Python財務數(shù)據(jù)分析與應用(微課版)- 教案 第7章 會計文本分析與詞云圖繪制_第1頁
Python財務數(shù)據(jù)分析與應用(微課版)- 教案 第7章 會計文本分析與詞云圖繪制_第2頁
Python財務數(shù)據(jù)分析與應用(微課版)- 教案 第7章 會計文本分析與詞云圖繪制_第3頁
Python財務數(shù)據(jù)分析與應用(微課版)- 教案 第7章 會計文本分析與詞云圖繪制_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

課次/學時:第1次課/2學時

本次課題目(內(nèi)容):

會計文本分析原理、中文分詞技術及文本預處理流程

學習目標:理解文本分析在財務會計領域的核心價值與工作流程(數(shù)據(jù)收集→預處理→分析)。掌握中文分詞五大模式(精確/全/搜索/paddle/HMM)及其適用場景。熟練定制財務詞典與停用詞表(如"遞延所得稅資產(chǎn)"/"商譽減值"等專業(yè)術語)。教學重點、難點:重點:jieba.lcut()模式參數(shù)選擇、自定義詞典構建(load_userdict())、停用詞過濾邏輯。難點:HMM模式識別未登錄詞、專業(yè)術語分詞邊界判定("現(xiàn)金流量表"→單分詞)。教學資源:

《中國注冊會計師職業(yè)道德守則》文本、財務術語詞典模板、停用詞庫(哈工大停用詞表)。

課堂教學創(chuàng)新點:會計場景適配:對比通用分詞vs加載財務詞典效果("遞延所得稅資產(chǎn)"完整性)用年報片段演示HMM識別新術語能力教學過程設計:文本分析框架(25分鐘)四步驟解析:會計應用場景:年報關鍵詞提取/監(jiān)管文件合規(guī)分析中文分詞實戰(zhàn)(40分鐘)五模式對比實驗:Python#精確模式(財務文本首選)

jieba.lcut(年報文本,cut_all=False)

#paddle模式(識別"新租賃準則"等新術語)

jieba.lcut(年報文本,use_paddle=True)學生任務:對審計報告片段進行精確模式分詞詞典與停用詞(25分鐘)財務詞典構建:Python#詞典文件內(nèi)容(詞頻可省略)

現(xiàn)金流量表10n

商譽減值8n

jieba.load_userdict("財務詞典.txt")停用詞過濾:Pythonstopwords=[line.strip()forlineinopen('hit_stopwords.txt')]

cleaned_words=[wordforwordinseg_listifwordnotinstopwords]課程總結與答疑:

強調(diào)財務文本特殊性:必須加載專業(yè)詞典(避免"營改增"被拆解),停用詞庫需補充會計無用詞("特此公告")。

教學反思:

課次/學時:第2次課/2學時

本次課題目(內(nèi)容):

會計文本關鍵詞提取、詞頻統(tǒng)計及詞云圖生成實戰(zhàn)

學習目標:運用jieba.analyse提取會計政策文本關鍵詞(TF-IDF算法)。通過collections.Counter實現(xiàn)高頻詞統(tǒng)計與業(yè)務解讀。生成合規(guī)報告詞云圖(形狀/顏色/字體定制化)。教學重點、難點:重點:TF-IDF權重解讀(jieba.analyse.extract_tags())、詞云參數(shù)調(diào)整(max_words/mask)。難點:關鍵詞業(yè)務意義解析(如"誠信獨立"高頻→審計核心原則)。教學資源:

《中國注冊會計師職業(yè)道德守則(2020)》PDF、會計師事務所LOGO掩膜圖、顏色映射表。

課堂教學創(chuàng)新點:倫理可視化:用詞云突出守則中的核心原則("誠信"/"保密"/"獨立性")形象化設計:將詞云嵌入會計師事務所LOGO形狀(mask參數(shù))教學過程設計:關鍵詞提?。?0分鐘)TF-IDF原理:詞頻高且文檔罕見的詞權重高守則文本分析:Pythonfromjiebaimportanalyse

keywords=analyse.extract_tags(守則文本,topK=20,withWeight=True)

#輸出:[('誠信',0.89),('獨立性',0.82)...]結論:守則核心關注職業(yè)操守(誠信/獨立)而非技術細節(jié)詞云圖生成(40分鐘)基礎詞云:PythonfromwordcloudimportWordCloud

wc=WordCloud(font_path='SimHei.ttf',background_color='white')

wc.generate_from_frequencies(word_freq)

wc.to_file("基礎詞云.png")高級定制:PythonfromPILimportImage

mask=np.array(Image.open("kpmg_logo.png"))

wc=WordCloud(mask=mask,colormap='Blues')實訓:守則分析報告(20分鐘)任務流程:加載《職業(yè)道德守則》PDF文本預處理(分詞+去停用詞)提取TOP20關鍵詞并解釋業(yè)務含義生成KPMGlogo形狀詞云圖輸出結論:

"獨立性"出現(xiàn)頻次最高(32次),凸顯審計業(yè)務底線要求課程總結與答疑:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論