AI+Python 財(cái)務(wù)應(yīng)用基礎(chǔ) 課件 項(xiàng)目5-8 -AI+Python數(shù)據(jù)采集與清洗-AI+Python綜合應(yīng)用:挖掘財(cái)務(wù)數(shù)據(jù)價(jià)值_第1頁(yè)
AI+Python 財(cái)務(wù)應(yīng)用基礎(chǔ) 課件 項(xiàng)目5-8 -AI+Python數(shù)據(jù)采集與清洗-AI+Python綜合應(yīng)用:挖掘財(cái)務(wù)數(shù)據(jù)價(jià)值_第2頁(yè)
AI+Python 財(cái)務(wù)應(yīng)用基礎(chǔ) 課件 項(xiàng)目5-8 -AI+Python數(shù)據(jù)采集與清洗-AI+Python綜合應(yīng)用:挖掘財(cái)務(wù)數(shù)據(jù)價(jià)值_第3頁(yè)
AI+Python 財(cái)務(wù)應(yīng)用基礎(chǔ) 課件 項(xiàng)目5-8 -AI+Python數(shù)據(jù)采集與清洗-AI+Python綜合應(yīng)用:挖掘財(cái)務(wù)數(shù)據(jù)價(jià)值_第4頁(yè)
AI+Python 財(cái)務(wù)應(yīng)用基礎(chǔ) 課件 項(xiàng)目5-8 -AI+Python數(shù)據(jù)采集與清洗-AI+Python綜合應(yīng)用:挖掘財(cái)務(wù)數(shù)據(jù)價(jià)值_第5頁(yè)
已閱讀5頁(yè),還剩139頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

AI+Python數(shù)據(jù)采集與清洗CONTENTS目錄01

課程學(xué)習(xí)目標(biāo)02

數(shù)據(jù)采集概述03

通過(guò)數(shù)據(jù)接口采集數(shù)據(jù)04

通過(guò)網(wǎng)絡(luò)爬蟲(chóng)采集數(shù)據(jù)05

數(shù)據(jù)清洗概述CONTENTS目錄06

缺失值處理07

重復(fù)值處理08

異常值處理09

AI+Python財(cái)務(wù)應(yīng)用拓展課程學(xué)習(xí)目標(biāo)01知識(shí)目標(biāo)數(shù)據(jù)接口獲取數(shù)據(jù)方法

掌握利用數(shù)據(jù)接口獲取數(shù)據(jù)的操作方法,包括了解接口規(guī)則、使用示范代碼及通過(guò)循環(huán)獲取不同維度數(shù)據(jù),如證券寶query_growth_data()接口獲取上市公司季頻成長(zhǎng)能力數(shù)據(jù)。網(wǎng)絡(luò)爬蟲(chóng)概念與操作

了解網(wǎng)絡(luò)爬蟲(chóng)概念,即按規(guī)則自動(dòng)抓取網(wǎng)絡(luò)數(shù)據(jù)的程序或腳本,掌握其爬取數(shù)據(jù)的操作方法,包括基本原理、工作流程及靜態(tài)頁(yè)面爬取,如利用pd.read_html()函數(shù)爬取IMF數(shù)據(jù)。AI+Python業(yè)務(wù)邏輯理解

理解AI+Python進(jìn)行數(shù)據(jù)采集和清洗的業(yè)務(wù)邏輯,包括人機(jī)協(xié)同開(kāi)發(fā)模式(AI生成代碼模板、可視化工具檢查結(jié)果),以及數(shù)據(jù)采集質(zhì)量要求(真實(shí)性、準(zhǔn)確性等)和合規(guī)要點(diǎn)。能力目標(biāo)

外部數(shù)據(jù)采集能力能夠根據(jù)業(yè)務(wù)需求,通過(guò)“AI助手+Python編程”模式,利用數(shù)據(jù)接口(如證券寶、AKShare)、網(wǎng)絡(luò)爬蟲(chóng)等實(shí)現(xiàn)完整的外部數(shù)據(jù)采集,例如分步驟采集農(nóng)業(yè)企業(yè)或深圳證券交易所數(shù)據(jù)并以DataFrame格式輸出。

數(shù)據(jù)清洗加工能力能夠根據(jù)業(yè)務(wù)需求,通過(guò)“AI助手+Python編程”模式,對(duì)缺失值(刪除或填充)、重復(fù)值(檢測(cè)與刪除)、異常值(箱線圖法等識(shí)別與處理)進(jìn)行清洗和初步加工,提升數(shù)據(jù)質(zhì)量。素養(yǎng)目標(biāo)數(shù)字素養(yǎng)與隱私保護(hù)提升數(shù)字素養(yǎng),注重在數(shù)據(jù)采集與處理過(guò)程中保護(hù)數(shù)據(jù)隱私,嚴(yán)格遵守《中華人民共和國(guó)數(shù)據(jù)安全法》等法律法規(guī),尊重知識(shí)產(chǎn)權(quán),避免侵犯他人合法權(quán)益,培養(yǎng)社會(huì)公德和職業(yè)道德。創(chuàng)新與批判性思維通過(guò)修改和迭代數(shù)據(jù)采集與清洗程序,培養(yǎng)創(chuàng)新思維和批判性思維,能夠?qū)I生成的代碼及清洗結(jié)果進(jìn)行合理性檢查,應(yīng)對(duì)AI幻覺(jué)等問(wèn)題。合規(guī)審查與算法偏見(jiàn)防范建立AI數(shù)據(jù)采集的合規(guī)審查意識(shí),規(guī)范數(shù)據(jù)處理活動(dòng),履行數(shù)據(jù)安全保護(hù)義務(wù),同時(shí)防范算法偏見(jiàn)導(dǎo)致的數(shù)據(jù)失真,確保數(shù)據(jù)應(yīng)用的公正性和可靠性。人機(jī)協(xié)同辯證思維培養(yǎng)人機(jī)協(xié)同的辯證思維,平衡自動(dòng)化采集與人工驗(yàn)證的關(guān)系,認(rèn)識(shí)到AI技術(shù)提升效率的同時(shí),需結(jié)合人工判斷保障數(shù)據(jù)質(zhì)量與合規(guī)性,承擔(dān)社會(huì)責(zé)任。數(shù)據(jù)采集概述02數(shù)據(jù)采集的重要性數(shù)據(jù)生命周期的起點(diǎn)數(shù)據(jù)采集是數(shù)據(jù)生命周期的首要環(huán)節(jié),為后續(xù)的數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等提供基礎(chǔ)數(shù)據(jù)支撐,直接影響數(shù)據(jù)應(yīng)用的質(zhì)量和效果。驅(qū)動(dòng)多領(lǐng)域決策與發(fā)展在商業(yè)決策中,高質(zhì)量數(shù)據(jù)助力企業(yè)精準(zhǔn)把握市場(chǎng)動(dòng)態(tài);科學(xué)研究依賴數(shù)據(jù)推動(dòng)創(chuàng)新發(fā)現(xiàn);社會(huì)治理通過(guò)數(shù)據(jù)提升管理效率,數(shù)字經(jīng)濟(jì)時(shí)代對(duì)數(shù)據(jù)采集的需求日益迫切。數(shù)據(jù)質(zhì)量的關(guān)鍵保障采集過(guò)程需關(guān)注數(shù)據(jù)的真實(shí)性、準(zhǔn)確性、完整性和時(shí)效性,同時(shí)嚴(yán)格遵守法律法規(guī),尊重知識(shí)產(chǎn)權(quán),避免侵犯他人合法權(quán)益,確保數(shù)據(jù)合規(guī)可用。數(shù)據(jù)采集的途徑

數(shù)據(jù)庫(kù)通過(guò)數(shù)據(jù)庫(kù)獲取數(shù)據(jù)需具備訪問(wèn)權(quán)限,基于數(shù)據(jù)安全考量,一般人員較難獲取權(quán)限,受限較多。

數(shù)據(jù)接口數(shù)據(jù)接口提供規(guī)范、完整的數(shù)據(jù),能減少后期處理工作。如證券寶提供季頻盈利能力、營(yíng)運(yùn)能力等多種接口,可通過(guò)調(diào)整參數(shù)獲取不同上市公司不同時(shí)期數(shù)據(jù)。

網(wǎng)絡(luò)爬蟲(chóng)當(dāng)無(wú)數(shù)據(jù)庫(kù)訪問(wèn)權(quán)限和合適第三方接口時(shí),網(wǎng)絡(luò)爬蟲(chóng)是可行方式。它按規(guī)則自動(dòng)抓取網(wǎng)頁(yè)內(nèi)容,如投資者爬取財(cái)經(jīng)網(wǎng)站數(shù)據(jù)用于分析,高校就業(yè)辦爬取招聘數(shù)據(jù)指導(dǎo)就業(yè)。

本課程重點(diǎn)因數(shù)據(jù)庫(kù)訪問(wèn)權(quán)限受限,本課程重點(diǎn)講解數(shù)據(jù)接口和網(wǎng)絡(luò)爬蟲(chóng)兩種數(shù)據(jù)采集方法。通過(guò)數(shù)據(jù)接口采集數(shù)據(jù)03數(shù)據(jù)接口規(guī)則了解

證券寶核心數(shù)據(jù)接口功能證券寶提供季頻盈利能力(query_profit_data())、營(yíng)運(yùn)能力(query_operation_data())、成長(zhǎng)能力(query_growth_data())等接口,可查詢企業(yè)財(cái)務(wù)數(shù)據(jù),如凈資產(chǎn)同比增長(zhǎng)率、凈利潤(rùn)同比增長(zhǎng)率等關(guān)鍵指標(biāo)。

接口說(shuō)明與示范代碼獲取通過(guò)證券寶官網(wǎng)對(duì)應(yīng)接口鏈接(如“季頻成長(zhǎng)能力”),可查看接口參數(shù)描述、算法說(shuō)明及示范代碼。以query_growth_data()為例,參數(shù)包括股票代碼(code)、統(tǒng)計(jì)年份(year)、季度(quarter)等,算法明確各指標(biāo)計(jì)算公式。示范代碼運(yùn)行與分析代碼結(jié)構(gòu)與登錄系統(tǒng)代碼需先安裝baostock模塊(pipinstallbaostock),通過(guò)bs.login()登錄系統(tǒng),返回error_code和error_msg驗(yàn)證登錄狀態(tài)(示例輸出“l(fā)oginsuccess!”)。數(shù)據(jù)獲取與結(jié)果展示調(diào)用query_growth_data(code='sh.600519',year=2024,quarter=4)獲取貴州茅臺(tái)2024年Q4成長(zhǎng)數(shù)據(jù),通過(guò)循環(huán)append()存儲(chǔ)結(jié)果,用pandas.DataFrame格式化輸出,包含pubDate(發(fā)布日期)、YOYNI(凈利潤(rùn)同比增長(zhǎng)率)等字段。結(jié)果參數(shù)解析輸出結(jié)果中英文索引可,如“YOYEquity”表示凈資產(chǎn)同比增長(zhǎng)率,計(jì)算公式為(本期凈資產(chǎn)-上年同期凈資產(chǎn))/上年同期凈資產(chǎn)絕對(duì)值×100%。利用循環(huán)獲取多維度數(shù)據(jù)

01可變參數(shù)調(diào)整方法核心參數(shù)包括股票代碼(sh/sz+6位數(shù)字,如sh.601398)、年份(默認(rèn)當(dāng)年)、季度(1-4,默認(rèn)當(dāng)前季度),通過(guò)修改參數(shù)可定向采集目標(biāo)數(shù)據(jù)。

02嵌套循環(huán)實(shí)現(xiàn)批量采集使用for循環(huán)嵌套遍歷年份和季度,示例代碼獲取sh.600519在2022-2024年各季度成長(zhǎng)數(shù)據(jù),通過(guò)result_growth輸出多維度時(shí)間序列數(shù)據(jù),提升采集效率。

03多接口擴(kuò)展應(yīng)用更換接口方法(如query_operation_data())可采集營(yíng)運(yùn)能力數(shù)據(jù),保持代碼框架不變,僅需調(diào)整函數(shù)名及對(duì)應(yīng)參數(shù),實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)的全方位獲取。AI工具輔助數(shù)據(jù)接口采集

AI提示詞設(shè)計(jì)要點(diǎn)提示詞需明確數(shù)據(jù)源(如AKShare)、目標(biāo)(農(nóng)業(yè)企業(yè)數(shù)據(jù)采集)、背景(鄉(xiāng)村振興)、輸出格式(DataFrame)及展示要求(代碼注釋+結(jié)果),示例:“利用AKShare接口,分步驟采集北大荒(600598)2025.7.1-9.30日線數(shù)據(jù),以DataFrame輸出并注釋”。

騰訊云AI代碼助手輸出示例AI生成代碼包含模塊導(dǎo)入(importakshareasak)、數(shù)據(jù)采集(ak.stock_zh_a_hist())、結(jié)果處理(daily_()),融入鄉(xiāng)村振興背景描述,并輸出數(shù)據(jù)基本信息及DataFrame格式結(jié)果,減少人工編碼工作量。AI工具輔助數(shù)據(jù)接口采集AI提升采集效率的優(yōu)勢(shì)AI可快速生成標(biāo)準(zhǔn)化代碼模板,自動(dòng)處理接口調(diào)用邏輯(如參數(shù)校驗(yàn)、數(shù)據(jù)格式化),用戶僅需微調(diào)參數(shù)即可適配不同場(chǎng)景,實(shí)現(xiàn)“自然語(yǔ)言指令→代碼→數(shù)據(jù)”的高效轉(zhuǎn)化。通過(guò)網(wǎng)絡(luò)爬蟲(chóng)采集數(shù)據(jù)04網(wǎng)絡(luò)爬蟲(chóng)基本原理與工作流程網(wǎng)絡(luò)爬蟲(chóng)的定義與本質(zhì)網(wǎng)絡(luò)爬蟲(chóng)是按照一定規(guī)則自動(dòng)抓取網(wǎng)絡(luò)數(shù)據(jù)的程序或腳本,其本質(zhì)是自動(dòng)化技術(shù),可根據(jù)指定URL獲取網(wǎng)頁(yè)中的圖像、文字、視頻、音頻等信息,并保存到本地或數(shù)據(jù)庫(kù)??蛻舳伺c服務(wù)器交互原理客戶端向服務(wù)器發(fā)送訪問(wèn)請(qǐng)求,服務(wù)器驗(yàn)證請(qǐng)求有效性后發(fā)送響應(yīng)內(nèi)容,客戶端接收并展示內(nèi)容,此為網(wǎng)絡(luò)爬蟲(chóng)數(shù)據(jù)獲取的底層交互邏輯。網(wǎng)絡(luò)爬蟲(chóng)的一般工作流程網(wǎng)絡(luò)爬蟲(chóng)工作流程廣泛應(yīng)用于財(cái)經(jīng)數(shù)據(jù)爬取、招聘信息采集等場(chǎng)景,其流程主要包括發(fā)起請(qǐng)求、接收響應(yīng)、解析內(nèi)容、提取數(shù)據(jù)、存儲(chǔ)數(shù)據(jù)等環(huán)節(jié)。靜態(tài)網(wǎng)頁(yè)數(shù)據(jù)爬取實(shí)例查看數(shù)據(jù)所在網(wǎng)頁(yè)登錄國(guó)際貨幣基金組織官網(wǎng),進(jìn)入世界經(jīng)濟(jì)數(shù)據(jù)庫(kù)詳情頁(yè)面,確定目標(biāo)數(shù)據(jù)所在位置及網(wǎng)頁(yè)類型。分析網(wǎng)頁(yè)結(jié)構(gòu)與數(shù)據(jù)格式通過(guò)瀏覽器右鍵查看網(wǎng)頁(yè)源代碼,判斷該頁(yè)面為靜態(tài)頁(yè)面,數(shù)據(jù)呈表格樣式,適合使用read_html()函數(shù)進(jìn)行爬取。編寫(xiě)代碼獲取特定數(shù)據(jù)利用pd.read_html()函數(shù)讀取網(wǎng)頁(yè)表格數(shù)據(jù),通過(guò)篩選年份列(如['SubjectDescriptor','2024']),可獲取馬來(lái)西亞2024年國(guó)內(nèi)生產(chǎn)總值、一般政府收入和一般政府總支出等數(shù)據(jù)。多維度數(shù)據(jù)爬取方法

獲取連續(xù)年份數(shù)據(jù)構(gòu)建年份列表(如['SubjectDescriptor']+[str(year)foryearinrange(2020,2025)]),從爬取的表格數(shù)據(jù)中篩選出2020-2024年的連續(xù)數(shù)據(jù)。

獲取不連續(xù)年份數(shù)據(jù)指定所需不連續(xù)年份(如['SubjectDescriptor','2010','2015','2020']),直接從表格數(shù)據(jù)中提取對(duì)應(yīng)年份列,實(shí)現(xiàn)非連續(xù)年份數(shù)據(jù)的精準(zhǔn)獲取。

獲取多個(gè)國(guó)家數(shù)據(jù)修改URL中國(guó)家參數(shù)(如'c=548,112'代表馬來(lái)西亞和英國(guó)),結(jié)合年份篩選(如2020-2024年),可同時(shí)獲取多個(gè)國(guó)家在指定年份的目標(biāo)數(shù)據(jù)。AI工具輔助網(wǎng)絡(luò)爬蟲(chóng)采集

01AI提示詞設(shè)計(jì)向騰訊云AI代碼助手輸入提示詞:“利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù),分步驟完成深圳證券交易所數(shù)據(jù)的采集,以DataFrame格式輸出數(shù)據(jù)采集結(jié)果,并對(duì)代碼注釋和輸出結(jié)果進(jìn)行詳細(xì)展示?!?/p>

02AI生成代碼解析AI輸出代碼包含導(dǎo)入requests、pandas等庫(kù),設(shè)置請(qǐng)求URL、參數(shù)(如日期范圍)及headers,發(fā)送請(qǐng)求、解析JSON數(shù)據(jù)、處理異常等步驟,并對(duì)“今日融資買(mǎi)入額”“今日融券余額”等列進(jìn)行重命名。

03數(shù)據(jù)采集結(jié)果展示運(yùn)行AI生成的代碼,可獲取深圳證券交易所融資融券數(shù)據(jù),最終以DataFrame格式輸出,包含“今日融資買(mǎi)入額”“今日融資融券余額”等關(guān)鍵指標(biāo),便于后續(xù)分析使用。數(shù)據(jù)清洗概述05數(shù)據(jù)清洗的意義

原始數(shù)據(jù)常見(jiàn)問(wèn)題通過(guò)網(wǎng)絡(luò)爬蟲(chóng)等方式采集到的數(shù)據(jù),常存在缺失值(如NaN表示的不完整屬性值)、重復(fù)值(多由系統(tǒng)錯(cuò)誤或重復(fù)錄入導(dǎo)致)、異常值(偏離數(shù)據(jù)正常范圍的值)等問(wèn)題,影響數(shù)據(jù)質(zhì)量。

數(shù)據(jù)清洗的核心價(jià)值數(shù)據(jù)清洗是將“臟數(shù)據(jù)”轉(zhuǎn)化為“干凈數(shù)據(jù)”的關(guān)鍵步驟,能有效提升數(shù)據(jù)的真實(shí)性、準(zhǔn)確性、完整性和一致性,為后續(xù)數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等工作提供可靠的數(shù)據(jù)基礎(chǔ),保證分析結(jié)果的準(zhǔn)確性和可信度。數(shù)據(jù)基本信息了解工具

數(shù)據(jù)預(yù)覽工具:head()與tail()head()函數(shù)可查看數(shù)據(jù)的前幾行(默認(rèn)前5行),tail()函數(shù)可查看數(shù)據(jù)的后幾行(默認(rèn)后5行),幫助快速了解數(shù)據(jù)的整體結(jié)構(gòu)、列名及數(shù)據(jù)格式。

數(shù)據(jù)量統(tǒng)計(jì)工具:count()count()函數(shù)用于統(tǒng)計(jì)每列非缺失值的數(shù)量,通過(guò)對(duì)比不同列的count值,可初步判斷數(shù)據(jù)是否存在缺失值,為缺失值處理提供依據(jù)。

數(shù)據(jù)分布描述工具:describe()describe()函數(shù)可生成數(shù)據(jù)的基本統(tǒng)計(jì)量,包括計(jì)數(shù)、均值、標(biāo)準(zhǔn)差、最小值、最大值及四分位數(shù)等,幫助了解數(shù)據(jù)的集中趨勢(shì)、離散程度和分布范圍,為異常值檢測(cè)提供參考。缺失值處理06缺失值查找方法01基礎(chǔ)判斷函數(shù):isnull()與notnull()isnull()函數(shù)用于檢測(cè)數(shù)據(jù)是否為缺失值(NaN),返回布爾值(True表示缺失);notnull()函數(shù)則判斷是否為非缺失值(False表示缺失),二者為互補(bǔ)關(guān)系。02統(tǒng)計(jì)每列缺失值數(shù)量通過(guò)df.isnull().sum()可快速計(jì)算各列缺失值總數(shù),直觀呈現(xiàn)數(shù)據(jù)缺失分布。例如某利潤(rùn)表數(shù)據(jù)中,"凈利潤(rùn)"列缺失值數(shù)量為1,其他列無(wú)缺失。03全局缺失值判斷使用df.isnull().any().any()可判斷數(shù)據(jù)集中是否存在缺失值,返回True則表示存在至少一個(gè)缺失值,便于快速篩查數(shù)據(jù)質(zhì)量。04缺失值位置定位通過(guò)df.isnull()生成布爾矩陣,True對(duì)應(yīng)位置即為缺失值所在行和列,結(jié)合iloc[]可精確定位具體缺失數(shù)據(jù),輔助分析缺失原因。缺失值處理方式-刪除

適用場(chǎng)景1:缺失值極少當(dāng)缺失值占比極低(如數(shù)萬(wàn)行數(shù)據(jù)中僅1行缺失),對(duì)整體分析影響可忽略時(shí),直接刪除所在行。

適用場(chǎng)景2:缺失量過(guò)大若某特征列缺失值占比超90%(如"行業(yè)分類"列95%為空),該列已無(wú)分析價(jià)值,可刪除整列以簡(jiǎn)化數(shù)據(jù)集,避免無(wú)效計(jì)算。

適用場(chǎng)景3:無(wú)法填充的缺失值對(duì)于不可隨意推斷的屬性(如人口普查中"性別"列缺失),因填充可能引入偏差,需刪除對(duì)應(yīng)行以保證數(shù)據(jù)真實(shí)性。

刪除操作實(shí)現(xiàn):dropna()方法默認(rèn)df.dropna(axis=0)刪除含缺失值的行,df.dropna(axis=1)刪除含缺失值的列。例如df_cleaned=df.dropna()可刪除缺失數(shù)據(jù)。缺失值處理方式-填充

手動(dòng)填充:指定值替換根據(jù)業(yè)務(wù)規(guī)則直接填充固定值,如用0填充"補(bǔ)貼收入"列的缺失值(df.fillna(0)),適用于明確缺失原因?yàn)?無(wú)該項(xiàng)數(shù)據(jù)"的場(chǎng)景。

臨近填充:前向與后向填充前向填充(df.fillna(method='ffill'))用相鄰前一個(gè)非缺失值填充,后向填充(df.fillna(method='bfill'))用相鄰后一個(gè)非缺失值填充,適用于時(shí)間序列數(shù)據(jù)(如月度銷售額)的零散缺失。

統(tǒng)計(jì)量填充:均值/中位數(shù)填充對(duì)數(shù)值型數(shù)據(jù),可用列平均值(df.mean())或中位數(shù)(df.median())填充,避免數(shù)據(jù)分布偏移。重復(fù)值處理07重復(fù)值檢測(cè)方法完全重復(fù)行檢測(cè)完全重復(fù)行指所有列數(shù)據(jù)均相同的記錄,可通過(guò)df.duplicated()函數(shù)直接檢測(cè),返回布爾值表示是否重復(fù),sum()可統(tǒng)計(jì)重復(fù)行數(shù)。指定字段重復(fù)檢測(cè):以發(fā)票號(hào)為例針對(duì)關(guān)鍵標(biāo)識(shí)字段(如發(fā)票號(hào)),使用df.duplicated(subset=['發(fā)票號(hào)'],keep=False)檢測(cè)重復(fù),keep=False標(biāo)記所有重復(fù)項(xiàng)。業(yè)務(wù)特征組合重復(fù)檢測(cè)結(jié)合業(yè)務(wù)場(chǎng)景,通過(guò)多字段組合(如日期+交易類型+部門(mén))檢測(cè)潛在重復(fù),使用df.duplicated(subset=['日期','交易類型','部門(mén)'],keep=False)實(shí)現(xiàn)。重復(fù)值處理方法刪除完全重復(fù)行使用df.drop_duplicates()直接刪除所有完全重復(fù)的行,默認(rèn)保留第一條記錄,適用于無(wú)業(yè)務(wù)意義的完全重復(fù)數(shù)據(jù)。按關(guān)鍵字段保留指定記錄針對(duì)指定字段(如發(fā)票號(hào)),通過(guò)subset參數(shù)控制保留規(guī)則:keep='first'保留第一條記錄,keep='last'保留最后一條。重復(fù)記錄標(biāo)記與人工核驗(yàn)使用df[df.duplicated(subset=['發(fā)票號(hào)'],keep=False)]篩選并標(biāo)記所有重復(fù)記錄,便于人工核查區(qū)分合理重復(fù)(如同業(yè)務(wù)多批次)與錯(cuò)誤重復(fù),需要業(yè)務(wù)人員進(jìn)一步校驗(yàn)處理。異常值處理08異常值識(shí)別方法

異常值的概念與影響異常值指偏離數(shù)據(jù)正常范圍的值,非錯(cuò)誤值但出現(xiàn)概率低,會(huì)顯著扭曲數(shù)據(jù)分析結(jié)果,尤其對(duì)數(shù)值型數(shù)據(jù)預(yù)測(cè)分析產(chǎn)生誤導(dǎo)。

箱線圖法識(shí)別步驟1.計(jì)算四分位數(shù):下四分位數(shù)(Q1)、上四分位數(shù)(Q3);2.計(jì)算四分位距(IQR=Q3-Q1);3.確定上下界:下界=Q1-1.5*IQR,上界=Q3+1.5*IQR;4.超出上下界的數(shù)據(jù)即為異常值。異常值處理策略

刪除異常值適用于異常值極少(如數(shù)萬(wàn)條中個(gè)別)、缺失量過(guò)大無(wú)分析價(jià)值或無(wú)法填充場(chǎng)景(如人口普查性別缺失),使用pandas的dropna()方法刪除所在行或列,需評(píng)估對(duì)數(shù)據(jù)集影響。

填充異常值包括手動(dòng)填充(指定值或0填充)、臨近填充(前向ffill或后向bfill填充零散缺失)、統(tǒng)計(jì)量填充(用平均值等填充數(shù)值型數(shù)據(jù)),需謹(jǐn)慎使用避免影響分析結(jié)果。

處理注意事項(xiàng)處理前需明確分析目標(biāo)和數(shù)據(jù)結(jié)構(gòu),區(qū)分異常值是人為失誤還是合理存在(如同業(yè)績(jī)記錄),避免誤刪;結(jié)合業(yè)務(wù)需求選擇合適方法,確保數(shù)據(jù)清洗質(zhì)量以保障分析準(zhǔn)確性。AI+Python財(cái)務(wù)應(yīng)用拓展09財(cái)務(wù)數(shù)據(jù)采集與分析案例

案例背景與目標(biāo)上市公司財(cái)務(wù)分析師需通過(guò)證券寶數(shù)據(jù)接口獲取季頻盈利能力數(shù)據(jù),處理缺失值、重復(fù)值和異常值,利用AI模型分析歷史數(shù)據(jù)并預(yù)測(cè)未來(lái)凈利潤(rùn),為管理層戰(zhàn)略決策提供數(shù)據(jù)支持。

數(shù)據(jù)采集與清洗實(shí)現(xiàn)使用baostock庫(kù)登錄證券寶,調(diào)用query_profit_data()接口采集季頻數(shù)據(jù);通過(guò)前值填充缺失值、刪除重復(fù)值、過(guò)濾負(fù)凈利潤(rùn)異常值完成數(shù)據(jù)預(yù)處理,確保數(shù)據(jù)質(zhì)量。

AI模型預(yù)測(cè)與可視化以時(shí)間為自變量、凈利潤(rùn)為因變量,構(gòu)建線性回歸模型,經(jīng)訓(xùn)練后預(yù)測(cè)未來(lái)4個(gè)季度凈利潤(rùn),MSE評(píng)估模型誤差;繪制歷史與預(yù)測(cè)凈利潤(rùn)趨勢(shì)圖,直觀展示財(cái)務(wù)趨勢(shì),輔助決策判斷。THEEND謝謝AI+Python第三方模塊數(shù)據(jù)可視化分析CONTENTS目錄01

項(xiàng)目概述與學(xué)習(xí)目標(biāo)02

AI+matplotlib可視化分析03

AI+pyecharts可視化分析04

AI在數(shù)據(jù)可視化中的應(yīng)用實(shí)踐05

總結(jié)與展望項(xiàng)目概述與學(xué)習(xí)目標(biāo)01項(xiàng)目背景

AI在財(cái)務(wù)數(shù)據(jù)可視化中的角色升級(jí)AI技術(shù)正從單純的“繪圖工具”轉(zhuǎn)變?yōu)椤胺治龌锇椤?,在?cái)務(wù)數(shù)據(jù)可視化實(shí)踐中,能自動(dòng)識(shí)別數(shù)據(jù)結(jié)構(gòu)、推薦最優(yōu)圖表類型,如檢測(cè)到多指標(biāo)對(duì)比需求時(shí)建議使用pyecharts繪制并行柱形圖,通過(guò)自然語(yǔ)言交互自動(dòng)生成Python代碼,降低編程門(mén)檻。

AI+Python第三方模塊的價(jià)值結(jié)合AI與Python第三方模塊(如matplotlib、pyecharts),可實(shí)現(xiàn)數(shù)據(jù)可視化效率和深度的提升,幫助財(cái)務(wù)人員將復(fù)雜財(cái)務(wù)數(shù)據(jù)轉(zhuǎn)化為直觀圖表,為企業(yè)決策提供有力支持,本項(xiàng)目旨在讓讀者掌握相關(guān)實(shí)現(xiàn)邏輯與方法。知識(shí)目標(biāo)matplotlib模塊掌握內(nèi)容掌握利用matplotlib模塊繪制柱形圖、散點(diǎn)圖、折線圖、餅圖等圖形的一般方法及樣式設(shè)置,同時(shí)掌握組合圖的繪制方式,其pyplot子模塊是核心模塊之一,可繪制幾乎所有樣式的2D圖形。pyecharts模塊掌握內(nèi)容掌握利用pyecharts模塊繪制柱形圖、條形圖、折線圖、餅圖等圖形的一般方法及樣式設(shè)置,以及層疊圖、并行圖的繪制方式,該模塊能生成動(dòng)態(tài)交互的可視化效果,支持列表、元組等Python原生數(shù)據(jù)類型。AI輔助圖表優(yōu)化方法理解AI+第三方模塊進(jìn)行數(shù)據(jù)可視化分析的業(yè)務(wù)邏輯,掌握生成式AI輔助圖表樣式優(yōu)化的基礎(chǔ)方法,AI可輔助進(jìn)行數(shù)據(jù)識(shí)別、代碼生成及圖表優(yōu)化建議。能力目標(biāo)解決財(cái)務(wù)數(shù)據(jù)可視化問(wèn)題的能力

能夠根據(jù)業(yè)務(wù)需求和數(shù)據(jù)結(jié)構(gòu),運(yùn)用“AI助手+Python編程”模式,解決財(cái)務(wù)數(shù)據(jù)可視化問(wèn)題,例如處理季度營(yíng)收數(shù)據(jù)、國(guó)民總收入變化等財(cái)務(wù)場(chǎng)景的數(shù)據(jù)展示。優(yōu)化和改進(jìn)可視化圖形的能力

能夠根據(jù)業(yè)務(wù)場(chǎng)景,運(yùn)用“AI助手+Python編程”模式,對(duì)可視化圖形進(jìn)行優(yōu)化和改進(jìn),如設(shè)置折線圖顏色、柱形圖寬度、餅圖標(biāo)簽格式等,提升圖形實(shí)用性和可讀性。生成方案建議與實(shí)現(xiàn)聯(lián)動(dòng)分析的能力

能夠運(yùn)用AI工具自動(dòng)解析財(cái)務(wù)數(shù)據(jù)特征,生成可視化方案建議;能夠通過(guò)對(duì)話式AI快速實(shí)現(xiàn)多維度數(shù)據(jù)鉆取分析的可視化聯(lián)動(dòng),如將華北區(qū)銷售趨勢(shì)線與競(jìng)品數(shù)據(jù)疊加顯示。素養(yǎng)目標(biāo)

確保數(shù)據(jù)真實(shí)性與評(píng)估結(jié)果局限性遵循科學(xué)原則,確保數(shù)據(jù)的真實(shí)性和準(zhǔn)確性,在使用可視化結(jié)果時(shí),能夠批判性地對(duì)其進(jìn)行評(píng)估,理解可視化結(jié)果可能存在的局限性。

保證圖形實(shí)用性與可讀性秉承工匠精神,在繪制可視化圖形過(guò)程中,注重細(xì)節(jié)設(shè)置,確保圖形具有良好的實(shí)用性和可讀性,以便清晰呈現(xiàn)數(shù)據(jù)內(nèi)在規(guī)律。

建立人機(jī)協(xié)同責(zé)任意識(shí)建立人機(jī)協(xié)同的責(zé)任意識(shí),辯證評(píng)價(jià)AI生成的可視化方案,識(shí)別算法可能存在的表達(dá)偏差,合理利用AI技術(shù)輔助財(cái)務(wù)數(shù)據(jù)可視化工作。AI+matplotlib可視化分析02matplotlib模塊基礎(chǔ)

matplotlib模塊概述matplotlib是Python的第三方模塊,能繪制各式各樣的2D圖形,其pyplot子模塊是核心模塊之一,幾乎所有樣式的2D圖形都可通過(guò)該子模塊繪制。

pyplot子模塊常用函數(shù)pyplot子模塊提供多種繪圖函數(shù),如.plot()繪制折線圖、.scatter()繪制散點(diǎn)圖、.hist()繪制直方圖、.pie()繪制餅圖、.bar()繪制柱形圖、.boxplot()繪制箱形圖、.barh()繪制條形圖等。matplotlib繪圖步驟

創(chuàng)建畫(huà)布使用plt.figure()函數(shù)創(chuàng)建畫(huà)布,可通過(guò)figsize參數(shù)設(shè)置畫(huà)布大小,如plt.figure(figsize=(10,6))。

創(chuàng)建坐標(biāo)系系統(tǒng)默認(rèn)會(huì)在畫(huà)布上創(chuàng)建一個(gè)坐標(biāo)系,若要繪制多個(gè)圖形,需自行創(chuàng)建多個(gè)坐標(biāo)系,可通過(guò)plt.subplot()或plt.subplots()等函數(shù)實(shí)現(xiàn)。

選擇圖表類型并繪制圖形根據(jù)數(shù)據(jù)特點(diǎn)和分析需求選擇合適的圖表類型,調(diào)用對(duì)應(yīng)的繪圖函數(shù)(如折線圖用plot()、柱形圖用bar()等)傳入數(shù)據(jù)完成繪制,最后用plt.show()顯示圖表。常見(jiàn)圖形繪制-折線圖

01折線圖繪制函數(shù)及語(yǔ)法在matplotlib中使用pyplot子模塊的plot()函數(shù)繪制折線圖,語(yǔ)法格式為pyplot.plot(x,y),其中x、y分別表示x軸、y軸數(shù)據(jù)。

022020—2024年國(guó)民總收入折線圖繪制示例準(zhǔn)備2020-2024年年份數(shù)據(jù)[2020,2021,2022,2023,2024]和對(duì)應(yīng)國(guó)民總收入數(shù)據(jù)[1026751.9,1165816.8,1223706.8,1284773.9,1339814.6],設(shè)置中文字體,創(chuàng)建畫(huà)布后調(diào)用plt.plot(years,gnis)繪制,添加標(biāo)題、坐標(biāo)軸標(biāo)簽及刻度后顯示圖表。常見(jiàn)圖形繪制-柱形圖

柱形圖繪制函數(shù)及語(yǔ)法柱形圖通過(guò)柱形條高度展示數(shù)據(jù)差異,使用pyplot子模塊的bar()函數(shù)繪制,語(yǔ)法格式為pyplot.bar(x,y),x、y分別為x軸、y軸數(shù)據(jù)。

與折線圖繪制的差異繪制柱形圖只需將折線圖的plot()函數(shù)修改為bar()函數(shù)即可,其他設(shè)置(如中文字體、畫(huà)布大小、標(biāo)題、坐標(biāo)軸標(biāo)簽等)與折線圖類似。

2020—2024年國(guó)民總收入柱形圖繪制示例使用與折線圖相同的年份和國(guó)民總收入數(shù)據(jù),將plt.plot(years,gnis)替換為plt.bar(years,gnis),即可繪制出展示2020-2024年國(guó)民總收入變化的柱形圖。常見(jiàn)圖形繪制-散點(diǎn)圖

散點(diǎn)圖繪制函數(shù)及作用散點(diǎn)圖通過(guò)點(diǎn)的分布揭示兩個(gè)變量之間的關(guān)系,可識(shí)別數(shù)據(jù)中的線性關(guān)系、趨勢(shì)及相關(guān)性,使用pyplot子模塊的scatter()函數(shù)繪制,語(yǔ)法格式為pyplot.scatter(x,y)。

多系列數(shù)據(jù)散點(diǎn)圖繪制示例以2020-2024年國(guó)民總收入與國(guó)內(nèi)生產(chǎn)總值對(duì)比為例,準(zhǔn)備年份數(shù)據(jù)[2020,2021,2022,2023,2024]、國(guó)民總收入數(shù)據(jù)[1026751.9,1165816.8,1223706.8,1284773.9,1339814.6]和國(guó)內(nèi)生產(chǎn)總值數(shù)據(jù)[1034867.6,1173823.0,1234029.4,1294271.7,1349083.5],分別調(diào)用scatter()函數(shù)并設(shè)置不同顏色和標(biāo)記。常見(jiàn)圖形繪制-餅圖

餅圖繪制函數(shù)及作用餅圖用于展示各個(gè)類別數(shù)據(jù)占總體數(shù)據(jù)的比例,反映部分和整體之間的關(guān)系,使用pyplot子模塊的pie()函數(shù)繪制,語(yǔ)法格式為pyplot.pie(x),x表示數(shù)據(jù)。

2024年三大產(chǎn)業(yè)增加值餅圖繪制步驟首先整理2024年第一產(chǎn)業(yè)、第二產(chǎn)業(yè)、第三產(chǎn)業(yè)(增加值數(shù)據(jù),設(shè)置標(biāo)簽和顏色,創(chuàng)建畫(huà)布后調(diào)用plt.pie()函數(shù),通過(guò)autopct參數(shù)設(shè)置百分比顯示格式(如'%1.2f%%'保留兩位小數(shù)),添加標(biāo)題后顯示圖表。組合圖繪制

組合圖概念組合圖是在同一個(gè)坐標(biāo)系中繪制多個(gè)圖形,用于呈現(xiàn)關(guān)聯(lián)數(shù)據(jù)之間的聯(lián)系,要求組合的圖形使用同一個(gè)橫坐標(biāo)軸。

國(guó)民總收入與國(guó)內(nèi)生產(chǎn)總值組合圖示例以2020-2024年數(shù)據(jù)為例,創(chuàng)建畫(huà)布后,用ax1.bar()繪制國(guó)民總收入柱形圖,通過(guò)ax1.twinx()創(chuàng)建次坐標(biāo)軸ax2,再用ax2.plot()繪制國(guó)內(nèi)生產(chǎn)總值折線圖,設(shè)置標(biāo)題、坐標(biāo)軸標(biāo)簽,合并圖例后顯示圖表,直觀展示兩者變化趨勢(shì)。子圖繪制子圖概念子圖是將多個(gè)圖形分別繪制在同一個(gè)畫(huà)布的多個(gè)坐標(biāo)系中,可根據(jù)需求設(shè)置子圖位置和布局。pyplot.subplot()函數(shù)繪制子圖語(yǔ)法格式為pyplot.subplot(nrows,ncols,index,…),如pyplot.subplot(2,2,1)表示創(chuàng)建2×2的網(wǎng)格,并取第一個(gè)網(wǎng)格作為子圖位置。pyplot.subplots()函數(shù)繪制子圖語(yǔ)法格式為pyplot.subplots(nrows,ncols,figsize,sharex,sharey,…),可通過(guò)元組接收子圖對(duì)象,如fig,(ax1,ax2)=plt.subplots(1,2,figsize=(12,5))創(chuàng)建1行2列的子圖布局,分別在ax1和ax2上繪制不同圖形。AI+pyecharts可視化分析03pyecharts模塊基礎(chǔ)

pyecharts與matplotlib對(duì)比特點(diǎn)pyecharts是Python第三方可視化模塊,與matplotlib相比,其核心優(yōu)勢(shì)在于支持動(dòng)態(tài)交互效果,鼠標(biāo)懸停即可顯示數(shù)據(jù)詳情;但不支持numpy、pandas數(shù)組類型,僅兼容列表、元組等Python原生數(shù)據(jù)類型。

pyecharts部分圖表類型提供30+圖表類型,涵蓋基礎(chǔ)與高級(jí)可視化需求,如Bar(柱形圖/條形圖)、Line(折線圖/面積圖)、Pie(餅圖)、Scatter(散點(diǎn)圖)、HeatMap(熱力圖)、Map(地圖)、Gauge(儀表盤(pán))、Bar3D(3D柱形圖)等。pyecharts繪圖步驟

導(dǎo)入相關(guān)模塊首先需導(dǎo)入charts子模塊中的作圖類(如Line、Bar、Pie)和options模塊(用于樣式配置),例如:frompyecharts.chartsimportLine;frompyechartsimportoptionsasopts。

添加圖表基礎(chǔ)數(shù)據(jù)通過(guò)add_xaxis()和add_yaxis()方法分別添加x軸和y軸數(shù)據(jù),數(shù)據(jù)格式需為列表或元組,如:line.add_xaxis(['2020','2021']);line.add_yaxis("銷售額",[100,200])。pyecharts繪圖步驟進(jìn)行樣式設(shè)置及渲染圖表使用set_global_opts()配置標(biāo)題、坐標(biāo)軸、圖例等全局樣式,set_series_opts()設(shè)置系列樣式;最后通過(guò)render_notebook()(Jupyter環(huán)境)或render()(生成HTML文件)渲染圖表。常見(jiàn)圖形繪制-折線圖與柱形圖

折線圖繪制示例以2020-2024年就業(yè)人數(shù)數(shù)據(jù)(萬(wàn)人:75064、74652、73351、74041、73439)為例,通過(guò)Line類創(chuàng)建對(duì)象,添加x軸年份和y軸就業(yè)人數(shù)數(shù)據(jù),設(shè)置標(biāo)題為“2020—2024年就業(yè)人數(shù)”,調(diào)用render_notebook()生成動(dòng)態(tài)折線圖。

柱形圖繪制示例使用Bar類繪制上述就業(yè)人數(shù)數(shù)據(jù),通過(guò)label_opts=opts.LabelOpts(position='top')將數(shù)值標(biāo)簽顯示在柱形頂部,配置tooltip_opts=opts.TooltipOpts(trigger='axis')啟用坐標(biāo)軸觸發(fā)提示框,y軸添加網(wǎng)格線增強(qiáng)可讀性。常見(jiàn)圖形繪制-條形圖與餅圖

條形圖轉(zhuǎn)換方法在柱形圖基礎(chǔ)上調(diào)用reversal_axis()函數(shù)轉(zhuǎn)置坐標(biāo)軸,即可將垂直柱形圖轉(zhuǎn)換為水平條形圖,適用于類別名稱較長(zhǎng)或需突出數(shù)值對(duì)比的場(chǎng)景,如2020-2024年就業(yè)人數(shù)橫向?qū)Ρ取?/p>

餅圖繪制與配置以2023年三大產(chǎn)業(yè)就業(yè)人數(shù)(第一產(chǎn)業(yè)16882萬(wàn)、第二產(chǎn)業(yè)21520萬(wàn)、第三產(chǎn)業(yè)35639萬(wàn))為例,通過(guò)Pie類添加數(shù)據(jù)對(duì),設(shè)置radius=['30%','70%']控制環(huán)形大小,label_opts格式化標(biāo)簽為“:{c}萬(wàn)人(1666611%)”,實(shí)現(xiàn)占比可視化。并行圖繪制Grid作圖類功能并行圖指同一畫(huà)布中分布多個(gè)獨(dú)立圖表(類似matplotlib子圖),通過(guò)Grid類實(shí)現(xiàn)。需先實(shí)例化Grid對(duì)象,再使用add()方法依次添加已創(chuàng)建的圖表,并通過(guò)GridOpts配置pos_top、pos_bottom等參數(shù)調(diào)整位置。柱形圖與折線圖并行示例語(yǔ)法示例:grid=Grid();grid.add(bar_chart,grid_opts=opts.GridOpts(pos_bottom='50%'));grid.add(line_chart,grid_opts=opts.GridOpts(pos_top='50%')),實(shí)現(xiàn)上下分布的雙圖表布局,避免標(biāo)題與圖例重疊。層疊圖繪制

層疊圖概念層疊圖是將多個(gè)圖表疊加顯示在同一坐標(biāo)系中,如柱形圖與折線圖疊加、折線圖與散點(diǎn)圖疊加,用于展示多維度數(shù)據(jù)關(guān)聯(lián)關(guān)系。

overlap()函數(shù)實(shí)現(xiàn)方法先分別創(chuàng)建需疊加的圖表對(duì)象(如bar和line),再調(diào)用bar.overlap(line)將折線圖疊加到柱形圖上,實(shí)現(xiàn)數(shù)據(jù)對(duì)比可視化。例如:在銷售額柱形圖上疊加增長(zhǎng)率折線圖,直觀展示銷量與增速關(guān)系。AI在數(shù)據(jù)可視化中的應(yīng)用04AI自動(dòng)識(shí)別數(shù)據(jù)與推薦圖表

01數(shù)據(jù)結(jié)構(gòu)智能解析AI能自動(dòng)識(shí)別財(cái)務(wù)數(shù)據(jù)結(jié)構(gòu),如在處理季度營(yíng)收數(shù)據(jù)時(shí),可快速判斷數(shù)據(jù)維度、指標(biāo)類型及關(guān)系,為后續(xù)可視化奠定基礎(chǔ)。

02最優(yōu)圖表類型推薦基于數(shù)據(jù)特征與分析需求推薦圖表,例如檢測(cè)到多指標(biāo)對(duì)比需求時(shí),會(huì)建議使用pyecharts繪制并行柱形圖,直觀呈現(xiàn)數(shù)據(jù)差異。

03財(cái)務(wù)場(chǎng)景應(yīng)用實(shí)例在財(cái)務(wù)數(shù)據(jù)可視化實(shí)踐中,AI從“繪圖工具”升級(jí)為“分析伙伴”,通過(guò)對(duì)數(shù)據(jù)的深度理解,提供契合業(yè)務(wù)場(chǎng)景的圖表方案,提升分析效率。自然語(yǔ)言交互生成代碼自然語(yǔ)言指令轉(zhuǎn)化用戶通過(guò)自然語(yǔ)言描述可視化需求,如“將華北區(qū)銷售趨勢(shì)線設(shè)為紅色加粗,并與競(jìng)品數(shù)據(jù)疊加顯示”,AI可準(zhǔn)確理解并轉(zhuǎn)化為操作邏輯。Python代碼自動(dòng)生成根據(jù)自然語(yǔ)言指令,AI自動(dòng)生成對(duì)應(yīng)的Python代碼,無(wú)需用戶手動(dòng)編寫(xiě)復(fù)雜代碼,有效降低編程門(mén)檻,讓非專業(yè)人員也能快速實(shí)現(xiàn)可視化。交互效率提升價(jià)值自然語(yǔ)言交互方式簡(jiǎn)化了操作流程,用戶可實(shí)時(shí)調(diào)整圖表樣式與數(shù)據(jù)展示方式,大幅縮短從需求提出到圖表生成的時(shí)間,提升工作效率。AI輔助多維度數(shù)據(jù)鉆取分析01數(shù)據(jù)特征自動(dòng)解析與方案建議AI工具能夠自動(dòng)解析財(cái)務(wù)數(shù)據(jù)特征,如數(shù)據(jù)分布、異常值、趨勢(shì)變化等,并基于此生成可視化方案建議,為分析提供方向。02對(duì)話式多維度數(shù)據(jù)鉆取通過(guò)對(duì)話式AI,用戶可進(jìn)行多維度數(shù)據(jù)鉆取分析,實(shí)現(xiàn)可視化聯(lián)動(dòng),如從整體銷售數(shù)據(jù)下鉆到區(qū)域、產(chǎn)品等細(xì)分維度,深入挖掘數(shù)據(jù)價(jià)值。03人機(jī)協(xié)同分析模式建立人機(jī)協(xié)同的分析模式,AI輔助處理數(shù)據(jù)與生成初步方案,用戶結(jié)合專業(yè)知識(shí)進(jìn)行判斷與調(diào)整,辯證評(píng)價(jià)AI方案,識(shí)別可能存在的表達(dá)偏差,提升分析準(zhǔn)確性。AI驅(qū)動(dòng)的行業(yè)案例分析電商銷售數(shù)據(jù)分析某電商平臺(tái)基于Python+AI構(gòu)建智能分析平臺(tái),業(yè)務(wù)部門(mén)通過(guò)自然語(yǔ)言提問(wèn)自動(dòng)生成可視化報(bào)告,分析月度銷售額趨勢(shì)、商品類別占比及客戶地域分布,提升數(shù)據(jù)驅(qū)動(dòng)決策效率。制造企業(yè)智能報(bào)表系統(tǒng)大型制造企業(yè)集成FineBI與Python實(shí)現(xiàn)AI可視化方案,月度報(bào)表自動(dòng)生成節(jié)省70%分析時(shí)間,管理者通過(guò)自然語(yǔ)言查詢"本月產(chǎn)線異常原因",系統(tǒng)自動(dòng)生成因果分析圖和文字說(shuō)明。實(shí)時(shí)數(shù)據(jù)流處理應(yīng)用IoT設(shè)備溫度數(shù)據(jù)流通過(guò)Flask+TensorFlow構(gòu)建實(shí)時(shí)分析系統(tǒng),前端動(dòng)態(tài)折線圖展示實(shí)時(shí)數(shù)據(jù),后端預(yù)測(cè)未來(lái)趨勢(shì),支持用戶手勢(shì)縮放實(shí)現(xiàn)多時(shí)間尺度分析。總結(jié)與展望05matplotlib與pyecharts模塊對(duì)比

核心功能與交互特性matplotlib專注于靜態(tài)2D圖表繪制,支持折線圖、柱形圖等基礎(chǔ)圖形及組合圖、子圖,通過(guò)pyplot子模塊實(shí)現(xiàn)高度自定義樣式,但交互性較弱;pyecharts主打動(dòng)態(tài)交互可視化,生成的圖表支持鼠標(biāo)懸停查看數(shù)據(jù)詳情、縮放等操作,支持并行圖、層疊圖及南丁格爾玫瑰圖等特殊圖表類型。

數(shù)據(jù)兼容性與應(yīng)用門(mén)檻matplotlib兼容numpy、pandas等數(shù)據(jù)類型,需手動(dòng)編寫(xiě)較多代碼配置圖表元素,對(duì)編程基礎(chǔ)有一定要求;pyecharts僅支持Python原生數(shù)據(jù)類型(列表、元組),通過(guò)鏈?zhǔn)秸{(diào)用和配置項(xiàng)簡(jiǎn)化代碼,動(dòng)態(tài)交互功能降低非技術(shù)人員使用門(mén)檻,但數(shù)據(jù)處理靈活性稍遜。matplotlib與pyecharts模塊對(duì)比適用場(chǎng)景與典型案例matplotlib適用于靜態(tài)報(bào)告、學(xué)術(shù)論文等需精確控制圖表樣式的場(chǎng)景,如財(cái)務(wù)數(shù)據(jù)固定周期分析報(bào)告;pyecharts適用于動(dòng)態(tài)數(shù)據(jù)看板、Web交互式展示,如實(shí)時(shí)銷售數(shù)據(jù)監(jiān)控系統(tǒng)。例如,分析GDP變化趨勢(shì)可用matplotlib繪制折線圖,展示就業(yè)結(jié)構(gòu)動(dòng)態(tài)占比則優(yōu)先選擇pyecharts餅圖。數(shù)據(jù)可視化的原則與注意事項(xiàng)真實(shí)性與準(zhǔn)確性原則確保數(shù)據(jù)源可靠,嚴(yán)格遵循數(shù)據(jù)采集規(guī)范,如國(guó)家統(tǒng)計(jì)局發(fā)布的GDP、就業(yè)人數(shù)等官方數(shù)據(jù)。避免為突出趨勢(shì)篡改數(shù)據(jù),例如繪制折線圖時(shí)不得隨意調(diào)整坐標(biāo)軸刻度范圍誤導(dǎo)讀者對(duì)數(shù)據(jù)波動(dòng)的判斷。注意數(shù)據(jù)安全,做好私有數(shù)據(jù)的脫敏操作。實(shí)用性與可讀性原則圖表設(shè)計(jì)以傳遞信息為核心,優(yōu)先選擇簡(jiǎn)潔清晰的圖表類型。例如,對(duì)比多指標(biāo)數(shù)據(jù)時(shí)用柱形圖而非復(fù)雜3D圖形;合理設(shè)置字體大小、顏色對(duì)比度,如matplotlib中通過(guò)rcParams配置中文字體(SimHei)避免亂碼,確保圖表在不同設(shè)備上清晰可讀。圖表選擇與數(shù)據(jù)匹配注意事項(xiàng)根據(jù)數(shù)據(jù)特征選擇圖表:時(shí)間序列數(shù)據(jù)用折線圖(如年度銷售額趨勢(shì)),占比分析用餅圖(如產(chǎn)業(yè)結(jié)構(gòu)分布),相關(guān)性分析用散點(diǎn)圖(如收入與利潤(rùn)關(guān)系)。避免誤用圖表,例如用餅圖展示時(shí)間趨勢(shì)會(huì)導(dǎo)致信息混亂,應(yīng)改用折線圖或柱形圖。AI+Python數(shù)據(jù)可視化未來(lái)趨勢(shì)

智能圖表推薦與自動(dòng)生成AI將通過(guò)分析數(shù)據(jù)結(jié)構(gòu)和業(yè)務(wù)需求自動(dòng)推薦最優(yōu)圖表類型,例如檢測(cè)到多指標(biāo)對(duì)比時(shí)建議使用pyecharts并行柱形圖。結(jié)合自然語(yǔ)言交互(如“將華北區(qū)銷售趨勢(shì)設(shè)為紅色加粗”),AI可直接生成Python代碼,大幅降低編程門(mén)檻,實(shí)現(xiàn)“低代碼”可視化。

動(dòng)態(tài)交互與多維度聯(lián)動(dòng)分析未來(lái)可視化將實(shí)現(xiàn)跨圖表聯(lián)動(dòng),如點(diǎn)擊餅圖某一產(chǎn)業(yè)扇區(qū),自動(dòng)觸發(fā)折線圖展示該產(chǎn)業(yè)歷史數(shù)據(jù)趨勢(shì)。AI輔助下支持實(shí)時(shí)數(shù)據(jù)更新與異常檢測(cè),例如金融資產(chǎn)收益率波動(dòng)超過(guò)閾值時(shí),動(dòng)態(tài)圖表自動(dòng)標(biāo)紅預(yù)警,助力決策者快速響應(yīng)市場(chǎng)變化。AI+Python數(shù)據(jù)可視化未來(lái)趨勢(shì)

人機(jī)協(xié)同與算法偏差修正AI生成可視化方案后,需結(jié)合人工審核辯證評(píng)估,識(shí)別算法可能存在的表達(dá)偏差(如過(guò)度強(qiáng)調(diào)某類數(shù)據(jù))。建立人機(jī)協(xié)同責(zé)任機(jī)制,例如財(cái)務(wù)風(fēng)險(xiǎn)分析中,AI提供初步可視化結(jié)果,分析師結(jié)合行業(yè)經(jīng)驗(yàn)調(diào)整圖表參數(shù),確保結(jié)論客觀可靠,推動(dòng)數(shù)據(jù)可視化向“分析伙伴”模式升級(jí)。THEEND謝謝AI+Python創(chuàng)建財(cái)務(wù)模型CONTENTS目錄01

學(xué)習(xí)目標(biāo)與AI導(dǎo)學(xué)02

創(chuàng)建業(yè)務(wù)數(shù)據(jù)分析模型03

創(chuàng)建固定資產(chǎn)分析模型04

創(chuàng)建項(xiàng)目投資決策模型CONTENTS目錄05

創(chuàng)建成本管理模型06

編制固定預(yù)算和彈性預(yù)算07

創(chuàng)建批量制作銷售訂單模型08

AI拓展與知識(shí)鞏固學(xué)習(xí)目標(biāo)與AI導(dǎo)學(xué)01學(xué)習(xí)目標(biāo)概述知識(shí)目標(biāo)

掌握自定義函數(shù)、pandas模塊的常見(jiàn)用法,以及可視化分析模塊在財(cái)務(wù)領(lǐng)域的應(yīng)用;理解AI+Python解決財(cái)務(wù)會(huì)計(jì)、管理會(huì)計(jì)問(wèn)題的業(yè)務(wù)邏輯。能力目標(biāo)

能夠根據(jù)財(cái)務(wù)會(huì)計(jì)和管理會(huì)計(jì)的業(yè)務(wù)要求,創(chuàng)建業(yè)務(wù)數(shù)據(jù)分析、固定資產(chǎn)分析、項(xiàng)目投資決策、成本管理、預(yù)算編制和批量制作銷售訂單等財(cái)務(wù)模型;能夠根據(jù)業(yè)務(wù)目標(biāo)和數(shù)據(jù)特征,利用可視化分析模塊選擇合適圖表進(jìn)行可視化呈現(xiàn),為分析決策提供支持。素養(yǎng)目標(biāo)

樹(shù)立專業(yè)自信,積極參與財(cái)務(wù)業(yè)務(wù)實(shí)踐,學(xué)會(huì)發(fā)現(xiàn)、分析和解決問(wèn)題以提高應(yīng)變能力;遵守堅(jiān)持學(xué)習(xí)、守正創(chuàng)新的會(huì)計(jì)人員職業(yè)道德規(guī)范,培養(yǎng)批判性思維,能對(duì)財(cái)務(wù)模型進(jìn)行反思和優(yōu)化;培養(yǎng)人機(jī)協(xié)同的辯證思維,提高數(shù)據(jù)安全意識(shí)和風(fēng)險(xiǎn)管理意識(shí),強(qiáng)化運(yùn)用數(shù)據(jù)服務(wù)經(jīng)濟(jì)社會(huì)發(fā)展的能力。AI在財(cái)務(wù)領(lǐng)域的應(yīng)用背景財(cái)務(wù)數(shù)據(jù)處理現(xiàn)狀在財(cái)務(wù)核算流程中,財(cái)務(wù)人員會(huì)接觸財(cái)務(wù)報(bào)表、科目余額表、明細(xì)賬等多種數(shù)據(jù)表。當(dāng)企業(yè)規(guī)模較小或數(shù)據(jù)量適中時(shí),Excel是處理簡(jiǎn)單運(yùn)算的常用工具。Excel的局限性隨著數(shù)據(jù)規(guī)模擴(kuò)大,大量重復(fù)性財(cái)務(wù)核算任務(wù)增加,企業(yè)對(duì)跨平臺(tái)數(shù)據(jù)表讀取、分組、排序,以及構(gòu)建復(fù)雜財(cái)務(wù)會(huì)計(jì)模型、進(jìn)行統(tǒng)計(jì)分析等數(shù)據(jù)處理需求提高,Excel難以滿足。Python的優(yōu)勢(shì)及應(yīng)用場(chǎng)景企業(yè)可利用Python中的pandas模塊進(jìn)行更高效的數(shù)據(jù)處理,結(jié)合matplotlib模塊進(jìn)行可視化呈現(xiàn)。本項(xiàng)目以業(yè)務(wù)數(shù)據(jù)分析、固定資產(chǎn)分析等常見(jiàn)會(huì)計(jì)核算業(yè)務(wù)為應(yīng)用場(chǎng)景,講解如何提升財(cái)務(wù)管理效率。創(chuàng)建業(yè)務(wù)數(shù)據(jù)分析模型02業(yè)務(wù)數(shù)據(jù)分析模型概述

業(yè)務(wù)數(shù)據(jù)分析的決策價(jià)值業(yè)務(wù)數(shù)據(jù)分析是企業(yè)決策的核心依據(jù),通過(guò)挖掘銷售數(shù)據(jù)特征與趨勢(shì),可支持產(chǎn)品策略、區(qū)域布局及資源調(diào)配等關(guān)鍵決策。

AI+Python技術(shù)架構(gòu)本任務(wù)融合AI工具與Python數(shù)據(jù)分析模塊(如pandas、matplotlib),構(gòu)建業(yè)務(wù)數(shù)據(jù)分析模型,實(shí)現(xiàn)數(shù)據(jù)挖掘、多維度分析及可視化呈現(xiàn)一體化流程。

模型應(yīng)用場(chǎng)景以銷售數(shù)據(jù)為案例,從數(shù)據(jù)生成、多維度分析(產(chǎn)品/區(qū)域/月份)到可視化展示,形成完整分析閉環(huán),提升財(cái)務(wù)管理效率與決策支持能力。模擬銷售數(shù)據(jù)生成

01數(shù)據(jù)維度設(shè)計(jì)涵蓋產(chǎn)品、區(qū)域、月份三大核心維度,模擬真實(shí)銷售場(chǎng)景的多維度交叉特征。

02數(shù)據(jù)生成代碼實(shí)現(xiàn)利用pandas、numpy庫(kù)生成模擬數(shù)據(jù):通過(guò)product函數(shù)構(gòu)建維度組合,隨機(jī)生成銷售量與銷售價(jià)格,計(jì)算銷售金額(銷售量×價(jià)格)。

03DataFrame數(shù)據(jù)結(jié)構(gòu)創(chuàng)建包含“月份、區(qū)域、產(chǎn)品、銷售量、銷售價(jià)格、銷售金額”6列的DataFrame,為后續(xù)分析提供標(biāo)準(zhǔn)化數(shù)據(jù)載體。多維度銷售數(shù)據(jù)分析01單維度分析:產(chǎn)品/區(qū)域/月份按產(chǎn)品維度:產(chǎn)品A銷售額居首(莫蘭迪色系柱形圖);按區(qū)域維度:南部區(qū)域銷售額領(lǐng)先;按月份維度:4月銷售額為年度峰值(折線圖展示趨勢(shì))。02交叉維度分析:產(chǎn)品×區(qū)域通過(guò)熱力圖呈現(xiàn)交叉分析結(jié)果,產(chǎn)品A在北部區(qū)域銷售額最高,西部區(qū)域整體銷售額偏低,直觀展示區(qū)域-產(chǎn)品組合表現(xiàn)。03交叉維度分析:月份×產(chǎn)品折線圖揭示不同產(chǎn)品的季節(jié)性銷售波動(dòng),為庫(kù)存管理與促銷策略提供依據(jù)。創(chuàng)建固定資產(chǎn)分析模型03固定資產(chǎn)分析模型背景與數(shù)據(jù)準(zhǔn)備

固定資產(chǎn)折舊核算的重要性固定資產(chǎn)折舊與企業(yè)成本控制、核算密切相關(guān),通過(guò)準(zhǔn)確核算折舊,可了解資產(chǎn)使用價(jià)值及經(jīng)濟(jì)耗損程度,合理估算成本費(fèi)用,精確衡量企業(yè)經(jīng)濟(jì)利潤(rùn)及財(cái)務(wù)狀況。

固定資產(chǎn)卡片數(shù)據(jù)寫(xiě)入Excel將包含資產(chǎn)編號(hào)、資產(chǎn)類別、使用狀況、原值、殘值等信息的固定資產(chǎn)卡片匯總表數(shù)據(jù),通過(guò)Python代碼寫(xiě)入"固定資產(chǎn)卡片匯總.xlsx"文件,確保數(shù)據(jù)規(guī)范存儲(chǔ)。

Excel數(shù)據(jù)讀取與預(yù)處理使用pandas模塊讀取Excel數(shù)據(jù),將"開(kāi)始使用日期"轉(zhuǎn)換為datetime格式,填充"減值"字段空值,為后續(xù)折舊計(jì)算和多維度分析奠定數(shù)據(jù)基礎(chǔ)。折舊計(jì)算與數(shù)據(jù)透視分析折舊相關(guān)字段計(jì)算根據(jù)當(dāng)前日期,計(jì)算已使用月份、月折舊額(直線法)、本月折舊(僅在用資產(chǎn)計(jì)提)、累計(jì)折舊及凈值,所有數(shù)值保留兩位小數(shù)。按資產(chǎn)類別匯總分析通過(guò)數(shù)據(jù)透視表按資產(chǎn)類別匯總原值、累計(jì)折舊和凈值,清晰呈現(xiàn)不同類別固定資產(chǎn)的價(jià)值規(guī)模與折舊情況,為資產(chǎn)結(jié)構(gòu)管理提供數(shù)據(jù)支持。按使用部門(mén)與狀況分析按使用部門(mén)匯總原值和本月折舊,掌握各部門(mén)資產(chǎn)占用及成本消耗;按使用狀況匯總資產(chǎn)數(shù)量和原值,了解在用、改造、報(bào)廢等不同狀態(tài)資產(chǎn)的分布情況。創(chuàng)建項(xiàng)目投資決策模型04貨幣時(shí)間價(jià)值計(jì)算基礎(chǔ)

01貨幣時(shí)間價(jià)值的決策意義貨幣時(shí)間價(jià)值是財(cái)務(wù)管理核心概念,指貨幣隨時(shí)間推移產(chǎn)生的增值,是投資決策、籌資決策的重要依據(jù),也廣泛應(yīng)用于個(gè)人理財(cái)、購(gòu)房還貸等場(chǎng)景。

02分步計(jì)算投資終值方法以飛翔集團(tuán)為例,讀取投資數(shù)據(jù)后,將投資時(shí)點(diǎn)與目標(biāo)時(shí)點(diǎn)轉(zhuǎn)換為datetime格式,計(jì)算間隔天數(shù),再根據(jù)日利率(年利率轉(zhuǎn)換)計(jì)算復(fù)利終值系數(shù),最終得出投資金額終值,該過(guò)程需分步處理數(shù)據(jù)轉(zhuǎn)換與計(jì)算邏輯。

03自定義函數(shù)優(yōu)化計(jì)算流程通過(guò)封裝TVM()函數(shù),整合投資回報(bào)率、目標(biāo)時(shí)點(diǎn)、項(xiàng)目數(shù)據(jù)等參數(shù),實(shí)現(xiàn)“數(shù)據(jù)讀取-間隔計(jì)算-終值輸出”一體化流程,調(diào)用函數(shù)可快速得到不同目標(biāo)時(shí)點(diǎn)(如2024-12-31、2025-12-31)的終值結(jié)果,顯著提升代碼復(fù)用性與計(jì)算效率。項(xiàng)目投資決策方法應(yīng)用

投資項(xiàng)目模擬數(shù)據(jù)構(gòu)建設(shè)計(jì)3個(gè)項(xiàng)目模擬數(shù)據(jù):項(xiàng)目A項(xiàng)目B項(xiàng)目C涵蓋不同投資規(guī)模與收益模式。

凈現(xiàn)值法(NPV)決策應(yīng)用設(shè)定折現(xiàn)率10%,按公式NPV=初始投資+Σ(CFt/(1+r)^t)計(jì)算:項(xiàng)目ANPV項(xiàng)目BNPV項(xiàng)目CNPV依據(jù)NPV>0原則,判斷最優(yōu)項(xiàng)目。項(xiàng)目投資決策方法應(yīng)用

投資回收期法決策應(yīng)用靜態(tài)投資回收期計(jì)算:項(xiàng)目A累計(jì)現(xiàn)金流量第3.71年收回初始投資,項(xiàng)目B需4.00年,項(xiàng)目C需3.67年,結(jié)合“回收期越短風(fēng)險(xiǎn)越低”原則,項(xiàng)目C為最優(yōu)選擇,與凈現(xiàn)值法結(jié)論一致。創(chuàng)建成本管理模型05本量利分析模型構(gòu)建本量利分析的概念與作用本量利分析以成本性態(tài)分析和變動(dòng)成本法為基礎(chǔ),通過(guò)研究成本、業(yè)務(wù)量和利潤(rùn)之間的關(guān)系,幫助企業(yè)進(jìn)行保本分析、保利分析和安全邊際分析,為成本控制和經(jīng)營(yíng)決策提供支持。多品種產(chǎn)品本量利分析模型構(gòu)建針對(duì)多品種產(chǎn)品,需分別計(jì)算各產(chǎn)品的保本銷售量、保本銷售額、保利銷售量、保利銷售額及安全邊際相關(guān)指標(biāo)。如產(chǎn)品A(單價(jià)120元,單位變動(dòng)成本80元,固定成本20000元,目標(biāo)利潤(rùn)10000元,銷售量800件),其保本銷售量為500件,保利銷售量為750件,安全邊際量300件,安全邊際率37.50%。盈虧平衡點(diǎn)可視化圖表繪制通過(guò)Matplotlib繪制總成本與總收益曲線,標(biāo)記盈虧平衡點(diǎn)。以產(chǎn)品為例,橫軸為銷售量,縱軸為金額,總成本線(固定成本+單位變動(dòng)成本×銷售量)與總收益線(單價(jià)×銷售量)交點(diǎn)即為盈虧平衡點(diǎn),直觀展示企業(yè)盈利與虧損的臨界點(diǎn)。標(biāo)準(zhǔn)成本法分析模型標(biāo)準(zhǔn)成本法的意義標(biāo)準(zhǔn)成本法是量化的成本分析方法,通過(guò)設(shè)定標(biāo)準(zhǔn)成本,與實(shí)際成本對(duì)比計(jì)算差異,清晰反映產(chǎn)品成本組成,為合理編制生產(chǎn)預(yù)算、提升成本控制和管理的科學(xué)性提供依據(jù)。產(chǎn)品成本模擬數(shù)據(jù)設(shè)計(jì)模擬數(shù)據(jù)包含產(chǎn)品的標(biāo)準(zhǔn)用量、標(biāo)準(zhǔn)價(jià)格、實(shí)際用量、實(shí)際價(jià)格和實(shí)際產(chǎn)量。如產(chǎn)品A:標(biāo)準(zhǔn)用量10、標(biāo)準(zhǔn)價(jià)格5、實(shí)際用量12、實(shí)際價(jià)格6、實(shí)際產(chǎn)量100;產(chǎn)品B:標(biāo)準(zhǔn)用量8、標(biāo)準(zhǔn)價(jià)格7、實(shí)際用量9、實(shí)際價(jià)格8、實(shí)際產(chǎn)量150。標(biāo)準(zhǔn)成本與實(shí)際成本計(jì)算標(biāo)準(zhǔn)成本=標(biāo)準(zhǔn)用量×標(biāo)準(zhǔn)價(jià)格×實(shí)際產(chǎn)量,實(shí)際成本=實(shí)際用量×實(shí)際價(jià)格×實(shí)際產(chǎn)量。產(chǎn)品A標(biāo)準(zhǔn)成本5000元,實(shí)際成本7200元;產(chǎn)品B標(biāo)準(zhǔn)成本8400元,實(shí)際成本10800元。標(biāo)準(zhǔn)成本法分析模型

成本差異分析成本總差異=實(shí)際成本-標(biāo)準(zhǔn)成本,價(jià)格差異=(實(shí)際價(jià)格-標(biāo)準(zhǔn)價(jià)格)×實(shí)際用量×實(shí)際產(chǎn)量,用量差異=(實(shí)際產(chǎn)量×實(shí)際用量-實(shí)際產(chǎn)量×標(biāo)準(zhǔn)用量)×標(biāo)準(zhǔn)價(jià)格。產(chǎn)品A總差異2200元(價(jià)格差異1200元,用量差異1000元);產(chǎn)品B總差異2400元(價(jià)格差異1350元,用量差異1050元)。編制固定預(yù)算和彈性預(yù)算06創(chuàng)建批量制作銷售訂單模型07批量制作銷售訂單背景與模塊導(dǎo)入

業(yè)財(cái)融合下的訂單處理需求在業(yè)財(cái)融合背景下,企業(yè)訂單量增長(zhǎng),需按日期拆分銷售訂單以支持業(yè)務(wù)決策。以北京飛翔體育用品有限公司2025年1月1-5日訂單為例,ERP系統(tǒng)導(dǎo)出數(shù)據(jù)需逐日拆分確認(rèn),提升運(yùn)營(yíng)效率。

核心模塊功能介紹pathlib模塊:用于文件路徑創(chuàng)建與管理,支持目錄操作;pandas模塊:實(shí)現(xiàn)數(shù)據(jù)讀取、分組及處理;xlwings模塊:實(shí)現(xiàn)Python與Excel交互,支持模板格式應(yīng)用與工作簿操作。銷售訂單數(shù)據(jù)處理與導(dǎo)出數(shù)據(jù)準(zhǔn)備與分組創(chuàng)建"每日銷售訂單表"文件夾存儲(chǔ)結(jié)果;讀取Excel訂單數(shù)據(jù),按"訂單日期"列分組,示例數(shù)據(jù)含18條記錄,涉及運(yùn)動(dòng)長(zhǎng)袖、運(yùn)動(dòng)鞋等多類產(chǎn)品。模板應(yīng)用與格式處理使用xlwings打開(kāi)"銷售訂單模板.xlsx",復(fù)制模板工作表至新工作簿;刪除"訂單日期"列,重置"序號(hào)",將數(shù)據(jù)寫(xiě)入模板指定區(qū)域(A4單元格起),粘貼模板格式(含行高、數(shù)字格式)。批量導(dǎo)出與保存按日期命名工作簿(如"2025-01-01.xlsx"),保存至目標(biāo)文件夾。遍歷分組數(shù)據(jù)完成1月1-5日訂單拆分,實(shí)現(xiàn)自動(dòng)化批量處理,減少人工操作錯(cuò)誤。AI拓展與知識(shí)鞏固08AI在財(cái)務(wù)分析中的拓展應(yīng)用資金使用效率分析模型通過(guò)Python構(gòu)建模型,計(jì)算各業(yè)務(wù)部門(mén)資金周轉(zhuǎn)次數(shù)與資金占用時(shí)長(zhǎng)的比值作為效率指標(biāo)。產(chǎn)品成本效益分析工具針對(duì)不同產(chǎn)品的固定成本、變動(dòng)成本與收益數(shù)據(jù),利用Python計(jì)算成本效益比并生成柱形圖。該工具能直觀對(duì)比各產(chǎn)品盈利效率,輔助企業(yè)優(yōu)化產(chǎn)品組合與定價(jià)策略,提升資源配置科學(xué)性。智能模型的復(fù)用與迭代AI生成的財(cái)務(wù)模型具備高度復(fù)用性,可通過(guò)調(diào)整參數(shù)適應(yīng)不同業(yè)務(wù)場(chǎng)景(如資金分析、成本管控)。結(jié)合海量數(shù)據(jù)訓(xùn)練,模型能持續(xù)優(yōu)化分析邏輯,為企業(yè)提供前瞻性財(cái)務(wù)洞察,推動(dòng)財(cái)務(wù)管理智能化升級(jí)。知識(shí)鞏固與技能提升

即測(cè)即評(píng)練習(xí)體系通過(guò)掃描二維碼完成針對(duì)性練習(xí),涵蓋財(cái)務(wù)模型構(gòu)建各環(huán)節(jié)(數(shù)據(jù)處理、函數(shù)應(yīng)用、可視化等),實(shí)時(shí)檢驗(yàn)知識(shí)掌握程度,強(qiáng)化對(duì)AI+Python財(cái)務(wù)應(yīng)用基礎(chǔ)的理解與記憶。

實(shí)際案例驅(qū)動(dòng)學(xué)習(xí)以宏大公司投資項(xiàng)目管理為例,要求開(kāi)發(fā)Python模型計(jì)算到期剩余年限并按期限區(qū)間匯總金額。通過(guò)真實(shí)業(yè)務(wù)場(chǎng)景演練,提升將理論知識(shí)轉(zhuǎn)化為解決復(fù)雜財(cái)務(wù)問(wèn)題的實(shí)踐能力。

技能提升路徑規(guī)劃從基礎(chǔ)模塊操作(pandas、matplotlib)到綜合模型開(kāi)發(fā)(投資決策、預(yù)算管理),逐步進(jìn)階。結(jié)合AI工具輔助編程,降低技術(shù)門(mén)檻,重點(diǎn)培養(yǎng)數(shù)據(jù)思維與模型優(yōu)化能力,適應(yīng)企業(yè)財(cái)務(wù)數(shù)字化需求。投資項(xiàng)目到期剩余年限計(jì)算

基期設(shè)定與數(shù)據(jù)預(yù)處理以2025年11月30日為基期,讀取宏大公司投資項(xiàng)目信息表(含投資金額、到期日等字段),通過(guò)Python將日期數(shù)據(jù)轉(zhuǎn)換為datetime格式,確保時(shí)間計(jì)算準(zhǔn)確性。

剩余年限計(jì)算邏輯利用datetime模塊計(jì)算各項(xiàng)目到期日與基期的時(shí)間差,精確到年(保留小數(shù))。公式:剩余年限=(到期日-基期日)/365,示例中tz0002項(xiàng)目(2026/3/29到期)剩余年限為0.33年。

期限區(qū)間匯總與可視化按1年及以內(nèi)、1-2年、2-3年、3年以上區(qū)間分組匯總投資金額,生成分布統(tǒng)計(jì)表。通過(guò)Python繪制餅圖或柱狀圖,清晰展示不同期限投資占比,為資金規(guī)劃與到期管理提供直觀依據(jù)。財(cái)務(wù)模型構(gòu)建關(guān)鍵要點(diǎn)回顧

數(shù)據(jù)處理核心技術(shù)掌握pandas模塊的數(shù)據(jù)讀?。╮ead_excel/csv)、清洗(fillna/drop)、分組聚合(groupby/pivot_table)操作,確保數(shù)據(jù)源可靠。示例:固定資產(chǎn)卡片數(shù)據(jù)通過(guò)pd.to_datetime轉(zhuǎn)換日期格式,為折舊計(jì)算奠定基礎(chǔ)。

函數(shù)與模型設(shè)計(jì)原則自定義函數(shù)需遵循單一職責(zé)原則(如TVM函數(shù)專注貨幣時(shí)間價(jià)值計(jì)算),參數(shù)設(shè)置靈活可擴(kuò)展。模型構(gòu)建采用模塊化思想,分步驟實(shí)現(xiàn)(數(shù)據(jù)輸入→計(jì)算邏輯→結(jié)果輸出),提升代碼可讀性與復(fù)用性。

可視化呈現(xiàn)技巧運(yùn)用matplotlib選擇合適圖表類型:趨勢(shì)分析用折線圖、對(duì)比分析用柱狀圖、分布分析用熱力圖。采用莫蘭迪色系等專業(yè)配色方案,添加網(wǎng)格線、標(biāo)題標(biāo)簽優(yōu)化圖表可讀性,使財(cái)務(wù)數(shù)據(jù)洞察更直觀??偨Y(jié)與思考

AI+Python財(cái)務(wù)應(yīng)用核心價(jià)值通過(guò)自動(dòng)化數(shù)據(jù)處理、智能化分析建模、可視化決策支持,AI+Python重新定義財(cái)務(wù)管理模式,使財(cái)務(wù)人員從重復(fù)勞動(dòng)中解放,聚焦戰(zhàn)略規(guī)劃與風(fēng)險(xiǎn)管控,成為企業(yè)價(jià)值創(chuàng)造的核心驅(qū)動(dòng)力。

企業(yè)落地路徑思考建議從高頻重復(fù)任務(wù)(如批量制單、報(bào)表生成)入手試點(diǎn)AI模型,逐步推廣至復(fù)雜分析場(chǎng)景(投資決策、預(yù)算管理)。同時(shí)加強(qiáng)財(cái)務(wù)人員編程技能培訓(xùn),構(gòu)建"業(yè)務(wù)+技術(shù)"復(fù)合型團(tuán)隊(duì),確保模型落地效果。

未來(lái)財(cái)務(wù)工作者角色轉(zhuǎn)變AI技術(shù)將推動(dòng)財(cái)務(wù)人員向"數(shù)據(jù)分析師+業(yè)務(wù)伙伴"轉(zhuǎn)型,需具備數(shù)據(jù)解讀能力(從模型結(jié)果提煉業(yè)務(wù)洞察)、跨部門(mén)協(xié)作能力(將財(cái)務(wù)分析融入業(yè)務(wù)決策)、持續(xù)學(xué)習(xí)能力(跟蹤AI技術(shù)在財(cái)務(wù)領(lǐng)域的創(chuàng)新應(yīng)用)。THEEND謝謝AI+Python綜合應(yīng)用:挖掘財(cái)務(wù)數(shù)據(jù)價(jià)值CONTENTS目錄01

AI+Python財(cái)務(wù)應(yīng)用概述02

AI+Python可視化分析財(cái)務(wù)數(shù)據(jù)03

AI+Python分析財(cái)報(bào)數(shù)據(jù)04

AI拓展應(yīng)用05

AI+Python財(cái)務(wù)應(yīng)用總結(jié)AI+Python財(cái)務(wù)應(yīng)用概述01學(xué)習(xí)目標(biāo)

知識(shí)目標(biāo)掌握AI+Python數(shù)據(jù)分析工具的融合應(yīng)用邏輯及基本思路方法,熟悉AI增強(qiáng)型可視化技術(shù)(如交互式儀表盤(pán))實(shí)現(xiàn)原理與pyecharts等模塊應(yīng)用場(chǎng)景。

能力目標(biāo)能運(yùn)用AI工具完成財(cái)務(wù)數(shù)據(jù)智能分析并優(yōu)化傳統(tǒng)Python流程,結(jié)合AI設(shè)計(jì)多維度Python可視化分析方案,為管理層提供決策支持。

素養(yǎng)目標(biāo)建立AI倫理意識(shí),遵守隱私保護(hù)與合規(guī)要求;培養(yǎng)人機(jī)協(xié)同思維,提升分析效率并驗(yàn)證修正模型輸出;踐行“數(shù)據(jù)工匠”精神,優(yōu)化模型追求結(jié)果精準(zhǔn)與業(yè)務(wù)價(jià)值最大化。AI在財(cái)務(wù)領(lǐng)域應(yīng)用背景01財(cái)會(huì)產(chǎn)業(yè)鏈數(shù)字化重構(gòu)數(shù)字經(jīng)濟(jì)時(shí)代,“大智移云物區(qū)”技術(shù)推動(dòng)業(yè)務(wù)、財(cái)務(wù)、稅務(wù)數(shù)據(jù)全域融合,形成多維度數(shù)據(jù)網(wǎng)絡(luò),傳統(tǒng)核算職能向戰(zhàn)略決策支持演進(jìn)。02AI+Python模式解決方案面對(duì)海量異構(gòu)數(shù)據(jù),“AI助手+Python編程”提供從智能數(shù)據(jù)采集、AI增強(qiáng)清洗到動(dòng)態(tài)決策支持的全鏈路解決方案,賦能財(cái)務(wù)分析范式升級(jí)。03可視化工具驅(qū)動(dòng)決策AI驅(qū)動(dòng)的可視化工具助力財(cái)務(wù)人員構(gòu)建多維度動(dòng)態(tài)看板,將數(shù)據(jù)洞察轉(zhuǎn)化為管理層可感知的決策語(yǔ)言,推動(dòng)財(cái)務(wù)分析從經(jīng)驗(yàn)驅(qū)動(dòng)向“數(shù)據(jù)—算法—洞察”智能范式轉(zhuǎn)變。數(shù)據(jù)分析完整流程

數(shù)據(jù)采集通過(guò)AI+人工協(xié)同方式,從行業(yè)數(shù)據(jù)源(如巨潮資訊網(wǎng))采集細(xì)顆粒度、多維度數(shù)據(jù),構(gòu)建高質(zhì)量數(shù)據(jù)集,為后續(xù)分析奠定基礎(chǔ)。數(shù)據(jù)加工缺失值處理采用AI增強(qiáng)填充技術(shù),結(jié)合財(cái)務(wù)業(yè)務(wù)邏輯選擇處理方法:數(shù)值型數(shù)據(jù)用均值/中位數(shù)填充(如流動(dòng)比率用行業(yè)中位數(shù)),類別型數(shù)據(jù)用眾數(shù)填充(如行業(yè)分類),關(guān)鍵指標(biāo)缺失時(shí)通過(guò)前后期間數(shù)據(jù)插值法修復(fù),確保數(shù)據(jù)完整性。異常值檢測(cè)運(yùn)用3σ原則與箱線圖法識(shí)別異常值,結(jié)合財(cái)務(wù)專業(yè)判斷:對(duì)極端值(如遠(yuǎn)超行業(yè)均值的營(yíng)收數(shù)據(jù))進(jìn)行Winsorize縮尾處理,對(duì)邏輯矛盾值(如資產(chǎn)負(fù)債率>100%)通過(guò)原始憑證復(fù)核修正,保留合理業(yè)務(wù)異常(如季節(jié)性波動(dòng))并標(biāo)記說(shuō)明。數(shù)據(jù)標(biāo)準(zhǔn)化針對(duì)不同量綱財(cái)務(wù)指標(biāo)實(shí)施標(biāo)準(zhǔn)化:比率類指標(biāo)(如毛利率)采用min-max歸一化至[0,1]區(qū)間,絕對(duì)數(shù)指標(biāo)(如營(yíng)業(yè)收入)通過(guò)Z-score標(biāo)準(zhǔn)化消除規(guī)模影響,確保橫向可比(如同業(yè)對(duì)比)與縱向可比(如跨期分析)。數(shù)據(jù)轉(zhuǎn)換執(zhí)行業(yè)務(wù)導(dǎo)向的數(shù)據(jù)轉(zhuǎn)換:文本型數(shù)據(jù)(如日期、會(huì)計(jì)科目)轉(zhuǎn)為結(jié)構(gòu)化格式(YYYY-MM-DD日期型、科目代碼數(shù)值型),非正態(tài)分布指標(biāo)(如利潤(rùn)額)通過(guò)對(duì)數(shù)/Box-Cox變換改善分布特性,分類變量(如企業(yè)性質(zhì))采用獨(dú)熱編碼適配算法需求。數(shù)據(jù)分析借助AI增強(qiáng)分析工具,開(kāi)展多維度指標(biāo)分析(盈利能力、償債能力、營(yíng)運(yùn)能力等),挖掘數(shù)據(jù)內(nèi)在關(guān)聯(lián)與業(yè)務(wù)洞察。數(shù)據(jù)應(yīng)用通過(guò)AI驅(qū)動(dòng)可視化技術(shù)(如動(dòng)態(tài)看板、交互式儀表盤(pán))呈現(xiàn)分析結(jié)果,將數(shù)據(jù)洞察轉(zhuǎn)化為管理層可感知的決策語(yǔ)言,實(shí)現(xiàn)從數(shù)據(jù)到價(jià)值的閉環(huán)。數(shù)據(jù)分析完整流程AI+Python可視化分析財(cái)務(wù)數(shù)據(jù)02業(yè)務(wù)場(chǎng)景與數(shù)據(jù)獲取

行業(yè)數(shù)據(jù)增長(zhǎng)下的分析需求財(cái)務(wù)報(bào)告分析是利益相關(guān)者洞察企業(yè)財(cái)務(wù)健康與經(jīng)營(yíng)成果的核心工具。在行業(yè)數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng)的當(dāng)下,高效整合行業(yè)基準(zhǔn)數(shù)據(jù),形成具有行業(yè)對(duì)標(biāo)價(jià)值的高質(zhì)量數(shù)據(jù)集成為關(guān)鍵。

AI+人工協(xié)同的數(shù)據(jù)采集模式采用AI+人工協(xié)同方式,從行業(yè)數(shù)據(jù)采集、跨企業(yè)財(cái)務(wù)指標(biāo)對(duì)比,到可視化呈現(xiàn)行業(yè)競(jìng)爭(zhēng)定位,構(gòu)建全鏈路閉環(huán)。以計(jì)算機(jī)行業(yè)為例,通過(guò)AI工具獲取2024年?duì)I業(yè)收入前10的上市公司信息,人工核實(shí)后形成“計(jì)算機(jī)行業(yè)上市公司名單.xlsx”。

數(shù)據(jù)來(lái)源與可靠性保障數(shù)據(jù)來(lái)源為巨潮資訊網(wǎng)等權(quán)威平臺(tái),AI輸出結(jié)果經(jīng)人工驗(yàn)證,確保數(shù)據(jù)的準(zhǔn)確性與合規(guī)性,為后續(xù)財(cái)務(wù)數(shù)據(jù)可視化分析奠定堅(jiān)實(shí)基礎(chǔ)。數(shù)據(jù)讀取與行業(yè)分類分布Python讀取Excel數(shù)據(jù)文件

使用pandas庫(kù)讀取“計(jì)算機(jī)行業(yè)上市公司名單.xlsx”文件,通過(guò)指定dtype={'證券代碼':str}確保證券代碼格式正確代碼示例:df=pd.read_excel('計(jì)算機(jī)行業(yè)上市公司名單.xlsx',dtype={'證券代碼':str})。AI驅(qū)動(dòng)的行業(yè)分類詞云圖繪制

利用豆包AI編程助手生成代碼,通過(guò)pyecharts庫(kù)繪制申萬(wàn)行業(yè)三級(jí)名稱詞云圖。核心步驟包括數(shù)據(jù)獲取(counts=df['申萬(wàn)行業(yè)三級(jí)名稱'].value_counts())、字典轉(zhuǎn)換(data=counts.to_dict())及詞云對(duì)象創(chuàng)建與渲染,直觀展示行業(yè)分類分布情況。詞云圖的分析價(jià)值

詞云圖能清晰呈現(xiàn)計(jì)算機(jī)行業(yè)各細(xì)分領(lǐng)域的企業(yè)數(shù)量占比,幫助快速識(shí)別行業(yè)熱門(mén)細(xì)分賽道,為后續(xù)聚焦特定領(lǐng)域(如安防設(shè)備)分析提供方向。安防設(shè)備行業(yè)數(shù)據(jù)篩選與業(yè)務(wù)規(guī)模分析

01安防設(shè)備企業(yè)證券代碼篩選基于申萬(wàn)行業(yè)三級(jí)名稱,使用Python篩選出安防設(shè)備行業(yè)上市公司,代碼示例:df1=df[df['申萬(wàn)行業(yè)三級(jí)名稱']=='安防設(shè)備'],獲取證券代碼列表用于后續(xù)財(cái)務(wù)數(shù)據(jù)采集。

022024年?duì)I業(yè)收入數(shù)據(jù)獲取從巨潮資訊網(wǎng)獲取安防設(shè)備行業(yè)26家上市公司2024年?duì)I業(yè)收入數(shù)據(jù),涵蓋大華股份等企業(yè),數(shù)據(jù)精確到小數(shù)點(diǎn)后兩位。

03業(yè)務(wù)規(guī)模條形圖可視化利用matplotlib繪制條形圖,按營(yíng)業(yè)收入降序排列,設(shè)置中文字體(SimHei)及圖片清晰度(dpi=300),直觀展示各公司業(yè)務(wù)規(guī)模差異。盈利能力分析baostock接口獲取盈利指標(biāo)通過(guò)baostock接口查詢安防設(shè)備行業(yè)2024年Q4盈利能力數(shù)據(jù),涉及證券代碼包括sz.002415、sz.002236等8家企業(yè),獲取指標(biāo)涵蓋凈資產(chǎn)收益率、銷售凈利率、銷售毛利率等。數(shù)據(jù)處理與格式轉(zhuǎn)換將接口返回的文本格式數(shù)據(jù)轉(zhuǎn)換為數(shù)值型,凈利潤(rùn)和主營(yíng)業(yè)務(wù)收入單位轉(zhuǎn)換為萬(wàn)元,代碼示例:result_profit['凈利潤(rùn)/萬(wàn)元']=(result_profit['凈利潤(rùn)'].astype(float)/10000),并保留兩位小數(shù)。盈利能力可視化呈現(xiàn)使用pyecharts繪制柱形圖對(duì)比凈資產(chǎn)收益率、銷售凈利率、銷售毛利率;通過(guò)matplotlib繪制雷達(dá)圖展示每股收益,多維度呈現(xiàn)企業(yè)盈利水平,輔助利益相關(guān)者快速識(shí)別行業(yè)盈利標(biāo)桿。償債能力分析償債能力指標(biāo)數(shù)據(jù)采集調(diào)用baostock接口query_balance_data函數(shù),獲取安防設(shè)備行業(yè)8家上市公司2024年Q4償債能力指標(biāo),包括流動(dòng)比率、速動(dòng)比率、現(xiàn)金比率、資產(chǎn)負(fù)債率及權(quán)益乘數(shù)。數(shù)據(jù)清洗與單位轉(zhuǎn)換將文本格式數(shù)據(jù)轉(zhuǎn)換為數(shù)值型,資產(chǎn)負(fù)債率轉(zhuǎn)換為百分比形式(result_balance['資產(chǎn)負(fù)債率']=result_balance['資產(chǎn)負(fù)債率'].astype(float)*100),提取關(guān)鍵指標(biāo)形成balance_data數(shù)據(jù)集。熱力圖與箱線圖分析繪制熱力圖直觀展示各償債指標(biāo)數(shù)值分布,箱線圖呈現(xiàn)指標(biāo)離散程度。例如,資產(chǎn)負(fù)債率熱力圖可快速定位高負(fù)債企業(yè),箱線圖能識(shí)別流動(dòng)比率異常值,為企業(yè)償債風(fēng)險(xiǎn)評(píng)估提供數(shù)據(jù)支持。營(yíng)運(yùn)能力分析

營(yíng)運(yùn)能力指標(biāo)獲取流程通過(guò)baostock接口query_operation_data函數(shù),采集安防設(shè)備行業(yè)8家企業(yè)2024年Q4營(yíng)運(yùn)能力數(shù)據(jù),指標(biāo)包括應(yīng)收賬款周轉(zhuǎn)率、存貨周轉(zhuǎn)率、流動(dòng)資產(chǎn)周轉(zhuǎn)率及總資產(chǎn)周轉(zhuǎn)率。

數(shù)據(jù)類型轉(zhuǎn)換與提取使用astype函數(shù)將文本格式指標(biāo)轉(zhuǎn)換為float型,提取應(yīng)收賬款周轉(zhuǎn)率、存貨周轉(zhuǎn)率、流動(dòng)資產(chǎn)周轉(zhuǎn)率、總資產(chǎn)周轉(zhuǎn)率形成operation_data數(shù)據(jù)集,代碼示例:result_operation=result_operation.astype({'應(yīng)收賬款周轉(zhuǎn)率':'float',...})。營(yíng)運(yùn)能力分析

散點(diǎn)圖矩陣與面積圖可視化利用seaborn繪制散點(diǎn)圖矩陣,觀察營(yíng)運(yùn)指標(biāo)間相關(guān)性;通過(guò)matplotlib繪制面積圖,展示各公司在不同營(yíng)運(yùn)指標(biāo)上的表現(xiàn)。例如,散點(diǎn)圖矩陣可發(fā)現(xiàn)應(yīng)收賬款周轉(zhuǎn)率與總資產(chǎn)周轉(zhuǎn)率的正相關(guān)關(guān)系,面積圖能對(duì)比企業(yè)整體營(yíng)運(yùn)效率差異。財(cái)務(wù)數(shù)據(jù)可視化總結(jié)

多樣化圖表的優(yōu)勢(shì)與適用場(chǎng)景不同圖表各有優(yōu)勢(shì):柱形圖適合對(duì)比多指標(biāo)數(shù)據(jù),雷達(dá)圖便于展示多維度綜合能力,熱力圖直觀呈現(xiàn)數(shù)據(jù)分布,箱線圖能識(shí)別異常值。需根據(jù)數(shù)據(jù)特性與分析需求選擇,如盈利能力分析用柱形圖,償債能力分析用熱力圖。

數(shù)據(jù)采集與處理的關(guān)鍵地位數(shù)據(jù)的精確性、完整性與一致性是可視化分析的前提。通過(guò)AI工具實(shí)現(xiàn)數(shù)據(jù)清洗、異常值檢測(cè)與缺失值自動(dòng)化處理,減少人工干預(yù)主觀性,提升數(shù)據(jù)處理效率和質(zhì)量,確保分析結(jié)論正確可靠。

AI+Python模式的協(xié)同價(jià)值“AI助手+Python編程”模式提供全鏈路解決方案,從智能數(shù)據(jù)采集、AI增強(qiáng)清洗到動(dòng)態(tài)決策支持。AI生成代碼框架結(jié)合人工業(yè)務(wù)優(yōu)化,推動(dòng)財(cái)務(wù)分析從經(jīng)驗(yàn)驅(qū)動(dòng)向“數(shù)據(jù)—算法—洞察”智能范式升級(jí),助力財(cái)務(wù)人員將數(shù)據(jù)洞察轉(zhuǎn)化為管理層可感知的決策語(yǔ)言。AI+Python分析財(cái)報(bào)數(shù)據(jù)03多源數(shù)據(jù)采集鏈路構(gòu)建新能源汽車行業(yè)數(shù)據(jù)采集渠道公開(kāi)數(shù)據(jù)來(lái)源包括證券交易所官網(wǎng)(如深交所、上交所)、第三方金融平臺(tái)(新浪財(cái)經(jīng)、東方財(cái)富網(wǎng))、企業(yè)官方網(wǎng)站投資者關(guān)系板塊等,可獲取財(cái)務(wù)年報(bào)、利潤(rùn)表、資產(chǎn)負(fù)債表、現(xiàn)金流量表等核心數(shù)據(jù)。比亞迪數(shù)據(jù)獲取步驟示例從深交所官網(wǎng)搜索“比亞迪(002594)”,在定期報(bào)告中下載2024年年度報(bào)告PDF/Excel附件;或訪問(wèn)新浪財(cái)經(jīng)個(gè)股頁(yè)面,通過(guò)“財(cái)務(wù)數(shù)據(jù)”標(biāo)簽查看利潤(rùn)表、關(guān)鍵指標(biāo)等結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)人機(jī)協(xié)同數(shù)據(jù)采集。從新浪財(cái)經(jīng)獲取比亞迪利潤(rùn)表數(shù)據(jù)Python爬蟲(chóng)函數(shù)設(shè)計(jì)定義fetch_income_statement函數(shù),使用requests庫(kù)發(fā)送HTTP請(qǐng)求,設(shè)置User-Agent模擬瀏覽器訪問(wèn),通過(guò)BeautifulSoup解析HTML,提取新浪財(cái)經(jīng)利潤(rùn)表表格中的指標(biāo)名稱與對(duì)應(yīng)數(shù)值。數(shù)據(jù)解析與轉(zhuǎn)換將提取的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為DataFrame格式,設(shè)置表頭為日期列,索引為財(cái)務(wù)指標(biāo)(如“一、營(yíng)業(yè)總收入”“二、營(yíng)業(yè)總成本”),處理千分位逗號(hào)與缺失值符號(hào)(如“—”),確保數(shù)據(jù)格式規(guī)范。比亞迪利潤(rùn)表示例輸出調(diào)用函數(shù)獲取證券代碼“002594”的2024年利潤(rùn)表數(shù)據(jù),輸出包含營(yíng)業(yè)總收入、營(yíng)業(yè)成本、銷售費(fèi)用、研發(fā)費(fèi)用、凈利潤(rùn)等關(guān)鍵指標(biāo)的DataFrame,支持后續(xù)分析與可視化。數(shù)據(jù)處理與準(zhǔn)備

數(shù)據(jù)寫(xiě)入與讀取配置使用to_excel方法將比亞迪利潤(rùn)表數(shù)據(jù)保存為“比亞迪利潤(rùn)表.xlsx”,讀取時(shí)通過(guò)pd.read_excel設(shè)置header=1(跳過(guò)空行)、index_col=0(指標(biāo)名稱為索引)、thousands=','(自動(dòng)處理千分位)、na_values=['—','--'](定義缺失值)。

數(shù)據(jù)清洗與標(biāo)準(zhǔn)化清除索引名稱中的特殊字符,將“營(yíng)業(yè)稅金及附加”科目調(diào)整為“稅金及附加”,確保會(huì)計(jì)科目與現(xiàn)行準(zhǔn)則一致;通過(guò)astype函數(shù)將文本格式的財(cái)務(wù)數(shù)據(jù)轉(zhuǎn)換為數(shù)值型,為可視化分析奠定基礎(chǔ)。

數(shù)據(jù)完整性驗(yàn)證檢查關(guān)鍵指標(biāo)(如營(yíng)業(yè)總收入、凈利潤(rùn))是否存在缺失值,通過(guò)head()預(yù)覽數(shù)據(jù)前5行,確認(rèn)數(shù)據(jù)讀取準(zhǔn)確性與結(jié)構(gòu)完整性,保證后續(xù)分析結(jié)果可靠。收入成本結(jié)構(gòu)環(huán)形圖分析雙層環(huán)形圖設(shè)計(jì)邏輯外層環(huán)展示營(yíng)業(yè)總收入與營(yíng)業(yè)總成本占比,內(nèi)層環(huán)細(xì)化營(yíng)業(yè)成本、稅金及附加、銷售費(fèi)用、管理費(fèi)用、研發(fā)費(fèi)用的構(gòu)成,通過(guò)半徑差異與顏色區(qū)分(如外層暖色調(diào)、內(nèi)層同色系漸變)實(shí)現(xiàn)層次化數(shù)據(jù)呈現(xiàn)。比亞迪2024Q4成本結(jié)構(gòu)示例外層環(huán)顯示營(yíng)業(yè)總收入(假設(shè)680億元)與營(yíng)業(yè)總成本(假設(shè)626億元)比例;內(nèi)層環(huán)中營(yíng)業(yè)成本占比超80%(約505億元),研發(fā)費(fèi)用占比8.5%(約53億元),直觀反映成本核心構(gòu)成。圖表解讀價(jià)值環(huán)形圖將復(fù)雜成本結(jié)構(gòu)轉(zhuǎn)化為可視化占比關(guān)系,幫助管理層快速識(shí)別成本控制重點(diǎn)(如營(yíng)業(yè)成本優(yōu)化)與資源投入方向(如研發(fā)費(fèi)用增長(zhǎng)趨勢(shì)),提升決策效率。季度利潤(rùn)氣泡圖分析

氣泡圖參數(shù)映射規(guī)則以2024年Q1-Q4為分析周期,橫軸為營(yíng)業(yè)收入(億元),縱軸為營(yíng)業(yè)利潤(rùn)(億元),氣泡大小映射營(yíng)業(yè)總成本(億元),通過(guò)顏色區(qū)分季度(如Q1藍(lán)色、Q4紅色),實(shí)現(xiàn)多維度數(shù)據(jù)關(guān)聯(lián)展示。

比亞迪季度利潤(rùn)特征Q4氣泡最大(總成本最高),對(duì)應(yīng)營(yíng)業(yè)收入與營(yíng)業(yè)利潤(rùn)峰值(假設(shè)營(yíng)收680億元、利潤(rùn)54億元);Q1氣泡最?。I(yíng)收320億元、利潤(rùn)18億元),呈現(xiàn)逐季增長(zhǎng)趨勢(shì),反映業(yè)務(wù)規(guī)模擴(kuò)張與利潤(rùn)提升同步性。

異常點(diǎn)識(shí)別與分析若某季度氣泡偏離營(yíng)收-利潤(rùn)增長(zhǎng)趨勢(shì)(如成本突增但利潤(rùn)未同步上升),可觸發(fā)進(jìn)一步核查,如供應(yīng)鏈波動(dòng)或費(fèi)用異常,體現(xiàn)可視化工具的異常檢測(cè)價(jià)值。季度營(yíng)收雷達(dá)圖分析指標(biāo)選取與歸一化處理提取營(yíng)業(yè)總收入、營(yíng)業(yè)總成本、營(yíng)業(yè)利潤(rùn)、利潤(rùn)總額、凈利潤(rùn)5項(xiàng)核心指標(biāo),采用min-max歸一化消除量綱差異,使季度間數(shù)據(jù)具備可比性。2024年季度雷達(dá)圖特征環(huán)比變化趨勢(shì)解讀從Q1到Q4,雷達(dá)圖“面積”逐季擴(kuò)大,營(yíng)業(yè)利潤(rùn)與凈利潤(rùn)增速高于營(yíng)收增速,反映成本管控與盈利能力提升,為管理層提供季度戰(zhàn)略調(diào)整效果的可視化反饋。全年凈利潤(rùn)率

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論