Python財務(wù)數(shù)據(jù)分析與可視化-授課教案 - 項(xiàng)目1-4 準(zhǔn)備Python開發(fā)環(huán)境-財務(wù)數(shù)據(jù)獲取與清洗_第1頁
Python財務(wù)數(shù)據(jù)分析與可視化-授課教案 - 項(xiàng)目1-4 準(zhǔn)備Python開發(fā)環(huán)境-財務(wù)數(shù)據(jù)獲取與清洗_第2頁
Python財務(wù)數(shù)據(jù)分析與可視化-授課教案 - 項(xiàng)目1-4 準(zhǔn)備Python開發(fā)環(huán)境-財務(wù)數(shù)據(jù)獲取與清洗_第3頁
Python財務(wù)數(shù)據(jù)分析與可視化-授課教案 - 項(xiàng)目1-4 準(zhǔn)備Python開發(fā)環(huán)境-財務(wù)數(shù)據(jù)獲取與清洗_第4頁
Python財務(wù)數(shù)據(jù)分析與可視化-授課教案 - 項(xiàng)目1-4 準(zhǔn)備Python開發(fā)環(huán)境-財務(wù)數(shù)據(jù)獲取與清洗_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

-110-《Pyhton財務(wù)數(shù)據(jù)分析與可視化》教案

課程基本信息課程信息課程名稱:Python財務(wù)數(shù)據(jù)分析與可視化課程性質(zhì):專業(yè)課、必修學(xué)時:總授課學(xué)時:36-64主教材:《Python財經(jīng)數(shù)據(jù)分析與可視化》人民郵電出版社教學(xué)安排章節(jié)內(nèi)容36學(xué)時64學(xué)時項(xiàng)目1準(zhǔn)備Python開發(fā)環(huán)境22項(xiàng)目2Python語言基礎(chǔ)46項(xiàng)目3學(xué)習(xí)Pandas模塊48項(xiàng)目4財務(wù)數(shù)據(jù)獲取與清洗48項(xiàng)目5財務(wù)數(shù)據(jù)處理48項(xiàng)目6財務(wù)數(shù)據(jù)可視化46項(xiàng)目7薪資核算與分析48項(xiàng)目8銷售數(shù)據(jù)多維分析48項(xiàng)目9財務(wù)指標(biāo)綜合分析48課程回顧與總結(jié)22合計3664

項(xiàng)目1準(zhǔn)備Python開發(fā)環(huán)境教學(xué)目標(biāo)1.了解Python語言的特點(diǎn)2.掌握Python的開發(fā)環(huán)境搭建3.掌握J(rèn)upyterNotebook的使用方法教學(xué)安排序號項(xiàng)目內(nèi)容1學(xué)時2學(xué)時2教學(xué)方法PPT教學(xué)、視頻演示、課堂討論、回答問題3教學(xué)內(nèi)容1.1了解Python1.1.1Python的特點(diǎn)1.1.2Python的應(yīng)用領(lǐng)域1.1.3Python的開發(fā)工具1.2安裝Anaconda1.3運(yùn)行Python1.3.1交互模式1.3.2文件模式4教學(xué)重點(diǎn)JupyterNotebook工作界面5應(yīng)用實(shí)踐安裝Anaconda6課后作業(yè)通關(guān)測試教學(xué)活動了解Python1.1.1Python的特點(diǎn)簡單開源跨平臺1.1.2Python的應(yīng)用領(lǐng)域數(shù)據(jù)采集科學(xué)計算可視化分析人工智能Web開發(fā)1.1.3Python的開發(fā)工具Python有多款開發(fā)工具,比較常用的有:IDLE、PyCharm、Anaconda、JupyterNotebook。IDLEIDLE是Python自帶的開發(fā)工具。集成了代碼編寫功能、分析功能、編譯功能、調(diào)試功能等。PyCharmPyCharm適合于專業(yè)人士進(jìn)行Python程序綜合開發(fā)使用。AnacondaAnaconda是一個集成了Python和大量第三方庫的開源Python發(fā)行版本,適用于初學(xué)者。JupyterNotebookJupyterNotebook是基于網(wǎng)頁的用于交互計算的應(yīng)用程序。支持代碼開發(fā)、文檔編寫、程序運(yùn)行和結(jié)果展示全過程。安裝Anaconda1.下載登錄Anaconda官方網(wǎng)站。下載與本機(jī)相適合的安裝程序。安裝 圖1-1“Welcome”安裝界面 圖1-2同意安裝協(xié)議 圖1-3選擇安裝模式 圖1-4高級安裝選項(xiàng)安裝過程中注意設(shè)置環(huán)境變量。1.3運(yùn)行Python1.3.1交互模式1.理解交互模式交互模式也稱會話模式,是指在PythonShell中輸入Python命令后,Python立即執(zhí)行并顯示執(zhí)行結(jié)果。啟動Python交互模式啟動Python交互模式有兩種方法。通過cmd命令啟動通過AnacondaPrompt啟動。退出Python交互模式退出Python交互模式有兩種方法。(1)在命令提示符“>>>”后輸入exit,回車。(2)直接關(guān)閉命令窗口。1.3.2文件模式1.理解文件模式文件模式是把Python代碼保存在文件中,該文件稱為Python程序。2.JupyterNotebook編輯器(1)Jupyter-HomePage窗口編輯器窗口默認(rèn)文件名代碼編輯區(qū)結(jié)果顯示菜單欄編輯模式:左邊框?yàn)榫G色默認(rèn)文件名代碼編輯區(qū)結(jié)果顯示菜單欄編輯模式:左邊框?yàn)榫G色圖1-9編輯并運(yùn)行在文件中設(shè)置標(biāo)記圖1-12在文件中設(shè)置標(biāo)記JupyterNotebook常用工具欄(5)JupyterNotebook常用快捷鍵

項(xiàng)目2Python語言基礎(chǔ)教學(xué)目標(biāo)1.理解Python的數(shù)據(jù)類型,掌握不同數(shù)據(jù)類型的轉(zhuǎn)換方法2.了解變量的概念,掌握常用運(yùn)算符的使用3.掌握三類基本程序結(jié)構(gòu)4.掌握函數(shù)的定義和調(diào)用方法教學(xué)安排序號項(xiàng)目內(nèi)容1學(xué)時4學(xué)時2教學(xué)方法PPT教學(xué)、視頻演示、課堂討論、回答問題3教學(xué)內(nèi)容2.1輸入、輸出與注釋2.1.1輸出函數(shù)print()2.1.2輸入函數(shù)input()2.1.3注釋2.2常用數(shù)據(jù)類型2.2.1數(shù)值2.2.2字符串2.2.3列表2.2.4字典2.2.5數(shù)據(jù)類型檢測與轉(zhuǎn)換2.3變量與運(yùn)算符2.3.1變量的命名2.3.2變量的賦值2.2.3運(yùn)算符2.4程序控制結(jié)構(gòu)2.4.1理解代碼塊2.4.2選擇結(jié)構(gòu)2.4.3循環(huán)結(jié)構(gòu)2.5函數(shù)2.5.1認(rèn)識函數(shù)2.5.2常用內(nèi)置函數(shù)2.5.3自定義函數(shù)2.5.4查詢函數(shù)使用說明2.6綜合實(shí)訓(xùn)4教學(xué)重點(diǎn)基本程序結(jié)構(gòu)、函數(shù)定義和調(diào)用5應(yīng)用實(shí)踐實(shí)訓(xùn)+綜合實(shí)訓(xùn)6課后作業(yè)通關(guān)測試教學(xué)活動輸入、輸出與注釋2.1.1輸出函數(shù)print()1.認(rèn)識print()函數(shù)語法:print(參數(shù)1[,參數(shù)2],...,end=’其他字符’)參數(shù):參數(shù)為數(shù)值時,將數(shù)值直接寫于括號內(nèi)即可。參數(shù)為字符串時,需要在字符串兩側(cè)使用單引號、雙引號、三單引號或三雙引號。如果字符串中已包含一種引號,那么兩側(cè)的引號要采用另外一種形式。print()函數(shù)的結(jié)束位置默認(rèn)有一個換行符,因此每個print()函數(shù)的輸出占一行。如果行尾需要輸出其他字符而非換行符,需要使用end參數(shù)來指定。print()函數(shù)應(yīng)用示例2.1.2輸入函數(shù)input()Python內(nèi)置的input()函數(shù)用于接收用戶輸入的內(nèi)容,并返回字符串類型的結(jié)果。input()函數(shù)中可以包含一些提示性的文字。1.認(rèn)識input()函數(shù)語法:[變量]=input(<提示性文字>)2.利用eval()函數(shù)轉(zhuǎn)換input()接收的結(jié)果input()函數(shù)接收的內(nèi)容是固定的字符串類型,字符串無法參與算術(shù)運(yùn)算。eval()函數(shù)可以將字符串的引號去掉,然后對引號中的表達(dá)式進(jìn)行解析和計算。2.1.3注釋為增加程序的可讀性,常常需要在程序中對某些代碼進(jìn)行說明,稱之為注釋。注釋不會被編譯,也不會被執(zhí)行。1.單行注釋單行注釋使用“#”作為注釋符,可以置于語句或表達(dá)式后面,也可以作為單獨(dú)的一行放置于代碼的上一行。前面示例中已多次使用。2.多行注釋當(dāng)注釋內(nèi)容太多,單行注釋無法顯示時,需要使用多行注釋。多行注釋使用三單引號或三雙引號標(biāo)識。2.2常用數(shù)據(jù)類型2.2.1數(shù)值Python中常見的數(shù)值類型包括整型(int)、浮點(diǎn)型(float)和布爾型(bool)。整型int整型包括正整數(shù)、負(fù)整數(shù)和0,如3、-22。浮點(diǎn)型float浮點(diǎn)型可以理解為是帶小數(shù)的數(shù)值,如12.56、-3.4567。布爾型bool布爾型只有兩個值:真(True)和假(False),注意必須要大寫首字母。2.2.2字符串字符串是由字母、數(shù)字、符號等一系列字符組成的序列。字符串需要用單引號(‘)、雙引號(“)或三引號(‘’’)括起來,且必須成對使用。1.字符串的索引字符串是字符的序列。序列中的每個值對應(yīng)一個位置編號。Python中的序號分為正向序號(從0開始遞增1)和反向序號(從-1開始遞減1)。正向: 0 123456789Python財務(wù)應(yīng)用反向:-10-9-8-7-6-5-4-3-2-1圖2-1兩種序號體系2.轉(zhuǎn)義字符反斜杠也稱轉(zhuǎn)義符。 如果字符串前有字符“r”,則表示不轉(zhuǎn)義。3.占位符(%)占位符用于標(biāo)記字符串中的指定位置,通過對占位符進(jìn)行賦值,可以改變輸出結(jié)果的格式。常用的占位符及含義如表2-2所示。表2-2常用的占位符及含義占位符含義%s任意字符%d整數(shù)占位符%f浮點(diǎn)數(shù)占位符4.字符串的常用操作方法Python中對字符串對象提供了一些常用操作方法,常用的幾種操作方法如表2-3所示。方法關(guān)鍵字含義find(子串,起始,結(jié)束)在指定的起始索引和結(jié)束索引范圍內(nèi)查找子串第1次出現(xiàn)的位置,找到返回索引值,未找到返回-1‘連接符’.join(序列)將序列中的元素用指定連接符連接起來replace(old,new)將字符串中原有的內(nèi)容old替換為新字符串newsplit(str,num)用指定符號str分割字符串,num指定分割次數(shù),num默認(rèn)為全部分割strip(char)移除字符串首尾指定字符char,char默認(rèn)為空格。lower()/upper()將字符串轉(zhuǎn)換為全部小寫/大寫表2-3字符串的常用方法2.2.3列表創(chuàng)建列表利用方括號[]直接賦值創(chuàng)建利用list()函數(shù)創(chuàng)建訪問列表列表的常用操作方法列表是可變序列,可以對列表中的元素進(jìn)行編輯。2.2.4字典字典用來表示有關(guān)聯(lián)的數(shù)據(jù)。字典滿足以下特征:字典中的元素必須包含鍵和值;如學(xué)生的學(xué)號和姓名。鍵是唯一的,不能進(jìn)行修改。學(xué)號為鍵。值可以重復(fù),可以進(jìn)行修改。姓名為值。創(chuàng)建字典字典使用花括號{}創(chuàng)建,其中包含多個鍵值對,成對的鍵和值之間用冒號分隔,多個鍵值對之間用逗號分隔。字典的常用操作方法2.2.5數(shù)據(jù)類型檢測與轉(zhuǎn)換1.檢測數(shù)據(jù)類型在Python中可以使用type()函數(shù)檢測數(shù)據(jù)類型。2.轉(zhuǎn)換數(shù)據(jù)類型不同數(shù)據(jù)類型之間可以進(jìn)行轉(zhuǎn)換。函數(shù)作用int()轉(zhuǎn)換為整數(shù)float()轉(zhuǎn)換為浮點(diǎn)數(shù)str()轉(zhuǎn)換為字符串list()轉(zhuǎn)換為列表tuple()轉(zhuǎn)換為元組dict()轉(zhuǎn)換為字典2.3變量與運(yùn)算符2.3.1變量的命名賦予變量標(biāo)識符的過程稱為命名。變量名是唯一的。變量命名注意事項(xiàng):變量名的首字符不能是數(shù)字;變量名區(qū)分大小寫;變量名不能包含空格;變量命名要避開Python關(guān)鍵詞;變量名要易于理解。2.3.2變量的賦值將數(shù)據(jù)存入變量的過程稱為變量賦值。在Python中使用“=”作為賦值運(yùn)算符。單個變量賦值語法:變量名=數(shù)據(jù)多個變量賦值語法:變量1,變量2,...,變量n=表達(dá)式1,表達(dá)式2,...,表達(dá)式n2.3.3運(yùn)算符 1.算術(shù)運(yùn)算符運(yùn)算符及其含義+(加)、-(減)、*(乘)、/(除)//(整除)**(乘方)%(取模、即取余數(shù))2.字符串運(yùn)算符運(yùn)算符及其含義+連接*重復(fù)[]索引取字符串中的某個字符[開始索引:結(jié)束索引:步長]切片取字符串中的子串,默認(rèn)步長為13.關(guān)系運(yùn)算符運(yùn)算符及其含義>大于;<小于>=大于等于;<=小于等于==等于!=不等于4.邏輯運(yùn)算符運(yùn)算符及其含義and“與”運(yùn)算兩個量均為True返回True,否則返回Falseor“或”運(yùn)算兩個量有一個為True返回True,否則返回Falsenot“非”運(yùn)算如果x為True返回False,否則返回True5.其他運(yùn)算符(1)成員運(yùn)算符in(2)身份運(yùn)算符is6.運(yùn)算優(yōu)先級2.4程序控制結(jié)構(gòu)2.4.1理解代碼塊1.代碼塊代碼塊是一組由多行代碼組成的邏輯功能單元,這個單元可以獨(dú)立運(yùn)行。2.縮進(jìn)Python程序中利用縮進(jìn)表示代碼塊,同一代碼塊的語句必須包含相同的縮進(jìn)空格數(shù)。不同的縮進(jìn)可以表明代碼塊的包含關(guān)系。3.續(xù)行符“\”可以使用續(xù)行符“\”將單行代碼分割為多行;或者將多行語句用一對圓括號括起來以表明是同一語句。4.基本程序控制結(jié)構(gòu)Python中有三種基本的程序控制結(jié)構(gòu):順序結(jié)構(gòu)、選擇結(jié)構(gòu)和循環(huán)結(jié)構(gòu)。這些結(jié)構(gòu)都只有一個入口和一個出口。2.4.2選擇結(jié)構(gòu)選擇結(jié)構(gòu)也稱為分支結(jié)構(gòu),它是根據(jù)條件判斷結(jié)果選擇不同的執(zhí)行路徑。1.單分支結(jié)構(gòu)ifIf條件:代碼塊A #滿足條件執(zhí)行代碼塊A【示例】登錄企業(yè)會計信息系統(tǒng)時,需要輸入正確的用戶密碼,假設(shè)某用戶密碼為“213465”,如果用戶輸入的口令是“123456”,則提示“口令不正確!”?!灸M上機(jī)】2.雙分支結(jié)構(gòu)if…else……if條件:代碼塊A#滿足條件執(zhí)行代碼塊Aelse:代碼塊B #不滿足條件執(zhí)行代碼塊B【示例】登錄企業(yè)會計信息系統(tǒng)時,需要輸入正確的用戶密碼,假設(shè)某用戶密碼為“213465”,如果用戶輸入的口令是“213465”,則提示“歡迎登錄!”,否則,提示“口令不正確!”。多分支結(jié)構(gòu)if……elif……elseif條件1:代碼塊A#如果滿足條件1,則執(zhí)行代碼塊Aelif條件2:代碼塊B#如果滿足條件2,則執(zhí)行代碼塊Belif條件3:代碼塊C#如果滿足條件3,則執(zhí)行代碼塊Celse:代碼塊N #不滿足以上條件則執(zhí)行代碼塊N【示例】某公司固定資產(chǎn)折舊采用平均年限法計提。每種固定資產(chǎn)分類預(yù)計使用年限、殘值率各不相同,如表2-12所示。編程計算固定資產(chǎn)月折舊額。固定資產(chǎn)月折舊額=固定資產(chǎn)原值*(1-殘值率)/(預(yù)計使用年限*12)表2-12固定資產(chǎn)相關(guān)信息固定資產(chǎn)類別預(yù)計使用年限殘值率%房屋及建筑物505機(jī)器設(shè)備105電子設(shè)備53其他633.循環(huán)結(jié)構(gòu)循環(huán)結(jié)構(gòu)中也存在條件判斷,如果條件成立則重復(fù)執(zhí)行某代碼塊,執(zhí)行完成再次對條件進(jìn)行判斷,滿足條件繼續(xù)循環(huán)執(zhí)行,不滿足條件時退出循環(huán)。for…in遍歷循環(huán)for循環(huán)也稱遍歷循環(huán),是一種有限次數(shù)的循環(huán)。語法:for循環(huán)變量in列表:代碼塊【示例】將“Python財務(wù)應(yīng)用”逐個字符輸出至同一行,并用空格分隔?!灸M上機(jī)】while條件循環(huán)語法:while條件:代碼塊當(dāng)程序遇到while時,若滿足條件,則執(zhí)行代碼塊,執(zhí)行完成后再次判斷是否滿足條件,直到不滿足條件時才退出循環(huán)?!臼纠坑脀hile換選計算1~100之內(nèi)奇數(shù)和。終止循環(huán)breakBreak可用在while循環(huán)和for循環(huán)中,用來終止當(dāng)前所在層的循環(huán)。【示例】有一張足夠大的紙,厚度為0.1mm,將其對折多少次之后,其厚度將超過珠峰的高度(假設(shè)珠峰高度為8848.86m)。跳出當(dāng)前循環(huán)continuecontinue同樣可用在while循環(huán)和for循環(huán)中,用來跳過當(dāng)前循環(huán)的剩余語句,繼續(xù)執(zhí)行下一輪循環(huán)?!臼纠枯敵?0以內(nèi)能被3整除的數(shù)字。2.5函數(shù)2.5.1認(rèn)識函數(shù)1.函數(shù)函數(shù)是為了實(shí)現(xiàn)某個特定功能而組合在一起的代碼集合??梢酝ㄟ^函數(shù)名來調(diào)用函數(shù)。2.函數(shù)分類Python中的函數(shù)分為四類:內(nèi)置函數(shù)、標(biāo)準(zhǔn)庫函數(shù)、第三方庫函數(shù)和用戶自定義函數(shù)。2.5.2常用內(nèi)置函數(shù)內(nèi)置函數(shù)是無需安裝及導(dǎo)入,可以直接使用的函數(shù)。Python中提供了大量內(nèi)置函數(shù),例如前面學(xué)習(xí)的輸入輸出函數(shù)print()、input()、數(shù)據(jù)類型轉(zhuǎn)換函數(shù)int()、float()等。2.5.3自定義函數(shù)盡管Python提供了強(qiáng)大的內(nèi)置函數(shù),但很多情況下我們?nèi)匀恍枰远x函數(shù)。函數(shù)定義語法:def<函數(shù)名>([參數(shù)列表]):<函數(shù)體>return返回值【示例】個人所得稅稅率如表2-14所示表2-14個人所得稅稅率表級別全年應(yīng)納稅所得額稅率%速算扣除數(shù)1不超過36000元302超過36000元不超過144000元的部分1025203超過144000元不超過300000元的部分20169204超過300000元不超過420000元的部分25319205超過420000元不超過660000元的部分30529206超過660000元不超過960000元的部分35859207超過960000元的部分45181920利用自定義函數(shù)計算個人所得稅。調(diào)用函數(shù)【示例】假設(shè)小王全年應(yīng)納稅所得額為46萬,調(diào)用tax()函數(shù)計算個人所得稅。2.5.4查詢函數(shù)使用說明利用快捷鍵調(diào)用函數(shù)簡要說明如果平時使用JupyterNotebook運(yùn)行Python代碼,可以使用<Shift>+<Tab>快捷鍵查看函數(shù)的簡要說明。【示例】使用<Shift>+<Tab>快捷鍵查看sum()函數(shù)的簡要說明。在代碼框中輸入“sum”,按<Shift>+<Tab>快捷鍵,得到sum()簡要說明。利用help查詢?nèi)绻覀兿肓私鈙um函數(shù)的用法,只需要輸入“help(sum)”,系統(tǒng)就會給出sum函數(shù)的語法及功能說明。2.6綜合實(shí)訓(xùn)【實(shí)訓(xùn)任務(wù)】創(chuàng)建一個程序,請用戶輸入出生年月和原退休年齡,根據(jù)我國延遲退休政策計算需要延遲的月數(shù)、退休年齡和退休時間,并打印輸出。項(xiàng)目3學(xué)習(xí)Pandas模塊教學(xué)目標(biāo)1.熟悉常用內(nèi)置模塊和第三方模塊,掌握模塊安裝與導(dǎo)入方法2.掌握Pandas的兩種數(shù)據(jù)結(jié)構(gòu):Series和DataFrame3.熟悉DataFrame的基本功能,掌握DataFrame的基本操作4.掌握Pandas讀取、上載Excel文件、掌握數(shù)據(jù)保存方法教學(xué)安排序號項(xiàng)目內(nèi)容1學(xué)時6學(xué)時2教學(xué)方法PPT教學(xué)、視頻演示、課堂討論、回答問題3教學(xué)內(nèi)容3.1了解模塊3.1.1認(rèn)識模塊(Module)3.1.2模塊的安裝和導(dǎo)入3.2Series數(shù)據(jù)結(jié)構(gòu)3.2.1認(rèn)識Series3.2.2創(chuàng)建Series3.2.3訪問Series3.3DataFrame數(shù)據(jù)結(jié)構(gòu)3.3.1認(rèn)識DataFrame3.3.2創(chuàng)建DataFrame3.3.3訪問DataFrame3.3.4編輯DataFrame3.4Excel文件讀寫3.4.1上載數(shù)據(jù)文件3.4.2從Excel文件中獲取數(shù)據(jù)3.4.3將數(shù)據(jù)保存為Excel文件3.5綜合實(shí)訓(xùn)4教學(xué)重點(diǎn)DataFrame數(shù)據(jù)結(jié)構(gòu)、Excel文件讀寫5應(yīng)用實(shí)踐實(shí)訓(xùn)+綜合實(shí)訓(xùn)6課后作業(yè)通關(guān)測試教學(xué)活動3.1了解模塊3.1.1認(rèn)識模塊(Module)1.什么是模塊模塊也稱為庫。每個模塊都能實(shí)現(xiàn)某個方面特定的功能。Python模塊就是一個.py文件,其中可以包含多個函數(shù),還可以包含類、語句等。2.模塊的分類(1)內(nèi)置模塊內(nèi)置模塊是Python自帶的模塊,可以直接導(dǎo)入并使用。(2)自定義模塊自定義模塊是用戶自己編寫的模塊,以方便在編寫其他程序時調(diào)用,也可以上傳到第三方庫,供他人調(diào)用。(3)第三方模塊第三方模塊是Python的開源模塊,擁有豐富的第三方庫正是Python的亮點(diǎn)。大量的優(yōu)秀程序員開發(fā)出各類功能,愿意分享給他人,因此上傳到python社區(qū),可以免費(fèi)下載使用。3.1.2模塊的安裝和導(dǎo)入1.模塊的安裝第三方模塊需要先安裝再導(dǎo)入。在交互模式下安裝模塊pipinstallpandas(2)在Python編輯器JupyterNotebook中安裝模塊在JupyterNotebook中也可以直接安裝模塊,仍以安裝pandas為例。2.模塊的導(dǎo)入除了Python的內(nèi)置模塊可以直接使用外,使用其他模塊前,需要先導(dǎo)入模塊。導(dǎo)入模塊后,才可以使用其中的函數(shù)、變量等。(1)使用import語句導(dǎo)入模塊語法:import模塊名但通常在導(dǎo)入模塊時為模塊指定別名。如:import模塊名as別名(2)使用from語句導(dǎo)入模塊如果只需要使用模塊中的少量內(nèi)容,可以使用from語句指定要從模塊中導(dǎo)入的子模塊或函數(shù)。語法:from模塊名import函數(shù)名from模塊名import函數(shù)名as別名提示:import和from…import的區(qū)別在于:如果使用import導(dǎo)入模塊,調(diào)用模塊中的函數(shù)時需要“模塊名.”作為前綴;而使用from…import導(dǎo)入模塊,之后可以直接調(diào)用模塊中的函數(shù)。(3)查看已安裝的第三方模塊可以使用“l(fā)ist”命令列示當(dāng)前系統(tǒng)中已安裝的第三方模塊。3.1.3認(rèn)識pandas模塊pandas模塊的主要功能pandas是Python的核心數(shù)據(jù)分析支持庫。其主要功能是:數(shù)據(jù)獲取和數(shù)據(jù)處理。2.pandas模塊的導(dǎo)入導(dǎo)入pandas模塊:importpandasaspd3.pandas的兩個數(shù)據(jù)結(jié)構(gòu)pandas提供了兩個主要的數(shù)據(jù)結(jié)構(gòu):Series和DataFrame。Series是一維數(shù)組結(jié)構(gòu),DataFrame是二維數(shù)組結(jié)構(gòu)。財務(wù)數(shù)據(jù)處理經(jīng)常要使用DataFrame數(shù)據(jù)結(jié)構(gòu)。3.2Series數(shù)據(jù)結(jié)構(gòu)3.2.1認(rèn)識SeriesSeries是帶索引的一維數(shù)組(數(shù)組是相同數(shù)據(jù)類型的元素按一定順序排列的組合),由一組數(shù)據(jù)(data)以及與這組數(shù)據(jù)相關(guān)的索引(index)組成。3.2.2創(chuàng)建Seriespd.Series(data,index=[])通過列表創(chuàng)建Series【示例】通過字典創(chuàng)建Series【示例】3.2.3訪問Series通過索引訪問Series【示例】通過切片訪問Series【示例】3.3DataFrame數(shù)據(jù)結(jié)構(gòu)3.3.1認(rèn)識DataFrameDataFrame是帶標(biāo)簽的、大小可變的二維數(shù)組。索引可以是位置索引,也可以是標(biāo)簽索引,DataFrame中表現(xiàn)為loc(標(biāo)簽索引)和iloc(數(shù)字索引、位置索引)兩個屬性。3.3.2創(chuàng)建DataFramepd.DataFrame(data,index=[],columns=[])以列表方式創(chuàng)建DataFrame【示例】以字典方式創(chuàng)建DataFrame【示例】3.3.3訪問DataFrame查看元素的值、類型、行名和列名【示例】查詢行數(shù)據(jù)查詢單行數(shù)據(jù)【示例】查看不連續(xù)的多行【示例】查看連續(xù)的多行【示例】查詢列數(shù)據(jù)查詢列數(shù)據(jù)可以利用列名查詢、利用索引查詢和利用切片查詢?!臼纠坎樵冎付〝?shù)據(jù)【示例】查詢符合條件的數(shù)據(jù)設(shè)置單一查詢條件【示例】設(shè)置復(fù)合查詢條件【示例】表格轉(zhuǎn)置【示例】3.3.4編輯DataFrame增加行數(shù)據(jù)(1)增加單行數(shù)據(jù)【示例】增加多行數(shù)據(jù)【示例】增加列數(shù)據(jù)在數(shù)據(jù)集末尾增加列【示例】在指定位置插入列【示例】修改數(shù)據(jù)利用loc屬性或iloc屬性修改某處數(shù)據(jù)【示例】修改列標(biāo)題【示例】刪除數(shù)據(jù)可以通過函數(shù)drop和del刪除數(shù)據(jù)?!臼纠?.4Excel文件讀寫3.4.1上載數(shù)據(jù)文件將數(shù)據(jù)文件上載到JupyterNotebook②③②③在數(shù)據(jù)文件所在的文件夾中打開JupyterNotebook【示例】3.4.2從Excel文件中獲取數(shù)據(jù)read_excel()函數(shù)pd.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,usecols=None,converters=None)讀取整個Excel文件【示例】讀取Excel文件中指定的工作表【示例】讀取工作表中指定的行或列(1)讀取工作表中指定的行【示例】(2)讀取工作表中指定的列【示例】Pandas中提供to_excel()函數(shù),用于將DataFrame數(shù)據(jù)寫入Excel文件。3.4.3將數(shù)據(jù)保存為Excel文件1.認(rèn)識to_excel()函數(shù)df.to_excel(io,sheet_name,columns=None,index=True)2.寫入單個工作表(1)寫入全部數(shù)據(jù)【示例】(2)寫入部分?jǐn)?shù)據(jù)【示例】3.寫入多個工作表withpd.ExcelWriter(io,mode='a',engine='openpyxl')aswriter:df.to_excel(writer,sheet_name,index=False)【示例】3.5綜合實(shí)訓(xùn)【實(shí)訓(xùn)任務(wù)】自定義函數(shù)。函數(shù)有3個輸入?yún)?shù):Excel文件名、工作表名和列標(biāo)題;輸出為DataFrame,其中保存指定文檔中相應(yīng)工作表的相關(guān)列數(shù)據(jù)。調(diào)用函數(shù)分別讀取比亞迪公司1月~3月的產(chǎn)銷快報中名稱為“銷量”的工作表,選取其中的“項(xiàng)目類別”和“本月”兩列。將列名“本月”分別改為“1月銷量”、“2月銷量”和“3月銷量”,合并到一個DataFrame中。計算第一季度總銷量和平均銷量并保存到DataFrame最右側(cè)列。項(xiàng)目4財務(wù)數(shù)據(jù)獲取與清洗教學(xué)目標(biāo)1.了解財務(wù)大數(shù)據(jù)的來源2.掌握從網(wǎng)絡(luò)爬取財務(wù)數(shù)據(jù)的方法3.掌握通過財務(wù)數(shù)據(jù)接口TuShare獲取財務(wù)數(shù)據(jù)的方法4.掌握缺失值、重復(fù)值、異常值的檢測和處理方法教學(xué)安排序號項(xiàng)目內(nèi)容1學(xué)時4學(xué)時~6學(xué)時2教學(xué)方法PPT教學(xué)、視頻演示、課堂討論、回答問題3教學(xué)內(nèi)容4.1認(rèn)知財務(wù)大數(shù)據(jù)4.1.1財務(wù)數(shù)據(jù)與財務(wù)大數(shù)據(jù)4.1.2財務(wù)大數(shù)據(jù)來源4.2從文件中獲取財務(wù)數(shù)據(jù)4.2.1從PDF文件中獲取財務(wù)數(shù)據(jù)4.2.2從網(wǎng)頁上獲取財務(wù)數(shù)據(jù)4.3通過數(shù)據(jù)接口獲取數(shù)據(jù)4.3.1認(rèn)識數(shù)據(jù)接口4.3.2利用tushare數(shù)據(jù)接口采集數(shù)據(jù)4.4財務(wù)數(shù)據(jù)清洗4.4.1缺失值處理4.4.2重復(fù)值處理4.4.3異常值處理4.5綜合實(shí)訓(xùn)4教學(xué)重點(diǎn)通過數(shù)據(jù)接口獲取數(shù)據(jù)、數(shù)據(jù)清洗5應(yīng)用實(shí)踐實(shí)訓(xùn)+綜合實(shí)訓(xùn)6課后作業(yè)通關(guān)測試教學(xué)活動4.1認(rèn)識財務(wù)大數(shù)據(jù)4.1.1財務(wù)數(shù)據(jù)與財務(wù)大數(shù)據(jù) 1.財務(wù)數(shù)據(jù)(1)財務(wù)賬簿數(shù)據(jù)及報表數(shù)據(jù)(2)企業(yè)的各項(xiàng)指標(biāo)分析數(shù)據(jù)2.財務(wù)大數(shù)據(jù)財務(wù)大數(shù)據(jù)是利用大數(shù)據(jù)技術(shù),不僅可以從自身企業(yè)管理信息系統(tǒng)中獲取企業(yè)經(jīng)營數(shù)據(jù),還可以從各種數(shù)據(jù)庫、政府網(wǎng)站、上下游合作伙伴、Web上獲取外部數(shù)據(jù),形成的海量數(shù)據(jù)集。4.1.2財務(wù)大數(shù)據(jù)來源政府機(jī)構(gòu)官網(wǎng):國家統(tǒng)計局、中國人民銀行、財政部、國家稅務(wù)總局;證券交易所官網(wǎng):上交、深交、北交財經(jīng)網(wǎng)站:巨潮資訊、新浪財經(jīng)、網(wǎng)易財經(jīng)商業(yè)數(shù)據(jù)庫:國泰安數(shù)據(jù)庫CSMRA、銳思數(shù)據(jù)庫RESSET、萬得數(shù)據(jù)庫wind數(shù)據(jù)服務(wù)公司:Tushare、證券寶、Akshare4.2從文件中獲取財務(wù)數(shù)據(jù)4.2.1從PDF文件中獲取數(shù)據(jù)1.認(rèn)識PDF文件PDF是除Word、Excel外最常用的一種文件類型,財政部發(fā)布的會計準(zhǔn)則、上海證券交易所披露的上市公司定期報告、發(fā)行上市公告、電子版期刊論文等都是PDF文件格式。 2.PDF解釋器pdfplumer在交互模式下安裝pdfplumer:pipinstallpdfplumber提取PDF文件中的表格數(shù)據(jù)【示例】4.2.2從網(wǎng)頁上獲取財務(wù)數(shù)據(jù)1.從HTML文件中獲取數(shù)據(jù)HTML(HyperTextMarkupLanguage超文本標(biāo)記語言)是用來制作網(wǎng)頁的一門語言。從網(wǎng)頁上爬取數(shù)據(jù)就是在Python中導(dǎo)入HTML文件。pd.read_html(io,header=0,encoding)2.爬取上市公司財務(wù)報表數(shù)據(jù)下面我們從新浪財經(jīng)網(wǎng)站上爬取瀘州老窖(股票代碼:000568)2023年利潤表的數(shù)據(jù)。確定目標(biāo)網(wǎng)站(2)編寫python程序【示例】(3)提取數(shù)據(jù)【示例】(4)保存數(shù)據(jù)【示例】4.3通過數(shù)據(jù)接口獲取數(shù)據(jù)4.3.1認(rèn)識數(shù)據(jù)接口1.什么是數(shù)據(jù)接口數(shù)據(jù)接口指獲取數(shù)據(jù)的規(guī)范和方法,它是由數(shù)據(jù)擁有者定義,目的是方便用戶順利地采集數(shù)據(jù)。2.常用的財務(wù)數(shù)據(jù)接口3.tushare數(shù)據(jù)接口的安裝及導(dǎo)入(1)安裝并導(dǎo)入tushare數(shù)據(jù)接口!pipinstalltushareimporttushareasts(2)注冊tushare社區(qū)只有社區(qū)用戶才能使用tushare數(shù)據(jù)接口。因此安裝完成后需要注冊tushare社區(qū)。(3)獲取TokenToken可以理解為是個人在tushare社區(qū)的身份證明。tushare社區(qū)通過Token識別用戶,并根據(jù)用戶積分賦予不同的調(diào)取數(shù)據(jù)的權(quán)限?!臼纠?.3.2利用tushare數(shù)據(jù)接口采集數(shù)據(jù)1.了解

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論