Python財(cái)務(wù)數(shù)據(jù)分析與可視化 課件 項(xiàng)目1-4 準(zhǔn)備Python開發(fā)環(huán)境- 財(cái)務(wù)數(shù)據(jù)獲取與清洗_第1頁
Python財(cái)務(wù)數(shù)據(jù)分析與可視化 課件 項(xiàng)目1-4 準(zhǔn)備Python開發(fā)環(huán)境- 財(cái)務(wù)數(shù)據(jù)獲取與清洗_第2頁
Python財(cái)務(wù)數(shù)據(jù)分析與可視化 課件 項(xiàng)目1-4 準(zhǔn)備Python開發(fā)環(huán)境- 財(cái)務(wù)數(shù)據(jù)獲取與清洗_第3頁
Python財(cái)務(wù)數(shù)據(jù)分析與可視化 課件 項(xiàng)目1-4 準(zhǔn)備Python開發(fā)環(huán)境- 財(cái)務(wù)數(shù)據(jù)獲取與清洗_第4頁
Python財(cái)務(wù)數(shù)據(jù)分析與可視化 課件 項(xiàng)目1-4 準(zhǔn)備Python開發(fā)環(huán)境- 財(cái)務(wù)數(shù)據(jù)獲取與清洗_第5頁
已閱讀5頁,還剩136頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

項(xiàng)目1準(zhǔn)備Python開發(fā)環(huán)境目錄為什么選擇學(xué)習(xí)Python搭建Python開發(fā)環(huán)境運(yùn)行Python工具方法理論P(yáng)ython緣起是什么?面向?qū)ο蟮慕忉屝统绦蛟O(shè)計(jì)語言由荷蘭人GuidovonRossum于1989年的圣誕節(jié)發(fā)明第一個(gè)公開發(fā)行版發(fā)布于1991年P(guān)ython3于2008年發(fā)布,不向下兼容Python特點(diǎn)語言簡單易理解開源免費(fèi)易獲得跨多平臺(tái)易部署資源共享易擴(kuò)展Python應(yīng)用領(lǐng)域數(shù)據(jù)采集A科學(xué)計(jì)算B可視化分析C人工智能DWeb開發(fā)EPython開發(fā)工具Python安裝自帶的IDLE(IntegratedDevelopmentEnvironment)集成開發(fā)環(huán)境PyCharm適合于專業(yè)人士進(jìn)行Python程序綜合開發(fā)使用Anaconda集成了Python和大量第三方庫,適于初學(xué)者JupyterNotebook基于網(wǎng)頁的用于交互計(jì)算的應(yīng)用程序。支持代碼開發(fā)、文檔編寫、程序運(yùn)行和結(jié)果展示全過程。Anaconda的下載與安裝登錄Anaconda官方網(wǎng)站默認(rèn)下載64位Windows操作系統(tǒng)的安裝程序安裝時(shí)將Anaconda的路徑加入到Path環(huán)境變量中運(yùn)行Pythton兩種模式交互模式交互模式也稱會(huì)話模式,是指在PythonShell中輸入Python命令后,Python立即執(zhí)行并顯示執(zhí)行結(jié)果文件模式交互模式下的Python代碼不易編輯,無法保存。文件模式是把Python代碼保存在文件中,該文件稱為Python程序。啟動(dòng)交互模式通過cmd命令啟動(dòng)按“<Windows>+R”,打開“運(yùn)行”對(duì)話框。輸入“cmd”,打開“cmd”命令窗口。輸入“python”,顯示Python版本信息,并出現(xiàn)Python交互模式的命令提示符“>>>”運(yùn)行Python-交互模式啟動(dòng)交互模式通過AnacondaPrompt啟動(dòng)并輸出“HelloPython”執(zhí)行“開始”|“所有應(yīng)用”|“Anaconda3”|“AnacondaPrompt”命令。輸入“python”,顯示Python版本信息,并出現(xiàn)Python交互模式的命令提示符“>>>”在命令提示符“>>>”后輸入print('HelloPython')運(yùn)行Python-交互模式二種方法在命令提示符“>>>”后輸入exit(),回車。直接關(guān)閉命令窗口。退出Python-交互模式文件模式-JupyterNotebookJupyterNotebookAnaconda自帶了JupyterNotebook編輯器將程序代碼、說明文本、數(shù)學(xué)公式、可視化圖表等內(nèi)容全部顯示在一個(gè)文檔中文件模式-JupyterNotebookJupyterHomePage窗口文件模式-JupyterNotebook編輯文件并運(yùn)行文件模式-JupyterNotebook在文件中設(shè)置標(biāo)記文件模式-JupyterNotebook保存文件“.py”和“.ipynp”文件在JupyterNotebook下的File—>Downloadas—>python(.py)可以將.ipynb轉(zhuǎn)化為.py文件。文件模式-JupyterNotebook常用工具欄文件模式-JupyterNotebook常用快捷鍵

項(xiàng)目2Python語言基礎(chǔ)目錄輸入、輸出與注釋常用數(shù)據(jù)類型變量與運(yùn)算符程序控制結(jié)構(gòu)函數(shù)工具方法理論輸入、輸出與注釋輸出函數(shù)print()print(輸出項(xiàng)1[,輸出項(xiàng)2],...,end=’其他字符’)end參數(shù):調(diào)整結(jié)束位置內(nèi)容輸入函數(shù)input()[變量]=input(<提示性文字>)eval()函數(shù):轉(zhuǎn)換input()接收的字符類型輸入、輸出與注釋輸入函數(shù)input()input()函數(shù)接收的是固定的字符串類型,字符串無法參與算術(shù)運(yùn)算eval()函數(shù)可以將字符串的引號(hào)去掉,然后對(duì)引號(hào)中的表達(dá)式進(jìn)行解析和計(jì)算輸入、輸出與注釋注釋在程序中對(duì)某些代碼進(jìn)行說明,稱之為注釋。注釋不會(huì)被編譯,也不會(huì)被執(zhí)行。單行注釋使用“#”作為注釋符,可以置于語句或表達(dá)式后面,也可以作為單獨(dú)的一行放置于代碼的上一行。多行注釋多行注釋使用三單引號(hào)或三雙引號(hào)標(biāo)識(shí)。輸入、輸出與注釋常用數(shù)據(jù)類型數(shù)據(jù)類型基本數(shù)據(jù)類型數(shù)值整型浮點(diǎn)型布爾型字符串高級(jí)數(shù)據(jù)類型列表字典元組集合基本數(shù)據(jù)類型-數(shù)值數(shù)值:數(shù)值是由0-9、小數(shù)點(diǎn)、正負(fù)號(hào)、e組成。整型int正整數(shù)、負(fù)整數(shù)和0浮點(diǎn)型float浮點(diǎn)型可以理解為是帶小數(shù)的數(shù)值布爾型bool布爾型只有兩個(gè)值:真(True)和假(False),必須要大寫首字母基本數(shù)據(jù)類型-字符串字符串字符串是由字母、數(shù)字、符號(hào)等一系列字符組成的序列。字符串需要用一對(duì)單引號(hào)(‘)、雙引號(hào)(“)或三引號(hào)(’’’)括起來。基本數(shù)據(jù)類型-字符串字符串的索引字符串是字符的序列,每個(gè)值對(duì)應(yīng)一個(gè)位置編號(hào)。Python中的序號(hào)分為正向序號(hào)(從0開始遞增1)和反向序號(hào)(從-1開始遞減1)基本數(shù)據(jù)類型-字符串轉(zhuǎn)義字符反斜杠也稱轉(zhuǎn)義符。表示一個(gè)轉(zhuǎn)義序列的開始。常用轉(zhuǎn)義符:基本數(shù)據(jù)類型-字符串轉(zhuǎn)義字符反斜杠也稱轉(zhuǎn)義符。表示一個(gè)轉(zhuǎn)義序列的開始。如果字符串前有字符“r”,則表示不轉(zhuǎn)義。基本數(shù)據(jù)類型-字符串格式化字符串占位符%:占位符用于標(biāo)記字符串中的指定位置。占位符含義%s任意字符%d整數(shù)占位符%f浮點(diǎn)數(shù)占位符基本數(shù)據(jù)類型-字符串格式化字符串占位符%:占位符用于標(biāo)記字符串中的指定位置。基本數(shù)據(jù)類型-字符串字符串的常用操作方法關(guān)鍵字含義find(子串,起始,結(jié)束)在指定的起始索引和結(jié)束索引范圍內(nèi)查找子串第1次出現(xiàn)的位置,找到返回索引值,未找到返回-1‘連接符’.join(序列)將序列中的元素用指定連接符連接起來replace(old,new)將字符串中原有的內(nèi)容old替換為新字符串newsplit(str,num)用指定符號(hào)str分割字符串,num指定分割次數(shù),num默認(rèn)為全部分割strip(char)移除字符串首尾指定字符char,char默認(rèn)為空格。lower()/upper()將字符串轉(zhuǎn)換為全部小寫/大寫基本數(shù)據(jù)類型-字符串字符串的常用操作高級(jí)數(shù)據(jù)類型-列表列表列表相當(dāng)于一個(gè)存儲(chǔ)數(shù)據(jù)的容器,它可以將多個(gè)元素存儲(chǔ)為一個(gè)數(shù)據(jù),且這些元素的數(shù)據(jù)類型可以不同。創(chuàng)建列表列表使用方括號(hào)[]創(chuàng)建,列表中的元素按順序排列,并以英文逗號(hào)分隔。高級(jí)數(shù)據(jù)類型-列表訪問列表列表中的每個(gè)元素也有索引??梢岳盟饕蚯衅L問列表。高級(jí)數(shù)據(jù)類型-列表對(duì)列表的操作操作Python命令及含義(index:索引位置,obj:元素)說明修改元素list[index]=obj將列表中索引為index的元素替換為新元素obj添加元素list.append(obj)在列表的末尾追加一個(gè)新元素obj插入元素list.insert(index,obj)在指定索引位置插入新元素obj擴(kuò)展列表list.extend(seq)在列表的最后一次性添加多個(gè)元素刪除元素list.pop(index)刪除指定索引位置的元素,如果不標(biāo)注索引位,默認(rèn)刪除最后一個(gè)元素刪除匹配項(xiàng)list.remove(obj)刪除列表中第一個(gè)匹配項(xiàng)反向排列l(wèi)ist.reverse()將列表中的元素逆置排序list.sort(key=none,reverse=False)對(duì)列表中的元素按指定關(guān)鍵字進(jìn)行升序或降序排列高級(jí)數(shù)據(jù)類型-列表對(duì)列表的操作高級(jí)數(shù)據(jù)類型-字典字典字典通過鍵和值將一組數(shù)據(jù)關(guān)聯(lián)在一起鍵是唯一的,值可以重復(fù)創(chuàng)建字典字典使用花括號(hào){}創(chuàng)建,其中包含多個(gè)鍵值對(duì)成對(duì)的鍵和值之間用冒號(hào)分隔,多個(gè)鍵值對(duì)之間用逗號(hào)分隔高級(jí)數(shù)據(jù)類型-字典對(duì)字典的操作操作Python命令及含義說明訪問值dic[key]通過給定的鍵key訪問對(duì)應(yīng)的值修改值dic[key]=value將鍵key對(duì)應(yīng)的值修改為value添加新的鍵值對(duì)dic[key]=value在字典最后添加鍵值對(duì)(字典中原來必須沒有key鍵)刪除鍵值對(duì)deldic[key]刪除給定鍵key對(duì)應(yīng)的鍵值對(duì)刪除字典deldic

清空字典dic.clear()刪除字典中所有的元素,成為空字典以列表形式返回所有鍵dic.keys()

以列表形式返回所有值dic.values()返回所有鍵值對(duì)dic.items()高級(jí)數(shù)據(jù)類型-字典對(duì)字典的操作數(shù)據(jù)類型的檢測與轉(zhuǎn)換檢測數(shù)據(jù)類型-type()數(shù)據(jù)類型的檢測與轉(zhuǎn)換轉(zhuǎn)換數(shù)據(jù)類型函數(shù)作用int()轉(zhuǎn)換為整數(shù)float()轉(zhuǎn)換為浮點(diǎn)數(shù)str()轉(zhuǎn)換為字符串list()轉(zhuǎn)換為列表tuple()轉(zhuǎn)換為元組dict()轉(zhuǎn)換為字典變量與運(yùn)算符變量的命名賦予變量標(biāo)識(shí)符的過程稱為命名。變量名是唯一的。變量名可以包含字母、數(shù)字、下劃線、漢字等,變量名沒有長度限制注意事項(xiàng)變量名的首字符不能是數(shù)字;變量名區(qū)分大小寫;變量名不能包含空格;變量命名要避開Python關(guān)鍵詞;變量名要易于理解。變量與運(yùn)算符變量的賦值將數(shù)據(jù)存入變量的過程稱為變量賦值。在Python中使用“=”作為賦值運(yùn)算符為單個(gè)變量賦值變量名=數(shù)據(jù)變量與運(yùn)算符為多個(gè)變量賦值變量1,變量2,...,變量n=表達(dá)式1,表達(dá)式2,...,表達(dá)式n變量與運(yùn)算符算術(shù)運(yùn)算符運(yùn)算符及其含義運(yùn)算示例+(加)、-(減)、*(乘)、/(除)

//(整除)17//3=5**(乘方)2**3=8%(取模、即取余數(shù))17%3=2變量與運(yùn)算符字符串運(yùn)算符運(yùn)算符及其含義運(yùn)算示例+連接str1=’happy’str2=’day’str1+str2結(jié)果:‘happyday’*重復(fù)str1*2結(jié)果:‘happyhappy’[]索引取字符串中的某個(gè)字符str1[1]結(jié)果:’a’str1[-2]結(jié)果:’p’[開始索引:結(jié)束索引:步長]切片取字符串中的子串,默認(rèn)步長為1str1[0:4]結(jié)果:’happ’str1[-5:-3]結(jié)果:’ha’str1[0:5:2]結(jié)果:‘hpy’變量與運(yùn)算符字符串運(yùn)算變量與運(yùn)算符關(guān)系運(yùn)算符(比較運(yùn)算)運(yùn)算符及其含義運(yùn)算示例>大于;<小于1>2>=大于等于;<=小于等于‘a(chǎn)’>=’b’結(jié)果False==等于‘a(chǎn)’==’A’結(jié)果False!=不等于‘a(chǎn)’!=A’結(jié)果True變量與運(yùn)算符邏輯運(yùn)算符邏輯運(yùn)算符及其含義運(yùn)算示例(兩個(gè)元素均為布爾值)運(yùn)算示例(布爾值與整數(shù)運(yùn)算)and“與”運(yùn)算若x為False,則xandy返回False,否則返回y的值TrueandTrue結(jié)果TrueFalseandTrue結(jié)果FalseTrueand8結(jié)果8Falseand8結(jié)果Falseor“或”運(yùn)算若x為非0,則xory返回x的值,否則返回y的值FalseorTrue結(jié)果TrueFalseorFalse結(jié)果FalseTrueor8結(jié)果TrueFalseor8結(jié)果8not“非”運(yùn)算如果x為True返回False,否則返回TrueNotTrue結(jié)果Falsenot0結(jié)果Truenot8結(jié)果False變量與運(yùn)算符其他運(yùn)算符成員運(yùn)算符in身份運(yùn)算符is基本程序結(jié)構(gòu)理解代碼塊代碼塊是一組由多行代碼組成的邏輯功能單元,這個(gè)單元可以獨(dú)立運(yùn)行。Python程序中利用縮進(jìn)表示代碼塊,同一代碼塊的語句必須包含相同的縮進(jìn)空格數(shù)。不同的縮進(jìn)可以表明代碼塊的包含關(guān)系。縮進(jìn)的快捷鍵是<Tab>鍵。如果要減少縮進(jìn)量,可以利用<Shift>+<Tab>鍵撤銷縮進(jìn)?;境绦蚩刂平Y(jié)構(gòu)三種基本程序控制結(jié)構(gòu)基本程序控制結(jié)構(gòu)選擇結(jié)構(gòu)(分支結(jié)構(gòu))單分支結(jié)構(gòu)If條件:代碼塊A #滿足條件執(zhí)行代碼塊A示例基本程序控制結(jié)構(gòu)選擇結(jié)構(gòu)(分支結(jié)構(gòu))雙分支結(jié)構(gòu)if條件:代碼塊A#滿足條件執(zhí)行代碼塊Aelse:代碼塊B

#不滿足條件執(zhí)行代碼塊B示例基本程序控制結(jié)構(gòu)選擇結(jié)構(gòu)(分支結(jié)構(gòu))多分支結(jié)構(gòu)if條件1:代碼塊A#如果滿足條件1,則執(zhí)行代碼塊Aelif條件2:代碼塊B#如果滿足條件2,則執(zhí)行代碼塊Belif條件3:代碼塊C#如果滿足條件3,則執(zhí)行代碼塊Celse:代碼塊N

#不滿足以上條件則執(zhí)行代碼塊N示例基本程序控制結(jié)構(gòu)選擇結(jié)構(gòu)(分支結(jié)構(gòu))固定資產(chǎn)類別預(yù)計(jì)使用年限殘值率%房屋及建筑物505機(jī)器設(shè)備105電子設(shè)備53其他63基本程序控制結(jié)構(gòu)選擇結(jié)構(gòu)(分支結(jié)構(gòu))if嵌套if條件1:if條件2:代碼塊A#滿足條件1和條件2時(shí)執(zhí)行代碼塊Aelif/else:代碼塊B #滿足條件1不滿足條件2時(shí)執(zhí)行代碼塊Belif/else:代碼塊C #不滿足條件1時(shí)執(zhí)行代碼塊C基本程序控制結(jié)構(gòu)選擇結(jié)構(gòu)(分支結(jié)構(gòu))基本程序控制結(jié)構(gòu)循環(huán)結(jié)構(gòu)while循環(huán)while條件:代碼塊 #滿足條件執(zhí)行代碼塊示例基本程序控制結(jié)構(gòu)循環(huán)結(jié)構(gòu)for……in循環(huán)for循環(huán)變量in列表:代碼塊 #滿足條件執(zhí)行代碼塊示例range(start,end,step)函數(shù)產(chǎn)生整數(shù)系列。基本程序控制結(jié)構(gòu)終止循環(huán)breakBreak可用在while循環(huán)和for循環(huán)中,用來終止當(dāng)前所在層的循環(huán)。示例基本程序控制結(jié)構(gòu)跳出當(dāng)前循環(huán)continuecontinue同樣可用在while循環(huán)和for循環(huán)中,用來跳過當(dāng)前循環(huán)的剩余語句,繼續(xù)執(zhí)行下一輪循環(huán)。示例輸出10以內(nèi)能被3整除的數(shù)字。函數(shù)認(rèn)識(shí)函數(shù)函數(shù)是為了實(shí)現(xiàn)某個(gè)特定功能而組合在一起的語句集,通過函數(shù)名來調(diào)用函數(shù)。函數(shù)分類。內(nèi)置函數(shù):在程序中可以直接使用標(biāo)準(zhǔn)庫函數(shù):已安裝需要通過import命令導(dǎo)入才能使用第三方庫函數(shù):需要先下載再導(dǎo)入才能使用用戶自定義函數(shù):用戶自行編寫的函數(shù),可以直接使用,也可以上傳到Python社區(qū)函數(shù)-自定義函數(shù)函數(shù)定義def函數(shù)名(參數(shù)):函數(shù)體[return返回值]函數(shù)調(diào)用

項(xiàng)目3學(xué)習(xí)Pandas模塊目錄了解模塊Series數(shù)據(jù)結(jié)構(gòu)DataFrame數(shù)據(jù)結(jié)構(gòu)Excel文件讀寫工具方法理論了解模塊認(rèn)識(shí)模塊模塊也稱為庫。每個(gè)模塊都能實(shí)現(xiàn)某個(gè)方面特定的功能。Python模塊就是一個(gè).py文件,其中可以包含多個(gè)函數(shù),還可以包含類、語句等。模塊的作用就是實(shí)現(xiàn)對(duì)函數(shù)的分類管理。模塊分類內(nèi)置模塊:Python自帶的模塊,可以直接導(dǎo)入并使用。自定義模塊:用戶自己編寫的模塊,以方便在編寫其他程序時(shí)調(diào)用,也可以上傳到第三方庫,供他人調(diào)用第三方模塊:Python的開源模塊模塊的安裝及導(dǎo)入模塊的安裝在交互模式下安裝:pipinstallpandas在JupyterNotebook中安裝:!pipinstallpandas模塊的導(dǎo)入使用import語句導(dǎo)入模塊import模塊名as別名使用from語句導(dǎo)入模塊:from模塊名import函數(shù)名from模塊名import函數(shù)名as別名認(rèn)識(shí)Pandas模塊

Pandas模塊的主要功能Pandas是Python的核心數(shù)據(jù)分析支持庫數(shù)據(jù)獲取數(shù)據(jù)整理Pandas模塊安裝及導(dǎo)入Anaconda中自帶Pandas庫,無需另行安裝導(dǎo)入:importpandasaspdSeries數(shù)據(jù)結(jié)構(gòu)了解SeriesSeries是帶索引的一維數(shù)組位置索引和標(biāo)簽索引創(chuàng)建Series如何創(chuàng)建pd.Series(data,index=[])通過列表創(chuàng)建Series創(chuàng)建Series如何創(chuàng)建pd.Series(data,index=[])通過字典創(chuàng)建Series字典的鍵作為索引index,字典的值作為數(shù)據(jù)data創(chuàng)建Series如何創(chuàng)建pd.Series(data,index=[])利用range()函數(shù)創(chuàng)建創(chuàng)建Seriesrange(start,stop,step)

初值

終值

步長訪問Series通過索引訪問Series訪問Series通過切片訪問Series按位置索引切片訪問Series中的多個(gè)元素時(shí),含頭不含尾,即左閉右開。例如,訪問s3中索引值從0到1的元素,需要用print(s3[0:2])。按標(biāo)簽索引切片訪問Series中的多個(gè)元素時(shí),含頭又含尾。DataFrame數(shù)據(jù)結(jié)構(gòu)了解DataFrameDataFrame是帶標(biāo)簽的、大小可變的二維數(shù)組DataFrame數(shù)據(jù)結(jié)構(gòu)了解DataFrame索引可以是位置索引,也可以是標(biāo)簽索引,DataFrame中表現(xiàn)為loc(標(biāo)簽索引)和iloc(數(shù)字索引、位置索引)兩個(gè)屬性。創(chuàng)建DataFrame1.以列表方式創(chuàng)建DataFrame自動(dòng)生成索引0、1、2創(chuàng)建DataFrame1.以列表方式創(chuàng)建DataFrame指定索引創(chuàng)建DataFrame1.以列表方式創(chuàng)建DataFrame創(chuàng)建DataFrame2.以字典方式創(chuàng)建DataFrame

字典的鍵會(huì)作為列索引,列索引無需再單獨(dú)設(shè)置。如果沒有設(shè)置行索引,默認(rèn)為從0開始的數(shù)字序列。訪問DataFrame屬性功能values查看所有元素的值dtypes查看所有元素的類型index查看所有行名、重命名行名columns查看所有列名、重命名列名T行列數(shù)據(jù)轉(zhuǎn)換head查看前N條數(shù)據(jù),默認(rèn)前5條tail查看后N條數(shù)據(jù),默認(rèn)后5條shape查看行數(shù)和列數(shù),shape[0]表示行,shape[1]表示列info查看索引、數(shù)據(jù)類型和內(nèi)存信息訪問DataFrame1.查看元素的值、類型、行名和列名訪問DataFrame2.查詢行數(shù)據(jù)(1)查詢單行數(shù)據(jù)訪問DataFrame2.查詢行數(shù)據(jù)(2)查看不連續(xù)的多行訪問DataFrame2.查詢行數(shù)據(jù)(3)查看連續(xù)的多行訪問DataFrame3.查詢列數(shù)據(jù)訪問DataFrame4.查詢指定數(shù)據(jù)訪問DataFrame5.查詢符合條件的數(shù)據(jù)(1)設(shè)置單一查詢條件訪問DataFrame5.查詢符合條件的數(shù)據(jù)(2)設(shè)置復(fù)合查詢條件訪問DataFrame6.表格轉(zhuǎn)置編輯DataFrame1.增加行數(shù)據(jù)增加單行數(shù)據(jù)編輯DataFrame1.增加行數(shù)據(jù)增加多行數(shù)據(jù)編輯DataFrame2.增加列數(shù)據(jù)在數(shù)據(jù)集末尾增加列編輯DataFrame2.增加列數(shù)據(jù)在指定位置插入列編輯DataFrame3.修改數(shù)據(jù)(1)利用loc屬性或iloc屬性修改某處數(shù)據(jù)編輯DataFrame3.修改數(shù)據(jù)(2)修改列標(biāo)題編輯DataFrame4.刪除數(shù)據(jù)(1)利用drop刪除數(shù)據(jù)編輯DataFrame4.刪除數(shù)據(jù)(2)利用del刪除數(shù)據(jù)將數(shù)據(jù)文件上載到JupyterNotebookExcel文件讀寫Excel文件讀寫在數(shù)據(jù)文件所在的文件夾中打開JupyterNotebook1.打開“D:\python”文件夾2.在路徑框內(nèi)輸入“cmd”3.在命令提示符后輸入“jupyternotebook”從Excel文件中獲取數(shù)據(jù)導(dǎo)入Excel文件方法pd.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,usecols=None,converters=None)導(dǎo)入Excel文件實(shí)戰(zhàn)(1)讀取整個(gè)Excel文件從Excel文件中獲取數(shù)據(jù)導(dǎo)入Excel文件實(shí)戰(zhàn)(2)讀取Excel文件中指定的工作表(3)讀取工作表中指定的行從Excel文件中獲取數(shù)據(jù)導(dǎo)入Excel文件實(shí)戰(zhàn)(4)讀取工作表中指定的列Excel文件讀寫寫入單個(gè)工作表1.寫入全部數(shù)據(jù)2.寫入部分?jǐn)?shù)據(jù)Excel文件讀寫寫入多個(gè)工作表

項(xiàng)目4財(cái)務(wù)數(shù)據(jù)獲取與清洗目錄認(rèn)識(shí)財(cái)務(wù)大數(shù)據(jù)從文件中獲取數(shù)據(jù)通過數(shù)據(jù)接口獲取數(shù)據(jù)財(cái)務(wù)數(shù)據(jù)清洗工具方法理論認(rèn)識(shí)財(cái)務(wù)大數(shù)據(jù)

大數(shù)據(jù)與財(cái)務(wù)數(shù)據(jù)大數(shù)據(jù)大數(shù)據(jù)(Bigdata),也稱巨量數(shù)據(jù),指的是其數(shù)據(jù)規(guī)模巨大到無法通過人工或常規(guī)工具在合理時(shí)間內(nèi)完成捕獲、管理和處理的數(shù)據(jù)集合。財(cái)務(wù)數(shù)據(jù)財(cái)務(wù)賬簿數(shù)據(jù)及報(bào)表數(shù)據(jù)企業(yè)的各項(xiàng)指標(biāo)分析數(shù)據(jù)認(rèn)識(shí)財(cái)務(wù)大數(shù)據(jù)

財(cái)務(wù)大數(shù)據(jù)來源數(shù)據(jù)分類數(shù)據(jù)來源網(wǎng)站及網(wǎng)址宏觀經(jīng)濟(jì)數(shù)據(jù)國家統(tǒng)計(jì)局中國經(jīng)濟(jì)信息網(wǎng)金融統(tǒng)計(jì)數(shù)據(jù)中國人民銀行財(cái)政數(shù)據(jù)財(cái)政部稅務(wù)政策國家稅務(wù)總局證券市場交易信息上市公司相關(guān)信息證券交易所官網(wǎng)上海證券交易所:w深圳證券交易所:www.szse.Cn北京證券交易所:w財(cái)經(jīng)網(wǎng)站新浪財(cái)經(jīng):網(wǎng)易財(cái)經(jīng):巨潮資訊:商業(yè)數(shù)據(jù)庫國泰安數(shù)據(jù)庫CSMRA、銳思數(shù)據(jù)庫RESSET萬得數(shù)據(jù)庫wind上市公司官網(wǎng)

數(shù)據(jù)服務(wù)公司Tushare證券寶Akshare從PDF文件中獲取財(cái)務(wù)數(shù)據(jù)認(rèn)識(shí)PDF文件PDF解釋器pdfplumerpipinstallpdfplumber導(dǎo)入PDF文件提取PDF文件中的表格數(shù)據(jù)從網(wǎng)頁上獲取財(cái)務(wù)數(shù)據(jù)從HTML文件中獲取數(shù)據(jù)pd.read_html(io,header=0,encoding)io:文件路徑,可以是URL鏈接。Header:指定列標(biāo)題所在的行。encoding:文件的編碼格式。常見的文件編碼格式有UTF-8/UTF-16/UTF-32、ASCII、GBK/GB2312/GB18030。從新浪財(cái)經(jīng)爬取瀘州老窖(000568)2023年利潤表的數(shù)據(jù)。確定目標(biāo)網(wǎng)站編寫代碼提取數(shù)據(jù)統(tǒng)計(jì)返回結(jié)果中表格的數(shù)量為表格標(biāo)上序號(hào)提取利潤表數(shù)據(jù)存儲(chǔ)數(shù)據(jù)從網(wǎng)頁上獲取財(cái)務(wù)數(shù)據(jù)從新浪財(cái)經(jīng)網(wǎng)站上爬取瀘州老窖(股票代碼:000568)2023年利潤表的數(shù)據(jù)。確定目標(biāo)網(wǎng)站“/corp/go.php/vFD_ProfitStatement/stockid/000568/ctrl/part/displaytype/4.phtml”編寫代碼從網(wǎng)頁上獲取財(cái)務(wù)數(shù)據(jù)從新浪財(cái)經(jīng)網(wǎng)站上爬取瀘州老窖(股票代碼:000568)2023年利潤表的數(shù)據(jù)。提取數(shù)據(jù)統(tǒng)計(jì)返回結(jié)果中表格的數(shù)量為表格標(biāo)上序號(hào)提取利潤表數(shù)據(jù)從網(wǎng)頁上獲取財(cái)務(wù)數(shù)據(jù)通過數(shù)據(jù)接口獲取數(shù)據(jù)認(rèn)識(shí)數(shù)據(jù)接口數(shù)據(jù)接口指獲取數(shù)據(jù)的規(guī)范和方法,它是由數(shù)據(jù)擁有者定義,目的是方便用戶順利地采集數(shù)據(jù)。常用財(cái)務(wù)數(shù)據(jù)接口序號(hào)公司網(wǎng)址可提供的數(shù)據(jù)1Tushare股票、基金、期貨、數(shù)字貨幣等行情數(shù)據(jù),公司財(cái)務(wù)、基金經(jīng)理等基本面數(shù)據(jù)2證券寶證券歷史行情數(shù)據(jù)、上市公司財(cái)務(wù)數(shù)據(jù)3AKsharewww.akshare.xyz基于Python的財(cái)經(jīng)數(shù)據(jù)接口庫,目的是實(shí)現(xiàn)對(duì)股票、期貨、期權(quán)、基金、外匯、債券、指數(shù)、加密貨幣等金融產(chǎn)品的基本面數(shù)據(jù)、實(shí)時(shí)和歷史行情數(shù)據(jù)、衍生數(shù)據(jù)從數(shù)據(jù)采集、數(shù)據(jù)清洗到數(shù)據(jù)落地的一套工具,主要用于學(xué)術(shù)研究目的。通過Tushare數(shù)據(jù)接口采集財(cái)務(wù)數(shù)據(jù)安裝pipinstalltushare注冊(cè)tushare社區(qū)獲取TokenToken可以理解為是個(gè)人在tushare社區(qū)的身份證明通過Tushare數(shù)據(jù)接口采集財(cái)務(wù)數(shù)據(jù)了解Tushare數(shù)據(jù)平臺(tái)通過Tushare數(shù)據(jù)接口采集財(cái)務(wù)數(shù)據(jù)利用Tushare采集上市公司基本信息了解tushare上市公司基本信息數(shù)據(jù)接口通過Tushare數(shù)據(jù)接口采集財(cái)務(wù)數(shù)據(jù)利用Tushare采集上市公司基本信息采集上市公司基本信息通過Tushare數(shù)據(jù)接口采集財(cái)務(wù)數(shù)據(jù)了解Tushare財(cái)務(wù)數(shù)據(jù)采集數(shù)據(jù)接口1.查看利潤表數(shù)據(jù)接口詳細(xì)說明通過Tushare數(shù)據(jù)接口采集財(cái)務(wù)數(shù)據(jù)了解Tushare財(cái)務(wù)數(shù)據(jù)采集數(shù)據(jù)接口2.找到接口使用說明和數(shù)據(jù)樣例通過Tushare數(shù)據(jù)接口采集財(cái)務(wù)數(shù)據(jù)了解Tushare財(cái)務(wù)數(shù)據(jù)采集數(shù)據(jù)接口3.對(duì)照接口使用說明理解輸入?yún)?shù)的含義通過Tushare數(shù)據(jù)接口采集財(cái)務(wù)數(shù)據(jù)了解Tushare財(cái)務(wù)數(shù)據(jù)采集數(shù)據(jù)接口4.對(duì)照數(shù)據(jù)樣例理解輸出參數(shù)的含義名稱類型必選描述total_reven

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論