《大數(shù)據(jù)技術(shù)在財務(wù)中的應(yīng)用》課件 4.1 采集數(shù)據(jù)_第1頁
《大數(shù)據(jù)技術(shù)在財務(wù)中的應(yīng)用》課件 4.1 采集數(shù)據(jù)_第2頁
《大數(shù)據(jù)技術(shù)在財務(wù)中的應(yīng)用》課件 4.1 采集數(shù)據(jù)_第3頁
《大數(shù)據(jù)技術(shù)在財務(wù)中的應(yīng)用》課件 4.1 采集數(shù)據(jù)_第4頁
《大數(shù)據(jù)技術(shù)在財務(wù)中的應(yīng)用》課件 4.1 采集數(shù)據(jù)_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

項目四搭建Python數(shù)據(jù)分析基礎(chǔ)任務(wù)一采集數(shù)據(jù)CONTENTS認識DataFrame01多源數(shù)據(jù)采集02目錄PARTONE認識DataFrame一、利用字典生成DataFrame二、利用列表生成DataFrame認識DataFrameDataFrame數(shù)據(jù)結(jié)構(gòu)類似與Excel表格數(shù)據(jù),如下表所示的某品類商品訂單數(shù)據(jù)。接下來分別利用字典和列表,生成表中數(shù)據(jù)。利用字典生成DataFrame在生成DataFrame數(shù)據(jù)時,字典是一種常用的方法。通常,會將每一列的字段作為字典的鍵(key),而字段下的數(shù)據(jù)則作為對應(yīng)的值(value),以此來構(gòu)建DataFrame。通過使用importpandasaspd語句導(dǎo)入pandas模塊,可以方便地在后續(xù)代碼中調(diào)用它的功能。設(shè)置別名為“pd”后,只需在函數(shù)名前加上“pd”即可調(diào)用相關(guān)函數(shù)。也可以利用AI助手,輔助完成數(shù)據(jù)的生成。利用列表生成DataFrame使用列表生成DataFrame格式的數(shù)據(jù),也是常見的構(gòu)造方式。下面展示了如何通過列表,生成相同數(shù)據(jù)。DataFrame可以使用同名函數(shù)DataFrame()創(chuàng)建,該函數(shù)包含3個參數(shù)。(1)data:數(shù)據(jù)參數(shù),是一組數(shù)據(jù)的集合。(2)columns:列索引,是縱向索引的集合;如果不指定,則默認參數(shù)值為從0開始的正整數(shù)序列。(3)index:行索引,是橫向索引的集合;如果不指定,則默認參數(shù)值為從0開始的正整數(shù)序列。也可以借助AI助手,利用列表和字典,構(gòu)造同樣的DataFrame。PARTTWO多源數(shù)據(jù)采集一、通過接口獲取訂單信息二、通過read_excel()函數(shù),獲取客戶信息三、通過read_html()函數(shù)獲取城市和產(chǎn)品數(shù)據(jù)通過接口獲取訂單信息在處理大規(guī)模訂單數(shù)據(jù)時,利用公開的數(shù)據(jù)接口,能夠高效地從數(shù)萬條訂單記錄中精準檢索所需信息,提升數(shù)據(jù)處理的效率與準確性。通過read_excel()函數(shù),獲取客戶信息可以借助AI助手,學習讀取本地excel文件。將“客戶數(shù)據(jù)表.xls”和對應(yīng)的ipynb代碼文件,存儲在同一目錄下,可以直接使用相對路徑,獲取客戶信息。通過read_html()函數(shù)獲取城市和產(chǎn)品數(shù)據(jù)read_html()函數(shù),能夠直接讀取網(wǎng)頁中標簽為table的數(shù)據(jù),比如本例中的城市和產(chǎn)品表,可以采用通過read_html()函數(shù)獲取。結(jié)果列表里,包含了產(chǎn)品和城市的數(shù)據(jù)。通過列表索引,可以獲取需要的數(shù)據(jù)。通過read_html()函數(shù)獲取城市和產(chǎn)品數(shù)據(jù)限于篇幅,僅進行部分數(shù)據(jù)展示,df_list[0]為獲取的第一張表,對應(yīng)產(chǎn)品數(shù)據(jù)。通過read_

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論