Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用(微課版)課件 5.4 Pandas數(shù)據(jù)重塑_第1頁(yè)
Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用(微課版)課件 5.4 Pandas數(shù)據(jù)重塑_第2頁(yè)
Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用(微課版)課件 5.4 Pandas數(shù)據(jù)重塑_第3頁(yè)
Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用(微課版)課件 5.4 Pandas數(shù)據(jù)重塑_第4頁(yè)
Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用(微課版)課件 5.4 Pandas數(shù)據(jù)重塑_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用模塊5Pandas數(shù)據(jù)預(yù)處理5.4Pandas數(shù)據(jù)重塑5.4.1重塑層次化索引1.使用stack()函數(shù)將數(shù)據(jù)的列索引轉(zhuǎn)換為行索引stack()函數(shù)可以將數(shù)據(jù)的列索引轉(zhuǎn)換為行索引,stack()函數(shù)的語(yǔ)法格式如下:stack(level=-1,dropna=True)該函數(shù)返回值為DataFrame或Series對(duì)象。函數(shù)參數(shù)說(shuō)明如下:?level:表示操作索引的級(jí)別或級(jí)別名稱(chēng)。默認(rèn)值為-1,表示操作內(nèi)層索引;如果其值設(shè)置為0,則表示操作外層索引。?dropna:接收布爾值,默認(rèn)值為T(mén)rue,表示自動(dòng)將旋轉(zhuǎn)后的缺失值刪除;如果其值設(shè)置為1,則表示保留缺失值。5.4.1重塑層次化索引2.使用unstack()函數(shù)將數(shù)據(jù)的行索引轉(zhuǎn)換為列索引unstack()函數(shù)可以將數(shù)據(jù)的行索引轉(zhuǎn)換為列索引,unstack()函數(shù)的語(yǔ)法格式如下:DataFrame.unstack(level=-1,fill_value=None)或Series.unstack(level=-1,fill_value=None)該函數(shù)返回值為DataFrame或Series。函數(shù)參數(shù)說(shuō)明如下:?level:表示unstack索引的級(jí)別或級(jí)別名稱(chēng)。默認(rèn)值為-1,表示操作內(nèi)層索引,如果其值設(shè)置為0,則表示操作外層索引。?fill_value:默認(rèn)值為None,如果設(shè)置其他值,則旋轉(zhuǎn)過(guò)程中產(chǎn)生了缺失值,則用該參數(shù)的值替換NaN缺失值。5.4.2使用pivot()函數(shù)實(shí)現(xiàn)軸向旋轉(zhuǎn)Pandas提供了pivot()函數(shù),該函數(shù)會(huì)根據(jù)給定的行索引或列索引重新組織一個(gè)DataFrame對(duì)象,即將一個(gè)DataFrame的記錄數(shù)據(jù)整合成表格,俗稱(chēng)數(shù)據(jù)透視,類(lèi)似Excel中的數(shù)據(jù)透視表功能,它返回重塑的DataFrame,這樣的好處是使得數(shù)據(jù)更加的直觀和容易分析。pivot()函數(shù)的語(yǔ)法結(jié)構(gòu)如下:pivot(index=None,columns=None,values=None)或者pivot(index,columns,values)其含義與作用是將index指定為行索引,columns指定為列索引,values則是填充新DataFrame對(duì)象中的值。即根據(jù)DataFrame的3列數(shù)據(jù)生成數(shù)據(jù)透視表,使用索引/列中的唯一值并填充值。5.4.2使用pivot()函數(shù)實(shí)現(xiàn)軸向旋轉(zhuǎn)該函數(shù)參數(shù)說(shuō)明如下:?index:為可選參數(shù),可接收string或object類(lèi)型的值,用于創(chuàng)建新DataFrame對(duì)象行索引的列名稱(chēng)。如果未指定,則使用原DataFrame對(duì)象的索引。?columns:可接收string或object類(lèi)型的值,用于創(chuàng)建新DataFrame對(duì)象列索引的列名稱(chēng)。如果未指定,則使用原DataFrame對(duì)象的索引?values:用于填充新DataFrame對(duì)象中值的列名稱(chēng)。如果未指定,則將使用剩余列進(jìn)行填充,結(jié)果將具有分層索引列。5.4.3使用melt()函數(shù)將DataFrame從寬格式轉(zhuǎn)換為長(zhǎng)格式數(shù)據(jù)分析時(shí)經(jīng)常要把寬數(shù)據(jù)格式轉(zhuǎn)換為長(zhǎng)數(shù)據(jù)格式,有點(diǎn)像excel的逆透視過(guò)程。melt()函數(shù)的語(yǔ)法格式如下:melt(id_vars=None,value_vars=None,var_name=None,value_name='value',col_level=None)該函數(shù)的功能為:將DataFrame壓縮為一種格式,其中一列或多列是標(biāo)識(shí)符變量(id_vars),而所有其他列均視為測(cè)量變量(value_vars),相對(duì)于行軸為“unpivoted”,僅留下兩個(gè)非標(biāo)識(shí)符列‘variable’和‘value’。5.4.3使用melt()函數(shù)將DataFrame從寬格式轉(zhuǎn)換為長(zhǎng)格式該函數(shù)參數(shù)說(shuō)明如下:?id_vars:為可選參數(shù),用作標(biāo)識(shí)符變量的列。?value_vars:為可選參數(shù),要取消透視的列。如果未指定,則使用未設(shè)置為id_vars的所有列。?var_name:用于自定義“variable”列的名稱(chēng)。如果沒(méi)有,則使用“variable”。?value_name:用于自定義“value”列的名稱(chēng),默認(rèn)為“value”。?col_level:為可選參數(shù),如果列是MultiIndex,則使用此級(jí)別進(jìn)行融合。5.4.4使用pivot_table()函數(shù)聚合與透視數(shù)據(jù)Pandas提供了制作數(shù)據(jù)透視表的函數(shù)pivot_table(),pivot_table()函數(shù)用于將列數(shù)據(jù)設(shè)定為行索引和列索引,并可以聚合運(yùn)算。pivot_table()函數(shù)的語(yǔ)法格式如下:dataframe.pivot_table(values=None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All')或pandas.pivot_table(data,values=None,index=

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論