版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用模塊5Pandas數(shù)據(jù)預(yù)處理5.4Pandas數(shù)據(jù)重塑5.4.1重塑層次化索引1.使用stack()函數(shù)將數(shù)據(jù)的列索引轉(zhuǎn)換為行索引stack()函數(shù)可以將數(shù)據(jù)的列索引轉(zhuǎn)換為行索引,stack()函數(shù)的語(yǔ)法格式如下:stack(level=-1,dropna=True)該函數(shù)返回值為DataFrame或Series對(duì)象。函數(shù)參數(shù)說(shuō)明如下:?level:表示操作索引的級(jí)別或級(jí)別名稱(chēng)。默認(rèn)值為-1,表示操作內(nèi)層索引;如果其值設(shè)置為0,則表示操作外層索引。?dropna:接收布爾值,默認(rèn)值為T(mén)rue,表示自動(dòng)將旋轉(zhuǎn)后的缺失值刪除;如果其值設(shè)置為1,則表示保留缺失值。5.4.1重塑層次化索引2.使用unstack()函數(shù)將數(shù)據(jù)的行索引轉(zhuǎn)換為列索引unstack()函數(shù)可以將數(shù)據(jù)的行索引轉(zhuǎn)換為列索引,unstack()函數(shù)的語(yǔ)法格式如下:DataFrame.unstack(level=-1,fill_value=None)或Series.unstack(level=-1,fill_value=None)該函數(shù)返回值為DataFrame或Series。函數(shù)參數(shù)說(shuō)明如下:?level:表示unstack索引的級(jí)別或級(jí)別名稱(chēng)。默認(rèn)值為-1,表示操作內(nèi)層索引,如果其值設(shè)置為0,則表示操作外層索引。?fill_value:默認(rèn)值為None,如果設(shè)置其他值,則旋轉(zhuǎn)過(guò)程中產(chǎn)生了缺失值,則用該參數(shù)的值替換NaN缺失值。5.4.2使用pivot()函數(shù)實(shí)現(xiàn)軸向旋轉(zhuǎn)Pandas提供了pivot()函數(shù),該函數(shù)會(huì)根據(jù)給定的行索引或列索引重新組織一個(gè)DataFrame對(duì)象,即將一個(gè)DataFrame的記錄數(shù)據(jù)整合成表格,俗稱(chēng)數(shù)據(jù)透視,類(lèi)似Excel中的數(shù)據(jù)透視表功能,它返回重塑的DataFrame,這樣的好處是使得數(shù)據(jù)更加的直觀和容易分析。pivot()函數(shù)的語(yǔ)法結(jié)構(gòu)如下:pivot(index=None,columns=None,values=None)或者pivot(index,columns,values)其含義與作用是將index指定為行索引,columns指定為列索引,values則是填充新DataFrame對(duì)象中的值。即根據(jù)DataFrame的3列數(shù)據(jù)生成數(shù)據(jù)透視表,使用索引/列中的唯一值并填充值。5.4.2使用pivot()函數(shù)實(shí)現(xiàn)軸向旋轉(zhuǎn)該函數(shù)參數(shù)說(shuō)明如下:?index:為可選參數(shù),可接收string或object類(lèi)型的值,用于創(chuàng)建新DataFrame對(duì)象行索引的列名稱(chēng)。如果未指定,則使用原DataFrame對(duì)象的索引。?columns:可接收string或object類(lèi)型的值,用于創(chuàng)建新DataFrame對(duì)象列索引的列名稱(chēng)。如果未指定,則使用原DataFrame對(duì)象的索引?values:用于填充新DataFrame對(duì)象中值的列名稱(chēng)。如果未指定,則將使用剩余列進(jìn)行填充,結(jié)果將具有分層索引列。5.4.3使用melt()函數(shù)將DataFrame從寬格式轉(zhuǎn)換為長(zhǎng)格式數(shù)據(jù)分析時(shí)經(jīng)常要把寬數(shù)據(jù)格式轉(zhuǎn)換為長(zhǎng)數(shù)據(jù)格式,有點(diǎn)像excel的逆透視過(guò)程。melt()函數(shù)的語(yǔ)法格式如下:melt(id_vars=None,value_vars=None,var_name=None,value_name='value',col_level=None)該函數(shù)的功能為:將DataFrame壓縮為一種格式,其中一列或多列是標(biāo)識(shí)符變量(id_vars),而所有其他列均視為測(cè)量變量(value_vars),相對(duì)于行軸為“unpivoted”,僅留下兩個(gè)非標(biāo)識(shí)符列‘variable’和‘value’。5.4.3使用melt()函數(shù)將DataFrame從寬格式轉(zhuǎn)換為長(zhǎng)格式該函數(shù)參數(shù)說(shuō)明如下:?id_vars:為可選參數(shù),用作標(biāo)識(shí)符變量的列。?value_vars:為可選參數(shù),要取消透視的列。如果未指定,則使用未設(shè)置為id_vars的所有列。?var_name:用于自定義“variable”列的名稱(chēng)。如果沒(méi)有,則使用“variable”。?value_name:用于自定義“value”列的名稱(chēng),默認(rèn)為“value”。?col_level:為可選參數(shù),如果列是MultiIndex,則使用此級(jí)別進(jìn)行融合。5.4.4使用pivot_table()函數(shù)聚合與透視數(shù)據(jù)Pandas提供了制作數(shù)據(jù)透視表的函數(shù)pivot_table(),pivot_table()函數(shù)用于將列數(shù)據(jù)設(shè)定為行索引和列索引,并可以聚合運(yùn)算。pivot_table()函數(shù)的語(yǔ)法格式如下:dataframe.pivot_table(values=None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All')或pandas.pivot_table(data,values=None,index=
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030融合通信核心器件行業(yè)市場(chǎng)供需特點(diǎn)及產(chǎn)業(yè)創(chuàng)新投資規(guī)劃分析報(bào)告
- 2025-2030葡萄牙高血壓藥物系統(tǒng)質(zhì)量研發(fā)利潤(rùn)格局評(píng)估部署方法
- 2025-2030葡萄牙葡萄酒產(chǎn)業(yè)現(xiàn)狀供需分析及投資價(jià)值規(guī)劃報(bào)告
- 山東2025年山東文化產(chǎn)業(yè)職業(yè)學(xué)院專(zhuān)任教師招聘44人筆試歷年參考題庫(kù)附帶答案詳解
- 寶雞2025年陜西寶雞市扶風(fēng)縣招聘城鎮(zhèn)社區(qū)專(zhuān)職工作人員30人筆試歷年參考題庫(kù)附帶答案詳解
- 寧波2025年浙江寧波余姚市公益性崗位招聘筆試歷年參考題庫(kù)附帶答案詳解
- 四川2025年四川中煙工業(yè)有限責(zé)任公司博士研究生招聘2人筆試歷年參考題庫(kù)附帶答案詳解
- 四川2025上半年中共四川省委金融委員會(huì)辦公室下屬事業(yè)單位試招聘工作人員筆試歷年參考題庫(kù)附帶答案詳解
- 合肥2025年上半年安徽合肥市肥西縣事業(yè)單位招聘62人筆試歷年參考題庫(kù)附帶答案詳解
- 臺(tái)州2025年浙江臺(tái)州科技職業(yè)學(xué)院招聘教師7人筆試歷年參考題庫(kù)附帶答案詳解
- 山東省德州市樂(lè)陵市2024-2025學(xué)年七年級(jí)上學(xué)期期末考試英語(yǔ)試(答案無(wú)聽(tīng)力原文及音頻)
- 2024年彩鋼瓦安裝合同范本
- 《冠心病》課件(完整版)
- 人教版(2024)六年級(jí)全一冊(cè) 第17課 設(shè)計(jì)我的種植園
- 小學(xué)三年級(jí)上冊(cè)數(shù)學(xué)期末測(cè)試卷(滿(mǎn)分必刷)
- 供貨方案-生產(chǎn)供貨實(shí)施方案-供貨方案
- 一種電子煙煙彈和電子煙的制作方法
- 場(chǎng)地平整施工組織說(shuō)明
- 案例pcs7中datamonitor使用入門(mén)
- 創(chuàng)傷性遲發(fā)性顱內(nèi)血腫
- 安全管理制度匯編報(bào)審表
評(píng)論
0/150
提交評(píng)論