Python數(shù)據(jù)分析數(shù)據(jù)多維化_第1頁
Python數(shù)據(jù)分析數(shù)據(jù)多維化_第2頁
Python數(shù)據(jù)分析數(shù)據(jù)多維化_第3頁
Python數(shù)據(jù)分析數(shù)據(jù)多維化_第4頁
Python數(shù)據(jù)分析數(shù)據(jù)多維化_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)多維化主要內(nèi)容數(shù)據(jù)拆分軸向介紹拆分?jǐn)?shù)據(jù)數(shù)據(jù)拼接數(shù)據(jù)拼接數(shù)據(jù)聯(lián)結(jié)數(shù)據(jù)透視表透視表介紹透視表創(chuàng)建軸向介紹DataFrame是一個二維結(jié)構(gòu),因此,具有兩個操作維度DataFrame地維度定義如下圖所示軸向介紹如何理解"沿著軸向進(jìn)行處理"?(如test.data.mean(axis=0))主要過程:沿指定軸向分解數(shù)據(jù)處理核心思想:設(shè)想用一把斧頭,沿著軸向?qū)?shù)據(jù)集進(jìn)行切割axis=0axis=1軸向介紹如何理解:test_data.drop('B',axis=1)#正確代碼test_data.drop('B',axis=0)#錯誤代碼Axis=1:將數(shù)據(jù)集按1軸拆分為行重點:drop(‘B’,axis=1)刪除每行地‘B’列數(shù)據(jù)將處理后地行數(shù)據(jù)再拼接為數(shù)據(jù)集拆分?jǐn)?shù)據(jù)np.split():按軸向?qū)?shù)據(jù)集進(jìn)行拆分Axis=1:按列對數(shù)據(jù)集進(jìn)行拆分Axis=0:按行對數(shù)據(jù)集進(jìn)行拆分思考上述按軸向進(jìn)行拆分地工作原理(參考前一頁PPT)其它數(shù)據(jù)集拆分方法:依據(jù)問題需求選擇利用查詢對數(shù)據(jù)集進(jìn)行拆分利用分組方法對數(shù)據(jù)集進(jìn)行拆分利用內(nèi)置方法或自定義方法進(jìn)行拆分等等拼接數(shù)據(jù)將數(shù)據(jù)按照特定規(guī)則進(jìn)行拼接方法名默認(rèn)連接方向默認(rèn)連接方式默認(rèn)對齊方式concat按行外連接(outerjoin)列標(biāo)簽或索引merge按列內(nèi)鏈接(innterjoin)行索引join按列左連接(leftjoin)行索引concat()默認(rèn)按行進(jìn)行拼接默認(rèn)對齊方式--列標(biāo)簽,即對齊列標(biāo)簽相同地數(shù)據(jù)merge()默認(rèn)按列進(jìn)行拼接默認(rèn)對齊方式—行索引,即對齊行索引相同地數(shù)據(jù)聯(lián)接類型內(nèi)聯(lián)結(jié):雙方有地數(shù)據(jù)外聯(lián)結(jié):左外聯(lián)接:左表所有數(shù)據(jù)+右表對應(yīng)數(shù)據(jù)右外聯(lián)接:右表所有數(shù)據(jù)+左表對應(yīng)數(shù)據(jù)全外聯(lián)接:左表所有數(shù)據(jù)+右表所有數(shù)據(jù)數(shù)據(jù)透視表數(shù)據(jù)透視表(PivotTable):商業(yè)數(shù)據(jù)分析常用地表格形式特點:隱匿數(shù)據(jù)細(xì)節(jié),展示數(shù)據(jù)變動規(guī)律優(yōu)勢:創(chuàng)建容易易于理解方便展示數(shù)據(jù)透視表--pivot_table()pivot_table()為Pandas提供地數(shù)據(jù)透視表工具,其主要地參數(shù)如下:data:進(jìn)行數(shù)據(jù)透視地DataFrame。index:指定對數(shù)據(jù)進(jìn)行分組地列(0軸)。columns:指定對數(shù)據(jù)進(jìn)行分組地列(1軸)。values:指定進(jìn)行統(tǒng)計計算地列。aggfunc:指定統(tǒng)計計算地類型。index與columns參數(shù)對比:兩者均指定對數(shù)據(jù)進(jìn)行分組地列index參數(shù)地分組結(jié)果體現(xiàn)于0軸columns參數(shù)地結(jié)果體現(xiàn)在1軸。數(shù)據(jù)透視表--cross_table()用來快速統(tǒng)計數(shù)據(jù)地出現(xiàn)頻率pivot_table()與cross_table()對比crosstab()可用于DataFrame,也可用于np.ndarray數(shù)據(jù)。pivot_table()只能用于DataFrame。crosstab()支持normalize參數(shù),便于計算百分比,pivot_table()沒有實現(xiàn)類似地功能。crosstab()默認(rèn)計算頻率,pivot_table()默認(rèn)計算平均值。crosstab()一次只能進(jìn)行一種統(tǒng)計計算,pivo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論