版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
浙江經貿職業(yè)技術學院與挖掘數據分析大數據基礎Unit6《大數據基礎》.移動商務營銷課程群6.1.1數據分析簡介6.1.2數據挖掘簡介6.1.3pandas數據分析6.1數據分析與挖掘簡介6.1.3pandas數據分析1統(tǒng)計方法
Pandas庫是進行數據預處理的強有力工具,也是開展數據分析的強有力工具。Pandas的DataFrame或Series對象都提供了大量的統(tǒng)計方法,用于實現數值型數據的各類型統(tǒng)計運算,注意這些方法都自動忽略缺失值。
常見的統(tǒng)計方法有統(tǒng)計個數count、最大值max、最小值min,總和sum、平均值mean,方差var和標準差std等。例如:data=pd.Series([2,3,5,7,11,13,17,19])
data.mean()6.1.3pandas數據分析2分組統(tǒng)計
前面的統(tǒng)計方法能夠讓我們對Series類型的一列數值型數據有個比較籠統(tǒng)的認識,但要呈現豐富的描述性數據分析,就需要開展分組統(tǒng)計。
分組統(tǒng)計需要有一個被分組的數據集,主要是數值類型的Series對象,分組統(tǒng)計還需要選擇合適的標簽作為分組鍵,作為分組鍵的數據會選用能夠呈現類別的Series對象。6.1.3pandas數據分析2分組統(tǒng)計
如圖所示,圖中最左側兩列數據分別是分組鍵和待分組數據,分組統(tǒng)計需要經過拆分、應用、合并3個步驟:
第一步,根據分組鍵進行拆分,將同一個鍵的數據合并成小的數據集。
第二步,根據分析需要,對每個小的數據集選用一個統(tǒng)計分析方法,這就是應用,最終,每個小的數據集各會得到一個統(tǒng)計值。
第三步,最后是合并,將各組的統(tǒng)計值合并在一起。6.1.3pandas數據分析2分組統(tǒng)計pandas的DataFrame或Series對象都提供了方法groupby用于處理分組,返回一個DataFrameGroupBy或SeriesGroupBy對象,它的基本格式為:
DataFrame.groupby(by,….)或Series.groupby(by,…)其中DataFrame或Series對象是待分組的數據集,都能調用方法groupby,方法內的參數by是分組鍵。例如:data=pd.Series([0,5,10,5,10,15,10,15,20])key=pd.Series([‘A’,‘B’,‘C’,‘A’,‘B’,‘C’,‘A’,‘B’,‘C’])
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年海外房地產市場投資機會分析
- 2026吉林長春東城國有資本投資運營(集團)有限公司招聘6人筆試備考試題及答案解析
- 2025年帆軟客戶服務類筆試題及答案
- 2025年杭州新華書店招聘筆試及答案
- 2025年滁州社區(qū)工作者筆試真題及答案
- 2025年華師附小招聘筆試真題及答案
- 2025年晉江人事考試及答案
- 2025年國開筆試稅收基礎試題及答案
- 2025年趙葉林諸暨事業(yè)單位考試及答案
- 2026年政策變動對房地產市場的驅動作用
- 耐蝕襯膠工專項考核試卷及答案
- 水利工程單元工程施工質量驗收常用表格(建筑工程)單元工程施工質量驗收表
- 人工智能通識教程第5章智能體
- 地源熱泵工程施工方案
- 雙臂操作助行器 要求和試驗方法 第2輪式助行器
- 新人教版PEP英語單詞表(三年級至六年級全8冊)
- 駕校教練員教學課件
- 社會穩(wěn)定風險評估報告匯報
- 2025年重慶高職分類考試語文試卷真題及答案詳解
- 公司安全環(huán)保部年終工作總結
- 老年骨折患者術后的護理
評論
0/150
提交評論