《Pandas數(shù)據(jù)處理》課件 8.1.1 統(tǒng)計平均錄取分?jǐn)?shù)最高的前10所學(xué)校_第1頁
《Pandas數(shù)據(jù)處理》課件 8.1.1 統(tǒng)計平均錄取分?jǐn)?shù)最高的前10所學(xué)校_第2頁
《Pandas數(shù)據(jù)處理》課件 8.1.1 統(tǒng)計平均錄取分?jǐn)?shù)最高的前10所學(xué)校_第3頁
《Pandas數(shù)據(jù)處理》課件 8.1.1 統(tǒng)計平均錄取分?jǐn)?shù)最高的前10所學(xué)校_第4頁
《Pandas數(shù)據(jù)處理》課件 8.1.1 統(tǒng)計平均錄取分?jǐn)?shù)最高的前10所學(xué)校_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計平均錄取分?jǐn)?shù)最高的前10所學(xué)校主講人:xx重慶市九龍坡職業(yè)教育中心問題描述利用2007年-2017年全國部分高校的錄取數(shù)據(jù)(“school.csv”),統(tǒng)計表中各學(xué)校各年所有地區(qū)所有專業(yè)的錄取平均分?jǐn)?shù),同時計算出各校11年的平均錄取分?jǐn)?shù)(即“歷年平均“),對“歷年平均“按降序排序,輸出“歷年平均“排名前10名高校的2016年和2017年錄取分?jǐn)?shù),并使用柱狀圖對數(shù)據(jù)進行可視化,見表8.1.2和圖8.1.1。問題描述表8.1.2排名前10名高校的2016年和2017年錄取分?jǐn)?shù)題前思考表8.1.2問題分析根據(jù)問題描述,填寫以下表格importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\項目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='學(xué)校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='歷年平均')④school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\項目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='學(xué)校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='歷年平均')④school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼importmatplotlib.pyplotasmp,導(dǎo)入繪圖matplotlib模塊的pythlot模塊。importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\項目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='學(xué)校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='歷年平均')④school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼修改圖表中的字體為'SimHei',即微軟雅黑。importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\項目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='學(xué)校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='歷年平均')④school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼pd.read_csv(),讀取scv格式的文件,保存到變量data中。程序代碼年份學(xué)校200720082009...20162017歷年平均上海交通大學(xué)646.889306629.036697632.233684...631.875000642.674419633.169404上海交通大學(xué)醫(yī)學(xué)院NaNNaN616.873239...NaNNaN623.438735東北大學(xué)NaNNaNNaN...578.368852558.357143575.552047東南大學(xué)614.896175591.421806597.955086...617.122905610.714286605.567555中南大學(xué)NaNNaN573.813187...590.922515578.175799585.413828........................西北工業(yè)大學(xué)609.861194584.370717586.713650...596.427160585.677494594.821507西安交通大學(xué)NaNNaNNaN...621.912442615.031250616.226291重慶大學(xué)595.704776576.811665575.806564...595.470426584.288973584.892715總計622.189012605.856792596.173174...603.825497592.947777603.538463表8.1.4匯總數(shù)據(jù)后的統(tǒng)計表importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\項目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='學(xué)校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='歷年平均')④school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼調(diào)用pivot_table()函數(shù)為數(shù)據(jù)框data建立數(shù)據(jù)透視表。school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼對數(shù)據(jù)school_score[:-1]進行排序。程序代碼年份學(xué)校200720082009...20162017歷年平均清華大學(xué)673.598291661.736264657.629167...675.017668669.352941664.742333北京大學(xué)662.169717653.086116646.217469...657.943231647.438272653.195701中國科學(xué)技術(shù)大學(xué)649.917553631.515873637.829016...648.400000633.673469642.332882浙江大學(xué)646.584775629.181495632.155280...638.600000653.500000635.590120表8.1.5排序后得到的數(shù)據(jù)school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼school_score_sort_2year.plot(),使用基本繪圖函數(shù)plot()對數(shù)據(jù)school_score_sort_2year繪圖。程序代碼school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_scor

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論