Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用(微課版) 教案 模塊8 應(yīng)用與實(shí)戰(zhàn)_第1頁
Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用(微課版) 教案 模塊8 應(yīng)用與實(shí)戰(zhàn)_第2頁
Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用(微課版) 教案 模塊8 應(yīng)用與實(shí)戰(zhàn)_第3頁
Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用(微課版) 教案 模塊8 應(yīng)用與實(shí)戰(zhàn)_第4頁
Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用(微課版) 教案 模塊8 應(yīng)用與實(shí)戰(zhàn)_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用模塊模塊8Pandas時(shí)間序列操作與應(yīng)用【應(yīng)用與實(shí)戰(zhàn)】【任務(wù)8-1】對(duì)日期時(shí)間數(shù)據(jù)進(jìn)行靈活處理【任務(wù)描述】編寫程序?qū)崿F(xiàn)以下功能:(1)從Excel文件“orderInfo.xlsx”第1個(gè)工作表中獲取“訂單完成時(shí)間”和“商品金額”兩列數(shù)據(jù)。(2)查看獲取數(shù)據(jù)的列名稱、數(shù)據(jù)類型、記錄數(shù)量等相關(guān)信息。(3)單獨(dú)提取“訂單完成時(shí)間”數(shù)據(jù),指定格式符為“'%Y-%m-%d”,將無效的數(shù)據(jù)解析設(shè)置為NaN。(4)查看數(shù)據(jù)集中各列數(shù)據(jù)的數(shù)據(jù)類型。(5)隨機(jī)獲取dataFrame中的5條銷售日期數(shù)據(jù)(6)分別從“銷售日期”中獲取無時(shí)、分、秒的日期、年、月、日、季度和星期,并輸出這些數(shù)據(jù)及對(duì)應(yīng)數(shù)據(jù)類型。(7)將年份“2021、2022”、月份“2、3”、天數(shù)“4、15”、小時(shí)數(shù)“2、3”通過DataFrame結(jié)構(gòu)組合為日期時(shí)間數(shù)據(jù)。(8)將前面從“銷售日期”中提取的年、月、日數(shù)據(jù)重新組合為日期數(shù)據(jù)。(9)從“銷售日期”中提取由年、月組成的數(shù)據(jù)?!救蝿?wù)實(shí)現(xiàn)】在JupyterNotebook開發(fā)環(huán)境中創(chuàng)建t8-01.ipynb,然后在單元格中編寫代碼與輸出對(duì)應(yīng)的結(jié)果。(1)讀取Excel文件orderInfo.xlsx中的數(shù)據(jù)代碼如下:importpandasaspdpath=r'data\orderInfo.xlsx'sales_df=pd.read_excel(path,usecols=['訂單完成時(shí)間','商品金額'])(2)查看列名、數(shù)據(jù)類型、記錄數(shù)量等相關(guān)信息代碼如下:sales_()輸出結(jié)果如下:<class'pandas.core.frame.DataFrame'>RangeIndex:9entries,0to8Datacolumns(total2columns):0訂單完成時(shí)間9non-nulldatetime64[ns]1商品金額9non-nullfloat64dtypes:datetime64[ns](1),float64(1)memoryusage:272.0bytes(3)單獨(dú)提取“訂單完成時(shí)間”列數(shù)據(jù)提取“訂單完成時(shí)間”列數(shù)據(jù)時(shí)指定格式符為“'Y-%m-%d”,將無效的數(shù)據(jù)解析為NaN。代碼如下:sales_df['銷售日期']=pd.to_datetime(sales_df['訂單完成時(shí)間'],format='%Y-%m-%d',errors='coerce')(4)查看數(shù)據(jù)集中各列數(shù)據(jù)的數(shù)據(jù)類型代碼如下:print(sales_df.dtypes)輸出結(jié)果如下:訂單完成時(shí)間datetime64[ns]商品金額float64銷售日期datetime64[ns]dtype:object(5)隨機(jī)獲取DataFrame中的5條銷售日期數(shù)據(jù)代碼如下:print(sales_df["銷售日期"].sample(5))輸出結(jié)果如下:52021-02-2518:21:0522021-02-2011:11:5762021-03-1215:12:2802021-03-0620:40:1082021-03-2210:11:26Name:銷售日期,dtype:datetime64[ns](6)從“銷售日期”列獲取日期數(shù)據(jù)分別從“銷售日期”列中獲取不包含時(shí)/分/秒的日期以及年、月、日、季度、星期數(shù)據(jù),并輸出這些數(shù)據(jù)。代碼如下:sales_df['日期']=sales_df['銷售日期'].dt.datesales_df['年']=sales_df['銷售日期'].dt.yearsales_df['月']=sales_df['銷售日期'].dt.monthsales_df['日']=sales_df['銷售日期'].dt.daysales_df['季度']=sales_df['銷售日期'].dt.quartersales_df['星期']=sales_df['銷售日期'].dt.weekdaysales_df輸出結(jié)果如下:(7)輸出日期和時(shí)間數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)類型代碼如下:sales_df.dtypes輸出結(jié)果如下:訂單完成時(shí)間atetime64[ns]商品金額float64銷售日期datetime64[ns]日期object年int64月int64日int64季度int64星期int64dtype:object(8)組合日期和時(shí)間數(shù)據(jù)將年份2021和2022、月份2和3、天數(shù)4和15、小時(shí)數(shù)2和3通過DataFrame結(jié)構(gòu)組合為日期和時(shí)間數(shù)據(jù)。代碼如下:importpandasaspddf1=pd.DataFrame({'year':[2021,2022],'month':[2,3],'day':[4,15],'hour':[2,3]})pd.to_datetime(df1)輸出結(jié)果如下:02021-02-0402:00:0012022-03-1503:00:00dtype:datetime64[ns]代碼如下:df1=pd.to_datetime(df1[['year','month','day']])df1輸出結(jié)果如下:02021-02-0412022-03-15dtype:datetime64[ns](9)將年、月、日數(shù)據(jù)組合為日期和時(shí)間數(shù)據(jù)將前面從“銷售日期”列中提取的年、月、日數(shù)據(jù)重新組合為日期和時(shí)間數(shù)據(jù)。代碼如下:df2=pd.DataFrame({'year':sales_df['年'],'month':sales_df['月'],'day':sales_df['日']})df3=pd.to_datetime(df2[['year','month','day']])df3輸出結(jié)果如下:02021-03-0612021-03-0522021-02-2032021-02-2042021-03-0452021-02-2562021-03-1272021-03-1282021-03-22dtype:datetime64[ns](10)從“銷售日期”列中提取由年、月組成的數(shù)據(jù)代碼如下:sales_df['year_month']=sales_df['銷售日期'].apply(lambdax:x.strftime('%Y-%m'))sales_df['year_month']輸出結(jié)果如下:02021-0312021-0322021-0232021-0242021-0352021-0262021-0372021-0382021-03Name:year_month,dtype:object【任務(wù)8-2】分析股票數(shù)據(jù)時(shí)應(yīng)用Pandas日期序列【任務(wù)描述】編寫程序?qū)崿F(xiàn)以下功能:(1)導(dǎo)入必要的模塊。(2)導(dǎo)入數(shù)據(jù)。(3)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。(4)繪制最高價(jià)與最低價(jià)趨勢(shì)圖。(5)獲取特征參數(shù)。(6)繪制股票開盤價(jià)的年度趨勢(shì)圖。(7繪制股票多維度的直方圖。(8)計(jì)算股票的每日收益并繪制圖形。(9)繪制收盤價(jià)對(duì)數(shù)變換后的序列趨勢(shì)圖。(10)繪制收盤價(jià)移動(dòng)平均和對(duì)數(shù)變換后的序列趨勢(shì)圖?!救蝿?wù)實(shí)現(xiàn)】在JupyterNotebook開發(fā)環(huán)境中創(chuàng)建t8-02.ipynb,然后在單元格中編寫代碼與輸出對(duì)應(yīng)的結(jié)果。1.導(dǎo)入模塊代碼如下:importpandasaspdimportnumpyasnpimportmatplotlib.pylabaspltplt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=False2.導(dǎo)入數(shù)據(jù)代碼如下:path=r".\data\stock-10.xlsx"data=pd.read_excel(path)3.?dāng)?shù)據(jù)預(yù)處理代碼如下:data=data.drop(columns="Unnamed:0")stock1=data.copy()stock1['date']=pd.to_datetime(stock1.date,format='%Y-%m-%d')stock1=stock1.set_index('date')stock1.head()輸出結(jié)果如下:4.繪制最高價(jià)與最低價(jià)趨勢(shì)圖(1)繪制采樣頻率為天的最高價(jià)與最低價(jià)趨勢(shì)圖代碼如下:stock1[['high','low']].plot(kind='line')plt.title('股票最高價(jià)與最低價(jià)')plt.show()輸出結(jié)果如圖8-2-1W所示。圖8-2-1采樣頻率為天的最高價(jià)與最低價(jià)趨勢(shì)圖(2)繪制采樣頻率為月的最高價(jià)與最低價(jià)趨勢(shì)圖代碼如下:stock1.resample('M').median()[['high','low']].plot(kind='line')plt.title('股票最高價(jià)與最低價(jià)')plt.show()輸出結(jié)果如圖8-2-2所示。圖8-2-2采樣頻率為月的最高價(jià)與最低價(jià)趨勢(shì)圖(3)繪制采樣頻率為年的最高價(jià)與最低價(jià)趨勢(shì)圖代碼如下:stock1.resample('Y').median()[['high','low']].plot(kind='line')plt.title('股票最高價(jià)與最低價(jià)')plt.show()輸出結(jié)果如圖8-2-3所示。圖8-2-3采樣頻率為年的最高價(jià)與最低價(jià)趨勢(shì)圖5.獲取特征參數(shù)(1)計(jì)算數(shù)據(jù)集中最早的日期和最晚的日期的間隔天數(shù)代碼如下:(stock1.index.max()-stock1.index.min()).days輸出結(jié)果如下:729(2)統(tǒng)計(jì)數(shù)據(jù)總月數(shù)代碼如下:stock_months=stock1.resample('BM').mean()len(stock_months.index)輸出結(jié)果如下:246.繪制股票開盤價(jià)的年度趨勢(shì)圖代碼如下:stock_open=stock1['open'].plot(title="股票開盤價(jià)")fig=stock_open.get_figure()fig.set_size_inches(8,6)輸出結(jié)果如圖8-2-4所示。圖8-2-4股票開盤價(jià)的年度趨勢(shì)圖7.繪制股票多維度的直方圖代碼如下:stock1[['high','low','open','close']].hist(figsize=(12,8))輸出結(jié)果如圖8-2-5所示。圖8-2-5股票多維度的直方圖8.計(jì)算股票的每日收益并繪制圖形代碼如下:stock1['DailyReturn']=stock1['close'].pct_change()plt.figure(figsize=(15,8))stock1['DailyReturn'].plot(legend=True,linestyle='--',marker='o',title='股票的每日收益')plt.show()輸出結(jié)果如圖8-2-6所示。圖8-2-6股票的每日收益9.繪制收盤價(jià)對(duì)數(shù)變換后的序列趨勢(shì)圖代碼如下:close1=stock1["close"]close_log=np.log(close1)close_log.plot()plt.show()輸出結(jié)果如圖8-2-7所示。圖8-2-7收盤價(jià)對(duì)數(shù)變換

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論