轉(zhuǎn)換與處理時間序列數(shù)據(jù)_第1頁
轉(zhuǎn)換與處理時間序列數(shù)據(jù)_第2頁
轉(zhuǎn)換與處理時間序列數(shù)據(jù)_第3頁
轉(zhuǎn)換與處理時間序列數(shù)據(jù)_第4頁
轉(zhuǎn)換與處理時間序列數(shù)據(jù)_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)據(jù)挖掘技術(shù)與應用1掌握DataFrame的常用操作目錄讀寫不同數(shù)據(jù)源的數(shù)據(jù)2轉(zhuǎn)換與處理時間序列數(shù)據(jù)3在多數(shù)情況下,對時間類型數(shù)據(jù)進行分析的前提就是將原本為字符串的時間轉(zhuǎn)換為標準時間類型。pandas繼承了NumPy庫和datetime庫的時間相關(guān)模塊,提供了6種時間相關(guān)的類。轉(zhuǎn)換字符串時間為標準時間pandas時間相關(guān)的類類名稱說明Timestamp最基礎(chǔ)的時間類。表示某個時間點。在絕大多數(shù)的場景中的時間數(shù)據(jù)都是Timestamp形式的時間。Period表示單個時間跨度,或者某個時間段,例如某一天,某一小時等。Timedelta表示不同單位的時間,例如1天,1.5小時,3分鐘,4秒等,而非具體的某個時間段。DatetimeIndex一組Timestamp構(gòu)成的Index,可以用來作為Series或者DataFrame的索引。PeriodtimeIndex一組Period構(gòu)成的Index,可以用來作為Series或者DataFrame的索引。TimedeltaIndex一組Timedelta構(gòu)成的Index,可以用來作為Series或者DataFrame的索引。其中Timestamp作為時間類中最基礎(chǔ)的,也是最為常用的。在多數(shù)情況下,時間相關(guān)的字符串都會轉(zhuǎn)換成為Timestamp。pandas提供了to_datetime函數(shù),能夠?qū)崿F(xiàn)這一目標。值得注意的是,Timestamp類型時間是有限制的。轉(zhuǎn)換字符串時間為標準時間Timestamp類型除了將數(shù)據(jù)字原始DataFrame中直接轉(zhuǎn)換為Timestamp格式外,還可以將數(shù)據(jù)單獨提取出來將其轉(zhuǎn)換為DatetimeIndex或者PeriodIndex。轉(zhuǎn)換為PeriodIndex的時候需要注意,需要通過freq參數(shù)指定時間間隔,常用的時間間隔有Y為年,M為月,D為日,H為小時,T為分鐘,S為秒。兩個函數(shù)可以用來轉(zhuǎn)換數(shù)據(jù)還可以用來創(chuàng)建時間序列數(shù)據(jù),其參數(shù)非常類似。轉(zhuǎn)換字符串時間為標準時間DatetimeIndex與PeriodIndex函數(shù)DatetimeIndex和PeriodIndex兩者區(qū)別在日常使用的過程中相對較小,其中DatetimeIndex是用來指代一系列時間點的一種數(shù)據(jù)結(jié)構(gòu),而PeriodIndex則是用來指代一系列時間段的數(shù)據(jù)結(jié)構(gòu)。轉(zhuǎn)換字符串時間為標準時間DatetimeIndex與PeriodIndex函數(shù)及其參數(shù)說明參數(shù)名稱說明data接收array。表示DatetimeIndex的值。無默認。freq接收string。表示時間的間隔頻率。無默認。start接收string。表示生成規(guī)則時間數(shù)據(jù)的起始點。無默認。periods表示需要生成的周期數(shù)目。無默認。end接收string。表示生成規(guī)則時間數(shù)據(jù)的終結(jié)點。無默認。tz接收timezone。表示數(shù)據(jù)的時區(qū)。默認為None。name接收int,string。默認為空。指定DatetimeIndex的名字。在多數(shù)涉及時間相關(guān)的數(shù)據(jù)處理,統(tǒng)計分析的過程中,需要提取時間中的年份,月份等數(shù)據(jù)。使用對應的Timestamp類屬性就能夠?qū)崿F(xiàn)這一目的。結(jié)合Python列表推導式,可以實現(xiàn)對DataFrame某一列時間信息數(shù)據(jù)的提取。提取時間序列數(shù)據(jù)信息Timestamp類常用屬性屬性名稱說明屬性名稱說明year年week一年中第幾周month月quarter季節(jié)day日weekofyear一年中第幾周hour小時dayofyear一年中的第幾天minute分鐘dayofweek一周第幾天second秒weekday一周第幾天date日期weekday_name星期名稱time時間is_leap_year是否閏年Timedelta是時間相關(guān)的類中的一個異類,不僅能夠使用正數(shù),還能夠使用負數(shù)表示單位時間,例如1秒,2分鐘,3小時等。使用Timedelta類,配合常規(guī)的時間相關(guān)類能夠輕松實現(xiàn)時間的算術(shù)運算。目前Timedelta函數(shù)中時間周期中沒有年和月。所有周期名稱,對應單位及其說明如下表所示。加減時間數(shù)據(jù)Timedelta類周期名稱單位說明周期名稱單位說明weeks無星期secondss秒daysD天millisecondsms毫秒hoursh小時microsecondsus微妙minutesm分nanosecondsns納秒使用Timedelta

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論