版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
時間序列預(yù)處理第一頁,共五十一頁,2022年,8月28日時間序列之概念(1)從統(tǒng)計意義上,將某一指標(biāo)在不同時間上的不同數(shù)值,按照時間的先后次序排列而成的數(shù)列。各種偶然因素的影響,表現(xiàn)出某種隨機(jī)性,存在統(tǒng)計上的依賴關(guān)系。(2)從系統(tǒng)意義上,某一系統(tǒng)在不同時間(地點(diǎn),條件等)的響應(yīng)。(3)從數(shù)學(xué)意義上,對某一過程中的某一個變量或一組變量X(t)進(jìn)行觀察測量,在一系列時刻t1t2t3等得到的離散有序數(shù)集合X(t1),X(t2),稱為離散時間序列。2第二頁,共五十一頁,2022年,8月28日第二章時間序列的預(yù)處理第三頁,共五十一頁,2022年,8月28日本章結(jié)構(gòu)時間序列的建立(補(bǔ)充)平穩(wěn)性檢驗(yàn)純隨機(jī)性檢驗(yàn)4第四頁,共五十一頁,2022年,8月28日補(bǔ)充:時間序列的建立
要分析時間序列,就必須建立一個時間序列。一般來說,研究者是運(yùn)用記錄儀或通過觀察測量來獲得所研究系統(tǒng)的真實(shí)有限的數(shù)據(jù)集合。有時也可以直接用二手資料。但是,不論是通過哪一種途徑獲得的時間序列,在進(jìn)行分析處理前,必須對所依據(jù)的資料進(jìn)行認(rèn)真地檢查、整理,有時還需要進(jìn)行適當(dāng)?shù)念A(yù)處理。我們把獲取時間序列以及對其進(jìn)行檢查、整理和預(yù)處理等工作,稱為時間序列的建立。5第五頁,共五十一頁,2022年,8月28日一、時間序列數(shù)據(jù)的采集1采樣:按照一定的時間間隔對所研究系統(tǒng)的響應(yīng)進(jìn)行記錄和觀察。
2采樣間隔(時間頻率):記錄和觀察的時間間隔。一般采樣是等間隔的,比如年、月、日等。時間的頻率。
3采樣原則:關(guān)鍵采樣間隔的選擇,希望所采到的樣本沒有信息損失,也沒有信息冗余。6第六頁,共五十一頁,2022年,8月28日(一)離群點(diǎn)(outier):指在一個時間序列里,遠(yuǎn)離序列一般水平的極端大值和極端小值。也稱奇異值或者野值。
(二)離群點(diǎn)產(chǎn)生的原因1、采樣中的誤差。2、被研究現(xiàn)象本身由于受各種偶然非正常的因素影響而引起的。
(三)離群點(diǎn)的主要影響
1、影響模型的擬合精度,甚至得到虛假信息;被認(rèn)為是一個“壞值”。
2、同時可以提供重要信息。如關(guān)于系統(tǒng)穩(wěn)定性和靈敏性等信息。二、離群點(diǎn)(outiler)的檢驗(yàn)與處理7第七頁,共五十一頁,2022年,8月28日(四)離群點(diǎn)的分類
8第八頁,共五十一頁,2022年,8月28日(四)離群點(diǎn)的分類9第九頁,共五十一頁,2022年,8月28日(五)離群點(diǎn)的檢驗(yàn)
1、確定離群點(diǎn)范圍,如果某一時刻數(shù)值超出該范圍,則說明該點(diǎn)是離群點(diǎn)。
2、對數(shù)據(jù)進(jìn)行模型分析,然后根據(jù)擬合模型后的殘差序列計算特定的統(tǒng)計量,測出離群點(diǎn)及其類型,并用相應(yīng)的模型修正?!丛诮y(tǒng)計分析中如何識別極端值〉
《江蘇統(tǒng)計》1999、11郭莉
1、四分展步法
2、3法
3、莖葉圖法10第十頁,共五十一頁,2022年,8月28日三、缺損值(Missingvalue)的補(bǔ)足
缺損值:在采集時間序列時,由于種種原因,引起在某些觀測點(diǎn)上未能記錄下來觀測值。缺損值的影響:破壞了系統(tǒng)運(yùn)行的連續(xù)性,違背了時間序列“順序的重要性”的原則。方法:增長量推算法、發(fā)展速度推算法比例推算法、平滑法、插值估算法
11第十一頁,共五十一頁,2022年,8月28日在SPSS中,缺失值填充方法:1、seriesmean全體序列的均數(shù),默認(rèn)值2、meanofnearbypoints相鄰若干點(diǎn)的均數(shù)3、medianofnearbypoints:相鄰若干點(diǎn)的中位數(shù)4、linearinterpolation:線性內(nèi)插,缺失值相鄰兩點(diǎn)的均數(shù),但缺失值在序列的最前/最后,則無法被填充。
5、lineartrendatpoint.該點(diǎn)的線性趨勢,將記錄號作為自變量,序列值作為應(yīng)變量回歸,求得該點(diǎn)的估計值。12第十二頁,共五十一頁,2022年,8月28日最后對序列中的每一個數(shù)據(jù)的指標(biāo)口徑、計算范圍、計算方法、計量單位等進(jìn)行認(rèn)真檢查,對經(jīng)濟(jì)時間序列來說,還必須檢查計算價格等方面是否一致。13第十三頁,共五十一頁,2022年,8月28日四時間序列建立的實(shí)例1確定時間序列的時間間隔
2確定指標(biāo)計算范圍
3確定計算方法
4確定指標(biāo)口徑
5檢查數(shù)據(jù)
6調(diào)整數(shù)據(jù)14第十四頁,共五十一頁,2022年,8月28日時間序列的預(yù)處理時間序列平穩(wěn)性檢驗(yàn)平穩(wěn)性時間序列非平穩(wěn)性時間序列純隨機(jī)性檢驗(yàn)白噪聲序列(純隨機(jī)序列)平穩(wěn)非白噪聲序列無規(guī)律可循,分析結(jié)束ARMA模型1.確定性分析2.隨機(jī)性分析(ARIMA模型)15第十五頁,共五十一頁,2022年,8月28日2.1平穩(wěn)性檢驗(yàn)
特征統(tǒng)計量平穩(wěn)時間序列的定義平穩(wěn)時間序列的統(tǒng)計性質(zhì)平穩(wěn)時間序列的意義平穩(wěn)性的檢驗(yàn)
16第十六頁,共五十一頁,2022年,8月28日概率分布概率分布的意義隨機(jī)變量族的統(tǒng)計特性完全由它們的聯(lián)合分布函數(shù)或聯(lián)合密度函數(shù)決定。
時間序列概率分布族的定義實(shí)際應(yīng)用的局限性17第十七頁,共五十一頁,2022年,8月28日特征統(tǒng)計量均值
方差自協(xié)方差自相關(guān)系數(shù)18第十八頁,共五十一頁,2022年,8月28日平穩(wěn)時間序列的定義嚴(yán)平穩(wěn)嚴(yán)平穩(wěn)是一種條件比較苛刻的平穩(wěn)性定義,它認(rèn)為只有當(dāng)序列所有的統(tǒng)計性質(zhì)都不會隨著時間的推移而發(fā)生變化時,該序列才能被認(rèn)為平穩(wěn)。寬平穩(wěn)寬平穩(wěn)是使用序列的特征統(tǒng)計量來定義的一種平穩(wěn)性。它認(rèn)為序列的統(tǒng)計性質(zhì)主要由它的低階矩決定,所以只要保證序列低階矩平穩(wěn)(二階),就能保證序列的主要性質(zhì)近似穩(wěn)定。
19第十九頁,共五十一頁,2022年,8月28日平穩(wěn)時間序列的統(tǒng)計定義
滿足如下條件的序列稱為嚴(yán)平穩(wěn)序列滿足如下條件的序列稱為寬平穩(wěn)序列20第二十頁,共五十一頁,2022年,8月28日嚴(yán)平穩(wěn)與寬平穩(wěn)的關(guān)系一般關(guān)系嚴(yán)平穩(wěn)條件比寬平穩(wěn)條件苛刻,通常情況下,嚴(yán)平穩(wěn)(低階矩存在)能推出寬平穩(wěn)成立,而寬平穩(wěn)序列不能反推嚴(yán)平穩(wěn)成立特例不存在低階矩的嚴(yán)平穩(wěn)序列不滿足寬平穩(wěn)條件,例如服從柯西分布的嚴(yán)平穩(wěn)序列就不是寬平穩(wěn)序列當(dāng)序列服從多元正態(tài)分布時,寬平穩(wěn)可以推出嚴(yán)平穩(wěn)21第二十一頁,共五十一頁,2022年,8月28日(1)嚴(yán)平穩(wěn)不一定寬平穩(wěn)。(2)寬平穩(wěn)不一定嚴(yán)平穩(wěn)。(3)嚴(yán)平穩(wěn)+二階矩存在=>寬平穩(wěn)。但反過來一般不成立。(4)對于正態(tài)過程來說,有嚴(yán)平穩(wěn)<=>寬平穩(wěn)22第二十二頁,共五十一頁,2022年,8月28日平穩(wěn)時間序列的統(tǒng)計性質(zhì)
常數(shù)均值
自協(xié)方差函數(shù)和自相關(guān)函數(shù)只依賴于時間的平移長度而與時間的起止點(diǎn)無關(guān)
延遲k自協(xié)方差函數(shù)
延遲k自相關(guān)系數(shù)23第二十三頁,共五十一頁,2022年,8月28日自相關(guān)系數(shù)的性質(zhì)規(guī)范性
對稱性
非負(fù)定性
非唯一性
24第二十四頁,共五十一頁,2022年,8月28日平穩(wěn)時間序列的意義
時間序列數(shù)據(jù)結(jié)構(gòu)的特殊性可列多個隨機(jī)變量,而每個變量只有一個樣本觀察值平穩(wěn)性的重大意義極大地減少了隨機(jī)變量的個數(shù),并增加了待估變量的樣本容量極大地簡化了時序分析的難度,同時也提高了對特征統(tǒng)計量的估計精度25第二十五頁,共五十一頁,2022年,8月28日平穩(wěn)性檢驗(yàn)方法(1)通過時間序列的趨勢圖來判斷(2)通過自相關(guān)函數(shù)(ACF)判斷特征根檢驗(yàn)法單位根檢驗(yàn)法非參數(shù)檢驗(yàn)法圖檢驗(yàn)方法返回本節(jié)首頁下一頁上一頁26第二十六頁,共五十一頁,2022年,8月28日圖檢驗(yàn)(特點(diǎn))這種方法是通過觀察時間序列的趨勢圖和自相關(guān)圖來判斷時間序列是否存在趨勢性或周期性。優(yōu)點(diǎn):簡便、直觀。對于那些明顯為非平穩(wěn)的時間序列,可以采用這種方法。缺點(diǎn):對于一般的時間序列是否平穩(wěn),不易用這種方法判斷出來。27第二十七頁,共五十一頁,2022年,8月28日(1)時序圖檢驗(yàn)(判斷準(zhǔn)則)根據(jù)平穩(wěn)時間序列均值、方差為常數(shù)的性質(zhì),平穩(wěn)序列的時序圖應(yīng)該顯示出該序列始終在一個常數(shù)值附近隨機(jī)波動,而且波動的范圍有界、無明顯趨勢及無周期特征28第二十八頁,共五十一頁,2022年,8月28日(2)自相關(guān)圖檢驗(yàn)(判斷準(zhǔn)則)平穩(wěn)序列通常具有短期相關(guān)性。該性質(zhì)用自相關(guān)系數(shù)來描述就是隨著延遲期數(shù)的增加,平穩(wěn)序列的自相關(guān)系數(shù)會很快地衰減向零。若時間序列的自相關(guān)函數(shù)在k>3時都落入置信區(qū)間,且逐漸趨于零,則該時間序列具有平穩(wěn)性;若時間序列的自相關(guān)函數(shù)更多地落在置信區(qū)間外面,則該時間序列就不具有平穩(wěn)性。29第二十九頁,共五十一頁,2022年,8月28日若序列無趨勢,但是具有季節(jié)性,那末對于按月采集的數(shù)據(jù),時滯12,24,36……的自相關(guān)系數(shù)達(dá)到最大(如果數(shù)據(jù)是按季度采集,則最大自相關(guān)系數(shù)出現(xiàn)在4,8,12,……),并且隨著時滯的增加變得較小。30第三十頁,共五十一頁,2022年,8月28日若序列是有趨勢的,且具有季節(jié)性,其自相關(guān)函數(shù)特性類似于有趨勢序列,但它們是擺動的,對于按月數(shù)據(jù),在時滯12,24,36,……等處具有峰態(tài);如果時間序列數(shù)據(jù)是按季節(jié)的,則峰出現(xiàn)在時滯4,8,12,……等處。31第三十一頁,共五十一頁,2022年,8月28日例題例2.1檢驗(yàn)1964年——1999年中國紗年產(chǎn)量序列的平穩(wěn)性例2.2檢驗(yàn)1962年1月——1975年12月平均每頭奶牛月產(chǎn)奶量序列的平穩(wěn)性例2.3檢驗(yàn)1949年——1998年北京市每年最高氣溫序列的平穩(wěn)性32第三十二頁,共五十一頁,2022年,8月28日例2.1時序圖33第三十三頁,共五十一頁,2022年,8月28日例2.1自相關(guān)圖34第三十四頁,共五十一頁,2022年,8月28日例2.2時序圖35第三十五頁,共五十一頁,2022年,8月28日例2.2自相關(guān)圖36第三十六頁,共五十一頁,2022年,8月28日例2.3時序圖37第三十七頁,共五十一頁,2022年,8月28日例2.3自相關(guān)圖38第三十八頁,共五十一頁,2022年,8月28日2.2純隨機(jī)性檢驗(yàn)
純隨機(jī)序列的定義純隨機(jī)性的性質(zhì)純隨機(jī)性檢驗(yàn)39第三十九頁,共五十一頁,2022年,8月28日純隨機(jī)序列的定義純隨機(jī)序列也稱為白噪聲序列,它滿足如下兩條性質(zhì)
40第四十頁,共五十一頁,2022年,8月28日標(biāo)準(zhǔn)正態(tài)白噪聲序列時序圖
41第四十一頁,共五十一頁,2022年,8月28日白噪聲序列的性質(zhì)
純隨機(jī)性
各序列值之間沒有任何相關(guān)關(guān)系,即為“沒有記憶”的序列
意義:純隨機(jī)性是判斷相關(guān)信息是否提取充分的一個判別標(biāo)準(zhǔn)方差齊性
序列中每個變量的方差都相等根據(jù)馬爾可夫定理,只有方差齊性假定成立時,用最小二乘法得到的未知參數(shù)估計值才是準(zhǔn)確的、有效的42第四十二頁,共五十一頁,2022年,8月28日純隨機(jī)性檢驗(yàn)
檢驗(yàn)原理假設(shè)條件檢驗(yàn)統(tǒng)計量
判別原則43第四十三頁,共五十一頁,2022年,8月28日Barlett定理
如果一個時間序列是純隨機(jī)的,得到一個觀察期數(shù)為的觀察序列,那么該序列的延遲非零期的樣本自相關(guān)系數(shù)將近似服從均值為零,方差為序列觀察期數(shù)倒數(shù)的正態(tài)分布44第四十四頁,共五十一頁,2022年,8月28日假設(shè)條件原假設(shè):延遲期數(shù)小于或等于期的序列值之間相互獨(dú)立備擇假設(shè):延遲期數(shù)小于或等于期的序列值之間有相關(guān)性
45第四十五頁,共五十一頁,2022年,8月28日檢驗(yàn)統(tǒng)計量Q統(tǒng)計量:適合于大樣本情況LB統(tǒng)計量:46第四十六頁,共五十一頁,2022年,8月28日判別原則拒絕原假設(shè)當(dāng)檢驗(yàn)統(tǒng)計量大于分位點(diǎn),或該統(tǒng)計量的P值小于時,則可以以的置信水平拒絕原假設(shè),認(rèn)為該序列為非白噪聲序列接受原假設(shè)當(dāng)檢驗(yàn)統(tǒng)計量小于分位點(diǎn),或該統(tǒng)計量的P值大于時,則認(rèn)為在的置信水平下無法拒絕原假設(shè),即不能顯著拒絕序列為純隨機(jī)序列的假定
47第四十七頁,共五十一頁,2022年,8月28日例2.4:
標(biāo)準(zhǔn)正態(tài)白
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年九江理工職業(yè)學(xué)院馬克思主義基本原理概論期末考試模擬題帶答案解析(奪冠)
- 吶喊中的要課件
- 2024年雞東縣幼兒園教師招教考試備考題庫及答案解析(必刷)
- 2025年中國刑事警察學(xué)院馬克思主義基本原理概論期末考試模擬題帶答案解析(必刷)
- 2025年饒陽縣招教考試備考題庫及答案解析(必刷)
- 2024年盤縣招教考試備考題庫及答案解析(奪冠)
- 2025年長春職業(yè)技術(shù)大學(xué)馬克思主義基本原理概論期末考試模擬題附答案解析(必刷)
- 2025年濮陽職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試題庫帶答案解析
- 2025年湘中幼兒師范高等??茖W(xué)校單招職業(yè)適應(yīng)性考試題庫帶答案解析
- 2025年武漢理工大學(xué)馬克思主義基本原理概論期末考試模擬題帶答案解析(必刷)
- 山西省金科新未來2024-2025學(xué)年高一上學(xué)期期末考試化學(xué)試題(含答案)
- 電氣檢測安全報告
- 第四屆全國儀器儀表行業(yè)職業(yè)技能競賽-無人機(jī)裝調(diào)檢修工(儀器儀表檢測)理論考試題庫(含答案)
- 國家職業(yè)技術(shù)技能標(biāo)準(zhǔn) 4-10-01-05 養(yǎng)老護(hù)理員 人社廳發(fā)201992號
- 急性梗阻性化膿性膽管炎護(hù)理
- 2024深海礦產(chǎn)資源開采系統(tǒng)技術(shù)指南
- 2022通達(dá)經(jīng)營性物業(yè)貸調(diào)查報告
- 立式氣液分離器計算
- 財務(wù)每日工作匯報表格
- 2022-2023學(xué)年廣東省佛山市南海區(qū)、三水區(qū)九年級(上)期末數(shù)學(xué)試卷含解析
- 版權(quán)登記代理委托書
評論
0/150
提交評論