時間序列分析課件(PPT 82頁).ppt_第1頁
時間序列分析課件(PPT 82頁).ppt_第2頁
時間序列分析課件(PPT 82頁).ppt_第3頁
時間序列分析課件(PPT 82頁).ppt_第4頁
時間序列分析課件(PPT 82頁).ppt_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1 時間序列分析 2 橫截面數(shù)據(jù)時間序列數(shù)據(jù) 人們對統(tǒng)計數(shù)據(jù)往往可以根據(jù)其特點從兩個方面來切入 以簡化分析過程 一個是研究所謂橫截面 crosssection 數(shù)據(jù) 也就是對大體上同時 或者和時間無關(guān)的不同對象的觀測值組成的數(shù)據(jù) 另一個稱為時間序列 timeseries 也就是由對象在不同時間的觀測值形成的數(shù)據(jù) 前面討論的模型多是和橫截面數(shù)據(jù)有關(guān) 這里將討論時間序列的分析 我們將不討論更加復(fù)雜的包含這兩方面的數(shù)據(jù) 3 時間序列和回歸 時間序列分析也是一種回歸 回歸分析的目的是建立因變量和自變量之間關(guān)系的模型 并且可以用自變量來對因變量進行預(yù)測 通常線性回歸分析因變量的觀測值假定是互相獨立并且有同樣分布 而時間序列的最大特點是觀測值并不獨立 時間序列的一個目的是用變量過去的觀測值來預(yù)測同一變量的未來值 也就是說 時間序列的因變量為變量未來的可能值 而用來預(yù)測的自變量中就包含該變量的一系列歷史觀測值 當(dāng)然時間序列的自變量也可能包含隨著時間度量的獨立變量 4 例15 1 數(shù)據(jù) Tax txt Tax sav 某地從1995年1月到2005年7月的稅收 單位 萬元 該數(shù)據(jù)有按照時間順序的按月記錄 共127個觀測值 圖15 1就是由該數(shù)據(jù)得到的一個時間序列圖 5 例15 1 數(shù)據(jù) Tax txt Tax sav 從這個點圖可以看出 總的趨勢是增長的 但增長并不是單調(diào)上升的 有漲有落 大體上看 這種升降不是雜亂無章的 和季節(jié)或月份的周期有關(guān)系 當(dāng)然 除了增長的趨勢和季節(jié)影響之外 還有些無規(guī)律的隨機因素的作用 這個只有一種隨著時間變化的變量 稅收 的序列一般稱為純粹時間序列 puretimeseries 下面將通過該例子對純粹時間序列進行介紹 6 時間序列的組成部分 從該例可以看出 該時間序列可以有三部分組成 趨勢 trend 季節(jié) seasonal 成分和無法用趨勢和季節(jié)模式解釋的隨機干擾 disturbance 例中數(shù)據(jù)的稅收就就可以用這三個成分疊加而成的模型來描述 一般的時間序列還可能有循環(huán)或波動 Cyclic orfluctuations 成分 循環(huán)模式和有規(guī)律的季節(jié)模式不同 周期長短不一定固定 比如經(jīng)濟危機周期 金融危機周期等等 7 時間序列的組成部分 一個時間序列可能有趨勢 季節(jié) 循環(huán)這三個成分中的某些或全部再加上隨機成分 因此 如果要想對一個時間序列本身進行較深入的研究 把序列的這些成分分解出來 或者把它們過慮掉則會有很大的幫助 如果要進行預(yù)測 則最好把模型中的與這些成分有關(guān)的參數(shù)估計出來 就例中的時間序列的分解 通過SPSS軟件 可以很輕而易舉地得到該序列的趨勢 季節(jié)和誤差成分 8 去掉季節(jié)成分 只有趨勢和誤差成分的例15 1的時間序列 9 例15 1的時間序列分解出來的純趨勢成分和純季節(jié)成分兩條曲線 10 例15 1的時間序列分解出來的純趨勢成分和純誤差成分兩條曲線 11 指數(shù)平滑 如果我們不僅僅滿足于分解現(xiàn)有的時間序列 而且想要對未來進行預(yù)測 就需要建立模型 首先 這里介紹比較簡單的指數(shù)平滑 exponentialsmoothing 指數(shù)平滑只能用于純粹時間序列的情況 而不能用于含有獨立變量時間序列的因果關(guān)系的研究 指數(shù)平滑的原理為 當(dāng)利用過去觀測值的加權(quán)平均來預(yù)測未來的觀測值時 這個過程稱為平滑 離得越近的觀測值要給以更多的權(quán) 而 指數(shù) 意味著 按照已有觀測值 老 的程度 其上的權(quán)數(shù)按指數(shù)速度遞減 12 指數(shù)平滑 以簡單的沒有趨勢和沒有季節(jié)成分的純粹時間序列為例 指數(shù)平滑在數(shù)學(xué)上這實際上是一個幾何級數(shù) 這時 如果用Yt表示在t時間的平滑后的數(shù)據(jù) 或預(yù)測值 而用X1 X2 Xt表示原始的時間序列 那么指數(shù)平滑模型為 或者 等價地 這里的系數(shù)為幾何級數(shù) 因此稱之為 幾何平滑 比使人不解的 指數(shù)平滑 似乎更有道理 13 指數(shù)平滑 自然 這種在簡單情況下導(dǎo)出的公式 如上面的公式 無法應(yīng)對具有各種成分的復(fù)雜情況 后面將給出各種實用的指數(shù)平滑模型的公式 根據(jù)數(shù)據(jù) 可以得到這些模型參數(shù)的估計以及對未來的預(yù)測 在和我們例子有關(guān)的指數(shù)平滑模型中 需要估計12個季節(jié)指標(biāo)和三個參數(shù) 包含前面公式權(quán)重中的a 和趨勢有關(guān)的g 以及和季節(jié)指標(biāo)有關(guān)的d 在簡單的選項之后 SPSS通過指數(shù)平滑產(chǎn)生了對2005年6月后一年的預(yù)測 下圖為原始的時間序列和預(yù)測的時間序列 光滑后的 下面為誤差 14 15 例15 1時間序列數(shù)據(jù)的指數(shù)平滑和對未來的預(yù)測 16 x scan d booktj1 data tax txt tax ts x frequency 12 start c 1995 1 ts plot tax ylab Tax plot x1 ylab Sales a stl tax period 分解a time series 分解結(jié)果 三列 ts plot a time series 1 3 b HoltWinters tax beta 0 Holt Winters濾波指數(shù)平滑predict b n ahead 12 對未來12個月預(yù)測pacf tax acf tax w arima tax c 0 1 1 seasonal list order c 1 2 1 period 12 predict w n ahead 12 w residuals 殘差acf w resi pacf w resi w coef 估計的模型系數(shù)w aic aic值 17 Box Jenkins方法 ARIMA模型 如果要對比較復(fù)雜的純粹時間序列進行細(xì)致的分析 指數(shù)平滑往往是無法滿足要求的 而若想對有獨立變量的時間序列進行預(yù)測 指數(shù)平滑更是無能為力 于是需要更加強有力的模型 這就是下面要介紹的Box JenkinsARIMA模型 數(shù)學(xué)上 指數(shù)平滑僅僅是ARIMA模型的特例 18 ARIMA模型 AR模型 比指數(shù)平滑要有用和精細(xì)得多的模型是Box Jenkins引入的ARIMA模型 或稱為整合自回歸移動平均模型 ARIMA為AutoregressiveIntegratedMovingAverage一些關(guān)鍵字母的縮寫 該模型的基礎(chǔ)是自回歸和移動平均模型或ARMA AutoregressiveandMovingAverage 模型 它由兩個特殊模型發(fā)展而成 一個特例是自回歸模型或AR Autoregressive 模型 假定時間序列用X1 X2 Xt表示 則一個純粹的AR p 模型意味著變量的一個觀測值由其以前的p個觀測值的線性組合加上隨機誤差項at 該誤差為獨立無關(guān)的 而得 這看上去象自己對自己回歸一樣 所以稱為自回歸模型 它牽涉到過去p個觀測值 相關(guān)的觀測值間隔最多為p個 19 ARIMA模型 MA模型 ARMA模型的另一個特例為移動平均模型或MA MovingAverage 模型 一個純粹的MA q 模型意味著變量的一個觀測值由目前的和先前的q個隨機誤差的線性的組合 由于右邊系數(shù)的和不為1 q甚至不一定是正數(shù) 因此叫做 移動平均 不如叫做 移動線性組合 更確切 雖然行家已經(jīng)習(xí)慣于叫 平均 了 但初學(xué)者還是因此可能和初等平滑方法中的什么 三點平均 之類的術(shù)語混淆 20 ARIMA模型 ARMA模型 顯然ARMA p q 模型應(yīng)該為AR p 模型和MA q 模型的組合了 顯然ARMA p 0 模型就是AR p 模型 而ARMA 0 q 模型就是MA q 模型 這個一般模型有p q個參數(shù)要估計 看起來很繁瑣 但利用計算機軟件則是常規(guī)運算 并不復(fù)雜 21 ARIMA模型 平穩(wěn)性和可逆性 但是要想ARMA p q 模型有意義則要求時間序列滿足平穩(wěn)性 stationarity 和可逆性 invertibility 的條件 這意味著序列均值不隨著時間增加或減少 序列的方差不隨時間變化 另外序列本身相關(guān)的模式不改變等 一個實際的時間序列是否滿足這些條件是無法在數(shù)學(xué)上驗證的 這沒有關(guān)系 但可以從下面要介紹的時間序列的自相關(guān)函數(shù)和偏相關(guān)函數(shù)圖中可以識別出來 一般人們所關(guān)注的的有趨勢和季節(jié) 循環(huán)成分的時間序列都不是平穩(wěn)的 這時就需要對時間序列進行差分 difference 來消除這些使序列不平穩(wěn)的成分 而使其變成平穩(wěn)的時間序列 并估計ARMA模型 估計之后再轉(zhuǎn)變該模型 使之適應(yīng)于差分之前的序列 這個過程和差分相反 所以稱為整合的 integrated ARMA模型 得到的模型于是稱為ARIMA模型 22 ARIMA模型 差分 差分是什么意思呢 差分可以是每一個觀測值減去其前面的一個觀測值 即Xt Xt 1 這樣 如果時間序列有一個斜率不變的趨勢 經(jīng)過這樣的差分之后 該趨勢就會被消除了 當(dāng)然差分也可以是每一個觀測值減去其前面任意間隔的一個觀測值 比如存在周期固定為s的季節(jié)成分 那么相隔s的差分為Xt Xt s就可以把這種以s為周期的季節(jié)成分消除 對于復(fù)雜情況 可能要進行多次差分 才能夠使得變換后的時間序列平穩(wěn) 23 ARMA模型的識別和估計 上面引進了一些必要的術(shù)語和概念 下面就如何識別模型進行說明 要想擬合ARIMA模型 必須先把它利用差分變成ARMA p q 模型 并確定是否平穩(wěn) 然后確定參數(shù)p q 現(xiàn)在利用一個例子來說明如何識別一個AR p 模型和參數(shù)p 由此MA q 及ARMA p q 模型模型可用類似的方法來識別 24 ARMA模型的識別和估計 根據(jù)ARMA p q 模型的定義 它的參數(shù)p q和自相關(guān)函數(shù) acf autocorrelationsfunction 及偏自相關(guān)函數(shù) pacf partialautocorrelationsfunction 有關(guān) 自相關(guān)函數(shù)描述觀測值和前面的觀測值的相關(guān)系數(shù) 而偏自相關(guān)函數(shù)為在給定中間觀測值的條件下觀測值和前面某間隔的觀測值的相關(guān)系數(shù) 這里當(dāng)然不打算討論這兩個概念的細(xì)節(jié) 引進這兩個概念主要是為了能夠了解如何通過研究關(guān)于這兩個函數(shù)的acf和pacf圖來識別模型 25 例 數(shù)據(jù)AR2 sav為了直觀地理解上面的概念 下面利用一個數(shù)據(jù)例子來描述 26 例 數(shù)據(jù)AR2 sav 拖尾和截尾先來看該時間序列的acf 左 和pacf圖 右 左邊的acf條形圖是衰減的指數(shù)型的波動 這種圖形稱為拖尾 而右邊的pacf條形圖是在第二個條 p 2 之后就很小 而且沒有什么模式 這種圖形稱為在在p 2后截尾 這說明該數(shù)據(jù)滿足是平穩(wěn)的AR 2 模型 27 拖尾和截尾 所謂拖尾圖形模式也可能不是以指數(shù)形式 而是以正負(fù)相間的正弦形式衰減 類似地 如果acf圖形是在第q k個條后截尾 而pacf圖形為拖尾 則數(shù)據(jù)滿足MA q 模型 如果兩個圖形都拖尾則可能滿足ARMA p q 模型 具體判別法總結(jié)在下面表中 并不一定嚴(yán)格 28 acf和pacf圖 如acf和pacf圖中至少一個不是以指數(shù)形式或正弦形式衰減 那么說明該序列不是平穩(wěn)序列 必須進行差分變換來得到一個可以估計參數(shù)的滿足ARMA p q 模型的序列如一個時間序列的acf和pacf圖沒有任何模式 而且數(shù)值很小 那么這個序列可能就是一些互相獨立的無關(guān)的隨機變量 一個很好擬合的時間序列模型的殘差就應(yīng)該有這樣的acf和pacf圖 29 AR 2 MA 2 和ARMA 2 2 模型所對應(yīng)的acf和pacf圖 注意 圖中有些條是從0開始的 不算在p或q內(nèi) 30 例 數(shù)據(jù)AR2 sav 根據(jù)acf和pacf圖的形態(tài) 不用進行任何差分就可以直接用AR 2 模型擬合 利用SPSS軟件 選擇AR 2 模型 等價地ARIMA 2 0 0 0 0 0 模型 得到參數(shù)估計為 也就是說該AR 2 模型為 31 例 數(shù)據(jù)AR2 sav 例15 2的原始序列和由模型AR 2 得到的擬合值及對未來10個觀測的預(yù)測圖 虛線 32 例 數(shù)據(jù)AR2 sav 下面再看剩下的殘差序列是否還有什么模式 這還可以由殘差的pacf 左 和acf 右 圖來判斷 可以看出 它們沒有什么模式 這說明擬合比較成功 33 例 數(shù)據(jù)AR2 sav 下圖為殘差對擬合值的散點圖 看不出任何模式 說明殘差的確是獨立的和隨機的 34 ARIMA p d q P D Q s模型 在對含有季節(jié)和趨勢 循環(huán)等成分的時間序列進行ARIMA模型的擬合研究和預(yù)測時 就不象對純粹的滿足可解條件的ARMA模型那么簡單了 一般的ARIMA模型有多個參數(shù) 沒有季節(jié)成分的可以記為ARIMA p d q 如果沒有必要利用差分來消除趨勢或循環(huán)成分時 差分階數(shù)d 0 模型為ARIMA p 0 q 即ARMA p q 在有已知的固定周期s時 模型多了4個參數(shù) 可記為ARIMA p d q P D Q s 這里增加的除了周期s已知之外 還有描述季節(jié)本身的ARIMA P D Q 的模型識別問題 因此 實際建模要復(fù)雜得多 需要經(jīng)過反復(fù)比較 35 用ARIMA模型擬合tax sav 先前對例15 1 數(shù)據(jù)tax txt或tax sav 進行了分解 并且用指數(shù)平滑做了預(yù)測 知道其中有季節(jié)和趨勢成分 下面試圖對其進行ARIMA模型擬合 先試圖對該序列做acf和pacf條形圖 其中acf圖顯然不是拖尾 不是以指數(shù)速率遞減 因此說明需要進行差分 36 用ARIMA模型擬合例tax sav 關(guān)于于參數(shù) 不要選得過大 每次擬合之后要檢查殘差的acf和pacf圖 看是否為無關(guān)隨機序列 在SPSS軟件中還有類似于回歸系數(shù)的檢驗以及其他一些判別標(biāo)準(zhǔn)的計算機輸出可做參考 這里不細(xì)說 經(jīng)過幾次對比之后 對于例16 1數(shù)據(jù)我們最后選中了ARIMA 0 1 1 1 2 1 12模型來擬合 擬合的結(jié)果和對2005年6月之后12個月的預(yù)測在下圖中 37 例tax sav的原始序列和由模型得到的擬合值及對未來12個月的預(yù)測圖 38 例 數(shù)據(jù)tax sav 為了核對 當(dāng)然要畫出殘差的acf和pacf的條形圖來看是否還有什么非隨機的因素存在 下圖為這兩個點圖 看來我們的模型選擇還是適當(dāng)?shù)?39 40 例 數(shù)據(jù)tax sav 例15 1數(shù)據(jù)擬合ARIMA 0 1 1 1 2 1 12模型后殘差序列的Ljung Box檢驗的p值 41 新SPSS 42 43 44 用ARIMA模型擬合帶有獨立變量的時間序列 例 數(shù)據(jù)tsadds2 sav是一個銷售時間序列 以每周七天為一個季節(jié)周期 除了銷售額序列sales之外 還有一個廣告花費的獨立變量adds 先不理睬這個獨立變量 把該序列當(dāng)成純粹時間序列來用ARIMA模型擬合 右圖為該序列的點圖 45 數(shù)據(jù)tsadds2 sav 再首先點出其acf和pacf條形圖 acf圖顯然不是拖尾模式 因此 必須進行差分以消除季節(jié)影響 試驗多次之后 看上去ARIMA 2 1 2 0 1 1 7的結(jié)果還可以接受 殘差的pacf和acf條形圖在下一頁圖中 46 用ARIMA模型擬合帶有獨立變量的時間序列 繼續(xù)改進我們的模型 再把獨立變量廣告支出加入模型 最后得到的帶有獨立變量adds的ARIMA 2 1 2 0 1 1 7模型 擬合后的殘差圖在下圖中 47 用ARIMA模型擬合帶有獨立變量的時間序列 從各種角度來看擬合帶獨立變量平方的ARIMA 2 1 2 0 1 1 7模型給出更好的結(jié)果 雖然從上面的acf和pacf圖看不出 一般也不應(yīng)該看出 獨立變量對序列的自相關(guān)性的影響 但是根據(jù)另外的一些判別準(zhǔn)則 獨立變量的影響是顯著的 而且加入獨立變量使得模型更加有效 48 用ARIMA模型擬合帶有獨立變量的時間序列 要注意 一些獨立變量的效果也可能是滿足某些時間序列模型的 也可能會和季節(jié) 趨勢等效應(yīng)混雜起來不易分辯 這時 模型選擇可能就比較困難 也可能不同模型會有類似的效果 一個時間序列在各種相關(guān)的因素影響下的模型選擇并不是一件簡單明了的事情 實際上沒有任何統(tǒng)計模型是絕對正確的 它們的區(qū)別在于 在某種意義上 一些模型的某些性質(zhì)可能要優(yōu)于另外一些 49 新SPSS的時間序列實現(xiàn) 特點 在ARIMA中自動選擇用什么參數(shù)在指數(shù)平滑和ARIMA中自動選擇模型 包括參數(shù) 下面是兩個例子TAXAIRPORT 50 tsadds2 sav 51 52 53 54 Airport sav 55 56 57 58 59 60 61 62 63 SPSS的實現(xiàn) ARIMA模型 時間序列的acf和pacf圖 可以用選項Graphs TimeSeries Autocorrelations 然后把變量選入Variables中 對于數(shù)據(jù)AR1 sav 把時間序列Z選入 在Display中 默認(rèn)地 有選項Autocorrelations和Partialautocorrelations導(dǎo)致acf和pacf圖 人們還經(jīng)常對殘差項繪acf和pacf圖 64 SPSS的實現(xiàn) ARIMA p d q P D Q s模型擬合 選擇Analyze TimeSeries ARIMA 然后把數(shù)據(jù)中的時間序列選入Dependent 在數(shù)據(jù)AR1 sav中 選Z 對數(shù)據(jù)tssales sav時選sales 而對數(shù)據(jù)tsadds2 sav時選sales 對于Independent 僅在使用數(shù)據(jù)tsadds2 sav時選了adds 在Model的第一列為ARIMA p d q P D Q s模型的前三個參數(shù) p d q 第二列 sp sd sq 為ARIMA p d q P D Q s模型的后三個參數(shù) P D Q 這樣只要選定我們所希望嘗試的模型參數(shù)即可 周期s由于在定義序列時已經(jīng)有了 見對話框中注明的CurrentPeriodicity后面的數(shù)字 就不用另外輸入了 在輸出的變量中有誤差和擬合 預(yù)測 的序列 在輸出文件中還有各個參數(shù)和一些判別準(zhǔn)則等 65 公式 指數(shù)平滑模型 這些模型中有a g d f為待估計參數(shù) g 0意味著斜率為常數(shù) 趨勢無變化 而d 0意味著沒有季節(jié)成分 f和減幅趨勢有關(guān) 對于時間序列Xt 趨勢 光滑后的序列 季節(jié)因子和預(yù)測的序列分別用Tt St It和表示 另外 p表示周期 et為殘差 66 指數(shù)平滑模型 線性趨勢可加季節(jié)模型 Lineartrend additiveseasonalitymodel 67 指數(shù)平滑模型 線性趨勢可乘季節(jié)模型 Lineartrend multiplicativeseasonalitymodel 68 指數(shù)平滑模型 指數(shù)趨勢可加季節(jié)模型 Exponentialtrend additiveseasonalitymodel 69 指數(shù)平滑模型 指數(shù)趨勢可乘季節(jié)模型 Exponentialtrend multiplicat

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論