非平穩(wěn)時(shí)間序列建模與預(yù)測(cè)方法研究_第1頁
非平穩(wěn)時(shí)間序列建模與預(yù)測(cè)方法研究_第2頁
非平穩(wěn)時(shí)間序列建模與預(yù)測(cè)方法研究_第3頁
非平穩(wěn)時(shí)間序列建模與預(yù)測(cè)方法研究_第4頁
非平穩(wěn)時(shí)間序列建模與預(yù)測(cè)方法研究_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

非平穩(wěn)時(shí)間序列建模與預(yù)測(cè)方法研究引言在金融市場(chǎng)的K線圖前,我們常看到股價(jià)像海浪般起伏,既有長(zhǎng)期的牛熊周期,又有日內(nèi)的劇烈波動(dòng);在宏觀經(jīng)濟(jì)分析中,GDP、CPI等指標(biāo)總帶著或陡峭或平緩的增長(zhǎng)趨勢(shì),偶爾還會(huì)被突發(fā)事件打斷軌跡。這些真實(shí)世界的數(shù)據(jù),很少能乖乖符合“均值恒定、方差穩(wěn)定”的平穩(wěn)假設(shè)。當(dāng)我們用平穩(wěn)時(shí)間序列模型去擬合時(shí),就像給不斷長(zhǎng)高的孩子穿固定尺碼的衣服——初期可能勉強(qiáng)合身,但隨著時(shí)間推移,模型的殘差會(huì)越來越大,預(yù)測(cè)結(jié)果逐漸偏離現(xiàn)實(shí)。這就是非平穩(wěn)時(shí)間序列帶來的挑戰(zhàn),也是我們今天要探討的核心問題。一、非平穩(wěn)時(shí)間序列的基本認(rèn)知與識(shí)別1.1非平穩(wěn)性的本質(zhì)與表現(xiàn)形式時(shí)間序列的“平穩(wěn)性”,通俗來說就是數(shù)據(jù)的“脾氣”要穩(wěn)定。平穩(wěn)序列的均值像錨一樣固定在某個(gè)位置,方差不會(huì)隨時(shí)間膨脹或收縮,不同時(shí)間點(diǎn)的相關(guān)性只和時(shí)間間隔有關(guān),就像有規(guī)律的鐘擺。而非平穩(wěn)序列則像脫韁的野馬:有的均值隨時(shí)間線性或非線性增長(zhǎng)(比如人口總量),有的方差越來越大(比如金融危機(jī)前的市場(chǎng)波動(dòng)率),還有的自相關(guān)結(jié)構(gòu)突然改變(比如政策調(diào)整后的經(jīng)濟(jì)指標(biāo))。具體來看,非平穩(wěn)性主要分為兩類:一類是“趨勢(shì)非平穩(wěn)”,數(shù)據(jù)受確定性趨勢(shì)或隨機(jī)趨勢(shì)(單位根)驅(qū)動(dòng),比如我國(guó)某年的GDP數(shù)據(jù),剔除價(jià)格因素后往往呈現(xiàn)明顯的上升趨勢(shì);另一類是“結(jié)構(gòu)非平穩(wěn)”,數(shù)據(jù)生成過程在某個(gè)時(shí)間點(diǎn)發(fā)生突變,比如某行業(yè)政策出臺(tái)后,相關(guān)企業(yè)的營(yíng)收增速可能從10%驟降至3%。這兩類非平穩(wěn)性可能單獨(dú)出現(xiàn),也可能交織在一起,增加了建模的復(fù)雜度。1.2非平穩(wěn)性的識(shí)別方法要給非平穩(wěn)序列“號(hào)脈”,首先得準(zhǔn)確識(shí)別其非平穩(wěn)特征。實(shí)際操作中,我們通常分兩步走:第一步是“望診”——圖形分析。畫出時(shí)間序列圖,觀察是否存在明顯的上升/下降趨勢(shì)(趨勢(shì)非平穩(wěn)的信號(hào));再看自相關(guān)圖,如果自相關(guān)系數(shù)隨滯后階數(shù)下降緩慢(比如滯后20期仍顯著不為0),很可能存在單位根;畫方差圖(比如每100個(gè)數(shù)據(jù)點(diǎn)的標(biāo)準(zhǔn)差),若方差隨時(shí)間遞增,說明存在異方差非平穩(wěn)。我曾處理過某股票的日收益率數(shù)據(jù),時(shí)序圖看起來像“隨機(jī)游走”,自相關(guān)圖前10階都在0.2以上,這提示可能存在單位根。第二步是“切診”——統(tǒng)計(jì)檢驗(yàn)。最常用的是ADF檢驗(yàn)(增廣迪基-富勒檢驗(yàn)),它的原假設(shè)是“序列存在單位根(非平穩(wěn))”。具體操作時(shí),我們會(huì)在回歸模型中加入滯后差分項(xiàng)以控制序列相關(guān),然后計(jì)算t統(tǒng)計(jì)量。如果t統(tǒng)計(jì)量小于臨界值(比如在5%顯著性水平下臨界值約為-2.86),就拒絕原假設(shè),認(rèn)為序列平穩(wěn);反之則接受非平穩(wěn)。需要注意的是,ADF檢驗(yàn)對(duì)結(jié)構(gòu)突變不敏感,這時(shí)候可以用KPSS檢驗(yàn)(原假設(shè)為平穩(wěn))作為補(bǔ)充,或者用Bai-Perron檢驗(yàn)檢測(cè)是否存在多個(gè)結(jié)構(gòu)突變點(diǎn)。二、經(jīng)典建模方法:從差分處理到協(xié)整分析2.1ARIMA模型:消除趨勢(shì)非平穩(wěn)的“手術(shù)刀”面對(duì)趨勢(shì)非平穩(wěn)序列,最經(jīng)典的方法是ARIMA(自回歸積分滑動(dòng)平均模型)。它的核心思想是通過差分操作“熨平”趨勢(shì):如果原序列是I(d)(d階單整),做d次差分后就變成平穩(wěn)的I(0)序列,然后對(duì)差分序列建立ARMA(p,q)模型。舉個(gè)例子,假設(shè)我們有一組月度銷售額數(shù)據(jù),時(shí)序圖顯示明顯的線性增長(zhǎng)趨勢(shì)。首先做ADF檢驗(yàn),發(fā)現(xiàn)t統(tǒng)計(jì)量為-1.9(大于-2.86),說明存在單位根(I(1))。于是對(duì)原序列做一階差分,得到新序列,再做ADF檢驗(yàn),t統(tǒng)計(jì)量變?yōu)?3.5(小于-2.86),確認(rèn)平穩(wěn)。接下來需要確定ARMA的階數(shù)p和q:觀察差分序列的自相關(guān)圖(ACF)和偏自相關(guān)圖(PACF),如果ACF在2階后截尾,PACF在3階后截尾,可能的模型是ARMA(3,2)。最后用AIC/BIC準(zhǔn)則在候選模型中選擇最優(yōu),比如ARMA(3,2)的AIC值比ARMA(2,2)低,就選前者。但ARIMA也有局限:它假設(shè)非平穩(wěn)性僅來自單位根,對(duì)結(jié)構(gòu)突變或非線性趨勢(shì)效果不佳;差分操作會(huì)損失低頻信息,可能弱化長(zhǎng)期預(yù)測(cè)能力;而且p和q的階數(shù)需要人工判斷,對(duì)新手不太友好。我曾用ARIMA預(yù)測(cè)某企業(yè)的季度收入,前12期預(yù)測(cè)誤差在5%以內(nèi),但遇到行業(yè)政策調(diào)整的季度,誤差突然放大到20%,這就是結(jié)構(gòu)突變超出了模型假設(shè)范圍。2.2協(xié)整理論:處理多變量非平穩(wěn)的“橋梁”現(xiàn)實(shí)中我們常需要分析多個(gè)非平穩(wěn)序列的關(guān)系,比如研究GDP與居民消費(fèi)、股價(jià)與利率的聯(lián)動(dòng)。這時(shí)候如果直接用OLS回歸,可能出現(xiàn)“偽回歸”——兩個(gè)無關(guān)的非平穩(wěn)序列也能擬合出高R2值,但殘差非平穩(wěn),模型沒有實(shí)際意義。協(xié)整理論正是為解決這個(gè)問題而生。協(xié)整的核心思想是:如果一組I(1)序列的線性組合是I(0),說明它們之間存在長(zhǎng)期均衡關(guān)系。比如GDP(Y)和消費(fèi)(C)都是I(1),但Y-αC是平穩(wěn)的,那么α就是長(zhǎng)期邊際消費(fèi)傾向。建模步驟通常是Engle-Granger兩步法:第一步用OLS估計(jì)協(xié)整方程,得到殘差;第二步對(duì)殘差做ADF檢驗(yàn),若殘差平穩(wěn)則存在協(xié)整關(guān)系;最后建立誤差修正模型(ECM),將短期波動(dòng)與長(zhǎng)期均衡結(jié)合起來,模型形式為ΔCt=βΔYt+γ(Et-1)+εt,其中Et-1是上一期的均衡誤差(Yt-1-αCt-1),γ表示誤差修正速度(通常為負(fù),說明偏離均衡后會(huì)向均衡調(diào)整)。我曾用協(xié)整模型分析某國(guó)M2(廣義貨幣供應(yīng)量)與CPI的關(guān)系。首先確認(rèn)M2和CPI都是I(1),然后用OLS得到協(xié)整方程CPI=0.03M2+常數(shù)項(xiàng),殘差的ADF檢驗(yàn)t統(tǒng)計(jì)量為-3.2(小于-2.86),確認(rèn)協(xié)整。接著建立ECM,發(fā)現(xiàn)誤差修正項(xiàng)的系數(shù)是-0.15,說明當(dāng)CPI短期高于長(zhǎng)期均衡水平時(shí),下一期會(huì)回調(diào)15%。這種方法不僅捕捉了長(zhǎng)期關(guān)系,還解釋了短期調(diào)整機(jī)制,比單變量模型更有經(jīng)濟(jì)意義。三、現(xiàn)代建模方法:應(yīng)對(duì)復(fù)雜非平穩(wěn)的新工具3.1GARCH類模型:捕捉波動(dòng)非平穩(wěn)的“顯微鏡”金融數(shù)據(jù)常出現(xiàn)“波動(dòng)聚類”現(xiàn)象——大漲大跌后往往跟著大漲大跌,這意味著方差非平穩(wěn)(條件異方差)。傳統(tǒng)ARIMA假設(shè)方差恒定,無法刻畫這種特征,而GARCH(廣義自回歸條件異方差)模型正是為解決這個(gè)問題設(shè)計(jì)的。GARCH(p,q)模型將條件方差σt2表示為過去q個(gè)殘差平方和p個(gè)條件方差的線性組合:σt2=ω+α1εt-12+…+αqεt-q2+β1σt-12+…+βpσt-p2。其中ω是常數(shù)項(xiàng),α捕捉“沖擊效應(yīng)”(大的ε會(huì)導(dǎo)致未來方差增大),β捕捉“波動(dòng)持續(xù)性”(高方差會(huì)持續(xù))。比如某股票日收益率的GARCH(1,1)模型中,α1=0.15,β1=0.8,說明一次大的波動(dòng)(εt-12)會(huì)使下一日方差增加15%,而前一日的高方差(σt-12)會(huì)貢獻(xiàn)80%到當(dāng)日方差,兩者相加接近1,說明波動(dòng)具有長(zhǎng)期記憶性。針對(duì)GARCH的不足,學(xué)者們發(fā)展了EGARCH(指數(shù)GARCH)處理杠桿效應(yīng)(壞消息比好消息引發(fā)更大波動(dòng)),TGARCH(門限GARCH)引入虛擬變量區(qū)分正負(fù)沖擊,GJR-GARCH考慮非對(duì)稱影響。我在分析某加密貨幣的波動(dòng)率時(shí),發(fā)現(xiàn)負(fù)收益率對(duì)應(yīng)的殘差平方對(duì)條件方差的影響是正收益率的2倍,這時(shí)候用EGARCH模型比普通GARCH更準(zhǔn)確,預(yù)測(cè)的VaR(風(fēng)險(xiǎn)價(jià)值)也更接近實(shí)際極值。3.2狀態(tài)空間模型:分離不可觀測(cè)成分的“透視鏡”很多非平穩(wěn)序列由不可觀測(cè)的狀態(tài)驅(qū)動(dòng),比如經(jīng)濟(jì)增長(zhǎng)中的趨勢(shì)成分、周期成分和隨機(jī)噪聲。狀態(tài)空間模型通過設(shè)定狀態(tài)方程和觀測(cè)方程,將這些成分分離出來,適合處理包含結(jié)構(gòu)變化的非平穩(wěn)數(shù)據(jù)。模型形式通常為:觀測(cè)方程yt=Ztαt+dt+εt(εt~N(0,Ht)),狀態(tài)方程αt=Ttαt-1+ct+ηt(ηt~N(0,Qt))。其中αt是不可觀測(cè)的狀態(tài)向量(如趨勢(shì)、周期),Zt、Tt是系數(shù)矩陣,dt、ct是確定性項(xiàng)。通過卡爾曼濾波可以遞歸估計(jì)狀態(tài)變量,并預(yù)測(cè)未來值。比如分析某城市用電量數(shù)據(jù),狀態(tài)空間模型可以將yt分解為長(zhǎng)期趨勢(shì)(如人口增長(zhǎng)帶來的用電增加)、季節(jié)成分(夏季空調(diào)用電高峰)和隨機(jī)波動(dòng)(偶然事件影響),分別建模后再組合預(yù)測(cè)。我曾用狀態(tài)空間模型預(yù)測(cè)某景區(qū)的月游客量,設(shè)定狀態(tài)向量包括線性趨勢(shì)(α1t)和12階季節(jié)成分(α2t到α13t)??柭鼮V波結(jié)果顯示,趨勢(shì)成分的斜率為0.02(每月增長(zhǎng)2%),季節(jié)成分中7月的系數(shù)比均值高30%(暑期旅游高峰),1月低25%(冬季淡季)。這種分解讓預(yù)測(cè)更有解釋力,景區(qū)管理方可以根據(jù)趨勢(shì)和季節(jié)成分提前調(diào)配資源。3.3機(jī)器學(xué)習(xí)方法:捕捉非線性非平穩(wěn)的“利器”傳統(tǒng)模型多假設(shè)線性關(guān)系,而現(xiàn)實(shí)中的非平穩(wěn)可能涉及非線性趨勢(shì)、時(shí)變參數(shù)甚至制度轉(zhuǎn)換(如經(jīng)濟(jì)從擴(kuò)張期轉(zhuǎn)向衰退期)。這時(shí)候機(jī)器學(xué)習(xí)方法,尤其是神經(jīng)網(wǎng)絡(luò),展現(xiàn)出獨(dú)特優(yōu)勢(shì)。LSTM(長(zhǎng)短期記憶網(wǎng)絡(luò))是處理時(shí)間序列的經(jīng)典神經(jīng)網(wǎng)絡(luò),其記憶單元能捕捉長(zhǎng)期依賴關(guān)系。比如預(yù)測(cè)股價(jià)時(shí),LSTM可以記住幾個(gè)月前的重大事件(如財(cái)報(bào)發(fā)布、政策變動(dòng))對(duì)當(dāng)前價(jià)格的影響,而傳統(tǒng)ARIMA可能因差分丟失這些信息。Transformer模型引入自注意力機(jī)制,能動(dòng)態(tài)關(guān)注不同時(shí)間點(diǎn)的相關(guān)性,比如在預(yù)測(cè)宏觀經(jīng)濟(jì)時(shí),它可以自動(dòng)識(shí)別近期的政策信號(hào)比遠(yuǎn)期數(shù)據(jù)更重要。不過機(jī)器學(xué)習(xí)也有“黑箱”問題,模型的可解釋性較弱。我曾對(duì)比LSTM和ARIMA在某電商平臺(tái)日訂單量預(yù)測(cè)中的表現(xiàn):LSTM的MAE(平均絕對(duì)誤差)比ARIMA低30%,但無法明確說明是哪些因素(如促銷活動(dòng)、天氣)主導(dǎo)了預(yù)測(cè)結(jié)果。因此實(shí)際應(yīng)用中,常將機(jī)器學(xué)習(xí)與傳統(tǒng)模型結(jié)合,比如用LSTM捕捉非線性特征,用ARIMA處理線性趨勢(shì),再通過集成學(xué)習(xí)加權(quán)預(yù)測(cè)。四、預(yù)測(cè)中的關(guān)鍵問題與改進(jìn)策略4.1結(jié)構(gòu)突變:預(yù)測(cè)路上的“暗礁”結(jié)構(gòu)突變是指數(shù)據(jù)生成過程在某個(gè)時(shí)間點(diǎn)發(fā)生顯著變化(如金融危機(jī)、技術(shù)革命),這會(huì)導(dǎo)致模型參數(shù)失效,預(yù)測(cè)誤差驟增。比如某年全球疫情爆發(fā),旅游、航空等行業(yè)的需求數(shù)據(jù)從平穩(wěn)增長(zhǎng)突然轉(zhuǎn)為斷崖式下跌,之前用歷史數(shù)據(jù)擬合的模型完全失效。檢測(cè)結(jié)構(gòu)突變的方法包括Chow檢驗(yàn)(已知突變點(diǎn)時(shí)檢驗(yàn)前后參數(shù)是否一致)、Bai-Perron檢驗(yàn)(未知突變點(diǎn)時(shí)估計(jì)多個(gè)突變位置)。改進(jìn)策略有兩種:一是“事后調(diào)整”,檢測(cè)到突變后,將樣本分為突變前和突變后,分別建模再拼接預(yù)測(cè);二是“事前魯棒化”,使用時(shí)變參數(shù)模型(如TVP-VAR)或貝葉斯動(dòng)態(tài)模型平均(DMA),讓模型自動(dòng)調(diào)整參數(shù)權(quán)重,降低突變的影響。我在預(yù)測(cè)某出口企業(yè)的訂單量時(shí),用DMA方法將模型集設(shè)為ARIMA、LSTM和結(jié)構(gòu)突變模型,通過貝葉斯因子動(dòng)態(tài)調(diào)整各模型的權(quán)重,結(jié)果在貿(mào)易摩擦事件后,預(yù)測(cè)誤差僅比平時(shí)增加5%,遠(yuǎn)低于單一模型的25%。4.2多尺度分析:分解復(fù)雜波動(dòng)的“棱鏡”非平穩(wěn)序列常包含不同時(shí)間尺度的成分(如年趨勢(shì)、月周期、日波動(dòng)),單一模型難以同時(shí)捕捉。多尺度分析通過分解技術(shù)(如小波變換、經(jīng)驗(yàn)?zāi)B(tài)分解EMD)將原序列分解為高頻(短期波動(dòng))、中頻(周期成分)和低頻(長(zhǎng)期趨勢(shì)),分別建模后再重構(gòu)預(yù)測(cè)。以小波分解為例,選擇合適的小波基(如db4小波)將序列分解為近似分量(低頻)和細(xì)節(jié)分量(高頻),對(duì)近似分量用ARIMA建模(捕捉長(zhǎng)期趨勢(shì)),對(duì)細(xì)節(jié)分量用GARCH建模(捕捉短期波動(dòng)),最后將各分量的預(yù)測(cè)結(jié)果相加。我曾用這種方法預(yù)測(cè)某股票的周收益率,分解后發(fā)現(xiàn)低頻分量占方差的60%(由公司基本面驅(qū)動(dòng)),高頻分量占40%(由市場(chǎng)情緒驅(qū)動(dòng)),分別建模后預(yù)測(cè)的夏普比率比單一模型高0.2,說明多尺度分析能更精準(zhǔn)地捕捉不同來源的非平穩(wěn)性。4.3動(dòng)態(tài)模型平均:應(yīng)對(duì)參數(shù)時(shí)變的“自適應(yīng)系統(tǒng)”現(xiàn)實(shí)中的非平穩(wěn)性往往表現(xiàn)為參數(shù)隨時(shí)間緩慢變化(如消費(fèi)傾向隨收入水平提高而下降),而不是突然的結(jié)構(gòu)突變。這時(shí)候動(dòng)態(tài)模型平均(DMA)通過設(shè)定參數(shù)的遺忘因子(λ),讓舊數(shù)據(jù)的權(quán)重隨時(shí)間指數(shù)衰減,新數(shù)據(jù)的權(quán)重逐漸增加。模型形式為:yt=βt’xt+εt,βt=βt-1+ηt,其中ηt的方差由λ控制(λ越接近1,參數(shù)越穩(wěn)定;λ越小,參數(shù)更新越快)。我在研究某國(guó)菲利普斯曲線(通脹與失業(yè)率的關(guān)系)時(shí),發(fā)現(xiàn)2000年后斜率參數(shù)(失業(yè)率對(duì)通脹的影響)從-0.5逐漸變?yōu)?0.3,用DMA模型估計(jì)時(shí),設(shè)定λ=0.95,結(jié)果顯示參數(shù)的后驗(yàn)均值隨時(shí)間平滑下降,預(yù)測(cè)的通脹率與實(shí)際值的相關(guān)系數(shù)達(dá)到0.85,而固定參數(shù)模型僅為0.62。這說明DMA能有效捕捉參數(shù)時(shí)變帶來的非平穩(wěn)性,提升預(yù)測(cè)的適應(yīng)性。五、總結(jié)與展望回顧非平穩(wěn)時(shí)間序列建模與預(yù)測(cè)的發(fā)展,從ARIMA的差分處理到協(xié)整理論的多變量分析,從GARCH的波動(dòng)建模到機(jī)器學(xué)習(xí)的非線性捕捉,方法體系不斷完善。這些方法各有優(yōu)劣:傳統(tǒng)模型可解釋性強(qiáng)但假設(shè)嚴(yán)格,機(jī)器學(xué)習(xí)靈活性高但偏黑箱,狀態(tài)空間模型適合成分分解但計(jì)算復(fù)雜。實(shí)際應(yīng)用中,需要根據(jù)數(shù)據(jù)特征(趨勢(shì)/結(jié)構(gòu)突變/波動(dòng)聚類)、問題需求(短期預(yù)測(cè)/長(zhǎng)期分析/政策模擬)和資源限制(計(jì)算能力/數(shù)據(jù)量)選擇合適的方法,或組合使用以取長(zhǎng)補(bǔ)短。展望未來,非平穩(wěn)時(shí)間序列研究可能向三個(gè)方向深化:一是“融合化”,將機(jī)器學(xué)習(xí)的非線性捕捉能力與傳統(tǒng)模型的可解釋性結(jié)合,開發(fā)“白箱化”的混合模型;二是“實(shí)時(shí)化”,隨

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論