非平穩(wěn)時間序列預測分析_第1頁
非平穩(wěn)時間序列預測分析_第2頁
非平穩(wěn)時間序列預測分析_第3頁
非平穩(wěn)時間序列預測分析_第4頁
非平穩(wěn)時間序列預測分析_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

非平穩(wěn)時間序列預測分析一、引言:從“穩(wěn)定”到“非穩(wěn)定”的現(xiàn)實挑戰(zhàn)剛?cè)胄凶鼋鹑跀?shù)據(jù)預測時,我曾天真地以為所有時間序列都像教科書里的ARMA模型那樣“規(guī)規(guī)矩矩”——均值圍繞一個常數(shù)波動,方差恒定,自相關系數(shù)隨滯后階數(shù)增加而衰減。直到第一次處理某只成長股的日收盤價數(shù)據(jù):打開時序圖,價格線像爬山一樣持續(xù)向上,自相關圖的尾巴拖得老長,ADF檢驗的p值大得離譜。導師拍著我肩膀說:“小伙子,這就是非平穩(wěn)序列的典型表現(xiàn)?,F(xiàn)實中,經(jīng)濟、金融、氣象甚至社交平臺流量數(shù)據(jù),大部分都是非平穩(wěn)的?!边@句話讓我突然明白:平穩(wěn)是理論假設的理想狀態(tài),非平穩(wěn)才是現(xiàn)實世界的常態(tài)。從宏觀經(jīng)濟的GDP增長趨勢,到個股價格的“慢?!毙星?;從電商平臺的季節(jié)性銷售高峰,到新能源發(fā)電量的政策驅(qū)動波動——這些數(shù)據(jù)的均值、方差或自相關結(jié)構(gòu)都會隨時間變化。如果用平穩(wěn)模型硬套,就像給長跑運動員量身高時不考慮他還在長個子,預測結(jié)果往往偏差極大。今天,我們就來深入聊聊非平穩(wěn)時間序列的預測分析。二、非平穩(wěn)時間序列的“真面目”:定義與識別2.1從平穩(wěn)到非平穩(wěn):概念的邊界要理解非平穩(wěn),得先明確平穩(wěn)性的定義。弱平穩(wěn)(二階平穩(wěn))要求序列滿足三個條件:均值為常數(shù),方差為常數(shù),任意兩個時間點的自協(xié)方差僅與時間間隔有關。打個比方,平穩(wěn)序列像在泳池里游泳的人——雖然上下浮動,但始終在一個固定區(qū)域內(nèi);而非平穩(wěn)序列更像順流而下的木筏,要么被水流推著一直前進(趨勢項),要么突然遇到漩渦改變浮動范圍(方差變化),甚至被礁石撞得方向驟變(結(jié)構(gòu)突變)。非平穩(wěn)的表現(xiàn)形式主要有三類:第一類是趨勢非平穩(wěn)(TrendNon-stationary),序列含有確定性趨勢或隨機趨勢(單位根過程)。比如某城市過去十年的房價數(shù)據(jù),受城鎮(zhèn)化推動持續(xù)上漲,均值隨時間t線性增加。第二類是季節(jié)非平穩(wěn)(SeasonalNon-stationary),序列存在周期性變化且季節(jié)效應隨時間增強或減弱。例如某冷飲品牌的月銷售額,夏季銷量遠高于冬季,但近年來夏季峰值越來越高,季節(jié)波動幅度在擴大。第三類是結(jié)構(gòu)突變非平穩(wěn)(StructuralBreakNon-stationary),序列在某個時間點后統(tǒng)計特征發(fā)生顯著變化。2020年初的全球股市就是典型——疫情爆發(fā)前波動率較低,爆發(fā)后波動率驟增,均值也出現(xiàn)跳變。2.2如何“揪出”非平穩(wěn):識別方法工具箱識別非平穩(wěn)是預測的第一步,就像醫(yī)生看病要先做檢查。常用方法有三大類:(1)圖形診斷法:最直觀的“望診”畫時序圖是最基礎的操作。如果序列呈現(xiàn)明顯的上升/下降趨勢(如GDP增速),或波動幅度逐漸擴大(如加密貨幣價格),或存在規(guī)律的季節(jié)性峰谷(如旅游景區(qū)客流量),基本可以判定非平穩(wěn)。自相關圖(ACF)也很有用:平穩(wěn)序列的ACF通常在滯后幾階后快速衰減趨近于0;而非平穩(wěn)序列的ACF衰減緩慢,甚至長期保持高位(比如單位根過程的ACF接近1)。我曾處理過某新能源汽車銷量數(shù)據(jù),時序圖顯示2019年前銷量緩慢增長,2020年后突然加速,自相關圖的前10階系數(shù)都在0.9以上。這提示可能存在趨勢變化和單位根,需要進一步檢驗。(2)單位根檢驗:判定隨機趨勢的“金標準”單位根檢驗(如ADF檢驗、PP檢驗、KPSS檢驗)是判斷序列是否含有隨機趨勢(即是否為I(1)過程)的核心方法。ADF檢驗的原假設是“序列存在單位根(非平穩(wěn))”,如果檢驗統(tǒng)計量小于臨界值(p值小于顯著性水平),則拒絕原假設,認為序列平穩(wěn)。需要注意的是,ADF檢驗對結(jié)構(gòu)突變不敏感,若序列存在斷點,可能出現(xiàn)“偽平穩(wěn)”結(jié)論。記得有次用ADF檢驗某股票對數(shù)收益率,結(jié)果顯示平穩(wěn),但后來發(fā)現(xiàn)數(shù)據(jù)中遺漏了財報發(fā)布日的異常波動點——剔除異常值后重新檢驗,居然出現(xiàn)了單位根。這說明數(shù)據(jù)清洗對檢驗結(jié)果影響很大。(3)結(jié)構(gòu)突變檢驗:捕捉“轉(zhuǎn)折點”的利器Bai-Perron檢驗可以檢測序列中是否存在多個結(jié)構(gòu)突變點,并估計斷點位置。比如分析某行業(yè)指數(shù)時,若在政策出臺前后均值或方差發(fā)生顯著變化,Bai-Perron檢驗能幫我們定位這些關鍵時間點。我曾用它分析過光伏產(chǎn)業(yè)指數(shù),發(fā)現(xiàn)2018年“531新政”和2021年“雙碳”目標提出這兩個時間點,序列的增長斜率和波動率都發(fā)生了顯著變化。三、化“非平穩(wěn)”為“可預測”:處理方法與模型選擇3.1基礎策略:讓序列“穩(wěn)下來”既然非平穩(wěn)的核心問題是統(tǒng)計特征隨時間變化,最直接的思路就是通過變換讓序列趨于平穩(wěn)。(1)差分法:消除趨勢的“手術刀”一階差分(Δy_t=y_ty_{t-1})是最常用的方法,適用于含有隨機趨勢(單位根)的序列。比如股票價格通常是I(1)過程,一階差分后得到收益率序列,往往是平穩(wěn)的。但要注意“過差分”問題:如果原序列是趨勢平穩(wěn)(含確定性趨勢),用差分法會丟失長期趨勢信息;二階差分可能導致序列過度波動,反而增加預測誤差。我曾對某城市人口數(shù)據(jù)做一階差分,結(jié)果得到的年增長量序列非常平穩(wěn);但對另一個已進入穩(wěn)定期的城市人口數(shù)據(jù)做差分,卻發(fā)現(xiàn)二階差分后才平穩(wěn)——這說明差分階數(shù)需要通過單位根檢驗(如檢驗Δy_t是否平穩(wěn))來確定。(2)分解法:拆解“混合信號”的“三棱鏡”對于同時含有趨勢、季節(jié)和隨機波動的序列,分解法能將各成分分離。常用的有STL分解(季節(jié)-趨勢分解)和X-13ARIMA-SEATS(官方統(tǒng)計常用方法)。以某電商平臺月銷售額為例,STL分解可得到:長期增長趨勢(如電商滲透率提升)、季節(jié)成分(雙11、618等大促)、剩余成分(隨機波動)。分解后,對各平穩(wěn)成分分別建模(如趨勢用線性回歸,季節(jié)用正弦函數(shù),剩余用ARMA),再合并預測結(jié)果。有次做季度GDP預測,用X-13分解后發(fā)現(xiàn)季節(jié)成分占比高達30%,而之前直接用ARIMA模型忽略了這一點,導致季度預測誤差超過5%。加入季節(jié)調(diào)整后,誤差降到了2%以內(nèi)。3.2進階模型:與非平穩(wěn)“和平共處”有些情況下,強行平穩(wěn)化會損失信息(比如協(xié)整序列),這時候需要能直接處理非平穩(wěn)的模型。(1)協(xié)整分析:尋找“非平穩(wěn)中的平穩(wěn)關系”現(xiàn)實中,多個非平穩(wěn)序列可能存在長期均衡關系(協(xié)整)。比如居民收入(I(1))和消費(I(1)),雖然各自有趨勢,但二者的差值(儲蓄率)可能是平穩(wěn)的。Engle-Granger兩步法和Johansen檢驗可以識別這種關系,并構(gòu)建誤差修正模型(VECM)。VECM的優(yōu)勢在于:既考慮了短期波動(差分后的變量),又通過誤差修正項(長期均衡偏差)約束了長期行為。我曾用VECM預測某行業(yè)的“產(chǎn)能-需求”關系:產(chǎn)能和需求都是I(1)序列,但二者的線性組合(產(chǎn)能利用率)平穩(wěn)。模型顯示,當產(chǎn)能增速超過需求增速2%時,下一期產(chǎn)能增速會回調(diào)1.2%——這種“糾偏機制”對企業(yè)投資決策很有參考價值。(2)時變參數(shù)模型:捕捉“動態(tài)變化”的“變色龍”對于結(jié)構(gòu)突變頻繁的序列(如受政策影響的金融市場),時變參數(shù)模型(TVP-VAR)允許系數(shù)隨時間變化。比如在分析貨幣政策對股市的影響時,2015年股災前利率變動對股價的彈性是0.8,股災后可能降到0.3——TVP模型通過隨機波動方程刻畫這種變化,比固定參數(shù)模型更貼近現(xiàn)實。之前用TVP模型預測國債收益率,發(fā)現(xiàn)2022年美聯(lián)儲加息周期中,模型的時變系數(shù)能及時反映市場對政策的敏感度變化,而傳統(tǒng)VAR模型因為參數(shù)固定,在加息初期的預測誤差比TVP大3倍。(3)非線性非平穩(wěn)模型:應對“復雜波動”的“多面手”金融數(shù)據(jù)常出現(xiàn)“波動聚集”(大波動后緊跟大波動),這是方差非平穩(wěn)的表現(xiàn)。ARCH/GARCH模型通過刻畫條件方差的時變性來處理這類問題。比如某股票日收益率的波動率,GARCH(1,1)模型可以表示為σ_t2=α?+α?ε_{t-1}2+β?σ_{t-1}2,其中ε是殘差,σ2是條件方差。這種模型在風險價值(VaR)計算中應用廣泛。我曾用GARCH模型預測某外匯對的波動率,發(fā)現(xiàn)模型能很好地捕捉到“黑天鵝”事件(如英國脫歐公投)后的波動率激增,而普通ARMA模型會低估尾部風險,導致VaR計算偏保守。四、實戰(zhàn):從數(shù)據(jù)到預測的全流程以某新能源股票的周收盤價預測為例,我們來走一遍完整的分析流程:4.1數(shù)據(jù)預處理:“打掃戰(zhàn)場”首先收集過去5年的周收盤價數(shù)據(jù)(約260個觀測值),檢查缺失值(用線性插值填補2個缺失點),剔除異常值(某周因拆股導致的異常跳升,用前后兩周均值替代)。然后畫時序圖:價格從10元漲到80元,呈現(xiàn)明顯上升趨勢;自相關圖顯示前20階ACF都在0.9以上,初步判斷非平穩(wěn)。4.2識別非平穩(wěn):“診斷病情”做ADF檢驗(含截距和趨勢項),結(jié)果p值=0.85(大于0.05),不拒絕單位根原假設,確認序列非平穩(wěn)。進一步做Bai-Perron結(jié)構(gòu)突變檢驗,發(fā)現(xiàn)第150周(約3年后)存在一個斷點——這可能對應公司推出爆款產(chǎn)品的時間點。4.3模型選擇與估計:“開藥方”考慮到序列是I(1)且存在結(jié)構(gòu)突變,有兩種思路:(1)差分后建模:一階差分得到收益率序列,ADF檢驗p值=0.001(平穩(wěn)),用ARIMA(2,1,2)模型(通過AIC準則選擇)。但差分法會丟失長期趨勢信息,且忽略斷點影響。(2)協(xié)整建模:尋找與該股票高度相關的變量(如新能源指數(shù)、行業(yè)政策情緒指數(shù)),檢驗是否存在協(xié)整關系。假設找到新能源指數(shù)(I(1))與該股票價格協(xié)整,構(gòu)建VECM模型,包含誤差修正項(長期均衡偏差)和短期差分變量。權衡后選擇VECM,因為能同時捕捉長期趨勢和短期波動。估計結(jié)果顯示,誤差修正項系數(shù)為-0.3(顯著),說明當股價偏離長期均衡1%時,下一周會回調(diào)0.3%。4.4模型診斷與預測:“療效評估”殘差檢驗:Ljung-Box檢驗p值=0.45(無自相關),ARCH-LM檢驗p值=0.62(無波動聚集),模型擬合良好。用最后20周數(shù)據(jù)做滾動預測,預測誤差RMSE=1.2元(實際價格在75-85元之間),MAPE=1.5%,精度符合要求。4.5結(jié)果解讀:“臨床意義”預測未來4周股價分別為82.3元、83.1元、83.7元、84.2元,增速逐漸放緩。結(jié)合誤差修正項的負向調(diào)整,說明當前股價略高于長期均衡水平,存在小幅回調(diào)壓力——這對投資者的止盈策略有參考價值。五、挑戰(zhàn)與展望:非平穩(wěn)預測的“未竟之路”5.1現(xiàn)實中的“難啃骨頭”盡管方法眾多,非平穩(wěn)預測仍面臨三大挑戰(zhàn):一是高維非平穩(wěn)序列(如數(shù)百只股票的價格序列)的處理,傳統(tǒng)協(xié)整檢驗的計算復雜度隨變量數(shù)呈指數(shù)增長,需要更高效的降維方法(如主成分協(xié)整分析)。二是“高頻非平穩(wěn)”:分鐘級、秒級金融數(shù)據(jù)的非平穩(wěn)性可能在極短時間內(nèi)變化(如新聞事件引發(fā)的“閃崩”),傳統(tǒng)模型的更新頻率跟不上,需要實時學習算法。三是“非參數(shù)非平穩(wěn)”:某些序列的非平穩(wěn)模式完全未知(如新興科技行業(yè)的用戶增長),既無明顯趨勢也無固定周期,傳統(tǒng)參數(shù)模型難以捕捉,需要更靈活的機器學習方法。5.2未來的“破局方向”近年來,學術界和業(yè)界在積極探索新方法:機器學習與傳統(tǒng)模型的融合:LSTM、Transformer等深度學習模型擅長捕捉長記憶和非線性關系,與ARIMA、GARCH結(jié)合(如ARIMA-LSTM混合模型),能同時處理線性趨勢和非線性波動。我曾用這種模型預測加密貨幣價格,比單一模型的預測誤差降低了40%。時變因果推斷:傳統(tǒng)Granger因果檢驗假設因果關系固定,而時變因果模型(如TVP-Granger)能動態(tài)識別變量間的影響方向和強度,這對政策效果評估很有價值。貝葉斯非平穩(wěn)分析:貝葉斯方法通過先驗分布和后驗采樣,能更自然地處理結(jié)構(gòu)突變和參數(shù)不確定性,尤其適合小樣本非平穩(wěn)序列(如新興市場數(shù)據(jù))。六、結(jié)語:與“非平穩(wěn)”共舞的智慧從業(yè)多年,我最深的體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論