版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ARIMA融合BLSTM模型的股票預(yù)測(cè)分析案例目錄TOC\o"1-3"\h\u15504ARIMA融合BLSTM模型的股票預(yù)測(cè)分析案例 177261.1濾波與消噪 131661.2濾波原理 3258261.3實(shí)驗(yàn)說(shuō)明 475621.3HP濾波分解時(shí)間序列 5273021.4基于Hp濾波的ARIMA模型的股票價(jià)格預(yù)測(cè) 694761.4.1ARIMA模型的建模步驟 6153671.4.2建立模型 6253661.5基于HP濾波的ARIMA-DBLSTM模型的股票價(jià)格預(yù)測(cè) 101.1濾波與消噪在多種因素的共同影響下,導(dǎo)致跨期傳播的波動(dòng)幅度較大,使其有著處處不連續(xù)毛刺的表現(xiàn)。但是,在一定的時(shí)期內(nèi),導(dǎo)致價(jià)差呈現(xiàn)上升或下降趨勢(shì)的因素之一又包括這多種因素中的一些成分所形成的一個(gè)具有持續(xù)性的合力。一些研究者們對(duì)識(shí)別趨勢(shì)形成的信號(hào)進(jìn)行了大量的研究,用來(lái)進(jìn)行傳統(tǒng)的趨勢(shì)交易策略分析。然而大多數(shù)的研究對(duì)象是金融類的時(shí)間序列數(shù)據(jù),且通常是波動(dòng)幅度較大的金融數(shù)據(jù),因此,此類研究的結(jié)果在很大程度上會(huì)受到短期波動(dòng)的影響,使得識(shí)別結(jié)果不準(zhǔn)確。那么,在識(shí)別信號(hào)快要出現(xiàn)的時(shí)候,可以通過(guò)哪些方法來(lái)過(guò)濾掉這些噪聲呢?接下來(lái),將介紹一些過(guò)濾理論和過(guò)濾工具,為解決上述問(wèn)題提供了很多啟示。時(shí)間序列的分析和處理有兩種方式。一種是直接將時(shí)間序列數(shù)據(jù)的結(jié)構(gòu)特征與時(shí)間扭曲、即時(shí)域分析結(jié)合起來(lái);時(shí)間序列的分析處理大致有兩種思路。一種是直接拆分隨時(shí)間變化的時(shí)間序列數(shù)據(jù)的結(jié)構(gòu)特征,即在頻域分析時(shí)間序列的結(jié)構(gòu)特征;二是利用功率譜的概念來(lái)研究時(shí)間序列在頻域中的結(jié)構(gòu)特征。金融時(shí)間序列的過(guò)濾技術(shù)也是在上述兩種思想的基礎(chǔ)上發(fā)展起來(lái)的。最早的濾波方法的基礎(chǔ)理論是傅里葉分析理論,其中時(shí)域信號(hào)可以轉(zhuǎn)換成頻率不一致的三角函數(shù)的疊加,然后在頻域內(nèi)濾波。噪聲的定義是超過(guò)了設(shè)定的閾值的頻率,其傅里葉系數(shù)為0。早期的濾波方法就是通過(guò)傅里葉逆變換將該類噪聲恢復(fù)到時(shí)域內(nèi),從而達(dá)到濾波去噪的目的。但這種早期的濾波方法不適用于金融數(shù)據(jù),因?yàn)榻鹑跁r(shí)間序列數(shù)據(jù)通常是非平穩(wěn)的數(shù)據(jù),非平穩(wěn)數(shù)據(jù)的特性是隨時(shí)間而變化的,但早期的濾波方法在處理數(shù)據(jù)的高頻部分時(shí),是全方位處理的。在某一個(gè)時(shí)域內(nèi),這種高頻部分可以被定義成噪聲,但是在其他不同的時(shí)域內(nèi),又可能是有用的信號(hào)。在如今的濾波方法中,研究對(duì)象的主要是頻域內(nèi)和時(shí)域內(nèi)序列,其中Wiener濾波法是頻域內(nèi)的典型代表,Kalman濾波法是時(shí)域內(nèi)的典型代表。Wiener濾波法是研究頻域內(nèi)對(duì)象的典型代表,它的中心思想是通過(guò)構(gòu)建最小均方誤差的損失函數(shù),找到一個(gè)最優(yōu)的脈沖響應(yīng)函數(shù),輸入波形的最優(yōu)選擇為濾波器的輸出波形。即在設(shè)定的一系列條件的基礎(chǔ)上,從最原始的時(shí)間序列中得到一個(gè)較為平滑的波形,這個(gè)波形是不包含原始數(shù)據(jù)中的噪聲的。但是,這種方法同樣也是在非平穩(wěn)數(shù)據(jù),如金融時(shí)間序列數(shù)據(jù),的研究過(guò)程中存在一定的局限性的,因?yàn)檫@種方法的一個(gè)前提條件是需要通過(guò)自相關(guān)函數(shù)、功率譜密度等方法得到區(qū)別噪聲和有用信號(hào)的先驗(yàn)知識(shí)。Kalman濾波法是研究時(shí)域內(nèi)對(duì)象的典型代表,它引入了遞歸的思想,可以根據(jù)前一時(shí)刻的狀態(tài)估計(jì)值和當(dāng)前時(shí)刻的觀察值得到當(dāng)前時(shí)刻的估計(jì)值。在遞歸的過(guò)程中,最優(yōu)值的優(yōu)化準(zhǔn)則選擇的是最小均方誤差。由于遞歸可以根據(jù)上一輪的估計(jì)快速更新和處理數(shù)據(jù),因此只須輸入一次歷史數(shù)據(jù),這也是Wiener濾波法所不能做到的。然而,這種遞歸的方法需要對(duì)系統(tǒng)的運(yùn)動(dòng)規(guī)律非常了解,并且能建立出精確的方程,這使得Kalman濾波法非常難以在非平穩(wěn)金融時(shí)間序列中應(yīng)用。小波分析也同樣得到了廣泛的應(yīng)用,其中使用較多的是定量投資。小波理論是濾波理論中的巨大突破,它改進(jìn)了傳統(tǒng)的頻譜濾波中傅立葉分析結(jié)構(gòu)。小波變換和傅立葉變換在對(duì)信號(hào)進(jìn)行分解時(shí),有著較大的差異。通過(guò)小波變換分解得到的是不同頻率的小波函數(shù),而通過(guò)傅立葉變換分解得到的是三角函數(shù),顯然,這兩者存在較大的差異。在小波變換中,最后所需要得到的小波函數(shù)的計(jì)算依據(jù)是分解得到的不同頻率的小波函數(shù)的變換以及其變換尺度,并且可以分為兩個(gè)部分:高頻部分和低頻部分。在使用小波變換的實(shí)際研究過(guò)程中,由于高頻層中的噪聲是普遍存在的,所以在使用小波變換時(shí)通常有以下幾步:第一、分解原始信號(hào),得到n層的小波分量以及n層的高低頻系數(shù);第二、設(shè)定較為合適的閾值,方便在對(duì)這些高低頻系數(shù)進(jìn)行量化之后,能夠有效的進(jìn)行濾波,消除噪聲;第三、處理完這些高低頻系數(shù)之后,將得到的小波函數(shù)重組,最終獲得消除了噪聲的新信號(hào)。但是,在定量模型的構(gòu)建和實(shí)踐中,小波分析中的參數(shù)選擇問(wèn)題是一個(gè)很大的問(wèn)題。過(guò)多的參數(shù)依賴性將大大降低模型的可信度。1.2濾波原理HP濾波方法被廣泛應(yīng)用于宏觀經(jīng)濟(jì)變量的研究領(lǐng)域中。首次被提出是在1980年,Hodrick和Prescott用來(lái)分析美國(guó)戰(zhàn)后的經(jīng)濟(jì)運(yùn)行狀況。因此,HP濾波最初就是用來(lái)分析宏觀經(jīng)濟(jì)數(shù)據(jù)的,其目的是為了得到一個(gè)小且穩(wěn)定的波動(dòng)方差。在這個(gè)過(guò)程中,不斷的調(diào)整所研究的時(shí)間序列的波動(dòng)性,讓其波動(dòng)范圍與均值的變化范圍是相匹配的。從數(shù)理理論的角度出發(fā),HP濾波器的原理簡(jiǎn)單來(lái)說(shuō)就相當(dāng)于是一個(gè)高通濾波器。HP濾波器可以自動(dòng)的將不同頻率的時(shí)間序列數(shù)據(jù)的波形分解,得到多種頻率不同的波形組合,然后過(guò)濾掉頻率較低的波形,最終得到的波形是波動(dòng)幅度可控的且波動(dòng)頻率較大的。接下來(lái),介紹HP濾波方法在股票價(jià)格預(yù)測(cè)領(lǐng)域上的應(yīng)用。假設(shè)原信號(hào)包含主要趨勢(shì)成分和噪聲成分,那么需要先將其中的主要趨勢(shì)成分和噪聲成分區(qū)分開(kāi)來(lái),公式如下:yt=g用HP濾波方法將股票指數(shù)序列分解為線性的趨勢(shì)項(xiàng)和非線性的周期項(xiàng),要通過(guò)HP濾波從yt中將gt和minSλ其中,殘差項(xiàng)t=1Tyt?gt2刻畫(huà)了主要趨勢(shì)成分gt對(duì)原序列yt的追蹤程度,而二階差分項(xiàng)t=3Tgt?g接下來(lái),給出HP濾波最優(yōu)化問(wèn)題的求解過(guò)程。式(5-3)是一個(gè)無(wú)約束極值問(wèn)題,最高階為二階,存在解析解。通過(guò)對(duì)不同gi?S(5-3)在求解線性方程組的數(shù)值時(shí),主要有兩種方法可以選擇。第一種是直接法,將要求解的方程組轉(zhuǎn)化為等價(jià)的三角形方程,然后求解方程組,這樣得到的結(jié)果具有較高的精度。除了等價(jià)的三角形方程組外,也可以選擇轉(zhuǎn)化為其他等價(jià)的可以求解的方程組。第二種是迭代法,它通過(guò)計(jì)算機(jī)利用一定的極限過(guò)程逐步逼近線性方程組的精確解。迭代法雖然也存在一定的錯(cuò)誤率,但其需要的計(jì)算機(jī)存儲(chǔ)單元小,求解速度快。而在本文的研究分析中,認(rèn)為整個(gè)模型的好壞是由解線性方程的速度決定的,因此,在速度和精度二者中,優(yōu)先選擇速度。1.3實(shí)驗(yàn)說(shuō)明(1)實(shí)驗(yàn)環(huán)境。本文模型試驗(yàn)階段的程序是在VScode和RStudio編輯器上實(shí)現(xiàn)的。VScode是一個(gè)運(yùn)行于MacOSX、Windows和Linux之上的,針對(duì)于編寫(xiě)現(xiàn)代Web和云應(yīng)用的跨平臺(tái)源代碼編輯器,能夠極大提升python語(yǔ)言開(kāi)發(fā)效率的編輯器。RStudio是個(gè)IDE,代碼編寫(xiě)的集成環(huán)境,沒(méi)有R的話,Rstudio沒(méi)法正常運(yùn)行。RStudio改善了R原生的那種比較粗糙的編寫(xiě)環(huán)境,在用R的時(shí)候更方便,更高效。實(shí)驗(yàn)的運(yùn)行環(huán)境為:Intel(R)Core(TM)i5-8250U、12G內(nèi)存(SSD)、Windows10、64位操作系統(tǒng)、python3.8、pandas、numpy、tensorflow、xlrd、sklearn、matplotlib、RX644.4.0。(2)訓(xùn)練樣本。本文第三章預(yù)處理后的數(shù)據(jù)集,共3857組數(shù)據(jù)。(3)預(yù)測(cè)樣本。本文第三章預(yù)處理后的數(shù)據(jù)集,共10組數(shù)據(jù)。(4)LSTM網(wǎng)絡(luò)設(shè)置:一共有4層網(wǎng)絡(luò),包括三層雙向LSTM網(wǎng)絡(luò)和一層全連接層,其中,每層雙向LSTM網(wǎng)絡(luò)由32個(gè)神經(jīng)單元組成,全連接層由64個(gè)神經(jīng)單元組成。1.3HP濾波分解時(shí)間序列根據(jù)以往的研究經(jīng)驗(yàn),可將λ取為14400。因此本文選擇HP的λ為14400,分解出的趨勢(shì)序列和噪音序列如圖5-1所示。圖5-1HP濾波下分解的趨勢(shì)序列與噪音序列由圖5-1,可以得到HP濾波分解后的兩個(gè)序列圖。其中趨勢(shì)序列較好的表現(xiàn)的原序列的趨勢(shì),而噪音序列在0的周?chē)舷虏▌?dòng)。特別需要注意的是,本章將利用HP濾波分解股票時(shí)間序列,將時(shí)間序列分為趨勢(shì)序列和噪音序列,而后用ARIMA模型和深層雙向長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)趨勢(shì)序列和噪音序列。由于ARIMA模型只適用于短期預(yù)測(cè),所以這里的訓(xùn)練集和測(cè)試集需要重新選擇。本章選取前3857條數(shù)據(jù)作為訓(xùn)練集,后10條數(shù)據(jù)作為測(cè)試集。1.4基于Hp濾波的ARIMA模型的股票價(jià)格預(yù)測(cè)1.4.1ARIMA模型的建模步驟(1)畫(huà)出時(shí)序圖、自相關(guān)和偏自相關(guān)圖,利用這些圖形(或者利用單位根檢驗(yàn)判別)判斷序列的平穩(wěn)性。(2)通過(guò)差分運(yùn)算得到平穩(wěn)的時(shí)間序列,一般來(lái)說(shuō),進(jìn)行一到兩次差分運(yùn)算,就可以得到,否則,就可以認(rèn)為該時(shí)間序列不適合用ARIMA模型來(lái)進(jìn)行建模。(3)對(duì)差分后的時(shí)間序列進(jìn)行平穩(wěn)性檢驗(yàn),以及白噪聲序列,有時(shí)會(huì)出現(xiàn)差分后序列平穩(wěn)下來(lái),但是差分后的序列為白噪聲,那么這時(shí)候該時(shí)間序列同樣不適合ARIMA模型的建模處理。(4)畫(huà)出差分后時(shí)間序列的時(shí)序圖、自相關(guān)和自相關(guān)圖,來(lái)對(duì)該ARIMA模型進(jìn)行定階(或者利用最小AIC準(zhǔn)則來(lái)定階也可以)。(5)求出模型的各項(xiàng)參數(shù)。(6)對(duì)模型的殘差進(jìn)行白噪聲檢驗(yàn)和參數(shù)進(jìn)行顯著性檢驗(yàn)。(7)利用模型進(jìn)行預(yù)測(cè)。1.4.2建立模型首先我們可以畫(huà)出時(shí)序圖如圖5-2所示。圖5-2時(shí)序圖在RStudio上進(jìn)行ADF檢驗(yàn),得到結(jié)果如圖5-3所示。圖5-3ADF檢驗(yàn)結(jié)果由圖5-3,發(fā)現(xiàn)P值遠(yuǎn)大于0.05,所以該序列為非平穩(wěn)時(shí)間序列。因此,需要進(jìn)行差分運(yùn)算,去除時(shí)間序列的趨勢(shì)因素。圖5-4差分后時(shí)序圖圖5-4為一階差分后的時(shí)序圖,可以看到數(shù)據(jù)在0周?chē)舷虏▌?dòng),應(yīng)該為較平穩(wěn)的序列。對(duì)已經(jīng)進(jìn)行一階差分的序列進(jìn)行ADF檢驗(yàn),結(jié)果如圖5-5所示。圖5-5差分后的ADF檢驗(yàn)結(jié)果這里看到p值小于0.01,因此我們可以拒絕原假設(shè),認(rèn)為該序列是平穩(wěn)序列。接下來(lái),進(jìn)行白噪聲檢驗(yàn),結(jié)果如圖5-6所示。圖5-6白噪聲檢驗(yàn)這里白噪聲檢驗(yàn)的p值遠(yuǎn)小于0.05,因此可以認(rèn)為一階差分序列非白噪聲序列,說(shuō)明該序列適合ARIMA模型的建模處理。在RStudio上畫(huà)出序列的自相關(guān)圖和偏相關(guān)圖,得到結(jié)果如圖5-7和圖5-8所示。圖5-7自相關(guān)圖圖5-8偏相關(guān)圖由圖5-7的自相關(guān)圖和圖5-8的偏相關(guān)圖,可以看到自相關(guān)系數(shù)是拖尾的,而偏相關(guān)系數(shù)是明顯二階截尾的。因此建立ARIMA(2,1,0)模型。圖5-8ARIMA模型擬合效果由圖5-8可以得到ARIMA(2,1,0)模型的擬合效果較好。因此使用ARIMA(2,1,0)模型來(lái)預(yù)測(cè)趨勢(shì)序列的未來(lái)10天的數(shù)值分別為3396.456、3401.031、3401.578、3410.088、3414.551、3418.956、3423.293、3427.553、3431.727、3431.805。1.5基于HP濾波的ARIMA-DBLSTM模型的股票價(jià)格預(yù)測(cè)根據(jù)第四章的結(jié)論,可以得到深度雙向長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果優(yōu)于單層長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò),因此本章將直接采用第四章中的深度雙向長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)模型對(duì)噪音序列進(jìn)行預(yù)測(cè)。這里的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為:4層網(wǎng)絡(luò),包括三層雙向LSTM網(wǎng)絡(luò)和一層全連接層,其中,每層雙向LSTM網(wǎng)絡(luò)由32個(gè)神經(jīng)單元組成,全連接層由64個(gè)神經(jīng)單元組成。在最后一個(gè)雙向LSTM層和全連接層中添加一個(gè)系數(shù)為0.1的Dropout層。經(jīng)過(guò)模型訓(xùn)練,最后對(duì)未來(lái)10天的噪音序列進(jìn)行預(yù)測(cè),得到預(yù)測(cè)結(jié)果為-9.630127、0.96295166、7.1239624、32.30359、11.36908、-22.90332、-20.65216、1.23584、-11.693726,30.766785。將趨勢(shì)序列和噪音序列的結(jié)果相加,得到ARIMA—DBLSTM模型的預(yù)測(cè)結(jié)果,如表5-1所示。表5-1各模型精度對(duì)比模型MAEMSERMSEEVSrDBLSTM模型19.585398.4619.9620.99975
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年貴州23年教資筆試及答案
- 2025年學(xué)科教學(xué)筆試及答案
- 民航新疆空管局2026屆畢業(yè)生招聘補(bǔ)充考試備考題庫(kù)及答案解析
- 2025年河南省屬企業(yè)招聘筆試及答案
- 2025年長(zhǎng)沙地鐵站筆試及答案
- 2026年房企如何應(yīng)對(duì)市場(chǎng)不確定性
- 2025年河北人事職稱考試及答案
- 2025年任丘市人事考試及答案
- 2025年平原縣人事考試及答案
- 2025年今年10月事業(yè)單位考試及答案
- GB/T 9706.266-2025醫(yī)用電氣設(shè)備第2-66部分:助聽(tīng)器及助聽(tīng)器系統(tǒng)的基本安全和基本性能專用要求
- (一模)株洲市2026屆高三年級(jí)教學(xué)質(zhì)量統(tǒng)一檢測(cè)地理試卷(含答案詳解)
- 2026年企業(yè)級(jí)云服務(wù)器采購(gòu)合同
- 2026廣西桂林醫(yī)科大學(xué)人才招聘27人備考題庫(kù)(第一批)及參考答案詳解一套
- 2026年度黑龍江省生態(tài)環(huán)境廳所屬事業(yè)單位公開(kāi)招聘工作人員57人備考題庫(kù)及答案詳解一套
- 2025安徽省中煤三建國(guó)際公司機(jī)關(guān)工作人員內(nèi)部競(jìng)聘31人筆試歷年參考題庫(kù)附帶答案詳解
- 2026國(guó)家國(guó)防科技工業(yè)局所屬事業(yè)單位第一批招聘62人筆試參考題庫(kù)及答案解析
- 北京2025年北京教育科學(xué)研究院公開(kāi)招聘筆試歷年參考題庫(kù)附帶答案詳解
- 2025至2030中國(guó)谷氨酸和味精行業(yè)深度研究及發(fā)展前景投資評(píng)估分析
- 產(chǎn)品品質(zhì)管理控制模板與實(shí)施手冊(cè)
- 人教版高二化學(xué)上冊(cè)期末真題試題題庫(kù)試題附答案完整版
評(píng)論
0/150
提交評(píng)論