【《基于BP神經網絡-ARIMA復合模型的股價預測實證分析》12000字】_第1頁
【《基于BP神經網絡-ARIMA復合模型的股價預測實證分析》12000字】_第2頁
【《基于BP神經網絡-ARIMA復合模型的股價預測實證分析》12000字】_第3頁
【《基于BP神經網絡-ARIMA復合模型的股價預測實證分析》12000字】_第4頁
【《基于BP神經網絡-ARIMA復合模型的股價預測實證分析》12000字】_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于BP神經網絡-ARIMA復合模型的股價預測實證研究目錄TOC\o"1-3"\h\u18649第一章、緒論 283941.1研究背景與意義 267611.2研究目標和方法 221609第二章、文獻綜述 628738第三章、相關理論 8173693.1ARIMA模型 814333.2神經網絡 913563第四章、ARIMA-BP神經網絡組合模型 1126584.1數據選取 11233544.2數據處理 11170154.2.1收盤價ADF檢驗 12226894.3BP神經網絡模型預搭建階段 13263494.4BP神經網絡模型訓練階段 14277444.5搭建ARIMA模型 1789504.6BP神經網絡-ARIMA組合模型預測 1825236第五章、穩(wěn)定性檢驗 2043645.1數據周期對股價預測的影響 20141705.2訓練次數對股價預測的影響 225695.3個股選擇對股價預測的影響 23121495.4樣本容量對股價預測的影響 2326792參考文獻 25摘要:通過在A股市場的28個板塊中,綜合考量成交量、EXPMA指數平均數、PRICEOSC指標等技術指標,每個板塊選取兩支股票,獲取每支股票從2019年1月2日9:31到2021年3月19日15:00共計128,881個分鐘收盤價??傆柧殠鞌祿€數7,217,336個。利用總訓練庫的數據,將模型的預測效果作為衡量標準,不斷修改完善預設的BP神經網絡模型的基本參數,并探索搭建好的BP神經網絡模型的預測期數。本文通過發(fā)揮ARIMA模型趨勢性預測良好的優(yōu)勢,降低BP神經網絡模型的深度學習難度,進而提高了BP神經網絡模型的預測精度,并且在成功擴大了預測期數。BP神經網絡-ARIMA復合模型很好的提高了BP神經網絡模型的整體性能。針對新提出的模型進行了穩(wěn)定性分析,考慮了研究對象、持倉時間、數據時間周期對模型的影響。仿真實驗證明該模型的預測效果穩(wěn)定,說明該模型具有普遍適用性、市場實用性和穩(wěn)定可行性。該模型可以為眾多投資者和市場監(jiān)管者帶來一定的指導方向和參考價值。關鍵詞:BP神經網絡模型;ARIMA模型;股價預測第一章、緒論1.1研究背景與意義隨著中國金融市場的蓬勃發(fā)展,股票市場愈發(fā)受國內投資者青睞。股票價格的趨勢判斷備受學術界與金融投資界關注。股票價格的變化是一種振蕩明顯、不穩(wěn)定、復雜且難以預測的時間序列。收盤價是一個包含非常多投資信息的價格,不僅反映著金融市場對某只股票的關注程度,也有能預示下一交易時間段的股價走勢的作用。對于收盤價的預測具有十分重要的現實投資意義。由于傳統(tǒng)非人工智能的方法在處理海量、龐雜的股價數據工程量大,在實際預測中往往不盡如人意。為模擬現代投資的分散非系統(tǒng)性風險的實際需求,本文使用金融預測中前沿的機器學習之BP神經網絡模型(卷積神經網絡),在海量的數據集中找到最優(yōu)學習集合。且與ARIMA模型結合,修正神經網絡模型在預測時的精度問題,進一步提高神經網絡模型在預測時的準確度。BP神經網絡-ARIMA復合模型在實際股票組合投資中具有良好的指導意義與潛在價值,是一款新型高效準確的組合投資的預測模型,供機構投資者參考。1.2研究目標和方法本文旨在通過優(yōu)化深度學習之神經網絡模型來實現對股票收盤價的預測。借助BP神經網絡模型、LSTM神經網絡模型、ARIMA模型、深度學習等相關理論基礎,構建ARIMA-BP神經網絡模型與ARIMA-LSTM神經網絡模型,通過對各種模型預測結果的比較分析,篩選出效果最優(yōu)的復合模型。最后將最優(yōu)模型應用于分散化投資,進行模型的穩(wěn)定性分析,若預測結果穩(wěn)定且準確,此組合模型便具備日常股票投資的實用性與實用性。本文在A股市場全部28個板塊中(農林牧漁、采掘、化工、鋼鐵、有色金屬、建筑材料、建筑裝飾、電氣設備、機械設備、國防軍工、汽車、電子、家用電器、食品飲料、紡織服裝、輕工制造、醫(yī)藥生物、公用事業(yè)、交通運輸、房地產、銀行、非銀金融、商業(yè)貿易、休閑服務、計算機、傳媒、通信、綜合),根據成交量、EXPMA指數平均數、PRICEOSC指標、MACD指數平滑異同平均指標等,在每個版塊選取兩只業(yè)績優(yōu)良并且流通市值位居板塊前列的股票,共計56只股票。每只股票通過爬蟲方法獲取2019年1月2日9:31-2021年3月19日15:00共計128,881個分鐘收盤價??傆柧殠鞌祿€數為7,217,336個。整個實證過程分為四個階段:1.數據預處理與模型預訓練階段。首先將56支股票的原始收盤價數據分為1分鐘收盤價數據、5分鐘收盤價數據、20分鐘收盤價數據、一小時收盤價數據、日收盤價數據五類,分別進行穩(wěn)定性分析,將不平穩(wěn)的數據做n階差分處理(做了差分處理的數據,在模型最后再做反歸一化處理,獲得價格數據),得到按照時間間隔劃分的平穩(wěn)收盤價數據。之后開始搭建BP神經網絡模型與LSTM神經網絡模型。在進行海量測試后發(fā)現,對于收盤價的預測而言,BP神經網絡模型的預測效果顯著大于LSTM神經網絡模型的預測效果,筆者本人最終采取BP神經網絡模型作為復合模型的一部分。通過預設輸入層感知器個數、隱含層層數、隱含層每層感知器個數、輸出層感知器個數、輸入層到隱含層的權重、隱含層到傳輸層的偏置、學習速率、選取合適的激勵函數等,通過這56支股票的平穩(wěn)收盤價數據不斷輸入預搭建的BP神經網絡模型,將得到的預測結果于真實數據做對比,不斷修改完善以上模型的基本參數,最終獲得最優(yōu)模型基本參數,并且初步探索可預測期數,模型預搭建完成。BP神經網絡模型股價預測訓練過程示意圖2.BP神經網絡模型搭建與訓練階段。對于“收盤價”的五組分時訓練的平穩(wěn)數據,通過對比不同基本參數得到的預測結果的準確度,最終選取了“1-12-1-1”的BP神經網絡模型,即一層輸入層(其中感知器個數為1)、兩層隱含層(其中感知器個數分別為12和1)、一層輸出層(其中感知器個數為1)的模型構造。激勵函數選取Sigmoid函數,由于BP神經網絡模型具有誤差反向傳播的特點,本文通過梯度下降法計算梯度進行迭代,更新參數向量。模型搭建完成,將平穩(wěn)的收盤價數據輸入模型,找到最優(yōu)機器學習的次數,設定該次數為本BP神經網絡模型的迭代次數,劃分訓練集與預測集,以訓練集數為600,預測集數為200,共800個數據,機器學習次數為500次,預測期數為2期為例,訓練集輸入1-598的收盤價數組,通過模型初步預測,輸出3-600的收盤價數組,預測值即為數組中599號與600號兩個收盤價,與訓練集中的599號與600號收盤價做對比,第一次預測偏差較大,該1-598的收盤價數組被重新導入輸入層,整個模型更新輸入層到隱含層的權重與隱含層到輸出層的權重,并且該數組會選擇新的進入隱含層的感知器。以上過程為一次機器學習的內部過程。通過以上500次機器學習過程,模型根據損失函數設置了最優(yōu)的內部參數,再將預測集的數據導入,輸入601-798的收盤價數組,通過500次機器學習,最終輸出603-800的收盤價數組,最后兩期799號與800號收盤價數據,即為BP神經網絡的預測數據。如果輸入的數據是經過差分處理的數據,那么得到的輸出數據還需進行反歸一化處理,才能獲得最終的預測收盤價。BP神經網絡模型內部結構示意圖3.ARIMA-BP神經網絡組合模型搭建與測試階段。該階段為對BP神經網絡的優(yōu)化階段。通過實驗可以得知,BP神經網絡在對噪聲的學習效果并不是特別理想,而ARIMA模型在處理收盤價這種時間序列在短期效果明顯,但ARIMA點擬合效果不佳,但趨勢擬合效果較優(yōu),ARIMA模型和BP神經網絡模型可以互補短處,將ARIMA模型融入BP神經網絡的預測中,可以提高BP神經網絡模型的預測能力。以訓練集數為600,預測集數為200,共800個數據,機器學習次數為500次,預測期數為2期為例,改良后的組合模型實現如下:通過ARIMA模型先對著800個數據進行平穩(wěn)化處理。訓練集與測試集確定最優(yōu)ARIMA模型,并往后預測5%樣本大小的數據。新的訓練集為1-570為原始平穩(wěn)數據,571-600為ARIMA預測數據;新的預測集為601-790為原始平穩(wěn)數據,791-800為ARIMA預測數據。將新的訓練集與預測集代入第二階段實驗,訓練BP神經網絡模型,得到組合模型預測結果。并與ARIMA模型,BP神經網絡模型,LSTM神經網絡模型,ARIMA-LSTM組合神經網絡模型預測結果作對比,找出最優(yōu)模型。ARIMA-BP神經網絡組合模型示意圖4.穩(wěn)健性檢驗階段。更換輸入樣本的時間類型,分別代入1分鐘收盤價數據、5分鐘收盤價數據、20分鐘收盤價數據、一小時收盤價數據、日收盤價數據的樣本,重復實驗。并且在實驗中適當擴大縮小樣本的大小,以確定樣本類型對該組合模型的影響程度。

第二章、文獻綜述傳統(tǒng)金融學派將股票價格的變動因素歸結為宏觀、中觀和微觀三個層面。宏觀層面包括銀行存款利率、國際收支、經濟增長情況、貨幣供應量等社會、政治、經濟、軍事、文化等因素;中觀層面包括該只股票所處行業(yè)的行業(yè)前景、行業(yè)地位、行業(yè)生命周期等行業(yè)發(fā)展與區(qū)域經濟發(fā)展狀況對該只股票的影響因素;微觀層面包括該只股票上市公司的經營狀況、財務狀況、管理水平、行業(yè)競爭水平等上市公司自身狀況的因素。其中,穩(wěn)固基礎理論將股票的內在價值視為未來全部股息的“現值”,實際中長期增長率與增長周期的不可預測讓這種方法失去計量的準確性。吳玉桐(2008)[1]吳玉桐,梁靜國.股票價格的影響因素研究[J].現代管理科學,2008(07):111-112.認為股價的變化時投資者的心理預期在股市中的綜合反應。股票價格受到諸多因素的影響,價格變化呈現非線性變化,傳統(tǒng)的預測方式并不適用于A股市場,基于股價的線性與非線性變化的假設中,有許多學者建立單一模型與復合模型將模擬數據逼近所研究的股票價格的變化。[1]吳玉桐,梁靜國.股票價格的影響因素研究[J].現代管理科學,2008(07):111-112.首先,基于股價在較短波動范圍內呈現線性變化的假設,國內外學者普遍采取ARIMA模型來對股價進行預測,翟志榮(2010)[2]翟志榮,白艷萍.基于MATLAB的自回歸移動平均模型(ARMA)在股票預測中的應用[J].山西大同大學學報(自然科學版),2010,26(06):5-7.搭建ARIMA模型預測單只股票的收盤價,相較于其他預測方法而言,對于波動不劇烈的股票樣本預測精度很高。徐晨萌(2019)[3]徐晨萌,方華.運用ARMA模型對股價預測的實證研究[J].經濟研究導刊,2019(31):77-82.ARMA模型可以較好地解決非平穩(wěn)金融時間序列的預測。高斯神經網絡預測(2004)[4]MatthiasSeeger.GaussianProcessesforMachineLearning[J]InternationalJournalofNeuralSystems,2004.、高斯回歸過程預測(2013)[5]楊振艦,夏克文.基于高斯過程回歸的上市股價預測模型[J].計算機仿真,2013,30(01):293-296+304.、灰色預測法(2015)[6]周琴,雍丹丹,王興龍.灰色神經網絡在股價預測中的應用[J].商,2015(39):169-170.、馬爾科夫鏈[7]張紫乾,劉明婉.馬爾科夫鏈模型對短期股價的預測[J].大眾投資指南,2019(12):272.等。在很多情況下,股價的變化存在非常復雜的噪聲,對股價在較短波動范圍內呈現線性變化的假設是忽略這些噪聲的,所以在精度層面而言,并非最佳模型。并且由于股價波動劇烈,且數據噪聲較大,傳統(tǒng)的線性模型難以準確刻畫股價波動的內在規(guī)律。[2]翟志榮,白艷萍.基于MATLAB的自回歸移動平均模型(ARMA)在股票預測中的應用[J].山西大同大學學報(自然科學版),2010,26(06):5-7.[3]徐晨萌,方華.運用ARMA模型對股價預測的實證研究[J].經濟研究導刊,2019(31):77-82.[4]MatthiasSeeger.GaussianProcessesforMachineLearning[J]InternationalJournalofNeuralSystems,2004.[5]楊振艦,夏克文.基于高斯過程回歸的上市股價預測模型[J].計算機仿真,2013,30(01):293-296+304.[6]周琴,雍丹丹,王興龍.灰色神經網絡在股價預測中的應用[J].商,2015(39):169-170.[7]張紫乾,劉明婉.馬爾科夫鏈模型對短期股價的預測[J].大眾投資指南,2019(12):272.所以國內外學者開始向“股價呈現非線性變化”的方向探索。實際上股票價格的波動受歷史數據、地方與國家對于該行業(yè)的政策等影響,突發(fā)事件、股民的心理預期等也會在不同程度上影響股價的變動,所以線性預測模型難以精準預測股價的變化規(guī)律?;诠蓛r在較短波動范圍內也會呈現非線性變化的假設,國內外學者普遍以SVM模型為基礎,鄔春學(2018)[8]鄔春學,賴靖文.基于SVM及股價趨勢的股票預測方法研究[J].軟件導刊,2018,17(04):42-44.從不同角度優(yōu)化SVM模型,從而達到精準預測股價的目的。楊新斌(2010)[9]楊新斌,黃曉娟.基于支持向量機的股票價格預測研究[J].計算機仿真,2010,27(09):302-305.建立基于支持向量機(SVM)的股市預測系統(tǒng)模型,發(fā)現支持向量機模型比神經網絡和CAR模型有較高的預測精度,證明SVM模型適用于股市預測等非線性問題的預測。謝國強(2012)[10]謝國強.基于支持向量回歸機的股票價格預測[J].計算機仿真,2012,29(04):379-382.基于粒子群優(yōu)化支持向量機(SVM),利用粒子群算法良好的尋優(yōu)能力,對支持向量機參數進行優(yōu)化,加快支持向量機學習速度,再采用非線性預測能力優(yōu)異的支持向量機對股票價格進行預測。Zhongx(2012)[11]ZhongxinDing.ApplicationofSupportVectorMachineRegressioninStockPriceForecasting[A].IntelligentInformationTechnologyApplicationAssociation.AdvancesinIntelligentandSoftComputing143[C].IntelligentInformationTechnologyApplicationAssociation:智能信息技術應用學會,2011:7.發(fā)現SVM模型能全面反映股票價格變化的非線性的時變規(guī)律。但是單純使用SVM模型有兩個很大的問題需要解決,SVM模型的參數優(yōu)化問題與預測區(qū)間過窄的問題。為了滿足實際投資者對于預測區(qū)間范圍的需要,國內外學者開始聚焦神經網絡技術(ANN)在股價預測中的作用。[8]鄔春學,賴靖文.基于SVM及股價趨勢的股票預測方法研究[J].軟件導刊,2018,17(04):42-44.[9]楊新斌,黃曉娟.基于支持向量機的股票價格預測研究[J].計算機仿真,2010,27(09):302-305.[10]謝國強.基于支持向量回歸機的股票價格預測[J].計算機仿真,2012,29(04):379-382.[11]ZhongxinDing.ApplicationofSupportVectorMachineRegressioninStockPriceForecasting[A].IntelligentInformationTechnologyApplicationAssociation.AdvancesinIntelligentandSoftComputing143[C].IntelligentInformationTechnologyApplicationAssociation:智能信息技術應用學會,2011:7.1987年,Ledes和Farbor第一次將神經網絡(ANN)運用到預測領域中,人工神經網絡是由大量簡單的處理單元按照某種方式聯(lián)結而成的自適應的非線性系統(tǒng).它具有高度的非線性全局作用與自學習功能,并且可以逼近任何連續(xù)函數,是預測股價的一種有效方法。但是RezaRamezanian(2019)[12]RezaRamezanianandArsalanPeymanfarandSeyedBabakEbrahimi.Anintegratedframeworkofgeneticnetworkprogrammingandmulti-layerperceptronneuralnetworkforpredictionofdailystockreturn:AnapplicationinTehranstockexchangemarket[J].AppliedSoftComputingJournal,2019,82認為使用人工神經網絡考慮股票價格時,具有時變性,且存在過擬合、局部最小等缺陷,預測結果有時不可靠,限制其在股票價格這種非線性、時變性問題的應用。人工神經網絡是證券市場預測研究的一個發(fā)展方向,但楊振艦(2013)[5]楊振艦,夏克文.基于高斯過程回歸的上市股價預測模型[J].計算機仿真,2013,30(01):293-296+304.認為目前在神經網絡的構造、專家經驗的提取、模糊形態(tài)的建立等方面,還不能得到滿意的結果。如隱含層數的選擇、過分強調擬合問題、局部最小值以及泛化性能不強。到后來的模糊神經網絡預測[13]劉慶玲.基于模糊深度學習網絡算法的短期股價預測[D].哈爾濱工業(yè)大學,2016.、高斯神經網絡(MatthiasSeeger)[4]MatthiasSeeger.GaussianProcessesforMachineLearning[J]InternationalJournalofNeuralSystems,2004.、BP神經網絡預測[14]陳小玲.基于ARIMA模型與神經網絡模型的股價預測[J].經濟數學,2017,34(04):30-34.、RBF神經網絡預測[15]俞國紅,楊德志,叢佩麗.ARIMA和RBF神經網絡相融合的股票價格預測研究[J].計算機工程與應用,2013,49(18):245-248+259.[12]RezaRamezanianandArsalanPeymanfarandSeyedBabakEbrahimi.Anintegratedframeworkofgeneticnetworkprogrammingandmulti-layerperceptronneuralnetworkforpredictionofdailystockreturn:AnapplicationinTehranstockexchangemarket[J].AppliedSoftComputingJournal,2019,82[5]楊振艦,夏克文.基于高斯過程回歸的上市股價預測模型[J].計算機仿真,2013,30(01):293-296+304.[13]劉慶玲.基于模糊深度學習網絡算法的短期股價預測[D].哈爾濱工業(yè)大學,2016.[4]MatthiasSeeger.GaussianProcessesforMachineLearning[J]InternationalJournalofNeuralSystems,2004.[14]陳小玲.基于ARIMA模型與神經網絡模型的股價預測[J].經濟數學,2017,34(04):30-34.[15]俞國紅,楊德志,叢佩麗.ARIMA和RBF神經網絡相融合的股票價格預測研究[J].計算機工程與應用,2013,49(18):245-248+259.BP神經網絡模型是金融與經濟領域應用非常廣泛的神經網絡模型,是一種通過誤差逆向傳播算法訓練的多層前饋神經網絡。具有了較強的非線性映射能力、泛化以及容錯能力等諸多優(yōu)點。樊重俊等(2008)[16]樊重俊.非線性經濟預測中的神經網絡方法評述[J].統(tǒng)計與決策,2008(13):161-162.通過對神經網絡方法和傳統(tǒng)統(tǒng)計預測方法的比較,說明了神經網絡方法有助于提高預測精度;郝勇等(2006)[17]郝勇,運用神經網絡技術研究上海證券股票價格分類指數的波動規(guī)律.上海市,上海工程技術大學,2006-01-01.運用BP神經網絡,對公用事業(yè)指數波動規(guī)律進行預測和分析,達到了較理想的預測效果。但是傳統(tǒng)BP模型存在著變量選擇困難、收斂速度慢和無法用于訓練深層神經網絡等缺點。并且BP神經網絡模型隱含層的單元數卻很難判定:單元數量過少會影響模型訓練和預測的精度,實證效果降低;另外,過多單元數則會影響網絡概括推理能力??梢?,模型設定是否成功在于精準確定隱含層層數以及相應的單元數。[16]樊重俊.非線性經濟預測中的神經網絡方法評述[J].統(tǒng)計與決策,2008(13):161-162.[17]郝勇,運用神經網絡技術研究上海證券股票價格分類指數的波動規(guī)律.上海市,上海工程技術大學,2006-01-01.針對BP神經網絡模型的各種不足,國內外學者從不同的角度對該模型進行優(yōu)化:(一)部分學者通過優(yōu)化模型的算法來提高模型預測的精度。徐清風(2021)[18]徐清風,于茹月,勾宇軒,趙云澤,李勇,黃元仿.基于云遺傳BP神經網絡的黃淮海旱作區(qū)土壤有機質預測精度分析[J].中國農業(yè)大學學報,2021,26(04):167-173.[18]徐清風,于茹月,勾宇軒,趙云澤,李勇,黃元仿.基于云遺傳BP神經網絡的黃淮海旱作區(qū)土壤有機質預測精度分析[J].中國農業(yè)大學學報,2021,26(04):167-173.通過使用云遺傳算法的BP神經網絡模型,提升了BP神經網絡模型的預測效率;曹曉(2017)[19]曹曉,孫紅兵.基于灰色GARCH模型和BP神經網絡的股票價格預測[J].軟件,2017,38(11):126-131.使用灰色GARCH-BP神經網絡復合模型,彌補bp算法的低精度問題。GARCH殘差序列經過BP神經網絡模型的測算后,利用預測值矯正灰色GARCH模型的預測結果,提高了股票價格的預測精度。(二)有些研究致力于提高BP神經網絡模型的運算速度。郭明霄(2021)[20]郭明霄,王宏偉,王佳,李昊哲,楊仕旗.基于動量分數階梯度的卷積神經網絡優(yōu)化方法[J/OL].計算機工程與應用:1-9[2021-05-03]./kcms/detail/11.2127.TP.20210420.1125.042.html.動量分數階梯度下降算法,解決了傳統(tǒng)BP神經網絡使用梯度下降法導致的收斂速度非常慢的問題,大大提升了BP模型的訓練速度。如何更好地將BP模型應用于金融領域一直是各界學者想要解決的問題。[19]曹曉,孫紅兵.基于灰色GARCH模型和BP神經網絡的股票價格預測[J].軟件,2017,38(11):126-131.[20]郭明霄,王宏偉,王佳,李昊哲,楊仕旗.基于動量分數階梯度的卷積神經網絡優(yōu)化方法[J/OL].計算機工程與應用:1-9[2021-05-03]./kcms/detail/11.2127.TP.20210420.1125.042.html.BP神經網絡的組合模型相對于單一模型,前者具有高精準度和預測精度,強健性和強抗過度擬合能力等優(yōu)勢。本文通過發(fā)揮ARIMA模型趨勢性預測良好的優(yōu)勢,降低BP神經網絡模型的深度學習難度,可以揚長避短,能夠更有效地研究股票價格的運行規(guī)律和趨勢走向。

第三章、相關理論3.1ARIMA模型(一)ARMA模型理論基礎

ARMA模型也稱Box–Jenkins模型,簡稱B-J法,20世紀70年代初,是美國統(tǒng)計學家Box和英國統(tǒng)計學家Jenkins共同提出的一種時間序列的分析方法。在當前經濟學的研究中,ARMA模型是擬合平穩(wěn)時間序列最常用的模型。平穩(wěn)性時間序列是指當時間發(fā)生變化時該序列的基本性質不會發(fā)生變化;而非平穩(wěn)性時間序列,則是指統(tǒng)計規(guī)律隨著時間的變化而變化。因此,當我們得到一組時間序列數據時,首先要對其進行ADF檢驗以判斷該組數據的平穩(wěn)性,若得到的時間序列是非平穩(wěn)的,我們就需要對原始數據進行對數或差分處理使其平穩(wěn)。其次,繪出平穩(wěn)時間序列的ACF與PACF的圖像,確定幾個備選模型。然后對每個備選模型進行估計與檢驗,并根據備選模型的SC、AIC以及擬合度R2判斷模型是否滿足簡約性,即最小的SC、ARMA模型是由自回歸模型AR(p)模型和移動平均模型MA(q如果時間序列yt的每個觀測值都是當期及其前期隨機擾動項的加權平均和,那么該過程是移動平均過程,可用MA(y而AR(p)模型和MA(q)模型都是ARMA(p,q)的特例:當p=0時,ARMA(0,q)即為MA(q)模型;當y其中,(二)ARMA模型的定階與識別在模型的定階與識別時,我們主要觀察不同時間點上的自相關函數與偏自相關函數。做出該時間序列每個時間點上的觀察值,獲得極端值、缺省值、結構變化等隱含在數據中的信息。當時間序列非平穩(wěn)時,我們可以先更正極端值與缺省值或進行一階差分使其平穩(wěn)化,然后進行p和q階數的確定。對于MA(q)過程,ACF會在q階之前顯示顯著異于零的自相關系數,而在q階之后立刻衰減;而PACF則以指數形式迅速衰減或是以正弦波形式振蕩衰減。相對于MA過程,AR(p)過程的ACF以指數形式迅速衰減或是以正弦波形式振蕩衰減;而PACF則會在p階之前表現出顯著的峰值即自相關性,隨后迅速下降。如果ACF與PACF無一衰減,均顯示為拖尾,那么數據就很有可能是兩者結合的過程,我們則選擇建立(三)ARIMA模型的定階與識別ARMA(p,d,qARMA(1-其中3.2神經網絡神經網絡分為生物神經網絡與人工神經網絡兩種。生物神經網絡,一般指生物的大腦神經元、細胞、觸點等組成的網絡。用于產生生物的意識、幫助生物進行思考和行動。人工神經網絡(ArtificialNeuralNetworks,簡稱為ANNs)是一種模仿動物神經網絡行為特征,進行分布式并行信息處理的數學模型。這種網絡依靠系統(tǒng)的復雜程度,通過調節(jié)內部大量節(jié)點之間相互連接的關系,從而達到處理信息的目的。BP(BackPropagation)神經網絡是1986年由Rumelhart和McClelland為首的科學家提出的概念。是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,也是應用最廣泛的神經網絡。BP神經網絡模型BP神經網絡是一種典型的非線性算法。BP神經網絡由輸入層、輸出層和之間的若干層(一層或多層)隱含層構成。每一層可以有若干個節(jié)點。這個節(jié)點又被稱為感知器。層與層之間節(jié)點的連接狀態(tài)通過權重來體現。如果只有一個隱含層,便是傳統(tǒng)的BP神經網絡模型,若含有多個隱含層,則屬于深度學習的神經網絡模型。其中,BP神經網絡的機器學習方式為反向傳播方式,訓練BP神經網絡的方法為梯度下降法。1.感知器—BP神經網絡中的單個節(jié)點感知器是1950年由FrankRosenblatt第一次引入。包括輸入項、權重、偏置、激活函數、輸出組成。感知器構成圖其中,X1、X2和X3為輸入節(jié)點,W1、W2和W3為權重,b為偏置,激活函數為f,輸出節(jié)點為output。2.BP神經網絡的反向傳播BP神經網絡模型的反向傳播流程圖BP神經網絡的反向傳播,是指將輸出的結果與理想的輸出結果進行比較,將輸出結果與理想輸出結果之間的誤差利用網絡進行反向傳播的過程,本質上是一個“負反饋”的過程。具體的過程是通過多次迭代的過程,不斷地對網絡上各個節(jié)點之間的所有權重進行調整,權重調整的方法為梯度下降法。3.梯度下降法梯度是一個矢量,表示某一函數在該點處的方向導數沿著該方向取得最大值,即函數在該點處沿著該方向(梯度方向)變化最快,變化率(該梯度的模)最大。當梯度取“正”時,上升最快;梯度取“負”時,下降最快。梯度下降法是訓練神經網絡和線性分類器的一種普遍方法。很多深度學習實際上都是在計算梯度,然后通過梯度進行迭代,更新參數向量。第四章、ARIMA-BP神經網絡組合模型4.1數據選取股票收盤價中,不同時間間隔的收盤價數據所包含的影響股價的信息存在差異,樣本訓練集和預測集中數據的間隔頻率、樣本容量都會影響模型的預測準確效果,現有研究都聚焦于日度數據,日度數據確實能很好的反映每天股價的總體震蕩情況,但是以日度數據為研究對象建立的模型卻不能很好的刻畫收盤價波動的內在規(guī)律,會失去非常多的交易信號。樣本容量在機器學習中也是非常關鍵的問題。如果樣本容量過大,機器學習中會因為計算各種復雜參數導致“過擬合”問題,若樣本容量過小,則機器學習不充分,模型的擬合能力較差。在本節(jié)中建立BP神經網絡模型的部分,也會探討這個問題。本文在A股市場全部28個板塊中(農林牧漁、采掘、化工、鋼鐵、有色金屬、建筑材料、建筑裝飾、電氣設備、機械設備、國防軍工、汽車、電子、家用電器、食品飲料、紡織服裝、輕工制造、醫(yī)藥生物、公用事業(yè)、交通運輸、房地產、銀行、非銀金融、商業(yè)貿易、休閑服務、計算機、傳媒、通信、綜合),根據成交量、EXPMA指數平均數、PRICEOSC指標、MACD指數平滑異同平均指標等,在每個版塊選取兩只業(yè)績優(yōu)良并且流通市值位居板塊前列的股票,共計56只股票。每只股票通過爬蟲方法獲取2019年1月2日9:31-2021年3月19日15:00共計128,881個分鐘收盤價??傆柧殠鞌祿€數為7,217,336個。這里以單支股票平安銀行(股票代碼000001)為例,解釋每支股票的收盤價數據是如何影響B(tài)P神經網絡模型的預搭建過程的。4.2數據處理將平安銀行(股票代碼000001)的原始分鐘收盤價數據分為1分鐘收盤價數據、5分鐘收盤價數據、20分鐘收盤價數據、一小時收盤價數據、日收盤價數據五類,分別標記為1-5號樣本。下面分別對這五個樣本進行平穩(wěn)性檢驗。4.2.1收盤價ADF檢驗1-5號樣本平穩(wěn)性檢驗結果如下表所示,5個樣本均需要進行差分使之平穩(wěn)。1-5號樣本數據ADF檢驗表1分鐘數據5分鐘數據20分鐘數據一小時數據日數據TestStatistic-1.567812-1.102833-2.101261-2.450267-1.581319P-value0.75830.71670.24430.12830.4915CriticalValues:-3.43(1%)、-2.86(5%)、-2.57(10%)通過ADF檢驗可知,這五個樣本均不平穩(wěn),分別進行一階差分處理后,對原始數據進行一階差分后的序列圖與原本的序列圖更趨于平穩(wěn):1號樣本時間序列趨勢圖1號樣本自相關及偏自相關圖我們可以大致判斷經過一階差分后的時間序列為平穩(wěn)時間序列。經過一階差分處理后的DY序列的自相關系數和偏自相關系數迅速趨于0,圍繞0上下波動,并且自相關圖和偏自相關圖呈現明顯的拖尾。依據模型識別的基本原則,我們選擇建立ARIMA模型,模型中p和q階數的確定我們可以根據信息準則進行選擇。但是,單單用圖形法來判斷該組時間序列的平穩(wěn)性并不能得出確切的結論,我們仍需進行ADF的單位根檢驗以判斷該序列是否是真正的平穩(wěn)時間序列。我們選擇無趨勢項和無常數項進行ADF檢驗,新的TestStatistic值與P值如下表所示??梢缘玫揭浑A差分后,5個樣本均在99%的顯著性水平上呈現平穩(wěn)狀態(tài)。將1-5號樣本差分后的新樣本分別記為A、B、C、D、E號樣本。1-5號樣本差分后數據ADF檢驗表1分鐘數據5分鐘數據20分鐘數據一小時數據日數據TestStatistic-99.638-32.414-13.886-47.109-23.517P-value0.0000.0000.0000.0000.000Lags13232900CriticalValues:-3.43(1%)、-2.86(5%)、-2.57(10%)4.3BP神經網絡模型預搭建階段將平安銀行(股票代碼000001)的原始分鐘收盤價數據分為1分鐘收盤價數據、5分鐘收盤價數據、20分鐘收盤價數據、一小時收盤價數據、日收盤價數據五類,分別標記為1-5號樣本。分別進行ADF檢驗,差分后分別使其平穩(wěn),從淺層神經網絡模型開始探索。通過預設輸入層感知器個數為1、隱含層層數位1、隱含層每層感知器個數為2、輸出層感知器個數為1、輸入層到隱含層的權重、隱含層到傳輸層的偏置、機器學習次數為500次。由python自帶的numpy包自主完成運算與預設,激勵函數選擇Sigmoid函數,開始的樣本容量設置為800(訓練集樣本大小為600,預測集樣本大小為200)將得到的預測結果于真實數據做對比,預測效果不理想,開始不斷修改完善以上模型的基本參數,逐步增加隱含層層數與隱含層上感知器的個數,重復預測過程,記錄最優(yōu)模型參數,在1-5號樣本實驗完成后,更換股票樣本,重復以上操作,記錄最優(yōu)模型參數。為何不用“隨機搜索”和“遺傳算法”而采用梯度下降法?因為隨著網絡深度的增加和節(jié)點個數的增加,誤差會不斷增大,所以在本次神經網絡模型構建的過程中,使用梯度下降法修正參數。BP神經網絡模型結構表經過海量實驗預測后,發(fā)現輸入層個數上感知器個數為1,隱藏層個數在2層,感知器個數在10-15個,輸出層上感知器個數為1時,激勵函數選取Sigmoid函數,由于BP神經網絡模型具有誤差反向傳播的特點,本文通過梯度下降法計算梯度進行迭代,更新參數向量。以此基礎值設置的BP神經網絡模型的預測效果最優(yōu),在該并且初步探索可預測期數,模型預搭建完成。4.4BP神經網絡模型訓練階段預搭建好BP神經網絡模型之后,接下來開始探索可預測期數。將1-5號樣本代入預搭建好的BP神經網絡模型中,模型的學習次數為500次,訓練集容量為1000,預測集容量為200,預測期數即真實值、訓練集R方、預測集R方、最終損失函數如下表所示:BP神經網絡模型訓練記錄表預測值真實值訓練集R方預測集R方最終損失函數1號樣本預測一期9.6660099.730.9730.8080.00231號樣本預測兩期9.671779.730.9480.7170.00399.6664579.711號樣本預測三期9.6722459.730.9510.7160.00389.6722459.719.665949.722號樣本預測一期11.19045911.210.9790.7910.0012號樣本預測兩期11.18458211.210.9520.5940.002111.21257911.242號樣本預測三期11.17272111.210.9520.4510.003911.1916111.2411.18216511.23號樣本預測一期11.93350911.880.9690.90.000815473號樣本預測兩期12.0496511.880.9460.7990.001611.94800611.883號樣本預測三期12.04086611.880.9590.720.002512.031811.8812.06806811.784號樣本預測一期13.36598713.180.9700.9460.00114號樣本預測兩期13.52735813.180.9630.9130.002213.32209213.94號樣本預測三期13.45088513.180.8900.7940.003513.36588412.913.59255312.985號樣本預測一期21.82807522.470.9580.9490.0055號樣本預測兩期22.10856622.470.9220.9000.009221.82807522.235號樣本預測三期20.33650822.470.8780.8600.013319.95333722.2320.55339422.031號-5號樣本分別為平安銀行(股票代碼000001)2019年1月2日9:31-2021年3月19日15:00的1分鐘收盤價數據、5分鐘收盤價數據、20分鐘收盤價數據、一小時收盤價數據與日收盤價數據從表中可以很清晰的看出,隨著預測期數的擴大,預測的準確度開始迅速下降,預測集的R方也在部分樣本中出現直線下跌。在兩到三期預測中,也出現了預測趨勢與真實值變化趨勢相反的現象:4號樣本滯后二期預測圖3號樣本滯后三期預測圖在大量實驗中發(fā)現,BP神經網絡模型在小幅震蕩數據的短期預測中效果顯著:BP神經網絡模型一期預測圖所以在接下來的組合模型部分,將通過使用ARIMA模型與BP神經網絡模型的組合,來優(yōu)化BP神經網絡的預測效果,并且在保證精度的情況下擴大BP神經網絡模型對于收盤價的預測期數。4.5搭建ARIMA模型對A、B、C、D、E五個新樣本分別進行ARIMA模型的構建。通過統(tǒng)計軟件Eviews中ARIMA自動定階工具包,計算出A、B、C、D、E五個新樣本的ARIMA模型分別為:A號樣本為ARIMA(2,1,2),B號樣本為ARIMA(3,1,3),C號樣本為ARIMA(2,1,3),D號樣本為ARIMA(2,1,2),E號樣本為ARIMA(1,1,3),并且滯后預測10%的樣本大小,預測結果如下:A-E號樣本ARIMA模型預測圖不難發(fā)現,ARIMA模型在處理大樣本數據擬合的時候,預測容易陷入均衡點,我們適度縮小訓練集與預測集的大?。ㄓ柧毤萘空{整為800個,預測集容量調整為200個),更換股票樣本重復上述過程,發(fā)現ARIMA模型在趨勢預測上效果顯著:ARIMA模型預測圖在重復實驗的過程中,記錄相應樣本的ARIMA預測數據,以便代入BP神經網絡模型中。4.6BP神經網絡-ARIMA組合模型預測本節(jié)通過構造下圖所示的ARIMA-BP神經網絡組合模型,來達到優(yōu)化BP神經網絡的預測效果,并且在保證精度的情況下擴大BP神經網絡模型的預測期數。選取4號樣本前1000個數據,記為6號樣本。前800個數據記為訓練集,后200個數據記為預測集。分別將訓練集與預測集設置為7號和8號樣本。將7號樣本和8號樣本分別通過Eviews軟件找到最佳ARIMA模型,并且通過6號樣本的前780個數據往后預測20期,通過8號樣本的前195個數據往后預測5期。將兩次預測數據按照對應的時間,替換6號樣本原本對應時間的數據。將新的6號樣本代入已預搭建完成的BP神經網絡中,設置機器學習的次數為200次,組合模型預測效果、ARIMA模型預測效果、單BP神經網絡模型預測效果如下表所示:BP神經網絡模型訓練記錄表真實值ARIMA模型預測值BP神經網絡模型預測值ARIMA-BP神經網絡組合模型預測值一期預測:16.717.1393101417.1142

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論