版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基于神經(jīng)網(wǎng)絡(luò)算法的白酒行業(yè)股票預(yù)測(cè)實(shí)證研究摘要中國(guó)股市作為世界第二大市值的股票市場(chǎng),2021年在北京證券交易所設(shè)立后,已經(jīng)有4685家上市公司,96.5萬(wàn)億元人民幣市值。如何規(guī)避風(fēng)險(xiǎn),預(yù)測(cè)股票漲跌趨勢(shì)以獲得更高的收益,一直以來(lái)是中國(guó)和全球的研究者及投資者關(guān)注的熱門問(wèn)題。本文通過(guò)國(guó)內(nèi)外文獻(xiàn)了解了目前股票預(yù)測(cè)的研究現(xiàn)狀和所用技術(shù),發(fā)現(xiàn)在目前的預(yù)測(cè)研究中應(yīng)用的技術(shù)指標(biāo)越來(lái)越多,并且除技術(shù)指標(biāo)外,還將投資者情緒量化一起輸入模型,在訓(xùn)練中取得了比單獨(dú)輸入技術(shù)指標(biāo)更好的效果。本文以貴州茅臺(tái)、五糧液、瀘州老窖三只市場(chǎng)中熱門的白酒行業(yè)的股票為研究對(duì)象,從東方財(cái)富股吧爬取文本數(shù)據(jù)結(jié)合情感詞典將其轉(zhuǎn)換為情緒指標(biāo),將之與股票基本數(shù)據(jù)和由之得到的多種技術(shù)指標(biāo)結(jié)合,并通過(guò)最大信息系數(shù)和隨機(jī)森林進(jìn)行特征篩選,最后通過(guò)建立了CNN、LSTM、GRU神經(jīng)網(wǎng)絡(luò)對(duì)股票的漲跌趨勢(shì)進(jìn)行預(yù)測(cè),結(jié)果發(fā)現(xiàn)在輸入技術(shù)指標(biāo)和情緒指標(biāo)后,不同的神經(jīng)網(wǎng)絡(luò)都能在股票預(yù)測(cè)中表現(xiàn)出一定效果,至少在對(duì)白酒行業(yè)股票的預(yù)測(cè)中可以讓投資者使用較短時(shí)間周期的數(shù)據(jù)建立模型,花費(fèi)較低的時(shí)間成本對(duì)股票的漲跌趨勢(shì)進(jìn)行判斷,作為未來(lái)投資計(jì)劃的參考。其中CNN在較短的時(shí)間周期內(nèi)在每只股票的預(yù)測(cè)中都表現(xiàn)出了較好的效果,LSTM和GRU效果稍差。關(guān)鍵詞:股票預(yù)測(cè);情感分析;CNN神經(jīng)網(wǎng)絡(luò);LSTM神經(jīng)網(wǎng)絡(luò);GRU神經(jīng)網(wǎng)絡(luò)目錄摘要 1Abstract 11.引言 11.1研究背景與研究意義 11.1.1研究背景 11.1.2研究意義 21.2研究框架和研究方法 21.2.1研究框架 21.2.2研究方法 31.3研究可能的創(chuàng)新點(diǎn) 32.文獻(xiàn)綜述與理論基礎(chǔ) 42.1文獻(xiàn)綜述 42.1.1國(guó)內(nèi)研究現(xiàn)狀 42.1.2國(guó)外研究現(xiàn)狀 52.2文獻(xiàn)評(píng)述 52.3理論與技術(shù)基礎(chǔ) 62.3.1網(wǎng)絡(luò)爬蟲(chóng) 62.3.2文本情感分析 62.3.3神經(jīng)網(wǎng)絡(luò) 63.指標(biāo)與研究對(duì)象 113.1指標(biāo) 113.2研究對(duì)象 144.數(shù)據(jù)來(lái)源及處理 164.1數(shù)據(jù)來(lái)源 164.2數(shù)據(jù)處理 175.建立模型 205.1使用CNN進(jìn)行預(yù)測(cè) 205.2使用LSTM進(jìn)行預(yù)測(cè) 235.3使用GRU進(jìn)行預(yù)測(cè) 256.總結(jié)與展望 276.1研究總結(jié) 276.2不足與展望 27參考文獻(xiàn) 28附錄 301.引言1.1研究背景與研究意義1.1.1研究背景股票是重要的投資手段,隨著經(jīng)濟(jì)發(fā)展和經(jīng)濟(jì)全球化進(jìn)程的推進(jìn),尤其對(duì)中國(guó)這樣的新興經(jīng)濟(jì)體,上海、深圳證券交易所已成立超過(guò)30年,北京證券交易所也于2021年11月15日開(kāi)市,股票市場(chǎng)已成為中國(guó)證券市場(chǎng)和國(guó)民經(jīng)濟(jì)的重要組成部分。隨著國(guó)民生活水平的提高,可支配收入增加,股票投資作為一個(gè)近乎沒(méi)有門檻的投資手段,顯然會(huì)源源不斷地吸引大量投資者進(jìn)入。但同時(shí)股票市場(chǎng)也是變幻莫測(cè)的,尤其是對(duì)于基數(shù)最大的散戶投資者,往往會(huì)因?yàn)榻?jīng)驗(yàn)的欠缺、專業(yè)理解不足、盲目自信和自棄而進(jìn)行錯(cuò)誤操作,又或是因?yàn)榇篌w量“莊家”的進(jìn)場(chǎng)或退場(chǎng)無(wú)腦跟風(fēng)而被“宰”,并且這些情況往往會(huì)引起惡性循環(huán),使股票市場(chǎng)波動(dòng)加劇,最終使大量投資者虧損。因此,無(wú)論是研究者還是投資者都開(kāi)始關(guān)注股票漲跌趨勢(shì)的預(yù)測(cè),希望通過(guò)一定技術(shù)手段實(shí)現(xiàn)對(duì)股票未來(lái)的漲跌趨勢(shì)進(jìn)行較為科學(xué)的預(yù)測(cè),以此來(lái)判斷股票未來(lái)走勢(shì)和對(duì)將來(lái)的投資計(jì)劃進(jìn)行輔助和參考。在股票相關(guān)的預(yù)測(cè)研究中,傳統(tǒng)的基于有效市場(chǎng)假說(shuō),對(duì)市場(chǎng)信息和K線使用統(tǒng)計(jì)學(xué)相關(guān)知識(shí)的預(yù)測(cè)需要扎實(shí)的理論基礎(chǔ)、豐富的經(jīng)驗(yàn),并且往往需要花費(fèi)大量時(shí)間進(jìn)行計(jì)算或是只能得到模糊的結(jié)果。在人工神經(jīng)網(wǎng)絡(luò)問(wèn)世后,其強(qiáng)大的可塑性能夠較好的契合股票市場(chǎng)這樣參數(shù)復(fù)雜、非線性、規(guī)模巨大的特點(diǎn)。并且在現(xiàn)在的研究中,神經(jīng)網(wǎng)絡(luò)已被證明可在相關(guān)領(lǐng)域取得較好效果。另一方面,人是不可能永遠(yuǎn)保持理性的,投資者對(duì)風(fēng)險(xiǎn)的偏好和厭惡,來(lái)自各處的信息都可能影響決策。盡管行為金融學(xué)還處在發(fā)展階段,但不可否認(rèn)投資者的情緒會(huì)對(duì)他們的選擇產(chǎn)生影響。尤其是在中國(guó)這樣大體量、大基數(shù)同時(shí)又不太成熟的市場(chǎng)環(huán)境中,對(duì)于股票相關(guān)預(yù)測(cè)研究來(lái)說(shuō),投資者的情感是和技術(shù)指標(biāo)同樣重要的存在。1.1.2研究意義本文基于技術(shù)面和投資者情感對(duì)滬深熱點(diǎn)板塊中的白酒股票漲跌趨勢(shì)預(yù)測(cè)的研究主要有兩方面的意義。首先,在現(xiàn)實(shí)層面,對(duì)于個(gè)人投資者,由于大多數(shù)人不具備專業(yè)知識(shí)且經(jīng)驗(yàn)不足,本身就容易判斷錯(cuò)誤,加之被各種信息誤導(dǎo),就更容易造成損失并可能導(dǎo)致滾雪球效應(yīng),使損失的人更多甚至進(jìn)而影響市場(chǎng)。對(duì)于非個(gè)人投資者,雖然其可能具備強(qiáng)大財(cái)力以及專業(yè)團(tuán)隊(duì),但同時(shí)他們顯然無(wú)法操控散戶的情緒,而又不得不注意他們可能會(huì)帶來(lái)的影響。因此無(wú)論是哪一方,不僅需要從技術(shù)層面掌握市場(chǎng)動(dòng)向,也需要對(duì)投資者情感進(jìn)行量化,以便能夠更加理性的看待市場(chǎng)和進(jìn)行判斷。其次,研究通過(guò)對(duì)相關(guān)文本的處理與分析將投資者情感轉(zhuǎn)化為情緒指標(biāo),并將其作為變量與技術(shù)面指標(biāo)一起輸入不同的預(yù)測(cè)模型中進(jìn)行計(jì)算,通過(guò)檢驗(yàn)?zāi)P偷男Ч麑?duì)豐富股票相關(guān)領(lǐng)域的預(yù)測(cè)模型具有一定理論意義。1.2研究框架和研究方法本文的研究是基于技術(shù)面和投資者情感的滬深熱點(diǎn)板塊中白酒股票漲跌趨勢(shì)預(yù)測(cè)探析,首先通過(guò)開(kāi)源的證券數(shù)據(jù)平臺(tái)獲得股票的基本交易數(shù)據(jù)并通過(guò)其計(jì)算技術(shù)指標(biāo),通過(guò)爬蟲(chóng)從東方財(cái)富股吧獲得股票的評(píng)論內(nèi)容結(jié)合金融情感詞典進(jìn)行文本處理,將投資者情感量化,構(gòu)建情緒指標(biāo),接著建立神經(jīng)網(wǎng)絡(luò)模型將技術(shù)指標(biāo)和情緒指標(biāo)輸入模型預(yù)測(cè)股票的漲跌趨勢(shì),并且本文的研究在使用LSTM模型外,還將嘗試使用了CNN和GRU神經(jīng)網(wǎng)絡(luò)模型和優(yōu)化算法來(lái)比較各個(gè)模型的效果并得出結(jié)論。1.2.1研究框架本文基于技術(shù)面和投資者情感,選取滬深熱點(diǎn)板塊中白酒行業(yè)的貴州茅臺(tái)、五糧液和瀘州老窖這三只股票,研究了以技術(shù)面指標(biāo)和情緒指標(biāo)為輸入變量,漲跌幅為目標(biāo)變量的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。本文第一部分引言。本文第二部分是文獻(xiàn)綜述與理論基礎(chǔ)。這部分梳理和總結(jié)了相關(guān)文獻(xiàn)的研究成果,并對(duì)爬蟲(chóng)、投資者情感、神經(jīng)網(wǎng)絡(luò)理論和模型進(jìn)行介紹。本文第三部分介紹股票技術(shù)面指標(biāo)以及股票對(duì)象的選擇。本文第四部分介紹數(shù)據(jù)來(lái)源、獲取以及數(shù)據(jù)的基本處理。本文第五部分是建立預(yù)測(cè)模型。通過(guò)獲取到的股票的相關(guān)數(shù)據(jù),建立不同的神經(jīng)網(wǎng)絡(luò)模型,并展示預(yù)測(cè)結(jié)果。本文第六部分為總結(jié)與展望。1.2.2研究方法本文運(yùn)用文獻(xiàn)研究法和實(shí)證研究法進(jìn)行研究。首先,通過(guò)對(duì)國(guó)內(nèi)外相關(guān)文獻(xiàn)的梳理,了解投資者情感量化方法、神經(jīng)網(wǎng)絡(luò)模型的建立和股票預(yù)測(cè)模型的構(gòu)建等方面內(nèi)容。通過(guò)對(duì)以往研究思路和方法的學(xué)習(xí),最終形成本文的研究思路。其次,本文計(jì)算股票技術(shù)面指標(biāo)和通過(guò)爬蟲(chóng)技術(shù)獲得文本信息對(duì)投資者情感量化得到情緒指標(biāo),建立神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè),比較不同股票的技術(shù)面指標(biāo)和情緒指標(biāo)在不同神經(jīng)網(wǎng)絡(luò)模型中的表現(xiàn)效果,進(jìn)行分析,得出結(jié)論。1.3研究可能的創(chuàng)新點(diǎn)本文嘗試對(duì)股票的漲跌幅進(jìn)行預(yù)測(cè)而不是常用的股價(jià),并且截至2021年的文獻(xiàn)中,仍然在大量使用TensorFlow1.0及其衍生版本來(lái)構(gòu)建神經(jīng)網(wǎng)絡(luò),而本文嘗試使用TensorFlow2.0及以上版本進(jìn)行神經(jīng)網(wǎng)絡(luò)的構(gòu)建,盡管在軟件層面最新的不一定是最好的,但TensorFlow2.0也已發(fā)布了3年,更新了若干個(gè)版本,其穩(wěn)定性也已經(jīng)得到了檢驗(yàn)。本文除LSTM及其變體GRU外,還嘗試使用CNN來(lái)進(jìn)行預(yù)測(cè),此外由于漲跌幅中的跌幅通常由負(fù)數(shù)表示,線性整流函數(shù)(relu)、sigmoid等常用激活函數(shù)在輸入有負(fù)值時(shí)會(huì)導(dǎo)致神經(jīng)元不能被正確激活,而支持負(fù)值輸入的雙曲正切函數(shù)(tanh)又存在比較嚴(yán)重的梯度消失問(wèn)題,所以本文嘗試了基于relu的能適應(yīng)負(fù)值輸入的leakyrelu函數(shù),并證明其能取得效果。并且借助最大信息系數(shù)和隨機(jī)森林模型來(lái)了解輸入變量與目標(biāo)變量的重要性,以此對(duì)特征進(jìn)行篩選。2.文獻(xiàn)綜述與理論基礎(chǔ)2.1文獻(xiàn)綜述2.1.1國(guó)內(nèi)研究現(xiàn)狀國(guó)內(nèi)今年來(lái)基于技術(shù)面和投資者情緒的股票預(yù)測(cè)研究日益增加,田鑫(2012)將投資者情感量化,與其他輸入變量一起對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,結(jié)果發(fā)現(xiàn)加入了情緒指標(biāo)的模型得到的結(jié)果好于僅輸入收盤價(jià)的模型[1]。隨后,張遲盼(2015)基于Elman神經(jīng)網(wǎng)絡(luò),加入了投資者情緒指標(biāo)作為變量的預(yù)測(cè)也被證明取得了較好結(jié)果[2]。吳飛飛(2017)將投資者情緒指標(biāo)和NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)結(jié)合對(duì)證券價(jià)格的預(yù)測(cè)結(jié)果要優(yōu)于ARIMA模型[3]。楊程遠(yuǎn)(2017)從論壇獲取股評(píng)文本,通過(guò)文本分類得到情緒指標(biāo)并將其和股票交易指標(biāo)一起輸入BP網(wǎng)絡(luò)模型,發(fā)現(xiàn)預(yù)測(cè)效果比只輸入股票交易指標(biāo)的好[4]。周凌寒(2018)通過(guò)CNN模型對(duì)文本數(shù)據(jù)進(jìn)行情感分類,再將結(jié)果輸入LSTM模型對(duì)股票行情進(jìn)行預(yù)測(cè)的結(jié)果,同樣好于以單一信息源為輸入變量的LSTM模型[5]。王聰?shù)龋?018)從股吧抓取評(píng)論數(shù)據(jù)并量化,使用VAR模型和神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)上海證券綜合指數(shù)的漲跌幅,發(fā)現(xiàn)其與量化的情緒指標(biāo)之間存在線性關(guān)系的同時(shí)也存在非線性關(guān)系[6]。周小波(2020)從股吧爬取評(píng)論,對(duì)其進(jìn)行情感分析,將投資者情緒和股票交易數(shù)據(jù)輸入LSTM模型和ARIMA模型進(jìn)行行情預(yù)測(cè),結(jié)果發(fā)現(xiàn)LSTM效果更好[7]。裴曼如和張立文(2020)發(fā)現(xiàn)通過(guò)同樣使用情感詞典基于文本數(shù)據(jù)構(gòu)建投資者情緒指標(biāo)的情況下,GRU模型的預(yù)測(cè)效果雖然不如LSTM模型,但成本更低、速度更快[8]。田雨(2021)加入投資者情緒指標(biāo)的LSTM模型的預(yù)測(cè)結(jié)果要好于同樣條件下的隨機(jī)森林和BP模型[9]。丁雨(2021)結(jié)合新聞主題和評(píng)論獲得情感特征,建立LSTM預(yù)測(cè)的效果好于只輸入股票技術(shù)指標(biāo)的LSTM模型[10]。宋麗娜(2021)將情感分析應(yīng)用到組合模型中的效果也好于單獨(dú)使用[11]。2.1.2國(guó)外研究現(xiàn)狀Hana等(2017)對(duì)推特的股市新聞進(jìn)行文本挖掘,結(jié)合股票交易信息對(duì)股價(jià)漲跌進(jìn)行預(yù)測(cè),得到了較好結(jié)果[12]。Feng等(2017)對(duì)財(cái)經(jīng)新聞進(jìn)行情感分析結(jié)合股票交易數(shù)據(jù)建立ELM模型對(duì)股票漲跌進(jìn)行預(yù)測(cè),發(fā)現(xiàn)其結(jié)果好于BP模型和SVM模型[13]。Sushree等(2018)對(duì)推特?cái)?shù)據(jù)進(jìn)行情感分析,建立RNN模型進(jìn)行股票預(yù)測(cè),取得了一定效果[14]。Ali等(2019)對(duì)股票社交媒體的文本信息進(jìn)行情感分析,結(jié)合股票交易數(shù)據(jù)建立模型預(yù)測(cè)股票走勢(shì),發(fā)現(xiàn)輸入情緒指標(biāo)的模型預(yù)測(cè)效果更好[15]。Thayogo等(2020)基于財(cái)經(jīng)新聞的情感分析和股票技術(shù)指標(biāo),建立LSTM模型預(yù)測(cè)股票,發(fā)現(xiàn)情緒指標(biāo)能夠提高模型精準(zhǔn)度[16]。Gite等(2021)使用LSTM模型和根據(jù)新聞的情緒分析相結(jié)合得到了比單獨(dú)使用LSTM預(yù)測(cè)更好的精度[17]。Zhang等(2021)基于生成對(duì)抗網(wǎng)絡(luò)和通過(guò)推特上的文本信息對(duì)股票進(jìn)行預(yù)測(cè),取得了較好的效果[18]。2.2文獻(xiàn)評(píng)述根據(jù)國(guó)內(nèi)外學(xué)者的研究,從社交媒體、論壇、新聞獲取文本信息計(jì)算的情緒指標(biāo)能夠提升神經(jīng)網(wǎng)絡(luò)和其他模型的預(yù)測(cè)效果,并且情感分析的手段多樣,有情感詞典、機(jī)器學(xué)習(xí)等方法。另外在股票交易數(shù)據(jù)外,輸入技術(shù)指標(biāo)也能提高預(yù)測(cè)效果。而神經(jīng)網(wǎng)絡(luò)的梯度下降、Adam算法等優(yōu)化方法也能提高預(yù)測(cè)準(zhǔn)確率。但另一方面,研究中選擇的目標(biāo)變量多是股價(jià),預(yù)測(cè)漲跌幅的研究較少,同時(shí)由于LSTM模型在股票預(yù)測(cè)中的優(yōu)異表現(xiàn),許多研究都使用LSTM模型。本文從東方財(cái)富股吧爬取文本數(shù)據(jù),使用情感詞典進(jìn)行情緒指標(biāo)量化,通過(guò)股票交易數(shù)據(jù)計(jì)算技術(shù)指標(biāo)。同時(shí)除建立LSTM模型外,還建立了CNN、GRU模型來(lái)探析在數(shù)據(jù)技術(shù)指標(biāo)和情緒指標(biāo)的情況下不同模型的預(yù)測(cè)效果。2.3理論與技術(shù)基礎(chǔ)2.3.1網(wǎng)絡(luò)爬蟲(chóng)網(wǎng)絡(luò)爬蟲(chóng)是一種通過(guò)技術(shù)手段獲取網(wǎng)頁(yè)信息的程序、包或庫(kù),爬蟲(chóng)運(yùn)行過(guò)程可以分為:請(qǐng)求網(wǎng)頁(yè)、獲取網(wǎng)頁(yè)數(shù)據(jù)、存儲(chǔ)數(shù)據(jù)這幾個(gè)步驟。每個(gè)步驟都有不同的運(yùn)行方法、搜索策略、分析算法等,可以據(jù)此把爬蟲(chóng)細(xì)分為多種種類。此外,由于部分網(wǎng)站出于對(duì)利益、服務(wù)器負(fù)載和信息安全等方面的考慮,會(huì)采用檢測(cè)訪問(wèn)頻率、流量等辦法,通過(guò)禁止IP地址訪問(wèn)等方式來(lái)進(jìn)行反爬取。而爬蟲(chóng)又會(huì)通過(guò)限制訪問(wèn)頻率、爬取速度等各種手段來(lái)規(guī)避網(wǎng)站的反爬取策略。2.3.2文本情感分析隨著網(wǎng)絡(luò)的興起與發(fā)展,在各個(gè)不同領(lǐng)域中都有各自的信息交流平臺(tái)如論壇、貼吧等,對(duì)某個(gè)人、事物、商品等的評(píng)價(jià)可以直接通過(guò)這些網(wǎng)絡(luò)平臺(tái)獲取。并且無(wú)論是國(guó)家還是個(gè)體,在越來(lái)越多的領(lǐng)域都大量的直接通過(guò)網(wǎng)絡(luò)平臺(tái)來(lái)收集信息和反饋,并將之量化分析以作為重要的參考。目前文本情感分析可分為機(jī)器學(xué)習(xí)法和情感詞典法,本文使用的情感詞典法通過(guò)構(gòu)建情感詞典,將積極和消極情感文本和其情感強(qiáng)弱程度進(jìn)行分類并進(jìn)行量化。2.3.3神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是受到生物腦部神經(jīng)元構(gòu)成的神經(jīng)網(wǎng)絡(luò)啟發(fā)人工構(gòu)建的模型。圖2-1神經(jīng)網(wǎng)絡(luò)處理單元一個(gè)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)通過(guò)輸入的量的權(quán)值經(jīng)過(guò)運(yùn)算與閾值比較,并通過(guò)激活函數(shù)來(lái)輸出,如同神經(jīng)元上神經(jīng)突觸接受不同神經(jīng)遞質(zhì)而相應(yīng)做出電位改變來(lái)完成不同功能一樣。神經(jīng)網(wǎng)絡(luò)都是由這樣的單元構(gòu)成。神經(jīng)網(wǎng)絡(luò)中每一層的輸入輸出是線性求和,如果沒(méi)有激活函數(shù),最后輸出是輸入的線性組合。所以激活函數(shù)往往是非線性的,這樣就使神經(jīng)網(wǎng)絡(luò)能應(yīng)用于非線性模型中。為了對(duì)帶有負(fù)值的漲跌幅進(jìn)行預(yù)測(cè),本文使用的leakyrelu函數(shù)是對(duì)負(fù)值有效的。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程通過(guò)計(jì)算預(yù)測(cè)值與真實(shí)值間的誤差衡量效果,誤差計(jì)算函數(shù)稱為損失函數(shù)。計(jì)算損失函數(shù)對(duì)各個(gè)參數(shù)的梯度,對(duì)參數(shù)進(jìn)行更新以減小誤差,梯度指函數(shù)在某一點(diǎn)變化最快的方向。這一個(gè)過(guò)程被稱為反向傳播,是目前神經(jīng)網(wǎng)絡(luò)中主要的訓(xùn)練方法。最后,為了評(píng)判神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果,常使用R-squared即R方,R方是常用的用來(lái)衡量預(yù)測(cè)值和真值之間關(guān)系和預(yù)測(cè)效果的統(tǒng)計(jì)量,其公式為:R2=1?iy從公式可以發(fā)現(xiàn)當(dāng)預(yù)測(cè)值越接近真值,R方越接近1,反之,當(dāng)預(yù)測(cè)完全沒(méi)有起到效果時(shí),R方甚至可能為負(fù)數(shù)。下面介紹本文使用的神經(jīng)網(wǎng)絡(luò):卷積神經(jīng)網(wǎng)絡(luò)(CNN)CNN是當(dāng)今計(jì)算機(jī)視覺(jué)研究的核心技術(shù)之一,它在圖像識(shí)別上表現(xiàn)出了非常好的效果。另外CNN同時(shí)也被應(yīng)用在自然語(yǔ)言處理(NLP)領(lǐng)域,所以這說(shuō)明它乃至神經(jīng)網(wǎng)絡(luò)都不是只能應(yīng)用于單一領(lǐng)域的,本文將嘗試使用它來(lái)預(yù)測(cè)股票的漲跌幅。CNN有卷積層、池化層、全連接層。卷積層在每個(gè)維度通過(guò)自我學(xué)習(xí)的過(guò)濾器(Filter)降維并提取特征。圖2-2卷積而在池化層,通過(guò)對(duì)在卷積層得到的特征再次進(jìn)行篩選,如選擇一定范圍內(nèi)的最大值或平均值來(lái)減少參數(shù)。圖2-3池化CNN在經(jīng)過(guò)卷積和池化后才會(huì)通過(guò)全連接層進(jìn)行誤差反向傳播等計(jì)算進(jìn)行迭代,這樣就比從第一層開(kāi)始就使用全連接神經(jīng)網(wǎng)絡(luò)減少了參數(shù),并且同時(shí)保留了特征,提高了運(yùn)算效率和精度。圖2-4卷積神經(jīng)網(wǎng)絡(luò)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)LSTM是在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的基礎(chǔ)上誕生的。圖2-5循環(huán)神經(jīng)網(wǎng)絡(luò)一般的全連接神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)之間并沒(méi)有聯(lián)系,但在面對(duì)時(shí)間序列問(wèn)題或是自然語(yǔ)言處理問(wèn)題時(shí),一個(gè)節(jié)點(diǎn)往往需要通過(guò)之前輸入的數(shù)據(jù)進(jìn)行計(jì)算。RNN就會(huì)把之前輸入的信息和之后準(zhǔn)備輸入的數(shù)據(jù)一并輸入下一個(gè)節(jié)點(diǎn),因此在最后的輸出就包含了之前所有輸入的信息。然而RNN每次輸入輸出都要計(jì)算上一次的數(shù)據(jù),在輸入數(shù)據(jù)過(guò)長(zhǎng)的情況下,在反向傳播計(jì)算中,如果梯度很小,那么結(jié)果就會(huì)越乘越小并趨近于0,相反梯度則會(huì)越來(lái)越大,這兩種情況被稱為梯度消失和梯度爆炸。無(wú)論哪種情況顯然都會(huì)導(dǎo)致參數(shù)無(wú)法正確更新,從而無(wú)法使模型得到好的結(jié)果。LSTM的出現(xiàn)就是為了解決RNN的問(wèn)題。圖2-6長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)LSTM在輸入之前會(huì)先對(duì)梯度進(jìn)行判斷,如果上次輸入信息對(duì)當(dāng)前輸入信息無(wú)影響,即梯度很小或?yàn)?,就可以不傳遞梯度。LSTM的具體操作通過(guò)遺忘門、輸入門、輸出門實(shí)現(xiàn)。門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(GRU)GRU是在LSTM的基礎(chǔ)上更進(jìn)一步的改進(jìn),LSTM雖然解決了RNN存在的問(wèn)題,但其內(nèi)部的計(jì)算過(guò)程較為復(fù)雜,步驟較多。GRU精簡(jiǎn)了LSTM的計(jì)算過(guò)程。圖2-7門控循環(huán)單元GRU將LSTM的遺忘門和輸入門整合為一個(gè)重置門,通過(guò)重置門來(lái)判斷是否將信息或者將多少信息輸入更新門,再由更新門來(lái)決定最終有多少信息輸出。3.指標(biāo)與研究對(duì)象3.1指標(biāo)股票除了開(kāi)盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)、交易量、換手率這些基本數(shù)據(jù)外,還可以通過(guò)它們使用數(shù)量統(tǒng)計(jì)方法計(jì)算技術(shù)指標(biāo)。如果只通過(guò)基本數(shù)據(jù)去進(jìn)行預(yù)測(cè)顯然無(wú)法取得好的效果,所以各種各樣的技術(shù)指標(biāo)被大量應(yīng)用于股票預(yù)測(cè)中。下面是本文所用到的技術(shù)指標(biāo)。中間意愿指標(biāo)(CR)CR又稱價(jià)格動(dòng)量指標(biāo)。通過(guò)中間價(jià)格判斷市場(chǎng)狀態(tài),CR值為100時(shí)表示中間買賣意愿平衡,大于100且越大,表示越應(yīng)當(dāng)擇機(jī)拋出,反之亦然。以N日CR指標(biāo)為例,其計(jì)算公式為:CRN日=P其中:P1=H?YM表示N日以來(lái)多方力量總和。H表示今日最高價(jià),YM表示上一個(gè)交易日中間價(jià)。P2=YM?L表示N日以來(lái)空方力量總和。L表示今日最低價(jià)。隨機(jī)指標(biāo)(K、D、J)該指標(biāo)用最高價(jià)、最低價(jià)、收盤價(jià)及這三者間的比例關(guān)系,計(jì)算未成熟隨機(jī)值(RSV),用平滑移動(dòng)平均線計(jì)算K、D、J值。K、D、J值分別在不同區(qū)間中越大代表超買,反之代表超賣。它們的計(jì)算公式為:RSV=C?LnH其中C為當(dāng)日的收盤價(jià),Ln為之前n日最低價(jià),Hn為之前n日最高價(jià)。第i天Ki=2第i天D值:Di=2第i天J值:Ji=3K若無(wú)第i-1天K和D值,則都分別用50來(lái)代替。布林線指標(biāo)(BOLL)該指標(biāo)求出股價(jià)標(biāo)準(zhǔn)差及其信賴區(qū)間確定走勢(shì)。日BOLL指標(biāo)的計(jì)算過(guò)程為:中軌線(MB)=N?1日MA上軌線(UP)=MB+2×MD公式3-9下軌線(DN)=MB?2×MD公式3-10其中:MA=N日C÷NMD=N日C?MA2N相對(duì)強(qiáng)弱指標(biāo)(RSI)該指標(biāo)用一段時(shí)間股價(jià)上漲總幅度占股價(jià)變化總幅度平均值的百分比評(píng)估多空力量強(qiáng)弱程度。RSI值越大表示市場(chǎng)越強(qiáng)勢(shì),直至超買,反之亦然。其公式為:RSIN日=A÷A+B×100其中A為N日內(nèi)收盤漲幅之和,B為N日內(nèi)收盤跌幅之和的絕對(duì)值。威廉指標(biāo)(WR)該指標(biāo)分析股票最高價(jià)、最低價(jià)、收盤價(jià)的關(guān)系,判斷股市的超買超賣現(xiàn)象,預(yù)測(cè)中短期走勢(shì)。N日WR指標(biāo)的計(jì)算公式為:W%R=Hn?C÷其中C為當(dāng)日收盤價(jià),Hn為N日內(nèi)最高價(jià),Ln為順勢(shì)指標(biāo)(CCI)該指標(biāo)用于較為極端的情況如股票突然暴漲或暴跌時(shí)進(jìn)行行情判斷。其計(jì)算公式為:CCI(N日)=TP?MA÷MD÷0.015其中:TP=H+L+C÷3MA=C÷NMD=MA?C÷N均幅指標(biāo)(ATR)該指標(biāo)用一定時(shí)間股價(jià)波動(dòng)幅度的移動(dòng)平均值判斷股票買賣時(shí)機(jī)。計(jì)算公式為:ATRnt=TRi=maxH其中n為時(shí)間長(zhǎng)度,t為當(dāng)日,Ci為第i日收盤價(jià),Hi為第i日最高價(jià),Li平行線差指標(biāo)(DMA)該指標(biāo)用兩條不同時(shí)間的平均線判斷價(jià)格趨勢(shì)、買賣能量。其計(jì)算公式為:DMA=短期平均值?長(zhǎng)期平均值公式3-21平滑異同移動(dòng)平均線(MACD)該指標(biāo)用快速、慢速移動(dòng)平均線(EMA)的離差值(DSI)的平滑移動(dòng)平均線判斷漲跌。其公式為:MACD=DIF?DEA×2DEA=EMADIF,9公式DIF=EMAC,12?EMAC,26EMAC,Nt=2其中C為收盤價(jià),N為時(shí)間。三重指數(shù)平滑平均線(TRIX)該指標(biāo)過(guò)濾股票短期波動(dòng)反應(yīng)長(zhǎng)期波動(dòng)趨勢(shì)。其公式為:TRIX=TRt?TR其中TRt為收盤價(jià)的N日指數(shù)移動(dòng)平均(EMA變動(dòng)率指標(biāo)(ROC)該指標(biāo)用當(dāng)日收盤價(jià)、N日前收盤價(jià)的關(guān)系判斷股票變化趨勢(shì)。其公式為:ROC=AXBXAX=當(dāng)日收盤價(jià)?BX公式3-28BX=N日前收盤價(jià)公式3-29資金流量指標(biāo)(MFI)該指標(biāo)用價(jià)格和成交量反應(yīng)市場(chǎng)行情、超買超賣情況,其公式為:MFI=100?1001+PMFNMF其中MF為當(dāng)日最高價(jià)、最低價(jià)和收盤價(jià)的算術(shù)平均乘以N日內(nèi)成交量,PMF表示當(dāng)日MF大于昨日MF,反之為NMF。能力指標(biāo)(EOM)該指標(biāo)根據(jù)最高價(jià)、最低價(jià)和成交量來(lái)衡量市場(chǎng)漲跌的順暢程度。公式為:EOM=DIFH+DIF其中DIFH和DIFL為最高價(jià)和最低價(jià)的差分,3.2研究對(duì)象中國(guó)獨(dú)特的白酒文化源遠(yuǎn)流長(zhǎng),加之白酒的特性,即使存貨積壓也不會(huì)減值,并且白酒原材料和人工成本不高,但有著極高的品牌價(jià)值,這使得白酒的毛利率和凈利率都很高,現(xiàn)金流狀況良好。這一系列因素使白酒有獨(dú)特且極佳的商業(yè)模式,在2020年新冠疫情后經(jīng)濟(jì)不可避免受到影響,投資風(fēng)險(xiǎn)增加,結(jié)果是市場(chǎng)選擇了白酒來(lái)規(guī)避風(fēng)險(xiǎn),掀起了一股白酒熱。同時(shí)白酒強(qiáng)大的品牌效應(yīng)和熱度可以保證其一直存在較高的討論度,方便獲取豐富的文本信息。本文選擇了白酒行業(yè)最熱門的貴州茅臺(tái)、五糧液、瀘州老窖三只股票為研究對(duì)象。一、貴州茅臺(tái)貴州茅臺(tái)作為白酒行業(yè)和A股龍頭,市值已經(jīng)突破2萬(wàn)億元人民幣,且曾經(jīng)一度達(dá)到3萬(wàn)億元,在穩(wěn)定的行業(yè)模式、強(qiáng)大的需求量、公司良好的財(cái)務(wù)情況和高利潤(rùn)率的情況下,茅臺(tái)深受投資者青睞。同時(shí)在另一方面,從茅臺(tái)超高的股價(jià)和市值背后,可能可以窺見(jiàn)大資本和整個(gè)市場(chǎng)的風(fēng)向標(biāo)。二、五糧液上世紀(jì)末到本世紀(jì)初占據(jù)白酒行業(yè)霸主地位的五糧液目前是白酒股票中市值第二大的品牌,僅次于貴州茅臺(tái),并且與主打醬香型白酒的茅臺(tái)不同,五糧液的主力產(chǎn)品是濃香型白酒,另外五糧液正積極轉(zhuǎn)型,與IBM、阿里巴巴等企業(yè)合作建設(shè)數(shù)字化營(yíng)銷和管理體系,加強(qiáng)核心競(jìng)爭(zhēng)力。三、瀘州老窖瀘州老窖也一度是白酒龍頭,是白酒行業(yè)中歷史最久的品牌之一,已有2000多年的傳承史,同時(shí)擁有中國(guó)最多和最早建設(shè)的窖池群。瀘州老窖也是行業(yè)中最注重文化建設(shè)的品牌,相比于茅臺(tái)和五糧液的中高端路線,瀘州老窖在高、中、低三檔介有產(chǎn)品,且已經(jīng)在工藝改良上取得進(jìn)展,產(chǎn)能得到提升,為其重回前三打下基礎(chǔ)。4.數(shù)據(jù)來(lái)源及處理4.1數(shù)據(jù)來(lái)源本文使用Python代碼的爬蟲(chóng)從東方財(cái)富股吧獲取所選股票2020-2021年兩年的共計(jì)約54萬(wàn)條評(píng)論數(shù)據(jù),平均每只股票18萬(wàn)條。并使用Deng(2019)開(kāi)發(fā)的能夠進(jìn)行中文文本處理的cnsenti庫(kù)[19]。并通過(guò)姚加權(quán)等(2021)開(kāi)發(fā)的中文金融情感詞典來(lái)根據(jù)文本中的內(nèi)容判斷是積極或消極,以及情感的強(qiáng)度,再根據(jù)獲取到的信息將文本數(shù)據(jù)轉(zhuǎn)換為情緒指標(biāo)[20]。計(jì)算公式參考了戴德寶(2019)的文本挖掘和投資者情緒的研究,為:SENTt=ln1+其中posN表示積極評(píng)論數(shù)量,negN表示消極評(píng)論數(shù)量本文通過(guò)開(kāi)源的BaoStock證券數(shù)據(jù)平臺(tái)取得所選股票2020-2021年兩年486個(gè)交易日的基本交易數(shù)據(jù),并通過(guò)各個(gè)技術(shù)指標(biāo)的計(jì)算方式獲得技術(shù)指標(biāo)在不同時(shí)間周期的值。這里就不再詳細(xì)說(shuō)明計(jì)算過(guò)程。本文進(jìn)行的預(yù)測(cè)中目標(biāo)變量為漲跌幅,所使用特征如下:情緒指標(biāo)(sent)開(kāi)盤價(jià)(open)收盤價(jià)(close)最高價(jià)(high)最低價(jià)(low)換手率(turn)成交量(volume)成交金額(amount)中間意愿指標(biāo)(cr)隨機(jī)指標(biāo)(kdj)布林線指標(biāo)(boll)相對(duì)強(qiáng)弱指標(biāo)(rsi)威廉指標(biāo)(wr)順勢(shì)指標(biāo)(cci)均幅指標(biāo)(atr)平行線差指標(biāo)(dma)平滑異動(dòng)平均線(macd)動(dòng)向指標(biāo)(dmi)三重指數(shù)平滑平均線(trix)變動(dòng)率指標(biāo)(roc)資金流量指標(biāo)(mfi)能力指標(biāo)(eom)移動(dòng)平均線(ma)指數(shù)移動(dòng)平均(ema)簡(jiǎn)單移動(dòng)平均線(sma)需要注意的是上面列出的只是使用特征的種類,實(shí)際訓(xùn)練模型時(shí)技術(shù)指標(biāo)都會(huì)計(jì)算不同時(shí)間跨度的值,如cr_3、cr_9、cr_26等等。4.2數(shù)據(jù)處理一、數(shù)據(jù)規(guī)范化股票的成交量可以達(dá)到千萬(wàn)級(jí)但漲跌卻可以小到個(gè)位數(shù),特征之間相差過(guò)大顯然對(duì)梯度的計(jì)算和模型的訓(xùn)練造成影響。本文使用sklearn的MinMaxScaler方法,將特征數(shù)據(jù)映射到相同區(qū)間中。二、利用MIC篩選指標(biāo)雖然在股票預(yù)測(cè)以及其他機(jī)器學(xué)習(xí)模型中,特征必不可少且對(duì)數(shù)量有一定要求,對(duì)于股票預(yù)測(cè),股票的基本交易數(shù)據(jù)和專業(yè)的技術(shù)指標(biāo)也不可或缺,但是為了避免過(guò)擬合和提高模型精確度,進(jìn)行特征工程同樣是非常重要的步驟。以通過(guò)上文方法獲得的情緒指標(biāo)為例,使用最大信息系數(shù)(MIC)檢測(cè)它與漲跌幅間的關(guān)系,衡量變量關(guān)聯(lián)程度,將其離散在二維空間,用散點(diǎn)圖表示,將當(dāng)前二維空間在x和y方向劃分一定區(qū)間數(shù),查看當(dāng)前散點(diǎn)在各個(gè)方格中落入情況。其公式為:MIC(x;y)=maxa×b<BI(x;y)log其中:Ix;y=p(x,y)log其中a、b即為劃分的區(qū)間數(shù)。以茅臺(tái)的情緒指標(biāo)為例:圖4-1最大信息系數(shù)(值)圖4-2最大信息系數(shù)(圖)三、利用隨機(jī)森林篩選指標(biāo)本文同時(shí)還使用了隨機(jī)森林對(duì)特征進(jìn)行選擇,并對(duì)股票的漲跌趨勢(shì)進(jìn)行了預(yù)測(cè),同樣以茅臺(tái)為例,其準(zhǔn)確率達(dá)到0.82。對(duì)其他兩只股票的預(yù)測(cè)準(zhǔn)確率也都在0.8以上。通過(guò)隨機(jī)森林來(lái)去除一些相關(guān)性不高的特征。圖4-3隨機(jī)森林最后經(jīng)過(guò)篩選的指標(biāo)如下表:表4-1特征特征變量名含義情緒指標(biāo)sent投資者情緒漲跌幅pctchg每日漲跌幅度開(kāi)盤價(jià)open每日開(kāi)盤價(jià)格最高價(jià)high每日最高價(jià)格最低價(jià)low每日最低價(jià)格收盤價(jià)close每日收盤價(jià)格換手率turn每日轉(zhuǎn)手頻率成交量volume每日成交數(shù)量9日中間意愿指標(biāo)cr_99日買賣意愿9日K值k_99日超買超賣情況9日D值d_99日超買超賣情況7日布林線指標(biāo)boll_77日漲跌幅情況14日相對(duì)強(qiáng)弱指標(biāo)rsi_1414日漲跌幅度和景氣程度5日威廉指標(biāo)wr_55日超買超賣狀態(tài)14日順勢(shì)指標(biāo)cci_1414日股價(jià)波動(dòng)情況14日均幅指標(biāo)atr_1414日股價(jià)漲跌趨勢(shì)10日平行線差指標(biāo)dma_1010日買賣情況和價(jià)格趨勢(shì)三重指數(shù)平滑平均線trix股價(jià)波動(dòng)趨勢(shì)6日變動(dòng)率指標(biāo)roc_66日買賣趨勢(shì)四、數(shù)據(jù)分區(qū)本文使用sklearn中train_test_split函數(shù)將數(shù)據(jù)集以4:1比率劃分訓(xùn)練集和測(cè)試集,得到389條訓(xùn)練數(shù)據(jù)和97條測(cè)試數(shù)據(jù)。。5.建立模型5.1使用CNN進(jìn)行預(yù)測(cè)接下來(lái)是使用CNN進(jìn)行預(yù)測(cè)的結(jié)果,設(shè)置50個(gè)4維卷積核即過(guò)濾器,全連接層使用20個(gè)神經(jīng)元,使用leakyrelu激活函數(shù),訓(xùn)練(epoch)50次,每批次處理(batch_size)32個(gè)樣本,Dropout為0.2并且使用梯度下降法(SGD)進(jìn)行優(yōu)化。另外,本文建立的每個(gè)模型都嘗試了不輸入情緒指標(biāo)進(jìn)行預(yù)測(cè),發(fā)現(xiàn)效果均低于輸入了情緒指標(biāo)的模型。下面以貴州茅臺(tái)為例給出了不輸入情緒指標(biāo)的CNN的預(yù)測(cè)結(jié)果。一、貴州茅臺(tái)圖5-1不輸入情緒指標(biāo)茅臺(tái)R方(CNN)圖5-2不輸入情緒指標(biāo)茅臺(tái)預(yù)測(cè)結(jié)果(CNN)圖5-3茅臺(tái)R方(CNN)圖5-4茅臺(tái)預(yù)測(cè)結(jié)果(CNN)二、五糧液圖5-5五糧液R方(CNN)圖5-6五糧液預(yù)測(cè)結(jié)果(CNN)三、瀘州老窖圖5-7瀘州老窖R方(CNN)圖5-8瀘州老窖預(yù)測(cè)結(jié)果(CNN)5.2使用LSTM進(jìn)行預(yù)測(cè)接下來(lái)是使用LSTM進(jìn)行預(yù)測(cè)的結(jié)果,設(shè)置三層,分別為256個(gè)神經(jīng)元,Dropout為0.3,128個(gè)神經(jīng)元,Dropout為0.2,128個(gè)神經(jīng)元,Dropout為0.2,使用leakyrelu激活函數(shù),訓(xùn)練(epoch)30次,每批次處理(batch_size)32個(gè)樣本,使用Adam算法優(yōu)化。一、貴州茅臺(tái)圖5-9茅臺(tái)R方(LSTM)圖5-10茅臺(tái)預(yù)測(cè)結(jié)果(LSTM)二、五糧液圖5-11五糧液R方(LSTM)圖5-12五糧液預(yù)測(cè)結(jié)果(LSTM)三、瀘州老窖圖5-13瀘州老窖R方(LSTM)圖5-14瀘州老窖預(yù)測(cè)結(jié)果(LSTM)5.3使用GRU進(jìn)行預(yù)測(cè)接下來(lái)是使用GRU進(jìn)行預(yù)測(cè)的結(jié)果,設(shè)置三層,每層50個(gè)神經(jīng)元,使用leakyrelu激活函數(shù),訓(xùn)練(epoch)30次,每批次處理(batch_size)32個(gè)樣本,Dropout為0.2并且使用Adam進(jìn)行優(yōu)化。一、貴州茅臺(tái)圖5-15茅臺(tái)R方(GRU)圖5-16茅臺(tái)預(yù)測(cè)結(jié)果(GRU)二、五糧液圖5-17五糧液R方(GRU)圖5-18五糧液預(yù)測(cè)結(jié)果(GRU)三、瀘州老窖圖5-19瀘州老窖R方(GRU)圖5-20瀘州老窖預(yù)測(cè)結(jié)果(GRU)6.總結(jié)與展望6.1研究總結(jié)研究結(jié)果表明神經(jīng)網(wǎng)絡(luò)可以作為股票預(yù)測(cè)的參考手段,同時(shí)技術(shù)指標(biāo)和情緒指標(biāo)的結(jié)合可以在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程中發(fā)揮作用。CNN在短期股票的預(yù)測(cè)中,表現(xiàn)出較好的效果。LSTM嚴(yán)謹(jǐn)?shù)珡?fù)雜的計(jì)算過(guò)程在實(shí)際應(yīng)用中,尤其是在時(shí)間周期偏短的情況下不一定能取得非常好的效果,而GRU作為L(zhǎng)STM的變體能更快的運(yùn)算速度,達(dá)到了它的初衷,并且效果優(yōu)于LSTM。從結(jié)果可以看出,至少在對(duì)白酒行業(yè)股票的預(yù)測(cè)中,投資者可以建立CNN、LSTM、GRU模型使用較短時(shí)間周期的數(shù)據(jù),花費(fèi)較低的時(shí)間成本對(duì)股票的漲跌趨勢(shì)進(jìn)行判斷,作為未來(lái)投資計(jì)劃的參考。6.2不足與展望雖然本文的研究中模型都能取得一定的效果,但因文本量過(guò)大,由于硬件和網(wǎng)站等多方面的限制本文只使用了兩年的數(shù)據(jù),如果使用更長(zhǎng)時(shí)間的數(shù)據(jù)每個(gè)模型的效果可能就有所不同,尤其是為處理長(zhǎng)時(shí)間周期數(shù)據(jù)的LSTM模型。使用相同模型對(duì)不同板塊股票進(jìn)行預(yù)測(cè)的效果可能也不同。使用更豐富的模型預(yù)測(cè)更多不同板塊的股票是今后的改進(jìn)方向之一。結(jié)合對(duì)股價(jià)等其他數(shù)據(jù)的預(yù)測(cè)判斷股票走勢(shì)相信也可以給投資者提供更好的判斷依據(jù)。目前還沒(méi)有權(quán)威且長(zhǎng)期有效的方法預(yù)測(cè)股票。神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)中有效果,提供給它的特征也多樣、專業(yè),但無(wú)論神經(jīng)網(wǎng)絡(luò)還是其在股票預(yù)測(cè)的研究都沒(méi)有到成熟階段。想通過(guò)目前的神經(jīng)網(wǎng)絡(luò)完全預(yù)測(cè)股票存在諸多難點(diǎn)。股票市場(chǎng)瞬息萬(wàn)變且在包括但不限于自然災(zāi)害、戰(zhàn)爭(zhēng)等突發(fā)情況下,模型可能完全失效,此時(shí)投資者的感性可能占主導(dǎo),但對(duì)投資者情緒正確獲取和計(jì)算也變得艱難。如何在異常情況下保證模型預(yù)測(cè)效果、更快處理海量數(shù)據(jù)相信會(huì)是未來(lái)研究熱點(diǎn)方向之一。參考文獻(xiàn)[1]田鑫.基于情緒指數(shù)和神經(jīng)網(wǎng)絡(luò)的上證指數(shù)預(yù)測(cè)研究[D].哈爾濱工業(yè)大學(xué),2012.[2]張遲盼.我國(guó)投資者情緒對(duì)股票價(jià)值溢價(jià)的影響研究[D].中國(guó)海洋大學(xué),2015.[3]吳飛飛.基于投資者情緒和NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的證券價(jià)格可預(yù)測(cè)性研究[D].首都經(jīng)濟(jì)貿(mào)易大學(xué),2017.[4]楊程遠(yuǎn).結(jié)合情感分析的股票預(yù)測(cè)研究[D].內(nèi)蒙古大學(xué),2017.[5]周凌寒.基于LSTM和投資者情緒的股票行情預(yù)測(cè)研究[D].華中師范大學(xué),2018.[6]王聰,高廣闊,王亮.基于個(gè)體投資者情感量化的上證指數(shù)預(yù)測(cè)檢驗(yàn)[J].經(jīng)濟(jì)研究導(dǎo)刊,2018(26):159-164.[7]周小波.基于情感分析的中國(guó)股市短期價(jià)格預(yù)測(cè)研究[D].西南交通大學(xué),2020.DOI:10.27414/ki.gxnju.2020.001184.[8]裴曼如,張立文.基于投資者情緒和深度學(xué)習(xí)的股票價(jià)格趨勢(shì)預(yù)測(cè)研究[J].金融發(fā)展,2020(01):78-97.[9]田雨.基于投資者情緒和LSTM的股價(jià)走勢(shì)預(yù)測(cè)研究[D].上海師范大學(xué),2021.DOI:10.27312/ki.gshsu.2021.002195.[10]丁力.融合新聞主題和評(píng)論情感特征分析的股市預(yù)測(cè)方法研究[D].南京財(cái)經(jīng)大學(xué),2021.DOI:10.27705/ki.gnjcj.2021.000040.[11]宋麗娜.基于情感分析和PCA-LSTM模型的股票價(jià)格預(yù)測(cè)[J].中國(guó)管理信息化,2021,24(21):159-161.[12]HanaAlostad,HasanDavulcu.DirectionalpredictionofstockpricesusingbreakingnewsonTwitter[J].
WebIntelligence,2017,15(1).[13]FengWang,Yongquan
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026 年中職掘進(jìn)技術(shù)(隧道掘進(jìn))試題及答案
- 直播運(yùn)營(yíng)考試題目及答案
- 愚公移山主要情節(jié)概括
- 沖突理論課件
- 2025年頂管施工試題答案及答案
- 2025年中考基礎(chǔ)押題試卷及答案
- 安徽高升??荚囶}及答案
- 體檢合同范本模板
- 電腦購(gòu)銷英文合同范本
- 銀行社會(huì)招聘題庫(kù)及答案
- 支撐梁鋼筋自動(dòng)計(jì)算表模板
- 請(qǐng)結(jié)合材料理論聯(lián)系實(shí)際分析如何正確評(píng)價(jià)人生價(jià)值?人生價(jià)值的實(shí)現(xiàn)需要哪些條件?參考答案
- 生物安全實(shí)驗(yàn)室自查報(bào)告及整改措施
- 2026年黨支部主題黨日活動(dòng)方案
- 醫(yī)療健康大數(shù)據(jù)的精準(zhǔn)營(yíng)養(yǎng)方案
- 幼兒園中班交通安全教育課件
- 食堂衛(wèi)生檢查與考核標(biāo)準(zhǔn)建立
- 2025 年國(guó)家層面數(shù)據(jù)資產(chǎn)政策匯編(全景解讀版)
- 2025新疆交通投資(集團(tuán))有限責(zé)任公司所屬公司招聘26人筆試歷年典型考點(diǎn)題庫(kù)附帶答案詳解2套試卷
- 2025年成本會(huì)計(jì)考試題及答案6
- 全域土地綜合整治項(xiàng)目社會(huì)穩(wěn)定風(fēng)險(xiǎn)評(píng)估報(bào)告
評(píng)論
0/150
提交評(píng)論