《經(jīng)濟(jì)和金融領(lǐng)域運(yùn)用文本大數(shù)據(jù)研究的國內(nèi)外文獻(xiàn)綜述2800字》_第1頁
《經(jīng)濟(jì)和金融領(lǐng)域運(yùn)用文本大數(shù)據(jù)研究的國內(nèi)外文獻(xiàn)綜述2800字》_第2頁
《經(jīng)濟(jì)和金融領(lǐng)域運(yùn)用文本大數(shù)據(jù)研究的國內(nèi)外文獻(xiàn)綜述2800字》_第3頁
《經(jīng)濟(jì)和金融領(lǐng)域運(yùn)用文本大數(shù)據(jù)研究的國內(nèi)外文獻(xiàn)綜述2800字》_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

經(jīng)濟(jì)和金融領(lǐng)域運(yùn)用文本大數(shù)據(jù)研究的國內(nèi)外文獻(xiàn)綜述1.理論研究現(xiàn)狀從行為金融學(xué)的相關(guān)理論來看人們投資者的行為時(shí)會發(fā)現(xiàn),人們的投資活動也容易受自身的心理因素影響REF_Ref2862\r\h[9]。投資活動往往暴露了一些投資者的感性情緒,據(jù)此研究工作人員認(rèn)為,決策者的投資偏好一般都是多個(gè)方面、容易改變的,這種投資偏好往往只在進(jìn)行決策的過程中才能逐漸形成;投資者往往由于自身勢單力薄,缺乏專業(yè)知識REF_Ref4548\r\h[15],消息渠道和投資經(jīng)驗(yàn)等原因根據(jù)“噪聲信息”投資,相關(guān)投資社區(qū)等就容易因同類用戶的聚集而形成噪聲并互相影響,干擾自身判斷,也有明顯的羊群效應(yīng)REF_Ref26434\r\h[1],“出盈保虧”現(xiàn)象也很普遍,這些無不說明投資者的情緒會對其行為產(chǎn)生影響,由此分析投資者的情緒表達(dá)對于其投資行為是十分重要的參考REF_Ref26692\r\h[2]。從情緒衡量的指標(biāo)來看,許多研究人員從尋找可以衡量投資者情緒的數(shù)據(jù)來源出發(fā),使用時(shí)間序列模型分析其與股市收益的相關(guān)性,并得出其與股市收益存在長期正相關(guān)的關(guān)系,也說明了投資者情緒與社會投資活動存在較強(qiáng)的關(guān)聯(lián),其決策會對市場變化發(fā)生一定程度的影響REF_Ref1932\r\h[6]。而隨著深度學(xué)習(xí)技術(shù)的發(fā)展,現(xiàn)代量化投資者情緒可以從海量的網(wǎng)絡(luò)文本數(shù)據(jù)中高效地挖掘出其隱含的情緒狀態(tài),并從中提取出有價(jià)值的信息。2.理論發(fā)展人們的非理性的行為可能產(chǎn)生持續(xù)性影響,通過結(jié)合心理學(xué)與行為學(xué)的相關(guān)理論,系統(tǒng)地研究金融活動中的參與者行為REF_Ref512\r\h[14],理查德·塞勒證明了人的性格確實(shí)會對個(gè)人決策與市場結(jié)果造成系統(tǒng)性影響。邁爾斯塔特曼從行為投資組合、心理會計(jì)、行為資產(chǎn)定價(jià)模型論述投資者的認(rèn)識偏差、認(rèn)知錯(cuò)誤。神經(jīng)網(wǎng)絡(luò)模擬人腦中各個(gè)神經(jīng)元對于信息的傳遞處理過程,按照其連接形態(tài)和方式可以組成不同的網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)由大量的節(jié)點(diǎn)之間相互連接構(gòu)成,每一個(gè)節(jié)點(diǎn)都可以用來代表一個(gè)輸出的函數(shù),這個(gè)節(jié)點(diǎn)輸出的函數(shù)也被我們統(tǒng)統(tǒng)地稱為一個(gè)激勵(lì)函數(shù),而每兩個(gè)節(jié)點(diǎn)之間的相互連接都可以代表一個(gè)對于通過該節(jié)點(diǎn)連接產(chǎn)生信號的加權(quán)值,這個(gè)節(jié)點(diǎn)的加權(quán)值也被我們統(tǒng)統(tǒng)地稱為輸出的權(quán)重,整個(gè)神經(jīng)網(wǎng)絡(luò)的每一個(gè)輸出根據(jù)其所受連接的方式、激勵(lì)函數(shù)以及其權(quán)重的不同而變化。有的研究者提出可以將其應(yīng)用于自然語言處理領(lǐng)域,這么做的最大優(yōu)勢主要就是無需再花費(fèi)大量的時(shí)間精力在進(jìn)行特征提取與選擇上。將單詞的分布式表達(dá)器輸入應(yīng)用到了神經(jīng)網(wǎng)絡(luò)中,運(yùn)用卷積、點(diǎn)乘、非線性函數(shù)、矩陣相乘等運(yùn)算,自動地提取并給出對文本進(jìn)行分類有價(jià)值的信息,具有易讀性,具備抗干擾能力,能夠保持模型相對穩(wěn)定REF_Ref31277\r\h[3]。在情緒衡量方面,網(wǎng)絡(luò)用戶的行為、評論往往是運(yùn)用分析模型計(jì)算的重要領(lǐng)域,Da、Engelberg&Gao(2015)通過民眾在互聯(lián)網(wǎng)上的搜索內(nèi)容來衡量投資者情緒的變化。Jiangetal.(2016)通過LM詞典對經(jīng)理人的文本情感指數(shù)予以搭建,根據(jù)相關(guān)研究和分析,未來股市收益、情感指數(shù)二者間的關(guān)系即反向影響。MeenaRambocas回顧在線情緒分析的營銷文獻(xiàn),并從分析單元、抽樣分析和情緒分析的角度得出了情緒對用戶的營銷作用REF_Ref22767\r\h[17]。在國內(nèi),研究人員通過從虛擬交流平臺獲取數(shù)據(jù),構(gòu)建出一系列可以用來評價(jià)投資者心理狀態(tài)的指標(biāo);或者采用相關(guān)指標(biāo),如消費(fèi)者信心指數(shù)(池麗旭、莊心田,2009)、好淡指數(shù)(呂志巖,2013、曾炫川,2015)、新增開戶數(shù)、開放式股票型基金資金凈流入(王春,2014)等對投資者偏好,信心,投資者增加量等相對較為廣泛接受的指標(biāo)進(jìn)行間接分析。REF_Ref31336\r\h[5]從文本情感分析的角度,人們研究的對象從IPO公司上市前主流財(cái)經(jīng)媒體正負(fù)面詞匯數(shù)(汪昌云、武佳薇,2015)、東方財(cái)富網(wǎng)標(biāo)題內(nèi)容的詞頻統(tǒng)計(jì)(易洪波等,2015)、用戶在股吧、論壇的評論數(shù)(劉珂言,2015)、知網(wǎng)、微博話題信息文本分析(孟雪井、孟祥蘭、胡楊洋,2016)以及東方財(cái)富網(wǎng)股吧的評論數(shù)據(jù)(孟志青、鄭國杰、趙韻文,2018)等都有作為直接代理變量衡量投資者情緒指標(biāo)REF_Ref15290\r\h[10]。3.理論應(yīng)用及成果憑借著文本分類技術(shù)的快速發(fā)展與進(jìn)步,金融學(xué)領(lǐng)域的文本分析效率得到大幅度的提高,利用文本挖掘技術(shù)精煉非結(jié)構(gòu)化文本數(shù)據(jù),機(jī)器學(xué)習(xí)在文本分析上的應(yīng)用是十分熱門的課題。通過解析人們的評價(jià)和言論獲取的文本數(shù)據(jù),可以用于刻畫關(guān)注度、情緒或語調(diào)、可讀性、新聞隱含波動率和意見分歧等方面。文本信息的來源多種多樣,從虛擬網(wǎng)絡(luò)社區(qū)的發(fā)帖與跟評,消費(fèi)者對產(chǎn)品的評價(jià),上市公司經(jīng)營報(bào)告,電話錄音文稿,分析師研究報(bào)告,會議紀(jì)要,由央行等政府機(jī)構(gòu)發(fā)布的權(quán)威報(bào)告等等都屬于文本大數(shù)據(jù)的范疇。在信息浩如煙海的時(shí)代,由于文本數(shù)據(jù)搜集難度與成本都較高,加上文本含義豐富,表達(dá)意味多樣,傳統(tǒng)數(shù)據(jù)收集方式搜集效率逐漸下降。而隨著文本信息從傳統(tǒng)收集方式向互聯(lián)網(wǎng)傳遞介質(zhì)的方式轉(zhuǎn)變,文本數(shù)據(jù)收集和傳輸成本有了更為簡便有效率的途徑,網(wǎng)絡(luò)詞庫的規(guī)模不斷得到補(bǔ)充和豐富。模型訓(xùn)練也讓龐大的數(shù)據(jù)文本得以被發(fā)掘出其深層涵義,為計(jì)算機(jī)領(lǐng)域的自然語言處理方法提供了適合的發(fā)揮空間。傳統(tǒng)數(shù)據(jù)需要經(jīng)過系統(tǒng)性的組織和安排來收集,常用的經(jīng)濟(jì)和金融領(lǐng)域數(shù)據(jù)多需要一段時(shí)間的累積才能形成其結(jié)果,而文本大數(shù)據(jù)的頻率可以高達(dá)秒級,面對這為高頻研究提供了數(shù)據(jù)基礎(chǔ)。針對文本數(shù)據(jù)的分析能夠更清晰判斷用戶的喜好。文本分類中的一個(gè)關(guān)鍵問題是特征表示,它通常基于詞袋模型,其中unigrams、bigrams、ngrams通常被提取為特征。此外,幾種特征選擇方法,如頻率、MI、PLSA、LDA被應(yīng)用于選擇更具鑒別性的特征。然而,傳統(tǒng)的特征表示方法往往忽略了文本中的上下文信息或詞序有時(shí)可能對于文本含義的把握出現(xiàn)偏差,這就需要循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建更長的文義依賴關(guān)系。未來幾年,在經(jīng)濟(jì)和金融領(lǐng)域運(yùn)用文本大數(shù)據(jù)研究方面,將開拓更為豐富的數(shù)據(jù)源,通過訓(xùn)練與分析篩選更適合的機(jī)器學(xué)習(xí)模型、改良深度學(xué)習(xí)方法來優(yōu)化文本數(shù)據(jù)的分析效果,提高模型準(zhǔn)確度與預(yù)測能力REF_Ref27451\r\h[12]。由于文本數(shù)據(jù)不可避免的帶有發(fā)出者的主觀情緒意圖,數(shù)據(jù)也存在情緒色彩,可能對研究產(chǎn)生偏差,此外無監(jiān)督學(xué)習(xí)過程也相對復(fù)雜,文本數(shù)據(jù)是否能夠準(zhǔn)確反映所研究的潛在內(nèi)容,需要更多研究。主要參考文獻(xiàn)林初曦,黃浩,論股票市場中的羊群行為[J].經(jīng)濟(jì)師,2019(05):64-67.楊蒙蒙.行為金融學(xué)及其應(yīng)用文獻(xiàn)綜述[J].合作經(jīng)濟(jì)與科技,2020(19):70-72.李福鵬,付東翔.基于Transformer編碼器的金融文本情感分析方法[J].電子科技,2020,33(9):10-15.杜慧,俞曉明,劉悅,等.融合詞性和注意力的卷積神經(jīng)網(wǎng)絡(luò)對象級情感分類方法[J].模式識別與人工智能,2018,31(12):62-68.凌翰文.基于投資者關(guān)注和社交網(wǎng)絡(luò)的選股模型研究[D].魯曉鵬.基于互聯(lián)網(wǎng)數(shù)據(jù)挖掘的投資者情緒與股市收益統(tǒng)計(jì)研究[D].2016.李志杰,耿朝陽,宋鵬.LSTM-TextCNN聯(lián)合模型的短文本分類研究[J].西安工業(yè)大學(xué)學(xué)報(bào),2020,40(03):299-304.高增亮,張俊瑞.行為金融視角下投資者情緒對財(cái)務(wù)重述行為的影響[J].中南財(cái)經(jīng)政法大學(xué)學(xué)報(bào),2019(03):85-93+159.顧鴻翼.淺析個(gè)人投資者投資心理因素對投資行為的影響[J].商展經(jīng)濟(jì),2020(11):62-64.沈艷,陳赟,黃卓.文本大數(shù)據(jù)分析在經(jīng)濟(jì)學(xué)和金融學(xué)中的應(yīng)用:一個(gè)文獻(xiàn)綜述[J].經(jīng)濟(jì)學(xué)(季刊),2019,18(04):1153-1186.王博.基于投資者情緒的資產(chǎn)定價(jià)理論及實(shí)證研究[D].遼寧大學(xué),2014.杜雪嫣.基于深度學(xué)習(xí)的中文短文本情緒分類研究[D].中國人民公安大學(xué),2020.鄧飛燕.岑少琪,鐘鳳琪,等.基于LSTM神經(jīng)網(wǎng)絡(luò)的短期價(jià)格趨勢預(yù)測[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2021,30(04):187-192.RichardLehman.FarFromRandom[M].上海財(cái)經(jīng)大學(xué)出版社:上海,2015:127.DeLongJB,ShleiferA,SummersLH,etal.NoiseTraderRiskinFinancialMarkets[J].JournalofPoliticalEconomy,1990,98(4):703-738.NicholasBarberis,RichardH.Thaler.ASurveyofBehavioralFinance[Z].USA:NationalBureauofEconomicResearch1050Mas

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論