【社交媒體情緒對股市價格的影響實證探析11000字(論文)】_第1頁
【社交媒體情緒對股市價格的影響實證探析11000字(論文)】_第2頁
【社交媒體情緒對股市價格的影響實證探析11000字(論文)】_第3頁
【社交媒體情緒對股市價格的影響實證探析11000字(論文)】_第4頁
【社交媒體情緒對股市價格的影響實證探析11000字(論文)】_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

社交媒體情緒對股市價格的影響實證分析摘要 3一、 前言 5二、 文獻(xiàn)回顧 6三、 基于NLP技術(shù)和Python數(shù)據(jù)挖掘的投資者情緒指標(biāo)構(gòu)建 83.1數(shù)據(jù)來源 83.2數(shù)據(jù)處理 83.2.1文本預(yù)處理 83.2.2情感詞典匹配 9四、 投資者社交媒體情緒與股票市場價格波動之間的關(guān)系。 104.1.樣本數(shù)據(jù)來源 104.2變量選取 114.3投資者情緒指標(biāo)的統(tǒng)計 164.3.1發(fā)帖數(shù)量的描述性統(tǒng)計 164.3.2發(fā)帖內(nèi)容的描述性統(tǒng)計 174.3.3投資者情緒影響股價的機(jī)理 184.4假設(shè)與假設(shè) 184.5構(gòu)建模型 184.6變量間的Pearson相關(guān)性分析(括號內(nèi)為P統(tǒng)計量) 194.7回歸分析 204.7.1對于假設(shè)1的回歸分析 204.7.2對于假設(shè)2的回歸分析: 20五、 結(jié)論與展望 225.1結(jié)論 225.2政策與展望 22

摘要行為金融學(xué)(BehaviorFinance)是一門與社會學(xué)、心理學(xué)等結(jié)合的金融學(xué)科。作為一門新興學(xué)科,行為金融學(xué)的一大重要理論就是投資者情緒理論(InvestorSentimentTheory)。行為金融學(xué)結(jié)合心理學(xué)的認(rèn)知,相對于傳統(tǒng)金融學(xué)里的“理性人”,行為金融學(xué)提出了“社會人”這一假設(shè)。“理性人”假設(shè)認(rèn)為,人總是追求利益最大化的,所以行為都有理可循。但是“社會人”假設(shè)認(rèn)為,并非所有人的行為都是理性的。因此,為了解釋市場中存在的一些反?,F(xiàn)象,一些學(xué)者開始提出“投資者情緒“這一概念。隨著信息時代的到來,網(wǎng)絡(luò)對證券市場的影響逐步被發(fā)掘出來。相關(guān)的研究也開始出現(xiàn),在提取了相關(guān)數(shù)據(jù)之后,一些研究表明:論壇上的信息可以影響投資者情緒,并通過影響投資者情緒,來影響投資者的投資行為。計算機(jī)相關(guān)技術(shù)和語言學(xué)、心理學(xué)的相關(guān)知識也被應(yīng)用于這一領(lǐng)域。在進(jìn)行了文獻(xiàn)回顧之后,決定結(jié)合計算機(jī)相關(guān)知識,來對投資者情緒這一主題進(jìn)行研究。本文基于選取的幾只股票,利用Python爬蟲技術(shù)(Webcrawler),爬取時間跨度為2020年1月1日到2020年12月31日的東方財富網(wǎng)股吧(股票網(wǎng)絡(luò)論壇)的用戶評論等相關(guān)數(shù)據(jù)。在清洗爬取的數(shù)據(jù)后,利用情感詞典技術(shù)進(jìn)行文本挖掘,從而提取出文本中蘊(yùn)含的投資者情緒。之后基于數(shù)據(jù)對東方財富網(wǎng)股吧中提取的投資者情緒對股市收益率的影響進(jìn)行實證的研究。研究結(jié)果表明:開放論壇中的投資者情緒能夠顯著的影響股市的價格。具體表現(xiàn)在:投資者情緒越高昂,與之對應(yīng)的股票收益率也就越高。投資者情緒越低落,相應(yīng)的股票收益率也就越低。同時,通過兩種不同類型的數(shù)據(jù)對比,我們發(fā)現(xiàn):投資者情緒指數(shù)的影響力要遠(yuǎn)遠(yuǎn)大于投資者信心指數(shù)的影響力。這也說明了文本型,非結(jié)構(gòu)化的數(shù)據(jù)的解釋力度要比數(shù)值型,結(jié)構(gòu)化的解釋力度要好。以文本為藍(lán)本的研究要比以數(shù)值為藍(lán)本的研究更具有說服力。因此本文中采取的研究辦法是具有其現(xiàn)實意義的。關(guān)鍵詞:股票收益率;個人投資者情緒;文本挖掘;前言1.1研究背景隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,迅速發(fā)展的社交媒體逐漸占據(jù)了信息傳播的高地。與此同時,大數(shù)據(jù)的廣泛應(yīng)用使得社交媒體得以實現(xiàn)信息的快速傳播。4G時代的到來也使得微博、微信、短視頻平臺等進(jìn)入到了人們的生活中,改變了每個人的生活方式。據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)第41次研究報告數(shù)據(jù)顯示,在2020年12月,中國會在網(wǎng)上購買理財產(chǎn)品的網(wǎng)民數(shù)量高達(dá)1.7億左右,相比于2020年3月增長了700萬人。2020年,新冠疫情的影響使得人們轉(zhuǎn)換了投資渠道,不再僅僅通過傳統(tǒng)的理財方式,如銀行存款等來進(jìn)行理財。投資的渠道從線上轉(zhuǎn)換到線下,極大的豐富了投資模式,提高了社會財富的利用率。然而,互聯(lián)網(wǎng)在給我們帶來的便利的同時,也不免給我們帶來了各種負(fù)面影響。通過網(wǎng)絡(luò)上的信息來進(jìn)行投資理財也不一定是永遠(yuǎn)正確的。尤其是在這個有著大量信息的時代,有價值的信息往往被淹沒在茫茫大海中,諸多真假難辨的信息極大的影響了人們的判斷。目前網(wǎng)絡(luò)空間里的主流討論地主要分為財經(jīng)網(wǎng)站和財經(jīng)論壇,財經(jīng)網(wǎng)站里的信息缺乏監(jiān)管,大量的假新聞充斥著網(wǎng)站。而財經(jīng)論壇由于其開放性導(dǎo)致任何人都可以發(fā)表自己的觀點,極大的影響了投資者的情緒。從來源來說,一部分假信息源于個人的判斷力不足,而另一部分則源于利益。一些人甚至故意發(fā)布虛假的信息以誘導(dǎo)人們做出非理性的行為,從而使自己獲利。也就是常說的“割韭菜”。由于每個人的年齡,性別,投資經(jīng)驗,受教育程度,本金數(shù)量都不同,如果相信了虛假的信息,個人就會做出錯誤的決策,從而導(dǎo)致整個市場的混亂,在整個市場里,作為多數(shù)人最先接觸,也是風(fēng)險最小的市場,基金無疑是最值得研究的一個部分。1.2研究意義囿于研究技術(shù)的限制,早期的研究大多缺乏定量性質(zhì)。早期的研究人員度量情緒的方法過于籠統(tǒng),沒有多少研究能夠綜合的構(gòu)建出這個指標(biāo)。隨著研究技術(shù)和研究方法的進(jìn)步和發(fā)展,投資者情緒這一指標(biāo)也有了更好的衡量標(biāo)準(zhǔn)。由于這是當(dāng)代研究的一個熱點問題,在此之前的國內(nèi)外學(xué)者已經(jīng)提出了各種各樣的衡量投資者情緒指數(shù)的方法。其中最經(jīng)典也是最具代表性的無疑是Baker和Wurgler(2006)所構(gòu)建的BW指數(shù),并已成為常用的投資者情緒指數(shù)之一。該指數(shù)主要包括六個投資者情緒指標(biāo),分別是封閉式基金折價率、股票周轉(zhuǎn)率、IPO數(shù)量已經(jīng)IPO第一天的平均回報率。之后使用主成分分析的辦法,將這些指標(biāo)整合為BW指數(shù)。但是,技術(shù)限制導(dǎo)致了該研究的局限性。散戶最集中的金融網(wǎng)站和金融論壇的數(shù)據(jù)沒有被收錄進(jìn)去。近年來,人們開始慢慢發(fā)掘這一領(lǐng)域,將步伐從結(jié)構(gòu)化的數(shù)據(jù)邁向了非結(jié)構(gòu)化的數(shù)據(jù),例如貼吧、論壇等。這些數(shù)據(jù)可以幫助解決以往數(shù)據(jù)解決不了的問題,填補(bǔ)之前結(jié)構(gòu)化數(shù)據(jù)所留下來的空白。盡管大部分網(wǎng)絡(luò)空間里的信息不值得參考,但是這些信息如何影響投資者從而影響整個市場依然是一個值得研究的課題。同時,研究一個開放的虛擬空間里的言論如何去影響真實的市場也有著其社會學(xué)意義。個人在面對駁雜的信息的時候的表現(xiàn)有著相當(dāng)集中的特征,先人的經(jīng)驗也可以幫助后人了解這方面的信息,而不是一味的聽信論壇里真真假假的消息。本文的研究為個人投資者提供了參考,同時幫助了他們進(jìn)行投資。文獻(xiàn)回顧2.1理論基礎(chǔ)1952年,馬科維茨提出了資產(chǎn)投資組合理論。緊接著,金融資產(chǎn)定價模型和套利定價模型補(bǔ)充了其他部分。傳統(tǒng)金融理論開始逐步建立起來。之后,傳統(tǒng)金融理論在資本資產(chǎn)的定價和指導(dǎo)投資者投資方面發(fā)揮了重要作用。傳統(tǒng)金融理論主要包括兩個內(nèi)容:首先是理性人假說,另一個則是有效市場假說。理性人假設(shè)認(rèn)為,投資者是完全理性的,在投資過程中可以依照所有的有效信息做到規(guī)避投資的風(fēng)險。這與經(jīng)濟(jì)學(xué)中的經(jīng)濟(jì)人假設(shè)有相似之處。兩者都是假設(shè),人可以實現(xiàn)效用最大化。有效市場假說則認(rèn)為:市場中的股票價格是隨機(jī)波動的,股票收益呈正態(tài)分布,市場最終處于均衡狀態(tài)。有效市場假說在三個逐漸放松的假說的基礎(chǔ)上證明,市場是有效的。首先,投資者是絕對理性的,并且可以高效的處理信息,市場也是高效的。第二,在一些非理性的投資者的推動下,單筆交易的成交與否,對股票價格的影響也是隨機(jī)的,這些影響相互抵消,因此很難影響股票價格。最后,即使非理性行為會對股價產(chǎn)生一定的影響,這一影響也無法持續(xù)很久。因為市場中的套利者會立刻發(fā)現(xiàn)這一影響并利用這一機(jī)會,從而使股價回歸正常水平。但是隨著研究的深入,這一理論的局限性也越來越明顯。一月效應(yīng)和特殊現(xiàn)象(如股權(quán)溢價之謎)對這一理論提出了挑戰(zhàn)。這兩者受到越來越多研究人員的質(zhì)疑,他們嘗試在這一框架之外理解這些問題,從而催生了行為金融學(xué)。2.2投資者情緒定義與度量與此同時,不同于傳統(tǒng)金融理論,重視投資者情緒的資產(chǎn)定價理論逐漸開始形成。作為對傳統(tǒng)資產(chǎn)定價理論的補(bǔ)充。根據(jù)在非理性形式下,實際金融市場中的投資者可能是受噪聲,認(rèn)知偏見或投資者情緒的影響。并提出了噪聲交易者模型來說明該影響。此外,一些學(xué)者開始通過心理學(xué)來建立偏見交易者模型,認(rèn)為投資者的認(rèn)知偏見對資產(chǎn)有重要影響。這兩種類型的模型的缺點是噪聲和心理偏見難以辨認(rèn)并且不能被衡量;因此,無法僅僅憑經(jīng)驗來證明它們。Baker和WurglerBakerM,WurglerJ.InvestorSentimentintheStockMarket[J].JournalofEconomicPerspectives,2007,21(2):129-152.在2006年發(fā)表的文章發(fā)現(xiàn)了投資者情緒對于投資的重大影響。上文中已經(jīng)提到了該指數(shù)的構(gòu)建辦法,BW指數(shù)是研究投資者的情緒指標(biāo)與收益率之間的關(guān)系的重要指數(shù)之一。研究表明:小公司股票、新發(fā)行股票、高波動性股票、虧損企業(yè)的股票、不分紅企業(yè)股票、高速成長企業(yè)股票、困境企業(yè)股票,如果投資者情緒較低,后來的投資收益率相對較高;如果投資者情緒高漲時,則將獲得較低的投資回報。與噪聲和心理偏見因子相比,投資者情緒可以定量衡量,因此近年來,投資者情緒的系統(tǒng)性作用一直是熱點問題。BakerM,WurglerJ.InvestorSentimentintheStockMarket[J].JournalofEconomicPerspectives,2007,21(2):129-152.許多實證分析和理論研究都表明了研究投資者情緒的意義。不僅僅在股價方面,投資者情緒對資產(chǎn)定價也有著系統(tǒng)性影響。Baker,M.,Wurgler,J.,2006.Investorsentimentandthecross-sectionofstockreturns.JournalofFinance61(4),1645–1680.有些學(xué)者提出了基于情緒的資產(chǎn)定價模型以強(qiáng)調(diào)投資者情緒在資產(chǎn)定價中的系統(tǒng)性作用。例如,YangandYan(2011)建立了情感資產(chǎn)定價模型。Yang,C.,Yan,W.,2011.Dosehighsentimentcausenegativeexcessreturn?InternationalJournalofDigitalContentTechnologyandItsApplication5(12),211–217提出了不同的投資者情緒導(dǎo)致不同的定價。Baker,M.,Wurgler,J.,2006.Investorsentimentandthecross-sectionofstockreturns.JournalofFinance61(4),1645–1680.Yang,C.,Yan,W.,2011.Dosehighsentimentcausenegativeexcessreturn?InternationalJournalofDigitalContentTechnologyandItsApplication5(12),211–217 囿于時代的限制,投資者的網(wǎng)絡(luò)情緒對于股票市場的影響則只是從2000年左右才開始漸漸的進(jìn)入公眾視野。一開始的研究主要以數(shù)字為主。Wysocki在1999年發(fā)表的文章中著重研究了發(fā)帖量這一指標(biāo)對于公司股價的影響。WysockiP.CheapTalkontheWeb:TheDeterminantsofPostingsonStockMessageBoards[J].SsrnElectronicJournal,1999.Da等(2011)則以羅素3000指數(shù)為指標(biāo),分析了每個公司的股票代碼在Google中被搜索的次數(shù)與其之間的關(guān)系。DaZ,EngelbergJ,GaoP.InternetSearchandMomentum[J].SocialScienceElectronicPublishing,2011.然而這些價值很低的數(shù)據(jù)并不能完全反映市場中的信息,要了解投資者的情緒,還得從新技術(shù)入手。Antweiler與Frank(2004)提取了150萬條文本,并將其分類為樂觀、悲觀、中性等三種類型。AntweilerW,FrankMZ.DoesTalkMatter?EvidenceFromaBroadCrossSectionofStocks[J].UniversityofBritishColumbiaWorkingPaper,2004.最后發(fā)現(xiàn)了其中的規(guī)律。這一研究意義深遠(yuǎn)。很快,國內(nèi)也陸續(xù)有了學(xué)者對這個問題進(jìn)行研究。WysockiP.CheapTalkontheWeb:TheDeterminantsofPostingsonStockMessageBoards[J].SsrnElectronicJournal,1999.DaZ,EngelbergJ,GaoP.InternetSearchandMomentum[J].SocialScienceElectronicPublishing,2011.AntweilerW,FrankMZ.DoesTalkMatter?EvidenceFromaBroadCrossSectionofStocks[J].UniversityofBritishColumbiaWorkingPaper,2004.基于NLP技術(shù)和Python數(shù)據(jù)挖掘的投資者情緒指標(biāo)構(gòu)建3.1數(shù)據(jù)來源目前投資者發(fā)布相關(guān)信息的載體主要有微信、短視頻平臺、微博、支付寶評論區(qū)、財經(jīng)軟件評論區(qū)與財經(jīng)論壇等。本文中僅用文本進(jìn)行研究,因此短視頻平臺被排除在外。微信、微博雖然討論熱度高,但是信息的針對性不強(qiáng)。關(guān)于投資客體的信息少之又少,大部分信息是低質(zhì)量而且對研究無幫助的。聚焦于投資主體的特點使得對這兩個平臺的研究難上加難。相比而言,論壇的討論更具有專業(yè)度,各大股吧的討論區(qū)熱度也大抵和股票的表現(xiàn)重合。如果經(jīng)常逛論壇,我們就會發(fā)現(xiàn):股票價格表現(xiàn)穩(wěn)定的時候,論壇里冷冷清清,一天都看不到什么人發(fā)帖。但是如果是牛市或者熊市,論壇的熱度瞬間上升幾個等級,在論壇里面可謂是有著人間百態(tài)。從這種現(xiàn)象出發(fā),本文中將假設(shè)論壇里的發(fā)帖語言體現(xiàn)了投資者對于股票的預(yù)期,源于股票表現(xiàn)又影響著股票的表現(xiàn)。3.2數(shù)據(jù)處理3.2.1文本預(yù)處理首先進(jìn)行數(shù)據(jù)清洗,將標(biāo)點符號和重復(fù)贅余的數(shù)據(jù)進(jìn)行刪除。詞語是句子的基本單位,也是能獨立表現(xiàn)情感的部分之一。通常來說,詞語本身足以反映句子的情感傾向。利用知網(wǎng)的詞典表,當(dāng)需要對一個句子進(jìn)行分詞時,首先將句子拆分成多個部分,并將每一個部分與字典一一對應(yīng),如果該詞語在詞典中,分詞成功,否則繼續(xù)拆分匹配直到成功。大致按照以下流程運(yùn)作:圖3.1文本處理流程示意圖3.2.2情感詞典匹配基于詞典的文本匹配算法相對簡單。對分詞后的語句中的詞語進(jìn)行逐個比對,,如果詞語與詞典中的部分一致,則賦予其權(quán)重。正面詞權(quán)重為加法,負(fù)面詞權(quán)重為減法,否定詞權(quán)重取相反數(shù),程度副詞權(quán)重則和它修飾的詞語權(quán)重相乘。圖3.2文本分類程序框圖謝楊易自然語言處理情感分析【EB/OL】本文所用的情感詞典是由《知網(wǎng)》發(fā)布的《情感分析用詞語集》,作為我國應(yīng)用最廣且地位最高的一部情感詞典,其中包括“正面情感”詞語,如:愛,贊賞,快樂,感同身受,好奇,喝彩,魂牽夢縈,嘉許...“負(fù)面情感”詞語,如:哀傷,半信半疑,鄙視,不滿意,不是滋味兒,后悔,大失所望...“正面評價”詞語,如:不可或缺,部優(yōu),才高八斗,沉魚落雁,催人奮進(jìn),動聽,對勁兒...“負(fù)面評價”詞語,如:丑,苦,超標(biāo),華而不實,荒涼,混濁,畸輕畸重,價高,空洞無物...“程度級別”詞語與“主張”詞語...由于python技術(shù)已經(jīng)相當(dāng)成熟而且具有相應(yīng)的包下載,下文中將主要采用python作為數(shù)據(jù)分析工具。本文對挖掘之后的帖子進(jìn)行以上的操作,并將否定詞的權(quán)重賦為-1,程度副詞按照相應(yīng)的程度賦為相應(yīng)的等級,最后求和。最后的和為正值代表為積極情感,負(fù)值代表為消極情感。投資者社交媒體情緒與股票市場價格波動之間的關(guān)系。4.1.樣本數(shù)據(jù)來源 本文選取了東方財富股吧作為研究對象。在國內(nèi)的財經(jīng)論壇中,東方財富股吧無疑是資格最老、活躍人數(shù)最多的那一個。下面抓取了幾大主流論壇的活躍量(2020.8-2020.9),從日均發(fā)帖量、日均閱讀量和日均活躍用戶三個維度進(jìn)行評估。圖4.1四個論壇數(shù)據(jù)對比從圖中可以看出,東方財富股吧在三個方面無疑都對其他論壇有著壓倒性的優(yōu)勢。因此本文選用該論壇作為數(shù)據(jù)來源。作為股票市場的重要組成部分,創(chuàng)業(yè)板市場有其獨特特點。相較于主板來說,創(chuàng)業(yè)板市場在成立時間、股本規(guī)模、中長期表現(xiàn)這三方面要求更加寬松,也因此吸引力大量新興企業(yè)。由于創(chuàng)業(yè)板市場上市企業(yè)大多趨向于創(chuàng)業(yè)型企業(yè),所以將其命名為創(chuàng)業(yè)板。在創(chuàng)業(yè)板市場上市的公司是高科技公司,因此具有較大的成長空間,但是,這些公司往往成立時間較短,規(guī)模較小??梢哉f,創(chuàng)業(yè)板市場是一個門檻低、風(fēng)險大、監(jiān)管嚴(yán)格的股票市場,也是科技型、成長型企業(yè)的溫床。相比于其他板,創(chuàng)業(yè)板體量較小,也更容易受到輿情的影響。同時,機(jī)構(gòu)投資者也很少涉足創(chuàng)業(yè)板的事務(wù)。對于我們的主題來說,創(chuàng)業(yè)板股票無疑是完美的樣本。為了保證數(shù)據(jù)的可靠性,本文選擇各分類中最具關(guān)注的5只股票進(jìn)行研究。分類參考深交所的行業(yè)分類,選取了各分類中股吧帖子數(shù)量最多的5只股票進(jìn)行研究。4.2變量選取 (1)股票日收益率。本文的研究對象就是投資者情緒對股價的影響,使用股票兩日之間的收益率差值來進(jìn)行衡量。為了方便統(tǒng)計,對兩者之間的差值取對數(shù)。計算公式如下:Reti,t=ln(Pi,t-pi,t-1)(4.1)Reti,t代表著i股票在t日收盤時候的日收益率。Pi,t代表著t股在i日時候的收盤價格,pi,t-1代表著t股在i-1日時候的收盤價格。 (2)股票換手率。換手率也稱“周轉(zhuǎn)率”,指在一定時間內(nèi)市場中股票轉(zhuǎn)手買賣的頻率。如果投資者情緒出現(xiàn)波動,股票的買賣勢必受到影響。因此本文使用股票換手率作為一個衡量消費(fèi)者情緒變化影響的因變量。計算公式如下:Tri,t=voli,t/tri,t(4.2)Tri,t指的是i股票在t日的換手率,voli,tl指的是i股票在t日時候的交易量,tri,t指的是i股票在t日時候的流通股本。 (3)投資者信心指數(shù),即CICSI。由國內(nèi)學(xué)者以封閉式基金折價(DCEF)、交易量(TURN)、IPO數(shù)量(IPON)以及上市首日收益(IOPR)、新增投資者開戶數(shù)(NIA)、消費(fèi)者信心指數(shù)(CCI)這六個變量為藍(lán)本,構(gòu)建出一個包含著12個變量的投資者情緒指數(shù)(cicsit),并加入宏觀經(jīng)濟(jì)變量的影響進(jìn)行回歸之后的一個指數(shù)。相對于我們之前的工作來說,這個指數(shù)偏重于結(jié)構(gòu)化的數(shù)據(jù)。兩者相結(jié)合才能更好反映出整個市場的情況。易志高,茅寧.中國股市投資者情緒測量研究:CICSI的構(gòu)建[J].金融研究,2009,000(011):174-184.易志高,茅寧.中國股市投資者情緒測量研究:CICSI的構(gòu)建[J].金融研究,2009,000(011):174-184. (4)波動率。股票的波動率指的是該股票在當(dāng)天的收盤價與當(dāng)天開盤價之比,如果一只股票的波動率較大,證明消費(fèi)者情緒變化較大,同時為了方便計算,取對數(shù)后得:Volat=ln(pht-plt)/(pt-1)(4.3)Volat指的是此股票在第t天的波動率,pht為股票在第t日的最高價,plt指的是股票在第t日的最低價,pt-1所指的則是該股票在第t-1日的收盤價格。 (5)發(fā)帖量(Num)。本文中所指的是五家公司在東方財富吧平臺上發(fā)表的帖子數(shù)量。發(fā)帖量在一定程度上體現(xiàn)了網(wǎng)民對于公司的關(guān)注度,同時也體現(xiàn)了網(wǎng)民的投資傾向性。 (6)投資者情緒指標(biāo)。目前常見的衡量辦法如下表所示:表4.1指標(biāo)種類指標(biāo)名稱指標(biāo)由來以及含義單一直接指標(biāo)投資者智能指數(shù)投資者智能指數(shù)(InvestorsIntelligence:)II指數(shù)是基于對一百多個報紙股評者的調(diào)查編制的。各評論被分類為看漲、看跌和看平三種。II指數(shù):看漲百分比數(shù)與看跌百分比數(shù)之差。美國個體投資者協(xié)會指數(shù)AAII美國散戶投資人情緒指數(shù)由美國散戶協(xié)會(TheAmericanAssociationofIndividualInvestors,簡稱AAII)所調(diào)查制成,于每周四發(fā)布結(jié)果。其調(diào)查方式只詢問AAII會員投資人一個問題:是否認(rèn)為未來六個月的股市方向是向上(看多),沒有變化(持平)或下降(看空)。AAII于1987年開始進(jìn)行投資人情緒調(diào)查,原先透過明信片郵寄方式,目前則是利用網(wǎng)絡(luò)投票。封閉式基金折價率封閉式基金折價率(Closed-endFundDiscountCEFD)封閉式基金折價:基金的交易價格小于其單位資產(chǎn)凈值(NAV)的情況。該數(shù)據(jù)可由每周公布的NAV得到。封閉式基金折價率計算公式:CEFD=(NAV-Price)/NAV一般認(rèn)為,如果折價率上升,則意味著投資者情緒悲觀,由于封閉式基金大都由個體投資者持有,所以該指標(biāo)可以衡量個體投資者情緒換手率詳見上文新開戶數(shù)量如果消費(fèi)者對于整個交易市場的看法是樂觀的,新開戶數(shù)量就會顯著增多。單一間接指標(biāo)BW情緒指數(shù)Baker和Wurgler在2006年發(fā)表的文章發(fā)現(xiàn)了投資者情緒對于投資的重大影響。文章選擇了封閉式基金折價率、股票換手率、IPO數(shù)量、IPO首日平均收益率等六個投指標(biāo)基于主成分分析法構(gòu)建了一個復(fù)合情緒指數(shù),以此來研究投資者的情緒指標(biāo)與收益率之間的關(guān)系。復(fù)合指標(biāo)由表可知,即使是目前,大多數(shù)的投資者的情緒指標(biāo)也是相當(dāng)主觀的。形式大多止于問卷調(diào)查或者當(dāng)前市場的交易數(shù)據(jù),而并非集中于投資者本身。而要想真正了解投資者,我們就必須深入到投資者中去。東方財富網(wǎng)股吧就給我們提供了一個這樣的數(shù)據(jù)樣本。在股吧里發(fā)言的都是真正的投資者,有著強(qiáng)烈的情緒和最真實的情感。在進(jìn)行數(shù)據(jù)清洗之后,得到投資者情緒指數(shù):E=(?1)n×adv×emo其中E所表達(dá)的即為消費(fèi)者情緒。正值代表著情緒為積極的,負(fù)值則為消極情緒。n為否定詞個數(shù),adv為程度副詞對應(yīng)的分值,emo為情緒副詞對應(yīng)的分值。(7)每股收益率(EPS):指的是稅后利潤與股本總數(shù)的比率。該指標(biāo)反映了企業(yè)的經(jīng)營能力,并用來衡量企業(yè)的獲利能力以及風(fēng)險。是投資者用來了解企業(yè)的盈利能力,預(yù)測企業(yè)將來的發(fā)展前景的重要指標(biāo)之一。(8)創(chuàng)業(yè)板指數(shù)日收益率(GDRR):為了排除大環(huán)境對研究結(jié)果的影響,本文使用創(chuàng)業(yè)板指數(shù)日收益率作為控制變量之一。公式表示為:Ret=ln(P公式中的Ret表示創(chuàng)業(yè)板指數(shù)日收益率,Pt指該只股票在第t天的收盤價,Pt-1指的該只股票在第t-1天的收盤價。表4.2變量含義變量名計算公式股票日收益率(Ret)Reti,t=ln(Pi,t-pi,t-1)換手率(Tr)Tri,t=voli,t/tri,t投資者信心指數(shù)(CICSI)來源于數(shù)據(jù)庫波動率(Vola)Volat=ln(pht-plt)/(pt-1)發(fā)帖量(Num)來源于抓取的數(shù)據(jù)投資者情緒指標(biāo)(E)E=每股收益率(EPS)稅后利潤與股本總數(shù)的比值創(chuàng)業(yè)板指數(shù)日收益率(GDRR)Ret=4.3投資者情緒指標(biāo)的統(tǒng)計4.3.1發(fā)帖數(shù)量的描述性統(tǒng)計 如圖所示,這是五個公司股吧數(shù)據(jù)的描述性統(tǒng)計。表4.3樣本統(tǒng)計來自東方財富、華誼兄弟、愛爾眼科、開元教育以及機(jī)器人的樣本數(shù)據(jù)統(tǒng)計樣本總量提問貼數(shù)量16.1708萬提問貼以及回答貼數(shù)量86.804萬起始日期-結(jié)束日期2020年1月1日至2020年12月31日總?cè)諗?shù)360每日平均發(fā)帖提問量107.2每貼平均閱讀量4.73由圖可知,作為最大的財經(jīng)媒體之一,東方財富網(wǎng)網(wǎng)站的股吧擁有著眾多的擁護(hù)者,社區(qū)的氛圍非常良性,大部分的發(fā)帖都能得到回答。如此大的樣本已經(jīng)能代表這個行業(yè)概況了。4.3.2發(fā)帖內(nèi)容的描述性統(tǒng)計由于無法一一枚舉,下文中將以幾個例子來說明這個問題。通過python將文本內(nèi)容分詞,去掉停用詞之后和情緒字典進(jìn)行比對,最后得出結(jié)果。正如上文所說的那樣,作為情感的重要載體,正面的詞匯反映了正面的情緒,中性詞匯則反映了投資者的中性情緒,而負(fù)面詞匯則反映了投資者的負(fù)面情緒。以下是幾個具有代表性的帖子的表格:表4.3發(fā)帖內(nèi)容示例類別言論舉例正面情緒哈哈哈哈哈哈,這天天爽是遇上財神了,謝謝老板給飯吃,是不是百分之九十漲停,是不是,第一次拉升落袋再進(jìn)。福氣十足?中性情緒看了減持公告的評論,真的佩服某些啥散的智商,說什么完了,趕緊跑吧,請問你炒股不動腦子么?沒有腦子吵什么股?!減持主體,成本891,進(jìn)來的,換成是你,你會虧著錢跑?現(xiàn)在行情這么好,啥13么?其次,他只減持4000萬股,還有百分之五的股份,德陽不知道他這個公告的殺傷力么?如果股價下跌,德陽剩下百分之五的股份豈不是虧得更多?這是他想看到的結(jié)果?這4000萬股,散戶接的住么?肯定接不住,那股價豈不是十個八個跌停?德陽得虧多少?!所以,這4000萬肯定有人接!無非就是制造短期利空,把傻散嚇出去,繼續(xù)洗盤!頂多兩三個跌停!傻散如果想制造恐慌,那你們趕緊掛單走,別在這拖后腿!

今天你跑了,以后別想回來!這里不歡迎墻頭草!負(fù)面情緒能走的時候不走,明天又搶著跑!我的判斷基本差不多,沒有死守的決心,還是見好就收比較好,免得最后狼狽離開,受盡煎熬,反復(fù)打臉,心態(tài)失衡!為了客觀的、定量的描述投資者的情緒,我們將引入情感詞典進(jìn)行處理。對于每句話而言,其情緒指數(shù)可以由否定詞、程度副詞、情感詞來定義。首先將爬取出來的帖子進(jìn)行數(shù)據(jù)清洗。進(jìn)行分詞操作,找出帖子里的情感用詞、程度副詞以及否定詞。之后進(jìn)行判斷,情感詞之前是否有程度副詞和否定詞?基于否定詞的個數(shù)將情感指數(shù)賦權(quán),奇數(shù)個否定詞為-1,偶數(shù)個為1。同時基于程度副詞的強(qiáng)弱等級將情感指數(shù)賦權(quán),強(qiáng)弱等級的判斷參見上文。最后將結(jié)果求和,如果為正數(shù),代表著帖子的態(tài)度是積極的。如果為負(fù)數(shù),代表著帖子的態(tài)度是消極的。4.3.3投資者情緒影響股價的機(jī)理 從直觀的角度來看,投資者情緒反應(yīng)的就是投資者對于該股票的預(yù)期,即當(dāng)投資者對股票市場抱有積極期望時,投資者情緒樂觀,此時相應(yīng)股票的價格將會上漲。當(dāng)投資者對股票市場持消極期望,他們的情緒是悲觀的,此時相應(yīng)的股票的價格將會下跌。如今,在21世紀(jì),隨著各種互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展與壯大,互聯(lián)網(wǎng)的覆蓋率越來越高。因此,互聯(lián)網(wǎng)用戶可以通過互聯(lián)網(wǎng)更好地表達(dá)自己的感受,在線媒體已成為研究投資者情緒對股票價格影響的重要組成部分。4.4假設(shè)與假設(shè) 根據(jù)以上信息,我們可以提出幾個假設(shè)。假設(shè)一:股票收益率的絕對變化值與發(fā)帖量正相關(guān)。一般來說,投資者的情緒狀態(tài)也就代表了對股票走勢的預(yù)期。當(dāng)股票走勢好的時候,投資者情緒高漲,進(jìn)而表現(xiàn)在股吧帖子數(shù)量激增,繼續(xù)激發(fā)其他股民對于股票的信心。這兩者相互作用,促進(jìn)股票的收益率增長。同時,當(dāng)股票走勢差的時候,投資者情緒低迷,進(jìn)而表現(xiàn)在股票帖子數(shù)量上升,導(dǎo)致其他股民對于股票更加悲觀,從而導(dǎo)致股票的收益率下降。因此,我們合理猜測:股票收益率變化的絕對值和發(fā)帖量是正相關(guān)的。假設(shè)二:發(fā)帖量的提高與換手率正相關(guān),投資者信心指數(shù)與投資者情緒指數(shù)與換手率正相關(guān)。發(fā)帖量代表著股票在網(wǎng)絡(luò)上的受關(guān)注程度。因此,發(fā)帖量越大,股票價格波動越大,換手率也就越高。同時,換手率也反映了股票的流通程度。因此,兩個代表著投資者信心的指標(biāo)越高,換手率也就越高。4.5構(gòu)建模型 Cheung(1992)、Fama(1996)等研究表明,公司價值也對股票價格有著重要的影響。因此,本文中引入每股收益(EPS)作為回歸的控制變量之一。同時,由于股市有著大小年之分,我們不能排除市場收益率對股價的影響。為了說明股價的變化是源于消費(fèi)者情緒的變化而非整體變化,本文中引入創(chuàng)業(yè)板指數(shù)日收益率(GDRR)作為另一個控制變量。 針對以上假設(shè),本文將建立回歸模型來進(jìn)行研究。首先是假設(shè)一:Ret=β0+β1NUM+β2GDRR+??(4.6)上述自變量和因變量含義參見前文,同時??為隨機(jī)誤差項。其次是假設(shè)二:TR=β0+β1NUM++β4EPS+β5GDRR+??(4.7)TR=β0+β1CICSI++β4EPS+β5GDRR+??(4.8)TR=β0+β1E++β4EPS+β5GDRR+??(4.9)4.6變量間的Pearson相關(guān)性分析(括號內(nèi)為P統(tǒng)計量)表4.4變量間的Pearson相關(guān)性分析變量名NumRetTrVolaCICSIEEPSGDRRNum1Ret0.097(0.156)1Tr-0.053(0.226)0.008(0.378)1Vola0.003(0.056)0.012(0.134)0.215(0.006)1CICSI0.717(0.037)0.657(0.146)-0.443(0.013)0.237(0.002)1E0.917(0.002)0.567(0.010)-0.345(0.176)-0.115(0.023)0.871(0.002)1Eps0.145(0.001)0.756(0.008)-0.234(0.012)0.013(0.023)0.124(0.005)-0.078(0.003)1Gdrr0.126(0.326)0.879(0.001)0.004(0.918)-0.012(0.328)0.113(0.021)0.278(0.034)0.468(0.023)1從表中可以看出,發(fā)帖量與投資者情緒指標(biāo)的相關(guān)性系數(shù)高達(dá)0.917,而且顯著性水平僅為0.002,我們可以認(rèn)為兩者之間有著顯著的相關(guān)性。但是,發(fā)帖量和換手率之間的關(guān)系則沒有那么明顯,我們姑且可以認(rèn)為這個相關(guān)性不存在。而我們本文著重研究的兩個指標(biāo),即消費(fèi)者信心指數(shù)與消費(fèi)者情緒指數(shù)則與換手率有著不小的正面影響。這也證明了假設(shè)二。而發(fā)帖量和波動性之間的關(guān)系則沒有那么顯著。同時,Eps和Gdrr與消費(fèi)者情緒的兩個指標(biāo)相關(guān)性較小,因此可以作為合格的控制變量。4.7回歸分析根據(jù)上述數(shù)據(jù),我們對這幾家公司的數(shù)據(jù)利用spss軟件進(jìn)行回歸分析。以下為數(shù)據(jù)分析結(jié)果:4.7.1對于假設(shè)1的回歸分析表4.5關(guān)于假設(shè)1的回歸分析結(jié)果匯總自變量因變量(股票日收益率)系數(shù)&T統(tǒng)計量截距項.218(7.12)***Num.014(4.18)***Gdrr1.175(2.67)**EPS.212(7.31)***調(diào)整后的R方0.217樣本量1825注:*,**,***分別表示在10%,5%,1%的水平下顯著。由此可見,方程的常數(shù)項β0為0.218且t值對應(yīng)的顯著性水平小于0.05,因此該常數(shù)項具有顯著性。自變量來看:發(fā)帖量的顯著性較高,且與收益率正相關(guān)。這表明了假設(shè)1的正確性。4.7.2對于假設(shè)2的回歸分析:表4.6對于假設(shè)2的回歸分析結(jié)果匯總自變量因變量(換手率)系數(shù)&T統(tǒng)計量截距項1.378(4.21)***Num.018(2.176)**Gdrr.276(3.247)***EPS3.146(0.018)調(diào)整后的R方0.315樣本量1825自變量因變量(換手率)系數(shù)&T統(tǒng)計量截距項.079(6.24)***E3.186(6.168)***Gdrr.835(2.932)***EPS4.528(1.141)**調(diào)整后的R方0.587樣本量1825自變量因變量(換手率)系數(shù)&T統(tǒng)計量截距項12.128(1.34)**CICSI3.213(6.117)***Gdrr2.129(3.912)**EPS.954(0.124)調(diào)整后的R方0.496樣本量1825注:*,**,***分別表示在10%,5%,1%的水平下顯著。由此可見,方程的常數(shù)項t值對應(yīng)的顯著性水平小于0.05,因此該常數(shù)項具有顯著性。自變量來看:雖然發(fā)帖量的顯著性水平較高,但是系數(shù)較低。發(fā)帖量變化一個單位僅對收益率產(chǎn)生0.018的影響,因此暫且認(rèn)為,發(fā)帖量的影響較小。除此之外,CICSI、投資者情緒指數(shù)均存在著顯著的正面影響。具體數(shù)據(jù)囿于數(shù)據(jù)的特殊性無法估算,但是顯著性水平是非常高的。結(jié)論與展望5.1結(jié)論本文利用了python爬蟲技術(shù),從開放式的網(wǎng)絡(luò)平臺里提取出相應(yīng)的數(shù)據(jù)后,通過python的nlp包做出情感分類從而構(gòu)造出了投資者情緒指數(shù),研究投資者情緒與股票市場的關(guān)系。具體研究結(jié)論如下:第一,研究結(jié)果表明,開放論壇中的投資者情緒能夠顯著的影響股市的價格。投資者情緒越高昂,相應(yīng)的股票收益率也就越高。投資者情緒越低落,相應(yīng)的股票收益率也就越低。同時,通過兩種不同類型的數(shù)據(jù)對比,我們發(fā)現(xiàn):投資者情緒指數(shù)的顯著程度要遠(yuǎn)遠(yuǎn)大于投資者信心指數(shù)的顯著程度。這也說明了文本型,非結(jié)構(gòu)化的數(shù)據(jù)的解釋力度要比數(shù)值型,結(jié)構(gòu)化的解釋力度要好。以文本為藍(lán)本的研究要比以數(shù)值為藍(lán)本的研究更具有說服力。本文中采取的研究辦法是具有現(xiàn)實意義的。同時,從我們的研究結(jié)果來看,發(fā)帖量與股市價格的相關(guān)性雖然很高,但是影響力卻很小,在兩個回歸方程中的系數(shù)均很低。如果從發(fā)帖量來判斷股票市場的價格,會造成誤導(dǎo),從而導(dǎo)致投資的失敗。第二,根據(jù)研究結(jié)果來看,投資者情緒指數(shù)、投資者信心指數(shù)均對個股換手率有正面影響。而情緒指標(biāo)的相關(guān)性更好,這說明非結(jié)構(gòu)性數(shù)據(jù)仍是一片尚待開發(fā)的藍(lán)海。根據(jù)回歸結(jié)果分析,發(fā)帖量對股票的換手率的影響不是很大,所以交易平臺中的投資者,即東方股吧中的股民多數(shù)還是相對理性的。5.2政策與展望大數(shù)據(jù)時代的到來,使得我們對技術(shù)的依賴性不斷增加,信息技術(shù)對我們的日常生活產(chǎn)生著越來越大的影響。我們在網(wǎng)絡(luò)論壇上表達(dá)自己情緒的同時,也影響著其他的投資者。由于網(wǎng)絡(luò)的特性,這些意見會被放大,影響著越來越多的人。我們的言

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論