版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基于文本分析的手機(jī)游戲用戶情感傾向?qū)嵶C研究目錄第一章緒論 第一章緒論1.1研究背景電子游戲作為高科技技術(shù)發(fā)展的骨干,是以各種文化元素作為背景,將文化、科技與創(chuàng)新創(chuàng)作融為一體的第三產(chǎn)業(yè)產(chǎn)物。電子游戲形成以開發(fā)為重要任務(wù)、以同人創(chuàng)作為輔助產(chǎn)品、進(jìn)行多方位人才培養(yǎng)的新型產(chǎn)業(yè)鏈,是現(xiàn)如今第三產(chǎn)業(yè)的重要組成部分。相較于2015年,2016年全球游戲市場(chǎng)規(guī)模達(dá)1011億美元,增長(zhǎng)了91.50億美元,增幅為9.96%[3]。電子游戲同樣是高新技術(shù)的推動(dòng)器,現(xiàn)如今風(fēng)靡全球的AR(AugmentedReality,增強(qiáng)現(xiàn)實(shí))和VR(VirtualReality,虛擬現(xiàn)實(shí))技術(shù),皆有電子游戲推進(jìn)而來(lái)。2016年,任天堂和寶可夢(mèng)公司合作研發(fā)的《PokemonGo》使人們關(guān)注到AR技術(shù),隨后,AR技術(shù)廣泛運(yùn)用于電子教育、醫(yī)療健康、企業(yè)培訓(xùn)、零售購(gòu)物、虛擬試衣、房屋設(shè)計(jì)中。手機(jī)游戲所需求的操作設(shè)備較易獲取并方便攜帶,操作層面是更為簡(jiǎn)單。根據(jù)iiMiediaResearch統(tǒng)計(jì)數(shù)據(jù)顯示,我國(guó)手機(jī)游戲市場(chǎng)的規(guī)模呈現(xiàn)逐年增長(zhǎng)的狀態(tài),2020年市場(chǎng)規(guī)模達(dá)到1850.3億元,2021年預(yù)計(jì)會(huì)達(dá)到2021.1億元。自然語(yǔ)言處理(NaturalLanguageProcessing,NLP)是研究實(shí)現(xiàn)人與計(jì)算機(jī)進(jìn)行通信,將人類交流所使用的自然語(yǔ)言翻譯成計(jì)算機(jī)可讀并且理解的語(yǔ)言。用自然語(yǔ)言與計(jì)算機(jī)進(jìn)行通信,使自然語(yǔ)言通信功能運(yùn)用到生活的各處,極大地便捷了人類的生活。各種手機(jī)的手機(jī)助手,如蘋果手機(jī)的“Siri”,以及各種AI產(chǎn)品,如“天貓精靈”等,在給生活帶來(lái)方便的同時(shí),也添加了樂(lè)趣。文本情感分析是對(duì)有情感色彩的文本進(jìn)行分析和歸納,判斷其包含的情感傾向。處理的文本包括互聯(lián)網(wǎng)上的在線點(diǎn)評(píng)和包含個(gè)人情感傾向和主觀感受的網(wǎng)絡(luò)評(píng)價(jià)等。文本內(nèi)容多包含喜怒哀樂(lè)等情感和表?yè)P(yáng)批評(píng)等主觀態(tài)度,文本情感分析則需要提取文本中的這些傾向性意愿進(jìn)行分析。本文將以國(guó)風(fēng)角色扮演類武俠手游《劍網(wǎng)3:指尖江湖》和《一夢(mèng)江湖》的用戶群體為研究對(duì)象,分析用戶對(duì)游戲內(nèi)的玩法屬性等方面的評(píng)價(jià),尋找用戶比較偏愛的方面,并且對(duì)評(píng)價(jià)較低的方面總結(jié)研究;運(yùn)用整理好的評(píng)價(jià)對(duì)游戲的綜合屬性進(jìn)行分析,找到游戲運(yùn)營(yíng)研發(fā)的薄弱環(huán)節(jié),給游戲開發(fā)者提供意見。1.2研究目的以《劍網(wǎng)3:指尖江湖》和《一夢(mèng)江湖》為例,采用基于領(lǐng)域詞典的在線評(píng)論情感分析技術(shù),嘗試構(gòu)建武俠手游情感評(píng)價(jià)專屬詞典,并通過(guò)情感傾向性分析探究用戶情感評(píng)價(jià)緊密相關(guān)的游戲?qū)傩允悄男┮约八鼈円l(fā)的情感體驗(yàn)特征。對(duì)兩款游戲所涉及的包括玩法和性能以及配置需求等屬性方面,通過(guò)情感詞庫(kù)和機(jī)器學(xué)習(xí)文本分析的方法建立模型,分析用戶對(duì)各方面的滿意度,對(duì)兩款游戲所欠缺的方面整理分析,基于研發(fā)者合理的意見。1.3研究意義1.3.1理論意義采用大數(shù)據(jù)與電子游戲結(jié)合的方法,對(duì)用戶評(píng)價(jià)進(jìn)行傳統(tǒng)文化滲透剖析和用戶滿意度分析,可以更加快速的對(duì)游戲發(fā)展的薄弱問(wèn)題進(jìn)行解讀,為游戲開發(fā)者提供參考,便利了游戲方的運(yùn)營(yíng)。1.3.2現(xiàn)實(shí)意義關(guān)于電子游戲中用戶情感體驗(yàn),可以幫助游戲開發(fā)者和研究者更好地將用戶喜愛和期待的方面融入到游戲設(shè)計(jì)中,增加用戶對(duì)游戲的好感,對(duì)游戲優(yōu)化、用戶粘性、以及同類游戲競(jìng)爭(zhēng)力的提高具有重要意義。1.4本章小結(jié)本章描述了現(xiàn)階段ACG產(chǎn)業(yè)、電子游戲以及手游的產(chǎn)值,簡(jiǎn)單闡述自然語(yǔ)言處理和情感分析的現(xiàn)況,提出研究方向。介紹了文章的研究目的以及研究意義。第二章自然語(yǔ)言處理與文本情感分析相關(guān)綜述第二章自然語(yǔ)言處理與文本情感分析相關(guān)綜述2.1自然語(yǔ)言處理與文本情感分析簡(jiǎn)介自然語(yǔ)言處理(NaturalLanguageProcessing,NLP)簡(jiǎn)單來(lái)說(shuō)就是用計(jì)算機(jī)來(lái)分析和理解人類的自然語(yǔ)言,并將它運(yùn)用到實(shí)際中。其涉及到的科目包括計(jì)算機(jī)、語(yǔ)言學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等。自然語(yǔ)言處理的目的是實(shí)現(xiàn)人機(jī)之間的交互和自然語(yǔ)言通信,即需要計(jì)算機(jī)充分理解人類的自然文本的意義,并且返回給人類用自然語(yǔ)言表示的需要得到的結(jié)果,即分為了自然語(yǔ)言理解和自然語(yǔ)言生成兩個(gè)部分。早期的自然語(yǔ)言處理僅包括建立詞匯、句意分析、問(wèn)答聊天和機(jī)器翻譯功能,90年代開始流行的基于統(tǒng)計(jì)學(xué)的機(jī)器學(xué)習(xí)方法,使自然語(yǔ)言處理有了飛躍性的發(fā)展,尤其在機(jī)器翻譯和搜索引擎等功能上。利用機(jī)器學(xué)習(xí)作為工具,通過(guò)確定得到的參數(shù),對(duì)輸入的數(shù)據(jù)進(jìn)行解碼并得到相應(yīng)的輸出。2008年后,深度學(xué)習(xí)在語(yǔ)音和圖像方面大展拳腳,自然語(yǔ)言處理隨之引入該類方法,而建立起基于神經(jīng)網(wǎng)絡(luò)的自然語(yǔ)言處理算法并在機(jī)器翻譯、問(wèn)答和閱讀理解方面取得不小的進(jìn)展。[5]文本情感分析是對(duì)有情感色彩的文本進(jìn)行分析和歸納,判斷其包含的情感傾向。處理的文本包括互聯(lián)網(wǎng)上的在線點(diǎn)評(píng)和包含個(gè)人情感傾向和主觀感受的網(wǎng)絡(luò)評(píng)價(jià)等。文本內(nèi)容多包含喜怒哀樂(lè)等情感和表?yè)P(yáng)批評(píng)等主觀態(tài)度,文本情感分析則需要提取文本中的這些傾向性意愿進(jìn)行分析。[6]2.2國(guó)內(nèi)外文獻(xiàn)綜述2.2.1國(guó)內(nèi)文獻(xiàn)綜述朱嫣嵐、閔錦、周雅倩(2006)提出了采用知網(wǎng)Hownet的詞典對(duì)文本進(jìn)行情感傾向性計(jì)算,提出了基于語(yǔ)義相似度和基于語(yǔ)義相關(guān)場(chǎng)的傾向性計(jì)算方法[7]。婁德成、姚天昉(2006)通過(guò)對(duì)互聯(lián)網(wǎng)中文評(píng)論進(jìn)行極性分析,提出計(jì)算詞語(yǔ)上下極性的算法,并與人工標(biāo)注的結(jié)果進(jìn)行比較來(lái)證明文章的有效性[8]。單曉紅、楊柳(2014)通過(guò)挖掘產(chǎn)品評(píng)論,提取特征來(lái)分析消費(fèi)者和商家的關(guān)注點(diǎn)從而提供有價(jià)值的信息[9]。陳佳慧(2019)通過(guò)實(shí)時(shí)獲取更新網(wǎng)絡(luò)用語(yǔ),提出了構(gòu)建細(xì)粒度情感詞典的方法[10]。王鐘璞(2020)把文本分析與神經(jīng)網(wǎng)絡(luò)結(jié)合起來(lái)進(jìn)行模型創(chuàng)建[11]。楊經(jīng)、林世平(2011)主要分析喜怒哀懼四類情感問(wèn)題,構(gòu)建相應(yīng)的情感基準(zhǔn)詞,挖掘潛在的情感詞,再通過(guò)機(jī)器學(xué)習(xí)的方法進(jìn)行特征選擇,對(duì)句子進(jìn)行情感識(shí)別分類[12]。杜嘉忠、徐健、劉穎(2014)對(duì)互聯(lián)網(wǎng)上的產(chǎn)品評(píng)論進(jìn)行分析,提出基于領(lǐng)域情感專用詞典的方法,并與基于Senti-HowNet詞典的情感分析進(jìn)行對(duì)比[13]。劉陽(yáng)、高巍、李大舟(2019)通過(guò)分析微博上的200篇文章,根據(jù)群眾對(duì)事件的態(tài)度,根據(jù)情感詞對(duì)情感傾向性的影響,設(shè)計(jì)情感得分的算法[14]。陳海棋(2017)對(duì)海量手游評(píng)論進(jìn)行分析,建立專屬詞典進(jìn)行情感傾向性分析[15]。陳曉東(2012)對(duì)中文微博進(jìn)行情感傾向性分析,通過(guò)分類有情感詞的情感分析和無(wú)情感詞的情感分析,進(jìn)行情感加權(quán)計(jì)算[16]。馬子洲(2018)對(duì)于用戶購(gòu)買手機(jī)后的評(píng)論作為研究范本,利用改良SO-PMI算法對(duì)情感詞典進(jìn)行擴(kuò)充,再對(duì)評(píng)論進(jìn)行正面評(píng)論和負(fù)面評(píng)論的分類[17]。2.2.2國(guó)外文獻(xiàn)綜述Turney等人提出用逐點(diǎn)互信息方法PMI(point-wisemutualinformation)對(duì)評(píng)論和文本進(jìn)行分類,提取語(yǔ)句中帶有主觀意愿的相關(guān)詞性的詞語(yǔ),再通過(guò)計(jì)算褒義種子詞和貶義種子詞的PMI值,再將情感極性相加得到整條評(píng)論的情感傾向[18]。Tofiloski(2011)提取了基于詞典的情感分析方法,利用SO-CAL建立帶有強(qiáng)化情感的詞語(yǔ)和否定詞的詞典[19]。SanjivR.Das、MikeY.Chen(2007)提取了股票留言板中小型投資者的情緒評(píng)論,提出了一種誤差較低的類貝葉斯分類器,分析股票價(jià)值和評(píng)論的情感傾向之間的關(guān)系[20]。MinxueHuang、RizwanAli、JunyunLiao(2017)通過(guò)調(diào)查網(wǎng)游玩家的喜愛偏向,研究用戶體驗(yàn)和口碑傳播,并討論其實(shí)際意義和理論意義[21]。TomioJindo、KiyomiHirasago(1997)采用情感分析對(duì)文本進(jìn)行進(jìn)行主觀評(píng)價(jià),再采用多變量分析進(jìn)行處理[22]2.3本章小結(jié)本章對(duì)自然語(yǔ)言處理和文本情感分析做了簡(jiǎn)單的介紹,再列舉國(guó)內(nèi)外對(duì)于自然語(yǔ)言處理和情感分析的相關(guān)文獻(xiàn)。第三章相關(guān)介紹和理論概述第三章相關(guān)介紹和理論概述3.1國(guó)風(fēng)武俠類手機(jī)游戲3.1.1武俠手機(jī)網(wǎng)絡(luò)游戲的界定網(wǎng)絡(luò)游戲(OnlineGame),簡(jiǎn)稱“網(wǎng)游”,是指通過(guò)互聯(lián)網(wǎng)傳輸?shù)姆绞?,使多位玩家參與的游戲類型。[24]。手機(jī)網(wǎng)絡(luò)游戲即手機(jī)上網(wǎng)可以玩的網(wǎng)絡(luò)游戲。相比于客戶端網(wǎng)絡(luò)游戲,手機(jī)網(wǎng)游最大的特點(diǎn)就是便攜性和移動(dòng)性,更能滿足用戶隨時(shí)隨地玩游戲的需求。相比于早期的單機(jī)手游,手機(jī)網(wǎng)游的色彩玩法更加豐富、畫面更加精美,人物形象建模更加立體飽滿。其操作方式包括觸屏、感重力感應(yīng)等,滿足玩家多方面的體驗(yàn)。武俠文化則是國(guó)內(nèi)特有的流行文化,即以各式俠客形象作為主角,以各種絢爛神幻的武術(shù)技巧作為特點(diǎn),宣揚(yáng)懲奸除惡、伸張正義的精神。周武王《劍銘》中:“帶之以為服,動(dòng)必行德,行德則興,倍德則崩。”《史記-游俠列傳》更是記載了各位俠士的逍遙自在,透露著對(duì)俠士瀟灑意氣的贊美。武俠文化從古至今都有著很高的熱度。古今文人通過(guò)小說(shuō)話本來(lái)宣揚(yáng)俠義精神,如《水滸傳》、《天龍八部》等,近代也不乏有優(yōu)秀的武俠類影視和游戲作品,如《仙劍奇?zhèn)b傳》、《古劍奇譚》等。武俠文化的主角多擁有不輕言棄、刻苦努力,最終成為一代大俠的經(jīng)歷,而各類作品中的關(guān)鍵人物也多為逍遙自在、武力高強(qiáng)的存在。金庸所寫的“俠之大者美國(guó)為民”,點(diǎn)燃了無(wú)數(shù)人的俠心。將這些正面形象融入到現(xiàn)行較為火熱的手機(jī)網(wǎng)游里,一方面為游戲增添樂(lè)趣,同時(shí)也更加快捷宣揚(yáng)了傳統(tǒng)的武俠文化。3.1.2武俠手機(jī)網(wǎng)絡(luò)游戲的分類通過(guò)游戲方式的不同分為三類。第一類為現(xiàn)下武俠類手機(jī)網(wǎng)游多為mmorpg游戲(MassiveMultiplayerOnlineRole-PlayingGame,大型多人在線角色扮演游戲),即玩家通過(guò)扮演一個(gè)虛擬人物來(lái)進(jìn)行各種游戲內(nèi)的活動(dòng),如《天涯明月刀》、《漢家江湖》等。第二類為棋牌類游戲,如《三國(guó)殺》、《英雄殺》,通過(guò)將古代歷史人物和經(jīng)典事件帶入到游戲中,由此使玩家能了解更多歷史。第三類為moba游戲(MultiplayerOnlineBattleArena,多人在線戰(zhàn)術(shù)競(jìng)技游戲),如《王者榮耀》,通過(guò)結(jié)合歷史人物和絢麗的技能以及華美的外觀來(lái)宣揚(yáng)武俠文化。武俠類手機(jī)游戲通過(guò)構(gòu)建不同的世界觀來(lái)展示作品宣揚(yáng)的武俠精神。第一類為歷史故事類,如《三國(guó)志》等,從人物形象和背景上高度還原歷史,使玩家在游戲的同時(shí)學(xué)習(xí)更多歷史知識(shí)。第二類是以古代王朝作為背景構(gòu)建虛擬的框架,如《劍網(wǎng)3:指尖江湖》等。第三類為仙俠類,即架空出一個(gè)現(xiàn)實(shí)中不存在的擁有完整時(shí)間線的世界,如《仙劍奇?zhèn)b傳》等。3.1.3武俠網(wǎng)游的發(fā)展和武俠手機(jī)網(wǎng)絡(luò)游戲產(chǎn)業(yè)現(xiàn)狀2000年后網(wǎng)絡(luò)游戲在國(guó)內(nèi)興起,武俠文化緊隨其后融入到游戲中。但由于玩法單一且韓游火極一時(shí),直到2007年,《魔獸世界》大熱,MMO進(jìn)入全盛時(shí)期,國(guó)產(chǎn)武俠網(wǎng)游開始繁榮。由搜狐暢游公司《天龍八部》憑借古風(fēng)韻味十足的畫面吸引眾多玩家。隨后兩年,金山西山居旗下的《劍俠情緣網(wǎng)絡(luò)版》在3D武俠作品上獲得驕人的成績(jī),成為了國(guó)產(chǎn)3D武俠網(wǎng)游的常青樹。然而到了2015年,隨著社會(huì)節(jié)奏的加快,MMO這種對(duì)設(shè)備和時(shí)間要求較高的游戲模式逐漸衰落,游戲開發(fā)者慢慢講注意力集中于手機(jī)游戲中。隨后推出的各類武俠手游,不再拘泥于受限的時(shí)間和空間,合理利用用戶的碎片化時(shí)間,將網(wǎng)游便捷化,做到隨時(shí)隨地打開手機(jī)就能暢游游戲世界,極大豐富了人們的生活?,F(xiàn)如今武俠手游良莠不齊、玩法類似,除去發(fā)行較早的《一夢(mèng)江湖》和由端游衍生的《劍網(wǎng)3:指尖江湖》,同類MMORPG游戲熱度并不是很高。而想提升產(chǎn)品熱度,首先要做到對(duì)癥下藥,故本文選擇此兩類游戲進(jìn)行研究。3.1.4武俠手機(jī)網(wǎng)絡(luò)游戲的文化元素武俠游戲除了有富含傳統(tǒng)文化和俠義精神的世界觀和人物設(shè)定以外,其他如背景音樂(lè)和地圖構(gòu)造也融入了傳統(tǒng)文化元素,如音樂(lè)方面。武俠游戲多運(yùn)用傳統(tǒng)中國(guó)樂(lè)器,如古箏、編鐘等進(jìn)行譜樂(lè)奏樂(lè),給人以身臨其境的美妙感覺?!秳W(wǎng)3:指尖江湖》中的文化元素《劍網(wǎng)3:指尖江湖》是西山居于2019年6月12日發(fā)行的大型多人3DMMORPG手機(jī)游戲,是古風(fēng)武俠網(wǎng)游《劍網(wǎng)3》的手機(jī)版二次創(chuàng)作[24]。游戲以盛唐安史之亂為時(shí)代背景,在朝堂混亂、社會(huì)動(dòng)蕩不安中各輩俠客行俠仗義、掃奸除惡。其次是游戲的人物設(shè)定。除去如安祿山、史思明等以外真實(shí)存在的歷史人物,游戲還創(chuàng)造了如善于謀略?shī)^勇抗敵的將帥李承恩、巾幗不讓須眉睿智過(guò)人的道教弟子于睿等。同時(shí),游戲的門派設(shè)定和武學(xué)設(shè)置上結(jié)合傳統(tǒng)文化與背景以及信仰流派,如融合道家真諦以劍為武器的純陽(yáng)宮、信奉佛教以禪杖為武器的少林寺。游戲地圖上通過(guò)寺廟、宮殿、庭院等建筑,彰顯古代匠人精湛技術(shù)。結(jié)合盔甲、禪衣、道袍以及唐朝流行服飾,人物模型的建立上也傳達(dá)出文化元素?!兑粔?mèng)江湖》中的文化元素《一夢(mèng)江湖》是以古龍《楚留香傳奇》為游戲背景,由網(wǎng)易游戲研發(fā)的武俠RPG手游。[25]不同于《指尖江湖》,《一夢(mèng)江湖》的世界觀沿用了古龍的小說(shuō)《楚留香傳奇》系列小說(shuō)的故事,從背景上就凸顯俠義氣氛。正派人物設(shè)定或?yàn)樾袀b仗義的俠客,或?yàn)榈赂咄氐恼崎T,又或是智力超群的智者,人物性格突出正派風(fēng)氣。游戲的門派設(shè)定相較于《指尖江湖》更為仙俠,如使用燈和鈴來(lái)進(jìn)行戰(zhàn)斗的云夢(mèng)、使用銅鏡和紙偶來(lái)進(jìn)行戰(zhàn)斗的太陰?!兑粔?mèng)江湖》的地圖設(shè)置更加立體全面,山河湖海、飛檐峭壁的建設(shè)更為生動(dòng)。服飾方面更多采用紗制和飄帶,使人物看起來(lái)更加仙氣。3.1.5武俠手機(jī)網(wǎng)絡(luò)游戲研究中的困難1.中文文本的多樣化在游戲評(píng)論中,用戶可以通過(guò)發(fā)表內(nèi)容來(lái)描述自己的游戲經(jīng)歷和感受,或者是對(duì)某個(gè)環(huán)節(jié)的點(diǎn)評(píng)。這些文字多包含各種情感,但用語(yǔ)大多是非書面語(yǔ),口語(yǔ)化嚴(yán)重,句式結(jié)構(gòu)較為雜亂,利用現(xiàn)有詞庫(kù)進(jìn)行自然語(yǔ)言處理很難計(jì)算出準(zhǔn)確的情感得分。2.情感詞典的構(gòu)建中文文字的表達(dá)方式千變?nèi)f化,一個(gè)詞語(yǔ)在不同情境下包含的情感各有不一。如“厲害”這個(gè)詞,正常語(yǔ)義解釋為“實(shí)力高強(qiáng),能做到別人難以做到的事”,多為褒義詞。但放在“能遲到這么久也是厲害”類似的語(yǔ)句中,則表示貶義。語(yǔ)境不同所表示的情感傾向多有差異,給情感傾向的得分計(jì)算帶來(lái)誤導(dǎo)。而游戲評(píng)論中玩家的發(fā)言更為突出,使構(gòu)造適用于游戲的情感詞典成為該研究的一大難點(diǎn)。3.2文本預(yù)處理3.2.1中文分詞中文分詞的意義中華語(yǔ)言博大精深,在互聯(lián)網(wǎng)發(fā)達(dá)的今天更是如此。在研究中文文本的自然語(yǔ)言處理時(shí),會(huì)遇見很多問(wèn)題。如何快速準(zhǔn)確的進(jìn)行分詞處理是實(shí)現(xiàn)文本情感分析的重要步驟。(1)“詞”和“詞組”的邊界模糊外文多以單個(gè)詞作為單位,中文以每個(gè)基礎(chǔ)字為單位,但單字很難表達(dá)出完整的意思,詞語(yǔ)拆分成的單字具有不同的含義。比如說(shuō),“我想吃蛋糕”這句話,用英文文本描述為“Iwanttoeatacake”,“cake”作為一個(gè)單詞,可直接翻譯為“蛋糕”,但使用中文時(shí),則可以拆分成“蛋”和“糕”兩種食物。(2)語(yǔ)句分割使語(yǔ)義發(fā)生變化不同于英文文本中單個(gè)詞語(yǔ)間有空格分割,中文文本語(yǔ)句連續(xù)成體,因此,劃分句子方法的不同以及對(duì)句子語(yǔ)境理解的不同會(huì)得出不一樣的情感傾向。如:“這個(gè)關(guān)卡非常難過(guò)”中,“難過(guò)”這個(gè)詞語(yǔ)意為“難以通過(guò)”。但在大多語(yǔ)境中,“難過(guò)”多作為形容詞,表示“沮喪、不開心”。(3)新詞層出不窮在信息化發(fā)達(dá)的今天,網(wǎng)絡(luò)在線評(píng)論表述方式各有不一,新詞應(yīng)接不暇,使現(xiàn)有的情感詞典很難準(zhǔn)確地判斷詞語(yǔ)所表達(dá)的情感取向。如:“人艱不拆”、“嘰嘰歪歪”、“避雷”等網(wǎng)絡(luò)新詞。現(xiàn)有分詞算法分類根據(jù)實(shí)現(xiàn)原理和特點(diǎn)的不同,可以將中文分詞分為三類:基于字符串匹配的分詞算法、基于理解的分詞算法和基于統(tǒng)計(jì)的分詞算法。[26](1)基于字符串匹配的分詞算法基于字符串匹配的分詞又名為機(jī)械分詞,是通過(guò)匹配文本與設(shè)定好的詞典中的詞條來(lái)進(jìn)行分詞,若詞典中存在文本中掃描到的詞語(yǔ),則匹配成功。常見的機(jī)械分詞方法有:正向最大匹配法、逆向最大匹配法、雙向最大匹配法。(2)基于理解的分詞算法給予理解的分詞算法是通過(guò)模仿人類的句子理解能力進(jìn)行分詞,即通過(guò)句意判斷來(lái)消除分詞中存在的誤差,包括分詞子系統(tǒng)、句法語(yǔ)義子系統(tǒng)、總控部分三個(gè)系統(tǒng)。(3)基于統(tǒng)計(jì)的分詞算法基于統(tǒng)計(jì)的分詞方法的主要思想是,將單個(gè)字作為最小的單位,聯(lián)系所有要分析的文本,若相連的字出現(xiàn)在該文本中的次數(shù)頻率越高,越有可能成為一個(gè)詞。屆時(shí)則需要設(shè)定一個(gè)頻率作為相關(guān)閾值,用來(lái)衡量詞組出現(xiàn)的可能性,若出現(xiàn)頻率高于該閾值,則可以判斷這些字組成一個(gè)詞。在實(shí)際的分詞過(guò)程中,通常將基于字符串匹配分詞算法和基于統(tǒng)計(jì)的分詞方法結(jié)合使用,既可以表現(xiàn)出對(duì)于現(xiàn)有詞語(yǔ)的匹配速度快的優(yōu)點(diǎn),又可以識(shí)別新詞生詞、減少歧義。主要的統(tǒng)計(jì)模型有:N元文法模型(N-Gram)、隱馬爾科夫模型(HMM)、最大熵模型(ME)、條件隨機(jī)場(chǎng)(CRF)等。中文分詞系統(tǒng)介紹(1)漢語(yǔ)語(yǔ)法分詞系統(tǒng)ICTCLASICTCLAS(InstituteofComputingTechnology,ChineseLexicalAnalysisSystem)由中國(guó)科學(xué)計(jì)算技術(shù)研究所研究得出,其主要功能包括:中英文混合分詞功能、關(guān)鍵詞提取功能、新詞識(shí)別與自適應(yīng)分詞功能、用戶專業(yè)詞典功能。最新研制的ICTCLAS版本為ICTCLAS3.0,分詞速度達(dá)到單機(jī)996KB/s,精度達(dá)到98.45%。[27](2)開源中文分詞系統(tǒng)HTTPCWSHTTPCWS是授權(quán)BSD協(xié)議、目前僅支持Linux操作系統(tǒng)、開發(fā)語(yǔ)言為C/C++的基于HTTP協(xié)議的開源中文分詞系統(tǒng),目前僅支持GBK編碼,利用逆向最大匹配法配合自定義詞庫(kù)對(duì)使用ICTCLAS的分詞結(jié)果進(jìn)行處理。通過(guò)測(cè)試,局域網(wǎng)內(nèi)的HTTPCWS接口中文平均的處理速度為0.001秒,每秒可處理5000到20000次requests。[28](3)簡(jiǎn)易分詞系統(tǒng)SCWSSCWS(SimpleChineseWordsSegmentation)是基于詞頻詞典、可將整段中文文本大致準(zhǔn)確地切分成詞組的機(jī)械中文分詞引擎,是目前最方便的開源免費(fèi)的中文分詞系統(tǒng)之一,支持GBK、UTF-8、BIG5等漢字編碼。SCWS利用自行采集的詞頻詞典,結(jié)合部分專有名稱、人名地名、數(shù)字年份的詞語(yǔ)集合,準(zhǔn)確率在90%~95%之間。[29](4)輕量級(jí)非浸入式PHP應(yīng)用性能分析器PHPAnalysisPHPAnalysis是現(xiàn)存使用較為廣泛的中文分詞系統(tǒng),使用逆向匹配算法配合基于unicode的詞庫(kù)進(jìn)行分詞。[30](5)MMSeg算法中文分詞器mmseg4jmmseg4j是基于Chih-HaoTsai的MMSeg算法的中文分詞器。MMSeg算法使用UTF-8編碼格式,有Simple和Complex兩種分詞方法,都是使用正向最大匹配法。MMSeg1.6版本開始,在Comples算法的基礎(chǔ)上實(shí)現(xiàn)了max-word(最多分詞)。[31]Python常用中文分詞工具介紹(1)jieba分詞jieba分詞是當(dāng)前國(guó)內(nèi)使用最普遍的中文分詞工具,其支持三種模式:1)精確模式:將橘子進(jìn)行最精確的切分;2)全模式:掃描文本中所有可以連接成詞的詞語(yǔ),速度較快,但不能消除歧義;3)搜索引擎模式:結(jié)合精確模式,通過(guò)對(duì)文本中較長(zhǎng)的句子進(jìn)行切分來(lái)提高召回率。[32](2)SnowNLPSnowNLP是受TextBlob啟發(fā)編寫,可以方便處理中文文本的Python類庫(kù)。不同于使用NLTK的TextBlob,SnowNlp自帶已經(jīng)訓(xùn)練好的詞典,且所有算法都是由自身實(shí)現(xiàn)。其主要功能包括:中文分詞、詞性標(biāo)注、情感分析、文本分類、轉(zhuǎn)換成拼音、繁簡(jiǎn)轉(zhuǎn)換、關(guān)鍵詞和摘要提取、計(jì)算文檔詞頻和逆向文檔頻率、文本相似度計(jì)算、Tokenization。[33](3)THULACTHULAC(THULexicalAnalyzerforChinese)是一個(gè)高效的中文詞法分析工具包,由清華大學(xué)自然語(yǔ)言處理和社會(huì)人文計(jì)算實(shí)驗(yàn)室研制,可進(jìn)行中文分詞和詞性標(biāo)注,具有能力強(qiáng)、準(zhǔn)確率高、速度快的特點(diǎn)。[34]3.2.2去除停用詞停用詞是指在信息檢索的過(guò)程中,進(jìn)行自然語(yǔ)言處理前后為了提高處理效率會(huì)自動(dòng)過(guò)濾掉的部分字或詞。停用詞是人工輸入形成的表,在文本中不顯得頻率很高且意義不大,多為一些語(yǔ)氣助詞、連詞、副詞等,如“的”、“是”等。在分詞過(guò)程中,若使用太多的停用詞,會(huì)對(duì)有效信息造成干擾,降低分詞工作的準(zhǔn)確性。Hownet詞典中現(xiàn)有停用詞為2612個(gè)。3.2.3關(guān)鍵字提取關(guān)鍵字提取概述文本以多樣的元素表示,如字、詞組、短句等。這些元素被稱為文本的關(guān)鍵字,代表文本的特性。在進(jìn)行自然語(yǔ)言處理,通常需要從文本中提取關(guān)鍵字。正確的關(guān)鍵字提取可以減少文本的規(guī)模,降低處理難度,有利于改善分析?,F(xiàn)有常見的關(guān)鍵字提取的方法有CHI、IG、MI、word2vec、TF-IDF、Textrank。關(guān)鍵字提取常見方法(1)卡方校驗(yàn)CHI卡方校驗(yàn)(chi-squaretest)是數(shù)理統(tǒng)計(jì)中檢驗(yàn)獨(dú)立性的方法,用來(lái)統(tǒng)計(jì)實(shí)際觀測(cè)值與理論觀測(cè)值之間的偏離程度。在文本的特征選擇中,卡方校驗(yàn)則用來(lái)衡量類別與詞組之間的關(guān)聯(lián)度。假設(shè)詞組與類別間服從自由度為1的卡方分布,則值越大,表示關(guān)聯(lián)度越大,該詞組對(duì)類別的信息量越多,反之則越少。(2)信息增益IG信息增益(InformationGrain,IG)是根據(jù)詞組為整個(gè)分詞系統(tǒng)帶來(lái)的信息量來(lái)判斷其重要性后進(jìn)行篩選。該詞的信息量越多,則重要性越大。信息量的多少由信息熵衡量。對(duì)于一個(gè)詞組來(lái)說(shuō),系統(tǒng)包括該詞組時(shí)的信息熵與排除該詞組后系統(tǒng)的信息熵的差值則為該詞組為系統(tǒng)帶來(lái)的信息量,稱為增益。(3)互信息MI互信息(MutualInformation,MI)是兩個(gè)隨機(jī)變量的信息量,即兩個(gè)變量之間的相關(guān)性,是自然語(yǔ)言處理常用的方法[35]。其基本思想為當(dāng)互信息越大時(shí),類別和詞組越有可能同時(shí)出現(xiàn)。某些訓(xùn)練集中較少可能由于錯(cuò)位分詞出現(xiàn)的詞組,其互信息值較大,容易被選為特征。而這些詞在分類過(guò)程中很難匹配到,故造成工作的準(zhǔn)確率較低。(4)詞向量word2vecword2vec又稱為wordembeddings,是用來(lái)產(chǎn)生詞向量的模型。在使用one-hot(獨(dú)熱編碼)的編碼形式對(duì)文本處理時(shí)可得到詞向量,但結(jié)果存在數(shù)據(jù)稀疏。word2vec則使用神經(jīng)網(wǎng)絡(luò)將one-hot的詞向量映射每個(gè)詞到一個(gè)向量來(lái)表示詞與詞之間的關(guān)系[36]。(5)詞頻-逆文檔頻度TF-IDFTF-IDF其實(shí)為TF與IDF的結(jié)合。TF(TermFrequency)為詞頻,表示某一詞在文章中出現(xiàn)的次數(shù);IDF(InverseDocumentFrequency)為逆向文件頻率,度量某一詞在文章中的重要性和普遍性。TF-IDF實(shí)則為TF*IDF,故:(3-1)故TF-IDF值與某詞在文本中出現(xiàn)的次數(shù)為正比,與該詞在文本中出現(xiàn)的次數(shù)為反比。(6)TextrankTextrank的基本思想是通過(guò)構(gòu)建詞語(yǔ)次之間的網(wǎng)絡(luò)再計(jì)算每個(gè)點(diǎn)的rank值,排序高低提取關(guān)鍵詞。Textrank的迭代公式如下:(3-2)其中,表示結(jié)點(diǎn)的rank值,表示結(jié)點(diǎn)的前驅(qū)結(jié)點(diǎn)集合,表示結(jié)點(diǎn)的后繼節(jié)點(diǎn)集合,作為平滑因子,為權(quán)重,代表兩結(jié)點(diǎn)的邊連接的不同重要程度。本文運(yùn)用的提取關(guān)鍵詞方法為Textrank法。其算法原理如下:1)將文本按照一定的規(guī)矩分割成若干個(gè)部分,即(3-3)再對(duì)句子進(jìn)行去除停用詞、分詞和詞性標(biāo)注的預(yù)處理,保留指定詞性的詞語(yǔ),即(3-4)其中是經(jīng)過(guò)預(yù)處理后保留的候選關(guān)鍵詞。2)構(gòu)建候選關(guān)鍵詞圖,是候選關(guān)鍵詞組成的節(jié)點(diǎn)集,通過(guò)共現(xiàn)關(guān)系來(lái)構(gòu)造邊,即當(dāng)且僅當(dāng)兩個(gè)節(jié)點(diǎn)對(duì)應(yīng)的詞在長(zhǎng)度為K的窗口共現(xiàn)時(shí)邊才會(huì)存在,則最多共現(xiàn)K個(gè)詞。3)迭代傳播每個(gè)節(jié)點(diǎn)的權(quán)重直到收斂,對(duì)各個(gè)權(quán)重進(jìn)行倒序排序選出最高的T個(gè)詞語(yǔ)作為候選詞。4)利用候選詞對(duì)原文進(jìn)行標(biāo)記,若形成相鄰詞組,則組成新建關(guān)鍵詞。3.3本章小結(jié)本章介紹了國(guó)風(fēng)武俠類手機(jī)游戲的現(xiàn)狀和發(fā)展,概述了研究涉及到的兩款手游,分析當(dāng)前情感分析中的困難;對(duì)文本預(yù)處理過(guò)程進(jìn)行簡(jiǎn)單描述,介紹了幾種常用的分詞算法、分詞系統(tǒng)和分詞工具;對(duì)關(guān)鍵詞選擇方法進(jìn)行簡(jiǎn)單介紹。第四章問(wèn)題提出及研究意義第四章問(wèn)題提出及研究意義4.1問(wèn)題提出步入21世紀(jì)后,人們更加重視對(duì)于傳統(tǒng)文化的保護(hù)和傳承。現(xiàn)如今走在街上,琳瑯滿目的古風(fēng)元素,時(shí)不時(shí)還能看到幾個(gè)身著漢服的路人。游戲同樣與時(shí)俱進(jìn),傳統(tǒng)文化游戲廣受用戶喜愛。不單單是將游戲的大環(huán)境設(shè)定在古代王朝中,游戲更是會(huì)在各個(gè)傳統(tǒng)節(jié)日中開設(shè)相應(yīng)的慶典活動(dòng),拿西山居旗下的國(guó)風(fēng)武俠游戲《劍俠情緣網(wǎng)絡(luò)版3》來(lái)說(shuō),端午節(jié)的劃龍舟,重陽(yáng)節(jié)的插茱萸,元宵節(jié)的猜燈謎,都是用戶津津樂(lè)道的地方。同時(shí),這些游戲的地圖設(shè)計(jì)和配樂(lè)選擇,都極其的復(fù)合國(guó)人對(duì)古風(fēng)的審美。本文將以國(guó)風(fēng)角色扮演類武俠手游《劍網(wǎng)3:指尖江湖》和《一夢(mèng)江湖》的用戶群體為研究對(duì)象,收集手游應(yīng)用軟件APP《Taptap》上的用戶評(píng)論,分析用戶對(duì)游戲內(nèi)的玩法屬性等方面的評(píng)價(jià),就傳統(tǒng)文化方面進(jìn)行分析,尋找用戶比較偏愛的方面,并且對(duì)評(píng)價(jià)較低的方面總結(jié)研究;運(yùn)用整理好的評(píng)價(jià)對(duì)游戲的綜合屬性進(jìn)行分析,找到游戲運(yùn)營(yíng)研發(fā)的薄弱環(huán)節(jié),給游戲開發(fā)者提供意見。4.2研究框架研究一:以《劍網(wǎng)3:指尖江湖》和《一夢(mèng)江湖》為例,探究用戶對(duì)國(guó)風(fēng)角色扮演類武俠手游的情感傾向。從Taptap上爬取兩款游戲的在線游戲評(píng)論,通過(guò)機(jī)器學(xué)習(xí)的方法構(gòu)建領(lǐng)域?qū)偾楦性~典和屬性詞典,并將專屬情感詞典與現(xiàn)有的基礎(chǔ)情感詞典組合,形成武俠手游研究情感詞典。研究二:對(duì)兩款游戲的評(píng)論按照屬性進(jìn)行分類,計(jì)算其情感得分,判斷用戶對(duì)于各類屬性的情感傾向,對(duì)兩款游戲所欠缺的方面進(jìn)行整理和分析。并通過(guò)計(jì)算總均分來(lái)判斷用戶對(duì)于各方面的滿意度,研究用戶對(duì)于武俠類角色扮演手游的各屬性情感特征。4.3研究意義4.3.1理論意義采用大數(shù)據(jù)與電子游戲結(jié)合的方法,對(duì)用戶評(píng)價(jià)進(jìn)行傳統(tǒng)文化滲透剖析和用戶滿意度分析,可以更加快速的對(duì)游戲發(fā)展的薄弱問(wèn)題進(jìn)行解讀,為游戲開發(fā)者提供參考,便利了游戲方的運(yùn)營(yíng)。4.3.2現(xiàn)實(shí)意義關(guān)于電子游戲中用戶情感體驗(yàn),可以幫助游戲開發(fā)者和研究者更好地將用戶喜愛和期待的方面融入到游戲設(shè)計(jì)中,增加用戶對(duì)游戲的好感,對(duì)游戲優(yōu)化、用戶粘性、以及同類游戲競(jìng)爭(zhēng)力的提高具有重要意義。4.4本章小結(jié)本章主要提出主要研究問(wèn)題,并分析了研究該問(wèn)題的理論意義和現(xiàn)實(shí)意義。第五章武俠手游評(píng)論情感詞典構(gòu)建第五章武俠手游評(píng)論情感詞典構(gòu)建5.1情感詞典相關(guān)介紹5.1.1情感詞典概述情感是人類對(duì)某一事物所持態(tài)度和反應(yīng),是檢驗(yàn)?zāi)骋皇挛锏拇嬖诤褪录陌l(fā)生是否符合人類預(yù)期及價(jià)值觀時(shí)而產(chǎn)生的態(tài)度體驗(yàn)。[37]情感分析是為了找出說(shuō)話者或作者在某一話題或針對(duì)某一文本的帶有情感傾向觀點(diǎn)和態(tài)度。對(duì)于評(píng)論而言,用戶通過(guò)對(duì)某一話題、產(chǎn)品或事件發(fā)表自己的意見、觀點(diǎn)、立場(chǎng)等,來(lái)表達(dá)內(nèi)心的情感傾向[38]。情感傾向是人類對(duì)于某一事物的主觀存在的內(nèi)心喜惡和內(nèi)在評(píng)價(jià)的傾向,由兩方面衡量,即情感傾向方向和情感傾向度。情感傾向方向又稱為情感極性,通常表現(xiàn)為正面情感、中性情感和負(fù)面情感。如“喜歡”和“好看”表示贊揚(yáng),是正面情感;“討厭”和“難看”表示否定,是負(fù)面情感;而類似于“看過(guò)這部電影”和“去過(guò)這個(gè)地方”等難以判斷情感傾向的詞匯和語(yǔ)句則劃分為中性情感。情感傾向度是指主體對(duì)客體表達(dá)正面情感或負(fù)面情感的強(qiáng)弱程度,通常表達(dá)為不同的情感詞或是修飾副詞。比如,“喜歡”和“深愛”雖都表示正面情感,但“深愛”比“喜歡”在情感程度上更為強(qiáng)烈。又比如,“一般好看”和“非常好看”對(duì)比時(shí),“非?!北取耙话恪钡男揎棾潭雀訌?qiáng)烈。情感詞表示包含情感傾向的詞匯,分為正面情感詞,即積極詞,和負(fù)面情感詞,即消極詞,具有較為濃烈的情感色彩。情感詞典則是情感詞的集合,分為包含正面情感詞的積極情感詞典和包含負(fù)面情感詞的消極情感詞典。5.1.2情感詞典分類基礎(chǔ)情感詞典(1)知網(wǎng)HowNet情感詞典HowNet是中國(guó)科學(xué)計(jì)算機(jī)研究所的研究成果。根據(jù)德克薩斯大學(xué)計(jì)算機(jī)系知識(shí)系統(tǒng)研究小組的評(píng)價(jià),HowNet是用于自然語(yǔ)言處理的在線的常識(shí)知識(shí)庫(kù),包含中文詞典中概念與概念間的關(guān)系,概念的屬性與屬性間的關(guān)系,中文對(duì)應(yīng)的英文概念以及概念的屬性間的關(guān)系。(2)臺(tái)灣大學(xué)簡(jiǎn)體中文情感極性詞典NTUSD臺(tái)灣大學(xué)NTUSD中文情感極性詞典是基于二元?jiǎng)澐址ǖ囊粋€(gè)中文詞庫(kù),共計(jì)11086個(gè)詞語(yǔ),即2810個(gè)積極詞語(yǔ)和8276個(gè)消極詞語(yǔ)。(3)其他情感詞典清華大學(xué)李軍中文褒貶義詞典共包含5568個(gè)褒義詞和4470個(gè)貶義詞。大連理工情感詞典將情感分為樂(lè)、好、怒、哀、懼、惡、驚七大類和21個(gè)小類,并將情感詞分為正向、中性和負(fù)向三個(gè)極性,并具有0到10不同的情感程度。網(wǎng)絡(luò)情感詞典伴隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)世界逐漸呈現(xiàn)出年輕化,而網(wǎng)絡(luò)用語(yǔ)也隨之流行。雖然相比于書面語(yǔ),網(wǎng)絡(luò)用語(yǔ)更加口語(yǔ)化且表達(dá)形式多種多樣,但同樣多帶有感情色彩。有的詞可能是現(xiàn)有可在基礎(chǔ)詞典中找到的詞語(yǔ)的縮寫,如“yygq(陰陽(yáng)怪氣)”;有的是外文音譯來(lái)的,如“瑞思拜(respect,尊重)”;有的則是獨(dú)立創(chuàng)作的不限于漢字表述的用語(yǔ)組成,如“就這”、“666”、“永遠(yuǎn)滴神”。上述舉例的網(wǎng)絡(luò)用語(yǔ)都帶有較為強(qiáng)烈的情感傾向,如“yygq”表示說(shuō)話譏諷,帶有貶義和批評(píng)的情感,“就這”表示對(duì)實(shí)力的失望和不滿,也是帶有否定情感;而“瑞思拜”表示對(duì)某人的尊敬和崇拜,“666”則是對(duì)某人行為舉止的夸贊和表?yè)P(yáng),“永遠(yuǎn)滴神”表示對(duì)某人或某物的高度贊揚(yáng),都具有正面情感。網(wǎng)絡(luò)評(píng)論大多為口語(yǔ)化表達(dá),因此針對(duì)網(wǎng)絡(luò)評(píng)論來(lái)建立網(wǎng)絡(luò)情感詞典尤為重要。本文通過(guò)網(wǎng)絡(luò)搜索總結(jié),與現(xiàn)有基礎(chǔ)情感詞典結(jié)合,形成評(píng)論基礎(chǔ)情感詞典。其中基礎(chǔ)詞典包含《知網(wǎng)HowNet詞典》、《臺(tái)灣大學(xué)NTUSD情感極性詞典》、《清華大學(xué)李軍中文褒貶義詞典》和《大連理工情感詞典》。表5-1基礎(chǔ)情感詞典Table3-1Basicemotiondictionary基礎(chǔ)詞典名稱褒義詞/個(gè)貶義詞/個(gè)知網(wǎng)HowNet詞典45664370臺(tái)灣大學(xué)NTUSD情感極性詞典28108276清華大學(xué)李軍中文褒貶義詞典55684470大連理工情感詞典1355113916對(duì)結(jié)合后的詞典進(jìn)行去重后,得到21595個(gè)正面情感詞和24831個(gè)負(fù)面情感詞。5.2武俠手游專屬情感詞典5.2.1建立武俠手游專屬情感詞典的意義基礎(chǔ)情感詞典包含的情感詞都較為書面,不能體現(xiàn)現(xiàn)代中文千奇百怪的表達(dá)方式。一些本來(lái)不包含情感傾向的詞語(yǔ)出現(xiàn)在特定領(lǐng)域則會(huì)帶有一定的感情色彩,比如“開掛”這個(gè)詞,表示采取不正當(dāng)手段修改游戲客戶端來(lái)使自己游戲獲得更多利益,多帶有批評(píng)和嘲諷意味。收集這樣的特定情感詞形成專屬情感詞典,對(duì)更準(zhǔn)確地判斷評(píng)論情感傾向有著重要的影響。本文使用的建立武俠手游專屬情感詞典的方法是先通過(guò)TextRank法收集情感種子詞,再利用《同義詞詞林》的方法對(duì)情感種子詞進(jìn)行擴(kuò)展,再以擴(kuò)展后的情感種子詞作為基準(zhǔn),利用基于改進(jìn)的SO-PMI算法選取擴(kuò)充詞,構(gòu)建專屬情感詞典。5.2.2SO-PMI算法SO-PMI(SemanticOrientationPointwiseMutualInformation)算法全稱為情感傾向點(diǎn)互信息算法,其由SO-PMI和PMI兩部分組成。PMI算法[39]點(diǎn)互信息算法,又稱PMI算法,是用來(lái)判斷某一詞與基準(zhǔn)詞出現(xiàn)的概率。其表達(dá)式為:,(5-1)其中為和共現(xiàn)的概率,為出現(xiàn)的概率,為出現(xiàn)的概率,若和相互獨(dú)立,則,即。則PMI的結(jié)果分析如下:(5-2)為了方便編程計(jì)算,,,可以表示為(5-3)(5-4)(5-5)其中,為文檔總數(shù),為和共現(xiàn)的次數(shù),為出現(xiàn)的次數(shù),為出現(xiàn)的次數(shù)。則帶入后得:(5-6)SO-PMI算法[16]SO-PMI算法的基本思想是:判斷某一未知詞匯與種子詞的關(guān)聯(lián)程度。若其與積極種子詞的關(guān)聯(lián)程度較大,則判定其為積極詞;若其與消極種子詞的關(guān)聯(lián)程度較大,則判定其為消極詞;若其與積極種子詞和消極種子詞的關(guān)聯(lián)程度相同,則判定其為中性詞。SO-PMI的算法表達(dá)式如下:(5-7)其中,表示未知詞匯和第個(gè)積極種子詞的關(guān)聯(lián)程度,表示積極種子詞的個(gè)數(shù),表示未知詞匯和第個(gè)消極種子詞的關(guān)聯(lián)程度,表示消極種子詞的個(gè)數(shù)。則SO-PMI的分析結(jié)果如下:(5-8)利用SO-PMI算法可以將文本中的未知詞匯判斷分為積極詞或消極詞,并加入相應(yīng)的情感詞典中。5.2.3基于Laplace平滑的改進(jìn)SO-PMI算法[39]由SO-PMI的表達(dá)式我們可以得知,若某詞并未在文檔中出現(xiàn),即,則會(huì)出現(xiàn)分母為0的情況;且當(dāng)分子為0時(shí),通過(guò)python應(yīng)用程序進(jìn)行分析時(shí)可能會(huì)報(bào)錯(cuò)。為了解決上述問(wèn)題,杜銳、朱艷輝等人(2015)提出在《基于平滑SO-PMI算法的微博情感詞典構(gòu)建方法研究》中提出基于Laplace平滑的SO-PMI算法。Laplace平滑又稱加一平滑(add-onesmoothing),由法國(guó)科學(xué)家拉普拉斯最早提出。在訓(xùn)練集很大的情況下,在避免零概率問(wèn)題出現(xiàn)的同時(shí),其每個(gè)分量的計(jì)數(shù)加1對(duì)結(jié)果造成的概率變化可以忽略不計(jì)。其表達(dá)式為:(5-9)其中,表示所有可能的不同的種子詞數(shù)量。帶入到上述公式中得:(5-10)則PMI值可表示為:。(5-11)SO-PMI可表示為:(5-12)其中,。(5-13)由于在某個(gè)固定的待研究文本中,其積極詞個(gè)數(shù)和消極詞個(gè)數(shù)是既定的,即(5-14)故可看做是某一常數(shù)。當(dāng)未知詞與積極種子詞和消極種子詞共現(xiàn)的次數(shù)相同,即(5-15)則未知詞為中性詞,即(5-16)基于Laplace平滑的改進(jìn)SO-PMI的表達(dá)式變?yōu)?5-17)當(dāng)消極種子詞個(gè)數(shù)小于積極種子詞個(gè)數(shù),即,其SO-PMI值小于0,未知詞匯被誤判為消極詞;當(dāng)消極詞個(gè)數(shù)大于積極詞個(gè)數(shù),即,其SO-PMI值大于0,未知詞匯被誤判為積極詞。為了避免帶來(lái)的判斷誤差,故將賦予固定值,令。(5-18)則基于Laplace平滑的改進(jìn)SO-PMI的表達(dá)式為:(5-19)5.2.4基于Good-Turing平滑的改進(jìn)SO-PMI算法[40]Good-Turing平滑又稱為圖靈估計(jì),用來(lái)平滑不常見的詞組。其基本思想是通過(guò)判斷計(jì)數(shù)的高低,利用出現(xiàn)次數(shù)較多的詞組去調(diào)整出現(xiàn)次數(shù)低于他的詞組的估計(jì)量。其平滑計(jì)數(shù)為:,(5-20)其中,表示某詞組出現(xiàn)的次數(shù),表示出現(xiàn)次數(shù)為的詞組的個(gè)數(shù)。姜伶伶、何中市等(2018)在《基于Good-Turing平滑SO-PMI算法構(gòu)建微博情感詞典方法的研究》中,將其引入到SO-PMI算法中,則(5-21)其中,為Good-Turing的平滑計(jì)數(shù)。(5-22)其中,表示文檔中發(fā)生次的未知詞匯的個(gè)數(shù),表示文檔中發(fā)生次的未知詞匯的個(gè)數(shù)。則PMI可表示為:(5-23)SO-PMI的表達(dá)式為:(5-24)其中,。(5-25)將賦值為1,原因見3.2.3。則基于Laplace平滑的改進(jìn)SO-PMI的表達(dá)式為:。(5-26)5.2.5情感詞典構(gòu)建評(píng)價(jià)指標(biāo)[40]本文使用準(zhǔn)確率(Precision)、召回率(Recall)和F1值作為評(píng)價(jià)指標(biāo)。表達(dá)式如下:,(5-27),(5-28)。(5-29)其中,準(zhǔn)確率precision表示被判為正類()中,被正確識(shí)別為正類()所占的比例;召回率recall表示所有真正為正類()中,被識(shí)別為正類()所占的比例;F1綜合考慮了準(zhǔn)確率和召回率,當(dāng)F1較高時(shí),方法越有效。數(shù)據(jù)選擇本文通過(guò)構(gòu)建由兩款游戲評(píng)論組合,隨機(jī)抽取1000條進(jìn)行分詞等規(guī)范化處理后作為測(cè)試集,再利用Textrank法選取出60個(gè)積極種子詞和60個(gè)消極種子詞作為構(gòu)建領(lǐng)域情感詞典的基準(zhǔn)詞。實(shí)驗(yàn)過(guò)程與結(jié)果本文分別使用SO-PMI算法、基于Laplace平滑的改進(jìn)SO-PMI算法和基于Good-Turing平滑的改進(jìn)SO-PMI算法進(jìn)行領(lǐng)域情感詞的識(shí)別。其基本步驟流程圖如下:圖5-1領(lǐng)域情感詞典構(gòu)建示意圖Fig5-1Thepictureofbuildingfieldemotiondictionary第一步:利用jieba分詞對(duì)評(píng)論語(yǔ)料進(jìn)行分詞處理。第二步:通過(guò)算法提取文本中的候選詞,將候選詞與已建立的基礎(chǔ)情感詞典進(jìn)行匹配,若為已有情感詞則忽略,若為未知情感詞則保留。第三步:將候選詞與積極種子詞和消極種子詞進(jìn)行三種SO-PMI算法的計(jì)算,獲得相應(yīng)的SO-PMI值,再根據(jù)得到的值分析其情感傾向。第四步:根據(jù)情感傾向的不同將候選詞分入不同的極性情感詞典,即情感傾向?yàn)榉e極,則分入積極詞典;若情感傾向?yàn)橄麡O,則分入消極詞典;情感傾向?yàn)橹行詣t舍棄[16]。部分輸出結(jié)果展示見附錄Ⅱ。通過(guò)SO-PMI算法和兩種改進(jìn)的SO-PMI算法對(duì)比,即對(duì)比三種方法的準(zhǔn)確率(Precision)、召回率(Recall)和F1值。PosP、PosR、PosF1分別表示積極準(zhǔn)確率、積極召回率和積極F1值,NegP、NegR、NegF1分別表示消極準(zhǔn)確率、消極召回率和消極F1值。對(duì)比結(jié)果如下所示。表5-1三種SO-PMI算法評(píng)價(jià)指標(biāo)Table5-1TheevaluationindicatorsThreealgorithms方法PosPPosRPosF1NegPNegRNegF1SO-PMI58.9%71.1%64.4%70.3%57.5%63.3%Laplace-SO-PMI65.4%78.6%71.4%76.4%67.2%71.5%GoodTuring-SO-PMI79.7%85.3%82.4%78.6%84.2%81.3%圖5-2積極詞評(píng)價(jià)指標(biāo)折線圖Fig5-2Thelinechartofevaluationindicatorsofpositivewords圖5-3消極詞評(píng)價(jià)指標(biāo)折線圖Fig5-2Thelinechartofevaluationindicatorsofnegativewords觀察實(shí)驗(yàn)結(jié)果得知,基于Good-Turing的改進(jìn)SO-PMI算法的評(píng)價(jià)指標(biāo)高于其他兩種方法,故本文使用Good-Turing平滑后的SO-PMI算法得出的結(jié)果來(lái)構(gòu)建領(lǐng)域?qū)偾楦性~典。通過(guò)算法收集到270個(gè)積極情感詞和322個(gè)消極情感詞,將其與基礎(chǔ)情感詞典和網(wǎng)絡(luò)情感詞典進(jìn)行匯總?cè)ブ睾?,得到的情感詞典結(jié)構(gòu)如下表所示。表5-2武俠手游情感詞典Table5-2Theswordsmenmobilegamesemotiondictionary情感極性積極消極情感詞個(gè)數(shù)/個(gè)22858261305.3本章小結(jié)本章先對(duì)情感詞典做了簡(jiǎn)單的介紹,并且列舉了幾種常見的基礎(chǔ)情感詞典,利用基礎(chǔ)情感詞典和網(wǎng)絡(luò)用語(yǔ)詞典構(gòu)成武俠手游基礎(chǔ)情感詞典。再通過(guò)對(duì)比SO-PMI算法和兩種改進(jìn)的SO-PMI算法的評(píng)價(jià)指標(biāo),進(jìn)行綜合比較,擇優(yōu)選用了基于Good-Turing的改進(jìn)SO-PMI算法進(jìn)行領(lǐng)域?qū)偾楦性~典的構(gòu)建。最后將武俠手游基礎(chǔ)情感詞典和領(lǐng)域?qū)偾楦性~典結(jié)合去重后,得到武俠手游情感詞典。第六章情感傾向性分析第六章情感傾向性分析6.1情感傾向概述如5.1.1中描述,情感傾向是主體對(duì)某一客體主觀存在的內(nèi)心喜惡和內(nèi)在評(píng)價(jià)的傾向,由兩方面衡量,即情感傾向方向和情感傾向度。情感傾向方向又稱為情感極性,通常表現(xiàn)為正面情感、中性情感和負(fù)面情感,通過(guò)語(yǔ)句中的情感詞用來(lái)表達(dá)對(duì)某一事物的態(tài)度和看法。如下圖所示:表6-1三類情感傾向評(píng)論示例Table6-1Examplesofthreekindsofemotiontendencycomments情感類型評(píng)論示例正面情感(1)我覺得這游戲玩的挺好的,上手挺容易的,玩法新穎。(2)總體還是不錯(cuò),一星給門派劇情,一星給cv,一星給畫質(zhì)畫面(很古風(fēng),清雅)一星給輕功。中性情感(1)沒玩過(guò)劍網(wǎng)三,以前朋友玩過(guò)就試下。(2)本人一開始是因?yàn)閯W(wǎng)3這個(gè)ID吸引過(guò)來(lái)玩的,剛開始把周圍都喜歡玩游戲的朋友拉過(guò)來(lái)一起玩。負(fù)面情感(1)這個(gè)游戲,太失望啦,畫風(fēng)一般,沒什么特點(diǎn)。(2)除了垃圾想不出別的詞來(lái)形容,這應(yīng)該是我玩過(guò)的最垃圾的游戲了。上述評(píng)論中,“好”、“容易”、“新穎”、“不錯(cuò)”等都是褒義詞,包含著正面情感;而“失望”、“垃圾”等是貶義詞,包含著負(fù)面情感。為了方便研究,本文將褒義詞的權(quán)重設(shè)置為1,將貶義詞的2權(quán)重設(shè)置為-1。受網(wǎng)絡(luò)語(yǔ)句口語(yǔ)化嚴(yán)重的影響,在線評(píng)論在某些情況下并不包含情感詞,但表達(dá)著濃烈的情感,如“為什么一進(jìn)戰(zhàn)斗區(qū)域突然就群毆?”這句評(píng)論中,雖然不包含任何情感詞,但評(píng)論中的“為什么”和“?”帶有質(zhì)疑和責(zé)備的意思,故通過(guò)語(yǔ)義可以看出這是一條包含負(fù)面情感的評(píng)論。故在判斷評(píng)論的情感傾向時(shí),要考慮到句子所帶的結(jié)尾標(biāo)點(diǎn)。6.2評(píng)論情感分析一個(gè)完整的帶有情感傾向的句子,不僅包括情感詞,更包括修飾詞,即程度詞和否定詞。程度詞會(huì)強(qiáng)化句子的情感強(qiáng)度。如“背景音樂(lè)也太好聽了”這句評(píng)論中,“好聽”作為褒義詞表達(dá)了正面情感,程度詞“太”則使評(píng)論者對(duì)主體的贊美更為濃烈。程度詞多種多樣,根據(jù)其修飾效果的不同,會(huì)給予其不同的權(quán)重。帶有感嘆語(yǔ)氣,即“!”的句子也強(qiáng)化了句子的情感,在后續(xù)研究中也賦予了一定的權(quán)重。句子中的否定詞則會(huì)使句子的情感傾向發(fā)生反轉(zhuǎn)。如“不喜歡這款游戲”中,“喜歡”原本作為褒義詞表示對(duì)該主題的肯定,但受到“不”字的影響,使其該評(píng)論變成包含負(fù)面情感的評(píng)論。故在進(jìn)行情感分析時(shí),應(yīng)給予否定詞一定的權(quán)重。6.2.1情感詞的判定本文使用的方法是基于詞典的情感分析方法。首先通過(guò)網(wǎng)絡(luò)下載現(xiàn)有更新較全的Hownet詞典,結(jié)合通過(guò)SO-PMI算法得到的領(lǐng)域情感詞典,形成完整的情感詞表進(jìn)行分析。處理方法為掃描整個(gè)句子,對(duì)句子進(jìn)行分詞處理,將分詞好的特征詞與情感詞表中的詞語(yǔ)進(jìn)行逐個(gè)匹配,若匹配成功,則確定其為情感詞;若未匹配到,則不認(rèn)為其為情感詞。如此進(jìn)行,直到此條評(píng)論結(jié)束。6.2.2否定詞的界定“否定”在漢語(yǔ)詞典中的相關(guān)解釋是“表示否認(rèn)的,反面的”。一個(gè)句子中出現(xiàn)類似于“不”、“沒有”等詞語(yǔ),可能會(huì)改變句子原本的情感傾向。而多次出現(xiàn)類似的否定詞,則表達(dá)為多重否定。如“這樣未嘗不是一種好方法”中出現(xiàn)了兩個(gè)否定詞“未嘗”和“不是”,則句意未發(fā)生改變,表示“可以”;而句子“沒有人可以否定這不是個(gè)好游戲”中出現(xiàn)了“沒有”、“否定”、“不是”三個(gè)否定詞,表達(dá)的意思是“所有人都覺得這不是個(gè)好游戲”,實(shí)則為否定情感。本文以標(biāo)點(diǎn)符號(hào)作為斷點(diǎn),斷點(diǎn)前的否定詞個(gè)數(shù)若為奇數(shù)則反轉(zhuǎn)原句的情感傾向,若為偶數(shù)則不改變?cè)涞那楦袃A向。故在進(jìn)行情感分析時(shí),將否定詞的權(quán)重設(shè)置為-1,與否定詞奇偶數(shù)相匹配,達(dá)到正確判斷情感基調(diào)的作用[16]。本文運(yùn)用否定詞詞典是結(jié)合Hownet詞典和筆者根據(jù)網(wǎng)絡(luò)熱門用語(yǔ)自定義模塊共同構(gòu)建的否定詞典,權(quán)重為-1,具體如下:表6-2否定詞表示例Table6-2Examplesofprivatedictionary否定詞示例權(quán)重個(gè)數(shù)不、不是、不會(huì)、不要、不能、不想、不可、不曾、不如、不及、不可……-1376.2.3程度副詞的界定程度副詞是對(duì)一個(gè)形容詞或副詞在表達(dá)程度上進(jìn)行修飾的副詞。不同的程度副詞所表達(dá)的語(yǔ)氣強(qiáng)弱程度不同。如:“我挺喜歡這件衣服”和“我太喜歡這件衣服”做對(duì)比,同樣是表示對(duì)主體的喜愛,但“太”的語(yǔ)氣強(qiáng)烈程度明顯高于“挺”,故對(duì)于不同的程度副詞,在進(jìn)行情感分析研究時(shí)需要進(jìn)行歸類,給予其不同的權(quán)重。將程度副詞分為“極其/最”、“超”、“很”、“較”、“稍”、“欠”六個(gè)階段,分別給予不同的權(quán)重[41],如下圖所示:表6-3程度副詞詞典示例Table6-3Examplesofdegreeadverbwordsdictionary程度副詞等級(jí)評(píng)分權(quán)重示例個(gè)數(shù)極其/最63非常、極其、絕對(duì)69超52.5超額、過(guò)分、何止30很42不過(guò)、格外、很是42較31.5更加、較為、越發(fā)37稍21略加、稍微、一點(diǎn)29欠10.5不大、絲毫、相對(duì)126.2.4感嘆句的界定漢語(yǔ)詞典中對(duì)感嘆句的定義為“帶有濃烈情感色彩的句子,在書面上句末使用感嘆號(hào)”,用來(lái)表示喜怒哀樂(lè)。在情感傾向性分析中,將感嘆句作為情感增強(qiáng)的一種方式,強(qiáng)化其情感程度。在分析過(guò)程中,對(duì)句子進(jìn)行倒序掃描,若句子結(jié)尾符號(hào)為感嘆號(hào),則使倒序掃描到的情感詞權(quán)重增強(qiáng)2倍,如此循環(huán)[16]。首先將“!”作為一個(gè)特征詞,然后對(duì)分詞后的每條評(píng)論進(jìn)行倒序掃描。若不為“!”,則讀取下一個(gè)特征詞;若為“!”,則向前掃描,找出其前一個(gè)情感詞,將其情感權(quán)重乘以感嘆號(hào)的情感權(quán)重,若前無(wú)情感詞,則放棄本次請(qǐng)求進(jìn)行下一次循環(huán)。6.2.5疑問(wèn)句的界定疑問(wèn)句通常帶有“設(shè)問(wèn)”、“疑惑”等感情色彩,在在線評(píng)論中,反問(wèn)句更具有“質(zhì)疑”的意味,多表示否定情感,以“?”結(jié)尾。其在分析過(guò)程中的識(shí)別方法與感嘆句類似,即掃描句子末端是否為問(wèn)號(hào),設(shè)置其權(quán)重為-2[16]。在處理過(guò)程中,倒序掃描分詞后的語(yǔ)料,若找到“?”,則向前尋找語(yǔ)句中是否具有反問(wèn)詞。若具有反問(wèn)詞,則將該評(píng)論的反問(wèn)涉及權(quán)重設(shè)置為-2;若未掃描到反問(wèn)詞,則舍棄此次請(qǐng)求,繼續(xù)下一次循環(huán)。常用的反問(wèn)詞如下所示:表6-3程度副詞詞典示例Table6-3Examplesofdegreeadverbwordsdictionary反問(wèn)詞權(quán)重個(gè)數(shù)為什么、憑什么、憑啥、怎么、哪里、莫非、難道、豈非、如何、奈何……-2376.3情感傾向得分計(jì)算對(duì)于單條評(píng)論而言,其可能包括情感主體、情感詞,以及修飾情感詞的副詞、否定詞等。本文通過(guò)網(wǎng)絡(luò)收集和文本預(yù)處理,構(gòu)建出武俠手游情感詞典、停用詞詞典、程度副詞詞典和否定詞詞典。結(jié)合4.2中給予的權(quán)重對(duì)特征項(xiàng)進(jìn)行打分處理并求和計(jì)算,得到每條評(píng)論的情感得分,再通過(guò)得分的正負(fù)和分?jǐn)?shù)高低判斷其情感傾向和強(qiáng)烈程度。假設(shè)單條評(píng)論可劃分為個(gè)句子,即,每個(gè)句子包含個(gè)情感詞,即。令程度副詞權(quán)重或感嘆號(hào)權(quán)重為,否定詞權(quán)重為,情感詞的權(quán)重為。當(dāng)評(píng)論中某一情感詞被程度副詞修飾時(shí),則該部分的情感得分計(jì)算公式為:。(6-1)當(dāng)評(píng)論中某一情感詞被否定詞修飾時(shí),則該部分的情感得分計(jì)算公式為:。(6-2)則對(duì)于句子而言,該句的情感得分為:。(6-3)對(duì)于整條評(píng)論,該條評(píng)論的情感得分為:。(6-4)通過(guò)判斷的正負(fù)和數(shù)值大小,來(lái)判斷該條評(píng)論的情感傾向和情感強(qiáng)度,即:(6-5)越大,則表示情感越為強(qiáng)烈。6.4本章小結(jié)本章先是簡(jiǎn)單介紹了情感傾向,列舉分析了進(jìn)行情感傾向分析時(shí)對(duì)情感打分其較為重要作用的幾種類型的詞,并賦予一定的權(quán)重。然后對(duì)不同類型的句式進(jìn)行分析給予權(quán)重。最后介紹情感打分的規(guī)則和結(jié)果分析,方便后續(xù)實(shí)驗(yàn)。第七章實(shí)驗(yàn)過(guò)程與結(jié)果分析第七章實(shí)驗(yàn)過(guò)程與結(jié)果分析7.1研究方法7.1.1數(shù)據(jù)來(lái)源本文選取《劍網(wǎng)3:指尖江湖》和《一夢(mèng)江湖》作為研究對(duì)象,選取原因?yàn)閮煽钣螒驘岫容^高,對(duì)于現(xiàn)有的武俠類手游具有一定的代表性,且評(píng)論較為豐富。評(píng)論爬取則是選擇手機(jī)手游應(yīng)用軟件APP《Taptap》上的用戶評(píng)論?!禩aptap》作為較為出眾的手游下載平臺(tái),對(duì)于評(píng)論管理更加嚴(yán)格,且下載量和評(píng)論量相較于其他平臺(tái)更多,爬取也更加便捷。爬取方法為通過(guò)八爪魚采集器軟件爬取,通過(guò)導(dǎo)入url網(wǎng)址,建立任務(wù),讀取網(wǎng)頁(yè)相關(guān)評(píng)論進(jìn)行爬取。7.1.2數(shù)據(jù)預(yù)處理(1)垃圾評(píng)論過(guò)濾在線評(píng)論中包含的內(nèi)容多種多樣,盡管受平臺(tái)網(wǎng)站限制,但仍會(huì)出現(xiàn)部分包含廣告、抽獎(jiǎng)等垃圾評(píng)論。本文利用Excel將包含“Http”、“VX(微信)”、“QQ(扣扣)”等字樣的疑似廣告評(píng)論去除,并過(guò)濾部分無(wú)意義的評(píng)論,最終得到《劍網(wǎng)3:指尖江湖》評(píng)論34445條,《一夢(mèng)江湖》評(píng)論40960條。(2)去除停用詞、分詞與詞性標(biāo)注詞語(yǔ)作為情感分析的基礎(chǔ)單位,構(gòu)成了一句話的情感部分。為了使話語(yǔ)更加連貫,詞語(yǔ)之間多有停用詞進(jìn)行連接,如“今天的飯菜太好吃了”中的“的”、“了”,而這些詞的存在對(duì)句子的情感分析毫無(wú)益處,甚至?xí):衷~的邊界,故在進(jìn)行實(shí)驗(yàn)時(shí)需將停用詞去除。本文選用了網(wǎng)絡(luò)上較為完善的停用詞表,共包含2612個(gè)停用詞。為方便后續(xù)關(guān)鍵詞提取,一般需要對(duì)句子進(jìn)行分詞和詞性標(biāo)注處理。本文采用Python的Jieba算法進(jìn)行實(shí)驗(yàn)。分詞與詞性標(biāo)注示例如下所示:表7-1分詞與詞性標(biāo)注示例Table6-3Aexampleofdividingwordsandadverbandthelablesofpropertyofwords評(píng)論內(nèi)容詞性與標(biāo)注玩法、畫風(fēng)、劇情都很不錯(cuò)玩法/n畫風(fēng)/n劇情/n很/d不錯(cuò)/a7.1.3相關(guān)詞典構(gòu)建構(gòu)建詞典是情感分析的關(guān)鍵。本文共涉及三種情感詞典,如下圖所示。武俠手游詞典武俠手游詞典游戲?qū)傩栽~典情感詞典修飾詞詞典基礎(chǔ)情感詞典專屬情感詞典網(wǎng)絡(luò)情感詞典否定詞詞典程度副詞詞典圖7-1武俠手游情感詞典構(gòu)成Fig7-1Theconstitutionofswordsmenmobilegamesemotiondictionary游戲?qū)傩栽~典為探究?jī)煽钣螒蛟诟鱾€(gè)方面的表現(xiàn)如何,需要提取出游戲的屬性詞構(gòu)成詞典,如“音樂(lè)”、“故事”等令用戶產(chǎn)生情感傾向以及進(jìn)行評(píng)價(jià)的屬性,即將情感傾向性研究的主體從游戲整體劃分為各個(gè)類別。細(xì)分游戲?qū)傩灶悇e可以更好地研究用戶的喜愛偏向以及產(chǎn)品的問(wèn)題所在。利用Textrank算法,對(duì)兩款游戲分別選取出頻數(shù)最高的60個(gè)屬性名詞,將其按照經(jīng)驗(yàn),利用Excel進(jìn)行人工分類,即分為故事、角色、玩法、經(jīng)濟(jì)、性能、交互、社交、場(chǎng)景八大類屬性。將兩款游戲的屬性進(jìn)行分類后如圖所示。表7-2《劍網(wǎng)3:指尖江湖》屬性詞典Table7-2ThepropertydictionaryofEastwardLegend:theEmpyrean屬性內(nèi)容故事劇情、任務(wù)、主線、視頻、支線、故事角色角色、人物、畫風(fēng)、動(dòng)作、模型玩法戰(zhàn)斗系統(tǒng)技能、裝備、戰(zhàn)力、等級(jí)、武器角色統(tǒng)計(jì)門派、屬性、職業(yè)材料物品材料、箱子、秘籍、碎片、道具、寶箱游戲模式戰(zhàn)場(chǎng)、賽季、心眼、名劍、成就、競(jìng)技場(chǎng)、大戰(zhàn)外觀外顯外觀、皮膚經(jīng)濟(jì)金幣、玄晶性能服務(wù)器、系統(tǒng)、優(yōu)化交互感官交互視角、畫面、畫質(zhì)、特效、手感、聲音、音效游戲交互羈絆、好感、配音社交幫會(huì)、親友、隊(duì)友、師父、徒弟、團(tuán)隊(duì)場(chǎng)景地圖、界面、場(chǎng)景、風(fēng)景表7-3《一夢(mèng)江湖》屬性詞典Table7-3ThepropertydictionaryofADreamingRuneScape屬性內(nèi)容故事劇情、任務(wù)、主線、故事、視頻角色角色、人物、動(dòng)作、畫風(fēng)玩法戰(zhàn)斗系統(tǒng)技能、裝備、武器、戰(zhàn)力角色統(tǒng)計(jì)門派、等級(jí)、職業(yè)、經(jīng)驗(yàn)、屬性材料物品秘籍、材料、道具、家具游戲模式副本、奇遇、房子、戰(zhàn)場(chǎng)、家園、茶館外觀外顯衣服、時(shí)裝、外觀、衣柜經(jīng)濟(jì)銀兩、銅幣、銀票、元寶、銅錢、貨幣、銀子性能系統(tǒng)、服務(wù)器交互感官交互畫質(zhì)、特技、畫面、特效游戲交互好感、配音、語(yǔ)音社交親友、情緣、徒弟、師父、好友、幫會(huì)、社交、隊(duì)友場(chǎng)景風(fēng)景、地圖、場(chǎng)景、界面兩款游戲的詞云圖如圖所示:圖7-2《劍網(wǎng)3:指尖江湖》詞云圖Fig7-2ThewordscloudofEastwardLegend:theEmpyrean圖7-3《一夢(mèng)江湖》詞云圖Fig7-3ThewordscloudofADreamingRuneScape情感詞典本文使用的情感詞典為第三章所建立的情感詞典,即結(jié)合基礎(chǔ)情感詞典、網(wǎng)絡(luò)用語(yǔ)情感詞典和領(lǐng)域?qū)偾楦性~典構(gòu)建的含有22987個(gè)積極詞匯和26846個(gè)消極詞匯的情感詞典。修飾詞詞典本文選用的程度副詞詞典和否定詞典為使用較為廣泛的Hownet詞典,并對(duì)詞典進(jìn)行部分補(bǔ)充,得到包含6大類共219個(gè)程度副詞的程度副詞詞典和包含37個(gè)否定詞的否定詞典。7.2具體分析過(guò)程第一步:利用Excel的篩選功能將評(píng)論按照屬性進(jìn)行分類;第二步:利用6.3所描述的方法對(duì)每條評(píng)論進(jìn)行打分;第三步:將輸出結(jié)果導(dǎo)入Excel中,結(jié)果格式為“情感得分+空格+評(píng)論內(nèi)容”,并利用分列功能以空格為標(biāo)志將得分和內(nèi)容分離,輸出結(jié)果示例展示見附錄Ⅲ;第四步:利用排序功能將得分進(jìn)行從高到低的排列,統(tǒng)計(jì)出各個(gè)屬性中積極評(píng)論、中性評(píng)論和消極評(píng)論的條數(shù);第五步:計(jì)算各個(gè)屬性三種情感傾向的評(píng)論數(shù)的卡方值,判斷三種評(píng)論條數(shù)是否有差異,且差異是否顯著;再計(jì)算積極評(píng)論與消極評(píng)論數(shù)量卡方值,判斷褒貶評(píng)論間是否有明顯差異;第六步:將各個(gè)屬性的得分求平均數(shù),得到屬性平均分。7.3結(jié)果分析7.3.1情感傾向性構(gòu)成分析將兩款游戲收集到的評(píng)論分別按照5.2所述方法進(jìn)行實(shí)驗(yàn),得到的實(shí)驗(yàn)結(jié)果如下圖所示:表7-4《劍網(wǎng)3:指尖江湖》屬性評(píng)論構(gòu)成和卡方值Table7-4Theconstitutionofcommentsofeachpropertyandchi-squarevaluesofEastwardLegend:theEmpyrean屬性積極中級(jí)消極故事15151316157825.45***1.28角色1619988121753.67***4.05*玩法459521243471142.41***156.63***經(jīng)濟(jì)42923832855.06***13.48***性能1002921108613.57**3.38交互21139231256110.55***4.60*社交2311990135957.60***50.31***場(chǎng)景19118151129116.36***29.63***注:*p<0.05表示;**表示p<0.01;***表示p<0.001表7-4《一夢(mèng)江湖》屬性評(píng)論構(gòu)成和卡方值Table7-4Theconstitutionofcommentsofeachpropertyandchi-squarevaluesofADreamingRuneScape屬性積極中級(jí)消極故事19471513172354.53***13.67***角色101945261145.71***23.64***玩法731760156548129.31***42.65***經(jīng)濟(jì)848451912169.26***2.33性能1094853119691.01***4.54*交互14291105119944.66***20.13***社交17611564185325.26***2.34場(chǎng)景13761129118124.74***8.07**注:*p<0.05表示;**表示p<0.01;***表示p<0.001表7-5各屬性評(píng)論數(shù)Table7-5Thequantitiesofeachproperty屬性劍網(wǎng)3:指尖江湖一夢(mèng)江湖評(píng)論總數(shù)故事440951839592角色382420825906玩法101901988030070經(jīng)濟(jì)99522113206性能300931436152交互429237338025社交466051789838場(chǎng)景385536867541從評(píng)論數(shù)量上分析,用戶對(duì)于屬性的關(guān)注度從高到低分別為玩法、社交、故事、交互、場(chǎng)景、性能、角色和經(jīng)濟(jì)。對(duì)于《劍網(wǎng)3:指尖江湖》,其評(píng)論占比從高到低依次為玩法、社交、故事、交互、角色、性能、經(jīng)濟(jì);對(duì)于《一夢(mèng)江湖》,其評(píng)論數(shù)量從高到低依次為玩法:故事、社交、交互、場(chǎng)景、性能、經(jīng)濟(jì)、角色。故事屬性上,《劍網(wǎng)3:指尖江湖》的三種評(píng)論數(shù)有差異(=24.45,p<0.001),而積極評(píng)論與消極評(píng)論數(shù)量間對(duì)比無(wú)明顯差異(=1.28,p>0.05);《一夢(mèng)江湖》的三種評(píng)論數(shù)有差異(=54.53,p<0.001),積極評(píng)論與消極評(píng)論數(shù)量間有明顯差異(=13.67,p<0.001),其中積極評(píng)論居多。角色屬性上,《劍網(wǎng)3:指尖江湖》的三種評(píng)論數(shù)有差異(=53.67,p<0.001),積極評(píng)論與消極評(píng)論數(shù)有差異但不顯著(=4.05,p<0.05),其中積極評(píng)論居多;《一夢(mèng)江湖》的三種評(píng)論數(shù)有差異(=45.71,p<0.001),積極評(píng)論與消極評(píng)論數(shù)有明顯差異(=23.64,p<0.001),其中積極評(píng)論居多。玩法屬性上,《劍網(wǎng)3:指尖江湖》的三種評(píng)論數(shù)有差異(=142.41,p<0.001),積極評(píng)論與消極評(píng)論數(shù)有顯著差異(=156.63,p<0.001),其中積極評(píng)論居多;《一夢(mèng)江湖》的三種評(píng)論數(shù)有差異(=129.31,p<0.001),積極評(píng)論與消極評(píng)論數(shù)有明顯差異(=23.64,p<0.001),其中積極評(píng)論居多。經(jīng)濟(jì)屬性上,《劍網(wǎng)3:指尖江湖》的三種評(píng)論數(shù)有差異(=55.06,p<0.001),積極評(píng)論與消極評(píng)論數(shù)有顯著差異(=13.48,p<0.001),其中積極評(píng)論居多;《一夢(mèng)江湖》的三種評(píng)論數(shù)有差異(=169.26,p<0.001),而積極評(píng)論與消極評(píng)論數(shù)量間對(duì)比無(wú)明顯差異(=2.33,p>0.05)。性能屬性上,《劍網(wǎng)3:指尖江湖》的三種評(píng)論數(shù)有較為顯著的差異(=13.57,p<0.01),而積極評(píng)論與消極評(píng)論數(shù)量間無(wú)明顯差異(=3.38,p>0.05);《一夢(mèng)江湖》的三種評(píng)論數(shù)有差異(=91.01,p<0.001),積極評(píng)論與消極評(píng)論數(shù)有差異但不顯著(=4.54,p<0.01),消極評(píng)論較多。交互屬性上,《劍網(wǎng)3:指尖江湖》的三種評(píng)論數(shù)有差異(=110.55,p<0.001),積極評(píng)論與消極評(píng)論數(shù)有不顯著差異(=4.60,p<0.05),其中消極評(píng)論居多;《一夢(mèng)江湖》的三種評(píng)論數(shù)有差異(=44.66,p<0.001),積極評(píng)論與消極評(píng)論數(shù)有明顯差異(=20.13,p<0.001),其中積極評(píng)論居多。社交屬性上,《劍網(wǎng)3:指尖江湖》的三種評(píng)論數(shù)有差異(=57.6,p<0.001),積極評(píng)論與消極評(píng)論數(shù)有明顯差異(=50.31,p<0.001),其中積極評(píng)論居多;《一夢(mèng)江湖》的三種評(píng)論數(shù)有差異(=25.26,p<0.001),而積極評(píng)論與消極評(píng)論數(shù)量間對(duì)比無(wú)明顯差異(=2.36,p>0.05)。場(chǎng)景屬性上,《劍網(wǎng)3:指尖江湖》的三種評(píng)論數(shù)有差異(=116.36,p<0.001),積極評(píng)論與消極評(píng)論數(shù)量間有明顯差異(=29.63,p<0.001),其中積極評(píng)論居多;《一夢(mèng)江湖》的三種評(píng)論數(shù)有差異(=24.74,p<0.001),而積極評(píng)論與消極評(píng)論數(shù)有較為顯著的差異(=8.07,p<0.01),其中積極評(píng)論居多。圖7-4《劍網(wǎng)3:指尖江湖》各屬性評(píng)論分布圖Fig7-4ThepictureofpropertycommentsdistributionsofwordscloudofEastwardLegend:theEmpyrean圖7-5《一夢(mèng)江湖》各屬性評(píng)論分布圖Fig7-5ThepictureofpropertycommentsdistributionsofwordscloudofADreamingRuneScape7.3.2屬性情感傾向分析假設(shè)某一屬性的情感總得分為,表示屬性的類型。該屬性中每條評(píng)論的打分為,則:,(7-1)則屬性平均分的表達(dá)式為:,(7-2)為探究用戶對(duì)于武俠手游的各個(gè)屬性的情感體驗(yàn),本文引入屬性總均分。兩款游戲的屬性總均分為單個(gè)屬性上兩款游戲的情感總得分之和與用戶對(duì)于兩款游戲在該屬性上的評(píng)論數(shù)的比值,即:(7-3)其中,表示《劍網(wǎng)3:指尖江湖》在第類屬性上的評(píng)論數(shù),表示《一夢(mèng)江湖》在第類屬性上的評(píng)論數(shù)。表7-6各屬性平均分和屬性總均分Table7-6Theaveragescoresofeachpropertyandgrandaveragescores屬性屬性平均分屬性總均分劍網(wǎng)3:指尖江湖一夢(mèng)江湖故事1.020.040.49角色-0.770.43-0.35玩法-1.000.35-0.11經(jīng)濟(jì)0.661.030.92性能-0.421.850.73交互0.710.160.47社交-0.19-0.24-0.22場(chǎng)景-0.39-1.42-1.02圖7-6各屬性平均分和屬性總均分柱狀圖Fig7-6Thehistogramofaveragescoresofeachpropertyandgrandaveragescores對(duì)于《劍網(wǎng)3:指尖江湖》而言,其屬性平均分從高到低排序依次為:故事、交互、經(jīng)濟(jì)、社交、場(chǎng)景、性能、角色、玩法。其中故事和交互的屬性平均分為正值,且故事的得分>1,說(shuō)明用戶對(duì)于該屬性的好評(píng)率較高,喜愛程度較強(qiáng);交互屬性平均分為正值,但得分較低,說(shuō)明用戶僅對(duì)這兩類屬性產(chǎn)生積極情感,但并不強(qiáng)烈;在經(jīng)濟(jì)、社交、場(chǎng)景、性能、角色和玩法方面的屬性平均分為負(fù)值,且玩法的得分絕對(duì)值>1,說(shuō)明該屬性使玩家的體驗(yàn)較差,甚至讓玩家感覺不適;經(jīng)濟(jì)、社交、場(chǎng)景、性能和角色方面的得分為負(fù)數(shù)但介于-1到0之間,說(shuō)明這幾類屬性使玩家的游戲體驗(yàn)降低,但從總體上來(lái)說(shuō)并不強(qiáng)烈。對(duì)于《一夢(mèng)江湖》而言,屬性平均分從高到低排序依次為:性能、經(jīng)濟(jì)、角色、玩法、交互、故事、社交、場(chǎng)景。其中性能、經(jīng)濟(jì)、角色、玩法、交互和故事的屬性平均分為正值,且性能和經(jīng)濟(jì)的得分>1,說(shuō)明用戶對(duì)于該兩類屬性的好評(píng)率較高,喜愛程度較強(qiáng);角色、玩法、交互和故事的平均分為正值,但得分較低,說(shuō)明用戶僅對(duì)這兩類屬性產(chǎn)生積極情感,但并不強(qiáng)烈;在社交和場(chǎng)景方面的屬性平均分為負(fù)值,且場(chǎng)景的得分絕對(duì)值>1,說(shuō)明該屬性使玩家的體驗(yàn)較差,甚至讓玩家感覺不適;社交方面的得分為負(fù)數(shù)但介于-1到0之間,說(shuō)明這幾類屬性使玩家的游戲體驗(yàn)降低,但從總體上來(lái)說(shuō)并不強(qiáng)烈。綜合而言,兩款游戲在故事、經(jīng)濟(jì)、交互方面的評(píng)分均分為正數(shù),在社交和場(chǎng)景上的評(píng)分均分為負(fù)數(shù)。故事、經(jīng)濟(jì)、性能、交互的屬性總均分為正數(shù),且均介于0到1之間;角色、玩法、社交、場(chǎng)景的屬性總均分為負(fù)數(shù),其中場(chǎng)景的均分絕對(duì)值>1,其他三類介于-1到0之間。7.4本章小結(jié)本章對(duì)實(shí)驗(yàn)過(guò)程進(jìn)行了詳細(xì)介紹,并展示了兩款游戲的屬性詞典。接著對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析,得到相應(yīng)的結(jié)論。第八章總結(jié)與展望第八章總結(jié)與展望8.1結(jié)果分析與總結(jié)玩法是一款游戲的核心,用戶嘗試去體驗(yàn)一款游戲,主要是為了體驗(yàn)其玩法。在游戲玩法上的創(chuàng)新會(huì)使游戲更加吸引人?!秳W(wǎng)3:指尖江湖》在游戲上的評(píng)分較低,說(shuō)明用戶體驗(yàn)價(jià)差,究其原因可能是其玩法不夠新穎,且游戲內(nèi)容負(fù)重較大,使用戶不能以輕松平和的狀態(tài)參與游戲活動(dòng)。《一夢(mèng)江湖》在游戲玩法上較為成功,合理的游戲難度和為用戶著想的游戲內(nèi)數(shù)值設(shè)置可以更長(zhǎng)久地留住用戶。不同于單機(jī)游戲,網(wǎng)絡(luò)游戲的亮點(diǎn)之一便是在于社交,在游戲內(nèi)與隊(duì)友協(xié)同合作,與朋友并肩玩耍,都是在線游戲相較于單機(jī)游戲的特色所在。通過(guò)屬性評(píng)分可知,《劍網(wǎng)3:指尖江湖》和《一夢(mèng)江湖》在社交上的表現(xiàn)都差強(qiáng)人意,其原因可能是隨著手機(jī)的普及和手機(jī)游戲用戶素質(zhì)及水平的良莠不齊,導(dǎo)致其他用戶在享受游戲時(shí)受到阻礙和干擾。一款游戲的故事是對(duì)于整個(gè)游戲的基礎(chǔ)。游戲的具體活動(dòng)圍繞著游戲的故事內(nèi)容展開,故事中的任務(wù)和主支線活動(dòng)則是向用戶展示游戲故事的具體方式。《劍網(wǎng)3:指尖江湖》的用戶對(duì)其故事較為喜愛,其原因可能是在真實(shí)歷史背景下進(jìn)行再創(chuàng)作的故事更加吸引人,且游戲本身故事較為感人曲折;《一夢(mèng)江湖》的用戶對(duì)于該屬性的態(tài)度雖是積極的,但評(píng)分較低,說(shuō)明用戶對(duì)故事的態(tài)度較為平淡,游戲故事本身并不是很吸引人。本文將交互分為感官交互和游戲交互。感官交互表示用戶在體驗(yàn)游戲時(shí)感官上的體驗(yàn),包括對(duì)于游戲的手感、對(duì)于游戲特效視覺上的沖擊和對(duì)于音樂(lè)等聽覺上的體驗(yàn)。游戲交互是指用戶在游戲內(nèi)與NPC(游戲內(nèi)虛擬人物)的交互,包括與NPC之間的好感度、與NPC對(duì)話時(shí)的配音等等。《劍網(wǎng)3:指尖江湖》相較于《一夢(mèng)江湖》在交互上的表現(xiàn)更為出色,其2.5D的平面畫面使操作更為便捷,且特效展示更加明顯;配樂(lè)上《劍網(wǎng)3:指尖江湖》更有意境,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026貴州京學(xué)貴陽(yáng)附屬實(shí)驗(yàn)學(xué)校招聘19人備考題庫(kù)附答案
- 2025徐匯區(qū)醫(yī)療保險(xiǎn)事務(wù)中心招聘醫(yī)療保險(xiǎn)社會(huì)服務(wù)工作人員考試備考題庫(kù)必考題
- 《汽車服務(wù)工程專業(yè)導(dǎo)論》課件-06汽車服務(wù)工程專業(yè)的學(xué)習(xí)方法
- 2025 小學(xué)五年級(jí)科學(xué)下冊(cè)軟體動(dòng)物模型的貝殼與運(yùn)動(dòng)方式課件
- 2025年江西水利職業(yè)學(xué)院輔導(dǎo)員考試真題
- 2026中國(guó)科學(xué)院廣州地球化學(xué)研究所科研助理招聘1人備考題庫(kù)(高溫高壓實(shí)驗(yàn)學(xué)科組)及完整答案詳解1套
- 2026國(guó)家稅務(wù)總局山東省稅務(wù)局招聘事業(yè)單位工作人員備考題庫(kù)及參考答案詳解一套
- 2026云南普洱市自然資源和規(guī)劃局招聘公益性崗位工作人員4人備考題庫(kù)及答案詳解(奪冠系列)
- 初中體育標(biāo)槍投擲動(dòng)作的疲勞恢復(fù)數(shù)字化監(jiān)測(cè)課題報(bào)告教學(xué)研究課題報(bào)告
- 2025年航空行業(yè)可重復(fù)使用火箭技術(shù)創(chuàng)新與成本降低報(bào)告
- 環(huán)境應(yīng)急培訓(xùn)課件
- 2026年大連雙D高科產(chǎn)業(yè)發(fā)展有限公司公開選聘?jìng)淇碱}庫(kù)及答案詳解(奪冠系列)
- 2026河南鄭州信息工程職業(yè)學(xué)院招聘67人參考題庫(kù)含答案
- 團(tuán)隊(duì)建設(shè)與協(xié)作能力提升工作坊指南
- 客房清掃流程培訓(xùn)課件
- 醫(yī)療機(jī)構(gòu)藥品配送服務(wù)評(píng)價(jià)體系
- 醫(yī)療資源合理分配
- 婦科微創(chuàng)術(shù)后護(hù)理新進(jìn)展
- 幼兒園大蝦課件
- 2025新疆能源(集團(tuán))有限責(zé)任公司共享中心招聘?jìng)淇碱}庫(kù)(2人)帶答案詳解(完整版)
- 2025至2030中國(guó)超純水(UPW)系統(tǒng)行業(yè)項(xiàng)目調(diào)研及市場(chǎng)前景預(yù)測(cè)評(píng)估報(bào)告
評(píng)論
0/150
提交評(píng)論