【《網(wǎng)絡(luò)評(píng)論與在線評(píng)分的關(guān)系分析案例》2900字】_第1頁
【《網(wǎng)絡(luò)評(píng)論與在線評(píng)分的關(guān)系分析案例》2900字】_第2頁
【《網(wǎng)絡(luò)評(píng)論與在線評(píng)分的關(guān)系分析案例》2900字】_第3頁
【《網(wǎng)絡(luò)評(píng)論與在線評(píng)分的關(guān)系分析案例》2900字】_第4頁
【《網(wǎng)絡(luò)評(píng)論與在線評(píng)分的關(guān)系分析案例》2900字】_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

網(wǎng)絡(luò)評(píng)論與在線評(píng)分的關(guān)系分析案例目錄TOC\o"1-3"\h\u5540網(wǎng)絡(luò)評(píng)論與在線評(píng)分的關(guān)系分析案例 17281.1短評(píng)文本與評(píng)分的關(guān)系 131751.1.1數(shù)據(jù)的描述性分析 186171.1.2相關(guān)性分析 171071.1.3線性支持向量回歸分析 2206771.2電影類型對(duì)于評(píng)論和評(píng)分及兩者關(guān)系的影響 253721.2.1評(píng)論詞云分析 2304851.2.2評(píng)分?jǐn)?shù)據(jù)描述性分析 5315511.2.3類型對(duì)評(píng)論-評(píng)分關(guān)系的影響研究 61.1短評(píng)文本與評(píng)分的關(guān)系1.1.1數(shù)據(jù)的描述性分析對(duì)全體樣本的豆瓣在線評(píng)分和評(píng)論情感打分值分別繪制餅狀圖。豆瓣評(píng)分評(píng)價(jià)體系中,用戶單獨(dú)打分以星數(shù)展示,有1-5星五種等級(jí)。在線評(píng)分餅狀圖中占比最高的是3星,達(dá)36.4%,其次是4星占28.0%,以上兩類之和超過總數(shù)的六成。評(píng)分集中在中位區(qū)域,數(shù)據(jù)分布大致呈現(xiàn)紡錘形。而在評(píng)論情感分餅狀圖中,最高分5分占比達(dá)68.6%,3分和2分的占比最少。有此可見,用戶在進(jìn)行打分評(píng)價(jià)時(shí)表現(xiàn)得較為克制,傾向于給出中庸、有所保留的分?jǐn)?shù);而使用文字評(píng)論一部電影時(shí),情緒更為明確和激進(jìn),正向積極情感的表達(dá)尤為強(qiáng)烈。這是網(wǎng)絡(luò)評(píng)論情感研究中值得我們關(guān)注的一點(diǎn)。圖5-1在線評(píng)分餅狀圖圖5-2評(píng)論情感分餅狀圖1.1.2相關(guān)性分析以七個(gè)話題的情感分作為自變量,在線評(píng)分作為因變量進(jìn)行相關(guān)性分析。觀察表5-1發(fā)現(xiàn),因變量評(píng)分與各自變量之間均存在正相關(guān)關(guān)系,其中相關(guān)性最強(qiáng)的是評(píng)分與劇情之間,系數(shù)值為0.439;評(píng)分與劇情、特效、題材、結(jié)局、角色塑造均在0.05水平上顯著正相關(guān),說明評(píng)分與這六個(gè)因素之間相互影響作用較明顯;票房與真實(shí)性、笑點(diǎn)的相關(guān)系數(shù)分別為0.277和0.236,存在0.1水平上的正相關(guān)但強(qiáng)度較弱。各話題自變量之間的關(guān)系有正有負(fù),除真實(shí)性與角色塑造表現(xiàn)0.05水平上的正相關(guān)外,其余相關(guān)性弱。由于這些自變量在概念與邏輯上的關(guān)系較為模糊,且非本文研究對(duì)象,因此不作過多分析。表5-1相關(guān)系數(shù)表評(píng)分劇情特效真實(shí)性題材結(jié)局角色塑造笑點(diǎn)評(píng)分10.4390.3560.2770.3240.3050.3510.236劇情0.43910.2020.183-0.0080.1090.1820.024特效0.3560.20210.170.110.0880.2790.186真實(shí)性0.2770.1830.1710.1450.2150.3120.171題材0.324-0.0080.110.14510.1310.1930.19結(jié)局0.3050.1090.0880.2150.13110.2390.147角色塑造0.3510.1820.2790.3120.1930.23910.178笑點(diǎn)0.2360.0240.1860.1710.190.1470.17811.1.3線性支持向量回歸分析由相關(guān)性分析可知,因變量電影評(píng)分與七個(gè)自變量之間存在較強(qiáng)相關(guān)性,本文采用線性支持向量回歸方法。首先將五分制的評(píng)論情感分按比例轉(zhuǎn)換為對(duì)應(yīng)的十分制分?jǐn)?shù),在Python中構(gòu)建多元線性回歸模型,最終得出擬合的回歸方程公式為:Y=3.20554+0.22954X此時(shí)均方誤差為0.932。因變量電影評(píng)分與自變量七個(gè)主題情感分之間存在因果關(guān)系,在其他條件不變的情況下,劇情情感分每增加1分,電影評(píng)分提高0.23分;同理,特效、真實(shí)性、題材、結(jié)局、角色塑造、笑點(diǎn)的情感分每提高1分,電影評(píng)分分別提高0.16,0.0007,0.09,0.15,0.09,0.01。故七個(gè)主題情感傾向均對(duì)電影評(píng)分有正向影響。將之前用于對(duì)照的評(píng)論-主題一對(duì)多模型按照相同方法進(jìn)行回歸,得到的方程公式為:Y=3.22569+0.13306X此時(shí)均方誤差為0.985,且出現(xiàn)負(fù)數(shù)系數(shù),擬合效果不如評(píng)論-主題一對(duì)一模型。造成該情況的原因可能是,對(duì)于大部分短評(píng),第二、第三主題的隸屬度較低,將第二、第三主題納入情感傾向分析,反而導(dǎo)致主題代表性降低,不利于回歸分析。1.2電影類型對(duì)于評(píng)論和評(píng)分及兩者關(guān)系的影響1.2.1評(píng)論詞云分析在數(shù)據(jù)總集中按照電影類型得到動(dòng)作、愛情、動(dòng)畫、文藝、懸疑恐怖五個(gè)子集。對(duì)于這五個(gè)子集進(jìn)行文本預(yù)處理,包括清洗、分詞、過濾,得到五個(gè)文本數(shù)據(jù)集。為了直觀地了解觀眾對(duì)于不同類型電影在評(píng)價(jià)上的區(qū)別,進(jìn)行詞云分析。本文選用微詞云工具,得到五個(gè)類型下的評(píng)論詞云圖如下。圖5-1動(dòng)作類電影詞云圖5-2愛情類電影詞云圖5-3動(dòng)畫類電影詞云圖5-4文藝類電影詞云圖5-5懸疑恐怖類電影詞云觀察詞云圖可知,觀眾對(duì)于某一類型電影的評(píng)論,一方面與電影本身的內(nèi)容息息相關(guān),一方面反映了觀眾觀看該類電影時(shí)關(guān)注的重點(diǎn)。故事、劇情是每一類型中都大量出現(xiàn)的熱門關(guān)鍵詞,動(dòng)作和動(dòng)畫片關(guān)注特效,愛情和文藝片觀眾注重導(dǎo)演。具體到類,動(dòng)作類電影中高頻詞有“游戲”、“技術(shù)”、“場面”、“好萊塢”等,說明動(dòng)作片的制作水平是觀眾在評(píng)價(jià)時(shí)關(guān)注的重點(diǎn);“爆米花”、“精彩“、”無聊”則反映觀眾的觀影情緒。愛情類電影詞云圖中最明顯的特點(diǎn)是包含大量情感類詞語,如“愛情”、“浪漫”、“矯情”等,說明該類電影需要注重感情的合理表達(dá)。動(dòng)畫類中的高頻詞包括“孩子”、“小朋友”、“低幼”,受眾明確。文藝類電影詞云圖中的“時(shí)代”、“社會(huì)”、“人生”、“青春”等是文藝片的常見主題,“導(dǎo)演”、“敘事”、“鏡頭”等詞則反映出對(duì)拍攝質(zhì)量的關(guān)注??植李愲娪暗臒狳c(diǎn)詞許多與“結(jié)局”有關(guān),“反轉(zhuǎn)”、“真相”、“推理”是該類型電影的看點(diǎn)。1.2.2評(píng)分?jǐn)?shù)據(jù)描述性分析對(duì)五類電影的評(píng)論情感打分情況進(jìn)行描述性統(tǒng)計(jì)分析,如表5-2所示。繪制箱型圖得到圖5-6。表5-2分類電影描述統(tǒng)計(jì)量最小值最大值均值中位數(shù)動(dòng)作3.98.66.76.9愛情2.78.31.41.3動(dòng)畫2.69.46.66.8文藝4.98.97.17.2懸疑恐怖3.28.36.36.5全部2.69.46.36.6圖5-6分類電影箱線圖觀察圖表可知,整體評(píng)分最高的電影類型是文藝片,均值7.1,中位數(shù)7.2,明顯高于其他類型,全部電影評(píng)分中的最大值9.4也出現(xiàn)在該類別中,說明豆瓣用戶傾向于對(duì)文藝片給出高評(píng)價(jià);其次為動(dòng)作、動(dòng)畫,均值分別為6.7、6.6,兩者比較相近,觀眾對(duì)這兩類的評(píng)價(jià)相對(duì)而言較高;懸疑恐怖類的均值為6.3,與所有電影評(píng)分均值接近,觀眾評(píng)價(jià)中等。均值最小的是愛情類電影,與其他四類差距較大。再看評(píng)分分布,文藝類型評(píng)分區(qū)間最小;動(dòng)畫片雖有離群值,但中位區(qū)間集中;評(píng)分最離散的是愛情類型電影。試對(duì)圖表情況作出解釋。文藝電影屬于小眾分類,更注重導(dǎo)演、敘事、拍攝手法而非明星、宣傳,因此面向觀眾大多為對(duì)文藝片感興趣的群體,一定程度上排除了非主動(dòng)受眾打低分的情況;并且豆瓣向來以文藝氣息著稱,喜愛文藝片的用戶比例高,他們?cè)敢庥酶叻纸o予小眾電影鼓勵(lì)。而愛情電影由于場景成本較低、對(duì)導(dǎo)演和演員的硬性要求不高,導(dǎo)致數(shù)量多質(zhì)量卻良莠不齊,容易出現(xiàn)所謂“爛片”。1.2.3類型對(duì)評(píng)論-評(píng)分關(guān)系的影響研究使用上文中建立的LDA主題模型分別對(duì)五種類型電影數(shù)據(jù)集進(jìn)行分類,基于同一情感詞典給出情感賦分,并進(jìn)行在線評(píng)分與七個(gè)方面情感分的相關(guān)性分析,得到結(jié)果如表5-3。表5-3不同類型下評(píng)分與評(píng)論相關(guān)系數(shù)表劇情特效真實(shí)性題材結(jié)局角色塑造笑點(diǎn)動(dòng)作0.3330.5870.0240.2560.0230.1590.389愛情0.2640.1920.1290.3660.3740.3830.605動(dòng)畫0.3200.571-0.2220.2480.4140.2520.249文藝0.1660.0750.4170.3200.1960.175-0.257恐怖懸疑0.4230.3180.1640.4140.5840.2830.309由表可知,各個(gè)類型的電影評(píng)分整體上與七個(gè)方面的情感分保持正相關(guān)。動(dòng)作片評(píng)分受特效影響最大,在0.01上顯著正相關(guān),說明特效水平是觀眾評(píng)價(jià)動(dòng)作電影的重要指標(biāo);劇情、笑點(diǎn)與情感分的關(guān)系也較強(qiáng),這兩者通常被認(rèn)為并非動(dòng)作片的重點(diǎn),但從數(shù)據(jù)來看,提升劇情和笑點(diǎn)能給動(dòng)作片錦上添花。與愛情類電影相關(guān)性最高的是笑點(diǎn),說明愛情喜劇更容易受到觀眾好評(píng)。動(dòng)畫片與特效、結(jié)局呈現(xiàn)較強(qiáng)的正相關(guān),符合兒童喜愛精致畫面、追求圓滿結(jié)局的心理;由于幻想是動(dòng)畫片的一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論