版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)的研究與設(shè)計摘要:在數(shù)字化時代背景下,隨著互聯(lián)網(wǎng)的普及和信息化程度的提高,網(wǎng)絡(luò)輿情監(jiān)控與分析越來越成為政府、企業(yè)和公眾關(guān)注的焦點,如何正確、迅速和高效率地監(jiān)控與分析復(fù)雜的網(wǎng)絡(luò)數(shù)據(jù),已經(jīng)成為了一個迫切需要解決的問題。在大數(shù)據(jù)技術(shù)的進步和廣泛應(yīng)用的背景下,大數(shù)據(jù)技術(shù)為網(wǎng)絡(luò)輿情監(jiān)控與分析提供了全新的解決思路和方法?;诖?,本文旨在通過運用大數(shù)據(jù)技術(shù),構(gòu)建一個既高效又智能的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng),以實現(xiàn)對網(wǎng)絡(luò)輿論動態(tài)的捕捉和深入分析。首先,該系統(tǒng)通過網(wǎng)頁爬蟲和自然語言處理技術(shù)收集和處理來自微博的海量數(shù)據(jù);其次,使用機器學(xué)習(xí)算法對數(shù)據(jù)進行情感分析,從而辨別出文本中所蘊含的正面、負面或中性的情緒;最后,使用數(shù)據(jù)可視化工具將分析結(jié)果以柱狀圖、直線圖、餅圖的形式進行展示。綜上所述,本文的研究不僅能夠有效監(jiān)控和分析網(wǎng)絡(luò)輿情,還能為相關(guān)機構(gòu)提供科學(xué)的決策支持,具有重要的理論意義和應(yīng)用價值。關(guān)鍵詞:大數(shù)據(jù);網(wǎng)絡(luò)輿情;監(jiān)控系統(tǒng);自然語言處理
ResearchAndDesignOfTheNetworkPublicOpinionMonitoringSystemBasedOnBigDataStudentmajoringinComputerScienceandTechnology(Dane)YadongLiTutorYahuiJi,JunhuiWangAbstract:Inthecontextofthedigitalera,withthepopularizationoftheInternetandtheimprovementoftheinformationlevel,themonitoringandanalysisofonlinepublicopinionhasbecomethefocusofthegovernment,enterprisesandthepublic.Howtocorrectlymonitor,quicklyandefficientlyanalyzecomplexnetworkdatahasbecomeanurgentproblemtobesolved.Underthebackgroundoftheprogressandwideapplicationofbigdatatechnology,bigdatatechnologyprovidesbrand-newsolutionsandmethodsfornetworkpublicopinionmonitoringandanalysis.Basedonthis,thispaperaimstobuildanefficientandintelligentnetworkpublicopinionmonitoringsystembyusingbigdatatechnology,soastorealizethecaptureandin-depthanalysisofthenetworkpublicopiniondynamics.Firstly,thesystemcollectsandprocessesmassivedatafrommicroblogthroughwebcrawlerandnaturallanguageprocessingtechnology;secondly,usesmachinelearningalgorithmtoanalyzetheemotionsonthedatatoidentifythepositive,negativeorneutralemotionscontainedinthetext;finally,usesthedatavisualizationtooltodisplaytheanalysisresultsintheformofbarchart,straightlinechartandpiechart.Tosumup,theresearchinthispapercannotonlyeffectivelymonitorandanalyzethenetworkpublicopinion,butalsoprovidescientificdecisionsupportforrelevantinstitutions,whichhasimportanttheoreticalsignificanceandapplicationvalue.Keywords:bigdata;networkpublicopinion;monitoringsystem;naturallanguageprocessing
1緒論1.1課題研究背景近幾年來,隨著數(shù)字技術(shù)變革持續(xù)深入,互聯(lián)網(wǎng)愈發(fā)成為信息傳播的渠道,2024年是我國全功能接入國際互聯(lián)網(wǎng)30周年,而我國人口眾多,網(wǎng)民數(shù)量節(jié)節(jié)攀升,超3/4人口、千行百業(yè)實現(xiàn)“觸網(wǎng)”,但是,由于互聯(lián)網(wǎng)的開放性,公眾在通過互聯(lián)網(wǎng)獲取信息時,也會通過互聯(lián)網(wǎng)來發(fā)表一些自己對社會熱點話題、焦點問題的看法和觀點。其中有正面、積極的言論,也會有負面、消極的言論,更會有不法分子借助互聯(lián)網(wǎng)傳播一些色情、暴力等信息,大幅提升了網(wǎng)絡(luò)輿情危機的發(fā)生概率,這個時候網(wǎng)絡(luò)輿情監(jiān)控就顯得十分重要。在傳統(tǒng)的網(wǎng)絡(luò)輿情監(jiān)控與分析的過程中主要是借助人工分析來完成,然而,隨著互聯(lián)網(wǎng)的普及和信息技術(shù)的快速發(fā)展,數(shù)據(jù)量巨大、結(jié)構(gòu)復(fù)雜、信息來源多樣,人工分析難以勝任。[1]此時,快速發(fā)展的大數(shù)據(jù)技術(shù)為網(wǎng)絡(luò)輿情的監(jiān)控與分析提供了創(chuàng)新的應(yīng)對策略和手段,利用大數(shù)據(jù)技術(shù),能夠有效地進行大規(guī)模數(shù)據(jù)的收集、保存、處理和分析,從而實現(xiàn)對網(wǎng)絡(luò)輿情的全面、深入監(jiān)控和分析。[4]在這一背景下,大數(shù)據(jù)技術(shù),作為新時代的產(chǎn)物,不僅為我們提供了前所未有的機遇,也帶來了挑戰(zhàn)。如何巧妙地利用大數(shù)據(jù)技術(shù),對網(wǎng)絡(luò)輿情進行全面而深入的監(jiān)測與分析,已經(jīng)成為了當(dāng)前亟待解決的重要問題。1.2課題研究意義(1)提升輿情監(jiān)控效率:大數(shù)據(jù)技術(shù)能夠快速而準(zhǔn)確地對海量網(wǎng)絡(luò)信息進行監(jiān)控和分析,從而提升輿情監(jiān)控的效率,有助于及時捕捉新興話題和突發(fā)事件,以及公眾情緒的變化。(2)提高輿情預(yù)警能力:通過大數(shù)據(jù)技術(shù),可以建立更為精準(zhǔn)的輿情預(yù)警模型,及時發(fā)現(xiàn)潛在的輿情危機,幫助企業(yè)和政府采取有效措施,降低負面影響。(3)實現(xiàn)更深層次的輿情分析:大數(shù)據(jù)技術(shù)可以實現(xiàn)對網(wǎng)絡(luò)輿情的深度挖掘和分析,包括對話題的演化規(guī)律、輿情事件的傳播路徑、用戶情緒的變化趨勢等,為決策者提供更為全面的信息支持。(4)促進精準(zhǔn)輿情引導(dǎo):基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情監(jiān)控與分析方法可以幫助企業(yè)和政府更準(zhǔn)確地了解公眾需求和意見,從而更好地引導(dǎo)輿論,提高輿情管理的精準(zhǔn)度。(5)推動大數(shù)據(jù)技術(shù)在輿情領(lǐng)域的應(yīng)用:研究基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情監(jiān)控與分析方法將有助于推動大數(shù)據(jù)技術(shù)在輿情管理領(lǐng)域的應(yīng)用和發(fā)展,為相關(guān)領(lǐng)域的技術(shù)創(chuàng)新和進步提供支持。綜上所述,基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)的研究與設(shè)計,不僅是技術(shù)革新的躍進,更是網(wǎng)絡(luò)治理智能化的里程碑。它推動了大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)輿情監(jiān)控領(lǐng)域的深入應(yīng)用和持續(xù)進化,為洞察民意、維護網(wǎng)絡(luò)健康提供了強有力的技術(shù)支撐。2基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情監(jiān)控分析2.1網(wǎng)絡(luò)輿情的相關(guān)概述網(wǎng)絡(luò)輿論是一個新興的術(shù)語,源于互聯(lián)網(wǎng)技術(shù)的快速發(fā)展。[3]網(wǎng)絡(luò)輿情(IPO)泛指在同一時空背景下,眾多網(wǎng)民通過互聯(lián)網(wǎng)平臺對現(xiàn)實生活中的熱門或關(guān)鍵議題所展示的總體認知、立場、情緒以及行為偏好,簡而言之,網(wǎng)絡(luò)輿情便是社會各階層通過互聯(lián)網(wǎng)平臺,對某個熱點或焦點事件展開討論,并分享各自的觀點與想法,而這些發(fā)表出來的想法及討論出的信息會通過微博、微信、QQ、網(wǎng)絡(luò)論壇等互聯(lián)網(wǎng)的應(yīng)用形式傳播。[5]網(wǎng)絡(luò)輿情監(jiān)控是一種重要的信息管理活動,它涉及到對公眾輿論的持續(xù)關(guān)注和對社會媒體平臺上的內(nèi)容進行實時的收集、分析和評估,其核心任務(wù),在于運用多種手段深入探知社會各界(包括官方、媒體、專家及公眾等)對特定事務(wù)或話題的看法與立場,搜集并梳理出公眾的意見和態(tài)度,為決策提供參考。網(wǎng)絡(luò)輿情的特征:(1)信息多元性:網(wǎng)絡(luò)輿情的信息源具有多樣化的特性,包括新聞評論、論壇、博客、社交媒體等,人們可以在上面表達自己的觀點和情感,各種各樣的媒體渠道豐富了信息的多樣性。(2)傳播速度快:網(wǎng)絡(luò)的傳播速度極快,一旦某個話題或事件成為熱點,相關(guān)信息會迅速在網(wǎng)絡(luò)上擴散,形成“病毒式”傳播。(3)情緒化:網(wǎng)絡(luò)輿情往往伴隨著強烈的情緒表達,尤其是當(dāng)涉及敏感或熱點話題時,網(wǎng)民的情緒可以在很短的時間內(nèi)通過網(wǎng)絡(luò)迅速傳播,影響輿情的走向。總的來說,網(wǎng)絡(luò)輿情的這些特點使其成為現(xiàn)代社會中不可忽視的力量。對于政府、企業(yè)和其他組織來說,了解并合理應(yīng)對網(wǎng)絡(luò)輿情,對于維護社會穩(wěn)定和品牌形象具有重要意義。2.2網(wǎng)絡(luò)輿情監(jiān)控面臨的挑戰(zhàn)隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,智能終端設(shè)備的廣泛普及,以及即時通信軟件的層出不窮,我們見證了信息傳播方式的一場革命,人們可以通過微信、微博、QQ和各種網(wǎng)絡(luò)論壇發(fā)表自己的觀點和看法,網(wǎng)絡(luò)平臺的開放性消除了傳統(tǒng)輿論對大眾在性別、年齡和身份等范疇的約束,任何人都可以參與到現(xiàn)實社會熱點話題的討論中去,這使得網(wǎng)絡(luò)輿情環(huán)境更加復(fù)雜,然而,在利用大數(shù)據(jù)技術(shù)進行網(wǎng)絡(luò)輿情監(jiān)控時,確實存在對個人隱私信息的保護問題。監(jiān)控過程中可能會接觸到個人的瀏覽記錄、互動信息等敏感數(shù)據(jù)。合理合法地使用這些數(shù)據(jù)對于提升輿情監(jiān)控的效率至關(guān)重要,然而,若這些私密信息被惡意行為者獲取,則可能導(dǎo)致隱私泄露,甚至引發(fā)更嚴重的安全事件,如何在分析和使用數(shù)據(jù)時遵守倫理道德規(guī)范,避免侵犯個人隱私,也是一個重要的挑戰(zhàn)。[6]在這個快速發(fā)展的大數(shù)據(jù)時代的背景下,人們的生活方式、生產(chǎn)方式已悄然發(fā)生改變,大數(shù)據(jù)技術(shù)的發(fā)展為網(wǎng)絡(luò)輿情監(jiān)控帶來的新的機遇,但同時也帶來了挑戰(zhàn),借助大數(shù)據(jù)技術(shù)進行網(wǎng)絡(luò)輿情監(jiān)控與分析,并非易事,其過程涉及一系列復(fù)雜而精細的步驟,從數(shù)據(jù)采集到數(shù)據(jù)處理,再到情感分析,每一步都要求運用專業(yè)知識和技術(shù),且網(wǎng)絡(luò)上的信息復(fù)雜多變,大量的相關(guān)性和偶發(fā)性使得輿情變得難以預(yù)測和掌控,這對進行輿情監(jiān)控的人員提出了更為嚴格的能力標(biāo)準(zhǔn),要求這些人員必須熟練掌握多種技能和分析手段,包括數(shù)據(jù)分析、數(shù)據(jù)挖掘以及數(shù)據(jù)可視化等,以便能夠有效地處理和控制大量的數(shù)據(jù)。[8]2.3網(wǎng)絡(luò)輿情監(jiān)控與大數(shù)據(jù)技術(shù)的適配性 (1)數(shù)據(jù)量龐大。在大數(shù)據(jù)時代到來后,網(wǎng)絡(luò)輿情信息的領(lǐng)域和范圍呈現(xiàn)出了多樣化和多變性的特點,覆蓋政治、經(jīng)濟、文化、社會等多個層面。隨著互聯(lián)網(wǎng)的不斷發(fā)展,網(wǎng)絡(luò)輿情傳播的渠道和形式也日益豐富,從傳統(tǒng)的論壇、博客到如今的社交媒體平臺如微博、微信,再到視頻分享平臺和即時通訊應(yīng)用,公眾表達觀點的方式更加多元和即時,于此,網(wǎng)絡(luò)輿情的數(shù)據(jù)規(guī)模大幅度提升,大數(shù)據(jù)技術(shù)能夠處理這些海量數(shù)據(jù),為網(wǎng)絡(luò)輿情監(jiān)控提供支持。(2)情感傾向分析?;ヂ?lián)網(wǎng)的最顯著的特點就是開放性,越來越多的人幾乎可以隨時隨地借助互聯(lián)網(wǎng)來了解信息,同時將自己的想法和觀點發(fā)表在網(wǎng)絡(luò)上,如有不慎,這些想法和觀點將會造成社會的負面影響,負面的網(wǎng)絡(luò)輿情將會對社會公共安全造成較大威脅,大數(shù)據(jù)技術(shù)可以通過數(shù)據(jù)挖掘分析網(wǎng)民的情感傾向,這對于理解輿情的走向至關(guān)重要。(3)預(yù)警與決策支持。網(wǎng)絡(luò)輿情一般會經(jīng)歷產(chǎn)生→成長→加速→爆發(fā)→消亡等不同的發(fā)展階段。[2]傳統(tǒng)的網(wǎng)絡(luò)輿情監(jiān)控與分析依賴于人工作業(yè),由于計算資源的限制和處理能力的瓶頸,往往難以實現(xiàn)對網(wǎng)絡(luò)輿情的全方位監(jiān)測和實時預(yù)警。這種方法耗時耗力,且易受人為因素干擾,導(dǎo)致分析結(jié)果可能存在偏差或滯后,無法滿足快速變化網(wǎng)絡(luò)環(huán)境下對即時性和全面性的要求。在大數(shù)據(jù)背景之下,我們采取相關(guān)技術(shù)對海量數(shù)據(jù)進行分析和重組,以便深入探尋數(shù)據(jù)之間的內(nèi)在聯(lián)系。通過對大數(shù)據(jù)的分析,可以形成報告、圖表等分析結(jié)果,為相關(guān)部門提供輿情預(yù)警和決策依據(jù)。3網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)的設(shè)計與實現(xiàn)網(wǎng)絡(luò)輿情監(jiān)控領(lǐng)域覆蓋了諸多技術(shù),涵蓋了自然語言處理、機器學(xué)習(xí)、文本數(shù)據(jù)挖掘、趨勢分析、語義綜合分析以及主題分類等技術(shù);其功能主要涉及到熱點檢測、事件分析、主體追蹤、傾向性分析和統(tǒng)計報告等方面。[8]從網(wǎng)絡(luò)輿情的監(jiān)控與分析過程來看,其核心目標(biāo)在于從海量的網(wǎng)絡(luò)數(shù)據(jù)中提取有價值的信息,并通過深入分析這些信息來滿足用戶的需求。為了實現(xiàn)這一目標(biāo),網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)通常被劃分為多個關(guān)鍵技術(shù)模塊,這幾個模塊也就是網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)的關(guān)鍵技術(shù)。本文設(shè)計的系統(tǒng)以微博部分文章及評論為研究對象,將Python作為數(shù)據(jù)挖掘平臺,利用爬蟲技術(shù)獲取微博在2023年8月至2023年10月時間段內(nèi)的部分文章,具體包括文章的內(nèi)容、評論的內(nèi)容、點贊量、轉(zhuǎn)發(fā)量和時間等輿情信息。3.1開發(fā)平臺和相關(guān)技術(shù)本文設(shè)計的系統(tǒng)在Windows10(64位)操作系統(tǒng)中,利用PyCharm集成開發(fā)環(huán)境,開發(fā)語言采用Python,數(shù)據(jù)庫采用了MySQL8.0,并通過SnowNLP對文章及評論進行情感傾向分析,結(jié)合Echarts技術(shù)進行數(shù)據(jù)可視化處理以柱狀圖、直線圖、餅圖進行展示。圖3-1系統(tǒng)開發(fā)平臺和相關(guān)技術(shù)3.1.1PythonPython誕生于20世紀90年代,在網(wǎng)絡(luò)爬蟲技術(shù)方面顯現(xiàn)出顯著的效能。它能夠模擬瀏覽器的登錄過程,并且能針對性地提取網(wǎng)頁信息,而且,Python具備一系列與數(shù)據(jù)爬取相關(guān)的豐富庫,這些庫為抓取和處理網(wǎng)頁內(nèi)容提供了強大的支持。在統(tǒng)計分析網(wǎng)頁信息的基本數(shù)據(jù)方面,Python主要通過使用分詞、統(tǒng)計詞頻分析法以及生成詞應(yīng)力場圖等方式,并主要通過引入了jieba分詞庫、wordcloud詞云庫,以及matplotlib繪圖庫等第三方庫的共同作用來完成。[11]本系統(tǒng)中,Python作為開發(fā)語言,承擔(dān)了重要工作,包括與Flask框架和PyMySQL庫一起使用,處理來自前端的請求并在數(shù)據(jù)庫中進行數(shù)據(jù)的存儲和讀取,還可以調(diào)用Echarts庫實現(xiàn)數(shù)據(jù)可視化,從而將數(shù)據(jù)以更直觀的方式呈現(xiàn)出來。3.1.2Flask框架Flask作為一個基于Python的輕型Web開發(fā)框架,它利用Werkzeug工具集來處理WSGI服務(wù)。該框架遵循傳統(tǒng)的MVC(模型-視圖-控制器)設(shè)計模式,但在Flask中通常被稱為MTV。作為一個輕量級框架,F(xiàn)lask能夠靈活地整合多種第三方庫,以適應(yīng)開發(fā)者的特定需求,擴展性強。本系統(tǒng)中,F(xiàn)lask作為后端框架,通過定義路由和處理函數(shù)來響應(yīng)前端的請求,并將請求傳遞到相應(yīng)的路由和視圖函數(shù)進行處理。3.1.3EchartsEcharts是一個功能強大、廣泛使用的數(shù)據(jù)可視化工具,它基于JavaScript開發(fā),為開發(fā)者們提供了一個豐富而靈活的圖表庫,滿足各種數(shù)據(jù)可視化需求。除了基本的折線圖、柱狀圖等,還包括雷達圖、地圖等多種復(fù)雜的圖表類型,而且,用戶可以通過簡單的配置生成各種各樣的圖表。本系統(tǒng)中,Echarts主要用于微博文章轉(zhuǎn)發(fā)量、點贊量、評論量、用戶IP地址、情感分析、文章內(nèi)容與評論內(nèi)容輿情趨勢分析等數(shù)據(jù)可視化模塊。3.1.4網(wǎng)絡(luò)爬蟲技術(shù)網(wǎng)絡(luò)爬蟲是一種自動化地瀏覽并獲取網(wǎng)絡(luò)平臺信息的程序或腳本,它能夠按照預(yù)定的規(guī)則自動地訪問網(wǎng)絡(luò),收集和下載網(wǎng)頁、圖片、視頻等內(nèi)容,并從中提取有用的信息。網(wǎng)絡(luò)爬蟲的核心功能主要涉及數(shù)據(jù)采集、處理和保存。網(wǎng)絡(luò)爬蟲根據(jù)其設(shè)定的目標(biāo)和需求,可劃分為多種類別,主要包括通用型、主題聚焦型以及增量型。通用型網(wǎng)絡(luò)爬蟲的核心任務(wù)是廣泛地搜集互聯(lián)網(wǎng)上存在的網(wǎng)頁內(nèi)容,而主題聚焦型網(wǎng)絡(luò)爬蟲則專注于特定領(lǐng)域或頁面的數(shù)據(jù)采集。網(wǎng)絡(luò)爬蟲廣泛應(yīng)用于搜索引擎、數(shù)據(jù)挖掘、網(wǎng)站監(jiān)測等領(lǐng)域。本系統(tǒng)中,網(wǎng)絡(luò)爬蟲技術(shù)主要用于獲取微博在目標(biāo)時間段內(nèi)的部分文章,具體包括文章的內(nèi)容、評論的內(nèi)容、點贊量、轉(zhuǎn)發(fā)量和時間等輿情信息。3.1.5MySQL數(shù)據(jù)庫MySQL是一種以關(guān)系為基礎(chǔ)的數(shù)據(jù)庫管理系統(tǒng),它通過將數(shù)據(jù)分散存儲在多個表中,而非集中存放于一個龐大的倉庫中,從而提升的訪問速度并增強了系統(tǒng)的靈活性。網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)的關(guān)鍵構(gòu)成之一是數(shù)據(jù)庫,它立足于大數(shù)據(jù)技術(shù),對于系統(tǒng)的具體設(shè)計而言,需要針對實際需求進行周密的規(guī)劃,目的在于優(yōu)化和提高輿情監(jiān)測的效能。本系統(tǒng)中,MySQL數(shù)據(jù)庫中共設(shè)計了3張數(shù)據(jù)表,主要用于用戶的登錄注冊和存儲獲取的微博文章和評論的相關(guān)輿情信息。3.1.6SnowNLPSnowNLP庫是專門針對中文文本處理而開發(fā)的Python類庫,它具備情感分析等功能。與大部分主要針對處理英文的Python自然語言處理庫不同,SnowNLP庫在中文文本的處理中表現(xiàn)出了出色的性能和準(zhǔn)確性,有效填補了這一領(lǐng)域的空白。該庫內(nèi)置了中文情感分析的訓(xùn)練集,利用樸素貝葉斯算法,它能執(zhí)行情感分析、詞性標(biāo)注、文本分類等任務(wù),對中文文本數(shù)據(jù)的處理具有顯著的應(yīng)用價值。本系統(tǒng)中,SnowNLP通過其強大的情感分析功能,為分析微博用戶的情感傾向提供了有力的技術(shù)支持。3.2系統(tǒng)可行性分析在系統(tǒng)開發(fā)的初期,對于使用的技術(shù)進行評估、選擇和確定,以確定所選技術(shù)是否能夠滿足系統(tǒng)開發(fā)的要求,同時也要考慮是否能夠滿足后期的維護和升級。在本系統(tǒng)中,使用高級編程語言Python作為核心開發(fā)語言,這種語言特別適用于開發(fā)Web應(yīng)用、進行數(shù)據(jù)分析以及科學(xué)計算等各個領(lǐng)域;同時本系統(tǒng)采用Flask框架,其具有靈活、簡單、易擴展等特點;其次,本系統(tǒng)使用MySQL數(shù)據(jù)庫存儲數(shù)據(jù),它以高效性、安全性和可擴展性等特性而聞名,適用于Web應(yīng)用、數(shù)據(jù)分析以及數(shù)據(jù)挖掘等多種領(lǐng)域;另外,本系統(tǒng)使用Echarts可視化工具進行數(shù)據(jù)可視化,Echarts是一個功能強大、廣泛使用的數(shù)據(jù)可視化工具,它以強交互性、配置靈活性和可擴展性等特性而著稱,適用于數(shù)據(jù)可視化等領(lǐng)域;最后本系統(tǒng)使用pandas、numpy等機器學(xué)習(xí)庫進行數(shù)據(jù)處理,這些庫具有強大的數(shù)據(jù)分析和機器學(xué)習(xí)功能。綜上所述,本系統(tǒng)所選用的技術(shù)具有成熟、穩(wěn)定、易用、可擴展等特點,能夠滿足系統(tǒng)開發(fā)和后期維護的要求,同時也能夠?qū)崿F(xiàn)該輿情系統(tǒng)的高效、可靠和可視化展示。3.3系統(tǒng)結(jié)構(gòu)設(shè)計在經(jīng)過系統(tǒng)需求與可行性分析以后,對該系統(tǒng)的設(shè)計思路有了一定的把握。在進一步細化梳理該系統(tǒng)的整體功能后,系統(tǒng)的相關(guān)功能如圖所示。本系統(tǒng)主要包括用戶模塊、首頁、數(shù)據(jù)可視化模塊。圖3-2系統(tǒng)結(jié)構(gòu)設(shè)計圖3.3.1登錄注冊模塊用戶的登錄注冊功能是本系統(tǒng)的功能之一,主要實現(xiàn)了用戶身份認證與權(quán)限管理。用戶注冊功能是實現(xiàn)的,在注冊頁面上,用戶需要輸入用戶名和密碼。這些信息通過前端的AJAX異,后端則利用PyMySQL與MySQL數(shù)據(jù)庫建立連接,將用戶的信息存入用戶數(shù)據(jù)表中,并將注冊成功的消息反饋到前端。同樣,用戶登錄功能也是借助Layui前端框架實現(xiàn)的,在登錄頁面上,用戶需要輸入用戶名和密碼。這些信息通過前端的AJAX步傳輸方式傳送到后端,后端則會查詢數(shù)據(jù)庫中用戶數(shù)據(jù)表中的用戶名和密碼信息,進行身份查驗。如果驗證成功,后端會通過Flask框架的session功能將用戶信息存儲在服務(wù)器端,以便后續(xù)操作,并同時將登錄成功的消息反饋到前端。3.3.2數(shù)據(jù)采集模塊在網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)中,數(shù)據(jù)采集是其核心技術(shù)之一,該技術(shù)的主要功能是持續(xù)不斷地從互聯(lián)網(wǎng)上,或從特定的網(wǎng)絡(luò)平臺中獲取相關(guān)的輿情數(shù)據(jù),并隨后進行深入的分析。該系統(tǒng)的數(shù)據(jù)內(nèi)容收集模型還在設(shè)計中,但為了提高收集速率與準(zhǔn)確度,使用的是Python的網(wǎng)站爬蟲技術(shù),以便于通過有針對性地收集Web網(wǎng)頁上的所有內(nèi)容與數(shù)據(jù),并利用Python中的requests數(shù)據(jù)庫和beautifulsoup庫,分析并獲取與目標(biāo)網(wǎng)站的有關(guān)信息及內(nèi)容。數(shù)據(jù)收集主要分為三個步驟:向URL發(fā)送請求、數(shù)據(jù)爬取、數(shù)據(jù)存儲,模塊實現(xiàn)的具體過程如下:首先調(diào)用requests庫中的get方法獲取目標(biāo)網(wǎng)頁的頁面內(nèi)容,然后使用json庫的loads方法來解析網(wǎng)頁內(nèi)容,在得到分析研究結(jié)果后,再從中抽取字典key對應(yīng)的值,并將其保存到數(shù)據(jù)庫中。圖3-3數(shù)據(jù)采集步驟3.3.3數(shù)據(jù)預(yù)處理模塊通過網(wǎng)絡(luò)爬蟲提取的文章和評論數(shù)據(jù),不僅包含了所需的目標(biāo)信息,還伴隨著大量的無關(guān)數(shù)據(jù),例如普遍使用的表情符號、特殊字符以及網(wǎng)頁的標(biāo)記等,并且還會有大量的缺失值,它們將會嚴重影響數(shù)據(jù)分析的正確性,因此在對采集到的數(shù)據(jù)進行分析之前,需要對數(shù)據(jù)需要進行預(yù)處理和清洗,過濾掉重復(fù)的、無意義的數(shù)據(jù)。(1)數(shù)據(jù)清洗。數(shù)據(jù)清洗是數(shù)據(jù)分析過程中的關(guān)鍵步驟,它包括處理數(shù)據(jù)集中的異常、錯誤和不完整部分進行修正和清理,以確保數(shù)據(jù)質(zhì)量和分析結(jié)果的準(zhǔn)確性。本系統(tǒng)利用正則表達式進行規(guī)則匹配,正則表達式是一種強大的工具,用于匹配、查找和替換字符串。其工作原理建立在有限狀態(tài)自動機(FiniteStateAutomaton)的理論基礎(chǔ)之上。在正則表達式中,每個字符都被視作一個輸入字符,而正則表達式本身被解釋為一系列狀態(tài)以及狀態(tài)之間的轉(zhuǎn)移規(guī)則,簡單來說,可以利用正則表達式過濾掉沒有意義的詞語,主要包括:去除亂碼(數(shù)字、符號、單個字)和填充字段等。中文分詞。由于本系統(tǒng)的研究對象都是文本信息,而文本信息研究的最小單位常為詞組,因此,需要將處理后的數(shù)據(jù)分割為詞語。大部分情況下,英文通常能通過空格的插入來自動實現(xiàn)分詞任務(wù),然而,由于中文語言的語法結(jié)構(gòu)較為復(fù)雜,往往需要借助外部庫來進行分詞處理。本系統(tǒng)執(zhí)行中文分詞任務(wù)時,運用了第三方庫的Jieba分詞工具。該分詞工具的核心工作原理依據(jù)統(tǒng)計詞典學(xué),它通過使用前置詞典對輸入文本進行初步切分,從而生成一系列可能的切分組合,并以此構(gòu)建一個有向無環(huán)圖(DAG)。在該圖中,每個節(jié)點表示一種潛在的切分方案,隨后,利用動態(tài)規(guī)劃方法計算出概率最高的路徑,以確定最佳分詞方式。3.3.4情感分析模塊在獲取到相關(guān)的網(wǎng)絡(luò)輿論信息之后,必須進行細致的分析,以便于更加精確地判斷特定的評論或意見是否可能構(gòu)成網(wǎng)絡(luò)輿論風(fēng)險。網(wǎng)絡(luò)討論不僅涉及對特定事件的事實性闡述,它們還可能蘊含著某種情緒色彩,這種情感色彩在公眾轉(zhuǎn)發(fā)某一熱議話題時,往往會變得更加突出。[10]文本情感分析,也稱為意見挖掘,是自然語言處理(NLP)和計算語言學(xué)領(lǐng)域的一個重要分支。情感傾向通??梢詺w為三個基本類別:正面、負面以及中性。鑒于網(wǎng)絡(luò)評論的復(fù)雜性和其往往篇幅較長的特點,為了提高網(wǎng)絡(luò)輿情監(jiān)控的效率,采取語義分析手段進行情感分析是必要的。如果網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)能夠有效地揭示公眾對某一議題的情緒態(tài)度,那么它就能更有效地作為決策分析的參考。本文設(shè)計的系統(tǒng)采用SnowNLP技術(shù),主要通過以下三種方法進行情感分析:(1)分詞:SnowNLP編程庫將原始文本內(nèi)容分割成句子,并根據(jù)中文詞性將句子拆分為單個詞和短語。(2)語義:SnowNLP編程庫用于分析文本中包含的語義單詞,并將其轉(zhuǎn)換為對應(yīng)的情感正負面類型。(3)情感分析:在情感分析中,SnowNLP將基于訓(xùn)練集中的語義詞的情感分類映射到每個文本語句,并計算出每個文本的情感極性。這樣,SnowNLP能夠快速準(zhǔn)確地將文本分類為正面、中性或負面。3.3.5數(shù)據(jù)可視化模塊隨著互聯(lián)網(wǎng)的發(fā)展、新媒體信息的廣泛傳播,網(wǎng)絡(luò)輿情在我國政治、生產(chǎn)、生活各方面產(chǎn)生了越來越顯著的影響,網(wǎng)絡(luò)輿論監(jiān)測系統(tǒng)的核心宗旨在于向個人,政府機構(gòu),以及商業(yè)實體等提供更合理和高效的決策參考。因此,在展現(xiàn)系統(tǒng)輸出時,應(yīng)追求簡潔明了,以便于決策者和分析師能夠更加深入地進行分析與研究,為了更直觀地呈現(xiàn)分析結(jié)果,網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)的結(jié)果展示部分應(yīng)當(dāng)采用動態(tài)圖表來反映相關(guān)信息。因此,本文設(shè)計的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)過調(diào)用后端提供的API接口,我們可以獲取到需要展示的數(shù)據(jù)信息,并利用Echarts將數(shù)據(jù)進行動態(tài)化展示,在后端方面,我們使用了Flask和PyMysql來實現(xiàn)數(shù)據(jù)的存儲和查詢。3.4系統(tǒng)結(jié)構(gòu)實現(xiàn)3.4.1登錄注冊模塊前端采用HTML模板和CSS樣式進行設(shè)計,同時使用JS動態(tài)展示數(shù)據(jù);后端采用Flask框架接收請求并進行處理,使用Python技術(shù)生成響應(yīng)數(shù)據(jù)。用戶登錄過程中,后端會驗證用戶的身份,如果身份驗證成功,其登錄數(shù)據(jù)會被保存在session中。在用戶執(zhí)行后續(xù)操作時,系統(tǒng)會利用session中的用戶信息來進行身份驗證。圖3-4用戶登錄頁面在用戶注冊過程中,服務(wù)器端負責(zé)對用戶提交的注冊信息進行校驗和處理,并將這些注冊信息存儲到數(shù)據(jù)庫中。圖3-5用戶注冊頁面3.4.2數(shù)據(jù)采集模塊在設(shè)計本系統(tǒng)的數(shù)據(jù)信息采集模塊時,為提升采集速度和精度,有針對性地采集Web頁面上的信息數(shù)據(jù),采用的是Python的網(wǎng)絡(luò)爬蟲技術(shù)。網(wǎng)絡(luò)爬蟲獲取網(wǎng)頁數(shù)據(jù)信息的主要原理:利用關(guān)鍵詞進行內(nèi)容篩選,以獲取與關(guān)鍵詞有關(guān)聯(lián)的網(wǎng)頁數(shù)據(jù)和內(nèi)容,進而自動過濾掉不相關(guān)的信息數(shù)據(jù)。本系統(tǒng)的數(shù)據(jù)采集模塊主要是針對微博的導(dǎo)航欄、文章和評論進行網(wǎng)絡(luò)爬蟲。核心代碼如下:#爬取導(dǎo)航欄defget_html(url):headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)……'Cookie':'SINAGLOBAL=1139663897103.056.1665663045813;……}params={'is_new_segment':1,'fetch_hot':1}response=requests.get(url,headers=headers,params=params)//調(diào)用Python的requests庫ifresponse.status_code==200:returnresponse.json()else:returnNone圖3-6導(dǎo)航欄的爬取#文章內(nèi)容爬取defget_html(url,id):headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)……'Cookie':'SINAGLOBAL=1139663897103.056.1665663045813;……}params={'is_show_bulletin':2,'id':id}response=requests.get(url,headers=headers,params=params)ifresponse.status_code==200:returnresponse.json()else:returnNone圖3-7文章內(nèi)容爬取過程圖3-8文章內(nèi)容的爬取#評論內(nèi)容的爬取defget_html(url,id):headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)……'Cookie':'SINAGLOBAL=1139663897103.056.1665663045813;……}params={'is_show_bulletin':2,'id':id}response=requests.get(url,headers=headers,params=params)ifresponse.status_code==200:returnresponse.json()else:returnNone圖3-9評論內(nèi)容的爬取3.4.3數(shù)據(jù)預(yù)處理模塊數(shù)據(jù)預(yù)處理是實現(xiàn)該系統(tǒng)核心功能的關(guān)鍵步驟,它可以通過移除原始文本數(shù)據(jù)中的無關(guān)元素,如標(biāo)點、數(shù)字和空白字符,從而顯著提高數(shù)據(jù)的質(zhì)量。本系統(tǒng)運用正則表達式來實現(xiàn)規(guī)則匹配,并借助第三方庫Jieba分詞器執(zhí)行中文分詞處理、去停用詞及詞頻統(tǒng)計工作。核心代碼如下:#分詞,去重,列表word_list=jieba.cut(strs,cut_all=True)#正則表達式去除數(shù)字,符號,單個字new_words=[]foriinword_list:m=re.search("\d+",i)n=re.search("\W+",i)ifnotmandnotnandlen(i)>1:new_words.append(i)#統(tǒng)計詞頻word_count={}#創(chuàng)建字典foriinset(new_words):#用set去除list中的重復(fù)項word_count[i]=new_words.count(i)圖3-10文本分詞、詞頻統(tǒng)計3.4.4情感分析模塊本系統(tǒng)在情感分析方面,運用了SnowNLP技術(shù),其具體的操作流程是:自定義爬蟲抓取信息保存至文件。根據(jù)研究需求,可以定制網(wǎng)絡(luò)爬蟲以捕獲特定字段信息,并將其存儲到相應(yīng)類型的文件中。本研究涉及中文分詞、詞性標(biāo)注以及關(guān)鍵詞的可視化展示。盡管存在眾多中文分詞工具,且SnowNLP也具備分詞功能,但其分詞精度不及Jieba分詞。因此,本系統(tǒng)選擇使用Jieba分詞來執(zhí)行相關(guān)任務(wù)。情感計算,結(jié)果可視化。在SnowNLP中,情感分析的實現(xiàn)流程被設(shè)計得非常簡明,只需對文本執(zhí)行sentiments函數(shù)即可完成。為了直觀地演示和對比文本內(nèi)容的重要程度,本系統(tǒng)利用wordcloud工具生成詞云圖,從而將結(jié)果以可視化形式呈現(xiàn)。核心代碼如下:deftargetFile():targetFile='target.csv'commentList=getCommentList()rateData=[]good=0#正面bad=0#負面midlle=0#中性forindex,iinenumerate(commentList):try:value=SnowNLP(i[4]).sentimentsifvalue>0.5:#value值大于0.5,輿情為正面good+=1rateData.append([i[4],'正面'])elifvalue==0.5:#value值等于0.5,輿情為中性midlle+=1rateData.append([i[4],'中性'])elifvalue<0.5:#value值小于0.5,輿情為負面bad+=1rateData.append([i[4],'負面'])except:continue圖3-11情感分析的實現(xiàn)3.4.5數(shù)據(jù)可視化模塊本輿情監(jiān)控系統(tǒng)可視化模塊實現(xiàn)主要通過Flask框架結(jié)合PyMysql實現(xiàn)對數(shù)據(jù)庫數(shù)據(jù)的分析與格式化處理,通過Echarts工具對數(shù)據(jù)進行可視化展示。該模塊主要實現(xiàn)了微博文章轉(zhuǎn)發(fā)量、點贊量、評論量、用戶IP地址、情感分析、文章內(nèi)容與評論內(nèi)容輿情趨勢分析等數(shù)據(jù)可視化模塊。核心代碼如下:<scriptsrc="/static/echarts.min.js"></script><scriptsrc="/static/china.js"></script>{%blockecharts%}<script>varlineChart=document.getElementById('main');//指定圖表的數(shù)據(jù)varmyCharts=echarts.init(lineChart,{width:1000,height:250});varxData={{xData|tojson}}varyData={{yData}};varxRes=[]varyRes=[]for(vari=0;i<8;i++){xRes.push(xData[i])yRes.push(yData[i])}該模塊的實現(xiàn)流程首先通過瀏覽器發(fā)動http請求,F(xiàn)lask接收到請求后,通過PyMysql對數(shù)據(jù)庫進行查詢,然后格式化與分析后響應(yīng)給前端,前端通過Echarts技術(shù)在進行可視化解析與渲染,最終實現(xiàn)可視化效果。圖3-12熱詞情感分析柱狀圖另外本系統(tǒng)為了更好地傳達有價值的信息,幫助輿情分析人員從大量文本中提取關(guān)鍵信息,該模塊還采用了一種數(shù)據(jù)可視化形式——詞云圖,它通過將文本中的高頻關(guān)鍵詞以視覺突出的方式展示出來,從而幫助人們快速捕捉文本的重點信息。圖3-13詞云圖生成步驟制作詞云圖的一些基本步驟:(1)數(shù)據(jù)采集:需要收集要在詞云圖中展示的文本數(shù)據(jù)。這些數(shù)據(jù)可能來自網(wǎng)頁內(nèi)容、社交媒體帖子、新聞文章或其他任何文本形式的數(shù)據(jù)源。(2)文本清洗:在進行文本分詞之前,通常需要對文本內(nèi)容進行清洗,以去除無關(guān)字符和干擾項,如標(biāo)點符號、數(shù)字等。這一步驟對于確保最終結(jié)果的準(zhǔn)確性至關(guān)重要。(3)分詞:使用分詞工具或自然語言處理庫將文本分解成單獨的詞匯。在中文環(huán)境下,可能需要使用特定的中文分詞工具,如jieba。(4)統(tǒng)計詞頻:對每個詞在文本中的出現(xiàn)次數(shù)進行統(tǒng)計。這將決定詞云圖中每個詞的大小和突出程度。(5)生成詞云圖:利用數(shù)據(jù)可視化工具或庫,如wordcloud庫,根據(jù)詞頻信息生成詞云圖。在這一步驟中,可以自定義詞云圖的顏色、形狀和字體等視覺元素,以增強視覺效果。(6)可視化展示:最后,將生成的詞云圖進行展示??梢允褂胢atplotlib等繪圖庫來顯示詞云圖,或者將其保存為圖片文件,以便在不同的平臺上進行分享和展示。核心代碼:#分詞cut=jieba.cut(text)string=''.join(cut)print(string)#圖片img=Image.open(targetImgSrc)#打開遮罩圖片img_arr=np.array(img)#將圖片轉(zhuǎn)化為列表wc=WordCloud(background_color='white',mask=img_arr,#font_path='Truetype.ttf'font_path='STHUPO.TTF')wc.generate_from_text(string)#繪制圖片fig=plt.figure(1)plt.imshow(wc)plt.axis('off')#不顯示坐標(biāo)軸#顯示生成的詞語圖片#plt.show()#輸入詞語圖片到文件plt.savefig(resImgSrc,dpi=500)圖3-14用戶評論詞云圖圖3-15文章內(nèi)容詞云圖4網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)的測試4.1登錄注冊模塊登錄注冊模塊主要是用于網(wǎng)絡(luò)輿情監(jiān)控人員登錄和注冊系統(tǒng),在對該模塊進行測試的過程中,首先對登錄功能進行了檢測,對于正常登錄的測試,輸入正確的用戶名和密碼,以檢驗系統(tǒng)是否能夠成功識別并允許登錄,進而導(dǎo)航至恰當(dāng)?shù)捻撁?。而在異常登錄的測試中,故意輸入錯誤的用戶名和密碼,以此來檢驗系統(tǒng)是否能夠阻擋不正確的登錄嘗試,并向用戶發(fā)出正確用戶名和密碼輸入的提示。其次,對于注冊功能,測試包括輸入合法和不合法的賬號進行測試,檢驗該系統(tǒng)是否能夠正確判斷注冊信息的合法性。表4-1用戶登錄注冊模塊的測試表測試行為預(yù)測結(jié)果實際結(jié)果輸入正確的賬號信息進行登錄操作顯示登錄成功并進入系統(tǒng)首頁與預(yù)測結(jié)果相同輸入錯誤的賬號信息進行登錄操作顯示輸入的密碼或賬號有問題,請返回登錄頁面重新登錄與預(yù)測結(jié)果相同輸入合法賬號,點擊注冊按鈕顯示賬號注冊成功與預(yù)測結(jié)果相同輸入不合法賬號,點擊注冊按鈕顯示兩次輸入的密碼不相符或賬號有誤與預(yù)測結(jié)果相同4.2數(shù)據(jù)采集模塊數(shù)據(jù)采集模塊的測試,主要測試該系統(tǒng)是否能夠成功抓取網(wǎng)頁上特定的輿情數(shù)據(jù),主要涉及的數(shù)據(jù)集包括:微博用戶識別(ID)、發(fā)布時間、用戶性別、IP地址、微博內(nèi)容等,進而將這些信息整理保存至數(shù)據(jù)庫內(nèi)。圖4-1微博文章成功存儲到數(shù)據(jù)庫圖4-2微博評論成功存儲到數(shù)據(jù)庫中4.3數(shù)據(jù)預(yù)處理模塊上一步存儲到數(shù)據(jù)庫的數(shù)據(jù)我們稱之為“臟數(shù)據(jù)”,在進行情感分析之前,需要先對數(shù)據(jù)進行預(yù)處理,簡單來說,需要從這些“臟數(shù)據(jù)”中剔除大量無關(guān)緊要的元素,如表情、符號、數(shù)字等,這些元素可以被視為噪音。該模塊的測試就是測試該系統(tǒng)是否能夠準(zhǔn)確處理臟數(shù)據(jù),并將上一步爬取到的內(nèi)容進行分詞、去停用詞等處理,以及統(tǒng)計各熱詞出現(xiàn)的頻率。測試步驟一:點擊熱詞統(tǒng)計按鈕,測試是否顯示熱詞統(tǒng)計頁面和熱詞查詢表格。圖4-3熱詞統(tǒng)計頁頁面測試步驟二:測試是否可以通過頁面最上方的搜索框進行熱詞搜索,測試結(jié)果與預(yù)測結(jié)果一致。圖4-4熱詞查詢表格測試步驟二:點擊微博輿情統(tǒng)計按鈕,測試是否顯示微博輿情統(tǒng)計表格,點擊表格中的文章ID是否可以跳轉(zhuǎn)至對應(yīng)的微博頁面,測試結(jié)果與預(yù)測結(jié)果一致。圖4-5微博文章統(tǒng)計表格數(shù)據(jù)采集模塊已獲取微博部分文章,并存儲到數(shù)據(jù)庫中,因此,點擊表格中的文章ID,可順利跳轉(zhuǎn)到微博原文章。圖4-6文章ID對應(yīng)的微博原文4.4情感分析模塊本系統(tǒng)采用SnowNLP技術(shù)進行情感分析,該模塊的測試主要是點擊微博輿情統(tǒng)計頁面中的情感分類按鈕,測試該系統(tǒng)是否能夠準(zhǔn)確進行情感分類處理,測試結(jié)果與預(yù)測結(jié)果一致。圖4-7微博文章的情感分類4.5數(shù)據(jù)可視化模塊本模塊主要實現(xiàn)了微博文章轉(zhuǎn)發(fā)量、點贊量、評論量、用戶IP地址、情感分析、文章內(nèi)容與評論內(nèi)容輿情趨勢分析等數(shù)據(jù)可視化功能,該模塊的測試主要是點擊數(shù)據(jù)可視化模塊對應(yīng)的按鈕是否可以順利顯示該模塊頁面相應(yīng)功能及信息。測試步驟一:點擊文章分析按鈕,測試該系統(tǒng)是否能顯示文章點贊量分析、評論量分析、轉(zhuǎn)發(fā)量分析頁面,并是否能夠通過頁面最上方的搜索框搜索不同類型的文章,測試結(jié)果與預(yù)測結(jié)果一致。Python作為開發(fā)語言,與Flask框架和PyMySQL庫一起使用,處理來自前端的請求并在數(shù)據(jù)庫中進行數(shù)據(jù)的存儲和讀取,分析數(shù)據(jù)庫中的文章點贊量和評論量,并調(diào)用Echarts庫實現(xiàn)數(shù)據(jù)可視化處理。圖4-8文章點贊量、評論量分析Python作為開發(fā)語言,分析數(shù)據(jù)庫中的文章轉(zhuǎn)發(fā)量,并調(diào)用Echarts庫實現(xiàn)數(shù)據(jù)可視化處理。圖4-9文章轉(zhuǎn)發(fā)量分析測試步驟二:點擊IP分析按鈕,測試該系統(tǒng)是否能顯示文章和評論發(fā)布作者IP地址圖,測試結(jié)果與預(yù)測結(jié)果一致。通過分析數(shù)據(jù)庫中的文章發(fā)布作者IP地址,統(tǒng)計各地區(qū)作者人數(shù),并調(diào)用Echarts庫實現(xiàn)數(shù)據(jù)可視化處理,生成文章發(fā)布作者IP地址圖。圖4-10文章發(fā)布作者IP地址圖通過分析數(shù)據(jù)庫中的評論發(fā)布作者IP地址,統(tǒng)計各地區(qū)評論人數(shù),并調(diào)用Echarts庫實現(xiàn)數(shù)據(jù)可視化處理,生成評論發(fā)布作者IP地址圖。圖4-11評論發(fā)布作者IP地址圖測試步驟三:點擊評論分析按鈕,測試該系統(tǒng)是否能顯示評論點贊量區(qū)間折線圖、評論用戶性別占比圖、用戶評論詞云圖,測試結(jié)果與預(yù)測結(jié)果一致。通過分析文章點贊量,調(diào)用Echarts庫實現(xiàn)數(shù)據(jù)可視化處理,生成評論點贊量區(qū)間折線圖。圖4-12評論點贊量區(qū)間折線圖通過分析評論的用戶性別,調(diào)用Echarts庫實現(xiàn)數(shù)據(jù)可視化處理,生成評論用戶性別占比圖。圖4-13評論用戶性別占比圖首先,對用戶的評論內(nèi)容進行深入分析,然后對這些評論
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 資料2-6 任務(wù)四 十、企業(yè)物流管理
- 2025年四平市中西醫(yī)結(jié)合醫(yī)院招聘護理人員備考題庫附答案詳解
- 2025年遵化益眾中學(xué)招聘教師30人備考題庫及1套完整答案詳解
- 2025年省屬國企公開招聘備考題庫及答案詳解參考
- 2025年遼寧省機場管理集團有限公司招聘備考題庫完整參考答案詳解
- 2025年區(qū)塊鏈電子存證保密合同條款
- 2025年永修縣總醫(yī)院面向社會公開招聘工作人員備考題庫及一套答案詳解
- 機械工程師面試題及實操技能評估
- 能源行業(yè)數(shù)字化轉(zhuǎn)型經(jīng)理招聘趨勢與面試題
- 商場裝修的合同(標(biāo)準(zhǔn)版)
- 2026成方金融信息技術(shù)服務(wù)有限公司校園招聘5人考試題庫附答案
- 車輛租賃服務(wù)協(xié)議書
- 2025安徽安慶市公安機關(guān)招聘警務(wù)輔助人員418人備考筆試題庫及答案解析
- 2025廣東廣州市黃埔區(qū)招聘社區(qū)專職工作人員50人(第二次)參考筆試題庫及答案解析
- 惡性胸腹腔積液病人護理
- 國家能源集團陸上風(fēng)電項目通 用造價指標(biāo)(2025年)
- 學(xué)堂在線 雨課堂 學(xué)堂云 中國建筑史-元明清與民居 期末考試答案
- MOOC 國際商務(wù)-暨南大學(xué) 中國大學(xué)慕課答案
- 重點監(jiān)管的危險化學(xué)品名錄(完整版)
- 心臟瓣膜病超聲診斷
- 部編版五年級語文上冊《全冊口語交際》課件
評論
0/150
提交評論