版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
如何通過輿情大數(shù)據(jù)分析成為新媒體運營領(lǐng)域的“增長黑客”即使我們不懂專業(yè)的技術(shù)分析和復(fù)雜的數(shù)學(xué)知識,我們也可以通過輿情分析大數(shù)據(jù)找到我們想要的內(nèi)容,根據(jù)客戶反饋數(shù)據(jù),不斷優(yōu)化公眾號內(nèi)容,逐漸成為新媒體運營領(lǐng)域的:“增長黑客”。1
為新媒體運營領(lǐng)域的“增長黑客”1.1一般意義上的“增長黑客”“增長黑客(GrowthHacker)”,這個近幾年來風(fēng)靡中國互聯(lián)網(wǎng)界的新興概念,濫觴于美國硅谷互聯(lián)網(wǎng)創(chuàng)業(yè)圈,國內(nèi)則是由范冰首先引進,他的著作《增長黑客:創(chuàng)業(yè)公司的用戶與收入增長秘籍》使這個概念深入人心。結(jié)合國內(nèi)外關(guān)于“增長黑客”的表述:“增長黑客”是以數(shù)據(jù)驅(qū)動營銷、以市場指導(dǎo)產(chǎn)品,通過技術(shù)手段貫徹增長目標的一群人。這就需要他們既了解技術(shù),寫得了代碼;又能了解人性,能捕捉用戶的心理感受和真實需求;最重要的是,他們經(jīng)常能突發(fā)奇想,發(fā)揮創(chuàng)意,大開腦洞,以小的投入獲取較多的用戶和收入。一言以蔽之,“增長黑客”就是具備各種跨界技能,可以利用各種巧妙的手段以極小的成本獲取大量用戶,實現(xiàn)最終的收入增加。“增長黑客”讓那些資金不夠充裕、前期資源緊缺和初始用戶匱乏的初創(chuàng)型互聯(lián)網(wǎng)初創(chuàng)團隊看到了“四兩撥千斤”的希望,小投入也能辦大事?!霸鲩L黑客”的一個很好的理念,但它在不同的互聯(lián)網(wǎng)領(lǐng)域有著不同的形態(tài),具體的實現(xiàn)手法也不盡相同,比如在新媒體運營領(lǐng)域。1.2新媒體運營領(lǐng)域的“增長黑客”新媒體是跟隨互聯(lián)網(wǎng)興起的一個新興媒體形態(tài),它已經(jīng)在很大程度上顛覆了以往的紙質(zhì)刊物、廣播及電視等傳統(tǒng)媒體,重要性不言而喻。關(guān)于它的概念和內(nèi)涵,筆者不想多說,網(wǎng)上有很多的詳細介紹。在這里,筆者認為新媒體最為重要的一個特征是:人人都可以是信息的生產(chǎn)者,人人也都是信息的傳播者。這意味著無論是誰,包含企業(yè)、機構(gòu)還有個人,都有機會成為這個新媒體時代的成功者。咪蒙、一條、十點讀書即是例證。然而,隨著中國的互聯(lián)網(wǎng)時代進入下半場,新媒體行業(yè)也從野蠻生長的時代進入“弱肉強食”的“叢林時代”,常規(guī)的新媒體運營手段(包括內(nèi)容、展現(xiàn)形式及推廣方法等)已經(jīng)很難從用戶增長緩慢和收入增長停滯的困境中突圍出來。寫到這里,筆者不由得想到兒時看過的動漫——《數(shù)碼寶貝》中的主人公身邊各類可愛的小精靈,在遇到危急情況時會進化,由“成長期”進化到“成熟期”、“完全體”,甚至是“究極體?”,適應(yīng)性和攻擊力呈現(xiàn)指數(shù)級的提升,足以在危如累卵的逆境中打敗強大的敵人,反敗為勝。與此類似,廣大新媒體從業(yè)者們在這個時候,也需要“進化”,完成華麗的轉(zhuǎn)身—采用精細運作、量化分析的科學(xué)手段去進行新媒體運營,以適應(yīng)這個足以革新我們思維觀念的“大數(shù)據(jù)時代”,而“增長黑客”正是一劑良方。從前面對“增長黑客”的介紹中,我們可以發(fā)現(xiàn):志“增長黑客紀”是一個多洋面手的角色媽,需要掌握洞跨領(lǐng)域的知艇識,其中最棒為核心的技皮能即是懂技指術(shù)、精通數(shù)亦據(jù)分析。事然而,技術(shù)幅(碼代碼、尾編寫程序等泉)和數(shù)據(jù)分蘆析(數(shù)學(xué)知岔識和BI軟功件操作等)縱對于很多做滿新媒體運營尤的小伙伴來港說,是十分因棘手的兩樣映事物:很多渡從事新媒體穗運營的小伙皆伴是正兒八判經(jīng)的文科生酷畢業(yè),文案啊和排版方面赴,他們可以眼說是“長袖姨善舞”,但油技術(shù)和數(shù)據(jù)回分析卻可能盲是他們的“趨夢魘”。總鑒于這種情坦形,筆者提搞倡“人+數(shù)捎據(jù)驅(qū)動思維頸+工具”理隊念—以人為曠本,從運營姐者自身的知確識結(jié)構(gòu)出發(fā)逝,以數(shù)據(jù)/游量化思維作塵為方法論,艙用工具輔助意運營,從而暮做到揚長避張短,把自己凳的精力集中閘在重要的事草情上。化筆者在這里針特意收羅了找10幾款跟峰數(shù)據(jù)分析有騙關(guān)的工具,塑以彌補技術(shù)恢小白和數(shù)據(jù)霉分析小白技死能上的匱乏卻,而且掌握際它們不需要盾很懂技術(shù),辮連數(shù)據(jù)分析皺這項技能也疲能借助它們?nèi)陛p松get字。銷值得注意的比是,本文所禽要介紹的工漫具,并不是繡狹義上的“詞工具”,如宇可視化工具鐘、文本分析談工具和事件租熱度趨勢/跌預(yù)測分析操題作類工具,越還包括數(shù)據(jù)稅新聞這種廣湊義上的新型租信息載體;援更為重要的問是,他們分例別代表著四票種思維/觀勁念—重視非嗚結(jié)構(gòu)性數(shù)據(jù)浩、科學(xué)化預(yù)晌測、信息的斤具象化呈現(xiàn)捉以及用數(shù)據(jù)疾講故事,這菠些“工具”羅都是為達到捉、完成或促乖進新媒體運筍營效果的有家利武器。蔬如下圖所示步,以下是本撇文的行文結(jié)悠構(gòu):于新媒體運營模的“增長黑蠻客”數(shù)據(jù)分影析工具箱撕2
文本分允析工具蹄2.1N燭LPIR在粱線系統(tǒng)稀NLPIR傲,即“自然棕語言處理與傲信息檢索共材享平臺”的在英文縮寫,廚打開該網(wǎng)栗址,即可進指入主界面—倦“語義分析葛系統(tǒng)”,顧穴名思義,它韻是一個在線事的中文語義律分析工具,照因為非商業(yè)粱化,它對處逮理文本的篇集幅大小也有野限制,只能島處理300赴0字,可以罵給熱衷于文蹦本分析的小舊伙伴過過癮犁,但要想用似于商業(yè)目的利,那只能呵普呵了。數(shù)NLPIR個在線系統(tǒng)的啦首頁橡上圖中間部六分的11個那圓圈即是該居系統(tǒng)的所有約功能,但其拴中有幾個只嶺是掛出來,晝目前還未實糞現(xiàn),結(jié)合新蓄媒體運營工僵作中的實際壓需求,筆者膏只介紹其中涌幾個比較有梢實用價值的僵功能模塊。扮以下以《<形你的名字。敞>破5.5裳億元日媒:梳和中國聯(lián)手撈有錢賺》這胳則新聞作為扇測試文本,弄筆者來給大傭家介紹下這響個系統(tǒng)中的瓦實體抽取、戰(zhàn)詞頻統(tǒng)計、旱文本分類、炮情感分析和區(qū)關(guān)鍵詞提取掃這5個比較割有實用價值似、且準確度害較高的功能波模塊。遠2.1.1捏
實體抽取定NLPIR向中的“實體端抽取”功能搜模塊可以智眾能識別出測覺試文本中出肉現(xiàn)的人名、爐地名、機構(gòu)溫名、媒體、綢作者及文章牛的主題關(guān)鍵唱詞,這是對真語言規(guī)律的吐深入理解和申科學(xué)預(yù)測,術(shù)它提煉出的撞詞語不需要園在詞典庫中裹事先存在。籌實體抽取的息圖表效果支黨持力導(dǎo)向圖咽和弦圖這兩冬種形式,如砍下圖所示:皇測試文本“胞實體抽取”跨的2種呈現(xiàn)痕形式禮上圖中,從喂“文本”這仍個一級類目勤中,分別分歲出了“關(guān)鍵迷詞”、“地太名”、“時虹間”這3個伯二級類目,例由此能大致保判斷出測試挑文本中包含抵的事件元素毀,如主題是樂關(guān)于電影的挪,涉及國家踩(地區(qū))間沖的對比,還較有縱向時間楊維度的分析巷,一些關(guān)鍵割詞能讓我們癢把握文章中屬重要的詞句鄭。帶2.1.2永
詞頻統(tǒng)計泰在一份給定包的文件里,遭詞頻(te準rmfr戒equen布cy,TF鄰)指的是某轟一個給定的州詞語在該文抱件中出現(xiàn)的拳次數(shù)。利在文本分析艦中,詞頻統(tǒng)吹計是較為常饑規(guī)的、同時內(nèi)也是最為重期要的一個環(huán)挨節(jié),它用來拐評估一個詞第對于一個文衡件或者一個轎語料庫中的都一個領(lǐng)域文努件集的重要輛程度。聰NLPIR椅只展示了名臥詞、動詞、湊形容詞這3豪種開放詞類喉,這個3個竊此類也是一齒段文本中最澡為重要的3嫂個部分:發(fā)名詞介紹文筐章中的各個裝主體,能讓市我們知道文搜本描述的對攝象是誰;飄動詞表征各停個主體的動散作和行為,梅能讓我們知角道關(guān)于主體莫發(fā)生了什么銳;繪而形容詞則龍能描述主體襖及動作/行學(xué)為的特征,茅能讓我們知炮道主體及其咽行為/動作攔的性質(zhì)、狀罪態(tài)、特征或嬌屬性。芒NLPIR思的詞頻統(tǒng)計膜只展示了上邀述詞類的T疤op10芹結(jié)果,以折宵線圖和條形款圖的形式進秋行展現(xiàn)。看笑了下面的詞巡頻分類展示清,聯(lián)想文章般標題,我們閥很自然地了詠解到《你的渣名字?!愤@殺部電影在市對場上獲得了斥不錯的業(yè)績攤,引發(fā)中日白媒體的廣泛建報道和關(guān)注儀……案測試文本的晶詞頻統(tǒng)計呈友現(xiàn)草2.1.3趴
文本分類每NLPIR售“文本分類淺”部分目前勺所展示的類撫別只是新聞葛的政治、經(jīng)炕濟、軍事、物交通等,分小類有待擴展羽和細化。符NLPIR疲深度文本分參類,可以用予于新聞分類書、簡歷分類證、郵件分類秤、辦公文檔貍分類、區(qū)域句分類等諸多藝方面。此外湯,它還可以陵實現(xiàn)文本過琴濾,能夠從蹈大量文本中患快速識別和陷過濾出符合筐特殊要求的招信息,可應(yīng)階用于品牌報寶道監(jiān)測、垃楚圾信息屏蔽寧、敏感信息砍審查等領(lǐng)域籠。戶然而,從測獄試的效果來炕看,這個功反能模塊的分禾析效果還不圓甚準確,它爆沒有“娛樂德”這一分類坊,但起碼也舌應(yīng)該劃入“具其他”這一膠類中??瘻y試文本的撲文本分類結(jié)睬果呈現(xiàn)堂2.1.4膜
情感分析泰NLPIR塊的“情感分潛析”提供兩能種模式:全岔文的情感判偷別(左圖)漠與指定對象頭的情感判別驗(右圖)。絮大類上,“寧情感分析”僅部分分為“允正(面)”杠和“負(面服)”這兩大魯類情感,這沙是內(nèi)層;在異外層,兩個悄大類又分為出“樂”、“廢好”、“怒耽”、“哀”掩、“懼”、往“惡”、“產(chǎn)驚”7中細直分的情感,掛這也就是大砍家常說的“搭七情六欲”糟中的“七情避”。籃目前正負面形的判斷已經(jīng)宜較為成熟,閑但鑒于漢語褲的博大精深餐和詞匯語義開(用法)的諷波譎多變(別反諷、貶義鄙褒用、語境垮變化等),舊細分情緒的忠判斷準確度販還值得觀察誦。卻測試文本的形情感分析結(jié)肺果呈現(xiàn)緩觀察上面測義試文本的情查感分析效果泳圖,再比對很原始文本,玉這個判斷大袋致上是準確珠的,但負面賓的部分應(yīng)該紙比實際的占夸比小,尤其監(jiān)是“惡”這簽個部分—筆土者并未發(fā)現(xiàn)灣有出現(xiàn)厭惡哪的語句和詞杠匯。幼2.1.5即
關(guān)鍵詞提液取傭這里的關(guān)鍵泰詞提取和前低面的詞頻統(tǒng)古計有一定的升聯(lián)系,但二氣者的算法(灰實現(xiàn)方法)橡是不一樣的粥:豬詞頻統(tǒng)計粘:詞頻統(tǒng)計竟的是一個詞巷在文章中出雙現(xiàn)次數(shù),出莖現(xiàn)的次數(shù)越顆多一般越重煎要;濃關(guān)鍵詞提取返:關(guān)鍵詞提陳取則是依據(jù)灶TF-ID做F(ter陵mfre斗quenc虧y–inv貪erse旁docum款entf欠reque趕ncy,詞柜頻–反轉(zhuǎn)文箏件頻率),躺用以評估一喇個詞對于文頃本內(nèi)容的重應(yīng)要程度。字爬詞的重要性仗隨著它在文嘆件中出現(xiàn)的桿次數(shù)成正比典增加,但同炒時會隨著它猴在語料庫中終出現(xiàn)的頻率戰(zhàn)成反比下降蝴。比如,“冒如果”、“接也”、“你壇們”等詞匯樸,他們出現(xiàn)譜的頻次很高騎,但它們的螞重要性就很襖弱。做測試文本的色關(guān)鍵詞分析顛從上圖中測郵試文本的“蘿關(guān)鍵詞提取津”中可以發(fā)藍現(xiàn),這部分蓋和“詞頻統(tǒng)善計”部分既晃有重合也有甲明顯區(qū)分,耗原因就在于薦上述的算法粗不同。絲值得注意的訓(xùn)是,不論是嬸“詞頻統(tǒng)計憐”還是“關(guān)踩鍵詞提取”仙,已經(jīng)設(shè)置仍了“停用詞墊(stop歸words供)”,在進陜行上述分析請的時候,自惡動的將那些膏無明顯意義備的副詞、冠相詞、代詞給術(shù)去掉了。德2.2
圖斗悅貢圖悅繳是一款在線歷的熱詞分析列工具,它可醋以對于載入芹文本或指向軍文本內(nèi)容的尊鏈接進行詞逃頻提取和詞抄語(重要性鋸)權(quán)重分析村,并可以導(dǎo)煤出成exc惱el格式的賓文件,便于摔后期分析和退處理。些圖悅的主界拉面腳處理熱詞分咬析,圖悅還粗可以自定義狼詞云形狀,世不過這里的江詞云效果不圾敢恭維,下顯面筆者將會沾介紹一個更評優(yōu)秀的詞云疲制作工具,賠讓經(jīng)圖悅處出理過的詞頻哨煥發(fā)出個性得化的風(fēng)采。歷值得注意的婚是,圖悅導(dǎo)隱出的exc怎el文檔有園三列:提取天出的詞語、記詞頻數(shù)、詞型匯權(quán)重。后岸兩個指標,英筆者已經(jīng)在塔前面做過論植述,不明白客的小伙伴可線以“倒帶”魄回去看看。震具體的使用仙方法筆者將搶在下面的可鼠視化自定義宣詞云部分詳酸述。但這款某詞頻分析工戚具只能導(dǎo)出襲150個詞重匯,對于處歌理一些復(fù)雜泡且大量的文孔本就會捉襟副見肘。渠2.3T帶oneA陰nalyz玻er剛Tone嘴Analy緩zer叛是一款由I敢BM推出的盡、基于云計疤算的人工智表能文本分析北工具,能對慣電子郵件、住博客文章以論及手機短信先進行感情色元彩分析,以酒確定它的措糞辭是否如實譯地表達了你哲的憤怒、肯額定、高興或持者悲傷等感卻情。腫ToneA蕉nalyz伸er的主界敗面搬這一用來幫囑助評估和改蝕善文字溝通賴當(dāng)中的語氣冒的服務(wù)目前珍尚處實驗?zāi)S晔剑绔@成響功,或?qū)⒏脑冏兾磥砩碳已莺蜖I銷人員賽同消費者、下客戶的溝通陵方式。呀更重要的是形,它可以應(yīng)紗用到新媒體發(fā)運營者的內(nèi)飄容校正中來圍:套用來查驗文胃章內(nèi)容的調(diào)軟性和風(fēng)格,摧了解自己的猶文字給人留耗下的印象如還何,以使公名眾號的內(nèi)容殺運營不偏離肚預(yù)設(shè)的定位疏。崖幫助品牌運饞營者和內(nèi)容艦輸出分析,忙撰寫何種風(fēng)鄉(xiāng)格的文案才齊可以引起受蒙眾的共鳴。小Tone
繭Analy哨zer的評責(zé)價系統(tǒng)包含需三個維度,唱各個維度及痕其簡介如下只圖所示:墓Tone
慈Analy應(yīng)zer的評滔價系統(tǒng)的三麗個維度下以下是To鑼ne
An鎮(zhèn)alyze翻r的使用案起例,大家可吃以從下面的僑幾個模塊中雀獲得對文字善信息的洞察很,這部分筆臺者不做詳述半,感興趣的義小伙伴可以乒去官網(wǎng)查閱遍文檔。課輸入文本信漫息和選擇分枝析類別炕文本信息3場個維度的分俯析結(jié)果算文本信息段洋落的逐行分啞析(附有標把記)盤3
熱點捕班獲/趨勢預(yù)題測工具坡3.1
搜村索指數(shù)型昆這里的搜索管指數(shù)型趨勢軌工具指的是核,它們的數(shù)略據(jù)絕大部分川是基于用戶躁的搜索行為扛,即用戶搜可索關(guān)鍵詞而榜形成的數(shù)據(jù)向及其展示,晨有一定的預(yù)惕測價值,但值缺點是并不繭能發(fā)現(xiàn)搜索貍行為背后的侍原因。懇3.1.1按停百度指數(shù)值關(guān)于百度指標數(shù)的介紹,搜筆者僅貼出悔部分官方關(guān)杏于功能的介君紹:黨百度指數(shù)是蠢以百度海量郊網(wǎng)民行為數(shù)催據(jù)為基礎(chǔ)的獎數(shù)據(jù)分享平店臺,它能夠樸告訴用戶:信某個關(guān)鍵詞致在百度的搜井索規(guī)模有多爺大,一段時層間內(nèi)的漲跌再態(tài)勢以及相雨關(guān)的新聞輿室論變化,關(guān)演注這些詞的欺網(wǎng)民是什么倉樣的,分布臨在哪里,同討時還搜了哪演些相關(guān)的詞份,幫助用戶冰優(yōu)化數(shù)字營界銷活動方案掉。產(chǎn)關(guān)于詳細它碧的使用方法粘及一些關(guān)鍵探原理,筆者井在《有尋找創(chuàng)業(yè)方份向時,如何捧零成本用大融數(shù)據(jù)獲悉市軌場行情?尤》有詳述,絡(luò)感興趣的小飯伙伴可以去屬看看。家3.1.2恰腥微指數(shù)座微指數(shù)是新叉浪微博的數(shù)疊據(jù)分析工具尊,基于新浪叢微博的全量絞數(shù)據(jù),通過慶關(guān)鍵詞的熱葉議度,以及最行業(yè)/類別主的平均影響以力,來反映部微博輿情或休賬號的發(fā)展座走勢。微指凍數(shù)分為熱詞信趨勢、實時因趨勢、(信辱息分布)地門域解讀和(膚用戶)屬性如分析4個板剩塊。格“熱詞趨勢秧”部分與百收度指數(shù)的趨業(yè)勢很相像,搖但它有一個搖更為有價值辰的地方—點拐擊趨勢曲線接中的各個節(jié)辛點,會顯示哈出關(guān)注度排床名靠前的3嚷條微博,可產(chǎn)以做到“知蒸其然并知其熟所以然”。亞微指數(shù)的熱我詞趨勢圖錢“實時趨勢劫”則反映該互熱詞近一天市的走勢情況午?!暗赜蚪獯鹱x”即該熱鬼詞相關(guān)微博慣信息的地域予分布情況。爆最后一個功女能板塊是“雹屬性分析”套,這部分能渣獲悉關(guān)注該養(yǎng)熱詞及其相極關(guān)事件的人旨群畫像,有資性別、年齡膠、興趣標簽以比例和星座叨標簽比例這妻4個人群屬駱性。淺微指數(shù)的“慌(人群)屬蔬性分析”曠3.2
現(xiàn)級網(wǎng)信息型跨現(xiàn)網(wǎng)信息型勾,顧名思義膝,就是該類旦工具的主要腔數(shù)據(jù)來源于剛現(xiàn)有的網(wǎng)絡(luò)匠信息,而不希是基于網(wǎng)民隔的搜索行為匙,因而通過慨它可以找到衡熱詞或事件艷關(guān)注(量)錦發(fā)生波動起敏伏的原因。每一般來說,容這類數(shù)據(jù)產(chǎn)慣品的典型應(yīng)付用領(lǐng)域在輿德情領(lǐng)域(包塞括輿情監(jiān)測走、品牌口碑把監(jiān)測等),莊比如李新浪或輿情通償。眉新浪敢輿情通僅的主頁胞新浪廚輿情通塑開放工具—貍“熱度指數(shù)籃”產(chǎn)品頁面盛以下是新浪電輿情通毛這個大數(shù)據(jù)侄分析工具的棵介紹,我們昌能從中看到郵現(xiàn)網(wǎng)信息型乖熱度分析工嚷具的基本原鴿理:錦“利用獨有礙的分布式網(wǎng)窩絡(luò)技術(shù),對撓互聯(lián)網(wǎng)上輿御情相關(guān)數(shù)據(jù)瞧源進行完整燕采集,同時偏根據(jù)用戶預(yù)剛定的監(jiān)控關(guān)客鍵詞對全網(wǎng)亦數(shù)據(jù)進行補問充獲取。“農(nóng)新浪各輿情通檔”可以在很獨短時間內(nèi)收賭錄到國內(nèi)外掙重要網(wǎng)站、冰論壇、微博卻、微信公眾星號、貼吧、遭博客等互聯(lián)筑網(wǎng)開放平臺車的相關(guān)信息凝,通過中文蒼智能分詞、啊自然語言處犧理、正負面言研判等大數(shù)貞據(jù)處理技術(shù)堡對收錄到的爹信息進行處密理并分析…節(jié)可以看出,尖現(xiàn)網(wǎng)信息型施熱度分析工鋤具的數(shù)據(jù)基梅于現(xiàn)有的全屠網(wǎng)信息搜集榨,并經(jīng)過自炕然語言處理版等技術(shù)對文察本信息進行雖信息的“去溜粗取精”,挎從而有效把貝握事件的重籍要方面和影脅響因素?!吧舷旅?,筆者此來詳述新浪芹輿情通叨的幾個很有內(nèi)價值的功能播模塊—分別守是熱度趨勢恒分析、信息淚監(jiān)測、事件借分析和微博疲傳播分析,姻它們可以很燥好的運用到條新媒體領(lǐng)域某,可以在熱鹽點追蹤、內(nèi)膽容規(guī)劃、受疊眾畫像分析南和營銷分析想方面給予運辯營者們以有撇益的指導(dǎo)。喝3.2.1站(事件)牙熱度趨勢分濱析舟在地震救援樣中,有一個限概念叫做“錫黃金72小蹄時”,它是沸地質(zhì)災(zāi)害發(fā)膨生后的黃金要救援期。因璃為救援界認榴為,災(zāi)難發(fā)痛生之后存在防一個“黃金奇72小時”登,在此時間建段內(nèi),災(zāi)民近的存活率極雁高。焰同樣,在新帥媒體內(nèi)容運謹營追蹤熱點貌事件方面,蔑也存在類似幫的定律,能揪在最短的時梁間內(nèi),把握匪觀眾所關(guān)注爬事件的發(fā)展壤走向和輿論逮傾向,因勢張利導(dǎo),就能鍛成功的“借嘉勢“。誓新浪維輿情通損的(事件)饑熱度趨勢分填析中有一個簽?zāi)芊从呈录x關(guān)注度的一介個數(shù)據(jù)指標或—熱度指數(shù)它,它的全稱臂是“網(wǎng)絡(luò)傳慨播熱度指數(shù)姻”,是指在蛛從新聞媒體約、微博、微予信、客戶端洋、網(wǎng)站、論撫壇等互聯(lián)網(wǎng)業(yè)平臺采集海貸量信息的基雪礎(chǔ)上,提取程與指定事件國、人物、品拳牌、地域等孟相關(guān)的信息太,并對所提妨取的信息進償行標準化計寫算后得出的等指數(shù)。訂熱度指數(shù)能怎客觀反映事捕件、人物、近品牌、地域剪等在互聯(lián)網(wǎng)絨上的受關(guān)注吉程度。熱度華指數(shù)所呈現(xiàn)碗的數(shù)值為0監(jiān)~100,團數(shù)值越大,爸表明其網(wǎng)絡(luò)萬受關(guān)注度越螺高。該下面舉個栗算子,拿前不雙久廣受關(guān)注哄的“淘寶被彩列入惡名市四場名單”事打件作為分析偵對象,來看孕看(事件)杠熱度趨勢分唱析的各個功壞能模塊是如明何運用到新改媒體運營領(lǐng)侮域的。左(1)熱度抱概況和熱度各趨勢宇從下圖的“將指數(shù)概況”條部分,我們窮可以看到,賄淘寶被列入巾惡名市場名棗單”在72原小時內(nèi)(當(dāng)贈然也可以選設(shè)擇24小時房這個時間區(qū)貧間)的熱度盛同比增長達兩到6231銷5%,表明掃互聯(lián)網(wǎng)上關(guān)該于該事件的補媒體報道和漏公眾評論信秧息出現(xiàn)驟增喊的情形,且洪指數(shù)有將近樓6%的增幅躲,幅度不大段結(jié)合這兩個株指標可以看良出,在近7糟2小時內(nèi)該登事件很火熱渾,且熱度呈彩現(xiàn)穩(wěn)步增長冊的趨勢。值瓣得注意的是理,這里的“幣同比”和“訪指數(shù)變化”漂是針對此次末查詢的72梢小時區(qū)間和選上一個72銀小時區(qū)間的滿數(shù)值進行對烈比的。除在“熱度趨包勢”部分,市由時間軸和書熱度指數(shù)軸形構(gòu)成的折線春圖反映了近繡72小時內(nèi)滋該事件熱度留指數(shù)的變化厲趨勢,這個艦折線圖的分守析意義重大呢,能起到預(yù)遵測事件未來往熱度走勢的春神奇作用。樹在分析熱度煩指數(shù)的折線壽圖的時候,南要注意從微呈觀層面和宏怎觀層面上的境把握。在微藏觀層面上,糕要特別注意啄折線圖中比榆較重要的節(jié)恩點,特別是癢峰值節(jié)點,俗它代表其對杠應(yīng)的時間點腐它的關(guān)注度薯較高,要注求意發(fā)現(xiàn)事件呢爆發(fā)的時間雨規(guī)律;在宏轉(zhuǎn)觀層面上,透要看整條折買線的整體走邀向,是整體沙呈現(xiàn)上升趨兼勢,還是呈禿現(xiàn)關(guān)注度的絡(luò)下降趨勢,濁當(dāng)情況屬于堵前者時,新特媒體運營者凝們則可以繼鎖續(xù)跟進事件股的發(fā)展,接筑著“借勢”畜和“跟風(fēng)”育。柄熱度概況及爸熱度趨勢分朽析歡既然知道了浴事件熱度的奉峰值節(jié)點出治現(xiàn)在哪個時殘間點,這時獲我們肯定想感了解這些時蓋間區(qū)間內(nèi)事您件關(guān)注度驟幕然上升的原循因。還好,映緊接著“熱墓度趨勢”,妻下方給出了承其中最突出物的峰值節(jié)點爹出現(xiàn)的原因善,以重點信溝息聚類的方提式呈現(xiàn)。牽在下圖中,福呈現(xiàn)的是1鎮(zhèn)2月23日投08時,舌達到24的姨峰值時的重插點信息聚類道。給出了這法些熱門文章款的標題和來煩源站點,點誤擊標題即可爽進入相應(yīng)的灘網(wǎng)頁,查看圣源信息。啊最突出峰值漢節(jié)點的信息推聚類渴這里需要強績調(diào)的是,對效于最突出峰袖值節(jié)點的重愿點聚類信息禾的解讀十分將重要,因為叉這些文章閱哭讀數(shù)高,抑雕或是轉(zhuǎn)發(fā)量棄高,在某種逗程度上表明酬了公眾對于臥這些信息的交認可度高,啞能代表一定同的公眾輿論豆傾向。作為粗新媒體內(nèi)容盟運營者來說依,引導(dǎo)公眾驚看法難度太諷大,不是人場人都能做成件意見領(lǐng)袖的材,能因勢利丈導(dǎo)的輸出順秀應(yīng)公眾觀點純的文章可能壓是上策。呢(2)事件塑熱度信息的刻關(guān)鍵詞詞云液這里的關(guān)鍵千詞云是由互擔(dān)聯(lián)網(wǎng)上各個車渠道的海量踏信息進行中尤文智能分詞義和自然語言枯處理所得,肅濃縮了關(guān)于恢該事件的T剝OP60關(guān)尼鍵詞,能在趟一定程度上態(tài)反映出事件妄的各個要素短。暈詞語的大小丑代表該詞出綁現(xiàn)次數(shù)的多糠寡,也表明逗了該關(guān)鍵詞施對于事件的蓄重要程度如欠何。在進行那內(nèi)容組織的克時候,可以杏考慮這些詞朽頻數(shù)高詞匯膝所代表的方妹面,如在“往淘寶列入惡籃名市場名單贊”這一事件榜中,除了“駛惡名市場”貼、“名單”科這些出現(xiàn)在紋標題之中的榴關(guān)鍵詞外,粒還有“加大懷力度”、“煉納入保護”般、“知識產(chǎn)禽權(quán)”等關(guān)鍵用詞表征的方鴨面作為文章耗內(nèi)容的著力朝方向。肝“淘寶列入辯惡名市場名痰單”事件的悟關(guān)鍵詞詞云恢(3)事件喉熱度信息的跑來源類型冊“信息來源云”部分中,旗反映出了事反件信息的來典源占比情況那,比重較大馳的部分是需計要運營者重消點關(guān)注的渠羊道。原“淘寶列入游惡名市場名唯單”事件的勤信息在“微妄博”這一信層息渠道中的慢比重最多,半其次是“網(wǎng)箭站”、“新父聞”、“客泄戶端”等,茅具體的數(shù)據(jù)誤為:微博(倚49.32仍%)、網(wǎng)站腹(27.7浙3%)和新辨聞(10.文13%)。富“淘寶列入多惡名市場名慶單”事件的料信息來源分繭布恭針對微博信漆息量為何占怎據(jù)如此大的保比重這個問鍛題,筆者找與到了今年1渡1月份新浪內(nèi)微博官方的不一份關(guān)于微左博UGC的紡數(shù)據(jù),頓時里了然:終新浪微博2飲016年P(guān)筆GC、UG患C幾項關(guān)鍵淚數(shù)據(jù)祖新浪貓輿情通兼是新浪微博剩旗下的子公鑄司,擁有全歇量的微博數(shù)帶據(jù),再加上埋騰訊微博的礦信息量,因進而其他渠道烘的信息量比析例會被微博專這一渠道巨敢大的UGC銅內(nèi)容給稀釋葉掉,形成絕換對信息量不屠小但看起來飽很少的效果精。趕(4)事件譯熱度信息的疤地域分布習(xí)(事件熱度規(guī)信息的)地抗域分布反映三的是搜索事帶件的全網(wǎng)信哭息量在全國巖各地的分布甚情況,這一罷點與百度指牛數(shù)的原理一仁樣?;?/p>
“淘寶列皂入惡名市場襯名單”事件棍的信息地域唯分布柴從地域分布握來看,與“幻淘寶列入惡什名市場名單算”相關(guān)的信惡息主要來源遇北京(35湯61條)、聾廣東(11寸39條)和現(xiàn)上海(83曉4條)。獵(5)事件愁熱度信息的幻關(guān)聯(lián)詞分析粘事件熱度信娃息的關(guān)聯(lián)詞支分析,它是螺通過系統(tǒng)自烘動運算找出簽事件核心詞詳、并計算出變與核心詞同伴時出現(xiàn)關(guān)聯(lián)昨度最高的高恒頻詞,也就第是與核心詞禽共現(xiàn)頻率最癥高的詞匯境。哀下圖中的關(guān)勞聯(lián)詞和弦圖再和對應(yīng)關(guān)聯(lián)咳度數(shù)據(jù)表反祖映了該事件腫的關(guān)聯(lián)詞情代況。標“淘寶列入助惡名市場名采單”的關(guān)聯(lián)黨詞分析框通過對與“顆淘寶列入惡析名市場名單掘”相關(guān)的信領(lǐng)息進行分析雪后可看出,稼與其核心詞右惡名市場關(guān)它聯(lián)度最高的根詞語為淘寶析(100.熔00%)、塌美國(99童.06%)層和名單(9泡7.19%繼)。恰3.2.2篩信息監(jiān)測樸一直以來,祥(輿情)信按息監(jiān)測的主項要用戶是政澇府、大型企崖業(yè)和專業(yè)新屯聞媒體,因原而對應(yīng)的主令要功能是傾擺聽民意、監(jiān)遇測自身(也田包含競品)啞的品牌口碑垮及動向,以升及追蹤熱點廟事件走向等俗。此外,它密可以通過各耽種預(yù)警設(shè)置勻,對關(guān)注事朋件產(chǎn)生的新顛信息進行第尿一時間的提例醒,以免運怒營者遺漏重智要信息。典實際上,信帽息監(jiān)測可以城用于新媒體招領(lǐng)域,結(jié)合議上面提及的妨“濫事件熱度趨駝勢分析”謝板塊棍,瘦媒體運營者驅(qū)可以有效的晴追蹤熱點事噴件的最新進街展,做到不培遺漏。止關(guān)于它的應(yīng)患用場景,筆嘆者目前想到真2個:旅(1)文章花轉(zhuǎn)載的全網(wǎng)帝監(jiān)測世筆者平時會虜寫一些關(guān)于芳互聯(lián)網(wǎng)數(shù)據(jù)剛運營的文章趁,發(fā)布在一淘些知名的互怎聯(lián)網(wǎng)平臺上閉,因此想監(jiān)什測一下全網(wǎng)斃轉(zhuǎn)載的情況告,比如筆者歪最近的一篇論文章—“如鎮(zhèn)何用數(shù)據(jù)分森析,搞定新桿媒體運營的輛定位和內(nèi)容謠初始化?”逢,在“信息鍛監(jiān)測”的監(jiān)對測方案部分休設(shè)置好關(guān)鍵痛詞后,選好植時間區(qū)間,糠轉(zhuǎn)載的詳細蠻情況和數(shù)據(jù)嘩統(tǒng)計圖表盡腹收眼底:族文章轉(zhuǎn)載的腎信息列表柿筆者文章轉(zhuǎn)賄載的各種信餓息反饋圖表驢(2)關(guān)注塞信息的全網(wǎng)壯監(jiān)測著運營者可以哈在監(jiān)測方案趴中按設(shè)置指舍定的關(guān)鍵詞棍,定向的追系蹤自己感興己趣的事件、工公司、品牌騾和資料等信咽息。禾以下是筆者昨在學(xué)習(xí)數(shù)據(jù)姥分析時,進愉行的關(guān)鍵詞辦設(shè)置,多個鹿零散詞匯通閘過邏輯運算威符形成了一污個監(jiān)測方案穩(wěn),可以無遺敬漏的監(jiān)測自困己關(guān)注的信韻息,同時系臭統(tǒng)也會過濾撿掉垃圾信息埋。辰通過各種邏魔輯運算符設(shè)湯置信息監(jiān)測綢的關(guān)鍵詞郊設(shè)置好監(jiān)測斑方案以后,莫點擊“圖表崗分析”,即度可看到如下崖圖所示的各益種監(jiān)測方案蜂信息量的可斗視化分析圖時表。灶監(jiān)測方案的岔信息量的走永勢圖散監(jiān)測方案的浸信息量分布澤情況拜監(jiān)測方案信查息量的地理拼分布情況曠再選擇“信界息列表”項設(shè),通過時間井、地域、渠湯道等選項的舉篩選,我們揮就可以得到寧自己想要的建信息了。此熱外點擊其中待一條信息,犁即可進入信角息詳情頁,描如下圖所示擺:亮監(jiān)測方案的倆信息列表贈監(jiān)測信息的桶詳情頁斯另外,這個殘功能模塊還快有幾個功能刊,如下圖所錄示,篇幅有態(tài)限,感興趣迷的小伙伴自獵己去試試吧并。妙“信息監(jiān)測站”板塊的預(yù)爽警通知、監(jiān)煤測日報和定降向監(jiān)測功能當(dāng)3.2.3副事件分析批事件分析(濤包括全網(wǎng)事緣件分析和微杯博事件分析撥)指的是,嬸輸入近期事條件或話題關(guān)嘗鍵詞,系統(tǒng)旦自動進行深軌度挖掘和多蔑重分析,記長錄事件從始悲發(fā)到發(fā)酵期榴、發(fā)展期、依高漲期、回恐落期和反饋仁期等階段的黑演變過程,治分析輿情傳憂播路徑、關(guān)本鍵詞云、發(fā)側(cè)展態(tài)勢、受或眾反饋和網(wǎng)額民觀點分析賀。繼3.2.4粉微博傳播司分析廉微博傳播分福析通過分析拆單條轉(zhuǎn)發(fā)量莊/評論量大迷的的微博,職從而得到關(guān)茄于該微博的竿傳播路徑、籠意見領(lǐng)袖、襖用戶畫像和竄微博營銷傳晝播質(zhì)量等。妙下面貼一張得大圖讓大家抹感受下:侄微博傳播分探析的部分功屬能鹿4
可視化陪工具建俗話說:“宵文不如字,屯字不如表,奸表不如圖”針,一張富含痕信息量且外旅觀時尚靚麗靠的圖會給文傷章增色不少著,會激起讀式者的好奇心坑,不知不覺傲的去圖片中漂探尋信息,屯從而讓文章傘的可讀性大俱大增加,易隱于傳播。比獅如這張圖:素人人都是產(chǎn)屠品經(jīng)理網(wǎng)站稼“產(chǎn)品經(jīng)理服”專欄所有肯文章標題制柏成的詞云趙怎么樣,想彼學(xué)了吧?僑不急,這個坊其實很簡單悲,下面我將殺以實例詳細撇的講解制作幫這張圖的步割驟,即使是躺小白的你,上也能做出這車樣精美的個圓性化詞云。亮4.1個勇性化詞云制掀作背我把個性化檔詞云的制作吩分為3個步撕驟,即抓取價數(shù)據(jù)、文本鑰處理和詞云泊制作,詳見鴉下圖:筑個性化詞云討制作的步驟醋4.1.1廳數(shù)據(jù)獲取鋸從本質(zhì)上講賽,詞云是反榆映某一特定贊主題的文本浪數(shù)據(jù)的可視衡化展示。比研如,上面的班喬幫主詞云麻反映的就是差“產(chǎn)品經(jīng)理拍”專欄中較欲為熱門的關(guān)加鍵詞/話題講。所以,要扶制作一個“段出彩”且有酒內(nèi)涵的自定啊義詞云,文楚本不能無規(guī)遇律,需要定托向的獲取特念定的文本數(shù)貢據(jù)。投筆者對前不舅久上映且廣熔受好評的電農(nóng)影《你的名賺字》頗感興死趣,想分析墓一下這部電權(quán)影的市場反倍響如何,先頓聊聊這部分顯數(shù)據(jù)的獲取糖。乓對于影片的樸分析,首選上當(dāng)然是豆瓣女電影,因為亭它是國內(nèi)最建具有參考價富值的影評網(wǎng)維站,從文本評中能得到很凍有價值和有勁意思的信息勸。但考慮到互文本數(shù)據(jù)獲搜取的難易程固度,我先介顫紹如下3個今數(shù)據(jù)獲取的送方法:麥(1)自己阿編寫爬蟲,紹想要什么數(shù)硬據(jù)就去抓取弊什么數(shù)據(jù),余既經(jīng)濟(用右爬蟲工具會座花錢),又施會增加“自懶己動手,豐希衣足食”的抵成就感,最貞重要的是,泉略施小計就飯可以躲避豆付瓣的封IP欠機制。愁用pyth倒on編寫爬鴉蟲抓取豆瓣瘋影評數(shù)據(jù)窩(2)利用租集搜客這樣如的爬蟲軟件謊去抓取數(shù)據(jù)崖,不需要編掠程技術(shù),且賊簡單易上手餓,但是可能喘會被封IP縮。沃(3)采用穴新浪猶輿情通勉這個大數(shù)據(jù)恢工具,因而修不用豆瓣的綱評論數(shù)據(jù),母在互聯(lián)網(wǎng)上泄進行全網(wǎng)信蹄息搜集,獲偵取有關(guān)該影勺片的熱門文求章標題作為承分析的文本勉數(shù)據(jù),這種雁方法是三種白中最為輕松展簡單的,而謹且獲取的是云全網(wǎng)的數(shù)據(jù)慧,大家可以景有選擇性的催選取自己需岡要的數(shù)據(jù),量操作步驟如西下圖所示:租用新浪標輿情通意獲取文本數(shù)站據(jù)固因為最近學(xué)準了點Pyt滔hon,故簡筆者選擇了削用Pyth察on編寫爬量蟲來獲取了璃豆瓣這部分森的影評數(shù)據(jù)狠。迷獲取《你的晶名字》豆瓣透電影的影評闖數(shù)據(jù)的抓取后的數(shù)經(jīng)據(jù)整理成如印下表格:章保存到本地紋的《你的名致字》豆瓣影盲評數(shù)據(jù)某接下來,就樸是把文本數(shù)際據(jù)單獨取下獨來咯,全選植“評論內(nèi)容維”這一列,汪把這些影評套數(shù)據(jù)占到記礦事本上,作忌為接下來分號析的“原材輪料”。恭4.1.2巴文本處理清一般情況下鋸,文本數(shù)據(jù)共的處理包含隆很多方面,揭如分詞、詞布性標注、詞鋼頻統(tǒng)計、文恰本分類、情災(zāi)感分析、關(guān)胸鍵詞提取、曉文本摘要提小取等。光在這里,制即作詞云只需吳要考慮璃關(guān)鍵詞提取剝和詞頻統(tǒng)計冰這兩個板塊懶。拘這里使用到耽的工具是前容面提及的熱腔詞分析工具心—它圖悅婆。將《你的渴名字》豆瓣仗評論的文本播部分粘貼到商上圖中左邊后的文本框中為,再點擊右計上方的“分揚析出圖”,絲系統(tǒng)顯示完圾成后,右邊州的預(yù)設(shè)詞云斬會發(fā)生變化茶,此時點擊鉗“導(dǎo)出”,盛即可得到詞伙頻的csv跨文件。騙經(jīng)圖悅處理樹得到的詞頻色csv文件以這里去除詞晃語和詞頻兩出列,用來進校行接下來的際詞云制作。附4.1.3羨詞云制作尚處理詞云,縮筆者用到的莊工具是鐮Tagul妖。下面是它宗的的主頁展問示:暴Tagul凱主頁堂(1)詞頻畜載入格式找在頁面左上押方的“Wo呈rds”處列,就是加載華詞語及詞頻滋的地方,這四里需要注意岡一下它的載與入格式。,第如下表所示左:組Tagul依的詞頻載入橋格式道上表中,前懂兩列的“W藏ord”和索“Weig蠅ht”就是掛剛才經(jīng)處理飯過的詞語和保詞頻,Co谷lor一欄屢則是設(shè)置該淋詞語的顏色汁,這是個性倍化詞云中很竭關(guān)鍵的一個距要素,會直欄接影響到最匙終的詞云呈傷現(xiàn)效果。這趕里可以不填窗寫,那么在椒形成詞云時灑默認隨機生姨成顏色。如蒸果要形成定把制化的顏色爆,則需要設(shè)美置采用16巾進制的色值津,以下是常錦用的顏色代修碼表,即色覆值表。給常用的16膊進制色值表晚與此類似,動字體也可選撤可不選,需饞要定制的話削,則可進行擠相應(yīng)的設(shè)置燈。吵“Repe披at”這項謎則表示該詞煙語是否會重敘復(fù)出現(xiàn),填蓬寫“0”,恒則表示不重默復(fù),填寫“原1”,則表顫示重復(fù)。為阿了保持信息盾的精準度,巷減少噪聲,搖一般選擇填隙寫“0”。癥后面的UR厲L鏈接就忽叨略了,因為湊有前面的設(shè)長置,就不需稱要進行網(wǎng)頁消鏈接。婚按照上述操皺作,出詞語村和詞頻兩例犁外,筆者還貧定制了“C冷olor”鼓和“Rep盛eat”這格兩項,結(jié)果照顯示如下。聚最終的詞語答載入表氏全選該表格播的文字部分粥,將其粘貼冷到“Imp迅ortW斑ords”店的文本框里催,進行保存禿。砌(2)載入場中文字體弄因為Tag犁ul是老外甚做的一個在帽線詞云制作酬網(wǎng)站,所以辯Tagul違不支持中文槳,這需要我瓦們載入能支攻持中文顯示逼的字體,如塘下圖所示,掌筆者載入的歉是“You極Yuan負(幼圓)”充字體。妖載入中文字伶體淡(3)處理芽背景圖片步加載了字體繭,可以說這謙是個性化詞編云制作的核每心部分,詞詠云最終效果丙的美與不美窩就在此一舉滑。應(yīng)值得注意的棋是,在載入突圖片之前的疏圖片選取步佩驟時,需要需選擇背景和挪主題對比比兇較明顯的圖堵片。從接下瘡來的圖片預(yù)考處理過程中悼,你會發(fā)現(xiàn)逗這一點的重地要性。爛詞云自定義嫁圖片的初始分狀態(tài)簡筆者選取的鳥是《你的名像字》最為標臉志性的一張榮海報,看起扎來很有感覺絡(luò):既有男女文主角的形象紅,也交代了彼他們所處的鮮生活環(huán)境,臥中間則是影隆片中重要的誰提條線索—堤彗星。這張悶圖初始狀態(tài)淹看似雜亂,克不好處理,俯但仔細觀察勉,可以發(fā)現(xiàn)輝主體(男女替主角)和背譜景(天空、巾城市和彗星洲)之間的對撿比度和色相份差異還是很范明顯的。在壟Tagul第的“Cus漠tomS淋hape”接的設(shè)置中可疼以進一步處珠理背景和主漁體之間的對稿比度問題。良在“Sha怨pes”處瘡載入圖片后等,點擊上載歐成功后圖片罩的右下角“慈齒輪”,打贊開圖片預(yù)處絹理。其中,惠“Thre桑shold陜”處理景深揭,可以拉開糟/縮小背景葛和主體之間塞的差異;“物Edges貪”則是處理鄙主體輪廓的稠銳度,可以頃調(diào)節(jié)圖片的旬清晰程度模爐糊程度。這緣里的要點是屢—淡化背景封,清晰主體暈輪廓。考淡化背景,死強化主體輪揪廓絡(luò)好了,完成踢上面繁瑣的簽步驟之后,椒現(xiàn)在是見證建奇跡的時刻民了,點擊右枕上方大大的爬黑體字“V斯isual可ize”,軍待進度條加蜂載完畢后,褲即可得到如絲下的最終效短果圖:孤最終的詞云昨效果圖散4.2
網(wǎng)黨絡(luò)可視化利悲器—Ge玉phi清Gephi雕是一款開源豎免費跨平臺遙基于JVM您的復(fù)雜網(wǎng)絡(luò)嫌分析軟件,碰其主要用奮于各種網(wǎng)絡(luò)恢和復(fù)雜系統(tǒng)凝,動態(tài)和分克層圖的交互四可視化與探斤測開源工具吧,下載地址周為顫https召://ge怒phi.o素rg/拼。網(wǎng)上目前詞比較權(quán)威的浙Gephi戚教程是在U跌demy上源的Ooof勸liu講吩解的《Ge逝phi中文驚教程》,地深址為熱https置://ww腹w.ude蘋my.co切m/gep他hi/停,看完這個辮部分仍有饒老有興趣的小壇伙伴可以去察學(xué)習(xí)下。斥下面是由G佛ephi制類作的各種網(wǎng)憐絡(luò)圖,這些紋圖不僅包含舍了豐富的信頁息量,而且見極富美感,謙在吸引眼球杜的同時還給揮予我們有意倉義的信息??聘鞣N由Ge蟻phi制成播的網(wǎng)絡(luò)圖葵Gephi常是一款信息領(lǐng)數(shù)據(jù)可視化暗利器,它的頑一般應(yīng)用場閱景如下:賠探索性數(shù)據(jù)溝分析鏈接分析慮語義網(wǎng)絡(luò)分燒析法社交網(wǎng)絡(luò)分進析賣生物網(wǎng)絡(luò)分躍析擇以下簡單介億紹下它的使事用方法。礙在操作下面礎(chǔ)步驟之前,毀先去Gep膛hi官網(wǎng)上繪下載最新版胸的0.9.漏1ver乞sion,蓄這是免費的占,且支持中崖文,還有豐林富的插件下蠢載,這簡直聽是數(shù)據(jù)可視縫化愛好者的您福音!亮值得注意的右是,這款軟潮件是用Ja陵va編寫的夠,所以需要童安裝Jav足a環(huán)境,這框個有點磨人旅。演與演員頸的關(guān)系作為稼分析對象,飯來詳細解讀淹如何制作一尸個“秀外慧朱中”的社交你網(wǎng)絡(luò)可視化例圖譜。升4.2.1例制作源數(shù)歉據(jù)賀Gephi劈的源數(shù)據(jù)可杯以在exc西el中完成吵。在exc砌el中,僅寇輸入2列即味可,表頭嚴缸格按照Ge撐phi的格挑式來制作,橋第一列為“攀Sourc湯e”,第二葉列為”Ta枝rget”惱。下面以豆借瓣上評分6嶄以下的國內(nèi)推電影的導(dǎo)演助(選取的是悟張藝謀、陳窗凱歌、馮小夢剛等大家耳礙熟能詳?shù)膶?dǎo)踐演,演員隨搖之確定)和駁演員關(guān)系表竿為例,做成蘆如下格式:孩在Exce急l上編輯G友ephi的僅源數(shù)據(jù)動做好源數(shù)據(jù)獲之后,記得遣保存為CS赤V格式,G診ephi僅飄能讀取這種跟格式的數(shù)據(jù)座。閘4.2.2立導(dǎo)入數(shù)據(jù)柔在導(dǎo)入數(shù)據(jù)邁時,分別在蓋“分隔符”他、“如表格魄”、“格式虎”這三個選閥項下選擇“籌逗號”、“像邊表格”、構(gòu)“GBK”守。接下來點技擊“下一步濟”,完成數(shù)漠據(jù)的導(dǎo)入。廊在Geph既i中導(dǎo)入c狗sv數(shù)據(jù)立4.2.3齡調(diào)整網(wǎng)絡(luò)忠布局鼻剛打開“圖填”,也就是題網(wǎng)絡(luò)圖的圖朋形界面時,蠻這幾百個節(jié)榆點“蝸居”啦成一團,有葬點盤古開天腰辟地前“渾芝沌如雞子”相的感覺,但粱這個模樣離擊我們心中的收審美還有很涂長一段距離如呢。譜初始狀態(tài)的午網(wǎng)絡(luò)圖塑不過,不用欄著急,下面桃?guī)讉€簡單的桑步驟就能讓疤它“脫胎換懇骨”,完成電華麗的變身嚼。錯在左上方的汽“布局”欄團目中,選擇杰其中的任一園算法,并可她以在下方的三操作界面修串改默認算法坊參數(shù),也可光使用默認的被參數(shù)。單擊福圖中運行按京鈕,布局算商法生效。顫選擇“布局緒”中的算法紫選擇不同的貿(mào)“布局”算砌法,網(wǎng)絡(luò)圖瞇的形態(tài)就會州有相應(yīng)的變虜化,以下是近其中最為典末型的集中算拳法及其拓撲淘圖。理各種“布局線”算法的網(wǎng)雁絡(luò)圖拓撲形岸態(tài)恥在這里,筆剖者選取由“絕Frunc司hterm鞠anRe癢ingol偷d”算法確萬定的呈蒲公峰英花朵狀的積結(jié)構(gòu)作為初籃始形態(tài)。疤網(wǎng)絡(luò)布局做屯好后,我們握完成了這個難網(wǎng)絡(luò)圖的“拍骨架”搭建矛,下一步則潤需要對它的腥外表進行修翅飾,包括節(jié)鐵點、邊和背密景等部分的脹美化。語4.2.4那美化載在這里,我樹們可以對網(wǎng)幕絡(luò)圖進行“齒美容”,給丟它著上靚麗政的顏色和合勒適的背景作孩為襯托??厝缦聢D所示隸,我們可以由在“外觀”高一欄對節(jié)點勺和邊進行著不色,然后在任下方選擇合辛適的背景,宣要注意節(jié)點悉、邊和背景谷之間的色差親和對比。句給節(jié)點、邊組和背景選擇膝合適的顏色村還需要注意牌一點,沿著絲“外觀”>植“節(jié)點”>技”數(shù)值設(shè)定影”這一路徑客,讓節(jié)點根斤據(jù)連接數(shù)的殺多少而顯示要相應(yīng)的大小泥,使該網(wǎng)絡(luò)他圖更有層次撕感;同理,??梢詫呥M密行類似的設(shè)鴉定,則兩個園聯(lián)系緊密的達節(jié)點間的邊健將變得更寬暖。偵經(jīng)過調(diào)整后到,可以得到賴如下的網(wǎng)絡(luò)畫圖。啟顏色調(diào)整后踢的效果圖軌4.2.5袍顯示標簽臣經(jīng)過上述幾留個操作步驟擁之后,網(wǎng)絡(luò)筍圖還需要加箏入最為重要蹦的一項內(nèi)容秘—標簽,也走就是前面提濁及的導(dǎo)演及盞演員的姓名逐,反映在節(jié)寺點上,由此蓮?fù)瓿伤麄冎戦g的社交網(wǎng)外絡(luò)圖的基本增繪制。灘沿著“窗口蹲”>“預(yù)覽耀設(shè)置”的路搭徑,打開“生預(yù)覽設(shè)置”旨,界面顯示沈如下。其中維,需要在“猶節(jié)點標簽”億這部分完成敢字體的選擇防,把默認的因西文字體變栽為中文字體效。除此之外睛,此處還可理以進行邊框牽、字體大小壁、顏色、透蹦明度等的設(shè)循置。帶在“預(yù)覽設(shè)乏置”中設(shè)置錫中文字體紛完成上述選躺項后,還需院要在軟件界均面的下方,杜點擊一下左也下角那個大債大的“T”干,則節(jié)點標場簽就會顯現(xiàn)會,旁邊也有耀些字體調(diào)節(jié)刷鈕,大家可贊以摸索下。滴在“布局”柏中,選擇“占標簽調(diào)整”柿算法,得到好下圖:最終效果圖濁圖中各個節(jié)慧點的字體隨慢節(jié)點的重要花性(由度、病連入度或連拌出度確定)編而呈現(xiàn)出不象同之大小。奧所以,大家拌先看文字,茶了解其中最作為突出的一柔些演員和導(dǎo)滋演,其次在顆看他們之間組的關(guān)系。六筆者比較懶葬,這個網(wǎng)絡(luò)著圖其實還可框以進行更深同入的優(yōu)化的挺,有興趣的盼小伙伴可以暗嘗試著做得禿更絢麗一些缸。垃4.3
數(shù)違據(jù)地圖干數(shù)據(jù)地圖,時在Exce弄l2013朝版及以上中冊都有三維地枕圖,還有一判些BI工具段中也集成了霜這個模塊,戲當(dāng)然也有專歡業(yè)的地圖G嶄IS軟件,董如地圖慧、刃智圖等。好秧了,上面的覆工具部分介殊紹完畢,該蘿進入最終的塔收尾階段了角。在某種意努義上講,上窗面介紹的若語干工具都是伙為接下來的視“數(shù)據(jù)新聞稱”部分做準場備—它們是革數(shù)據(jù)新聞中德不可獲取的洲一部分,是磁數(shù)據(jù)新聞內(nèi)忍容呈現(xiàn)的重鼠要“武器”楚。窩5
數(shù)據(jù)新踏聞本在正式介紹遭數(shù)據(jù)新聞之奧前,筆者先看聊聊,為什住么需要數(shù)據(jù)立新聞這種新河型的新聞報穿道方式。色這里,筆者只引用美國N妨orthw斃ester允nUni并versi倉ty人文與傲社科學(xué)院的盟Prof灰Brian臟Keega苦n的一段話斥作為注解:執(zhí)“在當(dāng)代,猜對于信息過選載,以及恐灶懼、不確定扭性和懷疑等細情緒的焦慮到氛圍下,數(shù)富據(jù)驅(qū)動的新張聞可以起到踢關(guān)鍵性的作病用。它們可亭以為關(guān)于政逼策、經(jīng)濟趨向勢、社會變背革的討論提晝供更為堅實做的經(jīng)驗基礎(chǔ)頭?!眽粲纱丝梢姡坌畔⑦^載、團信息失真和柴現(xiàn)實世界廣勿泛存在的不閥確定性,導(dǎo)泳致人們不再忠相信沒有充味分依據(jù)的信睛息,因而數(shù)司據(jù)新聞這種唐更有說服力蓄的信息載體奸呼之欲出。扇5.1
數(shù)鄙據(jù)新聞簡介潤數(shù)據(jù)新聞,鵝又叫數(shù)據(jù)驅(qū)仆動新聞。是鴉指基于數(shù)據(jù)伴的抓取、挖謊掘、統(tǒng)計、訊分析和可視盡化呈現(xiàn)的新粥型新聞報道警方式。它致染力于從海量扭數(shù)據(jù)中發(fā)現(xiàn)讓新聞線索,哄或是抓取大蘋量數(shù)據(jù)拓展菜既有新聞主綠題的廣度與原深度,最后趙依靠可視化逼技術(shù)將經(jīng)過雄過濾后的數(shù)區(qū)據(jù)進行融合達,以形象化織、藝術(shù)化的鄭方式加以呈切現(xiàn),致力于拉為讀者提供暑客觀、系統(tǒng)陡的報道以及基良好的閱讀持體驗。舟目前,在大景數(shù)據(jù)新聞制竭作上已經(jīng)積寨累了經(jīng)驗的頓國際媒體有棉《衛(wèi)報》《塔紐約時報》趴《華盛頓郵曲報》等。餐以下是常見形的數(shù)據(jù)新聞柿呈現(xiàn)方式:珠不同類型的裙數(shù)據(jù)新聞娘需要注意的底是,數(shù)據(jù)新驚聞不一定非殺得要復(fù)雜的銹數(shù)據(jù)來呈現(xiàn)能事實,表現(xiàn)縱出很高的逼旅格。在很多使時候,簡單招的描述性數(shù)忽據(jù)即可,就腐像下面的一堤個示例一樣趕,數(shù)據(jù)圖表掠的呈現(xiàn)讓讀國者更加清晰褲、直觀的了指解到西藏班過在“量”和燭“質(zhì)”上的哥變遷,是“旨綠葉”,而答內(nèi)地西藏班福的整個發(fā)展汪歷程才是真疑正的“紅花遵”,是該報埋道的主線。坡一張圖讀懂琴“內(nèi)地西藏慢班”胳5.2
數(shù)土據(jù)新聞的形鄉(xiāng)式妄一般情況下直,數(shù)據(jù)新聞逼有如下3種洲形式:顫5.2.1灰新聞敘事鞏數(shù)據(jù)新聞體牢系下的新聞低敘事講求客裳觀理性和邏削輯性,從數(shù)益據(jù)視角來看傅待事件與社叛會話題的方廢方面面,加芹之以形象具員體的可視化橋圖表作為最寄后的呈現(xiàn)方或式,使讀者準對內(nèi)容的真蠻實性和價值柔性產(chǎn)生信任響。嗎以下是標題領(lǐng)為《23萬寒投票紀錄承回顧第五屆喉香港立法會籌》的數(shù)據(jù)新兼聞,下面選修取了該文中衫一些具有代先表性的數(shù)據(jù)母圖示。遙《23萬投苗票紀錄回我顧第五屆香慘港立法會》幫數(shù)據(jù)新聞中椒的一些圖示島從上圖中,略在運用數(shù)據(jù)灑圖示的同時版,借助數(shù)據(jù)獨分析的方法還,從多維度憲總結(jié)了議員按的投票行為吊。這種基于舟數(shù)據(jù)的的表學(xué)達,比起單皆純的文字報升道來,表現(xiàn)咳清晰,說服叫力強。違5.2.2重事實判斷腸一個孤立的瞧事件當(dāng)中的堂少量信息往流往缺少關(guān)聯(lián)崗度,但如果董從正確的角渡度觀察卻能晉發(fā)現(xiàn)極為重青要的價值。給透過數(shù)據(jù),握內(nèi)容運營者箱可以發(fā)現(xiàn)僅拴憑知覺和傳包聞難以感知勤的、隱藏在境事件/新聞慕背后線索或溫假設(shè),抽絲蜜剝繭、言之撇鑿鑿的把事戴件的來龍去挽脈和其中緣懶由講述透徹示。通2016年結(jié)7月25號沉在DT財經(jīng)嘆上有一篇文庸章,文章標遷題為《10卻萬條掛號大寒?dāng)?shù)據(jù)顯示:啊互聯(lián)網(wǎng)也救槐不了看病難突》,文章中評全篇引用了鋪掛號網(wǎng)各個瘦維度的一手妖10W數(shù)據(jù)爆。采用循序呢漸進的邏輯姥描述并分析時看病難互聯(lián)便網(wǎng)也很難解睬決這一難題蔬。重要的是丑,作者將這鞋些數(shù)據(jù)制作砍成可視化的荷數(shù)據(jù)圖表,下從掛號網(wǎng)注乏冊醫(yī)院分布純、支持網(wǎng)絡(luò)侵預(yù)約功能的險醫(yī)院占比到紀預(yù)約掛號量宮超10萬的多醫(yī)院和人數(shù)群分布情況,禍最后到患者猶參與分享的探比例及對候芽診時間的滿沈意度分析,歇將這些數(shù)據(jù)女轉(zhuǎn)化為數(shù)據(jù)純地圖、點狀烏圖、旋風(fēng)圖宏和趣味條形料圖等可視化穴形式呈現(xiàn)出風(fēng)來。扭《10萬條繡掛號大數(shù)據(jù)婦顯示:互聯(lián)蘭網(wǎng)也救不了乏看病難》中兩的可視化圖家表著從這個例子容可以看出,足數(shù)據(jù)新聞的稈報道方式能薪夠在宏觀上革對某個事件凍看得更加清攔楚與全面,屑事件復(fù)雜的兇演進過程以欣及這個過程嚇中的各個方昂面,都能描翻述得直觀且雨有趣,最重閉要的是,很姜能讓異見者兇服氣。背5.2.3煌預(yù)測走向冷通過數(shù)據(jù)的鼠挖掘和分析電,尋找出有攏價值的相關(guān)價性,繼而增繭加對相關(guān)事迅件發(fā)展趨勢伸的預(yù)測性,壞新聞和數(shù)據(jù)迎相結(jié)合創(chuàng)作保出精確和深家度報道,成質(zhì)為大數(shù)據(jù)時屬代的新聞業(yè)登務(wù)發(fā)展方向艇。階下圖是CN卷N在今年7違月份關(guān)于美改國總統(tǒng)大選怖預(yù)測的數(shù)據(jù)念新聞,全篇贏大篇幅的介宋紹了當(dāng)下美匙國社交媒體司上各州對候丸選人的支持緒情況、通過玉復(fù)雜算法得議出的候選人隙各州獲勝的梢概率以及哪圍個州對于總輸統(tǒng)選舉具有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院茶水間功能提升方案
- 兒童醫(yī)院兒童游樂設(shè)施建設(shè)方案
- 醫(yī)院庭院綠化提升方案
- 中醫(yī)院運營效率提升方案
- 醫(yī)院集中供暖系統(tǒng)改造方案
- 醫(yī)院心理咨詢室設(shè)計方案
- 婦幼保健院消毒流程優(yōu)化方案
- 婦幼保健院評審標準制定方案
- 水利工程設(shè)施維護與運行手冊
- 企業(yè)員工職業(yè)規(guī)劃與職業(yè)發(fā)展策略指導(dǎo)手冊
- 2026年上半年眉山天府新區(qū)公開選調(diào)事業(yè)單位工作人員的參考題庫附答案
- 水產(chǎn)養(yǎng)殖技術(shù)手冊
- 2025年及未來5年市場數(shù)據(jù)中國吸塑、注塑行業(yè)發(fā)展前景預(yù)測及投資戰(zhàn)略數(shù)據(jù)分析研究報告
- 物流金融理論與實務(wù)課件
- 海內(nèi)外云廠商發(fā)展與現(xiàn)狀(三):資本開支壓力與海外云廠需求情況拆解-國信證券
- 2025年社區(qū)網(wǎng)格員招錄考試真題庫(含答案)
- GB/T 46510-2025玩具水基材料中游離甲醛的測定高效液相色譜法
- 溴化鋰清洗施工方案
- 第四方支付業(yè)務(wù)合規(guī)指引
- 手勢舞基本功課件
- 人教版七年級英語上冊全冊語法知識點梳理
評論
0/150
提交評論