版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
ICS35.240.01
CCSM11
4401
廣州市地方標準
DB4401/T12—2023
代替DB4401/T12—2018
網(wǎng)絡(luò)輿情分級與判定
Classificationandjudgmentfornetworkpublicopinion
2023-05-31發(fā)布2023-07-01實施
廣州市市場監(jiān)督管理局發(fā)布
DB4401/T12—2023
目次
前言..................................................................................Ⅲ
1范圍.................................................................................1
2規(guī)范性引用文件.......................................................................1
3術(shù)語和定義...........................................................................1
4總體原則.............................................................................1
4.1科學(xué)性原則.......................................................................1
4.2充分性原則.......................................................................2
4.3可度量原則.......................................................................2
4.4可預(yù)測原則.......................................................................2
4.5穩(wěn)健性原則.......................................................................2
5網(wǎng)絡(luò)輿情分級與判定的一般流程.........................................................2
6網(wǎng)絡(luò)輿情評價指標.....................................................................3
7指標量化.............................................................................3
7.1媒體傳播評價(Em)...............................................................3
7.2輿論強度評價(Es)...............................................................5
7.3民意態(tài)度評價(Ea)...............................................................7
7.4輿情演變評價(Ed)...............................................................8
8綜合評價.............................................................................9
8.1綜合評價要求.....................................................................9
8.2自動化系統(tǒng)評價...................................................................9
8.3專家輔助評價....................................................................10
9等級劃分與程度評估..................................................................10
9.1等級劃分........................................................................10
9.2程度評估........................................................................11
附錄A(資料性)詞頻-逆文檔頻率指數(shù)(TF-IDF)統(tǒng)計學(xué)方法.............................12
附錄B(資料性)專家輔助評分表......................................................13
I
DB4401/T12—2023
前言
本文件按照GB/T1.1-2020《標準化工作導(dǎo)則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起
草。
本文件代替DB4401/T12-2018《網(wǎng)絡(luò)輿情分級與判定》。
本文件與DB4401/T12-2018相比,主要變化如下:
——更改了術(shù)語和定義(見第3章,2018年版第2章);
——增加了總體原則(見第4章);
——更改了網(wǎng)絡(luò)輿情分級與判定的一般流程(見第5章,2018年版第3章);
——更改了網(wǎng)絡(luò)輿情評價指標(見第6章,2018年版第4章);
——更改指標公式,增加分析方法和大數(shù)據(jù)數(shù)學(xué)模型算法(見第7章,2018年版第5章);
——更改了綜合評價,增加專家評價系統(tǒng)定性分析模塊(見第8章,2018年版第6章);
——更改了等級劃分的表述(見9.1,2018年版的7.1);
——更改了程度評估的表述(見9.2,2018年版的7.2);
——更改了風(fēng)險程度評估尺度表(見表1,2018年版的表2);
——更改了資料性附錄中文檔主題生成模型(見附錄A);
——更改了資料性附錄中基于層次分析法(AHP)的權(quán)重計算方法(見附錄B)。
請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構(gòu)不承擔(dān)識別專利的責(zé)任。
本文件由中共廣州市委網(wǎng)絡(luò)安全和信息化委員會辦公室提出并歸口。
本文件起草單位:廣州市網(wǎng)絡(luò)輿情信息中心、廣州市標準化研究院、廣州市廣播電視臺、暨南大學(xué)
計算傳播研究中心、華南理工大學(xué)數(shù)據(jù)分析與信息可視化研究中心、云潤大數(shù)據(jù)服務(wù)有限公司。
本文件主要起草人:陸志強、陳小文、趙甜芳、支庭榮、吳小坤、陳偉能、申智平、肖娟、漆巍、
徐湛、黃楚恒、王祥麟、高淡絢、李宜軒、曾慶賢、梁市、吳鈺、林毅、李永康。
本文件及其所代替文件的歷次版本發(fā)布情況為:
——2018年首次發(fā)布為DB4401/T12-2018,本次為第一次修訂。
Ⅲ
DB4401/T12—2023
網(wǎng)絡(luò)輿情分級與判定
1范圍
本文件規(guī)定了網(wǎng)絡(luò)輿情分級與判定的一般流程、網(wǎng)絡(luò)輿情評價指標、指標量化、綜合評價、等級劃
分與程度評估等內(nèi)容。
本文件適用于廣州市網(wǎng)絡(luò)輿情的監(jiān)測、評估、預(yù)警及相關(guān)軟件開發(fā)等。
2規(guī)范性引用文件
本文件沒有規(guī)范性引用文件。
3術(shù)語和定義
下列術(shù)語和定義適用于本文件。
3.1
媒體傳播評價evaluationofcommunicationmedia
特定輿情事件中媒體的介入程度,以及范圍和信息在媒體上的傳播程度,包含但不僅限于以下四個
指標:媒體集中度、媒體權(quán)威度、媒體稿件差異度、媒體地域范圍。
3.2
輿論強度評價evaluationofpublicopinionstrength
特定輿情事件在時間和空間上的輿論強烈程度,包含但不僅限于以下四個指標:話題敏感程度、單
位時間波動程度、平均持續(xù)時長、輿論強度專家評價。
3.3
民意態(tài)度評價evaluationofpublicattitudeDB4401orientation
特定輿情事件中的主體意愿表達強度和態(tài)度傾向,包含但不僅限于以下四個指標:活躍網(wǎng)民占比、
網(wǎng)民互動質(zhì)量、網(wǎng)民情感極性、民意態(tài)度專家評價。
3.4
輿情演變評價evaluationofpublicopiniondevelopment
特定輿情事件的后續(xù)演化趨勢,包含但不僅限于以下兩個指標:輿情熱度演化趨勢、網(wǎng)民情感演化
趨勢。
4總體原則
4.1科學(xué)性原則
所選指標具有良好的科學(xué)性和合理性,準確描述指標適用場景,合理運用科學(xué)計算方法,客觀評價
網(wǎng)絡(luò)輿情影響要素,實現(xiàn)網(wǎng)絡(luò)輿情的科學(xué)評價。
1
DB4401/T12—2023
4.2充分性原則
所選指標具有良好的完備性和簡約性,綜合考慮單項指標覆蓋面及多項指標重疊度,建立簡約且完
整的指標集,刻畫網(wǎng)絡(luò)輿情整體畫像。
4.3可度量原則
所選指標具有良好的可量化性和可操作性,量化網(wǎng)絡(luò)輿情相關(guān)的不確定性因素,適配多樣化的輿情
監(jiān)測環(huán)境,保證輿情評價的有效性和可行性。
4.4可預(yù)測原則
所選指標具有良好的推演和預(yù)測性,剖析網(wǎng)絡(luò)輿情核心要素特征,預(yù)測網(wǎng)絡(luò)輿情發(fā)展趨勢,滿足網(wǎng)
絡(luò)輿情的風(fēng)險評估和預(yù)警需求,服務(wù)于相關(guān)職能部門的風(fēng)險評估和決策響應(yīng)。
4.5穩(wěn)健性原則
所選指標具有良好的穩(wěn)定性和魯棒性,適應(yīng)復(fù)雜多變的網(wǎng)絡(luò)輿情傳播過程,適應(yīng)動態(tài)開放的網(wǎng)絡(luò)輿
情環(huán)境,反映網(wǎng)絡(luò)輿情本質(zhì)特征。
5網(wǎng)絡(luò)輿情分級與判定的一般流程
網(wǎng)絡(luò)輿情評價應(yīng)遵循一定的工作流程,主要包括輿情監(jiān)測、輿情評價、輿情研判三個環(huán)節(jié),如圖1
所示。
圖1網(wǎng)絡(luò)輿情評價的一般流程
2
DB4401/T12—2023
6網(wǎng)絡(luò)輿情評價指標
網(wǎng)絡(luò)輿情評價指標包括媒體傳播評價、輿論強度評價、民意態(tài)度評價、輿情演變評價4個二級指標。
各二級指標又包含各自的子參數(shù),即三級指標,構(gòu)成了網(wǎng)絡(luò)輿情評價指標。網(wǎng)絡(luò)輿情評價指標的三級指
標應(yīng)包含但不限于圖2所列的14個三級評價指標。
媒體集中度(M1)
媒體權(quán)威度(M2)
媒體傳播評價(Em)
媒體稿件差異度(M3)
媒體地域關(guān)聯(lián)度(M4)
話題敏感程度(S1)
網(wǎng)
絡(luò)單位時間波動程度(S2)
輿輿論強度評價(Es)
平均持續(xù)時長(S3)
情
評
輿論強度專家評價(S4)
價
指
活躍網(wǎng)民占比(A1)
標
網(wǎng)民互動質(zhì)量(A2)
民意態(tài)度評價(Ea)
網(wǎng)民情感極性(A3)
民意態(tài)度專家評價(A4)
輿情熱度演化趨勢(D1)
輿情演變評價(Ed)
網(wǎng)民情感演化趨勢(D2)
DB4401
圖2網(wǎng)絡(luò)輿情評價指標
7指標量化
7.1媒體傳播評價()
Em
7.1.1媒體集中度()
M1
媒體集中度反映參與媒體的集中程度,采用赫爾芬達爾-赫希曼指數(shù)的公式進行計算,可按公式(1)
計算。媒體集中度越高,意味著媒體的壟斷力量越大、競爭程度越低、差異化程度越低、越容易形成輿
論控制行為。
3
DB4401/T12—2023
2
NmR
i····················································(1)
M1
i1Rc
式中:
M1——媒體集中度,數(shù)值范圍在[0,1]區(qū)間內(nèi);
Nm——媒體總數(shù);
Ri——第i家媒體發(fā)布的新聞報道數(shù);
Rc——所有媒體發(fā)布的新聞報道總數(shù)。
7.1.2媒體權(quán)威度(M2)
媒體權(quán)威度反映了網(wǎng)絡(luò)媒體的可信度和影響力,可按照公式(2)進行計算。媒體權(quán)威度越高,表明
輿情事件的受重視程度越高。
1Nm
·····················································(2)
M2wi
Nmi1
式中:
M2——媒體權(quán)威度,數(shù)值范圍在[0,1]區(qū)間內(nèi);
Nm——媒體總數(shù);
wi——媒體權(quán)重,由輿情監(jiān)測主體根據(jù)預(yù)定義的媒體分類表,經(jīng)過歸一化處理后賦值,數(shù)值范圍
在[0,1]區(qū)間內(nèi)。
7.1.3媒體稿件差異度()
M3
媒體稿件差異度反映了媒體稿件信息的多樣化程度。媒體稿件差異度越低,表明輿情信息具有較高
的相似程度和同質(zhì)化程度,如果沒有新的事件信息,該輿情事件較容易衰退;反之則表明媒體進行二次
創(chuàng)作的空間很大,該輿情事件仍具有持續(xù)演化發(fā)展的潛力。
基于詞頻-逆文檔頻率指數(shù)統(tǒng)計學(xué)方法(TermFrequency–InverseDocumentFrequency,TF-IDF)的
雙詞向量余弦相似度方法已被證明可用于文本相似度的計算,可按照公式(3)和公式(4)進行計算。首先
通過TF-IDF方法統(tǒng)計所有稿件的關(guān)鍵詞,得到統(tǒng)一的詞向量;隨后將不同稿件的詞向量兩兩組合,得
到N(N1)2個組合的雙詞向量余弦相似度。TF-IDF統(tǒng)計學(xué)方法見附錄A。按照公式(3)計算任意兩個媒
體稿件的詞向量的余弦相似度。由于媒體稿件的差異度與相似度是互補關(guān)系,最后可按照公式(4)計算
所有媒體稿件之間的差異度。
n
AjBj
ii··············································
j1(3)
Si
nn
j2j2
(Ai)(Bi)
j1j1
式中:
Si——第i個組合中的兩個詞向量的余弦相似度;
n——統(tǒng)一的詞向量的長度;
j
Ai——第i個組合中,稿件A對應(yīng)詞向量的第j個位置的取值;
j
Bi——第i個組合中,稿件B對應(yīng)詞向量的第j個位置的取值。
2N(N1)/2
··············································(4)
M31Si
N(N1)i1
4
DB4401/T12—2023
式中:
M3——媒體稿件差異度,數(shù)值范圍在[0,1]區(qū)間內(nèi);
N——媒體發(fā)布稿件的總數(shù);
Si——第i個稿件組合中兩個詞向量的余弦相似度。
其它計算方法經(jīng)驗證后可用于媒體稿件差異度的計算。
7.1.4媒體地域關(guān)聯(lián)度(M4)
媒體地域范圍反映了媒體歸屬地與輿情事件發(fā)生地之間的關(guān)聯(lián)程度,同時也反映事件的社會整體關(guān)
注程度和范圍,按照公式(5)進行計算。
1Nm
112233··········································(5)
M4(wiDiwiDiwiDi)
Nmi1
式中:
M4——媒體地域范圍,數(shù)值范圍在[0,1]區(qū)間內(nèi);
Nm——媒體總數(shù);
123123
wi,wi,wi——分別對應(yīng)不同地域的媒體權(quán)重,由輿情監(jiān)測主體設(shè)定,wi,wi,wi[0,1];
1231
Di[Di,Di,Di]——單位向量,只有一個位置為1,其他位置為0;其中,Di為輿情事件所在市(本
23
地)的媒體數(shù);Di為輿情事件所在省份的其他市(周邊)的媒體數(shù);Di為輿情事件所在省份之外的其
他地方媒體、全國性媒體、國際性媒體等媒體數(shù)。
7.2輿論強度評價(ES)
7.2.1話題敏感程度(S1)
話題敏感程度指標反映輿情事件的敏感程度,話題敏感度越高,其風(fēng)險等級越高。
機器學(xué)習(xí)模型預(yù)測方法已被證明可用于話題敏感程度的計算,可按照公式(6)進行計算。其它符
合準確率要求的方法可用于話題敏感程度的計算。
DB4401············································
S1sensitivity_predictor(X)(6)
式中:
S1——話題敏感程度,數(shù)值范圍在[0,1]區(qū)間內(nèi);
X——預(yù)測文本集合;
sensitivity_predictor(X)——用于敏感程度預(yù)測的機器學(xué)習(xí)模型,通過人工打標簽的敏感話題數(shù)據(jù)
集訓(xùn)練得到。
7.2.2單位時間波動程度()
S2
單位時間波動程度反映了過去一段時間內(nèi)輿情熱度的波動情況。單位時間內(nèi)的波動程度越高,表示
事件越不穩(wěn)定。計算平均波動程度應(yīng)先對采用數(shù)據(jù)歸一化,將歷史數(shù)據(jù)轉(zhuǎn)化為[0,1]區(qū)間內(nèi)的數(shù)值,可
按照公式(7)計算。完成數(shù)據(jù)歸一化后,采用離散系數(shù)計算公示計算出單位時間波動程度,可按照公
式(8)計算。
5
DB4401/T12—2023
xmin(X)
ktt,t············································
x?k(7)
max(Xtt,t)min(Xtt,t)
式中:
x?k——描述第k時刻經(jīng)過歸一化的輿情熱度,取值范圍在[0,1]區(qū)間內(nèi);
xk——描述第k時刻的輿情熱度,取值范圍在[0,)區(qū)間內(nèi);
Xtt,t——描述從第tt時刻到t時刻的輿情熱度,其中tt。
注:公式(7)為經(jīng)典的最大最小歸一化方法,已被證明可用于單位時間波動程度的數(shù)據(jù)歸一化處理,其它數(shù)據(jù)歸
一化方法可由輿情檢測主體確認其有效性后使用。
(tt,t)
S·····················································(8)
2(tt,t)
式中:
S2——單位時間波動程度,限定數(shù)值范圍在[0,1]區(qū)間內(nèi),超出后賦值為其最近的區(qū)間邊界值;
(tt,t)——從tt到t時刻的歷史數(shù)據(jù)的方差;
(tt,t)——從tt到t時刻的歷史數(shù)據(jù)的均值。
注:單位時間周期由輿情監(jiān)測主體確定,可用“一周”、“三天”、“一天”、“小時”等作為時間單位。
7.2.3平均持續(xù)時長(S3)
平均持續(xù)時長反映了輿情事件的持久度,按照公式(9)進行計算。
1K
············································(9)
S3Sig(Ts(k)Te(k))
Kk1
式中:
S3——平均持續(xù)時長,數(shù)值范圍在[0,1]區(qū)間內(nèi);
K——已觀測到的波動數(shù),且K1;
Ts(k)——第k次波動的起始時間,且1kK;
Te(k)——第k次波動的終止時間,且1kK;
Sig(x)——歸一化函數(shù)。
2
注1:表達式為