DB4401∕T 12-2023 網(wǎng)絡(luò)輿情分級與判定_第1頁
DB4401∕T 12-2023 網(wǎng)絡(luò)輿情分級與判定_第2頁
DB4401∕T 12-2023 網(wǎng)絡(luò)輿情分級與判定_第3頁
DB4401∕T 12-2023 網(wǎng)絡(luò)輿情分級與判定_第4頁
DB4401∕T 12-2023 網(wǎng)絡(luò)輿情分級與判定_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

ICS35.240.01

CCSM11

4401

廣州市地方標準

DB4401/T12—2023

代替DB4401/T12—2018

網(wǎng)絡(luò)輿情分級與判定

Classificationandjudgmentfornetworkpublicopinion

2023-05-31發(fā)布2023-07-01實施

廣州市市場監(jiān)督管理局發(fā)布

DB4401/T12—2023

目次

前言..................................................................................Ⅲ

1范圍.................................................................................1

2規(guī)范性引用文件.......................................................................1

3術(shù)語和定義...........................................................................1

4總體原則.............................................................................1

4.1科學(xué)性原則.......................................................................1

4.2充分性原則.......................................................................2

4.3可度量原則.......................................................................2

4.4可預(yù)測原則.......................................................................2

4.5穩(wěn)健性原則.......................................................................2

5網(wǎng)絡(luò)輿情分級與判定的一般流程.........................................................2

6網(wǎng)絡(luò)輿情評價指標.....................................................................3

7指標量化.............................................................................3

7.1媒體傳播評價(Em)...............................................................3

7.2輿論強度評價(Es)...............................................................5

7.3民意態(tài)度評價(Ea)...............................................................7

7.4輿情演變評價(Ed)...............................................................8

8綜合評價.............................................................................9

8.1綜合評價要求.....................................................................9

8.2自動化系統(tǒng)評價...................................................................9

8.3專家輔助評價....................................................................10

9等級劃分與程度評估..................................................................10

9.1等級劃分........................................................................10

9.2程度評估........................................................................11

附錄A(資料性)詞頻-逆文檔頻率指數(shù)(TF-IDF)統(tǒng)計學(xué)方法.............................12

附錄B(資料性)專家輔助評分表......................................................13

I

DB4401/T12—2023

前言

本文件按照GB/T1.1-2020《標準化工作導(dǎo)則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起

草。

本文件代替DB4401/T12-2018《網(wǎng)絡(luò)輿情分級與判定》。

本文件與DB4401/T12-2018相比,主要變化如下:

——更改了術(shù)語和定義(見第3章,2018年版第2章);

——增加了總體原則(見第4章);

——更改了網(wǎng)絡(luò)輿情分級與判定的一般流程(見第5章,2018年版第3章);

——更改了網(wǎng)絡(luò)輿情評價指標(見第6章,2018年版第4章);

——更改指標公式,增加分析方法和大數(shù)據(jù)數(shù)學(xué)模型算法(見第7章,2018年版第5章);

——更改了綜合評價,增加專家評價系統(tǒng)定性分析模塊(見第8章,2018年版第6章);

——更改了等級劃分的表述(見9.1,2018年版的7.1);

——更改了程度評估的表述(見9.2,2018年版的7.2);

——更改了風(fēng)險程度評估尺度表(見表1,2018年版的表2);

——更改了資料性附錄中文檔主題生成模型(見附錄A);

——更改了資料性附錄中基于層次分析法(AHP)的權(quán)重計算方法(見附錄B)。

請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構(gòu)不承擔(dān)識別專利的責(zé)任。

本文件由中共廣州市委網(wǎng)絡(luò)安全和信息化委員會辦公室提出并歸口。

本文件起草單位:廣州市網(wǎng)絡(luò)輿情信息中心、廣州市標準化研究院、廣州市廣播電視臺、暨南大學(xué)

計算傳播研究中心、華南理工大學(xué)數(shù)據(jù)分析與信息可視化研究中心、云潤大數(shù)據(jù)服務(wù)有限公司。

本文件主要起草人:陸志強、陳小文、趙甜芳、支庭榮、吳小坤、陳偉能、申智平、肖娟、漆巍、

徐湛、黃楚恒、王祥麟、高淡絢、李宜軒、曾慶賢、梁市、吳鈺、林毅、李永康。

本文件及其所代替文件的歷次版本發(fā)布情況為:

——2018年首次發(fā)布為DB4401/T12-2018,本次為第一次修訂。

DB4401/T12—2023

網(wǎng)絡(luò)輿情分級與判定

1范圍

本文件規(guī)定了網(wǎng)絡(luò)輿情分級與判定的一般流程、網(wǎng)絡(luò)輿情評價指標、指標量化、綜合評價、等級劃

分與程度評估等內(nèi)容。

本文件適用于廣州市網(wǎng)絡(luò)輿情的監(jiān)測、評估、預(yù)警及相關(guān)軟件開發(fā)等。

2規(guī)范性引用文件

本文件沒有規(guī)范性引用文件。

3術(shù)語和定義

下列術(shù)語和定義適用于本文件。

3.1

媒體傳播評價evaluationofcommunicationmedia

特定輿情事件中媒體的介入程度,以及范圍和信息在媒體上的傳播程度,包含但不僅限于以下四個

指標:媒體集中度、媒體權(quán)威度、媒體稿件差異度、媒體地域范圍。

3.2

輿論強度評價evaluationofpublicopinionstrength

特定輿情事件在時間和空間上的輿論強烈程度,包含但不僅限于以下四個指標:話題敏感程度、單

位時間波動程度、平均持續(xù)時長、輿論強度專家評價。

3.3

民意態(tài)度評價evaluationofpublicattitudeDB4401orientation

特定輿情事件中的主體意愿表達強度和態(tài)度傾向,包含但不僅限于以下四個指標:活躍網(wǎng)民占比、

網(wǎng)民互動質(zhì)量、網(wǎng)民情感極性、民意態(tài)度專家評價。

3.4

輿情演變評價evaluationofpublicopiniondevelopment

特定輿情事件的后續(xù)演化趨勢,包含但不僅限于以下兩個指標:輿情熱度演化趨勢、網(wǎng)民情感演化

趨勢。

4總體原則

4.1科學(xué)性原則

所選指標具有良好的科學(xué)性和合理性,準確描述指標適用場景,合理運用科學(xué)計算方法,客觀評價

網(wǎng)絡(luò)輿情影響要素,實現(xiàn)網(wǎng)絡(luò)輿情的科學(xué)評價。

1

DB4401/T12—2023

4.2充分性原則

所選指標具有良好的完備性和簡約性,綜合考慮單項指標覆蓋面及多項指標重疊度,建立簡約且完

整的指標集,刻畫網(wǎng)絡(luò)輿情整體畫像。

4.3可度量原則

所選指標具有良好的可量化性和可操作性,量化網(wǎng)絡(luò)輿情相關(guān)的不確定性因素,適配多樣化的輿情

監(jiān)測環(huán)境,保證輿情評價的有效性和可行性。

4.4可預(yù)測原則

所選指標具有良好的推演和預(yù)測性,剖析網(wǎng)絡(luò)輿情核心要素特征,預(yù)測網(wǎng)絡(luò)輿情發(fā)展趨勢,滿足網(wǎng)

絡(luò)輿情的風(fēng)險評估和預(yù)警需求,服務(wù)于相關(guān)職能部門的風(fēng)險評估和決策響應(yīng)。

4.5穩(wěn)健性原則

所選指標具有良好的穩(wěn)定性和魯棒性,適應(yīng)復(fù)雜多變的網(wǎng)絡(luò)輿情傳播過程,適應(yīng)動態(tài)開放的網(wǎng)絡(luò)輿

情環(huán)境,反映網(wǎng)絡(luò)輿情本質(zhì)特征。

5網(wǎng)絡(luò)輿情分級與判定的一般流程

網(wǎng)絡(luò)輿情評價應(yīng)遵循一定的工作流程,主要包括輿情監(jiān)測、輿情評價、輿情研判三個環(huán)節(jié),如圖1

所示。

圖1網(wǎng)絡(luò)輿情評價的一般流程

2

DB4401/T12—2023

6網(wǎng)絡(luò)輿情評價指標

網(wǎng)絡(luò)輿情評價指標包括媒體傳播評價、輿論強度評價、民意態(tài)度評價、輿情演變評價4個二級指標。

各二級指標又包含各自的子參數(shù),即三級指標,構(gòu)成了網(wǎng)絡(luò)輿情評價指標。網(wǎng)絡(luò)輿情評價指標的三級指

標應(yīng)包含但不限于圖2所列的14個三級評價指標。

媒體集中度(M1)

媒體權(quán)威度(M2)

媒體傳播評價(Em)

媒體稿件差異度(M3)

媒體地域關(guān)聯(lián)度(M4)

話題敏感程度(S1)

網(wǎng)

絡(luò)單位時間波動程度(S2)

輿輿論強度評價(Es)

平均持續(xù)時長(S3)

輿論強度專家評價(S4)

活躍網(wǎng)民占比(A1)

網(wǎng)民互動質(zhì)量(A2)

民意態(tài)度評價(Ea)

網(wǎng)民情感極性(A3)

民意態(tài)度專家評價(A4)

輿情熱度演化趨勢(D1)

輿情演變評價(Ed)

網(wǎng)民情感演化趨勢(D2)

DB4401

圖2網(wǎng)絡(luò)輿情評價指標

7指標量化

7.1媒體傳播評價()

Em

7.1.1媒體集中度()

M1

媒體集中度反映參與媒體的集中程度,采用赫爾芬達爾-赫希曼指數(shù)的公式進行計算,可按公式(1)

計算。媒體集中度越高,意味著媒體的壟斷力量越大、競爭程度越低、差異化程度越低、越容易形成輿

論控制行為。

3

DB4401/T12—2023

2

NmR

i····················································(1)

M1

i1Rc

式中:

M1——媒體集中度,數(shù)值范圍在[0,1]區(qū)間內(nèi);

Nm——媒體總數(shù);

Ri——第i家媒體發(fā)布的新聞報道數(shù);

Rc——所有媒體發(fā)布的新聞報道總數(shù)。

7.1.2媒體權(quán)威度(M2)

媒體權(quán)威度反映了網(wǎng)絡(luò)媒體的可信度和影響力,可按照公式(2)進行計算。媒體權(quán)威度越高,表明

輿情事件的受重視程度越高。

1Nm

·····················································(2)

M2wi

Nmi1

式中:

M2——媒體權(quán)威度,數(shù)值范圍在[0,1]區(qū)間內(nèi);

Nm——媒體總數(shù);

wi——媒體權(quán)重,由輿情監(jiān)測主體根據(jù)預(yù)定義的媒體分類表,經(jīng)過歸一化處理后賦值,數(shù)值范圍

在[0,1]區(qū)間內(nèi)。

7.1.3媒體稿件差異度()

M3

媒體稿件差異度反映了媒體稿件信息的多樣化程度。媒體稿件差異度越低,表明輿情信息具有較高

的相似程度和同質(zhì)化程度,如果沒有新的事件信息,該輿情事件較容易衰退;反之則表明媒體進行二次

創(chuàng)作的空間很大,該輿情事件仍具有持續(xù)演化發(fā)展的潛力。

基于詞頻-逆文檔頻率指數(shù)統(tǒng)計學(xué)方法(TermFrequency–InverseDocumentFrequency,TF-IDF)的

雙詞向量余弦相似度方法已被證明可用于文本相似度的計算,可按照公式(3)和公式(4)進行計算。首先

通過TF-IDF方法統(tǒng)計所有稿件的關(guān)鍵詞,得到統(tǒng)一的詞向量;隨后將不同稿件的詞向量兩兩組合,得

到N(N1)2個組合的雙詞向量余弦相似度。TF-IDF統(tǒng)計學(xué)方法見附錄A。按照公式(3)計算任意兩個媒

體稿件的詞向量的余弦相似度。由于媒體稿件的差異度與相似度是互補關(guān)系,最后可按照公式(4)計算

所有媒體稿件之間的差異度。

n

AjBj

ii··············································

j1(3)

Si

nn

j2j2

(Ai)(Bi)

j1j1

式中:

Si——第i個組合中的兩個詞向量的余弦相似度;

n——統(tǒng)一的詞向量的長度;

j

Ai——第i個組合中,稿件A對應(yīng)詞向量的第j個位置的取值;

j

Bi——第i個組合中,稿件B對應(yīng)詞向量的第j個位置的取值。

2N(N1)/2

··············································(4)

M31Si

N(N1)i1

4

DB4401/T12—2023

式中:

M3——媒體稿件差異度,數(shù)值范圍在[0,1]區(qū)間內(nèi);

N——媒體發(fā)布稿件的總數(shù);

Si——第i個稿件組合中兩個詞向量的余弦相似度。

其它計算方法經(jīng)驗證后可用于媒體稿件差異度的計算。

7.1.4媒體地域關(guān)聯(lián)度(M4)

媒體地域范圍反映了媒體歸屬地與輿情事件發(fā)生地之間的關(guān)聯(lián)程度,同時也反映事件的社會整體關(guān)

注程度和范圍,按照公式(5)進行計算。

1Nm

112233··········································(5)

M4(wiDiwiDiwiDi)

Nmi1

式中:

M4——媒體地域范圍,數(shù)值范圍在[0,1]區(qū)間內(nèi);

Nm——媒體總數(shù);

123123

wi,wi,wi——分別對應(yīng)不同地域的媒體權(quán)重,由輿情監(jiān)測主體設(shè)定,wi,wi,wi[0,1];

1231

Di[Di,Di,Di]——單位向量,只有一個位置為1,其他位置為0;其中,Di為輿情事件所在市(本

23

地)的媒體數(shù);Di為輿情事件所在省份的其他市(周邊)的媒體數(shù);Di為輿情事件所在省份之外的其

他地方媒體、全國性媒體、國際性媒體等媒體數(shù)。

7.2輿論強度評價(ES)

7.2.1話題敏感程度(S1)

話題敏感程度指標反映輿情事件的敏感程度,話題敏感度越高,其風(fēng)險等級越高。

機器學(xué)習(xí)模型預(yù)測方法已被證明可用于話題敏感程度的計算,可按照公式(6)進行計算。其它符

合準確率要求的方法可用于話題敏感程度的計算。

DB4401············································

S1sensitivity_predictor(X)(6)

式中:

S1——話題敏感程度,數(shù)值范圍在[0,1]區(qū)間內(nèi);

X——預(yù)測文本集合;

sensitivity_predictor(X)——用于敏感程度預(yù)測的機器學(xué)習(xí)模型,通過人工打標簽的敏感話題數(shù)據(jù)

集訓(xùn)練得到。

7.2.2單位時間波動程度()

S2

單位時間波動程度反映了過去一段時間內(nèi)輿情熱度的波動情況。單位時間內(nèi)的波動程度越高,表示

事件越不穩(wěn)定。計算平均波動程度應(yīng)先對采用數(shù)據(jù)歸一化,將歷史數(shù)據(jù)轉(zhuǎn)化為[0,1]區(qū)間內(nèi)的數(shù)值,可

按照公式(7)計算。完成數(shù)據(jù)歸一化后,采用離散系數(shù)計算公示計算出單位時間波動程度,可按照公

式(8)計算。

5

DB4401/T12—2023

xmin(X)

ktt,t············································

x?k(7)

max(Xtt,t)min(Xtt,t)

式中:

x?k——描述第k時刻經(jīng)過歸一化的輿情熱度,取值范圍在[0,1]區(qū)間內(nèi);

xk——描述第k時刻的輿情熱度,取值范圍在[0,)區(qū)間內(nèi);

Xtt,t——描述從第tt時刻到t時刻的輿情熱度,其中tt。

注:公式(7)為經(jīng)典的最大最小歸一化方法,已被證明可用于單位時間波動程度的數(shù)據(jù)歸一化處理,其它數(shù)據(jù)歸

一化方法可由輿情檢測主體確認其有效性后使用。

(tt,t)

S·····················································(8)

2(tt,t)

式中:

S2——單位時間波動程度,限定數(shù)值范圍在[0,1]區(qū)間內(nèi),超出后賦值為其最近的區(qū)間邊界值;

(tt,t)——從tt到t時刻的歷史數(shù)據(jù)的方差;

(tt,t)——從tt到t時刻的歷史數(shù)據(jù)的均值。

注:單位時間周期由輿情監(jiān)測主體確定,可用“一周”、“三天”、“一天”、“小時”等作為時間單位。

7.2.3平均持續(xù)時長(S3)

平均持續(xù)時長反映了輿情事件的持久度,按照公式(9)進行計算。

1K

············································(9)

S3Sig(Ts(k)Te(k))

Kk1

式中:

S3——平均持續(xù)時長,數(shù)值范圍在[0,1]區(qū)間內(nèi);

K——已觀測到的波動數(shù),且K1;

Ts(k)——第k次波動的起始時間,且1kK;

Te(k)——第k次波動的終止時間,且1kK;

Sig(x)——歸一化函數(shù)。

2

注1:表達式為