新媒體數(shù)據(jù)新聞 教案 全篇_第1頁(yè)
新媒體數(shù)據(jù)新聞 教案 全篇_第2頁(yè)
新媒體數(shù)據(jù)新聞 教案 全篇_第3頁(yè)
新媒體數(shù)據(jù)新聞 教案 全篇_第4頁(yè)
新媒體數(shù)據(jù)新聞 教案 全篇_第5頁(yè)
已閱讀5頁(yè),還剩61頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

XXXX大學(xué)教案

第一章新媒體數(shù)據(jù)新聞概述

一、課時(shí)安排:課時(shí)(理論講授4課時(shí),實(shí)踐2課時(shí))

二、教學(xué)課型:理論、實(shí)踐課

三、教學(xué)目標(biāo):

建立目標(biāo)任務(wù)

(1)初步了解新媒體數(shù)據(jù)新聞。

(2)了解新媒體數(shù)據(jù)新聞的發(fā)展。

(3)了解新媒體數(shù)據(jù)新聞的生成流程。

(4)了解新媒體數(shù)據(jù)新聞典型案例。

四、教學(xué)重點(diǎn)難點(diǎn):明的重難點(diǎn)

(1)新媒體數(shù)據(jù)新聞的發(fā)展。

(2)新媒體數(shù)據(jù)新聞的生成流程。

五、教學(xué)方法:

多媒體教學(xué)(講授法、實(shí)驗(yàn)法)

六、教學(xué)過(guò)程與內(nèi)容:

課程導(dǎo)入:

課程導(dǎo)入,激

新媒體數(shù)據(jù)新聞產(chǎn)生的背景和存在價(jià)值。

發(fā)學(xué)習(xí)興趣。

本章概述:

新媒體產(chǎn)生的海量數(shù)據(jù)和逐漸成熟的數(shù)據(jù)處理分析技術(shù)使得一種整合

各種媒介優(yōu)點(diǎn)、符合信息時(shí)代需求的新聞形態(tài)得以誕生一一數(shù)據(jù)新聞。

本章將對(duì)新媒體數(shù)據(jù)新聞的相關(guān)概念進(jìn)行介紹、分析國(guó)內(nèi)外數(shù)據(jù)新聞

發(fā)展的歷程,并且簡(jiǎn)述新媒體數(shù)據(jù)新聞的生產(chǎn)流程。

講授法,建立

最后將以國(guó)內(nèi)外典型數(shù)據(jù)新聞為例,總結(jié)優(yōu)秀新媒體數(shù)據(jù)新聞作品的

學(xué)習(xí)內(nèi)容的總

特征。

體印象。

從基礎(chǔ)理論出發(fā),以實(shí)際案例加強(qiáng)對(duì)新媒體數(shù)據(jù)新聞的理解。

第一節(jié)新媒體數(shù)據(jù)新聞簡(jiǎn)介

(一)新媒體數(shù)據(jù)新聞的概念與特征

1.新媒體數(shù)據(jù)新聞的概念

“新媒體”主要指基于數(shù)字技術(shù)、網(wǎng)絡(luò)技術(shù)及其他現(xiàn)代信息技術(shù)或通

信技術(shù)的,具有互動(dòng)性、融合性的媒介形態(tài)和平臺(tái)。在現(xiàn)階段,新媒體主

要包括網(wǎng)絡(luò)媒體、手機(jī)媒體及其兩者融合形成的移動(dòng)互聯(lián)網(wǎng),以及其他具

有互動(dòng)性的數(shù)字媒體形式。

數(shù)據(jù)新聞,又稱(chēng)“數(shù)據(jù)驅(qū)動(dòng)新聞”,是基于數(shù)據(jù)信息的采集、分析、呈

現(xiàn)的新聞工作方式。從狹義上看,數(shù)據(jù)新聞是建立在數(shù)據(jù)抓取、數(shù)據(jù)挖掘、

數(shù)據(jù)統(tǒng)計(jì)和分析基礎(chǔ)匕最終以可視化的方式呈現(xiàn)出來(lái)的i種新型新聞報(bào)

道方式。從廣義上看,數(shù)據(jù)新聞代表著新聞業(yè)未來(lái)的發(fā)展方向,是新聞學(xué)在

大數(shù)據(jù)時(shí)代的研究新領(lǐng)域。

2.新媒體數(shù)據(jù)新聞的特征

(1)以海量數(shù)據(jù)為核心驅(qū)動(dòng)力;

(2)以數(shù)據(jù)分析處理技術(shù)為基礎(chǔ);

(3)以數(shù)據(jù)可視化呈現(xiàn)為報(bào)道方式;

(4)以移動(dòng)端為主要傳播渠道;啟發(fā)式教學(xué),

(5)以服務(wù)公眾利益為報(bào)道指向。引導(dǎo)學(xué)生初步

(-)新媒體數(shù)據(jù)新聞的產(chǎn)生背景了蟀數(shù)據(jù)新聞

1.大數(shù)據(jù)時(shí)代的到來(lái)相關(guān)知識(shí)

數(shù)據(jù)新聞是大數(shù)據(jù)時(shí)代新聞界為不斷適應(yīng)媒體環(huán)境變化進(jìn)而產(chǎn)生的一

種新型新聞生產(chǎn)模式。

2.相關(guān)技術(shù)的發(fā)展成熟

新媒體數(shù)據(jù)新聞涉及大數(shù)據(jù)獲取、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)可視化

等多方面的技術(shù)。數(shù)字技術(shù)、云計(jì)算技術(shù)、智能技術(shù)等新技術(shù)的發(fā)展為數(shù)

據(jù)新聞產(chǎn)生提供了技術(shù)性條件?;ヂ?lián)網(wǎng)開(kāi)源軟件市場(chǎng)的成熟也為數(shù)據(jù)新聞

的發(fā)展提供了技術(shù)支持。

3.全球“開(kāi)放數(shù)據(jù)”運(yùn)動(dòng)的興起

向公眾公開(kāi)的政府?dāng)?shù)據(jù)為媒體制作數(shù)據(jù)新聞提供了重要的內(nèi)容來(lái)源。

4.新媒體發(fā)展需求

新媒體時(shí)代信息爆炸、用戶(hù)“淺閱讀”等現(xiàn)象的出現(xiàn)對(duì)新聞提出了新

的要求。數(shù)據(jù)新聞的出現(xiàn)符合媒體信息服務(wù)的本質(zhì),也順應(yīng)了新媒體時(shí)代

的信息傳播規(guī)律

(三)新媒體數(shù)據(jù)新聞的分類(lèi)

1.大數(shù)據(jù)型與小數(shù)據(jù)型

2.自采數(shù)據(jù)型與非自采數(shù)據(jù)型

3.事件選題型與話(huà)題選題型

4.調(diào)查型與常規(guī)型

(四)新媒體數(shù)據(jù)新聞的價(jià)值

1.增強(qiáng)新聞報(bào)導(dǎo)的深度性和宏觀(guān)性

2.增強(qiáng)新聞讀寫(xiě)的交互性能

3.促進(jìn)傳統(tǒng)媒體與新媒體的融合

第二節(jié)新媒體數(shù)據(jù)新聞的發(fā)展

(一)國(guó)外新媒體數(shù)據(jù)新聞的發(fā)展

1.業(yè)界對(duì)新媒體數(shù)據(jù)新聞的嘗試與探索

早在19世紀(jì),國(guó)外新聞業(yè)就開(kāi)始運(yùn)用量化數(shù)據(jù)進(jìn)行報(bào)道,《衛(wèi)報(bào)》1821

年的創(chuàng)刊號(hào)上的一篇調(diào)查未成年教育系統(tǒng)的報(bào)道就被視為該報(bào)最早的數(shù)據(jù)

新聞。不過(guò)這只是初步嘗試,此種報(bào)道方式在當(dāng)時(shí)并未形成規(guī)模。

20()7年,美國(guó)《紐約時(shí)報(bào)》建立了一個(gè)記者加程序員的團(tuán)隊(duì),即現(xiàn)在

的“互動(dòng)新聞技術(shù)部,這個(gè)團(tuán)隊(duì)在《紐約時(shí)報(bào)》網(wǎng)站上為總統(tǒng)選舉、奧運(yùn)

會(huì)等重大新聞制作推出了大量動(dòng)態(tài)、互動(dòng)的信息圖表,每一張圖表都由大案例分析法

量數(shù)據(jù)作支撐?!都~約時(shí)報(bào)》網(wǎng)站為此專(zhuān)門(mén)開(kāi)辟了板塊,匯總此類(lèi)報(bào)道。

2009年,《衛(wèi)報(bào)》網(wǎng)站開(kāi)設(shè)“數(shù)據(jù)商店”版塊,下分“大數(shù)據(jù)”、“數(shù)

據(jù)新聞”、“數(shù)據(jù)博客”等細(xì)分頻道。

2013年,《紐約時(shí)報(bào)》制作的“雪崩”題材新聞報(bào)道獲獎(jiǎng),引發(fā)全球

傳媒界對(duì)數(shù)據(jù)新聞這一新型報(bào)道形態(tài)的關(guān)注。

2.學(xué)界對(duì)新媒體數(shù)據(jù)新聞的研究

(1)數(shù)據(jù)新聞理論研究

目前,國(guó)外關(guān)于數(shù)據(jù)新聞的研究多從兩個(gè)角度切入。

一是從技術(shù)層面進(jìn)行分析,探討數(shù)據(jù)新聞的制作和呈現(xiàn)方式,其中最

具代表性的著作為歐美一線(xiàn)資深記者共同編撰的《數(shù)據(jù)新聞手冊(cè)》(TheData

JournalismHandbook);

二是從新聞學(xué)角度入手,側(cè)重?cái)?shù)據(jù)新聞的優(yōu)勢(shì)分析、現(xiàn)狀調(diào)查、問(wèn)題

探討、發(fā)展建議等,采用的方法主要是深度訪(fǎng)談法、參與觀(guān)察法及問(wèn)卷調(diào)

查。

(2)數(shù)據(jù)新聞教育發(fā)展

由英國(guó)數(shù)據(jù)新聞實(shí)踐推動(dòng)的英國(guó)數(shù)據(jù)新聞教育具有引領(lǐng)作用。

目前英國(guó)的數(shù)據(jù)新聞?lì)愓n程主要分三種類(lèi)型:

第一種是介紹型課程,如“數(shù)據(jù)報(bào)道概論”“數(shù)據(jù)系統(tǒng)概念與基礎(chǔ)”等;

第一種是數(shù)據(jù)新聞技能類(lèi)課程,如“數(shù)據(jù)可視化”“數(shù)字交互設(shè)計(jì)”“高

級(jí)數(shù)據(jù)與編程”等;

第三種是數(shù)據(jù)新聞應(yīng)用型課程,如“城市復(fù)原力,災(zāi)害和數(shù)據(jù)”“文化

遺產(chǎn)可視化應(yīng)用”等。

美國(guó)是數(shù)據(jù)新聞教育學(xué)術(shù)機(jī)構(gòu)發(fā)展最為成熟的國(guó)家。(“美國(guó)知名高校

數(shù)據(jù)新聞?wù)n程開(kāi)設(shè)情況”見(jiàn)教材)

(二)國(guó)內(nèi)新媒體數(shù)據(jù)新聞的發(fā)展對(duì)比分析法講

1.業(yè)界對(duì)新媒體數(shù)據(jù)新聞的嘗試與探索授

自2011年起,國(guó)內(nèi)四大門(mén)戶(hù)網(wǎng)站搜狐、網(wǎng)易、騰訊、新浪緊跟國(guó)外數(shù)

據(jù)新聞實(shí)踐步伐相繼推出數(shù)據(jù)新聞專(zhuān)欄:“數(shù)字之道”“數(shù)讀”“數(shù)據(jù)控”“圖

解天下”,拉開(kāi)數(shù)據(jù)新聞本土化實(shí)踐序幕。

2013年10月,財(cái)新傳媒率先成立了財(cái)新數(shù)據(jù)可視化實(shí)驗(yàn)室,推出數(shù)

據(jù)新聞專(zhuān)欄“數(shù)字說(shuō)”。

2014年1月,中央電視臺(tái)《晚間新聞》推出“據(jù)”說(shuō)系列報(bào)道,開(kāi)啟

了國(guó)內(nèi)電視媒體的數(shù)據(jù)新聞實(shí)踐之路。

2015年中國(guó)數(shù)據(jù)新聞大賽開(kāi)始舉辦,該比賽旨在通過(guò)比賽打通學(xué)界與

業(yè)界的壁壘,為全國(guó)培養(yǎng)新媒體人才助力,促進(jìn)國(guó)內(nèi)數(shù)據(jù)新聞的發(fā)展,目

前已經(jīng)逐漸成為一項(xiàng)具有規(guī)模的全國(guó)性賽事。

2.學(xué)界對(duì)新媒體數(shù)據(jù)新聞的研究

(1)數(shù)據(jù)新聞理論研究

20世紀(jì)80、90年代,國(guó)內(nèi)學(xué)界開(kāi)始關(guān)注數(shù)據(jù)新聞。國(guó)內(nèi)最早關(guān)于“數(shù)

據(jù)新聞”、“計(jì)算機(jī)輔助報(bào)道”等概念的研究可追溯到卜衛(wèi)于1998年的發(fā)

表論文,該文介紹了計(jì)算機(jī)輔助新聞報(bào)道的相關(guān)問(wèn)題,呼吁業(yè)界應(yīng)具有計(jì)

算機(jī)報(bào)道的意識(shí)。數(shù)據(jù)新聞在隨后的許多年里并未引起國(guó)內(nèi)學(xué)者的重視,

直到2012年“大數(shù)據(jù)”概念在國(guó)內(nèi)的悄然興起,無(wú)論學(xué)界還是業(yè)界,都

對(duì)“數(shù)據(jù)新聞”更加關(guān)注。

2011年,國(guó)內(nèi)業(yè)界的數(shù)據(jù)新聞實(shí)踐開(kāi)始起步,此時(shí)學(xué)界對(duì)數(shù)據(jù)新聞的

研究多集中于對(duì)概念的界定與探討,多屬于介紹性的研究。自2015年開(kāi)始,

隨著數(shù)據(jù)新聞被普遍當(dāng)作新聞業(yè)新的希望與未來(lái),被國(guó)內(nèi)的諸多傳統(tǒng)媒體

實(shí)踐與應(yīng)用,學(xué)界對(duì)數(shù)據(jù)新聞的研究也更加深入與多元。

(2)數(shù)據(jù)新聞教育發(fā)展

2015年,中國(guó)傳媒大學(xué)新聞學(xué)專(zhuān)業(yè)(數(shù)據(jù)新聞報(bào)道方向)設(shè)立,自2016

年起,該專(zhuān)業(yè)實(shí)行自主招生。這是中國(guó)內(nèi)地第一個(gè)設(shè)置數(shù)據(jù)新聞專(zhuān)業(yè)方向

的大學(xué)。

中國(guó)知名高校數(shù)據(jù)新聞?wù)n程主要分為兩類(lèi)。

第一類(lèi)是數(shù)據(jù)新聞概況類(lèi)課程,主要涵蓋國(guó)內(nèi)外數(shù)據(jù)新聞發(fā)展、各類(lèi)

媒體的實(shí)踐情況及其采制的原則和流程等;

第二類(lèi)是數(shù)據(jù)新聞技能類(lèi)課程,如“可視化技術(shù)”、“R語(yǔ)言與數(shù)據(jù)可

視化"、“GooSeeker網(wǎng)頁(yè)抓取工具”、“Python語(yǔ)言”、“SPSS數(shù)據(jù)分析”等

課程??傮w而言,中國(guó)數(shù)據(jù)新聞教育的課程設(shè)置偏重技能培養(yǎng)。

“部分中國(guó)高校數(shù)據(jù)新聞?wù)n程與專(zhuān)業(yè)設(shè)置”見(jiàn)教材。

(三)新媒體數(shù)據(jù)新聞未來(lái)發(fā)展趨勢(shì)

1.增強(qiáng)數(shù)據(jù)素養(yǎng),提升數(shù)據(jù)驅(qū)動(dòng)能力

2.重視數(shù)據(jù)倫理,加強(qiáng)數(shù)據(jù)內(nèi)容監(jiān)管

3.注重媒介融合,整合報(bào)道傳播渠道

4.加強(qiáng)理論建構(gòu),創(chuàng)新人才培養(yǎng)模式

第三節(jié)新媒體數(shù)據(jù)新聞的生產(chǎn)流程

(一)選題與策劃

1.新媒體數(shù)據(jù)新聞的選題

數(shù)據(jù)新聞的選題及其價(jià)值判斷可通過(guò)選題的新聞性和價(jià)值性?xún)蓚€(gè)方面

來(lái)完成。

選題的新聞性:與社會(huì)現(xiàn)狀、重大問(wèn)題等具有現(xiàn)實(shí)意義的熱點(diǎn)緊密聯(lián)

系,使選題建立在正確反映社會(huì)現(xiàn)實(shí)的基礎(chǔ)上;具有時(shí)效性,選題的時(shí)效

性在很大程度上影響著讀者的閱讀興趣。

選題的價(jià)值性:能通過(guò)數(shù)據(jù)對(duì)現(xiàn)象的反映,推動(dòng)社會(huì)向前發(fā)展;揭露

數(shù)據(jù)背后折射出的社會(huì)問(wèn)題,并能夠發(fā)人深省,具有深遠(yuǎn)意義。

2.新媒體數(shù)據(jù)新聞的策劃

既包括對(duì)擬選定題目具體新聞內(nèi)容框架的設(shè)計(jì),也包括該項(xiàng)目實(shí)施的

具體分工、時(shí)間規(guī)劃、資源統(tǒng)籌等具體實(shí)踐層面的事務(wù)。

設(shè)計(jì)數(shù)據(jù)新聞的框架結(jié)構(gòu)是一個(gè)優(yōu)秀數(shù)據(jù)新聞作品的前提。數(shù)據(jù)新聞

的框架設(shè)計(jì)重點(diǎn)在于內(nèi)容模塊的規(guī)劃。

組建一個(gè)具備新聞采編、數(shù)據(jù)處理、美工設(shè)計(jì)、媒體運(yùn)營(yíng)能力的人才

團(tuán)隊(duì)是數(shù)據(jù)新聞制作的關(guān)犍。

(二)數(shù)據(jù)獲取、預(yù)處理與分析

1.原始數(shù)據(jù)的獲取與采集

新媒體數(shù)據(jù)來(lái)源:網(wǎng)絡(luò)數(shù)據(jù)庫(kù)大數(shù)據(jù)、網(wǎng)絡(luò)社交大數(shù)據(jù)、網(wǎng)絡(luò)行為日

志大數(shù)據(jù)和網(wǎng)絡(luò)輿情大數(shù)據(jù)等。

數(shù)據(jù)獲取方式:國(guó)家統(tǒng)計(jì)部門(mén)就有大量可靠的公開(kāi)數(shù)據(jù)資源,可以通

過(guò)官方網(wǎng)站查詢(xún)下載;互聯(lián)網(wǎng)部門(mén)及專(zhuān)題網(wǎng)站數(shù)據(jù)有大量專(zhuān)題數(shù)據(jù)。中央

網(wǎng)信辦、國(guó)家網(wǎng)信辦、中國(guó)互聯(lián)網(wǎng)信息中心等提供的數(shù)據(jù)屬于互聯(lián)網(wǎng)官方

部門(mén)數(shù)據(jù),中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)、中國(guó)互聯(lián)網(wǎng)金融研究會(huì)等提供的數(shù)據(jù)為互聯(lián)

網(wǎng)行業(yè)部門(mén)數(shù)據(jù);系統(tǒng)日志采集是較為直接可靠的數(shù)據(jù)獲取方式,許多公

司的業(yè)務(wù)平臺(tái)每天都會(huì)產(chǎn)生大量的日志數(shù)據(jù)。系統(tǒng)日志數(shù)據(jù)可以通過(guò)第三

方平臺(tái)獲取,如CNZZ數(shù)據(jù)專(zhuān)家網(wǎng)站;Web數(shù)據(jù)抓取能夠快速、批量地從

網(wǎng)站上提取信息。Web數(shù)據(jù)抓取程序模擬瀏覽器的行為,能將可以在瀏覽

器上顯示的任何數(shù)據(jù)提取出來(lái)。八爪魚(yú)采集器是比較容易上手的Web數(shù)據(jù)

抓取軟件之一。

2.數(shù)據(jù)的預(yù)處理與加工

數(shù)據(jù)的預(yù)處理:一般所獲得的原始新媒體數(shù)據(jù)會(huì)存在數(shù)據(jù)被篡改、不

完整、重復(fù)等數(shù)據(jù)異常情況,即存在臟數(shù)據(jù),并不能直接使用。因此,對(duì)

所獲得原始數(shù)據(jù)需要通過(guò)數(shù)據(jù)清洗、集成、變換、規(guī)約等步驟對(duì)數(shù)據(jù)進(jìn)行

預(yù)處理。

數(shù)據(jù)的加工:完成數(shù)據(jù)預(yù)處理之后就可以正式進(jìn)入數(shù)據(jù)的加工,包括

數(shù)據(jù)合并、數(shù)據(jù)修正、公式計(jì)算等多種方式。

數(shù)據(jù)預(yù)處理與加工都是基礎(chǔ)步驟,主要是為后續(xù)數(shù)據(jù)分析和可視化服

務(wù)。

3.數(shù)據(jù)的分析

數(shù)據(jù)的分析是數(shù)據(jù)新聞生產(chǎn)的核心步驟。通??梢杂肊xcel、SPSS.

PythonR語(yǔ)言、Tableau等工具進(jìn)行數(shù)據(jù)分析。

按照難度和數(shù)據(jù)探索程度,數(shù)據(jù)分析可分為描述性分析、探索性分析、

驗(yàn)證性分析三種類(lèi)型。

數(shù)據(jù)的描述性分析包括對(duì)平均值、中位數(shù)、眾數(shù)、方差、標(biāo)準(zhǔn)差等進(jìn)

行計(jì)算,以及基于此的對(duì)比分析、交叉分析等。目前,大量的數(shù)據(jù)新聞作

品都是圍繞對(duì)數(shù)據(jù)的描述性分析而展開(kāi)。

探索性數(shù)據(jù)分析和驗(yàn)證性數(shù)據(jù)分析屬于高級(jí)數(shù)據(jù)分析,包括相關(guān)分析、

因子分析、回歸分析等內(nèi)容,側(cè)重于驗(yàn)證己有假設(shè)的真?zhèn)?、在?shù)據(jù)中發(fā)現(xiàn)

新的特征,以及對(duì)未來(lái)進(jìn)行預(yù)測(cè)。

(三)數(shù)據(jù)可視化與敘事

1.新媒體數(shù)據(jù)可視化

數(shù)據(jù)可視化是指通過(guò)圖形、圖表以及動(dòng)畫(huà)等手段直觀(guān)、生動(dòng)、形象地

展示數(shù)據(jù)的形式。

數(shù)據(jù)可視化的主要目的在于借助圖形化的手段,清晰有效地傳達(dá)與溝

通信息。總的來(lái)說(shuō),數(shù)據(jù)可視化的意義可分為三點(diǎn):更快獲取數(shù)據(jù)、獲取

更多數(shù)據(jù)、更深理解數(shù)據(jù)。

數(shù)據(jù)可視化分為靜態(tài)與動(dòng)態(tài)兩類(lèi),其中靜態(tài)類(lèi)型以信息圖表為代表,

動(dòng)態(tài)類(lèi)型乂可按照是否有交互操作分為動(dòng)畫(huà)視頻與交互圖表兩類(lèi)。

2.新媒體數(shù)據(jù)新聞可視化敘事

可視化敘事相比傳統(tǒng)的文本新聞敘事更能向受眾呈現(xiàn)新聞事件內(nèi)在的

邏輯聯(lián)系和關(guān)聯(lián)程度,更具有時(shí)空穿透力和感染力。

(四)數(shù)據(jù)新聞制作與發(fā)布提問(wèn),引導(dǎo)總

1.新媒體數(shù)據(jù)新聞的制作結(jié)數(shù)據(jù)新聞的

數(shù)據(jù)新聞制作是整合文字、圖表、視頻、音頻等元素,使其成為敘事生產(chǎn)流程。

完整、風(fēng)格統(tǒng)一的數(shù)字化新聞作品的過(guò)程。

GoogleFusionTables>TableauPublic、DataMarkel、ManyEyes是目前

常見(jiàn)的可用來(lái)制作數(shù)據(jù)新聞的軟件。

國(guó)內(nèi)的iH5、易企秀等網(wǎng)站也常被用來(lái)制作、發(fā)布數(shù)據(jù)新聞。

除此之外,還有很多功能更加細(xì)化的軟件,如專(zhuān)門(mén)制作時(shí)間類(lèi)作品的

Dipity、用于文本可視化即標(biāo)簽云的Wordle等。

2.新媒體數(shù)據(jù)新聞的集成發(fā)布

數(shù)據(jù)新聞作品制作完成后可通過(guò)移動(dòng)端和PC端集成發(fā)布。iH5、易企

秀發(fā)布平臺(tái)以H5制作見(jiàn)長(zhǎng),這也就決定了這類(lèi)平臺(tái)發(fā)布的數(shù)據(jù)新聞作品

是更適用于手機(jī)的移動(dòng)端模式,讀者通過(guò)滑動(dòng)或翻動(dòng)界面獲取數(shù)據(jù),通過(guò)

動(dòng)態(tài)交互圖表、視頻等了解詳情,交互感比PC端更強(qiáng)。

相較于移動(dòng)端,數(shù)據(jù)新聞在PC端傳播過(guò)程中用戶(hù)粘度較低,且PC

端數(shù)據(jù)新聞以媒體轉(zhuǎn)發(fā)為主,與普通用戶(hù)互動(dòng)較少。

在大數(shù)據(jù)時(shí)代,要想做好數(shù)據(jù)新聞報(bào)道,需要新聞從業(yè)者與時(shí)俱進(jìn),

積極學(xué)習(xí)新興技術(shù)與技能,加強(qiáng)互動(dòng)傳播;完善交互式設(shè)計(jì),提升多維鏈

式傳播廣度;深度追蹤熱點(diǎn)問(wèn)題,引發(fā)多級(jí)點(diǎn)傳播;把握關(guān)鍵節(jié)點(diǎn)位置,

拓展傳播網(wǎng)絡(luò)。

第四節(jié)新媒體數(shù)據(jù)新聞典型案例

(一)國(guó)外典型案例分析

2012年《紐約時(shí)報(bào)》推出的大型新聞報(bào)道作品《雪崩》(SnowFall)

在上線(xiàn)一周的時(shí)間內(nèi)獲得了350萬(wàn)的點(diǎn)閱率。這篇報(bào)道主要講述了2012年

2月份發(fā)生在美國(guó)華盛頓州卡斯凱德山區(qū)的雪崩造成的滑雪愛(ài)好者罹難的

事件,報(bào)道在當(dāng)時(shí)的不少創(chuàng)新之舉引領(lǐng)了一股數(shù)據(jù)新聞浪潮,成為傳統(tǒng)新

聞向融合新聞發(fā)展的一個(gè)標(biāo)志性報(bào)道。

(-)國(guó)內(nèi)典型案例分析

在2018年全球數(shù)據(jù)新聞獎(jiǎng)中,財(cái)新網(wǎng)作為唯一的中國(guó)大陸媒體入圍,

擊敗來(lái)自BBC、彭博、英國(guó)衛(wèi)報(bào)等媒體的11個(gè)團(tuán)隊(duì),獲得“最佳大型數(shù)

據(jù)新聞團(tuán)隊(duì)”獎(jiǎng)。

例:財(cái)新網(wǎng)的數(shù)據(jù)新聞作品《博物館里的國(guó)家寶藏》。

(三)數(shù)據(jù)新聞作品傳播渠道

1.網(wǎng)站數(shù)據(jù)新聞專(zhuān)欄

網(wǎng)站的數(shù)據(jù)新聞可分為兩類(lèi),第一類(lèi)是大型綜合性門(mén)戶(hù)網(wǎng)站,如網(wǎng)易

“數(shù)讀”欄目、騰訊“數(shù)據(jù)控”欄目、新浪“圖解天下”欄目、搜狐“數(shù)

字之道”欄目;第一類(lèi)是專(zhuān)業(yè)性質(zhì)的新媒體平臺(tái),如財(cái)新網(wǎng),它是專(zhuān)注于

原創(chuàng)財(cái)經(jīng)的新媒體,于2011年開(kāi)設(shè)了“數(shù)字說(shuō)”這一數(shù)據(jù)新聞欄目。

2.互聯(lián)網(wǎng)新媒體平臺(tái)

互聯(lián)網(wǎng)新媒體平臺(tái)如微博、微信公眾號(hào)、今日頭條,憑借其堅(jiān)實(shí)的用

戶(hù)基礎(chǔ)和強(qiáng)大的裂變傳播能力在數(shù)據(jù)新聞的傳播中占據(jù)了重要作用。

大部分傳統(tǒng)媒體或網(wǎng)站平臺(tái)如新華網(wǎng)、人民網(wǎng)等都會(huì)利用自己的微博

和微信賬號(hào)進(jìn)行數(shù)據(jù)新聞的發(fā)布。如《中國(guó)科學(xué)報(bào)》同時(shí)在科學(xué)網(wǎng)、《中國(guó)

科學(xué)報(bào)》微博客戶(hù)端和《中國(guó)科學(xué)報(bào)》微信公眾號(hào)發(fā)布數(shù)據(jù)新聞。

3.數(shù)據(jù)新聞?lì)I(lǐng)域權(quán)威大賽

目前在國(guó)際上認(rèn)可度較高的專(zhuān)業(yè)數(shù)據(jù)新聞大賽是“全球數(shù)據(jù)新聞獎(jiǎng)”,

設(shè)立于2012年。由谷歌贊助,全球編輯網(wǎng)絡(luò)和歐洲新聞中心聯(lián)合創(chuàng)立。

凱度信息之美獎(jiǎng)也是數(shù)據(jù)新聞?lì)I(lǐng)域的一個(gè)重要獎(jiǎng)項(xiàng),該獎(jiǎng)項(xiàng)主要用于

評(píng)估新聞作品的主題與可視化形式之間的適應(yīng)程度,評(píng)選信息與數(shù)據(jù)可視

化方面的優(yōu)秀作品。

“中國(guó)數(shù)據(jù)新聞大賽”是國(guó)內(nèi)數(shù)據(jù)新聞?lì)I(lǐng)域較為專(zhuān)業(yè)的賽事。

(四)優(yōu)秀數(shù)據(jù)新聞作品特點(diǎn)及問(wèn)題規(guī)避

1.優(yōu)秀數(shù)據(jù)新聞作品特點(diǎn)

(1)多維度視角

(2)故事化新聞敘事

(3)重視交互設(shè)計(jì)

(4)數(shù)據(jù)來(lái)源豐富

2.數(shù)據(jù)新聞作品問(wèn)題規(guī)避

(1)簡(jiǎn)潔易懂重視傳播

“少即是多,數(shù)據(jù)可視化價(jià)值在于要將信息高效地傳輸給讀者”

(2)注重?cái)⑹鍪侄吻捎么怪笨臻g

“對(duì)于可視化作品而言,垂直空間才是黃金資源”

(3)適當(dāng)交互避免冗余

“可視化交互新聞響應(yīng)的速度勝于形式”

(4)給出結(jié)論重在分析

“對(duì)于可視化作品而言,垂直空間才是黃金資源”

(5)注重實(shí)效避免過(guò)期

一般來(lái)說(shuō),與圖文新聞相比,數(shù)據(jù)可視化新聞的生產(chǎn)過(guò)程要復(fù)雜不少,

生產(chǎn)周期也相應(yīng)變長(zhǎng)。但在當(dāng)今社會(huì),熱點(diǎn)的轉(zhuǎn)換異常迅捷,各領(lǐng)風(fēng)騷兩

三天而已。但不少媒體沒(méi)能認(rèn)識(shí)到數(shù)據(jù)可視化報(bào)道的“周期性”問(wèn)題,只

管耕耘,不問(wèn)收獲,最終是事倍功半,效果不彰。

思考與練習(xí):

(1)什么是新媒體數(shù)據(jù)新聞?新媒體數(shù)據(jù)新聞?dòng)心男┨卣骱蛢r(jià)值?布置作業(yè)、鞏

(2)列舉國(guó)內(nèi)新聞網(wǎng)站的數(shù)據(jù)新聞欄目,并總結(jié)其各自的特色。固知識(shí),進(jìn)行

(3)闡述新媒體數(shù)據(jù)新聞的生產(chǎn)流程。形成性評(píng)價(jià)。

(4)根據(jù)典型數(shù)據(jù)新聞案例,簡(jiǎn)述優(yōu)秀數(shù)據(jù)新聞作品的特點(diǎn)及應(yīng)規(guī)避

的問(wèn)題。

教學(xué)反思:

(1)教學(xué)成功之處:教學(xué)反思

(2)教學(xué)不足之處:

(3)學(xué)生獲得知識(shí)和創(chuàng)新(知識(shí)掌握、技能獲取、價(jià)值觀(guān)理念樹(shù)立):

(4)改進(jìn)措施和方案:

XXXX大學(xué)教案

第二章新媒體數(shù)據(jù)新聞選題與策劃

一、課時(shí)安排:課時(shí)(理論講授6課時(shí),實(shí)踐4課時(shí))

二、教學(xué)課型:理論、實(shí)踐課

三、教學(xué)目標(biāo):

建立目標(biāo)任務(wù)

(1)了解新媒體數(shù)據(jù)新聞選題原則與分類(lèi)。

(2)掌握如何發(fā)現(xiàn)與選擇新媒體數(shù)據(jù)新聞選題。

(3)掌握新媒體數(shù)據(jù)新聞選題報(bào)道策劃。

(4)熟悉新媒體數(shù)據(jù)新聞選題與策劃應(yīng)用。

四、教學(xué)重點(diǎn)難點(diǎn):

明確重難點(diǎn)

(1)發(fā)現(xiàn)與選擇數(shù)據(jù)新聞選題。

(2)新媒體數(shù)據(jù)新聞選題報(bào)道策劃。

(3)新媒體數(shù)據(jù)新聞選題與策劃應(yīng)用。

五、教學(xué)方法:

多媒體教學(xué)(講授法、實(shí)驗(yàn)法)

六、教學(xué)過(guò)程與內(nèi)容:

課程導(dǎo)入:

新媒體數(shù)據(jù)新聞的選題意義和原則。課程導(dǎo)入,激

發(fā)學(xué)習(xí)興趣。

本章概述:

選題是新媒體數(shù)據(jù)新聞生產(chǎn)活動(dòng)的重要環(huán)節(jié),也是初始環(huán)節(jié)。

數(shù)據(jù)新聞工作者確立新聞選題之后,還要進(jìn)行新聞報(bào)道策劃。與傳統(tǒng)

講授法,建立

新聞報(bào)道策劃不同,數(shù)據(jù)新聞報(bào)道策劃要使得數(shù)據(jù)新聞符合新聞、深度報(bào)

學(xué)習(xí)內(nèi)容的總

道的基本結(jié)構(gòu)和模式,又要符合新媒體平臺(tái)及工具呈現(xiàn)的模式,同時(shí)還要

體印象。

符合新媒體時(shí)代用戶(hù)的閱讀模式。

本章將對(duì)新媒體數(shù)據(jù)新聞選題的意義、原則和分類(lèi)進(jìn)行詳細(xì)介紹,對(duì)

發(fā)現(xiàn)和選擇數(shù)據(jù)新聞選題具體說(shuō)明,并從報(bào)道策劃對(duì)數(shù)據(jù)新聞的重要意義、

報(bào)道策劃的關(guān)鍵以及重點(diǎn)三個(gè)方面對(duì)數(shù)據(jù)新聞報(bào)道策劃進(jìn)行說(shuō)明。

第一節(jié)選題原則與分類(lèi)

(一)新媒體數(shù)據(jù)新聞選題及意義

1.新媒體數(shù)據(jù)新聞選題

在整個(gè)新聞生產(chǎn)過(guò)程中,新聞的選題是眾多新聞生產(chǎn)環(huán)節(jié)中極為關(guān)鍵

的一環(huán),是新聞報(bào)道的前提。

新聞選題即報(bào)道對(duì)象或內(nèi)容的選擇,簡(jiǎn)單地說(shuō)就是媒體的報(bào)道內(nèi)容,

它是整個(gè)新聞生產(chǎn)活動(dòng)過(guò)程的起點(diǎn),也是整個(gè)新聞生產(chǎn)流程中最基礎(chǔ)、最

重要的環(huán)節(jié),選題的內(nèi)容和質(zhì)量對(duì)整個(gè)新聞生產(chǎn)活動(dòng)具有重要的影響。

新媒體數(shù)據(jù)新聞選題即可理解為選擇有價(jià)值的、能夠進(jìn)行數(shù)據(jù)可視化

敘事和表達(dá)的新聞報(bào)道主題的過(guò)程。

理論講授

2.選題對(duì)于新媒體數(shù)據(jù)新聞的意義

(1)給予正確方向,使主題更加鮮明

(2)提高新聞質(zhì)量,更好滿(mǎn)足受眾

(3)引導(dǎo)輿論,實(shí)現(xiàn)“社會(huì)公器”職能

(-)新媒體數(shù)據(jù)新聞選題的原則

1.價(jià)值性原則

新聞價(jià)值的十個(gè)要素。

2.時(shí)效性原則

新媒體數(shù)據(jù)新聞選題理應(yīng)遵循時(shí)效性的原則,盡可能的去選擇那些正

在發(fā)生的或者即將發(fā)生的報(bào)道內(nèi)容和對(duì)象,選擇那些生活中比較新、比較

熱門(mén)的話(huà)題。

3.創(chuàng)新性原則

堅(jiān)持創(chuàng)新性原則,打破常規(guī),選擇那些視角新穎的新聞選題,選擇那

些別人還未報(bào)道過(guò)的新鮮題材。

4.群眾性原則

貼近群眾、貼近生活、貼近實(shí)際。

5.可及性原則

考慮當(dāng)前的技術(shù)是否能夠獲取某個(gè)選題所需要的數(shù)據(jù),是否能夠?qū)⑺?/p>

獲取的數(shù)據(jù)進(jìn)行可視化呈現(xiàn),以及是否支撐某個(gè)新聞選題向新媒體數(shù)據(jù)新

聞的轉(zhuǎn)化等。

(三)新媒體數(shù)據(jù)新聞選題的分類(lèi)

1.時(shí)事類(lèi)

時(shí)事類(lèi)數(shù)據(jù)新聞選題主要是涉及當(dāng)前社會(huì)生活中新近發(fā)生的或正在發(fā)

生的事實(shí),一般是發(fā)生在社會(huì)生活中與人們關(guān)系密切、對(duì)人們的生活有著

重大影響或者能夠引起人們廣泛關(guān)注的事實(shí)。時(shí)事婁數(shù)據(jù)新聞選題所對(duì)應(yīng)講授.案例演

的數(shù)據(jù)新聞為時(shí)事類(lèi)數(shù)據(jù)新聞。示

眾多的數(shù)據(jù)新聞網(wǎng)站也專(zhuān)門(mén)設(shè)置了時(shí)事類(lèi)新聞版塊,比如澎拜新聞美

數(shù)課就專(zhuān)門(mén)設(shè)置了時(shí)事類(lèi)數(shù)據(jù)新聞版塊,并在版塊中設(shè)置了抗疫、澎湃國(guó)

際以及浦江頭條等多個(gè)欄目。

例:澎湃新聞美數(shù)課的時(shí)事類(lèi)數(shù)據(jù)新聞作品,以《中國(guó)人到底每天睡

多久?》。

2.財(cái)經(jīng)類(lèi)

財(cái)經(jīng)類(lèi)數(shù)據(jù)新聞選題主要涉及的是財(cái)政、經(jīng)濟(jì)和金融等方面的內(nèi)容,

這類(lèi)選題對(duì)應(yīng)的則是財(cái)經(jīng)類(lèi)數(shù)據(jù)新聞,澎湃新聞美數(shù)課和網(wǎng)易數(shù)讀都有相

應(yīng)的版塊設(shè)置。近年來(lái),也誕生了許多優(yōu)秀的財(cái)經(jīng)類(lèi)數(shù)據(jù)新聞作品。

例:網(wǎng)易數(shù)讀數(shù)據(jù)新聞作品《貸款難:46%需融資小微企業(yè)獲銀行貸

款》。

3.社會(huì)生活類(lèi)

社會(huì)生活類(lèi)數(shù)據(jù)新聞選題主要涉及的是與大眾生活相關(guān)的社會(huì)事件和

社會(huì)問(wèn)題等等,這類(lèi)選題對(duì)應(yīng)的是社會(huì)生活類(lèi)數(shù)據(jù)新聞。因?yàn)樗腿藗兊?/p>

日常生活關(guān)系比較密切,而受到社會(huì)大眾的廣泛關(guān)注。

例:新華網(wǎng)數(shù)據(jù)新聞所制作的《家宴?人間至味是團(tuán)圓》數(shù)據(jù)新聞就

是一篇極為經(jīng)典且優(yōu)秀的社會(huì)生活類(lèi)數(shù)據(jù)新聞作品。

4.文化科普類(lèi)

文化科普類(lèi)新媒體數(shù)據(jù)新聞選題主要涉及的是有關(guān)科學(xué)文化知識(shí)等方

面的內(nèi)容,這類(lèi)選題相對(duì)應(yīng)的是文化科普類(lèi)數(shù)據(jù)新聞。澎湃新聞美數(shù)課的

“思想”欄目、新華網(wǎng)數(shù)據(jù)新聞的“人文說(shuō)”“漲知識(shí)”和“健康解碼”等

都屬于文化科普類(lèi)數(shù)據(jù)新聞。講授,操作演

例:新華網(wǎng)數(shù)據(jù)新聞作品《4()年實(shí)現(xiàn)碳中和我們的底氣在哪》就是示。

一篇優(yōu)秀的文化科普類(lèi)數(shù)據(jù)新聞作品。

第二節(jié)發(fā)現(xiàn)與選擇選題

(一)培養(yǎng)“新聞鼻”“新聞眼”,增強(qiáng)新聞敏感

“新聞鼻”“新聞眼”就是一種“新聞嗅覺(jué)”,指的是新聞工作者對(duì)于

新聞的敏感性,它是新聞工作者發(fā)現(xiàn)新聞的一種重要能力、必不可少的素

質(zhì)。

新聞工作者要時(shí)刻保持這種新聞敏感,這種新聞敏感可能會(huì)在逛街時(shí)、

購(gòu)物時(shí)或者在生活的某個(gè)場(chǎng)景下,就迸發(fā)出一個(gè)新鮮有趣的新聞選題。

有了這種新聞敏感,新聞工作者也更容易在紛繁的新聞事實(shí)中發(fā)現(xiàn)具

有新聞價(jià)值的事實(shí)和更容易引起受眾興趣的內(nèi)容,從中選擇合適的數(shù)據(jù)新

聞選題,進(jìn)而去完成整個(gè)新媒體數(shù)據(jù)新聞的編輯和制作。

(二)善于提取和抓住優(yōu)秀選題

1.在微博、微信、抖音等新媒體平臺(tái)中發(fā)現(xiàn)與選擇選題

新媒體背景下,人人都是新聞的制造者和傳播者,而在微博、微信、

抖音這些用戶(hù)參與度極高的新媒體平臺(tái)上,更是匯集了多元且豐富的內(nèi)容

信息,而這也為新聞工作者進(jìn)行數(shù)據(jù)新聞選題提供了極為及時(shí)和全面的新

聞事實(shí)來(lái)源。

新聞工作者要深入這些用戶(hù)使用率高的新媒體,去瀏覽這些新媒體中

的大量新聞和內(nèi)容,去選擇那些備受關(guān)注的新聞事實(shí),從新聞熱點(diǎn)中善于

發(fā)現(xiàn)和提取優(yōu)秀的新聞選題。

以微博熱搜為例,在微博平臺(tái)上分別設(shè)立了熱搜榜、要聞榜以及同城

榜,這些都為新聞工作者發(fā)現(xiàn)和選擇數(shù)據(jù)新聞選題提供了重要線(xiàn)索。

微信朋友圈也是獲得數(shù)據(jù)新聞選題靈感的一條重要途徑,因?yàn)樾侣劰?/p>

作者自身的社交網(wǎng)絡(luò)和社會(huì)資源也是發(fā)現(xiàn)數(shù)據(jù)新聞選題的重要方式和來(lái)

源。朋友身份越是多重,朋友圈關(guān)系網(wǎng)越是復(fù)雜,其中所包含的觀(guān)點(diǎn)和意

見(jiàn)也就越是豐富,看待問(wèn)題的角度就越是多元。

2.在相關(guān)媒體的報(bào)道中發(fā)現(xiàn)與選擇選題

新聞工作者可以在工作之余去瀏覽分析其他一些相關(guān)媒體的報(bào)道內(nèi)容

和材料,從中去發(fā)現(xiàn)和選擇自己的數(shù)據(jù)新聞選題。

不要以為其他媒體報(bào)道過(guò)的新聞內(nèi)容就沒(méi)有價(jià)值,就放棄這方面的題

材進(jìn)行報(bào)道,同時(shí)這也并不意味著新聞工作者要去抄襲別人的新聞內(nèi)容,

而是利用其他媒體的新聞報(bào)道內(nèi)容和信息進(jìn)行二度開(kāi)發(fā)式的數(shù)據(jù)新聞制

作,可以是就其他新聞報(bào)道內(nèi)容進(jìn)行深度分析并進(jìn)行可視化呈現(xiàn),也可以

是就相關(guān)數(shù)據(jù)新聞報(bào)道題材進(jìn)行深度挖掘等等。

(三)善于觀(guān)察并從不同領(lǐng)域發(fā)現(xiàn)優(yōu)秀選題

1.在重大活動(dòng)中發(fā)現(xiàn)與選擇選題

各種體育比賽、文化娛樂(lè)活動(dòng)和黨政機(jī)關(guān)及各類(lèi)會(huì)議,也是發(fā)現(xiàn)數(shù)據(jù)

新聞選題的一條重要途徑,時(shí)事報(bào)道和新聞業(yè)界尤其注重這一方式。

各種各樣的體育比賽和文化娛樂(lè)活動(dòng)本身往往就備受觀(guān)眾矚目,再加

上在各種文體活動(dòng)中的體育明星、娛樂(lè)明星本身的吸引力和話(huà)題度,就會(huì)講授,案例演

使得比賽或活動(dòng)中充滿(mǎn)大量的新聞線(xiàn)索,細(xì)心的新聞工作者便可從中找到示

合適的新聞選題。

以2020年芒果TV推出的女團(tuán)成長(zhǎng)綜藝節(jié)目《乘風(fēng)破浪的姐姐》為例,

節(jié)目還未播出,便因參加節(jié)目的嘉賓本身的熱度和話(huà)題度引起了大眾廣泛

的關(guān)注。

例:網(wǎng)易數(shù)讀數(shù)據(jù)新聞作品《乘風(fēng)破浪的姐姐,誰(shuí)才是頂流》。

2.從社會(huì)生活中發(fā)現(xiàn)與選擇選題

新聞工作者應(yīng)該深入基層,從社會(huì)生活中去發(fā)現(xiàn)優(yōu)秀的新聞選題,去

發(fā)現(xiàn)能夠反映重大社會(huì)問(wèn)題、能夠切實(shí)解決人民群眾困難以及能夠給人民

群眾生活帶來(lái)積極意義的優(yōu)秀新聞選題。

例:網(wǎng)易數(shù)讀數(shù)據(jù)新聞作品《中國(guó)精神衛(wèi)生資源:床位不足、醫(yī)生少》。

第三節(jié)選題報(bào)道策劃

(一)新媒體數(shù)據(jù)新聞報(bào)道策劃的必要性

1.首先,新聞報(bào)道策劃是確保新媒體數(shù)據(jù)新聞生產(chǎn)制作工作順利進(jìn)行

的保證,前期的報(bào)道策劃能夠?yàn)閿?shù)據(jù)新聞后續(xù)工作的開(kāi)展提供正確方向和

有力支持。

2.其次,只有具有個(gè)性和特色的報(bào)道才能吸引受眾的眼球,而個(gè)性化

的數(shù)據(jù)新聞報(bào)道離不開(kāi)報(bào)道策劃。

3.最后,在新媒體時(shí)代,信息的傳播方式、受眾的閱讀接收方式以及

新聞報(bào)道平臺(tái)和呈現(xiàn)方式都發(fā)生了極大的變化,通過(guò)報(bào)道策劃,新媒體數(shù)

據(jù)新聞的生產(chǎn)制作工作才能夠順利地進(jìn)行。

(-)新媒體數(shù)據(jù)新聞報(bào)道策劃的關(guān)鍵

1.新媒體數(shù)據(jù)新聞要符合新聞、深度報(bào)道的基本結(jié)構(gòu)和模式

新媒體數(shù)據(jù)新聞要符合新聞的基本要求和結(jié)構(gòu):

首先,新媒體數(shù)據(jù)新聞也要選取真實(shí)、新鮮的事實(shí)進(jìn)行報(bào)道

其次,新聞的基本結(jié)構(gòu)為:標(biāo)題、導(dǎo)語(yǔ)、主體、背景、結(jié)語(yǔ)。數(shù)據(jù)新

聞報(bào)道亦要符合這個(gè)基本模式,而不能只有數(shù)據(jù)的可視化呈現(xiàn)。

新媒體數(shù)據(jù)新聞還耍符合深度報(bào)道的模式:

確定新聞選題之后,要針對(duì)性地選擇著眼點(diǎn),通過(guò)報(bào)道策劃,根據(jù)數(shù)

據(jù)獲取、處理、分析和可視化呈現(xiàn)去對(duì)事件的起因、經(jīng)過(guò)和發(fā)展進(jìn)行深入

挖掘,并對(duì)其進(jìn)行追蹤。

2.新媒體數(shù)據(jù)新聞要符合平臺(tái)及工具呈現(xiàn)的模式

新媒體數(shù)據(jù)新聞既要考慮到發(fā)布平臺(tái)的呈現(xiàn)方式,也要考慮到現(xiàn)有數(shù)

據(jù)處理工具是否支持所需數(shù)據(jù)的相關(guān)處理。

比如,數(shù)據(jù)新聞制作過(guò)程中經(jīng)常使用到的工具:可將數(shù)據(jù)轉(zhuǎn)化為圖表

的工具GoogleChartTools,可清除無(wú)效數(shù)據(jù)的工具GoogleRefine,可將將

Excel數(shù)據(jù)轉(zhuǎn)換為Web文件的工具M(jìn)r.DataConverter,可以將大量數(shù)據(jù)過(guò)濾

成自己所需數(shù)據(jù)的工具GoogleFusionTables,以及數(shù)據(jù)新聞制作與發(fā)布的

平臺(tái)工具iH5、Wix、易企秀等等。

3.新媒體數(shù)據(jù)新聞要符合新媒體時(shí)代用戶(hù)的閱讀模式

一方面,在圖文結(jié)構(gòu)和信息圖表的可視化呈現(xiàn)上,要使得數(shù)據(jù)新聞作

品符合用戶(hù)的視覺(jué)習(xí)慣;另一方面,數(shù)據(jù)新聞制作也要考慮到新媒體時(shí)代

智能終端廣泛使用背景下用戶(hù)對(duì)新聞的閱讀習(xí)慣。

以新華網(wǎng)數(shù)據(jù)新聞為例,其數(shù)據(jù)新聞作品就設(shè)置了PC交互和手機(jī)交互

兩種形式,分別滿(mǎn)足計(jì)算機(jī)端和手機(jī)端兩種不同使用習(xí)慣的用戶(hù)。

例:PC端數(shù)據(jù)新聞作品《人類(lèi)與珠穆朗瑪峰》。手機(jī)端數(shù)據(jù)新聞作品

《天使的日歷》。

(三)新媒體數(shù)據(jù)新聞報(bào)道框架策劃

1.結(jié)構(gòu)和邏輯策劃

報(bào)道結(jié)構(gòu)和邏輯,主要指的是報(bào)道內(nèi)容之間的組合排列關(guān)系。常見(jiàn)的

報(bào)道結(jié)構(gòu)有線(xiàn)型結(jié)構(gòu)、放射型結(jié)構(gòu)、收束型結(jié)構(gòu)和網(wǎng)狀結(jié)構(gòu)四種。

從時(shí)間的延續(xù)來(lái)看,新聞報(bào)道的線(xiàn)型結(jié)構(gòu)呈現(xiàn)出單向性的、直線(xiàn)型的

發(fā)展軌跡,放射型結(jié)構(gòu)呈現(xiàn)出由線(xiàn)到面的放射狀的特點(diǎn),收束型結(jié)構(gòu)呈現(xiàn)

出由面到線(xiàn)或到點(diǎn)的特點(diǎn),而網(wǎng)狀結(jié)構(gòu)則呈現(xiàn)出或追蹤、或拓展等相互烘

托、交錯(cuò)遞進(jìn)的特點(diǎn)。新媒體數(shù)據(jù)新聞報(bào)道要采用什么樣的報(bào)道方式需要

進(jìn)行提前策劃。

2.表達(dá)主題策劃

為了更好地去表達(dá)數(shù)據(jù)新聞主題,主題策劃也要遵循一些規(guī)律:

首先,數(shù)據(jù)新聞主題表達(dá)要有鮮明的傾向性,需要讓受眾感知到該數(shù)

據(jù)新聞作品的立場(chǎng)和態(tài)度;

其次,數(shù)據(jù)新聞主題表達(dá)要反映事物的本質(zhì)規(guī)律,幫助受眾認(rèn)識(shí)到事

物之間的關(guān)系和深刻內(nèi)涵;

最后,數(shù)據(jù)新聞主題還要具有創(chuàng)新性,能夠吸引新形勢(shì)、新背景下受

眾的注意力。

3.圖文結(jié)合策劃

在數(shù)據(jù)新聞報(bào)道中,什么時(shí)候采用文字表達(dá),什么時(shí)候運(yùn)用圖表進(jìn)行

可視化呈現(xiàn),以及文字和可視化圖表如何進(jìn)行搭配和結(jié)合,都需要對(duì)數(shù)據(jù)

新聞報(bào)道進(jìn)行圖文策劃。

例:新華網(wǎng)數(shù)據(jù)新聞。

第四節(jié)選題與策劃應(yīng)用

(一)確定數(shù)據(jù)新聞選題

在具體選題時(shí),可以由表及里、以小見(jiàn)大,更為關(guān)注當(dāng)代人的生存現(xiàn)

狀,關(guān)注社會(huì)熱點(diǎn)及社會(huì)發(fā)展存在的問(wèn)題,如健康、就業(yè)、社會(huì)保障、交

通出行等。

見(jiàn)數(shù)據(jù)新聞《中國(guó)城鎮(zhèn)化的單身困境》。

(二)規(guī)劃內(nèi)容板塊

內(nèi)容板塊規(guī)劃是做好數(shù)據(jù)新聞敘事的關(guān)鍵,也是講好新聞故事的關(guān)鍵。

內(nèi)容板塊確定既要前后具有邏輯性,又要層層深入,以便更清晰地表達(dá)主

題。

見(jiàn)數(shù)據(jù)新聞《中國(guó)城鎮(zhèn)化的單身困境》。

思考與練習(xí),

(1)簡(jiǎn)述新媒體數(shù)據(jù)新聞選題的意義及原則。布置作業(yè)、鞏

(2)簡(jiǎn)述新媒體數(shù)據(jù)新聞選題的分類(lèi)。固知識(shí),進(jìn)行

(3)簡(jiǎn)述如何發(fā)現(xiàn)并選擇優(yōu)秀的新媒體數(shù)據(jù)新聞選題。形成性評(píng)價(jià)。

(4)簡(jiǎn)述如何對(duì)新媒體數(shù)據(jù)新聞報(bào)道進(jìn)行策劃。

教學(xué)反思:教學(xué)反思

(1)教學(xué)成功之處:

(2)教學(xué)不足之處:

(3)學(xué)生獲得知識(shí)和創(chuàng)新(知識(shí)掌握、技能獲取、價(jià)值觀(guān)理念樹(shù)立):

(4)改進(jìn)措施和方案:

XXXX大學(xué)教案

第三章新媒體數(shù)據(jù)獲取

一、課時(shí)安排:課時(shí)(理論講授6課時(shí),實(shí)踐4課時(shí))

二、教學(xué)課型:理論、實(shí)踐課

三、教學(xué)目標(biāo):

建立目標(biāo)任務(wù)

(1)了解新媒體數(shù)據(jù)需求及目標(biāo)識(shí)別。

(2)熟悉新媒體數(shù)據(jù)來(lái)源。

(3)掌握新媒體數(shù)據(jù)獲取方式。

(4)掌握新媒體數(shù)據(jù)獲取的應(yīng)用。

四、教學(xué)重點(diǎn)難點(diǎn):

明確重難點(diǎn)

(1)新媒體數(shù)據(jù)來(lái)源。

(2)新媒體數(shù)據(jù)獲取方式。

(3)新媒體數(shù)據(jù)獲取的應(yīng)用。

五、教學(xué)方法:

多媒體教學(xué)(講授法、實(shí)驗(yàn)法)

六、教學(xué)過(guò)程與內(nèi)容:

課程導(dǎo)入:

常見(jiàn)新媒體數(shù)據(jù)產(chǎn)生及來(lái)源領(lǐng)域。課程導(dǎo)入,激

發(fā)學(xué)習(xí)興趣。

本章概述:

本章從新媒體數(shù)據(jù)需求及目標(biāo)識(shí)別、新媒體數(shù)據(jù)來(lái)源和新媒體數(shù)據(jù)獲

講授法,建立

取方式三個(gè)方面概述新媒體數(shù)據(jù)的獲取。

學(xué)習(xí)內(nèi)容的總

為了更好地理解與運(yùn)用,第四節(jié)以“分析網(wǎng)紅李佳琦抖音賬號(hào)運(yùn)營(yíng)情

體印象。

況”和數(shù)據(jù)新聞“中國(guó)城鎮(zhèn)化的單身困境”為例,詳細(xì)介紹了如何將以上

方法應(yīng)用到實(shí)踐中。目的是將理論方法、操作技術(shù)與具體實(shí)踐相結(jié)合,能

夠更好地實(shí)現(xiàn)新媒體數(shù)據(jù)獲取。

第一節(jié)新媒體數(shù)據(jù)需求及目標(biāo)識(shí)別

數(shù)據(jù)分析面臨的主要挑戰(zhàn)不僅有技術(shù)問(wèn)題,還包括方向和組織領(lǐng)導(dǎo)的

問(wèn)題。因此,提出問(wèn)題、明確需求、確定目標(biāo)才能為接下來(lái)?系列的數(shù)據(jù)理論講授

獲取、分析、可視化等做好準(zhǔn)備。

針對(duì)不同的需求,我們要組合不同的數(shù)據(jù)進(jìn)行分析,從多角度考慮設(shè)

計(jì)。如分析宏觀(guān)背景,可以從年代變化、地區(qū)差異、政府政策等方面搜集

數(shù)據(jù);分析微觀(guān)事件,可以從媒體關(guān)注、網(wǎng)民討論、時(shí)間節(jié)點(diǎn)、擴(kuò)散路徑

等方面搜集數(shù)據(jù)。

第二節(jié)新媒體數(shù)據(jù)的來(lái)源

(一)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)大數(shù)據(jù)

網(wǎng)絡(luò)數(shù)據(jù)庫(kù)大數(shù)據(jù)主要是指基于傳統(tǒng)數(shù)據(jù)庫(kù)對(duì)新媒體內(nèi)容及相關(guān)信息

進(jìn)行存儲(chǔ)的數(shù)據(jù),如新聞內(nèi)容數(shù)據(jù)、網(wǎng)絡(luò)服務(wù)資源數(shù)據(jù)、消費(fèi)者數(shù)據(jù)、用

講授,案例演

戶(hù)行為數(shù)據(jù)、庫(kù)存數(shù)據(jù)、賬目數(shù)據(jù)等。

(二)網(wǎng)絡(luò)社交大數(shù)據(jù)

網(wǎng)絡(luò)社交大數(shù)據(jù)主要是指用戶(hù)參與和使用新媒體社交平臺(tái)、系統(tǒng)、軟

件產(chǎn)生的數(shù)據(jù),具有雜亂、異構(gòu)等特點(diǎn)。目前以“三微一端”(微博、微信、

微視頻及新聞客戶(hù)端)為代表的新媒體平臺(tái)產(chǎn)生的數(shù)據(jù)是網(wǎng)絡(luò)社交大數(shù)據(jù)

的重點(diǎn)。新媒體平臺(tái)后臺(tái)數(shù)據(jù)大都能支持下載,以Excel文件方式導(dǎo)出到

本地,供進(jìn)一步分析應(yīng)用。這些數(shù)據(jù)對(duì)運(yùn)營(yíng)者了解平臺(tái)運(yùn)營(yíng)情況、提升運(yùn)

營(yíng)質(zhì)量具有重要意義。

(三)網(wǎng)絡(luò)行為日志大數(shù)據(jù)

網(wǎng)絡(luò)行為日志大數(shù)據(jù)主要是指新媒體設(shè)備、傳感器等產(chǎn)生的數(shù)據(jù),包

括人為交易記錄、瀏覽訪(fǎng)問(wèn)記錄等數(shù)據(jù),通常為結(jié)構(gòu)化數(shù)據(jù)。

(四)網(wǎng)絡(luò)輿情大數(shù)據(jù)

網(wǎng)絡(luò)輿情大數(shù)據(jù)主要是指基于某熱點(diǎn)話(huà)題或事件,大量用戶(hù)通過(guò)新媒

體方式參與而產(chǎn)生的數(shù)據(jù),通常通過(guò)人工或智能系統(tǒng)進(jìn)行獲取。

第三節(jié)新媒體數(shù)據(jù)的獲取方式

(一)政府統(tǒng)計(jì)部門(mén)

在我國(guó),政府統(tǒng)計(jì)部門(mén)包括國(guó)家統(tǒng)計(jì)局,省級(jí)統(tǒng)計(jì)局、市級(jí)統(tǒng)計(jì)局和

區(qū)縣級(jí)統(tǒng)計(jì)局,這些統(tǒng)計(jì)部門(mén)分別對(duì)不同層次、不同區(qū)域、不同范圍的各

類(lèi)數(shù)據(jù)進(jìn)行了詳細(xì)的統(tǒng)計(jì)。講授,操作演

例:國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù)獲取。

(二)互聯(lián)網(wǎng)部門(mén)及專(zhuān)題網(wǎng)站數(shù)據(jù)

互聯(lián)網(wǎng)部門(mén)及專(zhuān)題網(wǎng)站數(shù)據(jù)主要由互聯(lián)網(wǎng)官方部門(mén)和互聯(lián)網(wǎng)行業(yè)部門(mén)

數(shù)據(jù)組成。諸如中央和國(guó)家網(wǎng)信辦、中國(guó)互聯(lián)網(wǎng)信息中心等提供的數(shù)據(jù)可

歸屬為互聯(lián)網(wǎng)官方部門(mén)數(shù)據(jù),而像中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)、中國(guó)互聯(lián)網(wǎng)金融研究

會(huì)等提供的數(shù)據(jù)可歸屬為互聯(lián)網(wǎng)行業(yè)部門(mén)數(shù)據(jù)。

例:中國(guó)互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告。

(三)系統(tǒng)日志采集

日志數(shù)據(jù)的收集通常通過(guò)日志收集系統(tǒng)自動(dòng)完成,日志收集系統(tǒng)要做

的事情就是實(shí)時(shí).收集'業(yè)務(wù)H志數(shù)據(jù)供離線(xiàn)利在線(xiàn)的分析系統(tǒng)使用。高可用

性、高可靠性和可擴(kuò)展性是日志收集系統(tǒng)所具有的基本特征。系統(tǒng)日志數(shù)

據(jù)可以通過(guò)第三方平臺(tái)獲取,如CNZZ數(shù)據(jù)專(zhuān)家網(wǎng)站??梢詭椭y(tǒng)計(jì)某一

網(wǎng)站的瀏覽次數(shù)、訪(fǎng)客人數(shù)、訪(fǎng)問(wèn)數(shù)據(jù)等。

例:利用友盟+平臺(tái)獲取日志數(shù)據(jù)。

(四)Web數(shù)據(jù)抓取

Web數(shù)據(jù)抓取即通常所稱(chēng)的網(wǎng)絡(luò)爬蟲(chóng),指的是根據(jù)相關(guān)的主題或關(guān)鍵

詞批量、快速?gòu)木W(wǎng)站及新媒體平臺(tái)上提取信息的一種計(jì)算機(jī)軟件技術(shù)。Web

數(shù)據(jù)抓取程序模擬瀏覽器的行為,能夠提取瀏覽港上顯示的任何數(shù)據(jù),因演示八爪魚(yú)的

此也稱(chēng)為屏幕抓取。Web數(shù)據(jù)抓取的最終目的是將非結(jié)構(gòu)化的信息從大量操作,指導(dǎo)學(xué)

的網(wǎng)頁(yè)中抽取出來(lái)以結(jié)構(gòu)化的方式存儲(chǔ)。生練習(xí)利用八

Web數(shù)據(jù)抓取通常需要利用計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言進(jìn)行程序編寫(xiě),而且爪魚(yú)進(jìn)行數(shù)據(jù)

針對(duì)不同的需求和不同的抓取對(duì)象,程序的編寫(xiě)也有所差異,因而對(duì)于普抓取。注意:

通的用戶(hù)來(lái)說(shuō)具有較大的難度。而工具的應(yīng)用為這一功能的實(shí)現(xiàn)提供了巨本書(shū)是對(duì)V7

大的便利,也大大降低了操作的難度。版本的介紹,

例:以八爪魚(yú)采集器為例,詳細(xì)介紹Web數(shù)據(jù)抓取的操作。八爪魚(yú)采可以指導(dǎo)學(xué)生

集數(shù)據(jù)有簡(jiǎn)易采集和自定義采集兩種模式,簡(jiǎn)易采集簡(jiǎn)單易操作,門(mén)檻低,對(duì)最新V8版

無(wú)基礎(chǔ)也可使用。自定義采集可以滿(mǎn)足個(gè)性化需求,適合對(duì)八爪魚(yú)有一定本的操作。

了解、掌握八爪魚(yú)各項(xiàng)功能的用戶(hù)。

第四節(jié)新媒體數(shù)據(jù)獲取應(yīng)用

(-)“分析網(wǎng)紅李佳琦抖音賬號(hào)運(yùn)營(yíng)情況”數(shù)據(jù)獲取

1.確定分析方向

李佳琦于2018年12月相繼開(kāi)通抖音、小紅書(shū)、快手等社交賬號(hào),迅

速以其專(zhuān)業(yè)、富有個(gè)性的推薦方式成為最能帶貨的主播之一。截至2019年

10月,李佳琦抖音賬號(hào)估值為53305011元,其抖音賬號(hào)極具分析價(jià)值。課堂實(shí)驗(yàn):指

首先,分析運(yùn)營(yíng)質(zhì)量,關(guān)注其總粉絲數(shù)、獲贊數(shù),單條視頻播放量、導(dǎo)學(xué)生對(duì)李佳

轉(zhuǎn)贊評(píng)數(shù)等;其次,分析營(yíng)銷(xiāo)效果,這是此賬號(hào)分析中比較特殊的一點(diǎn),琦抖音賬號(hào)數(shù)

因?yàn)槔罴宴鳛槊缞y博主、帶貨達(dá)人,對(duì)其帶貨能力的分析對(duì)于廣告投放據(jù)進(jìn)行分析。

等具有重要意義;再次,分析整體環(huán)境背景,如網(wǎng)民數(shù)、抖音使用人數(shù)、

平均消費(fèi)水平等,便于后期進(jìn)行信息獲取。

值得注意的一點(diǎn)是,正式進(jìn)行數(shù)據(jù)處理和分析時(shí),此階段搜集到的數(shù)

據(jù)也許并不會(huì)全部被用到,但還是要盡可能多地找到相關(guān)數(shù)據(jù),以提供更

多的分析依據(jù)。

2.獲取數(shù)據(jù)方法

(1)第三方平臺(tái)一一飛瓜數(shù)據(jù)

飛瓜數(shù)據(jù)作為分析短視頻的專(zhuān)業(yè)工具,擁有豐富的數(shù)據(jù)資源和強(qiáng)大的

數(shù)據(jù)分析能力。此案例中需要的賬號(hào)總體數(shù)據(jù)、商品推廣數(shù)據(jù)、作品數(shù)據(jù)、

粉絲數(shù)據(jù)(包括新增粉絲數(shù)、粉絲年齡分布、粉絲性別分布、粉絲地域分課堂實(shí)驗(yàn):指

布)和實(shí)時(shí)數(shù)據(jù)都可以在飛瓜平臺(tái)的數(shù)據(jù)監(jiān)測(cè)功能中獲取。對(duì)于獲取的數(shù)導(dǎo)學(xué)生利用£

據(jù),可以將其整理在Excel表格中,供后續(xù)使用。瓜數(shù)據(jù)、抖音

(2)Web抓取數(shù)據(jù)一一抖音工具箱工具箱、已有

抖音評(píng)論數(shù)據(jù)對(duì)衡量李佳埼賬號(hào)視頻效果與熱度具有重要參考意義,統(tǒng)計(jì)報(bào)告進(jìn)行

但抖音評(píng)論無(wú)法大批量復(fù)制,因此需要利用工具進(jìn)行抓取。在此使用抖音數(shù)據(jù)分析。

工具箱進(jìn)行評(píng)論數(shù)據(jù)的抓取。

(3)互聯(lián)網(wǎng)部門(mén)及行業(yè)網(wǎng)站

網(wǎng)民規(guī)模、網(wǎng)民屬性、短視頻用戶(hù)規(guī)模等數(shù)據(jù)可以從相關(guān)統(tǒng)計(jì)部門(mén)、

互聯(lián)網(wǎng)部門(mén)及行業(yè)網(wǎng)站獲得,為了后續(xù)處理方便,最好將獲取的數(shù)據(jù)整理

在Excel表格中。此案例中需要的背景數(shù)據(jù)主要來(lái)自中國(guó)互聯(lián)網(wǎng)信息中心

發(fā)布的《第44次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》。

(-)數(shù)據(jù)新聞“中國(guó)城鎮(zhèn)化的單身困境”數(shù)據(jù)獲取

1.明確數(shù)據(jù)需求

新聞選題和內(nèi)容板塊確定,即明確了數(shù)據(jù)新聞的方向,數(shù)據(jù)新聞中相

應(yīng)的數(shù)據(jù)需求也得到明確。

見(jiàn)數(shù)據(jù)新聞《中國(guó)城鎮(zhèn)化的單身困境》。

2.收集獲取數(shù)據(jù)

包括國(guó)家統(tǒng)計(jì)部門(mén)數(shù)據(jù)、互聯(lián)網(wǎng)部門(mén)及行業(yè)數(shù)據(jù)、Web抓取數(shù)據(jù)、系

統(tǒng)日志采集數(shù)據(jù)。

見(jiàn)數(shù)據(jù)新聞《中國(guó)城鎮(zhèn)化的單身困境》。

思考與練習(xí),

(1)簡(jiǎn)述新媒體數(shù)據(jù)的來(lái)源渠道。布置作業(yè)、鞏

(2)簡(jiǎn)述常用的新媒體數(shù)據(jù)獲取的方式。固知識(shí),進(jìn)行

(3)分別利用八爪魚(yú)工具和飛瓜數(shù)據(jù)工具對(duì)網(wǎng)站平臺(tái)和短視頻平臺(tái)進(jìn)形成性評(píng)價(jià)。

行數(shù)據(jù)抓取。

教學(xué)反思:

(1)教學(xué)成功之處:

(2)教學(xué)不足之處:教學(xué)反思

(3)學(xué)生獲得知識(shí)和創(chuàng)新(知識(shí)掌握、技能獲取、價(jià)值觀(guān)理念樹(shù)立):

(4)改進(jìn)措施和方案:

XXXX大學(xué)教案

第四章新媒體數(shù)據(jù)預(yù)處理

一、課時(shí)安排:課時(shí)(理論講授6課時(shí),實(shí)踐4課時(shí))

二、教學(xué)課型:理論、實(shí)踐課

三、教學(xué)目標(biāo):

建立目標(biāo)任務(wù)

(1)了解新媒體數(shù)據(jù)可用性鑒別指標(biāo)。

(2)掌握新媒體數(shù)據(jù)預(yù)處理方法。

(3)掌握新媒體數(shù)據(jù)預(yù)處理應(yīng)用。

四、教學(xué)重點(diǎn)難點(diǎn):

明的重難點(diǎn)

(1)新媒體數(shù)據(jù)預(yù)處理方法(重點(diǎn)在于利用python進(jìn)行數(shù)據(jù)預(yù)處理)。

(2)新媒體數(shù)據(jù)預(yù)處理應(yīng)用。

五、教學(xué)方法:

多媒體教學(xué)(講授法、實(shí)驗(yàn)法)

六、教學(xué)過(guò)程與內(nèi)容:

課程導(dǎo)入:課程導(dǎo)入,激

新媒體數(shù)據(jù)分析面臨的不規(guī)范性問(wèn)題以及預(yù)處理價(jià)值的體現(xiàn)。發(fā)學(xué)習(xí)興趣。

本章概述,

數(shù)據(jù)預(yù)處理(DataPr叩rocessing)是指在主要的處理和分析以前對(duì)數(shù)

講授法,建立

據(jù)進(jìn)行的一些必要的加工整理,主要目標(biāo)是清理異常值、糾正錯(cuò)誤數(shù)據(jù)、

學(xué)習(xí)內(nèi)容的總

統(tǒng)一數(shù)據(jù)格式等。

體印象。

本章首先介紹新媒體數(shù)據(jù)可用性鑒別指標(biāo),分別是數(shù)據(jù)真實(shí)性、數(shù)據(jù)

完整性和數(shù)據(jù)價(jià)值性鑒別;其次,介紹數(shù)據(jù)預(yù)處理的四種基本方法,分別

是數(shù)據(jù)清洗(缺失值處理、重復(fù)值處理和異常值發(fā)現(xiàn))、數(shù)據(jù)集成(實(shí)體識(shí)

另IJ、冗余和數(shù)據(jù)值沖突問(wèn)題)、數(shù)據(jù)變換(平滑、聚集、數(shù)據(jù)概化、規(guī)范化

和屬性構(gòu)造)以及數(shù)據(jù)規(guī)約(數(shù)據(jù)立方體聚集、維規(guī)約和數(shù)值規(guī)約);最后,

以某旅游APP的酒店客戶(hù)信息數(shù)據(jù)為例,介紹數(shù)據(jù)預(yù)處理在新媒體領(lǐng)域的

實(shí)際應(yīng)用。

第一節(jié)新媒體數(shù)據(jù)可用性鑒別指標(biāo)

(一)數(shù)據(jù)真實(shí)性鑒別

1.數(shù)據(jù)來(lái)源真實(shí)

數(shù)據(jù)來(lái)源真實(shí)是保證數(shù)據(jù)真實(shí)的首要條件。數(shù)據(jù)來(lái)源整體可以分為官

力和其他渠道(包括行業(yè)數(shù)據(jù)、抓取數(shù)據(jù)和問(wèn)卷數(shù)據(jù)等)兩種。一般來(lái)說(shuō),

官方統(tǒng)計(jì)的數(shù)據(jù)相對(duì)權(quán)威,能夠保障真實(shí)性,其他渠道獲取的數(shù)據(jù)更要認(rèn)

真進(jìn)行鑒別,防止因利益、主觀(guān)傾向等因素造成的不真實(shí)。

2.數(shù)據(jù)細(xì)節(jié)真實(shí)

失之毫厘,差之千里,統(tǒng)計(jì)數(shù)據(jù)中某個(gè)參數(shù)的不準(zhǔn)確,都有可能導(dǎo)致

結(jié)果出現(xiàn)極大偏差,因此,對(duì)數(shù)據(jù)細(xì)節(jié)進(jìn)行核實(shí),是保證數(shù)據(jù)真實(shí)準(zhǔn)確的

重要手段。如網(wǎng)絡(luò)問(wèn)卷調(diào)查中,設(shè)置每個(gè)IP地址只能回答一次;紙質(zhì)問(wèn)卷

調(diào)查中,多次核查錄入數(shù)據(jù)以避免失誤。

(二)數(shù)據(jù)完整性鑒別

1.記錄是否完整

根據(jù)關(guān)系型數(shù)據(jù)庫(kù)相關(guān)概念,可以把數(shù)據(jù)表中的每一行叫做一個(gè)“記

講授,演示數(shù)

錄”。每一個(gè)記錄包含該行中的所有信息,就像在通訊錄數(shù)據(jù)庫(kù)中某個(gè)人全

據(jù)完整性、字

部的信息,但記錄在數(shù)據(jù)庫(kù)中并沒(méi)有專(zhuān)門(mén)的記錄名,常常用它所在的行數(shù)

段完整性案

表示這是第幾個(gè)記錄。

例,

例:“記錄”圖示。

2.字段是否完整

字段是比記錄更小的單位,字段集合組成記錄,每個(gè)字段描述文獻(xiàn)的

某一特征,即數(shù)據(jù)項(xiàng),并有唯一的供計(jì)算機(jī)識(shí)別的字段標(biāo)識(shí)符。

例:“字段”圖示。

(三)數(shù)據(jù)價(jià)值性鑒別

1.數(shù)據(jù)時(shí)效性分析

數(shù)據(jù)是什么時(shí)間產(chǎn)生的,是否還適用于現(xiàn)在的情況是對(duì)數(shù)據(jù)進(jìn)行價(jià)值

判斷時(shí)必須要考慮的問(wèn)題,只有確定數(shù)據(jù)產(chǎn)生的時(shí)間,才能更好地確定數(shù)

據(jù)的時(shí)效性和適用范圍。例如,要研究2019年青少年短視頻使用情況,10

年前的相關(guān)數(shù)據(jù)顯然不能適用于當(dāng)前的研究,數(shù)據(jù)也就失去了它的價(jià)值。

2.數(shù)據(jù)支持性分析

數(shù)據(jù)能否有效支撐研究主題或觀(guān)點(diǎn)是數(shù)據(jù)價(jià)值判斷的一個(gè)重要方面,

有些數(shù)據(jù)即使本身沒(méi)有任何問(wèn)題,但它不能對(duì)主題起到幫助,因而在此主

題下它就是沒(méi)有價(jià)值的。如了解中國(guó)青少年網(wǎng)絡(luò)使用情況,老年人網(wǎng)絡(luò)使

用情況調(diào)查數(shù)據(jù)在這里是沒(méi)有價(jià)值的。

3.數(shù)據(jù)全面性分析

某些數(shù)據(jù)確實(shí)可以為主題服務(wù),但僅用這些數(shù)據(jù)不能充分說(shuō)明問(wèn)題,

需要有更多的數(shù)據(jù)作為它的背景或者比較對(duì)象才能揭示主題。因此,全面

結(jié)合特定主題下的相關(guān)數(shù)據(jù)才能最大程度發(fā)揮數(shù)據(jù)的價(jià)值。如研究婚姻狀

況,僅有結(jié)婚率、離婚率數(shù)據(jù)是不夠的,需要結(jié)合適婚男女性別比、夫妻

雙方收入情況、文化水平等多方面數(shù)據(jù)分析,才能體現(xiàn)相關(guān)意義,揭示研

究主題。

第二節(jié)新媒體數(shù)據(jù)預(yù)處理方法

(一)數(shù)據(jù)清洗

數(shù)據(jù)清洗(DalaCleaning)是指發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識(shí)別的錯(cuò)誤

的最后一道程序,包括糾正不一致的數(shù)據(jù)、填補(bǔ)遺漏數(shù)據(jù)、消除異常數(shù)據(jù)

以及平滑噪音數(shù)據(jù)等。與問(wèn)卷審核不同,數(shù)據(jù)錄入后的清洗一般是由計(jì)算

機(jī)而不是人工完成。進(jìn)行數(shù)據(jù)清洗的原因在于直接采集來(lái)的數(shù)據(jù)是“臟”

的,主要體現(xiàn)在數(shù)據(jù)的不完整性、異常性、錯(cuò)誤性以及冗余性。

數(shù)據(jù)清洗常見(jiàn)方法操作包括以下兒方面:參考教材講

授、演示利用

1.缺失值處理

數(shù)據(jù)并不總是完整的。對(duì)于缺失值的處理,主要是通過(guò)推斷進(jìn)行填補(bǔ),python進(jìn)行缺

大多數(shù)情況下缺失的值必須手工填入(即手工清洗)。失值處理。

2.重復(fù)值處理

參考教材講

數(shù)據(jù)庫(kù)中屬性值相同的記錄被認(rèn)為是重復(fù)的記錄,通過(guò)判斷記錄間的

授、演示利用

屬性是否相等來(lái)檢測(cè)記錄是否相等,相等的記錄合并為一條記錄(即合并/

進(jìn)行重

清除)。本部分內(nèi)容將介紹運(yùn)用Excel刪除重復(fù)數(shù)據(jù)的三種方法。Excel

復(fù)值處理。

3.異常值發(fā)現(xiàn)

數(shù)據(jù)清洗中的異常值常用畫(huà)箱形圖(Box-plot)這一方法發(fā)現(xiàn)。箱形圖

又稱(chēng)為盒須圖、盒式圖或箱線(xiàn)圖,是一種用作顯示一組數(shù)據(jù)分散情況資料結(jié)合圖示講解

的統(tǒng)計(jì)圖,因形狀如箱子而得名。箱形圖的繪制方法是先找出一組數(shù)據(jù)的箱形圖原理。

上邊緣、下邊緣、中位數(shù)和兩個(gè)四分位數(shù);然后連接兩個(gè)四分位數(shù)畫(huà)出箱

體;再將上邊緣和下邊緣與箱體相連接,中位數(shù)在箱體中間。

(二)數(shù)據(jù)集成

數(shù)據(jù)集成(DataIntegration)主要指將多個(gè)數(shù)據(jù)源中的數(shù)據(jù)整合到一個(gè)

一致的存儲(chǔ)中,解決數(shù)據(jù)的分布性和異構(gòu)性問(wèn)題。其意義在于聯(lián)通“信息

孤島”,共享信息。在企業(yè)數(shù)據(jù)集成領(lǐng)域,目前通常采用聯(lián)邦式、基于中間

件模型和數(shù)據(jù)倉(cāng)庫(kù)等方法構(gòu)建集成的系統(tǒng)。數(shù)據(jù)集成的關(guān)鍵是要建立統(tǒng)一

的數(shù)據(jù)規(guī)范結(jié)構(gòu)。在數(shù)據(jù)集成中主要有以下三大問(wèn)題需要解決:實(shí)體識(shí)別

問(wèn)題、冗余問(wèn)題、數(shù)據(jù)值沖突問(wèn)題。

(三)數(shù)據(jù)變換

數(shù)據(jù)變換是指對(duì)數(shù)據(jù)進(jìn)行規(guī)范化處理,將數(shù)據(jù)轉(zhuǎn)換或統(tǒng)一成適合挖掘

的形式。數(shù)據(jù)變換包括平滑、聚集、數(shù)據(jù)概化、規(guī)范化和屬性構(gòu)造五種途

徑。

1.平滑結(jié)合教材實(shí)例

平滑指去除噪聲、將連續(xù)的數(shù)據(jù)離散化、增加粒度。實(shí)現(xiàn)平滑主要有講解數(shù)據(jù)變換

三種方法:分箱、聚類(lèi)和回歸。的五種途徑。

2.聚集

聚集主要指對(duì)數(shù)據(jù)進(jìn)行匯總,例如在Excel中可以通過(guò)SUM、COUNT

等函數(shù)實(shí)現(xiàn)。應(yīng)用中如每班學(xué)生數(shù)可以進(jìn)行求和操作以獲得每專(zhuān)業(yè)或每學(xué)

院學(xué)生總數(shù)。

3.數(shù)據(jù)概化

數(shù)據(jù)概化是指用更高層次、更抽象的概念來(lái)取代低層次或數(shù)據(jù)層的數(shù)

據(jù)對(duì)象。例如,街道屬性就可以泛化到更高層次的概念一一城市、國(guó)家;

對(duì)于數(shù)值型的屬性,如年齡屬性(20歲、40歲、60歲),也可以映射到更

高層次概念年輕、中年和老年。

4.規(guī)范化

規(guī)范化是指將數(shù)據(jù)按比例進(jìn)行縮放,使之落入一個(gè)特定的區(qū)域,以消

除數(shù)值型屬性因大小不一而造成挖掘結(jié)果的偏差。數(shù)據(jù)規(guī)范化的主要作用

有兩個(gè),一是去掉量綱,使得指標(biāo)之間具有可比性;二是將數(shù)據(jù)限制到一

定區(qū)間,使得運(yùn)算更為便捷。規(guī)范化包括最小-最大規(guī)范化、零均值規(guī)范化

和小數(shù)定標(biāo)規(guī)范化。

5.屬性構(gòu)造

屬性構(gòu)造是指利用已有屬性集構(gòu)造出新的屬性,并加入到現(xiàn)有屬性集

合中以幫助挖掘更深層次的模式知識(shí),提高挖掘結(jié)果準(zhǔn)確性。例如:根據(jù)

寬、高屬性可以構(gòu)造一個(gè)新屬性一一面積。

(四)數(shù)據(jù)歸約

數(shù)據(jù)歸約(Reduce)是指在盡可能保持?jǐn)?shù)據(jù)原貌的前提下,最大限度

地精簡(jiǎn)數(shù)據(jù)量(完成該任務(wù)的必要前提是理解挖掘任務(wù)和熟悉數(shù)據(jù)本身內(nèi)

容,詳見(jiàn)本書(shū)第二章)。數(shù)據(jù)歸約得到的數(shù)據(jù)比原數(shù)據(jù)小得多,但可以產(chǎn)生

與原數(shù)據(jù)相同或基本相同的分析結(jié)果,提高挖掘效率。常見(jiàn)的數(shù)據(jù)規(guī)約方結(jié)合教材

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論