傳播學(xué)研究方法 課件 ch7內(nèi)容分析法-不懂編程也可做大數(shù)據(jù)內(nèi)容研究_第1頁
傳播學(xué)研究方法 課件 ch7內(nèi)容分析法-不懂編程也可做大數(shù)據(jù)內(nèi)容研究_第2頁
傳播學(xué)研究方法 課件 ch7內(nèi)容分析法-不懂編程也可做大數(shù)據(jù)內(nèi)容研究_第3頁
傳播學(xué)研究方法 課件 ch7內(nèi)容分析法-不懂編程也可做大數(shù)據(jù)內(nèi)容研究_第4頁
傳播學(xué)研究方法 課件 ch7內(nèi)容分析法-不懂編程也可做大數(shù)據(jù)內(nèi)容研究_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第七章內(nèi)容分析法—不懂編程也可做大數(shù)據(jù)內(nèi)容研究學(xué)習(xí)目標(biāo)2了解大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法的發(fā)展歷程和基本概念。熟悉大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法的操作流程。通過具體案例,學(xué)會運用大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法進行文本資料研究。本章知識框架3第七章內(nèi)容分析法—不懂編程也可做大數(shù)據(jù)內(nèi)容研究7-1內(nèi)容分析法7-2大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法7-3案例分析大數(shù)據(jù)研究之難題及解決機制操作流程及優(yōu)勢自動化數(shù)據(jù)探索傳統(tǒng)內(nèi)容分析法計算機輔助內(nèi)容分析法協(xié)同管理機制數(shù)據(jù)庫的建立抽樣編碼類目的設(shè)置編碼編碼員間信度的測試統(tǒng)計分析及可視化呈現(xiàn)4內(nèi)容分析法傳統(tǒng)內(nèi)容分析法計算機輔助內(nèi)容分析法7-1內(nèi)容分析法內(nèi)容分析法是用來做什么的?什么是內(nèi)容分析法?哪些資料是可以用來作內(nèi)容分析的?7-1內(nèi)容分析法一、傳統(tǒng)內(nèi)容分析法5(一)內(nèi)容分析法是用來做什么的?主要用于挖掘內(nèi)容的意義,分為定量內(nèi)容分析法和定性內(nèi)容分析法。定量內(nèi)容分析法:據(jù)特定的分類標(biāo)準(zhǔn),對文本中的顯性內(nèi)容進行歸類、計數(shù)、統(tǒng)計。定性內(nèi)容分析法:基于符號學(xué)理論,對文本中的符號進行深入解讀,主要關(guān)注文本的內(nèi)容或情境意義,研究傳播的語言特征。社會科學(xué)的研究者多是結(jié)合定量與定性,對文本進行歸類統(tǒng)計,再對結(jié)果進行定性解讀,以獲取文本的表面意義及深層隱性意義。7-1內(nèi)容分析法一、傳統(tǒng)內(nèi)容分析法6(二)什么是內(nèi)容分析法?內(nèi)容分析法是對傳播的顯性內(nèi)容進行客觀、系統(tǒng)和定量的描述的一種研究技巧。晚近的研究中,內(nèi)容分析法逐漸被看成一種研究方法,該方法通過一整套程序,測量文本中某些變量的數(shù)值,并運用統(tǒng)計分析方法分析這些數(shù)值涉及的關(guān)系,從而得出文本中的意義。正式編碼7-1內(nèi)容分析法一、傳統(tǒng)內(nèi)容分析法7圖7-1傳統(tǒng)內(nèi)容分析法流程圖題材擬定文獻探討母體/抽樣計算信度前測編碼員訓(xùn)練編碼表類目建構(gòu)定義分析單位數(shù)據(jù)探索編碼結(jié)果檢查統(tǒng)計分析結(jié)論數(shù)據(jù)收集12研究假設(shè)質(zhì)量控制17-1內(nèi)容分析法一、傳統(tǒng)內(nèi)容分析法8(三)哪些資料是可以用來做內(nèi)容分析的?內(nèi)容分析法中的研究對象,可以是任意一種可被傳播的信息,包括“單詞、意義、圖像、符號、思想、主題等”,包括書面的、視覺上的或是口頭表達的。內(nèi)容分析法的優(yōu)勢在它作為非介入性研究的主要研究方法之一,不受變量的類型以及信息生產(chǎn)或呈現(xiàn)的背景限制,是一種總結(jié)性的、且依賴科學(xué)研究過程、可復(fù)制的、并可進行有效推論的的分析方法。7-1內(nèi)容分析法二、計算機輔助內(nèi)容分析法9(一)作為輔助工具的計算機輔助內(nèi)容分析法:主要應(yīng)用在數(shù)據(jù)處理和數(shù)據(jù)管理兩方面。數(shù)據(jù)處理:運用在定量內(nèi)容分析中的計算機輔助編碼,基于詞庫的定義對文本內(nèi)容進行自動化歸類。在數(shù)據(jù)管理:應(yīng)用于定性內(nèi)容分析,例如數(shù)據(jù)存儲和檢索。(二)作為技術(shù)導(dǎo)入的計算機輔助內(nèi)容分析法:主要是將語言學(xué)、認(rèn)知心理學(xué)和自然語言處理技術(shù)相結(jié)合,通過語義建模讓計算機快速處理大規(guī)模的文本,進而挖掘文本的深層意義。7-1內(nèi)容分析法三、大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法10人工智能在內(nèi)容分析法的應(yīng)用中,較多是計算機對數(shù)據(jù)的感知層面,如數(shù)據(jù)采集、定量數(shù)據(jù)的趨勢描繪,以及自動化情緒分析等。通過智能算法進行大數(shù)據(jù)技術(shù)輔助內(nèi)容分析,如線上完成數(shù)據(jù)庫建立、類目建構(gòu)、信度計算、內(nèi)容編碼、質(zhì)量控制、統(tǒng)計分析和可視化呈現(xiàn)。7-1內(nèi)容分析法三、大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法11圖7-2內(nèi)容分析法的整體發(fā)展脈絡(luò)傳統(tǒng)內(nèi)容分析法計算機輔助內(nèi)容分析法大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法人工(Paper→Excel)輔助工具:數(shù)據(jù)處理與分析技術(shù)導(dǎo)入:語意建模大數(shù)據(jù)技術(shù)及算法:

機器學(xué)習(xí)、網(wǎng)路挖掘、在線內(nèi)容分析核心與實現(xiàn)技術(shù)人機結(jié)合:機器或數(shù)據(jù)驅(qū)動12大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法大數(shù)據(jù)研究之難題及解決機制操作流程及優(yōu)勢自動化數(shù)據(jù)探索7-2

大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法網(wǎng)路挖掘機器學(xué)習(xí)情緒分析共現(xiàn)詞分析社交網(wǎng)絡(luò)分析7-2大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法一、大數(shù)據(jù)研究之難題及解決機制13大數(shù)據(jù)自身在體量、類型、價值以及處理的技術(shù)方面都是龐大且具有一定難度的。大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法結(jié)合社會科學(xué)的概念與方法,以覆蓋度、測量和解釋這三個重要的維度為重心,聚焦人工智能對文本的感知、認(rèn)知和判斷層面來處理文本大數(shù)據(jù)所面臨的問題。內(nèi)容分析法的研究流程,融合了人工智能算法和大數(shù)據(jù)技術(shù),形成集網(wǎng)絡(luò)挖掘、機器學(xué)習(xí)、內(nèi)容編碼、統(tǒng)計分析、情感分析等于一體的文本大數(shù)據(jù)挖掘與分析平臺(DiVoMiner?)。7-2大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法二、操作流程及優(yōu)勢14大數(shù)據(jù)技術(shù)和內(nèi)容分析法的基本流程,運用網(wǎng)絡(luò)挖掘、機器學(xué)習(xí)、自然語言文本處理、人工智能編碼、實時信度測試、統(tǒng)計分析、社交網(wǎng)絡(luò)分析等實現(xiàn)文本大數(shù)據(jù)的在線處理,按需產(chǎn)出文本大數(shù)據(jù)項目研究成果。這些優(yōu)勢體現(xiàn)在了內(nèi)容分析的研究數(shù)據(jù)庫的建立、抽樣、信度、編碼、統(tǒng)計分析、可視化呈現(xiàn)等步驟中。具體的操作流程如下:正式編碼7-2大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法二、操作流程及優(yōu)勢15圖7-1傳統(tǒng)內(nèi)容分析法流程圖題材擬定文獻探討母體/抽樣(內(nèi)建抽樣模組)計算信度(內(nèi)建模組)前測編碼員訓(xùn)練編碼表類目建構(gòu)定義分析單位數(shù)據(jù)探索實時編碼結(jié)果檢查統(tǒng)計分析/深度挖掘結(jié)論數(shù)據(jù)收集12研究假設(shè)質(zhì)量控制1可視化:傳統(tǒng)步驟:在線實現(xiàn):DiVoMiner?特有7-2大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法二、操作流程及優(yōu)勢16(一)建構(gòu)及清理數(shù)據(jù)庫。(二)完成編碼類目設(shè)置后,可在線編輯及調(diào)整編碼簿。(三)正式編碼之前,組織編碼員進行編碼訓(xùn)練及進行前測編碼,

自動計算編碼信度,當(dāng)信度達至可接受水平時,開始正式編碼。(四)最終自動統(tǒng)計分析編碼結(jié)果和呈現(xiàn)可視化效果。7-2大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法三、自動化數(shù)據(jù)探索17(一)網(wǎng)絡(luò)挖掘互聯(lián)網(wǎng)中普遍使用的數(shù)據(jù)挖掘方式,利用數(shù)據(jù)挖掘技術(shù)從網(wǎng)絡(luò)文檔和服務(wù)中發(fā)現(xiàn)和提取信息,分為三種類型:內(nèi)容挖掘、結(jié)構(gòu)挖掘和使用行為挖掘。在內(nèi)容分析過程中,多以內(nèi)容挖掘輔以定量的使用行為挖掘。(二)機器學(xué)習(xí)機器學(xué)習(xí)是文本挖掘領(lǐng)域中較為普遍應(yīng)用的技術(shù),通過對數(shù)據(jù)或文本的持續(xù)觀察生成概率模型、“學(xué)習(xí)”數(shù)據(jù)的規(guī)律,也就是機器“學(xué)習(xí)”經(jīng)驗,并自動分析和判斷其他未知的數(shù)據(jù)。7-2大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法三、自動化數(shù)據(jù)探索18(三)情緒分析(意見挖掘)或機器學(xué)習(xí)等技術(shù)對文本的主觀態(tài)度、情緒或觀點進行語義定向或極性分析,情感分析以正面、中立和負面為主要類別。使用機器學(xué)習(xí)技術(shù)的自動化情緒分析,是通過外部知識對文本進行分類。(四)共現(xiàn)詞分析共現(xiàn)詞分析是用于“描述兩個詞同時出現(xiàn)的頻率的程度”如下圖7-8,我們以國內(nèi)天涯社區(qū)和百度貼吧等論壇中對“一帶一路”倡議的討論文本進行內(nèi)容分析。7-2大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法三、自動化數(shù)據(jù)探索19圖7-8共現(xiàn)詞關(guān)系圖7-2大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法三、自動化數(shù)據(jù)探索20(五)社交網(wǎng)絡(luò)分析在社會行為學(xué)科中,社交網(wǎng)絡(luò)研究關(guān)注社會實體之間的關(guān)系,研究關(guān)系之中的模式及內(nèi)涵。度中心性、中介中心性和接近中心性是研究社交網(wǎng)絡(luò)節(jié)點中心性最為重要,也是使用最為廣泛的三個指標(biāo)。度中心性:一個點與其他點直接連接的總和,反映重要性。中介中心性:計算經(jīng)過一個點的數(shù)量。接近中心性:一個點到所有點的距離的總和,考量每個節(jié)點到其他節(jié)點的最短路線。7-2大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法三、自動化數(shù)據(jù)探索21圖7-9社交網(wǎng)絡(luò)分析圖227-3

案例分析線上數(shù)據(jù)的采集線下數(shù)據(jù)的上載案例分析協(xié)同管理機制數(shù)據(jù)庫的建立抽樣編碼類目的設(shè)置編碼編碼員間信度的測試統(tǒng)計分析及可視化呈現(xiàn)選擇抽樣方法確定分析單位23案例:“名人代言在雜志廣告中的應(yīng)用”分析出現(xiàn)在37種不同雜志中的廣告代言人,了解在雜志廣告中使用名人代言人的情況。共有3位編碼員分別對37本雜志中的2,358個廣告進行內(nèi)容編碼。分析類目包括名人的性別、地位、類型,名人特點,如吸引程度和專長。廣告類別涉及20種產(chǎn)品或服務(wù),如通訊產(chǎn)品、金融服務(wù)、時尚、視頻、媒體、家裝等。編碼員依據(jù)編碼簿完成內(nèi)容編碼后,整理編碼結(jié)果進行統(tǒng)計分析及做出結(jié)論,即完成了傳統(tǒng)內(nèi)容分析法的基本流程。7-3

案例分析24案例:“整合框架與解釋水平:海內(nèi)外報紙對‘一帶一路’報道

的對比分析”運用DiVoMiner?文本大數(shù)據(jù)挖掘及分析平臺,進行數(shù)據(jù)處理、信度測試和內(nèi)容編碼的操作。整個研究過程中,有8位編碼員分別使用了多套不同的編碼簿做內(nèi)容編碼,總樣本數(shù)有10,450篇新聞報道。信度測試環(huán)節(jié),運用DiVoMiner?一鍵隨機抽樣建立了測試數(shù)據(jù)庫。內(nèi)容編碼環(huán)節(jié),為了測量“框架策略”和“解釋水平”,研究人員利用平臺預(yù)先建立及處理好的含一萬多篇新聞報道的編碼數(shù)據(jù)庫,對多個不同的指標(biāo)進行測量,針對顯性的維度進行自動編碼。7-3

案例分析25案例:“整合框架與解釋水平:海內(nèi)外報紙對‘一帶一路’報道

的對比分析”(續(xù))研究人員又進行了二次編碼,對文章的篇幅、文章出現(xiàn)的頻率、配圖以及直接引語數(shù)量進行了再次編碼。除了量化內(nèi)容分析外,大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析法對質(zhì)化內(nèi)容分析也有幫助。例如,扎根理論(Groundedtheory)研究路徑中比較常見的開放性編碼(Openingcoding),從分析資料中識別特征,進行歸類,從而形成類目范疇。7-3

案例分析26案例:“如何滿足受眾:日?;W(wǎng)絡(luò)直播的技術(shù)與內(nèi)容考察”在處理文本數(shù)據(jù)方面,作者利用DiVoMiner?線上采集數(shù)據(jù)建立數(shù)據(jù)庫。通過設(shè)置開放式題目進行開放式編碼,從新聞報道內(nèi)容中提煉關(guān)鍵內(nèi)容,進行線上內(nèi)容編碼。編碼完成后,所有編碼結(jié)果自動匯總,針對編碼結(jié)果歸納內(nèi)容范疇,對日?;辈サ念愋瓦M一步歸納,最終提煉出主要的直播類型,包括生活流直播、獵奇直播和功用直播。7-3

案例分析27案例:以下我們以“兩岸四地媒介融合的創(chuàng)新實踐與發(fā)展趨勢”

為例,展示具體的操作流程。這個研究總計分析了44,936篇關(guān)于媒介融合的新聞報道和752篇學(xué)術(shù)文獻。將傳媒業(yè)界的報道及學(xué)術(shù)文獻中對媒介融合現(xiàn)狀和趨勢探討作為主線,對比分析兩岸四地的媒體對媒介融合的關(guān)注焦點,呈現(xiàn)傳媒業(yè)界和學(xué)術(shù)界在探討和論述媒介融合的現(xiàn)狀、趨勢和異同。7-3

案例分析28下面將按照該方法的主要步驟(圖7-12),逐步介紹每個步驟的操作。新聞媒體建立業(yè)界新聞報導(dǎo)數(shù)據(jù)庫設(shè)置類目制作編碼簿機器編碼學(xué)術(shù)文獻建立學(xué)術(shù)文獻數(shù)據(jù)庫設(shè)置類目制作編碼簿信度測試網(wǎng)路挖掘機器編碼和人工編碼上傳文本數(shù)據(jù)圖7-12“兩岸四地媒介融合的創(chuàng)新實踐與發(fā)展趨勢”研究流程圖7-3

案例分析7-3案例分析一、協(xié)同管理機制29研究團隊里不同的人執(zhí)行對應(yīng)的工作,輔助整個研究項目有序、高效地進展。管理員(研究人員)可以在研究項目開始之前設(shè)置研究員、編碼員和督導(dǎo)員的角色。7-3案例分析二、數(shù)據(jù)庫的建立30首先建立總體數(shù)據(jù)庫和樣本數(shù)據(jù)庫。研究數(shù)據(jù)來源通常有兩種形式,一種是線上實時采集的數(shù)據(jù),直接進入數(shù)據(jù)庫,一種是把線下已有的數(shù)據(jù),上載至數(shù)據(jù)庫。建立兩個數(shù)據(jù)庫,新聞報道數(shù)據(jù)庫和學(xué)術(shù)文獻數(shù)據(jù)庫。(一)線上數(shù)據(jù)的采集線上數(shù)據(jù)采集運用了邏輯關(guān)鍵詞構(gòu)建媒介融合的概念,總結(jié)在新聞報道中不同說法和名稱,提升關(guān)于媒介融合線上數(shù)據(jù)采集的覆蓋度。設(shè)定樣本的媒體類型、媒體來源名稱和時間范圍,按照邏輯關(guān)鍵詞組進行數(shù)據(jù)采集。7-3案例分析二、數(shù)據(jù)庫的建立31(二)線下數(shù)據(jù)的上載線下數(shù)據(jù)庫的建立,主要是通過上載本地資料,因案例中是想研究學(xué)術(shù)界對媒介融合的論述,因而選取了中國知網(wǎng)中國期刊全文數(shù)據(jù)庫的核心期刊中,篇名含有關(guān)鍵詞“媒介融合”的學(xué)術(shù)文獻。共計752篇上傳至DiVoMiner?平臺后建立了本地學(xué)術(shù)文獻數(shù)據(jù)庫。7-3案例分析三、抽樣32(一)選擇抽樣方法在確定研究題材和研究假設(shè)的前提下,研究者需要界定內(nèi)容分析的對象,即是分析樣本,可以是符合研究對象的總體,也可以是使用抽樣方法選取的部分樣本。內(nèi)容分析中比較常用的抽樣方法主要是簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣和整群抽樣。簡單隨機抽樣是最為常見的抽樣方法,總體中每個單位樣本被選中的機會都是獨立且相等的。7-3案例分析三、抽樣33(二)確定分析單位分析單位是研究過程中被分析的主體。單位化的過程即為分析對象賦值的過程,在內(nèi)容分析中,分析單位可以是詞語、句子、段落或整篇文章。7-3案例分析三、抽樣34表7-1分析單位示例研究者主題總體樣本分析單位Bramlett-Solomon&Subramaninan(1999)雜志廣告中的老年人形象1990-1997年《生活和烏木樹》中的全部廣告除分類廣告外的所有廣告65以上的人物、或者有灰白頭發(fā)、面部多皺紋、使用拐杖Mastro&Greenberg(2000)電視節(jié)目中的少數(shù)族裔1996年秋季、黃金時間段的電視節(jié)目對每一個廣告電視網(wǎng)的節(jié)目隨機構(gòu)建合成星期包換少數(shù)種族人物、主要角色中有少數(shù)種族的節(jié)目Signorielli&Kahlenberg(2001)黃金時段電視節(jié)目1990-1998年黃金時段的廣播電視每年秋季或春季一個星期的節(jié)目主角、配角及其他輔助角色從事的活動Lauzen&Dozier(1999)1994-1995年時段電視劇節(jié)目幕后的女性工作者1994-1995年時段內(nèi)收視率最高的65部連續(xù)劇和戲劇每個劇作中的一集從節(jié)目工作人員名單推斷幕后工作者的性別7-3案例分析四、編碼類目的設(shè)置35確定研究對象后,依據(jù)研究目的和研究問題設(shè)置類目??砂凑漳撤N框架對文本材料的內(nèi)容進行分類,進而賦值、編碼,轉(zhuǎn)化成可用于統(tǒng)計分析的數(shù)據(jù),探索文本中的意義和洞察。類目的基本形式由題目和選項組成,類似問卷調(diào)查中的題目和選項。區(qū)別是問卷調(diào)查是由調(diào)查員詢問受訪者,而類目表是由編碼員檢閱文本資料,從文本資料中找到答案并填答問題。在大數(shù)據(jù)技術(shù)輔助在線內(nèi)容分析過程中,類目設(shè)置支持本地類目上傳和線上創(chuàng)建、修正類目,類目內(nèi)容的更新變動也會同步至統(tǒng)計分析結(jié)果中。7-3案例分析五、編碼36編碼是將內(nèi)容分析的文本,按照類目進行歸類的過程。區(qū)分為:人工編碼、機器輔助人工編碼、機器自動編碼。人工編碼模式中,關(guān)鍵詞的作用是在內(nèi)容編碼時,文本會自動化標(biāo)注關(guān)鍵詞;機器編碼時,關(guān)鍵詞是執(zhí)行自動編碼的選項依據(jù)。正式編碼之前,是需要對不同編碼員

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論