傳播學研究方法 課件 ch11-量化資料分析-數(shù)字會說話-ch18-大數(shù)據(jù)的分析與可視化-用圖表勾勒網(wǎng)絡關系_第1頁
傳播學研究方法 課件 ch11-量化資料分析-數(shù)字會說話-ch18-大數(shù)據(jù)的分析與可視化-用圖表勾勒網(wǎng)絡關系_第2頁
傳播學研究方法 課件 ch11-量化資料分析-數(shù)字會說話-ch18-大數(shù)據(jù)的分析與可視化-用圖表勾勒網(wǎng)絡關系_第3頁
傳播學研究方法 課件 ch11-量化資料分析-數(shù)字會說話-ch18-大數(shù)據(jù)的分析與可視化-用圖表勾勒網(wǎng)絡關系_第4頁
傳播學研究方法 課件 ch11-量化資料分析-數(shù)字會說話-ch18-大數(shù)據(jù)的分析與可視化-用圖表勾勒網(wǎng)絡關系_第5頁
已閱讀5頁,還剩389頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第十一章量化資料分析—數(shù)字會說話學習目標2了解量化資料分析的基本概念知曉量化資料的預處理(資料清理、除錯、加權)掌握單變量資料的基本分析方法理解推論統(tǒng)計與假設檢驗的基本概念學習雙變量資料的基本分析方法初窺多變量資料的基本分析方法運用實際抽樣調(diào)查資料進行資料分析本章知識框架3第十一章量化資料分析—數(shù)字會說話11-1基礎知識11-2單變量分析個案與變量11-3雙變量分析11-4多變量分析變量的測量類別變量的描述統(tǒng)計連續(xù)變量的描述統(tǒng)計交叉分析卡方檢驗兩組平均數(shù)比較與統(tǒng)計檢驗數(shù)據(jù)預處理樣本代表性推論統(tǒng)計的基本概念多組平均數(shù)比較與統(tǒng)計檢驗雙變量相關分析雙因數(shù)方差分析線性回歸分析二分類邏輯斯回歸分析411-1

基礎知識基礎知識個案與變量變量的測量數(shù)據(jù)預處理樣本代表性11-1基礎知識一、個案與變量5一般來說,我們可以把資料分成兩大型態(tài),一種是“結構資料”(Structureddata),另一種是“非結構資料”(Unstructureddata)。

結構資料:指的是數(shù)據(jù)可以用一種統(tǒng)一的結構來呈現(xiàn)的數(shù)據(jù)非結構資料:指的是無法用一種統(tǒng)一的結構來呈現(xiàn)的數(shù)據(jù)11-1基礎知識一、個案與變量6在表11-1中,趙○○、錢○○、孫○○…等,代表的是個案。“性別”、“年齡”、“教育程度”…等,是用來描述個案的某種特性,稱為“變量”(Variable)。

變量1變量2變量3變量4變量5變量6性別

年齡教育程度婚姻狀況對于自己生活的滿意度對網(wǎng)路媒體報導新聞的評價個案一趙○○1:男2:30-39歲5:大學及以上1:未婚2:不滿意60個案二錢○○2:女1:18-29歲2:初中3:已婚1:非常不滿意40個案三孫○○2:女5:60及以上3:高中職2:同居4:非常滿意90個案四李○○1:男4:50-59歲4:???:離婚分居4:非常滿意70個案五王○○2:女3:40-49歲1:小學以下5:配偶去世3:滿意50表11-1

結構資料的例子11-1基礎知識一、個案與變量7所謂“變量”(Variable),指的是,針對“某種特征”所進行的“經(jīng)驗測量”。例如,“婚姻狀況”是這個變數(shù)的「變量名稱」(Variablename),“未婚、已婚、同居、已離婚或分居、配偶去世、其他狀況”是這個變量的“變量值”(Variablevalue)。11-1基礎知識二、變量的測量8定類尺度(Nominalscale):利用不同數(shù)值來標明某個“類別名目”的特征。但數(shù)值之間不能做大小順序比較、不能做加減差距比較、也不能做乘除倍數(shù)比較。定序尺度(Ordinalscale):利用不同數(shù)值來代表某一特征的“大小順序”,但順序之間的間距,是否為等距關系,并不明確。定距尺度(Intervalscale):利用不同數(shù)值來代表某一特征的“加減差距”,差距之間的間距,是等距關系,但沒有絕對的零點。定比尺度(Ratioscale):利用不同數(shù)值來代表某一特征的“倍數(shù)差距”,差距之間的間距,是等距關系,同時有絕對的零點。11-1基礎知識二、變量的測量9類別變量(Categoricalvariable):透過定類變量與定序變量測量得到的資料。連續(xù)變量(Continuousvariable):通過定距變量與定比變量測量得到的資料。因為不同種類的變量(類別變量vs.連續(xù)變量)會適用不同的統(tǒng)計分析方法。(見表11-2)

11-1基礎知識二、變量的測量10表11-2不同測量尺度的變量比較例子數(shù)學關系類別變量CategoricalVariable連續(xù)變量ContinuousVariable定類變量NominalScale定序變量OrdinalScale定距變量IntervalScale定比變量RatioScale

????

╳???+;-╳╳??*;/╳╳╳?例子性別1:男2:女教育程度1:小學以下2:初中3:高中職4:???:大學及以上智力測驗成績080120…沒有絕對零點數(shù)值0不代表真正的零評價分數(shù)406090…有絕對零點數(shù)值0代表真正的零11-1基礎知識三、數(shù)據(jù)預處理11通過數(shù)據(jù)預處理來解決數(shù)據(jù)收集與錄入質(zhì)量問題及變量間的邏輯問題。錄入質(zhì)量問題

如“性別”變量的代碼選項只有“1”或“2”,但統(tǒng)計結果出現(xiàn)其它代碼如“3”等。變量間的邏輯問題

主要出現(xiàn)在邏輯跳答問題中。11-1基礎知識四、樣本代表性12如果這個資料是個抽樣調(diào)查資料,我們還可以透過頻數(shù)分布統(tǒng)計觀察一下樣本在一些重要變量上的分布,是否和母體相符?是不是一個可以代表母體的“代表性樣本”(Representativesample)?11-1基礎知識四、樣本代表性13“調(diào)查母體”(Surveypopulation)

是〈該校網(wǎng)絡傳播學院本科學生〉“抽樣框”(Samplingframe)

是〈該校2018學年第二學期網(wǎng)絡傳播學院正式注冊本科生學生名單〉共3050人,調(diào)查預計成功訪問1000份樣案例講解一:

樣本母體檢驗結果人數(shù)百分比人數(shù)百分比樣本與母體不一致Chi-Square=523.821df=1P=0.000<0.05男41539.273924.2女64360.8231175.8合計1058100.03050100.0表11-3訪問成功樣本代表性檢驗的例子:性別(未加權)

樣本母體檢驗結果人數(shù)百分比人數(shù)百分比樣本與母體一致Chi-Square=0.000df=1P=0.998>0.05男25624.273924.2女80275.8231175.8合計1058100.03050100.0表11-6訪問成功樣本代表性檢驗的例子:性別(加權后)11-1基礎知識四、樣本代表性14和加權前比較,加權后的樣本,主要是在對學校食堂表示「一般」的回答比例,有相對較大的百分比差異(38.8%vs.39.3%)。案例講解二:表11-9分析變量未加權頻數(shù)分布表的例子:總體來說,對于食堂所提供的餐食服務,您滿不滿意?(未加權)表11-10分析變量加權后頻數(shù)分布表的例子:總體來說,對于食堂所提供的餐食服務,您滿不滿意?(加權后)

FrequencyPercentValidPercentCumulativePercentValid1:

非常不滿意181.71.71.72:

不太滿意1039.79.711.43:

一般41138.838.850.34:

還算滿意47344.744.795.05:

非常滿意535.05.0100.0合計1058100.0100.0

FrequencyPercentValidPercentCumulativePercentValid1:

非常不滿意151.41.41.42:

不太滿意1049.89.811.23:

一般41639.339.350.64:

還算滿意47244.644.695.25:

非常滿意514.84.8100.0合計1058100.0100.0

11-1基礎知識四、樣本代表性15樣本代表性對于一個抽樣調(diào)查資料來說相當重要,但卻是常被研究者所忽略,實務上常看到許多研究者一拿到問卷調(diào)查資料,不問其樣本代表性就開始進行分析,這樣的作法其實是有欠考慮的。

研究者如果使用一個不具樣本代表性的資料來進行分析,或者不經(jīng)過樣本代表性的檢驗程序就進行分析,其實是很難說服別人相信其分析結果與研究結論的。1611-2單變量分析單變量分析類別變量的描述統(tǒng)計連續(xù)變量的描述統(tǒng)計推論統(tǒng)計的基本概念頻數(shù)分布:復選題與單選題集中趨勢:眾數(shù)與中位數(shù)頻數(shù)分布分位數(shù):四分位數(shù)?百分位數(shù)集中趨勢:中位數(shù)、平均數(shù)離散趨勢:全距、四分位差、方差、標準差分布形狀:偏態(tài)系數(shù)、峰態(tài)系數(shù)圖形:直方圖離散趨勢:異眾比圖形:條形圖與圓餅圖中心極限定理統(tǒng)計顯著性與假設檢驗11-2單變量分析一、類別變量的描述統(tǒng)計17(一)頻數(shù)分布:復選題與單選題←表11-12類別單變量頻數(shù)分布的例子:復選題ResponsesPercentofCasesNPercent經(jīng)濟119221.3%59.5%兩岸關系3195.7%15.9%教育65011.6%32.5%醫(yī)療2254.0%11.2%治安3816.8%19.0%環(huán)保1973.5%9.8%司法2364.2%11.8%社會倫理與價值2724.9%13.6%地方建設941.7%4.7%國家認同1683.0%8.4%食品安全89115.9%44.5%薪資所得4978.9%24.8%水土保持711.3%3.5%政黨對立3746.7%18.7%其他310.6%1.6%合計5597100.0%279.6%n=2002

Q:那一項是某地當前最重要的問題?(復選最多三項)

FrequencyPercentValidPercent

CumulativePercent非常不滿意552.82.82.8不滿意42021.021.023.8滿意142070.970.994.7非常滿意1065.35.3100.0合計2002100.0100.0

Q:整體而言,你對於你的生活滿不滿意?表11-13類別單變量頻數(shù)分布的例子:單選題11-2單變量分析一、類別變量的描述統(tǒng)計18(二)集中趨勢:眾數(shù)與中位數(shù)所謂“眾數(shù)”(Mode),是指資料數(shù)值中出現(xiàn)次數(shù)最多的那一個數(shù)值,當資料中出現(xiàn)最多次數(shù)的數(shù)值不只一個時,則眾數(shù)就有多個。如果變量是屬于類別變量,則眾數(shù)指的是,資料數(shù)值中出現(xiàn)次數(shù)最多的那一個數(shù)值所對應的“類目”。所謂“中位數(shù)”(Median),是指將資料的數(shù)值從小到大排序后,位置處于最中間那一個數(shù)。11-2單變量分析一、類別變量的描述統(tǒng)計19(三)離散趨勢:異眾比“異眾比”(Variationratio)也稱離異比例,指的是“非眾數(shù)的次數(shù)”在“全部觀察值中”所占的比例。11-2單變量分析一、類別變量的描述統(tǒng)計20(四)圖形:條形圖與圓鉼圖類別變量可以透過“條形圖”(Barchart)與“圓餅圖”(Piechart)來呈現(xiàn)其頻數(shù)分布圖形。條形圖圓餅圖11-2單變量分析二、連續(xù)變量的描述統(tǒng)計21(一)頻數(shù)分布(二)分位數(shù):四分位數(shù)、百分位數(shù)四分位數(shù)指的是用三個點將資料均分成四等分,這三個點分別是:第1四分位點取值(Q1,即第25%位置對應值)、第2四分位點取值(Q2,即第50%位置對應值)及第3四分位點取值(Q3,即第75%位置對應值)。百分位數(shù)指的是用99個點將資料均分成100等分。11-2單變量分析二、連續(xù)變量的描述統(tǒng)計22(三)集中趨勢:中位數(shù)、平均數(shù)所謂“平均數(shù)”,指的是“所有數(shù)值加起來的總和,除以資料個數(shù),所得的商”。但由于平均數(shù)會受到極端值的影響,會把資料的中心往極端值的方向移動,此一特性容易使人誤判資料的重心所在。

由于中位數(shù)不會受到極端值的影響,因此,目前流行的作法是同時呈現(xiàn)資料的中位數(shù)與平均數(shù),以更平衡的方式呈現(xiàn)資料的中心點。11-2單變量分析二、連續(xù)變量的描述統(tǒng)計23(四)離散趨勢:全距、四分位差、方差、標準差所謂“全距”指的是“把資料數(shù)值的最大值(Maximumvalue)減去數(shù)值的最小值(Minimumvalue)”所得的結果。所謂“四分位差”指的是資料數(shù)值中的第3四分位點取值(第75%位置對應值)與第1四分位點取值(第25%位置對應值)的差距,也就是變量中間50%的全距(第75%位置對應值減去第25%位置對應值)。11-2單變量分析二、連續(xù)變量的描述統(tǒng)計24(四)離散趨勢:全距、四分位差、方差、標準差(續(xù))所謂“方差”,就樣本資料言,指的是“把所有(觀察值與平均數(shù)的差距平方),加以總和,再除以(資料個數(shù)-1),所得的商”。方差的本質(zhì)是在測量資料中所有觀察值到平均數(shù)的平均距離,是最常被使用的離散測量數(shù)?!皹藴什睢本褪前逊讲铋_平方,當資料的測量具有單位時(例如:天數(shù)、身高、分數(shù)…等等),會使用標準差來代替方差。11-2單變量分析二、連續(xù)變量的描述統(tǒng)計25(四)離散趨勢:全距、四分位差、方差、標準差(續(xù))案例解說樣本資料(5個數(shù)值)1,3,5,7,9中位數(shù)5平均數(shù)5(1+3+5+7+9)/5=5觀察值與平均數(shù)的差距-42024(1-5)(3-5)(5-5)(7-5)(9-5)差距的平方16,4,0,4,16差距平方的總和4016+4+0+4+16=40資料個數(shù)-145-1=4方差1040/4=10標準差3.16方差與標準差的計算方法示例11-2單變量分析二、連續(xù)變量的描述統(tǒng)計26(五)分布形狀:偏態(tài)系數(shù)、峰態(tài)系數(shù)“偏態(tài)系數(shù)”(Skewness)

右偏、左偏、正態(tài)分布

平均數(shù)≤中位數(shù)≤眾數(shù)圖11-5右偏分布時的眾數(shù)中位數(shù)平均數(shù)圖11-6左偏分布時的眾數(shù)中位數(shù)平均數(shù)11-2單變量分析二、連續(xù)變量的描述統(tǒng)計27(六)圖形:直方圖直方圖適用于連續(xù)變量以矩形高度來表達各類別的相對差異。直方圖的矩形彼此之間互相鄰接,其中沒有間隔,這是與條形圖最大不同之處(條形圖中的長條,彼此之間是有間隔的,分開的)。11-2單變量分析三、推論統(tǒng)計的基本概念28實務上由于我們所獲得的資料很多都是經(jīng)過抽樣調(diào)查所得的“樣本資料”(Sampledata),而不是“母體資料”(Populationdata),如果要從樣本資料來推論母體,就必須考慮“抽樣誤差”(Samplingerror)的問題。抽取第1套樣本得到的平均天數(shù)可能是6,第2套樣本可能是5,第3套樣本可能是7,....,每一套樣本所得到的平均使用天數(shù)可能都會不一樣,那我們?nèi)绾瓮乒滥阁w中對于社交媒體真正實際的平均使用天數(shù)呢?11-2單變量分析三、推論統(tǒng)計的基本概念29在大樣本、且母體標準差未知的情況下從樣本平均數(shù)推估母體的平均數(shù)【樣本平均數(shù)±1.96個標準誤】的這個區(qū)間范圍,包含母體平均數(shù)的機率是95%;【樣本平均數(shù)±2.58個標準誤】的這個區(qū)間范圍,包含母體平均數(shù)的機率是99%;【樣本平均數(shù)±3.29個標準誤】的這個區(qū)間范圍,包含母體平均數(shù)的機率是99.9%。(一)中心極限定理11-2單變量分析三、推論統(tǒng)計的基本概念30

從樣本平均數(shù)推估母體的平均數(shù)(續(xù))11-2單變量分析三、推論統(tǒng)計的基本概念31從樣本百分比推估母體的百分比表11-19以樣本百分比估計母體百分比的區(qū)間估計(95%、99%、99.9%置信水平)

11-2單變量分析三、推論統(tǒng)計的基本概念32從母體抽取出來的任何一個樣本﹐一定會有隨機抽樣誤差,所以,樣本統(tǒng)計量或多或少不會和母體參數(shù)完全一致、一個樣本資料分析結果如果要被視為一個具有實質(zhì)意義的顯著結果,研究者就必須要排除:“該分析結果是由隨機抽樣誤差所導致”這個因素。(二)統(tǒng)計顯著性與假設檢定11-2單變量分析三、推論統(tǒng)計的基本概念33在做出決策判斷前,研究者需先設定決策標準,也就是當決策判斷發(fā)生錯誤時可以容忍的犯錯機率,這個犯錯率稱為“顯著水平”(Significancelevel,又稱alphalevel),一般會用希臘字母α代表,通常設為5%,即α=0.05;有時也可以設定α=0.01(只容忍犯1%的錯誤)或α=0.001(只容忍犯0.1%的錯誤)。為了做成決策判斷,研究者必須計算“概率”(Probability),了解得到某一樣本檢驗值(testingvalue,例如t-testvalue,F(xiàn)-testvalue)的出現(xiàn),歸因于隨機抽樣誤差的概率是多少。一般會用p

值(pvalue)來代表概率,p

值的意涵是,得到某一檢驗值(或更極端檢驗值)歸因為隨機誤差的機率(probability)。(二)統(tǒng)計顯著性與假設檢定(續(xù))11-2單變量分析三、推論統(tǒng)計的基本概念34如果得到某一檢驗值的機率p

很大,大于研究者所設定的顯著水平α(例如:大于0.05),研究者就不能排除該結果是隨機抽驗誤差所造成,因此研究者就會下結論說,此一分析結果并沒有超過抽驗誤差允許的范圍,并沒有達到統(tǒng)計上的顯著差異。如果得到某一檢驗值的機率p

很小,小于研究者所設定的顯著水平α(例如:小于0.05),研究者就可以排除該結果是隨機抽驗誤差所造成,因此研究者就會下結論說,此一分析結果已經(jīng)超過抽驗誤差允許的范圍,達到統(tǒng)計上的顯著差異。當我們這樣說的時候,犯錯的機率小于5%。(二)統(tǒng)計顯著性與假設檢定(續(xù))11-2單變量分析三、推論統(tǒng)計的基本概念35運用統(tǒng)計顯著性進行假設檢驗的流程有以下幾個步驟(二)統(tǒng)計顯著性與假設檢定(續(xù))步驟一:決定虛無假設與研究假設虛無假設研究假設步驟二:決定顯著水平α顯著水平α指的是:“當虛無假設H0為真而研究者卻拒絕H0時,所犯錯的機率”。通常設定α=0.05(即如果顯著水平小于0.05,拒絕虛無假設,接受研究假設,可能犯錯誤的概率是5%)。11-2單變量分析三、推論統(tǒng)計的基本概念36(二)統(tǒng)計顯著性與假設檢定(續(xù))步驟三:選擇統(tǒng)計值通常使用Z

值或Chi-Square卡方值來檢驗類別變量的兩個百分比差距有無達到統(tǒng)計上的顯著差異;使用t

值來檢驗連續(xù)變量的兩組平均數(shù)差距有無達到統(tǒng)計上的顯著差異;使用F

值來檢驗三組(含)以上連續(xù)變量的平均數(shù)差距有無達到統(tǒng)計上的顯著差異。11-2單變量分析三、推論統(tǒng)計的基本概念37(二)統(tǒng)計顯著性與假設檢定(續(xù))步驟四:計算檢驗統(tǒng)計值以及對應的p值p

值定義:如果H0成立(即,如果兩變量無關/無差異的架設成立),則得到某一樣本檢驗值(或更極端檢驗值)歸因為隨機誤差的機率。11-2單變量分析三、推論統(tǒng)計的基本概念38(二)統(tǒng)計顯著性與假設檢定(續(xù))步驟五:進行決策判定

3911-3

雙變量分析雙變量分析交叉分析卡方檢驗兩組平均數(shù)比較與統(tǒng)計檢驗多組平均數(shù)比較與統(tǒng)計檢驗雙變量相關分析設定假設解讀報表分析結論獨立樣本T檢驗配對樣本T檢驗設定假設解讀報表分析結論4011-3

雙變量分析利用統(tǒng)計方法探索兩個變量之間的“關系”(Relationship),例如,

A變量的變化會不會與B變量的變化有關系?如果有關系,關系強度是否顯著?依據(jù)不同變量類型使用不同分析方法圖11-20基本統(tǒng)計分法的歸類:雙變量因變量(一個)類別變量(nominal/ordinal)連續(xù)變量(interval/ratio)

自變量(一個)類別變量(nominal/ordinal)交叉分析卡方檢驗(兩組)獨立樣本T檢驗(兩組)配對樣本T檢驗(多組)單因素方差分析連續(xù)變量(interval/ratio)邏輯斯回歸分析:單變量相關分析線性回歸分析:單變量11-3雙變量分析一、交叉分析卡方檢驗41(一)設定假設如果我們想要知道“教育程度”這個因素會不會對于民眾“快樂感”產(chǎn)生影響?想要回答這個提問,我們首先可以把上述想法轉(zhuǎn)化成研究問題如下:“民眾的幸福感,會不會因為其教育程度的不同而有差異?”;然后,我們提出虛無假設(H0):民眾的“快樂感”并不會因為其“教育程度”的不同而存在顯著差異。(注:在實際研究中,通常不會提出統(tǒng)計學中的虛無假設,而是直接提出研究假設)。研究假設(H1):民眾的“快樂感”會因為其“教育程度”的不同,而存在顯著差異。11-3雙變量分析一、交叉分析卡方檢驗42(二)解讀報表例如2015年針對某地18歲以上民眾(n=2002)進行了一項大規(guī)模的面訪調(diào)查:快樂感*教育程度的交叉分析11-3雙變量分析一、交叉分析卡方檢驗43(二)解讀報表(續(xù))選用“皮爾森卡分檢驗”(PearsonChi-SquareTest

)來檢驗交叉表中所觀察到的百分比差異,到底是源於抽樣誤差所導致的差異,還是真的有達到統(tǒng)計上的顯著差異。PearsonChi-Square的值(value)所對應的Sig.值(Significance值,又稱P

值)如果≦0.05(即P

≦0.05),則研究者應“拒絕”虛無假設H0(H0=兩變量無關系或無差異的假設),進而“不排斥或接受”研究假設H1(H1=即兩變量有關或有差異的假設)。PearsonChi-Square的值所對應的Sig.值如果>0.05(即P

>0.05),則研究者應“接受”虛無假設H0。注:0.05作為P

值的判斷標準是多數(shù)社會科學研究所采納的允許誤差范圍,有時也可采納0.1或者0.01作為P

值的標準。11-3雙變量分析一、交叉分析卡方檢驗44(二)解讀報表(續(xù))我們可以進一步地透過“調(diào)整后標準化殘差”(AdjustedStandardizedResidual)此一參數(shù),來觀察此一差異最主要發(fā)生在交叉表中的哪些“方格”(cell)。如果方格內(nèi)的“AdjustedStd.Residual”其數(shù)值的“絕對值”(Absolutevalue)>1.96,即為顯著差異之所在(方格內(nèi)的百分比,顯著高于或低于全體于某一類目的比例)。如果方格內(nèi)的“AdjustedStd.Residual”其數(shù)值的“絕對值”

≦1.96,即表示無顯著差異(方格內(nèi)的百分比,貼齊全體于某一類目的比例)。11-3雙變量分析一、交叉分析卡方檢驗45(二)解讀報表(續(xù))透過“皮爾森卡方檢驗”(PearsonChi-SquareTest)以及“調(diào)整后標準化殘差”(AdjustedStandardizedResidual),我們發(fā)現(xiàn),真正產(chǎn)生顯著差異的類別,只有發(fā)生在:“初中教育程度者”有較高的“不快樂”比例“初中教育程度者”有較低的“快樂”比例“大學及以上者”有較低的“不快樂”比例樣本的觀察值不能簡單作出推論母體的結論。11-3量化資料的統(tǒng)計分析:雙變量一、交叉分析卡方檢驗46(三)分析結論研究假設(H1):民眾的“快樂感”會因為其“教育程度”的不同,而存在顯著差異。資料來源:〈某地傳播調(diào)查資料庫〉資料分析:Crosstabanalysis交叉分析顯著水平:α=0.05檢驗統(tǒng)計值:透過PearsonChi-Squarevalue

卡方檢驗值及其對應的P值進行假設檢驗。通過交叉方格內(nèi)的AdjustedStd.Residual

調(diào)整后標準化殘差值,檢驗百分比差異之所在。研究結論;受訪民眾的“快樂感”,會因為其“教育程度”的不同而存在統(tǒng)計上的顯著差異(

χ

2

=15.289,P

=0.054=0.05),研究假設(H1)成立。具體來說,與全體“自覺“不快樂”的比例(12.7%)”比較,初中教育程度者自覺“不快樂的比例(19.2%)較高”,大學及以上者自覺“不快樂的比例(10.6%)較低”;與全體“自覺“快樂”的比例(84.5%)”對比,初中教育程度者自覺“快樂的比例較低(78.1%)”。11-3雙變量分析11-3雙變量分析二、兩組平均數(shù)比較與統(tǒng)計檢驗47(一)獨立樣本T檢驗設定假設目的:兩組不同的人(自變量,兩個類別),在某一變量(因變量)的平均數(shù)有沒有差異例如:如果我們想要知道“男性”與“女性”這兩組不同的人,在“每天使用社交媒體所花的時間”上有沒有差異?研究假設(H1):民眾“每天使用社交媒體所花的時間”會因為其“性別”的不同,而存在顯著差異。11-3雙變量分析二、兩組平均數(shù)比較與統(tǒng)計檢驗48(一)獨立樣本T檢驗(續(xù))解讀報表

從表11-22可以看出:女生比男生約多了13分鐘(104-91=13)性別nMeanStd.DeviationStd.ErrorMean每天使用社交媒體的分鐘數(shù)男65591.1244112.748354.40487女640104.0947110.197424.35523表11-22獨立樣本T檢驗,兩組平均數(shù)描述統(tǒng)計11-3雙變量分析二、兩組平均數(shù)比較與統(tǒng)計檢驗49(一)獨立樣本T檢驗(續(xù))解讀報表

使用“獨立樣本T檢驗”(IndependentSampleT-Test),來確定這樣的差異到底是由抽樣誤差所引起,還是說母體也確實存在著差異,就需要進一步做統(tǒng)計檢驗。

Levene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpper每天使用社交媒體的時間(分鐘)Equalvariancesassumed2.366.124-2.0931293.037-12.970346.19606-25.12578-.81491Equalvariancesnotassumed

-2.0941293.378.036-12.970346.19443-25.12257-.81812表11-23獨立樣本T檢驗,兩組平均數(shù)差異檢定11-3雙變量分析二、兩組平均數(shù)比較與統(tǒng)計檢驗50研究假設(H1):民眾“每天使用社交媒體所花的時間”會因為其“性別”的不同,而存在顯著差異。資料來源:〈某地傳播調(diào)查資料庫〉資料分析:IndependentSamplesTTest獨立樣本T檢驗顯著水準:α=0.05檢驗統(tǒng)計值:透過tvalue及其對應的P

值,進行假設檢驗,觀察平均數(shù)差異之所在。研究結論:受訪民眾“每天使用社交媒體所花的時間”會因為其“性別”的不同而存在統(tǒng)計上的顯著差異(tvalue

=-2.093,P

=0.037<0.05),研究假設(H1)成立。此一說法錯誤的機率不會大于5%。具體來說,受訪民眾“每天使用社交媒體所花的時間”,男性民眾平均是91分鐘,女性民眾平均是104分鐘。男性民眾每天花在社交媒體的時間,平均來說,比女生少了12.97分鐘(MeanDifference=-12.97),且此一差異(-12.97分鐘)已超過抽樣誤差的范圍,達到統(tǒng)計上的顯著差異(P

=0.037<0.05),可以推論到母體。(一)獨立樣本T檢驗(續(xù))分析結論11-3雙變量分析二、兩組平均數(shù)比較與統(tǒng)計檢驗51(二)配對樣本T檢驗有時候,當我們想比較「同一群人」在「前后兩次」平均數(shù)的差異,有無達到統(tǒng)計上的顯著差異時,此時就可使用配對樣本T檢驗,例如在教學成效的研究中,我們常想要比較學生們的學習有沒有進步,假設某個班有10位學生在第一次段考時(前測),這10個學生的分數(shù)分別為:

(60,65,70,75,80,85,90,85,80,75)全班平均76.5在第二次段考時(后測),這10個學生的分數(shù)分別為:

(65,70,73,78,80,85,88,83,82,77)全班平均78.111-3雙變量分析二、兩組平均數(shù)比較與統(tǒng)計檢驗52(二)配對樣本T檢驗(續(xù))解讀報表

目的:檢驗這個1.6分的平均數(shù)差距,有無超過抽樣誤差的范圍,達到統(tǒng)計上的顯著差異表11-25前后測比較:配對樣本T檢驗

PairedDifferencestdfSig.(2-tailed)MeanStd.DeviationStd.ErrorMean95%ConfidenceIntervaloftheDifferenceLowerUpperPair1t1-t2-1.600002.54733.80554-3.422250.22225-1.9869.07811-3雙變量分析二、兩組平均數(shù)比較與統(tǒng)計檢驗53(二)配對樣本T檢驗(續(xù))分析結論研究假設(H1):前測平均數(shù)(例如:全班第一次段考成績的平均數(shù)),和后測平均數(shù)(例如:第二次段考成績的平均數(shù))相較,呈現(xiàn)顯著差異(前后測兩組平均數(shù)不相等,μ1≠μ2)。資料來源:〈某地傳播調(diào)查資料庫〉資料分析:PairedSamplesTTest配對樣本T檢定顯著水準:α=0.05檢驗統(tǒng)計值:透過tvalue及其對應的P

值,進行假設檢驗,觀察前后測平均數(shù)差異之所在。研究結論:前測平均數(shù)(第一次段考成績平均數(shù))和后測平均數(shù)(第二次段考成績平均數(shù)),并未呈現(xiàn)統(tǒng)計上的顯著差異。(tvalue

=-1.98,P

=0.078>0.05),研究假設(H1)不成立。具體來說,第一次段考成績平均數(shù)=76.5,第二次段考成績平均數(shù)=78.1,第二次段考成績平均來說雖然比第一次段考多了1.6分(MeanDifference=+1.6),但此一樣本差距(+1.6分),經(jīng)統(tǒng)計檢驗結果,并未超過抽樣誤差的范圍,并未達到統(tǒng)計上的顯著差異(P

==0.078>0.05),無法推論到母體。11-3雙變量分析三、多組平均數(shù)比較與統(tǒng)計檢驗54如果我們想要檢驗單個自變量(類別變量,多組)在某個因變量(連續(xù)變量)的平均數(shù)有沒有差異,那么就需要使用“單因素方差分析”(OneWayAnalysisofVariance,OneWayANOVA)來進行這項工作。(一)設定假設研究問題如下:“民眾每天使用社交媒體所花的時間,會不會因為其年齡的不同而有差異?”然后,我們設定研究假設:研究假設(H1):民眾“每天使用社交媒體所花的時間”會因為其“年齡”的不同,而存在顯著差異。11-3雙變量分析三、多組平均數(shù)比較與統(tǒng)計檢驗55(二)解讀報表表11-26單因素方差分析:描述統(tǒng)計(Descriptive)每天使用社交媒體的時間(分鐘數(shù))

nMeanStd.DeviationStd.Error95%ConfidenceIntervalforMeanMinimumMaximumLowerBoundUpperBound18~29383137.2164134.694226.87993123.6891150.74365.00720.0030~39374106.1929122.418416.3294893.7470118.63885.00776.0040~4928372.707974.576714.4310163.985981.43005.00480.0050~5917454.504556.237974.2647946.086762.92235.00480.0060以上8148.886546.096415.1263838.684459.088610.00300.00合計129597.5346111.640503.1018791.4494103.61995.00776.0011-3雙變量分析三、多組平均數(shù)比較與統(tǒng)計檢驗56(二)解讀報表(續(xù))各年齡層“似乎”是有差異的。這邊之所以說“似乎”,因為我們使用的資料是抽樣調(diào)查資料,在樣本中所看到的差異很有可能是因為抽樣誤差所引起。為了要確定我們從樣本中所觀察到的差異能否推論到母體,就需要做進一步的統(tǒng)計檢驗。11-3雙變量分析三、多組平均數(shù)比較與統(tǒng)計檢驗57(二)解讀報表(續(xù))如果Sig.值>0.05,代表自變量的不同組別中,在兩兩比較之下,各組平均數(shù)差距皆未達到統(tǒng)計上的顯著差異。如果這個Sig.值≤0.05,代表自變量的不同組別中,至少有兩組的平均數(shù)呈現(xiàn)統(tǒng)計上的顯著差異,此時研究者應“拒絕”虛無假設H0。每天使用社交媒體的時間(分鐘數(shù))

SumofSquaresdfMeanSquareFSig.BetweenGroups1319509.8044329877.45128.727.000WithinGroups14813095.978129011483.020

合計16132605.7821294

表11-27單因素方差分析:F檢驗(ANOVA)11-3雙變量分析三、多組平均數(shù)比較與統(tǒng)計檢驗58(二)解讀報表(續(xù))單因素方差分析的同質(zhì)性檢驗顯示(表11-28),LeveneStatistic=31.524,其所對應的Sig.=0.000<0.05,表示“方差不相等”,此時研究者應選用DunnettT3

檢驗統(tǒng)計量來進行事后比較分析,以確認到底是哪幾組的平均數(shù)呈現(xiàn)統(tǒng)計顯著差異。表11-28單因素方差分析:方差同質(zhì)性檢驗(TestofHomogeneityofVariances)每天使用社交媒體的時間(分鐘數(shù))LeveneStatisticdf1df2Sig.31.52441290.00011-3雙變量分析三、多組平均數(shù)比較與統(tǒng)計檢驗59(二)解讀報表(續(xù))根據(jù)DunnettT3

檢驗統(tǒng)計量,表11-29的事后多重比較分析顯示,18-29歲的民眾每天花在社交媒體的時間,和30-39歲相比,平均來說多了31分鐘(137-106=31),此一平均數(shù)差距所對應的顯著性Sig.=0.009。11-3量化資11-3雙變量分析料的統(tǒng)計分析:雙變量三、多組平均數(shù)比較與統(tǒng)計檢驗60(三)分析結論研究假設(H1):民眾“每天使用社交媒體所花的時間”會因為其“年齡”的不同,而存在顯著差異。資料來源:〈某地傳播調(diào)查資料庫〉資料分析:OneWayANOVA單因素方差分析顯著水準:α=0.05檢驗統(tǒng)計值:透過Fvalue

及其對應的P

值進行假設檢驗,并透過事后多重比較的Scheffe

檢定(LSD檢定)或DunnettT3

觀察哪幾組的平均數(shù)呈現(xiàn)顯著差異。11-3雙變量分析三、多組平均數(shù)比較與統(tǒng)計檢驗61(三)分析結論(續(xù))研究結論:受訪民眾中,18-29歲民眾每天使用社交媒體的時間,平均來說是137分鐘,30-39歲是106分鐘,40-49歲是72分鐘,50-59歲是54分鐘,60歲以上是48分鐘。經(jīng)統(tǒng)計檢驗結果,民眾“每天使用社交媒體所花的時間”會因為其“年齡”的不同而存在顯著差異(F

=28.727,P

=0.000<0.05),研究假設(H1)成立。此一說法錯誤的機率不會大于5%。具體而言,18-29歲民眾“每天使用社交媒體所花的時間”,平均來說,比30-39歲這個年齡層多了31分鐘;比40-49歲這個年齡層多了64分鐘;比50-59歲多了82分鐘,比60歲以上多了88分鐘。這些差異已經(jīng)超過抽樣誤差的范圍,達到統(tǒng)計上的顯著差異,可以推論到母體。總體而言,呈現(xiàn)一種“年齡愈輕,愈常使用社交媒體”的一種現(xiàn)象(趨勢)。11-3雙變量分析四、雙變量相關分析62相關分析主要是用來探究兩個“連續(xù)變量”(等距或等比)之間是否相關、相關的方向是正相關或負相關,以及相關的強度有多大等方面的議題。常用的相關分析方法為“皮爾森雙變量相關分析”(Pearson’sBivariateCorrelation)。皮爾森雙變量相關分析指的是,研究者使用“皮爾森相關系數(shù)”(PearsonCorrelation)來衡量兩變量之間的“線性關系(Linearcorrelation)”,其值范圍介于【-1~0~+1】之間。【-1】代表兩變量之間呈現(xiàn)完全的線性負相關,【+1】代表兩變量之間呈現(xiàn)完全的線性正相關,【0】代表兩變量之間并未呈現(xiàn)線性相關關系。11-3雙變量分析四、雙變量相關分析63案例:

研究問題如下:“民眾對于網(wǎng)路媒體新聞報導的評價,和其每天使用社交媒體的時間多寡有沒有關系?如果有關系,兩者之間的關系是正相關或負相關?”研究假設(H1):民眾“對于網(wǎng)路媒體新聞報導的評價”和其“每天使用社交媒體所花的時間”,兩者之間有顯著關聯(lián),且呈現(xiàn)正相關。即:每天使用社交媒體時間愈多,對于網(wǎng)路媒體新聞報導的評價也會愈高。11-3雙變量分析四、雙變量相關分析64

MeanStd.Deviationn請你就下列媒體所報導新聞的整體的表現(xiàn)給一個分數(shù)-網(wǎng)路60.3218.1781470每天使用社交媒體的時間(小時)1.62561.860671295表11-30相關分析:描述統(tǒng)計

(DescriptiveStatistics)

請你就下列媒體所報導新聞的整體的表現(xiàn)給一個分數(shù)-網(wǎng)路每天使用社交媒體的分鐘數(shù)請你就下列媒體所報導新聞的整體的表現(xiàn)給一個分數(shù)-網(wǎng)路PearsonCorrelation1.062*Sig.(2-tailed)

.025n14701295每天使用社交媒體的時間(小時)PearsonCorrelation.062*1Sig.(2-tailed).025

n12951295*.Correlationissignificantatthe0.05level(2-tailed).表11-31相關分析:兩兩相關系數(shù)(Correlations)11-3雙變量分析四、雙變量相關分析65從以上兩個表的分析結果可以得知:民眾對于網(wǎng)路媒體新聞報導的評價,平均分數(shù)是60.32分,而民眾每天使用社交媒體的時間,平均時間是1.62個小時。民眾“對于網(wǎng)路媒體新聞報導的評價”和“每天使用社交媒體所花的時間”這兩個變量之間的皮爾森相關系數(shù)(PearsonCorrelation)是+0.062,呈現(xiàn)一種微弱的“正相關”關系,即使很微弱,但此一正相關關系已超過抽樣誤差的范圍,達到統(tǒng)計上的顯著差異(

P

=0.025<0.05),可以推論到母體。所以,我們的結論是,民眾“對于網(wǎng)路媒體新聞報導的評價”和其“每天使用社交媒體所花的時間”,兩者之間呈現(xiàn)微弱的正相關(Pearsoncorrelation=+0.062),雖然這是一個很微弱的正相關,但檢驗結果,仍達到統(tǒng)計上的顯著差異(P

=0.025<0.05),所以,研究假設(H1)成立。此一說法犯錯的機率不會大于5%。11-3雙變量分析四、雙變量相關分析66另外,我們也可以呈現(xiàn)多個連續(xù)變量兩兩之間的皮爾森相關系數(shù)(表11-32)。

請你就下列媒體所報導新聞整體的表現(xiàn)給一個分數(shù)-報紙請你就下列媒體所報導新聞整體的表現(xiàn)給一個分數(shù)-雜志請你就下列媒體所報導新聞整體的表現(xiàn)給一個分數(shù)-廣播請你就下列媒體所報導新聞整體的表現(xiàn)給一個分數(shù)-電視請你就下列媒體所報導新聞整體的表現(xiàn)給一個分數(shù)-網(wǎng)路請你就下列媒體所報導新聞整體的表現(xiàn)給一個分數(shù)-報紙PearsonCorrelation1.338**.398**.559**.303**Sig.(2-tailed)

.000.000.000.000n827392385791639請你就下列媒體所報導新聞整體的表現(xiàn)給一個分數(shù)-雜志PearsonCorrelation.338**1.451**.299**.270**Sig.(2-tailed).000

.000.000.000n392658334611583請你就下列媒體所報導新聞整體的表現(xiàn)給一個分數(shù)-廣播PearsonCorrelation.398**.451**1.379**.324**Sig.(2-tailed).000.000

.000.000n385334768722606請你就下列媒體所報導新聞整體的表現(xiàn)給一個分數(shù)-電視PearsonCorrelation.559**.299**.379**1.361**Sig.(2-tailed).000.000.000

.000n79161172218831365請你就下列媒體所報導新聞整體的表現(xiàn)給一個分數(shù)-網(wǎng)路PearsonCorrelation.303**.270**.324**.361**1Sig.(2-tailed).000.000.000.000

n63958360613651470**.Correlationissignificantatthe0.01level(2-tailed).表11-32對于不同媒體新聞報導的評價:皮爾森相關分析(Correlations)6711-4

多變量分析多變量分析雙因數(shù)方差分析線性回歸分析二分類邏輯斯回歸分析設定假設解讀報表簡單線性回歸分析多元線性回歸分析分析結論單變量多變量11-4

多變量分析一、雙因素方差分析68a性別(一)設定假設H1a:不同性別的民眾其每天使用社交媒體時間的平均數(shù),有顯著差異。即性別此因素對使用社交媒體時間,有影響。b年齡H1b:不同年齡的民眾其每天使用社交媒體時間的平均數(shù),有顯著差異。即年齡此因素對使用社交媒體時間,有影響。c性別與年齡的交互作用H1c:不同年齡的民眾其每天使用社交媒體時間的平均數(shù),會因為其性別的不同,而呈現(xiàn)顯著差異。即有交互作用。11-4

多變量分析一、雙因素方差分析69(二)解讀報表DependentVariable:每天使用社交媒體的時間(分鐘數(shù))

性別年齡五分類MeanStd.Deviationn男18~29124.2829135.8983615230~39105.1741131.0680920140~4962.058357.9060812050~5955.662556.395298060以上38.936228.6458247合計89.6017111.50746600女18~29151.7910130.8473313430~39107.2232113.2686622440~4982.987286.6883915650~5953.445456.3236311960以上61.219560.9793041合計98.1810105.98462674合計18~29137.1713134.0294428630~39106.2541121.8688642540~4973.887776.1227627650~5954.336756.2204619960以上49.318247.6287288合計94.1405108.662191274表11-33雙因素方差分析:描述統(tǒng)計(DescriptiveStatistics)11-4

多變量分析一、雙因素方差分析70(二)解讀報表(續(xù))表11-34雙因素方差分析:不同自變量影響效果(TestsofBetween-SubjectsEffects)第二步,看一下雙因素方差分析的自變量影響效果(表11-34)DependentVariable::每天使用社交媒體的時間(分鐘數(shù))SourceTypeIIISumofSquaresdfMeanSquareFSig.CorrectedModel1292377.439a9143597.49313.212.000Intercept6777802.84616777802.846623.585.000sex47498.784147498.7844.370.037age51207167.1484301791.78727.766.000sex*age544882.295411220.5741.032.389Error13738534.411126410869.094

Total26321653.0001274

CorrectedTotal15030911.8501273

a.RSquared=.086(AdjustedRSquared=.079)11-4

多變量分析一、雙因素方差分析71(二)解讀報表(續(xù))表11-35雙因素方差分析:事后分組組間比較(MultipleComparisons)第三步,看一下雙因素方差分析的事后分組組間比較(表11-35)。DependentVariable:每天使用社交媒體的時間(分鐘數(shù))Scheffe(I)age5年齡五分類(J)age5年齡五分類MeanDifference(I-J)Std.ErrorSig.95%ConfidenceIntervalLowerBoundUpperBound18~2930~3930.9172*7.97359.0056.320455.514040~4963.2836*8.79685.00036.147390.420050~5982.8346*9.62405.00053.1465112.522760以上87.8531*12.70890.00048.6490127.057330~3918~29-30.9172*7.97359.005-55.5140-6.320440~4932.3664*8.05947.0037.504757.228250~5951.9174*8.95505.00024.293179.541860以上56.9359*12.21011.00019.270494.601540~4918~29-63.2836*8.79685.000-90.4200-36.147330~39-32.3664*8.05947.003-57.2282-7.504750~5919.55109.69533.398-10.357049.459060以上24.569512.76296.448-14.801563.940450~5918~29-82.8346*9.62405.000-112.5227-53.146530~39-51.9174*8.95505.000-79.5418-24.293140~49-19.55109.69533.398-49.459010.357060以上5.018513.34657.998-36.152846.189860以上18~29-87.8531*12.70890.000-127.0573-48.649030~39-56.9359*12.21011.000-94.6015-19.270440~49-24.569512.76296.448-63.940414.801550~59-5.018513.34657.998-46.189836.1528Basedonobservedmeans.TheerrortermisMeanSquare(Error)=10869.094.*.Themeandifferenceissignificantatthe.05level11-4

多變量分析一、雙因素方差分析72(三)分析結論研究假設H1a:不同性別的民眾其每天使用社交媒體時間的平均數(shù),有顯著差異。(即,性別此因素對使用社交媒體時間,有影響)研究假設H1b:不同年齡的民眾其每天使用社交媒體時間的平均數(shù),有顯著差異。(即,年齡此因素對使用社交媒體時間,有影響)研究假設H1c:不同年齡的民眾其每天使用社交媒體時間的平均數(shù),會因為其性別的不同,而呈現(xiàn)顯著差異。(即,有交互作用)資料來源:〈某地傳播調(diào)查資料庫〉資料分析:雙因素方差分析,TwoWayANOVA顯著水準:α=0.05檢驗統(tǒng)計值:透過Fvalue及其對應的P值進行假設檢驗,并透過事后多重比較的Scheffe檢驗,觀察哪幾組的平均數(shù)呈現(xiàn)顯著差異。11-4

多變量分析一、雙因素方差分析73(三)分析結論(續(xù))研究結論:性別變量對于民眾每天使用社交媒體時間的多寡,有顯著影響(F=4.370,P=0.037<0.05),研究假設H1a成立。此一說法錯誤的機率不會大于5%。年齡變量對于民眾每天使用社交媒體時間的多寡,也有顯著影響(F=27.766,P=0.000<0.05),研究假設H1b成立。此一說法錯誤的機率不會大于5%。至于性別與年齡交互作用變量對于民眾每天使用社交媒體時間的影響,并未達到統(tǒng)計上的顯著差異(F=1.032,P=0.389>0.05),所以研究假設H1c不成立。也就是說,年齡對于民眾使用社交媒體時間的影響,并不會因為性別的不同而有所差異;性別對于民眾使用社交媒體時間的影響,也不會因為年齡的不同而有所差異。性別變量對于社交媒體使用時間的影響,其具體內(nèi)容為:女性每天使用社交媒體的時間,平均來說,比男性多了8.5分鐘,此一差距已達到統(tǒng)計上顯著差異。年齡變量對于社交媒體使用時間的影響,其具體內(nèi)容為:18-29歲民眾每天使用社交媒體的時間,比30-39歲、40-49歲、50-59歲、60歲以上民眾,平均來說分別多了30.9分鐘、63.2分鐘、82.8分鐘、以及87.8分鐘,這些差距都已達到統(tǒng)計上的顯著差異。11-4

多變量分析二、線性回歸分析74回歸分析建立在相關分析基礎上,在確認了兩變量具有相關關系,并能夠確認一個變量發(fā)生在前,另一變量是受其影響而發(fā)生變化,為分析自變量對因變量的線性影響程度,可采用線性回歸分析。使用線性回歸分析時,因變量必須是“連續(xù)變量”(等距或定比變量),自變量可以是“連續(xù)變量”(等距或定比變量),也可是“類別變量”(定類或定序變量)。11-4

多變量分析二、線性回歸分析75以“每天使用社交媒體的時間”作為自變量的回歸模型,對于“網(wǎng)路媒體新聞報導的評價”此一因變量,有沒有顯著的解釋力?(即,回歸模型的集體解釋力顯不顯著?)如果回歸模型有集體解釋力,則此一集體解釋力有多大?“每天使用社交媒體的時間”此一自變量對于“網(wǎng)路媒體新聞報導的評價”此一因變量的個別解釋力,有多大?有無達到統(tǒng)計上的顯著差異?(即,自變量的各別解釋解釋力顯不顯著?)(一)簡單線性回歸分析11-4

多變量分析二、線性回歸分析76簡單線性回歸分析的研究假設如下:

H0:簡單線性回歸方程式中,自變量的回歸系數(shù)等于0(β=0)

H1:簡單線性回歸方程式中,自變量的回歸系數(shù)等于0(β≠0)設定假設(一)簡單線性回歸分析(續(xù))11-4

多變量分析二、線性回歸分析77第一步,看一下簡單線性回歸分析的方差分析摘要表(表11-36)解讀報表(一)簡單線性回歸分析(續(xù))表11-36

簡單線性回歸分析:方差分析摘要表(ANOVA)aModelSumofSquaresdfMeanSquareFSig.1Regression1617.30611617.3065.047.025bResidual414454.5891293320.444

Total416071.8951294

a.DependentVariable:請你就下列媒體所報導新聞的整體的表現(xiàn)給一個分數(shù)-網(wǎng)路b.Predictors:(Constant),每天使用社交媒體的時間(小時)11-4

多變量分析二、線性回歸分析78第二步,我們看一下模型摘要表中的R2(表11-37)。R2

代表線性回歸分析中,自變量模型對于因變量的整體解釋力,介于0~1之間,此值愈大代表線性迴歸模型愈具有解釋力。解讀報表(一)簡單線性回歸分析(續(xù))表11-37簡單線性回歸分析:模型摘要表(ModelSummary)ModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.062a.004.00317.901a.Predictors:(Constant),每天使用社交媒體的時間(小時)11-4

多變量分析二、線性回歸分析79第三步,觀察回歸系數(shù)表(表11-38)。迴歸係數(shù)(Regressioncoefficient,用符號表示是Beta(或β)代表的是某一自變量對於因變量的解釋力。自變量(X)“每天使用社交媒體的時間(小時)”所對應的回歸系數(shù)β值為0.601(B=0.601)常數(shù)項(constant)的β值=60.069解讀報表(一)簡單線性回歸分析(續(xù))11-4

多變量分析二、線性回歸分析80解讀報表(一)簡單線性回歸分析(續(xù))ModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)60.069.661

90.938.000X:每天使用社交媒體的時間(小時).601.267.0622.247.025a.DependentVariable:請你就下列媒體所報導新聞的整體的表現(xiàn)給一個分數(shù)-網(wǎng)路表11-38簡單線性回歸分析:回歸系數(shù)表(Coefficients)a11-4

多變量分析二、線性回歸分析81E(Y)=a+bXE(Y):因變量Y的平均數(shù)a:常數(shù)項(constant)的未標準化回歸系數(shù)(Unstandardizedcoefficients)b:X變量的未標準化回歸系數(shù)(Unstandardizedcoefficients)X:自變量E(Y)=60.069+0.601XE(Y):對于網(wǎng)路媒體報導新聞評價的平均數(shù)X:每天使用社交媒體的時間(小時)解讀報表(一)簡單線性回歸分析(續(xù))11-4

多變量分析二、線性回歸分析82分析結論(一)簡單線性回歸分析(續(xù))研究假設H0:簡單線性回歸方程式中,自變量的回歸系數(shù)等于0(β=0)研究假設H1:簡單線性回歸方程式中,自變量的回歸系數(shù)等于0(β≠0)資料來源:〈某地傳播調(diào)查資料庫〉資料分析:simplelinearregression簡單線性回歸分析顯著水平:α=0.05檢驗統(tǒng)計值:透過方差摘要表的Fvalue及其對應的P

值進行假設檢驗,透過回歸系數(shù)表的unstandardizedcoefficientB(未標準化的回歸系數(shù)),寫出回歸方程式,并觀察自變量對因變量的影響方向及大小,再透過tvalue及其對應的P

值,檢驗自變量對因變量的此一影響是否顯著不等于零。11-4

多變量分析二、線性回歸分析83分析結論(一)簡單線性回歸分析(續(xù))研究結論:對于民眾而言,“每天使用社交媒體時間”可以用來作為“網(wǎng)路媒體新聞報導評價”的其中一個解釋因素(F

=5.047,P

=0.025<0.05);但此解釋力很小,只有大約0.4%(RSquare

=0.004)。研究假設H1成立。此一說法錯誤的機率不會大于5%。具體來說,當民眾“每天使用社交媒體的時間”每增加1個小時,對于“網(wǎng)路媒體新聞報導的評價”(Y),平均來說,會增加0.601分,此一影響效果,經(jīng)統(tǒng)計檢驗

(t

=2.247),已超過抽樣誤差的范圍,達到統(tǒng)計上的顯著差異(P

=0.025<0.05),可以推論到母體。11-4

多變量分析二、線性回歸分析84多元線性回歸分析指的是研究者使用多個自變量去解釋一個因變量,并假定多個自變量的線性組合,與因變量呈現(xiàn)一定程度的線性關系。(二)多元線性回歸分析自變量可以是連續(xù)變量也可以是類別變量,但因變量就一定要是連續(xù)變量。當自變量包含類別變量時,我們稱為虛擬變量回歸。11-4

多變量分析二、線性回歸分析85研究問題:(二)多元線性回歸分析(續(xù))以“每天使用社交媒體的時間”、“性別”、“年齡”、“教育程度”等多個變量作為自變量的多元線性回歸模型,對于“網(wǎng)路媒體新聞報導的評價”此一因變量,有沒有顯著的解釋力?如果此一多元線性回歸模型有集體解釋力,則此一集體解釋力有多大?“每天使用社交媒體的時間”、“性別”、“年齡”、“教育程度”等這些不同的自變量對于“網(wǎng)路媒體新聞報導的評價”此一因變量的個別解釋力,那一個自變量的解釋力比較大?有多大?有無達到統(tǒng)計上的顯著差異?11-4

多變量分析二、線性回歸分析86設定假設(二)多元線性回歸分析(續(xù))H0:多元線性回歸方程式中,各個回歸系數(shù)都等于0(β1=β2=...βk=0)H1:多變量線性回歸方程式中,至少有一個回歸系數(shù)不等于0(至少有1個βj≠0,j=1,2,...,k)11-4

多變量分析二、線性回歸分析87解讀報表(二)多元線性回歸分析(續(xù))第一步,看一下多元線性回歸分析的方差分析摘要表(表11-39)ModelSumofSquaresdfMeanSquareFSig.1Regression9404.56210940.4562.970.001bResidual406667.3331284316.626

Total416071.8951294

a.DependentVariable:請你就下列媒體所報導新聞的整體的表現(xiàn)給一個分數(shù)-網(wǎng)路b.Predictors:(Constant),每天使用社交媒體的時間(小時),男性,18-29,30-39,40-49,50-59,小學及以下,初中,高中職,???表11-39多元線性回歸分析:方差分析摘要表(ANOVA)a11-4

多變量分析二、線性回歸分析88解讀報表(二)多元線性回歸分析(續(xù))第二步,我們看一下模型摘要表(表11-40)。Adj.R2

被稱為“調(diào)整后的確定系數(shù)”(Adjusted

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論