數(shù)據(jù)分析方法3(方差分析)課件_第1頁(yè)
數(shù)據(jù)分析方法3(方差分析)課件_第2頁(yè)
數(shù)據(jù)分析方法3(方差分析)課件_第3頁(yè)
數(shù)據(jù)分析方法3(方差分析)課件_第4頁(yè)
數(shù)據(jù)分析方法3(方差分析)課件_第5頁(yè)
已閱讀5頁(yè),還剩80頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、試驗(yàn)設(shè)計(jì)數(shù)據(jù)的方差分析,1,PPT學(xué)習(xí)交流,試驗(yàn)設(shè)計(jì),一個(gè)養(yǎng)蟹戶要遇到許多影響生產(chǎn)的因素或因子(factor),比如水溫,飼料,水質(zhì)等各種問(wèn)題。要想穩(wěn)定高產(chǎn),就要進(jìn)行各種因素的不同水平(level)的搭配(組合)試驗(yàn)。這里的“水平”就是一個(gè)因素可能取的值。比如對(duì)于飼料這個(gè)因素,每個(gè)水平就是一種飼料;如果有三種可供選擇的飼料,該因素就有三個(gè)水平。而如果水溫有四種水平,則水溫和飼料就有12種可能的搭配(組合)。 試驗(yàn)設(shè)計(jì)模型可以說(shuō)就是回歸模型的一種,自變量有定性變量的情況的處理和試驗(yàn)設(shè)計(jì)數(shù)據(jù)處理是一樣的。但試驗(yàn)設(shè)計(jì)問(wèn)題本身有很大一部分是如何設(shè)計(jì)試驗(yàn),使得人們有可能用最少的資源得到最好的結(jié)果。當(dāng)然,

2、我們不打算詳細(xì)討論如何設(shè)計(jì)試驗(yàn),而把主要精力放在試驗(yàn)設(shè)計(jì)數(shù)據(jù)的方差分析上。,2,PPT學(xué)習(xí)交流,方差分析,方差分析(analysis of variance,ANOVA)是分析各個(gè)自變量對(duì)因變量影響的一種方法。這里的自變量就是定性變量的因子及可能出現(xiàn)的稱為協(xié)變量(covariate)的定量變量。分析結(jié)果是由一個(gè)方差分析表表示的。原理為:因變量的值隨著自變量的不同取值而變化。我們把這些變化按照自變量進(jìn)行分解,使得每一個(gè)自變量都有一份貢獻(xiàn),最后剩下無(wú)法用已知的因素解釋的則看成隨機(jī)誤差的貢獻(xiàn)。然后用各自變量的貢獻(xiàn)和隨機(jī)誤差的貢獻(xiàn)進(jìn)行比較(F檢驗(yàn)),以判斷該自變量的不同水平是否對(duì)因變量的變化有顯著貢獻(xiàn)

3、。輸出就是F-值和檢驗(yàn)的一些p-值。下面看一個(gè)例子。,3,PPT學(xué)習(xí)交流,銷售數(shù)據(jù)(sales.sav),研究這個(gè)數(shù)目的主要目的是看銷售額(因變量)是否受到促銷方式、售后服務(wù)和獎(jiǎng)金這三個(gè)自變量的影響(頭兩個(gè)是定性變量,亦稱為因子,分別有3個(gè)和2個(gè)水平;而定量變量獎(jiǎng)金是協(xié)變量)以及怎樣的影響。,4,PPT學(xué)習(xí)交流,什么是方差分析(ANOVA)?,檢驗(yàn)多個(gè)總體均值是否相等 通過(guò)分析數(shù)據(jù)的誤差判斷各總體均值是否相等 研究分類型自變量對(duì)數(shù)值型因變量的影響 一個(gè)或多個(gè)分類型自變量 兩個(gè)或多個(gè) (k 個(gè)) 處理水平或分類 一個(gè)數(shù)值型因變量 有單因素方差分析和多因素方差分析 單因素方差分析:涉及一個(gè)分類的自

4、變量 多因素方差分析:涉及多個(gè)分類的自變量,5,PPT學(xué)習(xí)交流,什么是方差分析?,例題分析:為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在四個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對(duì)總共23家企業(yè)投訴的次數(shù)如下表,6,PPT學(xué)習(xí)交流,什么是方差分析?,分析四個(gè)行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對(duì)“投訴次數(shù)”是否有顯著影響 作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個(gè)行業(yè)被投訴次數(shù)的均值是否相等 若它們的均值相等,則意味著“行業(yè)”對(duì)投訴次數(shù)是沒(méi)有影響的,即它們之間的服務(wù)質(zhì)量沒(méi)有顯著差異;若均值不全相等,則意味著“行業(yè)”對(duì)投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異,7,

5、PPT學(xué)習(xí)交流,方差分析中的有關(guān)術(shù)語(yǔ),因素或因子(factor) 所要檢驗(yàn)的對(duì)象 要分析行業(yè)對(duì)投訴次數(shù)是否有影響,行業(yè)是要檢驗(yàn)的因素或因子 水平或處理(treatment) 因子的不同表現(xiàn) 零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)就是因子的水平 觀察值 在每個(gè)因素水平下得到的樣本數(shù)據(jù) 每個(gè)行業(yè)被投訴的次數(shù)就是觀察值,8,PPT學(xué)習(xí)交流,方差分析中的有關(guān)術(shù)語(yǔ),試驗(yàn) 這里只涉及一個(gè)因素,因此稱為單因素四水平的試驗(yàn) 總體 因素的每一個(gè)水平可以看作是一個(gè)總體 比如零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)可以看作是四個(gè)總體 樣本數(shù)據(jù) 被投訴次數(shù)可以看作是從這四個(gè)總體中抽取的樣本數(shù)據(jù),9,PPT學(xué)習(xí)交流,方差分析

6、的基本思想和原理(圖形分析),10,PPT學(xué)習(xí)交流,從散點(diǎn)圖上可以看出 不同行業(yè)被投訴的次數(shù)是有明顯差異的 同一個(gè)行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同 家電制造被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低 行業(yè)與被投訴次數(shù)之間有一定的關(guān)系 如果行業(yè)與被投訴次數(shù)之間沒(méi)有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近,方差分析的基本思想和原理(圖形分析),11,PPT學(xué)習(xí)交流,僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異 這種差異也可能是由于抽樣的隨機(jī)性所造成的 需要有更準(zhǔn)確的方法來(lái)檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析 所以叫方差分析

7、,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時(shí)則需要借助于方差 這個(gè)名字也表示:它是通過(guò)對(duì)數(shù)據(jù)誤差來(lái)源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來(lái)源,方差分析的基本思想和原理,12,PPT學(xué)習(xí)交流,1.比較兩類誤差,以檢驗(yàn)均值是否相等 2.比較的基礎(chǔ)是方差比 3.如果系統(tǒng)(處理)誤差明顯地不同于隨機(jī)誤差,則均值就是不相等的;反之,均值就是相等的 4.誤差是由各部分的誤差占總誤差的比例來(lái)測(cè)度的,方差分析的基本思想和原理,13,PPT學(xué)習(xí)交流,方差分析的基本思想和原理(兩類誤差),隨機(jī)誤差 因素的同一水平(總體)下,樣本各觀察值之間的差異 比如,同一行業(yè)

8、下不同企業(yè)被投訴次數(shù)是不同的 這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差 系統(tǒng)誤差 因素的不同水平(不同總體)下,各觀察值之間的差異 比如,不同行業(yè)之間的被投訴次數(shù)之間的差異 這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差,14,PPT學(xué)習(xí)交流,方差分析的基本思想和原理(誤差平方和),數(shù)據(jù)的誤差用平方和(sum of squares)表示 組內(nèi)平方和(within groups) 因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的平方和 比如,零售業(yè)被投訴次數(shù)的誤差平方和 組內(nèi)平方和只包含隨機(jī)誤差 組間平方和(between

9、groups) 因素的不同水平(不同總體)下各樣本之間的平方和 比如,四個(gè)行業(yè)被投訴次數(shù)之間的誤差平方和 組間平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差,15,PPT學(xué)習(xí)交流,方差分析的基本思想和原理(誤差的比較),若原假設(shè)成立,組間平方和與組內(nèi)平方和經(jīng)過(guò)平均后的數(shù)值就應(yīng)該很接近,它們的比值就會(huì)接近1 若原假設(shè)不成立,組間平方和平均后的數(shù)值就會(huì)大于組內(nèi)平方和平均后的數(shù)值,它們之間的比值就會(huì)大于1 當(dāng)這個(gè)比值大到某種程度時(shí),就可以說(shuō)不同水平之間存在著顯著差異,也就是自變量對(duì)因變量有影響 判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,也就是檢驗(yàn)被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,

10、說(shuō)明不同行業(yè)對(duì)投訴次數(shù)有顯著影響,16,PPT學(xué)習(xí)交流,方差分析的基本假定,每個(gè)總體都應(yīng)服從正態(tài)分布 對(duì)于因素的每一個(gè)水平,其觀察值是來(lái)自服從正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本 比如,每個(gè)行業(yè)被投訴的次數(shù)必需服從正態(tài)分布 各個(gè)總體的方差必須相同 各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的 比如,四個(gè)行業(yè)被投訴次數(shù)的方差都相等 觀察值是獨(dú)立的 比如,每個(gè)行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨(dú)立,17,PPT學(xué)習(xí)交流,方差分析中的基本假定,在上述假定條件下,判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的四個(gè)正態(tài)總體的均值是否相等 如果四個(gè)總體的均值相等,可以期望四個(gè)樣本的均值也會(huì)很接近

11、四個(gè)樣本的均值越接近,推斷四個(gè)總體均值相等的證據(jù)也就越充分 樣本均值越不同,推斷總體均值不同的證據(jù)就越充分,18,PPT學(xué)習(xí)交流,方差分析中基本假定, 如果原假設(shè)成立,即H0 : m1 = m2 = m3 = m4 四個(gè)行業(yè)被投訴次數(shù)的均值都相等 意味著每個(gè)樣本都來(lái)自均值為、方差為 2的同一正態(tài)總體,X,f(X),1 2 3 4,19,PPT學(xué)習(xí)交流,方差分析中基本假定,若備擇假設(shè)成立,即H1 : mi (i=1,2,3,4)不全相等 至少有一個(gè)總體的均值是不同的 四個(gè)樣本分別來(lái)自均值不同的四個(gè)正態(tài)總體,20,PPT學(xué)習(xí)交流,問(wèn)題的一般提法,設(shè)因素有k個(gè)水平,每個(gè)水平的均值分別用1 , 2,

12、, k 表示 要檢驗(yàn)k個(gè)水平(總體)的均值是否相等,需要提出如下假設(shè): H0 : 1 2 k H1 : 1 , 2 , ,k 不全相等 設(shè)1為零售業(yè)被投訴次數(shù)的均值,2為旅游業(yè)被投訴次數(shù)的均值,3為航空公司被投訴次數(shù)的均值,4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設(shè)為 H0 : 1 2 3 4 H1 : 1 , 2 , 3 , 4 不全相等,21,PPT學(xué)習(xí)交流,單因素方差分析的數(shù)據(jù)結(jié)構(gòu),22,PPT學(xué)習(xí)交流,分析步驟 提出假設(shè) 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量 統(tǒng)計(jì)決策,23,PPT學(xué)習(xí)交流,提出假設(shè),一般提法 H0 : m1 = m2 = mk 自變量對(duì)因變量沒(méi)有顯著影響 H1 : m1 ,m2 , ,mk

13、不全相等 自變量對(duì)因變量有顯著影響 注意:拒絕原假設(shè),只表明至少有兩個(gè)總體的均值不相等,并不意味著所有的均值都不相等,24,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量,構(gòu)造統(tǒng)計(jì)量需要計(jì)算 水平的均值 全部觀察值的總均值 誤差平方和 均方(MS),25,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算水平的均值),假定從第i個(gè)總體中抽取一個(gè)容量為ni的簡(jiǎn)單隨機(jī)樣本,第i個(gè)總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個(gè)數(shù) 計(jì)算公式為,式中: ni為第 i 個(gè)總體的樣本觀察值個(gè)數(shù),xij 為第 i 個(gè)總體的第 j 個(gè)觀察值,26,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算全部觀察值的總均值),全部觀察值的總和除以觀察

14、值的總個(gè)數(shù) 計(jì)算公式為,27,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(例題分析),28,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算總誤差平方和 SST),全部觀察值 與總平均值 的離差平方和 反映全部觀察值的離散狀況 其計(jì)算公式為,前例的計(jì)算結(jié)果: SST = (57-47.869565)2+(58-47.869565)2 =115.9295,29,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算水平項(xiàng)平方和 SSA),各組平均值 與總平均值 的離差平方和 反映各總體的樣本均值之間的差異程度,又稱組間平方和 該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差 計(jì)算公式為,前例的計(jì)算結(jié)果:SSA = 1456.608696,3

15、0,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算誤差項(xiàng)平方和 SSE),每個(gè)水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和 反映每個(gè)樣本各觀察值的離散狀況,又稱組內(nèi)平方和 該平方和反映的是隨機(jī)誤差的大小 計(jì)算公式為,前例的計(jì)算結(jié)果:SSE = 2708,31,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(三個(gè)平方和的關(guān)系),總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和 (SSA) 之間的關(guān)系,SST = SSA + SSE,前例的計(jì)算結(jié)果: 4164.608696=1456.608696+2708,32,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(三個(gè)平方和的作用),SST反映全部數(shù)據(jù)總的誤差程度;

16、SSE反映隨機(jī)誤差的大?。籗SA反映隨機(jī)誤差和系統(tǒng)誤差的大小 如果原假設(shè)成立,則表明沒(méi)有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會(huì)太大;如果組間均方顯著地大于組內(nèi)均方,說(shuō)明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差 判斷因素的水平是否對(duì)其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小,33,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算均方MS),各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對(duì)誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差 計(jì)算方法是用誤差平方和除以相應(yīng)的自由度 三個(gè)平方和對(duì)應(yīng)的自由度分別是

17、 SST 的自由度為n-1,其中n為全部觀察值的個(gè)數(shù) SSA的自由度為k-1,其中k為因素水平(總體)的個(gè)數(shù) SSE 的自由度為n-k,34,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算均方 MS),組間方差:SSA的均方,記為MSA,計(jì)算公式為,組內(nèi)方差:SSE的均方,記為MSE,計(jì)算公式為,35,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算檢驗(yàn)統(tǒng)計(jì)量 F ),將MSA和MSE進(jìn)行對(duì)比,即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F 當(dāng)H0為真時(shí),二者的比值服從分子自由度為k-1、分母自由度為 n-k 的 F 分布,即,36,PPT學(xué)習(xí)交流,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(F分布與拒絕域),如果均值相等,F(xiàn)=MSA/MSE1,37,PP

18、T學(xué)習(xí)交流,統(tǒng)計(jì)決策, 將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行比較,作出對(duì)原假設(shè)H0的決策 根據(jù)給定的顯著性水平,在F分布表中查找與第一自由度df1k-1、第二自由度df2=n-k 相應(yīng)的臨界值 F 若FF ,則拒絕原假設(shè)H0 ,表明均值之間的差異是顯著的,所檢驗(yàn)的因素對(duì)觀察值有顯著影響 若FF ,則不能拒絕原假設(shè)H0 ,無(wú)證據(jù)支持表明所檢驗(yàn)的因素對(duì)觀察值有顯著影響,38,PPT學(xué)習(xí)交流,單因素方差分析表(基本結(jié)構(gòu)),39,PPT學(xué)習(xí)交流,單因素方差分析(例題分析),40,PPT學(xué)習(xí)交流,關(guān)系強(qiáng)度的測(cè)量,拒絕原假設(shè)表明因素(自變量)與觀測(cè)值之間有關(guān)系 組間平方和(SSA)度量了自變量(

19、行業(yè))對(duì)因變量(投訴次數(shù))的影響效應(yīng) 只要組間平方和SSA不等于0,就表明兩個(gè)變量之間有關(guān)系(只是是否顯著的問(wèn)題) 當(dāng)組間平方和比組內(nèi)平方和(SSE)大,而且大到一定程度時(shí),就意味著兩個(gè)變量之間的關(guān)系顯著,大得越多,表明它們之間的關(guān)系就越強(qiáng)。反之,就意味著兩個(gè)變量之間的關(guān)系不顯著,小得越多,表明它們之間的關(guān)系就越弱,41,PPT學(xué)習(xí)交流,關(guān)系強(qiáng)度的測(cè)量,變量間關(guān)系的強(qiáng)度用自變量平方和(SSA)及殘差平方和(SSE)占總平方和(SST)的比例大小來(lái)反映 自變量平方和占總平方和的比例記為R2 ,即 其平方根R就可以用來(lái)測(cè)量?jī)蓚€(gè)變量之間的關(guān)系強(qiáng)度,42,PPT學(xué)習(xí)交流,關(guān)系強(qiáng)度的測(cè)量(例題分析),R

20、=0.591404 結(jié)論: 行業(yè)(自變量)對(duì)投訴次數(shù)(因變量)的影響效應(yīng)占總效應(yīng)的34.9759%,而殘差效應(yīng)則占65.0241%。即行業(yè)對(duì)投訴次數(shù)差異解釋的比例達(dá)到近35%,而其他因素(殘差變量)所解釋的比例近為65%以上 R=0.591404,表明行業(yè)與投訴次數(shù)之間有中等以上的關(guān)系,43,PPT學(xué)習(xí)交流,方差分析中的多重比較,通過(guò)對(duì)總體均值之間的配對(duì)比較來(lái)進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異 可采用Fisher提出的最小顯著差異方法,簡(jiǎn)寫(xiě)為L(zhǎng)SD LSD方法是對(duì)檢驗(yàn)兩個(gè)總體均值是否相等的t檢驗(yàn)方法的總體方差估計(jì)加以修正(用MSE來(lái)代替)而得到的,44,PPT學(xué)習(xí)交流,方差分析中的多重比較(步

21、驟),提出假設(shè) H0: mi = mj (第i個(gè)總體的均值等于第j個(gè)總體的均值) H1: mi mj (第i個(gè)總體的均值不等于第j個(gè)總體的均值) 計(jì)算檢驗(yàn)的統(tǒng)計(jì)量: 計(jì)算LSD 決策:若 ,拒絕H0;若 ,不拒絕H0,45,PPT學(xué)習(xí)交流,方差分析中的多重比較(例題分析),第1步:提出假設(shè) 檢驗(yàn)1: 檢驗(yàn)2: 檢驗(yàn)3: 檢驗(yàn)4: 檢驗(yàn)5: 檢驗(yàn)6:,46,PPT學(xué)習(xí)交流,方差分析中的多重比較,第2步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量 檢驗(yàn)1: 檢驗(yàn)2: 檢驗(yàn)3: 檢驗(yàn)4: 檢驗(yàn)5: 檢驗(yàn)6:,47,PPT學(xué)習(xí)交流,方差分析中的多重比較,第3步:計(jì)算LSD 檢驗(yàn)1: 檢驗(yàn)2: 檢驗(yàn)3: 檢驗(yàn)4: 檢驗(yàn)5: 檢驗(yàn)6

22、:,48,PPT學(xué)習(xí)交流,方差分析中的多重比較,第4步:作出決策,不能認(rèn)為零售業(yè)與旅游業(yè)均值之間有顯著差異,零售業(yè)與航空公司均值之間有顯著差異,不能認(rèn)為零售業(yè)與家電業(yè)均值之間有顯著差異,不能認(rèn)為旅游業(yè)與航空業(yè)均值之間有顯著差異,不能認(rèn)為旅游業(yè)與家電業(yè)均值之間有顯著差異,航空業(yè)與家電業(yè)均值有顯著差異,49,PPT學(xué)習(xí)交流,雙因素方差分析,分析兩個(gè)因素(行因素Row和列因素Column)對(duì)試驗(yàn)結(jié)果的影響 如果兩個(gè)因素對(duì)試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷行因素和列因素對(duì)試驗(yàn)數(shù)據(jù)的影響,這時(shí)的雙因素方差分析稱為無(wú)交互作用的雙因素方差分析或無(wú)重復(fù)雙因素方差分析(Two-factor without r

23、eplication) 如果除了行因素和列因素對(duì)試驗(yàn)數(shù)據(jù)的單獨(dú)影響外,兩個(gè)因素的搭配還會(huì)對(duì)結(jié)果產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析 (Two-factor with replication ),50,PPT學(xué)習(xí)交流,雙因素方差分析的基本假定,1.每個(gè)總體都服從正態(tài)分布 對(duì)于因素的每一個(gè)水平,其觀察值是來(lái)自正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本 2.各個(gè)總體的方差必須相同 對(duì)于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的 3.觀察值是獨(dú)立的,51,PPT學(xué)習(xí)交流,雙因素方差分析,【例】有4個(gè)品牌的彩電在5個(gè)地區(qū)銷售,為分析彩電的品牌(品牌因素)和銷售地區(qū)

24、(地區(qū)因素)對(duì)銷售量是否有影響,對(duì)每種品牌在各地區(qū)的銷售量取得以下數(shù)據(jù)。試分析品牌和銷售地區(qū)對(duì)彩電的銷售量是否有顯著影響?(=0.05),52,PPT學(xué)習(xí)交流,數(shù)據(jù)結(jié)構(gòu),53,PPT學(xué)習(xí)交流,數(shù)據(jù)結(jié)構(gòu), 是行因素的第i個(gè)水平下各觀察值的平均值, 是列因素的第j個(gè)水平下的各觀察值的均值, 是全部 kr 個(gè)樣本數(shù)據(jù)的總平均值,54,PPT學(xué)習(xí)交流,分析步驟(提出假設(shè)),提出假設(shè) 對(duì)行因素提出的假設(shè)為 H0: m1 = m2 = = mi = = mk (mi為第i個(gè)水平的均值) H1: mi (i =1,2, , k) 不全相等 對(duì)列因素提出的假設(shè)為 H0: m1 = m2 = = mj = =

25、mr (mj為第j個(gè)水平的均值) H1: mj (j =1,2,r) 不全相等,55,PPT學(xué)習(xí)交流,分析步驟(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量),計(jì)算平方和(SS) 總誤差平方和 行因素誤差平方和 列因素誤差平方和 隨機(jī)誤差項(xiàng)平方和,56,PPT學(xué)習(xí)交流,分析步驟(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量), 總離差平方和(SST )、水平項(xiàng)離差平方和 (SSR和SSC) 、誤差項(xiàng)離差平方和(SSE) 之間的關(guān)系,SST = SSR +SSC+SSE,57,PPT學(xué)習(xí)交流,分析步驟(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量),計(jì)算均方(MS) 誤差平方和除以相應(yīng)的自由度 三個(gè)平方和的自由度分別是 總離差平方和SST的自由度為 kr-1 行因素的離差平方和

26、SSR的自由度為 k-1 列因素的離差平方和SSC的自由度為 r-1 隨機(jī)誤差平方和SSE的自由度為 (k-1)(r-1)),58,PPT學(xué)習(xí)交流,分析步驟(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量),計(jì)算均方(MS) 行因素的均方,記為MSR,計(jì)算公式為 列因素的均方,記為MSC ,計(jì)算公式為 隨機(jī)誤差項(xiàng)的均方,記為MSE ,計(jì)算公式為,59,PPT學(xué)習(xí)交流,分析步驟(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量),計(jì)算檢驗(yàn)統(tǒng)計(jì)量(F) 檢驗(yàn)行因素的統(tǒng)計(jì)量 檢驗(yàn)列因素的統(tǒng)計(jì)量,60,PPT學(xué)習(xí)交流,分析步驟(統(tǒng)計(jì)決策),將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行比較,作出對(duì)原假設(shè)H0的決策 根據(jù)給定的顯著性水平在F分布表中查找相應(yīng)的臨界值

27、 F 若FRF ,則拒絕原假設(shè)H0 ,表明均值之間的差異是顯著的,即所檢驗(yàn)的行因素對(duì)觀察值有顯著影響 若FC F ,則拒絕原假設(shè)H0 ,表明均值之間有顯著差異,即所檢驗(yàn)的列因素對(duì)觀察值有顯著影響,61,PPT學(xué)習(xí)交流,雙因素方差分析表(基本結(jié)構(gòu)),62,PPT學(xué)習(xí)交流,雙因素方差分析,提出假設(shè) 對(duì)品牌因素提出的假設(shè)為 H0: m1=m2=m3=m4 (品牌對(duì)銷售量無(wú)顯著影響) H1: mi (i =1,2, , 4) 不全相等 (有顯著影響) 對(duì)地區(qū)因素提出的假設(shè)為 H0: m1=m2=m3=m4=m5 (地區(qū)對(duì)銷售量無(wú)顯著影響) H1: mj (j =1,2,5) 不全相等 (有顯著影響),

28、63,PPT學(xué)習(xí)交流,雙因素方差分析,結(jié)論:1.FR18.10777F3.4903,拒絕原假設(shè)H0,說(shuō)明彩電的品牌對(duì)銷售量有顯著影響; 2. FC2.100846 F3.2592,不拒絕原假設(shè)H0,無(wú)證據(jù)表明銷售地區(qū)對(duì)彩電的銷售量有顯著影響,64,PPT學(xué)習(xí)交流,雙因素方差分析(關(guān)系強(qiáng)度的測(cè)量),行平方和(行SS)度量了品牌這個(gè)自變量對(duì)因變量(銷售量)的影響效應(yīng) 列平方和(列SS)度量了地區(qū)這個(gè)自變量對(duì)因變量(銷售量)的影響效應(yīng) 這兩個(gè)平方和加在一起則度量了兩個(gè)自變量對(duì)因變量的聯(lián)合效應(yīng) 聯(lián)合效應(yīng)與總平方和的比值定義為R2 其平方根R反映了這兩個(gè)自變量合起來(lái)與因變量之間的關(guān)系強(qiáng)度,65,PPT學(xué)

29、習(xí)交流,雙因素方差分析(關(guān)系強(qiáng)度的測(cè)量),例題分析 品牌因素和地區(qū)因素合起來(lái)總共解釋了銷售量差異的83.94% 其他因素(殘差變量)只解釋了銷售量差異的16.06% R=0.9162,表明品牌和地區(qū)兩個(gè)因素合起來(lái)與銷售量之間有較強(qiáng)的關(guān)系,66,PPT學(xué)習(xí)交流,有交互作用的雙因素方差分析,【例】城市道路交通管理部門為研究不同的路段和不同的時(shí)間段對(duì)行車時(shí)間的影響,讓一名交通警察分別在兩個(gè)路段和高峰期與非高峰期親自駕車進(jìn)行試驗(yàn),通過(guò)試驗(yàn)取得共獲得20個(gè)行車時(shí)間(分鐘)的數(shù)據(jù),如下表。試分析路段、時(shí)段以及路段和時(shí)段的交互作用對(duì)行車時(shí)間的影響,67,PPT學(xué)習(xí)交流,交互作用的圖示,路段與時(shí)段對(duì)行車時(shí)間的

30、影響,68,PPT學(xué)習(xí)交流,可重復(fù)雙因素分析(方差分析表的結(jié)構(gòu)),m為樣本的行數(shù),69,PPT學(xué)習(xí)交流,可重復(fù)雙因素分析(平方和的計(jì)算),設(shè): 為對(duì)應(yīng)于行因素的第i個(gè)水平和列因素的第j個(gè) 水平的第l行的觀察值 為行因素的第i個(gè)水平的樣本均值 為列因素的第j個(gè)水平的樣本均值 對(duì)應(yīng)于行因素的第i個(gè)水平和列因素的第j個(gè)水 平組合的樣本均值 為全部n個(gè)觀察值的總均值,70,PPT學(xué)習(xí)交流,可重復(fù)雙因素分析(平方和的計(jì)算),總平方和: 行變量平方和: 列變量平方和: 交互作用平方和: 誤差項(xiàng)平方和:,71,PPT學(xué)習(xí)交流,第一個(gè)例子的方差分析(只考慮主效應(yīng),不考慮交互效應(yīng)及協(xié)變量),首先假定自變量受到的

31、僅僅有不同因素的主效應(yīng)(main effect)而沒(méi)有交互效應(yīng)(interaction)和協(xié)變量的影響。主效應(yīng)就是每個(gè)自變量對(duì)因變量的單獨(dú)影響,而交互效應(yīng)是當(dāng)兩個(gè)或更多的自變量的某些水平同時(shí)出現(xiàn)時(shí)除了主效應(yīng)之外的附加影響。拿我們例子來(lái)說(shuō),當(dāng)單獨(dú)考慮時(shí),假定主動(dòng)促銷比被動(dòng)促銷可以多產(chǎn)生8萬(wàn)元效益,而有售后服務(wù)比沒(méi)有售后服務(wù)多產(chǎn)生9萬(wàn)元效益。那么在沒(méi)有交互作用時(shí),同時(shí)采取主動(dòng)促銷和售后服務(wù)會(huì)產(chǎn)生8917萬(wàn)元的效益(稱為可加的)。但如果存在交互效應(yīng),那么同時(shí)采取主動(dòng)促銷和售后服務(wù)會(huì)產(chǎn)生一個(gè)附加的效應(yīng)即交互效應(yīng)(一般來(lái)說(shuō)也可能是正面的,也可能是負(fù)面的),這時(shí)的總效應(yīng)就不是17萬(wàn)元了。,72,PPT學(xué)習(xí)

32、交流,方差分析(只考慮主效應(yīng),不考慮交互效應(yīng)及協(xié)變量),如要分析的只是因變量銷售額和自變量促銷和售后服務(wù)的主效應(yīng)。用y表示銷售額,i表示促銷(下標(biāo)表示不同水平), j表示售后服務(wù);則相應(yīng)的只有主效應(yīng)的線性模型為:,這里的下標(biāo)i代表促銷的水平,下標(biāo)j代表是否有售后服務(wù),下標(biāo)k代表每種ij組合中的第幾個(gè)觀測(cè)值。這里的最后一項(xiàng)ijk為隨機(jī)誤差項(xiàng)。,73,PPT學(xué)習(xí)交流,對(duì)于這個(gè)模型,SPSS輸出為,促銷(promot)的F檢驗(yàn)統(tǒng)計(jì)量(其自由度來(lái)自promot和error的自由度:2,20)取值為13.880,p值為0.000(更精確些是0.0001658).而售后服務(wù)的F檢驗(yàn)統(tǒng)計(jì)量為25.497,p

33、-值為0.000(更精確些是0.00006135). R2為0.981.,74,PPT學(xué)習(xí)交流,這里的估計(jì)只有相對(duì)意義。一定要放在模型中,或者考慮同一因子水平之間的差,比如a1-a3、a2-a3、b1-b2等等。上面的模型還可以有截距,有截距時(shí)的SPSS默認(rèn)約束是固定a3=b2=0;而目前的沒(méi)有截距的a1,a2,a3的估計(jì)實(shí)際上等于截距的估計(jì)加上有截距時(shí)的a1,a2,a3的估計(jì)。 由于約束條件不一樣,所以各種軟件的各種選項(xiàng)的估計(jì)不盡相同,但相對(duì)大小是不會(huì)變的。,對(duì)于這個(gè)模型,參數(shù)估計(jì)為,75,PPT學(xué)習(xí)交流,沒(méi)有交互作用的模型可以從上面點(diǎn)圖中直觀看出。圖中下面一條折線連接了沒(méi)有售后服務(wù)時(shí)三種促銷狀況的銷售均值,而上面一條連接了有售后服務(wù)時(shí)三種促銷狀況的銷售均值。由于模型選擇為無(wú)交互作用,所以這兩條線是平行的。從該圖可以看出,兩個(gè)因子效應(yīng)綜合效應(yīng)是簡(jiǎn)單的加法。,76,PPT學(xué)習(xí)交流,SPSS實(shí)現(xiàn)(只有因子主效應(yīng)的方差分析),拿sales.sav為例,在SPSS中選AnalyzeGeneral Linear ModelUnivariate進(jìn)入主對(duì)話框; 然后把sales選入Dependent Variable,把promot和service選入Fixed Factors; 然后點(diǎn)擊Model,選擇Custom,在Build Terms: Main effects中選擇

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論