單因素方差分析與多重比較.ppt_第1頁
單因素方差分析與多重比較.ppt_第2頁
單因素方差分析與多重比較.ppt_第3頁
單因素方差分析與多重比較.ppt_第4頁
單因素方差分析與多重比較.ppt_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第3章 單因素方差分析與多重比較,南京農(nóng)業(yè)大學(xué)農(nóng)學(xué)院 李剛?cè)A,3.1 方差分析引論,方差分析及其有關(guān)術(shù)語 方差分析的基本思想和原理 方差分析的基本假定 問題的一般提法,什么是方差分析(ANOVA)?(analysis of variance),檢驗(yàn)多個(gè)總體均值是否相等 通過分析觀察數(shù)據(jù)的誤差判斷各總體均值是否相等 研究分類型自變量對(duì)數(shù)值型因變量的影響 一個(gè)或多個(gè)分類尺度的自變量 2個(gè)或多個(gè) (k 個(gè)) 處理水平或分類 一個(gè)間隔或比率尺度的因變量 有單因素方差分析和雙因素方差分析 單因素方差分析:涉及一個(gè)分類的自變量 雙因素方差分析:涉及兩個(gè)分類的自變量,什么是方差分析? (例題分析),【例】為

2、了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在四個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對(duì)總共23家企業(yè)投訴的次數(shù)如下表,什么是方差分析? (例題分析),分析四個(gè)行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對(duì)“投訴次數(shù)”是否有顯著影響 作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個(gè)行業(yè)被投訴次數(shù)的均值是否相等 如果它們的均值相等,就意味著“行業(yè)”對(duì)投訴次數(shù)是沒有影響的,即它們之間的服務(wù)質(zhì)量沒有顯著差異;如果均值不全相等,則意味著“行業(yè)”對(duì)投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異,方差分析中的有關(guān)術(shù)語,因素或因子(factor) 所要檢驗(yàn)的對(duì)象 要分析行業(yè)對(duì)投訴次數(shù)是否有影響,行

3、業(yè)是要檢驗(yàn)的因素或因子 水平或處理(treatment) 因子的不同表現(xiàn) 零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)就是因子的水平 觀察值 在每個(gè)因素水平下得到的樣本值 每個(gè)行業(yè)被投訴的次數(shù)就是觀察值,方差分析中的有關(guān)術(shù)語,試驗(yàn) 這里只涉及一個(gè)因素,因此稱為單因素四水平的試驗(yàn) 總體 因素的每一個(gè)水平可以看作是一個(gè)總體 比如零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)可以看作是四個(gè)總體 樣本數(shù)據(jù) 被投訴次數(shù)可以看作是從這四個(gè)總體中抽取的樣本數(shù)據(jù),方差分析的基本思想和原理(圖形分析),從散點(diǎn)圖上可以看出 不同行業(yè)被投訴的次數(shù)是有明顯差異的 即使是在同一個(gè)行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同 家電制造也被投訴的次

4、數(shù)較高,航空公司被投訴的次數(shù)較低 行業(yè)與被投訴次數(shù)之間有一定的關(guān)系 如果行業(yè)與被投訴次數(shù)之間沒有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近,方差分析的基本思想和原理(圖形分析),僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異 這種差異也可能是由于抽樣的隨機(jī)性所造成的 需要有更準(zhǔn)確的方法來檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析 所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時(shí)則需要借助于方差 這個(gè)名字也表示:它是通過對(duì)數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來源

5、。,方差分析的基本思想和原理,1.比較兩類誤差,以檢驗(yàn)均值是否相等 2.比較的基礎(chǔ)是方差比 3.如果系統(tǒng)(處理)誤差顯著地不同于隨機(jī)誤差,則均值就是不相等的;反之,均值就是相等的 4.誤差是由各部分的誤差占總誤差的比例來測度的,方差分析的基本思想和原理,方差分析的基本思想和原理(兩類誤差),隨機(jī)誤差 因素的同一水平(總體)下,樣本各觀察值之間的差異 比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)是不同的 這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差 系統(tǒng)誤差 因素的不同水平(不同總體)下,各觀察值之間的差異 比如,不同行業(yè)之間的被投訴次數(shù)之間的差異 這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行

6、業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差,方差分析的基本思想和原理(兩類方差),數(shù)據(jù)的誤差用平方和(sum of squares)表示,稱為方差 組內(nèi)方差(within groups) 因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的方差 比如,零售業(yè)被投訴次數(shù)的方差 組內(nèi)方差只包含隨機(jī)誤差 組間方差(between groups) 因素的不同水平(不同總體)下各樣本之間的方差 比如,四個(gè)行業(yè)被投訴次數(shù)之間的方差 組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差,方差分析的基本思想和原理(方差的比較),若不同不同行業(yè)對(duì)投訴次數(shù)沒有影響,則組間誤差中只包含隨機(jī)誤差,沒有系統(tǒng)誤差。這時(shí),組

7、間誤差與組內(nèi)誤差經(jīng)過平均后的數(shù)值就應(yīng)該很接近,它們的比值就會(huì)接近1 若不同行業(yè)對(duì)投訴次數(shù)有影響,在組間誤差中除了包含隨機(jī)誤差外,還會(huì)包含有系統(tǒng)誤差,這時(shí)組間誤差平均后的數(shù)值就會(huì)大于組內(nèi)誤差平均后的數(shù)值,它們之間的比值就會(huì)大于1 當(dāng)這個(gè)比值大到某種程度時(shí),就可以說不同水平之間存在著顯著差異,也就是自變量對(duì)因變量有影響 判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說明不同行業(yè)對(duì)投訴次數(shù)有顯著影響,方差分析的基本假定,每個(gè)總體都應(yīng)服從正態(tài)分布 對(duì)于因素的每一個(gè)水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機(jī)樣本 比如,每個(gè)行

8、業(yè)被投訴的次數(shù)必需服從正態(tài)分布 各個(gè)總體的方差必須相同 各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的 比如,四個(gè)行業(yè)被投訴次數(shù)的方差都相等 觀察值是獨(dú)立的 比如,每個(gè)行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨(dú)立,方差分析中的基本假定,在上述假定條件下,判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的四個(gè)正態(tài)總體的均值是否相等 如果四個(gè)總體的均值相等,可以期望四個(gè)樣本的均值也會(huì)很接近 四個(gè)樣本的均值越接近,推斷四個(gè)總體均值相等的證據(jù)也就越充分 樣本均值越不同,推斷總體均值不同的證據(jù)就越充分,方差分析中基本假定, 如果原假設(shè)成立,即H0: m1 = m2 = m3 = m4 四個(gè)行業(yè)被投

9、訴次數(shù)的均值都相等 意味著每個(gè)樣本都來自均值為、方差為2的同一正態(tài)總體,X,f(X),1 2 3 4,方差分析中基本假定,若備擇假設(shè)成立,即H1: mi (i=1,2,3,4)不全相等 至少有一個(gè)總體的均值是不同的 四個(gè)樣本分別來自均值不同的四個(gè)正態(tài)總體,問題的一般提法,設(shè)因素有k個(gè)水平,每個(gè)水平的均值分別用1、2、k 表示 要檢驗(yàn)k個(gè)水平(總體)的均值是否相等,需要提出如下假設(shè): H0: 1 2 k H1: 1 , 2 , ,k 不全相等 設(shè)1為零售業(yè)被投訴次數(shù)的均值,2為旅游業(yè)被投訴次數(shù)的均值,3為航空公司被投訴次數(shù)的均值,4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設(shè)為 H0: 1 2 3

10、4 H1: 1 , 2 , 3 , 4 不全相等,3.2 單因素方差分析,數(shù)據(jù)結(jié)構(gòu) 分析步驟 關(guān)系強(qiáng)度的測量 用Excel進(jìn)行方差分析,單因素方差分析的數(shù)據(jù)結(jié)構(gòu)(one-way analysis of variance),分析步驟 提出假設(shè) 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量 統(tǒng)計(jì)決策,提出假設(shè),一般提法 H0: m1 = m2 = mk 自變量對(duì)因變量沒有顯著影響 H1: m1 ,m2 , ,mk不全相等 自變量對(duì)因變量有顯著影響 注意:拒絕原假設(shè),只表明至少有兩個(gè)總體的均值不相等,并不意味著所有的均值都不相等,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量,構(gòu)造統(tǒng)計(jì)量需要計(jì)算 水平的均值 全部觀察值的總均值 誤差平方和 均方(MS),構(gòu)造

11、檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算水平的均值),假定從第i個(gè)總體中抽取一個(gè)容量為ni的簡單隨機(jī)樣本,第i個(gè)總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個(gè)數(shù) 計(jì)算公式為,式中: ni為第 i 個(gè)總體的樣本觀察值個(gè)數(shù) xij 為第 i 個(gè)總體的第 j 個(gè)觀察值,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算全部觀察值的總均值),全部觀察值的總和除以觀察值的總個(gè)數(shù) 計(jì)算公式為,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(例題分析),構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算總誤差平方和 SST),全部觀察值 與總平均值 的離差平方和 反映全部觀察值的離散狀況 其計(jì)算公式為,前例的計(jì)算結(jié)果: SST = (57-47.869565)2+(58-47.869565)2 =115.9

12、295,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算水平項(xiàng)平方和 SSA),各組平均值 與總平均值 的離差平方和 反映各總體的樣本均值之間的差異程度,又稱組間平方和 該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差 計(jì)算公式為,前例的計(jì)算結(jié)果:SSA = 1456.608696,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算誤差項(xiàng)平方和 SSE),每個(gè)水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和 反映每個(gè)樣本各觀察值的離散狀況,又稱組內(nèi)平方和 該平方和反映的是隨機(jī)誤差的大小 計(jì)算公式為,前例的計(jì)算結(jié)果:SSE = 2708,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(三個(gè)平方和的關(guān)系),總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和 (SSA) 之間的

13、關(guān)系,SST = SSA + SSE,前例的計(jì)算結(jié)果: 4164.608696=1456.608696+2708,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(三個(gè)平方和的作用),SST反映全部數(shù)據(jù)總的誤差程度;SSE反映隨機(jī)誤差的大??;SSA反映隨機(jī)誤差和系統(tǒng)誤差的大小 如果原假設(shè)成立,則表明沒有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會(huì)太大;如果組間均方顯著地大于組內(nèi)均方,說明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差 判斷因素的水平是否對(duì)其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算均方MS),各誤差平方和的大小與觀

14、察值的多少有關(guān),為消除觀察值多少對(duì)誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差 計(jì)算方法是用誤差平方和除以相應(yīng)的自由度 三個(gè)平方和對(duì)應(yīng)的自由度分別是 SST 的自由度為n-1,其中n為全部觀察值的個(gè)數(shù) SSA的自由度為k-1,其中k為因素水平(總體)的個(gè)數(shù) SSE 的自由度為n-k,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算均方 MS),組間方差:SSA的均方,記為MSA,計(jì)算公式為,組內(nèi)方差:SSE的均方,記為MSE,計(jì)算公式為,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(計(jì)算檢驗(yàn)統(tǒng)計(jì)量 F ),將MSA和MSE進(jìn)行對(duì)比,即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F 當(dāng)H0為真時(shí),二者的比值服從分子自由度為k-1、分母自由度為 n-k 的

15、F 分布,即,構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(F分布與拒絕域),如果均值相等,F(xiàn)=MSA/MSE1,統(tǒng)計(jì)決策, 將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行比較,作出對(duì)原假設(shè)H0的決策 根據(jù)給定的顯著性水平,在F分布表中查找與第一自由度df1k-1、第二自由度df2=n-k 相應(yīng)的臨界值 F 若FF ,則拒絕原假設(shè)H0 ,表明均值之間的差異是顯著的,所檢驗(yàn)的因素對(duì)觀察值有顯著影響 若FF ,則不拒絕原假設(shè)H0 ,不能認(rèn)為所檢驗(yàn)的因素對(duì)觀察值有顯著影響,單因素方差分析表(基本結(jié)構(gòu)),單因素方差分析(例題分析),用Excel進(jìn)行方差分析,用Excel進(jìn)行方差分析,第1步:選擇“工具”下拉菜單 第2步:選擇“數(shù)

16、據(jù)分析”選項(xiàng) 第3步:在分析工具中選擇“單因素方差分析” ,然 后選擇“確定” 第4步:當(dāng)對(duì)話框出現(xiàn)時(shí) 在“輸入?yún)^(qū)域”方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域 在方框內(nèi)鍵入0.05(可根據(jù)需要確定) 在“輸出選項(xiàng)”中選擇輸出區(qū)域 用Excel進(jìn)行方差分析,3.3 方差分析中的多重比較,多重比較的意義 多重比較的方法,方差分析中的多重比較(multiple comparison procedures),通過對(duì)總體均值之間的配對(duì)比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異 可采用最小顯著差異方法(LSD),鄧肯法(Duncan),SPSS方差分析,方差分析過程,單因素方差分析的菜單圖,高級(jí)多元方差分析菜單,簡單的一維

17、方差分析,返回,單因素方差分析,-主對(duì)話框,對(duì)照比較對(duì)話框,返回,均值多重比較的對(duì)話框,輸出統(tǒng)計(jì)量對(duì)話框,分析輸出1,返回,描述統(tǒng)計(jì)量,例:分析不同飼料對(duì)豬體重的影響data07-01,多重比較結(jié)果的表示方法,(一) 列梯形表法 (二) 劃線法 (三) 標(biāo)記字母法,標(biāo)記字母法:,(1)將全部平均數(shù)從大到小依次排列。 (2)在最大的平均數(shù)上標(biāo)上字母a;將該平均數(shù)與以下各平均數(shù)相比,相差不顯著的,都標(biāo)上字母a,直至某一個(gè)與之相差顯著的平均數(shù)則標(biāo)以字母b(向下過程), (3)再以該標(biāo)有b的平均數(shù)為標(biāo)準(zhǔn),與上方各個(gè)比它大的平均數(shù)比,凡不顯著的也一律標(biāo)以字母b(向上過程); 再以該標(biāo)有b的最大平均數(shù)為標(biāo)準(zhǔn),與以下各未標(biāo)記的平均數(shù)比,凡不顯著的繼續(xù)標(biāo)以字

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論