第5章 方差分析.ppt_第1頁(yè)
第5章 方差分析.ppt_第2頁(yè)
第5章 方差分析.ppt_第3頁(yè)
第5章 方差分析.ppt_第4頁(yè)
第5章 方差分析.ppt_第5頁(yè)
已閱讀5頁(yè),還剩50頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第五章方差分析,5.1方差分析簡(jiǎn)介,5.2單向方差分析,5.3雙向方差分析,學(xué)習(xí)目標(biāo)和掌握方差分析的基本概念;掌握方差分析的基本思想和原則;掌握單因素方差分析的方法和應(yīng)用;初步了解多種比較方法的應(yīng)用;了解雙因素方差分析的方法和應(yīng)用。5.1方差分析的基本概念和假設(shè),失業(yè)保險(xiǎn)案例:為什么要進(jìn)行方差分析?為了減少失業(yè)保險(xiǎn)支出,促進(jìn)就業(yè),政府試圖為失業(yè)人員提供再就業(yè)激勵(lì),如果失業(yè)人員能夠在有限的時(shí)間內(nèi)再就業(yè),他將獲得一定數(shù)額的獎(jiǎng)金。這項(xiàng)政策會(huì)有效嗎?要研究的問(wèn)題,人口1,1(紅利=1),人口2,2(紅利=2),人口3,3(紅利=3),人口4,4(紅利=4),所有人口的平均值相等嗎?失業(yè)保險(xiǎn)案例:實(shí)驗(yàn)結(jié)

2、果,1=無(wú)獎(jiǎng)金2=低獎(jiǎng)金3=中獎(jiǎng)金4=高獎(jiǎng)金。根據(jù)實(shí)驗(yàn)結(jié)果,我們能認(rèn)為每個(gè)人口的平均失業(yè)時(shí)間是相同的嗎?研究方法:兩個(gè)樣本的t檢驗(yàn)?t檢驗(yàn)用于比較兩個(gè)平均值:一次只能比較兩個(gè)平均值。為了解決方差分析問(wèn)題,需要六次T檢驗(yàn),并且在整個(gè)檢驗(yàn)中犯第一類(lèi)錯(cuò)誤的概率顯著增加。如果在每次測(cè)試中犯第一類(lèi)錯(cuò)誤的概率等于5%,那么在整個(gè)測(cè)試中就等于1-(1-0.05)6=0.2649。方差分析可以用來(lái)比較多個(gè)平均值。它可以看作是t檢驗(yàn)的擴(kuò)展,當(dāng)只比較兩個(gè)平均值時(shí),它等價(jià)于t檢驗(yàn)。它最早是由英國(guó)統(tǒng)計(jì)學(xué)家費(fèi)希爾在20世紀(jì)20年代提出的,并被應(yīng)用于生物和農(nóng)業(yè)田間試驗(yàn),此后被廣泛應(yīng)用于許多學(xué)科。5.1.1方差分析中的幾個(gè)

3、基本概念,因變量:我們作為結(jié)果實(shí)際測(cè)量的變量,如失業(yè)持續(xù)時(shí)間。獨(dú)立變量:將觀察到的結(jié)果分成幾組進(jìn)行比較的變量,如獎(jiǎng)金水平。在方差分析中,自變量也稱(chēng)為因子。因子的不同表達(dá),即每個(gè)自變量的不同值,稱(chēng)為因子水平。5.1.1基本概念,方差分析主要用于研究一個(gè)定量因變量和一個(gè)或多個(gè)定性自變量之間的關(guān)系。只有一個(gè)獨(dú)立變量的方差分析被稱(chēng)為單向方差分析。研究多種因素對(duì)因變量影響的方差分析被稱(chēng)為多元方差分析,最簡(jiǎn)單的情況是雙因素方差分析。5.1.1:固定效應(yīng)和隨機(jī)效應(yīng)模型,固定效應(yīng)模型:所有層次的因素都是由實(shí)驗(yàn)者精心安排的,而不是隨機(jī)選擇的。隨機(jī)效應(yīng)模型:因素的級(jí)別是從多個(gè)可能的級(jí)別中隨機(jī)選擇的。固定效應(yīng)模型和

4、隨機(jī)效應(yīng)模型在假設(shè)設(shè)置和參數(shù)估計(jì)上是不同的。本章研究固定效應(yīng)模型。5.1.2:方差分析的基本假設(shè):(1)各總體的因變量服從正態(tài)分布;(2)因變量的方差在每個(gè)群體中是相等的;(3)觀測(cè)值相互獨(dú)立。(1)正態(tài)性檢驗(yàn),直方圖峰度系數(shù),偏度系數(shù)Q-Q圖,K-S檢驗(yàn)*,(2)等方差檢驗(yàn),經(jīng)驗(yàn)方法:計(jì)算各組數(shù)據(jù)的標(biāo)準(zhǔn)差,如果最大值與最小值之比小于2:1,則可視為同方差。最大值與最小值之比等于1.832 Levene測(cè)試*。(3)其他解釋表明,方差分析對(duì)前兩個(gè)假設(shè)是穩(wěn)健的,并允許一定程度的偏差。獨(dú)立性的假設(shè)通??梢酝ㄟ^(guò)控制數(shù)據(jù)收集過(guò)程來(lái)保證。如果與前兩個(gè)假設(shè)有嚴(yán)重偏差,則有必要先對(duì)數(shù)據(jù)進(jìn)行數(shù)學(xué)變換,或者用非

5、參數(shù)方法比較各組的平均值。5.2。單因素方差分析,5.2.1單因素方差分析模型,5.2.2單因素方差分析的基本原理,5.2.3單因素方差分析的步驟,5.2.4單因素方差分析中的多重比較,5.2.1單因素方差分析模型和:模型有一個(gè)自變量(因子)和一個(gè)因變量。在失業(yè)保險(xiǎn)實(shí)驗(yàn)中,假設(shè)張三處于高獎(jiǎng)金組,張三的失業(yè)時(shí)間=高獎(jiǎng)金組的平均失業(yè)時(shí)間=隨機(jī)因素的影響=高獎(jiǎng)金組的平均值與總平均值之差,5.2.2:總變差的分解(離差平方和),SSTSSASSE,5.2.2:組間方差和組內(nèi)方差, 偏差平方和的大小和觀測(cè)值計(jì)算方法是將偏差平方和除以相應(yīng)三個(gè)平方和的自由度,其中SST的自由度是n-1,n是所有觀測(cè)值的個(gè)數(shù)

6、,SSA的自由度是r-1,其中r是因子水平的個(gè)數(shù),SSE的自由度是n-r,5.2.2:組間方差和組內(nèi)方差,5.2.2:方差分析的基本思想, 組間方差,如果因子A的不同水平對(duì)結(jié)果沒(méi)有影響,那么組間方差只有隨機(jī)誤差,兩個(gè)方差之比將接近1。 如果不同水平對(duì)結(jié)果有影響,組間方差將大于組內(nèi)方差,組間方差與組內(nèi)方差之比將大于1。當(dāng)這一比值在一定程度上較大時(shí),可以說(shuō)不同水平之間存在顯著差異,或者因子A對(duì)結(jié)果有顯著影響。F=,1。檢查數(shù)據(jù)是否符合方差分析的假設(shè)。2.提出零假設(shè)和替代假設(shè):零假設(shè):每個(gè)群體的均值之間沒(méi)有顯著差異,即替代假設(shè):至少兩個(gè)均值不相等,即5.2.3:方差分析的步驟,5.2.3:方差分析的

7、步驟,3。根據(jù)樣本計(jì)算f統(tǒng)計(jì)值。方差分析表,5.2.3:方差分析的步驟,4。根據(jù)實(shí)際值與臨界值的比較,或p值與臨界值的比較,確定決策規(guī)則并得出試驗(yàn)結(jié)論。當(dāng)零假設(shè)成立時(shí),組間方差與組內(nèi)方差之比服從F分布,自由度為(r-1,n-r)。以失業(yè)保險(xiǎn)(1)為例,在失業(yè)保險(xiǎn)實(shí)驗(yàn)中,讓顯著性水平為0.05,并嘗試分析獎(jiǎng)金水平對(duì)失業(yè)時(shí)間是否有顯著影響。失業(yè)保險(xiǎn)的例子(2),1。根據(jù)前面的分析,數(shù)據(jù)符合方差分析的假設(shè)。2.提出零假設(shè)和替代假設(shè):H0: 1234,H1: 1,2,3和4不都是相等的。失業(yè)保險(xiǎn)示例(3),3。計(jì)算f統(tǒng)計(jì)的實(shí)際值。手工計(jì)算可以根據(jù)方差分析表的內(nèi)容逐步計(jì)算。由于計(jì)算量大,在實(shí)際應(yīng)用中通常

8、使用統(tǒng)計(jì)軟件。以下是用電子表格計(jì)算的方差分析表。失業(yè)保險(xiǎn)示例(4),4。樣本的f值是3.04。因此,我們應(yīng)該拒絕零假設(shè),得出獎(jiǎng)金水平對(duì)再就業(yè)時(shí)間有顯著影響的結(jié)論。同樣,因?yàn)?,可以得出同樣的結(jié)論。2.9,0.0433,0.05,3.04,示例2熱帶雨林(1),當(dāng)樣本大小在不同級(jí)別有所不同時(shí),單向方差分析方法完全適用,但公式略有不同,使用軟件進(jìn)行分析時(shí)很難看出這種差異。一份關(guān)于伐木對(duì)熱帶雨林影響的統(tǒng)計(jì)研究報(bào)告指出,“環(huán)境保護(hù)主義者幾乎絕望于砍伐、開(kāi)墾和焚燒樹(shù)木對(duì)熱帶雨林的破壞?!边@項(xiàng)研究比較了相似地塊上的樹(shù)木數(shù)量,其中一些從未收割過(guò),一些是一年前收割的,一些是八年前收割的。根據(jù)數(shù)據(jù),伐木對(duì)樹(shù)木數(shù)量

9、有顯著影響嗎?顯著性水平=0.05。示例2熱帶雨林(2),1。正態(tài)性檢驗(yàn):直方圖,例2熱帶雨林(3),同質(zhì)性檢驗(yàn):最大值與最小值之比等于33.19/4.81=1.34,明顯小于4,可視為等方差。示例2熱帶雨林(4),2。提出零假設(shè)和替代假設(shè):雨林砍伐對(duì)樹(shù)木數(shù)量沒(méi)有顯著影響(各組平均值相等);替代假設(shè):雨林收獲對(duì)這對(duì)夫婦有重大影響(每組的平均值并不完全相等)。示例2熱帶雨林(5),3,方差分析表4,結(jié)論。f值=11.433.3然而,為了進(jìn)一步檢驗(yàn)?zāi)男┢骄稻哂酗@著差異,有必要使用多種比較方法進(jìn)行分析。這被稱(chēng)為方差分析中的反向檢驗(yàn)。多重比較是每個(gè)群體平均值的成對(duì)比較。有許多方法,如費(fèi)希爾的最小顯著

10、差異法、圖基的誠(chéng)實(shí)顯著差異法或邦費(fèi)里尼的方法。這里,我們只介紹最小顯著差異法。1.提出假設(shè)H0:mi=mjh13360mi mj2,計(jì)算檢驗(yàn)3a的統(tǒng)計(jì),如果是,則拒絕H0。3b .計(jì)算的置信區(qū)間:如果置信區(qū)間中包含0,則不能拒絕H0;否則,不能拒絕H0。在失業(yè)保險(xiǎn)實(shí)驗(yàn)中,根據(jù)第一人口和第四人口的T統(tǒng)計(jì)量,利用統(tǒng)計(jì)軟件可以計(jì)算出T檢驗(yàn)的臨界值,因此我們有證據(jù)表明,無(wú)獎(jiǎng)金組和高獎(jiǎng)金組的再就業(yè)時(shí)間存在顯著差異。其他獎(jiǎng)勵(lì)等級(jí)效果之間的差異的顯著性也可以通過(guò)類(lèi)似的方法來(lái)計(jì)算。例子:雨林收獲許多統(tǒng)計(jì)軟件可以直接進(jìn)行多重比較。下表是熱帶雨林實(shí)例的SPSS輸出結(jié)果。5.3114.03和3.2612.68的置信

11、區(qū)間不包括0,差異顯著。置信區(qū)間-6.043.02包含0,差異不顯著。5.3雙因素方差分析,5.3.1無(wú)交互作用的雙因素方差分析5.3.2有交互作用的雙因素方差分析5.3.3雙因素方差分析步驟,交互作用,交互作用意味著一個(gè)因素對(duì)因變量的影響程度受另一個(gè)因素的影響。假設(shè)學(xué)生分為兩類(lèi):在學(xué)校和在工作。將兩類(lèi)學(xué)生隨機(jī)分為兩組,分別采用課堂教學(xué)和互動(dòng)教學(xué)的方法。測(cè)試結(jié)果如下表所示。由此可見(jiàn),課堂教學(xué)更適合在校學(xué)生,互動(dòng)教學(xué)更適合在職學(xué)生。在這種情況下,我們說(shuō)這兩個(gè)因素之間有相互作用。雙因素方差分析的類(lèi)型和基本假設(shè),其中因素A和因素B對(duì)結(jié)果的影響是獨(dú)立的,稱(chēng)為無(wú)交互作用的雙因素方差分析。如果除了A和B對(duì)

12、結(jié)果的獨(dú)立影響之外還有交互作用,那么雙因素方差分析被稱(chēng)為有交互作用的雙因素方差分析。雙因素方差分析的基本假設(shè)是每個(gè)亞群服從正態(tài)分布,具有相同的方差,每個(gè)觀察值相互獨(dú)立(與單因素相同)。5.3.1無(wú)交互作用的雙因素方差分析模型。在無(wú)交互作用的雙因素方差分析模型中,因變量的值受四個(gè)因素影響:總體平均值;由因素A引起的差異;乙因素造成的差異;和誤差項(xiàng)。該模型以下列形式寫(xiě)成:5.3.1無(wú)交互作用的雙因素方差分析模型,方差平方和的分解:無(wú)交互作用的雙因素方差分析表,5.3.2有交互作用的雙因素方差分析模型,其中因變量的值受五個(gè)因素的影響:總體平均值;由因素A引起的差異;乙因素造成的差異;因素甲和因素乙相

13、互作用產(chǎn)生的差異;和誤差項(xiàng)。書(shū)面模型的形式為:5.3.2交互作用的雙因素方差分析模型,方差平方和的分解:交互作用的雙因素方差分析表,5.3.3雙因素方差分析步驟(1),類(lèi)似于單因素分析,主要包括以下步驟:1。分析研究數(shù)據(jù)滿足方差分析要求的假設(shè)。如果假設(shè)條件不滿足,應(yīng)該首先轉(zhuǎn)換數(shù)據(jù)。5.3.3雙因素方差分析的步驟(2),2。提出零假設(shè)和替代假設(shè)。雙因素方差分析可以同時(shí)檢驗(yàn)兩組或三組零假設(shè)和替代假設(shè)。要說(shuō)明因素A是否有顯著影響,就要檢驗(yàn)以下假設(shè):要說(shuō)明因素B是否有顯著影響,就要檢驗(yàn)以下假設(shè):在有交互作用的雙因素方差中,要檢驗(yàn)第三組零假設(shè)和替代假設(shè):5.3.3雙因素方差分析的步驟(3),3。計(jì)算f檢

14、驗(yàn)值。4.根據(jù)實(shí)際值與臨界值的比較,或p值與臨界值的比較,得出檢驗(yàn)結(jié)論。與單因素方差分析的情況相似,對(duì)于固定資產(chǎn)、固定資產(chǎn)和固定資產(chǎn),當(dāng)計(jì)算的固定資產(chǎn)價(jià)值大于臨界值時(shí),零假設(shè)H0被拒絕。雙因素方差分析:失業(yè)保險(xiǎn)的一個(gè)例子(1)考慮到獎(jiǎng)金和年齡,它們對(duì)失業(yè)時(shí)間有顯著影響嗎?雙因素方差分析:失業(yè)保險(xiǎn)的一個(gè)例子(2)。1.當(dāng)同時(shí)考慮獎(jiǎng)金水平和年齡時(shí),每個(gè)實(shí)驗(yàn)條件下只有三個(gè)數(shù)據(jù),不適合正態(tài)性和等方差的直接檢驗(yàn)。假設(shè)這些條件成立。2.提出假設(shè)(有交互作用的方差分析模型):獎(jiǎng)金因素:年齡因素:交互作用:雙因素方差分析:失業(yè)保險(xiǎn)的一個(gè)例子(3),3。差異分析表(電子表格)4。結(jié)論:獎(jiǎng)金水平對(duì)就業(yè)時(shí)間有顯著影響,顯著水平為5%;年齡對(duì)就業(yè)時(shí)間有顯著影響。獎(jiǎng)金水平和年齡之間的交互作用不顯著。總結(jié)(1),1。方差分析(ANOVA)通常用于分析一個(gè)定量因變量和一個(gè)或多個(gè)定性自變量(因素)之間的關(guān)系。它可以測(cè)試多個(gè)群體的平均值是否相等。2.根據(jù)研究涉及的因素?cái)?shù)量,方差分析可分為單因素方差分析和多因素方差分析(包括雙因素方差分析

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論