數(shù)理統(tǒng)計(jì)第4章.ppt_第1頁(yè)
數(shù)理統(tǒng)計(jì)第4章.ppt_第2頁(yè)
數(shù)理統(tǒng)計(jì)第4章.ppt_第3頁(yè)
數(shù)理統(tǒng)計(jì)第4章.ppt_第4頁(yè)
數(shù)理統(tǒng)計(jì)第4章.ppt_第5頁(yè)
已閱讀5頁(yè),還剩64頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章,第 四 章 方差分析與試驗(yàn)設(shè)計(jì),4.1 單因素方差分析 4.2 雙因素方差分析 4.3 正交設(shè)計(jì),4.1 一元方差分析,一、方差分析及其有關(guān)術(shù)語(yǔ),(一)指標(biāo)、因素、水平,1、指標(biāo)試驗(yàn)結(jié)果值稱為指標(biāo),一般表示為,數(shù)值,用 X 表示。,2、因素影響指標(biāo)的因子,一般表示為分類變量。用 A,B,C 表示,3、水平因素所處的狀態(tài),一般用A1、A2、 A3、 Ar 。,單因素方差分析:眾多因素中僅有一個(gè)因素的的水平有多個(gè),其余因素只有一個(gè)水平。,多因素方差分析:多個(gè)因素有多個(gè)水平。,【例】為了比較四種肥料對(duì)小麥畝產(chǎn)量的影響,取一片土壤肥沃程度和水利灌溉條件差不多的土地分成16塊,肥料品種A1、A2

2、、 A3、A4,每種肥料施在四塊土地上,得畝產(chǎn):,指標(biāo):畝產(chǎn),因素:肥料,水平: 品種,(二)什么是方差分析(ANOVA) (analysis of variance),1、引例用上例,研究問(wèn)題:各肥料品種是否有差異。,問(wèn)題轉(zhuǎn)化:各肥料品種是否有差異體現(xiàn)為各肥料品種對(duì)小麥畝產(chǎn)量的影響否有顯著差異。,記 X1 為肥料A1下的小麥畝產(chǎn)量, m1為平均畝產(chǎn)量; X2 為肥料A2下的小麥畝產(chǎn)量, m2為平均畝產(chǎn)量; X3 為肥料A3下的小麥畝產(chǎn)量, m3為平均畝產(chǎn)量; X4 為肥料A4下的小麥畝產(chǎn)量, m4為平均畝產(chǎn)量;問(wèn)題轉(zhuǎn)化為,H0: m1 = m2 = m3 = m4,H1: m1 m2 m3

3、m4不全等,檢驗(yàn)多個(gè)母體平均數(shù)是否相等,2、什么是方差分析,手段:分析數(shù)據(jù)的誤差判斷各母體均值是否相等,(三)方差分析的有關(guān)術(shù)語(yǔ),試驗(yàn)這里只涉及一個(gè)因素,因此稱為單因素四水平的試驗(yàn) 母體因素的每一個(gè)水平可以看作是一個(gè)母體 比如肥料品種A1、A2、 A3、A4, 子樣數(shù)據(jù) 畝產(chǎn)量可以看作是從這四個(gè)母體中抽取的子樣數(shù)據(jù),【例】為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在四個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對(duì)總共23家企業(yè)投訴的次數(shù)如下表,二、方差分析的基本原理,(一)圖形分析,子樣平均值的折線,1、從散點(diǎn)圖上可以看出 不同行業(yè)被投訴的次數(shù)是有明顯差異的 即使是在同一個(gè)行業(yè),不同

4、企業(yè)被投訴的次數(shù)也明顯不同 家電制造被投訴的次數(shù)較高,航空公司被 投訴的次數(shù)較低 2、行業(yè)與被投訴次數(shù)之間有一定的關(guān)系 如果行業(yè)與被投訴次數(shù)之間沒(méi)有關(guān)系,那么 它們被投訴的次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖 上所呈現(xiàn)的模式也就應(yīng)該很接近,1、僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不 同行業(yè)被投訴的次數(shù)之間有顯著差異 這種差異也可能是由于抽樣的隨機(jī)性所造成的 2、需要有更準(zhǔn)確的方法來(lái)檢驗(yàn)這種差異是否顯著, 也就是進(jìn)行方差分析 所以叫方差分析,因?yàn)殡m然我們感興趣的是均值, 但在判斷均值之間是否有差異時(shí)則需要借助于方差 這個(gè)名字也表示:它是通過(guò)對(duì)數(shù)據(jù)誤差來(lái)源的分析 判斷不同母體的均值是否相等。因此,進(jìn)行

5、方差分析 時(shí),需要考察數(shù)據(jù)誤差的來(lái)源。,(二)方差分析的思想,1.比較兩類誤差,以檢驗(yàn)均值是否相等 2.比較的基礎(chǔ)是方差比 3.如果系統(tǒng)(處理)誤差顯著地不同于隨機(jī)誤差,則均值就是不相等的;反之,均值就是相等的 4.誤差是由各部分的誤差占總誤差的比例來(lái)測(cè)度的,(三)方差分析的基本原理,1、隨機(jī)誤差 因素的同一水平(母體)下,子樣各觀察值之 間的差異,對(duì)數(shù)據(jù)形成組內(nèi)差。 比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)是不 同的 這種差異可以看成是隨機(jī)因素的影響,稱為 隨機(jī)誤差,附:兩類誤差,2、系統(tǒng)誤差 因素的不同水平(不同母體)下,各觀察值之 間的差異,對(duì)數(shù)據(jù)形成組間差。 比如,不同行業(yè)之間的被投訴次數(shù)之

6、間的差 異 這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差,附:兩類誤差,三、單因素方差分析(一元),(一)模型,1、【例】為了比較四種肥料對(duì)小麥畝產(chǎn)量的影響,取一片土壤肥沃程度和水利灌溉條件差不多的土地分成16塊,肥料品種A1、A2、 A3、A4,每種肥料施在四塊土地上,得畝產(chǎn):,?不同品種肥料對(duì)小麥畝產(chǎn)量的作用是否有差異,不同品種肥料對(duì)小麥畝產(chǎn)量的作用是否有差異?轉(zhuǎn)化為是否拒絕 H0,H0: m1 = m2 = m3 = m4,H1: m1 m2 m3 m4不全等,設(shè)因素有r個(gè)水平(r個(gè)母體Xi i =1,2, n

7、) 每個(gè)水平的均值分別用1、2、 r 表示,2、一般模型,設(shè),H0: 1 2 r,H1: 1 ,2 ,r不全相等( !H1可以不寫),且各母體獨(dú)立,1、平方和 (1)總平方和(總離差),其中,第 i 行 (水平) 的平均數(shù),全部子樣的平均數(shù),(二) H0檢驗(yàn)的統(tǒng)計(jì)量,(2)組內(nèi)差(誤差項(xiàng)離差平方和)(隨機(jī)誤差),為第 i 行的子樣方差,(3)組間差(水平項(xiàng)離差平方和) (系統(tǒng)誤差),(4)三個(gè)平方和的關(guān)系,2、各平方和的作用及分布,(1) QE 反映隨機(jī)抽樣誤差的大小,該誤差是 由于各母體子樣值內(nèi)部的差異,可認(rèn)為是由 引起的誤差。由于,(3) QT 反映全部數(shù)據(jù)總的誤差程度,2、各平方和的作用

8、及分布,H0: 1 2 r,如果H0真 (1 2 r ) xij可以視為來(lái)自N ( ,2 ) 的容量為n的子樣。故H0真的條件下有,(3) QA反映水平之間的差異,2、各平方和的作用及分布,故當(dāng)H0真時(shí)1 2 r ,有,故 QA是由于水平之間的差異引起的,(4) QA分布,2、各平方和的作用及分布,QT QA QE的意義:總離差由兩部份構(gòu)成, 其一是由各水平(母體)的子樣值內(nèi)部的差異引 起,其二是由于水平之間的差異引起的,,由于QT QA QE,當(dāng)H0真時(shí),故當(dāng)H0真時(shí),如果原假設(shè)H0成立,即有,3、 H0的檢驗(yàn)統(tǒng)計(jì)量,:m1 = m2 = mr,相差不大,而,故H0 成立時(shí)QA 不應(yīng)太大,取

9、檢驗(yàn)統(tǒng)計(jì)量為,由于QA及 QT QA QE,故QA與F 等價(jià), H0 成立時(shí) F 應(yīng)小。故 H0 的拒絕域?yàn)?(三)H0 的拒絕域,滿足,F 臨界值為,(四)單因素方差分析表,(五)單因素方差計(jì)算,1、用統(tǒng)計(jì)軟件計(jì)算SPSSTSP,在Excel實(shí)現(xiàn):(1)輸入數(shù)據(jù)( r列);(2)在“工具”下拉“數(shù)據(jù)分析”,即可找到“單因方差分析”,【例】為了比較四種肥料對(duì)小麥畝產(chǎn)量的影響,取一片土壤肥沃程度和水利灌溉條件差不多的土地分成16塊,肥料品種A1、A2、 A3、A4,每種肥料施在四塊土地上,得畝產(chǎn):,?不同品種肥料對(duì)小麥畝產(chǎn)量的作用是否有差異,解:在Excel下運(yùn)算得:,子樣落入拒絕域,拒絕H0,

10、有證據(jù)表明,不同的肥料品種對(duì)小麥畝產(chǎn)量的影響是有顯著差異。,各平方和的計(jì)算 由子樣方差的計(jì)算公式,得:,(1)簡(jiǎn)化數(shù)據(jù)(全部數(shù)據(jù)加減同一個(gè)數(shù),或 同乘一個(gè)數(shù),F(xiàn)值不變),2、手工計(jì)算,(2)列表計(jì)算,和,(3)計(jì)算QT ,QE ,QA,(4)計(jì)算,(5)判斷子樣是否落入拒絕域,【例】某燈泡廠用四種不同配料方案制成的燈絲生產(chǎn)四批燈泡,在每批中抽取若干試驗(yàn),得,問(wèn)不同的燈絲配方對(duì)燈泡的壽命的影響有無(wú)顯著差異?,解:所有數(shù)據(jù)減1600,所以,在 = 0.05的水平上不拒絕H0。認(rèn)為不同燈泡的配方對(duì)燈泡的壽命的影響無(wú)顯著差異。,四、母體平均數(shù)的兩兩比較,2、方法:可采用Fisher提出的最小顯著差異方

11、法,簡(jiǎn)寫為L(zhǎng)SD(或t 檢驗(yàn)) LSD方法是對(duì)檢驗(yàn)兩個(gè)總體均值是否相等的t 檢驗(yàn)方法的總體方差估計(jì)加以修正(用MSE來(lái)代替 )而得到的,1、意義:若拒絕H0,只能得到各母體的平均 數(shù)有差異。通過(guò)對(duì)母體平均數(shù)之間的兩兩比較 來(lái)進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異,(一)母體平均數(shù)的兩兩比較檢驗(yàn),3、 LSD方法步驟: (1)提出假設(shè) H0: mi = mj (第i個(gè)母體的均值等于第j個(gè)總體的均值) H1: mi mj (第i個(gè)母體的均值不等于第j個(gè)總體的均值),(2)計(jì)算 LSD :,(3) H0拒絕域?yàn)?或:(t檢驗(yàn)) (1)提出假設(shè) H0: mi = mj (第i個(gè)母體的均值等于第j個(gè)總體的均

12、值) H1: mi mj (第i個(gè)母體的均值不等于第j個(gè)總體的均值),(2)檢驗(yàn)統(tǒng)計(jì)量,(3) H0拒絕域?yàn)?第一步:提出假設(shè) 檢驗(yàn)1: 檢驗(yàn)2: 檢驗(yàn)3: 檢驗(yàn)4: 檢驗(yàn)5: 檢驗(yàn)6:,對(duì)上例,第三步:計(jì)算LSD,(二) mi mj 的置信區(qū)間,由于,故,由獨(dú)立性,有,由獨(dú)立性,有,故有,故有mi mj 的置信區(qū)間為,例:m1 m4 的置信區(qū)間為,即 58.42365m1 m4 164.9098,五、單因素方差分析的等價(jià)模型,1、模型:設(shè)有r個(gè)母體Xi i =1,2, n ,母體,H0: 1 2 r,H1: 1 ,2 ,r不全相等,2、等價(jià)模型:設(shè),則有,等價(jià)模型:,!H1可以不寫,4.2

13、雙因素方差分析,雙因素方差分析及其類型 無(wú)交互作用的雙因素方差分析 有交互作用的雙因素方差分析,一、雙因素方差分析(two-way analysis of variance),1、雙因素方差分析:分析兩個(gè)因素(行因素 Row和列因素Column)變動(dòng)對(duì)試驗(yàn)結(jié)果的影響,例1:農(nóng)產(chǎn)品品種(因素1)和肥料(因素2) 對(duì)農(nóng)產(chǎn)品產(chǎn)量(試驗(yàn)結(jié)果)的影響。,例2:銷售地區(qū)(因素1)和品牌(因素2)對(duì) 電視機(jī)銷售量(試驗(yàn)結(jié)果)的影響。,2、雙因素方差分析的類型 (1)如果兩個(gè)因素對(duì)試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷行因素和列因素對(duì)試驗(yàn)數(shù)據(jù)的影響,這時(shí)的雙因素方差分析稱為無(wú)交互作用的雙因素方差分析或無(wú)重復(fù)雙因

14、素方差分析(Two-factor without replication) (2)如果除了行因素和列因素對(duì)試驗(yàn)數(shù)據(jù)的單獨(dú)影響外,兩個(gè)因素的搭配還會(huì)對(duì)結(jié)果產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析 (Two-factor with replication ),交互作用 例:兩因素N(氮肥)和P(磷肥),每個(gè)因素 有2個(gè)水平,對(duì)小麥畝產(chǎn)量的影響如下表,560400305080,二、無(wú)交互作用的雙因素方差分析(無(wú)重復(fù)雙因素分析),(一)試驗(yàn)方法和數(shù)據(jù)結(jié)構(gòu),因素 A 有r 個(gè)水平,A1、A2、 A3、 Ar ;,因素 B 有s 個(gè)水平,B1、B2、 B3

15、、 Bs .,1、試驗(yàn)方法:A 因素的第 i個(gè)水平Ai , B 因素的第 j 個(gè)水平Bj 的搭配下試驗(yàn)一次,得母體Xij,觀察得數(shù)據(jù),2、數(shù)據(jù)結(jié)構(gòu):,(二)模型:設(shè),對(duì)行因素提出的假設(shè)為,H0:行因素的變動(dòng)對(duì)結(jié)果的影響無(wú)顯著差異,對(duì)行因素提出的假設(shè)為,H1:行因素的變動(dòng)對(duì)結(jié)果的影響有顯著差異,H0:列因素的變動(dòng)對(duì)結(jié)果的影響無(wú)顯著差異,對(duì)列因素提出的假設(shè)為,H1:列因素的變動(dòng)對(duì)結(jié)果的影響有顯著差異,1、平方和 (1)總平方和(總離差),第 i 行的平均數(shù),全部子樣的平均數(shù),(三) 方差分析,第 j 列的平均數(shù),(2)組內(nèi)差(誤差項(xiàng)離差平方和)(隨機(jī)誤差),(3)組間差(水平項(xiàng)離差平方和) (系統(tǒng)

16、誤差),(4)各平方和的關(guān)系,QT QA QB QE的意義:總離差由三部份構(gòu)成 ,其一是各水平(母體)的子樣值內(nèi)部的差異( 2 ) 引起,其二是由于A因素的各水平之間的差異引起的, 第三部份是由于B因素的各水平之間的差異引起的。,QT QA QB QE,(5)各平方和的自由度和分布,2 、 H0的檢驗(yàn)統(tǒng)計(jì)量及拒絕域,行檢驗(yàn):, 列檢驗(yàn):,3、方差分析表,【例】在某種橡膠的配方中,考慮了三種不同的促進(jìn)劑,四種不同份量的氧化鋅。各配方試驗(yàn)一次,測(cè)得300%定強(qiáng)如下(=0.05),問(wèn)不同的促進(jìn)劑、不同份量的氧化鋅分別對(duì)定強(qiáng)的影響有無(wú)顯著差異?,解:,1、假設(shè),對(duì)行因素提出的假設(shè)為 H0: 行因素的各

17、個(gè)水平的均值相等 (不同促進(jìn)劑對(duì)定強(qiáng)的影響是無(wú)顯著差異) H1: 行因素的各個(gè)水平的均值不全相等 (不同促進(jìn)劑對(duì)定強(qiáng)的影響是顯著差異) 對(duì)列因素提出的假設(shè)為 H0: 列因素的各個(gè)水平的均值相等 (不同份量氧化鋅對(duì)定強(qiáng)的影響是無(wú)顯著差異的) H1: 列因素的各個(gè)水平的均值不全相等 (不同份量氧化鋅對(duì)定強(qiáng)的影響是顯著差異的),FA36.3F(2,6)5.14,拒絕原假設(shè)H0,說(shuō)明不同促進(jìn)劑對(duì)定強(qiáng)的影響是有顯著差異 FB56.3F(3,6)4.76,拒絕原假設(shè)H0,不同份量氧化鋅對(duì)定強(qiáng)的影響是顯著差異的。,2、計(jì)算得方差分析表,三、有交互作用的雙因素方差分析(重復(fù)試驗(yàn)雙因素分析),(一)試驗(yàn)方法和數(shù)

18、據(jù)結(jié)構(gòu),因素 A 有r 個(gè)水平,A1、A2、 A3、 Ar ;,因素 B 有s 個(gè)水平,B1、B2、 B3、 Bs .,1、試驗(yàn)方法:A 因素的第 i個(gè)水平Ai , B 因素的第 j 個(gè)水平Bj 的搭配下試驗(yàn)c( c 1)次,得母體Xij,子樣值Xij1, Xij2, Xijc。,2、數(shù)據(jù)結(jié)構(gòu):,(二)假設(shè),對(duì)行因素提出的假設(shè)為 H0: 行因素的各個(gè)水平的均值相等 H1: 行因素的各個(gè)水平的均值不全相等 對(duì)列因素提出的假設(shè)為 H0: 列因素的各個(gè)水平的均值相等 H1: 列因素的各個(gè)水平的均值不全相等 對(duì)行因素和列因素的搭配提出的假設(shè)為 H0: 行和列因素的各個(gè)水平搭配對(duì)結(jié)果的影響無(wú)差異 H1:行和列因素的各個(gè)水平搭配對(duì)結(jié)果的影響有差異,(三)方差分析表,(四)拒絕域,1、行檢驗(yàn)拒絕域,2、列檢驗(yàn)拒絕域,3、交互作用檢驗(yàn)的拒絕域,即比較F和F-crit,【例】城市道路交通管理部門為研究不同的路段和不同的時(shí)間段對(duì)行車時(shí)間的影響,讓一名交通警察分別在兩個(gè)路段和高峰期與非高峰期親自駕車進(jìn)行試驗(yàn),通過(guò)試驗(yàn)取得共獲得20個(gè)行車時(shí)間(分鐘)的數(shù)據(jù),如下表。試分析路段、時(shí)段以及路段和時(shí)段的交互作用對(duì)行車時(shí)間的影響,對(duì)行因素提出的假設(shè)為 H0:不同的時(shí)間段對(duì)行車時(shí)間的影響無(wú)差異 H1:不

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論