第十章方差分析與正交試驗設計_第1頁
第十章方差分析與正交試驗設計_第2頁
第十章方差分析與正交試驗設計_第3頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第十章方差分析與正交試驗設計方差分析與試驗設計是英國統(tǒng)計學家和遺傳學家費希爾進行農(nóng)業(yè)試驗發(fā)展起來的通過試驗獲取數(shù)據(jù)并進行分析的統(tǒng)計方法。方差分析討論的是生產(chǎn)和科學試驗中有哪些因素對試驗結果有顯著作用,哪些因素沒有顯著作用。討論的是一個因素對試驗結果是否有影響稱為一元方差分析,討論的是多個因素對試驗結果是否有影響稱為多元方差分析.對于因素多于兩個的方差分析,公式變得相當復雜,試驗次數(shù)較多,我們介紹一個試驗次數(shù)少的試驗設計方案,正交試驗設計。10.1一元方差分析人們常常通過試驗來考察了解各種因素對產(chǎn)品或成品的性能,成本、產(chǎn)量等的影響,我們把性能、成本、產(chǎn)量等統(tǒng)稱為試驗指標。有些指標可以直接用數(shù)量表

2、示,稱為定量指標;不能直接用數(shù)量表示的,稱為定性指標,可按評定結果打出分數(shù)或評出等級,這時就能用數(shù)量表示了。在試驗中,影響試驗指標的原因稱為因素。因素在試驗中所處的各種狀態(tài)稱為因素的水平,某個因素在試驗中需要考察它的幾種狀態(tài),就稱它為幾水平的因素。在生產(chǎn)實踐和科學試驗中,人們經(jīng)常要研究這樣的問題:如果改變生產(chǎn)條件是否會對產(chǎn)品(指標)產(chǎn)生顯著影響?如果改變試驗條件是否會對試驗結果(指標)產(chǎn)生顯著影響?方差分析的作用就在于通過對試驗數(shù)據(jù)的統(tǒng)計分析,從而推斷試驗數(shù)據(jù)間的差異是由于生產(chǎn)條件的改變還是由于隨機誤差的影響,并分析出最佳的試驗條件。為此弄清楚方差分析處理問題的基本思想,下面舉例說明。例某燈泡

3、廠用四種不同配料方案制成的燈絲生產(chǎn)四批燈泡,在每批燈泡中取若干個做壽命試驗,它們的壽命分別記為Xj,其中下標i表示第i批燈泡,第二個下標j表示第j次試驗。具體數(shù)據(jù)如下表四批燈泡的壽命試驗表品種壽命(小時)A1600,1610,1650,1680,1700,1720,1800A1580,1640,1640,1700,1750A1460,1550,1600,1620,1660,1740,1820,1640A1510,1520,1530,1570,1600,1680現(xiàn)在要研究的問題是燈絲的不同配料方案,即不同的品種對燈泡壽命有無顯著影響。在這里燈泡的壽命就是指標,燈泡品種就是因子,四種不同品種的燈泡

4、就是四個水平,因此這是一個單因子四水平試驗。我們將每一種配料制成的燈泡,其壽命看成同一總體,而不同品種的燈泡就是不同總體,因而出現(xiàn)四個不同總體。每一種的燈泡壽命都有一個理論上的平均值,即分布的數(shù)學期望,不同品種的燈泡的壽命的數(shù)學期望可能有顯著差異,也可能沒有顯著差異,試驗的目的就是通過假設檢驗對這個問題給出一個推斷。一般可假定母體的方差相同。由于其他試驗條件相同,如果燈泡品種對燈泡壽命無顯著性影響,我們可認為四個總體的概率分布相同,換句話說,燈泡品種對燈泡壽命是否有顯著性影響,就是要檢驗四個總體的均值是否相等.按參數(shù)估計的假設檢驗方法可以逐個地進行檢驗,但這個方法顯得繁而復雜.特別當水平數(shù)較多

5、時,需要做許多假設和檢驗,計算量也相當大.如果能導出一個可以用來檢驗所有這些假設的統(tǒng)計量,那么解決這樣的冋題就方便多了。方差分析就是解決這樣的冋題.假設試驗只考慮一個因素A,它有I個水平Ai,A,,A,總共有N次試驗,Xj表示第i水平第j次試驗,其數(shù)據(jù)如下表表一元方差試驗數(shù)據(jù)表水平試驗結果A1A2AiX11,X12,X1X21,X22,X2n2X|1,X|2,Xln|我們再作如下假設:Xi,X2,X|為I個子總體,且Xi,X2,X|相互獨立,XN(,;2),而冷兀2,,乂刖為Xi的樣本。顯然I個水平對試驗結果有無顯者性影響,就是看Xi,X2,X|是否為相同的總體,或它們的分布是否相同。由于它們

6、都是正態(tài)總體,就只要看它們分布的參數(shù)是否相同,已知方差相同,這就只須判斷數(shù)學期望是否相等。換句話說,只要在一定的顯著性水平上檢驗統(tǒng)計假設H。:1niXiXij,nij壬niXpU分別表示第i個子總體的樣本均值(組平均值)和總體樣本均值(總平均值)??偲钇椒胶虸niSST八x(Xj-X)2j電它描述全部數(shù)據(jù)離散程度(總波動)的大小。容易證明SST=SSA+SSE(10.1.1)I_Ini其中SSA八ni(X?-X)2,SSE;二(Xj-X)2ITijdSSA反映的是各子總體樣本均值(組平均值)的不同而引起的誤差,是各組平均值與總體樣本平均值的離差平方和,它表示因試驗水平差異帶來的誤差大小,稱為

7、組間偏差平方和,也稱為系統(tǒng)誤差。SSE反映的是每一個子總體的(組內(nèi))數(shù)據(jù)不同而引起的誤差,是每個觀測值與其組內(nèi)平均值的離差平方和,它表示試驗誤差的大小,稱為組內(nèi)偏差平方和,也稱為誤差平方和。因此,通過SSA的大小可以反映原假設Ho是否成立。若SSA顯著地大于SSE,說明各子總體(水平)Xi之間差異顯著,那么H??赡懿怀闪ⅰ_@種比較方差大小來判斷原假設H。是否成立的方法就是方差分析的由來。那么吏A的值大到什么程度可以否定H。呢?在SSE理論上已經(jīng)證明SSA/(I_1)SSE/(N-I)SSA/(I_1)SSE/(N-I)F(I-1,N-I)(10.1.2)統(tǒng)計量F可以作為判斷H。是否成立的檢驗統(tǒng)

8、計量。在給定顯著水平:的情況下,當F.F:.(l1,N-I)時,貝U拒絕H。,認為因素A對試驗的指標是顯著的,否則接受Ho。在實際進行一元方差分析時,通常將有關的統(tǒng)計量連同分析結果列在一張標上,即如下的方差分析表表一元方差分析表在例中給定-0.05,問燈絲的配料方案對燈泡壽命有無影響。方差來源平方和自由度樣本方差F值組間(因素A)SSAI-1SSA/(I_1)SSA/(I-1)組內(nèi)(誤差)SSEN-1SSE/(N-I)SSE/(N-1)總和SSTN-1解按題意丨=4,山=7,門2=5,門3=8,帀=6,N=26,經(jīng)計算可得下列方差分析表表例的方差分析表方差來源平方和自由度樣本方差F值組間(因素

9、A)44374.6314791.52.17組內(nèi)(誤差)1449970.8226816.8總和194345.425對給定的。=0.05,查表得F°.05(3,22)=3.05,因為F=2.15£F°.05(3,22),所以接受H。,即這四種燈絲的配料方案生產(chǎn)的燈泡壽命之間無顯著差異,換句話說,配料方案對燈泡壽命沒有顯著影響。10.2二元方差分析.無重復試驗的方差分析如果兩個因子無交互作用,只需在各種組合水平下各作一次試驗就可進行方差分析,稱為無重復試驗的方差分析。在上一小節(jié)中,我們假定對兩個因子的每個水平組合都重復1次,則將既沒有誤差平方和,也沒有自由度來刻畫隨機誤

10、差。此時,因子效應的大小將失去比較的依據(jù),從而也無法進行F檢驗因此,對雙因子無重復試驗數(shù)據(jù),只有采用簡化的模型,才能進行方差分析.由于是無重復試驗,可將數(shù)據(jù)重新記為Xij(i=1,,|,j=1,J),它表示A的第i水平和B的第j水平的指標值。假設諸Xj之間相互獨立,且XjN(j,;2),則Xjj-心為,其中呵之間相互獨立,且;jjN(0,;")。類似上一小節(jié)的討論,得到數(shù)學模型:Xj"+8+冋+引引N(0,<i2),且各引相互獨立(10.2.1)IJ送=0,£Pj=0在上述表達式中,了表示總均值,:i表示A因子的第i水平對指標的單獨效果,稱為A因子的主效應,

11、'表示B因子的第j水平對指標的單獨效果,稱為B因子的主效應。A因子的主效應水平是否顯著,對此可以檢驗假設:Hr:為-:2=:丨=°(10.2.2)B因子的主效應是否顯著,則可以檢驗假設:H2:二。(10.2.3)總體樣本均值、A的第i水平樣本均值和B的第j水平的樣本均值分別為11X=-XXjijIiA(10.2.4)11JXP:-Xj,可以證明SST二SSA+SSE+SSE其中IJ_總偏差平方和2SST八'(Xj-X)i=1j4A因子偏差(主效應)平方和:I_SSA二廣(Xj.-X)2,iAJ一B因子偏差(主效應)平方和:SSB=|v(X.j-X)2u隨機誤差平方和:

12、IJSSE=v'(Xj-X.j-Xi.X)2ij=1總偏差平方和SST的自由度(獨立平方項的個數(shù))為N=J一1,A因子偏差(主效應)平方和SSA的自由度為1-1,B因子偏差(主效應)平方和SSB自由度為J-1,誤差平方和SSE的自由度為(I一1)(J-1)。還可以證明在Hi成立的條件下噴_1)(j_1)噴_1)(j_1)F(I-1,(I-1)(J-1)(10.2.5)統(tǒng)計量Fa可以作為判斷H1是否成立的檢驗統(tǒng)計量。在給定顯著水平:的情況下,當F.R.(I-1,(I-1)(J-1)時,貝U拒絕H1,認為因子A對試驗的指標的影響是顯著的,否則接受H1。同理在H2成立的條件下SSBSSE(I

13、-1)(J-1)(J_1)F(J-1,(I-1)(J-1)(10.2.6)統(tǒng)計量FB可以作為判斷H2是否成立的檢驗統(tǒng)計量。在給定顯著水平-:的情況下,當FbF.(J-1,(I-1)(I-1)時,貝冊絕H2,認為因子B對試驗的指標的影響是顯著的,否則接受H2。在實際進行方差分析時,通常將有關的統(tǒng)計量連同分析結果列在一張標上,即如下的方差分析表表無重復試驗的二元方差分析表例.將土質基本相同的一塊耕地分成均等的五個地塊,每塊分成均等的四個小區(qū),四個品種的小麥,在每一地塊內(nèi)隨機分種在四個小區(qū)上,每一小區(qū)小麥的播種量相同,測得收獲量資料如下表(單位:斤/塊)方差來源平方和自由度均方F值主效應ASSAI-

14、1MSSAMSSA=SSA/(I-1)FA-主效應BSSBJ1MSSE隨機誤差SSEMSSB(1T)(JT)MSSB=SSB/(J-1)B-MSSEMSSE=SSE/(l-1)(J-1)總和SSTN-1表收獲量資料表地快B地塊B地塊R地塊B地塊B5品種A32.334.034.736.035.5品種A33.233.636.834.336.1品種A30.334.432.335.832.8品種A29.526.228.128.529.4現(xiàn)在考察地塊和品種對小麥收獲量有無顯著影響,取,-0.05。解設有兩個因子A、B分別表示品種和地塊。顯然因子A有四水平A、A、AA,因子B有五水平Bi、B、Ba、B、R

15、。因此原問題轉化為如下的數(shù)學問題:H1:4=0H2:I'H-:2=:3=:4=:5=0直接計算可以得到下列方差分析表表例的方差分析表方差來源平方和自由度均方F值主效應A134.65444.8820.49主效應B14.1033.531.6隨機誤差26.28122.19總和175.0319對品種A,有Fa=20.49Fo.o5(3,12)=5.95,說明不同品種對小麥的收獲量有顯著的影響。對地塊B,有Fb=1.6:F°.05(4,12)=3.26說明不同地塊對小麥的收獲量沒有顯著的影響。重復試驗的方差分析在許多實際問題中,往往不只出現(xiàn)單個因素的各個水平狀態(tài)對實驗指標的影響,而可能

16、同時需考慮兩個因子對實驗指標的影響。這時的方差分析,不僅需要判斷各因子對指標的影響是否顯著,還要考慮因子各水平之間的相互組合對指標的交互作用。如果兩個因子有交互作用,則要考慮每一種組合水平下各作多次試驗才能進行方差分析。例如假定要比較一種新型復合肥料與傳統(tǒng)肥料對小麥增產(chǎn)的效果又假定所使用的試驗地塊的地質條件也不同(酸性、堿性或中性等)自然我們會考慮到:除了肥料的不同可能使小麥的單產(chǎn)產(chǎn)生差異之外,地的酸堿性不同也可能使小麥的單元產(chǎn)產(chǎn)生差異。在這種情況下,如果把一種肥料撒到一塊地上,而把另一種肥料撒到另一塊地上,那么即使這兩塊地上的小麥單產(chǎn)有顯著的差異,也無法判斷這種差異是由肥料的不同造成的,還是

17、由地的酸堿性的不同造成的。對此,可以采取如下的作法:假定有三個試驗地塊,分別為酸性、堿性和中性。我們將每塊地劃分為2K塊小區(qū),將它們隨機地分成兩組,每組K塊小區(qū),其中一組小區(qū)施用傳統(tǒng)肥料,另外一組施用新型復合肥料。這樣作的結果是:每種肥料和地塊的組合(共有6種組合)都進行了K次試驗.這樣,數(shù)據(jù)的分組可以按肥料分組和按地塊分組兩種方式,等價地說,決定數(shù)據(jù)分組的因子有兩個,即肥料(因子A)和地塊(因子B)。因子A有兩個水下,因子B有三個水平。在上述的試驗方法下,兩個因子的任一水平組合都做了相同次數(shù)的試驗(K次).這是一個完全平衡的雙因子試驗。一般,我們假定在一個試驗中要考慮兩個因子A與B,分別有I

18、水平與J水平,記A因子的I水平為A,A2,A|,B因子的J水平為B1,B2,Bj。一個完全平衡的試驗,就是要對兩個因子的每個不同的水平組合ABj都做相K次試驗,其中K>l。在水平組合AiBj下所得到的響應變量觀測值Xjki=1,I,j=1,J,k=1,K它表示A的第i水平B的第j水平上的第k次實驗的指標值。假設諸Xjk之間相互獨立,且XjkN(7j,;2),則Xjk詠,其中:jk之間相互獨立,且;ijkN(0,;2)。在上面的模型中,兩個因子不同水平的組合對響應變量的影響的差異表現(xiàn)在分布的均值的差異表現(xiàn)在分布的均值7的差異上。為了更清楚地看清7的含義,我們做如下一些變換1J1IPT-_y

19、kip_yi.ij,.jijJja"j,i廠叮"j,i廠叮于是得到數(shù)學模型:Xjk=+務+Pj+Yj+®ijk*EijkN(0®2),且各Ejk相互獨立(10.2.7)IJIJ送W=0,Pj=0花;冷=0乏;冷=0二j=1i¥j=1在上述表達式中,了表示總均值,:i表示A因子的第i水平對指標的單獨效果,稱為A因子的主效應,打表示B因子的第j水于對指標的單獨效果,稱為B因子的主效應,j表示A因子的第i水平和B因子的第j水平在主效應之外,對指標所產(chǎn)生的額外的聯(lián)合效果,稱為交互效應。在雙因子試驗的模型中,我們所關心的是:(1) 因子的主效應是否顯著。

20、假如我們關心A因子的主效應水平是否顯著,對此可以檢驗假設:H1:一叫-:2一-:I=°(10.2.8)或者,假如我們所關心的是B因子的主效應是否顯著,則可以檢驗假設:H2:I=二1=0(10.2.9)(2) 檢驗交互效應的效果是否顯著。這時我們檢驗假設:H3:11二12=二IJ=0(10.2.10)雙因子檢驗數(shù)據(jù)的方差分析主要解決上述三個假設的檢驗問題。上述假設的檢驗方法,與在單因子試驗數(shù)據(jù)的方差分析中所采用的方法類似,就是將數(shù)據(jù)的總平方和分成若干項平方和,其中有的刻畫因子的主效應,有的刻畫因子的交互效應,有的刻畫隨機誤差的效應,然后構造適當?shù)腇統(tǒng)計量進行檢驗。令Xij.十XjkKk

21、j1X.j.Xij.i4JKX擊Xjk,IJKi4j-1k4XT.=丄'X7,Jj=i分別表示總體樣本均值(總平均值),A的第i水平與B的第j水平的樣本均值,A的第i水平的樣本均值(A組平均值)和B的第j水平的樣本均值(B組平均值)總偏差平方和IJK2SST八7、(Xjk-X)i呂j呂k土它描述全部數(shù)據(jù)離散程度(總波動)的大小。容易證明SST二SSA+SSB+SSAB+SSE(10.2.11)其中I_A因子偏差(主效應)平方和:SSA二J。(X7-X)2,=1J_B因子偏差(主效應)平方和:SSB=IK'(X?jX)2,jmIJ_交互效應偏差平方和:SSABK二二(Xj.-Xi

22、.-X.j.X)2,idj=1IjK隨機誤差平方和:SSE-777(Xijk-Xjj.)2i=1jdkd與單因子方差分析中平方和的解釋及自由度的計算類似,我們可以對上述的平方和給出解釋,并計算自由度??偲钇椒胶蚐ST刻畫樣本對于樣本總均值X的總離散程度,平方項共有N=IJK,滿足一個約束條件:IjK二二二(XjkX)7i±j=ikd因此,SST的自由度(獨立平方項的個數(shù))為N=IJK-1。A因子偏差(主效應)平方和SSA可以解釋為A因子主效應的總體效果,平方和項為I,滿足一個約I束條件:'(Xi.-X)=0,因此SSA的自由度為I-1。類似地,SSB可以解釋為idB因子主效

23、應的總體效果,自由度為J-1。SSAB代表交互效應的總效果,平方和項為IJ,它們之間滿足約束條件:I_J_(XT-兀-可.X)=o,j=1,j,、(XT.X?.Xj.X)=o,i,ii4j4這I7個約束條件中只有IJ-1個是獨立的,因此SSAB的自由度為(I-1)(J-1)。最后再來看誤差平方和SSE,它可以看成是隨機誤差的總度量,平方和項為IJK,滿足下列約束條件:K、(Xijk-XT.)=0,i=1,1,j=1,Jk4因此SSE的自由度為IJ(K-1)。因此,通過SSA的大小可以反映原假設H1是否成立。若SSA顯著地大于SSE,A因子水平之間差異顯著,那么H1可能不成立。這種比較方差大小來

24、判斷原假設H1是否成立的方法就是方差分析的由來。那么燮的值大到什么程度可以否SSE定H1呢?在理論上已經(jīng)證明在H1成立的條件下SSAfsse(I1)F(I-1,IJ(K-1)(10.2.12)/IJ(K-1)統(tǒng)計量Fa可以作為判斷H1是否成立的檢驗統(tǒng)計量。在給定顯著水平:的情況下,當FF:.(l-1,IJ(K-1)時,貝U拒絕H1認為因子A對試驗的指標的影響是顯著的,否則接受H1。同理在H2成立的條件下SSBFSSE(J1:)F(J_1,IJ(K-1)(10.2.13)FlJ(K-1)統(tǒng)計量Fb可以作為判斷H2是否成立的檢驗統(tǒng)計量。在給定顯著水平二的情況下,當FbF.(J-1,IJ(K-1)時

25、,則拒絕H2認為因子B對試驗的指標的影響是顯著的,否則接受H2。同理在H3成立的條件下SSABF(J_1,IJ(K_1)(10.2.14)(I-1)(J-1)SSEIJ(K-1)統(tǒng)計量Fab可以作為判斷H3是否成立的檢驗統(tǒng)計量。在給定顯著水平:的情況下,當FabF.(I-1)J-1,IJ(K-1)時,則拒絕H3,認為因子A與B對試驗的指標的交互作用的影響是顯著的,否則接受H3在實際進行方差分析時,通常將有關的統(tǒng)計量連同分析結果列在一張標上,即如下的方差分析表表有重復試驗的二元方差分析表方差來源平方和自由度均方F值主效SSAI-1MSSAMSSA=SSA/(I-1)Fa-應ASSBJ-1MSSE

26、主效(I-1)(J-1)MSSB=SSB/(J-1)lMSSBFb應BSSABMSSE交互MSSABIJ(K-1)MSSAB=SSAB/(I-1)(J-1)FAB效應SSEMSSEAB隨機MSSE=SSE/IJ(K-1)誤差總和SSTN-1例為了比較3種松樹在4個不同的地區(qū)的生長情況有無差別,在每個地區(qū)對每種松樹隨機地選取5株,測量它們的胸徑,得到了如下的數(shù)據(jù)表三種松樹的胸徑數(shù)據(jù)現(xiàn)在考察樹種和地區(qū)對樹的胸徑有無顯著影響,取-二0.05。地區(qū)1地區(qū)2地區(qū)3地區(qū)4樹種123,15,26,25,20,21,:21,17,16,14,17,19,13,2116,1824,2720,24樹種228,22

27、,25,30,26,26,19,24,19,17,21,18,19,2620,2825,2926,23樹種318,10,12,15,21,22,23,25,19,18,12,23,22,1314,1213,2222,19解這是一批等重復的兩因子數(shù)據(jù),記樹種因子為A,地區(qū)因子為B,則A因子有3水平,B因子有4水平,總共有12個水平組合,每個組合有5個重復觀測。假定樹的胸徑為度量樹的生長情況是否良好的數(shù)值指標,我們的目標是:由以上數(shù)據(jù)來判斷不同樹種及不同地區(qū)對松樹的生長情況是否有影響(好或壞)?這時要考慮的影響有三種:樹種的單獨影響(A因子主效應),地區(qū)的單獨影響(B因子主效應),以及不同樹種和不

28、同地區(qū)的結合所產(chǎn)生的交互影響(AB因子的交互效應)。方差分析的結果如下表表1026例322的方差分析表方差來源平方和自由度均方F值主效應A355.62177.89.68主效應B49.65316.550.90交互效應AB106.4617.730.97隨機誤差882.04818.38總和1393.759從上面的分析結果,我們來對因子的主效應和交互效應的顯著性進行檢驗?,F(xiàn)取顯著性水平:=0.05,查表得到F的臨界值:Fo5(2,48)=3.19,F(xiàn)o.o5(3,48)=2.8O,F°.°5(6,48)=2.29因為Fa=9.68:>Foo5(2,48)=3.19,F(xiàn)b=0.

29、90<Fo5(3,48)=2.80,F(xiàn)ab=0.97:F0.05(6,48)=2.29。所以,接受Hi,拒絕H2與H3。A因子主效應是顯著的,或者說松樹的不同種類對樹的胸徑有顯著影響。由于A因子主效應是顯著的,我們可以進一步考查A因子不同水平的均值注意到A因子的第二水平為最大:23.55,而第三水平的均值為最?。?7.65,可以認為樹種2的生長情況優(yōu)于樹種3。能夠得出這個結論,得益于觀測的等重復性。B因子主效應不顯著,或者說不同地區(qū)對樹的胸徑?jīng)]有顯著影響.AB因子的交互效應不顯著,或者說不同地區(qū)對不同的樹種的生長沒有特別的影響。10.3正交試驗設計方差分析法的推廣和正交試驗法的提出上二節(jié)

30、所研究的單因子、雙因子試驗的方差分析模型中所包含的統(tǒng)計思想和方法可以推廣到多因子試驗的場合。以3因子模型為例,設有3因子對響應變量(指標)有影響,分別記為A、B、C,它們的水平數(shù)分別為I、J、K。它們對響應變量的影響可以分成如下三種:(1)各因子的主效應,即單個因子的不同水平對響應變量產(chǎn)生的影響。(2)一階交互效應,即在扣除主效應的影響之后,任意兩個因子的不同水平組合(AB、ACBC)對響應變量產(chǎn)生的聯(lián)合影響。(3)二階交互效應,即在扣除主效應和一階交互效應的影響之后,三個因子的不同水平組合(ABC)對響應變量產(chǎn)生的聯(lián)合影響。與雙因子的情況類似,如果在3個因子的每個水平組合上作相同次數(shù)試驗K,

31、則當試驗次數(shù)K大于1(有重復)時,可以用全模型(包含全部上述3種效應的模型)進行方差分析,而當試驗次數(shù)等于1(無重復)時,無法對二階交互效應分析,而只能分析主效應和一階交互效應。讀者可以仿照上二節(jié)的作法,對這兩種情況下3個因子方差分析的全部過程列出結果(模型、平方和分解、自由度、F統(tǒng)計量,等等)以上的這些作法可以推廣到4因子、5因子、乃至m因子的情況.無論有多少個因子,如果在所有因子的每個水平組合上都做至少一次試驗,則試驗是完全的。為便于進行方差分析,試驗應該是等重復的。為能夠分析最高階(m-1)階交互效應,試驗應該是有重復的(重復數(shù)大于1)。雖然我們在理論上可以將單因子、雙因子方差分析的模型

32、和方法推廣到多因子方差分析的情況,但在實踐中,做多個因子的完全試驗會有實際的困難,因為完全試驗所要求的試驗次數(shù)太多乃至無法實現(xiàn)。例如,假定要考慮5個三水平因子,則完全試驗(重復數(shù)為1)要求做243次試驗;假如再加一個四水平因子,則完全試驗(同樣重復數(shù)為1)要作972次試驗如果要能夠分析全部交互效應,同時還能夠做平方和分解,則試驗次數(shù)還需加倍!顯然,如此多的試驗次數(shù)在實際應用中幾乎是無法實施的。如何解決這個困難呢?在對一個因子試驗所建立的線性模型中,獨立參數(shù)(總均值、主效應、交互效應等)的個數(shù)k與試驗次數(shù)n之間有下面的關系:當n>k時,有足夠的自由度來估計參數(shù),同時還有剩余自由度來估計誤差

33、的方差;當n=k時,有足夠的自由度來估計參數(shù),但是沒有剩余自由度來估計誤差的方差,當n<k時,沒有足夠的自由度來估計參數(shù),同時也沒有自由度來估計誤差的方差。在因子試驗中,除非可以事先確定數(shù)據(jù)中的隨機誤差很小,以至可以簡單地忽略,否則誤差的估計是必要的,它是進行假設檢驗的前提。因此,如果不能簡單忽略隨機誤差,就應該給誤差的估計留下適當?shù)淖杂啥取8鶕?jù)上述的思路,只要試驗總次數(shù)大于獨立參數(shù)的個數(shù)就可以有足夠的自由度來估計參數(shù),同時還有剩余自由度來估計誤差的方差,才能進行假設檢驗。在一個線性模型中,參數(shù)(主效應及各種交互效應)的數(shù)目是由實際問題本身決定的,而不是由主觀決定的。在大量的因子試驗實踐

34、中,人們發(fā)現(xiàn):在很多情況下,因子之間的高階交互效應是不存在的,至多存在某些一階交互效應(即兩因子的交互效應),或者只有主效應在這種情況下,多因子試驗的模型中包含的參數(shù)實際上并不多,可能遠遠少于全模型的參數(shù)比如有6個二水平因子,如果考慮所有可能的交互作用就有64個獨立參數(shù),但是如果只考慮主效應則只有7個獨立參數(shù)因此對6個二水平因子的無交互效應模型,理論上只需做8次試驗就可以有多余的自由度來估計誤差方差我們知道在生產(chǎn)經(jīng)營管理活動中,經(jīng)常要做許多試驗。如果試驗設計得好,就能用較少的試驗次數(shù)取得較滿意的結果,反之,如果試驗設計得不好,雖經(jīng)多次試驗,也不定能取得滿意的結果。因此,如何合理地設計試驗,是很

35、值得研究的一個問題。在模型中只有主效應的前提下,統(tǒng)計學家發(fā)明了一類試驗設計的方法,統(tǒng)稱為“正交因子設計”,或簡單地稱為“正交設計”。它的主要內(nèi)容是討論如何合理地安排試驗以及試驗后的數(shù)據(jù)怎樣作統(tǒng)計分析等。在這種試驗設計中,可以安排許多因子,而試驗次數(shù)遠遠小于完全試驗所需的試驗次數(shù)。應用正交試驗進行試驗設計,就是在試驗前借助于一種現(xiàn)成的規(guī)格化的表正交表,科學地挑選試驗條件,合理地分析試驗結果。從而可以只用較少的試驗次數(shù),分清各因素對試驗結果(指標)的影響,按其影響大小,找出主次關系并確定最佳搭配方案或最優(yōu)工藝條件。正交表及直觀分析法正交表正交表是統(tǒng)計學家和數(shù)學家構造的、供實際工作者安排正交試驗用的

36、表,是正交試驗法中安排試驗,并對數(shù)據(jù)進行直觀分析和方差分析的重要工具。正交表實際上就是一個在給定試驗次數(shù)和因子水平數(shù)之后,可以容納最多因子個數(shù)的正交試驗表.正交表可以分為兩大類:單一水平正交表和混合水平正交表。在單一水平正交表中,所有因子有相同水平,而在混合水平正交表中,因子有不同水平。單一水平正交表表示為Ln(tk),其中L表示正交表,下標n是正交表的行數(shù),為試驗次數(shù),k是正交表的列數(shù),表示試驗至多可以安排因素的個數(shù),t是表中不同數(shù)字的個數(shù),為因子水平數(shù)。例如L8(27)表示在8次試驗中最多可安排7個兩水平因子,其表如下:表正交表L8(27)效應,就可以選用一個能夠容納指定因子的而且試驗次數(shù)

37、最少的正交表來安排試驗。由于是無交互效應模型,因此因子具體安排在表的哪一列是沒有限制的。例如,假定有4個兩水平因子,由于試驗次數(shù)最少的兩水平表為L4(23),最多只能安排3個兩水平因子,因此需選用L8(2),4個因子可以安排在7列中的任意4列。為便于讀者使用,本書將常用正交表列于附錄。按照正交表安排好試驗后,就可以作試驗,得到試驗數(shù)據(jù)后就可以進行直觀分析和方差分析。在因子試驗中,二水平的因子是遇到最多的,因此Ln(2k)正交表也是用得最多的。對二水平的因子,在正交表中通常用1和2分別表示兩個水平。如果將表中所有元素2都改成-1,就得到一個所有元素都是I和-I的n行k列的矩陣X。表中的每一列1和

38、2的個數(shù)是相同的,任意兩列中組合(1,1),(1,2),(2,1),(2,2)出現(xiàn)的次數(shù)相同,因此矩陣X的每一列1和-1的個數(shù)是相同,任意兩列中,組合(1,1),(1,-1),(-1,1),(-I,-1)出現(xiàn)次數(shù)相同,由此可見X的列在“向量內(nèi)積”的意義下是兩兩正交的。正交表具有下列特點:任意一列中數(shù)字重復的次數(shù)相同,對于任意兩列數(shù)字間的搭配是均衡的。正交試驗法的直觀分析一般步驟下面通過實例說明下正交表的應用和直觀分析的一般步驟例為了提高某化工產(chǎn)品的轉化率,選擇了三個有關因素,反應溫度A,反應時間B和用堿量C,各因素所選取的水平為表三因素的水平選擇表因ABC(反映溫度°C)(反映時間分

39、)(用堿量)18090528512063901507如何對試驗進行安排呢?我們看到:如果進行全面試驗,則需要做27次試驗,如果用正交表來安排這項試驗,只須做9次試驗就夠了。具體步驟如下:(1)例中要考察的因素和水平都已確定。對于一般問題是這樣考慮:根據(jù)試驗的目的,確定試驗要考察的因素,如果對事物的變化規(guī)律了解不多,因素可以多取一些,如果對其規(guī)律已有相當了解,可以準確判斷主要因素,這時因素可取少一些。每個因素的水平數(shù)可以相等,也可以不等。重要的因素或者特別希望詳細了解的因素,水平可多取一些,其余情況水平可取少一些。(2)選擇適合試驗的正交表。此例是三因素三水平試驗,選用L9(34)比較合適。究競

40、選用那種正交表,要根據(jù)因素和水平的多少以及試驗費用的情況而定,一般地講,要求試驗精度高的可選試驗次數(shù)多的正交表,試驗費用較貴的,可選試驗次數(shù)少的正交表。(3)因素A、B、C放在正交表的列上。如果有些因素的不同水平改變起來比較困難,應當優(yōu)先考慮這些因素,把它們放在適當?shù)牧猩?,在這種列上不同水平的改變次數(shù)較少,固定一個水平后,要連續(xù)做幾次試驗才改變?yōu)榱硪凰?。?)根據(jù)表可知,9次試驗的方案是:第一號試驗的工藝條件是80C,90分,5%;第二號試驗的工藝條件是80°C,120分,6%;第九號試驗的工藝條件是90°C,150分,6%。(5)按試驗方案表中載明的各次試驗條件進行試驗

41、。例中,轉化率是試驗指標,按設計的方案進行試驗,取得數(shù)據(jù).將所得測得轉化率的數(shù)據(jù)填入試驗結果分析表的最右邊一欄。表直觀分析計算數(shù)據(jù)列試號驗號1(A)23(B)(C)轉化率Pr1(80)1(90)1(5)31212(120)2(6)54313(150)3(7)3842(85)125352234962314273(90)1357832162933264kli123141135k2i144165171k3i183144144k1i414745k2i485557k3i614848Rr20812優(yōu)水平AB2C2k其中kj表示第j列中對應水平i的試驗指標數(shù)據(jù)之和,kj3試驗結果的直觀分析(1)從正交試驗結

42、果分析表中挑出較好的方案:第九次試驗的結果最好,其具體條件是A3B3C2,這是正交試驗中較好的方案。(2) 計算各因子在相應于同一水平下的試驗指標之和及平均試驗指標,計算各列的極差。(3) 確定因素重要性順序依照各因素極差大小,排出重要性順序,極差大的因素表示此因素重要。因素的重要性順序是AB、Co(4) 確定最佳搭配方案或最優(yōu)工藝條件,在不考慮交互作用時,只需根據(jù)該試驗指標的要求(即該指標或是以最高者為優(yōu)或是以最低者為優(yōu))將各因素的最優(yōu)水平組合起來,再將最優(yōu)水平組合與試驗中的較好方案進行對比試驗,從而得到最佳搭配方案或最優(yōu)工藝條件。例中我們?nèi)∶總€因素平均轉化率最高的為優(yōu)水平,因此,最優(yōu)水平組

43、合AsB2C2,即最優(yōu)工藝條件為反映溫度90°C,反映時間120分,用堿量6%。而A3B2C2不在所做的九次試驗中,因此,可將這個條件與正交試驗中較好的方案AB3C2比較,對A3B2C2再做試驗的試驗結果的轉化率為74%,從而得最優(yōu)的工藝條件A3B2C2。正交試驗法的方差分析法正交表的直觀分析其優(yōu)點是簡單直觀,計算量小,但它不能給出誤差的估計,因此就不知道分析的精度,即不知道要到怎樣的程度,一個因素才算是次要因素。至于怎樣進行方差分析與單因子和雙因子方差分析類似。下面舉例說明:例考慮例,我們建立如下數(shù)學模型。設yi為第i次試驗中產(chǎn)品的轉化率(),并記:i為溫度因子的第I水平對產(chǎn)品的轉

44、化率的影響,'-i為時間因子的第I水平對產(chǎn)品的轉化率的影響,|為用堿量因子的第I水平對產(chǎn)品的轉化率的影響,I=1,2,3。根據(jù)表我們?nèi)菀讓懗鲞@個模型如下:Y1=卩+%+叫+珀+角Y2=卩+%+P2+了2+Z2丫3=卩+巧+P3+了3+奄丫4=卩+。2+了2+名4丿丫,=卩中。2+02十丫3十耳(10.3.1)丫6=卩+°2+卩3+了1+%丫7=»中。3十優(yōu)十了3+名7丫8=卩+。3+S+雞+%丫9332;9其中“,;9為獨立、N(0,;2)分布的隨機誤差;為總均值,如同在全面試驗的方差分析模型中的作法一樣,我們假定模型中的參數(shù)滿足下面的約束條件:11>2>

45、;3=0一:123二。(10.3.2).12,09容易證明在約束條件(5.3.2)下,a;:二min的最小二乘估計是idf1*.1*.1*%=3(%+y2十丫3),2=3(y4十丫5十y6)-(yyy、V1*1*41*(10.3.3)戸i=3(yi+y4+y7),戸2=3(y2+y5+y8)J3-(yyy?)3331*八1*f1*1=3(y1'y6'y8),2=3(y2'y4y9),=3(y3'y5y7)333-19-其中y=-vyj,y;二yj-y。還可以證明這些估計是相應的參數(shù)的最小方差估9i4計。得到參數(shù)估計之后,為了檢驗因子效應的顯著性,與單因子和雙因子

46、方差分析類似進行方差分析:SST=SSA+SSB+SSC十SSE9_其中總平方和為SST=v(yy)2,它的自由度為&因子效應的平方和分別為iA3A(10.3.4)(10.3.4)(10.3.5)(10.3.6)SSA=3、(冷)SSB=3、()2iASSC=3、(i)2i呂其自由度分別為2。殘差平方和SSE的自由度為2。根據(jù)上述結果我們可以構造F統(tǒng)計量。在實際進行因子方差分析時,通常將有關的統(tǒng)計量連同分析結果列在一張標上,即如下的方差分析表表模型的方差分析表方差來源平方和自由度均方F值因子A1SSA2MSSA=SSA/2匚MSSA因子BSSB2MSSB=SSB/2卜A-MSSE因子C

47、SSC2MSSC=SSC/2匚一MSSB隨機誤差SSE2MSSE=SSE/2Fb一MSSEMSSCFc=MSSE總和SST8通過直接計算,可以得到參數(shù)的估計二=y=50AAA、冷-9,-;2-2、d-3=11AAA-5、2=7、32進而得到方差分析結果列于下表表例的方差分析表取顯著性水平a=0.05,查表得Fo.o5(2、2)=19.O,又方差來源平方和自由度均方F值因子A”6182309FA=34.33因子B114257因子C2342117FB=6.33隨機誤差1829Fc=13總和9848Fa19.0,Fb:19.0、Fc<19.0,故反映溫度對產(chǎn)品轉化率有顯著影響,用堿量和反映時間

48、對產(chǎn)品轉化率沒有影響。由參數(shù)估計知道得到最優(yōu)的工藝條件為A3B2C20比較例和例,我們知道當因子對試驗結果的影響比隨機誤差的影響明顯的大或明顯的小,可以直接判斷而不必進行方差分析??紤]交互作用的正交設計在一些實際問題中,有時不僅因素的水平變化對指標有影響,而且有些因素間各水平的聯(lián)合搭配對指標也產(chǎn)生影響,這種聯(lián)合搭配作用稱為交互作用。因此,一般應該考慮某些因子的一階交互作用。例如,在農(nóng)作物施肥試驗中,在單位面積上施氮肥(N)6斤,能使該農(nóng)作物增產(chǎn)30斤,施磷肥(P)4斤,能增產(chǎn)50斤。若同時施6斤氮肥和4斤磷肥,似乎應該增產(chǎn)30+50=80斤,但實際上增產(chǎn)了160斤,這說明氮肥和磷肥除了本身作用

49、外,還有一種聯(lián)合作用,這就是交互作用,記作NXPo在這里交互作用的大小為160-30-50=80斤。一般地,在多因素試驗中,一個因素A對指標的影響與另一個因素B取什么水平有關,這就是因素A和因素B有交互作用,記為AXB。使用正交表安排試驗時,有時需要分析各因素之間的交互作用。在常用正交表中,有的表后面附有一張“兩列間的交互作用”表,這是專門為分析交互作用而使用的表,現(xiàn)以L8(27)的兩列間的交互作用表為例,說明它的用法。表1036L8(27)的兩列間的交互作用表列號/列號12345671(1)3254762(2)167453(3)76544(4)1235(5)326(6)17(7)從此表上可以

50、查出正交表中任兩列的交互作用列。此表用法如下:如果A放在豎排“列號1”中,B放在“橫排2”中,查此表得到第一行與第二列交叉點元素是3,則正交表上第3列就是第1列與第2列的交互作用列。同理可得到第2列與第4列的交互作用列是第6列,其它任意兩列的交互作用列可用類似方法查得。因此,當我們用L8(27)來安排三因子AB和C有交互作用的正交試驗時,如果因子A放第一列,因子B放在第二列,則AXB放在第三列。在試驗時,我們把交互作用AXB單獨作為一個因子來考慮,AXB所在的列不能再安排其它因子。如C放在第4列,再查交互作用表,AXC和BXC應分別放在第5和第6列。這樣設計出的表頭如下:表L8(27)的表頭列

51、號1234567因子ABAXBCAXCBXC下面通過實例說明交互作用的正交設計。例某試驗小組,為了提高水稻的產(chǎn)量,選取了對產(chǎn)量有影響的三個因素,每個因素取2個水平進行試驗,以便確定生產(chǎn)方案。并希望考察因素間的交互作用。具體水平如下:表因素與水平選擇表因素A-BC施磷肥量(斤/畝)施氮肥量(斤/畝)1水平A140152水平A26010用L8(27)安排8次試驗,試驗結果如下表表1039試驗數(shù)據(jù)及直觀分析表1(A)2(B)3(AXB)4(C)5(AXC)6(BXC)水稻產(chǎn)量(斤/畝)1111111112521112221052312211210774122221110552121211100621

52、22129507221122102082212111050kn435942274247432242024380k2i412042524232415742774099k1i108910571062108110511095k?103010631058103910691025R5964421870對于考慮交互作用的試驗,只要我們將每個交互作用作為一個因子考慮,其分析計算的步驟完全類似無交互作用情況,不同的是如何確定最優(yōu)水平問題。由表計算數(shù)據(jù)及直觀分析知,因子BXCA和C是重要的。顯然A取水平Ai,BXC的最優(yōu)水平可以將B和C的不同水平組合的實驗結果比較確定,計算如下:表XC的最優(yōu)水平的選擇通過比較,選取B和C,于是得到最優(yōu)工藝條件為ABQ?,F(xiàn)在進行方差分析??偲钇椒胶偷姆纸夤綖椋築1B2C11125+11001077+1020“1112.51048.22C21052+9501105+1050仆"=1001=10772

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論