不完全區(qū)組設計和統計分析課件(PPT 188頁)_第1頁
不完全區(qū)組設計和統計分析課件(PPT 188頁)_第2頁
不完全區(qū)組設計和統計分析課件(PPT 188頁)_第3頁
不完全區(qū)組設計和統計分析課件(PPT 188頁)_第4頁
不完全區(qū)組設計和統計分析課件(PPT 188頁)_第5頁
已閱讀5頁,還剩183頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第十四章 不完全區(qū)組設計和統計分析第一節(jié) 不完全區(qū)組設計的主要類型第二節(jié) 重復內分組和分組內重復設計的統計分析第三節(jié) 簡單格子設計的統計分析第四節(jié) 平衡不完全區(qū)組設計的統計分析第1頁,共188頁。第一節(jié) 不完全區(qū)組設計的主要類型一、田間試驗常用設計的歸類二、重復內分組和分組內重復設計三、格子設計四、平衡不完全區(qū)組設計第2頁,共188頁。一、田間試驗常用設計的歸類完全區(qū)組(complete block):每一區(qū)組包含全套處理。不完全區(qū)組(incomplete block):即一套處理分成幾個區(qū)組,或一個區(qū)組并不包含全部處理,但同樣要通過區(qū)組實施地區(qū)控制。 第3頁,共188頁。二、重復內分組和分組

2、內重復設計重復內分組設計(block in replication):將供試品種分為幾個組,看作為主區(qū),每個組內包含的各個品種看作為副區(qū),重復若干次,主副區(qū)都按隨機區(qū)組布置的設計。例如20個品種,分為4組,每組包含5個品種,若重復3次,則田間布置可設計如下圖: 第4頁,共188頁。 重復內分組設計的田間布置該例中重復內分組設計的自由度分析如下:重復重復重復區(qū)組(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)42011101775159191233181581662138171312191391881127161525161262010314620144117147

3、1994111018115第5頁,共188頁。變 異 來 源 DF重 復 2組 間 3誤 差 (Ea) 6組內品種間 16誤 差 (Eb) 32總 59組內品種間比較的誤差將為: ;第6頁,共188頁。各組平均數間比較的誤差將為: ;不同組品種間比較的誤差(仿照裂區(qū)的情況)將為: 。由于Ea與Eb常取不同數值,Ea往往大于Eb,例如 =3,若如此,則:組內品種間比較的誤差將為:不同組品種間比較的誤差將為:第7頁,共188頁。兩者比值為:即不同組品種間比較的方差將比組內品種間比較的方差大40%,因而像這種不完全區(qū)組設計的方法,并不能保證任何兩個品種間比較具有相近的精確度。分組內重復設計(repl

4、ication in block):將供試材料分組后放在連片土地上的幾組隨機區(qū)組試驗,通過土地連片而進行聯合分析與比較。 第8頁,共188頁。 分組內重復設計 分組1分組2分組3分組4區(qū)組(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)191618131511541898181917121114352710716201915121313510692017161114152149710171820141312423686第9頁,共188頁。三、 格子設計格子設計(lattice design):為了克服重復內分組設計中組間品種比較和組內品種比較精確度懸殊的問題,對品

5、種分組的方法可考慮從固定的分組改進為不固定的分組,使一個品種有機會和許多其他品種,甚至其他各個品種都在同一區(qū)組中相遇過。第10頁,共188頁。(一) 格子設計的類別平方格子設計(squared lattice ):供試品種數為區(qū)組內品種數的平方,區(qū)組內品種數為p,供試品種數為p2;立方格子設計(cubic lattice ):供試品種數為區(qū)組內品種數的立方,區(qū)組內品種數為p,供試品種數為p3;矩形格子設計:區(qū)組內品種數為p,供試品種數為p(p+1) 。 第11頁,共188頁。(二) 平方格子設計1. 仿照隨機區(qū)組式的設計 按品種分組方法的變換次數有:(1) 簡單格子設計(simple latt

6、ice)品種分組方法為二種,試驗重復次數為2或2的倍數。 重復 I重復(1)1 2 3(4)1 4 7區(qū)組(2)4 5 6(5)2 5 8(3)7 8 9(6)3 6 9第12頁,共188頁。(2) 三重格子設計(triple lattice):品種分組方法為三種,即在簡單格子設計二種分組方法的基礎上再增加對角線分組一種,重復次數為3或3的倍數。 (3) 四重格子設計(quadruple lattice):在三重格子設計的基礎上,再增加對角線一組, 重復 I重復重復 III(1)1 2 3(4)1 4 7(7)1 5 9區(qū)組(2)4 5 6(5)2 5 8(8)2 6 7(3)7 8 9(6)

7、3 6 9(9)3 4 8第13頁,共188頁。 (4) 平衡格子設計(balanced lattice):品種分組方法增加到使每一對品種都能在同一區(qū)組中相遇一次。 分組法X分組法Y分組法Z分組法L區(qū)組(1)1 2 3 4 5(6)1 6 11 16 21(11)1 7 13 19 25(16)1 8 15 17 24(2)6 7 8 9 10(7)2 7 12 17 22(12)2 8 14 20 21(17)2 9 11 18 25(3)11 12 13 14 15(8)3 8 13 18 23(13)3 9 15 16 22(18)3 10 12 19 21(4)16 17 18 19

8、20(9)4 9 14 19 24(14)4 10 11 17 23(19)4 6 13 20 22(5)21 22 23 24 25(10)5 10 15 20 25(15)5 6 12 18 24(20)5 7 14 16 2355四重格子設計方法第14頁,共188頁。 2. 仿照拉丁方的格子設計(1) 平衡格子方設計(balanced lattice square) 重復數r=(p+1)/2,每對品種在行或列區(qū)組中共相遇一次; 重復重復重復重復(1)1 2 3(4)1 4 7(7)1 5 9(10)1 6 8區(qū)組(2)4 5 6(5)2 5 8(8)2 6 7(11)2 4 9(3)7

9、8 9(6)3 6 9(9)3 4 8(12)3 5 733平衡格子設計第15頁,共188頁。 33平衡格子方設計在行或列中相遇一次,r =(p +1)/21 2 31 6 84 5 69 2 47 8 95 7 3第16頁,共188頁。重復數r=(p+1),每對品種在行及列區(qū)組中均相遇一次,亦即共相遇二次。 159131234111166261014658712251537111511129101483948121616151413713104171214110158821311927161016351363121596451411444平衡格子方設計在行及列中共相遇二次,r=(p+1) 第

10、17頁,共188頁。(2) 部分平衡格子方設計(partially balanced lattice square):重復次數少于最小平衡重復數。與三重、四重格子設計類似,不一定每一對品種都在行或列區(qū)組中相遇。格子設計的優(yōu)點是:考慮了供試品種間平衡比較的問題。但由于供試品種數多,這常只能實施部分平衡,而事實上很難實施完全平衡,因為完全平衡所需的重復次數導致試驗規(guī)模過大。第18頁,共188頁。育種工作中產量比較在早、中期階段,因供試材料多需要考慮適合大量處理的設計,但這時每份材料的種子數少,一般不可能進行小區(qū)較大的精確試驗,因而實際應用中部分平衡的格子設計已可滿足要求。第19頁,共188頁。四、

11、平衡不完全區(qū)組設計平衡不完全區(qū)組設計(balanced incomplete block design):設計的供試處理數不多,不須按格子設計那樣每一重復包含有區(qū)組大小為k的k個區(qū)組,而可將各重復寓于全部區(qū)組之中,區(qū)組數與區(qū)組大小不一定相等,即全試驗包括大小為k的區(qū)組共t (處理數)或 t 倍個。 第20頁,共188頁。圖14.7 一種平衡不完全區(qū)組設計例如品嘗試驗,對于一個人的味覺來說,品嘗的對象增加太多時鑒別差異的靈敏度便下降,因而每個人只能品嘗一部分。圖14.7的情況,若有7個水果品種供鑒評,每人品嘗3個,請7位品嘗家作鑒評,便共品嘗21次,每個品種品嘗3次。此處每位專家區(qū)組(1)(2)

12、(3)(4)(5)(6)(7)123456723456714567123第21頁,共188頁。 便是一個區(qū)組,每區(qū)組包含3個品種。這時盡管每人并未將7個品種全部鑒評過,但因是均衡的,每個品種至少和其他6個品種比較過1次。這一試驗可增加至14位專家則每對品種相遇2次,21位專家則相遇3次。因而可以請許多專家作出綜合評判。第22頁,共188頁。第二節(jié) 重復內分組和分組內重復設計的統計分析一、重復內分組設計的統計分析二、分組內重復設計的統計分析第23頁,共188頁。一、重復內分組設計的統計分析重復內分組用于品種(系)試驗時有二種情況:一是大量品種(系)間的比較目的在于選拔高產優(yōu)系(固定模型試驗);另

13、一是從一個群體內隨機抽出大量家系進行試驗,通過供試的樣本推論總體的情況(隨機模型試驗)。 第24頁,共188頁。假定重復內分組設計的供試品種為m=ab個,分a組,每組有b個品種(系),重復r次,則重復內分組設計的線性模型為: (141) 固定模型時: , , , ;隨機模型時: Ak ,Bkl , 。 第25頁,共188頁。重復內分組設計的自由度及期望均方變 異 來 源DFMSEMS固定模型隨機模型 重 復 r-1MS1 分組(區(qū)組,主區(qū)) a-1MS2 重復分組(Ea) (r-1)(a-1)MS3 分組內品種(系) a(b-1)MS4 重復分組內品種 (系)(Eb) a(b-1)(r-1)M

14、S5第26頁,共188頁。固定模型時分組間差異的測驗,F = MS2/MS3 ;分組內品種(系)間差異的測驗 F = MS4/MS5 。重復內分組設計著重在分組內品種間的比較,其分組間比較,其 (143)(142)第27頁,共188頁。不同組品種間比較,其 (144) 隨機模型時分組間變異的測驗: (145)分組內變異的測驗: F=MS4/MS5 (146) 第28頁,共188頁。F=(MS2+MS5)/(MS3+MS4)時,其有效自由度可用 Satterthwaite公式計算: (147)(147)中fi為各均方對應的自由度。由(145)及(146)的關系可分別估計出及。 第29頁,共188

15、頁。二、分組內重復設計的統計分析分組內重復的設計的線性模型為: (148) 固定模型時: , , ;隨機模型時,Ak ,Bkl ,第30頁,共188頁。 。分組內重復設計的自由度及期望均方變 異 來 源DFMSEMS固定模型隨機模型 分 組 a-1MS1 分組內品種 a(b-1)MS2 分組內重復(區(qū)組) a(r-1)MS3 重復組內品種(E) a(b-1)(r-1)MS4第31頁,共188頁。固定模型時分組間差異的測驗,F=MS1/MS4;分組內品種(系)間差異的測驗F=MS2/MS4。分組內重復設計著重在分組內品種間的比較,其 (149) 分組間可以比較,其 (1410)第32頁,共188

16、頁。不同組品種間的比較,其 (1411)隨機模型時分組間差異的測驗: (1412)其有效自由度按Satterthwaite公式。分組內品種間差異測驗: F=MS2/MS4 (1413)第33頁,共188頁。 由(1412)及(1413)測驗 及 。在各分組品種(系)均為總體一隨機樣本的前題下,可假定分組平均數相等,從而對品種(系)平均數作統一調整。重復內分組和分組內重復是目前品系產量早期比較試驗較常用的設計,并常用于遺傳參數的估計,尤其前者更為常用。第34頁,共188頁。第三節(jié) 簡單格子設計的統計分析一、簡單格子設計分析的基本原理二、簡單格子設計的例題第35頁,共188頁。一、簡單格子設計分析

17、的基本原理設有9個品種,重復2次的簡單格子設計試驗,這9個品種分別給以二位數的代號如下:品種按橫行、縱行分組,分別設置為一個重復,則其分組安排如下:1 2 311 12 134 5 621 22 237 8 931 32 33第36頁,共188頁。由重復所得產量以x表示,重復以y表示,各品種總和以t表示,則可以將試驗結果整理如表14.3的形式(虛線表示區(qū)組)。 重復11 12 1321 22 2331 32 33重復11 21 3112 22 3213 23 33x11x12x13X1y11y12y13Y1t11t12t13T1x21x22x23X2y21y22y23Y2t21t22t23T2

18、x31x32x33X3y31y32y33Y3t31t32t33T3X1X2X3XY1Y2Y3YT1T2T3TX 組Y 組品種總和簡單格子設計試驗結果符號表 第37頁,共188頁。橫行總和作為試驗因子A(X分組)的效應,縱列為B(Y分組)的效應。此試驗可看作為每個因子各具3個級別的二因子試驗,其自由度為:由于重復中A因子的效應和區(qū)組效應混雜,重復 中B因子與區(qū)組混雜,整個試驗相當于一個虛擬的二因子部分混雜試驗,其混雜的效應是A與B主效。DFA2B2AB4總8第38頁,共188頁。若將重復當作區(qū)組,那么本試驗可按隨機區(qū)組的方法進行方差分析,其自由度為(左圖)現在每一重復又劃分為區(qū)組,要把區(qū)組的變異

19、從誤差中扣去以減小試驗誤差,故其自由度分析將為(右圖)DF重復 1品種 8誤差 8總 17DF 重復 1 區(qū)組(Eb) 4 品種 8區(qū)組內誤差(Ei) 4總 17第39頁,共188頁。由t11、t12、t33計算品種平方和中包含有區(qū)組的效應,夸大了品種的效應;由X1 、X2 、X3 ,Y1 、Y2 、Y3計算區(qū)組平方和則又包含了品種的效應,夸大了區(qū)組的效應。關鍵:從品種效應中扣去區(qū)組部分,得到可以共同比較的調整的品種平均數及品種平方和;估計出除去品種效應的區(qū)組間變異,得到一個無偏的試驗誤差估計,進行合理的統計推斷。第40頁,共188頁。(一) 品種調整平均數的計算 1=T1/6 為A因子第一級

20、別的未調整平均數; 1=T1/6 為B因子第一級別的未調整平均數。如品種12的未調整平均數為v12,則: (1414)其中,m為全試驗總平均數。第41頁,共188頁。(1414)說明任一品種總的離均差為橫行離均差、縱 行離均差以及橫行縱行互作效應三部分之和。令: Ai表示不包含區(qū)組效應A因子效應估計值; Bi表示不包含區(qū)組效應B因子效應估計值。則 :A因子第一個級別的估計值 , B因子第一個級別的估計值第42頁,共188頁。又令Ab 表示與區(qū)組混雜的A因子效應估計值,Bb 表示與區(qū)組混雜的B因子效應估計值則 A因子第一個級別的估計值 , B因子第一個級別的估計值 若A0,B0分別表示X組及Y組

21、綜合在一起未調整的A因子及B因子效應,則:第43頁,共188頁。 求A及B的調整值比較合理的方法是以Ai、Bi及Ab、Bb各分組所獲得結果的可靠程度進行加權平均,這里Ai、Bi效應沒有區(qū)組效應在內,可用 衡量其可靠程度,其中 代表區(qū)組內誤差的理論方差。Ab、Bb效應混有區(qū)組效應,區(qū)組效應越大,Ab、Bb估計A及B的可靠程度越小,可用 衡量其可靠程度, 代表重復內區(qū)組間的理論方差(以小區(qū)為單位)。(1415)第44頁,共188頁。 (1416)當區(qū)組間沒有真實差異時, ,Ai、Bi和Ab、Bb 同等重要,故:第45頁,共188頁。得到A及B的估計值后,可得: (1417)因未調整的(v0-A0-

22、B0+m)與調整后的(v -A-B +m )應是相等的,兩者相減 v-v0=(A-A0)+(B-B0) (1418)表示調整的品種平均數可由v0、(A-A0)及(B-B0)三部分計算。 第46頁,共188頁。由(1416)及(1415)可得:令 則 (1419)第47頁,共188頁。 以品種11為例,需求出A及B各第一級別的A0、Ab、 B0及Bb,其中第48頁,共188頁。若令以上二矯正數分別以及代表,則: (1420) 其中vef 中的ef代表以二位數字表示的某品種,在具有二個重復參試材料為p2的簡單格子設計中 及 的通式可寫為: 第49頁,共188頁。 如果簡單格子設計,每種分組重復二次

23、,全試驗共有四次重復,則: (1421)(1422)第50頁,共188頁。 在品種平均數的橫行及縱行旁求出 , 求 出 , 就可計算出各個品種的調整平均數。但為便于計算,一般直接在品種總和表旁求出品種總和的矯正數,計算出各個品種的調整總和,再求調整平均數。2次重復時調整品種總和為: (1423) 第51頁,共188頁。(二) 與 及w與 的估計上述品種調整平均數的計算需按 , 進行調整。 可以由區(qū)組內均方Ei直接估計,主要需估計出 。區(qū)組間均方的計算需由二部分平方和合并,要了解清楚這二部分平方和的計算,從一個四次重復的試驗比較容易說明。第52頁,共188頁。 表14.4 四次重復簡單格子設計試

24、驗結果符號表X 分 組 法Y 分 組 法111213g11111213g12111213111213212223g21212223g22212223212223313233g31313233g32313233313233G1G2g13g23g33G3g14g24g34G4x11x12x13X1y11y12y13Y1t11t12t13T1x21x22x23X2y21y22y23Y2t21t22t23T2x31x32x33X3y31y32y33Y3t31t32t33T3X1X2X3XY1Y2Y3YT1T2T3T第53頁,共188頁。在X、Y 兩種分組各有重復時,從相同品種組的區(qū)組兩次重復間的差異的

25、效應扣去整個重復間差異的效應,可以估計出區(qū)組效應。其計算方法為(1424)二式之和。 (1424)第54頁,共188頁。這部分平方和相當于A因子與重復的互作和B因子與 重復的互作之和,稱為成分(a)。兩種分組方法各對應X1與Y1之間差異的效應扣去整個分組方法總差異間的效應,也將屬于區(qū)組的效應,其計算方法為(1425)二式之和。 (1425)第55頁,共188頁。這部分平方和相當于A因子與分組方法的互作和B因 子與分組方法的互作之和,稱為成分(b)。因 T1-2X1=(X1+Y1-2X1)=Y1-X1故成分(b)也可寫為: (1426) 第56頁,共188頁。在33簡單格子設計具有4個重復時,成

26、分(a)具有 2+2=4個自由度,成分(b)也具有2+2=4個自由度,(a)與(b)兩者相加共有8個區(qū)組自由度。在只有2個重復時,顯然成分(a)無從計算,因此僅由成分(b)代表區(qū)組的平方和。不過(1426)中分母將相應改變?yōu)?3及29。 第57頁,共188頁。分析成分(a)均方所估計的方差分量為 ,其中 為區(qū)組內誤差, 為區(qū)組間的方差。成分(b)均方所估計的方差分量為 ,這是因為成分(b)的兩部分是從同一材料計算來的,所以只估計了 。當只有二個重復時,只能由成分(b)計得區(qū)組的均方( ),但是由方差分析原理,正常的區(qū)組項均方應由 組成。所以對區(qū)組的理論方差的估計要作適當調整。 第58頁,共18

27、8頁。所以, (1427) 當有四次重復時,成分(a)與(b)綜合的均方所估計的分量為,即第59頁,共188頁。所以, (1428) (三) 品種平均數間比較的誤差計算同區(qū)組內品種間比較:第60頁,共188頁。 異區(qū)組品種間比較: 不論區(qū)組異同,品種間相互比較:(1429)(1430)第61頁,共188頁。 若 由成分(a)單獨估計,則 , 。當EbEi時, ,上列各公式均變?yōu)?,這就類似隨機區(qū)組時的公式。當Eb很大時, 接近于1,(1429)、(1430)、(1431)三公式相應變?yōu)椋?(1431)第62頁,共188頁。 , 和這種情況下,A與B的效應相當于由Ai及Bi單獨估計,Ab及Bb對

28、A、B均未提供信息。(四) 品種平方和的調整直接按格子設計進行測驗,則要對品種平方和進行調整,對于簡單格子設計,其矯正數為: 第63頁,共188頁。 (1432)其中,Ku為未調整的成分(b)平方和,Kb為調整的成分(b)平方和。Kb由(1425)計算,表14.3中的Ku可由下式計算: (1433)第64頁,共188頁。 表14.5 簡單格子設計方差分析表變 異 來 源DF 重復 r-1 區(qū)組(調整的) r(p-1) 2(p-1) 2(p-1) 品種(未調整的) p2-1 區(qū)組內誤差(Ei) (p-1)(rp-p-1) 總 r p2-1第65頁,共188頁。 (五) 期望均方簡單格子設計用于單

29、因素試驗,其期望均方和隨機區(qū)組的情況一樣,區(qū)組內誤差估計了 ,調整的品種均方估計了 (隨機模型)或 (固定模型)。二、簡單格子設計的例題(一) 二次重復簡單格子設計的例題第66頁,共188頁。 例14.1 表14.6為一個55大豆品種重復二次簡單格子設計的試驗結果。其田間排列是隨機的。隨機的步驟: 在每一重復內分別獨立地隨機安排區(qū)組; 在每一區(qū)組內分別獨立地隨機安排品種代號; 將各品種隨機決定品種代號。第67頁,共188頁。表14.6 55大豆品種簡單格子設計的產量試驗結果(r=2,kg/區(qū))第68頁,共188頁。分析步驟如下:1. 從表14.6計算各區(qū)組總和(這里即Xe及Yf),重復總和(這

30、里即X及Y)各品種(未調整)總和(tef)以及Te 、Tf值。并按隨機區(qū)組進行方差分析。結果列于表14.7。隨機區(qū)組方差分析結果品種間無顯著差異。進一步再按格子設計分析。第69頁,共188頁。表14.7 隨機區(qū)組方差分析表2. 計算消去品種效應的區(qū)組平方和。 由成分(b)單獨估計。按(1425),r =2時為:變異來源DFSSMSF重 復1212.18品 種24559.2823.301誤 差24720.3230.01總491491.78第70頁,共188頁。在表14.6上分別計算Te-2Xe及Tf -2Yf值,代進上式得:3. 列出分解有區(qū)組變異的方差分析表(表14.8)。=501.84 表1

31、4.8 55簡單格子設計(r=2)方差分析表變 異 來 源DFSSMSF 重復1212.18 品種(未調整)24559.2823.30 重復內區(qū)組(調整)8501.8462.73(Eb)4.59* 區(qū)組內誤差16218.4813.66(Ei) 總491491.78第71頁,共188頁。調整后重復內區(qū)組間的變異很顯著,說明將區(qū)組劃出是很必要的。4. 計算調整的品種總和( )。由(1423),在簡單格子設計兩個重復時:=0.7820 =0.1564 第72頁,共188頁。調整品種總和 = 在表14.6中分別計算 及 然后計算各品種調整的總和 ,以品種(1)為例: =30+9.5-1.4=38.1。

32、其余類推,全部結果列于表14.6的末端。5. 計算品種平均數間比較的誤差。同區(qū)組品種平均數間比較:第73頁,共188頁。 異區(qū)組品種平均數間比較:全試驗品種平均數相互比較:一般用2.93作標準誤進行品種間比較即可。第74頁,共188頁。6. 計算調整的品種平方和再進一步測驗品種差異的顯著性.按(1432)品種平方和的矯正數為: 其中Ku仿(1433)為:第75頁,共188頁。 Kb為調整的區(qū)組成分(b)平方和,即表14.9中的501.84。 w=1/Ei=1/13.66=0.073211/(2Eb-Ei)=1/(262.73-13.66)=0.008945=559.28+85.30=644.5

33、8故調整品種平方和 第76頁,共188頁。 調整的品種均方及F 測驗如下:按照簡單格子設計的分析結果調整以后的品種均方比 未調整時增大了,誤差比隨機區(qū)組時降低了,因而提高了試驗的精確性。它與隨機區(qū)組設計相比較,所提高的效率可估計如下: 變 異 來 源自由度平方和均 方F品種(調整)24644.5826.861.97區(qū)組內誤差16218.4813.66第77頁,共188頁。即提高了74。本試驗品種間無顯著差異,所以不必進一步再做品種平均數間的比較。第78頁,共188頁。(二) 四次重復簡單格子設計的例題例14.2 上例55大豆試驗,原為一個四次重復的簡單格子設計,若表14.6中的是第一重復及第三

34、重復,今將第二重復,第四重復的結果補充列在表14.9中,重復與重復屬同一種分組,重復與重復屬另一種分組。分析步驟如下:1. 從表14.6及14.9計算各重復各區(qū)組的總和g,重復總和G,同品種的兩個區(qū)組總和Xe及Yf ,各品種 第79頁,共188頁。表14.9 55大豆品種簡單格子設計、重復的產量結果(r=2,kg/區(qū))第80頁,共188頁。 (未調整)總和tef以及Te 、Tf值。按隨機區(qū)組預先進行方差分析(表14.10)。隨機區(qū)組方差分析結果品種間無顯著差異,進一步按格子設計分析。表14.10 隨機區(qū)組方差分析表變異來源DFSSMSF重 復r-1=4-1=3226.19品 種p2-1=25-

35、1=24791.2432.961.53誤 差(r-1)(p2-1)=721547.5621.49總 992564.99第81頁,共188頁。2. 計算消去品種效應的區(qū)組平方和。這里包括成分(a)及成分(b)兩部分。成分(a)的計算: 第82頁,共188頁。成分(a)的另一種計算方法可適用于更多次重復的分析。即由相同分組方法內品種組與二次重復的交互作用項計算。 區(qū)組平方和(區(qū)組總SS )第83頁,共188頁。 重復間平方和(重復SS )品種組間平方和(品種組SS)第84頁,共188頁。 成分(a)=區(qū)組總SS -重復SS -品種組SS =602.18 -309.28-128.14=164.72計

36、算結果與前相同。成分(b) r=4時,為:3. 列出分解有區(qū)組變異的方差分析表(表14.11)。第85頁,共188頁。表14.11 55簡單格子設計(r=4)方差分析表4. 計算調整的品種總和。 變 異 來 源DFSSMS 重 復 r-1=3226.19 品種(未調整) p2-1=24791.2432.96 重復內區(qū)組間 r(p-1)=16786.0049.12(Eb) 2(p-1)=8 2(p-1)=8164.72621.28 區(qū)組內誤差 (p-1)(rp-p-1)=56761.5613.60(Ei) 總 r p2-1=992564.99第86頁,共188頁。 調整品種總和 第87頁,共18

37、8頁。 在表14.9中分別計算出及然后計算各品種調整的總和,方法同上例。如品種15 =72+(+8.8)+(-61)=74.7,余類推。全部計算結果列于表14.9的末端。5. 計算品種平均數間比較的誤差。同區(qū)組品種 第88頁,共188頁。 異區(qū)組品種 全試驗品種 6. 計算調整品種平方和并進一步測驗品種差異的 顯著性。第89頁,共188頁。 此即計算成分(a)時的品種組間平方和一項。 調整品種平方和 =791.24+154.33=945.57第90頁,共188頁。調整的品種均方及F 測驗如下:按格子設計分析,扣除了重復內區(qū)組間的變異,降低了試驗誤差,使品種間的變異呈現出顯著性。7. 進一步可以

38、計算出調整的平均數,并由全試驗品種SE 計算LSD 進行品種間的比較。方法同隨機區(qū)組,此處從略。變異來源自由度平方和均方F品種(調整)24945.5739.402.90*區(qū)組內誤差56761.5613.60第91頁,共188頁。第四節(jié) 平衡不完全區(qū)組設計的統計分析例14.3 設若對某種水果7個品種進行風味品嘗,請7位專家評分,每位專家按圖14.7的計劃鑒評3個品種,其第1號為對照品種,評分范圍為最低0分,最高5分,結果列于表14.12。該試驗具有處理數t=7,區(qū)組數k=3,重復數r=k=3,兩兩品種在同一區(qū)組相遇1次。這一設計的線性模型為: (1434) 第92頁,共188頁。表14.12 七

39、個品種風味的專家評分結果(平衡不完全區(qū)組設計)區(qū)組(專家)品種與評分yij區(qū)組總和B(1) 3.5 3.8 4.111.4(2) 3.4 4.0 3.310.7(3) 4.1 4.3 4.613.0(4) 4.3 4.2 4.613.1(5) 3.7 4.6 3.912.2(6) 4.0 4.8 3.712.5(7) 4.9 4.0 4.513.4G=86.3第93頁,共188頁。其分析步驟如下:1. 在表14.12中計算未調整的區(qū)組總和(B )及全試驗總和(G )。計算未調整的品種總和(Tt)列于表14.13;同時計算出品種所在區(qū)組各區(qū)組總和的和數(Bt ),如品種1為11.4+12.2+1

40、3.4=37.0等,列于表14.13。應與kG 相等,可用以驗算數據。2. 計算各品種的W 值。W =(t-k)T-(t-1)Bt+(k-1)G=4T-6Bt+2G(本例情況)。按(1434)將各小區(qū)的線性組成相加、減,可以發(fā)現不同品種的W值只包含區(qū)組效應,因而W值間的變異表示了調整后區(qū)組間的變異,其總和W 應為0。第94頁,共188頁。表14.13 平衡不完全區(qū)組設計數據分析表調整處理平均 數品 種TtBtW調整處理總和Tc=Tt+wW 1(CK)11.437.0-3.811.263.75 210.934.68.611.223.74 312.637.10.412.614.20 412.737

41、.5-1.612.644.21 511.236.01.411.253.75 613.237.7-0.813.174.39 714.339.0-4.214.144.7186.3258.90.086.29第95頁,共188頁。3. 進行方差分析。全試驗21個小區(qū)的總變異中包含有品種間純變異、區(qū)組間純變異、由于區(qū)組不完全而導致的品種與區(qū)組相混雜的一部分變異、以及區(qū)組內的誤差四部分。其中品種與區(qū)組相混雜的一部分變異包含在處理總和(T )間的變異中,也包含在區(qū)組總和(B )間的變異中。因混雜的這一部分變異不論在前者還是在后者是同一個成分,因此在方差分析中只須考慮一個方面便可。由W 值計算調整的區(qū)組間平方

42、和的公式為:第96頁,共188頁。 (1435)本例中為 342)=0.6629未調整的品種平方和:全試驗總平方和區(qū)組內平方和=4.0981-3.0114-0.6629=0.4238第97頁,共188頁。表14.14 平衡不完全區(qū)組設計的方差分析表 此處所獲的Ee,實際上只是一個初步估計值,并不立即用于進行F測驗,而需作進一步調整。 4. 計算加權因子w ,并調整處理總和及平方和。 (1436) 變 異 來 源DFSSMS調整MS F品種(未調整) t -1=63.01140.5020.42787.035* F0.05=3.58, F0.01=6.37區(qū)組(已調整) b-1=60.66290.

43、110(Eb)區(qū)組內誤差 tr-2t+1=80.42380.053(Ee)0.0608總 tr-1=204.0981第98頁,共188頁。 按(Tt+wW )計算調整的品種總和(Tc),如品種1(CK) 為11.4+(-3.8)(0.0370)=11.26等,填入表14.13。 (1437) 本例中 本例中相應的均方為 2.5665/6=0.4278。第99頁,共188頁。5. 計算有效誤差并作進一步方差分析。 有效誤差E =Ee1+(t-k )w 本例中E =0.0531+(7-3)0.0370=0.0608將調整的品種均方和有效誤差填入表14.14右端,這時可進行F 測驗。F 測驗的結果表

44、明品種間風味評價上有很顯著的差異。必須說明平衡不完全區(qū)組設計的方差分析中根據加權因子w 調整的處理均方和誤差均方都是近似的,包括w 值本身也有抽樣波動,所以這一F 測驗也是一種近似的測驗。第100頁,共188頁。6. 處理間的比較。處理平均數間比較可用LSD 法,此例中已經F 測驗證實品種間有顯著差異,故實際上已用了Fisher保護最小顯著差數法(FPLSD )。 FPLSD0.05=測驗結果如下: 第101頁,共188頁。 品種2153467評分3.743.753.754.024.214.394.71顯著性比較結果,品種2、5、3與對照間無顯著差異,品種4、6、7的風味評價均優(yōu)于對照,尤其品

45、種7最佳,優(yōu)于品種3、4。第102頁,共188頁。第十五章 抽樣調查 第一節(jié) 抽樣調查方案 第二節(jié) 常用抽樣方法的統計分析 第三節(jié) 樣本容量的估計第103頁,共188頁。第一節(jié) 抽樣調查方案一、抽樣單位二、抽樣方法三、樣本容量四、確定抽樣方案的一些因素第104頁,共188頁。一、抽樣單位抽樣分數(sampling fraction):指一個樣本所包含的抽樣單位數占其總體單位數的成數。田間抽樣調查的抽樣單位(sample unit)是隨調查研究目的、作物種類、病蟲害種類、生育時期、播種方法等因素而不同的,可以是一種自然的單位,也可以是若干個自然單位歸并成的單位,還可以用人為確定的大小、范圍或數量

46、作為一個抽樣單位。 第105頁,共188頁。常用的抽樣單位舉例如下: (1)面積 如0.5平方米或每平方米內的產量、株數、害蟲頭數等。 (2)長度 如12行若干長度內的產量、株數,若干長度內植株上的害蟲頭數等。 (3)株穴 如棉花連續(xù)10株的結鈴數,水稻連續(xù)20穴的苗數、分蘗數、結實粒數等。 第106頁,共188頁。(4)器官 如稻、麥千粒重,大豆百粒重,每100個棉鈴中紅鈴蟲頭數,每張葉片的病斑數等。(5)時間 如單位時間內見到的蟲子頭數,每天開始開花的株數等。(6)器械 如一捕蟲網的蟲數,一只誘蛾燈下的蟲數,每一個顯微鏡視野內的細菌數、孢子數、花粉發(fā)芽粒數等。(7)容量或重量 如每升或每公

47、斤種子內的混雜種子數,每升或每公斤種子內的害蟲頭數等。(8)其他 如一個田塊、一個農場等概念性的單位。第107頁,共188頁。二、抽樣方法基本的抽樣方法(sampling method)有以下三類:1順序抽樣(systematic sampling) 也稱機械抽樣或系統抽樣,按照某種既定的順序抽取一定數量的抽樣單位組成樣本。 2典型抽樣(typical sampling) 也稱代表性抽樣,按調查研究目的從總體內有意識地選取一定數第108頁,共188頁。量有代表性的抽樣單位,至少要求所選取的單位能代表總體的大多數。 3隨機抽樣(random sampling) 也稱等概率抽樣,在抽取抽樣單位時,

48、總體內各單位應均有同等機會被抽取。 第109頁,共188頁。常用的順序抽樣方式 第110頁,共188頁。三、樣本容量樣本容量(或樣本含量sample size):指樣本所包括的抽樣單位數。樣本容量的大小與所獲抽樣調查結果的準確度和精確度密切有關。 第111頁,共188頁。四、確定抽樣方案的一些因素設計抽樣方案時須考慮以下幾方面:(1) 所要求的準確度與精確度,要求高時樣本容量應大。 (2) 是否需估計置信限或作統計推論,一般隨機抽樣有合理的試驗誤差估計,可以做統計推論。而其他抽樣方法往往缺乏合理的誤差估計,統計分析有局限性。 第112頁,共188頁。(3) 與人力、物力、時間等條件相適應,抽樣

49、單位大、樣本容量大、進行總體編號等都是較費事的,必須權衡需要與可能,在保證一定精確性的情況下,盡量減低消耗。(4) 注意到調查研究對象的特點。 第113頁,共188頁。第二節(jié) 常用抽樣方法的統計分析一、簡單順序抽樣及簡單典型抽樣法二、簡單隨機抽樣法三、分層隨機抽樣法四、整群抽樣法五、分級隨機抽樣法六、雙重隨機抽樣法七、序貫抽樣法第114頁,共188頁。一、簡單順序抽樣及簡單典型抽樣法簡單順序抽樣(simple systematic sampling):通常只計算平均數作為總體的估計值。計算平均數的公式為: 第115頁,共188頁。例15.1設成熟期對水稻汕優(yōu)2號大田測產,該田塊約5畝,生長較均

50、勻。采用棋盤式抽樣,10個點,每點由12行間距計算平均行距。其中任選二行測查2m長度內的穴數及有效穗數。再在其中拔連續(xù)5穴,將稻穗分成大、中、小三級,按比例選取20穗,結合考查其他性狀計數每穗總粒數及空癟粒數,從而算出結實粒數。每點其余稻穗脫粒,稱取千粒重。將10點數據匯總后求得每畝平均穴數4.2萬,每穴平均第116頁,共188頁。有效穗數9.2個,每穗平均結實粒數53.7粒,平均千粒重25.2克。計算平均數的公式為。本例中土地利用系數定為98%,則估計每畝產量為: = 513.75(kg/畝) 簡單典型抽樣法的分析同樣只計算 。第117頁,共188頁。二、簡單隨機抽樣法簡單隨機抽樣(simp

51、le random sampling):每個抽樣單位具有相同概率被抽入樣本。總體編號方法及隨機抽取方法依調查對象而定。例15.2 設在一休閑地上調查小地蠶蟲口密度每測框為1m2,隨機取30點,調查結果列在表15.1。 第118頁,共188頁。表15.1 30個單位的小地蠶幼蟲頭數 每m2內幼蟲頭數( y )0123456789101112 單位數(個)123844222100130 fy02624162012141690012131 fy20212726410072981288100144773(頭/)(頭/)(頭/)第119頁,共188頁。 即該田塊小地蠶幼蟲約為3.385.34(頭/),折

52、合每畝2253.43560.2頭,這個估計的可靠性為95%。以上將所調查研究的總體看為面積甚大的一個無限總體進行分析,設若該30個單位從336的一塊田中抽出,這時調查研究的總體實為一有限總體,有限總體的兩個參數為:平均數 (151) (頭/)第120頁,共188頁。標準差N 為總體內單位數,即總體容量。樣本估計值仍為及,但估計抽樣誤差時應考慮到抽樣分數的影響。 (153)(152)第121頁,共188頁。本例中 (頭/)該有限總體平均數的95%置信限為: (頭/)即3.425.30(頭/),折合每畝2280.03533.4頭。第122頁,共188頁。三、分層隨機抽樣法分層隨機抽樣法(strat

53、ified random sampling):從各個層次或段落分別進行隨機抽樣或順序抽樣。第123頁,共188頁。分層隨機抽樣有三個步驟:(1)將所調查的總體按變異情況分為相對同質的若干部分、地段等稱為區(qū)層,各區(qū)層可以相等,也可以不等。 (2)獨立地從每一區(qū)層按所定樣本容量進行隨機抽樣。各區(qū)層所抽單位數可以相同,也可以不同。 第124頁,共188頁。抽樣單位總數在各區(qū)層的分配有: 比例配置法:指各區(qū)層大小不同時按區(qū)層在總體中的比例確定抽樣單位數,若各區(qū)層大小相同,比例配置結果實際即為相等配置; 最優(yōu)配置法:指根據各區(qū)層的大小、變異程度以及抽取一個單位的費用綜合權衡,確定出抽樣誤差小、費用低的配

54、置方案。 第125頁,共188頁。(3)根據各區(qū)層的估計值,采用加權法估計總體參數??偲骄鶖?: (154) 總標準誤: 第126頁,共188頁。 若各區(qū)層總體方差相同,則 (15)(156)第127頁,共188頁。若各區(qū)層抽樣單位數按區(qū)層比例配置,則 (157)其中 (158)第128頁,共188頁。四、整群抽樣法整群隨機抽樣法( random group sampling ):被抽取的整群中各抽樣單位都進行調查,按群計算平均數及標準差,并估計其置信限。 第129頁,共188頁。例15.4 設某農場調查水稻螟害發(fā)生情況,在全場100個條田中隨機抽取9條做調查,每田塊采用平行線式取10點,每點

55、連續(xù)查20穴,經初步整理后將結果列于15.2。 某農場螟害率抽樣調查結果田 塊123456789調查莖稈數198020622154251223152098242118672248螟害莖稈數 178 211 335 345 212 238 460 119 298螟害率%8.9910.2315.5513.749.1611.3419.006.3713.25第130頁,共188頁。這資料以條田為抽樣單位進行分析。第131頁,共188頁。全場100條田平均螟害率95%的可能在9.0114.91%范圍內。本例的總體實際上是一個N =100的有限總體,故更確切地應為:即9.1514.77(%)間。第132頁

56、,共188頁。此外,本例是百分數資料,如果田塊間的差異不大,可以采用百分數資料的分析方法,即由總調查莖稈數和總螟害莖稈數求出總螟害率 ,得 這樣, 即11.6912.59(%)。這個區(qū)間比前面所估小得多,這是因為前面以田塊為抽樣單位,而不是以第133頁,共188頁。莖稈為單位,除了有莖稈受害與否的隨機誤差外,還包含有田塊間的差異,所以此處不宜采用百分數的誤差估計方法。第134頁,共188頁。五、分級隨機抽樣法巢式隨機抽樣法(nested random sampling):最簡單的是二級隨機抽樣。例如全區(qū)的棉花結鈴數,可以在區(qū)內隨機抽取幾個鄉(xiāng),鄉(xiāng)內隨機抽取若干戶進行調查。這時,鄉(xiāng)為初級抽樣單位,

57、戶為次級抽樣單位。又例如研究農藥在葉面上的殘留量,第一步隨機抽取單株,第二步在單株上隨機抽取葉片,分別作為初級和次數抽樣單位。第135頁,共188頁。表15.3 某農藥殘留量分析結果及其方差分析 植 株各葉片內的殘留量(單位數)合計平均13.283.093.033.0312.433.1123.523.483.383.3813.763.4432.882.802.812.7611.252.8143.343.383.233.2613.213.30變異來 源自由度均 方所估計的方差分量F植株間 3 MSB=0.2961* 44.9 F0.05(3,12)=3.49株內葉 片間12 MSA=0.0066

58、第136頁,共188頁。巢式隨機抽樣數據可以應用方差分析法算出各階段的抽樣誤差,從而估計平均數的標準誤。二級抽樣的公式如下: (1513)其中,k=初級抽樣單位數,n =次級抽樣單位數。 (1514) 、分別為次級和初級抽樣誤差的估計值。 第137頁,共188頁。二級抽樣的數據按單向分組的組次數相等(也可能不相等)的隨機模型進行方差分析。例題中k=4,n=4,方差分析結果F =0.2961/0.0066=44.9,說明植株間的誤差顯著大于株內葉片間的誤差。這二個階段的抽樣誤差是不同的,應該分別估計。但此處若將kn=44=16張葉片直接計算其方差則為0.0645。比扣除株間誤差后剩余的株內葉片間

59、誤差0.0066大得多。第138頁,共188頁。例15.5 表15.3數據的分析結果:(單位) (單位)2 (單位) (單位) 此處DF=3,因由均方MSB計算。 若只從1個初級單位估計置信限,如以株為單位作估 計,則:第139頁,共188頁。 (單位)2 (單位) (單位)由一株四張葉片估計,比四株16張葉片估計,誤差 要大得多。若每株只取一張葉片,四株共取4張葉片,則第140頁,共188頁。(單位) 所以,同樣測定4張葉片,從1株上取與從4株上取, 抽樣誤差是不同的,今后對此材料抽樣測定時,應多取植株,每株上可以少取一些葉片。第141頁,共188頁。三級抽樣時的情況為: 、 、 依次為三級

60、、二級及一級抽樣單位的抽樣誤差,分別抽取n、k、l個不同級別的抽樣單位,則所獲樣本平均數的抽樣誤差為 獲得后,其總體平均數的置信區(qū)間的計算方法與前相同。(1515)第142頁,共188頁。六、雙重隨機抽樣法雙重抽樣法(double sampling):亦稱相關抽樣法。若所要調查的性狀y是不易觀察測定,甚至對觀察材料要破壞后方能測定的,而試驗又不容許將材料破壞,這時可以利用和所要調查的性狀有密切相關關系的另一便于測定的性狀x進行間接的抽樣調查,按確定的相關關系從x的調查結果推算y 的結果。 第143頁,共188頁。1.做一次隨機抽樣,調查y 和x兩種性狀,從中求出y 依x 的回歸方程。這個樣本容

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論