第7章 擬合優(yōu)度檢驗_第1頁
第7章 擬合優(yōu)度檢驗_第2頁
第7章 擬合優(yōu)度檢驗_第3頁
第7章 擬合優(yōu)度檢驗_第4頁
第7章 擬合優(yōu)度檢驗_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第七章擬合優(yōu)度檢驗

§7.1擬合優(yōu)度檢驗的一般原理

7.1.1什么是擬合優(yōu)度檢驗

擬合優(yōu)度檢驗(goodnessoffittest)是用來檢驗實際觀測數(shù)與依照某種假設(shè)或模型計算出來的理論數(shù)之間的一致性,以便判斷該假設(shè)或模型是否與觀測數(shù)相配合。擬合優(yōu)度檢驗也會出現(xiàn)Ⅰ型錯誤(棄真)和Ⅱ型錯誤(取偽)。下一張

主頁

退出

上一張

該檢驗包括兩種類型:I:檢驗觀測數(shù)與理論數(shù)之間的一致性。II:通過檢驗觀測數(shù)與理論數(shù)之間的一致性來判斷事件之間的獨立性。這兩種類型的問題都是用

2檢驗,但這個

2檢驗與5.1.5所講的

2檢驗是截然不同的,5.1.5的

2檢驗是對一個正態(tài)總體的標準差所作的檢驗。引例:

根據(jù)遺傳學(xué)理論,動物的性別比例是1:1。統(tǒng)計某羊場一年所產(chǎn)的876只羔羊中,有公羔428只,母羔448只。按1:1的性別比例計算,公、母羔均應(yīng)為438只。以A表示實際觀察次數(shù),T表示理論次數(shù),可將上述情況列成表7-1。表7-1羔羊性別實際觀察次數(shù)與理論次數(shù)下一張

主頁

退出

上一張

7.1.2擬合優(yōu)度檢驗的統(tǒng)計量H0:觀測數(shù)與理論分布一致擬合優(yōu)度檢驗的一般做法是:(1)將觀測值分為k種不同類別。(2)共獲得n個獨立觀測值,第i類觀測值的數(shù)目為Oi.

(3)相互獨立自由組合的情況下,第i類的概率為Pi,,上例中,取得第1類的概率為p1=1/2。下一張

主頁

退出

上一張

(4)第i類的期望數(shù)即理論數(shù)為Ti,Ti=npi,上例第1類的理論數(shù)為:T1=876×1/2=438。(5)Oi與Ti進行比較,判斷Oi與Ti之間總的不符合程度是否由于機會所造成的。

為了得到總的不符合程度和相對的不符合程度,以Ti為權(quán)求加權(quán)值,由此得出的統(tǒng)計量為

2:(7.1)下一張

主頁

退出

上一張

當n充分大時,該統(tǒng)計量近似服從

2分布,但要求每一組內(nèi)的理論數(shù)都不得小于5,若理論數(shù)小于5時應(yīng)將相鄰組合并,直到等于或大于5。若總體參數(shù)已知,a=0,自由度df=k-1,若總體參數(shù)未知,需由樣本數(shù)據(jù)做點估計,根據(jù)點估計得出Ti,自由度df=k-1-a,其中a為需要由樣本估計的參數(shù)個數(shù)。當df=1時,(7.1)式應(yīng)做連續(xù)性矯正,矯正的

2為(7.2)下一張

主頁

退出

上一張

2的自由度為df=k-1-a(7.3)拒絕域的確定:P{拒絕H0|H0為真}=P{

2>}=

從而得拒絕域為§7.2擬合優(yōu)度檢驗7.2.1一般程序:(1)按§1.2所介紹的方法對數(shù)據(jù)進行分組(對于離散數(shù)據(jù),組間距通常是1)。(2)根據(jù)總體分布類型和樣本含量n計算理論數(shù)Ti。,,…,下一張

主頁

退出

上一張

(3)有時需用樣本數(shù)據(jù)估計總體參數(shù)。記所估計參數(shù)的個數(shù)為a。(4)分別合并兩個尾區(qū)的理論數(shù),使之不小于5,合并后的組數(shù)記為k。(5)相應(yīng)于(2)的自由度為k-1,相應(yīng)于(3)的自由度為k-1-a。(6)零假設(shè):因為擬合優(yōu)度

2檢驗不是針對總體參數(shù)做檢驗的,因而零假設(shè)不需提出具體參數(shù)值,只需判斷觀測數(shù)是否符合理論數(shù)或某一理論分布。它的零假設(shè)是觀測數(shù)與理論數(shù)相符合,可形象化記為Ho:O-T=0。(7)按(7.1)或(7.2)式計算出

2值并與

2臨界值做比較,當

2>

2a時拒絕Ho;當

2<

2a時接受Ho

下一張

主頁

退出

上一張

7.2.2對二項分布的檢驗1.總體參數(shù)已知例7.1

純合的黃圓豌豆與綠皺豌豆雜交,F1代自交,第二代分離數(shù)目如下:下一張

主頁

退出

上一張

Y_R_Y_rryyR_yyrr總計(黃圓)(黃皺)(綠圓)(綠皺)31510110832556問是否符合自由組合(獨立分配)率?解

當性狀相互獨立時,根據(jù)孟德爾獨立分配律,F2代的表型可由二項分布給出,記顯性性狀出現(xiàn)的概率為,=3/4,因一種表型是由一對等位基因決定的,本例為兩對基因的自由組合,故n=2。根據(jù)二項展開式可以得出理論分離比為:將以上數(shù)據(jù)列成下表

下一張

主頁

退出

上一張

Y_R_Y_rryyR_yyrr實際觀測數(shù)31510110832理論頻率9/163/163/161/16理論數(shù)T312.75104.25104.2534.75O-T2.25-3.253.75-2.75(O-T)25.062510.562514.06257.56250.0160.1010.1350.218X2=0.016+0.101+0.135+0.218=0.470Y_R_:Y_rr:yyR_:yyrr=6/16:3/16:3/16:1/16理論數(shù)Ti均大于5,不需要合并H0:O-T=0,α=0.05因為計算理論數(shù)時參數(shù)=3/4是已知的,并不需要用樣本數(shù)去估計,因此a=0,自由度df=4-1=3。

23,0.05=7.815,

2<

20.05,P>0.05

結(jié)論是接受H0,符合9:3:3:1的分離比。由于df=3,不需要矯正。當df=1時一定要做矯正,否則甚至?xí)玫较喾唇Y(jié)論,見下例。例7.2用正常翅的野生型果蠅(νg+νg+)與殘翅(νg

νg

)的果蠅雜交,F1代均表現(xiàn)正常翅(νg+νg)。F1代自交(νg+νg×νg+νg

),所得F2代中包括311個正常翅(νg+νg+和νg+νg)和81個殘翅(νg

νg

)。問這一分離比是否符合孟德爾3:1的理論比。下一張

主頁

退出

上一張

解計算過程見以下兩表下一張

主頁

退出

上一張

正常翅殘翅總數(shù)實際觀測數(shù)31181392理論數(shù)29498392O-T(未加矯正)17-17(O-T)2289289(O-T)2/T0.9832.949X2=0.983+2.949=3.932H0:O-T=0,a=0.05,df=1,x20.05=3.841,x2>x20.05,p<0.05結(jié)論:正常翅與殘翅的分離比不符合3:1下面計算矯正后的

2正常翅殘翅|O-T|-0.516.516.5(|O-T|-0.5)2272.25272.250.9262.778X2=0.926+2.778=3.704,X2<X20.05,p>0.05結(jié)論:可以認為正常翅與殘翅的分離比例符合3:1從上述結(jié)果可以看出,矯正后的

2比矯正前的低,若未加矯正,就已經(jīng)接受H0,矯正后的

2更低,不會影響結(jié)論,可以不加矯正。若未矯正時

2>

2α,一定要計算矯正的

2。2.總體參數(shù)未知調(diào)查到幼兒園接小孩的家長性別,以10人為一組,記錄每組女性人數(shù),共得到100組數(shù)據(jù),列在表7-1中的第2列。問女性家長人數(shù)是否符合二項分布。根據(jù)常識,人群中男女性人數(shù)應(yīng)各占一半,但是去幼兒園接小孩的家長中男女性是否各占一半并不一定。因此二項分布的參數(shù)

未知,需由樣本數(shù)據(jù)估計。

=0.59

下一張

主頁

退出

上一張

展開二項式(0.41+0.59)10得到表7-1的第4列理論頻率p(

i),根據(jù)Ti=Np(

)求出理論數(shù),列在第5列。第5列的前4個數(shù)都小于5,應(yīng)當合并,合并后的值為6.25。最后的2個數(shù)也都小于5,合并后仍小于5,所以將最后3個數(shù)合并,合并后的值為15.17。相應(yīng)的觀測數(shù)也應(yīng)做類似的合并。合并后的k=6。參數(shù)是用樣本數(shù)據(jù)估計的,因而a=1,自由度df=6-1-1=4。

從附表6中查出和

24,0.05=9.488,

42<

24,0.05,p>0.05.接受H0:O-T=0的假設(shè)。

結(jié)論是女性家長人數(shù)符合二項分布。下一張

主頁

退出

上一張

7.2.3對正態(tài)性的檢驗表7-2給出了1000個調(diào)查數(shù)據(jù),表的第1列為組限,第2列為實際觀測數(shù),總體平均數(shù)μ和總體方差σ2是未知的,觀測數(shù)的正態(tài)性看上去是很好的,兩頭少,中間多,兩側(cè)基本對稱。為了得到正態(tài)性的確切判斷必須進行嚴格的檢驗。下一張

主頁

退出

上一張

根據(jù)7.2.1所介紹的一般程序首先對數(shù)據(jù)進行分組,實際上表7-2已經(jīng)分好,共分10組,10個組依次編碼為0~9,稱為編碼變量(codedvariable),記為Vi,由編碼變量及觀測數(shù)可以計算出編碼變量的平均數(shù)和標準差sv(見表7-2的下半部)。第4列為Vi的組界。下面以和sv(作為正態(tài)分布的兩個參數(shù)計算每一組界的標準化值(u),并計算出累積概率(u

)。為什么要以組界為上限計算累積概率呢?在這里有必要做一些解釋。在例1.2中講過繪制直方圖時是以組界為分界的,在兩個組界內(nèi)包含這一組所有可能的值,例如第1組的組限是3.92~3.96,它的實際值x1可能是3.915≤x1<3.965的那些值,而第2組的實際值x2可能是3.965≤x2<4.015的那些值。為了求得某一區(qū)間內(nèi)的曲線下面積,根據(jù)3.4.3給出的關(guān)系:P(u1<V<u2)=便可求出每一區(qū)間的概率值,再乘以觀測總數(shù)n,而得到理論數(shù)Ti。如第一組的理論數(shù)T1=1000(0.0157)=15.7,第二組的理論數(shù)T2=1000(0.0568-0.0157)=41.1。依次類推。得到理論數(shù)后,代入(7.1)式得到

2=29.2總體的兩個參數(shù)μ和σ分別是由和sv估計的,因此自由度df=10-1-2=7,從附表6中查出χ27,0.05=14.067,χ27>χ27,0.05即p<0.05。因此拒絕H0:O-T=0的假設(shè)。該分布不符合正態(tài)分布。下一張

主頁

退出

上一張

7.2.4其他類型問題的檢驗上面僅舉出了對二項分布和正態(tài)分布的檢驗,對于其他類型的分布,如泊松分布、Γ分布等都可以用類似方法做檢驗。有時理論數(shù)是由某一模型或某一理論得到的,也同樣可以使用χ2某檢驗推斷實際觀測數(shù)與理論數(shù)之間的擬合程度。方法大同小異,這里不再一一舉例了。下一張

主頁

退出

上一張

§7.3獨立性檢驗7.3.1列聯(lián)表χ2檢驗列聯(lián)表(contingencytable)χ2檢驗是另一類型的χ2檢驗,可以用它檢驗事件的獨立性或者說檢驗處理之間的差異顯著性。下面舉例說明列聯(lián)表χ2檢驗的一般原理。例7.3表7-3是不同給藥方式與給藥效果表。給藥方式有效(A)無效()總數(shù)有效率口服(B)58409859.2%注射()64319567.4%總數(shù)12271193問:口服給藥與注射給藥的效果有無差異?處理這類問題時,一般做法如下:考慮樣本中的各處理之間是否有關(guān)聯(lián),根據(jù)它們之間無關(guān)聯(lián)的假設(shè)計算理論數(shù),在一定的自由度下對顯著性水平α作推斷,若拒絕無關(guān)聯(lián)的假設(shè),則說明不同處理之間有關(guān)聯(lián),不同處理產(chǎn)生不同效果,或者說處理之間的差異是顯著的。這種檢驗也稱為獨立性檢驗(independencetest)。表7-3稱為2×2列聯(lián)表(2×2contingencytable)。2×2列聯(lián)表的χ2檢驗一般需經(jīng)以下各步:下一張

主頁

退出

上一張

(1)提出零假設(shè):認為有效或無效與給藥方是無關(guān)聯(lián)。實際觀測的結(jié)果與在兩者之間并無關(guān)聯(lián)的前提下,從理論上推導(dǎo)出的理論數(shù)之間無差異。即H0:O-T=0。(2)根據(jù)概率乘法法則(見2.1.5),若事件A和事件B是相互獨立的,或者說它們之間并無關(guān)聯(lián),這是事件A和事件B同時出現(xiàn)的概率等于它們分別出現(xiàn)是概率的乘積P(AB)=P(A)P(B)例7.3的零假設(shè)是給藥方式與給藥效果之間無關(guān)聯(lián),則口服與有效同時出現(xiàn)的理論頻率應(yīng)為口服的頻率與有效的頻率的乘積,P(AB)=P(A)P(B)=其理論數(shù)T1由理論頻率乘以總數(shù)得出,T1=(193)==61.15。同樣可以計算出另外3種情況的理論數(shù)。(3)如吻合度檢驗?zāi)菢佑嬎?/p>

2值,若

2<

2α,則觀測數(shù)與理論數(shù)是一致的,給藥方式與給藥效果間無關(guān)聯(lián)的假設(shè)可以成立。若

2>

α2,則觀測數(shù)與理論數(shù)不一致,說明給藥方式與給藥效果間是有關(guān)聯(lián)的,不同的給藥方式產(chǎn)生不同的效果。下一張

主頁

退出

上一張

(4)確定自由度:2×2列聯(lián)表的自由度是(r-1)(c-1)或者寫成(行-1)(列-1)。因為每一行的各理論數(shù)受該行總數(shù)的約束,每一列的各理論數(shù)受該列總數(shù)的約束,所以總的自由度只有(r-1)(c-1)。2×2列聯(lián)表的χ2檢驗與吻合度檢驗一樣,理論數(shù)不得小于5,當理論數(shù)小于5時,應(yīng)使用另外的方法計算(見7.3.2)。

下面計算例7.3的χ2并作推斷。首先計算各格的理論數(shù),從表7-4總可以看出,任何一格的理論數(shù)等于這格所在的行總數(shù)乘以這格所在的列總數(shù),再除以總數(shù)。在實際計算時,算出T1以后,可以用列總數(shù)減去T1得T3,用行總數(shù)減去T1得T2,列總數(shù)減去T2得T4。有效無效總數(shù)口服O1=58O2=40T1==61.95T2==36.0598注射O3=64O4=3195T3==60.05T4==34.95總數(shù)12271193表7-422列聯(lián)表理論數(shù)的計算

χ2===0.252+0.433+0.260+0.446=1.391H0:O-T=0,a=0.05,df==1下一張

主頁

退出

上一張

結(jié)論是用口服方式給藥與注射方式給藥的效果沒有顯著不同。因為已經(jīng)接受H0,不必再矯正。雖然在生物學(xué)問題中,經(jīng)常遇到的是2×2列聯(lián)表,但有時還會遇到行數(shù)與列數(shù)都大于2的情況,這是稱為r×c列聯(lián)表(r×ccontingencytable),其理論數(shù)的計算仍為:例7.4用40Kr+N2,40Kr,25Kr的γ射線照射“天津一號”大麥。將處理后的種子做根尖壓片

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論