版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1概率論與數(shù)理統(tǒng)計(jì)2第八章 假設(shè)檢驗(yàn)35 樣本容量的選取4以上我們?cè)谶M(jìn)行假設(shè)檢驗(yàn)時(shí), 總是根據(jù)問(wèn)題的要求, 預(yù)先給出顯著性水平以控制犯第I類(lèi)錯(cuò)誤的概率. 而犯第II類(lèi)錯(cuò)誤的概率則依賴(lài)于樣本的容量的選擇. 在一些實(shí)際問(wèn)題中, 我們除了希望控制犯第I類(lèi)錯(cuò)誤的概率外, 往往還希望控制犯第II類(lèi)錯(cuò)誤的概率. 在這一節(jié), 我們將闡明如何選取樣本的容量使得犯第II類(lèi)錯(cuò)誤的概率控制在預(yù)先給定的限度之內(nèi). 為此, 我們引入施行特征函數(shù).5定義 若C是參數(shù)q的某檢驗(yàn)問(wèn)題的一個(gè)檢驗(yàn)法, b(q)=Pq接受H0(5.1)稱(chēng)為檢驗(yàn)法C的施行特征函數(shù)或OC函數(shù), 其圖形稱(chēng)為OC曲線.6b(q)=Pq接受H0(5.1)
2、由定義知, 若此檢驗(yàn)法的顯著性水平為a, 則當(dāng)真值qH0時(shí), b(q)就是作出正確判斷(即H0為真時(shí)接受H0)的概率, 故此時(shí)b(q)1-a; 而當(dāng)qH1時(shí), 則b(q)就是犯第II類(lèi)錯(cuò)誤的概率, 而1-b(q)是作出正確判斷(即H0為不真時(shí)拒絕H0)的概率. 函數(shù)1-b(q)稱(chēng)為檢驗(yàn)法C的功效函數(shù). 當(dāng)q*H1時(shí), 值1-b(q*)稱(chēng)為檢驗(yàn)法C在點(diǎn)q*的功效, 它表示當(dāng)參數(shù)q的真值為q*時(shí), 檢驗(yàn)法C作出正確判斷的概率.我們只介紹正態(tài)總體均值檢驗(yàn)的OC函數(shù).71, Z檢驗(yàn)法的OC函數(shù)右邊檢驗(yàn)問(wèn)題. H0:mm0, H1:mm0的OC函數(shù)是00( )()/XPHPznmmamb m- - 接受
3、0()/- - -XPzznnmaammm0(5.2)/nmm- - 8b(m)=(za-)的圖形.1abOb(m)m0m0+dm9由b(m)的連續(xù)性可知, 當(dāng)參數(shù)的真值m(mm0)在m0附近時(shí), 檢驗(yàn)法的功效很低, 即b(m)的值很大, 亦即犯第II類(lèi)錯(cuò)誤的概率很大. 因?yàn)閍通常取得比較小, 而不管多么小, n多么大, 只要n給定, 總存在m0附近的點(diǎn)m(mm0)使b(m)幾乎等于1-a.這表明, 無(wú)論n取多么大, 要想對(duì)所有mH1都控制第II類(lèi)錯(cuò)誤的概率都很小是不可能的. 但可規(guī)定一個(gè)正數(shù)d0, 使當(dāng)真值mm0+d時(shí), 犯第II類(lèi)錯(cuò)誤的概率不超過(guò)給定的b, 以此標(biāo)準(zhǔn)來(lái)確定樣本容量n.10當(dāng)
4、mm0+d時(shí)有b(m0+d)b(m).或者說(shuō)只要?jiǎng)t當(dāng)mH1且mm0+d時(shí), 即真值(mm0+d)時(shí)犯第II類(lèi)錯(cuò)誤的概率不超過(guò)b.(/)znab mdd b-0于是只要(+ )=亦即只要n滿(mǎn)足/znzabd - - -即可()(5.3)zznabd 11類(lèi)似地, 可得左邊檢驗(yàn)問(wèn)題H0:mm0, H1:mm0的OC函數(shù)為當(dāng)真值mm0時(shí)b(m)為作出正確判斷的概率; 當(dāng)真值m0)時(shí), 犯第II類(lèi)錯(cuò)誤的概率不超過(guò)給定的b.0( )(),(5.4)/znammb m- - ()(5.5)zznabd 12雙邊檢驗(yàn)問(wèn)題H0:m=m0, H1:mm0的OC函數(shù)是13在雙邊檢驗(yàn)問(wèn)題中, 若要求對(duì)H1中滿(mǎn)足|m
5、-m0| d0的m處函數(shù)值b(m)b, 需要解方程才能確定n. 通常因n較大, 故總可以認(rèn)為14即只要n滿(mǎn)足就能使當(dāng)mH1且|m-m1|d(d0), 為取定的值)時(shí), 犯第II類(lèi)錯(cuò)誤的概率不超過(guò)給定的值b.15例1 (工業(yè)產(chǎn)品質(zhì)量抽驗(yàn)方案)設(shè)有一大批產(chǎn)品, 產(chǎn)品質(zhì)量指標(biāo)XN(m,2). 以m小者為佳, 廠方要求所確定的驗(yàn)收方案對(duì)高質(zhì)量的產(chǎn)品(mm0)能以高概率1-a為買(mǎi)方所接受. 買(mǎi)方則要求低質(zhì)產(chǎn)品(mm0d, d0)能以高概率1-b被拒絕. a,b由廠方與買(mǎi)方協(xié)商給出. 并采取一次抽樣以確定該批產(chǎn)品是否為買(mǎi)方所接受. 問(wèn)應(yīng)怎樣安排抽樣方案. 已知m0=120, d=20, 且由工廠長(zhǎng)期經(jīng)驗(yàn)知
6、2=900. 又經(jīng)商定a,b均取為0.05.16解 檢驗(yàn)問(wèn)題可表達(dá)為H0:mm0, H1:mm0, 拒絕域?yàn)榘?5.3)式得按給定的數(shù)據(jù)算得n24.35, 故取n=25. 且算出當(dāng)x129.87時(shí), 買(mǎi)方就拒絕這批產(chǎn)品, 而當(dāng)x m0的t檢驗(yàn)法的OC函數(shù)是其中變量稱(chēng)它服從非中心參數(shù)為,自由度為n-1的非中心t分布.20若給定a,b以及d0, 可從書(shū)末附表7查得所需容量n, 使得當(dāng)mH1且(m-m0)/d時(shí)犯第II類(lèi)錯(cuò)誤的概率不超過(guò)b.若給定a,b及d0,對(duì)于左邊檢驗(yàn)問(wèn)題H0:mm0, H1:m68.(1) 要求在H1中mm1=68+時(shí)犯第II類(lèi)錯(cuò)誤的概率不能超過(guò)b=0.05. 求所需的樣本容量
7、.(2) 若樣本容量為n=30, 問(wèn)在H1中m=m1=68+0.75時(shí)犯第II類(lèi)錯(cuò)誤的概率是多少?解 (1)此處a=b=0.05, m0=68, d=(m1-m0)/=1, 查附表7得n=13.(2) 現(xiàn)在a=0.05, n=30, d=(m1-m0)/=0.75, 查附表7, 得b=0.01.22例3 考慮在顯著性水平a=0.05下進(jìn)行t檢驗(yàn)H0:m=14, H1:m14.要求在H1中|m-14|/0.4時(shí)犯第II類(lèi)錯(cuò)誤的概率不超過(guò)b=0.1, 求所需樣本容量.解 此處a=0.05, b=0.1, d=0.4, 查表得n=68.23在實(shí)際過(guò)程中經(jīng)常是未知, 則先做n1次試驗(yàn), 計(jì)算出樣本方差
8、S2作為2的估計(jì), 然后根據(jù)此估計(jì)值和給定的a,b,|m1-m2|的值查表獲得一個(gè)容量數(shù)n2, 如果n2小于n1, 則用已經(jīng)獲得的數(shù)據(jù)進(jìn)行檢驗(yàn)就足夠了, 而如果n2大于n1, 則再補(bǔ)做n2-n1次試驗(yàn), 獲得的n2個(gè)樣本的樣本方差作為2的估計(jì), 再去查表獲得正確的樣本容量n3, 這樣重復(fù)下去很快就能夠找到所求的樣本容量n.24現(xiàn)考慮兩個(gè)正態(tài)總體均值差的t檢驗(yàn).若兩個(gè)正態(tài)總體N(m1,12), N(m2,22)中12=22=2而2未知. 在均值差m1-m2的檢驗(yàn)問(wèn)題H0:m1-m2=0, H1:m1-m20(或H0:m1-m20, H1:m1-m20或H0:m1-m20,H1:m1-m20, 并
9、要求在mA-mB 5時(shí), 犯第II類(lèi)錯(cuò)誤的概率不超過(guò)b=0.01.所取的樣本容量為nA=nB=12, 且有xA=80.83, xB=78.67, s2A=5.61, s2B=6.06. 經(jīng)水平為0.1的F檢驗(yàn)知, 可認(rèn)為兩總體的方差相等, 即有27而右邊檢驗(yàn)的拒絕域?yàn)橛蓸颖居^察值算得t=2.192.5083, 故接受H0, 即采用B種燃料.286 分布擬合檢驗(yàn)29上面介紹的各種檢驗(yàn)法都是在總體分布形式為已知的前提下進(jìn)行討論的. 但在實(shí)際問(wèn)題中, 有時(shí)不能知道總體服從什么類(lèi)型的分布, 這時(shí)就需要根據(jù)樣本來(lái)檢驗(yàn)關(guān)于分布的假設(shè). 本節(jié)介紹c2擬合檢驗(yàn)法和專(zhuān)用于檢驗(yàn)分布是否為正態(tài)的 偏度,峰度檢驗(yàn)法.
10、30(一)c2擬合檢驗(yàn)法 這是在總體未知時(shí), 根據(jù)樣本X1,X2,.,Xn來(lái)檢驗(yàn)關(guān)于總體分布的假設(shè)H0:總體X的分布函數(shù)為F(x),H1:總體X的分布函數(shù)不是F(x), (6.1)的一種方法.注意, 若總體X為離散型則(6.1)中的H0相當(dāng)于H0:總體X的分布律為P(X=ti)=pi,i=1,2,. (6.2)若總體X為連續(xù)型, 則(6.1)中的H0相當(dāng)于H0:總體X的概率密度為f(x). (6.3)31先設(shè)H0中所假設(shè)的X的分布函數(shù)F(x)不含未知參數(shù). 將在H0下, X可能值的全體W分成k個(gè)兩兩不相交的子集A1,A2,.,Ak.以fi(i=1,2,.,k)記樣本觀察值x1,x2,.,xn中
11、落在Ai中的個(gè)數(shù), 這表示在n次試驗(yàn)中事件Ai發(fā)生的頻率為fi/n, 另一方面, 當(dāng)H0為真時(shí), 我們可以根據(jù)H0所假設(shè)的X的分布函數(shù)來(lái)計(jì)算事件Ai的概率, 得到pi=P(Ai), i=1,2,.,k. 頻率fi/n與概率pi會(huì)有差異, 但一般來(lái)說(shuō), 若H0為真, 且試驗(yàn)的次數(shù)又甚多時(shí), 這種差異不應(yīng)太大, 因此(fi/n-pi)2不應(yīng)太大.32我們采用形如的統(tǒng)計(jì)量來(lái)度量樣本與H0中所假設(shè)的分布的吻合程度, 其中hi(i=1,2,.,k)是給定的常數(shù). 皮爾遜證明, 如果選取hi=n/pi(i=1,2,.,k)則(6.4)式定義的統(tǒng)計(jì)量近似服從c2分布. 于是, 我們采用.作為檢驗(yàn)統(tǒng)計(jì)量216
12、 4()( . ) - - niiiifhpn33當(dāng)H0中所假設(shè)的X的分布函數(shù)F(x)中包含未知參數(shù)時(shí), 需要先利用樣本求出未知參數(shù)的最大似然估計(jì)(在H0下), 以估計(jì)值作為參數(shù)值, 然后根據(jù)H0中所假設(shè)的分布函數(shù), 求出pi的估作為檢驗(yàn)統(tǒng)計(jì)量.34定理 若n充分大(n50), 則當(dāng)H0為真時(shí), 統(tǒng)計(jì)量(6.5)近似地服從c2(k-1)分布; 而統(tǒng)計(jì)量(6.6)近似地服從c2(k-r-1)分布, 其中r是被估計(jì)的參數(shù)的個(gè)數(shù).因此當(dāng)H0為真時(shí)(6.5)或(6.6)所示的c2不應(yīng)太大, 如c2過(guò)分大就拒絕H0, 因而拒絕域的形式為c2G (G為正常數(shù)).對(duì)于給定的顯著性水平a, 確定G使35由定理
13、得即當(dāng)樣本觀察值使(6.5)或(6.6)的c2值有則在顯著性水平a下拒絕H0, 否則就接受H0, 這就是c2擬合檢驗(yàn)法36c c2擬合檢驗(yàn)法是基于上述定理得到的擬合檢驗(yàn)法是基于上述定理得到的, 所以在所以在37例1 在一實(shí)驗(yàn)中, 每隔一定時(shí)間觀察一次由某種鈾所放射的到達(dá)計(jì)數(shù)器上的a粒子數(shù)X, 共觀察了100次, 得結(jié)果如下表所示:i012345678910 1112fi1516 17 26 119921210AiA0A1A2A3A4A5A6A7A8A9A10A11A12其中fi是觀察到有i個(gè)a粒子的次數(shù), 在水平a=0.05下檢驗(yàn)假設(shè)H0:總體X服從泊松分布:,0,1,2,!iP Xieii-
14、38解 因在H0中參數(shù)未具體給出, 所以先估計(jì),下, X所有可能取的值為W=0,1,2,., 將W分成前表所示的兩兩不相交子集A1,A2,.,A12, 則PX=i有估計(jì)39c2擬合檢驗(yàn)計(jì)算表Aifipi估值npi估值fi2/npiA0160.0150.0781.57.84.615A150.0636.3A2160.13213.219.394A3170.18518.515.622A4260.19419.434.845A5110.16316.37.423A690.11411.47.105A790.0696.911.739A8260.0360.0653.66.55.538=106.281A910.01
15、71.7A1020.0070.7A1110.0030.3A1200.0020.340并組后k=8, 但因在計(jì)算概率時(shí), 估計(jì)了一個(gè)參數(shù), 故r=1, c2的自由度為8-1-1=6.現(xiàn)在c2=106.281-100=6.28112.592, 故在水平0.05下接受H0, 即認(rèn)為樣本來(lái)自泊松分布總體. 也就是說(shuō)認(rèn)為理論上的結(jié)論是符合實(shí)際的.41例2 至1965年1月1日至1971年2月9日共2231天中, 全世界記錄到里氏震級(jí)4級(jí)和4級(jí)以上地震計(jì)162次, 統(tǒng)計(jì)如下:(x-相繼兩次地震間隔天數(shù), f-出現(xiàn)的頻數(shù))x0-45-910-1415-1920-2425-2930-3435-3940f503
16、12617108668*試檢驗(yàn)相繼兩次地震間隔的天數(shù)X服從指數(shù)分布(a=0.05).*-8個(gè)數(shù)值是40,43,44,49,58,60,81,109.42解 按題意需檢驗(yàn)假設(shè):H0: X的概率密度為在這里, H0中的參數(shù)q未給出, 先由最大似然下, X可能取值的全體W為區(qū)間0,). 將區(qū)間分為k=9個(gè)不重疊的小區(qū)間:A1=0,4.5, A2=(4.5,9.5,.,A9=(39.5,).43若H0為真, X的分布函數(shù)的估計(jì)為由上式可得概率pi=P(Ai)的估計(jì):44例2的c2檢驗(yàn)計(jì)算表Aifipi估計(jì)npifi2/npiA1:0 x4.550 0.278845.165655.3519A2:4.5x
17、9.531 0.219635.575227.0132A3:9.5x14.526 0.152724.737427.3270A4:14.5x19.517 0.106217.204416.7980A5:19.5x24.510 0.073911.97188.3530A6:24.5x29.580.05148.32687.6860A7:29.5x34.560.03585.79966.2073A8:34.5x39.560.02484.017613.219214.8269A9:39.5x80.05689.2016=163.563345現(xiàn)在c2=163.5633-162=1.5633, 因?yàn)楣试谒?.05下接
18、受H0, 認(rèn)為X服從指數(shù)分布.46例3 下面列出64個(gè)伊特拉斯坎人男子的頭顱的最大寬度(mm), 檢驗(yàn)這些數(shù)據(jù)是否來(lái)自正態(tài)總體(取a=0.1)1411481321381541421501461551581501401471481441501491451491581431411441441261401441421411401451351471461411361401461421371481541371391431401311431411491481351481521443144141143147146150132142142143153149146149138142149142137134144
19、14614714014214013715214547解 為了粗略了解這些數(shù)據(jù)的分布情況, 我們先根據(jù)所給數(shù)據(jù)畫(huà)出直方圖.上述數(shù)據(jù)的最小值, 最大值分別為126,158, 即所有數(shù)據(jù)落在區(qū)間126,158上, 現(xiàn)取區(qū)間124.5, 159.5, 它能覆蓋區(qū)間126,158. 將此區(qū)間等分為7個(gè)小區(qū)間, 小區(qū)間的長(zhǎng)度記為D, D=(159.5-124.5)/7=5. D稱(chēng)為組距. 小區(qū)間的端點(diǎn)稱(chēng)為組限. 數(shù)出落在每個(gè)小區(qū)間內(nèi)的數(shù)據(jù)的頻數(shù)fi, 算出頻率fi/n(n=84, i=1,2,.,7).48列出下表:組限頻數(shù)fi頻率fi/n累積頻率124.5-129.510.01190.0119129.5
20、-134.540.04760.0595134.5-139.5100.11910.1786139.5-144.5330.39290.5715144.5-149.5240.28570.8572149.5-154.590.10710.9524154.5-159.530.0357149繪出的直方圖如下129.5 134.5 139.5 144.5 149.5 154.5 159.550從直方圖看樣本很象來(lái)自正態(tài)總體. 現(xiàn)作c2擬合檢驗(yàn)如下. 即需檢驗(yàn)假設(shè)H0: X的概率密度為因H0未給出m,2的數(shù)值, 需先估計(jì)m,2, 由最大似然估計(jì)法得m,2的估計(jì)值分別為將在H0下X可能取值的區(qū)間(-,)分為7個(gè)小
21、區(qū)間A1,A2,.,A7. 51若H0為真, X的概率密度的估計(jì)為按上式查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表即可得概率P(Ai)的估計(jì), 例如52例3的c2檢驗(yàn)計(jì)算表Aifipinpifi2/npiA1:x129.510.0087 0.735.094.91A2:129.5x134.540.0519 4.36A3:134.5x139.510 0.1752 14.726.79A4:139.5x144.533 0.3120 26.2141.55A5:144.5x149.524 0.2811 23.6124.40A6:149.5x154.590.133611.2214.3710.02A3:154.5x30.0375
22、3.15=87.6753現(xiàn)在c2=87.67-84=3.67, 因?yàn)楣试谒?.1下接受H0, 即認(rèn)為數(shù)據(jù)來(lái)自正態(tài)分布總體.54例4 一農(nóng)場(chǎng)10年前在一魚(yú)塘里按比例20:15:40:25投放了四種魚(yú):鮭魚(yú),鱸魚(yú),竹夾魚(yú)和鲇魚(yú)的魚(yú)苗. 現(xiàn)在在魚(yú)塘里獲得一樣本如下:序號(hào)1234種類(lèi)鮭魚(yú)鱸魚(yú)竹夾魚(yú)鲇魚(yú)數(shù)量(條)132100200168=600試取a=0.05檢驗(yàn)各類(lèi)魚(yú)數(shù)量的比例較10年前是否有顯著改變.55解 以X記魚(yú)種類(lèi)的序號(hào), 按題意需檢驗(yàn)假設(shè):H0:X的分布律為25. 040. 015. 020. 04321ipX所需計(jì)算列表如下(n=600):Aifipinpifi2/npiA11320.2
23、0120145.20A21000.1590111.11A32000.40240166.67A41680.25150188.16=611.1456現(xiàn)在c2=611.14-600=11.14, k=4, r=0, 故拒絕H0, 認(rèn)為各魚(yú)類(lèi)數(shù)量之比較10年前有顯著改變.57(二)偏度,峰度檢驗(yàn) 根據(jù)中心極限定理的論據(jù)知識(shí), 正態(tài)分布的隨機(jī)變量是較廣泛地存在的, 因此, 當(dāng)研究一連續(xù)型總體時(shí), 人們往往先考察它是否服從正態(tài)分布. 上面介紹的c2擬合檢驗(yàn)法雖然是檢驗(yàn)總體分布的較一般的方法, 但用它來(lái)檢驗(yàn)總體的正態(tài)性時(shí), 犯第II類(lèi)錯(cuò)誤的概率往往較大. 為此, 統(tǒng)計(jì)學(xué)家對(duì)檢驗(yàn)正態(tài)總體的種種方法進(jìn)行了比較,
24、 最后發(fā)現(xiàn), 以偏度,峰度檢驗(yàn)法較為有效, 在這里進(jìn)行介紹.58隨機(jī)變量X的偏度和峰度指的是X的標(biāo)準(zhǔn)化變量的三階矩和四階矩:當(dāng)X服從正態(tài)分布時(shí), n1=0且n2=3.59設(shè)X1,X2,.,Xn是來(lái)自總體X的樣本, 則n1,n2的矩估計(jì)量分別是其中Bk(k=2,3,4)是樣本k階中心矩, 并分別稱(chēng)G1,G2為樣本偏度和樣本峰度.若總體X為正態(tài)變量, 則可證當(dāng)n充分大時(shí), 近似地有60設(shè)X1,X2,.,Xn是來(lái)自總體X的樣本, 現(xiàn)在來(lái)檢驗(yàn)假設(shè) H0:X為正態(tài)總體. 記當(dāng)H0為真且n充分大時(shí), 近似地有U1N(0,1), U2N(0,1).因G1,G2依概率收斂于n1,n2, 因此一般來(lái)說(shuō)G1與n1
25、=0,G2與n2=3的偏離不應(yīng)太大.61故從直觀來(lái)看當(dāng)|U1|的觀察值|u1|或|U2|的觀察值|u2|過(guò)大時(shí)就拒絕H0, 取顯著性水平為a, H0的拒絕域?yàn)閨u1|k1 或 |u2|k2, (6.11)其中k1,k2由以下兩式確定:即有k1=za/4,k2= za/4. 于是得拒絕域?yàn)閨u1|za/4 或 |u2|za/4, (6.12)62下面來(lái)驗(yàn)證當(dāng)n充分大時(shí)上述檢驗(yàn)法近似地滿(mǎn)足顯著性水平為a的要求. 事實(shí)上當(dāng)n充分大時(shí)有63例5 試用偏度,峰度檢驗(yàn)法檢驗(yàn)例3中的數(shù)據(jù)是否來(lái)自正態(tài)總體(取a=0.1).解 現(xiàn)在來(lái)檢驗(yàn)假設(shè)H0:數(shù)據(jù)來(lái)自正態(tài)總體.這里a=0.1, n=84, 64下面來(lái)計(jì)算樣
26、本中心矩B2,B3,B4, 計(jì)算時(shí)可利用以下關(guān)系式:經(jīng)計(jì)算得A1=143.7338, A2=20706.13, A3=2987099, A4=4.316426108, B2=35.2246, B3-28.5, B4=3840.65樣本偏度和樣本峰度的觀察值分別為g1-0.1363, g2=3.0948而za/4=z0.025=1.96. 由(6.11)式, 拒絕域?yàn)閨u1|=|g1/1|1.96 或 |u2|=|g2-m2|/21.96.現(xiàn)算得|u1|=0.52851.96, |u2|=0.33811.96, 故接受H0, 認(rèn)為數(shù)據(jù)來(lái)自正態(tài)分布的總體.上述檢驗(yàn)法稱(chēng)為偏度,峰度檢驗(yàn)法. 使用這一
27、檢驗(yàn)法時(shí)樣本容量以大于100為宜.667 秩和檢驗(yàn)67本節(jié)介紹一種有效的, 且使用方便的檢驗(yàn)方法秩和檢驗(yàn)法.設(shè)有兩個(gè)連續(xù)型總體, 它們的概率密度函數(shù)分別為f1(x), f2(x), 均為未知, 但已知f1(x)=f2(x-a), a為未知常數(shù), (7.1)即f1與f2至多只差一平移. 我們要檢驗(yàn)下述各項(xiàng)假設(shè)H0:a=0, H1:a0.(7.3)H0:a=0, H1:a0.(7.4)68特別, 若總體的均值存在, 分別記作m1, m2, 則由于f1,f2至多只差一平移, 故有m1=m1-a.此時(shí), 上述各項(xiàng)假設(shè)分別等價(jià)于H0:m1=m2, H1:m1m2.(7.3)H0:m1=m2, H1:m1
28、m2.(7.4)現(xiàn)在來(lái)介紹威爾柯克斯(Frank wilcoxon)提出的秩和檢驗(yàn)法以檢驗(yàn)上述假設(shè). 為此, 先引入秩的概念.69秩 設(shè)X為一總體, 將一容量為n的樣本觀察值按自小到大的次序編號(hào)排成x(1)x(2).x(n),(7.5)稱(chēng)x(i)的足標(biāo)i為x(i)的秩, i=1,2,.,.現(xiàn)設(shè)自1,2兩總體分別抽取容量為n1,n2的樣本, 且設(shè)兩樣本獨(dú)立, 這里總假定n1n2. 將這n1+n2個(gè)觀察值放在一起, 按自小到大的次序排列, 求出每個(gè)觀察值的秩, 然后將屬于第1個(gè)總體的樣本觀察值的秩相加, 其和記為R1, 稱(chēng)為第1樣本的秩和. 其余觀察值的秩的總和記作R2, 稱(chēng)為第2樣本的秩和. 顯
29、然R1,R2是隨機(jī)變量70例如, 假設(shè)來(lái)自?xún)蓚€(gè)總體的兩個(gè)樣本觀察值為:樣本1:23, 48, 10. n1=3.樣本2: 11, 45, 50, 2. n2=4.排序得:2, 10, 11, 23, 45, 48, 50(1),(2),(3),(4), (5),(6),(7).則r1=2+4+6=12r2=1+3+5+7.71R1,R2滿(mǎn)足:所以R1,R2中的任一個(gè)確定后另一個(gè)隨之確定. 這樣, 只要考慮統(tǒng)計(jì)量R1即可.現(xiàn)在來(lái)解決雙邊檢驗(yàn)問(wèn)題(7.4). 對(duì)此, 先作直觀分析. 當(dāng)H0為真時(shí), 即有f1(x)=f2(x), 這時(shí)兩個(gè)獨(dú)立樣本實(shí)際上來(lái)自同一總體. 因而第1個(gè)樣本中諸元素的秩應(yīng)該隨
30、機(jī)地, 分散地在自然數(shù)1n1+n2中取值, 一般來(lái)說(shuō)不應(yīng)過(guò)分集中取較小的或較大的值.72考慮到即知當(dāng)H0為真時(shí)秩和R1一般來(lái)說(shuō)不應(yīng)取太靠近上述不等式兩端的值. 因而, 當(dāng)R1的觀察值r1過(guò)分大或過(guò)分小時(shí), 我們都拒絕H0. 據(jù)以上分析, 對(duì)于雙邊檢驗(yàn)(7.4), 在給定顯著性水平a下, H0的拒絕域?yàn)?374如果知道R1的分布, 則臨界點(diǎn)是不難求得的. 下面以n1=3, n2=4為例說(shuō)明求臨界點(diǎn)的方法.當(dāng)n1=3, n2=4時(shí), 第1個(gè)樣本中各觀察值的秩的不同取法共有35種, 列表如下:秩R1秩R1秩R1秩R1秩R1123613610167142471335614124713711234925
31、61335715125814510235102571436716126914611236112671545615127101471223712345124571613481561224511346134671713591571324612347145671875由于這35種情況的出現(xiàn)是等可能的, 由上表容易求得R1的分布律和分布函數(shù)如下:R16789101112PR1=r11/35 1/35 2/35 3/35 4/35 4/35 5/35PR1r11/35 2/35 4/257/3511/35 15/35 20/35R1131415161718PR1=r14/35 4/35 3/25 2/3
32、5 1/35 1/35PR1r124/35 28/35 31/35 34/35176于是, 對(duì)于不同的a值, 容易寫(xiě)出檢驗(yàn)問(wèn)題(7.4)的臨界點(diǎn)和拒絕域. 例如, 給定a=0.2. 由上表知即有CU(0.1)=7, CL(0,1)=17. 故當(dāng)n1=3, n2=4, 在水平0.2下檢驗(yàn)問(wèn)題(7.4)的拒絕域?yàn)閞17 或 r117.此時(shí), 犯第I類(lèi)錯(cuò)誤的概率為 Pa=0R17+Pa=0R117=2/35+2/35=0.114.77類(lèi)似地可得左邊檢驗(yàn)(7.2)的拒絕域?yàn)?顯著性水平為a)r1CU(a),此處, 臨界點(diǎn)CU(a)是滿(mǎn)足Pa=0R1CU(a)a的最大整數(shù).右邊檢驗(yàn)問(wèn)題的拒絕域?yàn)?顯著性
33、水平為a)r1CL(a),此處, 臨界點(diǎn)CL(a)是滿(mǎn)足Pa=0R1CL(a)a的最小整數(shù).78例如, 若給定a=0.1, 抽取的樣本容量為n1=3, n2=4, 則在上表知檢驗(yàn)問(wèn)題(7.3)的拒絕域?yàn)閞117.此時(shí)犯第1類(lèi)錯(cuò)誤的概率為2/350.1.書(shū)末附表8中列出了n1和n2自2到10為止的n1,n2的各種組合的臨界點(diǎn), 以及相應(yīng)的犯第I類(lèi)錯(cuò)誤的概率.79例1 為查明某種血清是否會(huì)抑制白血病, 選取患白血病已到晚期的老鼠9只, 其中有5只接受這種治療, 另4只則不作這種治療. 設(shè)兩樣本相互獨(dú)立. 從試驗(yàn)開(kāi)始時(shí)計(jì)算, 其存活時(shí)間(以月計(jì))如下:不作治療1.90.50.92.1接受治療3.15.31.44.62.8設(shè)治療與否的存活時(shí)間的概率密度至多差一個(gè)平移, 取a=0.05, 問(wèn)這種血清對(duì)白血病是否有抑制作用?80解 以m1,m2表示不作治療和接受治療的老鼠的存活時(shí)間的均值, 需檢驗(yàn)的假設(shè)是H0:m1=m2, H1:m
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 河南省駐馬店市汝南縣雙語(yǔ)學(xué)校、清華園學(xué)校2025-2026學(xué)年八年級(jí)上學(xué)期1月期末考試歷史試卷(含答案)
- 江蘇省蘇州市姑蘇區(qū)光華中學(xué)2025-2026學(xué)年七年級(jí)上學(xué)期期末測(cè)試歷史卷(含答案)
- 文秘試題及答案
- 網(wǎng)約車(chē)考試題庫(kù)及答案
- 2022~2023質(zhì)量員考試題庫(kù)及答案解析第117期
- 2021年部編人教版一年級(jí)語(yǔ)文上冊(cè)期中測(cè)試卷(1套)
- 公司實(shí)習(xí)總結(jié)15篇
- 營(yíng)口小升初數(shù)學(xué)綜合測(cè)試卷及參考答案
- 電氣設(shè)備選型技術(shù)要領(lǐng)
- 生理解剖考試題型及答案
- 大數(shù)據(jù)安全技術(shù)與管理
- 2026青島海發(fā)國(guó)有資本投資運(yùn)營(yíng)集團(tuán)有限公司招聘計(jì)劃筆試備考試題及答案解析
- 2026年中小學(xué)校長(zhǎng)校園安全管理培訓(xùn)考試題及答案
- 2025年山東建筑大學(xué)思想道德修養(yǎng)與法律基礎(chǔ)期末考試模擬題必考題
- 江西省贛州地區(qū)2023-2024學(xué)年七年級(jí)上學(xué)期期末英語(yǔ)試(含答案)
- 2025年香港滬江維多利亞筆試及答案
- 鼻飼技術(shù)操作課件
- 置景服務(wù)合同范本
- 隧道掛防水板及架設(shè)鋼筋臺(tái)車(chē)施工方案
- 述職報(bào)告中醫(yī)
- 患者身份識(shí)別管理標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論