版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第七章假設(shè)檢驗(yàn)
§7.1
假設(shè)檢驗(yàn)的基本思想與概念§7.2
正態(tài)總體參數(shù)假設(shè)檢驗(yàn)§7.3
其它分布參數(shù)的假設(shè)檢驗(yàn)§7.4
分布擬合檢驗(yàn)§7.1
假設(shè)檢驗(yàn)的基本思想與概念
7.1.1假設(shè)檢驗(yàn)問(wèn)題
例7.1.1
某廠生產(chǎn)的合金強(qiáng)度服從,其中的設(shè)計(jì)值
為不低于110(Pa)。為保證質(zhì)量,該廠每天都要對(duì)生產(chǎn)情況做例行檢查,以判斷生產(chǎn)是否正常進(jìn)行,即該合金的平均強(qiáng)度不低于
110(Pa)。某天從生產(chǎn)中隨機(jī)抽取25塊合金,
測(cè)得強(qiáng)度值為x1,x2
,
…,x25,其均值為
(Pa),問(wèn)當(dāng)日生產(chǎn)是否正常?
(1)是參數(shù)估計(jì)問(wèn)題嗎?(2)回答“是”還是“否”
,假設(shè)檢驗(yàn)問(wèn)題。(3)命題“合金平均強(qiáng)度不低于110Pa”正確與否僅涉及如下兩個(gè)參數(shù)集合:
這兩個(gè)非空參數(shù)集合都稱(chēng)作統(tǒng)計(jì)假設(shè),簡(jiǎn)稱(chēng)假設(shè)。
(4)我們的任務(wù)是利用樣本去判斷假設(shè)(命題)“”是否成立。這里的“判斷”在統(tǒng)計(jì)學(xué)中稱(chēng)為檢驗(yàn)或檢驗(yàn)法則。
7.1.2假設(shè)檢驗(yàn)的基本步驟
一、建立假設(shè)
在假設(shè)檢驗(yàn)中,常把一個(gè)被檢驗(yàn)的假設(shè)稱(chēng)為原假設(shè),用
表示,通常將不應(yīng)輕易加以否定的假設(shè)作為原假設(shè)。當(dāng)
被拒絕時(shí)而接收的假設(shè)稱(chēng)為備擇假設(shè),用
表示,它們常常成對(duì)出現(xiàn)。在例7.1.1中,我們可建立如下兩個(gè)假設(shè):
二、選擇檢驗(yàn)統(tǒng)計(jì)量,給出拒絕域形式由樣本對(duì)原假設(shè)進(jìn)行判斷總是通過(guò)一個(gè)統(tǒng)計(jì)量完成的,該統(tǒng)計(jì)量稱(chēng)為檢驗(yàn)統(tǒng)計(jì)量。使原假設(shè)被拒絕的樣本觀測(cè)值所在區(qū)域稱(chēng)為拒絕域,一般用W表示,在例7.1.1中,樣本均值愈大,意味著總體均值
也大,因此,合理的拒絕域形如正如在數(shù)學(xué)上我們不能用一個(gè)例子去證明一個(gè)結(jié)論一樣,用一個(gè)樣本(例子)不能證明一個(gè)命題(假設(shè))是成立的,但可以用一個(gè)例子(樣本)推翻一個(gè)命題。因此,從邏輯上看,注重拒絕域是適當(dāng)?shù)?。事?shí)上,在“拒絕原假設(shè)”和“拒絕備擇假設(shè)(從而接收原假設(shè))”之間還有一個(gè)模糊域,如今我們把它并入接收域,所以接收域是復(fù)雜的,將之稱(chēng)為保留域也許更恰當(dāng),但習(xí)慣上已把它稱(chēng)為接收域,沒(méi)有必要再進(jìn)行改變,只是應(yīng)注意它的含義。三、選擇顯著性水平檢驗(yàn)可能犯以下兩類(lèi)錯(cuò)誤:
其一是
為真但樣本觀測(cè)值落在拒絕域中,從而拒絕原假設(shè)
,這種錯(cuò)誤稱(chēng)為第一類(lèi)錯(cuò)誤,其發(fā)生的概率稱(chēng)為犯第一類(lèi)錯(cuò)誤的概率,或稱(chēng)拒真概率,通常記為
其二是
不真(即
為真)但樣本觀測(cè)值落在接受域中,從而接受原假設(shè)
,這種錯(cuò)誤稱(chēng)為第二類(lèi)錯(cuò)誤,其發(fā)生的概率稱(chēng)為犯第二類(lèi)錯(cuò)誤的概率,或稱(chēng)受偽概率,通常記為
。觀測(cè)數(shù)據(jù)情況總體情況犯第一類(lèi)錯(cuò)誤正確正確犯第二類(lèi)錯(cuò)誤為真為真犯第一類(lèi)錯(cuò)誤的概率
和犯第二類(lèi)錯(cuò)誤的概率
可以用同一個(gè)函數(shù)表示,即所謂的勢(shì)函數(shù)。勢(shì)函數(shù)是假設(shè)檢驗(yàn)中最重要的概念之一,定義如下:
定義7.1.1
設(shè)檢驗(yàn)問(wèn)題的拒絕域?yàn)閃,則樣本觀測(cè)值落在拒絕域內(nèi)的概率稱(chēng)為該檢驗(yàn)的勢(shì)函數(shù),記為(7.1.3)勢(shì)函數(shù)
是定義在參數(shù)空間
上的一個(gè)函數(shù)。犯兩類(lèi)錯(cuò)誤的概率都是參數(shù)
的函數(shù),并可由勢(shì)函數(shù)算得,即:對(duì)例7.1.1,其拒絕域?yàn)?,?7.1.3)可以算出該檢驗(yàn)的勢(shì)函數(shù)這個(gè)勢(shì)函數(shù)是
的減函數(shù)
由此可得如下結(jié)論:
利用這個(gè)勢(shì)函數(shù)容易寫(xiě)出犯兩類(lèi)錯(cuò)誤的概率分別為和
當(dāng)
減小時(shí),c也隨之減小,必導(dǎo)致
的增大;
當(dāng)
減小時(shí),c會(huì)增大,必導(dǎo)致
的增大;說(shuō)明:在樣本量一定的條件下不可能找到一個(gè)使
和
都小的檢驗(yàn)。
英國(guó)統(tǒng)計(jì)學(xué)家
Neyman和
Pearson提出水平為
的顯著性檢驗(yàn)的概念。
則稱(chēng)該檢驗(yàn)是顯著性水平為
的顯著性檢驗(yàn),簡(jiǎn)稱(chēng)水平為
的檢驗(yàn)。
定義7.1.2
對(duì)檢驗(yàn)問(wèn)題對(duì)如果一個(gè)檢驗(yàn)滿足對(duì)任意的
,都有
四、給出拒絕域確定顯著性水平后,可以定出檢驗(yàn)的拒絕域W。
在例7.1.1中,若取
=0.05,由于g(
)關(guān)于
單調(diào)減,只需要成立即可。這給出c的值為=108.684檢驗(yàn)的拒絕域?yàn)槿袅顒t拒絕域有另一種表示:五、作出判斷
在有了明確的拒絕域后,根據(jù)樣本觀測(cè)值我們可以做出判斷:
當(dāng)
或時(shí),則拒絕
即接收
;
當(dāng)
或
時(shí),則接收
在例7.1.1中,由于因此拒絕原假設(shè),即認(rèn)為該日生產(chǎn)不正常?!?.2正態(tài)總體參數(shù)假設(shè)檢驗(yàn)
參數(shù)假設(shè)檢驗(yàn)常見(jiàn)的有三種基本形式(1)(2)(3)當(dāng)備擇假設(shè)
在原假設(shè)
一側(cè)時(shí)的檢驗(yàn)稱(chēng)為單側(cè)檢驗(yàn);當(dāng)備擇假設(shè)
分散在原假設(shè)
兩側(cè)時(shí)的檢驗(yàn)稱(chēng)為雙側(cè)檢驗(yàn)。
7.2.1
單個(gè)正態(tài)總體均值的檢驗(yàn)一、已知
時(shí)的u檢驗(yàn)設(shè)
是來(lái)自
的樣本,考慮關(guān)于
的檢驗(yàn)問(wèn)題。檢驗(yàn)統(tǒng)計(jì)量可選為三種假設(shè)的拒絕域形式分別見(jiàn)下圖:(a)(b)(c)該檢驗(yàn)用u檢驗(yàn)統(tǒng)計(jì)量,故稱(chēng)為u檢驗(yàn)。
下面以為例說(shuō)明:由可推出具體的拒絕域?yàn)樵摍z驗(yàn)的勢(shì)函數(shù)是
的函數(shù),它可用正態(tài)分布寫(xiě)出,具體為
勢(shì)函數(shù)是
的增函數(shù)(見(jiàn)圖),只要
就可保證在
時(shí)有7.2.1(a)的圖形對(duì)單側(cè)檢驗(yàn)是類(lèi)似的,只是拒絕域變?yōu)?其勢(shì)函數(shù)為對(duì)雙側(cè)檢驗(yàn)問(wèn)題(7.2.3),拒絕域?yàn)槠鋭?shì)函數(shù)為7.2.1(b)(c)的圖形例7.2.1
從甲地發(fā)送一個(gè)訊號(hào)到乙地。設(shè)乙地接受到的訊號(hào)值服從正態(tài)分布
其中
為甲地發(fā)送的真實(shí)訊號(hào)值?,F(xiàn)甲地重復(fù)發(fā)送同一訊號(hào)5次,乙地接收到的訊號(hào)值為
8.058.158.28.18.25設(shè)接受方有理由猜測(cè)甲地發(fā)送的訊號(hào)值為8,問(wèn)能否接受這猜測(cè)?解:這是一個(gè)假設(shè)檢驗(yàn)的問(wèn)題,總體X~N(
,0.22),檢驗(yàn)假設(shè):這個(gè)雙側(cè)檢驗(yàn)問(wèn)題的拒絕域?yàn)槿≈眯潘?/p>
=0.05,則查表知u0.975=1.96。用觀測(cè)值可計(jì)算得u值未落入拒絕域內(nèi),故不能拒絕原假設(shè),即接受原假設(shè),可認(rèn)為猜測(cè)成立。二、
未知時(shí)的t檢驗(yàn)由于
未知,一個(gè)自然的想法是將(7.2.4)中未知的
替換成樣本標(biāo)準(zhǔn)差s,這就形成t檢驗(yàn)統(tǒng)計(jì)量(7.2.9)三種假設(shè)的檢驗(yàn)拒絕域分別為例7.2.2
某廠生產(chǎn)的某種鋁材的長(zhǎng)度服從正態(tài)分布,其均值設(shè)定為240厘米?,F(xiàn)從該廠抽取5件產(chǎn)品,測(cè)得其長(zhǎng)度為(單位:厘米)239.7239.6239240239.2試判斷該廠此類(lèi)鋁材的長(zhǎng)度是否滿足設(shè)定要求?
解:這是一個(gè)關(guān)于正態(tài)均值的雙側(cè)假設(shè)檢驗(yàn)問(wèn)題。采用t檢驗(yàn),拒絕域?yàn)?現(xiàn)由樣本計(jì)算得到:t==2.7951由于2.7951>2.776,故拒絕原假設(shè),認(rèn)為該廠生產(chǎn)的鋁材的長(zhǎng)度不滿足設(shè)定要求。
若取
=0.05,則t0.975(4)=2.776.故檢驗(yàn)法條件檢驗(yàn)統(tǒng)計(jì)量拒絕域u
檢驗(yàn)
已知t
檢驗(yàn)
未知原假設(shè)備擇假設(shè)表7.2.1單個(gè)正態(tài)總體的均值的檢驗(yàn)問(wèn)題三、假設(shè)檢驗(yàn)與置信區(qū)間的關(guān)系
這里用的檢驗(yàn)統(tǒng)計(jì)量與6.5.5節(jié)中置信區(qū)間所用的樞軸量是相似的。這不是偶然的,兩者之間存在非常密切的關(guān)系。設(shè)
是來(lái)自正態(tài)總體
的樣本,現(xiàn)在
未知場(chǎng)合討論關(guān)于均值
的檢驗(yàn)問(wèn)題??紤]雙側(cè)檢驗(yàn)問(wèn)題:它可以改寫(xiě)為并且有若讓
0
在(-)內(nèi)取值,就可得到
的1-
置信區(qū)間:
這里
0并無(wú)限制.則水平為
的檢驗(yàn)接收域?yàn)?/p>
關(guān)于的水平為
的顯著性檢驗(yàn)。是一一對(duì)應(yīng)的。
類(lèi)似地,“參數(shù)
的1-
置信上限”與“關(guān)于
的單側(cè)檢驗(yàn)問(wèn)題的水平
的檢驗(yàn)”反之若有一個(gè)如上的1-
置信區(qū)間,也可獲得所以:“正態(tài)均值
的1-
置信區(qū)間”與“關(guān)于
的雙側(cè)檢驗(yàn)問(wèn)題的水平
的檢驗(yàn)”參數(shù)
的1-
置信下限與另一個(gè)單側(cè)檢驗(yàn)也是一一對(duì)應(yīng)的。是一一對(duì)應(yīng)的。
7.2.2兩個(gè)正態(tài)總體均值差的檢驗(yàn)檢驗(yàn)法條件原假設(shè)備擇假設(shè)檢驗(yàn)統(tǒng)計(jì)量拒絕域u檢驗(yàn)已知t檢驗(yàn)未知大樣本檢u
驗(yàn)
未知m,n充分大近似t
檢驗(yàn)未知m,n不很大例7.2.3
某廠鑄造車(chē)間為提高鑄件的耐磨性而試制了一種鎳合金鑄件以取代銅合金鑄件,為此,從兩種鑄件中各抽取一個(gè)容量分別為
8和9的樣本,測(cè)得其硬度為
鎳合金:76.4376.2173.5869.6965.2970.8382.7572.34銅合金:73.6664.2769.3471.3769.7768.1267.2768.0762.61根據(jù)經(jīng)驗(yàn),硬度服從正態(tài)分布,且方差保持不變。試在顯著性水平
下判斷鎳合金的硬度是否有明顯提高。解:用X表示鎳合金的硬度,Y表示銅合金的硬度,則由假定,
要檢驗(yàn)的假設(shè)是:
經(jīng)計(jì)算,
從而查表知由于故拒絕原假設(shè),可判斷鎳合金硬度有顯著提高。7.2.3正態(tài)總體方差的檢驗(yàn)一、單個(gè)正態(tài)總體方差的檢驗(yàn)
設(shè)
是來(lái)自
的樣本,對(duì)方差亦可考慮如下三個(gè)檢驗(yàn)問(wèn)題:
通常假定
未知,它們采用的檢驗(yàn)統(tǒng)計(jì)量是相同的,均為
若取顯著性水平為
,則對(duì)應(yīng)三個(gè)檢驗(yàn)問(wèn)題的拒絕域依次分別為例7.2.4
某類(lèi)鋼板每塊的重量X服從正態(tài)分布,其一項(xiàng)質(zhì)量指標(biāo)是鋼板重量的方差不得超過(guò)
0.016(kg2)?,F(xiàn)從某天生產(chǎn)的鋼板中隨機(jī)抽取
25塊,得其樣本方差S2=0.025(kg2),問(wèn)該天生產(chǎn)的鋼板重量的方差是否滿足要求。解:原假設(shè)為備擇假設(shè)為此處n=25,若取
=0.05,則查表知由此,在顯著性水平0.05下,我們拒絕原假設(shè),認(rèn)為該天生產(chǎn)的鋼板重量不符合要求?,F(xiàn)計(jì)算可得二、兩個(gè)正態(tài)總體方差比的F檢驗(yàn)
設(shè)
是來(lái)自
的樣本,
是來(lái)自
的樣本??紤]如下三個(gè)假設(shè)檢驗(yàn)問(wèn)題
通常,均未知,記,分別是由算得的
的無(wú)偏估計(jì)和由
算得的
的無(wú)偏估計(jì).可建立檢驗(yàn)統(tǒng)計(jì)量:三種檢驗(yàn)問(wèn)題對(duì)應(yīng)的拒絕域依次為}。
或例7.2.5
甲、乙兩臺(tái)機(jī)床加工某種零件,零件的直徑服從正態(tài)分布,總體方差反映了加工精度,為比較兩臺(tái)機(jī)床的加工精度有無(wú)差別,現(xiàn)從各自加工的零件中分別抽取7件產(chǎn)品和8
件產(chǎn)品,測(cè)得其直徑為
X(機(jī)床甲)16.216.415.815.516.715.615.8Y(機(jī)床乙)15.916.016.416.116.515.815.715.0這就形成了一個(gè)雙側(cè)假設(shè)檢驗(yàn)問(wèn)題,原假設(shè)是
備擇假設(shè)為此處m=7,n=8,經(jīng)計(jì)算查表知于是
,若取
=0.05,其拒絕域?yàn)橛纱丝梢?jiàn),樣本未落入拒絕域,即在0.05水平下可以認(rèn)為兩臺(tái)機(jī)床的加工精度一致。
§7.3其他分布參數(shù)的假設(shè)檢驗(yàn)7.3.1指數(shù)分布參數(shù)的假設(shè)檢驗(yàn)設(shè)x1,x2
,
…,xn是來(lái)自指數(shù)分布的樣本,關(guān)于
的如下檢驗(yàn)問(wèn)題:
(7.3.1)拒絕域的形式是
,由于在
=
0時(shí),所以拒絕域?yàn)槔?.3.1
設(shè)我們要檢驗(yàn)?zāi)撤N元件的平均壽命不小于6000小時(shí),假定元件壽命為指數(shù)分布,現(xiàn)取
5個(gè)元件投入試驗(yàn),觀測(cè)到如下5個(gè)失效時(shí)間:395,4094,119,11572,6133。
解:由于待檢驗(yàn)的假設(shè)為
若取
=0.05,則檢驗(yàn)拒絕域?yàn)?
故接受原假設(shè),可以認(rèn)為平均壽命不低于6000小時(shí).經(jīng)計(jì)算得7.3.2比例的檢驗(yàn)比例
p可看作某事件發(fā)生的概率。作
n次獨(dú)立試驗(yàn),以
x記該事件發(fā)生的次數(shù),則
。我們可以根據(jù)
x檢驗(yàn)關(guān)于
p的一些假設(shè):
(1)直觀上看拒絕域?yàn)?
,由于x只取整數(shù)值,故c可限制在非負(fù)整數(shù)中。這是在對(duì)離散總體作假設(shè)檢驗(yàn)中普遍會(huì)遇到的問(wèn)題.一般情況下,對(duì)給定的
,不一定能正好取到一個(gè)正整數(shù)c使下式成立:一般較常見(jiàn)的是找一個(gè)c0,使得
(2)檢驗(yàn)的拒絕域?yàn)?c為滿足的最大正整數(shù)。(3)檢驗(yàn)的拒絕域?yàn)?或其中c1為滿足下式的最大正整數(shù):c2為滿足下式的最小正整數(shù):例7.3.2某廠生產(chǎn)的產(chǎn)品優(yōu)質(zhì)品率一直保持在
40%,近期對(duì)該廠生產(chǎn)的該類(lèi)產(chǎn)品抽檢20
件,其中優(yōu)質(zhì)品7件,在下能否認(rèn)為優(yōu)質(zhì)品率仍保持在40%?
解:以p表示優(yōu)質(zhì)品率,x表示20件產(chǎn)品中的優(yōu)質(zhì)品件數(shù),則
,待檢驗(yàn)的假設(shè)為拒絕域?yàn)榛蛴捎谙虑骳1與c2:故取c1=3,又因?yàn)閺亩鴆2=12,拒絕域?yàn)楦綆е赋?,該拒絕域的顯著性水平實(shí)際上不是0.05,而是0.0160+0.021=0.0370。由于觀測(cè)值沒(méi)有落入拒絕域,故接受原假設(shè)。
或7.3.3大樣本檢驗(yàn)
在二點(diǎn)分布參數(shù)p的檢驗(yàn)問(wèn)題中,臨界值的確定比較繁瑣,使用不太方便。如果樣本量較大,我們可用近似的檢驗(yàn)方法——大樣本檢驗(yàn)。大樣本檢驗(yàn)一般思路如下:設(shè)是來(lái)自某總體的樣本,又設(shè)該總體均值為
,方差為
的函數(shù),記為
,譬如,對(duì)二點(diǎn)分布b(1,
),其方差
(1-
)是均值
的函數(shù),則在樣本容量n充分大時(shí),
故可采用如下檢驗(yàn):由此近似地確定拒絕域。統(tǒng)計(jì)量
例7.3.3
某廠產(chǎn)品的不合格品率為10%,在一次例行檢查中,隨機(jī)抽取80件,發(fā)現(xiàn)有
11件不合格品,在
=0.05下能否認(rèn)為不合格品率仍為10%?解:這是關(guān)于不合格品率的檢驗(yàn),假設(shè)為:若取
=0.05,則u0.975=1.96,故拒絕域?yàn)?/p>
故不能拒絕原假設(shè)。因?yàn)閚=80比較大,可采用大樣本檢驗(yàn)方法。檢驗(yàn)統(tǒng)計(jì)量為例7.3.4
某建筑公司宣稱(chēng)其麾下建筑工地平均每天發(fā)生事故數(shù)不超過(guò)0.6起,現(xiàn)記錄了該公司麾下建筑工地200天的安全生產(chǎn)情況,事故數(shù)記錄如下:天數(shù)10259308010200一天發(fā)生的事故數(shù)012345合計(jì)6試檢驗(yàn)該建筑公司的宣稱(chēng)是否成立(取
=0.05)。
解:以X記建筑工地一天發(fā)生的事故數(shù),可認(rèn)為
,要檢驗(yàn)的假設(shè)是:
由于n=200很大,可以采用大樣本檢驗(yàn),泊松分布的均值和方差都是
,這里
,檢驗(yàn)統(tǒng)計(jì)量為若取
=0.05,則
u0.95=1.645,拒絕域?yàn)槿缃駏=2.556已落入拒絕域,故拒絕原假設(shè),認(rèn)為該建筑公司的宣稱(chēng)明顯不成立。
大樣本檢驗(yàn)是近似的:近似的含義是指檢驗(yàn)的實(shí)際顯著性水平與原先設(shè)
定的顯著性水平有差距,這是由于諸如(7.3.12)中
u的分布與N(0,1)有距離。如果n很大,則這種差異就很小。實(shí)用中我們一般并不清楚對(duì)一定的n,
u的分布與N(0,1)的差異有多大,因而也就不能確定檢驗(yàn)的實(shí)際水平與設(shè)定水平究竟差多少。在區(qū)間估計(jì)中也有類(lèi)似問(wèn)題。因此,大樣本方法是一個(gè)“不得已而為之”的方法。只要有基于精確分布的方法一般總是首先要加以考慮的。7.3.4檢驗(yàn)的p值假設(shè)檢驗(yàn)的結(jié)論通常是簡(jiǎn)單的:在給定的顯著水平下,不是拒絕原假設(shè)就是保留原假設(shè)。然而有時(shí)也會(huì)出現(xiàn)這樣的情況:在一個(gè)較大的顯著水平(
=0.05)下得到拒絕原假設(shè)的結(jié)論,而在一個(gè)較小的顯著水平(
=0.01)下卻會(huì)得到相反的結(jié)論。這種情況在理論上很容易解釋?zhuān)阂驗(yàn)轱@著水平變小后會(huì)導(dǎo)致檢驗(yàn)的拒絕域變小,于是原來(lái)落在拒絕域中的觀測(cè)值就可能落入接受域。但這種情況在應(yīng)用中會(huì)帶來(lái)一些麻煩:假如這時(shí)一個(gè)人主張選擇顯著水平
=0.05,而另一個(gè)人主張選
=0.01,則第一個(gè)人的結(jié)論是拒絕H0,而后一個(gè)人的結(jié)論是接受H0,我們?cè)撊绾翁幚磉@一問(wèn)題呢?例7.3.5
一支香煙中的尼古丁含量X服從正態(tài)分布N(
,1),質(zhì)量標(biāo)準(zhǔn)
規(guī)定不能超過(guò)1.5毫克?,F(xiàn)從某廠生產(chǎn)的香煙中隨機(jī)抽取20支測(cè)得其中平均每支香煙的尼古丁含量為
毫克,試問(wèn)該廠生產(chǎn)的香煙尼古丁含量是否符合質(zhì)量標(biāo)準(zhǔn)的規(guī)定。這是一個(gè)假設(shè)檢驗(yàn)問(wèn)題:H0:
1.5,H1:
>1.5,采用u檢驗(yàn),計(jì)算得:對(duì)一些的顯著性水平,表7.3.1列出了相應(yīng)的拒絕域和檢驗(yàn)結(jié)論。表7.3.1例7.3.5中的拒絕域顯著性水平拒絕域u=2.10對(duì)應(yīng)的結(jié)論
=0.05u
1.645拒絕H0
=0.025u
1.96拒絕H0
=0.01u
2.33接受H0
=0.005u
2.58接受H0我們看到,不同的
有不同的結(jié)論。
現(xiàn)在換一個(gè)角度來(lái)看,在
=1.5時(shí),u的分布是N(0,1)。此時(shí)可算得,P(u
2.10)=0.0179,若以0.0179為基準(zhǔn)來(lái)看上述檢驗(yàn)問(wèn)題,可得
當(dāng)
<0.0179時(shí),
>2.10。于是2.10就不在中,此時(shí)應(yīng)接受原假設(shè)H0;
當(dāng)
0.0179時(shí),
2.10。于是2.10就落在中,此時(shí)應(yīng)拒絕H0。u由此可以看出,0.0179是能用觀測(cè)值2.10做出“拒絕H0”的最小的顯著性水平,這就是p值。u定義7.3.1
在一個(gè)假設(shè)檢驗(yàn)問(wèn)題中,利用觀測(cè)值能夠做出拒絕原假設(shè)的最小顯著性水平稱(chēng)為檢驗(yàn)的p值。
引進(jìn)檢驗(yàn)的p值的概念有明顯的好處:第一,它比較客觀,避免了事先確定顯著水平;其次,由檢驗(yàn)的p值與人們心目中的顯著性水平
進(jìn)行比較可以很容易作出檢驗(yàn)的結(jié)論:
如果
p,則在顯著性水平
下拒絕H0;
如果
<p,則在顯著性水平
下保留H0.p值在應(yīng)用中很方便,如今的統(tǒng)計(jì)軟件中對(duì)檢驗(yàn)問(wèn)題一般都會(huì)給出檢驗(yàn)的p值。例7.3.6
設(shè)
是來(lái)自b(1,
)的樣本,要檢驗(yàn)如下假設(shè):若取顯著性水平為
,則在得到觀測(cè)值后,我們只需要計(jì)算概率:
這就是檢驗(yàn)的p值。譬如若取
=0.05,由于p<
,則應(yīng)拒絕原假設(shè)。例7.3.7
某工廠兩位化驗(yàn)員甲、乙分別獨(dú)立地用相同方法對(duì)某種聚合物的含氯量進(jìn)行測(cè)定。甲測(cè)9次,樣本方差為0.7292;乙測(cè)11次,樣本方差為0.2114。假定測(cè)量數(shù)據(jù)服從正態(tài)分布,試對(duì)兩總體方差作一致性檢驗(yàn):檢驗(yàn)統(tǒng)計(jì)量為,在原假設(shè)成立下,
F
F(8,10),拒絕域?yàn)?/p>
如今我們不是把拒絕域具體化,而是由觀測(cè)值算得F=0.7292/0.2114=3.4494,再去計(jì)算該檢驗(yàn)的p
值。
或首先,我們用F分布算得其次考慮到雙側(cè)檢驗(yàn)的拒絕域W分散在兩端,且兩端尾部概率相等(見(jiàn)圖7.3.2),據(jù)此可定出p值為
此p值不算很小,若
=0.05,則接收兩方差相等的假設(shè)。在這種雙側(cè)檢驗(yàn)情況下,如何由觀測(cè)值F=3.4494算得p值呢?圖7.3.2
觀測(cè)值F=3.4494對(duì)應(yīng)的p值由兩端尾部概率之和確定§7.4分布擬合檢驗(yàn)7.4.1總體分布只取有限個(gè)值的情況
設(shè)總體X可以分成k類(lèi),記為
,現(xiàn)對(duì)該總體作了n次觀測(cè),k個(gè)類(lèi)出現(xiàn)的頻數(shù)分別為:檢驗(yàn)如下假設(shè):n1,…,nk,且其中諸且一、諸pi均已知如果H0成立,則對(duì)每一類(lèi)Ai,其頻率ni/n與概率pi應(yīng)較接近。即觀測(cè)頻數(shù)ni
與理論頻數(shù)npi
應(yīng)相差不大。據(jù)此,英國(guó)統(tǒng)計(jì)學(xué)家K.Pearson提出如下檢驗(yàn)統(tǒng)計(jì)量:(7.4.2)并證明在H0成立時(shí)對(duì)充分大的n,(7.4.2)
給出的檢驗(yàn)統(tǒng)計(jì)量近似服從自由度為k-1的分布。拒絕域?yàn)?例7.4.1
為募集社會(huì)福利基金,某地方政府發(fā)行福利彩票,中彩者用搖大轉(zhuǎn)盤(pán)的方法確定最后中獎(jiǎng)金額。大轉(zhuǎn)盤(pán)均分為20份,其中金額為5萬(wàn)、10萬(wàn)、20萬(wàn)、30萬(wàn)、50萬(wàn)、100萬(wàn)的分別占2份、4份、6份、4份、2份、2份。假定大轉(zhuǎn)盤(pán)是均勻的,則每一點(diǎn)朝下是等可能的,于是搖出各個(gè)獎(jiǎng)項(xiàng)的概率如下:
概率0.10.20.30.20.10.1額度5萬(wàn)10萬(wàn)20萬(wàn)30萬(wàn)50萬(wàn)100萬(wàn)現(xiàn)20人參加搖獎(jiǎng),搖得5萬(wàn)、10萬(wàn)、20萬(wàn)、30萬(wàn)、50萬(wàn)和100萬(wàn)的人數(shù)分別為2、6、6、3、3、0,由于沒(méi)有一個(gè)人搖到100萬(wàn),于是有人懷疑大轉(zhuǎn)盤(pán)是不均勻的,那么該懷疑是否成立呢?這就需要對(duì)轉(zhuǎn)盤(pán)的均勻性作檢驗(yàn)。解:這是一個(gè)典型的分布擬合優(yōu)度檢驗(yàn),總體共有6類(lèi),其發(fā)生概率分別為0.1、0.2、0.3、
0.2、0.1和0.1,這里k=6,檢驗(yàn)拒絕域?yàn)?由本例數(shù)據(jù)可以算出若取
=0.05,則查附表3知=由于未落入拒絕域,故接受原假設(shè),沒(méi)有理由認(rèn)為轉(zhuǎn)盤(pán)不均勻。在分布擬合檢驗(yàn)中使用p值也是方便的。本例中,以T記服從
(5)的隨機(jī)變量,則使用統(tǒng)計(jì)軟件可以算出這個(gè)p值就反映了數(shù)據(jù)與假設(shè)的分布擬合程度的高低,p值越大,擬合越好。二、諸pi不完全已知
若諸
由r(r<k)個(gè)未知參數(shù)
確定,即
首先給出
的極大似然估計(jì)然后給出諸
的極大似然估計(jì)Fisher證明了
在H0成立時(shí)近似服從自由度為k-r-1的
分布,于是檢驗(yàn)拒絕域?yàn)槔?.4.2
盧瑟福在2608個(gè)等時(shí)間間隔內(nèi)觀測(cè)一枚放射性物質(zhì)放射的粒子數(shù)X,表7.4.1是觀測(cè)結(jié)果的匯總,其中ni表示2608次觀測(cè)中放射粒子數(shù)為i的次數(shù)。
ni572033835255324082731394527106i012345678910
11試?yán)迷摻M數(shù)據(jù)檢驗(yàn)該放射物質(zhì)在單位時(shí)間內(nèi)放射出的粒子數(shù)是否服從泊松分布。
解:本例中,要檢驗(yàn)總體是否服從泊松分布。
觀測(cè)到0,1,…,11共12個(gè)不同取值,這相當(dāng)于把總體分成12類(lèi)。這里有一個(gè)未知參數(shù)
,采用極大似然估計(jì),
=將
代入可以估計(jì)出諸
。于是可計(jì)算出列表如下。012345678910115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.53431.45250.01207.66730.16580.12580.0158合計(jì)26081.00002068=12.8967i本例中
=12.8967<18.307,故接受原假設(shè)。使用統(tǒng)計(jì)軟件可以計(jì)算出此處檢驗(yàn)的p值是0.2295。
若取
=0.05,則列聯(lián)表是將觀測(cè)數(shù)據(jù)按兩個(gè)或更多屬性(定性變量)分類(lèi)時(shí)所列出的頻數(shù)表。例如,對(duì)隨機(jī)抽取的1000人按性別(男或女)及色覺(jué)(正?;蛏?兩個(gè)屬性分類(lèi),得到如下二維列聯(lián)表,又稱(chēng)2×2表或四格表。
7.4.2
列聯(lián)表的獨(dú)立性檢驗(yàn)?zāi)?3565女38218性別視覺(jué)正常色盲一般,若總體中的個(gè)體可按兩個(gè)屬性A與B分類(lèi),A有r個(gè)類(lèi)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 健全內(nèi)審制度
- 伙食管理十項(xiàng)制度
- 廣東搞笑測(cè)試題及答案
- 中國(guó)的出口管制制度
- 護(hù)理團(tuán)隊(duì)介紹
- 2026年重慶航天機(jī)電設(shè)計(jì)院招聘電子工藝工程師、電機(jī)智能控制算法工程師、硬件電路設(shè)計(jì)等崗位備考題庫(kù)完整答案詳解
- 2026年玉溪市生態(tài)環(huán)境局華寧分局編外辦公輔助(內(nèi)勤相關(guān))人員公開(kāi)招聘?jìng)淇碱}庫(kù)附答案詳解
- 2025-2030中國(guó)皮帶行業(yè)供需趨勢(shì)及投資風(fēng)險(xiǎn)研究報(bào)告
- 中共中央對(duì)外聯(lián)絡(luò)部事業(yè)單位2026年度公開(kāi)招聘工作人員備考題庫(kù)含答案詳解
- 2025-2030中國(guó)比賽行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 耳聾護(hù)理查房記錄
- 中國(guó)臨床腫瘤學(xué)會(huì)(CSCO)食管癌診療指南2025
- 二保焊培訓(xùn)課件
- 工程變更通知(ECN)流程及管理規(guī)范
- 2025至2030中國(guó)助聽(tīng)器行業(yè)調(diào)研及市場(chǎng)前景預(yù)測(cè)評(píng)估報(bào)告
- 2025-2030碳纖維復(fù)合材料成型設(shè)備技術(shù)發(fā)展與市場(chǎng)前景
- 2025時(shí)事政治試題庫(kù)(附含參考答案)
- 宮腔鏡手術(shù)的護(hù)理常規(guī)
- JJG 1211-2025 自動(dòng)氣象站風(fēng)向傳感器檢定規(guī)程
- 機(jī)械標(biāo)準(zhǔn)-G類(lèi)-管件
- 醫(yī)療器械培訓(xùn)計(jì)劃和記錄
評(píng)論
0/150
提交評(píng)論