第7章 假設(shè)檢驗(yàn)a_第1頁(yè)
第7章 假設(shè)檢驗(yàn)a_第2頁(yè)
第7章 假設(shè)檢驗(yàn)a_第3頁(yè)
第7章 假設(shè)檢驗(yàn)a_第4頁(yè)
第7章 假設(shè)檢驗(yàn)a_第5頁(yè)
已閱讀5頁(yè),還剩114頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章假設(shè)檢驗(yàn)

§7.1

假設(shè)檢驗(yàn)的基本思想與概念§7.2

正態(tài)總體參數(shù)假設(shè)檢驗(yàn)§7.3

其它分布參數(shù)的假設(shè)檢驗(yàn)§7.4

分布擬合檢驗(yàn)§7.1

假設(shè)檢驗(yàn)的基本思想與概念

7.1.1假設(shè)檢驗(yàn)問(wèn)題

例7.1.1

某廠生產(chǎn)的合金強(qiáng)度服從,其中的設(shè)計(jì)值

為不低于110(Pa)。為保證質(zhì)量,該廠每天都要對(duì)生產(chǎn)情況做例行檢查,以判斷生產(chǎn)是否正常進(jìn)行,即該合金的平均強(qiáng)度不低于

110(Pa)。某天從生產(chǎn)中隨機(jī)抽取25塊合金,

測(cè)得強(qiáng)度值為x1,x2

,

…,x25,其均值為

(Pa),問(wèn)當(dāng)日生產(chǎn)是否正常?

(1)是參數(shù)估計(jì)問(wèn)題嗎?(2)回答“是”還是“否”

,假設(shè)檢驗(yàn)問(wèn)題。(3)命題“合金平均強(qiáng)度不低于110Pa”正確與否僅涉及如下兩個(gè)參數(shù)集合:

這兩個(gè)非空參數(shù)集合都稱(chēng)作統(tǒng)計(jì)假設(shè),簡(jiǎn)稱(chēng)假設(shè)。

(4)我們的任務(wù)是利用樣本去判斷假設(shè)(命題)“”是否成立。這里的“判斷”在統(tǒng)計(jì)學(xué)中稱(chēng)為檢驗(yàn)或檢驗(yàn)法則。

7.1.2假設(shè)檢驗(yàn)的基本步驟

一、建立假設(shè)

在假設(shè)檢驗(yàn)中,常把一個(gè)被檢驗(yàn)的假設(shè)稱(chēng)為原假設(shè),用

表示,通常將不應(yīng)輕易加以否定的假設(shè)作為原假設(shè)。當(dāng)

被拒絕時(shí)而接收的假設(shè)稱(chēng)為備擇假設(shè),用

表示,它們常常成對(duì)出現(xiàn)。在例7.1.1中,我們可建立如下兩個(gè)假設(shè):

二、選擇檢驗(yàn)統(tǒng)計(jì)量,給出拒絕域形式由樣本對(duì)原假設(shè)進(jìn)行判斷總是通過(guò)一個(gè)統(tǒng)計(jì)量完成的,該統(tǒng)計(jì)量稱(chēng)為檢驗(yàn)統(tǒng)計(jì)量。使原假設(shè)被拒絕的樣本觀測(cè)值所在區(qū)域稱(chēng)為拒絕域,一般用W表示,在例7.1.1中,樣本均值愈大,意味著總體均值

也大,因此,合理的拒絕域形如正如在數(shù)學(xué)上我們不能用一個(gè)例子去證明一個(gè)結(jié)論一樣,用一個(gè)樣本(例子)不能證明一個(gè)命題(假設(shè))是成立的,但可以用一個(gè)例子(樣本)推翻一個(gè)命題。因此,從邏輯上看,注重拒絕域是適當(dāng)?shù)?。事?shí)上,在“拒絕原假設(shè)”和“拒絕備擇假設(shè)(從而接收原假設(shè))”之間還有一個(gè)模糊域,如今我們把它并入接收域,所以接收域是復(fù)雜的,將之稱(chēng)為保留域也許更恰當(dāng),但習(xí)慣上已把它稱(chēng)為接收域,沒(méi)有必要再進(jìn)行改變,只是應(yīng)注意它的含義。三、選擇顯著性水平檢驗(yàn)可能犯以下兩類(lèi)錯(cuò)誤:

其一是

為真但樣本觀測(cè)值落在拒絕域中,從而拒絕原假設(shè)

,這種錯(cuò)誤稱(chēng)為第一類(lèi)錯(cuò)誤,其發(fā)生的概率稱(chēng)為犯第一類(lèi)錯(cuò)誤的概率,或稱(chēng)拒真概率,通常記為

其二是

不真(即

為真)但樣本觀測(cè)值落在接受域中,從而接受原假設(shè)

,這種錯(cuò)誤稱(chēng)為第二類(lèi)錯(cuò)誤,其發(fā)生的概率稱(chēng)為犯第二類(lèi)錯(cuò)誤的概率,或稱(chēng)受偽概率,通常記為

。觀測(cè)數(shù)據(jù)情況總體情況犯第一類(lèi)錯(cuò)誤正確正確犯第二類(lèi)錯(cuò)誤為真為真犯第一類(lèi)錯(cuò)誤的概率

和犯第二類(lèi)錯(cuò)誤的概率

可以用同一個(gè)函數(shù)表示,即所謂的勢(shì)函數(shù)。勢(shì)函數(shù)是假設(shè)檢驗(yàn)中最重要的概念之一,定義如下:

定義7.1.1

設(shè)檢驗(yàn)問(wèn)題的拒絕域?yàn)閃,則樣本觀測(cè)值落在拒絕域內(nèi)的概率稱(chēng)為該檢驗(yàn)的勢(shì)函數(shù),記為(7.1.3)勢(shì)函數(shù)

是定義在參數(shù)空間

上的一個(gè)函數(shù)。犯兩類(lèi)錯(cuò)誤的概率都是參數(shù)

的函數(shù),并可由勢(shì)函數(shù)算得,即:對(duì)例7.1.1,其拒絕域?yàn)?,?7.1.3)可以算出該檢驗(yàn)的勢(shì)函數(shù)這個(gè)勢(shì)函數(shù)是

的減函數(shù)

由此可得如下結(jié)論:

利用這個(gè)勢(shì)函數(shù)容易寫(xiě)出犯兩類(lèi)錯(cuò)誤的概率分別為和

當(dāng)

減小時(shí),c也隨之減小,必導(dǎo)致

的增大;

當(dāng)

減小時(shí),c會(huì)增大,必導(dǎo)致

的增大;說(shuō)明:在樣本量一定的條件下不可能找到一個(gè)使

都小的檢驗(yàn)。

英國(guó)統(tǒng)計(jì)學(xué)家

Neyman和

Pearson提出水平為

的顯著性檢驗(yàn)的概念。

則稱(chēng)該檢驗(yàn)是顯著性水平為

的顯著性檢驗(yàn),簡(jiǎn)稱(chēng)水平為

的檢驗(yàn)。

定義7.1.2

對(duì)檢驗(yàn)問(wèn)題對(duì)如果一個(gè)檢驗(yàn)滿足對(duì)任意的

,都有

四、給出拒絕域確定顯著性水平后,可以定出檢驗(yàn)的拒絕域W。

在例7.1.1中,若取

=0.05,由于g(

)關(guān)于

單調(diào)減,只需要成立即可。這給出c的值為=108.684檢驗(yàn)的拒絕域?yàn)槿袅顒t拒絕域有另一種表示:五、作出判斷

在有了明確的拒絕域后,根據(jù)樣本觀測(cè)值我們可以做出判斷:

當(dāng)

或時(shí),則拒絕

即接收

;

當(dāng)

時(shí),則接收

在例7.1.1中,由于因此拒絕原假設(shè),即認(rèn)為該日生產(chǎn)不正常?!?.2正態(tài)總體參數(shù)假設(shè)檢驗(yàn)

參數(shù)假設(shè)檢驗(yàn)常見(jiàn)的有三種基本形式(1)(2)(3)當(dāng)備擇假設(shè)

在原假設(shè)

一側(cè)時(shí)的檢驗(yàn)稱(chēng)為單側(cè)檢驗(yàn);當(dāng)備擇假設(shè)

分散在原假設(shè)

兩側(cè)時(shí)的檢驗(yàn)稱(chēng)為雙側(cè)檢驗(yàn)。

7.2.1

單個(gè)正態(tài)總體均值的檢驗(yàn)一、已知

時(shí)的u檢驗(yàn)設(shè)

是來(lái)自

的樣本,考慮關(guān)于

的檢驗(yàn)問(wèn)題。檢驗(yàn)統(tǒng)計(jì)量可選為三種假設(shè)的拒絕域形式分別見(jiàn)下圖:(a)(b)(c)該檢驗(yàn)用u檢驗(yàn)統(tǒng)計(jì)量,故稱(chēng)為u檢驗(yàn)。

下面以為例說(shuō)明:由可推出具體的拒絕域?yàn)樵摍z驗(yàn)的勢(shì)函數(shù)是

的函數(shù),它可用正態(tài)分布寫(xiě)出,具體為

勢(shì)函數(shù)是

的增函數(shù)(見(jiàn)圖),只要

就可保證在

時(shí)有7.2.1(a)的圖形對(duì)單側(cè)檢驗(yàn)是類(lèi)似的,只是拒絕域變?yōu)?其勢(shì)函數(shù)為對(duì)雙側(cè)檢驗(yàn)問(wèn)題(7.2.3),拒絕域?yàn)槠鋭?shì)函數(shù)為7.2.1(b)(c)的圖形例7.2.1

從甲地發(fā)送一個(gè)訊號(hào)到乙地。設(shè)乙地接受到的訊號(hào)值服從正態(tài)分布

其中

為甲地發(fā)送的真實(shí)訊號(hào)值?,F(xiàn)甲地重復(fù)發(fā)送同一訊號(hào)5次,乙地接收到的訊號(hào)值為

8.058.158.28.18.25設(shè)接受方有理由猜測(cè)甲地發(fā)送的訊號(hào)值為8,問(wèn)能否接受這猜測(cè)?解:這是一個(gè)假設(shè)檢驗(yàn)的問(wèn)題,總體X~N(

,0.22),檢驗(yàn)假設(shè):這個(gè)雙側(cè)檢驗(yàn)問(wèn)題的拒絕域?yàn)槿≈眯潘?/p>

=0.05,則查表知u0.975=1.96。用觀測(cè)值可計(jì)算得u值未落入拒絕域內(nèi),故不能拒絕原假設(shè),即接受原假設(shè),可認(rèn)為猜測(cè)成立。二、

未知時(shí)的t檢驗(yàn)由于

未知,一個(gè)自然的想法是將(7.2.4)中未知的

替換成樣本標(biāo)準(zhǔn)差s,這就形成t檢驗(yàn)統(tǒng)計(jì)量(7.2.9)三種假設(shè)的檢驗(yàn)拒絕域分別為例7.2.2

某廠生產(chǎn)的某種鋁材的長(zhǎng)度服從正態(tài)分布,其均值設(shè)定為240厘米?,F(xiàn)從該廠抽取5件產(chǎn)品,測(cè)得其長(zhǎng)度為(單位:厘米)239.7239.6239240239.2試判斷該廠此類(lèi)鋁材的長(zhǎng)度是否滿足設(shè)定要求?

解:這是一個(gè)關(guān)于正態(tài)均值的雙側(cè)假設(shè)檢驗(yàn)問(wèn)題。采用t檢驗(yàn),拒絕域?yàn)?現(xiàn)由樣本計(jì)算得到:t==2.7951由于2.7951>2.776,故拒絕原假設(shè),認(rèn)為該廠生產(chǎn)的鋁材的長(zhǎng)度不滿足設(shè)定要求。

若取

=0.05,則t0.975(4)=2.776.故檢驗(yàn)法條件檢驗(yàn)統(tǒng)計(jì)量拒絕域u

檢驗(yàn)

已知t

檢驗(yàn)

未知原假設(shè)備擇假設(shè)表7.2.1單個(gè)正態(tài)總體的均值的檢驗(yàn)問(wèn)題三、假設(shè)檢驗(yàn)與置信區(qū)間的關(guān)系

這里用的檢驗(yàn)統(tǒng)計(jì)量與6.5.5節(jié)中置信區(qū)間所用的樞軸量是相似的。這不是偶然的,兩者之間存在非常密切的關(guān)系。設(shè)

是來(lái)自正態(tài)總體

的樣本,現(xiàn)在

未知場(chǎng)合討論關(guān)于均值

的檢驗(yàn)問(wèn)題??紤]雙側(cè)檢驗(yàn)問(wèn)題:它可以改寫(xiě)為并且有若讓

0

在(-)內(nèi)取值,就可得到

的1-

置信區(qū)間:

這里

0并無(wú)限制.則水平為

的檢驗(yàn)接收域?yàn)?/p>

關(guān)于的水平為

的顯著性檢驗(yàn)。是一一對(duì)應(yīng)的。

類(lèi)似地,“參數(shù)

的1-

置信上限”與“關(guān)于

的單側(cè)檢驗(yàn)問(wèn)題的水平

的檢驗(yàn)”反之若有一個(gè)如上的1-

置信區(qū)間,也可獲得所以:“正態(tài)均值

的1-

置信區(qū)間”與“關(guān)于

的雙側(cè)檢驗(yàn)問(wèn)題的水平

的檢驗(yàn)”參數(shù)

的1-

置信下限與另一個(gè)單側(cè)檢驗(yàn)也是一一對(duì)應(yīng)的。是一一對(duì)應(yīng)的。

7.2.2兩個(gè)正態(tài)總體均值差的檢驗(yàn)檢驗(yàn)法條件原假設(shè)備擇假設(shè)檢驗(yàn)統(tǒng)計(jì)量拒絕域u檢驗(yàn)已知t檢驗(yàn)未知大樣本檢u

驗(yàn)

未知m,n充分大近似t

檢驗(yàn)未知m,n不很大例7.2.3

某廠鑄造車(chē)間為提高鑄件的耐磨性而試制了一種鎳合金鑄件以取代銅合金鑄件,為此,從兩種鑄件中各抽取一個(gè)容量分別為

8和9的樣本,測(cè)得其硬度為

鎳合金:76.4376.2173.5869.6965.2970.8382.7572.34銅合金:73.6664.2769.3471.3769.7768.1267.2768.0762.61根據(jù)經(jīng)驗(yàn),硬度服從正態(tài)分布,且方差保持不變。試在顯著性水平

下判斷鎳合金的硬度是否有明顯提高。解:用X表示鎳合金的硬度,Y表示銅合金的硬度,則由假定,

要檢驗(yàn)的假設(shè)是:

經(jīng)計(jì)算,

從而查表知由于故拒絕原假設(shè),可判斷鎳合金硬度有顯著提高。7.2.3正態(tài)總體方差的檢驗(yàn)一、單個(gè)正態(tài)總體方差的檢驗(yàn)

設(shè)

是來(lái)自

的樣本,對(duì)方差亦可考慮如下三個(gè)檢驗(yàn)問(wèn)題:

通常假定

未知,它們采用的檢驗(yàn)統(tǒng)計(jì)量是相同的,均為

若取顯著性水平為

,則對(duì)應(yīng)三個(gè)檢驗(yàn)問(wèn)題的拒絕域依次分別為例7.2.4

某類(lèi)鋼板每塊的重量X服從正態(tài)分布,其一項(xiàng)質(zhì)量指標(biāo)是鋼板重量的方差不得超過(guò)

0.016(kg2)?,F(xiàn)從某天生產(chǎn)的鋼板中隨機(jī)抽取

25塊,得其樣本方差S2=0.025(kg2),問(wèn)該天生產(chǎn)的鋼板重量的方差是否滿足要求。解:原假設(shè)為備擇假設(shè)為此處n=25,若取

=0.05,則查表知由此,在顯著性水平0.05下,我們拒絕原假設(shè),認(rèn)為該天生產(chǎn)的鋼板重量不符合要求?,F(xiàn)計(jì)算可得二、兩個(gè)正態(tài)總體方差比的F檢驗(yàn)

設(shè)

是來(lái)自

的樣本,

是來(lái)自

的樣本??紤]如下三個(gè)假設(shè)檢驗(yàn)問(wèn)題

通常,均未知,記,分別是由算得的

的無(wú)偏估計(jì)和由

算得的

的無(wú)偏估計(jì).可建立檢驗(yàn)統(tǒng)計(jì)量:三種檢驗(yàn)問(wèn)題對(duì)應(yīng)的拒絕域依次為}。

或例7.2.5

甲、乙兩臺(tái)機(jī)床加工某種零件,零件的直徑服從正態(tài)分布,總體方差反映了加工精度,為比較兩臺(tái)機(jī)床的加工精度有無(wú)差別,現(xiàn)從各自加工的零件中分別抽取7件產(chǎn)品和8

件產(chǎn)品,測(cè)得其直徑為

X(機(jī)床甲)16.216.415.815.516.715.615.8Y(機(jī)床乙)15.916.016.416.116.515.815.715.0這就形成了一個(gè)雙側(cè)假設(shè)檢驗(yàn)問(wèn)題,原假設(shè)是

備擇假設(shè)為此處m=7,n=8,經(jīng)計(jì)算查表知于是

,若取

=0.05,其拒絕域?yàn)橛纱丝梢?jiàn),樣本未落入拒絕域,即在0.05水平下可以認(rèn)為兩臺(tái)機(jī)床的加工精度一致。

§7.3其他分布參數(shù)的假設(shè)檢驗(yàn)7.3.1指數(shù)分布參數(shù)的假設(shè)檢驗(yàn)設(shè)x1,x2

,

…,xn是來(lái)自指數(shù)分布的樣本,關(guān)于

的如下檢驗(yàn)問(wèn)題:

(7.3.1)拒絕域的形式是

,由于在

=

0時(shí),所以拒絕域?yàn)槔?.3.1

設(shè)我們要檢驗(yàn)?zāi)撤N元件的平均壽命不小于6000小時(shí),假定元件壽命為指數(shù)分布,現(xiàn)取

5個(gè)元件投入試驗(yàn),觀測(cè)到如下5個(gè)失效時(shí)間:395,4094,119,11572,6133。

解:由于待檢驗(yàn)的假設(shè)為

若取

=0.05,則檢驗(yàn)拒絕域?yàn)?

故接受原假設(shè),可以認(rèn)為平均壽命不低于6000小時(shí).經(jīng)計(jì)算得7.3.2比例的檢驗(yàn)比例

p可看作某事件發(fā)生的概率。作

n次獨(dú)立試驗(yàn),以

x記該事件發(fā)生的次數(shù),則

。我們可以根據(jù)

x檢驗(yàn)關(guān)于

p的一些假設(shè):

(1)直觀上看拒絕域?yàn)?

,由于x只取整數(shù)值,故c可限制在非負(fù)整數(shù)中。這是在對(duì)離散總體作假設(shè)檢驗(yàn)中普遍會(huì)遇到的問(wèn)題.一般情況下,對(duì)給定的

,不一定能正好取到一個(gè)正整數(shù)c使下式成立:一般較常見(jiàn)的是找一個(gè)c0,使得

(2)檢驗(yàn)的拒絕域?yàn)?c為滿足的最大正整數(shù)。(3)檢驗(yàn)的拒絕域?yàn)?或其中c1為滿足下式的最大正整數(shù):c2為滿足下式的最小正整數(shù):例7.3.2某廠生產(chǎn)的產(chǎn)品優(yōu)質(zhì)品率一直保持在

40%,近期對(duì)該廠生產(chǎn)的該類(lèi)產(chǎn)品抽檢20

件,其中優(yōu)質(zhì)品7件,在下能否認(rèn)為優(yōu)質(zhì)品率仍保持在40%?

解:以p表示優(yōu)質(zhì)品率,x表示20件產(chǎn)品中的優(yōu)質(zhì)品件數(shù),則

,待檢驗(yàn)的假設(shè)為拒絕域?yàn)榛蛴捎谙虑骳1與c2:故取c1=3,又因?yàn)閺亩鴆2=12,拒絕域?yàn)楦綆е赋?,該拒絕域的顯著性水平實(shí)際上不是0.05,而是0.0160+0.021=0.0370。由于觀測(cè)值沒(méi)有落入拒絕域,故接受原假設(shè)。

或7.3.3大樣本檢驗(yàn)

在二點(diǎn)分布參數(shù)p的檢驗(yàn)問(wèn)題中,臨界值的確定比較繁瑣,使用不太方便。如果樣本量較大,我們可用近似的檢驗(yàn)方法——大樣本檢驗(yàn)。大樣本檢驗(yàn)一般思路如下:設(shè)是來(lái)自某總體的樣本,又設(shè)該總體均值為

,方差為

的函數(shù),記為

,譬如,對(duì)二點(diǎn)分布b(1,

),其方差

(1-

)是均值

的函數(shù),則在樣本容量n充分大時(shí),

故可采用如下檢驗(yàn):由此近似地確定拒絕域。統(tǒng)計(jì)量

例7.3.3

某廠產(chǎn)品的不合格品率為10%,在一次例行檢查中,隨機(jī)抽取80件,發(fā)現(xiàn)有

11件不合格品,在

=0.05下能否認(rèn)為不合格品率仍為10%?解:這是關(guān)于不合格品率的檢驗(yàn),假設(shè)為:若取

=0.05,則u0.975=1.96,故拒絕域?yàn)?/p>

故不能拒絕原假設(shè)。因?yàn)閚=80比較大,可采用大樣本檢驗(yàn)方法。檢驗(yàn)統(tǒng)計(jì)量為例7.3.4

某建筑公司宣稱(chēng)其麾下建筑工地平均每天發(fā)生事故數(shù)不超過(guò)0.6起,現(xiàn)記錄了該公司麾下建筑工地200天的安全生產(chǎn)情況,事故數(shù)記錄如下:天數(shù)10259308010200一天發(fā)生的事故數(shù)012345合計(jì)6試檢驗(yàn)該建筑公司的宣稱(chēng)是否成立(取

=0.05)。

解:以X記建筑工地一天發(fā)生的事故數(shù),可認(rèn)為

,要檢驗(yàn)的假設(shè)是:

由于n=200很大,可以采用大樣本檢驗(yàn),泊松分布的均值和方差都是

,這里

,檢驗(yàn)統(tǒng)計(jì)量為若取

=0.05,則

u0.95=1.645,拒絕域?yàn)槿缃駏=2.556已落入拒絕域,故拒絕原假設(shè),認(rèn)為該建筑公司的宣稱(chēng)明顯不成立。

大樣本檢驗(yàn)是近似的:近似的含義是指檢驗(yàn)的實(shí)際顯著性水平與原先設(shè)

定的顯著性水平有差距,這是由于諸如(7.3.12)中

u的分布與N(0,1)有距離。如果n很大,則這種差異就很小。實(shí)用中我們一般并不清楚對(duì)一定的n,

u的分布與N(0,1)的差異有多大,因而也就不能確定檢驗(yàn)的實(shí)際水平與設(shè)定水平究竟差多少。在區(qū)間估計(jì)中也有類(lèi)似問(wèn)題。因此,大樣本方法是一個(gè)“不得已而為之”的方法。只要有基于精確分布的方法一般總是首先要加以考慮的。7.3.4檢驗(yàn)的p值假設(shè)檢驗(yàn)的結(jié)論通常是簡(jiǎn)單的:在給定的顯著水平下,不是拒絕原假設(shè)就是保留原假設(shè)。然而有時(shí)也會(huì)出現(xiàn)這樣的情況:在一個(gè)較大的顯著水平(

=0.05)下得到拒絕原假設(shè)的結(jié)論,而在一個(gè)較小的顯著水平(

=0.01)下卻會(huì)得到相反的結(jié)論。這種情況在理論上很容易解釋?zhuān)阂驗(yàn)轱@著水平變小后會(huì)導(dǎo)致檢驗(yàn)的拒絕域變小,于是原來(lái)落在拒絕域中的觀測(cè)值就可能落入接受域。但這種情況在應(yīng)用中會(huì)帶來(lái)一些麻煩:假如這時(shí)一個(gè)人主張選擇顯著水平

=0.05,而另一個(gè)人主張選

=0.01,則第一個(gè)人的結(jié)論是拒絕H0,而后一個(gè)人的結(jié)論是接受H0,我們?cè)撊绾翁幚磉@一問(wèn)題呢?例7.3.5

一支香煙中的尼古丁含量X服從正態(tài)分布N(

,1),質(zhì)量標(biāo)準(zhǔn)

規(guī)定不能超過(guò)1.5毫克?,F(xiàn)從某廠生產(chǎn)的香煙中隨機(jī)抽取20支測(cè)得其中平均每支香煙的尼古丁含量為

毫克,試問(wèn)該廠生產(chǎn)的香煙尼古丁含量是否符合質(zhì)量標(biāo)準(zhǔn)的規(guī)定。這是一個(gè)假設(shè)檢驗(yàn)問(wèn)題:H0:

1.5,H1:

>1.5,采用u檢驗(yàn),計(jì)算得:對(duì)一些的顯著性水平,表7.3.1列出了相應(yīng)的拒絕域和檢驗(yàn)結(jié)論。表7.3.1例7.3.5中的拒絕域顯著性水平拒絕域u=2.10對(duì)應(yīng)的結(jié)論

=0.05u

1.645拒絕H0

=0.025u

1.96拒絕H0

=0.01u

2.33接受H0

=0.005u

2.58接受H0我們看到,不同的

有不同的結(jié)論。

現(xiàn)在換一個(gè)角度來(lái)看,在

=1.5時(shí),u的分布是N(0,1)。此時(shí)可算得,P(u

2.10)=0.0179,若以0.0179為基準(zhǔn)來(lái)看上述檢驗(yàn)問(wèn)題,可得

當(dāng)

<0.0179時(shí),

>2.10。于是2.10就不在中,此時(shí)應(yīng)接受原假設(shè)H0;

當(dāng)

0.0179時(shí),

2.10。于是2.10就落在中,此時(shí)應(yīng)拒絕H0。u由此可以看出,0.0179是能用觀測(cè)值2.10做出“拒絕H0”的最小的顯著性水平,這就是p值。u定義7.3.1

在一個(gè)假設(shè)檢驗(yàn)問(wèn)題中,利用觀測(cè)值能夠做出拒絕原假設(shè)的最小顯著性水平稱(chēng)為檢驗(yàn)的p值。

引進(jìn)檢驗(yàn)的p值的概念有明顯的好處:第一,它比較客觀,避免了事先確定顯著水平;其次,由檢驗(yàn)的p值與人們心目中的顯著性水平

進(jìn)行比較可以很容易作出檢驗(yàn)的結(jié)論:

如果

p,則在顯著性水平

下拒絕H0;

如果

<p,則在顯著性水平

下保留H0.p值在應(yīng)用中很方便,如今的統(tǒng)計(jì)軟件中對(duì)檢驗(yàn)問(wèn)題一般都會(huì)給出檢驗(yàn)的p值。例7.3.6

設(shè)

是來(lái)自b(1,

)的樣本,要檢驗(yàn)如下假設(shè):若取顯著性水平為

,則在得到觀測(cè)值后,我們只需要計(jì)算概率:

這就是檢驗(yàn)的p值。譬如若取

=0.05,由于p<

,則應(yīng)拒絕原假設(shè)。例7.3.7

某工廠兩位化驗(yàn)員甲、乙分別獨(dú)立地用相同方法對(duì)某種聚合物的含氯量進(jìn)行測(cè)定。甲測(cè)9次,樣本方差為0.7292;乙測(cè)11次,樣本方差為0.2114。假定測(cè)量數(shù)據(jù)服從正態(tài)分布,試對(duì)兩總體方差作一致性檢驗(yàn):檢驗(yàn)統(tǒng)計(jì)量為,在原假設(shè)成立下,

F

F(8,10),拒絕域?yàn)?/p>

如今我們不是把拒絕域具體化,而是由觀測(cè)值算得F=0.7292/0.2114=3.4494,再去計(jì)算該檢驗(yàn)的p

值。

或首先,我們用F分布算得其次考慮到雙側(cè)檢驗(yàn)的拒絕域W分散在兩端,且兩端尾部概率相等(見(jiàn)圖7.3.2),據(jù)此可定出p值為

此p值不算很小,若

=0.05,則接收兩方差相等的假設(shè)。在這種雙側(cè)檢驗(yàn)情況下,如何由觀測(cè)值F=3.4494算得p值呢?圖7.3.2

觀測(cè)值F=3.4494對(duì)應(yīng)的p值由兩端尾部概率之和確定§7.4分布擬合檢驗(yàn)7.4.1總體分布只取有限個(gè)值的情況

設(shè)總體X可以分成k類(lèi),記為

,現(xiàn)對(duì)該總體作了n次觀測(cè),k個(gè)類(lèi)出現(xiàn)的頻數(shù)分別為:檢驗(yàn)如下假設(shè):n1,…,nk,且其中諸且一、諸pi均已知如果H0成立,則對(duì)每一類(lèi)Ai,其頻率ni/n與概率pi應(yīng)較接近。即觀測(cè)頻數(shù)ni

與理論頻數(shù)npi

應(yīng)相差不大。據(jù)此,英國(guó)統(tǒng)計(jì)學(xué)家K.Pearson提出如下檢驗(yàn)統(tǒng)計(jì)量:(7.4.2)并證明在H0成立時(shí)對(duì)充分大的n,(7.4.2)

給出的檢驗(yàn)統(tǒng)計(jì)量近似服從自由度為k-1的分布。拒絕域?yàn)?例7.4.1

為募集社會(huì)福利基金,某地方政府發(fā)行福利彩票,中彩者用搖大轉(zhuǎn)盤(pán)的方法確定最后中獎(jiǎng)金額。大轉(zhuǎn)盤(pán)均分為20份,其中金額為5萬(wàn)、10萬(wàn)、20萬(wàn)、30萬(wàn)、50萬(wàn)、100萬(wàn)的分別占2份、4份、6份、4份、2份、2份。假定大轉(zhuǎn)盤(pán)是均勻的,則每一點(diǎn)朝下是等可能的,于是搖出各個(gè)獎(jiǎng)項(xiàng)的概率如下:

概率0.10.20.30.20.10.1額度5萬(wàn)10萬(wàn)20萬(wàn)30萬(wàn)50萬(wàn)100萬(wàn)現(xiàn)20人參加搖獎(jiǎng),搖得5萬(wàn)、10萬(wàn)、20萬(wàn)、30萬(wàn)、50萬(wàn)和100萬(wàn)的人數(shù)分別為2、6、6、3、3、0,由于沒(méi)有一個(gè)人搖到100萬(wàn),于是有人懷疑大轉(zhuǎn)盤(pán)是不均勻的,那么該懷疑是否成立呢?這就需要對(duì)轉(zhuǎn)盤(pán)的均勻性作檢驗(yàn)。解:這是一個(gè)典型的分布擬合優(yōu)度檢驗(yàn),總體共有6類(lèi),其發(fā)生概率分別為0.1、0.2、0.3、

0.2、0.1和0.1,這里k=6,檢驗(yàn)拒絕域?yàn)?由本例數(shù)據(jù)可以算出若取

=0.05,則查附表3知=由于未落入拒絕域,故接受原假設(shè),沒(méi)有理由認(rèn)為轉(zhuǎn)盤(pán)不均勻。在分布擬合檢驗(yàn)中使用p值也是方便的。本例中,以T記服從

(5)的隨機(jī)變量,則使用統(tǒng)計(jì)軟件可以算出這個(gè)p值就反映了數(shù)據(jù)與假設(shè)的分布擬合程度的高低,p值越大,擬合越好。二、諸pi不完全已知

若諸

由r(r<k)個(gè)未知參數(shù)

確定,即

首先給出

的極大似然估計(jì)然后給出諸

的極大似然估計(jì)Fisher證明了

在H0成立時(shí)近似服從自由度為k-r-1的

分布,于是檢驗(yàn)拒絕域?yàn)槔?.4.2

盧瑟福在2608個(gè)等時(shí)間間隔內(nèi)觀測(cè)一枚放射性物質(zhì)放射的粒子數(shù)X,表7.4.1是觀測(cè)結(jié)果的匯總,其中ni表示2608次觀測(cè)中放射粒子數(shù)為i的次數(shù)。

ni572033835255324082731394527106i012345678910

11試?yán)迷摻M數(shù)據(jù)檢驗(yàn)該放射物質(zhì)在單位時(shí)間內(nèi)放射出的粒子數(shù)是否服從泊松分布。

解:本例中,要檢驗(yàn)總體是否服從泊松分布。

觀測(cè)到0,1,…,11共12個(gè)不同取值,這相當(dāng)于把總體分成12類(lèi)。這里有一個(gè)未知參數(shù)

,采用極大似然估計(jì),

=將

代入可以估計(jì)出諸

。于是可計(jì)算出列表如下。012345678910115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.53431.45250.01207.66730.16580.12580.0158合計(jì)26081.00002068=12.8967i本例中

=12.8967<18.307,故接受原假設(shè)。使用統(tǒng)計(jì)軟件可以計(jì)算出此處檢驗(yàn)的p值是0.2295。

若取

=0.05,則列聯(lián)表是將觀測(cè)數(shù)據(jù)按兩個(gè)或更多屬性(定性變量)分類(lèi)時(shí)所列出的頻數(shù)表。例如,對(duì)隨機(jī)抽取的1000人按性別(男或女)及色覺(jué)(正?;蛏?兩個(gè)屬性分類(lèi),得到如下二維列聯(lián)表,又稱(chēng)2×2表或四格表。

7.4.2

列聯(lián)表的獨(dú)立性檢驗(yàn)?zāi)?3565女38218性別視覺(jué)正常色盲一般,若總體中的個(gè)體可按兩個(gè)屬性A與B分類(lèi),A有r個(gè)類(lèi)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論