《統(tǒng)計學》課件-第10章 假設檢驗_第1頁
《統(tǒng)計學》課件-第10章 假設檢驗_第2頁
《統(tǒng)計學》課件-第10章 假設檢驗_第3頁
《統(tǒng)計學》課件-第10章 假設檢驗_第4頁
《統(tǒng)計學》課件-第10章 假設檢驗_第5頁
已閱讀5頁,還剩171頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

10

假設檢驗【學習目標】建立解假設檢驗的基本概念,掌握假設檢驗的基本原理;理解僅依靠樣本進行決策的風險;能運用假設檢驗解決各種實際問題;掌握用

p值方法進行假設檢驗。10.1概述10.1.1假設檢驗在經濟管理活動中,人們需要對各種各樣的現象進行判斷,以期做出正確的決策。但是,人們所面對的是往往是隨機現象,并且所掌握和信息也是有限的,于是就產生了這樣一個問題:怎樣利用較少的信息對總體現象進行決策。下面我們通過一個例子來說明這個問題。【例

10-1】全國政協(xié)委員馮丹龍建議:完善兒童用藥安全管理

3

3

日,全國政協(xié)委員、馮玉祥之孫女馮丹龍,在接受法制晚報·看法新聞記者采訪時表示,今年她的建議是建立和完善兒童用藥法律法規(guī),同時加強對兒童藥品研發(fā)生產的監(jiān)管。馮丹龍認為,兒童用藥,安全是重中之重。兒童作為一個特殊用藥群體,各器官發(fā)育未成熟,對藥品的用法用量有其特殊要求。目前,臨床上兒童用藥不當方面均有不同程度的問題,需要及時改進和提高。

據《半月談》雜志報道,中國兒童用藥不良反應發(fā)生率為

12.9%,其中新生兒高達

24.4%,分別是成人的

2

倍和

4

倍。中國醫(yī)藥工業(yè)信息中心的數據顯示,全國藥品生產企業(yè)有

8000多家,其中專門生產兒童用藥的企業(yè)僅占

0.1%。在藥品臨床實驗注冊項目中,國產藥品注冊信息達到

16

萬多條,其中兒童藥品僅有2000

多條。

目前,兒童給藥劑量多依據成人劑量,再通過體重換算、體表面積換算、年齡換算等方法來確定?!皟和^非成人的‘微縮版’,具有其本身的生理特點。將成人藥酌減給兒童使用,缺乏科學依據和循證醫(yī)學證據。”河南省人民醫(yī)院兒科主任高麗表示。(北青網

2018-03-03)

生產兒童藥物劑量控制非常重要,劑量少了達不到治療效果,劑量大了可能出現不良反應。在生產過程中,我們怎樣判斷兒童藥物的劑量是否合格呢?顯然,不可能將全部的藥物都進行檢測,我們能做的只是檢測其中的一小部分。

假設一條生產兒童注射液的自動生產線的標準劑量是每支

12ml,由于各種偶然因素的影響,生產過程中罐裝劑量可能會產生偏差,假設允許偏差為

0.5ml。如果某一天,質檢檢測了

36

支,得到平均值為

12.3ml,這時生產線工作正常嗎?解:這個問題可以歸納為一個統(tǒng)計問題:

生產線生產正常時標準劑量為

12ml,即總體均值

12

;允許的偏差為

0.5ml,即總體的標準差

0.5

;抽取樣本容量為

36

的樣本,得到

。這時,我們能否依據這個樣本信息判斷

12

還成立嗎?

這個問題我們有兩個選擇:

12(生產線工作正常)和

12(生產線工作不正常),在總體標準差

0.5

的條件下,抽取樣本容量為36

的樣本,已知的樣本信息是

。我們希望利用這個樣本信息來對上述兩個選擇做出決策。樣本均值是統(tǒng)計量,是隨機變量,而總體均值是參數,是確定的值,我們的目的是利用統(tǒng)計量來對參數的取值做出判斷。一般地,利用樣本統(tǒng)計量對總體參數的取值做出決策的統(tǒng)計方法,稱為假設檢驗。10.1.2.假設檢驗的方法

一般來說,假設檢驗可以分成四個步驟:1)建立假設;2)確定檢驗統(tǒng)計量以及分布;3)設定顯著性水平,確定臨界值和拒絕域;4)計算檢驗統(tǒng)計量的值,做出決策。每個步驟的變化都會產生不同的假設檢驗,我們分步驟具體解釋假設檢驗的基本概念和方法。1.假設

所謂假設就是某些對客觀事物特征的初始判斷或者說斷言;用統(tǒng)計語言表達就是對總體參數的取值所作的斷言。由于這些斷言成立的理由并不充分,所以有對這些斷言進行檢驗的要求。

例如,在例

10-1

中,我們需要經常監(jiān)測生產線的工作狀態(tài)。雖然有嚴格的標準和先進的生產線,但由于生產過程會受到各樣偶然因素的影響,罐裝劑量可能會偏離標準劑量。在這里

12(生產線工作正常)就是一個假設(斷言),但是這個假設不一定成立,即可能出現另外一種情況:

12

(生產線工作不正常),如果是這種情況則需要對生產線的生產狀態(tài)進行檢修。假設包括原假設和備擇假設。原假設記為H

0

,是研究者懷疑的、反對的,而且是要被檢驗的假設。在例

10-1

中,H

0

:

12

就是原假設,質檢人員(研究者)之所以進行檢測,就是懷疑生產線工作不正常,檢測的目的就是在判斷

12

是否成立。備擇假設記為

H1

,是研究者支持的假設。在例

10-1

中,H1

:

12

就是備擇假設,是質檢人員(研究者)之所以進行檢測,就是支持

12

。原假設和備擇假設構成完備事件組,非此既彼,不存在第三種情況。假設檢驗的目的就是搜集證據反對(檢驗)原假設,如果沒有足夠的證據拒絕原假設,則只能選擇其反面—不拒絕原假設。

為了進行假設檢驗,首要步驟就是建立假設。一般情況下先建立備擇假設,這是因為備擇假設是研究者支持的假設,一般觀點明確,容易表達。當備擇假設確定后,其對立事件就是原假設?!纠?/p>

10-2】某果汁飲料包裝容量為

500ml/盒,灌裝過多或過少都會被認為包裝的容量不合格。質檢人員需要定期抽樣檢測容量,判斷灌裝生產線生產是否正常,試建立對應的假設。解:這個問題中質檢人員是研究者,他支持的觀點是生產線生產不正常,否則他就不需要進行檢測了。由于灌裝過多或過少都會被認為不正常,故備擇假設為:H1

:

500,從而原假設為:H

0

:

500

。【例

10-3】某品牌汽車輪胎的生產商聲稱其生產的輪胎行駛里程不少于

80000km。

為了驗證這個說法,某汽車俱樂部對該品牌輪胎的行駛里程進行抽樣調查,試建立對應的假設。解:這個問題中汽車俱樂部是研究者,他支持的觀點是該品牌輪胎的行駛里程達不到

80000km,否則他就不會進行抽樣調查。由于他支持的觀點是該品牌輪胎的行駛里程達不到

80000km,故備擇假設為:

H1

:

80000

,從而原假設為:

H

0

:

80000

由上述兩個例子可以看出建立假設的一些特點:1)假設有不同的方向性。在例

10-2

中,樣本統(tǒng)計量的值比

500

過大或過?。p側),都有一定的理由拒絕H

0

:

500

,這樣的檢驗稱為雙側檢驗或雙尾檢驗;在例

10-3

中,樣本統(tǒng)計量的值只有比

80000過?。▎蝹龋┎庞幸欢ɡ碛删芙^H

0

:

80000

,這樣的檢驗稱為單側檢驗或單尾檢驗。表

10-1

總體均值假設檢驗的基本形式

為總體均值,

0為假設的總體均值的取值,我們可以將假設的基本形式總結如表

10-1

所示的形式。假設雙側檢驗單側檢驗左側檢驗右側檢驗原假設

備擇假設

假設的方向性與具體的問題有關,也與研究者的地位有關,因為不同地位的研究者會有不同的觀點。如在例

10-2中,如果研究者換成工商管理人員,他可能更關心的是果汁生產廠商是否對消費者有欺詐行為,也就是H1

:

500

,這時就有H

0

:

500

,這是一個單側檢驗中的左側檢驗。2)假設中所有的等號“=”設置在原假設中。包括“=”、“≤”、“≥”都設置在原假設中,這是因為假設檢驗是目的是檢驗原假設,而且在邏輯方法是反證法—先假設原假設為真,再試圖導出矛盾的結果,這樣就要求原假設要“明確”地包含所有要檢驗的情況。3)上述例子中只涉及到總體均值的假設,類似的可以建立總體比率、總體方差的假設,同樣有雙側和單側檢驗。2.檢驗統(tǒng)計量

對不同的總體參數進行檢驗,需要用到不同的樣本統(tǒng)計量。如對總體均值進行檢驗,需要用到樣本均值;對總體比率進行檢驗,需要用到樣本比率;對總體方差進行檢驗,需要用到樣本方差等等。但是,樣本統(tǒng)計量并不能很好地幫助我們做出判斷,進行參數的假設檢驗需要構造檢驗統(tǒng)計量。

我們以例

10-1

來說明。生產線生產正常時標準劑量為12ml,即總體均值

12

;允許的偏差為0.5ml,即總體的標準差

0.5

;抽取樣本容量為36

的樣本,得到

。這時,我們能否依據這個樣本信息判斷

12

還成立嗎?

這個問題要對下列假設進行檢驗:

H

0

:

12

H1

:

12

。

顯然,樣本統(tǒng)計量

偏離總體均值

越遠,我們拒絕原假設的理由就越充分?,F在我們得到的樣本統(tǒng)計量

,這個值偏離

12

足夠遠嗎?雖然絕對差異只有

0.3,但是這是

36

支的平均差異,因為誤差有正有負,可以互相抵消,0.3

可能是一個很大的差異。為此,我們要構造檢驗統(tǒng)計量進行判斷。

我們先假定原假設為真,即

12

。由于樣本容量為

36(大樣本),

0.5

(總體方差已知),由中心極限定理得:(10-1)

由于

服從正態(tài)分布,在

12

為真的假定條件下,的取值偏離

12

足夠遠的概率是非常小的,所以我們可以用概率來表示

偏離

12

的程度。設

的取值偏離

12

足夠遠的概率為

,在雙側檢驗中

相對于

12

的偏離可以是正偏離,也可以負偏離,所以

被平分在兩側,單側面積為

,如圖

10-1

所示。于是我們就可以有一個直觀的判斷:如果

的值落入圖

10-1

中的陰影部分區(qū)域,

的值就偏離

12

足夠遠,就有足夠的理由拒絕原假設,否則不拒絕原假設。圖

10-1

樣本均值的分布

現在得到的

,這個值落入到如圖

10-1

所示的陰影部分區(qū)域了嗎?從絕對差異顯然是不好判斷的,為此我們做標準化變換:(10-2)

的抽樣分布變換為標準正態(tài)分布,如圖

10-2

所示。經過標準化變換后,將

12

變換到

z=0,兩側陰影部分的面積不發(fā)生變化。圖

10-2

標準正態(tài)分布由公式(10-2)可以計算得:(10-3)

即標準化變換將

變換到了z=3.6。如果

z=3.6

偏離

0

足夠的遠,即落入到圖

10-2

的陰影部分區(qū)域,則

就一定落入到圖10-1

的陰影部分區(qū)域,這時

偏離

12

足夠的遠,我們就有足夠的理由拒絕原假設?,F在的問題是我們怎樣判斷

z=3.6

是否落入到圖

10-1

的陰影部分區(qū)域。

由于標準正態(tài)分布的標準差

,由概率論知識可知在±3倍的標準差以外的

z

值是非常非常少的,大約只有

0.0027=0.27%,而現在我們得到的z=3.6,已經超過了±3

倍的標準差以外,于是我們就有足夠的理由認為

z=3.6

落入到圖

10-2

的陰影部分區(qū)域,從而

落入到圖

10-1

的陰影部分區(qū)域,我們有足夠的理由拒絕原假設。在這個過程中,我們是以z值進行檢驗的,其構造方式由式(10-2)決定的,故稱其為檢驗統(tǒng)計量。由于這個檢驗統(tǒng)計量服從標準正態(tài)分布,所以這個檢驗統(tǒng)計量稱為

z檢驗統(tǒng)計量。z檢驗統(tǒng)計量的絕對值越大,表示

之間偏離越遠,拒絕原假設的理由越充分,反之,不拒絕原假設的理由越充分。

不同的假設檢驗需要構造相應的檢驗統(tǒng)計量。3.

拒絕域與顯著性水平由上段分析可知,我們可以用

z檢驗統(tǒng)計量進行假設檢驗,基本方法是:如果

z檢驗統(tǒng)計量的值落入到圖

10-2

的陰影部分區(qū)域則拒絕原假設,否則不拒絕假設。所以圖

10-2

的陰影部分區(qū)域稱之為拒絕域,其含義是可以做出拒絕原假設決策的區(qū)域。拒絕域范圍是由什么因素決定的呢?由于標準正態(tài)分布是確定的,從圖

10-2

可以看出,拒絕域范圍是由我們設定的

的取值偏離

足夠遠的概率

決定的。

的值越大(陰影部分的面積越大),拒絕域的范圍也越大;反之,拒絕域的范圍也越小。

稱為顯著性水平。統(tǒng)計上的“顯著”并不表示“重要”,而是代表這個結果是“非偶然的”。一般來說

的值由研究者主觀確定,

的值都很小,常用的取值有

0.10、0.05、0.01,也可以取其他的值。顯著性水平可以認為是研究者拒絕原假設時所要承擔的風險,即原假設為真,但卻做出了拒絕原假設的決策。因為我們是依據樣本信息做出決策的,而樣本是有偶然性,并不能保證

100%的正確,如果取

0.05

,就意味著研究者拒絕原假設時所要承擔的風險最高不超過

0.05,那么1

0.95

就是可靠水平,稱為置信水平。由圖

10-2可見顯著性水平越小,結論的可靠性越大。怎樣構造拒絕域呢?由于拒絕域是由標準正態(tài)分布以及顯著性水平

確定的,構造拒絕域的關鍵是要確定如圖

10-2

中陰影部分的臨界值。記這個臨界值為

,由概率論知識可知,可以通過查標準正態(tài)分布表得到

。如果取

0.05

,則

Z

0.025

1.96

,故雙側檢驗的拒絕域為(-∞,-1.96),(1.96,+∞),如圖

10-3a)所示。如果是單側檢驗,則要分左側檢驗和右側檢驗。在例

10-3

中,只有當樣本足夠小時才能拒絕原假設,所以其拒絕域在左側,是左側檢驗。如果取

0.05

,查表得Z

Z

0.05

1.64

,故左側檢驗的臨界值為-1.64,拒絕域為(-∞,-1.64),如圖

10-3b)所示。同理,右側檢驗的拒絕域為(1.64,+∞),如圖

10-3c)所示。a)雙側檢驗b)左側檢驗c)右側檢驗4.決策規(guī)則

由上面的分析可以看出,我們是依據樣本統(tǒng)計量與假定為真的參數取值(原假設)之間的差異來判斷是否能拒絕原假設的。這種差異的本質是一種誤差,形成這種誤差的原因有兩個:一是隨機原因,這是由樣本的隨機性形成的,稱之為隨機性誤差;二是系統(tǒng)原因,這是由我們假定參數的取值為真(原假設為真)形成的,稱之為系統(tǒng)性誤差,其含義是參數真實的取值不是我們假定的哪個值。

直觀的理解,如果樣本統(tǒng)計量的值偏離假定為真的參數取值越“遠”,則這種誤差是系統(tǒng)性誤差的可能性越大,我們拒絕原假設的理由就越充分;反之,則不能拒絕原假設。

判斷樣本統(tǒng)計量的值離假定為真的參數的取值“遠”需要用檢驗統(tǒng)計量,由于條件不同,檢驗統(tǒng)計量的分布也不同,在上段中我們確定的檢驗統(tǒng)計量服從標準正態(tài)分布,即

z

檢驗統(tǒng)計量。由樣本為統(tǒng)計量的值可計算出檢驗統(tǒng)計量的值,如果檢驗統(tǒng)計量的值離

0過“遠”,我們就可以認為樣本統(tǒng)計量與假定為真的參數取值之間的誤差是系統(tǒng)性誤差,從而有足夠的理由拒絕原假設。以什么標準判斷“遠”呢?這個標準就是拒絕域的臨界值。如果檢驗統(tǒng)計量的值超過了臨界值,則說明已經顯著的“遠”了,或者說這種“遠”是非偶然的(不是偶然原因形成的,或者說是顯著的),這時就有理由能拒絕原假設了。

這樣,我們可以歸納出假設檢驗的決策規(guī)則,見表

10-2。表

10-2 z

檢驗決策規(guī)則注:

為顯著性水平檢驗檢驗統(tǒng)計量與臨界值的比較決策結果雙側檢驗拒絕原假設單側檢驗左側檢驗拒絕原假設右側檢驗拒絕原假設

特別需要注意的是,如果不能做出拒絕原假設的決策時,我們應該表達為“不拒絕原假設”,而不應該表達為“接受原假設”。這兩種表達形式是有本質區(qū)別的,不拒絕原假設的含義是說還沒有足夠的證據證明原假設為假(并沒有認定原假設一定為真),而接受原假設的含義是原假設為真。5.第Ⅰ類錯誤與第Ⅱ類錯誤

在假設檢驗中,我們是依據樣本信息做出的決策。由于樣本具有偶然性,所以決策結果并不能保證

100%正確,或者說是可能犯錯誤的。假設檢驗中可能犯的錯誤分為兩類:第Ⅰ類錯誤與第Ⅱ類錯誤。第Ⅰ類錯誤也稱之為“拒真錯誤”,是指原假設實際上為真,但卻被錯誤的拒絕了;第Ⅱ類錯誤也稱之為“存?zhèn)五e誤”,是指原假設實際為假,但卻沒有拒絕它。假設檢驗中可能出現四種不同的結果,歸納起來如表

10-3

所示。表

10-3

假設檢驗中的四種結果不拒絕原假設拒絕原假設原假設實際為真結論正確結論錯誤Ⅰ(拒真)原假設實際為假結論錯誤Ⅱ(存?zhèn)危┙Y論正確

人們經過比較認為犯第Ⅰ類錯誤的后果要比犯第Ⅱ類錯誤的后果嚴重。第Ⅰ類錯誤的后果好比一個人是清白的(原假設為真),但卻被判其有罪(拒絕原假設);第Ⅱ類錯誤的后果好比一個人有罪(原假設為假),但卻被判無罪釋放(不拒絕原假設)。冤枉一個好人的后果顯然要比放過一個壞人的后果要嚴重的多,因為一旦有證據還是可以將壞人繩之以法的,所以人們總想辦法來控制犯第Ⅰ類錯誤的可能性。

犯第Ⅰ類錯誤是這樣的情形發(fā)生了:雖然原假設為真,但檢驗統(tǒng)計量的值卻落入到拒絕域,從而做出了拒絕原假設的決策。因為拒絕域對應的概率為

,所以犯第Ⅰ類錯誤的可能性就是顯著性水平

,所以一般做假設檢驗時,人們都會將

假定的比較?。ㄐ「怕剩?,目的之一就是要控制犯第Ⅰ類錯誤的可能性。我們將犯第Ⅱ類錯誤的可能性記為

,控制和計算

比較復雜。

于是,很多人就會有這樣一個想法,能不能同時使

都小?這個愿望是無法實現的,這是因為這兩種可能性是一個此消彼長的關系,我們以單側檢驗繪制一張示意圖來說明兩者之間的關系,如圖

10-4。

假設問題是一個右側檢驗:

H

0

:

0,

H1

:

0。如果檢驗統(tǒng)計量的值沒有落入拒絕域(

的面積,圖

10-4

的上側),且原假設不正確,那么第Ⅱ類錯誤就發(fā)生了。由于原假設不正確,故真實的

0要比原來假設的

0大,如圖

10-4

的下側,顯然第Ⅱ類錯誤發(fā)生的概率是除去

的部分,如果減少

的面積,則會增加

的面積。圖

10-4

的關系所以我們一般是事先設定一個較小的

。10.2一個總體的參數檢驗

本節(jié)將具體討論對三種總體參數的檢驗,分別是總體均值

、總體比率

和總體方差

2

。上一節(jié)中的各種概念和方法都會在本節(jié)內容中出現,但由于檢驗的參數不同,構造檢驗統(tǒng)計量的方法也不同。10.2.1

總體均值的假設檢驗1.大樣本、總體方差已知在這個條件下,由中心極限定理可知,樣本均值服從正態(tài)分布,故我們可以構造z

檢驗統(tǒng)計量。(10-4)式中

——樣本均值;μ—-假設的總體均值

——總體標準差;n—-樣本容量【例

10-4】某果汁飲料包裝容量為

500ml/盒,為了判斷罐裝生產線生產是否正常,質檢人員需要定期抽樣檢測容量。假如某天質檢人員抽取

64

盒果汁飲料時行檢測,得到平均容量為

505ml/盒,總體標準差

15

,這時罐裝生產線工作是否正常?(取

0.05

)解:已知:n=64,

,

15

0.05建立假設由于研究者是質檢人員,他支持的觀點是生產線工作不正常,所以這個問題的假設是:H

0

:

500

,

H1

:

500選擇合適的檢驗統(tǒng)計量由于是大樣本,總體方差已知,那么使用z

檢驗。

3)在本例中

0.05

,查表得

,故拒絕域為(-∞,-1.96),(1.96,+∞)。4)計算檢驗統(tǒng)計量的值

由于

,故拒絕原假設。說明有足夠的證據證明這時生產線的生產是不正常的,罐裝量比標準值偏高(檢驗統(tǒng)計量的值為正)。本例題結果的示意圖如下:圖

10-5

Z

分布及臨界值Z

分布【例

10-5】在例

10-4

中,如果將研究者換成工商管理人員,抽查了

64

盒這種果汁飲料進行檢測,得到平均容量為

498

ml/盒,總體標準差

15

,在

0.05

水平下,工商管理人員將做出怎樣的判斷?解:已知:n=64,

15

,

0.05因為工商管理人員支持的觀點是生產廠商可能有少罐裝的嫌疑,故這時的假設形式為:H

0

:

500

,

H1

:

500

這是一個單側檢驗中的左側檢驗,拒絕域在左側。

0.05

時有,故拒絕域為(-∞,-1.64)。計算檢驗統(tǒng)計量的值:

由于

z

1.067

Z

0.05

1.64

,z=-1.067

沒有落入拒絕域,故不拒絕原假設,沒有足夠的理由證明生產廠商有少罐裝的行為。左側檢驗的結果示意圖如下:圖

10-6

左側檢驗

在上面的檢驗中是采用比較檢驗統(tǒng)計量的值與臨界值的方法,這種方法稱為臨界值法,是假設時經常用到的方法。除此以外,還可以用

p

值方法進行假設檢驗。

在之前的方法中,顯著性水平是在檢驗之前就確定的,這就意味著事先確定了拒絕域,使我們有一個明確的取舍標準。但此方法不足的是,顯著性水平是犯第Ⅰ類錯誤的上限,它只能提供檢驗結果可靠性是否及格,對一個具體的檢驗問題,不能給出其可能性的精確度量。

p

值是利用檢驗統(tǒng)計量的值計算出的一個概率值,雙側檢驗和單側檢驗的

p

值有所區(qū)別,通俗的講,p

值是檢驗統(tǒng)計量的值與拒絕域方向相同的外側面積,我們以

z

檢驗為例繪制

p

值的示意圖,如圖

10-7

所示。a)雙側檢驗b)左側檢驗c)右側檢驗圖

10-7

假設檢驗的

p

雙側檢驗的

p

值在兩側,而單側檢驗中的左側檢驗

p

值在左側,右側檢驗

p

值在右側。

由圖

10-7

可以看出,

p

值越小則說明樣本統(tǒng)計量與總體參數越不一致,越不利于原假設。如果計算得到

p

,則說明

p

值的臨界值(檢驗統(tǒng)計量的值)落入拒絕域,故拒絕原假設,否則不拒絕。

Z

分布的

p

值可以用Excel

計算得到。首先計算檢驗統(tǒng)計量的值,再利用NORM.S.DIST

函數計算出標準正態(tài)分布對應的下側面積,從而可以計算出

p

值。在例

10-4

中,z=2.67,可以得到其下側面積為

0.999841,則其上側面積為

0.000159,故對應的

p=0.000159×2=0.000318,如圖10-7a)。此時有

p=0.000318<

0.05

,故拒絕原假設。

在例

10-5

中,由于

z=-1.067,這時要計算

z=1.067

上側的面積(因為

z=1.067

上側面積與

z=-1.067

下側面積相等,而

NORM.S.DIST

函數只能計算正值的上側面積)。計算得到

p=0.142986,如圖

10-7b)。此時有

p=0.142986>

0.05

,故不拒絕原假設。表

10-4大樣本、總體方差已知條件下一個總體均值的檢驗方法雙側檢驗左側檢驗右側檢驗假設檢驗統(tǒng)計量拒絕域p值決策規(guī)則如果則拒絕H02.小樣本、總體方差已知

由于小樣本有更大的偶然性,需要承擔更大的風險,所以在這個條件下需要增加一個條件:總體服從正態(tài)分布,這樣,檢驗的方法與大樣本時完全相同?!纠?/p>

10-6】某品牌汽車的生產商聲稱其生產的一款

2.0L

排量的自動檔轎車的油耗不超過

8L/100km。為了證實這個說法,一家汽車俱樂部對該款車進行了調查,由抽取的

16

輛車計算得到的平均油耗是8.9

L/100km,假設總體服從正態(tài)分布,總體標準差

1.5

L/100km,顯著性水平

0.05

,這些數據能支持汽車生產商的說法嗎?解:已知:n=16,

,

1.5

0.05由于研究者是汽車俱樂部,故他們支持的觀點是這款轎車的油耗要大于

8L/100km,故:H

0

:

8

,

H1

:

8由于總體服從正態(tài)分布,在小樣本、總體方差已知的條件下,仍然使用

z

檢驗。查表得:

Z

Z

0.05

1.64

,拒絕域為(1.64,+∞)。計算檢驗統(tǒng)計的值得:

由于z

2.4

Z

0.05

1.64

,檢驗統(tǒng)計量的值落入到拒絕域,故拒絕原假設,汽車生產商說法不能成立。

如果使用

p

值方法,則要計算

z=2.4

對應的

p

值。由

Excel

計算得

p=0.008198,則有

p=0.008198<

0.05

,故同樣拒絕原假設。檢驗結果如圖

10-8

所示。圖

10-8

汽車油耗的假設檢驗3.大樣本、總體方差未知

總體方差是參數,在實際問題中一般是未知的。在這樣的條件下,我們需要用樣本標準差

s

來代替總體標準差

。這時,經過標準化變換的檢驗統(tǒng)計量不再服從標準正態(tài)分布了,而是服從自由度為(n-1)的

t

分布。故此時的檢驗統(tǒng)計量稱為t

檢驗統(tǒng)計量,檢驗也稱為

t

檢驗。(10-5)式中

—樣本均值s—樣本標準差n—樣本容量【例

10-7】國家電器產品安全質量監(jiān)督檢驗中心,是經中國合格評定國家認可委員會(CNAS)認可的國家級實驗室、國際電工委員會電工產品及元件合格評定組織(IECEE)認可的國際CB

實驗室、中國國家認證認可監(jiān)督管理委員會(CNCA)指定的國家強制性產品認證(CCC)檢測實驗室,是中國質量認證中心(CQC)、廣東質檢中誠認證有限公司(CTC)等認證機構簽約的CCC

認證檢驗和自愿認證檢驗實驗室,工業(yè)產品生產許可證檢驗實驗室,也是中國能效標識中心備案的能效標識能源效率檢測實驗室。

受某冰箱生產企業(yè)的委托,對其生產的型號為

BCD-216SDX

冰箱進行檢測,其中一項是對冰箱的耗電量進行檢測,這款冰箱標注的耗電量是

24

小時

0.58

千瓦時。假設抽檢了

36

臺此款冰箱,得到

24小時耗電量的數據(數據見

Data10-1),如果取

0.05

這些數據能支持生產商的說法嗎?解:由樣本數據計算得:

X

0.63

,

s

0.16

,且n=36,

0.05

作為第三方檢測機構,其應該站在保護消費者的立場上,故假設為:

H

0

:

0.58

,

H1

:

0.58

由于是大樣本,總體方差未知,故檢驗統(tǒng)計量服從自由度為

35的

t

分布。查表得:

t

(n

1)

t0.05

(35)

1.69

,故拒絕域為(1.69,+∞)。計算檢驗統(tǒng)計量的值得:由于t

1.875

t0.05

1.69

,故拒絕域原假設,這些數據不支持生產商的說法,說明平均而言這款冰箱的

24

小時耗電量超過其標注的0.58

千瓦時。如果用

p

值方法,過程如下:在Excel

中運用TDIST

函數可得t=1.875

上側的面積

p=0.034578,由于

p=0.034578<

0.05

,故拒絕原假設。檢驗的結果如下圖所示。圖

10-9

冰箱

24

小時耗電量的假設檢驗4.小樣本、總體方差未知

當小樣時,與

z

檢驗一樣要求總體服從正態(tài)分布,仍然使用

t檢驗。【例

10-8】某品牌手工速凍餃子包裝袋上標注的凈含量為

500

克。為了簡化包裝手續(xù),生產車間憑經驗認為餃子速凍后的平均重量為20

克,所以決定每袋裝

25

個餃子。質檢部門在生產線上隨機抽取了

25

個餃子,在速凍的狀態(tài)下稱得重量(數據見

Data10-2),假設總體服從正態(tài)分布,顯著性水平設為

0.05,質檢部門能從這些數據和計算結果中可以得到怎樣的結論?解:由樣本數據計算得:

,s=1.8,且n=25,

0.05

。

研究者是質檢部門,支持的觀點是餃子的平均重量不是

20

克,故假設為:

H

0

:

20

H1

:

20

由于總體服從正態(tài)分布,在小樣本、總體方差未知的條件下,仍然使用

t

檢驗。查表得:

t

2

(n

1)

t0.025

(24)

2.06

,故拒絕域為(-∞,-2.06),(2.06,+∞)。計算檢驗統(tǒng)計量的值:

由于

,故拒絕原假設,說明這時生產的速凍餃子的重要平均不足

20

克,如果每袋裝

25

個餃子,總重量會低于

500克(檢驗統(tǒng)計量的值為負)。

如果用

p

值方法,過程如下:

Excel

中運用

TDIST

函數可得

t=2.5

雙側的面積

p=0.019654,由于

p=0.019654<

0.05

,故拒絕原假設。檢驗的結果如下圖所示。圖

10-10

速凍餃子重量的假設檢驗表

10-5

總體方差未知條件下一個總體均值的檢驗方法

由上述過程我們可以歸納出假設檢驗的一般方法和邏輯關系:首先假定原假設為真(反證法);在原假設為真的前提下,檢驗統(tǒng)計量服從某種分布(中心極限定理);如果原假設為真,則由樣本計算得到的檢驗統(tǒng)計量的值不會落入到小概率區(qū)域(拒絕域)。若檢驗統(tǒng)計量的值落入到小概率區(qū)域,則有理由認為原假設不為真(小概率原理)。10.2.2

一個總體比率的假設檢驗

當數據以定性的方式表示時,就涉及到數據分析中的比率問題。例如市場研究人員想知道產品消費者中女性的比率是否上升,制造車間的質量控制人員想確定次品率是否符合要求等等。通常用字母

表示總體比率,用p

表示樣本比率。

總體比率的假設檢驗同樣有雙側檢驗和單側檢驗,檢驗的方法與總體均值的檢驗方法相同,有臨界值法和p值方法,但檢驗統(tǒng)計量的形式有所區(qū)別。

由中心極限定理可知,從兩項分布總體中進行隨機抽樣,當樣本容量很大時,其樣本比率

p

近似服從正態(tài)分布,所以總體比率也能進行和總體均值類似的假設檢驗,我們使用的是

z

檢驗,要注意使用這種方法的前提是大樣本,此時大樣本標準是以下兩個條件需同時成立:

n

5

n(1

)

5

,或者參考表

8-5

中的經驗值。一個總體比率的z

檢驗統(tǒng)計量為(10-6)式中

p

——樣本比率;

n

——樣本容量?!纠?/p>

10-9】

某購物網站的管理層認為在其網站上網購的客戶超過75%為女性。為了證實這個推測,網站的營銷部門做一次專門調查。營銷部門隨機抽取了

400

位客戶進行調查,其中

280

位客戶是女性,設

0.05

,這些數據支持管理層的推測嗎?解:已知:n=400,

0.05

,由樣本數據可計算得:營銷部門支持的觀點是女性客戶不會超過75%,故:H

0

:

75%

,

H1

:

75%由于n=400,顯然是大樣本,檢驗統(tǒng)計量服從標準正態(tài)分布,故用

z

檢驗。查表得:Z

Z

0.05

1.64

,由于是左側檢驗,所以拒絕域為(-∞,-1.64)計算檢驗統(tǒng)計量的值得:由于z=-2.31<

Z

0.05

1.64

,檢驗統(tǒng)計量的值落入到拒絕域,故拒絕原假設,在該網站網購的客戶中女性不超過

75%。

如果用

p

值方法,過程如下:

在Excel

中,運用

NORM.S.DIST

函數計算

z=2.31

上側的面積,可得

p=0.0104444,因為

p=0.010444<

0.05

,故拒絕原假設。檢驗的結果如下圖所示。圖

10-11

網購客戶為女性的比率假設檢驗表

10-6

一個總體比率的檢驗方法10.2.3

一個總體方差的假設檢驗

研究人員經常需要對總體的方差進行假設檢驗,例如在零件制造中,質量控制人員不僅需要了解其平均質量是否達標,還要了解其質量變動情況。因為一組數據的方差越大,那么其均值的代表性就越差,說明其質量越不穩(wěn)定,所以對方差的檢驗是相當重要的。從前面的章節(jié)知識我們知道樣本方差可以用來估計總體方差,在總體服從正態(tài)分布的假定前提下,可以利用卡方分布來進行假設檢驗。

2

檢驗統(tǒng)計量公式如下:(10-7)式中 s2

——樣本方差;

n

——樣本容量。

一個總體方差的假設檢驗有雙側檢驗和單側檢驗,同樣有臨界值法和

p值方法?!纠?/p>

10-10】一條藥品自動生產線的質量標準規(guī)定灌裝的劑量方差不超過

0.25。生產線經過檢修后重新投入生產,質檢人員抽取了

25袋進行檢測(數據見

Data10-3),假定總體服從正態(tài)分布,顯著性水平

0.05

,根據這些數據質檢人員能做出怎樣的判斷?解:由樣本數據計算得:

s

2

0.136

,且n=25,

0.05

質檢人員支持的觀點是經常檢修后,生產線灌裝的劑量方差發(fā)生了改變,故:

H0:

0.25,H1:

0.25

由于樣本方差服從卡方分布,

自由度為

24

,

查表得:計算檢驗統(tǒng)計量的值:由于,檢驗統(tǒng)計量的值沒有落入拒絕域,故不拒絕原假設,說明沒有足夠的證據證明生產線灌裝的劑量方差發(fā)生了改變。

如果用

p

值方法,過程如下:

Excel

中,運用

CHIDIST

函數計算得到

2

13.056

上側面積為0.965,下側面積為

0.035??ǚ诫p側檢驗的

p

值等于較小的面積乘以

2,故

p=0.07>

0.05

,故不拒絕原假設。

質檢人員支持的觀點也可以是生產線工作不正常,這時的假設為:

查表得:,故拒絕域為(36.415,+∞)。

由于,檢驗統(tǒng)計量的值沒有落入拒絕域,故不拒絕原假設,說明沒有足夠的證據證明生產線工作不正常。

如果用

p

值方法,過程如下:

Excel

中,運用

CHIDIST

函數計算得到

2

13.056

上側面積為p=0.965。由于

p=0.965>

0.05

,故不拒絕原假設。檢驗的結果如圖:a)雙側檢驗b)單側檢驗圖

10-12

藥品生產線方差的假設檢驗表10-7一個總體方差的檢驗方法10.3.兩個總體參數的檢驗

在很多情況下,我們都需要在兩個總體之間進行比較。例如兩個不同地區(qū)農民平均純收入是不是有差異?男性與女性的消費行為真的有差異嗎?兩只股票的風險有差異嗎?等等。這些問題的本質就是比較兩個總體的均值、比率和方差。

在兩個總體之間進行比較,需要在兩個總體中分別進行抽樣,這兩個樣本可以是獨立樣本,也可以是匹配樣本,兩種樣本的判斷方法有所不同。我們先討論獨立樣本的情形。10.3.1

兩個總體均值之差的假設檢驗1.大樣本、總體方差已知

如果兩個獨立樣本都是大樣本,并且兩個總體方差都已知,這是非常理想的一種情形。因為,在這個條件下,由中心極限定理可知每個樣本均值分別服從正態(tài)分布,再由正態(tài)分布再生定理可知,兩個樣本均值之差也服從正態(tài)分布,故可用

z

檢驗,檢驗統(tǒng)計量為:(10-8)式中

——樣本1的均值;——樣本2的均值;——樣本1的容量;——樣本2的容量;——總體1的均值;

——總體2的均值;——總體1的方差;——總體2的方差?!纠?/p>

10-11】據中新網消息,武漢軌道交通

2

號線南延線

19

日上午開通,并與軌道交通

2

號線、機場線貫通試運營。至此,武漢地鐵運營線路達

12

條,通車總里程

318

公里。2019

年武漢市政府工作報告提出,今年武漢市還將開通

8

號線三期、蔡甸線,開工建設新港線、12

號線三期、11

號線葛店段,同步推進

10

條線路續(xù)建。根據規(guī)劃,到

2024

年武漢將形成總長

606公里的軌道網。(2019

02

19

日證券時報網)隨著地鐵營運里程的增加,武漢市交通的擁堵狀況得到大大緩解,上班族花在上班路上的時間有所減少。某報社記者為此專門做了調查,她查閱了兩年前的數據,并與現在的數據進行比較,假設

0.05

,通過這些數據,記者能夠得到怎樣的結論?樣本

1:(兩年前)

,

n1

50

,

1

10樣本

2:(現在)

,

n2

54

,

2

9解:這是一個兩個總體均值比較的假設檢驗。H

0

:

1

2

0

(兩年前后上班路上的時間沒有變化)H1

:

1

2

0

(兩年前后上班路上的時間有變化)由于兩個樣本都是大樣本,總體方差已知,故用z

檢驗。查表得:

Z

/2

Z

0.025

1.96

,故拒絕域為(-∞,-1.96),(1.96,+∞)。

計算檢驗統(tǒng)計量的值:

由于

,說明檢驗統(tǒng)計量的值落入到拒絕域,故拒絕原假設。這個結果說明兩年前后武漢的上班族花在上班路上的時間有顯著的變化,具體來說是兩年后花在路上的時間減少了(檢驗統(tǒng)計的量為正)。

如果用

p

值方法,過程如下:

在Excel

中,運用

NORM.S.DIST

函數計算

z=2.67

外側的面積,可得

p=0.007585,因為

p=0.007585<

0.05

,故拒絕原假設。檢驗的結果如下圖所示:圖

10-13

假設檢驗結果

這個問題也可以設置為其他形式的假設檢驗。

單側檢驗(右側檢驗):

H

0

:

1

2

0

(兩年前后上班路上的時間沒有減少)

H1

:

1

2

0

(兩年前后上班路上的時間減少了)

由于右側檢驗的拒絕域為(1.64,+∞),而檢驗統(tǒng)計量的值為z=2.67,落入到拒絕域,故拒絕原假設,說明兩年前后上班路上的時間減少了。2.小樣本、總體方差已知

由于小樣本有更大的偶然性,需要承擔更大的風險,所以在這個條件下需要增加一個條件:總體服從正態(tài)分布,這樣,檢驗的方法與大樣本時完全相同。【例

10-12】一家大型連鎖超市在中心城區(qū)和郊區(qū)都有門店,經營者認為在不同的地區(qū)消費者的年齡有明顯的差異,應該采取不同的營銷策略。為了證實這個判斷,經營者在中心城區(qū)和郊區(qū)門店的消費者中分別抽取了兩個樣本進行比較,如果總體都服從正態(tài)分布,

0.05

,下列數據能支持經營者的判斷嗎?樣本

1:(中心城區(qū))

n1

25

,

1

10樣本

2:(郊區(qū))

n2

18

,

2

9解:這是一個小樣本、總體方差已知的情況,因為總體服從正態(tài)分布,故仍然用z

檢驗。

經營者支持的觀點是不同地區(qū)的消費者年齡不同,故假設為:

H

0

:

1

2

0

H1

:

1

2

0

查表得:

Z

/2

Z

0.025

1.96

,故拒絕域為(-∞,-1.96),(1.96,+∞)。計算檢驗統(tǒng)計量的值:由于

,說明檢驗統(tǒng)計量的值沒有落入到拒絕域,故不拒絕原假設。說明中心城區(qū)和郊區(qū)消費者的年齡沒有顯著的差異。

如果用

p

值方法,過程如下:

Excel

中,運用

NORM.S.DIST

函數計算z=1.715

外側的面積,可得

p=0.086345,因為

p=0.086345>

0.05

,故不拒絕原假設。

這個問題的另外一種形式可能更加合理,就是單側檢驗。如果經營者支持的觀點是中心城區(qū)消費者的年齡比郊區(qū)的大,則假設為:

H

0

:

1

2

0

,

H1

:

1

2

0

則拒絕域為(1.64,+∞)。檢驗統(tǒng)計量的值仍然為

z=1.715,落入到拒絕域,故拒絕原假設,說明中心城區(qū)消費者的年齡要比郊區(qū)消費者的年齡顯著的大。為什么數據相同,而假設不同,我們會得到了不同的結論呢?這是因為研究者對風險方向判斷不同的結果,在右側檢驗中,研究者將

(風險水平)都分配在右側(研究者認為左側風險不會發(fā)生),這時拒絕域都在右側,這時拒絕域的臨界值將變小,從而得到了不同的決策結果。3.大樣本、總體方差未知

在大部分情況下,總體方差是無法事先得到的,這時我們需要使用樣本方差來代替總體方差,在大樣本條件下,經過標準化變換后,檢驗統(tǒng)計量服從t

分布,故稱之為t

檢驗。

但是,t

檢驗的自由度的確定要分兩種情況。

1)

兩個總體方差相等在這個條件下,兩個總體數據分散程度是一樣的,故在兩個總體取樣的風險相對較小,這時檢驗統(tǒng)計量為:式中——樣本1的均值;——總體1的均值——樣本2的均值;——總體2的均值——樣本1的容量;——樣本1的方差——樣本2的容量;——樣本2的方差

(10-9)其中稱為聯合方差估計。2)

兩個總體方差不相等

在這個條件下,兩個總體數據分散程度是不一樣的,故在兩個總體取樣的風險相對較大小,這時檢驗統(tǒng)計量為:(10-10)

其中自由度為

[x]表示不超過

x

的最大整數。

可以證明:

也就是說,

我們可以用較小的自由度來對沖風險?!纠?/p>

10-13】

2017

年“學生體質健康評價與運動干預”高峰論壇,今天在上海華東師范大學閉幕,論壇上,由華東師范大學“青少年健康評價與運動干預”教育部重點實驗室與日本相關機構合作研究發(fā)布的《中日兒童青少年體質健康比較研究結果公報》受到關注。該項成果歷時3

年,分別在中國與日本的

4

個城市或地區(qū),對近兩萬名

7~18

歲的兒童青少年,運用同樣的方法和標準進行測試后完成。結果顯示,“2014

年和

2016

年,中國兒童青少年體格指標(身高、體重和

BMI)大部分年齡段顯著高于日本;但體能指標的比較中,日本兒童青少年在心肺耐力、柔韌性和靈敏協(xié)調性方面均顯著高于中國。”

(2018-10-28

搜狐健康)

假設該項目研究人員在中日兩國某一年齡組分別抽取了部分男生測試

50

米跑,測試數據如下。假定兩個總體的方差相等,

0.05

,在

50

米跑項目上中日兩國這個年齡組的男生存在顯著差異嗎?樣本

1:(中國)

(秒),n1

135

,

s1

1.1樣本

2:(日本)

(秒),n2

117

,s2

1.0解:由于研究者支持在這個項目上中國兒童的整體水平低于日本兒童的整體水平,故:H0:

1

2

0,H1:

1

2

0

這是一個大樣本、總體方差未知但相等的問題,故用

t

檢驗,自由度為

250。

在Excel

中使用

T.INV.2T

函數(注意是雙側,故Probability

選項中要輸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論