第七章 假設(shè)檢驗(yàn)_第1頁
第七章 假設(shè)檢驗(yàn)_第2頁
第七章 假設(shè)檢驗(yàn)_第3頁
第七章 假設(shè)檢驗(yàn)_第4頁
第七章 假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章假設(shè)檢驗(yàn)

假設(shè)檢驗(yàn)的基本問題

一個(gè)總體參數(shù)的檢驗(yàn)

二個(gè)總體參數(shù)的檢驗(yàn)第一節(jié)假設(shè)檢驗(yàn)的基本問題一、假設(shè)檢驗(yàn)的陳述

由統(tǒng)計(jì)資料得知,2007年某地新生兒的平均體重為3190克,現(xiàn)從2008年的新生兒中隨機(jī)抽取100個(gè),測(cè)得其平均體重為3210克,問2008年的新生兒與2007年相比,體重有無顯著差異。用統(tǒng)計(jì)的語言來說,“假設(shè)”就是對(duì)總體參數(shù)的具體數(shù)值所作的陳述。在假設(shè)檢驗(yàn)中,首先需要提出兩種假設(shè),即原假設(shè)和備擇假設(shè)。原假設(shè),通常是研究者想收集證據(jù)予以反對(duì)的假設(shè),由于原假設(shè)(H)用0修飾,所以也稱為零假設(shè)。備擇假設(shè),通常是研究者想收集證據(jù)予以支持的假設(shè),也稱為研究假設(shè)、替換假設(shè),用H1或Ha表示。備擇假設(shè)通常是用于支持你自己的看法。假設(shè)的形式:H0——原假設(shè),H1——備擇假設(shè)雙尾/側(cè)檢驗(yàn):H0:μ=μ0

,H1:μ≠μ0單尾/側(cè)檢驗(yàn):左側(cè)檢驗(yàn):H0:μ≥μ0

,H1:μ<μ0

右側(cè)檢驗(yàn):H0:μ≤μ0

,H1:μ>μ0幾點(diǎn)說明:第一,原假設(shè)和備擇假設(shè)是一個(gè)完備事件組,而且相互對(duì)立。第二,在建立假設(shè)時(shí),通常是先確定備擇假設(shè),然后再確定原假設(shè)。第三,在假設(shè)檢驗(yàn)中,等號(hào)“=”總是放在原假設(shè)上。第四,在面對(duì)某一實(shí)際問題時(shí),原假設(shè)和備擇假設(shè)可能是截然相反的。第五,假設(shè)檢驗(yàn)的目的主要是收集證據(jù)來拒絕原假設(shè)。二、假設(shè)檢驗(yàn)規(guī)則與兩類錯(cuò)誤

1、確定檢驗(yàn)規(guī)則差異臨界點(diǎn)判斷C拒絕H0C不拒絕H02、兩類錯(cuò)誤

I類錯(cuò)誤——棄真錯(cuò)誤,發(fā)生的概率為α。

II類錯(cuò)誤——取偽錯(cuò)誤,發(fā)生的概率為β。檢驗(yàn)決策H0為真H0非真拒絕H0犯I類錯(cuò)誤(α)正確不拒絕H0正確犯II類錯(cuò)誤(β)(a)(b)拒絕域假設(shè)檢驗(yàn)中犯兩類錯(cuò)誤的情況第一類錯(cuò)誤:H0本身成立,但通過檢驗(yàn)卻否定了它,犯了“棄真”錯(cuò)誤,也叫Ⅰ型錯(cuò)誤(typeⅠerror)、а錯(cuò)誤。Ⅰ型錯(cuò)誤,就是把非真實(shí)差異錯(cuò)判為真實(shí)差異,即H0:μ1=μ2為真,卻接受了HA:μ1≠μ2

。第二類錯(cuò)誤:H0本身不成立,但通過檢驗(yàn)卻接受了它,犯了“取偽”錯(cuò)誤,也叫II型錯(cuò)誤(typeIIerror)、β錯(cuò)誤。II型錯(cuò)誤,真實(shí)差異錯(cuò)判為非真實(shí)差異,即HA:μ1≠μ2為真,卻未能否定H0:μ1=μ2。

統(tǒng)計(jì)檢驗(yàn)是基于“小概率事件實(shí)際不可能性原理”來否定H0

,但在一次試驗(yàn)中小概率事件并不是絕對(duì)不會(huì)發(fā)生的。如果我們抽得一個(gè)樣本,它雖然來自與H0對(duì)應(yīng)的抽樣總體,但計(jì)算所得的統(tǒng)計(jì)量卻落入了否定域中,因而否定了H0,于是犯了Ⅰ型錯(cuò)誤。發(fā)生第Ⅰ類錯(cuò)誤的概率也常被用于檢驗(yàn)結(jié)論的可靠性度量,假設(shè)檢驗(yàn)中犯的第Ⅰ類錯(cuò)誤的概率被稱為顯著性水平,記為α。

Ⅱ型錯(cuò)誤概率β值的大小較難確切估計(jì),它只有與特定的HA結(jié)合起來才有意義。一般與顯著水平α、原總體的標(biāo)準(zhǔn)差σ、樣本含量n、以及相互比較的兩樣本所屬總體平均數(shù)之差μ1-μ2等因素有關(guān)。在其它因素確定時(shí),α值越小,β越大;反之,α值越大,β值越??;樣本含量及μ1-μ2越大、均數(shù)標(biāo)準(zhǔn)誤σ越小,β值越小。

由于β值的大小與α值的大小有關(guān),所以在選用檢驗(yàn)的顯著水平時(shí)應(yīng)考慮到犯Ⅰ、Ⅱ型錯(cuò)誤所產(chǎn)生后果嚴(yán)重性的大小,還應(yīng)考慮到試驗(yàn)的難易及試驗(yàn)結(jié)果的重要程度。若一個(gè)試驗(yàn)耗費(fèi)大,可靠性要求高,不允許反復(fù),那么α值應(yīng)取小些;當(dāng)一個(gè)試驗(yàn)結(jié)論的使用事關(guān)重大,容易產(chǎn)生嚴(yán)重后果,如藥物的毒性試驗(yàn),α值亦應(yīng)取小些。對(duì)于一些試驗(yàn)條件不易控制,試驗(yàn)誤差較大的試驗(yàn),可將α值放寬到0.1,甚至放寬到0.25。三、檢驗(yàn)統(tǒng)計(jì)量與拒絕域根據(jù)樣本觀測(cè)結(jié)果計(jì)算得到的,并據(jù)以對(duì)原假設(shè)和備擇假設(shè)做出決策的某個(gè)樣本統(tǒng)計(jì)量,稱為檢驗(yàn)統(tǒng)計(jì)量。檢驗(yàn)統(tǒng)計(jì)量實(shí)際上是總體參數(shù)的點(diǎn)估計(jì)量,但點(diǎn)估計(jì)量并不能直接作為檢驗(yàn)的統(tǒng)計(jì)量。只有將其標(biāo)準(zhǔn)化后,才能用于度量它與原假設(shè)的參數(shù)值之間的差異程度。對(duì)點(diǎn)估計(jì)量標(biāo)準(zhǔn)化的依據(jù)則是:①原假設(shè)為真;②點(diǎn)估計(jì)量的抽樣分布。實(shí)際上,假設(shè)檢驗(yàn)中所有的檢驗(yàn)統(tǒng)計(jì)量都是標(biāo)準(zhǔn)化檢驗(yàn)統(tǒng)計(jì)量,它反映了點(diǎn)估計(jì)量與假設(shè)的總體參數(shù)相比相差多少個(gè)標(biāo)準(zhǔn)差。為敘述方便,通常將標(biāo)準(zhǔn)化檢驗(yàn)統(tǒng)計(jì)量簡(jiǎn)稱為檢驗(yàn)統(tǒng)計(jì)量。①設(shè)有總體:,σ2已知。②隨機(jī)抽樣:樣本均值④確定α值⑤查概率表,知臨界值⑥計(jì)算Z值,作出判斷:③標(biāo)準(zhǔn)化:,拒絕H0。若,接受H0;若建立總體假設(shè)(1)抽樣得到樣本觀察值(2)根據(jù)具體決策要求確定α(4)選擇統(tǒng)計(jì)量確定H0為真時(shí)的抽樣分布(3)(5)確定分布上的臨界點(diǎn)C和檢驗(yàn)規(guī)則(7)比較并作出檢驗(yàn)判斷(6)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的數(shù)值【例】由統(tǒng)計(jì)資料得知,2007年某地新生兒的平均體重為3190克,標(biāo)準(zhǔn)差為80,現(xiàn)從2008年的新生兒中隨機(jī)抽取100個(gè),測(cè)得其平均體重為3210克,問2008年的新生兒與2007年相比,體重有無顯著差異(α=0.05)。假設(shè)檢驗(yàn)的流程如下:1.提出原假設(shè)和備擇假設(shè):

H0:μ=3190(克),H1:μ≠3190(克)2.確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并計(jì)算其數(shù)值:3.確定4.做出判斷,拒絕H0

四、利用P值進(jìn)行決策如果原假設(shè)H0為真,所得到的樣本結(jié)果會(huì)像實(shí)際觀測(cè)結(jié)果那么極端或更極端的概率,稱為P值,也稱為觀察到的顯著性水平。P值與原假設(shè)的對(duì)或錯(cuò)的概率無關(guān),它是關(guān)于數(shù)據(jù)的概率。P值告訴我們:在某個(gè)總體的許多樣本中,某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度。也就是說,P值是當(dāng)原假設(shè)正確時(shí),得到所觀測(cè)的數(shù)據(jù)的概率。

如前例,據(jù)隨機(jī)抽樣測(cè)得2008年的樣本均值為3210克,與2007年的總體均值3190克相差20克,20克的差異究竟是大還是小。換句話說,如果原假設(shè)成立,即2008年新生兒體重的總體均值與2007年新生兒體重的總體均值相同,那么隨機(jī)抽取出n=100的樣本,其均值大于3210克的概率有多大呢?這個(gè)概率稱為P值,所以P值就是當(dāng)原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率。如果P值很小,說明這種情況發(fā)生的概率很小,而如果出現(xiàn)了,根據(jù)小概率原理,我們就有理由拒絕原假設(shè),P值越小,我們拒絕原假設(shè)的理由就越充分。計(jì)算P值的一般表達(dá)式(1):左側(cè)檢驗(yàn):P值是當(dāng)時(shí),檢驗(yàn)統(tǒng)計(jì)量小于或等于根據(jù)實(shí)際觀測(cè)樣本數(shù)據(jù)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量值的概率,即P值=計(jì)算P值的一般表達(dá)式(2):右側(cè)檢驗(yàn):P值是當(dāng)時(shí),檢驗(yàn)統(tǒng)計(jì)量小于或等于根據(jù)實(shí)際觀測(cè)樣本數(shù)據(jù)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量值的概率,即P值=計(jì)算P值的一般表達(dá)式(3):雙側(cè)檢驗(yàn):P值是當(dāng)時(shí),檢驗(yàn)統(tǒng)計(jì)量小于或等于根據(jù)實(shí)際觀測(cè)樣本數(shù)據(jù)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量值的概率,即P值=在已知P值的條件下,將其與給定的顯著性水平α值進(jìn)行比較,單側(cè)檢驗(yàn)中,P值位于抽樣分布的一側(cè),而雙側(cè)檢驗(yàn)P值位于分布的兩側(cè),每一側(cè)的P值為1/2。如果P值<α,拒絕原假設(shè);如果P值>α,不拒絕原假設(shè)。第二節(jié)一個(gè)總體均值、比例和方差

的假設(shè)檢驗(yàn)一、總體均值的檢驗(yàn)

【例】一種罐裝飲料采用自動(dòng)生產(chǎn)線生產(chǎn),每罐的容量是255ml,標(biāo)準(zhǔn)差為5ml。為檢驗(yàn)每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機(jī)抽取了40罐進(jìn)行檢驗(yàn),測(cè)得每罐平均容量為255.8ml。取顯著性水平α=0.05,檢驗(yàn)該天生產(chǎn)的飲料容量是否符合標(biāo)準(zhǔn)要求。解:提出的原假設(shè)和備擇假設(shè)為:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的具體數(shù)值:顯著性水平α=0.05,得由于所以,不拒絕原假設(shè)。檢驗(yàn)結(jié)果表明:樣本提供的證據(jù)不足以推翻原假設(shè),因此不能證明該天生產(chǎn)的飲料不符合標(biāo)準(zhǔn)要求。方法二:用P值進(jìn)行檢驗(yàn)

1.用EXCEL計(jì)算P值

2.比較P值

P=0.312495>α=0.05

3.作出決策由于P值=0.312495遠(yuǎn)遠(yuǎn)大于α=0.05,所以不拒絕原假設(shè),得到的結(jié)論與前面的相同。

【例】某機(jī)床廠加工一種零件,根據(jù)經(jīng)驗(yàn)知道,該廠加工的零件的橢圓度漸近服從正態(tài)分布,其總體均值為0.081mm,今另換一種新機(jī)床進(jìn)行加工,取200個(gè)零件進(jìn)行檢驗(yàn),得到橢圓度均值為0.076mm,樣本標(biāo)準(zhǔn)差為0.025mm,問新機(jī)床加工零件的橢圓度總體均值與以前有無明顯差別。解:提出的原假設(shè)和備擇假設(shè)為:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的具體數(shù)值:顯著性水平α=0.05,得由于所以,拒絕原假設(shè)??梢哉J(rèn)為新老機(jī)床加工零件的橢圓度的均值有顯著差異。方法二:用P值進(jìn)行檢驗(yàn)

1.用EXCEL計(jì)算P值

2.比較P值

P=0.004655>α=0.05

3.作出決策由于P值=0.004655遠(yuǎn)遠(yuǎn)小于α=0.05,所以拒絕原假設(shè),得到的結(jié)論與前面的相同。

【例】某批發(fā)商欲從廠家購進(jìn)一批燈泡,根據(jù)合同規(guī)定燈泡的使用壽命平均不能低于1000小時(shí)。已知燈泡燃燒壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為200小時(shí)。在總體中隨機(jī)抽取了100個(gè)燈泡,得知樣本均值為960小時(shí),批發(fā)商是否應(yīng)該購買這批燈泡?解:提出的原假設(shè)和備擇假設(shè)為:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的具體數(shù)值:顯著性水平α=0.05,得由于所以,拒絕原假設(shè),即這批燈泡的使用壽命低于1000小時(shí),批發(fā)商不應(yīng)購買這批燈泡。方法二:用P值進(jìn)行檢驗(yàn)

1.用EXCEL計(jì)算P值

2.比較P值

P=0.02275<α=0.05

3.作出決策由于P值=0.02275小于α=0.05,所以拒絕原假設(shè),得到的結(jié)論與前面的相同?!锶绻诖死募僭O(shè)檢驗(yàn)中,取顯著性水平α=0.02,會(huì)發(fā)生什么?

雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式檢驗(yàn)統(tǒng)計(jì)量Α與拒絕域P值決策準(zhǔn)則大樣本情況下一個(gè)總體均值的檢驗(yàn)方法P<α,拒絕H0小樣本的檢驗(yàn)方法【例】一種汽車配件的平均長(zhǎng)度要求為12cm,高于低于該標(biāo)準(zhǔn)均被認(rèn)為是不合格的。汽車生產(chǎn)企業(yè)在購進(jìn)配件時(shí),通常是經(jīng)過招標(biāo),然后對(duì)中標(biāo)的配件提供商提供的樣品進(jìn)行檢驗(yàn),以決定是否購進(jìn)?,F(xiàn)對(duì)一個(gè)配件提供商提供的10個(gè)樣本進(jìn)行了檢驗(yàn),結(jié)果如下:

12.2

10.8

12.0

11.8

11.9

12.4

11.3

12.2

12.0

12.3

假設(shè)該供貨商生產(chǎn)的配件服從正態(tài)分布,在0.05的顯著性水平下,檢驗(yàn)該供應(yīng)商提供的配件是否符合要求?解:依題意建立如下原假設(shè)和備擇假設(shè):

H0:μ=12

H1:μ≠12根據(jù)樣本數(shù)據(jù)計(jì)算得:由于n=10<30,為小樣本,采用t檢驗(yàn)統(tǒng)計(jì)量:根據(jù)自由度(n-1)=10-1=9,查t分布表得:由于不拒絕原假設(shè),樣本提供的證據(jù)不足以推翻原假設(shè)。供應(yīng)商提供的配件可以認(rèn)為是符合要求的。方法二:用P值進(jìn)行檢驗(yàn)

1.用EXCEL計(jì)算P值

2.比較P值

P=0.498469786

>α=0.05

3.作出決策由于P值大于α=0.05,所以不拒絕原假設(shè),得到的結(jié)論與前面的相同。雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式檢驗(yàn)統(tǒng)計(jì)量Α與拒絕域P值決策準(zhǔn)則小樣本情況下一個(gè)總體均值的檢驗(yàn)方法P<α,拒絕H0二、總體比例的檢驗(yàn)條件檢驗(yàn)統(tǒng)計(jì)量H0、H1

拒絕域P值決策準(zhǔn)則二項(xiàng)分布np≥5n(1-p)≥5H0:π=π0H1:π≠π0P<α,拒絕H0H0:π≥π0H1:π<π0H0:π≤π0H1:π>π0【例】一項(xiàng)統(tǒng)計(jì)結(jié)果聲稱,某市老年人口(年齡在65歲以上)所占的比例為14.7%,該市老年人口研究會(huì)為了檢驗(yàn)該項(xiàng)統(tǒng)計(jì)是否可靠,隨機(jī)抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上,調(diào)查結(jié)果是否支持該市老年人口比例為14.7%的看法(α=0.05)?解:H0:π=14.7%

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論