第20講概率統(tǒng)計(jì) 王松桂.ppt_第1頁(yè)
第20講概率統(tǒng)計(jì) 王松桂.ppt_第2頁(yè)
第20講概率統(tǒng)計(jì) 王松桂.ppt_第3頁(yè)
第20講概率統(tǒng)計(jì) 王松桂.ppt_第4頁(yè)
第20講概率統(tǒng)計(jì) 王松桂.ppt_第5頁(yè)
已閱讀5頁(yè),還剩40頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、,概率論與數(shù)理統(tǒng)計(jì) 第二十講,主講教師:程維虎教授,北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院,第八章 假設(shè)檢驗(yàn),8.1 基本概念,下面,我們討論不同于參數(shù)估計(jì)問(wèn)題的另一類統(tǒng)計(jì)推斷問(wèn)題根據(jù)樣本提供的信息,檢驗(yàn)總體的某個(gè)假設(shè)是否成立的問(wèn)題。,這類問(wèn)題稱為假設(shè)檢驗(yàn)。,假設(shè)檢驗(yàn),參數(shù)檢驗(yàn),非參數(shù)檢驗(yàn),總體分布已知情 形下,檢驗(yàn)未知 參數(shù)的某個(gè)假設(shè),總體分布未知情形 下的假設(shè)檢驗(yàn)問(wèn)題,先看一個(gè)例子。,例1:某工廠生產(chǎn) 10 歐姆的電阻,根據(jù)以往生產(chǎn)的電阻實(shí)際情況,可以認(rèn)為: 電阻值 X服從正態(tài)分布 N(, 0.12)?,F(xiàn)在隨機(jī)抽取10個(gè)電阻, 測(cè)得它們的電阻值為: 9.9, 10.1, 10.2, 9.7, 9.9,

2、9.9, 10.0, 10.5, 10.1, 10.2. 問(wèn): 從樣本看,能否認(rèn)為該廠生產(chǎn)的電阻的平均值 = 10 歐姆?, 確定總體:記 X 為該廠生產(chǎn)電阻的測(cè)值,則 X N(, 0.12); 明確任務(wù):通過(guò)樣本推斷 “X 的均值 是否 等于10歐姆”; 假設(shè):上面的任務(wù)是要通過(guò)樣本檢驗(yàn)“X 的 均值 =10”這一假設(shè)是否成立。,I. 如何建立檢驗(yàn)?zāi)P?原假設(shè)的對(duì)立面是 “ X 的均值 10”,稱為 “對(duì)立假設(shè)” 或 “備擇假設(shè)”,記成 “ H1: 10”。把原假設(shè)和對(duì)立假設(shè)合寫在一起,就是:,H0: =10; H1:10.,在數(shù)理統(tǒng)計(jì)中,把 “ X 的均值 =10” 這樣一個(gè)待檢驗(yàn)的假設(shè)記

3、為 “原假設(shè)” 或 “零假設(shè)”,記成 “ H0: =10”。,II. 解決問(wèn)題的思路,因樣本均值是 的一個(gè)很好的估計(jì)。所以,當(dāng) =10,即原假設(shè) H0 成立時(shí), 應(yīng)比較?。?如果該值過(guò)大, 想必 H0 不成立。,于是,我們就用 的大小檢驗(yàn) H0 是否成立。,合理的做法應(yīng)該是:找出一個(gè)界限 c,,這里的問(wèn)題是:如何確定常數(shù) c 呢?,細(xì)致地分析:,根據(jù)定理 6.4.1,有,于是,當(dāng)原假設(shè) H0:=10 成立時(shí),有,為確定常數(shù) c,我們考慮一個(gè)很小的正數(shù), 如 = 0.05。當(dāng)原假設(shè) H0: =10 成立時(shí),有,于是,我們就得到如下檢驗(yàn)準(zhǔn)則:,為原假設(shè) H0 的拒絕域。,用以上檢驗(yàn)準(zhǔn)則處理我們的問(wèn)

4、題,,所以,接受原假設(shè) H0:=10。,因?yàn)椋?dāng)原假設(shè)是 H0: =10 成立時(shí),,所以,當(dāng) 很小時(shí),若 H0 為真(正確), 則檢驗(yàn)統(tǒng)計(jì)量落入拒絕域是一小概率事件 (概率很小,為 )。前面我們?cè)岬剑骸巴ǔUJ(rèn)為小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生”。,III. 方法原理,那么,如果小概率事件發(fā)生了,即:,發(fā)生, 就拒絕接受 H0 成立,即認(rèn)為 H0不成立。,IV. 兩類錯(cuò)誤與顯著性水平,當(dāng)我們檢驗(yàn)一個(gè)假設(shè) H0 時(shí),有可能犯以下兩類錯(cuò)誤之一:H0 是正確的,但被我們拒絕了,這就犯了“棄真”的錯(cuò)誤,即拋棄了正確假設(shè);H0 是不正確的,但被我們接受了,這就犯了“取偽”的錯(cuò)誤,即采用了偽假設(shè)。,因

5、為檢驗(yàn)統(tǒng)計(jì)量總是隨機(jī)的,所以,我們總是以一定的概率犯以上兩類錯(cuò)誤。,通常用 和 記犯第一、第二類錯(cuò)誤的概率,即,在檢驗(yàn)問(wèn)題中,犯“棄真”和“取偽”兩類錯(cuò)誤都總是不可避免的,并且減少犯第一類錯(cuò)誤的概率,就會(huì)增大犯第二類錯(cuò)誤的概率;反之亦然。,所以,犯兩類錯(cuò)誤的概率不能同時(shí)得到控制。,在統(tǒng)計(jì)學(xué)中,通??刂品傅谝活愬e(cuò)誤的概概率。一般事先選定一個(gè)數(shù) (01),要求犯第一類錯(cuò)誤的概率不超過(guò) 。稱 為假設(shè)檢驗(yàn)的顯著性水平,簡(jiǎn)稱水平。,犯第二類錯(cuò)誤的概率的計(jì)算超出了課程的學(xué)習(xí)范圍。因此,不作討論。,例1(續(xù)):分析該例的顯著性水平。,H0: =10,,現(xiàn)在我們來(lái)分析一下:取上述 c 后,如果 H0 是正確的

6、,卻被我們拒絕了。這時(shí),犯第一類錯(cuò)誤的概率是多少呢?,可見:用該方法進(jìn)行檢驗(yàn)時(shí),犯第一類錯(cuò)誤的概率等于 ,即顯著性水平等于 。,因?yàn)楫?dāng)原假設(shè) H0: =10 成立時(shí),有,分析:,8.2 正態(tài)總體均值的假設(shè)檢驗(yàn),8.2.1 單正態(tài)總體 N(, 2)均值 的檢驗(yàn),1. 雙邊檢驗(yàn) H0: = 0;H1: 0,假設(shè) 2已知,根據(jù)上節(jié)中的例1,當(dāng)原假設(shè) H0: = 0 成立時(shí),有,在應(yīng)用上,2未知的情況是常見的。此時(shí),和前面不同的是:常用樣本方差 S2代替未知的2 。,以上檢驗(yàn)法稱作 U 檢驗(yàn)法。,當(dāng) 2未知時(shí),根據(jù)基本定理 6.4.1 ,當(dāng)原假設(shè) H0: = 0 成立時(shí),有,此檢驗(yàn)法稱作 t 檢驗(yàn)法。

7、,解:n=10, =0.05, 0=10, t10-1( /2)=t9(0.025)=2.2622,,例1(續(xù)例 8.1.1) : 假設(shè)2未知,檢驗(yàn),所以,接受原假設(shè) H0: =10.,H0: =10;H1: 10.,上一段中, H0:=0 ; H1: 0 的對(duì)立假設(shè)為 H1: 0 , 該假設(shè)稱為雙邊對(duì)立假設(shè)。,2. 單邊檢驗(yàn) H0: =0; H1: 0,而現(xiàn)在要處理的對(duì)立假設(shè)為 H1: 0, 稱為右邊對(duì)立假設(shè)。,類似地,H0: =0; H1: 0 中的對(duì)立假設(shè)H1: 0,假設(shè)稱為左邊對(duì)立假設(shè)。右邊對(duì)立假設(shè)和左邊對(duì)立假設(shè)統(tǒng)稱為單邊對(duì)立假設(shè),其檢驗(yàn)為單邊檢驗(yàn)。,例如:工廠生產(chǎn)的某產(chǎn)品的數(shù)量指標(biāo)服

8、從正態(tài)分布,均值為 0 ;采用新技術(shù)或新配方后,產(chǎn)品質(zhì)量指標(biāo)還服從正態(tài)分布,但均值為 。我們想了解 “是否顯著地大于0”,即產(chǎn)品的質(zhì)量指標(biāo)是否顯著地增加了。,如果 =0,即原假設(shè)成立,則 就,不應(yīng)太大;反之,如果 過(guò)大,就認(rèn)為原假設(shè)不成立。,在2已知情況下,根據(jù)定理6.4.1,知:,當(dāng)原假設(shè) 成立時(shí),,單邊檢驗(yàn) H0: =0; H1: 0,在2未知情況下,當(dāng)原假設(shè) 成立時(shí),,例 2:某廠生產(chǎn)一種工業(yè)用繩,其質(zhì)量指標(biāo)是繩子所承受的最大拉力,假定該指標(biāo)服從正態(tài)分布,且該廠原來(lái)生產(chǎn)的繩子指標(biāo)均值 0 =15公斤,采用一種新原材料后,廠方稱這種原材料提高了繩子的質(zhì)量,也就是說(shuō)繩子所承受的最大拉力 比1

9、5公斤增大了。 為檢驗(yàn)該廠的結(jié)論是否真實(shí),從其新產(chǎn)品中隨機(jī)抽取50件,測(cè)得它們所承受的最大拉力的平均值為15.8公斤,樣本標(biāo)準(zhǔn)差S=0.5公斤。取顯著性水平 =0.01。問(wèn)從這些樣本看:能否接受廠方的結(jié)論。,解:?jiǎn)栴}歸結(jié)為檢驗(yàn)如下假設(shè) H0: =15; H1: 15 (2未知),于是,,從而,拒絕原假設(shè),即認(rèn)為新的原材料確實(shí)提高了繩子所能承受的最大拉力。,8.2.2 兩個(gè)正態(tài)總體 N(1, 12) 和 N(2, 22) 均值的比較,在應(yīng)用上,經(jīng)常會(huì)遇到兩個(gè)正態(tài)總體均值的比較問(wèn)題。,例如:比較甲、乙兩廠生產(chǎn)的某種產(chǎn)品的質(zhì)量。將兩廠生產(chǎn)的產(chǎn)品的質(zhì)量指標(biāo)分別看成正態(tài)總體 N(1, 12) 和 N(2

10、, 22)。比較它們的產(chǎn)品質(zhì)量指標(biāo)的問(wèn)題,就變?yōu)楸容^這兩個(gè)正態(tài)總體的均值 1和 2的的問(wèn)題。,又如:考察一項(xiàng)新技術(shù)對(duì)提高產(chǎn)品質(zhì)量是否有效。將新技術(shù)實(shí)施前后生產(chǎn)的產(chǎn)品質(zhì)量指標(biāo)分別看成正態(tài)總體 N(1, 12)和 N(2, 22)。這時(shí),所考察的問(wèn)題就歸結(jié)為檢驗(yàn)這兩個(gè)正態(tài)總體的均值 1和 2是否相等的問(wèn)題。,設(shè)X1, X2, , Xm與Y1, Y2, , Yn 分別為抽自正態(tài)總體 N(1, 12)和 N(2, 22)的樣本,記,考查如下檢驗(yàn)假設(shè):,1. H0: 1= 2 ; H1: 12,當(dāng) 12 和 22 已知時(shí),根據(jù)定理7.5.1,有,當(dāng) H0: 1 = 2為真時(shí),,故,拒絕域?yàn)?在12=22

11、 =2,2未知情況下,根據(jù)定理7.5.1,有,當(dāng) H0: 1=2 為真時(shí),有,拒絕域?yàn)?從而,上面,我們假定 12=22。當(dāng)然,這是個(gè)不得已而強(qiáng)加上去的條件,因?yàn)槿绻患哟藯l件,就無(wú)法使用簡(jiǎn)單易行的 t 檢驗(yàn)。 在實(shí)用中,只要我們有理由認(rèn)為12和22相差不是太大,往往就可使用上述方法。通常是:如果方差比檢驗(yàn)未被拒絕(見下節(jié)), 就認(rèn)為12和22相差不是太大。,說(shuō)明,例3:假設(shè)有A和B兩種藥,欲比較它們?cè)诜?小時(shí)后在血液中的含量是否一樣。對(duì)藥品A,隨機(jī)抽取8個(gè)病人服藥,服藥2小時(shí)后,測(cè)得8個(gè)病人血液中藥物濃度(用適當(dāng)?shù)膯挝?分別為: 1.23, 1.42, 1.41, 1.62, 1.55,

12、1.51, 1.60, 1.76. 對(duì)藥品B,隨機(jī)抽取6個(gè)病人服藥,服藥2小時(shí)后,測(cè)得血液中藥的濃度分別為: 1.76, 1.41, 1.87, 1.49, 1.67, 1.81. 假定這兩組觀測(cè)值抽自具有共同方差的兩個(gè)正態(tài)總體,在顯著性水=0.10下,檢驗(yàn)病人血液中這兩種藥的濃度是否有顯著不同?,故,接受原假設(shè)。即, 認(rèn)為病人血液中這兩種藥濃度無(wú)顯著差異。,解:?jiǎn)栴}就是從總體 N(1, 2)和N(2, 2)中分別抽取樣本X1, X2, X8 和Y1, Y2, Y6,樣本均值和樣本方差分別為:,與1.的分析完全類似,可以得到:,2. 單邊檢驗(yàn) H0: 12; H1: 12, 12和22已知情況

13、下,H0的拒絕域?yàn)? 12與22未知,但二者相等情況下,H0的 拒絕域?yàn)?與1.的分析完全類似,可以得到:,3. 單邊檢驗(yàn) H0: 12; H1: 12, 12和22已知情況下,H0的拒絕域?yàn)? 12與22未知,但二者相等情況下,H0的 拒絕域?yàn)?兩個(gè)正態(tài)總體與成對(duì)數(shù)據(jù)的區(qū)別 兩個(gè)正態(tài)總體假定來(lái)自這兩個(gè)正態(tài)總體 的兩組樣本,是相互獨(dú)立的。 成對(duì)數(shù)據(jù)兩組樣本可以是來(lái)自對(duì)同一個(gè) 總體上的重復(fù)測(cè)量,它們是成對(duì)出現(xiàn)的,可 以是相關(guān)的。,8.2.3 成對(duì)數(shù)據(jù)的 t 檢驗(yàn),例如: 為了考察一種降血壓藥的效果,測(cè)試了n 個(gè)高血壓病人服藥前、后的血壓分別為X1, X2, Xn 和Y1,Y2,Yn。這里(Xi

14、,Yi)是第 i個(gè)病人服藥前和服藥后的血壓,它們是相關(guān)的。,處理成對(duì)數(shù)據(jù)的思路,因(Xi , Yi)是在同一人身上觀測(cè)到的血壓。所以,Xi-Yi 就消除了人的體質(zhì)等諸方面的條件差異,僅剩下降血壓藥的效果。 所以,我們可以把 di=Xi-Yi,i=1, 2, n.看成抽自正態(tài)總體 N( , 2)的樣本。其中 就是降血壓藥的平均效果。,一般的成對(duì)數(shù)據(jù)同樣也是這樣轉(zhuǎn)變的。從前面所學(xué)內(nèi)容可以看出:其實(shí)就是作 H0: = 0; H1: 0; H0: 0; H1: 0,方差2未知情況下的檢驗(yàn)。,上述三種檢驗(yàn)的拒絕域分別為:,例4:為了檢驗(yàn)A, B兩種測(cè)定鐵礦石含鐵量的方法是否有明顯差異, 現(xiàn)用這兩種方法測(cè)定了取自12個(gè)不同鐵礦的礦石標(biāo)本的含鐵量(%),結(jié)果列于表 8.2.1中。取=0.05, 問(wèn)這兩種測(cè)定方法是否有顯著差異?,解: 將方法A和方法B的測(cè)定值分別記

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論