第七章 假設(shè)檢驗(yàn)_第1頁
第七章 假設(shè)檢驗(yàn)_第2頁
第七章 假設(shè)檢驗(yàn)_第3頁
第七章 假設(shè)檢驗(yàn)_第4頁
第七章 假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第七章假設(shè)檢驗(yàn)宋沈超假設(shè)檢驗(yàn)在統(tǒng)計(jì)方法中的地位統(tǒng)計(jì)方法統(tǒng)計(jì)方法描述統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)參數(shù)估計(jì)和假設(shè)檢驗(yàn)參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分,都是利用樣本對(duì)總體進(jìn)行某種推斷,但推斷的角度不同。參數(shù)估計(jì)討論的是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法。假設(shè)檢驗(yàn)討論的是用樣本信息去檢驗(yàn)對(duì)總體參數(shù)的某種假設(shè)是否成立的程序和方法。教學(xué)內(nèi)容第一節(jié) 假設(shè)檢驗(yàn)基本思想第二節(jié) 假設(shè)檢驗(yàn)基本步驟第三節(jié) I型錯(cuò)誤與II型錯(cuò)誤第四節(jié) 單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)第五節(jié) 假設(shè)檢驗(yàn)需要注意的問題第六節(jié) 假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系 教學(xué)目標(biāo)掌握:假設(shè)檢驗(yàn)的基本思想和基本步驟,掌握并理解I型錯(cuò)誤與I

2、I型錯(cuò)誤、檢驗(yàn)效能的概念熟悉:假設(shè)檢驗(yàn)需要注意的問題,單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)的概念和正確選擇;理解假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系。 第一節(jié) 假設(shè)檢驗(yàn)基本思想一、 假設(shè)檢驗(yàn)問題的提出例例1 已知一個(gè)暗箱中有已知一個(gè)暗箱中有100個(gè)白色與黑色個(gè)白色與黑色球,不知各有多少個(gè)?,F(xiàn)有人猜測(cè)其中有球,不知各有多少個(gè)?,F(xiàn)有人猜測(cè)其中有95個(gè)白色球,是否能相信他的猜測(cè)呢?個(gè)白色球,是否能相信他的猜測(cè)呢? 他相當(dāng)于提出假設(shè)他相當(dāng)于提出假設(shè): p=P(A)=0.05,A=任取一球是黑球任取一球是黑球. 可有兩種解釋:可有兩種解釋: 現(xiàn)隨機(jī)從中抽出一個(gè)球現(xiàn)隨機(jī)從中抽出一個(gè)球, 發(fā)現(xiàn)是黑球發(fā)現(xiàn)是黑球, 怎樣怎樣解釋這一事實(shí)?解

3、釋這一事實(shí)? 1)他的猜測(cè)是正確的他的猜測(cè)是正確的, ,恰抽得黑球是隨機(jī)性恰抽得黑球是隨機(jī)性所致;所致;2)他的猜測(cè)錯(cuò)了他的猜測(cè)錯(cuò)了. .應(yīng)接受哪一種呢?應(yīng)接受哪一種呢? 根據(jù)根據(jù)小概率事件原理小概率事件原理, , 事件事件A(黑球)(黑球)的發(fā)的發(fā)生不能不使人們懷疑他的猜測(cè)生不能不使人們懷疑他的猜測(cè), ,更更傾向于傾向于認(rèn)為箱認(rèn)為箱中白球個(gè)數(shù)不是中白球個(gè)數(shù)不是95個(gè)個(gè). . 例2 某醫(yī)院用新藥與常規(guī)藥物治療嬰幼兒貧血,將20名貧血患兒隨機(jī)等分兩組,分別接受兩種藥物治療,測(cè)得血紅蛋白增加量(g/L)見表7-1。問新藥與常規(guī)藥的療效有無差別? 表7-1 兩種藥物治療嬰幼兒貧血結(jié)果治療藥物 血紅蛋

4、白增加量(g/L)新藥組24 36 25 14 26 34 23 20 15 19常規(guī)藥組14 18 20 15 22 24 21 25 27 23 由于事先對(duì)兩種藥品療效(總體)情況一無所知,目前所關(guān)心的問題是如何根據(jù)兩組樣本患者治療后血紅蛋白增加量推斷兩種藥品的療效有無差異??杉僭O(shè)兩組患者(總體)治療后血紅蛋白平均增加量無差異,即假設(shè)然后,利用兩組樣本患者治療后血紅蛋白平均增加量來檢驗(yàn)這一假設(shè)是否正確。21 例3:根據(jù)1989年的統(tǒng)計(jì)資料,某地女性新生兒的平均體重為3190克。1990年從該地女性新生兒中隨機(jī)抽取30人,測(cè)得其平均體重為3210克。從樣本數(shù)據(jù)看,1990年女新生兒體重比19

5、89年略高。究竟是否存在顯著差異?差異產(chǎn)生的兩種可能(假設(shè)):隨機(jī)誤差導(dǎo)致的差異:生活水平提高使孕婦營養(yǎng)狀況改善導(dǎo)致新生兒體重實(shí)質(zhì)性增加:利用樣本信息檢驗(yàn)假設(shè)能否成立的過程稱為假設(shè)檢驗(yàn)。2121 上述案例的共同特點(diǎn)是:樣本統(tǒng)計(jì)量與總體參數(shù)之間,或不同組樣本統(tǒng)計(jì)量之間出現(xiàn)差異,這就提出了需要解決的問題:差異產(chǎn)生的原因(假設(shè))?由兩種誤差導(dǎo)致: 由隨機(jī)誤差導(dǎo)致樣本來自同一總體, 非本質(zhì)差異 不是隨機(jī)誤差導(dǎo)致樣本來自另一總體, 本質(zhì)差異用樣本信息檢驗(yàn)(推斷)上述假設(shè)哪個(gè)正確?統(tǒng)計(jì)假設(shè)統(tǒng)計(jì)假設(shè)2121假設(shè)檢驗(yàn)假設(shè)檢驗(yàn) 如何正確區(qū)分這兩種誤差,如何正確區(qū)分這兩種誤差,是解決問題的關(guān)鍵。是解決問題的關(guān)鍵。

6、假設(shè)檢驗(yàn)就是處理這一類假設(shè)檢驗(yàn)就是處理這一類問題的一種科學(xué)方法問題的一種科學(xué)方法它所根據(jù)的原理是它所根據(jù)的原理是小概率原理小概率原理。二、小概率原理假設(shè)檢驗(yàn)所依據(jù)的基本原理是小概率原理。什么是小概率?q概率是01之間的一個(gè)數(shù),因此小概率就是接近0的一個(gè)數(shù),一般指概率在0.05以下的事件。q著名的英國統(tǒng)計(jì)家Ronald Fisher 把20分之1作為標(biāo)準(zhǔn),也就是0.05,從此0.05或比0.05小的概率都被認(rèn)為是小概率。Fisher沒有任何深?yuàn)W的理由解釋他為什么選擇0.05,只是說他忽然想起來的什么是小概率原理?小概率原理發(fā)生概率很小的隨機(jī)事件(小概率事件)在一次實(shí)驗(yàn)中幾乎是不可能發(fā)生的。在一次

7、試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)。根據(jù)這一原理,可以先假設(shè)總體參數(shù)的某項(xiàng)取值為真,也就是假設(shè)其發(fā)生的可能性很大,然后抽取一個(gè)樣本進(jìn)行觀察,如果樣本信息顯示出現(xiàn)了與事先假設(shè)相反的結(jié)果且與原假設(shè)差別很大,則說明原來假定的小概率事件在一次實(shí)驗(yàn)中發(fā)生了,這是一個(gè)違背小概率原理的不合理現(xiàn)象,因此有理由懷疑和拒絕原假設(shè);否則不能拒絕原假設(shè)。檢驗(yàn)中使用的小概率由研究者在檢驗(yàn)前事先確定。小概率原理舉例:某工廠質(zhì)檢部門規(guī)定該廠產(chǎn)品次品率不超過4方能出廠。今從1000件產(chǎn)品中抽出10件,經(jīng)檢驗(yàn)有4件次品,問這批產(chǎn)品是否能出廠? 如果假設(shè)這批產(chǎn)品的次品率P4,則可計(jì)算事件“抽10件產(chǎn)品有4件次品”的

8、出現(xiàn)概率為: 可見,概率是相當(dāng)小的,1萬次實(shí)驗(yàn)中可能出現(xiàn)4次,然而概率如此小的事件,在一次實(shí)驗(yàn)中居然發(fā)生了,這是不合理的,而不合理的根源在于假設(shè)這批產(chǎn)品次品率P4 ,因而認(rèn)為假設(shè)次品率P4是不能成立的,故按質(zhì)檢部門的規(guī)定,這批產(chǎn)品不能出廠。00042. 0)04. 01 ()04. 0()4(6441010 CP又例又例 某醫(yī)生測(cè)量了某醫(yī)生測(cè)量了36名從事鉛作業(yè)男性工名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)工人的血紅。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值蛋白是否不同于正常成

9、年男性平均值140g/L?如果從事鉛作業(yè)不會(huì)影響工人的血紅蛋白如果從事鉛作業(yè)不會(huì)影響工人的血紅蛋白含量,則說明樣本均數(shù)含量,則說明樣本均數(shù)130.83g/L與總體均數(shù)與總體均數(shù)140g/L的差異是由抽樣誤差引起的,即的差異是由抽樣誤差引起的,即 = 0=140g/L,鉛作業(yè)男性工人的平均血紅蛋,鉛作業(yè)男性工人的平均血紅蛋白含量與正常成年男性的相等。白含量與正常成年男性的相等。 據(jù)此,可提出原假設(shè):H0: = 0=140g/L若原假設(shè)成立,事件 應(yīng)該是一個(gè)小概率事件(發(fā)生的概率為)?,F(xiàn)在 |2.138| t0.05/2,35=2.030 P , ,不拒絕 H0若p-值 /2 /2, 不拒絕 H0

10、若p /2 /2 -值 /2 /2, 拒絕 H0假設(shè)檢驗(yàn)結(jié)論的表述1.假設(shè)檢驗(yàn)的目的就在于試圖找到拒絕原假設(shè)的理由,而不在于證明什么是正確的2.拒絕原假設(shè)時(shí)結(jié)論是清楚的例如,H0: =3190,拒絕H0時(shí),我們可以說31903.當(dāng)不拒絕原假設(shè)時(shí)并非肯定原假設(shè)含義是 “不否定原假設(shè)” 或 “保留原假設(shè)”例如,當(dāng)不拒絕H0: =3190,我們并未說它就是3190,但也未說它不是3190。我們只能說樣本提供的證據(jù)還不足以推翻原假設(shè)假設(shè)檢驗(yàn)結(jié)論的表述1.報(bào)告結(jié)果時(shí),首先須給出檢驗(yàn)統(tǒng)計(jì)量,如U值、t值、自由度、P值,然后報(bào)告是否拒絕H0,最后結(jié)合問題的具體背景給出專業(yè)結(jié)論。2.拒絕原假設(shè)時(shí),表述為“差異

11、有統(tǒng)計(jì)學(xué)意義”,簡稱“有統(tǒng)計(jì)學(xué)意義”。3.不拒絕H0時(shí),表述為“差異無統(tǒng)計(jì)學(xué)意義”,簡稱“無統(tǒng)計(jì)學(xué)意義”第三節(jié) I型錯(cuò)誤與II型錯(cuò)誤(決策風(fēng)險(xiǎn)) 根據(jù)假設(shè)檢驗(yàn)做出判斷無非下述四種情況:1 1、原假設(shè)真實(shí),、原假設(shè)真實(shí), 并接受原假設(shè),判斷正確;并接受原假設(shè),判斷正確;2 2、原假設(shè)不真實(shí),且拒絕原假設(shè),判斷正確;、原假設(shè)不真實(shí),且拒絕原假設(shè),判斷正確;3 3、原假設(shè)真實(shí),、原假設(shè)真實(shí), 但拒絕原假設(shè),判斷錯(cuò)誤;但拒絕原假設(shè),判斷錯(cuò)誤;4 4、原假設(shè)不真實(shí),卻接受原假設(shè),判斷錯(cuò)誤。、原假設(shè)不真實(shí),卻接受原假設(shè),判斷錯(cuò)誤。 假設(shè)檢驗(yàn)的兩類錯(cuò)誤假設(shè)檢驗(yàn)是依據(jù)樣本提供的信息進(jìn)行判斷,有犯錯(cuò)誤的可能。所

12、犯錯(cuò)誤有兩種類型:第一類錯(cuò)誤是原假設(shè)H0為真時(shí),檢驗(yàn)結(jié)果把它當(dāng)成不真而拒絕了。犯這種錯(cuò)誤的概率用表示,也稱作錯(cuò)誤(error)或棄真錯(cuò)誤。第二類錯(cuò)誤是原假設(shè)H0不為真時(shí),檢驗(yàn)結(jié)果把它當(dāng)成真而接受了。犯這種錯(cuò)誤的概率用表示,也稱作錯(cuò)誤(error)或取偽錯(cuò)誤。假設(shè)檢驗(yàn)的兩類錯(cuò)誤正確決策和犯錯(cuò)誤的概率可以歸納為下表:假設(shè)檢驗(yàn)中各種可能結(jié)果的概率接受H0拒絕H0,接受H1H0 為真1-1-(正確決策)(正確決策)(棄真錯(cuò)誤)(棄真錯(cuò)誤)H0 為偽(取偽錯(cuò)誤)(取偽錯(cuò)誤)1-1-(正確決策)(正確決策) 假設(shè)檢驗(yàn)兩類錯(cuò)誤關(guān)系的圖示以單側(cè)上限檢驗(yàn)為例,設(shè)H0 :XX0 ,H1:XX0從上圖可以看出,如果

13、臨界值沿水平方向右移,從上圖可以看出,如果臨界值沿水平方向右移,將變小而將變小而變大,即若變大,即若減小減小錯(cuò)誤,就會(huì)增大犯錯(cuò)誤,就會(huì)增大犯錯(cuò)誤的機(jī)會(huì);如果臨界值沿水平方向左移,錯(cuò)誤的機(jī)會(huì);如果臨界值沿水平方向左移,將變大而將變大而變小,即若減小變小,即若減小錯(cuò)誤,也會(huì)增大犯錯(cuò)誤,也會(huì)增大犯錯(cuò)誤的機(jī)會(huì)。錯(cuò)誤的機(jī)會(huì)。圖圖(a) X X0H0為真為真圖圖(b) X X1 X0H0為偽為偽 錯(cuò)誤和 錯(cuò)誤的關(guān)系你不能同時(shí)減你不能同時(shí)減少兩類錯(cuò)誤少兩類錯(cuò)誤!在樣本容量n一定的情況下,假設(shè)檢驗(yàn)不能同時(shí)做到犯和兩類錯(cuò)誤的概率都很小。若減小錯(cuò)誤,就會(huì)增大犯錯(cuò)誤的機(jī)會(huì);若減小錯(cuò)誤,也會(huì)增大犯錯(cuò)誤的機(jī)會(huì)。要使和同

14、時(shí)變小只有增大樣本容量。但樣本容量增加要受人力、經(jīng)費(fèi)、時(shí)間等很多因素的限制,無限制增加樣本容量就會(huì)使抽樣調(diào)查失去意義。因此假設(shè)檢驗(yàn)需要慎重考慮對(duì)兩類錯(cuò)誤進(jìn)行控制的問題。兩類錯(cuò)誤的控制準(zhǔn)則 假設(shè)檢驗(yàn)中人們普遍執(zhí)行同一準(zhǔn)則:首先控制棄真錯(cuò)誤(錯(cuò)誤)。假設(shè)檢驗(yàn)的基本法則以為顯著性水平就體現(xiàn)了這一原則。 兩個(gè)理由:統(tǒng)計(jì)推斷中大家都遵循統(tǒng)一的準(zhǔn)則,討論問題會(huì)比較方便。更重要的是: 原假設(shè)常常是明確的,而備擇假設(shè)往往是模糊的。如H0: X X0很清楚, 而H1: X X0則不太清楚,是 X X0還是 X X0 ?大多少小多少都不清楚。對(duì)含義清晰的數(shù)量標(biāo)準(zhǔn)進(jìn)行檢驗(yàn)更容易被接受。因此,第一類錯(cuò)誤成為控制兩類錯(cuò)

15、誤的重點(diǎn)。第四節(jié) 單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)根據(jù)假設(shè)的形式不同,假設(shè)檢驗(yàn)可以分為雙側(cè)假設(shè)檢驗(yàn)(two-tailed test) 和單側(cè)假設(shè)檢驗(yàn)(one-tailed test)。若原假設(shè)是總體參數(shù)等于某一數(shù)值,如H0: X X0 ,即備擇假設(shè)H1: X X 0,那么只要 X X 0和 X X 0 二者中有一個(gè)成立,就可以否定原假設(shè)。這種假設(shè)檢驗(yàn)稱為雙側(cè)檢驗(yàn)。 雙側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ) /2 若原假設(shè)是總體參數(shù)大于等于或小于等于某一數(shù)值,如H0: X X 0 (即H1: X X0);或H0 : X X0 (即H1: X X0),那么對(duì)于前者當(dāng) X X0時(shí),對(duì)于后者當(dāng) X X0 時(shí),可以否定

16、原假設(shè)。這種假設(shè)檢驗(yàn)稱為單側(cè)檢驗(yàn)??梢苑譃樽髠?cè)檢驗(yàn)和右側(cè)檢驗(yàn)。 單側(cè)檢驗(yàn)有一個(gè)臨界值,一個(gè)拒絕域,拒絕域的面積為。分為左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)兩種情況。 左側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域) 右側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ) 雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn) (假設(shè)的形式)假設(shè)研究的問題(總體均值檢驗(yàn))雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)H0 X X= X X0 0 X X X X 0 0 X X X X 0 0H1 X X X X 0 0 X X X X 0 0第五節(jié) 假設(shè)檢驗(yàn)需要注意的問題 1.要有嚴(yán)密的研究設(shè)計(jì)要有嚴(yán)密的研究設(shè)計(jì) 組間應(yīng)均衡,具有可比性組間應(yīng)均衡,具有可比性。除對(duì)比的主要。除對(duì)比的主要因素因素(如

17、臨床試驗(yàn)用新藥和對(duì)照藥如臨床試驗(yàn)用新藥和對(duì)照藥)外,其它外,其它可能影響結(jié)果的因素可能影響結(jié)果的因素(如年齡、性別、病程、如年齡、性別、病程、病情輕重等病情輕重等)在對(duì)比組間應(yīng)相同或相近。在對(duì)比組間應(yīng)相同或相近。u配對(duì)設(shè)計(jì)計(jì)量資料:配對(duì)配對(duì)設(shè)計(jì)計(jì)量資料:配對(duì)t檢驗(yàn)。檢驗(yàn)。u完全隨機(jī)設(shè)計(jì)兩樣本計(jì)量資料:完全隨機(jī)設(shè)計(jì)兩樣本計(jì)量資料:小樣本小樣本(任一任一ni60)且方差齊且方差齊: 兩樣本兩樣本t檢驗(yàn)檢驗(yàn) 方差不齊方差不齊: 近似近似t 檢驗(yàn)檢驗(yàn)大樣本大樣本(所有所有ni60): u檢驗(yàn)。檢驗(yàn)。2.不同資料應(yīng)選用不同檢驗(yàn)方法不同資料應(yīng)選用不同檢驗(yàn)方法3.正確理解正確理解“significance”

18、一詞的含義一詞的含義過去稱差別有或無過去稱差別有或無“顯著性顯著性”,易造成兩,易造成兩樣本統(tǒng)計(jì)量之間比較相差很大的誤解。樣本統(tǒng)計(jì)量之間比較相差很大的誤解。u現(xiàn)在稱差別有或無現(xiàn)在稱差別有或無“統(tǒng)計(jì)學(xué)意義統(tǒng)計(jì)學(xué)意義”,相應(yīng),相應(yīng)推斷為:可以認(rèn)為或還不能認(rèn)為兩個(gè)或多個(gè)總推斷為:可以認(rèn)為或還不能認(rèn)為兩個(gè)或多個(gè)總體參數(shù)有差別。體參數(shù)有差別。4.結(jié)論不能絕對(duì)化結(jié)論不能絕對(duì)化 u因統(tǒng)計(jì)結(jié)論具有概率性質(zhì),故因統(tǒng)計(jì)結(jié)論具有概率性質(zhì),故“肯定肯定”、“一定一定”、“必定必定”等詞不要使用。等詞不要使用。u在報(bào)告結(jié)論時(shí),最好列出檢驗(yàn)統(tǒng)計(jì)量的在報(bào)告結(jié)論時(shí),最好列出檢驗(yàn)統(tǒng)計(jì)量的值,盡量寫出具體值,盡量寫出具體P值,而

19、不簡單寫成值,而不簡單寫成P0.05,以便讀者與同類研究進(jìn)行比較或進(jìn)行,以便讀者與同類研究進(jìn)行比較或進(jìn)行循證醫(yī)學(xué)時(shí)采用循證醫(yī)學(xué)時(shí)采用Meta分析。分析。 P ,拒絕H0,不能認(rèn)為H0肯定不成立,因?yàn)殡m然在H0成立的條件下出現(xiàn)等于及大于現(xiàn)有統(tǒng)計(jì)量的概率雖小,但仍有可能出現(xiàn);同理,P ,不拒絕H0,更不能認(rèn)為H0肯定成立。由此可見,假設(shè)檢驗(yàn)的結(jié)論是具有概率性的,無論拒絕H0或不拒絕H0,都有可能發(fā)生錯(cuò)誤,即第一類錯(cuò)誤或第二類錯(cuò)誤 5.統(tǒng)計(jì)統(tǒng)計(jì)“有意義有意義”與醫(yī)學(xué)與醫(yī)學(xué)“有意義有意義” 統(tǒng)計(jì)統(tǒng)計(jì)“有意義有意義”對(duì)應(yīng)統(tǒng)計(jì)結(jié)論,醫(yī)學(xué)對(duì)應(yīng)統(tǒng)計(jì)結(jié)論,醫(yī)學(xué)“有意義有意義”對(duì)應(yīng)專業(yè)結(jié)論。對(duì)應(yīng)專業(yè)結(jié)論。u統(tǒng)計(jì)結(jié)

20、論有意義,專業(yè)結(jié)論無意義,統(tǒng)計(jì)結(jié)論有意義,專業(yè)結(jié)論無意義,最終結(jié)論沒有意義,樣本含量過大或設(shè)計(jì)最終結(jié)論沒有意義,樣本含量過大或設(shè)計(jì)存在問題。存在問題。u統(tǒng)計(jì)結(jié)論無意義,專業(yè)結(jié)論有意義,統(tǒng)計(jì)結(jié)論無意義,專業(yè)結(jié)論有意義,檢查設(shè)計(jì)是否合理、樣本含量是否足夠。檢查設(shè)計(jì)是否合理、樣本含量是否足夠。第六節(jié) 假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系參數(shù)估計(jì)與假設(shè)檢驗(yàn)都是統(tǒng)計(jì)推斷的重要內(nèi)容。參數(shù)估計(jì)是根據(jù)樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的真值;假設(shè)檢驗(yàn)是根據(jù)樣本統(tǒng)計(jì)量來檢驗(yàn)對(duì)總體參數(shù)的檢驗(yàn)假設(shè)是否成立。 一、區(qū)間估計(jì)與假設(shè)檢驗(yàn)的主要區(qū)別一、區(qū)間估計(jì)與假設(shè)檢驗(yàn)的主要區(qū)別1.區(qū)間估計(jì)通常求得的是以樣本估計(jì)值為中心的雙側(cè)置信區(qū)間,而假設(shè)檢驗(yàn)

21、以假設(shè)總體參數(shù)值為基準(zhǔn),不僅有雙側(cè)檢驗(yàn)也有單側(cè)檢驗(yàn);2.區(qū)間估計(jì)立足于大概率,通常以較大的把握程度(置信水平)1-去保證總體參數(shù)的置信區(qū)間。而假設(shè)檢驗(yàn)立足于小概率,通常是給定很小的顯著性水平去檢驗(yàn)對(duì)總體參數(shù)的先驗(yàn)假設(shè)是否成立。二、區(qū)間估計(jì)與假設(shè)檢驗(yàn)的聯(lián)系1.區(qū)間估計(jì)與假設(shè)檢驗(yàn)都是根據(jù)樣本信息對(duì)總體參數(shù)進(jìn)行推斷,都是以抽樣分布為理論依據(jù),都是建立在概率基礎(chǔ)上的推斷,推斷結(jié)果都有一定的可信程度或風(fēng)險(xiǎn)。2.對(duì)同一問題的參數(shù)進(jìn)行推斷,二者使用同一樣本、同一統(tǒng)計(jì)量、同一分布,因而二者可以相互轉(zhuǎn)換。區(qū)間估計(jì)問題可以轉(zhuǎn)換成假設(shè)問題,假設(shè)問題也可以轉(zhuǎn)換成區(qū)間估計(jì)問題。區(qū)間估計(jì)中的置信區(qū)間對(duì)應(yīng)于假設(shè)檢驗(yàn)中的接受

22、區(qū)域,置信區(qū)間以外的區(qū)域就是假設(shè)檢驗(yàn)中的拒絕域。因此,利用置信區(qū)間可以進(jìn)行假設(shè)檢驗(yàn)。練習(xí)1、兩樣本比較時(shí),分別取以下檢驗(yàn)水準(zhǔn),哪一個(gè)的第二類錯(cuò)誤最小 A.=0.05 B.=0.01 C.=0.10 D.=0.20 E.=0.022、在假設(shè)檢驗(yàn)中,P值和 的關(guān)系為 A.P值越大, 值就越大 B.P值越大, 值就越小 C. P值和 值均可由研究者事先設(shè)定 D. P值和 值都不可以由研究者事先設(shè)定 E. P值的大小與 值的大小無關(guān) 3、假設(shè)檢驗(yàn)中的第二類錯(cuò)誤是指A.拒絕了實(shí)際上成立的H0 B.不拒絕實(shí)際上成立的H0C.拒絕了實(shí)際上成立的H1 D.不拒絕實(shí)際上不成立的H0 E.拒絕時(shí)所犯的錯(cuò)誤4、統(tǒng)計(jì)

23、推斷的內(nèi)容是A用樣本指標(biāo)推斷總體指標(biāo) B檢驗(yàn)統(tǒng)計(jì)上的“假設(shè)”CA、B均不是 DA、B均是是非題1進(jìn)行兩均數(shù)差別的假設(shè)檢驗(yàn)時(shí),當(dāng)P0.05時(shí),則拒絕H0;當(dāng)P0.05時(shí),則接受H0,認(rèn)為兩總體均數(shù)無差別。答案:錯(cuò)誤。當(dāng)答案:錯(cuò)誤。當(dāng)P P 0 0.0505,拒絕,拒絕H H0 0時(shí),我們是依據(jù)時(shí),我們是依據(jù)這一小概率來下結(jié)論的。而當(dāng)這一小概率來下結(jié)論的。而當(dāng)P P 0 0.0505時(shí),我們對(duì)兩總時(shí),我們對(duì)兩總體均數(shù)無差別這一結(jié)論無任何概率保證,因此不能貿(mào)體均數(shù)無差別這一結(jié)論無任何概率保證,因此不能貿(mào)然下無差別的結(jié)論。正確的說法是,按所取檢驗(yàn)水準(zhǔn)然下無差別的結(jié)論。正確的說法是,按所取檢驗(yàn)水準(zhǔn),接受

24、接受H H1 1的統(tǒng)計(jì)證據(jù)不足,或尚不能認(rèn)為兩總體均的統(tǒng)計(jì)證據(jù)不足,或尚不能認(rèn)為兩總體均數(shù)有差別。數(shù)有差別。 2通常單側(cè)檢驗(yàn)較雙側(cè)檢驗(yàn)更為靈敏,更易檢驗(yàn)出差別,應(yīng)此宜廣泛使用。答案:錯(cuò)誤。根據(jù)專業(yè)知識(shí)推斷兩個(gè)總體是否有差答案:錯(cuò)誤。根據(jù)專業(yè)知識(shí)推斷兩個(gè)總體是否有差別時(shí),是甲高于乙,還是乙高于甲,當(dāng)兩種可能都存別時(shí),是甲高于乙,還是乙高于甲,當(dāng)兩種可能都存在時(shí),一般選雙側(cè);若根據(jù)專業(yè)知識(shí),如果甲不會(huì)低在時(shí),一般選雙側(cè);若根據(jù)專業(yè)知識(shí),如果甲不會(huì)低于乙,或者研究者僅關(guān)心其中一種可能時(shí),可選用單于乙,或者研究者僅關(guān)心其中一種可能時(shí),可選用單側(cè)。一般來講,雙側(cè)檢驗(yàn)較為穩(wěn)妥。單側(cè)檢驗(yàn),應(yīng)以側(cè)。一般來講,

25、雙側(cè)檢驗(yàn)較為穩(wěn)妥。單側(cè)檢驗(yàn),應(yīng)以專業(yè)知識(shí)為依據(jù),它充分利用了另一側(cè)的不可能性,專業(yè)知識(shí)為依據(jù),它充分利用了另一側(cè)的不可能性,故檢出率高,但應(yīng)慎用。故檢出率高,但應(yīng)慎用。3只要增加樣本含量到足夠大,就可以避免I和II型錯(cuò)誤。答案:錯(cuò)誤。因?yàn)橥ㄟ^假設(shè)檢驗(yàn)推斷出的結(jié)論具有概率性,因此出現(xiàn)錯(cuò)誤判斷的可能性就一定存在,無論用任何方法也不能消除這一可能。但是,我們可以使錯(cuò)誤判斷的可能性盡量地小,比如樣本含量越大,犯I和II類錯(cuò)誤的可能性越小。 4、若兩樣本均數(shù)比較的假設(shè)檢驗(yàn)結(jié)果P值遠(yuǎn)遠(yuǎn)小于0.01,則說明差異非常大。錯(cuò)。錯(cuò)。P P 值的大小只能說明差異是否有統(tǒng)計(jì)學(xué)意義,值的大小只能說明差異是否有統(tǒng)計(jì)學(xué)意義

26、,同樣的差異,例數(shù)越多,同樣的差異,例數(shù)越多,P P 值越小。值越小。5 5、對(duì)同一參數(shù)的估計(jì),、對(duì)同一參數(shù)的估計(jì),99%99%可信區(qū)間比可信區(qū)間比90%90%可信可信區(qū)間好。區(qū)間好。錯(cuò)??尚艆^(qū)間的優(yōu)劣要通過兩點(diǎn)衡量:區(qū)間的可信錯(cuò)??尚艆^(qū)間的優(yōu)劣要通過兩點(diǎn)衡量:區(qū)間的可信度;區(qū)間的寬度。因此不能籠統(tǒng)的通過區(qū)間可信度度;區(qū)間的寬度。因此不能籠統(tǒng)的通過區(qū)間可信度的大小來評(píng)價(jià)優(yōu)劣。的大小來評(píng)價(jià)優(yōu)劣。簡答題1 簡述可信區(qū)間在假設(shè)檢驗(yàn)問題中的作用??尚艆^(qū)間不僅能回答差別有無統(tǒng)計(jì)學(xué)意義,而且可信區(qū)間不僅能回答差別有無統(tǒng)計(jì)學(xué)意義,而且還能提示差別有無實(shí)際意義??尚艆^(qū)間只能在預(yù)先規(guī)還能提示差別有無實(shí)際意義??尚艆^(qū)間只能在預(yù)先規(guī)定的概率即檢驗(yàn)水準(zhǔn)定的概率即檢驗(yàn)水準(zhǔn)的前提下進(jìn)行計(jì)算,而假設(shè)檢的前提下進(jìn)行計(jì)算,而假設(shè)檢驗(yàn)?zāi)軌颢@得一較為確切的概率驗(yàn)?zāi)軌颢@得一較為確切的概率P P 值。故將二者結(jié)合起值。故將二者結(jié)合起來,才是對(duì)假設(shè)檢驗(yàn)問題的完整分析。來,才是對(duì)假設(shè)檢驗(yàn)問題的完整分析。2 2、簡述假設(shè)檢驗(yàn)中、簡述假設(shè)檢驗(yàn)中P P 的含義的含義指從指從H H0 0 規(guī)定的總體隨機(jī)抽得等于及大于(或等于規(guī)定的總體隨機(jī)抽得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。及小于)現(xiàn)有樣本獲得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論