版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第
9
章
參數(shù)估計(jì)【學(xué)習(xí)目標(biāo)】理解參數(shù)估計(jì)的基本問(wèn)題,理解置信水平、置信區(qū)間、抽樣極限誤差等概念;理解參數(shù)估計(jì)的基本原理;掌握參數(shù)區(qū)間估計(jì)的方法;掌握確定樣本容量的基本方法。9.1概述9.1.1參數(shù)估計(jì)的一般問(wèn)題1.參數(shù)估計(jì)的概念高德地圖發(fā)布《2018
年度中國(guó)主要城市交通分析報(bào)告》央廣網(wǎng)2019-01-16近日,高德地圖聯(lián)合中國(guó)社會(huì)科學(xué)院社會(huì)學(xué)研究所、未來(lái)交通與城市計(jì)算聯(lián)合實(shí)驗(yàn)室、阿里云等單位共同發(fā)布了《2018
年度中國(guó)主要城市交通分析報(bào)告》(以下簡(jiǎn)稱“《報(bào)告》”)。
《報(bào)告》顯示,基于路網(wǎng)行程延時(shí)指數(shù)對(duì)監(jiān)測(cè)的
50
個(gè)城市進(jìn)行對(duì)比分析,發(fā)現(xiàn)
2018
年是四年來(lái)路網(wǎng)高峰行程延時(shí)指數(shù)最低的一年,同比
2017
年全國(guó)近
90%城市擁堵下降或持平。而通過(guò)該指數(shù)排名的中國(guó)堵城排行榜中,北京位列第一,廣州位列第二,上海位列第八。但即便位列第八的上海,其工作日平均通勤時(shí)長(zhǎng)(雙程)也達(dá)
85.27分鐘,也就是說(shuō),假如一個(gè)上海人要上35
年班,他一生花在通勤上的時(shí)間為
11869
小時(shí),這其中有
5443
小時(shí)是因?yàn)閾矶聦?dǎo)致的。
值得注意的是,北京本年度雖然被評(píng)為“首堵”,但北京的全天公交巡航速度(公交車輛在站點(diǎn)之間巡航速度的平均值)最高,達(dá)到
23.14km/h。其余高的城市還有紹興、東莞、蘇州、濟(jì)南、廈門、揚(yáng)州、石家莊、上海等。而全天公交巡航速度較低的城市包括太原、烏魯木齊、沈陽(yáng)等,其中太原僅為13.98km/h。高德地圖雖然掌握著眾多數(shù)據(jù),但它并不能知道北京的每一臺(tái)公交車的巡航速度,《報(bào)告》中所說(shuō)的北京公交的巡航速度為23.14km/h
只是部分北京公交的巡航速度,這是一個(gè)樣本結(jié)果,而不是總體的結(jié)果。在實(shí)際活動(dòng)中,人們總是用樣本的數(shù)量特征去估計(jì)總體的數(shù)量特征,這種方法就是參數(shù)估計(jì)。所謂參數(shù)估計(jì)就是用樣本的數(shù)量特征(統(tǒng)計(jì)量)對(duì)總體的數(shù)量特征(參數(shù))進(jìn)行估計(jì)的統(tǒng)計(jì)方法。在現(xiàn)實(shí)現(xiàn)象中,參數(shù)往往是未知的,比如北京公交的巡航速度。我們可以用抽樣的方法,用樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行估計(jì)。常用的參數(shù)有總體均值
、總體比率
、總體方差
2
,我們將參數(shù)抽象地記為
。2.估計(jì)量與估計(jì)值
用來(lái)估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱,稱為估計(jì)量。例如:樣本平均數(shù)
X、樣本比率
p
、樣本方差
s
2
都是估計(jì)量,我們將估計(jì)量抽象地記為
。由樣本數(shù)據(jù)計(jì)算得到的對(duì)應(yīng)估計(jì)量的數(shù)值稱為估計(jì)值。例如:為了估計(jì)北京公交的巡航速度,我們抽取由
100
輛運(yùn)營(yíng)的北京公交車作為樣本,記錄它們?nèi)斓难埠剿俣?,然后?jì)算平均值為
23.14km/h,這個(gè)數(shù)值就是一個(gè)估計(jì)值。3.點(diǎn)估計(jì)與區(qū)間估計(jì)
參數(shù)估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。
用估計(jì)量
的值作為參數(shù)
的估計(jì)值,稱為參數(shù)的點(diǎn)估計(jì)。例如:經(jīng)過(guò)抽樣并計(jì)算出北京公交的巡航速度為
23.14km/h,即
=23.14。如果我們用這個(gè)估計(jì)值作為總體均值,即
23.14
,這就是點(diǎn)估計(jì)。點(diǎn)估計(jì)在方法上比較簡(jiǎn)便,在理論上也有可靠的依據(jù),但是卻不能表述出點(diǎn)估計(jì)值與參數(shù)的真實(shí)值接近的程度(估計(jì)的誤差)以及對(duì)應(yīng)估計(jì)的可靠程度(概率度)。
在點(diǎn)估計(jì)的基礎(chǔ)上,給出參數(shù)估計(jì)的一個(gè)范圍,稱為區(qū)間估計(jì)。例如:北京公交的巡航速度的點(diǎn)估計(jì)值為
23.14km/h,即
=23.14,可以認(rèn)為北京公交的巡航速度在
23.14
左右,我們?cè)谝欢煽砍潭鹊谋WC下給出一個(gè)范圍。區(qū)間估計(jì)是參數(shù)估計(jì)的重要方法,在后面的內(nèi)容里我們將做詳細(xì)的討論。9.1.2
參數(shù)估計(jì)的理論依據(jù)和基本問(wèn)題1.大數(shù)定律在第
8
章中我們對(duì)大數(shù)定律做了描述,它為我們進(jìn)行參數(shù)估計(jì)提供了理論基礎(chǔ)。例如:設(shè)北京公交巡航速度的平均用時(shí)為
,是一個(gè)未知的參數(shù),我們對(duì)這一現(xiàn)象進(jìn)行多次觀察―即抽樣(抽取
100輛運(yùn)營(yíng)公交車)并測(cè)量樣本中的每一輛公交車的巡航速度,記為X
1
,
X
2
,......X
n
。由大數(shù)定律,當(dāng)
n
(
樣本容量)足夠大時(shí),有這個(gè)結(jié)論為我們用樣本平均數(shù)
對(duì)總體均值
進(jìn)行估計(jì)提供了理論基礎(chǔ)。同理,我們可以用樣本比率
p
對(duì)總體比率
進(jìn)行估計(jì),用樣本方差
s
2
對(duì)總體方差
2
進(jìn)行估計(jì)。2.中心極限定理
以樣本平均數(shù)為例,在重復(fù)抽樣、大樣本、總體方差已知的條件下,我們有:
,其分布圖如圖9-1。由概率論知識(shí),樣本平均數(shù)
落在總體均值μ的兩側(cè)各為一個(gè)標(biāo)準(zhǔn)誤差(抽樣平均誤差)范圍內(nèi)概率為0.9545;落在三個(gè)標(biāo)準(zhǔn)誤差范圍內(nèi)的概率為0.9973。
圖
9-1的抽樣分布X
的分布
由圖
9-1
可以看出,如果我們要求樣本平均數(shù)
離
越近(估計(jì)的誤差?。?,對(duì)應(yīng)的可能性也就是概率越小,即可靠程度越低;要求樣本平均數(shù)
離
越遠(yuǎn)(估計(jì)的誤差大),對(duì)應(yīng)的可能性也就是概率也越大,即可靠程度越高。這說(shuō)明,估計(jì)的誤差會(huì)受到兩個(gè)因素的影響:一是抽樣平均誤差(標(biāo)準(zhǔn)誤差);另一個(gè)是我們要求的可靠程度。這些結(jié)論為我們描述估計(jì)的誤差提供了依據(jù)。3.風(fēng)險(xiǎn)水平與置信水平
由上段的分析,可以理解估計(jì)的誤差與可靠程度的關(guān)系。仍以樣本平均數(shù)
為例,設(shè)在估計(jì)時(shí)發(fā)生錯(cuò)誤的概率為
,因?yàn)槲覀兿M稿e(cuò)誤的可能性要盡量地小,所以我們?cè)O(shè)定的
很小,一般為5%或更小。
稱為風(fēng)險(xiǎn)水平,其意義是指這樣的事件發(fā)生的概率:“遠(yuǎn)離”了
,或者說(shuō)
與
的差距超過(guò)了允許的范圍,即
落入到了如圖
9-2
所示陰影的范圍內(nèi)。由于
的抽樣分布是正態(tài)分布,所以
被平分在兩側(cè)。
B圖
9-2風(fēng)險(xiǎn)水平與置信水平的分布
2
2A
區(qū)間(A,B)對(duì)應(yīng)的概率為1
,我們稱為置信水平。其意義是指我們相信在所有的
中,有(1
)的
與
的差距沒(méi)有超過(guò)允許的范圍。4.抽樣極限誤差
我們將在參數(shù)估計(jì)中研究者所允許的誤差稱為抽樣極限誤差,也稱為邊際誤差,記為
。如何度量
呢?仍然以
為例,從圖
9-2
可以看出,這個(gè)允許的范圍就是區(qū)間(A,B)的半徑,而這個(gè)半徑的長(zhǎng)短是由
的抽樣分布和風(fēng)險(xiǎn)水平
決定的。在
的抽樣分布確定的條件下,
的值越大,區(qū)間(A,B)就越窄,估計(jì)的誤差越??;
的值越小,區(qū)間(A,B)就越寬,估計(jì)的誤差越大。
雖然的抽樣分布是正態(tài)分布,但由于μ未知,故A、B兩點(diǎn)的坐標(biāo)
、也未知,也就無(wú)法求出抽樣極限誤差
x
。
為了度量,對(duì)做標(biāo)準(zhǔn)變換,則
,如圖9-3所示。圖
9-3
標(biāo)準(zhǔn)正態(tài)分布(9-1)
當(dāng)風(fēng)險(xiǎn)水平為
α?xí)r,則對(duì)應(yīng)的臨界值是,經(jīng)過(guò)標(biāo)準(zhǔn)變換,原來(lái)正態(tài)分布的μ點(diǎn)坐標(biāo)變換到標(biāo)準(zhǔn)正態(tài)分布的0,原來(lái)正態(tài)分布的B點(diǎn)坐標(biāo)()變換到標(biāo)準(zhǔn)正態(tài)分布的,這時(shí)有則有:
當(dāng)總體方差未知時(shí),則用s
2
代替
2
,這時(shí)
,同樣有抽樣極限誤差為:
(9-2)同理,可以得到關(guān)于樣本比率
p
的抽樣極限誤差:(9-3)當(dāng)
未知時(shí)可用
p
代替。5.參數(shù)估計(jì)的標(biāo)準(zhǔn)1)無(wú)偏性
如果估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù),即E()=,則稱這個(gè)估計(jì)量是無(wú)偏的,其意義如圖
9-4a
所示。2)有效性
如果一個(gè)參數(shù)有兩個(gè)估計(jì)量,則其中方差較小的估計(jì)量是有效的,即如果
,則
是較
有效的估計(jì)量,其意義是計(jì)量
較估計(jì)量
更密集地集中在
的附近,這樣隨機(jī)抽取一個(gè),就要比隨機(jī)抽取一個(gè)離近的可能性要大。如圖9-4b所示。a)無(wú)偏性b)有效性3)一致性如果隨著樣本容量的增大,估計(jì)量與參數(shù)之間的差距變小,則稱這個(gè)估計(jì)量是一致的。其意義是隨著樣本容量的增大,抽樣分布的方差會(huì)變小,其意義如圖9-5
所示。圖
9-5 一致性可以證明,樣本平均數(shù)
、樣本比率
p
、樣本方差
s
2
分別是總體均值
、總體比率
、總體方差
2
的無(wú)偏、有效、一致的估計(jì)量。9.2一個(gè)總體參數(shù)的區(qū)間估計(jì)我們進(jìn)行抽樣的目的之一就是要用統(tǒng)計(jì)量對(duì)參數(shù)進(jìn)行估計(jì)。在實(shí)際的社會(huì)經(jīng)濟(jì)現(xiàn)象中,總體參數(shù)一般都是未知的,是需要我們進(jìn)行估計(jì)的,而估計(jì)量是可以通過(guò)計(jì)算某個(gè)樣本數(shù)據(jù)得到估計(jì)值的。仍然以樣本平均數(shù)
為例,由上節(jié)的分析,我們可以知道
落在以
為中心的一定范圍內(nèi)的概率是多少,由于
與
的距離是對(duì)稱的,所以
也以相同的概率被包含在以
為中心的區(qū)間內(nèi),利用這個(gè)原理,可以對(duì)
進(jìn)行區(qū)間估計(jì)。9.2.1
總體均值的區(qū)間估計(jì)1.大樣本情形1)總體方差已知
由中心極限定理,當(dāng)總體方差已知、大樣本時(shí),有
。假設(shè)風(fēng)險(xiǎn)水平為α,則置信水平為1-α,由某個(gè)樣本得到的估計(jì)值為,如圖9-6所示。圖
9-6
的區(qū)間估計(jì)
其中區(qū)間(C,D)是由(A,B)平移得到的,AB的中點(diǎn)是
,CD
的中點(diǎn)是
。如果
落在區(qū)間(A,B)中(概率為1
),則區(qū)間(C,D)也將包含
,概率也為1
。所以,區(qū)間(C,D)稱為
的置信水平為1
的置信區(qū)間,C
點(diǎn)稱為置信區(qū)間的下限,D
點(diǎn)稱為置信區(qū)間的上限。由公式(9-1),C點(diǎn)的橫坐標(biāo)是,D點(diǎn)的橫坐標(biāo)是
,所以μ的1-α的置信區(qū)間是:(
,
)
(9-4)
由以上分析顯然有:
對(duì)μ的置信區(qū)間的理解要注意以下幾個(gè)問(wèn)題:一是區(qū)間(C,D)是由某一個(gè)樣本平均數(shù)確定的,而是隨機(jī)的,所以區(qū)間(C,D)也是隨機(jī)的,我們得到的這個(gè)區(qū)間是用這種方法構(gòu)造的成千上萬(wàn)個(gè)這樣的區(qū)間中特定的一個(gè)。二是對(duì)置信水平的理解。假設(shè)風(fēng)險(xiǎn)水平α=5%,則置信水平1-α=95%,其含義是:假如按照構(gòu)造置信區(qū)間的方法構(gòu)造的這樣的區(qū)間有10000個(gè),則其中有95%即9500個(gè)區(qū)間包含總體均值μ的真值,我們有95%把握相信,由某一個(gè)樣本平均數(shù)構(gòu)造的區(qū)間是包含總體均值μ的真值的9500個(gè)區(qū)間中的一個(gè)。
這些解釋可以用圖9-7來(lái)描述。圖
9-7
參數(shù)的區(qū)間估計(jì)
【例
9-1】北青網(wǎng)
2018-04-17
大學(xué)生對(duì)手機(jī)形成依賴,日均使用時(shí)間超過(guò)
5.2
小時(shí),手機(jī)已經(jīng)是我們生活中難以缺少的一部分了,可以毫不夸張的說(shuō),有些人離開了手機(jī)啥也干不了!就像對(duì)手機(jī)有癮一樣,的確手機(jī)對(duì)我們來(lái)說(shuō)也是越來(lái)越重要了,平常的買東西都需要手機(jī),就連小編都好久沒(méi)有觸摸現(xiàn)金了!大學(xué)生用起手機(jī)來(lái)更加恐怖,日均使用
5.2
個(gè)小時(shí)。麥可思研究院發(fā)布的一份中國(guó)在校大學(xué)生手機(jī)使用調(diào)查報(bào)告顯示,超八成大學(xué)生存在“手機(jī)依賴”,日均使用手機(jī)的時(shí)間超
5
小時(shí),18
點(diǎn)以后是大學(xué)生使用手機(jī)的高峰期。此外,79%的大學(xué)生在課堂上使用手機(jī)。假設(shè)麥可思研究院在各地區(qū)抽取了
100
名在校大學(xué)生,記錄下他們?cè)谀骋还ぷ魅帐褂檬謾C(jī)的時(shí)間,并計(jì)算得到平均值為
5
小時(shí)。如果總體標(biāo)準(zhǔn)差為
1.5
小時(shí),置信水平為
95%。(1)在校大學(xué)平均使用手機(jī)時(shí)間的點(diǎn)估計(jì)值是多少?(2)計(jì)算抽樣極限誤差;(3)對(duì)在校大學(xué)平均使用手機(jī)的時(shí)間做區(qū)間估計(jì)。解:已知:n=100,=5,α=5%,1-α=95%,查表得(1)在校大學(xué)生平均使用手機(jī)時(shí)間的點(diǎn)估計(jì)值為5個(gè)小時(shí)。(2)由式(9-1)得(3) 由式(9-4)得:
在校大學(xué)生平均使用手機(jī)時(shí)間95%的置信區(qū)間為(4.706,5.294).2)總體方差未知
當(dāng)總體方差未知時(shí),則
服從自由度為
n-1
的
t
分布,置信水平為1-α的置信區(qū)間為:(,)(9-6)
同理有:(9-7)
【例
9-2】2018-08-14
新浪科技
2018
年全球網(wǎng)速排名:中國(guó)大陸排名第
141
北京時(shí)間
8
月
13
日下午消息,M-Lab
近期發(fā)布了全球?qū)拵ЬW(wǎng)速排名榜。榜單收集了從
2017
年
6
月到
2018
年
5
月
29
日
12
個(gè)月時(shí)間內(nèi)的網(wǎng)速數(shù)據(jù),共有
200
個(gè)國(guó)家和地區(qū)上榜,測(cè)速次數(shù)超過(guò)
1.63億次。排行榜顯示,全球?qū)拵俣扰旁诘谝晃坏氖切录悠?,平均下載速度達(dá)到了60.39Mbps,排在第二位的是瑞典,其寬帶平均下載速度為
46Mbps,這兩個(gè)國(guó)家的排名和去年一樣。排在第三至六位的分別是丹麥、挪威、羅馬尼亞以及比利時(shí)。數(shù)據(jù)顯示,中國(guó)大陸排在第141
位,
寬帶平均下載速度是2.38Mbps,雖然這一速度相對(duì)去年的
1.55Mbps
有所提升,但在今年的總排名中,中國(guó)大陸的排名還是下降了
7
位。此外,中國(guó)香港的網(wǎng)速全球排名
19
位,每秒是
26.45Mbit。中國(guó)臺(tái)灣的網(wǎng)速全球排名第
14
位,達(dá)到了
28.09Mbps,不過(guò)相比去年排名下降了
11
位。
M-Lab
是一家旨在測(cè)量全球網(wǎng)絡(luò)狀況的組織,由新美國(guó)基金會(huì)(New
America
Foundation)旗下的開放技術(shù)研究所(Open
Technology
Institute)、谷歌開源研究中心(Google
Open
SourceResearch)、普林斯頓大學(xué)的
PlanetLab
及其它支持機(jī)構(gòu)發(fā)起成立。假設(shè)在中國(guó)大陸不同地區(qū)抽取
49家網(wǎng)絡(luò)運(yùn)營(yíng)商進(jìn)行調(diào)查,測(cè)得互聯(lián)網(wǎng)連接速度數(shù)據(jù)(數(shù)據(jù)見
Data9-1)。根據(jù)這些數(shù)據(jù),對(duì)中國(guó)大陸平均網(wǎng)速做點(diǎn)估計(jì)和
95%置信水平的區(qū)間估計(jì)。解:由Excel計(jì)算得=2.45,s=0.60,且n=49,1-α=95%。查表得=2.01。(1)中國(guó)大陸平均網(wǎng)速的點(diǎn)估計(jì)值為2.43Mbps。
(2)中國(guó)大陸平均網(wǎng)速的區(qū)間估計(jì):由式(9-6)得:中國(guó)大陸平均網(wǎng)速95%的置信區(qū)間為(2.28,2.62)2.小樣本情形由于小樣本有更大的偶然性,在這種條件下則要求總體服從正態(tài)分布,以降低估計(jì)的風(fēng)險(xiǎn)。1)總體服從正態(tài)分布、方差已知在這個(gè)條件下,
的置信區(qū)間構(gòu)造方法同公式(9-4)。【例
9-3】某銀行為了估計(jì)一臺(tái)自動(dòng)取款機(jī)(ATM
機(jī))的日平均取款額,連續(xù)抽取了
25
天該自動(dòng)取款機(jī)的取款額,計(jì)算得平均取款額為7.2
萬(wàn)元。假設(shè)總體服從正態(tài)分布,標(biāo)準(zhǔn)差為
1
萬(wàn)元,求該自動(dòng)取款機(jī)置信水平為
95%的日平均取款額置信區(qū)間。解:
已知 n
=
25,
=
7.2
,
=
1
,
1
=
95%
,查表得則由式(9-4)有:該自動(dòng)取款機(jī)置信水平為
95%的日平均取款額置信區(qū)間為(6.808,7.592)。2)總體服從正態(tài)分布、方差未知
在這個(gè)條件下,
的置信區(qū)間構(gòu)造方法同公式(9-6)。
【例
9-4】隨著社會(huì)的進(jìn)步和經(jīng)濟(jì)的發(fā)展,電已經(jīng)成為人們不可或缺的生產(chǎn)必須品。為了保障電力供應(yīng),國(guó)家電網(wǎng)公司向社會(huì)公布了供電服務(wù)“十項(xiàng)承諾",其中第二項(xiàng)承諾為:提供
24
小時(shí)電力故障報(bào)修服務(wù),供電搶修人員到達(dá)現(xiàn)場(chǎng)的時(shí)間一般不超過(guò):城區(qū)范圍45
分鐘;農(nóng)村地區(qū)
90
分鐘;特殊邊遠(yuǎn)地區(qū)
2
小時(shí)。
為了核實(shí)某市電網(wǎng)公司落實(shí)供電服務(wù)“十項(xiàng)承諾"的情況,在該市的電力故障報(bào)修服務(wù)記錄中抽取到
25
條城區(qū)范圍報(bào)修服務(wù)記錄作為樣本,統(tǒng)計(jì)出供電搶修人員到達(dá)現(xiàn)場(chǎng)的時(shí)間的數(shù)據(jù)(數(shù)據(jù)見Data9-2)。(1)該市供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間的點(diǎn)估計(jì)是多少?(2)假設(shè)總體服從正態(tài)分布,構(gòu)造該市供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間的
95%的置信區(qū)間。解:由樣本數(shù)據(jù)計(jì)算得:=30.44,s=4.93,n=25,1-α=95%,查表得(1)供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間的點(diǎn)估計(jì)值為30.44分鐘。供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間
95%的置信區(qū)間為(28.40,32.48)。(2)由公式(9-6)有:9.2.2
總體比率的區(qū)間估計(jì)
由中心極限定理,當(dāng)大樣本、重復(fù)抽樣時(shí),樣本比率的抽樣分布是正態(tài)分布,其抽樣極限誤差如公式(9-3)所示。所以總體比率1
的置信區(qū)間是:()(9-8)當(dāng)
未知時(shí)可用
p
代替。大樣本的標(biāo)準(zhǔn)是使n
5
和n(1
)
5
同時(shí)成立時(shí)的n,或者按表8-5
的經(jīng)驗(yàn)值進(jìn)行判斷。
【例9-5】中國(guó)廣視索福瑞媒介研究(CSM)是央視市場(chǎng)研究(CTR)與
Kantar
Media
集團(tuán)等共同建立的中外合作企業(yè),致力于專業(yè)的電視收視和廣播收聽市場(chǎng)研究,為中國(guó)大陸地區(qū)和香港傳媒行業(yè)提供可靠的、不間斷的視聽調(diào)查服務(wù)。CSM
擁有龐大的廣播電視受眾調(diào)查網(wǎng)絡(luò),覆蓋
5.78
萬(wàn)余戶樣本家庭;其電視收視率調(diào)查網(wǎng)絡(luò)所提供的數(shù)據(jù)可推及中國(guó)內(nèi)地超過(guò)12.8億和香港地區(qū)
655
萬(wàn)的電視人口;其廣播收聽率調(diào)查的數(shù)據(jù)則可推及中國(guó)超過(guò)
1.2
億的廣播人口。
假設(shè)
CSM
為了推斷某一檔電視節(jié)目的收視率,在這檔電視節(jié)目播出期間,抽取了
1000
戶家庭進(jìn)行調(diào)查,得到收看這檔電視節(jié)目的家庭比率為
4%。依據(jù)這些數(shù)據(jù)求:(1)這檔電視節(jié)目平均收視率置信水平為
95%的抽樣極限誤差為多少?(2)這檔電視節(jié)目平均收視率置信水平為
95%的置信區(qū)間為多少?解:已知n=1000,p=4%,1-α=95%,查表得
,顯然,這是一個(gè)大樣本,故可以正態(tài)分布進(jìn)行估計(jì)。(1)抽樣極限誤差為:這檔電視節(jié)目平均收視率置信水平為
95%的置信區(qū)間為(2.8%,5.2%)。(2)由式(9-8)有:9.2.3
總體方差的區(qū)間估計(jì)
由第8
章的內(nèi)容知,樣本方差的抽樣分布服從卡方分布,由(8-15)式有:
。假設(shè)置信水平為1
,則如圖
9-8
所示:
/
2
/
2圖9-8卡方分布圖對(duì)總體方差做區(qū)間估計(jì)就是要使成立。整理得:
(9-9)
這就是構(gòu)造總體方差
2
的置信區(qū)間的方法?!纠?/p>
9-6】“愛情就像公交,苦苦等待卻怎么也等不到;愛情就像公交,有時(shí)候就差一點(diǎn)卻眼睜睜看著它遠(yuǎn)去;愛情就像公交,以為自己追上了卻發(fā)現(xiàn)怎么也擠不上?!边@是網(wǎng)上流行的一個(gè)段子,它從一個(gè)側(cè)面反映了人們對(duì)長(zhǎng)時(shí)間等待公交車的一種無(wú)奈。由于各種各樣的原因,雖然發(fā)車時(shí)間隔的時(shí)間相同,但是同一路公交車到達(dá)某一站的時(shí)間間隔會(huì)有比較大的差異。為了評(píng)估某城城市等待公交車的情況,選擇了其中一路公交車在某一時(shí)段時(shí)行調(diào)查,連續(xù)記錄了
25
輛公交車到達(dá)某站的時(shí)間間隔,經(jīng)計(jì)算時(shí)間間隔的方差為
16
分鐘,試以置信水平為
95%對(duì)總體方差做區(qū)間估計(jì)。
解:已知:n=25,s2=16,1-α=95%,查表得:,
。則總體方差95%的置信區(qū)間為(9.76,30.96)。9.3兩個(gè)總體參數(shù)的區(qū)間估計(jì)很多時(shí)候我們需要在兩個(gè)總體之間進(jìn)行比較。例如:比較兩個(gè)地區(qū)的平均勞動(dòng)報(bào)酬,就需要在兩個(gè)地區(qū)分別抽取樣本,再用樣本的平均數(shù)做出估計(jì)。為此先要建立一個(gè)基本概念--獨(dú)立樣本與匹配樣本。9.3.1
獨(dú)立樣本與匹配樣本當(dāng)我們要在兩個(gè)總體參數(shù)之間進(jìn)行比較時(shí),就要在兩個(gè)總體中分別抽取樣本,然后進(jìn)行比較。而在兩個(gè)總體中抽取樣本,可以有兩種抽取方法:一種是兩個(gè)樣本的抽取互相之間沒(méi)有影響,這時(shí)我們稱這樣抽取的兩個(gè)樣本是獨(dú)立樣本;另一種是兩個(gè)樣本的抽取互相之間有影響,這時(shí)我們稱這樣抽取的兩個(gè)樣本是匹配樣本。例如,為了研究駕駛員佩戴墨鏡是否會(huì)降低反應(yīng)速度,需要在佩戴墨鏡和不佩戴墨鏡兩個(gè)總體中抽取樣本,然后進(jìn)行比較。如果抽取若干名駕駛員,讓他們佩戴墨鏡測(cè)試反應(yīng)速度(一個(gè)樣本),然后再不加限制條件再抽取若干名駕駛員,讓他們不佩戴墨鏡測(cè)試速度(另一個(gè)樣本),這樣得到的兩個(gè)樣本是獨(dú)立樣本。但是,這樣的兩個(gè)樣本結(jié)果可能缺少可比性,因?yàn)椴煌娜似浞磻?yīng)速度是有差異的,為了增強(qiáng)可比性,我們可以抽取若干名駕駛員,讓他們佩戴墨鏡測(cè)試反應(yīng)速度(一個(gè)樣本),然后再讓這些駕駛員不佩戴墨鏡測(cè)試速度(另一個(gè)樣本),這樣得到的兩個(gè)樣本是匹配樣本。9.3.2
兩個(gè)總體均值之差的區(qū)間估計(jì)1.大樣本情形1)兩個(gè)總體的方差已知在這個(gè)條件下,由中心極限定理知兩個(gè)樣本平均數(shù)
X
1
,
X
2
分別服從正態(tài)分布。即:,
由正態(tài)分布再生定理知,其中分別表示兩個(gè)總體的均值,
分別表示兩個(gè)總體的方差,分別表示兩個(gè)樣本容量。
設(shè)置信水平為1-α,則抽樣極限誤差為:
(9-10)
兩個(gè)總體均值之差的置信區(qū)間為:(,)
(9-11)2)兩個(gè)總體方差未知但相等
設(shè)
,分別表示兩個(gè)樣本的方差,置信水平為1
,則由概率論知識(shí)可以證明:
(9-12)
其中:(9-13)稱為聯(lián)合方差估計(jì)。
兩個(gè)總體均值之差
1
2
的置信區(qū)間為:(,)(9-14)3)兩個(gè)總體方差未知且不相等此時(shí),估計(jì)量由公式(9-15)中的
t分布近似,但其自由度
df
由公式(9-16)決定:(9-15)(9-16)[x]表示不超過(guò)
x
的最大整數(shù)。此時(shí),兩個(gè)總體均值之差
1
2
的置信區(qū)間為:(
,)
(9-17)
注意此時(shí)的自由度是由公式(9-16)決定的?!纠?/p>
9-7】本周一(6
月
25
日),美世Mercer
公布了
2018
年全球城市生活成本排名
排在今年全球前十的中國(guó)城市,除了再次登頂?shù)南愀?,還有第
7
的上海和第
9
的北京。加上同樣位列TOP10
的東京、首爾、新加坡……連美世官方都不得不感嘆,亞洲城市前
10
占
6,住不起也惹不起?。《诒鄙细壑?,高居全球前
50
的中國(guó)城市還有深圳(12)、廣州(15)、南京(25)、臺(tái)北(27)、天津(29)、成都(31)、青島(36)和沈陽(yáng)(38)。
據(jù)BBC
News
以及美世官網(wǎng)介紹,這項(xiàng)排名今年已經(jīng)是連續(xù)第
24
年發(fā)布,具有相當(dāng)高的聲譽(yù)和可信度。它以紐約、美元作為測(cè)算基礎(chǔ),對(duì)全球范圍內(nèi)超過(guò)
375
個(gè)城市進(jìn)行數(shù)據(jù)收集和對(duì)比,所涵蓋的分項(xiàng)包括房?jī)r(jià)、交通費(fèi)、餐飲開銷、服裝配飾、娛樂(lè)休閑等
200
多個(gè)。(搜狐網(wǎng)
2018-07-01)
如果假設(shè)兩個(gè)城市生活成本的總體方差相等,則:(1)兩個(gè)總體均值之差的點(diǎn)估計(jì)為多少?(2)兩個(gè)總體均值之差的
95%的置信區(qū)間為多少?(3)你認(rèn)為這兩座城市的生活成本有顯著差異嗎?為了比較不同城市的生活成本,分別在沈陽(yáng)和成都抽取了兩個(gè)獨(dú)立樣本,調(diào)查數(shù)據(jù)如下:樣本1:成都=2100元=200=85樣本2:沈陽(yáng)=1900元=160=100
解:(1)因?yàn)?2100-1900=200,所以兩個(gè)總體均值之差的點(diǎn)估計(jì)為200。(2)由公式(9-13)得:則
:
由Excel得
兩個(gè)總體均值之差的
95%的置信區(qū)間為(145.9,254.1)。(3)由于置信區(qū)間不包含
0,所以這兩座城市的生活成本有顯著的差異。2.小樣本情形
當(dāng)樣本是小樣本時(shí),則要求兩個(gè)總體均服從正態(tài)分布。此時(shí),也可以分別討論兩個(gè)總體方差已知、兩個(gè)總體方差未知但相等、兩個(gè)總體方差未知且不相等三種情況,其結(jié)論與大樣本時(shí)相同,置信區(qū)間分別可由公式(9-11)、(9-14)和(9-17)給出。【例
9-8】北京澳德物流有限責(zé)任公司是一家主要經(jīng)營(yíng)國(guó)內(nèi)食品冷鏈運(yùn)輸業(yè)務(wù)的第三方物流運(yùn)輸企業(yè),成立于
2006
年
,是一家致力于優(yōu)化冷鏈?zhǔn)称芳吧r電商供應(yīng)鏈鏈路、降低運(yùn)營(yíng)成本、提高運(yùn)營(yíng)時(shí)效品質(zhì)的冷鏈物流公司。該公司常年給一家企業(yè)提供第三方物流服務(wù),需要在每天的同一時(shí)間將貨物從甲地送往乙地,送貨有兩條線路,雖然路程基本相,但車流量卻不同。為了比較兩條線路所需要的時(shí)間,物流公司隨機(jī)抽取了兩個(gè)獨(dú)立樣本,記錄下送貨所需的時(shí)間,兩個(gè)樣本整理后的結(jié)果如下。假設(shè)兩條線路所需時(shí)間的總體服從正態(tài)分布且方差相等,求兩條線路均值之差的95%的置信區(qū)間。樣本1:線路A
=46分鐘=5分鐘=24樣本2:線路B=42分鐘=3分鐘=18解:由公式(9-13)得:則=4.27查表得:兩條線路均值之差的
95%的置信區(qū)間為(1.3,6.7)。由于這個(gè)置信區(qū)間不包含
0,所以兩條線路所需時(shí)間存在顯著差異。9.3.3
兩個(gè)總體比率之差的區(qū)間估計(jì)兩個(gè)總體比率之差的區(qū)間估計(jì),
要求是大樣本,即:n1
1
5及n1(1
1)
5
、n2
2
5及n2
(1
2
)
5
都成立,或者按表
8-5
的經(jīng)驗(yàn)值進(jìn)行判斷。此時(shí),兩個(gè)樣本比率之差的抽樣分布是:
(9-18)兩個(gè)總體比率之差
1
2
的置信區(qū)間為:(,)
(9-19)當(dāng)
1
,
2
未知時(shí),用
p1
,
p2
代替。(9-18)設(shè)置信水平為1
,則抽樣極限誤差為:【例
9-9】
7
月
11
日,中國(guó)汽車技術(shù)研究中心聯(lián)合全球道路安全合作伙伴、世界衛(wèi)生組織、中國(guó)婦女發(fā)展基金會(huì)、標(biāo)準(zhǔn)所、中汽認(rèn)證中心有限公司、上海疾控中心、國(guó)家轎車質(zhì)量監(jiān)督檢驗(yàn)中心等機(jī)構(gòu)專家在津發(fā)布
2018
版中英文《中國(guó)兒童道路交通安全藍(lán)皮書》。
《中國(guó)兒童交通安全藍(lán)皮書
2018》調(diào)查顯示,在
2017
年開展的兒童道路交通安全調(diào)研收集的
4218
份有效問(wèn)卷中,每三個(gè)家庭中就有一個(gè)家庭未配備并正確使用兒童安全座椅。
目前,美國(guó)、日本、英國(guó)、瑞典、加拿大、新西蘭等超過(guò)
50
個(gè)國(guó)家和地區(qū)已經(jīng)出臺(tái)了兒童乘車的相關(guān)法規(guī),強(qiáng)制規(guī)定兒童乘車必需使用汽車安全座椅,同時(shí)也有相應(yīng)的法規(guī)及生產(chǎn)和檢測(cè)標(biāo)準(zhǔn)。國(guó)內(nèi),上海、杭州、南京、武漢、大連、濟(jì)南等也對(duì)兒童乘車有了硬性規(guī)定。(搜狐汽車2018-07-12)假設(shè)此次調(diào)查分別在上海和武漢分別抽取了
800
個(gè)和
600
個(gè)家庭,上海家庭使用兒童安全座椅的比率為
26%,而武漢為
20%。試以
95%的置信水平估計(jì)兩地家庭使用兒童安全座椅比率差異的置信區(qū)間。解:已知
p1
=26%,
p2
=20%,
n1
=800,
n2
=600,
1
=95%,查表得:
=1.96兩地家庭使用兒童安全座椅差異的置信區(qū)間
95%
的置信區(qū)間為(1.586%,10.414%),由于置信區(qū)間中不包含
0,說(shuō)明兩地家庭使用兒童安全座椅的比率有顯著差異。9.3.4
兩個(gè)總體方差之比的區(qū)間估計(jì)
由第
8
章的公式(8-21)有:
整理得:
設(shè)置信水平為1
,則有:,
如圖
9-9
所示。圖9-9方差之比置信區(qū)間示意圖
/2
/2取倒數(shù)得:
,則有:(9-20)【例
9-10】從兩條自動(dòng)瓶裝生產(chǎn)線上抽樣兩個(gè)獨(dú)立樣本,以檢測(cè)其工作得穩(wěn)定性。樣本數(shù)據(jù)如下:樣本1=25,=9;樣本2=16,=3。以置信水平為95%估計(jì)兩條自動(dòng)瓶裝生產(chǎn)線方差之比得置信區(qū)間。由公式(9-18)有:
兩條自動(dòng)瓶裝生產(chǎn)線方差之比的
95%的置信區(qū)間為(1.1,7.3)。由于置信區(qū)間不包括
1,所以兩條自動(dòng)生產(chǎn)線的穩(wěn)定性有顯著差異,樣本方差小的生產(chǎn)線穩(wěn)定性高。解:已知=25,=9,=16,=3,1-α=95%。查表得:=2.70,則:
≈0.419.3.5
匹配樣本的區(qū)間估計(jì)關(guān)于兩個(gè)總體參數(shù)的對(duì)比,有時(shí)需要匹配樣本。例如,兩個(gè)地區(qū)由于收入、地價(jià)、房租不同,相同的商品的價(jià)格可能會(huì)有不同。如果要比較兩個(gè)地區(qū)的物價(jià),必須針對(duì)相同的商品來(lái)比較價(jià)格,這樣,應(yīng)該抽取匹配樣本。抽取匹配樣本時(shí),兩個(gè)樣本之間是關(guān)聯(lián)的,所以其抽樣分布略有不同。匹配樣本的數(shù)據(jù)如下:表9-1匹配樣本的數(shù)據(jù)結(jié)構(gòu)序號(hào)樣本
1
的數(shù)據(jù)
樣本
2
的數(shù)據(jù)
兩個(gè)樣本的差值d
X1
X
21X11X
21d12X12X
22d2……………………nX
1nX
2ndn可以證明當(dāng)d
服從正態(tài)分布時(shí),有以下結(jié)論:(9-21)其中
--
d
的均值
sd
--
d
的樣本方差則抽樣極限誤差為:則d
的(1
)的置信區(qū)間為:(,)(9-23)(9-22)【例
9-11】人們相信即便在同一城市由于區(qū)域不同,從而地價(jià)不同,中心城區(qū)的商品價(jià)格要高于郊區(qū)。為了證實(shí)這個(gè)推測(cè),調(diào)查人員分別在中心城區(qū)和郊區(qū)抽取了相同的商品,記錄下其價(jià)格(數(shù)據(jù)見Data9-3)。根據(jù)這些數(shù)據(jù)判斷中心城區(qū)和郊區(qū)的商品價(jià)格有無(wú)顯著差異(取
0.05)
。解:由數(shù)據(jù)資料得:n=49,
=1.17,
sd=1.5
查表得
由公式(9-21)得:
中心城區(qū)和郊區(qū)的商品價(jià)格置信水平為
95%的置信區(qū)間為(0.74,1.60)。9.4樣本容量的確定我們知道,大樣本要比小樣本有更好的統(tǒng)計(jì)學(xué)性質(zhì),在其他條件不變的情況下,隨著樣本容量的增大,估計(jì)的誤差(抽樣極限誤差)會(huì)減小。為了提高估計(jì)的準(zhǔn)確性,一個(gè)最簡(jiǎn)單的辦法就是增加樣本容量。但是,在實(shí)際操作中,樣本容量的增加會(huì)同時(shí)增加收集數(shù)據(jù)的成本,也可能會(huì)增加出現(xiàn)登記性誤差的可能性。于是,我們必需考慮這樣一個(gè)問(wèn)題:在給定的抽樣極限誤差和可靠程度的條件下,如何選擇一個(gè)合適的樣本容量。
9.4.1
估計(jì)總體均值時(shí)樣本容量的確定當(dāng)估計(jì)一個(gè)總體均值時(shí),由公式(9-1)、(9-2)知,樣本容量與抽樣極限誤差成反比,與總體方差(或樣本方差)成正比,與置信水平對(duì)應(yīng)的可靠性系數(shù)成正比。于是,在給定相關(guān)條件下,我們可以確定樣本容量。當(dāng)總體方差已知時(shí)有:(9-24)【例9-12】某超市想要估計(jì)每位顧客平均每次購(gòu)物花費(fèi)的金額。根據(jù)過(guò)去的經(jīng)驗(yàn),標(biāo)準(zhǔn)差大約為150元,現(xiàn)要求以95%的置信水平估計(jì)每位顧客購(gòu)物金額的置信區(qū)間,并要求允許誤差不超過(guò)50元,應(yīng)抽取多少個(gè)顧客作為樣本?解:已知=150,=95%,=50,查表得=1.96。
由公式(9-19)有:
應(yīng)至少抽35名顧客作為樣本。9.4.2
估計(jì)總體比率時(shí)樣本容量的確定當(dāng)估計(jì)一個(gè)總體比率時(shí),由公式(9-3)得:
(9-25)
當(dāng)
未知時(shí),可以取
0.5
。【例
9-13】受一家電器制造商的委托,某市場(chǎng)調(diào)查公司要對(duì)某地區(qū)微波爐的家庭擁有率進(jìn)行估計(jì)。如果希望估計(jì)誤差不超過(guò)
5%。假設(shè)置信水平取
95%,應(yīng)取多大容量的樣本?解:已知
1-α=95%,=5%,查表得:=1.96
因Π未知,故取Π=0.5。
由公式(9-20)有:應(yīng)至少抽取385戶家庭作為樣本。【本章小結(jié)】
參數(shù)估計(jì)是推斷統(tǒng)計(jì)的重要內(nèi)容,區(qū)間估計(jì)是其中基本的方法。
參數(shù)估計(jì)的理論依據(jù)是大數(shù)定律和中心極限定理,我們可以在一定的置信水平保證下構(gòu)造參數(shù)的置信區(qū)間。
總體均值的置信區(qū)間的構(gòu)造方法是:當(dāng)總體方差已知、大樣本時(shí),可以用正態(tài)分布構(gòu)造置信區(qū)間;當(dāng)總體方差未知,大樣本時(shí),則要用
t
分布構(gòu)造置信區(qū)間。當(dāng)樣本是小樣本時(shí),則要求總體總體服從正態(tài)分布,在總體方差已知和總體方差未的條件,與大樣本一樣構(gòu)造置信區(qū)間??傮w比率的置信區(qū)間的構(gòu)造方法是:當(dāng)滿足大樣本條件時(shí),用正態(tài)分布構(gòu)造置信區(qū)間。總體方差的置信區(qū)間的構(gòu)造方法是:用卡方分布構(gòu)造置信區(qū)間。我們還可以構(gòu)造兩個(gè)總體參數(shù)差或比的置信區(qū)間。
置信區(qū)間的寬窄與風(fēng)險(xiǎn)水平或置信水平有關(guān),我們可以在風(fēng)險(xiǎn)水平和誤差程度之間選擇一個(gè)平衡點(diǎn)。
在實(shí)際運(yùn)用中,可以在一定的可靠程度和允許誤差的條件下,確定合適的樣本容量?!緦W(xué)習(xí)建議】參數(shù)估計(jì)是推斷統(tǒng)計(jì)的重要內(nèi)容,而其中最基本的內(nèi)容是區(qū)間估計(jì)。在學(xué)習(xí)這部分內(nèi)容時(shí),一是要理解進(jìn)行區(qū)間估計(jì)的理論基礎(chǔ)是大數(shù)定律和中心極限定理,掌握區(qū)間估計(jì)的基本原理;二是要理解置信水平和抽樣極限誤差的概念以及相互關(guān)系;三是要正確判斷樣本統(tǒng)計(jì)量的抽樣分布,特別是估計(jì)總體均值時(shí)什么條件下用正態(tài)分布,什么條件下用
t
分布;四是會(huì)正確確定樣本容量。本章重點(diǎn)區(qū)間估計(jì)的原理和方法;理解抽樣極限誤差的概念和意義;樣本容量的確定。本章難點(diǎn)區(qū)間估計(jì)的原理和方法;正確判斷樣本統(tǒng)計(jì)量的抽樣分布?!竞诵母拍睢奎c(diǎn)估計(jì)
區(qū)間估計(jì)
大數(shù)定律
中心極限定理
置信水平
標(biāo)準(zhǔn)誤差
抽樣極限誤差
置信區(qū)間第
10
章
假設(shè)檢驗(yàn)【學(xué)習(xí)目標(biāo)】建立解假設(shè)檢驗(yàn)的基本概念,掌握假設(shè)檢驗(yàn)的基本原理;理解僅依靠樣本進(jìn)行決策的風(fēng)險(xiǎn);能運(yùn)用假設(shè)檢驗(yàn)解決各種實(shí)際問(wèn)題;掌握用
p值方法進(jìn)行假設(shè)檢驗(yàn)。10.1概述10.1.1假設(shè)檢驗(yàn)在經(jīng)濟(jì)管理活動(dòng)中,人們需要對(duì)各種各樣的現(xiàn)象進(jìn)行判斷,以期做出正確的決策。但是,人們所面對(duì)的是往往是隨機(jī)現(xiàn)象,并且所掌握和信息也是有限的,于是就產(chǎn)生了這樣一個(gè)問(wèn)題:怎樣利用較少的信息對(duì)總體現(xiàn)象進(jìn)行決策。下面我們通過(guò)一個(gè)例子來(lái)說(shuō)明這個(gè)問(wèn)題?!纠?/p>
10-1】全國(guó)政協(xié)委員馮丹龍建議:完善兒童用藥安全管理
3
月
3
日,全國(guó)政協(xié)委員、馮玉祥之孫女馮丹龍,在接受法制晚報(bào)·看法新聞?dòng)浾卟稍L時(shí)表示,今年她的建議是建立和完善兒童用藥法律法規(guī),同時(shí)加強(qiáng)對(duì)兒童藥品研發(fā)生產(chǎn)的監(jiān)管。馮丹龍認(rèn)為,兒童用藥,安全是重中之重。兒童作為一個(gè)特殊用藥群體,各器官發(fā)育未成熟,對(duì)藥品的用法用量有其特殊要求。目前,臨床上兒童用藥不當(dāng)方面均有不同程度的問(wèn)題,需要及時(shí)改進(jìn)和提高。
據(jù)《半月談》雜志報(bào)道,中國(guó)兒童用藥不良反應(yīng)發(fā)生率為
12.9%,其中新生兒高達(dá)
24.4%,分別是成人的
2
倍和
4
倍。中國(guó)醫(yī)藥工業(yè)信息中心的數(shù)據(jù)顯示,全國(guó)藥品生產(chǎn)企業(yè)有
8000多家,其中專門生產(chǎn)兒童用藥的企業(yè)僅占
0.1%。在藥品臨床實(shí)驗(yàn)注冊(cè)項(xiàng)目中,國(guó)產(chǎn)藥品注冊(cè)信息達(dá)到
16
萬(wàn)多條,其中兒童藥品僅有2000
多條。
目前,兒童給藥劑量多依據(jù)成人劑量,再通過(guò)體重?fù)Q算、體表面積換算、年齡換算等方法來(lái)確定?!皟和^非成人的‘微縮版’,具有其本身的生理特點(diǎn)。將成人藥酌減給兒童使用,缺乏科學(xué)依據(jù)和循證醫(yī)學(xué)證據(jù)?!焙幽鲜∪嗣襻t(yī)院兒科主任高麗表示。(北青網(wǎng)
2018-03-03)
生產(chǎn)兒童藥物劑量控制非常重要,劑量少了達(dá)不到治療效果,劑量大了可能出現(xiàn)不良反應(yīng)。在生產(chǎn)過(guò)程中,我們?cè)鯓优袛鄡和幬锏膭┝渴欠窈细衲兀匡@然,不可能將全部的藥物都進(jìn)行檢測(cè),我們能做的只是檢測(cè)其中的一小部分。
假設(shè)一條生產(chǎn)兒童注射液的自動(dòng)生產(chǎn)線的標(biāo)準(zhǔn)劑量是每支
12ml,由于各種偶然因素的影響,生產(chǎn)過(guò)程中罐裝劑量可能會(huì)產(chǎn)生偏差,假設(shè)允許偏差為
0.5ml。如果某一天,質(zhì)檢檢測(cè)了
36
支,得到平均值為
12.3ml,這時(shí)生產(chǎn)線工作正常嗎?解:這個(gè)問(wèn)題可以歸納為一個(gè)統(tǒng)計(jì)問(wèn)題:
生產(chǎn)線生產(chǎn)正常時(shí)標(biāo)準(zhǔn)劑量為
12ml,即總體均值
12
;允許的偏差為
0.5ml,即總體的標(biāo)準(zhǔn)差
0.5
;抽取樣本容量為
36
的樣本,得到
。這時(shí),我們能否依據(jù)這個(gè)樣本信息判斷
12
還成立嗎?
這個(gè)問(wèn)題我們有兩個(gè)選擇:
12(生產(chǎn)線工作正常)和
12(生產(chǎn)線工作不正常),在總體標(biāo)準(zhǔn)差
0.5
的條件下,抽取樣本容量為36
的樣本,已知的樣本信息是
。我們希望利用這個(gè)樣本信息來(lái)對(duì)上述兩個(gè)選擇做出決策。樣本均值是統(tǒng)計(jì)量,是隨機(jī)變量,而總體均值是參數(shù),是確定的值,我們的目的是利用統(tǒng)計(jì)量來(lái)對(duì)參數(shù)的取值做出判斷。一般地,利用樣本統(tǒng)計(jì)量對(duì)總體參數(shù)的取值做出決策的統(tǒng)計(jì)方法,稱為假設(shè)檢驗(yàn)。10.1.2.假設(shè)檢驗(yàn)的方法
一般來(lái)說(shuō),假設(shè)檢驗(yàn)可以分成四個(gè)步驟:1)建立假設(shè);2)確定檢驗(yàn)統(tǒng)計(jì)量以及分布;3)設(shè)定顯著性水平,確定臨界值和拒絕域;4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,做出決策。每個(gè)步驟的變化都會(huì)產(chǎn)生不同的假設(shè)檢驗(yàn),我們分步驟具體解釋假設(shè)檢驗(yàn)的基本概念和方法。1.假設(shè)
所謂假設(shè)就是某些對(duì)客觀事物特征的初始判斷或者說(shuō)斷言;用統(tǒng)計(jì)語(yǔ)言表達(dá)就是對(duì)總體參數(shù)的取值所作的斷言。由于這些斷言成立的理由并不充分,所以有對(duì)這些斷言進(jìn)行檢驗(yàn)的要求。
例如,在例
10-1
中,我們需要經(jīng)常監(jiān)測(cè)生產(chǎn)線的工作狀態(tài)。雖然有嚴(yán)格的標(biāo)準(zhǔn)和先進(jìn)的生產(chǎn)線,但由于生產(chǎn)過(guò)程會(huì)受到各樣偶然因素的影響,罐裝劑量可能會(huì)偏離標(biāo)準(zhǔn)劑量。在這里
12(生產(chǎn)線工作正常)就是一個(gè)假設(shè)(斷言),但是這個(gè)假設(shè)不一定成立,即可能出現(xiàn)另外一種情況:
12
(生產(chǎn)線工作不正常),如果是這種情況則需要對(duì)生產(chǎn)線的生產(chǎn)狀態(tài)進(jìn)行檢修。假設(shè)包括原假設(shè)和備擇假設(shè)。原假設(shè)記為H
0
,是研究者懷疑的、反對(duì)的,而且是要被檢驗(yàn)的假設(shè)。在例
10-1
中,H
0
:
12
就是原假設(shè),質(zhì)檢人員(研究者)之所以進(jìn)行檢測(cè),就是懷疑生產(chǎn)線工作不正常,檢測(cè)的目的就是在判斷
12
是否成立。備擇假設(shè)記為
H1
,是研究者支持的假設(shè)。在例
10-1
中,H1
:
12
就是備擇假設(shè),是質(zhì)檢人員(研究者)之所以進(jìn)行檢測(cè),就是支持
12
。原假設(shè)和備擇假設(shè)構(gòu)成完備事件組,非此既彼,不存在第三種情況。假設(shè)檢驗(yàn)的目的就是搜集證據(jù)反對(duì)(檢驗(yàn))原假設(shè),如果沒(méi)有足夠的證據(jù)拒絕原假設(shè),則只能選擇其反面—不拒絕原假設(shè)。
為了進(jìn)行假設(shè)檢驗(yàn),首要步驟就是建立假設(shè)。一般情況下先建立備擇假設(shè),這是因?yàn)閭鋼窦僭O(shè)是研究者支持的假設(shè),一般觀點(diǎn)明確,容易表達(dá)。當(dāng)備擇假設(shè)確定后,其對(duì)立事件就是原假設(shè)。【例
10-2】某果汁飲料包裝容量為
500ml/盒,灌裝過(guò)多或過(guò)少都會(huì)被認(rèn)為包裝的容量不合格。質(zhì)檢人員需要定期抽樣檢測(cè)容量,判斷灌裝生產(chǎn)線生產(chǎn)是否正常,試建立對(duì)應(yīng)的假設(shè)。解:這個(gè)問(wèn)題中質(zhì)檢人員是研究者,他支持的觀點(diǎn)是生產(chǎn)線生產(chǎn)不正常,否則他就不需要進(jìn)行檢測(cè)了。由于灌裝過(guò)多或過(guò)少都會(huì)被認(rèn)為不正常,故備擇假設(shè)為:H1
:
500,從而原假設(shè)為:H
0
:
500
。【例
10-3】某品牌汽車輪胎的生產(chǎn)商聲稱其生產(chǎn)的輪胎行駛里程不少于
80000km。
為了驗(yàn)證這個(gè)說(shuō)法,某汽車俱樂(lè)部對(duì)該品牌輪胎的行駛里程進(jìn)行抽樣調(diào)查,試建立對(duì)應(yīng)的假設(shè)。解:這個(gè)問(wèn)題中汽車俱樂(lè)部是研究者,他支持的觀點(diǎn)是該品牌輪胎的行駛里程達(dá)不到
80000km,否則他就不會(huì)進(jìn)行抽樣調(diào)查。由于他支持的觀點(diǎn)是該品牌輪胎的行駛里程達(dá)不到
80000km,故備擇假設(shè)為:
H1
:
80000
,從而原假設(shè)為:
H
0
:
80000
。
由上述兩個(gè)例子可以看出建立假設(shè)的一些特點(diǎn):1)假設(shè)有不同的方向性。在例
10-2
中,樣本統(tǒng)計(jì)量的值比
500
過(guò)大或過(guò)?。p側(cè)),都有一定的理由拒絕H
0
:
500
,這樣的檢驗(yàn)稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn);在例
10-3
中,樣本統(tǒng)計(jì)量的值只有比
80000過(guò)?。▎蝹?cè))才有一定理由拒絕H
0
:
80000
,這樣的檢驗(yàn)稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)。表
10-1
總體均值假設(shè)檢驗(yàn)的基本形式
設(shè)
為總體均值,
0為假設(shè)的總體均值的取值,我們可以將假設(shè)的基本形式總結(jié)如表
10-1
所示的形式。假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)
備擇假設(shè)
假設(shè)的方向性與具體的問(wèn)題有關(guān),也與研究者的地位有關(guān),因?yàn)椴煌匚坏难芯空邥?huì)有不同的觀點(diǎn)。如在例
10-2中,如果研究者換成工商管理人員,他可能更關(guān)心的是果汁生產(chǎn)廠商是否對(duì)消費(fèi)者有欺詐行為,也就是H1
:
500
,這時(shí)就有H
0
:
500
,這是一個(gè)單側(cè)檢驗(yàn)中的左側(cè)檢驗(yàn)。2)假設(shè)中所有的等號(hào)“=”設(shè)置在原假設(shè)中。包括“=”、“≤”、“≥”都設(shè)置在原假設(shè)中,這是因?yàn)榧僭O(shè)檢驗(yàn)是目的是檢驗(yàn)原假設(shè),而且在邏輯方法是反證法—先假設(shè)原假設(shè)為真,再試圖導(dǎo)出矛盾的結(jié)果,這樣就要求原假設(shè)要“明確”地包含所有要檢驗(yàn)的情況。3)上述例子中只涉及到總體均值的假設(shè),類似的可以建立總體比率、總體方差的假設(shè),同樣有雙側(cè)和單側(cè)檢驗(yàn)。2.檢驗(yàn)統(tǒng)計(jì)量
對(duì)不同的總體參數(shù)進(jìn)行檢驗(yàn),需要用到不同的樣本統(tǒng)計(jì)量。如對(duì)總體均值進(jìn)行檢驗(yàn),需要用到樣本均值;對(duì)總體比率進(jìn)行檢驗(yàn),需要用到樣本比率;對(duì)總體方差進(jìn)行檢驗(yàn),需要用到樣本方差等等。但是,樣本統(tǒng)計(jì)量并不能很好地幫助我們做出判斷,進(jìn)行參數(shù)的假設(shè)檢驗(yàn)需要構(gòu)造檢驗(yàn)統(tǒng)計(jì)量。
我們以例
10-1
來(lái)說(shuō)明。生產(chǎn)線生產(chǎn)正常時(shí)標(biāo)準(zhǔn)劑量為12ml,即總體均值
12
;允許的偏差為0.5ml,即總體的標(biāo)準(zhǔn)差
0.5
;抽取樣本容量為36
的樣本,得到
。這時(shí),我們能否依據(jù)這個(gè)樣本信息判斷
12
還成立嗎?
這個(gè)問(wèn)題要對(duì)下列假設(shè)進(jìn)行檢驗(yàn):
H
0
:
12
,
H1
:
12
。
顯然,樣本統(tǒng)計(jì)量
偏離總體均值
越遠(yuǎn),我們拒絕原假設(shè)的理由就越充分?,F(xiàn)在我們得到的樣本統(tǒng)計(jì)量
,這個(gè)值偏離
12
足夠遠(yuǎn)嗎?雖然絕對(duì)差異只有
0.3,但是這是
36
支的平均差異,因?yàn)檎`差有正有負(fù),可以互相抵消,0.3
可能是一個(gè)很大的差異。為此,我們要構(gòu)造檢驗(yàn)統(tǒng)計(jì)量進(jìn)行判斷。
我們先假定原假設(shè)為真,即
12
。由于樣本容量為
36(大樣本),
0.5
(總體方差已知),由中心極限定理得:(10-1)
由于
服從正態(tài)分布,在
12
為真的假定條件下,的取值偏離
12
足夠遠(yuǎn)的概率是非常小的,所以我們可以用概率來(lái)表示
偏離
12
的程度。設(shè)
的取值偏離
12
足夠遠(yuǎn)的概率為
,在雙側(cè)檢驗(yàn)中
相對(duì)于
12
的偏離可以是正偏離,也可以負(fù)偏離,所以
被平分在兩側(cè),單側(cè)面積為
,如圖
10-1
所示。于是我們就可以有一個(gè)直觀的判斷:如果
的值落入圖
10-1
中的陰影部分區(qū)域,
的值就偏離
12
足夠遠(yuǎn),就有足夠的理由拒絕原假設(shè)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年廣西交通職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考題庫(kù)含詳細(xì)答案解析
- 2026年濰坊護(hù)理職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考試題含詳細(xì)答案解析
- 2026年蘭州科技職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試模擬試題及答案詳細(xì)解析
- 2026四川內(nèi)江市市中區(qū)龍門鎮(zhèn)中心敬老院招聘聘用人員1人考試參考試題及答案解析
- 2026年哈爾濱北方航空職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)筆試參考題庫(kù)含詳細(xì)答案解析
- 2026年濰坊工程職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考題庫(kù)含詳細(xì)答案解析
- 2026年黔南民族幼兒師范高等??茖W(xué)校高職單招職業(yè)適應(yīng)性測(cè)試備考試題及答案詳細(xì)解析
- 2026年集美大學(xué)誠(chéng)毅學(xué)院?jiǎn)握芯C合素質(zhì)筆試模擬試題含詳細(xì)答案解析
- 2026年珠海城市職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試參考題庫(kù)含詳細(xì)答案解析
- 2026年吉林科技職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試模擬試題含詳細(xì)答案解析
- DB34T 1948-2013 建設(shè)工程造價(jià)咨詢檔案立卷標(biāo)準(zhǔn)
- 2024中藥藥渣處理協(xié)議
- 心源性暈厥的查房
- 機(jī)械氣道廓清技術(shù)臨床應(yīng)用專家共識(shí)(2023版)解讀
- 壓力性損傷風(fēng)險(xiǎn)評(píng)估與管理護(hù)理課件
- 市域治理現(xiàn)代化的培訓(xùn)課件
- 專家解析:渲染,烘托等的區(qū)別課件
- 廣州花城匯UUPARK招商手冊(cè)
- 20S517 排水管道出水口
- (完整word)長(zhǎng)沙胡博士工作室公益發(fā)布新加坡SM2考試物理全真模擬試卷(附答案解析)
- GB/T 6682-2008分析實(shí)驗(yàn)室用水規(guī)格和試驗(yàn)方法
評(píng)論
0/150
提交評(píng)論