《統(tǒng)計(jì)學(xué)》課件（下）

上傳人：青*** IP屬地：福建上傳時(shí)間：2025-09-26 格式：PPTX 頁(yè)數(shù)：510 大?。?.05MB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩505頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第

章

參數(shù)估計(jì)【學(xué)習(xí)目標(biāo)】理解參數(shù)估計(jì)的基本問(wèn)題，理解置信水平、置信區(qū)間、抽樣極限誤差等概念；理解參數(shù)估計(jì)的基本原理；掌握參數(shù)區(qū)間估計(jì)的方法；掌握確定樣本容量的基本方法。9.1概述9.1.1參數(shù)估計(jì)的一般問(wèn)題1.參數(shù)估計(jì)的概念高德地圖發(fā)布《2018

年度中國(guó)主要城市交通分析報(bào)告》央廣網(wǎng)2019-01-16近日，高德地圖聯(lián)合中國(guó)社會(huì)科學(xué)院社會(huì)學(xué)研究所、未來(lái)交通與城市計(jì)算聯(lián)合實(shí)驗(yàn)室、阿里云等單位共同發(fā)布了《2018

年度中國(guó)主要城市交通分析報(bào)告》(以下簡(jiǎn)稱“《報(bào)告》”)。

《報(bào)告》顯示，基于路網(wǎng)行程延時(shí)指數(shù)對(duì)監(jiān)測(cè)的

個(gè)城市進(jìn)行對(duì)比分析，發(fā)現(xiàn)

2018

年是四年來(lái)路網(wǎng)高峰行程延時(shí)指數(shù)最低的一年,同比

2017

年全國(guó)近

90%城市擁堵下降或持平。而通過(guò)該指數(shù)排名的中國(guó)堵城排行榜中，北京位列第一，廣州位列第二，上海位列第八。但即便位列第八的上海，其工作日平均通勤時(shí)長(zhǎng)(雙程)也達(dá)

85.27分鐘，也就是說(shuō)，假如一個(gè)上海人要上35

年班，他一生花在通勤上的時(shí)間為

11869

小時(shí)，這其中有

5443

小時(shí)是因?yàn)閾矶聦?dǎo)致的。

值得注意的是，北京本年度雖然被評(píng)為“首堵”，但北京的全天公交巡航速度(公交車輛在站點(diǎn)之間巡航速度的平均值)最高，達(dá)到

23.14km/h。其余高的城市還有紹興、東莞、蘇州、濟(jì)南、廈門、揚(yáng)州、石家莊、上海等。而全天公交巡航速度較低的城市包括太原、烏魯木齊、沈陽(yáng)等，其中太原僅為13.98km/h。高德地圖雖然掌握著眾多數(shù)據(jù)，但它并不能知道北京的每一臺(tái)公交車的巡航速度，《報(bào)告》中所說(shuō)的北京公交的巡航速度為23.14km/h

只是部分北京公交的巡航速度，這是一個(gè)樣本結(jié)果，而不是總體的結(jié)果。在實(shí)際活動(dòng)中，人們總是用樣本的數(shù)量特征去估計(jì)總體的數(shù)量特征，這種方法就是參數(shù)估計(jì)。所謂參數(shù)估計(jì)就是用樣本的數(shù)量特征（統(tǒng)計(jì)量）對(duì)總體的數(shù)量特征（參數(shù)）進(jìn)行估計(jì)的統(tǒng)計(jì)方法。在現(xiàn)實(shí)現(xiàn)象中，參數(shù)往往是未知的，比如北京公交的巡航速度。我們可以用抽樣的方法，用樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行估計(jì)。常用的參數(shù)有總體均值

、總體比率

、總體方差

，我們將參數(shù)抽象地記為

。2.估計(jì)量與估計(jì)值

用來(lái)估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱，稱為估計(jì)量。例如：樣本平均數(shù)

X、樣本比率

、樣本方差

都是估計(jì)量，我們將估計(jì)量抽象地記為

。由樣本數(shù)據(jù)計(jì)算得到的對(duì)應(yīng)估計(jì)量的數(shù)值稱為估計(jì)值。例如：為了估計(jì)北京公交的巡航速度，我們抽取由

100

輛運(yùn)營(yíng)的北京公交車作為樣本，記錄它們?nèi)斓难埠剿俣?，然后?jì)算平均值為

23.14km/h,這個(gè)數(shù)值就是一個(gè)估計(jì)值。3.點(diǎn)估計(jì)與區(qū)間估計(jì)

參數(shù)估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。

用估計(jì)量

的值作為參數(shù)

的估計(jì)值，稱為參數(shù)的點(diǎn)估計(jì)。例如：經(jīng)過(guò)抽樣并計(jì)算出北京公交的巡航速度為

23.14km/h，即

＝23.14。如果我們用這個(gè)估計(jì)值作為總體均值，即

23.14

，這就是點(diǎn)估計(jì)。點(diǎn)估計(jì)在方法上比較簡(jiǎn)便，在理論上也有可靠的依據(jù)，但是卻不能表述出點(diǎn)估計(jì)值與參數(shù)的真實(shí)值接近的程度（估計(jì)的誤差）以及對(duì)應(yīng)估計(jì)的可靠程度（概率度）。

在點(diǎn)估計(jì)的基礎(chǔ)上，給出參數(shù)估計(jì)的一個(gè)范圍，稱為區(qū)間估計(jì)。例如：北京公交的巡航速度的點(diǎn)估計(jì)值為

23.14km/h，即

＝23.14，可以認(rèn)為北京公交的巡航速度在

23.14

左右，我們?cè)谝欢煽砍潭鹊谋ＷC下給出一個(gè)范圍。區(qū)間估計(jì)是參數(shù)估計(jì)的重要方法，在后面的內(nèi)容里我們將做詳細(xì)的討論。9.1.2

參數(shù)估計(jì)的理論依據(jù)和基本問(wèn)題1.大數(shù)定律在第

章中我們對(duì)大數(shù)定律做了描述，它為我們進(jìn)行參數(shù)估計(jì)提供了理論基礎(chǔ)。例如：設(shè)北京公交巡航速度的平均用時(shí)為

，是一個(gè)未知的參數(shù)，我們對(duì)這一現(xiàn)象進(jìn)行多次觀察―即抽樣（抽取

100輛運(yùn)營(yíng)公交車）并測(cè)量樣本中的每一輛公交車的巡航速度，記為X

,......X

。由大數(shù)定律，當(dāng)

（

樣本容量）足夠大時(shí)，有這個(gè)結(jié)論為我們用樣本平均數(shù)

對(duì)總體均值

進(jìn)行估計(jì)提供了理論基礎(chǔ)。同理，我們可以用樣本比率

對(duì)總體比率

進(jìn)行估計(jì)，用樣本方差

對(duì)總體方差

進(jìn)行估計(jì)。2.中心極限定理

以樣本平均數(shù)為例，在重復(fù)抽樣、大樣本、總體方差已知的條件下，我們有：

，其分布圖如圖9-1。由概率論知識(shí)，樣本平均數(shù)

落在總體均值μ的兩側(cè)各為一個(gè)標(biāo)準(zhǔn)誤差（抽樣平均誤差）范圍內(nèi)概率為0.9545；落在三個(gè)標(biāo)準(zhǔn)誤差范圍內(nèi)的概率為0.9973。

圖

9-1的抽樣分布X

的分布

由圖

9-1

可以看出，如果我們要求樣本平均數(shù)

離

越近（估計(jì)的誤差?。?，對(duì)應(yīng)的可能性也就是概率越小，即可靠程度越低；要求樣本平均數(shù)

離

越遠(yuǎn)（估計(jì)的誤差大），對(duì)應(yīng)的可能性也就是概率也越大，即可靠程度越高。這說(shuō)明，估計(jì)的誤差會(huì)受到兩個(gè)因素的影響：一是抽樣平均誤差（標(biāo)準(zhǔn)誤差）；另一個(gè)是我們要求的可靠程度。這些結(jié)論為我們描述估計(jì)的誤差提供了依據(jù)。3.風(fēng)險(xiǎn)水平與置信水平

由上段的分析，可以理解估計(jì)的誤差與可靠程度的關(guān)系。仍以樣本平均數(shù)

為例，設(shè)在估計(jì)時(shí)發(fā)生錯(cuò)誤的概率為

，因?yàn)槲覀兿Ｍ稿e(cuò)誤的可能性要盡量地小，所以我們?cè)O(shè)定的

很小，一般為5%或更小。

稱為風(fēng)險(xiǎn)水平，其意義是指這樣的事件發(fā)生的概率：“遠(yuǎn)離”了

，或者說(shuō)

與

的差距超過(guò)了允許的范圍，即

落入到了如圖

9-2

所示陰影的范圍內(nèi)。由于

的抽樣分布是正態(tài)分布，所以

被平分在兩側(cè)。

B圖

9-2風(fēng)險(xiǎn)水平與置信水平的分布

區(qū)間（A，B）對(duì)應(yīng)的概率為1

，我們稱為置信水平。其意義是指我們相信在所有的

中，有（1

）的

與

的差距沒(méi)有超過(guò)允許的范圍。4.抽樣極限誤差

我們將在參數(shù)估計(jì)中研究者所允許的誤差稱為抽樣極限誤差，也稱為邊際誤差，記為

。如何度量

呢？仍然以

為例，從圖

9-2

可以看出，這個(gè)允許的范圍就是區(qū)間（A，B）的半徑，而這個(gè)半徑的長(zhǎng)短是由

的抽樣分布和風(fēng)險(xiǎn)水平

決定的。在

的抽樣分布確定的條件下，

的值越大，區(qū)間（A，B）就越窄，估計(jì)的誤差越??；

的值越小，區(qū)間（A，B）就越寬，估計(jì)的誤差越大。

雖然的抽樣分布是正態(tài)分布，但由于μ未知，故A、B兩點(diǎn)的坐標(biāo)

、也未知，也就無(wú)法求出抽樣極限誤差

。

為了度量，對(duì)做標(biāo)準(zhǔn)變換，則

，如圖9-3所示。圖

9-3

標(biāo)準(zhǔn)正態(tài)分布（9-1）

當(dāng)風(fēng)險(xiǎn)水平為

α?xí)r，則對(duì)應(yīng)的臨界值是，經(jīng)過(guò)標(biāo)準(zhǔn)變換，原來(lái)正態(tài)分布的μ點(diǎn)坐標(biāo)變換到標(biāo)準(zhǔn)正態(tài)分布的0，原來(lái)正態(tài)分布的B點(diǎn)坐標(biāo)（）變換到標(biāo)準(zhǔn)正態(tài)分布的，這時(shí)有則有：

當(dāng)總體方差未知時(shí)，則用s

代替

，這時(shí)

，同樣有抽樣極限誤差為：

（9-2）同理，可以得到關(guān)于樣本比率

的抽樣極限誤差：(9-3)當(dāng)

未知時(shí)可用

代替。5.參數(shù)估計(jì)的標(biāo)準(zhǔn)1）無(wú)偏性

如果估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)，即E()=，則稱這個(gè)估計(jì)量是無(wú)偏的，其意義如圖

9-4a

所示。2）有效性

如果一個(gè)參數(shù)有兩個(gè)估計(jì)量，則其中方差較小的估計(jì)量是有效的，即如果

，則

是較

有效的估計(jì)量，其意義是計(jì)量

較估計(jì)量

更密集地集中在

的附近，這樣隨機(jī)抽取一個(gè),就要比隨機(jī)抽取一個(gè)離近的可能性要大。如圖9-4b所示。a)無(wú)偏性b)有效性3）一致性如果隨著樣本容量的增大，估計(jì)量與參數(shù)之間的差距變小，則稱這個(gè)估計(jì)量是一致的。其意義是隨著樣本容量的增大，抽樣分布的方差會(huì)變小，其意義如圖9-5

所示。圖

9-5 一致性可以證明，樣本平均數(shù)

、樣本比率

、樣本方差

分別是總體均值

、總體比率

、總體方差

的無(wú)偏、有效、一致的估計(jì)量。9.2一個(gè)總體參數(shù)的區(qū)間估計(jì)我們進(jìn)行抽樣的目的之一就是要用統(tǒng)計(jì)量對(duì)參數(shù)進(jìn)行估計(jì)。在實(shí)際的社會(huì)經(jīng)濟(jì)現(xiàn)象中，總體參數(shù)一般都是未知的，是需要我們進(jìn)行估計(jì)的，而估計(jì)量是可以通過(guò)計(jì)算某個(gè)樣本數(shù)據(jù)得到估計(jì)值的。仍然以樣本平均數(shù)

為例，由上節(jié)的分析，我們可以知道

落在以

為中心的一定范圍內(nèi)的概率是多少，由于

與

的距離是對(duì)稱的,所以

也以相同的概率被包含在以

為中心的區(qū)間內(nèi)，利用這個(gè)原理，可以對(duì)

進(jìn)行區(qū)間估計(jì)。9.2.1

總體均值的區(qū)間估計(jì)1.大樣本情形1）總體方差已知

由中心極限定理,當(dāng)總體方差已知、大樣本時(shí),有

。假設(shè)風(fēng)險(xiǎn)水平為α，則置信水平為1-α，由某個(gè)樣本得到的估計(jì)值為，如圖9-6所示。圖

9-6

的區(qū)間估計(jì)

其中區(qū)間（C，D）是由（A，B）平移得到的，AB的中點(diǎn)是

，CD

的中點(diǎn)是

。如果

落在區(qū)間（A，B）中（概率為1

），則區(qū)間（C，D）也將包含

，概率也為1

。所以，區(qū)間（C，D）稱為

的置信水平為1

的置信區(qū)間，C

點(diǎn)稱為置信區(qū)間的下限，D

點(diǎn)稱為置信區(qū)間的上限。由公式（9-1），C點(diǎn)的橫坐標(biāo)是，D點(diǎn)的橫坐標(biāo)是

，所以μ的1-α的置信區(qū)間是：（

，

）

（9-4）

由以上分析顯然有：

對(duì)μ的置信區(qū)間的理解要注意以下幾個(gè)問(wèn)題：一是區(qū)間（C,D）是由某一個(gè)樣本平均數(shù)確定的，而是隨機(jī)的，所以區(qū)間（C,D）也是隨機(jī)的，我們得到的這個(gè)區(qū)間是用這種方法構(gòu)造的成千上萬(wàn)個(gè)這樣的區(qū)間中特定的一個(gè)。二是對(duì)置信水平的理解。假設(shè)風(fēng)險(xiǎn)水平α=5%，則置信水平1-α=95%，其含義是：假如按照構(gòu)造置信區(qū)間的方法構(gòu)造的這樣的區(qū)間有10000個(gè)，則其中有95%即9500個(gè)區(qū)間包含總體均值μ的真值，我們有95%把握相信，由某一個(gè)樣本平均數(shù)構(gòu)造的區(qū)間是包含總體均值μ的真值的9500個(gè)區(qū)間中的一個(gè)。

這些解釋可以用圖9-7來(lái)描述。圖

9-7

參數(shù)的區(qū)間估計(jì)

【例

9-1】北青網(wǎng)

2018-04-17

大學(xué)生對(duì)手機(jī)形成依賴，日均使用時(shí)間超過(guò)

5.2

小時(shí)，手機(jī)已經(jīng)是我們生活中難以缺少的一部分了，可以毫不夸張的說(shuō)，有些人離開了手機(jī)啥也干不了！就像對(duì)手機(jī)有癮一樣，的確手機(jī)對(duì)我們來(lái)說(shuō)也是越來(lái)越重要了，平常的買東西都需要手機(jī)，就連小編都好久沒(méi)有觸摸現(xiàn)金了！大學(xué)生用起手機(jī)來(lái)更加恐怖，日均使用

5.2

個(gè)小時(shí)。麥可思研究院發(fā)布的一份中國(guó)在校大學(xué)生手機(jī)使用調(diào)查報(bào)告顯示，超八成大學(xué)生存在“手機(jī)依賴”，日均使用手機(jī)的時(shí)間超

小時(shí)，18

點(diǎn)以后是大學(xué)生使用手機(jī)的高峰期。此外，79%的大學(xué)生在課堂上使用手機(jī)。假設(shè)麥可思研究院在各地區(qū)抽取了

100

名在校大學(xué)生，記錄下他們?cè)谀骋还ぷ魅帐褂檬謾C(jī)的時(shí)間，并計(jì)算得到平均值為

小時(shí)。如果總體標(biāo)準(zhǔn)差為

1.5

小時(shí)，置信水平為

95%。（1）在校大學(xué)平均使用手機(jī)時(shí)間的點(diǎn)估計(jì)值是多少？（2）計(jì)算抽樣極限誤差；（3）對(duì)在校大學(xué)平均使用手機(jī)的時(shí)間做區(qū)間估計(jì)。解：已知：n=100，=5，α=5%，1-α=95%，查表得（1）在校大學(xué)生平均使用手機(jī)時(shí)間的點(diǎn)估計(jì)值為5個(gè)小時(shí)。（2）由式（9-1）得(3) 由式（9-4）得：

在校大學(xué)生平均使用手機(jī)時(shí)間95%的置信區(qū)間為（4.706，5.294）.2）總體方差未知

當(dāng)總體方差未知時(shí)，則

服從自由度為

n-1

的

分布，置信水平為1-α的置信區(qū)間為：（，）（9-6）

同理有：（9-7）

【例

9-2】2018-08-14

新浪科技

2018

年全球網(wǎng)速排名：中國(guó)大陸排名第

141

北京時(shí)間

月

日下午消息，M-Lab

近期發(fā)布了全球?qū)拵ЬW(wǎng)速排名榜。榜單收集了從

2017

年

月到

2018

年

月

日

個(gè)月時(shí)間內(nèi)的網(wǎng)速數(shù)據(jù)，共有

200

個(gè)國(guó)家和地區(qū)上榜，測(cè)速次數(shù)超過(guò)

1.63億次。排行榜顯示，全球?qū)拵俣扰旁诘谝晃坏氖切录悠?，平均下載速度達(dá)到了60.39Mbps,排在第二位的是瑞典，其寬帶平均下載速度為

46Mbps，這兩個(gè)國(guó)家的排名和去年一樣。排在第三至六位的分別是丹麥、挪威、羅馬尼亞以及比利時(shí)。數(shù)據(jù)顯示，中國(guó)大陸排在第141

位，

寬帶平均下載速度是2.38Mbps，雖然這一速度相對(duì)去年的

1.55Mbps

有所提升，但在今年的總排名中，中國(guó)大陸的排名還是下降了

位。此外，中國(guó)香港的網(wǎng)速全球排名

位，每秒是

26.45Mbit。中國(guó)臺(tái)灣的網(wǎng)速全球排名第

位，達(dá)到了

28.09Mbps，不過(guò)相比去年排名下降了

位。

M-Lab

是一家旨在測(cè)量全球網(wǎng)絡(luò)狀況的組織，由新美國(guó)基金會(huì)（New

America

Foundation）旗下的開放技術(shù)研究所（Open

Technology

Institute）、谷歌開源研究中心（Google

Open

SourceResearch）、普林斯頓大學(xué)的

PlanetLab

及其它支持機(jī)構(gòu)發(fā)起成立。假設(shè)在中國(guó)大陸不同地區(qū)抽取

49家網(wǎng)絡(luò)運(yùn)營(yíng)商進(jìn)行調(diào)查，測(cè)得互聯(lián)網(wǎng)連接速度數(shù)據(jù)（數(shù)據(jù)見

Data9-1）。根據(jù)這些數(shù)據(jù)，對(duì)中國(guó)大陸平均網(wǎng)速做點(diǎn)估計(jì)和

95%置信水平的區(qū)間估計(jì)。解：由Excel計(jì)算得=2.45，s=0.60，且n=49，1-α=95%。查表得=2.01。（1）中國(guó)大陸平均網(wǎng)速的點(diǎn)估計(jì)值為2.43Mbps。

（2）中國(guó)大陸平均網(wǎng)速的區(qū)間估計(jì)：由式（9-6）得：中國(guó)大陸平均網(wǎng)速95%的置信區(qū)間為（2.28，2.62）2.小樣本情形由于小樣本有更大的偶然性，在這種條件下則要求總體服從正態(tài)分布，以降低估計(jì)的風(fēng)險(xiǎn)。1）總體服從正態(tài)分布、方差已知在這個(gè)條件下，

的置信區(qū)間構(gòu)造方法同公式（9-4）。【例

9-3】某銀行為了估計(jì)一臺(tái)自動(dòng)取款機(jī)（ATM

機(jī)）的日平均取款額，連續(xù)抽取了

天該自動(dòng)取款機(jī)的取款額，計(jì)算得平均取款額為7.2

萬(wàn)元。假設(shè)總體服從正態(tài)分布，標(biāo)準(zhǔn)差為

萬(wàn)元，求該自動(dòng)取款機(jī)置信水平為

95%的日平均取款額置信區(qū)間。解：

已知 n

＝

25,

＝

7.2

，

＝

，

＝

95%

，查表得則由式（9-4）有：該自動(dòng)取款機(jī)置信水平為

95%的日平均取款額置信區(qū)間為（6.808，7.592）。2）總體服從正態(tài)分布、方差未知

在這個(gè)條件下，

的置信區(qū)間構(gòu)造方法同公式（9-6）。

【例

9-4】隨著社會(huì)的進(jìn)步和經(jīng)濟(jì)的發(fā)展，電已經(jīng)成為人們不可或缺的生產(chǎn)必須品。為了保障電力供應(yīng)，國(guó)家電網(wǎng)公司向社會(huì)公布了供電服務(wù)“十項(xiàng)承諾"，其中第二項(xiàng)承諾為：提供

小時(shí)電力故障報(bào)修服務(wù)，供電搶修人員到達(dá)現(xiàn)場(chǎng)的時(shí)間一般不超過(guò)：城區(qū)范圍45

分鐘；農(nóng)村地區(qū)

分鐘；特殊邊遠(yuǎn)地區(qū)

小時(shí)。

為了核實(shí)某市電網(wǎng)公司落實(shí)供電服務(wù)“十項(xiàng)承諾"的情況，在該市的電力故障報(bào)修服務(wù)記錄中抽取到

條城區(qū)范圍報(bào)修服務(wù)記錄作為樣本，統(tǒng)計(jì)出供電搶修人員到達(dá)現(xiàn)場(chǎng)的時(shí)間的數(shù)據(jù)（數(shù)據(jù)見Data9-2）。（1）該市供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間的點(diǎn)估計(jì)是多少？（2）假設(shè)總體服從正態(tài)分布，構(gòu)造該市供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間的

95%的置信區(qū)間。解：由樣本數(shù)據(jù)計(jì)算得：=30.44，s=4.93，n=25，1-α=95%，查表得（1）供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間的點(diǎn)估計(jì)值為30.44分鐘。供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間

95%的置信區(qū)間為（28.40，32.48）。（2）由公式（9-6）有：9.2.2

總體比率的區(qū)間估計(jì)

由中心極限定理，當(dāng)大樣本、重復(fù)抽樣時(shí)，樣本比率的抽樣分布是正態(tài)分布，其抽樣極限誤差如公式（9-3）所示。所以總體比率1

的置信區(qū)間是：()（9-8）當(dāng)

未知時(shí)可用

代替。大樣本的標(biāo)準(zhǔn)是使n

和n(1

)

同時(shí)成立時(shí)的n，或者按表8-5

的經(jīng)驗(yàn)值進(jìn)行判斷。

【例9-5】中國(guó)廣視索福瑞媒介研究(CSM)是央視市場(chǎng)研究(CTR)與

Kantar

Media

集團(tuán)等共同建立的中外合作企業(yè)，致力于專業(yè)的電視收視和廣播收聽市場(chǎng)研究，為中國(guó)大陸地區(qū)和香港傳媒行業(yè)提供可靠的、不間斷的視聽調(diào)查服務(wù)。CSM

擁有龐大的廣播電視受眾調(diào)查網(wǎng)絡(luò)，覆蓋

5.78

萬(wàn)余戶樣本家庭；其電視收視率調(diào)查網(wǎng)絡(luò)所提供的數(shù)據(jù)可推及中國(guó)內(nèi)地超過(guò)12.8億和香港地區(qū)

655

萬(wàn)的電視人口；其廣播收聽率調(diào)查的數(shù)據(jù)則可推及中國(guó)超過(guò)

1.2

億的廣播人口。

假設(shè)

CSM

為了推斷某一檔電視節(jié)目的收視率，在這檔電視節(jié)目播出期間，抽取了

1000

戶家庭進(jìn)行調(diào)查，得到收看這檔電視節(jié)目的家庭比率為

4%。依據(jù)這些數(shù)據(jù)求：(1)這檔電視節(jié)目平均收視率置信水平為

95%的抽樣極限誤差為多少？(2)這檔電視節(jié)目平均收視率置信水平為

95%的置信區(qū)間為多少？解：已知n=1000，p=4%,1-α=95%，查表得

，顯然，這是一個(gè)大樣本，故可以正態(tài)分布進(jìn)行估計(jì)。（1）抽樣極限誤差為：這檔電視節(jié)目平均收視率置信水平為

95%的置信區(qū)間為（2.8%，5.2%）。（2）由式（9-8）有：9.2.3

總體方差的區(qū)間估計(jì)

由第8

章的內(nèi)容知，樣本方差的抽樣分布服從卡方分布，由（8-15）式有：

。假設(shè)置信水平為1

，則如圖

9-8

所示：

2圖9-8卡方分布圖對(duì)總體方差做區(qū)間估計(jì)就是要使成立。整理得：

（9-9）

這就是構(gòu)造總體方差

的置信區(qū)間的方法?！纠?/p>

9-6】“愛情就像公交，苦苦等待卻怎么也等不到；愛情就像公交，有時(shí)候就差一點(diǎn)卻眼睜睜看著它遠(yuǎn)去；愛情就像公交，以為自己追上了卻發(fā)現(xiàn)怎么也擠不上?！边@是網(wǎng)上流行的一個(gè)段子，它從一個(gè)側(cè)面反映了人們對(duì)長(zhǎng)時(shí)間等待公交車的一種無(wú)奈。由于各種各樣的原因，雖然發(fā)車時(shí)間隔的時(shí)間相同，但是同一路公交車到達(dá)某一站的時(shí)間間隔會(huì)有比較大的差異。為了評(píng)估某城城市等待公交車的情況，選擇了其中一路公交車在某一時(shí)段時(shí)行調(diào)查，連續(xù)記錄了

輛公交車到達(dá)某站的時(shí)間間隔，經(jīng)計(jì)算時(shí)間間隔的方差為

分鐘，試以置信水平為

95%對(duì)總體方差做區(qū)間估計(jì)。

解：已知：n=25，s2＝16,1-α=95%，查表得：，

。則總體方差95%的置信區(qū)間為（9.76，30.96）。9.3兩個(gè)總體參數(shù)的區(qū)間估計(jì)很多時(shí)候我們需要在兩個(gè)總體之間進(jìn)行比較。例如：比較兩個(gè)地區(qū)的平均勞動(dòng)報(bào)酬，就需要在兩個(gè)地區(qū)分別抽取樣本，再用樣本的平均數(shù)做出估計(jì)。為此先要建立一個(gè)基本概念--獨(dú)立樣本與匹配樣本。9.3.1

獨(dú)立樣本與匹配樣本當(dāng)我們要在兩個(gè)總體參數(shù)之間進(jìn)行比較時(shí)，就要在兩個(gè)總體中分別抽取樣本，然后進(jìn)行比較。而在兩個(gè)總體中抽取樣本，可以有兩種抽取方法：一種是兩個(gè)樣本的抽取互相之間沒(méi)有影響，這時(shí)我們稱這樣抽取的兩個(gè)樣本是獨(dú)立樣本；另一種是兩個(gè)樣本的抽取互相之間有影響，這時(shí)我們稱這樣抽取的兩個(gè)樣本是匹配樣本。例如，為了研究駕駛員佩戴墨鏡是否會(huì)降低反應(yīng)速度，需要在佩戴墨鏡和不佩戴墨鏡兩個(gè)總體中抽取樣本，然后進(jìn)行比較。如果抽取若干名駕駛員，讓他們佩戴墨鏡測(cè)試反應(yīng)速度（一個(gè)樣本），然后再不加限制條件再抽取若干名駕駛員，讓他們不佩戴墨鏡測(cè)試速度（另一個(gè)樣本），這樣得到的兩個(gè)樣本是獨(dú)立樣本。但是，這樣的兩個(gè)樣本結(jié)果可能缺少可比性，因?yàn)椴煌娜似浞磻?yīng)速度是有差異的，為了增強(qiáng)可比性，我們可以抽取若干名駕駛員，讓他們佩戴墨鏡測(cè)試反應(yīng)速度（一個(gè)樣本），然后再讓這些駕駛員不佩戴墨鏡測(cè)試速度（另一個(gè)樣本），這樣得到的兩個(gè)樣本是匹配樣本。9.3.2

兩個(gè)總體均值之差的區(qū)間估計(jì)1.大樣本情形1）兩個(gè)總體的方差已知在這個(gè)條件下，由中心極限定理知兩個(gè)樣本平均數(shù)

分別服從正態(tài)分布。即：，

由正態(tài)分布再生定理知，其中分別表示兩個(gè)總體的均值，

分別表示兩個(gè)總體的方差，分別表示兩個(gè)樣本容量。

設(shè)置信水平為1-α，則抽樣極限誤差為：

（9-10）

兩個(gè)總體均值之差的置信區(qū)間為：（，）

（9-11）2）兩個(gè)總體方差未知但相等

設(shè)

,分別表示兩個(gè)樣本的方差，置信水平為1

，則由概率論知識(shí)可以證明：

（9-12）

其中：（9-13）稱為聯(lián)合方差估計(jì)。

兩個(gè)總體均值之差

的置信區(qū)間為：（，）（9-14）3）兩個(gè)總體方差未知且不相等此時(shí)，估計(jì)量由公式（9-15）中的

t分布近似，但其自由度

由公式（9-16）決定：（9-15）（9-16）[x]表示不超過(guò)

的最大整數(shù)。此時(shí)，兩個(gè)總體均值之差

的置信區(qū)間為：（

，）

（9-17）

注意此時(shí)的自由度是由公式（9-16）決定的?！纠?/p>

9-7】本周一（6

月

日），美世Mercer

公布了

2018

年全球城市生活成本排名

排在今年全球前十的中國(guó)城市，除了再次登頂?shù)南愀?，還有第

的上海和第

的北京。加上同樣位列TOP10

的東京、首爾、新加坡……連美世官方都不得不感嘆，亞洲城市前

占

6，住不起也惹不起?。《诒鄙细壑?，高居全球前

的中國(guó)城市還有深圳（12）、廣州（15）、南京（25）、臺(tái)北（27）、天津（29）、成都（31）、青島（36）和沈陽(yáng)（38）。

據(jù)BBC

News

以及美世官網(wǎng)介紹，這項(xiàng)排名今年已經(jīng)是連續(xù)第

年發(fā)布，具有相當(dāng)高的聲譽(yù)和可信度。它以紐約、美元作為測(cè)算基礎(chǔ)，對(duì)全球范圍內(nèi)超過(guò)

375

個(gè)城市進(jìn)行數(shù)據(jù)收集和對(duì)比，所涵蓋的分項(xiàng)包括房?jī)r(jià)、交通費(fèi)、餐飲開銷、服裝配飾、娛樂(lè)休閑等

200

多個(gè)。（搜狐網(wǎng)

2018-07-01）

如果假設(shè)兩個(gè)城市生活成本的總體方差相等，則：（1）兩個(gè)總體均值之差的點(diǎn)估計(jì)為多少？（2）兩個(gè)總體均值之差的

95%的置信區(qū)間為多少？（3）你認(rèn)為這兩座城市的生活成本有顯著差異嗎？為了比較不同城市的生活成本，分別在沈陽(yáng)和成都抽取了兩個(gè)獨(dú)立樣本，調(diào)查數(shù)據(jù)如下：樣本1：成都=2100元=200=85樣本2：沈陽(yáng)=1900元=160=100

解：（1）因?yàn)?2100-1900=200，所以兩個(gè)總體均值之差的點(diǎn)估計(jì)為200。（2）由公式（9-13）得：則

：

由Excel得

兩個(gè)總體均值之差的

95%的置信區(qū)間為（145.9，254.1）。(3)由于置信區(qū)間不包含

0，所以這兩座城市的生活成本有顯著的差異。2.小樣本情形

當(dāng)樣本是小樣本時(shí)，則要求兩個(gè)總體均服從正態(tài)分布。此時(shí)，也可以分別討論兩個(gè)總體方差已知、兩個(gè)總體方差未知但相等、兩個(gè)總體方差未知且不相等三種情況，其結(jié)論與大樣本時(shí)相同，置信區(qū)間分別可由公式（9-11）、（9-14）和（9-17）給出。【例

9-8】北京澳德物流有限責(zé)任公司是一家主要經(jīng)營(yíng)國(guó)內(nèi)食品冷鏈運(yùn)輸業(yè)務(wù)的第三方物流運(yùn)輸企業(yè)，成立于

2006

年

，是一家致力于優(yōu)化冷鏈?zhǔn)称芳吧r電商供應(yīng)鏈鏈路、降低運(yùn)營(yíng)成本、提高運(yùn)營(yíng)時(shí)效品質(zhì)的冷鏈物流公司。該公司常年給一家企業(yè)提供第三方物流服務(wù)，需要在每天的同一時(shí)間將貨物從甲地送往乙地，送貨有兩條線路，雖然路程基本相，但車流量卻不同。為了比較兩條線路所需要的時(shí)間，物流公司隨機(jī)抽取了兩個(gè)獨(dú)立樣本，記錄下送貨所需的時(shí)間，兩個(gè)樣本整理后的結(jié)果如下。假設(shè)兩條線路所需時(shí)間的總體服從正態(tài)分布且方差相等，求兩條線路均值之差的95%的置信區(qū)間。樣本1：線路A

=46分鐘=5分鐘=24樣本2：線路B=42分鐘=3分鐘=18解：由公式（9-13）得：則=4.27查表得：兩條線路均值之差的

95%的置信區(qū)間為（1.3，6.7）。由于這個(gè)置信區(qū)間不包含

0，所以兩條線路所需時(shí)間存在顯著差異。9.3.3

兩個(gè)總體比率之差的區(qū)間估計(jì)兩個(gè)總體比率之差的區(qū)間估計(jì)，

要求是大樣本，即：n1

5及n1(1

、n2

5及n2

)

都成立，或者按表

8-5

的經(jīng)驗(yàn)值進(jìn)行判斷。此時(shí)，兩個(gè)樣本比率之差的抽樣分布是：

（9-18）兩個(gè)總體比率之差

的置信區(qū)間為：(,）

（9-19）當(dāng)

，

未知時(shí)，用

，

代替。（9-18）設(shè)置信水平為1

，則抽樣極限誤差為：【例

9-9】

月

日，中國(guó)汽車技術(shù)研究中心聯(lián)合全球道路安全合作伙伴、世界衛(wèi)生組織、中國(guó)婦女發(fā)展基金會(huì)、標(biāo)準(zhǔn)所、中汽認(rèn)證中心有限公司、上海疾控中心、國(guó)家轎車質(zhì)量監(jiān)督檢驗(yàn)中心等機(jī)構(gòu)專家在津發(fā)布

2018

版中英文《中國(guó)兒童道路交通安全藍(lán)皮書》。

《中國(guó)兒童交通安全藍(lán)皮書

2018》調(diào)查顯示，在

2017

年開展的兒童道路交通安全調(diào)研收集的

4218

份有效問(wèn)卷中，每三個(gè)家庭中就有一個(gè)家庭未配備并正確使用兒童安全座椅。

目前，美國(guó)、日本、英國(guó)、瑞典、加拿大、新西蘭等超過(guò)

個(gè)國(guó)家和地區(qū)已經(jīng)出臺(tái)了兒童乘車的相關(guān)法規(guī)，強(qiáng)制規(guī)定兒童乘車必需使用汽車安全座椅，同時(shí)也有相應(yīng)的法規(guī)及生產(chǎn)和檢測(cè)標(biāo)準(zhǔn)。國(guó)內(nèi)，上海、杭州、南京、武漢、大連、濟(jì)南等也對(duì)兒童乘車有了硬性規(guī)定。（搜狐汽車2018-07-12）假設(shè)此次調(diào)查分別在上海和武漢分別抽取了

800

個(gè)和

600

個(gè)家庭，上海家庭使用兒童安全座椅的比率為

26%，而武漢為

20%。試以

95%的置信水平估計(jì)兩地家庭使用兒童安全座椅比率差異的置信區(qū)間。解：已知

＝26%，

＝20%，

＝800，

＝600，

＝95%，查表得：

＝1.96兩地家庭使用兒童安全座椅差異的置信區(qū)間

95%

的置信區(qū)間為（1.586%，10.414%），由于置信區(qū)間中不包含

0，說(shuō)明兩地家庭使用兒童安全座椅的比率有顯著差異。9.3.4

兩個(gè)總體方差之比的區(qū)間估計(jì)

由第

章的公式（8-21）有:

整理得：

設(shè)置信水平為1

，則有：,

如圖

9-9

所示。圖9-9方差之比置信區(qū)間示意圖

/2取倒數(shù)得：

，則有：（9-20）【例

9-10】從兩條自動(dòng)瓶裝生產(chǎn)線上抽樣兩個(gè)獨(dú)立樣本，以檢測(cè)其工作得穩(wěn)定性。樣本數(shù)據(jù)如下：樣本1=25，=9；樣本2=16，=3。以置信水平為95%估計(jì)兩條自動(dòng)瓶裝生產(chǎn)線方差之比得置信區(qū)間。由公式（9-18）有：

兩條自動(dòng)瓶裝生產(chǎn)線方差之比的

95%的置信區(qū)間為（1.1，7.3）。由于置信區(qū)間不包括

1，所以兩條自動(dòng)生產(chǎn)線的穩(wěn)定性有顯著差異，樣本方差小的生產(chǎn)線穩(wěn)定性高。解：已知=25，=9，=16，=3，1-α=95%。查表得：=2.70,則：

≈0.419.3.5

匹配樣本的區(qū)間估計(jì)關(guān)于兩個(gè)總體參數(shù)的對(duì)比，有時(shí)需要匹配樣本。例如，兩個(gè)地區(qū)由于收入、地價(jià)、房租不同，相同的商品的價(jià)格可能會(huì)有不同。如果要比較兩個(gè)地區(qū)的物價(jià)，必須針對(duì)相同的商品來(lái)比較價(jià)格，這樣，應(yīng)該抽取匹配樣本。抽取匹配樣本時(shí)，兩個(gè)樣本之間是關(guān)聯(lián)的，所以其抽樣分布略有不同。匹配樣本的數(shù)據(jù)如下:表9-1匹配樣本的數(shù)據(jù)結(jié)構(gòu)序號(hào)樣本

的數(shù)據(jù)

樣本

的數(shù)據(jù)

兩個(gè)樣本的差值d

21X11X

21d12X12X

22d2……………………nX

1nX

2ndn可以證明當(dāng)d

服從正態(tài)分布時(shí)，有以下結(jié)論：（9-21）其中

的均值

的樣本方差則抽樣極限誤差為：則d

的(1

)的置信區(qū)間為：（，）（9-23）（9-22）【例

9-11】人們相信即便在同一城市由于區(qū)域不同，從而地價(jià)不同，中心城區(qū)的商品價(jià)格要高于郊區(qū)。為了證實(shí)這個(gè)推測(cè)，調(diào)查人員分別在中心城區(qū)和郊區(qū)抽取了相同的商品，記錄下其價(jià)格（數(shù)據(jù)見Data9-3）。根據(jù)這些數(shù)據(jù)判斷中心城區(qū)和郊區(qū)的商品價(jià)格有無(wú)顯著差異(取

0.05)

。解：由數(shù)據(jù)資料得：n=49，

=1.17，

sd=1.5

查表得

由公式（9-21）得：

中心城區(qū)和郊區(qū)的商品價(jià)格置信水平為

95%的置信區(qū)間為（0.74,1.60）。9.4樣本容量的確定我們知道，大樣本要比小樣本有更好的統(tǒng)計(jì)學(xué)性質(zhì)，在其他條件不變的情況下，隨著樣本容量的增大，估計(jì)的誤差（抽樣極限誤差）會(huì)減小。為了提高估計(jì)的準(zhǔn)確性，一個(gè)最簡(jiǎn)單的辦法就是增加樣本容量。但是，在實(shí)際操作中，樣本容量的增加會(huì)同時(shí)增加收集數(shù)據(jù)的成本，也可能會(huì)增加出現(xiàn)登記性誤差的可能性。于是，我們必需考慮這樣一個(gè)問(wèn)題：在給定的抽樣極限誤差和可靠程度的條件下，如何選擇一個(gè)合適的樣本容量。

9.4.1

估計(jì)總體均值時(shí)樣本容量的確定當(dāng)估計(jì)一個(gè)總體均值時(shí)，由公式（9-1）、（9-2）知，樣本容量與抽樣極限誤差成反比，與總體方差（或樣本方差）成正比，與置信水平對(duì)應(yīng)的可靠性系數(shù)成正比。于是，在給定相關(guān)條件下，我們可以確定樣本容量。當(dāng)總體方差已知時(shí)有：（9-24）【例9-12】某超市想要估計(jì)每位顧客平均每次購(gòu)物花費(fèi)的金額。根據(jù)過(guò)去的經(jīng)驗(yàn)，標(biāo)準(zhǔn)差大約為150元，現(xiàn)要求以95%的置信水平估計(jì)每位顧客購(gòu)物金額的置信區(qū)間，并要求允許誤差不超過(guò)50元，應(yīng)抽取多少個(gè)顧客作為樣本？解：已知=150，=95%，=50，查表得=1.96。

由公式（9-19）有：

應(yīng)至少抽35名顧客作為樣本。9.4.2

估計(jì)總體比率時(shí)樣本容量的確定當(dāng)估計(jì)一個(gè)總體比率時(shí)，由公式（9-3）得：

（9-25）

當(dāng)

未知時(shí)，可以取

0.5

。【例

9-13】受一家電器制造商的委托，某市場(chǎng)調(diào)查公司要對(duì)某地區(qū)微波爐的家庭擁有率進(jìn)行估計(jì)。如果希望估計(jì)誤差不超過(guò)

5%。假設(shè)置信水平取

95%,應(yīng)取多大容量的樣本?解：已知

1-α=95%，=5%，查表得：=1.96

因Π未知，故取Π=0.5。

由公式（9-20）有：應(yīng)至少抽取385戶家庭作為樣本。【本章小結(jié)】

參數(shù)估計(jì)是推斷統(tǒng)計(jì)的重要內(nèi)容，區(qū)間估計(jì)是其中基本的方法。

參數(shù)估計(jì)的理論依據(jù)是大數(shù)定律和中心極限定理，我們可以在一定的置信水平保證下構(gòu)造參數(shù)的置信區(qū)間。

總體均值的置信區(qū)間的構(gòu)造方法是：當(dāng)總體方差已知、大樣本時(shí)，可以用正態(tài)分布構(gòu)造置信區(qū)間；當(dāng)總體方差未知，大樣本時(shí)，則要用

分布構(gòu)造置信區(qū)間。當(dāng)樣本是小樣本時(shí)，則要求總體總體服從正態(tài)分布，在總體方差已知和總體方差未的條件，與大樣本一樣構(gòu)造置信區(qū)間?？傮w比率的置信區(qū)間的構(gòu)造方法是：當(dāng)滿足大樣本條件時(shí)，用正態(tài)分布構(gòu)造置信區(qū)間。總體方差的置信區(qū)間的構(gòu)造方法是：用卡方分布構(gòu)造置信區(qū)間。我們還可以構(gòu)造兩個(gè)總體參數(shù)差或比的置信區(qū)間。

置信區(qū)間的寬窄與風(fēng)險(xiǎn)水平或置信水平有關(guān)，我們可以在風(fēng)險(xiǎn)水平和誤差程度之間選擇一個(gè)平衡點(diǎn)。

在實(shí)際運(yùn)用中，可以在一定的可靠程度和允許誤差的條件下，確定合適的樣本容量?！緦W(xué)習(xí)建議】參數(shù)估計(jì)是推斷統(tǒng)計(jì)的重要內(nèi)容，而其中最基本的內(nèi)容是區(qū)間估計(jì)。在學(xué)習(xí)這部分內(nèi)容時(shí)，一是要理解進(jìn)行區(qū)間估計(jì)的理論基礎(chǔ)是大數(shù)定律和中心極限定理，掌握區(qū)間估計(jì)的基本原理；二是要理解置信水平和抽樣極限誤差的概念以及相互關(guān)系；三是要正確判斷樣本統(tǒng)計(jì)量的抽樣分布，特別是估計(jì)總體均值時(shí)什么條件下用正態(tài)分布，什么條件下用

分布；四是會(huì)正確確定樣本容量。本章重點(diǎn)區(qū)間估計(jì)的原理和方法；理解抽樣極限誤差的概念和意義；樣本容量的確定。本章難點(diǎn)區(qū)間估計(jì)的原理和方法；正確判斷樣本統(tǒng)計(jì)量的抽樣分布?！竞诵母拍睢奎c(diǎn)估計(jì)

區(qū)間估計(jì)

大數(shù)定律

中心極限定理

置信水平

標(biāo)準(zhǔn)誤差

抽樣極限誤差

置信區(qū)間第

章

假設(shè)檢驗(yàn)【學(xué)習(xí)目標(biāo)】建立解假設(shè)檢驗(yàn)的基本概念,掌握假設(shè)檢驗(yàn)的基本原理；理解僅依靠樣本進(jìn)行決策的風(fēng)險(xiǎn)；能運(yùn)用假設(shè)檢驗(yàn)解決各種實(shí)際問(wèn)題；掌握用

p值方法進(jìn)行假設(shè)檢驗(yàn)。10.1概述10.1.1假設(shè)檢驗(yàn)在經(jīng)濟(jì)管理活動(dòng)中，人們需要對(duì)各種各樣的現(xiàn)象進(jìn)行判斷，以期做出正確的決策。但是，人們所面對(duì)的是往往是隨機(jī)現(xiàn)象，并且所掌握和信息也是有限的，于是就產(chǎn)生了這樣一個(gè)問(wèn)題：怎樣利用較少的信息對(duì)總體現(xiàn)象進(jìn)行決策。下面我們通過(guò)一個(gè)例子來(lái)說(shuō)明這個(gè)問(wèn)題?！纠?/p>

10-1】全國(guó)政協(xié)委員馮丹龍建議：完善兒童用藥安全管理

月

日，全國(guó)政協(xié)委員、馮玉祥之孫女馮丹龍，在接受法制晚報(bào)·看法新聞?dòng)浾卟稍L時(shí)表示，今年她的建議是建立和完善兒童用藥法律法規(guī)，同時(shí)加強(qiáng)對(duì)兒童藥品研發(fā)生產(chǎn)的監(jiān)管。馮丹龍認(rèn)為，兒童用藥，安全是重中之重。兒童作為一個(gè)特殊用藥群體，各器官發(fā)育未成熟，對(duì)藥品的用法用量有其特殊要求。目前，臨床上兒童用藥不當(dāng)方面均有不同程度的問(wèn)題，需要及時(shí)改進(jìn)和提高。

據(jù)《半月談》雜志報(bào)道，中國(guó)兒童用藥不良反應(yīng)發(fā)生率為

12.9%，其中新生兒高達(dá)

24.4%，分別是成人的

倍和

倍。中國(guó)醫(yī)藥工業(yè)信息中心的數(shù)據(jù)顯示，全國(guó)藥品生產(chǎn)企業(yè)有

8000多家，其中專門生產(chǎn)兒童用藥的企業(yè)僅占

0.1%。在藥品臨床實(shí)驗(yàn)注冊(cè)項(xiàng)目中，國(guó)產(chǎn)藥品注冊(cè)信息達(dá)到

萬(wàn)多條，其中兒童藥品僅有2000

多條。

目前，兒童給藥劑量多依據(jù)成人劑量，再通過(guò)體重?fù)Q算、體表面積換算、年齡換算等方法來(lái)確定?！皟和^非成人的‘微縮版’，具有其本身的生理特點(diǎn)。將成人藥酌減給兒童使用，缺乏科學(xué)依據(jù)和循證醫(yī)學(xué)證據(jù)?！焙幽鲜∪嗣襻t(yī)院兒科主任高麗表示。（北青網(wǎng)

2018-03-03）

生產(chǎn)兒童藥物劑量控制非常重要，劑量少了達(dá)不到治療效果，劑量大了可能出現(xiàn)不良反應(yīng)。在生產(chǎn)過(guò)程中，我們?cè)鯓优袛鄡和幬锏膭┝渴欠窈细衲兀匡@然，不可能將全部的藥物都進(jìn)行檢測(cè)，我們能做的只是檢測(cè)其中的一小部分。

假設(shè)一條生產(chǎn)兒童注射液的自動(dòng)生產(chǎn)線的標(biāo)準(zhǔn)劑量是每支

12ml，由于各種偶然因素的影響，生產(chǎn)過(guò)程中罐裝劑量可能會(huì)產(chǎn)生偏差，假設(shè)允許偏差為

0.5ml。如果某一天，質(zhì)檢檢測(cè)了

支，得到平均值為

12.3ml，這時(shí)生產(chǎn)線工作正常嗎？解：這個(gè)問(wèn)題可以歸納為一個(gè)統(tǒng)計(jì)問(wèn)題：

生產(chǎn)線生產(chǎn)正常時(shí)標(biāo)準(zhǔn)劑量為

12ml，即總體均值

；允許的偏差為

0.5ml，即總體的標(biāo)準(zhǔn)差

0.5

；抽取樣本容量為

的樣本，得到

。這時(shí)，我們能否依據(jù)這個(gè)樣本信息判斷

還成立嗎？

這個(gè)問(wèn)題我們有兩個(gè)選擇：

12（生產(chǎn)線工作正常）和

12（生產(chǎn)線工作不正常），在總體標(biāo)準(zhǔn)差

0.5

的條件下，抽取樣本容量為36

的樣本，已知的樣本信息是

。我們希望利用這個(gè)樣本信息來(lái)對(duì)上述兩個(gè)選擇做出決策。樣本均值是統(tǒng)計(jì)量，是隨機(jī)變量，而總體均值是參數(shù)，是確定的值，我們的目的是利用統(tǒng)計(jì)量來(lái)對(duì)參數(shù)的取值做出判斷。一般地，利用樣本統(tǒng)計(jì)量對(duì)總體參數(shù)的取值做出決策的統(tǒng)計(jì)方法，稱為假設(shè)檢驗(yàn)。10.1.2.假設(shè)檢驗(yàn)的方法

一般來(lái)說(shuō)，假設(shè)檢驗(yàn)可以分成四個(gè)步驟：1)建立假設(shè)；2)確定檢驗(yàn)統(tǒng)計(jì)量以及分布；3)設(shè)定顯著性水平，確定臨界值和拒絕域；4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值，做出決策。每個(gè)步驟的變化都會(huì)產(chǎn)生不同的假設(shè)檢驗(yàn)，我們分步驟具體解釋假設(shè)檢驗(yàn)的基本概念和方法。1.假設(shè)

所謂假設(shè)就是某些對(duì)客觀事物特征的初始判斷或者說(shuō)斷言；用統(tǒng)計(jì)語(yǔ)言表達(dá)就是對(duì)總體參數(shù)的取值所作的斷言。由于這些斷言成立的理由并不充分，所以有對(duì)這些斷言進(jìn)行檢驗(yàn)的要求。

例如，在例

10-1

中，我們需要經(jīng)常監(jiān)測(cè)生產(chǎn)線的工作狀態(tài)。雖然有嚴(yán)格的標(biāo)準(zhǔn)和先進(jìn)的生產(chǎn)線，但由于生產(chǎn)過(guò)程會(huì)受到各樣偶然因素的影響，罐裝劑量可能會(huì)偏離標(biāo)準(zhǔn)劑量。在這里

12（生產(chǎn)線工作正常）就是一個(gè)假設(shè)（斷言），但是這個(gè)假設(shè)不一定成立，即可能出現(xiàn)另外一種情況：

（生產(chǎn)線工作不正常），如果是這種情況則需要對(duì)生產(chǎn)線的生產(chǎn)狀態(tài)進(jìn)行檢修。假設(shè)包括原假設(shè)和備擇假設(shè)。原假設(shè)記為H

，是研究者懷疑的、反對(duì)的，而且是要被檢驗(yàn)的假設(shè)。在例

10-1

中，H

就是原假設(shè)，質(zhì)檢人員（研究者）之所以進(jìn)行檢測(cè)，就是懷疑生產(chǎn)線工作不正常，檢測(cè)的目的就是在判斷

是否成立。備擇假設(shè)記為

，是研究者支持的假設(shè)。在例

10-1

中，H1

就是備擇假設(shè)，是質(zhì)檢人員（研究者）之所以進(jìn)行檢測(cè)，就是支持

。原假設(shè)和備擇假設(shè)構(gòu)成完備事件組，非此既彼，不存在第三種情況。假設(shè)檢驗(yàn)的目的就是搜集證據(jù)反對(duì)（檢驗(yàn)）原假設(shè)，如果沒(méi)有足夠的證據(jù)拒絕原假設(shè)，則只能選擇其反面—不拒絕原假設(shè)。

為了進(jìn)行假設(shè)檢驗(yàn)，首要步驟就是建立假設(shè)。一般情況下先建立備擇假設(shè)，這是因?yàn)閭鋼窦僭O(shè)是研究者支持的假設(shè)，一般觀點(diǎn)明確，容易表達(dá)。當(dāng)備擇假設(shè)確定后，其對(duì)立事件就是原假設(shè)。【例

10-2】某果汁飲料包裝容量為

500ml/盒，灌裝過(guò)多或過(guò)少都會(huì)被認(rèn)為包裝的容量不合格。質(zhì)檢人員需要定期抽樣檢測(cè)容量，判斷灌裝生產(chǎn)線生產(chǎn)是否正常，試建立對(duì)應(yīng)的假設(shè)。解：這個(gè)問(wèn)題中質(zhì)檢人員是研究者，他支持的觀點(diǎn)是生產(chǎn)線生產(chǎn)不正常，否則他就不需要進(jìn)行檢測(cè)了。由于灌裝過(guò)多或過(guò)少都會(huì)被認(rèn)為不正常，故備擇假設(shè)為：H1

500，從而原假設(shè)為：H

500

。【例

10-3】某品牌汽車輪胎的生產(chǎn)商聲稱其生產(chǎn)的輪胎行駛里程不少于

80000km。

為了驗(yàn)證這個(gè)說(shuō)法，某汽車俱樂(lè)部對(duì)該品牌輪胎的行駛里程進(jìn)行抽樣調(diào)查，試建立對(duì)應(yīng)的假設(shè)。解：這個(gè)問(wèn)題中汽車俱樂(lè)部是研究者，他支持的觀點(diǎn)是該品牌輪胎的行駛里程達(dá)不到

80000km，否則他就不會(huì)進(jìn)行抽樣調(diào)查。由于他支持的觀點(diǎn)是該品牌輪胎的行駛里程達(dá)不到

80000km，故備擇假設(shè)為：

80000

，從而原假設(shè)為：

80000

。

由上述兩個(gè)例子可以看出建立假設(shè)的一些特點(diǎn)：1）假設(shè)有不同的方向性。在例

10-2

中，樣本統(tǒng)計(jì)量的值比

500

過(guò)大或過(guò)?。p側(cè)），都有一定的理由拒絕H

500

，這樣的檢驗(yàn)稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)；在例

10-3

中，樣本統(tǒng)計(jì)量的值只有比

80000過(guò)?。▎蝹?cè)）才有一定理由拒絕H

80000

，這樣的檢驗(yàn)稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)。表

10-1

總體均值假設(shè)檢驗(yàn)的基本形式

設(shè)

為總體均值，

0為假設(shè)的總體均值的取值，我們可以將假設(shè)的基本形式總結(jié)如表

10-1

所示的形式。假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)

備擇假設(shè)

假設(shè)的方向性與具體的問(wèn)題有關(guān)，也與研究者的地位有關(guān)，因?yàn)椴煌匚坏难芯空邥?huì)有不同的觀點(diǎn)。如在例

10-2中，如果研究者換成工商管理人員，他可能更關(guān)心的是果汁生產(chǎn)廠商是否對(duì)消費(fèi)者有欺詐行為，也就是H1

500

，這時(shí)就有H

500

，這是一個(gè)單側(cè)檢驗(yàn)中的左側(cè)檢驗(yàn)。2)假設(shè)中所有的等號(hào)“=”設(shè)置在原假設(shè)中。包括“=”、“≤”、“≥”都設(shè)置在原假設(shè)中，這是因?yàn)榧僭O(shè)檢驗(yàn)是目的是檢驗(yàn)原假設(shè)，而且在邏輯方法是反證法—先假設(shè)原假設(shè)為真，再試圖導(dǎo)出矛盾的結(jié)果，這樣就要求原假設(shè)要“明確”地包含所有要檢驗(yàn)的情況。3)上述例子中只涉及到總體均值的假設(shè)，類似的可以建立總體比率、總體方差的假設(shè)，同樣有雙側(cè)和單側(cè)檢驗(yàn)。2.檢驗(yàn)統(tǒng)計(jì)量

對(duì)不同的總體參數(shù)進(jìn)行檢驗(yàn)，需要用到不同的樣本統(tǒng)計(jì)量。如對(duì)總體均值進(jìn)行檢驗(yàn)，需要用到樣本均值；對(duì)總體比率進(jìn)行檢驗(yàn)，需要用到樣本比率；對(duì)總體方差進(jìn)行檢驗(yàn)，需要用到樣本方差等等。但是，樣本統(tǒng)計(jì)量并不能很好地幫助我們做出判斷，進(jìn)行參數(shù)的假設(shè)檢驗(yàn)需要構(gòu)造檢驗(yàn)統(tǒng)計(jì)量。

我們以例

10-1

來(lái)說(shuō)明。生產(chǎn)線生產(chǎn)正常時(shí)標(biāo)準(zhǔn)劑量為12ml，即總體均值

；允許的偏差為0.5ml，即總體的標(biāo)準(zhǔn)差

0.5

；抽取樣本容量為36

的樣本，得到

。這時(shí)，我們能否依據(jù)這個(gè)樣本信息判斷

還成立嗎？

這個(gè)問(wèn)題要對(duì)下列假設(shè)進(jìn)行檢驗(yàn)：

，

。

顯然，樣本統(tǒng)計(jì)量

偏離總體均值

越遠(yuǎn)，我們拒絕原假設(shè)的理由就越充分?，F(xiàn)在我們得到的樣本統(tǒng)計(jì)量

，這個(gè)值偏離

足夠遠(yuǎn)嗎？雖然絕對(duì)差異只有

0.3，但是這是

支的平均差異，因?yàn)檎`差有正有負(fù)，可以互相抵消，0.3

可能是一個(gè)很大的差異。為此，我們要構(gòu)造檢驗(yàn)統(tǒng)計(jì)量進(jìn)行判斷。

我們先假定原假設(shè)為真，即

。由于樣本容量為

36（大樣本），

0.5

（總體方差已知），由中心極限定理得：（10-1）

由于

服從正態(tài)分布，在

為真的假定條件下,的取值偏離

足夠遠(yuǎn)的概率是非常小的，所以我們可以用概率來(lái)表示

偏離

的程度。設(shè)

的取值偏離

足夠遠(yuǎn)的概率為

，在雙側(cè)檢驗(yàn)中

相對(duì)于

的偏離可以是正偏離，也可以負(fù)偏離，所以

被平分在兩側(cè)，單側(cè)面積為

，如圖

10-1

所示。于是我們就可以有一個(gè)直觀的判斷：如果

的值落入圖

10-1

中的陰影部分區(qū)域，

的值就偏離

足夠遠(yuǎn)，就有足夠的理由拒絕原假設(shè)

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《統(tǒng)計(jì)學(xué)》課件（下）

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《統(tǒng)計(jì)學(xué)》課件（下）

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔