《統(tǒng)計(jì)學(xué)》課件(下)_第1頁(yè)
《統(tǒng)計(jì)學(xué)》課件(下)_第2頁(yè)
《統(tǒng)計(jì)學(xué)》課件(下)_第3頁(yè)
《統(tǒng)計(jì)學(xué)》課件(下)_第4頁(yè)
《統(tǒng)計(jì)學(xué)》課件(下)_第5頁(yè)
已閱讀5頁(yè),還剩505頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

9

參數(shù)估計(jì)【學(xué)習(xí)目標(biāo)】理解參數(shù)估計(jì)的基本問(wèn)題,理解置信水平、置信區(qū)間、抽樣極限誤差等概念;理解參數(shù)估計(jì)的基本原理;掌握參數(shù)區(qū)間估計(jì)的方法;掌握確定樣本容量的基本方法。9.1概述9.1.1參數(shù)估計(jì)的一般問(wèn)題1.參數(shù)估計(jì)的概念高德地圖發(fā)布《2018

年度中國(guó)主要城市交通分析報(bào)告》央廣網(wǎng)2019-01-16近日,高德地圖聯(lián)合中國(guó)社會(huì)科學(xué)院社會(huì)學(xué)研究所、未來(lái)交通與城市計(jì)算聯(lián)合實(shí)驗(yàn)室、阿里云等單位共同發(fā)布了《2018

年度中國(guó)主要城市交通分析報(bào)告》(以下簡(jiǎn)稱“《報(bào)告》”)。

《報(bào)告》顯示,基于路網(wǎng)行程延時(shí)指數(shù)對(duì)監(jiān)測(cè)的

50

個(gè)城市進(jìn)行對(duì)比分析,發(fā)現(xiàn)

2018

年是四年來(lái)路網(wǎng)高峰行程延時(shí)指數(shù)最低的一年,同比

2017

年全國(guó)近

90%城市擁堵下降或持平。而通過(guò)該指數(shù)排名的中國(guó)堵城排行榜中,北京位列第一,廣州位列第二,上海位列第八。但即便位列第八的上海,其工作日平均通勤時(shí)長(zhǎng)(雙程)也達(dá)

85.27分鐘,也就是說(shuō),假如一個(gè)上海人要上35

年班,他一生花在通勤上的時(shí)間為

11869

小時(shí),這其中有

5443

小時(shí)是因?yàn)閾矶聦?dǎo)致的。

值得注意的是,北京本年度雖然被評(píng)為“首堵”,但北京的全天公交巡航速度(公交車輛在站點(diǎn)之間巡航速度的平均值)最高,達(dá)到

23.14km/h。其余高的城市還有紹興、東莞、蘇州、濟(jì)南、廈門、揚(yáng)州、石家莊、上海等。而全天公交巡航速度較低的城市包括太原、烏魯木齊、沈陽(yáng)等,其中太原僅為13.98km/h。高德地圖雖然掌握著眾多數(shù)據(jù),但它并不能知道北京的每一臺(tái)公交車的巡航速度,《報(bào)告》中所說(shuō)的北京公交的巡航速度為23.14km/h

只是部分北京公交的巡航速度,這是一個(gè)樣本結(jié)果,而不是總體的結(jié)果。在實(shí)際活動(dòng)中,人們總是用樣本的數(shù)量特征去估計(jì)總體的數(shù)量特征,這種方法就是參數(shù)估計(jì)。所謂參數(shù)估計(jì)就是用樣本的數(shù)量特征(統(tǒng)計(jì)量)對(duì)總體的數(shù)量特征(參數(shù))進(jìn)行估計(jì)的統(tǒng)計(jì)方法。在現(xiàn)實(shí)現(xiàn)象中,參數(shù)往往是未知的,比如北京公交的巡航速度。我們可以用抽樣的方法,用樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行估計(jì)。常用的參數(shù)有總體均值

、總體比率

、總體方差

2

,我們將參數(shù)抽象地記為

。2.估計(jì)量與估計(jì)值

用來(lái)估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱,稱為估計(jì)量。例如:樣本平均數(shù)

X、樣本比率

p

、樣本方差

s

2

都是估計(jì)量,我們將估計(jì)量抽象地記為

。由樣本數(shù)據(jù)計(jì)算得到的對(duì)應(yīng)估計(jì)量的數(shù)值稱為估計(jì)值。例如:為了估計(jì)北京公交的巡航速度,我們抽取由

100

輛運(yùn)營(yíng)的北京公交車作為樣本,記錄它們?nèi)斓难埠剿俣?,然后?jì)算平均值為

23.14km/h,這個(gè)數(shù)值就是一個(gè)估計(jì)值。3.點(diǎn)估計(jì)與區(qū)間估計(jì)

參數(shù)估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。

用估計(jì)量

的值作為參數(shù)

的估計(jì)值,稱為參數(shù)的點(diǎn)估計(jì)。例如:經(jīng)過(guò)抽樣并計(jì)算出北京公交的巡航速度為

23.14km/h,即

=23.14。如果我們用這個(gè)估計(jì)值作為總體均值,即

23.14

,這就是點(diǎn)估計(jì)。點(diǎn)估計(jì)在方法上比較簡(jiǎn)便,在理論上也有可靠的依據(jù),但是卻不能表述出點(diǎn)估計(jì)值與參數(shù)的真實(shí)值接近的程度(估計(jì)的誤差)以及對(duì)應(yīng)估計(jì)的可靠程度(概率度)。

在點(diǎn)估計(jì)的基礎(chǔ)上,給出參數(shù)估計(jì)的一個(gè)范圍,稱為區(qū)間估計(jì)。例如:北京公交的巡航速度的點(diǎn)估計(jì)值為

23.14km/h,即

=23.14,可以認(rèn)為北京公交的巡航速度在

23.14

左右,我們?cè)谝欢煽砍潭鹊谋WC下給出一個(gè)范圍。區(qū)間估計(jì)是參數(shù)估計(jì)的重要方法,在后面的內(nèi)容里我們將做詳細(xì)的討論。9.1.2

參數(shù)估計(jì)的理論依據(jù)和基本問(wèn)題1.大數(shù)定律在第

8

章中我們對(duì)大數(shù)定律做了描述,它為我們進(jìn)行參數(shù)估計(jì)提供了理論基礎(chǔ)。例如:設(shè)北京公交巡航速度的平均用時(shí)為

,是一個(gè)未知的參數(shù),我們對(duì)這一現(xiàn)象進(jìn)行多次觀察―即抽樣(抽取

100輛運(yùn)營(yíng)公交車)并測(cè)量樣本中的每一輛公交車的巡航速度,記為X

1

,

X

2

,......X

n

。由大數(shù)定律,當(dāng)

n

樣本容量)足夠大時(shí),有這個(gè)結(jié)論為我們用樣本平均數(shù)

對(duì)總體均值

進(jìn)行估計(jì)提供了理論基礎(chǔ)。同理,我們可以用樣本比率

p

對(duì)總體比率

進(jìn)行估計(jì),用樣本方差

s

2

對(duì)總體方差

2

進(jìn)行估計(jì)。2.中心極限定理

以樣本平均數(shù)為例,在重復(fù)抽樣、大樣本、總體方差已知的條件下,我們有:

,其分布圖如圖9-1。由概率論知識(shí),樣本平均數(shù)

落在總體均值μ的兩側(cè)各為一個(gè)標(biāo)準(zhǔn)誤差(抽樣平均誤差)范圍內(nèi)概率為0.9545;落在三個(gè)標(biāo)準(zhǔn)誤差范圍內(nèi)的概率為0.9973。

9-1的抽樣分布X

的分布

由圖

9-1

可以看出,如果我們要求樣本平均數(shù)

越近(估計(jì)的誤差?。?,對(duì)應(yīng)的可能性也就是概率越小,即可靠程度越低;要求樣本平均數(shù)

越遠(yuǎn)(估計(jì)的誤差大),對(duì)應(yīng)的可能性也就是概率也越大,即可靠程度越高。這說(shuō)明,估計(jì)的誤差會(huì)受到兩個(gè)因素的影響:一是抽樣平均誤差(標(biāo)準(zhǔn)誤差);另一個(gè)是我們要求的可靠程度。這些結(jié)論為我們描述估計(jì)的誤差提供了依據(jù)。3.風(fēng)險(xiǎn)水平與置信水平

由上段的分析,可以理解估計(jì)的誤差與可靠程度的關(guān)系。仍以樣本平均數(shù)

為例,設(shè)在估計(jì)時(shí)發(fā)生錯(cuò)誤的概率為

,因?yàn)槲覀兿M稿e(cuò)誤的可能性要盡量地小,所以我們?cè)O(shè)定的

很小,一般為5%或更小。

稱為風(fēng)險(xiǎn)水平,其意義是指這樣的事件發(fā)生的概率:“遠(yuǎn)離”了

,或者說(shuō)

的差距超過(guò)了允許的范圍,即

落入到了如圖

9-2

所示陰影的范圍內(nèi)。由于

的抽樣分布是正態(tài)分布,所以

被平分在兩側(cè)。

B圖

9-2風(fēng)險(xiǎn)水平與置信水平的分布

2

2A

區(qū)間(A,B)對(duì)應(yīng)的概率為1

,我們稱為置信水平。其意義是指我們相信在所有的

中,有(1

)的

的差距沒(méi)有超過(guò)允許的范圍。4.抽樣極限誤差

我們將在參數(shù)估計(jì)中研究者所允許的誤差稱為抽樣極限誤差,也稱為邊際誤差,記為

。如何度量

呢?仍然以

為例,從圖

9-2

可以看出,這個(gè)允許的范圍就是區(qū)間(A,B)的半徑,而這個(gè)半徑的長(zhǎng)短是由

的抽樣分布和風(fēng)險(xiǎn)水平

決定的。在

的抽樣分布確定的條件下,

的值越大,區(qū)間(A,B)就越窄,估計(jì)的誤差越??;

的值越小,區(qū)間(A,B)就越寬,估計(jì)的誤差越大。

雖然的抽樣分布是正態(tài)分布,但由于μ未知,故A、B兩點(diǎn)的坐標(biāo)

、也未知,也就無(wú)法求出抽樣極限誤差

x

。

為了度量,對(duì)做標(biāo)準(zhǔn)變換,則

,如圖9-3所示。圖

9-3

標(biāo)準(zhǔn)正態(tài)分布(9-1)

當(dāng)風(fēng)險(xiǎn)水平為

α?xí)r,則對(duì)應(yīng)的臨界值是,經(jīng)過(guò)標(biāo)準(zhǔn)變換,原來(lái)正態(tài)分布的μ點(diǎn)坐標(biāo)變換到標(biāo)準(zhǔn)正態(tài)分布的0,原來(lái)正態(tài)分布的B點(diǎn)坐標(biāo)()變換到標(biāo)準(zhǔn)正態(tài)分布的,這時(shí)有則有:

當(dāng)總體方差未知時(shí),則用s

2

代替

2

,這時(shí)

,同樣有抽樣極限誤差為:

(9-2)同理,可以得到關(guān)于樣本比率

p

的抽樣極限誤差:(9-3)當(dāng)

未知時(shí)可用

p

代替。5.參數(shù)估計(jì)的標(biāo)準(zhǔn)1)無(wú)偏性

如果估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù),即E()=,則稱這個(gè)估計(jì)量是無(wú)偏的,其意義如圖

9-4a

所示。2)有效性

如果一個(gè)參數(shù)有兩個(gè)估計(jì)量,則其中方差較小的估計(jì)量是有效的,即如果

,則

是較

有效的估計(jì)量,其意義是計(jì)量

較估計(jì)量

更密集地集中在

的附近,這樣隨機(jī)抽取一個(gè),就要比隨機(jī)抽取一個(gè)離近的可能性要大。如圖9-4b所示。a)無(wú)偏性b)有效性3)一致性如果隨著樣本容量的增大,估計(jì)量與參數(shù)之間的差距變小,則稱這個(gè)估計(jì)量是一致的。其意義是隨著樣本容量的增大,抽樣分布的方差會(huì)變小,其意義如圖9-5

所示。圖

9-5 一致性可以證明,樣本平均數(shù)

、樣本比率

p

、樣本方差

s

2

分別是總體均值

、總體比率

、總體方差

2

的無(wú)偏、有效、一致的估計(jì)量。9.2一個(gè)總體參數(shù)的區(qū)間估計(jì)我們進(jìn)行抽樣的目的之一就是要用統(tǒng)計(jì)量對(duì)參數(shù)進(jìn)行估計(jì)。在實(shí)際的社會(huì)經(jīng)濟(jì)現(xiàn)象中,總體參數(shù)一般都是未知的,是需要我們進(jìn)行估計(jì)的,而估計(jì)量是可以通過(guò)計(jì)算某個(gè)樣本數(shù)據(jù)得到估計(jì)值的。仍然以樣本平均數(shù)

為例,由上節(jié)的分析,我們可以知道

落在以

為中心的一定范圍內(nèi)的概率是多少,由于

的距離是對(duì)稱的,所以

也以相同的概率被包含在以

為中心的區(qū)間內(nèi),利用這個(gè)原理,可以對(duì)

進(jìn)行區(qū)間估計(jì)。9.2.1

總體均值的區(qū)間估計(jì)1.大樣本情形1)總體方差已知

由中心極限定理,當(dāng)總體方差已知、大樣本時(shí),有

。假設(shè)風(fēng)險(xiǎn)水平為α,則置信水平為1-α,由某個(gè)樣本得到的估計(jì)值為,如圖9-6所示。圖

9-6

的區(qū)間估計(jì)

其中區(qū)間(C,D)是由(A,B)平移得到的,AB的中點(diǎn)是

,CD

的中點(diǎn)是

。如果

落在區(qū)間(A,B)中(概率為1

),則區(qū)間(C,D)也將包含

,概率也為1

。所以,區(qū)間(C,D)稱為

的置信水平為1

的置信區(qū)間,C

點(diǎn)稱為置信區(qū)間的下限,D

點(diǎn)稱為置信區(qū)間的上限。由公式(9-1),C點(diǎn)的橫坐標(biāo)是,D點(diǎn)的橫坐標(biāo)是

,所以μ的1-α的置信區(qū)間是:(

,

(9-4)

由以上分析顯然有:

對(duì)μ的置信區(qū)間的理解要注意以下幾個(gè)問(wèn)題:一是區(qū)間(C,D)是由某一個(gè)樣本平均數(shù)確定的,而是隨機(jī)的,所以區(qū)間(C,D)也是隨機(jī)的,我們得到的這個(gè)區(qū)間是用這種方法構(gòu)造的成千上萬(wàn)個(gè)這樣的區(qū)間中特定的一個(gè)。二是對(duì)置信水平的理解。假設(shè)風(fēng)險(xiǎn)水平α=5%,則置信水平1-α=95%,其含義是:假如按照構(gòu)造置信區(qū)間的方法構(gòu)造的這樣的區(qū)間有10000個(gè),則其中有95%即9500個(gè)區(qū)間包含總體均值μ的真值,我們有95%把握相信,由某一個(gè)樣本平均數(shù)構(gòu)造的區(qū)間是包含總體均值μ的真值的9500個(gè)區(qū)間中的一個(gè)。

這些解釋可以用圖9-7來(lái)描述。圖

9-7

參數(shù)的區(qū)間估計(jì)

【例

9-1】北青網(wǎng)

2018-04-17

大學(xué)生對(duì)手機(jī)形成依賴,日均使用時(shí)間超過(guò)

5.2

小時(shí),手機(jī)已經(jīng)是我們生活中難以缺少的一部分了,可以毫不夸張的說(shuō),有些人離開了手機(jī)啥也干不了!就像對(duì)手機(jī)有癮一樣,的確手機(jī)對(duì)我們來(lái)說(shuō)也是越來(lái)越重要了,平常的買東西都需要手機(jī),就連小編都好久沒(méi)有觸摸現(xiàn)金了!大學(xué)生用起手機(jī)來(lái)更加恐怖,日均使用

5.2

個(gè)小時(shí)。麥可思研究院發(fā)布的一份中國(guó)在校大學(xué)生手機(jī)使用調(diào)查報(bào)告顯示,超八成大學(xué)生存在“手機(jī)依賴”,日均使用手機(jī)的時(shí)間超

5

小時(shí),18

點(diǎn)以后是大學(xué)生使用手機(jī)的高峰期。此外,79%的大學(xué)生在課堂上使用手機(jī)。假設(shè)麥可思研究院在各地區(qū)抽取了

100

名在校大學(xué)生,記錄下他們?cè)谀骋还ぷ魅帐褂檬謾C(jī)的時(shí)間,并計(jì)算得到平均值為

5

小時(shí)。如果總體標(biāo)準(zhǔn)差為

1.5

小時(shí),置信水平為

95%。(1)在校大學(xué)平均使用手機(jī)時(shí)間的點(diǎn)估計(jì)值是多少?(2)計(jì)算抽樣極限誤差;(3)對(duì)在校大學(xué)平均使用手機(jī)的時(shí)間做區(qū)間估計(jì)。解:已知:n=100,=5,α=5%,1-α=95%,查表得(1)在校大學(xué)生平均使用手機(jī)時(shí)間的點(diǎn)估計(jì)值為5個(gè)小時(shí)。(2)由式(9-1)得(3) 由式(9-4)得:

在校大學(xué)生平均使用手機(jī)時(shí)間95%的置信區(qū)間為(4.706,5.294).2)總體方差未知

當(dāng)總體方差未知時(shí),則

服從自由度為

n-1

t

分布,置信水平為1-α的置信區(qū)間為:(,)(9-6)

同理有:(9-7)

【例

9-2】2018-08-14

新浪科技

2018

年全球網(wǎng)速排名:中國(guó)大陸排名第

141

北京時(shí)間

8

13

日下午消息,M-Lab

近期發(fā)布了全球?qū)拵ЬW(wǎng)速排名榜。榜單收集了從

2017

6

月到

2018

5

29

12

個(gè)月時(shí)間內(nèi)的網(wǎng)速數(shù)據(jù),共有

200

個(gè)國(guó)家和地區(qū)上榜,測(cè)速次數(shù)超過(guò)

1.63億次。排行榜顯示,全球?qū)拵俣扰旁诘谝晃坏氖切录悠?,平均下載速度達(dá)到了60.39Mbps,排在第二位的是瑞典,其寬帶平均下載速度為

46Mbps,這兩個(gè)國(guó)家的排名和去年一樣。排在第三至六位的分別是丹麥、挪威、羅馬尼亞以及比利時(shí)。數(shù)據(jù)顯示,中國(guó)大陸排在第141

位,

寬帶平均下載速度是2.38Mbps,雖然這一速度相對(duì)去年的

1.55Mbps

有所提升,但在今年的總排名中,中國(guó)大陸的排名還是下降了

7

位。此外,中國(guó)香港的網(wǎng)速全球排名

19

位,每秒是

26.45Mbit。中國(guó)臺(tái)灣的網(wǎng)速全球排名第

14

位,達(dá)到了

28.09Mbps,不過(guò)相比去年排名下降了

11

位。

M-Lab

是一家旨在測(cè)量全球網(wǎng)絡(luò)狀況的組織,由新美國(guó)基金會(huì)(New

America

Foundation)旗下的開放技術(shù)研究所(Open

Technology

Institute)、谷歌開源研究中心(Google

Open

SourceResearch)、普林斯頓大學(xué)的

PlanetLab

及其它支持機(jī)構(gòu)發(fā)起成立。假設(shè)在中國(guó)大陸不同地區(qū)抽取

49家網(wǎng)絡(luò)運(yùn)營(yíng)商進(jìn)行調(diào)查,測(cè)得互聯(lián)網(wǎng)連接速度數(shù)據(jù)(數(shù)據(jù)見

Data9-1)。根據(jù)這些數(shù)據(jù),對(duì)中國(guó)大陸平均網(wǎng)速做點(diǎn)估計(jì)和

95%置信水平的區(qū)間估計(jì)。解:由Excel計(jì)算得=2.45,s=0.60,且n=49,1-α=95%。查表得=2.01。(1)中國(guó)大陸平均網(wǎng)速的點(diǎn)估計(jì)值為2.43Mbps。

(2)中國(guó)大陸平均網(wǎng)速的區(qū)間估計(jì):由式(9-6)得:中國(guó)大陸平均網(wǎng)速95%的置信區(qū)間為(2.28,2.62)2.小樣本情形由于小樣本有更大的偶然性,在這種條件下則要求總體服從正態(tài)分布,以降低估計(jì)的風(fēng)險(xiǎn)。1)總體服從正態(tài)分布、方差已知在這個(gè)條件下,

的置信區(qū)間構(gòu)造方法同公式(9-4)。【例

9-3】某銀行為了估計(jì)一臺(tái)自動(dòng)取款機(jī)(ATM

機(jī))的日平均取款額,連續(xù)抽取了

25

天該自動(dòng)取款機(jī)的取款額,計(jì)算得平均取款額為7.2

萬(wàn)元。假設(shè)總體服從正態(tài)分布,標(biāo)準(zhǔn)差為

1

萬(wàn)元,求該自動(dòng)取款機(jī)置信水平為

95%的日平均取款額置信區(qū)間。解:

已知 n

25,

7.2

,

1

1

95%

,查表得則由式(9-4)有:該自動(dòng)取款機(jī)置信水平為

95%的日平均取款額置信區(qū)間為(6.808,7.592)。2)總體服從正態(tài)分布、方差未知

在這個(gè)條件下,

的置信區(qū)間構(gòu)造方法同公式(9-6)。

【例

9-4】隨著社會(huì)的進(jìn)步和經(jīng)濟(jì)的發(fā)展,電已經(jīng)成為人們不可或缺的生產(chǎn)必須品。為了保障電力供應(yīng),國(guó)家電網(wǎng)公司向社會(huì)公布了供電服務(wù)“十項(xiàng)承諾",其中第二項(xiàng)承諾為:提供

24

小時(shí)電力故障報(bào)修服務(wù),供電搶修人員到達(dá)現(xiàn)場(chǎng)的時(shí)間一般不超過(guò):城區(qū)范圍45

分鐘;農(nóng)村地區(qū)

90

分鐘;特殊邊遠(yuǎn)地區(qū)

2

小時(shí)。

為了核實(shí)某市電網(wǎng)公司落實(shí)供電服務(wù)“十項(xiàng)承諾"的情況,在該市的電力故障報(bào)修服務(wù)記錄中抽取到

25

條城區(qū)范圍報(bào)修服務(wù)記錄作為樣本,統(tǒng)計(jì)出供電搶修人員到達(dá)現(xiàn)場(chǎng)的時(shí)間的數(shù)據(jù)(數(shù)據(jù)見Data9-2)。(1)該市供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間的點(diǎn)估計(jì)是多少?(2)假設(shè)總體服從正態(tài)分布,構(gòu)造該市供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間的

95%的置信區(qū)間。解:由樣本數(shù)據(jù)計(jì)算得:=30.44,s=4.93,n=25,1-α=95%,查表得(1)供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間的點(diǎn)估計(jì)值為30.44分鐘。供電搶修人員到達(dá)現(xiàn)場(chǎng)的平均時(shí)間

95%的置信區(qū)間為(28.40,32.48)。(2)由公式(9-6)有:9.2.2

總體比率的區(qū)間估計(jì)

由中心極限定理,當(dāng)大樣本、重復(fù)抽樣時(shí),樣本比率的抽樣分布是正態(tài)分布,其抽樣極限誤差如公式(9-3)所示。所以總體比率1

的置信區(qū)間是:()(9-8)當(dāng)

未知時(shí)可用

p

代替。大樣本的標(biāo)準(zhǔn)是使n

5

和n(1

)

5

同時(shí)成立時(shí)的n,或者按表8-5

的經(jīng)驗(yàn)值進(jìn)行判斷。

【例9-5】中國(guó)廣視索福瑞媒介研究(CSM)是央視市場(chǎng)研究(CTR)與

Kantar

Media

集團(tuán)等共同建立的中外合作企業(yè),致力于專業(yè)的電視收視和廣播收聽市場(chǎng)研究,為中國(guó)大陸地區(qū)和香港傳媒行業(yè)提供可靠的、不間斷的視聽調(diào)查服務(wù)。CSM

擁有龐大的廣播電視受眾調(diào)查網(wǎng)絡(luò),覆蓋

5.78

萬(wàn)余戶樣本家庭;其電視收視率調(diào)查網(wǎng)絡(luò)所提供的數(shù)據(jù)可推及中國(guó)內(nèi)地超過(guò)12.8億和香港地區(qū)

655

萬(wàn)的電視人口;其廣播收聽率調(diào)查的數(shù)據(jù)則可推及中國(guó)超過(guò)

1.2

億的廣播人口。

假設(shè)

CSM

為了推斷某一檔電視節(jié)目的收視率,在這檔電視節(jié)目播出期間,抽取了

1000

戶家庭進(jìn)行調(diào)查,得到收看這檔電視節(jié)目的家庭比率為

4%。依據(jù)這些數(shù)據(jù)求:(1)這檔電視節(jié)目平均收視率置信水平為

95%的抽樣極限誤差為多少?(2)這檔電視節(jié)目平均收視率置信水平為

95%的置信區(qū)間為多少?解:已知n=1000,p=4%,1-α=95%,查表得

,顯然,這是一個(gè)大樣本,故可以正態(tài)分布進(jìn)行估計(jì)。(1)抽樣極限誤差為:這檔電視節(jié)目平均收視率置信水平為

95%的置信區(qū)間為(2.8%,5.2%)。(2)由式(9-8)有:9.2.3

總體方差的區(qū)間估計(jì)

由第8

章的內(nèi)容知,樣本方差的抽樣分布服從卡方分布,由(8-15)式有:

。假設(shè)置信水平為1

,則如圖

9-8

所示:

/

2

/

2圖9-8卡方分布圖對(duì)總體方差做區(qū)間估計(jì)就是要使成立。整理得:

(9-9)

這就是構(gòu)造總體方差

2

的置信區(qū)間的方法?!纠?/p>

9-6】“愛情就像公交,苦苦等待卻怎么也等不到;愛情就像公交,有時(shí)候就差一點(diǎn)卻眼睜睜看著它遠(yuǎn)去;愛情就像公交,以為自己追上了卻發(fā)現(xiàn)怎么也擠不上?!边@是網(wǎng)上流行的一個(gè)段子,它從一個(gè)側(cè)面反映了人們對(duì)長(zhǎng)時(shí)間等待公交車的一種無(wú)奈。由于各種各樣的原因,雖然發(fā)車時(shí)間隔的時(shí)間相同,但是同一路公交車到達(dá)某一站的時(shí)間間隔會(huì)有比較大的差異。為了評(píng)估某城城市等待公交車的情況,選擇了其中一路公交車在某一時(shí)段時(shí)行調(diào)查,連續(xù)記錄了

25

輛公交車到達(dá)某站的時(shí)間間隔,經(jīng)計(jì)算時(shí)間間隔的方差為

16

分鐘,試以置信水平為

95%對(duì)總體方差做區(qū)間估計(jì)。

解:已知:n=25,s2=16,1-α=95%,查表得:,

。則總體方差95%的置信區(qū)間為(9.76,30.96)。9.3兩個(gè)總體參數(shù)的區(qū)間估計(jì)很多時(shí)候我們需要在兩個(gè)總體之間進(jìn)行比較。例如:比較兩個(gè)地區(qū)的平均勞動(dòng)報(bào)酬,就需要在兩個(gè)地區(qū)分別抽取樣本,再用樣本的平均數(shù)做出估計(jì)。為此先要建立一個(gè)基本概念--獨(dú)立樣本與匹配樣本。9.3.1

獨(dú)立樣本與匹配樣本當(dāng)我們要在兩個(gè)總體參數(shù)之間進(jìn)行比較時(shí),就要在兩個(gè)總體中分別抽取樣本,然后進(jìn)行比較。而在兩個(gè)總體中抽取樣本,可以有兩種抽取方法:一種是兩個(gè)樣本的抽取互相之間沒(méi)有影響,這時(shí)我們稱這樣抽取的兩個(gè)樣本是獨(dú)立樣本;另一種是兩個(gè)樣本的抽取互相之間有影響,這時(shí)我們稱這樣抽取的兩個(gè)樣本是匹配樣本。例如,為了研究駕駛員佩戴墨鏡是否會(huì)降低反應(yīng)速度,需要在佩戴墨鏡和不佩戴墨鏡兩個(gè)總體中抽取樣本,然后進(jìn)行比較。如果抽取若干名駕駛員,讓他們佩戴墨鏡測(cè)試反應(yīng)速度(一個(gè)樣本),然后再不加限制條件再抽取若干名駕駛員,讓他們不佩戴墨鏡測(cè)試速度(另一個(gè)樣本),這樣得到的兩個(gè)樣本是獨(dú)立樣本。但是,這樣的兩個(gè)樣本結(jié)果可能缺少可比性,因?yàn)椴煌娜似浞磻?yīng)速度是有差異的,為了增強(qiáng)可比性,我們可以抽取若干名駕駛員,讓他們佩戴墨鏡測(cè)試反應(yīng)速度(一個(gè)樣本),然后再讓這些駕駛員不佩戴墨鏡測(cè)試速度(另一個(gè)樣本),這樣得到的兩個(gè)樣本是匹配樣本。9.3.2

兩個(gè)總體均值之差的區(qū)間估計(jì)1.大樣本情形1)兩個(gè)總體的方差已知在這個(gè)條件下,由中心極限定理知兩個(gè)樣本平均數(shù)

X

1

,

X

2

分別服從正態(tài)分布。即:,

由正態(tài)分布再生定理知,其中分別表示兩個(gè)總體的均值,

分別表示兩個(gè)總體的方差,分別表示兩個(gè)樣本容量。

設(shè)置信水平為1-α,則抽樣極限誤差為:

(9-10)

兩個(gè)總體均值之差的置信區(qū)間為:(,)

(9-11)2)兩個(gè)總體方差未知但相等

設(shè)

,分別表示兩個(gè)樣本的方差,置信水平為1

,則由概率論知識(shí)可以證明:

(9-12)

其中:(9-13)稱為聯(lián)合方差估計(jì)。

兩個(gè)總體均值之差

1

2

的置信區(qū)間為:(,)(9-14)3)兩個(gè)總體方差未知且不相等此時(shí),估計(jì)量由公式(9-15)中的

t分布近似,但其自由度

df

由公式(9-16)決定:(9-15)(9-16)[x]表示不超過(guò)

x

的最大整數(shù)。此時(shí),兩個(gè)總體均值之差

1

2

的置信區(qū)間為:(

,)

(9-17)

注意此時(shí)的自由度是由公式(9-16)決定的?!纠?/p>

9-7】本周一(6

25

日),美世Mercer

公布了

2018

年全球城市生活成本排名

排在今年全球前十的中國(guó)城市,除了再次登頂?shù)南愀?,還有第

7

的上海和第

9

的北京。加上同樣位列TOP10

的東京、首爾、新加坡……連美世官方都不得不感嘆,亞洲城市前

10

6,住不起也惹不起?。《诒鄙细壑?,高居全球前

50

的中國(guó)城市還有深圳(12)、廣州(15)、南京(25)、臺(tái)北(27)、天津(29)、成都(31)、青島(36)和沈陽(yáng)(38)。

據(jù)BBC

News

以及美世官網(wǎng)介紹,這項(xiàng)排名今年已經(jīng)是連續(xù)第

24

年發(fā)布,具有相當(dāng)高的聲譽(yù)和可信度。它以紐約、美元作為測(cè)算基礎(chǔ),對(duì)全球范圍內(nèi)超過(guò)

375

個(gè)城市進(jìn)行數(shù)據(jù)收集和對(duì)比,所涵蓋的分項(xiàng)包括房?jī)r(jià)、交通費(fèi)、餐飲開銷、服裝配飾、娛樂(lè)休閑等

200

多個(gè)。(搜狐網(wǎng)

2018-07-01)

如果假設(shè)兩個(gè)城市生活成本的總體方差相等,則:(1)兩個(gè)總體均值之差的點(diǎn)估計(jì)為多少?(2)兩個(gè)總體均值之差的

95%的置信區(qū)間為多少?(3)你認(rèn)為這兩座城市的生活成本有顯著差異嗎?為了比較不同城市的生活成本,分別在沈陽(yáng)和成都抽取了兩個(gè)獨(dú)立樣本,調(diào)查數(shù)據(jù)如下:樣本1:成都=2100元=200=85樣本2:沈陽(yáng)=1900元=160=100

解:(1)因?yàn)?2100-1900=200,所以兩個(gè)總體均值之差的點(diǎn)估計(jì)為200。(2)由公式(9-13)得:則

由Excel得

兩個(gè)總體均值之差的

95%的置信區(qū)間為(145.9,254.1)。(3)由于置信區(qū)間不包含

0,所以這兩座城市的生活成本有顯著的差異。2.小樣本情形

當(dāng)樣本是小樣本時(shí),則要求兩個(gè)總體均服從正態(tài)分布。此時(shí),也可以分別討論兩個(gè)總體方差已知、兩個(gè)總體方差未知但相等、兩個(gè)總體方差未知且不相等三種情況,其結(jié)論與大樣本時(shí)相同,置信區(qū)間分別可由公式(9-11)、(9-14)和(9-17)給出。【例

9-8】北京澳德物流有限責(zé)任公司是一家主要經(jīng)營(yíng)國(guó)內(nèi)食品冷鏈運(yùn)輸業(yè)務(wù)的第三方物流運(yùn)輸企業(yè),成立于

2006

,是一家致力于優(yōu)化冷鏈?zhǔn)称芳吧r電商供應(yīng)鏈鏈路、降低運(yùn)營(yíng)成本、提高運(yùn)營(yíng)時(shí)效品質(zhì)的冷鏈物流公司。該公司常年給一家企業(yè)提供第三方物流服務(wù),需要在每天的同一時(shí)間將貨物從甲地送往乙地,送貨有兩條線路,雖然路程基本相,但車流量卻不同。為了比較兩條線路所需要的時(shí)間,物流公司隨機(jī)抽取了兩個(gè)獨(dú)立樣本,記錄下送貨所需的時(shí)間,兩個(gè)樣本整理后的結(jié)果如下。假設(shè)兩條線路所需時(shí)間的總體服從正態(tài)分布且方差相等,求兩條線路均值之差的95%的置信區(qū)間。樣本1:線路A

=46分鐘=5分鐘=24樣本2:線路B=42分鐘=3分鐘=18解:由公式(9-13)得:則=4.27查表得:兩條線路均值之差的

95%的置信區(qū)間為(1.3,6.7)。由于這個(gè)置信區(qū)間不包含

0,所以兩條線路所需時(shí)間存在顯著差異。9.3.3

兩個(gè)總體比率之差的區(qū)間估計(jì)兩個(gè)總體比率之差的區(qū)間估計(jì),

要求是大樣本,即:n1

1

5及n1(1

1)

5

、n2

2

5及n2

(1

2

)

5

都成立,或者按表

8-5

的經(jīng)驗(yàn)值進(jìn)行判斷。此時(shí),兩個(gè)樣本比率之差的抽樣分布是:

(9-18)兩個(gè)總體比率之差

1

2

的置信區(qū)間為:(,)

(9-19)當(dāng)

1

,

2

未知時(shí),用

p1

,

p2

代替。(9-18)設(shè)置信水平為1

,則抽樣極限誤差為:【例

9-9】

7

11

日,中國(guó)汽車技術(shù)研究中心聯(lián)合全球道路安全合作伙伴、世界衛(wèi)生組織、中國(guó)婦女發(fā)展基金會(huì)、標(biāo)準(zhǔn)所、中汽認(rèn)證中心有限公司、上海疾控中心、國(guó)家轎車質(zhì)量監(jiān)督檢驗(yàn)中心等機(jī)構(gòu)專家在津發(fā)布

2018

版中英文《中國(guó)兒童道路交通安全藍(lán)皮書》。

《中國(guó)兒童交通安全藍(lán)皮書

2018》調(diào)查顯示,在

2017

年開展的兒童道路交通安全調(diào)研收集的

4218

份有效問(wèn)卷中,每三個(gè)家庭中就有一個(gè)家庭未配備并正確使用兒童安全座椅。

目前,美國(guó)、日本、英國(guó)、瑞典、加拿大、新西蘭等超過(guò)

50

個(gè)國(guó)家和地區(qū)已經(jīng)出臺(tái)了兒童乘車的相關(guān)法規(guī),強(qiáng)制規(guī)定兒童乘車必需使用汽車安全座椅,同時(shí)也有相應(yīng)的法規(guī)及生產(chǎn)和檢測(cè)標(biāo)準(zhǔn)。國(guó)內(nèi),上海、杭州、南京、武漢、大連、濟(jì)南等也對(duì)兒童乘車有了硬性規(guī)定。(搜狐汽車2018-07-12)假設(shè)此次調(diào)查分別在上海和武漢分別抽取了

800

個(gè)和

600

個(gè)家庭,上海家庭使用兒童安全座椅的比率為

26%,而武漢為

20%。試以

95%的置信水平估計(jì)兩地家庭使用兒童安全座椅比率差異的置信區(qū)間。解:已知

p1

=26%,

p2

=20%,

n1

=800,

n2

=600,

1

=95%,查表得:

=1.96兩地家庭使用兒童安全座椅差異的置信區(qū)間

95%

的置信區(qū)間為(1.586%,10.414%),由于置信區(qū)間中不包含

0,說(shuō)明兩地家庭使用兒童安全座椅的比率有顯著差異。9.3.4

兩個(gè)總體方差之比的區(qū)間估計(jì)

由第

8

章的公式(8-21)有:

整理得:

設(shè)置信水平為1

,則有:,

如圖

9-9

所示。圖9-9方差之比置信區(qū)間示意圖

/2

/2取倒數(shù)得:

,則有:(9-20)【例

9-10】從兩條自動(dòng)瓶裝生產(chǎn)線上抽樣兩個(gè)獨(dú)立樣本,以檢測(cè)其工作得穩(wěn)定性。樣本數(shù)據(jù)如下:樣本1=25,=9;樣本2=16,=3。以置信水平為95%估計(jì)兩條自動(dòng)瓶裝生產(chǎn)線方差之比得置信區(qū)間。由公式(9-18)有:

兩條自動(dòng)瓶裝生產(chǎn)線方差之比的

95%的置信區(qū)間為(1.1,7.3)。由于置信區(qū)間不包括

1,所以兩條自動(dòng)生產(chǎn)線的穩(wěn)定性有顯著差異,樣本方差小的生產(chǎn)線穩(wěn)定性高。解:已知=25,=9,=16,=3,1-α=95%。查表得:=2.70,則:

≈0.419.3.5

匹配樣本的區(qū)間估計(jì)關(guān)于兩個(gè)總體參數(shù)的對(duì)比,有時(shí)需要匹配樣本。例如,兩個(gè)地區(qū)由于收入、地價(jià)、房租不同,相同的商品的價(jià)格可能會(huì)有不同。如果要比較兩個(gè)地區(qū)的物價(jià),必須針對(duì)相同的商品來(lái)比較價(jià)格,這樣,應(yīng)該抽取匹配樣本。抽取匹配樣本時(shí),兩個(gè)樣本之間是關(guān)聯(lián)的,所以其抽樣分布略有不同。匹配樣本的數(shù)據(jù)如下:表9-1匹配樣本的數(shù)據(jù)結(jié)構(gòu)序號(hào)樣本

1

的數(shù)據(jù)

樣本

2

的數(shù)據(jù)

兩個(gè)樣本的差值d

X1

X

21X11X

21d12X12X

22d2……………………nX

1nX

2ndn可以證明當(dāng)d

服從正態(tài)分布時(shí),有以下結(jié)論:(9-21)其中

--

d

的均值

sd

--

d

的樣本方差則抽樣極限誤差為:則d

的(1

)的置信區(qū)間為:(,)(9-23)(9-22)【例

9-11】人們相信即便在同一城市由于區(qū)域不同,從而地價(jià)不同,中心城區(qū)的商品價(jià)格要高于郊區(qū)。為了證實(shí)這個(gè)推測(cè),調(diào)查人員分別在中心城區(qū)和郊區(qū)抽取了相同的商品,記錄下其價(jià)格(數(shù)據(jù)見Data9-3)。根據(jù)這些數(shù)據(jù)判斷中心城區(qū)和郊區(qū)的商品價(jià)格有無(wú)顯著差異(取

0.05)

。解:由數(shù)據(jù)資料得:n=49,

=1.17,

sd=1.5

查表得

由公式(9-21)得:

中心城區(qū)和郊區(qū)的商品價(jià)格置信水平為

95%的置信區(qū)間為(0.74,1.60)。9.4樣本容量的確定我們知道,大樣本要比小樣本有更好的統(tǒng)計(jì)學(xué)性質(zhì),在其他條件不變的情況下,隨著樣本容量的增大,估計(jì)的誤差(抽樣極限誤差)會(huì)減小。為了提高估計(jì)的準(zhǔn)確性,一個(gè)最簡(jiǎn)單的辦法就是增加樣本容量。但是,在實(shí)際操作中,樣本容量的增加會(huì)同時(shí)增加收集數(shù)據(jù)的成本,也可能會(huì)增加出現(xiàn)登記性誤差的可能性。于是,我們必需考慮這樣一個(gè)問(wèn)題:在給定的抽樣極限誤差和可靠程度的條件下,如何選擇一個(gè)合適的樣本容量。

9.4.1

估計(jì)總體均值時(shí)樣本容量的確定當(dāng)估計(jì)一個(gè)總體均值時(shí),由公式(9-1)、(9-2)知,樣本容量與抽樣極限誤差成反比,與總體方差(或樣本方差)成正比,與置信水平對(duì)應(yīng)的可靠性系數(shù)成正比。于是,在給定相關(guān)條件下,我們可以確定樣本容量。當(dāng)總體方差已知時(shí)有:(9-24)【例9-12】某超市想要估計(jì)每位顧客平均每次購(gòu)物花費(fèi)的金額。根據(jù)過(guò)去的經(jīng)驗(yàn),標(biāo)準(zhǔn)差大約為150元,現(xiàn)要求以95%的置信水平估計(jì)每位顧客購(gòu)物金額的置信區(qū)間,并要求允許誤差不超過(guò)50元,應(yīng)抽取多少個(gè)顧客作為樣本?解:已知=150,=95%,=50,查表得=1.96。

由公式(9-19)有:

應(yīng)至少抽35名顧客作為樣本。9.4.2

估計(jì)總體比率時(shí)樣本容量的確定當(dāng)估計(jì)一個(gè)總體比率時(shí),由公式(9-3)得:

(9-25)

當(dāng)

未知時(shí),可以取

0.5

。【例

9-13】受一家電器制造商的委托,某市場(chǎng)調(diào)查公司要對(duì)某地區(qū)微波爐的家庭擁有率進(jìn)行估計(jì)。如果希望估計(jì)誤差不超過(guò)

5%。假設(shè)置信水平取

95%,應(yīng)取多大容量的樣本?解:已知

1-α=95%,=5%,查表得:=1.96

因Π未知,故取Π=0.5。

由公式(9-20)有:應(yīng)至少抽取385戶家庭作為樣本。【本章小結(jié)】

參數(shù)估計(jì)是推斷統(tǒng)計(jì)的重要內(nèi)容,區(qū)間估計(jì)是其中基本的方法。

參數(shù)估計(jì)的理論依據(jù)是大數(shù)定律和中心極限定理,我們可以在一定的置信水平保證下構(gòu)造參數(shù)的置信區(qū)間。

總體均值的置信區(qū)間的構(gòu)造方法是:當(dāng)總體方差已知、大樣本時(shí),可以用正態(tài)分布構(gòu)造置信區(qū)間;當(dāng)總體方差未知,大樣本時(shí),則要用

t

分布構(gòu)造置信區(qū)間。當(dāng)樣本是小樣本時(shí),則要求總體總體服從正態(tài)分布,在總體方差已知和總體方差未的條件,與大樣本一樣構(gòu)造置信區(qū)間??傮w比率的置信區(qū)間的構(gòu)造方法是:當(dāng)滿足大樣本條件時(shí),用正態(tài)分布構(gòu)造置信區(qū)間。總體方差的置信區(qū)間的構(gòu)造方法是:用卡方分布構(gòu)造置信區(qū)間。我們還可以構(gòu)造兩個(gè)總體參數(shù)差或比的置信區(qū)間。

置信區(qū)間的寬窄與風(fēng)險(xiǎn)水平或置信水平有關(guān),我們可以在風(fēng)險(xiǎn)水平和誤差程度之間選擇一個(gè)平衡點(diǎn)。

在實(shí)際運(yùn)用中,可以在一定的可靠程度和允許誤差的條件下,確定合適的樣本容量?!緦W(xué)習(xí)建議】參數(shù)估計(jì)是推斷統(tǒng)計(jì)的重要內(nèi)容,而其中最基本的內(nèi)容是區(qū)間估計(jì)。在學(xué)習(xí)這部分內(nèi)容時(shí),一是要理解進(jìn)行區(qū)間估計(jì)的理論基礎(chǔ)是大數(shù)定律和中心極限定理,掌握區(qū)間估計(jì)的基本原理;二是要理解置信水平和抽樣極限誤差的概念以及相互關(guān)系;三是要正確判斷樣本統(tǒng)計(jì)量的抽樣分布,特別是估計(jì)總體均值時(shí)什么條件下用正態(tài)分布,什么條件下用

t

分布;四是會(huì)正確確定樣本容量。本章重點(diǎn)區(qū)間估計(jì)的原理和方法;理解抽樣極限誤差的概念和意義;樣本容量的確定。本章難點(diǎn)區(qū)間估計(jì)的原理和方法;正確判斷樣本統(tǒng)計(jì)量的抽樣分布?!竞诵母拍睢奎c(diǎn)估計(jì)

區(qū)間估計(jì)

大數(shù)定律

中心極限定理

置信水平

標(biāo)準(zhǔn)誤差

抽樣極限誤差

置信區(qū)間第

10

假設(shè)檢驗(yàn)【學(xué)習(xí)目標(biāo)】建立解假設(shè)檢驗(yàn)的基本概念,掌握假設(shè)檢驗(yàn)的基本原理;理解僅依靠樣本進(jìn)行決策的風(fēng)險(xiǎn);能運(yùn)用假設(shè)檢驗(yàn)解決各種實(shí)際問(wèn)題;掌握用

p值方法進(jìn)行假設(shè)檢驗(yàn)。10.1概述10.1.1假設(shè)檢驗(yàn)在經(jīng)濟(jì)管理活動(dòng)中,人們需要對(duì)各種各樣的現(xiàn)象進(jìn)行判斷,以期做出正確的決策。但是,人們所面對(duì)的是往往是隨機(jī)現(xiàn)象,并且所掌握和信息也是有限的,于是就產(chǎn)生了這樣一個(gè)問(wèn)題:怎樣利用較少的信息對(duì)總體現(xiàn)象進(jìn)行決策。下面我們通過(guò)一個(gè)例子來(lái)說(shuō)明這個(gè)問(wèn)題?!纠?/p>

10-1】全國(guó)政協(xié)委員馮丹龍建議:完善兒童用藥安全管理

3

3

日,全國(guó)政協(xié)委員、馮玉祥之孫女馮丹龍,在接受法制晚報(bào)·看法新聞?dòng)浾卟稍L時(shí)表示,今年她的建議是建立和完善兒童用藥法律法規(guī),同時(shí)加強(qiáng)對(duì)兒童藥品研發(fā)生產(chǎn)的監(jiān)管。馮丹龍認(rèn)為,兒童用藥,安全是重中之重。兒童作為一個(gè)特殊用藥群體,各器官發(fā)育未成熟,對(duì)藥品的用法用量有其特殊要求。目前,臨床上兒童用藥不當(dāng)方面均有不同程度的問(wèn)題,需要及時(shí)改進(jìn)和提高。

據(jù)《半月談》雜志報(bào)道,中國(guó)兒童用藥不良反應(yīng)發(fā)生率為

12.9%,其中新生兒高達(dá)

24.4%,分別是成人的

2

倍和

4

倍。中國(guó)醫(yī)藥工業(yè)信息中心的數(shù)據(jù)顯示,全國(guó)藥品生產(chǎn)企業(yè)有

8000多家,其中專門生產(chǎn)兒童用藥的企業(yè)僅占

0.1%。在藥品臨床實(shí)驗(yàn)注冊(cè)項(xiàng)目中,國(guó)產(chǎn)藥品注冊(cè)信息達(dá)到

16

萬(wàn)多條,其中兒童藥品僅有2000

多條。

目前,兒童給藥劑量多依據(jù)成人劑量,再通過(guò)體重?fù)Q算、體表面積換算、年齡換算等方法來(lái)確定?!皟和^非成人的‘微縮版’,具有其本身的生理特點(diǎn)。將成人藥酌減給兒童使用,缺乏科學(xué)依據(jù)和循證醫(yī)學(xué)證據(jù)?!焙幽鲜∪嗣襻t(yī)院兒科主任高麗表示。(北青網(wǎng)

2018-03-03)

生產(chǎn)兒童藥物劑量控制非常重要,劑量少了達(dá)不到治療效果,劑量大了可能出現(xiàn)不良反應(yīng)。在生產(chǎn)過(guò)程中,我們?cè)鯓优袛鄡和幬锏膭┝渴欠窈细衲兀匡@然,不可能將全部的藥物都進(jìn)行檢測(cè),我們能做的只是檢測(cè)其中的一小部分。

假設(shè)一條生產(chǎn)兒童注射液的自動(dòng)生產(chǎn)線的標(biāo)準(zhǔn)劑量是每支

12ml,由于各種偶然因素的影響,生產(chǎn)過(guò)程中罐裝劑量可能會(huì)產(chǎn)生偏差,假設(shè)允許偏差為

0.5ml。如果某一天,質(zhì)檢檢測(cè)了

36

支,得到平均值為

12.3ml,這時(shí)生產(chǎn)線工作正常嗎?解:這個(gè)問(wèn)題可以歸納為一個(gè)統(tǒng)計(jì)問(wèn)題:

生產(chǎn)線生產(chǎn)正常時(shí)標(biāo)準(zhǔn)劑量為

12ml,即總體均值

12

;允許的偏差為

0.5ml,即總體的標(biāo)準(zhǔn)差

0.5

;抽取樣本容量為

36

的樣本,得到

。這時(shí),我們能否依據(jù)這個(gè)樣本信息判斷

12

還成立嗎?

這個(gè)問(wèn)題我們有兩個(gè)選擇:

12(生產(chǎn)線工作正常)和

12(生產(chǎn)線工作不正常),在總體標(biāo)準(zhǔn)差

0.5

的條件下,抽取樣本容量為36

的樣本,已知的樣本信息是

。我們希望利用這個(gè)樣本信息來(lái)對(duì)上述兩個(gè)選擇做出決策。樣本均值是統(tǒng)計(jì)量,是隨機(jī)變量,而總體均值是參數(shù),是確定的值,我們的目的是利用統(tǒng)計(jì)量來(lái)對(duì)參數(shù)的取值做出判斷。一般地,利用樣本統(tǒng)計(jì)量對(duì)總體參數(shù)的取值做出決策的統(tǒng)計(jì)方法,稱為假設(shè)檢驗(yàn)。10.1.2.假設(shè)檢驗(yàn)的方法

一般來(lái)說(shuō),假設(shè)檢驗(yàn)可以分成四個(gè)步驟:1)建立假設(shè);2)確定檢驗(yàn)統(tǒng)計(jì)量以及分布;3)設(shè)定顯著性水平,確定臨界值和拒絕域;4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,做出決策。每個(gè)步驟的變化都會(huì)產(chǎn)生不同的假設(shè)檢驗(yàn),我們分步驟具體解釋假設(shè)檢驗(yàn)的基本概念和方法。1.假設(shè)

所謂假設(shè)就是某些對(duì)客觀事物特征的初始判斷或者說(shuō)斷言;用統(tǒng)計(jì)語(yǔ)言表達(dá)就是對(duì)總體參數(shù)的取值所作的斷言。由于這些斷言成立的理由并不充分,所以有對(duì)這些斷言進(jìn)行檢驗(yàn)的要求。

例如,在例

10-1

中,我們需要經(jīng)常監(jiān)測(cè)生產(chǎn)線的工作狀態(tài)。雖然有嚴(yán)格的標(biāo)準(zhǔn)和先進(jìn)的生產(chǎn)線,但由于生產(chǎn)過(guò)程會(huì)受到各樣偶然因素的影響,罐裝劑量可能會(huì)偏離標(biāo)準(zhǔn)劑量。在這里

12(生產(chǎn)線工作正常)就是一個(gè)假設(shè)(斷言),但是這個(gè)假設(shè)不一定成立,即可能出現(xiàn)另外一種情況:

12

(生產(chǎn)線工作不正常),如果是這種情況則需要對(duì)生產(chǎn)線的生產(chǎn)狀態(tài)進(jìn)行檢修。假設(shè)包括原假設(shè)和備擇假設(shè)。原假設(shè)記為H

0

,是研究者懷疑的、反對(duì)的,而且是要被檢驗(yàn)的假設(shè)。在例

10-1

中,H

0

:

12

就是原假設(shè),質(zhì)檢人員(研究者)之所以進(jìn)行檢測(cè),就是懷疑生產(chǎn)線工作不正常,檢測(cè)的目的就是在判斷

12

是否成立。備擇假設(shè)記為

H1

,是研究者支持的假設(shè)。在例

10-1

中,H1

:

12

就是備擇假設(shè),是質(zhì)檢人員(研究者)之所以進(jìn)行檢測(cè),就是支持

12

。原假設(shè)和備擇假設(shè)構(gòu)成完備事件組,非此既彼,不存在第三種情況。假設(shè)檢驗(yàn)的目的就是搜集證據(jù)反對(duì)(檢驗(yàn))原假設(shè),如果沒(méi)有足夠的證據(jù)拒絕原假設(shè),則只能選擇其反面—不拒絕原假設(shè)。

為了進(jìn)行假設(shè)檢驗(yàn),首要步驟就是建立假設(shè)。一般情況下先建立備擇假設(shè),這是因?yàn)閭鋼窦僭O(shè)是研究者支持的假設(shè),一般觀點(diǎn)明確,容易表達(dá)。當(dāng)備擇假設(shè)確定后,其對(duì)立事件就是原假設(shè)。【例

10-2】某果汁飲料包裝容量為

500ml/盒,灌裝過(guò)多或過(guò)少都會(huì)被認(rèn)為包裝的容量不合格。質(zhì)檢人員需要定期抽樣檢測(cè)容量,判斷灌裝生產(chǎn)線生產(chǎn)是否正常,試建立對(duì)應(yīng)的假設(shè)。解:這個(gè)問(wèn)題中質(zhì)檢人員是研究者,他支持的觀點(diǎn)是生產(chǎn)線生產(chǎn)不正常,否則他就不需要進(jìn)行檢測(cè)了。由于灌裝過(guò)多或過(guò)少都會(huì)被認(rèn)為不正常,故備擇假設(shè)為:H1

:

500,從而原假設(shè)為:H

0

:

500

。【例

10-3】某品牌汽車輪胎的生產(chǎn)商聲稱其生產(chǎn)的輪胎行駛里程不少于

80000km。

為了驗(yàn)證這個(gè)說(shuō)法,某汽車俱樂(lè)部對(duì)該品牌輪胎的行駛里程進(jìn)行抽樣調(diào)查,試建立對(duì)應(yīng)的假設(shè)。解:這個(gè)問(wèn)題中汽車俱樂(lè)部是研究者,他支持的觀點(diǎn)是該品牌輪胎的行駛里程達(dá)不到

80000km,否則他就不會(huì)進(jìn)行抽樣調(diào)查。由于他支持的觀點(diǎn)是該品牌輪胎的行駛里程達(dá)不到

80000km,故備擇假設(shè)為:

H1

:

80000

,從而原假設(shè)為:

H

0

:

80000

由上述兩個(gè)例子可以看出建立假設(shè)的一些特點(diǎn):1)假設(shè)有不同的方向性。在例

10-2

中,樣本統(tǒng)計(jì)量的值比

500

過(guò)大或過(guò)?。p側(cè)),都有一定的理由拒絕H

0

:

500

,這樣的檢驗(yàn)稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn);在例

10-3

中,樣本統(tǒng)計(jì)量的值只有比

80000過(guò)?。▎蝹?cè))才有一定理由拒絕H

0

:

80000

,這樣的檢驗(yàn)稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)。表

10-1

總體均值假設(shè)檢驗(yàn)的基本形式

設(shè)

為總體均值,

0為假設(shè)的總體均值的取值,我們可以將假設(shè)的基本形式總結(jié)如表

10-1

所示的形式。假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)

備擇假設(shè)

假設(shè)的方向性與具體的問(wèn)題有關(guān),也與研究者的地位有關(guān),因?yàn)椴煌匚坏难芯空邥?huì)有不同的觀點(diǎn)。如在例

10-2中,如果研究者換成工商管理人員,他可能更關(guān)心的是果汁生產(chǎn)廠商是否對(duì)消費(fèi)者有欺詐行為,也就是H1

:

500

,這時(shí)就有H

0

:

500

,這是一個(gè)單側(cè)檢驗(yàn)中的左側(cè)檢驗(yàn)。2)假設(shè)中所有的等號(hào)“=”設(shè)置在原假設(shè)中。包括“=”、“≤”、“≥”都設(shè)置在原假設(shè)中,這是因?yàn)榧僭O(shè)檢驗(yàn)是目的是檢驗(yàn)原假設(shè),而且在邏輯方法是反證法—先假設(shè)原假設(shè)為真,再試圖導(dǎo)出矛盾的結(jié)果,這樣就要求原假設(shè)要“明確”地包含所有要檢驗(yàn)的情況。3)上述例子中只涉及到總體均值的假設(shè),類似的可以建立總體比率、總體方差的假設(shè),同樣有雙側(cè)和單側(cè)檢驗(yàn)。2.檢驗(yàn)統(tǒng)計(jì)量

對(duì)不同的總體參數(shù)進(jìn)行檢驗(yàn),需要用到不同的樣本統(tǒng)計(jì)量。如對(duì)總體均值進(jìn)行檢驗(yàn),需要用到樣本均值;對(duì)總體比率進(jìn)行檢驗(yàn),需要用到樣本比率;對(duì)總體方差進(jìn)行檢驗(yàn),需要用到樣本方差等等。但是,樣本統(tǒng)計(jì)量并不能很好地幫助我們做出判斷,進(jìn)行參數(shù)的假設(shè)檢驗(yàn)需要構(gòu)造檢驗(yàn)統(tǒng)計(jì)量。

我們以例

10-1

來(lái)說(shuō)明。生產(chǎn)線生產(chǎn)正常時(shí)標(biāo)準(zhǔn)劑量為12ml,即總體均值

12

;允許的偏差為0.5ml,即總體的標(biāo)準(zhǔn)差

0.5

;抽取樣本容量為36

的樣本,得到

。這時(shí),我們能否依據(jù)這個(gè)樣本信息判斷

12

還成立嗎?

這個(gè)問(wèn)題要對(duì)下列假設(shè)進(jìn)行檢驗(yàn):

H

0

:

12

,

H1

:

12

顯然,樣本統(tǒng)計(jì)量

偏離總體均值

越遠(yuǎn),我們拒絕原假設(shè)的理由就越充分?,F(xiàn)在我們得到的樣本統(tǒng)計(jì)量

,這個(gè)值偏離

12

足夠遠(yuǎn)嗎?雖然絕對(duì)差異只有

0.3,但是這是

36

支的平均差異,因?yàn)檎`差有正有負(fù),可以互相抵消,0.3

可能是一個(gè)很大的差異。為此,我們要構(gòu)造檢驗(yàn)統(tǒng)計(jì)量進(jìn)行判斷。

我們先假定原假設(shè)為真,即

12

。由于樣本容量為

36(大樣本),

0.5

(總體方差已知),由中心極限定理得:(10-1)

由于

服從正態(tài)分布,在

12

為真的假定條件下,的取值偏離

12

足夠遠(yuǎn)的概率是非常小的,所以我們可以用概率來(lái)表示

偏離

12

的程度。設(shè)

的取值偏離

12

足夠遠(yuǎn)的概率為

,在雙側(cè)檢驗(yàn)中

相對(duì)于

12

的偏離可以是正偏離,也可以負(fù)偏離,所以

被平分在兩側(cè),單側(cè)面積為

,如圖

10-1

所示。于是我們就可以有一個(gè)直觀的判斷:如果

的值落入圖

10-1

中的陰影部分區(qū)域,

的值就偏離

12

足夠遠(yuǎn),就有足夠的理由拒絕原假設(shè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論