版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
第
9
章
參數(shù)估計【學習目標】理解參數(shù)估計的基本問題,理解置信水平、置信區(qū)間、抽樣極限誤差等概念;理解參數(shù)估計的基本原理;掌握參數(shù)區(qū)間估計的方法;掌握確定樣本容量的基本方法。9.1概述9.1.1參數(shù)估計的一般問題1.參數(shù)估計的概念高德地圖發(fā)布《2018
年度中國主要城市交通分析報告》央廣網(wǎng)2019-01-16近日,高德地圖聯(lián)合中國社會科學院社會學研究所、未來交通與城市計算聯(lián)合實驗室、阿里云等單位共同發(fā)布了《2018
年度中國主要城市交通分析報告》(以下簡稱“《報告》”)。
《報告》顯示,基于路網(wǎng)行程延時指數(shù)對監(jiān)測的
50
個城市進行對比分析,發(fā)現(xiàn)
2018
年是四年來路網(wǎng)高峰行程延時指數(shù)最低的一年,同比
2017
年全國近
90%城市擁堵下降或持平。而通過該指數(shù)排名的中國堵城排行榜中,北京位列第一,廣州位列第二,上海位列第八。但即便位列第八的上海,其工作日平均通勤時長(雙程)也達
85.27分鐘,也就是說,假如一個上海人要上35
年班,他一生花在通勤上的時間為
11869
小時,這其中有
5443
小時是因為擁堵導致的。
值得注意的是,北京本年度雖然被評為“首堵”,但北京的全天公交巡航速度(公交車輛在站點之間巡航速度的平均值)最高,達到
23.14km/h。其余高的城市還有紹興、東莞、蘇州、濟南、廈門、揚州、石家莊、上海等。而全天公交巡航速度較低的城市包括太原、烏魯木齊、沈陽等,其中太原僅為13.98km/h。高德地圖雖然掌握著眾多數(shù)據(jù),但它并不能知道北京的每一臺公交車的巡航速度,《報告》中所說的北京公交的巡航速度為23.14km/h
只是部分北京公交的巡航速度,這是一個樣本結(jié)果,而不是總體的結(jié)果。在實際活動中,人們總是用樣本的數(shù)量特征去估計總體的數(shù)量特征,這種方法就是參數(shù)估計。所謂參數(shù)估計就是用樣本的數(shù)量特征(統(tǒng)計量)對總體的數(shù)量特征(參數(shù))進行估計的統(tǒng)計方法。在現(xiàn)實現(xiàn)象中,參數(shù)往往是未知的,比如北京公交的巡航速度。我們可以用抽樣的方法,用樣本統(tǒng)計量對總體參數(shù)進行估計。常用的參數(shù)有總體均值
、總體比率
、總體方差
2
,我們將參數(shù)抽象地記為
。2.估計量與估計值
用來估計總體參數(shù)的統(tǒng)計量的名稱,稱為估計量。例如:樣本平均數(shù)
X、樣本比率
p
、樣本方差
s
2
都是估計量,我們將估計量抽象地記為
。由樣本數(shù)據(jù)計算得到的對應估計量的數(shù)值稱為估計值。例如:為了估計北京公交的巡航速度,我們抽取由
100
輛運營的北京公交車作為樣本,記錄它們?nèi)斓难埠剿俣龋缓笥嬎闫骄禐?/p>
23.14km/h,這個數(shù)值就是一個估計值。3.點估計與區(qū)間估計
參數(shù)估計有點估計和區(qū)間估計兩種。
用估計量
的值作為參數(shù)
的估計值,稱為參數(shù)的點估計。例如:經(jīng)過抽樣并計算出北京公交的巡航速度為
23.14km/h,即
=23.14。如果我們用這個估計值作為總體均值,即
23.14
,這就是點估計。點估計在方法上比較簡便,在理論上也有可靠的依據(jù),但是卻不能表述出點估計值與參數(shù)的真實值接近的程度(估計的誤差)以及對應估計的可靠程度(概率度)。
在點估計的基礎上,給出參數(shù)估計的一個范圍,稱為區(qū)間估計。例如:北京公交的巡航速度的點估計值為
23.14km/h,即
=23.14,可以認為北京公交的巡航速度在
23.14
左右,我們在一定可靠程度的保證下給出一個范圍。區(qū)間估計是參數(shù)估計的重要方法,在后面的內(nèi)容里我們將做詳細的討論。9.1.2
參數(shù)估計的理論依據(jù)和基本問題1.大數(shù)定律在第
8
章中我們對大數(shù)定律做了描述,它為我們進行參數(shù)估計提供了理論基礎。例如:設北京公交巡航速度的平均用時為
,是一個未知的參數(shù),我們對這一現(xiàn)象進行多次觀察―即抽樣(抽取
100輛運營公交車)并測量樣本中的每一輛公交車的巡航速度,記為X
1
,
X
2
,......X
n
。由大數(shù)定律,當
n
(
樣本容量)足夠大時,有這個結(jié)論為我們用樣本平均數(shù)
對總體均值
進行估計提供了理論基礎。同理,我們可以用樣本比率
p
對總體比率
進行估計,用樣本方差
s
2
對總體方差
2
進行估計。2.中心極限定理
以樣本平均數(shù)為例,在重復抽樣、大樣本、總體方差已知的條件下,我們有:
,其分布圖如圖9-1。由概率論知識,樣本平均數(shù)
落在總體均值μ的兩側(cè)各為一個標準誤差(抽樣平均誤差)范圍內(nèi)概率為0.9545;落在三個標準誤差范圍內(nèi)的概率為0.9973。
圖
9-1的抽樣分布X
的分布
由圖
9-1
可以看出,如果我們要求樣本平均數(shù)
離
越近(估計的誤差?。瑢目赡苄砸簿褪歉怕试叫?,即可靠程度越低;要求樣本平均數(shù)
離
越遠(估計的誤差大),對應的可能性也就是概率也越大,即可靠程度越高。這說明,估計的誤差會受到兩個因素的影響:一是抽樣平均誤差(標準誤差);另一個是我們要求的可靠程度。這些結(jié)論為我們描述估計的誤差提供了依據(jù)。3.風險水平與置信水平
由上段的分析,可以理解估計的誤差與可靠程度的關系。仍以樣本平均數(shù)
為例,設在估計時發(fā)生錯誤的概率為
,因為我們希望犯錯誤的可能性要盡量地小,所以我們設定的
很小,一般為5%或更小。
稱為風險水平,其意義是指這樣的事件發(fā)生的概率:“遠離”了
,或者說
與
的差距超過了允許的范圍,即
落入到了如圖
9-2
所示陰影的范圍內(nèi)。由于
的抽樣分布是正態(tài)分布,所以
被平分在兩側(cè)。
B圖
9-2風險水平與置信水平的分布
2
2A
區(qū)間(A,B)對應的概率為1
,我們稱為置信水平。其意義是指我們相信在所有的
中,有(1
)的
與
的差距沒有超過允許的范圍。4.抽樣極限誤差
我們將在參數(shù)估計中研究者所允許的誤差稱為抽樣極限誤差,也稱為邊際誤差,記為
。如何度量
呢?仍然以
為例,從圖
9-2
可以看出,這個允許的范圍就是區(qū)間(A,B)的半徑,而這個半徑的長短是由
的抽樣分布和風險水平
決定的。在
的抽樣分布確定的條件下,
的值越大,區(qū)間(A,B)就越窄,估計的誤差越??;
的值越小,區(qū)間(A,B)就越寬,估計的誤差越大。
雖然的抽樣分布是正態(tài)分布,但由于μ未知,故A、B兩點的坐標
、也未知,也就無法求出抽樣極限誤差
x
。
為了度量,對做標準變換,則
,如圖9-3所示。圖
9-3
標準正態(tài)分布(9-1)
當風險水平為
α時,則對應的臨界值是,經(jīng)過標準變換,原來正態(tài)分布的μ點坐標變換到標準正態(tài)分布的0,原來正態(tài)分布的B點坐標()變換到標準正態(tài)分布的,這時有則有:
當總體方差未知時,則用s
2
代替
2
,這時
,同樣有抽樣極限誤差為:
(9-2)同理,可以得到關于樣本比率
p
的抽樣極限誤差:(9-3)當
未知時可用
p
代替。5.參數(shù)估計的標準1)無偏性
如果估計量抽樣分布的數(shù)學期望等于被估計的總體參數(shù),即E()=,則稱這個估計量是無偏的,其意義如圖
9-4a
所示。2)有效性
如果一個參數(shù)有兩個估計量,則其中方差較小的估計量是有效的,即如果
,則
是較
有效的估計量,其意義是計量
較估計量
更密集地集中在
的附近,這樣隨機抽取一個,就要比隨機抽取一個離近的可能性要大。如圖9-4b所示。a)無偏性b)有效性3)一致性如果隨著樣本容量的增大,估計量與參數(shù)之間的差距變小,則稱這個估計量是一致的。其意義是隨著樣本容量的增大,抽樣分布的方差會變小,其意義如圖9-5
所示。圖
9-5 一致性可以證明,樣本平均數(shù)
、樣本比率
p
、樣本方差
s
2
分別是總體均值
、總體比率
、總體方差
2
的無偏、有效、一致的估計量。9.2一個總體參數(shù)的區(qū)間估計我們進行抽樣的目的之一就是要用統(tǒng)計量對參數(shù)進行估計。在實際的社會經(jīng)濟現(xiàn)象中,總體參數(shù)一般都是未知的,是需要我們進行估計的,而估計量是可以通過計算某個樣本數(shù)據(jù)得到估計值的。仍然以樣本平均數(shù)
為例,由上節(jié)的分析,我們可以知道
落在以
為中心的一定范圍內(nèi)的概率是多少,由于
與
的距離是對稱的,所以
也以相同的概率被包含在以
為中心的區(qū)間內(nèi),利用這個原理,可以對
進行區(qū)間估計。9.2.1
總體均值的區(qū)間估計1.大樣本情形1)總體方差已知
由中心極限定理,當總體方差已知、大樣本時,有
。假設風險水平為α,則置信水平為1-α,由某個樣本得到的估計值為,如圖9-6所示。圖
9-6
的區(qū)間估計
其中區(qū)間(C,D)是由(A,B)平移得到的,AB的中點是
,CD
的中點是
。如果
落在區(qū)間(A,B)中(概率為1
),則區(qū)間(C,D)也將包含
,概率也為1
。所以,區(qū)間(C,D)稱為
的置信水平為1
的置信區(qū)間,C
點稱為置信區(qū)間的下限,D
點稱為置信區(qū)間的上限。由公式(9-1),C點的橫坐標是,D點的橫坐標是
,所以μ的1-α的置信區(qū)間是:(
,
)
(9-4)
由以上分析顯然有:
對μ的置信區(qū)間的理解要注意以下幾個問題:一是區(qū)間(C,D)是由某一個樣本平均數(shù)確定的,而是隨機的,所以區(qū)間(C,D)也是隨機的,我們得到的這個區(qū)間是用這種方法構(gòu)造的成千上萬個這樣的區(qū)間中特定的一個。二是對置信水平的理解。假設風險水平α=5%,則置信水平1-α=95%,其含義是:假如按照構(gòu)造置信區(qū)間的方法構(gòu)造的這樣的區(qū)間有10000個,則其中有95%即9500個區(qū)間包含總體均值μ的真值,我們有95%把握相信,由某一個樣本平均數(shù)構(gòu)造的區(qū)間是包含總體均值μ的真值的9500個區(qū)間中的一個。
這些解釋可以用圖9-7來描述。圖
9-7
參數(shù)的區(qū)間估計
【例
9-1】北青網(wǎng)
2018-04-17
大學生對手機形成依賴,日均使用時間超過
5.2
小時,手機已經(jīng)是我們生活中難以缺少的一部分了,可以毫不夸張的說,有些人離開了手機啥也干不了!就像對手機有癮一樣,的確手機對我們來說也是越來越重要了,平常的買東西都需要手機,就連小編都好久沒有觸摸現(xiàn)金了!大學生用起手機來更加恐怖,日均使用
5.2
個小時。麥可思研究院發(fā)布的一份中國在校大學生手機使用調(diào)查報告顯示,超八成大學生存在“手機依賴”,日均使用手機的時間超
5
小時,18
點以后是大學生使用手機的高峰期。此外,79%的大學生在課堂上使用手機。假設麥可思研究院在各地區(qū)抽取了
100
名在校大學生,記錄下他們在某一工作日使用手機的時間,并計算得到平均值為
5
小時。如果總體標準差為
1.5
小時,置信水平為
95%。(1)在校大學平均使用手機時間的點估計值是多少?(2)計算抽樣極限誤差;(3)對在校大學平均使用手機的時間做區(qū)間估計。解:已知:n=100,=5,α=5%,1-α=95%,查表得(1)在校大學生平均使用手機時間的點估計值為5個小時。(2)由式(9-1)得(3) 由式(9-4)得:
在校大學生平均使用手機時間95%的置信區(qū)間為(4.706,5.294).2)總體方差未知
當總體方差未知時,則
服從自由度為
n-1
的
t
分布,置信水平為1-α的置信區(qū)間為:(,)(9-6)
同理有:(9-7)
【例
9-2】2018-08-14
新浪科技
2018
年全球網(wǎng)速排名:中國大陸排名第
141
北京時間
8
月
13
日下午消息,M-Lab
近期發(fā)布了全球?qū)拵ЬW(wǎng)速排名榜。榜單收集了從
2017
年
6
月到
2018
年
5
月
29
日
12
個月時間內(nèi)的網(wǎng)速數(shù)據(jù),共有
200
個國家和地區(qū)上榜,測速次數(shù)超過
1.63億次。排行榜顯示,全球?qū)拵俣扰旁诘谝晃坏氖切录悠拢骄螺d速度達到了60.39Mbps,排在第二位的是瑞典,其寬帶平均下載速度為
46Mbps,這兩個國家的排名和去年一樣。排在第三至六位的分別是丹麥、挪威、羅馬尼亞以及比利時。數(shù)據(jù)顯示,中國大陸排在第141
位,
寬帶平均下載速度是2.38Mbps,雖然這一速度相對去年的
1.55Mbps
有所提升,但在今年的總排名中,中國大陸的排名還是下降了
7
位。此外,中國香港的網(wǎng)速全球排名
19
位,每秒是
26.45Mbit。中國臺灣的網(wǎng)速全球排名第
14
位,達到了
28.09Mbps,不過相比去年排名下降了
11
位。
M-Lab
是一家旨在測量全球網(wǎng)絡狀況的組織,由新美國基金會(New
America
Foundation)旗下的開放技術研究所(Open
Technology
Institute)、谷歌開源研究中心(Google
Open
SourceResearch)、普林斯頓大學的
PlanetLab
及其它支持機構(gòu)發(fā)起成立。假設在中國大陸不同地區(qū)抽取
49家網(wǎng)絡運營商進行調(diào)查,測得互聯(lián)網(wǎng)連接速度數(shù)據(jù)(數(shù)據(jù)見
Data9-1)。根據(jù)這些數(shù)據(jù),對中國大陸平均網(wǎng)速做點估計和
95%置信水平的區(qū)間估計。解:由Excel計算得=2.45,s=0.60,且n=49,1-α=95%。查表得=2.01。(1)中國大陸平均網(wǎng)速的點估計值為2.43Mbps。
(2)中國大陸平均網(wǎng)速的區(qū)間估計:由式(9-6)得:中國大陸平均網(wǎng)速95%的置信區(qū)間為(2.28,2.62)2.小樣本情形由于小樣本有更大的偶然性,在這種條件下則要求總體服從正態(tài)分布,以降低估計的風險。1)總體服從正態(tài)分布、方差已知在這個條件下,
的置信區(qū)間構(gòu)造方法同公式(9-4)。【例
9-3】某銀行為了估計一臺自動取款機(ATM
機)的日平均取款額,連續(xù)抽取了
25
天該自動取款機的取款額,計算得平均取款額為7.2
萬元。假設總體服從正態(tài)分布,標準差為
1
萬元,求該自動取款機置信水平為
95%的日平均取款額置信區(qū)間。解:
已知 n
=
25,
=
7.2
,
=
1
,
1
=
95%
,查表得則由式(9-4)有:該自動取款機置信水平為
95%的日平均取款額置信區(qū)間為(6.808,7.592)。2)總體服從正態(tài)分布、方差未知
在這個條件下,
的置信區(qū)間構(gòu)造方法同公式(9-6)。
【例
9-4】隨著社會的進步和經(jīng)濟的發(fā)展,電已經(jīng)成為人們不可或缺的生產(chǎn)必須品。為了保障電力供應,國家電網(wǎng)公司向社會公布了供電服務“十項承諾",其中第二項承諾為:提供
24
小時電力故障報修服務,供電搶修人員到達現(xiàn)場的時間一般不超過:城區(qū)范圍45
分鐘;農(nóng)村地區(qū)
90
分鐘;特殊邊遠地區(qū)
2
小時。
為了核實某市電網(wǎng)公司落實供電服務“十項承諾"的情況,在該市的電力故障報修服務記錄中抽取到
25
條城區(qū)范圍報修服務記錄作為樣本,統(tǒng)計出供電搶修人員到達現(xiàn)場的時間的數(shù)據(jù)(數(shù)據(jù)見Data9-2)。(1)該市供電搶修人員到達現(xiàn)場的平均時間的點估計是多少?(2)假設總體服從正態(tài)分布,構(gòu)造該市供電搶修人員到達現(xiàn)場的平均時間的
95%的置信區(qū)間。解:由樣本數(shù)據(jù)計算得:=30.44,s=4.93,n=25,1-α=95%,查表得(1)供電搶修人員到達現(xiàn)場的平均時間的點估計值為30.44分鐘。供電搶修人員到達現(xiàn)場的平均時間
95%的置信區(qū)間為(28.40,32.48)。(2)由公式(9-6)有:9.2.2
總體比率的區(qū)間估計
由中心極限定理,當大樣本、重復抽樣時,樣本比率的抽樣分布是正態(tài)分布,其抽樣極限誤差如公式(9-3)所示。所以總體比率1
的置信區(qū)間是:()(9-8)當
未知時可用
p
代替。大樣本的標準是使n
5
和n(1
)
5
同時成立時的n,或者按表8-5
的經(jīng)驗值進行判斷。
【例9-5】中國廣視索福瑞媒介研究(CSM)是央視市場研究(CTR)與
Kantar
Media
集團等共同建立的中外合作企業(yè),致力于專業(yè)的電視收視和廣播收聽市場研究,為中國大陸地區(qū)和香港傳媒行業(yè)提供可靠的、不間斷的視聽調(diào)查服務。CSM
擁有龐大的廣播電視受眾調(diào)查網(wǎng)絡,覆蓋
5.78
萬余戶樣本家庭;其電視收視率調(diào)查網(wǎng)絡所提供的數(shù)據(jù)可推及中國內(nèi)地超過12.8億和香港地區(qū)
655
萬的電視人口;其廣播收聽率調(diào)查的數(shù)據(jù)則可推及中國超過
1.2
億的廣播人口。
假設
CSM
為了推斷某一檔電視節(jié)目的收視率,在這檔電視節(jié)目播出期間,抽取了
1000
戶家庭進行調(diào)查,得到收看這檔電視節(jié)目的家庭比率為
4%。依據(jù)這些數(shù)據(jù)求:(1)這檔電視節(jié)目平均收視率置信水平為
95%的抽樣極限誤差為多少?(2)這檔電視節(jié)目平均收視率置信水平為
95%的置信區(qū)間為多少?解:已知n=1000,p=4%,1-α=95%,查表得
,顯然,這是一個大樣本,故可以正態(tài)分布進行估計。(1)抽樣極限誤差為:這檔電視節(jié)目平均收視率置信水平為
95%的置信區(qū)間為(2.8%,5.2%)。(2)由式(9-8)有:9.2.3
總體方差的區(qū)間估計
由第8
章的內(nèi)容知,樣本方差的抽樣分布服從卡方分布,由(8-15)式有:
。假設置信水平為1
,則如圖
9-8
所示:
/
2
/
2圖9-8卡方分布圖對總體方差做區(qū)間估計就是要使成立。整理得:
(9-9)
這就是構(gòu)造總體方差
2
的置信區(qū)間的方法。【例
9-6】“愛情就像公交,苦苦等待卻怎么也等不到;愛情就像公交,有時候就差一點卻眼睜睜看著它遠去;愛情就像公交,以為自己追上了卻發(fā)現(xiàn)怎么也擠不上。”這是網(wǎng)上流行的一個段子,它從一個側(cè)面反映了人們對長時間等待公交車的一種無奈。由于各種各樣的原因,雖然發(fā)車時間隔的時間相同,但是同一路公交車到達某一站的時間間隔會有比較大的差異。為了評估某城城市等待公交車的情況,選擇了其中一路公交車在某一時段時行調(diào)查,連續(xù)記錄了
25
輛公交車到達某站的時間間隔,經(jīng)計算時間間隔的方差為
16
分鐘,試以置信水平為
95%對總體方差做區(qū)間估計。
解:已知:n=25,s2=16,1-α=95%,查表得:,
。則總體方差95%的置信區(qū)間為(9.76,30.96)。9.3兩個總體參數(shù)的區(qū)間估計很多時候我們需要在兩個總體之間進行比較。例如:比較兩個地區(qū)的平均勞動報酬,就需要在兩個地區(qū)分別抽取樣本,再用樣本的平均數(shù)做出估計。為此先要建立一個基本概念--獨立樣本與匹配樣本。9.3.1
獨立樣本與匹配樣本當我們要在兩個總體參數(shù)之間進行比較時,就要在兩個總體中分別抽取樣本,然后進行比較。而在兩個總體中抽取樣本,可以有兩種抽取方法:一種是兩個樣本的抽取互相之間沒有影響,這時我們稱這樣抽取的兩個樣本是獨立樣本;另一種是兩個樣本的抽取互相之間有影響,這時我們稱這樣抽取的兩個樣本是匹配樣本。例如,為了研究駕駛員佩戴墨鏡是否會降低反應速度,需要在佩戴墨鏡和不佩戴墨鏡兩個總體中抽取樣本,然后進行比較。如果抽取若干名駕駛員,讓他們佩戴墨鏡測試反應速度(一個樣本),然后再不加限制條件再抽取若干名駕駛員,讓他們不佩戴墨鏡測試速度(另一個樣本),這樣得到的兩個樣本是獨立樣本。但是,這樣的兩個樣本結(jié)果可能缺少可比性,因為不同的人其反應速度是有差異的,為了增強可比性,我們可以抽取若干名駕駛員,讓他們佩戴墨鏡測試反應速度(一個樣本),然后再讓這些駕駛員不佩戴墨鏡測試速度(另一個樣本),這樣得到的兩個樣本是匹配樣本。9.3.2
兩個總體均值之差的區(qū)間估計1.大樣本情形1)兩個總體的方差已知在這個條件下,由中心極限定理知兩個樣本平均數(shù)
X
1
,
X
2
分別服從正態(tài)分布。即:,
由正態(tài)分布再生定理知,其中分別表示兩個總體的均值,
分別表示兩個總體的方差,分別表示兩個樣本容量。
設置信水平為1-α,則抽樣極限誤差為:
(9-10)
兩個總體均值之差的置信區(qū)間為:(,)
(9-11)2)兩個總體方差未知但相等
設
,分別表示兩個樣本的方差,置信水平為1
,則由概率論知識可以證明:
(9-12)
其中:(9-13)稱為聯(lián)合方差估計。
兩個總體均值之差
1
2
的置信區(qū)間為:(,)(9-14)3)兩個總體方差未知且不相等此時,估計量由公式(9-15)中的
t分布近似,但其自由度
df
由公式(9-16)決定:(9-15)(9-16)[x]表示不超過
x
的最大整數(shù)。此時,兩個總體均值之差
1
2
的置信區(qū)間為:(
,)
(9-17)
注意此時的自由度是由公式(9-16)決定的?!纠?/p>
9-7】本周一(6
月
25
日),美世Mercer
公布了
2018
年全球城市生活成本排名
排在今年全球前十的中國城市,除了再次登頂?shù)南愀郏€有第
7
的上海和第
9
的北京。加上同樣位列TOP10
的東京、首爾、新加坡……連美世官方都不得不感嘆,亞洲城市前
10
占
6,住不起也惹不起??!而在北上港之外,高居全球前
50
的中國城市還有深圳(12)、廣州(15)、南京(25)、臺北(27)、天津(29)、成都(31)、青島(36)和沈陽(38)。
據(jù)BBC
News
以及美世官網(wǎng)介紹,這項排名今年已經(jīng)是連續(xù)第
24
年發(fā)布,具有相當高的聲譽和可信度。它以紐約、美元作為測算基礎,對全球范圍內(nèi)超過
375
個城市進行數(shù)據(jù)收集和對比,所涵蓋的分項包括房價、交通費、餐飲開銷、服裝配飾、娛樂休閑等
200
多個。(搜狐網(wǎng)
2018-07-01)
如果假設兩個城市生活成本的總體方差相等,則:(1)兩個總體均值之差的點估計為多少?(2)兩個總體均值之差的
95%的置信區(qū)間為多少?(3)你認為這兩座城市的生活成本有顯著差異嗎?為了比較不同城市的生活成本,分別在沈陽和成都抽取了兩個獨立樣本,調(diào)查數(shù)據(jù)如下:樣本1:成都=2100元=200=85樣本2:沈陽=1900元=160=100
解:(1)因為=2100-1900=200,所以兩個總體均值之差的點估計為200。(2)由公式(9-13)得:則
:
由Excel得
兩個總體均值之差的
95%的置信區(qū)間為(145.9,254.1)。(3)由于置信區(qū)間不包含
0,所以這兩座城市的生活成本有顯著的差異。2.小樣本情形
當樣本是小樣本時,則要求兩個總體均服從正態(tài)分布。此時,也可以分別討論兩個總體方差已知、兩個總體方差未知但相等、兩個總體方差未知且不相等三種情況,其結(jié)論與大樣本時相同,置信區(qū)間分別可由公式(9-11)、(9-14)和(9-17)給出?!纠?/p>
9-8】北京澳德物流有限責任公司是一家主要經(jīng)營國內(nèi)食品冷鏈運輸業(yè)務的第三方物流運輸企業(yè),成立于
2006
年
,是一家致力于優(yōu)化冷鏈食品及生鮮電商供應鏈鏈路、降低運營成本、提高運營時效品質(zhì)的冷鏈物流公司。該公司常年給一家企業(yè)提供第三方物流服務,需要在每天的同一時間將貨物從甲地送往乙地,送貨有兩條線路,雖然路程基本相,但車流量卻不同。為了比較兩條線路所需要的時間,物流公司隨機抽取了兩個獨立樣本,記錄下送貨所需的時間,兩個樣本整理后的結(jié)果如下。假設兩條線路所需時間的總體服從正態(tài)分布且方差相等,求兩條線路均值之差的95%的置信區(qū)間。樣本1:線路A
=46分鐘=5分鐘=24樣本2:線路B=42分鐘=3分鐘=18解:由公式(9-13)得:則=4.27查表得:兩條線路均值之差的
95%的置信區(qū)間為(1.3,6.7)。由于這個置信區(qū)間不包含
0,所以兩條線路所需時間存在顯著差異。9.3.3
兩個總體比率之差的區(qū)間估計兩個總體比率之差的區(qū)間估計,
要求是大樣本,即:n1
1
5及n1(1
1)
5
、n2
2
5及n2
(1
2
)
5
都成立,或者按表
8-5
的經(jīng)驗值進行判斷。此時,兩個樣本比率之差的抽樣分布是:
(9-18)兩個總體比率之差
1
2
的置信區(qū)間為:(,)
(9-19)當
1
,
2
未知時,用
p1
,
p2
代替。(9-18)設置信水平為1
,則抽樣極限誤差為:【例
9-9】
7
月
11
日,中國汽車技術研究中心聯(lián)合全球道路安全合作伙伴、世界衛(wèi)生組織、中國婦女發(fā)展基金會、標準所、中汽認證中心有限公司、上海疾控中心、國家轎車質(zhì)量監(jiān)督檢驗中心等機構(gòu)專家在津發(fā)布
2018
版中英文《中國兒童道路交通安全藍皮書》。
《中國兒童交通安全藍皮書
2018》調(diào)查顯示,在
2017
年開展的兒童道路交通安全調(diào)研收集的
4218
份有效問卷中,每三個家庭中就有一個家庭未配備并正確使用兒童安全座椅。
目前,美國、日本、英國、瑞典、加拿大、新西蘭等超過
50
個國家和地區(qū)已經(jīng)出臺了兒童乘車的相關法規(guī),強制規(guī)定兒童乘車必需使用汽車安全座椅,同時也有相應的法規(guī)及生產(chǎn)和檢測標準。國內(nèi),上海、杭州、南京、武漢、大連、濟南等也對兒童乘車有了硬性規(guī)定。(搜狐汽車2018-07-12)假設此次調(diào)查分別在上海和武漢分別抽取了
800
個和
600
個家庭,上海家庭使用兒童安全座椅的比率為
26%,而武漢為
20%。試以
95%的置信水平估計兩地家庭使用兒童安全座椅比率差異的置信區(qū)間。解:已知
p1
=26%,
p2
=20%,
n1
=800,
n2
=600,
1
=95%,查表得:
=1.96兩地家庭使用兒童安全座椅差異的置信區(qū)間
95%
的置信區(qū)間為(1.586%,10.414%),由于置信區(qū)間中不包含
0,說明兩地家庭使用兒童安全座椅的比率有顯著差異。9.3.4
兩個總體方差之比的區(qū)間估計
由第
8
章的公式(8-21)有:
整理得:
設置信水平為1
,則有:,
如圖
9-9
所示。圖9-9方差之比置信區(qū)間示意圖
/2
/2取倒數(shù)得:
,則有:(9-20)【例
9-10】從兩條自動瓶裝生產(chǎn)線上抽樣兩個獨立樣本,以檢測其工作得穩(wěn)定性。樣本數(shù)據(jù)如下:樣本1=25,=9;樣本2=16,=3。以置信水平為95%估計兩條自動瓶裝生產(chǎn)線方差之比得置信區(qū)間。由公式(9-18)有:
兩條自動瓶裝生產(chǎn)線方差之比的
95%的置信區(qū)間為(1.1,7.3)。由于置信區(qū)間不包括
1,所以兩條自動生產(chǎn)線的穩(wěn)定性有顯著差異,樣本方差小的生產(chǎn)線穩(wěn)定性高。解:已知=25,=9,=16,=3,1-α=95%。查表得:=2.70,則:
≈0.419.3.5
匹配樣本的區(qū)間估計關于兩個總體參數(shù)的對比,有時需要匹配樣本。例如,兩個地區(qū)由于收入、地價、房租不同,相同的商品的價格可能會有不同。如果要比較兩個地區(qū)的物價,必須針對相同的商品來比較價格,這樣,應該抽取匹配樣本。抽取匹配樣本時,兩個樣本之間是關聯(lián)的,所以其抽樣分布略有不同。匹配樣本的數(shù)據(jù)如下:表9-1匹配樣本的數(shù)據(jù)結(jié)構(gòu)序號樣本
1
的數(shù)據(jù)
樣本
2
的數(shù)據(jù)
兩個樣本的差值d
X1
X
21X11X
21d12X12X
22d2……………………nX
1nX
2ndn可以證明當d
服從正態(tài)分布時,有以下結(jié)論:(9-21)其中
--
d
的均值
sd
--
d
的樣本方差則抽樣極限誤差為:則d
的(1
)的置信區(qū)間為:(,)(9-23)(9-22)【例
9-11】人們相信即便在同一城市由于區(qū)域不同,從而地價不同,中心城區(qū)的商品價格要高于郊區(qū)。為了證實這個推測,調(diào)查人員分別在中心城區(qū)和郊區(qū)抽取了相同的商品,記錄下其價格(數(shù)據(jù)見Data9-3)。根據(jù)這些數(shù)據(jù)判斷中心城區(qū)和郊區(qū)的商品價格有無顯著差異(取
0.05)
。解:由數(shù)據(jù)資料得:n=49,
=1.17,
sd=1.5
查表得
由公式(9-21)得:
中心城區(qū)和郊區(qū)的商品價格置信水平為
95%的置信區(qū)間為(0.74,1.60)。9.4樣本容量的確定我們知道,大樣本要比小樣本有更好的統(tǒng)計學性質(zhì),在其他條件不變的情況下,隨著樣本容量的增大,估計的誤差(抽樣極限誤差)會減小
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 達亮電子安全培訓課件
- 辰鑫安全培訓服務課件
- 生產(chǎn)企業(yè)垃圾場封閉建設方案
- 車險公司柜面培訓課件
- 2025年安全隱患整治月活動總結(jié)例文(2篇)
- 河北事業(yè)單位技師考試(行政辦事員)試題
- 車間防汛安全教育培訓課件
- 車間職工崗位培訓課件
- 酒店客房衛(wèi)生管理標準制度
- 2025年老年護理專科護士醫(yī)養(yǎng)結(jié)合模式實踐工作總結(jié)(3篇)
- 2025至2030年中國高效高速混合機數(shù)據(jù)監(jiān)測研究報告
- 2025年保密觀考試題庫+答案
- 表土剝離方案施工記錄(3篇)
- 小學生數(shù)學課堂紀律課件
- 2025-2030中國椎間孔鏡市場前景動態(tài)及應用需求現(xiàn)狀分析報告
- 評估機構(gòu)安全管理制度
- 杭州民樂團管理制度
- 寺廟信息服務管理制度
- 交通運輸信息化標準體系
- 財務合規(guī)審查實施方案計劃
- 阿里巴巴管理三板斧
評論
0/150
提交評論