版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
什么是抽樣估計(jì)?
ThepurposeofStatisticsinferenceistoobtaininformationaboutapopulationfrominformationcontainedinsample.
例1
一汽車輪胎制造商生產(chǎn)一種被認(rèn)為壽命更長(zhǎng)的新型輪胎。120個(gè)樣本測(cè)試平均里程:36,500公里推斷新輪胎平均壽命:36,500公里400個(gè)樣本支持人數(shù):160推斷支持該候選人的選民占全部選民的比例:160/400=40%例2:某黨派想支持某一候選人參選美國(guó)某州議員,為了決定是否支持該候選人,該黨派領(lǐng)導(dǎo)需要估計(jì)支持該候選人的民眾占全部登記投票人總數(shù)的比例。由于時(shí)間及財(cái)力的限制:抽樣估計(jì)方法主要用在下列兩種情況
注意:
●抽樣估計(jì)只得到對(duì)總體特征的近似測(cè)度,因此,抽樣估計(jì)還必須同時(shí)考察所得結(jié)果的“可能范圍”
與“可靠程度”。
1、對(duì)所考查的總體不可能進(jìn)行全部測(cè)度;
2、從理論上說(shuō)可以對(duì)所考查的總體進(jìn)行全部測(cè)度,但實(shí)踐上由于人力、財(cái)力、時(shí)間等方面的原因,無(wú)法(不劃算)進(jìn)行全部測(cè)度。第一節(jié)抽樣與抽樣分布一、有關(guān)抽樣的基本概念二、抽樣分布一、有關(guān)抽樣的基本概念(一)總體、總體參數(shù)及總體分布總體(Population):它是指所要認(rèn)識(shí)的,具有某種共同性質(zhì)的許多單位的集合體,也就是研究對(duì)象的全體。總體單位數(shù)一般用“N”表示。例1:某大公司人事部經(jīng)理整理其2500個(gè)中層干部的檔案。其中一項(xiàng)內(nèi)容是考察這些中層干部的平均年薪及參加過(guò)公司培訓(xùn)計(jì)劃的比例。總體:2500名中層干部(population),每個(gè)中層干部是總體的個(gè)體單位。N-=2500如果同時(shí)有1500人參加了公司培訓(xùn),則可從例1每個(gè)人的檔案資料中計(jì)算如下的總體參數(shù):
總體均值(populationmean):
=51800
總體標(biāo)準(zhǔn)差(Populationstandarddeviation)
=4000
總體比例P:P=1500/2500=0.60=60%
參數(shù)是總體的數(shù)值特征
Aparameterisanumericalcharacteristicofapopulation?!癯闃庸烙?jì)就是要通過(guò)樣本而非總體來(lái)估計(jì)總體參數(shù)??傮w中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布
總體分布(populationdistribution)總體樣本(Sample):從總體中所抽取的部分個(gè)體,樣本容量(Samplesize)即樣本單位數(shù)一般用“n”表示。樣本統(tǒng)計(jì)量(Samplestatistic):根據(jù)樣本各單位標(biāo)志值或標(biāo)志屬性計(jì)算的,反映樣本數(shù)量特征的綜合指標(biāo)。
(二)樣本、樣本統(tǒng)計(jì)量和樣本個(gè)數(shù)
在例1中,假如隨機(jī)抽取了一個(gè)容量為30的樣本:
AnnualSalaryManagementTrainingProgram?49094.3Yes53263.9Yes49643.5Yes……
根據(jù)該樣本求得的年薪樣本平均數(shù)、標(biāo)準(zhǔn)差及參加過(guò)培訓(xùn)計(jì)劃人數(shù)的比例分別為:樣
本
統(tǒng)
計(jì)量
1、考慮順序的不重復(fù)抽樣:N(N-1)(N-2)…(N-n+1)2、考慮順序的重復(fù)抽樣:
在總體單位數(shù)為N的總體中抽取容量為n的樣本,樣本個(gè)數(shù)可能有:
在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)中,往往采用的是較大總體(視為無(wú)限總體)下的無(wú)序不重復(fù)抽樣。3、不考慮順序的不重復(fù)抽樣:4、不考慮順序的重復(fù)抽樣:樣本個(gè)數(shù):樣本個(gè)數(shù)又稱樣本可能數(shù)目,也就是從一個(gè)總體中可能抽取的樣本個(gè)數(shù)。常用參數(shù)常用統(tǒng)計(jì)量平均數(shù)方差平均數(shù)方差變量總體屬性總體常用的參數(shù)和統(tǒng)計(jì)量計(jì)算公式(三)抽樣方法
重復(fù)抽樣
從N個(gè)單位中每次抽取1個(gè),抽取后將其號(hào)碼記下,再放回,一直抽取n個(gè)單位組成一個(gè)樣本,這樣的抽樣方法稱為重復(fù)抽樣。不重復(fù)抽樣從N個(gè)單位中每次抽取1個(gè),抽取后不放回,一直抽取n個(gè)單位組成一個(gè)樣本這樣的抽樣方法稱為不重復(fù)抽樣。不重復(fù)抽樣所得樣本對(duì)總體的代表性較大,抽樣誤差較小,所以實(shí)踐中通常采用不重復(fù)抽樣。(四)概率抽樣的組織方式簡(jiǎn)單隨機(jī)抽樣:從容量為N的總體中完全隨機(jī)地抽選樣本,使每個(gè)可能樣本被抽到的可能性相等,則稱容量為n的樣本為簡(jiǎn)單隨機(jī)樣本。
分層抽樣:也稱分類抽樣或類型抽樣,它是按某個(gè)主要標(biāo)志對(duì)總體各單位進(jìn)行分類,然后從各層中按隨機(jī)原則分別抽取一定數(shù)目的單位構(gòu)成樣本。等距抽樣:它是先將總體單位按一定順序排隊(duì),計(jì)算出抽樣間隔(或抽樣距離),然后按固定的順序和間隔抽取樣本單位。整群抽樣:它是將總體分為若干部分(每一部分稱為一個(gè)群),然后按隨機(jī)原則從中一群一群地抽選,對(duì)抽中群內(nèi)的所有單位進(jìn)行全面調(diào)查。二、抽樣分布(Samplingdistribution)1、抽樣分布的意義
2、樣本均值的抽樣分布3、樣本比例的抽樣分布
某一統(tǒng)計(jì)量(如:樣本均值、成數(shù)和方差)的所有可能樣本的取值和與之相對(duì)應(yīng)的概率所形成的分布。(1)抽樣分布的概念
(2)數(shù)字特征均值E(X)方差E[x-E(x)]21、抽樣分布的意義一個(gè)例子:樣本均值的抽樣分布【例2】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體)
,即總體單位數(shù)N=4。4
個(gè)個(gè)體分別為x1=1、x2=2、x3=3
、x4=4
。第一步:計(jì)算總體的均值、方差及分布:總體分布14230.1.2.3均值和方差
第二步:抽樣。從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))
(一個(gè)例子)
(一個(gè)例子)第三步:計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x
這里,的相對(duì)頻數(shù)分布,就稱為的抽樣分布。
正是抽樣分布及其特征使得用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的“精確程度”能夠給予概率上的描述。一般地,樣本統(tǒng)計(jì)量的可能取值及其取值概率所形成的概率分布,統(tǒng)計(jì)上稱為抽樣分布(samplingdistribution)。精確度可靠度第四步:計(jì)算所有樣本均值的均值和方差式中:M為樣本數(shù)目比較及結(jié)論:樣本均值的均值(數(shù)學(xué)期望)等于總體均值樣本均值的方差等于總體方差的1/n在不重復(fù)抽樣時(shí),樣本均值方差的方差:樣本平均數(shù)的標(biāo)準(zhǔn)差又稱為抽樣平均誤差(或抽樣標(biāo)準(zhǔn)差)。
(一個(gè)例子)樣本均值的分布與總體分布的比較
=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X2、樣本均值的抽樣分布抽樣總體樣本均值X,(N)均值μ=∑Xi/Nx,(n)考察樣本均值的概率分布形式。分兩種況:
1)總體分布已知且為正態(tài)分布;
2)總體分布未知;(1)樣本均值抽樣分布的形狀A(yù)、當(dāng)總體分布已知且為正態(tài)分布或接近正態(tài)分布時(shí),則無(wú)論樣本容量大小如何,樣本均值都為正態(tài)分布。
B、當(dāng)總體分布未知時(shí),需要用到中心極限定理(CentrallimitTheorem)
對(duì)容量為n的簡(jiǎn)單隨機(jī)樣本,樣本均值的分布隨樣本容量的增大而趨于正態(tài)分布。
經(jīng)驗(yàn)上驗(yàn)證,當(dāng)樣本容量等于或大于30時(shí),無(wú)論總體的分布如何,樣本均值的分布則非常接近正態(tài)分布。因此統(tǒng)計(jì)上常稱容量在30(含30)以上的樣本為大樣本(large-sample-size)。抽樣方法 均值 方差 標(biāo)準(zhǔn)差 (1)從無(wú)限總體抽樣和有限總體放回抽樣(2)從有限總體不放回抽樣抽樣誤差抽樣誤差樣本平均數(shù)的標(biāo)準(zhǔn)差又稱為抽樣平均誤差(或抽樣標(biāo)準(zhǔn)差)。由例2可得其計(jì)算公式:
樣本統(tǒng)計(jì)量的估計(jì)值與其所要測(cè)度的總體參數(shù)值之間的絕對(duì)差距,被稱為抽樣誤差(samplingerror)。
抽樣分布能夠用來(lái)提供抽樣誤差大小的可能性(概率)。樣本均值抽樣分布的實(shí)際應(yīng)用
在例1中,如果人事部經(jīng)理認(rèn)為在一次抽樣中所得到的中層干部的平均年薪與總體均值(51800$)誤差在500元以內(nèi),他就可以接受樣本估計(jì)值。則問(wèn)題歸結(jié)為在一次抽樣中,誤差在500元以內(nèi)的可能性(概率)有多大?
由于樣本容量為30,可認(rèn)為樣本均值服從正態(tài)分布,因此,上述問(wèn)題即為求一次抽樣的樣本均值點(diǎn)落在區(qū)間[51300,52300]內(nèi)的概率,即求下圖中陰影部分的面積。該例中:52300對(duì)應(yīng)的標(biāo)準(zhǔn)正態(tài)分布中的點(diǎn)為:(52300-51800)/730.3=0.68
查標(biāo)準(zhǔn)正態(tài)分布表:上述區(qū)間的面積為
0.2518+0.2518=0.5036
表明:在上述簡(jiǎn)單隨機(jī)抽樣中,只有50%的概率使得樣本均值與總體實(shí)際均值的誤差不超過(guò)500元。3、樣本比例的抽樣分布
當(dāng)從總體中抽出一個(gè)容量為n的樣本時(shí),樣本比例服從二項(xiàng)分布。當(dāng)n→∞時(shí),二項(xiàng)分布趨近于正態(tài)分布。經(jīng)驗(yàn)上,若np≥5且n(1-p)≥5,與P有關(guān)的樣本為大樣本下,樣本比例p近似服從正態(tài)分布。比例的抽樣平均誤差(重復(fù)抽樣)式中,P為總體比例,實(shí)際計(jì)算時(shí)通常采用以往經(jīng)驗(yàn)數(shù)據(jù)或樣本比例。
在例1中,由于全體中層干部接受過(guò)培訓(xùn)的人數(shù)比例為P=0.6,因此樣本比例期望值為p=0.6;同時(shí),由于n/N=30/2500=0.012<=0.05,因此樣本標(biāo)準(zhǔn)差為
又由于n·p=300.6=18,n(1-p)=300.4=12因此,樣本比例服從如下正態(tài)分布:例:燈泡廠從10000只燈泡中隨機(jī)抽取500只檢查其耐用時(shí)數(shù),結(jié)果如下表。該廠規(guī)定耐用時(shí)數(shù)在850以下為不合格。求平均耐用時(shí)數(shù)及不合格率的抽樣平均誤差。耐用時(shí)數(shù)燈泡數(shù)xxf800-850850-900900-950950-10001000-10501050-1100371291851024078258759259751025107530525112875171125994504100075253700003225000255000400000157500合計(jì)500——4625001475000解:重復(fù)抽樣條件下不重復(fù)抽樣條件下練習(xí):1、從某大學(xué)學(xué)生中隨機(jī)抽選100名調(diào)查體重,結(jié)果平均體重為58千克。根據(jù)過(guò)去的資料知道該校學(xué)生體重標(biāo)準(zhǔn)差為10千克。求抽樣誤差。2、某工廠共生產(chǎn)新型聚光燈2000只,隨機(jī)抽選400只進(jìn)行耐用時(shí)間調(diào)查,結(jié)果平均壽命為4800小時(shí),標(biāo)準(zhǔn)差為300小時(shí)。求抽樣誤差。3、從某校學(xué)生中隨機(jī)抽選400名,發(fā)現(xiàn)戴眼鏡的有80人。計(jì)算求抽樣誤差。4、一批食品罐頭60000桶,隨機(jī)抽查300桶,有6桶不合格。求合格率的抽樣誤差。5、假設(shè)4個(gè)人工資分別為:400、500、700、800元,現(xiàn)隨機(jī)抽選2人進(jìn)行調(diào)查。(1)驗(yàn)證(2)計(jì)算重復(fù)抽樣及不重復(fù)抽樣的抽樣平均誤差。第二節(jié)參數(shù)估計(jì)的基本方法一、點(diǎn)估計(jì)(Pointestimate)
二、抽樣誤差(SamplingError)三、區(qū)間估計(jì)(Intervalestimate)參數(shù)估計(jì)——以實(shí)際觀察的樣本數(shù)據(jù)所計(jì)算的統(tǒng)計(jì)量作為未知總體參數(shù)的估計(jì)值。一、點(diǎn)估計(jì)(Pointestimate)
1、點(diǎn)估計(jì)也稱定值估計(jì),就是直接以樣本統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值。如例1中,容量為30的樣本所計(jì)算出的年薪樣本平均數(shù)51814元、標(biāo)準(zhǔn)差2237.72元,及參加過(guò)培訓(xùn)計(jì)劃人數(shù)的比例63%,分別代表2500名中層干部的平均年薪、年薪的標(biāo)準(zhǔn)差及受訓(xùn)比例。2、點(diǎn)估計(jì)的優(yōu)點(diǎn)是它提供了總體參數(shù)的具體估計(jì)值,可作為決策的依據(jù),其缺點(diǎn)是不能提供有關(guān)抽樣誤差的信息。對(duì)同一總體參數(shù),會(huì)有不同的估計(jì)量;作為一個(gè)好的點(diǎn)估計(jì)量,統(tǒng)計(jì)量必須具有如下性質(zhì):無(wú)偏性、有效性、一致性3、優(yōu)良估計(jì)量的標(biāo)準(zhǔn)
1、無(wú)偏性(Unbiasedness):樣本估計(jì)量的均值等于被估總體參數(shù)的真值;
2、有效性(Efficiency):好的點(diǎn)估計(jì)量應(yīng)具有較小的方差;
3、一致性(Consistency):當(dāng)樣本容量增大時(shí),估計(jì)量依概率收斂于總體參數(shù)的真值??梢宰C明:樣本均值、樣本比例、樣本標(biāo)準(zhǔn)差:
無(wú)偏、有效、一致
一個(gè)樣本可以得到總體參數(shù)的一個(gè)點(diǎn)估計(jì),該點(diǎn)估計(jì)值與總體參數(shù)真值之間的差異,即為抽樣誤差。有三個(gè)相互聯(lián)系的概念:
1、實(shí)際抽樣誤差:
二抽樣誤差(SamplingError)
2、抽樣平均誤差:
所有可能樣本估計(jì)值與相應(yīng)總體參數(shù)的平均差異程度
3、抽樣極限誤差▼注意:
1、統(tǒng)計(jì)學(xué)上往往用抽樣極限誤差來(lái)測(cè)度抽樣誤差的大小或者說(shuō)測(cè)度點(diǎn)估計(jì)的精度。
原因:總體參數(shù)值往往并不知道,因此,實(shí)際抽樣誤差與抽樣平均誤差也往往無(wú)法求出,但在抽樣分布大體知道的情況下,抽樣極限誤差是可以估計(jì)出來(lái)的。一定概率下抽樣誤差的可能范圍(也稱允許誤差):
2、抽樣極限誤差的估計(jì)總是要和一定的概率保證程度聯(lián)系在一起的。
原因:樣本統(tǒng)計(jì)量往往是一隨機(jī)變量,它與總體參數(shù)真值之差也是一個(gè)隨機(jī)變量,因此就不能期望某次抽樣的樣本估計(jì)值落在一定區(qū)間內(nèi)是一個(gè)必然事件,而只能給予一定的概率保證。
因此,在進(jìn)行抽樣估計(jì)時(shí),既需要考慮抽樣誤差的可能范圍,同時(shí)還需考慮落到這一范圍的概率大小。
前者是估計(jì)的準(zhǔn)確度問(wèn)題,后者是估計(jì)的可靠性問(wèn)題,兩者緊密聯(lián)系不可分開(kāi)。這也正是區(qū)間估計(jì)所關(guān)心的主要問(wèn)題。三、區(qū)間估計(jì)(IntervalEstimation)(一)區(qū)間估計(jì)基本原理(二)總體均值的區(qū)間估計(jì)(三)總體比例的區(qū)間估計(jì)大數(shù)定律主要是說(shuō)明:當(dāng)n足夠大時(shí),獨(dú)立同分布的隨機(jī)變量的算術(shù)平均數(shù)趨近于數(shù)學(xué)期望;事件發(fā)生的頻率接近于其發(fā)生的概率。即樣本統(tǒng)計(jì)量接近于總體參數(shù)。因此,可以用樣本平均數(shù)(或比例)估計(jì)總體平均數(shù)(或比例)
中心極限定理是說(shuō)明:當(dāng)n充分大時(shí),大量的起微小作用的相互獨(dú)立的隨機(jī)變量之和趨于正態(tài)分布。因此可以用正態(tài)分布來(lái)確定總體參數(shù)的估計(jì)范圍(置信區(qū)間)和可靠程度(即概率或置信度)。(一)區(qū)間估計(jì)基本原理
區(qū)間估計(jì)則是根據(jù)樣本估計(jì)量以一定的可靠程度推斷總體參數(shù)所在的區(qū)間范圍。
如果抽樣分布已知,則在點(diǎn)估計(jì)中,可以知道抽樣的點(diǎn)估計(jì)值與總體參數(shù)的離差在某一給定范圍內(nèi)的概率大小,即以一定的可靠程度知道以下抽樣極限誤差:3、區(qū)間估計(jì)方法理論
因此,容易得到在抽樣中,總體參數(shù)將以同樣的可能性(概率)存在于下面的區(qū)間內(nèi):
一般地,設(shè)總體參數(shù)為
,
L、
U為由樣本確定的兩個(gè)統(tǒng)計(jì)量值,對(duì)于給定的
(0<
<1),有則稱(
L,
U
)為參數(shù)
的置信度為1-
的置信區(qū)間,
L、
U分別稱為置信下限與置信上限,
為顯著性水平,1-
為置信度。置信區(qū)間
2、
1-
可以認(rèn)為是用樣本估計(jì)值代替總體真值
時(shí)誤差在某一范圍內(nèi)的“可能性”,則
可認(rèn)為是這種替代產(chǎn)生的抽樣極限誤差超過(guò)這一范圍的“可能性”。
注意:
1、置信區(qū)間的直觀意義為:多次抽樣形成的多個(gè)置信區(qū)間中,有(1-
)100%包含總體參數(shù)真值。/2/2(二)總體均值的區(qū)間估計(jì)1、大樣本(n≥30)下總體均值的區(qū)間估計(jì)區(qū)間估計(jì)就是根據(jù)樣本求出總體未知參數(shù)的估計(jì)區(qū)間,并使其可靠程度達(dá)到預(yù)定要求。(1)
總體方差σ2已知時(shí)由于,所以對(duì)于給定的置信度1-α,有即可見(jiàn),極限誤差的計(jì)算公式為則總體均值的置信區(qū)間為例:從某大學(xué)學(xué)生中隨機(jī)抽取100名調(diào)查體重情況。經(jīng)稱量和計(jì)算,得到平均體重為58千克。根據(jù)過(guò)去的資料知道大學(xué)生體重的標(biāo)準(zhǔn)差是10千克。在95%的置信水平下,求該大學(xué)學(xué)生平均體重的置信區(qū)間。解:已知=58,σ=10,zα/2=1.96,n=100=10/10=1(千克)
=1.96×1=1.96(千克)
置信下限為58-1.96=57.04,置信上限為58+1.96=59.96故所求置信區(qū)間為(57.04,59.96)千克。例:某進(jìn)出口公司出口一種名茶,規(guī)定每包重量不低于150克?,F(xiàn)不重復(fù)抽取1%檢驗(yàn),結(jié)果如下。以95.45%的概率估計(jì)這批茶葉平均每包重量范圍,以確定該批茶葉是否達(dá)到要求。每包重量(克)包數(shù)xxf148——149149——150150——151151——15210205020148.5149.5150.5151.5148529907525303032.412.8228.8合計(jì)100——1503076(2)
總體方差σ2未知時(shí)用s2代替σ2
,對(duì)于給定的置信度1-α,總體均值的置信區(qū)間為解:在95.45%的概率保證下,
=2×0.087=0.174(g)
則總體平均數(shù)置信區(qū)間為即(150.126,150.474)之間說(shuō)明該批茶葉達(dá)到要求。2、小樣本下(n<30)總體均值的區(qū)間估計(jì)在小樣本條件下,樣本平均數(shù)的分布依賴于總體的概率分布。若總體服從正態(tài)分布,無(wú)論樣本容量如何,樣本平均數(shù)都服從正態(tài)概率分布。若總體不服從正態(tài)分布,必須擴(kuò)大樣本容量。(1)總體方差σ2已知時(shí),樣本均值的呈正態(tài)分布總體均值的置信區(qū)間為(2)總體方差σ2未知時(shí),樣本均值的分布為T分布總體均值的置信區(qū)間為
(,)例:某保險(xiǎn)公司投保人年齡設(shè)某保險(xiǎn)公司投保人年齡呈正態(tài)分布,現(xiàn)從中抽取10人,其年齡分別為:32,50,40,24,33,44,45,48,44,47歲。試以95%的置信水平估計(jì)該保險(xiǎn)公司投保人的平均年齡。
解:當(dāng)置信度為95%時(shí),=2.26222.6544=6.00(歲)因?yàn)?0.7-6.00=34.740.7+6.00=46.7所以該保險(xiǎn)公司投保人的平均年齡的置信區(qū)間為(34.7,46.7)歲。
(三)總體比例的區(qū)間估計(jì)在大樣本條件下,若,則樣本比例趨近于正態(tài)分布。對(duì)于給定置信度,有總體比例的置信區(qū)間為小樣本條件下,不作介紹。例:總體比例的區(qū)間估計(jì)
【例】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)抽取了100個(gè)下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%
例:某廠對(duì)一批產(chǎn)品進(jìn)行質(zhì)量檢驗(yàn),隨機(jī)重復(fù)抽取樣品100只,樣本合格品率為95%,試計(jì)算把握程度為90%的合格品率置信區(qū)間。
解:已知n=100,p=95%,1-α=90%,查表得zα/2=1.645
=0.0218
Δp=zα/2=1.645×0.0218=0.0359或3.59%
95%-3.59%=91.41%,95%+3.59%=98.59%
故該批產(chǎn)品合格率的置信區(qū)間為(91.41%,98.59%)總體均值區(qū)間估計(jì)程序n>=30?知否?用s代替總體是否接近正太分布?知否?用s代替增大樣本容量至n>=30yesNoyesNoyesyesNoNo練習(xí)1、從一批產(chǎn)品中按不重復(fù)隨機(jī)方法抽選1/20,共200件,其中廢品8件。當(dāng)概率保證程度為95.45%時(shí),可否認(rèn)為該批產(chǎn)品的廢品率不超過(guò)5%?2、一電視節(jié)目主持人想了解觀眾對(duì)電視節(jié)目的喜歡情況,他選取500名觀眾作樣本,結(jié)果說(shuō)喜歡該節(jié)目的175人。現(xiàn)以95%的概率估計(jì)觀眾喜歡這一節(jié)目的區(qū)間范圍。若該主持人希望估計(jì)極限誤差不超過(guò)5%,有多大把握?3、已知煉鋼廠的鐵水含碳量在正常情況下服從正態(tài)分布,其方差為0.108×0.108,現(xiàn)測(cè)定了9爐鋼水,平均含碳量4.484。按95%的可靠程度估計(jì)該廠鐵水含碳量。4.某市抽查25戶家庭用戶電力消費(fèi)量,結(jié)果如下。試以95%的概率保證,估計(jì)全市家庭用戶電力平均消費(fèi)量的置信區(qū)間、總消費(fèi)量的置信區(qū)間及用電量在85度以上的比例。用電量(度)戶數(shù)45——5555——6565——7575——8585——9525963合計(jì)25第三節(jié)樣本容量的確定
第三節(jié)樣本容量的確定
在重復(fù)抽樣下,
所以,必要抽樣單位數(shù)在不重復(fù)抽樣下,必要抽樣單位數(shù)
例:某市進(jìn)行職工家庭生活費(fèi)抽樣調(diào)查,已知職工家庭平均每人每月生活費(fèi)收入的標(biāo)準(zhǔn)差為110元,允許誤差范圍10元,概率把握程度95%,試確定應(yīng)抽選的戶數(shù)。
解:例:某企業(yè)要調(diào)查產(chǎn)品合格率,已知以往的合格率曾有90%、98%、99%?,F(xiàn)要求誤差不超過(guò)1%,把握程度為95%,問(wèn)需要抽選多少件產(chǎn)品?解:例:要調(diào)查某校大學(xué)生英語(yǔ)四級(jí)考試成績(jī),假設(shè)根據(jù)歷史資料該校學(xué)生平均成績(jī)的標(biāo)準(zhǔn)差為20分,及格率為65%。現(xiàn)用重復(fù)抽樣方法,要求在95%的置信度下,平均分?jǐn)?shù)的誤差不超過(guò)2分,及格率的誤差不超過(guò)4%,求必要抽樣數(shù)目。解:【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要估計(jì)年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?
解:影響必要抽樣數(shù)目的因素(1)允許誤差范圍Δ。當(dāng)其它條件不變時(shí),允許誤差愈小,必要的抽樣單位數(shù)就需要愈多;反之,允許誤差愈大,抽樣單位數(shù)就可以愈少。(2)總體方差σ2。其他條件不變的情況下,總體方差σ2愈大,總體單位的差異程度愈大,則樣本單位數(shù)應(yīng)愈多;反之,樣本單位數(shù)可愈少。(3)抽樣估計(jì)的可靠程度1-α。當(dāng)其他條件不變時(shí),抽樣估計(jì)的可靠程度愈高,zα/2數(shù)值愈大,抽樣數(shù)目就必須愈多;反之,抽樣估計(jì)的可靠程度愈低,抽樣數(shù)目就可以愈少。(4)抽樣方法。相同條件下,由于采用重復(fù)抽樣比不重復(fù)抽樣的誤差大,所以,前者應(yīng)比后者多抽一些樣本單位。除上述因素之外,抽樣組織方式也是影響抽樣單位數(shù)的一個(gè)原因。練習(xí):1、假定總體為5000單位,被研究的標(biāo)志方差不小于400,抽樣極限誤差不超過(guò)3。當(dāng)概率為99.73%時(shí),需要有多少不重復(fù)抽樣單位?(371)2、對(duì)某型號(hào)電池進(jìn)行電流強(qiáng)度檢查,根據(jù)以往正常生產(chǎn)經(jīng)驗(yàn),電流強(qiáng)度的標(biāo)準(zhǔn)差為0。4安培,合格率為90%?,F(xiàn)用重復(fù)抽樣方式,要求在95.45%的置信度下,抽樣平均電流強(qiáng)度的誤差范圍不超過(guò)0.08安培,抽樣合格率的極限誤差不超過(guò)5%,問(wèn)必要的抽樣單位數(shù)應(yīng)為多少?(144)3、對(duì)某型號(hào)電子元件10000只進(jìn)行耐用性能檢查。根據(jù)以往抽樣測(cè)定,求得耐用時(shí)數(shù)的均方差為51.91小時(shí),合格率的均方差為28.62%,試計(jì)算:(1)概率保證為68.27%時(shí),元件平均耐用時(shí)數(shù)的誤差范圍不超過(guò)9小時(shí),在重復(fù)抽樣的條件下,要抽查多少元件?(34)(2)概率保證為99.73%時(shí),元件合格率的極限誤差不超過(guò)5%,在重復(fù)抽樣的條件下,要抽查多少元件?(295)(3)在不重復(fù)抽樣的條件下,要同時(shí)滿足上述(1)、(2)條件,要抽查多少元件?4、某藥廠為了檢查瓶裝藥片數(shù)量,從成品庫(kù)隨機(jī)抽檢100瓶,結(jié)果平均每瓶101.5片,標(biāo)準(zhǔn)差為3片。試以99.73%的概率推斷成品庫(kù)中該種藥平均每瓶數(shù)量的置信區(qū)間。如果允許誤差減少到原來(lái)的1/2,其它條件不變,問(wèn)需要抽取多少瓶?5、在對(duì)一條廣告效應(yīng)進(jìn)行的電話追蹤調(diào)查中,30名被追蹤者中有20名會(huì)想起廣告用語(yǔ)。試求在看過(guò)該廣告的所有人中,會(huì)想起廣告語(yǔ)的人所占比重的置信區(qū)間。(α=5%)6、設(shè)成年男子身高呈正態(tài)分布。某地區(qū)成年男子平均身高170厘米,標(biāo)準(zhǔn)差為2厘米。(1)若抽查10人,問(wèn)這10人的平均身高介于166.2——173.8厘米之間的可能性有多大?(2)如果進(jìn)行一次成年男子身高的抽樣調(diào)查,要求以95%的把握程度保證誤差不超過(guò)3厘米,問(wèn)需抽查多少人?(3)如果以95%的把握保證誤差不超過(guò)1.5厘米,問(wèn)需抽查多少人?這一結(jié)果與上一結(jié)果有何關(guān)系?(4)如果允許誤差仍為1.5厘米,但要求保證程度提高到99.73%,問(wèn)需要抽查多少人?7、某公司電話咨詢服務(wù)部門在每次通話結(jié)束時(shí)都要記下通話時(shí)間,從一個(gè)由16個(gè)記錄組成的隨機(jī)樣本得出平均一次通話時(shí)間為16分鐘。已知總體服從正態(tài)分布,其標(biāo)準(zhǔn)差為0.7分鐘。試以95.45%的概率推斷總體均值的置信區(qū)間。8、某公司推出一種營(yíng)養(yǎng)型豆奶,為了做好促銷工作,隨機(jī)地選取顧客詢問(wèn)喜歡此豆奶情況。若要使置信度為95%,抽樣誤差不超過(guò)0.05,在下列情況下,你建議樣本的容量為多大?(1)假如初步估計(jì)約有60%的顧客喜歡此豆奶;(2)假如無(wú)任何資料可用來(lái)估計(jì)喜歡此豆奶的比例。9、對(duì)某磚廠產(chǎn)品質(zhì)量進(jìn)行抽樣調(diào)查,要求抽樣誤差不超過(guò)0.01111,概率把握程度為0.9545。已知過(guò)去進(jìn)行的幾次同樣調(diào)查所得不合格產(chǎn)品比例為1.25%、1.23%、1.14%,試確定必要的抽樣數(shù)目。10、根據(jù)高教廳統(tǒng)計(jì),某地區(qū)有17%的大學(xué)生申請(qǐng)免息教育貸款。假定樣本容量為300。試求:(1)當(dāng)?shù)卮髮W(xué)生中申請(qǐng)免息教育貸款的總體比例的95.45%的置信區(qū)間。(2)當(dāng)?shù)卮髮W(xué)生中申請(qǐng)免息教育貸款的總體比例的99%的置信區(qū)間。(3)當(dāng)把握程度由95.45%提高到99%時(shí),允許誤差如何變動(dòng)?11、某職業(yè)研究所隨機(jī)抽取100名IT行業(yè)人員了解本地人員薪金,樣本均值為50124.58元,樣本標(biāo)準(zhǔn)差為1685元,試分別求IT行業(yè)人員年薪的總體均值的90%、95%和99%的置信區(qū)間。當(dāng)置信水平增大時(shí),置信區(qū)間的寬度如何變化?第四節(jié)其它抽樣方法及
其抽樣分布特征
一、分層抽樣(Stratifiedsampling)二、等距抽樣(Systematicsampling)
三、整群抽樣(Clustersampling)
設(shè)總體容量為N,將總體劃分為k層(組或類),有N=N1+N2+…+Nk。從每層的Ni個(gè)單位中抽取ni個(gè)單位構(gòu)成容量為n的樣本,即n=n1+n2+…+nk。從每層中抽取樣本單位時(shí),為了保持樣本結(jié)構(gòu)與總體結(jié)構(gòu)相同,通常采用按(等)比例取樣,即按各層單位數(shù)占總體單位數(shù)的比例從中抽取樣本,使各層樣本單位數(shù)與各層總體單位數(shù)之比等于樣本容量與總體容量之比。即
一、分層抽樣(Stratifiedsampling)分層抽樣的抽樣平均誤差重復(fù)抽樣下,不重復(fù)抽樣下,對(duì)于等比例分層抽樣,其分布特征如下:
樣本平均數(shù)總體層內(nèi)方差平均數(shù)抽樣平均誤差(重復(fù)抽樣)(不重復(fù)抽樣)總體方差未知時(shí)樣本層內(nèi)方差平均數(shù)抽樣平均誤差計(jì)算公式為(重復(fù)抽樣)(不重復(fù)抽樣)對(duì)于分層抽樣,若總體各層為正態(tài)分布或?yàn)榇髽颖痉钦龖B(tài)分布,則各子樣本平均數(shù)、樣本平均數(shù)均服從或近似服從正態(tài)分布。對(duì)于給定的置信度1-α,總體均值的置信區(qū)間為:比例的抽樣平均誤差
重置抽樣不重置抽樣總體比例未知時(shí),其中,當(dāng)總體服從或近似服從正態(tài)分布時(shí),對(duì)于給定的置信度1-α,總體比例的置信區(qū)間為:例:某電視臺(tái)分別從三個(gè)縣按比例抽選600戶,調(diào)查晚間新聞的收視率和每周看電視時(shí)間(小時(shí)),結(jié)果如表所示。在95%的置信度下,求
(1)
三縣總體收視率的置信區(qū)間;
(2)
三縣住戶每周看電視的平均時(shí)間置信區(qū)間。
縣住戶抽選戶比例平均數(shù)層內(nèi)方差12340000140006000400140600.270.180.1714.3518.7419.98237.24168.47131.01樣本容量的確定
重復(fù)抽樣不重復(fù)抽樣分層抽樣有如下的特點(diǎn):
1、由于總體方差等于組內(nèi)方差與組間方差之和,所以分層抽樣的誤差一般小于簡(jiǎn)單隨機(jī)抽樣的誤差。2、由于總體方差是唯一確定的數(shù)值,因此分層抽樣時(shí)可以擴(kuò)大層間方差,縮小層內(nèi)方差,使抽樣誤差減小。練習(xí):
1、某鄉(xiāng)全部糧食耕地5000畝,按平原和山區(qū)面積比例抽取樣本,容量為630畝,計(jì)算各組平均畝產(chǎn)和標(biāo)準(zhǔn)差如下。以95%的概率保證對(duì)全鄉(xiāng)平均畝產(chǎn)作區(qū)間估計(jì)。全部面積抽樣面積平均畝產(chǎn)標(biāo)準(zhǔn)差平原山區(qū)40001000504126960750200400合計(jì)50006309182532、對(duì)某公司職工的工資進(jìn)行抽樣調(diào)查,共抽取600名職工,其中400名工人,200名職員,結(jié)果如下。試分別計(jì)算類型抽樣和簡(jiǎn)單隨機(jī)抽樣的誤差,并加以比較?,F(xiàn)若采用類型抽樣方式,試對(duì)該公司職工平均工資作區(qū)間估計(jì)。如果要求誤差不超過(guò)1元,應(yīng)至少抽選多少工人和職員?(置信度為95%)工人職員月工資人數(shù)月工資人數(shù)500——600600——700700——800100180120700——800800——900900——10007080503、從三種不同規(guī)模的工廠中,分別隨機(jī)抽查1%機(jī)床,得到機(jī)床利用率如下,試以95.45%的概率確定全部機(jī)床利用率的置信區(qū)間。工廠類型金屬切削機(jī)床數(shù)機(jī)床利用率(%)全部抽樣小型中型大型80002500030000802503008365594、假定類型抽樣的結(jié)果如下,試確定總體均值的95.45%的置信區(qū)間。區(qū)域抽取單位標(biāo)志平均數(shù)標(biāo)準(zhǔn)差甲乙60030032362030二、等距抽樣(Systematicsampling)
如果對(duì)總體的差異程度不了解,可以按無(wú)關(guān)標(biāo)志排隊(duì)。這種抽樣結(jié)果接近于簡(jiǎn)單隨機(jī)抽樣的效果,所以可采用簡(jiǎn)單隨機(jī)抽樣的誤差計(jì)算方法,但要注意等距抽樣通常都是不重置抽樣。如果對(duì)總體的變異程度有所了解,可以按有關(guān)標(biāo)志排隊(duì)。按有關(guān)標(biāo)志排隊(duì)的等距抽樣實(shí)質(zhì)上運(yùn)用了分層抽樣的一些特點(diǎn),有利于提高樣本的代表性,與分層抽樣不同的,只是分類更細(xì)致,層數(shù)更多,在各層只抽取1個(gè)單位。因此,一般可以采用不重復(fù)分層抽樣的誤差公式來(lái)近似計(jì)算。按有關(guān)標(biāo)志排隊(duì)并將總體單位n等分后,取樣方法有以下兩種:
1、半距中點(diǎn)取樣。即在每部分的中間(抽樣距離的一半)抽取一個(gè)單位組成樣本。如,第一部分取第k/2單位,第二部分取第3k/2單位,…,第n部分取第(2n-1)k/2單位。這種取樣方法,使所抽取的各單位最能代表每部分的一般水平,從而提高樣本的代表性,其不足之處是只能取一個(gè)樣本。2、對(duì)稱等距取樣。即第一部分隨機(jī)抽取一個(gè)單位,然后據(jù)此在各部分中抽取兩兩對(duì)稱的樣本單位組成樣本。如,第一部分取第i單位,第二部分取第2k-i單位,第三部分取第2k+i單位,第四部分取第4k-i單位,…,第(n-
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 我的語(yǔ)文老師讓我感動(dòng)的事作文7篇
- 體育賽事組織策劃與實(shí)施合同
- 科技人才引進(jìn)培養(yǎng)承諾書6篇
- 金色的秋天田野寫景作文13篇
- 教育學(xué)術(shù)倫理承諾書示例(6篇)
- 資產(chǎn)增值服務(wù)承諾書5篇范文
- 空間站建設(shè)工程質(zhì)量保證承諾函7篇范文
- 安徽醫(yī)科大學(xué)《日語(yǔ)聽(tīng)力》2024 - 2025 學(xué)年第一學(xué)期期末試卷
- 2026廣東佛山順德區(qū)杏壇光輝幼兒園招聘?jìng)淇碱}庫(kù)附答案詳解ab卷
- 2026上半年貴州事業(yè)單位聯(lián)考貴陽(yáng)學(xué)院招聘5人備考題庫(kù)完整答案詳解
- 2026中考英語(yǔ)時(shí)文熱點(diǎn):跨學(xué)科融合閱讀 練習(xí)(含解析)
- 《筑牢安全防線 歡度平安寒假》2026年寒假安全教育主題班會(huì)課件
- 2026國(guó)家國(guó)防科技工業(yè)局所屬事業(yè)單位第一批招聘62人備考題庫(kù)及答案詳解(新)
- 信息技術(shù)應(yīng)用創(chuàng)新軟件適配測(cè)評(píng)技術(shù)規(guī)范
- 2026版安全隱患排查治理
- 道路施工安全管理課件
- (2025年)吉林事業(yè)單位考試真題附答案
- 肉瘤的課件教學(xué)課件
- 《患者身份識(shí)別管理標(biāo)準(zhǔn)》測(cè)試題及答案
- VTE患者并發(fā)癥預(yù)防與處理
- 車輛救援合同協(xié)議書
評(píng)論
0/150
提交評(píng)論