第九章 多階段抽樣_第1頁
第九章 多階段抽樣_第2頁
第九章 多階段抽樣_第3頁
第九章 多階段抽樣_第4頁
第九章 多階段抽樣_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第九章多階段抽樣第一節(jié)多階抽樣概述、多階抽樣的概念1、單階抽樣:從總體中通過一次抽樣就能夠產(chǎn)生一個完整的樣本,這類抽樣即為單階抽樣。前面介紹的幾種抽樣方式均為單階抽樣。適合用于總體單元數(shù)相對較少的抽樣過程。2、多階抽樣:將整個抽樣過程分成若干個階段,一個階段一個階段地進(jìn)行抽樣以完成整個抽樣過程,這種抽樣即為多階抽樣。當(dāng)我們面對的總體單元數(shù)很龐大,而且分布范圍很廣時,如果使用前面所學(xué)習(xí)的單階抽樣方法,不僅工作量大,而且在精度上很難把握,此時如果改用多階抽樣方法,就會避免上述困難,從而達(dá)到理想的抽樣效果。3、關(guān)于多階抽樣的具體描述:如果我們面對的一階單元內(nèi)總體基本單元數(shù)相當(dāng)大,作全面的調(diào)查就會比較困難,或者一階單元內(nèi)各二階單元可以給出相近的結(jié)果,作全面的調(diào)查又無必要。此時從費(fèi)用和抽樣估計效率考慮,便可以從總體中隨機(jī)抽取一部分一階單元,然后再從被抽中的一階單元內(nèi),隨機(jī)抽取部分二階單元并對他們作全面調(diào)查,我們把這種抽樣技術(shù)稱為兩階抽樣。如果在被抽中的二階單元中,再抽取部分三階單元組成樣本,并對抽中的三階單元進(jìn)行全面的調(diào)查,這就是三階抽樣。類似地,可以定義四階抽樣或更高階的抽樣,通常將兩階以上的抽樣稱為多階抽樣。需要指出的是,多階抽樣中,各階可以采用不同的抽樣方法,也可采用同一種抽樣方法,要視具體情況和要求而定。在兩階抽樣中,總體各一階單元所包含的二階單元數(shù),有相等和不相等的兩種情況。前者無論在樣本的抽取還是在指標(biāo)的估算方面都相對比較簡單,然而在抽樣實(shí)踐中卻很少有這種情況的存在,但作為基本方法仍然有其實(shí)際意義;后種情況在抽樣和指標(biāo)的估算方法上都較為復(fù)雜,然而在實(shí)際中普遍存在此種情況。4、兩階抽樣與分層抽樣和整群抽樣的關(guān)系:將總體分為若干個一階單元,如果在每一個一階單元中,都隨機(jī)抽取部分二階單元,由這些二階單元中的總體基本單元組成的樣本,在抽樣的方式上,就相當(dāng)于分層抽樣;如果在全部的一階單元中,只抽取了部分一階單元,并對抽中的一階單元中的所有的基本單元都做全面調(diào)查,這就是整群抽樣。因此,分層抽樣實(shí)際是第一階抽樣比為100%時的一種特殊的兩階抽樣;而整群抽樣實(shí)際上是第二階抽樣比為100%時的一種特殊的兩階抽樣,故也稱單級整群抽樣。令f.為抽樣比,即有:當(dāng)!fi=1時,二階抽樣可視為分層抽樣,當(dāng)!f<1時,二階抽樣可視為整群抽樣M2<1M2t兩階抽樣與分層抽樣的主要區(qū)別在于:分層抽樣是對總體中的每個一級樣本群體進(jìn)行全面入樣,再對所有的樣本進(jìn)行抽查;而兩階抽樣則把總體中所有的群體視為一階單元,對這些一階單元進(jìn)行抽樣,將抽出的樣本再次進(jìn)行抽樣(兩次都不是進(jìn)行全面的調(diào)查),產(chǎn)生兩級樣本,最后綜合估算出總的一級樣本指標(biāo)。兩階抽樣與整群抽樣的主要區(qū)別在于:整群抽樣是對總體中抽取的每個樣本群體所包含的基本單元進(jìn)行全面調(diào)查;而兩階抽樣則把總體中所有的群體視為一階單元,對每一個被抽中的一階單元所包含的二級單元(即基本單位),不是進(jìn)行全面的調(diào)查,而是再進(jìn)行一次抽樣調(diào)查(也稱抽子樣本)。即兩階抽樣,產(chǎn)生兩級樣本,最后綜合估算出總的一級樣本指標(biāo)。至于在綜合估算的方式方法上,兩階抽樣與整群抽樣也是極其相似的,只不過前者為就被抽一級單元的樣本指標(biāo)進(jìn)行綜合估算,后者為就被抽樣群體單元的全體指標(biāo)進(jìn)行綜合估算。二、多階抽樣的特征(一)便于組織抽樣當(dāng)總體單元數(shù)目很大,分布很廣時,若采用簡單隨機(jī)抽樣,那么,編制全體總體單元的抽樣框和現(xiàn)場實(shí)施隨機(jī)抽樣,都是相當(dāng)困難的;如果采用等距抽樣,則須將全部總體單元進(jìn)行有序排列并等距抽取,也是很困難的;若采用分層抽樣。則為提高抽樣估計效率,需掌握全部總體單元的有關(guān)資料,按照分層的原則進(jìn)行分層,然后到各層中去抽樣,這一分層和大范圍抽樣的工作,是很繁重的;若采用單級整群抽樣,也需掌握全部總體單元的有關(guān)資料,按分群的原則分群,并在抽中的群內(nèi)作全面調(diào)查,這一分群和在群內(nèi)做全面調(diào)查的工作也是很龐大的。例如,我國有一億八千萬農(nóng)戶,為做農(nóng)村住戶調(diào)查,如果按上述幾種方式進(jìn)行抽樣,其工作量之大是難以想象的。若采用多階抽樣,就可避免上述抽樣技術(shù)中的麻煩。它可按現(xiàn)有的現(xiàn)有的行政區(qū)域或地理區(qū)域劃分為各階抽樣單元,從而簡化抽樣框的編制便于樣本單元的抽取使整個抽樣調(diào)查的組織工作容易進(jìn)行。多階抽樣既保持了單級整群抽樣的優(yōu)點(diǎn),又克服了他的缺點(diǎn)。(二)抽樣方式靈活,有利于提高抽樣的估計效率多階抽樣中,各階段可以采用同一種抽樣方法,也可以根據(jù)各階單元的分布情況,采用不同的抽樣方法。同時,還可以根據(jù)各階單元分布情況的不同,安排不同的抽樣比。(三)多階段抽樣對基本調(diào)查單元的抽選不是一步到位的至少要經(jīng)過兩步抽樣,這也是多階抽樣與單階抽樣的區(qū)別所在。因此,多階抽樣的隨機(jī)性體現(xiàn)在每一階單元的抽選上。而在各階段可以充分利用輔助信息來增加效率。但由于在現(xiàn)實(shí)中,各階單元大小相等的情形又幾乎是不存在,所以對于各階單元大小不等的多階段抽樣,如何保證每個基本單元都有相同的可能性被抽中,是一個較為復(fù)雜的問題,有待進(jìn)一步探討。(四)多階段抽樣實(shí)質(zhì)上是分層抽樣與整群抽樣的有機(jī)結(jié)合以兩階段抽樣為例,從總體上所有一階單元中抽取一部分單元,相當(dāng)于從總體所有群中抽取部分群的整群抽樣;而在每個抽中的一階單元中分別抽取部分二階單元,就相當(dāng)于分層抽樣。即先整群,后分層。因此,二階抽樣從技術(shù)上看是整群抽樣與分層抽樣的綜合。(五)多階抽樣在抽樣時并不需要二階或更低階單元的抽樣框?qū)τ诘谝浑A抽樣,初級單元的抽樣框是必要的。在以后的各階抽樣中,僅僅需對那些已抽中的單元準(zhǔn)備下一級單元的抽樣框。(六)多階抽樣還可用于“散料”的抽樣,即散料抽樣所謂“散料”,是指連續(xù)松散的、不易區(qū)分的個體或抽樣單元的材料。例如一堆煤,一車水泥等。對于散料,抽樣單元可以人為劃分,也可以取其自然的單位。進(jìn)行散料抽樣時,一級單元是自然或人為劃分的分裝(例如一袋水泥),二級單元則是從分裝中抽取一定數(shù)量(如一千克)的份樣作調(diào)查。第二節(jié)一階單元等大小的多階抽樣一、二階抽樣首先考慮一級單元大小相等的二階抽樣。對于初級單元大小不等的情形,可以通過分層,將大小近似的初級單元分到一層,則層內(nèi)的二階抽樣就可以按初級單元大小相等的方式來處理。第一階段在總體N個初級單元中,以簡單隨機(jī)抽樣抽取n個初級單元,第二階段在被抽取的初級單元包含的M個二級單元中,以簡單隨機(jī)抽樣抽取m個二級單元,即最終接受調(diào)查的單元。(一)有關(guān)符號的涵義記七為第i個一階單元中第j個二階單元的標(biāo)志值(或指標(biāo)值)(i=1,2,…卬j=1,2,…,M)。N為總體所含一階單元數(shù);n為樣本所含一階單元數(shù);M為每個總體一階單元所含二階單元數(shù);m為每個樣本一階單元所含二階單元數(shù);f1=n/N為第一階抽樣比;f2=m/M為第二階抽樣比;Mo=NM為總體所含二階單元數(shù);m0=nm為樣本所含二階單元數(shù);匕二z七.為總體中第i個一階單元的標(biāo)志總量;j=1y=Zy.為樣本中第i個一階單元的標(biāo)志總量;.=1k=1Ly為總體各一階單元的標(biāo)志總量;ii=1y=Zy為樣本各一階單元的標(biāo)志總量;i=1Y=Y::M為總體第i個一階單元內(nèi)的均值;yi=*為樣本第i個一階單元內(nèi)的均值;Y=Y;N為總體各一階單元間的均值;y=y:n為樣本各一階單元間的均值;Y=Y;M0=N工Y為總體各一階單元內(nèi)均值的平均,即總體中各二階單元的均值=1y=y/m0=1£y為樣本各一階單元內(nèi)均值的平均,即樣本中各二階單元的均=1S由2=Mi£(y目-匕)2為總體第i個一階單元內(nèi)的方差;j=iS2=二£(y-y)2為樣本第i個一階單元內(nèi)的方差;2,m一1jj=iS12=N一1£(Y-Y)2為總體各一階單元間的方差;=1s「=七£(y-y)2為樣本各一階單元間的方差;=1S2=二£S2=:[、££(y-Y2)2為總體各一階單元內(nèi)方差的平均,即2N.=]2iN(M-1).=],=]ji總體各二階單元間的方差;s2=1£S2=,1_££(y-y)2為樣本各一階單元內(nèi)方差的平均,即樣本2n.12in(m-1).1,1j,各二階單元間的方差。(二)估計量及其方差、由于二階抽樣中,抽樣過程分成兩步,因此,對于總體參數(shù)6的估計量0求均值和方差時,必須把這兩階抽樣過程所能產(chǎn)生的所有樣本加以平均,即E(0)=EE(0)」12V(0)=VE(0)」+EV(0)」1212其中史表示所有樣本的期望值或均值,氣、匕分別表示對第一階抽樣求的均值與方差,烏、V2分別表示對固定的第一階抽樣中抽得的一組一階單元對第二階抽樣求的均值與方差。對于三階抽樣可以有類似的公式

V(0)=VV(0)=V131231231、總體均值的估計對于二階抽樣,若兩個階段的抽樣都是簡單隨機(jī)的,則其總體均值亍的無偏估計量為亍=亍=£&司i=1j=1由于在每個一階單元中的第二階抽樣是相互獨(dú)立進(jìn)行的,所以,在二階段都用不放回方法抽樣時,其總體均值估計量的方差可構(gòu)造為VG)=上匕s2+上匕s2n1mn2=1(S2-M)+Mn1Mmn可以證明其方差的無偏估計量為V(y)=上匕s2+羅1—門n1mn其中,s2為S2的無偏估計,s2不屬于S2的無偏估計,S2的無偏估計為22111S2=s2-1-f2s211m2式中右邊第一部分相當(dāng)于第一階段抽樣的誤差,它只與各一階單元間差異大小有關(guān);第二部分相當(dāng)于第二階段抽樣的誤差,它只與各一階單元內(nèi)(即各二階單元間)差異有關(guān)。又因?yàn)樯县斑h(yuǎn)大于上A,因此在二階抽樣中,估計量的方差主要同第一項(xiàng)的大小有關(guān),也即nmn主要同第一階段抽樣比的大小和總體各一階單元間的差異大小有關(guān)。據(jù)此,要控制二階抽樣的誤差,首先要考慮在一階單元劃分時盡可能縮小其相互間的差異并相應(yīng)擴(kuò)大第一階抽樣比。當(dāng)然這樣又可能會使第二階抽樣的誤差有所增大。如何協(xié)調(diào)這樣一對矛盾呢?為此,有必要進(jìn)一步討論第一階抽樣和第二階抽樣的最佳抽樣比問題,以使估計量的方差達(dá)到最小。在還沒有涉及這個問題之前,我們來看一個例子:例:欲調(diào)查4月份100家企業(yè)的某項(xiàng)指標(biāo),首先從100家企業(yè)中抽取了一個含有5家樣本企業(yè)的簡單隨機(jī)樣本,由于填報一個月的數(shù)據(jù)需要每天填寫流水賬,為了減輕樣本企業(yè)的負(fù)擔(dān),調(diào)查人員對這5家企業(yè)分別在調(diào)查月內(nèi)隨機(jī)抽取3天作為調(diào)查日,要求樣本企業(yè)只

填寫這三天的流水帳。調(diào)查結(jié)果如下:對5家企業(yè)的調(diào)查結(jié)果樣本企業(yè)第一日第二日第三日15759642384150351606344853495625554要求根據(jù)這些數(shù)據(jù)推算100家企業(yè)該指標(biāo)的總量,并給出估計的95%的置信區(qū)間。解:對這個問題,我們可以利用二階抽樣的思路解決。首先將企業(yè)作為初級單元,將每一天看作二級單元,每個企業(yè)在調(diào)查月內(nèi)都擁有30天(即擁有30個二級單元)。在這個問題中,調(diào)查人員首先在初級單元中抽取了一個n=5的簡單隨機(jī)樣本,然后對每個樣本單元的二級單元分別獨(dú)立抽取了一個m=3的簡單隨機(jī)樣本,這就是初級單元大小相等的二階抽樣問題。由題意,N=100,M=30,n=5,m=3一一m3=0.05,f2=—=30=0.1/n5f一一m3=0.05,f2=—=30=0.1首先計算樣本初級單元的均值八方差,2樣本企業(yè)yiS22i160132433935839450755719于是得到:亍=1£y=1(60+43+58+50+57)=53.6"i=1S]2=^-~1£(yi-y)2=49.3i=1S2=1£si2=23.4"i=1TS2+f1(1—f2)S2n1mn21―0.05X49.3TS2+f1(1—f2)S2n1mn255x3計算rsv(y):Y=NMy=100乂30乂53.6=160800#(Y)=N2M2寸(y)=1002X302X9.4372=84934800Y的標(biāo)準(zhǔn)差為:s(Y)=\.:V(Y)=、.?84934800=9216-、…q在置信度95%的條件下,對應(yīng)的t=1.96,因此,Y的置信區(qū)間為:160800±1.96x92162、最佳抽樣比的確定在總費(fèi)用一定時,考慮下述簡單的線性費(fèi)用函數(shù):C=C0+C]n+C2nm若一階級單元間的旅費(fèi)不占重要位置,則上述費(fèi)用函數(shù)被證明是適用的。這里C是與0樣本量無關(guān)的固定費(fèi)用,C「C2分別為平均每調(diào)查一個一階單元和二階單元的費(fèi)用。又方差函數(shù)-1S2S2S2V(y)=_(S2—?)+?_一

n1MmnN式中右邊的最后一項(xiàng)與n及m的選擇無關(guān),建立函數(shù)Q=(V+NS2)(C-C0)1S2S2=[_(S2-—)+?](Cn+Cnm)

n1Mmn12S2S2=[S:-節(jié)+—+C2m)則當(dāng)費(fèi)用固定條件下,使方差極小,或在方差固定條件下使費(fèi)用極小,等價于使函數(shù)Q極小化。故使Q關(guān)于m的偏導(dǎo)數(shù)等于零,則可求得m的最優(yōu)值為m=2汁(其中S2>S2M)°pt'S2C12,,'S2-—2\1M當(dāng)m不為整數(shù)時,應(yīng)取整。令m'=[m列]若m2>m'(m'+1),則取m=m'+1;°pt若m2<m(m+1),則取m=m'若m>M或S2-S2/M<0,則取m=M當(dāng)S2,S2的值未知時,可以用試點(diǎn)調(diào)查的結(jié)果加以估計,即取S2=S2,S2=s2,則可121122以按上述同樣的思路求得m的估計量optmopt而Cmopt二.=:—1v;(mfs2s2)-1"C2其中,m'為試點(diǎn)調(diào)查中從每個一階單元中抽中二階單元的數(shù)目。需要說明的是,估計量mopt存在抽樣誤差,它的大小取決于比率s;"的抽樣誤差。求出m后,將其代入估計量方差的計算公式或上述線性費(fèi)用函數(shù)式中,即可求出n的值。這樣就可確定出最佳的抽樣比f和f2。特別地,當(dāng)f2=1時,即m=M時,二階抽樣就化為對一階單元進(jìn)行的單級整群抽樣,故其估計量的方差及其估計量就轉(zhuǎn)變?yōu)檎撼闃庸烙嬃康姆讲罴捌涔烙?。?dāng)f1=1,即n=N時,二階抽樣就化為按比例分配的分層隨機(jī)抽樣,且其層權(quán)相等,此時二階抽樣估計量的方差及其估計也就轉(zhuǎn)變?yōu)榉謱与S機(jī)抽樣估計量的方差及其估計。所以,一般地二階抽樣也可看作是把一階單元作為層的不完全的分層抽樣。然而,在大多數(shù)實(shí)際情況下,最優(yōu)性相對來說是不顯著的。因此,選擇m時一般并不要求比率C2;C2和S2/S;的估計量有高度的準(zhǔn)確性。對此,布魯克斯(Brooks)于1955年進(jìn)行了較為深入的研究,并編制了一些有用的表格。W?G?科克倫曾在他的著作中介紹了有關(guān)這方面的內(nèi)容。3、總體比例的估計若需估計總體中具有某種特性的二階單元所占的比例,則令=J1,若第,個一階單元中第/個二階單元具有該特性*二0,否則設(shè)《為第i個一階單元中具有該特性的二階單元所占的比例,p,為抽到的第i個一階單元中具有該特性的二階單元所占的比例。若兩階段的抽樣都是不放回簡單隨機(jī)的,則總體比例P的無偏估計量為

其方差為方差估計量為式中=1&n'i=1V(其方差為方差估計量為式中=1&n'i=1V(P)=V(p)=上匕S2+上LS2n1Mn1V(p)=工s2+工s2n1mn2S「£(p-p)2ii=1n-1£(p.-p)2,i=1S22MX2N(M-1)i—i'

i=1s22m£2而刁乙pi(1-pi)i=1二、分層二階抽樣對初級單元不等規(guī)模的二階抽樣的處理方法之一是進(jìn)行分層之后,再在各層實(shí)施二階抽樣。設(shè)總體分成L層,第h層有Nh個一階單元,每個一階單元均含M,個二階單元。在第h層隨機(jī)抽了%個一階單元,又從每個被抽中的一階單元中隨機(jī)抽了”個二階單元。則的估計量為其中是按二階單元的層權(quán);寧st其中是按二階單元的層權(quán);寧st=*hh為第h層的樣本均值。其方差為方差估計量為V(亍)=1^W2「方差估計量為V(亍)=1^W2「—f1hS2+1_f2hS2)

shhn1hnm2h其中Yw2(.1—f1h-nhhhn——hr--,fm=hNh2hMhv號=S2+f(1-fh)S2)

1hnm2h上式乘以£NhMhh在分層二階抽樣中,若)2則得Yst的方差及其方差估計量。=常數(shù)N內(nèi)M打則樣本是自加權(quán)的。即總體中每個二階單元入樣的概率都相等,:=I^y/£nmsthijhhh=1i=1j=1h=1則樣本是自加權(quán)的。三、三階抽樣設(shè)總體中含有N個一階單元,每個一階單元又含M個二階單元,而每個二階單元中又含有K個三階單元,各階樣本大小分別為n,m和k。令yij(u=1,2,…心為第i個一階單元的第j個二階單元中,第u個三階單元的觀測值,則Y=1Yy

ijKiju

u=1上YYyMKijuj=1u=1nMkyyyy‘jui=1j=1u=11=三乙(Y-Y)2N—11i=1S2=2N(M—1)i=1j=1

s32二iM^i藝藝切=1j=1u=1-_1yy=k乙yuu=s32二iM^i藝藝切=1j=1u=1-_1yy=k乙yuu=11yy=——七七ymkj=1u=1iju—1^^^^^mky=誠HL=1j=1u=1、1y,=三、一S;=—~1^(y-y)2=1S2=土yy(y-y)2

=1j=1s2=1yyyy3nm(k—1)=1j=1u=1若三階抽樣中,每階抽樣都是簡單隨機(jī)的,則總體均值亍的無偏估計量為y=-yy

ni=1其方差為V(y)=上匕S2+上八S2+上匕S2

n1nm2mnk3方差的無偏估計量為其中V(y)=上匕S2+(1—f2)f1S2+f1f2(1—12S2

n1nm2mnk3其中f=n,f=m,f=Jl1N2M3K第三節(jié)一階單元不等大小的兩階抽樣在兩階抽樣中,各一階單元所包含的二階單元數(shù)不等是最普遍的現(xiàn)象,因此對其樣本指標(biāo)和抽樣方差的估算,具有普遍意義,但較一階單元等大小的估算復(fù)雜很多。根據(jù)各個一階單元的M不相等及其差異程度是否懸殊,在抽樣時(即抽取一階單元時)就要考慮采用等概

抽樣或不等概抽樣。一、等概率抽樣在進(jìn)行兩階段抽樣時,不考慮各一階單元權(quán)重(主要用所含二階單元數(shù)的多少表示)的不同,一律予以同等被抽中的機(jī)會,在Mj的變異不大時,既簡單易行,且效果也好;當(dāng)M「的變異懸殊時,則會對抽樣產(chǎn)生不合理的影響。假定總體由N個一階單元組成,第i個一階單元包含M個二階單元。從N個一階單元中按簡單隨機(jī)抽樣抽取n個一階單元,然后在每個被抽中的一階單元中按簡單隨機(jī)抽樣抽取m個二階單元。1、簡單估計量由于兩階段的抽樣都是簡單隨機(jī)的,因此總體總和的無偏估計量為了N"了N頂M頂N5\,_Y———乙Y———乙i乙y=——乙Myun.1in.1m.1jn.1ii當(dāng)兩階段均為不放回抽樣時,其方差為£(Y-Y)2V(Y)-N2(1-fi—,,unN—1NYM2(1-f)S2

+i22iNYM2(1-f)S2

+i22in1mV(Y)-N2(1-f)un2u+n-1n■1m其中/1=n/N為第一階段抽樣比,S2:2iM2u+n-1n■1m其中/1=n/N為第一階段抽樣比,S2:2iM-1i1£言-Y)2j—1S22iY—Y/My,=y,/m,若f2i=f2,即第二階段的抽樣比為常數(shù),則Y廣N££y〃

nf2i=1j=1j可見,此時Y是自加權(quán)的u%是總體中每個二階單元入樣的概率。若估計總體均值,則有其方差為v(Y)=v(Y)/M2u0方差估計量為V(Y)=V(Y)/m20其中M0i=12、比估計量簡單估計量Y雖然是無偏的但效果一般不好方差較大。因此也可利用以M.為輔助變量來構(gòu)造比估計量。Em,iiEy比估計量是有偏的£m0Emi=1i=1i=1其估計量七^,的近似方差為RN2(1—f)VEm2(y—y)2iiN£M2(1—f)S2方差估計量為ni=1ni=1由此易得關(guān)于估計量YR的相應(yīng)結(jié)果—.”一一V氣)=V氣)/M0人=、一V(Y)=V(Y)/M2,RR0其中M用-乎M〔估計。=13、比例的估計在估計亍的公式中,令=J1,若第i個一階單元中第/個二階單元具有某特性,

yij=]0,若第i個一階單元中第^個二階單元不具某特性,就可得到估計比例P的公式。由于二階單元總數(shù)通常是未知的,這里給出比估計的公式?!?...........設(shè)P.表示第i個一階單元的二階樣本單元中具有某特性的單位占的比例,則總體中具i2mpii有該特性的單位占的比例的估計量-2mpii4=1Em

i

i=1其方差估計量V(PV(P)=1—LnM2V乙m2(P—P)ii4=11…1、1Em2(1—f)J,2im—1i其中M=1Emn'i=1二、不等概率抽樣關(guān)于不等概率抽取一階單元的問題,統(tǒng)計學(xué)家們進(jìn)行了廣泛的討論,提出了一系列方法,考慮到有些方法過于復(fù)雜,同時也限于篇幅,這里只討論當(dāng)n>1時的一般情形。(一)放回的不等概率抽樣1、估計量及其方差設(shè)總體由N個一階單元組成,第i個一階單元包含Mi個二階單元。按PPz抽樣(與第一階單元的大小成比例的放回地逐個獨(dú)立地抽樣)抽取了n個一階單元,第i個一階單元入樣的概率為z.,Ez=1,(z=M'/M',M'=£m,M'為衡量第i個一階單元大小尺Iiii00iii=1i=1i=1度;若M'為確知,則工氣=M〔lM0)。然后在被抽中的一階單元中,按簡單隨機(jī)抽樣,i=1抽取m個二階單元,八=m/M(i=1,2,…,n)。如果一階單元被重復(fù)抽中,則原來在第二階段抽樣中被抽中的mi個二階單元也放回,按簡單隨機(jī)抽樣再抽mt個二階單元。在這種情況下,總體總和的無偏估計量是\-_°1^Y1y^MyY=_—-i-=_——i~i~ppzn.]z,n.]z,q二,.—Y可看作是從總體{尸/z,I=1,2,…,N]中獨(dú)立抽取的一個大小為n的樣本(對一階單元ppzi1而言)的樣本均值??梢宰C明:YE(―)=Yziq....所以,Y是Y的無偏估計,其方差為ppz八1yyyM2(1-f)s2V(Y)=_[力z(―-Y)2+力一J2i'2i]ppzn,1iz■]zm方差估計量*—1vY"V(Yppz)=B'(zfpz)2i=1i是無偏的。當(dāng)一階單元被重復(fù)抽中時,抽取二階單元的其它方法:①若第i個一階單元被抽中J次,就從中一次隨機(jī)抽取mti個二階單元(假定mt<M),此時v(Y)減少匕1£ms2ppzn12i1②不論第i個一階單元被抽中多少次,都只從中隨機(jī)抽mi個二階單元,這時V(Y)增加日f2i)S2ippzni1mi在①、②兩種情況下,估計量均為Y=礦」肱".nz

其中匕為第i個一階單元被抽中的次數(shù)。2、估計量為自加權(quán)的條件前面已提到,如果一個估計量能表示成所有樣本單元(在二階抽樣中是指所有二階單元)的觀測值之和乘以某個常數(shù),則該估計量稱為是自加權(quán)的。在ppz抽樣時,由YYppz=1£MX=1£M£n.=]z.得Y自加權(quán)的條件是ppzM

i—

nzm此時Yppz=K£AYppz.i=1j=1其中K為常數(shù),f=nzm是任意一個二階單元被抽中的概率,因而,上式表示任意一個0Mi〃mf二階單元被抽中的概率都相等。在實(shí)際應(yīng)用中,若f0事先確定,f2i=m=土也可按已ii被抽中的二階

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論