版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
抽樣期末知識(shí)點(diǎn)匯總一.緒論(一)抽樣調(diào)查抽樣調(diào)查是指非全面調(diào)查的總稱。只要是從研究的對(duì)象中抽取部分單位加以調(diào)查用來說明全體,就統(tǒng)稱為抽樣調(diào)查。(廣義)選樣方法:非概率抽樣&概率抽樣非概率抽樣抽樣方法:目的抽樣、判斷抽樣、任意抽樣、方便抽樣、配額抽樣(蓋洛普民意測(cè)驗(yàn)、自愿樣本原因:(1)受客觀條件限制,無法進(jìn)行嚴(yán)格的隨機(jī)抽樣。(2)為了快速獲得調(diào)查結(jié)果。(3)在調(diào)查對(duì)象不確定,或無法確定的情況下采用,例如,對(duì)某一突發(fā)(偶然)事件進(jìn)行現(xiàn)場(chǎng)調(diào)查等。(4)總體各單位間離散程度不大,且調(diào)查員具有豐富的調(diào)查經(jīng)驗(yàn)時(shí)。優(yōu)點(diǎn):成本低,而且容易完成;缺點(diǎn):不能對(duì)估計(jì)的精度作出客觀、準(zhǔn)確的說明。概率抽樣(狹義抽樣調(diào)查)按照概率統(tǒng)計(jì)的原理,從研究的總體中按隨機(jī)原則來抽選樣本,通過對(duì)樣本的調(diào)查獲取數(shù)據(jù),以此來對(duì)總體的特征作出估計(jì)推斷;對(duì)推斷中可能出現(xiàn)的抽樣誤差可以從概率的意義上加以控制。特點(diǎn):(1)對(duì)于一個(gè)具體的調(diào)查,要求總體中的每一個(gè)單元都有一個(gè)已知的非零概率被抽中。(2)抽取樣本的方法必須是隨機(jī)的。(3)根據(jù)樣本來計(jì)算估計(jì)值的方法,應(yīng)符合抽樣的方法確定合適的估計(jì)量。(4)能夠以一定的概率控制抽樣誤差的范圍。概率抽樣:等概率抽樣&不等概率抽樣(二)抽樣調(diào)查的常用概念目標(biāo)總體:可簡稱為總體,是指所要研究對(duì)象的全體,或者說是希望從中獲取信息的總體,它是由研究對(duì)象中所有性質(zhì)相同的個(gè)體所組成,組成總體的各個(gè)個(gè)體稱作總體單元或單位。抽樣總體:指從中抽取樣本的總體。抽樣框:抽樣總體的具體表現(xiàn)。通常抽樣框是一份包含所有抽樣單元的名單??傮w參數(shù):總體的特征。統(tǒng)計(jì)量(估計(jì)量):樣本觀察值的函數(shù)。抽樣誤差:由于抽樣的非全面性和隨機(jī)性所引起的偶然性誤差。非抽樣誤差:由隨機(jī)抽樣的偶然性因素以外的原因所引起的誤差。抽樣誤差表現(xiàn)形式:抽樣實(shí)際誤差、抽樣標(biāo)準(zhǔn)誤和抽樣極限誤差。9.抽樣標(biāo)準(zhǔn)誤(S),抽樣方差(V),V=S210?偏差:樣本估計(jì)量的數(shù)學(xué)期望與總體真值間的離差,玖0)-0=BG)。11?均方誤差:MSE二E@-e)2二V@)+B2(d)。精確度:每次抽樣結(jié)果之間差別大小精度:估計(jì)量的抽樣標(biāo)準(zhǔn)誤差或方差與待估計(jì)參數(shù)之比。14?可靠性:置信度(1-a)抽樣效率:兩個(gè)抽樣方案在樣本量相同的情況下的抽樣方差之比。設(shè)計(jì)效果:Def=d絞V(0)SRS(0)表示某設(shè)計(jì)方案的方差,DiXx11iiXx11ii=1i=1總體指標(biāo)■n簡單隨機(jī)抽樣SRS(一)定義:從容量為N的總體中抽取一個(gè)容量為n的樣本,若所有可能的CN個(gè)樣本中的每一個(gè)被抽到的概率都相等,即每個(gè)可能樣本被抽中的概率均為i=1-NCi=1-N(二)實(shí)施方法:將總體中的單元依次從1到N進(jìn)行編號(hào),然后利用抽簽法或隨機(jī)數(shù)法來進(jìn)行簡單隨機(jī)抽樣。(三)優(yōu)點(diǎn):簡單直觀。在抽樣框完整時(shí),可以直接從中抽選樣本,由于抽選的概率相同,用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)及計(jì)算抽樣誤差都比較方便。(四)局限性:它要求將包括所有總體單元的名單作為抽樣框,當(dāng)N很大時(shí),構(gòu)造這樣的抽樣框并不容易;根據(jù)這種方法抽出的單元很分散,給實(shí)施調(diào)查增加了困難;這種方法沒有利用其他輔助信息以提高估計(jì)的效率。所以在規(guī)模較大的調(diào)查中,很少直接采用簡單隨機(jī)抽樣,一般是把這種方法與其他抽樣方法結(jié)合在起使用。五)估計(jì)R=-ii=1i=1尹Y(Y=0或R=-ii=1i=1尹Y(Y=0或1)y(y=o或1)iii=1(Y一Y)2i=1R=-ii=1i=1(y—y)2i(1)總體均值對(duì)于簡單隨機(jī)抽樣,y是Y的無偏估計(jì)。即E(y)二y對(duì)于簡單隨機(jī)抽樣,y的方差為:v(y)=S2=上丄S2nNnV(y的無偏估計(jì)為:v(刃二-_—Y的置信度為Y的置信度為—的近似置信區(qū)間為(y-*汀2-卩-—、y+ua—s)
i-5n2(2)總體總量(Y=NY=N迓Y對(duì)于簡單隨機(jī)抽樣,Y是Y的無偏估計(jì),ni
對(duì)于簡單隨機(jī)抽樣,Y是Y的無偏估計(jì),Y的方差為:v(Y)=N2V(y)=n2"-—)s2nVC的無偏估計(jì)為:v(Y)=N2v(y)=N2G-—)s2n3)總體比例(1,若第i個(gè)單元具有所考慮的特征?“2H林由若人¥-曰若卄…,i=1,2,,N,總體中有A個(gè)單兀具有0,其他這個(gè)特征,即A=Zy,總體中具有某種特征的單元在總體中所占的比例P即ii=1是Y是Y的均值:Y二N二i區(qū)八八ii=1,由于Y的取值為0i總體方差為:S2=-^-迓(Y—Y)=—^[迓Y2—NY2,由于Y的取值為0iTOC\o"1-5"\h\z\o"CurrentDocument"N—1iN—1(i丿\o"CurrentDocument"i=1i=1或1,所以迓Y2=1Ly,即S2=—(VP—NP)=-^PQ,其中Q=1—P.iiN—1N—1\o"CurrentDocument"i=1i=1£y.\o"CurrentDocument"相應(yīng)地,樣本比例為p=—=—=y,nn
樣本方差為s2=—才(y-y)2=—p(1一p)=—pq(其中q=1一p)-_1i-_1-_1i=1p為P的簡單估計(jì),且為無偏估計(jì),即E(p)=Pp的方差為V(pL乎語PQ二鋁)PQV(p的無偏估計(jì)為:v(p)=-_fs2二-_fpq(其中q二1_p)--一1在大樣本條件下,利用正態(tài)分布可得P的置信度為1-?的近似置信區(qū)間為pq,p+upq,p+u:1—f
—rpq
1_an一12p_uV71_MI-一12六)樣本量的確定費(fèi)用函數(shù):C二C+C-,其中費(fèi)用函數(shù):C二C+C-,其中C為總費(fèi)用,C為固定費(fèi)用,C為每調(diào)查一個(gè)T0T樣本單元所需的費(fèi)用。絕對(duì)誤差限:d二u二uS6)1_d1一區(qū)22sG)O.1~2cvG)其中cvk)=相對(duì)誤差限:r=u=u=ua6d6a.1_1_1_222(七)簡單隨機(jī)抽樣估計(jì)總體均值或總體總量時(shí)樣本量的確定:(
sd
EtTs(J6(1)精度要求:估計(jì)量y的方差上限為(1)精度要求:估計(jì)量y的方差上限為v設(shè)-=£1,貝切—,因此取-=_2—0Vnn1+—o1+-0-NNn,如果n《N時(shí),即<0.05,N樣本量直接取-,否則對(duì)-進(jìn)行修正,取-。02)精度要求:估計(jì)量y的絕對(duì)誤差為d,則S23)精度要求:估計(jì)量2)精度要求:估計(jì)量y的絕對(duì)誤差為d,則S23)精度要求:估計(jì)量y的相對(duì)誤差為r,則-二-0(u1_asy2-d4)精度要求:估計(jì)量y的變異系數(shù)上限為C,則no(usy2
d
'u丿1_a_rY,i丿S2
v3=n0—n1+TNnn—0—n一10N5)估計(jì)總體比例時(shí)樣本量的確定:u2PQu2Q/i占PQQ2=2==d2r2PVC2P三?分層隨機(jī)抽樣(一)定義:如果抽樣在每個(gè)層中獨(dú)立進(jìn)行,總的樣本由各層樣本構(gòu)成,這種抽樣方法稱為分層抽樣。若在每層中的抽樣采用SRS,這樣的分層抽樣稱為分層隨機(jī)抽樣。(二)原則:同一層內(nèi)差異小,不同層間差異大。(三)分層原因:當(dāng)總體各單元差異比較大時(shí),對(duì)參數(shù)估計(jì)誤差比較大。將總體分層,同一層中各單位差異小,從每一層中抽取構(gòu)成樣本,這樣樣本就有代表性,可以提高估計(jì)的精度;可以同時(shí)對(duì)子總體進(jìn)行參數(shù)估計(jì);便于依托各級(jí)管理機(jī)構(gòu)進(jìn)行組織和實(shí)施?;罘奖?;提高估計(jì)精度。(四)優(yōu)點(diǎn):分層樣本代表性好;可總體參數(shù)估計(jì),也可對(duì)層參數(shù)估計(jì);實(shí)施靈活方便;提高估計(jì)精度。丁=y=另wy=—2^NyTOC\o"1-5"\h\z(五)分層隨機(jī)抽樣總體均值:stysthyNh=1h=1E(y)=l^WE(y)=1^WY=Ysthhhhh=1h=1W21一fS2hnhh=1hV(y)=W21一fS2hnhh=1hShhhhh=1h=1無偏估計(jì):掃二」7土掃二」7土(必一九)'
叫-lxY=Nyststfl=lnh(六)分層隨機(jī)抽樣總體總值:蚊)=F卩也)=£瓦的-碼)盤叭緒-丈叫的-勵(lì)魚是叫匕)的一個(gè)無偏估計(jì)/J=lnh七)分層隨機(jī)抽樣總體比例:p=^L七)分層隨機(jī)抽樣總體比例:p=^LWpsthhh=1IS-3吧薯警G網(wǎng)幾)二咕若逬寧2腫提叫幾)的「個(gè)無偏估比當(dāng)飩很人時(shí),叫*皿,所臥vj(m—1)離1?此時(shí)珥必嚴(yán)士嗆上厶PQft-ifh估il?量為切仏)=g:宇討乩*(八)分別比估計(jì)(對(duì)每層樣本分別考慮比估計(jì)量,然后對(duì)各層的比估計(jì)量進(jìn)行加權(quán)平均)MSE(yRs)^V(yRs)衛(wèi)叭(】-幾)(陽+用昭—2&口幾兄Jj(=i叫MSE{YRs)^V(YRs)^£AV(1-A)fe+R沁-2也林前h=l叫(九)聯(lián)合比估計(jì)(先對(duì)兩個(gè)指標(biāo)先分別計(jì)算出分層估計(jì),然后再構(gòu)造比估計(jì))ySc=孕壬=丘龍“"Li\N晉X=&X
(十)分別比估計(jì)與聯(lián)合比估計(jì)的比較(十)分別比估計(jì)與聯(lián)合比估計(jì)的比較當(dāng)各層n的都比較大時(shí),各層比率R之間差異比較大,此時(shí)分別比估計(jì)要優(yōu)hh于聯(lián)合比估計(jì);當(dāng)某些層n的不夠大時(shí),或者各層的比率R差異較小,還是采用聯(lián)合比估計(jì)更hh分別比估計(jì)需要知道各層的子總體輔助變量信息,而聯(lián)合比估計(jì)只需要知道總體輔助變量的信息。十一)樣本量在各層的分配常數(shù)分配:W2h1一fypW2S2ypwS常數(shù)分配:W2hhS2=h_h—hhTOC\o"1-5"\h\z\o"CurrentDocument"nhnN\o"CurrentDocument"hh=1hh=11.層大小差不多,且沒有任何關(guān)于層的其他信息2.比例分配:即n=nW2.hh層大小有差異,且每層的方差不大Neyman分配:使n與WS成正比,即n=n^i^hhhhiLWS3.hh每層估計(jì)量達(dá)到相同精度當(dāng)S相等時(shí),最優(yōu)分配就是比例分配hnh4.nh4.最優(yōu)分配:考慮簡單的線性費(fèi)用函數(shù):C=c+cnT0hhh=1式中C是總費(fèi)用,c是與樣本量無關(guān)的固定費(fèi)用,而c是T0h在第h層中抽取一個(gè)單元的平均費(fèi)用十二)總樣本量的確定1.調(diào)查目標(biāo)是估計(jì)總體均值若V是給定的估計(jì)量y方差的上限,則有V=另巴送-藝空stnNTOC\o"1-5"\h\zh=1hh=1對(duì)某種分配n=n-w,h=1,2,...,Lhh“2S2yWS212S21丫…V=h_h—=h_h—WS2藝(W2S2/w)hhhn=―廠V+[KwS2藝(W2S2/w)hhhn=―廠V+[KwS2/N估計(jì)總體均值估計(jì)總體總值(1)常數(shù)分配1T設(shè)£是給定的護(hù)的方差上限,w=—,h=1,2,...,LsthL則將V—V/N2代入l^Lws2工N2S2/w力一1.▼一hhhn—八h、V+乙NS2nhh—n—h1n—0—h—1hhh1+-0V+(^WS2/N)Nhhh=1(2)比例分配w=W,h=1,2,...,L(2)比例分配w—W,h—1,2,...,LhhhhKwS2N工NS2——X-hhhV+乙NS2nhhn—o—h=1hhhnx1+fV+(乙WS2/N)Nhhh=1Ih=ihh丿(3)Neyman分配wshh—Ewshhh=1(3)Neyman分配WSh(3)Neyman分配wshh—Ewshhh=1(3)Neyman分配WShh—Ewshhh=1pEws]Ihh丿n=h=—V+丄EWS2Nhhh=1(工NS)2n=p11h—y+乙ns2hhh(4)最優(yōu)分配另WhSh応[另W”s”/妊]L—1丿'L—1丿n=—h=1h=1V+^WS2/Nhhh=1若精度是對(duì)y的絕對(duì)誤差限a(在給定置信度下度是對(duì)f的絕對(duì)誤差限入(在給定置信度下)st形式給出,即stst形式給出,即A2_.將V=仝置換前面各結(jié)果z2a/2將V=竺置換前面各結(jié)果z2a/2st形式給出,即將V=(比)2置換前面各結(jié)果za/2將V=(空)2置換前面各結(jié)果za/2st若精度是對(duì)y的相對(duì)誤差限丫(在給定置信若精度是對(duì)y的相對(duì)誤差限丫(在給定置信度下)stst形式給出,即2.調(diào)查目標(biāo)是總體比例P將Sh2=PhQh置換前面估計(jì)總體均值結(jié)果3.optpropsrs
3.optpropsrs四.整群抽樣(一)定義:整群抽樣是將總體劃分為若干群,然后以群為抽樣單元,從樣本中隨機(jī)抽取一部分群,對(duì)選中的群的所有基本單元進(jìn)行調(diào)查的一種抽樣技術(shù)。目的主要是擴(kuò)大抽樣單位,簡化組織工作。(二)特點(diǎn):抽樣框的編制簡單;實(shí)施便利,節(jié)省費(fèi)用;抽樣誤差相對(duì)較大。發(fā)揮整群抽樣的優(yōu)勢(shì),因?yàn)槠涫r(shí)省力,每個(gè)單元的平均調(diào)查費(fèi)用比較少,故可通過增大樣本量的方法彌補(bǔ)精度的損失。(三)群的劃分:盡量擴(kuò)大群內(nèi)差異,而縮小群間差異。這樣,每個(gè)群都具有足夠好的代表性。所以分群的原則使“群內(nèi)差異大、群間差異小”與分層的原則使“層內(nèi)差異小,層間差異大”是恰好相反的。(四)群的規(guī)模:組成群的單元的數(shù)量。其選擇一是取決于精度與費(fèi)用之間的平衡,二是從抽樣實(shí)施的組織管理等因素來考慮。(五)等概率整群抽樣的情形(群規(guī)模相等)總體群間方差:S2二也迓(Y-Y)2總體群內(nèi)方差:S2=1遲另(Y-Y〉bN一1i'wn(M—1)ijiiij樣本群間方差:s2=bn-1i工(y-y)2樣本群內(nèi)方差:is2樣本群間方差:s2=bn-1i工(y-y)2樣本群內(nèi)方差:is2=1工遲(y-y)wn(M-1)iijij總體方差:S2=n2茲"ij:-Y)樣本方差:s2=nM-1(y-y>ij1、總體均值戸的估計(jì)二丄Myni
i=12、總體總和Y的估計(jì)?NnNY=NM?y=mY=ynini=13、總體比例P的估計(jì)V(y)=NT~1為(Y-Y)2=nM2N-1ii=1P=p=-工P=丄工aninMi
i=1i=1□-為(Y/M-Y/M)2=
N-1ii=1r丄牙(Y-y)2=rN-1ii=1S2nMbv(y)=昌2nMbv(v(Y)二N2M2v(y)V(Y)=V(NMy)=N2M2V(y)
迓(P-P)2工(P-P),1-fi…1-fiV(P)二——4V(p)二——亠nN-1nn-1設(shè)計(jì)效應(yīng)仍用總體均值估計(jì)量的方差進(jìn)行討論,并且考慮等概率抽樣的情形。由前面1一f的分析可知,y的估計(jì)量y的方差為v(y)沁——S2[i+(M-1)P]nMCsrs如果按簡單隨機(jī)抽樣從總體中抽取nM個(gè)次級(jí)單元,則:V(y)二爲(wèi)S2srs所以,整群抽樣的設(shè)計(jì)效應(yīng)為:Deff二V(y)~
V(y)srs孚S2[1+(M-1)p所以,整群抽樣的設(shè)計(jì)效應(yīng)為:Deff二V(y)~
V(y)srs□S2s2-s2Ps2-s2P二bws2+(M—1)s2bw1+(M-1)pC當(dāng)p>0時(shí),Deff<1,則整群抽樣的精度較簡單隨機(jī)抽樣在相同樣本量時(shí)要差。C當(dāng)p<0時(shí),Deff<1,則整群抽樣的精度較相同樣本量的簡單隨機(jī)抽樣要高。c即可達(dá)到整群抽樣nM戶樣本量若令n為簡單隨機(jī)抽樣的樣本量,貝也=Mn即可達(dá)到整群抽樣nM戶樣本量srssrsdeff相同的估計(jì)精度。11四.多階段抽樣(一)定義:在總體各單位(初級(jí)單位PSU)中抽取樣本單位,在抽中的初級(jí)單位中再抽取若干個(gè)第二級(jí)單位(SSU),在抽中的第二級(jí)單位中再抽取若干個(gè)第三級(jí)單位……,直至從最后一級(jí)單位中抽取所要調(diào)查的基本單位的抽樣組織形式,就叫做多階段抽樣。(二)特點(diǎn):便于組織抽樣;可以使抽樣方式更加靈活和多樣化;能夠提高估計(jì)精度;可以提高抽樣的經(jīng)濟(jì)效益;可以為各級(jí)機(jī)構(gòu)提供相應(yīng)的信息。(三)適用范圍:在社會(huì)研究中,當(dāng)總體的規(guī)模特別大,或者總體分布的范圍特別廣時(shí),研究者一般采取多階段抽樣的方法來抽取樣本。(四)基本假定:初級(jí)單元中所包含的次級(jí)單元數(shù)目相同,均為M,因此從抽中的初級(jí)單元中再抽取的次級(jí)單元個(gè)數(shù)也相同,為m;兩個(gè)階段的抽樣方法都是簡單隨機(jī)抽樣;在抽中的初級(jí)單元中作第二階抽樣是相互獨(dú)立進(jìn)行的。(五)分層抽樣、整群抽樣、二階抽樣的共同點(diǎn)及區(qū)別共同點(diǎn):都將總體分為若干子總體(層、群)區(qū)別:分層抽樣——對(duì)總體中每個(gè)子總體(層)都進(jìn)行抽樣;整群抽樣——對(duì)總體中被抽中的若干個(gè)子總體(群)進(jìn)行普查;二階抽樣——對(duì)總體中被抽中的若干個(gè)子總體(群)再進(jìn)行抽樣。(六)二階抽樣的效率通常情況下,二階抽樣的設(shè)計(jì)效應(yīng)大于1。這說明二階抽樣的效率要低于簡單抽樣,但是由于二階抽樣有著樣本分布集中,可以省時(shí)、省力和省費(fèi)用的優(yōu)點(diǎn),因此從這個(gè)意義來講,二階抽樣的效率就不一定低于簡單隨機(jī)抽樣了。二階抽樣效率通常低于分層抽樣。二階抽樣的效率有時(shí)低于整群抽樣,有時(shí)高于整群抽樣。(七)估計(jì)第一階段和第二階段的抽樣比:f=n/N,f=m/M1Y=Ry二丄區(qū)j=1yY=Ry二丄區(qū)j=1yimijj=1初級(jí)單元間的方差:S12=N-1Y=丄YyNi
i=1£(F-Y)iy=-Yynii=1i=1s2=Y(y-y》1n-1ii=1iiii初級(jí)單元內(nèi)的方差:逬=ntm歸江〔Y>皆nrmh註—詁i=1j=1i=1j=1i.總體均值:Y=y=1Yy=丄工Kyninmij
1i=1j=1V(y)=匕]S2+口2S2卩(y)=上厶2+fG_f2)s2n1nm2n1nm22.P=—迓P=-^迓A=Yp=-工p=—工aNiNMininmi1111V(p)=乎Nn另(P-P)2+YN(Mh另怏11v(p)=¥nhE(pi-p)2+乎侖)瓦piq11五.不等概抽樣(一)定義:如果總體中每個(gè)單元進(jìn)入樣本的可能性是不相等的,則這種隨機(jī)抽樣方式就稱為不等概率隨機(jī)抽樣,簡稱不等概率抽樣。(二)特點(diǎn):將總體中每個(gè)單元的入樣概率與其“規(guī)?!贝笮÷?lián)系起來,使得“大單元”被抽到的概率大,“小單元”被抽到的概率小。(三)優(yōu)點(diǎn):能夠大大提高抽樣精度,減少抽樣誤差。(四)局限性:必須具有能夠說明單元規(guī)模大小的輔助變量來確定各個(gè)單元的入樣概率或包含概率。(五)適用場(chǎng)合:總體單元之間的差異較大。(六)分類抽樣容量n固定時(shí),單元入樣的概率(不放回抽樣)或每次抽樣的概率(有放回抽樣)與單元的大小嚴(yán)格成比例。這種情況下的有放回抽樣稱為PPS抽樣,不放回抽樣稱為nPS抽樣?!复a法(漢森一赫維茨(Hansen-Hurwitz)法)PPS抽樣:有放回抽樣-拉希里L(fēng)ahiri)法(二次抽取法)-L規(guī)模累積等距抽選法nPS抽樣:不放回抽樣-Brewer(布魯爾)方法(1963)Durbin(德賓)方法(1967)代碼法:它適合于N不太大的情形。假定所有Mi為整數(shù)(若不然也可以乘以一個(gè)倍數(shù)M0,使一切M=MZ成為整數(shù)),對(duì)于具有整數(shù)Mi的第i個(gè)單元賦予一個(gè)與i0iMi相等的代碼數(shù)。每次抽樣前,先在整數(shù)1,2,…,M0里面隨機(jī)等可能地選取一個(gè)整數(shù),設(shè)為m若代碼m屬于第j個(gè)單元擁有的代碼數(shù),則第j個(gè)單元入樣。這個(gè)過程重復(fù)n次,得到n個(gè)單元入樣(當(dāng)然存在重復(fù)的可能),構(gòu)成了pps樣本。Lahiri法:令M*=max{M}每次抽取一個(gè)[1,N沖的隨機(jī)數(shù)i及[1JM*沖的隨機(jī)數(shù)m.1<i<N1若M>m,則第i個(gè)單元入樣;否則重抽一組(i,m).i2V2V(七)漢森一赫維茨(Hansen-Hurwitz)估計(jì)量(總量估計(jì))Y=1卍匕”Hn曰f口\二)如心)疔(Y)=(Y)=1丄乞[Zhhnn一1i=1/、——YZHHIZ丿i刃y■f——o————1—(n—1)IMi八i八、YM丿i0丿六?系統(tǒng)抽樣(Systematicsampling)(一)定義:又稱為等距抽樣、機(jī)械抽樣。按照這種抽樣方法,從總體中抽取第一個(gè)樣本點(diǎn)(隨機(jī)起點(diǎn)),然后按某種固定的順序和規(guī)律依次抽取其余的樣本點(diǎn),最終構(gòu)成樣本。(二)優(yōu)點(diǎn):樣本分布比較均勻,在現(xiàn)實(shí)生活中比較容易接受;樣本單位抽取簡便,有很高適用價(jià)值;簡便易行,簡化抽樣手續(xù)。(三)缺點(diǎn):如果單元的排列存在周期性的變化,而抽樣者對(duì)此缺乏了解或處理經(jīng)驗(yàn),抽取的樣本可能代表性很差。系統(tǒng)抽樣的方差很復(fù)雜,對(duì)估計(jì)帶來很大困難。有時(shí)估計(jì)量是有偏的。抽樣誤差計(jì)算上比較復(fù)雜。(四)特點(diǎn):系統(tǒng)抽樣只需要抽取一個(gè)樣本單位,然后按照某種規(guī)律,順次地得到整個(gè)樣本。(五)抽樣一般方法:直線等距抽樣假設(shè)總體單元數(shù)為N,樣本容量為n,N=nko在1-k中隨機(jī)抽出一個(gè)單元編號(hào),然后每隔k個(gè)單元編號(hào)抽取一個(gè)單元編號(hào),直到抽出n個(gè)單元編號(hào)為止。2?循環(huán)等距抽樣(適用于k不為整數(shù))抽樣間距k取最接近N/n的整數(shù),從1?N中隨機(jī)抽取一個(gè)隨機(jī)起點(diǎn)作為起始單元,然后每隔k個(gè)抽取一個(gè),直到抽取滿n個(gè)為止。如果序號(hào)大于N時(shí),將其減去N得到的在1—N中的號(hào)碼入選。(六)抽樣方法改進(jìn)中心位置法起點(diǎn)不是隨機(jī)取,而是直接取第一階段的k個(gè)單元中處于中間位置的單元。K奇數(shù),r=(k+1)/2;k偶數(shù),r=k/2或r二k/2+1。雖然可以提高精度,但對(duì)于一定順序排列的總體,樣本是確定的,失去了隨機(jī)性。尤其對(duì)同樣問題進(jìn)行連續(xù)性調(diào)查,樣本老化,會(huì)帶來較大不利影響。對(duì)稱系統(tǒng)抽樣當(dāng)N=nk且n為偶數(shù)時(shí),將總體分為n/2組,每組含有2k個(gè)單元,在各段內(nèi)隨機(jī)抽取與兩端等距地兩個(gè)單元作為樣本,一端靠近低端,一端靠近高端。假設(shè)隨機(jī)起點(diǎn)為i(1WiWk),入樣單元:「i+2jk,2(j+l)k—i+1]j=0,1,2,…,--1L」2(七)等概系統(tǒng)抽樣(即等距抽樣)估計(jì)量的性質(zhì)1.Y的估計(jì)量均值y1.Y的估計(jì)量均值y二y」Yynrjj=1當(dāng)N=nK,y為Y的無偏估計(jì)量,當(dāng)N工nK,syrsy2.Y的估計(jì)量方差y為Y的有偏估計(jì)量。syV(yV(y)=e(y-Y)2=1y(y-Y)2sysykrr=11—fN—n1y=s2=乙(y一y)2nnNn-1isyi=1反映sy與SRS關(guān)系的方差計(jì)算公式:kv(y)=yk(y一Y)2,又有反映sy與SRS關(guān)系的方差計(jì)算公式:syrr=1S2=—藝區(qū)(y-Y)2n(N-1)S2=藝區(qū)(y-Y)2N一1rjrjr=1j=1r=1j=11)=ny(y一Y)2+yy(y一y)2=nkV(y)+(y一y)21)rrjrsyrjrr=1r=1j=1r=1j=1令S2=1YXn(y-y)2(系統(tǒng)樣本內(nèi)方差)wsyk(n一1)rjrr=1j=12wsyr=1j=1則將k(n—1)S2=(y—y)2代入(2wsyr=1j=1rjr便有:(N-1)S2=nkV(y)+k(n一1)S2,得:v(y)=(N一1S2—k(n—1)S2sywsysyNNwsy系統(tǒng)抽樣優(yōu)于簡單隨機(jī)抽樣的條件為:(N一DS2—S2<口竺NNwsyNn即(N一DS2一4聖<K(n-】)s2,所當(dāng):NNnNwsyN一nk(n一1)S2>[(N一1)一]S2>k(n一1)S2,就是S2>S2,sy效率高于SRS。wsynwsy當(dāng)總體單元的排列順序與要研究的總體特征總量的大小高度相關(guān),不管是正相關(guān)還是負(fù)相關(guān),則系統(tǒng)抽樣更接近于分層抽樣;當(dāng)總體單元的排列順序與要研究的總體特征變量的大小相關(guān)程度極低時(shí),則系統(tǒng)抽樣更接近于簡單隨機(jī)抽樣;當(dāng)總體單元的排列順序與要研究的總體特征變量的大小相關(guān)程度介乎于兩者之間,則很難知道系統(tǒng)抽樣到底與其他三種抽樣方式的哪一種更相似。附:考試范圍《抽樣技術(shù)》期末復(fù)習(xí)提綱第一章緒論1、了解抽樣調(diào)查的意義、特點(diǎn)、發(fā)展歷史、應(yīng)用及分類組織。2、理解和掌握總體、樣本、抽樣框、樣本可能數(shù)目的基本概念。3、理解和掌握概率抽樣與非概率抽樣的區(qū)別,抽樣誤差與非抽樣誤差的區(qū)別與聯(lián)系等。4、系統(tǒng)地掌握和熟練地應(yīng)用統(tǒng)計(jì)量的抽樣分布、抽樣誤差的計(jì)算、抽樣估計(jì)的方法和步驟、抽樣設(shè)計(jì)效果的評(píng)價(jià)等問題。第二章簡單隨機(jī)抽樣1、理解簡單隨機(jī)抽樣的概念、地位和特點(diǎn)。2、熟練地掌握簡單隨機(jī)抽樣的具體方法、總體均值、總量、比例的估計(jì)方法以及樣本容量的確定方法等并能夠熟練應(yīng)用。3、熟練掌握比率估計(jì)的構(gòu)造定義。第三章分層隨機(jī)抽樣1、理解分層抽樣的概念與特點(diǎn)。2、熟練掌握分層抽樣的原則、特點(diǎn)、估計(jì)的方法。3、深入理解分層抽樣中總樣本量在各層間分配的方法。4、了解分層隨機(jī)樣本中的比率估計(jì)的構(gòu)造。第四章整群抽樣與多階段抽樣1、了解整群抽樣的原則、特點(diǎn)、適用場(chǎng)合。2、掌握群規(guī)模相等時(shí)整群抽樣的方法及對(duì)總體指標(biāo)的估計(jì)方法。3、理解抽樣效果與樣本容量的分析確定方法,分清整群抽樣與分層隨機(jī)抽樣的區(qū)別。4、了解多階段抽樣的原則、特點(diǎn)及適用場(chǎng)合。5、了解初級(jí)單元相等時(shí)兩階段抽樣中對(duì)總體指標(biāo)的估計(jì)方法。第五章不等概抽樣1、理解并掌握不等概率抽樣的意義、特點(diǎn)、實(shí)施方法。2、熟練掌握PPS抽樣條件下估計(jì)量及其誤差計(jì)算。3、了解不放回不等概抽樣的概念。第六章系統(tǒng)抽樣1、理解和掌握等距抽樣的特點(diǎn)與實(shí)施方法。2、熟練掌握總體單元隨機(jī)排列情形,總體參數(shù)的估計(jì)以及估計(jì)量方差的估計(jì)方法。附:練習(xí)題簡單隨機(jī)抽樣:為調(diào)查某5443戶城鎮(zhèn)居民服裝消費(fèi)情況,采用簡單隨機(jī)不重復(fù)抽樣調(diào)查了36戶進(jìn)行調(diào)查,得到平均消費(fèi)支出y=649.72元,s2=304803試根據(jù)此估計(jì):(1)該地區(qū)居民服裝消費(fèi)支出總額,并給出置信水平為95%的置信區(qū)間。(2)如果希望服裝平均消費(fèi)支出的相對(duì)誤差限不超過5%,則樣本量至少應(yīng)為多少?解:N二5443,n二36,y二649.72,s2二304803,t二1.96n~11一f(1)f=—=0.66%,~?Ny土N-1?爲(wèi)一f-s2N\nY=N-y=3536425.96v(y)=1^f-s2=8410.8695nv(Y?)=N2?v(刃SE(Y?)=499181.843312?12?s2r2Y2(2)r<5%,n=0—,nn01+—0N根據(jù)題中相關(guān)數(shù)據(jù)可得n>1110戶,由此可得n>922戶。要滿足相應(yīng)的精度要0求,至少得抽922戶做樣本。簡單隨機(jī)抽樣(比例):某地區(qū)10000名群眾,現(xiàn)欲估計(jì)在擁有本科學(xué)歷及以上的群眾所占的比例,隨機(jī)不重復(fù)抽取了300名群眾進(jìn)行調(diào)查,得到p=0.25,試估計(jì)該地區(qū)群眾擁有本科以上學(xué)歷的比例,并以正態(tài)分布近似給出其95%的置信區(qū)間。n解:N=10000,n=300,f=—=0.03,p=0.25,t=1.96Nv(p)=_f?p?(1-p)q6.08x10-4n一1hh=1SE(p)沁0.0247所以本科生中暑假參加培訓(xùn)班的95%的置信區(qū)間為p土t-SE(p)二25%土(1.96x0.0247)二25%土0.0484即(0.2016,0.2984)分層隨機(jī)抽樣:對(duì)某地區(qū)171980戶居民家庭收入進(jìn)行調(diào)查,以居民戶為抽樣單位,根據(jù)城鎮(zhèn)和鄉(xiāng)村將居民劃為2層,每層按簡單隨機(jī)抽樣抽取300戶,經(jīng)整理得如下數(shù)據(jù):層NhyhWhsh城鎮(zhèn)23560151800.1372972鄉(xiāng)8632546試根據(jù)此估計(jì):(20分)(1)居民平均收入及其95%的置信區(qū)間。(2)若是按比例分配和奈曼分配時(shí),各層樣本量分別應(yīng)為多少?解:(1)由題中相關(guān)數(shù)據(jù)資料:y二fW-y沁10585.39(元)sthhh=1f2S2、’,W2-(1-f)1沁545.5718+16059.7364=16605.3082(元)sthhnTOC\o"1-5"\h\zh=1hse(Y)沁128.86(元/戶),=1.96st該地區(qū)居民平均收入的95%的置信區(qū)間為:_*.Y+1?se(Y)t(10332.82,10837.96)兀stst(2)按比例分配:n=n?W=600x0.137=82(戶)11n=n?W=600x0.863=518(戶)22W?S按奈曼分配:n=nh——ihLfLW?Shhhhh=1由表中資料:n=600,WS=407.164,WS=2197.19&^2WS=2604.362hhh=11122由上可得根據(jù)奈曼分配,各層所需樣本容量為407.164n=600xq942604.3622197.198n=600xq5062604.362整群抽樣:郵局欲估計(jì)每個(gè)家庭的平均訂報(bào)份數(shù),該轄區(qū)共有4000戶,劃分為400個(gè)群每群10戶,現(xiàn)隨機(jī)抽取4個(gè)群,取得資料如下表所示:群各戶訂報(bào)數(shù)y..jyi11,2,1,3,3,2,1,4,1,11921,3,2,2,3,1,4,1,1,22032,1,1,1,1,3,2,1,3,11641,1,3,2,1,5,1,2,3,120試估計(jì)平均每戶家庭訂報(bào)份數(shù)及總的訂報(bào)份數(shù),以及估計(jì)量的方差。解:由題意得到N=400,n=4,M=10,/=N=盒=。?01亍1v119+20+1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 技工培訓(xùn)學(xué)校規(guī)章制度
- 職業(yè)衛(wèi)生上崗后培訓(xùn)制度
- 電網(wǎng)公司培訓(xùn)管理制度
- 統(tǒng)戰(zhàn)部教育培訓(xùn)制度
- 創(chuàng)業(yè)培訓(xùn)syb管理制度
- 成人教育培訓(xùn)管理制度
- 幼兒園校本培訓(xùn)遵循制度
- dfs公司培訓(xùn)制度
- 鎮(zhèn)學(xué)區(qū)教師外出培訓(xùn)制度
- 政府培訓(xùn)學(xué)員管理制度
- 胸痛救治單元培訓(xùn)
- 2026年孝昌縣供水有限公司公開招聘正式員工備考題庫及1套完整答案詳解
- 四川省南充市2024-2025學(xué)年高二上學(xué)期1月期末考試化學(xué)試題
- 產(chǎn)前篩查檔案管理制度
- 虛擬電廠的分布式能源協(xié)同調(diào)度與彈性運(yùn)行機(jī)制
- 蘭州水務(wù)冬季安全培訓(xùn)課件
- 陜西交控集團(tuán)招聘筆試題庫2026
- 山東省濟(jì)南市槐蔭區(qū)2024-2025學(xué)年四年級(jí)上學(xué)期期末考試語文試卷
- 零售門店銷售激勵(lì)方案設(shè)計(jì)與實(shí)施
- 口腔科智齒培訓(xùn)
- GB/T 26953-2025焊縫無損檢測(cè)滲透檢測(cè)驗(yàn)收等級(jí)
評(píng)論
0/150
提交評(píng)論