版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
抽樣期末知識(shí)點(diǎn)匯總
緒論
(一)抽樣調(diào)查
抽樣調(diào)查是指非全面調(diào)查的總稱。只要是從研究的對(duì)象中抽取部分單位加以調(diào)查,
用來(lái)說(shuō)明全體,就統(tǒng)稱為抽樣調(diào)查。(廣義)
選樣方法:非概率抽樣&概率抽樣
1.非概率抽樣
抽樣方法:目的抽樣、判斷抽樣、任意抽樣、方便抽樣、配額抽樣(蓋洛普民意
測(cè)驗(yàn)、自愿樣本
原因:
(1)受客觀條件限制,無(wú)法進(jìn)行嚴(yán)格的隨機(jī)抽樣。
(2)為了快速獲得調(diào)查結(jié)果。
(3)在調(diào)查對(duì)象不確定,或無(wú)法確定的情況下采用,例如,對(duì)某一突發(fā)(偶然)
事件進(jìn)行現(xiàn)場(chǎng)調(diào)查等。
(4)總體各單位間離散程度不大,且調(diào)查員具有豐富的調(diào)查經(jīng)驗(yàn)時(shí)。
優(yōu)點(diǎn):成本低,而且容易完成;
缺點(diǎn):不能對(duì)估計(jì)的精度作出客觀、準(zhǔn)確的說(shuō)明。
2.概率抽樣(狹義抽樣調(diào)查)
按照概率統(tǒng)計(jì)的原理,從研究的總體中按隨機(jī)原則來(lái)抽選樣本,通過(guò)對(duì)樣本的調(diào)
查獲取數(shù)據(jù),以此來(lái)對(duì)總體的特征作出估計(jì)推斷;對(duì)推斷中可能出現(xiàn)的抽樣誤差
可以從概率的意義上加以控制。
特點(diǎn):
(1)對(duì)于一個(gè)具體的調(diào)查,要求總體中的每一個(gè)單元都有一個(gè)已知的非零概率被
抽中。
(2)抽取樣本的方法必須是隨機(jī)的。
(3)根據(jù)樣本來(lái)計(jì)算估計(jì)值的方法,應(yīng)符合抽樣的方法確定合適的估計(jì)量。
(4)能夠以一定的概率控制抽樣誤差的范圍。
概率抽樣:等概率抽樣&不等概率抽樣
(二)抽樣調(diào)查的常用概念
1.目標(biāo)總體:可簡(jiǎn)稱為總體,是指所要研究對(duì)象的全體,或者說(shuō)是希望從中獲
取信息的總體,它是由研究對(duì)象中所有性質(zhì)相同的個(gè)體所組成,組成總體的各個(gè)
個(gè)體稱作總體單元或單位。
2.抽樣總體:指從中抽取樣本的總體。
3.抽樣框:抽樣總體的具體表現(xiàn)。通常抽樣框是一份包含所有抽樣單元的名單。
4.總體參數(shù):總體的特征。
5.統(tǒng)計(jì)量(估計(jì)量):樣本觀察值的函數(shù)。
6.抽樣誤差:由于抽樣的非全面性和隨機(jī)性所引起的偶然性誤差。
7.非抽樣誤差:由隨機(jī)抽樣的偶然性因素以外的原因所引起的誤差。
8.抽樣誤差表現(xiàn)形式:抽樣實(shí)際誤差、抽樣標(biāo)準(zhǔn)誤和抽樣極限誤差。
9.抽樣標(biāo)準(zhǔn)誤(S),抽樣方差(V),V=S2
10.偏差:樣本估計(jì)量的數(shù)學(xué)期望與總體真值間的離差,E(^=B(^)O
11.均方誤差:MSE=+B-(。)。
12.精確度:每次抽樣結(jié)果之間差別大小
13.精度:估計(jì)量的抽樣標(biāo)準(zhǔn)誤差或方差與待估計(jì)參數(shù)之比。
14.可靠性:置信度(ba)
15.抽樣效率:兩個(gè)抽樣方案在樣本量相同的情況下的抽樣方差之比。
16.設(shè)計(jì)效果:。力=望@
匕RS(。)
%3)表示某設(shè)計(jì)方案的方差,
匕RS(3)表示相同樣本量下簡(jiǎn)單隨機(jī)抽樣的方差。
17.1-f稱為有限總體校正系數(shù)(finitepopulationcorrection,簡(jiǎn)記為fpc),
當(dāng)抽樣比f(wàn)很小時(shí),1-f就接近于1,這樣抽樣比對(duì)了的精度就沒有直接影響;
一般地,當(dāng)抽樣比小于5%,甚至小于10%時(shí),fpc可以忽略不計(jì),即認(rèn)為1-f為
1;事實(shí)上略去fpc的影響是使V(9)高了一些
18.抽樣調(diào)查步驟
確定調(diào)研問(wèn)題一一抽樣方案設(shè)計(jì)一一問(wèn)卷設(shè)計(jì)一一實(shí)施調(diào)查過(guò)程一一數(shù)據(jù)處
理分析一一撰寫調(diào)查報(bào)告
二.簡(jiǎn)單隨機(jī)抽樣SRS
(一)定義:從容量為N的總體中抽取一個(gè)容量為n的樣本,若所有可能的《個(gè)
樣本中的每一個(gè)被抽到的概率都相等,即每個(gè)可能樣本被抽中的概率均為1/G;,
這種抽樣方法稱為不放回的簡(jiǎn)單隨機(jī)抽樣,簡(jiǎn)稱簡(jiǎn)單隨機(jī)抽樣,所得的樣本稱為
不放回的簡(jiǎn)單隨機(jī)樣本,簡(jiǎn)稱簡(jiǎn)單隨機(jī)樣本
(二)實(shí)施方法:將總體中的單元依次從1到N進(jìn)行編號(hào),然后利用抽簽法或隨
機(jī)數(shù)法來(lái)進(jìn)行簡(jiǎn)單隨機(jī)抽樣。
(三)優(yōu)點(diǎn):簡(jiǎn)單直觀。在抽樣框完整時(shí),可以直接從中抽選樣本,由于抽選的
概率相同,用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)及計(jì)算抽樣誤差都比較方便。
(四)局限性:它要求將包括所有總體單元的名單作為抽樣框,當(dāng)N很大時(shí),構(gòu)
造這樣的抽樣框并不容易;根據(jù)這種方法抽出的單元很分散,給實(shí)施調(diào)查增加了
困難;這種方法沒有利用其他輔助信息以提高估計(jì)的效率。所以在規(guī)模較大的調(diào)
查中,很少直接采用簡(jiǎn)單隨機(jī)抽樣,一般是把這種方法與其他抽樣方法結(jié)合在起
使用。
(五)估計(jì)
總體指標(biāo)樣本指標(biāo)
N
丫二匕川+八+…+匕
/=!
?小展…+…+九了’".J+)-,
1N
A1N
2二R=天Z匕(匕二°或1)p=q=」力,(%=0的)
NNF
nn,=1
N
Yr,._£〃,-
R=^_=y=y
R=^—=—=4
fx,.xXn—
AX
/=!/=1
次(匕一斤=上/-力2
(1)總體均值
對(duì)于簡(jiǎn)單隨機(jī)抽樣,歹是歹的無(wú)偏估計(jì)。即E(y)=P
對(duì)于簡(jiǎn)單隨機(jī)抽樣,死勺方差為:v(y)=^^s2=t2s2
nNn
V(巾勺無(wú)偏估計(jì)為:咆)=匕£$2
門的置信度為1-a的近彳濯信區(qū)間為(9-M
_/VN
(2)總體總量(Y=NY=—£丫)
對(duì)于簡(jiǎn)單隨機(jī)抽樣,魂Y的無(wú)偏估計(jì),艮舊同=Y
寸的方差為:v(f)=N2V(y)=N~(I二/)52
n
用加無(wú)偏估計(jì)為:v(y)=N2v(y)=~~—s2
(3)總體比例
工寸[1,若第[?個(gè)單元具有所考慮的特1E.…...._人4一口七
設(shè)Yj=《開,匚,i=l,2,…,NKT,總體中有A個(gè)單兀具有
[0,其他
N
這個(gè)特征,即A=5;匕,總體中具有某種特征的單元在總體中所占的比例p即
是Y的均值:丫=2A=1!1N匕=已
NN£
N
總體方差為:§2=,由于匕的取值為0
NN1z\/V
或1,所以X片=£匕,即§2=------(NP-NP2)=---PQ,其中0=1-P.
i=li=lN—1N—1
相應(yīng)地,樣本比例為p=@=上一=少
nn
樣本方差為/=」*7支(%-歹y=/7P(1-P)=」YP4(其中q=l-p)
〃一1nn-\n-\
P為P的簡(jiǎn)單估計(jì),且為無(wú)偏估計(jì),即E(p)=P
V(p肺無(wú)偏估計(jì)為:v(p)=^--s2=-~^〃4(其中(7=1-〃)
n71-1
在大樣本條件下,利用正態(tài)分布可得P的置信度為1-a的近似置信區(qū)間為
(六)樣本量的確定
費(fèi)用函數(shù):CT=C0+C〃,其中CT為總費(fèi)用,C。為固定費(fèi)用,C為每調(diào)查一個(gè)
樣本單元所需的費(fèi)用。
絕對(duì)誤差限:d=uay/v^)=uaS,)
I---1---
型”耳=?助其中。砥爵甲
相對(duì)誤差限:r=u
tf1-5tf*-yE\uIy
(七)簡(jiǎn)單隨機(jī)抽樣估計(jì)總體均值或總體總量時(shí)樣本量的確定:
(1)精度要求:估計(jì)量》的方差上限為V
樣本量直接取〃°,否則對(duì)%進(jìn)行修正,取〃。
/C、2
,?s
V21-a-rj
(2)精度要求:估計(jì)量少的絕對(duì)誤差為d,則〃o=2=-4一,〃=—?
1——2
(3)精度要求:估計(jì)量了的相對(duì)誤差為r,則〃。
22
(4)精度要求:估計(jì)量歹的變異系數(shù)上限為C,則〃0=2Q_=廠二S立
V-(CY)2-C
(5)估計(jì)總體比例時(shí)樣本量的確定:
〃2p。2Q
I--I--
2_2齊導(dǎo)則〃=4
d2r-P
N
三.分層隨機(jī)抽樣
(一)定義:如果抽樣在每個(gè)層中獨(dú)立進(jìn)行,總的樣本由各層樣本構(gòu)成,這種抽
樣方法稱為分層抽樣。若在每層中的抽樣采用SRS,這樣的分層抽樣稱為分層隨
機(jī)抽樣。
(二)原則:同一層內(nèi)差異小,不同層間差異大。
(三)分層原因:當(dāng)總體各單元差異比較大時(shí),對(duì)參數(shù)估計(jì)誤差比較大。將總體
分層,同一層中各單位差異小,從每一層中抽取構(gòu)成樣本,這樣樣本就有代表性,
可以提高估計(jì)的精度;可以同時(shí)對(duì)子總體進(jìn)行參數(shù)估計(jì);便于依托各級(jí)管理機(jī)構(gòu)
進(jìn)行組織和實(shí)施。
(四)優(yōu)點(diǎn):分層樣本代表性好;可總體參數(shù)估計(jì),也可對(duì)層參數(shù)估計(jì);實(shí)施靈
活方便;提高估計(jì)精度。2L1L
(五)分層隨機(jī)抽樣總體均值:
/:=1h=\
£(兀)=€%,£(%)=£%%=F
h=lh=l
LLLi
V(兀)=v(2%%)=t%"(工)=IX十s;
h=\h=\h=lh
無(wú)偏估計(jì):
5)=之制匕*S''=三力%f>
(六)分層隨機(jī)抽樣總體總值:Y.=八夕”
E(YJ=Y
口比)=1X(N%-%)與
A=11lh
L?2
巾(%)=一巧,)上是的一個(gè)無(wú)偏估計(jì)
A=1nh
(七)分層隨機(jī)抽樣總體比例:
h=\
Eg=P
/&)=品所給攀
1n
ZA-lZhh
W(P")二點(diǎn)X"%是)的一個(gè)無(wú)偏估計(jì)
當(dāng)N“很大時(shí),N?-1RN〃,所以N"/(N%—1),1.
此時(shí)/5”£叫4「念
Mnh
估計(jì)量為*「"”)=2吟IzAPM*
/|=1〃hT
(A)分別比估計(jì)(對(duì)每層樣本分別考慮比估計(jì)量,然后對(duì)各層的比估計(jì)量進(jìn)行
加權(quán)平均)
LL市
K=1;環(huán)m=£環(huán)"八
h=lh=lXh
_L_L
治”啟立共瑞旺心
/TMh=l
(%)。之叮a-力坊j,+R次「2&p凡
ft
/i=ih
MSE(WQ=*)苗N式1-秋維+R2S2h_2RhPhSyhSxh)
/f=l〃/l
(九)聯(lián)合比估計(jì)(先對(duì)兩個(gè)指標(biāo)先分別計(jì)算出分層估計(jì),然后再構(gòu)造比估計(jì))
yRc="大=RCX
_競(jìng)"
人¥八
I:I\C=—4—x=RcX
st
2
M阻加)”(加)空)乙)的+RS;h-2RphS,lSxh)
/i=iNnh
Nj,(if,,)z
心石臉)”(如^~(S;.h+RS;h-2即£凡,)
/i=irth
(十)分別比估計(jì)與聯(lián)合比估計(jì)的比較
1.當(dāng)各層4的都比較大時(shí),各層比率R之間差異比較大,此時(shí)分別比估計(jì)要優(yōu)
于聯(lián)合比估計(jì);
2.當(dāng)某些層a的不夠大時(shí),或者各層的比率R差異較小,還是采用聯(lián)合比估計(jì)更
有效些。
3.分別比估計(jì)需要知道各層的子總體輔助變量信息,而聯(lián)合比估計(jì)只需要知道總
體輔助變量的信息。
(十一)樣本量在各層的分配
廄4以:上公:=”設(shè)上嚕
h=\nhh=\nhh=\N
常數(shù)分配:即%="
1.L
層大小差不多,且沒有任何關(guān)于層的其他信息
2,比例分配:即%=〃叱,
層大小有差異,且每層的方差不大
Ney,/。/?分配:使的與叱河,成正比,即劭=n£島
3.
每層估計(jì)量達(dá)到相同精度
當(dāng)S.相等時(shí),最優(yōu)分配就是比例分配
?一…向N5J瓜
"小5./£少5/£
4.最優(yōu)分配:
考慮簡(jiǎn)單的線性費(fèi)用函數(shù):
L
J=%+匯
h=\
式中a是總費(fèi)用,。。是與樣本量無(wú)關(guān)的固定費(fèi)用,而q是
在第〃層中抽取一個(gè)單元的平均費(fèi)用.
(十二)總樣本量的確定
1.調(diào)查目標(biāo)是估計(jì)總體均值
若V是給定的估計(jì)量方方差的上限,則有必或
/:=1&h=TN
對(duì)某種分配為="?叫,h=l,2,…,L
h=\nh
之叫節(jié);/叼)
力=1
'/N
V+
\h=\7
估計(jì)總體均值估計(jì)總體總值
設(shè)爐是給定的匕的方差上限,
(1)常數(shù)分配wh=-,h=l,2,...,L
L則將V=V/N2代入
叫
n虎卬閭
F+二閭
〃=-^=---詈-------
1+墨V+^W^/N)
Nh=l
(2)比例分配wh=W?,h=l,2,...,L(2)比例分配卬力=此,〃=1,2,…,L
n次卬⑶〃一
N局
n=—=---號(hào)-------V+Z.
1+.V+(次w局/N)
Nh=\
叼4ws
(3)Heyman分配(3)Neyman分酉已w=
Egh汽z叱£
h=]h=\
(L、2
<任】J〃一(ZM)2
1L
V+RZ叱&一O+ZHS
h=\
(4)最優(yōu)分配(4)最優(yōu)分配
(\叱4石)_0網(wǎng)際向(工網(wǎng)8」向
〃一R+Ed同
V+^W^/N
h=\
若精度是對(duì)力的絕對(duì)誤差限△(在給定置彳言鹿精度是對(duì)匕的絕對(duì)誤差限&在給定置彳言度下)
形式給出,即形式給出,即
將丫=與置換前面各結(jié)果將V=絲,空置換前面各結(jié)果
Za/2Za/2
若精度是對(duì)得的相對(duì)誤差限y(在給定置彳言震精度是對(duì)口的相對(duì)誤差限7(在給定置彳糠下)
形式給出,即形式給出,即
將V=(ZL)2置換前面各結(jié)果將丫=(匹)2置換前面各結(jié)果
Za/2Za/2
2.調(diào)查目標(biāo)是總體比例P
將Sh?=PhQh置換前面估計(jì)總體均值結(jié)果
<Vps<vxrs
srs
四.整群抽樣
(一)定義:整群抽樣是將總體劃分為若干群,然后以群為抽樣單元,從樣本中
隨機(jī)抽取一部分群,對(duì)選中的群的所有基本單元進(jìn)行調(diào)查的一種抽樣技術(shù)。目的
主要是擴(kuò)大抽樣單位,簡(jiǎn)化組織工作。
(二)特點(diǎn):抽樣框的編制簡(jiǎn)單;實(shí)施便利,節(jié)省費(fèi)用;抽樣誤差相對(duì)較大。
發(fā)揮整群抽樣的優(yōu)勢(shì),因?yàn)槠涫r(shí)省力,每個(gè)單元的平均調(diào)查費(fèi)用比較少,故可
通過(guò)增大樣本量的方法彌補(bǔ)精度的損失。
(三)群的劃分:盡量擴(kuò)大群內(nèi)差異,而縮小群間差異。這樣,每個(gè)群都具有足
夠好的代表性。所以分群的原則使“群內(nèi)差異大、群間差異小”與分層的原則使
“層內(nèi)差異小,層間差異大”是恰好相反的。
(四)群的規(guī)模:組成群的單元的數(shù)量。其選擇一是取決于精度與費(fèi)用之間的平
衡,二是從抽樣實(shí)施的組織管理等因素來(lái)考慮。
(五)等概率整群抽樣的情形(群規(guī)模相等)
總體群間方差:s:=3z(匕一斤總體群內(nèi)方差:化廠可
N-\jN(M7
〃
M£-o1M、
樣本群間方差:心0石中5樣本群內(nèi)方差::=〃(/_1)£5(為一,)
1NM/
總體方差:s2=—K-F
NM-1一個(gè),J>樣本方差TZZGT-
1、總體均值》的估計(jì)聲=歹=空匕
?,=|
,-N白N
2、總體總和y的估計(jì)
Y=NM?y=—YYi=-y
1n1n
3、總體比例P的估計(jì)0=p=_之"=
卒-力2=.出士(K/M-「/M)2=1-/
nM
v(y)
V(f)=V(NMy)=N2M2V(y)v(f)=N2M2v(y)
Nn
一Z(p「p)2>fZ(P,_再
v(0)二^^-----------------
nN-lnn-1
(六)設(shè)計(jì)效應(yīng)
仍用總體均值估計(jì)量的方差進(jìn)行討論,并且考慮等概率抽樣的情形。由前面
的分析可知,〒的估計(jì)量y的方差為VG)B"S2[1+(M-1)PC]
nM
2
如果按簡(jiǎn)單隨機(jī)抽樣從總體中抽取nM個(gè)次級(jí)單元,則:Vsrs(y)=i^S
\r(=\~S'[1+(M—l)/?]
所以,整群抽樣的設(shè)計(jì)效應(yīng)為:Deff=-^上.nM--------c-%
2
vsrs(y)lz£s
nM
方一
1+(M-l)/?c$+(/T)s:,
當(dāng)Oc〉0時(shí),Deff<l,則整群抽樣的精度較簡(jiǎn)單隨機(jī)抽樣在相同樣本量時(shí)要差。
當(dāng)£<0時(shí),Deff<l,則整群抽樣的精度較相同樣本量的簡(jiǎn)單隨機(jī)抽樣要高。
若令n為簡(jiǎn)單隨機(jī)抽樣的樣本量,則〃仍=—=x,即可達(dá)到整群抽樣nM戶樣本量
m8deff
相同的估計(jì)精度。
四.多階段抽樣
(一)定義:在總體各單位(初級(jí)單位PSU)中抽取樣本單位,在抽中的初級(jí)單
位中再抽取若干個(gè)第二級(jí)單位(SSU),在抽中的第二級(jí)單位中再抽取若干個(gè)第三
級(jí)單位……,直至從最后一級(jí)單位中抽取所要調(diào)查的基本單位的抽樣組織形式,
就叫做多階段抽樣。
(二)特點(diǎn):便于組織抽樣;可以使抽樣方式更加靈活和多樣化;能夠提高估計(jì)
精度;可以提高抽樣的經(jīng)濟(jì)效益;可以為各級(jí)機(jī)構(gòu)提供相應(yīng)的信息。
(三)適用范圍:在社會(huì)研究中,當(dāng)總體的規(guī)模特別大,或者總體分布的范圍特
別廣時(shí),研究者一般采取多階段抽樣的方法來(lái)抽取樣本。
(四)基本假定:初級(jí)單元中所包含的次級(jí)單元數(shù)目相同,均為M,因此從抽中
的初級(jí)單元中再抽取的次級(jí)單元個(gè)數(shù)也相同,為m;兩個(gè)階段的抽樣方法都是簡(jiǎn)
單隨機(jī)抽樣;在抽中的初級(jí)單元中作第二階抽樣是相互獨(dú)立進(jìn)行的。
(五)分層抽樣、整群抽樣、二階抽樣的共同點(diǎn)及區(qū)別
共同點(diǎn):都將總體分為若干子總體(層、群)
區(qū)別:分層抽樣一一對(duì)總體中每個(gè)子總體(層)都進(jìn)行抽樣;
整群抽樣一一對(duì)總體中被抽中的若干個(gè)子總體(群)進(jìn)行普查;
二階抽樣一一對(duì)總體中被抽中的若干個(gè)子總體(群)再進(jìn)行抽樣。
(六)二階抽樣的效率
通常情況下,二階抽樣的設(shè)計(jì)效應(yīng)大于1。這說(shuō)明二階抽樣的效率要低于簡(jiǎn)單抽
樣,但是由于二階抽樣有著樣本分布集中,可以省時(shí)、省力和省費(fèi)用的優(yōu)點(diǎn),因
此從這個(gè)意義來(lái)講,二階抽樣的效率就不一定低于簡(jiǎn)單隨機(jī)抽樣了。
二階抽樣效率通常低于分層抽樣。
二階抽樣的效率有時(shí)低于整群抽樣,有時(shí)高于整群抽樣。
(七)估計(jì)
第一階段和第二階段的抽樣比:/=n/N,f2=m/M
[M1m
J=1m;=1
初級(jí)單元間的方差:s;==次,-4-可
iNMinm
初級(jí)單元內(nèi)的方差:丘品引話;化廠。0釬狀電沙廠訂0
q1n1nm
L總體均值7,平=嬴沼力
V(小子的噤比◎=
nnm
1N1N—1M1n
2-p=/p尸而,二牛=嬴牛
V(P)=—/4(?4+看常刁
y(p)=1~f,\z(Pi-“)2+--7^-prSP,4
nn-\]n〃(加一1)1
五.不等概抽樣
(一)定義:如果總體中每個(gè)單元進(jìn)入樣本的可能性是不相等的,則這種隨機(jī)
抽樣方式就稱為不等概率隨機(jī)抽樣,簡(jiǎn)稱不等概率抽樣。
(二)特點(diǎn):將總體中每個(gè)單元的入樣概率與其“規(guī)?!贝笮÷?lián)系起來(lái),使得“大
單元”被抽到的概率大,“小單元”被抽到的概率小。
(三)優(yōu)點(diǎn):能夠大大提高抽樣精度,減少抽樣誤差。
(四)局限性:必須具有能夠說(shuō)明單元規(guī)模大小的輔助變量來(lái)確定各個(gè)單元的入
樣概率或包含概率。
(五)適用場(chǎng)合:總體單元之間的差異較大。
(六)分類
抽樣容量n固定時(shí),單元入樣的概率(不放回抽樣)或每次抽樣的概率(有放
回抽樣)與單元的大小嚴(yán)格成比例。這種情況下的有放回抽樣稱為PPS抽樣,不
放回抽樣稱為"PS抽樣。
一代碼法(漢森―赫維茨(Hansen-Hurwitz)法)
PPS抽樣:有放回抽樣-拉希里(Lahiri)法(二次抽取法)
-L規(guī)模累積等距抽選法
JTPS抽樣:不放回抽樣_Brewer(布魯爾)方法(1963)
Durbin(德賓)方法(1967)
代碼法:它適合于N不太大的情形。假定所有Mi為整數(shù)(若不然也可以乘以一個(gè)
倍數(shù)M0,使一切Mi=MZ成為整數(shù)),對(duì)于具有整數(shù)Mi的第i個(gè)單元賦予一個(gè)與
Mi相等的代碼數(shù)。每次抽樣前,先在整數(shù)1,2,…,M0里面隨機(jī)等可能地選取一
個(gè)整數(shù),設(shè)為m,若代碼m屬于第j個(gè)單元擁有的代碼數(shù),則第j個(gè)單元入樣。
這個(gè)過(guò)程重復(fù)n次,得到n個(gè)單元入樣(當(dāng)然存在重復(fù)的可能),構(gòu)成了pps樣
本。
Lahiri法:令M*=max{MJ每次抽取一個(gè)[1,N]中的隨機(jī)數(shù)i及口,M*忡的隨機(jī)數(shù)機(jī)
1</<^
若用?〃?,則第i個(gè)單元入樣;否則重抽一組億機(jī)).
(七)漢森―赫維茨(Hansen-Hurwitz)估計(jì)量(總量估計(jì))
YLyXL
=Ed陽(yáng))二y
N
Var(%)-n2
ny1^HH
Z2HHy
\)nn-\J〃(〃T)占
六.系統(tǒng)抽樣(Systematicsampling)
(一)定義:又稱為等距抽樣、機(jī)械抽樣。按照這種抽樣方法,從總體中抽取第
一個(gè)樣本點(diǎn)(隨機(jī)起點(diǎn)),然后按某種固定的順序和規(guī)律依次抽取其余的樣本點(diǎn),
最終構(gòu)成樣本。
(二)優(yōu)點(diǎn):樣本分布比較均勻,在現(xiàn)實(shí)生活中比較容易接受;樣本單位抽取簡(jiǎn)
便,有很高適用價(jià)值;簡(jiǎn)便易行,簡(jiǎn)化抽樣手續(xù)。
(三)缺點(diǎn):如果單元的排列存在周期性的變化,而抽樣者對(duì)此缺乏了解或處理
經(jīng)驗(yàn),抽取的樣本可能代表性很差。系統(tǒng)抽樣的方差很復(fù)雜,對(duì)估計(jì)帶來(lái)很大困
難。有時(shí)估計(jì)量是有偏的。抽樣誤差計(jì)算上比較復(fù)雜。
(四)特點(diǎn):系統(tǒng)抽樣只需要抽取一個(gè)樣本單位,然后按照某種規(guī)律,順
次地得到整個(gè)樣本。
(五)抽樣一般方法:
1.直線等距抽樣
假設(shè)總體單元數(shù)為N,樣本容量為n,N=nko在1k中隨機(jī)抽出一個(gè)單元編
號(hào),然后每隔k個(gè)單元編號(hào)抽取一個(gè)單元編號(hào),直到抽出n個(gè)單元編號(hào)為止。
2.循環(huán)等距抽樣(適用于k不為整數(shù))
抽樣間距k取最接近N/n的整數(shù),從1?N中隨機(jī)抽取一個(gè)隨機(jī)起點(diǎn)作為起
始單元,然后每隔k個(gè)抽取一個(gè),直到抽取滿n個(gè)為止。如果序號(hào)大于N時(shí),
將其減去N得到的在1—N中的號(hào)碼入選。
(六)抽樣方法改進(jìn)
1.中心位置法
起點(diǎn)不是隨機(jī)取,而是直接取第一階段的k個(gè)單元中處于中間位置的單元。
K奇數(shù),r=(k+l)/2;k偶數(shù),r=k/2或r=k/2+l。
雖然可以提高精度,但對(duì)于一定順序排列的總體,樣本是確定的,失去了隨
機(jī)性。尤其對(duì)同樣問(wèn)題進(jìn)行連續(xù)性調(diào)查,樣本老化,會(huì)帶來(lái)較大不利影響。
2.對(duì)稱系統(tǒng)抽樣
當(dāng)他疝且n為偶數(shù)時(shí),將總體分為n/2組,每組含有2k個(gè)單元,在各段內(nèi)
隨機(jī)抽取與兩端等距地兩個(gè)單元作為樣本,一端靠近低端,一端靠近高端。假設(shè)
隨機(jī)起點(diǎn)為i(lWiWk),入樣單元:\_i+2jk,2(j+\)k-i+\']j=
(七)等概系統(tǒng)抽樣(即等距抽樣)估計(jì)量的性質(zhì)
1.Y的估計(jì)量均值%=%=工f%
〃;=|
當(dāng)N=nK,%為「的無(wú)偏估計(jì)量,當(dāng)N*nK,%為「的有偏估計(jì)量。
2.1的估計(jì)量方差
221-f2_N-n1_、2
m,.)=£(^.-r)=7E(yr-K)%=----=nN〃—1自,一,》
Kr=ln
反映sy與SRS關(guān)系的方差計(jì)算公式:匹(叉v)=Z(%-P)2,又有
r=\
s2=E之力為y)2=>(Ni)s2=「可
/v7r=lj=\r=\j=\
=式(為-守+巨豆(力-反產(chǎn)成叭%)+2£(力-%)2⑴
r=lr=lj=\r=lj=l
令(力一工>(系統(tǒng)樣本內(nèi)方差)
左(〃-
則將心-l)S2=££(y廣,/代入⑴式
r=lj=\
便有:(N-1?2=nkV(ysy)+k(n-l)Sly,得“(又v)=吟號(hào)一管/S;v
系統(tǒng)抽樣優(yōu)于簡(jiǎn)單隨機(jī)抽樣的條件為:.(一二DS:一挺仁工<——
NNyNn
即更但一口至〈螞曰所當(dāng):
NNnN
/〃T)S;,>[(N—>%(〃—1?2,就是S*>§2,sy效率高于SRSO
n
當(dāng)總體單元的排列順序與要研究的總體特征總量的大小高度相關(guān),不管是正
相關(guān)還是負(fù)相關(guān),則系統(tǒng)抽樣更接近于分層抽樣;當(dāng)總體單元的排列順序與要研
究的總體特征變量的大小相關(guān)程度極低時(shí),則系統(tǒng)抽樣更接近于簡(jiǎn)單隨機(jī)抽樣;
當(dāng)總體單元的排列順序與要研究的總體特征變量的大小相關(guān)程度介乎于兩者之
間,則很難知道系統(tǒng)抽樣到底與其他三種抽樣方式的哪一種更相似。
附:考試范圍
《抽樣技術(shù)》期末復(fù)習(xí)提綱
第一章緒論
1、了解抽樣調(diào)查的意義、特點(diǎn)、發(fā)展歷史、應(yīng)用及分類組織。
2、理解和掌握總體、樣本、抽樣框、樣本可能數(shù)目的基本概念。
3、理解和掌握概率抽樣與非概率抽樣的區(qū)別,抽樣誤差與非抽樣誤差的區(qū)別與
聯(lián)系等。
4、系統(tǒng)地掌握和熟練地應(yīng)用統(tǒng)計(jì)量的抽樣分布、抽樣誤差的計(jì)算、抽樣估計(jì)的
方法和步驟、抽樣設(shè)計(jì)效果的評(píng)價(jià)等問(wèn)題。
第二章簡(jiǎn)單隨機(jī)抽樣
1、理解簡(jiǎn)單隨機(jī)抽樣的概念、地位和特點(diǎn)。
2、熟練地掌握簡(jiǎn)單隨機(jī)抽樣的具體方法、總體均值、總量、比例的估計(jì)方法以
及樣本容量的確定方法等并能夠熟練應(yīng)用。
3、熟練掌握比率估計(jì)的構(gòu)造定義。
第三章分層隨機(jī)抽樣
1、理解分層抽樣的概念與特點(diǎn)。
2、熟練掌握分層抽樣的原則、特點(diǎn)、估計(jì)的方法。
3、深入理解分層抽樣中總樣本量在各層間分配的方法。
4、了解分層隨機(jī)樣本中的比率估計(jì)的構(gòu)造。
第四章整群抽樣與多階段抽樣
1、了解整群抽樣的原則、特點(diǎn)、適用場(chǎng)合。
2、掌握群規(guī)模相等時(shí)整群抽樣的方法及對(duì)總體指標(biāo)的估計(jì)方法。
3、理解抽樣效果與樣本容量的分析確定方法,分清整群抽樣與分層隨機(jī)抽樣的
區(qū)別。
4、了解多階段抽樣的原則、特點(diǎn)及適用場(chǎng)合。
5、了解初級(jí)單元相等時(shí)兩階段抽樣中對(duì)總體指標(biāo)的估計(jì)方法。
第五章不等概抽樣
1、理解并掌握不等概率抽樣的意義、特點(diǎn)、實(shí)施方法。
2、熟練掌握PPS抽樣條件下估計(jì)量及其誤差計(jì)算。
3、了解不放回不等概抽樣的概念。
第六章系統(tǒng)抽樣
1、理解和掌握等距抽樣的特點(diǎn)與實(shí)施方法。
2、熟練掌握總體單元隨機(jī)排列情形,總體參數(shù)的估計(jì)以及估計(jì)量方差的估計(jì)方
法。
附:練習(xí)題
簡(jiǎn)單隨機(jī)抽樣:
為調(diào)查某5443戶城鎮(zhèn)居民服裝消費(fèi)情況,采用簡(jiǎn)單隨機(jī)不重復(fù)抽樣調(diào)查了36
戶進(jìn)行調(diào)查,得到平均消費(fèi)支出了=649.72元,.I=304803試根據(jù)此估計(jì):
(1)該地區(qū)居民服裝消費(fèi)支出總額,并給出置信水平為95%的置信區(qū)間。
(2)如果希望服裝平均消費(fèi)支出的相對(duì)誤差限不超過(guò)5%,則樣本量至少應(yīng)為多
少?
解:N=5443,〃=36,y=M9.72,/=3(X803=1.96
2
(1)/=A=O.66%,F~Ny±N-t-J^—^-s
N\n
2
T=9=3536425.96v(y)=^L.s=8410.8695
n
v(y)=N2-v(y)SE(r)=499181.8433
區(qū)間為:(2558029.55,451482237)
22
(2)r45%,〃=%,%=1T
1+國(guó)rp
N
根據(jù)題中相關(guān)數(shù)據(jù)可得421110戶,由此可得“2922戶。要滿足相應(yīng)的精度要
求,至少得抽922戶做樣本。
簡(jiǎn)單隨機(jī)抽樣(比例):
某地區(qū)10000名群眾,現(xiàn)欲估計(jì)在擁有本科學(xué)歷及以上的群眾所占的比例,隨機(jī)
不重復(fù)抽取了300名群眾進(jìn)行調(diào)查,得到〃=0.25,試估計(jì)該地區(qū)群眾擁有本科
以上學(xué)歷的比例,并以正態(tài)分布近似給出其95%的置信區(qū)間。
解:N=10000,〃=300,/=—=0.03,p=0.25/=1.96
N
u(p)=-~~—?〃?(1—〃)a6.08x104
n-1
SE(p)a0.0247
所以本科生中暑假參加培訓(xùn)班的95%的置信區(qū)間為:
p土八SE(p)=25%±(1.96x0.0247)=25%±0.0484
即(0.2016,0.2984)
分層隨機(jī)抽樣:
對(duì)某地區(qū)171980戶居民家庭收入進(jìn)行調(diào)查,以居民戶為抽樣單位,根據(jù)城鎮(zhèn)和
鄉(xiāng)村將居民劃為2層,每層按簡(jiǎn)單隨機(jī)抽樣抽取300戶,經(jīng)整理得如下數(shù)據(jù):
層Sh
Nhyh叱
城鎮(zhèn)23560151800.1372972
鄉(xiāng)8632546
試根據(jù)此估計(jì):(20分)
(1)居民平均收入及其95%的置信區(qū)間。
(2)若是按比例分配和奈曼分配時(shí),各層樣本量分別應(yīng)為多少?
解:(1)由題中相關(guān)數(shù)據(jù)資料:兀=工卬/%”10585.39(元)
h=l
2c2
v(yj7)=2叱:.(i_力,).」a545.5718+16059.7364=16605.3082(元)
h=\nh
se(匕)a128.86(元/戶),r=1.96
該地區(qū)居民平均收入的95%的置信區(qū)間為:
Ys,±t-se(Ysl)f(10332.82,10837.96)元
(2)按比例分配:々=〃?叱=600x0.137=82(戶)
%=〃?嗎=600x0.863=518(戶)
按奈曼分配:%=〃?獸鳥」
/?=!
2
由表中資料:〃=600,卬吊=407.IM,W2S2=2197.198,^^,5,=26(M.362
A=1
由上可得根據(jù)奈曼分配,各層所需樣本容量為:
407.164
%=600x。94
2604.362
2197.198
n=600x?506
22604.362
整群抽樣:
郵局欲估計(jì)每個(gè)家庭的平均訂報(bào)份數(shù),該轄區(qū)共有4000戶,劃分為400個(gè)群,
每群10戶,現(xiàn)隨機(jī)抽取4個(gè)群,取得資料如下表所示:
群各戶訂報(bào)數(shù)為以
11,2,1,3,3,2,1,4,1,119
21,3,2,2,3,1,4,1,1,220
3
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職畜牧獸醫(yī)(寵物護(hù)理)試題及答案
- 2025年大學(xué)環(huán)境設(shè)計(jì)(環(huán)境設(shè)計(jì))試題及答案
- 2025年大學(xué)大四(教育學(xué))教育管理學(xué)基礎(chǔ)測(cè)試題及答案
- 2025年大學(xué)食品科學(xué)與工程(食品加工)試題及答案
- 2025年高職井巷工程(巷道施工)試題及答案
- 2026年建筑結(jié)構(gòu)(鋼結(jié)構(gòu)加固)試題及答案
- 2025年高職文化藝術(shù)管理(管理技術(shù)實(shí)操)試題及答案
- 2025年大學(xué)大二(藝術(shù)設(shè)計(jì))首飾設(shè)計(jì)綜合測(cè)試試題及答案
- 2025年高職職業(yè)健康安全管理(職業(yè)衛(wèi)生監(jiān)測(cè))試題及答案
- 2025年高職第二學(xué)年(園林工程技術(shù))園林植物養(yǎng)護(hù)試題及答案
- 體檢中心外科檢查
- 中緬邊境景頗克欽族:社會(huì)經(jīng)濟(jì)的歷史、現(xiàn)狀與發(fā)展路徑探究
- 深圳市鹽田區(qū)2025年數(shù)學(xué)六上期末綜合測(cè)試試題含解析
- DB5203∕T 38-2023 特色酒莊旅游服務(wù)等級(jí)劃分與評(píng)定
- 四川省成都市嘉祥外國(guó)語(yǔ)學(xué)校2024-2025學(xué)年七年級(jí)數(shù)學(xué)第一學(xué)期期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)試題含解析
- 華為客戶分級(jí)管理制度
- 雙向轉(zhuǎn)診職責(zé)與患者體驗(yàn)提升
- 2025年中考道德與法治三輪沖刺:主觀題常用答題術(shù)語(yǔ)速查寶典
- 2025屆北京豐臺(tái)區(qū)高三二模高考語(yǔ)文試卷試題(含答案詳解)
- 《四川省普通國(guó)省道養(yǎng)護(hù)預(yù)算編制辦法》及配套定額解讀2025
- 論語(yǔ)的測(cè)試題及答案
評(píng)論
0/150
提交評(píng)論