抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)_第1頁(yè)
抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)_第2頁(yè)
抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)_第3頁(yè)
抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)_第4頁(yè)
抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣期末知識(shí)點(diǎn)匯總

緒論

(一)抽樣調(diào)查

抽樣調(diào)查是指非全面調(diào)查的總稱。只要是從研究的對(duì)象中抽取部分單位加以調(diào)查,

用來(lái)說(shuō)明全體,就統(tǒng)稱為抽樣調(diào)查。(廣義)

選樣方法:非概率抽樣&概率抽樣

1.非概率抽樣

抽樣方法:目的抽樣、判斷抽樣、任意抽樣、方便抽樣、配額抽樣(蓋洛普民意

測(cè)驗(yàn)、自愿樣本

原因:

(1)受客觀條件限制,無(wú)法進(jìn)行嚴(yán)格的隨機(jī)抽樣。

(2)為了快速獲得調(diào)查結(jié)果。

(3)在調(diào)查對(duì)象不確定,或無(wú)法確定的情況下采用,例如,對(duì)某一突發(fā)(偶然)

事件進(jìn)行現(xiàn)場(chǎng)調(diào)查等。

(4)總體各單位間離散程度不大,且調(diào)查員具有豐富的調(diào)查經(jīng)驗(yàn)時(shí)。

優(yōu)點(diǎn):成本低,而且容易完成;

缺點(diǎn):不能對(duì)估計(jì)的精度作出客觀、準(zhǔn)確的說(shuō)明。

2.概率抽樣(狹義抽樣調(diào)查)

按照概率統(tǒng)計(jì)的原理,從研究的總體中按隨機(jī)原則來(lái)抽選樣本,通過(guò)對(duì)樣本的調(diào)

查獲取數(shù)據(jù),以此來(lái)對(duì)總體的特征作出估計(jì)推斷;對(duì)推斷中可能出現(xiàn)的抽樣誤差

可以從概率的意義上加以控制。

特點(diǎn):

(1)對(duì)于一個(gè)具體的調(diào)查,要求總體中的每一個(gè)單元都有一個(gè)已知的非零概率被

抽中。

(2)抽取樣本的方法必須是隨機(jī)的。

(3)根據(jù)樣本來(lái)計(jì)算估計(jì)值的方法,應(yīng)符合抽樣的方法確定合適的估計(jì)量。

(4)能夠以一定的概率控制抽樣誤差的范圍。

概率抽樣:等概率抽樣&不等概率抽樣

(二)抽樣調(diào)查的常用概念

1.目標(biāo)總體:可簡(jiǎn)稱為總體,是指所要研究對(duì)象的全體,或者說(shuō)是希望從中獲

取信息的總體,它是由研究對(duì)象中所有性質(zhì)相同的個(gè)體所組成,組成總體的各個(gè)

個(gè)體稱作總體單元或單位。

2.抽樣總體:指從中抽取樣本的總體。

3.抽樣框:抽樣總體的具體表現(xiàn)。通常抽樣框是一份包含所有抽樣單元的名單。

4.總體參數(shù):總體的特征。

5.統(tǒng)計(jì)量(估計(jì)量):樣本觀察值的函數(shù)。

6.抽樣誤差:由于抽樣的非全面性和隨機(jī)性所引起的偶然性誤差。

7.非抽樣誤差:由隨機(jī)抽樣的偶然性因素以外的原因所引起的誤差。

8.抽樣誤差表現(xiàn)形式:抽樣實(shí)際誤差、抽樣標(biāo)準(zhǔn)誤和抽樣極限誤差。

9.抽樣標(biāo)準(zhǔn)誤(S),抽樣方差(V),V=S2

10.偏差:樣本估計(jì)量的數(shù)學(xué)期望與總體真值間的離差,E(^=B(^)O

11.均方誤差:MSE=+B-(。)。

12.精確度:每次抽樣結(jié)果之間差別大小

13.精度:估計(jì)量的抽樣標(biāo)準(zhǔn)誤差或方差與待估計(jì)參數(shù)之比。

14.可靠性:置信度(ba)

15.抽樣效率:兩個(gè)抽樣方案在樣本量相同的情況下的抽樣方差之比。

16.設(shè)計(jì)效果:。力=望@

匕RS(。)

%3)表示某設(shè)計(jì)方案的方差,

匕RS(3)表示相同樣本量下簡(jiǎn)單隨機(jī)抽樣的方差。

17.1-f稱為有限總體校正系數(shù)(finitepopulationcorrection,簡(jiǎn)記為fpc),

當(dāng)抽樣比f(wàn)很小時(shí),1-f就接近于1,這樣抽樣比對(duì)了的精度就沒有直接影響;

一般地,當(dāng)抽樣比小于5%,甚至小于10%時(shí),fpc可以忽略不計(jì),即認(rèn)為1-f為

1;事實(shí)上略去fpc的影響是使V(9)高了一些

18.抽樣調(diào)查步驟

確定調(diào)研問(wèn)題一一抽樣方案設(shè)計(jì)一一問(wèn)卷設(shè)計(jì)一一實(shí)施調(diào)查過(guò)程一一數(shù)據(jù)處

理分析一一撰寫調(diào)查報(bào)告

二.簡(jiǎn)單隨機(jī)抽樣SRS

(一)定義:從容量為N的總體中抽取一個(gè)容量為n的樣本,若所有可能的《個(gè)

樣本中的每一個(gè)被抽到的概率都相等,即每個(gè)可能樣本被抽中的概率均為1/G;,

這種抽樣方法稱為不放回的簡(jiǎn)單隨機(jī)抽樣,簡(jiǎn)稱簡(jiǎn)單隨機(jī)抽樣,所得的樣本稱為

不放回的簡(jiǎn)單隨機(jī)樣本,簡(jiǎn)稱簡(jiǎn)單隨機(jī)樣本

(二)實(shí)施方法:將總體中的單元依次從1到N進(jìn)行編號(hào),然后利用抽簽法或隨

機(jī)數(shù)法來(lái)進(jìn)行簡(jiǎn)單隨機(jī)抽樣。

(三)優(yōu)點(diǎn):簡(jiǎn)單直觀。在抽樣框完整時(shí),可以直接從中抽選樣本,由于抽選的

概率相同,用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)及計(jì)算抽樣誤差都比較方便。

(四)局限性:它要求將包括所有總體單元的名單作為抽樣框,當(dāng)N很大時(shí),構(gòu)

造這樣的抽樣框并不容易;根據(jù)這種方法抽出的單元很分散,給實(shí)施調(diào)查增加了

困難;這種方法沒有利用其他輔助信息以提高估計(jì)的效率。所以在規(guī)模較大的調(diào)

查中,很少直接采用簡(jiǎn)單隨機(jī)抽樣,一般是把這種方法與其他抽樣方法結(jié)合在起

使用。

(五)估計(jì)

總體指標(biāo)樣本指標(biāo)

N

丫二匕川+八+…+匕

/=!

?小展…+…+九了’".J+)-,

1N

A1N

2二R=天Z匕(匕二°或1)p=q=」力,(%=0的)

NNF

nn,=1

N

Yr,._£〃,-

R=^_=y=y

R=^—=—=4

fx,.xXn—

AX

/=!/=1

次(匕一斤=上/-力2

(1)總體均值

對(duì)于簡(jiǎn)單隨機(jī)抽樣,歹是歹的無(wú)偏估計(jì)。即E(y)=P

對(duì)于簡(jiǎn)單隨機(jī)抽樣,死勺方差為:v(y)=^^s2=t2s2

nNn

V(巾勺無(wú)偏估計(jì)為:咆)=匕£$2

門的置信度為1-a的近彳濯信區(qū)間為(9-M

_/VN

(2)總體總量(Y=NY=—£丫)

對(duì)于簡(jiǎn)單隨機(jī)抽樣,魂Y的無(wú)偏估計(jì),艮舊同=Y

寸的方差為:v(f)=N2V(y)=N~(I二/)52

n

用加無(wú)偏估計(jì)為:v(y)=N2v(y)=~~—s2

(3)總體比例

工寸[1,若第[?個(gè)單元具有所考慮的特1E.…...._人4一口七

設(shè)Yj=《開,匚,i=l,2,…,NKT,總體中有A個(gè)單兀具有

[0,其他

N

這個(gè)特征,即A=5;匕,總體中具有某種特征的單元在總體中所占的比例p即

是Y的均值:丫=2A=1!1N匕=已

NN£

N

總體方差為:§2=,由于匕的取值為0

NN1z\/V

或1,所以X片=£匕,即§2=------(NP-NP2)=---PQ,其中0=1-P.

i=li=lN—1N—1

相應(yīng)地,樣本比例為p=@=上一=少

nn

樣本方差為/=」*7支(%-歹y=/7P(1-P)=」YP4(其中q=l-p)

〃一1nn-\n-\

P為P的簡(jiǎn)單估計(jì),且為無(wú)偏估計(jì),即E(p)=P

V(p肺無(wú)偏估計(jì)為:v(p)=^--s2=-~^〃4(其中(7=1-〃)

n71-1

在大樣本條件下,利用正態(tài)分布可得P的置信度為1-a的近似置信區(qū)間為

(六)樣本量的確定

費(fèi)用函數(shù):CT=C0+C〃,其中CT為總費(fèi)用,C。為固定費(fèi)用,C為每調(diào)查一個(gè)

樣本單元所需的費(fèi)用。

絕對(duì)誤差限:d=uay/v^)=uaS,)

I---1---

型”耳=?助其中。砥爵甲

相對(duì)誤差限:r=u

tf1-5tf*-yE\uIy

(七)簡(jiǎn)單隨機(jī)抽樣估計(jì)總體均值或總體總量時(shí)樣本量的確定:

(1)精度要求:估計(jì)量》的方差上限為V

樣本量直接取〃°,否則對(duì)%進(jìn)行修正,取〃。

/C、2

,?s

V21-a-rj

(2)精度要求:估計(jì)量少的絕對(duì)誤差為d,則〃o=2=-4一,〃=—?

1——2

(3)精度要求:估計(jì)量了的相對(duì)誤差為r,則〃。

22

(4)精度要求:估計(jì)量歹的變異系數(shù)上限為C,則〃0=2Q_=廠二S立

V-(CY)2-C

(5)估計(jì)總體比例時(shí)樣本量的確定:

〃2p。2Q

I--I--

2_2齊導(dǎo)則〃=4

d2r-P

N

三.分層隨機(jī)抽樣

(一)定義:如果抽樣在每個(gè)層中獨(dú)立進(jìn)行,總的樣本由各層樣本構(gòu)成,這種抽

樣方法稱為分層抽樣。若在每層中的抽樣采用SRS,這樣的分層抽樣稱為分層隨

機(jī)抽樣。

(二)原則:同一層內(nèi)差異小,不同層間差異大。

(三)分層原因:當(dāng)總體各單元差異比較大時(shí),對(duì)參數(shù)估計(jì)誤差比較大。將總體

分層,同一層中各單位差異小,從每一層中抽取構(gòu)成樣本,這樣樣本就有代表性,

可以提高估計(jì)的精度;可以同時(shí)對(duì)子總體進(jìn)行參數(shù)估計(jì);便于依托各級(jí)管理機(jī)構(gòu)

進(jìn)行組織和實(shí)施。

(四)優(yōu)點(diǎn):分層樣本代表性好;可總體參數(shù)估計(jì),也可對(duì)層參數(shù)估計(jì);實(shí)施靈

活方便;提高估計(jì)精度。2L1L

(五)分層隨機(jī)抽樣總體均值:

/:=1h=\

£(兀)=€%,£(%)=£%%=F

h=lh=l

LLLi

V(兀)=v(2%%)=t%"(工)=IX十s;

h=\h=\h=lh

無(wú)偏估計(jì):

5)=之制匕*S''=三力%f>

(六)分層隨機(jī)抽樣總體總值:Y.=八夕”

E(YJ=Y

口比)=1X(N%-%)與

A=11lh

L?2

巾(%)=一巧,)上是的一個(gè)無(wú)偏估計(jì)

A=1nh

(七)分層隨機(jī)抽樣總體比例:

h=\

Eg=P

/&)=品所給攀

1n

ZA-lZhh

W(P")二點(diǎn)X"%是)的一個(gè)無(wú)偏估計(jì)

當(dāng)N“很大時(shí),N?-1RN〃,所以N"/(N%—1),1.

此時(shí)/5”£叫4「念

Mnh

估計(jì)量為*「"”)=2吟IzAPM*

/|=1〃hT

(A)分別比估計(jì)(對(duì)每層樣本分別考慮比估計(jì)量,然后對(duì)各層的比估計(jì)量進(jìn)行

加權(quán)平均)

LL市

K=1;環(huán)m=£環(huán)"八

h=lh=lXh

_L_L

治”啟立共瑞旺心

/TMh=l

(%)。之叮a-力坊j,+R次「2&p凡

ft

/i=ih

MSE(WQ=*)苗N式1-秋維+R2S2h_2RhPhSyhSxh)

/f=l〃/l

(九)聯(lián)合比估計(jì)(先對(duì)兩個(gè)指標(biāo)先分別計(jì)算出分層估計(jì),然后再構(gòu)造比估計(jì))

yRc="大=RCX

_競(jìng)"

人¥八

I:I\C=—4—x=RcX

st

2

M阻加)”(加)空)乙)的+RS;h-2RphS,lSxh)

/i=iNnh

Nj,(if,,)z

心石臉)”(如^~(S;.h+RS;h-2即£凡,)

/i=irth

(十)分別比估計(jì)與聯(lián)合比估計(jì)的比較

1.當(dāng)各層4的都比較大時(shí),各層比率R之間差異比較大,此時(shí)分別比估計(jì)要優(yōu)

于聯(lián)合比估計(jì);

2.當(dāng)某些層a的不夠大時(shí),或者各層的比率R差異較小,還是采用聯(lián)合比估計(jì)更

有效些。

3.分別比估計(jì)需要知道各層的子總體輔助變量信息,而聯(lián)合比估計(jì)只需要知道總

體輔助變量的信息。

(十一)樣本量在各層的分配

廄4以:上公:=”設(shè)上嚕

h=\nhh=\nhh=\N

常數(shù)分配:即%="

1.L

層大小差不多,且沒有任何關(guān)于層的其他信息

2,比例分配:即%=〃叱,

層大小有差異,且每層的方差不大

Ney,/。/?分配:使的與叱河,成正比,即劭=n£島

3.

每層估計(jì)量達(dá)到相同精度

當(dāng)S.相等時(shí),最優(yōu)分配就是比例分配

?一…向N5J瓜

"小5./£少5/£

4.最優(yōu)分配:

考慮簡(jiǎn)單的線性費(fèi)用函數(shù):

L

J=%+匯

h=\

式中a是總費(fèi)用,。。是與樣本量無(wú)關(guān)的固定費(fèi)用,而q是

在第〃層中抽取一個(gè)單元的平均費(fèi)用.

(十二)總樣本量的確定

1.調(diào)查目標(biāo)是估計(jì)總體均值

若V是給定的估計(jì)量方方差的上限,則有必或

/:=1&h=TN

對(duì)某種分配為="?叫,h=l,2,…,L

h=\nh

之叫節(jié);/叼)

力=1

'/N

V+

\h=\7

估計(jì)總體均值估計(jì)總體總值

設(shè)爐是給定的匕的方差上限,

(1)常數(shù)分配wh=-,h=l,2,...,L

L則將V=V/N2代入

n虎卬閭

F+二閭

〃=-^=---詈-------

1+墨V+^W^/N)

Nh=l

(2)比例分配wh=W?,h=l,2,...,L(2)比例分配卬力=此,〃=1,2,…,L

n次卬⑶〃一

N局

n=—=---號(hào)-------V+Z.

1+.V+(次w局/N)

Nh=\

叼4ws

(3)Heyman分配(3)Neyman分酉已w=

Egh汽z叱£

h=]h=\

(L、2

<任】J〃一(ZM)2

1L

V+RZ叱&一O+ZHS

h=\

(4)最優(yōu)分配(4)最優(yōu)分配

(\叱4石)_0網(wǎng)際向(工網(wǎng)8」向

〃一R+Ed同

V+^W^/N

h=\

若精度是對(duì)力的絕對(duì)誤差限△(在給定置彳言鹿精度是對(duì)匕的絕對(duì)誤差限&在給定置彳言度下)

形式給出,即形式給出,即

將丫=與置換前面各結(jié)果將V=絲,空置換前面各結(jié)果

Za/2Za/2

若精度是對(duì)得的相對(duì)誤差限y(在給定置彳言震精度是對(duì)口的相對(duì)誤差限7(在給定置彳糠下)

形式給出,即形式給出,即

將V=(ZL)2置換前面各結(jié)果將丫=(匹)2置換前面各結(jié)果

Za/2Za/2

2.調(diào)查目標(biāo)是總體比例P

將Sh?=PhQh置換前面估計(jì)總體均值結(jié)果

<Vps<vxrs

srs

四.整群抽樣

(一)定義:整群抽樣是將總體劃分為若干群,然后以群為抽樣單元,從樣本中

隨機(jī)抽取一部分群,對(duì)選中的群的所有基本單元進(jìn)行調(diào)查的一種抽樣技術(shù)。目的

主要是擴(kuò)大抽樣單位,簡(jiǎn)化組織工作。

(二)特點(diǎn):抽樣框的編制簡(jiǎn)單;實(shí)施便利,節(jié)省費(fèi)用;抽樣誤差相對(duì)較大。

發(fā)揮整群抽樣的優(yōu)勢(shì),因?yàn)槠涫r(shí)省力,每個(gè)單元的平均調(diào)查費(fèi)用比較少,故可

通過(guò)增大樣本量的方法彌補(bǔ)精度的損失。

(三)群的劃分:盡量擴(kuò)大群內(nèi)差異,而縮小群間差異。這樣,每個(gè)群都具有足

夠好的代表性。所以分群的原則使“群內(nèi)差異大、群間差異小”與分層的原則使

“層內(nèi)差異小,層間差異大”是恰好相反的。

(四)群的規(guī)模:組成群的單元的數(shù)量。其選擇一是取決于精度與費(fèi)用之間的平

衡,二是從抽樣實(shí)施的組織管理等因素來(lái)考慮。

(五)等概率整群抽樣的情形(群規(guī)模相等)

總體群間方差:s:=3z(匕一斤總體群內(nèi)方差:化廠可

N-\jN(M7

M£-o1M、

樣本群間方差:心0石中5樣本群內(nèi)方差::=〃(/_1)£5(為一,)

1NM/

總體方差:s2=—K-F

NM-1一個(gè),J>樣本方差TZZGT-

1、總體均值》的估計(jì)聲=歹=空匕

?,=|

,-N白N

2、總體總和y的估計(jì)

Y=NM?y=—YYi=-y

1n1n

3、總體比例P的估計(jì)0=p=_之"=

卒-力2=.出士(K/M-「/M)2=1-/

nM

v(y)

V(f)=V(NMy)=N2M2V(y)v(f)=N2M2v(y)

Nn

一Z(p「p)2>fZ(P,_再

v(0)二^^-----------------

nN-lnn-1

(六)設(shè)計(jì)效應(yīng)

仍用總體均值估計(jì)量的方差進(jìn)行討論,并且考慮等概率抽樣的情形。由前面

的分析可知,〒的估計(jì)量y的方差為VG)B"S2[1+(M-1)PC]

nM

2

如果按簡(jiǎn)單隨機(jī)抽樣從總體中抽取nM個(gè)次級(jí)單元,則:Vsrs(y)=i^S

\r(=\~S'[1+(M—l)/?]

所以,整群抽樣的設(shè)計(jì)效應(yīng)為:Deff=-^上.nM--------c-%

2

vsrs(y)lz£s

nM

方一

1+(M-l)/?c$+(/T)s:,

當(dāng)Oc〉0時(shí),Deff<l,則整群抽樣的精度較簡(jiǎn)單隨機(jī)抽樣在相同樣本量時(shí)要差。

當(dāng)£<0時(shí),Deff<l,則整群抽樣的精度較相同樣本量的簡(jiǎn)單隨機(jī)抽樣要高。

若令n為簡(jiǎn)單隨機(jī)抽樣的樣本量,則〃仍=—=x,即可達(dá)到整群抽樣nM戶樣本量

m8deff

相同的估計(jì)精度。

四.多階段抽樣

(一)定義:在總體各單位(初級(jí)單位PSU)中抽取樣本單位,在抽中的初級(jí)單

位中再抽取若干個(gè)第二級(jí)單位(SSU),在抽中的第二級(jí)單位中再抽取若干個(gè)第三

級(jí)單位……,直至從最后一級(jí)單位中抽取所要調(diào)查的基本單位的抽樣組織形式,

就叫做多階段抽樣。

(二)特點(diǎn):便于組織抽樣;可以使抽樣方式更加靈活和多樣化;能夠提高估計(jì)

精度;可以提高抽樣的經(jīng)濟(jì)效益;可以為各級(jí)機(jī)構(gòu)提供相應(yīng)的信息。

(三)適用范圍:在社會(huì)研究中,當(dāng)總體的規(guī)模特別大,或者總體分布的范圍特

別廣時(shí),研究者一般采取多階段抽樣的方法來(lái)抽取樣本。

(四)基本假定:初級(jí)單元中所包含的次級(jí)單元數(shù)目相同,均為M,因此從抽中

的初級(jí)單元中再抽取的次級(jí)單元個(gè)數(shù)也相同,為m;兩個(gè)階段的抽樣方法都是簡(jiǎn)

單隨機(jī)抽樣;在抽中的初級(jí)單元中作第二階抽樣是相互獨(dú)立進(jìn)行的。

(五)分層抽樣、整群抽樣、二階抽樣的共同點(diǎn)及區(qū)別

共同點(diǎn):都將總體分為若干子總體(層、群)

區(qū)別:分層抽樣一一對(duì)總體中每個(gè)子總體(層)都進(jìn)行抽樣;

整群抽樣一一對(duì)總體中被抽中的若干個(gè)子總體(群)進(jìn)行普查;

二階抽樣一一對(duì)總體中被抽中的若干個(gè)子總體(群)再進(jìn)行抽樣。

(六)二階抽樣的效率

通常情況下,二階抽樣的設(shè)計(jì)效應(yīng)大于1。這說(shuō)明二階抽樣的效率要低于簡(jiǎn)單抽

樣,但是由于二階抽樣有著樣本分布集中,可以省時(shí)、省力和省費(fèi)用的優(yōu)點(diǎn),因

此從這個(gè)意義來(lái)講,二階抽樣的效率就不一定低于簡(jiǎn)單隨機(jī)抽樣了。

二階抽樣效率通常低于分層抽樣。

二階抽樣的效率有時(shí)低于整群抽樣,有時(shí)高于整群抽樣。

(七)估計(jì)

第一階段和第二階段的抽樣比:/=n/N,f2=m/M

[M1m

J=1m;=1

初級(jí)單元間的方差:s;==次,-4-可

iNMinm

初級(jí)單元內(nèi)的方差:丘品引話;化廠。0釬狀電沙廠訂0

q1n1nm

L總體均值7,平=嬴沼力

V(小子的噤比◎=

nnm

1N1N—1M1n

2-p=/p尸而,二牛=嬴牛

V(P)=—/4(?4+看常刁

y(p)=1~f,\z(Pi-“)2+--7^-prSP,4

nn-\]n〃(加一1)1

五.不等概抽樣

(一)定義:如果總體中每個(gè)單元進(jìn)入樣本的可能性是不相等的,則這種隨機(jī)

抽樣方式就稱為不等概率隨機(jī)抽樣,簡(jiǎn)稱不等概率抽樣。

(二)特點(diǎn):將總體中每個(gè)單元的入樣概率與其“規(guī)?!贝笮÷?lián)系起來(lái),使得“大

單元”被抽到的概率大,“小單元”被抽到的概率小。

(三)優(yōu)點(diǎn):能夠大大提高抽樣精度,減少抽樣誤差。

(四)局限性:必須具有能夠說(shuō)明單元規(guī)模大小的輔助變量來(lái)確定各個(gè)單元的入

樣概率或包含概率。

(五)適用場(chǎng)合:總體單元之間的差異較大。

(六)分類

抽樣容量n固定時(shí),單元入樣的概率(不放回抽樣)或每次抽樣的概率(有放

回抽樣)與單元的大小嚴(yán)格成比例。這種情況下的有放回抽樣稱為PPS抽樣,不

放回抽樣稱為"PS抽樣。

一代碼法(漢森―赫維茨(Hansen-Hurwitz)法)

PPS抽樣:有放回抽樣-拉希里(Lahiri)法(二次抽取法)

-L規(guī)模累積等距抽選法

JTPS抽樣:不放回抽樣_Brewer(布魯爾)方法(1963)

Durbin(德賓)方法(1967)

代碼法:它適合于N不太大的情形。假定所有Mi為整數(shù)(若不然也可以乘以一個(gè)

倍數(shù)M0,使一切Mi=MZ成為整數(shù)),對(duì)于具有整數(shù)Mi的第i個(gè)單元賦予一個(gè)與

Mi相等的代碼數(shù)。每次抽樣前,先在整數(shù)1,2,…,M0里面隨機(jī)等可能地選取一

個(gè)整數(shù),設(shè)為m,若代碼m屬于第j個(gè)單元擁有的代碼數(shù),則第j個(gè)單元入樣。

這個(gè)過(guò)程重復(fù)n次,得到n個(gè)單元入樣(當(dāng)然存在重復(fù)的可能),構(gòu)成了pps樣

本。

Lahiri法:令M*=max{MJ每次抽取一個(gè)[1,N]中的隨機(jī)數(shù)i及口,M*忡的隨機(jī)數(shù)機(jī)

1</<^

若用?〃?,則第i個(gè)單元入樣;否則重抽一組億機(jī)).

(七)漢森―赫維茨(Hansen-Hurwitz)估計(jì)量(總量估計(jì))

YLyXL

=Ed陽(yáng))二y

N

Var(%)-n2

ny1^HH

Z2HHy

\)nn-\J〃(〃T)占

六.系統(tǒng)抽樣(Systematicsampling)

(一)定義:又稱為等距抽樣、機(jī)械抽樣。按照這種抽樣方法,從總體中抽取第

一個(gè)樣本點(diǎn)(隨機(jī)起點(diǎn)),然后按某種固定的順序和規(guī)律依次抽取其余的樣本點(diǎn),

最終構(gòu)成樣本。

(二)優(yōu)點(diǎn):樣本分布比較均勻,在現(xiàn)實(shí)生活中比較容易接受;樣本單位抽取簡(jiǎn)

便,有很高適用價(jià)值;簡(jiǎn)便易行,簡(jiǎn)化抽樣手續(xù)。

(三)缺點(diǎn):如果單元的排列存在周期性的變化,而抽樣者對(duì)此缺乏了解或處理

經(jīng)驗(yàn),抽取的樣本可能代表性很差。系統(tǒng)抽樣的方差很復(fù)雜,對(duì)估計(jì)帶來(lái)很大困

難。有時(shí)估計(jì)量是有偏的。抽樣誤差計(jì)算上比較復(fù)雜。

(四)特點(diǎn):系統(tǒng)抽樣只需要抽取一個(gè)樣本單位,然后按照某種規(guī)律,順

次地得到整個(gè)樣本。

(五)抽樣一般方法:

1.直線等距抽樣

假設(shè)總體單元數(shù)為N,樣本容量為n,N=nko在1k中隨機(jī)抽出一個(gè)單元編

號(hào),然后每隔k個(gè)單元編號(hào)抽取一個(gè)單元編號(hào),直到抽出n個(gè)單元編號(hào)為止。

2.循環(huán)等距抽樣(適用于k不為整數(shù))

抽樣間距k取最接近N/n的整數(shù),從1?N中隨機(jī)抽取一個(gè)隨機(jī)起點(diǎn)作為起

始單元,然后每隔k個(gè)抽取一個(gè),直到抽取滿n個(gè)為止。如果序號(hào)大于N時(shí),

將其減去N得到的在1—N中的號(hào)碼入選。

(六)抽樣方法改進(jìn)

1.中心位置法

起點(diǎn)不是隨機(jī)取,而是直接取第一階段的k個(gè)單元中處于中間位置的單元。

K奇數(shù),r=(k+l)/2;k偶數(shù),r=k/2或r=k/2+l。

雖然可以提高精度,但對(duì)于一定順序排列的總體,樣本是確定的,失去了隨

機(jī)性。尤其對(duì)同樣問(wèn)題進(jìn)行連續(xù)性調(diào)查,樣本老化,會(huì)帶來(lái)較大不利影響。

2.對(duì)稱系統(tǒng)抽樣

當(dāng)他疝且n為偶數(shù)時(shí),將總體分為n/2組,每組含有2k個(gè)單元,在各段內(nèi)

隨機(jī)抽取與兩端等距地兩個(gè)單元作為樣本,一端靠近低端,一端靠近高端。假設(shè)

隨機(jī)起點(diǎn)為i(lWiWk),入樣單元:\_i+2jk,2(j+\)k-i+\']j=

(七)等概系統(tǒng)抽樣(即等距抽樣)估計(jì)量的性質(zhì)

1.Y的估計(jì)量均值%=%=工f%

〃;=|

當(dāng)N=nK,%為「的無(wú)偏估計(jì)量,當(dāng)N*nK,%為「的有偏估計(jì)量。

2.1的估計(jì)量方差

221-f2_N-n1_、2

m,.)=£(^.-r)=7E(yr-K)%=----=nN〃—1自,一,》

Kr=ln

反映sy與SRS關(guān)系的方差計(jì)算公式:匹(叉v)=Z(%-P)2,又有

r=\

s2=E之力為y)2=>(Ni)s2=「可

/v7r=lj=\r=\j=\

=式(為-守+巨豆(力-反產(chǎn)成叭%)+2£(力-%)2⑴

r=lr=lj=\r=lj=l

令(力一工>(系統(tǒng)樣本內(nèi)方差)

左(〃-

則將心-l)S2=££(y廣,/代入⑴式

r=lj=\

便有:(N-1?2=nkV(ysy)+k(n-l)Sly,得“(又v)=吟號(hào)一管/S;v

系統(tǒng)抽樣優(yōu)于簡(jiǎn)單隨機(jī)抽樣的條件為:.(一二DS:一挺仁工<——

NNyNn

即更但一口至〈螞曰所當(dāng):

NNnN

/〃T)S;,>[(N—>%(〃—1?2,就是S*>§2,sy效率高于SRSO

n

當(dāng)總體單元的排列順序與要研究的總體特征總量的大小高度相關(guān),不管是正

相關(guān)還是負(fù)相關(guān),則系統(tǒng)抽樣更接近于分層抽樣;當(dāng)總體單元的排列順序與要研

究的總體特征變量的大小相關(guān)程度極低時(shí),則系統(tǒng)抽樣更接近于簡(jiǎn)單隨機(jī)抽樣;

當(dāng)總體單元的排列順序與要研究的總體特征變量的大小相關(guān)程度介乎于兩者之

間,則很難知道系統(tǒng)抽樣到底與其他三種抽樣方式的哪一種更相似。

附:考試范圍

《抽樣技術(shù)》期末復(fù)習(xí)提綱

第一章緒論

1、了解抽樣調(diào)查的意義、特點(diǎn)、發(fā)展歷史、應(yīng)用及分類組織。

2、理解和掌握總體、樣本、抽樣框、樣本可能數(shù)目的基本概念。

3、理解和掌握概率抽樣與非概率抽樣的區(qū)別,抽樣誤差與非抽樣誤差的區(qū)別與

聯(lián)系等。

4、系統(tǒng)地掌握和熟練地應(yīng)用統(tǒng)計(jì)量的抽樣分布、抽樣誤差的計(jì)算、抽樣估計(jì)的

方法和步驟、抽樣設(shè)計(jì)效果的評(píng)價(jià)等問(wèn)題。

第二章簡(jiǎn)單隨機(jī)抽樣

1、理解簡(jiǎn)單隨機(jī)抽樣的概念、地位和特點(diǎn)。

2、熟練地掌握簡(jiǎn)單隨機(jī)抽樣的具體方法、總體均值、總量、比例的估計(jì)方法以

及樣本容量的確定方法等并能夠熟練應(yīng)用。

3、熟練掌握比率估計(jì)的構(gòu)造定義。

第三章分層隨機(jī)抽樣

1、理解分層抽樣的概念與特點(diǎn)。

2、熟練掌握分層抽樣的原則、特點(diǎn)、估計(jì)的方法。

3、深入理解分層抽樣中總樣本量在各層間分配的方法。

4、了解分層隨機(jī)樣本中的比率估計(jì)的構(gòu)造。

第四章整群抽樣與多階段抽樣

1、了解整群抽樣的原則、特點(diǎn)、適用場(chǎng)合。

2、掌握群規(guī)模相等時(shí)整群抽樣的方法及對(duì)總體指標(biāo)的估計(jì)方法。

3、理解抽樣效果與樣本容量的分析確定方法,分清整群抽樣與分層隨機(jī)抽樣的

區(qū)別。

4、了解多階段抽樣的原則、特點(diǎn)及適用場(chǎng)合。

5、了解初級(jí)單元相等時(shí)兩階段抽樣中對(duì)總體指標(biāo)的估計(jì)方法。

第五章不等概抽樣

1、理解并掌握不等概率抽樣的意義、特點(diǎn)、實(shí)施方法。

2、熟練掌握PPS抽樣條件下估計(jì)量及其誤差計(jì)算。

3、了解不放回不等概抽樣的概念。

第六章系統(tǒng)抽樣

1、理解和掌握等距抽樣的特點(diǎn)與實(shí)施方法。

2、熟練掌握總體單元隨機(jī)排列情形,總體參數(shù)的估計(jì)以及估計(jì)量方差的估計(jì)方

法。

附:練習(xí)題

簡(jiǎn)單隨機(jī)抽樣:

為調(diào)查某5443戶城鎮(zhèn)居民服裝消費(fèi)情況,采用簡(jiǎn)單隨機(jī)不重復(fù)抽樣調(diào)查了36

戶進(jìn)行調(diào)查,得到平均消費(fèi)支出了=649.72元,.I=304803試根據(jù)此估計(jì):

(1)該地區(qū)居民服裝消費(fèi)支出總額,并給出置信水平為95%的置信區(qū)間。

(2)如果希望服裝平均消費(fèi)支出的相對(duì)誤差限不超過(guò)5%,則樣本量至少應(yīng)為多

少?

解:N=5443,〃=36,y=M9.72,/=3(X803=1.96

2

(1)/=A=O.66%,F~Ny±N-t-J^—^-s

N\n

2

T=9=3536425.96v(y)=^L.s=8410.8695

n

v(y)=N2-v(y)SE(r)=499181.8433

區(qū)間為:(2558029.55,451482237)

22

(2)r45%,〃=%,%=1T

1+國(guó)rp

N

根據(jù)題中相關(guān)數(shù)據(jù)可得421110戶,由此可得“2922戶。要滿足相應(yīng)的精度要

求,至少得抽922戶做樣本。

簡(jiǎn)單隨機(jī)抽樣(比例):

某地區(qū)10000名群眾,現(xiàn)欲估計(jì)在擁有本科學(xué)歷及以上的群眾所占的比例,隨機(jī)

不重復(fù)抽取了300名群眾進(jìn)行調(diào)查,得到〃=0.25,試估計(jì)該地區(qū)群眾擁有本科

以上學(xué)歷的比例,并以正態(tài)分布近似給出其95%的置信區(qū)間。

解:N=10000,〃=300,/=—=0.03,p=0.25/=1.96

N

u(p)=-~~—?〃?(1—〃)a6.08x104

n-1

SE(p)a0.0247

所以本科生中暑假參加培訓(xùn)班的95%的置信區(qū)間為:

p土八SE(p)=25%±(1.96x0.0247)=25%±0.0484

即(0.2016,0.2984)

分層隨機(jī)抽樣:

對(duì)某地區(qū)171980戶居民家庭收入進(jìn)行調(diào)查,以居民戶為抽樣單位,根據(jù)城鎮(zhèn)和

鄉(xiāng)村將居民劃為2層,每層按簡(jiǎn)單隨機(jī)抽樣抽取300戶,經(jīng)整理得如下數(shù)據(jù):

層Sh

Nhyh叱

城鎮(zhèn)23560151800.1372972

鄉(xiāng)8632546

試根據(jù)此估計(jì):(20分)

(1)居民平均收入及其95%的置信區(qū)間。

(2)若是按比例分配和奈曼分配時(shí),各層樣本量分別應(yīng)為多少?

解:(1)由題中相關(guān)數(shù)據(jù)資料:兀=工卬/%”10585.39(元)

h=l

2c2

v(yj7)=2叱:.(i_力,).」a545.5718+16059.7364=16605.3082(元)

h=\nh

se(匕)a128.86(元/戶),r=1.96

該地區(qū)居民平均收入的95%的置信區(qū)間為:

Ys,±t-se(Ysl)f(10332.82,10837.96)元

(2)按比例分配:々=〃?叱=600x0.137=82(戶)

%=〃?嗎=600x0.863=518(戶)

按奈曼分配:%=〃?獸鳥」

/?=!

2

由表中資料:〃=600,卬吊=407.IM,W2S2=2197.198,^^,5,=26(M.362

A=1

由上可得根據(jù)奈曼分配,各層所需樣本容量為:

407.164

%=600x。94

2604.362

2197.198

n=600x?506

22604.362

整群抽樣:

郵局欲估計(jì)每個(gè)家庭的平均訂報(bào)份數(shù),該轄區(qū)共有4000戶,劃分為400個(gè)群,

每群10戶,現(xiàn)隨機(jī)抽取4個(gè)群,取得資料如下表所示:

群各戶訂報(bào)數(shù)為以

11,2,1,3,3,2,1,4,1,119

21,3,2,2,3,1,4,1,1,220

3

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論