抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)

上傳人：無(wú)*** IP屬地：河北上傳時(shí)間：2024-01-07 格式：PDF 頁(yè)數(shù)：26 大?。?.87MB 積分：12 舉報(bào) 版權(quán)申訴

抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)_第2頁(yè)

抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)_第3頁(yè)

抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)_第4頁(yè)

抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)_第5頁(yè)

已閱讀5頁(yè)，還剩21頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣期末知識(shí)點(diǎn)匯總

緒論

（一）抽樣調(diào)查

抽樣調(diào)查是指非全面調(diào)查的總稱。只要是從研究的對(duì)象中抽取部分單位加以調(diào)查,

用來(lái)說(shuō)明全體，就統(tǒng)稱為抽樣調(diào)查。（廣義）

選樣方法：非概率抽樣&概率抽樣

1.非概率抽樣

抽樣方法：目的抽樣、判斷抽樣、任意抽樣、方便抽樣、配額抽樣（蓋洛普民意

測(cè)驗(yàn)、自愿樣本

原因：

（1）受客觀條件限制，無(wú)法進(jìn)行嚴(yán)格的隨機(jī)抽樣。

（2）為了快速獲得調(diào)查結(jié)果。

（3）在調(diào)查對(duì)象不確定，或無(wú)法確定的情況下采用，例如，對(duì)某一突發(fā)（偶然）

事件進(jìn)行現(xiàn)場(chǎng)調(diào)查等。

（4）總體各單位間離散程度不大，且調(diào)查員具有豐富的調(diào)查經(jīng)驗(yàn)時(shí)。

優(yōu)點(diǎn)：成本低，而且容易完成；

缺點(diǎn)：不能對(duì)估計(jì)的精度作出客觀、準(zhǔn)確的說(shuō)明。

2.概率抽樣（狹義抽樣調(diào)查）

按照概率統(tǒng)計(jì)的原理，從研究的總體中按隨機(jī)原則來(lái)抽選樣本,通過(guò)對(duì)樣本的調(diào)

查獲取數(shù)據(jù)，以此來(lái)對(duì)總體的特征作出估計(jì)推斷；對(duì)推斷中可能出現(xiàn)的抽樣誤差

可以從概率的意義上加以控制。

特點(diǎn)：

（1）對(duì)于一個(gè)具體的調(diào)查，要求總體中的每一個(gè)單元都有一個(gè)已知的非零概率被

抽中。

（2）抽取樣本的方法必須是隨機(jī)的。

（3）根據(jù)樣本來(lái)計(jì)算估計(jì)值的方法，應(yīng)符合抽樣的方法確定合適的估計(jì)量。

（4）能夠以一定的概率控制抽樣誤差的范圍。

概率抽樣：等概率抽樣&不等概率抽樣

（二）抽樣調(diào)查的常用概念

1.目標(biāo)總體：可簡(jiǎn)稱為總體，是指所要研究對(duì)象的全體，或者說(shuō)是希望從中獲

取信息的總體，它是由研究對(duì)象中所有性質(zhì)相同的個(gè)體所組成，組成總體的各個(gè)

個(gè)體稱作總體單元或單位。

2.抽樣總體：指從中抽取樣本的總體。

3.抽樣框：抽樣總體的具體表現(xiàn)。通常抽樣框是一份包含所有抽樣單元的名單。

4.總體參數(shù)：總體的特征。

5.統(tǒng)計(jì)量（估計(jì)量）：樣本觀察值的函數(shù)。

6.抽樣誤差：由于抽樣的非全面性和隨機(jī)性所引起的偶然性誤差。

7.非抽樣誤差：由隨機(jī)抽樣的偶然性因素以外的原因所引起的誤差。

8.抽樣誤差表現(xiàn)形式：抽樣實(shí)際誤差、抽樣標(biāo)準(zhǔn)誤和抽樣極限誤差。

9.抽樣標(biāo)準(zhǔn)誤（S）,抽樣方差（V）,V=S2

10.偏差：樣本估計(jì)量的數(shù)學(xué)期望與總體真值間的離差，E（^=B（^）O

11.均方誤差：MSE=+B-（。）。

12.精確度：每次抽樣結(jié)果之間差別大小

13.精度：估計(jì)量的抽樣標(biāo)準(zhǔn)誤差或方差與待估計(jì)參數(shù)之比。

14.可靠性：置信度（ba）

15.抽樣效率：兩個(gè)抽樣方案在樣本量相同的情況下的抽樣方差之比。

16.設(shè)計(jì)效果：。力=望@

匕RS（。）

%3）表示某設(shè)計(jì)方案的方差，

匕RS（3）表示相同樣本量下簡(jiǎn)單隨機(jī)抽樣的方差。

17.1-f稱為有限總體校正系數(shù)（finitepopulationcorrection,簡(jiǎn)記為fpc）,

當(dāng)抽樣比f(wàn)很小時(shí)，1-f就接近于1,這樣抽樣比對(duì)了的精度就沒有直接影響；

一般地，當(dāng)抽樣比小于5%,甚至小于10%時(shí)，fpc可以忽略不計(jì)，即認(rèn)為1-f為

1;事實(shí)上略去fpc的影響是使V（9）高了一些

18.抽樣調(diào)查步驟

確定調(diào)研問(wèn)題一一抽樣方案設(shè)計(jì)一一問(wèn)卷設(shè)計(jì)一一實(shí)施調(diào)查過(guò)程一一數(shù)據(jù)處

理分析一一撰寫調(diào)查報(bào)告

二.簡(jiǎn)單隨機(jī)抽樣SRS

（一）定義：從容量為N的總體中抽取一個(gè)容量為n的樣本，若所有可能的《個(gè)

樣本中的每一個(gè)被抽到的概率都相等，即每個(gè)可能樣本被抽中的概率均為1/G；,

這種抽樣方法稱為不放回的簡(jiǎn)單隨機(jī)抽樣，簡(jiǎn)稱簡(jiǎn)單隨機(jī)抽樣，所得的樣本稱為

不放回的簡(jiǎn)單隨機(jī)樣本，簡(jiǎn)稱簡(jiǎn)單隨機(jī)樣本

（二）實(shí)施方法：將總體中的單元依次從1到N進(jìn)行編號(hào)，然后利用抽簽法或隨

機(jī)數(shù)法來(lái)進(jìn)行簡(jiǎn)單隨機(jī)抽樣。

（三）優(yōu)點(diǎn)：簡(jiǎn)單直觀。在抽樣框完整時(shí)，可以直接從中抽選樣本，由于抽選的

概率相同，用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)及計(jì)算抽樣誤差都比較方便。

（四）局限性：它要求將包括所有總體單元的名單作為抽樣框，當(dāng)N很大時(shí)，構(gòu)

造這樣的抽樣框并不容易；根據(jù)這種方法抽出的單元很分散，給實(shí)施調(diào)查增加了

困難；這種方法沒有利用其他輔助信息以提高估計(jì)的效率。所以在規(guī)模較大的調(diào)

查中，很少直接采用簡(jiǎn)單隨機(jī)抽樣，一般是把這種方法與其他抽樣方法結(jié)合在起

使用。

（五）估計(jì)

總體指標(biāo)樣本指標(biāo)

丫二匕川+八+…+匕

/=!

?小展…+…+九了’".J+）-，

A1N

2二R=天Z匕（匕二°或1）p=q=」力,（%=0的）

NNF

nn,=1

Yr,._￡〃，-

R=^_=y=y

R=^—=—=4

fx,.xXn—

/=!/=1

次（匕一斤=上/-力2

(1)總體均值

對(duì)于簡(jiǎn)單隨機(jī)抽樣，歹是歹的無(wú)偏估計(jì)。即E(y)=P

對(duì)于簡(jiǎn)單隨機(jī)抽樣，死勺方差為：v(y)=^^s2=t2s2

nNn

V(巾勺無(wú)偏估計(jì)為：咆)=匕￡$2

門的置信度為1-a的近彳濯信區(qū)間為(9-M

_/VN

(2)總體總量(Y=NY=—￡丫)

對(duì)于簡(jiǎn)單隨機(jī)抽樣，魂Y的無(wú)偏估計(jì)，艮舊同=Y

寸的方差為：v(f)=N2V(y)=N~(I二/)52

用加無(wú)偏估計(jì)為：v(y)=N2v(y)=~~—s2

(3)總體比例

工寸［1,若第［?個(gè)單元具有所考慮的特1E.…...._人4一口七

設(shè)Yj=《開，匚，i=l,2,…，NKT,總體中有A個(gè)單兀具有

［0，其他

這個(gè)特征，即A=5；匕，總體中具有某種特征的單元在總體中所占的比例p即

是Y的均值：丫=2A=1!1N匕=已

NN￡

總體方差為：§2=,由于匕的取值為0

NN1z\/V

或1,所以X片=￡匕，即§2=------(NP-NP2)=---PQ,其中0=1-P.

i=li=lN—1N—1

相應(yīng)地，樣本比例為p=@=上一=少

樣本方差為/=」*7支（%-歹y=/7P（1-P）=」YP4（其中q=l-p）

〃一1nn-\n-\

P為P的簡(jiǎn)單估計(jì)，且為無(wú)偏估計(jì)，即E（p）=P

V（p肺無(wú)偏估計(jì)為：v（p）=^--s2=-~^〃4（其中（7=1-〃）

n71-1

在大樣本條件下，利用正態(tài)分布可得P的置信度為1-a的近似置信區(qū)間為

（六）樣本量的確定

費(fèi)用函數(shù)：CT=C0+C〃，其中CT為總費(fèi)用，C。為固定費(fèi)用，C為每調(diào)查一個(gè)

樣本單元所需的費(fèi)用。

絕對(duì)誤差限：d=uay/v^）=uaS,）

I---1---

型”耳=?助其中。砥爵甲

相對(duì)誤差限：r=u

tf1-5tf*-yE\uIy

（七）簡(jiǎn)單隨機(jī)抽樣估計(jì)總體均值或總體總量時(shí)樣本量的確定:

（1）精度要求：估計(jì)量》的方差上限為V

樣本量直接取〃°，否則對(duì)%進(jìn)行修正，取〃。

/C、2

,?s

V21-a-rj

（2）精度要求：估計(jì)量少的絕對(duì)誤差為d,則〃o=2=-4一，〃=—?

1——2

（3）精度要求:估計(jì)量了的相對(duì)誤差為r,則〃。

（4）精度要求：估計(jì)量歹的變異系數(shù)上限為C,則〃0=2Q_=廠二S立

V-（CY）2-C

（5）估計(jì)總體比例時(shí)樣本量的確定:

〃2p。2Q

I--I--

2_2齊導(dǎo)則〃=4

d2r-P

三.分層隨機(jī)抽樣

（一）定義：如果抽樣在每個(gè)層中獨(dú)立進(jìn)行，總的樣本由各層樣本構(gòu)成，這種抽

樣方法稱為分層抽樣。若在每層中的抽樣采用SRS,這樣的分層抽樣稱為分層隨

機(jī)抽樣。

（二）原則：同一層內(nèi)差異小，不同層間差異大。

（三）分層原因：當(dāng)總體各單元差異比較大時(shí)，對(duì)參數(shù)估計(jì)誤差比較大。將總體

分層，同一層中各單位差異小，從每一層中抽取構(gòu)成樣本,這樣樣本就有代表性，

可以提高估計(jì)的精度；可以同時(shí)對(duì)子總體進(jìn)行參數(shù)估計(jì)；便于依托各級(jí)管理機(jī)構(gòu)

進(jìn)行組織和實(shí)施。

（四）優(yōu)點(diǎn)：分層樣本代表性好；可總體參數(shù)估計(jì)，也可對(duì)層參數(shù)估計(jì)；實(shí)施靈

活方便；提高估計(jì)精度。2L1L

（五）分層隨機(jī)抽樣總體均值：

/:=1h=\

￡（兀）=€%,￡（%）=￡%%=F

h=lh=l

LLLi

V（兀）=v（2%%）=t%"（工）=IX十s；

h=\h=\h=lh

無(wú)偏估計(jì)：

5）=之制匕*S''=三力%f>

（六）分層隨機(jī)抽樣總體總值：Y.=八夕”

E（YJ=Y

口比）=1X（N%-%）與

A=11lh

L?2

巾（%）=一巧,）上是的一個(gè)無(wú)偏估計(jì)

A=1nh

(七)分層隨機(jī)抽樣總體比例:

h=\

Eg=P

/&)=品所給攀

ZA-lZhh

W(P")二點(diǎn)X"%是)的一個(gè)無(wú)偏估計(jì)

當(dāng)N“很大時(shí)，N?-1RN〃,所以N"/(N%—1),1.

此時(shí)/5”￡叫4「念

Mnh

估計(jì)量為*「"”)=2吟IzAPM*

/|=1〃hT

(A)分別比估計(jì)(對(duì)每層樣本分別考慮比估計(jì)量，然后對(duì)各層的比估計(jì)量進(jìn)行

加權(quán)平均)

LL市

K=1；環(huán)m=￡環(huán)"八

h=lh=lXh

_L_L

治”啟立共瑞旺心

/TMh=l

(%)。之叮a-力坊j,+R次「2&p凡

/i=ih

MSE(WQ=*)苗N式1-秋維+R2S2h_2RhPhSyhSxh)

/f=l〃/l

(九)聯(lián)合比估計(jì)(先對(duì)兩個(gè)指標(biāo)先分別計(jì)算出分層估計(jì)，然后再構(gòu)造比估計(jì))

yRc="大=RCX

_競(jìng)"

人￥八

I：I\C=—4—x=RcX

M阻加）”（加）空）乙）的+RS；h-2RphS,lSxh）

/i=iNnh

Nj，（if，，）z

心石臉）”（如^~（S；.h+RS；h-2即￡凡,）

/i=irth

（十）分別比估計(jì)與聯(lián)合比估計(jì)的比較

1.當(dāng)各層4的都比較大時(shí)，各層比率R之間差異比較大，此時(shí)分別比估計(jì)要優(yōu)

于聯(lián)合比估計(jì)；

2.當(dāng)某些層a的不夠大時(shí)，或者各層的比率R差異較小，還是采用聯(lián)合比估計(jì)更

有效些。

3.分別比估計(jì)需要知道各層的子總體輔助變量信息，而聯(lián)合比估計(jì)只需要知道總

體輔助變量的信息。

（十一）樣本量在各層的分配

廄4以:上公：=”設(shè)上嚕

h=\nhh=\nhh=\N

常數(shù)分配：即%="

1.L

層大小差不多，且沒有任何關(guān)于層的其他信息

2,比例分配：即%=〃叱，

層大小有差異，且每層的方差不大

Ney，/。/?分配：使的與叱河,成正比，即劭=n￡島

每層估計(jì)量達(dá)到相同精度

當(dāng)S.相等時(shí)，最優(yōu)分配就是比例分配

?一…向N5J瓜

"小5./￡少5/￡

4.最優(yōu)分配:

考慮簡(jiǎn)單的線性費(fèi)用函數(shù)：

J=%+匯

h=\

式中a是總費(fèi)用，。。是與樣本量無(wú)關(guān)的固定費(fèi)用，而q是

在第〃層中抽取一個(gè)單元的平均費(fèi)用.

（十二）總樣本量的確定

1.調(diào)查目標(biāo)是估計(jì)總體均值

若V是給定的估計(jì)量方方差的上限，則有必或

/:=1&h=TN

對(duì)某種分配為="?叫,h=l,2,…,L

h=\nh

之叫節(jié)；/叼）

力=1

'/N

V+

\h=\7

估計(jì)總體均值估計(jì)總體總值

設(shè)爐是給定的匕的方差上限，

(1)常數(shù)分配wh=-,h=l,2,...,L

L則將V=V/N2代入

叫

n虎卬閭

F+二閭

〃=-^=---詈-------

1+墨V+^W^/N)

Nh=l

(2)比例分配wh=W?,h=l,2,...,L（2）比例分配卬力=此,〃=1,2,…,L

n次卬⑶〃一

N局

n=—=---號(hào)-------V+Z.

1+.V+(次w局/N)

Nh=\

叼4ws

(3)Heyman分配(3)Neyman分酉已w=

Egh汽z叱￡

h=]h=\

(L、2

<任】J〃一(ZM)2

V+RZ叱&一O+ZHS

h=\

（4）最優(yōu)分配（4）最優(yōu)分配

（\叱4石）_0網(wǎng)際向（工網(wǎng)8」向

〃一R+Ed同

V+^W^/N

h=\

若精度是對(duì)力的絕對(duì)誤差限△（在給定置彳言鹿精度是對(duì)匕的絕對(duì)誤差限&在給定置彳言度下）

形式給出，即形式給出，即

將丫=與置換前面各結(jié)果將V=絲，空置換前面各結(jié)果

Za/2Za/2

若精度是對(duì)得的相對(duì)誤差限y（在給定置彳言震精度是對(duì)口的相對(duì)誤差限7（在給定置彳糠下）

形式給出，即形式給出，即

將V=（ZL）2置換前面各結(jié)果將丫=（匹）2置換前面各結(jié)果

Za/2Za/2

2.調(diào)查目標(biāo)是總體比例P

將Sh?=PhQh置換前面估計(jì)總體均值結(jié)果

<Vps<vxrs

srs

四.整群抽樣

（一）定義：整群抽樣是將總體劃分為若干群，然后以群為抽樣單元，從樣本中

隨機(jī)抽取一部分群，對(duì)選中的群的所有基本單元進(jìn)行調(diào)查的一種抽樣技術(shù)。目的

主要是擴(kuò)大抽樣單位，簡(jiǎn)化組織工作。

（二）特點(diǎn)：抽樣框的編制簡(jiǎn)單；實(shí)施便利，節(jié)省費(fèi)用；抽樣誤差相對(duì)較大。

發(fā)揮整群抽樣的優(yōu)勢(shì)，因?yàn)槠涫r(shí)省力，每個(gè)單元的平均調(diào)查費(fèi)用比較少，故可

通過(guò)增大樣本量的方法彌補(bǔ)精度的損失。

（三）群的劃分：盡量擴(kuò)大群內(nèi)差異，而縮小群間差異。這樣，每個(gè)群都具有足

夠好的代表性。所以分群的原則使“群內(nèi)差異大、群間差異小”與分層的原則使

“層內(nèi)差異小，層間差異大”是恰好相反的。

（四）群的規(guī)模：組成群的單元的數(shù)量。其選擇一是取決于精度與費(fèi)用之間的平

衡，二是從抽樣實(shí)施的組織管理等因素來(lái)考慮。

（五）等概率整群抽樣的情形（群規(guī)模相等）

總體群間方差：s：=3z（匕一斤總體群內(nèi)方差：化廠可

N-\jN（M7

〃

M￡-o1M、

樣本群間方差:心0石中5樣本群內(nèi)方差:：=〃(/_1)￡5(為一，)

1NM/

總體方差：s2=—K-F

NM-1一個(gè),J>樣本方差TZZGT-

1、總體均值》的估計(jì)聲=歹=空匕

?,=|

，-N白N

2、總體總和y的估計(jì)

Y=NM?y=—YYi=-y

1n1n

3、總體比例P的估計(jì)0=p=_之"=

卒-力2=.出士(K/M-「/M)2=1-/

v(y)

V(f)=V(NMy)=N2M2V(y)v(f)=N2M2v(y)

一Z(p「p)2>fZ(P，_再

v(0)二^^-----------------

nN-lnn-1

(六)設(shè)計(jì)效應(yīng)

仍用總體均值估計(jì)量的方差進(jìn)行討論，并且考慮等概率抽樣的情形。由前面

的分析可知，〒的估計(jì)量y的方差為VG)B"S2[1+(M-1)PC]

如果按簡(jiǎn)單隨機(jī)抽樣從總體中抽取nM個(gè)次級(jí)單元，則：Vsrs(y)=i^S

\r(=\~S'[1+(M—l)/?]

所以，整群抽樣的設(shè)計(jì)效應(yīng)為：Deff=-^上.nM--------c-%

vsrs(y)lz￡s

方一

1+(M-l)/?c$+(/T)s：,

當(dāng)Oc〉0時(shí)，Deff<l,則整群抽樣的精度較簡(jiǎn)單隨機(jī)抽樣在相同樣本量時(shí)要差。

當(dāng)￡<0時(shí)，Deff<l,則整群抽樣的精度較相同樣本量的簡(jiǎn)單隨機(jī)抽樣要高。

若令n為簡(jiǎn)單隨機(jī)抽樣的樣本量，則〃仍=—=x,即可達(dá)到整群抽樣nM戶樣本量

m8deff

相同的估計(jì)精度。

四.多階段抽樣

（一）定義：在總體各單位（初級(jí)單位PSU）中抽取樣本單位，在抽中的初級(jí)單

位中再抽取若干個(gè)第二級(jí)單位（SSU）,在抽中的第二級(jí)單位中再抽取若干個(gè)第三

級(jí)單位……，直至從最后一級(jí)單位中抽取所要調(diào)查的基本單位的抽樣組織形式，

就叫做多階段抽樣。

（二）特點(diǎn)：便于組織抽樣；可以使抽樣方式更加靈活和多樣化；能夠提高估計(jì)

精度；可以提高抽樣的經(jīng)濟(jì)效益；可以為各級(jí)機(jī)構(gòu)提供相應(yīng)的信息。

（三）適用范圍：在社會(huì)研究中，當(dāng)總體的規(guī)模特別大，或者總體分布的范圍特

別廣時(shí)，研究者一般采取多階段抽樣的方法來(lái)抽取樣本。

（四）基本假定：初級(jí)單元中所包含的次級(jí)單元數(shù)目相同，均為M,因此從抽中

的初級(jí)單元中再抽取的次級(jí)單元個(gè)數(shù)也相同，為m；兩個(gè)階段的抽樣方法都是簡(jiǎn)

單隨機(jī)抽樣；在抽中的初級(jí)單元中作第二階抽樣是相互獨(dú)立進(jìn)行的。

（五）分層抽樣、整群抽樣、二階抽樣的共同點(diǎn)及區(qū)別

共同點(diǎn)：都將總體分為若干子總體（層、群）

區(qū)別：分層抽樣一一對(duì)總體中每個(gè)子總體（層）都進(jìn)行抽樣；

整群抽樣一一對(duì)總體中被抽中的若干個(gè)子總體（群）進(jìn)行普查；

二階抽樣一一對(duì)總體中被抽中的若干個(gè)子總體（群）再進(jìn)行抽樣。

（六）二階抽樣的效率

通常情況下，二階抽樣的設(shè)計(jì)效應(yīng)大于1。這說(shuō)明二階抽樣的效率要低于簡(jiǎn)單抽

樣，但是由于二階抽樣有著樣本分布集中，可以省時(shí)、省力和省費(fèi)用的優(yōu)點(diǎn)，因

此從這個(gè)意義來(lái)講，二階抽樣的效率就不一定低于簡(jiǎn)單隨機(jī)抽樣了。

二階抽樣效率通常低于分層抽樣。

二階抽樣的效率有時(shí)低于整群抽樣，有時(shí)高于整群抽樣。

（七）估計(jì)

第一階段和第二階段的抽樣比：/=n/N,f2=m/M

[M1m

J=1m;=1

初級(jí)單元間的方差：s；==次,-4-可

iNMinm

初級(jí)單元內(nèi)的方差：丘品引話;化廠。0釬狀電沙廠訂0

q1n1nm

L總體均值7,平=嬴沼力

V（小子的噤比◎=

nnm

1N1N—1M1n

2-p=/p尸而，二牛=嬴牛

V(P)=—/4(?4+看常刁

y(p)=1~f，\z(Pi-“)2+--7^-prSP，4

nn-\]n〃(加一1)1

五.不等概抽樣

（一）定義：如果總體中每個(gè)單元進(jìn)入樣本的可能性是不相等的，則這種隨機(jī)

抽樣方式就稱為不等概率隨機(jī)抽樣，簡(jiǎn)稱不等概率抽樣。

（二）特點(diǎn)：將總體中每個(gè)單元的入樣概率與其“規(guī)?！贝笮÷?lián)系起來(lái)，使得“大

單元”被抽到的概率大，“小單元”被抽到的概率小。

（三）優(yōu)點(diǎn)：能夠大大提高抽樣精度，減少抽樣誤差。

（四）局限性：必須具有能夠說(shuō)明單元規(guī)模大小的輔助變量來(lái)確定各個(gè)單元的入

樣概率或包含概率。

（五）適用場(chǎng)合：總體單元之間的差異較大。

（六）分類

抽樣容量n固定時(shí)，單元入樣的概率（不放回抽樣）或每次抽樣的概率（有放

回抽樣）與單元的大小嚴(yán)格成比例。這種情況下的有放回抽樣稱為PPS抽樣，不

放回抽樣稱為"PS抽樣。

一代碼法（漢森―赫維茨（Hansen-Hurwitz）法）

PPS抽樣：有放回抽樣-拉希里（Lahiri）法（二次抽取法）

-L規(guī)模累積等距抽選法

JTPS抽樣：不放回抽樣_Brewer（布魯爾）方法（1963）

Durbin（德賓）方法（1967）

代碼法：它適合于N不太大的情形。假定所有Mi為整數(shù)（若不然也可以乘以一個(gè)

倍數(shù)M0,使一切Mi=MZ成為整數(shù)），對(duì)于具有整數(shù)Mi的第i個(gè)單元賦予一個(gè)與

Mi相等的代碼數(shù)。每次抽樣前，先在整數(shù)1,2,…,M0里面隨機(jī)等可能地選取一

個(gè)整數(shù)，設(shè)為m,若代碼m屬于第j個(gè)單元擁有的代碼數(shù)，則第j個(gè)單元入樣。

這個(gè)過(guò)程重復(fù)n次，得到n個(gè)單元入樣（當(dāng)然存在重復(fù)的可能），構(gòu)成了pps樣

本。

Lahiri法:令M*=max{MJ每次抽取一個(gè)［1,N］中的隨機(jī)數(shù)i及口,M*忡的隨機(jī)數(shù)機(jī)

1</<^

若用?〃?,則第i個(gè)單元入樣；否則重抽一組億機(jī)）.

（七）漢森―赫維茨（Hansen-Hurwitz）估計(jì)量（總量估計(jì)）

YLyXL

=Ed陽(yáng))二y

Var(%)-n2

ny1^HH

Z2HHy

\)nn-\J〃(〃T)占

六.系統(tǒng)抽樣（Systematicsampling）

（一）定義：又稱為等距抽樣、機(jī)械抽樣。按照這種抽樣方法，從總體中抽取第

一個(gè)樣本點(diǎn)（隨機(jī)起點(diǎn)），然后按某種固定的順序和規(guī)律依次抽取其余的樣本點(diǎn)，

最終構(gòu)成樣本。

（二）優(yōu)點(diǎn)：樣本分布比較均勻，在現(xiàn)實(shí)生活中比較容易接受；樣本單位抽取簡(jiǎn)

便，有很高適用價(jià)值；簡(jiǎn)便易行，簡(jiǎn)化抽樣手續(xù)。

（三）缺點(diǎn)：如果單元的排列存在周期性的變化，而抽樣者對(duì)此缺乏了解或處理

經(jīng)驗(yàn)，抽取的樣本可能代表性很差。系統(tǒng)抽樣的方差很復(fù)雜，對(duì)估計(jì)帶來(lái)很大困

難。有時(shí)估計(jì)量是有偏的。抽樣誤差計(jì)算上比較復(fù)雜。

（四）特點(diǎn)：系統(tǒng)抽樣只需要抽取一個(gè)樣本單位，然后按照某種規(guī)律，順

次地得到整個(gè)樣本。

（五）抽樣一般方法：

1.直線等距抽樣

假設(shè)總體單元數(shù)為N,樣本容量為n,N=nko在1k中隨機(jī)抽出一個(gè)單元編

號(hào)，然后每隔k個(gè)單元編號(hào)抽取一個(gè)單元編號(hào)，直到抽出n個(gè)單元編號(hào)為止。

2.循環(huán)等距抽樣（適用于k不為整數(shù)）

抽樣間距k取最接近N/n的整數(shù)，從1?N中隨機(jī)抽取一個(gè)隨機(jī)起點(diǎn)作為起

始單元，然后每隔k個(gè)抽取一個(gè)，直到抽取滿n個(gè)為止。如果序號(hào)大于N時(shí),

將其減去N得到的在1—N中的號(hào)碼入選。

（六）抽樣方法改進(jìn)

1.中心位置法

起點(diǎn)不是隨機(jī)取，而是直接取第一階段的k個(gè)單元中處于中間位置的單元。

K奇數(shù)，r=（k+l）/2；k偶數(shù),r=k/2或r=k/2+l。

雖然可以提高精度，但對(duì)于一定順序排列的總體，樣本是確定的，失去了隨

機(jī)性。尤其對(duì)同樣問(wèn)題進(jìn)行連續(xù)性調(diào)查，樣本老化，會(huì)帶來(lái)較大不利影響。

2.對(duì)稱系統(tǒng)抽樣

當(dāng)他疝且n為偶數(shù)時(shí)，將總體分為n/2組，每組含有2k個(gè)單元，在各段內(nèi)

隨機(jī)抽取與兩端等距地兩個(gè)單元作為樣本，一端靠近低端，一端靠近高端。假設(shè)

隨機(jī)起點(diǎn)為i（lWiWk）,入樣單元：\_i+2jk,2（j+\）k-i+\']j=

（七）等概系統(tǒng)抽樣（即等距抽樣）估計(jì)量的性質(zhì)

1.Y的估計(jì)量均值%=%=工f%

〃;=|

當(dāng)N=nK,%為「的無(wú)偏估計(jì)量，當(dāng)N*nK,%為「的有偏估計(jì)量。

2.1的估計(jì)量方差

221-f2_N-n1_、2

m,.)=￡(^.-r)=7E(yr-K)%=----=nN〃—1自，一，》

Kr=ln

反映sy與SRS關(guān)系的方差計(jì)算公式：匹（叉v）=Z（%-P）2,又有

r=\

s2=E之力為y）2=>（Ni）s2=「可

/v7r=lj=\r=\j=\

=式（為-守+巨豆（力-反產(chǎn)成叭%）+2￡（力-%）2⑴

r=lr=lj=\r=lj=l

令（力一工>（系統(tǒng)樣本內(nèi)方差）

左（〃-

則將心-l）S2=￡￡（y廣,/代入⑴式

r=lj=\

便有：（N-1?2=nkV（ysy）+k（n-l）Sly，得“（又v）=吟號(hào)一管/S；v

系統(tǒng)抽樣優(yōu)于簡(jiǎn)單隨機(jī)抽樣的條件為：.（一二DS：一挺仁工<——

NNyNn

即更但一口至〈螞曰所當(dāng)：

NNnN

/〃T）S；,>［（N—>%（〃—1?2,就是S*>§2,sy效率高于SRSO

當(dāng)總體單元的排列順序與要研究的總體特征總量的大小高度相關(guān)，不管是正

相關(guān)還是負(fù)相關(guān)，則系統(tǒng)抽樣更接近于分層抽樣；當(dāng)總體單元的排列順序與要研

究的總體特征變量的大小相關(guān)程度極低時(shí)，則系統(tǒng)抽樣更接近于簡(jiǎn)單隨機(jī)抽樣；

當(dāng)總體單元的排列順序與要研究的總體特征變量的大小相關(guān)程度介乎于兩者之

間，則很難知道系統(tǒng)抽樣到底與其他三種抽樣方式的哪一種更相似。

附：考試范圍

《抽樣技術(shù)》期末復(fù)習(xí)提綱

第一章緒論

1、了解抽樣調(diào)查的意義、特點(diǎn)、發(fā)展歷史、應(yīng)用及分類組織。

2、理解和掌握總體、樣本、抽樣框、樣本可能數(shù)目的基本概念。

3、理解和掌握概率抽樣與非概率抽樣的區(qū)別，抽樣誤差與非抽樣誤差的區(qū)別與

聯(lián)系等。

4、系統(tǒng)地掌握和熟練地應(yīng)用統(tǒng)計(jì)量的抽樣分布、抽樣誤差的計(jì)算、抽樣估計(jì)的

方法和步驟、抽樣設(shè)計(jì)效果的評(píng)價(jià)等問(wèn)題。

第二章簡(jiǎn)單隨機(jī)抽樣

1、理解簡(jiǎn)單隨機(jī)抽樣的概念、地位和特點(diǎn)。

2、熟練地掌握簡(jiǎn)單隨機(jī)抽樣的具體方法、總體均值、總量、比例的估計(jì)方法以

及樣本容量的確定方法等并能夠熟練應(yīng)用。

3、熟練掌握比率估計(jì)的構(gòu)造定義。

第三章分層隨機(jī)抽樣

1、理解分層抽樣的概念與特點(diǎn)。

2、熟練掌握分層抽樣的原則、特點(diǎn)、估計(jì)的方法。

3、深入理解分層抽樣中總樣本量在各層間分配的方法。

4、了解分層隨機(jī)樣本中的比率估計(jì)的構(gòu)造。

第四章整群抽樣與多階段抽樣

1、了解整群抽樣的原則、特點(diǎn)、適用場(chǎng)合。

2、掌握群規(guī)模相等時(shí)整群抽樣的方法及對(duì)總體指標(biāo)的估計(jì)方法。

3、理解抽樣效果與樣本容量的分析確定方法，分清整群抽樣與分層隨機(jī)抽樣的

區(qū)別。

4、了解多階段抽樣的原則、特點(diǎn)及適用場(chǎng)合。

5、了解初級(jí)單元相等時(shí)兩階段抽樣中對(duì)總體指標(biāo)的估計(jì)方法。

第五章不等概抽樣

1、理解并掌握不等概率抽樣的意義、特點(diǎn)、實(shí)施方法。

2、熟練掌握PPS抽樣條件下估計(jì)量及其誤差計(jì)算。

3、了解不放回不等概抽樣的概念。

第六章系統(tǒng)抽樣

1、理解和掌握等距抽樣的特點(diǎn)與實(shí)施方法。

2、熟練掌握總體單元隨機(jī)排列情形，總體參數(shù)的估計(jì)以及估計(jì)量方差的估計(jì)方

法。

附：練習(xí)題

簡(jiǎn)單隨機(jī)抽樣：

為調(diào)查某5443戶城鎮(zhèn)居民服裝消費(fèi)情況，采用簡(jiǎn)單隨機(jī)不重復(fù)抽樣調(diào)查了36

戶進(jìn)行調(diào)查，得到平均消費(fèi)支出了=649.72元，.I=304803試根據(jù)此估計(jì)：

（1）該地區(qū)居民服裝消費(fèi)支出總額，并給出置信水平為95%的置信區(qū)間。

（2）如果希望服裝平均消費(fèi)支出的相對(duì)誤差限不超過(guò)5%,則樣本量至少應(yīng)為多

少？

解：N=5443,〃=36,y=M9.72,/=3(X803=1.96

(1)/=A=O.66%,F~Ny±N-t-J^—^-s

N\n

T=9=3536425.96v(y)=^L.s=8410.8695

v(y)=N2-v(y)SE(r)=499181.8433

區(qū)間為：(2558029.55,451482237)

(2)r45%,〃=%,%=1T

1+國(guó)rp

根據(jù)題中相關(guān)數(shù)據(jù)可得421110戶，由此可得“2922戶。要滿足相應(yīng)的精度要

求，至少得抽922戶做樣本。

簡(jiǎn)單隨機(jī)抽樣（比例）：

某地區(qū)10000名群眾，現(xiàn)欲估計(jì)在擁有本科學(xué)歷及以上的群眾所占的比例，隨機(jī)

不重復(fù)抽取了300名群眾進(jìn)行調(diào)查，得到〃=0.25,試估計(jì)該地區(qū)群眾擁有本科

以上學(xué)歷的比例，并以正態(tài)分布近似給出其95%的置信區(qū)間。

解：N=10000,〃=300,/=—=0.03,p=0.25/=1.96

u（p）=-~~—?〃?（1—〃）a6.08x104

n-1

SE(p)a0.0247

所以本科生中暑假參加培訓(xùn)班的95%的置信區(qū)間為:

p土八SE（p）=25%±（1.96x0.0247）=25%±0.0484

即（0.2016,0.2984）

分層隨機(jī)抽樣：

對(duì)某地區(qū)171980戶居民家庭收入進(jìn)行調(diào)查，以居民戶為抽樣單位，根據(jù)城鎮(zhèn)和

鄉(xiāng)村將居民劃為2層，每層按簡(jiǎn)單隨機(jī)抽樣抽取300戶，經(jīng)整理得如下數(shù)據(jù)：

層Sh

Nhyh叱

城鎮(zhèn)23560151800.1372972

鄉(xiāng)8632546

試根據(jù)此估計(jì)：（20分）

（1）居民平均收入及其95%的置信區(qū)間。

（2）若是按比例分配和奈曼分配時(shí)，各層樣本量分別應(yīng)為多少？

解：（1）由題中相關(guān)數(shù)據(jù)資料：兀=工卬/%”10585.39（元）

h=l

2c2

v（yj7）=2叱：.（i_力,）.」a545.5718+16059.7364=16605.3082（元）

h=\nh

se（匕）a128.86（元/戶），r=1.96

該地區(qū)居民平均收入的95%的置信區(qū)間為：

Ys,±t-se（Ysl）f（10332.82,10837.96）元

（2）按比例分配：々=〃?叱=600x0.137=82（戶）

%=〃?嗎=600x0.863=518（戶）

按奈曼分配：%=〃?獸鳥」

/?=!

由表中資料：〃=600,卬吊=407.IM,W2S2=2197.198,^^,5,=26(M.362

A=1

由上可得根據(jù)奈曼分配，各層所需樣本容量為:

407.164

%=600x。94

2604.362

2197.198

n=600x?506

22604.362

整群抽樣：

郵局欲估計(jì)每個(gè)家庭的平均訂報(bào)份數(shù)，該轄區(qū)共有4000戶，劃分為400個(gè)群,

每群10戶，現(xiàn)隨機(jī)抽取4個(gè)群，取得資料如下表所示：

群各戶訂報(bào)數(shù)為以

11,2,1,3,3,2,1,4,1,119

21,3,2,2,3,1,4,1,1,220

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

抽樣技術(shù)期末知識(shí)點(diǎn)(附考點(diǎn)大題)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔