不等概率抽樣課件_第1頁
不等概率抽樣課件_第2頁
不等概率抽樣課件_第3頁
不等概率抽樣課件_第4頁
不等概率抽樣課件_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第六章不等概率抽樣§1概述一、不等概率抽樣的定義和特點(一)定義:如果總體中每個單元進入樣本的可能性是不相等的,則這種隨機抽樣方式就稱為不等概率隨機抽樣,簡稱不等概率抽樣。

(二)特點:將總體中每個單元的入樣概率與其“規(guī)?!贝笮÷?lián)系起來,使得“大單元”被抽到的概率大,“小單元”被抽到的概率小。第六章不等概率抽樣§1概述一、不等概率抽樣的定1二、不等概率抽樣的優(yōu)點和局限性(一)優(yōu)點:能夠大大提高抽樣精度,減少抽樣誤差。

(二)局限性:必須具有能夠說明單元規(guī)模大小的輔助變量來確定各個單元的入樣概率或包含概率。三、不等概率的適用場合:總體單元之間的差異較大。四、不等概率抽樣分類:我們最關(guān)心也是最重要的情形是抽樣容量n固定時,單元入樣的概率(不放回抽樣)或每次抽樣的概率(有放回抽樣)與單元的大小嚴格成比例。這種情況下的有放回抽樣稱為抽樣不放回抽樣稱為抽樣。二、不等概率抽樣的優(yōu)點和局限性(一)優(yōu)點:能夠大大提高抽樣精2§2

放回的不等概率抽樣1、多項抽樣、抽樣及其實施方法既然是不等概率抽樣,那么就應該在抽樣之前給總體中的每一個單元賦予一定的抽取概率,在放回抽樣的每一次抽取中,設(shè)第個單元入樣的概率為且,按此規(guī)定有放回地獨立抽取n次,形成所謂的多項抽樣?!?放回的不等概率抽樣1、多項抽樣、抽樣及3假設(shè)第個單元在n次抽樣中被抽中次,則是一個隨機向量,其聯(lián)合分布為:這是我們熟悉的多項分布,多項抽樣其名正出于此。(7.1)多項分布(7.1)具有如下性質(zhì):倘若單元有一個數(shù)值度量其大小,諸如職工人數(shù)、工廠產(chǎn)值商店銷售額等,或者感興趣的調(diào)查指標在上一次普查時的數(shù)據(jù)也可以作為其單元大小的一種度量。記為第個單元的“大小”,并記假設(shè)第個單元在n次抽樣中被抽中次,則這是我4多項抽樣是最簡單的不等概率抽樣,它的實施方法通常有兩種,以pps抽樣為例。則可取此時多項抽樣體現(xiàn)了每次抽樣時單元的入樣概率與單元的大小成比例,即為pps抽樣。

(1)代碼法它適合于N不太大的情形。假定所有的為整數(shù),倘若在實際中存在不是整數(shù)的話,則可以乘以一個倍數(shù)使一切為整數(shù)(對一般的多項抽樣,也總可找到整數(shù),使一切成為整數(shù))。對于具整數(shù)的第個單元賦予一個與相等的代碼數(shù),見表7—1。多項抽樣是最簡單的不等概率抽樣,它的實施方法通常有兩5單元單元大小代碼數(shù)表7—1pps抽樣時各單元的代碼數(shù)每次抽樣前,先在整數(shù)里面隨機等可能的選取一個整數(shù),設(shè)為m,若代碼m屬于第j個單元擁有的代碼數(shù),則第j個單元入樣。整個過程重復n次,得到n個單元入樣(當然存在重復的可能性)構(gòu)成pps樣本。單元單元大小代碼數(shù)表7—1pps抽樣時6例7.1設(shè)某總體共有N=8個單元,相應及代碼如表所示123456782/51/22/34/38/53/52/311215204048182030累計12274787135153173203代碼1~1213~2728~4748~8788~135136~153154~173174~203例7.1設(shè)某總體共有N=8個單元,相應及代碼如表所7若取n=3,在1~203中隨機有放回地產(chǎn)生3個隨機整數(shù),不妨設(shè)為45、89、101,則第3個單元入樣一次,第5個單元入樣2次。(2)Lahiri(拉希里)方法當N相當大時,累計的將很大,給代碼法的實施帶來很多不方便。Lahiri提出下列方法:令每次抽取1~N中一個隨機整數(shù)及1~內(nèi)一個隨機整數(shù),如果,則第個單元入樣;若,則按前面步驟重抽,顯然,第個單元的入樣與否受到的影響,只有時它才入樣,因此第個單元入樣的概率與的大小成正比,此時m若取n=3,在1~203中隨機有放回地產(chǎn)生3個隨機整數(shù),不82、Hansen-Hurwitz(漢森—赫維茨)估計量若是按為入樣概率的多項抽樣而得的樣本數(shù)據(jù),它們相應的值自然記為,則對總體總和,Hansen-Hurwitz給出了如下的估計量:(7.4)且,即是總體總和的無偏估計。(7.6)的無偏估計為(7.7)2、Hansen-Hurwitz(漢森—赫維茨)估計量9§2不放回的不等概率抽樣上一節(jié)講述了有放回不等概率抽樣,無論從實施上還是從估計計算以及精度估計都顯得十分方便。但是,一個單元被抽中兩次以上總會使樣本的代表性打折扣,從而引起抽樣誤差的增加。因此,實際調(diào)查工作者一般傾向于使用不放回形式。最簡單的不放回不等概率抽樣方式自然會想到逐一抽樣這在第一次抽樣時不會發(fā)生問題,但在抽第二個樣本時面臨的情況與有放回時大不相同,余下的(N-1)個單元以什么樣的概率參與第二次抽樣就是個問題;再在抽第三個樣本時又面臨新問題,如此下去,一是抽樣實施的復雜,二是估計量及其方差計算的復雜,因此,在本節(jié)僅討論n固定,尤其是n=2時的情形。同時,我們只對使總體中每個單元的入樣概率嚴格地與其“大小”成比例感興趣,這就是所謂的抽樣?!?不放回的不等概率抽樣上一節(jié)講述了有放回101、包含概率不放回不等概率抽樣中,總體中每個單元被包含到樣本的概率,即入樣概率是個重要的概念,而且任意兩個單元包含到樣本中去的概率也是個重要的概念,可以想象,估計量的方差等計算會與有著密切的關(guān)系既然表示第個單元在n個樣本中出現(xiàn)的可能性,那么所有N個單元在樣本中出現(xiàn)的可能性之和自然等于n,這就是的一個眾所周知的性質(zhì):我們所考慮的嚴格抽樣,既然與成比例,若n固定的話,顯然有:(7.8)(7.9)1、包含概率不放回不等概率抽樣中,總體中每個單元被包11對于,我們有(7.11)2、Horvitz—Thompson(霍維茨—湯普森)估計量(7.12)H—T估計量與H—H估計量是及其相似的。因為,它們在形式上似乎完全一樣,但是H—H估計量中的可以互相重復,而H—T中的卻是絕對地互不相同。對于不放回不等概率抽樣,關(guān)于總體總和由Horvitz和Thompson提出如下的估計量:對于,我們有(7.11)2、Horvitz—T12當n固定時,H—T估計量的方差為:(7.13)3、幾種嚴格的不放回抽樣方法前面已經(jīng)指出,所謂“嚴格不放回”是指樣本容量n固定,嚴格不放回、的抽樣。僅介紹n=2的情形。(1)Brewer(布魯爾)方法(1963)假設(shè)對所有,均有,現(xiàn)抽取兩個樣本,最通常的方法是逐個選取。先以正比于的概率從N個單元中抽取1個樣本,然后在余的N-1個單元中按與成正比的概率抽取第2樣本當n固定時,H—T估計量的方差為:(7.13)3、幾種嚴13這種抽樣方法可以保證每個單元入樣概率為:而(7.17)其中這種抽樣方法可以保證每個單元入樣概率為:而(7.17)其中14(2)Durbin(德賓)方法(1967)的概率抽取第二個樣本。此時以概率在總體中進行一次不等概率抽樣,設(shè)第個單元以概率入樣,在剩余的N-1個單元中,以正比于于是可以計算出(7.19)(7.18)(2)Durbin(德賓)方法(1967)的概率抽取第二個樣15Durbin方法中的與Brewer方法中的完全一樣這表明兩種不等概率抽樣方法其實是等價的。(7.20)Durbin方法中的與Brewer方16第六章不等概率抽樣§1概述一、不等概率抽樣的定義和特點(一)定義:如果總體中每個單元進入樣本的可能性是不相等的,則這種隨機抽樣方式就稱為不等概率隨機抽樣,簡稱不等概率抽樣。

(二)特點:將總體中每個單元的入樣概率與其“規(guī)?!贝笮÷?lián)系起來,使得“大單元”被抽到的概率大,“小單元”被抽到的概率小。第六章不等概率抽樣§1概述一、不等概率抽樣的定17二、不等概率抽樣的優(yōu)點和局限性(一)優(yōu)點:能夠大大提高抽樣精度,減少抽樣誤差。

(二)局限性:必須具有能夠說明單元規(guī)模大小的輔助變量來確定各個單元的入樣概率或包含概率。三、不等概率的適用場合:總體單元之間的差異較大。四、不等概率抽樣分類:我們最關(guān)心也是最重要的情形是抽樣容量n固定時,單元入樣的概率(不放回抽樣)或每次抽樣的概率(有放回抽樣)與單元的大小嚴格成比例。這種情況下的有放回抽樣稱為抽樣不放回抽樣稱為抽樣。二、不等概率抽樣的優(yōu)點和局限性(一)優(yōu)點:能夠大大提高抽樣精18§2

放回的不等概率抽樣1、多項抽樣、抽樣及其實施方法既然是不等概率抽樣,那么就應該在抽樣之前給總體中的每一個單元賦予一定的抽取概率,在放回抽樣的每一次抽取中,設(shè)第個單元入樣的概率為且,按此規(guī)定有放回地獨立抽取n次,形成所謂的多項抽樣?!?放回的不等概率抽樣1、多項抽樣、抽樣及19假設(shè)第個單元在n次抽樣中被抽中次,則是一個隨機向量,其聯(lián)合分布為:這是我們熟悉的多項分布,多項抽樣其名正出于此。(7.1)多項分布(7.1)具有如下性質(zhì):倘若單元有一個數(shù)值度量其大小,諸如職工人數(shù)、工廠產(chǎn)值商店銷售額等,或者感興趣的調(diào)查指標在上一次普查時的數(shù)據(jù)也可以作為其單元大小的一種度量。記為第個單元的“大小”,并記假設(shè)第個單元在n次抽樣中被抽中次,則這是我20多項抽樣是最簡單的不等概率抽樣,它的實施方法通常有兩種,以pps抽樣為例。則可取此時多項抽樣體現(xiàn)了每次抽樣時單元的入樣概率與單元的大小成比例,即為pps抽樣。

(1)代碼法它適合于N不太大的情形。假定所有的為整數(shù),倘若在實際中存在不是整數(shù)的話,則可以乘以一個倍數(shù)使一切為整數(shù)(對一般的多項抽樣,也總可找到整數(shù),使一切成為整數(shù))。對于具整數(shù)的第個單元賦予一個與相等的代碼數(shù),見表7—1。多項抽樣是最簡單的不等概率抽樣,它的實施方法通常有兩21單元單元大小代碼數(shù)表7—1pps抽樣時各單元的代碼數(shù)每次抽樣前,先在整數(shù)里面隨機等可能的選取一個整數(shù),設(shè)為m,若代碼m屬于第j個單元擁有的代碼數(shù),則第j個單元入樣。整個過程重復n次,得到n個單元入樣(當然存在重復的可能性)構(gòu)成pps樣本。單元單元大小代碼數(shù)表7—1pps抽樣時22例7.1設(shè)某總體共有N=8個單元,相應及代碼如表所示123456782/51/22/34/38/53/52/311215204048182030累計12274787135153173203代碼1~1213~2728~4748~8788~135136~153154~173174~203例7.1設(shè)某總體共有N=8個單元,相應及代碼如表所23若取n=3,在1~203中隨機有放回地產(chǎn)生3個隨機整數(shù),不妨設(shè)為45、89、101,則第3個單元入樣一次,第5個單元入樣2次。(2)Lahiri(拉希里)方法當N相當大時,累計的將很大,給代碼法的實施帶來很多不方便。Lahiri提出下列方法:令每次抽取1~N中一個隨機整數(shù)及1~內(nèi)一個隨機整數(shù),如果,則第個單元入樣;若,則按前面步驟重抽,顯然,第個單元的入樣與否受到的影響,只有時它才入樣,因此第個單元入樣的概率與的大小成正比,此時m若取n=3,在1~203中隨機有放回地產(chǎn)生3個隨機整數(shù),不242、Hansen-Hurwitz(漢森—赫維茨)估計量若是按為入樣概率的多項抽樣而得的樣本數(shù)據(jù),它們相應的值自然記為,則對總體總和,Hansen-Hurwitz給出了如下的估計量:(7.4)且,即是總體總和的無偏估計。(7.6)的無偏估計為(7.7)2、Hansen-Hurwitz(漢森—赫維茨)估計量25§2不放回的不等概率抽樣上一節(jié)講述了有放回不等概率抽樣,無論從實施上還是從估計計算以及精度估計都顯得十分方便。但是,一個單元被抽中兩次以上總會使樣本的代表性打折扣,從而引起抽樣誤差的增加。因此,實際調(diào)查工作者一般傾向于使用不放回形式。最簡單的不放回不等概率抽樣方式自然會想到逐一抽樣這在第一次抽樣時不會發(fā)生問題,但在抽第二個樣本時面臨的情況與有放回時大不相同,余下的(N-1)個單元以什么樣的概率參與第二次抽樣就是個問題;再在抽第三個樣本時又面臨新問題,如此下去,一是抽樣實施的復雜,二是估計量及其方差計算的復雜,因此,在本節(jié)僅討論n固定,尤其是n=2時的情形。同時,我們只對使總體中每個單元的入樣概率嚴格地與其“大小”成比例感興趣,這就是所謂的抽樣?!?不放回的不等概率抽樣上一節(jié)講述了有放回261、包含概率不放回不等概率抽樣中,總體中每個單元被包含到樣本的概率,即入樣概率是個重要的概念,而且任意兩個單元包含到樣本中去的概率也是個重要的概念,可以想象,估計量的方差等計算會與有著密切的關(guān)系既然表示第個單元在n個樣本中出現(xiàn)的可能性,那么所有N個單元在樣本中出現(xiàn)的可能性之和自然等于n,這就是的一個眾所周知的性質(zhì):我們所考慮的嚴格抽樣,既然與成比例,若n固定的話,顯然有:(7.8)(7.9)1、包含概率不放回不等概率抽樣中,總體中每個單元被包27對于,我們有(7.11)2、Horvitz—Thompson(霍維茨—湯普森)估計量(7.12)H—T估計量與H—H估計量是及其相似的。因為,它們在形式上似乎完全一樣,但是H—H估計量中的可以互相重復,而H—T中的卻是絕對地互不相同。對于不放回不等概率抽樣,關(guān)于總體總和由Horvitz和Thompson提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論