抽樣調(diào)查分層隨機抽樣培訓(xùn)課件_第1頁
抽樣調(diào)查分層隨機抽樣培訓(xùn)課件_第2頁
抽樣調(diào)查分層隨機抽樣培訓(xùn)課件_第3頁
抽樣調(diào)查分層隨機抽樣培訓(xùn)課件_第4頁
抽樣調(diào)查分層隨機抽樣培訓(xùn)課件_第5頁
已閱讀5頁,還剩96頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、3.1 引 言一、定義(dngy)先將總體 N 個單元劃分(hu fn)成 L 個互不重復(fù)的子總體,每個子總體稱為層,它們(t men)的大小分別為 然后,在每個層中獨立地進行抽樣,稱為分層抽樣.第一頁,共一百零一頁。二、作用(zuyng)分層抽樣在實際工作中應(yīng)用(yngyng)的非常廣泛,主要是因為它具有其它抽樣方法所沒有的特點:1.分層抽樣的抽樣效率較高,也就是說,分層抽樣的估計精度較高。2.分層抽樣不僅能對總體指標(biāo)進行推算,而且能對各層指標(biāo)進行推算。3.層內(nèi)抽樣方法可以不同,而且便于抽樣工作的組織。第二頁,共一百零一頁。三、使用場合在對分層進行具體劃分時,通常考慮如下原則:1.層內(nèi)單元具

2、有相同性質(zhì),通常按調(diào)查對象的不同類型進行劃分。2.盡可能使層內(nèi)單元的標(biāo)志值相近,層間單元的差異盡可能大。3.既按類型又按層內(nèi)單元標(biāo)志值相近的原則進行多重分層,同時達(dá)到實現(xiàn)估計類值以及提高估計精度的目的。4.抽樣組織實施的方便,通常按行政管理機構(gòu)設(shè)置進行分層。第三頁,共一百零一頁。四、符號(fho)說明我們用下標(biāo)(xi bio)h表示層號(h=1,2,,L)。關(guān)于第h層的記號如下:單元總數(shù):樣本單元數(shù):第 i個單元標(biāo)志值(觀察值):第四頁,共一百零一頁。單元權(quán)數(shù):總體均值:第L層總體方差:第五頁,共一百零一頁。抽樣比:樣本均值:第L層樣本方差:第六頁,共一百零一頁。3.2 簡單(jindn)估計

3、量及其性質(zhì)一、總體均值(jn zh)的估計1.估計量的定義總體均值的估計:=如果得到的是分層隨機樣本,則總體均值的簡單估計為:第七頁,共一百零一頁。2.估計量的性質(zhì)(xngzh)性質(zhì)一 對于一般的分層抽樣,如果是的無偏估計( h=1,2, ,L),則是的無偏估計。的方差為:V()=值得注意的是:只要對各層估計(gj)是無偏的,則對總體(zngt)的估計也是無偏的。 因此,各層可以采用不同的抽樣方法,只要相應(yīng)的估計量是無偏的,則對整體的推算也是無偏的。第八頁,共一百零一頁。性質(zhì)一的證明(zhngmng):由于對每一層有因此(ync)第九頁,共一百零一頁。性質(zhì)二 對于分層簡單隨機抽樣,是的無偏估計

4、,的方差為:第十頁,共一百零一頁。9、 人的價值,在招收誘惑的一瞬間被決定。2022/9/12022/9/1Thursday, September 1, 202210、低頭要有勇氣,抬頭要有低氣。2022/9/12022/9/12022/9/19/1/2022 10:07:52 PM11、人總是珍惜為得到。2022/9/12022/9/12022/9/1Sep-2201-Sep-2212、人亂于心,不寬余請。2022/9/12022/9/12022/9/1Thursday, September 1, 202213、生氣是拿別人做錯的事來懲罰自己。2022/9/12022/9/12022/9/1

5、2022/9/19/1/202214、抱最大的希望,作最大的努力(n l)。01 九月 20222022/9/12022/9/12022/9/115、一個人炫耀什么,說明他內(nèi)心缺少什么。九月 222022/9/12022/9/12022/9/19/1/202216、業(yè)余生活要有意義,不要越軌。2022/9/12022/9/101 September 202217、一個人即使已登上頂峰,也仍要自強不息。2022/9/12022/9/12022/9/12022/9/1第十一頁,共一百零一頁。9、 人的價值,在招收誘惑的一瞬間被決定。2022/9/12022/9/1Thursday, Septemb

6、er 1, 202210、低頭要有勇氣,抬頭要有低氣。2022/9/12022/9/12022/9/19/1/2022 10:07:52 PM11、人總是珍惜為得到。2022/9/12022/9/12022/9/1Sep-2201-Sep-2212、人亂于心,不寬余請。2022/9/12022/9/12022/9/1Thursday, September 1, 202213、生氣是拿別人做錯的事來懲罰自己。2022/9/12022/9/12022/9/12022/9/19/1/202214、抱最大的希望,作最大的努力。01 九月 20222022/9/12022/9/12022/9/115、一

7、個人炫耀什么,說明他內(nèi)心缺少什么。九月 222022/9/12022/9/12022/9/19/1/202216、業(yè)余生活要有意義(yy),不要越軌。2022/9/12022/9/101 September 202217、一個人即使已登上頂峰,也仍要自強不息。2022/9/12022/9/12022/9/12022/9/1第十二頁,共一百零一頁。性質(zhì)二的證明:若各層獨立進行(jnxng)簡單隨機抽樣,對每一層有由第二章性質(zhì)(xngzh)二得因此(ync)第十三頁,共一百零一頁。性質(zhì)(xngzh)三 對于分層隨機抽樣,的無偏估計為:第十四頁,共一百零一頁。性質(zhì)三的證明(zhngmng):對于分層

8、隨機抽樣,各層獨立進行簡單隨機抽樣,由第二章性質(zhì)三,得因此(ync),的一個(y )無偏估計為:第十五頁,共一百零一頁。二、總體(zngt)總量的估計1.估計量的定義(dngy) 總體總量 Y 的估計為:如果得到(d do)的是分層隨機樣本,則總體總量 Y 的簡單估計為:2.估計量的性質(zhì)由于與只差一個常數(shù),因此,與具有相同的性質(zhì)。第十六頁,共一百零一頁。性質(zhì)一 對于一般的分層隨機抽樣,如果是的無偏估計,則是的無偏估計,的方差為:性質(zhì)二 對于分層隨機抽樣,的方差為:=第十七頁,共一百零一頁。=性質(zhì)三 對于分層隨機抽樣,的無偏估計為:【例3.1】 調(diào)查某地區(qū)的居民奶制品年消費支出,以居民戶為調(diào)查單

9、元,根據(jù)經(jīng)濟及收入水平將居民戶劃分為4層,每層按簡單隨機抽樣抽出10戶,調(diào)查獲得如下數(shù)據(jù)(單位:元)估計該地區(qū)居民奶制品年消費總支出及估計的標(biāo)準(zhǔn)差。(數(shù)據(jù)(shj)見下表)第十八頁,共一百零一頁。 樣本戶奶制品年消費(xiofi)支出層居民戶總數(shù)樣本戶奶制品年消費支出(元)1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025第十九頁,共一百零一頁。由上表,N=2850,各層的層權(quán)及抽樣比為:),4,3,2,1(,

10、10=hnh第二十頁,共一百零一頁。各層樣本(yngbn)均值及樣本(yngbn)方差為:同理有第二十一頁,共一百零一頁。因此,估計(gj)奶制品年消費總支出為:估計量方差(fn ch)及標(biāo)準(zhǔn)差的樣本估計第二十二頁,共一百零一頁。三、總體(zngt)比例的估計1.估計量的定義(dngy)總體(zngt)比例 P 的估計為:2.估計量的性質(zhì) 如果定義第 i個單元具有所考慮的特征;其他。(i=1,2, ,N)則對總體比例的估計類似對總體均值的估計,這時,與具有同樣的性質(zhì)。第二十三頁,共一百零一頁。的無偏(w pin)估計(h=1,2, ,L),則性質(zhì)一 對于一般的分層隨機抽樣,如果是 P 的無偏估

11、計。的方差(fn ch)為:性質(zhì)二 對于分層隨機抽樣,是 P 的無偏估計。證明:注意到及因而的方差為:第二十四頁,共一百零一頁。性質(zhì)三 對于分層隨機抽樣,的無偏估計為V()第二十五頁,共一百零一頁?!纠?.2】 在例3.1的調(diào)查中,同時調(diào)查了居民擁有家庭電腦的情況(qngkung),獲得如下數(shù)據(jù)(單位:臺),如表3.2。估計該地區(qū)居民擁有家庭電腦的比例及估計的標(biāo)準(zhǔn)差。(數(shù)據(jù)(shj)見下表)第二十六頁,共一百零一頁。 樣本戶擁有家庭電腦(dinno)情況層居民戶總數(shù)樣本戶擁有家庭電腦情況123456789101200000100010024000100000010375011000010104

12、15001000000000表3.2第二十七頁,共一百零一頁。解:由上表(shn bio)可得該地區(qū)居民擁有家庭電腦比例(bl)的估計為:估計量的方差(fn ch)為:第二十八頁,共一百零一頁。3.3 比率(bl)估計量及其性質(zhì) 將比率估計的思想和技術(shù)用于分層隨機樣本時,對總體參數(shù)的估計有兩種途徑: 一種是對每層樣本分別(fnbi)考慮比估計量,然后對各層的比估計量進行加權(quán)平均,此時所得的估計量稱為分別估計(separate ratio estimator); 另一種是對比率的分子、分母分別加權(quán)計算出分層估計量,然后用對應(yīng)的估計量來構(gòu)造比估計,這樣所得的估計量稱為聯(lián)合比估計(combined

13、ratioestimator).第二十九頁,共一百零一頁。1.分別(fnbi)比率估計總體均值總體總量的分層比率估計為:總體均值:總體總量:層權(quán)L: 層數(shù)為的比率估計,為比率估計第三十頁,共一百零一頁。比率(bl)估計量的方差:式中,分別為第 i層指標(biāo)Y,X的方差及相關(guān)系數(shù). 分別比率估計量要求每一層的樣本量都比較大,否則,偏倚(pin y)可能比較大.第三十一頁,共一百零一頁。2.聯(lián)合比率(bl)估計(combined ratio estimator)總體(zngt)均值:總體(zngt)總量:式中:表示的無偏估計;表示的無偏估計.均方誤差為:第三十二頁,共一百零一頁。3.分別比率估計量與聯(lián)

14、合(linh)比率估計量的比較一般而言,分別比率估計量的方差小于聯(lián)合比率估計量的方差。但當(dāng)每層的樣本量不太大時,還是采用聯(lián)合比率估計量更可靠些,因為這時分別比率估計量的偏倚很大,從而使總的均方誤差增大。實際使用時,如果(rgu)各層的樣本量都較大,且有理由認(rèn)為各層的比率Rh差異較大,則分別比率估計優(yōu)于聯(lián)合比率估計。當(dāng)各層的樣本量不大,或各層比率Rh差異很小,則聯(lián)合比率估計更好些。第三十三頁,共一百零一頁?!纠?.4】 某市1996年對950家港口生產(chǎn)單位完成的吞吐量進行了調(diào)查(dio ch),1997年欲對全市港口生產(chǎn)單位完成的吞吐量進行調(diào)查。對港口生產(chǎn)單位按非國有(h=1)和國有(h=2)分

15、為兩層,單位數(shù)分別為800家和150家,分別在兩層中調(diào)查了10家和15家港口生產(chǎn)單位,調(diào)查數(shù)據(jù)如下表,試計算1997年全市港口生產(chǎn)單位完成的吞吐量。1997年國有和非國有企業(yè)調(diào)查數(shù)據(jù)(shj)如下頁第三十四頁,共一百零一頁。ixiyiixiyi1958014955302220210221032033593843360496412011742304005177180560065162532586100088073023497700560833228681100123092722159720823101379710310390114784651281765013919116014116010701

16、5735698第三十五頁,共一百零一頁。(將上述數(shù)據(jù)計算(j sun)的中間結(jié)果列于P77的表中)1.按分別(fnbi)比率估計量估計第三十六頁,共一百零一頁。2.按聯(lián)合比率(bl)估計量估計 按聯(lián)合比率估計量估計(gj)比按分別比率估計(gj)量估計要好一些!第三十七頁,共一百零一頁。三、分別比率估計與聯(lián)合(linh)比率估計的比較具體情況分析參看(cnkn)教材P87第三十八頁,共一百零一頁。3.4 回歸估計量及其性質(zhì)(xngzh) 與比估計相似,將回歸估計的思想和技術(shù)用于分層隨機抽樣時,同樣有兩種方法: 一種是對每層樣本分別求取回歸估計量,然后(rnhu)對各層的回歸估計量進行加權(quán)平均,

17、此時所得的估計量稱為分別回歸估計(separate regression estimator); 另一種是對兩個變量先分別計算出分層簡單估計量然后再對它們的分層簡單估計量來構(gòu)造回歸估計,這時所得的估計量稱為聯(lián)合回歸估計 (combined regression estimator).第三十九頁,共一百零一頁。1.分別(fnbi)回歸估計(separate regression estimator)總體均值的估計:總體總量的估計:第四十頁,共一百零一頁。 當(dāng)各層的回歸系數(shù)為事先給定的常數(shù)時,分別(fnbi)回歸估計量是無偏的。其方差為:其中 是第h層的回歸系數(shù)第四十一頁,共一百零一頁。并且當(dāng)時,

18、達(dá)到最小,即通常未知,可用回歸系數(shù)作為的估計:第四十二頁,共一百零一頁。注 意 (1)分別回歸估計量是有偏的,但當(dāng)每一層的樣本量 都很大時,估計的偏倚可以忽略,其方差近似為:(2)這里 是子總體的回歸系數(shù), 是子總體樣本的回歸系數(shù),前者是未知的,后者是可知的。第四十三頁,共一百零一頁。方差的樣本估計值為:式中, 分別回歸估計量要求每一層的樣本量都較大,如果這個條件得不到滿足,則分別回歸估計量的偏倚(pin y)可能很大,這時,采用聯(lián)合回歸估計量更好些。第四十四頁,共一百零一頁。2.聯(lián)合(linh)回歸估計(combined regression estimator)總體均值的估計:總體總量的估

19、計:式中,分別為的分層估計。是無偏的,其方差為:第四十五頁,共一百零一頁。并且(bngqi),只要取時,達(dá)到最小。當(dāng)回歸系數(shù)未知時,取為的樣本估計:這時,聯(lián)合回歸估計量是有偏的,但當(dāng)樣本量n較大時,估計的偏倚可以忽略,其方差近似為:第四十六頁,共一百零一頁。方差的樣本估計為:第四十七頁,共一百零一頁。 分別回歸估計與聯(lián)合(linh)回歸估計的比較 當(dāng)回歸系數(shù)設(shè)定時,分別回歸估計優(yōu)于聯(lián)合回歸估計; 當(dāng)回歸系數(shù)由樣本(yngbn)估計時,如果各層的樣本量不太小,采用分別回歸估計為宜. 否則,采用聯(lián)合回歸估計為好! 第四十八頁,共一百零一頁?!纠?.6】(續(xù)例4.4)利用回歸估計量估計該市港口生產(chǎn)單

20、位1997年完成的吞吐量。解:樣本(yngbn)回歸系數(shù):h=1,非國有h=2,國有1.070170.856402則按分別(fnbi)回歸估計量估計:(見P85)第四十九頁,共一百零一頁。按聯(lián)合(linh)回歸估計量估計:(見教材P86) 從本題看,聯(lián)合回歸估計量比分別(fnbi)回歸估計量要優(yōu)一些!第五十頁,共一百零一頁。 分別比率估計、聯(lián)合(linh)比率估計、分別回歸估計和聯(lián)合回歸估計的比較 (參看教材P96. 【例3.3】)第五十一頁,共一百零一頁。比率估計與回歸估計總結(jié): 在分層隨機抽樣中,當(dāng)有輔助變量信息可以利用時,我們可以采用(ciyng)分別比率估計、聯(lián)合比率估計、分別回歸估計

21、以及聯(lián)合回歸估計方法。在選用這些估計量時,要注意以下幾個問題: 1、比估計是有偏估計量,當(dāng)各層樣本量都較大時兩種比估計都近似(jn s)無偏;當(dāng)某些層的樣本量不夠大,而總樣本量較大時,聯(lián)合比率估計近似無偏。第五十二頁,共一百零一頁。 2、在回歸估計中,若事先設(shè)定回歸系數(shù),其估計量無偏;若用樣本(yngbn)回歸系數(shù)作為回歸估計系數(shù),其估計量有偏,但在大樣本情況下近似無偏。 3、當(dāng)主要變量Y和輔助變量X高度相關(guān)時,比率(bl)估計和回歸估計都是有效的,且能大幅度地提高估計精度。第五十三頁,共一百零一頁。3.3 樣本量在各層的分配(fnpi)對于分層抽樣,當(dāng)總的樣本量一定時,還需研究各層應(yīng)該分配多

22、少(dusho)樣本量的問題,因為對總體推算時,估計量的方差與各層的方差有關(guān),還與各層所分配的樣本量有關(guān)。一、比例(bl)分配這里的比例分配指的是按各層單元數(shù)占總體單元數(shù)的比例,也就是按各層的層權(quán)進行分配,這時對于分層抽樣,這時總體均值的估計是:第五十四頁,共一百零一頁??傮w(zngt)比例 P 的估計是: 這是因為總體中的人一單元,不管它在哪一層,以同樣的概率(gil)入樣,因此按比例分配的分層隨機樣本,估計量的形式特別簡單。這種樣本也稱為自加權(quán)的樣本。第五十五頁,共一百零一頁。第五十六頁,共一百零一頁。二、最優(yōu)分配(fnpi)1.最優(yōu)分配(fnpi)如果(rgu)我們考慮簡單線性費用函數(shù),

23、總費用則最優(yōu)分配是:第五十七頁,共一百零一頁。證明(zhngmng):作拉格朗日函數(shù),求條件極值:第五十八頁,共一百零一頁。解得:由此得出下面(xi mian)的準(zhǔn)則: 如果某一層單元數(shù)較多,內(nèi)部差異較大(jio d),費用比較省,則對這一層的樣本量要多分配些,第五十九頁,共一百零一頁。2. Neyman(內(nèi)曼)分配(fnpi)對于分層隨機樣本,作為特例(tl),如果每一層的費用相同,即時,最優(yōu)分配可簡化為:這種分配稱為Neyman分配.這時,達(dá)到最小。第六十頁,共一百零一頁?!纠?.3】續(xù)例3.1如果樣本量仍為 n=40 ,則按比例分配和Neyman分配時,各層的樣本量應(yīng)為多少?(見17)解

24、:按比例(bl)分配時,各層的樣本量為:即各層的樣本量分別(fnbi)為 3,6,11,20.第六十一頁,共一百零一頁。對于(duy)Neyman分配,根據(jù)前面計算所得的各層權(quán)數(shù)和方差,得到:第六十二頁,共一百零一頁。因此(ync),按Neyman分配時,各層應(yīng)分配的樣本量為:即各層的樣本量分別(fnbi)為 3,,.第六十三頁,共一百零一頁?!纠?.5】某市有甲、乙兩個地區(qū),現(xiàn)進行家庭收入的調(diào)查。令n=500,已知甲地區(qū)共有20000戶居民,乙地區(qū)共有50000戶居民;甲地區(qū)居民和乙地區(qū)居民年收入標(biāo)準(zhǔn)差估計分別為 ;同時對甲地和乙地每戶的平均抽樣費用之比為2:3,請分別計算出甲地和乙地進行比

25、例分配、一般最優(yōu)分配(考慮費用因素)以及內(nèi)曼分配(不考慮費用因素)的樣本量?!窘狻扛鶕?jù)(gnj)已知的數(shù)據(jù),通過計算整理可得下表:第六十四頁,共一百零一頁。h1200000.285725002713.2857505.07632500000.7143200031428.5714823.7861總計700001.0000-2141.85711328.8624關(guān)于樣本量分配(fnpi)的計算(1) 比例分配。第六十五頁,共一百零一頁。(2)一般(ybn)最優(yōu)分配第六十六頁,共一百零一頁。(3)內(nèi)曼分配(fnpi)第六十七頁,共一百零一頁。結(jié)果比較 , 對比上面三組結(jié)果可以發(fā)現(xiàn): 一般最優(yōu)分配在乙地所

26、抽取的樣本量是最小的。這是因為一般最優(yōu)分配考慮了費用問題,在乙地抽樣的單位平均費用較高,所以最優(yōu)的原則應(yīng)是適當(dāng)增加甲地的樣本量,減少乙地的樣本量。 一般最優(yōu)分配和內(nèi)曼分配在甲地的樣本量都比比例分配大,這是因為甲地總體的方差(fn ch)較大。為了保證估計量方差(fn ch)小,子總體方差(fn ch)大的就要多抽些樣本,否則就要少抽樣本。第六十八頁,共一百零一頁。3.某些(mu xi)層要求大于100%抽樣時的修正又比較大,則可能按最優(yōu)分配計算的這個層的樣按最優(yōu)分配時,可能抽樣比較大,某個層的本量超過的情況.若出現(xiàn)這種情況(qngkung),則對該層進行不100%的抽樣,即第六十九頁,共一百零

27、一頁。3.4 樣本量的確定(qudng)(1)一般(ybn)公式令其中已經(jīng)選定,于是當(dāng)方差 V給定時(dn sh),有第七十頁,共一百零一頁。得到確定樣本量的一般公式為:令則第七十一頁,共一百零一頁。(2)若按比例分配:將 代入上式可得第七十二頁,共一百零一頁。()內(nèi)曼分配(fnpi):將代入上面兩式可得:第七十三頁,共一百零一頁。()最優(yōu)分配:將代入上式可得:第七十四頁,共一百零一頁。即d: 絕對誤差(ju du w ch); r:相對誤差;t: 標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)分位數(shù);這時,樣本量的一般形式可以表示為:如果(rgu)估計精度是以誤差限的形式給出第七十五頁,共一百零一頁。 下面(xi mi

28、an)將分別給出比例分配、內(nèi)曼分配和最優(yōu)分配時的樣本量分配形式:第七十六頁,共一百零一頁。(1)若按比例分配:將 代入上式可得第七十七頁,共一百零一頁。(2)當(dāng)按Neyman分配(fnpi)時,第七十八頁,共一百零一頁。(3)最優(yōu)分配時:將代入上式可得:第七十九頁,共一百零一頁。例3.4(續(xù)例3.1)如果要求(yoqi)在95%置信度下,相對誤差不超過10%,則按比例分配和Neyman分配時,總樣本量分別為多少?解:當(dāng)按比例(bl)分配時:由前面的計算結(jié)果,可以得到各層的Whs2h。第八十頁,共一百零一頁。在95%置信度時,對應(yīng)(duyng)的 t =1.96,又因此(ync)得到由此可以得到

29、對進行修正,得到修正后的 n 第八十一頁,共一百零一頁。2.最優(yōu)分配需要考慮費用(fi yong)時的情形在最優(yōu)分配(fnpi)時,如果考慮費用為簡單線性函數(shù)則由式(3.21)有:當(dāng)方差 V 給定時(dn sh),代入式(3.24)得到樣本量為:第八十二頁,共一百零一頁。3.5 分層時的若干(rugn)問題1.抽樣(chu yn)效果分析對于固定樣本量的情況,如果相對于1可以(ky)忽略,則式中,分別為分層隨機抽樣最優(yōu)分配、分層隨機抽樣按比例分配以及簡單隨機抽樣簡單估計的方差。第八十三頁,共一百零一頁。二、層的劃分(hu fn) 既然(jrn)分層抽樣比簡單隨機抽樣效率高,那么如何構(gòu)造層,構(gòu)造

30、多少層,才能使分層抽樣發(fā)揮其效率高的特點呢? 這就涉及最優(yōu)分層和確定層數(shù)的問題。第八十四頁,共一百零一頁。(一)最優(yōu)分層為了提高抽樣效率,按調(diào)查目標(biāo)量進行分層當(dāng)然是最好的,但我們在調(diào)查前并不知道 的值,因此分層只能通過與高度相關(guān)的輔助指標(biāo) 來進行.(見P56)第八十五頁,共一百零一頁。(二) 層的確定(qudng) 當(dāng)分層是按自然(zrn)層或單元類型劃分時,層數(shù)是自然的,但當(dāng)遇到上述運用累積平方根法進行分層時,就存在層數(shù)問題。 在實際工作中,層數(shù)一般不超過六層。雖然增加層數(shù)可以提高估計精度,但在總費用一定的條件下增加層數(shù)必然(brn)導(dǎo)致降低樣本量,這時就要考慮增加層數(shù)而降低樣本量在精度上是

31、否合算。第八十六頁,共一百零一頁。三、事后(shhu)分層 我們一般在抽樣之前將總體中的所有單元分好層,但在實際工作中,有時(yush)沒有層的抽樣框,或總體特別大來不及事先分層等原因.這時我們又想采用分層抽樣,就可以采用事后分層.第八十七頁,共一百零一頁。 事后分層要注意的問題(1)要求我們(w men)可以通過某種途徑知道各層的層大小或?qū)訖?quán);(2)層權(quán)與實際情況不能相差太大,否則不可能提高精度;(3)事后分層的層數(shù)不宜太多.第八十八頁,共一百零一頁。 事后分層的具體實施辦法 先采用簡單隨機抽樣的方法從總體中抽取一個樣本量為n的樣本,然后對樣本中的單元按某種特征進行分層。 假設(shè)在容量為n的樣

32、本中,落入第h層的樣本單元數(shù)為 ,有 , 則此時對總體均值的事后分層估計為:第八十九頁,共一百零一頁。這里, 下標(biāo)“pst”表示事后分層; 代表落入第h層的第i個 樣本單元的指標(biāo)值。第九十頁,共一百零一頁。 理論上,只要n充分大,事后分層估計量是無偏的。且它的方差有如下(rxi)性質(zhì):第九十一頁,共一百零一頁。 由上式可以看出,第一項就是按比例分配(fnpi)分層抽樣估計量的方差,第二項表示因事后分層而非事先按比例分配(fnpi)分層引起的方差增加量。由此看出,只要樣本量足夠大,事后分層的精度與比例分配(fnpi)事先分層的精度相當(dāng)。第九十二頁,共一百零一頁。 事后分層均值估計量 的方差 ,可以用下面的式子來估計:其中第九十三頁,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論