抽樣調查課件講稿4_第1頁
抽樣調查課件講稿4_第2頁
抽樣調查課件講稿4_第3頁
抽樣調查課件講稿4_第4頁
抽樣調查課件講稿4_第5頁
已閱讀5頁,還剩37頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 Chapter 4 Ratio and Regression Estimator 1802年,拉普拉斯想要估計法國的人口數(shù)目。他獲得了一個遍布全國范圍的30commune的樣本,截至1802年9月23日總共有2,037615居民。在包括1802年9月23日以前的三年中,215599個新生兒在30個commune。 拉普拉斯認為30個commune的每年注冊的新生兒數(shù)為215599/3=71866.33.把2037615按照71866.33來分,拉普拉斯估計每年每28.35人里有一個注冊新生兒。 具有眾多人口的鄉(xiāng)鎮(zhèn)也就可能有同樣眾多的注冊新生兒,通過用28.35乘以全法國年度新生兒總數(shù)來估計得

2、出法國人口總數(shù)。 調查中都有輔助信息,抽樣框也通常有每個單元額外的信息,這些信息能被用來提高我們的估計精度。為什么要使用比率估計為什么要使用比率估計/回歸估計回歸估計利用總體的輔助信息提高估計的精度利用總體的輔助信息提高估計的精度。輔助指標的選擇 :輔助指標應該與調查指標有較好較好的正的相關關系的正的相關關系 。 的抽樣分布較 的抽樣分布變動性要小得多。 輔助指標的總體總量或總體均值已知總體均值已知。 比率估計、回歸估計需要有足夠的樣本量足夠的樣本量才能保證估計的有效。有偏估計:當樣本量足夠大時,估計的偏倚趨于0。 yxuyx簡單地想要估計一個比率簡單地想要估計一個比率 :假定總體由面積不同農(nóng)

3、業(yè)用地構成, yi =i地谷物的產(chǎn)量, xi :i地的面積,B=每畝谷物的平均產(chǎn)量 想要估計一個總體總數(shù),但總體大小但總體大小N是未是未知的知的。但是我們知道,于是可以通過來估計N,由此我們可以使用不同于總數(shù)N的方法而是采用輔助變量來進行測量。 要估計漁網(wǎng)中長度長于12cm的魚的總數(shù),抽取一個魚的隨機樣本,估計長度長于12cm的魚所占的比例,用魚的總數(shù)N乘以這個比例即可得到,但如果N未知不能使用。 能稱量漁網(wǎng)中魚的總重量。魚的長度與其重量相關。 yNytxyyrxtt調整來自樣本的估計量以便它們反映人調整來自樣本的估計量以便它們反映人口統(tǒng)計學的總量。口統(tǒng)計學的總量。 在一所具有4000名學生的

4、大學提取一個400個學生的簡單隨機樣本,此樣本可能包含240個女性,160個男性,且其中被抽中的84名女性和40名男性計劃以教學為畢業(yè)后的職業(yè)。 400012412404008440270013001270240160 比率估計量被用來對無回答進行調整對無回答進行調整 設抽取一個行業(yè)的樣本:令yi為i行業(yè)花費在健康保險上的金額,xi為i行業(yè)的雇員數(shù)。假定對總體中的每個行業(yè)xi均已知。我們希望一個行業(yè)花費在健康保險上的金額與雇員數(shù)相關。某些行業(yè)在調查中可能涉及不到。估計保險費用的總花銷時調整無回答的方法之一是用總體數(shù) X 乘以比率 yxyx一一、 Ratio Estimator 在 srs 條件

5、下, 1)(1)(22NRXYXnfRVxyRyNXxyXxyYXxyXxyyiiRRR輔助指標輔助指標x x,其總體均值(總量)已知,其總體均值(總量)已知【例例4.14.1】對以下假設總體(N=6),用簡單隨機抽樣抽取的樣本,比較簡單隨機抽樣比估計及簡單估計的性質。 iYiX123456平均值01358104.51311182946181526CRy樣本樣本簡單估計簡單估計比估計比估計11,221821,361831,49.517.141,51516.87551,623.521.1562,3715.7572,410.515.7582,5161692,624.520103,414.516.3

6、113,52016.36123,628.519.73134,523.516.27144,63219.2155,637.518.75yyxXyxXRii簡單估計是無偏的,而比估計是有偏的。簡單估計量的方差遠遠大于比估計量的方差,比估計的偏差不大,其均方誤差也比簡單估計的小得多。因此對這個總體,比估計比簡單估計的效率高。 18151)(151iiyyE87.97)(151)(1512iiyEyyV686.17151)(151iRiRyyE31356. 0)()(YyEyBRR82. 2)(151)(1512iRRiRyEyyV92. 2)()()(2RRRyByVyMSE二、比率估計的性質二、比率

7、估計的性質偏倚量會小,如果: 樣本量n 很大抽樣比n/N很大 很大 S x很小 相關系數(shù)R接近于1 )(1)(22xyxRSSSXnfRrExuxu比率估計的近似方差比率估計的近似方差)2(1)(22222xxyysRsRsxnfRvniiixRynXnfRv1221)(111)()()()()()(222RVXNYVRVXRXVyVRR當 R0.5 時,比估計比 srs 有更高的精度。分層抽樣下,比估計有兩種方法:1.Separate Ratio estimator,111xyr,222xyr厖.LLLxyr(h=1,2,.L)222)(1)()(XRyEXRRERV V RfnX NY R

8、XfnXSRSRSiiiNyxyx11112221222 2niiixRynXnfRv1221)(111)(三、比率估計的效率三、比率估計的效率 1.與簡單估計的比較簡單估計量無偏,而比率估計量漸近無偏。因此這里只比較當?shù)那樾?。比率估計量?yōu)于簡單估計量的條件是: V yfnSy12V yfnSR SRSRyxyx1222222212yxyxfSR SR S Sn2220 xyxR SR S S122SXSYCCxyxy正高度相關2.比率估計成為最優(yōu)線性無偏估計的條件 (1).與的關系是過原點的直線 (2).對這條直線的方差與成比例。則比率估計是最優(yōu)線性無偏估計(BLUE)。 iyixixiy

9、【例例4.24.2】某縣在對船舶調查月完成的貨運量進行調查時,對運管部門登記的船舶臺帳進行整理后獲得注冊船舶2860艘,載重噸位154626噸,從2860艘船舶中抽取了一個的簡單隨機樣本,調查得到樣本船舶調查月完成的貨運量及其載重噸位如下表(單位:噸),要推算該縣船舶調查月完成的貨運量。 iiYiXiiYiX1780100621701202150050718231503100550814508043761091582056002010137050i 該縣船舶在調查月完成貨運量的比率估計為 用簡單估計對貨運量進行估計 1123.2154626267193765RyYXx Rv Y2222(1)y

10、xNfsR sn1122.10617 10yxRs Rs Y()458930Rv Y2860 1123.23212352YNy 2211(1)3.43303 10yNfv Ysn( )585921v Y s Y()0.6135( )Rv Ydeffv Y實際中對于樣本量較小的情形,使用比率估計量時不能忽視其偏倚。 )()()()()(222RVXNYVRVXRXVyVRR當 R0.5 時,比估計比 srs 有更高的精度。分層抽樣下,比估計有兩種方法:1.Separate Ratio estimator,111xyr,222xyr厖.LLLxyr(h=1,2,.L)四、分層隨機抽樣下的比率估計四

11、、分層隨機抽樣下的比率估計 如果各層的樣本量不小的話,則可以采用各層分別進行比率估計,將各層加權匯總得到總體指標的估計,這種方式稱為分別比率估計量。separate ratio estimator hhhhRhhRSXxyWyWy RhhhhRSRSYXxyyNY 2.Combined Ratio estimator 由hy估計sty,由hx估計stx。 XRXxyyCststRCXRyNXxyYCRCststRC方差的比較如果每一層樣本量都比較大,各層R相差較大,則分別比率估計量的方差小于聯(lián)合比率估計量的方差。但當每層的樣本量不太大時,還是采用聯(lián)合比率估計量更可靠些,因為這時分別比率估計量的

12、偏倚很大,從而使總的均方誤差增大。2222222222()(2)()(2)hRsyhhxhhyxhhhRcyhcxhcyxhhWV YNSR SR SnWV YNSR SR SnRSYRCY六六、Regression Estimator LrLrLryNYXxyxXyy)()( 若令, 0則)(srsyyLr; 若令,R則RLryxXxyyy)((比估計) ()011uuregyxBBBxxy回歸估計應用的兩種情況: 1. 事先確定 設的確定值為0,0是一常數(shù),則: )(0 xXyyLr (1) )2()2(1)()(111)(0220220yxxyiNiLrSSSnfXXYYNnfyV) 3

13、 ()2(1)(02202yxxyLrsssnfy因為YxXEyEyElr)()()(0而)(0iilrxXyy又可表為的樣本均值后者的總體均值為Y故(2)式成立其樣本估計量:性質: A:Lry是Y的無偏估計 B:)(Lry是)(LryV的無偏估計 C:0的最佳值是 20 xyxSS 總體回歸系數(shù)大樣本條大樣本條件下件下殘差方差Se22()(1)eregnSENnSy3.分層抽樣中的回歸估計 (1)分別回歸估計 )()(hhhhhLrslrshhhhhLrhLnLrsxXyNyNYxXyWyWy 當h可以事先確定時,Lrsy與LrsY都是無偏的,且 )2()1 ()(2222xhhyxhhyh

14、hhhLrsSSSnfWyV 在).2 , 1(2LhSSxhyxhh時達到極小值 )1 ()1 ()(222minhyhhhhLrsSnfWyV 若h不能事先確定, hhnhhinhhihhihxxxxyyb2)()( 當 較大時,適用場合 ?hn2222222222(1)()(1)(1)()()() (2)(1)(1)(1)(2)hhhhLrsyhhhnnhhLrshihhhihhhhhhyhhhhWfV ySnWfyyybxxn nWfnSrn n層內殘差方差Seh2 (2)聯(lián)合回歸估計 )()(,ststLrcLrcststLrchhsthhstXXYyNYxXyyxWxyWy 當事先

15、設定時,)2()1 ()(2222xhyxhyhhhhLrcSSSnfWyV無偏當無法事先設定時,)2()1 ()()() 1()1 ()(222222xhcyxhcyhhhhhhichhihhhhLrcSbSbSnfWxxbyynnfWy漸近無偏其中222(1)()()(1)(1)()(1)hhhhihhihhhcnhhhihhhWfyyxxn nbWfxxn n如果是按比例分配,則可簡化為聯(lián)合最小二乘估計? 【例例】某市對中央直屬單位和市屬單位專業(yè)技術人員總數(shù)進行了分層隨機調查,已有98年各層人員總數(shù),135個中央直屬單位有75650專業(yè)技術人員,1228個市屬單位有315612專業(yè)技術人

16、員。分別在兩層中調查了15、20家單位,調查數(shù)據(jù)如下,試估計99年全市專業(yè)技術人員總數(shù)。(1)按分別比率估計量估計 (2)按聯(lián)合比率估計量估計 RSY210.959859 171400 1.049725 102900 272536.6hhhR XRSv Y222221(1)hhyhhxhhhNfsR sn2hyxhR s9588.48RSv YRCY277310274300271956.1279700ststYXXRCv Y222221(1)hhyhxhhhNfsR sn2yxhRs9289.44RCv Y41552416074154331675(3)按分別回歸估計量估計,用樣本回歸系數(shù)估計b

17、 (2)按聯(lián)合比率估計量估計 lrSY2211()hlrhhhhhhhhN yNyb Xx415331lrSv Y222221(1)12hhhyhhxhhhhNfnsb snn9480.11lrSv Y1604cb 2212221(1)756.57571.0290(1)735.2535hhyxhhhhhxhhhWfsnWfsn1.06lrcYstYcstbXX415386 lrCvY2222 21(1)hhyhc xhhhNfsbsn2c yxhbs9238.96lrCv Y1672七七 其他其他 估估 計計 如果調查時所用的輔助指標為目標量最近的普查結果,或者回歸估計的回歸系數(shù)接近于1,這時可以采用差值估計差值估計 (無偏) 輔助變量X與Y負相關, X和Y都為正值, 使用乘積估計(有偏)xXyyd()XyxXdyXxNYyXxYPP 八、比估計量與回歸估計量的比較: 已知: )2(1)(222yxxyRSSRSRSnfyV )1 (1)(22;yrLSnfyV )()(RLryVyV yxxySSRSRS22222 0)(2xyRSS 0)(2R 回歸估計優(yōu)于簡單估計和比率估計實際中更多使用比估計的原因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論