抽樣技術(shù)(金勇進)PPT.ppt_第1頁
抽樣技術(shù)(金勇進)PPT.ppt_第2頁
抽樣技術(shù)(金勇進)PPT.ppt_第3頁
抽樣技術(shù)(金勇進)PPT.ppt_第4頁
抽樣技術(shù)(金勇進)PPT.ppt_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1802年,拉普拉斯想要估計法國的人口數(shù)目。他獲得了一個遍布全國范圍的30commune的樣本,截至1802年9月23日總共有2,037615居民。在包括1802年9月23日以前的三年中,215599個新生兒在30個commune。 拉普拉斯認為30個commune的每年注冊的新生兒數(shù)為215599/3=71866.33.把2037615按照71866.33來分,拉普拉斯估計每年每28.35人里有一個注冊新生兒。 具有眾多人口的鄉(xiāng)鎮(zhèn)也就可能有同樣眾多的注冊新生兒,通過用28.35乘以全法國年度新生兒總數(shù)來估計得出法國人口總數(shù)。 調(diào)查中都有輔助信息,抽樣框也通常有每個單元額外的信息,這些信息能被

2、用來提高我們的估計精度。,為什么要使用比率估計/回歸估計,利用總體的輔助信息提高估計的精度。 輔助指標的選擇 :輔助指標應該與調(diào)查指標有較好的正的相關(guān)關(guān)系 。 的抽樣分布較 的抽樣分布變動性要小得多。 輔助指標的總體總量或總體均值已知。 比率估計、回歸估計需要有足夠的樣本量才能保證估計的有效。 有偏估計:當樣本量足夠大時,估計的偏倚趨于0。,簡單地想要估計一個比率 :假定總體由面積不同農(nóng)業(yè)用地構(gòu)成, yi =i地谷物的產(chǎn)量, xi :i地的面積,B=每畝谷物的平均產(chǎn)量,想要估計一個總體總數(shù),但總體大小N是未知的。但是我們知道,于是可以通過來估計N,由此我們可以使用不同于總數(shù)N的方法而是采用輔助

3、變量來進行測量。 要估計漁網(wǎng)中長度長于12cm的魚的總數(shù),抽取一個魚的隨機樣本,估計長度長于12cm的魚所占的比例,用魚的總數(shù)N乘以這個比例即可得到,但如果N未知不能使用。 能稱量漁網(wǎng)中魚的總重量。魚的長度與其重量相關(guān)。,調(diào)整來自樣本的估計量以便它們反映人口統(tǒng)計學的總量。 在一所具有4000名學生的大學提取一個400個學生的簡單隨機樣本,此樣本可能包含240個女性,160個男性,且其中被抽中的84名女性和40名男性計劃以教學為畢業(yè)后的職業(yè)。,比率估計量被用來對無回答進行調(diào)整 設抽取一個行業(yè)的樣本:令yi為i行業(yè)花費在健康保險上的金額,xi為i行業(yè)的雇員數(shù)。假定對總體中的每個行業(yè)xi均已知。我們

4、希望一個行業(yè)花費在健康保險上的金額與雇員數(shù)相關(guān)。某些行業(yè)在調(diào)查中可能涉及不到。估計保險費用的總花銷時調(diào)整無回答的方法之一是用總體數(shù) X 乘以比率,輔助指標x,其總體均值(總量)已知,【例4.1】對以下假設總體(N=6),用簡單隨機抽樣抽取的樣本,比較簡單隨機抽樣比估計及簡單估計的性質(zhì)。,簡單估計是無偏的,而比估計是有偏的。 簡單估計量的方差遠遠大于比估計量的方差,比估計的偏差不大,其均方誤差也比簡單估計的小得多。 因此對這個總體,比估計比簡單估計的效率高。,二、比率估計的性質(zhì),偏倚量會小,如果: 樣本量n 很大 抽樣比n/N很大 很大 S x很小 相關(guān)系數(shù)R接近于1,比率估計的近似方差,三、比

5、率估計的效率,1.與簡單估計的比較 簡單估計量無偏,而比率估計量漸近無偏。 因此這里只比較當比較大的情形。 比率估計量優(yōu)于簡單估計量的條件是:,正高度相關(guān),2.比率估計成為最優(yōu)線性無偏估計的條件 (1).與的關(guān)系是過原點的直線 (2).對這條直線的方差與成比例。 則比率估計是最優(yōu)線性無偏估計(BLUE)。,【例4.2】某縣在對船舶調(diào)查月完成的貨運量進行調(diào)查時,對運管部門登記的船舶臺帳進行整理后獲得注冊船舶2860艘,載重噸位154626噸,從2860艘船舶中抽取了一個的簡單隨機樣本,調(diào)查得到樣本船舶調(diào)查月完成的貨運量及其載重噸位如下表(單位:噸),要推算該縣船舶調(diào)查月完成的貨運量。,該縣船舶在

6、調(diào)查月完成貨運量的比率估計為 用簡單估計對貨運量進行估計,實際中對于樣本量較小的情形, 使用比率估計量時不能忽視其偏倚。,四、分層隨機抽樣下的比率估計,如果各層的樣本量不小的話,則可以采用各層分別進行比率估計,將各層加權(quán)匯總得到總體指標的估計,這種方式稱為分別比率估計量。separate ratio estimator,分別比率估計量要求每一層的樣本量都比較大,如果達不到這個要求,則它的偏倚可能比較大,這時使用聯(lián)合比率估計量。 combined ratio estimator,方差的比較,如果每一層樣本量都比較大,各層R相差較大,則分別比率估計量的方差小于聯(lián)合比率估計量的方差。 但當每層的樣本

7、量不太大時,還是采用聯(lián)合比率估計量更可靠些,因為這時分別比率估計量的偏倚很大,從而使總的均方誤差增大。,因為,而,的樣本均值,后者的總體均值為,故(2)式成立,其樣本估計量:,總體回歸系數(shù),大樣本條件下,殘差方差Se2,當 較大時, 適用場合 ?,層內(nèi)殘差方差Seh2,無偏,漸近無偏,其中,如果是按比例分配,則可簡化為聯(lián)合最小二乘估計?,【例】某市對中央直屬單位和市屬單位專業(yè)技術(shù)人員總數(shù)進行了分層隨機調(diào)查,已有98年各層人員總數(shù),135個中央直屬單位有75650專業(yè)技術(shù)人員,1228個市屬單位有315612專業(yè)技術(shù)人員。分別在兩層中調(diào)查了15、20家單位,調(diào)查數(shù)據(jù)如下,試估計99年全市專業(yè)技術(shù)

8、人員總數(shù)。,(1)按分別比率估計量估計 (2)按聯(lián)合比率估計量估計,415524,1607,415433,1675,(3)按分別回歸估計量估計,用樣本回歸系數(shù)估計b (2)按聯(lián)合比率估計量估計,415331,1604,1.06,415386,1672,七 其他 估 計,如果調(diào)查時所用的輔助指標為目標量最近的普查結(jié)果,或者回歸估計的回歸系數(shù)接近于1,這時可以采用差值估計 (無偏) 輔助變量X與Y負相關(guān), X和Y都為正值, 使用乘積估計(有偏),大樣本條件下 回歸估計優(yōu)于簡單估計和比率估計,樣本量小時,回歸估計偏差大于比率估計,三種估計量之間的關(guān)系,對于簡單隨機抽樣,簡單估計、差值估計是無偏的,比率估計、回歸估計是漸近無偏的。 小樣本條件下回歸估計偏差大于比率估計和簡單估計。 比

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論