抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件_第1頁(yè)
抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件_第2頁(yè)
抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件_第3頁(yè)
抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件_第4頁(yè)
抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件_第5頁(yè)
已閱讀5頁(yè),還剩185頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

§2.1定義與符號(hào)

一、定義簡(jiǎn)單隨機(jī)抽樣:從含有N個(gè)單元的總體中隨機(jī)抽取n個(gè)單元組成樣本。1.若抽樣是放回的,則所有可能的樣本有個(gè),每個(gè)樣本被抽中的概率為,這種抽樣方法稱為放回簡(jiǎn)單隨機(jī)抽樣。2.若抽樣是不放回的,則所有可能的樣本有個(gè),每個(gè)樣本被抽中的概率為,這種抽樣方法稱為不放回簡(jiǎn)單隨機(jī)抽樣?!?.1定義與符號(hào)一、定義簡(jiǎn)單隨機(jī)抽樣:從含有N個(gè)單元11.簡(jiǎn)單隨機(jī)抽樣是等概抽樣,即每個(gè)總體單元都有相同的入樣概率;2.隨機(jī)抽取是有嚴(yán)格要求的,不是隨便抽取,必須按照某一隨機(jī)原則進(jìn)行。注意1.簡(jiǎn)單隨機(jī)抽樣是等概抽樣,即每個(gè)總體單元都有相同的入樣概率2【例2.1】設(shè)總體有5個(gè)單元(1,2,3,4,5),按放回簡(jiǎn)單隨機(jī)抽樣的方式抽2個(gè)單元,則所有可能的樣本為個(gè)(考慮樣本單元的順序)1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,5(放回簡(jiǎn)單隨機(jī)抽樣所有可能的樣本)【例2.1】設(shè)總體有5個(gè)單元(1,2,3,4,5),按放回3【例2.2】設(shè)總體有5個(gè)單元(1,2,3,4,5),按不放回簡(jiǎn)單隨機(jī)抽樣的方式抽2個(gè)單元,則所有可1,21,31,41,52,32,42,53,43,54,5(不放回簡(jiǎn)單隨機(jī)抽樣所有可能的樣本)能的樣本為個(gè)。在實(shí)際工作中,更多地采用不放回簡(jiǎn)單隨機(jī)抽樣,所以以下討論的簡(jiǎn)單隨機(jī)抽樣一般都指不放回簡(jiǎn)單隨機(jī)抽樣.【例2.2】設(shè)總體有5個(gè)單元(1,2,3,4,5),按不放4二、符號(hào)大寫字母表示總體單元的標(biāo)志值:如小寫字母表示樣本單元的標(biāo)志值:如調(diào)查的總體目標(biāo)量主要有:總體總量Y;總體均值

;總體某一指標(biāo)的比例P;兩個(gè)總體總量的比率R。對(duì)估計(jì)精度進(jìn)行計(jì)算時(shí),要涉及到總體方差和樣本方差等。下面分別列出:二、符號(hào)大寫字母表示總體單元的標(biāo)志值:如小寫字母表示樣本單元5總體方差樣本方差還有一些其他符號(hào),分別說(shuō)明如下:總體方差樣本方差還有一些其他符號(hào),分別說(shuō)明如下:6總體(),樣本將左邊式子中的大寫字母改為小寫字母??傮w(),樣本將左邊式子中7總體指標(biāo)值上面帶符號(hào)“”的表示由樣本得到的總體指標(biāo)的估計(jì)。如稱為的估計(jì)。估計(jì)量的方差用V表示,如標(biāo)準(zhǔn)差用S表示,如對(duì)的樣本估計(jì)不用而用稱為抽樣比,記為f.總體指標(biāo)值上面帶符號(hào)“”的表示由樣本得到的總體指標(biāo)的估計(jì)。如8§2.2簡(jiǎn)單估計(jì)量及其性質(zhì)

無(wú)論調(diào)查對(duì)象是何種總體參數(shù),其實(shí)所有估計(jì)量通常都是樣本均值的某種線性組合,因此在抽樣中不管討論何種估計(jì)的基本性質(zhì),都只圍繞樣本均值進(jìn)行。而對(duì)樣本均值這個(gè)核心估計(jì)量的研究則分為兩個(gè)方面:一方面是求樣本均值對(duì)所有可能樣本的數(shù)學(xué)期望

(檢驗(yàn)估計(jì)量是否無(wú)偏)。另一方面是求樣本均值對(duì)所有可能樣本的方差

(檢驗(yàn)估計(jì)量誤差的大小)?!?.2簡(jiǎn)單估計(jì)量及其性質(zhì)無(wú)論調(diào)查對(duì)象是何9為了討論簡(jiǎn)單估計(jì)的性質(zhì),首先我們來(lái)看兩個(gè)引理:

引理一

從大小為N的總體中抽取一個(gè)樣本量為n的簡(jiǎn)單隨機(jī)樣本,則總體中每個(gè)特定單元的入樣概率為:兩個(gè)特定單元都入樣的概率為:為了討論簡(jiǎn)單估計(jì)的性質(zhì),首先我們來(lái)看兩個(gè)引理:10引理一的證明:在N個(gè)單元中取n個(gè)單元為樣本,共有個(gè)樣本。在個(gè)樣本中,包含某個(gè)特定單元的樣本數(shù)為:每個(gè)樣本被抽中的概率為:。同時(shí)包含兩個(gè)特定單元的樣本數(shù)為每個(gè)樣本被抽中的概率為:引理一的證明:在N個(gè)單元中取n個(gè)單元為樣本,同時(shí)包含兩個(gè)特定11

引理二

從總體規(guī)模為N的總體中抽取一個(gè)樣本量為n的簡(jiǎn)單隨機(jī)樣本。若對(duì)總體中的每個(gè)單元,引進(jìn)隨機(jī)變量如下:由二項(xiàng)分布可知:引理二從總體規(guī)模為N的總體中抽取12所以,不難推出:所以,不難推出:13簡(jiǎn)單估計(jì)量的性質(zhì)

是性質(zhì)1的無(wú)偏估計(jì),即下面我們用兩種與數(shù)理統(tǒng)計(jì)中不同的方法來(lái)證明這一性質(zhì)。思考:為什么不能用數(shù)理統(tǒng)計(jì)中常用的方法?簡(jiǎn)單估計(jì)量的性質(zhì)是性質(zhì)1的無(wú)偏估計(jì),即下面14有了這些準(zhǔn)備,我們很容易證明根據(jù)前面提到的關(guān)于的定義,有下式有了這些準(zhǔn)備,我們很容易證明根據(jù)前面提到的關(guān)于的定15第二種方法證明

證明:對(duì)于一個(gè)大小為N的總體,樣本量為n的簡(jiǎn)單隨機(jī)樣本有個(gè),因此第二種方法證明證明:對(duì)于一個(gè)大小為N的總體,樣本量為n16抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件17其他幾個(gè)估計(jì)量的無(wú)偏性可容易推出:1、對(duì)于總體總量2、對(duì)于總體比例其他幾個(gè)估計(jì)量的無(wú)偏性可容易推出:1、對(duì)于總體總量2、對(duì)于總18性質(zhì)2對(duì)于簡(jiǎn)單隨機(jī)抽樣,的方差為:式中,n為樣本量;f=為抽樣比;1-f為有限總體校正系數(shù)。V()=(2.5)性質(zhì)2對(duì)于簡(jiǎn)單隨機(jī)抽樣,的方差為:式中,n為樣本量;f=為抽19證明方法一證明方法一20即即21

證明方法二:由定義而

證明方法二:由定義而22因此有因此有23

即即24性質(zhì)3V()的無(wú)偏估計(jì)為:式中,為樣本方差。證明:將改寫成:性質(zhì)3V()的無(wú)偏估計(jì)為:式中,為樣本方差。證明:將25由前面性質(zhì)1證明用過(guò)的對(duì)稱論證法有:由性質(zhì)2有:由前面性質(zhì)1證明用過(guò)的對(duì)稱論證法有:由性質(zhì)2有:26抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件27下面我們從關(guān)系式可以推出其他幾個(gè)估計(jì)量的方差下面我們從關(guān)系式可以推出其他幾個(gè)估計(jì)量的方差28

總體總量的估計(jì)量方差是總體均值方差的直接推導(dǎo),下面我們來(lái)推導(dǎo)總體比例估計(jì)量的方差。總體總量的估計(jì)量方差是總體均值方差的直接29

設(shè)N個(gè)樣本單元中有N1個(gè)具有某一特性,即有N1個(gè)單元取值為1,有N-N1個(gè)單元取值為0.設(shè)N個(gè)樣本單元中有N1個(gè)具有某一特性,即有30同理對(duì)樣本方差有因此同理對(duì)樣本方差有因此31同樣下面我們從關(guān)系式可以推出同樣下面我們從關(guān)系式可以推出32估計(jì)量的方差是衡量估計(jì)量精度的度量。從式可以看出,影響估計(jì)量方差的因素有:①樣本量n;③總體未入樣比率1-f

②總體方差分析見(jiàn)教材P38,39估計(jì)量的方差是衡量估計(jì)量精度的度量。從式①樣本量n;33

N通常很大,當(dāng)f<0.05時(shí),可將1-f近似取為1,這時(shí)影響估計(jì)量方差的主要因素是樣本量n和總體方差。的大小是我們無(wú)法改變的,因此,要提高估計(jì)量的精度就只有加大樣本量。注意N通常很大,當(dāng)f<0.05時(shí),可將1-f近似取為1,34【例2.3】我們從某個(gè)N=100的總體中抽出一個(gè)大小為n=10的簡(jiǎn)單隨機(jī)樣本,要估計(jì)總體平均水平并給出置信度95%的置信區(qū)間。序號(hào)i1234567891045204661508解:依題意,N=100,n=10,f=樣本均值為:【例2.3】我們從某個(gè)N=100的總體中抽出一個(gè)序號(hào)i135樣本方差為:因此,總體平均值的估計(jì)為:的方差為:的方標(biāo)準(zhǔn)差為:s的置信度95%的置信區(qū)間為:即[2.4295,7.5705].樣本方差為:因此,總體平均值的估計(jì)為:的方差為:的方標(biāo)準(zhǔn)差為36,。其方差為:V(

放回簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單估計(jì)量,。其方差為:V(放回簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單估計(jì)量37

注意:不放回時(shí)的方差為放回時(shí)的約1-f倍,而1-f<1,因此不放回抽樣的估計(jì)精度比放回抽樣的估計(jì)精度高。注意:不放回時(shí)的方差為放回時(shí)的約1-f倍,而1-f<1,因38【例2.4】我們從某個(gè)N=100的總體中抽出一個(gè)大小為n=10的簡(jiǎn)單隨機(jī)樣本,要估計(jì)總體總量并給出在置信度95%的條件下,估計(jì)量的相對(duì)誤差。序號(hào)i1234567891045204661508解依題意,N=100,由例2.3可知:,因此,對(duì)總體總量的估計(jì)為:=100×5=500。【例2.4】我們從某個(gè)N=100的總體中抽出一個(gè)大序號(hào)i139對(duì)V()的樣本估計(jì)為:0其標(biāo)準(zhǔn)差為:因此,在置信度95%的條件下(對(duì)應(yīng)的t=1.96),的相對(duì)誤差為:=51.41%對(duì)V()的樣本估計(jì)為:0其標(biāo)準(zhǔn)差為:因此,在置信度95%的條40【例2.5】解:已知n=200,a=130,1-f≈1某超市開張一段時(shí)間之后,為改進(jìn)銷售服務(wù)環(huán)境,欲調(diào)查附近幾個(gè)小區(qū)居民到該超市購(gòu)物的滿意度。該超市與附近幾個(gè)小區(qū)居委會(huì)取得聯(lián)系,在整體中按簡(jiǎn)單隨機(jī)機(jī)樣,抽取了一個(gè)大小為n=200人的樣本。調(diào)查發(fā)現(xiàn)對(duì)該超市購(gòu)物環(huán)境表示滿意或基本滿意的居民有130位,要估計(jì)對(duì)該超市購(gòu)物環(huán)境持肯定態(tài)度居民的比例,并在置信度95%條件下,給出估計(jì)的絕對(duì)誤差和置信區(qū)間。假定這時(shí)的抽樣比可以忽略。【例2.5】解:已知n=200,a=130,1-41在置信度95%的條件下,估計(jì)的絕對(duì)誤差為:的95%置信區(qū)間為:0.65在置信度95%的條件下,估計(jì)的絕對(duì)誤差為:的95%置信區(qū)間為42§2.3比率估計(jì)量及其性質(zhì)

用樣本均值作為總體均值的簡(jiǎn)單估計(jì)量,具有無(wú)偏等很多優(yōu)良性質(zhì),且完全不依賴其它總體信息。但是,若我們有與調(diào)查變量相關(guān)的其它信息(通常稱為輔助變量信息)可以利用,則估計(jì)的精度可以大大提高。這就是我們下面要講的比率估計(jì)和回歸估計(jì)。一、估計(jì)的概念§2.3比率估計(jì)量及其性質(zhì)用樣本均值作為43設(shè)主要變量為:Y輔助變量為:X兩變量的比率為:總體均值的比估計(jì):其中設(shè)主要變量為:Y總體均值的比估計(jì):其中44二、比率估計(jì)的特點(diǎn)及注意事項(xiàng)1、使用比估計(jì)首先要知道輔助變量的總體均值(或總體總量),調(diào)查時(shí),既要觀測(cè)主要變量的值還要觀測(cè)輔助變量的值;2、輔助變量必須與主要變量高度相關(guān)且整體上應(yīng)相當(dāng)穩(wěn)定;3、比估計(jì)雖然不是無(wú)偏的,但其精度要高于簡(jiǎn)單估計(jì)量很多。下面我們看一個(gè)簡(jiǎn)單估計(jì)與比估計(jì)對(duì)比的例題二、比率估計(jì)的特點(diǎn)及注意事項(xiàng)1、使用比估計(jì)首先要知道輔助變量45【例】對(duì)以下假設(shè)的總體(N=6),用簡(jiǎn)單隨機(jī)抽樣抽取n=2的樣本,比較簡(jiǎn)單隨機(jī)抽樣比率估計(jì)及簡(jiǎn)單估計(jì)的性質(zhì)。i123456均值XiYi011331151882910464.518解:對(duì)這個(gè)總體,我們列出所有可能的個(gè)樣本,以比較簡(jiǎn)單估計(jì)與比率估計(jì)的性質(zhì)?!纠繉?duì)以下假設(shè)的總體(N=6),用簡(jiǎn)單隨機(jī)抽樣抽取n=246i樣本簡(jiǎn)單估計(jì)()比率估計(jì)()1234567891011121314151,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.5181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.75i樣本簡(jiǎn)單估計(jì)()比率估計(jì)(47由此,可以算出:由此,可以算出:48總結(jié)1、從計(jì)算表格中可以看出,均值的比估計(jì)很穩(wěn)定,而均值的簡(jiǎn)單估計(jì)則波動(dòng)劇烈。2、雖然比率估計(jì)是有偏估計(jì),但偏倚不大,而估計(jì)量方差要比簡(jiǎn)單估計(jì)的方差小得多。3、比估計(jì)是一種很好的估計(jì)量,是提高估計(jì)精度的最有效的途徑。4、思考:比估計(jì)為什么能大幅度地提高估計(jì)精度?總結(jié)49對(duì)于簡(jiǎn)單隨機(jī)抽樣,n較大時(shí),比率估計(jì)具有以下性質(zhì):對(duì)于簡(jiǎn)單隨機(jī)抽樣,n較大時(shí),比率估計(jì)具有以下性質(zhì):50關(guān)于比率估計(jì)我們要說(shuō)明(或證明)以下幾個(gè)問(wèn)題:1、均值的比率估計(jì)不是無(wú)偏的;2、偏倚是怎么產(chǎn)生的;3、均值比率估計(jì)的均方誤差;4、均方誤差的估計(jì)。關(guān)于比率估計(jì)我們要說(shuō)明51第一個(gè)問(wèn)題可從上面的例題給予說(shuō)明:第二個(gè)問(wèn)題我們可以從下面的表達(dá)式說(shuō)明:這里是常量,是隨機(jī)變量。估計(jì)量不是隨機(jī)變量的線性函數(shù)。因此,估計(jì)量的偏倚是由R的有偏性造成的.第一個(gè)問(wèn)題可從上面的例題給予說(shuō)明:第二個(gè)問(wèn)題我們可以從下面的52第三個(gè)問(wèn)題,我們來(lái)證明R估計(jì)的偏倚第三個(gè)問(wèn)題,我們來(lái)證明R估計(jì)的偏倚53因此因而偏倚主要來(lái)自于等式右邊的第二項(xiàng),由因此因而偏倚主要來(lái)自于等式右邊的第二項(xiàng),由54因此,偏倚的主要項(xiàng)為:同樣我們可以推出:因此,偏倚的主要項(xiàng)為:同樣我們可以推出:55抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件56對(duì)上述方差分別給出樣本估計(jì)式如下:對(duì)上述方差分別給出樣本估計(jì)式如下:57【例2.2】某縣在對(duì)船舶調(diào)查月完成的貨運(yùn)量進(jìn)行調(diào)查時(shí),對(duì)運(yùn)管部門登記的船舶臺(tái)帳進(jìn)行整理后獲得注冊(cè)船舶2860艘,載重噸位154626噸。從2860艘船舶中抽取一個(gè)n=10的簡(jiǎn)單隨機(jī)樣本,調(diào)查得到樣本船舶調(diào)查月完成的貨運(yùn)量及其載重噸位如表(單位:噸),要推算該縣船舶調(diào)查月完成的貨運(yùn)量?!纠?.2】某縣在對(duì)船舶調(diào)查月完成的貨運(yùn)量進(jìn)行調(diào)查時(shí),對(duì)運(yùn)管58ii1234578015001005376600100505010206789102170182314501581370120150802050解:已知:N=2860,n=10,X=154626由表可得ii178010062170120解:已知:N59因此,對(duì)該縣船舶在調(diào)查月完成貨運(yùn)量的比率估計(jì)為:方差的估計(jì)為:=2.10617×因此,對(duì)該縣船舶在調(diào)查月完成貨運(yùn)量的比率估計(jì)為:方差的估計(jì)為60標(biāo)準(zhǔn)差的估計(jì)為:如果用簡(jiǎn)單估計(jì)對(duì)貨運(yùn)量進(jìn)行估計(jì),則由此,得到比率估計(jì)量設(shè)計(jì)效應(yīng)為:對(duì)于本問(wèn)題,比率估計(jì)量比簡(jiǎn)單估計(jì)量的效率高!標(biāo)準(zhǔn)差的估計(jì)為:如果用簡(jiǎn)單估計(jì)對(duì)貨運(yùn)量進(jìn)行估計(jì),則由此,得到61【例2.3】在一項(xiàng)工資研究中,人們發(fā)現(xiàn)IT行業(yè)中,從業(yè)者的現(xiàn)薪與起薪之間相關(guān)系數(shù)高達(dá)0.88,已知某IT企業(yè)474名員工的平均起薪為17016.00元/年,現(xiàn)根據(jù)對(duì)100個(gè)按簡(jiǎn)單隨機(jī)抽樣方式選出的員工現(xiàn)薪的調(diào)查結(jié)果,估計(jì)該企業(yè)員工的現(xiàn)薪平均水平。已知:【例2.3】在一項(xiàng)工資研究中,人們發(fā)現(xiàn)IT行業(yè)中,62【解】1、在簡(jiǎn)單估計(jì)條件下,的95%的近似置信區(qū)間為:此處教材有誤(P51)【解】的95%的近似置信區(qū)間為:此處教材有誤(P51)632、在比率估計(jì)條件下,的95%的近似置信區(qū)間為:2、在比率估計(jì)條件下,的95%的近似置信區(qū)間為:64下面我們從理論上來(lái)比較簡(jiǎn)單估計(jì)與比率估計(jì)的誤差比率估計(jì)量精度高于簡(jiǎn)單估計(jì)量的充要條件是:下面我們從理論上來(lái)比較簡(jiǎn)單估計(jì)與比率估計(jì)的誤差比率估計(jì)量精度65也就是說(shuō),比率估計(jì)比簡(jiǎn)單估計(jì)更為精確。尤其是當(dāng)時(shí),只要相關(guān)系數(shù),比率估計(jì)就要優(yōu)于簡(jiǎn)單估計(jì)。比率估計(jì)的其他問(wèn)題看教材P53也就是說(shuō),比率估計(jì)比簡(jiǎn)單估計(jì)更為精確。尤其是當(dāng)66§2.4回歸估計(jì)量及其性質(zhì)一、回歸估計(jì)的定義對(duì)于簡(jiǎn)單隨機(jī)抽樣,總體均值和總體總量的回歸估計(jì)量(regressionestimatior)的定義為:式中,是樣本均值;為事先設(shè)定的一個(gè)常數(shù)如果β=0,則回歸估計(jì)量就是簡(jiǎn)單估計(jì)量;如果則回歸估計(jì)量就是比率估計(jì)量?!?.4回歸估計(jì)量及其性質(zhì)一、回歸估計(jì)的定義對(duì)于簡(jiǎn)單隨機(jī)67二、為常數(shù)的情形當(dāng)回歸系數(shù)為事先給定的常數(shù)時(shí),或以前為相同目的進(jìn)行的調(diào)查所得到的對(duì)的樣本回歸系數(shù)穩(wěn)定在某個(gè)數(shù)值上,取最近一次調(diào)查所得的作為設(shè)定值。性質(zhì)2對(duì)于簡(jiǎn)單隨機(jī)抽樣回歸估計(jì)量,作為及Y的回歸估計(jì),都是無(wú)偏的。即的方差分別為:二、為常數(shù)的情形當(dāng)回歸系數(shù)為事先給定的常數(shù)時(shí),或以前為相同目68式中,分別是Y,X的總體方差和總體協(xié)方差;分別是Y,X的樣本方差和樣本協(xié)方差。的樣本估計(jì)量為:式中,分別是Y,X的總體方差和總體協(xié)方差;分別是Y,X的樣本69我們對(duì)上式兩端關(guān)于求導(dǎo)數(shù),得:我們對(duì)上式兩端關(guān)于求導(dǎo)數(shù),得:70因此當(dāng)取總體回歸系數(shù)達(dá)到最小,即時(shí),式中,為總體相關(guān)系數(shù)。因此當(dāng)取總體回歸系數(shù)達(dá)到最小,即時(shí),式中,為總體相關(guān)系數(shù)。71三、β為樣本回歸系數(shù)的情形如果β需要通過(guò)樣本來(lái)確定,很自然地,我們會(huì)想到用總體回歸系數(shù)的最小二乘估計(jì),也就是樣本回歸系數(shù):這時(shí)簡(jiǎn)單隨機(jī)抽樣回歸估計(jì)量是有偏的。但當(dāng)樣本量n充分大時(shí),估計(jì)量的偏倚趨于零。因此,類似比率估計(jì)量,回歸估計(jì)量也是漸近無(wú)偏的。三、β為樣本回歸系數(shù)的情形如果β需要通過(guò)樣本來(lái)確定,很自然地72且有的一個(gè)近似估計(jì)為:且有的一個(gè)近似估計(jì)為:73【例4.5】(續(xù)P72的例4.2)利用回歸估計(jì)量推算該縣船舶調(diào)查月完成的貨運(yùn)量.解:根據(jù)例4.2中的計(jì)算結(jié)果可得樣本回歸系數(shù):從而【例4.5】(續(xù)P72的例4.2)利用回歸估計(jì)量推算該縣船舶74因此,該縣船舶調(diào)查月完成的貨運(yùn)量的回歸估計(jì)為:為了估計(jì),先計(jì)算回歸殘差方差:所以因此,該縣船舶調(diào)查月完成的貨運(yùn)量的回歸為了估計(jì)75對(duì)于同一個(gè)題,我們來(lái)比較三種估計(jì)量的誤差差異對(duì)于同一個(gè)題,我們來(lái)比較三種估計(jì)量的誤差差異76●與例4.2的結(jié)果比較,對(duì)于本問(wèn)題回歸估計(jì)優(yōu)于比率估計(jì),而比率估計(jì)又優(yōu)于簡(jiǎn)單估計(jì);

●回歸估計(jì)優(yōu)于比率估計(jì)的原因是回歸直線可以不通過(guò)原點(diǎn)。

●比較上述估計(jì)量的優(yōu)劣,一般是通過(guò)比較它們的均方誤差或方差大小來(lái)進(jìn)行?!衽c例4.2的結(jié)果比較,對(duì)于本問(wèn)題回歸估計(jì)優(yōu)于比77關(guān)于簡(jiǎn)單估計(jì)、比率估計(jì)、回歸估計(jì)的估計(jì)量方差比較簡(jiǎn)單估計(jì)量:比率估計(jì)量:回歸估計(jì)量:關(guān)于簡(jiǎn)單估計(jì)、比率估計(jì)、簡(jiǎn)單估計(jì)量:比率估計(jì)量:回歸估計(jì)78由此可以看出(在不考慮偏倚的情況下)有以下結(jié)論:2.比率估計(jì)量?jī)?yōu)于簡(jiǎn)單估計(jì)量的條件是:3.回歸估計(jì)量?jī)?yōu)于比率估計(jì)量的條件是:在不考慮偏倚時(shí),回歸估計(jì)總是優(yōu)于比率估計(jì)1.回歸估計(jì)量總是優(yōu)于簡(jiǎn)單估計(jì)量,除非即一般而言有由此可以看出(在不考慮偏倚的情況下)有以下結(jié)論:2.比率估計(jì)79如果不忽略偏倚,全面考慮比率估計(jì)和回歸估計(jì)的均方誤差MSE,那情況會(huì)怎么樣呢?下面我們通過(guò)教材P61.表2—13的實(shí)際例題來(lái)分析比較。(略,看教材)如果不忽略偏倚,全面考慮比率估計(jì)80§2.4簡(jiǎn)單隨機(jī)抽樣的實(shí)施一、樣本量的確定原理

我們知道n的大小會(huì)影響抽樣誤差,因?yàn)槿绻鹡越接近N,則抽樣誤差就會(huì)越接近于零,這一點(diǎn)也清楚地體現(xiàn)在下面的式子里。三個(gè)因素決定n§2.4簡(jiǎn)單隨機(jī)抽樣的實(shí)施一、樣本量的確定原理三個(gè)因素決定81

在上式中,N是已知的,S是無(wú)法知道的,所以要考考慮影響n的重點(diǎn)應(yīng)該是抽樣誤差。習(xí)慣上,不以作為調(diào)查精度指標(biāo),而是用置信度和絕對(duì)誤差限度替代抽樣誤差根據(jù)雙側(cè)分位點(diǎn)的定義有在上式中,N是已知的,S是無(wú)法知道的,所以要考根據(jù)雙82下面我們分別觀察等式右端各部分對(duì)n的影響。下面我們分別觀察等式右端各部分對(duì)n的影響。830.900.950.991.6451.962.58n1.191.73置信度對(duì)樣本量n的影響絕對(duì)誤差限度d對(duì)樣本量n的影響d0.140.100.040.03n4995566964這里0.900.950.991.6451.962.5884總體方差對(duì)樣本量n的影響00.090.160.210.240.25n1136240313356370這里下面我們把置信度設(shè)為:絕對(duì)誤差設(shè)為:總體方差設(shè)為:來(lái)觀察總體規(guī)模N對(duì)樣本量n的影響總體方差對(duì)樣本量n的影響00.090.160.210.24085總體規(guī)模N樣本容量n5044100795002171000278500035710000370100000383100000038410000000384總體規(guī)模N對(duì)樣本量n的影響總體規(guī)模N樣本容量n5044100795002171000286二、樣本量的確定步驟第一步:確定委托單位認(rèn)可的估計(jì)精度水平,包括絕對(duì)誤差d和置信水平;第二步:按照保守原則(寧大勿?。?,實(shí)施對(duì)總體方差的預(yù)估;第三步:根據(jù)上述給定的估計(jì)精度和總體方差的預(yù)估值并考慮總體N的大小,以簡(jiǎn)單抽樣及回答率100%為前提條件,按下面的式子計(jì)算初始樣本量n二、樣本量的確定步驟第一步:確定委托單位認(rèn)可的估計(jì)精度水平,87第四步:確定抽樣方法,并根據(jù)不同抽樣方法的抽樣效應(yīng)deff對(duì)樣本容量進(jìn)行調(diào)整:簡(jiǎn)單隨機(jī)抽樣的分層隨機(jī)抽樣的整群隨機(jī)抽樣的系統(tǒng)隨機(jī)抽樣的第四步:確定抽樣方法,并根據(jù)不同抽樣方法的抽樣簡(jiǎn)單隨機(jī)抽樣的88第五步:判定有效回答率,并根據(jù)有效回答率r對(duì)樣本容量進(jìn)行再調(diào)整:第六步:為了獲得分組數(shù)據(jù),要考慮適當(dāng)增加樣本量;第七步:要考慮調(diào)查費(fèi)用,適當(dāng)調(diào)整樣本量。第五步:判定有效回答率,并根據(jù)有效回答率r對(duì)第六步:為了獲得89三、抽選方法首先將總體的N個(gè)單元從一到N編號(hào),每個(gè)單元對(duì)應(yīng)一個(gè)號(hào),如果抽到某個(gè)號(hào),則對(duì)應(yīng)的那個(gè)單元入樣。要選出n個(gè)單元入樣,通常有兩種做法:抽簽法和隨機(jī)數(shù)法。

1、抽簽法當(dāng)總體不大時(shí),可以用均勻同質(zhì)的材料制作N個(gè)簽,將它們充分混合,然后一次抽取n個(gè)簽;或一次抽取一個(gè)簽,但不放回,接著抽下一個(gè)簽直到第n個(gè)簽為止。則這n個(gè)簽上所示號(hào)碼表示入樣的單元號(hào)。三、抽選方法首先將總體的N個(gè)單元從一到N編號(hào),每個(gè)單元對(duì)應(yīng)一902、隨機(jī)數(shù)法

(一)隨機(jī)數(shù)表

隨機(jī)數(shù)表是由數(shù)字0,1,2,…,9組成的表,每個(gè)數(shù)字都有同樣的機(jī)會(huì)被抽中,用隨機(jī)數(shù)表抽取簡(jiǎn)單隨機(jī)樣本,可用下面兩種方法:

2、隨機(jī)數(shù)法(一)隨機(jī)數(shù)表91方法一根據(jù)總體大小N的位數(shù)確定在隨機(jī)表中隨機(jī)抽取幾列。如N=678,要抽取n=5的樣本,則在隨機(jī)數(shù)表中隨機(jī)抽取3列,依次往下,選出頭5個(gè)001~678之間互不相同的數(shù)。方法一根據(jù)總體大小N的位數(shù)確定在隨機(jī)表中隨機(jī)抽取幾列。92方法二

若N的第一個(gè)數(shù)字小于5,且n較大,則方法一可能花費(fèi)較多的時(shí)間。如N=327,按方法一則328~999的數(shù)都沒(méi)有用,這時(shí)采用下面的方法可能更好:在隨機(jī)數(shù)表中隨機(jī)抽取3列,依次往下,如果得到的隨機(jī)數(shù)在401~800之間,則這個(gè)數(shù)減去400,由此000,大于800以及余數(shù)大于327的數(shù)被扔掉。抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件93

(二)計(jì)算機(jī)產(chǎn)生的偽隨機(jī)數(shù)

利用軟件中的隨機(jī)函數(shù)可產(chǎn)生所需要的隨機(jī)數(shù),這種方法產(chǎn)生隨機(jī)數(shù)稱為偽隨機(jī)數(shù),雖然方便,但并不能保證其隨機(jī)性,因?yàn)檫@些偽隨機(jī)數(shù)有循環(huán)周期,當(dāng)然,我們希望產(chǎn)生的偽隨機(jī)數(shù)循環(huán)周期越長(zhǎng)越好。在可能的條件下,建議還是利用隨機(jī)數(shù)表來(lái)產(chǎn)生隨機(jī)數(shù)。抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件94本章作業(yè)

(1)熟悉本章有關(guān)估計(jì)量性質(zhì)的證明;(2)思考書后P72.習(xí)題2.2,習(xí)題2.3;(3)在作業(yè)本上完成P72.習(xí)題2.4;2.5;2.9;2.10(第二章結(jié)束)本章作業(yè)(1)熟悉本章有關(guān)估計(jì)量性質(zhì)的證明;(第二章結(jié)束)95§2.1定義與符號(hào)

一、定義簡(jiǎn)單隨機(jī)抽樣:從含有N個(gè)單元的總體中隨機(jī)抽取n個(gè)單元組成樣本。1.若抽樣是放回的,則所有可能的樣本有個(gè),每個(gè)樣本被抽中的概率為,這種抽樣方法稱為放回簡(jiǎn)單隨機(jī)抽樣。2.若抽樣是不放回的,則所有可能的樣本有個(gè),每個(gè)樣本被抽中的概率為,這種抽樣方法稱為不放回簡(jiǎn)單隨機(jī)抽樣?!?.1定義與符號(hào)一、定義簡(jiǎn)單隨機(jī)抽樣:從含有N個(gè)單元961.簡(jiǎn)單隨機(jī)抽樣是等概抽樣,即每個(gè)總體單元都有相同的入樣概率;2.隨機(jī)抽取是有嚴(yán)格要求的,不是隨便抽取,必須按照某一隨機(jī)原則進(jìn)行。注意1.簡(jiǎn)單隨機(jī)抽樣是等概抽樣,即每個(gè)總體單元都有相同的入樣概率97【例2.1】設(shè)總體有5個(gè)單元(1,2,3,4,5),按放回簡(jiǎn)單隨機(jī)抽樣的方式抽2個(gè)單元,則所有可能的樣本為個(gè)(考慮樣本單元的順序)1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,5(放回簡(jiǎn)單隨機(jī)抽樣所有可能的樣本)【例2.1】設(shè)總體有5個(gè)單元(1,2,3,4,5),按放回98【例2.2】設(shè)總體有5個(gè)單元(1,2,3,4,5),按不放回簡(jiǎn)單隨機(jī)抽樣的方式抽2個(gè)單元,則所有可1,21,31,41,52,32,42,53,43,54,5(不放回簡(jiǎn)單隨機(jī)抽樣所有可能的樣本)能的樣本為個(gè)。在實(shí)際工作中,更多地采用不放回簡(jiǎn)單隨機(jī)抽樣,所以以下討論的簡(jiǎn)單隨機(jī)抽樣一般都指不放回簡(jiǎn)單隨機(jī)抽樣.【例2.2】設(shè)總體有5個(gè)單元(1,2,3,4,5),按不放99二、符號(hào)大寫字母表示總體單元的標(biāo)志值:如小寫字母表示樣本單元的標(biāo)志值:如調(diào)查的總體目標(biāo)量主要有:總體總量Y;總體均值

;總體某一指標(biāo)的比例P;兩個(gè)總體總量的比率R。對(duì)估計(jì)精度進(jìn)行計(jì)算時(shí),要涉及到總體方差和樣本方差等。下面分別列出:二、符號(hào)大寫字母表示總體單元的標(biāo)志值:如小寫字母表示樣本單元100總體方差樣本方差還有一些其他符號(hào),分別說(shuō)明如下:總體方差樣本方差還有一些其他符號(hào),分別說(shuō)明如下:101總體(),樣本將左邊式子中的大寫字母改為小寫字母??傮w(),樣本將左邊式子中102總體指標(biāo)值上面帶符號(hào)“”的表示由樣本得到的總體指標(biāo)的估計(jì)。如稱為的估計(jì)。估計(jì)量的方差用V表示,如標(biāo)準(zhǔn)差用S表示,如對(duì)的樣本估計(jì)不用而用稱為抽樣比,記為f.總體指標(biāo)值上面帶符號(hào)“”的表示由樣本得到的總體指標(biāo)的估計(jì)。如103§2.2簡(jiǎn)單估計(jì)量及其性質(zhì)

無(wú)論調(diào)查對(duì)象是何種總體參數(shù),其實(shí)所有估計(jì)量通常都是樣本均值的某種線性組合,因此在抽樣中不管討論何種估計(jì)的基本性質(zhì),都只圍繞樣本均值進(jìn)行。而對(duì)樣本均值這個(gè)核心估計(jì)量的研究則分為兩個(gè)方面:一方面是求樣本均值對(duì)所有可能樣本的數(shù)學(xué)期望

(檢驗(yàn)估計(jì)量是否無(wú)偏)。另一方面是求樣本均值對(duì)所有可能樣本的方差

(檢驗(yàn)估計(jì)量誤差的大?。??!?.2簡(jiǎn)單估計(jì)量及其性質(zhì)無(wú)論調(diào)查對(duì)象是何104為了討論簡(jiǎn)單估計(jì)的性質(zhì),首先我們來(lái)看兩個(gè)引理:

引理一

從大小為N的總體中抽取一個(gè)樣本量為n的簡(jiǎn)單隨機(jī)樣本,則總體中每個(gè)特定單元的入樣概率為:兩個(gè)特定單元都入樣的概率為:為了討論簡(jiǎn)單估計(jì)的性質(zhì),首先我們來(lái)看兩個(gè)引理:105引理一的證明:在N個(gè)單元中取n個(gè)單元為樣本,共有個(gè)樣本。在個(gè)樣本中,包含某個(gè)特定單元的樣本數(shù)為:每個(gè)樣本被抽中的概率為:。同時(shí)包含兩個(gè)特定單元的樣本數(shù)為每個(gè)樣本被抽中的概率為:引理一的證明:在N個(gè)單元中取n個(gè)單元為樣本,同時(shí)包含兩個(gè)特定106

引理二

從總體規(guī)模為N的總體中抽取一個(gè)樣本量為n的簡(jiǎn)單隨機(jī)樣本。若對(duì)總體中的每個(gè)單元,引進(jìn)隨機(jī)變量如下:由二項(xiàng)分布可知:引理二從總體規(guī)模為N的總體中抽取107所以,不難推出:所以,不難推出:108簡(jiǎn)單估計(jì)量的性質(zhì)

是性質(zhì)1的無(wú)偏估計(jì),即下面我們用兩種與數(shù)理統(tǒng)計(jì)中不同的方法來(lái)證明這一性質(zhì)。思考:為什么不能用數(shù)理統(tǒng)計(jì)中常用的方法?簡(jiǎn)單估計(jì)量的性質(zhì)是性質(zhì)1的無(wú)偏估計(jì),即下面109有了這些準(zhǔn)備,我們很容易證明根據(jù)前面提到的關(guān)于的定義,有下式有了這些準(zhǔn)備,我們很容易證明根據(jù)前面提到的關(guān)于的定110第二種方法證明

證明:對(duì)于一個(gè)大小為N的總體,樣本量為n的簡(jiǎn)單隨機(jī)樣本有個(gè),因此第二種方法證明證明:對(duì)于一個(gè)大小為N的總體,樣本量為n111抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件112其他幾個(gè)估計(jì)量的無(wú)偏性可容易推出:1、對(duì)于總體總量2、對(duì)于總體比例其他幾個(gè)估計(jì)量的無(wú)偏性可容易推出:1、對(duì)于總體總量2、對(duì)于總113性質(zhì)2對(duì)于簡(jiǎn)單隨機(jī)抽樣,的方差為:式中,n為樣本量;f=為抽樣比;1-f為有限總體校正系數(shù)。V()=(2.5)性質(zhì)2對(duì)于簡(jiǎn)單隨機(jī)抽樣,的方差為:式中,n為樣本量;f=為抽114證明方法一證明方法一115即即116

證明方法二:由定義而

證明方法二:由定義而117因此有因此有118

即即119性質(zhì)3V()的無(wú)偏估計(jì)為:式中,為樣本方差。證明:將改寫成:性質(zhì)3V()的無(wú)偏估計(jì)為:式中,為樣本方差。證明:將120由前面性質(zhì)1證明用過(guò)的對(duì)稱論證法有:由性質(zhì)2有:由前面性質(zhì)1證明用過(guò)的對(duì)稱論證法有:由性質(zhì)2有:121抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件122下面我們從關(guān)系式可以推出其他幾個(gè)估計(jì)量的方差下面我們從關(guān)系式可以推出其他幾個(gè)估計(jì)量的方差123

總體總量的估計(jì)量方差是總體均值方差的直接推導(dǎo),下面我們來(lái)推導(dǎo)總體比例估計(jì)量的方差??傮w總量的估計(jì)量方差是總體均值方差的直接124

設(shè)N個(gè)樣本單元中有N1個(gè)具有某一特性,即有N1個(gè)單元取值為1,有N-N1個(gè)單元取值為0.設(shè)N個(gè)樣本單元中有N1個(gè)具有某一特性,即有125同理對(duì)樣本方差有因此同理對(duì)樣本方差有因此126同樣下面我們從關(guān)系式可以推出同樣下面我們從關(guān)系式可以推出127估計(jì)量的方差是衡量估計(jì)量精度的度量。從式可以看出,影響估計(jì)量方差的因素有:①樣本量n;③總體未入樣比率1-f

②總體方差分析見(jiàn)教材P38,39估計(jì)量的方差是衡量估計(jì)量精度的度量。從式①樣本量n;128

N通常很大,當(dāng)f<0.05時(shí),可將1-f近似取為1,這時(shí)影響估計(jì)量方差的主要因素是樣本量n和總體方差。的大小是我們無(wú)法改變的,因此,要提高估計(jì)量的精度就只有加大樣本量。注意N通常很大,當(dāng)f<0.05時(shí),可將1-f近似取為1,129【例2.3】我們從某個(gè)N=100的總體中抽出一個(gè)大小為n=10的簡(jiǎn)單隨機(jī)樣本,要估計(jì)總體平均水平并給出置信度95%的置信區(qū)間。序號(hào)i1234567891045204661508解:依題意,N=100,n=10,f=樣本均值為:【例2.3】我們從某個(gè)N=100的總體中抽出一個(gè)序號(hào)i1130樣本方差為:因此,總體平均值的估計(jì)為:的方差為:的方標(biāo)準(zhǔn)差為:s的置信度95%的置信區(qū)間為:即[2.4295,7.5705].樣本方差為:因此,總體平均值的估計(jì)為:的方差為:的方標(biāo)準(zhǔn)差為131,。其方差為:V(

放回簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單估計(jì)量,。其方差為:V(放回簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單估計(jì)量132

注意:不放回時(shí)的方差為放回時(shí)的約1-f倍,而1-f<1,因此不放回抽樣的估計(jì)精度比放回抽樣的估計(jì)精度高。注意:不放回時(shí)的方差為放回時(shí)的約1-f倍,而1-f<1,因133【例2.4】我們從某個(gè)N=100的總體中抽出一個(gè)大小為n=10的簡(jiǎn)單隨機(jī)樣本,要估計(jì)總體總量并給出在置信度95%的條件下,估計(jì)量的相對(duì)誤差。序號(hào)i1234567891045204661508解依題意,N=100,由例2.3可知:,因此,對(duì)總體總量的估計(jì)為:=100×5=500?!纠?.4】我們從某個(gè)N=100的總體中抽出一個(gè)大序號(hào)i1134對(duì)V()的樣本估計(jì)為:0其標(biāo)準(zhǔn)差為:因此,在置信度95%的條件下(對(duì)應(yīng)的t=1.96),的相對(duì)誤差為:=51.41%對(duì)V()的樣本估計(jì)為:0其標(biāo)準(zhǔn)差為:因此,在置信度95%的條135【例2.5】解:已知n=200,a=130,1-f≈1某超市開張一段時(shí)間之后,為改進(jìn)銷售服務(wù)環(huán)境,欲調(diào)查附近幾個(gè)小區(qū)居民到該超市購(gòu)物的滿意度。該超市與附近幾個(gè)小區(qū)居委會(huì)取得聯(lián)系,在整體中按簡(jiǎn)單隨機(jī)機(jī)樣,抽取了一個(gè)大小為n=200人的樣本。調(diào)查發(fā)現(xiàn)對(duì)該超市購(gòu)物環(huán)境表示滿意或基本滿意的居民有130位,要估計(jì)對(duì)該超市購(gòu)物環(huán)境持肯定態(tài)度居民的比例,并在置信度95%條件下,給出估計(jì)的絕對(duì)誤差和置信區(qū)間。假定這時(shí)的抽樣比可以忽略?!纠?.5】解:已知n=200,a=130,1-136在置信度95%的條件下,估計(jì)的絕對(duì)誤差為:的95%置信區(qū)間為:0.65在置信度95%的條件下,估計(jì)的絕對(duì)誤差為:的95%置信區(qū)間為137§2.3比率估計(jì)量及其性質(zhì)

用樣本均值作為總體均值的簡(jiǎn)單估計(jì)量,具有無(wú)偏等很多優(yōu)良性質(zhì),且完全不依賴其它總體信息。但是,若我們有與調(diào)查變量相關(guān)的其它信息(通常稱為輔助變量信息)可以利用,則估計(jì)的精度可以大大提高。這就是我們下面要講的比率估計(jì)和回歸估計(jì)。一、估計(jì)的概念§2.3比率估計(jì)量及其性質(zhì)用樣本均值作為138設(shè)主要變量為:Y輔助變量為:X兩變量的比率為:總體均值的比估計(jì):其中設(shè)主要變量為:Y總體均值的比估計(jì):其中139二、比率估計(jì)的特點(diǎn)及注意事項(xiàng)1、使用比估計(jì)首先要知道輔助變量的總體均值(或總體總量),調(diào)查時(shí),既要觀測(cè)主要變量的值還要觀測(cè)輔助變量的值;2、輔助變量必須與主要變量高度相關(guān)且整體上應(yīng)相當(dāng)穩(wěn)定;3、比估計(jì)雖然不是無(wú)偏的,但其精度要高于簡(jiǎn)單估計(jì)量很多。下面我們看一個(gè)簡(jiǎn)單估計(jì)與比估計(jì)對(duì)比的例題二、比率估計(jì)的特點(diǎn)及注意事項(xiàng)1、使用比估計(jì)首先要知道輔助變量140【例】對(duì)以下假設(shè)的總體(N=6),用簡(jiǎn)單隨機(jī)抽樣抽取n=2的樣本,比較簡(jiǎn)單隨機(jī)抽樣比率估計(jì)及簡(jiǎn)單估計(jì)的性質(zhì)。i123456均值XiYi011331151882910464.518解:對(duì)這個(gè)總體,我們列出所有可能的個(gè)樣本,以比較簡(jiǎn)單估計(jì)與比率估計(jì)的性質(zhì)?!纠繉?duì)以下假設(shè)的總體(N=6),用簡(jiǎn)單隨機(jī)抽樣抽取n=2141i樣本簡(jiǎn)單估計(jì)()比率估計(jì)()1234567891011121314151,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.5181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.75i樣本簡(jiǎn)單估計(jì)()比率估計(jì)(142由此,可以算出:由此,可以算出:143總結(jié)1、從計(jì)算表格中可以看出,均值的比估計(jì)很穩(wěn)定,而均值的簡(jiǎn)單估計(jì)則波動(dòng)劇烈。2、雖然比率估計(jì)是有偏估計(jì),但偏倚不大,而估計(jì)量方差要比簡(jiǎn)單估計(jì)的方差小得多。3、比估計(jì)是一種很好的估計(jì)量,是提高估計(jì)精度的最有效的途徑。4、思考:比估計(jì)為什么能大幅度地提高估計(jì)精度?總結(jié)144對(duì)于簡(jiǎn)單隨機(jī)抽樣,n較大時(shí),比率估計(jì)具有以下性質(zhì):對(duì)于簡(jiǎn)單隨機(jī)抽樣,n較大時(shí),比率估計(jì)具有以下性質(zhì):145關(guān)于比率估計(jì)我們要說(shuō)明(或證明)以下幾個(gè)問(wèn)題:1、均值的比率估計(jì)不是無(wú)偏的;2、偏倚是怎么產(chǎn)生的;3、均值比率估計(jì)的均方誤差;4、均方誤差的估計(jì)。關(guān)于比率估計(jì)我們要說(shuō)明146第一個(gè)問(wèn)題可從上面的例題給予說(shuō)明:第二個(gè)問(wèn)題我們可以從下面的表達(dá)式說(shuō)明:這里是常量,是隨機(jī)變量。估計(jì)量不是隨機(jī)變量的線性函數(shù)。因此,估計(jì)量的偏倚是由R的有偏性造成的.第一個(gè)問(wèn)題可從上面的例題給予說(shuō)明:第二個(gè)問(wèn)題我們可以從下面的147第三個(gè)問(wèn)題,我們來(lái)證明R估計(jì)的偏倚第三個(gè)問(wèn)題,我們來(lái)證明R估計(jì)的偏倚148因此因而偏倚主要來(lái)自于等式右邊的第二項(xiàng),由因此因而偏倚主要來(lái)自于等式右邊的第二項(xiàng),由149因此,偏倚的主要項(xiàng)為:同樣我們可以推出:因此,偏倚的主要項(xiàng)為:同樣我們可以推出:150抽樣調(diào)查-第2章簡(jiǎn)單隨機(jī)抽樣課件151對(duì)上述方差分別給出樣本估計(jì)式如下:對(duì)上述方差分別給出樣本估計(jì)式如下:152【例2.2】某縣在對(duì)船舶調(diào)查月完成的貨運(yùn)量進(jìn)行調(diào)查時(shí),對(duì)運(yùn)管部門登記的船舶臺(tái)帳進(jìn)行整理后獲得注冊(cè)船舶2860艘,載重噸位154626噸。從2860艘船舶中抽取一個(gè)n=10的簡(jiǎn)單隨機(jī)樣本,調(diào)查得到樣本船舶調(diào)查月完成的貨運(yùn)量及其載重噸位如表(單位:噸),要推算該縣船舶調(diào)查月完成的貨運(yùn)量?!纠?.2】某縣在對(duì)船舶調(diào)查月完成的貨運(yùn)量進(jìn)行調(diào)查時(shí),對(duì)運(yùn)管153ii1234578015001005376600100505010206789102170182314501581370120150802050解:已知:N=2860,n=10,X=154626由表可得ii178010062170120解:已知:N154因此,對(duì)該縣船舶在調(diào)查月完成貨運(yùn)量的比率估計(jì)為:方差的估計(jì)為:=2.10617×因此,對(duì)該縣船舶在調(diào)查月完成貨運(yùn)量的比率估計(jì)為:方差的估計(jì)為155標(biāo)準(zhǔn)差的估計(jì)為:如果用簡(jiǎn)單估計(jì)對(duì)貨運(yùn)量進(jìn)行估計(jì),則由此,得到比率估計(jì)量設(shè)計(jì)效應(yīng)為:對(duì)于本問(wèn)題,比率估計(jì)量比簡(jiǎn)單估計(jì)量的效率高!標(biāo)準(zhǔn)差的估計(jì)為:如果用簡(jiǎn)單估計(jì)對(duì)貨運(yùn)量進(jìn)行估計(jì),則由此,得到156【例2.3】在一項(xiàng)工資研究中,人們發(fā)現(xiàn)IT行業(yè)中,從業(yè)者的現(xiàn)薪與起薪之間相關(guān)系數(shù)高達(dá)0.88,已知某IT企業(yè)474名員工的平均起薪為17016.00元/年,現(xiàn)根據(jù)對(duì)100個(gè)按簡(jiǎn)單隨機(jī)抽樣方式選出的員工現(xiàn)薪的調(diào)查結(jié)果,估計(jì)該企業(yè)員工的現(xiàn)薪平均水平。已知:【例2.3】在一項(xiàng)工資研究中,人們發(fā)現(xiàn)IT行業(yè)中,157【解】1、在簡(jiǎn)單估計(jì)條件下,的95%的近似置信區(qū)間為:此處教材有誤(P51)【解】的95%的近似置信區(qū)間為:此處教材有誤(P51)1582、在比率估計(jì)條件下,的95%的近似置信區(qū)間為:2、在比率估計(jì)條件下,的95%的近似置信區(qū)間為:159下面我們從理論上來(lái)比較簡(jiǎn)單估計(jì)與比率估計(jì)的誤差比率估計(jì)量精度高于簡(jiǎn)單估計(jì)量的充要條件是:下面我們從理論上來(lái)比較簡(jiǎn)單估計(jì)與比率估計(jì)的誤差比率估計(jì)量精度160也就是說(shuō),比率估計(jì)比簡(jiǎn)單估計(jì)更為精確。尤其是當(dāng)時(shí),只要相關(guān)系數(shù),比率估計(jì)就要優(yōu)于簡(jiǎn)單估計(jì)。比率估計(jì)的其他問(wèn)題看教材P53也就是說(shuō),比率估計(jì)比簡(jiǎn)單估計(jì)更為精確。尤其是當(dāng)161§2.4回歸估計(jì)量及其性質(zhì)一、回歸估計(jì)的定義對(duì)于簡(jiǎn)單隨機(jī)抽樣,總體均值和總體總量的回歸估計(jì)量(regressionestimatior)的定義為:式中,是樣本均值;為事先設(shè)定的一個(gè)常數(shù)如果β=0,則回歸估計(jì)量就是簡(jiǎn)單估計(jì)量;如果則回歸估計(jì)量就是比率估計(jì)量?!?.4回歸估計(jì)量及其性質(zhì)一、回歸估計(jì)的定義對(duì)于簡(jiǎn)單隨機(jī)162二、為常數(shù)的情形當(dāng)回歸系數(shù)為事先給定的常數(shù)時(shí),或以前為相同目的進(jìn)行的調(diào)查所得到的對(duì)的樣本回歸系數(shù)穩(wěn)定在某個(gè)數(shù)值上,取最近一次調(diào)查所得的作為設(shè)定值。性質(zhì)2對(duì)于簡(jiǎn)單隨機(jī)抽樣回歸估計(jì)量,作為及Y的回歸估計(jì),都是無(wú)偏的。即的方差分別為:二、為常數(shù)的情形當(dāng)回歸系數(shù)為事先給定的常數(shù)時(shí),或以前為相同目163式中,分別是Y,X的總體方差和總體協(xié)方差;分別是Y,X的樣本方差和樣本協(xié)方差。的樣本估計(jì)量為:式中,分別是Y,X的總體方差和總體協(xié)方差;分別是Y,X的樣本164我們對(duì)上式兩端關(guān)于求導(dǎo)數(shù),得:我們對(duì)上式兩端關(guān)于求導(dǎo)數(shù),得:165因此當(dāng)取總體回歸系數(shù)達(dá)到最小,即時(shí),式中,為總體相關(guān)系數(shù)。因此當(dāng)取總體回歸系數(shù)達(dá)到最小,即時(shí),式中,為總體相關(guān)系數(shù)。166三、β為樣本回歸系數(shù)的情形如果β需要通過(guò)樣本來(lái)確定,很自然地,我們會(huì)想到用總體回歸系數(shù)的最小二乘估計(jì),也就是樣本回歸系數(shù):這時(shí)簡(jiǎn)單隨機(jī)抽樣回歸估計(jì)量是有偏的。但當(dāng)樣本量n充分大時(shí),估計(jì)量的偏倚趨于零。因此,類似比率估計(jì)量,回歸估計(jì)量也是漸近無(wú)偏的。三、β為樣本回歸系數(shù)的情形如果β需要通過(guò)樣本來(lái)確定,很自然地167且有的一個(gè)近似估計(jì)為:且有的一個(gè)近似估計(jì)為:168【例4.5】(續(xù)P72的例4.2)利用回歸估計(jì)量推算該縣船舶調(diào)查月完成的貨運(yùn)量.解:根據(jù)例4.2中的計(jì)算結(jié)果可得樣本回歸系數(shù):從而【例4.5】(續(xù)P72的例4.2)利用回歸估計(jì)量推算該縣船舶169因此,該縣船舶調(diào)查月完成的貨運(yùn)量的回歸估計(jì)為:為了估計(jì),先計(jì)算回歸殘差方差:所以因此,該縣船舶調(diào)查月完成的貨運(yùn)量的回歸為了估計(jì)170對(duì)于同一個(gè)題,我們來(lái)比較三種估計(jì)量的誤差差異對(duì)于同一個(gè)題,我們來(lái)比較三種估計(jì)量的誤差差異171●與例4.2的結(jié)果比較,對(duì)于本問(wèn)題回歸估計(jì)優(yōu)于比率估計(jì),而比率估計(jì)又優(yōu)于簡(jiǎn)單估計(jì);

●回歸估計(jì)優(yōu)于比率估計(jì)的原因是回歸直線可以不通過(guò)原點(diǎn)。

●比較上述估計(jì)量的優(yōu)劣,一般是通過(guò)比較它們的均方誤差或方差大小來(lái)進(jìn)行?!衽c例4.2的結(jié)果比較,對(duì)于本問(wèn)題回歸估計(jì)優(yōu)于比172關(guān)于簡(jiǎn)單估計(jì)、比率估計(jì)、回歸估計(jì)的估計(jì)量方差比較簡(jiǎn)單估計(jì)量:比率估計(jì)量:回歸估計(jì)量:關(guān)于簡(jiǎn)單估計(jì)、比率估計(jì)、簡(jiǎn)單估計(jì)量:比率估計(jì)量:回歸估計(jì)173由此可以看出(在不考慮偏倚的情況下)有以下結(jié)論:2.比率估計(jì)量?jī)?yōu)于簡(jiǎn)單估計(jì)量的條件是:3.回歸估計(jì)量?jī)?yōu)于比率估計(jì)量的條件是:在不考慮偏倚時(shí),回歸估計(jì)總是優(yōu)于比率估計(jì)1.回歸估計(jì)量總是優(yōu)于簡(jiǎn)單估計(jì)量,除非即一般而言有由此可以看出(在不考慮偏倚的情況下)有以下結(jié)論:2.比率估計(jì)174如果不忽略偏倚,全面考慮比率估計(jì)和回歸估計(jì)的均方誤差MSE,那情況會(huì)怎么樣呢?下面我們通過(guò)教材P61.表2—13的實(shí)際例題來(lái)分析比較。(略,看教材)如果不忽略偏倚,全面考慮比率估計(jì)175§2.4簡(jiǎn)單隨機(jī)抽樣的實(shí)施一、樣本量的確定

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論