統(tǒng)計學:第六章抽樣與抽樣分布_第1頁
統(tǒng)計學:第六章抽樣與抽樣分布_第2頁
統(tǒng)計學:第六章抽樣與抽樣分布_第3頁
統(tǒng)計學:第六章抽樣與抽樣分布_第4頁
統(tǒng)計學:第六章抽樣與抽樣分布_第5頁
已閱讀5頁,還剩80頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2022-5-8河北工程大學經(jīng)濟管理學院1統(tǒng)計學統(tǒng)計學2022-5-8河北工程大學經(jīng)濟管理學院2第六章第六章 抽樣與抽樣分布抽樣與抽樣分布 本章內(nèi)容:抽樣與抽樣分布是推斷統(tǒng)計學中的最基本內(nèi)容。學習本章了解抽樣的概率抽樣方法;理解抽樣分布的概念和形式;掌握樣本平均數(shù)、樣本比例的抽樣分布;了解抽樣組織方式及其抽樣分布。重點是樣本平均數(shù)、重點是樣本平均數(shù)、樣本比例的抽樣分布。樣本比例的抽樣分布。2022-5-8河北工程大學經(jīng)濟管理學院3 第六章第六章 抽樣與抽樣分布抽樣與抽樣分布 本章分三節(jié): 第一節(jié)第一節(jié) 抽樣的基本概念抽樣的基本概念 第二節(jié)第二節(jié) 抽樣分布抽樣分布 第三節(jié)第三節(jié) 抽樣組織方式及其

2、抽樣分抽樣組織方式及其抽樣分布布 2022-5-8河北工程大學經(jīng)濟管理學院4第一節(jié)第一節(jié) 抽樣的基本概念抽樣的基本概念本節(jié)需要把握四個問題:一、總體與樣本;一、總體與樣本;二、抽樣方法;二、抽樣方法;三、抽樣框;三、抽樣框;四、抽樣誤差。四、抽樣誤差。2022-5-8河北工程大學經(jīng)濟管理學院5一、總體與樣本一、總體與樣本 把握兩個問題: 1、總體和總體參數(shù); 2、樣本和樣本統(tǒng)計量。2022-5-8河北工程大學經(jīng)濟管理學院6 1、總體與總體參數(shù)(1)總體總體:指根據(jù)研究目的確定的所要研究的同類事物的全體,是所要說明其數(shù)量特征的研究對象。按所研究標志性質(zhì)不同,分為變量總體和屬性總體,分別研究總體的

3、數(shù)量特征和品質(zhì)特征。 構(gòu)成總體的個別事物(基本單元)就是總體單位總體單位,也稱個體??傮w單位的總數(shù)稱為總體容量,記作N。2022-5-8河北工程大學經(jīng)濟管理學院7 1、總體與總體參數(shù)、總體與總體參數(shù) (2)總體參數(shù):總體參數(shù):指抽樣估計中用來反映總體數(shù)量特征的指標。研究目的確定后,總體確定,總體參數(shù)存在但未知,需要估計。 A、變量總體中各單位可以直接用數(shù)量表示,設(shè)各單位變量值為:X1, X2, XN,則總體參數(shù)有均值,標準差或方差以及總體標志總量,即 我們研究變量X值的全體,X的取值有一定分布,為一個隨機變量。 XNFFXXXXNFXFNXXNiiNii,)(1),(221221或或2022-

4、5-8河北工程大學經(jīng)濟管理學院8 (2)總體參數(shù)總體參數(shù):B、對于屬性總體,各單位不能用數(shù)值來表示,但可以計算總體成數(shù),如前面所學P=N1/ N,Q=N0/N,P+Q=1,則總體參數(shù)有均值,標準差或方差以及具有某一屬性的單位總數(shù),即: 1、總體與總體參數(shù)PX _NPPP, )1 ( 2022-5-8河北工程大學經(jīng)濟管理學院9 2 2、樣本和樣本統(tǒng)計量樣本和樣本統(tǒng)計量 (1)樣本:)樣本:是從總體中抽出的部分單位的集合,樣本所包含的總體單位個數(shù)稱為樣本樣本容量容量,一般用,一般用n表示。表示。把n30的樣本稱為大樣本, n30的樣本稱為小樣本。對于既定總體,由于抽取樣本的方式方法不同,樣本容量可

5、大可小,樣本不確定。樣本的內(nèi)部構(gòu)成與總體內(nèi)部構(gòu)成總有一定差異,即樣本不能完全代表總體,用樣本估計總體總存在代表性誤差代表性誤差。 樣本個數(shù):樣本個數(shù):又稱樣本可能數(shù)目,它是指從一個總體中可能抽取多少個樣本。樣本個數(shù)的多少與抽樣方法有關(guān)。 2022-5-8河北工程大學經(jīng)濟管理學院10 2、樣本和樣本統(tǒng)計量 (2)樣本統(tǒng)計量:)樣本統(tǒng)計量:又稱樣本指標或估計量,它是根據(jù)樣本資料計算的、用以估計和推斷相應(yīng)總體參數(shù)的綜合指標,常用的有:)1 (),1(11)(1221221ppsnnpxssffxxxxnsfxfnxxniinii,或或2022-5-8河北工程大學經(jīng)濟管理學院11二、抽樣方法二、抽樣方

6、法 把握以下問題: 1、概率抽樣與非概率抽樣; 2、重復(fù)抽樣與不重復(fù)抽樣。2022-5-8河北工程大學經(jīng)濟管理學院12 (1)概率抽樣:又稱隨機抽樣,指按隨機原則抽取樣本。 隨機原則:就是排除主觀意愿的干擾,使總體的每一個單位都有一定的概率被抽選為樣本單位,每個單位能否入樣是隨機的。 概率抽樣的基本組織方式有:簡單隨機抽樣、分層抽樣、等距抽樣和整群抽樣。 1、概率抽樣與非概率抽樣2022-5-8河北工程大學經(jīng)濟管理學院13 1、概率抽樣與非概率抽樣 (2)概率抽樣的特點:A、避免主觀選樣帶來的傾向性誤差(系統(tǒng)偏差),使樣本資料能夠估計、推斷總體的數(shù)量特征;B、因為抽樣建立在概率和數(shù)理統(tǒng)計基礎(chǔ)上

7、,可以計算和控制抽樣誤差,能說明估計結(jié)果的可靠程度。 實際中,在不可能或不必要全面調(diào)查時,常用概率抽樣推斷總體,還可以修正或補充全面調(diào)查的結(jié)果。2022-5-8河北工程大學經(jīng)濟管理學院14 1、概率抽樣與非概率抽樣 (3)非概率抽樣:又稱非隨機抽樣,指從研究目的出發(fā),根據(jù)研究者的經(jīng)驗或判斷,從總體中有意識抽取若干個單位構(gòu)成樣本。有重點調(diào)查、典型調(diào)查、配額抽樣、方便抽樣等 。 配額抽樣:指抽選一群特定數(shù)目的滿足特定條件的被調(diào)查者的抽樣方法,這群被調(diào)查者已知對此研究主題有用,配額通常是年齡、收入、職業(yè)等,使用配額抽樣有助于降低非概率抽樣方法的偏差。 2022-5-8河北工程大學經(jīng)濟管理學院151、

8、概率抽樣與非概率抽樣 (4 4)非概率抽樣:)非概率抽樣: 適用于:了解總體大致情況,總結(jié)經(jīng)驗教訓,進行大規(guī)模調(diào)查前的試點等,有其優(yōu)越性。 缺點:受主觀影響易產(chǎn)生傾向性誤差;不能計算、控制誤差,無法說明調(diào)查結(jié)果的可靠程度。抽樣一般都是指概率抽樣。2022-5-8河北工程大學經(jīng)濟管理學院162、重復(fù)抽樣和非重復(fù)抽樣、重復(fù)抽樣和非重復(fù)抽樣(1)重復(fù)抽樣:)重復(fù)抽樣:又稱重置抽樣,是指從總體中抽出一個樣本單位,記錄其標志值后,又將其放回總體中繼續(xù)參加下一輪單位的抽取。特點是:第一,n個單位的樣本是由n次試驗的結(jié)果構(gòu)成的。第二,每次試驗是獨立的,即其試驗的結(jié)果與前次、后次的結(jié)果無關(guān)。第三,每次試驗是在

9、相同條件下進行的,每個單位在多次試驗中選中的機會(概率)是相同的。在重復(fù)試驗中,樣本可能的個數(shù)是 ,N為總體單位數(shù),n為樣本容量。nN2022-5-8河北工程大學經(jīng)濟管理學院172、重復(fù)抽樣和非重復(fù)抽樣 (2)非重復(fù)抽樣:)非重復(fù)抽樣:又稱為不重置抽樣,即每次從總體抽取一個單位,登記后不放回原總體,不參加下一輪抽樣。下一次繼續(xù)從總體中余下的單位抽取樣本。特點是:第一,n個單位的樣本由 n 次試驗結(jié)果構(gòu)成,但由于每次抽出不重復(fù),所以實質(zhì)上相當于從總體中同時抽取n個樣本單位。第二,每次試驗結(jié)果不是獨立的,上次中選情況影響下次抽選結(jié)果。第三,每個單位在多次(輪)試驗中中選的機會是不等的。不重復(fù)抽樣,

10、如果是考慮順序,其樣本可能個數(shù)為 ;如果不考慮順序,其樣本可能個數(shù)為 。)!(!nNN!)!(!nnNN2022-5-8河北工程大學經(jīng)濟管理學院18三、抽樣框 把握以下問題: 1、概念; 2、抽樣框的形式; 3、對抽樣框的要求。2022-5-8河北工程大學經(jīng)濟管理學院191、概念 抽樣框:抽樣框:指包括全部抽樣單位的名單框架。 調(diào)查目的確定后,總體隨之確定,總體又叫目標總體,即理論上的抽樣范圍,與實際抽樣的總體范圍有時不一致。此外抽樣單位可以是個總體單位,也可以是若干總體單位的集合。如某省進行農(nóng)戶收支調(diào)查,目標總體是全省所有農(nóng)戶,抽樣單位可以是每個農(nóng)戶,也可以是每個鄉(xiāng)或村。所以,有目標總體后還

11、必須明確實際進行抽樣的總體范圍和抽樣單位。2022-5-8河北工程大學經(jīng)濟管理學院202、抽樣框的形式 (1)名單抽樣框名單抽樣框:列出全部總體單位的名錄一覽表,如職工名單、企業(yè)名單等。 (2)區(qū)域抽樣框區(qū)域抽樣框:按地理位置將總體范圍劃分為若干小區(qū)域,以小區(qū)域為抽樣單位。如某市居民住房調(diào)查,將全市居民戶劃分為若干街道或片區(qū)。 (3)時間表抽樣框時間表抽樣框:將總體全部單位按時間順序排列,把總體的時間過程分為若干小的時間單位,以時間單位作為抽樣單位。如對流水線上24小時內(nèi)生產(chǎn)的產(chǎn)品進行質(zhì)量抽檢。2022-5-8河北工程大學經(jīng)濟管理學院21 3、對抽樣框的要求 (1)應(yīng)與目標總體一致,即包括全部

12、總體單位,不重不漏,否則破壞隨機原則。例如,對某市居民進行抽查,以電話號碼本為抽樣框不科學。 (2)盡可能利用與所研究變量高度相關(guān)的輔助變量的信息,設(shè)計最佳的抽樣組織方式和抽樣估計方法。2022-5-8河北工程大學經(jīng)濟管理學院22四、抽樣誤差 把握以下問題: 1、調(diào)查誤差概念及其分類; 2、實際抽樣誤差; 3、抽樣平均誤差; 4、抽樣極限誤差。2022-5-8河北工程大學經(jīng)濟管理學院231、調(diào)查誤差概念及其分類 (1)統(tǒng)計調(diào)查的誤差:指調(diào)查結(jié)果與總體真值間的差異。 (2)分為登記性誤差和代表性誤差:)分為登記性誤差和代表性誤差: A、登記性誤差:、登記性誤差:指在調(diào)查和匯總過程中由于觀察、測量

13、、登記、計算等方面的差錯或被調(diào)查者提供虛假資料造成的誤差。它是任何一種統(tǒng)計調(diào)查都可能產(chǎn)生的,可以避免。2022-5-8河北工程大學經(jīng)濟管理學院241、調(diào)查誤差概念及其分類 (2)分為登記性誤差和代表性誤差:)分為登記性誤差和代表性誤差: B、代表性誤差、代表性誤差 :指用樣本指標推斷總體指標時,由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)的不一致,樣本不能完全代表總體而產(chǎn)生的誤差。 代表性誤差又分為系統(tǒng)誤差和隨機誤差:a、系統(tǒng)誤差又稱偏差,指非隨機因素引起的樣本代表性不足產(chǎn)生的誤差,可以避免;b、隨機誤差,又稱偶然性誤差、抽樣誤差,隨機因素引起的代表性誤差,不可避免,但可以計算并加以控制。2022-5-8河北工程大

14、學經(jīng)濟管理學院252、實際抽樣誤差 (1)實際抽樣誤差指某一具體樣本的樣本估計值 與總體參數(shù) 的真實值之間的離差 。實際中,總體參數(shù) 未知,誤差無法計算。 平均數(shù)的誤差: 成數(shù)的誤差:p-P)(_Xx 2022-5-8河北工程大學經(jīng)濟管理學院262、實際抽樣誤差 (2)由于樣本隨機抽取,估計量是隨樣本不同而不同的隨機變量,所以實際抽樣誤差是隨機變量,可正可負,可大可小。就某個既定的抽樣方案,樣本估計量所有可能值有一定的分布規(guī)律,它們與總體參數(shù)的離差即抽樣誤差也有一定的規(guī)律。實際中真正計算、控制的誤差并不是該誤差。2022-5-8河北工程大學經(jīng)濟管理學院273、抽樣平均誤差(1)它是反映抽樣誤差

15、一般水平的指標。常用樣本估計量的標準差反映所有可能樣本估計量與其中心的平均離散程度,即抽樣平均數(shù)或抽樣成數(shù)的標準差,公式為:則抽樣平均數(shù)、抽樣成數(shù)的標準差分別為:可能樣本個數(shù)2)()(E可能樣本個數(shù)2_)()(xExx可能樣本個數(shù)2)()(pEpp2022-5-8河北工程大學經(jīng)濟管理學院283、抽樣平均誤差 (2)又因為 ,則上式變?yōu)?反映所有可能樣本的估計值與總體參數(shù)的平均差異程度,即抽樣平均誤差,可以衡量樣本對總體的代表性大小,它越小則統(tǒng)計量的分布就越集中在總體參數(shù)的附近。 抽樣平均數(shù)、抽樣成數(shù)的標準差變?yōu)椋?另一個概念是抽樣方差 為抽樣平均誤差的平方。)(E)1.5()()(2可能樣本個

16、數(shù)可能樣本個數(shù)2_)()(Xxx可能樣本個數(shù)2)()(Ppp)(V2022-5-8河北工程大學經(jīng)濟管理學院294、抽樣極限誤差 (1)它是指一定概率下樣本指標與總體參數(shù)間抽樣誤差的可能范圍,又稱允許誤差允許誤差。因為總體參數(shù)確定,統(tǒng)計量圍繞其左右變動,用統(tǒng)計量與總體參數(shù)之差的絕對值表示誤差的可能范圍。公式表示: 在一定概率下: 平均數(shù)、比例的抽樣極限誤差,在一定概率下,_xXxpPp2022-5-8河北工程大學經(jīng)濟管理學院304、抽樣極限誤差 (2)抽樣極限誤差是抽樣誤差的可能范圍而非完全肯定范圍,可能范圍大小與這一估計的可能性大小即概率緊密聯(lián)系,這個概率被稱為置信度置信度或或可信程度可信程度

17、、把握程度、概率保把握程度、概率保證程度證程度等等,表示為 ,其他條件不變的情況下,抽樣極限誤差越大,置信度越大。12022-5-8河北工程大學經(jīng)濟管理學院314、抽樣極限誤差 (3)相關(guān)概念: 抽樣誤差率抽樣誤差率=(抽樣極限誤差/估計量) 100%,抽樣估計精度=100%-抽樣誤差率 估計精度與置信度矛盾。其他條件不變下,提高估計置信度,增大允許誤差,使精度降低;反之,提高精度會降低置信度。實際中根據(jù)具體情況,可先確定置信度再求極限誤差或先確定極限誤差再求相應(yīng)的把握程度。2022-5-8河北工程大學經(jīng)濟管理學院32 第二節(jié)第二節(jié) 抽樣分布抽樣分布 本節(jié)只討論重復(fù)的簡單隨機抽樣,所得容量為n

18、的樣本(x1, x2 xn)稱為簡單隨機樣本,它滿足兩個條件: x1, x2 xn相互獨立;每個xi(i=1,2,n)都與總體X同分布。 把握以下問題: 一、抽樣分布的概念;一、抽樣分布的概念; 二、抽樣平均數(shù)的抽樣分布;二、抽樣平均數(shù)的抽樣分布; 三、樣本比例的抽樣分布;三、樣本比例的抽樣分布; 四、不重復(fù)抽樣的修正系數(shù)。四、不重復(fù)抽樣的修正系數(shù)。2022-5-8河北工程大學經(jīng)濟管理學院33一、抽樣分布的概念一、抽樣分布的概念 把握以下問題: 1、抽樣分布的概念; 2、尋求抽樣分布的方法。2022-5-8河北工程大學經(jīng)濟管理學院341、抽樣分布的概念 (1 1)它是指樣本統(tǒng)計量的概率分布。)

19、它是指樣本統(tǒng)計量的概率分布。每個隨機變量都有其概率分布,樣本統(tǒng)計量是隨機變量,有若干可能取值,每個取值有一定的可能性即概率,從而形成統(tǒng)計量的概率分布。 樣本統(tǒng)計量是由n個隨機變量構(gòu)成的樣本函數(shù),抽樣分布屬于隨機變量函數(shù)的分布。2022-5-8河北工程大學經(jīng)濟管理學院351、抽樣分布的概念 (2)例如,總體有N個單位,隨機抽取n個單位進行調(diào)查,可抽取 個樣本,得 個不盡相同的樣本平均數(shù),將樣本平均數(shù)全部可能取值及其出現(xiàn)的概率依序排列得到樣本平均數(shù)的概率分布即平均數(shù)的抽樣分布。同理得到比例的抽樣分布、樣本標準差的抽樣分布。對于抽樣分布,同樣可以計算其均值和方差(或標準差)等數(shù)字特征反映該分布的集中

20、、離散趨勢。nNnN2022-5-8河北工程大學經(jīng)濟管理學院36 1、抽樣分布的概念 (3)抽樣分布反映樣本統(tǒng)計量的分布特征,是抽樣推斷的重要依據(jù),根據(jù)其分布規(guī)律,可以揭示樣本指標與總體參數(shù)間的關(guān)系,估計抽樣誤差,說明抽樣推斷的可靠程度。2022-5-8河北工程大學經(jīng)濟管理學院37 2、尋求抽樣分布的方法 有精確方法精確方法和和大樣本方法大樣本方法,形成精確和漸近抽樣分布。(1)當總體分布類型已知,對任一自然數(shù)n能導出統(tǒng)計量 的分布的明顯表達式,稱為精確方法精確方法,所得分布為精確分布精確分布。當n較小時特別有用,又稱小樣本方法小樣本方法,大多是在正態(tài)總體條件正態(tài)總體條件下得到的。),(21n

21、xxx2022-5-8河北工程大學經(jīng)濟管理學院38 2、尋求抽樣分布的方法 (2)大多數(shù)場合,精確分布很難求出或表達式復(fù)雜,借助極限定理,尋求n無限增大時統(tǒng)計量的極限分布,用極限分布當作所求抽樣分布的近似,稱為大樣本方法大樣本方法,這種極限分布稱為漸近分布漸近分布。 在抽樣推斷中,許多場合下統(tǒng)計量服從正態(tài)分布或以正態(tài)分布為漸近分布,此外還有 分布、 t分布、 F分布等精確抽樣分布。2x2022-5-8河北工程大學經(jīng)濟管理學院39二、抽樣平均數(shù)的抽樣分布二、抽樣平均數(shù)的抽樣分布 把握以下問題: 1 1、總體方差已知總體方差已知時,樣本平均數(shù)時,樣本平均數(shù)的抽樣分布;的抽樣分布; 2 2、總體方差

22、未知總體方差未知時,樣本平均數(shù)時,樣本平均數(shù)的抽樣分布。的抽樣分布。2022-5-8河北工程大學經(jīng)濟管理學院40 1 1、總體方差已知時,樣本平均、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)數(shù)的抽樣分布(大樣本) (1)定理定理1:設(shè)總體 是一個簡單隨機樣本,則樣本平均數(shù) 證明:因為總體 是其一個簡單隨機樣本,所以 相互獨立且都服從 ,由概率論知,相互獨立的正態(tài)隨機變量和服從正態(tài)分布,其線性函數(shù)也服從正態(tài)分布。),(),(212nxxxNX./)(,)(),/,(2_2_nxVxEnNx),(),(212nxxxNXnxxx,21).,(2NX2022-5-8河北工程大學經(jīng)濟管理學院41

23、1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(1)定理1的證明:而且,所以, 將樣本平均數(shù)標準化,有:) 4 . 6 (1)(1)/()() 3 . 6 (1)(1)/()(222_nnnxVnnxVxVnnxEnnxExEiiii)./,(2_nNx)5 . 6)(1 , 0(/)(_NnxxxZ2022-5-8河北工程大學經(jīng)濟管理學院421、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本) (2)定理)定理2:若總體平均數(shù) 和方差 有限,當樣本容量n充分大時,無論總體形式如何,樣本平均數(shù) 近似服從正態(tài)分布 (3)由定理知,樣本平均數(shù)是以總體平均數(shù)為分布中心,且n愈大,樣本平均數(shù)的離散程

24、度愈小,抽樣誤差愈小。由此得出抽樣平均數(shù)的標準差即抽樣平均誤差的公式為: 實際計算中,總體標準差未知,可用以前的標準差代替;大樣本下,用樣本標準差代替。)./,(2nN2_x)6 . 6()()(2_nnxVx2022-5-8河北工程大學經(jīng)濟管理學院431、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本) (4)由公式(6.6)知,影響抽樣平均誤差的因素: A、總體方差或標準差,即總體各單位變量值的差異程度; B、樣本容量,容量越大,誤差越??; C、抽樣方法(重復(fù)、不重復(fù)抽樣)和抽樣組織方式(分層抽樣、等距抽樣等)。2022-5-8河北工程大學經(jīng)濟管理學院442、總體方差未知時,樣本平均數(shù)的抽樣

25、分布(小樣本) 定理定理3:設(shè)總體 是一個簡單隨機樣本,樣本均值為 ,樣本標準差為S,則統(tǒng)計量),(),(212nxxxNX_xnnnxxSntnSxt1,1)().1(/2_大樣本其中2022-5-8河北工程大學經(jīng)濟管理學院45 三、樣本比例的抽樣分布三、樣本比例的抽樣分布 把握以下問題: 1、總體比例與樣本比例; 2、樣本比例的抽樣分布。2022-5-8河北工程大學經(jīng)濟管理學院46 1、總體比例與樣本比例、總體比例與樣本比例 總體中具有某種特征的單位占全部單位的比例稱作總體比例總體比例,記做,記做P;樣本中具有此種特征的單位占全部樣本單位的比例稱作樣本比例樣本比例,記做,記做p。 實際中如

26、產(chǎn)品的合格率、某電視節(jié)目的收視率等。2022-5-8河北工程大學經(jīng)濟管理學院47 2、樣本比例的抽樣分布、樣本比例的抽樣分布 (1)X服從二項分布,且有E(X)=nP,V(X)=nP(1-P),當從總體中抽出一個容量為n的樣本時,樣本中具有某種特征的單位數(shù)x服從二項分布,即xB(n,p),因而樣本比例p=x/n也服從二項分布,且有:)10. 6)(1 (1)(1)()()9 . 6()(1)()(2PPnxVnnxVpVPxEnnxEpE2022-5-8河北工程大學經(jīng)濟管理學院48 2、樣本比例的抽樣分布 (2)根據(jù)中心極限定理,當 二項分布趨于正態(tài)分布,大樣本下,若nP、n(1-P)皆大于5

27、,樣本比例近似服從正態(tài)分布:pN(P,P(1-P)/n),則比例的抽樣平均誤差為: 實際中,用以前的總體比例或樣本比例 p 代替。,n)12. 6()1 ()()(nPPpVp2022-5-8河北工程大學經(jīng)濟管理學院49 四、不重復(fù)抽樣的修正系數(shù)四、不重復(fù)抽樣的修正系數(shù) 1、與重復(fù)抽樣比,由于樣本單位不重復(fù),樣本單位很可能在總體中更均勻的分布,從而樣本結(jié)構(gòu)更能與總體結(jié)構(gòu)近似,因此不重復(fù)抽樣所得樣本對總體的代表性更大,抽樣誤差較小。 前面所講的抽樣分布和抽樣平均誤差公式都是就重復(fù)抽樣而言。 2022-5-8河北工程大學經(jīng)濟管理學院50四、不重復(fù)抽樣的修正系數(shù) 2、不重復(fù)抽樣的抽樣平均誤差為: 其

28、中 稱為不重復(fù)抽樣的修正系數(shù),N很大時, 其他條件相同下, 不重復(fù)抽樣誤差小于重復(fù)抽樣。當N很大而n很小時,系數(shù)接近1,二者相差不大。因此,無限總體都可以用重復(fù)抽樣的平均誤差公式度量抽樣誤差;有限總體當抽樣比例很小時(一般小于5%),也常用重復(fù)抽樣公式計算。)14.6()1()1()1()1()()13.6()1()1()(22_NnnppNnNnpppNnnNnNnx1NnNNnNnN112022-5-8河北工程大學經(jīng)濟管理學院51第三節(jié)第三節(jié) 抽樣組織方式及其抽樣分布抽樣組織方式及其抽樣分布 把握以下問題: 一、簡單隨機抽樣;一、簡單隨機抽樣; 二、分層抽樣;二、分層抽樣; 三、等距抽樣;

29、三、等距抽樣; 四、整群抽樣;四、整群抽樣; 五、抽樣組織方式的選擇。五、抽樣組織方式的選擇。2022-5-8河北工程大學經(jīng)濟管理學院52一、簡單隨機抽樣一、簡單隨機抽樣 它是最基本的抽樣組織方式,常用方法有抽簽法、利用隨機數(shù)表取數(shù)法和電子計算機取數(shù)法。 它隊對總體單位不進行任何劃分或排隊,完全隨機地直接從總體中抽取樣本單位,使每個單位都有完全均等的機會被抽中,故又稱純隨機抽樣。 它只對總體單位進行編號。這樣估計的效率低,進行大規(guī)模抽樣調(diào)查時,工作不易展開。2022-5-8河北工程大學經(jīng)濟管理學院53二、分層抽樣及其抽樣估計二、分層抽樣及其抽樣估計 把握以下問題: 1、分層抽樣的概念及特點;

30、2、等比例分層抽樣方式; 3、抽樣平均誤差的計算; 4、例6-1。2022-5-8河北工程大學經(jīng)濟管理學院541、分層抽樣的概念及特點、分層抽樣的概念及特點 (1)也稱類型抽樣,它是按一定標志對總體各單位進行分類(或?qū)印⒆涌傮w),然后分別從每一類中按隨機原則抽取一定的單位構(gòu)成樣本。例如,抽樣調(diào)查一個城市居民收入分配狀況,如果歷史資料反映了該城市居民的貧富結(jié)構(gòu):高收入者、中等收入者與低收入者的比例結(jié)構(gòu),我們可以按此結(jié)構(gòu)分類分別從高收入者、中等收入者與低收入者中按一定的比例抽取樣本。2022-5-8河北工程大學經(jīng)濟管理學院551、分層抽樣的概念及特點、分層抽樣的概念及特點 (2)特點:類型抽樣是統(tǒng)

31、計分組與抽樣原理的結(jié)合,可以提高樣本的代表性;不僅可以用樣本推斷總體,還可以推斷子總體指標。 前提是對總體的結(jié)構(gòu)有著一定的了解,為了充分利用這些信息,提高估計的精確性,對總體按確定標志進行分類,保證抽出的樣本與總體盡可能保持相似的結(jié)構(gòu)。2022-5-8河北工程大學經(jīng)濟管理學院56 2、等比例分層抽樣方式、等比例分層抽樣方式 分層抽樣可分為等比例和不等比例分層抽樣,實際中采用等比例分層抽樣。 (1)設(shè)總體由N個單位組成,按對總體的認識,把總體分為k組,使得: 然后相應(yīng)從各組中分別按隨機方式抽出個單位組成樣本。設(shè)樣本容量為n,它滿足:kNNNN21knnnn212022-5-8河北工程大學經(jīng)濟管理

32、學院57 2、等比例分層抽樣方式、等比例分層抽樣方式 (2)比例抽樣方式就是從每一類 抽取 時要求兩者間保持合適的比例,也就是保持各組樣本單位數(shù)與總體同組單位數(shù)之比,等于樣本容量與總體單位數(shù)之比,即 所以各組的樣本單位數(shù)應(yīng)為: NnNnNn2211NnNnii), 2 , 1(ki2022-5-8河北工程大學經(jīng)濟管理學院583、抽樣平均誤差的計算和區(qū)間估計、抽樣平均誤差的計算和區(qū)間估計 (1)步驟:設(shè)樣本是: 樣本抽出來后: 第一步:計算各組平均數(shù) 第二步:將各組平均數(shù)以各組單位數(shù)或各樣本組單位數(shù)為權(quán)數(shù),進行加權(quán)平均,求出樣本平均數(shù)1,21knkkxxx111211,nxxx,ijijinxx

33、), 2 , 1(kinxnNxNxiiii2022-5-8河北工程大學經(jīng)濟管理學院593、抽樣平均誤差的計算和區(qū)間估計、抽樣平均誤差的計算和區(qū)間估計 (1)步驟:第三步:計算分層抽樣的抽樣平均誤差,第i組的組內(nèi)標準差為 第i組 的抽樣平均誤差為: 即為 的方差 ,表示從第i組中抽樣計算平均數(shù)的方差 ,樣本平均數(shù) 的方差為 ,樣本平均數(shù)的抽樣平均誤差為 記 表示組(層)內(nèi)方差平均數(shù)。iiiinxx2ixiixniix2ixx2222nnixixnnnnnnnxiiiiiixx222222_1)(_或nniii22x2022-5-8河北工程大學經(jīng)濟管理學院60 3、抽樣平均誤差的計算和區(qū)間估計、

34、抽樣平均誤差的計算和區(qū)間估計 (1)步驟: 同樣可計算在不重復(fù)抽樣條件下的抽樣平均誤差為: Nnnix122022-5-8河北工程大學經(jīng)濟管理學院61 3、抽樣平均誤差的計算、抽樣平均誤差的計算 (2)分析:在分組下,總方差=組內(nèi)方差平均數(shù)+組間方差,通過比較,分層抽樣的抽樣平均誤差小于簡單隨機抽樣的抽樣誤差。 對于給定的總體,總體方差一定,劃分層時應(yīng)盡量增大層間差異,縮小層內(nèi)差異。因為層內(nèi)差異越小。分層抽樣的抽樣平均誤差越小,參數(shù)估計的效率越高。2022-5-8河北工程大學經(jīng)濟管理學院62例6-1 某地區(qū)對居民在一年內(nèi)用于某類消費的支出進行等比例分層抽樣,結(jié)果見表,要求計算該地區(qū)平均每戶支出

35、的抽樣平均誤差和抽樣極限誤差。 調(diào)查戶數(shù)平均支出(元) 方差 城鎮(zhèn) 40 350 2209 農(nóng)村 80 260 29162022-5-8河北工程大學經(jīng)濟管理學院634、例6-1 解:樣本平均數(shù)是: 層內(nèi)方差平均數(shù): 抽樣平均誤差: 抽樣極限誤差:元)(29080402608035040nxnxii33.2680804029168022094022nnii元)(726.412033.2680)(2_nx元)(452. 9726. 42)(_2_xzx2022-5-8河北工程大學經(jīng)濟管理學院64三、等距抽樣三、等距抽樣 把握以下問題: 1、等距抽樣的概念和特點; 2、無關(guān)標志排隊等距抽樣; 3、有

36、關(guān)標志排隊等距抽樣。2022-5-8河北工程大學經(jīng)濟管理學院65 1、等距抽樣的概念和特點 (1)又稱機械抽樣或系統(tǒng)抽樣,它是將總體各單位按某一標志進行排隊,計算出抽樣間隔,并在第一個抽樣間隔內(nèi)確定一個抽樣起點,再按固定的順序和間隔來抽取樣本單位的抽樣組織形式。 根據(jù)需要抽取的樣本單位數(shù)n和總體的單位數(shù)N,可以計算出等距抽樣的間隔大?。?K=N/n ,再從第一至第K個單位的范圍內(nèi)確定抽樣起點,之后每隔K個單位抽取一個樣本單位。2022-5-8河北工程大學經(jīng)濟管理學院66 1、等距抽樣的概念和特點 (2)優(yōu)越性:提高樣本單位分布的均勻性,樣本代表性強,一般工作易開展,實際應(yīng)用廣泛。 但等距抽樣在

37、排隊后,抽樣起點一確定,整個樣本就確定了。其隨機性體現(xiàn)在排隊和抽樣起點的確定上。 按排隊標志與調(diào)查內(nèi)容的關(guān)系,等距抽樣分為無關(guān)標志、有關(guān)標志排隊等距抽樣,二者抽樣起點確定方式、抽樣效果不同。2022-5-8河北工程大學經(jīng)濟管理學院67 2、無關(guān)標志排隊等距抽樣 (1)它是指等距抽樣據(jù)以排隊的標志與調(diào)查內(nèi)容沒有直接關(guān)系。例如,城市居民家計調(diào)查時,將居民按其居住的街道門牌號碼排隊;產(chǎn)品質(zhì)量檢查按產(chǎn)品生產(chǎn)的時間先后順序排隊,每個一定時間或每生產(chǎn)一定數(shù)量的產(chǎn)品抽取一單位產(chǎn)品。2022-5-8河北工程大學經(jīng)濟管理學院682、無關(guān)標志排隊等距抽樣(2)抽樣起點的確定:從所要調(diào)查的標志看,總體單位的排序仍是

38、隨機的,抽樣起點r可以隨機確定,即1r K,遵循隨機原則,避免系統(tǒng)偏差。(3)無關(guān)標志排隊等距抽樣的效果接近于簡單隨機抽樣的效果,其抽樣誤差通常按簡單隨機抽樣的抽樣誤差公式近似計算。2022-5-8河北工程大學經(jīng)濟管理學院69 3、有關(guān)標志排隊等距抽樣 (1)它是指排隊標志與調(diào)查內(nèi)容有關(guān),例如職工家計調(diào)查按職工工資水平排隊。 (2)在排隊后,從所調(diào)查變量看,總體單位也大致呈順序排列,其抽樣起點不宜隨機確定。否則,若第一個間隔內(nèi)隨機抽取一個標志值較?。ɑ虼螅┑膯挝蛔髌瘘c,整個樣本會出現(xiàn)偏低(或高)的系統(tǒng)偏差。2022-5-8河北工程大學經(jīng)濟管理學院703、有關(guān)標志排隊等距抽樣 (3)半距起點等距

39、抽樣(中心系統(tǒng)抽樣):以第一個抽樣距離的一半為抽樣起點(r=k/2)并每間隔k個單位抽一個單位。這樣樣本單位是處于每個抽樣距離(組)中點的總體單位。因單位變量值大致呈順序排列,所以這些單位變量值能代表所在間距內(nèi)的一般水平,由此樣本代表性較高。但這種取樣限制抽樣的隨機性,且只能抽取出一個樣本。2022-5-8河北工程大學經(jīng)濟管理學院71 3、有關(guān)標志排隊等距抽樣 (4)對稱等距抽樣:在第一個間距內(nèi)隨機確定起點r( 1r k),然后以組界k,2k,(n-1)k為對稱點兩兩對稱地抽取樣本單位,看書上圖,知第一組內(nèi)r偏小,但第二組內(nèi)樣本單位(2k-r)偏大;反之,第二組內(nèi)r偏大,則第二個樣本單位偏小,

40、這樣整體看,樣本有較好的代表性,又保證抽樣的隨機性,根據(jù)排隊結(jié)果可以抽出k個樣本2022-5-8河北工程大學經(jīng)濟管理學院723、有關(guān)標志排隊等距抽樣 (5)有關(guān)標志排隊等距抽樣相當于分層較多(將總體分為同等大小的n個層)而每層只抽取一個調(diào)查單位的分層抽樣,所以抽樣效果類似于分層抽樣,抽樣誤差一般按分層抽樣的誤差公式近似計算。2022-5-8河北工程大學經(jīng)濟管理學院73四、整群抽樣四、整群抽樣 把握以下問題: 1、整群抽樣的概念和特點; 2、整群抽樣的抽樣平均誤差; 3、例6-2。2022-5-8河北工程大學經(jīng)濟管理學院74 1、整群抽樣的概念和特點、整群抽樣的概念和特點 (1)整群抽樣又稱集團

41、抽樣,就是將總體各單位分成若干群,然后從其中隨機抽取部分群,對中選的群進行全面調(diào)查的抽樣組織方式。例如居民家計調(diào)查,以一個鄉(xiāng)(或街道)的所有住戶或所有人口為一群,對抽中的鄉(xiāng)或街道的住戶或人口進行全面調(diào)查。2022-5-8河北工程大學經(jīng)濟管理學院75 1、整群抽樣的概念和特點 (2)這種方式是整群的抽取樣本單位,只需對各群編號,簡化工作,抽樣單位集中,便于集中調(diào)查,簡單方便又節(jié)省人力、物力、財力和時間,應(yīng)用廣泛。 但抽樣單位集中,抽樣單位在總體中分布不夠均勻。在其他條件相同下,其樣本代表性可能較差,要適當多抽一些樣本單位。2022-5-876 2、整群抽樣的抽樣平均誤差 (1)整群抽樣的代表性取

42、決于抽中群之間的差異,差異大,代表性差。因此其誤差與群間差異有關(guān),與群內(nèi)差異無關(guān)。 (2)設(shè)總體的全部N個單位被劃分為R群,每群含有M個單位。現(xiàn)在從總體R群中隨機抽出r群組成樣本,對中選的群中的所有單位進行全面調(diào)查。群的平均數(shù)是: 樣本均值是:MxxMjiji1ri,2,1rxrMxxriiriMjij1112022-5-8河北工程大學經(jīng)濟管理學院77 2、整群抽樣的抽樣平均誤差 (2)從上式可以看出,整群抽樣實質(zhì)上是以群代替總體單位,以群平均數(shù)代替總體單位標志值之后的簡單隨機抽樣。群間方差是: 或者由樣本數(shù)據(jù)估計: 因此,樣本平均數(shù)的抽樣平均誤差是: 上式中出現(xiàn)修正系數(shù) ,這是因為整群抽樣都采用不重復(fù)抽樣。RXXiB22122rxxSiB)1 (1)(22_RrrRrRrxBB1RrR2022-5-8河北工程大學經(jīng)濟管理學院782、整群抽樣的抽樣平均誤差(3)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論