第三章 簡單隨機(jī)抽樣.ppt_第1頁
第三章 簡單隨機(jī)抽樣.ppt_第2頁
第三章 簡單隨機(jī)抽樣.ppt_第3頁
第三章 簡單隨機(jī)抽樣.ppt_第4頁
第三章 簡單隨機(jī)抽樣.ppt_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三章 簡單隨機(jī)抽樣,本章教學(xué)目的與要求,簡單隨機(jī)抽樣是抽樣中最基本、最成熟、最簡單的抽樣設(shè)計方式,是所有概率抽樣方法發(fā)展、比較的基礎(chǔ)。具體要求: 通過學(xué)習(xí),熟練掌握簡單隨機(jī)抽樣的抽樣方式和樣本抽選方法; 熟知總體均值、總體總值和總體比例的簡單估計; 掌握樣本量的確定; 了解子總體的估計。,第一節(jié) 抽樣方式,簡單隨機(jī)抽樣(simple random sampling):也稱純隨機(jī)抽樣。對于大小為N的總體,抽取樣本量為n的樣本,若全部可能的樣本被抽中的概率都相等,則稱這樣的抽樣為簡單隨機(jī)抽樣。 可以分為放回和不放回抽樣。,(一)放回簡單隨機(jī)抽樣,放回抽樣也稱重復(fù)抽樣。做法是每次從總體中隨機(jī)抽取一

2、個樣本單位,經(jīng)調(diào)查觀測后,將該單位重新放回總體,然后再在總體中隨機(jī)抽取下一個單位進(jìn)行調(diào)查觀測,依次重復(fù)這樣的步驟,直到從總體中隨機(jī)抽夠n個樣本單位為止。 可能的樣本為 ( 考慮順序) 或 放回抽樣的特點(diǎn):同一個單位有可能在同一個樣本中重復(fù)出現(xiàn)。,(一)放回簡單隨機(jī)抽樣,設(shè)總體有個單位(1,2,3,4,5),按放回簡單隨機(jī)抽樣的方式抽取2個單位,若考慮樣本單位的順序,則所有的可能樣本為25個,若不考慮樣本單位的順序,則所有可能樣本為15個。 不考慮順序的放回簡單隨機(jī)抽樣的估計量方差大于或等于考慮順序時的估計量的方差。只討論和使用考慮順序的情形。,(二)不放回簡單隨機(jī)抽樣,不放回也稱不重復(fù)抽樣,每

3、次從總體中隨機(jī)抽取一個樣本單位,經(jīng)調(diào)查觀測后,不再將該單位放回總體參加下一次抽樣,然后再在剩下的總體單位中隨機(jī)抽取下一個樣本單位進(jìn)行調(diào)查觀測,直到抽夠n個樣本單位為止。 考慮順序可能的樣本為 每個樣本被抽中的概率為,(二)不放回簡單隨機(jī)抽樣,不考慮樣本單位順序,可能的樣本為 個。 每個樣本被抽中的概率為 雖然樣本個數(shù)不同,但有同樣的概率分布。,(二)不放回簡單隨機(jī)抽樣,設(shè)總體有5個單位(1,2,3,4,5),按不放回簡單隨機(jī)抽樣的方式抽取2個單位,若考慮樣本單位的順序,則所有可能樣本20個。若不考慮樣本單位的順序,所有可能樣本為10個。二者概率分布相同,不考慮順序的工作量小,所以對于不放回抽樣

4、,只討論不考慮順序的不放回抽樣。,(三)不放回和放回簡單隨機(jī)抽樣的比較,每次抽樣面對的總體結(jié)構(gòu)不同。放回抽樣總體結(jié)構(gòu)不變,每次抽取相互獨(dú)立,不放回抽樣總體結(jié)構(gòu)改變,每次抽取不相互獨(dú)立,前者的數(shù)學(xué)處理簡單。 樣本提供的信息量不同。不放回抽樣信息量更大,抽樣效率高。 樣本單位數(shù)量限制不同。 一般采用不考慮順序的不放回簡單隨機(jī)抽樣。,二、簡單隨機(jī)樣本的抽選方法,抽簽法:材質(zhì)相同N個簽,一次抽n,或者一次抽1個直到抽夠n. 隨機(jī)數(shù)表法 隨機(jī)數(shù)色子 搖獎機(jī) 計算機(jī)產(chǎn)生,三、簡單隨機(jī)抽樣的地位與局限,抽樣技術(shù)的重要理論基礎(chǔ)。 當(dāng)很大時,編制抽樣框困難;有輔助信息不加利用,統(tǒng)計效率低下;樣本分布廣泛時,抽樣

5、費(fèi)時費(fèi)力;可能得到差的樣本。,第二節(jié) 總體均值與總體總值的估計,一、總體均值的簡單估計 (一)簡單估計量 樣本均值是總體均值的簡單估計量。 (二)無偏性 總體中每個特定的單位出現(xiàn)在全部可能樣本中的次數(shù)都相等是 每一單位入樣概率 總體中任意兩個單位出現(xiàn)在全部可能樣本中的次數(shù)都相等是 每一單位入樣概率,對稱性論證法 (三)簡單估計量的方差 (四)簡單估計量方差的無偏性 簡單隨機(jī)樣本的方差是總體方差的無偏估計。 是的無偏估計。,(五)放回簡單隨機(jī)抽樣的簡單估計,樣本方差是無限總體方差的無偏估計量。 考慮順序的放回簡單隨機(jī)抽樣方差的無偏估計是 放回不放回,為調(diào)查某校大學(xué)生的電信消費(fèi)水平,在全校1523

6、0名學(xué)生用簡單隨機(jī)抽樣抽取n=36名學(xué)生,調(diào)查上月電信支出數(shù)據(jù)。試以95%的置信度估計該校大學(xué)生該月電信消費(fèi)的平均支出額。,對該校大學(xué)生某月電信消費(fèi)人均支出額的估計為53.64元,在置信度95%下,臨界值1.96,可以說以95%的把握說明該校大學(xué)生該月的人均支出在53.64+(-)1.96*6.1355,即41.6165.67元。,總體總值 總體總值的簡單估計量 總體總值估計量的性質(zhì)由總體均值估計量的性質(zhì)決定。簡單隨機(jī)抽樣的 是 的無偏估計量。 方差 無偏估計為,二、總體總值的簡單估計,第三節(jié) 總體比例的簡單估計,一、總體比例 總體中具有某種屬性的單位占總體單位的比例或具有某種屬性單位的總個數(shù)

7、,也稱成數(shù)。 設(shè)總體有N個單位,具有某種屬性的單位N1個,不具有該屬性的單位有N-N1個。,二、總體比例的簡單估計量及性質(zhì),(一)簡單估計量的定義 利用簡單隨機(jī)抽樣抽取n個單位組成樣本,其中n1個單位具有某種屬性,則樣本比例是總體比例的簡單估計量。 是總體中具有某種屬性單位的總個數(shù) 的簡單估計量。,(二)估計量性質(zhì),p是P的無偏估計量。 p的方差 V(p)的無偏估計量是v(p),當(dāng)N,n,N-n都比較大時,以正態(tài)分布給出P及N1的近似置信區(qū)間(置信度1-a)為,正態(tài)近似產(chǎn)生的誤差主要與nP有關(guān),特別當(dāng)nP比較小時,產(chǎn)生的誤差甚大,在95%置信度下,P0.5時正態(tài)分布需要的最小nP值與n值如下表

8、。,試以95%的置信度估計上例大學(xué)生月電信消費(fèi)超過80元的人數(shù)及其比例。,第四節(jié) 樣本量的確定,一、確定樣本量主要考慮因素 樣本量過大,容易產(chǎn)生非抽樣誤差,樣本量過小,產(chǎn)生抽樣誤差。 因素一:對抽樣估計量精度的要求。精度要求高,即要求抽樣誤差小,則必須樣本量大??傮w單位調(diào)查標(biāo)志的變異程度、總體的大小、樣本設(shè)計和所使用的估計量、回答率等都是影響估計精度的因素。,一、確定樣本量主要考慮因素,因素二:實際調(diào)查運(yùn)作的機(jī)制。調(diào)查經(jīng)費(fèi)能支持多大樣本?允許調(diào)查持續(xù)的時間多久?需要多少調(diào)查人員?多種約束條件。 能夠量化的因素只有抽樣精度和調(diào)查費(fèi)用。 方案:總費(fèi)用一定的條件下精度最高;或者在滿足一定精度要求的條

9、件下使費(fèi)用最小。,費(fèi)用公式:,達(dá)到要求精度,就是控制抽樣誤差,估計量的標(biāo)準(zhǔn)差或變異系數(shù)都是n的函數(shù),只要給定對精度的要求,就可以求出最低樣本量要求。,二、估計總體均值(總值)的樣本量確定,總體總值是總體均值N倍,N是常數(shù),對樣本量的確定不起決定作用,只須估計總體均值的情形。,無限總體或放回抽樣情況下,n0為所確定的樣本量。 不放回情況下,若總體單位N很大, n0/Nn,在同樣精度要求下,放回比不放回需要的樣本量大。,利用絕對允許誤差,相對允許誤差和變異系數(shù)公式變形估計樣本量上限。,復(fù)雜的抽樣設(shè)計方法,樣本量估計公式也復(fù)雜。在同樣精度要求下,先獲取簡單隨機(jī)抽樣的樣本量n,計算復(fù)雜抽樣設(shè)計的效果D

10、eff,再間接推算復(fù)雜設(shè)計方法需要的樣本量n,有n=n*Deff.,前面大學(xué)生通信費(fèi)消費(fèi)調(diào)查例子中,要求以95%的置信度估計該校大學(xué)生該月人均電信消費(fèi)支出的絕對允許誤差不超過5元,樣本量為多少? 解:,三、估計總體比例的樣本量確定,如果要求以95%的置信度估計該校大學(xué)生月電信消費(fèi)支出超過80元的人數(shù)比例的相對允許誤差不超過10%,樣本量多少?,四、逆抽樣法(適于調(diào)查稀有事件),現(xiàn)實中有的情況,總體中具有所考慮屬性的單位數(shù)很少,即P很小,利用之前公式計算困難,并且調(diào)查者難以估計P的大致范圍,由于n0和P成反比,不同的P估計的樣本量懸殊。 逆抽樣法:根據(jù)調(diào)查精度的要求,事先確定其樣本中含有稀有事件

11、的個數(shù)m,然后一個一個地隨機(jī)抽取樣本,直到樣本中含有m個稀有事件為止。此時樣本量n是一個隨機(jī)變量。,假設(shè)稀有事件數(shù)占總體的比例為P,樣本量服從Pascal分布: 第n次抽樣恰好抽到第m個具有所考察屬性的單位這一事件,必須是前n-1次抽樣中抽到m-1個這樣的單位的事件已經(jīng)發(fā)生,而在第n次抽樣時又恰好抽到具有這種屬性的單位,前者的概率是二項分布,后者概率恰為P,第五節(jié) 子總體估計,一、問題提出 有時總體按照某個屬性可以分為若干個組成部分。例如,總體單位按所屬的地域不同劃分,企業(yè)按所有制性質(zhì)、行業(yè)以及規(guī)模不同劃分,人口按性別、年齡、民族等劃分。 把總體中具有某種共同屬性特征的單位的集合稱為子總體。,

12、對子總體的估計方法,若每個子總體在編制抽樣框時可以區(qū)分開,可以采用分層抽樣方法進(jìn)行估計 若事先不能將各個子總體區(qū)分開,但事先知道各個子總體的單位數(shù)Nj,可以采用事后分層的方法進(jìn)行估計 若既不能事先將各個子總體區(qū)分開來,又無法事先知道各子總體的單位數(shù)Nj,則屬于這一節(jié)討論的特殊子總體估計問題。,子總體均值的估計,設(shè)總體單位數(shù)為N,假設(shè)屬于第j個子總體的單位數(shù)為Nj,單位標(biāo)志值 ,從總體中抽取一個樣本量為n的簡單隨機(jī)樣本,記樣本中屬于第j個子總體的單位數(shù)為nj,其相應(yīng)的標(biāo)志值為 ,nj隨樣本的不同而變化。在nj固定的條件下,可以證明這nj個單位可以看成是從大小為Nj的子總體中抽取的一個簡單隨機(jī)樣本

13、。,子總體總值的估計,對總體每個單位定義新的指標(biāo)值為,例:為了估計個體餐飲業(yè)經(jīng)營戶的納稅情況,某市地稅局從全部15800戶個體經(jīng)營戶中利用簡單隨機(jī)抽樣的方法隨機(jī)抽取800戶,對其中從事餐飲業(yè)的375戶年納稅情況作調(diào)查,戶均年納稅額為4376元,年納稅標(biāo)準(zhǔn)差755元,試估計全部餐飲業(yè)個體經(jīng)營戶的全年納稅額,并估計其標(biāo)準(zhǔn)差和變異系數(shù)。,練習(xí)題,1判斷一下抽取方式是否為等概率抽樣。 (1)總體(1120),抽法:從數(shù)160中隨機(jī)抽取一個數(shù)r,再從數(shù)4和5中抽取一個數(shù),如果抽中4則取該數(shù)為r,如果抽中5則取該數(shù)為60+r (2)總體(1120),抽法:從1和2中抽取一個數(shù)以決定兩個群195和96120

14、,再從抽中的群中隨機(jī)地抽取一個數(shù)r. (3)總體(019),抽法:在1100中隨機(jī)抽選r,再除以20,如果余數(shù)為019,則抽中相應(yīng)的余數(shù),否則不取。 (4)總體(119),抽法:在1100中隨機(jī)抽選一個數(shù)除以19,以余數(shù)為抽中的數(shù)。,2設(shè)總體N=4,其指標(biāo)值2,5,6,9, (1)計算總體總值,總體方差。 (2)給出n=2的全部不放回簡單隨機(jī)樣本,并驗證 3為調(diào)查某中學(xué)學(xué)生的每月購書支出水平,在全校N=1750名學(xué)生中,用不放回簡單隨機(jī)抽樣方法抽得一個n=30的樣本,對每個抽中的學(xué)生調(diào)查其上個月購書支出金額如下表。 (1)在95%的置信度下估計該校學(xué)生該月平均購書支出額。 (2)估計該校學(xué)生購書支出超出70元的人數(shù)。 ()如果要求相對誤差不超過,以的置信度估計購書支出超過元

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論