統(tǒng)計(jì)學(xué)原理第五章 抽樣調(diào)查與參數(shù)估計(jì)_第1頁
統(tǒng)計(jì)學(xué)原理第五章 抽樣調(diào)查與參數(shù)估計(jì)_第2頁
統(tǒng)計(jì)學(xué)原理第五章 抽樣調(diào)查與參數(shù)估計(jì)_第3頁
統(tǒng)計(jì)學(xué)原理第五章 抽樣調(diào)查與參數(shù)估計(jì)_第4頁
統(tǒng)計(jì)學(xué)原理第五章 抽樣調(diào)查與參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第五章 抽樣調(diào)查與參數(shù)估計(jì)PowerPoint統(tǒng)計(jì)學(xué)1主要內(nèi)容抽樣調(diào)查與抽樣組織形式參數(shù)估計(jì)的基本原理一個(gè)總體參數(shù)的區(qū)間估計(jì)樣本容量的確定2參數(shù)估計(jì)在統(tǒng)計(jì)方法中的地位方差分析統(tǒng)計(jì)方法描述統(tǒng)計(jì)回歸分析參數(shù)估計(jì)假設(shè)檢驗(yàn)推斷統(tǒng)計(jì)3第一節(jié) 抽樣調(diào)查與抽樣組織形式4一、抽樣調(diào)查的特點(diǎn)1.按隨機(jī)原則抽取樣本2.可以用樣本資料推斷總體數(shù)量特征3.推斷結(jié)果必然產(chǎn)生抽樣誤差,但可以估計(jì)并進(jìn)行控制。5抽樣調(diào)查的作用與優(yōu)點(diǎn)1.對于一些不可能、不必要進(jìn)行全面調(diào)查的現(xiàn)象進(jìn)行調(diào)查2.對全面調(diào)查的資料進(jìn)行補(bǔ)充和修正3.具有很強(qiáng)的經(jīng)濟(jì)性、時(shí)效性、準(zhǔn)確性、靈活性6二、基本概念(一)總體與樣本總體:研究事物的全體,是由若干的個(gè)體

2、即總體單位組成。樣本:從總體中隨機(jī)抽取的一些個(gè)體組成的集合。大樣本、小樣本(二)參數(shù)與統(tǒng)計(jì)量參數(shù):描述總體特征的指標(biāo);常數(shù),通常未知,需要用樣本數(shù)據(jù)進(jìn)行估計(jì)統(tǒng)計(jì)量:樣本指標(biāo);不確定的、非唯一的;是隨機(jī)變量。7常見的參數(shù)與統(tǒng)計(jì)量指標(biāo)名稱總體參數(shù)樣本統(tǒng)計(jì)量均值比例方差8(三)抽樣框抽樣框:有關(guān)總體全部單位的名錄實(shí)施抽樣的基礎(chǔ)(四)重復(fù)抽樣與不重復(fù)抽樣9抽樣調(diào)查的工作步驟1.設(shè)計(jì)調(diào)查方案(如何抽、抽多少)2.抽取樣本3.調(diào)查(搜集資料)4.計(jì)算統(tǒng)計(jì)量5.推斷總體數(shù)量特征或方差分析、假設(shè)檢驗(yàn)10三、抽樣的組織形式(一) 簡單隨機(jī)抽樣(二)分層(類)抽樣(三)系統(tǒng)抽樣(機(jī)械抽樣)(四)整群抽樣(五)多階

3、段抽樣11第二節(jié) 抽樣分布一、分布總體分布樣本分布抽樣分布二、抽樣誤差12重復(fù)抽取容量為n 的樣本時(shí),統(tǒng)計(jì)量所有可能的取值形成的相對頻數(shù)分布稱為抽樣分布。抽樣分布實(shí)際上是一種理論分布。抽樣分布提供了樣本統(tǒng)計(jì)量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ)和重要依據(jù)。抽樣分布13【例】設(shè)一個(gè)由4個(gè)同學(xué)組成的統(tǒng)計(jì)總體,他們的某科成績分別為:60、70、80、90分。該總體月薪的均值、方差及分布如下總體分布0.1.2.3均值(平均分?jǐn)?shù))方差6080907014從4個(gè)人中隨機(jī)抽取2人(重復(fù)抽樣、考慮順序),可能的樣本有12個(gè),其樣本的平均數(shù)如下表。15樣本樣本中的單位樣本均值12345678910111213

4、14151660,6060,7060,8060,9070,6070,7070,8070,9080,6080,7080,8080,9090,6090,7090,8090,906065707565707580707580857580859016樣本均值樣本個(gè)數(shù)相對頻數(shù)(%)6065707580859012343216.2512.518.7525.0018.7512.56.25合計(jì)1610.00樣本均值的抽樣分布 171819結(jié)論1.如果總體服從正態(tài)分布,樣本均值均服從正態(tài)分布。 2.如果總體為非正態(tài)分布,若樣本容量充分大,樣本均值近似服從正態(tài)分布; 3.如果總體為正態(tài)分布,樣本容量比較小,則樣本均

5、值進(jìn)行標(biāo)準(zhǔn)化以后的隨機(jī)變量服從自由度為n-1的t分布。4.當(dāng)樣本容量足夠大時(shí),樣本比例近似服從正態(tài)分布, 20二、抽樣平均誤差樣本指標(biāo)的標(biāo)準(zhǔn)差稱為抽樣平均誤差它反映了所有可能樣本的估計(jì)值與總體參數(shù)的平均差異程度。實(shí)際中不可能用上面的公式計(jì)算計(jì)算公式為:21(一)樣本均值的抽樣平均誤差22(二)樣本比例的抽樣平均誤差23若總體標(biāo)準(zhǔn)差 、總體比例P未知,則:1.用總體過去的、 P;2.用樣本的標(biāo)準(zhǔn)差和比例,即s、p;24第三節(jié) 參數(shù)估計(jì)25一、 估計(jì)量及其評價(jià)標(biāo)準(zhǔn)用來估計(jì)總體參數(shù)的統(tǒng)計(jì)量稱為估計(jì)量評價(jià)估計(jì)量的標(biāo)準(zhǔn) :1.無偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù) 2.有效性:估計(jì)量的方差越小,則

6、估計(jì)就越有效 3.一致性:指隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)總體的參數(shù) 26二、參數(shù)估計(jì)的方法點(diǎn)估計(jì)區(qū)間估計(jì)27三、對一個(gè)總體參數(shù)的區(qū)間估計(jì)(一)總體均值的區(qū)間估計(jì) 大樣本 :在1-置信水平下的置信區(qū)間 要點(diǎn):樣本均值、抽樣平均誤差、Z值例:75頁28正態(tài)分布置信水平F(Z) Z值95.45% 229【例5-4 】某學(xué)校對教職工繳納個(gè)人所得稅的情況進(jìn)行了調(diào)查。全校教職工總?cè)藬?shù)為2000人,采用重復(fù)抽樣的方法隨機(jī)抽取了50人,樣本資料如下: 875 630 345 210 670 231 78 309 189 77 123 99 167 198 890 276 89 438 112

7、 試以95%的置信水平估計(jì)該校教職工人均繳納所得稅的置信區(qū)間。30解:1.樣本均值 =(875+630+345+73)2.樣本標(biāo)準(zhǔn)差3.抽樣平均誤差4.該校教職工人均交納個(gè)人所得稅的置信區(qū)間為:即元到元 31(二)總體比例的區(qū)間估計(jì)大樣本 :在1-置信水平下的置信區(qū)間32【例5-6】某電視臺(tái)委托調(diào)查公司調(diào)查一個(gè)電視談話節(jié)目的收視率,調(diào)查公司隨機(jī)調(diào)查了200戶家庭,結(jié)果有44戶家庭經(jīng)常收看該節(jié)目。試以90%的置信水平估計(jì)該節(jié)目收視率的置信區(qū)間。解:樣本收視率p=44/200=22%, 置信水平90%,則抽樣平均誤差則該節(jié)目收視率在90%的置信水平下的置信區(qū)間為: (,),即17.2%到26.8%

8、之間 33【例】隨機(jī)抽取100件產(chǎn)品對某批電子元件進(jìn)行耐用性能檢查,樣本數(shù)據(jù)如下。要求耐用時(shí)數(shù)的允許誤差范圍為小時(shí),試對這批元件的平均耐用時(shí)數(shù)進(jìn)行區(qū)間估計(jì)。耐用時(shí)數(shù)(小時(shí))元件數(shù)900以下1900-9502950-100061000-1050351050-1100431100-115091150-120031200以上1合計(jì)100要求:1.試對這批元件的平均耐用時(shí)數(shù)進(jìn)行區(qū)間估計(jì),耐用時(shí)數(shù)的允許誤差范圍為小時(shí),2.試對這批產(chǎn)品的合格率進(jìn)行區(qū)間估計(jì),要求合格率的允許誤差范圍不超過5%,。34極限誤差(允許誤差、誤差范圍)抽樣極限誤差是指一定概率下總體指標(biāo)與樣本指標(biāo)相差的最大可能范圍,也稱為允許誤差

9、。用 表示,在 一定的情況下,Z值越大,越大,總體指標(biāo)與樣本指標(biāo)相差范圍越大,這時(shí)概率也隨之增大;反之亦然。抽樣極限誤差是可能范圍而非完全肯定的范圍,它與概率緊密聯(lián)系。351.對這批元件的平均耐用時(shí)數(shù)進(jìn)行區(qū)間估計(jì)解:(1)計(jì)算樣本統(tǒng)計(jì)量(2)計(jì)算置信上限、下限:根據(jù)可作出估計(jì):這批元件的平均耐用時(shí)數(shù)在1045到1066小時(shí)之間,其置信水平為95.45%。362.對這批元件的合格率進(jìn)行區(qū)間估計(jì)解:.計(jì)算樣本統(tǒng)計(jì)量.計(jì)算置信上限、下限:根據(jù)查正態(tài)分布表得置信水平為92%;估計(jì)結(jié)論:這批產(chǎn)品的合格率在86%到96%之間,其置信水平為92%。37第五節(jié) 樣本容量的確定一、必要樣本容量及其影響因素 二、

10、必要樣本容量的計(jì)算 三、應(yīng)注意的問題38必要樣本容量:?39一、必要樣本容量的影響因素1.總體各單位標(biāo)志值變異程度的大小:2.抽樣誤差范圍:3.置信程度:Z4.抽樣的方法:重復(fù)與不重復(fù)5.抽樣的組織形式:純隨機(jī)、等距、分類等 40二、必要樣本容量的計(jì)算41調(diào)查均值時(shí)的計(jì)算公式由得由得重復(fù)抽樣不重復(fù)抽樣42調(diào)查比例時(shí)的計(jì)算公式由得由得重復(fù)抽樣不重復(fù)抽樣43【例5-10】某省要調(diào)查從事某種行業(yè)農(nóng)村勞動(dòng)力(約16000人)的年均收入,據(jù)5年的統(tǒng)計(jì)資料獲知,該行業(yè)農(nóng)村勞動(dòng)力人均年收入的標(biāo)準(zhǔn)差為200元,若預(yù)先確定允許誤差不超過20元,采用重復(fù)抽樣。應(yīng)該抽取多少人才能以95.45%的概率保證估計(jì)誤差不超過允許誤差? 解:已知置信水平為95.45%,則 =2,=200,=20根據(jù)公式計(jì)算樣本容量為:44【例5-11】某城市要調(diào)查本市老年人口所占的比例,要求估計(jì)的允許誤差不超過5%,置信水平為95%,應(yīng)該抽取多大容量的樣本?解:應(yīng)抽取的樣本容量為45三、應(yīng)注意的問題1.對誤差范圍要十分慎重的考慮。因?yàn)檎`差范圍越小,意味著對估計(jì)結(jié)果準(zhǔn)確性要求

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論