應(yīng)用統(tǒng)計(jì)學(xué)參數(shù)估計(jì).ppt_第1頁
應(yīng)用統(tǒng)計(jì)學(xué)參數(shù)估計(jì).ppt_第2頁
應(yīng)用統(tǒng)計(jì)學(xué)參數(shù)估計(jì).ppt_第3頁
應(yīng)用統(tǒng)計(jì)學(xué)參數(shù)估計(jì).ppt_第4頁
應(yīng)用統(tǒng)計(jì)學(xué)參數(shù)估計(jì).ppt_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余49頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、應(yīng)用統(tǒng)計(jì)學(xué)參數(shù)估計(jì),國際商學(xué)院 統(tǒng)計(jì)與技術(shù)經(jīng)濟(jì)學(xué)系 許曉娟,本講內(nèi)容,點(diǎn)估計(jì) 什么是點(diǎn)估計(jì) 估計(jì)量優(yōu)良性的標(biāo)準(zhǔn) 優(yōu)缺點(diǎn) 區(qū)間估計(jì) 什么是區(qū)間估計(jì) 區(qū)間估計(jì)應(yīng)用 樣本容量的確定,第五章,統(tǒng)計(jì)推斷的過程,案例一:德軍有多少輛坦克?,二戰(zhàn)期間,盟軍非常想知道德軍總共制造了多少輛坦。德國人在制造坦克時是墨守成規(guī)的,他們把坦克從1開始進(jìn)行了連續(xù)編號。在戰(zhàn)爭過程中,盟軍繳獲了一些敵軍坦克,并記錄了它們的生產(chǎn)編號。那么怎樣利用這些號碼來估計(jì)坦克總數(shù)呢?在這個問題中,總體參數(shù)是未知的坦克總數(shù)N,而繳獲坦克的編號則是樣本。,估計(jì)方法,我們先找到被繳獲坦克編號的平均值,并認(rèn)為這個值是全部編號的中點(diǎn)。因此樣本均值乘

2、以2就是總數(shù)的一個估計(jì) 用觀測到的最大編號乘以因子1+1/n,其中 n 是被俘虜坦克個數(shù)。,數(shù)據(jù),方法1:A=均值*2=38.4,方法1:B=最大值*(1+1/n)=55,這里對戰(zhàn)爭、坦克的部署以及繳獲做了哪些假設(shè)?,點(diǎn)估計(jì),估計(jì)量:用于估計(jì)總體參數(shù)的統(tǒng)計(jì)量 是一個隨機(jī)變量 包括樣本均值、樣本比例、樣本方差等 例如: 樣本均值就是總體均值 的一個估計(jì)量 參數(shù)用 表示,估計(jì)量用 表示 估計(jì)值:估計(jì)參數(shù)時計(jì)算出來的統(tǒng)計(jì)量的具體值 如果樣本均值 x =80,則80就是的估計(jì)值,點(diǎn)估計(jì)的基本概念,點(diǎn)估計(jì)的方法,矩估計(jì) 廣義矩估計(jì)(GMM) 最小二乘估計(jì)(Least Squares Estmate,LS

3、E) 最大似然估計(jì)(Maximum Likelihood Estimate,MLE),如何評價估計(jì)量的優(yōu)良性,無偏性 有效性 一致性,無偏性( unbiasedness ),樣本估計(jì)量的期望等于總體參數(shù),該統(tǒng)計(jì)量是無偏估計(jì)量 無偏估計(jì)量的優(yōu)點(diǎn) 樣本估計(jì)量與參數(shù)不存在系統(tǒng)偏差 無偏估計(jì)量的缺點(diǎn) 不一定存在 常常不唯一 不一定是個好估計(jì),有效性(efficiency),樣本估計(jì)量的方差(或標(biāo)準(zhǔn)差)較小,則相對來說,其有效性較高 常常與無偏性結(jié)合起來,評價估計(jì)量的優(yōu)良性 均方誤差(MSE),一致性(consistency),增加樣本量時,樣本估計(jì)量以較大的概率接近總體參數(shù) 常常與有效性結(jié)合起來,評價

4、估計(jì)量的優(yōu)良性 對某一n,無法要求MSE最小 但當(dāng)n趨近無窮大時,常常可以做出證明,14,請利用中心極限定理 對樣本均值優(yōu)良性進(jìn)行評價,樣本方差呢?,常見估計(jì)量的一些性質(zhì),樣本均值 是總體均值的一致無偏估計(jì)量,并且在線性無偏估計(jì)類中,方差最小。 比率也有同樣的性質(zhì) 樣本方差 是總體方差的一致無偏估計(jì)量,16,點(diǎn)估計(jì)的優(yōu)缺點(diǎn),優(yōu)點(diǎn) 計(jì)算簡單、容易理解 缺點(diǎn) 給人絕對化的感覺 無法表現(xiàn)估計(jì)量的隨機(jī)性 無法定量地測度估計(jì)值的可靠性,區(qū)間估計(jì),區(qū)間估計(jì)的圖示,樣本均值服從正態(tài)分布, 這意味著,在所有可能的樣本均值中, 有90%的樣本均值落在 之內(nèi) 有95%的樣本均值落在 之內(nèi) 有99%的樣本均值落在

5、之內(nèi) 據(jù)此我們估計(jì) 包含總體均值 ,并認(rèn)為有 的把握 重復(fù)抽樣的話,大約有 的抽樣是包含 的,一、區(qū)間估計(jì)的基本原理,置信區(qū)間,置信水平,將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平 表示為 (1 - 為總體參數(shù)包含在區(qū)間內(nèi)的比例 常用的置信水平值有 99%, 95%, 90% 相應(yīng)的 為0.01,0.05,0.10,置信水平(置信度或置信系數(shù)),由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間 統(tǒng)計(jì)學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間 用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是

6、否包含總體參數(shù)的真值 我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個,置信區(qū)間 (confidence interval),置信區(qū)間與置信水平,置信水平越大,置信區(qū)間包含真知的可能性越大 置信區(qū)間越小,估計(jì)結(jié)果越 精確 區(qū)間估計(jì)的理想狀況是在較高的置信水平下,獲得寬度較小的置信區(qū)間,均值的抽樣分布,(1 - ) % 區(qū)間包含了 % 的區(qū)間未包含,影響區(qū)間寬度的因素,總體數(shù)據(jù)的離散程度,用 來測度 置信水平 (1 - ),影響 z 的大小 樣本容量,,區(qū)間估計(jì)的優(yōu)缺點(diǎn),優(yōu)點(diǎn) 能夠表現(xiàn)估計(jì)值的隨機(jī)性 能夠提供估計(jì)值可靠性的定量測度 計(jì)算

7、也簡單 缺點(diǎn) 不容易理解 常常被誤認(rèn)為一定包含真實(shí)值 常常被利用來騙人 隱瞞置信度和樣本量,縮小置信區(qū)間的寬度,讓結(jié)果顯得“精確”,負(fù)責(zé)任的表現(xiàn)是給出置信區(qū)間的同時,給出置信度或樣本量,置信區(qū)間的注意點(diǎn),是否應(yīng)該建水電站? 一項(xiàng)調(diào)查則稱持反對觀點(diǎn)的比例是70%,并且置信區(qū)間為(0.691,0.709) 另一項(xiàng)調(diào)查搜集了1萬個人的觀點(diǎn),有70%的人同意,調(diào)查者認(rèn)為95%置信水平下的置信區(qū)間為(0.691,0.709) 該相信誰? 區(qū)間估計(jì)的理想情況是獲得很小的置信區(qū)間和很大的置信度,但魚和熊掌不可兼得 固定置信度(比如95%),樣本量越大,置信區(qū)間越小 固定置信區(qū)間的長度,樣本量越大,置信度越大

8、 從而確定需要多大的樣本量,實(shí)際上,這一調(diào)查的樣本量為50;置信度為11%,27,二、區(qū)間估計(jì)的操作步驟,選定置信系數(shù) 確定統(tǒng)計(jì)量的概率分布 抽取一個樣本容量為n的樣本 計(jì)算 (或P ), 當(dāng) 未知時還要計(jì)算S 求置信區(qū)間的臨界值,要點(diǎn),基本情況 總體的基本情況 樣本的基本情況 要求 可靠性:置信系數(shù) 準(zhǔn)確性:邊際誤差(區(qū)間寬度) 構(gòu)造區(qū)間估計(jì)的統(tǒng)計(jì)量 Z,使之服從標(biāo)準(zhǔn)正態(tài)分布 t,使之服從t(n-1)分布 利用概率分布計(jì)算估計(jì)區(qū)間 解讀區(qū)間估計(jì)結(jié)果的意思,學(xué)習(xí)難點(diǎn)是確定估計(jì)量的抽樣分布,樣本均值和樣本比率的概率分布 正態(tài)分布 正態(tài)總體,大樣本,標(biāo)準(zhǔn)差已知 非正態(tài)總體,大樣本,標(biāo)準(zhǔn)差已知 正態(tài)

9、總體,小樣本,標(biāo)準(zhǔn)差已知 正態(tài)總體,大樣本,標(biāo)準(zhǔn)差未知 放回抽樣,計(jì)算標(biāo)準(zhǔn)差 不放回抽樣,計(jì)算標(biāo)準(zhǔn)差 T-分布 正態(tài)總體,小樣本,標(biāo)準(zhǔn)差未知 放回抽樣,計(jì)算標(biāo)準(zhǔn)差 不放回抽樣,計(jì)算標(biāo)準(zhǔn)差 樣本均值之差和樣本比率的概率分布 正態(tài)分布,29,30,三、總體均值的參數(shù)估計(jì),情況1:使用正態(tài)分布完成區(qū)間估計(jì) 情況2:使用t-分布完成區(qū)間估計(jì),情況1:標(biāo)準(zhǔn)化樣本均值服從標(biāo)準(zhǔn)正態(tài)分布(例5.1),假定條件 總體服從正態(tài)分布,且方差() 已知 如果不是正態(tài)分布,可由正態(tài)分布來近似 (n 30) 使用正態(tài)分布統(tǒng)計(jì)量 總體均值 在1-置信水平下的置信區(qū)間為,總體方差已知-例,【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品

10、為主,為對產(chǎn)量質(zhì)量進(jìn)行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10克。試估計(jì)該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%,總體方差已知-解,解:已知N(,102),n=25, 1- = 95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計(jì)算得: 總體均值在1-置信水平下的置信區(qū)間為,該食品平均重量的置信區(qū)間為101.44克109.28克之,大樣本、總體方差未知-例,【例】一家保險(xiǎn)公司收集到由36投保個人組成的隨機(jī)樣本,得到每個投保人的年齡(周歲)數(shù)據(jù)如下表。試建立投保人年齡

11、90%的置信區(qū)間,大樣本、總體方差未知-解,解:已知n=36, 1- = 90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計(jì)算得: , 總體均值在1-置信水平下的置信區(qū)間為,投保人平均年齡的置信區(qū)間為37.37歲41.63歲,例子:月團(tuán)購消費(fèi)額,貿(mào)大在校本科生8000余人 放回簡單隨機(jī)抽樣,樣本個數(shù):100,樣本均值(月團(tuán)購消費(fèi)額)為50元,樣本標(biāo)準(zhǔn)差5元 請計(jì)算如下置信水平下樣本均值在區(qū)間估計(jì) 90% 95% 99% 請計(jì)算如下置信區(qū)間的置信水平 40-60元,情況2:標(biāo)準(zhǔn)化樣本均值服從t-分布(例5.4),假定條件 總體服從正態(tài)分布,且方差() 未知 小樣本 (n 30) 使用 t 分布統(tǒng)計(jì)量 總

12、體均值 在1-置信水平下的置信區(qū)間為,t 分布,分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布,小樣本、總體方差未知-例,【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間,小樣本、總體方差未知-解,解:已知N(,2),n=16, 1- = 95%,t/2=2.131。根據(jù)樣本數(shù)據(jù)計(jì)算得: , 總體均值在1-置信水平下的置信區(qū)間為,該種燈泡平均使用壽命的置信區(qū)間為1476.8小時1503.2小時,例子:月團(tuán)購消費(fèi)

13、額,貿(mào)大在校本科生8000余人,月團(tuán)購消費(fèi)額服從正態(tài)分布 放回簡單隨機(jī)抽樣,樣本個數(shù):25,樣本均值(月團(tuán)購消費(fèi)額)為50元,樣本標(biāo)準(zhǔn)差10元 請計(jì)算如下置信水平下樣本均值在區(qū)間估計(jì) 90% 95% 99% 請計(jì)算如下置信區(qū)間的置信水平 40-60元,42,兩個總體平均數(shù)差異的區(qū)間估計(jì):例5.5,應(yīng)用條件 兩個樣本都是大樣本,且兩樣本彼此獨(dú)立,兩個總體平均數(shù)之差1-2在1- 置信水平下的置信區(qū)間為,例子:男女月團(tuán)購消費(fèi)額之差,貿(mào)大在校本科生2400男生,5600女生 樣本個數(shù) 男:100 女:300 男生平均月團(tuán)購消費(fèi):50元,標(biāo)準(zhǔn)差5元 女生平均月團(tuán)購消費(fèi):50元,標(biāo)準(zhǔn)差3元 男女月團(tuán)購消費(fèi)

14、額之差的區(qū)間估計(jì)? 90%置信水平 95%置信水平 99%置信水平,44,四、總體比率的區(qū)間估計(jì)(例5.6),應(yīng)用條件: 總體服從二項(xiàng)分布; 大樣本 ( ) 時 P近似服從正態(tài)分布。 使用正態(tài)分布統(tǒng)計(jì)量,總體比率 在1- 置信水平下的置信區(qū)間為,例子:團(tuán)購參與程度a/b,貿(mào)大在校本科生8000余人 樣本個數(shù):100,團(tuán)購參與程度0.5 給出團(tuán)購參與程度的區(qū)間估計(jì) 90%置信區(qū)間 95% 99%,46,應(yīng)用條件:兩個總體均服從二項(xiàng)分布;兩個樣本都是大樣本,且兩樣本彼此獨(dú)立 兩個總體比率之差 在1- 置信水平下的置信區(qū)間為,兩個總體比率之間差異的區(qū)間估計(jì):5.7,例子:男女月團(tuán)購消費(fèi)額之差,貿(mào)大在校本科生2400男生,5600女生 樣本個數(shù) 男:100 女:300 月團(tuán)購消費(fèi)額 男:51元 女:61元 月團(tuán)購消費(fèi)額標(biāo)準(zhǔn)差 男:5元 女:3元 計(jì)算男女月團(tuán)購消費(fèi)額之差的區(qū)間估計(jì) 置信水平取95%,樣本量的確定,49,根據(jù)均值區(qū)間估計(jì)公式可得樣本容量n為,第三節(jié) 樣本容量的確定,估計(jì)總體平均數(shù)時,例子:月團(tuán)購消費(fèi)額,根據(jù)二手資料,學(xué)生月團(tuán)購消費(fèi)額標(biāo)準(zhǔn)差一般為50元 要求 置信水平95.4% 邊際誤差10元 應(yīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論