《抽樣分布與估計》PPT課件.ppt_第1頁
《抽樣分布與估計》PPT課件.ppt_第2頁
《抽樣分布與估計》PPT課件.ppt_第3頁
《抽樣分布與估計》PPT課件.ppt_第4頁
《抽樣分布與估計》PPT課件.ppt_第5頁
已閱讀5頁,還剩67頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、,現(xiàn)代統(tǒng)計與SAS,統(tǒng)計推斷的過程,總體均值、比例、方差等,抽樣分布,樣本 對應的不含未知參數的實值函數 稱作統(tǒng)計量,記作:,它本身也是一隨機變量。它的分布稱作抽樣分布。,數理統(tǒng)計需要用統(tǒng)計量來推斷被抽樣的總體,因此討論 抽樣分布就成為數理統(tǒng)計的一個十分重要和基本的理論課題。,這里主要介紹某些常用的統(tǒng)計量的分布,要求能正確 掌握各種分布成立的條件和結論,為將來的應用打下基礎。,對總體 X 和給定的 ,若存在 ,使,,則稱 為 X 分布的上側 分位數或,分位數,上側臨介值,使,的 稱為 X 分布的雙側 分位數。,特別地,若 X 的分布密度是關于 軸對稱的,則它 的雙側分位數是使 的,例1 設,求

2、上側 分位數及雙側 分位數。,解:,分位數,例2 設,求上側 分位數及雙側 分位數。,解:,分位數,正態(tài)總體的樣本均值的抽樣分布,的一個樣本。則,證明:,因,更進一步,有,的一個樣本。則,因為 所以, 也服從正態(tài)分布。,證法2:由獨立同分布的中心極限定理,,又,所以,例3 設 是它的一個樣本,,求,解:,正態(tài)總體的樣本均值的抽樣分布,自由度記作,正態(tài)總體的樣本方差的抽樣分布,則統(tǒng)計量,稱 服從自由度為 的 分布,有時也將 記作,分布,即:服從標準正態(tài)分布的相互獨立的 個隨機變量 的平方和服從 分布。,正態(tài)總體的樣本方差的抽樣分布,服從 分布的隨機變量 的概率密度函數為,其中,服從 分布的隨機變

3、量的分布密度圖形:,分布的性質,設 且它們相互獨立,則,求 的分布。,解:,例4 設 是它的一個樣本,,樣本均值的抽樣分布與中心極限定理,當總體服從正態(tài)分布N(,2)時,來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X 的數學期望為,方差為2/n。即XN(,2/n),中心極限定理(central limit theorem),中心極限定理:設從均值為,方差為 2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布,正態(tài)總體的樣本方差的抽樣分布,定理 5.1,則(1)樣本均值 與樣本方差 相互獨立。,(2),(3),例5 設 是它的一

4、個樣本,,解:,使,例5 設 是它的一個樣本,,使,解:,例5 設 是它的一個樣本,,使,解:,查表得:,即:,(上側臨介值: ),正態(tài)總體的樣本均值與標準差之比的抽樣分布,在后面講到的參數估計和假設檢驗中,對于正態(tài)總體 的樣本 ,經常要用到統(tǒng)計量:,欲考察它的分布要先介紹一個抽樣分布 分布,它描述的是樣本均值與標準差之比。,記作:,正態(tài)總體的樣本均值與標準差之比的抽樣分布,例6 設,求上側 分位數及雙側 分位數。,解:,正態(tài)總體的樣本均值與標準差之比的抽樣分布,正態(tài)總體的樣本均值與標準差之比的抽樣分布,則統(tǒng)計量:,則統(tǒng)計量:,其中:,前面提到:兩個 隨機變量的和的分布仍是 分布。,它是描述兩

5、個 隨機變量的商的分布的。,兩個正態(tài)總體的樣本方差之比的抽樣分布,但兩個 隨機變量的商的分布卻是,相互獨立,則隨機變量,稱 F 服從第一自由度為 ,第二自由度為 的 F 分布。,兩個正態(tài)總體的樣本方差之比的抽樣分布,例7 若 求 的分布。,解:因為,兩個正態(tài)總體的樣本方差之比的抽樣分布,還可利用下列公式求出當 較大時的近似臨介值:,如,兩個正態(tài)總體的樣本方差之比的抽樣分布,則統(tǒng)計量:,定理5.4,解:,如果隨機變量的概率密度函數為,其中 且,則稱 X 服從 分布,記作,分布與 函數(附錄),稱為 函數。有如下性質:,當 時收斂,且,當 時有,例2,由此也可說 函數是階乘的推廣。,分布的一個特殊

6、情形 是一指數分布。,如果隨機變量的概率密度函數為,其中 且,則稱 X 服從 分布,記作,很多重要分布是 分布的特殊情形。,分布的另一特殊情形 是 分布。,抽樣分布(sampling distribution),抽樣分布與總體分布的關系,樣本均值的數學期望 樣本均值的方差 重復抽樣 不重復抽樣,樣本均值的抽樣分布(數學期望與方差),樣本均值的抽樣分布(數學期望與方差),比較及結論:1. 樣本均值的均值(數學期望) 等于總體均值 2. 樣本均值的方差等于總體方差的1/n,樣本比例的抽樣分布,總體(或樣本)中具有某種屬性的單位與全部單位總數之比 不同性別的人與全部人數之比 合格品(或不合格品) 與

7、全部產品總數之比 總體比例可表示為 樣本比例可表示為,比例(proportion),容量相同的所有可能樣本的樣本比例的概率分布 當樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似 一種理論概率分布 推斷總體總體比例的理論基礎,樣本比例的抽樣分布,樣本比例的數學期望 樣本比例的方差 重復抽樣 不重復抽樣,樣本比例的抽樣分布(數學期望與方差),區(qū)間估計的圖示,將構造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數真值的次數所占的比例稱為置信水平 表示為 (1 - 為是總體參數未在區(qū)間內的比例 常用的置信水平值有 99%, 95%, 90% 相應的 為0.01,0.05,0.10,置信水平,由樣本統(tǒng)

8、計量所構造的總體參數的估計區(qū)間稱為置信區(qū)間 統(tǒng)計學家在某種程度上確信這個區(qū)間會包含真正的總體參數,所以給它取名為置信區(qū)間 用一個具體的樣本所構造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產生的區(qū)間是否包含總體參數的真值 我們只能是希望這個區(qū)間是大量包含總體參數真值的區(qū)間中的一個,但它也可能是少數幾個不包含參數真值的區(qū)間中的一個,置信區(qū)間 (confidence interval),置信區(qū)間與置信水平,均值的抽樣分布,(1 - ) % 區(qū)間包含了 % 的區(qū)間未包含,影響區(qū)間寬度的因素,1.總體數據的離散程度,用 來測度 2.樣本容量, 3.置信水平 (1 - ),影響 z 的大小,5.3 總

9、體均值的區(qū)間估計,正態(tài)總體且方差已知,或 正態(tài)總體,方差未知、大樣本 正態(tài)總體,方差未知、小樣本,一個總體參數的區(qū)間估計,總體均值的區(qū)間估計 (正態(tài)總體、已知,或非正態(tài)總體、大樣本),總體均值的區(qū)間估計(大樣本),1.假定條件 總體服從正態(tài)分布,且方差() 未知 如果不是正態(tài)分布,可由正態(tài)分布來近似 (n 30) 總體均值 在1-置信水平下的置信區(qū)間為,重復抽樣,不重復抽樣,總體均值的區(qū)間估計(例題分析),【例】某種零件的長度服從正態(tài)分布,從某天生產一批零件中按重復抽樣方法隨機抽取9個,測得其平均長度為21.4cm。已知總體標準差為=0.15cm。試估計該批零件平均長度的置信區(qū)間,置信水平為9

10、5%,解:已知:= 0.15cm,n=9,x=21.4,1-=95%,即:21.40.098=(21.302,21.498),該批零件平均長度的置信區(qū)間為21.302cm21.498cm之間,總體均值的區(qū)間估計(例題分析),解:已知N(,102),n=25, 1- = 95%,z/2=1.96。根據樣本數據計算得: 總體均值在1-置信水平下的置信區(qū)間為,該食品平均重量的置信區(qū)間為101.44克109.28克之,總體均值的區(qū)間估計(例題分析),【例】一家保險公司收集到由36個投保個人組成的隨機樣本,得到每個投保人的年齡(周歲)數據如下表。試建立投保人年齡90%的置信區(qū)間,總體均值的區(qū)間估計(例題

11、分析),解:已知n=36, 1- = 90%,z/2=1.645。根據樣本數據計算得: , 總體均值在1-置信水平下的置信區(qū)間為,投保人平均年齡的置信區(qū)間為37.37歲41.63歲,總體均值的區(qū)間估計 (正態(tài)總體、未知、小樣本),總體均值的區(qū)間估計(小樣本),1.假定條件 總體服從正態(tài)分布,且方差() 未知 小樣本 (n 30) 使用 t 分布統(tǒng)計量,總體均值 在1-置信水平下的置信區(qū)間為,t 分布,t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的t分布依賴于稱之為自由度的參數。隨著自由度的增大,t分布也逐漸趨于正態(tài)分布,總體均值的區(qū)間估計(例題分析),【例】已知某

12、種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間,總體均值的區(qū)間估計(例題分析),解:已知N(,2),n=16, 1- = 95%,t/2=2.131。根據樣本數據計算得: , 總體均值在1-置信水平下的置信區(qū)間為,該種燈泡平均使用壽命的置信區(qū)間為1476.8小時1503.2小時,5.4 總體比例的區(qū)間估計,大樣本重復抽樣時的估計方法 大樣本不重復抽樣時的估計方法,總體比例的區(qū)間估計,總體比例的區(qū)間估計,1.假定條件 總體服從二項分布 可以由正態(tài)分布來近似 使用正態(tài)分布統(tǒng)計量,3. 總體比例在1-置信水平下的置信區(qū)間為

13、,總體比例的區(qū)間估計(例題分析),【例】某城市想要估計下崗職工中女性所占的比例,隨機抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間,解:已知 n=100,p65% , 1-= 95%,z/2=1.96,該城市下崗職工中女性比例的置信區(qū)間為55.65%74.35%,估計總體均值時樣本容量的確定,估計總體均值時樣本容量n為 樣本容量n與總體方差2、邊際誤差E、可靠性系數Z或t之間的關系為 與總體方差成正比 與邊際誤差成反比 與可靠性系數成正比,估計總體均值時樣本容量的確定,其中:,估計總體均值時樣本容量的確定 (例題分析),【例】擁有工商管理學士學位的大學畢業(yè)生年薪的標準差大約為2000元,假定想要估計年薪95%的置信區(qū)間,希望邊際誤差為400元,應抽取多大的樣本容量?,估計總體均值時樣本容量的確定 (例題分析),解: 已知 =500,E=200, 1-=95%, z/2=1.96 12 /22置信度為90%的置信區(qū)間為,即應抽取97人作為樣本,估計總體比例時樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論