數(shù)理統(tǒng)計第六章_第1頁
數(shù)理統(tǒng)計第六章_第2頁
數(shù)理統(tǒng)計第六章_第3頁
數(shù)理統(tǒng)計第六章_第4頁
數(shù)理統(tǒng)計第六章_第5頁
已閱讀5頁,還剩66頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 對隨機現(xiàn)象進行觀測、試驗,以取得對隨機現(xiàn)象進行觀測、試驗,以取得有代表性的觀測值有代表性的觀測值 對已取得的觀測值進行整理、分析對已取得的觀測值進行整理、分析, ,作出推斷、決策作出推斷、決策, ,從而找出所研究的對象從而找出所研究的對象的規(guī)律性的規(guī)律性數(shù)數(shù)理理統(tǒng)統(tǒng)計計的的分分類類描述統(tǒng)計學描述統(tǒng)計學推斷統(tǒng)計學推斷統(tǒng)計學第一節(jié)第一節(jié) 基本概念基本概念一、總體和個體一、總體和個體二、樣本二、樣本 簡單隨機樣本簡單隨機樣本二、統(tǒng)計量二、統(tǒng)計量一、總體和個體一、總體和個體 一個統(tǒng)計問題總有它明確的研究對象一個統(tǒng)計問題總有它明確的研究對象. .研究某批燈泡的質量研究某批燈泡的質量研究對象的全體稱為研

2、究對象的全體稱為總體總體( (母體母體) ),組成總體的每個元素稱為組成總體的每個元素稱為個體個體. .總體總體 然而在統(tǒng)計研究中,人們關心總體僅僅是關心然而在統(tǒng)計研究中,人們關心總體僅僅是關心其每個個體的一項其每個個體的一項( (或幾項或幾項) )數(shù)量指標和該數(shù)量指標數(shù)量指標和該數(shù)量指標在總體中的分布情況在總體中的分布情況. . 這時,每個個體具有的數(shù)這時,每個個體具有的數(shù)量指標的全體就是總體量指標的全體就是總體. .某批某批燈泡的壽命燈泡的壽命該批燈泡壽命的該批燈泡壽命的全體就是總體全體就是總體國產轎車每公里國產轎車每公里的耗油量的耗油量國產轎車每公里耗油量國產轎車每公里耗油量的全體就是總

3、體的全體就是總體所研究的對象的某個所研究的對象的某個( (或某些或某些) )數(shù)量指標的全體稱為數(shù)量指標的全體稱為總體總體, ,它是一個隨機變量它是一個隨機變量( (或多維隨機變量或多維隨機變量) ),記為,記為X . . X 的分布函數(shù)和數(shù)字特征稱為總體分布函數(shù)的分布函數(shù)和數(shù)字特征稱為總體分布函數(shù)和總體數(shù)字特征和總體數(shù)字特征. 例如例如: :研究某批燈泡的壽命時,總體研究某批燈泡的壽命時,總體X是這批是這批燈泡的壽命,而其中每個燈泡的壽命就是個體。燈泡的壽命,而其中每個燈泡的壽命就是個體。每個每個燈泡的壽命燈泡的壽命個體個體總體總體國產轎車每公里國產轎車每公里的耗油量的耗油量國產轎車每公里耗油

4、國產轎車每公里耗油量的全體就是總體量的全體就是總體 又如又如:研究某批國產轎車每公里的耗油量時,總研究某批國產轎車每公里的耗油量時,總體體X是這批轎車每公里的耗油量,而其中每輛轎車是這批轎車每公里的耗油量,而其中每輛轎車的耗油量就是個體。的耗油量就是個體。 類似地,在研究某地區(qū)中學生的營養(yǎng)狀況時,類似地,在研究某地區(qū)中學生的營養(yǎng)狀況時,若關心的數(shù)量指標是身高和體重,我們用若關心的數(shù)量指標是身高和體重,我們用X和和Y分分別表示身高和體重,那么此總體就可用二維隨機變別表示身高和體重,那么此總體就可用二維隨機變量量(X,Y) 來表示,而每個學生的身高和體重就是個來表示,而每個學生的身高和體重就是個體

5、體. 為推斷總體分布及各種特征,按一定規(guī)則從總為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取若干個體進行觀察試驗,以獲得有關總體體中抽取若干個體進行觀察試驗,以獲得有關總體的信息,這一抽取過程稱為的信息,這一抽取過程稱為 “抽樣抽樣”,所抽取的部,所抽取的部分個體稱為分個體稱為樣本樣本. . 樣本中所包含的個體數(shù)目稱為樣本中所包含的個體數(shù)目稱為樣本容量樣本容量. .二、樣本二、樣本 簡單隨機樣本簡單隨機樣本1 1)抽樣和樣本)抽樣和樣本 樣本的抽取是隨機的,每個個體是一個隨機樣本的抽取是隨機的,每個個體是一個隨機變量變量.容量為容量為n的樣本可以看作的樣本可以看作n維隨機變量,用維隨機變量,

6、用X1,X2,Xn表示表示. 而一旦取定一組樣本,得到的是而一旦取定一組樣本,得到的是n個具體的個具體的數(shù)數(shù) (x1,x2,xn),稱其為樣本的一個觀察值,簡,稱其為樣本的一個觀察值,簡稱稱樣本值樣本值 .2.X1,X2,Xn相互獨立相互獨立. 由于抽樣的目的是為了對總體進行統(tǒng)計推斷,由于抽樣的目的是為了對總體進行統(tǒng)計推斷,為了使抽取的樣本能很好地反映總體的信息,必須為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法考慮抽樣方法. .最常用的一種抽樣方法叫作最常用的一種抽樣方法叫作“簡單簡單隨機抽樣隨機抽樣”,它要求抽取的樣本滿足下面兩點,它要求抽取的樣本滿足下面兩點:1. 樣本樣本X1

7、,X2,Xn中每一個中每一個Xi與所考察的總體與所考察的總體X有相同的分布有相同的分布.2 2)簡單隨機樣本)簡單隨機樣本 由簡單隨機抽樣得到的樣本稱為由簡單隨機抽樣得到的樣本稱為簡單隨機樣簡單隨機樣本本,它可以用與總體獨立同分布的,它可以用與總體獨立同分布的n個相互獨立個相互獨立的隨機變量的隨機變量X1,X2,Xn表示表示. 簡單隨機樣本是應用中最常見的情形,今后,簡單隨機樣本是應用中最常見的情形,今后,當說到當說到“X1,X2,Xn是取自某總體的樣本是取自某總體的樣本”時,時,若不特別說明,就指簡單隨機樣本若不特別說明,就指簡單隨機樣本. 設設X1,X2,Xn 是總體是總體X的一個簡單隨機

8、樣本,的一個簡單隨機樣本,1)若若X為離散型總體,其分布律是為離散型總體,其分布律是p(x),則,則X1,X2,Xn的的聯(lián)合分布律為聯(lián)合分布律為p(x1) p (x2) p (xn) 2)若若X為連續(xù)型總體,其概率密度是為連續(xù)型總體,其概率密度是f(x),則,則X1,X2,Xn的聯(lián)合分布律為的聯(lián)合分布律為f (x1) f (x2) f (xn) 事實上我們抽樣后得到的資料都是具體的、事實上我們抽樣后得到的資料都是具體的、確定的值確定的值. 如我們從某班大學生中抽取如我們從某班大學生中抽取10人測量人測量身高,得到身高,得到10個數(shù),它們是樣本取到的值而不是個數(shù),它們是樣本取到的值而不是樣本樣本

9、. 我們只能觀察到隨機變量取的值而見不到我們只能觀察到隨機變量取的值而見不到隨機變量隨機變量.3)總體、樣本、樣本值的關系)總體、樣本、樣本值的關系 統(tǒng)計是從手中已有的資料統(tǒng)計是從手中已有的資料 樣本值,去推斷樣本值,去推斷總體的情況總體的情況 總體分布總體分布F(x)的性質的性質. 總體分布決定了樣本取值的概率規(guī)律,也就是總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體總體. 由樣本值去推斷總體情況,需要對樣本由樣本值去推斷總體情況,需要對樣本值進行值進行“加工加工”,這就要構造一些樣本的函,這就要構造一些樣

10、本的函數(shù),它把樣本中所含的(某一方面)信息集數(shù),它把樣本中所含的(某一方面)信息集中起來中起來. .中不含有任何的未知參數(shù),則稱函數(shù)中不含有任何的未知參數(shù),則稱函數(shù)g(X1,X2,,Xn)如果樣本如果樣本X1,X2,,Xn的函數(shù)的函數(shù)g(X1,X2,,Xn)為統(tǒng)計量為統(tǒng)計量. .g(x1,x2,,xn)為統(tǒng)計量為統(tǒng)計量g(X1,X2,,Xn)的一個的一個若若x1,x2,,xn是相應的樣本值,則稱函數(shù)值是相應的樣本值,則稱函數(shù)值觀察值觀察值.若若 a , 2 已知已知, 則則n2ii=1X ,是統(tǒng)計量,是統(tǒng)計量,而而是是X 的一個樣本的一個樣本,nXXX,21則則n2i2i=11X -a不是統(tǒng)計

11、量不是統(tǒng)計量. .35543XX也是統(tǒng)計量也是統(tǒng)計量.n2i2i=11X -a,X N(a,)a,是未知參數(shù)是未知參數(shù), niiXnX112211()niiSXXn它反映了總體均值它反映了總體均值的信息的信息它反映了總體方差它反映了總體方差的信息的信息nikikXnA11nikikXXnB1)(1 k=1,2,它反映了總體它反映了總體 k 階矩階矩的信息的信息它反映了總體它反映了總體 k 階階中心矩的信息中心矩的信息它們的觀察值分別為:它們的觀察值分別為: niixnx112211()niisxxn nikikxna11 nikikxxnb1)(1由大數(shù)定律可知:由大數(shù)定律可知: nikikX

12、nA11)(kXE依概率收斂于依概率收斂于例例1. 從一批相同的電子元件中隨機地抽出從一批相同的電子元件中隨機地抽出8個,測得使用個,測得使用壽命(單位:小時)分別為:壽命(單位:小時)分別為:2300,2430,2580,2400,2280,1960,2460,2000,試計算樣本均值、樣本方差及,試計算樣本均值、樣本方差及樣本二階矩樣本二階矩.解:解: niixnx11(小時)(小時)25.2301 1n22ii=1s =(x - x )n242110.9375(小時) niixna1221)(小小時時25 .5337862 順序統(tǒng)計量順序統(tǒng)計量 設設X1, X2 ,, Xn為總體為總體X

13、的樣本的樣本,由樣本由樣本可建立可建立n個函數(shù)個函數(shù): *kx*12,1,2kknXXXXXkn其中其中 為這樣的統(tǒng)計量,它的觀察值為為這樣的統(tǒng)計量,它的觀察值為 , *kX為樣本為樣本X1, X2 , Xn的觀察值的觀察值x1, x2, xn中中*kx由小至大排列由小至大排列(即即*1knxxx) )后的后的第第k位數(shù)值位數(shù)值, ,則稱則稱*12,nXXX為為順序統(tǒng)計量順序統(tǒng)計量協(xié)方差與相關系數(shù)協(xié)方差與相關系數(shù)記記樣本的協(xié)方差樣本的協(xié)方差1211niiiSXXYYn樣本的相關系數(shù)樣本的相關系數(shù)1212SRSS一、經驗分布函數(shù)一、經驗分布函數(shù) 設設X1,X2,Xn為取自總體為取自總體X的樣本,

14、的樣本, x1,x2,xn為其觀察值為其觀察值.對于每個固定的對于每個固定的x,設事件,設事件Xx在在n次觀察中出現(xiàn)的次數(shù)為次觀察中出現(xiàn)的次數(shù)為vn(x),于是事,于是事件件Xx發(fā)生的頻率為:發(fā)生的頻率為:( )( )nnvxFxxn 稱稱 Fn(x) 為樣本分布函數(shù)或經驗分布函數(shù)為樣本分布函數(shù)或經驗分布函數(shù).定理(格列汶科)當定理(格列汶科)當n時,經驗分布函數(shù)時,經驗分布函數(shù) Fn(x) 依概率依概率1關于關于x一致收斂與總體分布函數(shù),即一致收斂與總體分布函數(shù),即lim sup |( )( )| 01nnxPFxF x 定理表明:定理表明:當樣本容量當樣本容量n充分大時,經驗分布函數(shù)充分大

15、時,經驗分布函數(shù) Fn(x) 幾乎一定會充分趨近總體分布函數(shù)幾乎一定會充分趨近總體分布函數(shù)F(x),這是這是用樣本來推斷總體的理論依據(jù)用樣本來推斷總體的理論依據(jù).二、樣本均值和方差的性質二、樣本均值和方差的性質1 1 樣本均值的性質樣本均值的性質(1 1)(2 2)若總體若總體X的均值和方差存在的均值和方差存在, ,且且則則21,EXa DXn10niiXX2 2 樣本方差的性質樣本方差的性質(1 1)(2 2)則則2221111nniiiiXXXXnn記記221111nniiSXXn2211nnSSn若總體若總體X的方差存在的方差存在, ,則則(3 3)21nE SDXn21nE SDX三、

16、極值的分布三、極值的分布設總體設總體X的分布函數(shù)為的分布函數(shù)為F(x),12,nXXX為其樣本為其樣本(1 1)最大項統(tǒng)計量)最大項統(tǒng)計量*nX的分布函數(shù)記為的分布函數(shù)記為 nF u,則,則 *nnFuP Xu12,nP Xu XuXu nF u (2 2)最小項統(tǒng)計量)最小項統(tǒng)計量*1X的分布函數(shù)記為的分布函數(shù)記為 1F v,則,則 *1111F vP XvP Xv 121,nP Xv XvXv 1nP Xv 11nF v 特別地特別地, ,若若X 有密度函數(shù)有密度函數(shù)f(x) , ,則則 和和*nX*1X的密度函數(shù)分別為的密度函數(shù)分別為 1nnfunf uF u 111nfvnf vF v

17、 統(tǒng)計量是樣本的函數(shù),而樣本是隨機統(tǒng)計量是樣本的函數(shù),而樣本是隨機變量,故統(tǒng)計量也是隨機變量,因而就有變量,故統(tǒng)計量也是隨機變量,因而就有一定的分布,它的分布稱為一定的分布,它的分布稱為“抽樣分抽樣分布布” ” . . 下面介紹三個來自正態(tài)總體的抽樣分布下面介紹三個來自正態(tài)總體的抽樣分布. .)n(222分布分布1、 設設 相互獨立相互獨立, ,都服從標準正態(tài)分布都服從標準正態(tài)分布nX,X,X21222212nXXX N(0,1), 則稱隨機變量:則稱隨機變量: 所服從的分布為自由度為所服從的分布為自由度為 n 的的 分布,記為分布,記為22分布的概率密度為分布的概率密度為 其其它它00)2(

18、21)(2122yeynyfynn其中,其中,01)(dtetxtx稱為稱為 函數(shù),具有性質函數(shù),具有性質(1)( ),(1)1,(1/2)(1)! ()xxxnnnN n=1n=4n=10f(y)0 1 3 5 7 9 11 13 15 17 x0.50.40.30.20.1有所改變有所改變. .2分布的概率密度圖形如下:分布的概率密度圖形如下:2顯然顯然分布的概率密度圖形隨自由度的不同而分布的概率密度圖形隨自由度的不同而性質性質1.1.),(22n設設nDnE2)(,)(22 則則2性質性質2.2. 設設),(1221n),(2222n且且21與與22相互獨立,則相互獨立,則)(21222

19、21nn 這個性質稱為這個性質稱為 分布的可加性分布的可加性. .2t 的概率密度為的概率密度為:2121221 n)nt(n)n()n()t (h 設設XN( 0 , 1 ) , , Y YnYXt 所服從的分布為自由度為所服從的分布為自由度為 n 的的 t 分布分布. .記為記為tt (n).)(2n2、t 分布分布,且,且 X 與與 Y 相互相互獨立,則稱變量獨立,則稱變量n=4n=10n=1xt(x;n)o t分布的概率密度函數(shù)關于分布的概率密度函數(shù)關于t=0對稱,且對稱,且當當n充分大時充分大時(n30),其圖形與標準正態(tài)分布的,其圖形與標準正態(tài)分布的概率密度函數(shù)的圖形非常接近概率密

20、度函數(shù)的圖形非常接近.但對于較小的但對于較小的n,t 分布與分布與N (0,1)分布相差很大分布相差很大.由定義可見,由定義可見,3、F分布分布則稱統(tǒng)計量則稱統(tǒng)計量服從自由度為服從自由度為n1及及 n2 的的F分布,分布,n1稱為第一自由度,稱為第一自由度,21nYnXF 121nXnYF F(n2,n1),n(Y),n(X2212 設設X 與與 Y 相互獨立,相互獨立,n2稱為第二自由度,記作稱為第二自由度,記作 FF(n1,n2) .xo)n,n;x(f21 2n201 n252 n102 n二、上二、上分位點分位點 dxxfxXPx )(設隨機變量設隨機變量X的概率密度為的概率密度為 f(x),對于對于任意給定的任意給定的(01),若存在實數(shù)若存在實數(shù)x,使得使得:則稱點則稱點x為該概率分布的上為該概率分布的上分位點分位點 對標準正態(tài)分布變量對標準正態(tài)分布變量ZN(0, 1)和給定的和給定的 ,上,上 分分位數(shù)是由位數(shù)是由: PZz =2212tzdte 即即 PZ 1.059 = 0.15.P X 12.5 = 0.15.的概率不小于的概率不小于90%,90%,則樣本容量至少取多少則樣本容量至少取多少? ?例例6.設設(72 ,10)XN, ,為使樣本均值大于為使樣本均值大于7070

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論