版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第五章 統(tǒng)計(jì)量及其分布,5.1 總體與樣本 5.2 樣本數(shù)據(jù)的整理與顯示 5.3 統(tǒng)計(jì)量及其分布 5.4 三大抽樣分布 5.5 充分統(tǒng)計(jì)量,1,引 言,隨機(jī)變量及其所伴隨的概率分布全面描述了隨機(jī) 現(xiàn)象的統(tǒng)計(jì)性規(guī)律。,概率論的許多問題中,隨機(jī)變量的概率分布通常 是已知的,或者假設(shè)是已知的,而一切計(jì)算與推理都 是在這已知的基礎(chǔ)上得出來的。,但實(shí)際中,情況往往并非如此,一個(gè)隨機(jī)現(xiàn)象所 服從的分布可能是完全不知道的,或者知道其分布概 型,但是其中的某些參數(shù)是未知的。,2,例5.0.1 某公司要采購一批產(chǎn)品,每件產(chǎn)品不 是合格品就是不合格品,但該批產(chǎn)品總有一 個(gè)不合格品率 p 。由此,若從該批產(chǎn)品中隨
2、機(jī)抽取一件,用 X 表示這一件產(chǎn)品的不合格 數(shù),不難看出 X 服從一個(gè)二點(diǎn)分布b(1 , p), 但分布中的參數(shù) p 是不知道的。一些問題:,p 的大小如何;,p 大概落在什么范圍內(nèi);,能否認(rèn)為 p 滿足設(shè)定要求 (如 p 0.05)。,3,數(shù)理統(tǒng)計(jì)的任務(wù)則是以概率論為基礎(chǔ),根據(jù)試驗(yàn)所得到的數(shù)據(jù),對(duì)研究對(duì)象的客觀統(tǒng)計(jì)規(guī)律性做出合理的推斷。,服從怎樣的分布;,分布中的參數(shù);,學(xué)科分支:抽樣調(diào)查、實(shí)驗(yàn)設(shè)計(jì)、回歸分析、多元統(tǒng)計(jì)分析、非參數(shù)統(tǒng)計(jì)、貝葉斯方法,等等。,4,5.1 總體與個(gè)體,總體的三層含義:,研究對(duì)象的全體;,數(shù)據(jù);,分布,在數(shù)理統(tǒng)計(jì)中,把研究對(duì)象的全體稱為總體 (population)
3、或母體,而把組成總體的每個(gè)單元 稱為個(gè)體。,5,例5.1.1 考察某廠的產(chǎn)品質(zhì)量,將產(chǎn)品只分為合格品和不合格品,以0記合格品,以1記不合格品,則,該廠生產(chǎn)的全部合格品與不合格品,若以 p 表示這堆數(shù)中1的比例(不合格品率),則該總體可由一個(gè)二點(diǎn)分布表示:,總體 =,= 由0或1組成的一堆數(shù),6,比如:兩個(gè)生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品的總體分布:,7,例5.1.2 在二十世紀(jì)七十年代后期,美國消費(fèi)者購買日產(chǎn)SONY彩電的熱情高于購買美產(chǎn)SONY彩電,原因何在?,1979年4月17日日本朝日新聞刊登調(diào)查報(bào) 告指出N(m, (5/3)2),日產(chǎn)SONY彩電的彩色濃 度服從正態(tài)分布,而美產(chǎn)SONY彩電的彩
4、色濃 度服從(m5 , m+5)上的均勻分布。,原因在于總體的差異上!,8,圖5.1.1 SONY彩電彩色濃度分布圖q,9,等級(jí) I II III IV 美產(chǎn) 33.3 33.3 33.3 0 日產(chǎn) 68.3 27.1 4.3 0.3,表5.1.1 各等級(jí)彩電的比例(%),|X-m|5/3,5/3|X-m|10/3,10/3 |X-m|5,|X-m|5,10,5.1.2 樣本,抽樣 :,要了解總體的分布規(guī)律,在統(tǒng)計(jì)分析工作中,往往是從總體中抽取一部分個(gè)體進(jìn)行觀測,這個(gè)過程稱為抽樣。,樣本,在抽取過程中,每抽取一個(gè)個(gè)體,就是對(duì)總體X進(jìn) 行一次隨機(jī)試驗(yàn),每次抽取的n個(gè)個(gè)體 , 稱為總體X的一個(gè)容量
5、為n的樣本(sample)或子 樣;其中樣本中所包含的個(gè)體數(shù)量稱為樣本容量。樣本中的個(gè)體稱為樣品。,11,5.1.2 樣本,樣本具有兩重性:,一方面,由于樣本是從總體中隨機(jī)抽取的,抽 取前無法預(yù)知它們的數(shù)值,因此,樣本是隨機(jī) 變量,用大寫字母 X1, X2, , Xn 表示;,另一方面,樣本在抽取以后經(jīng)觀測就有確定的 觀測值,因此,樣本又是一組數(shù)值。此時(shí)用小 寫字母 x1, x2, , xn 表示是恰當(dāng)?shù)摹?在本書中,無論是樣本還是其觀測值,樣本一般均用 x1, x2, xn 表示,大家要注意從上下文中加以識(shí)別。,12,例5.1.3 啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640 克。由于隨機(jī)性,事實(shí)
6、上不可能使得所有的啤酒 凈含量均為640克?,F(xiàn)從某廠生產(chǎn)的啤酒中隨機(jī) 抽取10瓶測定其凈含量,得到如下結(jié)果: 641, 635, 640, 637, 642, 638, 645, 643, 639, 640,這是一個(gè)容量為10的樣本的觀測值, 對(duì)應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。,完全樣本,13,例5.1.4 考察某廠生產(chǎn)的某種電子元件的壽命,選了100只進(jìn)行壽命試驗(yàn),得到如下數(shù)據(jù):,表5.1.2 100只元件的壽命數(shù)據(jù),壽命范圍 元件數(shù) 壽命范圍 元件數(shù) 壽命范圍 元件數(shù) ( 0 24 4 (192 216 6 (384 408 4 (24 48 8 (216 240 3 (408 43
7、2 4 (48 72 6 (240 264 3 (432 456 1 (72 96 5 (264 288 5 (456 480 2 (96 120 3 (288 312 5 (480 504 2 (120 144 4 (312 336 3 (504 528 3 (144 168 5 (336 360 5 (528 552 1 (168 192 4 (360 184 1 552 13,表5.1.2中的樣本觀測值沒有具體的數(shù)值, 只有一個(gè)范圍,這樣的樣本稱為分組樣本。,14,獨(dú)立性: 樣本中每一樣品的取值不影響其 它樣品的取值 - x1, x2, , xn 相互獨(dú)立。,要使得推斷可靠,對(duì)樣本就有要
8、求,使樣本能很好地代表總體。通常有如下兩個(gè)要求:,隨機(jī)性: 總體中每一個(gè)個(gè)體都有同等機(jī)會(huì) 被選入樣本 - xi 與總體X有相同的分布。,樣本的要求:簡單隨機(jī)樣本,15,用簡單隨機(jī)抽樣方法得到的樣本稱為 簡單隨機(jī)樣本,也簡稱樣本。,于是,樣本 x1, x2, , xn 可以看成是 獨(dú)立同分布( iid ) 的隨機(jī)變量, 其共同分布即為總體分布。,iidindependent identical distribution,16,若總體 的分布函數(shù)為,則樣本 的聯(lián)合分布函數(shù)為,若總體 的密度函數(shù)為,則樣本 的聯(lián)合密度函數(shù)為,17,若總體 的分布列為,則樣本 的聯(lián)合分布列為:,18,總體分為有限總體與
9、無限總體,實(shí)際中總體中的個(gè)體數(shù)大多是有限的。當(dāng)個(gè)體數(shù)充分大時(shí),將有限總體看作無限總體是一種合理的抽象。,對(duì)無限總體,隨機(jī)性與獨(dú)立性容易實(shí)現(xiàn),困難在于排除有意或無意的人為干擾。,對(duì)有限總體,只要總體所含個(gè)體數(shù)很大,特別是與樣本量相比很大,則獨(dú)立性也可基本得到滿足。,本書以無限總體為主要研究對(duì)象。,19,例5.1.5 設(shè)有一批產(chǎn)品共N個(gè),需要進(jìn)行抽樣檢驗(yàn)以了解其不合格品率p?,F(xiàn)從中采取不放回抽樣抽出2個(gè)產(chǎn)品,這時(shí),第二次抽到不合格品的概率依賴于第一次抽到的是否是不合格品,如果第一次抽到不合格品,則,而若第一次抽到的是合格品,則第二次抽到不合格品的概率為,P(x2 = 1 | x1 = 1) = (
10、Np1)/(N1),P(x2 = 1 | x1 = 0) = (Np)(N1),20,顯然,如此得到的樣本不是簡單隨機(jī)樣本。但是,當(dāng)N 很大時(shí),我們可以看到上述兩種情形的概率都近似等于p 。所以當(dāng)N 很大,而n不大(一個(gè)經(jīng)驗(yàn)法則是 n N 0.1)時(shí)可以把該樣本近似地看成簡單隨機(jī)樣本。,作業(yè):P256 4、6,21,5.2.1 經(jīng)驗(yàn)分布函數(shù),5.2 樣本數(shù)據(jù)的整理與顯示,設(shè) x1, x2, , xn 是取自總體分布函數(shù)為F(x)的樣本,若將樣本觀測值由小到大進(jìn)行排列,為 x(1), x(2), , x(n),則稱 x(1), x(2), , x(n) 為有序樣本, 用有序樣本定義如下函數(shù),22
11、,則Fn(x)是一非減右連續(xù)函數(shù),且滿足,Fn() = 0 和 Fn() = 1,由此可見,F(xiàn)n(x)是一個(gè)分布函數(shù), 并稱Fn(x)為經(jīng)驗(yàn)分布函數(shù)。,23,例5.2.1 某食品廠生產(chǎn)聽裝飲料,現(xiàn)從生產(chǎn)線上隨機(jī)抽取5聽飲料,稱得其凈重(單位:克) 351 347 355 344 351,x(1)= 344, x(2)= 347, x(3)= 351, x(4)= 351, x(5)= 355,這是一個(gè)容量為5的樣本,經(jīng)排序可得有序樣本:,故其經(jīng)驗(yàn)分布函數(shù)為,24,定理5.2.1 設(shè) 是取自總體分布函數(shù)為F(x)的樣本, 為其經(jīng)驗(yàn)分布函數(shù),當(dāng) 時(shí),有,更深刻的結(jié)論:格里紋科定理,由伯努里大數(shù)定律
12、: 兩點(diǎn)分布,只要 n 相當(dāng)大,F(xiàn)n(x)依概率收斂于F(x) 。,格里紋科定理表明:當(dāng)n 相當(dāng)大時(shí),經(jīng)驗(yàn)分布函數(shù)是總體分布函數(shù)F(x)的一個(gè)良好的近似。 經(jīng)典的統(tǒng)計(jì)學(xué)中一切統(tǒng)計(jì)推斷都以樣本為依據(jù),其理由就在于此。,25,5.2.2 頻數(shù)-頻率分布表,樣本數(shù)據(jù)的整理是統(tǒng)計(jì)研究的基礎(chǔ),整理數(shù)據(jù)的最常用方法之一是給出其頻數(shù)分布表或頻率分布表。,例5.2.2 為研究某廠工人生產(chǎn)某種產(chǎn)品的能力, 我們隨機(jī)調(diào)查了20位工人某天生產(chǎn)的該種產(chǎn)品 的數(shù)量,數(shù)據(jù)如下,26,(1) 對(duì)樣本進(jìn)行分組:作為一般性的原則,組數(shù)通 常在520個(gè),對(duì)容量較小的樣本;,(2) 確定每組組距:近似公式為 組距d = (最大觀測
13、值 最小觀測值)/組數(shù);,(3) 確定每組組限: 各組區(qū)間端點(diǎn)為 a0, a1=a0+d, a2=a0+2d, , ak=a0+kd, 形成如下的分組區(qū)間 (a0 , a1 , (a1, a2, , (ak-1 , ak,對(duì)這20個(gè)數(shù)據(jù)(樣本)進(jìn)行整理,具體步驟如下:,其中a0 略小于最小觀測值, ak 略大于最大觀測值.,(4) 統(tǒng)計(jì)樣本數(shù)據(jù)落入每個(gè)區(qū)間的個(gè)數(shù)頻數(shù), 并列出其頻數(shù)頻率分布表。,27,表5.2.1 例5.2.2 的頻數(shù)頻率分布表,組序 分組區(qū)間 組中值 頻數(shù) 頻率 累計(jì)頻率(%) 1 (147,157 152 4 0.20 20 2 (157,167 162 8 0.40 60
14、 3 (167,177 172 5 0.25 85 4 (177,187 182 2 0.10 95 5 (187,197 192 1 0.05 100 合計(jì) 20 1,28,5.2.3 樣本數(shù)據(jù)的圖形顯示,一、直方圖,直方圖是頻數(shù)分布的圖形表示,它的橫坐標(biāo)表示所關(guān)心變量的取值區(qū)間,縱坐標(biāo)有三種表示方法:頻數(shù),頻率,最準(zhǔn)確的是頻率/組距,它可使得諸長條矩形面積和為1。凡此三種直方圖的差別僅在于縱軸刻度的選擇,直方圖本身并無變化。,29,把每一個(gè)數(shù)值分為兩部分,前面一部分(百位和十位)稱為莖,后面部分(個(gè)位)稱為葉,然后畫一條豎線,在豎線的左側(cè)寫上莖,右側(cè)寫上葉,就形成了莖葉圖。如:,二、莖葉圖
15、,數(shù)值 分開 莖 和 葉 112 11 | 2 11 和 2,30,例5.2.3 某公司對(duì)應(yīng)聘人員進(jìn)行能力測試,測試 成績總分為 150分。下面是50位應(yīng)聘人員的測 試成績(已經(jīng)過排序):,我們用這批數(shù)據(jù)給出一個(gè)莖葉圖,見下頁。,31,圖5.2.3 測試成績的莖葉圖,32,在要比較兩組樣本時(shí), 可畫出它們的背靠背的莖葉圖。,注意:莖葉圖保留數(shù)據(jù)中全部信息。當(dāng)樣本量較 大,數(shù)據(jù)很分散,橫跨二、三個(gè)數(shù)量級(jí)時(shí), 莖葉圖并不適用。,作業(yè):P261 2、7,33,5.3.1 統(tǒng)計(jì)量與抽樣分布,5.3 統(tǒng)計(jì)量及其分布,當(dāng)人們需要從樣本獲得對(duì)總體各種參數(shù)的認(rèn)識(shí)時(shí),最好的方法是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總
16、體的不同特征。,定義5.3.1 設(shè) x1, x2, , xn 為取自某總體的樣 本,若樣本函數(shù)T = T(x1, x2, , xn)中不含有任 何未知參數(shù)。則稱T為統(tǒng)計(jì)量。統(tǒng)計(jì)量的分布 稱為抽樣分布。,34,按照這一定義:若 x1, x2, , xn 為樣本, 則 以及經(jīng)驗(yàn)分布函數(shù)Fn(x)都是統(tǒng)計(jì)量。而當(dāng), 2 未知時(shí),x1, x1/ 等均不是統(tǒng)計(jì)量。,盡管統(tǒng)計(jì)量不依賴于未知參數(shù),但是它的分布一般是依賴于未知參數(shù)的。,下面介紹一些常見的統(tǒng)計(jì)量及其抽樣分布。,35,5.3.2 樣本均值及其抽樣分布,定義5.3.2 設(shè) x1, x2, , xn為取自某總體的樣本,其算術(shù)平均值稱為樣本均值,一般用
17、 表示,即,思考:在分組樣本場合,樣本均值如何計(jì)算? 二者結(jié)果相同嗎?,x,x= (x1+xn)/n,注意:樣本均值是一個(gè)隨機(jī)變量,應(yīng)理解為:,36,定理5.3.2 數(shù)據(jù)觀測值與均值的偏差平方和 最小,即在形如 (xic)2 的函數(shù)中,,樣本均值的基本性質(zhì):,定理5.3.1 若把樣本中的數(shù)據(jù)與樣本均值之差 稱為偏差,則樣本所有偏差之和為0,即,最小,其中c為任意給定常數(shù)。,證明:板述,例5.3.2:見書,37,若總體分布未知或不是正態(tài)分布, 但 E(x)=, Var(x)=2,則n 較大時(shí) 的漸近分 布為N(, 2/n) ,常記為 。,樣本均值的抽樣分布:,定理5.3.3 設(shè)x1, x2, ,
18、 xn 是來自某個(gè)總體的樣本,,為樣本均值。,(1) 若總體分布為N(, 2),則,的精確分布為N(, 2/n) ;,這里漸近分布是指n 較大時(shí)的近似分布.,例:5.3.3 :見書,38,5.3.3 樣本方差與樣本標(biāo)準(zhǔn)差,稱為樣本標(biāo)準(zhǔn)差。,定義5.3.3,稱為樣本方差,,其算術(shù)平方根,在n 不大時(shí),常用 作為樣本方差,其算術(shù)平方根也稱為樣本標(biāo)準(zhǔn)差。,39,在這個(gè)定義中,, ( xi x )2,n1稱為偏差平方和的自由度。其含義是:,在 確定后, n 個(gè)偏差,x1x, x2x, , xnx,能自由取值,因?yàn)?只有n1個(gè)數(shù)據(jù)可以自由變動(dòng),而第n個(gè)則不,(xi x ) = 0 .,稱為偏差平方和,,
19、中,樣本偏差平方和有三個(gè)不同的表達(dá)式:,( xix )2 = xi2 (xi)2/n = xi2 nx,它們都可用來計(jì)算樣本方差。,思考:分組樣本如何計(jì)算樣本方差?,40,以下定理表明:樣本均值的數(shù)學(xué)期望和方差,以及樣本方差的數(shù)學(xué)期望都不依賴于總體的分布形式。,定理5.3.4 設(shè)總體 X 具有二階矩,即 E(x)= , Var(x)=2 , x1, x2, , xn 為從該總體得到的樣本,,x,和s2 分別是樣本均值和樣本方差,則,E( x )=, Var( x )=2 /n, E(s2) =2,證明:板述,41,5.3.4 樣本矩及其函數(shù),樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常
20、見的統(tǒng)計(jì)量。,定義5.3.4 ak = (xik)/n 稱為樣本 k 階原點(diǎn)矩, 特別,樣本一階原點(diǎn)矩就是樣本均值。,稱為樣本k階中心矩。 特別,樣本二階中心矩就是樣本方差。,bk = (xi x)k/n,42,當(dāng)總體關(guān)于分布中心對(duì)稱時(shí),我們用,和 s,刻畫樣本特征很有代表性,而當(dāng)其不對(duì)稱時(shí), 只用,就顯得很不夠。為此,需要一些刻畫分布形狀的統(tǒng)計(jì)量,如樣本偏度和樣本峰度,它們都是樣本中心矩的函數(shù)。,樣本偏度1反映了總體分布密度曲線的對(duì)稱性信息。樣本峰度2反映了總體分布密度曲線在其峰值附近的陡峭程度。,定義: 1 = b3/b23/2 稱為樣本偏度, 2 = b4/b22-3 稱為樣本峰度。,和
21、 s,圖見書中圖5.3.4,43,5.3.5 次序統(tǒng)計(jì)量及其分布,另一類常見的統(tǒng)計(jì)量是次序統(tǒng)計(jì)量。,一、定義5.3.7 設(shè) x1, x2, , xn 是取自總體X的樣本, x(i) 稱為該樣本的第i 個(gè)次序統(tǒng)計(jì)量,它的取值 是將樣本觀測值由小到大排列后得到的第 i 個(gè) 觀測值。其中x(1)=minx1, x2, xn稱為該樣本 的最小次序統(tǒng)計(jì)量,稱 x(n)=maxx1,x2,xn為 該樣本的最大次序統(tǒng)計(jì)量。,44,在一個(gè)樣本中,x1, x2,xn 是獨(dú)立同分布的,而次序統(tǒng)計(jì)量 x(1), x(2), x(n) 則既不獨(dú)立,分布也不相同,看下例。,現(xiàn)從中抽取容量為3的樣本,其一切可能取值有33
22、=27種,表5.3.6列出了這些值,由此,例5.3.6 設(shè)總體X 的分布為僅取0,1,2的離散均勻分布,分布列為,45,我們可以清楚地看到這三個(gè)次序統(tǒng)計(jì)量的分布是不相同的。,可給出的 x(1) , x(2), x(3) 分布列如下:,46,進(jìn)一步,我們可以給出兩個(gè)次序統(tǒng)計(jì)量的聯(lián)合分布,如,x(1) 和x(2) 的聯(lián)合分布列為,因?yàn)?P(x(1) = 0, x(2) = 0) =7/27 ,,而 P( x(1) = 0)*P( x(2) = 0) = (19/27)*(7/27),,二者不等,由此可看出x(1) 和 x(2)是不獨(dú)立的。,47,二、單個(gè)次序統(tǒng)計(jì)量的分布,定理5.3.5 設(shè)總體X的
23、密度函數(shù)為p(x),分布函數(shù)為F(x), x1, x2, xn為樣本,則第k個(gè)次序統(tǒng)計(jì)量x(k)的密度函數(shù)為,48,例5.3.7 設(shè)總體密度函數(shù)為 p(x)=3x2, 0 x1. 從該總體抽得一個(gè)容量為5的樣本, 試計(jì)算 P(x(2)1/2)。,例5.3.8 設(shè)總體分布為U(0,1), x1, x2, xn為樣 本,試求第 k 個(gè)次序統(tǒng)計(jì)量的分布。,49,三、多個(gè)次序統(tǒng)計(jì)量的聯(lián)合分布,對(duì)任意多個(gè)次序統(tǒng)計(jì)量可給出其聯(lián)合分布,以兩個(gè)為例說明:,定理5.3.6 在定理5.3.5的記號(hào)下,次序統(tǒng)計(jì) 量 (x(i), x(j), (i j) 的聯(lián)合分布密度函數(shù)為,50,次序統(tǒng)計(jì)量的函數(shù)在實(shí)際中經(jīng)常用到。
24、 如 樣本極差 Rn = x(n) x(1), 樣本中程 x(n) x(1)/2。,樣本極差是一個(gè)很常用的統(tǒng)計(jì)量,其分布只在很少幾種場合可用初等函數(shù)表示。,51,令 R = x(n) x(1) ,由 R 0, 可以推出 0 x(1) = x(n)R 1 R , 則,例5.3.9 設(shè)總體分布為U(0,1), x1, x2, xn 為 樣本,則(x(n), x(1)的聯(lián)合密度函數(shù)為,p1,n(y,z)=n(n1)(zy)n-2, 0 y z 1,這正是參數(shù)為(n1, 2)的貝塔分布。,作業(yè):P279 8、20,52,5.4 三大抽樣分布,有很多統(tǒng)計(jì)推斷是基于正態(tài)分布的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)變量為基石而
25、構(gòu)造的三個(gè)著名統(tǒng)計(jì)量在實(shí)際中有廣泛的應(yīng)用,這是因?yàn)檫@三個(gè)統(tǒng)計(jì)量不僅有明確背景,而且其抽樣分布的密度函數(shù)有明顯表達(dá)式,它們被稱為統(tǒng)計(jì)中的“ 三大抽樣分布 ” 。,53,5.4.1 2 分布(卡方分布),定義5.4.1 設(shè) X1, X2, Xn, 獨(dú)立同分布于標(biāo)準(zhǔn) 正態(tài)分布N(0,1) ,則2= X12+ Xn2的分布稱 為自由度為n 的2分布,記為 2 2(n) 。,自由度是指獨(dú)立隨機(jī)變量的個(gè)數(shù),常記為,分布的密度函數(shù)為,54,該密度函數(shù)的圖像是一只取非負(fù)值的偏態(tài)分布,55,當(dāng)隨機(jī)變量 2 2(n) 時(shí),對(duì)給定 (01),稱滿足 P(2 12(n) 的 12(n) 是自由度為n的卡方分布的1 分
26、位數(shù).分位數(shù) 12(n) 可以從附表3 中查到。,顯然,在自由度n取定以后, 的值只與有關(guān).,例如,當(dāng)n=21,=0.05時(shí),由附表3(P425)可查得,,32.6706,即,56,例 設(shè)總體X N( ,22) , 從總體X中抽取容量為16的樣本X1,X2,X16. 如果已知=0,求 的概率;,57,5.4.2 F 分布,定義5.4.2 設(shè)X1 2(m), X2 2(n), X1與X2獨(dú)立, 則稱 F =(X1/m)/(X2/n) 的分布是自由度為 m 與 n 的 F分布,記為F F(m, n),其中m 稱為分子自 由度,n 稱為分母自由度。,其中,F分布的密度函數(shù)為:,58,該密度函數(shù)的圖象
27、也是一只取非負(fù)值的偏態(tài)分布,59,當(dāng)隨機(jī)變量F F(m,n) 時(shí),對(duì)給定 (01) ,稱滿足 P(F F1(m,n) =1 的F1(m,n) 是自由度為m 與 n 的F 分布的1 分位數(shù)。,一個(gè)有用的結(jié)論: F(n,m) = 1/F1(m,n)。,60,F1- (m,n)的值可由F 分布表查得.,附表5(P431P434 )分 =0.1、 =0.05、 =0.025 、 =0.01給出了F分布的1-分位數(shù).,如當(dāng)m=2, n=18時(shí),,對(duì)=0.01有,F1-0.01(2, 18)= F0.99(2, 18),=6.01,在附表5中所列的值都比較小,當(dāng) 較大 時(shí),可用下面公式,查表時(shí)應(yīng)先找到相應(yīng)
28、的值的表.,例如,,0.166,F1- (2, 18)=,61,解,因?yàn)?所以,F(3,n-3).,例 設(shè)總體XN(0,1), X1,X2,Xn為簡單隨機(jī)樣本,試問以下統(tǒng)計(jì)量服從什么分布?,且,與,相互獨(dú)立,62,5.4.3 t 分布,定義 5.4.3 設(shè)隨機(jī)變量X1 與X2 獨(dú)立, 且X1 N(0,1), X2 2(n), 則稱,的分布為自由度為n 的t 分布,記為t t(n) 。,t分布的概率密度函數(shù)為,63,t 分布的密度函數(shù)的圖象是一個(gè)關(guān)于縱軸對(duì)稱的分布,與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形狀類似,只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些尾部的概率比標(biāo)準(zhǔn)正態(tài)分布的大一些。,64,n1時(shí), t 分布的數(shù)學(xué)期望存
29、在且為0; n2時(shí),t 分布的方差存在,且為n/(n2); 當(dāng)自由度較大 (如n30) 時(shí), t 分布可以用 正態(tài)分布 N(0,1)近似。,自由度為1的 t 分布就是標(biāo)準(zhǔn)柯西分布, 它的均值不存在;,65,當(dāng)隨機(jī)變量t t(n) 時(shí),稱滿足 P(t t1(n) =1 的 t1(n) 是自由度為 n 的 t 分布的1分位數(shù). 分位數(shù) t1(n) 可以從附表4中查到。 譬如 n=10,=0.05,那么從附表4上查得 t10.05(10) = t0.95(10),由于 t 分布的密度函數(shù)關(guān)于0 對(duì)稱, 故其分位數(shù)間有如下關(guān)系 t(n1)= t1(n1),=1.812,66,例 設(shè)總體XN(0,1),
30、 X1,X2,Xn為簡單隨機(jī)樣本,試問下列統(tǒng)計(jì)量各服從什么分布?,解,(1),因?yàn)閄iN(0,1),i=1, 2, , n.且各Xi相互獨(dú)立,所以,X1-X2 N(0, 2),即,有,t(2).,又因?yàn)?與,相互獨(dú)立,故根據(jù)t分布的定義,67,解,(2),所以X1N(0,1),,有,t(n-1).,例 設(shè)總體XN(0,1), X1,X2,Xn為簡單隨機(jī)樣本,試問下列統(tǒng)計(jì)量各服從什么分布?,因?yàn)閄iN(0,1),i=1, 2, , n.且各Xi相互獨(dú)立,又因?yàn)?與,相互獨(dú)立,故根據(jù)t分布的定義,,作業(yè):P292 9、11,68,5.4.4 一些重要結(jié)論,定理5.4.1 設(shè) x1, x2, xn
31、是來自N(, 2) 的 樣本,其樣本均值和樣本方差分別為,和,x = xi/n,(3) (n1) s2/2 2(n1)。,則有,與 s2 相互獨(dú)立;,(2) x N(, 2/n) ;,69,為n維隨機(jī)向量 的數(shù)學(xué)期望向量,簡稱為 的數(shù)學(xué)期望,而稱,定義 記n維隨機(jī)向量為 , 若其每個(gè)分量的數(shù)學(xué)期望都存在,則稱,為該隨機(jī)向量的方差-協(xié)方差陣,簡稱協(xié)方差陣, 記為 。,70,定理5.4.4的證明:記 則有:,71,取一個(gè)n維正交矩陣A,其第一行元素均為 如:,72,令 ,根據(jù)多維正態(tài)分布的性質(zhì)知Y仍服從n維正態(tài)分布,且,可以看出, 的各個(gè)分量相互獨(dú)立,且都服從正態(tài)分布,其中,(2)得證,73,又因
32、為,且,故,從而,74,又因?yàn)?和 相互獨(dú)立,而,且 各分量相互獨(dú)立,,從而,從而 與 相互獨(dú)立,結(jié)論(1)得證。又因?yàn)?結(jié)論(3)得證.,75,從表面上看,,但實(shí)際上它們不是獨(dú)立的,,它們之間有一種線性約束關(guān)系:,=0,這表明,當(dāng)這n個(gè)正態(tài)隨機(jī)變量中有n-1個(gè)取值給定時(shí),剩下的一個(gè)的取值就跟著唯一確定了,故在這n項(xiàng)平方和中只有n-1項(xiàng)是獨(dú)立的.所以(3)的自由度是n-1.,關(guān)于(3)的自由度的一些直觀說明:,76,推論5.4.1,設(shè)(X1,X2,Xn)為來自正態(tài)總體 XN( , 2)的樣本,則統(tǒng)計(jì)量,證,由定義得,77,推論5.4.2 設(shè) x1, x2, xn 是來自N(1, 12) 的樣本
33、,y1, y2, yn 是來自N(2, 22) 的樣本, 且此兩樣本相互獨(dú)立,則有,特別,若12 =22 ,則,F=sx2/sy2 F(m1,n1),78,推論5.4.3 在推論5.4.2的記號(hào)下,設(shè) 12 =22 = 2 , 并記,則,79,例 設(shè)總體X N( ,2) ,從總體X中抽取容量為9的樣本,求樣本均值與總體均值之差的絕對(duì)值小于2的概率,如果: (1)已知 ; (2)未知 ,但已知樣本方差值,注意(1)和(2)所用的統(tǒng)計(jì)量的區(qū)別,80,例 設(shè)總體X N( ,22) , 從總體X中抽取容量為16的樣本X1,X2,X16. (1)如果已知=0,求 的概率; (2)如果未知,求 的概率;,
34、注意(1)和(2)所用的統(tǒng)計(jì)量的區(qū)別,81,例設(shè)總體XN( , 42), X1,X2,X10是n=10簡單隨機(jī)樣本, s2為樣本方差,已知Ps2=0.1,求 .,解,因?yàn)閚=10,n-1=9, 2=42,,所以,2(9).,又,Ps2 =,=0.1,,所以,14.6837.,故, ,14.6837x,26.105,82,5.5 充分統(tǒng)計(jì)量,5.5.1 充分性的概念,例5.5.1 為研究某個(gè)運(yùn)動(dòng)員的打靶命中率,我們 對(duì)該運(yùn)動(dòng)員進(jìn)行測試,觀測其10次,發(fā)現(xiàn)除第 三、六次未命中外,其余8次都命中。這樣的 觀測結(jié)果包含了兩種信息:,(1) 打靶10次命中8次;,(2) 2次不命中分別出現(xiàn)在第3次和第6
35、次 打靶上。,83,第二種信息對(duì)了解該運(yùn)動(dòng)員的命中率是沒有什么幫助的。一般地,設(shè)我們對(duì)該運(yùn)動(dòng)員進(jìn)行n 次觀測,得到 x1, x2, xn,每個(gè)xj 取值非0即1,命中為1,不命中為0。令 T = x1+xn ,T為觀測到的命中次數(shù)。在這種場合僅僅記錄使用T 不會(huì)丟失任何與命中率 有關(guān)的信息,統(tǒng)計(jì)上將這種“樣本加工不損失信息”稱為“充分性”。,樣本 x=(x1,x2,xn) 有一個(gè)樣本分布F (x), 這個(gè)分布包含了樣本中一切有關(guān)的信息。,84,統(tǒng)計(jì)量T =T (x1,x2,xn) 也有一個(gè)抽樣分布FT(t) ,當(dāng)我們期望用統(tǒng)計(jì)量T 代替原始樣本并且不損失任何有關(guān) 的信息時(shí),也就是期望抽樣分布 FT(t) 像 F(x) 一樣概括了有關(guān) 的一切信息,這即是說在統(tǒng)計(jì)量 T 的取值為 t 的情況下樣本 x 的條件分布 F(x|T=t) 已不含 的信息,這正是統(tǒng)計(jì)量具有充分性的含義。,85,這,與 無關(guān),86,定義5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 妊娠期卒中患者個(gè)體化治療方案的調(diào)整策略-1
- 固鎮(zhèn)綜合考試題目及答案
- 材料專業(yè)導(dǎo)論試題及答案
- 2026寶坻事業(yè)編考試題及答案
- 頭頸癌免疫治療后的靶向維持-1
- 大數(shù)據(jù)驅(qū)動(dòng)的醫(yī)療廢物風(fēng)險(xiǎn)分級(jí)管控策略-1
- 招工考試常識(shí)題及答案
- ps考試試卷及答案
- 2025年大學(xué)建筑工程施工(建筑施工組織)試題及答案
- 2025年大學(xué)衛(wèi)生信息管理(衛(wèi)生信息系統(tǒng))試題及答案
- JJF 2266-2025血液融漿機(jī)校準(zhǔn)規(guī)范
- 公司兩權(quán)分離管理制度
- 紫砂陶制品行業(yè)深度研究分析報(bào)告(2024-2030版)
- 餐飲公司監(jiān)控管理制度
- 種雞免疫工作總結(jié)
- 河南省商丘市柘城縣2024-2025學(xué)年八年級(jí)上學(xué)期期末數(shù)學(xué)試題(含答案)
- 教育機(jī)構(gòu)財(cái)務(wù)管理制度及報(bào)銷流程指南
- 給女朋友申請(qǐng)書
- 2023-2024學(xué)年北京市海淀區(qū)八年級(jí)上學(xué)期期末考試物理試卷含詳解
- 2024版房屋市政工程生產(chǎn)安全重大事故隱患判定標(biāo)準(zhǔn)內(nèi)容解讀
- GB 21258-2024燃煤發(fā)電機(jī)組單位產(chǎn)品能源消耗限額
評(píng)論
0/150
提交評(píng)論