樣本及抽樣分布.ppt_第1頁
樣本及抽樣分布.ppt_第2頁
樣本及抽樣分布.ppt_第3頁
樣本及抽樣分布.ppt_第4頁
樣本及抽樣分布.ppt_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第六章 樣本及抽樣分布,第一節(jié) 總體與樣本 第二節(jié) 樣本分布函數(shù) 直方圖 第三節(jié) 樣本函數(shù)與統(tǒng)計(jì)量 第四節(jié) 抽樣分布,前面五章我們講述了概率論的基本內(nèi)容 ,隨后的四章將講述數(shù)理統(tǒng)計(jì)數(shù)理統(tǒng)計(jì)是具有廣泛應(yīng)用的一個(gè)數(shù)學(xué)分支,它以概率論為理論基礎(chǔ),根據(jù)試驗(yàn)或觀察得到的數(shù)據(jù),來研究隨機(jī)現(xiàn)象,對(duì)研究對(duì)象的客觀規(guī)律性作出種種合理的估計(jì)和判斷 數(shù)理統(tǒng)計(jì)的內(nèi)容包括:如何收集、整理數(shù)據(jù)資料;如何對(duì)所得的數(shù)據(jù)資料進(jìn)行分析、研究,從而對(duì)所研究的對(duì)象的性質(zhì)、特點(diǎn)作出推斷后者就是我們所說的統(tǒng)計(jì)推斷問題。本書只講述統(tǒng)計(jì)推斷的基本內(nèi)容。本章我們介紹總體、隨機(jī)樣本及統(tǒng)計(jì)量等基本概念,并著重介紹幾個(gè)常用統(tǒng)計(jì)量及抽樣分布,第一節(jié)

2、總體與樣本,我們知道,雖然從理論上講,對(duì)隨機(jī)變量進(jìn)行大量的觀測(cè),被研究的隨機(jī)變量的概率特征一定能顯現(xiàn)出來,可是實(shí)際進(jìn)行的觀測(cè)次數(shù)只能是有限的,有的甚至是少量的 因此,我們關(guān)心的問題就是怎樣有效地利用收集到的有限的資料,盡可能地對(duì)被研究的隨機(jī)變量的概率特征作出精確而可靠的結(jié)論,例如,我們考察某廠生產(chǎn)的電視機(jī)顯像管的質(zhì)量,在正常生產(chǎn)情況下,顯像管的質(zhì)量主要表現(xiàn)為它們的平均壽命是穩(wěn)定的 然而,由于生產(chǎn)中各種隨機(jī)因素的影響,各個(gè)顯像管的壽命是不完全相同的 因?yàn)槭艿饺肆Α⑽锪Φ鹊南拗?,特別是測(cè)定顯像管壽命這類的試驗(yàn)具有破壞性,所以我們不可能對(duì)生產(chǎn)的全部顯像管一一進(jìn)行測(cè)試,一般只是從整批顯像管中取出一些顯

3、像管來測(cè)試,然后根據(jù)得到的這些顯像管壽命的數(shù)據(jù)來推斷整批顯像管的平均壽命,我們把被研究的對(duì)象的全體稱為總體(或母體),而把組成總體的各個(gè)元素稱為個(gè)體 在上面的例子中,該廠生產(chǎn)的所有顯像管的壽命就是總體,而每一個(gè)顯像管的壽命就是個(gè)體 代表總體的指標(biāo)(如顯像管的壽命)是一個(gè)隨機(jī)變量,所以總體就是指某個(gè)隨機(jī)變量可能取的值的全體,從總體中抽取一個(gè)個(gè)體,就是對(duì)代表總體的隨機(jī)變量進(jìn)行一次試驗(yàn)(或觀測(cè)),得到的一個(gè)試驗(yàn)數(shù)據(jù)(或觀測(cè)值) 從總體中抽取一部分個(gè)體,就是對(duì)隨機(jī)變量進(jìn)行若干次試驗(yàn)(觀測(cè)) 從總體中抽取若干個(gè)個(gè)體的過程稱為抽樣 抽樣結(jié)果得到的一組試驗(yàn)數(shù)據(jù)(觀測(cè)值),稱為樣本(或子樣); 樣本中所含個(gè)體

4、的數(shù)量稱為樣本容量,假設(shè)滿足下述兩個(gè)條件: (1)隨機(jī)性 為了使樣本具有充分的代表性,抽樣必須是隨機(jī)的,應(yīng)使總體中的每一個(gè)個(gè)體都有同等的機(jī)會(huì)被抽取到,通??梢杂镁幪?hào)抽簽的方法或利用隨機(jī)數(shù)表來實(shí)現(xiàn) (2)獨(dú)立性 各次抽樣必須是相互獨(dú)立的,即每次抽樣的結(jié)果既不影響其它各次抽樣的結(jié)果,也不受其它各次抽樣結(jié)果的影響 這種隨機(jī)的、獨(dú)立的抽樣方法稱為簡(jiǎn)單隨機(jī)抽樣,由此得到的樣本稱為簡(jiǎn)單隨機(jī)樣本,今后,凡是提到抽樣與樣本,都是指簡(jiǎn)單 隨機(jī)抽樣與簡(jiǎn)單隨機(jī)樣本 我們指出,從總體中抽取容量為n的樣本, 就是對(duì)代表總體的隨機(jī)變量隨機(jī)地、獨(dú)立地 進(jìn)行n次試驗(yàn)(觀測(cè)),每次試驗(yàn)的結(jié)果可以 看作是一個(gè)隨機(jī)變量,次試驗(yàn)的結(jié)

5、果就是n個(gè) 隨機(jī)變量 , ,這些隨機(jī)變量相互獨(dú)立,并且與總體服從相同的分布。設(shè)得到的樣本觀測(cè)值分別是 則可以認(rèn)為抽樣的結(jié)果是n個(gè)相互獨(dú)立的事件 發(fā)生了,若將樣本 , , 看作是一個(gè)維隨機(jī)變 量 ,則 (1)當(dāng)總體 是離散型隨機(jī)變量,若記其分布率為 ,則樣本 的分布律為: (1),(2)當(dāng)總體 是連續(xù)型隨機(jī)變量,且具有概率密度函數(shù) 時(shí) ,樣本 的概率密度為,(2),1.設(shè) 是來自兩點(diǎn)分布總體 的樣本, 的分布為:,求樣本分布律。,2.設(shè)有 個(gè)產(chǎn)品,其中有 個(gè)次品, 個(gè)正品,進(jìn)行放回抽樣,定義 如下:,求樣本 的分布律。,習(xí)題6-1,4.設(shè)某種電燈泡的壽命 服從指數(shù)分布,求來自這一總體的簡(jiǎn)單隨機(jī)樣

6、本 的聯(lián)合概率密度。 5.設(shè) 是來自均勻分布總體 的樣本,求樣本的聯(lián)合概率密度。,3 .設(shè)電話交換臺(tái)一小時(shí)內(nèi)的呼喚次數(shù) 服從泊松分布 ,求來自這一總體的簡(jiǎn)單隨機(jī)樣本 的樣本分布律。,第二節(jié) 樣本分布函數(shù) 直方圖,一、樣本分布函數(shù),我們把總體的分布函數(shù) 稱為總體分布函數(shù).從總體中抽取容量為n的樣本得到n個(gè)樣本觀測(cè)值,若樣本容量n較大,則相同的n觀測(cè)值可能重復(fù)出現(xiàn)若干次,為此,應(yīng)當(dāng)把這些觀測(cè)值整理,并寫出下面的樣本頻率分布表:,其中,定義 設(shè)函數(shù),其中和式 是對(duì)小于或等于 的一切 的頻率 求和,則稱 為樣本分布函數(shù),經(jīng)驗(yàn)分布函數(shù)。 易知樣本分布函數(shù) 具有下列性質(zhì):,(2) 是非減函數(shù),(1),(3

7、),(4) 在每個(gè)觀測(cè)值 處是右連續(xù)的,點(diǎn) 是 的跳躍間斷點(diǎn), 在該點(diǎn)的躍度就等于頻率,樣本分布函數(shù) 的圖形如圖6-1所示,圖6-1,對(duì)于任意的實(shí)數(shù) 總體分布函數(shù) 是事件 的概率;樣本分布函數(shù) 是事件 發(fā)生的頻率根據(jù)伯努利大數(shù)定理可知, 當(dāng) 時(shí),對(duì)于任意的正數(shù) ,有,格利文科(Glivenko)進(jìn)一步證明了 當(dāng) 時(shí),樣本分布函數(shù) 與總體分布函數(shù) 之間存在著更密切的近似關(guān)系的結(jié)論.這些結(jié)論就是我們?cè)跀?shù)理統(tǒng)計(jì)中可以依據(jù)樣本來推斷總體的理論基礎(chǔ),二、直方圖,數(shù)理統(tǒng)計(jì)中研究連續(xù)隨機(jī)變量 的樣本分布時(shí),通常需要作出樣本的頻率直方圖(簡(jiǎn)稱直方圖),作直方圖的步驟如下:,1.找出樣本觀測(cè)值 中的最小值與最大

8、值,分別記作 與 ,即,2.適當(dāng)選取略小于 的數(shù) 與略大于 的數(shù) ,并用分點(diǎn) 把區(qū)間 分成 個(gè)子區(qū)間 第 個(gè)子區(qū)間的長(zhǎng)度為,此外,為了方便起見,分點(diǎn) 應(yīng)比樣本觀測(cè)值 多取一位小數(shù)。,各子區(qū)間的長(zhǎng)度可以相等,也可以不等;若使各子區(qū)間的長(zhǎng)度相等,則有,子區(qū)間的個(gè)數(shù)一般取為8至15個(gè),太多則由于頻率的隨機(jī)擺動(dòng)而使分布顯得雜亂,太少則難于顯示分布的特征。,3.把所有樣本觀測(cè)值逐個(gè)分到各子區(qū)間內(nèi),并計(jì)算樣本觀測(cè)值落在各子區(qū)間內(nèi)的頻數(shù) 及頻率,4.在 軸上截取各子區(qū)間,并以各子區(qū)間為底,,所有小矩形的面積的和,這樣作出的所有小矩形就構(gòu)成了直方圖。,因?yàn)闃颖救萘?充分大時(shí),隨機(jī)變量 的取值落在各個(gè)子區(qū)間 內(nèi)

9、的頻率近似等于其概率 即 所以直方圖大致地描述了總體 的概率分布。,例 測(cè)量100個(gè)某種機(jī)械零件的質(zhì)量,得到樣本觀測(cè)值如下(單位:g) 246 251 259 254 246 253 237 252 250 251 249 244 249 244 243 246 256 247 252 252 250 247 255 249 247 252 252 242 245 240 260 263 254 240 255 250 256 246 249 253 246 255 244 245 257 252 250 249 255 248 258 242 252 259 249 244 251 250

10、241 253 250 265 247 249 253 247 248 251 251 249 246 250 252 256 245 254 258 248 255 251 249 252 254 246 250 251 247 253 252 255 254 247 252 257 258 247 252 264 248 244 寫出零件質(zhì)量的頻率分布表并作直方圖。,解,因?yàn)闃颖居^測(cè)中最小值為237,最大值為265,,所以我們把數(shù)據(jù)的 分布區(qū)間確定為 (236.5,266.5),并把這個(gè)區(qū)間等分 為10個(gè)子區(qū)間,(236.5,239.5), ( 239.5,242.5), , ( 263.

11、5,266.5),由此得到零件質(zhì)量的頻率分布表:,直方圖如圖62所示,圖62,習(xí)題62,第三節(jié) 樣本函數(shù)與統(tǒng)計(jì)量,為了通過對(duì)樣本觀測(cè)值的整理、分析、研究,對(duì)總體 的某些概率特征作出推斷,往往需要考慮各種適用的樣本函數(shù) 因?yàn)橐唤M樣本 可以看作是一個(gè) 維隨機(jī)變量 所以任何樣本函數(shù) 都是 維隨機(jī)變量的函數(shù),顯然也是隨機(jī)變量.根據(jù)樣本 的觀 測(cè)值 計(jì)算得到的函數(shù)值 就是樣本函數(shù) 的觀測(cè)值.,定義 若樣本函數(shù) 中不含有任何未知量,則稱這類樣本函數(shù)為統(tǒng)計(jì)量。,1.樣本均值 (1),觀測(cè)值記為 (2),2.樣本方差 (3),觀測(cè)值記為 (4),數(shù)理統(tǒng)計(jì)中最常用的統(tǒng)計(jì)量及其觀測(cè)值有:,3. 樣本標(biāo)準(zhǔn)差 (5)

12、 它的觀測(cè)值記為 (6) 4. 樣本k 階原點(diǎn)矩 (7) 它的觀測(cè)值記為 (8) 顯然,樣本的一階原點(diǎn)矩就是樣本均值。,5.樣本k階中心矩 (9) 它的觀測(cè)值記為 (10) 顯然,樣本一階中心矩恒等于零。 當(dāng)樣本容量 較大時(shí),相同的樣本觀測(cè)值 往 往可能重復(fù)出現(xiàn),為了使計(jì)算簡(jiǎn)化, 應(yīng)先把所得的數(shù)據(jù)整理,設(shè)得到下表:,(11),(12),(13),若總體 的 階矩 存在,獨(dú)立且與 同分布。故有,則當(dāng) 時(shí),進(jìn)而由第五章中關(guān)于依概率收斂的序列的性質(zhì)知道,其中 為連續(xù)函數(shù),這就是下一章所要介紹的矩估計(jì)法的理論根據(jù)。,從而由第五章的大數(shù)定理知,習(xí)題63,1.從某工人生產(chǎn)的鉚釘中隨機(jī)抽取5只,測(cè)得其直徑分

13、別為(單位:mm): 13.7 13.08 13.11 13.11 13.13 (1)寫出總體、樣本、樣本值、樣本容量 (2)求樣本觀測(cè)值的均值、方差。 2設(shè)抽樣得到樣本觀測(cè)值為 38.2 40.2 42.4 37.6 39.2 41.0 44.0 43.2 38.8 40.6 計(jì)算樣本均值、樣本標(biāo)準(zhǔn)差、樣本方差與樣本二 階中心矩。,5. 從總體中抽取兩組樣本,其容量分別為 及 , 設(shè)兩組的樣本均值分別為 及 樣本方差分別為 及 ,把這兩組樣本合并為一組容量為 的聯(lián) 合樣本,證明: (1)聯(lián)合樣本的樣本均值 (2)聯(lián)合樣本的樣本方差,第四節(jié) 抽樣分布,統(tǒng)計(jì)量的分布稱為抽樣分布。 在使用統(tǒng)計(jì)量進(jìn)

14、行統(tǒng)計(jì)推斷時(shí)常需知道它的分布. 當(dāng)總體的分布函數(shù)已知時(shí),抽樣分布是確定的,然而要求出統(tǒng)計(jì)量的精確分布,一般來說是困難的. 本節(jié)介紹來自正態(tài)總體的幾個(gè)常用統(tǒng)計(jì)量的分布. 今后,我們將看到這些分布在數(shù)理統(tǒng)計(jì)中有重要的應(yīng)用.,一、三個(gè)重要分布,為了討論正態(tài)總體下的抽樣分布,先引入由正態(tài) 分布導(dǎo)出的統(tǒng)計(jì)量中的三個(gè)重要分布,即 分布,分布,分布。 1. 分布 設(shè) 是來自總體 的樣本,則稱統(tǒng)計(jì)量 (1) 服從自由度為 的 分布, 記為,此處,自由度是指(1)式右端包含獨(dú)立變量個(gè)數(shù),分布的概率密度為,的圖形如圖63所示。,(2),圖6-3,此結(jié)論可推廣:設(shè) 且相互 獨(dú)立,分布的可加性,(證明略),則,若 ,

15、則有,分布的數(shù)學(xué)期望和方差,因,故,因此,又,于是,則稱點(diǎn) 為 的上 分位點(diǎn),分布的分位點(diǎn),定義 設(shè)有分布函數(shù) ,若對(duì)給定的,有,(6),當(dāng) 有密度函數(shù) 時(shí),式(6)可寫成,(7),由上述定義得 分布的上 分位點(diǎn)為,(8),如圖6-4所示,對(duì)于不同的 上 分位點(diǎn)的值已制成表格,可以查用(參見附表4)。,圖6-4,例如 對(duì)于 ,查得 但該表只詳列到 費(fèi)歇(R.A.Fisher)曾 證明,當(dāng) 充分大時(shí),近似地有 (9) 其中 是標(biāo)準(zhǔn)正態(tài)分布的上 分位點(diǎn)。利用(8)式 可以求得當(dāng) 時(shí), 分布的上 分位點(diǎn)的近似值,例如由(9)式可得 (由更詳細(xì)的表得 ),2. 分布,設(shè) , ,且 獨(dú)立,服從自由度為

16、的 分布,記為,分布又稱為學(xué)生氏(student)分布,分布的概率密度函數(shù)為,(11 ),圖6-5,的點(diǎn) 為 分布的上 分位點(diǎn).(見圖6-6),分布的分位點(diǎn),對(duì)于給定的 , ,稱滿足條件,(13),圖6-6,由 分布上 分位點(diǎn)的定義及 圖形的對(duì)稱性知,在 時(shí),對(duì)于常用的 的值,就用正態(tài)近似,(14),分布的上 分位點(diǎn)可自附表查得.,(15),3. 分布,記為,(16),的概率密度為,(17),圖6-7中畫出了 的圖形,由定義可知,若 則 ( 18),圖6-7,分布的分位點(diǎn),對(duì)于給定的 ,稱滿足條件,(19),的點(diǎn) 為 分布的上 分位點(diǎn)(圖6-8),圖6-8,容易證明等式:,(20),利用這個(gè)等

17、式,查附錄表,可以計(jì)算當(dāng),時(shí)的 的值,例如,F分布的上 分位點(diǎn)有表格可查(見附表 5),二、正態(tài)總體統(tǒng)計(jì)量分布,研究數(shù)理統(tǒng)計(jì)的問題時(shí),往往需要知道所討論的統(tǒng)計(jì)量 的分布一般說來,要確定某個(gè)統(tǒng)計(jì)量的分布是困難的,有的甚至是不可能的然而,對(duì)于總體服從正態(tài)分布的情形已經(jīng)有了詳盡的研究. 下面我們討論服從正態(tài)分布的總體的統(tǒng)計(jì)量的分布.,假設(shè) 是來自正態(tài)總體 的樣本,即它們是獨(dú)立同分布的,皆服從 分布,樣本均值與樣本方差分別是,定理1 設(shè)總體 服從正態(tài)分布 ,,(21),即,則,因?yàn)殡S機(jī)變量 相互獨(dú)立且與總體 服從相同的正態(tài)分布,證,所以,由正態(tài)分布的性質(zhì)可知,它們的線性組合服從,正態(tài)分布,即,這個(gè)定理

18、的證明從略,我們僅對(duì)自由度作一些說明,雖然是 個(gè)隨機(jī)變量的平方和,但是這些隨機(jī)變量不是相互獨(dú)立的 。因?yàn)樗鼈兊暮秃愕扔诹悖?由樣本方差 的定義易知,所以統(tǒng)計(jì)量,由于受到一個(gè)條件的約束,所以自由度為,上述兩定理是正態(tài)總體統(tǒng)計(jì)推斷的基礎(chǔ),因而是十分重要的,下面列舉其應(yīng)用 (有些結(jié)論我們放在習(xí)題6-4中),由定理1知,統(tǒng)計(jì)量,又由定理2知,統(tǒng)計(jì)量,因?yàn)?與 相互獨(dú)立,證,于是 ,由 分布的定義可知,統(tǒng)計(jì)量,例2 設(shè) 來自 , 是來自 的兩個(gè)獨(dú)立樣本,記,由定理1可知,統(tǒng)計(jì)量,證,且 與 相互獨(dú)立,由正態(tài)分布的性質(zhì)知,即,又由定理2知:,因?yàn)?與 相互獨(dú)立, 與 相互獨(dú)立,所以統(tǒng)計(jì)量 與 也相互獨(dú)立,因?yàn)?與 相互獨(dú)立,所以由 分布的可加性可知,統(tǒng)計(jì)量,于是,由

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論