理論分布和抽樣分布_第1頁
理論分布和抽樣分布_第2頁
理論分布和抽樣分布_第3頁
理論分布和抽樣分布_第4頁
理論分布和抽樣分布_第5頁
已閱讀5頁,還剩121頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章理論分布和抽樣分布

教學(xué)基本要求:了解幾種主要的理論分布和概率分布類型;理解小概率事件實(shí)際不可能性原理、樣本平均數(shù)的抽樣分布概念、t分布的概念;掌握正態(tài)分布標(biāo)準(zhǔn)化的方法以及正態(tài)分布概率的計(jì)算。教學(xué)重點(diǎn)難點(diǎn):重點(diǎn):小概率事件實(shí)際不可能性原理的概念,正態(tài)分布標(biāo)準(zhǔn)化的概念和方法及正態(tài)分布的概率計(jì)算方法。難點(diǎn):正態(tài)分布標(biāo)準(zhǔn)化。教學(xué)建議:先復(fù)習(xí)概率論中有關(guān)內(nèi)容1第二章理論分布和抽樣分布

2.1概率的統(tǒng)計(jì)學(xué)意義2.2小概率事件實(shí)際不可能性原理2.3理論分布2.4抽樣分布2.5t分布2第二章理論分布和抽樣分布為了便于理解統(tǒng)計(jì)分析的基本原理,正確掌握和應(yīng)用以后各章所介紹的統(tǒng)計(jì)分析方法,在上章樣本分布及其特征的基礎(chǔ)上本章將討論總體的分布及其特征。本章在介紹概率論中最基本的兩個(gè)概念——事件、概率的基礎(chǔ)上,重點(diǎn)介紹生物科學(xué)研究中常用的幾種隨機(jī)變量的概率分布:間斷性變數(shù)總體的理論分布:二項(xiàng)分布、泊松分布;連續(xù)性變數(shù)總體的理論分布,即正態(tài)分布;從這兩類理論分布中抽出的樣本統(tǒng)計(jì)數(shù)的分布,即抽樣分布和t分布。32.1概率的統(tǒng)計(jì)學(xué)意義一、事件1.必然現(xiàn)象與隨機(jī)現(xiàn)象在自然界與生產(chǎn)實(shí)踐和科學(xué)試驗(yàn)中,人們會(huì)觀察到各種各樣的現(xiàn)象,歸納起來大體上分為兩大類:必然現(xiàn)象:在保持條件不變的情況下,重復(fù)進(jìn)行試驗(yàn),其結(jié)果總是確定的,必然發(fā)生(或必然不發(fā)生),可預(yù)言其結(jié)果。隨機(jī)現(xiàn)象:在保持條件不變的情況下,重復(fù)進(jìn)行試驗(yàn),其結(jié)果未必相同,不可預(yù)言其結(jié)果。這類現(xiàn)象在個(gè)別試驗(yàn)中其結(jié)果呈現(xiàn)偶然性、不確定性現(xiàn)象。4一、攻關(guān)目標(biāo)2.1概率的統(tǒng)計(jì)學(xué)意義隨機(jī)現(xiàn)象有如下特點(diǎn):在一定的條件實(shí)現(xiàn)時(shí),有多種可能的結(jié)果發(fā)生,事前人們不能預(yù)言將出現(xiàn)哪種結(jié)果;對(duì)一次或少數(shù)幾次觀察或試驗(yàn)而言,其結(jié)果呈現(xiàn)偶然性、不確定性;但在相同條件下進(jìn)行大量重復(fù)試驗(yàn)時(shí),其試驗(yàn)結(jié)果卻呈現(xiàn)出某種固有的特定的規(guī)律性——頻率的穩(wěn)定性,通常稱之為隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。52.1概率的統(tǒng)計(jì)學(xué)意義2.隨機(jī)試驗(yàn)與隨機(jī)事件隨機(jī)試驗(yàn)通常我們把根據(jù)某一研究目的,在一定條件下對(duì)自然現(xiàn)象所進(jìn)行的觀察或試驗(yàn)統(tǒng)稱為試驗(yàn)。而一個(gè)試驗(yàn)如果滿足下述三個(gè)特性,則稱其為一個(gè)隨機(jī)試驗(yàn):隨機(jī)現(xiàn)象有如下特點(diǎn):(1)試驗(yàn)可以在相同條件下多次重復(fù)進(jìn)行;(2)每次試驗(yàn)的可能結(jié)果不止一個(gè),并且事先知道會(huì)有哪些可能的結(jié)果;(3)每次試驗(yàn)總是恰好出現(xiàn)這些可能結(jié)果中的一個(gè),但在一次試驗(yàn)之前不能肯定這次試驗(yàn)會(huì)出現(xiàn)哪一個(gè)結(jié)果。例如在一定孵化條件下,孵化6枚種蛋,觀察其出雛情況,具有隨機(jī)試驗(yàn)的三個(gè)特征。6一、攻關(guān)目標(biāo)2.1概率的統(tǒng)計(jì)學(xué)意義2.隨機(jī)試驗(yàn)與隨機(jī)事件隨機(jī)事件

隨機(jī)試驗(yàn)的每一種可能結(jié)果,在一定條件下可能發(fā)生,也可能不發(fā)生,稱為隨機(jī)事件,簡稱事件。(1)基本事件把不能再分的事件稱為基本事件。例如,在編號(hào)為1、2、3、…、10的十頭豬中隨機(jī)抽取1頭,有10種不同的可能結(jié)果:“取得一個(gè)編號(hào)是1”、…,這10個(gè)事件都是不可能再分的事件。由若干個(gè)基本事件組合而成的事件稱為復(fù)合事件。如“取得一個(gè)編號(hào)是2的倍數(shù)”是一個(gè)復(fù)合事件,它由5個(gè)基本事件組合而成。72.1概率的統(tǒng)計(jì)學(xué)意義2.隨機(jī)試驗(yàn)與隨機(jī)事件隨機(jī)事件

(2)必然事件把在一定條件下必然會(huì)發(fā)生的事件稱為必然事件。例如,在嚴(yán)格按妊娠期母豬飼養(yǎng)管理的要求飼養(yǎng)的條件下,妊娠正常的母豬經(jīng)114天左右產(chǎn)仔,就是一個(gè)必然事件。(3)不可能事件

把在一定條件下不可能發(fā)生的事件稱為不可能事件。例如,在滿足一定孵化條件下,從石頭孵化出雛雞,就是一個(gè)不可能事件。必然事件與不可能事件實(shí)際上是確定性現(xiàn)象,即它們不是隨機(jī)事件,但是為了方便起見,我們把它們看作為兩個(gè)特殊的隨機(jī)事件。82.1概率的統(tǒng)計(jì)學(xué)意義二、概率(一)概率的統(tǒng)計(jì)定義

研究隨機(jī)試驗(yàn),僅知道可能發(fā)生哪些隨機(jī)事件是不夠的,還需了解各種隨機(jī)事件發(fā)生的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)計(jì)規(guī)律性,從而指導(dǎo)實(shí)踐。這就要求有一個(gè)能夠刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo),這指標(biāo)應(yīng)該是事件本身所固有的,且不隨人的主觀意志而改變,人們稱之為概率(probability)。事件A的概率記為P(A)。92.1概率的統(tǒng)計(jì)學(xué)意義事件發(fā)生的可能性(概率)是在大量的實(shí)驗(yàn)中觀察得到的,例如棉田發(fā)生盲椿象為害的情況,并不是所有的棉株都受害,隨著觀察的次數(shù)增多,我們對(duì)棉株受害可能性程度大小的把握越準(zhǔn)確、越穩(wěn)定,棉株受害為隨機(jī)事件。下表為一個(gè)調(diào)查結(jié)果:

102.1概率的的統(tǒng)計(jì)計(jì)學(xué)意意義從棉株株受害害情況況調(diào)查查結(jié)果果看,,頻率率在n取不同同的值值時(shí),,盡管管調(diào)查查田塊塊是相相同的的,頻頻率p卻不同同,只只有在在n很大時(shí)時(shí)頻率率才比比較穩(wěn)穩(wěn)定一一致。。因而而,調(diào)調(diào)查株株數(shù)n較多時(shí)時(shí)的穩(wěn)穩(wěn)定頻頻率才才能較較好地地代表表棉株株受害害的可可能性性。統(tǒng)計(jì)學(xué)學(xué)上把把通過大大量實(shí)實(shí)驗(yàn)而而估計(jì)計(jì)的概概率稱稱為實(shí)實(shí)驗(yàn)概概率或或統(tǒng)計(jì)計(jì)概率率,用n較大時(shí)時(shí)穩(wěn)定定的p近似代代表概概率,,稱為為隨機(jī)機(jī)事件件A的概率率:P(A)=p≈≈m/n(n→→∞)此處P代表概概率,,P(A)代表事事件A的概率率。112.1概率的的統(tǒng)計(jì)計(jì)學(xué)意意義然而,,正如如此試試驗(yàn)中中出現(xiàn)現(xiàn)的情情況,,盡管管頻率率比較較穩(wěn)定定,但但仍有有較小小的數(shù)數(shù)值波波動(dòng),,說明明觀察察的頻頻率只只是對(duì)對(duì)棉株株受害害這個(gè)個(gè)事件件的概概率的的估計(jì)計(jì)。122.1概率的的統(tǒng)計(jì)計(jì)學(xué)意意義(二))概率率的古古典定定義對(duì)于某某些隨隨機(jī)事事件,,用不不著進(jìn)進(jìn)行多多次重重復(fù)試試驗(yàn)來來確定定其概概率,,而是是根據(jù)據(jù)隨機(jī)機(jī)事件件本身身的特特性直直接計(jì)計(jì)算其其概率率。有很多多隨機(jī)機(jī)試驗(yàn)驗(yàn)具有有以下下特征征:1、試驗(yàn)驗(yàn)的所所有可可能結(jié)結(jié)果(基本事事件數(shù)數(shù))只有有有限個(gè)個(gè);2、各個(gè)個(gè)試驗(yàn)驗(yàn)的可可能結(jié)結(jié)果出出現(xiàn)的的可能能性相相等,,即所所有基基本事事件的的發(fā)生生是等等可能能的;;3、試驗(yàn)驗(yàn)的所所有可可能結(jié)結(jié)果兩兩兩互互不相相容。。具有上上述特特征的的隨機(jī)機(jī)試驗(yàn)驗(yàn),稱稱為古典概概型。132.1概率的的統(tǒng)計(jì)計(jì)學(xué)意意義對(duì)于古古典概概型,,概率率的定定義如如下::設(shè)樣本本空間間由n個(gè)等可可能的的基本本事件件所構(gòu)構(gòu)成,,其中中事件件A包含有有m個(gè)基本本事件件,則則事件件A的概率率為m/n,即P(A)=m/n這樣定定義的的概率率稱為為古典概概率。142.1概率的的統(tǒng)計(jì)計(jì)學(xué)意意義例如,,在有有兩個(gè)個(gè)孩子子的家家庭中中,孩孩子性性別的的組成成有四四種類類型。。即::男男男、男男女、、女男男、女女女。。它們們是四四個(gè)基基本事事件,,而且且是互互不相相容且且等可可能的的,那那么兩兩個(gè)男男孩的的事件件A1為四個(gè)個(gè)基本本事件件(n)中的一一個(gè)(m),A1的概率率P(A1)=1/4=0.25第一個(gè)個(gè)是男男孩的的事件件A2,包括括男男男,男男女兩兩個(gè)基基本事事件。。A2的概率率P(A2)=2/4=0.50152.1概率的統(tǒng)統(tǒng)計(jì)學(xué)意意義概率的古古典定義義是在概概率論發(fā)發(fā)展史上上早期提提出來的的,它存存在嚴(yán)重重缺點(diǎn)。。首先,它它要求各各基本事事件是等等可能的的,即等等概率的的。在尚尚未給出出概率的的定義之之前,利利用概率率的概念念定義概概率是不不可取的的。其次,它它存在很很大的局局限性,,只適用用于基本本事件數(shù)數(shù)是有限限的一類類試驗(yàn),,對(duì)于基基本事件件數(shù)是無無限的一一類就無無能為力力了。雖然如此此,在實(shí)實(shí)際應(yīng)用用中,它它還是被被廣泛地地使用。。162.1概率的統(tǒng)統(tǒng)計(jì)學(xué)意意義例在N頭奶牛中中,有M頭曾有流流產(chǎn)史,,從這群群奶牛中中任意抽抽出n頭奶牛,,試求:(1)其中恰有有m頭有流產(chǎn)產(chǎn)史奶牛牛的概率率是多少少?(2)若N=30,M=8,n=10,m=2,其概率率是多少少?172.1概率的統(tǒng)統(tǒng)計(jì)學(xué)意意義我們把從從有M頭奶牛曾曾有流產(chǎn)產(chǎn)史的N頭奶牛中中任意抽抽出n頭奶牛,,其中恰恰有m頭有流產(chǎn)產(chǎn)史這一一事件記記為A,因?yàn)閺腘頭奶牛牛中中任意意抽抽出n頭奶牛牛的基本本事件總總數(shù)為;;事件A所包含的的基本事事件數(shù)為為;;因此所求求事件A的概率為為:18一、攻關(guān)關(guān)目標(biāo)2.1概率的統(tǒng)統(tǒng)計(jì)學(xué)意意義將N=30,M=8,n=10,m=2代入上式式,得=0.0695即在30頭奶牛中中有8頭曾有流流產(chǎn)史,,從這群群奶牛隨隨機(jī)抽出出10頭奶牛其其中有2頭曾有流流產(chǎn)史的的概率為為6.95%。192.1概率的統(tǒng)統(tǒng)計(jì)學(xué)意意義(三)概概率的性性質(zhì)1、對(duì)于任任何事件件A,有0≤P(A)≤1;2、必然事事件的概概率為1,即P(Ω)=1;3、不可能能事件的的概率為為0,即P(ф)=0。20一、攻關(guān)關(guān)目標(biāo)2.2小概率事事件實(shí)際際不可能能性原理理隨機(jī)事件件的概率率表現(xiàn)了了事件的的客觀統(tǒng)統(tǒng)計(jì)規(guī)律律性,它它反映了了事件在在一次試試驗(yàn)中發(fā)發(fā)生可能能性的大大小,概概率大大表示事事件發(fā)生生的可能能性大,,概率小小表示事事件發(fā)生生的可能能性小。。若隨機(jī)機(jī)事件的的概率很很小,例例如小于于0.05、0.01、0.001,稱之為為小概率事事件。21一、攻關(guān)關(guān)目標(biāo)2.2小概率事事件實(shí)際際不可能能性原理理在統(tǒng)計(jì)學(xué)學(xué)上,把小概率率事件在在一次試試驗(yàn)中看看成是實(shí)實(shí)際不可可能發(fā)生生的事件件稱為小概概率事件件實(shí)際不不可能性性原理,,亦稱為為小概率原原理。小概率事事件實(shí)際際不可能能性原理理是統(tǒng)計(jì)計(jì)學(xué)上進(jìn)進(jìn)行假設(shè)設(shè)檢驗(yàn)((顯著性性檢驗(yàn)))的基本本依據(jù)。。這里的0.05或0.01稱為小概概率標(biāo)準(zhǔn)準(zhǔn),生物物試驗(yàn)研研究中通通常使用用這兩個(gè)個(gè)小概率標(biāo)標(biāo)準(zhǔn)。222.3理論分布布事件的概概率表示示了一次次試驗(yàn)?zāi)衬骋粋€(gè)結(jié)結(jié)果發(fā)生生的可能能性大小小。若要要全面了了解試驗(yàn)驗(yàn),則必必須知道道試驗(yàn)的的全部可可能結(jié)果果及各種種可能結(jié)結(jié)果發(fā)生生的概率率,即必必須知道道隨機(jī)試試驗(yàn)的概概率分布布(probabilitydistribution)。為了深深入研究究隨機(jī)試試驗(yàn),,我們先先引入隨機(jī)變量量(randomvariable)的概念。。232.3理論分布布第一節(jié)、、隨機(jī)變變量隨機(jī)變量量就是在在隨機(jī)試試驗(yàn)中被被測定的的量。例如,觀觀察10只新生動(dòng)動(dòng)物的性性別是一一隨機(jī)試試驗(yàn),而而其中雄雄性動(dòng)物物出現(xiàn)的的只數(shù)Y,就是在在隨機(jī)試試驗(yàn)中被被測定的的量,Y可取0,1,…,10中的任何值。。但是它究竟竟取何值,在在試驗(yàn)結(jié)束之之前是不能確確知的。一般般來說,在隨隨機(jī)試驗(yàn)中,,被測定的量量是可取不同同值的變量,,而且它究竟竟取何值具有有隨機(jī)性,我我們稱這樣的的量為隨機(jī)變量。隨機(jī)變量所所取得的值稱稱為觀測值。242.3理論分布有時(shí)隨機(jī)試驗(yàn)驗(yàn)結(jié)果本身就就是數(shù)量,如如測量我國男男青年身高本本身就是數(shù)量量。有時(shí),隨隨機(jī)試驗(yàn)的結(jié)結(jié)果本身不是是數(shù)量,但可可以表示為數(shù)數(shù)量。如觀觀察每10只新生動(dòng)物的的性別,本身身并不是數(shù)量量,但可以記記為10只動(dòng)物中雄性性動(dòng)物的只數(shù)數(shù)或雌性動(dòng)物物的只數(shù),即即試驗(yàn)結(jié)果可可以表示為數(shù)數(shù)量。這個(gè)數(shù)數(shù)量的具體值值,同樣是由由隨機(jī)試驗(yàn)的的結(jié)果而確定定。252.3理論分布根據(jù)隨機(jī)變量量可能取得的的值,可將隨隨機(jī)變量分為為離散型隨機(jī)變變量和連續(xù)型隨機(jī)變變量:如果隨機(jī)變量量可能取得的的數(shù)值為有限限個(gè),或可數(shù)數(shù)無窮個(gè)孤立立的數(shù)值,且且以各種確定定的概率取這這些不同的值值,則稱為為離散型隨機(jī)變變量。例如,每10只新生動(dòng)物中中,雄性動(dòng)物物的只數(shù)。如果隨機(jī)變量量可取某一(有限或無限)區(qū)間內(nèi)的任何何數(shù)值,且Y其取值范圍內(nèi)內(nèi)的任一區(qū)間間中取值時(shí),,其概率是確確定的,則稱稱為連續(xù)型隨機(jī)變變量。例如我國男男青年身高即即為一連續(xù)型型隨機(jī)變量。。262.3理論分布隨機(jī)變量可能能取值的全體體稱為總體,其n次獨(dú)立觀測值值,稱為樣本。本書均以大大寫的拉丁字字母,如X,Y,U等表示隨機(jī)變變量,而以小小寫字母如、、等等表示第i次觀測值。有了隨機(jī)變量量的概念,事事件就可以用用隨機(jī)變量的的關(guān)系式表示示。如在10只動(dòng)物中,出出現(xiàn)3只和3只以下雄性動(dòng)動(dòng)物的事件即即可寫為Y≤3。272.3理論分布離散型隨機(jī)變變量的概率分分布要了解離散型型隨機(jī)變量Y的統(tǒng)計(jì)規(guī)律,,就必須知道道它的一切可可能值yi及取每種可能能值的概率pi。如果將離散型型隨機(jī)變量Y的一切可能取取值y的概率P(Y=y)寫成y的函數(shù)稱為隨隨機(jī)變量Y的概率函數(shù)::p(y)=P(Y=y)(2.16)概率函數(shù)應(yīng)滿滿足p(y)≥0,(2.17)28第二章理理論分布和抽抽樣分布將Y的一切可能值值,,,,…,以及取得這這些值的概率率、、…,排列起來,,就構(gòu)成了了離散型隨機(jī)機(jī)變量的概率分布(probabiitdistribution)。表2-2離散型隨機(jī)變變量的概率分分布表。

Y

P(yi)

292.3理論分布連續(xù)型隨機(jī)變變量的概率分分布連續(xù)型隨機(jī)機(jī)變量(如體長、體體重、)的概率分布布不能用上上述分布表表來表示,,因?yàn)槠淇煽赡苋〉闹抵凳遣豢蓴?shù)數(shù)的。我們們改用隨機(jī)機(jī)變量Y在某個(gè)區(qū)間內(nèi)取值的概概率P(a≤Y<b)來表示。下面通過頻頻率分布密密度曲線予予以說明。。302.3理論分布如由140行水稻產(chǎn)量量資料的頻頻數(shù)分布方方柱形圖(圖3—1),圖中縱座座標(biāo)取頻數(shù)數(shù)與組距的的比值。??梢栽O(shè)想想,如果果樣本取得得越來越大大(n→∞),組分得越越來越細(xì)(i→0),某一范圍圍內(nèi)的頻率率將趨近于于一個(gè)穩(wěn)定定值───概率。。這時(shí),,頻率分分布方柱形形圖各個(gè)方方柱上端中中點(diǎn)的聯(lián)線線──頻頻率分布布折線將逐逐漸趨向于于一條曲線線,換句話話說,當(dāng)n→∞、i→0時(shí),頻數(shù)分布折折線的極限限是一條穩(wěn)穩(wěn)定的函數(shù)數(shù)曲線。31第二章理理論分布布和抽樣分分布32第二章理理論分布布和抽樣分分布對(duì)于樣本是是取自連續(xù)續(xù)型隨機(jī)變變量的情況況,這條條函數(shù)曲線線將是光滑滑的。這這條曲線排排除了抽樣樣和測量的的誤差,,完全反反映了水稻稻行產(chǎn)量的的變動(dòng)規(guī)律律。這條條曲線叫概率分布曲曲線,相應(yīng)的函函數(shù)f(y)叫概率密度函函數(shù)。332.3理論分布若記產(chǎn)量概概率分布密密度函數(shù)為為f(y),則y取值于區(qū)間間(a,b)的概率為::上式為連續(xù)續(xù)型隨機(jī)變變量Y在區(qū)間(a,b)上取值概率率的表達(dá)式式。可見,,連續(xù)型隨隨機(jī)變量的的概率由概概率分布密密度函數(shù)確確定。34第二章理理論分布布和抽樣分分布連續(xù)型隨機(jī)機(jī)變量概率率分布的性性質(zhì):1、分布密度度函數(shù)總是是大于或等等于0,即f(y)≥0;2、當(dāng)隨機(jī)變變量Y取某一特定值值時(shí),其概率率等于0;即(c為任意實(shí)數(shù)數(shù))因而,對(duì)于于連續(xù)型隨隨機(jī)變量,,僅研究其其在某一個(gè)個(gè)區(qū)間內(nèi)取取值的概率率,而不去去討論取某某一個(gè)值的的概率。35第二章理理論分布布和抽樣分分布3、在一一次試驗(yàn)中中隨機(jī)變變量Y之取值必必在-∞<Y<+∞范圍內(nèi),為為一必然事事件。所以以上式表示分分布密度曲曲線下、橫橫軸上的全全部面積為為1。362.3理論分布第二節(jié)二二項(xiàng)分布布一、二項(xiàng)分分布的概念念在生物學(xué)研研究中,有有這樣一類類常見的變變量,其總總體中的全全部個(gè)體可可以根據(jù)某某種性狀的的出現(xiàn)與否否分為兩類類。例如,,一粒種子可可能發(fā)芽也也可能不發(fā)發(fā)芽、隨機(jī)機(jī)抽出一只只動(dòng)物可能能是雌性也也可能是雄雄性等,這類變量屬屬于間斷性性隨機(jī)變量量,其總體體包括非此即彼的兩項(xiàng)對(duì)立立事件,這這樣的總體體稱為二項(xiàng)總體。。372.3理論論分分布布為便便于于研研究究,,通通常常將將二二項(xiàng)項(xiàng)總總體體中中的的“此”事件件以以變變量量“1””表示示,,具具概概率率;將將“彼”事件件以以變變量量“0””表示示,,具具概概率率。。因因而而二二項(xiàng)項(xiàng)總總體體又又稱稱為為0、1總體體。382.3理論論分分布布如果果從從二二項(xiàng)項(xiàng)總總體體抽抽取取n個(gè)個(gè)個(gè)體體,,可可能能得得到到y(tǒng)個(gè)個(gè)個(gè)體體屬屬于于“此”,而而屬屬于于“彼”的個(gè)個(gè)體體為為n-y。由由于于是是隨隨機(jī)機(jī)獨(dú)獨(dú)立立地地從從總總體體中中抽抽取取個(gè)個(gè)體體的的,,每每一一次次抽抽取取的的個(gè)個(gè)體體均均有有可可能能屬屬于于“此”,也也可可能能屬屬于于“彼”,那那么么得得到到的的y個(gè)“此”個(gè)體體的的數(shù)數(shù)目目可可能能為為0、1、2、…、n個(gè),,共共有有n+l種取取值值,,這這n+l種取取值值各各有有其其對(duì)對(duì)應(yīng)應(yīng)的的概概率率,,因因而而由由變變量量及及其其概概率率就就構(gòu)構(gòu)成成了了一一個(gè)個(gè)分分布布,,這這個(gè)個(gè)分分布布叫叫做做二項(xiàng)項(xiàng)式式概概率率分分布布,簡簡稱稱二二項(xiàng)項(xiàng)式式分分布布或或二項(xiàng)項(xiàng)分分布布(binomialdistribution)。392.3理論論分分布布動(dòng)物物的的性性別別比比一一般般為為1∶∶1,即即?!,F(xiàn)現(xiàn)從從一一動(dòng)動(dòng)物物群群體體中中進(jìn)進(jìn)行行隨隨機(jī)機(jī)抽抽樣樣,,共共抽抽取取10次,,則則抽抽到到3只雄雄性性動(dòng)動(dòng)物物的的概概率率可可分分析析為為::在10次抽抽樣樣中中,,抽抽到到3雄7雌的的組組合合方方式式數(shù)數(shù)為為::而每每種種抽抽樣樣方方式式中中,,10次抽抽樣樣得得到到3只雄雄性性的的概概率率為為::所以以抽抽取取10次,,抽抽到到3只雄雄性性動(dòng)動(dòng)物物的的概概率率為為::402.3理論論分分布布對(duì)于于任任意意n和y,則則可可寫寫成成通通式式::上式式正正是是二二項(xiàng)項(xiàng)式式展展開開式式的的第第y+1項(xiàng),,故故稱稱二二項(xiàng)項(xiàng)分分布布,,上上式式稱稱作作二項(xiàng)項(xiàng)概概率率公公式式。。因?yàn)闉椋?,所所以以:?12.3理論論分分布布二、、二二項(xiàng)項(xiàng)分分布布的的性性質(zhì)質(zhì)1、二二項(xiàng)項(xiàng)分分布布的的概概率率之之和和等等于于12、二二項(xiàng)項(xiàng)分分布布由由n和兩個(gè)個(gè)參參數(shù)數(shù)決決定定::當(dāng)值值較較小小且且n不大大時(shí)時(shí),,分分布布是是偏偏倚倚的的。。但但隨隨著著n的增大,分分布逐漸趨于于對(duì)稱;當(dāng)值趨于0.5時(shí),分布趨趨于對(duì)稱;在n較大,、較接近時(shí),,二項(xiàng)分布接接近于正態(tài)分分布;當(dāng)n→∞時(shí),二項(xiàng)分布布的極限分布布是正態(tài)分布布。422.3理論分布432.3理論分布三、二項(xiàng)分布布的概率計(jì)算算例1一批種子發(fā)芽芽率為70%,每穴播種6粒種子,計(jì)算算每穴出6棵苗、5、4、3、2、1、0棵苗的概率各各為多少?解:設(shè)y表示每穴出苗苗數(shù)442.3理論分布例2純種白豬與純純種黑豬雜交交,根據(jù)孟德德爾遺傳理論論,子二代代中白豬與黑黑豬的比率為為3∶1。求窩產(chǎn)仔10頭,有7頭白豬的概率率。根據(jù)題意,n=10,=0.75,。。設(shè)10頭仔豬中白色色的為y頭,則y為服從二項(xiàng)分分布B(10,0.75)的隨機(jī)變量。。于是窩產(chǎn)10頭仔豬中有7頭是白色的概概率為:452.3理論分布例3設(shè)在家畜中感感染某種疾病病的概率為20%,現(xiàn)有兩種種疫苗,用疫疫苗A注射了15頭家畜后無一一感染,用疫疫苗B注射15頭家畜后有1頭感染。設(shè)各各頭家畜沒有有相互傳染疾疾病的可能,,問:應(yīng)該如如何評(píng)價(jià)這兩兩種疫苗?假設(shè)疫苗A完全無效,那那么注射后的的家畜感染的的概率仍為20%,則15頭家畜中染病病頭數(shù)y=0的概率為:462.3理論分布同理,如果疫疫苗B完全無效,則則15頭家畜中最多多有1頭感染的概率率為:由計(jì)算可知,,注射A疫苗無效的概概率為0.0352,比B疫苗無效的概概率0.1671小得多。因此此,可以認(rèn)為為A疫苗是有效的的,但不能認(rèn)認(rèn)為B疫苗也是有效效的。472.3理論分布在輻射育種實(shí)實(shí)驗(yàn)中,已知知經(jīng)過處理的的單株至少發(fā)發(fā)生一個(gè)有利利突變的概率率是,,群體中至至少出現(xiàn)一株株有利突變單單株的概率為為,,問為了至至少得到一株株有利突變的的單株,群體體n應(yīng)多大?解:己知為為單株株至少發(fā)生一一個(gè)有利突變變的概率則為為單株不發(fā)發(fā)生一個(gè)有利利突變的概率率48第二章章理理論論分布布和抽四、二二項(xiàng)分分布的的平均均數(shù)與與標(biāo)準(zhǔn)準(zhǔn)差統(tǒng)計(jì)學(xué)學(xué)證明明,服服從二二項(xiàng)分分布B(n,)的隨機(jī)機(jī)變量量的平平均數(shù)數(shù)μ、標(biāo)準(zhǔn)準(zhǔn)差σ與參數(shù)數(shù)n、有如下下關(guān)系系:當(dāng)試驗(yàn)驗(yàn)結(jié)果果以事事件A發(fā)生次次數(shù)k表示時(shí)時(shí)49第二章章理理論論分布布和抽抽樣分分布例:求=0.2,n=5時(shí)的平平均死死亡豬豬數(shù)及及死亡亡數(shù)的的標(biāo)準(zhǔn)準(zhǔn)差。。平均死死亡豬豬數(shù)μ=5×0.20=1.0(頭)標(biāo)準(zhǔn)差差=0.894(頭)50第二章章理理論論分布布和抽抽樣分分布當(dāng)試驗(yàn)驗(yàn)結(jié)果果以事事件A發(fā)生的的頻率率k/n表示時(shí)時(shí)也稱為為總體體百分分?jǐn)?shù)標(biāo)標(biāo)準(zhǔn)誤誤。512.3理論分分布第三節(jié)節(jié)泊泊松松分布布泊松分分布是是一種種可以以用來來描述述和分分析隨隨機(jī)地地發(fā)生生在單單位空空間或或時(shí)間間里的的稀有事事件的概率率分布布。要要觀察察到這這類事事件,,樣本本含量量n必須很很大。。在生物物學(xué)研研究中中,服服從泊泊松分分布的的隨機(jī)機(jī)變量量是常常見的的。如如,一一定定群體體中某某種患患病率率很低低的非非傳染染性疾疾病患患病數(shù)數(shù)或死死亡數(shù)數(shù),群群體中中遺傳傳的畸畸形怪怪胎數(shù)數(shù),每每升飲飲水中中大腸腸桿菌菌數(shù),,計(jì)數(shù)數(shù)器小小方格格中血血球數(shù)數(shù),單單位空空間中中某些些野生生動(dòng)物物或昆昆蟲數(shù)數(shù)等,,都是是服從從泊松松分布布的。。522.3理論分分布一、泊泊松分分布的的意義義在二項(xiàng)項(xiàng)分布布中,,當(dāng)某某事件件出現(xiàn)現(xiàn)的概概率特特別小小(),而樣樣本含含量又又很大大()且時(shí)時(shí),二二項(xiàng)分分布就就變成成泊松松分布布(Poissondistribution),具有有概率率密度度函數(shù)數(shù):其中;e=2.7182……是自然然對(duì)數(shù)數(shù)的底底數(shù),,稱y服從參參數(shù)為為的的泊松松分布布,記為~~。。532.3理論分分布二、泊松分分布的特征征數(shù)泊松分布的的平均數(shù)::即泊松分布布的平均數(shù)數(shù)為概率密密度函數(shù)中中的。。泊松分布的的方差:即泊松分布布的方差為為概率密度度函數(shù)中的的。。所以,泊松松分布具有有重要特征征:平均數(shù)和方方差相等,,都等于常常數(shù)。。泊松分布的的偏斜度::泊松分布的的峭度:當(dāng)(≥20)很大時(shí),泊泊松分布近近似于正態(tài)態(tài)分布。542.3理論分布例調(diào)查某種豬豬場閉鎖育育種群仔豬豬畸形數(shù),,共記錄200窩,畸形形仔豬數(shù)的的分布情況況如表所示示。試判斷斷畸形仔豬豬數(shù)是否服服從泊松分分布。樣本均數(shù)和和方差:樣本均數(shù)和和方差兩個(gè)個(gè)數(shù)是相當(dāng)當(dāng)接近的,,因此可可以認(rèn)為畸畸形仔豬數(shù)數(shù)服從泊松松分布。552.3理論分布將代代替替公式中的的得得::e-0.51=1.6653,畸形仔豬豬數(shù)各項(xiàng)的的概率為::P(y=0)=0.510/(0!×1.6653)=0.6005P(y=1)=0.511/(1!×1.6653)=0.3063P(y=2)=0.512/(2!×1.6653)=0.0781P(y=3)=0.513/(3!×1.6653)=0.0133P(y=4)=0.514/(4!×1.6653)=0.0017把上面各項(xiàng)項(xiàng)概率乘以以總觀察窩窩數(shù)(n=200)即得各項(xiàng)按按泊松分布布的理論窩窩數(shù)。562.3理論分布表畸形仔豬數(shù)數(shù)的泊松分分布將實(shí)際計(jì)算算得的頻率率與根據(jù)=0.51的泊松分布布計(jì)算的概概率相比較較,發(fā)現(xiàn)現(xiàn)畸形仔豬豬的頻率分分布與=0.51的泊松分布布是吻合得得很好的。。這進(jìn)一一步說明了了畸形仔豬豬數(shù)是服從從泊松分布布的。572.3理論分布第三節(jié)泊泊松分布布P47例3.5582.3理論分布例為監(jiān)測飲用用水的污染染情況,現(xiàn)現(xiàn)檢驗(yàn)?zāi)衬成鐓^(qū)每毫毫升飲用水水中細(xì)菌數(shù)數(shù),共共得400個(gè)記錄如下下:試分析飲用用水中細(xì)菌菌數(shù)的分布布是否服從從泊松分布布。若服從從,按泊松松分布計(jì)算算每毫升水水中細(xì)菌數(shù)數(shù)的概率及及理論次數(shù)數(shù)并將頻率率分布與泊泊松分布作作直觀比較較。592.3理論分布經(jīng)計(jì)算得每每毫升水中中平均細(xì)菌菌數(shù)和方差差:兩者很接近近,故可可認(rèn)為每毫毫升水中細(xì)細(xì)菌數(shù)服從從泊松分布布。將代代替替公式中的的得得::計(jì)算結(jié)果如如下表:602.3理論分布表細(xì)菌數(shù)的泊泊松分布可見細(xì)菌數(shù)數(shù)的頻率分分布與的的泊松松分布是相相當(dāng)吻合的的,進(jìn)進(jìn)一步說明明用泊松分分布描述單單位容積(或面積)中細(xì)菌數(shù)的的分布是適適宜的。612.3理論分布第四節(jié)正正態(tài)分布布正態(tài)分布是是一種很重重要的連續(xù)續(xù)型隨機(jī)變變量的概率率分布。生生物現(xiàn)象中中有許多變變量是服從從或近似服服從正態(tài)分分布的。許許多統(tǒng)計(jì)分分析方法都都是以正態(tài)態(tài)分布為基基礎(chǔ)的。此此外,還有有不少隨機(jī)機(jī)變量的概概率分布在在一定條件件下以正態(tài)態(tài)分布為其其極限分布布。因此在在統(tǒng)計(jì)學(xué)中中,正態(tài)分分布無論在在理論研究究上還是實(shí)實(shí)際應(yīng)用中中,均占占有重要的的地位。622.3理論分布一、正態(tài)分分布的定義義及其特征征(一)正態(tài)分布布的定義義若連續(xù)型型隨機(jī)變變量Y的概率分分布密度度函數(shù)為為:其中μ為平均數(shù)數(shù),為為方方差,則則稱隨機(jī)機(jī)變量Y服從正態(tài)態(tài)分布(normaldistribution),記為為Y~N(μ,)。632.3理論分布布642.3理論分布布對(duì)于任意意正態(tài)分分布,隨隨機(jī)變量量Y的值落入入任意區(qū)區(qū)間(a,b)的概率為為:相應(yīng)的累累積分布布函數(shù)為為:652.3理論分布布(二)正態(tài)分布布的特征征1、正態(tài)分分布密度度曲線是是單峰、、對(duì)稱的的懸鐘形形曲線,,對(duì)稱軸軸為y=μ;2、f(y)在y=μ處達(dá)到極極大,,極大大值;;3、f(y)是非負(fù)函函數(shù),以以x軸為漸近近線,分分布從-∞至+∞;4、曲線在在y=μ±σσ處各有一一個(gè)拐點(diǎn)點(diǎn),即曲曲線在(-∞,μ-σσ)和(μ+σσ,+∞∞)區(qū)間上是是下凸的的,在[μ-σσ,μ+σ]區(qū)間內(nèi)是是上凸的的;5、正態(tài)分分布有兩兩個(gè)參數(shù)數(shù),即平平均數(shù)μ和標(biāo)準(zhǔn)差差σ。μ是位置參參數(shù),如如圖4—8所示。當(dāng)當(dāng)σ恒定時(shí),,μ愈大,則則曲線沿沿x軸愈向右右移動(dòng);;反之,,μ愈小,曲曲線沿x軸愈向左左移動(dòng)。。σ是變異度度參數(shù),,如圖4—9所示。。6、分布密密度曲線線與橫軸軸所夾的的面積為為1,662.3理論分布布二、標(biāo)準(zhǔn)準(zhǔn)正態(tài)分分布由上述正正態(tài)分布布的特征征可知,,正態(tài)分分布是依依賴于參參數(shù)μ和(或σ)的一簇分分布,正正態(tài)曲曲線之位位置及形形態(tài)隨μ和的的不不同而不不同。這這就給給研究具具體的正正態(tài)總體體帶來困困難。以一個(gè)新新變數(shù)u替代y變數(shù),即即將y離其平均均數(shù)的差差數(shù),以以σ為單位進(jìn)進(jìn)行轉(zhuǎn)換換,于是是。u稱為標(biāo)準(zhǔn)準(zhǔn)正態(tài)離離差。672.3理論分布由之可將正態(tài)態(tài)分布的概率率密度函數(shù)標(biāo)標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)正態(tài)分布布的概率密度度函數(shù)為:我們稱的的正正態(tài)分布為標(biāo)標(biāo)準(zhǔn)正態(tài)分布布(standardnormaldistribution)。記作u~N(0,1)。累積分布函數(shù)數(shù)為:682.3理論分布692.3理論分布三、正態(tài)分布布的概率計(jì)算算(一)標(biāo)準(zhǔn)正正態(tài)分布的概概率計(jì)算設(shè)u服從標(biāo)準(zhǔn)正態(tài)態(tài)分布,則u在[u1,u2)內(nèi)取值的概率率為:=Φ(u2)-Φ(u1)Φ(u1)與Φ(u2)可由附表2查得。702.3理論分布由公式及正態(tài)態(tài)分布的對(duì)稱稱性可推出下下列關(guān)系式,,再借助附表表2,便能很方便便地計(jì)算有關(guān)關(guān)概率:P(0≤U<u1)=Φ(u1)-0.5P(U≥u1)=Φ(-u1)P(|U|≥u1)=2Φ(-u1)P(|U|<u1==1-2Φ(-u1)P(u1≤U<u2)=Φ(u2)-Φ(u1)712.3理論分布例已知u~N(0,1),試求:(1)P(u<-1.64)=?(2)P(u≥2.58)=?(3)P(|u|≥2.56)=?(4)P(0.34≤≤u<1.53)=?722.3理論分布查附表2得:(1)P(u<-1.64)=0.05050(2)P(u≥2.58)=Φ(-2.58)=0.024940(3)P(|u|≥2.56)=2Φ(-2.56)=2×0.005234=0.010468(4)P(0.34≤≤u<1.53)=Φ(1.53)-Φ(0.34)=0.93669-0.6331=0.30389732.3理論分布742.3理論分布關(guān)于標(biāo)準(zhǔn)正態(tài)態(tài)分布,以下下幾種概率應(yīng)應(yīng)當(dāng)熟記:P(-1≤≤u<1)=0.6826P(-2≤≤u<2)=0.9545P(-3≤≤u<3)=0.9973P(-1.96≤≤u<1.96)=0.95P(-2.58≤≤u<2.58)=0.99752.3理論論分分布布u變量量在在上上述述區(qū)區(qū)間間以以外外取取值值的的概概率率分分別別為為::P(|u|≥≥1)=2ΦΦ(-1)=1-P(-1≤≤u<1)=1-0.6826=0.3174P(|u|≥≥2)=2ΦΦ(-2)=1-P(-2≤≤u<2)=1-0.9545=0.0455P(|u|≥≥3)=1-0.9973=0.0027P(|u|≥≥1.96)=1-0.95=0.05P(|u|≥≥2.58)=1-0.99=0.01762.3理論論分分布布(二二))一一般般正正態(tài)態(tài)分分布布的的概概率率計(jì)計(jì)算算正態(tài)態(tài)分分布布密密度度曲曲線線和和橫橫軸軸圍圍成成的的一一個(gè)個(gè)區(qū)區(qū)域域,,其其面面積積為為1,這這實(shí)實(shí)際際上上表表明明了了““隨隨機(jī)機(jī)變變量量Y取值值在在-∞∞與+∞∞之間間””是是一一個(gè)個(gè)必必然然事事件件,,其其概概率率為為1。若隨隨機(jī)機(jī)變變量量Y服從從正正態(tài)態(tài)分分布布N(μμ,σσ2),則則Y的取取值值落落在在任任意意區(qū)區(qū)間間[y1,y2)的的概概率率,,記記作作P(y1≤Y<y2),等等于于圖中陰陰影影部部分分曲曲邊邊梯梯形形面面積積。。772.3理論論分分布布782.3理論分分布對(duì)上式式作變變換u=(y-μ)/σ,得dy=σdu,故有有:其中,,792.3理論分分布這表明明服從從正態(tài)態(tài)分布布N(μ,σ2)的隨機(jī)機(jī)變量量Y在[y1,y2)內(nèi)取取值的的概率率,等等于服服從標(biāo)標(biāo)準(zhǔn)正正態(tài)分分布的的隨機(jī)機(jī)變量量u在[(y1-μ)/σσ,(y2-μ)/σσ)內(nèi)取取值的的概率率。。因此,,計(jì)算算一般般正態(tài)態(tài)分布布的概概率時(shí)時(shí),只只要將將區(qū)間間的上上下限限作適適當(dāng)變變換(標(biāo)準(zhǔn)化化),就就可用用查標(biāo)標(biāo)準(zhǔn)正正態(tài)分分布的的概率率表的的方法法求得得概率率了。。802.3理論分分布例設(shè)Y服從μ=30.26,σ2=5.102的正態(tài)態(tài)分布布,試試求P(21.64≤≤Y<32.98)。令則u服從標(biāo)標(biāo)準(zhǔn)正正態(tài)分分布,,故=P(-1.69≤≤u<0.53)=Φ(0.53)-Φ(-1.69)=0.7019-0.04551=0.6564812.3理論分分布關(guān)于一一般正正態(tài)分分布,,以下下幾個(gè)個(gè)概率率(即隨機(jī)機(jī)變量量Y落在μ加減不不同倍倍數(shù)σ區(qū)間的的概率率)是經(jīng)常常用到到的。。P(μ-σ≤≤Y<μ+σσ)=0.6826P(μ-2σσ≤Y<μ+2σ)=0.9545P(μ-3σσ≤Y<μ+3σ)=0.9973P(μ-1.96σ≤≤Y<μ+1.96σσ)=0.95P(μ-2.58σ≤≤Y<μ+2.58σσ)=0.99822.3理論分分布四、正正態(tài)分分布的的單側(cè)側(cè)臨界界值生物統(tǒng)統(tǒng)計(jì)中中,不不僅注注意隨隨機(jī)變變量Y落在平平均數(shù)數(shù)加減減不同同倍數(shù)數(shù)標(biāo)準(zhǔn)準(zhǔn)差區(qū)區(qū)間(μ-kσ,μμ+kσ)之內(nèi)的的概率率,而而且也也很關(guān)關(guān)心Y落在此此區(qū)間間之外外的概概率。。我們把把隨機(jī)機(jī)變量量Y落在平平均數(shù)數(shù)μ加減不不同倍倍數(shù)標(biāo)標(biāo)準(zhǔn)差差σ區(qū)間之之外的的概率率稱為為雙側(cè)概概率(兩尾概概率),記作α。832.3理論分分布對(duì)應(yīng)于于雙側(cè)側(cè)概率率可以以求得得隨機(jī)機(jī)變量量Y小于μ-kσ或大于于μ+kσ的概率率,稱稱為單側(cè)概概率(一尾概概率),記作α/2。例如,,Y落在(μ-1.96σ,μ+1.96σ)之外的的雙側(cè)側(cè)概率率為0.05,而單單側(cè)概概率為為0.025。即P(y<μ-1.96σσ)=P(y>μ+1.96σσ)=0.025雙側(cè)概概率或或單側(cè)側(cè)概率率如圖3—7所示。。y落在(μ-2.58σ,μ+2.58σ)之外的的雙側(cè)側(cè)概率率為0.01,而單單側(cè)概概率為為0.005。即P(x<μ-2.58σσ)=P(x>+2.58σ)=0.005842.3理論分分布852.3理論分分布附表3給出了了滿足足的的上側(cè)側(cè)分位位的數(shù)數(shù)值,,稱稱為的的上側(cè)側(cè)臨界界值,,也稱稱上側(cè)側(cè)分位位數(shù),,位丁丁曲線線的右右側(cè)尾尾區(qū);;對(duì)于左左側(cè)尾尾區(qū),,滿足足的的下下側(cè)分分位的的數(shù)值值,稱稱為為的的下下側(cè)臨臨界值值,也也稱下下側(cè)分分位數(shù)數(shù)。因因此,,只只要已已知單單側(cè)概概率α的值,,由附附表3就可直直接查查出對(duì)對(duì)應(yīng)的的單側(cè)側(cè)分位位數(shù)。。例如,,已知知u~N(0,1):(1)P(u<-1.645)+P(u≥1.645)=0.05(2)P(-1.645≤u<1.645)=0.90862.3理論分布布如果(1)P(u<-)+P(u≥)=1-P(-≤≤u<﹚=0.10=2α側(cè)由附表表3查得:=1.645(2)P(-≤≤u<)=0.86,2α=1-P(-≤≤u<)=1-0.86=0.14由附表3查得:=1.476對(duì)于x~N(μ,σσ2),只要將將其轉(zhuǎn)換換為u~N(0,1),即可求得得相應(yīng)的的雙側(cè)分分位數(shù)。。872.3理論分布布前面討論論的三個(gè)個(gè)重要的的概率分分布中,,前一個(gè)個(gè)屬連續(xù)續(xù)型隨機(jī)機(jī)變量的的概率分分布,后后兩個(gè)屬屬離散型型隨機(jī)變變量的概概率分布布。三三者間間的關(guān)系系如下::對(duì)于二項(xiàng)項(xiàng)分布,,在n→∞,p→0,且np=μμ(較小常數(shù)數(shù))情況下,,二項(xiàng)項(xiàng)分布趨趨于泊松松布,在在這種場場合,泊泊松分布布中的參參數(shù)μ用二項(xiàng)分分布的np代之;在在n→∞,p→→0.5時(shí),二項(xiàng)項(xiàng)分布趨趨于正態(tài)態(tài)分布,,在這種種場合,,正態(tài)態(tài)分布中中的μ、σ2用二項(xiàng)分分布的np、nq代之。在實(shí)際計(jì)計(jì)算中,,當(dāng)p<0.1且n很大時(shí),,二二項(xiàng)分布布可由泊泊松分布布近似;;當(dāng)p>0.1且n很大時(shí),,二項(xiàng)項(xiàng)分布可可由正態(tài)態(tài)分布近近似。88第二章理理論論分布和和抽樣分分布對(duì)于泊松松分布,,當(dāng)μ→∞時(shí),泊泊松分布布以正態(tài)態(tài)分布為為極限。。在實(shí)際際計(jì)算中中,當(dāng)當(dāng)μ≥20(也有人認(rèn)認(rèn)為μ≥6)時(shí),用泊泊松分布布中的μ代替正態(tài)態(tài)分布中中的μ及σ2,即可由由后者對(duì)對(duì)前者進(jìn)進(jìn)行近似似計(jì)算。。892.3理論分布布標(biāo)準(zhǔn)正態(tài)態(tài)分布幾幾種特殊殊概率::P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545P(-3≤u<3)=0.9973P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99兩尾概率率與一尾尾概率::兩尾概率率:P(y<μ-kσσ)+P(y>μ+kσσ)=αα一尾概率率:P(y<μ-kσσ)=P(y>μ+kσσ)=αα/2P(|u|≥≥2.58)=0.01P(|u|≥≥1.96)=0.05902.3理論分布布第六節(jié)樣樣本本平均數(shù)數(shù)的抽樣樣分布研究總體體與從中中抽取的的樣本之之間的關(guān)關(guān)系是統(tǒng)統(tǒng)計(jì)學(xué)的的中心內(nèi)內(nèi)容。。對(duì)這種種關(guān)系的的研究可可從兩方方面著手手:?。簭目傮w體到樣本本,研究究抽樣分布布問題。即即研究從從總體中中抽出的的所有可可能樣本本統(tǒng)計(jì)量量的分布布及其與與原總體體的關(guān)系系。本節(jié)節(jié)討論。。ⅱ:從樣本本到總體體,研究究統(tǒng)計(jì)推斷斷問題。即即從總體體中隨機(jī)機(jī)抽取樣樣本,并并用樣本本對(duì)總體體作出推推論。912.3理論分布布統(tǒng)計(jì)推斷斷是以總總體分布布和樣本本抽樣分分布的理理論關(guān)系系為基礎(chǔ)礎(chǔ)的。為為了能正正確地利利用樣本本去推斷斷總體,,并能正正確地理理解統(tǒng)計(jì)計(jì)推斷的的結(jié)論,,須對(duì)樣樣本的抽抽樣分布布有所了了解。我們知道道,由總總體中隨隨機(jī)地抽抽取若干干個(gè)體組組成樣本本,即使使每次抽抽取的樣樣本含量量相等,,其統(tǒng)計(jì)計(jì)量(如,S)也將隨樣樣本的不不同而有有所不同同,因而而樣本統(tǒng)統(tǒng)計(jì)量也也是隨機(jī)機(jī)變量,,也有有其概率率分布。。我們把把統(tǒng)計(jì)量的的概率分分布稱為為抽樣分分布。922.3理論分布布由總體隨隨機(jī)抽樣樣(randomsampling)的方法可可分為有返置抽抽樣和不不返置抽抽樣兩種。前前者指指每次抽抽出一個(gè)個(gè)個(gè)體后后,這個(gè)個(gè)個(gè)體應(yīng)應(yīng)返置回回原總體體;后者者指每次次抽出的的個(gè)體不不返置回回原總體體。對(duì)于于無限總總體,返返置與否否都可保保證各個(gè)個(gè)體被抽抽到的機(jī)機(jī)會(huì)相等等。對(duì)于于有限總總體,就就應(yīng)該采采取返置置抽樣,,否則各各個(gè)體被被抽到的的機(jī)會(huì)就就不相等等。932.3理論分布布一、樣本本平均數(shù)數(shù)抽樣分分布設(shè)有一個(gè)個(gè)總體,,總體體平均數(shù)數(shù)為μ,方差為σ2,總體中中各變數(shù)數(shù)為y,將此此總體稱稱為原總總體?,F(xiàn)現(xiàn)從這個(gè)個(gè)總體中中隨機(jī)抽抽取含量量為n的樣本,,樣本平平均數(shù)記記為。。942.3理論分布布可以設(shè)想想,從原原總體中中可抽出出個(gè)個(gè)含量為為n的樣本。。由這些些樣本算算得的平平均數(shù)有有大有小小,不盡盡相同,,與原總總體平均均數(shù)μ相比往往往表現(xiàn)出出不同程程度的差差異。這這種差異異是由隨隨機(jī)抽樣樣造成的的,稱稱為抽樣誤差差(samplingerror)。顯然,樣樣本平均均數(shù)也也是一一個(gè)隨機(jī)機(jī)變量,,其概率率分布叫叫做樣本平均均數(shù)的抽抽樣分布布。由樣本本平均數(shù)數(shù)構(gòu)構(gòu)成的總總體稱為為樣本平均均數(shù)的抽抽樣總體體。952.3理論分布布962.3理論分布布的總體平均均數(shù)記為、、總體方差差記為,,的的抽抽樣總體體標(biāo)準(zhǔn)差差簡簡稱總體標(biāo)準(zhǔn)準(zhǔn)誤,表示平平均數(shù)抽抽樣誤差差的大小小。數(shù)理統(tǒng)計(jì)計(jì)的推導(dǎo)導(dǎo)表明,,樣本平平均數(shù)構(gòu)構(gòu)成成的總體體與原Y總體參數(shù)數(shù)間具有有以下關(guān)關(guān)系:972.3理論分布布1.2.大小與起起始總體體成成正正比、而而與樣本本含量n平方根成成反比。。表明增大樣本本含量n才能降低低抽樣誤誤差。抽樣分布布的標(biāo)準(zhǔn)準(zhǔn)差又稱稱為標(biāo)準(zhǔn)準(zhǔn)誤,它它可以度度量抽樣樣分布的的變異。。對(duì)于樣樣本平均均數(shù)分布布,有樣樣本標(biāo)準(zhǔn)準(zhǔn)誤()):其中,即意義:因?yàn)闉镾估計(jì),,故估估計(jì)計(jì),,即估估計(jì),,表明樣樣本標(biāo)準(zhǔn)誤誤是是平均數(shù)抽抽樣誤差的的估計(jì)值。。982.3理論分布3.中心極限定定理若,,且y1、y2、…、yn來自Y總體,則,,且、、、,,即。。若Y不服從正態(tài)態(tài)分布,具具有總體平平均數(shù)μ、總體方差差σ2,且y1、y2、…、yn來自Y總體,則n相當(dāng)大時(shí),,。。99第二章理理論分布布和抽樣分分布抽樣試驗(yàn):設(shè)有一個(gè)N=4的有限限總體,變變數(shù)為2、3、3、4。根據(jù)μ=Σy/N和σ2=Σ(y-μ)2/N求得該總體體的μ、σ2、σ為:μ=3,σσ2=1/2,σ==0.707100第二章理理論分布布和抽樣分分布從有限總體體作返置隨隨機(jī)抽樣,,所有可能能的樣本數(shù)數(shù)為Nn,其中n為樣本含量量。以上上述總體而而論,如果果從中抽取取n=2的樣本,共共可得42=16個(gè)樣本;如如果樣本含含量n為4,則一共共可抽抽得44=256個(gè)樣本。分分別求這些些樣本的平平均數(shù),,其次數(shù)數(shù)分布如表表4—6所示。根據(jù)表4—6,在n=2的試驗(yàn)中,,樣本平均均數(shù)抽樣總總體的平均均數(shù)、方差差與標(biāo)準(zhǔn)差差分別為::101第二章理理論分布布和抽樣分分布=4/16=1/4=(1/2)/2=102第二章理理論分布布和抽樣分分布同理,可得得n=4時(shí):這就驗(yàn)證了了,,的的正確性性。103第二章理理論分布布和抽樣分分布表4—6N=4,n=2和n=4時(shí)的次數(shù)分分布1042.3理論分布105第二章理理論分布布和抽樣分分布由以上模擬擬抽樣試驗(yàn)驗(yàn)可以看出出,雖然然原總體并并非正態(tài)分分布,但從從中隨機(jī)抽抽取樣本,,即使樣樣本含量很很小(n=2,n=4),樣本平均均數(shù)的分布布卻趨向于于正態(tài)分布布形式。隨隨著樣本含含量n的增大,樣樣本平均均數(shù)的分布布愈來愈從從不連續(xù)趨趨向于連續(xù)續(xù)的正態(tài)分分布。106第二章理理論分布布和抽樣分分布中心極限定定理告訴我我們:不論論Y變量是連續(xù)續(xù)型還是離離散型,也也無論Y服從何種分分布,一般般只要n>30,就可認(rèn)為為的的分布布是正態(tài)的的。107第二章理理論分布布和抽樣分分布注意,樣本本標(biāo)準(zhǔn)差與與樣本標(biāo)準(zhǔn)準(zhǔn)誤是既有有聯(lián)系又有有區(qū)別的兩兩個(gè)統(tǒng)計(jì)量量。二者的的區(qū)別在于于:樣本本標(biāo)標(biāo)準(zhǔn)準(zhǔn)差差S是反反映映樣樣本本中中各各觀觀測測值值,,,,…,變變異異程程度度大大小小的的一一個(gè)個(gè)指指標(biāo)標(biāo),,它它的的大大小小說說明明了了對(duì)對(duì)該該樣樣本本代代表表性性的的強(qiáng)強(qiáng)弱弱。。樣本本標(biāo)標(biāo)準(zhǔn)準(zhǔn)誤誤是是樣樣本本平平均均數(shù)數(shù)的的標(biāo)標(biāo)準(zhǔn)準(zhǔn)差差,,它它是是抽抽樣樣誤誤差差的的估估計(jì)計(jì)值值,,其其大大小小說說明明了了樣樣本本間間變變異異程程度度的的大大小小及及精精確確性性的的高高低低。。1082.3理論論分分布布樣本本平平均均數(shù)數(shù)分分布布可標(biāo)標(biāo)準(zhǔn)準(zhǔn)化化,,獲獲得得u值。。從u值可可查查正正態(tài)態(tài)離離差差概概率率表表,,獲獲得得其其相相應(yīng)應(yīng)的的概概率率。。1092.3理論論分分布布二、、兩兩個(gè)個(gè)獨(dú)獨(dú)立立樣樣本本平平均均數(shù)數(shù)差差數(shù)數(shù)的的抽抽樣樣分分布布如果果從從一一個(gè)個(gè)總總體體隨隨機(jī)機(jī)地地抽抽取取一一個(gè)個(gè)樣樣本本容容量量為為的的樣樣本本,,同同時(shí)時(shí)隨隨機(jī)機(jī)獨(dú)獨(dú)立立地地從從另另一一個(gè)個(gè)總總體體抽抽取取一一個(gè)個(gè)樣樣本本容容量量為為的的樣樣本本,,那那么么可可以以得得到到分分別別屬屬于于兩兩個(gè)個(gè)總總體體的的樣樣本本,,這這兩兩個(gè)個(gè)樣樣本本的的平平均均數(shù)數(shù)用用和和表表示示。。1102.3理論論分分布布設(shè)這這兩兩個(gè)個(gè)樣樣本本所所來來自自的的兩兩個(gè)個(gè)總總體體的的平平均均數(shù)數(shù)分分別別為為和和,,它它們們的的方方差差分分別別為為和和。。根根據(jù)據(jù)數(shù)數(shù)理理統(tǒng)統(tǒng)計(jì)計(jì)的的推推導(dǎo)導(dǎo),,兩兩個(gè)個(gè)獨(dú)獨(dú)立立隨隨機(jī)機(jī)抽抽取取的的樣樣本本平平均均數(shù)數(shù)間間差差數(shù)數(shù)()的抽抽樣樣分分布布參參數(shù)數(shù)與與兩兩個(gè)個(gè)母母總總體體間間存存在在如如下下關(guān)關(guān)系系:1112.3理論論分分布布(1)兩個(gè)個(gè)樣樣本本平平均均數(shù)數(shù)差差數(shù)數(shù)分分布布的的平平均均數(shù)數(shù)必必等等于于兩兩母母總總體體平平均均數(shù)數(shù)的的差差數(shù)數(shù)。。(2)兩個(gè)個(gè)獨(dú)獨(dú)立立的的樣樣本本平平均均數(shù)數(shù)差差數(shù)數(shù)分分布布的的方方差差等等于于兩兩母母總總體體的的樣樣本本平平均均數(shù)數(shù)的的方方差差總總和和。。其差數(shù)標(biāo)標(biāo)準(zhǔn)差為為:1122.3理論分布布(3)如果兩個(gè)個(gè)總體各各作正態(tài)態(tài)分布,,則其樣樣本平均均數(shù)差數(shù)數(shù)()準(zhǔn)確地遵遵循正態(tài)態(tài)分布律律,無無論樣本本容量大大或小,,都有N()。若兩個(gè)樣樣本抽自自于兩個(gè)個(gè)非正態(tài)態(tài)總體,,尤其與與相相差很大大時(shí),則則其平均均數(shù)差數(shù)數(shù)的抽樣樣分布很很難確定定。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論