版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三章理論分布與抽樣分布為了便于理解統(tǒng)計(jì)分析的基本原理,正確掌握和應(yīng)用統(tǒng)計(jì)分析方法,本章在介紹概率論中最基本的兩個(gè)概念-事件、概率的基礎(chǔ)上,重點(diǎn)介紹科學(xué)研究中常用的幾種隨機(jī)變量的概率分布-正態(tài)分布、二項(xiàng)分布、波松分布以及樣本平均數(shù)的抽樣分布和t分布。下一張
主頁
退出
上一張
第三章理論分布與抽樣分布為了便于理解統(tǒng)計(jì)分析11事件與概率1.1事件1.1.1必然現(xiàn)象與隨機(jī)現(xiàn)象
在自然界與生產(chǎn)實(shí)踐和科學(xué)試驗(yàn)中,人們會(huì)觀察到各種各樣的現(xiàn)象,把它們歸納起來,大體上分為兩大類:下一張
主頁
退出
上一張
1事件與概率1.1事件下一張主頁退2必然現(xiàn)象:可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進(jìn)行試驗(yàn),其結(jié)果總是確定的,必然發(fā)生的(或必然不發(fā)生)。這類現(xiàn)象稱為必然現(xiàn)象(inevitablephenomena)或確定性現(xiàn)象(definitephenomena)。隨機(jī)現(xiàn)象:另一類是事前不可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進(jìn)行試驗(yàn),其結(jié)果未必相同。這類在個(gè)別試驗(yàn)中其結(jié)果呈現(xiàn)偶然性、不確定性現(xiàn)象,稱為隨機(jī)現(xiàn)象(randomphenomena)或不確定性現(xiàn)象(indefinitephenomena)。下一張
主頁
退出
上一張
必然現(xiàn)象:可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進(jìn)行3隨機(jī)現(xiàn)象或不確定性現(xiàn)象,有如下特點(diǎn):在一定的條件實(shí)現(xiàn)時(shí),有多種可能的結(jié)果發(fā)生,事前人們不能預(yù)言將出現(xiàn)哪種結(jié)果;對(duì)一次或少數(shù)幾次觀察或試驗(yàn)而言,其結(jié)果呈現(xiàn)偶然性、不確定性;但在相同條件下進(jìn)行大量重復(fù)試驗(yàn)時(shí),其試驗(yàn)結(jié)果卻呈現(xiàn)出某種固有的、特定的規(guī)律性——頻率的穩(wěn)定性,通常稱之為隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。下一張
主頁
退出
上一張
隨機(jī)現(xiàn)象或不確定性現(xiàn)象,有如下特點(diǎn):下一張主41.1.2隨機(jī)試驗(yàn)與隨機(jī)事件1隨機(jī)試驗(yàn)通常我們把根據(jù)某一研究目的,在一定條件下對(duì)自然現(xiàn)象所進(jìn)行的觀察或試驗(yàn)統(tǒng)稱為試驗(yàn)(trial)。當(dāng)一個(gè)試驗(yàn)如果滿足下述三個(gè)特性,則稱其為一個(gè)隨機(jī)試驗(yàn)(randomtrial),簡(jiǎn)稱試驗(yàn)。下一張
主頁
退出
上一張
1.1.2隨機(jī)試驗(yàn)與隨機(jī)事件下一張主頁退出5(1)試驗(yàn)可以在相同條件下多次重復(fù)進(jìn)行;(2)每次試驗(yàn)的可能結(jié)果不止一個(gè),并且事先知道會(huì)有哪些可能的結(jié)果;(3)每次試驗(yàn)總是恰好出現(xiàn)這些可能結(jié)果中的一個(gè),但在一次試驗(yàn)之前卻不能肯定這次試驗(yàn)會(huì)出現(xiàn)哪一個(gè)結(jié)果。下一張
主頁
退出
上一張
(1)試驗(yàn)可以在相同條件下多次重復(fù)進(jìn)行;下一張主62隨機(jī)事件
隨機(jī)試驗(yàn)的每一種可能結(jié)果,在一定條件下可能發(fā)生,也可能不發(fā)生,稱為隨機(jī)事件(randomevent),簡(jiǎn)稱事件(event),通常用A、B、C等來表示。(1)基本事件
我們把不能再分的事件稱為基本事件(elementaryevent),也稱為樣本點(diǎn)(samplepoint)。下一張
主頁
退出
上一張
2隨機(jī)事件下一張主頁退出上一張7
例如,從編號(hào)為1、2、3、…、10的十個(gè)籃球中隨機(jī)抽取1個(gè)籃球,有10種不同的可能結(jié)果:“取得一個(gè)編號(hào)是1”、“取得一個(gè)編號(hào)是2”、…、“取得一個(gè)編號(hào)是10”,這10個(gè)事件都是不可能再分的事件,它們都是基本事件。由若干個(gè)基本事件組合而成的事件稱為復(fù)合事件(compoundevent)。如“取得一個(gè)編號(hào)是2的倍數(shù)”是一個(gè)復(fù)合事件,它由“取得一個(gè)編號(hào)是2”、“是4”、“是6、“是8”、“是10”5個(gè)基本事件組合而成。下一張
主頁
退出
上一張
例如,從編號(hào)為1、2、3、…、10的十個(gè)籃球中8
(2)必然事件
把在一定條件下必然會(huì)發(fā)生的事件稱為必然事件(certainevent),用Ω表示。例如,一個(gè)大氣壓下,水加熱到100C,水會(huì)沸騰;種瓜得瓜、種豆得豆下一張
主頁
退出
上一張
(3)不可能事件
在一定條件下不可能發(fā)生的事件稱為不可能事件(impossibleevent),用ф表示。例如,在滿足一定孵化條件下,從石頭孵化出小雞,就是一個(gè)不可能事件。
必然事件與不可能事件實(shí)際上是確定性現(xiàn)象,它們不是隨機(jī)事件,但是為了方便起見,我們把它們看作為兩個(gè)特殊的隨機(jī)事件。(2)必然事件下一張主頁退出上一91.2概率1.2.1概率統(tǒng)計(jì)定義研究隨機(jī)試驗(yàn),僅知道可能發(fā)生哪些隨機(jī)事件是不夠的,還需了解各種隨機(jī)事件發(fā)生的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)計(jì)規(guī)律性,從而指導(dǎo)實(shí)踐。這就要求有一個(gè)能夠刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo),這個(gè)指標(biāo)應(yīng)該是事件本身所固有的,且不隨人的主觀意志而改變,人們稱之為概率(probability)。事件A的概率記為P(A)。下一張
主頁
退出
上一張
概率:刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo)1.2概率下一張主頁退出上一張概率:10
概率統(tǒng)計(jì)定義:
在相同條件下進(jìn)行n次重復(fù)試驗(yàn),如果隨機(jī)事件A發(fā)生的次數(shù)為m,那么m/n稱為隨機(jī)事件A的頻率(frequency);當(dāng)試驗(yàn)重復(fù)數(shù)n逐漸增大時(shí),隨機(jī)事件A的頻率越來越穩(wěn)定地接近某一數(shù)值p,那么就把p稱為隨機(jī)事件A的概率。下一張
主頁
退出
上一張
如此定義的概率稱為統(tǒng)計(jì)概率(statisticsprobability),或者稱后驗(yàn)概率(posteriorprobability)。概率統(tǒng)計(jì)定義:在相同條件下進(jìn)行n次重復(fù)試驗(yàn),如果隨機(jī)事11
表3-1拋擲一枚硬幣發(fā)生正面朝上的試驗(yàn)記錄下一張
主頁
退出
上一張
例如為了確定拋擲一枚硬幣出現(xiàn)正面朝上這個(gè)事件的概率,歷史上有人作過成千上萬次拋擲硬幣的試驗(yàn)。在表3—1中列出了他們的試驗(yàn)記錄。表3-1拋擲一枚硬幣發(fā)生正面朝上的試驗(yàn)記錄下一張12從表3-1可看出,隨著實(shí)驗(yàn)次數(shù)的增多,正面朝上這個(gè)事件發(fā)生的頻率越來越穩(wěn)定地接近0.5,我們就把0.5作為這個(gè)事件的概率。在一般情況下,隨機(jī)事件的概率p是不可能準(zhǔn)確得到的。通常以試驗(yàn)次數(shù)n充分大時(shí)隨機(jī)事件A的頻率作為該隨機(jī)事件概率的近似值。即P(A)=p≈m/n(n充分大)(3-1)下一張
主頁
退出
上一張
從表3-1可看出,隨著實(shí)驗(yàn)次數(shù)的增多,正面朝上這131.2.2概率的性質(zhì)
(1)對(duì)于任何事件A,有0≤P(A)≤1;(2)必然事件的概率為1,即P(Ω)=1;(3)不可能事件的概率為0,即P(ф)=0。1.2.2概率的性質(zhì)142概率分布事件的概率表示了一次試驗(yàn)?zāi)骋粋€(gè)結(jié)果發(fā)生的可能性大小。若要全面了解試驗(yàn),則必須知道試驗(yàn)的全部可能結(jié)果及各種可能結(jié)果發(fā)生的概率,即必須知道隨機(jī)試驗(yàn)的概率分布(probabilitydistribution)。為了深入研究隨機(jī)試驗(yàn),我們先引入隨機(jī)變量(randomvariable)的概念。下一張
主頁
退出
上一張
2概率分布事件的概率表示了一次試驗(yàn)?zāi)骋粋€(gè)152.1隨機(jī)變量
下一張
主頁
退出
上一張
2004年奶粉事件“大頭娃”描述隨機(jī)事件的變量稱為隨機(jī)變量。隨機(jī)變量的取值在一次試驗(yàn)前不能確定,具有隨機(jī)性。作一次試驗(yàn),其結(jié)果有多種可能。每一種可能結(jié)果都可用一個(gè)數(shù)來表示,把這些數(shù)作為變量x的取值,則試驗(yàn)結(jié)果可用變量x來表示?!纠繉?duì)10種品牌袋裝奶粉進(jìn)行質(zhì)量檢測(cè),其可能結(jié)果是“0種合格”、“1種合格”、“2種合格”、“…”、“10種袋裝奶粉都合格”。若用x表示袋裝奶粉合格品牌數(shù),則x的取值為0、1、2、…、10。2.1隨機(jī)變量下一張主頁退出上一張16【例】食品加工中高溫殺菌可能結(jié)果只有兩種,即“全部殺死細(xì)菌”與“未能全部殺死細(xì)菌”。若用變量x表示試驗(yàn)的兩種結(jié)果,則可令x=0表示“未能全部殺死細(xì)菌”,x=1表示“全部殺死細(xì)菌”?!纠繙y(cè)定關(guān)中地區(qū)不同小麥品種的蛋白質(zhì)含量,其蛋白質(zhì)含量在9.3-13.5%之間,如用x表示測(cè)定結(jié)果,那么x值可以是這個(gè)范圍內(nèi)的任何實(shí)數(shù)。下一張
主頁
退出
上一張
【例】食品加工中高溫殺菌可能結(jié)果只有兩種,即“全部殺死細(xì)17離散型隨機(jī)變量:如果表示試驗(yàn)結(jié)果的變量x,其可能取值為可列個(gè),且以各種確定的概率取這些不同的值,則稱x為離散型隨機(jī)變量(discreterandomvariable);連續(xù)型隨機(jī)變量:如果表示試驗(yàn)結(jié)果的變量x,其可能取值為某范圍內(nèi)的任何數(shù)值,且x在其取值范圍內(nèi)的任一區(qū)間中取值時(shí),其概率是確定的,則稱x為連續(xù)型隨機(jī)變量(continuousrandomvariable)。
下一張
主頁
退出
上一張
試驗(yàn)結(jié)果和取此結(jié)果的概率可以一一列出。不能列出試驗(yàn)結(jié)果和取此結(jié)果的概率,只能給出一定范圍和在此范圍內(nèi)取值的概率。離散型隨機(jī)變量:如果表示試驗(yàn)結(jié)果的變量x,其可能182.2離散型隨機(jī)變量的概率分布要了解離散型隨機(jī)變量x的統(tǒng)計(jì)規(guī)律,就必須知道它的一切可能值xi及取每種可能值的概率pi。如果我們將離散型隨機(jī)變量x的一切可能取值xi
(i=1,2,…),及其對(duì)應(yīng)的概率pi,記作P(x=xi)=pi
i=1,2,…(3—3)則稱(3—3)式為離散型隨機(jī)變量x的概率分布或分布。常用分布列(distributionseries)來表示:下一張
主頁
退出
上一張
2.2離散型隨機(jī)變量的概率分布下一張主頁退出19x1x2…xn….p1p2…pn…從分布列可以一目了然看出隨機(jī)變量X的可能取值及取這些值的概率。離散型隨機(jī)變量的概率分布具有pi≥0和Σpi=1這兩個(gè)基本性質(zhì)。2.3連續(xù)型隨機(jī)變量的概率分布
連續(xù)型隨機(jī)變量(如身高、體重等)的概率分布不能用分布列來表示,因?yàn)槠淇赡苋≈凳遣豢蓴?shù)的,不能一一列出。改用隨機(jī)變量x在某個(gè)區(qū)間內(nèi)取值的概率P(a≤x<b)來表示。下面通過頻率分布密度曲線予以說明。下一張
主頁
退出
上一張
x1x2…xn….下一張主20
圖4—1為數(shù)據(jù)資料的頻率分布直方圖,圖中縱座標(biāo)取頻率與組距的比值。可以設(shè)想,如果樣本取得越來越大(n→+∞),組分得越來越細(xì)(i→0),某一范圍內(nèi)的頻率將趨近于一個(gè)穩(wěn)定值-概率。這時(shí),頻率分布直方圖各個(gè)直方上端中點(diǎn)的連線-頻率分布折線將逐漸趨向于一條曲線。下一張
主頁
退出
上一張
圖4—1為數(shù)據(jù)資料的頻率分布直方圖,圖中縱座標(biāo)取頻21當(dāng)n→+∞、i→0時(shí),頻率分布折線的極限是一條穩(wěn)定的函數(shù)曲線。對(duì)于樣本是取自連續(xù)型隨機(jī)變量的情況,這條函數(shù)曲線將是光滑的。這條曲線排除了抽樣和測(cè)量的誤差,完全反映了數(shù)據(jù)資料的變動(dòng)規(guī)律。這條曲線叫概率分布密度曲線,相應(yīng)的函數(shù)叫概率分布密度函數(shù),簡(jiǎn)稱分布密度。下一張
主頁
退出
上一張
當(dāng)n→+∞、i→0時(shí),頻率分布折線的極限是一條穩(wěn)定22
(3—4)式為連續(xù)型隨機(jī)變量x在區(qū)間[a,b)上取值概率的表達(dá)式。可見,連續(xù)型隨機(jī)變量的概率由概率分布密度函數(shù)確定。若變量X概率分布密度函數(shù)記為f(x),則x取值于區(qū)間[a,b)的概率為圖中陰影部分的面積,即P(a≤x<b)=(3-4)(3—4)式為連續(xù)型隨機(jī)變量23連續(xù)型隨機(jī)變量概率分布的性質(zhì):1、分布密度函數(shù)總是大于或等于0,即f(x)≥0;2、當(dāng)隨機(jī)變量x取某一特定值時(shí),其概率等于0;即(c為任意實(shí)數(shù))
所以,對(duì)于連續(xù)型隨機(jī)變量,僅研究其在某一個(gè)區(qū)間內(nèi)取值的概率,而不去討論取某一個(gè)值(點(diǎn))的概率。下一張
主頁
退出
上一張
連續(xù)型隨機(jī)變量某一點(diǎn)的概率為0。連續(xù)型隨機(jī)變量概率分布的性質(zhì):下一張主243、隨機(jī)變量x取值在-∞<x<+∞范圍內(nèi),所以下一張
主頁
退出
上一張
(3-5)(3—5)式表示分布密度曲線與橫軸所圍成的區(qū)間全部面積為1。P(a≤x<b)=4、隨機(jī)變量X取〔a,b)區(qū)間值的概率為:3、隨機(jī)變量x取值在-∞<x<+∞范圍內(nèi),所以下一張253理論分布
3.1二項(xiàng)分布3.1.1貝努利試驗(yàn)及其概率公式貝努利試驗(yàn):對(duì)于n次獨(dú)立的試驗(yàn),如果每次試驗(yàn)結(jié)果出現(xiàn)且只出現(xiàn)對(duì)立事件A與之一,在每次試驗(yàn)中出現(xiàn)A的概率是常數(shù)p(0<p<1),因而出現(xiàn)對(duì)立事件的概率是1-p=q,則稱這一串重復(fù)的獨(dú)立試驗(yàn)為n重貝努利試驗(yàn),簡(jiǎn)稱貝努利試驗(yàn)(Bernoullitrials)。
下一張
主頁
退出
上一張
重要的離散型分布只有兩種可能結(jié)果的隨機(jī)試驗(yàn)稱為貝努利試驗(yàn)食品抽樣中,產(chǎn)品合格或不合格,種子發(fā)芽或不發(fā)芽,施藥后害蟲死或活等等。3理論分布3.1二項(xiàng)分布下一張主頁退26貝努利試驗(yàn)的概率公式
在貝努利試驗(yàn)中,事件A可能發(fā)生,也可能不發(fā)生,用隨機(jī)變量x表示貝努利試驗(yàn)的兩種結(jié)果,記A發(fā)生時(shí)取1,A不發(fā)生時(shí)取0。那么,貝努利試驗(yàn)的概率公式可以表示為:P(x=1)=pP(x=0)=q其中x=1,A事件發(fā)生,成功0,A事件未發(fā)生,失敗也稱為兩點(diǎn)分布(3-6)貝努利試驗(yàn)的概率公式在貝努利試驗(yàn)中,事件A可能發(fā)生27在n重貝努利試驗(yàn)中,事件A可能發(fā)生0,1,2,…,n次,現(xiàn)在我們來求事件A恰好發(fā)生k(0≤k≤n)次的概率Pn(k)。事件A在n次試驗(yàn)中正好發(fā)生k次共有種情況。由貝努利試驗(yàn)的獨(dú)立性可知,A在k次實(shí)驗(yàn)中發(fā)生,而在其余n-k次試驗(yàn)中不發(fā)生的概率為下一張
主頁
退出
上一張
3.1.2二項(xiàng)分布的定義及其特點(diǎn)在n重貝努利試驗(yàn)中,事件A可能發(fā)生0,1,2,…,n次,28一般,在n重貝努利試驗(yàn)中,事件A恰好發(fā)生k(0≤k≤n)次的概率為下一張
主頁
退出
上一張
k=0,1,2…,n(3-7)若把(3-7)式與二項(xiàng)展開式相比較就可以發(fā)現(xiàn),在n重貝努利試驗(yàn)中,事件A發(fā)生k次的概率恰好等于展開式中的第k+1項(xiàng),所以也把(3-7)式稱作二項(xiàng)概率公式。一般,在n重貝努利試驗(yàn)中,事件A恰好發(fā)生k(0291.二項(xiàng)分布定義
設(shè)隨機(jī)變量x所有可能取的值為零和正整數(shù):0,1,2,…,n,且有=k=0,1,2…,n其中p>0,q>0,p+q=1,則稱隨機(jī)變量x服從參數(shù)為n和p的二項(xiàng)分布(binomialdistribution),記為x~B(n,p)。下一張
主頁
退出
上一張
二項(xiàng)分布是一種離散型隨機(jī)變量的概率分布。參數(shù)n稱為離散參數(shù),只能取正整數(shù);p是連續(xù)參數(shù),它能取0與1之間的任何數(shù)值(q由p確定,故不是另一個(gè)獨(dú)立參數(shù))。1.二項(xiàng)分布定義下一張主頁退出上一張二30下一張
主頁
退出
上一張
(3-10)(5)(3)(4)(3-8)(3-9)(m1<m2)2.二項(xiàng)分布的特點(diǎn)具有概率分布的一切性質(zhì),即:(1)P(x=k)=Pn(k)≥0(k=0,1,…,n)(2)二項(xiàng)分布的概率之和等于1,即下一張主頁退出上一張(3-10)(5)(331圖3-1n值不同的二項(xiàng)分布比較圖3-1n值不同的二項(xiàng)分布比較32(2)當(dāng)p值趨于0.5時(shí),分布趨于對(duì)稱,如圖所示;(3)對(duì)于固定的n及p,當(dāng)k增加時(shí),Pn(k)先隨之增加并達(dá)到其極大值,以后又下降。(4)在n較大,np、nq較接近時(shí),二項(xiàng)分布接近于正態(tài)分布;當(dāng)n→∞時(shí),二項(xiàng)分布的極限分布是正態(tài)分布。下一張
主頁
退出
上一張
二項(xiàng)分布由n和p兩個(gè)參數(shù)決定,其特點(diǎn)是:(1)當(dāng)p值較小且n不大時(shí),分布是偏倚的。但隨著n的增大,分布逐漸趨于對(duì)稱,如圖所示;(2)當(dāng)p值趨于0.5時(shí),分布趨33圖3-2p值不同的二項(xiàng)分布比較圖3-2p值不同的二項(xiàng)分布比較343.1.3二項(xiàng)分布的概率計(jì)算及應(yīng)用條件(1)已知隨機(jī)變量x~B(n,p),求x正好有k次發(fā)生的概率?!纠齪43】有一批食品,其合格率為0.85,今在該批食品中隨機(jī)抽取6份該食品,求正好有5份食品合格的概率?由題意可知,食品抽檢結(jié)果有兩種可能,合格與不合格,合格率為0.85,即P(A)=0.85,相應(yīng)不合格率為P()=1-0.85=0.15,由概率公式得,正好有5個(gè)合格產(chǎn)品的概率為:下一張
主頁
退出
上一張
3.1.3二項(xiàng)分布的概率計(jì)算及應(yīng)用條件下一張主頁35(2)已知隨機(jī)變量x~B(n,p),求x最多發(fā)生k次的概率。例:同上例,問最多有4個(gè)合格的概率是多少?當(dāng)產(chǎn)品最多有k個(gè)合格時(shí),即可能的合格數(shù)為0,1,2,…,k,那么為最多有k個(gè)合格產(chǎn)品的概率。在本例中,下一張
主頁
退出
上一張
(2)已知隨機(jī)變量x~B(n,p),求x最多發(fā)生k次的36二項(xiàng)分布的應(yīng)用條件:(1)各觀察單位只具有相互對(duì)立的一種結(jié)果,如合格或不合格,生存或死亡等等,非此即彼;(2)已知發(fā)生某一結(jié)果(如死亡)的概率為p,其對(duì)立結(jié)果的概率則為1-P=q,實(shí)際中要求p是從大量觀察中獲得的比較穩(wěn)定的數(shù)值;(3)n次觀察結(jié)果互相獨(dú)立,即每個(gè)觀察單位的觀察結(jié)果不會(huì)影響到其它觀察單位的觀察結(jié)果。下一張
主頁
退出
上一張
二項(xiàng)分布的應(yīng)用條件:下一張主頁退出373.1.4二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差統(tǒng)計(jì)學(xué)證明,服從二項(xiàng)分布B(n,p)的隨機(jī)變量x的平均數(shù)μ、標(biāo)準(zhǔn)差σ與參數(shù)n、p有如下關(guān)系。設(shè)x~B(n,p),那么,二項(xiàng)分布的總體特征數(shù)為:
下一張
主頁
退出
上一張
均值μ=np標(biāo)準(zhǔn)差σ=方差σ2=npq3.1.4二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差下一張主頁退38
當(dāng)試驗(yàn)結(jié)果以事件A發(fā)生的頻率k/n表示時(shí)
也稱為總體百分?jǐn)?shù)的標(biāo)準(zhǔn)誤,當(dāng)p未知時(shí),常以樣本百分?jǐn)?shù)來估計(jì)。此時(shí)式改寫為:
=稱為樣本百分?jǐn)?shù)標(biāo)準(zhǔn)誤。下一張
主頁
退出
上一張
下一張主頁退出上一張393.2波松分布(Poisson)波松分布是一種可以用來描述和分析隨機(jī)地發(fā)生在單位空間或時(shí)間里的稀有事件的概率分布。要觀察到這類事件,樣本含量n必須很大。
所謂稀有事件即是小概率事件。在生物、醫(yī)學(xué)等研究中,服從波松分布的隨機(jī)變量也是常見的。例如,正常生產(chǎn)線中單位事件生產(chǎn)出不合格產(chǎn)品個(gè)數(shù),單位事件內(nèi)機(jī)器出現(xiàn)故障的次數(shù),每升飲水中大腸桿菌數(shù),計(jì)數(shù)器小方格中血球數(shù),一批香腸中含有毛發(fā)的香腸數(shù),1000袋面粉中含有金屬物的袋數(shù)等等,都是服從或近似服從波松分布的。下一張
主頁
退出
上一張
3.2波松分布(Poisson)波松分布是403.2.1波松分布的定義若隨機(jī)變量x(x=k)所有可能取值是非負(fù)整數(shù),且其概率分布為
其中λ>0;e=2.7182…,則稱x服從參數(shù)為λ的波松分布(Poisson‘sdistribution),記為x~P(λ)。下一張
主頁
退出
上一張
k=0,1,……3.2.1波松分布的定義下一張主頁退出上一41λ是波松分布所依賴的唯一參數(shù)。λ值愈小分布愈偏倚,隨著λ的增大,分布趨于對(duì)稱(如圖所示)。當(dāng)λ=20時(shí)分布接近于正態(tài)分布;當(dāng)λ=50時(shí),可以認(rèn)為波松分布呈正態(tài)分布。所以在實(shí)際工作中,當(dāng)λ≥20時(shí)就可以用正態(tài)分布來近似地處理波松分布的問題。3.2.2波松分布重要的特征波松分布為離散型隨機(jī)變量的概率分布,其平均數(shù)和方差相等,都等于常數(shù)λ,即μ=σ2=λλ是波松分布所依賴的唯一參數(shù)。λ值愈小分42圖3-3不同λ的泊松分布圖3-3不同λ的泊松分布433.2.3波松分布的概率計(jì)算由波松分布的概率計(jì)算公式可以看出,依賴于參數(shù)λ的確定,只要參數(shù)λ確定了,把k=0,1,2,…代入即可求得各項(xiàng)的概率。但是在大多數(shù)服從波松分布的實(shí)例中,分布參數(shù)λ往往是未知的,只能從所觀察的隨機(jī)樣本中計(jì)算出相應(yīng)的樣本平均數(shù)作為λ的估計(jì)值,將其代替計(jì)算公式中的λ,計(jì)算出k=0,1,2,…時(shí)的各項(xiàng)概率。下一張
主頁
退出
上一張
3.2.3波松分布的概率計(jì)算下一張主頁退出44【例3-6】為監(jiān)測(cè)飲用水的污染情況,現(xiàn)檢驗(yàn)?zāi)成鐓^(qū)每毫升飲用水中細(xì)菌數(shù),共得400個(gè)記錄如下:試分析飲用水中細(xì)菌數(shù)的分布是否服從波松分布。若服從,按波松分布計(jì)算每毫升水中細(xì)菌數(shù)的概率及理論次數(shù)并將頻率分布與波松分布作直觀比較。下一張
主頁
退出
上一張
【例3-6】為監(jiān)測(cè)飲用水的污染情況,現(xiàn)檢驗(yàn)?zāi)成鐓^(qū)每毫45經(jīng)計(jì)算得每毫升水中平均細(xì)菌數(shù)=0.500,方差S2=0.496。兩者很接近,故可認(rèn)為每毫升水中細(xì)菌數(shù)服從波松分布。以=0.500代替λ,得(k=0,1,2…)計(jì)算結(jié)果如表所示。下一張
主頁
退出
上一張
經(jīng)計(jì)算得每毫升水中平均細(xì)菌數(shù)=0.5046細(xì)菌數(shù)的波松分布可見細(xì)菌數(shù)的頻率分布與λ=0.5的波松分布是相當(dāng)吻合的,進(jìn)一步說明用波松分布描述單位容積(或面積)中細(xì)菌數(shù)的分布是適宜的。下一張
主頁
退出
上一張
細(xì)菌數(shù)的波松分布下一張主頁退出上一張47注意,二項(xiàng)分布的應(yīng)用條件也是波松分布的應(yīng)用條件。比如二項(xiàng)分布要求n次試驗(yàn)是相互獨(dú)立的,這也是波松分布的要求。然而一些具有傳染性的罕見疾病的發(fā)病數(shù),因?yàn)槭桌l(fā)生之后可成為傳染源,會(huì)影響到后續(xù)病例的發(fā)生,所以不符合波松分布的應(yīng)用條件。對(duì)于在單位時(shí)間、單位面積或單位容積內(nèi),所觀察的稀有事件由于某些原因分布不隨機(jī)時(shí),如細(xì)菌在牛奶中成集落存在時(shí),不呈波松分布,不能用波松分布來描述其發(fā)生規(guī)律。下一張
主頁
退出
上一張
注意,二項(xiàng)分布的應(yīng)用條件也是波松分布下一張主483.3正態(tài)分布(normaldistribution)
正態(tài)分布是一種很重要的連續(xù)型隨機(jī)變量的概率分布。自然現(xiàn)象中有許多變量是服從或近似服從正態(tài)分布的。如食品中各種成分的含量、有害物質(zhì)殘留量、瓶裝食品的重量、分析測(cè)定過程中的隨機(jī)誤差等等。許多統(tǒng)計(jì)分析方法都是以正態(tài)分布為基礎(chǔ)的。此外,還有不少隨機(jī)變量的概率分布在一定條件下以正態(tài)分布為其極限分布。因此在統(tǒng)計(jì)學(xué)中,正態(tài)分布無論在理論研究上還是實(shí)際應(yīng)用中,均占有十分重要的地位。
下一張
主頁
退出
上一張
3.3正態(tài)分布(normaldistribution)493.3.1正態(tài)分布的定義及其特征1.正態(tài)分布的定義
若連續(xù)型隨機(jī)變量x的概率分布密度函數(shù)為
其中μ為平均數(shù),σ2為方差,則稱隨機(jī)變量x服從正態(tài)分布,記為x~N(μ,σ2)。相應(yīng)的概率分布函數(shù)為
下一張
主頁
退出
上一張
(3-12)(3-11)3.3.1正態(tài)分布的定義及其特征下一張主頁退50分布密度曲線如圖3-4所示。圖3-4正態(tài)分布密度(函數(shù))曲線分布密度曲線如圖3-4所示。圖3-4正態(tài)分布密度(函512.正態(tài)分布的特征(1)正態(tài)分布密度曲線是單峰、對(duì)稱的懸鐘形曲線,對(duì)稱軸為x=μ;(2)f(x)在x=μ處達(dá)到極大,極大值(3)f(x)是非負(fù)函數(shù),以x軸為漸近線,分布從-∞至+∞;下一張
主頁
退出
上一張
;2.正態(tài)分布的特征下一張主頁退出上52(4)曲線在x=μ±σ處各有一個(gè)拐點(diǎn),即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間上是下凸的,在[μ-σ,μ+σ]區(qū)間內(nèi)是上凸的;(5)正態(tài)分布有兩個(gè)參數(shù),即平均數(shù)μ和標(biāo)準(zhǔn)差σ。μ是位置參數(shù),如圖3—5所示。當(dāng)σ恒定時(shí),μ愈大,則曲線沿x軸愈向右移動(dòng);反之,μ愈小,曲線沿x軸愈向左移動(dòng)。σ是形狀參數(shù),如圖3—6所示。當(dāng)μ恒定時(shí),σ愈大,表示x的取值愈分散,曲線愈“胖”;σ愈小,x的取值愈集中在μ附近,曲線愈“瘦”。下一張
主頁
退出
上一張
(4)曲線在x=μ±σ處各有一個(gè)拐點(diǎn),即曲線在(-∞,μ-53圖3-5σ相同而μ不同的3個(gè)正態(tài)分布比較圖3-5σ相同而μ不同的3個(gè)正態(tài)分布比較54圖3-6μ相同而σ不同的3個(gè)正態(tài)分布比較大圖3-6μ相同而σ不同的3個(gè)正態(tài)分布比較大55(6)分布密度曲線與橫軸所圍成的區(qū)間面積為1,即:下一張
主頁
退出
上一張
(7)正態(tài)分布的次數(shù)多數(shù)集中在平均數(shù)μ的附近,離均數(shù)越遠(yuǎn),其相應(yīng)次數(shù)越少,在3σ以外的極少,這就是食品工業(yè)控制中的3σ原理的基礎(chǔ)。(6)分布密度曲線與橫軸所圍成的區(qū)間面積為1,即:56正態(tài)分布是依賴于參數(shù)μ和σ2(或σ)的一簇分布,正態(tài)曲線的位置及形態(tài)隨μ和σ2的不同而不同。這就給研究具體的正態(tài)總體帶來困難,通常將一般的N(μ,σ2)轉(zhuǎn)換為μ=0,σ2=1的正態(tài)分布。3.3.2標(biāo)準(zhǔn)正態(tài)分布μ=0,σ2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)。正態(tài)分布是依賴于參數(shù)μ和σ2(或σ)的57標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別記作ψ(u)和Φ(u),下一張
主頁
退出
上一張
(3-14)μ=0σ=1(3-13)標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別記作ψ(58隨機(jī)變量u服從標(biāo)準(zhǔn)正態(tài)分布,記作u~N(0,1),分布密度曲線如圖3—7所示。圖3-7標(biāo)準(zhǔn)正態(tài)分布曲線隨機(jī)變量u服從標(biāo)準(zhǔn)正態(tài)分布,記作u~N(0,59
對(duì)于任何一個(gè)服從正態(tài)分布N(μ,σ2)的隨機(jī)變量x,都可以通過標(biāo)準(zhǔn)化變換,u=(x-μ)/σ(3-15)將其變換為服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量u。u稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差。
下一張
主頁
退出
上一張
x~N(μ,σ2)x~N(0,1)u=(x-μ)/σ對(duì)于任何一個(gè)服從正態(tài)分布N(μ,σ2)的隨機(jī)變量x603.3.3正態(tài)分布的概率計(jì)算
1.標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算
設(shè)u服從標(biāo)準(zhǔn)正態(tài)分布,則u在[u1,u2)內(nèi)取值的概率為:=Φ(u2)-Φ(u1)(3-16)Φ(u1)與Φ(u2)可由附表1查得。下一張
主頁
退出
上一張
3.3.3正態(tài)分布的概率計(jì)算下一張主頁退出61例如,u=1.75時(shí),由附表1可以查出Φ(1.75)=0.95994有時(shí)會(huì)遇到給定Φ(u)值,例如Φ(u)=0.284,反過來查u值。這時(shí)只需在附表1中找到與0.284最接近的值0.2843,對(duì)應(yīng)查出相應(yīng)的u值為
u=-0.57,即Φ(-0.57)=0.284下一張
主頁
退出
上一張
例如,u=1.75時(shí),由附表1可以查出下一張主62由標(biāo)準(zhǔn)正態(tài)分布概率計(jì)算式及正態(tài)分布的對(duì)稱性可推出下列關(guān)系式:P(0≤u<u1)=
P(u≥u1)=
P(|u|≥u1)=
P(|u|<u1)
=
P(u1≤u<u2)=下一張
主頁
退出
上一張
Φ(u1)-0.5Φ(-u1)2
Φ(-u1)(3-17)1-2
Φ(-u1)Φ(u2)-Φ(u1)由標(biāo)準(zhǔn)正態(tài)分布概率計(jì)算式及正態(tài)分布的對(duì)稱性可推出63【例3.7】已知u~N(0,1),試求:(1)P(u<-1.64)=?(2)P(u≥2.58)=?(3)P(|u|≥2.56)=?(4)P(0.34≤u<1.53)=?下一張
主頁
退出
上一張
【例3.7】已知u~N(0,1),試求:下一張主64(1)P(u<-1.64)=0.05050(2)P(u≥2.58)=Φ(-2.58)=0.024940(3)P(|u|≥2.56)=2Φ(-2.56)=2×0.005234=0.010468(4)P(0.34≤u<1.53)=Φ(1.53)-Φ(0.34)=0.93669-0.6331=0.30389下一張
主頁
退出
上一張
(1)P(u<-1.64)=0.05050下一張65對(duì)于標(biāo)準(zhǔn)正態(tài)分布,特殊區(qū)間的概率為:P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545
P(-3≤u<3)=0.9973P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99標(biāo)準(zhǔn)正態(tài)分布的三個(gè)常用概率如圖示下一張
主頁
退出
上一張
對(duì)于標(biāo)準(zhǔn)正態(tài)分布,特殊區(qū)間的概率為:下一張主頁66理論分布與抽樣分布課件67u變量在上述區(qū)間以外取值的概率分別為:P(|u|≥1)=2Φ(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2Φ(-2)=1-P(-2≤u<2)=1-0.9545=0.0455P(|u|≥3)=1-0.9973=0.0027P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.01下一張
主頁
退出
上一張
統(tǒng)計(jì)檢驗(yàn)中常用u變量在上述區(qū)間以外取值的概率分別為:下一張主68
2.一般正態(tài)分布的概率計(jì)算
若隨機(jī)變量x服從正態(tài)分布N(μ,σ2),則x的取值落在任意區(qū)間[x1,x2)的概率,記作P(x1≤x<x2),等于圖3—8中陰影部分的面積。即:下一張
主頁
退出
上一張
圖3-8正態(tài)分布的概率2.一般正態(tài)分布的概率計(jì)算下一張主頁退69
對(duì)(3-18)式作變換u=(x-μ)/σ,得dx=σdu,故有下一張
主頁
退出
上一張
(3-18)其中,
70表明服從正態(tài)分布N(μ,σ2)的隨機(jī)變量x在[x1,x2)內(nèi)取值的概率,等于服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量u在[(x1-μ)/σ,(x2-μ)/σ)內(nèi)取值的概率。因此,計(jì)算一般正態(tài)分布的概率時(shí),只要將原區(qū)間的上下限作適當(dāng)變換(標(biāo)準(zhǔn)化),就可用查標(biāo)準(zhǔn)正態(tài)分布的概率表的方法求取某一區(qū)間的概率。下一張
主頁
退出
上一張
表明服從正態(tài)分布N(μ,σ2)的隨機(jī)變量x在71【例3-8】P53已知x~N(100,22),試求P(100≤x<102)=?。=P(0≤u<1)=Φ(1)-Φ(0)=
0.8413-0.5000=0.3413【例3-8】P53已知x~N(100,22),試求P(72【例】設(shè)x服從μ=30.26,σ2=5.102的正態(tài)分布,試求P(21.64≤x<32.98)。令則u服從標(biāo)準(zhǔn)正態(tài)分布,故=P(-1.69≤u<0.53)=Φ(0.53)-Φ(-1.69)=0.7019-0.04551=0.6564
下一張
主頁
退出
上一張
【例】設(shè)x服從μ=30.26,σ2=5.10273關(guān)于一般正態(tài)分布,以下幾個(gè)概率(即隨機(jī)變量x落在μ加減不同倍數(shù)σ區(qū)間的概率)是經(jīng)常用到的。P(μ-σ≤x<μ+σ)=P(μ-2σ≤x<μ+2σ)=
P(μ-3σ≤x<μ+3σ)=P(μ-1.96σ≤x<μ+1.96σ)=P(μ-2.58σ≤x<μ+2.58σ)=0.68260.95450.99730.950.99關(guān)于一般正態(tài)分布,以下幾個(gè)概率(即隨機(jī)變量x落在74
在數(shù)理統(tǒng)計(jì)分析中,不僅注意隨機(jī)變量x落在平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間(μ-kσ,μ+kσ)之內(nèi)的概率,更關(guān)心的是x落在此區(qū)間之外的概率。把隨機(jī)變量x落在平均數(shù)μ加減不同倍數(shù)標(biāo)準(zhǔn)差σ區(qū)間之外的概率稱為雙側(cè)概率(兩尾概率),記作α。下一張
主頁
退出
上一張
對(duì)應(yīng)于雙側(cè)概率,也可以求得隨機(jī)變量x小于μ-kσ或大于μ+kσ的概率,稱為單側(cè)概率(一尾概率),記作α/2。
圖3—9兩尾概率在數(shù)理統(tǒng)計(jì)分析中,不僅注意隨機(jī)變量x落在平均數(shù)加減75附表2給出了滿足P(|u|>)=α的雙側(cè)分位的數(shù)值。因此,只要已知雙側(cè)概率α的值,由附表2就可直接查出對(duì)應(yīng)的雙側(cè)分位數(shù)。例如,已知u~N(0,1)試求:(1)P(u<-)+P(u≥)=0.10的(2)P(-≤u<﹚=0.86的由于附表2中的α值是:下一張
主頁
退出
上一張
附表2給出了滿足P(|u|>)=α76(1)P(u<-)+P(u≥)=0.10=α由附表2查得:=1.644854(2)P(-≤u<)=0.86,α=1-P(-≤u<)=1-0.86=0.14由附表2查得:=1.475791對(duì)于x~N(μ,σ2),只要將其轉(zhuǎn)換為u~N(0,1),即可求得相應(yīng)的雙側(cè)分位數(shù)。下一張
主頁
退出
上一張
(1)P(u<-)+P(u≥77【例3-9】已知飲料灌裝量x(ml)服從正態(tài)分布N(250,1.582),若P(x<)=0.05,P(x≥)=0.05,求,。P54
由題意可知,α/2=0.05,α=0.10因?yàn)镻(x≥)=故P(x<)+P(x≥)=P(u<-)+P(u≥)下一張
主頁
退出
上一張
【例3-9】已知飲料灌裝量x(ml)服從正態(tài)分布N(78=1-P(-≤u<)=0.10=α由附表2查得:=1.644854,所以(-250)/1.58=-1.644854(-250)/1.58=1.644854即=247.40,=252.60。下一張
主頁
退出
上一張
和分別為a=0.10(雙側(cè))時(shí)的下側(cè)分位數(shù)和上側(cè)分位數(shù)=1-P(-≤u<)79
前面討論的三個(gè)重要的概率分布中,前兩個(gè)屬離散型隨機(jī)變量的概率分布,后一個(gè)屬連續(xù)型隨機(jī)變量的概率分布。三者間的關(guān)系如下:
對(duì)于二項(xiàng)分布,在n→∞,p→0,且np=λ(較小常數(shù))情況下,二項(xiàng)分布趨于波松分布。在這種場(chǎng)合,波松分布中的參數(shù)λ用二項(xiàng)分布的np代之;在n→∞,p→0.5時(shí),二項(xiàng)分布趨于正態(tài)分布。在這種場(chǎng)合,正態(tài)分布中的μ、σ2用二項(xiàng)分布的np、np
q代之。在實(shí)際計(jì)算中,當(dāng)p<0.1且n很大時(shí),二項(xiàng)分布可由波松分布近似;當(dāng)p>0.1且n很大時(shí),二項(xiàng)分布可由正態(tài)分布近似。下一張
主頁
退出
上一張
前面討論的三個(gè)重要的概率分布中,前兩個(gè)屬離散型隨80
對(duì)于波松分布,當(dāng)λ→∞時(shí),波松分布以正態(tài)分布為極限。在實(shí)際計(jì)算中,當(dāng)λ≥20(也有人認(rèn)為λ≥6)時(shí),用波松分布中的λ代替正態(tài)分布中的μ及σ2,即可由后者對(duì)前者進(jìn)行近似計(jì)算。下一張
主頁
退出
上一張
對(duì)于波松分布,當(dāng)λ→∞時(shí),波松分布以正態(tài)分布為81
研究總體與所抽取的樣本之間的關(guān)系是統(tǒng)計(jì)學(xué)的中心內(nèi)容。對(duì)這種關(guān)系的研究從兩方面著手:一是從總體到樣本,這就是研究抽樣分布(samplingdistribution)的問題;二是從樣本到總體,這就是統(tǒng)計(jì)推斷(statisticalinference)問題。下一張
主頁
退出
上一張
4抽樣分布研究總體與所抽取的樣本之間的關(guān)系是統(tǒng)計(jì)學(xué)的中82統(tǒng)計(jì)推斷是以總體分布和樣本抽樣分布的理論關(guān)系為基礎(chǔ)的。為了能正確地利用樣本去推斷總體,并能正確地理解統(tǒng)計(jì)推斷的結(jié)論,必須對(duì)樣本的抽樣分布有所了解。由總體中隨機(jī)地抽取若干個(gè)體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計(jì)量(如,S)也將隨著樣本的不同而有所不同,因而樣本統(tǒng)計(jì)量也是隨機(jī)變量,也有其概率分布。我們把統(tǒng)計(jì)量的概率分布稱為抽樣分布。下一張
主頁
退出
上一張
統(tǒng)計(jì)推斷是以總體分布和樣本抽樣分布的理論關(guān)系為基83由總體隨機(jī)抽樣(randomsampling)的方法可分為有返置抽樣和不返置抽樣兩種。前者指每次抽出一個(gè)個(gè)體后,這個(gè)個(gè)體應(yīng)返置回原總體;后者指每次抽出的個(gè)體不返置回原總體。對(duì)于無限總體,返置與否都可保證各個(gè)體被抽到的機(jī)會(huì)相等。對(duì)于有限總體,就應(yīng)該采取返置抽樣,否則各個(gè)體被抽到的機(jī)會(huì)就不相等。下一張
主頁
退出
上一張
4.1樣本平均數(shù)的抽樣分布由總體隨機(jī)抽樣(randomsampling)84設(shè)有一個(gè)總體,總體平均數(shù)為μ,方差為σ2,總體中各變數(shù)為x,將此總體稱為原總體?,F(xiàn)從這個(gè)總體中隨機(jī)抽取含量為n的樣本,樣本平均數(shù)記為??梢栽O(shè)想,從原總體中可抽出很多甚至無窮多個(gè)含量為n的樣本。由這些樣本算得的平均數(shù)有大有小,不盡相同,與原總體平均數(shù)μ相比往往表現(xiàn)出不同程度的差異。這種差異是由隨機(jī)抽樣造成的,稱為抽樣誤差(samplingerror)。
下一張
主頁
退出
上一張
設(shè)有一個(gè)總體,總體平均數(shù)為μ,方差為σ2,總85總體樣本觀測(cè)前樣本值1樣本值2…樣本值n隨抽機(jī)樣…(x1,x2,…xn)(x1,x2,…xn)(x1,x2,…xn)樣本值1樣本值2樣本值nX1,X2,…,Xn隨抽機(jī)樣樣本總體X觀測(cè)以后……………總體樣本觀測(cè)前樣本值1樣本值2…樣本值n隨抽機(jī)樣…(86顯然,樣本平均數(shù)也是一個(gè)隨機(jī)變量,其概率分布叫做樣本平均數(shù)的抽樣分布。由樣本平均數(shù)構(gòu)成的總體稱為樣本平均數(shù)的抽樣總體。其平均數(shù)和標(biāo)準(zhǔn)差分別記為和。是樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差,簡(jiǎn)稱標(biāo)準(zhǔn)誤(standarderror),它表示平均數(shù)抽樣誤差的大小。統(tǒng)計(jì)學(xué)上已證明總體的兩個(gè)參數(shù)與x
總體的兩個(gè)參數(shù)有如下關(guān)系:
下一張
主頁
退出
上一張
(3-19)=μ,顯然,樣本平均數(shù)也是一個(gè)隨機(jī)變量,其概率分布叫做87(1)若隨機(jī)變量x服從正態(tài)分布N(μσ2),、、…、是由x總體得來的隨機(jī)樣本,則統(tǒng)計(jì)量=Σx/n的概率分布也是正態(tài)分布,且有=μ,,即~
N(μ,σ2/n)。(2)若隨機(jī)變量x服從平均數(shù)是μ,方差是σ2的分布(不是正態(tài)分布);,,…,是由此總體得來的隨機(jī)樣本,則統(tǒng)計(jì)量=Σx/n的概率分布,當(dāng)n相當(dāng)大時(shí)逼近正態(tài)分布N(μ,σ2/n)。這就是中心極限定理。下一張
主頁
退出
上一張
X變量與變量概率分布間的關(guān)系可由下列兩個(gè)定理說明:(1)若隨機(jī)變量x服從正態(tài)分布N(μσ2),下一張主88由中心極限定理可知,不論x變量是連續(xù)型的還是離散型的,也無論x服從何種分布,一般只要n>30,就可認(rèn)為的分布是正態(tài)的。若x的分布不很偏倚,在n>20時(shí),的分布就近似于正態(tài)分布。下一張
主頁
退出
上一張
由中心極限定理可知,不論x變量是連續(xù)型的還是離散型89均數(shù)標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤(平均數(shù)抽樣總體的標(biāo)準(zhǔn)差)的大小,反映樣本平均數(shù)的抽樣誤差的大小,即精確性的高低。標(biāo)準(zhǔn)誤大,說明各樣本平均數(shù)間差異程度大,樣本平均數(shù)的精確性低。反之,小,說明間的差異程度小,樣本平均數(shù)的精確性高。的大小與原總體的標(biāo)準(zhǔn)差σ成正比,與樣本含量n的平方根成反比。從特定總體抽樣時(shí),因?yàn)棣沂且怀?shù),所以只有增大樣本含量才能降低樣本平均數(shù)的抽樣誤差。下一張
主頁
退出
上一張
均數(shù)標(biāo)準(zhǔn)誤下一張主頁退出上一張90但在實(shí)際工作中,總體標(biāo)準(zhǔn)差σ往往是未知的,因而無法求得。此時(shí),可用樣本標(biāo)準(zhǔn)差S估計(jì)σ。于是,以估計(jì)。記為,稱作樣本標(biāo)準(zhǔn)誤或均數(shù)標(biāo)準(zhǔn)誤。樣本標(biāo)準(zhǔn)誤是平均數(shù)抽樣誤差的估計(jì)值。若樣本中各觀測(cè)值為,,…,,則下一張
主頁
退出
上一張
(3-20)但在實(shí)際工作中,總體標(biāo)準(zhǔn)差σ往往是未知的,因而無91注意,樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩個(gè)統(tǒng)計(jì)量,(3-20)式已表明了二者的聯(lián)系。二者的區(qū)別在于:
樣本標(biāo)準(zhǔn)差S是反映樣本中各觀測(cè)值,,…,變異程度大小的一個(gè)指標(biāo),它的大小說明了對(duì)該樣本代表性的強(qiáng)弱。
樣本標(biāo)準(zhǔn)誤是樣本平均數(shù)的標(biāo)準(zhǔn)差,它是抽樣誤差的估計(jì)值,其大小說明了樣本間變異程度的大小及精確性的高低。下一張
主頁
退出
上一張
注意,樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩92
對(duì)于大樣本資料,常將樣本標(biāo)準(zhǔn)差S與樣本平均數(shù)配合使用,記為±S,用以說明所考察性狀或指標(biāo)的優(yōu)良性與穩(wěn)定性。
對(duì)于小樣本資料,常將樣本標(biāo)準(zhǔn)誤與樣本平均數(shù)配合使用,記為±,用以表示所考察性狀或指標(biāo)的優(yōu)良性與抽樣誤差的大小。下一張
主頁
退出
上一張
對(duì)于大樣本資料,常將樣本標(biāo)準(zhǔn)差S與樣本平均數(shù)934.2兩樣本均數(shù)差數(shù)的抽樣分布設(shè)x1~,x2~,且x1與x2相互獨(dú)立,由這兩個(gè)總體中抽樣(無論樣本容量n1、n2多大),則樣本平均數(shù)之差()服從正態(tài)分布,即且總體參數(shù)有如下關(guān)系:(3-21)~4.2兩樣本均數(shù)差數(shù)的抽樣分布設(shè)x1~94若所有樣本均來自同一個(gè)正態(tài)總體x~,則其平均數(shù)差數(shù)的抽樣分布(不論樣本容量n1、n2大?。┓恼龖B(tài)分布,且(3-22)若所有樣本均來自非正態(tài)的同一總體,則其平均數(shù)差數(shù)的抽樣分布按中心極限定理在樣本容量n1、n2相當(dāng)大時(shí)(大于30)才逐漸接近于正態(tài)分布。若所有樣本均來自同一個(gè)正態(tài)總體x~95若所有樣本均來自兩個(gè)非正態(tài)總體,當(dāng)與相差不太大,且n1和n2趨于無窮大時(shí),其平均數(shù)差數(shù)的抽樣分布逐漸趨于正態(tài)分布。實(shí)際研究中與是未知的,常用S12與S22分別來代替,于是常用來估計(jì),記為稱為均數(shù)差數(shù)標(biāo)準(zhǔn)誤(3-23)其中,S12、S22分別是樣本含量為n1、n2的兩個(gè)樣本方差。若所有樣本均來自兩個(gè)非正態(tài)總體,當(dāng)與96如果兩個(gè)總體的方差相等,即那么,S12、S22都是的估計(jì)值,這時(shí)應(yīng)該用他們的加權(quán)平均值S02來估計(jì)
統(tǒng)計(jì)量:~t()如果兩個(gè)總體的方差相等,即那么,S12、S22都974.3學(xué)生氏t分布(t-distribution)由樣本平均數(shù)抽樣分布的性質(zhì)知道:若x~N(μ,σ2),則~N(μ,σ2/n)。將隨機(jī)變量標(biāo)準(zhǔn)化得:,則u~N(0,1)。但當(dāng)總體標(biāo)準(zhǔn)差σ未知時(shí),以樣本標(biāo)準(zhǔn)差S代替σ所得到的統(tǒng)計(jì)量記為t。下一張
主頁
退出
上一張
(3-26)~t(df)4.3學(xué)生氏t分布(t-distribution98下一張
主頁
退出
上一張
在計(jì)算時(shí),由于采用S來代替σ,使得t變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布。它的概率分布密度函數(shù)如下:(3-27)式中,df=n-1為自由度,t的取值范圍是(-∞,+∞)t分布的平均數(shù)和標(biāo)準(zhǔn)差為:μt=0(3-28)(df>2)(df>1)下一張主頁退出上一張?jiān)谟?jì)算99t分布密度曲線如圖3-11所示圖3-11不同自由度的t分布t分布密度曲線如圖3-11所示圖3-11不同自由度的t分100(1)t分布受自由度的制約,每一個(gè)自由度都有一條t分布密度曲線。(2)t分布密度曲線以縱軸為對(duì)稱軸,左右對(duì)稱,且在t=0時(shí),分布密度函數(shù)取得最大值。(3)與標(biāo)準(zhǔn)正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平。df越小這種趨勢(shì)越明顯。df越大,t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布。當(dāng)n>30時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很小;n>100時(shí),t分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;n→∞時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布完全一致。下一張
主頁
退出
上一張
t分布的特點(diǎn)是:(1)t分布受自由度的制約,每一個(gè)自由度都有一條t分布密度101
t分布的概率分布函數(shù)為:(3-29)因而t在區(qū)間(t1,+∞)取值的概率—右尾概率為1-Ft(df)。由于t分布左右對(duì)稱,t在區(qū)間(-∞,-t1)取值的概率也為1-Ftdf)。于是t分布曲線下由-∞到-t1和由t1到+∞兩個(gè)相等的概率之和—兩尾概率為2(1-Ft(df))。對(duì)于不同自由度下t分布的兩尾概率及其對(duì)應(yīng)的臨界t值已編制成附表3,即t分布表。下一張
主頁
退出
上一張
t分布的概率分布函數(shù)為:下一張主頁退102例如,當(dāng)df=15時(shí),查附表3得兩尾概率等于0.05的臨界t值為=2.131,其意義是:P(-∞<t<-2.131)=P(2.131<t<+∞)=0.025;P(-∞<t<-2.131)+
(2.131<t<+∞)=0.05。由附表3可知,當(dāng)df一定時(shí),概率P越大,臨界t值越??;概率P越小,臨界t值越大。當(dāng)概率P一定時(shí),隨著df的增加,臨界t值在減小,當(dāng)df=∞時(shí),臨界t值與標(biāo)準(zhǔn)正態(tài)分布的臨界u值相等。下一張
主頁
退出
上一張
例如,當(dāng)df=15時(shí),查附表3得兩尾概率等于0.01034.4分布如果是來自正態(tài)總體的一個(gè)隨機(jī)樣本,定義樣本方差為:那么,統(tǒng)計(jì)量服從自由度為n-1的分布,記為4.4分布如果是來自正態(tài)總104分布密度曲線(卡方)(4)分布的形狀取決于參數(shù)df,,df=1時(shí),曲線極端左偏,呈反J型;隨著df的增大,曲線漸趨左右對(duì)稱。當(dāng)df>30時(shí),分布已趨向于正態(tài)分布。分布密度曲線(卡方)(4)分布的形狀取決于參數(shù)df105下一張
主頁
退出
上一張
設(shè)為來自正態(tài)總體的一個(gè)隨機(jī)樣本,樣本方差為S12,為來自正態(tài)總體的一個(gè)隨機(jī)樣本,樣本方差為S22,且這兩個(gè)樣本相互獨(dú)立,則統(tǒng)計(jì)量4.5F分布(Fdistribution)服從第一自由度為df1=n1-1,第二自由度為df2=n2-1的F分布。記為~F(n1-1,n2-1)下一張主頁退出上一張?jiān)O(shè)106下一張
主頁
退出
上一張
F分布密度曲線是隨自由度df1、df2的變化而變化的一簇偏態(tài)曲線,其形態(tài)隨著df1、df2的增大逐漸趨于對(duì)稱,如圖所示。下一張主頁退出上一張F(tuán)分布密度曲線是隨自107第三章理論分布與抽樣分布為了便于理解統(tǒng)計(jì)分析的基本原理,正確掌握和應(yīng)用統(tǒng)計(jì)分析方法,本章在介紹概率論中最基本的兩個(gè)概念-事件、概率的基礎(chǔ)上,重點(diǎn)介紹科學(xué)研究中常用的幾種隨機(jī)變量的概率分布-正態(tài)分布、二項(xiàng)分布、波松分布以及樣本平均數(shù)的抽樣分布和t分布。下一張
主頁
退出
上一張
第三章理論分布與抽樣分布為了便于理解統(tǒng)計(jì)分析1081事件與概率1.1事件1.1.1必然現(xiàn)象與隨機(jī)現(xiàn)象
在自然界與生產(chǎn)實(shí)踐和科學(xué)試驗(yàn)中,人們會(huì)觀察到各種各樣的現(xiàn)象,把它們歸納起來,大體上分為兩大類:下一張
主頁
退出
上一張
1事件與概率1.1事件下一張主頁退109必然現(xiàn)象:可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進(jìn)行試驗(yàn),其結(jié)果總是確定的,必然發(fā)生的(或必然不發(fā)生)。這類現(xiàn)象稱為必然現(xiàn)象(inevitablephenomena)或確定性現(xiàn)象(definitephenomena)。隨機(jī)現(xiàn)象:另一類是事前不可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進(jìn)行試驗(yàn),其結(jié)果未必相同。這類在個(gè)別試驗(yàn)中其結(jié)果呈現(xiàn)偶然性、不確定性現(xiàn)象,稱為隨機(jī)現(xiàn)象(randomphenomena)或不確定性現(xiàn)象(indefinitephenomena)。下一張
主頁
退出
上一張
必然現(xiàn)象:可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進(jìn)行110隨機(jī)現(xiàn)象或不確定性現(xiàn)象,有如下特點(diǎn):在一定的條件實(shí)現(xiàn)時(shí),有多種可能的結(jié)果發(fā)生,事前人們不能預(yù)言將出現(xiàn)哪種結(jié)果;對(duì)一次或少數(shù)幾次觀察或試驗(yàn)而言,其結(jié)果呈現(xiàn)偶然性、不確定性;但在相同條件下進(jìn)行大量重復(fù)試驗(yàn)時(shí),其試驗(yàn)結(jié)果卻呈現(xiàn)出某種固有的、特定的規(guī)律性——頻率的穩(wěn)定性,通常稱之為隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。下一張
主頁
退出
上一張
隨機(jī)現(xiàn)象或不確定性現(xiàn)象,有如下特點(diǎn):下一張主1111.1.2隨機(jī)試驗(yàn)與隨機(jī)事件1隨機(jī)試驗(yàn)通常我們把根據(jù)某一研究目的,在一定條件下對(duì)自然現(xiàn)象所進(jìn)行的觀察或試驗(yàn)統(tǒng)稱為試驗(yàn)(trial)。當(dāng)一個(gè)試驗(yàn)如果滿足下述三個(gè)特性,則稱其為一個(gè)隨機(jī)試驗(yàn)(randomtrial),簡(jiǎn)稱試驗(yàn)。下一張
主頁
退出
上一張
1.1.2隨機(jī)試驗(yàn)與隨機(jī)事件下一張主頁退出112(1)試驗(yàn)可以在相同條件下多次重復(fù)進(jìn)行;(2)每次試驗(yàn)的可能結(jié)果不止一個(gè),并且事先知道會(huì)有哪些可能的結(jié)果;(3)每次試驗(yàn)總是恰好出現(xiàn)這些可能結(jié)果中的一個(gè),但在一次試驗(yàn)之前卻不能肯定這次試驗(yàn)會(huì)出現(xiàn)哪一個(gè)結(jié)果。下一張
主頁
退出
上一張
(1)試驗(yàn)可以在相同條件下多次重復(fù)進(jìn)行;下一張主1132隨機(jī)事件
隨機(jī)試驗(yàn)的每一種可能結(jié)果,在一定條件下可能發(fā)生,也可能不發(fā)生,稱為隨機(jī)事件(randomevent),簡(jiǎn)稱事件(event),通常用A、B、C等來表示。(1)基本事件
我們把不能再分的事件稱為基本事件(elementaryevent),也稱為樣本點(diǎn)(samplepoint)。下一張
主頁
退出
上一張
2隨機(jī)事件下一張主頁退出上一張114
例如,從編號(hào)為1、2、3、…、10的十個(gè)籃球中隨機(jī)抽取1個(gè)籃球,有10種不同的可能結(jié)果:“取得一個(gè)編號(hào)是1”、“取得一個(gè)編號(hào)是2”、…、“取得一個(gè)編號(hào)是10”,這10個(gè)事件都是不可能再分的事件,它們都是基本事件。由若干個(gè)基本事件組合而成的事件稱為復(fù)合事件(compoundevent)。如“取得一個(gè)編號(hào)是2的倍數(shù)”是一個(gè)復(fù)合事件,它由“取得一個(gè)編號(hào)是2”、“是4”、“是6、“是8”、“是10”5個(gè)基本事件組合而成。下一張
主頁
退出
上一張
例如,從編號(hào)為1、2、3、…、10的十個(gè)籃球中115
(2)必然事件
把在一定條件下必然會(huì)發(fā)生的事件稱為必然事件(certainevent),用Ω表示。例如,一個(gè)大氣壓下,水加熱到100C,水會(huì)沸騰;種瓜得瓜、種豆得豆下一張
主頁
退出
上一張
(3)不可能事件
在一定條件下不可能發(fā)生的事件稱為不可能事件(impossibleevent),用ф表示。例如,在滿足一定孵化條件下,從石頭孵化出小雞,就是一個(gè)不可能事件。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 列車服務(wù)禮儀培訓(xùn)課件
- 阿里巴巴人工智能戰(zhàn)略
- 分隊(duì)長(zhǎng)培訓(xùn)課件
- 信用保障之真誠(chéng)承諾函4篇
- 企業(yè)內(nèi)訓(xùn)課程設(shè)計(jì)框架內(nèi)容與形式結(jié)合
- 2026重慶望江中學(xué)校近期招聘教師6人備考題庫(kù)及一套完整答案詳解
- 分離焦慮培訓(xùn)課件
- 北京市海淀區(qū)學(xué)府幼兒園招聘?jìng)淇碱}庫(kù)及答案詳解(奪冠系列)
- 英思科m40培訓(xùn)課件
- 護(hù)理睡眠培訓(xùn)課件
- 來料檢驗(yàn)控制程序(含表格)
- 醫(yī)院供氧、供電、供水故障脆弱性分析報(bào)告
- 2025年鈦合金閥項(xiàng)目可行性研究報(bào)告
- 耙地合同協(xié)議書
- 分布式基站光伏電站建設(shè)標(biāo)準(zhǔn)
- 2024-2025學(xué)年廣東省深圳市福田區(qū)六年級(jí)(上)期末數(shù)學(xué)試卷
- 酸棗扦插快繁技術(shù)規(guī)程DB1305T+098-2016
- 道岔滾輪作用原理講解信號(hào)設(shè)備檢修作業(yè)課件
- 小學(xué)師徒結(jié)對(duì)師傅工作總結(jié)
- 2024-2025學(xué)年山東省臨沂市高二上學(xué)期期末學(xué)科素養(yǎng)水平監(jiān)測(cè)數(shù)學(xué)試卷(含答案)
- 房地產(chǎn) -北京好房子政策研究報(bào)告-規(guī)劃技術(shù)和市場(chǎng)效應(yīng) 202502
評(píng)論
0/150
提交評(píng)論