常用概率分布9課時(shí).ppt_第1頁(yè)
常用概率分布9課時(shí).ppt_第2頁(yè)
常用概率分布9課時(shí).ppt_第3頁(yè)
常用概率分布9課時(shí).ppt_第4頁(yè)
常用概率分布9課時(shí).ppt_第5頁(yè)
已閱讀5頁(yè),還剩122頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三章 常用概率分布,本章在介紹概率論中最基本的兩個(gè)概念事件、概率的基礎(chǔ)上,重點(diǎn)介紹生物科學(xué)研究中常用的幾種隨機(jī)變量的概率分布二項(xiàng)分布、正態(tài)分布以及樣本平均數(shù)的抽樣分布、t分布、 分布和F分布。,第三章 常用概率分布,第一節(jié) 事件與概率 第二節(jié) 概率分布 第三節(jié) 二項(xiàng)分布 第四節(jié) 正態(tài)分布 第五節(jié) 樣本平均數(shù)抽樣分布與標(biāo)準(zhǔn)誤 第六節(jié) t分布、 分布與F分布,第一節(jié) 事件與概率,一、事件 (一)必然現(xiàn)象與隨機(jī)現(xiàn)象 在自然界與生產(chǎn)實(shí)踐和科學(xué)試驗(yàn)中,人們會(huì)觀察到各種各樣的現(xiàn)象,把它們歸納起來(lái),大體上分為兩大類(lèi):,一類(lèi)是可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進(jìn)行觀察,其結(jié)果總是確定的,必然發(fā)生

2、(或必然不發(fā)生)。這類(lèi)現(xiàn)象稱(chēng)為必然現(xiàn)象或確定性現(xiàn)象。例如:標(biāo)準(zhǔn)大氣壓下,水加熱到100必然沸騰。 另一類(lèi)是事前不可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進(jìn)行觀察,其結(jié)果未必相同。這種在個(gè)別試驗(yàn)中其結(jié)果呈現(xiàn)偶然性、不確定性現(xiàn)象,稱(chēng)為隨機(jī)現(xiàn)象或不確定性現(xiàn)象。例如:100粒玉米種子發(fā)芽試驗(yàn),可能有0粒發(fā)芽,也可能,第一節(jié) 事件與概率,隨機(jī)現(xiàn)象或不確定性現(xiàn)象,有如下特點(diǎn): 在一定的條件實(shí)現(xiàn)時(shí),有多種可能的結(jié)果發(fā)生,事前人們不能預(yù)言將出現(xiàn)哪種結(jié)果;對(duì)一次或少數(shù)幾次觀察或試驗(yàn)而言,其結(jié)果呈現(xiàn)偶然性、不確定性; 但在相同條件下進(jìn)行大量重復(fù)試驗(yàn)時(shí),其試驗(yàn)結(jié)果卻呈現(xiàn)出某種固有的特定的規(guī)律性頻率的穩(wěn)定性,通

3、常稱(chēng)之為隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。例如:投硬幣,第一節(jié) 事件與概率,(二)隨機(jī)試驗(yàn)與隨機(jī)事件 1、隨機(jī)試驗(yàn):通常我們把根據(jù)某一研究目的,在一定條件下對(duì)自然現(xiàn)象所進(jìn)行的觀察或試驗(yàn)統(tǒng)稱(chēng)為試驗(yàn)。 一個(gè)試驗(yàn)如果滿(mǎn)足下述三個(gè)特性,則稱(chēng)其為一個(gè)隨機(jī)試驗(yàn),簡(jiǎn)稱(chēng)試驗(yàn):,第一節(jié) 事件與概率,(1)試驗(yàn)可以在相同條件下多次重復(fù)進(jìn)行; (2)每次試驗(yàn)的可能結(jié)果不止一個(gè),并且事先知道會(huì)有哪些可能的結(jié)果; (3)每次試驗(yàn)總是恰好出現(xiàn)這些可能結(jié)果中的一個(gè),但在一次試驗(yàn)之前卻不能肯定這次試驗(yàn)會(huì)出現(xiàn)哪一個(gè)結(jié)果。,第一節(jié) 事件與概率,2、隨機(jī)事件 隨機(jī)試驗(yàn)的每一種可能結(jié)果,稱(chēng)為隨機(jī)事件,簡(jiǎn)稱(chēng)事件,通常用 A、B、C 等來(lái)表示。隨機(jī)

4、事件在一定條件下可能發(fā)生,也可能不發(fā)生。 (1)基本事件 我們把不能再分的事件稱(chēng)為基本事件。,第一節(jié) 事件與概率,例如,在1、2、3、 、20這20個(gè)數(shù)字中隨機(jī)抽取1個(gè)數(shù)字,有20種不同的可能結(jié)果: “取得1個(gè)數(shù)字是1”、“取得1個(gè)數(shù)字是2”、“取得1個(gè)數(shù)字是20”。 每一種可能結(jié)果就是一個(gè)事件,這20個(gè)事件都是不可能再分的事件,它們都是基本事件。,第一節(jié) 事件與概率,由若干個(gè)基本事件組合而成的事件稱(chēng)為復(fù)合事件。 如“取得1個(gè)數(shù)字是2的倍數(shù)”是一個(gè)復(fù)合事件,它由“取得1個(gè)數(shù)字是2”、“是4”、“是6”、 、“是20”10個(gè)基本事件組合而成。 (2)必然事件 在一定條件下必然會(huì)發(fā)生的事件稱(chēng)為必然

5、事件,用表示。,第一節(jié) 事件與概率,(3)不可能事件 在一定條件下不可能發(fā)生的事件稱(chēng)為不可能事件,用表示。 必然事件與不可能事件實(shí)際上是確定性現(xiàn)象,即它們不是隨機(jī)事件,但是為了方便起見(jiàn),我們把它們看作為兩個(gè)特殊的隨機(jī)事件。,第一節(jié) 事件與概率,二、 概率 刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo),稱(chēng)為概率。事件A的概率記為P(A)。 (一)概率的統(tǒng)計(jì)定義,第一節(jié) 事件與概率,在相同條件下進(jìn)行n次重復(fù)試驗(yàn),如果隨機(jī)事件A發(fā)生的次數(shù)為m ,那么m/n稱(chēng)為隨機(jī)事件A的頻率;當(dāng)試驗(yàn)重復(fù)數(shù)n逐漸增大時(shí),隨機(jī)事件A的頻率越來(lái)越穩(wěn)定地接近某一數(shù)值p,那么就把p稱(chēng)為隨機(jī)事件A的概率。 這樣定義的概率稱(chēng)為統(tǒng)計(jì)概率。,第

6、一節(jié) 事件與概率,例如,為了確定1粒小麥種子發(fā)芽這個(gè)事件的概率,在表3-1中列出了小麥種子發(fā)芽試驗(yàn)記錄。,第一節(jié) 事件與概率,表3-1 小麥種子發(fā)芽試驗(yàn)記錄,從表3-1可看出,隨著試驗(yàn)次數(shù)的增多, 1粒小麥種子發(fā)芽這個(gè)事件的概率越來(lái)越穩(wěn)定地接近0.7,我們就把0.7作為這個(gè)事件的概率。 在一般情況下,隨機(jī)事件的概率 p 是不可能準(zhǔn)確得到的。通常以試驗(yàn)次數(shù)n充分大時(shí)隨機(jī)事件A的頻率作為該隨機(jī)事件概率的近似值。 即 P(A)=pm/n (n充分大),第一節(jié) 事件與概率,(二)概率的古典定義 有很多隨機(jī)試驗(yàn)具有以下特征: 1、試驗(yàn)的所有可能結(jié)果只有有限個(gè),即樣本空間中的基本事件只有有限個(gè); 2、各個(gè)

7、試驗(yàn)的可能結(jié)果出現(xiàn)的可能性相等,即所有基本事件的發(fā)生是等可能的; 3、試驗(yàn)的所有可能結(jié)果兩兩互不相容。,第一節(jié) 事件與概率,具有上述特征的隨機(jī)試驗(yàn),稱(chēng)為古典概型。對(duì)于古典概型,概率的定義如下: 設(shè)樣本空間由n個(gè)等可能的基本事件所構(gòu)成,其中事件A包含有m個(gè)基本事件,則事件A的概率為m/n,即 P(A)=m/n 這樣定義的概率稱(chēng)為古典概率。,第一節(jié) 事件與概率,【例31】 在1、2、3、 、20這20個(gè)數(shù)字中隨機(jī)抽取1個(gè),求下列隨機(jī)事件的概率。 (1)A=“抽得1個(gè)數(shù)字4”; (2)B=“抽得1個(gè)數(shù)字是2的倍數(shù)”。,第一節(jié) 事件與概率,因?yàn)樵撛囼?yàn)樣本空間由20個(gè)等可能的基本事件構(gòu)成,即n=20,而

8、事件A所包含的基本事件有4個(gè),既抽得編號(hào)為1,2,3,4中的任何1個(gè),事件A便發(fā)生,即mA=4,所以,第一節(jié) 事件與概率,同理,事件B 所包含的基本事件數(shù)mB=10,即抽得數(shù)字為 2,4,6,8,10,12,14,16,18,20中的任何1個(gè),事件B便發(fā)生,故,第一節(jié) 事件與概率,(三)概率的性質(zhì) 1、對(duì)于任何事件A,有0P(A)1; 2、必然事件的概率為1,即P()=1; 3、不可能事件的概率為0,即P()=0。,第一節(jié) 事件與概率,三、小概率事件實(shí)際不可能性原理 隨機(jī)事件的概率表示了隨機(jī)事件在一次試驗(yàn)中出現(xiàn)的可能性大小。若隨機(jī)事件的概率很小,例如小于0.05、0.01、0.001,稱(chēng)之為小

9、概率事件。,第一節(jié) 事件與概率,小概率事件雖然不是不可能事件,但在一次試驗(yàn)中出現(xiàn)的可能性很小,不出現(xiàn)的可能性很大,以至于實(shí)際上可以看成是不可能發(fā)生的。在統(tǒng)計(jì)學(xué)上,把小概率事件在一次試驗(yàn)中看成是實(shí)際不可能發(fā)生的事件稱(chēng)為小概率事件實(shí)際不可能性原理,亦稱(chēng)為小概率原理。小概率事件實(shí)際不可能性原理是統(tǒng)計(jì)學(xué)上進(jìn)行假設(shè)檢驗(yàn)(顯著性檢驗(yàn))的基本依據(jù)。,第一節(jié) 事件與概率,第二節(jié) 概率分布,事件的概率表示了一次試驗(yàn)?zāi)骋粋€(gè)結(jié)果發(fā)生的可能性大小。 若要全面了解試驗(yàn),則必須知道試驗(yàn)的全部可能結(jié)果及各種可能結(jié)果發(fā)生的概率,即必須知道隨機(jī)試驗(yàn)的概率分布。 先引入隨機(jī)變量的概念。,作一次試驗(yàn),其結(jié)果有多種可能。每一種可能結(jié)

10、果都可用一個(gè)數(shù)來(lái)表示,把這些數(shù)作為變量x的取值范圍,則試驗(yàn)結(jié)果可用變量x來(lái)表示。 【例32】 對(duì)100株樹(shù)苗進(jìn)行嫁接,觀察其成活株數(shù),其可能結(jié)果是 “0 株成活”,“1 株成活”,“100 株成活”。 用x表示成活株數(shù),則x的取值為0、1、2、100。,一、隨機(jī)變量,【例33】 拋擲一枚硬幣,其可能結(jié)果是“幣值一面朝上” 、“幣值一面朝下”?!皫胖狄幻娉稀庇?表示,“幣值一面朝下”用0表示,用x表示試驗(yàn)結(jié)果,則x的取值為0、1。,【例 34】 測(cè)定某品種小麥產(chǎn)量(/667.7),表示測(cè)定結(jié)果的變量x所取的值為一個(gè)特定范圍(a, b),例如200300(/667.7),x值可以取這個(gè)范圍內(nèi)的任

11、何數(shù)值。,如果表示試驗(yàn)結(jié)果的變量x,其可能取值至多為可列個(gè),且以各種確定的概率取這些不同的值,則稱(chēng)x為離散型隨機(jī)變量; 如果表示試驗(yàn)結(jié)果的變量x,其可能取值為某范圍內(nèi)的任何數(shù)值,且x在其取值范圍內(nèi)的任一區(qū)間中取值時(shí),其概率是確定的,則稱(chēng)x為連續(xù)型隨機(jī)變量。,要了解離散型隨機(jī)變量x的統(tǒng)計(jì)規(guī)律,就必須知道它的一切可能值xi 及取每種可能值的概率pi。 如果我們將離散型隨機(jī)變量x的一切可能取值xi ( i=1, 2 , ),及其對(duì)應(yīng)的概率pi,記作 P(x=xi)=pi i=1,2, (33) 則稱(chēng)(33)式為離散型隨機(jī)變量x的概率分布或分布。,二、離散型隨機(jī)變量的概率分布,常用列表法表示離散型隨機(jī)

12、變量的概率分布: x x1 x2 xn p p1 p2 pn 顯然離散型隨機(jī)變量的概率分布具有pi0和pi=1這兩個(gè)基本性質(zhì)。,連續(xù)型隨機(jī)變量的概率分布不能用分布列來(lái)表示, 因?yàn)槠淇赡苋〉闹凳遣豢蓴?shù)的。 對(duì)于連續(xù)型隨機(jī)變量x,要了解的是它在某個(gè)區(qū)間a,b)上取值的概率,即P(axb)? 下面通過(guò)頻率分布密度曲線(xiàn)予以說(shuō)明。,三、連續(xù)型隨機(jī)變量的概率分布,由表2-6 作140行水稻產(chǎn)量資料的頻率分布直方圖 ,見(jiàn)圖3-1 ,圖中縱坐標(biāo)取頻率與組距的比值 。 可以設(shè)想,如果樣本取得越來(lái)越大(n+) ,組分得越來(lái)越細(xì) (i0),某一范圍內(nèi)的頻率將趨近于一個(gè)穩(wěn)定值概率。這時(shí),頻率分布直方圖各個(gè)直方上端中點(diǎn)

13、的聯(lián)線(xiàn)頻率分布折線(xiàn)將逐漸趨向于一條曲線(xiàn),換句話(huà)說(shuō),當(dāng)n+、i0時(shí),頻率分布折線(xiàn)的極限是一條穩(wěn)定的函數(shù)曲線(xiàn)。,對(duì)于樣本是取自連續(xù)型隨機(jī)變量的情況,這條函數(shù)曲線(xiàn)將是光滑的。這條曲線(xiàn)排除了抽樣和測(cè)量的誤差,完全反映了行水稻產(chǎn)量的變動(dòng)規(guī)律。 這條曲線(xiàn)叫概率分布密度曲線(xiàn),相應(yīng)的函數(shù)叫概率分布密度函數(shù) 。,(34) 式為連續(xù)型隨機(jī)變量 x 在 區(qū)間a,b)上取值概率的表達(dá)式??梢?jiàn),連續(xù)型隨機(jī)變量的概率由概率分布密度函數(shù)確定。 圖3-1 表2-6資料的分布密度曲線(xiàn),若記概率分布密度函數(shù)為f(x),則x取值于區(qū)間a,b)的概率為圖中陰影部分的面積,即 P(axb)= (3-4),連續(xù)型隨機(jī)變量概率分布的性質(zhì):

14、 1、分布密度函數(shù)總是大于或等于0,即f(x)0; 2、當(dāng)隨機(jī)變量x取某一特定值時(shí),其概率等于0;即 (c為任意實(shí)數(shù)) 對(duì)于連續(xù)型隨機(jī)變量,僅研究其在某一個(gè)區(qū)間內(nèi)取值的概率,而不去討論取某一個(gè)值的概率。,3、 在一次試驗(yàn)中隨機(jī)變量x之取值必在-x+范圍內(nèi),為一必然事件。所以 (3-5) (35)式表示分布密度曲線(xiàn)之下、橫軸之上的全面積為1。,第三節(jié) 二項(xiàng)分布,一、貝努利試驗(yàn)及其概率公式 將某隨機(jī)試驗(yàn)重復(fù)進(jìn)行n 次,若各次試驗(yàn)結(jié)果互 不影響,即每次試驗(yàn)結(jié)果出現(xiàn)的概率都不依賴(lài)于其它各 次試驗(yàn)的結(jié)果,則稱(chēng)這n次試驗(yàn)是獨(dú)立的。,對(duì)于n次獨(dú)立的試驗(yàn),如果每次試驗(yàn)結(jié)果出現(xiàn)且只出現(xiàn)對(duì)立事件A與 之一 ,在每

15、次試驗(yàn)中出現(xiàn)A的概率是常數(shù)p(0p1) ,因而出現(xiàn)對(duì)立事件 的概率是1-p=q,則稱(chēng)這一串重復(fù)的獨(dú)立試驗(yàn)為n重貝努利試驗(yàn),簡(jiǎn)稱(chēng)貝努利試驗(yàn)。,在n重貝努利試驗(yàn)中,可以證明:事件A恰好發(fā)生k(0kn)次的概率為 k=0,1,2,n (3-6) 若把(3-6)式與二項(xiàng)展開(kāi)式 相比較就可以發(fā)現(xiàn),在n重貝努利試驗(yàn)中,事件A發(fā)生k次的概率恰好等于展開(kāi)式中的第k+1項(xiàng),所以也把(3-6)式稱(chēng)作二項(xiàng)概率公式 。,二項(xiàng)分布定義: 設(shè)隨機(jī)變量x所有可能的取值為零和正整數(shù):0,1,2, ,n,且有 k= 0,1,2,n 其中p0,q0,p+q=1,則稱(chēng)隨機(jī)變量x服從參數(shù)為n和p的二項(xiàng)分布,記為 xB(n,p)。 二

16、項(xiàng)分布是一種離散型隨機(jī)變量的概率分布。,二、二項(xiàng)分布的意義及性質(zhì),容易驗(yàn)證,二項(xiàng)分布具有概率分布的一切性質(zhì),即: 1、P(x=k)= Pn(k) 0 (k=0,1,n) 2、二項(xiàng)分布的概率之和等于1,即,3、 4、 5、 (m1m2),二項(xiàng)分布由n和p兩個(gè)參數(shù)決定。參數(shù)n只能取正整數(shù),參數(shù)p能取0與1之間的任何數(shù)值(q由p確定,故不是另一個(gè)獨(dú)立參數(shù))。 1、當(dāng)p值較小且n不大時(shí),分布是偏倚的。但隨著n的增大 ,分布逐漸趨于對(duì)稱(chēng),如圖32所示;,2、當(dāng) p 值趨于0.5時(shí),分布趨于對(duì)稱(chēng),如圖33所示; 3、對(duì)于固定的n及p,當(dāng) k 增加時(shí),Pn(k)先隨之增加并達(dá)到其極大值,以后又下降。,【例3

17、-5】有一批玉米種子,出苗率為0.67,現(xiàn)任取6粒種子種1穴中,問(wèn)這穴至少有1粒種子出苗的概率是多少? 根據(jù)題意, n=6, p=0.67,q =(1-0.67)=0.33。設(shè)6粒種子出苗為x粒,則x為服從二項(xiàng)分布B(6,0.67)的隨機(jī)變量。于是6粒種子種1穴中, 這穴至少有1粒種子出苗的概率為:,三、二項(xiàng)分布的概率計(jì)算,P(“至少1粒種子出苗”) = P(x=1)+P(x=2)+P(x=6) = = 0.01570.07990.2162 0.32920.26720.0905 = 0.9987,【 例3-6 】大豆紫花與白花這一相對(duì)性狀在F2的分離比例符合一對(duì)等位基因的遺傳規(guī)律,即F2的紫花

18、植株與白花植株之比為3:1。求F2 10株有7株是紫花的概率。 根據(jù)題意,n=10,p=3/4=0.75,q=1/4=0.25。設(shè)F2 10株中紫花植株為x株,則x為服從二項(xiàng)分布B(10,0.75)的隨機(jī)變量。于是F2 10株有7株是紫花的概率為:,統(tǒng)計(jì)學(xué)證明,服從二項(xiàng)分布B(n,p)的隨機(jī)變量之平均數(shù)、標(biāo)準(zhǔn)差與參數(shù)n、p有如下關(guān)系: 當(dāng)試驗(yàn)結(jié)果以事件A發(fā)生次數(shù)k表示時(shí) =np,四、二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差,也稱(chēng)為總體百分?jǐn)?shù)標(biāo)準(zhǔn)誤,當(dāng) p 未知時(shí),常以樣本百分?jǐn)?shù) 來(lái)估計(jì)。此時(shí) (3-13) 式改寫(xiě)為:,稱(chēng)為樣本百分?jǐn)?shù)標(biāo)準(zhǔn)誤。,當(dāng)試驗(yàn)結(jié)果以事件A發(fā)生的頻率k/n表示時(shí) (3-13),【例37】

19、某樹(shù)種幼苗成材率為70%,現(xiàn)種植2000株,問(wèn)成材幼苗株數(shù)的平均數(shù)、標(biāo)準(zhǔn)差是多少? 根據(jù)題意 , n=2000 , p=0.70,q=0.30。設(shè)2000株幼苗成材為x株,則x為服從二項(xiàng)分布B(2000,0.70)的隨機(jī)變量。,成材幼苗株數(shù)的平均數(shù),成材幼苗株數(shù)的標(biāo)準(zhǔn)差,第四節(jié) 正態(tài)分布,正態(tài)分布是一種很重要的連續(xù)型隨機(jī)變量的概率分布。生物現(xiàn)象中有許多變量是服從或近似服從正態(tài)分布的。許多統(tǒng)計(jì)分析方法都是以正態(tài)分布為基礎(chǔ)的。此外,還有不少隨機(jī)變量的概率分布在一定條件下以正態(tài)分布為其極限分布。因此在統(tǒng)計(jì)學(xué)中,正態(tài)分布無(wú)論在理論研究上還是實(shí)際應(yīng)用中,均占有重要的地位。 定積分與圖形面積,定積分的定義

20、,面積與定積分,一、正態(tài)分布的定義及其特征,(一) 正態(tài)分布的定義:若連續(xù)型隨機(jī)變量x的概率分布密度函數(shù)為 其中為平均數(shù),2為方差,則稱(chēng)隨機(jī)變量 x服從正態(tài)分布,記為xN(,2)。 相應(yīng)的概率分布函數(shù)為,分布密度曲線(xiàn)如圖34所示。 (二) 正態(tài)分布的特征 1、正態(tài)分布密度曲線(xiàn)是單峰、對(duì)稱(chēng)的“懸鐘”形曲線(xiàn),對(duì)稱(chēng)軸為x=; 2、f(x)在x =處達(dá)到極大,極大值; 3、f(x)是非負(fù)函數(shù),以x軸為漸近線(xiàn),分布從-至+;,4、曲線(xiàn)在x=處各有一個(gè)拐點(diǎn),即曲線(xiàn)在(-,-)和(+,+) 區(qū)間上是下凸的, 在 -,+區(qū)間內(nèi)是上凸的; 5、正態(tài)分布有兩個(gè)參數(shù),即平均數(shù)和標(biāo)準(zhǔn)差。,是位置參數(shù),當(dāng)恒定時(shí),愈大,

21、則曲線(xiàn)沿x軸愈向右移動(dòng);反之,愈小,曲線(xiàn)沿x軸愈向左移動(dòng)。如圖35所示。 是變異度參數(shù), 當(dāng)恒定時(shí),愈大,表示 x 的取值愈分散, 曲線(xiàn)愈“胖”;愈小,x的取值愈集中在附近,曲線(xiàn)愈“瘦”。如圖36所示。,6、分布密度曲線(xiàn)與橫軸所夾的面積為1,即:,二、標(biāo)準(zhǔn)正態(tài)分布,=0,2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布。 標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別記作(u)和(u),由 (3-15)及(3-16) 式得: 隨機(jī)變量u服從標(biāo)準(zhǔn)正態(tài)分布,記作uN(0,1),分布密度曲線(xiàn)如圖37所示。,對(duì)于任何一個(gè)服從正態(tài)分布N(,2)的隨機(jī)變量x,都可以通過(guò)標(biāo)準(zhǔn)化變換: 將其變換為服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量u。 u稱(chēng)

22、為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差,三、正態(tài)分布的概率計(jì)算,(一)標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算 設(shè)u服從標(biāo)準(zhǔn)正態(tài)分布,則 u 在u1,u2 )內(nèi)取值的概率為: (u2)(u1) -(3-20),由(3-20) 式及正態(tài)分布的對(duì)稱(chēng)性可推出下列關(guān)系式: P(0uu1)(u1)-0.5 P(uu1) =(-u1) P(uu1)=2(-u1) P(uu1)1-2(-u1) P(u1uu2)(u2)-(u1) -(3-21),例如,u=1.75,(1.75)=0.95994 有時(shí)會(huì)遇到給定(u)值,例如(u)=0.284, 反過(guò)來(lái)查u值。這只要在附表1中找到與0.284 最接近的值0.2843,對(duì)應(yīng)行的第一列數(shù) -

23、0.5,對(duì) 應(yīng)列的第一行數(shù)值0.07,即相應(yīng)的u值為u =0.57,即 (-0.57)=0.284,【例38】 已知 uN(0,1),試求 (1) P (u-1.64); (2) P(u2.58); (3) P (u2.56); (4) P (0.34u1.53)。,利用(3-21)式,查附表1得: (1) P (u-1.64)(-1.64)0.0505 (2) P (u2.58)(-2.58)0.00494 (3) P (u2.56)2(-2.56) 20.0052340.010468 (4) P (0.34u1.53) (1.53)(0.34) 0.936690.63310.30389,關(guān)

24、于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記: P(-1u1)=0.6826 P(-2u2)=0.9545 P(-3u3)=0.9973 P(-1.96u1.96)=0.95 P (-2.58u2.58)=0.99 圖38 標(biāo)準(zhǔn)正態(tài)分布的三個(gè)常用概率,隨機(jī)變量u在上述區(qū)間以外取值的概率分別為: P(u1)=1- P(-1u1) =1-0.6826=0.3174 P(u2)=1- P(-2u2) =1-0.9545=0.0455 P(u3)= 1- P(-3u3) =1-0.9973=0.0027,P(u1.96)=1-0.95 =0.05 P(u2.58)=1-0.99 =0.01,(二)一般正態(tài)分布

25、的概率計(jì)算,若隨機(jī)變量x服從正態(tài)分布N(,2),則x的取值落在任意區(qū)間 x1,x2)的概率,記作P(x1 x x2),等于圖3-9中陰影部分曲邊梯形面積。即:,作變換u=(x-)/,得dx=du,故有 其中,,表明服從正態(tài)分布N(,2)的隨機(jī)變量x在x1,x2 )內(nèi)取值的概率,等于服從標(biāo)準(zhǔn)正態(tài)分布的隨 機(jī)變量u在(x1-)/,(x2-)/)內(nèi)取值的概率。 因此,計(jì)算一般正態(tài)分布的概率時(shí),只要將區(qū)間的上下限作適當(dāng)變換(標(biāo)準(zhǔn)化),就可用查標(biāo)準(zhǔn)正態(tài)分布的概率表的方法求得概率。,【例39】 設(shè)x 服從=30.26,2=5.102的正態(tài)分布,試求P(21.64x32.98) 令: 則u服從標(biāo)準(zhǔn)正態(tài)分布N

26、(0,1),故:,=P(-1.69u0.53) =(0.53)-(-1.69) =0.7019-0.04551=0.6564,關(guān)于一般正態(tài)分布,P(-x+)=0.6826 P(-2x+2)=0.9545 P (-3x+3)=0.9973 P (-1.96x+1.96)=0.95 P (-2.58x+2.58)=0.99,生物統(tǒng)計(jì)中,不僅注意隨機(jī)變量x落在平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間(-k,+k)之內(nèi)的概率而且 也很關(guān)心x落在此區(qū)間之外的概率。 我們把隨機(jī)變量x落在平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間之外的概率稱(chēng)為兩尾概率,記作。,用兩尾概率可以求得隨機(jī)變量x小于-k或大于+k的概率,稱(chēng)為一尾概率,記作

27、/2。 x落在(-1.96,+1.96)之外的兩尾概率為0.05,而一尾概率為0.025。即: P(x-1.96)= P(x+1.96)=0.025 x落在(-2.58,+2.58)之外的兩尾概率為0.01,而一尾概率為0.005。即 P(x-2.58)= P(x+2.58)=0.005 兩尾概率如圖3-10所示,一尾概率如圖3-11所示。,【例310】 已知 xN(30.26,5.12), 求 (1)P(x15); (2)P(x40); (3)P(x30.265.1); (4)P(20.06x40.46)。,則u服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),故 (1)P(x15) P( ) = P(u-2.

28、9922) =(-2.9922) =0.001395,(2) P (x40) =P( ) =P(u1.9098) =(-1.9098) 0.0281,(3)P(x30.265.1),附表2給出了滿(mǎn)足P (uu)=的雙側(cè)分位 的數(shù)值。因此,只要已知雙側(cè)概率的值,由附表2就可直接查出對(duì)應(yīng)的雙側(cè)分位數(shù)u,查法與附表1相同。,例如,已知uN(0,1)試求: (1) P(u- u)+P(uu)=0.10的u (2) P(- uuu=0.86的u 因?yàn)楦奖?中的值是:,所以 (1) P(u- u)+ P(uu) =1- P(- uuu=0.10= 由附表2查得: u=1.644854 (2) P (- u

29、u u)=0.86 , =1- P (- uuu)=1-0.86=0.14 由附表2查得: u=1.475791,對(duì)于xN(,2),只要將其轉(zhuǎn)換為uN(0,1),即可求得相應(yīng)的雙側(cè)分位數(shù)。 【例3.11】 已知x 服從正態(tài)分布 N ( 12.86,1.332 ), 若 P (xl1) =0.03, P(xl2)=0.03,求l1、l2 。,由題意可知,/2=0.03,=0.06 又因?yàn)?故: P(xl1)+ P(xl2) = P(u- u) + P(uu) =1- P(- uuu)=0.06= 由附表2查得:u0.06=1.880794 所以: (l1-12.86)/1.33=-1.88079

30、4 (12-12.86)/1.33=1.880794 即:l1=10.36,12=15.36,第五節(jié) 樣本平均數(shù)的抽樣分布 與標(biāo)準(zhǔn)誤,由總體中隨機(jī)地抽取若干個(gè)體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計(jì)數(shù)(如, 、s) 也將隨樣本的不同而有所不同,因而樣本統(tǒng)計(jì)數(shù)也是隨機(jī)變量,也有其概率分布。 我們把統(tǒng)計(jì)數(shù)的概率分布稱(chēng)為抽樣分布。,一、樣本平均數(shù)抽樣分布,由于總體隨機(jī)抽樣的方法可分為有返置抽樣和不返置抽樣兩種。 前者指每次抽出一個(gè)個(gè)體后,這個(gè)個(gè)體應(yīng)返置回原總體;后者指每次抽出的個(gè)體不返置回原總體。 對(duì)于無(wú)限總體,返置與否都可保證各個(gè)體被抽到的機(jī)會(huì)相等。對(duì)于有限總體,就應(yīng)該采取返置抽樣,否則各個(gè)

31、體被抽到的機(jī)會(huì)就不相等。,設(shè)有一個(gè)總體,總體平均數(shù)為,方差為2 ,總體中各變數(shù)為x,將此總體稱(chēng)為原總體?,F(xiàn)從這個(gè)總體中隨機(jī)抽取含量為n的樣本,樣本平均數(shù)記為 。 可以設(shè)想,從原總體中可抽出很多甚至無(wú)窮多個(gè)含量為n的樣本。由這些樣本算得的平均數(shù)有大有小,不盡相同,與原總體平均數(shù)相比往往表現(xiàn)出不同程度的差異。這種差異是由隨機(jī)抽樣造成的,稱(chēng)為抽樣誤差。,樣本平均數(shù)也是一個(gè)隨機(jī)變量,其概率分布叫做樣本平均數(shù)的抽樣分布。 由樣本平均數(shù)構(gòu)成的總體稱(chēng)為樣本平均數(shù)的抽樣總體。其平均數(shù)和標(biāo)準(zhǔn)差分別記為 和,是樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差,簡(jiǎn)稱(chēng)標(biāo)準(zhǔn)誤,它表示平均數(shù)抽樣誤差的大小。 統(tǒng)計(jì)學(xué)上已證明總體的兩個(gè)參數(shù)與x

32、總體的兩個(gè)參數(shù)有如下關(guān)系: 證明如下:,有一個(gè)包含4個(gè)個(gè)體的有限總體(N=4),變數(shù)為2、3、3、4。 根據(jù)=x/N和2=(x-)2/N求得該總體的、2、為: =3, 2=1/2, = =0.707 從有限總體作返置隨機(jī)抽樣,所有可能的樣本數(shù)為Nn,其中n為樣本含量。,以上述總體而論,如果從中抽取n=2的樣本,共可得42=16個(gè)樣本;如果樣本含量n為4,則一共可抽得44=256個(gè)樣本。 分別求這些樣本的平均數(shù) ,其次數(shù)分布如表32 所示。 在n=2的試驗(yàn)中,樣本平均數(shù)、抽樣總體的平均數(shù)、方差與標(biāo)準(zhǔn)差分別為:,表32 N=4, n=2和n=4時(shí)的次數(shù)分布,=4/16=1/4=(1/2)/2=,n

33、=4時(shí): 這就驗(yàn)證了 =, 的正確性。,X 變量與 變量概率分布間的關(guān)系可由下列兩 個(gè)定理說(shuō)明: P73:(1),(2),中心極限定理告訴我們:不論x變量是連續(xù)型還是離散型,也無(wú)論x服從何種分布,一般只要n30,就可認(rèn)為 的分布是正態(tài)的。 若x的分布不很偏倚,在n20時(shí), 的分布就近似于正態(tài)分布了。,二、標(biāo)準(zhǔn)誤,標(biāo)準(zhǔn)誤(平均數(shù)抽樣總體的標(biāo)準(zhǔn)差) 的大小反映樣本平均數(shù) 的抽樣誤差的大小,即精確性的高低 。 的大小與原總體的標(biāo)準(zhǔn)差成正比,與樣本含量n的平方根成反比。從某特定總體抽樣,因?yàn)槭且怀?shù),所以只有增大樣本含量才能降低樣本平均數(shù) 的抽樣誤差。,在實(shí)際工作中,總體標(biāo)準(zhǔn)差往往是未知的,因而無(wú)法求

34、得 。此時(shí),可用樣本標(biāo)準(zhǔn)差s估計(jì)。于是,以 估計(jì) 。記為 ,稱(chēng)作樣本標(biāo)準(zhǔn)誤或均數(shù)標(biāo)準(zhǔn)誤。樣本標(biāo)準(zhǔn)誤 是平均數(shù)抽樣誤差的估計(jì)值。若樣本中各觀測(cè)值為 , ,則,樣本標(biāo)準(zhǔn)誤 是樣本平均數(shù)的標(biāo)準(zhǔn)差,它是抽樣誤差的估計(jì)值,其大小說(shuō)明了樣本間變異程度的大小及精確性的高低。,樣本標(biāo)準(zhǔn)差s是反映樣本中各觀測(cè)值變異程度大小的一個(gè)指標(biāo),它的大小說(shuō)明了 對(duì)該樣本代表性的強(qiáng)弱。,注意,樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩個(gè)統(tǒng)計(jì)量,(3-24) 式已表明了二者的聯(lián)系。二者的區(qū)別在于:,對(duì)于小樣本資料,常將樣本標(biāo)準(zhǔn)誤 與樣本平均數(shù) 配合使用,記為 , 用以表示所考察性狀或指標(biāo)的優(yōu)良性與抽樣誤差的大小。,對(duì)于大樣本

35、資料,常將樣本標(biāo)準(zhǔn)差s與樣本平均數(shù) 配合使用,記為 s,用以說(shuō)明所考察性狀或指標(biāo)的優(yōu)良性與穩(wěn)定性。,第六節(jié) t 分布、 分布與F分布,當(dāng)總體標(biāo)準(zhǔn)差未知時(shí), 以樣本標(biāo)準(zhǔn)差S代替所得到的統(tǒng)計(jì)數(shù) 記為t。即,一、t分布,若xN(, 2), 則 N(, 2/n)。 將隨機(jī)變量 標(biāo)準(zhǔn)化得: ,則uN(0,1)。,在計(jì)算 時(shí),由于采用s來(lái)代替,使得t 變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從自由度df=n-1 的t分布。,t的取值范圍是(-,+);,t分布密度曲線(xiàn)如圖3-13 所示 ,其特 點(diǎn)是:,1、t分布受自由度的制約,每一個(gè)自由度都有一條t分布密度曲線(xiàn)。 2、t分布密度曲線(xiàn)以縱軸為對(duì)稱(chēng)軸,左右對(duì)稱(chēng),且在t0時(shí),分布密度函數(shù)取得最大值。,3、與標(biāo)準(zhǔn)正態(tài)分布曲線(xiàn)相比,t分布曲線(xiàn)頂部略低 ,兩尾部稍高而平。df 越小這種趨勢(shì)越明顯 。df越大,t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布。當(dāng)n 30時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很小;n 100 時(shí),t分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;n時(shí),t 分布與標(biāo)準(zhǔn)正態(tài)分布完全一致。,用f(t)表示t分布的概率密度函數(shù),則t分布的概率分布函數(shù)為: 因而t在區(qū)間

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論