試驗(yàn)統(tǒng)計(jì)方法 3.第四章理論分布和抽樣分布學(xué)習(xí)資料_第1頁
試驗(yàn)統(tǒng)計(jì)方法 3.第四章理論分布和抽樣分布學(xué)習(xí)資料_第2頁
試驗(yàn)統(tǒng)計(jì)方法 3.第四章理論分布和抽樣分布學(xué)習(xí)資料_第3頁
試驗(yàn)統(tǒng)計(jì)方法 3.第四章理論分布和抽樣分布學(xué)習(xí)資料_第4頁
試驗(yàn)統(tǒng)計(jì)方法 3.第四章理論分布和抽樣分布學(xué)習(xí)資料_第5頁
已閱讀5頁,還剩58頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

【例題1】有一小麥品比試驗(yàn),共有8個品種,用A、B、C、D、E、F、G、H作為品種代號,其中A為對照品種。采用隨機(jī)區(qū)組設(shè)計(jì),設(shè)置三次重復(fù),小區(qū)面積25m2。試作分析。小麥品比試驗(yàn)(隨機(jī)區(qū)組)的產(chǎn)量結(jié)果(kg)區(qū)組ⅠⅡⅢTt平均品種A(CK)10.99.112.232.210.7B10.812.314.037.112.4C11.112.510.534.111.4D9.110.710.129.910.0E11.813.916.842.514.2F10.110.611.832.510.8G10.011.514.135.611.9H9.310.414.434.111.4Tr83.191.0103.9278【例題2】為了了解我國小麥品種的產(chǎn)量變異情況,今從品種資源庫中隨機(jī)抽取8個品種,用A、B、C、D、E、F、G、H作為品種代號,進(jìn)行品比試驗(yàn)。采用隨機(jī)區(qū)組設(shè)計(jì),設(shè)置三次重復(fù),小區(qū)面積25m2。試作分析。堅(jiān)強(qiáng)是什么?是長夜漫漫淚水流盡,依然早起擁抱新的太陽樂觀是什么?是暴雨傾盆沒有帶傘,就笑著跑著來一場淋浴游戲第四章理論分布和抽樣分布概率基礎(chǔ)知識幾種常見的理論分布離散型隨機(jī)變量的理論分布

二項(xiàng)分布泊松分布

連續(xù)性隨機(jī)變量的理論分布

正態(tài)分布抽樣分布

第一節(jié)事件、概率和隨機(jī)變量一、事件和事件發(fā)生的概率

在科學(xué)試驗(yàn)和生產(chǎn)實(shí)踐中,人們會觀察到各種各樣的現(xiàn)象,每種現(xiàn)象出現(xiàn)的可能結(jié)果稱為事件。必然事件:在一定條件下必然出現(xiàn)的現(xiàn)象。用U表示。不可能事件:在一定條件下必然不出現(xiàn)的事件,用V表示。隨機(jī)事件:相同條件下重復(fù)進(jìn)行試驗(yàn),而事前無法預(yù)言其隨后結(jié)果(可出現(xiàn)也可不出現(xiàn))的現(xiàn)象。

隨機(jī)事件的特點(diǎn):

(1)試驗(yàn)可以在相同條件下多次重復(fù)進(jìn)行;(2)每次試驗(yàn)的可能結(jié)果不止一個,并且

事先知道會有哪些可能的結(jié)果;(3)每次試驗(yàn)總是恰好出現(xiàn)這些可能結(jié)果

中的一個,但在一次試驗(yàn)之前卻不能

肯定這次試驗(yàn)會出現(xiàn)哪一個結(jié)果。一次或少數(shù)試驗(yàn),結(jié)果呈現(xiàn)偶然性。大量重復(fù)試驗(yàn),試驗(yàn)結(jié)果呈現(xiàn)某種規(guī)律性——頻率的穩(wěn)定性。例如:拋擲一枚硬幣發(fā)生正面朝上的頻率試驗(yàn)結(jié)果試驗(yàn)的次數(shù)頻率1.000.000.250.500.750255075100125

概率(probability)

一個事件發(fā)生的可能性,稱為概率。

事件A的概率表示方法為P(A)。

1、對于任何事件A,有0≤P(A)≤1;2、必然事件的概率為1,即P(U)=1;3、不可能事件的概率為0,即P(V)=0。

小概率原理若隨機(jī)事件的概率很小,稱之為小概率事件。

例如:統(tǒng)計(jì)學(xué)一般將概率小于0.05、0.01、0.001,稱為小概率?!鲈谝淮卧囼?yàn)中不可能發(fā)生;■大量試驗(yàn)中,一定發(fā)生。

小概率事件在一次試驗(yàn)中看成是實(shí)際不可能發(fā)生的事件,稱為小概率事件實(shí)際不可能性原理,亦稱為小概率原理。小概率原理是統(tǒng)計(jì)學(xué)上進(jìn)行假設(shè)檢驗(yàn)(顯著性檢驗(yàn))的基本依據(jù)。

二、事件間的關(guān)系(P48)

三、計(jì)算事件概率的法則(P49)

四、隨機(jī)變量(randomvariable)

作一次試驗(yàn),其結(jié)果有多種可能。每一種可能結(jié)果的出現(xiàn)都具有一定的隨機(jī)性和偶然性,這些變量叫隨機(jī)變量。

隨機(jī)變量常用X、Y和Z等表示.離散型隨機(jī)變量(discreterandomvariable);

如果隨機(jī)變量X的結(jié)果是明確的,并可一一列出,當(dāng)X取某一值時,其概率是確定的,則稱X為離散型隨機(jī)變量。離散型隨機(jī)變量的概率分布

要了解離散型隨機(jī)變量的統(tǒng)計(jì)規(guī)律,就必須知道它的一切可能值xi及取每種可能值的概率pi。

常用分布列來表示:x1x2…xi…p1p2…pi…

pi≥0,Σpi=1連續(xù)型隨機(jī)變量(continuousrandomvariable)。

如果表示試驗(yàn)結(jié)果的變量X,其可能取值為某范圍內(nèi)的任何數(shù)值,且X在其取值范圍內(nèi)的任一區(qū)間中取值時,其概率是確定的,則稱X為

連續(xù)型隨機(jī)變量。連續(xù)型隨機(jī)變量的概率分布

連續(xù)型隨機(jī)變量(如產(chǎn)量、株高)的概率分布不能用分布列來表示,因?yàn)槠淇赡苋≈凳遣豢蓴?shù)的。我們改用隨機(jī)變量X在某個區(qū)間內(nèi)取值的概率P(a≤x<b)來表示。P(a≤x<b)=

連續(xù)型隨機(jī)變量概率分布的性質(zhì):

1、f(x)≥0;2、

(c為任意實(shí)數(shù))因而,對于連續(xù)型隨機(jī)變量,僅研究其在某一個區(qū)間內(nèi)取值的概率,而不去討論取某一個值的概率。3、

第二節(jié)二項(xiàng)分布一、二項(xiàng)總體和二項(xiàng)分布生物學(xué)研究中經(jīng)常碰到離散型的隨機(jī)變量,常??梢园涯硞€性狀分成兩種類型,例如,種子的發(fā)芽與不發(fā)芽、穗子有芒與無芒、哺乳動物的雄性與雌性等。由對立事件構(gòu)成的總體,稱為二項(xiàng)總體。貝努里試驗(yàn):試驗(yàn)的對象只有兩種結(jié)果,事件A和A。事件A的概率是p,事件A的概率是q。而且p+q=1事件A和A是可以計(jì)數(shù)的。從二項(xiàng)總體中連續(xù)抽取n個個體,將結(jié)果是A的次數(shù)記為X。以x表示事件A在n個個體中出現(xiàn)的次數(shù),則x是一個離散型隨機(jī)變量。它的所有可能取值為0,1,2,…,n,其概率分布函數(shù)為:稱P(x)為隨機(jī)變量x的二項(xiàng)分布,記作B(n,p),也叫貝努里分布。如果連續(xù)進(jìn)行N次同樣的抽樣,得到某一觀察值xi的理論次數(shù)則為:理論次數(shù)=

N·P(xi)二項(xiàng)分布的概率累積函數(shù):F(x)=∑P(x=i)

i=0x二項(xiàng)分布的特征:

(1)每個試驗(yàn)只有兩個對立結(jié)果。(2)若其中一個結(jié)果的概率為p,則其對立結(jié)果的概率為q=1-p(3)n次試驗(yàn)是互相獨(dú)立的,即每個試驗(yàn)結(jié)果不會影響到其它試驗(yàn)結(jié)果。二、二項(xiàng)分布的概率計(jì)算

【例題1】豌豆紅花與白花雜交,根據(jù)孟德爾遺傳理論,F(xiàn)2代中紅花與白花的比率為3:1。若一次隨機(jī)觀察12株,有7株紅花的概率是多少?若連續(xù)觀察50次,理論上有幾次出現(xiàn)7株紅花?解:n=12,p=3/4=0.75,

q=1/4=0.25。設(shè)12株豌豆中紅花的株數(shù)以x表示,則x為服從二項(xiàng)分布B(12,0.75)的隨機(jī)變量。于是12株豌豆中有7株是紅花的概率為:P(7)=C127.p7.q5=792×0.757×0.255=0.1032若觀察50次(N),出現(xiàn)7株紅花的理論次數(shù)為理論次數(shù)=N×P(7)=50X0.1032=5.16(次)例題2某小麥品種在田間出現(xiàn)自然變異植株的概率為0.0045,試計(jì)算:(1)觀察100株,獲得兩株或兩株以上變異植株的概率是多少?(2)期望有0.99的概率獲得1株或1株以上的變異植株,至少應(yīng)觀察多少株?解:已知變異株概率p=0.0045非變異株的概率q=1-p=0.9955

n=100

(1)獲得0個變異株概率,

x=0,P(0)=0.6370 獲得1個變異株概率,

x=1,P(1)=0.2879

獲得2株或以上變異株概率為:

x≥2,P(x≥2)=1-P(0)-P(1)=0.0751(2)如果期望調(diào)查n株中至少有1株是變異株的概率是0.99,則獲得非變異株的概率:P(0)=1-0.99=0.01即:x=0,P(0)=因?yàn)閝=0.9955,所以,因此,至少應(yīng)觀察1021株才能滿足要求。三、二項(xiàng)分布的形狀和參數(shù)1.二項(xiàng)分布的形狀

由n和p兩個參數(shù)決定(1)當(dāng)p值較小且n值不大時圖形是偏畸的。隨著n值的增大,分布逐漸趨于對稱。(2)當(dāng)p值趨于0.5時,分布趨于對稱。

2、二項(xiàng)分布的參數(shù)

二項(xiàng)總體次數(shù)分布的參數(shù)

若隨機(jī)變量(次數(shù)X)服從二項(xiàng)分布B(n,p)平均數(shù)μx=np

標(biāo)準(zhǔn)差(例題):豌豆花色遺傳,F(xiàn)2代紅花P=0.75。每次觀察10株,觀察100次,由此形成一個二項(xiàng)分布。求出現(xiàn)紅花的平均次數(shù)及標(biāo)準(zhǔn)差。

以p=0.75,n=10代入上式得:μx=np=10×0.75=7.5(株)

=1.37(株)四、泊松分布---二項(xiàng)分布的一種極限分布

1、泊松分布的意義在生物學(xué)研究中,當(dāng)許多事件出現(xiàn)的概率很小,而樣本的容量或試驗(yàn)次數(shù)卻往往很大,即有很小的p值和很大的n值時,二項(xiàng)分布就變成了一種特殊的分布——泊松分布(Poissondistribution)。泊松分布也是一種離散型隨機(jī)變量的分布,其分布的概率函數(shù)為:式中,λ為參數(shù),λ=np,x=0,1,2,…,∞。稱x服從參數(shù)為λ的波松分布,記為x~P(λ)。泊松分布的平均數(shù)和方差、標(biāo)準(zhǔn)差為:

μ=λ σ2=λ

μ=σ2=λ

是泊松分布的重要特征二項(xiàng)分布中,一般當(dāng)P<0.1和np<5時,可用泊松分布來近似計(jì)算。

2、波松分布的概率計(jì)算

由上式可知,波松分布的概率計(jì)算,依賴于參數(shù)λ的確定。但是在大多數(shù)服從波松分布的實(shí)例中,分布參數(shù)λ往往是未知的,只能從所觀察的隨機(jī)樣本中計(jì)算出相應(yīng)的樣本平均數(shù)作為λ的估計(jì)值。進(jìn)而計(jì)算出x=0,1,2,…時的各事件概率。

泊松分布是描述在一定空間或時間內(nèi),稀少點(diǎn)子散布狀況的一種理論分布。在農(nóng)業(yè)生物學(xué)上有著較廣泛應(yīng)用。μ=σ2=λ

是泊松分布的重要特征解:100m2麥田中,平均雜草株數(shù)μμ=1×100/10=10(株)因此根據(jù)進(jìn)而可求出100m2麥田中有x株雜草的概率.例題1:麥田內(nèi),平均每10m2有1株雜草,現(xiàn)在要問每100m2麥田中,有0株、1株、2株…的概率是多少?雜草數(shù)(x)≤5678910概率P(x)0.06700.06310.09010.11260.12510.1137雜草數(shù)(x)11121314≥15概率P(x)0.11370.09480.07290.05210.0835每100m2麥田中雜草株數(shù)的概率第三節(jié)正態(tài)分布一種很重要的連續(xù)型隨機(jī)變量的概率分布:(1)生物現(xiàn)象中有許多變量是服從或近似服從正態(tài)分布的。因此許多統(tǒng)計(jì)分析方法都是以正態(tài)分布為基礎(chǔ)的。(2)還有不少隨機(jī)變量的概率分布在一定條件下以正態(tài)分布為其極限分布。因此在統(tǒng)計(jì)學(xué)中,正態(tài)分布無論在理論研究上還是實(shí)際應(yīng)用中,均占有重要的地位。一、正態(tài)分布的定義

若連續(xù)型隨機(jī)變量x的概率分布密度函數(shù)為:

其中μ為平均數(shù),σ2為方差,則稱隨機(jī)變量x服從正態(tài)分布(normaldistribution),記為x~N(μ,σ2)。

μ是位置參數(shù)。當(dāng)σ恒定時,μ愈大,則曲線沿x軸愈向右移動;反之,μ愈小,曲線沿x軸愈向左移動。σ是變異度參數(shù)。σ愈大,表示x的取值愈分散,曲線愈“胖”;σ愈小,x的取值愈集中在μ附近,曲線愈“瘦”。

二、正態(tài)分布的特征

1、正態(tài)分布密度曲線是單峰、對稱的懸鐘形曲線,對稱軸為x=μ;2、f(x)在x=μ處達(dá)到極大,極大值為;

3、f(x)是非負(fù)函數(shù),以x軸為漸近線,分布從-∞至+∞;

5、正態(tài)分布有兩個參數(shù),即平均數(shù)μ和標(biāo)準(zhǔn)差σ。6、分布密度曲線與橫軸所夾的面積為1,即:4、曲線在x=μ±σ處各有一個拐點(diǎn),即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間是下凸的,在[μ-σ,μ+σ]區(qū)間是上凸的;

二、標(biāo)準(zhǔn)正態(tài)分布

正態(tài)分布是依賴于參數(shù)μ和σ2(或σ)的一簇曲線。這就給研究具體的正態(tài)總體帶來困難,需將一般的N(μ,σ2)轉(zhuǎn)換為μ=0,σ2=1的正態(tài)分布。

我們稱μ=0,σ2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)。

標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)記作f(u):

隨機(jī)變量u服從標(biāo)準(zhǔn)正態(tài)分布,記作u~N(0,1),分布密度曲線如下頁圖。

對于任何一個服從正態(tài)分布N(μ,σ2)的隨機(jī)變量x,都可以通過標(biāo)準(zhǔn)化變換:u=(x-μ)/σ將其變換為服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)的隨機(jī)變量u。

u稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差(standardnormaldeviate)。

三、正態(tài)分布的概率計(jì)算(一)標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算在連續(xù)性隨機(jī)變數(shù)中,不能計(jì)算某一定值的概率,只能計(jì)求某一區(qū)間或范圍的概率。在標(biāo)準(zhǔn)正態(tài)分布曲線下,變量u在[a,b]區(qū)間的概率可用曲線下區(qū)間的面積來表示。區(qū)間的概率可用下式表示P(a≤u<b)

正態(tài)分布曲線下一∝到u的面積,可以通過定積分得出,即:

F(ui)稱為標(biāo)準(zhǔn)正態(tài)分布的累積函數(shù)。它是變量u小于某一定值ui的概率。因此,正態(tài)分布任一區(qū)間的概率可以如下式計(jì)算:

P(u1≤u<u2)=F(u2)-F(u1)

由于標(biāo)準(zhǔn)正態(tài)分布的概率累積函數(shù)具有廣泛的應(yīng)用,所以,統(tǒng)計(jì)學(xué)家已計(jì)算好實(shí)際需要的各個F(ui)值,列于附表1(P336)。學(xué)習(xí)查表例如,u=1.75,累計(jì)概率F(1.75)是多少?從第一列中找到1.7,在第一行中找到0.05。行與列相交處的數(shù)值為0.95994,所以

F(1.75)=0.95994有時會遇到給定F(u)值,反過來查u值。

例如:

F(u)=0.284,u值是多少?

這只要在附表2中找到與0.284最接近的值0.2843,對應(yīng)行的第一列數(shù)-0.5,對應(yīng)列的第一行數(shù)值0.07

即相應(yīng)的u值為u=-0.57。

由正態(tài)分布的對稱性可推出下列關(guān)系式,再借助附表2,便能很方便地計(jì)算有關(guān)概率:

P(0≤u<u1)=

P(u≥u1)=

P(|u|≥u1)=

P(|u|<u1)=

F(u1)-0.5F(-u1)2F(-u1)1-2F(-u1)

關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率經(jīng)常用到:

P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545

P(-3≤u<3)=0.9973

P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99

u變量在上述區(qū)間以外取值的概率分別為:

P(|u|≥1)=2F(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2F(-2)=1-P(-2≤u<2)=1-0.9545=0.0455P(|u|≥3)=1-0.9973=0.0027

P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.01

從上述計(jì)算可知,雖然正態(tài)分布u的取值區(qū)間為(一∝,十∝),但實(shí)際上|u|>2.58的概率只有0.0l,|u|>1.96的概率也只有0.05,即:在u±1.96和u±2.58范圍內(nèi)已分別包含了95%和99%的變量值。(二)標(biāo)準(zhǔn)正態(tài)分布的兩尾概率和單尾概率以上在計(jì)算P(|u|≥1)和P(|u|≥2.58)等概率時,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論