分布與抽樣分布_第1頁
分布與抽樣分布_第2頁
分布與抽樣分布_第3頁
分布與抽樣分布_第4頁
分布與抽樣分布_第5頁
已閱讀5頁,還剩89頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三章第三章 分布與抽樣分布分布與抽樣分布 第二節(jié)第二節(jié) 抽樣分布抽樣分布 第一節(jié)第一節(jié) 概率與概率分布概率與概率分布 第三節(jié)第三節(jié) 統(tǒng)計推斷統(tǒng)計推斷 第一節(jié)第一節(jié) 概率與概率分布概率與概率分布統(tǒng)計學(xué)一一 概率概率(一)概率的統(tǒng)計定義(一)概率的統(tǒng)計定義 研究隨機(jī)試驗,僅知道可能發(fā)生哪些隨機(jī)研究隨機(jī)試驗,僅知道可能發(fā)生哪些隨機(jī)事件是不夠的,還需了解各種隨機(jī)事件發(fā)生事件是不夠的,還需了解各種隨機(jī)事件發(fā)生的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)計規(guī)律性,從而指導(dǎo)實踐。這就要求有一個計規(guī)律性,從而指導(dǎo)實踐。這就要求有一個能夠能夠刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo)刻劃

2、事件發(fā)生可能性大小的數(shù)量指標(biāo),這指標(biāo)應(yīng)該是事件本身所固有的,且不隨人這指標(biāo)應(yīng)該是事件本身所固有的,且不隨人的主觀意志而改變,人們的主觀意志而改變,人們稱之為概率稱之為概率(probability)。)。事件事件A的概率記為的概率記為P(A)。)。 概率的統(tǒng)計定義概率的統(tǒng)計定義 在相同條件下進(jìn)行在相同條件下進(jìn)行n次重復(fù)試驗,如次重復(fù)試驗,如果隨機(jī)事件果隨機(jī)事件A發(fā)生的次數(shù)為發(fā)生的次數(shù)為m,那么那么m/n稱為隨機(jī)事件稱為隨機(jī)事件A的的頻率頻率(frequency););當(dāng)試驗重復(fù)數(shù)當(dāng)試驗重復(fù)數(shù)n逐漸增大時,隨逐漸增大時,隨機(jī)事件機(jī)事件A的頻率越來越穩(wěn)定地接近某一數(shù)值的頻率越來越穩(wěn)定地接近某一數(shù)值

3、p , 那么那么 就就 把把 p稱為隨機(jī)事件稱為隨機(jī)事件A的的概率概率。 這這 樣樣 定定 義義 的的 概概 率率 稱稱 為為 統(tǒng)統(tǒng) 計計 概概 率(率(statistics probability),),或者稱后驗概率(或者稱后驗概率(posterior probability)表表3-1 拋擲一枚硬幣發(fā)生正面朝上的試驗記錄拋擲一枚硬幣發(fā)生正面朝上的試驗記錄 從表從表3-1可看出,隨著實驗次數(shù)的增多,正面朝可看出,隨著實驗次數(shù)的增多,正面朝上這個事件發(fā)生的頻率越來越穩(wěn)定地接近上這個事件發(fā)生的頻率越來越穩(wěn)定地接近0.5,我們就,我們就把把0.5作為這個事件的概率。作為這個事件的概率。 在一般情

4、況下,隨機(jī)事件的概率在一般情況下,隨機(jī)事件的概率p是不可能準(zhǔn)確是不可能準(zhǔn)確得到的。通常以試驗次數(shù)得到的。通常以試驗次數(shù)n充分大時隨機(jī)事件充分大時隨機(jī)事件A的頻率的頻率作為該隨機(jī)事件概率的近似值。作為該隨機(jī)事件概率的近似值。 即即 P(A)=pm/n (n充分大)充分大)(二(二)概率的性質(zhì)概率的性質(zhì) 1、對于任何事件、對于任何事件A,有有0P(A)1; 2、必然事件的概率為必然事件的概率為1,即,即P()=1; 3、不可能事件的概率為不可能事件的概率為0,即,即P()=0。一個總體是由一個隨機(jī)變量的所有可能取值來構(gòu)成的,而樣本只一個總體是由一個隨機(jī)變量的所有可能取值來構(gòu)成的,而樣本只是這些所有

5、可能取值的一部分是這些所有可能取值的一部分 隨機(jī)變量中某一個值出現(xiàn)的概率,只是隨機(jī)變量一個側(cè)面的反映,隨機(jī)變量中某一個值出現(xiàn)的概率,只是隨機(jī)變量一個側(cè)面的反映,若要全面了解隨機(jī)變量則必須知道若要全面了解隨機(jī)變量則必須知道隨機(jī)變量的全部值隨機(jī)變量的全部值和和各個值出各個值出現(xiàn)的概率現(xiàn)的概率,即隨機(jī)變量的概率分布,即隨機(jī)變量的概率分布 概率和概率分布是生命科學(xué)研究中由樣本推斷總體的理論基礎(chǔ)概率和概率分布是生命科學(xué)研究中由樣本推斷總體的理論基礎(chǔ) 隨機(jī)變量的種類很多,每一種隨機(jī)變量都有其特定的概率分布。隨機(jī)變量的種類很多,每一種隨機(jī)變量都有其特定的概率分布。 連續(xù)型隨機(jī)變量連續(xù)型隨機(jī)變量 離散型隨機(jī)變

6、量離散型隨機(jī)變量 在一定范圍內(nèi)可連續(xù)取值的變量。在一定范圍內(nèi)可連續(xù)取值的變量。在一定范圍內(nèi)只取有限種可能的值的變量。在一定范圍內(nèi)只取有限種可能的值的變量。正態(tài)分布正態(tài)分布 二項分布、泊松分布二項分布、泊松分布 二二 概率分布概率分布1. 正態(tài)分布正態(tài)分布 正態(tài)分布(正態(tài)分布(normal distribution)的概念是由德國數(shù)學(xué)家和天文學(xué)家的概念是由德國數(shù)學(xué)家和天文學(xué)家Moivre于于1733年首次提出的,由德國數(shù)學(xué)家年首次提出的,由德國數(shù)學(xué)家Gauss率先將其應(yīng)用于天文學(xué)研究,故正率先將其應(yīng)用于天文學(xué)研究,故正態(tài)分布又稱為態(tài)分布又稱為Gauss分布(分布(Gaussian distrib

7、ution)。)。許多生物學(xué)領(lǐng)域(許多生物學(xué)領(lǐng)域(如身高、體重、脈搏、血紅蛋白、血清總膽固醇等如身高、體重、脈搏、血紅蛋白、血清總膽固醇等)的隨機(jī)變量都)的隨機(jī)變量都服從或者近似服從正態(tài)分布或通過某種轉(zhuǎn)換后服從正態(tài)分布,許多其他類型服從或者近似服從正態(tài)分布或通過某種轉(zhuǎn)換后服從正態(tài)分布,許多其他類型分布基本上都與正態(tài)分布有關(guān),它們的極限就是正態(tài)分布。分布基本上都與正態(tài)分布有關(guān),它們的極限就是正態(tài)分布。1.1 正態(tài)分布的定義正態(tài)分布的定義 在日常工作中所遇到的變量大多是連續(xù)型隨機(jī)變量,當(dāng)這一類隨機(jī)變量呈線在日常工作中所遇到的變量大多是連續(xù)型隨機(jī)變量,當(dāng)這一類隨機(jī)變量呈線性時,往往服從正態(tài)分布性時,

8、往往服從正態(tài)分布 頻數(shù)分布表:某地 13 歲女孩 118 人的身高(cm)資料頻數(shù)分布 身高組段 頻數(shù) 組中值 (1) (2) (3) 129 2 130.5 132 2 133.5 135 8 136.5 138 20 139.5 141 26 142.5 144 25 145.5 147 20 148.5 150 9 151.5 153 3 154.5 156 2 157.5 159162 1 160.5 合計 118 下面我們以某地13歲女孩118人的身高(cm)資料,來說明身高變量服從正態(tài)分布。頻數(shù)分布圖(又稱直方圖) 身高(cm)160.5157.5154.5151.5148.514

9、5.5142.5139.5136.5133.5130.5 某地13歲女孩118人身高(cm)頻數(shù)分布圖頻數(shù)3020100從頻數(shù)表及頻數(shù)分布圖上可得知: 該數(shù)值變量資料頻數(shù)分布呈現(xiàn)中間頻數(shù)多,左右兩側(cè)基本對稱的分布。所以我們通俗地認(rèn)為該資料服從正態(tài)分布。 身高(cm) 某地13歲女孩118人身高(cm)頻數(shù)分布圖頻數(shù)20100頻數(shù)分布圖二頻數(shù)分布圖三身高(cm) 某地13歲女孩118人身高(cm)頻數(shù)分布圖頻態(tài)分布圖四身高(cm) 頻數(shù)分布逐漸接近正態(tài)分布示意圖和正態(tài)分布相對應(yīng)的曲線稱為正態(tài)分布密度曲線,簡稱為和正態(tài)分布相對應(yīng)的曲線稱為正態(tài)分布密度曲線,簡稱為正態(tài)曲線。

10、正態(tài)曲線。 用來描述正態(tài)曲線的函數(shù)稱為正態(tài)分布密度函數(shù)用來描述正態(tài)曲線的函數(shù)稱為正態(tài)分布密度函數(shù) 222)(21)(xexf 總體平均數(shù) 2 總體方差 圓周率3.14 總體標(biāo)準(zhǔn)差 任何一個正態(tài)分布均由參數(shù)任何一個正態(tài)分布均由參數(shù)和和所決定所決定如果一個隨機(jī)變量如果一個隨機(jī)變量x服從平均數(shù)為服從平均數(shù)為、方差為方差為2的正態(tài)分布,可的正態(tài)分布,可記為記為xN(,2)。)。e 自然對數(shù)的底,2.718281.2 正態(tài)分布的特點(diǎn)正態(tài)分布的特點(diǎn) (1)正態(tài)分布曲線以直線)正態(tài)分布曲線以直線x =為對稱軸,左右完全對稱為對稱軸,左右完全對稱(3)正態(tài)分布曲線有兩個拐點(diǎn),拐點(diǎn)座標(biāo)分別為(正態(tài)分布曲線有兩個

11、拐點(diǎn),拐點(diǎn)座標(biāo)分別為(-,f(-)和(和(+,f(+),),在這兩個拐點(diǎn)處曲線改變方向,在這兩個拐點(diǎn)處曲線改變方向,即曲線在(即曲線在(-,-)和(和(+,+) 區(qū)間上是下凹的,在區(qū)間上是下凹的,在-,+區(qū)間內(nèi)是上凸的區(qū)間內(nèi)是上凸的x(2)在在x =處,處,f(x)有最大值有最大值 21)(f(4)正態(tài)分布密度曲線的位置由正態(tài)分布密度曲線的位置由決定(決定(為位置參數(shù)),形狀為位置參數(shù)),形狀由由決定(決定(為形狀參數(shù))為形狀參數(shù))(5)正態(tài)分布曲線向兩邊無限延伸,以正態(tài)分布曲線向兩邊無限延伸,以x軸為漸進(jìn)線,分布從軸為漸進(jìn)線,分布從-到到+ 的大小決定了曲線在的大小決定了曲線在x軸上的位置軸

12、上的位置的大小則決定了曲線的胖瘦程度的大小則決定了曲線的胖瘦程度當(dāng)當(dāng)恒定時,恒定時,愈大,則曲線沿愈大,則曲線沿x軸愈向右軸愈向右移動移動愈小,曲線沿愈小,曲線沿x軸愈向左移動軸愈向左移動越大表示數(shù)據(jù)越分散,曲線越胖越大表示數(shù)據(jù)越分散,曲線越胖越小表示數(shù)據(jù)越集中,曲線越瘦越小表示數(shù)據(jù)越集中,曲線越瘦1.3 標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布由正態(tài)分布由和和所決定,不同的所決定,不同的、值就決定了不同的正態(tài)分值就決定了不同的正態(tài)分布密度函數(shù),因此在實際計算中很不方便的。需將一般的布密度函數(shù),因此在實際計算中很不方便的。需將一般的N(,2 2 )轉(zhuǎn)換為轉(zhuǎn)換為=0, 2 2 =1的正態(tài)分布。我們稱的正

13、態(tài)分布。我們稱=0, 2 2 =1的正態(tài)分的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布布為標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution) 可見,由正態(tài)分布密度函數(shù)得到標(biāo)準(zhǔn)正態(tài)分布密度函數(shù):222)(21)(xexf2221)(xexf1.4 正態(tài)分布的概率計算正態(tài)分布的概率計算 根據(jù)概率論原理,可知隨機(jī)變量根據(jù)概率論原理,可知隨機(jī)變量x在區(qū)間(在區(qū)間(a,b)內(nèi)取值的概率是一塊面積:內(nèi)取值的概率是一塊面積: axbx 面積由面積由0y曲線曲線 所圍成的曲邊梯形所組成:所圍成的曲邊梯形所組成: badxxfbxaP)()(隨機(jī)變量隨機(jī)變量x在(在(-,+)間取值的概率為)間取值的概率為1

14、,即:,即:1)()(dxxfxP 求隨機(jī)變量x在某一區(qū)段內(nèi)取值的概率就轉(zhuǎn)化成了求由該區(qū)段與相應(yīng)曲線所圍成的曲邊梯形的面積。 由于正態(tài)分布的概率密度函數(shù)比較復(fù)雜,積分的計算也比較麻煩,而這些由于正態(tài)分布的概率密度函數(shù)比較復(fù)雜,積分的計算也比較麻煩,而這些計算在動物科學(xué)或動物醫(yī)學(xué)生產(chǎn)實踐中又經(jīng)常會用到。計算在動物科學(xué)或動物醫(yī)學(xué)生產(chǎn)實踐中又經(jīng)常會用到。 最好的解決辦法:將正態(tài)分布最好的解決辦法:將正態(tài)分布轉(zhuǎn)化為轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,然后根據(jù)標(biāo)準(zhǔn)正態(tài)分標(biāo)準(zhǔn)正態(tài)分布,然后根據(jù)標(biāo)準(zhǔn)正態(tài)分布表(附表布表(附表1)直接查出概率值。)直接查出概率值。 (1) 標(biāo)準(zhǔn)正態(tài)分布的概率計算標(biāo)準(zhǔn)正態(tài)分布的概率計算 附表附

15、表1列出了在標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量列出了在標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量u在區(qū)間在區(qū)間(,u內(nèi)取值的概率:內(nèi)取值的概率: uuudueduufuuP2221)()(標(biāo)準(zhǔn)正態(tài)分布的概率計算通式標(biāo)準(zhǔn)正態(tài)分布的概率計算通式 標(biāo)準(zhǔn)正態(tài)分布函數(shù)表標(biāo)準(zhǔn)正態(tài)分布函數(shù)表 例例1:若u N(0,1),),求: )64. 0( uP)53. 1( uP)53. 012. 2(uP(1)(2)(3)解:解:(1))64. 0( uP)53. 012. 2(uP)53. 1( uP7389. 0(2))53. 1(1uP9370. 010630. 0(3))12. 2()53. 0(uPuP)12. 2(1 )53. 0(1 u

16、PuP)9830. 01 ()7109. 01 (0170. 02981. 02811. 0關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:P(-1u1)=0.6826P(-2u2)=0.9545P(-3u3)=0.9973P(-1.96u1.96)=0.95P(-2.58u2.58)=0.99P(u1) u變量在上述區(qū)間以外取值的概率,變量在上述區(qū)間以外取值的概率, 即兩尾概率:即兩尾概率:= 1- P(-1u1) = 1-0.6826 = 0.3174 P(u2)=1- P(-2u2)= 0.0455P(u3)= 1-0.9973 = 0.0027P(u1.

17、96)= 1-0.95 = 0.05P(u2.58)= 1-0.99 = 0.01(2) 正態(tài)分布的概率計算正態(tài)分布的概率計算 對于服從任意正態(tài)分布對于服從任意正態(tài)分布N(,2)的隨機(jī)變量,欲求其在某個區(qū)間的取值概率,需的隨機(jī)變量,欲求其在某個區(qū)間的取值概率,需先將它標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)正態(tài)分布先將它標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)正態(tài)分布N(0,1)的隨機(jī)變量,然后查表即可。的隨機(jī)變量,然后查表即可。xu實質(zhì):實質(zhì):為了能使正態(tài)分布應(yīng)用起來更方便一些,可以將為了能使正態(tài)分布應(yīng)用起來更方便一些,可以將x作一變換,令:作一變換,令:變換后的正態(tài)分布密度函數(shù)為:變換后的正態(tài)分布密度函數(shù)為:2221)(ueuf標(biāo)準(zhǔn)正態(tài)分布均具

18、有標(biāo)準(zhǔn)正態(tài)分布均具有=0,2=1的特性的特性如果隨機(jī)變量如果隨機(jī)變量u服從標(biāo)準(zhǔn)正態(tài)分布,可記為:服從標(biāo)準(zhǔn)正態(tài)分布,可記為:uN(0,1) u變換變換這個變換稱為標(biāo)準(zhǔn)化或這個變換稱為標(biāo)準(zhǔn)化或u變換變換, ,由于由于x是隨機(jī)變量,因此是隨機(jī)變量,因此u也是隨機(jī)變量,也是隨機(jī)變量,所得到的隨機(jī)變量所得到的隨機(jī)變量U也服從正也服從正態(tài)分布,因此,由任意正態(tài)分布隨機(jī)變量標(biāo)準(zhǔn)化得到的隨機(jī)變量的標(biāo)準(zhǔn)正態(tài)分布常稱為態(tài)分布,因此,由任意正態(tài)分布隨機(jī)變量標(biāo)準(zhǔn)化得到的隨機(jī)變量的標(biāo)準(zhǔn)正態(tài)分布常稱為u分布??梢姡悍植???梢姡豪?:設(shè) x N(30,102)試求x 40的概率。解:解: 首先將正態(tài)分布首先將正態(tài)分布 轉(zhuǎn)化

19、為標(biāo)準(zhǔn)正態(tài)分布,令轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,令:)103040(uP)40( xP1030 xu則則u服從標(biāo)準(zhǔn)正態(tài)分布,故服從標(biāo)準(zhǔn)正態(tài)分布,故:) 1( uP) 1(1uP8413. 011587. 0例3:設(shè)x服從=30.26, =5.102的正態(tài)分布,試求P(21.64x32.98)。 解:解: 令令10.526.30 xu)10. 526.3098.3210. 526.3010. 526.3064.21()98.3264.21(xPxP關(guān)于一般正態(tài)分布,經(jīng)常用到以下幾個概率:關(guān)于一般正態(tài)分布,經(jīng)常用到以下幾個概率:P(-x+)= 0.6826P(-2x+2) = 0.9545P(-3x+3)

20、=0.9973P(-1.96x+1.96) = 0.95P(-2.58x+2.58) = 0.99把隨機(jī)變量把隨機(jī)變量x落在平均數(shù)落在平均數(shù)加減不同加減不同倍數(shù)標(biāo)準(zhǔn)差倍數(shù)標(biāo)準(zhǔn)差區(qū)間之外的概率稱為兩區(qū)間之外的概率稱為兩尾概率(雙側(cè)概率),記作尾概率(雙側(cè)概率),記作。對應(yīng)于兩尾概率可以求得隨機(jī)變量對應(yīng)于兩尾概率可以求得隨機(jī)變量x小于小于-k或大于或大于+k的概率,稱為的概率,稱為一尾概率(單側(cè)概率),記作一尾概率(單側(cè)概率),記作2。0.3173 0.0455 0.0027 0.05 0.01 /2附表2: 給出了滿足給出了滿足)uuP(兩尾臨界值兩尾臨界值u 因此,可以根據(jù)兩尾概率因此,可以根

21、據(jù)兩尾概率,由附表由附表2查出相應(yīng)的臨界值查出相應(yīng)的臨界值u。 例4:已知 u N(0,1),),試求u: 10. 0()()uuPuuP(1)(2)86. 0()uuuP解:解:(1)10. 0)()(uuPuuP644854. 110. 0u(2)()(uuPuuP)(uuuP114. 086. 01475791. 114. 0u2. 二項分布二項分布 二項分布(二項分布(binomial distribution)是一種最常見的、典型的離散型隨機(jī)變是一種最常見的、典型的離散型隨機(jī)變量的概率分布。量的概率分布。有些試驗只有非此即彼兩種結(jié)果,這種由非此即彼的事件構(gòu)成的總體,稱有些試驗只有非此

22、即彼兩種結(jié)果,這種由非此即彼的事件構(gòu)成的總體,稱為二項總體。為二項總體。 結(jié)果結(jié)果“此此”用變量用變量1表示,表示, 概率為概率為 p 結(jié)果結(jié)果“彼彼”用變量用變量0表示,表示, 概率為概率為 q pxP ) 1(qxP )0(1 qp對于n次獨(dú)立的試驗,如果每次試驗結(jié)果出現(xiàn)且只出現(xiàn)對立事件A與A-中之一,在每次試驗中出現(xiàn)A的概率是p(0p5,np、nq較接近時,接近正態(tài)較接近時,接近正態(tài)分布,分布,n時服從正態(tài)分布,即二項分布的極限是正態(tài)分布時服從正態(tài)分布,即二項分布的極限是正態(tài)分布 (4)二項分布的平均數(shù)為:)二項分布的平均數(shù)為: np npq2方差為:方差為:npq標(biāo)準(zhǔn)差為:例4:某奶牛

23、場情期受胎率為0.6,該場對30頭發(fā)情母牛配種,使24頭母牛一次配種受胎的概率為多少?解:解:6 . 0p30n24m)24(30P6242430)4 . 0()6 . 0(C624)4 . 0()6 . 0()2430(2430!0115. 0%15. 1186 . 030 np2 . 74 . 06 . 0302 npq68. 22 . 7npq2.3 二項分布的概率計算二項分布的概率計算課堂練習(xí):用某種常規(guī)藥物治療豬瘟的治愈率為0.7,對20頭患豬瘟的肥育豬進(jìn)行治療,問20頭豬中16頭豬治愈的概率是多少? 解:解:7 . 0p20n16m)16(20P4161620) 3 . 0()7

24、. 0(C416) 3 . 0()7 . 0()1620(1620!1295. 0%95.12147 . 020 np2 . 43 . 07 . 0202 npq05. 22 . 4npq3. 泊松分布泊松分布 當(dāng)二項分布中的當(dāng)二項分布中的n,p0時,二項分布趨向于一種新的分布時,二項分布趨向于一種新的分布 泊松分布(普哇松分布)泊松分布(普哇松分布) (Poissons distribution)當(dāng)試驗次數(shù)(或稱觀測次數(shù))很大,而某事件出現(xiàn)的概率很小,當(dāng)試驗次數(shù)(或稱觀測次數(shù))很大,而某事件出現(xiàn)的概率很小,則離散型隨機(jī)變量則離散型隨機(jī)變量x服從于泊松分布。服從于泊松分布。 3.1 泊松分布的

25、定義泊松分布的定義 若隨機(jī)變量若隨機(jī)變量x(x = m)只取零和正整數(shù)值只取零和正整數(shù)值0,1,2,且其概,且其概率分布為:率分布為: )(mxPemm!0其中:其中: = np,是一個常量,且是一個常量,且 7182. 2e則稱則稱x服從參數(shù)為服從參數(shù)為的泊松分布,的泊松分布,記為記為x P() n 泊松分布主要是用來描述小概率事件發(fā)生的概率泊松分布主要是用來描述小概率事件發(fā)生的概率 單位空間中某些野單位空間中某些野生動物數(shù)生動物數(shù) 畜群中的畸形畜群中的畸形個體數(shù)個體數(shù) 畜群中某些遺傳性畜群中某些遺傳性疾病的患病數(shù)疾病的患病數(shù) n 泊松分布不是用來描述幾乎不可能發(fā)生的事件的概率泊松分布不是用

26、來描述幾乎不可能發(fā)生的事件的概率 山無棱,天地合山無棱,天地合南京六月飛雪南京六月飛雪(1)泊松分布只有一個參數(shù))泊松分布只有一個參數(shù),= np。 3.2 泊松分布的特點(diǎn)泊松分布的特點(diǎn) 既是泊松分布的平均值既是泊松分布的平均值,又是方差又是方差2,即:即: 2(2)泊松分布的圖形決定于)泊松分布的圖形決定于,值愈小分布愈偏倚,隨著值愈小分布愈偏倚,隨著的增大,分布的增大,分布趨于對稱。趨于對稱。 當(dāng)當(dāng)=20時分布接近于正態(tài)分布;當(dāng)時分布接近于正態(tài)分布;當(dāng)=50時,可以認(rèn)為泊松分布呈正態(tài)分時,可以認(rèn)為泊松分布呈正態(tài)分布。布。 3.3 泊松分布的概率計算泊松分布的概率計算 例5:某大型豬場因某種疾

27、病死亡的豬數(shù)呈泊松分布。已知該場平均每年因這種疾病死亡的豬數(shù)為9.5頭,問2007年該場因這種疾病死亡的豬數(shù)為15頭的概率是多少?5 . 9解:解:根據(jù)泊松分布的性質(zhì)可知:根據(jù)泊松分布的性質(zhì)可知: 15m)15(xP5 .915!155 .9e0265.02007年該場因這種疾病死亡的豬數(shù)為15頭的概率是2.65%。)(mxPemm!第二節(jié)第二節(jié) 抽樣分布抽樣分布統(tǒng)計學(xué)的主要任務(wù)就是研究總體和樣本的關(guān)系:統(tǒng)計學(xué)的主要任務(wù)就是研究總體和樣本的關(guān)系: 從樣本到總體從樣本到總體 從總體到樣本從總體到樣本 目的就是通過樣本來推斷總體。目的就是通過樣本來推斷總體。 目的就是研究樣本統(tǒng)計量的分布及其與原目

28、的就是研究樣本統(tǒng)計量的分布及其與原總體的關(guān)系總體的關(guān)系從特殊到一般,從特殊到一般, 從一般到特殊,從一般到特殊, 統(tǒng)計推斷統(tǒng)計推斷 抽樣分布抽樣分布 抽樣分布是統(tǒng)計推斷的基礎(chǔ),研究抽樣分布的目的就是為了更好地進(jìn)行統(tǒng)計推斷,并能正確地理解統(tǒng)計推斷的結(jié)論。 1. 抽樣分布的概念抽樣分布的概念x樣本平均數(shù)樣本平均數(shù) 和樣本方差和樣本方差S2是描述樣本特征的兩個最重要的統(tǒng)計量是描述樣本特征的兩個最重要的統(tǒng)計量總體平均數(shù)總體平均數(shù)和總體方差和總體方差2是描述總體特征的兩個最重要的參數(shù)是描述總體特征的兩個最重要的參數(shù) 因此,研究總體和樣本的關(guān)系,實際就是研究:因此,研究總體和樣本的關(guān)系,實際就是研究: x

29、S2 2 就總體而言,就總體而言,和和2都是常量都是常量 從總體中隨機(jī)地抽取若干個體所組成的樣本,即使每次抽取的樣本容量都相等,從總體中隨機(jī)地抽取若干個體所組成的樣本,即使每次抽取的樣本容量都相等,每一個樣本所得到的樣本平均數(shù)每一個樣本所得到的樣本平均數(shù)也不可能都相等,同時也不可能就等于總體平均也不可能都相等,同時也不可能就等于總體平均數(shù)數(shù) 樣本統(tǒng)計量將隨樣本的不同而有所不同,因而樣本統(tǒng)計量也是隨機(jī)變量,也有其概率分布 樣本統(tǒng)計量的概率分布稱為抽樣分布(樣本統(tǒng)計量的概率分布稱為抽樣分布(sampling distribution) 樣本統(tǒng)計量與總體參數(shù)之間的差異稱為抽樣誤差樣本統(tǒng)計量與總體參數(shù)

30、之間的差異稱為抽樣誤差 (sampling error) 從總體中抽取樣本的過程稱為抽樣(從總體中抽取樣本的過程稱為抽樣(sampling) 抽樣分為復(fù)置抽樣和不復(fù)置抽樣兩種:抽樣分為復(fù)置抽樣和不復(fù)置抽樣兩種: 復(fù)置抽樣指每次抽出一個個體后,這個個體應(yīng)返回原總體復(fù)置抽樣指每次抽出一個個體后,這個個體應(yīng)返回原總體 不復(fù)置抽樣指每次抽出的個體不返回原總體不復(fù)置抽樣指每次抽出的個體不返回原總體 對于無限總體,或者樣本容量對于無限總體,或者樣本容量n與總體容量與總體容量N相比很小時,返回與否都相比很小時,返回與否都可保證每個個體被抽到的機(jī)會相等,復(fù)置抽樣等同于不復(fù)置抽樣可保證每個個體被抽到的機(jī)會相等,

31、復(fù)置抽樣等同于不復(fù)置抽樣 對于有限總體,應(yīng)該采取復(fù)置抽樣,否則各個體被抽到的機(jī)會就不相對于有限總體,應(yīng)該采取復(fù)置抽樣,否則各個體被抽到的機(jī)會就不相等等在實際操作中,均為不復(fù)置抽樣在實際操作中,均為不復(fù)置抽樣 在理論研究中則以復(fù)置抽樣為主在理論研究中則以復(fù)置抽樣為主 2. 樣本平均數(shù)的抽樣分布樣本平均數(shù)的抽樣分布2.1 樣本平均數(shù)抽樣分布的概念樣本平均數(shù)抽樣分布的概念從總體容量為從總體容量為N的總體中進(jìn)行抽樣,如果每個樣本的樣本容量均為的總體中進(jìn)行抽樣,如果每個樣本的樣本容量均為n,將所有將所有這樣的樣本都抽出來,并計算出每一個樣本的平均數(shù)這樣的樣本都抽出來,并計算出每一個樣本的平均數(shù)原來的那個

32、總體,稱為原總體原來的那個總體,稱為原總體 由樣本平均數(shù)組成的分布稱為樣本平均數(shù)的抽樣分布由樣本平均數(shù)組成的分布稱為樣本平均數(shù)的抽樣分布 如果原總體的平均數(shù)為如果原總體的平均數(shù)為,標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為,那么樣本平均數(shù)抽樣總體:那么樣本平均數(shù)抽樣總體:平均數(shù)為:平均數(shù)為:標(biāo)準(zhǔn)差為:標(biāo)準(zhǔn)差為:xx稱為樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)誤差稱為樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)誤差 簡稱為標(biāo)準(zhǔn)誤(簡稱為標(biāo)準(zhǔn)誤(standard error) 由這些樣本平均數(shù)組成的新總體,就稱為樣本平均數(shù)抽樣總體。由這些樣本平均數(shù)組成的新總體,就稱為樣本平均數(shù)抽樣總體。 標(biāo)準(zhǔn)誤表示平均數(shù)抽樣誤差的大小,反映樣本平均數(shù)與新總體平均數(shù)之間的標(biāo)準(zhǔn)

33、誤表示平均數(shù)抽樣誤差的大小,反映樣本平均數(shù)與新總體平均數(shù)之間的離散程度。離散程度。 標(biāo)準(zhǔn)差表示的是原總體中原始數(shù)據(jù)與原總體平均數(shù)的關(guān)系標(biāo)準(zhǔn)差表示的是原總體中原始數(shù)據(jù)與原總體平均數(shù)的關(guān)系 標(biāo)準(zhǔn)誤表示的是從原總體中抽取的樣本平均數(shù)與樣本平均數(shù)抽樣總體平標(biāo)準(zhǔn)誤表示的是從原總體中抽取的樣本平均數(shù)與樣本平均數(shù)抽樣總體平均數(shù)的關(guān)系均數(shù)的關(guān)系 研究總體與樣本的關(guān)系就轉(zhuǎn)化成了討論原總體與樣本平均數(shù)抽樣總體的關(guān)系:xnx例6:設(shè)有一總體,總體容量為N=3,觀測值分別為2、4、6,以樣本容量n=2對該總體進(jìn)行復(fù)置抽樣,證明: (1)x(2)nx原總體的總體平均數(shù)為:原總體的總體平均數(shù)為:4364223(1)以樣本

34、容量以樣本容量n = 2對該總體進(jìn)行復(fù)置抽對該總體進(jìn)行復(fù)置抽樣,則樣本平均數(shù)抽樣總體為:樣,則樣本平均數(shù)抽樣總體為: 樣本平均數(shù)抽樣總體的總體容量樣本平均數(shù)抽樣總體的總體容量為:為: nN49369632x樣本平均數(shù)抽樣總體的總體平均樣本平均數(shù)抽樣總體的總體平均數(shù)為:數(shù)為: 9(2)原總體的總體標(biāo)準(zhǔn)差為:原總體的總體標(biāo)準(zhǔn)差為:NxNx2)(23485638NxxNx2)(2樣本平均數(shù)抽樣總體的總體標(biāo)準(zhǔn)差為:樣本平均數(shù)抽樣總體的總體標(biāo)準(zhǔn)差為: 99)36(156234238n2.2 樣本平均數(shù)抽樣分布的特點(diǎn)樣本平均數(shù)抽樣分布的特點(diǎn)(1)樣本平均數(shù)抽樣總體的總體平均數(shù)與原總體的總體平均數(shù)相等,)樣

35、本平均數(shù)抽樣總體的總體平均數(shù)與原總體的總體平均數(shù)相等,因此,可用因此,可用代替代替x(2)樣本平均數(shù)抽樣總體的方差與原總體的方差的關(guān)系為)樣本平均數(shù)抽樣總體的方差與原總體的方差的關(guān)系為 nx22(3)當(dāng)隨機(jī)變量)當(dāng)隨機(jī)變量xN(,2)時,樣本平均數(shù)時,樣本平均數(shù) n2當(dāng)隨機(jī)變量當(dāng)隨機(jī)變量x不呈正態(tài)分布或分布未知時,只要樣本容量不呈正態(tài)分布或分布未知時,只要樣本容量n不斷增大(或不斷增大(或足夠大),則樣本平均數(shù)的分布逐漸趨向于正態(tài)分布,且平均數(shù)為足夠大),則樣本平均數(shù)的分布逐漸趨向于正態(tài)分布,且平均數(shù)為,方差為方差為中心極限定理中心極限定理),(2nNx樣本平均值樣本平均值 服從或近似服從正態(tài)

36、分布服從或近似服從正態(tài)分布2.3 與與 的關(guān)系的關(guān)系xnx(1) (2)表示原總體中各觀測值的離散程度表示原總體中各觀測值的離散程度 x表示樣本平均數(shù)抽樣總體中各樣本平均數(shù)的離散程度表示樣本平均數(shù)抽樣總體中各樣本平均數(shù)的離散程度(3)是總體中各觀測值變異程度的度量值是總體中各觀測值變異程度的度量值 是樣本平均數(shù)抽樣誤差的度量值是樣本平均數(shù)抽樣誤差的度量值是用來衡量樣本平均數(shù)代表總體平均數(shù)的代表程度的是用來衡量樣本平均數(shù)代表總體平均數(shù)的代表程度的x(4)稱為標(biāo)準(zhǔn)差,用稱為標(biāo)準(zhǔn)差,用Sd表示表示 稱為標(biāo)準(zhǔn)誤,用稱為標(biāo)準(zhǔn)誤,用Se表示表示 x4. t-分布(不要求)分布(不要求)4.1 t-分布的定

37、義分布的定義設(shè)有服從正態(tài)分布的隨機(jī)變量設(shè)有服從正態(tài)分布的隨機(jī)變量x,正態(tài)分布的標(biāo)準(zhǔn)化公式為:正態(tài)分布的標(biāo)準(zhǔn)化公式為:xu 對于總體方差對于總體方差2已知的總體,已知的總體,根據(jù)公式可以計算出隨機(jī)變量根據(jù)公式可以計算出隨機(jī)變量x在某一區(qū)間在某一區(qū)間內(nèi)出現(xiàn)的概率:內(nèi)出現(xiàn)的概率: uxu對于總體方差對于總體方差2已知的總體,根據(jù)公式可以知道已知的總體,根據(jù)公式可以知道在某一區(qū)間內(nèi)在某一區(qū)間內(nèi)出現(xiàn)的概率,公式為:出現(xiàn)的概率,公式為: xxuxxuxu服從標(biāo)準(zhǔn)正態(tài)分布服從標(biāo)準(zhǔn)正態(tài)分布nx附:附:服從標(biāo)準(zhǔn)正態(tài)分布服從標(biāo)準(zhǔn)正態(tài)分布xu假如假如2未知,而且樣本容量又比較?。ㄎ粗覙颖救萘坑直容^?。╪30)

38、時:時: 2S2xSx標(biāo)準(zhǔn)化公式可變換為:標(biāo)準(zhǔn)化公式可變換為:xSxtt統(tǒng)計量組成的分布,就稱為統(tǒng)計量組成的分布,就稱為t分布(分布(t distribution) 不再服從標(biāo)準(zhǔn)正態(tài)分布不再服從標(biāo)準(zhǔn)正態(tài)分布)(dfttt分布是一組曲線,自由度不同,曲線不同,但均以分布是一組曲線,自由度不同,曲線不同,但均以y軸為對稱軸為對稱 t分布只有一個參數(shù),即自由度分布只有一個參數(shù),即自由度 dft分布的平均數(shù)和標(biāo)準(zhǔn)差為:分布的平均數(shù)和標(biāo)準(zhǔn)差為: 0 (df 1) )2/(dfdft(df 2)服從服從t-分布分布nSSx4.2 t-分布的特點(diǎn)分布的特點(diǎn)(1)t分布為對稱分布,關(guān)于分布為對稱分布,關(guān)于t

39、= 0對稱;只有一個峰,峰值在對稱;只有一個峰,峰值在t = 0處;與標(biāo)準(zhǔn)正態(tài)分布曲線相比,處;與標(biāo)準(zhǔn)正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍分布曲線頂部略低,兩尾部稍高而平高而平 (2)t分布曲線受自由度分布曲線受自由度df 的影響,自由度越小,離散程度越大的影響,自由度越小,離散程度越大(3) t分布的極限是正態(tài)分分布的極限是正態(tài)分布。布。df越大,越大,t分布越趨近于分布越趨近于標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布 當(dāng)當(dāng)n 30時,時,t分布與標(biāo)準(zhǔn)正分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很小;態(tài)分布的區(qū)別很小;n 100時,時,t分布基本與標(biāo)準(zhǔn)正態(tài)分分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;布相同;n時,時,t 分布與分

40、布與標(biāo)準(zhǔn)正態(tài)分布完全一致標(biāo)準(zhǔn)正態(tài)分布完全一致4.3 t-分布的概率計算分布的概率計算附表附表4 4給出了給出了t t分布的兩尾臨界值分布的兩尾臨界值 當(dāng)左尾和右尾的概率之和為當(dāng)左尾和右尾的概率之和為 (每(每側(cè)為側(cè)為 /2)時,)時,t分布在橫坐標(biāo)上的分布在橫坐標(biāo)上的臨界值的絕對值,記為臨界值的絕對值,記為t )()(ttPttP例7:根據(jù)附表4查出相應(yīng)的臨界 t值 :(1)df =9,=0.05; (2)df =9,=0.01)9(05. 0t)9(01. 0t261. 2250. 3從一個平均數(shù)為從一個平均數(shù)為,方差為方差為2的正態(tài)總體中,進(jìn)行獨(dú)立地抽樣,的正態(tài)總體中,進(jìn)行獨(dú)立地抽樣,可獲

41、得隨機(jī)變量可獲得隨機(jī)變量x,則其標(biāo)準(zhǔn)離差:則其標(biāo)準(zhǔn)離差: xu N(0,1)如果連續(xù)進(jìn)行如果連續(xù)進(jìn)行n次獨(dú)立抽樣,可得次獨(dú)立抽樣,可得n個標(biāo)準(zhǔn)正態(tài)離差個標(biāo)準(zhǔn)正態(tài)離差ui,對這對這n個獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差個獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差ui進(jìn)行平方求和就得到一個新的統(tǒng)計量進(jìn)行平方求和就得到一個新的統(tǒng)計量2:2222212niuuuu22)(x5. 2-分布(不要求)分布(不要求)5.1 2-分布的定義分布的定義222)(xx222) 1(Sn 222)(x2)(xx如果用樣本進(jìn)行計算:如果用樣本進(jìn)行計算:2)(x由這些由這些2值所組成的一個分布,就稱之為值所組成的一個分布,就稱之為2分布(分布(2 distr

42、ibution)2)(2df22) 1()(Snxx1)(22nxxS5.2 2-分布的特點(diǎn)分布的特點(diǎn)(1)2分布的取值范圍為分布的取值范圍為0,+),無負(fù)值),無負(fù)值(2)2分布的平均數(shù)為:分布的平均數(shù)為: df2方差為:方差為: dfx222(3)2分布的形狀決定于自由度分布的形狀決定于自由度df 當(dāng)當(dāng)df =1時,曲線呈反時,曲線呈反 J 形形 隨著隨著df 的增大,曲線漸趨對稱的增大,曲線漸趨對稱 當(dāng)當(dāng)df 30時,向正態(tài)分布漸近時,向正態(tài)分布漸近 (4)2還可以定義為理論次數(shù)與觀察次數(shù)間的符合程度還可以定義為理論次數(shù)與觀察次數(shù)間的符合程度 (離散型變量)(離散型變量)iiiEEO22

43、)(O 觀察次數(shù) E 理論次數(shù) 5.3 2-分布的概率計算分布的概率計算附表附表3 3給出了給出了2 2分布的右尾臨界值分布的右尾臨界值 當(dāng)右尾概率為當(dāng)右尾概率為 時,時,2分布在橫坐標(biāo)分布在橫坐標(biāo)上的臨界值的絕對值,記為上的臨界值的絕對值,記為2)(22P例8:根據(jù)附表3查出相應(yīng)的右尾臨界2值 : (1)df =9,=0.05;(2)df =9,=0.012)9(05. 02)9(01. 0919.16666.21如果計算左尾概率為如果計算左尾概率為 時時 2分布分布的臨界值,只需查右尾概率為的臨界值,只需查右尾概率為1- 的右尾臨界值即可。的右尾臨界值即可。6. F-分布分布6.1 F-分

44、布的定義分布的定義從一個方差從一個方差2的正態(tài)總體中獨(dú)立地抽取樣本容量分別為的正態(tài)總體中獨(dú)立地抽取樣本容量分別為n1、n2的兩個樣本,的兩個樣本,這兩個樣本的方差分別為:這兩個樣本的方差分別為:21S22S221121) 1(Sn 則有:則有:222222) 1(Sn 這兩個這兩個2變量除以各自的自由度后的比值為:變量除以各自的自由度后的比值為:) 1() 1(222121nn2222221211) 1() 1() 1() 1(nSnnSn2221SSF由一系列由一系列F值所構(gòu)成的分布稱為值所構(gòu)成的分布稱為F分布(分布(F distribution) F F(df1,df2) 222) 1(S

45、n 已計算:已計算:6.2 F-分布的特點(diǎn)分布的特點(diǎn)(1)F分布密度曲線是隨自由度分布密度曲線是隨自由度df1、df2的變化而變化的一簇偏態(tài)曲線的變化而變化的一簇偏態(tài)曲線 其形狀隨著其形狀隨著df1、df2的增大逐漸趨于對稱;的增大逐漸趨于對稱;(2)F分布的取值范圍是(分布的取值范圍是(0,+),其平均數(shù):),其平均數(shù):1F6.3 F-分布的概率計算分布的概率計算附表附表5 5給出了給出了F F分布的右尾臨界值分布的右尾臨界值 當(dāng)右尾概率為當(dāng)右尾概率為 時,時,2分布在橫坐分布在橫坐標(biāo)上的臨界值的絕對值,記為標(biāo)上的臨界值的絕對值,記為F )(FFP例9:根據(jù)附表5查出相應(yīng)的右尾臨界F值 :

46、(1)df1 =4, df2 =20,=0.05;(2) df1 =4, df2 =20,=0.01F0.01(4,20) = 4.43 F0.05(4,20) = 2.87 第三節(jié) 統(tǒng)計推斷 假設(shè)檢驗假設(shè)檢驗參數(shù)估計參數(shù)估計統(tǒng)計學(xué)假設(shè)你正在研究平均一個美國人一生中要得到多少交通罰單,報告研究結(jié)果的方法有以假設(shè)你正在研究平均一個美國人一生中要得到多少交通罰單,報告研究結(jié)果的方法有以下兩種:下兩種:“10”或者或者“8到到12之間之間”一、參數(shù)估計一、參數(shù)估計Gudmund R. Iversen1、點(diǎn)估計、點(diǎn)估計1.用樣本的估計量直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計例如

47、:用樣本方差直接作為總體方差的估計2.沒有給出估計值接近總體參數(shù)程度的信息X22211)(nXXiSn2、區(qū)間估計、區(qū)間估計1.在點(diǎn)估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減抽樣誤差而得到的2.根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量n比如,某班級平均分?jǐn)?shù)在7585之間,置信水平是95% 1)(tsxtPx(不要求)(不要求)統(tǒng)計假設(shè)檢驗又稱為顯著性檢驗,是生物統(tǒng)計學(xué)的核心內(nèi)容,是統(tǒng)計推斷的主要組成部分統(tǒng)計推斷(statistical inference)就是通過樣本特征(統(tǒng)計量)來推斷相應(yīng)總體特征(參數(shù))的方法n 參數(shù)估計

48、(參數(shù)估計(parametric estimate) 通過樣本統(tǒng)計量估計總體參數(shù)的方法通過樣本統(tǒng)計量估計總體參數(shù)的方法 點(diǎn)估計(點(diǎn)估計(point estimate) 區(qū)間估計(區(qū)間估計(interval estimate)直接用樣本統(tǒng)計量的數(shù)值估計出相應(yīng)總體參數(shù)具體值的方法直接用樣本統(tǒng)計量的數(shù)值估計出相應(yīng)總體參數(shù)具體值的方法在一定的概率保證下(一般為在一定的概率保證下(一般為95%或或99%),根據(jù)樣本統(tǒng)計量的分布,計),根據(jù)樣本統(tǒng)計量的分布,計算出總體參數(shù)出現(xiàn)的數(shù)值范圍或區(qū)間,用該區(qū)間來估計總體參數(shù)的方法算出總體參數(shù)出現(xiàn)的數(shù)值范圍或區(qū)間,用該區(qū)間來估計總體參數(shù)的方法 參數(shù)估計是對總體參數(shù)的

49、參數(shù)估計是對總體參數(shù)的定量分析定量分析 二、假設(shè)檢驗二、假設(shè)檢驗n 統(tǒng)計假設(shè)檢驗(統(tǒng)計假設(shè)檢驗(hypothesis test) 根據(jù)某種實際需要,對未知的或不完全知道的總體參數(shù)提出一些假設(shè),根據(jù)某種實際需要,對未知的或不完全知道的總體參數(shù)提出一些假設(shè),然后根據(jù)樣本觀測值和統(tǒng)計量的分布,通過一定的計算,再作出在一定然后根據(jù)樣本觀測值和統(tǒng)計量的分布,通過一定的計算,再作出在一定概率意義上應(yīng)當(dāng)接受哪種假設(shè)的方法。概率意義上應(yīng)當(dāng)接受哪種假設(shè)的方法。 統(tǒng)計假設(shè)檢驗的假設(shè)是對總體提出的,由于最后檢驗的結(jié)論只有兩種:統(tǒng)計假設(shè)檢驗的假設(shè)是對總體提出的,由于最后檢驗的結(jié)論只有兩種:要比較的總體參數(shù)間要么存在顯

50、著差異,要么不存在顯著差異要比較的總體參數(shù)間要么存在顯著差異,要么不存在顯著差異 統(tǒng)計假設(shè)檢驗是對總體參數(shù)的統(tǒng)計假設(shè)檢驗是對總體參數(shù)的定性分析定性分析 1. 統(tǒng)計假設(shè)檢驗的意義統(tǒng)計假設(shè)檢驗的意義 以兩個平均數(shù)之間差異的顯著性檢驗為例以兩個平均數(shù)之間差異的顯著性檢驗為例現(xiàn)隨機(jī)挑選10名中國女性和10名韓國女性,請世界網(wǎng)絡(luò)知名度大賽評委和觀眾進(jìn)行知名度評分,試比較哪個國家女性知名度更高?9.999.859.999.959.989.979.959.95中國女性的平均得分9.98韓國女性的平均得分9.91兩個國家女性的平均得分并不相等,其差值(表面效應(yīng))為:兩個國家女性的平均得分并不相等,其差值(表面

51、效應(yīng))為: 07. 091. 998. 921 xx根據(jù)兩個樣本平均數(shù)的差值根據(jù)兩個樣本平均數(shù)的差值0.07,是否可以給兩個樣本所在總體的總體平,是否可以給兩個樣本所在總體的總體平均數(shù)下這樣的結(jié)論:均數(shù)下這樣的結(jié)論:中國女性總體的平均得分高于韓國女性總體的平均得分中國女性比韓國女性知名度更高 如果從經(jīng)典數(shù)學(xué)的角度來看,答案應(yīng)該是肯定如果從經(jīng)典數(shù)學(xué)的角度來看,答案應(yīng)該是肯定 如果從生物統(tǒng)計學(xué)的角度來看,在未經(jīng)過統(tǒng)計假設(shè)檢驗以前,只能如果從生物統(tǒng)計學(xué)的角度來看,在未經(jīng)過統(tǒng)計假設(shè)檢驗以前,只能說說“不一定不一定” 事實上,僅僅憑借樣本平均數(shù)之差不等于事實上,僅僅憑借樣本平均數(shù)之差不等于0就得出其所屬

52、的總體平均數(shù)不相就得出其所屬的總體平均數(shù)不相等是不可靠的等是不可靠的 實際上,進(jìn)行試驗研究的目的并不在于了解樣本的結(jié)果,而是要通過樣本了實際上,進(jìn)行試驗研究的目的并不在于了解樣本的結(jié)果,而是要通過樣本了解總體,通過樣本來推斷總體,從而對總體給出一個全面的結(jié)論解總體,通過樣本來推斷總體,從而對總體給出一個全面的結(jié)論 2. 統(tǒng)計假設(shè)檢驗的基本思想與步驟統(tǒng)計假設(shè)檢驗的基本思想與步驟 首先根據(jù)具體試驗?zāi)康奶岢鲆粋€假設(shè) 然后在假定該假設(shè)成立(或正確)的前提下進(jìn)行試驗,并取得數(shù)據(jù),接著對這些資料進(jìn)行統(tǒng)計分析,獲得該假設(shè)成立的概率 最后根據(jù)所獲得的概率值的大小來判斷假設(shè)是否成立 如果所得概率較大,就表明我們

53、沒有足夠的理由來否定所作假設(shè),即必須接受這一假設(shè) 如果所得概率較小,就表明這一假設(shè)不大可能成立,應(yīng)予否定,從而接受其對立假設(shè) 統(tǒng)計假設(shè)檢驗的基本步驟例3-3:通過以往的大規(guī)模調(diào)查,已知某地成年黑白花奶牛血液中的白細(xì)胞數(shù)為52.3,標(biāo)準(zhǔn)差為5.38,現(xiàn)測得10頭黑白花牛白細(xì)胞數(shù)分別為53.6,55.3,46.4,57.2,46.0,43.2,48.1,51.1,49.9,44.5; =49.53。試問這批黑白花奶牛是否來自于某地黑白花奶??傮w?x(1)對所研究的總體提出假設(shè)對所研究的總體提出假設(shè)研究某一隨機(jī)樣本所在的總體(用研究某一隨機(jī)樣本所在的總體(用表示)和一已知總體(用表示)和一已知總體(

54、用0表示)是表示)是否為同一總體,也就是研究這一隨機(jī)樣本是否來自于已知總體否為同一總體,也就是研究這一隨機(jī)樣本是否來自于已知總體 假設(shè):假設(shè): 兩個總體為同一個總體(即兩個總體的總體平均數(shù)相等)兩個總體為同一個總體(即兩個總體的總體平均數(shù)相等)無效假設(shè)(無效假設(shè)(null hypothesis) 用用H0表示表示 即即H0:=0 無效假設(shè)的含義:無效假設(shè)就是假設(shè)兩總體的平均數(shù)相等,即H0:3 .52053.49x3.520假設(shè)樣本平均數(shù) 與已知總體平均數(shù) 77. 20 x由抽樣誤差引起的,并不是兩總體之間的真實差異 兩總體之間的差異是由抽樣誤差所引起的為了在無效假設(shè)被否定后有可以被接受的假設(shè),

55、因此應(yīng)在設(shè)立無效假設(shè)的同為了在無效假設(shè)被否定后有可以被接受的假設(shè),因此應(yīng)在設(shè)立無效假設(shè)的同時設(shè)立一個后備假設(shè)時設(shè)立一個后備假設(shè) 備擇假設(shè)(備擇假設(shè)(alternative hypothesis) 用用HA表示表示 即即HA: 3 .52H0A:077. 20 x備擇假設(shè)的統(tǒng)計學(xué)意義:樣本所在總體與已知總體不是同一個總體,即兩總體的平均數(shù)不等,即: 兩總體之間的差異是真實差異,而不是由抽樣誤差引起的 統(tǒng)計假設(shè)檢驗中完整的假設(shè)是:統(tǒng)計假設(shè)檢驗中完整的假設(shè)是: 00H:0AH:兩總體之間的差異是真實差異(2)在假定無效假設(shè)成立的前提下,研究樣本平均數(shù)的抽樣分布,計算樣在假定無效假設(shè)成立的前提下,研究

56、樣本平均數(shù)的抽樣分布,計算樣本平均數(shù)出現(xiàn)的概率本平均數(shù)出現(xiàn)的概率樣本平均數(shù)與總體平均數(shù)間有一個實際存在的差值:樣本平均數(shù)與總體平均數(shù)間有一個實際存在的差值:77. 20 x3 .5202238. 5這個差值就是表面效應(yīng),可能是抽樣誤差,也可能是真實差異,因此需要這個差值就是表面效應(yīng),可能是抽樣誤差,也可能是真實差異,因此需要借助概率原理來進(jìn)行判斷借助概率原理來進(jìn)行判斷 n 第一種方法:計算差值-2.77(或樣本平均數(shù))(或樣本平均數(shù))出現(xiàn)的概率在無效假設(shè)成立的前提下,樣本所在的總體與已知總體為同一個總體,因在無效假設(shè)成立的前提下,樣本所在的總體與已知總體為同一個總體,因此樣本所在總體的總體平均

57、數(shù)和方差已知,即:此樣本所在總體的總體平均數(shù)和方差已知,即:xxu070. 13 .5253.4963. 170. 11038. 5nx由于總體方差已知,根據(jù)標(biāo)準(zhǔn)正態(tài)分布就由于總體方差已知,根據(jù)標(biāo)準(zhǔn)正態(tài)分布就可以計算出差值可以計算出差值-2.77出現(xiàn)的概率出現(xiàn)的概率 63. 1u0.10.11標(biāo)準(zhǔn)化:構(gòu)造統(tǒng)計量 正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布-計算概率n 第二種方法:計算樣本平均數(shù)的接受區(qū)間xxu0根據(jù)標(biāo)準(zhǔn)化公式計算樣本平均數(shù)的接受區(qū)間:根據(jù)標(biāo)準(zhǔn)化公式計算樣本平均數(shù)的接受區(qū)間:1)(00 xxuxuPxux0 xxuxu00接受區(qū)間接受區(qū)間xux0否定區(qū)間否定區(qū)間接受區(qū)間和否定區(qū)間是有一定的概率保

58、證的,保證概率為接受區(qū)間和否定區(qū)間是有一定的概率保證的,保證概率為1-,常用的保常用的保證概率為證概率為95%和和99%;為顯著水平,常用的顯著水平有為顯著水平,常用的顯著水平有0.05和和0.01x96. 10倘若樣本平均數(shù)落在接受區(qū)間內(nèi),就接受倘若樣本平均數(shù)落在接受區(qū)間內(nèi),就接受H0,反之,倘若樣本平均數(shù)落在反之,倘若樣本平均數(shù)落在接受區(qū)間之外,就否定接受區(qū)間之外,就否定H0,接受接受HA作為作為0.05顯著水平上接受或否定無效假設(shè)的兩個臨界值顯著水平上接受或否定無效假設(shè)的兩個臨界值 x58. 2作為作為0.01顯著水平上接受或否定無效假設(shè)的兩個臨界值顯著水平上接受或否定無效假設(shè)的兩個臨界

59、值 1)(uuuP95%的接受區(qū)間為:的接受區(qū)間為:97.4870. 196. 13 .5296. 10 x68.5670. 158. 23 .5258. 20 x92.4770. 158. 23 .5258. 20 x99%的接受區(qū)間為:的接受區(qū)間為:63.5570. 196. 13 .5296. 10 x(3)根據(jù)根據(jù)“小概率事件實際不可能性原理小概率事件實際不可能性原理”接受或否定無效假設(shè)接受或否定無效假設(shè)小概率事件實際不可能性原理是指在一次試驗中,概率很小的事件是不可小概率事件實際不可能性原理是指在一次試驗中,概率很小的事件是不可能出現(xiàn)的能出現(xiàn)的 在統(tǒng)計學(xué)中,當(dāng)樣本平均數(shù)與總體平均數(shù)差

60、值出現(xiàn)的概率小于在統(tǒng)計學(xué)中,當(dāng)樣本平均數(shù)與總體平均數(shù)差值出現(xiàn)的概率小于5%時,就認(rèn)時,就認(rèn)為這種差異由抽樣誤差引起的概率較小,而是兩總體間的真實性差異,從為這種差異由抽樣誤差引起的概率較小,而是兩總體間的真實性差異,從而否定無效假設(shè)而否定無效假設(shè) 差值差值-2.77出現(xiàn)的概率為出現(xiàn)的概率為0.10.11,大于,大于0.05,概率較大,概率較大 ;說明樣本平均數(shù);說明樣本平均數(shù)與已知總體的總體平均數(shù)之間的差異是抽樣誤差的概率較大,而不大可能是與已知總體的總體平均數(shù)之間的差異是抽樣誤差的概率較大,而不大可能是真實差異真實差異 接受無效假設(shè),也就是說這批黑白花奶牛是來自于某地黑白花奶??傮w。接受無效

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論