生物統(tǒng)計(jì)學(xué)(第三版)_第1頁
生物統(tǒng)計(jì)學(xué)(第三版)_第2頁
生物統(tǒng)計(jì)學(xué)(第三版)_第3頁
生物統(tǒng)計(jì)學(xué)(第三版)_第4頁
生物統(tǒng)計(jì)學(xué)(第三版)_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、概論名詞:生物統(tǒng)計(jì):將概率論和數(shù)理統(tǒng)計(jì)的原理應(yīng)用到生物學(xué)中以分析和解釋其數(shù)量資料的科學(xué)試驗(yàn)設(shè)計(jì):試驗(yàn)工作未進(jìn)行之前應(yīng)用生物統(tǒng)計(jì)原理,來制定合理的試驗(yàn)方案,包括選擇動(dòng)物,分組和對(duì)比以及相應(yīng)的資料搜集整理和統(tǒng)計(jì)分析的方法??傮w與樣本n 數(shù)據(jù)具有不齊性。n 根據(jù)研究目的確定的研究對(duì)象的全體稱為總體(population);n 含有有限個(gè)個(gè)體的總體稱為有限總體;n 包含有無限多個(gè)個(gè)體的總體叫無限總體; n 總體中的一個(gè)研究單位稱為個(gè)體 (individual);n 從總體中隨機(jī)抽出一部分具有代表性的個(gè)體稱為樣本(sample);n 樣本中所包含的個(gè)體數(shù)目叫樣本容量或大小,常記為n。n 通常把n30的樣

2、本叫小樣本,n 30的樣本叫大樣本。 隨機(jī)抽取(random sampling) 的樣本是指總體中的每一個(gè)個(gè)體都有同等的機(jī)會(huì)被抽取組成樣本。變數(shù)與變異數(shù)列、變量 :n 變數(shù):研究中對(duì)樣本個(gè)體的觀察值。n 變量:相同性質(zhì)的事物間表現(xiàn)差異性的某種特征。如:身高、體重。n 變異數(shù)列:將變數(shù)按從小到大的順序排列的一組數(shù)列。參數(shù)與統(tǒng)計(jì)量 n 由總體計(jì)算的特征數(shù)叫參數(shù)(parameter);n 由樣本計(jì)算的特征數(shù)叫統(tǒng)計(jì)量(staistic)。準(zhǔn)確性與精確性 n 準(zhǔn)確性(accuracy)也叫準(zhǔn)確度,指觀測(cè)值與其真值接近的程度。若 x與相差的絕對(duì)值|x|小, 則觀測(cè)值x的準(zhǔn)確性高; 反之則低。n 精確性(p

3、recision)也叫精確度,指重復(fù)觀測(cè)值彼此接近的程度。若觀測(cè)值彼此接近,即任意二個(gè)觀測(cè)值xi、xj 相差的絕對(duì)值|xi xj |小,則觀測(cè)值精確性高;反之則低。n 調(diào)查或試驗(yàn)的準(zhǔn)確性、精確性合稱為正確性。由于真值常常不知道,所以準(zhǔn)確性不易度量,但利用統(tǒng)計(jì)方法可度量精確性。 隨機(jī)誤差與系統(tǒng)誤差隨機(jī)誤差也叫抽樣誤差(sampling error) , 是由于許多無法控制的內(nèi)在和外在的偶然因素所造成。帶有偶然性質(zhì),在試驗(yàn)中,即使十分小心也難以消除。隨機(jī)誤差影響試驗(yàn)的精確性。統(tǒng)計(jì)上的試驗(yàn)誤差指隨機(jī)誤差。這種誤差愈小,試驗(yàn)的精確性愈高。系統(tǒng)誤差也叫片面誤差 (lopsided error),是試驗(yàn)處

4、理之外的其他條件明顯不一致所帶來的偏差。是由于試驗(yàn)動(dòng)物的初始條件相差較大,飼料種類、品質(zhì)、數(shù)量、飼養(yǎng)條件未控制相同 ,測(cè)量的儀器不準(zhǔn)、標(biāo)準(zhǔn)試劑未經(jīng)校正,以及觀測(cè)、記載、抄錄、計(jì)算中的錯(cuò)誤所引起。系統(tǒng)誤差影響試驗(yàn)的準(zhǔn)確性。系統(tǒng)誤差是一種有原因的偏差,因而在試驗(yàn)過程中要防止這種偏差的出現(xiàn)。隨機(jī)誤差是偶然性的。整個(gè)試驗(yàn)過程中涉及的隨機(jī)波動(dòng)因素愈多,試驗(yàn)的環(huán)節(jié)愈多,時(shí)間愈長,隨機(jī)誤差發(fā)生的可能性及波動(dòng)程度愈大。隨機(jī)誤差不可避免,但可減少,這主要依賴控制試驗(yàn)過程,尤其那些隨機(jī)波動(dòng)性大的因素。系統(tǒng)誤差是可以通過試驗(yàn)條件及試驗(yàn)過程的仔細(xì)操作而控制的。實(shí)際上一些主要的系統(tǒng)性偏差較易控制,而有些細(xì)微偏差則較難控

5、制。平均數(shù)、標(biāo)準(zhǔn)差無偏估計(jì)量:當(dāng)一個(gè)統(tǒng)計(jì)量的數(shù)學(xué)期望等于所估計(jì)的總體參數(shù)時(shí),則稱此統(tǒng)計(jì)量為該總體參數(shù)的無偏估計(jì)量中位數(shù)的計(jì)算方法因資料是否分組而有所不同。分組資料中位數(shù)的計(jì)算方法 1、當(dāng)n為奇數(shù)時(shí): Md=2、當(dāng)n為 偶 數(shù) 時(shí) : 已分組資料中位數(shù)的計(jì)算方法若資料已分組,編制成次數(shù)分布表,則可利用次數(shù)分布表來計(jì)算中位數(shù),其計(jì)算公式為: L 中位數(shù)所在組的下限;i 組距;f 中位數(shù)所在組的次數(shù);n 總次數(shù);c 小于中數(shù)所在組的累加次數(shù)。 例題:某奶牛場(chǎng)68頭健康母牛從分娩到第一次發(fā)情間隔時(shí)間 整理成次數(shù)分布表如表所示,求中位數(shù)。 例題:將100頭長白母豬的仔豬一月窩重(單位:kg)資料整理成次

6、數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。平均數(shù)適用于對(duì)稱分布,特別是正態(tài)分布資料。中位數(shù)適用于各種分布類型的資料,特別適合大樣本偏態(tài)分布資料或者一端或兩端無確切數(shù)值的資料。幾何平均數(shù):n 個(gè)觀測(cè)值相乘之積開 n 次方所得的方根,稱為幾何平均數(shù),記為G。例題:某波爾山羊群19972000年各年度的存欄數(shù)見表33,試求其年平均增長率。 G=lg-1(-0.368-0.3980.602)=lg-1(-0.456)=0.3501例題:有8份血清的抗體效價(jià)分別為1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗體效價(jià)。平均抗體效價(jià)為: 1:57幾何平均數(shù):適用

7、于成等比數(shù)列的資料,特別是服從對(duì)數(shù)正態(tài)分布資料。如畜禽 、水產(chǎn)養(yǎng)殖的 增長率,抗體的滴度,藥物的效價(jià),畜禽疾病的潛伏期等。眾數(shù):資料 中出現(xiàn)次數(shù)最多的那個(gè)觀測(cè)值或次數(shù)最多一組的組中值,稱為眾數(shù),記為M0。適用于大樣本;較粗糙如前述的 50枚受精種蛋出雛天數(shù)次數(shù)分布中,以22出現(xiàn)的次數(shù)最多,則該資料的眾數(shù)為22天。標(biāo)準(zhǔn)差:用平均數(shù)作為樣本的代表,其代表性的強(qiáng)弱受樣本資料中各觀測(cè)值變異程度的影響。全距(極差):是表示變異程度最簡(jiǎn)便的統(tǒng)計(jì)量。當(dāng)資料很多而又要迅速對(duì)變異程度作出判斷,可以用全距。 但是全距只利用了資料中的最大值和最小值,比較粗略。離均差以平均數(shù)為標(biāo)準(zhǔn),求出各個(gè)觀測(cè)值與平均數(shù)的離差,(

8、)。離均差能表示一個(gè)觀測(cè)值偏離平均數(shù)的性質(zhì)和程度,但因?yàn)殡x均差有正、有負(fù) ,離均差之和為零,即( ) = 0 ,而 不 能 用離均差之和( ) 表示所有觀測(cè)值的總偏離程度。平均絕對(duì)離差:| |/n。平均絕對(duì)離差可以表示資料中各觀測(cè)值的變異程度 ,但包含絕對(duì)值符號(hào) ,使用很不方便。先將各 個(gè)離 均差平方,即 ( )2 ,再求 離均差平方和 , 即 ,簡(jiǎn)稱平方和,記為SS; 為了消除樣本大小的影響,需求出離均差平方和的平均數(shù) ;為使所得的統(tǒng)計(jì)量是相應(yīng)總體參數(shù)的無偏估計(jì)量,統(tǒng)計(jì)學(xué)證明,在求離均差平方和的平均數(shù)時(shí),分母用自由度 n-1, 于是, 采 用統(tǒng)計(jì)量 表示資料的變異程度。 統(tǒng)計(jì)量 稱 為 均

9、方 ( mean square縮寫為MS),又稱樣本方差,記為S2,即S2= 自由度:樣本內(nèi)能獨(dú)立而自由變動(dòng)的觀察值的個(gè)數(shù),DFn-K,K為限制條件的個(gè)數(shù)。相應(yīng)的總體參數(shù)叫 總體方差 ,記為2。對(duì)于有限總體而言,2的計(jì)算公式為:由于 樣本方差 帶有原觀測(cè)單位的 平方單位,統(tǒng)計(jì)學(xué)上把樣本方差 S2 的平方根叫做樣本標(biāo)準(zhǔn) 差,記為S,即: 相應(yīng)的總體參數(shù)叫總體標(biāo)準(zhǔn)差,記為。對(duì)于有限總體而言,的計(jì)算公式為:在統(tǒng)計(jì)學(xué)中,常用樣本標(biāo)準(zhǔn)差S估計(jì)總體標(biāo)準(zhǔn)差。 標(biāo)準(zhǔn)差的計(jì)算方法對(duì)于未分組或小樣本資料 , 可直接利用公式來計(jì)算標(biāo)準(zhǔn)差。對(duì)于次數(shù)分布表的大樣本資料,采用加權(quán)法計(jì)算標(biāo)準(zhǔn)差。計(jì)算公式為: 式中,f為各組

10、次數(shù);x為各組的組中值;f = n為總次數(shù)。例:用某純系蛋雞200枚蛋重資料的次數(shù)分布表計(jì)算標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的特性 標(biāo)準(zhǔn)差的大小,受資料中每個(gè)觀測(cè)值的影響,如觀測(cè)值間變異大,標(biāo)準(zhǔn)差也大,反之則小。 在各觀測(cè)值加上或減去一個(gè)常數(shù),其數(shù)值不變。 每個(gè)觀測(cè)值乘以或除以一個(gè)常數(shù)a,則所得的標(biāo)準(zhǔn)差是原來標(biāo)準(zhǔn)差的a倍或1/a倍。 資料服從正態(tài)分布時(shí),n 68.26%的觀測(cè)值在( S)范圍內(nèi);n 95.43%的觀測(cè)值在( 2S)范圍內(nèi);n 99.73%的觀測(cè)值在( 3S)范圍內(nèi)。也就是說全距近似地等于6倍標(biāo)準(zhǔn)差,可用(全距/6)來粗略估計(jì)標(biāo)準(zhǔn)差。 變異系數(shù) :衡量資料中各觀測(cè)值變異程度的另一個(gè)統(tǒng)計(jì)量 。標(biāo)準(zhǔn)差與

11、平均數(shù)的比值稱為變異系數(shù),記為CV。變異系數(shù)可以消除單位 和 (或)平 均數(shù)不同對(duì)兩個(gè)或多個(gè)資料變異程度比較的影響。注意,變異系數(shù)的大小,同時(shí)受平均數(shù)和標(biāo)準(zhǔn)差兩個(gè)統(tǒng)計(jì)量的影響,因而在利用變異系數(shù)表示資料的變異程度時(shí),最好將平均數(shù)和標(biāo)準(zhǔn)差也列出。常用概率分布隨機(jī)現(xiàn)象或不確定性現(xiàn)象,有如下特點(diǎn):對(duì)一次或少數(shù)幾次觀察或試驗(yàn)而言,其結(jié)果呈現(xiàn)偶然性、不確定性;在相同條件下進(jìn)行大量重復(fù)試驗(yàn)時(shí),其試驗(yàn)結(jié)果呈現(xiàn)出某種特定的規(guī)律性頻率的穩(wěn)定性,稱之為隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。隨機(jī)試驗(yàn)與隨機(jī)事件隨機(jī)試驗(yàn) 根據(jù)某一研究目的,在一定條件下對(duì)自然現(xiàn)象所進(jìn)行的觀察或試驗(yàn)統(tǒng)稱為試驗(yàn)。 滿足下述三個(gè)特性稱為 一個(gè)隨機(jī)試驗(yàn)(ran

12、dom trial),簡(jiǎn)稱試驗(yàn): (1)試驗(yàn)可以在相同條件下多次重復(fù)進(jìn)行; (2)每次試驗(yàn)的可能結(jié)果不止一個(gè) ,并且事先知道會(huì)有哪些可能的結(jié)果; (3)每次試驗(yàn)總是恰好出現(xiàn)這些可能結(jié)果中的一個(gè) ,但在一次試驗(yàn)之前卻不能肯定這次試驗(yàn)會(huì)出現(xiàn)哪一個(gè)結(jié)果。隨機(jī)事件 隨機(jī)試驗(yàn)的每一種可能結(jié)果,稱為隨機(jī)事件(random event),簡(jiǎn)稱事件(event),通常用A、B、C等來表示?;臼录翰荒茉俜值氖录Q為基本事件(elementary event) , 也稱為樣本點(diǎn)(sample point)。復(fù)合事件:由若干個(gè)基本事件組合而成的事件。如 “取得一個(gè)編號(hào)是 2的倍數(shù)”是一個(gè)復(fù)合事件。由 “ 取得一

13、個(gè)編號(hào)是2 ”、 “ 是4”、“是6、“是8”、“是10”5個(gè)基本事件組合而成。 必然事件 (certain event 在一定條件下必然會(huì)發(fā)生的事件,用表示。如,在嚴(yán)格按妊娠期母豬飼養(yǎng)管理的要求飼養(yǎng)的條件下,妊娠正常的母豬經(jīng)114天左右產(chǎn)仔。不可能事件 (impossible event),在一定條件下不可能發(fā)生的事件,用表示。必然事件與不可能事件實(shí)際上是確定性現(xiàn)象,為了方便起見,把它們看作為兩個(gè)特殊的隨機(jī)事件。概率:在相同條件下進(jìn)行n次重復(fù)試驗(yàn),如果隨機(jī)事件A發(fā)生的次數(shù)為m,那么m/n稱為隨機(jī)事件A的頻率(frequency);當(dāng)試驗(yàn)重復(fù)數(shù)n逐漸增大時(shí),隨機(jī)事件A的頻率越來越穩(wěn)定地接近某一

14、數(shù)值 p , p稱為隨機(jī)事件A的概率。這樣的概率稱為統(tǒng)計(jì)概率或者后驗(yàn)概率。概率的古典定義:有很多隨機(jī)試驗(yàn)具有以下特征:樣本空間中的基本事件只有有限個(gè);所有基本事件的發(fā)生是等可能的;試驗(yàn)的所有可能結(jié)果兩兩互不相容。具有上述特征的隨機(jī)試驗(yàn),稱為古典概型。若隨機(jī)事件的概率很小,例如小于0.05、0.01、0.001,稱之為小概率事件。把小概率事件在一次試驗(yàn)中看成是實(shí)際不可能發(fā)生的事件稱為小概率事件實(shí)際不可能性原理,亦稱為小概率原理。小概率事件實(shí)際不可能性原理是統(tǒng)計(jì)學(xué)上進(jìn)行假設(shè)檢驗(yàn)(顯著性檢驗(yàn))的基本依據(jù)。 例:患結(jié)核病為3,患沙眼為4,則10000中患任一種病的概率、人數(shù) P( AB ) P(A)P

15、(B) P (AB) 0.030.040.030.04 0.0688 0.0688 10000 688人標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算 利用下列關(guān)系式,可計(jì)算常用概率: P(0uu1)(u1)-0.5 P(uu1) =(-u1) P(uu1)=2(-u1) P(uu1)1-2(-u1) P(u1uu2)(u2)-(u1) 例 已知uN(0,1),試求: (1) P(u-1.64)? =0.05050 (2) P (u2.58)=? =(-2.58)=0. (3) P (u2.56)=? =2(-2.56)=20. =0. (4) P(0.34u1.53) =? =(1.53)-(0.34) =0.93

16、669-0.6331=0.30389關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:P(-1u1)=0.6826 P(-2u2)=0.9545 P(-3u3)=0.9973 P(-1.96u1.96)=0.95 P (-2.58u2.58)=0.99 P(-x+)=0.6826 P(-2x+2) =0.9545 P (-3x+3) =0.9973 P (-1.96x+1.96) =0.95 P (-2.58x+2.58)=0.99雙側(cè)概率(兩尾概率)和單側(cè)概率隨機(jī)變量x落在平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間之外的概率稱為雙側(cè)概率(兩尾概率),記作。對(duì)應(yīng)于雙側(cè)概率可以求得隨機(jī)變量x小于-k或大于+k的概率,稱

17、為單側(cè)概率(一尾概率),記作2。 例題 已知豬血紅蛋白含量x服從正態(tài)分布 N ( 12.86,1.332 ), 若 P (x L1 ) =0.03, P(x L2 )=0.03,求 L1 , L2 。 解:由題意可知,2=0.03,=0.06由附表2查得: =1. , 所以 (L1 -12.86)/1.33=-1. (L2 -12.86)/1.33=1.即 L1 10.36, L2 15.36。二項(xiàng)分布“成功失敗型”試驗(yàn)稱為Bernoulli試驗(yàn)(1)每次試驗(yàn)結(jié)果,只能是兩個(gè)互斥的結(jié)果之一(A或非A)。(2)每次試驗(yàn)的條件不變。即每次試驗(yàn)中,結(jié)果A發(fā)生的概率不變,均為 p 。(3)各次試驗(yàn)獨(dú)立

18、。即一次試驗(yàn)出現(xiàn)什么樣的結(jié)果與前面已出現(xiàn)的結(jié)果無關(guān)。二項(xiàng)分布的性質(zhì)n 二項(xiàng)分布由n和p兩個(gè)參數(shù)決定: 1、當(dāng)p值較小且n不大時(shí)(np5) ,分布是偏倚的。但隨著n的增大 ,分布逐漸趨于對(duì)稱;2、當(dāng) p 值趨于0.5 時(shí) ,分布趨于對(duì)稱;3、對(duì)于固定的n及p,當(dāng)k增加時(shí),Pn(k)先隨之增加并達(dá)到其極大值,以后又下降。n 在n較大,np、nq (np5,p不接近0,1)較接近時(shí) ,二項(xiàng)分布接近于正態(tài)分布;當(dāng)n時(shí),P 0.1,二項(xiàng)分布的極限分布是正態(tài)分布。例題:設(shè)在家畜中感染某種疾病的概率為20,現(xiàn)有兩種疫苗,用疫苗A 注射了15頭家畜后無一感染,用疫苗B 注射 15頭家畜后有1頭感染。設(shè)各頭家畜

19、沒有相互傳染疾病的可能,問:應(yīng)該如何評(píng)價(jià)這兩種疫苗? 解:假設(shè)疫苗A完全無效,注射后的家畜感染的概率仍為20,則15 頭家畜中染病頭數(shù)x=0的概率為 同理,如果疫苗B完全無效,則15頭家畜中最多有1頭感染的概率為可知 , 注射 A 疫苗無效的概率為0.0352,比B疫苗無效的概率0.1671小得多。因此,可以認(rèn)為A疫苗是有效的,但不能認(rèn)為B疫苗也是有效的。例題:棕色正常毛(bbRR)和黑色短毛(BBrr)雜交,問需多少F2代家兔才能以99的概率獲得一個(gè)棕色短毛兔?解:非bbrr為15/16,bbrr為1/16n 出現(xiàn)1個(gè)bbrr:n n 出現(xiàn)2個(gè)bbrr:n 出現(xiàn)n個(gè)bbrr:所以 出現(xiàn)0個(gè)b

20、brr: 10.990.01n n=(lg15-lg16)=0.01,n=71.4 二項(xiàng)分布的應(yīng)用條件: (1)各觀察單位只具有互相對(duì)立的一種結(jié)果; (2)已知發(fā)生某一結(jié)果 (如死亡) 的概率為p,其對(duì)立結(jié)果的概率則為1-P=q,實(shí)際中要求p 是從大量觀察中獲得的比較穩(wěn)定的數(shù)值; (3)n個(gè)觀察單位的觀察結(jié)果互相獨(dú)立。二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差當(dāng)試驗(yàn)結(jié)果以事件A發(fā)生次數(shù)k表示時(shí) x=np x= 當(dāng)試驗(yàn)結(jié)果以事件A發(fā)生的頻率kn表示時(shí)也稱為總體百分?jǐn)?shù)標(biāo)準(zhǔn)誤,當(dāng) p 未 知時(shí),常以樣本百分?jǐn)?shù) 來估計(jì)。此時(shí) : = 稱為樣本百分?jǐn)?shù)標(biāo)準(zhǔn)誤。 波松分布用來描述和分析隨機(jī)地發(fā)生在單位空間或 時(shí)間里的稀有事件

21、的概率分布。P0.1,n np 5應(yīng)用:如, 一定畜群中某種患病率很低的非傳染性疾病患病數(shù)或死亡數(shù), 畜群中遺傳的畸形怪胎數(shù), 每升飲水中大腸桿菌數(shù),計(jì)數(shù)器小方格中血球數(shù), 單位空間中某些野生動(dòng)物或昆蟲數(shù)等。 波松分布的意義 若隨機(jī)變量x(x=k)只取零和正整數(shù)值0,1,2,且其概率分布為 , k=0,1, 其中0;e=2.7182 是自然對(duì)數(shù)的底數(shù),則 稱 x 服 從 參 數(shù) 為 的 波 松分布(Poissons distribution),記 為 xP()。 波松分布重要的特征:平均數(shù)和方差相等,都等于常數(shù),即 =2=性質(zhì): 1.是波松分布所依賴的唯一參數(shù)。 2.值愈小分布愈偏倚,隨著的增

22、大 ,分布趨于對(duì)稱。 當(dāng)= 20時(shí)分布接近于正態(tài)分布; 當(dāng)=50時(shí),可以認(rèn)為波松分布呈正態(tài)分布波松分布的概率計(jì)算調(diào)查某種豬場(chǎng)育種群仔豬畸形數(shù),共記錄200窩, 畸形仔豬數(shù)的分布情況如表4-3所示。試判斷畸形仔豬數(shù)是否服從波松分布樣本均數(shù)和方差S2計(jì)算結(jié)果如下: =fk/n =(1200+621 +152+23+14)/200 =0.51 這兩個(gè)數(shù)是相當(dāng)接近的 , 因此可以認(rèn)為畸形仔豬數(shù)服從波松分布。將0.51代替公式(4-23)中的得:(k=0,1,2,)因?yàn)閑-0.51=1.6653,所以畸形仔豬數(shù)各項(xiàng)的概率為: P(x=0)=0.510(0!1.6653)=0.6005P(x=1)=0.5

23、11(1!1.6653)=0.3063P(x=2)=0.512(2!1.6653)=0.0781 P(x=3)=0.513(3!1.6653)=0.0133P(x=4)=0.514(4!1.6653)=0.0017進(jìn)一步說明了畸形仔豬數(shù)是服從波松分布的例:某小麥品種在田間的變異概率為0.0045,計(jì)算:(1)調(diào)查100株,獲2株或2株以上的變異植株的概率 (2)期望以99獲得1株或1株以上的變異植株,至少要調(diào)查多少株?解:np1000.00450.45 P(0) 0.6376P(1) 0.2869P(x2)1P(0)P(1)0.0755(2)P(0) 0.01 n=1023株 一些具有傳染性的

24、罕見疾病的發(fā)病數(shù),因?yàn)槭桌l(fā)生之后可成為傳染源,會(huì)影響到后續(xù)病例的發(fā)生,所以不符合波松分布的應(yīng)用條件。 對(duì)于在單位時(shí)間、單位面積或單位容積內(nèi),所觀察的事物由于某些原因分布不隨機(jī)時(shí),如細(xì)菌在牛奶中成集落存在時(shí),亦不呈波松分布。正態(tài)分布、二項(xiàng)分布、波松分布三 者間關(guān)系: 二項(xiàng)分布: n,p0 (p0.1) , 且 n p =(較小常數(shù)30,分成若干組,以便統(tǒng)計(jì)分析。分組后,制成次數(shù)分布表,即可看到資料的集中和變異情況。(一)計(jì)數(shù)資料的整理單項(xiàng)式分組法。n 以50枚受精種蛋孵化出雛雞的天數(shù)為例。n 用變數(shù)自然值進(jìn)行分組,每組組值均用一個(gè)變數(shù)值表示,將每個(gè)變數(shù)歸入相應(yīng)組,統(tǒng)計(jì)頻數(shù),制成頻數(shù)分布表。小雞

25、出殼天數(shù)在1924天范圍內(nèi)變動(dòng) ,有6個(gè)不同的觀察值。用各個(gè)不同觀察值進(jìn)行分組,共分為6組。合并分組法觀察值較多的計(jì)數(shù)資料,以幾個(gè)相鄰觀察值為一組,適當(dāng)減少組數(shù),資料的規(guī)律性就較明顯,進(jìn)一步計(jì)算分析也比較方便。如觀測(cè)某品種100只蛋雞每年每只雞產(chǎn)蛋數(shù) (原始資料略),其變異范圍為200-299枚。如間隔10枚為一組,可使組數(shù)適當(dāng)減少。經(jīng)初步整理后分為10組,資料的規(guī)律性就比較明顯。(二)計(jì)量資料的整理 組距式分組法在分組前需確定全距、組數(shù)、組距、組中值及組限,然后將全部觀測(cè)值劃線計(jì)數(shù)歸組。將126頭基礎(chǔ)母羊的體重資料整理成次數(shù)分布表1、求全距 全距是資料中最大值與最小值之差,又稱為極差(ran

26、ge),用R表示2、確定組數(shù)(經(jīng)驗(yàn)) 視樣本含量及資料的變動(dòng)范圍而定,既簡(jiǎn)化資料又不影響反映資料的規(guī)律性。組數(shù)要適當(dāng),分組越多所求得的統(tǒng)計(jì)量越精確,但增大了運(yùn)算量;分組過少,資料的規(guī)律性就反映不出來,計(jì)算出的統(tǒng)計(jì)量的精確性也較差。 n 50,56組; n 50,720組 。3、確定組距 每組最大值與最小值之差稱為組距,記為 i。要求各組的組距相等。組距(i)全距組數(shù) 本例 i28.0103.0 (一般用整數(shù)、避免計(jì)算的麻煩)4、確定組限及組中值 各組的最大值與最小值稱為組限。最小值為下限, 最大值為上限。每一組的中點(diǎn)值稱為組中值,是該組的代表值。組中值(組下限組上限)/2 組下限1/ 2組距

27、組上限1/2組距當(dāng)?shù)谝唤M的組中值確定以后,加上組距就是第二組的組中值,其余類推。 首先要選定第一組的組中值。為避免第一組中觀察值過多,第一組的組中值以接近或等于資料中的最小值為好。第一組組中值、組限確定后,其余各組的組中值、組限也可相繼確定。注意,最末一組的上限應(yīng)大于資料中的最大值。最小值為37.0, 第一組的組中值取37.5,組距為3.0。第一組的下限為: 37.5-(1/2)3.036.0;第一組的上限也就是第二組的下限為: 36.0+3.0=39.0;以此類推。于是可分組為:36.0 39.0,39.0 42.0,。為使恰好等于前一組上限和后一組下限的數(shù)據(jù)能確切歸組,約定將其歸入后一組:

28、 第一組記為36.0 , 第二組記為39.0 , 5、歸組劃線計(jì)數(shù),作次數(shù)分布表分組結(jié)束后,將資料中的每一觀測(cè)值逐一歸組,劃線計(jì)數(shù),然后制成次數(shù)分布表。在歸組劃線時(shí)應(yīng)注意,不要重復(fù)或遺漏。分組后所得實(shí)際組數(shù),有時(shí)和最初確定的組數(shù)不同。(三)質(zhì)量性狀資料、半定量(等級(jí))資料的整理 按性狀或等級(jí)進(jìn)行分組,分別統(tǒng)計(jì)各組的次數(shù),然后制成次數(shù)分布表。常用統(tǒng)計(jì)表與統(tǒng)計(jì)圖 一、統(tǒng)計(jì)表 (一)統(tǒng)計(jì)表的結(jié)構(gòu)和要求 統(tǒng)計(jì)表由標(biāo)題、橫標(biāo)目、縱標(biāo)目、線條、數(shù)字及合計(jì)構(gòu)成。 編制統(tǒng)計(jì)表的總原則:結(jié)構(gòu)簡(jiǎn)單,層次分明,內(nèi)容安排合理,重點(diǎn)突出,數(shù)據(jù)準(zhǔn)確,便于理解和比較分析。具體要求如下:1、標(biāo)題 簡(jiǎn)明扼要、準(zhǔn)確說明表的內(nèi)容,

29、有時(shí)須注明時(shí)間、地點(diǎn)。2、標(biāo)目 標(biāo)目分橫標(biāo)目和縱標(biāo)目兩項(xiàng)。橫標(biāo)目列在表的左側(cè) ,用以表示被說明事物的主要標(biāo)志;縱標(biāo)目列在表的上端,說明橫標(biāo)目各統(tǒng)計(jì)指標(biāo)內(nèi)容,并注明計(jì)算單位,如、kg、cm等等,用/隔開。 3、數(shù)字 一律用阿拉伯?dāng)?shù)字,數(shù)字以小數(shù)點(diǎn)對(duì)齊,小數(shù)位數(shù)一致, 無數(shù)字的用“”表示,數(shù)字是“0”的,則填寫“0”。4、線條 三線圖:表的上下兩條邊線略粗,總橫標(biāo)目、縱標(biāo)目間及合計(jì)用細(xì)線與下面橫標(biāo)目、縱標(biāo)目分組及合計(jì)分開, 表的左上角一般不用斜線(二) 統(tǒng)計(jì)表的種類 統(tǒng)計(jì)表可根據(jù)縱、橫標(biāo)目是否有分組分為簡(jiǎn)單表和復(fù)合表兩類。1、簡(jiǎn)單表 由一組橫標(biāo)目和一組縱標(biāo)目組成,縱橫標(biāo)目都未分組 。 適于簡(jiǎn)單資料

30、的統(tǒng)計(jì)。 2、復(fù)合表 由兩組或兩組以上的橫標(biāo)目與一組縱標(biāo)目結(jié)合而成。此類表適用于復(fù)雜資料的統(tǒng)計(jì)。 二、統(tǒng)計(jì)圖常用有長條圖 (bar chart) 、園圖(pie chart) 、 線圖(linear chart) 、 直方圖(histogram)和 折線圖 (broken-line chart)等 。一般,計(jì)量資料采用直方圖和折線圖,計(jì)數(shù)資料 、質(zhì)量性狀資料、半定量 (等級(jí))資料常用長條圖 、 線圖或園圖。(一)統(tǒng)計(jì)圖繪制的基本要求 1、標(biāo)題簡(jiǎn)明扼要,列于圖的下方。 2、縱、橫兩軸應(yīng)有刻度,注明單位。 3、橫軸由左至右、縱軸由下而上,數(shù)值由小到大; 圖形長寬比例約5:4或6:5。 4、圖中需用

31、不同顏色或線條代表不同事物時(shí),應(yīng)有圖例說明。(二)常用統(tǒng)計(jì)圖及其繪制方法 1、長條圖 用等寬長條的長短或高低表示屬性種類或等級(jí)的次數(shù)或頻率分布。 如果只涉及一項(xiàng)指標(biāo) , 則采用單式長條圖; 如果涉及兩個(gè)或兩個(gè)以上的指標(biāo),則采用復(fù)式長條圖。 長條圖注意以下幾點(diǎn): (1)縱軸尺度從“0”開始,間隔相等,標(biāo)明所表示指標(biāo)的尺度及單位。 (2)橫軸是長條圖的共同基線,應(yīng)標(biāo)明各長條的內(nèi)容。 (3)在繪制復(fù)式長條圖時(shí),將同一屬性種類、等級(jí)的兩個(gè)或兩個(gè)以上指標(biāo)的長條繪制在一起,各長條所表示的指標(biāo)用圖例說明,同一屬性種類、等級(jí)的各長條間不留間隔。 2、園圖 用于表示計(jì)數(shù)資料、質(zhì)量性狀資料或半定量(等級(jí))資料的構(gòu)成比。 把園圖的全面積看成100%,按各類別、等級(jí)的構(gòu)成比將園面積分成若干分, 以扇形面積的大小表分別表示各類別、等級(jí)的比例。 園圖注意: (1)園圖上各部分按資料順序或大小順序,以時(shí)鐘9時(shí)或12時(shí)為起點(diǎn),順時(shí)針方向排列。 (2)園圖中各部分用線條分開,注明簡(jiǎn)要文字及百分比。3、線圖 用來表示事物或現(xiàn)象隨時(shí)間而變化的情況。 (1)單式線圖 表示某一事物或現(xiàn)象的動(dòng)態(tài)。 (2)復(fù)式線圖 在同一圖上表示兩種或兩種以上事物或現(xiàn)象的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論