版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第三章 生物統(tǒng)計(jì)的基本理論,第一節(jié) 總體、樣本與誤差,近代數(shù)理統(tǒng)計(jì)方法的發(fā)展和在科學(xué)研究中的應(yīng)用,特別是電子計(jì)算機(jī)技術(shù)的發(fā)展,使試驗(yàn)研究的試驗(yàn)手段、方法、設(shè)計(jì)和數(shù)據(jù)處理又進(jìn)入了現(xiàn)代化新階段。 20世紀(jì)20年代:費(fèi)休(R.Fisher)提出了的方差分析和隨機(jī)區(qū)組設(shè)計(jì);葉次(Yates)提出了混雜設(shè)計(jì)和復(fù)因素試驗(yàn)。 20世紀(jì)30年代:田間復(fù)因子試驗(yàn)開始在歐美實(shí)施。 20世紀(jì)50年代后:隨著電子計(jì)算機(jī)技術(shù)的發(fā)展,試驗(yàn)設(shè)計(jì)逐步向復(fù)雜化和高級(jí)化發(fā)展。回歸正交設(shè)計(jì)、回歸旋轉(zhuǎn)設(shè)計(jì)、回歸最優(yōu)設(shè)計(jì)、混料設(shè)計(jì)逐漸用于科學(xué)研究的試驗(yàn)設(shè)計(jì),也成為環(huán)境研究的重要方法.,生物統(tǒng)計(jì)方法的發(fā)展,統(tǒng)計(jì)分析軟件,一、總體與樣本,
2、例如:研究某一地區(qū)耕地土壤中的Cd含量(總體),則從該地區(qū)選取若干個(gè)地塊為樣本,每個(gè)地塊土壤Cd含量則為一個(gè)個(gè)體。,二、誤差,誤差:觀察值與真值之間的差異。,系統(tǒng)誤差:由某個(gè)或某些固定因素引起的誤差。 特點(diǎn):誤差的性質(zhì)和符號(hào)恒定不變 可以預(yù)見和消除 結(jié)果的統(tǒng)計(jì)分析不一定能發(fā)現(xiàn),隨機(jī)誤差:由不可預(yù)見的偶然因素引起的誤差。 特點(diǎn):誤差的符號(hào)隨機(jī)出現(xiàn),或正或負(fù) 不可預(yù)見,不能消除,但可減少 正負(fù)相抵,具有補(bǔ)償性,疏失誤差:由疏忽大意、操作不正確等主觀因素引起的誤差。 特點(diǎn):完全可以消除,第二節(jié) 總體與樣本特征數(shù),一、特征數(shù),變量:同一總體中個(gè)體間具有變異的每種性狀或特征,在數(shù)量上可以表現(xiàn)為不同的數(shù)值
3、,這個(gè)因個(gè)體不同而變化的量在統(tǒng)計(jì)學(xué)中稱為變量。,觀察值:不同個(gè)體的某一性狀具體表現(xiàn)的數(shù)值。,連續(xù)變量:總體中相鄰兩個(gè)變量的差值可無(wú)限小者。,不連續(xù)變量:相鄰兩個(gè)變量的之差最小為1 者。,變量可以分為:,總體特征數(shù):說(shuō)明總體中個(gè)體間集中性和分散性(變異性)特征的數(shù)值,稱為總體特征數(shù)或參數(shù)。,樣本特征數(shù):由樣本的不同個(gè)體觀察值計(jì)算出的反映樣本集中性和分散性(變異性)特征的數(shù)值,又稱統(tǒng)計(jì)值,可作為總體特征數(shù)的估計(jì)值。,總體特征數(shù):平均數(shù)、極差、方差、標(biāo)準(zhǔn)差、變異系數(shù)等,二、表示總體或樣本個(gè)體集中性的特征數(shù)平均數(shù),1 算術(shù)平均數(shù),1)總體算術(shù)平均數(shù):一個(gè)具有N個(gè)個(gè)體的總體,其觀察值為x1,x2,xN,
4、則該總體的算術(shù)平均數(shù)為:,2)樣本算術(shù)平均數(shù):一個(gè)具有n個(gè)個(gè)體的樣本,其觀察值為x1,x2,xn,則該樣本的算術(shù)平均數(shù) x 為:,3)算術(shù)平均數(shù)性質(zhì): (1)各觀察值與算術(shù)平均數(shù)之差(離均差)總和等于零:,(2)離均差的平方和最?。?3)算術(shù)平均數(shù)的計(jì)算方法: (1)直接法:,(2)加權(quán)法:如果觀察值有重復(fù)數(shù)值出現(xiàn),使各觀察值xi有不同的比重fi, 且 f1 +f2+fn=n,則平均數(shù):,例:分析表明菠菜根、莖、葉的重量分別為:2.3g,4.2g,6.0g;其農(nóng)藥殘留量分別為:400mg/kg,790mg/kg,500mg/kg。問菠菜的平均農(nóng)藥殘留量?,2 中數(shù),總體或樣本的各觀察值按大小順
5、序排列,排在中間位置的數(shù)據(jù)即為中數(shù)。,如果觀察值的個(gè)數(shù)為奇數(shù),則中數(shù)為排在中間位置的數(shù); 如果觀察值的個(gè)數(shù)為偶數(shù),則中數(shù)為排在中間兩數(shù)的均值。,3 眾數(shù),4 幾何平均數(shù),如果總體或樣本有n個(gè)觀察值,其乘積開n次方所得的數(shù)值,即為幾何平均數(shù)。記為G。,例:育種工作者,用幾何平均數(shù)從兩個(gè)蕃茄親本果重:P1=10.36g,P2=0.45g,預(yù)測(cè)F1的果重。結(jié)果為:,5 調(diào)合平均數(shù),例:毛管水在土壤中的上升速度,第1個(gè)10cm為8cm/min,第2個(gè)10cm為6cm/min,第3個(gè)10cm為4cm/min,求其平均速度。,6 樣本平均數(shù)的作用,1)反映樣本某一性狀的集中趨勢(shì)。 2)作為樣本性狀的代表,
6、可與另一同質(zhì)樣本進(jìn)行比較。 3)總體平均數(shù)的估計(jì)值,用于同質(zhì)總體的比較。,三、表示數(shù)據(jù)分散性趨勢(shì)的特征數(shù)變異數(shù),1 極差,總體或樣本觀察值中最大值與最小值之差。,R = maxx1,x2,xn - minx1,x2,xn,3 標(biāo)準(zhǔn)差,方差的正平方根。,總體標(biāo)準(zhǔn)差:,樣本標(biāo)準(zhǔn)差:,3 變異系數(shù),標(biāo)準(zhǔn)差占平均數(shù)的百分率。,CV(%)=,例:重金屬污染田小麥產(chǎn)量:250kg/mu;標(biāo)準(zhǔn)差:28kg/mu 無(wú)污染田小麥產(chǎn)量:400kg/mu;標(biāo)準(zhǔn)差:30kg/mu 問:哪種田塊小麥產(chǎn)量變異程度大?,第三節(jié) 理論分布與抽樣分布,2 頻率,定義:在大量重復(fù)試驗(yàn)中,某一事件已發(fā)生的次數(shù)占試驗(yàn)總次數(shù)的比率。,
7、特點(diǎn):一個(gè)事件的頻率不是常數(shù),但隨重復(fù)試驗(yàn)或觀察次數(shù)n增加,頻率的波動(dòng)會(huì)不斷減小,逐步趨于穩(wěn)定,此稱為頻率的穩(wěn)定性。,3 概率,定義:同一條件下,試驗(yàn)或觀察次數(shù)n無(wú)限增大,隨機(jī)事件 A 發(fā)生的頻率/ n必然穩(wěn)定接近某一常數(shù)P,P就稱為隨機(jī)事件A的概率。,性質(zhì):1)0 P(A)1 2)P(A)=1,表明該事件為必然事件; P(A)=0,表明該事件為不可能事件; 0 P(A)1,表明該事件為隨機(jī)事件。,取值:一般情況下P的取值不可能準(zhǔn)確獲得,以n充分大時(shí)事件 A 發(fā)生的頻率/ n作為P的近似值。,運(yùn)算法則: 1)若事件A的概率為P(A),那么其對(duì)立事件B的概率為: P(B)=1-P(A) 2)若事
8、件A和B是互斥的,其概率各為P(A)和P(B),那么兩事件的和事件的概率為:P(A+B)=P(A)+P(B) 3)若事件A和B是獨(dú)立的,其概率各為P(A)和P(B),那么兩事件同時(shí)出現(xiàn)的概率為:P(AB)=P(A) P(B),二、正態(tài)分布,1 概念,1)概念 正態(tài)分布隨機(jī)變量的概率密度函數(shù)(X) 為:,式中:x正態(tài)分布中的隨機(jī)變量; e2.718,是自然對(duì)數(shù)的底數(shù); 正態(tài)分布總體的平均數(shù),是曲線最高點(diǎn)的橫坐標(biāo); 正態(tài)分布總體的標(biāo)準(zhǔn)差,其大小表達(dá)曲線高低胖瘦程度。,正態(tài)分布常以記號(hào)N( , 2)來(lái)表示,當(dāng) = 0 ,=1時(shí),正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布。,2)正態(tài)分布與誤差的關(guān)系,x- 是觀察值的誤
9、差,如令: x- =,則誤差的概率密度函數(shù)為:,可見,誤差是服從正態(tài)分布的。,(3)正態(tài)分布總體的多數(shù)觀察值出現(xiàn)在算術(shù)平均數(shù)的附近;離平均數(shù)愈遠(yuǎn),出現(xiàn)的次數(shù)愈少;當(dāng) x- 3時(shí), 出現(xiàn)次數(shù)極少。,3)正態(tài)分布曲線的特點(diǎn),(1)正態(tài)分布曲線以算術(shù)平均數(shù) 為軸點(diǎn),左右對(duì)稱。說(shuō)明不論=x-為正或負(fù),絕對(duì)值相等的誤差,出現(xiàn)的概率相同。,(2)當(dāng)x=,即=0時(shí), (x) 或()的值最大,正態(tài)分布總體的算術(shù)平均數(shù)、中數(shù)和眾數(shù)是相等的,三者合一,位于x=點(diǎn)上。,(4)正態(tài)曲線在 x- 處有拐點(diǎn)。當(dāng)x +或-時(shí),曲線以x軸為漸近線左右延伸。,(5)正態(tài)曲線與x 軸之間的總面積等于1。,4)正態(tài)分布標(biāo)準(zhǔn)化,為了
10、便于計(jì)算概率,將正態(tài)分布標(biāo)準(zhǔn)化。令:,且以為度量單位,則概率密度函數(shù)可被標(biāo)準(zhǔn)化為:,式中u 叫做正態(tài)標(biāo)準(zhǔn)離差、正態(tài)離差或概率度。任何正態(tài)分布都可以根據(jù)以上變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布。,5)求正態(tài)分布總體觀察值x落入?yún)^(qū)間(a,b)的概率,(1) x N(, 2 ), x落入?yún)^(qū)間(a,b)的概率為:,則x落入?yún)^(qū)間(a,b) 的概率,亦即標(biāo)準(zhǔn)化后 u 落入?yún)^(qū)間(u1,u1)的概率:,設(shè):P (u1) 為u 落入?yún)^(qū)間(0,u1)的概率 P (u2) 為u 落入?yún)^(qū)間(0,u2)的概率,例:某地區(qū)土壤汞背景值呈正態(tài)分布: =0.108, = 0.013,求土壤汞含量在0.108至0.121之間的概率.,P =
11、 P (u2) - P (u1) = P(1) - P(0) = 0.8413 - 0.5000 = 0.3413,落入(-,+)的概率:68.3 % 落入(-2,+2)的概率:95.4 % 落入(-3,+3)的概率:99.7 % 落入(-1.96,+1.96)的概率:95 % 落入(-2.58,+2.58)的概率:99 %,6)正態(tài)分布總體觀察值x落入以下特殊區(qū)間的概率,7)小概率事件和小概率原理,在生物統(tǒng)計(jì)學(xué)中,把概率小于 5 %的事件,稱為小概率事件。 小概率事件在一次試驗(yàn)中幾乎是不可能事件,這一規(guī)律稱為小概率原理。,三、頻數(shù)與頻率分布,1 頻數(shù)與頻率分布,頻 數(shù):在一定條件下,總體或樣
12、本中某觀察 值或某區(qū)間的觀察值所出現(xiàn)的次數(shù)。 頻數(shù)分布:總體或樣本中某觀察值或某區(qū)間的觀 察值出現(xiàn)的次數(shù)在整個(gè)區(qū)間的分布情況。 頻率分布:總體或樣本中某觀察值或某區(qū)間的觀察 值出現(xiàn)的頻率在整個(gè)區(qū)間的分布情況。,2 統(tǒng)計(jì)方法,1.求出極差(R),2.確定組數(shù)(G)及組距(B) 組數(shù):n100時(shí), G:815 n 100時(shí), G:不少于6組 n 很大時(shí), G:不大于30組 組距:B = R/G 對(duì)于連續(xù)變量,組距精度與觀察值相同 對(duì)于非連續(xù)變量,組距取整數(shù),3.確定組限 組限就是每一組的上限和下限,對(duì)于連續(xù)性變量,組限的數(shù)值比原觀察值精度高一位;對(duì)于非連續(xù)性變量,與原觀察值精度相同,組限上的數(shù)值,
13、習(xí)慣上是上限不包括在本組之內(nèi)。,4.統(tǒng)計(jì)頻數(shù) 通常是采用制作頻數(shù)(頻率)分布表或頻數(shù)(頻率)分布圖的方法。,1.求出極差:R=1.41-0.76=0.65,2.確定組數(shù)(G)及組距(B) 組數(shù):G = 11 組距:B =0.65/11=0.06,3.確定組限 第1組:0.755 0.815 第2組:0.815 0.875 第3組:0.875 0.935 ,4.統(tǒng)計(jì)頻數(shù)和頻率,四、置信限與置信區(qū)間,1 概念,置信區(qū)間 在一定概率保證下,誤差的合理存在范圍或區(qū)間稱 為置信區(qū)間或置信距。區(qū)間的上下限稱為置信限。,置信概率 保證誤差合理存在范圍的概率,稱為置信概率、置 信度或置信系數(shù)。用P表示,否定區(qū)
14、間 不屬于合理誤差的范圍或區(qū)間,稱為否定區(qū)間。,否定概率 不合理誤差存在范圍或區(qū)間的概率,稱為否定概率, 或顯著性水平。用表示。,2 置信限和置信概率的用途,1)估計(jì)誤差合理存在范圍或區(qū)間,如果置信概率取95%: 當(dāng)已知時(shí),誤差 = x -的置信區(qū)間為(-1.96,1.96) 誤差 = x -的置信區(qū)間為(-1.96x ,1.96x),當(dāng)未知,為小樣本時(shí), 誤差 = x - 的置信區(qū)間為(-t0.05Sx ,t0.05Sx ),如果置信概率取99%: 當(dāng)已知時(shí),誤差 = x -的置信區(qū)間為(-2.58,2.58) 誤差 = x -的置信區(qū)間為(-2.58x ,2.58x),當(dāng)未知,為小樣本時(shí), 誤差 = x - 的置信區(qū)間為(-t0.01
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年汨羅市文學(xué)藝術(shù)服務(wù)中心公開選調(diào)工作人員備考題庫(kù)及答案詳解一套
- 2026年宣威市板橋街道公開招聘村級(jí)衛(wèi)生室鄉(xiāng)村醫(yī)生備考題庫(kù)及答案詳解參考
- 2026年中鐵七局集團(tuán)第二工程有限公司招聘?jìng)淇碱}庫(kù)及1套完整答案詳解
- 2026年北京一零一中溫泉校區(qū)招聘?jìng)淇碱}庫(kù)有答案詳解
- 2026年吐魯番市消防救援支隊(duì)面向社會(huì)公開招聘政府專職消防員16人備考題庫(kù)及完整答案詳解1套
- 完善資產(chǎn)內(nèi)控制度
- 檔案室內(nèi)控制度
- 五項(xiàng)費(fèi)用內(nèi)控制度
- 內(nèi)控制度如何匯編
- 免房租內(nèi)控制度
- 售后服務(wù)流程管理手冊(cè)
- 2020-2021學(xué)年新概念英語(yǔ)第二冊(cè)-Lesson14-同步習(xí)題(含答案)
- 混凝土構(gòu)件的配筋計(jì)算
- 國(guó)家開放大學(xué)《政治學(xué)原理》章節(jié)自檢自測(cè)題參考答案
- GB/T 5758-2023離子交換樹脂粒度、有效粒徑和均一系數(shù)的測(cè)定方法
- 防雷裝置維護(hù)保養(yǎng)制度
- 中醫(yī)治療“膏淋”醫(yī)案67例
- 黃金冶煉行業(yè)三廢處理綜述
- 統(tǒng)編版高中語(yǔ)文選擇性必修上冊(cè) 在民族復(fù)興的歷史豐碑上-2020中國(guó)抗疫記 教學(xué)課件
- GB/T 2792-2014膠粘帶剝離強(qiáng)度的試驗(yàn)方法
- 小波分析及其應(yīng)用教材課件
評(píng)論
0/150
提交評(píng)論