生物統(tǒng)計學-方差分析.ppt_第1頁
生物統(tǒng)計學-方差分析.ppt_第2頁
生物統(tǒng)計學-方差分析.ppt_第3頁
生物統(tǒng)計學-方差分析.ppt_第4頁
生物統(tǒng)計學-方差分析.ppt_第5頁
已閱讀5頁,還剩162頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第六章方差分析,重慶大學生物工程學院應用統(tǒng)計學,第一章,第一章,第二章,基本概念,方差分析:方差分析是檢驗兩個或多個樣本平均值之間差異顯著性的一種方法。實施例:為了研究生物材料的生物學特性,將該材料分成三組,分別在與成骨細胞共培養(yǎng)1、7和11天后測試細胞活性。為了避免錯誤,每組測試5個樣本,以嘗試判斷材料的生物特性。a,3,基本概念,a,4,兩個樣本的平均數(shù)據(jù)比較,1,當總體方差已知或總體方差未知時,但兩個樣本都是大樣本,2,當總體方差未知時,兩個樣本都是小樣本,a,5,例如,為了生產(chǎn)某些紡織品,要求棉纖維的平均長度超過30毫米。用n400對一個現(xiàn)有的棉花品種進行取樣,測得平均纖維長度為30.

2、2毫米,標準偏差為2.5毫米。詢問該棉花品種的纖維長度是否為分析:1)已知U檢驗2)因為只有大于30毫米才合格,單尾檢驗,解決方案:1)假設該棉花品種的纖維長度不能滿足紡織生產(chǎn)的要求。是,(2)選擇顯著水平,(3)檢查和計算,(4)推斷u為u0.05,接受H0并拒絕顯著水平的ha。也就是說,認為該棉花品種的纖維長度不符合紡織品品種的生產(chǎn)要求。a、6、為了探究不同窩中動物的出生體重是否存在差異,隨機選取了4窩,結果如下:表4不同窩中動物的出生體重(克),通過對上述數(shù)據(jù)的分析,可以判斷不同窩中動物的出生體重是否存在差異。a,7,方差分析的顯著性,k個樣本平均值的比較:如果t檢驗或u檢驗仍在使用,則

3、比較的次數(shù)為:例如,4個樣本平均值的比較次數(shù)為6次。假設每次比較確定的檢驗水平為0.05,拒絕H0犯第一類錯誤的概率為1-0.05=0.95;那么在六次測試中沒有犯第一類錯誤的概率是(1-0.05)6=0.7351,而犯第一類錯誤的概率是0.2649,a,8。方差分析的意義,K樣本均值的比較:如果仍然使用T檢驗或U檢驗,存在以下問題:1。測試過程很繁瑣。沒有統(tǒng)一的測試誤差和誤差估計。犯第一類錯誤的概率增加。a,9,ANOVA :是一種特定情況下的統(tǒng)計假設檢驗,或者是均值差異顯著性檢驗的擴展。u檢驗和T檢驗可以判斷兩組數(shù)據(jù)平均值之間差異的顯著性,而方差分析可以同時判斷多組數(shù)據(jù)平均值之間差異的顯著

4、性。當然,當比較多組數(shù)據(jù)的平均值時,你可以在所有的平均值對之間做T檢驗。但是這樣做會增加出錯的可能性,所以這是不可取的。方差分析是由英國統(tǒng)計學家費希爾提出的。為了紀念費希爾,它以F命名,所以方差分析也被稱為F檢驗。用于推斷多個總體均值之間是否存在差異,a,11,方差分析的定義,這是一種檢驗兩個或多個樣本均值之間差異顯著性的方法。根據(jù)變化源將測量數(shù)據(jù)的總變化分解為處理效果和測試誤差,并對其進行定量估計。它將所有經(jīng)過處理的觀察結果作為一個整體,經(jīng)過一次比較后,判斷許多組之間的平均樣本數(shù)是否有差異。如果差異不顯著,則認為它們是相同的。如果差異顯著,進一步比較哪組數(shù)據(jù)不同于其他數(shù)據(jù)。,a,12,方差分

5、析的意義,方差分析的基本思想:1。將k個群體視為一個整體;2.將觀測值總變化的平方和和和自由度分成不同來源的平方和和和自由度;3.計算不同方差估計的比率;4.檢查每個樣本的平均數(shù)是否相等實際上是對觀察值變化原因的定量分析;a,13。方差分析的應用條件和用途。方差分析的應用條件:1。每個樣本必須是獨立的隨機樣本2。每個樣本來自正態(tài)分布總體3。每個總體方差是相等的,也就是說,方差是同質(zhì)的。方差分析的基本用途是:1。多個樣本平均數(shù)量的比較2。多種因素的相互作用?;貧w方程4的假設檢驗。方差齊性檢驗,a,14。方差分析的基本原理。試驗指標日增重、產(chǎn)仔數(shù)和瘦肉率的試驗因素:影響試驗指標的因素,也稱為加工因

6、素,或簡稱因素。1.可控因素(固定因素):人工可控;2.不可控因素(隨機因素):不能人為控制的測試因素的表達:大寫字母A、B、C等。1.相關術語,a,16,因子水平:測試因子的具體狀態(tài)或數(shù)量水平。稱為水平表達法:在代表該因子的字母上加上下標,如A1、A2、B1、B2測試處理:測試單元中實施的具體項目,簡稱處理。單變量:實驗因素的水平多因素:實驗因素的水平組合;1.相關術語,a,17,實驗單元:實驗載體,即根據(jù)研究目的確定的觀察總體重復:一個治療在兩個或兩個以上的實驗單元中實施,稱為治療重復。測試單元的數(shù)量稱為治療的重復次數(shù)。首先,相關術語,a,18。方差分析是一種關于k(k3)樣本平均數(shù)的假設

7、檢驗方法,它根據(jù)來源將總變異分為處理效果和檢驗誤差,并對其進行定量估計。一種統(tǒng)計分析方法,用于找出總變異中每個變異原因的相對重要性。第二,方差分析的基本原理,a,19,總方差分解為組間方差和組內(nèi)方差。群體內(nèi)的差異是由個體差異和抽樣誤差引起的。組之間的差異可能由兩個原因引起,一是抽樣誤差;第二,待遇不同。抽樣誤差在抽樣研究中是不可避免的,因此群體間變異的第一個原因必須存在;第二個原因是否存在需要通過假設檢驗來推斷。第二,方差分析的基本原理,a、20和第三,數(shù)學模型,每組中具有N個觀察值的K組樣本的數(shù)據(jù),a、21和實施例2.1調(diào)查了五個不同小麥品系的株高,結果列于表21。在這個例子中,只有一個因素

8、,如“應變”,所以它被稱為單一因素。有五種不同的菌株,我們稱之為五級因子。五個菌株可以被認為是五個群體,表21中的數(shù)據(jù)是從五個群體中提取的五個樣品。通過比較這五個樣本,我們可以判斷這五個群體之間是否存在差異。表21五個小麥品系的株高調(diào)查結果,a,22,實施例2.2為了探討不同巢中動物的出生體重是否存在差異,隨機選擇了4窩,結果如下:表22 4窩動物的出生體重(克)。A,23,上述兩個例子的共同點是每個實驗只有一個因素,即有A級或A級處理,這樣的實驗稱為單因素實驗。從單因素實驗的每個處理中獲得的結果是隨機變量1。對于處理,具有N次重復(或N次觀察)的單向方差分析的通用表達方法如表23所示。表23

9、單因素方差分析的典型數(shù)據(jù)、a、24,每個觀察值可以用以下常用的所謂線性統(tǒng)計模型來描述:其中:xij是第I級(治療)下的第j個觀察值。是所有觀察值的參數(shù),稱為總體平均值。I是限于ith治療的參數(shù),稱為ith治療效果。方差分析的目的是檢驗治療效果的大小或存在。Eij是一個隨機誤差分量。a,25,在上述模型中,有兩種不同的處理效果。第一種治療效果稱為固定效果,它是由固定因素引起的。如果一個因素的水平是故意選擇的,那么這個因素被稱為固定因素。例如,幾種不同的實驗溫度、幾種不同的化學物質(zhì)或不同濃度的藥物、幾種作物品種、幾種不同的治療方案和治療效果等。a,26,在這些情況下,因子的水平被特別選擇,并且關于

10、ai的假設被檢驗,并且結論僅適用于方差分析中考慮的那些水平,并且不能不考慮而擴展到其他類似的水平。因此,以上因素:溫度、藥物、品種等。被稱為固定因子。用來處理這些因素的模型被稱為固定效應模型。例2.1中的五個小麥品系是特意選擇的,以便從這五個品系中選出最好的一個,因此“品系”的因子是一個固定的因子,所用的模型是一個固定效應模型。第二種加工效應叫做隨機效應,它是由隨機因素引起的。如果一個因子的A水平是從該因子的所有水平的整體中隨機選擇的樣本,則該因子被稱為隨機因子。從A級隨機因素得到的結論可以推廣到該因素的所有級別。用于處理隨機因素的模型稱為隨機效應模型。實施例2.2中的動物巢是從所有可能的動物

11、巢中隨機選擇的。這個實驗的目的是檢驗巢與巢之間出生體重是否有差異,所以“巢”是一個隨機因素。有時很難區(qū)分固定因素和隨機因素。除了上面提到的原則,它還可以從另一個角度加以區(qū)分。固定因素是指可以人為嚴格控制的因素水平。等級固定后,其效果值也是固定的。例如,研究了三種溫度對胰蛋白酶水解產(chǎn)物的影響。因為溫度水平可以被嚴格控制,即每個溫度水平可以在重復之間被精確地控制在固定值,所以當重復實驗時,水解產(chǎn)物的產(chǎn)率也是固定的。簡單地說,在水平(不同的溫度)固定后,它的效果值(輸出)也是固定的。因此,溫度是一個固定的因素。隨機因素的水平不能人為嚴格控制,水平確定后其影響值也不是固定的。例如,在研究不同施用量的農(nóng)

12、家肥對作物產(chǎn)量的影響的實驗中,農(nóng)家肥是一個因素,不同的施用量是該因素的不同水平,作物產(chǎn)量是其影響值。由于農(nóng)家肥的有效成分非常復雜,農(nóng)家肥的有效成分不能像溫度控制那樣嚴格控制在某個固定值。即使在重復試驗中施用相同量的肥料,也不能獲得固定的效果值。也就是說,在因素水平(施肥量)固定后,其影響值(產(chǎn)量)也不固定,所以農(nóng)家肥是一個隨機因素。a,30,3。數(shù)學模型,a,31,3。數(shù)學模型、a、33、4。平方和與自由度的分解。所有觀測值的總變化可以用總體方差來衡量。方差或均方是偏離平均值的平方和除以自由度。為了根據(jù)變化源將實驗數(shù)據(jù)的總變化分解成相應的變化,首先,平方和和和總自由度應該分解成每個變化源的相應

13、部分。然后可以研究總方差:a,34,4,平方和與自由度的分解,平方和的分解:總平方和=加工之間的平方和與加工內(nèi)的平方和,a,35,4,平方和與自由度的分解,自由度的分解:總自由度=加工之間的自由度與加工內(nèi)的自由度,a,36,5.統(tǒng)計學假設的顯著性檢驗f檢驗,f檢驗的目的是:推斷治療之間是否存在差異,a,38,5。統(tǒng)計假設的顯著性檢驗f檢驗,注:方差分析中的f檢驗總是單尾檢驗,而且是右尾檢驗。a、39、F越大,組間方差越大,是方差的主要來源,因子影響越顯著。f越小,表明隨機方差是方差的主要來源,而因子的影響越小。五、統(tǒng)計假設的顯著性檢驗F檢驗,a,40。為了比較四種不同的配合飼料對魚類的飼喂效果

14、,一個漁業(yè)研究所選取了20種條件基本相同的魚類,隨機分為四組,分別飼喂不同的飼料。一個月后,各組魚的增重數(shù)據(jù)如下表所示。分析:1因子,4水平,5重復方差分析,A,41,解:A,42,A,43,不同飼料飼養(yǎng)的魚增重方差分析表,A,44,II。固定效應模型在固定效應模型中,ai是被處理的平均值和總平均值之間的偏差,它是一個常數(shù),因此應該進行測試。如果每個ai等于0,則處理效果之間沒有差異。因此,零假設是:替代假設是:ha: ai0(至少一個I)。如果H0被接受,則沒有治療效果,并且每個觀察值由平均值加上隨機誤差組成。如果H0被拒絕,則存在加工效應,每個觀察值由三部分組成:總平均值、加工效應和誤差。

15、a、45和實施例2.1調(diào)查了五個不同小麥品系的株高,結果列于表21。在這個例子中,只有一個因素,如“應變”,所以它被稱為單一因素。有五種不同的菌株,我們稱之為五級因子。五個菌株可以被認為是五個群體,表24中的數(shù)據(jù)是從五個群體中提取的五個樣品。通過比較這五個樣本,我們可以判斷這五個群體之間是否存在差異。表21 5個小麥品系的株高調(diào)查結果,a,46,解法:在方差分析中,可采用編碼法簡化計算。在方差分析的編碼中,必須從所有數(shù)據(jù)中減去相同的公共數(shù)。在情況2.1中,每個xij減去65,如下表a,47所示。首先計算校正項c,然后計算,a,48,并將以上結果列在方差分析表(見表25)中:表25不同小麥品系株

16、高的方差分析表,* FF0.01,當分子自由度為4,分母自由度為20時,F(xiàn)4。因此,不同小麥品系的株高存在顯著差異。傳統(tǒng)上,“*”表示0.05水平的顯著差異,“* *”表示0.01水平的顯著差異,通常稱為“高度顯著”。隨機效應模型在實驗中,某個因素有許多可能的水平。如果參加實驗的A水平是從因子的總體水平中隨機選擇的,那么這個因子就叫做隨機因子。方差分析是通過隨機選擇的A水平來推斷這個因素的總體水平。所需層次的總體是一個完美的總體,即使它不是一個無限的總體,它也應該如此之大,以至于它可以被視為一個無限的總體。實施例2.2中動物的“巢”是隨機因素,每個巢是一個等級,該動物的所有巢構成一個等級群體。從該群體中隨機選擇四個水平(四窩)進行實驗。實驗的目的是推斷這種動物的所有不同產(chǎn)仔的出生體重是否有差異。a,50,固定效應模型中ai0的假設在這里不再適用。在隨機模型中,檢驗單一治療的效果是沒有意義的,關于人工智

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論