版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
生物統(tǒng)計(jì)與試驗(yàn)設(shè)計(jì)
第一章概論
生物統(tǒng)計(jì)學(xué)常用術(shù)語(yǔ)
生物統(tǒng)計(jì)學(xué)的內(nèi)容
生物統(tǒng)計(jì)學(xué)的特點(diǎn)
生物統(tǒng)計(jì)學(xué)的概念第一節(jié)生物統(tǒng)計(jì)學(xué)的概念生物統(tǒng)計(jì)學(xué)(biostatistics)就是用概率論和數(shù)理統(tǒng)計(jì)學(xué)的原理與方法來(lái)處理生物學(xué)資料的學(xué)科■達(dá)爾文時(shí)代以前的生物學(xué),一般以描述為主顏色形狀大小羽色冠形體格白羽黑羽黃羽橫斑紋白來(lái)航雞
狼山雞正陽(yáng)三黃雞
蘆花雞
單冠豆冠玫瑰冠草莓冠茶花雞舊院黑雞
泰和烏雞♂
泰和烏雞♀大型雞小型雞蕭山雞
矮小雞
■隨著生物學(xué)的發(fā)展,描述已無(wú)法滿足科學(xué)研究的需要,于是就有了度量有了度量以后就產(chǎn)生了大量的數(shù)據(jù)資料,那么,如何來(lái)處理、分析這些看似雜亂無(wú)章的數(shù)據(jù)資料,并且發(fā)現(xiàn)其內(nèi)在的規(guī)律采用一般的數(shù)學(xué)方法來(lái)進(jìn)行計(jì)算用概率論和數(shù)理統(tǒng)計(jì)學(xué)的原理與方法生物統(tǒng)計(jì)學(xué)是動(dòng)物科學(xué)生產(chǎn)實(shí)踐和科學(xué)研究中必不可少的工具,現(xiàn)已被廣泛應(yīng)用于各個(gè)方面:
動(dòng)物育種學(xué)
動(dòng)物遺傳學(xué)
動(dòng)物營(yíng)養(yǎng)學(xué)
動(dòng)物生產(chǎn)學(xué)
動(dòng)物繁殖學(xué)在國(guó)外特別是經(jīng)濟(jì)發(fā)達(dá)的國(guó)家,生物統(tǒng)計(jì)學(xué)已經(jīng)滲透到生物學(xué)相關(guān)的各個(gè)領(lǐng)域課題申請(qǐng)論文審稿新藥研發(fā)專設(shè)機(jī)構(gòu)生物統(tǒng)計(jì)學(xué)的思維和方法已經(jīng)滲透到動(dòng)物生產(chǎn)實(shí)踐和科學(xué)研究之中與國(guó)外相比,國(guó)內(nèi)缺乏從事生物統(tǒng)計(jì)學(xué)研究的專業(yè)人員
《畜牧與獸醫(yī)》雜志的審稿
與農(nóng)業(yè)部動(dòng)物檢疫所(青島)的合作
本科畢業(yè)論文答辯孟德爾遺傳定律、生物進(jìn)化理論、分子數(shù)量遺傳學(xué)和生物信息學(xué)等,它們的發(fā)現(xiàn)、誕生和發(fā)展,都離不開生物統(tǒng)計(jì)學(xué)的參與隨著分子生物學(xué)的發(fā)展,生物統(tǒng)計(jì)學(xué)越來(lái)越顯示出它的重要性第二節(jié)生物統(tǒng)計(jì)學(xué)的特點(diǎn)1.概率性(Probability)2.二元性(Duality)3.歸納性(Induction)1.概率性生物學(xué)數(shù)據(jù)具有變異性針對(duì)生物性狀進(jìn)行研究得出一個(gè)結(jié)論時(shí),這個(gè)結(jié)論的正確性往往是相對(duì)的、有條件的,這個(gè)條件可以用概率值來(lái)表示不能通過(guò)描述性的定性科學(xué)或決定性的數(shù)量科學(xué)來(lái)解決生物學(xué)領(lǐng)域中的很多問(wèn)題
動(dòng)物的血液是紅色的冰魚的血液是黃色的馬蹄蟹的血液是藍(lán)色的天下烏鴉一般黑
形容萬(wàn)惡的舊社會(huì)官官相護(hù)2004年《央視國(guó)際》報(bào)道:在印度南部的一個(gè)小村莊發(fā)現(xiàn)了一只白色的烏鴉出現(xiàn)了白色的烏鴉,就認(rèn)為“天下烏鴉一般黑”的觀點(diǎn)就是錯(cuò)誤的出現(xiàn)了黃色血液的冰魚,就認(rèn)為“動(dòng)物的血液是紅色的”的結(jié)論是不正確的
按照某些學(xué)科的推理,如果出現(xiàn)反例就必須要否定原來(lái)的結(jié)論如果從生物統(tǒng)計(jì)學(xué)的角度來(lái)看,結(jié)果會(huì)完全不同至少有95%以上的動(dòng)物的血液是紅色的至少有99%以上的烏鴉的羽色是黑色的■經(jīng)典數(shù)學(xué)的計(jì)算結(jié)果是絕對(duì)的、明確的,也是唯一的■生物統(tǒng)計(jì)學(xué)從復(fù)雜多變的生物性狀中得出的結(jié)論一般都只能在一定的概率保證下認(rèn)為是正確的,同時(shí)得到的結(jié)果也不是唯一的生物統(tǒng)計(jì)學(xué)不同于經(jīng)典數(shù)學(xué)現(xiàn)在概率的思想越來(lái)越深入到每個(gè)人的生活中
午后有陣雨,雷雨時(shí)短時(shí)陣風(fēng)……降水概率75%,東南風(fēng)轉(zhuǎn)西北風(fēng)……2.二元性■生物統(tǒng)計(jì)學(xué)的理論體系——概率論■大量的、來(lái)源于生產(chǎn)實(shí)踐的數(shù)據(jù)資料生物統(tǒng)計(jì)學(xué)是理論與實(shí)踐并重的一門學(xué)科,有時(shí)處理實(shí)踐資料甚至重于理論指導(dǎo)生物統(tǒng)計(jì)學(xué)的二元性:理論與實(shí)踐并重理論與實(shí)踐密切結(jié)合3.歸納性理論上我們總希望能獲得并處理具有同一性質(zhì)的所有資料歸納性是生物統(tǒng)計(jì)學(xué)的主要精神,簡(jiǎn)單地說(shuō)就是從部分資料(統(tǒng)計(jì)學(xué)中稱為樣本)中歸納出一般性的原理并把它應(yīng)用到較大的范圍(總體)豬鏈球菌病研究
四川地區(qū)病人主要是通過(guò)接觸性的傷口感染豬鏈球菌病人感染豬鏈球菌病,主要是通過(guò)接觸性的傷口傳播
廣東東京紐約在科學(xué)研究和生產(chǎn)實(shí)踐中只能獲得其中很小的、但具有代表性的一部分個(gè)體來(lái)進(jìn)行研究、分析和處理第三節(jié)生物統(tǒng)計(jì)學(xué)的主要內(nèi)容生物統(tǒng)計(jì)學(xué)是動(dòng)物科學(xué)專業(yè)的專業(yè)基礎(chǔ)課程生物統(tǒng)計(jì)學(xué)主要包括兩大部分內(nèi)容:1.統(tǒng)計(jì)部分1.1描述性統(tǒng)計(jì)主要是數(shù)據(jù)資料的整理、分析,是生物統(tǒng)計(jì)學(xué)的基礎(chǔ)內(nèi)容(1)數(shù)據(jù)資料的整理(2)數(shù)據(jù)資料特征值的計(jì)算(3)概率分布和抽樣分布1.2統(tǒng)計(jì)推斷又稱假設(shè)檢驗(yàn),是生物統(tǒng)計(jì)學(xué)的核心內(nèi)容
(1)t-檢驗(yàn)主要用于檢驗(yàn)2個(gè)平均數(shù)間差異是否顯著(2)χ2-檢驗(yàn)主要用于檢驗(yàn)由質(zhì)量性狀得來(lái)的次數(shù)資料的顯著性(3)F-檢驗(yàn)主要用于檢驗(yàn)多個(gè)平均數(shù)間差異是否顯著(4)非參數(shù)檢驗(yàn)主要用于檢驗(yàn)樣本容量小、未知分布資料的顯著性1.3相關(guān)與回歸分析通過(guò)對(duì)數(shù)據(jù)資料的相關(guān)、回歸分析,揭示出試驗(yàn)指標(biāo)間的內(nèi)在聯(lián)系,為動(dòng)物生產(chǎn)提供強(qiáng)有力的依據(jù)(1)簡(jiǎn)單相關(guān)(2)簡(jiǎn)單回歸(3)曲線回歸(4)多元回歸2.試驗(yàn)設(shè)計(jì)部分主要是試驗(yàn)設(shè)計(jì)的基本原理、方法
完全隨機(jī)設(shè)計(jì)
配對(duì)設(shè)計(jì)
拉丁方設(shè)計(jì)
正交設(shè)計(jì)
隨機(jī)區(qū)組設(shè)計(jì)
交叉設(shè)計(jì)第四節(jié)生物統(tǒng)計(jì)學(xué)常用術(shù)語(yǔ)1.變量與觀測(cè)值變量(variable)是指不同個(gè)體間表現(xiàn)變異性的某種特征對(duì)于一個(gè)個(gè)體來(lái)說(shuō),通過(guò)度量所得到的某一變量的具有變異性質(zhì)的數(shù)值就稱為觀測(cè)值(observation)2.總體與樣本總體(population)是指研究的全部對(duì)象,即具有相同性質(zhì)的觀測(cè)值所組成的的集合相似的生物體所組成的集合,如同一物種,不是統(tǒng)計(jì)學(xué)意義上的總體只有相似生物體所具有的某一相同性狀所表現(xiàn)出來(lái)的值的集合才能作為統(tǒng)計(jì)學(xué)中的總體禽流感雞的產(chǎn)蛋量總體中的每一個(gè)研究對(duì)象稱為個(gè)體(individual)無(wú)限總體既有時(shí)間內(nèi)涵,又有空間(地域)內(nèi)涵。當(dāng)我們把某一總體限定于某一時(shí)間、某一地域時(shí),無(wú)限總體就成了有限總體
總體按所含的個(gè)體數(shù)量可以分為無(wú)限總體和有限總體無(wú)限總體2005年遼寧黑山有限總體
總體按研究對(duì)象又可以分為現(xiàn)實(shí)總體和假想總體
豬鏈球菌病2型疫苗的免疫效果假想這一部分被試豬就來(lái)自于已注射新疫苗的豬的總體這一總體在疫苗推廣之前并不存在假想總體當(dāng)新疫苗試驗(yàn)成功并加以推廣后這一總體就存在了現(xiàn)實(shí)總體(1)總體往往是無(wú)限的、假想的■在實(shí)際工作中不可能對(duì)總體中所有的觀測(cè)值一一加以考察,而只能對(duì)其中具有代表性的一小部分觀測(cè)值進(jìn)行研究(2)有限的總體有時(shí)也包含數(shù)目相當(dāng)多的個(gè)體,要獲得全部觀測(cè)值需花費(fèi)大量人力、物力和時(shí)間(3)有些性狀的測(cè)定、觀測(cè)值的獲得帶有破壞性樣本(sample)就是從總體中抽得的一部分具有代表性的觀測(cè)值所組成的子集為了使所得到的樣本能無(wú)偏地估計(jì)總體,必須使總體中每一觀測(cè)值都有同等的機(jī)會(huì)進(jìn)入樣本,這種抽樣方法稱為隨機(jī)抽樣(randomsampling)隨機(jī)抽樣法所得到的樣本稱為隨機(jī)樣本(randomsample)樣本中所包含的觀測(cè)值的個(gè)數(shù),稱為樣本容量
用n表示有限總體的大小(總體容量),用N表示n≤30的樣本稱為小樣本n>30的稱為大樣本◆原則:大動(dòng)物樣本容量可小一些,小動(dòng)物樣本容量可適當(dāng)大一些3.參數(shù)與統(tǒng)計(jì)量反映數(shù)據(jù)集中趨勢(shì)的總體平均數(shù)參數(shù)(parameter):由總體各觀測(cè)值所獲得的、用來(lái)描述總體特征的數(shù)值反映數(shù)據(jù)變異程度的總體標(biāo)準(zhǔn)差◆參數(shù)是一個(gè)真值、一個(gè)定值,不變化用σ表示用μ表示統(tǒng)計(jì)量(statistic):由樣本各觀測(cè)值計(jì)算得到的、用來(lái)描述樣本特征的數(shù)值樣本平均數(shù)
樣本標(biāo)準(zhǔn)差用S表示◆統(tǒng)計(jì)量是變化的,不固定的用
表示統(tǒng)計(jì)量和參數(shù)的關(guān)系
從同一總體中抽取不同的樣本所計(jì)算得到的同一性質(zhì)的統(tǒng)計(jì)量是不相同的,但這些統(tǒng)計(jì)量都可以用來(lái)估計(jì)相應(yīng)的參數(shù)
在絕大多數(shù)情況下,參數(shù)很難直接由計(jì)算得到,而只能通過(guò)樣本的統(tǒng)計(jì)量來(lái)進(jìn)行估計(jì)4.準(zhǔn)確度與精確度準(zhǔn)確度(accuracy)也稱為準(zhǔn)確性,是指觀測(cè)值與真值接近的程度精確度(precise)也稱為精確性,指在同一處理?xiàng)l件下,同一批觀測(cè)值間相互接近的程度■準(zhǔn)確度高、精確度高在很多情況下,準(zhǔn)確度和精確度兩者往往不可兼得,因此在制訂試驗(yàn)方案或進(jìn)行試驗(yàn)時(shí),應(yīng)當(dāng)很好地加以權(quán)衡■準(zhǔn)確度低、精確度低■準(zhǔn)確度低、精確度高原則上,可以適當(dāng)放棄一些精確度以保證足夠的準(zhǔn)確度5.隨機(jī)誤差和系統(tǒng)誤差誤差(error):試驗(yàn)結(jié)果和真值之間的差異和偏離5.1隨機(jī)誤差隨機(jī)誤差(randomerror)又稱為偶然誤差,是指由各種偶然因素引起的、無(wú)法加以預(yù)測(cè)和控制的無(wú)規(guī)律的偏差(1)偶然性隨機(jī)誤差的性質(zhì):(2)恒在性(3)獨(dú)立性(4)影響精確度
隨機(jī)誤差是進(jìn)行統(tǒng)計(jì)假設(shè)檢驗(yàn)的基礎(chǔ),沒有隨機(jī)誤差就沒有統(tǒng)計(jì)假設(shè)檢驗(yàn)
生物統(tǒng)計(jì)學(xué)就是為誤差而誕生的,生物統(tǒng)計(jì)學(xué)的全部意義就是處理和估計(jì)誤差5.2系統(tǒng)誤差系統(tǒng)誤差(systematicerror)也稱為片面誤差,是指由于某些特定的非試驗(yàn)條件所造成的使試驗(yàn)結(jié)果朝某一個(gè)方向發(fā)生有規(guī)律的偏移(1)度量工具的不正確(5)試驗(yàn)人員操作或觀測(cè)時(shí)的偏愛和習(xí)慣(2)試驗(yàn)儀器未經(jīng)校正(3)外界試驗(yàn)條件發(fā)生了很大的變化(4)觀測(cè)時(shí)間的影響(6)試驗(yàn)動(dòng)物分組時(shí)發(fā)生的偏差■當(dāng)發(fā)生系統(tǒng)誤差時(shí),觀測(cè)值都會(huì)有規(guī)律地向某一個(gè)方向偏離真值,因而降低了試驗(yàn)的準(zhǔn)確度。系統(tǒng)誤差是可以被消除的生物學(xué)數(shù)據(jù)資料(觀測(cè)值)的分布具有兩個(gè)重要的特征:
集中性
離散性
觀測(cè)值向中心位置聚集的趨勢(shì)反映數(shù)據(jù)資料集中性的特征值是平均數(shù)觀測(cè)值偏離中心位置的分散情況反映數(shù)據(jù)資料離散性的特征值是極差、方差、標(biāo)準(zhǔn)差和變異系數(shù)等眾數(shù)算術(shù)平均數(shù)幾何平均數(shù)調(diào)和平均數(shù)中位數(shù)第一節(jié)集中性特征值平均數(shù)(mean)是統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,用來(lái)表明數(shù)據(jù)中各觀測(cè)值相對(duì)集中較多的中心位置,反映了一組觀察值的平均水平,是一組數(shù)據(jù)資料的代表值
可以用來(lái)說(shuō)明一組數(shù)據(jù)資料的平均水平或集中趨勢(shì),具有典型性
可以用來(lái)進(jìn)行組間比較,以判斷一組數(shù)據(jù)資料與另一組數(shù)據(jù)資料的差別,具有代表性平均數(shù)的作用:1.算術(shù)平均數(shù)算術(shù)平均數(shù)(arithmeticmean):數(shù)據(jù)資料中各觀測(cè)值的總和除以觀測(cè)值的個(gè)數(shù)所得的商,簡(jiǎn)稱平均數(shù)或均數(shù)。記為1.1基本概念■算術(shù)平均數(shù)適合描述對(duì)稱分布資料的集中趨勢(shì)1.2計(jì)算公式觀測(cè)值為:x1,x2,…,xn,則:對(duì)于總體來(lái)說(shuō),則有:設(shè)有一隨機(jī)變量x,1.3重要性質(zhì)
樣本各觀測(cè)值與平均數(shù)之差的和為0,即離均差之和為0
證明
樣本各觀測(cè)值與平均數(shù)之差的平方和為最小,即離均差平方和最小
證明則有:1.4加權(quán)平均數(shù)對(duì)于樣本容量≥30且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計(jì)算平均數(shù)xi—第i組的組中值
fi—第i組的次數(shù)
k—組數(shù)
采用加權(quán)法計(jì)算得到的平均數(shù)就稱為加權(quán)平均數(shù)(weightedmean)
加權(quán)平均數(shù)不具備算術(shù)平均數(shù)的兩個(gè)性質(zhì)幾何平均數(shù)(geometricmean):n個(gè)觀測(cè)值相乘之積的n次方根■適用于利率、畜禽數(shù)的增長(zhǎng)率、藥物的效價(jià)、抗體的滴度等非線性數(shù)據(jù)例1為研究人群中流感的抗體水平,測(cè)得12名兒童的血清對(duì)流感病毒的血凝抑制抗體效價(jià)的倒數(shù)為:5,5,5,5,5,5,5,10,10,10,20,40,試計(jì)算平均血凝抑制抗體效價(jià)。解:
答:平均血凝抑制抗體效價(jià)約為1∶8平均血凝抑制抗體效價(jià)約為1∶10
2.幾何平均數(shù)3.調(diào)和平均數(shù)調(diào)和平均數(shù)(harmonicmean):資料中各觀測(cè)值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)■調(diào)和平均數(shù)主要適用于速度類的資料,或有個(gè)別極端大觀測(cè)值的數(shù)據(jù)資料4.中位數(shù)中位數(shù)(median):將資料中所有觀測(cè)值按從小到大依次排列,位于中間位置的那個(gè)觀測(cè)值,簡(jiǎn)稱為中數(shù)5.眾數(shù)眾數(shù)(mode):在數(shù)據(jù)資料中出現(xiàn)次數(shù)最多的一個(gè)觀測(cè)值或次數(shù)最多一組的組中值
有的資料可出現(xiàn)多個(gè)眾數(shù)當(dāng)觀測(cè)值的個(gè)數(shù)是偶數(shù)時(shí),以中間兩個(gè)觀測(cè)值的平均數(shù)作為中位數(shù)
■數(shù)據(jù)資料呈偏態(tài)分布或分布情況不清楚時(shí),中位數(shù)的代表性優(yōu)于算術(shù)平均數(shù)
有的資料則沒有眾數(shù)第二節(jié)離散性特征值平均數(shù)主要是用來(lái)說(shuō)明數(shù)據(jù)的集中趨勢(shì)和集中程度的,是一組數(shù)據(jù)的代表值平均數(shù)的代表性如何,還要看數(shù)據(jù)的變異情況:
數(shù)據(jù)越是集中,
則平均數(shù)的代表性就越強(qiáng)
僅用平均數(shù)對(duì)一個(gè)數(shù)據(jù)資料的特征進(jìn)行統(tǒng)計(jì)描述是不完善的,還必須要有另外一個(gè)統(tǒng)計(jì)量來(lái)衡量數(shù)據(jù)變異程度的大小、說(shuō)明平均數(shù)的代表性
數(shù)據(jù)越是分散(離散),則平均數(shù)的代表性就越弱
用來(lái)衡量數(shù)據(jù)變異程度的統(tǒng)計(jì)量有很多,常用的有:極差、方差、標(biāo)準(zhǔn)差和變異系數(shù)1.極差
極差(range):數(shù)據(jù)資料中最大觀測(cè)值與最小觀測(cè)值之間的差■極差主要用來(lái)說(shuō)明傳染病和食物中毒的最短、最長(zhǎng)潛伏期(1)沒有充分利用數(shù)據(jù)中全部觀測(cè)值的信息
優(yōu)點(diǎn):極差是衡量數(shù)據(jù)資料變異程度大小的最簡(jiǎn)便的統(tǒng)計(jì)量
缺點(diǎn):(2)不能準(zhǔn)確反映數(shù)據(jù)中各觀測(cè)值的分布狀況(3)樣本之間難以進(jìn)行比較(4)極差的抽樣誤差較大,不穩(wěn)定2.方差
極差:僅用全部觀測(cè)值中較為特殊的兩個(gè)點(diǎn)值,比較粗糙充分利用數(shù)據(jù)資料中的每一個(gè)觀測(cè)值,將每一觀測(cè)值都和某一個(gè)特定的值相比,可以求出每一個(gè)觀測(cè)值與平均數(shù)的差值,即離均差有多少個(gè)觀測(cè)值就可以得到多少個(gè)離均差,還是不能說(shuō)明整個(gè)數(shù)據(jù)資料的變異程度將各個(gè)離均差相加是最簡(jiǎn)單的方法,■可以用離均差平方和來(lái)衡量數(shù)據(jù)的變異程度僅僅進(jìn)行簡(jiǎn)單地相加,還是不能反映數(shù)據(jù)資料中所有觀測(cè)值的總偏離程度
最理想的特定值就是平均數(shù)根據(jù)平均數(shù)的第二個(gè)性質(zhì)可知,離均差平方和最小,也就是說(shuō)將離均差平方后相加之和是最穩(wěn)定的一個(gè)值,而且這個(gè)值不等于0
離均差平方和簡(jiǎn)稱為平方和(sumofsquares),用SS表示
樣本平方和:總體平方和:用平方和衡量數(shù)據(jù)的變異程度:
離均差平方和消除了離均差正、負(fù)值的影響
離均差平方和的大小除了與變異程度有關(guān)外,還隨樣本容量的大小而改變?yōu)榱讼龢颖救萘看笮〉挠绊?,可以取其平均?shù),即用平方和除以樣本容量,即平方和的平均數(shù)稱為方差(variance)
為了使所得的統(tǒng)計(jì)量是相應(yīng)總體參數(shù)的無(wú)偏估計(jì)量,在求離均差平方和的平均數(shù)時(shí),分母不用樣本容量n,而用自由度n-1
樣本方差:總體方差:樣本均方S2是總體方差σ2的無(wú)偏估計(jì)值3.標(biāo)準(zhǔn)差
用方差衡量數(shù)據(jù)的變異程度:■同類資料進(jìn)行比較時(shí),方差越大就意味著數(shù)據(jù)資料的變異程度越大,因此方差是衡量數(shù)據(jù)資料變異程度的一個(gè)重要指標(biāo)
■方差是通過(guò)平方求和得來(lái)的,在對(duì)觀測(cè)值進(jìn)行平方的同時(shí),它的單位也相應(yīng)地進(jìn)行了平方,因此在實(shí)際應(yīng)用時(shí)很不方便樣本方差S2的平方根稱為樣本標(biāo)準(zhǔn)差(standarddeviation)3.1關(guān)于自由度的討論(1)對(duì)于樣本容量為n的樣本來(lái)說(shuō),每一個(gè)觀測(cè)值都要與平均數(shù)相比,都有一個(gè)離均差,即有n個(gè)離均差,但由于受到“離均差之和為0”的限制,其中只有n-1個(gè)離均差是自由的,有一個(gè)離均差必定失去自由(2)在統(tǒng)計(jì)學(xué)中,計(jì)算某個(gè)統(tǒng)計(jì)量時(shí),如果該統(tǒng)計(jì)量受到了k個(gè)條件的限制,那么它的自由度就為n-k
(3)使用自由度的目的之一就是為了使樣本方差能無(wú)偏地估計(jì)總體方差
總體方差σ2的平方根稱為總體標(biāo)準(zhǔn)差3.2標(biāo)準(zhǔn)差的計(jì)算
(1)直接法對(duì)于未分組或小樣本資料,可用標(biāo)準(zhǔn)差的概念公式來(lái)直接計(jì)算:
(2)校正值法大樣本資料一般采用校正值法(3)加權(quán)法對(duì)于分組資料可用加權(quán)法計(jì)算標(biāo)準(zhǔn)差:
3.3標(biāo)準(zhǔn)差的性質(zhì)(1)標(biāo)準(zhǔn)差的大小,受數(shù)據(jù)資料中每個(gè)觀測(cè)值的影響觀測(cè)值間變異大,標(biāo)準(zhǔn)差大;觀測(cè)值間變異小,則標(biāo)準(zhǔn)差?。?)各觀測(cè)值同時(shí)加減一個(gè)常數(shù),標(biāo)準(zhǔn)差不變(3)各觀測(cè)值乘上一個(gè)常數(shù)a,所得標(biāo)準(zhǔn)差將擴(kuò)大a倍,各觀測(cè)值除以一個(gè)常數(shù)a,所得標(biāo)準(zhǔn)差將縮小a倍(4)標(biāo)準(zhǔn)差可以近似地估計(jì)觀測(cè)值的分布情況。當(dāng)資料服從正態(tài)分布時(shí),觀測(cè)值的分布為:68.26%的觀測(cè)值分布在μ±σ的范圍內(nèi)95.45%的觀測(cè)值分布在μ±2σ的范圍內(nèi)99.73%的觀測(cè)值分布在μ±3σ的范圍內(nèi)μ±1.96σ的范圍內(nèi)包含了95%的觀測(cè)值μ±2.58σ的范圍內(nèi)包含了99%的觀測(cè)值第一節(jié)概率分布一個(gè)總體是由一個(gè)隨機(jī)變量的所有可能取值來(lái)構(gòu)成的,而樣本只是這些所有可能取值的一部分隨機(jī)變量中某一個(gè)值出現(xiàn)的概率,只是隨機(jī)變量一個(gè)側(cè)面的反映,若要全面了解隨機(jī)變量則必須知道隨機(jī)變量的全部值和各個(gè)值出現(xiàn)的概率,即隨機(jī)變量的概率分布■概率和概率分布是由樣本推斷總體的理論基礎(chǔ)隨機(jī)變量的種類很多,每一種隨機(jī)變量都有其特定的概率分布
連續(xù)型隨機(jī)變量
離散型隨機(jī)變量在一定范圍內(nèi)可連續(xù)取值的變量在一定范圍內(nèi)只取有限種可能的值的變量正態(tài)分布
二項(xiàng)分布、泊松分布
1.正態(tài)分布
正態(tài)分布(normaldistribution)是動(dòng)物科學(xué)中應(yīng)用最廣泛的一種連續(xù)型分布類型許多生物學(xué)領(lǐng)域的隨機(jī)變量都服從或者近似服從正態(tài)分布或通過(guò)某種轉(zhuǎn)換后服從正態(tài)分布,許多其他類型分布基本上都與正態(tài)分布有關(guān),它們的極限就是正態(tài)分布
1.1正態(tài)分布的定義
在日常工作中所遇到的變量大多是連續(xù)型隨機(jī)變量,當(dāng)這一類隨機(jī)變量呈線性,往往服從正態(tài)分布和正態(tài)分布相對(duì)應(yīng)的曲線稱為正態(tài)分布密度曲線,簡(jiǎn)稱為正態(tài)曲線用來(lái)描述正態(tài)曲線的函數(shù)稱為正態(tài)分布密度函數(shù)μ—
總體平均數(shù)σ2—
總體方差π—
圓周率3.14σ—
總體標(biāo)準(zhǔn)差■任何一個(gè)正態(tài)分布均由參數(shù)μ和σ所決定如果一個(gè)隨機(jī)變量x服從平均數(shù)為μ、方差為σ2的正態(tài)分布,可記為x~N(μ,σ2)1.2正態(tài)分布的特點(diǎn)
(1)正態(tài)分布曲線以直線x=μ為對(duì)稱軸,左右完全對(duì)稱(3)正態(tài)分布曲線有兩個(gè)拐點(diǎn),拐點(diǎn)座標(biāo)分別為(μ-σ,f(μ-σ))和(μ+σ,f(μ+σ)),在這兩個(gè)拐點(diǎn)處曲線改變方向,即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間上是下凹的,在[μ-σ,μ+σ]區(qū)間內(nèi)是上凸的●●●(2)在x=μ處,f(x)有最大值
(4)正態(tài)分布曲線的位置由μ決定(μ為位置參數(shù)),形狀由σ決定(σ為形狀參數(shù))(5)正態(tài)分布曲線向兩邊無(wú)限延伸,以x軸為漸近線,分布從-∞到+∞μ的大小決定了曲線在x軸上的位置σ的大小則決定了曲線的胖瘦程度當(dāng)σ恒定時(shí),μ愈大,則曲線沿x軸愈向右移動(dòng)μ愈小,曲線沿x軸愈向左移動(dòng)σ越大表示數(shù)據(jù)越分散,曲線越胖σ越小表示數(shù)據(jù)越集中,曲線越瘦1.3標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布由μ和σ所決定,不同的μ值就決定了不同的正態(tài)分布密度函數(shù),因此在實(shí)際計(jì)算中很不方便為了能使正態(tài)分布應(yīng)用起來(lái)更方便一些,可以將x作一變換,令:由于x是隨機(jī)變量,因此u也是隨機(jī)變量,變換后的正態(tài)分布密度函數(shù)為:標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)均具有μ=0,σ2=1的特性如果隨機(jī)變量u服從標(biāo)準(zhǔn)正態(tài)分布,可記為:u~N(0,1)
1.4正態(tài)分布的概率計(jì)算
根據(jù)概率論原理,可知隨機(jī)變量x在區(qū)間[a,b)內(nèi)取值的概率是一塊面積:面積由曲線所圍成的曲邊梯形所組成:隨機(jī)變量x在(-∞,+∞)間取值的概率為1,即:■求隨機(jī)變量x在某一區(qū)段內(nèi)取值的概率就轉(zhuǎn)化成了求由該區(qū)段與相應(yīng)曲線所圍成的曲邊梯形的面積由于正態(tài)分布的概率密度函數(shù)比較復(fù)雜,積分的計(jì)算也比較麻煩,而這些計(jì)算在動(dòng)物科學(xué)研究和生產(chǎn)實(shí)踐中又經(jīng)常會(huì)用到
最好的解決辦法:將正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,然后根據(jù)標(biāo)準(zhǔn)正態(tài)分布表(附表1)直接查出概率值
(1)標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算
附表1列出了標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量u在區(qū)間(
,uα]內(nèi)取值的概率:例1:若u~N(0,1),求:(1)(2)(3)解:(1)(2)(3)關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545P(-3≤u<3)=0.9973P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99P(|u|≥1)u變量在上述區(qū)間以外取值的概率,即兩尾概率:=1-P(-1≤u<1)
=1-0.6826=0.3174
P(|u|≥2)=1-P(-2≤u<2)=0.0455P(|u|≥3)=1-0.9973=0.0027P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.01(2)正態(tài)分布的概率計(jì)算
例2:設(shè)x~N(30,102)試求x≥40的概率。對(duì)于服從任意正態(tài)分布N(μ,σ2)的隨機(jī)變量,欲求其在某個(gè)區(qū)間的取值概率,需先將它標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)正態(tài)分布N(0,1)的隨機(jī)變量,然后查表即可解:首先將正態(tài)分布
轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,令:則u服從標(biāo)準(zhǔn)正態(tài)分布,故:關(guān)于一般正態(tài)分布,經(jīng)常用到以下幾個(gè)概率:P(μ-σ≤x<μ+σ)=0.6826P(μ-2σ≤x<μ+2σ)=0.9545P(μ-3σ≤x<μ+3σ)=0.9973P(μ-1.96σ≤x<μ+1.96σ)=0.95P(μ-2.58σ≤x<μ+2.58σ)=0.99把隨機(jī)變量x落在平均數(shù)μ加減不同倍數(shù)標(biāo)準(zhǔn)差σ區(qū)間之外的概率稱為兩尾概率(雙側(cè)概率),記作α對(duì)應(yīng)于兩尾概率可以求得隨機(jī)變量x小于μ-kσ或大于μ+kσ的概率,稱為一尾概率(單側(cè)概率),記作α/2α0.31730.0455
0.0027
0.050.01
α/2附表2:給出了滿足兩尾臨界值uα
因此,可以根據(jù)兩尾概率α,由附表2查出相應(yīng)的臨界值uα
例3:已知u~N(0,1),試求uα:
(1)(2)解:(1)(2)2.二項(xiàng)分布
二項(xiàng)分布(binomialdistribution)是一種最常見的、典型的離散型隨機(jī)變量的概率分布有些試驗(yàn)只有非此即彼兩種結(jié)果,這種由非此即彼的事件構(gòu)成的總體,稱為二項(xiàng)總體結(jié)果“此”用變量1表示,概率為p
結(jié)果“彼”用變量0表示,概率為q
對(duì)于n次獨(dú)立的試驗(yàn),如果每次試驗(yàn)結(jié)果出現(xiàn)且只出現(xiàn)對(duì)立事件A與A-中之一,在每次試驗(yàn)中出現(xiàn)A的概率是p(0<p<1),因而出現(xiàn)對(duì)立事A-件的概率是1-p=q,則稱這一連串重復(fù)的獨(dú)立試驗(yàn)稱為n重貝努利試驗(yàn)貝努利試驗(yàn)在n重貝努利試驗(yàn)中,事件A恰好發(fā)生m(0≤m≤n)次的概率為:其中:
m=0,1,2…,n
2.1二項(xiàng)分布的定義
設(shè)隨機(jī)變量x所有可能取的值為零和正整數(shù):0,1,2,…,n,且有其中:
m=0,1,2…,n
則稱隨機(jī)變量x服從參數(shù)為n和p的二項(xiàng)分布,記為x~B(n,p)
■只有兩種可能結(jié)果的屬性資料服從二項(xiàng)分布2.2二項(xiàng)分布的特點(diǎn)
(1)當(dāng)p值較小且n不大時(shí),分布是偏倚的,隨著n的增大,分布逐漸趨于對(duì)稱p=0.3n=5n=20n=50(2)當(dāng)p值趨于0.5時(shí),分布趨于對(duì)稱(3)對(duì)于固定的n及p,當(dāng)m增加時(shí),Pn(m)先隨之增加并達(dá)到其極大值,以后又下降(4)二項(xiàng)分布在n較大,且np>5,nq>5時(shí),接近正態(tài)分布,n→∞時(shí)服從正態(tài)分布,即二項(xiàng)分布的極限是正態(tài)分布(5)二項(xiàng)分布的平均數(shù)為:
方差為:標(biāo)準(zhǔn)差為:例4:某奶牛場(chǎng)情期受胎率為0.6,該場(chǎng)對(duì)30頭發(fā)情母牛配種,使24頭母牛一次配種受胎的概率為多少?解:2.3二項(xiàng)分布的概率計(jì)算課堂練習(xí):用某種常規(guī)藥物治療豬瘟的治愈率為0.7,對(duì)20頭患豬瘟的肥育豬進(jìn)行治療,問(wèn)20頭豬中16頭豬治愈的概率是多少?
解:3.泊松分布
當(dāng)二項(xiàng)分布中的n→∞,p→0時(shí),二項(xiàng)分布趨向于一種新的分布——泊松分布(普哇松分布)(Poisson’sdistribution)當(dāng)試驗(yàn)次數(shù)(或稱觀測(cè)次數(shù))很大,而某事件出現(xiàn)的概率很小,則離散型隨機(jī)變量x服從于泊松分布3.1泊松分布的定義
若隨機(jī)變量x(x=m)只取零和正整數(shù)值0,1,2,…,且其概率分布為:其中:則稱x服從參數(shù)為λ的泊松分布,記為x~P(λ)
■泊松分布主要是用來(lái)描述小概率事件發(fā)生的概率單位空間中某些野生動(dòng)物數(shù)畜群中的畸形個(gè)體數(shù)畜群中某些遺傳性疾病的患病數(shù)
■泊松分布不是用來(lái)描述幾乎不可能發(fā)生的事件的概率山無(wú)棱,天地合南京六月飛雪(1)泊松分布只有一個(gè)參數(shù)λ,λ=np
3.2泊松分布的特點(diǎn)
λ既是泊松分布的平均值μ,又是方差σ2,即:(2)泊松分布的圖形決定于λ,λ值愈小分布愈偏倚,隨著λ的增大,分布趨于對(duì)稱λ<1時(shí)P(x>0)為最大,1<λ<2時(shí)P(x=1)最大,2<λ<3時(shí),P(x=2)最大,以此類推當(dāng)λ=20時(shí)分布接近于正態(tài)分布;當(dāng)λ=50時(shí),可以認(rèn)為泊松分布呈正態(tài)分布統(tǒng)計(jì)假設(shè)檢驗(yàn)是生物統(tǒng)計(jì)學(xué)的核心內(nèi)容,是統(tǒng)計(jì)推斷的主要組成部分第一節(jié)統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本原理統(tǒng)計(jì)推斷(statisticalinference)就是通過(guò)樣本特征(統(tǒng)計(jì)量)來(lái)推斷相應(yīng)總體特征(參數(shù))的方法
參數(shù)估計(jì)(parametricestimate)通過(guò)樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法
點(diǎn)估計(jì)(pointestimate)
區(qū)間估計(jì)(intervalestimate)直接用樣本統(tǒng)計(jì)量的數(shù)值估計(jì)出相應(yīng)總體參數(shù)具體值的方法在一定的概率保證下(一般為95%或99%),根據(jù)樣本統(tǒng)計(jì)量的分布,計(jì)算出總體參數(shù)出現(xiàn)的數(shù)值范圍或區(qū)間,用該區(qū)間來(lái)估計(jì)總體參數(shù)的方法■參數(shù)估計(jì)是對(duì)總體參數(shù)的定量分析
統(tǒng)計(jì)假設(shè)檢驗(yàn)(hypothesistest)根據(jù)某種實(shí)際需要,對(duì)未知的或不完全知道的總體參數(shù)提出一些假設(shè),然后根據(jù)樣本觀測(cè)值和統(tǒng)計(jì)量的分布,通過(guò)一定的計(jì)算,再作出在一定概率意義上應(yīng)當(dāng)接受哪種假設(shè)的方法統(tǒng)計(jì)假設(shè)檢驗(yàn)的假設(shè)是對(duì)總體提出的,最后檢驗(yàn)的結(jié)論只有兩種:比較的總體參數(shù)間要么存在顯著差異,要么不存在顯著差異■統(tǒng)計(jì)假設(shè)檢驗(yàn)是對(duì)總體參數(shù)的定性分析
1.統(tǒng)計(jì)假設(shè)檢驗(yàn)的意義
以兩個(gè)平均數(shù)之間差異的顯著性檢驗(yàn)——t-檢驗(yàn)為例現(xiàn)隨機(jī)挑選10名中國(guó)美女和10名韓國(guó)美女,請(qǐng)世界選美大賽評(píng)委和觀眾進(jìn)行評(píng)分,試比較哪個(gè)國(guó)家美女更美?9.999.859.999.959.989.979.959.95中國(guó)美女的平均得分9.98韓國(guó)美女的平均得分9.91兩個(gè)國(guó)家美女的平均得分并不相等,其差值(表面效應(yīng))為:根據(jù)兩個(gè)樣本平均數(shù)的差值0.07,是否可以給兩個(gè)樣本所在總體的總體平均數(shù)下這樣的結(jié)論:中國(guó)美女總體的平均得分高于韓國(guó)美女總體的平均得分中國(guó)美女比韓國(guó)美女漂亮◆如果從經(jīng)典數(shù)學(xué)的角度來(lái)看,答案應(yīng)該是肯定◆如果從生物統(tǒng)計(jì)學(xué)的角度來(lái)看,在未經(jīng)過(guò)統(tǒng)計(jì)假設(shè)檢驗(yàn)以前,只能說(shuō)“不一定”
事實(shí)上,僅僅憑借2個(gè)樣本平均數(shù)之差不等于0就得出其所屬的2個(gè)總體平均數(shù)不相等是不可靠的實(shí)際上,進(jìn)行試驗(yàn)研究的目的并不在于了解樣本的結(jié)果,而是要通過(guò)樣本了解總體,通過(guò)樣本來(lái)推斷總體,從而對(duì)總體給出一個(gè)全面的結(jié)論在統(tǒng)計(jì)學(xué)中,一般用樣本平均數(shù)、作為統(tǒng)計(jì)假設(shè)檢驗(yàn)的對(duì)象
、以樣本平均數(shù)差數(shù)的大小來(lái)對(duì)樣本所在的總體平均數(shù)μ1與μ2是否相同作出統(tǒng)計(jì)推斷
以樣本平均數(shù)作為檢驗(yàn)對(duì)象的依據(jù):
離均差平方和為最小,說(shuō)明樣本平均數(shù)與樣本中各個(gè)觀測(cè)值之間相差最小,因此,平均數(shù)是一個(gè)樣本資料的最好代表值
樣本平均數(shù)是總體平均數(shù)的無(wú)偏估計(jì)值
根據(jù)中心極限定理,樣本平均數(shù)服從或逼近正態(tài)分布實(shí)際上,每個(gè)觀測(cè)值(數(shù)據(jù))都只是試驗(yàn)的表面效應(yīng),而表面效應(yīng)一般由兩部分組成:
試驗(yàn)的處理效應(yīng)
試驗(yàn)的隨機(jī)誤差
樣本中每一觀測(cè)值xi可以被分解成兩部分:處理效應(yīng):用總體平均數(shù)μ表示誤差效應(yīng):用隨機(jī)誤差ε表示
樣本平均數(shù)為:總體平均數(shù)樣本平均數(shù)的差數(shù)也可分解成2部分:誤差平均數(shù)表面效應(yīng)處理效應(yīng)抽樣誤差2.統(tǒng)計(jì)假設(shè)檢驗(yàn)的步驟
統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本原理和思路:■首先根據(jù)具體試驗(yàn)?zāi)康奶岢鲆粋€(gè)假設(shè)■然后在假定該假設(shè)成立(或正確)的前提下進(jìn)行試驗(yàn),并取得數(shù)據(jù),接著對(duì)這些資料進(jìn)行統(tǒng)計(jì)分析,獲得該假設(shè)成立的概率■最后根據(jù)所獲得的概率值的大小來(lái)判斷假設(shè)是否成立如果所得概率較大,就表明我們沒有足夠的理由來(lái)否定所作假設(shè),即必須接受這一假設(shè)如果所得概率較小,就表明這一假設(shè)不大可能成立,應(yīng)予否定,從而接受其對(duì)立假設(shè)例1:某地成年黑白花奶牛產(chǎn)奶量為52.3,標(biāo)準(zhǔn)差為5.38,現(xiàn)測(cè)得10頭黑白花奶牛產(chǎn)奶量分別為53.6,55.3,46.4,57.2,46.0,43.2,48.1,51.1,49.9,44.5;=49.53。試問(wèn)這批黑白花奶牛是否來(lái)自于某地黑白花奶??傮w?(1)對(duì)所研究的總體提出假設(shè)研究某一隨機(jī)樣本所在的總體(用μ表示)和一已知總體(用μ0表示)是否為同一總體,也就是研究這一隨機(jī)樣本是否來(lái)自于已知總體假設(shè):兩個(gè)總體為同一個(gè)總體(即兩個(gè)總體的總體平均數(shù)相等)無(wú)效假設(shè)(nullhypothesis)用H0表示即H0:μ=μ0
無(wú)效假設(shè)的含義:例1:無(wú)效假設(shè)就是假設(shè)兩總體的平均數(shù)相等,即H0:假設(shè)樣本平均數(shù)與已知總體平均數(shù)由抽樣誤差引起的,并不是兩總體之間的真實(shí)差異兩總體之間的差異是由抽樣誤差所引起的為了在無(wú)效假設(shè)被否定后有可以被接受的假設(shè),因此應(yīng)在設(shè)立無(wú)效假設(shè)的同時(shí)設(shè)立一個(gè)后備假設(shè)備擇假設(shè)(alternativehypothesis)用HA表示即HA:
備擇假設(shè)的統(tǒng)計(jì)學(xué)意義:例1:樣本所在總體與已知總體不是同一個(gè)總體,即兩總體平均數(shù)不等,即:兩總體之間的差異是真實(shí)差異,而不是由抽樣誤差引起的統(tǒng)計(jì)假設(shè)檢驗(yàn)中完整的假設(shè)是:
兩總體之間的差異是真實(shí)差異(2)在假定無(wú)效假設(shè)成立的前提下,研究樣本平均數(shù)的抽樣分布,計(jì)算樣本平均數(shù)出現(xiàn)的概率樣本平均數(shù)與總體平均數(shù)間有一個(gè)實(shí)際存在的差值:這個(gè)差值就是表面效應(yīng),可能是抽樣誤差,也可能是真實(shí)差異,因此需要借助概率原理來(lái)進(jìn)行判斷
第一種方法:計(jì)算差值-2.77出現(xiàn)的概率在無(wú)效假設(shè)成立的前提下,樣本所在的總體與已知總體為同一個(gè)總體,因此樣本所在總體的總體平均數(shù)和方差已知,即:由于總體方差已知,根據(jù)標(biāo)準(zhǔn)正態(tài)分布就可以計(jì)算出差值-2.77出現(xiàn)的概率
0.1~0.11
第二種方法:計(jì)算樣本平均數(shù)的接受區(qū)間根據(jù)標(biāo)準(zhǔn)化公式計(jì)算樣本平均數(shù)的接受區(qū)間:接受區(qū)間否定區(qū)間接受區(qū)間和否定區(qū)間是有一定的概率保證的,保證概率為1-α,常用的保證概率為95%和99%;α為顯著水平,常用的顯著水平有0.05和0.01倘若樣本平均數(shù)落在接受區(qū)間內(nèi),就接受H0,反之,倘若樣本平均數(shù)落在接受區(qū)間之外,就否定H0,接受HA作為0.05顯著水平上接受或否定無(wú)效假設(shè)的兩個(gè)臨界值作為0.01顯著水平上接受或否定無(wú)效假設(shè)的兩個(gè)臨界值95%的接受區(qū)間為:99%的接受區(qū)間為:(3)根據(jù)“小概率事件實(shí)際不可能性原理”接受或否定無(wú)效假設(shè)小概率事件實(shí)際不可能性原理是指在一次試驗(yàn)中,概率很小的事件是不可能出現(xiàn)的當(dāng)樣本平均數(shù)與總體平均數(shù)差值出現(xiàn)的概率小于5%時(shí),就認(rèn)為這種差異由抽樣誤差引起的概率較小,而是兩總體間的真實(shí)性差異,從而否定無(wú)效假設(shè)差值-2.77出現(xiàn)的概率為0.1~0.11,大于0.05,概率較大;說(shuō)明樣本平均數(shù)與已知總體的總體平均數(shù)之間的差異是抽樣誤差的概率較大,而不大可能是真實(shí)差異接受無(wú)效假設(shè),也就是說(shuō)這批黑白花奶牛是來(lái)自于某地黑白花奶??傮w總結(jié):統(tǒng)計(jì)假設(shè)檢驗(yàn)的步驟(1)提出假設(shè)(2)計(jì)算樣本平均數(shù)抽樣分布的t值或u值(3)查附表,根據(jù)小概率原理作出接受或者否定無(wú)效假設(shè)的推斷,并結(jié)合專業(yè)知識(shí)作出合理的、科學(xué)的解釋例2:1995年,已知某地20歲應(yīng)征男青年的平均身高為168.5cm。2005年在當(dāng)?shù)?0歲應(yīng)征男青年中隨機(jī)抽取85人,平均身高為171.2cm,標(biāo)準(zhǔn)差為5.3cm,問(wèn)2005年當(dāng)?shù)?0歲應(yīng)征男青年的身高與1995年的是否相同?解:(1)提出假設(shè)H0:μ=168.5HA:μ≠168.5與1995年相比,2005年當(dāng)?shù)?0歲應(yīng)征男青年的身高沒有變化與1995年相比,2005年當(dāng)?shù)?0歲應(yīng)征男青年的身高有變化(2)計(jì)算u值(3)查表,作出推斷u0.05=1.96,u0.01=2.58|u|=4.70>2.58=u0.01,
P<0.01根據(jù)“小概率事件原理”可以認(rèn)為無(wú)效假設(shè)不成立,因此否定無(wú)效假設(shè),接受備擇假設(shè)樣本不是來(lái)自于已知總體,即2005年當(dāng)?shù)?0歲應(yīng)征男青年的身高有變化,比1995年增高了在顯著性檢驗(yàn)中,否定或接受無(wú)效假設(shè)的依據(jù)是“小概率事件實(shí)際不可能性原理”
用來(lái)確定否定或接受無(wú)效假設(shè)的概率標(biāo)準(zhǔn)稱為顯著水平,記作α
若|u|<u0.05
P>0.05,
說(shuō)明表面效應(yīng)屬于試驗(yàn)誤差的可能性大,不能否定無(wú)效假設(shè),兩個(gè)總體平均數(shù)間差異不顯著
若u0.05≤|u|<u0.01
P≤0.05,
說(shuō)明表面效應(yīng)屬于試驗(yàn)誤差的概率P在0.01-0.05之間,表面效應(yīng)屬于試驗(yàn)誤差的可能性較小,應(yīng)否定無(wú)效假設(shè),接受備擇假設(shè)兩個(gè)總體平均數(shù)間差異顯著
標(biāo)記*
若|u|≥u0.01
P≤0.01,
說(shuō)明表面效應(yīng)屬于試驗(yàn)誤差的概率P不超過(guò)0.01,表面效應(yīng)屬于試驗(yàn)誤差的可能性更小,應(yīng)否定無(wú)效假設(shè),接受備擇假設(shè)
兩個(gè)總體平均數(shù)間差異極顯著
標(biāo)記
**課堂練習(xí):太湖豬母豬成年體重為75㎏,現(xiàn)從太湖豬產(chǎn)區(qū)隨機(jī)抽得60個(gè)個(gè)體,平均成年體重為70.8㎏,S=11.32㎏,問(wèn)該樣本群就成年體重這一性狀來(lái)看,是否與總體符合?3.一尾檢驗(yàn)和兩尾檢驗(yàn)
所研究樣本的樣本平均數(shù),有可能大于已知總體的總體平均數(shù),也有可能小于已知總體的總體平均數(shù),即計(jì)算所得的u值可能會(huì)落在標(biāo)準(zhǔn)正態(tài)分布左邊否定區(qū),也有可能會(huì)落在右邊否定區(qū)既考慮左邊否定區(qū)又考慮右邊否定區(qū)即考慮分布曲線兩尾的檢驗(yàn)稱為兩尾檢驗(yàn)(two-tailedtest)在很多情況下,事先并不知道所抽樣本的樣本平均數(shù)是不是肯定大于總體平均數(shù)或肯定小于總體平均數(shù)因此,備擇假設(shè)HA:μ≠μ0中,有兩種可能性存在,既包括μ>μ0,又包括μ<μ0■兩尾檢驗(yàn)是生物統(tǒng)計(jì)學(xué)中最常用的方法,應(yīng)用范圍極其廣泛
有些時(shí)候,試驗(yàn)?zāi)康氖敲鞔_的,即所抽樣本的樣本平均數(shù)只可能大于總體平均數(shù)μ>μ0,或只可能小于總體平均數(shù)μ<μ0
在這種情況下,無(wú)效假設(shè)否定后的備擇假設(shè)只有一種情況:要么μ<μ0
,要么μ>μ0
只有一個(gè)否定區(qū)(一尾)的假設(shè)檢驗(yàn)稱為一尾檢驗(yàn)(one-tailedtest)
兩尾檢驗(yàn)的假設(shè):H0:μ=μ0,HA:μ≠μ0
一尾檢驗(yàn)的假設(shè):H0:μ>μ0,HA:μ<μ0
在樣本容量和顯著水平相同的情況下,一尾檢驗(yàn)的效率高于兩尾檢驗(yàn),一尾檢驗(yàn)比兩尾檢驗(yàn)更容易否定無(wú)效假設(shè)若對(duì)同一資料進(jìn)行兩尾檢驗(yàn)和一尾檢驗(yàn),那么在α水平上一尾檢驗(yàn)顯著,只相當(dāng)于兩尾檢驗(yàn)在2α水平上顯著。所以,同一資料兩尾檢驗(yàn)與一尾檢驗(yàn)所得的結(jié)論不一定相同兩尾檢驗(yàn)顯著,一尾檢驗(yàn)一定顯著一尾檢驗(yàn)顯著,兩尾檢驗(yàn)未必顯著4.假設(shè)檢驗(yàn)的兩類錯(cuò)誤在假設(shè)檢驗(yàn)中,接受或者否定無(wú)效假設(shè)的依據(jù)是“小概率事件實(shí)際不可能性原理”,因此所得出的結(jié)論(不論是接受還是否定無(wú)效假設(shè))都沒有100%的把握,只是在一定的概率范圍內(nèi)認(rèn)為這種結(jié)論是正確的
4.1第一類錯(cuò)誤如果無(wú)效假設(shè)H0成立,即H0:μ=μ0為真,但:
檢驗(yàn)結(jié)果發(fā)現(xiàn)“差異顯著”而否定了它(此時(shí),只有95%的把握,要冒5%下錯(cuò)結(jié)論的風(fēng)險(xiǎn))檢驗(yàn)結(jié)果發(fā)現(xiàn)“差異極顯著”而否定了它(此時(shí),只有99%的把握,要冒1%下錯(cuò)結(jié)論的風(fēng)險(xiǎn))這一類錯(cuò)誤稱為Ⅰ型錯(cuò)誤或α型錯(cuò)誤Ⅰ型錯(cuò)誤的實(shí)質(zhì)就是把非真實(shí)差異(抽樣誤差)錯(cuò)判為真實(shí)差異,即:H0:μ=μ0為真,卻接受了HA:μ≠μ0
棄真H0正確被否定犯Ⅰ型錯(cuò)誤的概率不會(huì)超過(guò)顯著水平α(5%、1%)
4.2第二類錯(cuò)誤
如果無(wú)效假設(shè)H0不成立,即H0:μ=μ0為假,但:
檢驗(yàn)結(jié)果發(fā)現(xiàn)“差異不顯著”而接受了它,同時(shí)放棄了正確的備擇假設(shè)
在統(tǒng)計(jì)學(xué)中所謂的“差異不顯著”就是指沒有充分的理由去否定無(wú)效假設(shè),但也沒有充分的理由去接受備擇假設(shè),但生物統(tǒng)計(jì)學(xué)實(shí)行的是“非此即彼”的原則,因此,既然“差異不顯著”就必須接受無(wú)效假設(shè)。
這一類錯(cuò)誤稱為Ⅱ型錯(cuò)誤或β型錯(cuò)誤Ⅱ型錯(cuò)誤的實(shí)質(zhì)就是把真實(shí)差異錯(cuò)判為非真實(shí)差異,即雖然H0:μ=μ0是假的,但通過(guò)檢驗(yàn)卻接受了存?zhèn)蜨0錯(cuò)誤被接受“差異不顯著”不是指沒有差異,它存在2種可能:一是兩總體間的確沒有差異,平均數(shù)間的差異純屬抽樣誤差;二是兩總體間有差異,但由于實(shí)驗(yàn)誤差大而掩蓋了這一差異統(tǒng)計(jì)推斷的基本特點(diǎn)就是“有很大的可靠性,但也有一定的錯(cuò)誤率”
在動(dòng)物科學(xué)研究和生產(chǎn)實(shí)踐中有很多質(zhì)量性狀的數(shù)據(jù)資料(次數(shù)資料):■將其轉(zhuǎn)化成百分率資料,用u-檢驗(yàn)進(jìn)行分析■直接使用χ2檢驗(yàn)來(lái)進(jìn)行分析
單個(gè)樣本百分率的假設(shè)檢驗(yàn)
兩個(gè)樣本百分率差異的假設(shè)檢驗(yàn)第一節(jié)χ2檢驗(yàn)原理1.基本原理從一個(gè)已知平均數(shù)為μ,方差為σ2的正態(tài)總體中,進(jìn)行獨(dú)立地抽樣,可獲得隨機(jī)變量x,則其標(biāo)準(zhǔn)正態(tài)離差:~
N(0,1)如果連續(xù)進(jìn)行n次獨(dú)立抽樣,可得n個(gè)標(biāo)準(zhǔn)正態(tài)離差ui,對(duì)這n個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差ui進(jìn)行平方求和就得到一個(gè)新的統(tǒng)計(jì)量χ2:如果用樣本進(jìn)行計(jì)算:在實(shí)際應(yīng)用時(shí),χ2定義為理論次數(shù)與觀察次數(shù)間的符合程度:O—觀察次數(shù)E—理論次數(shù)χ2檢驗(yàn)主要應(yīng)用于:□在遺傳學(xué)中,研究雜交后代某一性狀的分離比例是否符合孟德爾定律□在動(dòng)物醫(yī)學(xué)中,研究某種疾病的發(fā)生與某種致病因素是否相關(guān)聯(lián)□在生物學(xué)中,研究群體的性別分離比例是否符合1∶1的比例孟德爾在利用豌豆進(jìn)行遺傳學(xué)試驗(yàn)時(shí),發(fā)現(xiàn)F2代中紅花和白花的數(shù)量分別為705和224,經(jīng)過(guò)分析提出了著名的分離定律(lawofsegregation),認(rèn)為豌豆花顏色是由一對(duì)等位基因控制的按照孟德爾的分離定律,可以計(jì)算出F2代紅花和白花的理論次數(shù):紅花的理論次數(shù):929×3/4=696.75白花的理論次數(shù):929×1/4=232.25可以看出,理論次數(shù)與觀察次數(shù)之間存在一定的差異:705-696.75=8.25224-232.25=-8.25觀察次數(shù)與理論次數(shù)之間的差異越小,說(shuō)明觀察結(jié)果與理論值越相符
觀察次數(shù)與理論次數(shù)之間的差異越大,說(shuō)明觀察結(jié)果與理論值越不符如何來(lái)定量地界定這種相符或不相符?■兩個(gè)差值相加(705-596.75)+(224-232.5)=8.25+(-8.25)=0推而廣之,觀察次數(shù)與理論次數(shù)的離差之和等于0,即:
因此,簡(jiǎn)單相加根本不能反映出觀察次數(shù)和理論次數(shù)之間的差異程度進(jìn)行平方相加,和就不會(huì)再等于零了,即:■兩個(gè)差值平方后相加平方后,可以使較大的差值變得更大,因而增加了分析問(wèn)題的靈敏度
因此,平方相加可以反映出觀察次數(shù)和理論次數(shù)之間的變異程度
由于每個(gè)樣本的樣本容量可能不相等,因而不同樣本之間缺乏可比性■如果以理論次數(shù)為標(biāo)準(zhǔn)進(jìn)行比較,則就可以順利解決這個(gè)問(wèn)題了,即:紅花的χ2值:
白花的χ2值:
總的χ2值:
得到χ2值后,可以根據(jù)χ2分布來(lái)推斷觀察次數(shù)與理論次數(shù)之間是否相符
2.χ2的顯著性檢驗(yàn)
根據(jù)研究目的不同,χ2檢驗(yàn)可分為2類:2.1適合性檢驗(yàn)
適合性檢驗(yàn)(testforgoodnessoffit)是用來(lái)檢驗(yàn)?zāi)承誀畹挠^察次數(shù)與理論比例是否相符的一種χ2檢驗(yàn)方法適合性檢驗(yàn)的步驟為:
(1)提出假設(shè)H0:觀察次數(shù)與理論次數(shù)是相符的HA:觀察次數(shù)與理論次數(shù)是不相符的(3)查表,推斷(2)計(jì)算χ2值2.2獨(dú)立性檢驗(yàn)
獨(dú)立性檢驗(yàn)(testforindependence)是研究?jī)深愒囼?yàn)因子之間是相互獨(dú)立還是相互影響的一種χ2檢驗(yàn)方法■獨(dú)立性檢驗(yàn)與適合性檢驗(yàn)不同,獨(dú)立性檢驗(yàn)沒有一個(gè)給定的理論次數(shù)■獨(dú)立性檢驗(yàn)所用的理論次數(shù)是在無(wú)效假設(shè)成立的前提下推算出來(lái)的
獨(dú)立性檢驗(yàn)的步驟為:(1)提出假設(shè)(2)計(jì)算χ2值(3)查表,推斷H0:兩類試驗(yàn)因子之間是相互獨(dú)立的HA:兩類試驗(yàn)因子之間是有關(guān)聯(lián)的3.χ2的連續(xù)性校正◆χ2分布是一種連續(xù)型的分布類型◆在科學(xué)研究和臨床實(shí)踐中所得的次數(shù)資料屬于離散型分布由次數(shù)資料得到的χ2統(tǒng)計(jì)量的抽樣分布也具有離散性質(zhì),往往會(huì)造成偏低的估計(jì),特別是在df=1時(shí)為了改善χ2統(tǒng)計(jì)量抽樣分布的連續(xù)性,統(tǒng)計(jì)學(xué)家提出了一個(gè)校正公式:
將觀察次數(shù)與理論次數(shù)之差的絕對(duì)值減去0.5
連續(xù)性校正—
校正χ2值
0.5為連續(xù)性校正常數(shù)
連續(xù)性校正僅適用于df=1的情況,當(dāng)df≥2時(shí)一般不作校正4.χ2檢驗(yàn)的自由度
t-檢驗(yàn)的自由度與樣本容量(n)有關(guān)配對(duì)數(shù)據(jù):非配對(duì)數(shù)據(jù):
χ2檢驗(yàn)的自由度與觀察次數(shù)、理論次數(shù)的多少無(wú)關(guān)而是由類別(n)來(lái)確定的豌豆花的顏色有紅花和白花2類,自由度為:果蠅有4種類型:長(zhǎng)灰、長(zhǎng)黑、殘灰和殘黑,自由度為:第二節(jié)適合性檢驗(yàn)適合性檢驗(yàn)是用來(lái)檢驗(yàn)實(shí)際的觀察次數(shù)與理論比例是否相符的一種χ2檢驗(yàn)方法適合性檢驗(yàn)主要用于以下幾個(gè)領(lǐng)域:(1)遺傳學(xué)分析
(2)質(zhì)量鑒定和規(guī)范化作業(yè)
(3)檢驗(yàn)觀測(cè)值的分布是否符合某種理論分布
◆孟德爾遺傳定律◆哈代-溫伯格平衡定律◆正態(tài)分布◆二項(xiàng)分布◆泊松分布例1:為了研究人口性別比例,現(xiàn)對(duì)某一地區(qū)2006-2009年新生嬰兒進(jìn)行抽樣調(diào)查,發(fā)現(xiàn)20500名新生嬰兒中男嬰11200名,試問(wèn)此地男女兩性人口是否均衡?人口出生性別比(新生嬰兒性別比)是衡量男女兩性人口是否均衡的重要標(biāo)志,國(guó)際上一般以每出生100名女性人口相對(duì)應(yīng)出生的男性人口的數(shù)值來(lái)表示
絕大多數(shù)國(guó)家的人口生育史表明,在不進(jìn)行人為控制的情況下,新生嬰兒的性別比在102-107之間,為了計(jì)算方便,這里取105(1)提出假設(shè)H0:此地男女兩性人口符合105:100的性別比例HA:此地男女兩性人口不符合105:100的性別比例先根據(jù)105:100的理論比例計(jì)算理論次數(shù):男性的理論次數(shù):20500×105/205=10500
女性的理論次數(shù):20500×100/205=10000
(3)查表,推斷根據(jù)自由度df=1,查χ2值表:P<0.01差異極顯著此地男女兩性人口不符合105:100的性別比例,男女兩性人口嚴(yán)重失衡否定H0,接受HA課堂練習(xí)1:純種白豬和純種黑豬交配,F(xiàn)1后代全為白豬,F(xiàn)1代內(nèi)橫交,F(xiàn)2代毛色發(fā)生了分離。現(xiàn)統(tǒng)計(jì)了某一個(gè)豬場(chǎng)內(nèi)F2代680頭仔豬,發(fā)現(xiàn)白色仔豬494頭,黑色仔豬186頭,試問(wèn)F2代仔豬的毛色性狀是否符合孟德爾分離定律?例2:果蠅兩對(duì)性狀F2代表現(xiàn)出的4種不同的表型,觀察次數(shù)分別為154、43、53、6,試問(wèn)該批資料是否符合9:3:3:1的遺傳比例?(1)提出假設(shè)H0:F2代表型符合9:3:3:1的遺傳比例HA:F2代表型不符合9:3:3:1的遺傳比例(2)計(jì)算χ2值根據(jù)9:3:3:1的理論比例計(jì)算理論次數(shù):總觀察次數(shù):154+43+53+6=256A-B-:256×9/16=144A-bb:256×3/16=48aaB-:256×3/16=48
aabb:256×1/16=16(3)查表,推斷根據(jù)自由度df=3查表,可得:P<0.05說(shuō)明F2代表型不符合9:3:3:1的遺傳比例否定H0,接受HA當(dāng)df≥2,χ2檢驗(yàn)差異顯著或極顯著,表示整批資料不符合某一理論比例
根據(jù)總的χ2值無(wú)法判斷出:到底是全部資料均不符合理論比例還是其中的部分資料不符合比例?為了確定各部分的符合程度,應(yīng)當(dāng)對(duì)總的χ2值進(jìn)行分割,即χ2再分割(4)χ2再分割χ2再分割是建立在χ2具有可加性的特點(diǎn)上的,即:但這種可加性只有在次數(shù)資料各部分相互獨(dú)立,并不作χ2的連續(xù)性校正時(shí)才成立的差異顯著前三部分的χ2值均較小,因此可先取前三部分的比率作χ2檢驗(yàn),即檢驗(yàn)前三部分是否符合9:3:3的比例(a)檢驗(yàn)前三部分是否符合9:3:3的遺傳比例總觀察次數(shù)為154+43+53=250計(jì)算理論次數(shù):A-B-:250×9/15=150
A-bb:250×3/15=50
aaB-:250×3/15=50
接受H0,否定HA
說(shuō)明前三部分實(shí)際觀測(cè)值符合9:3:3的遺傳比例P>0.05差異不顯著(b)檢驗(yàn)前三部分組合與aabb是否符合15:1的比例理論次數(shù)分別為:組合:256×15/16=240aabb:256×1/16=16P<0.05,差異顯著,否定H0,接受HA
說(shuō)明aabb不符合理論比例■χ2適合性檢驗(yàn)一般應(yīng)針對(duì)大樣本資料,樣本容量過(guò)小會(huì)影響到檢驗(yàn)的正確性,特別是理論比例中有較小值時(shí),更應(yīng)注意樣本容量第三節(jié)獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)是檢驗(yàn)兩個(gè)變量、兩個(gè)試驗(yàn)因子之間是相互獨(dú)立的還是相關(guān)的一種χ2檢驗(yàn)方法獨(dú)立性檢驗(yàn)的無(wú)效假設(shè)H0:兩因子相互獨(dú)立(無(wú)關(guān));備擇假設(shè)HA:兩因子相關(guān)獨(dú)立性檢驗(yàn)無(wú)已知的理論比例,因此必須用列表的方式根據(jù)現(xiàn)有的觀察次數(shù)來(lái)推算理論次數(shù)獨(dú)立性檢驗(yàn)用列表的方式來(lái)推算理論次數(shù)的方法是建立在無(wú)效假設(shè)成立,也就是兩因子無(wú)關(guān)的基礎(chǔ)上的1.2×2列聯(lián)表
獨(dú)立性檢驗(yàn)所列的兩向表格稱為列聯(lián)表根據(jù)分組數(shù)的多少,列聯(lián)表可分為2×2、2×C和R×C三種形式2×2列聯(lián)表是列聯(lián)表中最簡(jiǎn)單的一種形式C1C2R1abR2cd總和總和a+b=TR1c+d=TR2a+c=TC1b+d=TC2a+b+c+d=T例1:在將苗雞放進(jìn)雞舍前一般要先對(duì)雞舍進(jìn)行消毒,以降低疾病的發(fā)生?,F(xiàn)進(jìn)行雞舍消毒試驗(yàn),得數(shù)據(jù)如下,試問(wèn)消毒能否有效降低疾病的發(fā)生?
發(fā)病未發(fā)病合計(jì)消毒3092122不消毒5863121合計(jì)88155243(44.18)(43.82)(77.82)(77.18)(1)提出假設(shè)
H0:雞舍消毒與疾病的發(fā)生無(wú)關(guān)HA:雞舍消毒與疾病的發(fā)生相關(guān)獨(dú)立性檢驗(yàn)的自由度為:a格的理論次數(shù):
b格的理論次數(shù):(3)查表,推斷P<0.01差異極顯著雞舍消毒可極顯著地降低疾病的發(fā)生否定無(wú)效假設(shè),接受備擇假設(shè)2.2×C或R×2表例2:為了研究雞的飼養(yǎng)密度與雞的啄癖有無(wú)關(guān)系,設(shè)計(jì)了如下試驗(yàn),按密度大小分為三種飼養(yǎng)方式,檢查不同密度下有啄癖的雞只數(shù),得數(shù)據(jù)如下,并列成2×3表,試分析飼養(yǎng)密度與雞的啄癖有無(wú)關(guān)系。較低中等較高合計(jì)啄癖數(shù)141722正常數(shù)798683248合計(jì)8090100270(6.52)(73.48)(7.33)(82.67)(8.15)(91.85)(1)提出假設(shè)
H0:雞的啄癖與飼養(yǎng)密度無(wú)關(guān)HA:雞的啄癖與飼養(yǎng)密度有關(guān)(2)計(jì)算χ2值
=(2-1)(3-1)=2(3)查表,推斷P<0.01差異極顯著否定無(wú)效假設(shè),接受備擇假設(shè),即雞的啄癖與飼養(yǎng)密度有極顯著地關(guān)聯(lián)(4)χ2再分割A(yù).檢驗(yàn)中等密度是否與雞的啄癖有關(guān)分析較低飼養(yǎng)密度、中等飼養(yǎng)密度與啄癖的關(guān)系低中合計(jì)啄癖數(shù)1(2.35)4(2.65)5正常數(shù)79(77.65)86(87.35)165合計(jì)8090170經(jīng)計(jì)算,可得:P>0.05中等飼養(yǎng)密度并不顯著增加雞的啄癖數(shù)B.檢驗(yàn)高等飼養(yǎng)密度是否與啄癖有關(guān)將飼養(yǎng)較低飼養(yǎng)密度和中等飼養(yǎng)密度的合并起來(lái)檢驗(yàn)較高飼養(yǎng)密度
合并高合計(jì)啄癖數(shù)5(13.85)17(8.15)22正常數(shù)165(156.15)83(91.85)248合計(jì)170100270經(jīng)計(jì)算,可得:P<0.01差異極顯著高的飼養(yǎng)密度可極顯著地引發(fā)雞的啄癖的發(fā)生第一節(jié)方差分析的基本概念2個(gè)平均數(shù)之間差異的顯著性檢驗(yàn)一般用t-檢驗(yàn)或u-檢驗(yàn)來(lái)進(jìn)行分析3個(gè)或3個(gè)以上平均數(shù)之間差異的顯著性檢驗(yàn)是否仍然可以采用t-檢驗(yàn)或u-檢驗(yàn)來(lái)進(jìn)行分析呢?(I)工作量相當(dāng)大如果對(duì)k個(gè)(k≥3)樣本平均數(shù)進(jìn)行t-檢驗(yàn)時(shí),需要假設(shè)檢驗(yàn)的次數(shù)為:對(duì)5個(gè)平均數(shù)進(jìn)行t-檢驗(yàn)時(shí)需要進(jìn)行10次t-檢驗(yàn)對(duì)10個(gè)平均數(shù)進(jìn)行t-檢驗(yàn)時(shí)需要進(jìn)行45次t-檢驗(yàn)(II)無(wú)統(tǒng)一的試驗(yàn)誤差對(duì)同一個(gè)試驗(yàn)的多個(gè)樣本平均數(shù)進(jìn)行比較時(shí),應(yīng)當(dāng)有一個(gè)統(tǒng)一的試驗(yàn)誤差但是,如果用t-檢驗(yàn)對(duì)多個(gè)樣本平均數(shù)進(jìn)行兩兩比較時(shí):每進(jìn)行一次t-檢驗(yàn)都需要計(jì)算一個(gè)標(biāo)準(zhǔn)誤:(III)誤差估計(jì)的精確性低假設(shè)一個(gè)試驗(yàn)中,有k個(gè)(k≥3)樣本,每個(gè)樣本的樣本容量均為n■用t-檢驗(yàn)進(jìn)行兩兩比較,那么,每次只能利用兩個(gè)樣本共2n個(gè)觀測(cè)值估計(jì)試驗(yàn)誤差,誤差自由度為2(n-1)■利用整個(gè)試驗(yàn)的kn個(gè)觀測(cè)值估計(jì)試驗(yàn)誤差,誤差自由度為k(n-1)用t-檢驗(yàn)對(duì)3個(gè)或3個(gè)以上的樣本平均數(shù)進(jìn)行分析時(shí),由于誤差自由度小,誤差估計(jì)的精確性低,使檢驗(yàn)的靈敏度降低,容易掩蓋差異的顯著性(IV)犯I型錯(cuò)誤的概率大
用t-檢驗(yàn)進(jìn)行多個(gè)樣本平均數(shù)間差異的顯著性檢驗(yàn),隨著樣本數(shù)量的增大而增大犯I型錯(cuò)誤的概率用t-檢驗(yàn)來(lái)比較5個(gè)樣本平均數(shù),就會(huì)有10個(gè)差數(shù),對(duì)這10個(gè)差數(shù)都以α=0.05為顯著水平進(jìn)行假設(shè)檢驗(yàn)■每一差數(shù)獲得正確結(jié)論的概率是1-α=0.95■10個(gè)差數(shù)都獲得正確結(jié)論的概率只有0.9510=0.5987■在10個(gè)兩兩比較中,犯I型錯(cuò)誤的概率就不再是α=0.05,而是α=1-0.5987=0.4013方差是衡量數(shù)據(jù)變異程度的特征值
平方和的平均數(shù)引起變量發(fā)生變異的原因稱為變異因素或變異來(lái)源◆方差分析就是發(fā)現(xiàn)各類變異來(lái)源相對(duì)重要性的一種方法方差分析的基本思路
把整個(gè)試驗(yàn)(設(shè)有k個(gè)樣本)資料作為一個(gè)整體來(lái)考慮,把整個(gè)試驗(yàn)的總變異按照變異的來(lái)源分解成不同來(lái)源的變異,即把總方差分解成不同來(lái)源的方差由于樣本方差等于平方和除以自由度,因此把總方差分解成不同來(lái)源的方差,就等于把總方差中的平方和、自由度分解為相應(yīng)的不同變異來(lái)源的平方和、自由度,進(jìn)而獲得不同變異來(lái)源方差的估計(jì)值,從而發(fā)現(xiàn)不同變異來(lái)源方差的相對(duì)重要性第二節(jié)單因素方差分析1.組內(nèi)樣本容量相同的單因素資料
單因素資料是指在試驗(yàn)時(shí)僅考慮一個(gè)因素,除這一因素外,其余因素均控制在同一水平上當(dāng)每一組內(nèi)的供試動(dòng)物個(gè)數(shù)相等時(shí),就稱為組內(nèi)樣本容量相等的單因素資料試驗(yàn)因素(experimentalfactor)試驗(yàn)中所研究的影響試驗(yàn)指標(biāo)的因素
因素水平(level)試驗(yàn)因素所處的某種特定狀態(tài)或數(shù)量等級(jí)1.1數(shù)學(xué)模型和數(shù)據(jù)結(jié)構(gòu)從一個(gè)正態(tài)總體N(μ,σ2)中隨機(jī)抽取一個(gè)樣本容量為n的樣本,則樣本中每一觀測(cè)值為:樣本平均數(shù)為:如果對(duì)上述總體施加效應(yīng)為a的處理,則樣本中每一個(gè)觀測(cè)值為:如果將N(μ,σ2)的總體分成k個(gè)亞總體,每一個(gè)亞總體施加一個(gè)效應(yīng)為ai的處理,則每一亞總體的平均數(shù)為:從每一亞總體內(nèi)抽取一個(gè)樣本容量為n的樣本,則有k個(gè)樣本:
樣本12…i…k觀測(cè)值x11…x12x1j…x1nx2nx21xi2xi1xk1x2jxk2xknxkjxinxijx22………………………………………………任何一個(gè)觀測(cè)值均具有線性模型:
1.2平方和、自由度的剖分全部觀測(cè)值的總平方和為:第1個(gè)樣本內(nèi)的平方和為:第2個(gè)樣本內(nèi)的平方和為:第i個(gè)樣本內(nèi)的平方和為:第k個(gè)樣本內(nèi)的平方和為:組內(nèi)平方和(誤差平方和):組間變異就是k個(gè)樣本平均數(shù)的變異,其平方和、自由度為:組間均方:
組內(nèi)均方:
獲得3個(gè)均方:總均方:組內(nèi)均方:組間均方:三個(gè)均方的平方和、自由度之間的關(guān)系
三個(gè)均方的自由度之間的關(guān)系
總自由度=組間自由度+組內(nèi)自由度
總自由度可以剖分為兩部分:組間自由度、組內(nèi)自由度
三個(gè)均方的平方和之間的關(guān)系
同理,第2個(gè)樣本、第i個(gè)樣本、第k個(gè)樣本都有相似的等式:第一個(gè)樣本的每個(gè)觀測(cè)值與總平均數(shù)的離差平方和:總平方和=組間平方和+組內(nèi)平方和總平方和可以剖分為兩部分:組間平方和、組內(nèi)平方和1.3F-檢驗(yàn)組間均方:組間平方和除以組間自由度組內(nèi)均方:組內(nèi)平方和除以組內(nèi)自由度如果對(duì)各亞總體施加的處理效應(yīng)足夠大,樣本平均數(shù)之間的差距就會(huì)足夠大,則組間均方就會(huì)顯著大于組內(nèi)均方,F(xiàn)值就會(huì)達(dá)到顯著水平用F值進(jìn)行的假設(shè)檢驗(yàn)稱為F-檢驗(yàn),又稱為方差分析F-檢驗(yàn)的步驟
無(wú)效假設(shè)H0:(1)提出假設(shè)備擇假設(shè)HA:至少有兩個(gè)均數(shù)不相等(2)計(jì)算F值(3)查表,推斷根據(jù)第一自由度dfb、第二自由度dfe由附表5查出顯著水平α=0.05和0.01的兩個(gè)臨界值,將計(jì)算的F值與之相比較,作出推斷
■方差分析表例1:選用4種不同劑型的配合飼料作太湖豬的配合飼料劑型試驗(yàn),每一劑型飼喂5頭太湖豬,得增重?cái)?shù)據(jù)如下,試對(duì)不同劑型飼料對(duì)太湖豬增重效果的差異進(jìn)行檢驗(yàn)。無(wú)效假設(shè)H0:(1)提出假設(shè)備擇假設(shè)HA:4個(gè)均數(shù)不全相等(2)計(jì)算F值解:檢驗(yàn)步驟如下:計(jì)算均方(MS)值、F值并建立方差分析表:(3)查表,推斷查附表5,F(xiàn)0.05(3,16)=3.24,F(xiàn)0.01(3,16)=5.29F>F0.01,即P<0.01,F(xiàn)值極顯著
否定H0,接受HA,即4種劑型的飼料對(duì)太湖豬增重的影響有極顯著的差異**課堂練習(xí):為了研究長(zhǎng)白豬、杜洛克、太湖豬、新淮豬等4個(gè)不同豬種的生長(zhǎng)速度,現(xiàn)從每個(gè)品種豬中隨機(jī)抽取5頭同日齡的架子豬,在相同的飼養(yǎng)條件下飼養(yǎng)一個(gè)月后得到增重量如下,試進(jìn)行方差分析。1.4多重比較(multiplecomparisons)
多重比較的總體原則都是構(gòu)建平均數(shù)差數(shù)的顯著尺度
多重比較的第一步就是求出尺度值多重比較的第二步是用平均數(shù)差數(shù)值與相應(yīng)的尺度值比較
差數(shù)值大于尺度值,就表示兩平均數(shù)間差異顯著或極顯著
差數(shù)值小于尺度值,就表示兩平均數(shù)間差異不顯著1.4.1LSD法
LSD法即最小顯著差數(shù)法(leastsignificantdifference),是多重比較中一種最簡(jiǎn)便的方法LSD法多重比較步驟:■建立平均數(shù)的多重比較表,將各組按其平均數(shù)從大到小自上而下排列■計(jì)算最小顯著差數(shù)LSD0.05和LSD0.01
■將平均數(shù)多重比較表中兩兩平均數(shù)的差數(shù)與LSD0.05和LSD0.01比較,作出推斷例1:選用4種不同劑型的配合飼料作太湖豬的配合飼料劑型試驗(yàn),每一劑型飼喂5頭太湖豬,得增重?cái)?shù)據(jù)如下,試對(duì)不同劑型飼料對(duì)太湖豬增重效果的差異進(jìn)行檢驗(yàn)。**a.建立平均數(shù)多重比較表組(劑型)A4A3
A1
A2
25.022.820.217.67.45.22.64.82.62.2b.計(jì)算最小顯著差數(shù)c.比較,推斷將平均數(shù)差數(shù)與最小顯著差數(shù)比較:
小于LSD0.05者為不顯著
介于LSD0.05與LSD0.01之間者顯著,在差數(shù)的右上方標(biāo)記*
大于LSD0.01者極顯著,在差數(shù)的右上方標(biāo)記********A3劑型飼料對(duì)太湖豬的增重效果極顯著高于A2
A4劑型飼料對(duì)太湖豬的增重效果極顯著高于A2
A3劑型飼料對(duì)太湖豬的增重效果極顯著高于A1
1.4.2LSR法
LSR法即最小顯著極差法(Leastsignificantranges)LSR法的特點(diǎn)是把平均數(shù)的差數(shù)看成是平均數(shù)的極差,根據(jù)極距r(平均數(shù)的距離)的不同而采用不同的檢驗(yàn)尺度■克服了LSD法的不足■檢驗(yàn)的工作量有所增加(1)q法(qtest)q法為一種比較客觀的方法,其尺度公式為:q法多重比較的步驟:■建立平均數(shù)多重比較表■由自由度dfe、極距r查臨界q值,計(jì)算最小顯著極差LSR0.05,r和LSR0.01,r■將平均數(shù)多重比較表中的各極差與相應(yīng)的最小顯著極差LSR0.05,r和LSR0.01,r比較,作出推斷例1:選用4種不同劑型的配合飼料作太湖豬的配合飼料劑型試驗(yàn),每一劑型飼喂5頭太湖豬,得增重?cái)?shù)據(jù)如下,試對(duì)不同劑型飼料對(duì)太湖豬增重效果的差異進(jìn)行檢驗(yàn)。**a.建立平均數(shù)多重比較表b.計(jì)算最小顯著極差極距(r)234q0.05q0.013.004.133.654.78
4.055.19LSR0.05LSR0.013.435
4.7294.1785.4714.6355.940查qα值,計(jì)算最小顯著極差c.比較,推斷****(2)SSR法SSR法(shortestsignificantranges)又稱為新復(fù)極差法(newmultiplerangemethod)和Duncan法
SSR法的尺度公式為:SSR法與q法的檢驗(yàn)步驟相同■LSD法、q法和SSR法檢驗(yàn)尺度的關(guān)系LSD法≤SSR法≤q法
極距r=2時(shí),取等于號(hào)
極距r≥3時(shí),取小于號(hào)2.組內(nèi)樣本容量不等的單因素資料
2.1平方和、自由度的剖分2.2F檢驗(yàn)步驟與組內(nèi)樣本容量相等的單因素資料相同
2.3多
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 儋州市八一糖廠中學(xué)2026年春季學(xué)期招聘教師備考題庫(kù)及一套完整答案詳解
- 2026年招聘廣州南沙人力資源發(fā)展有限公司儲(chǔ)備編外工作人員備考題庫(kù)儲(chǔ)備人才含答案詳解
- 烏魯木齊銀行2025年秋季招聘?jìng)淇碱}庫(kù)及參考答案詳解一套
- 安全生產(chǎn)聯(lián)合懲制度
- 輪胎安全生產(chǎn)操作制度
- 管材生產(chǎn)衛(wèi)生管理制度
- 安全生產(chǎn)考評(píng)制度
- 生產(chǎn)部裝配管理制度
- 生產(chǎn)派工單制度
- 工廠生產(chǎn)安全制度
- 2025年水利工程質(zhì)量檢測(cè)員資格考試模擬試題:(巖土工程)復(fù)習(xí)題庫(kù)及答案
- 廣東省深圳市羅湖區(qū)2024-2025學(xué)年六年級(jí)上學(xué)期語(yǔ)文11月期中試卷(含答案)
- 耳聾護(hù)理查房記錄
- 中國(guó)臨床腫瘤學(xué)會(huì)(CSCO)食管癌診療指南2025
- 二保焊培訓(xùn)課件
- 工程變更通知(ECN)流程及管理規(guī)范
- 2025至2030中國(guó)助聽器行業(yè)調(diào)研及市場(chǎng)前景預(yù)測(cè)評(píng)估報(bào)告
- 2025-2030碳纖維復(fù)合材料成型設(shè)備技術(shù)發(fā)展與市場(chǎng)前景
- 2025時(shí)事政治試題庫(kù)(附含參考答案)
- 宮腔鏡手術(shù)的護(hù)理常規(guī)
- 機(jī)械標(biāo)準(zhǔn)-G類-管件
評(píng)論
0/150
提交評(píng)論