版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第五章方差分析第一節(jié)概述前面介紹了兩樣本均數(shù)比較的t檢驗(yàn),但在實(shí)際研究中經(jīng)常需要多組均數(shù)的比較。如:例5.1患有某種腫瘤的大白鼠接受不同實(shí)驗(yàn)處理后(對(duì)照未服藥;服抗癌A藥;服抗癌B藥;服抗癌C藥),2周后體內(nèi)存活的腫瘤細(xì)胞數(shù)如表5.1所示,比較不同實(shí)驗(yàn)處理后的平均存活腫瘤細(xì)胞數(shù)是否有差異。表5.1不同實(shí)驗(yàn)處理后存活腫瘤細(xì)胞數(shù)(有絲分裂細(xì)胞/10個(gè)高倍鏡視野)對(duì)照服抗癌A藥服抗癌B藥服抗癌C藥合計(jì)48452355051206464722052481924847212504N565622x48.8048.0021.003.1733.45s2.282.191.582.2320.14本例中共有4種實(shí)驗(yàn)處理,在實(shí)驗(yàn)設(shè)計(jì)中稱(chēng)為一個(gè)因素中的4個(gè)水平:第一個(gè)水平為對(duì)照處理;第二個(gè)水平為服用A藥處理;第三個(gè)水平為服用B藥處理;第四個(gè)水平為服用C藥處理。根據(jù)本例的研究問(wèn)題,相應(yīng)的假設(shè)檢驗(yàn)為H。:叫=巴=巴=巴vsHr叫,巴,巴,巴不全相同不能用t檢驗(yàn)進(jìn)行兩兩比較,第一類(lèi)錯(cuò)誤會(huì)增大。由于本例共有4組的均數(shù)需要比較。如果用t檢驗(yàn)進(jìn)行兩兩比較,共要進(jìn)行C2二6次4t檢驗(yàn)。如果每次t檢驗(yàn)犯第一類(lèi)錯(cuò)誤的概率為0.05,則不犯第一類(lèi)錯(cuò)誤的概率為0.95,6次都不犯第一類(lèi)錯(cuò)誤的概率為0.956二0.7351,因此在6次t檢驗(yàn)中至少有一次犯第一類(lèi)錯(cuò)誤的概率為1-0.956二0.2649>>0.05。由此可見(jiàn)用t檢驗(yàn)進(jìn)行多組均數(shù)的比較會(huì)增大犯第一類(lèi)錯(cuò)誤的概率。要用方差分析或多組的秩和檢驗(yàn)(KruskalWallistest)的方法進(jìn)行多組比較:方差分析的英文全稱(chēng)為AnalysisofVariance,縮寫(xiě)簡(jiǎn)稱(chēng)為AN0VA。統(tǒng)計(jì)分析策略■如果每一組資料服從正態(tài)分布(或大樣本),并且方差齊性,則可以用方差分析的方法進(jìn)行比較?!鋈绻讲畈积R或小樣本而非正態(tài)分布,則用KruskalWallis進(jìn)行檢驗(yàn)。第二節(jié)完全隨機(jī)設(shè)計(jì)資料的方差分析一、完全隨機(jī)設(shè)計(jì)表5.1不同實(shí)驗(yàn)處理后存活腫瘤細(xì)胞數(shù)(有絲分裂細(xì)胞/10個(gè)高倍鏡視野)對(duì)照(i=l)服抗癌A藥(1=2)服抗癌B藥(1=3)服抗癌C藥(1=4)合計(jì)48452355051206464722052481924847212504n565622X 48.8048.0021.003.1733.45s 2.282.191.582.2320.14例5.1就是完全隨機(jī)設(shè)計(jì)的資料。該例中的處理因素是不同的實(shí)驗(yàn)處理(即服用不同藥物情況),共有4個(gè)水平,對(duì)照未服藥、服抗癌A藥、服抗癌B藥和服抗癌C藥,觀察指標(biāo)是大白鼠體內(nèi)存活腫瘤細(xì)胞數(shù),觀察結(jié)果及部分描述統(tǒng)計(jì)量見(jiàn)表5.1。二、變異的分解(以本例為例)組間變異SS =n(X-X)+n(X-X)+n(X-X)+n(X-X)組間1 1 2 2 3 3 4 4其中X,X,X,X為第1組,第2組,第3組和第4組的樣本均數(shù),X為所有數(shù)據(jù)1234的平均數(shù)。自由度v=4—1=3組內(nèi)變異SS=(n-1)S2+(n-1)S2+(n-1)S2+(n-1)S2組內(nèi)1 1 2 2 3 3 4 4S,S,S,S為各組的樣本標(biāo)準(zhǔn)差。1234自由度v=22—4=18可以證明:H:卩二卩二卩二卩成立時(shí),SS較小0 1 2 3 4 組間H:卩二卩二卩二卩不成立時(shí),SS較大0 1 2 3 4 組間H屮=卩=卩=卩是否成立與組內(nèi)變異SS士無(wú)關(guān)。0 1 2 3 4 組內(nèi)SS=SS+SS,其中總 組間 組內(nèi)SS=(x-X)2+(x-X)2++(x-X)2+(x-X)2++(x-X)2總1121511264=荒(x-X)2 … …ijj=1i其中X表示所有資料的平均數(shù),用N表示總樣本量(本例N=5+6+5+6=22)。資料乂彳越離散,SS越大,反之亦然。ijSS還與樣本的自由度(degreeoffreedom)=N—1有關(guān)(N為總樣本量),自由度增大,SS增大。組內(nèi)變異自由度為v組內(nèi)=N-k由于組間變異和組內(nèi)變異與自由度有關(guān),所以不能直接比較離均差平方和。將各部分的離均差平方和除以各自的自由度,得到相應(yīng)的平均變異指標(biāo):均方(meansquare,記為MS)。組間變異和組內(nèi)變異的均方可通過(guò)公式5.7和公式5.8計(jì)算得到。MS組間SS= ■組間v組間(5.7)SSMS= ■組內(nèi)(5.8)組內(nèi)v組內(nèi)均方消除了自由度的影響,因而可以進(jìn)行比較。將組間均方除以組內(nèi)均方,就得到方差分析的檢驗(yàn)統(tǒng)計(jì)量F。MSF=組間 (5.9)MS組內(nèi)可以證明,當(dāng)H成立時(shí),貝yF服從自由度為k-1和N-k的F分布;若H不成立,則F00不服從F分布,且大多數(shù)情況下,F(xiàn)遠(yuǎn)大于1。因此,可通過(guò)F的大小判斷H。的成立與否。三、方差分析的步驟建立假設(shè)并確定檢驗(yàn)水準(zhǔn)根據(jù)例5.1的題意,可作如下假設(shè):H:不同實(shí)驗(yàn)組大白鼠體內(nèi)存活的腫瘤細(xì)胞數(shù)的總體均數(shù)相同,即卩=卩=卩=卩;01234H1:不同實(shí)驗(yàn)組大白鼠體內(nèi)存活的腫瘤細(xì)胞數(shù)的總體均數(shù)不全相同。檢驗(yàn)水準(zhǔn):a=0.052、 計(jì)算檢驗(yàn)統(tǒng)計(jì)量根據(jù)表5.3的計(jì)算公式,可計(jì)算各變異部分的離均差平方和、自由度、均方和檢驗(yàn)統(tǒng)計(jì)量F值。表5.3完全隨機(jī)設(shè)計(jì)資料方差分析的計(jì)算公式(k個(gè)樣本)
變異來(lái)源離均差平方和(SS)自由度(u)均方(MS)F值組間變異工n(xj.j-X)2k-1SS組間VMS組間MSj組間組內(nèi)組內(nèi)變異莎 (xij—X)2.jN-kSS組內(nèi)Vji組內(nèi)總變異莎(xij-X)2N-1本例計(jì)算為用Stata軟件計(jì)算如下groupx148150146152148245251247248247250323320322319321454640424244由于本例樣本量較少,正態(tài)性檢驗(yàn)有些困難。可以采用各組資料減去相應(yīng)的樣本均數(shù),然后再檢驗(yàn)。因此先計(jì)算各組的樣本均數(shù),Stata命令tabgroup,su(x)
| Summaryofxgroup| MeanStd.Dev. Freq. + 1|48.82.280350952|482.190890263|211.581138854|3.16666672.2286026 + Total| 29.818182 20.136762 22gend=0replaced=x-48.8ifgroup==1replaced=x-48ifgroup==2replaced=x-21ifgroup==3replaced=x-3.166667ifgroup==4d稱(chēng)為殘差。進(jìn)行正態(tài)性檢驗(yàn)sktestdjoint Prob>chi20.3633joint Prob>chi20.3633Variable|Pr(Skewness)Pr(Kurtosis)adjchi2(2) + d| 0.853 0.181 2.03沒(méi)有證據(jù)認(rèn)為資料偏態(tài)分布。Stata命令:oneway觀察變量分組變量,t本例命令:onewayxgroup,tonewayxgroup,t| Summaryofxgroup| MeanStd.Dev. Freq. + 1|48.82.280350952|482.190890263|211.581138854|3.16666672.2286026 + Total| 29.818182 20.136762 22AnalysisofVarianceSource SS dfMS FProb>FBetweengroups 8435.63939 3 2811.8798 635.59 0.0000Withingroups 79.6333333 18 4.42407407Total 8515.27273 21 405.489177Bartlett'stestforequalvariances:chi2(3)= 0.5947Prob〉chi2=0.898藍(lán)色處為方差齊性檢驗(yàn)。P=0.898〉0.1,所以不能認(rèn)為方差不齊。均數(shù)的比較的P值〈0.0001,因此拒絕H0卩二卩二卩二卩,并可以認(rèn)為各組均數(shù)不全相01234等。因此需用進(jìn)一步組間兩兩比較,以確定那些組之間確有差異。兩兩比較有許多方法,此處近介紹兩種方法:lsd方法和Bonferroni方法lsd稱(chēng)為最小差異檢驗(yàn),適用于探索性研究。命令如下:lsdxgroupLSD方法進(jìn)行兩兩均數(shù)比較輸入效應(yīng)變量分組變量mean1-mean2=0.800000P-value=0.537814mean1-mean3=27.800000P-value=0.000000mean1-mean4=45.633333P-value=0.000000mean2-mean3=27.000000P-value=0.000000mean2-mean4=44.833333P-value=0.000000mean3-mean4=17.833333P-value=0.000000mean1-mean2=0.800000P-value=0.537814mean1-mean3=27.800000P-value=0.000000mean1-mean4=45.633333P-value=0.000000mean2-mean3=27.000000P-value=0.000000mean2-mean4=44.833333P-value=0.000000mean3-mean4=17.833333P-value=0.000000因此第1組和第2組之間的差異沒(méi)有統(tǒng)計(jì)學(xué)意義(nosignificant),第1組和第2組的平均存活腫瘤細(xì)胞數(shù)分別高于第3組和第4組,第3組的平均存活腫瘤細(xì)胞數(shù)也高于第4組,差別有統(tǒng)計(jì)學(xué)意義。(thedifferencesarestatisticallysignificant)。Bonferroni是一種比較保守的兩兩比較方法,通常用于比較慎重的研究結(jié)果。命令如下:onewayxgroup,bAnalysisofVarianceSourceSSdfMSProb>FBetweengroups8435.639392811.8798635.590.0000Withingroups79.633333318 4.42407407Total8515.2727321 405.489177SourceSSdfMSProb>FBetweengroups8435.639392811.8798635.590.0000Withingroups79.633333318 4.42407407Total8515.2727321 405.489177Bartlett'stestforequalvariances:chi2(3)= 0.5947Prob〉chi2=0.898Comparisonofxbygroup(Bonferroni)RowMean-|ColMean| 1 2 3 + 2|-.8||1.0003|-27.8-27||0.0000.0004|-45.6333-44.8333-17.8333|0.0000.0000.000紅色處為P值。本例結(jié)果與LSD相同。Bonferroni方法計(jì)算的P值=min(LSD的P值X比較次數(shù),1)本例的比較次數(shù)為3,所以Bonferroni方法計(jì)算的P值=LSD的P值X3但是,第一組與第二組比較的LSD的P值X3>1,所以Bonferroni方法計(jì)算的P值=1。單因素多組資料的秩和檢驗(yàn)成組設(shè)計(jì)多組計(jì)量資料的處理效應(yīng)的比較,如果資料不滿足完全隨機(jī)設(shè)計(jì)的方差分析的應(yīng)用條件,可用Kruskal-WallisH檢驗(yàn)(Kruskal-WallisHtest)。Kruskal-WallisH檢驗(yàn)用于推斷計(jì)量資料或等級(jí)資料的多個(gè)獨(dú)立樣本所來(lái)自的多個(gè)總體的分布是否相同。統(tǒng)計(jì)檢驗(yàn)方法、步驟和基本思想見(jiàn)例8.4。(一)計(jì)量資料的多個(gè)樣本比較例8.4研究單味中藥對(duì)小鼠細(xì)胞免疫機(jī)能的影響,把40只小鼠隨機(jī)分為4組,每組10只,雌雄各半,用藥15天后,測(cè)定E-玫瑰結(jié)形成率(X:%),結(jié)果見(jiàn)表8.4第(1)、(3)、(5)、(7)欄。問(wèn):?jiǎn)挝吨兴帉?duì)E-玫瑰結(jié)形成率有無(wú)影響?表8.4四組E-玫瑰結(jié)形成率(X:%)比較對(duì)照組黨參組黃芪組淫羊霍組XXXX(1)(2)(3)(4)1421243510242027121822331617182913221731
141921401218183510232230132019289182336本例為百分率資料,不符合正態(tài)分布,現(xiàn)用Kruskal-WallisH檢驗(yàn)。統(tǒng)計(jì)分析步驟如下:檢驗(yàn)假設(shè):H:四組E-玫瑰結(jié)形成率的總體分布相同0H]:四組E-玫瑰結(jié)形成率的總體分布不全相同a二0.05編秩:把四個(gè)樣本數(shù)據(jù)混合從小到大編秩次,求秩和并確定檢驗(yàn)統(tǒng)計(jì)量:分組求秩和,按下式求檢驗(yàn)統(tǒng)計(jì)量H值。TOC\o"1-5"\h\z12y__ 12 VR2H二 乙n(R-R)2二 (乙十)-3(N+1) (85)N(N+1) ii N(N+1) ni如果H成立,各個(gè)總體相同,各組的平均秩R應(yīng)該非常接近總的平均秩R,即:在通常情0i況下,統(tǒng)計(jì)量H應(yīng)該比較小,在樣本量比較大時(shí),近似服從咒2分布(Chi—Square)。反之,H不成立時(shí),各個(gè)總體不相同,各組的平均秩斤應(yīng)遠(yuǎn)離總的平均秩R,統(tǒng)計(jì)量H值會(huì)增大。用Stata軟件進(jìn)行檢驗(yàn)如下Stata格式如下:gx11411011211611311411211011319221224218217
222219218223220218324320322318317321318322319323435427433429431440435430428436Stata命令kwallis觀察變量,by(分組變量)本例:kwallisx,by(g)kwallisx,by(g)Test:Equalityofpopulations(Kruskal-Wallistest)g_Obs_RankSum11055.00210200.00310210.00410355.00chi-squared=32.963bability二0.0001chi-squaredwithties=33.072bability二0.0001Kruskal-Wallis檢驗(yàn)的P值=0.0001〈,所以可以認(rèn)為四組樣本所在總體不全相同。進(jìn)一步檢驗(yàn)可以用兩組比較的Wilcoxon秩和檢驗(yàn),結(jié)合Bonferroni校正P值的方法進(jìn)行檢驗(yàn),但要根據(jù)研究問(wèn)題,有選擇地進(jìn)行比較,僅可能地減少比較的次數(shù)。第二節(jié)隨機(jī)區(qū)組設(shè)計(jì)資料的方差分析隨機(jī)區(qū)組設(shè)計(jì)的優(yōu)點(diǎn)是每個(gè)區(qū)組內(nèi)的k個(gè)受試對(duì)象有較好的同質(zhì)性,組間均衡性較好,與完全隨機(jī)設(shè)計(jì)相比,可以較好地減少非研究因素對(duì)觀察結(jié)果的影響(稱(chēng)為偏倚,Bias);缺點(diǎn)是要求區(qū)組內(nèi)受試對(duì)象數(shù)與處理數(shù)相等,實(shí)驗(yàn)結(jié)果中若有數(shù)據(jù)缺失,統(tǒng)計(jì)分析較麻煩。在醫(yī)學(xué)科學(xué)研究中的隨機(jī)區(qū)組設(shè)計(jì)主要有以下幾種情況:1.配對(duì)或配伍的k(k±2)個(gè)受試對(duì)象分別接受k種處理(即一個(gè)處理因素的k個(gè)水平)之后的數(shù)據(jù);2.同一樣品用k種方法(或儀器等)檢驗(yàn)的結(jié)果;3.同一受試對(duì)象k個(gè)部位的數(shù)據(jù)。對(duì)于隨機(jī)區(qū)組設(shè)計(jì)資料的統(tǒng)計(jì)分析,根據(jù)資料性質(zhì)(定量或分類(lèi)資料)、處理組數(shù)以及符合的統(tǒng)計(jì)分析條件,可選用配對(duì)t檢驗(yàn),配對(duì)秩和檢驗(yàn),配對(duì)卡方檢驗(yàn),隨機(jī)區(qū)組的方差分析,隨機(jī)區(qū)組的秩和檢驗(yàn)等。例1:某研究者將24名貧血患兒按年齡及貧血程度分成8個(gè)區(qū)組(b=8),每個(gè)區(qū)組的3個(gè)對(duì)象的年齡非常接近并且貧血程度也非常接近,每區(qū)組中三名兒童用隨機(jī)的方式分配給A、B和C三種不同的治療方法(處理組,k=3)。治療后血紅蛋白含量的增加量(g/L)列表如下(倪宗瓚,《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》第二版P84)表1貧血患兒不同療法治療后血紅蛋白含量的增加量(g/L)區(qū)組A療法B療法C療法1161818215162031927354131323511141761081275388-2-23隨機(jī)區(qū)組設(shè)計(jì)要求每個(gè)處理組內(nèi)的研究對(duì)象個(gè)數(shù)必須是相同的,并且每個(gè)區(qū)組的觀察例數(shù)也是相同的。隨機(jī)區(qū)組設(shè)計(jì)的觀察資料一般形式如表5.6所示的二、變異分解根據(jù)隨機(jī)區(qū)組設(shè)計(jì)的性質(zhì),在例5.2中,血紅蛋白含量增加量的變異除了總變異、處理組間變異(不同治療方案之間)和個(gè)體變異外,還有區(qū)組間變異(不同組年齡和貧血程度之間)。各種變異之間的關(guān)系可用公式5.10表示:SS=SS +SS +SS (5.10)總 處理組間 區(qū)組間誤差
1、處理組間變異描述了不同治療方案對(duì)應(yīng)的血紅蛋白含量增加量的樣本均數(shù)之間的差異 SS=n工(x—X)2 (5-11)處理 .jj其中x)為第j個(gè)處理組的樣本均數(shù),自由度為v處理二k-1。如果3種治療效果相同,則對(duì)應(yīng)的總體均數(shù)應(yīng)該相同,各個(gè)樣本均數(shù)之間的差異一般會(huì)很小,所以SS處理較??;如果3種治療效果不同,對(duì)應(yīng)的總體均數(shù)不同,各個(gè)樣本均數(shù)之間處理的差異會(huì)較大,相應(yīng)的SS處理較大。處理3、區(qū)組間變異是指不同區(qū)組的血紅蛋白含量增加量樣本均數(shù)之間差異SS=k工(X—X)2 (5.12)區(qū)組 i.i由于同一區(qū)組的年齡和貧血程度非常接近,而不同年齡和貧血程度不同,它反映了不同年齡和貧血程度對(duì)血紅蛋白含量增加量樣本均數(shù)的影響。4、誤差是指總變異中排除了處理變異和區(qū)組變異外,僅僅由隨機(jī)誤差引起的變異。其SS誤差的計(jì)算公式可以根據(jù)公式(5.13)來(lái)獲得:誤差SS=SS-SS -SS (5.13)誤差 總 處理 區(qū)組其自由度為v誤差二(k-l)(n-l)根據(jù)計(jì)算所得的SS和自由度,可計(jì)算變異來(lái)源各部分的均方:MS處理MSMS處理MS區(qū)組MS、口Air誤差然后可以得到兩個(gè)F值:SS處理v處理SS―區(qū)組v區(qū)組SS、口Air 誤差v、口Air誤差(5.14)(5.15)(5.16)MSF二■處理處理MSF二■處理處理MS、口Air誤差MSF二區(qū)組區(qū)組MS、口Air誤差然后用F分布進(jìn)行檢驗(yàn)。(5.17)(5.18)即:比完全隨機(jī)分組的方差分析多分離一個(gè)區(qū)組變異用Stata軟件進(jìn)行統(tǒng)計(jì)分析如下數(shù)據(jù)格式gblockx1116211831181215221632201319232733351413241334231511251435171610268361217527337818-228-2383Stata命令:anova觀察變量處理變量區(qū)組變量本例命令anovaxgblockNumberofobs = 24 R-squared = 0.9427RootMSE = 2
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 火電廠衛(wèi)生清掃制度
- 初中學(xué)生個(gè)人衛(wèi)生制度
- 公共衛(wèi)生委員工作制度
- 局愛(ài)國(guó)衛(wèi)生評(píng)比制度
- PE給水管衛(wèi)生管業(yè)制度
- 餐飲人員手衛(wèi)生制度
- 辦公室衛(wèi)生設(shè)備樂(lè)捐制度
- 餐飲業(yè)勞動(dòng)安全衛(wèi)生制度
- 醫(yī)院衛(wèi)生室安全管理制度
- 局環(huán)境衛(wèi)生整治制度
- 完整工資表模板(帶公式)
- 家長(zhǎng)要求學(xué)校換老師的申請(qǐng)書(shū)
- 奇瑞汽車(chē)QC小組成果匯報(bào)材料
- 闌尾腫瘤-課件
- CTT2000LM用戶手冊(cè)(維護(hù)分冊(cè))
- 川2020J146-TJ 建筑用輕質(zhì)隔墻條板構(gòu)造圖集
- 正式員工派遣單
- 新員工入職申請(qǐng)表模板
- 中外新聞事業(yè)史課程教學(xué)大綱
- LY/T 1357-2008歧化松香
- 化工廠常見(jiàn)隱患危害因素及防范措施
評(píng)論
0/150
提交評(píng)論