版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、PAGE PAGE 85第四章 方差分析方差分析(Analysis of Variance,ANOVA)是將待分析資料的總變異(biny)剖分為不同的變異來源,以獲得不同變異來源的總體方差的估計值。通過F檢驗,完成多個樣本(yngbn)平均數之間的差異顯著性檢驗(即多重比較),若處理效應為隨機模型時,則進行方差組分的估計。4.1 方差分析的SAS過程(guchng)用于方差分析的主要過程有方差分析(ANOVA)和廣義線性模型(GLM)。對于無缺省(缺值、缺組等)資料,或稱平衡資料,一般采用(ANOVA)過程,對缺省資料(非平衡資料)應采用(GLM)過程。事實上根據效應模型的不同,還有VARCO
2、ME(方差組分)過程,MIXED(混合模型)過程等。4.1.1 ANOVA過程1. 名詞解釋自變量與依變量 在方差分析中,自變量可稱為獨立變量、定性變量(Qualitative Variale)、分類變量(Classiflcation Variable)或類別變量(Categorcal Variable),相當于因素處理、水平變量。依變量又稱反應變量(Response Variable),相當于觀察值變量。實驗效應 方差分析的目的是找出對依變量產生的實驗效應,這種效應可分為3種:主效應,常以自變量的英文字母表示,如A、B等?;プ餍?,常以星號聯接自變量表示,如A*B。嵌套效應,以小括號表示,如
3、A(B)表示A效應嵌套在B效應之內。2 過程格式:PROCANOVACLASSMODELMEANSFREQTESTMANOVABY選項串;變量名稱串;依變量名稱串=效應串/選項串;效應名稱串/選項串;變量名稱;H=效應名稱 E=效應名稱H=效應名稱 E=效應名稱 M=變量的轉換式;PREFIX=新變量的名稱代號;MNAMES=新變量的名稱串/選項串;變量名稱串語句(yj)說明:CLASS指令(zhlng)必須出現在MODEL指令(zhlng)之前,如選用TEST、MANOVA指令,則它們必須出現在MODEL指令之后。MEANS、TEST及MANOVA等指令可重復使用,其他指令則只能出現一次。P
4、ROC ANOVA選項串中:DATA=輸入數據集名稱,指明對它執(zhí)行ANOVA分析。MANOVA 要求將含一個或一個以上依變量遺漏數據的觀察值剔除。OUTPUT=(含分析結果的)輸出文件名稱,包括平方和(SS),F檢驗值,以及各效應的顯著程度。CLASS變量名稱串 指明自變量,自變量可以是數值的或文字的。MODEL指令 定義分析所用的線性數學模型(見表61),刪除號(/)后的選項:NOUNI:不印出單變量方差分析的結果,適用于多變量的方差分析。INT:要求SAS把線性模型內的截距(即資料的總平均數)當成一個參數,同時對這個截距作是否為零的假設檢驗。MEANS指令 前半部要求算出某些自變量(或互作
5、)中各組的平均數,后半部(刪除號后)共有24個選項,前17個選項分別對MEANS指令中所列的主效應平均數進行多種方法的多重比較。這些選項有:BON:修正最小顯著差異t檢驗。DUNCAN:鄧肯多重范圍檢驗,即鄧肯氏新復極差法。DUNNETT(控制組組名):鄧尼特控制差異檢驗。它是依據t分布由各組平均數與控制組(指定組如對照組)進行比較,采用雙尾檢驗。DUNNETTL(控制組組名):鄧尼特小于控制均數檢驗。與控制組平均數的比較,采用單尾檢驗,臨界值訂在t分布的下端。DUNNETTU(控制組組名):鄧尼特大于控制均數檢驗。與控制組平均數的比較,采用單尾檢驗,臨界值訂在t分布的上端。GABRIEL:貴
6、博氏多重比較。REGWF:REGW多重F檢驗。REGWQ:REGW多種t檢驗。SCHEFFE:執(zhí)行沙菲氏(Scheffe)的多重比較檢驗。SIDAK:Sidak調整T檢驗。SUM(或GTI):Sidak獨立樣本t檢驗。當兩組樣本含量不等時為哈氏(Hochberg)的GTI檢驗。SNK:紐曼庫爾多重范圍檢驗,即q檢驗。T(或LSD):配對t檢驗或費歇爾最小顯著差異檢驗。TUKEY:圖基固定極差檢驗。WALLER:娃爾鄧肯 K比率t檢驗。以上17種檢驗法最常用的為、。其它主要選項還有ALPHA=P:界定檢驗的顯著水準。內設值為P=0.05。當上面選項與選項并用時,P值必須是0.10、0.05、0.
7、01三者之一。與上面其他檢驗選項時,P可以是0.0001與0.9999間任何的值。LINES:將顯著性檢驗的平均數,由大到小排列。若某一對平均數之間無顯著差異,則將它們印在同一行上,并以虛線將它們與其他有顯著差異的平均數分開。當選用、或等檢驗時,此選項會自動被包括在內,否則,必須附加此選項。CLM:效應的各組平均數以置信區(qū)間方式表示。此項必須與、等聯用。(21)CLDIFF:與(20)相仿,選用、時,附加此選項,將以置信區(qū)間方式顯示各組平均數。(22)E=效應名稱:它界定各顯著檢驗的分母,缺省時以誤差項的均方自動成為分母。FREQ指令(zhlng) 指明(zhmng)該變量值為各觀察值重復出現
8、的次數。TEST指令(zhlng) 用來指定F檢驗的分子與分母,H=分子,E=分母;一般而言,系統(tǒng)自動采用誤差項的均方作為F檢驗的分母。但對于隨機模型等,可選此項。MANOVA指令 主要用于執(zhí)行多變量(多元)方差分析。BY指令 用于把數據文件分成幾個小文件,然后逐一進行ANOVA分析,但文件內的數據必須先按照BY變量串的值做由小到大的重新排列。此步驟可籍PROC SORT達成。以上指令中MODEL指令至關重要,同一資料,分析結果依模型不同而異。常用的模型定義語句有:MODEL Y=A;單因素方差分析,MODEL Y=A B兩因素主效應模型,MODEL Y=A B A*B兩因素帶互作模型,MOD
9、EL Y=A B(A)嵌套(NESTED)模型用于系統(tǒng)分組資料。MODEL Y1、Y2=A兩元單因素方差分析。在模型定義中,可用“|”和“n”簡化表達?!皘”等價于按Searle規(guī)則將效應從左到右展開,“n”表示互作效應和嵌套效應所包含的最多變量數。各種模型簡化表示法及其等價形式列于下表。表41模型簡化表示法及其等價形式簡化表示法等價形式 A|BA|B|CA|B|C2A|C(B)A(B)|C(B)A|B(A)|CA|B(A)|C2A B A*BA B A*B C A*C B*C A*B*CA B A*B C A*C B*CA C(B) A*C(B)A(B) C(B) A*C(B)A B(A)
10、C A*C B*C(A)A B(A) C A*C結果輸出包括分類變量信息表,方差分析表及多重比較表等。4.1.2 GLM過程1. 概述GLM是廣義(gungy)線性模型(General Linear Model)的簡稱(jinchng),其推算參數(cnsh)的理論依據是最小誤差平方法(The Least Squares Method)。最適宜于非平衡設計的資料,該過程可應用于多種不同的統(tǒng)計分析。本章僅介紹在方差分析方面的用途。2. 過程格式:PROCGLMCLASSMODELMEANSCONTRASTESTIMATELSMEANSMANOVAOUTPUTRANDOMTESTFREQBY選項串
11、;變量名稱串;依變量名稱串=效應串/選項串;效應名稱串/選項串;比較式的名稱各組效應系數據/選項串; 估計值的名稱各組效應系數據/選項串;效應名稱串/選項串;H=效應名稱 E=效應名稱 M=變量的轉換式;PREFIX=新變量的名稱代號;MNAMES=新變量的名稱串/選項串;OUT=輸出文件名稱 關鍵字=變量串;效應名稱串/選項串;H=效應名稱 E=效應名稱/選項串;變量名稱; 變量名稱 語句說明: 格式中第1、3條指令是不可省略的,CLASS指令必須出現在MODEL、MEANS指令之前,其余均應出現在MODEL指令之后(但BY可出現在RUN前任何一處)。PROC GLM選項串中: DATA、
12、MANOVA、 OUTPUT的含義與ANOVA選項串中的相同。 NOPRINT:要求分析結果不在報表上打印出來,一般不用此選項。MULTIPASS:要求重讀輸入資料文件內的數據,也不常用。 ORDER=FREQ |DATA| INTERNAL|FORMATTED:界定自變量內各水平(組別)的次序,該選項與CONTRAST及ESTIMATE指令相關。當ORDER=FREQ時,觀察值個數最多的那一組為第一組,余類推。當ORDER=DATA時,組別按輸入資料文件中各組第一次出現的次序而定。當ORDER=INTERNAL時,組別按其代號由小到大排列,或按各組名稱的英文字母順序排列。當ORDER=FOR
13、MATTED時,則組別的順序以外部的格式而定,此項為內設值。CLASS指令 指明自變量。MODEL指令(zhlng)的前半部可參見表41,刪除號后的選項串大致可分四類(s li)。第一類與截距(常數項)有關。NOINT:把截距排除(pich)模型之外。INT:印出截距統(tǒng)計檢驗。第二類與報表有關。NOUNI:不打印單因素方差分析結果(常用于多變量分析)。SOLUTION:打印一般線模型中參數的估計值,當省略CLASS指令時,程序會自動印出此解。TOLERANCE:印出容忍量。其定義為1R2,R2為自變量與依變量的相關指數。第三類與無效假設的檢驗有關。E:要求印出所有可估計函數(Estimable
14、 Functions)的值。E1;或E2:或E3:或E4:只要求印出每一效應第一、或第二、或第三、或第四型可估計函數值。SSI:或SS2:或SS3:或SS4:只印出每一效應第一、或第二、或第三、或第四型的平方和。第四類與控制計算過程的打印有關。XPX:要求印出(XX)的向量積距陣INVERST(或I):要求印出(XX)的逆距陣,或(XX)通用逆距陣。MEANS指令的后半部分(刪除號后)的選項,前22項可參見ANOVA過程。另有DEPONLY:要求印出依變量的平均數,若省略此項,程序會印出文件中所有連續(xù)性變量的平均數。ETYPE=1(或2、或3、或4):界定F檢驗中分母距陣的均方類型,內設為分析
15、過程檢驗中最高的一型。HTYPE=1(或2、或3、或4):與WALLER選項并用,界定F檢驗中分子距陣的均方類型,內設為分析過程檢驗中最高的一型。CONTRAST指令 用于對比檢驗,即以線性方程序重新組合參數據執(zhí)行檢驗。其中“比較式的名字”必須放在單引號內,名字長度以20個字母為限;各組效應系數前必須先注明所要比較的效應,這些效應必須是MODEL中出現過的。橫行系數總和必須是0,不接受分數。若有多個比較式,則以逗號將各橫行隔開。刪除號后有E:印出線性函數的向量L。E=效應名稱:界定F檢驗的分母內設為誤差項均方。ETYPE=1(或2:或3:或4):界定平方和的類型等。ESTIMATE指令 用于檢
16、驗參數線性組合。LSMEANS指令 用于計算依據最小誤差平方法所得的平均數。主要選項有:E:最小誤差平方平均數(Lsm)計算過程中所用到的可估計函數值。STDERR:印出t檢驗(Ho:Lsm0) 的分母與其顯著程度。TDIFF:印出各平均數比較的t值及顯著程度。PDIFF:印出各平均數比較后的顯著程度。E=效應名稱:必須與、選項并用,指定某一效應均方作為t檢驗的分母。缺省時,GLM自動采用誤差項的均方作為t檢驗的分母。ETYPE=1(或2:或3:或4):指定中效應均方的類型。MANOVA指令 請參閱 4.3。OUTPUT指令(zhlng)中,OUT=輸出資料文件名稱,這個(zh ge)文件含原
17、輸入資料文件的所有變量,以及指令中所提到的關鍵字。關鍵字=變量(binling)名稱串:關鍵字主要有P=預測值。R=預測誤差。L95M(或U95M)=依變量平均數95%置信區(qū)間的下限(或上限)。L95(或U95)=依變量預測值95%置信區(qū)間的下(或上)限。STDP=預測值平均數的標準差。KSTDP=誤差的標準差。STDI=個別預測值的標準差。STUDENT=經過標準化的誤差。H=影響力,定義為Xi(XX)Xi。RANDOM指令 指定模型中的隨機效應。選項串中Q:給出所有固定效應的二次形。TEST:對各式隨機效應執(zhí)行適當的F檢驗,并且F檢驗的分母完全根據效應的期望均方而定。FREQ、BY、指令與
18、ANOAV過程中相似。4.1.3 VARCOMP過程1. 概述VARCOMP過程是用于估計廣義線性模型中方差組分的值,尤其是對隨機模型的資料,或系統(tǒng)設計的資料,可用該過程完成方差組分的估計。本過程估計方差組分的方法有四種:TYPE1(一型平方和)法:因為該型平方和與模型效應的前后順序相關(如系統(tǒng)設計)。所以需要對其后效應的大小作調整,據此計算出各效應均方后進行F檢驗,其所對應的選項為:METHOD=TYPE1。MIVQUE0(最小方差二次無偏估計)法:該法估計的方差不受線性模型中固定效應的影響,隨機效應的方差只對固定效應作調整,所以該法計算過程非常節(jié)省時間,并作為VARCOMP的內設值。其選項
19、為:METHOD=MIVQUE0。ML(極大似然) 法,該法的估計過程是循環(huán)式的,直到目標函數值穩(wěn)定下來為止。其選項為METHOD=ML。REML(約束極大似然)法,該法與相異之處是先將線性模型中的隨機效應與固定效應分開,然后進行循環(huán)式的估計,直到隨機效應所對應的目標函數值穩(wěn)定下來為止。而則不加以區(qū)分。該法的選項為:METHOD=REML。2. 過程格式:PROCVARCOMPCLASSMODELBY選項串;自變量名稱串;依變量名稱串=效應串/選項串;變量名稱串;語句說明:VARCOMP選項中METHOD =TYPE1|MIVQUEO|ML|REML見概述。MAXITER = 正整數:界定ML
20、 REML中循環(huán)的最高次數,內設值等于50。EPSILON=小的正實數:界定ML或REML中目標函數穩(wěn)定性的標準,內設10-8。若兩次循環(huán)所產生的函數值 之差小于此數,則目標函數已達穩(wěn)定。CLASS、BY指令(zhlng)與ANOVA或GLM過程(guchng)相同。MODEL指令的前半部,亦與上述兩個過程相同,刪除號后的選項只有(zhyu)一個,FIXD=n(大于0的正整數,如:2):它指明指令等號右邊的前n(2)個效應是固定效應,其后的效應都是隨機效應。4.2程序應用4.2.1單因素方差分析例41選用條件基本一致的小白鼠30只,隨機分成3組,分別接種11C、9D、DSL三種菌型的傷寒桿菌,
21、觀察接種后小白鼠的存活天數如下列程序數據行中。試比較3組小白鼠的存活天數有無顯著差異。這是一個單因素設計的資料,a因素分3個水平,每個水平含10個觀察值,擬用ANOVA過程分析。1. 編程法分析(1)程序options nodate nonumber;data xu4a;do a=1 to 3;do i=1 to 10; input x ; output;end; end;cards;5 5 6 7 8 8 5 5 7 102 4 3 2 4 7 7 2 5 45 6 7 7 12 13 11 7 8 9;proc format;value trtf 1=11C 2=9D 3=DSL;proc
22、 anova; format a trtf.;class a; model x=a;means a/ duncan; means a/ duncan alpha=0.01;means a;run;(2)輸出結果 The ANOVA ProcedureClass Level InformationClassLevelsValuesa311C 9D DSLNumber of observations 30 Dependent Variable: xSourceDFSum of SquaresMean SquareF ValuePr FModel2102.066666751.033333311.21
23、0.0003Error27122.90000004.5518519Corrected Total29224.9666667R-SquareCoeff VarRoot MSEx Mean0.45369733.510582.1335076.366667SourceDFAnova SSMean SquareF ValuePr Fa2102.066666751.033333311.210.0003 Duncans Multiple Range Test for xAlpha0.050.01Error Degrees of Freedom2727Error Mean Square4.5518524.55
24、1852Number of Means2323Critical Range1.9582.0572.6442.757Means with the same letter are not significantly different.0.050.01Duncan GroupingMeanNaDuncan roupingMeanNaA8.500010DSL A8.500010DSLA6.60001011CBA6.60001011CB4.0000109D B4.0000109D Level of xaNMeanStd Dev11C106.600000001.712697689D104.0000000
25、01.88561808DSL108.500000002.67706307【程序(chngx)說明】數據(shj)步中有兩個循環(huán)體,外循環(huán)a取值1、2、3,循環(huán)(xnhun)3次(為a的水平數),內循環(huán)i取值110,循環(huán)10次(為各水平內觀察值個數),所以,整個大循環(huán)共讀入觀察值變量x(依變量)的30個數據。過程步中FORMAT語句 用于設定變量格式。VALUE語句 定義格式名trtf,當某變量使用trtf格式時,該變量若取值1、2、3,將分別用格式中定義的11C、9D、DSL表示。其語句為:FORMAT 變量名 格式名,本例為:FORMAT a trtf;即指定a的輸出格式,輸出時將a的取值1
26、、2、3,分別用11C、9D、DSL代替。設定格式和輸出格式的存在與否不影響分析結果,僅僅是為了解釋結果的方便而已。CLASS語句 指明自變量a。MODEL語句 定義單項分組資料的線性數學模型。MEANS語句 前兩個指定計算處理平均數,并用鄧肯新復極差法(SSR法)進行0.05及0.01顯著水平下的多重比較。后一個MEANS語句指定印出各處理的平均數、標準差?!窘Y果分析】輸出結果為:顯示資料的分組(自變量)信息。a有3個水平,取值為11C、9D、DSL,觀察值個數為30。為方差分析表。項目有:變異來源(Source)、自由度(DF)、平方和(Sun of Squares)、均方(Mean Sq
27、uare)、F值(F Value)及概率P(PrsF)。變異來源中有模型變異(Model),即整個處理效應的總變異,誤差項(Error)的變異以及總變異(Corrected Total)。因為只有一個A因素,因此,其下表中a間變異即為總效應的變異。F檢驗結果(F=11.21,P=.0003)表明,處理間差異達到極顯著水平。在該表下為a(自變量)與x(依變量)間的相關指數(RSquare)為:R2=模型平方和/總平方和=102.067/224.967=0.453697。Root MSE為誤差項均方根(相當于方程估測誤差) Sx=4.5518521/2=2.133507。依變量(x)的平均數=6.
28、366667,Coeff Var為剔除處理效應后依變量的變異系數CV=100%Sx/=100%2.1335/6.3667=33.5106。為多重比較表,表中列有檢驗所用的顯著水平、自由度、標準誤及LSR值(Critical Range),并注明均數前字母相同者為差異不顯著,不同者為差異顯著或極顯著。經檢驗結果表明,9D與11C、DSL兩個菌型的毒性分別達到顯著(p0.05)和極顯著(p0.05)。列出各水平的樣本含量、平均數及標準差。2. 非編程法分析先創(chuàng)建(chungjin)數據集work.xu4a,采用(ciyng)SAS/ASSIST進行(jnxng)分析,其步驟為:SolutionsA
29、SSISTData AnalysisANOVAAnalysis of VarianceTableworkxu4aokDependentxokClassificationaokAdditional OptionsOutput statisticsMeanaOptions for meansComparison TestsDuncansrange testokokGobackGobackRunSubmit【說明】結果顯示于OUTPUT窗口,其內容與編程法分析中多重比較為0.05顯著水平的相當。例42在產卵場捕得12尾鯽魚,它們的成熟系數(%)按年齡分成2年(g2)、3年(g3)及4(g4)年3個組
30、別列于程序數據行中。試檢驗不同年齡組鯽魚成熟系數有無顯著差異。這是一個單因素3個水平內觀察次數不等的資料,擬用GLM過程進行分析。1. 編程法分析(1)程序 options nodate nonumber;data xu4b;input g$ n;do i=1 to n;input x ;output;end;cards;g2 411.5 14.0 14.3 12.0g3 513.2 12.6 18.5 19.0 15.7g4 318.1 18.6 20.0;proc glm;class g; model x=g/ss3;means g / hovtest snk;means g;run;pr
31、oc npar1way wilcoxon;class g;var x;exact;run;(2)輸出(shch)結果 Dependent Variable: xSourceDFSum of SquaresMean SquareF ValuePr FModel260.952500030.47625006.470.0182Error942.41000004.7122222Corrected Total11103.3625000R-SquareCoeff VarRoot MSEx Mean0.58969613.892902.17076515.62500SourceDFType III SSMean
32、SquareF ValuePr Fg260.9525000030.476250006.470.0182 Levenes Test for Homogeneity of x VarianceANOVA of Squared Deviations from Group MeansSourceDFSum of SquaresMean SquareF ValuePr Fg298.764149.38206.210.0202Error971.56277.9514 Student-Newman-Keuls Test for xSNK GroupingMeanNgA18.9003g4 BA15.8005g3
33、B12.9504g2 Level of xgNMeanStd Devg2412.95000001.40593978g3515.80000002.93853705g4318.90000000.98488578The NPAR1WAY Procedure Wilcoxon Scores (Rank Sums) for Variable xClassified by Variable g gNSum of ScoresExpected Under H0Std Dev Under H0Mean Scoreg2414.026.005.8878413.50g3534.032.506.1576516.80g
34、4330.019.505.40832710.00 Kruskal-Wallis TestChi-Square5.6308DF2Asymptotic Pr Chi-Square0.0599Exact Pr = Chi-Square0.0504【程序(chngx)說明】Input語句(yj) 指明(zhmng)輸入一個字符變量(自變量)g,取值g2、g3、g4(3個水平名稱)、一個數字型變量n取值4、5、3(各水平內觀察次數)。Do循環(huán)語句 指定按各水平中的觀察值讀給變量g。MODEL語句中刪除號后的選項ss3:指明印出效應的第三型平方和。MEANS語句中刪除號后的選項SKN:指明用q法進行平均數
35、的多重比較。選項HOVTEST:指明進行方差同質性檢驗。同質性檢驗有多種方法,若不對HOVTEST加選擇(直接寫上)為缺省的算法,即LEVENE檢驗法。若加選擇,如HOVTEST=BARTLETT,則表明用巴特利特檢驗法等等。PROC NPAR1WAY語句 指明調用非參數檢驗過程。當資料的總體方差不同質或為非正態(tài)資料時,可調用該過程進行非參分析,NPAR1WAY后的選項主要有四種常用分析方法,它們的不同稱呼列于表42。表42四種非參數的平均數比較值選項名傳統(tǒng)的非參數分析兩個樣本時名稱多個樣本時名稱WILCOXONWilcoxon秩和檢驗或MannWhitney U檢驗多樣本KruskalWal
36、lis檢驗MEDIANBrown檢驗中位數檢驗VWVan der Waerden檢驗多樣本Van der Waerden檢驗SAVAGESavage檢驗多樣本Savage檢驗EXACT語句 指明進行非參數的精確檢驗,不選此項,NPAR1WAY在執(zhí)行大樣本分析時用卡方檢驗?!窘Y果分析】方差分析結果(F=6.47,P=0.018)表明,不同年齡組別的成熟系數間存在顯著的差異。多重比較表中,q檢驗的結果表明,只有4年齡的鯽魚成熟系數與2年齡的存在顯著的差異,其他各組間的差異均未達到5%的顯著水平。嚴格地說,只有滿足正態(tài)性和方差同質性的資料才能進行方差分析。中采用LEVENE檢驗法對資料的方差同質性進
37、行檢驗。結果(F=6.21,P=0.0202)表明,該資料相應的總體方差是不同質的(P0.05)。在這種情況下,要么尋找合適的變量變換方法,使變換的資料滿足正態(tài)性和方差同質性后,進行參數檢驗;要么采用非參數檢驗。非參數檢驗結果表明,3組之間的差異其精確概率P=0.054,用2分布作為其近似分布推算出來的概率P=0.0599,兩者都接近于0.05,表明四組資料的分布位置之間存在一定的差異。但兩兩之間的差異,SAS中未給出。列出各水平的樣本含量、平均數及標準差。2 非編程法分析創(chuàng)建(chungjin)數據集work.xu4b,用SAS/AA模塊進行方差分析和非參數檢驗以及(yj)方差同質性檢驗。(
38、1)方差分析及非參數檢驗 SolutionsAnalysisStatistical AnalysisFileOpen by SAS Nameworkxu4bokStatisaicsANOVAOneWay ANOVAxDependentgIndependentTestsNonparametricsKruskalWallisokokRunSubmit(2)方差(fn ch)同質性檢驗SolutionsAnalysisStatistical AnalysisFileOpen by SAS Nameworkxu4bokStatisaicsANOVAOneWay ANOVAxDependentgInde
39、pendentTestsLevenes TestokokSubmit 【說明】在Tests for Equal Variance復選框中可任選Levenes Test、Brown and Forsythes Test或Bartletts Test中的一種或全部非參檢驗法。輸出結果與編程法分析的結果相同。例43對不同周齡組的羅曼雞,注射某疫苗后,測定其抗體滴度(1x)列于下表。試對各組的抗體平均滴度作差異顯著性檢驗。表43 不同周齡雞抗體滴度的倒數(x)5周齡24488163210周齡881632326412815周齡163232646412825620周齡326464128256256512該
40、資料是一個單因素4水平,各水平觀察值次數相等的資料,表中數據為抗體滴度的倒數,明顯呈等比數列。此類資料多不符合方差分析的基本假定,因此有必要做正態(tài)性檢驗,若資料不符合正態(tài)分布則需要作變量變換。本例擬作對數的變換。1編程法分析(1)程序 options nodate nonumber;data xu4c; input g x; y=log(x);cards;122831643214283324641421633246418232364412818232364425611626431284256132212832564512;proc sort;by g;run;proc univariate n
41、ormal;var x;by g;run;proc anova;class g;model y=g; means g/duncan;means g; run;(2) 輸出(shch)結果 Tests for Normality (x)g=1TestStatisticp ValueShapiro-WilkW0.792083Pr W0.0342g=2TestStatisticp ValueShapiro-WilkW0.798708Pr W0.0398g=3TestStatisticp ValueShapiro-WilkW0.792083Pr W0.0342g=4TestStatisticp Val
42、ueShapiro-WilkW0.854425Pr FModel331.4868314510.4956104811.12 Fg331.4868314510.4956104811.12.0001 Duncan GroupingMeanNgA4.852074BA4.059973B3.267772C1.980471 Level of ygNMeanStd Dev171.980420520.93241148273.267693851.03696654374.059862060.93241148474.852030260.98025814【程序(chngx)說明】Input語句(yj) 指明(zhmng
43、)輸入2個變量g、x,其中g取值1、2、3、4,x為表43中的觀察值變量。Y=log(x) 是對原始數據作以e為底的對數變換。若原始數據出現0時,通常作y=log(x+1)變換。若為百分數資料應作反正弦變換,即 Y=arsin(sqrt(x)/3.14159*2*90,其中x為百分數,如50%,x=0.5。第1、2過程步 指明對原始數據x做正態(tài)性檢驗。第3過程 調用ANOVA過程。MODEL語句 指明以y為依變量的單因數線性數學模型(y=g),即對變換后的數據進行方差分析。這種分析亦稱幾何平均數的單因素方差分析?!窘Y果分析】從正態(tài)性檢驗摘錄的結果中可以看出,4組數據中的前3組均不滿足正態(tài)性的要
44、求(p0.05),因此作變量變換是適宜的。方差分析結果(F=11.12,p0.01)表明處理間的差異極為顯著,說明不同周齡雞的抗體平均滴度(幾何平均數)之間有明顯的差別。由SSR法檢驗結果表明20周齡雞的抗體平均滴度顯著高于5周和10周齡的(p0.05);15周的 也明顯高于5周的(p0.05)。若要具體說明其平均滴度時,應將上述各組平均數換算回原始的幾何平均滴度,即取它們的反對數值,但顯著性不變。取反對數后5、10、15、20周齡的幾何平均滴度分別為17.25、126.25、158、1128。2 非編程分析(fnx)先創(chuàng)建(chungjin)數據集后,仿例41的SAS/ASSIST模塊(m
45、kui)分析操作步驟,把其中的X改為Y,把A改為G即可。輸出結果與編程法相同。4.2.2 交叉分組的兩因素方差分析所謂交叉分組的兩因素設計資料,是指同時考察兩因素A、B對觀察值的影響時,兩因素中的水平(a、b)都相互搭配齊全。其處理數(水平組合數)為兩因素水平數之積(ab)。當水平組合內只有一個觀察值時,稱無重復觀察值的交叉分組資料;當水平組合內有兩個或兩個以上觀察值時,稱有重復觀察值的交叉分組資料。例44為研究蒸餾水的PH值和硫酸銅濃度對化驗血清白蛋白的影響,采用交叉分組,用同一種血清。每一水平組合各做一次化驗,測得白蛋白與球蛋白之比例于下表,試作方差分析。表44 PH值及硫酸銅濃度對血清蛋
46、白的影響蒸餾水值硫酸銅濃度 (B)0.040.080.105.43.52.32.05.62.62.01.95.72.01.51.25.81.40.80.31 編程法分析(1)程序 options nodate nonumber;data xu4d;do a=1 to 4;do b=1 to 3;input x ;output;end; end;cards;3.5 2.3 2.0 2.6 2.0 1.9 2.0 1.5 1.2 1.4 0.8 0.3 ;proc glm;class a b;model x=a b / ss3;means a b;means a b /snk;run;(2)輸出(
47、shch)結果 Dependent Variable: xSourceDFSum of SquaresMean SquareF ValuePr FModel57.510833331.5021666734.890.0002Error60.258333330.04305556Corrected Total117.76916667 R-Square Coeff Var Root MSE x Mean 0.966749 11.58130 0.207498 1.791667SourceDFType III SSMean SquareF ValuePr Fa35.289166671.7630555640.
48、950.0002b22.221666671.1108333325.800.0011 Level of AaNMeanStd DevSNK Groupinga132.600000000.79372539A1232.166666670.37859389B2331.566666670.40414519C3430.833333330.55075705D4 Level of BbNMeanStd DevSNK Groupingb142.375000000.89582364A1241.650000000.65574385B2341.350000000.78528127B3【程序(chngx)說明】循環(huán)(x
49、nhun)語句 指明(zhmng)外循環(huán)A取值14(A因素的水平(shupng)名稱)B取值13(因素的水平名稱),水平組合43=12,為觀察值的個數。PROC語句 指明調用GLM過程,進行方差分析,若改GLM為ANOVA過程,其分析結果相同。CLASS語句 指明2個分組變量或2個自變量(即A、B兩因素)。MODEL語句 定義兩因素主因素模型,其效應的平方和以SS3型印出。兩個MEANS語句 前者指明計算A、B兩因素各水平的平均數及標準差(可有可無);后者要求計算的各水平平均數用q法進行多重比較?!窘Y果分析】方差分析結果表明,總處理(Model)均方與誤差項均方之比達到極顯著水平(F=34.4
50、9,P=0.0002)。說明或A、或B、或A、B兩因素的主效應都非常明顯。各效應的分析表明,A、B兩因素各水平間都存在明顯的差異(P FModel80.128555560.016069445.440.0004Error270.079700000.00295185Corrected Total350.20825556 R-Square Coeff Var Root MSE x Mean 0.617297 12.52186 0.054331 0.433889SourceDFType III SSMean SquareF ValuePr Fa20.072072220.0360361112.210.0
51、002b20.012772220.006386112.160.1344a*b40.043711110.010927783.700.0158 Duncan GroupingMeanNaDuncan GroupingMeanNbA0.47000122A0.45833123A0.46083121A0.43083121B0.37083123A0.41250122 Least Squares Meansabx LSMEANStandard ErrorPr |t|LSMEAN Number110.415000000.02716547.00011120.490000000.02716547.00012130
52、.477500000.02716547.00013210.477500000.02716547.00014220.397500000.02716547.00015230.535000000.02716547.00016310.400000000.02716547.00017320.350000000.02716547.00018330.362500000.02716547 |t|Dependent Variable: xi/j1234567891-1.95222-1.62685-1.626850.455518-3.123550.3904441.6919251.3665550.06140.115
53、40.11540.65240.00420.69930.10220.183021.9522210.325370.325372.407739-1.171332.3426653.6441463.3187760.06140.74740.74740.02320.25170.02680.00110.002631.626851-0.325371.44E-152.082369-1.49672.0172953.3187762.9934060.11540.74741.00000.04690.14610.05370.00260.005841.626851-0.32537-144E-172.082369-1.4967
54、2.0172953.3187762.9934060.11540.74741.00000.04690.14610.05370.00260.00585-0.45552-2.40774-2.08237-2.08237-3.57907-0.065071.2364070.9110360.65240.02320.04690.04690.00130.94860.22700.370363.1235541.1713331.4967031.4967033.5790723.5139984.8154784.4901080.00420.25170.14610.14610.00130.0016.00010.00017-0
55、.39044-2.34267-2.0173-2.01730.065074-3.5141.3014810.9761110.69930.02680.05370.05370.94860.00160.20410.33778-1.69192-3.64415-3.31878-3.31878-1.23641-4.81548-1.30148-0.325370.10220.00110.00260.00260.2270.00010.20410.74749-1.36655-3.31878-2.99341-2.99341-0.91104-4.49011-0.976110.325370.18300.00260.0058
56、0.00580.37030.00010.33770.7474【程序(chngx)說明】3個循環(huán)體中,內循環(huán)把每個水平(shupng)組合內4個觀察(gunch)值讀給r,中循環(huán)(xnhun)和外循環(huán)各3次,把36個觀察值分別讀給A和B兩個分組變量(自變量)。MODEL語句 定義A、B兩個主效應、A*B互作效應的線性數學模型。選項指明各效應的平方和以SS3型印出。MEANS語句 要求計算A、B兩因素的各水平平均數用SSR法進行多重比較。LSMEANS語句 要求依據最小誤差平方法計算各水平組合的平均數 (平衡資料LSM=MEAN)。選項要求印出t檢驗(Ho:Lsm0) 的分母與其顯著程度、各平均數
57、比較的t值及顯著程度。當比較的平均數較多時,可采用本語句。否則系統(tǒng)不印出多重比較的結果,只印出平均數和標準差?!窘Y果分析】方差分析結果(F=5.44,P FTermError MeanSquareVarianceComponentPercentof TotalTotal111482.250000134.750000151.104167100.0000a2662.0000001.280.3974b331.00000017.85416711.8158b3778.75000037.530.0003Error259.583333126.33333383.6068Error641.5000006.916
58、6676.9166674.5774 x Mean 18.25000000 Standard Error of x Mean 5.25198375 Dependent Variable: xSourceDFSquaresSum of Mean SquareF ValuePr FModel51440.750000288.15000041.660.0001Error641.5000006.916667Corrected Total111482.250000 R-Square Coeff Var Root MSE x Mean0.972002 14.41072 2.629956 18.25000Sou
59、rceDFType I SSMean SquareF ValuePr Fa2662.0000000331.000000047.860.0002b(a)3778.7500000259.583333337.530.0003Tests of Hypotheses Using the Type I MS for b(a) as an Error TermSourceDFType I SSMean SquareF ValuePr Fa2662.0000000331.00000001.280.3974 Duncan GroupingMeanNaA23.7541A23.2542A7.7543 Least S
60、quares Means for Effect b(a)bax LSMEANi/j1234561117.000001-5.133171.901173-6.65415.3232841.7110550.00220.10600.00060.00180.13792130.5000025.1331667.034339-1.5209410.456456.8442220.00220.00040.1791.00010.00051212.000003-1.90117-7.03434-8.555283.422111-0.190120.10600.00040.00010.01410.85552234.5000046
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 規(guī)范臺帳填寫與管理制度
- 內部會計制度基本規(guī)范
- 公路橋梁評級制度規(guī)范
- 超重型汽車列車司機操作安全水平考核試卷含答案
- 鎮(zhèn)意識形態(tài)陣地風險隱患自查報告
- 貴金屬回收提純工崗前安全技能測試考核試卷含答案
- 庸懶散浮拖個人自查報告整改措施
- 2026年企業(yè)安全生產責任制管理制度
- 外貿會計實務理論知識考核試題及答案
- 電子商務支付系統(tǒng)安全操作手冊
- GB/T 6003.2-2024試驗篩技術要求和檢驗第2部分:金屬穿孔板試驗篩
- 離婚協議標準版(有兩小孩)
- 浙江省臺州市路橋區(qū)2023-2024學年七年級上學期1月期末考試語文試題(含答案)
- 假體隆胸后查房課件
- 2023年互聯網新興設計人才白皮書
- DB52-T 785-2023 長順綠殼蛋雞
- c語言知識點思維導圖
- 關于地方儲備糧輪換業(yè)務會計核算處理辦法的探討
- GB/T 29319-2012光伏發(fā)電系統(tǒng)接入配電網技術規(guī)定
- GB/T 1773-2008片狀銀粉
- GB/T 12007.4-1989環(huán)氧樹脂粘度測定方法
評論
0/150
提交評論