雙變量的統(tǒng)計分析之均值比較與檢驗_第1頁
雙變量的統(tǒng)計分析之均值比較與檢驗_第2頁
雙變量的統(tǒng)計分析之均值比較與檢驗_第3頁
雙變量的統(tǒng)計分析之均值比較與檢驗_第4頁
雙變量的統(tǒng)計分析之均值比較與檢驗_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第六章 雙變量的統(tǒng)計分析之二 均值比較與檢驗 主要內(nèi)容MEANS過程單一樣本T檢驗 (One-Sample T Test)獨(dú)立樣本T檢驗 (Independent-Sample T Test)配對樣本T檢驗 (Paired-Sample T Test)方差分析(One-Way ANOVA)MEANS過程一、 Means過程 該過程實際上更傾向于對樣本進(jìn)行描述,可以對需要比較的各組計算描述指標(biāo),包括均值、標(biāo)準(zhǔn)差、總和、觀測量數(shù)、方差等一系列單變量統(tǒng)計量。二、完全窗口分析 按AnalyzeCompare MeansMeans順序,打開Means主對話框(如圖6-1)。圖61 Means主對話框該框

2、的變量為因變量,即用于分析的變量。該框的變量為自變量,必須至少有一個變量單擊此按鈕,進(jìn)入下一層,返回則按Previous按鈕。見圖62Statistics框:供選擇的統(tǒng)計量Statistics for First Layer復(fù)選框:Anova table and eta: 進(jìn)行分組變量的單因方差分析并計算eta 統(tǒng)計量。Test for linearity:產(chǎn)生第一層最后一個變量的R和R2。 圖62 Options 對話框Cell Statistics框: 選入的描述統(tǒng)計量,默認(rèn)為均值、樣本數(shù)、標(biāo)準(zhǔn)差。三、例題分析 某醫(yī)生測得如下血紅蛋白值(g%),用Means過程對其做基本的描述性統(tǒng)計分析。

3、表5-1血紅蛋白值(g%)編號性別年齡血紅蛋白值編號性別年齡血紅蛋白值編號性別年齡血紅蛋白值111813.661511610.88291167.88211810.57161189.653011812.35311612.56172168.363111613.6542179.871811811.66322169.8752178.99192188.543321810.09621711.35202177.783421812.55711714.562121611.363511816.04811612.402211612.783611813.7892168.052311815.093711711.6710

4、11814.03242188.673811710.981121812.83252178.56392168.781211615.502621812.564011611.351321812.252721711.561421710.062811614.671、操作步驟 1) 打開數(shù)據(jù)文件“Means過程.sav” 。2)按順序Analyze Compare Means Means打開主對話框。3)單擊Option, 打開Options對話框,選擇統(tǒng)計項目。4)單擊OK完成。選hbsex按Next,進(jìn)入layer 2of 2,選age圖63 在主對話框選送變量圖64 第二層變量框選擇統(tǒng)計項目按此按鈕復(fù)

5、選此2項,第一層次分組選擇計算方差分析和線性檢驗圖65 Options對話框表61 觀測量摘要表 表61 是觀測量摘要表,觀測量總個數(shù)為40,其中有效值為40個、無效值0。2. 結(jié)果及分析表62 分組描述統(tǒng)計量 表62 分三部分:第一、二部分先按性別分組,再按年齡分組計算觀測值合計、均數(shù)、標(biāo)準(zhǔn)差、方差和個數(shù);第三部分只按年齡分組,最后一行為合計。表64 按年齡分組的描述統(tǒng)計量表63 按性別分組的描述性統(tǒng)計量 血紅蛋白* 性別 血紅蛋白* 年齡 表63、4是將sex和age一起放在layer 1of 1中,分別計算男、女(不作年齡分組)。年齡分三組(不作性別分組)的觀測值合計、均數(shù)、標(biāo)準(zhǔn)差、方差

6、和個數(shù)。表65 方差分析表 表65是方差分析表,共6列:第一列方差來源:組間的、組內(nèi)的、總的方差;第二列為平方和;第三列為自由度;第四列為均方;第五列為F值;第六列為F統(tǒng)計量的顯著值,顯著值小于0.05,所以性別對血紅蛋白值有顯著影響。表66 eta統(tǒng)計量 表66是eta統(tǒng)計量表,統(tǒng)計量表明因變量和自變量之間聯(lián)系的強(qiáng)度,0.567的值處于中等水平,2是因變量中不同組間差異所解釋的方差比,是組間平方和與總平方和之比,即由64.5256除以 200.787得到。表67 按年齡分組的方差分析表 表67是將年齡作為第一層自變量得到的方差分析表,Linearity是假設(shè)因變量均值是第一層自變量值的線性函

7、數(shù),Deviation from Linearity是不能由線性模型解釋的部分。表68 按年齡分組的eta統(tǒng)計量表68是將年齡作為第一層自變量得到的eta統(tǒng)計量表,R和R2測度線性擬合的良好度,R是觀測值與預(yù)測值之間的相關(guān)系數(shù)。一、 簡介 用于檢驗單個變量的均值與假設(shè)檢驗值(給定的常數(shù))之間是否存在差異。二、完全窗口分析 按AnalyzeCompare MeansOne-Sample T Test順序,打開One-Sample T Test主對話框(如圖5-1)一、單一樣本T檢驗圖6-6 One-Sample T Test主對話框圖6-7 Options對話框Test Variables框:用

8、于選取需要分析的變量Test Value:輸入已知的總體均值,默認(rèn)0Confidence Interval:輸入置信區(qū)間,一般取90、95、99等。Missing Values:在檢驗變量中含有缺失值的觀測將不被計算。在任何一個變量中含有缺失值的觀測都將不被計算三、例題分析 仍以表5-1的資料來說明。已知另一地區(qū)16-18歲的少年血紅蛋白平均值為11.657g%,檢驗這一地區(qū)16-18歲少年血紅蛋白值是否與另一地區(qū)的平均值相等。1、操作步驟 1)按AnalyzeCompare MeansOne Sample T Test順序,打開主對話框。(打開數(shù)據(jù)文件“Means過程.sav”。) 2)將變

9、量hb選入 Test Variable框。 3)在Test Value中輸入 11.657,后單擊OK。2、結(jié)果分析表5-9 單個樣本統(tǒng)計量 表5-9 是血紅蛋白值的觀測量個數(shù)、均值、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤等統(tǒng)計量。表5-10 單個樣本檢驗 從表5-10可看出,t 值為-0.592,自由度39,顯著值為0.558,樣本均值與檢驗值的差為-0.2122,該差值95%的置信區(qū)間是0.93790.5134。 一、 簡介 用于檢驗對于兩組來自獨(dú)立總體的樣本,其獨(dú)立總體的均值或中心位置是否一樣。如果兩組樣本彼此不獨(dú)立,應(yīng)使用配對T檢驗(Paired -Sample T Test )。如果分組不止一個,應(yīng)使

10、用One-Way ANOVA 過程進(jìn)行單變量方差分析。如果想比較的變量是分類變量,應(yīng)使用Crosstabs功能。獨(dú)立樣本T檢驗還要求總體服從正態(tài)分布,如果總體明顯不服從正態(tài)分布,則應(yīng)使用非參數(shù)檢驗過程(Nonparametric test)二、完全窗口分析 按AnalyzeCompare MeansIndependent-Sample T Test順序,打開Independent- Sample T Test主對話框(如圖5-10)二、獨(dú)立樣本T檢驗圖510 獨(dú)立樣本T檢驗主對話框圖511 Define Groups 主對話框從源變量框中選取要作檢驗的變量。為分組變量,只能有一個。分別輸入分組

11、變量的取值條件,如1為男,2為女等。輸入分界點值,如體重60公斤等。在檢驗變量中含有缺失值的觀測將不被計算。在任何一個變量中含有缺失值的觀測都將不被計算輸入置信區(qū)間,一般取90、95、99等。圖5-9 Independent-Sample T Test的Options對話框三、例題分析 仍以表5-1的資料來說明。1、操作步驟 1)按AnalyzeCompare Means Independent-Sample T Test順序,打開主對話框。打開數(shù)據(jù)文件“Means過程.sav”。 2)將變量hb選入 Test Variable框。 3)在sex選入Grouping Variable框中作為檢

12、驗變量。 4)打開Define Groups對話框,在Group1輸入1, Group2輸入2,單擊Continue,再單擊OK。2、結(jié)果分析 表5-11 是血紅蛋白值的觀測量個數(shù)、均值、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤等統(tǒng)計量。表5-11 分組統(tǒng)計量表5-12 獨(dú)立樣本T檢驗結(jié)果 從表5-12可看出,Equal variances assumed 行是假設(shè)方差相等進(jìn)行的檢驗,當(dāng)方差相等時考察這一行的結(jié)果;Equal variances not assumed行是假設(shè)方差不等進(jìn)行的檢驗,當(dāng)方差不等時考察這一行的結(jié)果。在Levenes Test for Equality of Variance列中,顯著值為

13、 0.5440.15,可認(rèn)為方差是相等的,所以應(yīng)考察第一行的結(jié)果。可看出,顯著值為 0.0000.05,所以認(rèn)為均值是不等的。 一、 簡介 用于檢驗兩個相關(guān)的樣本是否來自具有相同均值的總體。二、完全窗口分析1、主對話框 按AnalyzeCompare MeansPaired-Sample T Test順序,打開Paired -Sample T Test主對話框(如圖5-1)三、配對樣本T檢驗從源變量框中選取成對變量移入。所選變量。同圖59圖510 Paired-Sample T Test 對話框 三、例題分析 某單位研究飼料中缺乏維生素E與肝中維生素A含量的關(guān)系,將大白鼠按性別、體重等配為8對

14、,每對中兩只大白鼠分別喂給正常飼料和維生素E缺乏飼料,一段時期后測定其肝中維生素A含量(mol/L)如下,現(xiàn)在想知道飼料中缺乏維生素E對鼠肝中維生素A含量有無影響。大白鼠配對編號肝中維生素A含量(mol/L)正常飼料組維生素E缺乏組137.225.7220.925.1331.418.8441.433.5539.834.0639.328.3736.126.2831.918.3表5-12 配對樣本T檢驗數(shù)據(jù)1、操作步驟 1)輸入數(shù)據(jù)并定義變量名:正常飼料組測定值為x1,維生素E缺乏飼料組測定值為x2(數(shù)據(jù)文件“飼料(配對T檢驗).sav”。) 2)按AnalyzeCompare MeansPair

15、ed-Sample T Test 順序,打開主對話框。 3)單擊變量x1,再單擊x2,將x1,x2送入Variables框。左下方Current Selections框中出現(xiàn)Variable1、 Variable2 4)單擊OK。2、輸出結(jié)果及分析表5-13 配對樣本T檢驗描述統(tǒng)計量 表5-13可看出,變量x1的均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤分別為34.750、6.649、2.351,變量x2的均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤分別為26.238、5.821、2.058。表5-14 配對樣本T檢驗相關(guān)性 表5-14可看出,本例共有8對觀測值,相關(guān)系數(shù)為0.586,相關(guān)系數(shù)的顯著性檢驗表明顯著值為0.127。表5-15

16、 配對樣本T檢驗結(jié)果 表5-16說明變量x1 、x2兩兩相減的差值均數(shù)、標(biāo)準(zhǔn)差、差值均數(shù)的標(biāo)準(zhǔn)誤差分別為8.513、5.719、2.022,95可信區(qū)間為3.731 ,13.292。配對檢驗結(jié)果表明t為4.21,自由度為7,顯著值為0.004,差別具高度顯著性意義,即飼料中缺乏維生素E對鼠肝中維生素A含量確有影響。方差分析簡介 方差分析的核心就是方差可分解。這里的方差是通過計算各觀測值偏離均值的平方和再除以n-1(樣本量減1)而得到的。這樣給定n值的情況下,方差就是離差平方和(SS)。方差的分解按表6-1進(jìn)行。 方差分析的目的是檢驗均數(shù)(組間或變量間)差別是否具有統(tǒng)計學(xué)意義。即將總變異分解為由

17、隨機(jī)誤差造成的變異(組內(nèi)SS)與由均數(shù)差異造成的變異(組間SS)兩個部分。如果后者大于前者,且具有統(tǒng)計學(xué)意義,我們將拒絕零假設(shè),即認(rèn)為總體中均數(shù)間存在差異。一、簡介 單因素方差分析是檢驗由單一因素影響的多組樣本某因變量的均值是否有顯著差異的問題。如果各組之間有顯著差異,說明這個因素(分類變量)對因變量是有顯著影響的,因素的不同水平會影響到因變量的取值。二、完全窗口分析 按AnalyzeCompared Means One-Way Anova順序單擊。打開 One-Way Anova主對話框,如圖四、單因素方差分析選入因變量,可有多個變量選入分組變量,必須滿足只取有限個水平的條件。 One-Wa

18、y Anova主對話框見圖 6-2見圖 6-3見圖 6-4見圖 62 多項式比較對話框進(jìn)行軍制的多項式比較,并在其后的參數(shù)框中選定階數(shù) 。如一階:Linear,二階:Quadratic,三階:Cubic.最高可達(dá)五階輸入多項式各組均值的系數(shù),輸入一個系數(shù)單擊Add按鈕。系數(shù)進(jìn)入下面方框.依次輸入各組均值的系數(shù)。如果多項式中只包括第一與第四組的均值的系數(shù),必須把第二、第三個系數(shù)輸入為0。如果只包括第一與第二組的均值,則第三、第四個可不輸入??赏瑫r建多個多項式,輸入一組后按Next按鈕;如果要修改則按Previous按鈕,修改后按Change按鈕,刪除按Remove按鈕。顯示每組系數(shù)的總和。63

19、Post Hoc對話框在此對話框中選擇進(jìn)行多重比較的方法1.用t檢驗完成組間成對均值的比較,對多重比較錯誤率不 進(jìn)行調(diào)整2.同上,但通過設(shè)置每個檢驗的誤差率來控制整個誤差率3.用t檢驗完成多重配對比較,為多重比較調(diào)整顯著值,但 比2的界限要小4.對所有可能的組合進(jìn)行同步進(jìn)入的均值配對比較5.用F檢驗進(jìn)行多重比較6.在Studentized Range分布下進(jìn)行多重比較7.用Studentized Range分布進(jìn)行所有各組均值間的配對比較8.用Studentized Range統(tǒng)計量進(jìn)行所有組間均值的配對比較, 用所有配對比較集合的誤差率作為試驗誤差率9.同8,但,其臨界值是TUKEY和S-N

20、-K的相應(yīng)值的平均值10.進(jìn)行配對比較時,使用的逐步順序與Student-Newman- Keuls檢驗的順序一樣,但并不是給每個檢驗設(shè)定一個誤差 率,而是給所有檢驗的誤差率設(shè)定一個臨界值11.用Studentized最大系數(shù)進(jìn)行比較檢驗和范圍檢驗12.用Studentized最大系數(shù)進(jìn)行配對比較檢驗13.用Studentized最大系數(shù)進(jìn)行比較檢驗,使用貝葉斯逼近.14.用t檢驗進(jìn)行配對比較.1.用t檢驗進(jìn)行配對比較,2.用Studentized 最大系數(shù)進(jìn)行配對比較檢驗3.同上,這種方法有時比較自由4.用Studentized Range統(tǒng)計量進(jìn)行配對比較檢驗規(guī)定顯著性水平,默認(rèn)為0.05

21、圖 64 Options對話框 選擇缺失值的處置方式:在檢驗變量中含有缺失值的觀測將不被計算在任何一個變量中含有缺失值的觀測都將不被計算規(guī)定輸出的統(tǒng)計量:輸出描述統(tǒng)計量,包括觀測量數(shù)目,均值,最小值,最大值,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)誤差,各組中每個因變量的95%的置信區(qū)間用Levene檢驗進(jìn)行方差一致性檢驗輸出均數(shù)分布圖三、例題分析 例1 某燈泡廠用四種不同配料方案制成的燈絲,生產(chǎn)了四批燈泡。每批燈泡中隨機(jī)抽取若干個燈泡測其使用壽命(單位:小時),數(shù)據(jù)如表6-2,求四種燈絲的燈泡的使用壽命有無顯著差異。 燈泡燈絲12345678甲1600161016501680170017001780乙150016401

22、40017001750丙16401550160016201640160017401800丁151015201530157016401680表6-1 燈泡使用壽命 在該例中,設(shè)燈泡的使用壽命為因變量,燈絲的配料為因子,四種配料方案為四水平,為單因子四水平的實驗。(數(shù)據(jù)文件:“燈泡使用(單因素方差).sav)1、不使用選擇項操作步驟 1)定義兩個變量:Filament變量,取值1、2、3、4分別代表甲、乙、丙、丁,標(biāo)簽為“燈絲”。Hours變量其值為燈泡的使用壽命,標(biāo)簽為“燈泡使用壽命”。2)按AnalyzeCompared Means One-Way Anova順序打開“單因素分析”主對話框。3

23、)從源變量框中選取hours入Dependent List框中;選取filament變量入Factor框中,單擊“OK”運(yùn)行。4)輸出結(jié)果及分析表6-2 燈泡使用壽命的單因素方差分析結(jié)果表6-2說明:第一列:方差來源;第二列:離差平方和;第三列:自由度;第四列:均方;第五列:F值;第六列:顯著值,是F統(tǒng)計量的P值。2、使用選擇項操作步驟1)定義變量和選取變量同1的操作步驟2)在主對話框中單擊“Contrast”,在Contrast對話框中選擇多項式比較,選擇一次多項式比較各組均值,共指定兩組多項式系數(shù):3)輸出結(jié)果及分析2)在主對話框中單擊“Contrast”,在Contrast對話框中選擇多項式比較,選擇一次多項式比較各組均值,共指定兩組多項式系數(shù):系數(shù)依次為1、-1、-1、1,這是檢驗燈絲對燈泡使用壽命的影響及甲、丁效應(yīng)和與乙、丙效應(yīng)和是否有顯著差異系數(shù)依次為1、-1、1、-1,這是檢驗燈絲對燈泡使用壽命的影響及甲、丙效應(yīng)和與乙、丁效應(yīng)和是否有顯

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論