SPSS-第9單元-非參數檢驗_第1頁
SPSS-第9單元-非參數檢驗_第2頁
SPSS-第9單元-非參數檢驗_第3頁
SPSS-第9單元-非參數檢驗_第4頁
SPSS-第9單元-非參數檢驗_第5頁
已閱讀5頁,還剩136頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

前面已經討論的許多統(tǒng)計分析方法對總體有特殊的要求,如T檢驗要求總體符合正態(tài)分布,F檢驗要求誤差呈正態(tài)分布且各組方差整齊,等等。這些方法常用來估計或檢驗總體參數,統(tǒng)稱為參數檢驗。

但許多調查或實驗所得的科研數據,其總體分布未知或無法確定。因為有的數據不是來自所假定分布的總體,或者數據根本不是來自一個總體,還有可能數據因為某種原因被嚴重污染,這樣在假定分布的情況下進行推斷的做法就有可能產生錯誤的結論。此時人們希望檢驗對一個總體分布形狀不必作限制。

這種不是針對總體參數,而是針對總體的某些一般性假設(如總體分布)的統(tǒng)計分析方法稱非參數檢驗(NonparametricTests)。非參數檢驗對數據分布沒有要求,適于參數檢驗的數據都可以用非參數檢驗的方法進行檢驗,有研究表明,非參數檢驗的統(tǒng)計效能大約為參數檢驗的95%,這是一個能夠接受的水平。非參數檢驗根據樣本數目以及樣本之間的關系可以分為單樣本非參數檢驗、兩獨立樣本非參數檢驗、多獨立樣本非參數檢驗、兩配對樣本非參數檢驗和多配對樣本非參數檢驗幾種。8.1總體分布的卡方(Chi-square)檢驗

在得到一批樣本數據后,人們往往希望從中得到樣本所來自的總體的分布形態(tài)是否和某種特定分布相擬合。這可以通過繪制樣本數據直方圖的方法來進行粗略的判斷。如果需要進行比較準確的判斷,則需要使用非參數檢驗的方法。其中總體分布的卡方檢驗(也記為χ2檢驗)就是一種比較好的方法。8.1.1統(tǒng)計學上的定義和計算公式

定義:總體分布的卡方檢驗適用于配合度檢驗,是根據樣本數據的實際頻數推斷總體分布與期望分布或理論分布是否有顯著差異。它的零假設H0:樣本來自的總體分布形態(tài)和期望分布或某一理論分布沒有顯著差異。

因此,總體分布的卡方檢驗是一種吻合性檢驗,比較適用于一個因素的多項分類數據分析??傮w分布的卡方檢驗的數據是實際收集到的樣本數據,而非頻數數據。

研究問題某地一周內各日患憂郁癥的人數分布如表10-1所示,請檢驗一周內各日人們憂郁數是否滿足1:1:2:2:1:1:1。8.1.2SPSS中實現過程周日患者數131238370480529624731

實現步驟圖10-1在菜單中選擇“WeightCases”命令圖10-2“WeightCases”對話框圖10-3在菜單中選擇“Chi-Square”命令圖10-4“Chi-SquareTest”對話框圖10-5“Chi-SquareTest:Options”對話框

(1)本例輸出結果中有兩個表格,其中第一個表格如下。8.1.3結果和討論(2)輸出的結果文件中第二個表格如下。8.2二項分布檢驗8.2.1統(tǒng)計學上的定義和計算公式

現實生活中有很多數據的取值只有兩類,如醫(yī)學中的生與死、患病的有與無、性別中的男性和女性、產品的合格與不合格等。從這種二分類總體中抽取的所有可能結果,要么是對立分類中的這一類,要么是另一類,其頻數分布稱為二項分布。調用SPSS中的二項分布檢驗(Binomial)可對樣本資料進行二項分布分析。SPSS二項分布檢驗就是根據收集到的樣本數據,推斷總體分布是否服從某個指定的二項分布。其零假設是H0:樣本來自的總體與所指定的某個二項分布不存在顯著的差異。SPSS中的二項分布檢驗,在樣本小于或等于30時,按照計算二項分布概率的公式進行計算;樣本數大于30時,計算的是Z統(tǒng)計量,認為在零假設下,Z統(tǒng)計量服從正態(tài)分布。Z統(tǒng)計量的計算公式如下SPSS將自動計算Z統(tǒng)計量,并給出相應的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平α,則應拒絕零假設H0,認為樣本來自的總體分布形態(tài)與指定的二項分布存在顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設H0,認為樣本來自的總體分布形態(tài)與指定的二項分布不存在顯著差異。SPSS二項分布檢驗的數據是實際收集到的樣本數據,而非頻數數據。

研究問題某地某一時期內出生35名嬰兒,其中女性19名(定Sex=0),男性16名(定Sex=1)。問這個地方出生嬰兒的性別比例與通常的男女性比例(總體概率約為0.5)是否不同?數據如表10-2所示。8.2.2SPSS中實現過程嬰兒Sex嬰兒Sex嬰兒Sex111312512014126131151270411612805117029061180300701903118020032090210330100220340111231350121241

實現步驟圖10-6在菜單中選擇“BinomialTest”命令圖10-7“BinomialTest”對話框圖10-8“BinomialTest:Options”對話框8.2.3結果和討論8.3.1統(tǒng)計學上的定義和計算公式8.3SPSS單樣本K-S檢驗

定義:單樣本K-S檢驗是以兩位前蘇聯(lián)數學家Kolmogorov和Smirnov命名的,也是一種擬合優(yōu)度的非參數檢驗方法。單樣本K-S檢驗是利用樣本數據推斷總體是否服從某一理論分布的方法,適用于探索連續(xù)型隨機變量的分布形態(tài)。

單樣本K-S檢驗可以將一個變量的實際頻數分布與正態(tài)分布(Normal)、均勻分布(Uniform)、泊松分布(Poisson)、指數(Exponential)分布進行比較。其零假設H0為樣本來自的總體與指定的理論分布無顯著差異。SPSS實現K-S檢驗的過程如下:(1)根據樣本數據和用戶的指定構造出理論分布,查分布表得到相應的理論累計概率分布函數;SPSS在統(tǒng)計中將計算K-S的Z統(tǒng)計量,并依據K-S分布表(小樣本)或正態(tài)分布表(大樣本)給出對應的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平α,則應拒絕零假設H0,認為樣本來自的總體與指定的分布有顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設H0,認為樣本來自的總體與指定的分布無顯著差異。8.3.2SPSS中實現過程

研究問題某地144個周歲兒童身高數據如表10-4所示,問該地區(qū)周歲兒童身高頻數是否呈正態(tài)分布?表10-4 兒童身高數據身高區(qū)間人數64-268-469-770-1671-2072-2573-2474-2276-1678-279-683-1

實現步驟圖10-12在菜單中選擇“1-SampleK-S”命令圖10-13“One-SampleKolmogorov-SmirnovTest”對話框圖10-14“One-SampleK-S:Options”對話框8.3.3結果和討論(1)本例輸出結果如下表所示。8.4.1統(tǒng)計學上的定義和計算公式8.4兩獨立樣本非參數檢驗

定義:兩獨立樣本的非參數檢驗是在對總體分布不很了解的情況下,通過分析樣本數據,推斷樣本來自的兩個獨立總體分布是否存在顯著差異。一般用來對兩個獨立樣本的均數、中位數、離散趨勢、偏度等進行差異比較檢驗。兩個樣本是否獨立,主要看在一個總體中抽取樣本對另外一個總體中抽取樣本有無影響。如果沒有影響,則可以認為兩個總體是獨立的。SPSS提供了4種兩獨立樣本的非參數檢驗方法。1.兩獨立樣本的Mann-WhitneyU檢驗兩獨立樣本的Mann-WhitneyU檢驗的零假設H0為樣本來自的兩獨立總體均值沒有顯著差異。兩獨立樣本的Mann-WhitneyU檢驗主要通過對平均秩的研究來實現推斷。秩簡單地說就是名次。如果將數據按照升序進行排序,這時每一個具體數據都會有一個在整個數據中的位置或名次,這就是該數據的秩,數據有多少個,秩便有多少個。2.兩獨立樣本的K-S檢驗兩獨立樣本的K-S檢驗能夠對兩獨立樣本的總體分布情況進行比較。其零假設是H0為樣本來自的兩獨立總體分布沒有顯著差異。兩獨立樣本的K-S檢驗實現方法是:首先將兩組樣本數據(X1,X2,…,Xm)和(Y1,Y2,…,Yn)混合并按升序排列(m和n是兩組樣本的樣本容量),分別計算兩組樣本秩的累計頻率和每個點上的累計頻率;最后將兩個累計頻率相減,得到差值序列數據。兩獨立樣本的K-S檢驗將關注差值序列。SPSS將自動計算K-SZ統(tǒng)計量,并依據正態(tài)分布表給出對應的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平

,則應拒絕零假設H0,認為兩個樣本來自的總體分布有顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設H0,認為兩個樣本來自的總體分布無顯著差異。3.兩獨立樣本的游程檢驗(Wald-WolfwitzRuns)兩獨立樣本的游程檢驗用來檢驗樣本來自的兩獨立總體的分布是否存在顯著差異。其零假設是H0為樣本來自的兩獨立總體分布沒有顯著差異。

樣本的游程檢驗中,計算游程的方法與觀察值的秩有關。首先,將兩組樣本混合并按照升序排列。在數據排序時,兩組樣本的每個觀察值對應的樣本組標志值序列也隨之重新排列,然后對標志值序列按照前面10.3節(jié)的方法求游程。

如果計算出的游程數相對比較小,則說明樣本來自的兩總體的分布形態(tài)存在較大差距;如果得到的游程數相對比較大,則說明樣本來自的兩總體的分布形態(tài)不存在顯著差距。SPSS將自動計算游程數得到Z統(tǒng)計量,并依據正態(tài)分布表給出對應的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平

,則應拒絕零假設H0,認為兩個樣本來自的總體分布有顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設H0,認為兩個樣本來自的總體分布無顯著差異。4.兩獨立樣本的極端反應檢驗(MosesExtremeReactions)

兩獨立樣本的極端反應檢驗用來檢驗樣本來自的兩獨立總體的分布是否存在顯著差異。其零假設H0為樣本來自的兩獨立總體分布沒有顯著差異。

兩獨立樣本的極端反應檢驗將一個樣本作為控制樣本,另外一個樣本作為實驗樣本。以控制樣本作對照,檢驗實驗樣本是否存在極端反應。首先將兩組樣本混合并按升序排列;然后找出控制樣本最低秩和最高秩之間所包含的觀察值個數,即跨度(Span)。為控制極端值對分析結果的影響,也可以先去掉樣本兩個最極端的觀察值后再求跨度,這個跨度稱為截頭跨度。

兩獨立樣本的極端檢驗計算跨度和截頭跨度。如果跨度或截頭跨度很小,則表明兩個樣本數據無法充分混合,可以認為實驗樣本存在極端反應。SPSS自動計算跨度和截頭跨度,依據分布表給出對應的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平

,則應拒絕零假設H0,認為兩個樣本來自的總體分布有顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設H0,認為兩個樣本來自的總體分布無顯著差異。8.4.2SPSS中實現過程

研究問題研究兩個不同廠家生產的燈泡使用壽命是否存在顯著差異。隨機抽取兩個廠家生成的燈泡若干,實驗得到使用壽命,數據如表10-5所示。表10-5 兩個廠家生產的燈泡使用壽命數據燈泡壽命(h)廠家編號67516821691167016501693165016492680263026502646265126202

實現步驟圖10-15在菜單中選擇“2IndependentSamples”命令圖10-16“Two-Independent-Samples-Test”對話框

圖10-17“TwoIndependentSamples:DefineGroups”對話框圖10-18“Two-Independent-Samples:Options”對話框8.4.3結果和討論

(1)兩獨立樣本Mann-WhitneyU檢驗結果如下面兩表所示。

(2)兩獨立樣本K-S檢驗輸出結果如下兩表所示。

(3)兩獨立樣本極端反應檢驗輸出結果如下兩表所示。

(4)兩獨立樣本游程檢驗輸出結果如下兩表所示。8.5多獨立樣本非參數檢驗8.5.1統(tǒng)計學上的定義和計算公式

定義:多獨立樣本非參數檢驗分析樣本數據是推斷樣本來自的多個獨立總體分布是否存在顯著差異。SPSS多獨立樣本非參數檢驗一般推斷多個獨立總體的均值或中位數是否存在顯著差異。

多個樣本之間是否獨立,需要看在一個總體中抽取樣本對其他總體中抽取樣本是否有影響。如果沒有影響,則認為這些總體之間是獨立的。

例如,隨機抽取3個班級之間學生的學生成績,分析3個班級總體的成績是否存在顯著的差異。由于對各個班級都是隨機抽取樣本,抽樣沒有相互影響,可以認為這三個班級學生成績是獨立的。

SPSS中有3種多獨立樣本非參數檢驗方法。1.多獨立樣本的中位數檢驗(Median)

多獨立樣本的中位數檢驗通過對多組數據的分析推斷多個獨立總體分布是否存在顯著差異。多獨立樣本的中位數檢驗的零假設H0為:樣本來自的多個獨立總體的中位數無顯著差異。2.多獨立樣本的K-W檢驗

多獨立樣本的K-W檢驗是Kruskal-Waillis檢驗的縮寫,是一種推廣的平均秩檢驗。其零假設為:樣本來自的多個獨立總體的分布無顯著差異。

多獨立樣本的K-W檢驗的基本方法是:首先將多組樣本數混合按升序排列,并求出每個觀察值的秩,然后對多組樣本的秩分別求平均值。

如果各組樣本的平均秩大致相等,則可以認為多個獨立總體的分布沒有顯著差異。如果各樣本的平均秩相差很大,則不能認為多個獨立總體的分布無顯著差異。3.多獨立樣本的Jonkheere-Terpstra檢驗

多獨立樣本的Jonkheere-Terpstra檢驗用于分析樣本來自的多個獨立總體分布是否存在顯著差異。其零假設是:樣本來自的多個獨立總體的分布無顯著差異。

多獨立樣本的Jonkheere-Terpstra檢驗的基本方法和兩獨立樣本的Mann-WhitneyU檢驗比較類似,也是計算一組樣本的觀察值小于其他組樣本觀察值的個數。

研究問題隨機抽取3個班級的學生,得到21個學生成績樣本,如表10-7所示,問3個班級學生總體成績是否存在顯著差異?8.5.2SPSS中實現過程表10-7 3個班級學生成績學生成績所屬班級學生成績所屬班級60.00190.00270.00196.00271.00170.00280.00185.00375.00192.00365.00197.00390.00196.00380.00288.00385.00289.00381.00280.00383.002

實現步驟圖10-19在菜單中選擇“KIndependentSamples”命令圖10-20“TestsforSeveralIndependentSamples”對話框圖10-21“SeveralIndependentSamples:DefineRange”對話框

圖10-22“Two-Independent-Samples:Options”對話框8.5.3結果和討論(1)多獨立樣本K-W檢驗結果如下兩表所示。

(2)多獨立樣本中位數檢驗結果如下兩表所示。8.6兩配對樣本非參數檢驗8.6.1統(tǒng)計學上的定義和計算公式

定義:兩配對樣本(2RelatedSamples)非參數檢驗是在對總體分布不很清楚的情況下,對樣本來自的兩相關配對總體分別進行檢驗。

兩配對樣本非參數檢驗一般用于同一研究對象(或兩配對對象)分別給予兩種不同處理的效果比較,以及同一研究對象(或兩配對對象)處理前后的效果比較。前者推斷兩種效果有無差別,后者推斷某種處理是否有效。

兩配對樣本非參數檢驗的前提要求兩個樣本應是配對的。在應用領域中,主要的配對資料包括:具有年齡、性別、體重、病況等非處理因素相同或相似者。首先兩個樣本的觀察數目相同,其次兩樣本的觀察值順序不能隨意改變。SPSS中有以下3種兩配對樣本非參數檢驗方法。1.兩配對樣本的McNemar變化顯著性檢驗McNemar變化顯著性檢驗以研究對象自身為對照,檢驗其兩組樣本變化是否顯著。其零假設為:樣本來自的兩配對總體分布無顯著差異。

McNemar變化顯著性檢驗要求待檢驗的兩組樣本的觀察值是二值數據,在實際分析中有一定的局限性。McNemar變化顯著性檢驗基本方法采用二項分布檢驗。它通過對兩組樣本前后變化的頻率,計算二項分布的概率值。2.兩配對樣本的符號(Sign)檢驗

當兩配對樣本的觀察值不是二值數據時,無法利用前面一種檢驗方法,這時可以采用兩配對樣本的符號(Sign)檢驗方法。其零假設為:樣本來自的兩配對樣本總體的分布無顯著差異。

兩配對樣本的符號檢驗利用正、負符號的個數多少來進行檢驗。首先,將第二組樣本的各個觀察值減去第一組樣本對應的觀察值,如果得到差值是一個正數,則記為正號;差值為負數,則記為負號。然后計算正號的個數和負號的個數。

通過比較正號的個數和負號的個數,可以判斷兩組樣本的分布。例如,正號的個數和負號的個數大致相當,則可以認為兩配對樣本數據分布差距較??;正號的個數和負號的個數相差較多,可以分為兩配對樣本數據分布差距較大。SPSS將自動對差值正負符合序列作單樣本二項分布檢驗,計算出實際的概率值。如果得到的概率值小于或等于用戶的顯著性水平

,則應拒絕零假設H0,認為兩配對樣本來自的總體分布有顯著差異;如果概率值大于顯著性水平,則不能拒絕零假設H0,認為兩配對樣本來自的總體分布無顯著差異。3.兩配對樣本的Wilcoxon符號平均秩檢驗

兩配對樣本的符號檢驗考慮了總體數據變化的性質,但沒有考慮兩組樣本變化的程度。兩配對樣本的Wilcoxon符號平均秩檢驗考慮了這方面的因素。其零假設為:樣本來自的兩配對樣本總體的分布無顯著差異。

兩配對樣本的Wilcoxon符號平均秩檢驗首先按照符號檢驗的方法,將第二組樣本的各個觀察值減去第一組樣本對應的觀察值,如果得到差值是一個正數,則記為正號;差值為負數,則記為負號。同時保存差值的絕對值數據。然后將絕對差值數據按升序排序,并求出相應的秩,最后分別計算正號秩總合W

+、負號秩總合W

?以及正號平均秩和負號平均秩。

如果正號平均秩和負號平均秩大致相當,則可以認為兩配對樣本數據正負變化程度基本相當,分布差距較小。

兩配對樣本的Wilcoxon符號平均秩檢驗按照下面的公式計算Z統(tǒng)計量,它近似服從正態(tài)分布

研究問題分析10個學生接受某種方法進行訓練的效果,收集到這些學生在訓練前、后的成績,如表10-9所示。表格的每一行表示一個學生的4個成績。其中第一列表示,訓練前的成績是否合格,0表示不合格,1表示合格;第二列表示訓練后的成績是否合格,0表示不合格,1表示合格;第三列表示訓練前學生的具體成績;第四列表示訓練后學生的具體成績。問訓練前后學生的成績是否存在顯著差異?8.6.2SPSS中實現過程表10-9 訓練前后的成績訓練前訓練后訓練前成績訓練后成績0158.0070.001170.0071.000145.0065.000156.0068.000045.0050.000050.0055.001161.0075.001170.0070.000155.0065.001160.0070.00

實現步驟圖10-23在菜單中選擇“2RelatedSamples”命令圖10-24“Two-Related-SamplesTests”對話框圖10-25選擇兩個變量配對圖10-26“Two-Related-Samples:Options”對話框圖10-27選擇兩個變量配對8.6.3結果和討論(1)描述性統(tǒng)計部分結果如下表所示。(2)Wilcoxon檢驗結果如下兩表所示。(3)符號檢驗結果如下兩表所示。(4)McNemar檢驗結果如下兩表所示。8.7多配對樣本非參數檢驗8.7.1統(tǒng)計學上的定義和計算公式

定義:多配對樣本非參數檢驗是對多個匹配樣本的總體分布是否存在顯著性差異進行統(tǒng)計分析。

SPSS中有以下3種多配對樣本非參數檢驗方法。1.多配對樣本的Friendman檢驗

多配對樣本的Friendman檢驗是利用秩實現多個配對總體分布檢驗的一種方法,多配對樣本的Friendman檢驗要求數據是定距的。其零假設為:樣本來自的多個配對總體的分布無顯著差異。

多配對樣本的Friendman檢驗的實現原理是:首先以樣本為單位,將各個樣本數據按照升序排列,求得各個樣本數據在各自行中的秩,然后計算各樣本的秩總和及平均秩。

如果多個配對樣本的分布存在顯著的差異,那么數值普遍偏大的組秩和必然偏大,數值普遍偏小的組,秩和也必然偏小,各組的秩之間就會存在顯著差異。如果各樣本的平均秩大致相當,那么可以認

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論