SPSS的非參數(shù)檢驗(yàn)_第1頁
SPSS的非參數(shù)檢驗(yàn)_第2頁
SPSS的非參數(shù)檢驗(yàn)_第3頁
SPSS的非參數(shù)檢驗(yàn)_第4頁
SPSS的非參數(shù)檢驗(yàn)_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第七章 非參數(shù)檢驗(yàn) 17.1 關(guān)于非參數(shù)的一些常識經(jīng)典統(tǒng)計(jì)的多數(shù)檢驗(yàn)都假定了總體的背景分布。但在總體未知時,如果假定的總體和真實(shí)總體不符,那么就不適宜用通常的檢驗(yàn)。這時如果利用傳統(tǒng)的假定分布已知的檢驗(yàn),就會產(chǎn)生錯誤甚至災(zāi)難。非參數(shù)檢驗(yàn)(nonparametric testing)是在總體分布未知或知之甚少的情況下,利用樣本數(shù)據(jù)對總體分布形態(tài)等進(jìn)行推斷的方法。2非參數(shù)檢驗(yàn)在總體分布未知時有很大的優(yōu)越性。它總是比傳統(tǒng)檢驗(yàn)安全。在總體分布形式已知時,非參數(shù)檢驗(yàn)不如傳統(tǒng)方法效率高。這是因?yàn)榉菂?shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況,非參數(shù)檢驗(yàn)無法拒絕。但非參數(shù)統(tǒng)計(jì)在總體未知時效率要

2、比傳統(tǒng)方法要高,有時要高很多。是否用非參數(shù)統(tǒng)計(jì)方法,要根據(jù)對總體分布的了解程度來確定。3SPSS中的非參數(shù)檢驗(yàn)方法主要涉及以下方面:單樣本非參數(shù)檢驗(yàn)兩獨(dú)立樣本非參數(shù)檢驗(yàn)多獨(dú)立樣本非參數(shù)檢驗(yàn)兩配對樣本非參數(shù)檢驗(yàn)多配對樣本非參數(shù)檢驗(yàn)47.2單樣本的非參數(shù)檢驗(yàn)7.2.1總體分布的卡方檢驗(yàn)卡方檢驗(yàn)可以根據(jù)樣本數(shù)據(jù),推斷總體分布與期望分布或某一理論分布是否存在顯著差異,通常適于多項(xiàng)分類值總體分布的分析。H0: 樣本來自的總體分布與期望分布或某一理論分布無顯著差異。理論依據(jù) 如果從一個隨機(jī)變量X中隨機(jī)抽取若干個觀察樣本,這些觀察樣本落在X的k個互不相交的子集中的觀察頻數(shù)服從一個多項(xiàng)分布,這個多項(xiàng)分布當(dāng)k趨

3、于無窮時近似服從卡方分布。5卡方統(tǒng)計(jì)量Pearson卡方:如果 的概率p值小于顯著性水平,則應(yīng)拒絕H0; 否則,不拒絕H0 。例子醫(yī)學(xué)家研究心臟病人猝死人數(shù)與日期的關(guān)系時發(fā)現(xiàn),一周之中星期一心臟病人猝死者較多,其他日子則基本相當(dāng)。每天的比例近似為:2.8:1:1:1:1:1:1。現(xiàn)收集到心臟病人死亡日期的樣本數(shù)據(jù),需要推斷其總體分布是否與上述理論分布相吻合。6 例: 今有 3 人組成的品茶專家組,對A、B兩種不同牌號的茶進(jìn)行 6 種不同味道的檢驗(yàn)。凡專家認(rèn)為優(yōu)者被記錄下來,如下表。不同牌號的茶提供給專家品嘗是隨機(jī)的。兩種不同牌號的茶哪個更好?7H0:F( x )為二項(xiàng)分布87.2.2二項(xiàng)分布檢

4、驗(yàn)現(xiàn)實(shí)中很多數(shù)據(jù)的取值是二值的,例如產(chǎn)品分為合格和不合格等等。將這樣的二值分別用0和1表示,如進(jìn)行n次相同的實(shí)驗(yàn),則出現(xiàn)兩類(1或0)的次數(shù)可以用離散型隨機(jī)變量X表示。如X值為1的概率為p,則X為0的概率q為1-p,形成二項(xiàng)分布。通過樣本數(shù)據(jù)檢驗(yàn)樣本來自的總體是否服從指定的概率值為p的二項(xiàng)分布。H0: 樣本來自的總體與指定的二項(xiàng)分布無顯著差異。9二項(xiàng)分布檢驗(yàn)小樣本:精確檢驗(yàn)方法大樣本:近似檢驗(yàn)方法如果算得概率p值小于顯著性水平,則應(yīng)拒絕H0; 否則,不拒絕H0 。例子產(chǎn)品合格率檢驗(yàn)107.2.3單樣本K-S檢驗(yàn)利用樣本數(shù)據(jù)推斷樣本來自的總體是否服從某一理論分布。適用于探索連續(xù)型隨機(jī)變量的分布。

5、H0: 樣本來自的總體與指定的理論分布(正態(tài)分布、均勻分布、指數(shù)分布和泊松分布等)無顯著差異。例子 收集儲戶調(diào)查的樣本數(shù)據(jù),分析儲戶總體一次存(取)款金額的分布是否服從正態(tài)分布。11基本思路在零假設(shè)成立的前提下,計(jì)算各樣本觀測值在理論分布中出現(xiàn)的理論累計(jì)概率值F(x);計(jì)算各樣本觀測值的實(shí)際累計(jì)概率值S(x);計(jì)算實(shí)際累計(jì)概率值與理論累計(jì)概率值的差D(x);計(jì)算差值序列中的最大絕對值差,即D=max(| S(xi) - F(xi) |)。通常由于實(shí)際累計(jì)概率為離散值,D修正為 D=max(max(| S(xi) - F(xi) |), max(| S(xi-1) - F(xi-1) |) )

6、。D統(tǒng)計(jì)量也稱為K-S統(tǒng)計(jì)量。在小樣本下,零假設(shè)成立時,D統(tǒng)計(jì)量服從Kolmogorov分布;在大樣本下,零假設(shè)成立時, D統(tǒng)計(jì)量近似服從K(x)分布;如概率p值小于顯著性水平,則應(yīng)拒絕H0;否則不拒絕H0 。12警告經(jīng)常有人在Kolmogorov-Smirnov檢驗(yàn)中,當(dāng)檢驗(yàn)不能拒絕總體分布為某分布時,來“接受”或“證明”該樣本來自該分布。這是錯誤的。比如我們有由1、2、3、4、5五個數(shù)目組成的數(shù)據(jù),我們分別檢驗(yàn)該數(shù)據(jù)是否是正態(tài)分布、均勻分布、Poisson分布或指數(shù)分布。結(jié)果歸納為下表13Kolmogorov-Smirnov單樣本分布檢驗(yàn)零假設(shè)的分布(漸近雙邊檢驗(yàn)的)p-值正態(tài)分布1.00

7、0均勻分布0.988Poisson分布1.000指數(shù)分布0.806根據(jù)此表,沒有足夠證據(jù)來拒絕任何一個零假設(shè)。難道我們可以隨意“接受”該總體為其中任一個分布嗎? 14例: 公共交通設(shè)施適合性的研究公共汽車到達(dá)時間是否服從正態(tài)分布。15167.2.4 關(guān)于隨機(jī)性的游程檢驗(yàn)(run test)游程檢驗(yàn)方法是檢驗(yàn)一個取兩個值的變量的這兩個值的出現(xiàn)是否是隨機(jī)的。假定下面是由0和1組成的一個這種變量的樣本:0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0其中相同的0(或相同的1)在一起稱為一個游程(單獨(dú)的0或1也算)。這個數(shù)據(jù)中有4個0組成的游程和3個1

8、組成的游程。一共是R=7個游程。其中0的個數(shù)為m=15,而1的個數(shù)為n=10。 17關(guān)于隨機(jī)性的游程檢驗(yàn)(run test) 出現(xiàn)0和1的的這樣一個過程可以看成是參數(shù)為某未知p的Bernoulli試驗(yàn)。但在給定了m和n之后,在0和1的出現(xiàn)是隨機(jī)的零假設(shè)之下,R的條件分布就和這個參數(shù)無關(guān)了。根據(jù)初等概率論,R的分布可以寫成(令N=m+n)18關(guān)于隨機(jī)性的游程檢驗(yàn)(run test) 于是就可以算出在零假設(shè)下有關(guān)R的概率,以及進(jìn)行有關(guān)的檢驗(yàn)了。利用上面公式可進(jìn)行精確檢驗(yàn);也可以利用大樣本的漸近分布和利用Monte Carlo方法進(jìn)行檢驗(yàn)。當(dāng)然,游程檢驗(yàn)并不僅僅用于只取兩個值的變量,它還可以用于某個

9、連續(xù)變量的取值小于某個值及大于該值的個數(shù)(類似于0和1的個數(shù))是否隨機(jī)的問題??聪旅胬?。19關(guān)于隨機(jī)性的游程檢驗(yàn)(run test) 例 (run2.sav): 從某裝瓶機(jī)出來的30盒化妝品的重量如下(單位克) 71.6 71.0 71.8 70.3 70.5 72.9 71.0 71.0 70.1 71.8 71.9 70.3 70.9 69.3 71.2 67.3 67.6 67.7 67.6 68.1 68.0 67.5 69.8 67.5 69.7 70.0 69.1 70.4 71.0 69.9為了看該裝瓶機(jī)是否工作正常,首先需要驗(yàn)證是否大于和小于中位數(shù)的個數(shù)是否是隨機(jī)的(零假設(shè)為

10、這種個數(shù)的出現(xiàn)是隨機(jī)的)。如果把小于中位數(shù)的記為0,否則記為1,上面數(shù)據(jù)變成下面的01序列1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 實(shí)際計(jì)算時,用不著這種變換,計(jì)算機(jī)會自動處理這個問題的。207.3 兩獨(dú)立樣本的非參數(shù)檢驗(yàn)7.3.1 曼-惠特尼U(Mann-Whitney U) 檢驗(yàn)用于對兩總體分布的比較判斷。H0:兩組獨(dú)立樣本來自的兩總體分布無顯著差異基本步驟:將兩組樣本數(shù)據(jù)(X1, X2, Xm)和(Y1, Y2, Yn) 混合并按升冪排序,得到每個數(shù)據(jù)各自的秩Ri。記第一個樣本觀測值的秩的和為WX而第二個樣本秩

11、的和為WY。對秩分別求平均,對兩個平均秩的差距比較。如果相差甚遠(yuǎn),則此時零假設(shè)可能是不成立的。計(jì)算(X1, X2, Xm)每個秩優(yōu)先于(Y1, Y2, Yn) 每個秩的個數(shù)U1,以及(Y1, Y2, Yn)每個秩優(yōu)先于(X1, X2, Xm)每個秩的個數(shù)U2,比較U1和U2 。如果相差較大,則應(yīng)懷疑零假設(shè)的真實(shí)性。依據(jù)計(jì)算Wilcoxon W統(tǒng)計(jì)量和曼-惠特尼U統(tǒng)計(jì)量。21基本步驟(續(xù)):WilcoxonW為:如果mn,WilcoxonW=WY;如果m=n,則WilcoxonW為第一個變量所在樣本組的W值。曼-惠特尼U統(tǒng)計(jì)量為:U=W-1/2k(k+1),k為W對應(yīng)樣本組的樣本個數(shù)。小樣本下,

12、U服從曼-惠特尼分布;大樣本下,U近似服從正態(tài)分布,計(jì)算方法是:在小樣本下,依據(jù)U統(tǒng)計(jì)量的概率p值進(jìn)行決策;在大樣本下,則依據(jù)Z統(tǒng)計(jì)量的概率p值進(jìn)行決策。227.3.2 兩樣本分布的Kolmogorov-Smirnov檢驗(yàn) 假定有分別來自兩個獨(dú)立總體的兩個樣本。要想檢驗(yàn)它們背后的總體分布相同的零假設(shè),可以進(jìn)行兩獨(dú)立樣本的Kolmogorov-Smirnov檢驗(yàn)。原理完全和單樣本情況一樣。只不過把檢驗(yàn)統(tǒng)計(jì)量中零假設(shè)的分布換成另一個樣本的經(jīng)驗(yàn)分布即可。假定兩個樣本的樣本量分別為n1和n2,用S1 (X)和S2 (X)分別表示兩個樣本的累積經(jīng)驗(yàn)分布函數(shù)。再記DjS1 (Xj)-S2 (Xj)。近似正

13、態(tài)分布的檢驗(yàn)統(tǒng)計(jì)量為 237.3.3 兩樣本W(wǎng)ald-Wolfowitz游程檢驗(yàn) Wald-Wolfowitz游程檢驗(yàn)(Wald-Wolfowitz runs test)和Kolmogorov-Smirnov檢驗(yàn)都是看兩樣本代表的總體分布是否類似。但是方法不一樣。和單樣本的游程問題類似。Wald-Wolfowitz游程檢驗(yàn)把兩個樣本混合之后,按照大小次序排列,同樣本的觀測值在一起的為一個游程??梢杂捎纬虃€數(shù)R看出兩個樣本在排序中是否隨機(jī)出現(xiàn)。247.3.4 極端反應(yīng)檢驗(yàn) 基本思想將一組樣本作為控制樣本,另一組樣本作為實(shí)驗(yàn)樣本。以控制樣本作為對照,檢驗(yàn)實(shí)驗(yàn)樣本相對于控制樣本是否出現(xiàn)極端反應(yīng)。如有

14、極端反應(yīng),則認(rèn)為兩總體分布存在顯著差異。分析過程將兩組樣本混合按升序排序求出控制樣本的最小秩Qmin和最大秩Qmax,并計(jì)算跨度(Span):S=Qmax-Qmin+1為消除樣本數(shù)據(jù)中極端值對分析結(jié)果的影響,在計(jì)算跨度之前按比例去除控制樣本中靠近兩端的部分樣本值,然后在求跨度,得到截頭跨度。針對跨度或截頭跨度計(jì)算H檢驗(yàn)統(tǒng)計(jì)量,即:25幾種檢驗(yàn)的比較 若研究的是兩個祥本是否代表位置(集中趨勢)有差異的總體,應(yīng)選擇對這種差異最敏感的檢驗(yàn)方法。如U檢驗(yàn), K-S檢驗(yàn)(單側(cè))。在樣本容量較大或測量層次較低時,可以采用 U 檢驗(yàn),它是專門揭示位置是否有差異的檢驗(yàn)。如果樣本容量非常小,或者同分秩較多,不便

15、于應(yīng)用 U 檢驗(yàn)時,K-S檢驗(yàn)比 U 檢驗(yàn)稍為有效一些。如果研究的是兩個樣本是否代表任一方面有差異的總體,如位置、離散度、偏斜度等等,可以選用K-S 檢驗(yàn)(雙側(cè))、游程檢驗(yàn)。若被評價的總體是連續(xù)分布的,可選用游程檢驗(yàn)或 K- S 檢驗(yàn)。一般來說, K-S檢驗(yàn)要比游程檢驗(yàn)更有效,當(dāng)數(shù)據(jù)不滿足連續(xù)性假定時,它仍然可以適用,只是得到的P值將比應(yīng)得到的稍大些,也就是說犯第 l 類錯誤的概率會稍稍增大。26 7.4.1 Brown-Mood中位數(shù)檢驗(yàn) 在有數(shù)個獨(dú)立樣本的情況,希望知道它們的中位數(shù)是否相等。零假設(shè)是這些樣本所代表的總體的中位數(shù)相等。備選假設(shè)是這些中位數(shù)不全相等。假定有k個總體,ni為第i個

16、樣本量;把所有樣本量之和記為N。先把從這個k個總體來的樣本混合起來排序,找出它們的中位數(shù)。再計(jì)算每個總體中小于該中位數(shù)的觀測值個數(shù)O1i,i=1,k,和每個總體中大于該中位數(shù)的觀測值個數(shù)O2i,i=1,k。這樣就形成了一個由元素Oij組成的2k表。其列總和為ni,i=1,k。7.4 多個獨(dú)立樣本的非參數(shù)檢驗(yàn)27兩個行總和為各樣本小于總中位數(shù)的觀測值總和:R1O11+O12+ O1k及各樣本大于總中位數(shù)的觀測值總和R2O21+O22+ O2k。用Pearson c2統(tǒng)計(jì)量,即 其中287.4.2 Kruskal-Wallis多個樣本的秩和檢驗(yàn)檢驗(yàn)?zāi)康氖强炊嗫傮w位置參數(shù)是否一樣。假定有k個總體。先

17、把從這個k個總體來的樣本混合起來排序,記各個總體觀測值的秩之和為Ri,i=1,k。顯然如果這些Ri很不相同,就可以認(rèn)為它們位置參數(shù)相同的零假設(shè)不妥(備選假設(shè)為各個位置參數(shù)不全相等)。注意這里所說的位置參數(shù)是在下面意義上的qi ;由于它在分布函數(shù)Fi(x)中可以和變元x相加成為F(x+ qi)的樣子,所以稱qi為位置參數(shù)。形式上,假定這些樣本有連續(xù)分布F1,Fk,零假設(shè)為H0:F1=Fk,備選假設(shè)為Ha:Fi(x)=F(x+ qi),i=1,k,這里F為某連續(xù)分布函數(shù),而且這些參數(shù)qi并不相等。Kruskal-Wallis檢驗(yàn)統(tǒng)計(jì)量為(R上面一杠表示平均)29公式中ni為第i個樣本量,而N為各個

18、樣本量之和(總樣本量)。如果觀測值中有大小一樣的數(shù)值,這個公式會有稍微的變化。這個統(tǒng)計(jì)量在位置參數(shù)相同的零假設(shè)下有漸近的自由度為k-1的c2分布。Kruskal-Wallis檢驗(yàn)僅僅要求各個總體變量有相似形狀的連續(xù)分布。30例子:四種不同類型治療的有效性是否有顯著不同。31327.4.3 Jonckheere-Terpstra多樣本的秩檢驗(yàn) H0:多個獨(dú)立樣本來自的多個總體的分布無顯著性差異。和兩獨(dú)立樣本的曼-惠特尼U檢驗(yàn)類似,計(jì)算一組樣本的觀察值小于其他組樣本的觀察值的個數(shù)。用Uij表第i組觀察值小于第j組觀察值的個數(shù),在J-T統(tǒng)計(jì)量的定義為:大樣本下,J-T統(tǒng)計(jì)量近似服從正態(tài)分布,檢驗(yàn)統(tǒng)計(jì)量為:337.5 兩配對樣本的非參數(shù)檢驗(yàn) McNemar檢驗(yàn)符號檢驗(yàn)Wilcoxon符號秩檢驗(yàn) 解

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論