第十講1非參數(shù)檢驗卡方檢驗_第1頁
第十講1非參數(shù)檢驗卡方檢驗_第2頁
第十講1非參數(shù)檢驗卡方檢驗_第3頁
第十講1非參數(shù)檢驗卡方檢驗_第4頁
第十講1非參數(shù)檢驗卡方檢驗_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1卡方檢驗

(chi-squaretest)

分類數(shù)據(jù)組間比較的假設(shè)檢驗計數(shù)資料組間的比較2

本講主要內(nèi)容第一節(jié)卡方檢驗的基本思想第二節(jié)獨立四格表資料的χ2檢驗*第三節(jié)配對四格表資料的χ2檢驗*第四節(jié)行×列表資料的χ2檢驗*第五節(jié)多個樣本率間的多重比較第六節(jié)卡方檢驗總結(jié)3

目的:推斷兩個總體率或構(gòu)成比之間有無差別多個總體率或構(gòu)成比之間有無差別多個樣本率間的多重比較兩個分類變量之間有無關(guān)聯(lián)性頻數(shù)分布擬合優(yōu)度的檢驗。檢驗統(tǒng)計量:資料類型:計數(shù)資料理論基礎(chǔ):卡方分布4第一節(jié)檢驗的基本思想51.χ2分布1875年F.Helmet提出χ2統(tǒng)計量,設(shè)Xi為來自正態(tài)總體的連續(xù)型變量。χ2分布是一個連續(xù)型變量的分布,分布的參數(shù)為自由度(ν)。63.847.8112.59P=0.05的臨界值χ2分布的概率密度函數(shù)曲線7χ2分布的界值在υ=1,卡方分布界值為標(biāo)準(zhǔn)正態(tài)分布界值的平方。8K.Pearson的χ2統(tǒng)計量1900年K.Pearson提出下述公式,在n≥40時下式值與χ2分布近似,在理論頻數(shù)>5,近似程度較好。A:實際頻數(shù),表中實際發(fā)生的陽性或陰性頻數(shù);T:理論頻數(shù),按某H0假設(shè)計算理論上的陽性或陰性頻數(shù)TRC,第R行第C列的理論頻數(shù);nR,相應(yīng)行的合計,nC,相應(yīng)列的合計,n,總例數(shù)9表7-1兩組療法降低顱內(nèi)壓有效率(%)療法有效人數(shù)無效人數(shù)合計有效率試驗組99(90.48)5(13.52)10495.2對照組75(83.52)21(12.48)9678.1合計

1742620087.0注:括號內(nèi)為理論頻數(shù)(T)T11=174*104/200=90.48假設(shè):H0:1=2=c=87.00

(兩組總體有效率相等)H1:12(兩組總體有效率不等)

假定兩組有效率均為87%10Class n HypothesizedObservedExpected=T試驗組104有效概率π=0.8799 90.48

無效概率π1=0.13513.52對照組96有效概率π=0.87 75 83.52

無效概率π1=0.132112.48Χ2檢驗是考察實際頻數(shù)與假設(shè)理論頻數(shù)是否一致的統(tǒng)計量。11Pearson檢驗計算與步驟1.建立假設(shè):H0:1=2=c(兩組總體率相等)H1:12(兩組總體率不等)2.=0.053.計算統(tǒng)計量4.確定概率(P)和自由度(ν)自由度(ν)=(行數(shù)-1)×(列數(shù)-1)本例ν=(2-1)×(2-1)=112

與比較,得到p值5.結(jié)論:在=0.05水準(zhǔn)上,p<0.01,拒絕H0,兩樣本率差別有統(tǒng)計意義,可認(rèn)為試驗組對降低顱內(nèi)壓有效率高于對照組。本例13第二節(jié)獨立四格表資料檢驗

(兩組樣本率間差別檢驗)14兩組(不配對)樣本率的比較

1)四格表形式組別陽性數(shù)陰性數(shù)合計率%甲組aba+b=n1a/n1乙組cdc+d=n2c/n2合計a+cb+dn2)四格表不配對資料檢驗的專用公式二者結(jié)果等價各組樣本例數(shù)是固定的省去求理論頻數(shù)15表7-1兩組降低顱內(nèi)壓有效率比較療法有效人數(shù)無效數(shù)合計試驗組99(a)5(b)104(a+b)對照組75(c)21(d)96(c+d)合計174(a+c)26(b+d)200(N)163)四格表資料檢驗的校正公式計數(shù)資料中的實際頻數(shù)是分類資料,計算的統(tǒng)計量是離散型分布,一般近似于連續(xù)型分布。在自由度大于1,各格的理論頻數(shù)均大于5時,這種近似很好;當(dāng)自由度為1,有任何格子理論頻數(shù)小于5而大于1,且n>40時,這種近似較差。而分布是一連續(xù)型分布。因此需要進行連續(xù)性校正。美國統(tǒng)計學(xué)家F.Yates提出了用|A-T|-0.5計算連續(xù)性校正法。17四格表資料檢驗公式選擇條件:

,不校正的理論或?qū)S霉剑?/p>

,校正公式;,用Fisher確切概率法

連續(xù)性校正僅用于的四格表資料,當(dāng)時,一般不作校正。

18表7-2兩藥物治療腦血管病有效率比較組別有效數(shù)無效數(shù)合計有效率%甲藥4665288.46乙藥1882669.23合計64147882.05校正公式不校正χ2=4.350.025<p<0.050.05<P<0.1

結(jié)果不同19SPSS輸入格式組別Freq2效果甲藥46陽性甲藥6陰性乙藥18陽性乙藥8陰性20SPSS過程DataWeightCasesWeightCasesby錄入的數(shù)據(jù)是經(jīng)過整理后的頻數(shù)表數(shù)據(jù),分析前需要告訴系統(tǒng)freq變量代表的是頻數(shù),否則得不到預(yù)期的結(jié)果。將頻數(shù)變量freq2送入FrequencyVariableok21AnalyzeCrosstabsDescriptiveStatisticsSPSS過程22Rows:group1Colums:效果列變量行變量Statistics23Chi-squareokNominal無序分類變量Ordinal有序分類變量2*2配對卡方檢驗只適合方表,吻合程度檢驗2*2表,計算相對危險度OR估計值卡方檢驗,產(chǎn)生多種結(jié)果計算相關(guān)系數(shù)24SPSS輸出結(jié)果25SPSS輸出結(jié)果不校正校正a說明對2*2表格計算了連續(xù)性校正卡方b說明1個單元格的理論頻數(shù)小于5,最小理論頻數(shù)為4.67皮爾遜卡方檢驗結(jié)果:x2=4.353,p=0.037Fisher卡方檢驗結(jié)果:p=0.058n=78,T<5選校正公式結(jié)果26練習(xí)在甲乙兩個污水排放口分別取樣檢驗COD超標(biāo)情況,結(jié)果見表,排污口超標(biāo)次數(shù)未超標(biāo)次數(shù)合計甲4(5.22)26(24.78)30乙4(2.78)12(13.22)16合計838461)確定檢驗假設(shè)和檢驗水準(zhǔn)2)計算理論頻數(shù),見表中括號里數(shù)字3)使用校正公式計算卡方統(tǒng)計量,為0.344)查臨界值表,得p>0.05,超標(biāo)率無統(tǒng)計學(xué)意義。27練習(xí)結(jié)果28第三節(jié)配對設(shè)計兩個樣本率的χ2檢驗(McNemer檢驗)用途常用于比較兩種檢驗方法或兩種培養(yǎng)基的陽性率是否有差別。特點:對同一觀察對象分別用兩種方法處理,觀察其陽性與陰性結(jié)果。資料整理為配對四格表形式.29配對設(shè)計資料的四格表及公式例表7-3兩種方法的檢測結(jié)果

免疫乳膠法熒光法+-合計+11(a)12(b)23(a+b)-2(c)33(d)35(c+d)合計13(a+c)45(b+d)58(N)例7-3:某實驗室采用兩種方法對58名可疑紅斑狼瘡患者的血清抗體進行測定,問:兩方法測定結(jié)果陽性檢出率是否有差別?各觀察單位分別用兩種方法處理,然后觀察兩種處理方法的某兩分類變量的計數(shù)結(jié)果30例:配對計數(shù)資料的比較1.建立檢驗的假設(shè)H0:b=c

(兩法總體陽性率相等)H1:bc

(兩法總體陽性率不等)2.=0.053.計算χ2

統(tǒng)計量(McNemer檢驗

)條件:(b+c)<40條件:(b+c)≥40314.確定自由度(ν)和χ2值的概率P

ν=(行數(shù)-1)(列數(shù)-1)本例:ν=1本例χ2=5.79>3.84,P<0.055.結(jié)論:在α=0.05水準(zhǔn),拒絕H0,P<0.05認(rèn)為兩方法的檢測率不同,乳膠法的陽性檢測率22.41%低于免疫檢測率39.66%。當(dāng)n很大,a與d數(shù)值很大,統(tǒng)計意義不大32熒光法乳膠法頻數(shù)2陽性陽性11陽性陰性12陰性陽性2陰性陰性33SPSS數(shù)據(jù)要求33SPSS過程DataWeightCasesWeightCasesby將頻數(shù)2變量送入FrequencyVariableokAnalyzeDescriptiveStatisticsCrosstabsRows:熒光法Colums:乳膠法StatisticsMcMemarok34McNemar檢驗結(jié)果McNemar利用二項分布原理計算雙側(cè)精確概率,p=0.013,差異具有統(tǒng)計學(xué)意義。35第四節(jié)行×列表的χ2檢驗當(dāng)比較組行或列分類數(shù)>2,稱為行×列表。其基本數(shù)據(jù)有以下三種情況:1.多組(獨立樣本)樣本率差別有無統(tǒng)計意義?2.兩組(獨立樣本)的構(gòu)成比(分布)有無統(tǒng)計意義?3.兩個分類變量分布是否獨立(有關(guān)聯(lián))?36行×列表的χ2檢驗公式自由度=(行數(shù)-1)×(列數(shù)-1)等價37表7-8三組療法有效率的比較療法有效無效合計有效率%物理組199720696.6藥物組1641818290.1外用組1182614481.9合計4815153290.4一、多組樣本率的比較H0:1=2=3=90.4(三組總體有效率相等)H1:三組總體率不全等38表7-8三組療法有效率的計算A為表中的實際頻數(shù)自由度=(行數(shù)-1)(列數(shù)-1)=(3-1)(2-1)=239SPSS過程DataWeightCasesWeightCasesby將頻數(shù)變量送入FrequencyVariableokAnalyzeDescriptiveStatisticsCrosstabsRows:group1Colums:效果StatisticsChi-squareok40Group1效果頻數(shù)物理組陽性199物理組陰性7藥物組陽性164藥物組陰性18外用組陽性118外用組陰性26SPSS輸入和輸出注意weigtcases結(jié)論:在α=0.05水準(zhǔn),拒絕H0,P<0.01,認(rèn)為三組療法有效率不等或不全等.注意:此結(jié)果不能得到各兩兩組比較的結(jié)論.41二、兩組和多組構(gòu)成比的比較

表7-9兩組Ⅱ型糖尿病患者ACE基因分布比較

ACE基因類型糖尿病DDIDII合計有腎病42(37.8)48(43.3)21(18.9)111無腎病30(21.7)75(52.2)36(26.1)141合計72(28.9)123(48.2)57(22.9)252括號內(nèi)為行的構(gòu)成比問:兩組糖尿病人在ACE基因類型分布上有無差別?H0:兩組總體各基因構(gòu)成相等,均等于合計構(gòu)成比H1:兩組總體構(gòu)成分布不相等42輸入格式和過程腎病有無基因類型構(gòu)成比有腎病DD42有腎病ID48有腎病二21無腎病DD30無腎病ID75無腎病二36操作過程同前43SPSS輸出結(jié)果結(jié)論:在α=0.05水準(zhǔn),拒絕H0,P=0.015,認(rèn)為兩組糖尿病病人在ACE基因類型分布上有差別,有腎病糖尿病者DD基因比例多于無腎病.

44三、R×C表數(shù)據(jù)的注意事項1.多個樣本率比較的χ2檢驗,當(dāng)拒絕H0時,不能得出任何兩組間都有差別,需要進行多個樣本率的多重比較。目前尚無公認(rèn)的兩兩比較的方法.2.R×C表各格的理論頻數(shù)不應(yīng)小于1,且1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論