衛(wèi)統(tǒng) 卡方檢驗_第1頁
衛(wèi)統(tǒng) 卡方檢驗_第2頁
衛(wèi)統(tǒng) 卡方檢驗_第3頁
衛(wèi)統(tǒng) 卡方檢驗_第4頁
衛(wèi)統(tǒng) 卡方檢驗_第5頁
已閱讀5頁,還剩69頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七章

卡方檢驗小組成員:彭渝軒馮丹楊芳卡方檢驗第一節(jié)四格表資料的χ2檢驗第二節(jié)配對四格表資料的χ2檢驗第三節(jié)四格表資料的Fisher確切概率法第四節(jié)行×列表資料的χ2檢驗第五節(jié)多個樣本率間的多重比較第六節(jié)有序分組資料的線性趨勢檢驗第七節(jié)頻數(shù)分布擬合優(yōu)度的χ2檢驗四格表資料的χ2檢驗卡方檢驗是(χ2檢驗,Chi-squaretest)是現(xiàn)代統(tǒng)計學(xué)的創(chuàng)始人之一,英國人K.Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計方法,是分類計數(shù)資料的假設(shè)檢驗方法,可用于兩個或多個率間或構(gòu)成比之間的比較,計數(shù)資料的關(guān)聯(lián)度分析,擬合優(yōu)度檢驗等等。這就是著名的pearsonχ2檢驗??ǚ綑z驗的檢驗統(tǒng)計量為:

卡方檢驗是建立在卡方分布的基礎(chǔ)上。

2分布是一種連續(xù)型分布,只有自由度一個參數(shù)。按分布的密度函數(shù)可給出不同自由度的一簇分布曲線。

2分布的形狀依賴于自由度的大?。?/p>

當(dāng)自由度≤2時,曲線呈L形;隨著自由度的增加,曲線逐漸趨于對稱;當(dāng)自由度趨向于無窮大時,

2分布趨向正態(tài)分布。

3.847.8112.59P=0.05的臨界值χ2分布(chi-squaredistribution)

2分布具有可加性,如果兩個獨立的隨機(jī)變量X1X2分別服從自由度v1v2的

2分布,那么它們的和(X1+X2)服從自由度(v1+v2

)的

2分布。自由度一定時,P值越小,

2值越大。當(dāng)P值一定時,自由度越大,

2越大。

2檢驗時,先計算檢驗統(tǒng)計量

2值,然后按自由度查

2界值表,確定P值??ǚ綑z驗的基本原理卡方檢驗的基本思想是檢驗列聯(lián)表的實際頻數(shù)和理論頻數(shù)的差別是否由抽樣誤差所引起。x2反映了實際頻數(shù)與理論頻數(shù)的吻合程度,卡方檢驗就是通過二者的吻合程度大小作出統(tǒng)計推斷。對于同一份資料,u2=x2組別骨質(zhì)增生合計發(fā)生率發(fā)生未發(fā)生井下工人18224045%井上工人9273625%合計27497635.5%表:兩組工人的骨質(zhì)增生發(fā)生率比較期望頻數(shù)的分布根據(jù)前面的表格,假設(shè)兩總體發(fā)生率相等,均等于合計的骨質(zhì)增生發(fā)生率35.5%(27/76),根據(jù)上述假設(shè),計算表格中對應(yīng)的期望頻數(shù),也可稱為理論數(shù),記作T。根據(jù)上述假設(shè),計算得到井下礦工組發(fā)生骨質(zhì)增生的期望頻數(shù)T11=40×(27/76)=14.2,井上工人組發(fā)生骨質(zhì)增生的期望頻數(shù)T21=36×(27/76)=12.8組別骨質(zhì)增生合計發(fā)生率發(fā)生未發(fā)生井下工人18(14.2)22(25.8)4045井上工人9(12.8)27(23.2)3625合計27497635.5表:兩組工人的骨質(zhì)增生發(fā)生率比較

綜合以上思路,列聯(lián)表期望頻數(shù)的統(tǒng)一計算公式為:如果H0成立,A與T不應(yīng)相差太大,x2值不應(yīng)很大;如果H0不成立,由H0為真的條件下所計算的理論頻數(shù)與樣本的實際頻數(shù)的差別會很大,大多數(shù)情況下的檢驗統(tǒng)計量x2會較大或很大。理論上可以證明,若H0成立,服從x2分布。A:表示實際頻數(shù),即實際觀察到的例數(shù)。T:理論頻數(shù),期望頻數(shù),即如果假設(shè)檢驗成立,應(yīng)該觀察到的例數(shù)。計算出x2值后,查表判斷如此大的x2是否為小概率事件,以判斷建設(shè)檢驗是否成立。如果x2值大于臨界值,P<a,所以可以拒絕H0。x2值的大小除了與(A-T)的差值有關(guān)外,還取決于格子數(shù)(嚴(yán)格說是自由度)的多少。因為每個格子的(A-T)2/T都是正值,因此格子數(shù)越多,x2值就越大。所以考慮x2值大小的意義時就要同時考慮自由度自由度:

=(R-1)×(C-1),其中,R行數(shù),C列數(shù)例題:為了解井下礦工腰脊椎退行性變化情況,2002年某醫(yī)生從某煤礦井下作業(yè)15-20年的40歲以上礦工的名單中按系統(tǒng)抽樣的方法隨機(jī)抽取40名工人為觀察組;同時從年齡、工齡和身高相近的井上體力勞動者中按同樣方法隨機(jī)抽取36名工人作為對照組。對每個觀察單位做X光影像檢查,并根據(jù)檢查結(jié)果將76名調(diào)查對象分為骨質(zhì)增生發(fā)生和未發(fā)生兩種情況。用卡方檢驗來回答井下礦工與井上工人的骨質(zhì)增生發(fā)生率有無不同。例題組別骨質(zhì)增生合計發(fā)生率發(fā)生未發(fā)生井下工人18(14.2)22(25.8)4045井上工人9(12.8)27(23.2)3625合計27497635.5表:兩組工人的骨質(zhì)增生發(fā)生率比較具體步驟1.建立假設(shè)2.計算卡方統(tǒng)計量3、確定P值,并做出結(jié)論卡方檢驗的使用范圍兩組及多組率的檢驗兩組及多組構(gòu)成比分布的檢驗獨立性檢驗擬合優(yōu)度檢驗四格表資料的x2檢驗什么是四格表資料?凡是兩個率或構(gòu)成比資料都可以看做四格表資料,即2×2列聯(lián)表。四格表的一般形式假設(shè)一組和二組的總體陽性率相等,均等于即因此,以兩樣本組的合計陽性率作為理論頻率。期望頻數(shù)就可以通過每組的合計數(shù)與總體陽性率乘積得到,也即四格表資料的一般公式A是實際頻數(shù),T是根據(jù)假設(shè)檢驗來確定的,是當(dāng)H0成立時,計算出的理論頻數(shù)。四格表資料的一般公式展開式四格表資料的專用公式該公式從基本公式推導(dǎo)而來,計算結(jié)果與基本公式相同。適用條件:

N>40且T

5組別骨質(zhì)增生合計發(fā)生率發(fā)生未發(fā)生井下工人18(14.2)a22(25.8)b40(a+b)45井上工人9(12.8)c27(23.2)d36(c+d)25合計27(a+c)49(b+d)76(n)35.5表:兩組工人的骨質(zhì)增生發(fā)生率比較具體步驟1.建立假設(shè)2.計算卡方統(tǒng)計量按照四格表專用公式3、確定P值,并做出結(jié)論四格表資料的校正公式卡方值的分布原本是連續(xù)性分布,界值表是根據(jù)這種連續(xù)性的理論分布計算出來的,而分類數(shù)據(jù)都是不連續(xù)的,由此計算的x2值也是不連續(xù)的,與真正的卡方分布有一定的誤差,統(tǒng)計學(xué)家已經(jīng)證明,當(dāng)自由度比較大時,誤差較小。當(dāng)自由度為1時,特別是n較小或者期望頻數(shù)<5,則誤差較大,使得所得概率偏小,統(tǒng)計學(xué)家提出了校正公式;②

一般來說,當(dāng)n≥40,1≤T<5時,采用校正公式①

對四格表資料,如果n≥40,且所有的格子的理論頻數(shù)≥5,無須進(jìn)行校正。該方法是由R.A.Fisher1934提出的,其理論依據(jù)是超幾何分布,簡稱Fisher確切概率法。此方法不屬于卡方檢驗范疇,但可作為四格表卡方檢驗應(yīng)用上的補(bǔ)充。實際上,當(dāng)有統(tǒng)計軟件條件下,大樣本四格表的資料也可用確切概率檢驗③當(dāng)T<1或n<40時,或者當(dāng)卡方檢驗的P值≈a時,采用確切概率法例:某食品檢驗所對來自同一屠宰場的甲、乙兩肉食零售點的豬肉,檢查其表層沙門菌帶菌情況,資料見表,問甲、乙兩零售點的豬肉帶菌率有無差別?零售點陽性例數(shù)陰性例數(shù)合計帶菌率甲226287.14乙591435.71合計7354216.67表:比較甲、乙兩零售點豬肉表層沙門菌帶菌率首先計算最小的期望頻數(shù):T21=14×7/42=2.33由于最小期望頻數(shù)小于5,應(yīng)選用校正公式第一步:建立假設(shè)H0:

1=2

H1:

1≠2第二步:確定顯著性水平

=0.05第三步:計算統(tǒng)計量:第四步:確定P值,判斷結(jié)果確切概率法確切概率計算方法的基本思想:在四格表邊緣合計固定不變的條件下,利用公式

直接計算表內(nèi)四個格子數(shù)據(jù)的各種組合的概率,然后計算單側(cè)或雙側(cè)累計概率,并與檢驗水準(zhǔn)比較,作出是否拒絕H0的結(jié)論治療效果合計有效率分組有效無效甲藥751258.3乙藥381127.3合計10132343.5例題:將23名精神抑郁癥患者隨機(jī)分到兩組,分別用兩種藥物治療,結(jié)果見表,問兩種藥物的治療效果是否不同?本例n<40,只能選擇四格表的確切概率法。1、建立檢驗假設(shè)

H0:兩種藥物治療效果相等

H1:兩種藥物治療效果不等2、計算概率在邊緣合計數(shù)不變的條件下,計算所有組合四格表的概率P。四格表序號有效無效P1750.114382840.0230293930.00211041020.0000580115660.266523476570.3198567480.199865表:各種組合的四格表計算的確切概率四格表序號有效無效P8390.06347492100.009583101110.00057792110120.0000011013、確定P值和作出判斷雙側(cè)檢驗的P值是指上表中P≤0.114各種組合的四格表確切概率相加所得到的累積概率。單側(cè)檢驗則取a≥7,或a≤7一側(cè)的累積概率為單側(cè)P值。本題的研究目的是甲乙兩種藥物的治療效果何者為優(yōu),所以用雙側(cè)檢驗。將上表中P≤0.114的8個四格表的P值相加,得累計概率P=0.214。按顯著性水平0.05水準(zhǔn)不能拒絕原假設(shè),兩組藥物療效的差別無統(tǒng)計學(xué)意義,尚不能認(rèn)為兩藥治療精神抑郁癥的效果不同。若研究的目的是說明甲藥是否優(yōu)于乙藥,并有證據(jù)說明甲藥不會次于乙藥,則用單側(cè)檢驗。將表中a≥7的1-4四格表的P值相加得累計概率P=0.14。按顯著性水平0.05檢驗水平,不能拒絕原假設(shè),兩組藥物療效的差別無統(tǒng)計學(xué)意義,尚不能認(rèn)為甲藥治療精神抑郁癥的效果優(yōu)于乙藥。四格表卡方檢驗條件總結(jié)當(dāng)n≥40,且所有T≥5時,用基本公式或四格表專用公式;如果P≈a,最好用確切概率法。當(dāng)n≥40,但有1<T<5時,用四格表校正公式,或用確切概率法。當(dāng)n≤40,或T≤1時,需用確切概率法。在實際應(yīng)用中,通常先計算四格表中最小的T值,也就是最小行合計與最小列合計對應(yīng)的那一格子的T值,以確定是否采用校正公式。

什么是配對資料?計數(shù)資料的配對設(shè)計同計量資料一樣,可以將條件相似的兩個受試對象配成一對,隨機(jī)地讓其中一個接受A處理,另一個接受B處理;也可以把兩種處理分別施與同一受試對象,或觀察同一受試對象處理前后的變化。把每種處理的結(jié)果分類整理成表格的形式,這種設(shè)計類型的資料稱為配對資料。配對四格表資料的x2檢驗例:為比較兩種檢驗方法是否有差別,某實驗室將75份受大腸桿菌污染的乳制品依相同的實驗條件分別用乳膠凝聚法(A法)和常規(guī)培養(yǎng)法(B法)作細(xì)菌培養(yǎng),并將培養(yǎng)結(jié)果整理成下表,問兩種實驗的細(xì)菌培養(yǎng)效果有無不同?研究目的是檢驗兩種處理方法的總體陽性率是否有差別,而兩種處理的樣本陽性率及其差值分別為:PA=(a+b)/n,PB=(a+c)/n,PA-PB=(b-c)/n可見,兩樣本陽性率差值的大小完全是由b和c決定,如果b=c,則兩樣本的陽性率相等。因此推斷總體率是否相等,只需推斷總體B=C即可,假設(shè)檢驗仍然采用卡方檢驗,又稱為McNemar檢驗。在H0:總體B=C成立的情況下,b與c的理論頻數(shù)相等,均等于因此,當(dāng)b+c≤40時,需要做連續(xù)性校正,校正公式為行×列表資料的x2檢驗四格表是指只有2行2列的表格,當(dāng)行數(shù)或列數(shù)超過2時,統(tǒng)稱為行×列表,或R×C表。行×列表的卡方檢驗多用于:多個獨立樣本率的比較(R×2);兩個或多個樣本構(gòu)成比分布的比較(2×C表,或R×C表);單個樣本資料的兩個無序分類變量間有無關(guān)聯(lián)性的統(tǒng)計推斷

基本公式:基本公式的展開式:其中,自由度:

=(R-1)×(C-1)

適用條件:表中不宜有1/5以上格子的理論頻數(shù)小于5,或有一個格子的理論頻數(shù)小于1。表三種療法有效率的比較

療法有效無效合計有效率(%)

物理療法199720696.60

藥物治療1641818290.11

外用膏藥1182614481.94

合計4815153290.41例:三種療法治療周圍性面神經(jīng)麻痹的有效率比較。一、多個獨立樣本率的比較H0:π1=

π2=

π3,即三種療法治療周圍性面神經(jīng)麻痹的有效率相等H1:三種療法治療周圍性面神經(jīng)麻痹的有效率不全相等查

2界值表,得p<0.005,按α=0.05水準(zhǔn),拒絕H0

,接受H1

,三種療法治療周圍性面神經(jīng)麻痹的有效率有差別。

例:某研究人員收集了亞洲、歐洲和北美洲人的A、B、AB、O血型資料,結(jié)果見表所示,其目的是研究不同地區(qū)的人群血型分類構(gòu)成比是否一樣二、樣本構(gòu)成比的比較建立假設(shè)

H0:不同地區(qū)的人群血型分布構(gòu)成相同

H1:不同地區(qū)的人群血型分布構(gòu)成不同或不全相同α=0.05計算檢驗統(tǒng)計T11=1080×987/2592=411.5T12=215.83T13=64.17T14=388.75T21=196.87T22=103.32T23=30.72T24=186.10 T31=378.88T32=198.8T33=59.12T34=358.15方法1:查χ2界值表v=(3-1)×(4-1)=6,由于則P<0.05,拒絕H0,認(rèn)為三個地區(qū)的人群血型分布構(gòu)成不同或不全相同。建立假設(shè)

H0:不同地區(qū)的人群血型分布構(gòu)成相同

H1:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論