第六章卡方檢驗_第1頁
第六章卡方檢驗_第2頁
第六章卡方檢驗_第3頁
第六章卡方檢驗_第4頁
第六章卡方檢驗_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第六章

離散型分類計數(shù)資料的2檢驗我們已學過連續(xù)型資料的t檢驗和Z檢驗方法,本章介紹離散型資料2檢驗。理論基礎:連續(xù)型變量的2分布,擬和優(yōu)度檢驗。用途:

①比較兩獨立樣本頻率或多個獨立樣本頻率的假設檢驗;②配對設計分類資料的假設檢驗;③檢驗兩個分類指標是否有相關(guān)性;④檢驗某個樣本是否服從某個分布的假設檢驗。

第一節(jié)2分布和擬合優(yōu)度的2檢驗一、2分布:

若互相獨立,則的分布稱為自由度為的2分布(Chi-squaredistribution),記為。性質(zhì):若互相獨立,則服從2分布,υ二、關(guān)于擬合優(yōu)度的2檢驗(大樣本):1.建立檢驗假設:H0:樣本來自某理論分布。H1:樣本并非來自該理論分布。α=0.12.H0成立時,大樣本時,Pearson2統(tǒng)計量:

2值:反映了實際頻數(shù)與根據(jù)檢驗假設算得的理論頻數(shù)的吻合程度。

*似然比統(tǒng)計量:自由度:-計算時利用樣本資料估計的參數(shù)個數(shù)

3.將觀察值代入得當前值和相應的P值。若P<α,則拒絕H0

否則,不拒絕H0。條件:★“大樣本”(都不小于5)。

第二節(jié)比較兩個獨立樣本頻率的2檢驗表6.1反應變量按二項分類的兩個獨立樣本資料(四格表類型之一)

例6.1164例用過洋地黃和51例沒用過洋地黃的肺心病人心率失常率是否不同?

表6.2肺心病患者心律失常觀察資料原始數(shù)據(jù)有四個,即稱為實際頻數(shù),用f表示。其余的數(shù)據(jù)都是從這四個數(shù)據(jù)推算得來的。該資料稱四格表(fourfoldtable)資料。

1.建立檢驗假設:

α=0.05

2.計算統(tǒng)計量2值:

H0成立時,,用近似地代替。一、四格表的基本思想和檢驗步驟:

理論頻數(shù)的計算公式:

統(tǒng)計量為:(理論公式)

基本思想:式中fij和eij分別表示某一格的實際頻數(shù)和理論頻數(shù)。

2值:反映了實際頻數(shù)和根據(jù)檢驗假設算得的理論頻數(shù)的吻合程度(差別的程度)。如H0成立,實際頻數(shù)和理論頻數(shù)的差別不會很大,出現(xiàn)大2值的概率P很??;出現(xiàn)大2值時,說明實際頻數(shù)和理論頻數(shù)相差較大,若2值時,,我們就懷疑H0,因而拒絕它。反之,若,則不能拒絕它。

自由度:υ=(行數(shù)-1)(列數(shù)-1)=1對于例6.1,υ=(2–1)(2–1)=13.確定P值及決策:按,查附表7,得υ=1時,臨界值,,P>0.05,故不拒絕,可認為兩總體心率失常陽性率相等。

二、四格表資料專用公式:注:關(guān)于統(tǒng)計量*四格表時,Z檢驗和檢驗完全等價。

三、連續(xù)性校正的公式:

四格表卡方檢驗的應用條件:(1)eij≥5,且n≥40時,用不校正公式計算值。(2)1≤eij<5,且n≥40時,用連續(xù)性校正檢驗。(3)eij<1或n<40,用Fisher精確概率法。

第三節(jié)2×2交叉分類資料的2檢驗

(配對四格表)

表6.32×2交叉分類資料表(四格表類型之二)根據(jù)研究目的不同可進行兩種不同的2檢驗:

獨立性檢驗和兩種處理概率相等的檢驗。一、兩種屬性分布間獨立性檢驗

(或稱關(guān)聯(lián)性檢驗):如果一種屬性的概率分布與另一種屬性的概率分布無關(guān),則稱這兩種屬性相互獨立;否則稱這兩種屬性之間存在關(guān)聯(lián)性。

例6.2

有260份血清樣品,每份樣品一分為二,用二種不同的免疫學檢測方法檢驗類風濕因子,其結(jié)果如表6.4所示。試問這兩種免疫學檢驗的結(jié)果是否相互獨立?表6.4兩種血清免疫學檢測結(jié)果1.建立檢驗假設:

H0:

屬性A和B互相獨立。

H1:屬性A和B互相關(guān)聯(lián)。

α=0.05

兩種屬性分布間獨立性檢驗與兩獨立樣本資料頻率相等的假設檢驗資料分析的計算方法相同,但設計和解釋不同。設計:一份樣本;n=260;行和與列和事先是不定的;按兩種屬性交叉分類。

2.計算統(tǒng)計量2值:利用(6.8a)或(6.7a),

υ=(2-1)(2-1)=1

3.確定P值及決策:據(jù),查附表7,υ=1時,=10.83,P<0.001,按=0.05,拒絕,可認為兩種方法測定結(jié)果間有關(guān)聯(lián)。關(guān)聯(lián)程度的大小關(guān)聯(lián)系數(shù)表達。r=(取值在-1與+1之間)其中符號由關(guān)聯(lián)的方向決定,與的符號相同。上例中,故:二、兩種處理概率相等的2檢驗

(McNemer檢驗)常用于配對設計,數(shù)據(jù)結(jié)構(gòu)同上。問題不同。

例6.2

問兩種測定方法的陽性概率是否相等?*這里不是問是否關(guān)聯(lián),故不能用上面的辦法分析!*這里的兩份樣本,接受方法A的個體與接受方法B的個體有關(guān)聯(lián),故不能用前一節(jié)兩獨立樣本資料頻率比較的辦法分析!

兩樣本陽性率之差取決于觀察值f12和f21。

問題:f12和f21的差異是否是偶然的?1.建立檢驗假設:

α=0.052.計算統(tǒng)計量2值:

連續(xù)性校正公式:當時,3.確定P值及決策:查附表7,υ=1時,,按水準,不拒絕,可以認為兩種檢測方法的總體陽性率相等。第四節(jié)

R×C列聯(lián)表資料的2檢驗

一、問題的提出:前面我們已經(jīng)學過用2檢驗進行兩個率(比率)差異的比較。在醫(yī)學研究中,常遇見多個率(比率)的比較。可否用同樣的思路和方法去解決這類問題?見表6.6的資料:表6.6不同疾病病人的血型分布這是三個三分類構(gòu)成比的比較。表6.11某病170例不同年齡患者的療效統(tǒng)計這是三個率的比較。二、R×C表資料的2檢驗:

我們可用同樣的思路,利用2檢驗進行多個率(比率)差異的比較,將資料整理成一個R×C表,可用R×C表資料的2檢驗比較多個率或構(gòu)成比的差異?;竟剑?/p>

R×C表簡化公式:

例6.4

在血型與疾病關(guān)系的研究中,隨機抽取胃潰瘍病人、胃癌病人及對照人群的樣本,根據(jù)ABO血型分類(本例中因AB血型的例數(shù)較少,故省略不計),觀測結(jié)果列于表6.6。試探討不同病種是否具有不同的血型分布。表6.6不同疾病病人的血型分布

1.建立檢驗假設:H0:三種疾病的血型構(gòu)成比相等。

H1:三種疾病的血型構(gòu)成比不全相等。α=0.052.計算2統(tǒng)計量:

思想:假設三個構(gòu)成比相等,等于什么?在沒其他信息時,基于樣本信息,最可靠的估計值是等于合計的構(gòu)成比。每個格子的理論頻數(shù)就等于各疾病的總?cè)藬?shù)乘以相應的合計構(gòu)成比,如胃潰瘍組A型血的理論頻數(shù)為:

e11=17960.424=761.5,其余格子相同。可用基本公式:或R×C表簡化公式:

3.確定P值及決策:自由度=(3-1)(3-1)=4,查附表得=18.47,故P<0.001,按=0.05,拒絕H0,即認為三種疾病的血型構(gòu)成比不等或不全相等。三、R×C表資料的關(guān)聯(lián)度測定:

對于交叉分類資料,用2檢驗拒絕了兩有序分類特征變量間獨立的零假設之后,可用Pearson列聯(lián)系數(shù)來定量描述兩有序分類特征變量的關(guān)聯(lián)強度。

Pearson列聯(lián)系數(shù)(rP):

例6.5

某病不同年齡患者的治療效果資料列于表6.11中,進行獨立性2檢驗得到=23.582,=4,拒絕兩種屬性分類相互獨立的零假設。例6.5:表6.11某病170例不同年齡患者與療效統(tǒng)計現(xiàn)計算Pearson列聯(lián)系數(shù)rP為:

注意:列聯(lián)系數(shù)的符號,當頻數(shù)集中在正對角線的格子時,取正值,集中在負對角線的格子時,取負值。(本例為負值)。四、注意事項:

1.同四格表資料一樣,2分布是建立在大樣本的假定上的,要求不能有1/5以上的格子理論頻數(shù)小于5,且不能有一個格子的理論頻數(shù)小于1。

解決辦法:①增大樣本量;②合理地合并相鄰的組別;③刪除理論數(shù)太小的行列;④電腦進行精確概率計算。

2.當多個樣本率(或構(gòu)成比)作2檢驗,結(jié)論為拒絕零假設時,只能認為各總體率(或總體構(gòu)成比)之間總的有差別,不能說明兩兩之間有差別。兩組間的比較可參考2分割的方法。第五節(jié)檢驗頻數(shù)分布的2檢驗

利用2檢驗的性質(zhì),我們可以用于檢驗任意實際分布與某個理論分布的符合程度。例如:某市成年男女的構(gòu)成比鼻咽癌在家族的分布儀器測量誤差的分布

例6.6

某地暴發(fā)流行細菌性痢疾。為了分析這次爆發(fā)流行是否存在家庭內(nèi)成員間的傳播,共調(diào)查了四口之家288戶。原始資料列于表6.12中第1及第2兩列。其步驟為:表6.12二項分布擬合優(yōu)度計算表1.

建立檢驗假設:H0:服從

=0.18576的二項分布,即不存在家庭內(nèi)傳播。H1:不服從二項分布,即存在家庭內(nèi)傳播。

=0.052.估計,計算P(x)﹑理論家庭數(shù)ex及2分量:①發(fā)病率發(fā)病人數(shù)/調(diào)查人數(shù)本例=(0×167+1×51+…+4×3)/288×4=0.18576不發(fā)病率1-=0.81424。②發(fā)病人數(shù)為x的概率:

例如:P(x=0)=(0.18576)0(0.81424)4=0.43955③理論家庭數(shù):本例n=288為調(diào)查家庭總數(shù)。e0=288×0.43955=126.59④相應的2分量為:=(167-126.59)2/126.59=12.90(條件:ex5)

3.計算2值:

4.確定P值及決策:自由度=4-1-1=2。查附表7,=2時,

=5.99,故P<0.05,拒絕H0,可認為本次調(diào)查的四口之家內(nèi)發(fā)病人數(shù)的分布不符合二項分布,此次流行可能存在家庭成員間的傳播。*第七節(jié)四格表精確概率檢驗法前以述及,由于2分布為連續(xù)性分布,2檢驗是基于大樣本假定,四格表時,如果總例數(shù)小于40或任意一格子理論數(shù)小于1,大樣本假定不成立,則不能用2檢驗。表6.14栓塞性脈管炎兩種治療方法的結(jié)果總例數(shù)n小于40,為小樣本資料,不能用2檢驗。

1.建立檢驗假設:H0:1=2H1:1≠2α=0.052.計算各種可能組合的概率:用a,b,c,d代替四個格子的頻數(shù)。我們知道總的12個病人中有7人治愈,如治愈率與治療方法無關(guān)時,可建立以下條件概率:

目前四格表資料的發(fā)生概率為:統(tǒng)計檢驗的P值還

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論