版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、許林勇 博士,醫(yī)學(xué)統(tǒng)計(jì)學(xué)-卡方檢驗(yàn),E-MAIL: ,1,高級(jí)培訓(xùn),主講內(nèi)容,第一 概述基本思想 第二 22表卡方檢驗(yàn) 第三 配對(duì)四格表卡方檢驗(yàn) 第四 RC表卡方檢驗(yàn) 第五 Fisher確切概率檢驗(yàn) 第六 多個(gè)樣本率的多重比較 第七有序分組資料的線性趨勢(shì)檢驗(yàn),卡方檢驗(yàn)概述p136,研究目的:率 or 構(gòu)成比的假設(shè)檢驗(yàn)(大樣本率或 小樣本率) 資料類型:計(jì)數(shù)資料 基本思想: 檢驗(yàn)中的 是希臘字母,稱為卡方檢驗(yàn),是一種用途較廣的計(jì)數(shù)資料的假設(shè)檢驗(yàn)方法,屬于非參數(shù)檢驗(yàn)的范疇,主要是比較兩個(gè)及兩個(gè)以上樣本率( 構(gòu)成比)以及兩個(gè)分類變量的關(guān)聯(lián)性分析。其根本思想就是在于比較理論頻數(shù)和實(shí)際頻數(shù)的吻合程度或擬
2、合優(yōu)度問(wèn)題。,檢驗(yàn)的應(yīng)用,檢驗(yàn)兩個(gè)樣本率之間差別的顯著性; 檢驗(yàn)多個(gè)樣本率或構(gòu)成比之間差別的顯著性; 檢驗(yàn)兩個(gè)雙向無(wú)序分類變量是否存在關(guān)聯(lián); 配對(duì)計(jì)數(shù)資料的比較。,一、兩獨(dú)立樣本率檢驗(yàn)(一)兩獨(dú)立樣本率資料的四格表形式,例7-1 為研究腫瘤標(biāo)志物癌胚抗原(CEA)對(duì)肺癌的診斷價(jià)值,隨機(jī)抽取72例確診為肺癌的患者為肺癌組,114例接受健康體檢的非肺癌患者為對(duì)照組。用CEA對(duì)其進(jìn)行檢測(cè),結(jié)果呈陽(yáng)性反應(yīng)者病例組中33例,對(duì)照組中10例。問(wèn)兩組人群的CEA陽(yáng)性率有無(wú)差異?,表7-1 CEA對(duì)兩組人群的診斷結(jié)果*,* 括號(hào)內(nèi)為理論頻數(shù)。,本例資料經(jīng)整理成表7-1形式,即有兩個(gè)處理組,每個(gè)處理組的例數(shù)由發(fā)
3、生數(shù)和未發(fā)生數(shù)兩部分組成。表內(nèi)有33、39、10、104 四個(gè)基本數(shù)據(jù),其余數(shù)據(jù)均由此四個(gè)數(shù)據(jù)推算出來(lái)的,故稱四格表資料。,(二) 檢驗(yàn)的基本思想,表7-2 四格表資料的基本形式,基本思想:可通過(guò) 檢驗(yàn)的基本公式來(lái)理解。,式中,A為實(shí)際頻數(shù)(actual frequency), T為理論頻數(shù)(theoretical frequency)。,理論頻數(shù) 是根據(jù)檢驗(yàn)設(shè) ,且用合并率 來(lái)估計(jì)而定的。,理論頻數(shù)由下式求得:,式中,TRC 為第R 行C 列的理論頻數(shù) nR 為相應(yīng)的行合計(jì) nC 為相應(yīng)的列合計(jì),檢驗(yàn)統(tǒng)計(jì)量 值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。 若檢驗(yàn)假設(shè)H0:1=2成立,四個(gè)格子的實(shí)際頻
4、數(shù)A 與理論頻數(shù)T 相差不應(yīng)該很大,即統(tǒng)計(jì)量 不應(yīng)該很大。如果 值很大,即相對(duì)應(yīng)的P 值很小,若 ,則反過(guò)來(lái)推斷A與T相差太大,超出了抽樣誤差允許的范圍,從而懷疑H0的正確性,繼而拒絕H0,接受其對(duì)立假設(shè)H1,即12 。,由公式(7-1)還可以看出: 值的大小還取決于 個(gè)數(shù)的多少(嚴(yán)格地說(shuō)是自由度的大?。S捎诟?皆是正值,故自由度愈大, 值也會(huì)愈大;所以只有考慮了自由度的影響, 值才能正確地反映實(shí)際頻數(shù)A和理論頻數(shù)T 的吻合程度。 檢驗(yàn)的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,=1,即在周邊合計(jì)數(shù)固定的情況下,4個(gè)基本數(shù)據(jù)當(dāng)中只有一個(gè)可以自由取值。,(1
5、) 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水平。 H0:1=2 H1:12 =0.05。,(三) 假設(shè)檢驗(yàn),(2)求檢驗(yàn)統(tǒng)計(jì)量值,四格表資料檢驗(yàn)的專用公式,(四)四格表資料檢驗(yàn)的校正公式,分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此計(jì)算得的 統(tǒng)計(jì)量的抽樣分布亦呈離散性質(zhì)。為改善 統(tǒng)計(jì)量分布的連續(xù)性,則進(jìn)行連續(xù)性校正。,四格表資料 檢驗(yàn)公式選擇條件:,,不校正的理論或?qū)S霉剑?,校正公式; ,直接計(jì)算概率 (Fisher)。,連續(xù)性校正僅用于 的四格表資料,當(dāng) 時(shí),一般不作校正。,例7-2 將116例癲癇患者隨機(jī)分為兩組,一組70例接受常規(guī)加高壓氧治療(高壓氧組),另一組46例接受常規(guī)治療(常規(guī)組),治
6、療結(jié)果見(jiàn)表7-3。問(wèn)兩種療法的有效率有無(wú)差別?,表7-3 兩種療法治療癲癇的效果,本例 ,故用四格表資料 檢驗(yàn)的校正公式,,查 界值表得 。按 檢驗(yàn)水準(zhǔn)不拒絕 ,尚不能認(rèn)為組有效率不等。,本資料若不校正時(shí), 結(jié)論與之相反。,(四)卡方檢驗(yàn)的連續(xù)性校正問(wèn)題,贊成依據(jù)是:這樣做可使卡方統(tǒng)計(jì)量抽樣分布的連續(xù)性和平滑性得到改善,可以降低I類錯(cuò)誤的概率,連續(xù)性校正后的卡方檢驗(yàn),其結(jié)果更接近于Fisher確切概率法。不過(guò),校正也不是無(wú)條件的,它只適合于自由度為1時(shí),樣本含量較小,如n40,或至少有一個(gè)格子的理論頻數(shù)太小,如T5的情形。,(四)卡方檢驗(yàn)的連續(xù)性校正問(wèn)題,反對(duì)依據(jù)是:經(jīng)連續(xù)性校正后,P值有過(guò)分
7、保守之嫌。此外,F(xiàn)isher確切概率法建立在四格表雙邊固定的假定下,而實(shí)際資料則是單邊固定的四格表,連續(xù)性校正卡方檢驗(yàn)的P值與Fisher確切概率法的P值沒(méi)有可比性。,就應(yīng)用而言,無(wú)論是否經(jīng)過(guò)連續(xù)性校正,若兩種檢驗(yàn)的結(jié)果一致,無(wú)須在此問(wèn)題上糾纏。但是,當(dāng)兩種檢驗(yàn)結(jié)果相互矛盾時(shí),如例7-2,就需要謹(jǐn)慎解釋結(jié)果了。 為客觀起見(jiàn),建議將兩種結(jié)論同時(shí)報(bào)告出來(lái),以便他人判斷。當(dāng)然,如果兩種結(jié)論一致,如均為或,則只報(bào)道非連續(xù)性檢驗(yàn)的結(jié)果即可。,第二節(jié)、兩相關(guān)樣本率檢驗(yàn)(McNemar檢驗(yàn)),配對(duì)四格表資料的 檢驗(yàn),與計(jì)量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計(jì)和配對(duì)設(shè)計(jì)一樣,計(jì)數(shù)資料推斷兩個(gè)總體率(構(gòu)成比)
8、是否有差別也有成組設(shè)計(jì)和配對(duì)設(shè)計(jì),即四格表資料和配對(duì)四格表資料。,例7-3某抗癌新藥的毒理研究中,將78只大鼠按性別、窩別、體重、年齡等因素配成39對(duì),每個(gè)對(duì)子的兩只大鼠經(jīng)隨機(jī)分配,分別接受甲劑量和乙劑量注射,試驗(yàn)結(jié)果見(jiàn)表7-4。試分析該新藥兩種不同劑量的毒性有無(wú)差異。,表7-4 某抗癌新藥兩種劑量的毒理實(shí)驗(yàn)結(jié)果,上述配對(duì)設(shè)計(jì)實(shí)驗(yàn)中,就每個(gè)對(duì)子而言,兩種處理的結(jié)果不外乎有四種可能:,兩只大鼠均死亡(甲乙)數(shù)(a); 兩只均生存(甲乙)數(shù)(d); 其中一只死亡(甲乙 )數(shù)(b); 其中一只死亡(甲乙)數(shù) (c)。,其中,a, d 為兩法觀察結(jié)果一致的兩種情況, b, c為兩法觀察結(jié)果不一致的兩種
9、情況。,檢驗(yàn)統(tǒng)計(jì)量為,注意:,本法一般用于樣本含量不太大的資料。因?yàn)樗鼉H考慮了兩法結(jié)果不一致的兩種情況(b, c),而未考慮樣本含量n和兩法結(jié)果一致的兩種情況(a, d)。所以,當(dāng)n很大且a與d的數(shù)值很大(即兩法的一致率較高),b與c的數(shù)值相對(duì)較小時(shí),即便是檢驗(yàn)結(jié)果有統(tǒng)計(jì)學(xué)意義,其實(shí)際意義往往也不大。,第三節(jié),R C表 檢驗(yàn),行列表資料,多個(gè)樣本率比較時(shí),有R行2列,稱為R 2表; 兩個(gè)樣本的構(gòu)成比比較時(shí),有2行C列,稱2C表; 多個(gè)樣本的構(gòu)成比比較,以及雙向無(wú)序分類資料關(guān)聯(lián)性檢驗(yàn)時(shí),有行列,稱為R C表。,檢驗(yàn)統(tǒng)計(jì)量,一、多個(gè)樣本率的比較,例7-4用A、B、C三種不同方法分別處理新生兒臍帶,
10、發(fā)生感染的情況見(jiàn)表7-6,試比較3種不同方法的臍帶感染率有無(wú)差異。 表9-6 三種臍帶處理方法的臍帶感染情況,二、兩組構(gòu)成比的比較,例7-5為研究某種新藥對(duì)尿路疼痛的止痛效果,將有尿路疼痛的患者144例隨機(jī)分為兩組,每組72例,一組服該新藥(治療組),另一組服安慰劑(對(duì)照組)。兩組患者尿路疼痛的原因見(jiàn)表7-7,問(wèn)兩組患者尿路疼痛原因的分布有無(wú)差異?,表7-7 兩組患者尿路疼痛原因的分布,三、多組構(gòu)成比的比較,例7-6 在某項(xiàng)疼痛測(cè)量研究中,給160例手術(shù)后疼痛的患者提供四種疼痛測(cè)量量表,即直觀模擬量表(VAS),數(shù)字評(píng)估量表(NRS),詞語(yǔ)描述量表(VDS),面部表情疼痛量表(FPS),患者首
11、選的量表以及患者的文化程度見(jiàn)表7-8,問(wèn)患者首選疼痛量表與文化程度是否有關(guān)?,表7-8 不同文化程度患者首選疼痛量表的類型,四、 R C表 檢驗(yàn)的條件,1行列表中的各格T1,并且1T5的格子數(shù)不宜超過(guò)1/5格子總數(shù),否則可能產(chǎn)生偏性。處理方法有三種:,增大樣本含量以達(dá)到增大理論頻數(shù)的目的,屬首選方法,只是有些研究無(wú)法增大樣本含量,如同一批號(hào)試劑已用完等。,根據(jù)專業(yè)知識(shí),刪去理論頻數(shù)太小的行或列,或?qū)⒗碚擃l數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列合并。這樣做會(huì)損失信息及損害樣本的隨機(jī)性。 注意:不同年齡組可以合并,但不同血型就不能合并。 改用雙向無(wú)序RC表的Fisher確切概率法(可用SAS軟件實(shí)現(xiàn)
12、)。,第四節(jié)、Fisher確切概率檢驗(yàn),確切概率檢驗(yàn)是由Fisher 1934年提出的一種用于兩個(gè)獨(dú)立樣本率比較的方法,故又稱Fisher確切概率法。有人認(rèn)為,當(dāng)樣本量n和理論頻數(shù)T太小時(shí),如n40而且T5,或T1,或n20,應(yīng)該用確切概率檢驗(yàn)。這一觀點(diǎn)所基于的理論是,當(dāng)樣本量太小時(shí),二項(xiàng)分布的正態(tài)逼近性較差,因而不宜用基于正態(tài)分布的檢驗(yàn)。提出上述條件的另外一種考慮是確切概率法的計(jì)算量偏大,但隨著計(jì)算工具的大大改進(jìn),確切概率法的應(yīng)用不一定限于上述條件。,例7-4 某醫(yī)師為研究乙肝免疫球蛋白預(yù)防胎兒宮內(nèi)感染HBV的效果,將33例HBsAg陽(yáng)性孕婦隨機(jī)分為預(yù)防注射組和非預(yù)防組,結(jié)果見(jiàn)表7-4。問(wèn)兩
13、組新生兒的HBV總體感染率有無(wú)差別?,基本思想,在四格表周邊合計(jì)數(shù)固定不變的條件下,計(jì)算表內(nèi)4個(gè)實(shí)際頻數(shù)變動(dòng)時(shí)的各種組合之概率;再按檢驗(yàn)假設(shè)用單側(cè)或雙側(cè)的累計(jì)概率,依據(jù)所取的檢驗(yàn)水準(zhǔn)做出推斷。,1各組合概率的計(jì)算 在四格表周邊合計(jì)數(shù)不變的條件下,表內(nèi)4個(gè)實(shí)際頻數(shù),變動(dòng)的組合數(shù)共有“周邊合計(jì)中最小數(shù)+1”個(gè)。如例7-4,表內(nèi)4個(gè)實(shí)際頻數(shù)變動(dòng)的組合數(shù)共有個(gè),依次為:,1計(jì)算現(xiàn)有樣本四格表的和及各組合下四格表的,見(jiàn)表7-5。本例、。 2計(jì)算滿足條件的各組合下四格表的概率。 3計(jì)算同時(shí)滿足和條件的四格表的累計(jì)概率。本例 滿足條件,累計(jì)概率為,教材批p143,本例,宜用四格表資料的Fisher確切概率法
14、直接計(jì)算累計(jì)概率。檢驗(yàn)步驟為: :,即兩組新生兒HBV的總體感染率相等 :,即兩組新生兒HBV的總體感染率不等,第五節(jié) 多個(gè)樣本率間的多重比較,當(dāng)多個(gè)樣本率比較的表資料檢驗(yàn),推斷結(jié)論為拒絕,接受時(shí),只能認(rèn)為各總體率之間總的來(lái)說(shuō)有差別,但不能說(shuō)明任兩個(gè)總體率之間有差別。要進(jìn)一步推斷哪兩兩總體間有差別,若直接用四格表資料的檢驗(yàn)進(jìn)行多重比較,將會(huì)加大犯類錯(cuò)誤的概率。,1多個(gè)實(shí)驗(yàn)組間的兩兩比較,, ,k 為樣本率的個(gè)數(shù)。,2、實(shí)驗(yàn)組與同一個(gè)對(duì)照組的比較,第六節(jié) 雙向無(wú)序分類資料的關(guān)聯(lián)性檢驗(yàn),例 7-8 測(cè)得某地5801人的ABO血型和MN血型結(jié)果如表,問(wèn)兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?,步驟,1、建立檢驗(yàn)
15、假設(shè) 2、計(jì)算檢驗(yàn)統(tǒng)計(jì)量 3、求出P值,作結(jié)論 注意:若須進(jìn)一步分析關(guān)系的密切程度時(shí),可計(jì)算Pearson列聯(lián)系數(shù),第七節(jié) 有序分組資料的線性趨勢(shì)檢驗(yàn),例7-11 某研究者欲研究年齡與冠狀動(dòng)脈粥樣硬化等級(jí)之間的關(guān)系,將278例尸解資料整理成表7-13,問(wèn)年齡與冠狀動(dòng)脈粥樣硬化等級(jí)之間是否存在線性變化趨勢(shì)?,步驟,1、建立檢驗(yàn)假設(shè) 2、計(jì)算檢驗(yàn)統(tǒng)計(jì)量 3、求出P值,作結(jié)論 注意:基本思想是: 首先計(jì)算表資料的值,然后將總的值分解成線性回歸分量與偏離線性回歸分量。若兩分量均有統(tǒng)計(jì)學(xué)意義,說(shuō)明兩個(gè)分類變量存在相關(guān)關(guān)系,但關(guān)系不是簡(jiǎn)單的直線關(guān)系;若線性回歸分量有統(tǒng)計(jì)學(xué)意義,偏離線性回歸分量無(wú)統(tǒng)計(jì)學(xué)意義
16、時(shí),說(shuō)明兩個(gè)分類變量不僅存在相關(guān)關(guān)系,而且是線性關(guān)系。,Nonzero Correlation 8 63.3895 .0001,Chi-Square 1 71.4325 .0001,data ex7_11; input r c f ; cards; 1 1 70 1 2 22 1 3 4 1 4 2 2 1 27 2 2 24 2 3 9 2 4 3 3 1 16 3 2 23 3 3 13 3 4 7 4 1 9 4 2 20 4 3 15 4 4 14 ; proc freq; weight f; tables r*c /cmh1; run;,注意,雙向有序?qū)傩圆煌谋碣Y料 表資料中兩個(gè)分
17、類變量皆為有序的,但屬性不同,如表7-13。對(duì)于該類資料,若研究目的為分析不同年齡組患者療效之間有無(wú)差別時(shí),可把它視為單向有序表資料,選用秩轉(zhuǎn)換的非參數(shù)檢驗(yàn);若研究目的為分析兩個(gè)有序分類變量間是否存在相關(guān)關(guān)系,宜用等級(jí)相關(guān)分析或Pearson積矩相關(guān)分析(見(jiàn)第九章);若研究目的為分析兩個(gè)有序分類變量間是否存在線性變化趨勢(shì),宜用本節(jié)所介紹的有序分組資料的線性趨勢(shì)檢驗(yàn)。,summary,1、研究目的:率 or 構(gòu)成比的假設(shè)檢驗(yàn)(大樣本率或 小樣本率) 2、資料類型:計(jì)數(shù)資料 3、基本思想: 根本思想就是在于比較理論頻數(shù)和實(shí)際頻數(shù)的吻合程度或擬合優(yōu)度問(wèn)題。 4、應(yīng)用條件 檢驗(yàn)兩個(gè)樣本率之間差別的顯著
18、性; 檢驗(yàn)多個(gè)樣本率或構(gòu)成比之間差別的顯著性; 檢驗(yàn)兩個(gè)雙向無(wú)序分類變量是否存在關(guān)聯(lián); 配對(duì)計(jì)數(shù)資料的比較。,5、理論頻數(shù)和fisher確切概率法 6、多個(gè)樣本率的多重比較 7、 表資料的分類和相應(yīng)檢驗(yàn)?zāi)康?可以分為雙向無(wú)序、單向有序、雙向有序?qū)傩韵嗤碗p向有序?qū)傩圆煌?類。 A、對(duì)于雙向無(wú)序資料,若研究目的為多個(gè)樣本率(或構(gòu)成比)的比較,可用行列表資料的檢驗(yàn);若研究目的為分析兩個(gè)分類變量之間有無(wú)關(guān)聯(lián)性以及關(guān)系的密切程度時(shí),可用行列表資料的檢驗(yàn)以及Pearson列聯(lián)系數(shù)進(jìn)行分析。,B、單向有序 表資料 有兩種形式。一種是表資料中的分組變量(如年齡)是有序的,而指標(biāo)變量(如傳染病的類型)是無(wú)序的。其研究目的通常是分析不同年齡組各種傳染病的構(gòu)成情況,此種單向有序表資料可用行列表資料的檢驗(yàn)進(jìn)行分析。另一種
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 成功創(chuàng)業(yè)教育試題及答案
- 安康摩托車考試題及答案
- 婦科腹腔鏡術(shù)后感染的多因素分析及護(hù)理對(duì)策
- 大數(shù)據(jù)分析優(yōu)化神經(jīng)微創(chuàng)成本結(jié)構(gòu)
- 多部門(mén)協(xié)作機(jī)制社區(qū)構(gòu)建-1
- 2025年中職社會(huì)體育(健身指導(dǎo)基礎(chǔ))試題及答案
- 2025年高職(汽車檢測(cè)與維修技術(shù))汽車底盤(pán)電控實(shí)訓(xùn)試題及答案
- 2025年大學(xué)民族文化藝術(shù)(民族手工藝)試題及答案
- 2025年高職人物形象設(shè)計(jì)(美甲創(chuàng)意設(shè)計(jì))試題及答案
- 2025年高職教育學(xué)(學(xué)前教育學(xué))試題及答案
- (正式版)DB32∕T 5156-2025 《零碳園區(qū)建設(shè)指南》
- 2025年人教版八年級(jí)英語(yǔ)上冊(cè)各單元詞匯知識(shí)點(diǎn)和語(yǔ)法講解與練習(xí)(有答案詳解)
- 智慧林業(yè)云平臺(tái)信息化建設(shè)詳細(xì)規(guī)劃
- 監(jiān)控綜合維保方案(3篇)
- 安防監(jiān)控系統(tǒng)維護(hù)與管理方案
- 犢牛獸醫(yī)工作總結(jié)
- JJF(陜) 125-2025 醫(yī)用移動(dòng)式 C 形臂 X 射線輻射源校準(zhǔn)規(guī)范
- 2025屆重慶八中學(xué)七上數(shù)學(xué)期末復(fù)習(xí)檢測(cè)模擬試題含解析
- 燙熨治療法講課件
- 2025年江蘇省事業(yè)單位招聘考試教師招聘體育學(xué)科專業(yè)知識(shí)試題
- 機(jī)械設(shè)計(jì)年終述職報(bào)告
評(píng)論
0/150
提交評(píng)論