版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第6章二維列聯(lián)表
6.1列聯(lián)分析的基本問題在醫(yī)學(xué)統(tǒng)計中,對變量較多而病例較少的數(shù)據(jù)進(jìn)行處理時,可以先使用列聯(lián)表尋找與被關(guān)注變量顯著相關(guān)的變量。首先看一個例子,對患者按病程分組,521例患者按病程長短分組得到表6-1的結(jié)果。病程小于1年1至5年5至10年10至15年15年以上合計人數(shù)(人)9087134104106521百分比(%)17.2716.725.7219.9620.35100表6-1從表6-1可以看出,521例患者病程分布相對比較均勻,5至10年的人數(shù)略多。研究還希望了解這些患者病情的嚴(yán)重程度,可以按病情嚴(yán)重程度分組,得到表6-2。病情人數(shù)(人)百分比(%)較輕529.98一般較重合計16330652131.2958.73100表6-2從表6-2可以看出,521例患者中病情嚴(yán)重的人數(shù)最多,占近60%。但是,病情嚴(yán)重是否就是病程長的?它們之間有什么關(guān)系?分布規(guī)律如何?將上面兩張表的數(shù)據(jù)進(jìn)行列聯(lián)分析,可以得到表6-3的結(jié)果。從表6-3可以得到比表6-1和表6-2更多的信息。病程10年以上的患者總的來說,病情較重。210名病程10年以上患者中病情較重的有165人,占78.57%;在病情較重的306名患者中,病程在10年以上的有165人,占53.93%。表6-3中有兩個變量,分別以X和Y表示病程和病情。病程病情小于1年1至5年5至10年10至15年15年以上合計較輕1618135052一般3733532911163較重3736687095306合計9087134104106521列聯(lián)表中的X和Y是否獨立,是二維列聯(lián)表獨立性檢驗要解決的問題。如果兩者獨立就沒有必要做過多的分析;如果不獨立,那么兩者相依程度有多大?X影響Y和Y影響X的程度是否相同?這是二維列聯(lián)表相關(guān)性度量要解決的問題。如果兩個變量沒有因果關(guān)系,或研究中不考察是X影響Y,還是Y影響X,稱為對稱關(guān)系。這種情況下哪個變量為X,哪個為Y均可,兩者地位平等。但若兩個變量之間存在因果關(guān)系,并且要研究這種關(guān)系,則需將考察或預(yù)測的變量記作Y,稱為因變量,常列入表的橫行,如表6-3中的病情;另一變量稱為自變量,記作X,列入表的縱列,如表6-3中的病程。這種情況是考察病程對病情的影響,稱為不對稱關(guān)系。列聯(lián)表可以清楚地反映在X變量條件下,Y的次數(shù)分布情況。因此,列聯(lián)表又稱作條件次數(shù)表。表的最下端是每列的總次數(shù),稱為行邊緣次數(shù),表的最右列是每行的總次數(shù),稱為列邊緣次數(shù)。表中的次數(shù),稱為條件次數(shù)。表示在自變量每個條件下,因變量各個值的數(shù)目。例如,在表6-1中,病程小于1年的有90人,這是邊緣次數(shù),從表6-3可知,其中病情較輕的有16人,這是條件次數(shù)。由表6-3中可以看出,病程確實對病情有影響。不同病程的患者,其病情有所不同。病程長的患者,更多的病情較重,而病程較短的患者,相對來說,則更多的傾向于病情較輕。表6-3是一個二維聯(lián)列表,只有兩個變量,變量病情有三個類別,是三行,變量病程有五個類別,是五列,構(gòu)成二維的3×5列聯(lián)表,最簡單的列聯(lián)表是2行和2列,稱為2×2列聯(lián)表,也稱為四格表。
合計合計表6-4:從條件次數(shù)表雖然可以知道在X條件下,Y變量值的次數(shù),但難于比較不同條件下的次數(shù)分布,因為作為基數(shù)的邊緣次數(shù)不相同。如表6-3中,病程小于1年的患者有16人的病情較輕,而病程在1至5年的患者有18人,這是否表明,病程較長的患者病情傾向于較輕?觀察邊緣次數(shù)發(fā)現(xiàn),病程1年和1至5年總?cè)藬?shù)不同,比較的基數(shù)不同,因而不宜作出結(jié)論。為了能在相同的基礎(chǔ)上比較,使列聯(lián)表的數(shù)據(jù)提供更多的信息,可以將絕對次數(shù)轉(zhuǎn)化成以百分?jǐn)?shù)表示的相對次數(shù),即將條件次數(shù)變?yōu)榘俜謹(jǐn)?shù)。這樣的表稱為條件百分表,如表6-5。病程病情小于1年1至5年5至10年10至15年15年以上合計較輕30.77%34.62%25%9.61%0100%一般22.7%20.25%32.51%17.79%6.75%100%較重12.09%11.76%22.22%22.88%31.05%100%合計17.27%16.7%25.72%19.96%20.35%100%表6-5在很多時候,研究的是不對稱關(guān)系,目的是了解自變量X對因變量Y的影響。因此,條件百分?jǐn)?shù)多按自變量X的方向計算,如表6-3。研究病程對病情的影響,沿自變量X的方向計算百分?jǐn)?shù),如表6-5。這一結(jié)果表明在不同病程水平下病情的變化情況。從表6-5可以看出,病程不同,病情的百分?jǐn)?shù)分布也不同,這就是病程長短對病情的影響。有時由于某種原因可能使因變量在樣本內(nèi)的分布不能代表其在總體內(nèi)的分布,例如為滿足資料分析的需要,抽樣時擴大了因變量的某個值的數(shù)目,使其樣本內(nèi)的分布不同于總體中的分布。這時,以自變量的方向計算百分?jǐn)?shù)會歪曲數(shù)據(jù)的結(jié)果,需要按因變量的方向計算。條件百分表比條件次數(shù)表能夠提供更多的信息,因此較為有用。但當(dāng)r×c很大時,百分?jǐn)?shù)的個數(shù)會很多,不容易分析兩個變量之間的關(guān)系。因此,在列聯(lián)表的相關(guān)測量中有許多更實用的方法可供選擇研究。
6.2.1獨立性檢驗和齊性檢驗1.獨立性檢驗(1)基本方法二維列聯(lián)表的獨立性檢驗是檢驗行變量(Y)與列變量(X)是否獨立。表6-6為兩個隨機變量的聯(lián)合分布表,其中每個格子是聯(lián)合概率,橫行合計是X的邊緣分布,縱列合計是Y的邊緣分布。建立假設(shè)組
該假設(shè)組用概率的語言描述為
合計合計表6-6
(2)應(yīng)用【例6.1】檢驗表6-3數(shù)據(jù)行變量與列變量之間的獨立性。
2.齊性檢驗(1)基本方法二維列聯(lián)表的齊性檢驗要檢驗的目標(biāo)是:給定列,條件行分布是否相同;或者給定行,條件列分布是否相同。
如果滿足齊性,則應(yīng)該有對于給定列,條件行分布都相同,即表6-7的每行分別相等。
合計11表6-7建立二維列聯(lián)表的假設(shè)組:
在原假設(shè)成立的條件下,對于表6-7的第i行都相等,記第i行的值為
這說明,二維列聯(lián)表的齊性檢驗本質(zhì)上是獨立性檢驗。因此采用的檢驗統(tǒng)計量和計算p值的方法都用獨立性檢驗相同。(2)應(yīng)用【例6.2】對表6-3數(shù)據(jù)進(jìn)行齊性檢驗。對表6-3數(shù)據(jù)進(jìn)行齊性檢驗,即檢驗在不同的病程條件下,病情的條件分布是否相同。建立假設(shè)組:
3.獨立性檢驗和齊性檢驗獨立性檢驗和齊性檢驗的檢驗統(tǒng)計量完全相同,但兩者的統(tǒng)計意義不同。獨立性檢驗要檢驗行變量與列變量是否獨立,兩個變量地位平等,沒有考慮因果關(guān)系。齊性檢驗要檢驗的是條件分布的齊一性,待檢驗的兩個變量地位是不平等的,包含著因果關(guān)系,一般作為條件的變量是自變量,例如病程;另一個變量是因變量,例如病情。在應(yīng)用中,應(yīng)根據(jù)實際問題選擇獨立性檢驗還是選擇齊性檢驗。
YX
2.皮爾遜(Pearson)列聯(lián)相關(guān)系數(shù)
當(dāng)列聯(lián)表的行和列獨立時,C系數(shù)的值為0;當(dāng)列聯(lián)表的行和列不獨立時,C系數(shù)不會隨著r或c的增大而增大,它的值永遠(yuǎn)小于1。對列聯(lián)相關(guān)C系數(shù)可以進(jìn)行顯著性檢驗。但檢驗不是利用C系數(shù)的抽樣分布,而是利用檢驗統(tǒng)計量Q。因為在計算C系數(shù)值的過程中先計算了Q的值,Q值可以作為C系數(shù)顯著性的一個簡單而合適的指標(biāo)。即只要檢驗了Q的顯著性,就等于檢驗了由Q計算的C的顯著性。檢驗方法就是前面介紹的獨立性檢驗,這里不再贅述。列聯(lián)相關(guān)C系數(shù)的局限性一般而言,一個令人滿意的相關(guān)系數(shù)至少應(yīng)該滿足兩個特點:變量完全相關(guān)時,系數(shù)為1;變量完全不相關(guān)時,系數(shù)為0。但C不是理想的相關(guān)系數(shù)。一是變量完全相關(guān)時,C值并不等于1。二是兩個列聯(lián)相關(guān)C系數(shù)不能比較,除非是從同樣大小的列聯(lián)表獲得的數(shù)據(jù)。
三是C系數(shù)不能與其它相關(guān)系數(shù)進(jìn)行比較,例如斯皮爾曼秩相關(guān)系數(shù)和肯德爾秩相關(guān)系數(shù)等。3.克拉默V相關(guān)系數(shù)(Cramer’sVCoefficientofAssociation)
當(dāng)行和列完全不相關(guān)時,V=0;當(dāng)行和列完全相關(guān)時,V=1。4.應(yīng)用【例6.3】分析青少年犯罪行為與家庭狀況的相關(guān)性。數(shù)據(jù)如下表.青少年行為家庭狀況合計離異家庭和睦家庭犯罪178272450未犯罪38502540合計216774990
6.3PRE準(zhǔn)則下的二維列聯(lián)表相關(guān)性度量當(dāng)研究X和Y之間的關(guān)系,目的是為了用X去預(yù)測Y時,往往希望這一預(yù)測的效果是很好的,但事實上難免會出現(xiàn)誤差。一般來說,兩個變量之間的關(guān)系越強,以一個變量預(yù)測另一個變量的誤差就越小,也就是減少的預(yù)測誤差越多。換言之,消減的誤差有多少,也可以反映變量之間的相關(guān)程度強弱。因此,在度量兩個變量的相關(guān)程度時,可以引進(jìn)消減誤差比例的概念。相關(guān)性的測量方法有很多種,凡是其統(tǒng)計值具有消減誤差比例(ProportionateReductioninError)的意義,均稱為PRE測量法。
其公式定義為
PRE的值可以作為度量相關(guān)性大小的值。
6.3.1Lambda相關(guān)測量法
1.非對稱形式的Lambda相關(guān)測量當(dāng)研究的兩個變量間存在某種因果關(guān)系,自變量X影響因變量Y的變化,而Y不會影響X,這種情況稱為非對稱關(guān)系。例如,研究出生時間和身體發(fā)育的關(guān)系,一般認(rèn)為出生時間對身體發(fā)育會有影響,而身體發(fā)育不會影響出生時間。
根據(jù)PRE的定義可得下式
【例6.4】出生季節(jié)與身體發(fā)育相關(guān)程度的分析出生時間對身體發(fā)育不夠正常有多大的影響,為此進(jìn)行了調(diào)査。對兩組身體發(fā)育不夠正常的人的調(diào)査結(jié)果如表6-10。身體發(fā)育(Y)出生季節(jié)(X)合計春季夏季秋季冬季較低1829181277很低2013162069合計38423432146表6-10
2.對稱形式的Lambda測量
【例6.5】某市隨機抽取100位居民調(diào)查得到表6-11的數(shù)據(jù),考察性別和是否愿意看中醫(yī)的態(tài)度之間相關(guān)情況。態(tài)度(Y)性別(X)總數(shù)男女很愿意103040不大愿意401050不愿意10010總數(shù)6040100表6-11
如果僅研究性別影響態(tài)度的程度,可以算得
這個計算結(jié)果表明,以性別X預(yù)測態(tài)度Y,可以消減40%的誤差。從表6-11可以看出,性別對看中醫(yī)的態(tài)度是有影響的,男性的態(tài)度基本傾向不大愿意,而女性則較多的認(rèn)為很愿意。3.Lambda相關(guān)測量法的特點
第三,由于Lambda相關(guān)測量法是以眾數(shù)作為預(yù)測的準(zhǔn)則,沒有考慮其它的條件次數(shù),因此,當(dāng)眾數(shù)集中在條件次數(shù)表的某行或某列時,Lambda系數(shù)會等于0。但這并不一定真是
X與Y完全無關(guān)。
故Lambda相關(guān)測量法的敏感性有問題。4.顯著性檢驗
6.3.2Goodman-KruskalTau相關(guān)測量法Goodman-KruskalTau相關(guān)測量法是由古德曼和克魯斯卡爾提出的,采用Tau系數(shù)測定兩個定類變量間的相關(guān)程度。Tau系數(shù)是對Lambda系數(shù)的改進(jìn)。它不再用眾數(shù)對Y進(jìn)行預(yù)測,而是利用邊緣次數(shù)提供的比例進(jìn)行預(yù)測。1.非對稱形式的Tau相關(guān)測量
根據(jù)PRE準(zhǔn)則,可得Tau相關(guān)測量系數(shù)為(6.14)式。
【例6.6】隨機從城鎮(zhèn)、鄉(xiāng)村兩個地區(qū)抽取10800戶家庭調(diào)査,結(jié)果如表6-12。討論城鄉(xiāng)地區(qū)與健康知識傳播渠道的相關(guān)。傳播渠道(Y)地區(qū)(X)城鎮(zhèn)鄉(xiāng)村衛(wèi)生機構(gòu)宣傳319111204311網(wǎng)絡(luò)宣傳237011833553商品推介12865281814其他媒介93518711227782301810800表6-12分析:表中提供的數(shù)據(jù)是兩個定類變量的值,測定城鄉(xiāng)地區(qū)與健康知識傳播渠道的相關(guān)程度,是為考察城鄉(xiāng)不同地區(qū)信息傳播渠道是否不同,對兩個不同地區(qū)是否應(yīng)采用不同的傳播形式。自變量是不同地區(qū),因變量是不同的信息渠道。這是非對稱的關(guān)系,可以采用Tau相關(guān)測量法。
2.Tau相關(guān)測量法的特點
3.顯著性檢驗
【例6.7】從某地區(qū)隨機抽取620位居民進(jìn)行調(diào)查,調(diào)查結(jié)果如表6-13所示,欲進(jìn)行是否定期體檢與小病處理方式的相關(guān)分析。是否定期體檢(Y)小病處理方式(X)去醫(yī)院
自己買藥
忍耐
合計檢驗結(jié)果定期體檢非定期體檢71182513042624743316合計9742994620表6-13分析:先進(jìn)行獨立性檢驗,建立假設(shè)組:
由R語言可以算得p值很小,所以拒絕源假設(shè),認(rèn)為定期體檢與小病處理方式有關(guān)。具體的關(guān)系如何?接下來利用Tau相關(guān)測量法進(jìn)一步分析。
6.3.3Gamma相關(guān)測量法
1.同序?qū)彤愋驅(qū)ν驅(qū)κ荴變量中的數(shù)值與Y變量中的數(shù)值變化方向一致的序?qū)?。?-14是三個職工受教育程度與經(jīng)濟收入的列聯(lián)表,由表6-14可以看出,甲、乙、丙三人在受教育程度和經(jīng)濟收入方面的位次有如下的關(guān)系:受教育程度:乙>甲;乙>丙;甲>丙,經(jīng)濟收入:甲>乙;乙>丙;甲>丙。經(jīng)濟收入受教育程度高中低高
甲
中乙
低
丙表6-14
2.對稱關(guān)系的Gamma相關(guān)測量Gamma相關(guān)測量法具有消減誤差比例的意義,它利用同序?qū)彤愋驅(qū)Χx系數(shù)G。
由PRE準(zhǔn)則,可以定義G系數(shù)為下式:
G系數(shù)沒有考慮Y對X的影響,還是X對Y的影響,因而是對稱關(guān)系的相關(guān)測量。
YX高中低高中低表6-15
異序?qū)梢圆捎妙愃频姆椒ǖ玫?,即將同行同列的同分對舍去,再舍去某一頻數(shù)右下方的同序?qū)Γ谀骋活l數(shù)左下方的都可以構(gòu)成異序?qū)?。?-15中的異序?qū)倲?shù)為
【例6.8】從醫(yī)院某病患者隨機抽取55名通過評分測得頭暈和頭重的不同等級狀況如表6-16。是否能夠測量頭暈和頭重的相關(guān)性。頭重頭暈輕中重輕17140中6151重002表6-16
表明兩個變量間存在正相關(guān),相關(guān)程度不算太高。由于G系數(shù)具有消減誤差比例的性質(zhì),因此G=0.6456意味著,以頭暈的相對等級解釋頭重的相對等級可以消減64.56%的誤差。由于G系數(shù)是對稱關(guān)系的相關(guān)測量,因而也可以說,以頭重的相對等級解釋頭暈的相對等級可以消減64.56%的誤差。頭暈與頭重呈正相關(guān),表明一個變量等級愈高,另一變量等級也愈高。4.Gamma相關(guān)測量法的特點
G系數(shù)測量對稱關(guān)系的相關(guān)程度。從定義可以看出,G系數(shù)只考慮同序和異序的關(guān)系,因此,無論用X預(yù)測Y,還是Y預(yù)測X,計算的G值都是一樣的。
YX表6-16
【例6.9】新藥是否能預(yù)防肝炎?采用配對樣本進(jìn)行研究,抽取60對,每對中隨機指定一人服用新藥,另一人服用原有藥,經(jīng)過一段時間的觀察,結(jié)果如表6-17.YX服用新藥服用原有藥未患肝炎6048患肝炎012表6-17
5.Gamma系數(shù)的檢驗利用隨機樣本數(shù)據(jù)計算的G系數(shù),是否能用以推斷總體,必須進(jìn)行統(tǒng)計檢驗。建立的假設(shè)組為
為判定假設(shè),需要采用隨機抽樣獲得數(shù)據(jù),數(shù)據(jù)至少是定序尺度測量。定義的檢驗統(tǒng)計量為
【
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025福建泉州晉江市博物館招聘編外人員1人筆試考試備考題庫及答案解析
- 2026中國科協(xié)所屬單位面向社會招聘5人筆試考試參考題庫及答案解析
- 2025四川廣元劍閣縣行政爭議化解中心調(diào)解專家?guī)斐蓡T選聘筆試考試備考題庫及答案解析
- 2025年下半年安徽交控驛達(dá)集團招聘3人筆試考試參考試題及答案解析
- 2025廣東中山市板芙鎮(zhèn)招聘公辦中小學(xué)校臨聘教師1人筆試考試參考題庫及答案解析
- 2025年甘肅省人民醫(yī)院護理員及人體器官捐獻(xiàn)協(xié)調(diào)員招聘考試筆試備考題庫及答案解析
- 2025榆林市橫山區(qū)艾好峁衛(wèi)生院招聘(4人)筆試考試備考題庫及答案解析
- 福建漳州市2026屆國企類選優(yōu)生招聘(第四批)開考崗位考試筆試備考題庫及答案解析
- 2025黑龍江齊齊哈爾市富??h社會保險事業(yè)中心招聘公益性崗位人員1人筆試考試備考題庫及答案解析
- 2026天津市南開區(qū)衛(wèi)生健康系統(tǒng)招聘事業(yè)單位60人(含高層次人才)考試筆試模擬試題及答案解析
- 四川省達(dá)州市達(dá)川中學(xué)2025-2026學(xué)年八年級上學(xué)期第二次月考數(shù)學(xué)試題(無答案)
- 2025陜西西安市工會系統(tǒng)開招聘工會社會工作者61人歷年題庫帶答案解析
- 外賣平臺2025年商家協(xié)議
- 2025年高職(鐵道車輛技術(shù))鐵道車輛制動試題及答案
- (新教材)2026年人教版八年級下冊數(shù)學(xué) 24.4 數(shù)據(jù)的分組 課件
- 2025陜西榆林市榆陽區(qū)部分區(qū)屬國有企業(yè)招聘20人考試筆試模擬試題及答案解析
- 老年慢性病管理及康復(fù)護理
- 2025廣西自然資源職業(yè)技術(shù)學(xué)院下半年招聘工作人員150人(公共基礎(chǔ)知識)測試題帶答案解析
- 2026年海南經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院單招(計算機)考試參考題庫及答案1套
- 代辦執(zhí)照合同范本
- 2025天津大學(xué)管理崗位集中招聘15人備考考點試題及答案解析
評論
0/150
提交評論