第十一講衛(wèi)生統(tǒng)計學(xué)兩變量關(guān)聯(lián)性分析課件_第1頁
第十一講衛(wèi)生統(tǒng)計學(xué)兩變量關(guān)聯(lián)性分析課件_第2頁
第十一講衛(wèi)生統(tǒng)計學(xué)兩變量關(guān)聯(lián)性分析課件_第3頁
第十一講衛(wèi)生統(tǒng)計學(xué)兩變量關(guān)聯(lián)性分析課件_第4頁
第十一講衛(wèi)生統(tǒng)計學(xué)兩變量關(guān)聯(lián)性分析課件_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第十一章

兩變量關(guān)聯(lián)性分析-本章內(nèi)容第一節(jié)線性相關(guān)

第二節(jié)秩相關(guān)第三節(jié)分類變量的關(guān)聯(lián)性分析

-醫(yī)學(xué)上,許多現(xiàn)象之間也都有相互聯(lián)系,例如:身高與體重、體溫與脈搏、產(chǎn)前檢查與嬰兒體重、乙肝病毒與乙肝等。在這些有關(guān)系的現(xiàn)象中,它們之間聯(lián)系的程度和性質(zhì)也各不相同。這里,體溫和脈搏的關(guān)系就比產(chǎn)前檢查與嬰兒體重之間的關(guān)系密切得多,而體重和身高的關(guān)系則介與二者之間。另外,可以說乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之間是因果關(guān)系;但是,有的現(xiàn)象之間因果不清,只是伴隨關(guān)系,例如丈夫的身高和妻子的身高之間,就不能說有因果關(guān)系。相關(guān)與回歸就是用于研究和解釋兩個變量之間相互關(guān)系的。-第一節(jié)線性相關(guān)一、線性相關(guān)的概念

線性相關(guān)(linearcorrelation)又稱簡單相關(guān)(simplecorrelation),用于雙變量正態(tài)分布(bivariatenormaldistribution)資料。其性質(zhì)可由圖11-2散點圖直觀的說明。

-散點圖為了確定相關(guān)變量之間的關(guān)系,首先應(yīng)該收集一些數(shù)據(jù),這些數(shù)據(jù)應(yīng)該是成對的。例如,每人的身高和體重。然后在直角坐標(biāo)系上描述這些點,這一組點集稱為散點圖。-為了研究父親與成年兒子身高之間的關(guān)系,卡爾·皮爾遜測量了1078對父子的身高。把1078對數(shù)字表示在坐標(biāo)上,如圖。用水平軸X上的數(shù)代表父親身高,垂直軸Y上的數(shù)代表兒子的身高,1078個點所形成的圖形是一個散點圖。它的形狀象一塊橄欖狀的云,中間的點密集,邊沿的點稀少,其主要部分是一個橢圓。-相關(guān)的類型★正相關(guān)★負(fù)相關(guān)★完全正相關(guān)★完全負(fù)相關(guān)★稱零相關(guān)

-目的:研究兩個變量X,Y數(shù)量上的相關(guān)關(guān)系。特點:統(tǒng)計關(guān)系-二、相關(guān)系數(shù)的意義與計算1、意義:相關(guān)系數(shù)(correlationcoefficient)又稱Pearson積差相關(guān)系數(shù),用來說明具有直線關(guān)系的兩變量間相關(guān)的密切程度與相關(guān)方向。-樣本的相關(guān)系數(shù)用r(correlationcoefficient)相關(guān)系數(shù)r的值在-1和1之間,但可以是此范圍內(nèi)的任何值。正相關(guān)時,r值在0和1之間,散點云圖是斜向上的,這時一個變量增加,另一個變量也增加;負(fù)相關(guān)時,r值在-1和0之間,散點云圖是斜向下的,此時一個變量增加,另一個變量將減少。r的絕對值越接近1,兩變量的關(guān)聯(lián)程度越強,r的絕對值越接近0,兩變量的關(guān)聯(lián)程度越弱。-相關(guān)系數(shù)的計算公式:r的計算結(jié)果說明了兩個變量X與Y之間關(guān)聯(lián)的密切程度(絕對值大?。┡c關(guān)聯(lián)的性質(zhì)(正負(fù)號)。-例11-1在某一項膳食調(diào)查中,隨機抽取14名40-60歲的健康婦女,測得每人的基礎(chǔ)代謝(kJ/d)與體重(kg)數(shù)據(jù),見表11-1所示,據(jù)此數(shù)據(jù)如何判斷這兩項指標(biāo)間有否相關(guān)?表11-114名中年健康婦女基礎(chǔ)代謝與體重測量結(jié)果-例11-2計算例11-1中體重X與基礎(chǔ)代謝Y之間樣本相關(guān)系數(shù)。由例11-1得:從計算結(jié)果可以知道,14名成年健康婦女基礎(chǔ)代謝和體重之間呈正相關(guān),相關(guān)系數(shù)是0.964。-相關(guān)系數(shù)的特點1、相關(guān)系數(shù)r是一個無量綱的數(shù)值,且-1<r<1;2、r>0為正相關(guān),r<0為負(fù)相關(guān);3、|r

|越接近于1,說明相關(guān)性越好;|r

|越接近于0,說明相關(guān)性越差。-問題:我們能否得出結(jié)論說明成年健康婦女基礎(chǔ)代謝和體重之間呈正相關(guān),相關(guān)系數(shù)是0.964。為什么?-相關(guān)系數(shù)的假設(shè)檢驗

上例中的相關(guān)系數(shù)r等于0.964,說明了14名成年健康婦女基礎(chǔ)代謝和體重之間存在相關(guān)關(guān)系,這14名成年健康婦女只是總體中的一個樣本,由此得到的相關(guān)系數(shù)會存在抽樣誤差。因為,總體相關(guān)系數(shù)()為零時,由于抽樣誤差,從總體抽出的14名成年健康婦女,其r可能不等于零。所以,要判斷該樣本的r是否有意義,需與總體相關(guān)系數(shù)=0進行比較,看兩者的差別有無統(tǒng)計學(xué)意義。這就要對r進行假設(shè)檢驗,判斷r不等于零是由于抽樣誤差所致,還是兩個變量之間確實存在相關(guān)關(guān)系。-相關(guān)系數(shù)的統(tǒng)計推斷(一)相關(guān)系數(shù)的假設(shè)檢驗(11-5)

(11-6)-1、建立假設(shè),確定檢驗水準(zhǔn)H0:=0即成年健康婦女基礎(chǔ)代謝和體重之間不存在相關(guān)關(guān)系;

H1:≠0即成年健康婦女基礎(chǔ)代謝和體重之間存在相關(guān)關(guān)系。

=0.052、計算t值

例11-3繼例11-2中算得r=0.964后,試檢驗相關(guān)是否具有統(tǒng)計學(xué)意義。-3、確定P值=n-2=14-2=12,查t值表得t0.01(12)=3.055,t>t0.01(13),故P<0.014、判斷結(jié)果因P<0.01,按=0.05水準(zhǔn)拒絕H0,接受H1,有理由認(rèn)為成年健康婦女基礎(chǔ)代謝和體重之間不存在相關(guān)關(guān)系。-直線相關(guān)的應(yīng)用前面我們已經(jīng)講過,相關(guān)是研究兩個變量間的相互關(guān)系,而且這種相互關(guān)系是用相關(guān)系數(shù)反映的。在確實存在相關(guān)關(guān)系的前提下,如果r的絕對值越大,說明兩個變量之間的關(guān)聯(lián)程度越強,那么,已知一個變量對預(yù)測另一個變量越有幫助;如果r絕對值越小,則說明兩個變量之間的關(guān)系越弱,一個變量的信息對猜測另一個變量的值無多大幫助。

一般說來,當(dāng)樣本量較大(n>100),并對r進行假設(shè)檢驗,有統(tǒng)計學(xué)意義時,r的絕對值大于0.7,則表示兩個變量高度相關(guān);r的絕對值大于0.4,小于等于0.7時,則表示兩個變量之間中度相關(guān);r的絕對值大于0.2,小于等于0.4時,則兩個變量低度相關(guān)。-進行線性相關(guān)分析的注意事項:1、線性相關(guān)表示兩個變量之間的相互關(guān)系是雙向的,分析兩個變量之間到底有無相關(guān)關(guān)系可首先繪制散點圖,散點圖呈現(xiàn)出直線趨勢時,再做分析。2、相關(guān)系數(shù)的計算只適用于兩個變量都服從正態(tài)分布的情形,如果資料不服從正態(tài)分布,應(yīng)先通過變量變換,使之正態(tài)化,再根據(jù)變換值計算相關(guān)系數(shù)。3、依據(jù)公式計算出的相關(guān)系數(shù)僅是樣本相關(guān)系數(shù),它是總體相關(guān)系數(shù)的一個估計值,與總體相關(guān)系數(shù)之間存在著抽樣誤差,要判斷兩個事物之間有無相關(guān)及相關(guān)的密切程度,必須做假設(shè)檢驗。當(dāng)檢驗拒絕了無效假設(shè)時,才可以認(rèn)為兩個事物之間存在著相關(guān)關(guān)系,然后再根據(jù)計算出的相關(guān)系數(shù)大小判斷相關(guān)關(guān)系的密切程度。-4、相關(guān)分析是用相關(guān)系數(shù)來描述兩個變量間相互關(guān)系的密切程度和方向,而兩個事物之間的關(guān)系既可能是依存因果關(guān)系,也可能僅是相互伴隨的數(shù)量關(guān)系。決不可因為兩事物間的相關(guān)系數(shù)有統(tǒng)計學(xué)意義,就認(rèn)為兩者之間存在著因果關(guān)系,要證明兩事物間確實存在因果關(guān)系,必須憑借專業(yè)知識加以闡明。

樣本的相關(guān)系數(shù)接近零并不意味著兩變量間一定無相關(guān)性。一個變量的數(shù)值人為選定時莫作相關(guān);出現(xiàn)異常值時甚用相關(guān);相關(guān)未必真有內(nèi)在聯(lián)系;分層資料盲目合并易出假象。-第二節(jié)秩相關(guān)-適用條件:①資料不服從雙變量正態(tài)分布,而不宜作積差相關(guān)分析;②總體分布型未知,一端或兩端是不確定數(shù)值(如<10歲,≥65歲)的資料;③原始數(shù)據(jù)用等級表示的資料。-一、Spearman秩相關(guān)1、意義:等級相關(guān)系數(shù)rs用來說明兩個變量間直線相關(guān)關(guān)系的密切程度與相關(guān)方向。2、計算公式:當(dāng)相同秩次較多時rs的校正:-樣本的等級相關(guān)系數(shù)rs

(correlationcoefficient)樣本的等級相關(guān)系數(shù)rs也是總體相關(guān)系數(shù)ρs的估計值。rs值界于-1和1之間,rs為正表示正相關(guān),rs為負(fù)表示負(fù)相關(guān),rs為零表示零相關(guān)。ρs是否為零可用查rs界值表或t檢驗確定。(當(dāng)n≤50時,查附表的rs界值表;當(dāng)n>50時,計算檢驗統(tǒng)計量t,查t界值表)-例11-4某研究者觀察了10例6個月~7歲的貧血患兒的血紅蛋白含量與貧血體征,結(jié)果見表11-2,試用秩相關(guān)進行分析。表11-2貧血患兒的血紅蛋白含量(g/dl)與貧血體征--利用表11-2中的數(shù)據(jù)得:lpp=82.5,lqq=70.5,lpq=-56.5秩相關(guān)系數(shù)為負(fù),說明兩變量間有負(fù)相關(guān)關(guān)系,同樣由樣本算得的秩相關(guān)系數(shù)是否有統(tǒng)計學(xué)意義,也應(yīng)做假設(shè)檢驗。-1、建立假設(shè),確定檢驗水準(zhǔn)H0:s=0即血紅蛋白含量與貧血體征之間不存在相關(guān)關(guān)系;

H1:s

≠0即血紅蛋白含量與貧血體征之間存在相關(guān)關(guān)系。

=0.052、計算統(tǒng)計量二、秩相關(guān)系數(shù)的統(tǒng)計推斷

當(dāng)n≤50時,查附表的rs界值表;當(dāng)n>50時,計算檢驗統(tǒng)計量t,查t界值表。-3、確定P值

本例n=10,查rs值表得r0.05(10)=0.648

|rs|=0.714>0.648,故P<0.054、判斷結(jié)果因P<0.05,按=0.05水準(zhǔn)拒絕H0,接受H1

,有理由認(rèn)為貧血患兒的血紅蛋白含量與貧血體征之間存在相關(guān)關(guān)系。-第三節(jié)分類變量的關(guān)聯(lián)性分析-適用條件:對定性變量之間的聯(lián)系通用的方法是根據(jù)兩個定性變量交叉分類基數(shù)所得的頻數(shù)資料(列聯(lián)表)作關(guān)聯(lián)性分析,即關(guān)于兩種屬性獨立性的卡方檢驗。計算公式:-一、交叉分類2×2表的關(guān)聯(lián)分析

例11-6研究吸煙方式與患慢性支氣管炎是否有關(guān),某研究者隨機調(diào)查了200例年齡相仿的吸煙者,對每個個體分別觀察慢性支氣管炎與否和吸煙方式兩種屬性,2×2種結(jié)果分類記述如表11-3所示,試分析兩種屬性的關(guān)聯(lián)性。表11-3吸煙習(xí)慣和慢性支氣管炎的關(guān)系吸煙方式慢性支氣管炎合計有無自卷紙煙22(a)53(b)75過濾嘴煙15(c)110(d)125合計37163200-1、建立假設(shè),確定檢驗水準(zhǔn)H0:吸煙方式與慢性支氣管炎有無之間相互獨立H1:吸煙方式與慢性支氣管炎有無之間相互關(guān)聯(lián)

a=0.052、計算2值-3、確定P值υ=1,查2界值表得20.01(1)=6.63,因2

>20.01(1),故P<0.01。4、判斷結(jié)果因P<0.01,在a=0.05的水準(zhǔn)上拒絕H0,接受H1,有理由認(rèn)為慢性支氣管炎有無吸煙方式之間存在關(guān)聯(lián)性。相關(guān)系數(shù):-例11-5:設(shè)有132份食品標(biāo)本,把每份標(biāo)本一分為二,分別用兩種檢驗方法做沙門氏菌檢驗,結(jié)果如表9-5,試問兩種檢驗方法的結(jié)果是否存在關(guān)聯(lián)?甲法乙法陽性陰性合計陽性80(a)10(b)90陰性31(c)11(d)42合計11121132表11-5兩種檢驗方法檢驗結(jié)果比較二、2×2配對資料的關(guān)聯(lián)性分析-1、建立假設(shè),確定檢驗水準(zhǔn)H0:兩種檢驗方法的結(jié)果之間相互獨立H1:兩種檢驗方法的結(jié)果之間相互關(guān)聯(lián)a=0.052、計算2

值-3、確定P值

υ=1,查2界值表得2

0.05(1)=3.84,因2

>2

0.05(1),故P<0.05。4、判斷結(jié)果因P<0.05,在a=0.05的水準(zhǔn)上拒絕H0,接受H1,有理由認(rèn)為兩種檢驗方法的結(jié)果之間存在關(guān)聯(lián)性。相關(guān)系數(shù):-職業(yè)胃病類型合計淺表性胃炎慢性胃炎胃潰瘍機關(guān)干部80484132工廠工人526212126公交司機20221052合11-6310名胃病患者按胃病類型和職業(yè)兩種屬性的交叉分類表三、R×C表分類資料的關(guān)聯(lián)性分析例11-8為探討職業(yè)類型與胃病類型是否有關(guān)聯(lián),某醫(yī)師將收治的310名胃病患者按主要的職業(yè)類型和胃病類型兩種屬性交叉分類,結(jié)果見表11-6。問職業(yè)類型與胃病類型有無關(guān)聯(lián)?-1、建立假設(shè),確定檢驗水準(zhǔn)H0:胃病類型與職業(yè)無關(guān)H1:胃病類型與職業(yè)有關(guān)聯(lián)a=0.052、計算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論