統(tǒng)計(jì)-26兩變量關(guān)聯(lián)性分析_第1頁
統(tǒng)計(jì)-26兩變量關(guān)聯(lián)性分析_第2頁
統(tǒng)計(jì)-26兩變量關(guān)聯(lián)性分析_第3頁
統(tǒng)計(jì)-26兩變量關(guān)聯(lián)性分析_第4頁
統(tǒng)計(jì)-26兩變量關(guān)聯(lián)性分析_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.姚明為什么那么高?2.父母身高很高子女一定很高嗎?3.父母身高與子女身高的關(guān)系

相關(guān):如:身高~體重胰島素~血糖水平藥物劑量~動(dòng)物死亡率父親身高~兒子身高姐妹身高~兄弟身高

兩變量關(guān)聯(lián)性分析

BivariateCorrelation參考書1.徐勇勇主編.醫(yī)學(xué)統(tǒng)計(jì)學(xué)(第二版).北京:高等教育出版社,20042.楊樹勤主編.衛(wèi)生統(tǒng)計(jì)學(xué)(第二版).北京:人民衛(wèi)生出版社,19913.方積乾主編.醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)(第二版).上海:上??茖W(xué)技術(shù)出版社,20014.孫振球主編.醫(yī)學(xué)統(tǒng)計(jì)學(xué)(供研究生用).北京:人民衛(wèi)生出版社,2004

本章內(nèi)容一線性相關(guān)二秩相關(guān)三分類變量的關(guān)聯(lián)性分析

教學(xué)目標(biāo)了解線性相關(guān)的概念掌握線性相關(guān)系數(shù)的求解及其假設(shè)檢驗(yàn)熟悉秩相關(guān)和分類變量的關(guān)聯(lián)性分析一線性相關(guān)

線性相關(guān)的概念線性相關(guān)(linearcorrelation)又稱簡(jiǎn)單相關(guān)(simplecorrelation)

。線性相關(guān)(linearcorrelation)前提假設(shè):(X,Y)服從正態(tài)分布,即適用于雙變量正態(tài)分布資料研究目的:分析兩個(gè)變量之間有無相關(guān)關(guān)系相關(guān)系數(shù):(linearcorrelationcoefficient)

描述兩變量間線性相關(guān)的密切程度和相關(guān)方向的統(tǒng)計(jì)量

簡(jiǎn)單線性相關(guān)

當(dāng)一個(gè)變量X由小到大,另一個(gè)變量Y亦相應(yīng)地由小到大(或由大到?。?,兩變量的散點(diǎn)圖呈直線趨勢(shì),那么這兩個(gè)變量之間有線性關(guān)系。分析這種線性關(guān)系的理論和方法,統(tǒng)稱為直線相關(guān)或線性相關(guān)。兩變量直線相關(guān)的性質(zhì)和密切程度,用直線相關(guān)系數(shù)r來描述。

相關(guān)系數(shù):又稱為積差相關(guān)系數(shù)或積矩相關(guān)系數(shù),它表示兩個(gè)變量之間直線關(guān)系的密切程度和相關(guān)方向的統(tǒng)計(jì)指標(biāo)??傮w相關(guān)系數(shù)用符號(hào)ρ表示,隨機(jī)樣本相關(guān)系數(shù)用符號(hào)r表示。

r取值范圍:-1≤r≤1,沒有單位。二、相關(guān)系數(shù)的計(jì)算及意義:負(fù)線性相關(guān)-1<r<0正線性相關(guān)0<r<1完全負(fù)線性相關(guān)r=-1完全正線性相關(guān)r=1非線性相關(guān)r=0零相關(guān)r=0零相關(guān)r=0零相關(guān)r=0又稱:積差相關(guān)系數(shù)(coefficientofproduct-momentcorrelation)/Pearson相關(guān)系數(shù)/相關(guān)系數(shù)樣本相關(guān)系數(shù):r總體相關(guān)系數(shù):r-1≤r≤1|r|越大,線性相關(guān)越密切線性相關(guān)系數(shù)計(jì)算相關(guān)系數(shù)的特點(diǎn)1.相關(guān)系數(shù)r是一個(gè)無量綱的數(shù)值,且-1<r<1;2.r>0為正相關(guān),r<0為負(fù)相關(guān);3.r越接近于1,說明相關(guān)性越好

r越接近于0,說明相關(guān)性越差.例1:隨機(jī)抽取15名健康成人,測(cè)定血液的凝血酶濃度(單位/毫升)及凝固時(shí)間,數(shù)據(jù)如表1所示。據(jù)此數(shù)據(jù)如何判斷這兩項(xiàng)指標(biāo)是否相關(guān)?表115例健康成人凝血時(shí)間與凝血酶濃度測(cè)量值記錄受試者123456789101112131415凝血酶濃度1.11.21.00.91.21.10.90.61.00.91.10.91.11.00.7凝血時(shí)間1413151513141617141615161415171.繪制散點(diǎn)圖

線性相關(guān)分析的步驟2.計(jì)算相關(guān)系數(shù)例2計(jì)算例1中凝血酶濃度X與凝血酶時(shí)間Y之間樣本相關(guān)系數(shù)。由例1得

,

,

由公式得不存在相關(guān)關(guān)系r=0r0的原因:存在相關(guān)關(guān)系,總體相關(guān)系數(shù)r0

由抽樣誤差引起,總體相關(guān)系數(shù)r=0

對(duì)r是否為0進(jìn)行假設(shè)檢驗(yàn)3.相關(guān)系數(shù)的假設(shè)檢驗(yàn)相關(guān)系數(shù)的統(tǒng)計(jì)推斷(一)相關(guān)系數(shù)的假設(shè)檢驗(yàn)

檢驗(yàn)步驟

本例

n=15,r=-0.926,由公式得本例,查界值表得,故拒絕接受,認(rèn)為凝血酶濃度與凝血酶時(shí)間之間存在負(fù)相關(guān)。此結(jié)果與查表的結(jié)果是一致的。(二)查表法查r界值表(附表13)線性相關(guān)中應(yīng)注意的問題1.樣本的相關(guān)系數(shù)接近零并不意味著兩變量間一定無相關(guān)性.2.一個(gè)變量的數(shù)值人為選定時(shí)莫作相關(guān).3.出現(xiàn)異常值時(shí)甚用相關(guān).4.相關(guān)未必真有內(nèi)在聯(lián)系.5.分層資料盲目合并易出假象.二秩相關(guān)適用條件:①資料不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析;②總體分布型未知,一端或兩端是不確定數(shù)值(如<10歲,≥65歲)的資料;③原始數(shù)據(jù)用等級(jí)表示的資料。一、Spearman秩相關(guān)1.意義:等級(jí)相關(guān)系數(shù)rs用來說明兩個(gè)變量間直線相關(guān)關(guān)系的密切程度與相關(guān)方向。2.計(jì)算公式例4某地研究2~7歲急性白血病患兒的血小板數(shù)與出血癥狀程度之間的相關(guān)性,結(jié)果見表4,試用秩相關(guān)進(jìn)行分析表4急性白血病患兒的血小板(109/L)和出血癥狀病人編號(hào)血小板數(shù)秩次p2出血癥狀秩次q2pqXpYq(1)(2)(3)(4)(5)(6)(7)(8)=(3).(6)12111+++11.5132.2511.513824++9.081.0018.016539+7.049.0021.0310416-3.512.2514.0426525++9.081.0045.0540636++9.081.0054.0740749-3.52.2524.51060864-3.512.2528.01260981-3.512.2531.5129010100-3.512.2535.0143811121+++11.5132.25126.25200412144-3.512.2542.0合計(jì)—78650-78630451利用表4中的數(shù)據(jù)容易算得

秩相關(guān)系數(shù)為負(fù),說明兩變量間有負(fù)相關(guān)關(guān)系,同樣由樣本算得的秩相關(guān)系數(shù)是否有統(tǒng)計(jì)學(xué)意義,也應(yīng)做檢驗(yàn)秩相關(guān)系數(shù)的統(tǒng)計(jì)推斷

檢驗(yàn)步驟

假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷當(dāng)時(shí),可查書后的臨界值表,若秩相關(guān)系數(shù)超過臨界值,則拒絕;當(dāng)時(shí),也可采用公式式做檢驗(yàn)例5對(duì)例4的秩相關(guān)系數(shù)作假設(shè)檢驗(yàn)例4中算得查臨界值表,,按的水準(zhǔn),不能拒絕,可以認(rèn)為急性白血病患兒的出血癥狀與血小板數(shù)之間無相關(guān)關(guān)系三分類變量的關(guān)聯(lián)性分析適用條件對(duì)定性變量之間的聯(lián)系通用的方法是根據(jù)兩個(gè)定性變量交叉分類基數(shù)所得的頻數(shù)資料(列聯(lián)表)作關(guān)聯(lián)性分析,即關(guān)于兩種屬性獨(dú)立性的卡方檢驗(yàn)計(jì)算公式交叉分類2×2表的關(guān)聯(lián)分析例6為觀察嬰兒腹瀉是否與喂養(yǎng)方式有關(guān),某醫(yī)院兒科隨機(jī)收集了消化不良的嬰兒82例,對(duì)每個(gè)個(gè)體分別觀察腹瀉與否和喂養(yǎng)方式兩種屬性,2×2種結(jié)果分類記述如表6所示,試分析兩種屬性的關(guān)聯(lián)性。表6嬰兒腹瀉與喂養(yǎng)方式的關(guān)系喂養(yǎng)方式

腹瀉合計(jì)

有無人工301040母乳172542合計(jì)473582假設(shè)檢驗(yàn)

:喂養(yǎng)方式與嬰兒腹瀉之間相互獨(dú)立

:喂養(yǎng)方式與嬰兒腹瀉之間有關(guān)聯(lián)將表中各數(shù)據(jù)代入公式得

,拒絕原假設(shè),說明嬰兒腹瀉與喂養(yǎng)方式之間存在關(guān)聯(lián)性.二2×2配對(duì)資料的關(guān)聯(lián)性分析例7有56份咽喉涂抹標(biāo)本,把每份標(biāo)本一分為二,依同樣的條件分別接種于甲乙兩種白喉?xiàng)U菌培養(yǎng)基上,觀察白喉菌生長(zhǎng)的情況,結(jié)果如表7,問兩種培養(yǎng)基的結(jié)果有無關(guān)聯(lián)?表7兩種白喉?xiàng)U菌培養(yǎng)結(jié)果甲培養(yǎng)基

乙培養(yǎng)基合計(jì)+-+221840-21416合計(jì)243256假設(shè)檢驗(yàn)

:兩種培養(yǎng)基的結(jié)果之間互相獨(dú)立

:兩種培養(yǎng)基的結(jié)果之間有關(guān)聯(lián)將本例數(shù)據(jù)代入公式得有理由拒絕零假設(shè),可以認(rèn)為甲、乙兩種培養(yǎng)基之間存在關(guān)聯(lián)性三R×C表分類資料的關(guān)聯(lián)性分析例8某地居民主要有三種祖籍,均流行甲狀腺腫。為探索甲狀腺腫類型與祖籍是否有關(guān)聯(lián),現(xiàn)根據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論