Logistic回歸分析(重點、難點)_第1頁
Logistic回歸分析(重點、難點)_第2頁
Logistic回歸分析(重點、難點)_第3頁
Logistic回歸分析(重點、難點)_第4頁
Logistic回歸分析(重點、難點)_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、衛(wèi)生統(tǒng)計系,衛(wèi)生統(tǒng)計系,第三軍醫(yī)大學軍事預防醫(yī)學學院,TMMUTEL: 68752343師:張燕琪,醫(yī)學統(tǒng)計學,第16章Logistic回歸分析,衛(wèi)生統(tǒng)計系,張燕琪,衛(wèi)生統(tǒng)計系,第1節(jié)無條件Logistic回歸分析,第2節(jié)條件Logistic回歸分析,教學內(nèi)容,第3節(jié):Logistic回歸分析的應用及注意事項,流行病學概念復習,衛(wèi)生統(tǒng)計系,張燕琪,衛(wèi)生統(tǒng)計教研室,邏輯回歸參數(shù)估計的基本思想。邏輯回歸系數(shù)的假設檢驗和區(qū)間估計方法,教學目標,1。邏輯回歸分析結果及解釋2。邏輯回歸變量篩選方法3。邏輯回歸系數(shù)4的流行病學意義。摘要:邏輯回歸的應用及注意事項,理解,非條件邏輯

2、回歸與條件邏輯回歸的區(qū)別,幾個重要的流行病學概念,衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,病因分析(預后分析)的目的:找出影響因素及影響的強度。如果某一因素對疾病的發(fā)生有影響,則稱該因素與疾病的發(fā)生有關,關聯(lián)的強度反映了其對疾病發(fā)生的影響。衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,幾個重要的流行病學概念,隊列研究,病例對照研究,風險,相對風險,比值比或比值比(or),衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,隊列研究,隊列研究:對“原因”類別的人進行隨訪,觀察他們的“結果”,然后對數(shù)據(jù)進行比較和分析,判斷“原因”和“結果”之間是否存在相關性,衛(wèi)生統(tǒng)計司,張燕琪, 衛(wèi)生部統(tǒng)計,病例對照研究:是對被歸類為“水果”的人群進行回

3、顧性調(diào)查,觀察其“原因”,然后對數(shù)據(jù)進行比較分析,判斷“水果”與“原因”之間的相關性是否具有統(tǒng)計學意義以及相關性的強度。 衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,風險:通常指發(fā)生不幸事件的概率。高風險意味著發(fā)生的可能性高。疾病發(fā)生風險:觀察期間疾病發(fā)生的概率,即疾病的發(fā)生率。衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,相對風險,RR1:這說明這個因素是一個危險因素,它增加了患病的風險。RR1:這個因子是一個保護因子,可以降低患病風險。RR=1:該因素對疾病沒有影響。相對風險(RR):暴露于某一風險因素的pe發(fā)病率與未暴露于該風險因素的p0發(fā)病率之比。衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,相對風險,病例對照研究一般不能計

4、算RR。衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,比值:發(fā)病率與非發(fā)病率之比,即p/(1-p),即陽性率/陰性率。比值比(OR):兩個比值的比值,即p1為病例組的暴露率,p2為流行病學研究中對照組的暴露率。對于發(fā)病率低的疾病,一般有RRor,衛(wèi)生統(tǒng)計部,張燕琪,衛(wèi)生統(tǒng)計部,比值比,(對于發(fā)病率低的疾病),病例對照研究一般用OR代替RR。,衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,病例對照研究數(shù)據(jù),或,衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,說,只有兩個可能值的因變量(即二級分類變量),如發(fā)病率和非發(fā)病率,陽性和陰性,死亡和存活,治愈和非治愈,暴露和非暴露等。顯然,這種數(shù)據(jù)不符合多元回歸的條件,在什么情況下應該

5、使用邏輯回歸?衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司。目的:建立一個邏輯回歸方程,其中多個獨立變量(風險因素)用于估計因變量(結果因素)。它屬于概率非線性回歸。數(shù)據(jù):1 .因變量是反映某種現(xiàn)象發(fā)生和不發(fā)生的二元變量;2.所有或大部分的獨立變量應該是分類變量,也可能有一些數(shù)字變量。分類變量應該量化。何時使用邏輯回歸,衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,目的:研究一種疾病或現(xiàn)象的發(fā)生與多種危險因素(或保護因素)之間的定量關系。測試的局限性:1 .只能研究一個風險因素;2.只能得出定性的結論。在什么情況下應該使用邏輯回歸?衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,類別: 1。群體(無條件)邏輯回歸方程。2.成對(條件)邏

6、輯回歸方程。在什么情況下應該使用邏輯回歸?第1節(jié)邏輯回歸分析邏輯回歸,衛(wèi)生統(tǒng)計部,張燕琪,衛(wèi)生統(tǒng)計部,例,表16-1膀胱癌患者及對照組吸煙史資料,衛(wèi)生統(tǒng)計部,衛(wèi)生統(tǒng)計部,張燕琪,病例16-2為探討冠心病的危險因素,對26例冠心病患者及28例對照組進行了病例對照研究。調(diào)查并記錄了八個可能的風險因素。Logistic逐步回歸分析用于篩選危險因素和分析每個變量的作用。例,衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,表16-2冠心病八大可能危險因素及編碼說明,例,衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,例,表16-3冠心病危險因素病例對照研究原始數(shù)據(jù),衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,Logistic回歸模型,M自變量作用

7、下陽性結果的概率記錄為:衛(wèi)生統(tǒng)計司, 衛(wèi)生部統(tǒng)計,張燕琪,邏輯回歸模型,擺脫了二元反應變量可能出現(xiàn)在一般線性回歸分析的因變量領域的困境。衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,邏輯曲線,衛(wèi)生統(tǒng)計司,張燕琪,常項:暴露劑量為0時個體發(fā)病率與非發(fā)病率之比的自然對數(shù)?;貧w系數(shù):表示自變量變化一個單位時,對數(shù)的變化。模型參數(shù)的顯著性,邏輯斯蒂模型有另一種線性表達形式,稱為邏輯斯蒂模型:衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,流行病學的比率指數(shù),以衡量危險因素的作用。計算公式為:模型參數(shù)的含義,衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,模型參數(shù)的含義,j代表ORj的自然對數(shù)值。衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,

8、衛(wèi)生統(tǒng)計司,張燕琪,logistic回歸模型的參數(shù)估計,原理:最大似然估計,衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,可以反映某一因素的兩個不同層次(c1,c0)的優(yōu)勢比。logistic回歸模型的參數(shù)估計,衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,logistic回歸模型的假設檢驗,2。1。似然比檢驗:-2nl近似服從分布G=2(lnL1-lnL0)=2ln(L1/L0)=p-l,衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,標準化回歸系數(shù),標準化回歸系數(shù)的絕對值越大,相應變量的影響越大。衛(wèi)生統(tǒng)計部,衛(wèi)生統(tǒng)計部,衛(wèi)生統(tǒng)計部,張燕琪,病例分析,衛(wèi)生統(tǒng)計部,衛(wèi)生統(tǒng)計部,張燕琪,衛(wèi)生統(tǒng)計部,數(shù)據(jù)編制成三列:病例數(shù),吸煙

9、史(1:是,0:否),膀胱癌(1:是,0:否),病例分析,衛(wèi)生統(tǒng)計部,張燕琪,數(shù)據(jù)權重病例,實例分析,衛(wèi)生統(tǒng)計部,張燕琪,回歸二元邏輯分析,病例分析,衛(wèi)生統(tǒng)計部,張燕琪,因變量編碼, 模型擬合結果,案例分析,衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,方法:向前法,向后法和逐步法。 檢驗統(tǒng)計:不是f統(tǒng)計,而是似然比統(tǒng)計、沃爾德統(tǒng)計和得分統(tǒng)計之一。為探討冠心病的危險因素,對26例冠心病患者和28例對照組進行了病例對照研究。調(diào)查并記錄了八個可能的風險因素。Logistic逐步回歸分析用于篩選危險因素和分析每個變量的作用。衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,表16-2冠心病八種可能危險因素及編碼說明,病例分析,衛(wèi)生

10、統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,病例分析,表16-3冠心病危險因素病例對照研究原始數(shù)據(jù),衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,從標準化回歸系數(shù)可以看出,根據(jù)影響大小,選擇的四個危險因素為X6,X8,X5和X1,分別為動物脂肪攝入量,A,案例分析,第2節(jié)條件邏輯回歸分析,衛(wèi)生統(tǒng)計部,張燕琪,衛(wèi)生統(tǒng)計部,條件邏輯回歸原理,條件邏輯回歸是一種用于成對或分層數(shù)據(jù)分析的方法。為了控制一些重要的混雜因素(如性別和年齡等。),流行病學通常采用133,360 m匹配的研究方法,即每個病例組成一個匹配組,m個對照與其條件一致(每個匹配組為一層)。條件邏輯回歸的本質(zhì)是在構造似然函數(shù)時利用適當?shù)臈l件分布,從而進行不同層次之間

11、的比較。衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,表16-5 1: M條件邏輯回歸數(shù)據(jù)格式,* t=0為病例,其他為對照,1: m數(shù)據(jù)格式,衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,條件邏輯回歸模型,衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,病例分析,病例16-3 A市調(diào)查了三種生活方式與胃癌發(fā)病率的關系,并采用1:1配對病例對照研究。根據(jù)每個病例的性別、年齡和居住地,選擇一名健康者作為對照。被調(diào)查的三種生活方式的價值見表16-7。共調(diào)查了50對病例和對照。嘗試做條件Logistic逐步回歸分析。表16-7三種生活方式的值,衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,數(shù)據(jù)準備成四列:X1,X2,X3,匹配數(shù)和疾病發(fā)生率Y(1:病例,0:對照)。實例分析,衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,模型擬合結果,顯然,有無意義的變量,可用于逐步回歸分析。實例分析,衛(wèi)生統(tǒng)計司,張燕琪,衛(wèi)生統(tǒng)計司,案例分析,第三節(jié)邏輯回歸的應用及注意事項,衛(wèi)生統(tǒng)計司,衛(wèi)生統(tǒng)計司,張燕琪,邏輯回歸分析的特點之一是參數(shù)含義明確。也就是說,在獲得某一因子的回

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論