版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、.,1,第十六章 Logistic回歸分析,Logistic regression,.,2,復習 多元線性回歸 (multiple linear regression),在醫(yī)學實踐中,常會遇到一個應變量與多個自變量數量關系的問題。如醫(yī)院住院人數不僅與門診人數有關, 而且可能與病床周轉次數, 床位數等有關;兒童的身高不僅與遺傳有關還與生活質量,性別,地區(qū),國別等有關;人的體表面積與體重、身高等有關。,.,3,表 多元線性回歸分析的數據結構 實驗對象 y X1 X2 X3 . XP 1 y1 a11 a12 a13 a1p 2 y2 a21 a22 a23 a2p 3 y3 a31 a32 a33
2、 a3p n yn an1 an2 an3 anp 其中:y取值是服從正態(tài)分布,.,4,多元線性回歸模型,通過實驗測得含有p個自變量x1,x2,x3,xp及一個因變量y的n個觀察對象值, 利用最小二乘法原理, 建立多元線性回歸模型: 其中b0為截距, b1 ,b2 bp稱為偏回歸系數. bi表示當將其它p-1個變量的作用加以固定后, Xi改變1個單位時Y將改變bi個單位.,.,5,logistic regression analysis,Logistic回歸分析及其應用,.,6,(一)基本概念和原理,1.應用背景 Logistic回歸模型是一種概率模型,適合于病例對照研究、隨訪研究和橫斷面研究
3、,且結果發(fā)生的變量取值必須是二分的或多項分類。可用影響結果變量發(fā)生的因素為自變量與因變量,建立回歸方程。,.,7,設資料中有一個因變量y、p個自變量x1, x2,xp,對每個實驗對象共有n次觀測結果,可將原始資料列成表2形式。,2、Logistic回歸模型的數據結構,.,8,表2 Logistic回歸模型的數據結構 實驗對象 y X1 X2 X3 . XP 1 y1 a11 a12 a13 a1p 2 y2 a21 a22 a23 a2p 3 y3 a31 a32 a33 a3p n yn an1 an2 an3 anp 其中:y取值是二值或多項分類,表3 肺癌與危險因素的調查分析 例號 是否
4、患病 性別 吸煙 年齡 地區(qū) 1 1 1 0 30 0 2 1 0 1 46 1 3 0 0 0 35 1 30 0 0 0 26 1 注:是否患病中,0代表否,1代表是。性別中1代表男,0代表女,吸煙中1代表吸煙,0代表不吸煙。地區(qū)中,1代表農村,0代表城市。,表4 配對資料(1:1) 對子號 病例 對照 x1 x2 x3 x1 x2 x3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0 注:X1蛋白質攝入量,取值:0,1,2,3 X2不良飲食習慣,取值:0,1,2,3 X3精神狀況 ,取值:0,1,2,.,11,Logist
5、ic回歸 - Logistic回歸與多重線性回歸聯(lián)系與區(qū)別,聯(lián)系: 用于分析多個自變量與一個因變量的關系,目的是矯正混雜因素、篩選自變量和更精確地對因變量作預測等。 區(qū)別: 線性模型中因變量為連續(xù)性隨機變量,且要求呈正態(tài)分布. Logistic回歸因變量的取值僅有兩個,不滿足正態(tài)分布。,.,12,3、 Logistic回歸模型,令: y=1 發(fā)?。栃?、死亡、治愈等) y=0 未發(fā)?。幮?、生存、未治愈等) 將發(fā)病的概率記為P,它與自變量x1, x2,xp之間的Logistic回歸模型為: 可知,不發(fā)病的概率為:,經數學變換得: 定義: 為Logistic變換,即:,.,14,4、回歸系數i的
6、意義 流行病學的常用指標優(yōu)勢比(odds ratio,OR)或稱比數比,定義為:暴露人群發(fā)病優(yōu)勢與非暴露人群發(fā)病優(yōu)勢之比。 即Xi的優(yōu)勢比為:,故對于樣本資料OR=exp( ) 95%置信區(qū)間為: 可見 是影響因素Xi增加一個單位所引起的對數優(yōu)勢的增量,反映了其對Y作用大小。 如果要比較不同因素對Y作用大小,需要消除變量量綱的影響,為此計算標準化回歸系數,5.假設檢驗,(1)回歸方程的假設檢驗 H0:所有 H1:某個 計算統(tǒng)計量為:G=-2lnL,服從自由度等于n-p 的 分布 (2)回歸系數的假設檢驗 H0: H1:,計算統(tǒng)計量為:Wald,,自由度等于1。,.,17,(二) Logisti
7、c回歸類型及其實例分析,1、非條件Logistic回歸 當研究設計為隊列研究、橫斷面研究或成組病例對照研究時,可以用非條件Logistic回歸。,.,18,實例1,某研討究者調查了30名成年人,記錄了同肺癌發(fā)病的有關因素情況, 數據見表4。其中是否患病中, 0代表否, 1代表是;性別中 1代表男, 0代表女;吸煙中 1代表吸煙, 0代表不吸煙;地區(qū)中, 1代表農村, 0代表城市。試分析各因素與肺癌間的關系。,.,19,表5 肺癌與危險因素的調查分析 例號 是否患病 性別 吸煙 年齡 地區(qū) 1 1 1 0 30 0 2 1 0 1 46 1 3 0 0 0 35 1 30 0 0 0 26 1
8、注:是否患病中,0代表否,1代表是。性別中1代表男,0代表女,吸煙中1代表吸煙,0代表不吸煙。地區(qū)中,1代表農村,0代表城市。,.,20,SPSS操作步驟:,Analyze-Regression-Binary Logistic -Dependent框(y)-Covariates框(x1,x2,)-ok,非條件Logistic回歸 SPSS操作步驟:,.,21,.,22,.,23,結果表明, 性別, 吸煙, 年齡三個因素都與肺癌有關. 由于在對某一因素進行單因素分析時沒有控制其它因素的干擾, 因此結果不可靠.,單因素分析的結果,.,24,多因素分析的結果,.,25,.,26,由上最大似然估計分析
9、知因素X2(吸煙), X3(年齡)對肺癌的發(fā)生有影響。 所得的回歸方程為: Logit(P)=-9.7544+2.5152X1+3.9849X2+0.1884X3-1.3037X4.,.,27,2.條件logistic回歸分析,配對設計的類型:1:1、1:m、n:m (可采用分層COX模型來擬合)。 例如:某市調查三種生活因素與胃癌的關系,資料見表5。,表6 配對資料(1:1) 對子號 病例 對照 x1 x2 x3 x1 x2 x3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0 注:X1蛋白質攝入量,取值:0,1,2,3 X2
10、不良飲食習慣,取值:0,1,2,3 X3精神狀況 ,取值:0,1,2,.,29,配對Logistic回歸SPSS操作步驟:,Analyze-Survival-COX Regression-Time框(outcome)-Status框( Status ) -Define Event:Single value 1:continue-Covariates框(x1、x2、x3)-Strata框(id)-Options-at last step-ok,.,30,.,31,.,32,.,33,.,34,.,35,.,36,.,37,3、逐步Logistic回歸分析,(1)向前法(forward selec
11、tion),開始方程中沒有變量,自變量由少到多一個一個引入回歸方程。按自變量對因變量的貢獻(P值的大?。┯尚〉酱笠来翁暨x,變量入選的條件是其P值小于規(guī)定進入方程的P界值Enter, 缺省值 P(0.05)。,.,38,(2)后退法(backward selection),開始變量都在方程中,然后按自變量因變量的貢獻(P值的大?。┯纱蟮叫∫来翁蕹兞刻蕹臈l件是其P值小于規(guī)定的剔除標準Remove, 缺省值 p(0.10)。,.,39,(3)逐步回歸法 逐步引入-剔除法(stepwise selection),前進逐步引入-剔除法 是在前進法的思想下,考慮剔除變量, 因此有兩個p界值Enter
12、, Remove。,.,40,無論是條件還是非條件Logistic回歸,在多變量分析時均可以采用逐步回歸方法,實現的方法是:在 model后加選項:/selection=forward、backward或stepwise 再給出SLE, SLS的界值。,調試法:P從大到小取值0.5,0.1,0.05, 一般實際用時, SLE,SLS應多次選取調整,.,41,解 釋,設第i個因素的回歸系數為bi,表示當有多個自變量存在時,其它自變量固定不變的情況下,自變量Xi每增加一個單位時,所得到的優(yōu)勢比的自然對數。也就是其它自變量固定不變的情況下,自變量Xi每增加一個單位時,影響因變量Y=0發(fā)生的倍數。 當
13、bi0時,對應的優(yōu)勢比(odds ratio,記為ORi):ORi=exp(bi)1,說明該因素是危險因素;當bi0時,對應的優(yōu)勢比ORi=exp(bi)1,說明該因素是保護因素。,.,42,在本例中不良飲食習慣X2 ,取值:0、1,2、3,b=1.2218, OR=3.393,表示不良飲食習慣是危險因素;精神狀況X3 ,取值:0、1、2,b=2.2947, OR=9.922,表示精神狀況是危險因素。,.,43,SPSS無論是條件還是非條件Logistic回歸,在多變量分析時均可以采用逐步回歸方法,實現的方法是: 在 method后加選項: Enter:所有變量一次全部進入方程。 Forwar
14、d:逐步向前法 Backward:后退法 變量移出方程所采取的檢驗方法: Conditional; LR; Ward(盡量不用),.,44,.,45,二分類Logistic回歸,.,46,SPSS 軟件實現方法,FileOpen相應數據(已存在) Analyze RegressionBinary Logistic Dependent(y)Covariates (自變量) Mothod(逐步回歸方法)Specify model(單因素或多因素) save(欲保存的內容)Options(輸出選項)OK,.,47,調試法:P從大到小取值0.5,0.1,0.05, 一般實際用時,Enter、Remov
15、e應多次選取調整,.,48,Block 1: Method = Forward Stepwise (Likelihood Ratio),.,49,.,50,.,51,.,52,.,53,.,54,4.Logistic回歸- Logistic回歸種類,.,55,對于成組資料的非條件Logistic回歸,()兩分類反應變量的Logistic回歸,.,56,.,57,自變量分為以下情況: 定量資料時,直接計算; 二值時,化為與或與; 有序多分類:有線性規(guī)律時連續(xù)賦值 ,. 無線性規(guī)律按無序多分類 無序多分類:需要先轉換成n-1個啞變量,以 啞變量進行分析。,.,58,.,59,.,60,.,61,.
16、,62,二分類Logistic回歸多重比較的方法,Indicator第一類或最后一類為參照類,每一類與 參照類比較 Simple-除參照類外,每一類與參照類比較 Difference-除第一類外,每一類與其前各類的平均 效應比較,有稱反Helmert Helmert-除最后一類外,每一類與其后各類的平均 Repeated相鄰兩類比較,除第一類外,每類與其前一 比較 Polynominal正交多名義分類比較,該法假設每一分類都 有相等的空間,僅適于數值變量 Deviation除參照類外,每一類與總效應比較,.,63,.,64,.,65,()多分類無序反應變量Logistic回歸*,.,66,.,
17、67,()多分類有序反應變量Logistic回歸*,.,68,.,69,練習,據報道目前全世界每年的自殺率為1010萬,我國自殺率為2310萬,我國高校自殺率則為210萬。為了了解當代大學生綜合素質現狀、為了進行提高大學生綜合素質的對策研究,利用中國現場統(tǒng)計研究會教育統(tǒng)計與管理專業(yè)學會設計的中國大學生綜合素質調查問卷,采用分層整群抽樣,選擇了不同年級、不同性別、不同專業(yè)以及不同生源的醫(yī)學大學生554名的調查問卷,其中129人有過自殺的意念。應用 Logistic回歸分析,探討大學生有自殺意念的影響因素。,.,70,部隊3所院校,1121份有效問卷、 地方3所院校1874份有效問卷。,表8 各校
18、有效問卷情況 單 位 有效問卷份數 軍隊: 北京軍醫(yī)學院 554 海軍工程大學 450 解放軍信息工程大學 117 地方:同濟醫(yī)學院 778 中國科技大學 628 廣西工學院 468,.,71,1. 各項目的名稱及量化方法 在中國大學生綜合素質調查問卷中又增加的2個小題記為A01,A02。基本情況A共有21項,分別記為A1,A2,A21。當有的項目中又分為2項時再分別賦予不同的名稱,如A10父母親文化程度分為:父親文化程度A10.1、母親文化程度A10.2。其它項目的名稱以此類推。,.,72,利用EXCEL將調查問卷各項進行量化:有序的項目按照順序賦值0,1,2,;兩分類無序項目賦值0和1;多項無序和多選項目,根據例數多少進行合并成兩項或引進啞變量。去掉了幾項人數少或不容易量化的個別多選題:A9.1父親職業(yè)、A9.2母親職業(yè)、B16加入WTO后大學生最應具備的素質、B17在當代大學生中你認為普遍欠缺的東西、C10.1對學習吃力的再回答、C19.1決定考研者進一步需回答、C21.1-C21.3參與過科研或社會實踐者進一步需回答的問題。最終確定的變量個數是:A類有22個、B類有17個、C類有38個、D類有32個、E類有20個,總計129個變量。,.,73,大學生產生自殺念
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年管理會計師專業(yè)能力認證考試試題附答案
- 迪士尼員工安全培訓卡課件
- 云南國防工業(yè)職業(yè)技術學院《室內設計(軍工場館)》2024-2025 學年第一學期期末試卷(藝術專業(yè))
- 邊坡支護安全教育培訓課件
- 內科主治醫(yī)師考試基礎知識練習試題及答案
- 2026年書記員測試題及答案
- 中小學德育活動策劃與學生品格塑造專項工作總結(2篇)
- 2025年企業(yè)審計年終工作總結(3篇)
- 銀行內部控制規(guī)范制度
- 2026年工作室成員個人工作總結(2篇)
- 2024-2025學年山東省濱州市北鎮(zhèn)中學鴻蒙班九年級下學寒假開學考試數學試題
- 園林綠化服務方案(3篇)
- 2025年流產家屬簽字協(xié)議書
- 2025年《中醫(yī)護理適宜技術臨床應用指南》
- 下頜阻生齒拔除病例匯報
- 生物樣本資源庫建設計劃及管理工作方案
- DBJ04-T 491-2025 建設工程消防設計審查驗收文件歸檔標準
- DB45∕T 2419-2021 鉆孔管波探測技術規(guī)程
- 2025年學校食堂從業(yè)人員食品安全知識培訓考試試題(附答案)
- GB/T 45752-2025礦用車載滅火系統(tǒng)安全技術要求
- 安置房舉行活動方案
評論
0/150
提交評論