Logistic回歸模型和生存分析簡(jiǎn)介課件_第1頁(yè)
Logistic回歸模型和生存分析簡(jiǎn)介課件_第2頁(yè)
Logistic回歸模型和生存分析簡(jiǎn)介課件_第3頁(yè)
Logistic回歸模型和生存分析簡(jiǎn)介課件_第4頁(yè)
Logistic回歸模型和生存分析簡(jiǎn)介課件_第5頁(yè)
已閱讀5頁(yè),還剩48頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Logistic回歸模型與生存分析簡(jiǎn)介張志杰流行病學(xué)教研室epistat Tel.:54237410 (Office:8號(hào)樓443)主要內(nèi)容一、Logistic回歸模型二、生存分析三、Assignments2022/10/62張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)Logistic回歸模型簡(jiǎn)介模型簡(jiǎn)介模型中參數(shù)的估計(jì)與意義模型與參數(shù)的假設(shè)檢驗(yàn)?zāi)P偷臄M合優(yōu)度Logistic回歸模型中的高級(jí)話題分析實(shí)例2022/10/63張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)模型簡(jiǎn)介方差分析模型:應(yīng)變量-連續(xù)/正態(tài); 自變量:分類/連續(xù)變量線性回歸模型:應(yīng)變量-連續(xù)/正態(tài); 自變量: 連

2、續(xù)/分類變量應(yīng)變量為分類變量:研究該分類變量與一組自變量之間的關(guān)系治愈/未治愈(0/1);治愈/好轉(zhuǎn)/未治愈(有序分類);無序分類(腺癌、鱗癌、大細(xì)胞癌)研究的因素較少:2;CMH (無序分類變量;自變量為分類變量)研究的因素較多時(shí)(分層較多):出現(xiàn)較多0的單元Logistic回歸模型單元為0的信息可以利用;自變量可以是連續(xù)性變量基于線性回歸模型的思想發(fā)展而來2022/10/64張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)模型簡(jiǎn)介應(yīng)變量為0/1變量的Logistic回歸模型 在冠心病可疑危險(xiǎn)因素的研究中,記錄下每個(gè)研究對(duì)象的p個(gè)自變量(年齡、性別、飲酒等),記為x1,xp。隨訪一段時(shí)間

3、,如果發(fā)生冠心病,應(yīng)變量y記為1,如果沒有發(fā)生冠心病,y=0。 可以觀察到,不同的x1,xp的研究對(duì)象,冠心病的發(fā)生概率P(y=1)不同,如果我們希望依據(jù)隨訪得到的這組數(shù)據(jù)建立一個(gè)描述自變量x1,xp與冠心病的發(fā)生概率P(y=1)間關(guān)系的回歸方程,并根據(jù)建立的回歸方程進(jìn)行預(yù)測(cè),對(duì)各個(gè)自變量的作用大小和方向作出評(píng)價(jià),如何實(shí)現(xiàn)? 我們首先想到的是能不能用線性回歸模型來實(shí)現(xiàn)?2022/10/65張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)模型簡(jiǎn)介2022/10/67張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)模型簡(jiǎn)介模型名稱的來源: Logistic這個(gè)名稱來源于它對(duì)應(yīng)變量所采用的l

4、ogit變換,和英文單詞Logistic的含義(后勤的)一點(diǎn)關(guān)系都沒有,與邏輯就更不相干模型用途篩選危險(xiǎn)因素校正混雜因素預(yù)測(cè)與判別(判別分析)2022/10/68張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)模型中參數(shù)的估計(jì)與意義模型中參數(shù)的意義0-常數(shù)項(xiàng)自變量取值全為0時(shí)的基線狀況,未必有實(shí)際意義;比數(shù)(Y=1與Y=0的概率之比)的自然對(duì)數(shù)值;病例對(duì)照研究中,病例與對(duì)照兩組人數(shù)的比例是人為定的,不能代表人群中真實(shí)的病人與正常人比例,因此該常數(shù)項(xiàng)不是各自變量取值為0時(shí)人群患病比的估計(jì)值的對(duì)數(shù)。因此根據(jù)病例對(duì)照研究資料建立的Logistic回歸模型中,常數(shù)項(xiàng)意義不大,主要針對(duì)結(jié)果中自變量的

5、偏回歸系數(shù)及其轉(zhuǎn)換成OR值的意義作解釋,不適宜直接用于預(yù)測(cè)和判別。如希望進(jìn)行預(yù)測(cè),則需知道人群中真實(shí)的患病率P。2022/10/610張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)模型中參數(shù)的估計(jì)與意義ii和多重線性回歸模型中系數(shù)的解釋一樣,偏回歸系數(shù);代表固定其它Xj時(shí),Xi改變一個(gè)單位引起logitP平均值的改變量;在實(shí)際應(yīng)用中,可以為這些系數(shù)找到更加貼近實(shí)際的解釋,比數(shù)比(Odds Ratio,OR)=exp(i):Logit變換的優(yōu)勢(shì)當(dāng)其它自變量(Xj)取值保持不變時(shí), Xi取值增加一個(gè)單位引起OR自然對(duì)數(shù)值的變化量,因此在使用上OR值要遠(yuǎn)比i本身更常用2022/10/611張志

6、杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)模型中參數(shù)的估計(jì)與意義(X1增加一個(gè)單位)2022/10/612張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)模型與參數(shù)的假設(shè)檢驗(yàn)2. Walds檢驗(yàn)?zāi)P椭谢貧w系數(shù)的假設(shè)檢驗(yàn)在SPSS輸出的結(jié)果中,關(guān)于值的所有檢驗(yàn)都是Walds檢驗(yàn)該檢驗(yàn)基于值服從正態(tài)分布的假設(shè),首先求出值的標(biāo)準(zhǔn)誤,然后基于正態(tài)分布原理求出P值進(jìn)行檢驗(yàn)?zāi)P椭袇?shù)可信區(qū)間的估計(jì)就是基于Walds檢驗(yàn)來的;常用于模型中變量的剔除2022/10/614張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)模型與參數(shù)的假設(shè)檢驗(yàn)3. 記分檢驗(yàn)?zāi)P椭谢貧w系數(shù)的假設(shè)檢驗(yàn)及兩個(gè)模型擬合效果的

7、比較以未包含某一個(gè)(或幾個(gè))參數(shù)的模型為基礎(chǔ),保留模型中參數(shù)的估計(jì)值,并假設(shè)新增加的參數(shù)為0,計(jì)算似然函數(shù)的一階偏導(dǎo)數(shù)(又稱有效比分)及信息矩陣;記分檢驗(yàn)統(tǒng)計(jì)量Score=S(COV)S列向量S是對(duì)數(shù)似然函數(shù)的一階偏導(dǎo)數(shù),S是行向量COV是模型的方差協(xié)方差矩陣當(dāng)樣本量較大時(shí),Score服從卡方分布常用于模型中變量的納入2022/10/615張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)模型的擬合優(yōu)度-2lnL: 越小越好偽決定系數(shù):基于對(duì)數(shù)似然值而來,類似于線性回歸模型中的決定系數(shù)模型預(yù)測(cè)的正確率和ROC曲線Hosmer-Lemeshow統(tǒng)計(jì)量: Lack of Fit testH0:n

8、o lack of fit自變量中有連續(xù)性變量?jī)H適用于0/1應(yīng)變量2022/10/617張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)Logistic回歸模型中的高級(jí)話題啞變量 偏回歸系數(shù)表示其它自變量Xj不變,Xi每改變一個(gè)單位,所導(dǎo)致logitP的平均變化量x為連續(xù)性/二分類變量:沒有問題x為多分類變量:不太合適無序多分類:民族,各族之間不存在大小問題有序多分類:家庭收入分為高、中、低三檔,它們之間的差距無法準(zhǔn)確衡量 在以上這些情況時(shí),我們就必須將原始的多分類變量轉(zhuǎn)化為數(shù)個(gè)啞變量(Dummy Variable), 2022/10/618張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦

9、大學(xué)Logistic回歸模型中的高級(jí)話題啞變量每個(gè)啞變量只代表某兩個(gè)級(jí)別或若干個(gè)級(jí)別間的差異,這樣得到的回歸結(jié)果才能有明確而合理的實(shí)際意義對(duì)于取值具有n個(gè)水平的自變量Xi,可以生成n-1個(gè)啞變量模型中啞變量遵循“同進(jìn)同出” 的原則2022/10/619張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)Logistic回歸模型中的高級(jí)話題Logistic回歸模型只能用于應(yīng)變量為0/1變量的資料?有序多分類的Logistic回歸模型(e.g.累積Logit模型)無序多分類的Logistic回歸模型 2022/10/620張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)Logistic回歸模型

10、中的高級(jí)話題Logistic回歸模型非條件Logistic回歸模型:0/1; 有序多分類; 無序多分類條件(配對(duì))Logistic回歸模型: 分層的Cox比例風(fēng)險(xiǎn)模型2022/10/621張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)分析實(shí)例 Hosmer和Lemeshow于1989年研究了低出生體重嬰兒的影響因素,數(shù)據(jù)間文件logistic_step.sav,應(yīng)變量為出生的嬰兒是否為低體重嬰兒(變量名LOW,1表示低出生體重2500g),考慮的影響因素有:1.產(chǎn)婦懷孕前體重(1wt,磅);2.產(chǎn)婦年齡(age,歲);3.產(chǎn)婦在懷孕期間是否吸煙(smoke,0表示不吸煙);4.本次懷孕前

11、早產(chǎn)次數(shù)(ptl,次);5.是否還有高血壓(ht,0表示未患高血壓);6.子宮對(duì)按摩、催產(chǎn)素等刺激引起收縮的應(yīng)激性(ui,0無應(yīng)激性);7.懷孕前3個(gè)月社區(qū)醫(yī)生隨訪次數(shù)(ftv,次)8.種族(race,1白人,2黑人,3其它種族):?jiǎn)∽兞?022/10/622張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)Logistic回歸模型LogitP=Ln(P低出生體重/P非低出生體重) =0.893-0.015*產(chǎn)婦懷孕前體重lwt+0.728*本次懷孕前早產(chǎn)次數(shù)ptl+1.789*是否患有高血壓ht危險(xiǎn)因素:ptl; ht保護(hù)因素:lwt2022/10/624張志杰, 流行病學(xué)教研室, 公共衛(wèi)

12、生學(xué)院, 復(fù)旦大學(xué)生存分析簡(jiǎn)介生存分析概述基本概念生存率的估計(jì)生存曲線的比較Cox比例風(fēng)險(xiǎn)模型2022/10/625張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存分析概述大量失訪:失去聯(lián)系(病人搬走,電話號(hào)碼改變);無法觀察到結(jié)局(死于其他原因);研究截止將失訪數(shù)據(jù)無論是算作死亡還是存活似乎都不大合理生存分析的特點(diǎn)與局限在針對(duì)結(jié)局比較兇險(xiǎn),即總體生存時(shí)間都比較短的疾病的研究中,生存分析比只考慮結(jié)局,不考慮時(shí)間因素的Logistic模型等方法的研究效率要高得多。如果相應(yīng)疾病的結(jié)局都非常好,比如幾乎人人都可痊愈的感冒,生存分析的利用價(jià)值也許并不大,除非是特殊情況,否則感冒晚好兩天對(duì)醫(yī)生或

13、病人來說根本沒有多大影響2022/10/627張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存分析概述生存分析的主要研究?jī)?nèi)容1描述生存過程(單樣本):研究人群生存狀態(tài)的規(guī)律,如生存時(shí)間的分布特點(diǎn),計(jì)算某個(gè)時(shí)間點(diǎn)的生存率、生存率曲線的變動(dòng)趨勢(shì)等;2比較不同人群的生存過程(兩/多樣本): 比較不同人群的生存狀況,進(jìn)行兩組或多組生存率的比較;3. 分析影響生存過程的相關(guān)因素:比較不同人群的生存狀況,進(jìn)行兩組或多組生存率比較,以了解哪些因素會(huì)影響目標(biāo)人群的生存過程,這是生存分析方法最重要的研究?jī)?nèi)容,在臨床醫(yī)學(xué)中應(yīng)用的非常廣泛。2022/10/628張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)

14、旦大學(xué)生存分析概述生存分析的方法參數(shù)法要求觀察的生存時(shí)間t服從某一特定的分布,采用估計(jì)分布中參數(shù)的方法獲得生存率的估計(jì)值生存時(shí)間的分布可能為指數(shù)分布、Weibull分布、對(duì)數(shù)正態(tài)分布等,這些分布曲線都有相應(yīng)的生存率函數(shù)形式。只需求出相應(yīng)參數(shù)的估計(jì)值,即可獲得生存率的估計(jì)值和曲線非參數(shù)法實(shí)際工作中,多數(shù)生存時(shí)間的分布不符合上述所指的分布,少用參數(shù)法,多用非參數(shù)法與以往所學(xué)的非參數(shù)法一樣,假設(shè)兩組或多組的總體生存曲線分布相同,而不考慮總體的分布形式和參數(shù)如何。2022/10/629張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存分析概述半?yún)?shù)法只規(guī)定了影響因素對(duì)生存率的影響規(guī)律,但是沒有對(duì)

15、生存時(shí)間(和基線風(fēng)險(xiǎn)函數(shù))的分布情況加以限定主要用于分析生存率的影響因素,屬多因素分析方法,其典型方法是Cox比例風(fēng)險(xiǎn)模型2022/10/630張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)基本概念1. 起點(diǎn)事件與終點(diǎn)事件起點(diǎn)事件:研究者根據(jù)研究目的設(shè)定的開始關(guān)心某一事件的起點(diǎn),如“某疾病的確診”、“治療結(jié)束”、“某電子設(shè)備的開始使用”等;(廣義的概念)終點(diǎn)事件/失效事件:觀察到隨訪對(duì)象出現(xiàn)了預(yù)先規(guī)定的結(jié)局終點(diǎn)事件的確定是生存分析的基礎(chǔ),必須絕對(duì)準(zhǔn)確失效事件應(yīng)當(dāng)由研究目的而決定,并非一定是死亡(如病例的死亡、疾病的痊愈、某電子設(shè)備出現(xiàn)故障),而死亡也被并非一定是發(fā)生了失效事件(如肺癌患者

16、死于車禍)。2022/10/631張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)基本概念 起點(diǎn)事件與終點(diǎn)事件是相對(duì)的都是由研究目的決定的,須在研究設(shè)計(jì)時(shí)就明確規(guī)定,并在研究期間嚴(yán)格遵守而不能隨意改變;不同的研究目的有不同的終點(diǎn)事件,如果研究的是腫瘤的局部復(fù)發(fā)情況,那么死于腫瘤遠(yuǎn)處轉(zhuǎn)移只能算做截尾,而不是終點(diǎn)事件;在一項(xiàng)研究中,可以設(shè)定開始治療為起點(diǎn)事件,痊愈為終點(diǎn)事件,而在另一項(xiàng)研究中,可以把痊愈作為起始事件,而把第一次復(fù)發(fā)作為終點(diǎn)事件。2022/10/632張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)基本概念2. 生存時(shí)間/失效時(shí)間從某起點(diǎn)事件開始到被觀測(cè)對(duì)象出現(xiàn)終點(diǎn)事件或失訪

17、前最后一次的隨訪時(shí)間記錄所經(jīng)歷的時(shí)間,包括三個(gè)要素:起點(diǎn)、終點(diǎn)和時(shí)間尺度(天、周、月、年等),如從疾病“確診”到“死亡”;從“治療結(jié)束到痊愈”;電子設(shè)備從“開始使用”到“出現(xiàn)故障”等一般情況下應(yīng)盡量以個(gè)體為單位采用較細(xì)的時(shí)間單位來記錄,但在許多大型的隨訪中,不可能做到按個(gè)體記錄,常見的是按固定的時(shí)間段記錄有多少人失訪、多少人發(fā)生失效事件,此時(shí)收集到的資料被稱為分組生存資料不服從正態(tài)分布,右偏、非負(fù),包括完整生存時(shí)間和刪失生存時(shí)間2022/10/633張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)基本概念3. 刪失值/截尾值終止隨訪不是由于終點(diǎn)事件發(fā)生,而是失訪造成,常加符號(hào)“”表示。生存

18、但中途失訪:包括拒絕訪問、失去聯(lián)系或中途退出試驗(yàn)死于其它與研究無關(guān)的原因:如肺癌患者死于心梗、車禍隨訪截止:隨訪研究結(jié)束時(shí)觀察對(duì)象仍存活左刪失、右刪失和期間刪失左/右刪失:期待結(jié)局發(fā)生的時(shí)間未知,只知道發(fā)生在某一時(shí)點(diǎn)之前/后期間刪失:期待結(jié)局發(fā)生的時(shí)間未知,只知道發(fā)生在某兩時(shí)點(diǎn)之間2022/10/634張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)基本概念4. 生存概率與生存率 (生存曲線)生存概率:記為p,是指在某段時(shí)間開始時(shí)存活的個(gè)體至該時(shí)段結(jié)束時(shí)仍存活的可能性大小生存率:累積生存概率,指某個(gè)觀察對(duì)象活過t時(shí)刻的概率,常用P(xt)表示2022/10/635張志杰, 流行病學(xué)教研室,

19、 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)基本概念生存率和生存概率雖然僅1字之差,但含義卻是不同的。生存概率是針對(duì)單位時(shí)間而言的,而生存率是針對(duì)某個(gè)較長(zhǎng)時(shí)間段的,是生存概率的累積結(jié)果。如評(píng)價(jià)腫瘤預(yù)后常用的5年生存率,是指第1年存活、第2年存活、直到第5年仍存活的累積概率,而這5年間每1年有不同的生存概率。5. 中位生存時(shí)間當(dāng)累積生存概率為0.5時(shí)所對(duì)應(yīng)的生存時(shí)間,表示有且只有50%的個(gè)體可以活過這個(gè)時(shí)間如果無失訪,其估計(jì)值等于50%死亡,還有50%人存活的時(shí)間如果存在失訪,其估計(jì)值不等于樣本中還有一半人存活的時(shí)間由于生存時(shí)間分布為正偏態(tài),其估計(jì)值不會(huì)等于均數(shù)2022/10/636張志杰, 流行病學(xué)教研室, 公

20、共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存率的估計(jì)描述生存過程為什么不用普通的率計(jì)算方法進(jìn)行估計(jì)?由于存在大量的失訪,直接使用該時(shí)點(diǎn)的存活人數(shù)進(jìn)行生存率的計(jì)算會(huì)嚴(yán)重低估生存率這樣計(jì)算出來的標(biāo)準(zhǔn)誤也不準(zhǔn)確這里介紹的為基本的非參數(shù)方法,沒有對(duì)生存時(shí)間的分布S(t)做任何假定,計(jì)算結(jié)果最為穩(wěn)妥,但也最為粗糙Kaplan-Meier法(小樣本的精細(xì)記錄)壽命表法 (大樣本的粗略記錄)2022/10/637張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存率的估計(jì)Kaplan-Meier法乘積極限法:最基本的一種生存分析方法,非參數(shù)方法主要用于小樣本資料,難以將生存時(shí)間按組段劃分,利用tk時(shí)刻之前各時(shí)點(diǎn)上生存概率

21、的連乘積來估計(jì)在時(shí)刻tk的生存率,不需要對(duì)被估計(jì)的資料分布作任何假設(shè)(也可用于大樣本資料)假定病人在各個(gè)時(shí)段生存的事件獨(dú)立,生存概率為p,則應(yīng)用概率乘法得生存率估計(jì)的應(yīng)用公式為: 2022/10/638張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存率的估計(jì)Kaplan-Meier法分析實(shí)例一組10例病人的生存時(shí)間(日)如下,用Kaplan-Meier法估計(jì)其生存曲線(+代表截尾)3, 5, 5, 6+, 8, 16+, 22, 30, 47+, 712022/10/639張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存率的估計(jì)壽命表法在大型研究中,因條件限制,往往無法對(duì)每一個(gè)

22、人做到詳細(xì)跟蹤、及時(shí)記錄結(jié)果,只能按一定的時(shí)間間隔記錄隨訪情況,此時(shí)收集到的資料就是分組的生存資料,相應(yīng)的分析就被稱為分組資料的生存分析壽命表法(大樣本資料)基本思想資料是以分時(shí)間段的形式收集,對(duì)于每個(gè)時(shí)間段,由于沒有更多信息,只能假設(shè)死亡事件是在該時(shí)間段內(nèi)均勻出現(xiàn)的,即生存率勻速下降2022/10/640張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存率的估計(jì)壽命表法分析實(shí)例 現(xiàn)有68名心臟移植后的病人追蹤觀察記錄,其生存天數(shù)從移植的第一天算起,請(qǐng)計(jì)算它們的生存率,并繪制生存曲線。 2022/10/641張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存率的估計(jì)壽命表法適用于大

23、樣本或無法準(zhǔn)確得知研究結(jié)果出現(xiàn)時(shí)間的資料,K-M法主要用于小樣本,也可以用于大樣本;壽命表法是按照指定的時(shí)段來分段,估計(jì)的是時(shí)間區(qū)間右端點(diǎn)上的生存率,分析的重點(diǎn)是研究總體的生存規(guī)律;K-M法根據(jù)死亡時(shí)點(diǎn)分段,逐個(gè)估計(jì)死亡時(shí)點(diǎn)的生存率,分析的重點(diǎn)除了研究總體的生存規(guī)律外,往往更要尋找相關(guān)影響因素;壽命表法不能確切得知死亡時(shí)間,假定每個(gè)時(shí)間段中的“死亡”是呈均勻分布,生存率為線性變化,故簡(jiǎn)單化以直線相連接;K-M法其生存曲線是左連續(xù)的階梯型曲線,間斷點(diǎn)的縱坐標(biāo)在下一階處,當(dāng)樣本量較大及死亡時(shí)點(diǎn)較多時(shí),階梯形不明顯。2022/10/642張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存曲線的

24、比較 如果我們將患某種腫瘤的病人分成兩組,一組給予化療,另一組給予化療加放療。那么,我們一定想知道哪一種療法更有效,使病人存活的時(shí)間更長(zhǎng)。若兩組病人的生存率不同,在統(tǒng)計(jì)學(xué)上是否有意義?若用Kaplan-Meier曲線繪制兩條曲線,表示兩組病人的生存狀況,這兩條曲線的差異是抽樣誤差所致,還是本質(zhì)上的差異,為了回答上述問題,這就需要進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)。非參數(shù)方法:不強(qiáng)行假定生存時(shí)間的分布情況,僅僅比較不同人群生存時(shí)間的分布位置是否重疊,適用范圍更廣,也最為常用Log-Rank檢驗(yàn)Breslow檢驗(yàn)2022/10/643張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存曲線的比較原理:本質(zhì)為大樣本

25、卡方檢驗(yàn),在觀察對(duì)象按時(shí)間排序后,利用全部時(shí)間點(diǎn)上死亡數(shù)的觀察值和理論值的差值構(gòu)造卡方統(tǒng)計(jì)量基本思想如果兩總體生存曲線無差別,根據(jù)不同時(shí)間兩種處理的期初人數(shù)和死亡人數(shù),計(jì)算各種處理在各個(gè)時(shí)期的理論死亡數(shù),所有的死亡人數(shù)應(yīng)當(dāng)在兩組間均勻分配如無效假設(shè)成立,則實(shí)際死亡數(shù)與理論死亡數(shù)不會(huì)相差不大,否則認(rèn)為無效假設(shè)可能不成立2022/10/644張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存曲線的比較Log-Rank檢驗(yàn)Breslow檢驗(yàn)(Nj每一時(shí)間點(diǎn)上的總觀察數(shù))2022/10/645張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存曲線的比較分析實(shí)例 某醫(yī)生收集23例晚期肺癌患者

26、在接受化療后的生存時(shí)間t(月),按接受治療方案的不同劃分為2組(1為常規(guī)方案,2為新方案),問不同的治療方案對(duì)其生存時(shí)間長(zhǎng)短的影響有無顯著性差異。 2022/10/646張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)生存曲線的比較注意當(dāng)在不同時(shí)間段內(nèi)生存曲線出現(xiàn)明顯交叉,則可以考慮分段分析,或者多因素方法Breslow檢驗(yàn)更注重生存曲線的開始階段,因?yàn)樗臋?quán)重是每一生存時(shí)刻兩組的總觀察例數(shù),在開始階段總有較多的觀察對(duì)象,這樣生存早期有較大的權(quán)重,對(duì)兩個(gè)生存分布的早期差別更敏感,而生存末期,被觀察對(duì)象較少,權(quán)重也變少,因此晚期沒有Log-rank檢驗(yàn)敏感;Log-rank檢驗(yàn)對(duì)所有的生存時(shí)

27、間均給予了相等的權(quán)重,由于末期生存觀測(cè)對(duì)象數(shù)量減少,這樣相對(duì)強(qiáng)調(diào)生存曲線的末期階段。二者給出的結(jié)果是相似的,但不完全相等。 2022/10/647張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)Cox比例風(fēng)險(xiǎn)模型為了紀(jì)念英國(guó)統(tǒng)計(jì)學(xué)家Cox的貢獻(xiàn),統(tǒng)計(jì)學(xué)家把它稱為Cox比例風(fēng)險(xiǎn)模型半?yún)?shù)模型與參數(shù)模型相比,該模型不能給出各時(shí)點(diǎn)的風(fēng)險(xiǎn)率,但對(duì)生存時(shí)間分布無要求,可估計(jì)出各研究因素對(duì)風(fēng)險(xiǎn)率的影響,因而應(yīng)用范圍更廣2022/10/648張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)Cox比例風(fēng)險(xiǎn)模型Cox比例風(fēng)險(xiǎn)模型: 在k個(gè)影響因素同時(shí)影響生存過程的情況下,假定它們?cè)陔S訪期間的取值不隨時(shí)間而變化,在時(shí)點(diǎn)t的風(fēng)險(xiǎn)函數(shù):RH(t)就是相對(duì)危險(xiǎn)度RR或風(fēng)險(xiǎn)比risk ratio,Cox模型假定其大小與時(shí)間t無關(guān),即等比例風(fēng)險(xiǎn)假設(shè),簡(jiǎn)稱PH假設(shè),比例風(fēng)險(xiǎn)模型(proportional hazard model);h(X,t)由兩部分組成:h0(t)不要求特定的形式,具有非參數(shù)方法的特點(diǎn),而exp() 部分的自變量效應(yīng)具有參數(shù)模型的形式,所以Cox 回歸屬于半?yún)?shù)模型。 2022/10/649張志杰, 流行病學(xué)教研室, 公共衛(wèi)生學(xué)院, 復(fù)旦大學(xué)Cox比例風(fēng)險(xiǎn)模型t表示生存時(shí)間; 具有自變量X的個(gè)體在t時(shí)刻的風(fēng)險(xiǎn)函數(shù),表示這些個(gè)體在t時(shí)刻

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論