臨床流行病學(xué):疾病預(yù)后研究及生存分析_第1頁
臨床流行病學(xué):疾病預(yù)后研究及生存分析_第2頁
臨床流行病學(xué):疾病預(yù)后研究及生存分析_第3頁
臨床流行病學(xué):疾病預(yù)后研究及生存分析_第4頁
臨床流行病學(xué):疾病預(yù)后研究及生存分析_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

疾病預(yù)后研究及生存分析概述一、疾病預(yù)后及預(yù)后研究的概念預(yù)后(prognosis):指疾病發(fā)生后,對將來發(fā)展為不同結(jié)局(痊愈、復(fù)發(fā)、惡化、傷殘、并發(fā)癥、死亡等)的預(yù)測或事前估計,通常以概率表示,如治愈率、有效率、5年生存率等。概述二、疾病預(yù)后研究的意義1.了解疾病的發(fā)展趨勢和后果;2.通過對影響疾病預(yù)后的各種因素的研究,找出主要因素,進(jìn)行有效干預(yù),有助于改變疾病的結(jié)局;3.正確評價干預(yù)措施的效果概述三、疾病的自然史和臨床病程

疾病的自然史是指疾病在沒有任何醫(yī)學(xué)干預(yù)的情況下,從發(fā)生、發(fā)展到結(jié)局的整個過程。1.生物學(xué)發(fā)病期2.臨床前期3.臨床期4.結(jié)局

病程是指疾病從開始出現(xiàn)癥狀、體征到最后結(jié)局所經(jīng)歷的全過程,其中可經(jīng)歷不同醫(yī)療干預(yù)措施。概述四、影響疾病預(yù)后的因素疾病本身的特點(diǎn)醫(yī)療條件和干預(yù)的方式與程度患者身體素質(zhì)社會因素與家庭因素疾病預(yù)后研究的設(shè)計與實施一、疾病預(yù)后研究的方法隊列研究臨床試驗病例對照研究描述性研究…疾病預(yù)后研究的設(shè)計與實施二、預(yù)后研究設(shè)計的主要內(nèi)容1.明確研究目的2.確定研究對象3.疾病預(yù)后的評定指標(biāo)病死率、治愈率、緩解率、復(fù)發(fā)率、生存率4.明確研究結(jié)局及其判斷標(biāo)準(zhǔn)5.進(jìn)行隨訪,收集相關(guān)資料6.疾病預(yù)后研究設(shè)計的注意問題疾病預(yù)后研究中的偏倚與控制一、常見偏倚1.失訪偏倚2.領(lǐng)先時間偏倚3.集合偏倚4.存活隊列偏倚5.遷移偏倚6.測量偏倚7.混雜偏倚疾病預(yù)后研究中的偏倚與控制一、偏倚的控制1.隨機(jī)化方法2.限制3.匹配4.分層5.標(biāo)準(zhǔn)化6.多因素分析一些醫(yī)學(xué)事件所經(jīng)歷的時間:從開始觀察到事件發(fā)生的時間,不是短期內(nèi)可以明確判斷的乳腺癌病人術(shù)后生存時間幼兒乳牙萌出的時間白血病病人化療后緩解持續(xù)的時間兩種方法治療某慢性病產(chǎn)生療效的時間針對這類生存資料的分析方法:生存分析生存分析:將終點(diǎn)事件的出現(xiàn)與否和達(dá)到終點(diǎn)所經(jīng)歷的時間結(jié)合起來分析的一類統(tǒng)計分析方法。生存資料生存資料圖102名黑色素瘤患者的生存時間分布time(Month)051015202530354045010203040生存分析的目的1.估計:根據(jù)樣本生存資料估計總體生存率及其它有關(guān)指標(biāo)(如中位生存時間等),如根據(jù)腦瘤患者治療后的生存時間資料,估計不同時間的生存率、生存曲線以及中位生存期等。2.比較:對不同處理組生存率進(jìn)行比較,如比較不同療法治療腦瘤的生存率,以了解哪種治療方案較優(yōu)。生存分析的目的3.影響因素分析:目的是為了探索和了解影響生存時間長短的因素,或平衡某些因素影響后,研究某個或某些因素對生存率的影響。如為改善腦瘤病人的預(yù)后,應(yīng)了解影響病人預(yù)后的主要因素,包括病人的年齡、性別、病程、腫瘤分期、治療方案等。4.預(yù)測:具有不同因素水平的個體生存預(yù)測,如根據(jù)腦瘤病人的年齡、性別、病程、腫瘤分期、治療方案等預(yù)測該病人t年(月)生存率。第一節(jié)生存資料概述一、起始事件與終點(diǎn)事件起始事件:反映研究對象生存過程的起始特征的事件。如確診、手術(shù)、開始采取措施,開始觀察。終點(diǎn)事件(outcomeevent):指研究者所關(guān)心的特定結(jié)局,又稱死亡事件、失效事件(failureevent)。如死亡、復(fù)發(fā)、痊愈等。二、生存時間(survivaltime)

指從某起始事件開始到被觀測對象出現(xiàn)終點(diǎn)事件所經(jīng)歷的時間,用t表示。研究號(1)姓名(2)術(shù)后開始隨訪時間(3)終止隨訪時間(4)結(jié)局(5)生存天數(shù)(6)1趙××00-01-1600-09-01失去聯(lián)系229+2錢××00-01-2601-03-18局部復(fù)發(fā)死亡4173孫××00-02-0501-12-25車禍死亡689+4李××00-02-1902-10-01研究終止955+5王××00-03-0700-11-11局部復(fù)發(fā)死亡2496劉××00-03-2002-01-24遠(yuǎn)處轉(zhuǎn)移死亡675例1:某醫(yī)師從2000年1月1日起到2002年10月1日對6名肺癌患者進(jìn)行跟蹤觀察,記錄其結(jié)局。1234562000-01-012002.10.01三、刪失(censor)又稱截尾,主要有3種情況:①失訪:指失去聯(lián)系,如信訪未回信,上門不見人,電話采訪不答理或搬遷未留新地址等原因;②退出:指退出研究,如因其他非此次研究疾病死亡,臨時改變治療方案而中途退出研究;③終止:指研究時限已到而終止觀察。

第一節(jié)生存資料概述生存時間有2種類型:(1)完全數(shù)據(jù)(completedata):是指被觀測對象從觀察起點(diǎn)至出現(xiàn)終點(diǎn)事件所經(jīng)歷的時間。(2)不完全數(shù)據(jù)(censoreddata):是指在出現(xiàn)終點(diǎn)事件前,被觀測對象的觀測過程終止了。由于被觀測對象所提供的信息是“不完全的”,只知道他們的生存時間超過了截尾時間。常用229+、689+、955+來表示不完全數(shù)據(jù)(刪失數(shù)據(jù))。

第一節(jié)生存資料概述例2:某臨床試驗對32名晚期肺癌患者患者進(jìn)行隨訪研究,截止到研究期結(jié)束,記錄的生存隨訪資料如下表,試計算100周生存率。12.815.617.824.0+26.429.230.030.8+39.242.049.358.4+72.0+76.9+77.282.485.086.887.2+90.694.4+96.597.2+98.6+106.0+114.8+117.2+140.0+168.0+170.5+196.0198.5+注:+表示該數(shù)據(jù)為刪失數(shù)據(jù)(不完全數(shù)據(jù))四、死亡概率(q)

死亡概率(mortalityprobability):記為q,是指在某段時間開始時存活的個體在該段時間內(nèi)死亡的可能性大小。若無刪失數(shù)據(jù),死亡概率的估計公式為:第一節(jié)生存資料概述四、死亡概率(q)

第一節(jié)生存資料概述當(dāng)存在刪失數(shù)據(jù)時,假定失訪等刪失事件在觀察時段的各個時間點(diǎn)是等機(jī)會發(fā)生的,故分母改用校正觀察例數(shù)。五、生存概率(p)

生存概率(survivalprobability):記為p,是指在某段時間開始時存活的個體至該時間結(jié)束時仍存活的可能性大小。生存概率的公式為:第一節(jié)生存資料概述第一節(jié)生存資料概述六、生存率(survivalrate)

用S(tk)表示,是指病人經(jīng)歷tk個單位時間后仍存活的概率。若無刪失數(shù)據(jù),則

但如果資料中含有刪失數(shù)據(jù),分母必須按時段進(jìn)行校正,此公式則不再適用,此時生存率的計算公式應(yīng)為

第一節(jié)生存資料概述六、生存率(survivalrate)

生存率的標(biāo)準(zhǔn)誤生存率的可信區(qū)間估計(正態(tài)近似法)第二節(jié)生存率的壽命表法適用于大樣本資料數(shù)據(jù)按時間區(qū)間分組利用刪失資料信息,按刪失資料對進(jìn)行校正區(qū)間中的刪失個體折算為半個人時第二節(jié)生存率的壽命表法一、生存率計算

例3:某醫(yī)院對100名惡性腫瘤術(shù)后病人進(jìn)行隨訪所獲得的資料如下表術(shù)后年數(shù)t~(1)期初觀察例數(shù)n0(2)期內(nèi)死亡例數(shù)d(3)刪失例數(shù)c(4)校正期初例數(shù)nc=n0-c/2(5)死亡概率q=d/nc(6)生存概率p=1-q(7)t+1年生存率S(t+1)(8)生存率標(biāo)準(zhǔn)誤SE(S(t+1))(9)0~1001001000.10000.90000.90000.03001~90150900.16670.83330.75000.04332~75168710.22540.77460.58100.05013~51124490.24490.75510.43870.05204~3514731.50.44440.55560.24370.04845~147710.50.66670.33330.08120.0390第二節(jié)生存率的壽命表法二、生存曲線

生存曲線(survivalcurve):以時間為橫軸,生存率為縱軸,將各個時點(diǎn)的生存率連接在一起的曲線圖。

圖1100例惡性腫瘤患者術(shù)后生存曲線

第二節(jié)生存率的壽命表法三、中位生存時間

中位生存時間(MedianSurvivalTime):又稱為半數(shù)生存期,即當(dāng)累積生存率為0.5時所對應(yīng)的生存時間,表示有且只有50%的個體可以活過這個時間。要注意中位生存期通常不等于生存時間的中位數(shù)(除非在這個時間點(diǎn)之前沒有刪失值存在)。第二節(jié)生存率的壽命表法三、中位生存時間

壽命表法由于默認(rèn)組段內(nèi)生存率的變化是均勻的,因此可以直接在生存曲線上進(jìn)行內(nèi)插,如例3,3年生存率為0.5810,4年生存率為0.4387,當(dāng)生存率為0.5000時,中位生存時間為:第三節(jié)生存率的乘積極限法Kaplan-meier法(K-M法),直接用概率乘法定理估計生存率,故又稱乘積極限法(Product-LimitMethod,簡稱PL法),由Kaplan和Meier在1958年提出,多用于樣本量較小,難以將生存時間按組段劃分,此時是利用tk時刻之前各時點(diǎn)上生存概率的乘積來估計在時刻tk的生存率,不需要對被估計的資料分布作任何假設(shè)。

這是一種非參數(shù)法,大樣本時若知道每個對象的生存時間,也能用該法。第三節(jié)生存率的乘積極限法例4:一組病人的生存時間(日)如下,用Kaplan-Meier法估計其生存曲線(+代表刪失)。3,5,5,6+,8,16+,22,30,47+,71(1)將所有生存時間按從小到大排列(t),包括完全和截尾生存時間。(2)列出各期初暴露病例數(shù)(n),它是指在t時刻前仍存活的病例數(shù)。(3)將各期內(nèi)死亡例數(shù)(d)和刪失例數(shù)(c)分別寫在第(3)、(4)列。第三節(jié)生存率的乘積極限法存活時間(天)期初暴露數(shù)期內(nèi)死亡例數(shù)期內(nèi)刪失例數(shù)死亡概率生存概率生存率生存率標(biāo)準(zhǔn)誤tndcq=d/np=1-qS(tk)SE(S(tk))(1)(2)(3)(4)(5)(6)(7)(8)310100.10000.90000.90000.094959200.22220.77780.70000.14496+7010.00001.00000.70000.144986100.16670.83330.58330.161016+5010.00001.00000.58330.1610224100.25000.75000.43750.1747303100.33330.66670.29170.166647+2010.00001.00000.29170.1666711101.00000.00000.0000.第三節(jié)生存率的乘積極限法(4)計算各期的死亡概率q,q=d/n,刪失數(shù)不參加計算,結(jié)果見第(5)列。例如生存時間為5天時,q=2/9=0.2222。(5)計算各期的生存概率p,p=1-q,例如生存時間為5天時,p=1-0.2222=0.7778,計算結(jié)果見第(6)列。(6)計算各t時刻的生存率S(tk)。計算tk時刻生存率時可以用小于和等于tk時刻的各時點(diǎn)生存概率的乘積得到,計算結(jié)果見第(7)列。

生存曲線(survivalcurve):以時間為橫軸,生存率為縱軸,將各個時點(diǎn)的生存率連接在一起的曲線圖。

第三節(jié)生存率的乘積極限法圖2Kaplan-Meier法對10名病人的生存率估計

兩種方法的比較

①壽命表法適用于大樣本或無法準(zhǔn)確得知研究結(jié)果出現(xiàn)時間的資料,Kaplan-Meier法主要用于小樣本,也可以用于大樣本。②壽命表法是按照指定的時段來分段,估計的是時間區(qū)間右端點(diǎn)上的生存率;Kaplan-Meier法是根據(jù)死亡時點(diǎn)分段,逐個估計死亡時點(diǎn)的生存率。③壽命表法不能確切得知死亡時間,假定每個時間段中的“死亡”是呈均勻分布,生存率為線性變化,故簡單化以直線相連接;K-M法其生存曲線是連續(xù)的階梯型曲線,間斷點(diǎn)的縱坐標(biāo)在下一階處,當(dāng)樣本量較大及死亡時點(diǎn)較多時,階梯形就不明顯了。第四節(jié)生存曲線的比較H0:S1(t)=S2(t),兩組總體生存曲線相同

H1:S1(t)≠S2(t),兩組總體生存曲線不同第四節(jié)生存曲線的比較log-rank檢驗(對數(shù)秩檢驗、時序檢驗)該方法的基本思想是當(dāng)H0成立時,根據(jù)ti時點(diǎn)的死亡率,可計算出ti時點(diǎn)上各組的理論死亡數(shù);將所有時點(diǎn)的理論死亡數(shù)累加,便得到各組的理論死亡總數(shù)Tg;將Tg與各組的實際死亡總數(shù)Ag作比較,就得到以下的log-rank檢驗的統(tǒng)計量:第四節(jié)生存曲線的比較log-rank檢驗(對數(shù)秩檢驗、時序檢驗)

該檢驗屬非參數(shù)檢驗,用于比較兩組或多組生存曲線或生存時間是否相同。檢驗統(tǒng)計量為卡方值,自由度=組別數(shù)-1。若P≤0.05,兩組或多組生存曲線有統(tǒng)計學(xué)差異;若P>0.05,兩組或多組生存曲線的差別無統(tǒng)計學(xué)意義。H0:兩組病人的生存率相同H1:兩組病人的生存率不相同df=組數(shù)-1=1故P>0.05,拒絕無效假設(shè),認(rèn)為兩種治療方式生存率的差別無統(tǒng)計學(xué)意義。第四節(jié)生存曲線的比較log-rank檢驗(對數(shù)秩檢驗、時序檢驗)此檢驗比較兩組或多組生存曲線,實為一單因素分析方法。要求各組生存曲線不能交叉,如交叉提示存在混雜因素,應(yīng)采用分層分析方法或多因素方法來校正混雜因素。當(dāng)假設(shè)檢驗有統(tǒng)計意義時,可從以下幾方面來評價各組效應(yīng)大?。荷媲€圖目測判斷、中位生存時間比較等。第四節(jié)生存曲線的比較log-rank檢驗用于整條生存曲線的比較,若比較兩組某時間點(diǎn)處的生存率,則按下式計算:

如比較多個時間點(diǎn)處生存率,檢驗水準(zhǔn)應(yīng)取Bonferroni校正,即,其中k為比較的次數(shù),以保證總的I型錯誤概率不超過。

第五節(jié)Cox回歸

Cox比例風(fēng)險回歸模型(Cox’sproportionalhazardsregressionmodel),簡稱Cox回歸模型。

該模型由英國統(tǒng)計學(xué)家D.R.Cox于1972年提出,主要用于腫瘤和其它慢性病的預(yù)后分析,也可用于隊列研究的病因探索。其優(yōu)點(diǎn)是:1.多因素分析方法2.不考慮生存時間分布3.可利用截尾數(shù)據(jù)Cox比例風(fēng)險回歸模型h(t,X):t時刻風(fēng)險函數(shù)、風(fēng)險率或瞬時死亡率(hazardfunction)h0(t):基準(zhǔn)風(fēng)險函數(shù),即所有變量都取0時t時刻的風(fēng)險函數(shù)X1、X2、…、Xp:協(xié)變量、影響因素、預(yù)后因素β1、β2、…、βp:回歸系數(shù)Cox比例風(fēng)險回歸模型β>0,RR>1,說明變量X增加時,危險率增加,即X是危險因素。β<0,RR<1,說明變量X增加時,危險率下降,即X是保護(hù)因素。β=0,RR=1,說明變量X增加時,危險率不變,即X是危險無關(guān)因素。參數(shù)估計與假設(shè)檢驗(一)參數(shù)估計最大似然法(二)假設(shè)檢驗似然比檢驗(likelihoodratiotest)得分檢驗(scoretest)Wald檢驗(Waldtest)因素篩選與最優(yōu)模型的建立變量篩選方法1.向前引入法(前進(jìn)法)Forward2.向后剔除法(后退法)Backward3.逐步引入-剔除法(逐步法)Stepwise檢驗水準(zhǔn)1.初步的、探索性的研究,或變量數(shù)較少時,可取0.10。2.設(shè)計嚴(yán)謹(jǐn)?shù)?、證實性的研究,或變量數(shù)較多時,可取0.05或0.01。3.檢驗水準(zhǔn)包括引入的檢驗水準(zhǔn)和剔除的檢驗水準(zhǔn)。一般地,剔除α≥引入α。Cox回歸分析時應(yīng)注意的問題1.除生存資料的基本要求外,還要求因素對生存時間的作用不隨時間變化(比例風(fēng)險假定)。如觀察年限超過10年時,癌癥手術(shù)后放療的治療作用可能逐漸消失,從而不滿足這一要求。2.篩選變量時,考慮該指標(biāo)是否容易收集、是否費(fèi)用較高等臨床因素。3.對連續(xù)性自變量,看其分布,如服從偏態(tài)分布,一般進(jìn)行對數(shù)變換后參與計算。對多項無序分類自變量應(yīng)設(shè)置啞變量。Cox回歸與logistic回歸logistic回歸模型可以作多因素分析,并可進(jìn)行相對危險度估計,但不考慮生存時間的長短,不能處理隨訪中常見的截尾數(shù)據(jù)。Cox比例風(fēng)險回歸模型具有l(wèi)ogistic回歸模型的所有優(yōu)點(diǎn);同時考慮生存結(jié)局和生存時間的長短,可處理截尾數(shù)據(jù);且不考慮基準(zhǔn)風(fēng)險的分布。Cox回歸與多元線性回歸、logistic回歸的比較多元線性回歸logistic回歸Cox回歸數(shù)據(jù)類型Y數(shù)值變量Y分類變量Y二分類變量+時間X可為數(shù)值變量、分類變量、等級變量模型結(jié)構(gòu)略變量篩選前進(jìn)法;后退法;逐步法參數(shù)估計最小二乘法最大似然法最大似然法參數(shù)檢驗F-testt-test似然比檢驗Wald檢驗score檢驗似然比檢驗Wald檢驗score檢驗參數(shù)解釋回歸系數(shù)b優(yōu)勢比ORRR樣本含量至少變量數(shù)的10倍至少變量數(shù)的20倍非截尾例數(shù)至少變量數(shù)的10倍應(yīng)用因素分析預(yù)測預(yù)報Y因素分析預(yù)測、判別P(Y=1)因素分析生存預(yù)測S(t)1.常使用的研究類型前瞻性隊列研究回顧性隊列研究生存分析的設(shè)計和實施2.研究開始時應(yīng)確定起始事件、終點(diǎn)事件、隨訪終止日期、生存時間、截尾。3.確定可能的影響因素、水平以及量化方法。1.常使用的研究類型前瞻性隊列研究回顧性隊列研究生存分析的設(shè)計和實施2.研究開始時應(yīng)確定起始事件、終點(diǎn)事件、隨訪終止日期、生存時間、截尾。3.確定可能的影響因素、水平以及量化方法。大腸癌影響因素量化表變量名因素量化值病例數(shù)構(gòu)成比(%)X1性別女=03248.5

男=13451.5X2年齡(歲)<40=11015.140-60=23756.1≥60=31928.8X3組織學(xué)分類乳頭狀腺癌=02030.3

管狀腺癌=1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論