醫(yī)學(xué)統(tǒng)計(jì):生存分析_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì):生存分析_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì):生存分析_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì):生存分析_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì):生存分析_第5頁(yè)
已閱讀5頁(yè),還剩80頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、生存分析survival analysis,孫秀彬,何為生存分析,生存分析的歷史與應(yīng)用,17、18世紀(jì):壽命表的提出及其應(yīng)用。 1926年:Greenwood提出評(píng)價(jià)生存函數(shù)的誤差的方法Greenwood公式。 1958年:生存函數(shù)的計(jì)算方法Kaplan-Meier法(乘積極限法product-limit)的提出。 1960年代中葉:生存時(shí)間的組間比較方法的開(kāi)發(fā)廣義Wilcoxon秩和檢驗(yàn)(Gehan,1965年);對(duì)數(shù)秩檢驗(yàn)(log-rank test)又稱(chēng)時(shí)序檢驗(yàn)(Mantel,1966年)。 1970年:將協(xié)變量的影響模型化參數(shù)模型:假設(shè)生存時(shí)間服從Weibull分布、對(duì)數(shù)正態(tài)分布等;半

2、參數(shù)模型:比例風(fēng)險(xiǎn)模型(Cox,1972年),又稱(chēng)Cox回歸模型。,第一節(jié) 概述,一、基本概念,(一)死亡事件 死亡事件又稱(chēng)失效事件,不單指通常意義下的生物體的死亡,而是泛指標(biāo)志某種處理措施失敗或失效的特征事件。,(二)生存時(shí)間(survival time): 1定義:廣義的生存時(shí)間是指從某個(gè)起始事件開(kāi)始到某個(gè)終點(diǎn)事件的發(fā)生(出現(xiàn)反應(yīng))所經(jīng)歷的時(shí)間。也稱(chēng)失效時(shí)間(failure time)。 2特點(diǎn): (1)分布類(lèi)型不易確定。一般不服從正態(tài)分布, 有時(shí)近似服從指數(shù)分布、Weibull分布、 Gompertz分布等,多數(shù)情況下往往不服從任 何規(guī)則的分布類(lèi)型。,(2)生存時(shí)間的影響因素多而復(fù)雜且不

3、易控制。 (3)根據(jù)研究對(duì)象的結(jié)局,生存時(shí)間數(shù)據(jù)可分兩種類(lèi)型: 完全數(shù)據(jù)(complete data):觀察對(duì)象在觀察期內(nèi)出現(xiàn)反應(yīng)(終點(diǎn)事件),這時(shí)記錄到的時(shí)間信息是完整的,這種生存時(shí)間數(shù)據(jù)稱(chēng)為完全數(shù)據(jù)。 截尾數(shù)據(jù)(截尾值、刪失數(shù)據(jù),censored data):尚未觀察到研究對(duì)象出現(xiàn)反應(yīng)(終點(diǎn)事件)時(shí),即由于某種原因停止了隨訪(fǎng),這時(shí)記錄到的時(shí)間信息是不完整的,這種生存時(shí)間數(shù)據(jù)稱(chēng)為不完全數(shù)據(jù)或截尾值。,截尾的原因主要有3種: 失訪(fǎng):失去聯(lián)系 退出:死于非研究因素或其他非處理因 素、改變治療方案等導(dǎo)致退出研究。 終止:指觀察研究期限結(jié)束時(shí)仍未出現(xiàn)結(jié)局。,關(guān)于截尾或刪失,風(fēng)險(xiǎn)函數(shù)與生存函數(shù)的關(guān)系,

4、第二節(jié) 生存率估計(jì)的非參數(shù)法,第三節(jié) 生存率的比較,生存率比較的假設(shè)檢驗(yàn)方法有參數(shù)法、半?yún)?shù)法和非參數(shù)法, 因醫(yī)學(xué)研究中的生存時(shí)間資料大多為不規(guī)則分布或者分布未知,常采用非參數(shù)法進(jìn)行假設(shè)檢驗(yàn)。 非參數(shù)法是將生存率曲線(xiàn)作為整體進(jìn)行曲線(xiàn)與曲線(xiàn)之間的比較,其零假設(shè)為各總體生存率曲線(xiàn)相同。 常用的非參數(shù)檢驗(yàn)方法有l(wèi)og-rank 檢驗(yàn)(時(shí)序檢驗(yàn))、Gehan比分檢驗(yàn)和Breslow檢驗(yàn)等。,續(xù)表,對(duì)于大樣本資料生存率的比較,可以將其整理成頻數(shù)表形式,采用壽命表法計(jì)算生存率然后進(jìn)行比較,其基本原理與上述方法相同。,第四節(jié) Cox比例風(fēng)險(xiǎn)回歸模型,一、Cox比例風(fēng)險(xiǎn)回歸模型的基本形式,看下面例子,如果分析

5、x1-x6這6個(gè)因素對(duì)生存時(shí)間t的影響,能否用線(xiàn)性回歸分析建立時(shí)間t與影響因素間的線(xiàn)性回歸方程?或建立生存函數(shù)S(t)與影響因素間的線(xiàn)性回歸方程? t=b0+b1x1+b2x2+b6x6 ? S(t) =b0+b1x1+b2x2+b6x6 ?,1、生存時(shí)間t一般不服從正態(tài) 分布; 2、生存時(shí)間t中含有截尾值。,利用生存率函數(shù)S(t,X)與風(fēng)險(xiǎn)函數(shù)h(t,X)的關(guān)系可導(dǎo)出,較好的解決截尾值的問(wèn)題,反映了協(xié)變量X與生存函數(shù)的關(guān)系,Cox模型的基本形式,所有危險(xiǎn)因素為0時(shí)的基礎(chǔ)風(fēng)險(xiǎn)率,它是未知的,但假定它與h(t,X)是呈比例的。,右側(cè)可分為兩部分:h0(t)沒(méi)有明確的定義,分布無(wú)明確的假定,參數(shù)無(wú)

6、法估計(jì),為非參數(shù)部分;另一部分是參數(shù)部分,其參數(shù)可以通過(guò)樣本的實(shí)際觀察值來(lái)估計(jì)的,正因?yàn)镃ox模型有非參數(shù)和參數(shù)兩部分組成,故又稱(chēng)為半?yún)?shù)模型。,二、Cox回歸分析的步驟:,確定自變量和因變量 參數(shù)估計(jì),擬和模型 對(duì)模型的假設(shè)檢驗(yàn) 模型的解釋及應(yīng)用 對(duì)模型的擬和優(yōu)度檢驗(yàn),模型的參數(shù)估計(jì),(一)參數(shù)估計(jì)-偏似然估計(jì),代表ti時(shí)刻以后危險(xiǎn)集R(ti)中對(duì)似然函數(shù)作貢獻(xiàn)的個(gè)體,將n個(gè)病人死亡的 條件概率相乘,兩邊取自然對(duì)數(shù),模型的假設(shè)檢驗(yàn),Cox模型的解釋及應(yīng)用,1探索結(jié)局事件發(fā)生的危險(xiǎn)因素,分析各 因素的作用大小 。 2計(jì)算個(gè)體預(yù)后指數(shù)(prognosis index, PI),對(duì)個(gè)體進(jìn)行定性的預(yù)

7、后評(píng)價(jià)。 3通過(guò)估計(jì)生存率,對(duì)群體定量地進(jìn)行預(yù) 后評(píng)價(jià)。,影響因素Xi的標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)正態(tài)離差,相應(yīng)偏回歸系數(shù)的標(biāo)準(zhǔn)誤,ti時(shí)刻的基礎(chǔ)生存率公式,ti時(shí)刻的基礎(chǔ)累計(jì)風(fēng)險(xiǎn)函數(shù)公式,在ti時(shí)刻的死亡人數(shù),ti時(shí)刻的生存率計(jì)算公式,Cox模型的擬合優(yōu)度,可將研究對(duì)象按個(gè)體預(yù)后指數(shù)恰當(dāng)?shù)胤纸M,用乘積極限法估計(jì)各組的生存率曲線(xiàn),并與按Cox模型預(yù)后指數(shù)分類(lèi)的生存率曲線(xiàn)在同一坐標(biāo)系內(nèi)進(jìn)行比較,若兩種曲線(xiàn)具有一致性,說(shuō)明模型擬合較理想。,Cox回歸分析的應(yīng)用實(shí)例,調(diào)用Cox模型分析模塊 ,分析數(shù)據(jù)集為cox,建立生存時(shí)間為t ,截尾指示變量為d 的Cox模型,d 取值為1時(shí)表示截尾,用逐步回歸法篩選變量,選入

8、和剔出水平均為0.05,計(jì)算篩選因素的相對(duì)危險(xiǎn)度及其95%的可信區(qū)間,結(jié)果:,治療方式(x4):相對(duì)危險(xiǎn)度為5.820,說(shuō)明傳統(tǒng)的治療方式和新的治療方式相比,病人死亡的風(fēng)險(xiǎn)為5.820倍,相對(duì)危險(xiǎn)度的95%的可信區(qū)間為1.98917.031; 淋巴結(jié)是否轉(zhuǎn)移(x5)的RR值的含義與治療方式相同。,四、Cox模型的適用范圍,Cox模型適用于生存資料的統(tǒng)計(jì)分析,屬半?yún)?shù)模型,對(duì)資料沒(méi)有特殊的要求,也可以估計(jì)各因素的參數(shù),并能做多因素的統(tǒng)計(jì)分析。該模型的主要優(yōu)點(diǎn)在于能從眾多的影響因素中排除混雜因素的影響,找出影響生存時(shí)間的因素,根據(jù)各因素的參數(shù)估計(jì)出個(gè)體的生存率。 另外,Cox模型能分析具有截尾數(shù)值

9、的生存時(shí)間。 Cox模型在臨床流行病學(xué)分析中,使臨床觀察的定性指標(biāo)又加上定量指標(biāo)進(jìn)行分析,提高了分析的效率。,五、Cox模型的適用范圍及注意事項(xiàng),1設(shè)計(jì)階段應(yīng)注意的問(wèn)題 樣本的代表性要好。要注意資料的代表性及可靠性;樣本含量不宜過(guò)小,一般在40例以上。隨著協(xié)變量的增加觀察的樣本應(yīng)適當(dāng)?shù)脑黾?,要求樣本的含量為觀察協(xié)變量的5-20倍。 所有危險(xiǎn)因素要在設(shè)計(jì)時(shí)考慮全面,避免漏掉重要因素和加入無(wú)關(guān)因素。 生存時(shí)間的定義要明確。起始事件和終點(diǎn)事件要有明確規(guī)定,時(shí)間盡可能精確測(cè)量。,1設(shè)計(jì)階段應(yīng)注意的問(wèn)題(續(xù)) 研究的協(xié)變量在研究對(duì)象中的分布要適中,否則會(huì)給參數(shù)的估計(jì)帶來(lái)困難。 在設(shè)計(jì)時(shí)要注意影響時(shí)間的效

10、應(yīng)因素。如研究吸煙對(duì)肺癌患者生存率的影響,若本來(lái)吸煙的人因患肺癌而戒煙,則一般模型不易分析吸煙的作用,需考慮吸煙量隨時(shí)間變化的趨勢(shì)。如果研究的因素隨時(shí)間而發(fā)生變化,必要時(shí)可以采用伴時(shí)協(xié)變量的Cox模型進(jìn)行分析。,2模型擬合時(shí)應(yīng)注意的問(wèn)題 多重共線(xiàn)性問(wèn)題:醫(yī)學(xué)研究中的許多變量間并不是獨(dú)立的,但通常不會(huì)影響分析的結(jié)果,如果變量間存在高度的相關(guān),則會(huì)影響Cox模型的參數(shù)估計(jì),此時(shí)可采用主成分分析法或R 型聚類(lèi)分析法消除多元共線(xiàn)性的影響。 應(yīng)注意Cox模型要求病人的風(fēng)險(xiǎn)函數(shù)與基礎(chǔ)風(fēng)險(xiǎn)函數(shù)呈比例,如果這一假定不成立,則不能用Cox模型進(jìn)行分析。,3模型應(yīng)用時(shí)應(yīng)注意的問(wèn)題 結(jié)果的解釋?xiě)?yīng)結(jié)合專(zhuān)業(yè)知識(shí)。Cox模型與其他回歸分析一樣,當(dāng)進(jìn)入模型中的因素有統(tǒng)計(jì)學(xué)意義時(shí),該因素與生存時(shí)間不一定有因果關(guān)系,其中有一部分因素與生存時(shí)間的關(guān)系為伴隨關(guān)系。 Cox回歸的生存率一般不宜用于不同資料之間的比較,因?yàn)榛鶞?zhǔn)危險(xiǎn)率函數(shù)只在同一份資料內(nèi)保持相同,不同資料的基準(zhǔn)危險(xiǎn)率往往不同;而且在多因素分析的情況下,協(xié)變量組合也很難一致,可比性難以保證。,(三)Cox模型的局限性,Cox模型估計(jì)參數(shù)時(shí),首先要假定偏似然函數(shù)具有最大似然的性質(zhì),這個(gè)問(wèn)題在理論上尚不完善; Cox模型對(duì)異常值較為敏感,所以在進(jìn)行模型配合

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論