版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、生存分析survival analysis,孫秀彬,何為生存分析,生存分析的歷史與應(yīng)用,17、18世紀(jì):壽命表的提出及其應(yīng)用。 1926年:Greenwood提出評(píng)價(jià)生存函數(shù)的誤差的方法Greenwood公式。 1958年:生存函數(shù)的計(jì)算方法Kaplan-Meier法(乘積極限法product-limit)的提出。 1960年代中葉:生存時(shí)間的組間比較方法的開(kāi)發(fā)廣義Wilcoxon秩和檢驗(yàn)(Gehan,1965年);對(duì)數(shù)秩檢驗(yàn)(log-rank test)又稱(chēng)時(shí)序檢驗(yàn)(Mantel,1966年)。 1970年:將協(xié)變量的影響模型化參數(shù)模型:假設(shè)生存時(shí)間服從Weibull分布、對(duì)數(shù)正態(tài)分布等;半
2、參數(shù)模型:比例風(fēng)險(xiǎn)模型(Cox,1972年),又稱(chēng)Cox回歸模型。,第一節(jié) 概述,一、基本概念,(一)死亡事件 死亡事件又稱(chēng)失效事件,不單指通常意義下的生物體的死亡,而是泛指標(biāo)志某種處理措施失敗或失效的特征事件。,(二)生存時(shí)間(survival time): 1定義:廣義的生存時(shí)間是指從某個(gè)起始事件開(kāi)始到某個(gè)終點(diǎn)事件的發(fā)生(出現(xiàn)反應(yīng))所經(jīng)歷的時(shí)間。也稱(chēng)失效時(shí)間(failure time)。 2特點(diǎn): (1)分布類(lèi)型不易確定。一般不服從正態(tài)分布, 有時(shí)近似服從指數(shù)分布、Weibull分布、 Gompertz分布等,多數(shù)情況下往往不服從任 何規(guī)則的分布類(lèi)型。,(2)生存時(shí)間的影響因素多而復(fù)雜且不
3、易控制。 (3)根據(jù)研究對(duì)象的結(jié)局,生存時(shí)間數(shù)據(jù)可分兩種類(lèi)型: 完全數(shù)據(jù)(complete data):觀察對(duì)象在觀察期內(nèi)出現(xiàn)反應(yīng)(終點(diǎn)事件),這時(shí)記錄到的時(shí)間信息是完整的,這種生存時(shí)間數(shù)據(jù)稱(chēng)為完全數(shù)據(jù)。 截尾數(shù)據(jù)(截尾值、刪失數(shù)據(jù),censored data):尚未觀察到研究對(duì)象出現(xiàn)反應(yīng)(終點(diǎn)事件)時(shí),即由于某種原因停止了隨訪(fǎng),這時(shí)記錄到的時(shí)間信息是不完整的,這種生存時(shí)間數(shù)據(jù)稱(chēng)為不完全數(shù)據(jù)或截尾值。,截尾的原因主要有3種: 失訪(fǎng):失去聯(lián)系 退出:死于非研究因素或其他非處理因 素、改變治療方案等導(dǎo)致退出研究。 終止:指觀察研究期限結(jié)束時(shí)仍未出現(xiàn)結(jié)局。,關(guān)于截尾或刪失,風(fēng)險(xiǎn)函數(shù)與生存函數(shù)的關(guān)系,
4、第二節(jié) 生存率估計(jì)的非參數(shù)法,第三節(jié) 生存率的比較,生存率比較的假設(shè)檢驗(yàn)方法有參數(shù)法、半?yún)?shù)法和非參數(shù)法, 因醫(yī)學(xué)研究中的生存時(shí)間資料大多為不規(guī)則分布或者分布未知,常采用非參數(shù)法進(jìn)行假設(shè)檢驗(yàn)。 非參數(shù)法是將生存率曲線(xiàn)作為整體進(jìn)行曲線(xiàn)與曲線(xiàn)之間的比較,其零假設(shè)為各總體生存率曲線(xiàn)相同。 常用的非參數(shù)檢驗(yàn)方法有l(wèi)og-rank 檢驗(yàn)(時(shí)序檢驗(yàn))、Gehan比分檢驗(yàn)和Breslow檢驗(yàn)等。,續(xù)表,對(duì)于大樣本資料生存率的比較,可以將其整理成頻數(shù)表形式,采用壽命表法計(jì)算生存率然后進(jìn)行比較,其基本原理與上述方法相同。,第四節(jié) Cox比例風(fēng)險(xiǎn)回歸模型,一、Cox比例風(fēng)險(xiǎn)回歸模型的基本形式,看下面例子,如果分析
5、x1-x6這6個(gè)因素對(duì)生存時(shí)間t的影響,能否用線(xiàn)性回歸分析建立時(shí)間t與影響因素間的線(xiàn)性回歸方程?或建立生存函數(shù)S(t)與影響因素間的線(xiàn)性回歸方程? t=b0+b1x1+b2x2+b6x6 ? S(t) =b0+b1x1+b2x2+b6x6 ?,1、生存時(shí)間t一般不服從正態(tài) 分布; 2、生存時(shí)間t中含有截尾值。,利用生存率函數(shù)S(t,X)與風(fēng)險(xiǎn)函數(shù)h(t,X)的關(guān)系可導(dǎo)出,較好的解決截尾值的問(wèn)題,反映了協(xié)變量X與生存函數(shù)的關(guān)系,Cox模型的基本形式,所有危險(xiǎn)因素為0時(shí)的基礎(chǔ)風(fēng)險(xiǎn)率,它是未知的,但假定它與h(t,X)是呈比例的。,右側(cè)可分為兩部分:h0(t)沒(méi)有明確的定義,分布無(wú)明確的假定,參數(shù)無(wú)
6、法估計(jì),為非參數(shù)部分;另一部分是參數(shù)部分,其參數(shù)可以通過(guò)樣本的實(shí)際觀察值來(lái)估計(jì)的,正因?yàn)镃ox模型有非參數(shù)和參數(shù)兩部分組成,故又稱(chēng)為半?yún)?shù)模型。,二、Cox回歸分析的步驟:,確定自變量和因變量 參數(shù)估計(jì),擬和模型 對(duì)模型的假設(shè)檢驗(yàn) 模型的解釋及應(yīng)用 對(duì)模型的擬和優(yōu)度檢驗(yàn),模型的參數(shù)估計(jì),(一)參數(shù)估計(jì)-偏似然估計(jì),代表ti時(shí)刻以后危險(xiǎn)集R(ti)中對(duì)似然函數(shù)作貢獻(xiàn)的個(gè)體,將n個(gè)病人死亡的 條件概率相乘,兩邊取自然對(duì)數(shù),模型的假設(shè)檢驗(yàn),Cox模型的解釋及應(yīng)用,1探索結(jié)局事件發(fā)生的危險(xiǎn)因素,分析各 因素的作用大小 。 2計(jì)算個(gè)體預(yù)后指數(shù)(prognosis index, PI),對(duì)個(gè)體進(jìn)行定性的預(yù)
7、后評(píng)價(jià)。 3通過(guò)估計(jì)生存率,對(duì)群體定量地進(jìn)行預(yù) 后評(píng)價(jià)。,影響因素Xi的標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)正態(tài)離差,相應(yīng)偏回歸系數(shù)的標(biāo)準(zhǔn)誤,ti時(shí)刻的基礎(chǔ)生存率公式,ti時(shí)刻的基礎(chǔ)累計(jì)風(fēng)險(xiǎn)函數(shù)公式,在ti時(shí)刻的死亡人數(shù),ti時(shí)刻的生存率計(jì)算公式,Cox模型的擬合優(yōu)度,可將研究對(duì)象按個(gè)體預(yù)后指數(shù)恰當(dāng)?shù)胤纸M,用乘積極限法估計(jì)各組的生存率曲線(xiàn),并與按Cox模型預(yù)后指數(shù)分類(lèi)的生存率曲線(xiàn)在同一坐標(biāo)系內(nèi)進(jìn)行比較,若兩種曲線(xiàn)具有一致性,說(shuō)明模型擬合較理想。,Cox回歸分析的應(yīng)用實(shí)例,調(diào)用Cox模型分析模塊 ,分析數(shù)據(jù)集為cox,建立生存時(shí)間為t ,截尾指示變量為d 的Cox模型,d 取值為1時(shí)表示截尾,用逐步回歸法篩選變量,選入
8、和剔出水平均為0.05,計(jì)算篩選因素的相對(duì)危險(xiǎn)度及其95%的可信區(qū)間,結(jié)果:,治療方式(x4):相對(duì)危險(xiǎn)度為5.820,說(shuō)明傳統(tǒng)的治療方式和新的治療方式相比,病人死亡的風(fēng)險(xiǎn)為5.820倍,相對(duì)危險(xiǎn)度的95%的可信區(qū)間為1.98917.031; 淋巴結(jié)是否轉(zhuǎn)移(x5)的RR值的含義與治療方式相同。,四、Cox模型的適用范圍,Cox模型適用于生存資料的統(tǒng)計(jì)分析,屬半?yún)?shù)模型,對(duì)資料沒(méi)有特殊的要求,也可以估計(jì)各因素的參數(shù),并能做多因素的統(tǒng)計(jì)分析。該模型的主要優(yōu)點(diǎn)在于能從眾多的影響因素中排除混雜因素的影響,找出影響生存時(shí)間的因素,根據(jù)各因素的參數(shù)估計(jì)出個(gè)體的生存率。 另外,Cox模型能分析具有截尾數(shù)值
9、的生存時(shí)間。 Cox模型在臨床流行病學(xué)分析中,使臨床觀察的定性指標(biāo)又加上定量指標(biāo)進(jìn)行分析,提高了分析的效率。,五、Cox模型的適用范圍及注意事項(xiàng),1設(shè)計(jì)階段應(yīng)注意的問(wèn)題 樣本的代表性要好。要注意資料的代表性及可靠性;樣本含量不宜過(guò)小,一般在40例以上。隨著協(xié)變量的增加觀察的樣本應(yīng)適當(dāng)?shù)脑黾?,要求樣本的含量為觀察協(xié)變量的5-20倍。 所有危險(xiǎn)因素要在設(shè)計(jì)時(shí)考慮全面,避免漏掉重要因素和加入無(wú)關(guān)因素。 生存時(shí)間的定義要明確。起始事件和終點(diǎn)事件要有明確規(guī)定,時(shí)間盡可能精確測(cè)量。,1設(shè)計(jì)階段應(yīng)注意的問(wèn)題(續(xù)) 研究的協(xié)變量在研究對(duì)象中的分布要適中,否則會(huì)給參數(shù)的估計(jì)帶來(lái)困難。 在設(shè)計(jì)時(shí)要注意影響時(shí)間的效
10、應(yīng)因素。如研究吸煙對(duì)肺癌患者生存率的影響,若本來(lái)吸煙的人因患肺癌而戒煙,則一般模型不易分析吸煙的作用,需考慮吸煙量隨時(shí)間變化的趨勢(shì)。如果研究的因素隨時(shí)間而發(fā)生變化,必要時(shí)可以采用伴時(shí)協(xié)變量的Cox模型進(jìn)行分析。,2模型擬合時(shí)應(yīng)注意的問(wèn)題 多重共線(xiàn)性問(wèn)題:醫(yī)學(xué)研究中的許多變量間并不是獨(dú)立的,但通常不會(huì)影響分析的結(jié)果,如果變量間存在高度的相關(guān),則會(huì)影響Cox模型的參數(shù)估計(jì),此時(shí)可采用主成分分析法或R 型聚類(lèi)分析法消除多元共線(xiàn)性的影響。 應(yīng)注意Cox模型要求病人的風(fēng)險(xiǎn)函數(shù)與基礎(chǔ)風(fēng)險(xiǎn)函數(shù)呈比例,如果這一假定不成立,則不能用Cox模型進(jìn)行分析。,3模型應(yīng)用時(shí)應(yīng)注意的問(wèn)題 結(jié)果的解釋?xiě)?yīng)結(jié)合專(zhuān)業(yè)知識(shí)。Cox模型與其他回歸分析一樣,當(dāng)進(jìn)入模型中的因素有統(tǒng)計(jì)學(xué)意義時(shí),該因素與生存時(shí)間不一定有因果關(guān)系,其中有一部分因素與生存時(shí)間的關(guān)系為伴隨關(guān)系。 Cox回歸的生存率一般不宜用于不同資料之間的比較,因?yàn)榛鶞?zhǔn)危險(xiǎn)率函數(shù)只在同一份資料內(nèi)保持相同,不同資料的基準(zhǔn)危險(xiǎn)率往往不同;而且在多因素分析的情況下,協(xié)變量組合也很難一致,可比性難以保證。,(三)Cox模型的局限性,Cox模型估計(jì)參數(shù)時(shí),首先要假定偏似然函數(shù)具有最大似然的性質(zhì),這個(gè)問(wèn)題在理論上尚不完善; Cox模型對(duì)異常值較為敏感,所以在進(jìn)行模型配合
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 電氣接地檢測(cè)技術(shù)要領(lǐng)
- 數(shù)控編程考試題庫(kù)及答案
- 審評(píng)規(guī)則考試題及答案
- 審計(jì)實(shí)務(wù)試卷試題及答案
- 融資專(zhuān)崗招聘考試題庫(kù)及答案
- 《GAT 974.90-2015消防信息代碼 第90部分:滅火器類(lèi)型代碼》專(zhuān)題研究報(bào)告
- 2026年深圳中考英語(yǔ)任務(wù)型閱讀專(zhuān)項(xiàng)試卷(附答案可下載)
- 2026年深圳中考英語(yǔ)創(chuàng)新題型特訓(xùn)試卷(附答案可下載)
- 2026年深圳中考數(shù)學(xué)圓的相關(guān)性質(zhì)試卷(附答案可下載)
- 2026年深圳中考生物人體的神經(jīng)調(diào)節(jié)專(zhuān)項(xiàng)試卷(附答案可下載)
- 設(shè)計(jì)成果保密管理制度
- 珠寶文化課件
- GB/T 43590.506-2025激光顯示器件第5-6部分:投影屏幕光學(xué)性能測(cè)試方法
- 電工職業(yè)衛(wèi)生試題及答案
- 五年級(jí)第一學(xué)期勞動(dòng)課教學(xué)計(jì)劃和總結(jié)
- 《骨及關(guān)節(jié)疾病》課件
- QES三體系建筑施工企業(yè)管理手冊(cè)(含50430)
- 物業(yè)管理技巧與經(jīng)驗(yàn)分享
- GB/T 44179-2024交流電壓高于1 000 V和直流電壓高于1 500 V的變電站用空心支柱復(fù)合絕緣子定義、試驗(yàn)方法和接收準(zhǔn)則
- 德漢翻譯入門(mén)智慧樹(shù)知到期末考試答案章節(jié)答案2024年中國(guó)海洋大學(xué)
- MT-T 1199-2023 煤礦用防爆柴油機(jī)無(wú)軌膠輪運(yùn)輸車(chē)輛安全技術(shù)條件
評(píng)論
0/150
提交評(píng)論