版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Bioinformatics,
lecture
:6
Survivalanalysisinmedicine第六講生存分析應(yīng)用:原理–應(yīng)用–結(jié)果分析Wei-Hua
ChenCollege
of
Life
Science
and
Technology
(CLST)Sunday,May28,20231weihuachen@-未經(jīng)許可不得傳播前情提要轉(zhuǎn)錄組學(xué)數(shù)據(jù)序列獲取原理與方法芯片數(shù)據(jù)庫GEO數(shù)據(jù)結(jié)構(gòu)與類型生信數(shù)據(jù)分析利器Bioconductor如何對(duì)數(shù)據(jù)進(jìn)行處理與分析?數(shù)據(jù)的標(biāo)準(zhǔn)化數(shù)據(jù)樣本分組和檢查差異表達(dá)基因功能富集分析——更好的理解基因的功能!Sunday,May28,20232weihuachen@-未經(jīng)許可不得傳播內(nèi)容提要:臨床數(shù)據(jù)獲取與分析Sunday,May28,20233生存分析的原理生存分析方法123小結(jié)、作業(yè)與下次提要weihuachen@-未經(jīng)許可不得傳播什么是生存分析?生存分析(survivalanalysis)——對(duì)生存數(shù)據(jù)的分析
從某一觀察時(shí)間開始,將事件發(fā)生的結(jié)果與出現(xiàn)這一結(jié)果所經(jīng)歷的時(shí)間結(jié)合起來分析的一種統(tǒng)計(jì)方法。在生存分析中,定義的事件有病人死亡、產(chǎn)品損壞、員工解雇等等。
在醫(yī)學(xué)分析中,常用于觀察某一段時(shí)間內(nèi),病人死亡或病情復(fù)發(fā)的情況。生存分析的三個(gè)要素:Sunday,May28,20234weihuachen@-未經(jīng)許可不得傳播生存分析基本概念
Sunday,May28,20235weihuachen@-未經(jīng)許可不得傳播生存數(shù)據(jù)完全數(shù)據(jù):A病人:從進(jìn)入研究直到死亡都在我們的觀察中,并能得知病人具體的死亡時(shí)間。右刪失數(shù)據(jù):B病人:在觀察未終止時(shí)因故退出C病人:觀察終止時(shí)未死亡左刪失數(shù)據(jù):D病人:死亡時(shí)間在終止前,但死亡的具體時(shí)間未知區(qū)間刪失數(shù)據(jù):E病人:死亡時(shí)間在觀察終止前的某一時(shí)間區(qū)間內(nèi),具體時(shí)間未知BACDE未知死亡退出死亡死亡觀察起點(diǎn)觀測(cè)時(shí)間區(qū)間觀察終止Sunday,May28,20236weihuachen@-未經(jīng)許可不得傳播生存分析的特點(diǎn)生存分析的特點(diǎn):與其他多因素分析相比,同時(shí)考慮了每個(gè)事件發(fā)生時(shí)經(jīng)歷的時(shí)間與事件結(jié)果兩個(gè)因變量可處理生存時(shí)間分布不正態(tài)、含有刪失數(shù)據(jù)的問題進(jìn)行非參數(shù)分析(Kaplan-Meier法)與參數(shù)分析方法(Cox風(fēng)險(xiǎn)比例回歸模型)Sunday,May28,20237weihuachen@-未經(jīng)許可不得傳播內(nèi)容提要:臨床數(shù)據(jù)獲取與分析Sunday,May28,20238生存分析的原理生存分析方法與數(shù)據(jù)123小結(jié)、作業(yè)與下次提要weihuachen@-未經(jīng)許可不得傳播生存分析的應(yīng)用描述生存的過程:研究患有某一疾病的人群生存的特點(diǎn),如估計(jì)平均存活時(shí)間與生存率,繪制生存曲線等。計(jì)算生存率一般使用Kaplan-Meier法。比較生存過程可對(duì)各組別的生存率進(jìn)行比較,探討組間的生存過程是否存在差異,一般使用log-rank檢驗(yàn)和Breslow檢驗(yàn)。分析影響因素通過建立生存分析模型探討影響生存時(shí)間與事件發(fā)生的有利因素與不利因素,因素作用的大小與方向等,通常使用Cox比例風(fēng)險(xiǎn)回歸模型。Sunday,May28,20239weihuachen@-未經(jīng)許可不得傳播生存數(shù)據(jù)的描述–以AML病人為例time:事件發(fā)生時(shí)對(duì)象的存活時(shí)間或?qū)ο笸顺鰰r(shí)的刪失時(shí)間status:0表示沒有事件發(fā)生或?yàn)閯h失,1表示事件發(fā)生X:Nonmaintained表示沒有進(jìn)行化療,maintained表示在進(jìn)行化療Sunday,May28,202310weihuachen@-未經(jīng)許可不得傳播生存數(shù)據(jù)的描述Lifetables
ofAML:time:事件發(fā)生的時(shí)間點(diǎn)n.risk:在時(shí)間time之前未發(fā)生事件,且沒有發(fā)生刪失情況的對(duì)象數(shù)量n.event:在時(shí)間點(diǎn)time發(fā)生了事件的對(duì)象數(shù)量survival:K-M分析方法來估計(jì)的累積生存率S(t)。std.err、lower95%CI與upper95%CI分別是估計(jì)S(t)的標(biāo)準(zhǔn)誤差與置信區(qū)間。Sunday,May28,202311weihuachen@-未經(jīng)許可不得傳播累積生存率S(t)對(duì)生存率的計(jì)算方法分為壽命表法與Kaplan-Meier法,目前采用較多的是K-M法。Kaplan-Meier
estimator:Kaplan與Meier在1958年提出,利用生存數(shù)據(jù)估計(jì)生存函數(shù)S(t)的無參統(tǒng)計(jì)方法。以事件發(fā)生的時(shí)間點(diǎn)對(duì)觀測(cè)區(qū)間分段,再來估計(jì)生存函數(shù)。ti
表示每次事件發(fā)生的時(shí)間點(diǎn);di
表示在ti時(shí)發(fā)生事件的次數(shù)(n.event)ni表示在ti時(shí)還存活,并且沒有發(fā)生刪失情況的觀察對(duì)象數(shù)量(n.risk)生存率的本質(zhì):對(duì)前面所有發(fā)生事件時(shí)刻的生存率的累積Sunday,May28,202312weihuachen@-未經(jīng)許可不得傳播累積生存率S(t)time=0時(shí),survival即S(t)=100%;(0,5]:在此區(qū)間,有2個(gè)個(gè)體發(fā)生了事件,23個(gè)個(gè)體存活,故本區(qū)間S(t)=(23-2)/23=0.913(5,8]:有2個(gè)個(gè)體發(fā)生了事件,21個(gè)個(gè)體存活,本區(qū)間S(t)=0.913*19/21=0.8261(8,9]:有1個(gè)個(gè)體發(fā)生了事件,19個(gè)個(gè)體存活,說明有1個(gè)個(gè)體出現(xiàn)了刪失數(shù)據(jù),本區(qū)間S(t)=0.8261*18/19=0.7826(9,12]:有1個(gè)個(gè)體發(fā)生了事件,18個(gè)個(gè)體存活,本區(qū)間S(t)=0.7826*17/18=0.7391Sunday,May28,202313weihuachen@-未經(jīng)許可不得傳播生存數(shù)據(jù)的描述Kaplan-MeierplotforAMLdataX軸表示從0(觀察起始)到最終的觀察時(shí)間點(diǎn)Y軸表示K-M方法估計(jì)的總生存率。在觀察起始點(diǎn),所有的觀察對(duì)象都是存活的,即x=0時(shí),y=1。實(shí)線表示事件發(fā)生的進(jìn)展,虛線為估計(jì)的生存率的95%置信區(qū)間。Sunday,May28,202314weihuachen@-未經(jīng)許可不得傳播生存過程的比較通過分類變量將生存數(shù)據(jù)分為兩組或多組,對(duì)各組的生存情況進(jìn)行比較。通常用log-ranktest方法用于檢驗(yàn)組間差異性。一般情況下認(rèn)為當(dāng)P<0.05時(shí),組間有顯著性差異。(假設(shè)檢驗(yàn))log-ranktest只能分析單因素對(duì)生存率的影響,且不適用于連續(xù)變量,如基因表達(dá)值。通過分組比較生存數(shù)據(jù),分析某個(gè)變量是否影響病人的生存率,或是作為預(yù)后的指標(biāo)。Sunday,May28,202315weihuachen@-未經(jīng)許可不得傳播生存過程的比較將AML病人根據(jù)有無做化療劃分為兩組,并查看兩組的生存情況。Sunday,May28,202316weihuachen@-未經(jīng)許可不得傳播生存過程的比較利用ggsurvplot繪制圖片,可顯示log-rank檢驗(yàn)的P值結(jié)果。分組后生存率差異不顯著,可能的原因?樣本量太少(log-ranktest基于卡方檢驗(yàn))該因素的影響不足以導(dǎo)致差異Sunday,May28,202317weihuachen@-未經(jīng)許可不得傳播生存過程的比較CES:細(xì)胞分裂相關(guān)基因的表達(dá)值如果想要研究某個(gè)連續(xù)變量對(duì)生存率的影響,我們可以考慮將連續(xù)變量由小到大進(jìn)行分組,轉(zhuǎn)化成分類變量后再來進(jìn)行l(wèi)og-rank檢驗(yàn)。Sunday,May28,202318weihuachen@-未經(jīng)許可不得傳播生存過程的比較當(dāng)生存曲線出現(xiàn)交叉時(shí),說明該因素受時(shí)間影響,此時(shí)的Log-rank檢驗(yàn)失效。解決方法:樣本分層分析;采用多因素分析方法校正。Sunday,May28,202319weihuachen@-未經(jīng)許可不得傳播多因素分析個(gè)體的生存狀況通常受到多個(gè)因素的影響,如基因、抽煙喝酒等不良習(xí)慣、疾病所用的藥物、生理指標(biāo)等。這些對(duì)生存時(shí)間有影響的變量我們稱為協(xié)變量(covariate)。在進(jìn)行多因素分析時(shí)我們通常采用Cox回歸分析。Coxproportionalhazardmodel:由英國(guó)倫敦大學(xué)的Cox在1972年提出的Cox比例風(fēng)險(xiǎn)模型,又稱Cox回歸分析,是一種半?yún)?shù)模型,主要用于腫瘤與其他慢性病的預(yù)后分析。Cox回歸分析以生存結(jié)局和生存時(shí)間為因變量,并同時(shí)分析眾多因素對(duì)生存期的影響,且不要求生存資料服從特定的分布類型。分為獨(dú)立協(xié)變量比例風(fēng)險(xiǎn)模型與時(shí)間相依性協(xié)變量比例風(fēng)險(xiǎn)模型,區(qū)別在于協(xié)變量是否隨時(shí)間變化。通常我們采取前者做分析。Sunday,May28,202320weihuachen@-未經(jīng)許可不得傳播多因素分析Cox獨(dú)立協(xié)變量比例風(fēng)險(xiǎn)模型:β1、β2、β3……由樣本估計(jì)而得的回歸系數(shù),當(dāng)βi>0表示該協(xié)變量為危險(xiǎn)因素,越大,導(dǎo)致生存時(shí)間越短;βi<0表示為保護(hù)因素,越大使生存時(shí)間越長(zhǎng)。h0(t):基礎(chǔ)風(fēng)險(xiǎn)函數(shù),當(dāng)全部協(xié)變量Z1、Z2、Z3……為0時(shí),個(gè)體在t時(shí)刻的風(fēng)險(xiǎn)函數(shù)。h(t,z):具有協(xié)變量Z1、Z2、Z3……的個(gè)體在t時(shí)刻的風(fēng)險(xiǎn)函數(shù)。表示t時(shí)刻存活的個(gè)體在t時(shí)刻的瞬時(shí)死亡率,它和h0(t)成比例。Sunday,May28,202321weihuachen@-未經(jīng)許可不得傳播多因素分析任意兩個(gè)群體風(fēng)險(xiǎn)函數(shù)之比,即為風(fēng)險(xiǎn)比(hazardratio/riskratio/HR/RR):假設(shè)hi(t)的X取值為1,hj(t)取值為0結(jié)論:風(fēng)險(xiǎn)比是與時(shí)間無關(guān)的常數(shù)。Sunday,May28,202322weihuachen@-未經(jīng)許可不得傳播多因素分析使用Cox獨(dú)立協(xié)變量比例風(fēng)險(xiǎn)模型前,必須滿足PH假設(shè):任何兩個(gè)個(gè)體的風(fēng)險(xiǎn)函數(shù)之比保持恒定比例,與時(shí)間t無關(guān);協(xié)變量的效應(yīng)不隨時(shí)間而改變;各影響因素之間相互獨(dú)立。PH假設(shè)檢驗(yàn)方法:使用的協(xié)變量繪制的生存曲線是否交叉——最簡(jiǎn)單Log-logplot檢驗(yàn)法統(tǒng)計(jì)檢驗(yàn)法:cox.zphSunday,May28,202323weihuachen@-未經(jīng)許可不得傳播多因素分析-PH假設(shè)檢驗(yàn)兩個(gè)折線圖沒交叉,說明AML的病人的化療信息不受時(shí)間影響。Sunday,May28,202324weihuachen@-未經(jīng)許可不得傳播Cox回歸分析–單因素分析Sunday,May28,202325weihuachen@-未經(jīng)許可不得傳播Cox回歸分析–單因素分析P值越大越好樣本越靠近虛線(置信區(qū)間),越滿足PH假設(shè)檢驗(yàn)Sunday,May28,202326weihuachen@-未經(jīng)許可不得傳播Cox回歸分析–多因素分析該選取哪些協(xié)變量進(jìn)行多因素分析?在進(jìn)行單因素分析時(shí),差異具有統(tǒng)計(jì)學(xué)意義的變量。(可將P值放寬);單因素分析時(shí),差異雖然沒有統(tǒng)計(jì)學(xué)意義,但臨床上認(rèn)為與因變量關(guān)系密切的協(xié)變量。Sunday,May28,202327weihuachen@-未經(jīng)許可不得傳播Cox回歸分析–多因素分析利用survival包內(nèi)置的肝硬化病人(pbc)數(shù)據(jù)做Cox多因素分析Sunday,May28,202328weihuachen@-未經(jīng)許可不得傳播Cox回歸分析–多因素分析Stage不符合PH假設(shè)檢驗(yàn),怎么解決?Sunday,May28,202329weihuachen@-未經(jīng)許可不得傳播Cox回歸分析–多因素分析對(duì)不符合PH假設(shè)的因素,我們采取分層措施分層分析后發(fā)現(xiàn),年齡對(duì)病人死亡有顯著的負(fù)面關(guān)系Sunday,May28,202330weihuachen@-未經(jīng)許可不得傳播Cox回歸分析–多因素分析當(dāng)置信區(qū)間都位于x=1右側(cè)時(shí),才說明該協(xié)變量具有高風(fēng)險(xiǎn)意義。Sunday,May28,202331weihuachen@-未經(jīng)許可不得傳播如何獲得臨床數(shù)據(jù)?GEO
database有些預(yù)后研究會(huì)提供芯片與臨床數(shù)據(jù)Sunday,May28,202332weihuachen@-未經(jīng)許可不得傳播如何獲得臨床數(shù)據(jù)?GEO
database有些疾病預(yù)后研究會(huì)提供芯片與臨床數(shù)據(jù)通過bioconductor下載GEOquery包來獲取GEO信息臨床信息可通過read.delim(“website”)來讀取Sunday,May28,202333weihuachen@-未經(jīng)許可不得傳播如何獲得臨床數(shù)據(jù)?TheCancerGenomeAtlas(TCGAdatabase)研究36種癌癥類型數(shù)據(jù)類型多樣:Clinical、mRNA、microRNA、Copynumber、mutation、Protein、Methylation數(shù)據(jù)水平及類型:原始數(shù)據(jù)、處理過的數(shù)據(jù)、經(jīng)過分割解釋的數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)Sunday,May28,202334weihuachen@-未經(jīng)許可不得傳播如何獲得臨床數(shù)據(jù)?知名腫瘤機(jī)構(gòu)都有自己的TCGA探索工具:BroadInstituteFirebrowseportalcBioportal——常用RegulomeExplorer下載TCGA數(shù)據(jù)的R
tools:TCGAbiolinks:
官方推薦工具,可下載TCGA實(shí)時(shí)更新的數(shù)據(jù)http://bioinformaticsfmrp.github.io/TCGAbiolinks/cgdsr:cBioportal的R包工具/cgds_r.jspSunday,May28,202335weihuachen@-未經(jīng)許可不得傳播如何獲得臨床數(shù)據(jù)?TCGAbiolinks下載感興趣的數(shù)據(jù)數(shù)據(jù)類型的選擇可在TCGAbiolinks官網(wǎng)教程了解列名:樣本名行名:基因名Sunday,May28,202336weihuachen@-未經(jīng)許可不得傳播如何獲得臨床數(shù)據(jù)?TCGAbiolinks下載感興趣的數(shù)據(jù)表達(dá)數(shù)據(jù)與臨床數(shù)據(jù)類型的選擇可在TCGAbiolinks官網(wǎng)教程了解Clinical臨床信息包括了病人、病人的年齡、生存信息、癌癥復(fù)發(fā)與轉(zhuǎn)移情況等化療、放療等具體信息需額外下載Sunday,May28,202337weihuachen@-未經(jīng)許可不得傳播如何獲得臨床數(shù)據(jù)?TCGAbiolinks表達(dá)數(shù)據(jù)與臨床數(shù)據(jù)的整合了解TCGA的命名規(guī)則:每個(gè)TCGA數(shù)據(jù)元素都具有自己的條碼,條碼的每個(gè)部分都代表了不同信息。所有條碼都是基于病人條碼(bcr_patient_barcode/submitter_id)的延伸,例如,條碼為TCGA-AO-A0JM的病人,她具有5個(gè)用藥條碼。通過barcode的前12個(gè)字符(TCGA-OO-BBBB),
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年會(huì)計(jì)實(shí)務(wù)操作技能測(cè)試題及答案解析
- 家具銷售行業(yè)培訓(xùn)
- 2026年企業(yè)內(nèi)部風(fēng)險(xiǎn)管理與審計(jì)試題
- 2026年管理學(xué)原理與實(shí)踐考試題庫
- 2026年系統(tǒng)集成項(xiàng)目管理師考前練習(xí)數(shù)據(jù)存儲(chǔ)與管理技術(shù)題
- 2026年經(jīng)濟(jì)法學(xué)深度解讀企業(yè)法務(wù)實(shí)務(wù)經(jīng)典題目
- 2026年環(huán)境工程污染治理造價(jià)估算問題集
- 2026年數(shù)據(jù)結(jié)構(gòu)與算法工程師考試題庫
- 2026年通信工程專業(yè)知識(shí)考試題庫及答案詳解
- 2025 小學(xué)二年級(jí)道德與法治上冊(cè)公共場(chǎng)合不挖鼻孔課件
- 市安全生產(chǎn)例會(huì)制度
- 高新區(qū)服務(wù)規(guī)范制度
- 小程序維護(hù)更新合同協(xié)議2025
- 雨課堂學(xué)堂在線學(xué)堂云《課程與教學(xué)論( 華師)》單元測(cè)試考核答案
- 中國(guó)自有品牌發(fā)展研究報(bào)告2025-2026
- 2025年豆制品千張銷量及餐桌烹飪調(diào)研匯報(bào)
- 地形測(cè)量投標(biāo)標(biāo)書技術(shù)設(shè)計(jì)書
- 2025及未來5年馬桶水箱組合項(xiàng)目投資價(jià)值分析報(bào)告
- 合伙建廠合同協(xié)議書
- 代建合同安全協(xié)議書
- 貸款掛靠合同(標(biāo)準(zhǔn)版)
評(píng)論
0/150
提交評(píng)論