版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、生存分析,(10號(hào)) 21160311055 侯笛,目錄,概述,定義,生存分析是研究生存現(xiàn)象和響應(yīng)時(shí)間數(shù)據(jù)及其統(tǒng)計(jì)規(guī)律的一門學(xué)科。由于最初研究的關(guān)鍵事件是死亡,故稱為生存分析。生存分析是統(tǒng)計(jì)科學(xué)的重要分支,其研究的兩個(gè)重要變?cè)獮椤笆录焙汀皦勖薄?事件:生存分析中定義的事件有死亡、損壞、失敗、解雇、病發(fā)等等。例如病人的死亡,產(chǎn)品的失效,疾病的發(fā)生,職員被解雇。 壽命:從記錄開始到事件發(fā)生的時(shí)間。,特點(diǎn),生存分析的優(yōu)點(diǎn)在于其能夠處理刪失數(shù)據(jù)。 生存分析的統(tǒng)計(jì)資料以生存時(shí)間為反應(yīng)變量,此類資料的生存時(shí)間變量大多不服從正態(tài)分布,且由于刪失值的存在,不適合用傳統(tǒng)的分析方法處理。此時(shí)就應(yīng)選用生存分析的
2、方法。,研究?jī)?nèi)容,生存分析研究的內(nèi)容主要有以下兩個(gè)方面: 一 對(duì)生存過程的描述 二 分析生存過程的影響因素并對(duì)生存的結(jié)局加以預(yù)測(cè),應(yīng)用領(lǐng)域,生存分析雖然源自醫(yī)學(xué)領(lǐng)域,但其在生物學(xué),保險(xiǎn)學(xué),可靠性工程學(xué),經(jīng)濟(jì)學(xué),教育學(xué),社會(huì)學(xué)等領(lǐng)域都有廣泛的應(yīng)用。比如: 醫(yī)療科學(xué)中病人的去世 保險(xiǎn)行業(yè)中的賠償 可靠性工程中產(chǎn)品的失效 金融領(lǐng)域中銀行賬戶從開立到取消的時(shí)間的研究 教育行業(yè)中學(xué)生的中途退學(xué) 客戶關(guān)系管理中的客戶流失,常用術(shù)語,生存數(shù)據(jù),生存分析中所分析的數(shù)據(jù)通常稱為分析數(shù)據(jù),一般度量的是某個(gè)事件發(fā)生所經(jīng)歷的時(shí)間長(zhǎng)度。生存數(shù)據(jù)可以分為完全數(shù)據(jù)和刪失數(shù)據(jù)。 完全數(shù)據(jù):指提供了完整信息的數(shù)據(jù)。例如,在研究
3、產(chǎn)品的失效時(shí)間時(shí),某個(gè)樣品從進(jìn)入研究直到失效都在我們的觀察中,可以得到該樣品的具體失效時(shí)間,這就是一個(gè)完全數(shù)據(jù)。 刪失數(shù)據(jù):是指在觀測(cè)期內(nèi),我們并沒有看見個(gè)體的狀態(tài)發(fā)生改變,無法確定個(gè)體具體的生存時(shí)間。又分為左刪失數(shù)據(jù),右刪失數(shù)據(jù),區(qū)間刪失數(shù)據(jù)。,刪失數(shù)據(jù)示意圖,起始 觀測(cè)時(shí)間區(qū)間 終止,死亡,死亡,死亡,未知,退出,完全數(shù)據(jù): A,觀測(cè)期內(nèi)死亡 右刪失數(shù)據(jù): B,觀測(cè)未終止時(shí)因故退出 C,觀測(cè)終止時(shí)尚未死亡 左刪失數(shù)據(jù): D,死亡時(shí)間在某一時(shí)刻之前,具體時(shí)間未知 區(qū)間刪失數(shù)據(jù): E,死亡時(shí)間位于某一區(qū)間,具體時(shí)間未知,生存函數(shù),生存函數(shù)(survival function),又稱為累積生存率
4、,我們用符號(hào)T表示個(gè)體的生存時(shí)間(從開始記錄到事件發(fā)生的時(shí)間),用 t 表示觀測(cè)時(shí)間,將生存函數(shù)記作 S(t),是指?jìng)€(gè)體生存時(shí)間大于 t 的概率。 S(t)= P(T t ),顯然 S(t)是非升函數(shù),且S(0)= 1, S()= 0,,風(fēng)險(xiǎn)函數(shù),風(fēng)險(xiǎn)函數(shù)(hazard function),又稱為瞬時(shí)死亡率,記作 h(t)。是指在t時(shí)刻存活的個(gè)體,在t+ t 時(shí)刻死亡的概率。 顯然,h(t)非負(fù),且無上限。,分析方法,按照是否使用參數(shù),可以將生存分析中的分析方法分為三類: 參數(shù)方法:若已經(jīng)證明某事件的發(fā)展可以用某個(gè)參數(shù)模型很好地?cái)M合,就可以用參數(shù)方法做該事件的生存分析。常用的參數(shù)模型有指數(shù)分布
5、模型、對(duì)數(shù)分布模型、正態(tài)分布模型,威泊分布模型等。 非參數(shù)方法:當(dāng)被研究事件不能被參數(shù)模型很好地?cái)M合時(shí),可以采用非參數(shù)方法研究它的生存特征。常用的非參數(shù)方法包括生命表分析和K-M分析。 半?yún)?shù)方法:它比參數(shù)模型靈活,與非參數(shù)方法相比更容易對(duì)分析結(jié)果進(jìn)行解釋。生存分析中使用的半?yún)?shù)模型是Cox比例風(fēng)險(xiǎn)模型。,非參數(shù)方法,生命表分析 K-M分析,生命表分析,生命表分析將觀測(cè)時(shí)間分成時(shí)間段,按時(shí)間段逐個(gè)統(tǒng)計(jì)事件發(fā)生的情況,以此估計(jì)生存函數(shù)。假設(shè)共有k個(gè)時(shí)間段 t 0 , t 1) , t 1 , t 2) , , t k-1 , t k ) , 每個(gè)區(qū)間中事件發(fā)生的次數(shù)分別為 d 1 ,d 2 ,
6、, d k , 每個(gè)區(qū)間中的個(gè)體總數(shù)分別為 n 1 , n 2 , , n k ,所以在第 i 個(gè)區(qū)間個(gè)體存活的概率為(n i - d i )/ n i ,而個(gè)體可以從第一個(gè)區(qū)間存活到第 i 個(gè)區(qū)間的概率(累積生存率)為: i = 1 , 2 , ,k ,且S(t)為遞減函數(shù)。,K-M分析,Kaplan-Meier分析,也稱為乘積極限分析,是Kaplan和Meier在1958年提出的一種估計(jì)生存函數(shù)的非參數(shù)方法。與生命表分析不同,K-M分析以事件發(fā)生的時(shí)間點(diǎn)將觀測(cè)區(qū)間分段,用來估計(jì)生存函數(shù)。下舉例說明其具體的分析過程。,下表記錄了5個(gè)實(shí)驗(yàn)對(duì)象的存活時(shí)間,其中F代表失效,S代表存活,2和4為右刪
7、失數(shù)據(jù)。,用S(t)表示實(shí)驗(yàn)對(duì)象的累積存活概率,分時(shí)間段計(jì)算如右:,t,0,31) :此區(qū)間5個(gè)實(shí)驗(yàn)對(duì)象均存活,故 S(t)=5/5=1. 31,65) :個(gè)體1在31小時(shí)死亡,故本區(qū)間 S(t)=14/5=0.8 65,150) :個(gè)體2在65小時(shí)退出實(shí)驗(yàn),本區(qū)間無個(gè)體死亡, S(t)=0.84/4=0.8. 150,220) :個(gè)體3在150小時(shí)死亡,S(t)=0.82/3=0.53. 220,300) :個(gè)體4在220小時(shí)退出實(shí)驗(yàn),本區(qū)間無個(gè)體死亡, S(t)=0.532/2=0.53. t=300時(shí),個(gè)體5死亡,S(300)=0,以SPSS對(duì)上例進(jìn)行K-M分析,結(jié)果如下: 1.輸入數(shù)據(jù)
8、,2.進(jìn)行K-M分析,參數(shù)設(shè)置,輸出結(jié)果,K-M分析生存函數(shù)圖,生命表分析與K-M分析的比較,生命表分析適用于大樣本的情況,特別是沒有個(gè)體數(shù)據(jù)的情形,主要優(yōu)點(diǎn)是對(duì)生存時(shí)間的分布沒有要求。 K-M分析中時(shí)間區(qū)間的劃分是以事件的發(fā)生為依據(jù)的,因此必須知道每個(gè)個(gè)體的生存時(shí)間數(shù)據(jù),適用于小樣本的情況。,半?yún)?shù)方法,生存分析中我們常常遇到個(gè)體的生存狀況受到多種因素影響的情況。這些對(duì)生存時(shí)間有影響的變量稱為協(xié)變量。在分析生存數(shù)據(jù)時(shí)要將協(xié)變量的影響考慮進(jìn)去。Cox半?yún)?shù)模型就很好地解決了這個(gè)問題。它假定風(fēng)險(xiǎn)函數(shù)由兩部分構(gòu)成:基準(zhǔn)風(fēng)險(xiǎn)函數(shù)和協(xié)變量線性組合的指數(shù)。 Cox半?yún)?shù)模型又分為獨(dú)立協(xié)變量比例風(fēng)險(xiǎn)模型和
9、時(shí)間相依性協(xié)變量比例風(fēng)險(xiǎn)模型兩種。二者的區(qū)別在于協(xié)變量的取值是否和時(shí)間有關(guān)。,Cox獨(dú)立協(xié)變量比例風(fēng)險(xiǎn)模型,該模型可寫成如下形式: 式中,Z1,Z2,Zm為協(xié)變量,這里的協(xié)變量與時(shí)間無關(guān),1,2,m為對(duì)應(yīng)協(xié)變量的未知參數(shù)。h 0(t)是基準(zhǔn)風(fēng)險(xiǎn)函數(shù)。 實(shí)際應(yīng)用中常比較兩個(gè)不同個(gè)體風(fēng)險(xiǎn)函數(shù)的比率,即危險(xiǎn)率??梢宰C明危險(xiǎn)率為常數(shù),因此該模型又稱為比例風(fēng)險(xiǎn)模型。 當(dāng)協(xié)變量與時(shí)間有關(guān)時(shí),危險(xiǎn)率將不再是常數(shù),此時(shí)稱為時(shí)間相依性比例風(fēng)險(xiǎn)模型。,案例分析,兩組小白鼠用來檢驗(yàn)癌癥的治療狀況。一組使用傳統(tǒng)治療方法,另一組使用試驗(yàn)方法,試驗(yàn)人員記錄了小白鼠的存活時(shí)間及狀態(tài):Days為存活時(shí)間或觀測(cè)時(shí)間;Statu
10、s表示生存狀態(tài),取值1表示死亡,0表示存活;Group表示治療方法,取0表示傳統(tǒng)療法,取1表示試驗(yàn)療法,共有64組數(shù)據(jù)。,原始數(shù)據(jù)如下:,首先用生命表分析方法對(duì)數(shù)據(jù)進(jìn)行處理:,1.輸入數(shù)據(jù),2.選擇生命表分析,3.設(shè)置參數(shù),4.輸出結(jié)果,可以看出,大約在200天時(shí)兩種治療方法的生存函數(shù)相交,在200天以前傳統(tǒng)治療方法的存活率較高,而在200天以后試驗(yàn)方法的治療效果明顯優(yōu)于傳統(tǒng)治療方法。,中位數(shù)生存時(shí)間是生存率為50%時(shí),生存時(shí)間的平均水平。 從中位數(shù)生存時(shí)間來看,傳統(tǒng)治療方法的中位數(shù)為241天,試驗(yàn)方法的中位數(shù)為266天,明顯高于傳統(tǒng)治療方法??梢耘袛嘣囼?yàn)方法的療效相比傳統(tǒng)治療方法有所提高。,
11、用K-M方法對(duì)數(shù)據(jù)進(jìn)行處理,結(jié)果如下:,生存函數(shù)分布和生命表分析的結(jié)果相似。K-M方法可以記錄刪失數(shù)據(jù),且由于分段較多整體呈現(xiàn)密集的鋸齒,而生命表分析的分布則較為平緩。 在結(jié)果檢驗(yàn)上,不同檢驗(yàn)方法結(jié)果有所差異,其中Log Rank檢驗(yàn)的p值小于0.05,表明兩種治療方法有顯著性差異。,除了治療方法對(duì)小白鼠的生存狀況有影響,其他因素如性別,年齡,體重等都可能對(duì)其生存時(shí)間造成影響。加入這些數(shù)據(jù)后,用Cox獨(dú)立協(xié)變量比例風(fēng)險(xiǎn)模型重新分析。,1.輸入數(shù)據(jù),2.設(shè)置參數(shù),3.輸出結(jié)果,分類變量是指不連續(xù)的變量,此例中治療方法的值只取0和1,性別只取F和M。不同于體重、年齡這些連續(xù)變量,分類變量在計(jì)算風(fēng)險(xiǎn)比例時(shí)以參考類別作為參照。如在本案例中治療方法這一因子以試驗(yàn)方法作為參照。計(jì)算結(jié)果為傳統(tǒng)方法的風(fēng)險(xiǎn)率相對(duì)于參考的倍數(shù)。,上表為模型系數(shù)的綜合檢驗(yàn)結(jié)果。可以看到p=0,小于0.05,說明這些因素中有些變量對(duì)白鼠的生存時(shí)間有顯著影響。,此表給出了各個(gè)變量的單個(gè)模型系數(shù)檢驗(yàn)結(jié)果,可以看到體重變量的p=0,說明體重對(duì)風(fēng)險(xiǎn)函數(shù)有極顯著影響。體重每增
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 君直少年申請(qǐng)書個(gè)人想法
- 民事債務(wù)糾紛執(zhí)行申請(qǐng)書
- 取保就醫(yī)申請(qǐng)書文案范文
- 委托代理人辯解申請(qǐng)書
- 小額速裁審理申請(qǐng)書
- 外地公司勞動(dòng)仲裁申請(qǐng)書
- 提前送孩子上學(xué)的申請(qǐng)書
- 調(diào)動(dòng)人員申請(qǐng)書
- 衡水中學(xué)休學(xué)申請(qǐng)書范文
- 證券投資風(fēng)險(xiǎn)管理與操作指南
- 【MOOC】線性代數(shù)學(xué)習(xí)指導(dǎo)-同濟(jì)大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 網(wǎng)架吊裝安全保證措施
- 某電廠660MW機(jī)組熱力系統(tǒng)與凝結(jié)水系統(tǒng)設(shè)計(jì)
- 交通基礎(chǔ)設(shè)施數(shù)字化轉(zhuǎn)型
- 《TCEC 2022102低溫環(huán)境條件下高壓電氣設(shè)備現(xiàn)場(chǎng)檢測(cè)實(shí)施導(dǎo)則 第1部分:紅外測(cè)溫》
- JB-T 8532-2023 脈沖噴吹類袋式除塵器
- 越南與中國(guó)廣西邊境貿(mào)易研究
- 室內(nèi)消火栓的檢查內(nèi)容、標(biāo)準(zhǔn)及檢驗(yàn)程序
- DB35T 2136-2023 茶樹病害測(cè)報(bào)與綠色防控技術(shù)規(guī)程
- 舞臺(tái)機(jī)械的維護(hù)與保養(yǎng)
- 運(yùn)輸工具服務(wù)企業(yè)備案表
評(píng)論
0/150
提交評(píng)論