版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、生存分析,To be or not to be is only a part of the question. The question also includes how long to be.,生存資料(survival data),蘊(yùn)涵有結(jié)局和時(shí)間兩個(gè)方面的信息; 結(jié)局為兩分類互斥事件; 一般是通過(guò)隨訪收集得到 ; 常因失訪等原因造成某些研究對(duì)象的生存時(shí)間數(shù)據(jù)不完整,分布類型復(fù)雜。 不能簡(jiǎn)單地套用前面介紹過(guò)的統(tǒng)計(jì)方法進(jìn)行分析!,生存資料的分類: 未分組資料:例數(shù)較少,有每個(gè)觀察對(duì)象確切的生存時(shí)間; 分組資料:例數(shù)較多時(shí),常常按隨訪時(shí)間分組,沒(méi)有每個(gè)觀察對(duì)象確切的生存時(shí)間。,何為生存分析(
2、survival analysis),將研究對(duì)象的隨訪結(jié)局和隨訪時(shí)間兩個(gè)因素同時(shí)結(jié)合起來(lái)考慮的一種統(tǒng)計(jì)分析方法。 能充分利用所獲得的信息,達(dá)到較準(zhǔn)確、全面地評(píng)價(jià)和比較隨訪資料的目的,是臨床試驗(yàn)和隊(duì)列研究的一種重要分析手段。,生存分析的主要內(nèi)容,對(duì)生存時(shí)間進(jìn)行分析的統(tǒng)計(jì)方法的總稱。 描述生存時(shí)間分布 組間的生存時(shí)間分布的比較 考察可能與生存時(shí)間有關(guān)聯(lián)的協(xié)變量,生存分析的基本方法,非參數(shù)法 參數(shù)法 半?yún)?shù)法,生存分析的發(fā)展歷史,17、18世紀(jì):壽命表的提出及其應(yīng)用。 1926年:Greenwood提出評(píng)價(jià)生存函數(shù)的誤差的方法Greenwood公式。 1958年:生存函數(shù)的計(jì)算方法Kaplan-Me
3、ier法(乘積極限法)的提出。 1960年代中葉:生存時(shí)間的組間比較方法的開(kāi)發(fā)廣義Wilcoxon秩和檢驗(yàn)(Gehan,1965年)、對(duì)數(shù)秩檢驗(yàn)(log-rank test)又稱時(shí)序檢驗(yàn)(Mantel,1966年)。 1970年:將協(xié)變量的影響模型化參數(shù)模型:假設(shè)生存時(shí)間服從Weibull分布、對(duì)數(shù)正態(tài)分布等;半?yún)?shù)模型:比例風(fēng)險(xiǎn)模型(Cox,1972年),又稱Cox回歸模型。,生存分析的幾個(gè)基本概念,“死亡”事件(death event) :或稱終點(diǎn)事件(outcome event),反映研究因素失敗或失效的特征。如: 死亡、疾病復(fù)發(fā)、故障、再就業(yè),等。,生存時(shí)間(survival time
4、) :或稱隨訪時(shí)間,指觀察到的存活時(shí)間,可用小時(shí)、天、周、月、年等時(shí)間單位記錄,常用符號(hào)t表示。 生存時(shí)間的分布:非負(fù)、左偏。,圖1 102名黑色素瘤患者的生存時(shí)間分布,time (Month),0,5,10,15,20,25,30,35,40,45,0,10,20,30,40,完全數(shù)據(jù)(complete data):是指從觀察起點(diǎn)到發(fā)生死亡事件所經(jīng)歷的時(shí)間 ; 截尾數(shù)據(jù)(censor data):又稱刪失值或終檢值。 指期待結(jié)局發(fā)生的正確時(shí)間未知。習(xí)慣上在生存時(shí)間右上標(biāo)注“”表示 。 失訪 退出 終止,生存時(shí)間的分類,關(guān)于截尾,截尾的模式圖,隨訪開(kāi)始,“死亡”事件,失訪 死于車(chē)禍 研究截止時(shí)
5、仍存活,研究截止時(shí)點(diǎn),患者進(jìn)入期間,死亡概率(mortality probability):記為q,是指在某單位時(shí)段開(kāi)始時(shí)存活的個(gè)體在該時(shí)段內(nèi)死亡的可能性大小。 若年內(nèi)有截尾,則分母用校正人口數(shù):,生存概率(survival probability):記為p,與死亡概率相對(duì)立,表示在某單位時(shí)段開(kāi)始時(shí)存活的個(gè)體到該時(shí)段結(jié)束時(shí)仍存活的可能性大小。,生存率(survival rate):記為S(tk),是指觀察對(duì)象活過(guò)tk時(shí)刻的概率。 式中T為觀察對(duì)象的存活時(shí)間。,假定觀察對(duì)象在各個(gè)時(shí)段的生存事件獨(dú)立,生存概率分別為p1,p2pk,則根據(jù)概率乘法原理得到估計(jì)生存率的計(jì)算公式為 : S(tk)實(shí)質(zhì)上是
6、累積生存概率(cumulative probability of survival)。,生存曲線(survival curve):是指將各個(gè)時(shí)點(diǎn)的生存率在坐標(biāo)軸上連接在一起的曲線圖,用以描述生存過(guò)程。 中位生存時(shí)間(median survival time) :又稱半數(shù)生存期,是指生存率為0.5時(shí)對(duì)應(yīng)的生存時(shí)間,表示有50%的觀察對(duì)象可活這么長(zhǎng)時(shí)間。一般是采用內(nèi)插法進(jìn)行估計(jì)。,圖2 102名黑色素瘤患者的生存率估計(jì) (Kaplan-Meier估計(jì)),生 存 率,Part 1. 生存資料的統(tǒng)計(jì)描述與生存率的區(qū)間估計(jì),乘積極限法(product-limit estimates),又稱Kaplan-
7、Meier法。 生存率及其標(biāo)準(zhǔn)誤的計(jì)算 估計(jì)各時(shí)點(diǎn)總體生存率的95%可信區(qū)間 中位生存時(shí)間的計(jì)算 生存曲線繪制 適用于小樣本,是一種非參數(shù)方法。,一、未分組生存資料的統(tǒng)計(jì)描述,例14.1 某醫(yī)師采用手術(shù)療法治療12例宮頸癌患者,隨訪時(shí)間(月)記錄如下: 1 2 4 5 7 8+ 11 15 18 33+ 36 38 + 試估計(jì)各時(shí)點(diǎn)生存率及其標(biāo)準(zhǔn)誤、各時(shí)點(diǎn)總體生存率的95%可信區(qū)間、中位生存時(shí)間,并繪制生存曲線。,生存率及其標(biāo)準(zhǔn)誤的計(jì)算 本例以月為時(shí)間單位,并將t月當(dāng)作一個(gè)時(shí)點(diǎn)看待。,第(1)欄:序號(hào) 第(2)欄:將樣本生存時(shí)間t由小到大順次排列,如遇非截尾值和截尾值相同時(shí),將截尾值排在后面;
8、,第(3)欄:與生存時(shí)間t對(duì)應(yīng)的發(fā)生死亡人數(shù)dk, e.g. 生存時(shí)間為5月時(shí)有1例死亡,相應(yīng)的d5=1。截尾值對(duì)應(yīng)的患者“未死”,所以死亡人數(shù)為0,如 d6=0 ;,Q,第(4)欄:期初病例數(shù)nk,即恰好在該時(shí)刻以前尚存活的病例數(shù); e.g. k為4時(shí)對(duì)應(yīng)的n4為9,表示恰好在5月時(shí)點(diǎn)前有9人存活;,第(5)欄:各時(shí)點(diǎn)死亡概率qk,即恰好在t時(shí)點(diǎn)以前尚存活的患者在t時(shí)點(diǎn)上(第t個(gè)月)死亡的概率,其計(jì)算公式為: e.g. q4表示恰好在5月時(shí)點(diǎn)前尚存活的9例患者在5月時(shí)點(diǎn)上(實(shí)指治療后第五個(gè)月的第一天到第三十天)的死亡概率為,第(6)欄:各時(shí)點(diǎn)生存概率pk ,即恰好在t月前尚存活的觀察對(duì)象,在
9、t月時(shí)點(diǎn)繼續(xù)存活的概率。 e.g. k為4時(shí)對(duì)應(yīng)的5月生存概率p4為:,第(7)欄:各時(shí)點(diǎn)生存率S(tk),即恰好在t時(shí)點(diǎn)以前尚存活的患者活過(guò)t時(shí)點(diǎn)的概率。,對(duì)未分組資料,某時(shí)點(diǎn)生存率為小于和等于t 時(shí)刻的各時(shí)點(diǎn)生存概率的乘積。 e.g. 生存時(shí)間t為4月的生存率為:,第(8)欄:各時(shí)點(diǎn)生存率的標(biāo)準(zhǔn)誤(Greenwood) e.g. 如S(t3)的標(biāo)準(zhǔn)誤SES(t3)為,2. 總體生存率可信區(qū)間的估計(jì) 用正態(tài)近似原理估計(jì)某時(shí)點(diǎn)總體生存率的可信區(qū)間,公式為,e.g. 本例4月總體生存率的95%可信區(qū)間為 下限 上限,3. 中位生存時(shí)間的計(jì)算,采用內(nèi)插法計(jì)算如下: (711): (7t) = (0
10、.58330.4861) : (0.58330.5),4. 生存曲線 未分組資料的生存曲線也稱 Kaplan-Meier曲線 ,用以說(shuō)明生存時(shí)間與生存率之間的關(guān)系。 以生存時(shí)間t為橫軸,生存率為縱軸,繪制而成的連續(xù)型的階梯形曲線。 每個(gè)小橫線的長(zhǎng)短代表一個(gè)t時(shí)點(diǎn)到下一個(gè)t時(shí)點(diǎn)的距離; 當(dāng)最后一個(gè)時(shí)點(diǎn)的觀察對(duì)象全部死亡時(shí),曲線與橫軸相交。,圖3乘積極限法生存曲線(Kaplan-Meier曲線),描述生存時(shí)間分布(附例),對(duì)兩組分別接受了A處理和B處理的小老鼠注射某種致癌物,觀察它們直至全部死亡。記錄它們的存活天數(shù)并進(jìn)行分析,數(shù)據(jù)如下: A: 143,164,188,188,190,192,206
11、,209,213,216,220,227,230,234,246,265,304,216+,244+ B: 142,156,163,198, 205,232,232,233,233,233,233,239,240,261,280,280,296,296,353,204+,344+,The LIFETEST Procedure Stratum 1: Group = 0 Product-Limit Survival Estimates Survival Standard Number Number Days Survival Failure Error Failed Left 0.000 1.00
12、00 0 0 0 19 143.000 0.9474 0.0526 0.0512 1 18 164.000 0.8947 0.1053 0.0704 2 17 188.000 . . . 3 16 188.000 0.7895 0.2105 0.0935 4 15 190.000 0.7368 0.2632 0.1010 5 14 192.000 0.6842 0.3158 0.1066 6 13 206.000 0.6316 0.3684 0.1107 7 12 209.000 0.5789 0.4211 0.1133 8 11 213.000 0.5263 0.4737 0.1145 9
13、10 216.000 0.4737 0.5263 0.1145 10 9 216.000* . . . 10 8 220.000 0.4145 0.5855 0.1145 11 7 227.000 0.3553 0.6447 0.1124 12 6 230.000 0.2961 0.7039 0.1082 13 5 234.000 0.2368 0.7632 0.1015 14 4 244.000* . . . 14 3 246.000 0.1579 0.8421 0.0934 15 2 265.000 0.0789 0.9211 0.0728 16 1 304.000 0 1.0000 0
14、17 0 NOTE: The marked survival times are censored observations.,二、分組資料的生存分析,壽命表法(life-table method) 生存率及其標(biāo)準(zhǔn)誤 各時(shí)點(diǎn)總體生存率的95%可信區(qū)間 中位生存時(shí)間 生存曲線 適用于大樣本,是一種非參數(shù)方法。,例14.2某醫(yī)師對(duì)110例原發(fā)性肺癌患者確診后進(jìn)行隨訪,得資料見(jiàn)表14.3第(2)欄至第(4)欄,試估計(jì)各時(shí)點(diǎn)生存率及其標(biāo)準(zhǔn)誤、各時(shí)點(diǎn)總體生存率的95%可信區(qū)間、中位生存時(shí)間,并繪制生存曲線。,生存率及其標(biāo)準(zhǔn)誤的計(jì)算 本例以月為時(shí)間單位,并將t月當(dāng)作一個(gè)時(shí)點(diǎn)看待。,第(1)欄:序號(hào) 第(2
15、)欄:確診后月數(shù)tk e.g. “0”表示從確診日起不滿1月,第(3)欄:期內(nèi)截尾人數(shù)Ck ,表示確診后滿t月但未滿t+1月期間截尾的人數(shù)。 e.g. C3=1,表示確診后滿2月但未滿3月期間有1例截尾。,第(4)欄:期內(nèi)死亡人數(shù)Dk ,表示確診后滿t月但未滿t+1月期間發(fā)生死亡事件的人數(shù)。 e.g. D1 =25,表示確診后未滿1月有25例死于原發(fā)性肺癌 。,第(5)欄:期初觀察人數(shù)Lk ,指t月初尚存活的病例數(shù)。此欄自下而上累計(jì)求得,計(jì)算公式為 e.g. 如本例L8 =4,則,第(6)欄:校正人數(shù)Nk,相當(dāng)于實(shí)際觀察人月數(shù)。凡在t月內(nèi)截尾的病例都被當(dāng)作平均觀察了半月時(shí)間,其計(jì)算公式為 e.
16、g. “2”月組,,第(7)欄:死亡概率qk ,表示確診后活滿t月的病人在今后一個(gè)月內(nèi)死亡的概率,其計(jì)算公式為 e.g. ,表示確診后活滿2月的病人,在第三個(gè)月內(nèi)死亡的概率為0.4959,第(8)欄:生存概率pk ,表示確診后活滿t月的病人在今后一個(gè)月內(nèi)存活的概率,其計(jì)算公式為 e.g.,第(9)欄:t月生存率,表示確診后活滿t月的概率,其計(jì)算公式為,第(10)欄:生存率的標(biāo)準(zhǔn)誤,其計(jì)算公式為,3. 中位生存時(shí)間的計(jì)算,采用內(nèi)插法計(jì)算如下: (23): (2t) = (0.57650.2906) : (0.57650.5),4. 生存曲線 分組資料的壽命表法生存曲線 兩個(gè)時(shí)點(diǎn)生存率用直線連接;
17、 各個(gè)組段對(duì)應(yīng)的生存率應(yīng)點(diǎn)在各組段的上限處 ; 當(dāng)最后一個(gè)時(shí)點(diǎn)的觀察對(duì)象全部死亡時(shí),曲線與橫軸相交。,圖14.2壽命表法生存曲線,計(jì)算相似; 不同之處: 未分組資料生存率的計(jì)算是以觀察人數(shù)為計(jì)算單位,生存時(shí)間未分組; 分組資料的生存率的計(jì)算是以觀察人時(shí)數(shù)為單位,生存時(shí)間等距離分組。,分組資料與未分組資料的生存率計(jì)算比較:,Part 2. 生存曲線比較的假設(shè)檢驗(yàn),生存過(guò)程的比較,非參數(shù)方法 參數(shù)方法 時(shí)序(log-rank)檢驗(yàn) 分布參數(shù)檢驗(yàn) 分層時(shí)序檢驗(yàn) Gehan檢驗(yàn) 廣義Wilcoxon檢驗(yàn) Mantel-Haenszel檢驗(yàn),一、對(duì)數(shù)秩檢驗(yàn)(log-rank test),基本思想:假定兩
18、總體生存曲線無(wú)差別,則根據(jù)兩種處理不同生存時(shí)間的期初觀察人數(shù)和理論死亡概率計(jì)算出的理論死亡數(shù),與實(shí)際死亡數(shù)應(yīng)相差不大,否則無(wú)效假設(shè)不成立,認(rèn)為兩條生存曲線差異有統(tǒng)計(jì)學(xué)意義。,其檢驗(yàn)統(tǒng)計(jì)量的計(jì)算公式如下: v=組數(shù)1式中,A為實(shí)際死亡數(shù),T為理論死亡數(shù)。,例14.322例肺癌患者經(jīng)隨機(jī)化分配到放療組和放化療聯(lián)合組,從緩解出院日開(kāi)始隨訪,隨訪時(shí)間(月)如下,試比較放療組(甲)和放化療聯(lián)合組(乙)患者的生存曲線有無(wú)差別。 放療組:1 2 3 5 6 9+ 11 13 16 26 37+ 放化療聯(lián)合組: 10 11+ 14 18 22 22 26 32 38 40+ 42 +,圖14.3放療組和放化療
19、聯(lián)合組患者的生存曲線,甲組,乙組,1. 建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn) H0:放療組與放化療聯(lián)合組患者的生存曲線位置相同 H1:放療組與放化療聯(lián)合組患者的生存曲線位置不同 0.05,2. 計(jì)算統(tǒng)計(jì)量 值 (1) 將兩組患者按生存時(shí)間統(tǒng)一從小到大排序,并標(biāo)明組別、死亡數(shù)。 注:生存時(shí)間相同的甲、乙兩組列在同一行;某時(shí)間點(diǎn)既有完全數(shù)據(jù)又有截尾數(shù)據(jù),截尾數(shù)據(jù)排在后面。,(2) 列出各時(shí)點(diǎn)期初病例數(shù),見(jiàn)表14.4第(5)(7)欄。 (3) 分別計(jì)算甲、乙兩組各時(shí)點(diǎn)的理論死亡數(shù),見(jiàn)表14.4第(8)(9)欄。 甲組各時(shí)點(diǎn)的理論死亡數(shù) =(該時(shí)點(diǎn)病死數(shù)期初病例總數(shù))甲組期初病例數(shù) =(4)/(7)(5) =(
20、4)(5)/(7),表14.5 生存時(shí)間t=1對(duì)應(yīng)的四格表,(4) 求出甲組和乙組理論死亡數(shù)的合計(jì)值分別為5.1282、11.8718。 表14.6對(duì)數(shù)秩檢驗(yàn)總結(jié)表,v=211,3. 求出P值,作出推斷結(jié)論 查附表5, 界值表,得P0.05, 按 =0.05水準(zhǔn)拒絕H0,接受H1,又因從圖14.3可直觀地看出放化療聯(lián)合組的生存曲線位置較高,故可認(rèn)為放化療聯(lián)合治療肺癌的效果較好。,圖14.3放療組和放化療聯(lián)合組患者的生存曲線,甲組,乙組,二、Gehan比分檢驗(yàn)(Gehan score test),僅用于兩樣本生存曲線的比較。 基本原理:其檢驗(yàn)統(tǒng)計(jì)量V值的抽樣分布近似均數(shù)為0、標(biāo)準(zhǔn)誤為 的正態(tài)分布
21、,故采用正態(tài)近似法作假設(shè)檢驗(yàn)。,基本計(jì)算步驟,例14.3 1. 建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn),2. 計(jì)算統(tǒng)計(jì)量值,將兩組患者按生存時(shí)間統(tǒng)一從小到大排序,并標(biāo)明組別、死亡數(shù) ; 計(jì)算R1、R2及(R1R2) 值; 求Gehan比分總計(jì)V ;,表14.7Gehan比分檢驗(yàn)計(jì)算表,(4) 求u值 式中,n1和n2分別為兩組樣本含量。,本例u值為,3. 求出P值,作出推斷結(jié)論 查附表2,t界值表(自由度),得P0.05,按 =0.05水準(zhǔn),拒絕H0,接受H1,又因乙組V值為正,故可認(rèn)為放化療聯(lián)合治療肺癌的效果較好。,生存曲線比較的假設(shè)檢驗(yàn)的注意事項(xiàng):,方法選擇 應(yīng)用條件 處理措施優(yōu)劣的判斷,1. 方法選擇 本例上述兩種假設(shè)檢驗(yàn)方法的結(jié)論一致,但在應(yīng)用上有差別。Gehan比分檢驗(yàn)僅用于未分組資料兩個(gè)樣本生存曲線的比較,對(duì)數(shù)秩檢驗(yàn)既可用于兩個(gè)樣本生存曲線的比較,又可用于多個(gè)樣本生存曲線的比較;既可用于未分組資料生存曲線的比較,又可用于分
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高職服裝款式設(shè)計(jì)(設(shè)計(jì)基礎(chǔ))試題及答案
- 2026年化工分析(電化學(xué)分析技術(shù))試題及答案
- 2025年高職(財(cái)務(wù)管理綜合實(shí)訓(xùn))投資管理實(shí)操試題及答案
- 2025年中職第三學(xué)年(防火墻技術(shù))網(wǎng)絡(luò)安全防護(hù)測(cè)試題及答案
- 2025年中職工業(yè)互聯(lián)網(wǎng)技術(shù)(工業(yè)互聯(lián)網(wǎng)基礎(chǔ))試題及答案
- 2025年中職第二學(xué)年(家政服務(wù)與管理)家庭膳食搭配實(shí)務(wù)測(cè)試題及答案
- 2025年中職(會(huì)計(jì))成本核算綜合試題及答案
- 2025年大學(xué)第四學(xué)年(服裝設(shè)計(jì)與工程)服裝綜合設(shè)計(jì)試題及答案
- 2026年粉底銷(xiāo)售(客戶接待)試題及答案
- 2025年高職統(tǒng)計(jì)學(xué)(統(tǒng)計(jì)教育心理學(xué)案例分析)試題及答案
- 遺產(chǎn)分割協(xié)議書(shū)
- 京瓷哲學(xué)手冊(cè)樣本
- 形神拳動(dòng)作名稱與圖解
- 博士生入學(xué)復(fù)試面試報(bào)告?zhèn)€人簡(jiǎn)歷介紹含內(nèi)容模板兩篇
- 食品工廠設(shè)計(jì) 課件 第二章 廠址選擇
- 2023年生產(chǎn)車(chē)間各類文件匯總
- WORD版A4橫版密封條打印模板(可編輯)
- 2013標(biāo)致508使用說(shuō)明書(shū)
- 中考滿分(合集15篇)
- 《大數(shù)據(jù)營(yíng)銷(xiāo)》-課程教學(xué)大綱
- GB/T 18993.1-2020冷熱水用氯化聚氯乙烯(PVC-C)管道系統(tǒng)第1部分:總則
評(píng)論
0/150
提交評(píng)論