SAS的生存分析(正式)課件_第1頁(yè)
SAS的生存分析(正式)課件_第2頁(yè)
SAS的生存分析(正式)課件_第3頁(yè)
SAS的生存分析(正式)課件_第4頁(yè)
SAS的生存分析(正式)課件_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

學(xué)習(xí)目標(biāo)了解生存分析的應(yīng)用范圍和數(shù)據(jù)特點(diǎn);熟悉常見(jiàn)的生存時(shí)間分布規(guī)律的函數(shù);掌握生存率的兩種估計(jì)方法:乘積極限法和壽命表法;掌握估計(jì)和比較生存函數(shù)的SAS程序;Cox回歸的形式、數(shù)據(jù)格式、應(yīng)用和SAS程序。學(xué)習(xí)目標(biāo)了解生存分析的應(yīng)用范圍和數(shù)據(jù)特點(diǎn);生存分析簡(jiǎn)介在醫(yī)學(xué)研究中,常常用隨訪(fǎng)的方式來(lái)研究事物發(fā)展的規(guī)律。例如,了解某藥物的療效,了解某儀器設(shè)備的使用壽命,了解手術(shù)后的存活時(shí)間等等。這種研究的特點(diǎn)是追蹤研究的現(xiàn)象都要經(jīng)過(guò)一段時(shí)間,統(tǒng)計(jì)學(xué)上將這段時(shí)間稱(chēng)為生存時(shí)間。生存分析就是用來(lái)研究生存時(shí)間的分布規(guī)律以及生存時(shí)間和相關(guān)因素之間關(guān)系的一種統(tǒng)計(jì)分析方法。生存分析在醫(yī)學(xué)科學(xué)研究中具有廣泛而重要的應(yīng)用價(jià)值,它對(duì)人群壽命的研究,各種慢性疾病的現(xiàn)場(chǎng)追蹤研究,臨床療效試驗(yàn)和動(dòng)物試驗(yàn)等研究中隨訪(fǎng)資料的處理起著舉足輕重的作用。生存分析簡(jiǎn)介在醫(yī)學(xué)研究中,常常用隨訪(fǎng)的方式來(lái)研究事物發(fā)展的生存數(shù)據(jù)生存數(shù)據(jù),指的是生存時(shí)間以及與生存時(shí)間有關(guān)聯(lián)的一組獨(dú)立變量。這里主要解釋與生存時(shí)間有關(guān)的幾個(gè)概念。在生存分析中將生存時(shí)間定義為從某起始事件起到某終止事件為止所經(jīng)歷的時(shí)間跨度。例如,在臨床研究中,冠心病患者在兩次發(fā)作之間的時(shí)間間隔;在流行病學(xué)研究中,從開(kāi)始接觸危險(xiǎn)因素到發(fā)病所經(jīng)歷的時(shí)間;在動(dòng)物研究中,從開(kāi)始給藥到發(fā)生死亡所經(jīng)歷的時(shí)間。所以,生存時(shí)間也稱(chēng)為失效時(shí)間。生存數(shù)據(jù)生存數(shù)據(jù),指的是生存時(shí)間以及與生存時(shí)間有關(guān)聯(lián)的一組生存數(shù)據(jù)生存時(shí)間資料與多元線(xiàn)性回歸資料很相似,只不過(guò)因變量通常為觀測(cè)對(duì)象生存的時(shí)間,常用t來(lái)表示。當(dāng)然,生存時(shí)間是廣義的,可以指在通常意義下生物體的生存時(shí)間、也可以指所關(guān)心的某現(xiàn)象(如疾病治愈后、合格品使用后)持續(xù)的時(shí)間。若生存時(shí)間是準(zhǔn)確觀測(cè)到的,則稱(chēng)為完全數(shù)據(jù),它提供的關(guān)于生存時(shí)間的信息是完整確切的,也就是說(shuō)它準(zhǔn)確地度量了觀察對(duì)象實(shí)際生存時(shí)間。但是生存資料的一個(gè)明顯特點(diǎn)是:所收集的資料中常常包含不完全數(shù)據(jù),也稱(chēng)為截尾數(shù)據(jù)、刪失數(shù)據(jù)。包括刪失數(shù)據(jù)的資料,稱(chēng)為刪失資料(或截尾數(shù)據(jù))。它提供的關(guān)于生存時(shí)間的信息是不完整不確切的,也就是說(shuō)它沒(méi)有準(zhǔn)確地度量觀察對(duì)象實(shí)際生存的時(shí)間。生存數(shù)據(jù)生存時(shí)間資料與多元線(xiàn)性回歸資料很相似,只不過(guò)因變量生存數(shù)據(jù)導(dǎo)致數(shù)據(jù)刪失有很多原因,較常見(jiàn)的為失訪(fǎng)和研究截止。由隨機(jī)因素引起的,稱(chēng)為隨機(jī)刪失;若事先就定了截止日期,則稱(chēng)為定時(shí)刪失;若事先就定了觀察完多少例就截止研究,則稱(chēng)為定數(shù)刪失。在表達(dá)刪失數(shù)據(jù)時(shí),常在其右上角放一個(gè)“+”號(hào);而用SAS軟件分析時(shí),常在其前放一個(gè)“-”號(hào)或產(chǎn)生1個(gè)指示變量(例如,C=0表示刪失數(shù)據(jù)、C=1表示完全數(shù)據(jù)),便于計(jì)算時(shí)區(qū)別對(duì)待。為了使數(shù)據(jù)的表達(dá)與計(jì)算在形式上統(tǒng)一起來(lái),本章一律用負(fù)數(shù)表示刪失數(shù)據(jù),因生存時(shí)間不可能為負(fù)值,故不會(huì)產(chǎn)生混淆。生存數(shù)據(jù)導(dǎo)致數(shù)據(jù)刪失有很多原因,較常見(jiàn)的為失訪(fǎng)和研究截止。由生存數(shù)據(jù)一般地,截尾數(shù)據(jù)可分為右截尾、左截尾、區(qū)間截尾等不同類(lèi)型。右截尾數(shù)據(jù)表示觀察對(duì)象至少存活到時(shí)刻t,即生存時(shí)間的上界是未知的。右截尾數(shù)據(jù)一般出現(xiàn)在隨訪(fǎng)過(guò)程中某些觀察對(duì)象失訪(fǎng)或死于其它原因,或在規(guī)定的研究過(guò)程結(jié)束時(shí)觀察對(duì)象的終止事件還未發(fā)生。左截尾數(shù)據(jù)表示觀察對(duì)象至多存活到時(shí)刻t,即生存時(shí)間的上界是已知的,但確切的生存時(shí)間是未知的。區(qū)間截尾數(shù)據(jù)表示觀察對(duì)象至少存活到t1時(shí)刻且至多存活到t2時(shí)刻。生存數(shù)據(jù)一般地,截尾數(shù)據(jù)可分為右截尾、左截尾、區(qū)間截尾等不同生存數(shù)據(jù)對(duì)于截尾數(shù)據(jù),既不能簡(jiǎn)單地棄之,需要采取一些技術(shù)處理。專(zhuān)門(mén)處理這種資料的統(tǒng)計(jì)方法,稱(chēng)為生存分析。應(yīng)為拋棄截尾數(shù)據(jù)不僅損失了樣本量,最重要的是在這些截尾數(shù)據(jù)中,特別是右截尾數(shù)據(jù)大部分是生存時(shí)間較長(zhǎng)者的數(shù)據(jù),損失掉這一部分觀察對(duì)象的信息,分析結(jié)果一定是片面或不穩(wěn)定的。截尾數(shù)據(jù)的存在是生存數(shù)據(jù)與普通數(shù)據(jù)的根本區(qū)別。處理截尾數(shù)據(jù)是生存分析的一個(gè)重要特點(diǎn),本章介紹的生存分析主要處理右截尾數(shù)據(jù)。生存數(shù)據(jù)對(duì)于截尾數(shù)據(jù),既不能簡(jiǎn)單地棄之,需要采取一些技術(shù)處理生存時(shí)間函數(shù)描述生存時(shí)間分布規(guī)律的函數(shù)統(tǒng)稱(chēng)為生存時(shí)間函數(shù)。常用的有生存函數(shù)、死亡函數(shù)、死亡密度函數(shù)和風(fēng)險(xiǎn)函數(shù)。生存時(shí)間函數(shù)描述生存時(shí)間分布規(guī)律的函數(shù)統(tǒng)稱(chēng)為生存時(shí)間函數(shù)。生存函數(shù)生存函數(shù)也稱(chēng)為生存概率或累積生存率,它表示觀察對(duì)象生存時(shí)間T大于某時(shí)刻t的概率常用S(t)表示:在具體問(wèn)題中,該函數(shù)在t時(shí)刻的取值可用下式來(lái)估計(jì)∶

S(t)≈生存時(shí)間長(zhǎng)于t的觀察對(duì)象人數(shù)/觀察對(duì)象總數(shù)顯然,S(t)是一個(gè)隨時(shí)間增加而下降的函數(shù),它表示觀察對(duì)象隨訪(fǎng)到t時(shí)刻的累積生存率。生存函數(shù)生存函數(shù)也稱(chēng)為生存概率或累積生存率,它表示觀察對(duì)象生死亡函數(shù)觀察對(duì)象的生存時(shí)間T不大于某時(shí)刻t的概率稱(chēng)為死亡函數(shù),又稱(chēng)為死亡概率函數(shù)簡(jiǎn)稱(chēng)為死亡概率,它表示一個(gè)體從開(kāi)始觀察起到時(shí)刻t為止的死亡概率,常用F(t)表示:顯然,F(xiàn)(t)是一個(gè)隨時(shí)間增加而上升的函數(shù),它表示觀察對(duì)象隨訪(fǎng)到t時(shí)刻的累積死亡率。死亡函數(shù)觀察對(duì)象的生存時(shí)間T不大于某時(shí)刻t的概率稱(chēng)為死亡函數(shù)死亡密度函數(shù)死亡密度函數(shù)簡(jiǎn)稱(chēng)為密度函數(shù),觀察對(duì)象在某時(shí)刻t的瞬時(shí)死亡率,常用f(t)表示:該函數(shù)表示觀察對(duì)象死于(t,t+△t)小區(qū)間內(nèi)的概率的極限。在具體問(wèn)題中,該函數(shù)在t時(shí)刻的取值可用下式來(lái)估計(jì)∶

f(t)≈t時(shí)刻開(kāi)始的區(qū)間內(nèi)(t,t+△t)的死亡人數(shù)/(觀察總?cè)藬?shù)×區(qū)間寬度)

死亡密度函數(shù)死亡密度函數(shù)簡(jiǎn)稱(chēng)為密度函數(shù),觀察對(duì)象在某時(shí)刻t的風(fēng)險(xiǎn)函數(shù)它表示已存活到時(shí)刻t的觀察對(duì)象在時(shí)刻t的瞬時(shí)死亡率,又稱(chēng)危險(xiǎn)函數(shù),常用h(t)表示:該函數(shù)表示一個(gè)已存活到時(shí)刻t的觀察對(duì)象死于(t,t+△t)小區(qū)間內(nèi)的概率的極限,它實(shí)際上是一個(gè)條件瞬時(shí)死亡率。在具體問(wèn)題中,該函數(shù)在t時(shí)刻的取值可用下式來(lái)估計(jì):

風(fēng)險(xiǎn)函數(shù)它表示已存活到時(shí)刻t的觀察對(duì)象在時(shí)刻t的瞬時(shí)死亡率,均數(shù)、中位數(shù)和半數(shù)生存期除了上述的生存時(shí)間函數(shù)外,均數(shù)、中位數(shù)、半數(shù)生存期等也反映一組生存時(shí)間平均水平常用的統(tǒng)計(jì)指標(biāo)。由于生存資料多呈正偏態(tài)分布,更適宜選用百分位數(shù),包括中位數(shù)指標(biāo)。半數(shù)生存期,指壽命的中位數(shù),表示有且只有50%的觀察對(duì)象可以活這么長(zhǎng)時(shí)間。由于截尾數(shù)據(jù)的存在,半數(shù)生存期的計(jì)算不同于普通的中位數(shù),它可應(yīng)用生存函數(shù)曲線(xiàn)圖或生存函數(shù)公式,令生存率等于50%,然后推算生存時(shí)間。均數(shù)、中位數(shù)和半數(shù)生存期除了上述的生存時(shí)間函數(shù)外,均數(shù)、中均數(shù)、中位數(shù)和半數(shù)生存期總之,生存分析主要包括四個(gè)方面的內(nèi)容:①描述生存過(guò)程,即研究生存時(shí)間的分布規(guī)律;②比較生存過(guò)程,即研究?jī)山M或多組生存時(shí)間的分布規(guī)律,并進(jìn)行比較;③分析危險(xiǎn)因素,即研究危險(xiǎn)因素對(duì)生存過(guò)程的影響;④建立數(shù)學(xué)模型,即將生存時(shí)間與相關(guān)危險(xiǎn)因素的依存關(guān)系用一個(gè)數(shù)學(xué)式子表示出來(lái)。均數(shù)、中位數(shù)和半數(shù)生存期總之,生存分析主要包括四個(gè)方面的內(nèi)生存分析的基本方法統(tǒng)計(jì)描述非參數(shù)檢驗(yàn)半?yún)?shù)模型回歸分析參數(shù)模型回歸分析生存分析的基本方法統(tǒng)計(jì)描述統(tǒng)計(jì)描述包括求生存時(shí)間的分位數(shù)、中數(shù)生存期、平均數(shù)、生存函數(shù)的估計(jì)、判斷生存時(shí)間的圖示法,不對(duì)所分析的數(shù)據(jù)作出任何統(tǒng)計(jì)推斷結(jié)論。用描述法進(jìn)行生存分析的基本方法是根據(jù)樣本觀察值提供的信息,直接用上述給出的估計(jì)公式計(jì)算出在每一時(shí)間點(diǎn)或每一個(gè)時(shí)間區(qū)間上的生存函數(shù)、死亡函數(shù)、風(fēng)險(xiǎn)函數(shù)以及計(jì)算出生存時(shí)間的百分位數(shù)、平均數(shù)、半數(shù)生存期等,并采用列表或繪圖的形式顯示生存時(shí)間的分布規(guī)律。統(tǒng)計(jì)描述包括求生存時(shí)間的分位數(shù)、中數(shù)生存期、平均數(shù)、生存函統(tǒng)計(jì)描述用描述法估計(jì)生存時(shí)間分布規(guī)律的優(yōu)點(diǎn)是方法簡(jiǎn)單且對(duì)數(shù)據(jù)的分布無(wú)要求,但它的缺點(diǎn)是①不能比較兩組或多組生存時(shí)間分布函數(shù)的區(qū)別;②不能分析危險(xiǎn)因素對(duì)生存時(shí)間的影響;③不能建立生存時(shí)間與危險(xiǎn)因素之間的數(shù)量依存關(guān)系模型。統(tǒng)計(jì)描述用描述法估計(jì)生存時(shí)間分布規(guī)律的優(yōu)點(diǎn)是方法簡(jiǎn)單且對(duì)數(shù)據(jù)非參數(shù)檢驗(yàn)檢驗(yàn)分組變量各水平所對(duì)應(yīng)的生存曲線(xiàn)是否一致,對(duì)生存時(shí)間的分布沒(méi)有要求,并且檢驗(yàn)危險(xiǎn)因素對(duì)生存時(shí)間的影響。非常數(shù)法可以用來(lái)完成:①估計(jì)生存函數(shù);②比較兩組或多組生存函數(shù);③分析危險(xiǎn)因素對(duì)生存時(shí)間的影響。缺點(diǎn)是不能建立生存時(shí)間與危險(xiǎn)因素之間的數(shù)量依存關(guān)系的數(shù)學(xué)模型。常用的方法有乘積極限法(PL法)和壽命表法(LT法)。非參數(shù)檢驗(yàn)檢驗(yàn)分組變量各水平所對(duì)應(yīng)的生存曲線(xiàn)是否一致,對(duì)生半?yún)?shù)模型回歸分析在特定的假設(shè)之下,建立生存時(shí)間隨多個(gè)危險(xiǎn)因素變化的回歸方程。半常數(shù)法不需要對(duì)生存時(shí)間的分布作出假定,但卻可以通過(guò)一個(gè)模型來(lái)分析生存時(shí)間的分布規(guī)律,以及危險(xiǎn)因素對(duì)生存時(shí)間的影響。這種方法的代表是Cox比例風(fēng)險(xiǎn)回歸分析法,它兼有非常數(shù)法和參數(shù)法的優(yōu)點(diǎn),是生存分析中最重要的模型分析法。它在表達(dá)形式上與參數(shù)模型相似,但在對(duì)模型中各參數(shù)進(jìn)行估計(jì)時(shí)又不依賴(lài)于特定分布的假設(shè),所以又稱(chēng)其為半?yún)?shù)模型。半?yún)?shù)模型回歸分析在特定的假設(shè)之下,建立生存時(shí)間隨多個(gè)危險(xiǎn)參數(shù)模型回歸分析已知生存時(shí)間服從特定的參數(shù)模型時(shí),擬合相應(yīng)的參數(shù)模型,更準(zhǔn)確地分析確定變量之間的變化規(guī)律。用參數(shù)法進(jìn)行生存分析的基本方法是根據(jù)樣本觀察值來(lái)估計(jì)假定的分布模型中的參數(shù),獲得生存時(shí)間的概率分布模型。用參數(shù)法進(jìn)行生存分析需要事先知道生存時(shí)間的分布,但它的優(yōu)點(diǎn)是:①比較兩組或多組生存時(shí)間分布函數(shù);②分析危險(xiǎn)因素對(duì)生存時(shí)間的影響;③建立生存時(shí)間與危險(xiǎn)因素之間依存關(guān)系的模型。生存時(shí)間經(jīng)常服從的分布有指數(shù)分布、Weibull分布、對(duì)數(shù)正態(tài)分布、對(duì)數(shù)Logistic回歸和Gamma分布。參數(shù)模型回歸分析已知生存時(shí)間服從特定的參數(shù)模型時(shí),擬合相應(yīng)非參數(shù)分析方法SAS程序SAS系統(tǒng)中,LIFETEST過(guò)程提供非參數(shù)分析方法,用乘積極限法和壽命表法估計(jì)生存率和中位生存時(shí)間等;用對(duì)數(shù)秩檢驗(yàn)(Log-ranktest)、Wilcoxon檢驗(yàn)和似然比檢驗(yàn)等做分組比較。該過(guò)程主要用于估計(jì)生存率及進(jìn)行單因素分析。LIFETEST過(guò)程的語(yǔ)法格式如下:

PROCLIFETEST<options>;TIME生存時(shí)間變量*截尾指示變量(數(shù)字);TEST<分組變量名列>;STRATA<分組變量名列>;FREQ<變量名列>;BY<變量名列>;]Run;非參數(shù)分析方法SAS程序SAS系統(tǒng)中,LIFETEST過(guò)程非參數(shù)分析方法SAS程序DATA=數(shù)據(jù)集:規(guī)定PROCFREQ語(yǔ)句使用的數(shù)據(jù)集;METHOD=方法:指定估計(jì)生存率所用的方法;①PL,要求用乘積極限法(即Kaplam-Meier法)估計(jì)生存率并計(jì)算中位生存時(shí)間等,為缺省方法。②LT,要求用壽命表法估計(jì)生存率等。③INTERVALS=(初值TO終值BY步長(zhǎng))只能在指定分析方法為壽命表法時(shí)使用。用壽命表法分析時(shí),程序會(huì)自動(dòng)給定生存時(shí)間的區(qū)間。如果人為規(guī)定生存時(shí)間的分組區(qū)間,則需用該選項(xiàng)指定。步長(zhǎng)的缺省值為1。非參數(shù)分析方法SAS程序DATA=數(shù)據(jù)集:規(guī)定PROCF非參數(shù)分析方法SAS程序WIDTH=寬度:指定用LT法的生存時(shí)間區(qū)間的寬度。PLOTS=繪圖類(lèi)型:要求輸出生存分析圖??晒┹敵龅膱D形有:①S,對(duì)生存函數(shù)S(t)做圖,橫、縱坐標(biāo)分別為t、S(t)。②LS:對(duì)-LOGS(t)做圖,橫、縱坐標(biāo)分別為t、-LOGS(t)。③LLS:對(duì)LOG(-LOGS(t))做圖,橫、縱坐標(biāo)分別為L(zhǎng)OG(t)、LOG(-LOGS(t))。④H:對(duì)風(fēng)險(xiǎn)函數(shù)做圖,橫、縱坐標(biāo)分別為t、H(t)。非參數(shù)分析方法SAS程序WIDTH=寬度:指定用LT法的生非參數(shù)分析方法SAS程序NOTABLE:指令不輸出生存函數(shù)估計(jì)結(jié)果,只輸出生存時(shí)間的截尾數(shù)據(jù)和完全數(shù)據(jù)的個(gè)數(shù)以及散點(diǎn)圖和檢驗(yàn)結(jié)果。TIME語(yǔ)句用于定義生存時(shí)間和截尾指示變量。對(duì)截尾指示變量可以指定發(fā)生失效事件的數(shù)值,默認(rèn)失效事件用0來(lái)表示,截尾事件用1來(lái)表示。非參數(shù)分析方法SAS程序NOTABLE:指令不輸出生存函數(shù)非參數(shù)分析方法SAS程序STRATA語(yǔ)句定義生存率比較的分組變量,TEST語(yǔ)句定義生存率比較的分組變量或協(xié)變量。STRATA語(yǔ)句在這里的作用和BY語(yǔ)句類(lèi)似,都是要求按分組變量名列進(jìn)行分析,在計(jì)算生存率時(shí)各組分開(kāi)計(jì)算。TEST語(yǔ)句定義需檢驗(yàn)的變量,即生存時(shí)間與該變量是否有關(guān),如果它后面定義的變量為數(shù)值變量,則把該變量當(dāng)作協(xié)變量檢驗(yàn)與生存時(shí)間的關(guān)系。如果它定義的為分組變量,則分組比較生存時(shí)間有無(wú)差別。非參數(shù)分析方法SAS程序STRATA語(yǔ)句定義生存率比較的分例題1-生存率計(jì)算為了比較不同手術(shù)方法治療腎上腺腫瘤的療效,某研究者隨機(jī)將43例病人分成兩組,甲組23例、乙組20例的生存時(shí)間(月)如下所示:甲組:1,3,5(3),6(3),7,8,10(2),14+,17,19+,20+,22+,26+,31+,34,

34+,44,59乙組:1(2),2,3(2),4(3),

6(2),8,9(2),10,11,12,13,15,17,18其中有“+”者是刪失數(shù)據(jù),表示病人仍生存或失訪(fǎng),括號(hào)內(nèi)為重復(fù)死亡數(shù)。試計(jì)算甲組的生存率與標(biāo)準(zhǔn)誤。例題1-生存率計(jì)算為了比較不同手術(shù)方法治療腎上腺腫瘤的療效,例題2-壽命表法某研究者隨訪(fǎng)收集了某地男性心絞痛患者2418例,試計(jì)算該地男性心絞痛患者的生存率及其標(biāo)準(zhǔn)誤。例題2-壽命表法某研究者隨訪(fǎng)收集了某地男性心絞痛患者2418例題3-log-rank檢驗(yàn)試比較甲、乙兩種手術(shù)方式的生存率有無(wú)差別?例題3-log-rank檢驗(yàn)試比較甲、乙兩種手術(shù)方式的生存率Cox模型像通常的回歸分析一樣,人們也希望能建立起生存時(shí)間(因變量或反應(yīng)變量)隨危險(xiǎn)因素(自變量或協(xié)變量)變化的回歸方程,以便對(duì)危險(xiǎn)因素的作用大小有一個(gè)全面的了解和掌握、并根據(jù)危險(xiǎn)因素的不同取值對(duì)生存概率進(jìn)行預(yù)測(cè)。由于很難獲得準(zhǔn)確的生存時(shí)間,前述目的較難直接實(shí)現(xiàn)。1972年Cox提出了比例危險(xiǎn)模型,簡(jiǎn)稱(chēng)為Cox模型。由于此模型在表達(dá)形式上與參數(shù)模型相似,但在對(duì)模型中各參數(shù)進(jìn)行估計(jì)時(shí)卻不依賴(lài)于特定的假設(shè),所以又稱(chēng)為半?yún)?shù)模型。Cox模型像通常的回歸分析一樣,人們也希望能建立起生存時(shí)間Cox模型Cox模型是目前生存分析多因素預(yù)后評(píng)價(jià)中較好的統(tǒng)計(jì)分析方法,醫(yī)學(xué)上經(jīng)常遇到“時(shí)間-反應(yīng)”類(lèi)型資料。如生命現(xiàn)象生存期、疾病潛伏期、藥物試驗(yàn)的生效時(shí)間等。這種類(lèi)型的資料可以用各種參數(shù)或非參數(shù)方法進(jìn)行分析,但都有一定的局限性。Cox模型以半?yún)?shù)方式出現(xiàn),適用于許多分布未知的資料和多因素分析,可以在眾多預(yù)后因素共存的情況下,排除混雜因子的影響,提高預(yù)后分析質(zhì)量,并能處理截尾數(shù)據(jù)。此模型的適用面很寬,在生存分析中占有特殊的地位。Cox模型Cox模型是目前生存分析多因素預(yù)后評(píng)價(jià)中較好的統(tǒng)計(jì)Cox模型設(shè)是影響生存時(shí)間t的k個(gè)危險(xiǎn)因素。設(shè)hi(t)為第i名受試者在時(shí)刻t的風(fēng)險(xiǎn)率,即t時(shí)刻外后一瞬間的死亡速率。又設(shè)h0(t)表示不受危險(xiǎn)因素x的影響下,在時(shí)刻t的風(fēng)險(xiǎn)率,又稱(chēng)為基準(zhǔn)風(fēng)險(xiǎn)率或基準(zhǔn)函數(shù)。其模型的具體形式為:

hi(t)=h0(t)exp(β1xi1+β2xi2+…+βmxim)式中hi(t)為第i名受試者生存到t時(shí)刻的危險(xiǎn)率函數(shù),h0(t)是當(dāng)所有危險(xiǎn)因素(即xij=0)不存在時(shí)的基礎(chǔ)危險(xiǎn)率函數(shù),X=(xi1,xi2,…,xim)'是可能與生存時(shí)間有關(guān)的m個(gè)危險(xiǎn)因素所構(gòu)成的向量。Cox模型設(shè)是影響生存時(shí)間t的k個(gè)危險(xiǎn)因素。設(shè)hi(t)為第Cox模型

ln[hi(t)/h0(t)]=β1xi1+β2xi2+…+βmxim

此式表明:各危險(xiǎn)因素與回歸系數(shù)的線(xiàn)性組合就是第i名受試者的相對(duì)危險(xiǎn)率函數(shù)的自然對(duì)數(shù)值。再設(shè)有i、j兩個(gè)受試者,其危險(xiǎn)因素向量分別為X1與X2,不難得出他們的相對(duì)危險(xiǎn)率的自然對(duì)數(shù)為:

ln[hi(t)/h0(t)]=β1(xi1-xj1)+β2(xi2-xj2)即利用“具有某預(yù)后因素向量的受試者的死亡風(fēng)險(xiǎn)與不具有該預(yù)后因素向量的受試者的死亡風(fēng)險(xiǎn)在所有時(shí)間上都保持一個(gè)恒定比例”的假設(shè),巧妙地獲得了各時(shí)間點(diǎn)上2個(gè)受試者相對(duì)危險(xiǎn)率函數(shù)的估計(jì)值。Cox模型ln[hi(t)/h0(t)]=β1xi1+β2Cox模型然而,當(dāng)資料不滿(mǎn)足上述假設(shè)時(shí),即有些危險(xiǎn)因素作用的強(qiáng)度是隨時(shí)間而變化的,2個(gè)受試者的危險(xiǎn)率函數(shù)之比(相對(duì)危險(xiǎn))隨時(shí)間而改變,就應(yīng)改用時(shí)變協(xié)變量模型,也稱(chēng)為非比例危險(xiǎn)模型。當(dāng)只有一個(gè)危險(xiǎn)因素時(shí),其模型的具體形式為:

hi(t)=h0(t)exp[βxi+γ(xiti)]式中ti為第i個(gè)受試者的生存時(shí)間。上述各式中的回歸系數(shù)需用最大似然法進(jìn)行估計(jì),一旦有了危險(xiǎn)率函數(shù)的估計(jì)值,再利用生存時(shí)間函數(shù)之間的相互關(guān)系,可獲得其他生存時(shí)間函數(shù)的估計(jì)值。Cox模型然而,當(dāng)資料不滿(mǎn)足上述假設(shè)時(shí),即有些危險(xiǎn)因素作用的Cox模型中參數(shù)意義的解釋對(duì)于一元Cox模型,如果因素x的取值為1和0,那么,受x影響與不受x影響的相對(duì)風(fēng)險(xiǎn)是:對(duì)于一元Cox模型,如果因素x是連續(xù)變量,那么,表示相鄰水平的風(fēng)險(xiǎn)率之比。多余多元Cox模型,表示其它因素不變的情況下,因素xi相鄰水平的風(fēng)險(xiǎn)率之比(相對(duì)風(fēng)險(xiǎn)率)。Cox模型中參數(shù)意義的解釋對(duì)于一元Cox模型,如果因素x的Cox模型中參數(shù)意義的解釋例如,高血壓(x1)和高血脂(x2)對(duì)冠心病的發(fā)病風(fēng)險(xiǎn)率的Cox模型是:其中,h0(t)表示既沒(méi)有高血壓(x1=0)也沒(méi)有高血脂(x2=0)的研究對(duì)象在時(shí)刻t的發(fā)病風(fēng)險(xiǎn)率。Cox模型中參數(shù)意義的解釋例如,高血壓(x1)和高血脂(x2Cox模型中參數(shù)意義的解釋由此可以估計(jì)出:有高血壓但沒(méi)有高血脂者(x1=1,x2=0)相對(duì)于既沒(méi)有高血壓也沒(méi)有高血脂者發(fā)病的風(fēng)險(xiǎn)率之比為:有高血脂但沒(méi)有高血壓者(x1=0,x2=1)相對(duì)于既沒(méi)有高血壓也沒(méi)有高血脂者發(fā)病的風(fēng)險(xiǎn)率之比為:有高血壓又有高血脂者(x1=1,x2=1)相對(duì)于既沒(méi)有高血壓也沒(méi)有高血脂者發(fā)病的風(fēng)險(xiǎn)率之比為:

Cox模型中參數(shù)意義的解釋由此可以估計(jì)出:Cox模型的應(yīng)用Cox模型由于以下特點(diǎn)具有廣泛的應(yīng)用價(jià)值:與參數(shù)法相比,它不需要考慮資料的分布,即任何分布的生存研究資料都可以利用Cox模型進(jìn)行數(shù)據(jù)分析。它是一種多元統(tǒng)計(jì)分析方法,可以用來(lái)分析多種因素對(duì)生存時(shí)間的影響。而流行病學(xué)研究的重要目標(biāo)之一就是分析各種因子與發(fā)病之間的關(guān)系,Cox模型回歸分析模型可以用來(lái)分析各因子對(duì)發(fā)病的影響,使得生存分析更適合于流行病學(xué)研究。Cox模型的應(yīng)用Cox模型由于以下特點(diǎn)具有廣泛的應(yīng)用價(jià)值:Cox模型的應(yīng)用它與其它一般回歸分析方法類(lèi)似,可用于比較和預(yù)測(cè),多元Cox模型回歸分析可以校正其它因素的影響,用于某一因素不同水平的比較;并可以在研究對(duì)象的各因素已知時(shí),預(yù)測(cè)研究對(duì)象在某時(shí)刻的生存概率。它與Logistic回歸分析類(lèi)似,在得到回歸系數(shù)的估計(jì)值后,則可以估計(jì)t時(shí)刻的相對(duì)危險(xiǎn)度:。Cox模型的應(yīng)用它與其它一般回歸分析方法類(lèi)似,可用于比較和預(yù)Cox回歸的SAS程序SAS系統(tǒng)中利用PHREG過(guò)程對(duì)生存數(shù)據(jù)進(jìn)行回歸分析,結(jié)局變量(因變量)為生存時(shí)間,可以處理有截尾數(shù)據(jù)的生存時(shí)間。PHREG過(guò)程的語(yǔ)法格式如下:PROCPRREGDATA=[選項(xiàng)];MODEL<生存時(shí)間變量*截尾指示變量(數(shù)值)>=<自變量名>/[選項(xiàng)];STRATA<分組變量名列>;FREQ<變量名列>;BY<變量名列>;RUN;Cox回歸的SAS程序SAS系統(tǒng)中利用PHREG過(guò)程對(duì)生存Cox回歸的SAS程序MODEL語(yǔ)句為必需的,定義生存時(shí)間和截尾指示變量和說(shuō)明變量:NOPRINT,不打印輸出;NOSUMMARY,不打印輸出事件和截尾數(shù)值;SIMPLE輸出MODEL語(yǔ)句中每一個(gè)說(shuō)明變量的簡(jiǎn)單的描述統(tǒng)計(jì)量。TIES=方法,指定估計(jì)生存率所用的方法:BRESLOW使用Breslow的近似似然估計(jì),為默認(rèn)的選項(xiàng);DISCRETE,用離散Logistic模型替代比例風(fēng)險(xiǎn)模型,多用于m:n的Logistic回歸;EFRON使用Efron的近似似然。Cox回歸的SAS程序MODEL語(yǔ)句為必需的,定義生存時(shí)間和Cox回歸的SAS程序EXACT,計(jì)算在比例危險(xiǎn)假定下所有失效事件發(fā)生在具有相同值的刪失時(shí)間或較大值時(shí)間之前的精確條件概率。ENTRYTIME=變量名,規(guī)定一個(gè)替代左截?cái)鄷r(shí)間的變量名。Cox回歸的SAS程序EXACT,計(jì)算在比例危險(xiǎn)假定下所有失Cox回歸的SAS程序SELECTION=method,方法可以選擇以下幾種:FORWARD(或F),按照規(guī)定的P值SLE從無(wú)到有依次選一個(gè)變量進(jìn)入模型;BACKWARD,按照規(guī)定的P值SLS從含有全部變量的模型開(kāi)始,依次剔除一個(gè)變量;STEPWISE,按照SLE的標(biāo)準(zhǔn)依次選入變量,同時(shí)對(duì)模型中現(xiàn)有的變量按SLS的標(biāo)準(zhǔn)剔除不顯著的變量;SCORE,采用最優(yōu)子集選擇法。其中,SLE選擇項(xiàng)用于指定協(xié)變量進(jìn)入模型的顯著水平,SLS選擇項(xiàng)用于指定協(xié)變量停留在模型中的顯著水平,缺省值皆為0.05。Cox回歸的SAS程序SELECTION=method,方法Cox回歸的SAS程序STRATA語(yǔ)句:比例風(fēng)險(xiǎn)的假定可能不會(huì)對(duì)所有的層都成立,此

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論