醫(yī)學(xué)統(tǒng)計(jì)學(xué)-生存分析_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-生存分析_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-生存分析_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-生存分析_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-生存分析_第5頁(yè)
已閱讀5頁(yè),還剩114頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

醫(yī)學(xué)研究中,為了解某種疾病(如慢

、

等)的預(yù)后及遠(yuǎn)期療效、評(píng)價(jià)治療方法的優(yōu)劣或觀察預(yù)防

措施的效果等,常需對(duì)研究對(duì)象進(jìn)行追蹤觀察,以獲得必要的數(shù)據(jù)(如 的生存時(shí)間、治療后病情緩解情況及持續(xù)時(shí)間等),這類(lèi)資料都屬于隨訪資料。隨訪資料是指對(duì)一批研究對(duì)象進(jìn)行追蹤觀察所獲得的有關(guān)其結(jié)局以及出現(xiàn)這種結(jié)局所經(jīng)歷的時(shí)間等方面的資料。由于隨訪資料的分析最初 于對(duì) 資料的統(tǒng)計(jì)分析,故稱(chēng)為生存分析,或稱(chēng)為生存時(shí)間分析。2何為生存分析傳統(tǒng)方法在分析隨訪資料時(shí)存在的1隨訪結(jié)局和時(shí)間都成為了要關(guān)心的因素等),還原有的療效指標(biāo)

效率、治愈率等難以適用。除了關(guān)注是否出現(xiàn)某種結(jié)局( 效、治愈、要考慮出現(xiàn)這些結(jié)局所經(jīng)歷的時(shí)間長(zhǎng)短。如:除了隨訪結(jié)局作為判定標(biāo)準(zhǔn)以外,只要能讓存活時(shí)間延長(zhǎng),這種藥物也應(yīng)當(dāng)被認(rèn)為有效。即時(shí)間延長(zhǎng)也認(rèn)為有效。將兩者均作為因變量擬合多元模型極為 (“時(shí)間”分布不明,一般不呈正態(tài)分布,在不同情況下的分布規(guī)律也不同)。3傳統(tǒng)方法在分析隨訪資料時(shí)存在的2存在大量失訪的資料失去聯(lián)系(

搬走,

改變……)無(wú)法觀察到結(jié)局(死于其他原因)研究截止……生存分析是將研究對(duì)象的觀察結(jié)局和出現(xiàn)這一結(jié)局所經(jīng)歷的時(shí)間結(jié)合起來(lái)分析的一種統(tǒng)計(jì)分析方法。并能充分利用所獲得的信息,達(dá)到較準(zhǔn)確、全面地評(píng)價(jià)和比較隨訪資料的目的,是臨床試驗(yàn)和隊(duì)列研究的一種重要分析

。5生存分析的歷史與應(yīng)用17、18世紀(jì):

表的提出及其應(yīng)用。1926年:Greenwood提出評(píng)價(jià)生存函數(shù)的誤差的方法—Greenwood公式。1958年:生存函數(shù)的計(jì)算方法—Kaplan-Meier法(乘積極限法product-limit)的提出。1960年代中葉:生存時(shí)間的組間比較方法的開(kāi)發(fā)—廣義Wilcoxon秩和檢驗(yàn)(Gehan,1965年);對(duì)數(shù)秩檢驗(yàn)(log-ranktest,又稱(chēng)時(shí)序檢驗(yàn))

[Man

,1966年]。1970年:將協(xié)變量的影響模型化—參數(shù)模型(假設(shè)生存時(shí)間服從Weibull分布、對(duì)數(shù)正態(tài)分布等);半?yún)?shù)模型(比例風(fēng)險(xiǎn)模型,又稱(chēng)Cox回歸模型)

[Cox,1972年]。主要內(nèi)容概述生存分析的基本概念、資料要求…生存率估計(jì)的非參數(shù)法乘積極限法、 表法生存率的比較Log-rank檢驗(yàn)…Cox比例風(fēng)險(xiǎn)回歸模型6§1

概述生存分析的方法已被廣泛應(yīng)用到醫(yī)學(xué)研究領(lǐng)域,如現(xiàn)場(chǎng)追蹤研究、臨床療效試驗(yàn)、疾病預(yù)后分析等,生存時(shí)間的涵義也隨之?dāng)U展到更廣義的范圍,又稱(chēng)為時(shí)間-效應(yīng)分析(time-effect ysis)。其研究?jī)?nèi)容主要包括:①對(duì)生存狀況進(jìn)行統(tǒng)計(jì)描述(生存概率、生存率、中位生存期等);②

尋找影響生存時(shí)間的“

”和“保護(hù)因素”;③估計(jì)生存率和生存時(shí)間長(zhǎng)短,進(jìn)行預(yù)后評(píng)價(jià)。7隨訪研究例:某醫(yī)師收集了年

月 日到

6例手術(shù)后的大腸癌患者資料,以了解患者術(shù)后生存情況及其可能的影響因素。表22-1

10 346例手術(shù)后的大腸癌患者生存資料記錄表患者dtime(月)手術(shù)日期終止隨訪日期結(jié)局生存時(shí)間(月)1男32101994.01.231994.12.24112女48121998.02.141999.01.01失訪10+3女2661992.03.041995.04.12374男5531999.08.202001.09.21死于其他25+5女5882001.03.102001.12.31存活9+oooooooo346男46122000.08.122001.12.12存活16+隨訪過(guò)程示意圖9一、生存分析中的基本概念起始事件、終點(diǎn)事件生存時(shí)間概率、

率生存概率、生存率、生存函數(shù)生存率曲線中位生存期率函數(shù)10基本概念(一)起始事件、終點(diǎn)事件起始事件(initial

event):反映研究對(duì)象生存過(guò)程的起始特征的事件。如

患者接受某種特定的治療、鉛作業(yè)工人開(kāi)始職業(yè)性鉛接觸等。終點(diǎn)事件(endpointevent):又稱(chēng)失效事件(failureevent),指研究者所關(guān)心的研究對(duì)象的特定結(jié)局。如患者死于癌癥、工人出現(xiàn)重癥鉛 癥狀等。1112基本概念(二)生存時(shí)間定義:廣義的生存時(shí)間(survival

time):也稱(chēng)失效時(shí)間(failuretime),指從某個(gè)起始事件開(kāi)始到某個(gè)終點(diǎn)事件的發(fā)生

(出現(xiàn)反應(yīng))所經(jīng)歷的時(shí)間。13起始事件疾病確診疾病確診治療開(kāi)始治療開(kāi)始癥狀緩解接觸毒物接觸出生開(kāi)始戒煙(毒)終點(diǎn)事件痊愈痊愈疾病出現(xiàn)毒性反映發(fā)病出現(xiàn)第一顆乳牙再次吸煙(毒)隨訪時(shí)間生存時(shí)間基本概念(二)生存時(shí)間特點(diǎn):1.分布類(lèi)型不易確定。一般 從正態(tài)分布,有時(shí)近似服從指數(shù)分布、Weibull分從任何規(guī)則的布、Gompertz分布等,多數(shù)情況下往往分布類(lèi)型。2.生存時(shí)間的影響因素多而復(fù)雜且不易控制。1415基本概念(二)生存時(shí)間特點(diǎn):3.根據(jù)研究對(duì)象的結(jié)局,生存時(shí)間數(shù)據(jù)可分為:

完全數(shù)據(jù)(complete

data):研究對(duì)象在觀察期內(nèi)出現(xiàn)反應(yīng)

(終點(diǎn)事件),這時(shí)記錄到的時(shí)間信息是完整的,這種生存時(shí)間數(shù)據(jù)稱(chēng)為完全數(shù)據(jù)。

截尾數(shù)據(jù)(截尾值、刪失數(shù)據(jù),censored

data):觀察期內(nèi)尚未觀察到研究對(duì)象出現(xiàn)反應(yīng)(終點(diǎn)事件)時(shí),即由于某種原因停止了隨訪,這時(shí)記錄到的時(shí)間信息是不完整的,這種生存時(shí)間數(shù)據(jù)稱(chēng)為不完全數(shù)據(jù)或截尾值。表示為“+”基本概念(二)生存時(shí)間特點(diǎn):3.

根據(jù)研究對(duì)象的結(jié)局,生存時(shí)間數(shù)據(jù)可分兩種類(lèi)型:(1)

完全數(shù)據(jù)(2)

截尾數(shù)據(jù)截尾的原因①失訪:生存但中途失訪,包括、失去聯(lián)系等。,②退出:中途退出試驗(yàn)、改變治療方案、死于其它與研究無(wú)關(guān)的原因:如肺癌患者死于心機(jī)梗塞、 或因終止隨訪時(shí)間為 時(shí)間。③終止:指觀察期結(jié)束時(shí)仍未出現(xiàn)結(jié)局。1617隨訪資料常見(jiàn)形式終點(diǎn)始點(diǎn)(結(jié)局事件)失訪、退出終止18基本概念(二)生存時(shí)間生存時(shí)間資料的收集與整理:對(duì)于隨訪資料,需記錄的原始數(shù)據(jù)包括開(kāi)始觀察的時(shí)點(diǎn)(起始事件發(fā)生的時(shí)間)、終止觀察的時(shí)點(diǎn)、研究對(duì)象的結(jié)局、考慮的影響因素等。生存時(shí)間t為反映時(shí)間長(zhǎng)短的指標(biāo),屬數(shù)值變量:生存時(shí)間(t)=終止觀察的時(shí)點(diǎn)–開(kāi)始觀察的時(shí)點(diǎn);結(jié)局變量δ反映終點(diǎn)事件是否發(fā)生,為二分類(lèi)的變量。通常用(t,δ)完整地表示一個(gè)觀察對(duì)象的隨訪結(jié)果。19基本概念(三)

概率、

率概率(mortality

probability):是指某單位時(shí)段期初的觀察對(duì)象在該單位時(shí)段內(nèi) 的可能性大小。若某時(shí)段內(nèi)有刪失,則分母用校正人口數(shù):q

某單位時(shí)段內(nèi)數(shù)該時(shí)段期初觀察人數(shù)2校正人口數(shù)

期初觀察人數(shù)

1

刪失數(shù)20基本概念(三)

概率、

率率(mortality

rate):指單位時(shí)間內(nèi)研究對(duì)象的 頻率或強(qiáng)度,即平均每

(或萬(wàn)人、百人等)中的 人數(shù)。平均人口數(shù)=(該時(shí)段期初人口數(shù)+期末人口數(shù))/2m

某單位時(shí)段內(nèi)數(shù)1000‰該時(shí)段平均人口數(shù)21基本概念(四)生存概率、生存率、生存函數(shù)生存概率(survival

probability):表示某單位時(shí)段開(kāi)始時(shí)存活的 到該時(shí)段結(jié)束時(shí)仍存活的可能性大小。若該時(shí)段內(nèi)有刪失,則分母用校正人口數(shù)。

1

-

qp

活滿(mǎn)某時(shí)段的人數(shù)該時(shí)段期初觀察人數(shù)2校正人口數(shù)

期初觀察人數(shù)

1刪失數(shù)2223基本概念(四)生存概率、生存率、生存函數(shù)生存率(survivalrate):指研究對(duì)象經(jīng)歷t個(gè)時(shí)段后仍存活的概率,即生存時(shí)間大于等于t

的概率,用P(T

≥t)表示。生存函數(shù)(survival

function):生存率隨時(shí)間t

變化而變化,即生存率是相對(duì)于時(shí)間t

的函數(shù),記為S(t)。生存函數(shù)在某時(shí)點(diǎn)的函數(shù)值就是生存率。生存函數(shù)或生存率計(jì)算如下:①若前

t

個(gè)時(shí)段無(wú)刪失:研究期初觀察總?cè)藬?shù)S

(t)

P(T

t)

t時(shí)段結(jié)束時(shí)仍存活的人數(shù)如:100%活滿(mǎn)n年的人數(shù)研究期初觀察人數(shù)n年生存率。t

j

t②若觀察期內(nèi)有刪失:假定觀察對(duì)象在各個(gè)單位時(shí)段內(nèi)是否生存的事件是相互獨(dú)立的,其生存概率分別為

p1,p2

,p3,,pt

,則根據(jù)概率乘法原理得

S

(t)

p1

p2

p3

......pt

p

j故生存函數(shù)又稱(chēng)累積生存概率(cumulativeprobabilityof

survival),即將時(shí)刻t

尚存活看成是前t

個(gè)時(shí)段一直存活的累計(jì)結(jié)果。如:n年生存率1p0

1

p11

p2......1

pn1

。2425基本概念(五)生存率曲線生存率曲線(survival

curve):指以時(shí)間為橫軸、生存率為縱軸,將各個(gè)時(shí)點(diǎn)的生存率連接在一起的曲線圖。階梯形:小樣本資料用直接法估計(jì)的生存曲線;折線形:大樣本資料用頻數(shù)表法估計(jì)的生存曲線。10.90.80.70.60.50.40.30.20.10270

1

2

3

4

5

6

7圖16-3

233例食管癌患者術(shù)后生存率曲線術(shù)后年數(shù)生存率基本概念(六)中位生存期中位生存期(median

survival

time):也稱(chēng)半數(shù)生存期,即生存時(shí)間的中位數(shù),表示生存率等于50%時(shí)的時(shí)間。反映生存時(shí)間的平均水平。由于生存時(shí)間并非正態(tài)分布,故常用中位生存期作為群生存過(guò)程的概括性描述指標(biāo)。中位生存期越長(zhǎng),表示疾病預(yù)后越好;中位生存期越短,表示疾病預(yù)后越差。[利用生存曲線圖或線性?xún)?nèi)插法估計(jì)]2829基本概念(七)率函數(shù)率函數(shù)(hazard

function):指t

時(shí)刻尚存活的研究對(duì)象死于t時(shí)刻后一瞬間的概率,為條件概率。即活到t時(shí)刻的條件下在t~t+t這一微時(shí)段內(nèi)的概率,用h(t)表示。T為觀察對(duì)象的生存時(shí)間,n(t)為t時(shí)刻的生存人數(shù),n(t+t)為t+t時(shí)刻的生存人數(shù)。率函數(shù)也稱(chēng)為 力(force

of

mortality)、瞬時(shí)

率(instantaneous

failure

rate)等。Δt(()Δnnt)t

()ΔnttΔ

tt)PtTTt

limΔt0()

lihmt

(Δt

0率函數(shù)是生存分析的基本函數(shù),它反映研究對(duì)象在某時(shí)點(diǎn)的風(fēng)險(xiǎn)大小。t生存函數(shù)與 率函數(shù)的關(guān)系可表示為:

St0

ht(e)dxt(p30率函數(shù)與生存函數(shù)的關(guān)系31率隨時(shí)間變化而增加,如急性白血病患者治療無(wú)率逐漸減小,如意外事故造成的外傷經(jīng)有效治療h1(t)是一種上升的曲線,表示

效其 率隨時(shí)間呈增加趨勢(shì);h2(t)的曲線為下降趨勢(shì),表示后

的 性逐漸減?。籬3(t)為一種穩(wěn)定的

率函數(shù),如某些慢 患者在穩(wěn)定期,其 率基本不變。h4(t)為一種山峰型曲線,表示

率先增大后降低。圖

不同形式的率函數(shù)曲線h(t)0th1(t)h3(t)h4(t)h2(t)二、生存分析對(duì)資料的基本要求樣本由隨機(jī)抽樣方法獲得,要有一定的數(shù)量。完全數(shù)據(jù)所占的比例不能太少,即截尾值不宜太多。截尾值出現(xiàn)的原因無(wú)偏性。為防止偏性,常需對(duì)截尾的研究對(duì)象的、職業(yè)、地區(qū)、病情輕重等情況進(jìn)行分析。生存時(shí)間盡可能精確。因?yàn)樵S多常用的生存分析方法都在生存時(shí)間排序的基礎(chǔ)上作統(tǒng)計(jì)處理,即使小小的舍入誤差也可能改變生存時(shí)間順序而影響結(jié)果。缺項(xiàng)要盡量補(bǔ)齊。32三、生存分析的方法非參數(shù)法:其特點(diǎn)是不論資料是什么樣的分布形式,只根據(jù)樣本提供的順序統(tǒng)計(jì)量對(duì)生存率進(jìn)行估計(jì),常用的方法有乘積極限法和表法。參數(shù)法:其特點(diǎn)是假定生存時(shí)間服從于特定的參數(shù)分布,根據(jù)已知分布的特點(diǎn)對(duì)影響生存時(shí)間的因素進(jìn)行分析,常用的方法有指數(shù)分布法、Weibull分布法、對(duì)數(shù)正態(tài)回歸分析法和對(duì)數(shù)logistic回歸分析法等。半?yún)?shù)法:兼有非參數(shù)法和參數(shù)法的特點(diǎn),主要用于分析影響生存時(shí)間和生存率的因素,屬多因素分析方型方法為Cox模型分析法。33乘積極限法(product-limit

method):小樣本未分組資料表

ife

table

method):大樣本分組資料§2

生存率估計(jì)的非參數(shù)法34乘積極限法(product-limit

method)是由Kaplan和Meier在1958年首先提出,故又稱(chēng)Kaplan-Meier法(K-M法)。該法主要適用于樣本含量較小的資料。例:用某中藥+化療(中藥組)和化療(對(duì)照組)兩種療療白血病后,隨訪記錄患者死前存活月數(shù),結(jié)果如下。試分別估計(jì)兩組的生存率并繪制生存率曲線。一、乘積極限法中藥組(n=16):10

12+

13

18

19+

26

9+2+

6+

8+6+43+

9

4

31

2413

7+

11+

6

1

11

3

17

7對(duì)照組(n=10):2+35乘積極限法估計(jì)生存率的步驟:將n個(gè)樣本觀察值(生存時(shí)間t)由小到大依次排列,秩次i=1,2,…,n。如非截尾值與截尾值相同,將非截尾值排在前面。列出各時(shí)點(diǎn)(實(shí)為一短的時(shí)間單位)的例數(shù)。截尾值對(duì)應(yīng)的

數(shù)為0。列出各時(shí)點(diǎn)(實(shí)為一短的時(shí)間單位)開(kāi)

始時(shí)的存活數(shù),即期初觀察單位數(shù)ni。乘積極限法乘積極限法估計(jì)生存率的步驟:計(jì)算各時(shí)點(diǎn)

概率q及生存概率p。求活過(guò)各時(shí)點(diǎn)的生存率S(ti),等于從開(kāi)始觀察時(shí)點(diǎn)到ti時(shí)點(diǎn)各生存概率的連乘積。乘積極限法生存率的區(qū)間估計(jì):以上計(jì)算出的樣本生存率是總體生存率的點(diǎn)估計(jì),進(jìn)一步求得各生存率的標(biāo)準(zhǔn)誤,即可按照近似正態(tài)分布原理估計(jì)總體生存率的區(qū)間。38乘積極限法

1

生存率的標(biāo)準(zhǔn)誤:SES

ti

S

ti

Σn

in

i

1式中i為秩次,

1Σn

in

i

1

表示把小于等于t的

各非截尾值所對(duì)應(yīng)的1(n

i)(n

i

1)加起來(lái)求和。某時(shí)點(diǎn)ti的總體生存率1

%的區(qū)間為:Sti

u

2SESti

6

7+7

118

11+9

1310

1754321SES

ti

S

ti

SE[S(t5

)]

0.40繪制生存率曲線常繪制成階梯形的曲線。方法是將各非截尾值及其對(duì)應(yīng)的生存率標(biāo)在直角坐標(biāo)紙上,然后將各點(diǎn)垂直向下再水平向右連成階梯形。41乘積極限法圖16-2

兩種療療后白血病患者的生存率曲線4213

6

70.900.790.680.560.4211

130.21曲線階梯形

不能用直線或曲線連接相鄰的兩個(gè)生存率散點(diǎn)。隨著 時(shí)點(diǎn)增多,曲線的階梯形逐漸不明顯。曲線左連續(xù)

每一級(jí)臺(tái)階的右端為斷點(diǎn),當(dāng)前 時(shí)點(diǎn)處的縱坐標(biāo)值在下一個(gè)臺(tái)階。曲線尾部不穩(wěn)定

隨著時(shí)間的增加,觀察例數(shù)越來(lái)越少,誤差越來(lái)越大,曲線尾部極不穩(wěn)定。在多組比較時(shí),常發(fā)生曲線尾部交叉現(xiàn)象,這很可能是因誤差大而出現(xiàn)的一種假象。此時(shí)可適當(dāng)提前終止日期,使得最后一個(gè) 時(shí)點(diǎn)仍有一定的觀察例數(shù)。43生存率曲線特點(diǎn)(乘積極限法)0表示截尾數(shù)據(jù)1表示完全數(shù)據(jù)Pl為乘積極限ife為表法t為橫坐標(biāo),指定時(shí)間變量和截尾變量

S為縱坐標(biāo)生存率率生存率的標(biāo)準(zhǔn)誤例數(shù)

生存例數(shù)46描述性統(tǒng)計(jì)量48完整數(shù)據(jù)截尾數(shù)據(jù)0.000.250.500.751.00time01020304050STRATA:c=1Censored

c=1c=2Censored

c=250二、

表法如果隨訪人數(shù)很多,原始資料可以按照生存時(shí)間分成不同組段得到各組段頻數(shù),這種大樣本的分組數(shù)據(jù)通常可以用

表法來(lái)描述生存過(guò)程。表

ife

table

method):采用編制定群 表的原理來(lái)計(jì)算生存率,首先求出患者在治療后或健康者在預(yù)

防措施后各時(shí)期的生存概率,然后根據(jù)概率的乘法法則,將各時(shí)期的生存概率相乘,即可得到自觀察開(kāi)始到各時(shí)

點(diǎn)的生存率。52表16-5 233例食管癌患者術(shù)后隨訪資料術(shù)后年數(shù)t(1)期內(nèi)死亡人數(shù)d(2)期內(nèi)刪失人數(shù)c(3)年初觀察人數(shù)n0(4)0~6882331~6171572~383893~161484~80315~623023表法對(duì)食管癌患者手術(shù)后隨訪的資料如下表(1)~(4)例:欄,用 表法估計(jì)生存率。術(shù)后年數(shù)t:以術(shù)后為觀察起點(diǎn),按術(shù)后年數(shù)劃分組段,如“0~”組段指術(shù)后不滿(mǎn)1年。期內(nèi)

人數(shù)d:表示相應(yīng)時(shí)段內(nèi)出現(xiàn)結(jié)局事件(如

)的人數(shù)。期內(nèi)刪失人數(shù)c:表示相應(yīng)時(shí)段內(nèi)出現(xiàn)截尾(失訪、死于它病或研究結(jié)束時(shí)尚存活等)的人數(shù)。年初觀察人數(shù)n0:表示各組段下限對(duì)應(yīng)時(shí)點(diǎn)的觀察人數(shù)。表法校正期初觀察人數(shù)n:n=n0-c/2概率q

:q=d/n生存概率p:p=1-q55:t+1年生存率的標(biāo)準(zhǔn)誤為生存率S(t+1):表示各組段上限對(duì)應(yīng)時(shí)點(diǎn)的生存率,即研究對(duì)象活滿(mǎn)t+1年的概率。St11p0

1

p11

p21

pn1生存率的標(biāo)準(zhǔn)誤SE[S(t+1)]:qit

1i1

piniSESt

1

St

1表法56表16-5表法估計(jì)233例食管癌患者的生存率計(jì)算表術(shù)后

期內(nèi)年數(shù)

人數(shù)t

d(1)

(2)期內(nèi)刪

年初觀

校正期初失人數(shù)

察人數(shù)

觀察人數(shù)

概率c

n0

n=n0-c/2

q=d/n(3)

(4)

(5)

(6)生存概率p=1-q(7)t+1年生存率S(t+1)(8)生存率標(biāo)準(zhǔn)誤SE[St+1](9)0~1~2~3~4~5~66861381682387310023315789483123229.0153.587.547.531.023.00.2969

0.7031

0.7031

0.03020.3974

0.6026

0.4237

0.03320.4343

0.5657

0.2397

0.02930.3368

0.6632

0.1589

0.02540.2581

0.7419

0.1179

0.02261.0000

0.0000

0.0000

0.0000qit

1i1

pi

niSESt

1

St

1

0.6026153

.50.

565787

.50.7031229SE[(S3

)]

0.239

0.0292

3.50.33680.43430.39740.2969

0.025427

0.6026153

.5

0.565787

.5

0.6632470.7031229SE[(S4

)]

0.1589

本例結(jié)果分析:動(dòng)態(tài)變化:從

率一欄看,前3年

性逐年增加,而后呈下降趨勢(shì),生存概率從

說(shuō)明了這一結(jié)果。累積情況:從第(9)列看,生存率的標(biāo)準(zhǔn)誤都很小,說(shuō)明生存率具有代表性;再看第(8)列的生存率,半數(shù)以上的術(shù)后活不到2年,提示此

對(duì)生命 大??砂从谜龖B(tài)近似法估計(jì)總體生存率的置信區(qū)間。如,本例手術(shù)后5年生存率的95%

區(qū)間為:0.11791.960.0226=(0.0736,0.1622)。57表法表法用

表法計(jì)算的頻數(shù)表資料的生存率,繪制生存率曲線時(shí)應(yīng)繪制成線圖,即相鄰兩個(gè)時(shí)點(diǎn)的生存率之間用線段連接。圖16-3

233例食管癌患者術(shù)后生存率曲線1

2

3

4

5

6

7術(shù)后年數(shù)生存率10.90.80.70.60.50.40.30.20.100生存率曲線特點(diǎn):曲線折線形因不知道時(shí)段內(nèi)生存率的變化規(guī)律,故用直線連接各端點(diǎn),形成一條折線。曲線連續(xù)可估計(jì)任意時(shí)點(diǎn)的縱坐標(biāo)值(生存率)。曲線尾部穩(wěn)定性好表法用于大樣本,通常最后一個(gè)時(shí)段仍有一定的觀察例數(shù),故曲線尾部穩(wěn)定性比K-M法好。data

AA16;do

c=0to1;=1to6;inputtf@@;output;end;end;cards;0685

2308172

331405

0;time

t*c(1);freq

f;run;59計(jì)算生存率的規(guī)定時(shí)間區(qū)間為1t為橫坐標(biāo)proc

lifetest

method=life

width=1

plots=(s);

S為縱坐標(biāo)TheLIFETEST

ProcedureLife

Table

Survival

EstimatesConditionalProbabilityEffectiveNumber

Number

SampleConditionalProbabilityofFailureIntervalStandardError[Lower,

Upper)

Failed

Censored

Size生存率Survival率Failure01688229.00.29690.03021.0000012617153.50.39740.03950.70310.29692338387.50.43430.05300.42370.57633416147.50.33680.06860.23970.7603458031.00.25810.07860.15890.84115.23023.01.000000.11790.882160條件概率及其標(biāo)準(zhǔn)誤期處觀察人數(shù)Evaluated

at

the

Midpoint

of

theIntervalSurvival

Median

Median

PDFHazardStandardInterval

Standard Residual

Standard

Standard[Lower,

Upper)

Error Lifetime

Error

PDF

ErrorHazardError0.041640.0615150101.72680.11830.29690.03020.348718120.03021.39210.15420.27940.03030.495935230.03321.34490.28050.18400.02670.554745340.02931.95340.42390.08070.01920.405063450.0254..0.04100.01410.2962960.086460.0991670.1036015.0.0226

.

.....61生存率的標(biāo)準(zhǔn)誤剩余生存時(shí)間中位數(shù)及其標(biāo)準(zhǔn)誤各個(gè)時(shí)間區(qū)間中點(diǎn)的概率密度函數(shù)及其標(biāo)準(zhǔn)誤時(shí)間區(qū)間下限的

率及其標(biāo)準(zhǔn)誤Summary

of

the

Number

of

Censored

and

Uncensored

ValuesPercentTotal

Failed233

214Censored19Censored8.15620.000.250.500.751.00t012345663§3

生存率的比較生存率比較的假設(shè)檢驗(yàn)方法有:參數(shù)法、半?yún)?shù)法和非參數(shù)法非參數(shù)法是將生存率曲線作為整體進(jìn)行曲線與曲線之間的比較,其零假設(shè)為各總體生存率曲線相同。常用的非參數(shù)法有:log-rank

檢驗(yàn)(時(shí)序檢驗(yàn))似然比檢驗(yàn)(likelihood

ratio

test)wilcoxon檢驗(yàn)(又稱(chēng)Breslow檢驗(yàn))。log-rank

檢驗(yàn)(時(shí)序檢驗(yàn))時(shí)序檢驗(yàn)由Man等人于1966年提出。該法不指定生存時(shí)間服從某種特定的分布,所比較的是整個(gè)生存時(shí)間的分布,而不是僅僅比較某個(gè)特定時(shí)間點(diǎn)的生存率?;舅枷耄涸跓o(wú)效假設(shè)成立的前提下,根據(jù)兩種處理不同生存時(shí)間的期初觀察人數(shù)和理論論 數(shù)(期望

數(shù)),應(yīng)該與實(shí)際概率計(jì)算出的理數(shù)相差不大;如果相差較大,則無(wú)效假設(shè)不成立,可以認(rèn)為兩條生存曲線間的差異有統(tǒng)計(jì)學(xué)意義??捎糜趦山M或多組生存率曲線的比較。64log-rank

檢驗(yàn)(時(shí)序檢驗(yàn))例:用某中藥+化療(中藥組)和化療(對(duì)照組)兩種療療白血病后,隨訪記錄患者死前存活月數(shù),結(jié)果如下。試比較兩組患者總體生存率。中藥組:102+12+13

18

6+

19+

269+

8+6+43+94

31

24對(duì)照組:2+137+11+

6

1

11

3

1776566log-rank

檢驗(yàn)(時(shí)序檢驗(yàn))H0:兩組總體生存率曲線分布相同

H1:兩組總體生存率曲線分布不同=0.05將兩組資料的生存時(shí)間混合后 排序,并按K-M法計(jì)算合并的概率(第6欄);分別統(tǒng)計(jì)兩組在各時(shí)點(diǎn)的期初觀察人數(shù)(第7和9欄);分別計(jì)算各單位時(shí)段內(nèi),H0假設(shè)成立下兩組的預(yù)期

人數(shù)(第8和10欄),即用合并的 概率乘以相應(yīng)的期初觀察人數(shù)。求各組的期望 人數(shù)之和:將第(8)欄和第(10)欄的數(shù)據(jù)分別求和。(5)

計(jì)算檢驗(yàn)統(tǒng)計(jì)量:公式

2TΣ0A

T

2

計(jì)算

2

值,在H假設(shè)成立時(shí),

2

服從度

k

1(k為比較組數(shù))的

2

分布。表16-6

兩種療療后白血病患者的生存率比較的log-rank檢驗(yàn)計(jì)算表數(shù)亡人數(shù)月數(shù)兩組合并對(duì)照組期對(duì)照組中藥組中藥組t期初觀察人數(shù)人數(shù)失訪人數(shù)組別合并死亡概率初觀察人預(yù)期死亡人數(shù)期初觀察人數(shù)預(yù)期死(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)12610C0.03846100.3846160.61542**2502C、T09016032310C0.0434880.3478150.652242210T0.0454570.3182150.681862110C0.0476270.3333140.66676**2002T、T06014071810C0.0555660.3333120.66677*1701C0501208*1601T04012091510T0.0666740.2667110.73339*1401T0401006768101310T0.0769240.307790.6923111210C0.0833340.333380.666711*1101C0308012*1001T0208013920T、C0.2222220.444471.5556——

———3.2123—

11.7877合計(jì)

—注:*表示刪失。續(xù)表data

AA16;do

c=1

to

2;input

n;=1

to

n;input

time

censor

@@;output;end;end;cards;1610

1

2

0

12

0

262

0 1

11

1

3

1

17

1

7

1;proc

lifetest

plots=(s);time

time*censor(0);str

;定義分組變量run;6970生存曲線方差齊性檢驗(yàn)協(xié)方差矩陣檢驗(yàn)兩條生存曲線的比較結(jié)果0.000.250.500.751.00time01020304050STRATA:c=1Censored

c=1c=2Censored

c=2生存曲線圖對(duì)于大樣本資料生存率的比較,可以將其整理成頻數(shù)表形式,采用表法計(jì)算生存率然后進(jìn)行比較,其基本原理與上述方法相同。例

203例急性腦血栓患者出院后隨訪資料如下,試比較3個(gè) 組腦血栓患者的總體生存率是否相同。72log-rank

檢驗(yàn)(時(shí)序檢驗(yàn))73表16-7

三個(gè)組腦血栓患者的生存率比較40~59歲60~69歲70歲及以上合計(jì)出院后校正實(shí)際預(yù)期校正實(shí)際預(yù)期校正實(shí)際預(yù)期校正實(shí)際月數(shù)觀察觀察觀察觀察人數(shù)人數(shù)人數(shù)人數(shù)人數(shù)人數(shù)人數(shù)人數(shù)人數(shù)人數(shù)人數(shù)(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)0~8834.33507023.44834552.2167203106~8104.39026653.577237.552.0325184.51012~6614.66435063.533625.531.8021141.51018~4623.46243112.33331641.204393724~29.511.512820.521.05138.500.435958.5330~18.500.513911.510.3194600.166736136~1100.00005.500.0000300.000019.5042~483.500.0000100.00000.500.00005.00合計(jì)718.87861714.2631177.858241log-rank

檢驗(yàn)(時(shí)序檢驗(yàn))組總體生存率曲線相同組總體生存率曲線不同或不全相同H0:3個(gè)H1:3個(gè)=0.05列計(jì)算表,表中預(yù)期 人數(shù)。。iiiiΣNΣAT

N

88

4.3350203如40~59歲組的“0~”組段:T

1018

6344858272.

2T

18

8786. 14

2631.

85827.AT

7

18

8786.2

14127631.2

17

2

Σ按 度=k-1=2查2界值表,得P<0.005,按

水準(zhǔn)

H0,接受H1,可認(rèn)為3個(gè)組的總體生存率不等或不全相等。746

12

18圖16-4

三個(gè)

組腦30

36患者生存率曲線0.40.50.6生存率10.90.80.702442術(shù)后月數(shù)40-59歲60-69歲70歲及以上75注意對(duì)于生存率比較的時(shí)序檢驗(yàn),計(jì)算方法有近似法和精確法兩種,以上兩例檢驗(yàn)統(tǒng)計(jì)量的計(jì)算均為近似法,精確法計(jì)算時(shí)的分母是對(duì)應(yīng)的方差估計(jì)量。兩種方法的結(jié)果在樣本例數(shù)較小時(shí)稍有不同。用log-rank檢驗(yàn)對(duì)樣本的生存率進(jìn)行比較時(shí),要求各組生存率曲線不能交叉,若生存率曲線交叉提示存在某種混雜因素,此時(shí)應(yīng)采用分層的辦法或多因素的辦法來(lái)校正混雜因素。另外,當(dāng)假設(shè)檢驗(yàn)推斷各組總體生存率曲線不同時(shí),可以通過(guò)生存率曲線的高低、半數(shù)生存期的長(zhǎng)短及相對(duì)

度等指標(biāo)來(lái)評(píng)價(jià)其效果。767Log-rank精確檢驗(yàn)法注意:不同時(shí)點(diǎn)期初觀察例數(shù)等于上一時(shí)點(diǎn)期初觀察例數(shù)減去上一時(shí)點(diǎn)的 數(shù)與刪失數(shù)。Tki

表示在每個(gè)時(shí)間點(diǎn),當(dāng)兩組的生存率相等且均為該時(shí)點(diǎn)的總

數(shù)除以該時(shí)點(diǎn)的總觀察數(shù)時(shí),按照各組期初例數(shù)計(jì)算的期望人數(shù)。上述方法為L(zhǎng)og-rank近似計(jì)算方法,其計(jì)算結(jié)果與SAS

結(jié)果存在差距,SAS

的計(jì)算結(jié)果為L(zhǎng)og-rank精確計(jì)算法的結(jié)果。①將兩組的完全生存時(shí)間混合排序列,相同生存時(shí)間只列1

次。②兩組在不同時(shí)點(diǎn)的期初觀察例數(shù)為n1i

、n2i

,其合計(jì)Ni

n1i

n2i

;③不同時(shí)點(diǎn)兩組的人數(shù)為d1i

、d2i

,,其合計(jì)Di

d1i

d2i

;④計(jì)算各組期望kiiN

Di人數(shù)

和T2i

Tki

n,k=1,2kiiiiki

iikiik

knn

n n

d式中V

為第

k

組期望數(shù)T

的方差估計(jì),V

w)dn n

1(1

)(2wi

為權(quán)重,對(duì)log-rank檢驗(yàn),wi

1,即該檢驗(yàn)給任意時(shí)間點(diǎn)處兩組間的差別相同的權(quán)重。當(dāng)比較的兩總體生存曲線呈比例時(shí),檢驗(yàn)效能最大;wi

ni

則對(duì)應(yīng)Gehan

檢驗(yàn)(1965)或

Wilcoxon

檢驗(yàn),該檢驗(yàn)給兩組間

的早期差別更大的權(quán)重。78⑤log-rank檢驗(yàn)精確法

2

統(tǒng)計(jì)量計(jì)算公式為:χ

2

w

(d

T

)2

i

ki

ki

VkLog-rank精確檢驗(yàn)法79對(duì)照組中藥組合計(jì)序號(hào)i(1)時(shí)間ti(2)n1i

d1i(3)

(4)(5)n2i(7)Ni

Di(11)

(12)7

10

4

0 0

3077

0

2130

9

1

0

6923

0

2130

13111010.38460.23671600.61540.23672612**91001610025023810.34780.22681500.65220.226823134700.31820.21691510.68180.216922146710.33330.22221400.66670.22222116**600014200200本例log-rank

檢驗(yàn)精確法方差估計(jì)Vki

見(jiàn)表第6

列和第10

列,第6、第10

列合計(jì)處V1

V2

2.1806。9*4000101001401按甲療法組計(jì)算,

2

3(2.7123)

26.57922.180610021111800021806611218066101110合計(jì)73.21232.1806811.78772.180615=10×1/26(6)d

2i

T2i

=16×1/26(8)

(9)

(10)第四節(jié)

Cox比例風(fēng)險(xiǎn)回歸模型i1生存分析中一個(gè)很重要的內(nèi)容是探索影響生存時(shí)間或生存率的 ,這些

通過(guò)影響各時(shí)刻的 風(fēng)險(xiǎn)(即率)而影響生存率,不同特征的人群在不同時(shí)刻的率函數(shù)不同,通常將危率函數(shù)表達(dá)為基準(zhǔn) 率函數(shù)與相應(yīng)協(xié)變量函數(shù)的乘積,即:

h(

t

)

h0

(

t

)

f

(

X

)對(duì)于協(xié)變量函數(shù)f(X),最常用的是對(duì)數(shù)線性模型,m即f(X)

exp(

i

X

i

)。80當(dāng)基準(zhǔn)

率函數(shù)h0

(t)

已知時(shí),

h(

t

)

h0

(

t

)

f

(

X

)為參數(shù)模型,如:h0

(t)

時(shí),為指數(shù)回歸模型;

10h

(t)

t時(shí),為Weibull回歸模型;th

(t)

0e

時(shí),為Gompertz模型。1972年英國(guó)生物統(tǒng)計(jì)學(xué)家D.R.

Cox提出在基準(zhǔn)

率函數(shù)未知的情況下估計(jì)模型參數(shù)的方法,稱(chēng)為Cox比例風(fēng)險(xiǎn)回歸模型(Cox’sproportional

hazard

regression

model)。該模型的參數(shù)估計(jì)不依賴(lài)于基準(zhǔn)

率的分布類(lèi)型,屬于一種半?yún)?shù)模型。8182一、Cox比例風(fēng)險(xiǎn)回歸模型的基本形式生存分析的主要目的在于研究協(xié)變量

X

與觀察結(jié)果即生存函數(shù)之間的關(guān)系,當(dāng)

St

受到協(xié)變量的影響時(shí),傳統(tǒng)的方法是考慮回歸分析,即各協(xié)變

量對(duì)St

的影響,由于生存分析研究的數(shù)據(jù)中包含有截尾數(shù)據(jù),用一般的方法難以解決上述問(wèn)題??聪旅胬尤绻治鰔1-x6這6個(gè)因素對(duì)生存時(shí)間t的影響,能否用線性回歸分析建立時(shí)間t與影響因素間的線性回歸方程?或建立生存函數(shù)S(t)與影響因素間的線性回歸方程?t=b0+b1x1+b2x2+┅+b6x6

?S(t)

=b0+b1x1+b2x2+┅+b6x6

?1、生存時(shí)間t一般 從正態(tài)分布;2、生存時(shí)間t中含有截尾值。83Cox

模型不直接生存函數(shù)St

與協(xié)變量的關(guān)系,而是用風(fēng)險(xiǎn)率函數(shù)ht

作為因變量,并假定:XX

thexp

X

1221

mm0

h0

tthe,Xxp

X0000texp()

Xexp

hXt

dt

S

t

exp

t

htX,expd,

tStX

利用生存率函數(shù)S(t,X)與風(fēng)險(xiǎn)函數(shù)h(t,X)的關(guān)系可導(dǎo)出反映了協(xié)變量X與生存函數(shù)的關(guān)系Cox模型的基本形式8485ht,

X

h0

texp

X

h0

texp1

X1

2

X

2

m

Xm

表示具有協(xié)變量X

的個(gè)體在時(shí)刻t

的又稱(chēng)為瞬時(shí)率,率。T為生存時(shí)間,X'

X1

,

X

2

,,

Xm

表示與生存時(shí)間可能有關(guān)的協(xié)變量或交互項(xiàng)。其中的因素可能是定量的或定性的,在整個(gè)觀察期間內(nèi)不隨時(shí)間的變化而變化。'm

(1

,2

)為Cox

模型的偏回歸系數(shù),是一組未知的參數(shù),需根據(jù)實(shí)際的數(shù)據(jù)來(lái)估計(jì)。所有 為0時(shí)的基礎(chǔ)風(fēng)險(xiǎn)率,它是未知的,但假定它與h(t,X)是呈比例的。右側(cè)可分為兩部分:h0(t)沒(méi)有明確的定義,分布無(wú)明確的假定,參數(shù)無(wú)法估計(jì),為非參數(shù)部分;另一部分是參數(shù)部分,其參數(shù)可以通過(guò)樣本的實(shí)際觀察值來(lái)估計(jì)的,正因?yàn)镃ox模型有非參數(shù)和參數(shù)兩部分組成,故又稱(chēng)為半?yún)?shù)模型。86

m

Xm

2

X

2

h0texp1

X1ht,

X

h0texp

X

1

1

2

2ht,

X

/

h0

t

exp偏回歸系數(shù)

i

的意義是:當(dāng)其它協(xié)變量都不變時(shí),

Xi

每變化一個(gè)單位,相對(duì)

度的自然對(duì)數(shù)(

ln

RR

)變化

i

個(gè)單位。若i

0

,則

RR

1,該因素為

;若i

0

,則

RR

1,該因素為保護(hù)因素;若i

0

,則

RR

1,該因素為無(wú)關(guān)因素。87存時(shí)間作為回通過(guò)風(fēng)險(xiǎn)函數(shù)和基礎(chǔ)風(fēng)數(shù)和基礎(chǔ)風(fēng)險(xiǎn)函數(shù)是未知的。另外偏回歸系數(shù)的估計(jì)需要借助于在完成參數(shù)估計(jì)的情況下,可對(duì)基礎(chǔ)風(fēng)險(xiǎn)函數(shù)和做出估計(jì),并計(jì)算每一個(gè)時(shí)刻的生存率。88①只考慮1個(gè)協(xié)變量

X

時(shí):00

0)exp(()

1)exp(()

)ththht()'()thRR②考慮多個(gè),其中xi增加1個(gè)單位而其它變量都不變時(shí),相對(duì)度:mmimmXht'1221122'01122

exp11'

exp

iht

0

expRR

XXX2X

'mXmmX

Xh'X'etxp

X

'XhXt③同時(shí)考慮2個(gè)協(xié)變量,2個(gè)因素都存在的率與2個(gè)exp1

2

exp1

exp

2

RR1

RR2因素都不存在時(shí)的

率之比(相對(duì) 度)為:RR

ht

h0

t

exp1

1

2

1h'

t

h0

t

exp1

0

2

089兩組

的 率分別為:h

(t,

Xi

)

h0

(t)

exp(b1x1

b2

x2

)治療組:

h

t

h01t(0

0h(t,

X

j

)

h0

(t)

exp(b1x1

b2

x2

)未治療組:

h0

(t)

exp(

0.360

0

0.333

0)

h0

(t)二者的比值為:RR

ht,

X

i

/

ht,

X

j

0.5實(shí)例:胃癌患者的預(yù)后;手術(shù)治療(X1:X1=1,施行手術(shù),X1=0,未施行手術(shù));放射治療(X2:X2=1,接受放療,X2=0,未接受放療);得偏回歸系數(shù)1

、2

估計(jì)值分別為Cox

回歸方程:ht/x

.x1

0.3b60

2

0.3b33

0.3ex6p0x1

0.333x2

h021tCox回歸基本模型的兩個(gè)前提假設(shè):①各

的作用不隨時(shí)間變化而變化,即h0t

()ht()不隨時(shí)間變化而變化;②各之間不存在交互作用。9091二、Cox回歸分析的步驟:確定自變量和因變量參數(shù)估計(jì),擬和模型對(duì)模型的假設(shè)檢驗(yàn)?zāi)P偷慕忉尲皯?yīng)用對(duì)模型的擬和優(yōu)度檢驗(yàn)?zāi)P偷膮?shù)估計(jì)(一)參數(shù)估計(jì)-偏似然估計(jì)假定有n

個(gè),他們的生存時(shí)間由小到大排列:t1

t2

t

n對(duì)于每個(gè)生存時(shí)間ti來(lái)說(shuō),凡生存時(shí)間大于ti的所有 組成一個(gè)

集,記為

Rti

。在 集內(nèi)的

,在ti

以前尚生存,但隨著時(shí)間的推移,

集內(nèi)的直至最后一個(gè)陸續(xù)

,逐漸退出觀察,時(shí),

。92e

b1

x1

b2x2eb1

b2eb1

b2e

0e

0eb2eb2eb2eb1eb1eb1eb1qi

hi(t)

hj(t)1

22121,ieb1

b2b

be

e0

eb

ebe0

ebq:偏似然函數(shù)(條件概率連乘)p21

qL1eb1

b2L

93SR(ti

)SR(ti

)exp

1

X

i1exp

1

X

s1

2

X

s2

P

X

sm

2

X

i2

p

X

im

h0

t

exp

1

X

s1

2

X

s2

P

X

sm

h0

t

exp

1

X

i1

2

X

i2

p

X

im

SR(t)niLP

X

sm

exp

X

X

Xexp1

X

s12

i

2

p

im

2

X

s

21

i1i1第i

個(gè)研究對(duì)象在ti

時(shí)刻的概率應(yīng)當(dāng)是兩部分的乘積,一是患者存活到ti

時(shí)刻的概率(與h0(t)有關(guān)),二是該人群Ri

中恰好第i

個(gè)患者的概率(qi),L

忽略了前者,故稱(chēng)之為偏似然函數(shù)。代表ti時(shí)刻以后

集R(ti)中對(duì)似然函數(shù)作貢獻(xiàn)的將n個(gè) 的

條件概率相乘9495有截尾值時(shí),用i

來(lái)表示數(shù)據(jù)類(lèi)型:

i

1,表示在ti

時(shí)刻病人

。

i

0

,表示

在ti

時(shí)刻截尾。其偏似然函數(shù)為:

nm

smRS(ti)i12

s

21

s1i2

Xi

2exp1

Xi1L(

)

exp

X

X

X

m

Xim

SR(t)mi

lni1

j

1exp

j

X

sj

m

Ximn

11X

iiln

L()

j求關(guān)于

j

j

1,2,,m的一階偏導(dǎo)數(shù),并求其等于0(即

ln

L(

)

0

)的解,得到

j

的最大似然估計(jì)值。兩邊取自然對(duì)數(shù)可以解決截尾值問(wèn)題96(二)建立最佳模型為建立最佳模型常需對(duì)研究的因素進(jìn)行篩選,篩選方法有前進(jìn)法、后退法和逐步回歸法。實(shí)際工作中要根據(jù)具體情況選擇使用,最常用的為逐步回歸法。因素篩選時(shí)需規(guī)定顯著性水平,一般情況下初步篩選因素的顯著性水平確定為0.1或0.15,設(shè)計(jì)較嚴(yán)格的研究顯著性水平可確定為0.05。另外,篩選因素時(shí),還要考慮因素間共線性的影響。當(dāng)存在共線性時(shí),應(yīng)考慮消除共線的影響,如采用主成分回歸等方法。模型的假設(shè)檢驗(yàn)1.似然比檢驗(yàn)(likelihood

ratio

test)用于模型中原有不顯著的變量的剔除和新變量的引入,以及包含不同變量數(shù)的各模型的比較。假定建立一個(gè)包含p

個(gè)因素的模型,其偏回歸系數(shù)為向量

,根據(jù)最大似然函數(shù)估計(jì)得到的似然函數(shù)值為L(zhǎng)p,在上述模型中再增加

1個(gè)因素,建立

1個(gè)新模型,對(duì)應(yīng)的偏回歸系數(shù)

為向量

*

,根據(jù)最大似然估計(jì)得到的似然函數(shù)值為

Lp

1,檢驗(yàn)統(tǒng)計(jì)量為:

2

2ln

Lp

1

ln

Lp上式服從于度為1的

2

分布。97982.得分檢驗(yàn)(score

test)

可檢驗(yàn)一個(gè)或多個(gè)新變量能否引入模型,也可用于檢驗(yàn)變量間的交互作用。假定已建立一個(gè)包含p

個(gè)因素的模型,其參數(shù)估計(jì)為向量

,信息矩陣為I,方差-協(xié)方差矩陣為V,當(dāng)增加第k

個(gè)變量時(shí),其對(duì)應(yīng)的偏回歸系數(shù)為k

,將模型中包含p

個(gè)因素的偏回歸系數(shù)向量和k

代入下式,nSR(

t

)j

sj

mi

iX

lni1

j

11

i1

m

imexp

Xln

L(

)

X

求其一階偏導(dǎo)數(shù)f

k

、二階偏導(dǎo)數(shù)gk

、二階混合偏導(dǎo)數(shù)Gk

和V=I-1,則

是否為

0

的假設(shè)檢驗(yàn)可如下計(jì)算

2

統(tǒng)計(jì)量:k

k

gk

Gk

VGk

f

2

2

K

2

服從

度為

1

2

分布,式中G‘為Gk

轉(zhuǎn)置的列向量。3.Wald

檢驗(yàn)用于檢驗(yàn)?zāi)P椭械淖兞渴欠駪?yīng)從模型中剔除。假定已建立1

個(gè)包含

p

個(gè)因素的模型,對(duì)應(yīng)的偏回歸系數(shù)為向量

,其信息矩陣與方差-協(xié)方差矩陣分別用I

和V

表示,并可求得各偏回歸系數(shù)的標(biāo)準(zhǔn)誤。如果要檢驗(yàn)?zāi)P椭械?/p>

k

個(gè)因素對(duì)模型的貢獻(xiàn)是否有意義,對(duì)應(yīng)的Wald

檢驗(yàn)統(tǒng)計(jì)量為:]2

2

[

sw k

k, 服從 度為

1

2

分布其中

s

表示偏回歸系數(shù)

k

的標(biāo)準(zhǔn)誤。k另外Wald

檢驗(yàn)還可按參數(shù)的區(qū)間推斷模型內(nèi)的參數(shù)是否為

0,其方法是當(dāng)偏回歸系數(shù)

95%的區(qū)間包含

0

時(shí),則認(rèn)為總體偏回歸系數(shù)為0。99Cox模型的解釋及應(yīng)用,分析各因素的作探索結(jié)局事件發(fā)生的用大小。計(jì)算

預(yù)后指數(shù)(prognosis

index,

PI),對(duì)個(gè)體進(jìn)行定性的預(yù)后評(píng)價(jià)。通過(guò)估計(jì)生存率,對(duì)群體定量地進(jìn)行預(yù)后評(píng)價(jià)。1001.探索結(jié)局事件發(fā)生的 ,分析各因素的作用大小。在分析時(shí)Cox模型可以給出偏回歸系數(shù)和標(biāo)準(zhǔn)偏回歸系數(shù),標(biāo)準(zhǔn)偏回歸系數(shù)

i

'

與偏回歸系數(shù)

i

的關(guān)系為:i'

i

i

,根據(jù)各因素對(duì)應(yīng)的偏回歸系數(shù)大小,可以計(jì)算相對(duì)度(RR):RRi

=exp(

?i

)相對(duì)度1%

exp[

?i

u

SE?

i]區(qū)間為:影響因素Xi的標(biāo)準(zhǔn)差u

分布的界值相應(yīng)偏回歸系數(shù)的標(biāo)準(zhǔn)誤1012.計(jì)算預(yù)后指數(shù)(prognosis

index,PI),對(duì)進(jìn)行定性的預(yù)后評(píng)價(jià)。從Cox模型可以看出, 的風(fēng)險(xiǎn)率與該

具有的及各因素對(duì)應(yīng)的偏回歸系數(shù)有關(guān)。對(duì)各變量進(jìn)行標(biāo)準(zhǔn)轉(zhuǎn)換后進(jìn)行模型擬合,可得到各因素對(duì)應(yīng)的標(biāo)準(zhǔn)偏回歸系數(shù),此時(shí)定義第

j

個(gè)觀察單位的預(yù)后指數(shù)為:

PI

'

''

'

bbb'

xx'xj

j

1212

j

m

1m'ibi其中

為第

個(gè)協(xié)變量的標(biāo)準(zhǔn)偏回歸系數(shù)i

'的估計(jì)值iii(

bb'

s'ijx),

為第j

個(gè)觀察單位()第i

個(gè)協(xié)變量的標(biāo)準(zhǔn)化值。PI

jPI

jPI

j

0

,說(shuō)明該0

,說(shuō)明該

0

,說(shuō)明該風(fēng)險(xiǎn)處于平均水平;風(fēng)險(xiǎn)高于平均水平;風(fēng)險(xiǎn)低于平均水平。1023.通過(guò)估計(jì)生存率,對(duì)群體定量地進(jìn)行預(yù)后評(píng)價(jià)。

由于生存率與基礎(chǔ)生存率相關(guān),只要估計(jì)出基礎(chǔ)生存

率,再結(jié)合各因素的偏回歸系數(shù)就可以估計(jì)出生存率,103即

StdtS

t,

X

exp

t

exp

X

00

exp

0h

t

exp

X

0ht,

X

dt

t104S?0

ti

exp

H

0

(

ti

)k

iIt

tsdksR(t

)0

i(t

)

H?

exp(

X

)iit??exp'

X

0

iSt

S

ti時(shí)刻的基礎(chǔ)生存率公式ti時(shí)刻的基礎(chǔ)累計(jì)風(fēng)險(xiǎn)函數(shù)公式在ti時(shí)刻的 人數(shù)ti時(shí)刻的生存率計(jì)算公式Cox模型的擬合優(yōu)度可將研究對(duì)象按 預(yù)后指數(shù)恰當(dāng)?shù)胤纸M,用乘積極限法估計(jì)各組的生存率曲線,并與按Cox模型預(yù)后指數(shù)分類(lèi)的生

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論