版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、Cox回歸分析,劉瑞紅,利用生存率函數(shù)S(t,X)與風(fēng)險(xiǎn)函數(shù)h(t,X)的關(guān)系可導(dǎo)出,較好地解決截尾值的問題,反映了協(xié)變量X與生存函數(shù)的關(guān)系,Cox模型的基本形式,所有危險(xiǎn)因素為0時(shí)的基礎(chǔ)風(fēng)險(xiǎn)率,它是未知的,但假定它與h(t,X)是呈比例的。,右側(cè)可分為兩部分:h0(t)沒有明確的定義,分布無明確的假定,參數(shù)無法估計(jì),為非參數(shù)部分;另一部分是參數(shù)部分,其參數(shù)可以通過樣本的實(shí)際觀察值來估計(jì)的,正因?yàn)镃ox模型有非參數(shù)和參數(shù)兩部分組成,故又稱為半?yún)?shù)模型。,若i0,則RR1,該因素為危險(xiǎn)因素; 若i0,則RR1, 該因素為保護(hù)因素; 若i=0,則RR=1, 該因素為無關(guān)因素。,偏回歸系數(shù)i的意義是
2、,當(dāng)其它協(xié)變量都不變時(shí),Xi每變化一個(gè)單位,相對(duì)危險(xiǎn)度的自然對(duì)數(shù)(lnRR)變化i個(gè)單位。,相對(duì)危險(xiǎn)度RR,相對(duì)危險(xiǎn)度RR,同時(shí)考慮2個(gè)協(xié)變量,2個(gè)因素都存在的危險(xiǎn)率與2個(gè)因素都不存在時(shí)的危險(xiǎn)率之比(相對(duì)危險(xiǎn)度)為,Cox回歸基本模型的兩個(gè)前提假設(shè),各危險(xiǎn)因素的作用不隨時(shí)間變化而變化,即 不隨時(shí)間變化而變化; 對(duì)數(shù)線性假定:模型中的協(xié)變量應(yīng)該與對(duì)數(shù)風(fēng)險(xiǎn)比成線性關(guān)系。,Cox回歸模型與一般的回歸分析不同,它不是直接用生存時(shí)間作為回歸方程的因變量,協(xié)變量對(duì)生存時(shí)間的影響是通過風(fēng)險(xiǎn)函數(shù)和基礎(chǔ)風(fēng)險(xiǎn)函數(shù)的比值反映的,其中的風(fēng)險(xiǎn)函數(shù)和基礎(chǔ)風(fēng)險(xiǎn)函數(shù)是未知的。另外偏回歸系數(shù)的估計(jì)需要借助于偏似然函數(shù)的方法。在
3、完成參數(shù)估計(jì)的情況下,可對(duì)基礎(chǔ)風(fēng)險(xiǎn)函數(shù)和風(fēng)險(xiǎn)函數(shù)做出估計(jì),并可計(jì)算每一個(gè)時(shí)刻的生存率。,二、Cox回歸分析的一般步驟,1. 分析前的準(zhǔn)備-數(shù)據(jù)整理 2. 參數(shù)估計(jì),建立最佳模型 3. 假設(shè)檢驗(yàn) 4. Cox模型的解釋及應(yīng)用 5. Cox模型擬合優(yōu)度的考察,1. 分析前的準(zhǔn)備-數(shù)據(jù)整理,嚴(yán)密的研究設(shè)計(jì) 收集資料:影響疾病的因素、病人的個(gè)性及行為特征等資料(如病人的年齡、性別、職業(yè)、是否飲酒、是否吸煙及病情、病理類型等資料)、研究對(duì)象的生存時(shí)間和截尾指示變量(一般用變量t表示生存時(shí)間,用變量d表示是否截尾)。資料應(yīng)盡量避免偏性及主觀因素的影響。 樣本含量:不宜過小。一般情況下,樣本例數(shù)應(yīng)為分析因素
4、的5-20倍。 數(shù)據(jù)預(yù)處理:如數(shù)據(jù)的變換、日歷數(shù)據(jù)與生存時(shí)間的轉(zhuǎn)化等。同時(shí)要對(duì)數(shù)據(jù)進(jìn)行描述性分析。,2. 參數(shù)估計(jì),建立最佳模型,(1) 參數(shù)估計(jì)-偏似然估計(jì) 假定有n個(gè)病人,他們的生存時(shí)間由小到大排列: t1t2tn 對(duì)于每個(gè)生存時(shí)間ti來說,凡生存時(shí)間大于等于ti的所有病人組成一個(gè)危險(xiǎn)集,記為R(ti)。在危險(xiǎn)集內(nèi)的病人,在ti以前尚生存,但處在危險(xiǎn)之中,隨著時(shí)間的推移,危險(xiǎn)集內(nèi)的病人陸續(xù)死亡,逐漸退出觀察,直至最后一個(gè)病人死亡時(shí),危險(xiǎn)集消失。,代表ti時(shí)刻以后危險(xiǎn)集R(ti)中對(duì)似然函數(shù)作貢獻(xiàn)的個(gè)體,將n個(gè)病人死亡的 條件概率相乘,兩邊取自然對(duì)數(shù),(2) 建立最佳模型,為建立最佳模型常需
5、對(duì)研究的因素進(jìn)行篩選,篩選方法有前進(jìn)法、后退法和逐步回歸法。實(shí)際工作中要根據(jù)具體情況選擇使用,最常用的為逐步回歸法。 因素篩選時(shí)需規(guī)定顯著性水平,一般情況下初步篩選因素的顯著性水平確定為0.1或0.15,設(shè)計(jì)較嚴(yán)格的研究顯著性水平可確定為0.05。 另外,篩選因素時(shí),還要考慮因素間共線性的影響。當(dāng)存在共線性時(shí),應(yīng)考慮消除共線的影響,如采用主成分回歸等方法。,3. 參數(shù)的假設(shè)檢驗(yàn),(1) 似然比檢驗(yàn)(likelihood ratio test) (2) 得分檢驗(yàn)(score test)(又稱為拉格朗日乘數(shù)法) (3) Wald檢驗(yàn) 是三種基于極大似然法大樣本檢驗(yàn)方法。,似然比檢驗(yàn):用于模型中原有
6、不顯著變量的剔除和顯著變量的引入,以及包含不同變量數(shù)時(shí)模型間的比較。檢驗(yàn)新增加的協(xié)變量是否有統(tǒng)計(jì)學(xué)意義的統(tǒng)計(jì)量為:,拉格朗日乘子檢驗(yàn)(LM),基本思想:拉格朗日乘子檢驗(yàn)(LM),又稱為Score檢驗(yàn)。該檢驗(yàn)基于約束模型,無需估計(jì)無約束模型。 假設(shè)約束條件為 ,在約束條件下最大化對(duì)數(shù)似然函數(shù),另 表示拉格朗日乘子向量,此時(shí),拉格朗日函數(shù)為 約束條件下最大化問題就是求解下式根,,拉格朗日乘子檢驗(yàn)(LM),如果約束成立,對(duì)數(shù)似然函數(shù)值不會(huì)有顯著變化。這就意味著在一階條件下,第二項(xiàng)應(yīng)該很小,特別是 應(yīng)該很小。因此,約束條件是否成立檢驗(yàn)轉(zhuǎn)化成檢驗(yàn) ,這就是拉格朗日乘子檢驗(yàn)的思想。 但是直接檢驗(yàn) 比較困難
7、,有一個(gè)等價(jià)而簡單的方法。如果約束條件成立,在約束估計(jì)值處計(jì)算對(duì)數(shù)似然函數(shù)的導(dǎo)數(shù)應(yīng)該近似為零,如果該值顯著異于零,則約束條件不成立,拒絕原假設(shè)。 對(duì)數(shù)似然函數(shù)的導(dǎo)數(shù)就是得分向量,因此,LM檢驗(yàn)就是檢驗(yàn)約束條件下參數(shù)估計(jì)值的得分向量值是否顯著異于零,因而,LM檢驗(yàn)又稱為得分檢驗(yàn)。,拉格朗日乘子檢驗(yàn)(LM),在最大似然估計(jì)過程中,通過解似然方程 ,可以求出無約束估計(jì)量 ;如果計(jì)算有約束估計(jì)量 在此處得分,則 一般不為零,但是如果約束有效,則 趨近于零。 在原假設(shè)成立條件下,,拉格朗日乘子檢驗(yàn)(LM),對(duì)于線性約束 將有關(guān)量代入上式得, 拒絕域,,拉格朗日乘子檢驗(yàn)(LM),LM統(tǒng)計(jì)量另一種表達(dá)形式,
8、 LR、 Wald 、LM關(guān)系(一般情況下成立):,4. Cox模型的解釋及應(yīng)用,(1) 探索結(jié)局事件發(fā)生的危險(xiǎn)因素,分析各因素的作用大小。 (2) 計(jì)算個(gè)體預(yù)后指數(shù)(prognosis index,PI),對(duì)個(gè)體進(jìn)行定性的預(yù)后評(píng)價(jià)。 (3) 通過估計(jì)生存率,對(duì)群體定量地進(jìn)行預(yù)后評(píng)價(jià)。,影響因素Xi的標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)正態(tài)離差,相應(yīng)偏回歸系數(shù)的標(biāo)準(zhǔn)誤,(2)計(jì)算個(gè)體預(yù)后指數(shù)(prognosis index,PI),對(duì)個(gè)體進(jìn)行定性的預(yù)后評(píng)價(jià)。 定義第j個(gè)觀察單位的預(yù)后指數(shù)為: 式中 為第i個(gè)協(xié)變量的標(biāo)準(zhǔn)偏回歸系數(shù) 的估計(jì)值( ), 為第j個(gè)觀察單位(個(gè)體)第i個(gè)協(xié)變量的標(biāo)準(zhǔn)化值。 若PIj=0,說明該
9、個(gè)體死亡風(fēng)險(xiǎn)處于平均水平; 若PIj0,說明該個(gè)體死亡風(fēng)險(xiǎn)高于平均水平; 若PIj0,說明該個(gè)體死亡風(fēng)險(xiǎn)低于平均水平。,3通過估計(jì)生存率,對(duì)群體定量地進(jìn)行預(yù)后評(píng)價(jià)。,由于生存率與基礎(chǔ)生存率相關(guān),故只要估計(jì)出基礎(chǔ)生存率,再結(jié)合各因素的偏回歸系數(shù)就可以估計(jì)出生存率, 即,ti 時(shí)刻的基礎(chǔ)生存率公式,ti 時(shí)刻的基礎(chǔ)累計(jì)風(fēng)險(xiǎn)函數(shù)公式,在tk時(shí)刻的死亡人數(shù),ti 時(shí)刻的生存率計(jì)算公式,2.Breslow法,5. Cox模型擬合優(yōu)度的考察,可將研究對(duì)象按個(gè)體預(yù)后指數(shù)恰當(dāng)?shù)胤纸M,用乘積極限法估計(jì)各組的生存率曲線,并與按Cox模型預(yù)后指數(shù)分類的生存率曲線在同一坐標(biāo)系內(nèi)進(jìn)行比較,若兩種曲線具有一致性,說明模型
10、擬合較理想。也可以使用卡方檢驗(yàn)的方法。,比例風(fēng)險(xiǎn)假定(PH假定):,PH假定的檢驗(yàn)方法大致可以分為圖法和正規(guī)的檢驗(yàn)方法。 圖法:即通過觀察散點(diǎn)圖中散點(diǎn)的分布或趨勢是否滿足既定模型基本假設(shè)下的形狀來判斷資料是否滿足或近似滿足模型假定,主要的方法有:比較COX-KM生存曲線、基于累計(jì)風(fēng)險(xiǎn)函數(shù)的圖示法、Schoenfeld殘差圖、Score殘差圖; 正規(guī)的檢驗(yàn)方法:通過構(gòu)造滿足既定模型基本假定下服從某一已知分布的統(tǒng)計(jì)量,利用P值來檢驗(yàn)資料是否滿足或近似滿足模型假定。主要方法有:時(shí)協(xié)變量法、線性相關(guān)檢驗(yàn)、加權(quán)殘差Score檢驗(yàn)、三次樣條函數(shù)法 .Cox比例風(fēng)險(xiǎn)回歸模型診斷及預(yù)測有關(guān)問題的研究_余紅梅.
11、caj.caj,對(duì)數(shù)線性假定,主要的方法:多重法;鞅殘差法;改進(jìn)的鞅殘差法;構(gòu)造變量法 Cox回歸影響點(diǎn)的分析 鞅殘差,剩余殘差,得分殘差,Schoenfeld殘差, 加權(quán)Schoenfeld殘差,R程序:,在survival包中的函數(shù): coxph(formula,data,weights,subset,na.action) formula:反應(yīng)變量要有Surv()函數(shù)定義 cox.zph(fit,transform= ,global=T/F) 檢驗(yàn)比例風(fēng)險(xiǎn)假定 basehaz(fit,centered=T/F) 計(jì)算基礎(chǔ)風(fēng)險(xiǎn)率的函數(shù),getwd() setwd(C:/Users/Admin
12、istrator/Desktop) my-read.csv(pharynx.csv,header=T) attach(my) my-myCOND!=9 model =/選項(xiàng); strata freq ; by ; Proportionality_test:test ;/*比例風(fēng)險(xiǎn)假定,時(shí)協(xié)變量法*/ run ;,libname ll F:R語言學(xué)習(xí)COX; data a; set ll.pharynx; run; data a; set a; if cond=9 or grade=9 then delete; if cond=3 or cond=4 then cond=2; if cond=0
13、 then cond=1; run; proc phreg data=a; model time*status(0)=tx cond site t_stage n_stage age grade inst/selection=stepwise risklimits sle=0.15 sls=0.15; baseline out=cox survival=suv stderr=stderr /method=ch; run;,四、Cox模型的適用范圍及注意事項(xiàng),1. 適用范圍 Cox模型適用于生存資料的統(tǒng)計(jì)分析,屬半?yún)?shù)模型,對(duì)資料沒有特殊的要求,也可以估計(jì)各因素的參數(shù),并能做多因素的統(tǒng)計(jì)分析。該
14、模型的主要優(yōu)點(diǎn)在于能從眾多的影響因素中排除混雜因素的影響,找出影響生存時(shí)間的因素,根據(jù)各因素的參數(shù)估計(jì)出個(gè)體的生存率。 另外,Cox模型能分析具有截尾數(shù)值的生存時(shí)間。 Cox模型可以分析多種因素對(duì)疾病預(yù)后的影響,使其更適合于臨床的隨訪研究。Cox模型使臨床觀察的定性指標(biāo)又加上定量指標(biāo)進(jìn)行分析,提高了分析的效率。,2. 注意事項(xiàng),(1) 設(shè)計(jì)階段應(yīng)注意的問題 樣本的代表性要好。樣本的含量為觀察協(xié)變量的5-20倍。 所有危險(xiǎn)因素要在設(shè)計(jì)時(shí)考慮全面,避免漏掉重要因素和加入無關(guān)因素。 生存時(shí)間的定義要明確。起始事件和終點(diǎn)事件要有明確規(guī)定,時(shí)間盡可能精確測量。 研究的協(xié)變量在研究對(duì)象中的分布要適中,否則
15、會(huì)給參數(shù)的估計(jì)帶來困難。 在設(shè)計(jì)時(shí)要注意影響時(shí)間的效應(yīng)因素。如研究吸煙對(duì)肺癌患者生存率的影響,若本來吸煙的人因患肺癌而戒煙,則一般模型不易分析吸煙的作用,需考慮吸煙量隨時(shí)間變化的趨勢。如果研究的因素隨時(shí)間而發(fā)生變化,必要時(shí)可以采用伴時(shí)協(xié)變量的Cox模型進(jìn)行分析。,注意事項(xiàng),(2) 模型擬合時(shí)應(yīng)注意的問題 多重共線性問題:醫(yī)學(xué)研究中的許多變量間并不是獨(dú)立的,但通常不會(huì)影響分析的結(jié)果,如果變量間存在高度的相關(guān),則會(huì)影響Cox模型的參數(shù)估計(jì),此時(shí)可采用主成分分析法或R型聚類分析法消除多元共線性的影響。 應(yīng)注意Cox模型要求病人的風(fēng)險(xiǎn)函數(shù)與基礎(chǔ)風(fēng)險(xiǎn)函數(shù)呈比例,如果這一假定不成立,則不能用Cox模型進(jìn)行分析。,注意事項(xiàng),(3) 模型應(yīng)用時(shí)應(yīng)注意的問題 結(jié)果的解釋應(yīng)結(jié)合專業(yè)知識(shí)。Cox模型與其他回歸分析一樣,當(dāng)進(jìn)入模型中的因素有統(tǒng)計(jì)學(xué)意義時(shí),該因素與生存時(shí)間不一定有因果關(guān)系,其中有一部分因素與生存時(shí)間的關(guān)系為伴隨關(guān)系。 Cox回歸的生存率一般不宜用于不同資料之間的比較,因?yàn)榛鶞?zhǔn)危險(xiǎn)率函數(shù)只在同一份資料內(nèi)保持相同,不同資料的基準(zhǔn)危險(xiǎn)率往往不同;而且在多因素分析的情況下,協(xié)變量組合也很難一致,可比性難以保證。,3. Co
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 化工廠介紹教學(xué)課件
- 江蘇省南京市2025-2026南京秦淮區(qū)九上期末物理卷(無答案)
- 海南省??谑?025-2026學(xué)年八年級(jí)上學(xué)期1月期末考試英語試卷(含答案無聽力原文及音頻)
- 化工企業(yè)大修培訓(xùn)課件
- 飛機(jī)飛行原理科普
- 飛機(jī)科普小知識(shí)
- 2026廣東廣州市天河區(qū)長興街道綜合事務(wù)中心招聘環(huán)衛(wèi)保潔員參考考試題庫及答案解析
- 食堂食品分配制度
- 2026年上半年玉溪師范學(xué)院招聘(6人)筆試參考題庫及答案解析
- 禮泉春節(jié)活動(dòng)策劃方案(3篇)
- 中建“大商務(wù)”管理實(shí)施方案
- 2024-2030年中國輻射監(jiān)測儀表行業(yè)市場供需態(tài)勢及投資前景研判報(bào)告
- GB/T 14048.11-2024低壓開關(guān)設(shè)備和控制設(shè)備第6-1部分:多功能電器轉(zhuǎn)換開關(guān)電器
- 2024年國家國防科工局重大專項(xiàng)工程中心面向應(yīng)屆生招考聘用筆試參考題庫附帶答案詳解
- 福建省寧德市2023-2024學(xué)年高一上學(xué)期期末質(zhì)量檢測物理試題(原卷版)
- 《油氣儲(chǔ)運(yùn)安全技術(shù)》課件第九章 液化石油氣儲(chǔ)運(yùn)安全與管理
- 2023修訂版《托育中心、幼兒園建筑設(shè)計(jì)規(guī)范》
- 2018廣州一模作文講練評(píng)
- 生物化學(xué):實(shí)驗(yàn)七 牛乳中酪蛋白的制備
- 旋磁治療機(jī)前列腺總結(jié)報(bào)告
- 《自信的秘密》節(jié)選
評(píng)論
0/150
提交評(píng)論