版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、復(fù)習(xí)、Logistic回歸模型為概率模型,適合于病例對(duì)照研究、隨訪研究和橫斷面研究,結(jié)果變量的取值應(yīng)分為二分或多項(xiàng)分類。 影響結(jié)果變量產(chǎn)生的因素可以建立自變量和因素變量的回歸公式。 復(fù)習(xí),1.Logistic回歸分析的數(shù)據(jù)結(jié)構(gòu)2.Logistic回歸分析的模型3 .篩選變量的常用方法4.Logistic回歸分析的結(jié)果說明,目的:在多個(gè)參數(shù)(影響因素)中變形量(結(jié)果變量) 建立logistic回歸方程的估計(jì)資料:1.應(yīng)變量是一種現(xiàn)象的發(fā)生和不發(fā)生的二值變量2 .自變量(影響因素)可能是二值數(shù)據(jù)或等級(jí)數(shù)據(jù)或計(jì)量數(shù)據(jù)。 分類變量量化的用途:研究某些疾病和現(xiàn)象的發(fā)生與多個(gè)危險(xiǎn)因子(或保護(hù)因子)的數(shù)量關(guān)
2、系,1.Logistic回歸模型的數(shù)據(jù)結(jié)構(gòu),假設(shè)資料中有一個(gè)因素變量y,p個(gè)參數(shù)X1,X2,Xp,每個(gè)被實(shí)驗(yàn)者有n次觀測(cè)結(jié)果,表示原始資料5、表1.Logistic回歸模型的數(shù)據(jù)結(jié)構(gòu)實(shí)驗(yàn)對(duì)象yx 1x2x3. XP 1y1a 11a 12 a13 p2y2a 22 a 23 a2p 3y3a 31a 33 a3 pny nan1an2an3np, 表2 .肺癌和危險(xiǎn)因素的調(diào)查分析例子編號(hào)是否生病性別吸煙年齡地區(qū)10103002001461310035130100261疾?。?1為no,0為性別: 1為男性,0為女性吸煙: 1為吸煙,0為非吸煙地區(qū): 1為農(nóng)村,0為城市表3 .配對(duì)資料(1:1
3、x1x2x 311301203113012030120202525252525252525252525252525252525252525252525252525252525252525252 25352535253525353525353535353535353535353535353535353535353535353535353令: Y=1發(fā)病(陽(yáng)性、死亡、治愈等) Y=0未發(fā)病(陰性、陰性然后將參數(shù)x1、x2、xp之間的Logistic回歸模型定義為:定義: Logistic變換,即:2.Logistic回歸模型,3 .篩選變量的常用方法正向后退法設(shè)逐次回歸法(stepwisesele
4、ction )、4.Logistic回歸的結(jié)果解釋,4.Logistic回歸的結(jié)果解釋,第I個(gè)要素的回歸系數(shù)為bi,在存在多個(gè)參數(shù)的情況下,在其他參數(shù)為一定的情況下,每增加1個(gè)單位就得到參數(shù)Xi 即,如果在其它參數(shù)是恒定的情況下,每當(dāng)參數(shù)Xi增加1個(gè)單位,就會(huì)影響在變量Y=0處產(chǎn)生的倍數(shù),并且第I個(gè)元素的回歸系數(shù)為bi和bi0,則對(duì)應(yīng)的優(yōu)勢(shì)比ORi=exp(bi)1與bi0相對(duì)應(yīng),指示該元素為危險(xiǎn)元素說明這一因素是保護(hù)因素,宋曼殳公共衛(wèi)生學(xué)院傳染病和衛(wèi)生統(tǒng)計(jì)系、生存分析、醫(yī)學(xué)科學(xué)研究的統(tǒng)計(jì)學(xué)方法、急性疾病的治療效果評(píng)價(jià)一般可以使用治愈率、病死率等指標(biāo),但對(duì)于腫瘤、結(jié)核及其他慢性疾病,其預(yù)后可以
5、在短時(shí)間內(nèi)明確地判斷臨床試驗(yàn)研究通常觀察各對(duì)象各時(shí)刻事件的發(fā)生情況(結(jié)局),評(píng)價(jià)臨床治療效果。 比較不同治療方法的治療效果時(shí),不僅要考慮有效與否,還要考慮從試驗(yàn)開始到治療效果出現(xiàn)的時(shí)間。 例:假設(shè)治療甲乙兩種藥物的病,其治愈率均為80,可以說兩種療效一致,也要考慮時(shí)間效果問題,甲藥平均3天治愈80,乙藥平均7天治愈80,甲藥比乙藥治療效果好。 評(píng)價(jià)18、2種治療方法的好壞,不能簡(jiǎn)單地比較治愈率和效率,也能看到結(jié)果出現(xiàn)的時(shí)間的長(zhǎng)短,所以在不包含t檢定和卡方檢定等時(shí)間要素的方法中,有必要學(xué)習(xí)新的方法。 長(zhǎng)期隨訪疾病,可以統(tǒng)計(jì)一定年限后的生存和死亡情況來判斷治療效果。 這需要“生存分析”。主要內(nèi)容是
6、基本概念生存率估計(jì)和生存曲線生存曲線的log-rank檢驗(yàn),生存時(shí)間:由任意兩個(gè)相關(guān)事件之間的時(shí)間間隔、終點(diǎn)(故障)事件和開始事件之間的時(shí)間間隔、常用符號(hào)t表示。 廣義的生存時(shí)間被定義為從一個(gè)開始事件到結(jié)束事件的時(shí)間寬度。 狹義的生存時(shí)間多指患病患者從發(fā)病到死亡的時(shí)間范圍,一、基本概念、一、基本概念、生存時(shí)間(survivaltime ) :一邊看疾病治療的預(yù)后,一邊看結(jié)果的好壞,看其結(jié)果出現(xiàn)的時(shí)間的長(zhǎng)度,把經(jīng)歷的時(shí)間稱為生存時(shí)間開始事件是反映生存時(shí)間開始特征的事件,如疾病的確診、某些疾病治療的開始、接觸毒物等,研究設(shè)計(jì)時(shí)需要明確規(guī)定。 終點(diǎn)事件是反映結(jié)局特征的事件,也稱為死亡事件、失效事件。
7、 腎移植患者腎功能喪失導(dǎo)致的死亡、急性白血病患者的復(fù)發(fā)、癌癥患者的死亡等。 在討論設(shè)計(jì)時(shí)也需要事先明確規(guī)定。 作為生存時(shí)間的例子,事件結(jié)束事件的治療開始(服藥)病已痊愈的死亡手術(shù)切除死亡接觸毒物的反應(yīng)化療以緩解復(fù)發(fā),生存分析(survivalanalysis )是將事件結(jié)束事件和該結(jié)束事件的經(jīng)過時(shí)間結(jié)合起來分析的統(tǒng)計(jì)分析方法。 在可以分析完整數(shù)據(jù)的資料的同時(shí),包含不完整數(shù)據(jù)的資料的生存分析和其他多因素分析的主要區(qū)別在于生存分析考慮了每觀測(cè)一次結(jié)局的時(shí)間長(zhǎng)度。 一、基本概念、生存分析:不完整的數(shù)據(jù)提供了一些信息。 必須用特別的方法進(jìn)行統(tǒng)計(jì)處理。 這種統(tǒng)計(jì)方法來源于壽命數(shù)據(jù)的統(tǒng)計(jì)分析,因此被稱為生
8、存分析。 生存分析:研究生存時(shí)間分布規(guī)律、生存時(shí)間與相關(guān)因素之間關(guān)系的統(tǒng)計(jì)分析方法。 主要反映慢性病的指標(biāo)可以很好地處理不完整的隨訪資料,一方面基本概念、臨床試驗(yàn)及其隨訪資料特征的一些研究對(duì)象可以觀察死亡,得到正確的生存時(shí)間,提供的信息稱為完整數(shù)據(jù)(completedata )。 其他一些患者由于失訪、事故或觀察結(jié)束時(shí)生存等原因,無法知道正確的生存時(shí)間,提供不完整的信息,稱為不完整的數(shù)據(jù)(切片數(shù)據(jù)、缺失數(shù)據(jù)censoreddata )。 生存時(shí)間的類型,完全數(shù)據(jù)(completedata ) :從起點(diǎn)到死亡(因研究的病死亡)的經(jīng)過時(shí)間。 切片數(shù)據(jù)(缺失數(shù)據(jù)、censoreddata ) :從起
9、點(diǎn)到切片點(diǎn)的經(jīng)過時(shí)間。 最后原因:失去訪問,死于其他疾病,觀察結(jié)束時(shí)患者還活著等。 資料收集、生存時(shí)間一般通過隨訪收集。 跟進(jìn)內(nèi)容確定開始跟進(jìn)的時(shí)間(觀察起點(diǎn))。 例如住院時(shí)間、確診時(shí)間、開始治療的時(shí)間等。 例如乳腺癌:乳腺切除的第一天,出院日白血?。撼鲈喝眨_始治療的日子。 確診時(shí)間、手術(shù)時(shí)間、治療開始時(shí)間、出院時(shí)間等比較正確,經(jīng)常作為隨訪開始時(shí)間。隨訪結(jié)果顯示,死亡,即處理無效,結(jié)束時(shí)間以“死亡”時(shí)間生存,但中途失去訪問,拒絕訪問,或失去聯(lián)系,中途退出考試,其結(jié)束時(shí)間以最后的訪問時(shí)間為基準(zhǔn),因與其他研究疾病無關(guān)的原因死亡,如肺癌患者因交通事故等死亡,其隨訪結(jié)束的時(shí)間是死亡時(shí)間隨訪結(jié)束,隨訪
10、研究結(jié)束時(shí)觀察對(duì)象生存的結(jié)束隨訪時(shí)間也是研究結(jié)束時(shí)間,是影響生存時(shí)間的因素(協(xié)變量),如患者的年齡、病程、術(shù)前健康狀態(tài)、經(jīng)濟(jì)、文化、 為了分析這些因素對(duì)生存時(shí)間的影響,隨訪方式、觀察對(duì)象整體同時(shí)受到處理措施,觀察最后一例的出現(xiàn)結(jié)果,或觀察事先決定的跟蹤期限時(shí)間,圖中的“”表示“死亡”的“o”失去訪問,或退出研究,或涉及本研究隨訪方式、所有觀察對(duì)象在不同時(shí)間接受治療處理,完成一定數(shù)量的隨訪病例后,決定隨訪期限、在事先規(guī)定的時(shí)間中止隨訪是臨床試驗(yàn)最常見的形式,圖中“死亡”,“o”錯(cuò)過訪問或脫離研究表示可能因與本研究無關(guān)的其他原因死亡,由于切片數(shù)據(jù)的處理對(duì)切片數(shù)據(jù)的處理不太好,很多臨床研究者在分析時(shí)
11、經(jīng)常廢棄因訪問或中止等原因引起的切片數(shù)據(jù)。 最后數(shù)據(jù)提供的信息雖然不完整,但有價(jià)值,不能輕易刪除。 例如:某研究者追蹤了100名患者治療后的生存狀況,第一年有30人死亡,第三年有20人死亡,40人失去訪問(退出觀察),10人生存。 估計(jì)生存率。 表4刪除切片數(shù)據(jù)時(shí)不刪除切片數(shù)據(jù)時(shí)切片數(shù)據(jù)n=60n=100生存數(shù)生存率1年3030/60=50p70/100=70%3年1010/60=13、跟蹤記錄表、跟蹤資料記錄的項(xiàng)目通常是小組、觀察開始日表4.9例患者的隨訪記錄病號(hào)性別開始日的結(jié)束日最終是1男08/31/8210/31/89死亡手術(shù)2男08/31/8208/28/86訪問非手術(shù)3女10/30/
12、8303/31/90死亡非手術(shù)4男12/01/8410/01/87 88死亡手術(shù)6男07/01/8510/01/88死亡手術(shù)7人男08/31/8712/30/90生存手術(shù)8人女07/11/8612/17/90死亡手術(shù)9人男08/31/8610/01/90死亡非手術(shù)nsextimeoutcometreat 1171123061041310506131713018041191410,表6 .膀胱腫瘤患者生存資料變量代入表,表7.6例膀胱腫瘤患者生存資料原始記錄表,生存分析的主要內(nèi)容, 第一,描述生存過程研究生存時(shí)間的分布特征,估計(jì)生存率、生存曲線;比較生存過程(假設(shè)檢測(cè)),比較兩組或多組生存率;分
13、析影響生存時(shí)間的因素,理解影響生存過程的因素,為改善預(yù)后提供指導(dǎo)。 例子記載在資料中,癌癥患者5人(n=5)的生存時(shí)間(月):610142020平均生存時(shí)間: mean=18、median=14、782535有截止日期數(shù)據(jù)的情況? “死亡概率”是指在某個(gè)時(shí)間段內(nèi)死亡的可能性的大小。 如果某一年內(nèi)死亡人數(shù)q某一年年初的人口數(shù)在年內(nèi)減少的話,用分母校正的人口數(shù):人口數(shù)年初人口數(shù)的1/2的減少數(shù),2,生存資料經(jīng)常計(jì)算的數(shù)量的比率,死亡概率是已經(jīng)在t時(shí)刻生存的個(gè)體,之后一段時(shí)間(從t開始)可能會(huì)死亡。 關(guān)于死亡概率的計(jì)算式,從t開始內(nèi)有截?cái)嘀担鲜鍪降乃劳龈怕室驳?,可以調(diào)整分母,短時(shí),瞬時(shí)、死亡概率被
14、稱為t時(shí)刻的瞬時(shí)死亡概率,或被稱為危險(xiǎn)函數(shù)(hazardfunction,h(t ) ),剛在t時(shí)刻生存的個(gè)體在t時(shí)刻死亡的概率生存概率(survivalprobability )表示在某單位期間開始生存的個(gè)體在該期間結(jié)束之前生存的可能性的大小,記為p。年生存概率的計(jì)算公式是,如果某年人數(shù)p年年初的人口數(shù)在年內(nèi)消失,分母校正人口數(shù)。 如果t到t期間有截?cái)嘀?,還必須計(jì)算并調(diào)整生存概率生存概率與死亡概率的關(guān)系:p=1-q,生存率與生存函數(shù)、累積生存概率、簡(jiǎn)稱生存率。 以S(t )為任意時(shí)刻t的生存率,t為生存期間,得到S(t)=P(Tt)0t,S(t )稱為生存率函數(shù),簡(jiǎn)稱為生存率函數(shù),三、生存率
15、推定(記述),醫(yī)學(xué)研究中的生存資料分布多為不規(guī)則、不確定或未知的分布,所以用非參數(shù)法推定生存率根據(jù)樣品含量的大小,簡(jiǎn)稱為1 .積分限制法(小樣品的情況)2.壽命表法(大樣品的情況)、1 .積分限制法Product-limitmethod、積分限制法或PL法,使用概率乘法原理直接推算生存率,是統(tǒng)計(jì)學(xué)家Kaplan和me 基本思想:把生存時(shí)間(包括切片數(shù)據(jù))按升序排列,對(duì)其中每個(gè)死亡點(diǎn)推算死亡概率、生存概率和生存率。 適用條件:數(shù)據(jù)數(shù)量少的情況。 Kaplan-Meier法計(jì)算生存率,該方法在計(jì)算生存率時(shí),按每個(gè)個(gè)體的生存時(shí)間從小到大的順序排列,排序時(shí)如果截止值和非截止值的觀察時(shí)間相同,則指定比截
16、止值小的截止值,并排列在截止值之前。 然后,依次計(jì)算各時(shí)間段的死亡概率、生存概率,再計(jì)算從觀察開始到各時(shí)刻的生存率及其基準(zhǔn)錯(cuò)誤。 有研究人員分析了肺癌患者嗜酸性粒細(xì)胞(EC )陽(yáng)性和陰性患者的生存情況,26名EC陰性和35名EC陽(yáng)性患者的生存時(shí)間數(shù)據(jù)如下,計(jì)算兩組患者的生存率。 在26名EC陰性患者的觀察期內(nèi)死亡,其生存月數(shù)分別在0.3、1、2、2、3、4、4、6、6、7、7、8、8、11、12、12、14、18、21、2435名EC陽(yáng)性患者的觀察期內(nèi)死亡28人生存月數(shù)分別為4、4、4、5、5、8、9、9、9、10、11、12、12、13、14、16、16、17、19、20、22、23、24、
17、26、26、30、32、36、36、36 計(jì)算順序*患者按生存時(shí)間從小到大排列排序。 數(shù)各時(shí)間段開始觀察時(shí)的病例數(shù)。 例如,第三列。 寫下各期間的死亡例數(shù),因?yàn)榻刂怪禌]有因病死亡,全部以0計(jì)算。 計(jì)算各期間的死亡概率q,得到第五列。 用公式p=1-q計(jì)算各時(shí)間段的生存概率,獲得第6列,6 .計(jì)算從患者的觀察到各時(shí)刻t為止的生存率S(t )。 從觀察開始到某個(gè)時(shí)刻的生存率是到此為止的各階段的生存概率的積,根據(jù)式,將第1行的生存率S(T4)=P1=32/35=0.914286行的生存率s (t5)=p1p2=32/3530/32=0. 857143,7 .各生存率的標(biāo)準(zhǔn)誤差說明采樣誤差的大小,式中的n是樣品含量,I是等級(jí),表8.kalan-meier法計(jì)算生存率,0.857143,例如第2行和第9行,有截?cái)嘀档那闆r(12 ),計(jì)算sp(T13 )的情況下為1/(n-15 ) (n 表8.kalan-meier法計(jì)算生存率,0.857143樣本生存分析Kaplan-Meier方法在S
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高職選礦技術(shù)(選礦設(shè)備操作)試題及答案
- 工程施工安全培訓(xùn)感想課件
- 工程崗前安全培訓(xùn)課件
- 工程安全生產(chǎn)監(jiān)理培訓(xùn)平臺(tái)課件
- 工程安全培訓(xùn)考題課件
- 工程保險(xiǎn)理賠培訓(xùn)課件
- 2026年上海市小學(xué)生地理知識(shí)競(jìng)賽試題及答案
- 關(guān)于輔警自查自糾整改報(bào)告
- 村級(jí)社會(huì)治安綜合治理工作總結(jié)
- 成本控制策略方法
- 幼兒園大班語(yǔ)言活動(dòng)《新年禮物》課件
- 牙周病的病例匯報(bào)
- 吡侖帕奈口服混懸液-臨床用藥解讀
- 計(jì)量經(jīng)濟(jì)學(xué)論文-中國(guó)進(jìn)出口總額的影響因素分析
- 可復(fù)制的領(lǐng)導(dǎo)力課件教學(xué)課件
- 公司注冊(cè)登記表格
- 《上帝擲骰子嗎:量子物理史話》【超星爾雅學(xué)習(xí)通】章節(jié)答案
- 外貿(mào)發(fā)票 PI 形式發(fā)票模板范例
- YS/T 254.5-2011鈹精礦、綠柱石化學(xué)分析方法第5部分:氟量的測(cè)定離子選擇電極法
- GB/T 39532-2020能源績(jī)效測(cè)量和驗(yàn)證指南
- GB/T 30475.3-2017壓縮空氣過濾器試驗(yàn)方法第3部分:顆粒
評(píng)論
0/150
提交評(píng)論