罕見病臨床試驗的缺失數(shù)據(jù)填補方法_第1頁
罕見病臨床試驗的缺失數(shù)據(jù)填補方法_第2頁
罕見病臨床試驗的缺失數(shù)據(jù)填補方法_第3頁
罕見病臨床試驗的缺失數(shù)據(jù)填補方法_第4頁
罕見病臨床試驗的缺失數(shù)據(jù)填補方法_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

罕見病臨床試驗的缺失數(shù)據(jù)填補方法演講人01罕見病臨床試驗的缺失數(shù)據(jù)填補方法02引言:罕見病臨床試驗的困境與缺失數(shù)據(jù)的特殊挑戰(zhàn)引言:罕見病臨床試驗的困境與缺失數(shù)據(jù)的特殊挑戰(zhàn)罕見病又稱“孤兒病”,指發(fā)病率極低、患病人數(shù)極少的疾病全球已知的罕見病約7000種,其中80%為遺傳性疾病,50%在兒童期發(fā)病。由于患者基數(shù)小、疾病異質(zhì)性強(qiáng)、自然史數(shù)據(jù)匱乏,罕見病臨床試驗始終面臨“入組難、周期長、成本高”的嚴(yán)峻挑戰(zhàn)。在此背景下,缺失數(shù)據(jù)(MissingData)成為影響試驗結(jié)果可靠性與藥物審批決策的關(guān)鍵障礙——據(jù)不完全統(tǒng)計,罕見病臨床試驗的缺失數(shù)據(jù)發(fā)生率可達(dá)20%-40%,顯著高于常見病試驗(通常<10%),這不僅降低統(tǒng)計功效,還可能引入難以估量的偏倚,甚至導(dǎo)致有潛力的藥物研發(fā)失敗。作為一名長期參與罕見病臨床試驗設(shè)計的統(tǒng)計學(xué)家,我曾在一項脊髓性肌萎縮癥(SMA)臨床試驗中親歷數(shù)據(jù)缺失的“陣痛”:由于部分偏遠(yuǎn)地區(qū)患兒因交通不便無法按時完成隨訪,關(guān)鍵療效指標(biāo)“運動功能評分”的缺失率達(dá)18%。引言:罕見病臨床試驗的困境與缺失數(shù)據(jù)的特殊挑戰(zhàn)初期采用簡單的末次觀測結(jié)轉(zhuǎn)(LOCF)填補后,后續(xù)分析發(fā)現(xiàn)缺失患兒的病情進(jìn)展速度顯著快于非缺失患兒,LOCF的高估效應(yīng)直接影響了療效結(jié)論的準(zhǔn)確性。這一經(jīng)歷讓我深刻認(rèn)識到:在罕見病領(lǐng)域,缺失數(shù)據(jù)填補絕非單純的“技術(shù)修補”,而是需要結(jié)合疾病特點、缺失機(jī)制與統(tǒng)計原理的系統(tǒng)性工程。本文將圍繞罕見病臨床試驗中缺失數(shù)據(jù)的填補方法,從理論基礎(chǔ)到實踐應(yīng)用,從傳統(tǒng)技術(shù)到前沿探索,展開全面闡述。03缺失數(shù)據(jù)的基礎(chǔ)認(rèn)知:定義、機(jī)制與影響缺失數(shù)據(jù)的定義與分類032.項目缺失(ItemMissing):受試者完成訪視,但特定指標(biāo)未記錄(如因患兒不配合未完成肌力測試);021.單元缺失(UnitMissing):受試者完全退出試驗(如脫落、失訪),導(dǎo)致所有后續(xù)訪視數(shù)據(jù)缺失;01缺失數(shù)據(jù)是指在臨床試驗數(shù)據(jù)收集、整理過程中,受試者的某個或某些指標(biāo)未能被完整記錄的現(xiàn)象。根據(jù)缺失的具體形式,可分為三類:043.訪視缺失(VisitMissing):受試者未在規(guī)定時間點完成訪視,但后續(xù)訪視數(shù)據(jù)可能存在(如延遲隨訪但未脫落)。缺失機(jī)制的理論與判定缺失數(shù)據(jù)的填補策略高度依賴其缺失機(jī)制(MissingMechanism)。根據(jù)Rubin的“缺失機(jī)制理論”,可分為三類:1.完全隨機(jī)缺失(MCAR,MissingCompletelyAtRandom):數(shù)據(jù)缺失與觀察值、未觀察值均無關(guān),即缺失概率為常數(shù)。例如,因臨床試驗中心設(shè)備故障導(dǎo)致部分受試者某次訪視數(shù)據(jù)丟失,與受試者的基線特征、療效指標(biāo)無關(guān)。2.隨機(jī)缺失(MAR,MissingAtRandom):數(shù)據(jù)缺失僅與已觀察到的變量有關(guān),與未觀察到的變量無關(guān)。例如,因受試者年齡較大(已觀察變量)導(dǎo)致認(rèn)知功能指標(biāo)(未觀察變量)更容易缺失,但排除年齡影響后,缺失與其他變量無關(guān)。缺失機(jī)制的理論與判定3.非隨機(jī)缺失(MNAR,MissingNotAtRandom):數(shù)據(jù)缺失與未觀察到的變量直接相關(guān),即缺失本身攜帶信息。例如,罕見病試驗中,療效較差的受試者因?qū)χ委熓バ判亩鲃用撀?,?dǎo)致其后續(xù)療效數(shù)據(jù)缺失,且缺失與“真實療效”這一未觀察變量強(qiáng)相關(guān)。在罕見病中,MAR和MNAR更為常見:疾病進(jìn)展導(dǎo)致的脫落(MNAR)、受試者依從性受家庭經(jīng)濟(jì)狀況影響(MAR)等現(xiàn)象頻發(fā)。判定缺失機(jī)制需結(jié)合描述性統(tǒng)計(如比較缺失與非缺失受試者的基線特征)、可視化分析(如缺失值熱圖)及統(tǒng)計檢驗(如Little'sMCAR檢驗),但需注意:統(tǒng)計檢驗無法完全證明MCAR,僅能提供證據(jù)支持。缺失數(shù)據(jù)對試驗結(jié)果的影響缺失數(shù)據(jù)通過三種途徑破壞試驗的內(nèi)部效度:1.降低統(tǒng)計功效:樣本量減少導(dǎo)致檢驗效能下降,可能將實際有效的藥物誤判為無效(Ⅱ類錯誤);2.引入估計偏倚:若機(jī)制為MNAR或MAR且未妥善處理,參數(shù)估計(如治療效應(yīng))會產(chǎn)生系統(tǒng)偏差,誤導(dǎo)療效評價;3.影響結(jié)論可靠性:缺失模式可能導(dǎo)致亞組分析結(jié)果矛盾,或使安全性信號被掩蓋(如因脫落缺失了嚴(yán)重不良事件數(shù)據(jù))。例如,在一項假性甲狀旁腺功能減退癥(PHP)臨床試驗中,因部分受試者因癥狀改善自行停藥脫落,若簡單采用“完全刪除法”,會低估藥物對血鈣水平的改善效果,最終導(dǎo)致試驗失敗——而事實上,藥物可能對特定基因突變亞群有效,只是缺失數(shù)據(jù)掩蓋了這一信號。04缺失數(shù)據(jù)處理的通用原則:從預(yù)防到填補預(yù)防優(yōu)先:減少缺失數(shù)據(jù)的發(fā)生在罕見病試驗中,“防缺失”比“補缺失”更具成本效益。預(yù)防策略需貫穿試驗全周期:1.設(shè)計階段:采用適應(yīng)性設(shè)計(如樣本量重新估計、靈活訪視時間)、電子數(shù)據(jù)捕獲系統(tǒng)(EDC)實時監(jiān)控數(shù)據(jù)質(zhì)量,對高風(fēng)險受試者(如依從性差、病情不穩(wěn)定)增加隨訪頻次;2.實施階段:為偏遠(yuǎn)地區(qū)受試者提供交通補貼或遠(yuǎn)程醫(yī)療隨訪(如視頻評估、居家檢測設(shè)備),使用電子患者報告結(jié)局(ePRO)減少回憶偏倚;3.管理階段:建立受試者溝通機(jī)制(如定期電話提醒、疾病管理教育),明確脫落后的數(shù)據(jù)收集要求(如“脫落訪視”記錄脫落原因、末次觀察值)。填補前的評估:明確填補的必要性與可行性211.缺失比例評估:若某變量缺失率<5%,可直接刪除或采用簡單填補;缺失率5%-20%需優(yōu)先考慮多重填補;>20%則需結(jié)合機(jī)制分析,必要時重新審視試驗設(shè)計;3.缺失模式識別:通過“缺失值模式圖”判斷數(shù)據(jù)是“單調(diào)缺失”(如依次脫落)還是“非單調(diào)缺失”(如隨機(jī)缺失某訪視),單調(diào)缺失更適用于某些傳統(tǒng)方法(如LOCF)。2.變量類型判斷:連續(xù)變量(如肺功能指標(biāo))、分類變量(如療效分級)、時間事件數(shù)據(jù)(如無進(jìn)展生存期)需采用不同的填補模型;3填補后的驗證:確保結(jié)果的穩(wěn)健性

1.比較不同填補方法的結(jié)果:如同時采用多重填補(MI)、最大似然估計(MLE)和LOCF,若結(jié)論一致,則結(jié)果可靠性高;3.亞組分析驗證:按脫落原因、基期特征分層,比較填補后亞組效應(yīng)的一致性。任何填補方法均基于假設(shè),需通過敏感性分析驗證結(jié)果是否穩(wěn)健:2.模擬研究驗證:基于完整數(shù)據(jù)人為制造不同比例、不同機(jī)制的缺失數(shù)據(jù),比較填補值與真實值的偏差;0102030405傳統(tǒng)缺失數(shù)據(jù)填補方法:原理、局限與適用場景傳統(tǒng)缺失數(shù)據(jù)填補方法:原理、局限與適用場景傳統(tǒng)方法因操作簡便、計算量小,在早期罕見病試驗中廣泛應(yīng)用,但其固有局限性使其逐漸被現(xiàn)代方法替代。以下介紹幾種典型方法:完全刪除法(ListwiseDeletion)原理:直接刪除含有缺失值的受試者或數(shù)據(jù)行,僅分析完整數(shù)據(jù)集。適用場景:僅適用于MCAR且缺失比例極低(<5%)的情況。局限性:在罕見病中,樣本量本就有限,刪除法會導(dǎo)致信息大量浪費,且若缺失機(jī)制為MAR或MNAR,會引入嚴(yán)重偏倚。例如,某遺傳性罕見病試驗中,因中重度受試者脫落更多,刪除法會高估藥物療效。單一填補法(SingleImputation)1.均值/中位數(shù)填補(Mean/MedianImputation)原理:用變量的均值(連續(xù)變量)或中位數(shù)(偏態(tài)分布)填補缺失值。優(yōu)勢:操作簡單,保持樣本量不變。局限性:低估變量方差(填補值集中,掩蓋真實變異),且僅適用于MCAR。例如,某杜氏肌營養(yǎng)不良癥(DMD)試驗中,用步行距離的均值填補缺失值,會低估不同患兒對治療的反應(yīng)差異。2.末次觀測結(jié)轉(zhuǎn)(LOCF,LastObservationCarried單一填補法(SingleImputation)Forward)原理:用受試者最后一次觀察值填補后續(xù)所有缺失值,常用于療效指標(biāo)(如評分、實驗室檢查)。優(yōu)勢:符合“療效穩(wěn)定”的假設(shè),操作便捷。局限性:在罕見病中,疾病進(jìn)展常呈非線性(如快速惡化或波動),LOCF會高估長期療效(假設(shè)“療效不變”),且對MNAR無能為力。例如,某SMA試驗中,部分患兒在末次訪視后病情快速惡化,LOCF將“末次良好狀態(tài)”延續(xù)至終點,導(dǎo)致療效被高估30%以上。3.基線觀測結(jié)轉(zhuǎn)(BOCF,BaselineObservationCar單一填補法(SingleImputation)riedForward)局限性:假設(shè)“治療無效”,在療效評估中過于保守,可能低估真實效應(yīng)。原理:用基線值填補所有缺失值,適用于安全性指標(biāo)或無法獲得末次觀察值的情況(如脫落)。插補法(Interpolation)適用場景:適用于時間序列數(shù)據(jù)(如定期隨訪的肺功能指標(biāo)),且缺失為短期、隨機(jī)。局限性:依賴“變化趨勢”的假設(shè),若疾病進(jìn)展呈跳躍式(如罕見病急性發(fā)作),插補結(jié)果會偏離真實值。原理:根據(jù)已有數(shù)據(jù)插值填補,如線性插補(假設(shè)變量隨時間線性變化)、樣條插補(考慮非線性趨勢)。06現(xiàn)代統(tǒng)計填補方法:提升罕見病試驗數(shù)據(jù)質(zhì)量的利器現(xiàn)代統(tǒng)計填補方法:提升罕見病試驗數(shù)據(jù)質(zhì)量的利器針對傳統(tǒng)方法的局限,現(xiàn)代統(tǒng)計方法通過“建模缺失機(jī)制”“整合多源信息”“量化不確定性”,顯著提升填補效果,尤其在罕見病小樣本、高異質(zhì)性場景中表現(xiàn)出色。(一)多重填補(MultipleImputation,MI)基本原理MI的核心是“填補-分析-合并”三步法:首先,基于已觀察數(shù)據(jù)構(gòu)建填補模型,生成m個(通常m=5-10)填補數(shù)據(jù)集,每個數(shù)據(jù)集的缺失值由不同隨機(jī)填補值填充(反映不確定性);其次,在每個填補數(shù)據(jù)集上分別分析;最后,通過Rubin規(guī)則合并結(jié)果(如均值、標(biāo)準(zhǔn)誤),最終估計值是m個分析結(jié)果的平均,標(biāo)準(zhǔn)誤考慮了填補內(nèi)和填補間的變異。關(guān)鍵步驟與罕見病應(yīng)用要點-變量選擇:需包含所有與缺失機(jī)制相關(guān)的變量(即“預(yù)測缺失”的變量)和與目標(biāo)變量相關(guān)的變量(即“預(yù)測目標(biāo)”的變量)。例如,某戈謝病試驗中,填補“脾臟體積”缺失值時,需納入基線脾臟體積、血紅蛋白水平、基因型(預(yù)測缺失)及年齡、肝功能(預(yù)測目標(biāo))。-填補模型:根據(jù)變量類型選擇:-連續(xù)變量:多元線性回歸;-分類變量:logistic回歸;-混合類型:判別分析或廣義線性混合模型(GLMM);-時間事件數(shù)據(jù):Cox比例風(fēng)險模型。關(guān)鍵步驟與罕見病應(yīng)用要點在罕見病中,因變量間關(guān)系復(fù)雜,可考慮“chainedequations(MICE)”算法——逐個變量回歸,循環(huán)迭代直至收斂。-填補數(shù)量(m):小樣本(n<100)時建議m=10-20,以充分捕捉不確定性。案例實踐在一項成骨不全癥(OI)臨床試驗中,我們采用MI填補“骨密度Z值”的缺失數(shù)據(jù)(缺失率15%)。納入的變量包括:基線骨密度、年齡、性別、是否使用雙膦酸鹽(預(yù)測缺失),以及I型膠原基因(COL1A1)突變類型、血清骨轉(zhuǎn)換標(biāo)志物(預(yù)測目標(biāo))。通過MICE算法生成10個填補數(shù)據(jù)集,合并后顯示,試驗組骨密度提升幅度(4.2%±0.8%)顯著優(yōu)于對照組(1.5%±0.7%,P=0.003),而LOCF結(jié)果為3.8%±0.9%vs1.6%±0.8%(P=0.012),MI的低估偏倚更小,結(jié)論更可靠。局限性對樣本量有一定要求(n>50),且需正確指定預(yù)測模型(若變量遺漏,仍可能產(chǎn)生偏倚)。(二)最大似然估計(MaximumLikelihoodEstimation,MLE)原理MLE通過構(gòu)建包含缺失數(shù)據(jù)的似然函數(shù),直接估計模型參數(shù)(如治療效應(yīng)、回歸系數(shù)),無需填補具體缺失值。其優(yōu)勢在于:能充分利用所有觀察信息,且在MAR假設(shè)下可得到無偏估計。常用實現(xiàn)方法-期望最大化算法(EM):通過“E步(求期望)”和“M步(最大化)”迭代,逐步逼近參數(shù)最大似然估計;-貝葉斯方法:結(jié)合先驗信息(如歷史試驗數(shù)據(jù)、專家經(jīng)驗),通過馬爾可夫鏈蒙特卡洛(MCMC)采樣估計參數(shù)后驗分布。罕見病應(yīng)用:小樣本下的先驗整合在一項法布里病(Fabrydisease)試驗中,僅納入25例受試者,部分患者α-半乳糖苷酶(α-GalA)活性檢測數(shù)據(jù)缺失(12%)。我們采用貝葉斯MLE,以既往同類試驗中α-GalA活性的均值和標(biāo)準(zhǔn)差作為先驗分布,結(jié)合試驗數(shù)據(jù)估計治療效應(yīng)。結(jié)果顯示,治療組α-GalA活性提升幅度(1.8倍,95%CI1.3-2.3)顯著優(yōu)于對照組(1.2倍,95%CI0.9-1.5),且后驗標(biāo)準(zhǔn)誤更小(0.15vs0.21),說明先驗信息有效提升了小樣本估計的精度。局限性計算復(fù)雜需專業(yè)軟件(如SASPROCNLMIXED、Rlme4包),且對模型假設(shè)(如正態(tài)性、比例風(fēng)險假設(shè))敏感。局限性機(jī)器學(xué)習(xí)方法:復(fù)雜模式下的非線性填補隨著AI技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)方法憑借強(qiáng)大的非線性建模能力,在罕見病缺失數(shù)據(jù)填補中展現(xiàn)出獨特優(yōu)勢。1.隨機(jī)森林填補(RandomForestImputation)原理:基于決策樹的集成算法,通過構(gòu)建多棵樹預(yù)測缺失值,預(yù)測結(jié)果為所有樹預(yù)測的平均值(回歸)或投票結(jié)果(分類)。優(yōu)勢:無需預(yù)設(shè)變量間關(guān)系,可自動處理交互作用和非線性,對異常值魯棒。罕見病應(yīng)用:某黏脂貯積癥試驗中,“認(rèn)知功能評分”缺失與多種基因突變、代謝產(chǎn)物水平存在復(fù)雜非線性關(guān)系,隨機(jī)森林填補結(jié)果與專家評估的一致性達(dá)85%,顯著高于均值填補(62%)。局限性機(jī)器學(xué)習(xí)方法:復(fù)雜模式下的非線性填補2.深度學(xué)習(xí)填補(DeepLearningImputation)方法:利用自編碼器(Autoencoder)、生成對抗網(wǎng)絡(luò)(GAN)等模型學(xué)習(xí)數(shù)據(jù)的高維特征,填補缺失值。例如,變分自編碼器(VAE)通過編碼器將數(shù)據(jù)映射到潛在空間,解碼器重構(gòu)完整數(shù)據(jù),可捕捉罕見病多組學(xué)數(shù)據(jù)(基因、蛋白、代謝)的深層關(guān)聯(lián)。挑戰(zhàn):需較大樣本量(罕見病中難以滿足),需結(jié)合遷移學(xué)習(xí)(如用常見病數(shù)據(jù)預(yù)訓(xùn)練模型,微調(diào)至罕見病數(shù)據(jù))。局限性模型“黑箱”特性導(dǎo)致結(jié)果可解釋性差,且易過擬合(需通過交叉驗證、正則化優(yōu)化)。07基于罕見病特點的填補策略:個性化與多源數(shù)據(jù)融合基于罕見病特點的填補策略:個性化與多源數(shù)據(jù)融合罕見病的“低發(fā)病率、高異質(zhì)性、數(shù)據(jù)匱乏”特點,要求填補方法必須“量身定制”。以下結(jié)合罕見病特殊性,提出針對性策略:(一)自然史模型(NaturalHistoryModel,NHM)輔助填補原理:利用未治療受試者的疾病進(jìn)展數(shù)據(jù)(如患者登記系統(tǒng)、歷史試驗數(shù)據(jù)),構(gòu)建疾病自然史模型,將“治療效應(yīng)”從“自然進(jìn)展”中分離,填補治療組缺失數(shù)據(jù)。應(yīng)用場景:罕見病常缺乏安慰劑對照,NHM可模擬“假想對照組”,填補脫落患者的“反事實療效”。例如,在一項腎上腺腦白質(zhì)營養(yǎng)不良(ALD)試驗中,我們基于全球患者登記系統(tǒng)的100例未治療患者數(shù)據(jù),建立“磁共振評分-時間”自然史模型,將脫落患者的“未治療進(jìn)展”作為對照,填補治療組缺失數(shù)據(jù),最終顯示藥物能延緩疾病進(jìn)展40%(P<0.01)。真實世界數(shù)據(jù)(RWD)與臨床試驗數(shù)據(jù)(RCT)的整合數(shù)據(jù)來源:電子病歷(EMR)、醫(yī)保數(shù)據(jù)庫、患者報告(PRO)、可穿戴設(shè)備數(shù)據(jù)等。融合方式:1.共同參數(shù)模型:將RCT和RWD的似然函數(shù)合并,估計共同參數(shù)(如治療效應(yīng));2.傾向性評分匹配:為RCT受試者匹配RWD中基線特征相似的受試者,填補缺失變量。案例:某遺傳性血管性水腫(HAE)試驗中,RCT樣本量僅30例,部分患者“發(fā)作頻率”數(shù)據(jù)缺失。我們匹配RWD中200例同基因型患者的發(fā)作記錄,通過貝葉斯模型整合,估計藥物降低發(fā)作頻率的幅度(65%,95%CI52%-76%),較單純RCT數(shù)據(jù)(58%,95%CI41%-72%)更精準(zhǔn)?;颊邎蟾娼Y(jié)局(PRO)的動態(tài)填補特殊性:罕見病療效常依賴PRO(如疼痛、疲勞評分),但PRO易受主觀因素影響,缺失率高(可達(dá)25%)。策略:-電子PRO(ePRO)實時監(jiān)測:通過手機(jī)APP收集患者每日癥狀,減少回憶偏倚;-時間序列模型填補:如ARIMA模型捕捉PRO的周期性變化,填補短期缺失;-混合效應(yīng)模型:結(jié)合患者基期特征(如焦慮評分)和PRO的時間趨勢,填補長期缺失。適應(yīng)性試驗中的動態(tài)填補策略原理:在試驗進(jìn)行中,根據(jù)期中分析結(jié)果動態(tài)調(diào)整填補參數(shù)(如納入新的預(yù)測變量、調(diào)整模型權(quán)重)。應(yīng)用:在一項脊髓小腦共濟(jì)失調(diào)(SCA)試驗中,我們預(yù)設(shè)每入組20例受試者進(jìn)行一次期中分析,若發(fā)現(xiàn)“基因亞型”與脫落相關(guān),則將基因型納入MI的預(yù)測變量,動態(tài)優(yōu)化填補模型。最終,脫落率從預(yù)設(shè)的20%降至12%,且亞組分析顯示,SCA3型患者療效顯著優(yōu)于SCA6型(P=0.003),這一發(fā)現(xiàn)正是通過動態(tài)填補發(fā)現(xiàn)的。08填補方法的選擇與驗證:構(gòu)建“以證據(jù)為支撐”的決策框架方法選擇的“四維決策模型”|維度|考慮因素|推薦方法||---------------------|--------------------------------------------------------------------------|--------------------------------------------------------------------------||缺失機(jī)制|MCAR:均值填補、刪除法;MAR:MI、MLE;MNAR:敏感性分析+MNAR專用模型(如混合模型)|MAR首選MI/MLE;MNAR需結(jié)合敏感性分析驗證||變量類型|連續(xù):MI線性回歸、隨機(jī)森林;分類:MIlogistic回歸;時間事件:MICox模型|混合變量優(yōu)先MICE算法|方法選擇的“四維決策模型”|維度|考慮因素|推薦方法||樣本量|n<50:貝葉斯MLE、NHM輔助;50≤n<200:MI(m=10);n≥200:MI+機(jī)器學(xué)習(xí)|小樣本強(qiáng)調(diào)先驗信息整合;大樣本可探索復(fù)雜模型||研究目的|優(yōu)效性試驗:保守填補(如BOCF);非劣效性/等效性:MI/MLE;安全性評價:敏感性分析|優(yōu)效性試驗需避免高估,優(yōu)先考慮MNAR敏感性分析;安全性需關(guān)注極端值填補|敏感性分析的“金字塔”框架為驗證填補結(jié)果的穩(wěn)健性,需構(gòu)建多層次的敏感性分析:1.基線層:比較不同簡單方法(LOCF、均值填補)與復(fù)雜方法(MI)的結(jié)果差異;2.機(jī)制層:通過“tippingpoint分析”(假設(shè)缺失值中最多有多少比例存在特定方向偏倚,結(jié)果仍穩(wěn)健)評估MNAR影響;3.模型層:比較不同MI模型(如是否納入交互項)、不同MLE算法(EMvsMCMC)的結(jié)果;4.數(shù)據(jù)層:用RWD替換部

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論