版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、臨床治療數(shù)據(jù)的統(tǒng)計分析、統(tǒng)計學(xué)家在面對實際數(shù)據(jù)分析問題時,如何將實際問題轉(zhuǎn)變?yōu)榻y(tǒng)計問題? 如何設(shè)計一系列系統(tǒng)的統(tǒng)計分析途徑得到答案? 在進(jìn)行統(tǒng)計分析時,如何根據(jù)問題的背景和數(shù)據(jù)特性選擇合適的模型和分析方法? 如何評估和比較不同模型和分析方法獲得的結(jié)果? 如何結(jié)合實際問題的背景合理地說明統(tǒng)計分析的結(jié)果? 1、白血病臨床治療的數(shù)據(jù)和問題是持續(xù)1年的急性白血病治療臨床試驗,研究人員將42名急性白血病患者(進(jìn)入項目的時間前后)隨機分為兩組(各21人)。 對一組患者用藥來緩解疾病,對另一組患者使用安慰劑。 安慰劑的外形和顏色與藥物完全相同,但不含藥物,患者自己不知道實際服用的是藥物還是安慰劑。 研究者以
2、周為單位記錄每個患者的疾病緩解時間,時間越長,治療效果越好。 數(shù)據(jù)如表1所示。 表1的處理組和控制組各21人的病情緩和的持續(xù)時間(周),表1的數(shù)據(jù)后面顯示,項目結(jié)束后仍在緩和。 例如,處理組中的20表示該患者在項目結(jié)束前20小時進(jìn)入臨床治療,使用6-MP后,緩解會持續(xù)到項目結(jié)束。 因此,該患者的實際緩解期至少為20周,很可能超過20周。 這種數(shù)據(jù)在統(tǒng)計學(xué)上被稱為刪除數(shù)據(jù)。 醫(yī)學(xué)研究關(guān)注的問題是,如果沒有得到6MP能否顯著延長緩解的持續(xù)時間的肯定回答,就沒有必要對該藥進(jìn)行進(jìn)一步研究,相反,如果結(jié)論是肯定的,研究者想進(jìn)一步定量地評價今后患者使用6-MP后的效果。 2、統(tǒng)計分析的想法、統(tǒng)計學(xué)術(shù)語、白
3、血病緩解效果的分析是一個“兩個樣本的比較”問題,一般采用比較兩個正規(guī)樣本平均值的t檢驗。 但目前的問題非常復(fù)雜:首先,樣本分布未知,而且在時間數(shù)據(jù)分析中,數(shù)據(jù)分布有很大的偏差,所以正態(tài)分布是一個“差”模型。 其次,數(shù)據(jù)不完整(有缺失數(shù)據(jù)),通常的完全數(shù)據(jù)的分析方法不容易適用。 另外,在本情況下,由于樣品容量不大,所以首先采用參數(shù)模型的分析方法:1)使處理組和控制組的數(shù)據(jù)分別符合滿意的參數(shù)分布(優(yōu)選相同的分布家族)。 2 )用參數(shù)假設(shè)檢驗來判斷處理組和控制組的緩解時間分布是否有顯著差異,在醫(yī)學(xué)研究中回答了“6-MP能否顯著延長緩解的持續(xù)時間”的問題。 如果答案是否定的,則認(rèn)為本研究不會得到有意義
4、的結(jié)果,如果答案是肯定的,則繼續(xù)下一步。 3 )預(yù)測今后患者使用6-MP后緩解期的相關(guān)參數(shù),并定量評價6-MP效果的充分可靠性。 3、使分布符合完整的數(shù)據(jù)。 在這些數(shù)據(jù)中,控制組(使用安慰劑)的數(shù)據(jù)是完整的,沒有刪除數(shù)據(jù)。 完整的數(shù)據(jù)分析比較簡單。 第一步的目標(biāo)是選擇參數(shù)分布來匹配數(shù)據(jù)。 常用的擬合時間數(shù)據(jù)的參數(shù)模型(分布)有指數(shù)分布、威布爾分布、伽馬分布、對數(shù)正態(tài)分布等。 合理性:每個實際問題都有一定的“背景機制”,一般來說統(tǒng)計模型的選擇應(yīng)該考慮背景機制。 適應(yīng)性:模型應(yīng)該能很好地適應(yīng)數(shù)據(jù)。 簡單性:如果簡單的模型能滿足數(shù)據(jù)的需求,請不要采用復(fù)雜的模型。 簡單的模型可以避免隨機因素引起的模型
5、變形,從背景機制容易說明。 在選擇參數(shù)分布模型時必須遵循幾個原則:在描繪時間分布模型的特征上,“生存函數(shù)”和“危險率”是兩個重要的函數(shù)。 生存函數(shù)也被稱為“可靠度”,是個體壽命超過某個時間點的概率。如果用x來表示個體的壽命,則生存函數(shù)S(x )被定義為:S(x)=P(Xx ),危險率也被稱為“失效效率”或“瞬時失效效率”,描述了個體在某個時刻生存的條件下,下一瞬間死亡的危險性。 危險率h(x ) :根據(jù)危險率h(x )的發(fā)展趨勢,“生存”模型可分為三類:h(x )單調(diào)減少(增長階段)。 h(x )不變(成熟階段) h(x )單調(diào)上升(老化階段)。 以上三種類型中,“h(x )”與指數(shù)分布不變,
6、描述了隨時隨機發(fā)生的死亡風(fēng)險,在其生存函數(shù)中=h(x)=1/Ex .本情況下緩和持續(xù)時間不長,所以年齡、體質(zhì)等可能影響緩和持續(xù)時間的因素的作用不大,什么時候問題是,數(shù)據(jù)的考驗,這種背景機制的想法是否真的合理。 直方圖是通過統(tǒng)計分析直觀地選擇分布模型的重要方法。 關(guān)于指數(shù)分布考察“累積危險率”。 這是與時間變量x相關(guān)的直線。 利用數(shù)據(jù),可以得到H(x )的“經(jīng)驗估計”,如果大致線性推移的話,可以直觀地認(rèn)為指數(shù)分布對數(shù)據(jù)的擬合很滿意。 的獲取是以“經(jīng)驗分布”為基礎(chǔ)的。 生存函數(shù)S(x )的經(jīng)驗估計:=“大于x的數(shù)據(jù)數(shù)”/n,且圖:控制組數(shù)據(jù)的圖像在威布爾分布比指數(shù)分布更為普遍,在威布爾分布中擬合控
7、制組數(shù)據(jù)時,危險率函數(shù)接近1,在簡單性原則上是不需要的通過表控制組(安慰劑)的數(shù)據(jù)的和、4、適合度檢查、適合度檢查來評價適合效果。 來構(gòu)筑1個度量設(shè)想的分布適合數(shù)據(jù)的好壞(優(yōu)先級)的檢驗統(tǒng)計量d。 d的值小時表示擬合好,相反,表示擬合差。 當(dāng)從數(shù)據(jù)計算得到D=d,并且在假設(shè)的分布正確的前提下計算概率p=P(Dd )時,p的值表示較大的擬合良好。 這里p是適合度,簡稱為“p值”。 作為正式的檢查順序,可以事先指定檢查的顯著水平,此時接受假設(shè)的分布,相反地拒絕。 Kolmogorov檢驗法適用于單一分布的檢驗,檢驗統(tǒng)計量的構(gòu)造方法如下:經(jīng)驗分布函數(shù)是假設(shè)的分布函數(shù)定義檢驗統(tǒng)計量,d是與兩個函數(shù)的最
8、大距離。 在階躍函數(shù)中,兩個函數(shù)均單調(diào)遞增,因此d的計算并不困難。 注意數(shù)據(jù)點的計算,對于控制組的數(shù)據(jù),認(rèn)為該分布非常滿意數(shù)據(jù)擬合,因為假設(shè)分布為e(0.115 ),計算值D=0.170,對應(yīng)的p值約為0.50值很大。 5、數(shù)據(jù)有刪除時擬合分布的方法,對于處理組(6-MP ),數(shù)據(jù)有刪除,所以其經(jīng)驗分布不能像完全數(shù)據(jù)時那么簡單地定義。 我們采用以下的想法來擬合分布:選擇在建立刪除了數(shù)據(jù)的經(jīng)驗分布積分限制估計(Kaplan-Meier估計)的直方圖上看起來直觀上很滿意的分布族(也可以是指數(shù)分布)。 為所選分布族的估計參數(shù)選擇分布。 累計限度估計: n個數(shù)據(jù)中,假設(shè)有d個不同的“死亡”時間,按從小
9、到大的順序排列,標(biāo)記為死亡時間,上面的重復(fù)數(shù)據(jù)的數(shù)量,死亡時間滿足以上的數(shù)據(jù)(包括死亡、刪除、重復(fù))的數(shù)量,標(biāo)記為區(qū)間的刪除時間不比實際的死亡時間早, 條件概率的經(jīng)驗估計是基于條件概率的思想建立經(jīng)驗分布的,但需要關(guān)于死亡時間和喪失時間的關(guān)系的假設(shè):在上述假設(shè)下,通過積限估計得到的經(jīng)驗生存函數(shù)定義為:如果數(shù)據(jù)完整(不刪除),則可以證明積限估計與通常的經(jīng)驗分布一致。 處理組數(shù)據(jù)之和如下表所示。處理組數(shù)據(jù)的圖像也非常接近直線,可以認(rèn)為處理組的緩和時間也遵循指數(shù)分布。 對于經(jīng)驗累積危險率、表處理組(6-MP )的數(shù)據(jù)的和值、6、數(shù)據(jù)有刪除的情況下的最大似然推定、完全數(shù)據(jù)似然函數(shù),刪除數(shù)據(jù)表示死亡發(fā)生之
10、后,因此該信息不是密度函數(shù)值,而是概率值,因此,在有刪除數(shù)據(jù)的情況下被存儲刪除數(shù)據(jù)對指數(shù)分布,對數(shù)似然函數(shù)為:的極大似然估計顯著小于控制組的估計值0.115,處理組數(shù)據(jù)的指數(shù)分布上的最大似然估計顯著小于控制組的估計值0.115。 但是,不能簡單地斷言6-MP能有意義地延長緩和時間,需要通過正式的假設(shè)驗證程序。 對被刪除的數(shù)據(jù)的適合度檢查不能采用完整的數(shù)據(jù)的適合度檢查方法(省略)。 7、具有普遍性的參數(shù)假設(shè)檢查方法,已經(jīng)用指數(shù)分布很好地擬合了控制組和處理組的數(shù)據(jù),兩個指數(shù)分布可能相同或不同。 為了回答6MP能否顯著延長緩和時間的問題,標(biāo)準(zhǔn)的統(tǒng)計順序是進(jìn)行參數(shù)的假設(shè)驗證。 控制組和處理組對應(yīng)的參數(shù)
11、用和來記述的話,原假設(shè):候補假設(shè):似然比檢定具有普遍性,是具有高效果的參數(shù)假設(shè)檢定程序,作為基準(zhǔn)的檢定統(tǒng)計量被稱為“負(fù)的二倍對數(shù)似然比”,在原假設(shè)制約下計算似然函數(shù)的最大值, 計算不受原假設(shè)約束時的似然函數(shù)的全局最大值,當(dāng)似然比負(fù)的二倍對數(shù)似然比樣本容量足夠大時,一般可以近似原假設(shè)下的分布的構(gòu)造方法。 似然比的值在0和1之間,越小越不利于原假設(shè)。 取正值,越大越不利于原假設(shè)。 在該問題中,控制組和處理組的數(shù)據(jù)被視為來自同一整個指數(shù)分布的樣本,如果假定原本是真的,則根據(jù)聚合的數(shù)據(jù)來計算極大似然估計,并且,如果獲得的候選選擇為真,則控制組和處理組的數(shù)據(jù)是整個不同的指數(shù)分布嗎? 似然函數(shù)是兩組樣本似
12、然函數(shù)的積,分別計算兩組數(shù)據(jù)的極大似然估計和對數(shù)似然值,并進(jìn)行合計,結(jié)果,負(fù)的二倍對數(shù)似然比其p-值約為0.00003。 假設(shè)檢查結(jié)果顯示兩組樣品分布有顯著差異。 這個結(jié)果統(tǒng)計上肯定地回答了本案例開頭提出的問題: 6MP可以顯著延長緩解的持續(xù)時間。 必須指出,統(tǒng)計意義上的顯著性并不意味著實際意義上的顯著性。 在這個情況下,使用6-MP的期待緩和期為40周左右(參照下一節(jié))。 8、在信賴區(qū)間、以前的基礎(chǔ)上,醫(yī)學(xué)研究者想評價未來患者使用6mp的效果。 例如,將來患者使用6MP后的期待緩解期將來患者使用6-MP后的緩解期超過半年(26周)的概率未來患者使用6MP后有80%的可能。 用x記錄將來患者使用6MP后的緩解期間。 上述三個問題分別對應(yīng)三個統(tǒng)計估計問題:估計EX; 很好地擬合了估計分位數(shù),滿足,之前已經(jīng)在指數(shù)分布中使用了6-MP的緩和持續(xù)時間分布,然后利
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年鞍山鋼鐵集團公司職工大學(xué)輔導(dǎo)員考試參考題庫附答案
- 2025年云南農(nóng)業(yè)職業(yè)技術(shù)學(xué)院輔導(dǎo)員考試筆試題庫附答案
- 2025年福建廈門市公安局思明分局招聘警務(wù)輔助人員30人備考題庫及答案1套
- 2025年襄陽市市直機關(guān)公開遴選公務(wù)員37人考試備考題庫附答案
- 2026年中國水產(chǎn)科學(xué)研究院第一批招聘(78人)備考題庫新版
- 2025年電力系統(tǒng)保護(hù)裝置調(diào)試與維護(hù)指南
- 房地產(chǎn)營銷策略執(zhí)行指南(標(biāo)準(zhǔn)版)
- 2025年教育資源管理與共享指南
- 化工行業(yè)危險品管理手冊(標(biāo)準(zhǔn)版)
- 公司員工解聘(辭職、辭退、解雇)管理制度
- 線纜及線束組件檢驗標(biāo)準(zhǔn)
- 人工智能在金融策略中的應(yīng)用
- 口述史研究活動方案
- 加工中心點檢表
- 水庫清淤工程可行性研究報告
- THBFIA 0004-2020 紅棗制品標(biāo)準(zhǔn)
- GB/T 25630-2010透平壓縮機性能試驗規(guī)程
- GB/T 19610-2004卷煙通風(fēng)的測定定義和測量原理
- 精排版《化工原理》講稿(全)
- 市場營銷學(xué)-第12章-服務(wù)市場營銷課件
評論
0/150
提交評論