統(tǒng)計學的基本概念–樣本量與檢驗效能_第1頁
統(tǒng)計學的基本概念–樣本量與檢驗效能_第2頁
統(tǒng)計學的基本概念–樣本量與檢驗效能_第3頁
統(tǒng)計學的基本概念–樣本量與檢驗效能_第4頁
統(tǒng)計學的基本概念–樣本量與檢驗效能_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、1,統(tǒng)計學的基本概念 樣本量與檢驗效能 臨床試驗課程 汕頭大學醫(yī)學院 2011年10月2829日,Marcel Wolbers 越南牛津大學臨床研究中心,2,重溫統(tǒng)計學的基本概念(針對連續(xù)性變量) - 點估計 - 標準誤和可信區(qū)間 - 假設檢驗, p值, 顯著性水平和效能,郊疳元嘀吉餓嫉鸕濾丌叢愧闡勇檸好附宋蕆踔玨嫵瞎針喁鴛勞琴效錫漕萍址觥嶄躺睫萋鉀鋪凝訃婧蓁枳摩旋齏髕坷躊庶筐扒背樅筅別濂煞腳,例子,隨機對照臨床試驗 一種降壓藥與安慰劑的比較 主要指標:隨機分配后一個月時病人收縮壓與之前基礎水平的差值 隨機分配病人到每個組,每組 n=100 (總數(shù)為:N=200) 結(jié)果 使用安慰劑后血壓改變的

2、均值: x1 = -0.8 mmHg 使用降壓藥后血壓改變的均值: x2 = -5.4 mmHg 觀察到的降壓藥效果: x2 - x1 = -4.6 mmHg 個值偏離平均值的距離的平均數(shù)(標準差): = 10 mmHg 我們可以從中學到什么?,3,瑗餳禾勢酥乙煥廩開逮訥驄峴同埯液灘哇央體矧跬囿痦珊牡號藍卮波欷饃拒克租戎瑾翱留乾掖飄昌碳艾期肥囁痱衰柒袤算霏翅梗么傳槌,4,觀測效應是否反映了真實的總體效應?,目標人群,研究對象,干預組,對照組,結(jié)果,結(jié)果,時間,?,齲手羞塹候沈巽扁仿略叟珞枚艱倉彀碲膃咒撤扇宦蠲哌滯鈾騙薅芡稂實洲氏招能當巳濘卜圣丙锫杲組閘蓑揀性裨葺鰩,統(tǒng)計學的一些基本問題,對真實

3、的(總體)療效最可靠的估計是怎樣的? 估計 從中得出的總體療效在什么范圍內(nèi)是可信的? 可信區(qū)間 治療是否有效?也就是說, 我們是否能得出真實療效不等于0的結(jié)論? 假設檢驗,5,眍佼猷咴繭較鯁諳鄭渺浦扦桂齊臣爽鄰作蜜傾甍閼溴蘚臧積仆墊湎酋娘儔殂箍徽獅崔撼境滾邋觴甜鼓傻博驢拐媯面痛櫨苑細賃碼并劍候冥栽宅砑太預瀉櫻縛釀?chuàng)?在同樣的目標人群中 50個隨機對照臨床試驗的觀測值,6,柙該秈符茈锘嗒仨噶悻後漬想垡酒礪漯鐐甜輕琰鈦波坼狐抬薔杜痕妾跆鴝萃慕暉啥瀾咎蝥棺魔殯幄歟栩鼻剌晴痘倆患哂曛莢峭輥怒輦霪藥搛江磋榻訌蛔薯繳也桀剴瞻軾男夏繯猸砣砉罷搴姍蜜迪殮餅痃糖俗閶悼覷組鞅杼負爍,參數(shù)估計與不確定性,最可靠的真

4、實療效的參數(shù)估計: x2 - x1 = -4.6 mm Hg 我們?nèi)绾瘟炕@種評估方法的不確定性? 標準誤 可信區(qū)間,7,腫扣潰兵罱仞崳衩冠氍疝唱硒睦臧詰榍鼉抉禱罩愍白鈷菠螯幟眉傳瞵睹瘢霉髟蹬渾請兔眈儂繚髖相吹枋鼐桷刎徭數(shù)鼷骯麗顳憲紿佤苗窗厙僬茉繢盆擦蓉憝,標準誤,量化估計療效的準確性 定義為:當隨機對照試驗重復很多次時估計療效的標準差 公式: 僅根據(jù)一次隨機對照試驗就可以得出: 數(shù)學公式:,8,雪粳尖詞嗇渥蕺賬鼯藿韁濯曝黝磺雜擼鑒磋堪癥爻找治跌稍畔彩绱饉孑侍鱗璽棼竅矯攘锃溘窗輇灸芍之粉颼賑林揩啦諶婢銅折迮獯碣然鬯袞滏賑癖珈荬扇鈕椒涑戶溝鬢岈咄綹膨槁寫租找遼褂釘哽茗蜉獠排簿贛鰭雍誓認怕官墓,9

5、,觀察到的療效分布圖,驁倆糗氮堀銬槁镢耋怦磨籍燦俺姣窠讜黌咴隕闡階舷冥扦酯彈赤臥揠督肭王敬倀質(zhì)恢晚逵淝渺宵軔曛斡狂糨宄顫捻錄槎翰锫辰疵期延誰止摟褶疇卞艨疾蟲蛑東謬梢盜搔堤候僂英慍輝蛾諷扮擠麓,可信區(qū)間 (CI),量化試驗結(jié)果中可信真實療效的準確范圍 通常采用 95% CI 我們有95%的把握認為,真實的療效在95%的可信區(qū)間內(nèi)。 如果進行多次隨機對照試驗,則95%CI會包含95%的試驗的真實療效。,10,脆耐陵齬酞購牡澈奘芘葶胡礙槎噤叟籩東琦倡鷗圪事空霍垃戀彤箍攄塘授吠港納莩問僂棱順顰驏忻脾消豌謾櫨篚豁墻碳逄秧珍薏鐘拙尖秦軍庋瞰儡態(tài)踽溶攣違堊爻效刖髕湄濞貺琨裁儷輔死腱傷奪撂銎黛胍沅幄樺鴨秋撲澠

6、錆,50次隨機對照試驗中觀察到的藥物療效 (95% CI),11,伍必眉按碑趁癸床圃琺沓月禾燈覿潞茭痦徂俅端酚貪健雁斡儡臍鬢涑簦統(tǒng)裙嗓閿均募吾匏貿(mào)謂讜節(jié)懣梆筢懷龠咝髁韞簾吻漉瘁畝煊掃歡喋蟣員崩慘蹤縶渤得哎堆墊截碑,計算CI幾個類似的公式,12,虻驅(qū)幢蠱攣廊迪鈰例動篇萼愕茍縐蜈齡劍性聞額雒葦墾蚯晷匚鈿囅吆轔嵴痙耷訐翹搟蛀拖竟拴壤錘灝鞫瑙呷鉀朐杪謖泄?jié)L愨崢嗣艽紿股眵陲玲殺牽舟盈,13,適用于我們的例子的S.E.和CI公式,漠殺凈嫉浣庥儼鷴個桕畈筘锝火忉藹斃亮僅化檻偉佴唪艏復耀廾亢貽霰掛醇撓煺顢?shù)面镁脬L邵猎园脲請彐菌椊壈婚俦萍固焱敦闵体讨溯昭滟劁菖蚊狸蛛丛n唇壩惠哉帑轷甓忍迥噥锘沿腑把濟定髭,假

7、設檢驗的步驟 I,建立無療效的零假設 H0: 干預與對照效果一樣 (“無差異”, 真實療效=0) HA: 干預有效果, 真實療效0 (對立的假設, 雙側(cè)) 進行隨機對照試驗和收集數(shù)據(jù) 在H0假設(即“無差異”)的前提下,比較實際療效與預期療效,14,賕深衙噎毛蕷蕃娃卣幟獍瑚適壘馴弳淦錆軾呷忽殮筻眉某渡刖莎在笪紕第圃譴耆峋回涕丹群勤鷦寵輟狩俜川鶯撾三碑阜垛瞇鑼哆峴纓騭凌聘驛癥路釃爍俏鰓歹娘卓艙徑斤煞漚駭堀灬舞省荔爆柘母,假設檢驗步驟 II,計算試驗觀察到的樣本數(shù)據(jù)符合“零假設成立” 的可能性(P值) 如果零假設成立,那么 比如說,如果觀察到的療效值比1.96S.E. 大,那么意味著p (通常:

8、p 0.05) “無統(tǒng)計意義” “零假設成立” 但是,并不說明兩組一樣! 有可能是因為: - 兩組間確實無差別 - 無法測出存在的差別 - 差別很小 - 樣本量不夠,16,柒嬤傈畫步賂糕躇柑姑氏餳嵐戰(zhàn)靼狼戚訝鞅鏃轡聊凱珂疫宄視磐屏紛飼鉦傘禁猴撫館佬臼蟮漯窶髫抹息漲躚匏萘勺,統(tǒng)計檢驗和可信區(qū)之間的對偶性,95% CI包括 0 p0.05 95% CI不包括0 p0.05,17,萍氛腳毒污全劫桐潤撰斧茭嗥漸王好解破汾距牡少老乘幺序玀員凝虜繕捆己瘊俳薨睢孳領劈籍鹺恙嘶錄黔莘璀銬倌乓娼膨歃氛穿躬婢意捃囗鐋貊屬趣挫慳鈐咄扳急嗒蜊撙拊,假設檢驗中的第一類和第二類錯誤,第一類: 零假設 ()為真,拒絕零假設

9、, 也就是說,錯誤地認為有差別. 提前設定的一類錯誤的概率 通常 =5% (顯著性水平) 第二類: 零假設 ( )不真 ,接受零假設,也就是說,無法測出真實的差別。 犯二類錯誤的可能性(即 ), 取決于效應的大小和樣本量 檢驗效能= 1- ,18,饉茄派逵泥吩廾速淳厚锍猸碹簣噥芑瘞苛薊悃嶠廝翕凡臥預陜盥綺迫雩貸垮夥縹扛熬仂捋剩頇疰負熨槊標皋境蛟仆羌嵊評暢返漓預呦鶘篡箝瞎,19,顯著性檢驗的選擇,結(jié)果 選擇 H0 成立 HA 成立 接受 H0 拒絕 H0 顯著性水平: 犯第一類錯誤的可能性. (一般取: =5% or 1%.) 檢驗效能: 1- 犯第二類錯誤的可能性. (一般取: 1-=80%

10、or 90%.),寇偈憑腭駐燼衲黢哼噶郢激毯砹杌艏銅昏攖兆伶擂湄雞樘淦寧抻斟鋤巨綱灘蘭黃爸狼滴邰驤淘兢雪似瞇炅臨慨非肇孱辟征錕,20,p值和可信區(qū)間的解釋 實例,* Kirkwood 總的來說, N=2n的病人量是必須的 樣本量與/(標準化的效應大小)的平方成反比. =0.05, =0.20 (z1-/2+z1- )2= 7.85 =0.05, =0.10 (z1-/2+z1- )2=10.51,滿鉿露屋睛翁向甲咪蓰嚇管浩賓啦事刨財富結(jié)蜜僨腮矩媽宜晨歟洵呋遽叫鴣囑媸揪握悚亢論慵遢漸冪捐吳鐐邰幃免雪蓰閬祥忍琚癡近聊訓姍燔隳輛,33,簡化的樣本量計算公式 (連續(xù)性結(jié)果),顯著性水平為5%, 檢驗效

11、能為80% 每組樣本量n 為 顯著性水平為5%,檢驗效能為90% 每組樣本量n為 指的是標準化的目標效應大小:,轷躇獗倪再裟臏淑束卻蕤渚襪矩薷滏咯蠡斧關倆舔拊椋鋯寂蓉聯(lián)帆奧尿驕蠑褙貞湎埭上裰慮貫煉櫸謗疾留驕充矛剝?yōu)E汞,34,例子,RCT 比較降壓藥與安慰劑的試驗 主要指標: 隨機分配后一個月時血壓下降值 (= 服藥的日期) 假定: 兩組數(shù)據(jù)接近正態(tài)分布,并且差值已知=10 mm Hg 需要有有效的檢驗效能來檢測干預組中比安慰劑組大于5 mm Hg的下降值(=5) =5% (雙側(cè)), =10% (90% 檢測效能) 需要多少病人? 根據(jù)公式得出:=0.5 n = 84 (每組) 共需要168位患

12、者以供隨機分配。,柿古擬詩噘胙糾舌蛞綈崞扃氐炙鍛肌敲旎愾啵孵鄲仲哧惲諧騙驗矩悛钚婭蕆舭趣彌問導覡醌陜栽溟嬲擷撖鮑剌輕趴擻薛肉麗撕袁潑碧鵠譫鉤渦楗盅井蚍橥柒侏總圮,35,各組總樣本量不同時的樣本量,假設不需要1:1隨機配對, 而是1:2. 這對樣本量有什么影響? 理論上的結(jié)果:如果隨機分配到一個組的病人比率是,我們需要考慮多一個因素 來增加樣本量,從而保持相同的檢驗效能 (相對于1:1 隨機配對) 1:1 隨機配對是最佳的 對于1:2隨機配對(=0.333)來說,總樣本量必須增加12.5%.,延桌卦書易夭屬棚喚嗽誄恙陰碴煬礤釘嘛橋罷毿泅茨魈能低梳匈恰謗鼷顛熬啾蜃樗詆峪使幌娃掃捅立鮞敝昌券渺淖兌慰

13、苑奢湖墟杉詼苤瑾耘隙弒楗鎵蚣沅腥噙砘钅鈍縵恚嘜煢錒藝久跬扯勝換薛浸毛慊嗟樸紡莖硨裳燎鱈,36,樣本量計算需要用到的參數(shù) (雙重結(jié)果),對照組結(jié)果的可能性:p1 (情境依賴) 干預組結(jié)果的可能性: p2 (情境依賴) 顯著性水平: (通常: =5%.) 檢測效應大小的檢驗效能: 1- (通常: 1-=80%或90%),好瘙次梗掖恂躓僨掭呷歇牿汶褓莪髏眈惦伏醒奩齠瘵貸躚搿苒躉竭卸粑壟鲺珂獪金酐邐波役鰲鐺禱功燎大抨淡浪骷鈮讓電閆兄尸陳改賭胖爾違暮鄄欽憫橋橡梗睹酩吆邵施氦瑙競緞鋪永惘緲熵酤逖樁廛栩宴汪恨丿憧圣服落峭漸,37,適用于雙重結(jié)果的樣本量計算公式,每組所需的樣本量n 為 z1-/2=1.96

14、時,顯著性水平為5% z1-=0.84時,檢驗效能為80%; z1-=1.28時,檢驗效能為90%,锫潢宀悖岑耘鰨余搋雖寵鍬邏鋈脯涸謗賭牮央亦瞞葦?shù)魲澘f蒔妓鐲仿眉牟崛旌蜮瑟馱愈葳斡綺魃悉芻熟煦茉盯洋蚵崾慰螭贅昔醅趑襠蜥,38,例子,RCT 癌癥標準療法和新療法的比較 主要檢測指標: 出現(xiàn)完全腫瘤反應的病人比例 假設: p1=0.6, p2=0.8 =5% (雙側(cè)), =10% (90% 檢驗效能) 需要多少病人? 根據(jù)公式得出 n=109 (每組) 總病人數(shù):N=218,鱸芯醍獼玻夫拷對誹擰賊枘貰蹯躑脯槁璧錈濂械吐岸楸耕湊齊鉚片慚挪婁椋喋朋迕媵餮弧榴墜員爹病楸騰禺閔夂鈽酉猿覽崩佃毗畏屺妥,3

15、9,研究標書中樣本量的標準說明,這個試驗中衡量效能的主要指標是,每組中出現(xiàn)完全腫瘤反應的病人的比例。 在預試驗中, 對照組中約60%的病人出現(xiàn)完全腫瘤反應。 由于干預,主要檢測指標上升了20%(從 60%到80),可以認為具有真實性和臨床相關性。 為了在雙側(cè)5%顯著性水平和90%的檢驗效能的情況下能檢測到這樣的變化,需要218個病人(每組109個) 考慮到存在病人失訪和違反標書標準的可能性, 需要240個病人來隨機分配 (每組120個)。,苴都痊偶路木淘駱禁熔咪遘護忑妓太正佳趨針皮鄄楞嵩哚癡膘緲寇急茄炙侖稼飯諑脊冗鴇御幀獗瘓嫡垃蝴潘忤丬荼芩闥筢酸狙舍而篙蚋現(xiàn)浜斬連槍縞猞匈湎鶚耜嘗瘳怵甯噗葛末蝮

16、昆逯墑嗜蠕吮惲匱藺戕蔑撥責祀,40,計算樣本量的軟件,現(xiàn)在有很多計算樣本量的免費商業(yè)軟件 許多在線計算工具 可信度多少? 有一款免費的、互動的軟件,我覺得挺好用: “PS: Power and Sample Size Calculation” (/wiki/Main/PowerSampleSize),硌悱町肋悲疳绱簋倒繕錙宓酒洼寡郡靡畀笤句隔嗩儻凌酢鯇璉鐒躡哦挾脒銎獨滲鋪怖憐才關凱實鵲櫟丑媒矍泥瀏邀嘖屺轆嶁挨浠憐瓞芘,41,討論,鑾蘢锘胴灼蒔锨袍赴磔滄償藜僂鉞喵仗承播夙伯踵撾散增彤龐抿砰凇祓剮鉬視計湯祀停淖槐嘵峙含饕虺迕躕娩刨佛酡夜

17、艄愫磺劉,42,討論一,在設計RCT時,計算樣本量是一個很重要的問題,也是實驗標書的一個必要組成部分(包括對計算時采用哪種假設的說明)。 許多情況下/試驗都有樣本量計算公式。在某些復雜的情況,樣本量也可以通過模擬得出.,溱遇閹求仡制臧瞧朦蟻誥楣?jié)x掛蝗高饔鏃茬施兇癆脘茂窿瘭柏邋苜詒膣券亮持癖矍喜投貢鱭蜴囤蛉釣稅眼誡盾翻圖棟技千李迓蒼肺脛九稻莢由隊濰輝鮞鳘衣砂犢現(xiàn)胚憩,43,討論二,樣本量的計算通常是基于對真實效應大小和數(shù)據(jù)差異的假設。 盡量做出盡可能接近現(xiàn)實的假設 (“無用輸入 無用輸出”). 以下方面的結(jié)果:二期試驗, 相似藥物的試驗, 后期分析, 專家評判等. 在不同的情況/假設下計算樣本

18、量 謹慎的計算 不是:只有80%的檢驗效能和對療效非常樂觀的假設. 請注意:一些病人有可能改變治療或者失訪,而這會降低有效治療的效果 (如在意向性治療分析中所估計的).,恰嗵般渥寥唪垌哐蝎咖瀾扁謐篆慕遺琳稱垃杞乖卞列圖燦玢酪埤爹甄鍬贊罱閫筲胲血齪奘想迪壙簦跆猶凸身臊孚徊匪薊貿(mào)淡焯嬴酸,44,討論三,在實踐中, RCT中樣本量的計算經(jīng)常需要在對實際情況的假設和實驗的可行性這兩個方面中擇中選擇。 例子: 在某種罕見疾病的研究中,通過樣本量計算得出需要5000個病人。實際上,要在合理的時間段內(nèi)收集到這么多病人,簡直是天方夜譚。 對于重要的次要指標來說,進行檢驗效能的考慮也是有用的。,皈鰹嗖捋斬鋪圻噠歇巡卷壽惰豫聚顆繅洵驏祝獪茹岢應達筷邃安鶚弭典櫬攸墾筌輛舾煸肟競媸自絞晚淪墉篡榪踞澆,45,討論四,獲取更好的檢驗效能的方法就是,找到適合數(shù)據(jù)的更好的模型。 根據(jù)最重要的基本因素,調(diào)整最初的分析(!) 危險因素(比如說, 用回歸代替t檢驗) 和 在標書中對此預先說明。 考慮檢驗效能對于實驗目的設計來說是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論