醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座_第1頁
醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座_第2頁
醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座_第3頁
醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座_第4頁
醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

醫(yī)學科研設(shè)計與統(tǒng)計學思維

醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第1頁

醫(yī)學統(tǒng)計學要說它簡單吧,其實也挺簡單,常見統(tǒng)計方法也就十余種,在教科書上都能找到,只要熟練掌握了,雖不敢夸下??谡f能夠“以秋風掃落葉氣概橫掃四海之內(nèi)雜志”,但足以輕車熟路地應(yīng)付普通科學研究。要說它復(fù)雜吧,也挺復(fù)雜,毫不夸大地說,絕大部分國內(nèi)期刊,甚至在SCI雜志上,亂用統(tǒng)計學現(xiàn)象多如牛毛。很多人在學習醫(yī)學統(tǒng)計課時,都在埋怨自己極難走出“一學就會,一會就用,一用就錯,一錯就懵”怪圈。究其原因,主要是我們在學習醫(yī)學統(tǒng)計課時都抱著一副“依葫蘆畫瓢”態(tài)度,試圖“套用統(tǒng)計學方法”來處理自己面臨問題,而不去仔細思索統(tǒng)計學方法本身特點。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第2頁

沒有設(shè)計臨床干預(yù)試驗

1685年搶救英國國王查理二世(CharlesII,1630-1685):

“一品脫(0.568L)血從右臂放出,半品脫血從左肩放出,服下催吐劑、兩付湯藥和一個由15成份灌腸劑。刮國王頭部,直到起一個大泡。再服打噴嚏藥粉和更多催吐劑。繼續(xù)放血,加服止痛劑。把瀝青和鴿子糞混合后敷于腳上。服一個含有10種成份草藥。最終服人頭蓋骨粉制成40滴糖漿,外敷牛黃。然后,國王陛下死了?!贬t(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第3頁

有設(shè)計臨床干預(yù)試驗

1747年5月20日,英國J.Lind醫(yī)生將12名病情相同似患者帶到一艘船上。患者主要癥狀是牙齦潰爛,皮膚有出血點,雙膝無力。Lind將12名患者分為6組,分別給予以下主要干預(yù):A組:天天飲1夸脫(1.136L)蘋果汁;B組:服25滴硫酸丹劑(elixirvitriol),天天3次;C組:服2匙醋,天天3次;D組:天天飲約半品脫海水,服緩解瀉藥;E組:天天食2個桔子,一個檸檬;F組:天天服由大蒜、芥子等成份組成干藥。

當6月16日船返回英國Plymouth港時,全部患者病情都有好轉(zhuǎn),其中E組恢復(fù)最快、最好,其中一人到第6天就能夠工作了。B組也有一人比登船時健康。Lind醫(yī)生試驗并沒有得出明確結(jié)論,直到160年后,經(jīng)過動物試驗才真正從科學意義上解釋了E組療效最好真正原因。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第4頁J.Lind醫(yī)生研究有二點符合統(tǒng)計學設(shè)計:1、設(shè)置了對照(相互對照);2、質(zhì)量控制(消除了一些混雜)。假如我們今天重復(fù)J.Lind研究,在統(tǒng)計設(shè)計上還需要做到以下幾點:1、研究對象定義與納入標準和排除標準2、足夠多觀察對象3、效應(yīng)指標選擇4、結(jié)論是否能外推醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第5頁統(tǒng)計學方法用于干預(yù)試驗1835年,法國醫(yī)生P.C.A.Louis對當初流行“放血”療法治療肺炎效果進行了比較,發(fā)覺“放血”療效不象預(yù)期那么好,而且早期“放血”和晚期“放血”組比較,患者診療、病情、病程、年紀等方面差異很大,比較平均治愈時間意義不大。因為晚期“放血”組平均治愈時間長,但該組患者病情重、病程長、年紀大。Louis對醫(yī)學研究方法學作出了很大貢獻:

(1)用數(shù)字方法表示不一樣疾病患者特征和預(yù)后;

(2)提出了臨床療效對比前瞻性標準;

(3)提出抽樣誤差和混雜(confounding)概念。其中前瞻性研究和降低混雜,分別成為當今臨床試驗和流行病學研究基本研究方法;

(4)在J.Gavarret幫助下,Louis數(shù)字方法發(fā)展為“概率框架”,Gavarret也于1840年在巴黎出版了世界第一部醫(yī)學統(tǒng)計學教科書。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第6頁

“非常痛心地看到,因為數(shù)據(jù)分析缺點和錯誤,那么多好生物研究工作面臨著被葬送危險”

F.Yates,M.J.R.Healy醫(yī)學論文中統(tǒng)計問題

統(tǒng)計知識利用

撰寫論文:匯報自己觀察或試驗研究結(jié)果

閱讀論文:吸收新知識,了解學術(shù)進展1996年,對申報科技結(jié)果4586篇科研論文分析,統(tǒng)計方法使用率為76%。

醫(yī)學論文中統(tǒng)計利用錯誤,除了影響論文科學性,還可能造成嚴重倫理學問題。

醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第7頁“調(diào)查結(jié)果反應(yīng)了醫(yī)學論文作者統(tǒng)計知識和統(tǒng)計水平低下,也再次強調(diào)了生物統(tǒng)計學者不是令人生畏檢驗官。恰恰相反,生物統(tǒng)計學者是我們可貴盟友。生物統(tǒng)計學不是遠離我們數(shù)學,而是當代醫(yī)學一門基本學科,就像大廈中一個支柱”---JAMA編輯部60年代到80年代,國外醫(yī)學雜志調(diào)查結(jié)果:有統(tǒng)計錯誤論文20%~72%。1984年對《中華醫(yī)學雜志》、《中華內(nèi)科雜志》、《中華外科雜志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文調(diào)查結(jié)果:

相對數(shù)誤用為11.2%

抽樣方法誤用15.9%

統(tǒng)計圖表誤用11.7%1996年對4586篇論文統(tǒng)計(中華醫(yī)學會系列雜志占6.9%),數(shù)據(jù)分析方法誤用達55.7%。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第8頁

科學容不得半點虛假,造假者一旦被揭露就背上了永遠洗脫不掉恥辱

。偽造統(tǒng)計數(shù)據(jù)違反科學道德

據(jù)1976年NewScience雜志關(guān)于科研舞弊行為調(diào)查74%調(diào)查表反應(yīng)有不正當修改數(shù)據(jù)情況,其中,17%拼湊試驗結(jié)果,7%憑空捏造數(shù)據(jù),2%有意曲解結(jié)果。

就統(tǒng)計學本身來說,正確試驗設(shè)計得出統(tǒng)計結(jié)果,是用P值作為“重現(xiàn)性”概率確保。P<0.05,就是說試驗結(jié)果顯示差異是機遇所致可能性不足5%,或者說,他人在一樣條件下重復(fù)一樣試驗,得出相反結(jié)論可能性不足5%。

醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第9頁總體樣本抽取部分觀察單位

統(tǒng)計量

數(shù)

統(tǒng)計推斷統(tǒng)計推斷statisticalinference如:樣本均數(shù)

樣本標準差S

樣本率

P如:總體均數(shù)

總體標準差

總體率內(nèi)容:參數(shù)預(yù)計(estimationofparameters)

包含:點預(yù)計與區(qū)間預(yù)計2.假設(shè)檢驗(testofhypothesis)醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第10頁總體樣本抽取部分觀察單位

統(tǒng)計量

數(shù)

統(tǒng)計推斷抽樣誤差如:樣本均數(shù)

樣本標準差S

樣本率

P如:總體均數(shù)

總體標準差

總體率

抽樣誤差

(samplingerror):因為個體差異造成樣本統(tǒng)計量與總體參數(shù)間差異。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第11頁

統(tǒng)計結(jié)論是推斷而不是證實,正確統(tǒng)計結(jié)論必須建立在科學設(shè)計和適當統(tǒng)計方法上,不然得到是不恰當或是錯誤結(jié)論。1、搜集數(shù)據(jù)方法(研究假說、調(diào)查或試驗設(shè)計、誤

差和偏倚控制等)2、分析數(shù)據(jù)方法(變量類型、數(shù)據(jù)分布、研究

目標和原因等)3、結(jié)論外推(統(tǒng)計結(jié)論是否適合全部研究對象)醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第12頁1.采取統(tǒng)計學方法,發(fā)覺不確定現(xiàn)象背后隱藏規(guī)律。

變異(variation)是社會和生物醫(yī)學中普遍現(xiàn)象。

變異使得試驗或觀察結(jié)果含有不確定性,如每個人身高、體重、血壓等各有不一樣。

一、為何要學統(tǒng)計學?醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第13頁

最大值=6.18,最小值=3.29,極差=2.89。

算術(shù)均數(shù)=4.72,標準差=0.57。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第14頁案例一:兩個指標診療疾病問題路人甲做了一個研究,意在比較兩個指標(A和B)對肝癌診療價值。路人甲以A和B參考范圍上限作為診療界值,得出了A和B在該界值下對應(yīng)診療敏感性和特異性。結(jié)果表明,A診療敏感性為0.80,特異性為0.90;B診療敏感性為0.85,特異性為0.87。路人甲很快撰寫論文報道了自己研究結(jié)果,指出B診療肝癌敏感性高于A,而特異性低于A。

路人乙是這篇文章審稿人,當他看見這個結(jié)論后,毫不猶豫地在審稿意見中寫道:就敏感性而言,B高于A;就特異性而言,A高于B。診療敏感性和特異性與所采取界值親密相關(guān),作者得出敏感性和特異性僅僅代表了一個診療界點下面診療效能,無法從全局上反應(yīng)A和B診療價值。文章結(jié)論到底是想說明A優(yōu)異還是B優(yōu)異呢Reject!這個例子說明:統(tǒng)計指標選錯了,統(tǒng)計出來東西往往難以“自圓其說”。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第15頁稿件被退了,路人甲有些許郁悶。經(jīng)過認真學習科研設(shè)計與統(tǒng)計學知識后,路人甲終于明白了一個問題:兩個指標診療性能比較是不能比較敏感性和特異性,而應(yīng)該比較ROC曲線下面積,因為曲線下面積才是衡量整體診療效率最正確指標。路人甲很快繪制了ROC曲線,統(tǒng)計結(jié)果表明,A曲線下面積為0.80,B曲線下面積為0.82。路人甲欣喜若狂,趕快動筆寫論文,而且理直氣壯地給文章定了一個結(jié)論:B診療效率是優(yōu)于A,其理由就是因為B曲線下面積大于A。

路人丙是這篇文章審稿人,當他看見這個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見中寫道:從表面上看,B曲線下面積高于A,不過造成這種差異原因有兩種,一個是隨機誤差,一個是試驗效應(yīng),即B確實是高于A。你怎么能確定這不是抽樣誤差呢?在統(tǒng)計學上,要確定0.82是否高于0.80,就一定要經(jīng)過統(tǒng)計學檢驗。又Reject!

這個例子說明:在醫(yī)學科研中,沒有經(jīng)過統(tǒng)計學檢驗結(jié)論雜志社多半認為是不科學。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第16頁稿件又被退了,路人甲很是郁悶。他吸收了經(jīng)驗教訓,自學了很多統(tǒng)計學理論,終于搞清楚了采取何種方法去比較曲線下面積。接下來事情就是改稿,然后另選雜志繼續(xù)投稿。路人甲在文稿中尤其注明了,曲線下面積是經(jīng)過了統(tǒng)計學檢驗,B曲線下面積(0.82)與A曲線下面積(0.80)之間差異是有統(tǒng)計學意義,而且還大搖大擺地在后面加了個括號,寫明P=0.01。路人甲仰天長嘆了一口氣,很鄭重地給自己研究下了結(jié)論:本研究表明B診療效率是優(yōu)于A。

路人丁是這篇文章審稿人,當他看見這個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見寫道:B是常見診療指標,其檢測結(jié)果并不對臨床醫(yī)師設(shè)盲,在很大程度上能夠檢測影響臨床醫(yī)師對疾病診療。A是新進發(fā)覺診療指標,其結(jié)果完全對臨床醫(yī)師設(shè)盲,不可能影響醫(yī)生診療。所以作者結(jié)論(B比A優(yōu)異)是不可靠。再說得通俗點,假如把A和B分別了解成法庭上原稿和被告,那B無疑既充當了辯護律師,又充當了法官角色。在這種情況下,A輸?shù)袅斯偎臼鞘终!<偃鐡Q一個公平、獨立法官來斷案,B能否勝出就不好說了。再一次Reject!

這個例子說明:實(試)驗設(shè)計有缺點,即便是統(tǒng)計學方法準確也于事無補。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第17頁稿件又一次被退了,路人甲心情極度郁悶。思來想去,決定把試驗重做一遍,讓A和B在一個公平環(huán)境中比較(為便于描述,此處忽略醫(yī)學倫理學問題)。在新開展研究中,A和B都是對臨床醫(yī)生設(shè)盲,不可能影響金標準。這下A和B比較結(jié)果應(yīng)該比較可靠了吧,路人甲又仰天長嘆了一口氣,感覺自己如釋重負了??蒲刑垓v人了,太不輕易了!統(tǒng)計結(jié)果很快出來,A曲線下面積是0.80,B曲線下面積則變成了0.77,經(jīng)過統(tǒng)計學檢驗后發(fā)覺,A診療效能確實是高于B。整個研究試驗設(shè)計滴水不漏,統(tǒng)計學過程天衣無縫,我就不信還有些人敢拒這篇稿件,路人甲心中開始暗喜。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第18頁路人戊是這篇文章審稿人,當他看見這個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見寫道:A和B檢測并不矛盾,他們之間關(guān)系不應(yīng)該是競爭關(guān)系,而應(yīng)該是合作關(guān)系。讀者最關(guān)心問題顯然不是A和B“孰強孰弱”問題,即使這個問題有一定專業(yè)價值。假如我是坐診醫(yī)生,我會說:A和B誰強誰弱關(guān)我什么事?總之來一個病人我就A和B都檢測,我患者都不差錢!作者研究重點應(yīng)該是明確A和B能否互補,聯(lián)合使用是否能有利于提升診療準確性問題,而非A和B“孰強孰弱”問題。簡單地說,就是明確1+1是否大于1問題。還是被Reject!(作者吐血)這個例子說明:研究方向錯了,即使是無懈可擊實(試)驗設(shè)計和天衣無縫統(tǒng)計方法,也是無濟于事。這四個例子說明:醫(yī)學科研是很痛苦,不重視統(tǒng)計學和科研設(shè)計,會走很多彎路。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第19頁2.

用統(tǒng)計學思維方式考慮相關(guān)醫(yī)學研究中問題

“陽性”結(jié)果是否是虛假聯(lián)絡(luò)?

某感冒藥治療1周后,治愈率為90%,能否說該感冒藥十分有效?

以前許多研究表明,血清甘油三酯含量與冠心病危險性相關(guān),即甘油三酯含量越高,患冠心病危險性就越大。有醫(yī)生以此篩選危險人群?

冠心病甘油三酯膽固醇+高密度脂蛋白虛假聯(lián)絡(luò)醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第20頁案例二,怎樣對待統(tǒng)計學結(jié)果路人甲經(jīng)歷數(shù)十年研究,動用了各種高精尖研究伎倆,發(fā)覺了一個新蛋白(命名為蛋白A)。在肝癌患者中展開研究表明,蛋白A和甲胎蛋白(AFP)有很好相關(guān)性,其相關(guān)程度之好,幾乎能夠用“一塌糊涂”來形容,相關(guān)系數(shù)到達了0.99(P<0.0001)。路人甲欣喜若狂,盡管蛋白A檢測過程還十分繁瑣,檢測費用還十分高,不過路人甲還是把持不住內(nèi)心激動,日夜兼程地撰寫論文,宣稱自己找到了一個新肝癌標志物。

路人乙是這篇文章審稿人,當他看見這個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見寫道:統(tǒng)計結(jié)果表明蛋白A和AFP相關(guān)性十分顯著。假如是這么,在臨床實踐中,經(jīng)過檢測AFP完全就能夠得知蛋白A濃度了,蛋白A在肝癌中臨床價值完全能夠被AFP代替,還不說蛋白A檢測過程繁瑣,費用太高問題,你說蛋白A還有什么價值?Reject!這個例子說明:統(tǒng)計學陽性結(jié)果未必是“好結(jié)果”。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第21頁

如:當專業(yè)上有一定聯(lián)絡(luò)兩個變量之間改變呈“S型”或“倒S型”曲線趨勢時,若錯誤地用直線方程去描述,從統(tǒng)計學角度看效果也很好,但在專業(yè)上是解釋不通。再比如,某兩個統(tǒng)計量(如均值、率等)之間差異在統(tǒng)計學上有顯著性意義,有時在專業(yè)上并無實用價值。如某種新降壓藥,平均降低血壓2mmHg,若樣本含量較大,誤差又較小,統(tǒng)計檢驗可能會得到“P<0.05”結(jié)果,但在臨床上卻認為此新藥療效沒有多大提升。另外,在利用統(tǒng)計學中,稍有不慎都可能犯這么或那樣錯誤。所以,統(tǒng)計結(jié)論可靠性仍需經(jīng)過實踐去檢驗。所以,應(yīng)該切記:利用統(tǒng)計課時必須結(jié)合醫(yī)學實際,才能真正發(fā)揮統(tǒng)計學應(yīng)有作用。組別N基線血壓(mmHg)治療后血壓(mmHg)標準差(mmHg)P值95%CI(mmHg)統(tǒng)計學意義臨床意義治療組2001601426<0.050.8~3.2有無對照組2001601446有統(tǒng)計學(差異)意義,并不代表有生物學、臨床意義醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第22頁案例三,降糖藥研究、學生自殺事件某醫(yī)生長久從事降糖藥研究,最近他發(fā)覺了一個藥品,能夠降低患者血糖。為了評價該藥降糖效果,路人甲費盡心機地設(shè)計了一個看似完美隨機對照試驗(RCT),為了確保結(jié)果可靠,路人甲嚴格恪守RCT設(shè)計準則,包含隨機、雙盲、撫慰劑對照等辦法。研究結(jié)果表明,試驗組和對照組在接收藥品治療前血糖濃度均值都是10mmol/L,差異無統(tǒng)計學意義,表明兩組研究對象基線特征含有可比性。對照組未經(jīng)任何藥品治療(為便于描述,此處忽略醫(yī)學倫理學問題),血糖濃度還是10mmol/L;試驗組經(jīng)過藥品干預(yù)后,血糖濃度變成了9mmol/L,統(tǒng)計學檢驗結(jié)果表明,試驗組和對照組治療后血糖濃度差異是有統(tǒng)計學意義(P<0.01)。路人甲趕快撰寫論文,并毫不客氣地給研究下了個結(jié)論:該藥能夠降低患者血糖。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第23頁路人乙是這篇文章審稿人,當他看見這個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見寫道:卻要確實能夠降低血糖,不過一個只能降低1mmol/L降糖藥有何臨床價值?Reject!

這個例子說明:有統(tǒng)計學意義不一定有專業(yè)意義。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第24頁某CDC做了一個調(diào)查,同處一地A和B兩所中學,各有1000名學生,過去一年,A校有5名學生自殺(自殺率為0.5%),B校沒有學生自殺(自殺率為0%)。統(tǒng)計學結(jié)果表明,兩校自殺率差異無統(tǒng)計學意義(P=0.07,F(xiàn)isher確切概率法)。于是寫論文得出結(jié)論:A和B兩校自殺率是沒有統(tǒng)計學上差異,A校5名學生自殺純屬小概率事件。路人乙是這篇文章審稿人,當他看見這個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見寫道:5個鮮活生命就這么沒有了,5個家庭就這么毀了,你卻告訴我這純屬小概率事件,你就不怕“人神共憤”嗎?Reject!

這個故事說明:有專業(yè)意義不一定有統(tǒng)計學意義。這兩個故事說明:統(tǒng)計學只是方法學,醫(yī)學科研中需要借助統(tǒng)計學方法來發(fā)覺事物規(guī)律性,但不能死磕統(tǒng)計。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第25頁例:某醫(yī)生用一個新治療某病療法(簡稱治療組),用現(xiàn)在公認療法作為對照(簡稱對照組),經(jīng)臨床試驗,對照組和治療組療效分別為P1=75%與P2=95%。問:能認為這兩個有效率之間差異有顯著性意義嗎?答:這兩個有效率之間差異可能有統(tǒng)計學意義,也可能沒有統(tǒng)計學意義。因為其結(jié)論不但取決于二者之差絕對值大小,更主要是取決于隨機誤差大小和樣本大小,千萬不可輕率地作出統(tǒng)計推斷?,F(xiàn)假定這兩個有效率分別來自以下甲、乙、丙三批試驗結(jié)果,則含有以下3種不一樣統(tǒng)計檢驗結(jié)果。“陰性”結(jié)果是否是樣本含量不足?

有些人曾對發(fā)表在Lancet,NEnglJMed,JAMA等著名醫(yī)學雜志上71篇陰性結(jié)果論文作過分析,發(fā)覺其中有62篇(93%)可能是因為樣本含量不足造成假陰性。

醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第26頁表1、兩個有效率比較甲試驗中,P1與P2之間差異無統(tǒng)計學意義(校正χ2=1.765,P>0.05)乙試驗中,P1與P2之間差異有統(tǒng)計學意義(χ2=6.275,0.01<P<0.05);丙試驗中,P1與P2之間差異也有統(tǒng)計學意義(χ2=9.412,P<0.01)。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第27頁醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第28頁案例四:路人甲創(chuàng)造了兩套診療肺癌方案,分別命名為A和B。為了明確這兩種方到底誰“更勝一籌”,路人甲找了100個肺癌患者和100個疑似肺癌患者(結(jié)核、肺炎等),分別用A、B兩套方案去進行判別診療。在200個研究對象中(100個肺癌和100個非肺癌),方案A正確了100例,準確率50%,方案B僅僅正確了50例,準確率僅為25%??ǚ綑z驗結(jié)果:方案A和B準確率之間差異有統(tǒng)計學意義(P<0.01)。很顯著,方案A準確性要高于方案B。路人甲趕快發(fā)表論文,指出:方案A診療肺癌準確性優(yōu)于方案B。路人乙是這篇文章審稿人,當他看見這個結(jié)論后,臉色鐵青,毫不猶豫地在審稿意見寫道:假如我(審稿人本人)是坐診醫(yī)生,他就會反著看方案B結(jié)果,凡是方案B認為是肺癌,他就認為病人不是肺癌;反之亦然。這么下來,200個病人中,方案B應(yīng)該能正確識別150個人,準確率為75%,統(tǒng)計學結(jié)果表明,方案B準確率(75%)是高于方案A(50%),所以真實情況是方案B優(yōu)于方案A。實際上,當面對這200名患者時候,隨便到城隍廟找個瞎子來“算命(猜患者是否患?。?,按照統(tǒng)計學理論,準確率也應(yīng)該是50%,方案A價值能夠說是“一無是處”。Reject!這個例子說明:統(tǒng)計學陰性結(jié)果未必是“壞結(jié)果”。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第29頁3.

確保你研究論文能經(jīng)過統(tǒng)計學審查

據(jù)國外60~80年代對不一樣醫(yī)學雜志發(fā)表論文調(diào)查,有統(tǒng)計錯誤論文百分比最高達72%,最低也有20%。

國內(nèi)1984年對《中華醫(yī)學雜志》、《中華內(nèi)科雜志》、《中華外科雜志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文調(diào)查結(jié)果,相對數(shù)誤用為11.2%,抽樣方法誤用15.9%,統(tǒng)計圖表誤用11.7%。某研究者1996年對4586篇論文統(tǒng)計(中華醫(yī)學會系列雜志僅占6.9%),數(shù)據(jù)分析方法誤用達55.7%。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第30頁JAMA,新英格蘭醫(yī)學雜志(NEJM)、英國醫(yī)學雜志、中華醫(yī)學會雜志對來稿都有統(tǒng)計學要求或統(tǒng)計學指導。

國際生物醫(yī)學雜志編輯協(xié)會在其《生物醫(yī)學期刊投稿統(tǒng)一要求》中也包含了統(tǒng)計學要求。UniformRequirementsforManuscripts

SubmittedtoBiomedicalJournals

http://醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第31頁《中華醫(yī)學雜志》對來稿中統(tǒng)計學處理相關(guān)要求1.統(tǒng)計研究設(shè)計:應(yīng)交代統(tǒng)計研究設(shè)計名稱和主要做法。如調(diào)查設(shè)計(分為前瞻性、回顧性或橫斷面調(diào)查研究);試驗設(shè)計(應(yīng)交代詳細設(shè)計類型,如本身配對設(shè)計、成組設(shè)計、交叉設(shè)計、析因設(shè)計、正交設(shè)計等);臨床試驗設(shè)計(應(yīng)交代屬于第幾期臨床試驗,采取了何種盲法辦法等)。主要做法應(yīng)圍繞4個基本標準(隨機、對照、重復(fù)、均衡)概要說明,尤其要交代怎樣控制主要非試驗原因干擾和影響。2.資料表示與描述:用x和s表示近似服從正態(tài)分布定量資料,用M(Q)表示呈偏態(tài)分布定量資料;用統(tǒng)計表時,要合理安排縱橫標目,并將數(shù)據(jù)含義表示清楚;用統(tǒng)計圖時,所用統(tǒng)計圖類型應(yīng)與資料性質(zhì)相匹配,并使數(shù)軸上刻度值標法符合數(shù)學標準;用相對數(shù)時,分母不宜小于2O,要注意區(qū)分百分率與百分比。3.統(tǒng)計分析方法選擇:對于定量資料,應(yīng)依據(jù)所采取設(shè)計類型、資料所具備條件和分析目標,選取適當統(tǒng)計分析方法,不應(yīng)盲目套用t檢驗和單原因方差分析;對于定性資料,應(yīng)依據(jù)所采取設(shè)計類型、定性變量性質(zhì)和頻數(shù)所具備條件以及分析目標,選取適當統(tǒng)計分析方法,不應(yīng)盲目套用χ2

檢驗。對于回歸分析,應(yīng)結(jié)合專業(yè)知識和散布圖,選取適當回歸類型,不應(yīng)盲目套用簡單直線回歸分析,對含有重復(fù)試驗數(shù)據(jù)回歸分析資料,不應(yīng)簡單化處理;對于多原因、多指標資料,要在一元分析基礎(chǔ)上,盡可能利用多元統(tǒng)計分析方法,方便對原因之間交互作用和多指標之間內(nèi)在聯(lián)絡(luò)進行全方面、合理解釋和評價。4.統(tǒng)計結(jié)果解釋和表示:當P<0.05(或P<0.01)時,應(yīng)說明對比組之間差異有統(tǒng)計學意義,而不應(yīng)說對比組之間含有顯著性(或非常顯著性)差異;應(yīng)寫明所用統(tǒng)計分析方法詳細名稱(如:成組設(shè)計資料t檢驗、兩原因析因設(shè)計資料方差分析、多個均數(shù)之間兩兩比較q檢驗等),統(tǒng)計量詳細值(如t=3.45,X2=4.68,F(xiàn)=6.79等)應(yīng)盡可能給出詳細P值(如P=0.0238);當包括到總體參數(shù)(如總體均數(shù)

總體率等)時,在給出顯著性檢驗結(jié)果同時,再給出95%置信區(qū)間。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第32頁還是那個AFP與蛋白A例子。路人甲發(fā)覺蛋白A和甲胎蛋白(AFP)之間有很好相關(guān)性,也開始撰寫論文,不過他結(jié)論并不是“蛋白A是診療肝癌標識物”。他認為,既然蛋白A與AFP之間有很強相關(guān)性,那提醒AFP和蛋白A之間可能存在十分親密“調(diào)整”或者“被調(diào)整”關(guān)系。最終,路人甲圍繞“蛋白A與AFP之間調(diào)整或者被調(diào)整關(guān)系”做了很多分子生物學試驗,指出蛋白A是調(diào)整AFP表示唯一(注意“唯一”這兩個字)因子,所以二者之間才會展現(xiàn)如此強烈相關(guān)性。這是一項基礎(chǔ)研究,即使未能直截了當?shù)氐刂赋龅鞍譇臨床價值,不過這個研究形象生動地講述了一個完整分子生物學事件,豐富了我們對于肝癌發(fā)生與發(fā)展分子機制認識。最終,論文“堂而皇之”地accept了。

這個例子說明:同一統(tǒng)計學結(jié)果,從不一樣專業(yè)角度去解釋,結(jié)論是完全不一樣。以上全部案例說明:對統(tǒng)計學結(jié)果解讀一定要結(jié)合專業(yè)!從專業(yè)中來,到專業(yè)中去!醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第33頁4.

取得循證醫(yī)學證據(jù)主要伎倆“良好愿望醫(yī)學”(well-meaningmedicine)轉(zhuǎn)入“以證據(jù)為基礎(chǔ)醫(yī)學”

(evidence-basedmedicine,EBM)需要有統(tǒng)計學方法支持。

全世界醫(yī)學期刊每年大約登載600萬學術(shù)論文,但能作為可靠“證據(jù)”論文并不多。

醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第34頁

二、

醫(yī)學科研基本要素

醫(yī)學科研由三個基本部分組成,即處理原因(studyfactor)、受試對象(studyobject)和試驗效應(yīng)(experimentaleffect)。比如,觀察流甲丙脯酸對腎性高血壓患者療效。其中,疏甲丙脯酸為處理原因,腎性高血壓患者為受試對象,動脈壓改變?yōu)樵囼炐?yīng)。通常將這三個組成部分稱為醫(yī)學科研基本要素。怎樣正確選擇三個要素,是科研設(shè)計關(guān)鍵問題。

StudyfactorStudyobjectExperimentaleffect醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第35頁1、醫(yī)學研究設(shè)計基本原理:降壓藥高血壓病人血壓值TseT+S=e基本模式:T+s1=e1=20mmHgO+s2=e2=5mmHgT-O=e1-e2=20-5Te=15mmHg處理原因作用被單獨顯示統(tǒng)計分析思維:

在排除或控制了一些可能影響試驗效應(yīng)原因后,以概率為基礎(chǔ)計算其差異是否為隨機誤差(偶然性結(jié)果),從而推斷處理因素(或暴露)效應(yīng)是否不為零。處理效應(yīng)(暴露)(目標人群)(發(fā)病風險)處理組:對照組:研究假說:處理效應(yīng)不為零統(tǒng)計假設(shè):處理效應(yīng)為零醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第36頁

醫(yī)學科研類型因為不一樣科研目標,有各種不一樣分類方法。如,按科技活動類型分為基礎(chǔ)研究、應(yīng)用研究和開發(fā)研究(發(fā)展研究);按照醫(yī)學中各專業(yè)屬性,可分為:基礎(chǔ)醫(yī)學科研、臨床醫(yī)學科研、預(yù)防醫(yī)學科研、社會醫(yī)學科研(包含衛(wèi)生事業(yè)管理學研究和醫(yī)學心理學科)。

普通來說,醫(yī)學科研分類,常按設(shè)計類型不一樣,分為以下幾個基本類型。(圖1-1)醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第37頁普查抽樣調(diào)查經(jīng)典調(diào)查橫斷面研究(現(xiàn)況研究)常規(guī)資料分析匯報描述性研究個案調(diào)查(病例、病例家眷、周圍概況))生態(tài)學研究(相關(guān)研究)病例對照研究(探索性、驗證性)隊列研究(歷史性、同時性)觀察性研究醫(yī)學科研方法巢式病例對照研究病例-病例研究病例隊列研究多階段復(fù)合設(shè)計研究分析性研究

試驗室試驗

臨床試驗

小區(qū)試驗試驗性研究理論性研究(數(shù)學模型研究)圖1-1醫(yī)學科研方法基本類型醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第38頁2、

醫(yī)學研究設(shè)計4個基本標準

重復(fù)、隨機、對照、均衡是試驗設(shè)計4個基本標準,在試驗設(shè)計中務(wù)必要嚴格恪守。不然,試驗研究結(jié)果可靠性將大受影響。所謂重復(fù),就是試驗原因各水平組合下要有足夠樣本含量。因為統(tǒng)計學研究是隨機現(xiàn)象改變規(guī)律性,重復(fù)次數(shù)少,內(nèi)在規(guī)律表現(xiàn)不出來。在統(tǒng)計學上可依據(jù)設(shè)計類型選取對應(yīng)樣本含量估算公式進行計算。所謂隨機,就是每一個試驗單位都有同等機會被分配到任何一個組中去,分組結(jié)果不受人為原因干擾和影響。在統(tǒng)計學上有許多實現(xiàn)隨機化詳細方法,應(yīng)該嚴格實施。千萬不可用“隨便”取代隨機。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第39頁所謂對照,就是要設(shè)置參考物。因為沒有對比,就無法判別優(yōu)劣。比如,要考查一個新抗癌藥療效怎樣,必須設(shè)置一個對照組。在對照組里癌癥患者,能夠什么抗癌藥都不用(稱為空白對照,在臨床上應(yīng)該慎用這種對照),亦能夠用現(xiàn)在公認最好抗癌藥作為對照藥(稱為標準對照)。在研究干預(yù)辦法效果時,直接觀察到往往是各種原因效應(yīng)交織在一起綜合作用,而合理對照能成功地將辦法真實效應(yīng)客觀、充分地識別出來,使研究者得以做出正確評價。普通來說,設(shè)置對照能夠最大可能地防止以下原因或現(xiàn)象對臨床試驗研究結(jié)果影響:①不能預(yù)知結(jié)局(unpredictableoutcome),因為人類認識不足,干預(yù)效應(yīng)受一些當前未被認識潛在未知原因影響。②向均數(shù)回歸(regressiontothemean)在臨床實踐中,有些極端臨床癥狀或體征有向均數(shù)回歸現(xiàn)象。所謂均衡,就是要設(shè)法使各條件(即試驗原因各水平組合)下受試對象受到非試驗原因干擾和影響機會和數(shù)量基本相等。這么一來,由各組受試對象反應(yīng)出來試驗效應(yīng)才能較為客觀地表達出試驗原因取不一樣水平時所產(chǎn)生效果。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第40頁三、統(tǒng)計分析意義:

有些論文中資料十分豐富,現(xiàn)有多原因又有多指標。遺憾是有些作者未對資料作統(tǒng)計分析就作出了結(jié)論;有些即使作了統(tǒng)計分析,但普通僅作單原因分析,而且,所選取分析方法還不完全得當。因為統(tǒng)計軟件日趨普及,人們能夠利用科學統(tǒng)計分析方法,對同一份資料進行更深入分析,這有利于更加好地發(fā)掘資料中所蘊藏信息,揭示資料間相互關(guān)系和內(nèi)在規(guī)律性。對于同一份實際資料,因為研究目標、觀察角度不一樣,所選取統(tǒng)計處理方法也會不盡相同。用各種統(tǒng)計分析方法對資料進行多層次、多側(cè)面綜合處理,盡可能挖掘各方面信息是十分必要,也是完全可能。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第41頁對資料作統(tǒng)計分析時,可從以下幾個方面考慮怎樣合理選擇各種統(tǒng)計分析方法。其一,資料類型與描述統(tǒng)計量選擇。資料普通可分為定量與定性兩大類,定量資料可細分為計量和計數(shù)兩種;定性資料可細分為有序和無序(名義)兩種。描述定量資料慣用統(tǒng)計指標有:平均指標、變異指標、分位數(shù)等;描述定性資料慣用統(tǒng)計指標有絕對數(shù)和相對數(shù)等。按變量測量準確程度由低到高,將數(shù)據(jù)分類為:名義數(shù)據(jù)(如性別、婚姻情況)、有序變量(如療效,類別間差異大小難以度量)、區(qū)間變量(如攝氏體溫,類別間差異有實際意義)、比變量(如身高,除含有區(qū)間變量特征外,還含有真實意義零點。攝氏溫度零點為水結(jié)冰時溫度,并非絕對意義零點,所以它不屬于比變量)

醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第42頁其二,資料類型與區(qū)間預(yù)計選擇。慣用于定量資料區(qū)間預(yù)計方法有個體值允許區(qū)間(醫(yī)學上亦稱“正常值范圍”)及總體均值(或其它特定參數(shù))可信區(qū)間;慣用于定性資料區(qū)間預(yù)計方法是總體率可信區(qū)間。其三,資料類型與統(tǒng)計分析方法選擇。普通來說,當分組變量為定性變量,指標(或結(jié)果)變量為定量變量時,慣用統(tǒng)計分析方法有t檢驗、Z檢驗、方差分析(亦稱F檢驗)和秩和檢驗等;當分組變量和指標(或結(jié)果)變量均為定性變量(包含由定量變量轉(zhuǎn)化而產(chǎn)生)時,慣用統(tǒng)計分析方法有卡方檢驗、秩和檢驗、Ridit分析、線性趨勢檢驗等。其四,處理多原因多元資料常見統(tǒng)計分析方法有多元回歸分析、多元方差和協(xié)方差分析、聚類分析、主成份分析、因子分析、經(jīng)典相關(guān)分析等。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第43頁四、資料統(tǒng)計分析中錯誤:在對實際資料進行分析時,從統(tǒng)計分析角度看,常見錯誤是:對資料未作統(tǒng)計處理就下結(jié)論;多元(或多原因)資料用一元(或單原因)統(tǒng)計分析方法處理,造成資料利用率低,不能反應(yīng)資料整體情況,不能很好地揭示變量之間交互作用和內(nèi)在聯(lián)絡(luò)。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第44頁當暴露變量為一個分類變量時,為單原因設(shè)計,常見設(shè)計類型有單組設(shè)計、兩組成組設(shè)計和配對設(shè)計及多組完全隨機設(shè)計。若滿足參數(shù)檢驗條件,分別選取單樣本t檢驗、成組兩樣本t檢驗、配對t檢驗及單原因多水平方差分析(one-wayANOVA);若不滿足參數(shù)檢驗條件,分別選取ilcoxon秩和檢驗(或Mann-WhitneyU檢驗)、Wilcoxon符號秩和檢驗或Kruskal-WallisH檢驗。

常見錯誤在做檢驗前,不對結(jié)局變量分布和方差齊性進行檢驗,在不滿足參數(shù)檢驗前提條件下對定量資料盲目套用參數(shù)檢驗方法。

錯誤舉例某項研究評價治療前后膝關(guān)節(jié)功效(表1),從結(jié)果來看,部分指標標準差是均數(shù)2倍,提醒呈偏態(tài)分布,而原作者用單原因方差分析檢驗治療前后功效得分。正確做法是,選取非參數(shù)檢驗方法,這個研究是自身配對設(shè)計,可選取Wilcoxon符號秩和檢驗,或?qū)Y(jié)局變量進行變換,滿足參數(shù)檢驗要求。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第45頁用Pearson卡方檢驗分析有序結(jié)局變量數(shù)據(jù)?某項研究探討原發(fā)性肝癌肝動脈碘油化療栓塞(TACE)和三維適形放療(3DCRT)綜合治療價值(見表5)。原文將不一樣水平療效進行了合并,采取Pearson卡方檢驗比較兩組有效率分別為71%和45%,P值為0.0097,這么合并沒有充分利用資料有序信息;而若用2×C表卡方檢驗,P值為0.0827,沒有考慮療效遞減關(guān)系。所以,應(yīng)選取CMH卡方檢驗行平均得分差分析結(jié)果,P值為0.0160,(或用Ridit檢驗)才能做出正確評價。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第46頁重復(fù)測量數(shù)據(jù)用單原因分析:某研究探討重型顱腦創(chuàng)傷患者硫酸鎂治療與患者血清丙二醛(MDA)含量及預(yù)后關(guān)系。治療組和對照組患者分別在入院時、用藥后24、48和72小時抽取靜脈血,檢測MDA濃度(表3)。原文采取成組t檢驗在不一樣時間點進行兩組比較,割裂了整體設(shè)計,沒有考慮到對于同一觀察對象,不一樣時間點上數(shù)據(jù)是不獨立。該研究可選取重復(fù)測量設(shè)計方差分析。對于較復(fù)雜重復(fù)測量設(shè)計資料,可選擇混合模型(Mixedmodel)或廣義預(yù)計方程(GEE)等方法進行分析。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第47頁不能充分利用數(shù)據(jù)信息,缺乏深入分析(浙江預(yù)防醫(yī)學

年第24卷第4期)男童行為因子均數(shù)比較(x±s)女童行為因子均數(shù)比較(x±s)作者分別對男童和女童每項因子作了t檢驗,沒有很好利用數(shù)據(jù)中隱藏分布信息,另外,屢次重復(fù)t檢驗會增加I型錯誤概率。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第48頁對于這類數(shù)據(jù)能夠考慮采取輪廓分析(ProfileAnalysis)方法:1、平行檢驗2、相合檢驗3、水平檢驗醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第49頁筆誤?統(tǒng)計學知識缺乏?或雜志社審稿錯誤?醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第50頁

五、多變量分析與單變量分析

多變量分析是對m個反應(yīng)變量進行一次假設(shè)檢驗(HotellingT2檢驗或MANOVA),對組間差異作出推斷。在大多數(shù)情況下,多變量假設(shè)檢驗結(jié)論與對m個反應(yīng)變量進行m次單變量假設(shè)檢驗(t檢驗或ANOVA)結(jié)論是一致,即多變量假設(shè)檢驗拒絕H0,m次單變量假設(shè)檢驗最少有一次拒絕H0,SPSS、SAS等統(tǒng)計軟件也是先給出多變量假設(shè)檢驗結(jié)果,再給出單變量假設(shè)檢驗結(jié)果,作為多變量分析補充。醫(yī)學科研設(shè)計與統(tǒng)計學思維專家講座第51頁例:某婦幼保健院將孕婦隨機分兩組,一組接收孕期保健教育,另一組作為對照。表14-3是同一日出生13名順產(chǎn)嬰兒體重和身長,問孕期保健教育對嬰兒生長發(fā)育有沒有促進作用?

表中用兩個指標反應(yīng)嬰兒生長發(fā)育情況,經(jīng)過孕期保健教育組和對照組嬰兒樣本均數(shù)比較,推論兩組總體均數(shù)μ1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論