版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、計數資料與計量資料醫(yī)學統計資料按其性質一般分為計數資料與計量資料兩類。不同類型的統計資料應采用不同 的統計分析方法。計數資料是先將觀察單位按某種屬性或類別分成若干組,再清點各組觀察單位個數所得到的 資料。如臨床某些檢驗結果用陽性或陰性反應表示,對一批某病患者檢驗完畢后,清點呈陽 性或陰性反應的各有若干例。又如要調查某人群的血型分布,先按A、B、AB、O四型分組, 再清點各血型組人數。計數資料每個觀察單位之間沒有量的差別,但各組之間具有質的不同, 不同性質的觀察單位不能歸入一組。對這類資料通常是先計算百分比或率等相對數,需要時 做百分比或率之間的比較,也可做兩事物之間相關的相關分析。計量資料是用
2、儀器、工具或其它定量方法對每個觀察單位的某項標志進行測量,并把測量結 果用數值大小表示出來的資料,一般帶有度量衡或其它單位。如檢查一批應征青年體重,需 要磅秤測量,通常以公斤為單位,測得許多大小不一的體重值。其它如身長(cm)、血壓(mmHg)、 脈搏(次/分)、紅細胞(萬/mm3)轉氨酶(單位)等,都屬于計量資料。每個觀察單位的 觀測值之間有量的區(qū)別,但同一批觀察單位必須是同質的。對這類資料通常先計算平均數與 標準差等指標,需要時做各均數之間的比較或各變量之間的分析還有一些資料,也是將觀察單位按某種屬性或某個標志分組,然后清點各組觀察單位個數得 來的,但所分各組之間具有等級順序。這些資料既具
3、有計數資料的特點,又兼有半定量的性 質,稱為等級資料或半定量資料。例如對一批急性病毒性肝炎患者作麝香草酚絮狀試驗,將 試驗結果按-、+、+、+、+分組,顯然各組之間既有等級順序,又有程序與量的差別。 又如某病住院病人的治療結果,按治愈、好轉、無效、死亡分組,同樣各組之間具有順序與 程度之別。分析等級資料常用的統計指標有比和率,常用的統計方法有秩和檢驗、參照單位 分析等。在醫(yī)學實踐中,根據分析研究的目的,計數資料與計量資料可以互相轉化。例如血 壓值本是計量資料,但如果將一組20-40歲成年人的血壓值分為血壓正常與血壓異常兩組, 再清點各組人數,于是這組血壓資料就轉化成為計數資料了。假若將這組血壓
4、值按低血壓(130/90-110毫米汞柱)、重度高血壓(130/110毫米汞柱)的等級順序分組,清點各組人 數,這時這組血壓資料又轉化為等級資料了。又如在計量診斷中,將某些陽性體征根據確診 病人的概率賦予分數,分數的多少代表量的大小,這樣原來的計數資料就轉化為計量資料。由 于計量資料可以得到較多的信息,所以凡能計量的,盡量采用計量資料臨床科研統計方法與選擇臨床科研中數據的處理和統計方法是臨床研究得出結論的步驟之一。而描述臨床數據,應用正 確的統計方法是獲得正確的臨床科研結果的前提。本文從描述數據到統計方法的選擇介紹臨 床科研論文中常用的統計方法、基本概念。一、數據的種類數據種類:臨床上的數據通
5、常可簡單地分成計量資料、等級資料和分類資料(計數資料)三種類型。計 量資料指連續(xù)的數據,通常有具體的數值,如身高、體重、血壓、血紅蛋白、膽紅素和白蛋白等。 等級資料指有一定級別的數據,如臨床療效分為治愈、顯效、好轉、無效,臨床檢驗結果分為-、 +、+、+,疼痛等癥狀的嚴重程度分為0(無疼痛)、1(輕度)、2(中度)、3(重度)等,等級資料又 稱為半定量資料。分類資料指各數據之間沒有順序或等級關系,而是歸于一定屬性,可以是兩類, 也可以是多類。如性別資料,按男性和女性分類,計算男性與女性各有多少例;職業(yè)資料,按工人、 農民、職員等歸類計算各自的例數;隨訪結果資料,按生存或死亡歸類,計算各自的例數
6、;接受十 預措施資料,按用試驗藥物、用安慰劑歸類;是否存在吸煙、飲酒、幽門螺桿菌(Hp)感染等暴露 因素,按吸煙、不吸煙,飲酒、不飲酒,Hp(+)、Hp(-)歸類等。數據的類別轉換:計量資料可以根據需要或一定的標準分成兩個或數個等級而變成計數或等級資料。如年 齡資料是計量資料,但可以按大于65歲、4565歲、小于45歲分為老、中、青年3類而轉變 為等級資料或計數資料。但需要注意的是:計量資料轉換為等級資料或計數資料比較簡單, 但從等級資料或計數資料就無法再轉換成計量資料,因此,在臨床上收集數據或計算機儲存數 據時,應考慮收集或儲存計量資料,只有在數據處理時根據需要再轉換為等級資料或計數資料。
7、對兩組病人的某項指標進行統計學檢驗時,數據從計量轉換為計數或等級資料,統計的效率 也可能下降。二、數據的統計描述對于臨床研究數據,通常我們不可能在論文中或在報道時告訴讀者每一個病人的具體特 征。我們需要知道這批數據的特征,一方面便于描述,另一方面便于兩組數據或特征的差異比較, 這就是統計描述。計量資料(數據)的統計描述:計量資料的特征通常包括中心位置與離散程度。中心位置通 常用均數來描述,如一組病人的年齡、體重、血紅蛋白、白蛋白、膽紅素、肌酎和尿素氮等, 要求是這類數據應該服從正態(tài)分布;如果數據經對數轉換后呈正態(tài)分布,則可以用幾何均數表 示其中心位置,如HBsAg滴度(1 : 8,1 : 16
8、,1 : 32,1 : 64);對于偏態(tài)數據,通常用中位數表示其中 心位置,加研究急性肝炎時ALT、AST等范圍從數十到上千變動較大,且每個病人的變化情況不 一致。正態(tài)分布的數據離散程度可用標準差來描述;對于偏態(tài)數據,可以用4分位范圍(inter quartie range, IQR)描述離散程度,即:IQR為第25百分位數(P25)第75百分位數(P75)。計數資料(數據)的統計描述:計數資料在分類時可以計算各類別在總數中的比重或百分 比,稱為構成比,如性別資料,100例病人中,60例男性,40例女性,可表示為男性占60%,女性占 40%;如果數據分為發(fā)生或不發(fā)生,如死亡、患病等,則可計算其
9、死亡率、發(fā)病率等指標,表示其 發(fā)生的強度,稱率。構成比一般不能說明發(fā)生強度。臨床上有很多率實際上只是個比例(構成比)。 如患病率是一個比例,由于歷史原因,仍稱為患病率。所以不能將構成比混為發(fā)病率來說明發(fā)生 強度。當兩個率進行比較時,如果某一指標足以對率的大小有影響(如年齡對死亡率),而該指標 的組成(如年齡構成)在兩組內不同,則需要對該指標進行標準化。統計描述:根據數據可以用構成比或率來計算。如臨床療效可表示為治愈率、好轉率等。 腹痛根據程度分為無、輕、中、重,可計算各程度的構成比。即用各種程度病人數除以總病例 數,各構成比之和應為100%。4.比數、優(yōu)勢比、相對危險度:在病因學研究中,是暴露
10、因素與疾 病之間的聯系強度的指標。比數是陽性率與陰性率之比。相對危險度(RR)是兩種暴露條件下 發(fā)病率之比,如研究Hp感染與胃癌的關系,采用前瞻性隊列研究,按Hp (+)與Hp(-)分為2組觀 察若十年后胃癌的發(fā)生率,計算兩組的發(fā)病率之比即估計相對危險度。優(yōu)勢比(OR)是在病例對 照研究中表示暴露與疾病發(fā)生之間的相關程度,是RR的近似值,如同樣研究,采用病例對照設計, 按胃癌與非胃癌分為兩組,調查兩組病人發(fā)病前Hp感染情況,評價Hp感染與胃癌之間的關系 需用優(yōu)勢比。三、定量數據的統計學檢驗臨床研究中要進行兩個樣本或多個樣本間差異的統計學檢驗,以判定差異是真實存在或 者由于抽樣誤差引起。t檢驗與
11、方差分析:對于分組呈正態(tài)分布的定量資料,如為兩組比較,可用t檢驗。t檢驗 有2種方法,取決于資料是成組比較還是配對比較。臨床科研中對每一病人治療前后的比較: 如應用利膽藥物后膽紅素水平前后的比較;應用保肝藥物后白蛋白水平的前后比較等多屬于 配對比較。臨床上許多研究無法配對,如新藥與對照藥物的比較,通常都是治療組與對照組進行 成組比較。在選用t檢驗時,這兩種t檢驗的方法是不同的。對兩組以上(多組)資料比較,則選用方差分析;方差分析也有二種方法,取決于研究設計。如研究 血液放置時間對血糖測定值的影響,對8名健康人抽血后將每一個體的血液分為4份,分別放置 0、45、90、135min后測定血糖濃度,
12、這種設計每4份血糖測定值均來自同一個體,稱為隨機 區(qū)組隨機,需要用隨機區(qū)組分差分析。同樣,如果我們的目的是比較三種不同降血糖藥物的治療 效果,采用隨機化方法將病人分為三組,每種藥物應用于一組病人,三組病人最終的血糖比較則 用完全隨機設計方差分析。需要注意的是,各組樣本含量相等與不相等時,由于組間離均差平方 和計算方法略有差別,所選用方差分析計算公式也不一樣。需要指出的是,配對或配伍組設計比成組或完全隨機設計的優(yōu)點是對某一因素進行控制,如上 述4份血糖結果,除了放置的時間外,其余因素都一樣(來自同一人),從而減少了偏倚誤差,提高 統計效率。在進行方差分析時,如對A、B、C三種藥物的療效進行比較時
13、,無效假設為三組療效相同, 即HO:A=B = C,差異有統計意義而推翻此無效假設時,其備選假設H1為三種藥物的療效全不 相同或不全相同,這時并不能區(qū)分是哪兩種藥物療效相同,哪兩種不同。一種自然的想法是不做 方差分析而直接做三個t檢驗,即檢驗A=B、A = C、B = C,由此直接得出結論。從統計學角 度看,這是不正確的,因為它增加了第一類錯誤,即假陽性錯誤的概率。這時統計上有意義的臨 界值概率a,已超過a =0.05的標準,因而是不可取的。比較合理的方法是在方差分析后作多重比較(兩兩比較)。多重比較的方法很多,常用的有SNK SNK(Student New man Keuls)法、Dunca
14、n 法、LSD 法以及 Dunnett 法等。應用 t 檢驗和方差 分析的前提是:小樣本時,無論t檢驗或方差分析,對數據的要求均應是正態(tài)分布,資料正態(tài)性 問題可以用頻數圖考察或正態(tài)檢驗;成組t檢驗和方差分析要求各組的樣本方差間差異無 顯著性(方差齊性)。兩組方差齊性檢驗可以用F檢驗;多組方差齊性檢驗可以用Bettlett檢驗。數據轉換:如果數據屬于某種特殊分布或數據具有一定特征,經過一定轉換后可轉換成 正態(tài)或方差齊性,則分析效果更好。如水中細菌數、單位時間放射性計數等符合普松分布,數據 可通過平方根轉換;非傳染病患病率、白細胞百分數、淋巴細胞轉換率、鋇條胃排空檢查的殘 留率等符合二項分布,數據
15、可通過平方根反正弦函數轉換;滴度資料等可通過對數轉換。非參數統計:非參數統計也針對兩組或多組計量資料的比較,當t檢驗或方差分析的前 提條件不能滿足而對數據的總體分布不能確定或沒有適當的轉換方法時,可以用非參數統計 方法。相應于參數檢驗、配對比較的設計,非參數統計采用符號等級檢驗(Wilcoxon法);兩組比 較采用兩樣本等級和檢驗(Wilcoxon Man and Whitne ranksum法)或中位數檢驗;配伍組設計比較采用M檢驗(Friedman法);多組比較采用H檢驗(Kruskal and Wallis)表1計量資料比較時參數與非參數統計方法選擇 設計方法參數統計*非參數統計*配對比
16、較 配對t檢驗 符合檢驗,符號等級檢驗(Wilcoxon)兩組比較 成組比較t檢驗 兩樣本等級和檢驗(Wilcoxon Mann and Whitney), 中位數檢驗配伍組比較隨機區(qū)組方差分析M檢驗(Friedman法)多組比較完全隨機設計方差分析H檢驗(Kruskal and Wallis)設計方法參數統計*非參數統計*配對比較 配對t檢驗 符合檢驗,符號等級檢驗(Wilcoxon)兩組比較 成組比較t檢驗 兩樣本等級和檢驗(Wilcoxon Mann and Whitney), 中位數檢驗配伍組比較隨機區(qū)組方差分析M檢驗(Friedman法)多組比較完全隨機設計方差分析H檢驗(Krusk
17、al and Wallis)*應用條件是數據正態(tài)分布,方差齊性,*應用范圍主要為偏態(tài)資料且數據無法轉換為正 態(tài),等級資料分組比較等級資料分組比較也應用非參數檢驗,多組比較時采用H檢驗,兩組比較時采用等級和檢 驗(Wilcoxon Mann and Whitney檢驗)或中位數檢驗。如比較兩種胃動力藥物治療功能性消化不 良的療效,療效評價按顯效、有效、好轉、無效分為4等級,兩組比較可采用等級和檢驗。四、卡方檢驗研究兩組或幾組資料的性質是定性或分類的,通常用率或構成比描述各組的特征。比較組 間率或構成情況間的差異是否有統計學意義可以用卡方檢驗。四格表資料的卡方檢驗:當比較兩組定性或計數資料且資料的
18、屬性只有兩種時,通常采 用卡方檢驗,如研究Hp感染與胃癌關系時,胃癌病例組100例,Hp感染80例(感染比例80.0%), 慢性胃炎對照組100 例,Hp感染60例(感染比例60%),是否胃癌病例組Hp感染率高于慢性胃 炎組,即Hp感染與胃癌有關是否真實存在而不是由于抽樣誤差引起,統計學檢驗時即可采用 四格表卡方檢驗。一般計算Pearson卡方,僅表示兩組構成比不同,有一般聯系。四格表中如果 數據較少,理論值(根據無效假設計算得到的各格應有的數值)5,特別是總觀察數40時,或有理 論數1時,需要用精確(Fisher )檢驗法。行列表卡方檢驗:當比較組超過2組或者資料的屬性超過2種時,這類表格稱
19、行列表。通 常仍計算Pearson卡方,表示一般聯系的檢驗,即行變量與列變量都是計數或定性資料,變量的 各水平之間都沒有等級關系,檢驗的結果僅表示兩變量之間是否存在聯系。如果行變量為名義 變量(定性)而列變量為等級變量時,可以采用非參數檢驗、趨勢卡方或用行平均得分差進行檢 驗。單純Pearson卡方檢驗往往不能說明問題。對組內分組資料的卡方檢驗或內部構成不同 的兩個率差異的統計意義檢驗,可采用加權卡方檢驗或M H卡方檢驗。而如果需要分層的因 素很多或者影響結果的因素很多,而分層太多樣本量又無法滿足時,回歸分析常是首先考慮的 選擇。對生存率資料的比較:常采用壽命表法描述,除了可計算年生存率并進行
20、卡方檢驗外,還 可直接對生存曲線進行比較,通常采用Log Rank檢驗。五、臨床科研中統計方法應用的常見錯誤應用正確的統計方法可增加研究結果的可信度,而錯誤的統計方法常導致不正確的研究 結論。臨床科研中常見的統計方法錯誤包括:構成比的誤用:由于醫(yī)院資料的局限性,臨床所獲得的數據一般只能計算構成比而不是 發(fā)病率。構成比通常不能說明事物發(fā)生的強度,而且構成比的大小受到很多其他因素的影響, 因此比較構成比的大小或應用構成比說明問題時不能濫用。只有縱向隨訪研究才能得到發(fā)病 率的資料。內部構成對統計指標的影響:臨床研究中,比較兩組藥物的療效或說明兩組病人的預后 時,常需要注意其他因素對結果的影響。標化或
21、對可能影響結果的因素進行分層是解決這一問 題的最好辦法,如果影響因素很多,可能需要多因素分析來平衡各種因素的影響。而無視其他因 素的影響可能得出錯誤的結果。偏態(tài)定量數據統計描述和檢驗方法的誤用:偏態(tài)定量數據的中心位置應當用中位數來描 述(對數正態(tài)分布采用幾何均數描述),但目前很多研究報道的資料仍只用均數描述。由于均數 和標準差唯一刻劃了正態(tài)分布資料的特征,對于正態(tài)分布資料只需表示均數土標準差,但是均 數土標準差不是偏態(tài)分布資料的特征,通常應該用中位數(25%百分位數75%百分位數)刻劃 資料的中心位置和分布概況。對明顯偏態(tài)資料的組間比較,t檢驗或方差分析也是不正確的, 應選擇非參數檢驗。配對(
22、配伍)比較和成組比較:配對t檢驗與兩組比較的t檢驗選用要根據不同研究設計, 完全隨機設計和配伍組設計也要根據不同研究設計選用,配對研究設計和配伍組設計的資料 屬于非獨立數據,只能采用相應的配對t檢驗或配伍組方差分析,成組設計或完全隨機設計的 資料不能(也無法)用配對t檢驗或配伍組方差分析方法進行檢驗。一攬子比較的錯誤:對于多組或配伍組比較應當先做方差分析或非參數統計分析,然后 再用相應的多重比較,而不應直接做所有兩兩比較的t檢驗或非參數檢驗,否則第一類錯誤會 增大。臨床研究和雜志上仍然??梢姷竭@一錯誤。統計方法應用的條件不符合:各種統計方法應用有一定的條件,如t檢驗和方差分析要 求數據為正態(tài)(
23、或近似正態(tài))分布和方差齊性,很多研究數據呈明顯偏態(tài)仍然采用t檢驗或方差 分析是不正確的。對于非負值資料,如果標準差遠大于均數,這樣的資料常是偏態(tài)分布的。方差 是否齊性對統計結果影響很大,要特別注意。再如回歸分析的方法選擇,不能不管因變量是什么 性質而亂用回歸方法,因變量為定量數據可以用線性回歸(或數據經轉換后應用),因變量為分類 數據可以用Logistic回歸,而生存時間因變量可以用Cox回歸。亂用不適當的回歸分析方法會 得出無法解釋的結果。論文中應注明哪些與統計有關的結果:統計所用的方法、比較的樣本量、統計量如卡方 值、P值等。最后需要指出的是,研究結果的準確性與研究設計有關,統計方法的選擇
24、也與收集 資料的方法有關,因此,統計方法應當在研究設計階段作出正確的選擇,而不是等到數據收集好 之后再來考慮。否則,研究結果的可信度就受到懷疑,而單純依賴統計學方法對研究設計沒有考 慮的選擇性偏倚和測量性偏倚是無法補救的。參數檢驗與非參數檢驗的優(yōu)缺點1)參數檢驗:優(yōu)點是符合條件時,檢驗效率高;其缺點是對資料要求嚴格,如等級數據、非 確定數據(50mg )不能使用參數檢驗,而且要求資料的分布型已知和總體方差相等。2)非參數檢驗:優(yōu)點是應用范圍廣、簡便、易掌握;缺點是若對符合參數檢驗條件的資料用 非參數檢驗,則檢驗效率低于參數檢驗。如無效假設是正確的,非參數法與參數法一樣好, 但如果無效假設是錯誤的,則非參數檢驗效果較差,如需檢驗出同樣大小的差異的差異往往 需要較多的資料。另一點是非參數檢驗統計量是近似服從某一部分,檢驗的界值表也是有近 似的(如配對秩和檢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- CCAA - 2016年06月環(huán)境管理體系基礎答案及解析 - 詳解版(100題)
- 【寒假專項】人教版六年級數學上冊應用題專項訓練(含答案)
- 養(yǎng)老院健康講座制度
- 仁愛科普版(2024)八年級上冊英語Unit1~Unit6單元話題作文練習題(含答案+范文)
- 促進智能助手創(chuàng)新發(fā)展的政策建議
- 2025年龍門農商銀行招聘筆試真題
- 玻璃退火工創(chuàng)新應用考核試卷含答案
- 純堿生產工安全操作強化考核試卷含答案
- 我國上市公司治理因素與信用風險的關聯性研究:基于面板數據的實證剖析
- 我國上市公司并購類型與績效關聯的實證剖析:基于多維度視角
- 2024-2025學年度高一英語下學期期中試卷(北師大版含答案)
- 銀行從業(yè)者觀《榜樣》心得體會
- 農村年底活動方案
- 2024屆山東省威海市高三二模數學試題(解析版)
- 設備管理獎罰管理制度
- LINE6效果器HD300中文說明書
- 2025年航運行業(yè)安全生產費用提取和使用計劃
- 納米纖維凝膠隔熱材料的應用研究進展
- 蟹苗買賣合同協議
- 2025年社區(qū)養(yǎng)老服務補貼政策及申領方法
- 胸外科手術圍手術期的護理
評論
0/150
提交評論