SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第1頁(yè)
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第2頁(yè)
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第3頁(yè)
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第4頁(yè)
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇目錄數(shù)據(jù)分析的統(tǒng)計(jì)方法選擇小結(jié)錯(cuò)誤!未定義書簽。目錄1資料12完全隨機(jī)分組設(shè)計(jì)的資料2配對(duì)設(shè)計(jì)或隨機(jī)區(qū)組設(shè)計(jì)3變量之間的關(guān)聯(lián)性分析4資料251、連續(xù)性資料51、1兩組獨(dú)立樣本比較51、2兩組配對(duì)樣本的比較51、3多組完全隨機(jī)樣本比較51、4多組隨機(jī)區(qū)組樣本比較62.分類資料62、1四格表資料62、22X表或RX2表資料的統(tǒng)計(jì)分析62、3RX表資料的統(tǒng)計(jì)分析72、4配對(duì)分類資料的統(tǒng)計(jì)分析7資料38一、兩個(gè)變量之間的關(guān)聯(lián)性分析8二、回歸分析8資料491 .統(tǒng)計(jì)方法抉擇的條件91 .分析目的92 .資料類型103 .設(shè)計(jì)方法114 .分布特征及數(shù)理統(tǒng)計(jì)條件112 .

2、數(shù)據(jù)資料的描述121 .數(shù)值變量資料的描述122 .分類變量資料的描述133 .數(shù)據(jù)資料的比較131 .假設(shè)檢驗(yàn)的基本步驟142 .假設(shè)檢驗(yàn)結(jié)論的兩類錯(cuò)誤143 .假設(shè)檢驗(yàn)的注意事項(xiàng)154 .常用假設(shè)檢驗(yàn)方法154 .變量間的相關(guān)分析171 .數(shù)值變量(計(jì)量資料)的關(guān)系分析172 .無(wú)序分類變量(計(jì)數(shù)資料)的相關(guān)分析173 .有序分類變量(等級(jí)資料)等級(jí)相關(guān)18資料1完全隨機(jī)分組設(shè)計(jì)的資料一、兩組或多組計(jì)量資料的比較1 .兩組資料:1)大樣本資料或服從正態(tài)分布的小樣本資料(1)若方差齊性,則作成組t檢驗(yàn)(2)若方差不齊,則作t檢驗(yàn)或用成組的Wilcoxon秩與檢驗(yàn)2)小樣本偏態(tài)分布資料,則用成

3、組的Wilcoxon秩與檢驗(yàn)2 .多組資料:1)若大樣本資料或服從正態(tài)分布,并且方差齊性,則作完全隨機(jī)的方差分析。如果方差分析的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:LSD檢驗(yàn),Bonferroni檢驗(yàn)等)進(jìn)行兩兩比較。2)如果小樣本的偏態(tài)分布資料或方差不齊,則作KruskalWallis的統(tǒng)計(jì)檢驗(yàn)。如果KruskalWallis的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:用成組的Wilcoxon秩與檢驗(yàn),但用Bonferroni方法校正P值等)進(jìn)行兩兩比較。二、分類資料的統(tǒng)計(jì)分析1 .單樣本資料與總體比較1)二分類資料:(1)小樣本時(shí):用二項(xiàng)分

4、布進(jìn)行確切概率法檢驗(yàn);(2)大樣本時(shí):用U檢驗(yàn)。2)多分類資料:用Pearson2檢驗(yàn)(又稱擬合優(yōu)度檢驗(yàn))。2 .四格表資料1)n40并且所以理論數(shù)大于5,則用Pearson22)n40并且所以理論數(shù)大于1并且至少存在一個(gè)理論數(shù)5,則用校正2或用Fishers確切概率法檢驗(yàn)3)n40或存在理論數(shù)40并且理論數(shù)小于5的格子數(shù)行列表中格子總數(shù)的25%,則用Pearson2(2)n40或理論數(shù)小于5的格子數(shù)行列表中格子總數(shù)的25%,則用Fishers確切概率法檢驗(yàn)4 .RXC表資料的統(tǒng)計(jì)分析1) 列變量為效應(yīng)指標(biāo),并且為有序多分類變量,行變量為分組變量,則CMH2或KruskalWallis的秩與檢

5、驗(yàn)2) 列變量為效應(yīng)指標(biāo),并且為無(wú)序多分類變量,行變量為有序多分類變量,作nonezerocorrelationanalysis的CMH23) 列變量與行變量均為有序多分類變量,可以作Spearman相關(guān)分析4) 列變量與行變量均為無(wú)序多分類變量,(1)n40并且理論數(shù)小于5的格子數(shù)行列表中格子總數(shù)的25%,則用Fishers確切概率法檢驗(yàn)3、 Poisson分布資料1 .單樣本資料與總體比較:1)觀察值較小時(shí):用確切概率法進(jìn)行檢驗(yàn)。2) 觀察值較大時(shí):用正態(tài)近似的U檢驗(yàn)。2 .兩個(gè)樣本比較:用正態(tài)近似的U檢驗(yàn)。配對(duì)設(shè)計(jì)或隨機(jī)區(qū)組設(shè)計(jì)4、 兩組或多組計(jì)量資料的比較1. 兩組資料:1)大樣本資料

6、或配對(duì)差值服從正態(tài)分布的小樣本資料,作配對(duì)t檢驗(yàn)2) 小樣本并且差值呈偏態(tài)分布資料,則用Wilcoxon的符號(hào)配對(duì)秩檢驗(yàn)2. 多組資料:1)若大樣本資料或殘差服從正態(tài)分布,并且方差齊性,則作隨機(jī)區(qū)組的方差分析。如果方差分析的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:LSD檢驗(yàn),Bonferroni檢驗(yàn)等)進(jìn)行兩兩比較。2) 如果小樣本時(shí),差值呈偏態(tài)分布資料或方差不齊,則作Fredman的統(tǒng)計(jì)檢驗(yàn)。如果Fredman的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:用Wilcoxon的符號(hào)配對(duì)秩檢驗(yàn),但用Bonferroni方法校正P值等)進(jìn)行兩兩比較。5、

7、 分類資料的統(tǒng)計(jì)分析1 .四格表資料1)b+c40,則用McNemarf已對(duì)2檢驗(yàn)或配又找!際2檢驗(yàn)2)b+c40,則用二項(xiàng)分布確切概率法檢驗(yàn)2 .CXC表資料:1)配對(duì)比較:用McNemarf已對(duì)2檢驗(yàn)或配又找!際2檢驗(yàn)2) 一致性問(wèn)題(Agreement):用Kap檢驗(yàn)變量之間的關(guān)聯(lián)性分析6、 兩個(gè)變量之間的關(guān)聯(lián)性分析1. 兩個(gè)變量均為連續(xù)型變量1)小樣本并且兩個(gè)變量服從雙正態(tài)分布,則用Pearson相關(guān)系數(shù)做統(tǒng)計(jì)分析2)大樣本或兩個(gè)變量不服從雙正態(tài)分布,則用Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析2. 兩個(gè)變量均為有序分類變量,可以用Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析3. 一個(gè)變量為有序分

8、類變量,另一個(gè)變量為連續(xù)型變量,可以用Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析7、 回歸分析1 .直線回歸:如果回歸分析中的殘差服從正態(tài)分布(大樣本時(shí)無(wú)需正態(tài)性),殘差與自變量無(wú)趨勢(shì)變化,則直線回歸(單個(gè)自變量的線性回歸,稱為簡(jiǎn)單回歸),否則應(yīng)作適當(dāng)?shù)淖儞Q,使其滿足上述條件。2 .多重線性回歸:應(yīng)變量(Y)為連續(xù)型變量(即計(jì)量資料),自變量(Xi,X2,,Xp)可以為連續(xù)型變量、有序分類變量或二分類變量。如果回歸分析中的殘差服從正態(tài)分布(大樣本時(shí)無(wú)需正態(tài)性),殘差與自變量無(wú)趨勢(shì)變化,可以作多重線性回歸。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2 )實(shí)驗(yàn)性研究:在保持主要研究因素變

9、量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用3 .二分類的Logistic回歸:應(yīng)變量為二分類變量,自變量(Xi,X2,Xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1)非配對(duì)的情況:用非條件Logistic回歸(1) 觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素(2) 實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用2) 配對(duì)的情況:用條件Logistic回歸(1) 觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素(2) 實(shí)驗(yàn)性研究:在保持主要研

10、究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用4.有序多分類有序的Logistic回歸:應(yīng)變量為有序多分類變量,自變量(Xi,X2,,Xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用5.無(wú)序多分類有序的Logistic回歸:應(yīng)變量為無(wú)序多分類變量,自變量(Xi,X2,Xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1)觀察性研究:可以用逐步線性回歸尋

11、找(擬)主要的影響因素2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用八、生存分析資料:(要求資料記錄結(jié)局與結(jié)局發(fā)生的時(shí)間,如:死亡與死亡發(fā)生的時(shí)間)1 .用Kaplan-Meier方法估計(jì)生存曲線2 .大樣本時(shí),可以壽命表方法估計(jì)3 .單因素可以用Logrank比較兩條或多條生存曲線4 .多個(gè)因素時(shí),可以作多重的Cox回歸1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用資料

12、21、連續(xù)性資料1、1兩組獨(dú)立樣本比較1、1、1資料符合正態(tài)分布,且兩組方差齊性,直接采用t檢驗(yàn)。1、1、2資料不符合正態(tài)分布(1)可進(jìn)行數(shù)據(jù)轉(zhuǎn)換,如對(duì)數(shù)轉(zhuǎn)換等,使之服從正態(tài)分布,然后對(duì)轉(zhuǎn)換后的數(shù)據(jù)采用t檢驗(yàn);(2)采用非參數(shù)檢驗(yàn),如Wilcoxon檢驗(yàn)。1、1、3資料方差不齊(1)采用Satterthwate的t檢驗(yàn);(2)采用非參數(shù)檢驗(yàn),如Wilcoxon檢驗(yàn)。1、2兩組配對(duì)樣本的比較1、2、1兩組差值服從正態(tài)分布,采用配對(duì)t檢驗(yàn)。1、2、2兩組差值不服從正態(tài)分布,采用wilcoxon的符號(hào)配對(duì)秩與檢驗(yàn)。1、3多組完全隨機(jī)樣本比較1、3、1資料符合正態(tài)分布,且各組方差齊性,直接采用完全隨機(jī)

13、的方差分析。如果檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較的方法有LSD檢驗(yàn),Bonferroni法,tukey法,Scheffe法,SNK法等。1、3、2資料不符合正態(tài)分布,或各組方差不齊,則采用非參數(shù)檢驗(yàn)的KruscalWallis法。如果檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,一般采用Bonferroni法校正P值,然后用成組的Wilcoxon檢驗(yàn)。1、4多組隨機(jī)區(qū)組樣本比較1、4、1資料符合正態(tài)分布,且各組方差齊性,直接采用隨機(jī)區(qū)組的方差分析。如果檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較的方法有LSD檢驗(yàn),Bonferroni法,tukey法,Scheffe法

14、,SNK法等。1、 4、2資料不符合正態(tài)分布,或各組方差不齊,則采用非參數(shù)檢驗(yàn)的Fridman檢驗(yàn)法。如果檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,一般采用Bonferroni法校正P彳1,然后用符號(hào)配對(duì)的Wilcoxon檢驗(yàn)。需要注意的問(wèn)題:(1) 一般來(lái)說(shuō),如果就是大樣本,比如各組例數(shù)大于50,可以不作正態(tài)性檢驗(yàn),直接采用t檢驗(yàn)或方差分析。因?yàn)榻y(tǒng)計(jì)學(xué)上有中心極限定理,假定大樣本就是服從正態(tài)分布的。(2) 當(dāng)進(jìn)行多組比較時(shí),最容易犯的錯(cuò)誤就是僅比較其中的兩組,而不顧其她組,這樣作容易增大犯假陽(yáng)性錯(cuò)誤的概率。正確的做法應(yīng)該就是,先作總的各組間的比較,如果總的來(lái)說(shuō)差別有統(tǒng)計(jì)學(xué)意義,然后才能作其

15、中任意兩組的比較,這些兩兩比較有特定的統(tǒng)計(jì)方法,如上面提到的LSD檢3處,Bonferroni法,tukey法,Scheffe法,SNK法等。絕不能對(duì)其中的兩組直接采用t檢驗(yàn),這樣即使得出結(jié)果也未必正確。(3) 關(guān)于常用的設(shè)計(jì)方法:多組資料盡管最終分析都就是采用方差分析,但不同設(shè)計(jì)會(huì)有差別。常用的設(shè)計(jì)如完全隨即設(shè)計(jì),隨機(jī)區(qū)組設(shè)計(jì),析因設(shè)計(jì),裂區(qū)設(shè)計(jì),嵌套設(shè)計(jì)等。2.分類資料2、 1四格表資料2、 1、1例數(shù)大于40,且所有理論數(shù)大于5,則用普通的Pearson檢驗(yàn)。2、 1、2例數(shù)大于40,所有理論數(shù)大于1,且至少一個(gè)理論數(shù)小于5,則用校正的檢驗(yàn)或Fishers確切概率法檢驗(yàn)。2、 1、3例數(shù)

16、小于40,或有理論數(shù)小于2,則用Fishers確切概率法檢驗(yàn)。2、22XC表或RX2表資料的統(tǒng)計(jì)分析,則3、 2、1列變量行變量均為無(wú)序分類變量(1)例數(shù)大于40,且理論數(shù)小于5的格子數(shù)目總格子數(shù)目的25,則用普通的Pearson檢驗(yàn)。(2)例數(shù)小于40,或理論數(shù)小于5的格子數(shù)目總格子數(shù)目的25,則用Fishers確切概率法檢驗(yàn)。2、2、2列變量為效應(yīng)指標(biāo),且為有序多分類變量,行變量為分組變量,用普通的Pearson檢驗(yàn)只說(shuō)明組間構(gòu)成比不同,如要說(shuō)明療效,則可用行平均分差檢驗(yàn)或成組的Wilcoxon秩與檢驗(yàn)。2、2、3列變量為效應(yīng)指標(biāo),且為二分類變量,行變量為有序多分類變量,則可采用普通的Pe

17、arson檢驗(yàn)比較各組之間有無(wú)差別,如果總的來(lái)說(shuō)有差別,還可進(jìn)一步作兩兩比較,以說(shuō)明就是否任意兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。2、3RXC表資料的統(tǒng)計(jì)分析2、 3、1列變量行變量均為無(wú)序分類變量,則(1) 例數(shù)大于40,且理論數(shù)小于5的格子數(shù)目總格子數(shù)目的25,則用普通的Pearson檢驗(yàn)。(2) 例數(shù)小于40,或理論數(shù)小于5的格子數(shù)目總格子數(shù)目的25,則用Fishers確切概率法檢驗(yàn)。(3) 如果要作相關(guān)性分析,可采用Pearson相關(guān)系數(shù)。2、3、2列變量為效應(yīng)指標(biāo),且為有序多分類變量,行變量為分組變量,用普通的Pearson檢驗(yàn)只說(shuō)明組間構(gòu)成比不同,如要說(shuō)明療效或強(qiáng)弱程度的不同,則可用行平

18、均分差檢驗(yàn)或成組的Wilcoxon秩與檢驗(yàn)或Ridit分析。2、3、3列變量為效應(yīng)指標(biāo),且為無(wú)序多分類變量,行變量為有序多分類變量,則可采用普通的Pearson檢驗(yàn)比較各組之間有無(wú)差別,如果有差別,還可進(jìn)一步作兩兩比較,以說(shuō)明就是否任意兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。2、3、4列變量行變量均為有序多分類變量(1) 如要做組間差別分析,則可用行平均分差檢驗(yàn)或成組的Wilcoxon秩與檢驗(yàn)或Ridit分析。如果總的來(lái)說(shuō)有差別,還可進(jìn)一步作兩兩比較,以說(shuō)明就是否任意兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。(2) 如果要做兩變量之間的相關(guān)性,可采用Spearson相關(guān)分析。2、4配對(duì)分類資料的統(tǒng)計(jì)分析2、 4、1

19、四格表配對(duì)資料(1)b+c40,貝U用McNemar配對(duì)檢驗(yàn)。(2)bc40,則用校正的配對(duì)檢驗(yàn)。2、4、1CxC資料配對(duì)比較:用McNema而對(duì)檢驗(yàn)。(2)一致性檢驗(yàn),用Kappa檢驗(yàn)。資料3在研究設(shè)計(jì)時(shí),統(tǒng)計(jì)方法的選擇需考慮以下6個(gè)方面的問(wèn)題:(1)瞧反應(yīng)變量就是單變量、雙變量還就是多變量;(2)瞧單變量資料屬于3種資料類型(計(jì)量、計(jì)數(shù)及等級(jí)資料)中的哪一種;(3)瞧影響因素就是單因素還就是多因素;(4)瞧單樣本、兩樣本或多樣本;(5)瞧就是否就是配對(duì)或配伍設(shè)計(jì);(6)瞧就是否滿足檢驗(yàn)方法所需的前提條件,必要時(shí)可進(jìn)行變量變換,應(yīng)用參數(shù)方法進(jìn)行假設(shè)檢驗(yàn)往往要求數(shù)據(jù)滿足某些前提條件,如兩個(gè)獨(dú)立

20、樣本比較t檢驗(yàn)或多個(gè)獨(dú)立樣本比較的方差分析,均要求方差齊性,因此需要做方差齊性檢驗(yàn)。如果要用正態(tài)分布法估計(jì)參考值范圍,首先要檢驗(yàn)資料就是否服從正態(tài)分布。在建立各種多重回歸方程時(shí),常需檢驗(yàn)變量間的多重共線性與殘差分布的正態(tài)性。表1-1連續(xù)因變量分類因變量連續(xù)自變量回歸分析Logistic回歸分類自變量方差分析(ANOVA)表格檢驗(yàn)(比如卡方檢驗(yàn))不同的統(tǒng)計(jì)分析方法都有其各自的應(yīng)用條件與適用范圍。實(shí)際應(yīng)用時(shí),必須根據(jù)研究目的、資料的性質(zhì)以及所要分析的具體內(nèi)容等選擇適當(dāng)?shù)慕y(tǒng)計(jì)分析方法,切忌只關(guān)心p值的大?。ň褪欠?、05),而忽略統(tǒng)計(jì)分析方法的應(yīng)用條件與適用范圍。、兩個(gè)變量之間的關(guān)聯(lián)性分析1、兩個(gè)變

21、量均為連續(xù)型變量1)小樣本并且兩個(gè)變量服從雙正態(tài)分布,則用Pearson相關(guān)系數(shù)做統(tǒng)計(jì)分析2)大樣本或兩個(gè)變量不服從雙正態(tài)分布,則用Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析2、兩個(gè)變量均為有序分類變量,可以用Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析3、一個(gè)變量為有序分類變量,另一個(gè)變量為連續(xù)型變量,可以用Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析二、回歸分析1、直線回歸:如果回歸分析中的殘差服從正態(tài)分布(大樣本時(shí)無(wú)需正態(tài)性),殘差與自變量無(wú)趨勢(shì)變化,則直線回歸(單個(gè)自變量的線性回歸,稱為簡(jiǎn)單回歸,否則應(yīng)作適當(dāng)?shù)淖儞Q,使其滿足上述條件。2、多重線性回歸:應(yīng)變量(Y)為連續(xù)型變量(即計(jì)量資料),自變量(X1,X

22、2,,Xp)可以為連續(xù)型變量、有序分類變量或二分類變量。如果回歸分析中的殘差服從正態(tài)分布(大樣本時(shí)無(wú)需正態(tài)性),殘差與自變量無(wú)趨勢(shì)變化,可以作多重線性回歸。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用3、二分類的Logistic回歸:應(yīng)變量為二分類變量,自變量(X1,X2,,Xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1)非配對(duì)的情況:用非條件Logistic回歸(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素(2)實(shí)驗(yàn)性研究:在保持

23、主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用2)配對(duì)的情況:用條件Logistic回歸(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素(2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用4、有序多分類有序的Logistic回歸:應(yīng)變量為有序多分類變量,自變量(X1,X2,,Xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)

24、地引入一些其它可能的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用5、無(wú)序多分類有序的Logistic回歸:應(yīng)變量為無(wú)序多分類變量,自變量(X1,X2,,Xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用。資料4一.統(tǒng)計(jì)方法抉擇的條件在臨床科研工作中,正確地抉擇統(tǒng)計(jì)分析方法,應(yīng)充分考慮科研工作者的分析目的、臨床科研設(shè)計(jì)方法、搜集到的數(shù)據(jù)資料類型、數(shù)據(jù)資料的分布特征與所涉及的數(shù)理統(tǒng)計(jì)條件等。其中任何一個(gè)問(wèn)題沒(méi)

25、考慮到或考慮有誤,都有可能導(dǎo)致統(tǒng)計(jì)分析方法的抉擇失誤。此外,統(tǒng)計(jì)分析方法的抉擇應(yīng)在科研的設(shè)計(jì)階段來(lái)完成,而不應(yīng)該在臨床試驗(yàn)結(jié)束或在數(shù)據(jù)的收集工作已完成之后。對(duì)臨床科研數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析與進(jìn)行統(tǒng)計(jì)方法抉擇時(shí),應(yīng)考慮下列因素:1 .分析目的對(duì)于臨床醫(yī)生及臨床流行病醫(yī)生來(lái)說(shuō),在進(jìn)行統(tǒng)at分析前,一定要明確利用統(tǒng)計(jì)方法達(dá)到研究者的什么目的。一般來(lái)說(shuō),統(tǒng)計(jì)方法可分為描述與推斷兩類方法。一就是統(tǒng)計(jì)描述(descriptivestatistics),二就是統(tǒng)計(jì)推斷(inferentialstatistics)。統(tǒng)計(jì)描述,即利用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖或統(tǒng)計(jì)表,對(duì)數(shù)據(jù)資料所進(jìn)行的最基本的統(tǒng)計(jì)分析,使其能反映數(shù)據(jù)資料的基

26、本特征,有利于研究者能準(zhǔn)確、全面地了解數(shù)據(jù)資料所包涵的信息,以便做出科學(xué)的推斷。統(tǒng)計(jì)表,如頻數(shù)表、四格表、列聯(lián)表等;統(tǒng)計(jì)圖,如直方圖、餅圖,散點(diǎn)圖等;統(tǒng)計(jì)指標(biāo),如均數(shù)、標(biāo)準(zhǔn)差、率及構(gòu)成比等。統(tǒng)計(jì)推斷,即利用樣本所提供的信息對(duì)總體進(jìn)行推斷(估計(jì)或比較),其中包括參數(shù)估計(jì)與假設(shè)檢驗(yàn),如可信區(qū)間、t檢驗(yàn)、方差分析、2檢驗(yàn)等,如要分析甲藥治療與乙藥治療兩組的療效就是否不相同、不同地區(qū)某病的患病率有無(wú)差異等。還有些統(tǒng)計(jì)方法,既包含了統(tǒng)計(jì)描述也包含了統(tǒng)計(jì)推斷的內(nèi)容,如不同變量間的關(guān)系分析。相關(guān)分析,可用于研究某些因素間的相互聯(lián)系,以相關(guān)系數(shù)來(lái)衡量各因素間相關(guān)的密切程度與方向,如高血脂與冠心病、慢性宮頸炎與

27、宮頸癌等的相關(guān)分析;回歸分析,可用于研究某個(gè)因素與另一因素(變量)的依存關(guān)系,即以一個(gè)變量去推測(cè)另一變量,如利用回歸分析建立起來(lái)的回歸方程,可由兒童的年齡推算其體重。2 .資料類型資料類型的劃分現(xiàn)多采用國(guó)際通用的分類方法,將其分為兩類:數(shù)值變量(numericalvariable)資料與分類變量(categoricalvariable)資料。數(shù)值變量就是指其值就是可以定量或準(zhǔn)確測(cè)量的變量,其表現(xiàn)為數(shù)值大小的不同;而分類變量就是指其值就是無(wú)法定量或不能測(cè)量的變量,其表現(xiàn)沒(méi)有數(shù)值的大小而只有互不相容的類別或?qū)傩?。分類變量又可分為無(wú)序分類變量與有序分類變量?jī)尚☆?,無(wú)序分類變量表現(xiàn)為沒(méi)有大小之分的屬性

28、或類別,如:性別就是兩類無(wú)序分類變量,血型就是四類無(wú)序分類變量;有序分類變量表現(xiàn)為各屬性或類別間有程度之分,如:臨床上某種疾病的“輕、中、重”,治療結(jié)果的“無(wú)效、顯效、好轉(zhuǎn)、治愈”。由此可見(jiàn),數(shù)值變量資料、無(wú)序分類變量資料與有序分類變量資料又可叫做計(jì)量資料、計(jì)數(shù)資料與等級(jí)資料。資料類型的劃分與統(tǒng)計(jì)方法的抉擇有關(guān),在多數(shù)情況下不同的資料類型,選擇的統(tǒng)計(jì)方法不一樣。如數(shù)值變量資料的比較可選用t檢驗(yàn)、u檢驗(yàn)等統(tǒng)計(jì)方法;而率的比較多用2檢驗(yàn)。值得注意的就是,有些臨床科研工作者,常常人為地將數(shù)值變量的結(jié)果轉(zhuǎn)化為分類變量的臨床指標(biāo),然后參與統(tǒng)計(jì)分析,如患者的血紅蛋白含量,研究者常用正常、輕度貧血、中度貧血

29、與重度貧血來(lái)表示,這樣雖然照顧了臨床工作的習(xí)慣,卻損失了資料所提供的信息量。換言之,在多數(shù)#況下,數(shù)值變量資料提供的信息量最為充分,可進(jìn)行統(tǒng)計(jì)分析的手段也較為豐富、經(jīng)典與可靠,與之相比,分類變量在這些方面都不如數(shù)值變量資料。因此,在臨床實(shí)驗(yàn)中要盡可能選擇量化的指標(biāo)反映實(shí)驗(yàn)效應(yīng),若確實(shí)無(wú)法定量時(shí),才選用分類數(shù)據(jù),通常不宜將定量數(shù)據(jù)轉(zhuǎn)變成分類數(shù)據(jù)。3 .設(shè)計(jì)方法在眾多的臨床科研設(shè)計(jì)方法中,每一種設(shè)計(jì)方法都有與之相適應(yīng)的統(tǒng)計(jì)方法。在統(tǒng)計(jì)方法的抉擇時(shí),必須根據(jù)不同的臨床科研設(shè)計(jì)方法來(lái)選擇相應(yīng)的統(tǒng)計(jì)分析方法。如果統(tǒng)計(jì)方法的抉擇與設(shè)計(jì)方法不一致,統(tǒng)計(jì)分析得到的任何結(jié)論都就是錯(cuò)誤的。在常用的科研設(shè)計(jì)方法中,

30、有成組設(shè)計(jì)(完全隨機(jī)設(shè)計(jì))的t檢驗(yàn)、配對(duì)t檢驗(yàn)、成組設(shè)計(jì)(完全隨機(jī)設(shè)計(jì))的方差分析、配伍設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì))的方差分析等,都就是統(tǒng)計(jì)方法與科研設(shè)計(jì)方法有關(guān)的佐證。因此,應(yīng)注意區(qū)分成組設(shè)計(jì)(完全隨機(jī)設(shè)計(jì))與配對(duì)與配伍設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì)),在成組設(shè)計(jì)中又要注意區(qū)別兩組與多組設(shè)計(jì)。最常見(jiàn)的錯(cuò)誤就是將配對(duì)或配伍設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì))的資料當(dāng)做成組設(shè)計(jì)(完全隨機(jī)設(shè)計(jì))來(lái)處理,如配對(duì)設(shè)計(jì)的資料使用成組t檢驗(yàn)、配伍設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì))使用成組資料的方差分析;或?qū)⑷M及三組以上的成組設(shè)計(jì)(完全隨機(jī)設(shè)計(jì))資料的比較采用多個(gè)t檢驗(yàn)、三個(gè)或多個(gè)率的比較采用四格表的卡方檢驗(yàn)來(lái)進(jìn)行比較,都就是典型的錯(cuò)誤。如下表:表1常見(jiàn)

31、與設(shè)計(jì)方法有關(guān)的統(tǒng)計(jì)方法抉擇錯(cuò)誤表格i設(shè)計(jì)方法錯(cuò)誤的統(tǒng)計(jì)方法正確統(tǒng)計(jì)方法兩個(gè)均數(shù)的比較(成組設(shè)計(jì)、完全隨機(jī)設(shè)計(jì))成組設(shè)計(jì)的t檢驗(yàn)成組設(shè)計(jì)的秩與檢驗(yàn)多個(gè)均數(shù)的比較(成組設(shè)計(jì)、完全隨機(jī)設(shè)計(jì))多個(gè)成組設(shè)計(jì)的t檢驗(yàn)完全隨機(jī)設(shè)計(jì)的方差分析及q檢驗(yàn)、完全隨機(jī)設(shè)計(jì)的秩與檢驗(yàn)及兩兩比較數(shù)值變量的配對(duì)設(shè)計(jì)成組設(shè)計(jì)的t檢驗(yàn)配對(duì)t檢驗(yàn)、配對(duì)秩與檢驗(yàn)隨機(jī)區(qū)組設(shè)計(jì)(配伍設(shè)計(jì))多個(gè)成組設(shè)計(jì)的t檢驗(yàn)、完全隨機(jī)設(shè)計(jì)的力差分析隨機(jī)區(qū)組設(shè)計(jì)的方差分析及q檢驗(yàn)、隨機(jī)區(qū)組設(shè)計(jì)的秩與檢驗(yàn)及兩兩比較交叉設(shè)計(jì)成組設(shè)計(jì)的t檢驗(yàn)、配對(duì)t檢驗(yàn)、配對(duì)秩與檢驗(yàn)交叉設(shè)計(jì)的方差分析、交叉設(shè)計(jì)的秩與檢驗(yàn)4 .分布特征及數(shù)理統(tǒng)計(jì)條件數(shù)理統(tǒng)計(jì)與概率論就是統(tǒng)計(jì)

32、的理論基礎(chǔ)。每種統(tǒng)計(jì)方法都要涉及數(shù)理統(tǒng)計(jì)公式而這些數(shù)理統(tǒng)計(jì)公式都就是在一定條件下推導(dǎo)與建立的。也就就是說(shuō),只有當(dāng)某個(gè)或某些條件滿足時(shí),某個(gè)數(shù)理統(tǒng)計(jì)公式才成立,反之若不滿足條件時(shí),就不能使用某個(gè)數(shù)理統(tǒng)計(jì)公式。在數(shù)理統(tǒng)計(jì)公式推導(dǎo)與建立的條件中,涉及最多的就是數(shù)據(jù)的分布特征。數(shù)據(jù)的分布特征就是指數(shù)據(jù)的數(shù)理統(tǒng)計(jì)規(guī)律,許多數(shù)理統(tǒng)計(jì)公式都就是在特定的分布下推導(dǎo)與建立的。若實(shí)際資料服從(符合)某種分布,即可使用該分布所具有的數(shù)理統(tǒng)計(jì)規(guī)律來(lái)分析與處理該實(shí)際資料,反之則不能。在臨床資料的統(tǒng)at分析過(guò)程中,涉及得最多的分布有正態(tài)分布、偏態(tài)分布、二項(xiàng)分布等。許多統(tǒng)計(jì)方法對(duì)資料的分布有要求,如:均數(shù)與標(biāo)準(zhǔn)差、t與u檢

33、驗(yàn);方差分析都要求資料服從正態(tài)分布,而中位數(shù)與四分位數(shù)間距、秩與檢驗(yàn)等,可用于不服從正態(tài)分布的資料。所以,臨床資料的統(tǒng)計(jì)分析過(guò)程中,應(yīng)考慮資料的分布特征,最起碼的要求就是熟悉正態(tài)分布與偏態(tài)分布。例如:在臨床科研中,許多資料的描述不考慮資料的分布特征,而多選擇均數(shù)與標(biāo)準(zhǔn)差。如某婦科腫瘤化療前的血象值,資料如下表:某婦科腫瘤化療前的血象值表格2指標(biāo)名例數(shù)均數(shù)標(biāo)準(zhǔn)差偏度系數(shù)P值峰度系數(shù)P值血紅蛋白(g/L)98111、9918、820、1800、4590、0250、958血小板(X109/L)98173、5887、111、3530、0001、8430、000白細(xì)胞(X109/L)986、79302、

34、7671、2070、0001、2020、013從上結(jié)果可見(jiàn),若只瞧三項(xiàng)指標(biāo)的均數(shù)與標(biāo)準(zhǔn)差,臨床醫(yī)生也許不會(huì)懷疑有什么問(wèn)題。但就是經(jīng)正態(tài)性檢驗(yàn),病人的血紅蛋白服從正態(tài)分布,而血小板與白細(xì)胞兩項(xiàng)指標(biāo)的偏度與峰度系數(shù)均不服從正態(tài)分布(P時(shí),其概率大于我們事先確定好的檢驗(yàn)水平(如P0、05),我們就不拒絕其無(wú)差別的假設(shè)H0,還不能認(rèn)為各總體間有差別,樣本來(lái)自同一總體,即差別沒(méi)有統(tǒng)計(jì)學(xué)意義。2 .假設(shè)檢驗(yàn)結(jié)論的兩類錯(cuò)誤在假設(shè)檢驗(yàn)的兩種結(jié)論中無(wú)論做出何種結(jié)論,都有可能犯錯(cuò)誤。當(dāng)PW時(shí),做出“拒絕其無(wú)差別的假設(shè),可認(rèn)為各總體間有差別”的結(jié)論時(shí)就有可能犯錯(cuò)誤,這類錯(cuò)誤稱為第一類錯(cuò)誤(I型錯(cuò)誤,typeIerr

35、or),其犯錯(cuò)誤的概率用表示,若取0、05,此時(shí)犯I型錯(cuò)誤的概率小于或等于0、05,若假設(shè)檢驗(yàn)的P值比0、05越小,犯一類錯(cuò)誤的概率就越小。當(dāng)P時(shí),做出“不拒絕其無(wú)差別的假設(shè),還不能認(rèn)為各總體間有差別”的結(jié)論時(shí),就有可能犯第二類錯(cuò)誤(n型錯(cuò)誤,typenerror),其犯錯(cuò)誤的概率用表示,在通常情況下犯n類錯(cuò)誤的概率未知,雖然就是個(gè)未知數(shù),但假設(shè)檢驗(yàn)P值越大,犯二類錯(cuò)誤的概率就越小。表5假設(shè)檢驗(yàn)的兩類錯(cuò)誤表格5假設(shè)檢驗(yàn)結(jié)果真實(shí)情況拒名H0不拒絕H0樣本來(lái)自同一總體推斷不止確()推斷正確(1-)樣本來(lái)自小同總體推斷正確(1-)推斷不止確()3 .假設(shè)檢驗(yàn)的注意事項(xiàng)(1)假設(shè)檢驗(yàn)比較的象就是總體,

36、而研究的方法就是抽樣研究,即通過(guò)對(duì)樣本提供的信息去推斷總體間有無(wú)差別。不能誤認(rèn)為假設(shè)檢驗(yàn)就是樣本間的比較,更不能將此體現(xiàn)在結(jié)論中。如果研究方法就是普查時(shí),由于不存在抽樣誤差,也不存在用樣本提供的信息去推斷總體的問(wèn)題。因此,在這種情況下也就不能使用假設(shè)檢驗(yàn)的統(tǒng)計(jì)方法。(2)當(dāng)長(zhǎng)時(shí),概率(P)越小,越有理由拒絕無(wú)差別的假設(shè),即拒絕假設(shè)的可信程度就越大,這時(shí)I率(P)越小,其結(jié)論的可靠性就越好。當(dāng)P時(shí),概率(P)越大,越有理由不拒絕無(wú)差別的假設(shè),即不拒絕無(wú)差別假設(shè)的可信程度就越大。這時(shí)概率(P)越大,其結(jié)論的可靠性就越好。因此,無(wú)論概率PW,還就是P時(shí),都不能說(shuō)明組間差別的大小。(3)假設(shè)檢驗(yàn)的結(jié)論

37、不能絕對(duì)化。假設(shè)檢驗(yàn)的結(jié)論就是根據(jù)概率(P)的大小得出的事實(shí)上當(dāng)PW時(shí),我們拒絕其無(wú)差別的假設(shè),可認(rèn)為各總體間有差別,但就是,只要什0,我們無(wú)法完全拒絕無(wú)差別的假設(shè),即不能肯定各總體間有差別:同理,當(dāng)P時(shí),我們不拒絕其無(wú)差別的假設(shè),還不能認(rèn)為各總體間有差別,但就是,只要Pw1,我們無(wú)法完全接受無(wú)差別的假設(shè),即不能肯定各總體間無(wú)差別。因此,在做出統(tǒng)方t結(jié)論時(shí),要避免使用絕對(duì)的或肯定的語(yǔ)句,如當(dāng)PW時(shí),使用“拒絕假設(shè),可認(rèn)為各組間有差別;而當(dāng)P時(shí),使用“不拒絕假設(shè),還不能認(rèn)為各組間有差別”的語(yǔ)言進(jìn)行描述。(4)假設(shè)檢驗(yàn)的方法與設(shè)計(jì)方案與分布特征有關(guān),如:兩組比較的方法有t檢3u檢驗(yàn)、兩組秩與檢驗(yàn)、四格表與校正四格表的2檢驗(yàn)等,這些方法只能用于兩組比較,而不能用于多組的比較。在實(shí)際工作中錯(cuò)誤地使用兩組比較的方法代替多組比較的情況并不少見(jiàn)如,三個(gè)均數(shù)比較用三個(gè)t檢驗(yàn)、四個(gè)均數(shù)比較用六個(gè)t檢驗(yàn)等。多組比較可用方差分析、多組秩與檢驗(yàn)、行乘列2檢驗(yàn)等。t、u檢驗(yàn)與方差分析用于正態(tài)分布的資料,不服從正態(tài)分布的資料可用秩與檢驗(yàn)。4 .常用假設(shè)檢驗(yàn)方法(1)計(jì)量資料的假設(shè)檢驗(yàn)表6常用計(jì)量資料假設(shè)檢驗(yàn)方法表格6比較目的應(yīng)用條件統(tǒng)計(jì)方法樣本與總體的比較例數(shù)(n)較大,(任意分布)u檢驗(yàn)例數(shù)較小,樣本來(lái)自正t檢驗(yàn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論