SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第1頁(yè)
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第2頁(yè)
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第3頁(yè)
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第4頁(yè)
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、spss數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇目錄數(shù)據(jù)分析的統(tǒng)計(jì)方法選擇小結(jié) 錯(cuò)誤!未定義書簽。目錄 錯(cuò)誤!未定義書簽。資料1 錯(cuò)誤!未定義書簽。完全隨機(jī)分組設(shè)計(jì)的資料 錯(cuò)誤!未定義書簽。配對(duì)設(shè)計(jì)或隨機(jī)區(qū)組設(shè)計(jì) 錯(cuò)誤!未定義書簽。變量之間的關(guān)聯(lián)性分析 錯(cuò)誤!未定義書簽。資料2 錯(cuò)誤!未定義書簽。1. 連續(xù)性資料 錯(cuò)誤!未定義書簽。兩組獨(dú)立樣本比較 錯(cuò)誤!未定義書簽。兩組配對(duì)樣本的比較 錯(cuò)誤!未定義書簽。多組完全隨機(jī)樣本比較 錯(cuò)誤!未定義書簽。多組隨機(jī)區(qū)組樣本比較 錯(cuò)誤!未定義書簽。2 分類資料 錯(cuò)誤!未定義書簽。四格表資料 錯(cuò)誤!未定義書簽。2xc表或rx2表資料的統(tǒng)計(jì)分析 錯(cuò)誤!未定義書簽。rxc表資料

2、的統(tǒng)計(jì)分析 錯(cuò)誤!未定義書簽。配對(duì)分類資料的統(tǒng)計(jì)分析 錯(cuò)誤!未定義書簽。資料3 錯(cuò)誤!未定義書簽。一、兩個(gè)變量之間的關(guān)聯(lián)性分析 錯(cuò)誤!未定義書簽。二、回歸分析 錯(cuò)誤!未定義書簽。資料4 錯(cuò)誤!未定義書簽。一統(tǒng)計(jì)方法抉擇的條件 錯(cuò)誤!未定義書簽。1 分析目的 錯(cuò)誤!未定義書簽。2 資料類型 錯(cuò)誤!未定義書簽。3 設(shè)計(jì)方法 錯(cuò)誤!未定義書簽。4 分布特征及數(shù)理統(tǒng)計(jì)條件 錯(cuò)誤!未定義書簽。二數(shù)據(jù)資料的描述 錯(cuò)誤!未定義書簽。1 數(shù)值變量資料的描述 錯(cuò)誤!未定義書簽。2 分類變量資料的描述 錯(cuò)誤!未定義書簽。三數(shù)據(jù)資料的比較 錯(cuò)誤!未定義書簽。1 假設(shè)檢驗(yàn)的基本步驟 錯(cuò)誤!未定義書簽。2 假設(shè)檢驗(yàn)結(jié)論

3、的兩類錯(cuò)誤 錯(cuò)誤!未定義書簽。3 假設(shè)檢驗(yàn)的注意事項(xiàng) 錯(cuò)誤!未定義書簽。4 常用假設(shè)檢驗(yàn)方法 錯(cuò)誤!未定義書簽。四變量間的相關(guān)分析 錯(cuò)誤!未定義書簽。1 數(shù)值變量(計(jì)量資料)的關(guān)系分析 錯(cuò)誤!未定義書簽。2 無(wú)序分類變量(計(jì)數(shù)資料)的相關(guān)分析 錯(cuò)誤!未定義書簽。3 有序分類變量(等級(jí)資料)等級(jí)相關(guān) 錯(cuò)誤!未定義書簽。資料1完全隨機(jī)分組設(shè)計(jì)的資料兩組或多組計(jì)量資料的比較1. 兩組資料:1)大樣本資料或服從正態(tài)分布的小樣本資料(1)若方差齊性,則作成組 t檢驗(yàn)(2)若方差不齊,則作t '檢驗(yàn)或用成組的 wilcox on秩和檢驗(yàn)2)小樣本偏態(tài)分布資料,則用成組的wilcox on秩和檢驗(yàn)2

4、. 多組資料:1)若大樣本資料或服從正態(tài)分布,并且方差齊性,則作完全隨機(jī)的方差分析。 如果方差分析的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:lsd檢驗(yàn),bonferroni 檢驗(yàn)等)進(jìn)行兩兩比較。2)如果小樣本的偏態(tài)分布資料或方差不齊,則作kruskal wallis 的統(tǒng)計(jì)檢驗(yàn)。如果kruskal wallis的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:用成組的 wilcoxon秩和檢驗(yàn),但用 bonferroni方法校正p值等)進(jìn)行 兩兩比較。分類資料的統(tǒng)計(jì)分析1. 單樣本資料與總體比較1)二分類資料:(1)小樣本時(shí):用二項(xiàng)分布進(jìn)行確切概率法檢

5、驗(yàn);(2)大樣本時(shí):用u檢驗(yàn)。2)多分類資料:用 pearson2檢驗(yàn)(又稱擬合優(yōu)度檢驗(yàn))2. 四格表資料1)n>40并且所以理論數(shù)大于5,則用 pearson2)n>40并且所以理論數(shù)大于1并且至少存在一個(gè)理論數(shù) <5,則用校正2或用fisher ' s確切概率法檢驗(yàn)3)n40或存在理論數(shù)<1,則用fisher ' s檢驗(yàn)3. 2 x c表資料的統(tǒng)計(jì)分析1)列變量為效應(yīng)指標(biāo), 并且為有序多分類變量,行變量為分組變量, 則行評(píng)分的2cmh 或成組的wilcox on秩和檢驗(yàn)22)列變量為效應(yīng)指標(biāo)并且為二分類,列變量為有序多分類變量,則用趨勢(shì)檢3)行變量和

6、列變量均為無(wú)序分類變量(1)n40并且理論數(shù)小于 5的格子數(shù) 行列表中格子總數(shù)的25%則用pearson 2(2)n 40或理論數(shù)小于 5的格子數(shù) 行列表中格子總數(shù)的 25%則用fisher ' s 確切概率法檢驗(yàn)cmh4. r x c表資料的統(tǒng)計(jì)分析1)列變量為效應(yīng)指標(biāo),并且為有序多分類變量,行變量為分組變量,則或kruskal wallis的秩和檢驗(yàn)2)列變量為效應(yīng)指標(biāo),并且為無(wú)序多分類變量,行變量為有序多分類變量,作2none zero correlation analysis的 cmh3)列變量和行變量均為有序多分類變量,可以作spearman相關(guān)分析 4)列變量和行變量均為無(wú)

7、序多分類變量,(1)n40并且理論數(shù)小于 5的格子數(shù) 行列表中格子總數(shù)的 25%則用pearson(2)n40或理論數(shù)小于5的格子數(shù) 行列表中格子總數(shù)的25% 則用 fisher ' s確切概率法檢驗(yàn)三、poisson分布資料1. 單樣本資料與總體比較:1)觀察值較小時(shí):用確切概率法進(jìn)行檢驗(yàn)。2)觀察值較大時(shí):用正態(tài)近似的u檢驗(yàn)。2. 兩個(gè)樣本比較:用正態(tài)近似的 u檢驗(yàn)。配對(duì)設(shè)計(jì)或隨機(jī)區(qū)組設(shè)計(jì)四、兩組或多組計(jì)量資料的比較1. 兩組資料:1)大樣本資料或配對(duì)差值服從正態(tài)分布的小樣本資料,作配對(duì)t檢驗(yàn)2)小樣本并且差值呈偏態(tài)分布資料,則用wilcoxon的符號(hào)配對(duì)秩檢驗(yàn)2. 多組資料:1)

8、若大樣本資料或殘差服從正態(tài)分布,并且方差齊性,則作隨機(jī)區(qū)組的方差分析。如果方差分析的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:lsd檢驗(yàn),bonferroni 檢驗(yàn)等)進(jìn)行兩兩比較。2)如果小樣本時(shí),差值呈偏態(tài)分布資料或方差不齊,則作fredman的統(tǒng)計(jì)檢驗(yàn)。如果fredman的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:用wilcox on的符號(hào)配對(duì)秩檢驗(yàn), 但用bon ferro ni方法校正p值等)進(jìn)行兩兩 比較。五、分類資料的統(tǒng)計(jì)分析1. 四格表資料1)b+c>40,則用mcnemar配對(duì)2檢驗(yàn)或配對(duì)邊際2檢驗(yàn)2)b+c 40,則用二項(xiàng)分

9、布確切概率法檢驗(yàn)2. c x c表資料:2 21)配對(duì)比較:用 mcnemar配對(duì)檢驗(yàn)或配對(duì)邊際檢驗(yàn)2)一致性問(wèn)題(agreement):用kap檢驗(yàn)變量之間的關(guān)聯(lián)性分析六、兩個(gè)變量之間的關(guān)聯(lián)性分析1. 兩個(gè)變量均為連續(xù)型變量1)小樣本并且兩個(gè)變量服從雙正態(tài)分布,則用pears on相關(guān)系數(shù)做統(tǒng)計(jì)分析2)大樣本或兩個(gè)變量不服從雙正態(tài)分布,則用spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析2. 兩個(gè)變量均為有序分類變量,可以用spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析3. 一個(gè)變量為有序分類變量,另一個(gè)變量為連續(xù)型變量,可以用spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析七、回歸分析1. 直線回歸:如果回歸分析中的殘差服

10、從正態(tài)分布(大樣本時(shí)無(wú)需正態(tài)性),殘差與自變量無(wú)趨勢(shì)變化,則直線回歸(單個(gè)自變量的線性回歸,稱為簡(jiǎn)單回歸),否則應(yīng)作適當(dāng)?shù)淖儞Q,使其滿足上述條件。2. 多重線性回歸:應(yīng)變量(y)為連續(xù)型變量(即計(jì)量資料),自變量(x1, x2, x0可以為連續(xù)型變量、有序分類變量或二分類變量。如果回歸分析中的殘差服從正態(tài)分布(大樣本時(shí)無(wú)需正態(tài)性),殘差與自變量無(wú)趨勢(shì)變化,可以作多重線性回歸。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用3. 二分類的logistic 回

11、歸:應(yīng)變量為二分類變量,自變量(x1, x2,,xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1)非配對(duì)的情況:用非條件logistic 回歸(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素(2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍?些其它可能的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用2)配對(duì)的情況:用條件 logistic 回歸(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素(2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍?些其它可能的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用4. 有序多分類有序

12、的logistic 回歸:應(yīng)變量為有序多分類變量,自變量(x1 ,x2,xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用5. 無(wú)序多分類有序的logistic 回歸:應(yīng)變量為無(wú)序多分類變量,自變量(xi ,x2,xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素

13、變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用八、生存分析資料:(要求資料記錄結(jié)局和結(jié)局發(fā)生的時(shí)間,如:死亡和死亡發(fā)生的時(shí)間)1. 用kaplan-meier方法估計(jì)生存曲線2. 大樣本時(shí),可以壽命表方法估計(jì)3. 單因素可以用log rank比較兩條或多條生存曲線4. 多個(gè)因素時(shí),可以作多重的 cox回歸1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用資料21. 連續(xù)性資料兩組獨(dú)立樣本比較資料符合正態(tài)分布,且兩組方差齊性,直接采用t檢驗(yàn)。資料不符合正態(tài)分布(1)

14、可進(jìn)行數(shù)據(jù)轉(zhuǎn)換,如對(duì)數(shù)轉(zhuǎn)換等,使之服從正態(tài)分布,然后對(duì)轉(zhuǎn)換后的數(shù)據(jù)采用 t檢驗(yàn);(2)采用非參數(shù)檢驗(yàn),如wilcox on檢驗(yàn)。資料方差不齊(1)采用 satterthwate 的 t'檢驗(yàn);(2)采用非參數(shù)檢驗(yàn),如wilcox on檢驗(yàn)。兩組配對(duì)樣本的比較兩組差值服從正態(tài)分布,采用配對(duì) t 檢驗(yàn)。兩組差值不服從正態(tài)分布,采用 wilcoxon 的符號(hào)配對(duì)秩和檢驗(yàn)。多組完全隨機(jī)樣本比較資料符合正態(tài)分布, 且各組方差齊性, 直接采用完全隨機(jī)的方差分析。 如果檢驗(yàn)結(jié)果為 有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較的方法有l(wèi)sd檢驗(yàn),bonferroni法,tukey法,scheffe 法,

15、snk法等。資料不符合正態(tài)分布, 或各組方差不齊, 則采用非參數(shù)檢驗(yàn)的 kruscal wallis 法。 如 果檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,一般采用bonferroni 法校正 p 值,然后用成組的 wilcoxon 檢驗(yàn)。多組隨機(jī)區(qū)組樣本比較資料符合正態(tài)分布, 且各組方差齊性, 直接采用隨機(jī)區(qū)組的方差分析。 如果檢驗(yàn)結(jié)果為 有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較的方法有l(wèi)sd檢驗(yàn),bonferroni法,tukey法,scheffe 法,snk法等。資料不符合正態(tài)分布, 或各組方差不齊, 則采用非參數(shù)檢驗(yàn)的 fridman 檢驗(yàn)法。 如果檢 驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一

16、步作兩兩比較,一般采用bonferroni 法校正 p 值,然后用符號(hào)配對(duì)的 wilcoxon 檢驗(yàn)。需要注意的問(wèn)題:(1) 一般來(lái)說(shuō),如果是大樣本,比如各組例數(shù)大于50,可以不作正態(tài)性檢驗(yàn),直接采 用t檢驗(yàn)或方差分析。因?yàn)榻y(tǒng)計(jì)學(xué)上有中心極限定理,假定大樣本是服從正態(tài)分布的。(2) 當(dāng)進(jìn)行多組比較時(shí),最容易犯的錯(cuò)誤是僅比較其中的兩組,而不顧其他組, 這樣 作容易增大犯假陽(yáng)性錯(cuò)誤的概率。 正確的做法應(yīng)該是, 先作總的各組間的比較, 如果總的來(lái) 說(shuō)差別有統(tǒng)計(jì)學(xué)意義,然后才能作其中任意兩組的比較,這些兩兩比較有特定的統(tǒng)計(jì)方法,如上面提到的 lsd檢驗(yàn),bonferroni 法,tukey法,sche

17、ffe法,snk法等。絕不能對(duì)其中 的兩組直接采用 t 檢驗(yàn),這樣即使得出結(jié)果也未必正確。(3)關(guān)于常用的設(shè)計(jì)方法: 多組資料盡管最終分析都是采用方差分析, 但不同設(shè)計(jì)會(huì) 有差別。常用的設(shè)計(jì)如完全隨即設(shè)計(jì),隨機(jī)區(qū)組設(shè)計(jì),析因設(shè)計(jì),裂區(qū)設(shè)計(jì),嵌套設(shè)計(jì)等。2分類資料四格表資料例數(shù)大于 40 ,且所有理論數(shù)大于 5,則用普通的 pearson 檢驗(yàn)。例數(shù)大于 40 ,所有理論數(shù)大于 1,且至少一個(gè)理論數(shù)小于 5,則用校正的檢驗(yàn)或 fisher ' s 確切概率法檢驗(yàn)。例數(shù)小于 40,或有理論數(shù)小于 2,則用 fisher ' s 確切概率法檢驗(yàn)。2 x c表或rx 2表資料的統(tǒng)計(jì)分析

18、列變量行變量均為無(wú)序分類變量,則( 1)例數(shù)大于 40,且理論數(shù)小于 5 的格子數(shù)目 總格子數(shù)目的 25,則用普通的 pearson 檢驗(yàn)。( 2)例數(shù)小于 40,或理論數(shù)小于 5 的格子數(shù)目 總格子數(shù)目的 25,則用 fisher 's 確切概率法檢驗(yàn)。列變量為效應(yīng)指標(biāo), 且為有序多分類變量, 行變量為分組變量, 用普通的 pearson 檢驗(yàn) 只說(shuō)明組間構(gòu)成比不同,如要說(shuō)明療效,則可用行平均分差檢驗(yàn)或成組的 wilcoxon 秩和檢 驗(yàn)。列變量為效應(yīng)指標(biāo),且為二分類變量,行變量為有序多分類變量,則可采用普通的 pearson 檢驗(yàn)比較各組之間有無(wú)差別,如果總的來(lái)說(shuō)有差別,還可進(jìn)一步

19、作兩兩比較,以說(shuō) 明是否任意兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。rxc表資料的統(tǒng)計(jì)分析列變量行變量均為無(wú)序分類變量,則( 1)例數(shù)大于 40,且理論數(shù)小于 5 的格子數(shù)目 總格子數(shù)目的 25,則用普通的 pearson 檢驗(yàn)。( 2)例數(shù)小于 40,或理論數(shù)小于 5 的格子數(shù)目 總格子數(shù)目的 25,則用 fisher 's 確切概率法檢驗(yàn)。( 3)如果要作相關(guān)性分析,可采用 pearson 相關(guān)系數(shù)。列變量為效應(yīng)指標(biāo), 且為有序多分類變量, 行變量為分組變量, 用普通的 pearson 檢驗(yàn) 只說(shuō)明組間構(gòu)成比不同, 如要說(shuō)明療效或強(qiáng)弱程度的不同, 則可用行平均分差檢驗(yàn)或成組的 wilcoxo

20、n 秩和檢驗(yàn)或 ridit 分析。列變量為效應(yīng)指標(biāo), 且為無(wú)序多分類變量, 行變量為有序多分類變量, 則可采用普通的 pearson 檢驗(yàn)比較各組之間有無(wú)差別,如果有差別,還可進(jìn)一步作兩兩比較,以說(shuō)明是否任 意兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。列變量&行變量均為有序多分類變量(1) 如要做組間差別分析,則可用行平均分差檢驗(yàn)或成組的wilcox on秩和檢驗(yàn)或ridit 分析。如果總的來(lái)說(shuō)有差別,還可進(jìn)一步作兩兩比較,以說(shuō)明是否任意兩組之間的差別都有 統(tǒng)計(jì)學(xué)意義。(2)如果要做兩變量之間的相關(guān)性,可采用 spearson相關(guān)分析。配對(duì)分類資料的統(tǒng)計(jì)分析四格表配對(duì)資料(1)b+ c>40

21、,則用 mcnemar配對(duì)檢驗(yàn)。(2)b+ c<40,則用校正的配對(duì)檢驗(yàn)。c x c資料(1)配對(duì)比較:用 mcnemar配對(duì)檢驗(yàn)。(2)一致性檢驗(yàn),用 kappa檢驗(yàn)。資料3在研究設(shè)計(jì)時(shí),統(tǒng)計(jì)方法的選擇需考慮以下6個(gè)方面的問(wèn)題:(1)看反應(yīng)變量是單變量、雙變量還是多變量;(2)看單變量資料屬于 3種資料類型(計(jì)量、計(jì)數(shù)及等級(jí)資料)中的哪一種;(3)看影響因素是單因素還是多因素;(4)看單樣本、兩樣本或多樣本;(5)看是否是配對(duì)或配伍設(shè)計(jì);(6)看是否滿足檢驗(yàn)方法所需的前提條件,必要時(shí)可進(jìn)行變量變換,應(yīng)用參數(shù)方法進(jìn)行假設(shè)檢驗(yàn)往往要求數(shù)據(jù)滿足某些前提條件,如兩個(gè)獨(dú)立樣本比較t檢驗(yàn)或多個(gè)獨(dú)立

22、樣本比較的方差分析,均要求方差齊性,因此需要做方差齊性檢驗(yàn)。如果要用正態(tài)分 布法估計(jì)參考值范圍,首先要檢驗(yàn)資料是否服從正態(tài)分布。在建立各種多重回歸方程時(shí),常 需檢驗(yàn)變量間的多重共線性和殘差分布的正態(tài)性。表1-1連續(xù)因變量分類因變量連續(xù)自變量回歸分析logistic回歸分類自變量方差分析(anova)表格檢驗(yàn)(比如卡方檢驗(yàn))不同的統(tǒng)計(jì)分析方法都有其各自的應(yīng)用條件和適用范圍。實(shí)際應(yīng)用時(shí),必須根據(jù)研究目的、資料的性質(zhì)以及所要分析的具體內(nèi)容等選擇適當(dāng)?shù)慕y(tǒng)計(jì)分析方法,切忌只關(guān)心p值的大?。ㄊ欠?<),而忽略統(tǒng)計(jì)分析方法的應(yīng)用條件和適用范圍。、兩個(gè)變量之間的關(guān)聯(lián)性分析1. 兩個(gè)變量均為連續(xù)型變量1)

23、 小樣本并且兩個(gè)變量服從雙正態(tài)分布,則用pearson 相關(guān)系數(shù)做統(tǒng)計(jì)分析2) 大樣本或兩個(gè)變量不服從雙正態(tài)分布,則用spearman 相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析2. 兩個(gè)變量均為有序分類變量,可以用spearman 相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析3. 一個(gè)變量為有序分類變量,另一個(gè)變量為連續(xù)型變量,可以用spearman 相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析二、回歸分析1. 直線回歸:如果回歸分析中的殘差服從正態(tài)分布 (大樣本時(shí)無(wú)需正態(tài)性), 殘差與自 變量無(wú)趨勢(shì)變化,則直線回歸(單個(gè)自變量的線性回歸,稱為簡(jiǎn)單回歸),否則應(yīng)作適當(dāng)?shù)?變換,使其滿足上述條件。2. 多重線性回歸:應(yīng)變量(y)為連續(xù)型變量(即計(jì)量資料),自變量

24、(x1, x2,,xp)可以為連續(xù)型變量、有序分類變量或二分類變量。如果回歸分析中的殘差服從正態(tài)分布(大樣本時(shí)無(wú)需正態(tài)性),殘差與自變量無(wú)趨勢(shì)變化,可以作多重線性回歸。1 )觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2) 實(shí)驗(yàn)性研究: 在保持主要研究因素變量 (干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌?能的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用3. 二分類的logistic 回歸:應(yīng)變量為二分類變量,自變量(x1, x2,,xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1 )非配對(duì)的情況:用非條件 logistic 回歸(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要

25、的影響因素(2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌?可能的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用2)配對(duì)的情況:用條件 logistic 回歸(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素(2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌?可能的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用4. 有序多分類有序的logistic 回歸:應(yīng)變量為有序多分類變量,自變量(x1, x2,xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1 )觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2) 實(shí)驗(yàn)性研

26、究: 在保持主要研究因素變量 (干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌?能的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用5. 無(wú)序多分類有序的 logistic 回歸:應(yīng)變量為無(wú)序多分類變量,自變量(x1, x2,xp)可以為連續(xù)型變量、有序分類變量或二分類變量。1 )觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素2)實(shí)驗(yàn)性研究:在保持主要研究因素變量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡艿幕祀s因素變量,以校正這些混雜因素對(duì)結(jié)果的混雜作用。資料4一.統(tǒng)計(jì)方法抉擇的條件在臨床科研工作中,正確地抉擇統(tǒng)計(jì)分析方法,應(yīng)充分考慮科研工作者的分析目的、臨床科研設(shè)計(jì)方法、搜集到的數(shù)據(jù)資料類型

27、、數(shù)據(jù)資料的分布特征與所涉及的數(shù)理統(tǒng)計(jì)條件等。 其中任何一個(gè)問(wèn)題沒(méi)考慮到或考慮有誤,都有可能導(dǎo)致統(tǒng)計(jì)分析方法的抉擇失誤。此外,統(tǒng)計(jì)分析方法的抉擇應(yīng)在科研的設(shè)計(jì)階段來(lái)完成,而不應(yīng)該在臨床試驗(yàn)結(jié)束或在數(shù)據(jù)的收集工作已完成之后。對(duì)臨床科研數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析和進(jìn)行統(tǒng)計(jì)方法 抉擇時(shí),應(yīng)考慮下列因素:1.分析目的對(duì)于臨床醫(yī)生及臨床流行病醫(yī)生來(lái)說(shuō),在進(jìn)行統(tǒng)計(jì)分析前,一定要明確利用 統(tǒng)計(jì)方法 達(dá)到研究者的什么目的。一般來(lái)說(shuō),統(tǒng)計(jì)方法 可分為描述與推斷兩類方法。一是統(tǒng)計(jì)描述(descriptive statistics),二是統(tǒng)計(jì)推斷(inferentialstatistics) 。統(tǒng)計(jì)描述,即利用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)

28、圖或統(tǒng)計(jì)表,對(duì)數(shù)據(jù)資料所進(jìn)行的最基本的統(tǒng)計(jì)分析, 使其能反映數(shù)據(jù)資料的基本特征,有利于研究者能準(zhǔn)確、全面地了解數(shù)據(jù)資料所包涵的信息, 以便做出科學(xué)的推斷。統(tǒng)計(jì)表,如頻數(shù)表、四格表、列聯(lián)表等;統(tǒng)計(jì)圖,如直方圖、餅圖, 散點(diǎn)圖等;統(tǒng)計(jì)指標(biāo),如均數(shù)、標(biāo)準(zhǔn)差、率及構(gòu)成比等。統(tǒng)計(jì)推斷,即利用樣本所提供的信息對(duì)總體進(jìn)行推斷(估計(jì)或比較),其中包括參數(shù)估計(jì)和假設(shè)檢驗(yàn),如可信區(qū)間、t檢驗(yàn)、方差分析、2檢驗(yàn)等,如要分析甲藥治療與乙藥治療兩組的療效是否不相同、不同地區(qū)某病的患病率有無(wú)差異等。還有些統(tǒng)計(jì)方法,既包含了統(tǒng)計(jì)描述也包含了統(tǒng)計(jì)推斷的內(nèi)容,如不同變量間的關(guān)系分析。相關(guān)分析,可用于研究某些因素間的相互聯(lián)系,以

29、相關(guān)系數(shù)來(lái)衡量各因素間相關(guān)的密切程度和方向,如高血脂與冠心病、慢性宮頸炎與宮頸癌等的相關(guān)分析;回歸分析,可用于研究某個(gè)因素與另一因素(變量)的依存關(guān)系,即以一個(gè)變量去推測(cè)另一變量,如利用回歸分析建立起來(lái)的回歸方程,可由兒童的年齡推算其體重。2. 資料類型資料類型的劃分現(xiàn)多采用國(guó)際通用的分類方法,將其分為兩類:數(shù)值變量 (numerical variable) 資料和分類變量(categorical variable) 資料。數(shù)值變量是指其值 是可以定量或準(zhǔn)確測(cè)量的變量,其表現(xiàn)為數(shù)值大小的不同;而分類變量是指其值是無(wú)法定量或不能測(cè)量的變量,其表現(xiàn)沒(méi)有數(shù)值的大小而只有互不相容的類別或?qū)傩?。分類變?/p>

30、又可分為無(wú)序分類變量和有序分類變量?jī)尚☆?,無(wú)序分類變量表現(xiàn)為沒(méi)有大小之分的屬性或類別, 如:性別是兩類無(wú)序分類變量,血型是四類無(wú)序分類變量;有序分類變量表現(xiàn)為各屬性或類 別間有程度之分,如:臨床上某種疾病的“輕、中、重”,治療結(jié)果的“無(wú)效、顯效、好轉(zhuǎn)、治愈”。由此可見(jiàn),數(shù)值變量資料、無(wú)序分類變量資料和有序分類變量資料又可叫做計(jì)量資 料、計(jì)數(shù)資料和等級(jí)資料。資料類型的劃分與統(tǒng)計(jì)方法的抉擇有關(guān),在多數(shù)情況下不同的資料類型,選擇的統(tǒng)計(jì)方 法不一樣。如數(shù)值變量資料的比較可選用 t檢驗(yàn)、u檢驗(yàn)等統(tǒng)計(jì)方法;而率的比較多用 2 檢驗(yàn)。值得注意的是,有些臨床科研工作者,常常人為地將數(shù)值變量的結(jié)果轉(zhuǎn)化為分類變量

31、的 臨床指標(biāo),然后參與統(tǒng)計(jì)分析,如患者的血紅蛋白含量,研究者常用正常、輕度貧血、中度 貧血和重度貧血來(lái)表示,這樣雖然照顧了臨床工作的習(xí)慣,卻損失了資料所提供的信息量。 換言之,在多數(shù)情況下,數(shù)值變量資料提供的信息量最為充分,可進(jìn)行統(tǒng)計(jì)分析的手段也較為豐富、經(jīng)典和可靠,與之相比,分類變量在這些方面都不如數(shù)值變量資料。因此,在臨床 實(shí)驗(yàn)中要盡可能 選擇量化的指標(biāo)反映實(shí)驗(yàn)效應(yīng), 若確實(shí)無(wú)法定量時(shí),才選用分類數(shù)據(jù),通常 不宜將定量數(shù)據(jù)轉(zhuǎn)變成分類數(shù)據(jù)。3. 設(shè)計(jì)方法在眾多的臨床科研設(shè)計(jì)方法中,每一種設(shè)計(jì)方法都有與之相適應(yīng)的統(tǒng)計(jì)方法。在統(tǒng)計(jì)方法的抉擇時(shí),必須根據(jù)不同的臨床科研設(shè)計(jì)方法來(lái) 選擇相應(yīng)的統(tǒng)計(jì)分析

32、方法。如果 統(tǒng)計(jì)方法的抉擇與設(shè)計(jì)方法不一致,統(tǒng)計(jì)分析得到的任何結(jié)論都是錯(cuò)誤的。在常用的科研設(shè)計(jì)方法中,有成組設(shè)計(jì)(完全隨機(jī)設(shè)計(jì))的 t檢驗(yàn)、配對(duì)t檢驗(yàn)、成組 設(shè)計(jì)(完全隨機(jī)設(shè)計(jì))的方差分析、配伍設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì))的方差分析等,都是統(tǒng)計(jì)方法與科研設(shè)計(jì)方法有關(guān)的佐證。因此,應(yīng)注意區(qū)分成組設(shè)計(jì)(完全隨機(jī)設(shè)計(jì))與配對(duì)和配伍設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì)),在成組設(shè)計(jì)中又要注意區(qū)別兩組與多組設(shè)計(jì)。最常見(jiàn)的錯(cuò)誤是將配 對(duì)或配伍設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì))的資料當(dāng)做成組設(shè)計(jì)(完全隨機(jī)設(shè)計(jì))來(lái)處理,如配對(duì)設(shè)計(jì) 的資料使用成組t檢驗(yàn)、配伍設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì))使用成組資料的方差分析;或?qū)⑷M及 三組以上的成組設(shè)計(jì)(完全隨機(jī)設(shè)計(jì))資

33、料的比較采用多個(gè) t檢驗(yàn)、三個(gè)或多個(gè)率的比較采 用四格表的卡方檢驗(yàn)來(lái)進(jìn)行比較,都是典型的錯(cuò)誤。如下表:表1常見(jiàn)與設(shè)計(jì)方法有關(guān)的統(tǒng)計(jì)方法抉擇錯(cuò)誤表格1設(shè)計(jì)方法錯(cuò)誤的統(tǒng)計(jì)方法正確統(tǒng)計(jì)方法兩個(gè)均數(shù)的比較(成組設(shè) 計(jì)、完全隨機(jī)設(shè)計(jì))成組設(shè)計(jì)的t檢驗(yàn)成組設(shè)計(jì)的秩和檢驗(yàn)多個(gè)均數(shù)的比較(成組設(shè) 計(jì)、完全隨機(jī)設(shè)計(jì))多個(gè)成組設(shè)計(jì)的t檢驗(yàn)完全隨機(jī)設(shè)計(jì)的方差分析及q檢驗(yàn)、完全隨機(jī)設(shè)計(jì)的秩和檢驗(yàn)及兩 兩比較數(shù)值變量的配對(duì)設(shè) 計(jì)成組設(shè)計(jì)的t檢驗(yàn)配對(duì)t檢驗(yàn)、配對(duì)秩和檢驗(yàn)隨機(jī)區(qū)組設(shè)計(jì)(配伍設(shè) 計(jì))多個(gè)成組設(shè)計(jì)的t檢驗(yàn)、完全隨機(jī)設(shè)計(jì)的方差分析隨機(jī)區(qū)組設(shè)計(jì)的方差分析及q檢驗(yàn)、隨機(jī)區(qū)組設(shè)計(jì)的秩和檢驗(yàn)及兩 兩比較交叉設(shè)計(jì)成組設(shè)計(jì)的

34、t檢驗(yàn)、配對(duì) t檢驗(yàn)、配對(duì)秩和檢驗(yàn)交叉設(shè)計(jì)的方差分析、交叉設(shè)計(jì)的 秩和檢驗(yàn)4. 分布特征及數(shù)理統(tǒng)計(jì)條件數(shù)理統(tǒng)計(jì)和概率論是統(tǒng)計(jì)的理論基礎(chǔ)。每種 統(tǒng)計(jì)方法都要涉及數(shù)理統(tǒng)計(jì)公式, 而這些數(shù)理統(tǒng)計(jì)公式都是在一定條件下推導(dǎo)和建立的。也就是說(shuō),只有當(dāng)某個(gè)或某些條件滿足時(shí),某個(gè)數(shù)理統(tǒng)計(jì)公式才成立,反之若不滿足條件時(shí),就不能使用某個(gè)數(shù)理統(tǒng)計(jì)公式。在數(shù)理統(tǒng)計(jì)公式推導(dǎo)和建立的條件中,涉及最多的是數(shù)據(jù)的分布特征。 數(shù)據(jù)的分布特征是指數(shù)據(jù)的數(shù)理統(tǒng)計(jì)規(guī)律,許多數(shù)理統(tǒng)計(jì)公式都是在特定的分布下推導(dǎo)和建立的。若實(shí)際資料服從(符合)某種分布,即可使用該分布所具有的數(shù)理統(tǒng)計(jì)規(guī)律來(lái)分析和處理該實(shí)際資料, 反之則不能。在臨床資料的統(tǒng)

35、計(jì)分析過(guò)程中,涉及得最多的分布有正態(tài)分布、偏態(tài)分布、二項(xiàng)分布等。許多統(tǒng)計(jì)方法對(duì)資料的分布有要求,如:均數(shù)和標(biāo)準(zhǔn)差、t和u檢驗(yàn);方差分析都要求資料服從正態(tài)分布,而中位數(shù)和四分位數(shù)間距、 秩和檢驗(yàn)等,可用于不服從正態(tài)分布的資料。 所以,臨床資料的統(tǒng)計(jì)分析過(guò)程中,應(yīng)考慮資料的分布特征,最起碼的要求是熟悉正態(tài)分布 與偏態(tài)分布。例如:在臨床科研中,許多資料的描述不考慮資料的分布特征,而多選擇均數(shù)與標(biāo)準(zhǔn)差。如某婦科腫瘤化療前的血象值,資料如下表:某婦科腫瘤化療前的血象值表格2指標(biāo)名例數(shù)均數(shù)標(biāo)準(zhǔn)差偏度系數(shù)p值峰度系數(shù)p值血紅蛋白(g/l)98血小板(x 109/l)98白細(xì)胞(x 109/l)98從上結(jié)果可

36、見(jiàn),若只看三項(xiàng)指標(biāo)的均數(shù)和標(biāo)準(zhǔn)差,臨床醫(yī)生也許不會(huì)懷疑有什么問(wèn)題。但是經(jīng)正態(tài)性檢驗(yàn),病人的血紅蛋白服從正態(tài)分布,而血小板和白細(xì)胞兩項(xiàng)指標(biāo)的偏度和峰度系數(shù)均不服從正態(tài)分布(p)。因此,描述病人的血小板和白細(xì)胞平均水平正確的指標(biāo)是 中位數(shù),而其變異程度應(yīng)使用四分位數(shù)間距。除了數(shù)據(jù)的分布特征外,有些數(shù)理統(tǒng)計(jì)公式還有其它一些的條件,如t檢驗(yàn)和方差分析的方差齊性、卡方檢驗(yàn)的理論數(shù) (t)大小等??傊瑢?duì)于臨床科研工作者來(lái)說(shuō),為正確地進(jìn)行 統(tǒng)計(jì)方法的抉擇,首先要掌握或熟悉上述影響 統(tǒng)計(jì)方法 抉擇因素;其次,還應(yīng)熟悉和了解常用統(tǒng)計(jì)方法的應(yīng)用條件。二.數(shù)據(jù)資料的描述統(tǒng)計(jì)描述的內(nèi)容包括了統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖和表,其

37、目的是使數(shù)據(jù)資料的基本特征更加清晰地表達(dá)。本節(jié)只討論統(tǒng)計(jì)指標(biāo)的正確選用,而統(tǒng)計(jì)圖表的正確使用請(qǐng)參閱其他書籍。1數(shù)值變量資料的描述描述數(shù)值變量資料的基本特征有兩類指標(biāo), 一是描述集中趨勢(shì)的指標(biāo), 用以反映一組數(shù) 據(jù)的平均水平;二是描述離散程度的指標(biāo), 用以反映一組數(shù)據(jù)的變異大小。 各指標(biāo)的名稱及 適用范圍等見(jiàn)表2。表3描述數(shù)值變量資料的常用指標(biāo)表格3指標(biāo)名稱用途適用的資料均數(shù)(x-)描述一組數(shù)據(jù)的平均水平,集中位置正態(tài)分布或近似正態(tài)分布中位數(shù)(m)與均數(shù)相同偏態(tài)分布、分布未知、兩端無(wú)界幾何均數(shù)(g )與均數(shù)相同對(duì)數(shù)正態(tài)分布,等比資料標(biāo)準(zhǔn)差(s)描述一組數(shù)據(jù)的變異大小,離散程度正態(tài)分布或近似正態(tài)分

38、布四分位數(shù)間距(qu-ql與標(biāo)準(zhǔn)差相同偏態(tài)分布、分布未知、兩端無(wú)界極差(r)與標(biāo)準(zhǔn)差相同觀察例數(shù)相近的數(shù)值變量變異系數(shù)(cv與標(biāo)準(zhǔn)差相同比較幾組資料間的變異大小從表中可看出,均數(shù)與標(biāo)準(zhǔn)差聯(lián)合使用描述正態(tài)分布或近似正態(tài)分布資料的基本特征;中位數(shù)與四分位數(shù)間距聯(lián)合使用描述偏態(tài)分布或未知分布資料的基本特征。這些描述指標(biāo)應(yīng)用時(shí), 最常見(jiàn)的錯(cuò)誤是不考慮其應(yīng)用條件的隨意使用,女口:用均數(shù)和標(biāo)準(zhǔn)差描述偏態(tài)分布、分布未知或兩端無(wú)界的資料,這是目前在臨床研究文獻(xiàn)中較為普遍和典 型的錯(cuò)誤。2.分類變量資料的描述描述分類變量資料常用的指標(biāo)有死亡率、患病率、發(fā)病率等。臨床上,這類指標(biāo)的應(yīng)用較多,出現(xiàn)的錯(cuò)誤也較多。這些

39、錯(cuò)誤歸納起來(lái)大致有 兩類:一是以比代率,即誤將構(gòu)成比(proportion) 當(dāng)做率(rate)來(lái)描述某病發(fā)生的強(qiáng)度和頻 率,如用某病的病人數(shù)除以就診人數(shù)(或人次)得到"某病患病率”或"某病發(fā)病率”,就是典型的以比代率的例子。二是把各種不同的率相互混淆,如把患病率與發(fā)病率、死亡率與病死率等概念混同。需要指出的是,單純利用醫(yī)院常規(guī)資料, 最易得到的指標(biāo)是構(gòu)成比。 而描述疾 病發(fā)生強(qiáng)度和頻率的指標(biāo)的率反映如患病率、發(fā)病率、死亡率等,很難利用醫(yī)院的常規(guī)資料(如醫(yī)院醫(yī)院的病例檔案)獲得。因?yàn)?,醫(yī)院常規(guī)資料無(wú)法得到計(jì)算這些率所需的分子和分母的資料。所以,一旦研究者利用的是醫(yī)院常規(guī)資料

40、,則無(wú)法衡量疾病對(duì)人群的危害程度。 常用描述指標(biāo)如表 3。表4描述分類變量資料的常用指標(biāo)表格4指標(biāo)名稱計(jì)算公式意義率發(fā)生某現(xiàn)象的觀察單位數(shù)可能發(fā)生某現(xiàn)象的觀察單位總數(shù)x k描述事件發(fā)生的強(qiáng)度和頻率構(gòu)成比a a+b+x 100%事物內(nèi)部各組成部分所占的比重相對(duì)比aba指標(biāo)為b指標(biāo)的若干倍或百分之幾三. 數(shù)據(jù)資料的比較在眾多的科研研究方法中,歸納起來(lái)最基本的手段有兩種,一是對(duì)研究對(duì)象的全體進(jìn)行研究,在實(shí)際工作中往往難以實(shí)現(xiàn);二是從總體中抽取一定數(shù)量的樣本進(jìn)行抽樣研究,但要考慮抽樣誤差對(duì)結(jié)果的影響。因此,若用樣本信息去推斷其所代表的總體間有無(wú)差別時(shí),需要使用假設(shè)檢驗(yàn) (hypothesistesti

41、ng) 或稱顯著性檢驗(yàn)(significancetest)。1假設(shè)檢驗(yàn)的基本步驟(1) 建立檢驗(yàn)假設(shè)。建立假設(shè)的過(guò)程應(yīng)有三個(gè)內(nèi)容。即無(wú)效假設(shè)ho (n ull hypothesis)、備擇假設(shè) h1 (alternative hypothesis)和檢驗(yàn)水準(zhǔn)(size of test)。無(wú)效假設(shè) h0 是研究者想得到結(jié)論的對(duì)立事件的假設(shè),對(duì)于差異性檢驗(yàn)而言,研究者想得到的是“有差別” 的結(jié)論,故首先應(yīng)假設(shè)各總體間無(wú)差別;備擇假設(shè)h1是其對(duì)立的假設(shè),即是“有差別”的假設(shè);此外,還應(yīng)確定有統(tǒng)計(jì)意義的概率水平,通常 取。建立檢驗(yàn)假設(shè)的通常格式為:h0:多個(gè)樣本來(lái)自同一總體,各樣本間的差別是由于抽樣誤

42、差所致h1:多個(gè)樣本來(lái)自不同的總體,各樣本間的差別是由于不同總體所致(2) 計(jì)算統(tǒng)計(jì)量。根據(jù)資料的類型、分布特征、科研設(shè)計(jì)方法等條件,選擇不同的統(tǒng)計(jì)量計(jì)算方法,如t檢驗(yàn)、u檢驗(yàn)等統(tǒng)計(jì)方法。(3) 根據(jù)統(tǒng)計(jì)量的值得到概率 (p)值;再按概率(p)值的大小得出結(jié)論。其結(jié)論只有兩 種情況,若pw 時(shí),即概率小于我們事先確定好的檢驗(yàn)水平概率(如pw),我們就拒絕其無(wú)差別假設(shè)h0,而接受h1,認(rèn)為差別有統(tǒng)計(jì)學(xué)意義,各樣本來(lái)自不同總體,樣本間的差別 是總體的不同所致;若p> 時(shí),其概率大于我們事先確定好的檢驗(yàn)水平(如p>),我們就不拒絕其無(wú)差別的假設(shè)h0,還不能認(rèn)為各總體間有差別,樣本來(lái)自同一

43、總體,即差別沒(méi)有統(tǒng)計(jì)學(xué)意義。2.假設(shè)檢驗(yàn)結(jié)論的兩類錯(cuò)誤在假設(shè)檢驗(yàn)的兩種結(jié)論中無(wú)論做出何種結(jié)論,都有可能犯錯(cuò)誤。當(dāng)pw 時(shí),做出“拒絕其無(wú)差別的假設(shè),可認(rèn)為各總體間有差別”的結(jié)論時(shí)就有可能犯錯(cuò)誤,這類錯(cuò)誤稱為第一類錯(cuò)誤(i型錯(cuò)誤,type i error ),其犯錯(cuò)誤的概率用 表示,若 取,此時(shí)犯i型錯(cuò)誤的概率小于或等于,若假設(shè)檢驗(yàn)的p值比越小,犯一類錯(cuò)誤的概率就越小。當(dāng)p> 時(shí),做出“不拒絕其無(wú)差別的假設(shè),還不能認(rèn)為各總體間有差別”的結(jié)論時(shí),就有可能犯第二類錯(cuò)誤(h型錯(cuò)誤, type n error ),其犯錯(cuò)誤的概率用 表示,在通常 情況下犯n類錯(cuò)誤的概率未知, 雖然 是個(gè)未知數(shù),但假

44、設(shè)檢驗(yàn)p值越大,犯二類錯(cuò)誤的概 率就越小。表5假設(shè)檢驗(yàn)的兩類錯(cuò)誤表格5假設(shè)檢驗(yàn)結(jié)果真實(shí)情況拒絕h0不拒絕h0樣本來(lái)自同一總體:推斷不正確()推斷正確(1-)樣本來(lái)自不同總體推斷正確(1-)推斷不正確()3 .假設(shè)檢驗(yàn)的注意事項(xiàng)(1)假設(shè)檢驗(yàn)比較的對(duì)象是總體,而研究的方法是抽樣研究,即通過(guò)對(duì)樣本提供的信息去推斷總體間有無(wú)差別。 不能誤認(rèn)為假設(shè)檢驗(yàn)是樣本間的比較,更不能將此體現(xiàn)在結(jié)論中。如果研究方法是普查時(shí), 由于不存在抽樣誤差, 也不存在用樣本提供的信息去推斷總體的問(wèn) 題。因此,在這種情況下也就不能使用假設(shè)檢驗(yàn)的統(tǒng)計(jì)方法。(2)當(dāng)pw 時(shí),概率(p)越小,越有理由拒絕無(wú)差別的假設(shè),即拒絕假設(shè)的可

45、信程度就越大,這時(shí)概率( p)越小,其結(jié)論的可靠性就越好。當(dāng)p> 時(shí),概率(p)越大,越有理由不拒絕無(wú)差別的假設(shè),即不拒絕無(wú)差別假設(shè)的可信程度就越大。這時(shí)概率(p)越大,其結(jié)論的可靠性就越好。因此,無(wú)論概率pw ,還是p> 時(shí),都不能說(shuō)明組間差別的大小。(3)假設(shè)檢驗(yàn)的結(jié)論不能絕對(duì)化。假設(shè)檢驗(yàn)的結(jié)論是根據(jù)概率(p)的大小得出的,事實(shí)上當(dāng)p< 時(shí),我們拒絕其無(wú)差別的假設(shè),可認(rèn)為各總體間有差別,但是,只要p工0,我們無(wú)法完全拒絕無(wú)差別的假設(shè),即不能肯定各總體間有差別:同理,當(dāng)p> 時(shí),我們不拒絕其無(wú)差別的假設(shè),還不能認(rèn)為各總體間有差別,但是,只要pm 1,我們無(wú)法完全接受無(wú)

46、差別的假設(shè),即不能肯定各總體間無(wú)差別。因此,在做出統(tǒng)計(jì)結(jié)論時(shí),要避免使用 絕對(duì)的或肯定的語(yǔ)句,如當(dāng) pw 時(shí),使用“拒絕假設(shè),可認(rèn)為各組間有差別”;而當(dāng)p> 時(shí),使用"不拒絕假設(shè),還不能認(rèn)為各組間有差別”的語(yǔ)言進(jìn)行描述。(4)假設(shè)檢驗(yàn)的方法與設(shè)計(jì)方案和分布特征有關(guān),如:兩組比較的方法有t檢驗(yàn)、u檢驗(yàn)、兩組秩和檢驗(yàn)、四格表和校正四格表的2檢驗(yàn)等,這些方法只能用于兩組比較,而不能用于多組的比較。 在實(shí)際工作中錯(cuò)誤地使用兩組比較的方法代替多組比較的情況 并不少見(jiàn),女口,三個(gè)均數(shù)比較用三個(gè) t檢驗(yàn)、四個(gè)均數(shù)比較用六個(gè)t檢驗(yàn)等。多組比較可用 方差分析、多組秩和檢驗(yàn)、行乘列2檢驗(yàn)等。t、u檢驗(yàn)和方差分

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論