統(tǒng)計學各種檢驗_第1頁
統(tǒng)計學各種檢驗_第2頁
統(tǒng)計學各種檢驗_第3頁
統(tǒng)計學各種檢驗_第4頁
統(tǒng)計學各種檢驗_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、u檢驗、t檢驗、F檢驗、X2檢驗 (轉(zhuǎn)) 來源: 李冠煒的日志 常用顯著性檢驗1.t檢驗適用于計量資料、正態(tài)分布、方差具有齊性的兩組間小樣本比較。包括配對資料間、樣本與均數(shù)間、兩樣本均數(shù)間比較三種,三者的計算公式不能混淆。2.t'檢驗應用條件與t檢驗大致相同,但t檢驗用于兩組間方差不齊時,t檢驗的計算公式實際上是方差不齊時t檢驗的校正公式。3.U檢驗應用條件與t檢驗基本一致,只是當大樣本時用U檢驗,而小樣本時則用t檢驗,t檢驗可以代替U檢驗。4.方差分析用于正態(tài)分布、方差齊性的多組間計量比較。常見的有單因素分組的多樣本均數(shù)比較及雙因素分組的多個樣本均數(shù)的比較,方差分析首先是比較各組間總

2、的差異,如總差異有顯著性,再進行組間的兩兩比較,組間比較用q檢驗或LST檢驗等。5.X2檢驗是計數(shù)資料主要的顯著性檢驗方法。用于兩個或多個百分比(率)的比較。常見以下幾種情況:四格表資料、配對資料、多于2行*2列資料及組內(nèi)分組X2檢驗。6.零反應檢驗用于計數(shù)資料。是當實驗組或?qū)φ战M中出現(xiàn)概率為0或100時,X2檢驗的一種特殊形式。屬于直接概率計算法。7.符號檢驗、秩和檢驗和Ridit檢驗三者均屬非參數(shù)統(tǒng)計方法,共同特點是簡便、快捷、實用??捎糜诟鞣N非正態(tài)分布的資料、未知分布資料及半定量資料的分析。其主要缺點是容易丟失數(shù)據(jù)中包含的信息。所以凡是正態(tài)分布或可通過數(shù)據(jù)轉(zhuǎn)換成正態(tài)分布者盡量不用這些方法

3、。8.Hotelling檢驗用于計量資料、正態(tài)分布、兩組間多項指標的綜合差異顯著性檢驗。 計量經(jīng)濟學檢驗方法討論計量經(jīng)濟學中的檢驗方法多種多樣,而且在不同的假設前提之下,使用的檢驗統(tǒng)計量不同,在這里我論述幾種比較常見的方法。在 討論不同的檢驗之前,我們必須知道為什么要檢驗,到底檢驗什么?如果這個問題都不知道,那么我覺得我們很荒謬或者說是很模式化。檢驗的含義是要確實因果關 系,計量經(jīng)濟學的核心是要說因果關系是怎么樣的。那么如果兩個東西之間沒有什么因果聯(lián)系,那么我們尋找的原因就不對。那么這樣的結(jié)果是沒有什么意義的,或 者說是意義不大的。那么檢驗對于我們確認結(jié)果非常的重要,也是評價我們的結(jié)

4、果是否擁有價值的關鍵因素。所以要做統(tǒng)計檢驗。t 檢驗,t檢驗主要是檢驗單個ols估計值或者說是參數(shù)估計值的顯著性,什么是顯著性?也就是給定一個容忍程度,一個我們可以犯錯誤的限度,錯誤分為兩 類:1、本來是錯的但是我們認為是對的。2、本來是對的我們認為是錯的。統(tǒng)計的檢驗主要是針對第一種錯誤而言的。一般的計量經(jīng)濟學中的這個容忍程度是 5%,也就是說可以容忍我們范第一類錯誤的概率是5%。這樣說不準確,但是比較好理解。t-stastic是類似標準正態(tài)化的正態(tài)分布兩一樣,也就是估計 值減去假設值除以估計值得標準差,一般假設值是0,這一點不難理解,如果是0 ,那么也就意味著沒有因果關系。這個t-stati

5、c在經(jīng)典假設之下服從t分布。t分布一般是和正態(tài)分布差不多,尤其是當樣本的量足夠大的時候,一般的經(jīng) 驗認為在樣本數(shù)量大于120的時候,就可以看成是正態(tài)分布的。F-statistc:F檢驗是屬于聯(lián)合檢驗比較重要的一種,主要的目的是用于對于一系列的原因的是否會產(chǎn)生結(jié)果這樣一個命題做出的檢驗。F統(tǒng)計量主要的產(chǎn)生來源是SSRSSTSSE三個量。但是這個檢驗有一個缺點是必須在經(jīng)典假設之下才能有效。LM 檢驗:這個檢驗的性質(zhì)和F檢驗的性質(zhì)是一樣的,都是檢驗聯(lián)合顯著性的,不同的是F統(tǒng)計量符合F分布,但是LM統(tǒng)計量服從卡方分布。卡方分布是正態(tài)分布的變 量的平方和,而F分布是卡方分布的商,并且分子和分布必須獨立,

6、這就是為什么F檢驗適用范圍受限的原因。LM=n*SSR、或者是LM=n-SSR。至于其他的White檢驗、Brusch-pagan檢驗(異方差的檢驗方法)、還有序列相關的t檢驗、DW檢驗基本原來是相同的。關于異方差檢驗、序列相關的檢驗其中存在不同的地方,但是思想基本是相同的。關于異方差檢驗的討論:1、Brusch-pagan檢驗:這個檢驗的思路比較簡單,主要是要研究殘查和X之間的關系,給定這樣的一個方程:u=b0+b1*x1+bn*xn+u'的回歸,其中進行F檢驗和LM檢驗。如果檢驗通過那么不存在異方差,如果不通過那么存在異方差。2、 White檢驗:這個檢驗也是對異方差的檢驗,但是這

7、個檢驗不同的是不僅對于X的一次方進行回歸,而且考慮到殘查和x的平方還有Xi*Xj之間的關系。給 定如下方程:u=b0+b1*y+b2*y2+u'。也是用F和LM聯(lián)合檢驗來檢驗顯著性。如果通過那么不存在異方差,否則存在。序列相關的檢驗方法的討論:對 于時間序列的問需要知道一個東西,也就是一介自回歸過程,也就是一般在教科書中說到的:AR(1)過程,其中的道理主要是說在當期的變量主要是取決于過去 一個時期的變量和一個隨機誤差項。表示如下:Ut=p*U(t-1)+et。在這里我要說到幾個概念問題,I(1)(一階積整)、I(0)(零階積整)。 其中的一介自回歸過程AR(1)就屬于零階積整過程,而

8、一階積整過程實際上是隨機游動和飄移的隨機游動過程。隨機游動過程:Ut=U(t-1)+et。也 就是在AR(1)的過程之下,其中的P是等于1的。飄移的隨機游動過程:Ut=a+U(t-1)+et。其中隨機游動過程和AR(1)過程中的不同點在于 一個弱相依性的強弱問題,實際上我們在時間序列問題中,我們可以認為任何一個過程是弱相依的,但是問題的關鍵是我們不知道到底有多弱?或者更加直觀地說, 我們想知道P到底是多大,如果P是0.9或者是一個比較接近于1得數(shù),那么可能我們可以認為這個時間序列有高度持久性,這個概念表示當期的變量卻絕于一個 很早的時期的變量,比如一階積整過程,實際上et是一個獨立統(tǒng)分布的變量

9、,而且條件數(shù)學期望等于0,沒有異方差性。那么實際上這個序列的數(shù)學期望是和期數(shù) 沒有什么關系的。那么也就意味著從第0期開始,U的數(shù)學期望值就是和很久以后的U的數(shù)學期望值一樣的。但是方差就不同了,方差隨著時間的增加不斷擴大。我 們知道了,這種不同的概念就可以討論在一階自回歸的條件之下的檢驗問題,但是我們說一介自回歸的過程是參差序列的特征而已,其他的變量的特征問題我們不 談。在討論檢驗的問題以前,我有必要交待一下時間序列在ols估計的時候我們應該注意什么。實際上解決序列自相關問題最主要的問題就是一個差分的方法。因為如果是長期持久的序列或者是不是長期持久的序列,那么一定的差分就可以解除這種問題。1、

10、t檢驗。如果我們知道這個變量是一個一介自回歸的過程,如果我們知道自回歸過程是AR(1)的。那么我們就可以這樣作,首先我們做OLS估計,得到的參差 序列我們認為是一階自相關的。那么為了驗證這種情況,那么我們可以做Ut和U(t-1)的回歸,當然這里可以包含一個截距項。那么我們驗證其中的參數(shù)的估 計是不是顯著的,就用t檢驗。  t檢驗與F檢驗有什么區(qū)別 1.檢驗有單樣本t檢驗,配對t檢驗和兩樣本t檢驗。單樣本t檢驗:是用樣本均數(shù)代表的未知總體均數(shù)和已知總體均數(shù)進行比較,來觀察此組樣本與總體的差異性。配對t檢驗:是采用配對設計方法觀察以下幾種情形,1,兩個同質(zhì)受試對象分別

11、接受兩種不同的處理;2,同一受試對象接受兩種不同的處理;3,同一受試對象處理前后。F 檢驗又叫方差齊性檢驗。在兩樣本t檢驗中要用到F檢驗。從兩研究總體中隨機抽取樣本,要對這兩個樣本進行比較的時候,首先要判斷兩總體方差是否相同,即方 差齊性。若兩總體方差相等,則直接用t檢驗,若不等,可采用t'檢驗或變量變換或秩和檢驗等方法。其中要判斷兩總體方差是否相等,就可以用F檢驗。2.t檢驗和方差分析的前提條件及應用誤區(qū)用于比較均值的t檢驗可以分成三類,第一類是針對單組設計定量資料的;第二類是針對配對設計定量資料的;第三類則是針對成組設計定量資料的。后兩種設計類型的區(qū)別在于事先是否將兩組研究對象按照

12、某一個或幾個方面的特征相似配成對子。無論哪種類型的t檢驗,都必須在滿足特定的前提條件下應用才是合理的。若是單組設計,必須給出一個標準值或總體均值,同時,提供一組定量的觀測結(jié)果,應用t檢驗的前提條件就是該組資料必須服從正態(tài)分布;若是配對設計,每對數(shù)據(jù)的差值必須服從正態(tài)分布;若是成組設計,個體之間相互獨立,兩組資料均取自正態(tài)分布的總體,并滿足方差齊性。之所以需要這些前提條件,是因為必須在這樣的前提下所計算出的t統(tǒng)計量才服從t分布,而t檢驗正是以t分布作為其理論依據(jù)的檢驗方法。值得注意的是,方差分析與成組設計t檢驗的前提條件是相同的,即正態(tài)性和方差齊性。t 檢驗是目前醫(yī)學研究中使用頻率最高,醫(yī)學論文

13、中最常見到的處理定量資料的假設檢驗方法。t檢驗得到如此廣泛的應用,究其原因,不外乎以下幾點:現(xiàn)有的醫(yī)學 期刊多在統(tǒng)計學方面作出了要求,研究結(jié)論需要統(tǒng)計學支持;傳統(tǒng)的醫(yī)學統(tǒng)計教學都把t檢驗作為假設檢驗的入門方法進行介紹,使之成為廣大醫(yī)學研究人員最熟悉 的方法;t檢驗方法簡單,其結(jié)果便于解釋。簡單、熟悉加上外界的要求,促成了t檢驗的流行。但是,由于某些人對該方法理解得不全面,導致在應用過程中出現(xiàn) 不少問題,有些甚至是非常嚴重的錯誤,直接影響到結(jié)論的可靠性。將這些問題歸類,可大致概括為以下兩種情況:不考慮t檢驗的應用前提,對兩組的比較一律用t檢驗;將各種實驗設計類型一律視為多個單因素兩水平設計,多次

14、用t檢驗進行均值之間的兩兩比較。以上兩種情況,均不同程度地增加了得出錯誤結(jié)論的風險。而且,在實驗因素的個數(shù)大于等于2時,無法研究實驗因素之間的交互作用的大小。  u檢驗和t檢驗區(qū)別與聯(lián)系 u 檢驗和t檢驗可用于樣本均數(shù)與總體均數(shù)的比較以及兩樣本均數(shù)的比較。理論上要求樣本來自正態(tài)分布總體。但在實用時,只要樣本例數(shù)n較大,或n小但總體標準 差已知時,就可應用u檢驗;n小且總體標準差未知時,可應用t檢驗,但要求樣本來自正態(tài)分布總體。兩樣本均數(shù)比較時還要求兩總體方差相等。一、樣本均數(shù)與總體均數(shù)比較比較的目的是推斷樣本所代表的未知總體均數(shù)與已知總體均數(shù)0有無差別。通常把理論

15、值、標準值或經(jīng)大量調(diào)查所得的穩(wěn)定值作為0.根據(jù)樣本例數(shù)n大小和總體標準差是否已知選用u檢驗或t 檢驗。(一)u檢驗用于已知或未知但n足夠大用樣本標準差s作為的估計值,代入式(19.6)時。以算得的統(tǒng)計量u,按表19-3所示關系作判斷。表19-3 u值、P值與統(tǒng)計結(jié)論t值P值統(tǒng)計結(jié)論0.05雙側(cè)單側(cè)1.961.6450.05不拒絕H0,差別無統(tǒng)計學意義0.05雙側(cè)單側(cè)1.961.6450.05拒絕H0,接受H1,差別有統(tǒng)計學意義0.01雙側(cè)單側(cè)2.582.330.01拒絕H0,接受H1,差別有高度統(tǒng)計學意義例19.3根據(jù)大量調(diào)查,已知健康成年男子脈搏均數(shù)為72次/分,標準差為6.0次/分。某醫(yī)生

16、在山區(qū)隨機抽查25名健康成年男子,求得其脈搏均數(shù)為74.2次/分,能否據(jù)此認為山區(qū)成年男子的脈搏高于一般?據(jù)題意,可把大量調(diào)查所得的均數(shù)72次/分與標準差6.0次/分看作為總體均數(shù)0和總體標準差,樣本均數(shù)x為74.2次/分,樣本例數(shù)n為25.H0: =0H1: 0=0.05(單側(cè)檢驗)算得的統(tǒng)計量u=1.8331.645,P0.05,按=0.05檢驗水準拒絕H0,可認為該山區(qū)健康成年男子的脈搏高于一般。(二)t檢驗用于未知且n較小時。以算得的統(tǒng)計量t,按表19-4所示關系作判斷。表19-4 t值、P值與統(tǒng)計結(jié)論t值P值統(tǒng)計結(jié)論0.05t0.05(v)0.05不拒絕H0,差別無統(tǒng)計學意義0.05

17、t0.05(v)0.05拒絕H0,接受H1,差別有統(tǒng)計學意義0.01t0.01(v)0.01拒絕H0,接受H1,差別有高度統(tǒng)計學意義例19.4 若例19.3中總體標準差未知,但樣本標準差已求出,s=6.5次/分,余數(shù)據(jù)同例19.3.據(jù)題意,與例19.3不同之處在于未知,可用t檢驗。H0: =0H1: 0=0.05(單側(cè)檢驗)本例自由度v=25-1=24,查t界值表(單側(cè))(附表19-1)得t0.05(24)=1.711.算得的統(tǒng)計量t=1.6921.711,P0.05,按=0.05檢驗水準不拒絕H0,尚不能認為該山區(qū)成年男子的脈搏高于一般。二、配對資料的比較在 醫(yī)學研究中,常用配對設計。配對設

18、計主要有四種情況:同一受試對象處理前后的數(shù)據(jù);同一受試對象兩個部位的數(shù)據(jù);同一樣品用兩種方法(儀器等)檢驗 的結(jié)果;配對的兩個受試對象分別接受兩種處理后的數(shù)據(jù)。情況的目的是推斷其處理有無作用;情況、的目的是推斷兩種處理(方法等)的結(jié)果有無差 別。公式(19.8)式中,0為差數(shù)年總體均數(shù),因為假設處理前后或兩法無差別,則其差數(shù)的均數(shù)應為0,d為一組成對數(shù)據(jù)之差d(簡稱差數(shù))的均數(shù),其計算公式同式(18.1);Sd為差數(shù)均數(shù)的標準誤,sd為差數(shù)年的標準差,計算公式同式(18.3);n為對子數(shù)。因計算的統(tǒng)計量是t,按表19-4所示關系作判斷。例19.5 應用某藥治療9例高血壓病人,治療前后舒張壓如表

19、19-5,試問用藥前后舒張壓有無變化?表19-5 高血壓病人用某藥治療前后的舒張壓(kPa)病人編號治療前治療后差數(shù)dD2112.811.71.01.21213.113.10.00.00314.914.40.50.25414.413.60.80.64513.613.10.50.25613.113.3-0.20.04713.312.80.50.25814.113.60.50.25913.312.31.01.00合計4.73.89H0:該藥治療前后的舒張壓無變化,即d=0H1:該藥治療前后的舒張壓有變化,即d0=0.05自由度v=n-1=8,查t界值表得t0.05(8)=2.306,t0.01(8

20、)=3.355,本例t=3.714t0.01(8),P0.01,按=0.05檢驗水準拒絕H0,接受H1,可認為治療前后舒張壓有變化,即該藥有降壓作用。三、完全隨機設計的兩樣本均數(shù)的比較亦稱成組比較。目的是推斷兩樣本各自代表的總體均數(shù)1與2是否相等。根據(jù)樣本含量n的大小,分u檢驗與t檢驗。(一)u檢驗可用于兩樣本含量n1、n2、均足夠大時,如均大于50或100.公式(19.9)算得的統(tǒng)計量為u 值,按表19-3所示關系作出判斷。例19.6某地抽樣調(diào)查了部分健康成人紅細胞數(shù),其中男性360人,均數(shù)為4.660×1012/L,標準差為0.575×1012/L;女性255人,均數(shù)為

21、4.178×1012/L,標準差為0.291×1012/L,試問該地男、女紅細胞數(shù)的均數(shù)有無差別?H0: =0H1: 0=0.05今x1=4.660×1012/L,s1=0.575×1012/L,n1=360;x2=4.1781012/L,s2=0.2911012/L,n2=255.算得的u=13.632.58,P0.01,按 =0.05檢驗水準拒絕H0,接受H1,可認為該地男女紅細胞數(shù)的均數(shù)不同,男性高于女性。(二)t檢驗可用于兩樣本含量n1、n2較小時,且要求兩總體方差相等,即方差齊(homoscedasticity)。若被檢驗的兩樣本方差相差較大且

22、差別有統(tǒng)計學意義則需用t檢驗。公式(19.10)公式(19.11)公式(19.12)式中sx1x2,為兩樣本均數(shù)之差的標準誤,s2c為合并估計方差(combined estimate variance)。算得的統(tǒng)計量為t,按表19-4所示關系作出判斷。例19.7某醫(yī)生統(tǒng)廣西瑤族和侗族正常婦女骨盆X線測量資料各50例。骨盆入口前后徑:瑤族的均數(shù)為12.002(cm),標準差0.948(cm),侗族相應的為11.456(cm)和1.215(cm)。問兩族婦女的骨盆入口前后徑是否有差別?H0: 1=2H1: 12=0.05已知n1=n2=50, x1=12.002(cm),s1=0.948(cm);

23、x2=11.456(cm),s2=1.215(cm)。本 例自由度v =n1+n2-2=98,查t界值表表內(nèi)自由度一欄無98,可用內(nèi)插法(從略)或用v =100估計.T0.05(100)=1948,t0.01(100)=2.626,今t=2.505t0.05(1000,P0.05,按 =0.05檢驗水準拒絕H0,接受H1,可認為廣西瑤族和侗族婦女骨盆入口前后徑不同,前者大于后者。四、完全隨機設計的兩樣本幾何均數(shù)比較醫(yī)學上有些資料為等比資料或正態(tài)分布資料,宜用幾何均數(shù)表示其平均水平。比較兩樣本幾何均數(shù)的目的是推斷它們分別代表的總體幾何均數(shù)是否相等。此種情況下,應先把原始數(shù)據(jù)X進行對數(shù)變換,用變換

24、后的數(shù)據(jù)代入式(19.10)、(19.11)、(19.12)計算t值。例19.8 將20名鉤端螺旋體病人的血清隨機分為兩組,分別用標準株或水生株作凝溶試驗,測得稀釋倍數(shù)如下,問兩組的平均效價有無差別?X1:標準株(11人)100,200,400,400,400,400,800,1600,1600,1600,3200X2:水生珠(9人)100,100,100,200,200,200,200,400,400H0: 1=2H1: 12=0.05將兩組數(shù)據(jù)分別取對數(shù),以對數(shù)作為新變量X1和X2.X1:2.000,2.301,2.602,2.602,2.602,2.602,2.903,3.204,3.2

25、04,3.204,3.505X2: 2.000,2.000,2.000,2.301,2.301,2.301,2.301,2.602,2.602用變換后的數(shù)據(jù)計算 x1,s12;x2,s22再代入式(19.10)、(19.11)、(19.12)計算t值。x1=2.794,s12=0.2043;x2=2.268,s22=0.0554自由度v=11+9-2=18,查t界值表得t0.01(18)=2.878,今t=3.1502.878,P0.01,按=0.05檢驗水準拒絕H0,接受H1,可認為兩組平均效價不同,標準株高于水生株。   方差分析與兩樣本T檢驗區(qū)別方差分析與兩

26、樣本T檢驗。1。首先可以看到方差分析(ANOVA)包含兩樣本T檢驗,把兩樣本T檢驗作為自己的特例。因為ANOVA可以比較多個總體的均值,當然包含兩個總體作為特例。實際上,T的平方就是F統(tǒng)計量(m個自由度的T分布之平方恰為自由度為(1,m)的F 分布。因此,這時候二者檢驗效果完全相同。T 檢驗和 ANOVA 檢驗對于所要求的條件也相同:1)各個組的樣本數(shù)據(jù)內(nèi)部要相互獨立,2)各組皆要正態(tài)分布3)各總體的方差相等。上述這3個條件完全相同。2。如果說要指出差別,則區(qū)別僅在下列一點上:用ANOVA檢驗兩總體均值相等性時,只限于這樣的雙側(cè)檢驗問題,即:H0:mu1=MU2 <-> Ha:mu

27、1 not= mu2而兩樣本的T檢驗則可以比上述情況更廣泛,對立假設可以是下面3種中的任何一種.Ha:mu1 > mu2Ha:mu1 < mu2Ha:mu1 not= mu2這樣說來,兩樣本均值相等性檢驗雖然可以用ANOVA做, 但這沒有任何好處,反而使得對立假設受到限制,因而還是T檢驗更好。其他表述:t檢驗與方差分析,主要差異在于,t檢驗一般使用在單樣本或雙樣本的檢驗,方差分析用于2個樣本以上的總體均值的檢驗.同樣,雙樣本也可以使用方差分析, 多樣本也可以使用t檢驗,不過,t檢驗只能是所有總體兩兩檢驗而已.兩 種方法與樣本量沒有直接關系,而是與數(shù)據(jù)的分布有關系,如果數(shù)據(jù)是正態(tài)分布

28、的,那不管是小樣本或大樣本,利用萊維-林德伯格中心極限定理的原理,都是可以 用的,如果數(shù)據(jù)非正態(tài)分布,那只能使用大樣本利用李雅普諾夫中心極限定理的原理進行2t檢驗,此時不能利用方差分析,因為方差分析三個條件之一就是正態(tài)分 布. T 檢驗及其與方差分析的區(qū)別假設檢驗是通過兩組或多組的樣本統(tǒng)計量的差別或樣本統(tǒng)計量與總體參數(shù)的差異來推斷他們相應的總體參數(shù)是否相同。 t 檢驗:1.單因素設計的小樣本(n50)計量資料2.樣本來自正態(tài)分布總體3.總體標準差未知4.兩樣本均數(shù)比較時,要求兩樣本相應的總體方差相等 根據(jù)研究設計t檢驗可由三種形式: 單個樣本的

29、t檢驗 配對樣本均數(shù)t檢驗(非獨立兩樣本均數(shù)t檢驗) 兩個獨立樣本均數(shù)t檢驗(1)單個樣本t檢驗 又稱單樣本均數(shù)t檢驗(one sample t test),適用于樣本均數(shù)與已知總體均數(shù)0的比較,其比較目的是檢驗樣本均數(shù)所代表的總體均數(shù)是否與已知總體均數(shù)0有差別。 已知總體均數(shù)0一般為標準值、理論值或經(jīng)大量觀察得到的較穩(wěn)定的指標值。 單樣t檢驗的應用條件是總體標準s未知的小樣本資料( 如n<50),且服從正態(tài)分布。(2)配對樣本均數(shù)t檢驗 配對樣本均數(shù)t檢驗簡稱配對t檢驗(paired t 

30、;test),又稱非獨立兩樣本均數(shù)t檢驗,適用于配對設計計量資料均數(shù)的比較,其比較目的是檢驗兩相關樣本均數(shù)所代表的未知總體均數(shù)是否有差別。 配對設計(paired design)是將受試對象按某些重要特征相近的原則配成對子,每對中的兩個個體隨機地給予兩種處理。 應用配對設計可以減少實驗的誤差和控制非處理因素,提高統(tǒng)計處理的效率。 配對設計處理分配方式主要有三種情況:兩個同質(zhì)受試對象分別接受兩種處理,如把同窩、同性別和體重相近的動物配成一對,或把同性別和年齡相近的相同病情病人配成一對;同一受試對象或同一標本的兩個部分,隨機分配接受兩種不同處理,如例5.2資料;自身對

31、比(self-contrast)。即將同一受試對象處理(實驗或治療)前后的結(jié)果進行比較,如對高血壓患者治療前后、運動員體育運動前后的某一生理指標進行比較。(3)兩獨立樣本t檢驗兩獨立樣本t 檢驗(two independent samples t-test),又稱成組 t 檢驗。 適用于完全隨機設計的兩樣本均數(shù)的比較,其目的是檢驗兩樣本所來自總體的均數(shù)是否相等。 完全隨機設計是將受試對象隨機地分配到兩組中,每組對象分別接受不同的處理,分析比較處理的效應?;蚍謩e從不同總體中隨機抽樣進行研究。 兩獨立樣本t檢驗要求兩樣本所代表的

32、總體服從正態(tài)分布N(1,12)和N(2,22),且兩總體方差12、22相等,即方差齊性(homogeneity of variance, homoscedasticity)。 若兩總體方差不等,即方差不齊,可采用t檢驗,或進行變量變換,或用秩和檢驗方法處理。t 檢驗中的注意事項1. 假 設檢驗結(jié)論正確的前提 作假設檢驗用的樣本資料,必須能代表相應的總體,同時各對比組具有良好的組間均衡性,才能得出有意義的統(tǒng)計結(jié)論和有價值的專業(yè)結(jié) 論。這要求有嚴密的實驗設計和抽樣設計,如樣本是從同質(zhì)總體中抽取的一個隨機樣本,試驗單位在干預前隨機分組,有足夠的樣本量等。2.&

33、#160;檢驗方法的選用及其適用條件,應根據(jù)分析目的、研究設計、資料類型、樣本量大小等選用適當?shù)臋z驗方法。 t 檢驗是以正態(tài)分布為基礎的,資料的正態(tài)性可用正態(tài)性檢驗方法檢驗予以判斷。若資料為非正態(tài)分布,可采用數(shù)據(jù)變換的方法,嘗試將資料變換成正態(tài)分布資料后進行分析。3. 雙側(cè)檢驗與單側(cè)檢驗的選擇 需根據(jù)研究目的和專業(yè)知識予以選擇。單側(cè)檢驗和雙側(cè)檢驗中的t值計算過程相同,只是t界值不同,對同一資料作單側(cè)檢驗更容易獲得顯著的結(jié)果。單雙側(cè)檢驗的選擇,應在統(tǒng)計分析工作開始之前就決定,若缺乏這方面的依據(jù),一般應選用雙側(cè)檢驗。4. 假設檢驗的結(jié)論不能絕對化&

34、#160;假設檢驗統(tǒng)計結(jié)論的正確性是以概率作保證的,作統(tǒng)計結(jié)論時不能絕對化。在報告結(jié)論時,最好列出概率 P 的確切數(shù)值或給出P值的范圍,如寫成0.02<P<0.05,同時應注明采用的是單側(cè)檢驗還是雙側(cè)檢驗,以便讀者與同類研究進行比較。當 P接近臨界值時,下結(jié)論應慎重。5正確理解P值的統(tǒng)計意義 P 是指在無效假設 H0 的總體中進行隨機抽樣,所觀察到的等于或大于現(xiàn)有統(tǒng)計量值的概率。其推斷的基礎是小概率事件的原理,即概率很小的事件在一次抽樣研究中幾乎是不可能發(fā)生的,如發(fā)生則拒絕H0。因此,只能說明統(tǒng)計學意義的“顯著” 。6假設

35、檢驗和可信區(qū)間的關系 假設檢驗用以推斷總體均數(shù)間是否相同,而可信區(qū)間則用于估計總體均數(shù)所在的范圍,兩者既有聯(lián)系又有區(qū)別。 T檢驗屬于均值分析,它是用來檢驗兩類母體均值是否相等。均值分析是來考察不同樣本之間是否存在差異,而方差分析則是評估不同樣本之間的差異是否由某個因素起主要作用。 T檢驗及其與方差分析的區(qū)別 假設檢驗是通過兩組或多組的樣本統(tǒng)計量的差別或樣本統(tǒng)計量與總體參數(shù)的差異來推斷他們相應的總體參數(shù)是否相同。 t 檢驗:1.單因素設計的小樣本(n50)計量資料2.樣本來自正態(tài)分布總體3.總體標準差未知4.兩樣本均數(shù)比較時,要求兩樣本

36、相應的總體方差相等 根據(jù)研究設計t檢驗可由三種形式: 單個樣本的t檢驗 配對樣本均數(shù)t檢驗(非獨立兩樣本均數(shù)t檢驗) 兩個獨立樣本均數(shù)t檢驗(1)單個樣本t檢驗 又稱單樣本均數(shù)t檢驗(one sample t test),適用于樣本均數(shù)與已知總體均數(shù)0的比較,其比較目的是檢驗樣本均數(shù)所代表的總體均數(shù)是否與已知總體均數(shù)0有差別。 已知總體均數(shù)0一般為標準值、理論值或經(jīng)大量觀察得到的較穩(wěn)定的指標值。 單樣t檢驗的應用條件是總體標準s未知的小樣本資料( 如n<50),且服從正態(tài)分布。(2)配對樣本均數(shù)t檢

37、驗 配對樣本均數(shù)t檢驗簡稱配對t檢驗(paired t test),又稱非獨立兩樣本均數(shù)t檢驗,適用于配對設計計量資料均數(shù)的比較,其比較目的是檢驗兩相關樣本均數(shù)所代表的未知總體均數(shù)是否有差別。 配對設計(paired design)是將受試對象按某些重要特征相近的原則配成對子,每對中的兩個個體隨機地給予兩種處理。 應用配對設計可以減少實驗的誤差和控制非處理因素,提高統(tǒng)計處理的效率。 配對設計處理分配方式主要有三種情況:兩個同質(zhì)受試對象分別接受兩種處理,如把同窩、同性別和體重相近的動物配成一對,或把同性別和年齡相近的相同病情病人配成一對

38、;同一受試對象或同一標本的兩個部分,隨機分配接受兩種不同處理,如例5.2資料;自身對比(self-contrast)。即將同一受試對象處理(實驗或治療)前后的結(jié)果進行比較,如對高血壓患者治療前后、運動員體育運動前后的某一生理指標進行比較。(3)兩獨立樣本t檢驗兩獨立樣本t 檢驗(two independent samples t-test),又稱成組 t 檢驗。 適用于完全隨機設計的兩樣本均數(shù)的比較,其目的是檢驗兩樣本所來自總體的均數(shù)是否相等。 完全隨機設計是將受試對象隨機地分配到兩組中,每組對象分別接受不同的處理,分析比較處理的效應

39、?;蚍謩e從不同總體中隨機抽樣進行研究。 兩獨立樣本t檢驗要求兩樣本所代表的總體服從正態(tài)分布N(1,12)和N(2,22),且兩總體方差12、22相等,即方差齊性(homogeneity of variance, homoscedasticity)。 若兩總體方差不等,即方差不齊,可采用t檢驗,或進行變量變換,或用秩和檢驗方法處理。t 檢驗中的注意事項1. 假 設檢驗結(jié)論正確的前提 作假設檢驗用的樣本資料,必須能代表相應的總體,同時各對比組具有良好的組間均衡性,才能得出有意義的統(tǒng)計結(jié)論和有價值的專業(yè)結(jié) 論。這要求有嚴密的實驗設計和抽樣設計,如樣本

40、是從同質(zhì)總體中抽取的一個隨機樣本,試驗單位在干預前隨機分組,有足夠的樣本量等。2. 檢驗方法的選用及其適用條件,應根據(jù)分析目的、研究設計、資料類型、樣本量大小等選用適當?shù)臋z驗方法。 t 檢驗是以正態(tài)分布為基礎的,資料的正態(tài)性可用正態(tài)性檢驗方法檢驗予以判斷。若資料為非正態(tài)分布,可采用數(shù)據(jù)變換的方法,嘗試將資料變換成正態(tài)分布資料后進行分析。3. 雙側(cè)檢驗與單側(cè)檢驗的選擇 需根據(jù)研究目的和專業(yè)知識予以選擇。單側(cè)檢驗和雙側(cè)檢驗中的t值計算過程相同,只是t界值不同,對同一資料作單側(cè)檢驗更容易獲得顯著的結(jié)果。單雙側(cè)檢驗的選擇,應在統(tǒng)計分析工作開始之前就決定

41、,若缺乏這方面的依據(jù),一般應選用雙側(cè)檢驗。4. 假設檢驗的結(jié)論不能絕對化 假設檢驗統(tǒng)計結(jié)論的正確性是以概率作保證的,作統(tǒng)計結(jié)論時不能絕對化。在報告結(jié)論時,最好列出概率 P 的確切數(shù)值或給出P值的范圍,如寫成0.02<P<0.05,同時應注明采用的是單側(cè)檢驗還是雙側(cè)檢驗,以便讀者與同類研究進行比較。當 P接近臨界值時,下結(jié)論應慎重。5正確理解P值的統(tǒng)計意義 P 是指在無效假設 H0 的總體中進行隨機抽樣,所觀察到的等于或大于現(xiàn)有統(tǒng)計量值的概率。其推斷的基礎是小概率事件的原理,即概率很小的事件在一次抽樣研究

42、中幾乎是不可能發(fā)生的,如發(fā)生則拒絕H0。因此,只能說明統(tǒng)計學意義的“顯著” 。6假設檢驗和可信區(qū)間的關系 假設檢驗用以推斷總體均數(shù)間是否相同,而可信區(qū)間則用于估計總體均數(shù)所在的范圍,兩者既有聯(lián)系又有區(qū)別。 T檢驗屬于均值分析,它是用來檢驗兩類母體均值是否相等。均值分析是來考察不同樣本之間是否存在差異,而方差分析則是評估不同樣本之間的差異是否由某個因素起主要作用。  t檢驗:是假設檢驗的一種常用方法,當方差未知時,可以用來檢驗一個正態(tài)總體或兩個正態(tài)總體的均值檢驗假設問題,也可以用來檢驗成對數(shù)據(jù)的均值假設問題。具體內(nèi)容可以參考概率論與數(shù)理統(tǒng)計??梢杂脕砼袛鄡?/p>

43、組數(shù)倨差異是否有顯著意義,也就是結(jié)果有沒有統(tǒng)計學意義。 方差分析:它是處理實驗研究資料時重要的分析方法之一,代表數(shù)據(jù)是否具有統(tǒng)計意義,一般一組數(shù)據(jù)代表某個條件或因素,方差分析可以判斷你選取的這個因素是否有意義,是不是影響因素如果你做統(tǒng)計為了找到事物相關性,而方差結(jié)果顯示數(shù)據(jù)無統(tǒng)計學差異,很可能代表實驗失敗或設計有問題在 對均值進行假設檢驗時,一般有兩種參數(shù)檢驗方法,即t檢驗與方差分析。t檢驗僅用在單因素兩水平設計(包括配對設計和成組設計)和單組設計(給出一組數(shù)據(jù) 和一個標準值的資料)的定量資料的均值檢驗場合;而方差分析用在單因素k水平設計(k3)和多因素設計的定量資料的均值檢驗場合。

44、應當進一步說明的是, 方差分析有十幾種,不同的方差分析取決于不同的設計類型。很多人習慣于用t檢驗取代一切方差分析。不能用t檢驗取代方差分析的情況單因素k(k3)水平設計時的情形。為了便于理解,舉例說明。實例研究單味中藥對小鼠細胞免疫機能的影響,把40只小鼠隨機均分為4組,每組10只,雌雄各半,用藥15d后測定E-玫瑰結(jié)成率(%),結(jié)果如下,試比較各組總體均值之間的差別有無顯著性意義?對照組: 14 10 12 16 13 14 12 10 13 9黨參組: 21 24 18 17 22 19 18 23 20 18黃芪組: 24 20 22 18 17 21 18 22 19 23淫羊藿組:

45、35 27 23 29 31 40 35 30 28 36處 理本例資料,通常人們錯誤的做法是,重復運用成組設計資料的t檢驗對4個組的均值進行6次兩兩比較;而正確的做法是,先進行單因素4水平設計資料的方差分 析,若4個總體均值之間的差別有顯著性意義,再用q檢驗等方法進行多個均值之間的兩兩比較。下面將從多個方面來說明上述兩種分析方法之間的差異(表1)。表1 用t檢驗與方差分析處理實例資料的區(qū)別比較的內(nèi)容 資料的利用率 對原實驗設計的影響 犯假陽性錯誤的概率結(jié)論的可靠性t檢驗 低: 每次僅用兩組 殘:割裂了整體設計 大:1-(1-0.05)6 = 0.265 低:統(tǒng)計量的自由度小(=18)方差分析

46、加q檢驗 高:每次要用全部數(shù)據(jù) 全:與原實驗設計相呼應 小:0.05(假定=0.05)高:統(tǒng)計量的自由度大(=36)注:自由度大,所對應的統(tǒng)計量的可靠性就高,它相當于“權(quán)重”,也類似于產(chǎn)生“代表”的基數(shù),基數(shù)越大,所選出的“代表”就越具有權(quán)威性。多因素設計時的情形。為了便于理解,仍舉例說明(表2)。表2 注射氯化鋰或煙堿后不同時間大鼠體溫的下降值使用氯化鋰與否 使用煙堿與否 第二次注射后不同時間體溫下降值(攝氏度)0.7 1.5 3 5- - 0.0±0.4 0.2±0.5 0.1±0.4 0.3±0.5+ - 0.7±0.5 0.1±

47、;0.5 0.1±0.6 0.2±0.5- + 1.2±0.8 0.1±0.6 0.4±0.5 0.4±0.3+ + 1.7±0.6 0.7±0.6 0.3±0.6 0.1±0.5顯 然,表2中涉及到的3個實驗因素(即”使用氯化鋰與否”、“使用煙堿與否”、“藥物在體內(nèi)作用時間”)。這些因素之間一般都存在不同程度的交互作用,應當 選用與設計類型(本例為具有一個重復測量的三因素設計)相對應的方差分析方法。然而,對于處置復雜的實驗設計問題,人們常犯的錯誤是在;其一,將多因素各 水平的不同組合(本例中共

48、有16種不同的組合,相當于16種不同的實驗條件)、簡單地看作單因素的多個水平(即視為單因素16水平),混淆了因素與水平之 間的區(qū)別,從而錯誤地確定了實驗設計類型;其二,分析資料時,常錯誤用單因素多水平設計或仍采用多次t檢驗進行兩兩比較。誤用這兩種方法的后果是,不僅無 法分析因素之間的交互作用的大小,而且,由于所選用的數(shù)學模型與設計不匹配,易得出錯誤的結(jié)論。 答:t 檢驗適用于兩個變量均數(shù)間的差異檢驗,多于兩個變量間的均數(shù)比較要用方差分析。用于比較均值的t檢驗可以分成三類,第一類是針對單組設計定量資料的;第二 類是針對配對設計定量資料的;第三類則是針對成組設計定量資料的。后兩種設計類型

49、的區(qū)別在于事先是否將兩組研究對象按照某一個或幾個方面的特征相似配成對 子。無論哪種類型的t檢驗,都必須在滿足特定的前提條件下應用才是合理的。若是單組設計,必須給出一個標準值或總體均值,同時,提供一組定量的觀測結(jié) 果,應用t檢驗的前提條件就是該組資料必須服從正態(tài)分布;若是配對設計,每對數(shù)據(jù)的差值必須服從正態(tài)分布;若是成組設計,個體之間相互獨立,兩組資料均取 自正態(tài)分布的總體,并滿足方差齊性。之所以需要這些前提條件,是因為必須在這樣的前提下所計算出的t統(tǒng)計量才服從t分布,而t檢驗正是以t分布作為其理論 依據(jù)的檢驗方法。值得注意的是,方差分析與成組設計t檢驗的前提條件是相同的,即正態(tài)性和方差齊性。t

50、檢驗是目前醫(yī)學研究中使用頻率最高,醫(yī)學論 文中最常見到的處理定量資料的假設檢驗方法。t檢驗得到如此廣泛的應用,究其原因,不外乎以下幾點:現(xiàn)有的醫(yī)學期刊多在統(tǒng)計學方面作出了要求,研究結(jié)論需 要統(tǒng)計學支持;傳統(tǒng)的醫(yī)學統(tǒng)計教學都把t檢驗作為假設檢驗的入門方法進行介紹,使之成為廣大醫(yī)學研究人員最熟悉的方法;t檢驗方法簡單,其結(jié)果便于解釋。 簡單、熟悉加上外界的要求,促成了t檢驗的流行。但是,由于某些人對該方法理解得不全面,導致在應用過程中出現(xiàn)不少問題,有些甚至是非常嚴重的錯誤,直接 影響到結(jié)論的可靠性。將這些問題歸類,可大致概括為以下兩種情況:不考慮t檢驗的應用前提,對兩組的比較一律用t檢驗;將各種實

51、驗設計類型一律視為多個單 因素兩水平設計,多次用t檢驗進行均值之間的兩兩比較。以上兩種情況,均不同程度地增加了得出錯誤結(jié)論的風險。而且,在實驗因素的個數(shù)大于等于2時,無法 研究實驗因素之間的交互作用的大小。u檢驗(u test)以服從u分布的統(tǒng)計量檢驗統(tǒng)計假設的方法。均值的檢驗。 一個正態(tài)總體: 當0:0 22已知時,用檢驗統(tǒng)計量:其中,0、02為已知正態(tài)總體的均值與方差,X為樣本平均數(shù),n為樣本含量。當總體分布未知但樣本含量較大時,用檢驗 統(tǒng)計量: 兩個正態(tài)總體: H0:1 2 當兩個總體方差12、 22已知時,用檢驗統(tǒng)計量:當總體分布未知但樣本含量較大時,用檢驗統(tǒng)計量: 總體率的檢驗(適用

52、于大樣本)。 一個總體:H0 : 0用檢驗統(tǒng)計量:兩個總體:H0:12用檢驗統(tǒng)計量:其中,為兩樣本率的加權(quán)平均數(shù),m1、m2分別為兩樣本中某事件出現(xiàn)的頻數(shù)。 u檢驗的判斷結(jié)論:對給定的顯著性水平,查正態(tài)分布表,當0.05、0.01時,臨界值分別為1.96、2.58。當u1.96 時,P0.05,不拒絕H0,差異不具顯著性;當1.96u2.58時,P0.05,拒絕H0,差異具顯著性;當 u 2. 58時,P0.01,拒絕H0,差異具高度顯著性。只要u檢驗的條件滿足,如正態(tài)總體02已知或是大樣本,都可使用該方法,如某一運動隊通過一段時間 的訓練后成績是否有所提高,可以進行u檢驗。皮爾遜x2檢驗和卡

53、方檢驗一樣嗎?皮爾遜x2檢驗是檢驗實際頻數(shù)和理論頻數(shù)是否較為接近,統(tǒng)計學家卡爾?皮爾遜1900年提出了如下檢驗統(tǒng)計量:X2=【(實際頻數(shù)-理論頻數(shù)的)2】/理論頻數(shù)它近似服從自由度為V =組格數(shù)估計參數(shù)個數(shù)1 的 分布。式中, n 是樣本量,理論頻數(shù)是由樣本量乘以由理論分布確定的組格概率計算的。求和項數(shù)為組格數(shù)目。皮爾遜 統(tǒng)計量的直觀意義十分顯然: 是各組格的實際觀測頻數(shù)與理論期望頻數(shù)的相對平方偏差的總和,若 值充分大,則應認為樣本提供了理論分布與統(tǒng)計分布不同的顯著證據(jù),即假設的總體分布與總體的實際分布不符,從而應否定所假定的理論分布。所以,應當在 分布密度曲線圖的右尾部建立拒絕域??ǚ綑z驗有

54、很多種,跟他們叫卡方檢驗是因為構(gòu)造的統(tǒng)計量服從或近似服從卡方分布,然后再根據(jù)卡方分布建立檢驗規(guī)則,比如檢驗正態(tài)總體方差的是否為某定值的卡方檢驗構(gòu)造的統(tǒng)計量是那樣的這個統(tǒng)計量服從n-1的卡方分布,所以這個檢驗也叫卡方檢驗。 T檢驗(T Test)什么是T檢驗T檢驗是用于小樣本(樣本容量小于30)的兩個平均值差異程度的檢驗方法。它是用T分布理論來推斷差異發(fā)生的概率,從而判定兩個平均數(shù)的差異是否顯著。 T檢驗是戈斯特為了觀測釀酒質(zhì)量而發(fā)明的。戈斯特在位于都柏林的健力士釀酒廠擔任統(tǒng)計學家,基于Claude Guinness聘用從牛津大學和劍橋大學出來的最好的畢業(yè)生以將生物化學及統(tǒng)計學應用到健

55、力士工業(yè)程序的創(chuàng)新政策。戈特特于1908年在 Biometrika上公布T檢驗,但因其老板認為其為商業(yè)機密而被迫使用筆名(學生)。實際上,戈斯特的真實身份不只是其它統(tǒng)計學家不知道,連其老板也 不知道。T檢驗的步驟1、建立虛無假設H0:1 = 2,即先假定兩個總體平均數(shù)之間沒有顯著差異;2、計算統(tǒng)計量T值,對于不同類型的問題選用不同的統(tǒng)計量計算方法;1)如果要評斷一個總體中的小樣本平均數(shù)與總體平均值之間的差異程度,其統(tǒng)計量T值的計算公式為:2)如果要評斷兩組樣本平均數(shù)之間的差異程度,其統(tǒng)計量T值的計算公式為:3、根據(jù)自由度df=n-1,查T值表,找出規(guī)定的T理論值并進行比較。理論值差異的顯著水平為0.01級或0.05級。不同自由度的顯著水平理論值記為T(df)0.01和T(df)0.054、比較計算得到的t

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論