多元統(tǒng)計分析第三章 假設(shè)檢驗與方差分析_第1頁
多元統(tǒng)計分析第三章 假設(shè)檢驗與方差分析_第2頁
多元統(tǒng)計分析第三章 假設(shè)檢驗與方差分析_第3頁
多元統(tǒng)計分析第三章 假設(shè)檢驗與方差分析_第4頁
多元統(tǒng)計分析第三章 假設(shè)檢驗與方差分析_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第3章多元正態(tài)總體的假設(shè)檢驗與方差分析

從本章開始,我們開始轉(zhuǎn)入多元統(tǒng)計方法和統(tǒng)計模型的學習。統(tǒng)計學分析處理的對象是帶

有隨機性的數(shù)據(jù)。按照隨機排列、重復、局部控制、正交等原則設(shè)計一個試驗,通過試驗結(jié)果

形成樣本信息(通常以數(shù)據(jù)的形式),再根據(jù)樣本進行統(tǒng)計推斷,是自然科學和I:程技術(shù)領(lǐng)域

常用的一種研究方法。由于試驗指標常為多個數(shù)量指標,故常設(shè)試驗結(jié)果所形成的總體為多元

正態(tài)總體,這是本章理論方法研究的出發(fā)點。

所謂統(tǒng)計推斷就是根據(jù)從總體中觀測到的部分數(shù)據(jù)對總體中我們感興趣的未知部分作出推測,

這種推測必然伴有某種程度的不確定性,需要用概率來表明其可靠程度。統(tǒng)計推斷的任務是“觀

察現(xiàn)象,提取信息,建立模型,作出推斷”。

統(tǒng)計推斷有參數(shù)估計和假設(shè)檢驗兩大類問題,其統(tǒng)計推斷目的不同。參數(shù)估計問題回答諸如“未

知參數(shù)的值有多大?”之類的問題,而假設(shè)檢驗回答諸如“未知參數(shù)的值是嗎?”之類的問

題。本章主要討論多元正態(tài)總體的假設(shè)檢驗方法及其實際應用,我們將對?元正態(tài)總體情形作

一簡單回顧,然后將介紹單個總體均值的推斷,兩個總體均值的比較推斷,多個總體均值的

比較檢驗和協(xié)方差陣的推斷等。

3.1一元正態(tài)總體情形的回顧

一、假設(shè)檢驗

在假設(shè)檢驗問題中通常有兩個統(tǒng)計假設(shè)(簡稱假設(shè)),一個作為原假設(shè)(或稱零假設(shè)),另

一個作為備擇假設(shè)(或稱對立假設(shè)),分別記為和。

1.顯著性檢驗

為便于表述,假定考慮假設(shè)檢驗問題:設(shè),,…,來自總體的樣本,我們要檢驗

假設(shè)

,%:〃工4。(31)

原假設(shè)與備擇假設(shè)應相互排斥,兩者有且只有一個正確。備擇假設(shè)的意思是,一旦否

定原假設(shè),我們就選擇已準備的假設(shè)。

當已知時.,用統(tǒng)計量

在原假設(shè)成立下,統(tǒng)計量服從正態(tài)分布,通過查表,查得的上分位點。

對于檢驗問題(3.1.1),我們制定這樣一個檢驗規(guī)則(簡稱檢驗):

當時,拒絕;

當時,接受。(3.2)

我們稱為臨界值,是的上分位點,不同的臨界值代表不同的檢驗。稱拒絕原假設(shè)的

統(tǒng)計量的范圍為拒絕域,稱接受的統(tǒng)計量的范圍為接受域,因此給出一個檢驗,就是給

出一個拒絕域。

2.兩類錯誤

由于樣本具有隨機性,因此在根據(jù)樣本進行判斷時,有可能犯兩種類型的錯誤。一類錯誤

是,原假設(shè)本來正確,但按檢驗規(guī)則卻作出了拒絕的判斷,這類錯誤稱為第一類錯誤(棄

真錯誤),其發(fā)生的概率稱為犯第一類錯誤的概率;另一類錯誤時,原假設(shè)本來不正確,但

按檢驗規(guī)則卻作出了接收的判斷,這類錯誤稱為第二類錯誤(存?zhèn)五e誤),其發(fā)生的概率稱

為犯第二類錯誤的概率,記為。

同時控制這兩類錯誤是困難的,當時在樣本容量固定的條件下,要使和同時減小,

通常是不可能的。在假設(shè)檢驗的應用中,由奈曼(NEYMAN)與皮爾遜(PEARSON)提出了一個原則,

即在控制犯第一類錯誤的概率條件下,盡量使犯第二類錯誤的概率小,這種檢驗問題,稱

為顯著性檢驗問題。根據(jù)這一原則,原假設(shè)受到保護,不至于被輕易拒絕,一旦檢驗結(jié)果拒絕

了原假設(shè),則表明拒絕的理由是充分的,如果接受了原假設(shè),則只是表明拒絕的理由還不充分,

未必意味著原假設(shè)就是正確的。所以,在實際問題中,為了通過樣本觀測值對某一猜測取得強

有力的支持,通稱我們把這一猜測的否定作為原假設(shè),而把猜測本身作為備擇假設(shè)。

3.關(guān)于檢驗的值

下面,我們再介紹進行檢驗的另一種方式一一值,我們就以⑶1.1)的檢驗問題為例來

加以說明,對于樣本,我們通過統(tǒng)計量,計算出,是一確定值,這里的是樣本觀測值的均

值,再由統(tǒng)計量服從正態(tài)分布,計算為檢驗的值。

由于等價于=,所以檢驗規(guī)則可以表述為:

當時,拒絕;

當時,接受。接受。(3.3)

上述值的檢驗規(guī)則與(3.1.2)的檢驗結(jié)果相比含有更豐富的信息、,值越小,拒絕原假

設(shè)的理由就充分。通常SAS等軟件的計算機輸出一般只給出值,由你自己給定的值來判斷

檢驗結(jié)果

二、單一變量假設(shè)檢驗的回顧

1、單個正態(tài)總體均值的檢驗

考慮假設(shè)檢驗問題:設(shè),,…,來自總體的樣本,我們要檢驗假設(shè)

“°:〃=〃o,%

(1)總體方差己知

構(gòu)造統(tǒng)計量

在原假設(shè)成立下,服從正態(tài)分布,可得這樣一個檢驗規(guī)則:

(2)當時,拒絕;

(3)當時,接受。

(4)總體方差/未知

構(gòu)造統(tǒng)計量

在原假設(shè)成立下,服從自由度為的分布可得這樣一個檢驗規(guī)則:

當時,拒絕;

當時,接受。(3.1.4)

2、兩個正態(tài)總體均值的比較檢驗

考慮假設(shè)檢驗問題

“0:=〃2,”1:工〃2(3.1.5)

(1)設(shè)是取自總體的容量為的樣本,是取自的容量為的樣本,給定顯

著性水平。

(2)兩個總體方差。:和(7;已知

文_yz

構(gòu)造檢驗統(tǒng)計量z=1(3.1.6)

V巧叫

在原假設(shè)成立下,服從正態(tài)分布,檢驗規(guī)則為:

當時,拒絕;

當時,接受.

在方差分析問題中,變量是示性變量,即只取0或1的變量。GLM過程對每一因子的每

一水平,通過CLASS語句產(chǎn)生1個示性變量,也稱分類變量。

GLM過程主要有四個語句:PROCGLM,CLASS,MODEL和LSMEANS語句。

PROCGLM語句用以調(diào)用GLM過程,有許多選項,一般形式是:

Procglm[daia=數(shù)據(jù)集名稱][。111$3=輸出的統(tǒng)計量]

[oider=foiniatted|fieq|data|internall;

CLASS語句說明哪些變量是分類變量。方差分析中的因素都是分類變量,如:

ClassVIV2V3;

此語句指示計算機把因子VI,V2,V3作為分類變量,可以是字符型變量或數(shù)字型變量。如

果是字符型變量,長度限于10個字符以內(nèi)。

MODEL語句語句中等號前是響應變量,如:

ModelY=A:單因子ANOVA

ModelY=ABC;主效應模型

ModelY=ABA*B;含交互效應的因子模型

ModelY1Y2=AB;多因子方差模型MANOVA

LSMEANS語句用以求待估參數(shù)的最小二乘估計。

LsmcansABA*B;

MANOVA語句用以說明是做多元方差分析。

3.2均值等于常數(shù)向量的檢驗

在經(jīng)濟生產(chǎn)、管理決策中的很多實際問題,通常要選取多個指標進行考察,根據(jù)歷史數(shù)據(jù),

將項指標的歷史平均水平記作,考慮新的項指標平均值是否與歷史數(shù)據(jù)記載的平均值有

明顯差異?若有差異,進一步分析差異主要在哪些指標匕先看下面的實例:

例3.1測量20名健康女性排汗量、鈉含量、鉀含量得表3.1。問健康女性、、

的均值是不是4、50.10?

表3-120名健康女性排汗量陽、鈉含量工2、鉀含量工數(shù)據(jù)

排汗量再鈉含量乙鉀含量工

3.748.59.3

5.765.18.0

3.847.210.9

3.253.212.0

3.155.59.7

4.636.17.9

2.424.814.0

7.233.17.6

6.747.48.5

5.454.111.3

3.936.912.7

4.558.812.3

3.527.89.8

4.540.28.4

1.513.510.1

8.556.47.1

4.571.68.2

6.552.810.9

4.144.111.2

5.540.99.4

一般的,我們考慮維正態(tài)分布均值等于常數(shù)的檢驗問題:為取自維正態(tài)總體的一

個樣本,要檢驗:

,(3.4)

其中〃。為已知〃維向量。

對于這樣一個檢驗問題,分為以下兩種情形:

一、協(xié)方差陣已知條件下,均值的檢驗

作出假設(shè)后,需要構(gòu)迨一個合適的統(tǒng)計量。要檢驗的假設(shè)在形式上同一維情形是一樣的。

"o:〃二〃o;乩

在一維時構(gòu)造的統(tǒng)計量為且在成立時,服從正態(tài)分布。

依照一維情形,由于成立時服從維正態(tài)分布,。若記,為非奇異對稱陣,

則有服從但用來確定拒絕域不方便,因此,改選用統(tǒng)計量,

/=〃(又—〃0),£7(又一〃0)(35)

當成立時,服從-分布。對給定的,從,求出,當

時,要先求,這需要大量的計算。實際計算時,可以不必求出,只要令

即zy=(X-//0)(3.6)

求解方程組(3.2.3),求出Y后,則

/=〃(9—〃。)『丫

二.協(xié)方差陣未知條件下均值的檢驗

假設(shè)檢驗問題仍然是:

其中〃。為已知〃維向量。

回顧一元情況,在原假設(shè)成立下,服從自由度為的分布,

在維正態(tài)情況下,當協(xié)方差已知時,選用時統(tǒng)計量為

/二〃(又一〃。)72"(又一〃。)

現(xiàn)用樣本協(xié)方差代替總體協(xié)方差陣,令

2Tl

T=n(n-l)(X-jLic)S-(X-ju0)

統(tǒng)計量的分布是一元統(tǒng)計中分布的推廣,最早由HOTELLING導出,在上一章中,我們

已經(jīng)給出了這個定義,可以直接用它作為檢驗的統(tǒng)計量,分布已被仔細研究過,幽及5%的

分位點已經(jīng)列成專表,讀者可在[3]中找到這個表。也可以利用HOTELLING分布的性質(zhì),

.+1尸~F(p,〃-p)(證明參見朱道元P210)

5-1)〃

當不成立時,有變大的趨勢,對給定的,從

求出,當時,拒絕;否則接受。

例3.1測量20名健康女性排汗量、鈉含量、鉀含量得表3.1。問健康女性、、的

均值是不是450、10?

解:建立

用SAS,MATEMATICA,MATLAB等軟件都可算出

-4.64■2879368410.0100000-1.8090526-

x=45.4,S=10.0100000199.7884211-5.6400000

9.965-1.8090526-5.64000003.6276579

T2=20(X一4)'ST(X-//())=9.74。

F=(20-3)*7,2/(19*3)=2.90>A;,,(0.10)=2.44

所以否定原假設(shè),即在o.10顯著水平下拒絕。

例3.1也可用下列SAS程序計算

datahanye;

inputxl-x3;yl=xl-4;y2=x2-50;y3=x3-10;a=l;

cards;

3.748.59.3

5.765.18.0

3.847.210.9

3.253.212.0

3.155.59.7

4.636.17.9

2.424.814.0

7.233.17.6

6.747.48.5

5.454.111.3

3.936.912.7

4.558.812.3

3.527.89.8

4.540.28.4

1.513.510.1

8.556.47.1

4.571.68.2

6.552.810.9

4.144.111.2

5.540.99.4

procglm;

modelyl-y3=a/noint;

manovah=a/printeprmth;

run;

執(zhí)行此程序后得到的輸出中主要的是最后一個表

H=TypeIIISSCPMatrixfora

E=ErrorSSCPMatrix

S=1M=0.5N=7.5

StatisticValueFValueNumDFDenDFPr>F

Wilks*Lambda0.661127742.903170.0649

Pi1lai'sTrace0.338872262.903170.0649

Hotelling-LawleyTrace0.512566992.903170.0649

Roy'sGreatestRoot0.512566992.903170.0649

可見P值為0.0649,所以否定原假設(shè),即在0.10顯著水平下拒絕。

在實際工作中,一元檢驗與多元檢驗可以聯(lián)合使用,多元的檢驗具有概括和全面的優(yōu)點,而一

元的檢驗容易發(fā)現(xiàn)各指標之間的關(guān)系和差異,兩者的結(jié)合能給統(tǒng)計人員提供更多的統(tǒng)計分析信

息。

3.3兩總體均值的比較檢驗

例3.2為了研究日美兩國在華企業(yè)對中國經(jīng)營環(huán)境的評價是否存在差異,從兩國在華企

業(yè)對中國的政治、經(jīng)濟、法律、文化等環(huán)境打分,得表3-2。試分析日美兩國在華企業(yè)對中國

經(jīng)營環(huán)境的評價是否存在差異?

表3-2日美兩國在華企業(yè)對中國經(jīng)營環(huán)境的評價

美國企業(yè)號政治環(huán)境XI經(jīng)濟環(huán)境X2法律環(huán)境X3文化環(huán)境X4

美165352560

美275502055

美360453565

美475404070

美570303050

美655403505

美760453060

美865402560

美960503070

美1055553575

日本企業(yè)號政治環(huán)境Y1經(jīng)濟環(huán)境Y2法律環(huán)境Y3文化環(huán)境Y4

日1,55554065

日250604570

日345453575

日450505070

F1555503075

日660404560

日765554575

日850653580

日940453065

日1045504570

假設(shè)服從,服從下,且有10對樣品,要做復合檢

一般情況下,我們考慮為取自維正態(tài)總體的一個樣本,為取自維正態(tài)總體的

一個樣本。假定兩組樣本相互獨立,且

一、有共同已知的協(xié)差陣時

對于例3.2提出的問題,可歸類為假設(shè)檢驗問題:

“0:M=〃2〃1:〃1工〃2其中〃i4為已知'維向量。

在一維情形下,用了統(tǒng)計量,與前面相似的思路,在維時,選用統(tǒng)計量

Z2=^(X_F)7E-1(X_F)

〃+〃2

當成立時,服從-分布。對給定的顯著性水平,從,求出。當時,拒絕

:當<時,接受“

二、有共同的未知協(xié)差陣時

假定兩組樣本相互獨立,己知兩總體有相同的協(xié)方差年>0,但未知,要檢驗的假設(shè)

/:從=〃2W:從其中從生為己知〃維向量。記

r

5)=J(Xf-X)(Xr-X)

i=l

S2=Z(Z-F)(Z—F)T

1=1

采用統(tǒng)計量為

T2=--(〃?+〃一2)(x-y)/(y+s,『(x_y)

m+n

定理3.2若,成立;則

F—+/n-p—\)T2/[p(n+m—2)]?尸(〃,〃十/〃一p—1)

證明參見朱道元P217

定理3.2可用于用做兩總體復合檢驗。

根據(jù)定理3.2,當成立時,統(tǒng)計量

(〃+加一2)一〃+12n+m-p-\

r=------------------------I------------------12

(〃+m-2)〃(〃+in-2)p

二刖加+力/⑸+S,)~\X-Y)?F",〃”一p-l)

p(m+n)

當不成立時,有變大的趨勢,對給定的,從

求出,當時,拒絕;否則接受O

以上有關(guān)的統(tǒng)計量在成立時所服從的分布的相應證明都比較復雜,這里我們只敘述了有

關(guān)結(jié)論,沒有給出證明,可參看第二章的相關(guān)內(nèi)容。這些統(tǒng)計量同一維相應的統(tǒng)計量均有相似

之處,對比兩者的形式有助于理解和應用。

例3.2的解:作假設(shè)

-64-'51'

__43_51

X=r=

30.5740

6370.5

-54.44444444-18.888888汾-13.33333333-27.22222222'

-18.888888?56.666666671.1111111134.44444444

SY=

-13.333333231.1111111135.8333333828.88888889

-27.2222222234.4444444428.888888汾56.66666667

45.833333335.8333333319.44444444-0.83333333

5.8333333355.833333332.7777777826.94444444

Sy二

19.444444羽2.7777777850.000000(1)-11.11111111

-0.8333333326.94444444-11.1111111135.83333333

10*10_———

T2=(X—P7ST(X—y)=29.8625

10+10

F=(10+10-4-l)/(910+10-2)*4)*29.8625=6.2214>^15(0.01)

所以日美兩國在華企業(yè)對中國經(jīng)營環(huán)境的評價存在顯著差異。

例3.2可用如下SAS程序?qū)崿F(xiàn)

datawul;

inputno$polecnlegculcou$;

cards;

2<6535256o

21

255o2o55

36o453565

4757o

40

5o

3050

6554o3565a

376o453o6oa

65256o

40

96o5o3o7o

:1o55553575a

t

Lt155554o65

Em25o457o

60

日345453575D

日450505070j

日555503075j

日6604045603

日765554575j

日850603580j

口940453065j

日1045504570j

procglm;

classcou;

modelpolecnlegcu_=cou/ss3;

manovah=cou/printeprinth;

run;

執(zhí)行此程序后得到的輸出中主要的是最后一個表

H=TypeITTSSCPMatrixforcou

E=ErrorSSCPMatrix

S=1M=1N=6.5

StatisticValueFValueNumDFDenDFPr>F

Wilks'Lambda0.376077346.224150.0037

PillaisTrace0.623922666.224150.0037

Hotelling-LawleyTrace1.659027526.224150.0037

Roy'sGreatestRoot1.659027526.224150.0037

由此可見P值是0.0037,因而日美兩國在華企業(yè)對中國經(jīng)營環(huán)境的評價存在顯著差異。

3.4多個總體均值向量的比較檢驗

在研究作物栽培時,要考慮播種期、品種、土質(zhì)、施肥方式、灌溉方式對產(chǎn)量的影

響;在化學反應中要觀察原料成分、劑量、催化劑、溫度、壓力,攪拌速度等對得

率的影響。在很多應用領(lǐng)域尤其是科學研究中,都遇到過類似的問題,常涉及許多

因素,這類問題要分析出影響最“大”的因素,就是比較各種因素對試驗結(jié)果所起的

作用問題。作為影響試臉結(jié)果的每一因素或因素的某一水平或某一方案,且試驗結(jié)

果都形成一個隨機總體。這樣,比較各種因素對試驗結(jié)果所起的作用問題就變成對

各種因素的試驗結(jié)果所形成的總體的比較問題。

由于試驗指標常為多元指標,故常設(shè)試驗結(jié)果所形成的總體為多元正態(tài)總體。此外,

我們按照隨機排列、重復、局部控制、正交等原則設(shè)計一個試驗,除要考察的因素

外,其他試驗條件均要求一致,即要考察的試驗因素的試驗結(jié)果都是同協(xié)方差陣的

且相互獨立的多元正態(tài)總體。因而,各因素對試驗結(jié)果影響的結(jié)果的比較,就變成

了多個同協(xié)方差陣的多元正態(tài)總體均值向量的比較。統(tǒng)計上解決兩個以上同協(xié)方差

陣多元正態(tài)總體均值向量比較的方法叫做多元方差分析。多個總體均值向量的比較

檢驗,特別是多元方差分析正是本節(jié)的內(nèi)容,這類方法在經(jīng)濟管理,系統(tǒng)控制,生

物醫(yī)藥等許多領(lǐng)域有著廣泛的應用。這里先看一個具體實例。

3.4.1提出問題

例3.3為了研究某種疾病,對三組人測量:第1組是20至35歲女性、第2組是20至25歲

男性、第3組是30至55歲男性。每組取20個人,測量第I組的第J人4個指標是:脂蛋白

()、甘油三脂()、脂蛋白()、前脂蛋門()。測量結(jié)果見表3-3。問三組

人的指標間有沒有顯著差別?

表3-3夕脂蛋白、甘油三脂、。脂蛋白、前夕脂蛋白數(shù)據(jù)

r(,)X⑴r(,)X⑵r(2)丫⑶(3)丫⑶r⑶

巧4%r

力1勺2勺3人〃勺1為2勺3勺2勺3人J4

2607540183101223021320643917

200723417310603518260593711

2408745181904027153GO88282G

1706539172256534162951003612

2701103924170653716270653221

20513034232108231173801143621

190692715280673718240554210

200464515210383617260553420

25011721202806530232601102920

2001072820200764017295733321

22513036112007639202401143818

21012526172809426113101033218

1706431141906033173301122111

2707633132955530163451272420

1906034162701252421250622216

2808120182801203218260592119

31011925152406232202251003430

270573182806929203451203618

2506731143707030203601072523

26013539292804037172501173616

問題中的3組人的測量值、、,每個隨機向量有4個指標,即4維隨機向量。例3.3要

從每個總體20個樣品值出發(fā),檢驗是否成立。

3.4.2單因素方差分析的數(shù)學模型

方差分析的目的在于找出自變量與因變量之間的線性關(guān)系,或自變量對因變量的實驗效果。方

差分析是一種處理實驗數(shù)據(jù)的方法,考察一個被稱為因變量或相依變量(depencientvariable,)

的連續(xù)響應變量,乂稱反應變量(ResponseVariable),其數(shù)值則是連續(xù)的,它在由分類變量識別的

幾種試驗條件下被測量,這些分類變量被稱為自變量,獨立變量(independentvariable),定性變量

(QualitativeVariable)或分類變量(ClassificationVariable),其數(shù)值多半是不連續(xù)的。這些分

類變量的水平組合形成試驗設(shè)計的單元。例如,某個試驗要測量男人和女人的重量變化〔因變

量),他們采取了三種不同的減肥方法,這個設(shè)計的6個單元由性別(男、女)和減肥方法(ABC)

6種組合形成。

一項試驗有多個影響因素,因素也可以看成是一種變量,其取值不是數(shù),而是水平。例如“產(chǎn)地”

是一個變量,它取的值是“北京”、“上?!?、“南京”等。這種變量稱為屬性變量,定性變量或分

類變量.如果只有一個因素在發(fā)生變化,其他因素保持不變,則稱為單因素試驗,與之對應的方

差分析,稱為單因素方差分析。

我們所考察的.影響產(chǎn)品指標的因素(如產(chǎn)地,溫度)也稱為因子,用大寫字母A,B,C表小。

因素所能處的狀況,如甲、乙、丙;60,65,70,75,……,稱為因素的水平,簡稱為水平。水平常

以表示。

一般地,假設(shè)因素A有k個水平:。對第個水平進行試驗,獨立觀察次,,整個試

驗共作了次,且完全隨機排列。

設(shè)4的第/次觀察的試驗指標為p維向量

假設(shè):

(I)同一個水平下得到的觀測值,…;…:,…,由于實驗過程中各種倡然因

素的干擾及測量誤差所致,每次實驗中這些偶然因素的總和稱為實驗誤差,它們是

方差相同的零均值正態(tài)隨機變最;

(2)所有誤差相互獨立;

由于水平的不同,可能會給一個定量的確定性的影響,其大小是未知的。

假定〃=一工從令〃

〃日

于是有模型:

X?=〃+%+%

?%~Np(0、E)且相互獨立

i=l,2,…,4,7=1,2,…,《

其中稱為總體均值向量,為的主效應向量,為的第次觀察的隨機誤差向量,根據(jù)假設(shè)

相互獨立且均服從。

判斷這個因素的影響是否顯著就是要檢驗假設(shè):

H0:a[=a2=---=ak=0儲:%%不全為0(3.7)

設(shè)第I組樣本均值X")=上方X?

總均值又=」£yX?

flr=lj=l

樣本組內(nèi)差后=之石(X;”—湎)(x,—而y

/=1;=1

樣本組間差3二之〃,(又一尸)(又一尸)、

1=1

A=ti(X?-5)(Xf-又)=5+E,

r=lj=\

對干該檢驗問題的統(tǒng)計量,取WILKS統(tǒng)計量

定理3.3若,則服從WILKS分布

證明參見朱道元第177頁

例3.3為了研究某種疾病,對三組人測量:第1組是20至35歲女性、第2組是20至25

歲男性、第3組是30至55歲男性。每組取20個人,測量第I組的第J人4個指標是:脂蛋

白()、甘油三脂()、脂蛋白()、前脂蛋白()。測量結(jié)果見表3.3。問三

組人的指標間有沒有顯著差別?

解這兒有3個總體,建立假設(shè)

計算三總體樣本均值

一231.0--253.5--292.75-

89.672.5590.2

X=(2)=,A?(3)=

32.932.4531.75

_17.1_17.9__18.4

計算組內(nèi)差

-305306298-1078195-

15736.8-796.81:387.8

E[二

*95590.2

?.413.8_

?

-517057021.5-1571.5827

12288.95-807.95321.

E=

2364.95-5.1

■?**133.8

-

■43173.759959-1301.25723

?12441.2-333457.4

4=761.5-112

??476.8

12504.823278.5-395.751748-

40466.395-1937.752166.3

E=E4分卜氏二

2082.5-26.9

*?1024.2

計算組間差

—-

39065.832307.92-724.08786

4017.23-35.82-26.9

B=

13.43-14.7

*?17.2

--

計算總方差

-164474.5825586.42-4674.832534-

?44484.18-1973.572139.4

B+E=

2095.93-41.6

???1041.4

計算統(tǒng)計量,資得〉0.6621;

所以高度顯著否定,故三組人身體指標有顯著差異。

3.5總體協(xié)差陣相等的檢驗

本章第三節(jié)和第四節(jié)中,總假定不同總體的方差是相同的,這一假定是否合理?在一些問題

中應當加以證明。

3.5.1一個正態(tài)總體協(xié)方差陣的檢驗

設(shè)為取自維正態(tài)總體的一個樣本,未知,且。

首先,我們考慮假設(shè)檢驗問題:,

所構(gòu)造的檢驗統(tǒng)計量為

行expTMN*產(chǎn)

其中

r

A=^(X/-X)(X;-X)

2I

然后,我們考慮假設(shè)檢驗問題:,

因為,所以存在非奇異矩陣,使得

令匕=OX,,i=l,2,…,〃

則Yj~Np?i,DXDT)=Np("*£)

因此檢驗2==等價于£*=/「

此時構(gòu)造檢驗統(tǒng)計量為

/l=exp{--rM^}A*|n/2(-)n,V2

21n

其中

A;力(工―力(匕―力,

/=1

給定檢驗水平,因為直接卷的分布計算臨界值很困難,所以通常采用的近似分布。

在成立時,的極限分布是,因此當?,由樣本值計算出值,若〉,即

<,則拒絕,否則不能拒絕。

3.5.2多個協(xié)方差陣相等檢驗

剛才討論的檢驗是一個正態(tài)總體協(xié)方差陣的檢驗,是檢驗當前協(xié)方差陣與過去是否

一樣,在一些實際問題中,可能會遇到多個正態(tài)總體的協(xié)方差陣是否相等的問題。

設(shè)有個正態(tài)總體分別為,…,,且未知,

從第i個總體中?。€樣本

m,□

這里+%+,,?+,”=〃為總樣本容量。

我們考慮假設(shè)檢驗問題為

,不全相等

構(gòu)造檢驗統(tǒng)計量為

小丁2-

?=%產(chǎn)1----------------

|A|口,產(chǎn)

r=l

其中4=火4

1=1

4=宜(X?—又⑴)(x7_x(i))T,

按照Bartlett的建議,記,得到修正的檢驗統(tǒng)計量

,M產(chǎn)N喇2

2-Jrl___________________

£一IA|N/2k

i=l

則在成立時,的極限分布是,其中

.f=g〃(P+D伏-1)

2P、3p-l侍1___

6(〃+1)(攵-幅同—片{NJ不必相等;

(2p2+3p-l)(k+l){“相等

6(p+l)M

有甲、乙兩品種,取得如表3-4所示的兩個二元正態(tài)樣本,試檢驗

表3-4方差陣檢驗數(shù)據(jù)

觀察值和百

3002322171002863201455385109

甲⑴26385

X235254310171233417

2001503331502833833503002149635167

乙X⑵161638

5043834173808610055642044

解:

「90163.48540.01

A=

[8540.04297.5

|A|=14892822ln|4,|=16.5164

|闋=460883525ln|4|=17.6461

|41=314545504.1ln|A|=19.5666

由于,,,,,,,故

kk

-21n2'=N(In|A\-p\nN)+收乂lnN女工ln|4|

r-l/=l

=175.1614+43.3371-206.0957=7.815

6/=0.1874

/=gp(〃+l)d)=3

=而3(3)=9.6176

由于,故應拒絕,即認為有顯著差異。

3.6獨立性檢驗

一個隨機向量,若其中兩子向量相互獨立,則可化為兩個低維隨即向量處理,給統(tǒng)計

分析帶來極大的便利,因此檢驗一個隨機向量的子向量之間是否獨立是參數(shù)假設(shè)檢驗中的重大

課題,而當

時,,相互獨立,互不相關(guān)()。這時,,的獨立性檢驗可歸結(jié)

為參數(shù)假設(shè)檢驗。

一般情況下,設(shè),正定,將分割成個子向量:

X=(X⑴,X⑵,?.?,X⑹),,

其中的維數(shù)為,,將與也作相應的剖分:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論