版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
概率論與數(shù)理統(tǒng)計第1章隨機事件與概率第2章隨機變量的分布及其數(shù)字特征第3章多維隨機變量的分布及其數(shù)字特征第4章數(shù)理統(tǒng)計的基本概念第5章參數(shù)估計第6章假設檢驗第7章方差分析第8章回歸分析
第7章方差分析
第6章介紹了雙總體均值之差的假設檢驗問題,實踐中還會遇到比較多個總體均值的假設檢驗問題,解決此類問題的有效方法之一是方差分析.方差分析(簡稱ANOVA)是英國統(tǒng)計與遺傳學家,現(xiàn)代統(tǒng)計科學的奠基人之一費歇爾(R.A.Fisher,1890-1962)在試驗設計時為解釋試驗數(shù)據(jù)而首先引入的,用于檢驗兩個及兩個以上總體均值有無顯著性差異的一種方法.第7章知識結構第7章方差分析本章主要內容有:
單因素方差分析、雙因素方差分析,以及利用Excel進行方差分析的案例.多因素方差分析方差分析單因素方差分析實際問題Excel應用第7章方差分析☆實際問題中,常需要檢驗因素的不同水平(因素的不同表現(xiàn))是否有顯著性差異,方法是方差分析.☆方差分析可分為單因素方差分析和多因素方差分析,多因素方差分析又可分為無交互作用的多因素方差分析和有交互作用的多因素方差分析.☆方差分析涉及復雜的計算過程,可以利用Excel提供的方差分析工具進行基本的計算和統(tǒng)計推斷.第7章方差分析§7.1單因素方差分析§7.2雙因素方差分析7.1.1問題的提出7.1.2檢驗問題7.1.3平方和分解與方差分析7.1.4參數(shù)估計7.1單因素方差分析7.1.1問題的提出
為了更好地理解方差分析的思想,我們先看一個例子.
例7.1.1有3個品牌的彩電在4個地區(qū)銷售,為了分析品牌對彩電銷售量的影響,統(tǒng)計每個品牌在各地區(qū)的銷售量數(shù)據(jù)(單位:萬臺)如下:表7.1.13個品牌4個地區(qū)的銷售量
問題是品牌會不會影響銷售量?換句話說,這3個品牌的彩電銷售量是否有顯著性差異?7.1單因素方差分析品牌銷售量品牌136383634品牌234363432品牌3323430327.1.1問題的提出
我們將3個品牌的彩電銷售量看作3個總體,若它們服從相同的分布,則3個品牌的彩電銷售量就沒有顯著性差異.
假設3個總體都服從正態(tài)分布,則只要它們的均值和方差分別相等,則它們的分布就相同.再假設它們的方差相同,則只要檢驗它們的均值是否相等,就可以推斷它們是否服從相同的分布.
顯然,可以利用第6章中雙總體均值假設檢驗來檢驗不同品牌的彩電銷售量是否有顯著性差異.但3個品牌的彩電銷售量兩兩比較則需要檢驗3次,檢驗工作量較大,而且多次檢驗會使犯a錯誤的概率相應累加,置信水平下降.7.1單因素方差分析7.1.1問題的提出
如果a=0.05,每次檢驗犯a錯誤的概率為0.05,不犯錯誤的概率為0.95,3次檢驗都不犯錯誤的概率為0.953,檢驗3次至少犯一次a錯誤的概率為1-0.953=0.1426.所以,若能一次性檢驗3個總體是否有顯著性差異,既能減少工作量,又能充分利用樣本信息提高檢驗結果的可靠性.
方差分析是在假設多個總體都服從正態(tài)分布且方差相等的條件下,通過一次性檢驗它們的均值是否相等,從而推斷這些總體的分布是否有顯著性差異的方法.
方差分析中檢驗的對象稱為因素.因素的不同表現(xiàn)稱為水平.在例7.1.1中,檢驗問題只考察品牌一個因素對銷售量的影響,我們稱之為單因素分析,品牌為因素,不同的品牌稱為水平.若除了考察品牌這一因素外,還考察地區(qū)因素對銷售量的影響,我們稱之為雙因素分析.
7.1單因素方差分析7.1.2檢驗問題
在單因素方差分析中,設因素A共有r個水平A1,A2,…,Ar,將每一水平看作一個總體,共有r個總體,檢驗假設問題是:H0:A因素對研究對象沒有顯著性影響;H1:A因素對研究對象有顯著性影響.
如果H0成立,則稱因素A不顯著,否則稱因素A顯著.
為了進行檢驗,需要對每個總體進行獨立重復試驗獲取樣本數(shù)據(jù).設從第i個水平總體中獲得ni個試驗數(shù)據(jù),記xij表示第i個總體的第j次重復試驗數(shù)據(jù).將試驗數(shù)據(jù)列成表7.1.2的形式,稱為數(shù)據(jù)結構.7.1單因素方差分析7.1.2檢驗問題
單因素方差分析假設:
(1)第i個水平總體服從N(mi,s2),i=1,2,…,r;
(2)所有的試驗結果xij都相互獨立.由于每個總體都假設服從正態(tài)分布且方差相等,只要各總體的均值mi也相等,則各總體就沒有差異.7.1單因素方差分析7.1.3平方和分解與方差分析所以,檢驗問題可以轉化為對各總體均值進行檢驗:
H0:m1=m2=…=mr=m;H1:mi(i=1,2,…,r)不全相等(7.1.1)為簡單起見,我們只討論ni=m時的情形,ni不全相等的情形可以類似地討論.令n=m×r.記7.1單因素方差分析7.1.3平方和分解與方差分析可以證明,所以記可以證明SST=SSA+SSE.SST中xij有n個,是xij的均值,對xij起到約束作用,視作1個約束條件,dfSST=n-1稱為SST的自由度.SSA中有r個,是的均值,對起到約束作用,視作1個約束條件,dfSSA=r-1稱為SSA的自由度.SSE中xij有n個,是部分xij的均值,對xij起到約束作用,視作r個約束條件,dfSSE=n-r稱為SSE的自由度.7.1單因素方差分析7.1.3平方和分解與方差分析dfSST=dfSSA+dfSSESST反映的是樣本值與總均值的差異,稱為總偏差平方和.SSE反映的是在水平Ai下,樣本值與均值的差異,是由水平Ai內部的隨機性引起的,稱為組內偏差平方和.SSA反映的是第i個水平的均值與總均值的差異,既可能是由隨機性引起的,也可能是由水平不同而引起的,稱為組間偏差平方和或因素偏差平方和.如果H0成立,則∑∑(mi-m)2=0.因為分別為mi和m的無偏估計,即便存在樣本的隨機性,
,SSA也不應太大,若SSA太大,就有理由懷疑H0的真實性.相對地講,SSA越大,SSE就越小,進而SSA/SSE越大,[SSA/(r-1)]/[SSE/(n-r)]也越大.因此,可以用[SSA/(r-1)]/[SSE/(n-r)]的大小來判別是否成立.7.1單因素方差分析7.1.3平方和分解與方差分析可以證明,在滿足假設和H0為真時,
(7.1.2)稱MSA=SSA/(r-1),MSE=SSE/(n-r),MST=SST/(n-1)為均方,亦即平均每個自由度上的平方和.選取(7.1.2)作為檢驗統(tǒng)計量.由上述分析知,單因素方差分析屬于F右側檢驗.將上面分析結果排成表7.1.3的形式,稱為方差分析表.7.1單因素方差分析7.1.3平方和分解與方差分析
將上面分析結果排成表7.1.3的形式,稱為方差分析表表7.13單因素方差分析表7.1單因素方差分析差異源SSdfMSFP-valueFcrit組間SSAr-1MSAFApFa(r-1,n-r)組內SSEn-rMSE總計SSTn-1
7.1.4參數(shù)估計若檢驗結果為顯著,我們可以進一步求各總體參數(shù)的最大似估計:
(1)
(2)由于sM2不是s2的無偏估計,實際中通常用均方誤差作為的無偏估計量,即
.
(7.1.3)由于,
,且相互獨立,故
(7.1.4)由此得到水平Ai的均值的置信區(qū)間端點為(7.1.5)7.1單因素方差分析7.1.4參數(shù)估計至此我們總結出單因素方差分析的步驟:步驟1建立單因素方差模型并提出假設;步驟2計算方差分析表;步驟3統(tǒng)計推斷;步驟4若因素顯著,可對參數(shù)進行估計;若因素不顯著則無需進行參數(shù)估計.7.1單因素方差分析7.1.4參數(shù)估計
例7.1.2對例7.1.1進行方差分析.
解
步驟1原假設與備擇假設為:H0:3個品牌的彩電銷售量沒有顯著性差異;
H1:3個品牌的彩電銷售量有顯著性差異.
步驟2計算方差分析表.本例因素是品牌,有3個水平,每個水平有4個樣本值.因此r=3,m=4,n=12.7.1單因素方差分析7.1.4參數(shù)估計7.1單因素方差分析7.1.4參數(shù)估計
SSE=SST-SSA=56-32=24,
查表F
分布表得F0.05(2,9)=4.26,拒絕域為[4.26,+∞).
得方差分析表如下:差異源SSdfMSFPvalueFcrit組間322166-4.26組內2498/3
總計5611
7.1單因素方差分析7.1.4參數(shù)估計
步驟3統(tǒng)計推斷.因為FA=6>4.26=F0.05(2,9),故在下應拒絕原假設H0,3個品牌的彩電銷售量有顯著性差異.
步驟4參數(shù)估計.品牌1:品牌2:品牌3:方差:7.1單因素方差分析7.1.4參數(shù)估計
本例三個水平的觀測數(shù)相同,第i
個水平均值的置信區(qū)間端點分別為
將以上數(shù)值代入得3各品牌均值的0.95置信區(qū)間端點分別為:[34.15,37.85],[32.15,35.15],[30.15,33.85].例7.1.3解步驟1原假設與備擇假設為:H0:4個行業(yè)的服務質量沒有顯著性影響;
H1:4個行業(yè)的服務質量有顯著性影響.7.1單因素方差分析7.1.4參數(shù)估計
步驟2計算方差分析表.用Excel計算得方差分析表如下:SUMMARY
組觀測數(shù)求和平均方差
零售業(yè)735951.29183.90
旅游業(yè)640968.17167.37
航空業(yè)523547157.5
家電制造業(yè)524549175.5
方差分析表:
差異源SSdfMSFP-valueFcrit組間1624.173541.393.140.053.13組內3272.2619172.22
總計4896.4322
7.1單因素方差分析7.1.4參數(shù)估計
步驟3統(tǒng)計推斷.因FA=3.14>3.13=F0.05(3,19),所以在a=0.05下拒絕H0,即四個行業(yè)的服務質量之間有顯著性差異.
步驟4參數(shù)估計.
零售業(yè):
旅游業(yè):
航空業(yè):
家電業(yè):方差:
7.1單因素方差分析7.1.4參數(shù)估計
MSE=172.22,dfe=n-r=19,n1=7,n2=6,n3=n4=5,a=0.05,ta/2(n-r)=t0.025(19)≈2.09,
本例4個水平的觀測數(shù)不同,第i
個水平均值的置信區(qū)間分別為
將以上數(shù)值代入得m1,m2,m3的0.95置信區(qū)間分別為:[40.29,61.66],[56.97,79.37],[34.73,59.21],[36.73,61.27].7.1單因素方差分析7.2.1雙因素方差分析及其類型7.2.2無交互作用的雙因素方差分析7.2.3有交互作用的雙因素方差分析7.2雙因素方差分析7.2.1雙因素方差分析及其類型
在實際問題中,有時需要考慮幾個因素對試驗結果的影響.例如,分析影響彩電銷售量的因素時,需要考慮品牌、銷售地區(qū)、價格、質量等多個因素的影響.
例7.2.1有3個品牌的彩電在4個地區(qū)銷售,為了分析品牌和地區(qū)對彩電銷售量的影響,統(tǒng)計每個品牌在各地區(qū)的銷售量數(shù)據(jù)(單位:臺)如下:試在a=0.05下分析品牌和地區(qū)對彩電銷售量是否有顯著性影響.品牌
地區(qū)1地區(qū)2地區(qū)3地區(qū)4品牌136383634品牌234363432品牌3323430327.2雙因素方差分析7.2.1雙因素方差分析及其類型
方差分析涉及兩個因素時,稱為雙因素方差分析.在雙因素方差分析中,如果各因素是相互獨立的,則稱為無交互作用的方差分析,或稱為無重復雙因素分析.如果各因素不是相互獨立的,即他們的不同組合也會產生影響,則稱為有交互作用的方差分析,或稱為可重復雙因素分析.7.2雙因素方差分析7.2.2無交互作用的雙因素方差分析
1)檢驗問題在無交互作用的方差分析中,設行因素A有個水平A1,A2,…,Ar.列因素B有個水平B1,B2,…,Bk,將每一水平看作一個總體,共有r+k個總體.檢驗問題是:
(1)H0:A因素對研究對象無顯著性影響;H1:A因素對研究對象有顯著性影響.
(2)H0:B因素對研究對象無顯著性影響;H1:B因素對研究對象有顯著性影響.設對每個總體進行獨立重復試驗共取得樣本數(shù)據(jù),記xij表示第i個行總體第j個列總體的試驗數(shù)據(jù),數(shù)據(jù)結構見表7.2.1.7.2雙因素方差分析7.2.2無交互作用的雙因素方差分析7.2雙因素方差分析7.2.2無交互作用的雙因素方差分析無交互作用的方差分析假設:
(1)第i個行水平總體都服從N(mi,s2),i=1,2,…,r;
(2)第j個列水平總體都服從N(mj,s2),j=1,2,…,k
;
(3)所有的試驗結果xij都相互獨立.因此,檢驗問題可以轉化為對下述假設進行檢驗:
(1)H0:mi全相等;H1:mi不全相等.
(7.2.1)
(2)H0:mj全相等;H1:mj不全相等.
(7.2.2)7.2雙因素方差分析7.2.2無交互作用的雙因素方差分析
2)總平方和分解與方差分析記稱SST為總偏差平方和,SSA稱為行因素偏差平方和,SSB稱為列因素偏差平方和,SSE稱為隨機因素偏差平方.7.2雙因素方差分析7.2.2無交互作用的雙因素方差分析可以證明,SST=SSA+SSB+SSE,且在滿足假設和H0為真時,
(7.2.3)
(7.2.4)選取(7.2.3)作為行因素A的影響是否顯著的檢驗統(tǒng)計量,(7.2.4)作為檢驗列因素B的影響是否顯著的檢驗統(tǒng)計量.雙因素方差分析仍為F右側檢驗.將上面分析結果排成表7.2.2的形式,即為方差分析表.7.2雙因素方差分析7.2.2無交互作用的雙因素方差分析
例7.2.2對例7.2.1進行方差分析.
解
步驟1原假設與備擇假設為:(1)品牌對彩電銷售量無顯著性影響;
品牌對彩電銷售量有顯著性影響.(2)地區(qū)對彩電銷售量無顯著性影響;
地區(qū)對彩電銷售量有顯著性影響.表7.2.2無交互作用的雙因素方差分析表差異源SSdfMSFFcrit因素
SSAr-1MSAFAFa(r-1,(r-1)(k-1))因素
SSBk-1MSBFBFa(r-1,(k-1)(k-1))誤差
SSE(r-1)(k-1)MSE
總計SSTrk-1
7.2雙因素方差分析7.2.2無交互作用的雙因素方差分析
步驟2計算方差分析表.用Excel計算得方差分析表如下:
步驟3統(tǒng)計推斷.本例品牌因素有3個水平,地區(qū)因素有4水平,因此r=3,k=4,n=12,
FA~F(2,6),FB~F(3,6).因FA=18>5.14=F0.05(2,6),故在a=0.05下拒絕H0,即品牌對彩電銷售量有顯著性影響.因FB=7>4.76=F0.05(3,6),故在a=0.05下拒絕H0,即地區(qū)對彩電銷售量有顯著性影響.差異源SSdfMSFP-valueFcrit行32216180.005.14列18.6736.2270.024.76誤差5.3360.89總計56117.2雙因素方差分析7.2.3有交互作用的雙因素方差分析
例7.2.3從某市高考考生中隨機抽取男生女生各36人,按考生性別和父母文化程度登記個人的考試成績,其中父母文化程度(按父母中較高者)分為小學以下、初中、高中、中專、本科和研究生以上六種分類,數(shù)據(jù)如下:
父母最高文化程度
小學以下初中高中中專本科研究生以上考生性別男生493415425329510590388438541440498459312380306401540531288437456458561480410390391499524418343476518508462534女生3294903203805005205065414845844565675244084174894045444055805705675304253075053515525213192923175035373195027.2雙因素方差分析7.2.3有交互作用的雙因素方差分析
試檢在a=0.05下檢驗考生性別和父母文化程度對高考成績有無顯著性影響.父母文化程度、考生的性別可能會影響考生的成績,同時父母文化程度和考生性別可能共同影響考生的成績,考慮有交互作用的方差分析.1)檢驗問題在有交互作用的方差分析中,設行因素A有r個水平,列因素B有個k水平.將每一水平看作一個總體,行因素A有r個總體,列因素B有k個總體.將水平(Ai,Bj)看作一個總體,共有r×k個總體.檢驗問題是:
(1)H0:因素A對研究對象有影響;H1:因素A對研究對象有影響.
(2)H0:因素B對研究對象有影響;H1:因素B對研究對象有影響.
(3)H0:因素A和B共同對研究對象有影響;H1:因素A和B共同對研究對象有影響.7.2雙因素方差分析7.2.3有交互作用的雙因素方差分析為了檢驗因素A和B是否相互獨立,即他們的不同組合是否會產生影響,對因素A和B的水平的每對組合都作m次試驗,共取得r×k×m個數(shù)據(jù),數(shù)據(jù)結構見表7.2.3.7.2雙因素方差分析7.2.3有交互作用的雙因素方差分析有交互作用的方差分析假設:
(1)第i個行水平總體都服從N(mi,s2),i=1,2,…,r;
(2)第j個列水平總體都服從N(mj,s2),j=1,2,…,k;
(3)每一對水平(Ai,Bj)總體都服從N(mij,s2),
;
(4)所有的試驗結果xijl都相互獨立.7.2雙因素方差分析7.2.3有交互作用的雙因素方差分析因此,假設問題可以轉化為對下述假設進行檢驗:
(1)對行因素提出的假設為:
H0:mi全相等;H1:mi不全相等.
(7.2.5)
(2)對列因素提出的假設為:
H0:mj全相等;H1:mj不全相等.
(7.2.6)
(3)對行因素和列因素提出的假設為:
H0:mij全相等;H1:mij不全相等.
(7.2.7)7.2雙因素方差分析7.2.3有交互作用的雙因素方差分析
2)總平方和分解與方差分析記稱SST為總偏差平方和,稱SSA為A因素偏差平方和,稱SSB為B因素偏差平方和,稱SAB為A因素與B因素交互作用偏差平方和,稱SSE為隨機因素偏差平方.7.2雙因素方差分析7.2.3有交互作用的雙因素方差分析可以證明,SST=SSA+SSB+SAB+SSE,且在滿足假設和H0為真時,
,
(7.2.8)
,
(7.2.9)
.
(7.2.10)選取(7.2.8)作為行因素的影響是否顯著的檢驗統(tǒng)計量,(7.2.9)作為列因素的影響是否顯著的檢驗統(tǒng)計量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 塑石工崗前安全生產意識考核試卷含答案
- 整模脫模工崗前節(jié)能考核試卷含答案
- 擠壓修模工安全風險強化考核試卷含答案
- 苯酐裝置操作工崗前崗后考核試卷含答案
- 煤粉工QC考核試卷含答案
- 潤滑油調合操作工保密能力考核試卷含答案
- 廢舊電池及電池系統(tǒng)處置員成果轉化水平考核試卷含答案
- 耐火原料煅燒工操作規(guī)范水平考核試卷含答案
- 2026年時事政治測試題庫及答案(考點梳理)
- 2025河北交投物流有限公司招聘社會人員8人備考題庫附答案
- 大數(shù)據(jù)安全技術與管理
- 2026年中小學校長校園安全管理培訓考試題及答案
- 2025年山東建筑大學思想道德修養(yǎng)與法律基礎期末考試模擬題必考題
- 江西省贛州地區(qū)2023-2024學年七年級上學期期末英語試(含答案)
- 2025年香港滬江維多利亞筆試及答案
- 述職報告中醫(yī)
- 患者身份識別管理標準
- 松下Feeder維護保養(yǎng)教材
- 汽車融資貸款合同范本
- 雨課堂學堂在線學堂云《高分子與阻燃材料成型加工( 理大)》單元測試考核答案
- 血透室護士長5分鐘述職報告
評論
0/150
提交評論