版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第7章方差分析授課老師:李芳鳳
email:fangfly2003@163.com第5章介紹了兩個(gè)樣本均值比較的t檢驗(yàn),而在實(shí)際中,經(jīng)常會(huì)遇到多個(gè)樣本均值比較的問題,方差分析方法就是處理這類問題的一種常用統(tǒng)計(jì)方法。方差分析中的有關(guān)術(shù)語試驗(yàn)指標(biāo)所要考察的指標(biāo)如水質(zhì)的惡臭、產(chǎn)品的顏色、油漆的亮度因素影響試驗(yàn)指標(biāo)的原因或條件通常用大寫英文字母A、B、C表示方差分析中的有關(guān)術(shù)語水平因素所處的不同狀態(tài)通常用表示該因素的字母加下標(biāo)表示,如Ai試驗(yàn)處理(處理)對(duì)受試對(duì)象給予的某種外部干預(yù)或措施,是因素水平的一個(gè)組合?!纠磕翅t(yī)生為研究一種降糖藥的療效,以統(tǒng)一的納入標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn)選擇了60名II型糖尿病患者,隨機(jī)將其分為三組進(jìn)行雙盲臨床試驗(yàn)。其中高劑量組21人,低劑量組19人,對(duì)照組20人,對(duì)照組服用公認(rèn)的降糖藥物。治療4周后測(cè)得其餐后2小時(shí)血糖的下降值(mmol/L),結(jié)果如表1。問治療4周后餐后2小時(shí)血糖下降值的三組總體水平是否不同?表1
II型糖尿病患者治療4周后餐后2小時(shí)血糖的下降值(mmol/L)高劑量組低劑量組對(duì)照組
5.6-0.6 12.4
9.5
5.70.9
6.0
12.87.0
8.7
4.1 3.9
…
…
…
4.9
4.3 9.4
8.1
6.4 3.8
3.8
7.07.5
6.1
5.48.4
13.2
3.112.2
16.5
6.09.2試驗(yàn)指標(biāo):血糖的下降值;影響試驗(yàn)指標(biāo)的條件稱為因素為藥物;因素所處的狀態(tài)稱為該因素的水平----本例藥物有3個(gè)不同的水平
在一項(xiàng)試驗(yàn)中,如果影響試驗(yàn)指標(biāo)的因素只有一個(gè),則稱該試驗(yàn)為單因素試驗(yàn)(本例);如果影響試驗(yàn)指標(biāo)的因素有多個(gè),則稱該試驗(yàn)為多因素試驗(yàn)?!纠磕筹嬃仙a(chǎn)企業(yè)研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無色透明。這四種飲料的營養(yǎng)含量、價(jià)格、包裝、味道等可能影響銷售量的因素全部相同。現(xiàn)從地理位置相似、經(jīng)營規(guī)模相仿的五家超級(jí)市場(chǎng)上收集了前一時(shí)期該飲料的銷售情況,見表2。試分析飲料的顏色是否對(duì)銷售量產(chǎn)生影響。表2該飲料在五家超市的銷售情況超市無色粉色橘黃色綠色1234526.528.731.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8這里,試驗(yàn)指標(biāo)是銷售量,顏色是因素,不同的4種顏色就是這個(gè)因素的4個(gè)不同的水平。這里除了顏色之外,其他因素完全相同,故是單因素的試驗(yàn)。方差分析消費(fèi)者對(duì)四個(gè)行業(yè)的投訴次數(shù)行業(yè)觀測(cè)值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例】為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在4個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對(duì)總共23家企業(yè)投訴的次數(shù)如下表方差分析分析4個(gè)行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對(duì)“投訴次數(shù)”是否有顯著影響作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個(gè)行業(yè)被投訴次數(shù)的均值是否相等若它們的均值相等,則意味著“行業(yè)”對(duì)投訴次數(shù)是沒有影響的,即它們之間的服務(wù)質(zhì)量沒有顯著差異;若均值不全相等,則意味著“行業(yè)”對(duì)投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異方差分析可以檢驗(yàn)這種差異是否顯著方差分析的基本假定每個(gè)總體都應(yīng)服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機(jī)樣本比如,每個(gè)行業(yè)被投訴的次數(shù)必須服從正態(tài)分布各個(gè)總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,4個(gè)行業(yè)被投訴次數(shù)的方差都相等觀察值是獨(dú)立的比如,每個(gè)行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨(dú)立方差分析中的基本假定在上述假定條件下,判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的4個(gè)正態(tài)總體的均值是否相等如果4個(gè)總體的均值相等,可以期望4個(gè)樣本的均值也會(huì)很接近4個(gè)樣本的均值越接近,推斷4個(gè)總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分方差分析中基本假定如果原假設(shè)成立,即H0:
m1=m2=m3=m44個(gè)行業(yè)被投訴次數(shù)的均值都相等意味著每個(gè)樣本都來自均值為、方差為2的同一正態(tài)總體
Xf(X)1
2
3
4
方差分析中基本假定若備擇假設(shè)成立,即H1:mi(i=1,2,3,4)不全相等至少有一個(gè)總體的均值是不同的4個(gè)樣本分別來自均值不同的4個(gè)正態(tài)總體
Xf(X)3
1
2
4
問題的一般提法設(shè)因素有k個(gè)水平,每個(gè)水平的均值分別用1,2,,k
表示要檢驗(yàn)k個(gè)水平(總體)的均值是否相等,需要提出如下假設(shè):H0:
12…k
H1:
1,2,,k
不全相等問題的一般提法設(shè)1為零售業(yè)被投訴次數(shù)的均值,2為旅游業(yè)被投訴次數(shù)的均值,3為航空公司被投訴次數(shù)的均值,4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設(shè)為H0:
1234
H1:
1,2,3,4不全相等在建立單因素試驗(yàn)的數(shù)學(xué)模型之前,先分析一下影響試驗(yàn)結(jié)果變化的原因。引起試驗(yàn)結(jié)果變化的原因有隨機(jī)因素與人為控制因素兩類。ANOVA的基本思想就是通過對(duì)試驗(yàn)結(jié)果數(shù)據(jù)的總變異的分析,將總變異按照變異原因的不同,分解為人為控制因素帶來的變異(因素效應(yīng))和隨機(jī)因素帶來的變異(誤差效應(yīng)),并作出數(shù)量估計(jì)。方差分析的基本思想單因素方差分析的數(shù)據(jù)結(jié)構(gòu)觀察值(j)因素(A)i
水平A1水平A2
…水平As12::n
x11
x21
…
xs1x12
x22
…
xs2::
:
:::
:
:x1n
x2n
…
xsn單因素方差分析
(數(shù)學(xué)模型)設(shè)因素A有s種處理,單因素方差分析可用下面的線性模型來表示
s單因素方差分析
(數(shù)學(xué)模型)設(shè)全部觀測(cè)數(shù)據(jù)的總均值為,第i個(gè)水平效應(yīng)用第i個(gè)處理均值與總均值的差(i-)
表示,記為i,即i=i-。這樣,第i個(gè)處理均值被分解成i=i+,方差分析模型可以表達(dá)為要檢驗(yàn)s個(gè)水平(總體)的均值是否相等,等價(jià)于檢驗(yàn)假設(shè):H0:
1
2…s
H1:
1,2,…,s
不全相等單因素方差分析
(數(shù)學(xué)模型)平方和分解從方差分析的基本思想出發(fā),要把一個(gè)試驗(yàn)的總變異依據(jù)變異來源分為相應(yīng)的變異。引起觀察值出現(xiàn)變異的原因有處理效應(yīng)和誤差效應(yīng)。處理間平均值的差異由處理效應(yīng)所致,同一處理內(nèi)的變異則由隨機(jī)誤差引起。平方和分解記總離差平方和平方和分解記水平Aj下的樣本平均值為式中:ni為第i個(gè)總體的樣本觀察值個(gè)數(shù)
xij為第i個(gè)總體的第j個(gè)觀察值
平方和分解將SST寫成=0=SSE=SSASST=SSE+SSA平方和分解總離差平方和誤差平方和效應(yīng)平方和由隨機(jī)誤差引起的由不同水平的效應(yīng)差異和隨機(jī)誤差引起的平方和的統(tǒng)計(jì)特征由第3章可知故同理構(gòu)造檢驗(yàn)統(tǒng)計(jì)量由F分布定義記從而得到方差分析的拒絕域構(gòu)造檢驗(yàn)統(tǒng)計(jì)量當(dāng)這個(gè)比值大到某種程度時(shí),就可以說不同水平之間存在著顯著差異,即因素各水平對(duì)總體的影響較大。從而得到方差分析的拒絕域單因素方差分析表誤差來源平方和(SS)自由度(df)均方(MS)F值組間SSAk-1MSAMSAMSE組內(nèi)(誤差)SSEn-kMSE總和SSTn-1分析步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)決策提出假設(shè)一般提法H0
:m1=m2=…=
ms
因素各水平對(duì)試驗(yàn)指標(biāo)沒有顯著影響
H1:m1
,m2
,…
,ms不全相等因素各水平對(duì)試驗(yàn)指標(biāo)有顯著影響
注意:拒絕原假設(shè),只表明至少有兩個(gè)總體的均值不相等,并不意味著所有的均值都不相等構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量構(gòu)造統(tǒng)計(jì)量需要計(jì)算水平的均值全部觀察值的總均值誤差平方和均方(MS)構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(例題分析)構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量前例的計(jì)算結(jié)果SST=(57-47.869565)2+…+(58-47.869565)2=115.9295計(jì)算總誤差平方和SST計(jì)算組間平方和SSA前例的計(jì)算結(jié)果SSA
=1456.608696構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
前例的計(jì)算結(jié)果SSE
=2708計(jì)算組內(nèi)平方和SSE
構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算均方MS)組間方差:SSA的均方,記為MSA,計(jì)算公式為組內(nèi)方差:SSE的均方,記為MSE,計(jì)算公式為構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算檢驗(yàn)統(tǒng)計(jì)量F)統(tǒng)計(jì)決策
將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行比較,作出對(duì)原假設(shè)H0的決策根據(jù)給定的顯著性水平,在F分布表中查找與第一自由度df1=s-1、第二自由度df2=n-s相應(yīng)的臨界值F
若F>F
,則拒絕原假設(shè)H0
,表明均值之間的差異是顯著的,所檢驗(yàn)的因素對(duì)觀察值有顯著影響若F<F
,則不拒絕原假設(shè)H0
,無證據(jù)表明所檢驗(yàn)的因素對(duì)觀察值有顯著影響統(tǒng)計(jì)決策用Excel進(jìn)行方差分析
(Excel分析步驟)第1步:選擇“工具”下拉菜單第2步:選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在分析工具中選擇【單因素方差分析】
,然后選擇【確定】第4步:當(dāng)對(duì)話框出現(xiàn)時(shí)在【輸入?yún)^(qū)域】方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域在【】方框內(nèi)鍵入0.05(可根據(jù)需要確定)在【輸出選項(xiàng)】中選擇輸出區(qū)域練習(xí)為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在4個(gè)行業(yè)分別抽取了不同的企業(yè)的投訴數(shù)據(jù)作為樣本,共23家。得如下方差分析表,請(qǐng)將表中空格填上。練習(xí)某企業(yè)準(zhǔn)備用三種方法組裝一種新的產(chǎn)品,為確定哪種方法每小時(shí)生產(chǎn)的產(chǎn)品數(shù)量最多,隨機(jī)抽取了30名工人,并指定每個(gè)人使用其中的一種方法。通過對(duì)每個(gè)工人生產(chǎn)的產(chǎn)品數(shù)進(jìn)行方差分析得到下面的結(jié)果:要求:(1)完成上面的方差分析表。(2)檢驗(yàn)三種方法組裝的產(chǎn)品數(shù)量之間是否有顯著差異?差異源SSdfMSFFcrit組間2103.3541組內(nèi)3836——總計(jì)29———42021.47810227142.0740744256多重比較的意義通過對(duì)總體均值之間的配對(duì)比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異提出假設(shè)H0:mi=mj(第i個(gè)總體的均值等于第j個(gè)總體的均值)H1:mimj(第i個(gè)總體的均值不等于第j個(gè)總體的均值)多重比較的步驟提出假設(shè)H0:mi=mj(第i個(gè)總體的均值等于第j個(gè)總體的均值)H1:mimj(第i個(gè)總體的均值不等于第j個(gè)總體的均值)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量:計(jì)算LSD決策:若,拒絕H0;若
,不拒絕H0t分布自由度為(n-k)消費(fèi)者對(duì)四個(gè)行業(yè)的投訴次數(shù)行業(yè)觀測(cè)值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例】為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在4個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對(duì)總共23家企業(yè)投訴的次數(shù)如下表用SPSS進(jìn)行方差分析和多重比較第1步:選擇【Analyze】,并選擇【GeneralLinearModel-Univaiate】進(jìn)入主對(duì)話框第2步:將因變量)選入【DependentVariable】,將自變量選入【FixedFactor(s)】第3步(需要均值圖時(shí))點(diǎn)擊【Plots】,將“行業(yè)”選入【HorizontalAxis】,在【Plots】下點(diǎn)擊【Add】,點(diǎn)擊【Continue】回到主對(duì)話框(需要多重比較時(shí))點(diǎn)擊【Post-Hoc】,將“行業(yè)”選入【Post-HocTestfor】,在【EqualVariancesAssumed】下選擇一種方法,如LSD,點(diǎn)擊【Continue】回到主對(duì)話框用SPSS進(jìn)行方差分析和多重比較(需要相關(guān)統(tǒng)計(jì)量時(shí))點(diǎn)擊【Options】,在【Display】下選中【Descriptive】,點(diǎn)擊【Continue】回到主對(duì)話框(需要方差齊性檢驗(yàn)時(shí))點(diǎn)擊【Options】,在【Display】下選中【Homogeneitytests】,點(diǎn)擊【Continue】回到主對(duì)話框(需要對(duì)模型的參數(shù)進(jìn)行估計(jì)時(shí))點(diǎn)擊【Options】,在【Display】下選中【Parameterestimates】,點(diǎn)擊【Continue】回到主對(duì)話框(需要預(yù)測(cè)值時(shí))點(diǎn)擊【Save】,并在【PredictedValues】下選中【Unstandardized】,點(diǎn)擊【Continue】回到主對(duì)話框;點(diǎn)擊【OK】(注:選擇【Analyze-CompareMeans】,并選擇【One-Way-ANOVA】也可以進(jìn)行單因素方差分析,但得到的結(jié)果不如上面多)SPSS(CorrectedModel)是對(duì)整個(gè)方差分析模型的檢驗(yàn)。其原假設(shè)是:模型中的因素(行業(yè))對(duì)因變量(投訴次數(shù))無顯著影響。由于顯著性水平Sig.<0.05,表明該模型是顯著的雙因素方差分析分析兩個(gè)因素(行因素Row和列因素Column)對(duì)試驗(yàn)結(jié)果的影響如果兩個(gè)因素對(duì)試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷行因素和列因素對(duì)試驗(yàn)數(shù)據(jù)的影響,這時(shí)的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復(fù)雙因素方差分析(Two-factorwithoutreplication)如果除了行因素和列因素對(duì)試驗(yàn)數(shù)據(jù)的單獨(dú)影響外,兩個(gè)因素的搭配還會(huì)對(duì)結(jié)果產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析
(Two-factorwithreplication)雙因素方差分析的基本假定每個(gè)總體都服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來自正態(tài)分布總體的簡單隨機(jī)樣本各個(gè)總體的方差必須相同對(duì)于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的觀察值是獨(dú)立的雙因素方差分析
(數(shù)學(xué)模型)設(shè)因素A有I種處理,因素B有J種處理,雙因素方差分析可用下面的線性模型來表示ij=0(無重復(fù)雙因素分析)雙因素方差分析不同品牌的彩電在5個(gè)地區(qū)的銷售量數(shù)據(jù)品牌因素地區(qū)因素地區(qū)1地區(qū)2地區(qū)3地區(qū)4地區(qū)5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298【例】有4個(gè)品牌的彩電在5個(gè)地區(qū)銷售,為分析彩電的品牌(品牌因素)和銷售地區(qū)(地區(qū)因素)對(duì)銷售量的影響,對(duì)每個(gè)品牌在各地區(qū)的銷售量取得以下數(shù)據(jù)。試分析品牌和銷售地區(qū)對(duì)彩電的銷售量是否有顯著影響?(=0.05)雙因素方差分析表
(基本結(jié)構(gòu))誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值行因素SSRk-1MSRMSRMSE列因素SSCr-1MSCMSCMSE誤差SSE(k-1)(r-1)MSE總和SSTkr-1雙因素方差分析例題分析提出假設(shè)對(duì)品牌因素提出的假設(shè)為H0:m1=m2=m3=m4(品牌對(duì)銷售量無顯著影響)H1:mi
(i=1,2,…,4)
不全相等(有顯著影響)對(duì)地區(qū)因素提出的假設(shè)為H0:m1=m2=m3=m4=m5(地區(qū)對(duì)銷售量無顯著影響)H1:mj
(j=1,2,…,5)
不全相等(有顯著影響)
無重復(fù)雙因素分析
(Excel
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 防火安全培訓(xùn)教育中心課件
- 防差錯(cuò)安全課件
- 隊(duì)員安全培訓(xùn)總結(jié)報(bào)告課件
- 閉口化妝技巧培訓(xùn)課件
- 鏟車工安全培訓(xùn)資料課件
- 部門間溝通培訓(xùn)課件
- 避孕藥具課件培訓(xùn)
- 道路運(yùn)輸安全培訓(xùn)平臺(tái)課件
- 道路運(yùn)輸安全員培訓(xùn)資料課件
- 道路泊車安全培訓(xùn)課件
- 【一例擴(kuò)張型心肌病合并心力衰竭患者的個(gè)案護(hù)理】5400字【論文】
- 四川橋梁工程系梁專項(xiàng)施工方案
- DB32T 3695-2019房屋面積測(cè)算技術(shù)規(guī)程
- 貴州省納雍縣水東鄉(xiāng)水東鉬鎳礦采礦權(quán)評(píng)估報(bào)告
- GB 8270-2014食品安全國家標(biāo)準(zhǔn)食品添加劑甜菊糖苷
- 2023年杭州臨平環(huán)境科技有限公司招聘筆試題庫及答案解析
- 易制毒化學(xué)品日常管理有關(guān)問題權(quán)威解釋和答疑
- LF爐機(jī)械設(shè)備安裝施工方案
- 湖北省高等教育自學(xué)考試
- 企業(yè)三級(jí)安全生產(chǎn)標(biāo)準(zhǔn)化評(píng)定表(新版)
- 中心衛(wèi)生院關(guān)于成立按病種分值付費(fèi)(DIP)工作領(lǐng)導(dǎo)小組及制度的通知
評(píng)論
0/150
提交評(píng)論