《統(tǒng)計學(xué)》課件 7方差分析_第1頁
《統(tǒng)計學(xué)》課件 7方差分析_第2頁
《統(tǒng)計學(xué)》課件 7方差分析_第3頁
《統(tǒng)計學(xué)》課件 7方差分析_第4頁
《統(tǒng)計學(xué)》課件 7方差分析_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第7章方差分析PowerPoint統(tǒng)計學(xué)統(tǒng)計應(yīng)用

某飲料生產(chǎn)企業(yè)研制一種新型飲料。飲料的顏色共有四種,分為桔黃色、粉色、綠色和無色透明。隨機(jī)從五家超市收集了該種飲料上月銷量,問不同顏色是否對飲料的銷量產(chǎn)生影響?超市無色粉色桔黃色綠色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8學(xué)習(xí)目標(biāo)與重難點(diǎn)提示解釋方差分析的基本概念理解方差分析的基本思想和原理※

掌握單因素方差分析的方法及應(yīng)用※

理解無交互作用的雙因素方差分析用Excel進(jìn)行方差分析※目的:為回歸分析提供方法理論基礎(chǔ)。主要章節(jié)

7.1方差分析的引論※

7.3雙因素方差分析

7.2單因素方差分析※7.1方差分析引論7.1.1方差分析及其有關(guān)術(shù)語7.1.2方差分析的基本思想和原理※7.1.3問題的一般提法內(nèi)容提示7.1.1

方差分析及其有關(guān)術(shù)語什么是方差分析(ANOVA)?

(analysisofvariance)檢驗(yàn)多個總體均值是否相等※通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等(通過方差的比較)

※研究分類型自變量對數(shù)值型因變量的影響一個或多個分類型自變量兩個或多個(k個)處理水平或分類一個數(shù)值型因變量有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個分類的自變量雙因素方差分析:涉及兩個分類的自變量什么是方差分析?

(例題分析)【例】某飲料生產(chǎn)企業(yè)研制一種新型飲料。飲料的顏色共有四種,分為桔黃色、粉色、綠色和無色。隨機(jī)從10家超市收集了不同顏色飲料上月銷售量,銷售量情況如下表所示,試檢驗(yàn)不同顏色飲料對銷量是否有顯著性影響?例7.1超市四個顏色的飲料銷量情況超市四個顏色的飲料銷量表顏色觀測值無色粉色桔黃色綠色1234567891040656020503055706545305055403530307060255580605565506070804545706050605055707550例7.1什么是方差分析?

(例題分析)分析四個顏色之間的銷量是否有顯著差異,也就是要判斷“顏色對“銷量”是否有顯著影響。作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個顏色銷量的均值是否相等。若它們的均值相等,則意味著“顏色”對銷量是沒有影響的,即不同顏色對銷量沒有顯著差異;若均值不全相等,則意味著“顏色”對銷量是有影響的,顏色對銷量有顯著影響。方差分析中的有關(guān)術(shù)語因素或因子(factor)所要檢驗(yàn)的對象要分析顏色對銷量是否有影響,顏色是要檢驗(yàn)的因素或因子水平或處理(treatment)因子的不同表現(xiàn)桔黃色、粉色、綠色、無色就是因子的水平觀察值在每個因素水平下得到的樣本數(shù)據(jù)每個顏色中的銷量就是觀察值方差分析中的有關(guān)術(shù)語試驗(yàn)這里只涉及一個因素,因此稱為單因素四水平的試驗(yàn)總體因素的每一個水平可以看作是一個總體比如桔黃色、粉色、綠色、無色可以看作是四個總體樣本數(shù)據(jù)銷量可以看作是從這四個總體中抽取的樣本數(shù)據(jù)7.1.2

方差分析的基本思想

和原理※方差分析的基本思想和原理

(圖形分析)從散點(diǎn)圖上可以看出顏色對銷量是有明顯差異的同一個顏色,不同銷量也明顯不同桔黃色平均銷量較高,粉色平均銷量較低顏色與銷量之間有一定的關(guān)系如果顏色與銷量之間沒有關(guān)系,那么它們銷量是差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近方差分析的基本思想和原理

(圖形分析)僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不同顏色銷量之間有顯著差異。這種差異也可能是由于抽樣的隨機(jī)性所造成的需要有更準(zhǔn)確的方法來檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析。所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時則需要借助于方差這個名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時,需要考察數(shù)據(jù)誤差的來源。方差分析的基本思想和原理1. 比較兩類誤差,以檢驗(yàn)均值是否相等2. 比較的基礎(chǔ)是方差比3. 如果系統(tǒng)(處理)誤差明顯地不同于隨機(jī)誤差,則均值就是不相等的;反之,均值就是相等的4. 誤差是由各部分的誤差占總誤差的比例來測度的方差分析的基本思想和原理方差分析的基本思想和原理

(兩類誤差)隨機(jī)誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一顏色下銷量是不同的這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差

系統(tǒng)誤差因素的不同水平(不同總體)下,各觀察值之間的差異比如,不同顏色之間的銷量之間的差異這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于顏色本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差方差分析的基本思想和原理

(誤差平方和)數(shù)據(jù)的誤差用平方和(sumofsquares)表示組內(nèi)平方和(withingroups)因素的同一水平(同一個總體)下樣本數(shù)據(jù)的平方和比如,桔黃色銷量的誤差平方和組內(nèi)平方和只包含隨機(jī)誤差組間平方和(betweengroups)因素的不同水平(不同總體)下各樣本之間的平方和比如,四個顏色銷量之間的誤差平方和組間平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差方差分析的基本思想和原理

(誤差的比較)若原假設(shè)成立,組間平方和與組內(nèi)平方和經(jīng)過平均后的數(shù)值就應(yīng)該很接近,它們的比值就會接近1。若原假設(shè)不成立,組間平方和平均后的數(shù)值就會大于組內(nèi)平方和平均后的數(shù)值,它們之間的比值就會大于1。當(dāng)這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,也就是自變量對因變量有影響判斷顏色對銷量是否有顯著影響,也就是檢驗(yàn)銷量的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說明不同顏色對銷量有顯著影響。7.1.3問題的一般提法問題的一般提法設(shè)因素有k個水平,每個水平的均值分別用

1,

2,,

k

表示要檢驗(yàn)k個水平(總體)的均值是否相等,需要提出如下假設(shè):H0:

1

2

k

H1:

1,

2,,

k

不全相等設(shè)

1為無色銷量的均值,

2為粉色銷量的均值,

3為桔黃色銷量的均值,

4為綠色銷量的均值,提出的假設(shè)為H0:

1

2

3

4

顏色與銷量沒有顯著影響H1:

1,

2,

3,

4

不全相等顏色與銷量有顯著影響7.2單因素方差分析※

7.2.1數(shù)據(jù)結(jié)構(gòu)7.2.2分析步驟7.2.3關(guān)系強(qiáng)度的測量※

7.2.4用Excel進(jìn)行方差分析※內(nèi)容提示7.2.1

單因素方差分析的數(shù)據(jù)結(jié)構(gòu)

7.2.1

單因素方差分析的數(shù)據(jù)結(jié)構(gòu)

(one-wayanalysisofvariance)

觀察值(j)因素(A)i

水平A1水平A2

…水平Ak12::n

x11

x21

xk1x12

x22

xk2::

:

:::

:

:x1n

x2n

xkn分析步驟※提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計量(給出臨界值)統(tǒng)計決策(決策與結(jié)論)7.2.2單因素方差分析步驟提出假設(shè)一般提法H0

:m1=m2=…=

mk

自變量對因變量沒有顯著影響

H1:m1

,m2

,…

,mk不全相等自變量對因變量有顯著影響

注意:拒絕原假設(shè),只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等構(gòu)造檢驗(yàn)的統(tǒng)計量構(gòu)造統(tǒng)計量需要計算:水平的均值全部觀察值的總均值誤差平方和(SS)

SST=SSA+SSE均方差(MS)

MST=MSA+MSE構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算水平的均值)假定從第i個總體中抽取一個容量為ni的簡單隨機(jī)樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)(組內(nèi)均值-水平均值)計算公式為式中:ni為第i個總體的樣本觀察值個數(shù)

xij為第i個總體的第j個觀察值

構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個數(shù)計算公式為

(總平均值)構(gòu)造檢驗(yàn)的統(tǒng)計量(例題分析)

超市4個顏色飲料銷量及其均值超市顏色無色粉色桔黃色綠色1403055452655080703605560604204055505503565606303050507553060558707070709656080751045254550構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算總誤差平方和SST)全部觀察值

與總平均值

的離差平方和反映全部觀察值的離散狀況其計算公式為

前例的計算結(jié)果:

SST=(40-53.25)2+…+(50-53.25)2=9027.5構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算水平項(xiàng)平方和SSA)各組平均值與總平均值

的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計算公式為

前例的計算結(jié)果:SSA=2302.5構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算誤差項(xiàng)平方和SSE)每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況,又稱組內(nèi)平方和該平方和反映的是隨機(jī)誤差的大小計算公式為

前例的計算結(jié)果:SSE=6725構(gòu)造檢驗(yàn)的統(tǒng)計量

(三個平方和的關(guān)系)

總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和(SSA)之間的關(guān)系SST=SSA+SSE

前例的計算結(jié)果:

9027.5=2302.5+6725構(gòu)造檢驗(yàn)的統(tǒng)計量

(三個平方和的作用)

SST反映全部數(shù)據(jù)總的誤差程度;SSE(組內(nèi)平方和)反映隨機(jī)誤差的大??;SSA(組間平方和)反映隨機(jī)誤差和系統(tǒng)誤差的大小如果原假設(shè)成立,則表明沒有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE除以自由度后的均方差異就不會太大;如果組間均方顯著地大于組內(nèi)均方,說明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差判斷因素的水平是否對其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算均方MS)各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計算方法是用誤差平方和除以相應(yīng)的自由度三個平方和對應(yīng)的自由度分別是SST(總誤差平方和)

的自由度為n-1,其中n為全部觀察值的個數(shù)SSA(組間平方和)的自由度為k-1,其中k為因素水平(總體)的個數(shù)SSE(組內(nèi)平方和)的自由度為n-k構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算均方MS)

組間方差:SSA的均方,記為MSA,計算公式為:

組內(nèi)方差:SSE的均方,記為MSE,計算公式為:構(gòu)造檢驗(yàn)的統(tǒng)計量

(計算檢驗(yàn)統(tǒng)計量F)將MSA和MSE進(jìn)行對比,即得到所需要的檢驗(yàn)統(tǒng)計量F當(dāng)H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k的

F分布,即構(gòu)造檢驗(yàn)的統(tǒng)計量

(F分布與拒絕域)如果均值相等,F(xiàn)=MSA/MSE

1a

F分布F

(k-1,n-k)0拒絕H0不能拒絕H0F統(tǒng)計決策

將統(tǒng)計量的值F與給定的顯著性水平

的臨界值F

進(jìn)行比較,作出對原假設(shè)H0的決策。根據(jù)給定的顯著性水平

,在F分布表中查找與第一自由度(分子)df1=k-1、第二自由度(分母)df2=n-k相應(yīng)的臨界值

F

。若F>F

,則拒絕原假設(shè)H0

,表明均值之間的差異是顯著的,所檢驗(yàn)的因素對觀察值有顯著影響。若F<F

,則不能拒絕原假設(shè)H0

,無證據(jù)支持表明所檢驗(yàn)的因素對觀察值有顯著影響。統(tǒng)計量F的抽樣分布

F

(k-1,n-k)0拒絕H0不能拒絕H0F例題7.1分析1.提出假設(shè)2.根據(jù)數(shù)據(jù)計算結(jié)果3.顯著性水平

,在F分布表中查找與分子自由度df1=k-1=3、分母自由度df2=n-k=36,相應(yīng)的臨界值

F

4.決策:5.結(jié)論:由樣本提供的信息表明:顏色之間的銷量均值有顯著性差異,即不同顏色對銷量有顯著性影響。單因素方差分析表

(基本結(jié)構(gòu))

7.2.4

用Excel進(jìn)行方差分析※用Excel進(jìn)行方差分析

(Excel檢驗(yàn)步驟)第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析”選項(xiàng)第3步:在分析工具中選擇“單因素方差分析”

,然后選擇“確定”第4步:當(dāng)對話框出現(xiàn)時

在“輸入?yún)^(qū)域”方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域在

方框內(nèi)鍵入0.05(可根據(jù)需要確定)在“輸出選項(xiàng)”中選擇輸出區(qū)域

用Excel進(jìn)行方差分析單因素方差分析

4個顏色飲料銷量的方差分析表7.2.3關(guān)系強(qiáng)度的測量※關(guān)系強(qiáng)度的測量

拒絕原假設(shè)表明因素(自變量)與觀測值(因變量)之間有關(guān)系組間平方和(SSA)度量了自變量(顏色)對因變量(銷量)的影響效應(yīng)只要組間平方和SSA不等于0,就表明兩個變量之間有關(guān)系(只是是否顯著的問題)當(dāng)組間平方和比組內(nèi)平方和(SSE)大,而且大到一定程度時,就意味著兩個變量之間的關(guān)系顯著,大得越多,表明兩變量之間的關(guān)系就越強(qiáng)。反之,就意味著兩個變量之間的關(guān)系不顯著,小得越多,表明它們之間的關(guān)系就越弱。關(guān)系強(qiáng)度的測量

變量間關(guān)系的強(qiáng)度用自變量平方和(SSA)及殘差平方和(SSE)占總平方和(SST)的比例大小來反映自變量平方和占總平方和的比例記為R2,即其平方根R就可以用來測量兩個變量之間的關(guān)系強(qiáng)度關(guān)系強(qiáng)度的測量

(例題分析)

R=0.505029結(jié)論:顏色(自變量)對銷量(因變量)的影響效應(yīng)占總效應(yīng)的25.5054%,而殘差效應(yīng)則占74.49496%。即顏色對銷量差異解釋的比例達(dá)到近26%,而其他因素(殘差變量)所解釋的比例近為74%以上。

R=0.505029,表明顏色與銷量之間有中等的相關(guān)關(guān)系。課堂練習(xí)某企業(yè)準(zhǔn)備用3種方法組裝一種新的產(chǎn)品,為確定哪種方法每小時生產(chǎn)的產(chǎn)品數(shù)量最多,隨機(jī)抽取了32名工人,并指定每個人使用其中的一種方法,通過對每個工人生產(chǎn)的產(chǎn)品數(shù)進(jìn)行方差分析得到下面的結(jié)果(1)完成方差分析表(2)若顯著性水平為0.05,檢驗(yàn)3種方法組裝的產(chǎn)品數(shù)量之間是否有顯著性差異?課堂練習(xí)差異源SSdfMSFPFcrit組間2100.24593.35組內(nèi)3836---總計31----2294204256132.31.59(1)完成方差分析表(2)若顯著性水平α=0.05,因?yàn)閜>α,所以不拒絕原假設(shè),沒有足夠證據(jù)表明三種方法對產(chǎn)量有顯著性影響。

(3)關(guān)系強(qiáng)度R2=420/4256=0.0987

R=0.317.3雙因素方差分析7.3.1雙因素方差分析及其類型7.3.2無交互作用的雙因素方差分析內(nèi)容提示7.3.1

雙因素方差分析及其類型雙因素方差分析

(two-wayanalysisofvariance)

分析兩個因素(行因素Row和列因素Column)對試驗(yàn)結(jié)果的影響如果兩個因素對試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷行因素和列因素對試驗(yàn)數(shù)據(jù)的影響,這時的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復(fù)雙因素方差分析(Two-factorwithoutreplication)如果除了行因素和列因素對試驗(yàn)數(shù)據(jù)的單獨(dú)影響外,兩個因素的搭配還會對結(jié)果產(chǎn)生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析

(Two-factorwithreplication)雙因素方差分析的基本假定每個總體都服從正態(tài)分布對于因素的每一個水平,其觀察值是來自正態(tài)分布總體的簡單隨機(jī)樣本各個總體的方差必須相同對于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的觀察值是獨(dú)立的7.3.2

無交互作用的雙因素方差分析

(無重復(fù)雙因素分析)數(shù)據(jù)結(jié)構(gòu)

雙因素方差分析

(例題分析)不同品牌的彩電在各地區(qū)的銷售量數(shù)據(jù)品牌因素地區(qū)因素地區(qū)1地區(qū)2地區(qū)3地區(qū)4地區(qū)5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298【例】有4個品牌的彩電在5個地區(qū)銷售,為分析彩電的品牌(品牌因素)和銷售地區(qū)(地區(qū)因素)對銷售量是否有影響,對每種品牌在各地區(qū)的銷售量取得以下數(shù)據(jù)。試分析品牌和銷售地區(qū)對彩電的銷售量是否有顯著影響?(=0.05)數(shù)據(jù)結(jié)構(gòu)

是行因素的第i個水平下各觀察值的平均值

是列因素的第j個水平下的各觀察值的均值

是全部kr個樣本數(shù)據(jù)的總平均值分析步驟

(提出假設(shè))

提出假設(shè)對行因素提出的假設(shè)為H0:m1=m2

=

…=mi=…=

mk(mi為第i個水平的均值)H1:mi

(i=1,2,…,k)

不全相等對列因素提出的假設(shè)為H0:m1=m2

=

…=mj=…=

mr(mj為第j個水平的均值)H1:mj

(j=1,2,…,r)

不全相等分析步驟

(構(gòu)造檢驗(yàn)的統(tǒng)計量)

計算平方和(SS)總誤差平方和行因素誤差平方和列因素誤差平方和隨機(jī)誤差項(xiàng)平方和分析步驟

(構(gòu)造檢驗(yàn)的統(tǒng)計量)

總離差平方和(SST)、水平項(xiàng)離差平方和(SSR和SSC)、誤差項(xiàng)離差平方和(SSE)之間的關(guān)系SST=SSR+SSC+SSE

分析步驟

(構(gòu)造檢驗(yàn)的統(tǒng)計量)

計算均方(MS)誤差平方和除以相應(yīng)的自由度三個平方和的自由度分別是總離差平方和SST的自由度為

kr-1行因素的離差平方和SSR的自由度為

k-1列因素的離差平方和SSC的自由度為

r-1隨機(jī)誤差平方和SSE的自由度為

(k-1)×(r-1)

分析步驟

(構(gòu)造檢驗(yàn)的統(tǒng)計量)

計算均方(MS)行因素的均方,記為MSR,計算公式為列因素的均方,記為MSC

,計算公式為隨機(jī)誤差項(xiàng)的均方,記為MSE

,計算公式為分析步驟

(構(gòu)造檢驗(yàn)的統(tǒng)計量)

計算檢驗(yàn)統(tǒng)計量(F)檢驗(yàn)行因素的統(tǒng)計量檢驗(yàn)列因素的統(tǒng)計量分析步驟

(統(tǒng)計決策)

將統(tǒng)計量的值F與給定的顯著性水平

的臨界值F

進(jìn)行比較,作出對原假設(shè)H0的決策根據(jù)給定的顯著性水平

在F分布表中查找相應(yīng)的臨界值F

若FR>F

,則拒絕原假設(shè)H0

,表明均值之間的差異是顯著的,即所檢驗(yàn)的行因素對觀察值有顯著影響。若FC

>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論