版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)學(xué)第9章
方差分析第9章
方差分析§1基本問(wèn)題§2單因素方差分析§3雙因素方差分析2§1基本問(wèn)題§1.1方差分析概念§1.2方差分析中的統(tǒng)計(jì)思想§1.3方差分析中的假定3§1.1方差分析概念方差分析方差分析是通過(guò)檢驗(yàn)各總體的均值是否相等來(lái)判斷分類型自變量對(duì)數(shù)值型因變量是否有顯著影響。方差分析不僅可以提高檢驗(yàn)的效率,同時(shí)由于它是將所有的樣本信息結(jié)合在一起,也增加了分析的可靠性。4§1.1方差分析概念【例9.1】某飲料生產(chǎn)企業(yè)研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無(wú)色透明。這四種飲料的營(yíng)養(yǎng)含量、味道、價(jià)格、包裝等可能影響銷售量的因素全部相同。現(xiàn)從地理位置相似、經(jīng)營(yíng)規(guī)模相仿的五家超市收集了前一時(shí)期該飲料的銷售情況,如表9—1所示。試分析飲料的顏色是否對(duì)銷售量產(chǎn)生影響。表9—1不同顏色飲料在五家超市的銷售情況
單位:箱5§1.1方差分析概念分析思路:要判斷“顏色”對(duì)“銷量”是否有顯著影響,實(shí)際上就是要分析四種顏色之間銷量是否有顯著差異,最終被歸結(jié)為檢驗(yàn)這四種顏色飲料銷量的均值是否相等。如果它們的均值相等,即四種不同顏色飲料之間的銷售量沒(méi)有顯著差異,就意味著“顏色”對(duì)銷售量沒(méi)有顯著影響;反之,如果它們的均值不全相等,則意味著“顏色”對(duì)銷售量是有顯著影響。6§1.1方差分析概念因素(因子)在方差分析中,被檢驗(yàn)是否有影響作用的對(duì)象稱為因素或因子。水平(處理)因素的不同表現(xiàn)稱為水平或處理。觀測(cè)值每個(gè)因子水平下得到的樣本數(shù)據(jù)稱為觀測(cè)值。7§1.2方差分析中的統(tǒng)計(jì)思想1.兩類誤差方差分析名稱來(lái)源(1)方差分析兩類誤差(從誤差來(lái)源的角度)隨機(jī)誤差系統(tǒng)誤差(2)方差分析兩類誤差(從總誤差分解的角度)組內(nèi)誤差組間誤差數(shù)據(jù)誤差分解是從總誤差分解的角度來(lái)研究的。8§1.2方差分析中的統(tǒng)計(jì)思想2.誤差分解總平方和(SST):如果用平方和表示數(shù)據(jù)的誤差,那么反映全部數(shù)據(jù)誤差大小的平方和稱為總平方和。誤差平方(SSE):反映組內(nèi)誤差大小的平方和稱為組內(nèi)平方和,也稱為誤差平方和或殘差平方和。因素平方和(SSA):反映組間誤差大小的平方和稱為組間平方和,也稱為因素平方和。9§1.2方差分析中的統(tǒng)計(jì)思想數(shù)據(jù)誤差分解過(guò)程如圖9—1所示。10圖9—1誤差分解示意圖§1.2方差分析中的統(tǒng)計(jì)思想3.誤差分析
(1)組間均方、組內(nèi)均方組間誤差、組內(nèi)誤差經(jīng)過(guò)平均后的數(shù)值稱為組間均方、組內(nèi)均方。
(2)因素(自變量)與因變量的關(guān)系判定如果因素(自變量)對(duì)因變量沒(méi)有影響,那么在組間誤差中只包含隨機(jī)誤差,而沒(méi)有系統(tǒng)誤差,這時(shí)組間均方與組內(nèi)均方之比就會(huì)接近1;如果因素(自變量)對(duì)因變量有影響,則組間誤差中除包含隨機(jī)誤差外,還會(huì)包含系統(tǒng)誤差,這時(shí)組間均方就會(huì)大于組內(nèi)均方,二者的比值就會(huì)大于1。當(dāng)比值大至某種程度時(shí),就認(rèn)為因素的不同水平之間存在著顯著差異,也就是自變量對(duì)因變量有顯著影響。11§1.3方差分析中的假定方差分析假定1.每個(gè)總體都應(yīng)服從正態(tài)分布2.每個(gè)總體的方差相等3.觀測(cè)值彼此獨(dú)立12§2單因素方差分析§2.1數(shù)據(jù)結(jié)構(gòu)§2.2分析步驟§2.3計(jì)算機(jī)實(shí)現(xiàn)結(jié)果13§2.1數(shù)據(jù)結(jié)構(gòu)首先引入單因素方差分析的數(shù)據(jù)結(jié)構(gòu)問(wèn)題。進(jìn)行單因素方差分析時(shí),所要求的數(shù)據(jù)結(jié)構(gòu)形如下表9—2:表9—2單因素方差分析的數(shù)據(jù)結(jié)構(gòu)14§2.2單因素方差分析步驟1.提出假設(shè),即設(shè)立原假設(shè)與備擇假設(shè)2.構(gòu)造檢驗(yàn)統(tǒng)計(jì)量及確定分布3.依據(jù)樣本信息汁算該檢驗(yàn)統(tǒng)計(jì)量的實(shí)際值4.設(shè)定檢驗(yàn)的顯著性水平
并確定臨界值5.比較理論值(臨界值)與實(shí)際值,進(jìn)行決策15§2.2分析步驟1.提出假設(shè),即設(shè)立原假設(shè)與備擇假設(shè)
各因子水平下因變量的均值相等(因子影響作用不顯著)
不全相等
各因子水平下因變量均值不全相等(因子的影響作用顯著)其中,
為因素第個(gè)水平下的總體均值。16§2.2分析步驟2.構(gòu)造檢驗(yàn)統(tǒng)計(jì)量及確定分布總平方和SST:反映全部數(shù)據(jù)誤差大小的平方和稱為總平方和.組間平方和SSA:反映組間誤差大小的平方和稱為組間平方和.。組內(nèi)平方和:反映組內(nèi)誤差大小的平方和稱為組內(nèi)平方和,也稱為誤差平方和或殘差平方和,記為SSE。17§2.2分析步驟下式可以用于驗(yàn)證計(jì)算的正確性:自由度SST的自由度為n-1;SSA的自由度為r-1;SSE的自由度為n-r。n=rm為總觀測(cè)值個(gè)數(shù)r為因素水平數(shù)m為每個(gè)水平下的觀測(cè)值個(gè)數(shù)18§2.2分析步驟組間均方MSA計(jì)算公式組內(nèi)均方MSE計(jì)算公式19§2.2分析步驟F統(tǒng)計(jì)量將MSA與MSE進(jìn)行對(duì)比,得到的比值即為需要的檢驗(yàn)統(tǒng)計(jì)量F統(tǒng)計(jì)量。當(dāng)原假設(shè)
為真時(shí),該比值服從分子自由度為r-1、分母自由度為n-r的F分布.20§2.2分析步驟3.依據(jù)樣本信息計(jì)算該檢驗(yàn)統(tǒng)計(jì)量的實(shí)際值(1)計(jì)算各個(gè)因素水平下的樣本均值(2)計(jì)算所有因素水平下全部樣本的總均值(3)計(jì)算誤差平方和(4)計(jì)算組間均方和組內(nèi)均方及檢驗(yàn)統(tǒng)計(jì)量的樣本值21§2.2分析步驟(1)計(jì)算各個(gè)因素水平下的樣本均值( )(2)計(jì)算所有因素水平下全部樣本的總均值()其中:表示第i個(gè)水平下的第j個(gè)樣本觀測(cè)值;m為該水平下的樣本觀測(cè)值個(gè)數(shù);r為所有因素水平個(gè)數(shù),且。22§2.2分析步驟(3)計(jì)算誤差平方和23§2.2分析步驟(4)計(jì)算組間均方和組內(nèi)均方及檢驗(yàn)統(tǒng)計(jì)量的樣本值24§2.2分析步驟
4.設(shè)定檢驗(yàn)的顯著性水平
并確定臨界值根據(jù)事先設(shè)定的顯著性水平
,在F分布表中查找分子自由度為
、分母自由度為
所對(duì)應(yīng)的臨界值
。5.比較理論值(臨界值)與實(shí)際值大小,進(jìn)行決策通過(guò)比較檢驗(yàn)統(tǒng)計(jì)量的樣本值和臨界值的大小判斷原假設(shè)的拒絕情況。具體判斷原則為:如果
,則拒絕原假設(shè);如果
,則不能拒絕原假設(shè)。25§2.2分析步驟以上分析步驟可以用表格9—3表示,通常稱該表格為方差分析表,具體格式如下:表9—3單因素方差分析表的一般格式26§2.2分析步驟【例9.2】某新品藥進(jìn)入效果測(cè)試階段,測(cè)試人員希望了解該藥品在不同年齡段人群身上的藥效是否相同,因該藥對(duì)骨骼生長(zhǎng)發(fā)育具有強(qiáng)烈抑制作用,故未成年人不在試驗(yàn)范圍內(nèi),因而將試藥人群分為21~30、31~40、41~50和51~60四個(gè)年齡段,每個(gè)年齡段有10名受試者,在其他各項(xiàng)條件都相同情況下開(kāi)展試驗(yàn)。試驗(yàn)開(kāi)始后,分別測(cè)量每個(gè)受試者某項(xiàng)身體指標(biāo)值,數(shù)據(jù)見(jiàn)表9—4。根據(jù)上面的實(shí)驗(yàn)數(shù)據(jù),請(qǐng)分析該新藥在不同年齡段人群的藥效是否相同,即年齡是否影響該藥品效果的一個(gè)因素?(
)27§2.2分析步驟表9—4新品藥效果試驗(yàn)數(shù)據(jù)28§2.2分析步驟解:首先,根據(jù)題意設(shè)定原假設(shè)與備擇假設(shè):
不全相等接下來(lái),依據(jù)樣本數(shù)據(jù)信息計(jì)算檢驗(yàn)統(tǒng)計(jì)量的實(shí)際值:已知:
,
,
。(1)計(jì)算各個(gè)因素水平下的樣本均值29§2.2分析步驟(2)計(jì)算所有因素水平下全部樣本的總均值(3)計(jì)算誤差平方和可見(jiàn):30§2.2分析步驟(4)計(jì)算組間均方和組內(nèi)均方及檢驗(yàn)統(tǒng)計(jì)量的樣本值
根據(jù)事先設(shè)定的顯著性水平
,在F分布表中查找分子自由度為
、分母自由度為
所對(duì)應(yīng)的臨界值
在
之間,顯然,
,因此拒絕原假設(shè),即
不成立,表明該新藥在各個(gè)不同年齡段水平下的藥效存在顯著差異,即年齡是影響該新藥藥效的一個(gè)顯著因素。31§2.3計(jì)算機(jī)實(shí)現(xiàn)結(jié)果目前很多統(tǒng)計(jì)軟件都可以進(jìn)單因素方差分析的數(shù)據(jù)分析,在SPSS統(tǒng)計(jì)軟件中有專門的模塊程序One-WayANOVA進(jìn)行單因素方差分析。以例9.2為例,運(yùn)行該模塊后,SPSS會(huì)自動(dòng)分解誤差平方和,給出組間方差、組內(nèi)方差、
統(tǒng)計(jì)量及相對(duì)應(yīng)的概率值等一些分析結(jié)果,輸出結(jié)果如表9—5所示。表9—5單因素方差分析表(ANOVA)32§3雙因素方差分析§3.1數(shù)據(jù)結(jié)構(gòu)§3.2分析步驟§3.3計(jì)算機(jī)實(shí)現(xiàn)結(jié)果33§3.1數(shù)據(jù)結(jié)構(gòu)
在無(wú)交互作用的雙因素方差分析中,獲取數(shù)據(jù)時(shí),往往將兩個(gè)因素分別作為試驗(yàn)數(shù)據(jù)表的行因素和列因素。假如要考慮A因素和B因素對(duì)考察對(duì)象的影響作用,設(shè)試驗(yàn)中,A因素有r個(gè)水平,B因素有k個(gè)水平,則進(jìn)行雙因素方差分析的試驗(yàn)數(shù)據(jù)表結(jié)構(gòu)應(yīng)形如表9—6。
表9—6雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)34§3.2分析步驟雙因素方差分析的步驟1.提出原假設(shè)與備擇假設(shè)2.構(gòu)造檢驗(yàn)統(tǒng)計(jì)量及確定分布3.依據(jù)樣本信息汁算該檢驗(yàn)統(tǒng)計(jì)量的實(shí)際值4.設(shè)定檢驗(yàn)的顯著性水平
并確定臨界值5.比較理論值(臨界值)與實(shí)際值,進(jìn)行決策35§3.2分析步驟1.提出原假設(shè)與備擇假設(shè)對(duì)行因素提出的原假設(shè)應(yīng)為:
不全相等
其中,
為行因素第個(gè)水平下的總體均值。對(duì)列因素提出的原假設(shè)應(yīng)為:
不全相等其中,
為列因素第個(gè)水平下的總體均值。36§3.2分析步驟2.構(gòu)造檢驗(yàn)統(tǒng)計(jì)量及確定分布SST是全部樣本觀察值(; )與總的樣本均值的誤差平方和,用公式表示為:其中,
表示行因素第i個(gè)水平下的樣本均值;
表示列因素第j個(gè)水平下的樣本均值;
表示所有樣本的均值。37§3.2分析步驟總誤差平方和的分解部分1.行因素角度SSR:2.列因素角度SSC:3.隨機(jī)因素影響造成的誤差平方和SSE:用于驗(yàn)證的關(guān)系:各平方和的自由度SST的自由度為n-1;SSR的自由度為r-1;SSC的自由度為k-1;SSE的自由度為(r-1)*(k-1)其中,n=rk為總觀測(cè)值個(gè)數(shù),r為行因素水平數(shù),k為列因素水平數(shù)。38§3.2分析步驟各均方計(jì)算公式行因素的均方:行因素的均方:
隨機(jī)誤差項(xiàng)的均方:構(gòu)造行因素和列因素檢驗(yàn)統(tǒng)計(jì)量F統(tǒng)計(jì)量檢驗(yàn)行因素的統(tǒng)計(jì)量:檢驗(yàn)列因素的統(tǒng)計(jì)量:39§3.2分析步驟3.依據(jù)樣本信息計(jì)算該檢驗(yàn)統(tǒng)計(jì)量的實(shí)際值(1)分別計(jì)算行因素、列因素各個(gè)水平下的樣本均值(2)計(jì)算所有因素水平下全部樣本的總均值(3)計(jì)算誤差平方和(4)計(jì)算行因素、列因素檢驗(yàn)統(tǒng)計(jì)量的樣本值40§3.2分析步驟4.設(shè)定檢驗(yàn)的顯著性水平
并確定臨界值根據(jù)事先設(shè)定的顯著性水平
,在F分布表中查找行因素、列因素統(tǒng)計(jì)量相對(duì)應(yīng)的臨界值
、
。5.比較理論值(臨界值)與實(shí)際值大小,進(jìn)行決策分別比較行、列因素檢驗(yàn)統(tǒng)計(jì)量的樣本值與其相對(duì)應(yīng)的理論值(臨界值)大小,判斷原假設(shè)的拒絕情況,進(jìn)行決策。41§3.2分析步驟雙因素方差分析的步驟可以用表格9—7表示,該表也稱為方差分析表,具體格式如下:表9—7雙因素方差分析表的一般格式42§3.2分析步驟【例9.3】某品牌飲料生廠商要分析飲料顏色和銷售地區(qū)對(duì)該飲料銷售量的影響作用,分別將該品牌的飲料調(diào)制成四種顏色后,在五個(gè)地區(qū)進(jìn)行銷售,通過(guò)一周的銷售試驗(yàn),得到以下數(shù)據(jù)(表9—8):請(qǐng)?jiān)谥眯哦?/p>
的水平下,分析飲料顏色和地區(qū)這兩個(gè)因素對(duì)于銷售量是否有顯著影響?表9—8飲料銷售試驗(yàn)數(shù)據(jù)43§3.2分析步驟解:根據(jù)題意:
,
,
,
對(duì)行、列因素分別建立假設(shè):行因素:
列因素:
44§3.2分析步驟依據(jù)樣本數(shù)據(jù)信息汁算檢驗(yàn)統(tǒng)計(jì)量的實(shí)際值:(1)計(jì)算各個(gè)因素水平下的樣本均值,用表格形式表示為:注:右下角的灰色底紋單元格內(nèi)表示全部樣本觀測(cè)值的均值,即
。45§3.2分析步驟(2)計(jì)算各項(xiàng)誤差平方和(3)計(jì)算各均方及檢驗(yàn)統(tǒng)計(jì)量的樣本值46§3.2分析步驟(4)行因素和列因素的檢驗(yàn)統(tǒng)計(jì)量樣本值根據(jù)事先設(shè)定的顯著性水平
,在分布表中分別查找對(duì)應(yīng)的的臨界值
,
,顯然,
,因此拒絕行因素的原假設(shè),即
不成立,說(shuō)明飲料的顏色是影響飲料銷售量的一個(gè)顯著因素;
,因此不能拒絕列因素的原假設(shè),即不能拒絕
(
)均相等,表明地區(qū)因素并不是影響飲料銷售量的顯著因素。47§3
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年湖北銀行武漢財(cái)富管理人員社會(huì)招聘?jìng)淇碱}庫(kù)及參考答案詳解1套
- 高效溝通技巧培訓(xùn)
- 2025年山西水利職業(yè)技術(shù)學(xué)院招聘15人備考題庫(kù)含答案詳解
- 2025年通遼市霍林郭勒市事業(yè)單位第一批次人才引進(jìn)23人備考題庫(kù)及1套參考答案詳解
- 2025年紹興市文化市場(chǎng)執(zhí)法指導(dǎo)中心招聘編制外工作人員備考題庫(kù)參考答案詳解
- 2025年中共南充市委網(wǎng)信辦下屬事業(yè)單位公開(kāi)考調(diào)工作人員的備考題庫(kù)及一套參考答案詳解
- 2025年?yáng)|莞市公安局鳳崗分局警務(wù)輔助人員招聘12人備考題庫(kù)及答案詳解一套
- 昆明市中醫(yī)醫(yī)院2025年第二批公開(kāi)引進(jìn)高層次人才備考題庫(kù)含答案詳解
- 2025年鄭州市頸肩腰腿痛醫(yī)院工作人員招聘12人的備考題庫(kù)帶答案詳解
- 運(yùn)城中學(xué)關(guān)于招聘2026屆公費(fèi)師范畢業(yè)生的備考題庫(kù)及參考答案詳解1套
- 2025年P(guān)MP項(xiàng)目管理專業(yè)人士資格考試模擬試卷及答案
- H2受體拮抗劑:臨床定位與合理應(yīng)用
- 農(nóng)夫山泉人事管理
- 2026-2031年中國(guó)西北菜行業(yè)發(fā)展分析及投資風(fēng)險(xiǎn)預(yù)測(cè)研究報(bào)告
- 裝修工程可行性研究報(bào)告(完整)
- 己糖胺途徑調(diào)控機(jī)制-洞察及研究
- 醫(yī)院培訓(xùn)課件:《基層高血壓管理指南-高血壓藥物治療方案》
- 哈希nitratax sc硝氮分析儀操作手冊(cè)
- 秸稈資源化綜合利用項(xiàng)目可行性研究報(bào)告
- 殘疾人照料知識(shí)培訓(xùn)方案課件
- 2025年新能源汽車消費(fèi)者偏好研究報(bào)告綠色出行趨勢(shì)下的消費(fèi)心理
評(píng)論
0/150
提交評(píng)論