應(yīng)用統(tǒng)計學教學資料-統(tǒng)計學 第十章 方差分析ppt課件_第1頁
應(yīng)用統(tǒng)計學教學資料-統(tǒng)計學 第十章 方差分析ppt課件_第2頁
應(yīng)用統(tǒng)計學教學資料-統(tǒng)計學 第十章 方差分析ppt課件_第3頁
應(yīng)用統(tǒng)計學教學資料-統(tǒng)計學 第十章 方差分析ppt課件_第4頁
應(yīng)用統(tǒng)計學教學資料-統(tǒng)計學 第十章 方差分析ppt課件_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng)計學第十章 方差分析;2 解釋方差分析的概念 解釋方差分析的根本思想和原理 掌握單要素方差分析的方法及運用 了解多重比較的意義 掌握雙要素方差分析的方法及運用學習目的本章學習目的;310.1方差分析引論 ;4方差分析及其有關(guān)術(shù)語方差分析的根本假定方差分析的根本思想和原理問題的普通提法1234方差分析引論 ;51.檢驗多個總體均值能否相等2.經(jīng)過分析數(shù)據(jù)的誤差判別各總體均值能否相等3.研討分類型自變量對數(shù)值型因變量的影響 4.一個或多個分類型自變量5.兩個或多個 (k 個) 處置程度或分類6.一個數(shù)值型因變量7.有單要素方差分析和雙要素方差分析8.單要素方差分析:涉及一個分類的自變量9.雙要素

2、方差分析:涉及兩個分類的自變量方差分析引論 ;6行業(yè)行業(yè)觀測值觀測值零售業(yè)零售業(yè)旅游業(yè)旅游業(yè)航空公司航空公司家電制造業(yè)家電制造業(yè)12345675766494034534468392945565131492134404451657758方差分析;71.分析4個行業(yè)之間的效力質(zhì)量能否有顯著差別,也就是要判別“行業(yè)對“贊揚次數(shù)能否有顯著影響2.作出這種判別最終被歸結(jié)為檢驗這四個行業(yè)被贊揚次數(shù)的均值能否相等3.假設(shè)它們的均值相等,那么意味著“行業(yè)對贊揚次數(shù)是沒有影響的,即它們之間的效力質(zhì)量沒有顯著差別;假設(shè)均值不全相等,那么意味著“行業(yè)對贊揚次數(shù)是有影響的,它們之間的效力質(zhì)量有顯著差別什么是方差分析?

3、(例題分析);81.要素或因子(factor)2.所要檢驗的對象3.分析行業(yè)對贊揚次數(shù)的影響,行業(yè)是要檢驗的因子4.程度或處置(treatment)5.因子的不同表現(xiàn)6.零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)7.察看值8.在每個要素程度下得到的樣本數(shù)據(jù)9.每個行業(yè)被贊揚的次數(shù)方差分析中的有關(guān)術(shù)語;91.實驗2.這里只涉及一個要素,因此稱為單要素4程度的實驗3.總體4.要素的每一個程度可以看作是一個總體5.零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)是4個總體6.樣本數(shù)據(jù)7.被贊揚次數(shù)可以看作是從這4個總體中抽取的樣本數(shù)據(jù)方差分析中的有關(guān)術(shù)語;10方差分析及其有關(guān)術(shù)語方差分析的根本假定方差分析的根本思想和

4、原理問題的普通提法1234方差分析引論 ;11不同行業(yè)被投訴次數(shù)的散點圖不同行業(yè)被投訴次數(shù)的散點圖020406080012345行業(yè)被投訴次數(shù) 零售業(yè) 旅游業(yè) 航空公司 家電制造方差分析的根本思想和原理(圖形分析散點圖);12方差分析的根本思想和原理(圖形分析散點圖)1.從散點圖上可以看出2.不同行業(yè)被贊揚的次數(shù)有明顯差別3.同一個行業(yè),不同企業(yè)被贊揚的次數(shù)也明顯不同4.家電制造被贊揚的次數(shù)較高,航空公司被贊揚的次數(shù)較低5.行業(yè)與被贊揚次數(shù)之間有一定的關(guān)系6.假設(shè)行業(yè)與被贊揚次數(shù)之間沒有關(guān)系,那么它們被贊揚的次數(shù)應(yīng)該差不多一樣,在散點圖上所呈現(xiàn)的方式也就應(yīng)該很接近;131.散點圖察看不能提供充

5、分的證據(jù)證明不同行業(yè)被贊揚的次數(shù)之間有顯著差別2.這種差別能夠是由于抽樣的隨機性所呵斥的3.需求有更準確的方法來檢驗這種差別能否顯著,也就是進展方差分析4.所以叫方差分析,由于雖然我們感興趣的是均值,但在判別均值之間能否有差別時那么需求借助于方差5.這個名字也表示:它是經(jīng)過對數(shù)據(jù)誤差來源的分析判別不同總體的均值能否相等。因此,進展方差分析時,需求調(diào)查數(shù)據(jù)誤差的來源方差分析的根本思想和原理;141.隨機誤差2.要素的同一程度(總體)下,樣本各察看值之間的差別3.比如,同一行業(yè)下不同企業(yè)被贊揚次數(shù)之間的差別4.這種差別可以看成是隨機要素的影響,稱為隨機誤差 5.系統(tǒng)誤差6.要素的不同程度(不同總體

6、)之間察看值的差別7.比如,不同行業(yè)之間的被贊揚次數(shù)之間的差別8.這種差別能夠是由于抽樣的隨機性所呵斥的,也能夠是由于行業(yè)本身所呵斥的,后者所構(gòu)成的誤差是由系統(tǒng)性要素呵斥的,稱為系統(tǒng)誤差方差分析的根本思想和原理(兩類誤差);151.數(shù)據(jù)的誤差用平方和(sum of squares)表示2.組內(nèi)平方和(within groups)3.要素的同一程度下數(shù)據(jù)誤差的平方和4.比如,零售業(yè)被贊揚次數(shù)的誤差平方和5.只包含隨機誤差6.組間平方和(between groups)7.要素的不同程度之間數(shù)據(jù)誤差的平方和8.比如,4個行業(yè)被贊揚次數(shù)之間的誤差平方和9.既包括隨機誤差,也包括系統(tǒng)誤差方差分析的根本思

7、想和原理(誤差平方和SS);161. 平方和除以相應(yīng)的自在度2. 假設(shè)原假設(shè)成立,組間均方與組內(nèi)均方的數(shù)值就應(yīng)該很接近,它們的比值就會接近13. 假設(shè)原假設(shè)不成立,組間均方會大于組內(nèi)均方,它們之間的比值就會大于14. 當這個比值大到某種程度時,就可以說不同程度之間存在著顯著差別,即自變量對因變量有影響5. 判別行業(yè)對贊揚次數(shù)能否有顯著影響,也就是檢驗被贊揚次數(shù)的差別主要是由于什么緣由所引起的。假設(shè)這種差別主要是系統(tǒng)誤差,闡明不同行業(yè)對贊揚次數(shù)有顯著影響方差分析的根本思想和原理(均方MS);17方差分析及其有關(guān)術(shù)語方差分析的根本假定方差分析的根本思想和原理問題的普通提法1234方差分析引論 ;1

8、81. 每個總體都應(yīng)服從正態(tài)分布2. 對于要素的每一個程度,其察看值是來自服從正態(tài)分布總體的簡單隨機樣本3. 比如,每個行業(yè)被贊揚的次數(shù)必需服從正態(tài)分布4. 各個總體的方差必需一樣5. 各組察看數(shù)據(jù)是從具有一樣方差的總體中抽取的6. 比如,4個行業(yè)被贊揚次數(shù)的方差都相等7. 察看值是獨立的8. 比如,每個行業(yè)被贊揚的次數(shù)與其他行業(yè)被贊揚的次數(shù)獨立方差分析的根本假定;191.在上述假定條件下,判別行業(yè)對贊揚次數(shù)能否有顯著影響,實踐上也就是檢驗具有同方差的4個正態(tài)總體的均值能否相等2.假設(shè)4個總體的均值相等,可以期望4個樣本的均值也會很接近3.4個樣本的均值越接近,推斷4個總體均值相等的證據(jù)也就越

9、充分4.樣本均值越不同,推斷總體均值不同的證據(jù)就越充分 方差分析的根本假定;201. 假設(shè)原假設(shè)成立,即H0 : m1 = m2 = m3 = m42.4個行業(yè)被贊揚次數(shù)的均值都相等3.意味著每個樣本都來自均值為、方差為 2的同一正態(tài)總體 方差分析的根本假定;21假設(shè)備擇假設(shè)成立,即H1 : mi (i=1,2,3,4)不全相等至少有一個總體的均值是不同的4個樣本分別來自均值不同的4個正態(tài)總體 方差分析的根本假定;22方差分析及其有關(guān)術(shù)語方差分析的根本假定方差分析的根本思想和原理問題的普通提法1234方差分析引論 ;231.設(shè)要素有k個程度,每個程度的均值分別用1 , 2, , k 表示2.要

10、檢驗k個程度(總體)的均值能否相等,需求提出如下假設(shè): 3.H0 : 1 2 k 4.H1 : 1 , 2 , ,k 不全相等5.設(shè)1為零售業(yè)被贊揚次數(shù)的均值,2為旅游業(yè)被贊揚次數(shù)的均值,3為航空公司被贊揚次數(shù)的均值,4為家電制造業(yè)被贊揚次數(shù)的均值,提出的假設(shè)為6.H0 : 1 2 3 4 7.H1 : 1 , 2 , 3 , 4 不全相等問題的普通提法;2410.2單要素方差分析;25問題的普通提法;26分析步驟提出假設(shè)構(gòu)造檢驗統(tǒng)計量統(tǒng)計決策分析步驟;27提出假設(shè)1. 普通提法2. H0 :m1 = m2 = mk 3. 自變量對因變量沒有顯著影響 4. H1 :m1 ,m2 , ,mk不全

11、相等5. 自變量對因變量有顯著影響 6. 留意:回絕原假設(shè),只闡明至少有兩個總體的均值不相等,并不意味著一切的均值都不相等 ;28構(gòu)造統(tǒng)計量需求計算程度的均值全部察看值的總均值誤差平方和均方(MS) 構(gòu)造檢驗的統(tǒng)計量;291. 假定從第i個總體中抽取一個容量為ni的簡單隨機樣本,第i個總體的樣本均值為該樣本的全部察看值總和除以察看值的個數(shù)2. 計算公式為 構(gòu)造檢驗的統(tǒng)計量(計算程度的均值);301. 全部察看值的總和除以察看值的總個數(shù)2. 計算公式為 構(gòu)造檢驗的統(tǒng)計量(計算全部察看值的總均值);31構(gòu)造檢驗的統(tǒng)計量(例題分析);321. 全部察看值 與總平均值 的離差平方和2. 反映全部察看值

12、的離散情況3. 其計算公式為前例的計算結(jié)果SST = (57-47.869565)2+(58-47.869565)2=115.9295構(gòu)造檢驗的統(tǒng)計量(計算總誤差平方和 SST);33構(gòu)造檢驗的統(tǒng)計量(計算組間平方和 SSA)1. 各組平均值 與總平均值 的離差平方和2. 反映各總體的樣本均值之間的差別程度3. 該平方和既包括隨機誤差,也包括系統(tǒng)誤差4. 計算公式為 前例的計算結(jié)果 SSA = 1456.608696;34構(gòu)造檢驗的統(tǒng)計量(計算組內(nèi)平方和 SSE )1. 每個程度或組的各樣本數(shù)據(jù)與其組平均值的離差平方和2. 反映每個樣本各察看值的離散情況3. 該平方和反映的是隨機誤差的大小4.

13、 計算公式為 ;35構(gòu)造檢驗的統(tǒng)計量(三個平方和的關(guān)系)總離差平方和(SST)、誤差項離差平方和(SSE)、程度項離差平方和 (SSA) 之間的關(guān)系;36構(gòu)造檢驗的統(tǒng)計量(計算均方MS)1. 各誤差平方和的大小與察看值的多少有關(guān),為消除察看值多少對誤差平方和大小的影響,需求將其平均,這就是均方,也稱為方差2. 由誤差平方和除以相應(yīng)的自在度求得3. 三個平方和對應(yīng)的自在度分別是4. SST 的自在度為n-1,其中n為全部察看值的個數(shù)5. SSA的自在度為k-1,其中k為要素程度(總體)的個數(shù)6. SSE 的自在度為n-k;37構(gòu)造檢驗的統(tǒng)計量(計算均方 MS)1. 組間方差:組間方差:SSA的均

14、方,記為的均方,記為MSA,計算公,計算公式為式為;38構(gòu)造檢驗的統(tǒng)計量(計算檢驗統(tǒng)計量 F )1. 將MSA和MSE進展對比,即得到所需求的檢驗統(tǒng)計量F2. 當H0為真時,二者的比值服從分子自在度為k-1、分母自在度為 n-k 的 F 分布,即 ;39構(gòu)造檢驗的統(tǒng)計量(F分布與回絕域);40統(tǒng)計決策 將統(tǒng)計量的值F與給定的顯著性程度的臨界值F進展比較,作出對原假設(shè)H0的決策根據(jù)給定的顯著性程度,在F分布表中查找與第一自在度df1k-1、第二自在度df2=n-k 相應(yīng)的臨界值 F 假設(shè)FF ,那么回絕原假設(shè)H0 ,闡明均值之間的差別是顯著的,所檢驗的要素對察看值有顯著影響假設(shè)FF ,回絕原假設(shè)

15、H0 ,闡明均值之間的差別是顯著的,即所檢驗的行要素對察看值有顯著影響假設(shè)FC F ,回絕原假設(shè)H0 ,闡明均值之間有顯著差別,即所檢驗的列要素對察看值有顯著影響 ;70雙要素方差分析表(根本構(gòu)造)誤差來源誤差來源平方和平方和(SS)自由度自由度(df)均方均方(MS)F值值P值值F臨界值臨界值行因素行因素列因素列因素誤差誤差總和總和;71雙要素方差分析(例題分析)提出假設(shè)對品牌要素提出的假設(shè)為H0:m1=m2=m3=m4 (品牌對銷售量無顯著影響)H1:mi (i =1,2, , 4) 不全相等 (有顯著影響)對地域要素提出的假設(shè)為H0:m1=m2=m3=m4=m5 (地域?qū)︿N售量無顯著影響

16、)H1:mj (j =1,2,5) 不全相等 (有顯著影響) ;72差異源差異源SSdfMSFP-valueF crit 行行(品牌品牌)13004.634334.8518.10789.46E-053.4903 列列(地區(qū)地區(qū))2011.74502.9252.100850.143673.2592 誤差誤差2872.712239.392 總和總和1788919雙要素方差分析(例題分析);73雙要素方差分析(關(guān)系強度的丈量)1.行平方和(SSR)度量了品牌這個自變量對因變量(銷售量)的影響效應(yīng)2.列平方和(SSC)度量了地域這個自變量對因變量(銷售量)的影響效應(yīng)3.這兩個平方和加在一同那么度量了兩

17、個自變量對因變量的結(jié)合效應(yīng)4.結(jié)合效應(yīng)與總平方和的比值定義為R25.其平方根R反映了這兩個自變量合起來與因變量之間的關(guān)系強度 ;74例題分析品牌要素和地域要素合起來總共解釋了銷售量差別的83.94%其他要素(殘差變量)只解釋了銷售量差別的16.06%R=0.9162,闡明品牌和地域兩個要素合起來與銷售量之間有較強的關(guān)系 雙要素方差分析(關(guān)系強度的丈量);75有交互作用的雙要素方差分析(可反復(fù)雙要素分析);76可反復(fù)雙要素分析(例題)【例】城市道路交通管理部門為研討不同的路段和不同的【例】城市道路交通管理部門為研討不同的路段和不同的時間段對行車時間的影響,讓一名交通警察分別在兩個路時間段對行車時

18、間的影響,讓一名交通警察分別在兩個路段和頂峰期與非頂峰期親身駕車進展實驗,經(jīng)過實驗共獲段和頂峰期與非頂峰期親身駕車進展實驗,經(jīng)過實驗共獲得得20個行車時間個行車時間(單位:單位:min)的數(shù)據(jù),如下表。試分析路的數(shù)據(jù),如下表。試分析路段、時段以及路段和時段的交互作用對行車時間的影響段、時段以及路段和時段的交互作用對行車時間的影響 ;77可反復(fù)雙要素方差分析表(根本構(gòu)造)誤差來源誤差來源平方和平方和(SS)自由度自由度(df)均方均方(MS)F值值P值值F臨界值臨界值行因素行因素列因素列因素交互作用交互作用誤差誤差總和總和m為樣本的行數(shù);78可反復(fù)雙要素分析(平方和的計算)設(shè): 為對應(yīng)于行要素的第i個程度和列要素的第j個 程度的第l行的察看值 為行要素的第i個程度的樣本均值 為列要素的第j個程度的樣本均值 對應(yīng)于行要素的第i個程度和列要素的第j個水 平組合的樣本均值 為全部n個察看值的總均值 ;79可反復(fù)雙要素分析(平方和的計算)1.總平方和:2.行變量平方和:3.列變量平方和:4.交互作用平方和:5.誤差項平方和:;80可反復(fù)雙要素分析(平方和的計算)1.總平方和:2.行變量平方和:3.列變量平方和:4.交互作用平方和:5.誤差項平方和:;81可反復(fù)雙要素分析(Excel檢驗步驟)第第1步:選擇步:選

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論