版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
SPSS統計分析
基礎教程北京理工大學珠海學院1可編輯ppt什么是方差分析?2可編輯ppt什么是方差分析?
(概念要點)1.檢驗多個總體均值是否相等通過對各觀察數據誤差來源的分析來判斷多個總體均值是否相等2.變量一個定類尺度的自變量2個或多個(k個)處理水平或分類一個定距或定比尺度的因變量3什么是方差分析?
(一個例子)表8-1該飲料在五家超市的銷售情況超市無色粉色橘黃色綠色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例8.1】某飲料生產企業(yè)研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無色透明。這四種飲料的營養(yǎng)含量、味道、價格、包裝等可能影響銷售量的因素全部相同?,F從地理位置相似、經營規(guī)模相仿的五家超級市場上收集了前一時期該飲料的銷售情況,見表8-1。試分析飲料的顏色是否對銷售量產生影響。4什么是方差分析?
(例子的進一步分析)檢驗飲料的顏色對銷售量是否有影響,也就是檢驗四種顏色飲料的平均銷售量是否相同設
1為無色飲料的平均銷售量,
2粉色飲料的平均銷售量,
3為橘黃色飲料的平均銷售量,
4為綠色飲料的平均銷售量,也就是檢驗下面的假設H0:1
2
3
4
H1:1,2,3,4不全相等檢驗上述假設所采用的方法就是方差分析5方差分析的基本思想和原理6可編輯ppt方差分析的基本思想和原理
(幾個基本概念)因素或因子所要檢驗的對象稱為因子要分析飲料的顏色對銷售量是否有影響,顏色是要檢驗的因素或因子水平因素的具體表現稱為水平A1、A2、A3、A4四種顏色就是因素的水平觀察值在每個因素水平下得到的樣本值每種顏色飲料的銷售量就是觀察值7方差分析的基本思想和原理
(幾個基本概念)試驗這里只涉及一個因素,因此稱為單因素四水平的試驗總體因素的每一個水平可以看作是一個總體比如A1、A2、A3、A4四種顏色可以看作是四個總體樣本數據上面的數據可以看作是從這四個總體中抽取的樣本數據81. 比較兩類誤差,以檢驗均值是否相等2. 比較的基礎是方差比3. 如果系統(處理)誤差顯著地不同于隨機誤差,則均值就是不相等的;反之,均值就是相等的4. 誤差是由各部分的誤差占總誤差的比例來測度的方差分析的基本思想和原理9方差分析的基本思想和原理
(兩類誤差)隨機誤差在因素的同一水平(同一個總體)下,樣本的各觀察值之間的差異比如,同一種顏色的飲料在不同超市上的銷售量是不同的不同超市銷售量的差異可以看成是隨機因素的影響,或者說是由于抽樣的隨機性所造成的,稱為隨機誤差
系統誤差在因素的不同水平(不同總體)下,各觀察值之間的差異比如,同一家超市,不同顏色飲料的銷售量也是不同的這種差異可能是由于抽樣的隨機性所造成的,也可能是由于顏色本身所造成的,后者所形成的誤差是由系統性因素造成的,稱為系統誤差10方差分析的基本思想和原理
(兩類方差)組內方差因素的同一水平(同一個總體)下樣本數據的方差比如,無色飲料A1在5家超市銷售數量的方差組內方差只包含隨機誤差組間方差因素的不同水平(不同總體)下各樣本之間的方差比如,A1、A2、A3、A4四種顏色飲料銷售量之間的方差組間方差既包括隨機誤差,也包括系統誤差11方差分析的基本思想和原理
(方差的比較)如果不同顏色(水平)對銷售量(結果)沒有影響,那么在組間方差中只包含有隨機誤差,而沒有系統誤差。這時,組間方差與組內方差就應該很接近,兩個方差的比值就會接近1如果不同的水平對結果有影響,在組間方差中除了包含隨機誤差外,還會包含有系統誤差,這時組間方差就會大于組內方差,組間方差與組內方差的比值就會大于1當這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異12方差分析中的基本假定13可編輯ppt方差分析中的基本假定每個總體都應服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本比如,每種顏色飲料的銷售量必需服從正態(tài)分布各個總體的方差必須相同對于各組觀察數據,是從具有相同方差的總體中抽取的比如,四種顏色飲料的銷售量的方差都相同觀察值是獨立的比如,每個超市的銷售量都與其他超市的銷售量獨立14方差分析中的基本假定在上述假定條件下,判斷顏色對銷售量是否有顯著影響,實際上也就是檢驗具有同方差的四個正態(tài)總體的均值是否相等的問題如果四個總體的均值相等,可以期望四個樣本的均值也會很接近四個樣本的均值越接近,我們推斷四個總體均值相等的證據也就越充分樣本均值越不同,我們推斷總體均值不同的證據就越充分15方差分析中基本假定
如果原假設成立,即H0:m1=m2=m3=m4四種顏色飲料銷售的均值都相等沒有系統誤差
這意味著每個樣本都來自均值為
、差為
2的同一正態(tài)總體
Xf(X)
1
2
3
4
16方差分析中基本假定
如果備擇假設成立,即H1:mi(i=1,2,3,4)不全相等至少有一個總體的均值是不同的有系統誤差這意味著四個樣本分別來自均值不同的四個正態(tài)總體
Xf(X)
3
1
2
4
17單因素方差分析的數據結構
觀察值(j)因素(A)i
水平A1水平A2…水平Ak12::n
x11x12…x1kx21x22…x2k::::::::xn1
xn2…xnk18單因素方差分析的步驟提出假設構造檢驗統計量統計決策19可編輯ppt提出假設一般提法H0:m1=m2=…=
mk(因素有k個水平)H1:m1
,m2
,…,mk不全相等對前面的例子H0:m1=m2=m3=m4顏色對銷售量沒有影響H0:m1
,m2
,m3,m4不全相等顏色對銷售量有影響20構造檢驗的統計量為檢驗H0是否成立,需確定檢驗的統計量
構造統計量需要計算水平的均值全部觀察值的總均值離差平方和均方(MS)
21構造檢驗的統計量
(計算水平的均值
)假定從第i個總體中抽取一個容量為ni的簡單隨機樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數計算公式為式中:ni為第i個總體的樣本觀察值個數
xij為第i個總體的第j個觀察值
22構造檢驗的統計量
(計算全部觀察值的總均值
)全部觀察值的總和除以觀察值的總個數計算公式為23構造檢驗的統計量
(前例計算結果
)表8-2四種顏色飲料的銷售量及均值超市(j)水平A(i)無色(A1)粉色(A2)橘黃色(A3)綠色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合計136.6147.8132.2157.3573.9水平均值觀察值個數
x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5總均值x=28.69524構造檢驗的統計量
(計算總離差平方和
SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況總離差平方和(總變異)其計算公式為前例的計算結果:
SST=(26.5-28.695)2+(28.7-28.695)2+…+(32.8-28.695)2=115.929525構造檢驗的統計量
(計算誤差項平方和
SSW)每個水平或組的各樣本數據與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況,又稱組內離差平方和該平方和反映的是隨機誤差的大小誤差項平方和(組內變異或是組內平方和)計算公式為
前例的計算結果:SSW=39.08426構造檢驗的統計量
(計算水平項平方和
SSB)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機誤差,也包括系統誤差計算公式為前例的計算結果:SSB=76.845527構造檢驗的統計量
(三個平方和的關系)
總離差平方和(SST)、誤差項離差平方和(SSW)、水平項離差平方和(SSB)之間的關系SST=SSW+SSB28構造檢驗的統計量
(三個平方和的作用)
SST反映了全部數據總的誤差程度;SSW反映了隨機誤差的大??;SSB反映了隨機誤差和系統誤差的大小.如果原假設成立,即H1=H2
=…=Hk為真,則表明沒有系統誤差,組間平方和SSB除以自由度后的均方與組內平方和SSE和除以自由度后的均方差異就不會太大;如果組間均方顯著地大于組內均方,說明各水平(總體)之間的差異不僅有隨機誤差,還有系統誤差判斷因素的水平是否對其觀察值有影響,實際上就是比較組間方差與組內方差之間差異的大小為檢驗這種差異,需要構造一個用于檢驗的統計量29構造檢驗的統計量
(計算均方
MS)各離差平方和的大小與觀察值的多少有關,為了消除觀察值多少對離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計算方法是用離差平方和除以相應的自由度三個平方和的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個數SSB的自由度為k-1,其中k為因素水平(總體)的個數SSW的自由度為n-k30構造檢驗的統計量
(計算均方
MS)
SSB的均方也稱組間方差,記為MSB,計算公式為
SSW的均方也稱組內方差,記為MSW,計算公式為31構造檢驗的統計量
(計算檢驗的統計量
F)將MSB和MSW進行對比,即得到所需要的檢驗統計量F當H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即32統計決策
將統計量的值F與給定的顯著性水平
的臨界值F
進行比較,作出接受或拒絕原假設H0的決策根據給定的顯著性水平
,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應的臨界值F
若F>F
,則拒絕原假設H0
,表明均值之間的差異是顯著的,所檢驗的因素(A)對觀察值有顯著影響若F
F
,則不能拒絕原假設H0
,表明所檢驗的因素(A)對觀察值沒有顯著影響【根據P值直接進行決策】33單因素方差分析表
(基本結構)方差來源平方和SS自由度df均方MSF值組間(因素影響)
組內(誤差)
總和SSBSSWSSTk-1n-kn-1MSBMSWMSBMSW34單因素方差分析實質上采用了統計推斷的方法,由于方差
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年漢中職業(yè)技術學院單招職業(yè)傾向性測試題庫及答案詳解一套
- 2026年廈門安防科技職業(yè)學院單招職業(yè)技能考試題庫參考答案詳解
- 2026年錫林郭勒職業(yè)學院單招綜合素質考試題庫帶答案詳解
- 2026年西藏山南地區(qū)單招職業(yè)適應性考試題庫及參考答案詳解1套
- 2026年山東省淄博市單招職業(yè)適應性測試題庫及完整答案詳解1套
- 2026年山東文化產業(yè)職業(yè)學院單招職業(yè)傾向性考試題庫及參考答案詳解1套
- 海南醫(yī)院面試題目及答案
- 鐵路車輛運維面試題及答案
- 維修合同協議書范本
- 2025年四川工商學院招聘黨委宣傳部工作人員備考題庫及1套參考答案詳解
- 腹腔出血課件
- 驚恐障礙的認知行為干預與藥物協同
- 2025中遠海運集團招聘筆試歷年參考題庫附帶答案詳解
- 2025年國家統計局齊齊哈爾調查隊公開招聘公益性崗位5人筆試考試備考試題及答案解析
- 啦啦操課件教學課件
- 2025年及未來5年市場數據中國拋光液市場運行態(tài)勢及行業(yè)發(fā)展前景預測報告
- 2026年網絡安全法培訓課件
- 2025年全國新能源電力現貨交易價格趨勢報告
- 2025重慶市涪陵區(qū)人民政府江東街道辦事處選聘本土人才5人(公共基礎知識)測試題附答案解析
- 2025智慧物流系統市場發(fā)展趨勢技術創(chuàng)新市場競爭態(tài)勢與商業(yè)模式演進深度研究報告
- GB/T 46476-2025電工鋼帶和鋼片幾何特性的測量方法
評論
0/150
提交評論