數(shù)據(jù)的參數(shù)檢驗和方差分析詳解演示文稿_第1頁
數(shù)據(jù)的參數(shù)檢驗和方差分析詳解演示文稿_第2頁
數(shù)據(jù)的參數(shù)檢驗和方差分析詳解演示文稿_第3頁
數(shù)據(jù)的參數(shù)檢驗和方差分析詳解演示文稿_第4頁
數(shù)據(jù)的參數(shù)檢驗和方差分析詳解演示文稿_第5頁
已閱讀5頁,還剩91頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)的參數(shù)檢驗和方差分析詳解演示文稿zf當(dāng)前1頁,總共96頁。優(yōu)選數(shù)據(jù)的參數(shù)檢驗和方差分析zf當(dāng)前2頁,總共96頁。假設(shè)檢驗的基本問題假設(shè)檢驗的基本原理

小概率事件原理小概率思想是指小概率事件(P<0.01或P<0.05等)在一次試驗中基本上不會發(fā)生。利用反證法思想,先提出假設(shè)H0,再用適當(dāng)?shù)慕y(tǒng)計方法確定假設(shè)成立的可能性大小,如可能性小,則認(rèn)為假設(shè)不成立;反之,則認(rèn)為假設(shè)成立。zf3當(dāng)前3頁,總共96頁。假設(shè)檢驗的步驟

(1)提出一個原假設(shè)和備擇假設(shè)(2)確定檢驗統(tǒng)計量(3)確定顯著性水平α(4)確立置信區(qū)間(5)結(jié)論zf4當(dāng)前4頁,總共96頁。例:現(xiàn)對某地區(qū)成年女性的平均身高進(jìn)行檢驗,看是否達(dá)到160

cm。隨機(jī)抽樣了50個樣本,抽樣樣本均值為162。(1)提出零假設(shè)(nullhypothesis)和備擇假設(shè)(alternativehypothesis)

H0:u=160cmH1:u160cm如何對此假設(shè)進(jìn)行檢驗?zāi)??通過隨機(jī)抽樣,從樣本資料中找充分證據(jù)去拒絕或接受H0zf5當(dāng)前5頁,總共96頁。(2)設(shè)定顯著性水平α

(如:設(shè)α=0.05)(3)確定檢驗統(tǒng)計量:即選擇適當(dāng)?shù)慕y(tǒng)計量,并在原假設(shè)H0成立的條件下確定該統(tǒng)計量的分布。

如:t、Z統(tǒng)計量(4)確定置信區(qū)間

假定此例為:(157,163)(5)結(jié)論

假定此例中計算得到t=1.92,以及t=1.92實現(xiàn)的可能性P值為0.06。在0.05水平下t分布表中的t值為1.96統(tǒng)計軟件輸出p-值的位置,有的用“p-value”,有的用significant的縮寫“Sig”zf6當(dāng)前6頁,總共96頁。依據(jù)t=1.92<t分布表中的t值為1.96,接受H0,拒絕H1;依據(jù)t=1.92實現(xiàn)的可能性P值為0.06﹥顯著性水平α的0.05,也可得到‘接受H0,拒絕H1’的結(jié)論;依據(jù)樣本均值162落在(157,163)這一置信區(qū)間,仍可得到‘接受H0,拒絕H1’的結(jié)論。接受H1并不表示H1為真,只是表示樣本資料并沒有充分證據(jù)可以拒絕H1,也可能會發(fā)生‘拒絕正確零假設(shè)的錯誤,即第一類錯誤’接受H0并不表示H0為真,只是表示樣本資料并沒有充分證據(jù)可以拒絕H0,也可能會發(fā)生‘備選假設(shè)正確時反而說零假設(shè)正確的錯誤,即第二類錯誤’zf7當(dāng)前7頁,總共96頁。此例中備擇假設(shè)H1:u160cm的假設(shè)稱為雙尾檢驗(Two-tailedTest

);如果備選假設(shè)為H1:u>160cm或者u<160cm

則稱為單尾檢驗(One-tailedTest)。其中u>160cm為右尾檢定(Upper-tailedTest

);

u<160cm為左尾檢定(Lower-tailedTest

實際中選擇何種備選假設(shè),需根據(jù)檢驗的需要決定。需要注意的是:計算機(jī)輸出結(jié)果中的p值是雙尾檢驗的概率。如果備選假設(shè)選擇的是單尾檢驗,則要將計算機(jī)給的p值除以2,即取p值的一半。注意:zf8當(dāng)前8頁,總共96頁。1參數(shù)檢驗單樣本的t檢驗(One-SampleTTest)兩獨立樣本的t檢驗(IndependentTwo-SampleTTest)兩配對樣本的檢驗(Pair-SampleTTest)zf9當(dāng)前9頁,總共96頁。1.1單樣本t檢驗-根據(jù)樣本對其總體均值大小進(jìn)行檢驗假設(shè)從總體取出一容量為n的樣本,得到均值和標(biāo)準(zhǔn)差s,現(xiàn)要透過樣本推斷總體均值是否與某給定值(理論值或標(biāo)準(zhǔn)值)有無差別進(jìn)行檢驗.記

數(shù)據(jù)服從正態(tài)分布zf10當(dāng)前10頁,總共96頁??傮w方差已知,用統(tǒng)計量

當(dāng)零假設(shè)成立,則統(tǒng)計量服從正態(tài)分布。檢驗的拒絕域為總體方差未知

用樣本方差代替總體方差,用統(tǒng)計量:

當(dāng)零假設(shè)成立,則統(tǒng)計量服從正態(tài)分布。檢驗的拒絕域為zf11當(dāng)前11頁,總共96頁。zf12當(dāng)前12頁,總共96頁。例1:如果你買了一包標(biāo)有500g重的一包紅糖,你覺得份量不足。于是你找到監(jiān)督部門;當(dāng)然他們會覺得一包份量不夠可能是隨機(jī)的。于是監(jiān)督部門就去商店稱了50包紅糖(數(shù)據(jù)在sugar.sav);其中均值(平均重量)是498.35g;這的確比500g少,但這是否能夠說明廠家生產(chǎn)的這批紅糖平均起來不夠份量呢?于是需要統(tǒng)計檢驗。

zf13當(dāng)前13頁,總共96頁。首先,可以畫出這些重量的直方圖(圖1)判斷樣本是否服從正態(tài)分布zf14當(dāng)前14頁,總共96頁。提出假設(shè)由于廠家聲稱每袋500g(標(biāo)明重量),因此零假設(shè)為總體均值等于500g(被懷疑對象總是放在零假設(shè));而且由于樣本均值少于500g(這是懷疑的根據(jù)),把備選假設(shè)定為總體均值少于500g(這種備選假設(shè)為單向不等式的檢驗為單尾檢驗,)。即,H0:u=500H1:u小于500zf15當(dāng)前15頁,總共96頁。SPSS處理數(shù)據(jù):

分析(Analyze)—比較均值(Comparemean)—單樣本t檢驗(OneSampleTTest)

zf16當(dāng)前16頁,總共96頁。Spss輸出結(jié)果:t=-2.696(也稱為t值),同時得到p-值為0.005(由于計算機(jī)輸出的為雙尾檢驗的p-值,比單尾的大一倍,應(yīng)該0.010除以2)在0.5%的條件下,紅糖標(biāo)記重量為500g是不能接受的,實際上平均起來要少于500g。zf17當(dāng)前17頁,總共96頁。依據(jù)調(diào)查數(shù)據(jù),推斷儲戶總體一次存(?。┛罱痤~是否為2000元。案例分析:居民儲蓄調(diào)查數(shù)據(jù)zf18當(dāng)前18頁,總共96頁。依據(jù)調(diào)查數(shù)據(jù)對我國目前保險公司從業(yè)人員受高等教育的程度和年輕化程度進(jìn)行推斷。問題1:保險公司具有高等教育水平的員工比例的平均值低于0.8。案例分析:保險公司人員構(gòu)成調(diào)查數(shù)據(jù)zf19當(dāng)前19頁,總共96頁。問題2:保險公司年輕人比例的平均值與0.5無顯著差異。zf20當(dāng)前20頁,總共96頁。例3:

某汽車生產(chǎn)廠商要求其生產(chǎn)的汽車剎車直徑為322毫米。其中有8個生產(chǎn)車間。質(zhì)量監(jiān)控中心樣本。(數(shù)據(jù)見

brakes.sav)究竟該廠商生產(chǎn)的剎車是否達(dá)標(biāo)?其中哪些車間的剎車達(dá)標(biāo)?哪些車間的剎車不達(dá)標(biāo)?zf21當(dāng)前21頁,總共96頁。(1)數(shù)據(jù)拆分:數(shù)據(jù)(data)—拆分文件(splitfiles)zf22當(dāng)前22頁,總共96頁。(2)單樣本T檢驗的SPSS操作:

分析(Analyze)—比較均值(Comparemean)—單樣本t檢驗(One-SampleTTest)

彈出新對話框zf23當(dāng)前23頁,總共96頁。選擇檢測變量設(shè)定檢測值選擇檢測變量:DiscBrakeDiameter(mm).

設(shè)定檢測值:322點擊

Options.

zf24當(dāng)前24頁,總共96頁。置信水平設(shè)置

缺失值處理

設(shè)置置信水平,如90%.

設(shè)置缺失值的處理.點擊

Continue.

再在點擊

“One-SampleTTest”對話框點擊

OK.當(dāng)計算時涉及的變量有缺失值,則剔除在該變量上為缺失的樣本剔除所有在任意變量上有缺失值的樣本zf25當(dāng)前25頁,總共96頁。(3)結(jié)果分析:

one-samplestatistic描述性統(tǒng)計:每個車間的樣本大小,汽車剎車直徑的均值、標(biāo)準(zhǔn)差、均值的標(biāo)準(zhǔn)誤。各車間生產(chǎn)的剎車直徑都在322毫米左右。zf26當(dāng)前26頁,總共96頁。

One-samplettest依據(jù)此表,我們可做出怎樣的結(jié)論?zf27當(dāng)前27頁,總共96頁。目的是推斷兩個樣本分別代表的總體均數(shù)是否相等。其假設(shè)一般為:H0:μ1=μ2,即兩樣本來自的總體均數(shù)相等.H1:μ1>μ2或μ1<μ2,即兩樣本來自的總體均數(shù)不相等.1.2兩樣本的t檢驗———根據(jù)來自兩個總體的獨立樣本對其總體均值的檢驗

觀測樣本獨立且是服從正態(tài)分布的隨機(jī)樣本zf28當(dāng)前28頁,總共96頁。與已知時

構(gòu)造統(tǒng)計量

與未知但相等時

構(gòu)造統(tǒng)計量計算t統(tǒng)計量時是用兩樣本均數(shù)差值的絕對值除以兩樣本均數(shù)差值的標(biāo)準(zhǔn)誤zf29當(dāng)前29頁,總共96頁。zf30當(dāng)前30頁,總共96頁。例4:為檢測某種藥物對攻擊性情緒的影響,對100名服藥者和150名非服藥者進(jìn)行心理測試,得到相應(yīng)的某指標(biāo)。相應(yīng)的假設(shè)檢驗問題為:H0:μ1=μ2

H1:μ1大于μ2

μ1

為第一組的總體均值,而μ2為第二組的總體均值。用SPSS處理數(shù)據(jù):

分析(Analyze)—比較均值(Comparemean)—兩獨立樣本t檢驗(Independent-SamplesTTest)

zf31當(dāng)前31頁,總共96頁。SPSS輸出結(jié)果:注意:這個輸出的前面三列(Levene‘sTestforEqualityofVariances)為檢驗這兩個樣本所代表的總體之方差是否相等(零假設(shè)為相等)。如果顯著,即在Sig列中的該Levene檢驗p-值很?。ㄟ@里是0.008),說明兩總體的方差相等被拒絕。就應(yīng)該看兩總體方差不等的結(jié)果,即最后一行的t檢驗輸出(p-值=0.347/2);否則看上面一行的結(jié)果。因為總體方差相同時使用的檢驗統(tǒng)計量與方差不同時使用的不一樣

zf32當(dāng)前32頁,總共96頁。結(jié)論:通過計算,t統(tǒng)計量等于0.942,p值為0.1735(輸出中的雙尾檢驗p值0.347的一半)。因此無法拒絕零假設(shè),即服藥與未服藥的攻擊性情緒無差異。zf33當(dāng)前33頁,總共96頁。例5:

某商場的營銷部擬對某種信用卡購物促銷方式及效果進(jìn)行評估。隨機(jī)抽取了500名持卡消費者。信用卡購物促銷方式之一:過去三個月消費實施降低利率的方式;方式之二:采取標(biāo)準(zhǔn)的信用卡購物方式。(兩種方式各有250名消費者)。(見數(shù)據(jù)文件:creditpromo.sav

)zf34當(dāng)前34頁,總共96頁。(1)分析的下拉菜單中選擇:

分析(Analyze)—比較均值(Comparemean)—兩獨立樣本t檢驗(Independent-SamplesTTest)彈出對話框

SPSS操作過程:zf35當(dāng)前35頁,總共96頁。選擇檢測變量分組變量選擇分組取值定義選擇檢測變量:$spentduringpromotionalperiod.

選擇分組變量:Typeofmailinsertreceived.點擊‘DefineGroups’對分組變量的取值進(jìn)行定義.

zf36當(dāng)前36頁,總共96頁。第一組的分組取值第二組的分組取值運用分界點進(jìn)行分組zf37當(dāng)前37頁,總共96頁。(2)輸出結(jié)果及分析:

independent-samplesstatistic該表是‘描述性統(tǒng)計’表:不同消費方式下樣本大小、消費金額的均值、標(biāo)準(zhǔn)差、均值的標(biāo)準(zhǔn)誤.該表可看出從樣本平均值來看,接受利率優(yōu)惠的消費者的平均消費要高出接受標(biāo)準(zhǔn)方式的消費者有71美元.zf38當(dāng)前38頁,總共96頁。結(jié)論:因計算的T統(tǒng)計量為-2.26,sig值為0.024<<0.05,所以可得出接受新的信用卡購物方式的消費者消費金額高出另一種購物方式的71.11美元顯著異于0.超市應(yīng)盡力將新的信用卡購物方式推廣.zf39當(dāng)前39頁,總共96頁。配對樣本的檢驗(pairedsamples):(針對同樣的樣本)考察實驗前后樣本均值有無差異。能夠很好地控制非實驗因素對結(jié)果的影響。注意:該方法能夠很好地控制非實驗因素對結(jié)果的影響;但同一樣本實驗前后并不獨立。1.3配對樣本的t檢驗——針對同樣的樣本實驗前后均值的比較

怎么處理??要消除配對樣本相關(guān)性影響,處理方法:用配對樣本差值與總體均數(shù)“0”進(jìn)行比較,即推斷差數(shù)的總體均數(shù)是否為“0”。故其檢驗過程與依據(jù)樣本均數(shù)推斷總體均數(shù)大小的t檢驗類似。配對樣本差值服從正態(tài)分布zf40當(dāng)前40頁,總共96頁。例6:某減肥茶生產(chǎn)商擬對其生產(chǎn)的新產(chǎn)品的減肥效果進(jìn)行檢驗,隨機(jī)抽取了50個人,考察了50個人減肥前的體重和減肥后的體重。注意:每一個人減肥后的重量都和自己減肥前的重量有關(guān)。但不同人之間卻是獨立的。令減肥前的重量均值為μ1,而減肥后的均值為μ2;這樣所要進(jìn)行的檢驗為:H0:μ1=μ2

H1:μ1大于μ2zf41當(dāng)前41頁,總共96頁。也可以把同一樣本實驗前后兩個觀測值逐個相減,形成一個由獨立觀測值組成的樣本;然后用單樣本檢驗方法,看其均值是否為零。在相減之后公式和單樣本均值檢驗無異。用SPSS處理數(shù)據(jù):分析(Analyze)—比較均值(Comparemean)—配對樣本t檢驗(Paired-SamplesTTest)

zf42當(dāng)前42頁,總共96頁。Spss輸出結(jié)果得到雙尾p-值為0.002,這里的單尾p-值于是為0.001.

因此減肥后和減肥前相比,平均重量顯著要輕。SPSS輸出結(jié)果:減肥前后的體重高度相關(guān)zf43當(dāng)前43頁,總共96頁。例7:某藥物生產(chǎn)商欲評估某新藥對有心臟病家族病史的病人有無效果。隨機(jī)選取了16個病人,服藥后觀察了6個月。在這項研究中,著重考察了實驗前后病人的‘weights’和‘triglyceridelevels’.(數(shù)據(jù)文件:dietstudy.sav.)zf44當(dāng)前44頁,總共96頁。(1)下拉菜單選項:

Analyze—CompareMeans—Paired-SamplesTTest

彈出配對樣本對話框SPSS處理步驟zf45當(dāng)前45頁,總共96頁。選擇Triglyceride

和FinalTriglyceride

作為第一配對變量.

選擇Weight

和FinalWeight

作為第二配對變量.

點擊OK.

(置信水平選擇Option以系統(tǒng)默認(rèn)為準(zhǔn))zf46當(dāng)前46頁,總共96頁。(2)結(jié)論及分析:

paired-samplesstatistic均值樣本量標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤=標(biāo)準(zhǔn)差/從16個樣本的’triglyceridelevels’指標(biāo)看到服用新藥后,該指標(biāo)水平將下降14.06.

16個樣本的weight也平均下降8磅從標(biāo)準(zhǔn)差看服藥前后的weight相對指標(biāo)triglyceridelevels的變異度更大.

zf47當(dāng)前47頁,總共96頁。paired-samplescorrelation服藥前后triglyceridelevels指標(biāo)的相關(guān)系數(shù)為-0.286,(統(tǒng)計意義上)無顯著的相關(guān)關(guān)系:從總體看triglyceridelevels服藥后降低了,但16個樣本該指標(biāo)上的變化卻很不一致,有的沒變化,有的反而上升了。服藥前后weight指標(biāo)的相關(guān)系數(shù)為0.996,(統(tǒng)計意義上)有非常顯著的相關(guān)關(guān)系:所有的樣本weight都很一致地降低了。zf48當(dāng)前48頁,總共96頁。paired-samplestest該表是‘配對樣本t檢驗’結(jié)果表,給出了‘實驗前后triglyceride差值’和‘實驗前后weight的差值’的均值、標(biāo)準(zhǔn)差、均值的標(biāo)準(zhǔn)誤、置信區(qū)間、t統(tǒng)計量、自由度、sig值等結(jié)論:因為實驗前后triglyceridelevel

的t統(tǒng)計量為1.2;sig值0.1245(雙尾為0.249)>>0.05;所以,可得出新藥對triglyceridelevel

無影響。而實驗前后weight的t統(tǒng)計量為11.2;sig值0.000<<0.05;所以,可認(rèn)為體重下降8.06絕非偶然,而是新藥起了作用。zf49當(dāng)前49頁,總共96頁。如何解決多元多總體的均值檢驗?zf50當(dāng)前50頁,總共96頁。不同型號的計算機(jī)的平均維修時間是相同?2方差分析zf51當(dāng)前51頁,總共96頁。首先計算各樣本平均數(shù)若按兩個總體平均值比較的檢驗法,把樣本平均數(shù)兩兩組成對:

zf52當(dāng)前52頁,總共96頁。將這15對平均數(shù)一一進(jìn)行比較檢驗——計算工作量太大即使每對都進(jìn)行了比較,并且都以0.95的置信度得出每對均值都相等的結(jié)論,但是由此要得出這6個型號的維修時間的均值都相等這一結(jié)論的置信度僅是——估計的精確性和檢驗的靈敏度降低其他方法??zf53當(dāng)前53頁,總共96頁。方差分析(analysisofvariance,ANOVA):又稱變異數(shù)分析或F檢驗,其目的是推斷兩組或多組資料的總體均數(shù)是否相同,檢驗兩個或多個樣本均數(shù)的差異是否有統(tǒng)計學(xué)意義。方差分析中幾個重要概念:1)觀測因素或稱為觀測變量如:考察農(nóng)作物產(chǎn)量的影響因素。農(nóng)作物產(chǎn)量就是觀測變量。2)控制因素或稱控制變量:進(jìn)行試驗(實驗)時,我們稱可控制的試驗條件為因素(Factor)。其中因素變化的各個等級為水平(Level)。影響農(nóng)作物產(chǎn)量的因素,如品種、施肥量、土壤等。

zf54當(dāng)前54頁,總共96頁。如果在試驗中只有一個因素在變化,其他可控制的條件不變,稱它為單因素試驗;若試驗中變化的因素有兩個或兩個以上,則稱為雙因素或多因素試驗。

方差分析就是從觀測變量的方差入手,研究諸多控制變量(因素)中哪些變量是對觀測變量有顯著影響的變量zf55當(dāng)前55頁,總共96頁。方差分析的基本原理

設(shè)有r個總體,各總體分別服從,假定各總體方差相等?,F(xiàn)從各總體隨機(jī)抽取樣本。透過各總體的樣本數(shù)據(jù)推斷r個總體的均值是否相等?

:至少有一組數(shù)據(jù)的平均值與其它組的平均值有顯著性差異。

zf56當(dāng)前56頁,總共96頁。分析的思路:用離差平方和(SS)描述所有樣本總的變異情況,將總變異分為兩個來源:(1)組內(nèi)變動(withingroups),代表本組內(nèi)各樣本與該組平均值的離散程度,即水平內(nèi)部(組內(nèi))方差(2)組間變動(betweengroups),代表各組平均值關(guān)于總平均值的離散程度。即水平之間(組間)方差即:SS總=SS組間+SS組內(nèi)zf57當(dāng)前57頁,總共96頁。消除各組樣本數(shù)不同的影響--離差平方和除以自由度(即均方差)。從而構(gòu)造統(tǒng)計量:方差分析的基本思想就是通過組內(nèi)方差與組間方差的比值構(gòu)造的F統(tǒng)計量,將其與給定顯著性水平、自由度下的F值相對比,判定各組均數(shù)間的差異有無統(tǒng)計學(xué)意義。零假設(shè)否定域:zf58當(dāng)前58頁,總共96頁。方差分析的應(yīng)用條件(1)可比性,若資料中各組均數(shù)本身不具可比性則不適用方差分析。(2)正態(tài)性,各組的觀察數(shù)據(jù),是從服從正態(tài)分布的總體中隨機(jī)抽取的樣本。即偏態(tài)分布資料不適用方差分析。對偏態(tài)分布的資料應(yīng)考慮用對數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等變量變換方法變?yōu)檎龖B(tài)或接近正態(tài)后再進(jìn)行方差分析。(3)方差齊性,各組的觀察數(shù)據(jù),是從具有相同方差的相互獨立的總體中抽取得到的。即若組間方差不齊則不適用方差分析。zf59當(dāng)前59頁,總共96頁。一元單因素方差分析:分析某一個因素A的不同水平是否對某一個觀測變量Y產(chǎn)生了顯著影響。一元多因素方差分析:分析某兩個或多個因素的不同水平是否對某一個觀測變量Y產(chǎn)生了顯著影響。2.1一元方差分析zf60當(dāng)前60頁,總共96頁。例1:某飲料生產(chǎn)企業(yè)研制出一種新型飲料.飲料的顏色共有四種:橘黃色、粉色、綠色和無色透明。這四種飲料的營養(yǎng)含量、味道、價格、包裝等可能影響銷售量的因素全部相同?,F(xiàn)從地理位置相似、經(jīng)營規(guī)模相仿的五家超市上收集了該種飲料的銷售情況。2.1.1一元單因素方差分析zf61當(dāng)前61頁,總共96頁。問題:飲料的顏色是否對銷售量產(chǎn)生影響?zf62當(dāng)前62頁,總共96頁。其中:飲料的顏色即是影響因素(控制因素、變量)銷售量是觀測變量。在其他條件相同的情況下,上述問題就歸結(jié)為一個檢驗問題,即:zf63當(dāng)前63頁,總共96頁。差異的產(chǎn)生來自兩個方面:

一方面是由不同顏色的差異造成的,既不同的飲料顏色對銷售量產(chǎn)生了影響。用‘組間方差’表示另一方面是由于抽選樣本的隨機(jī)性而產(chǎn)生的差異,即各顏色內(nèi)的隨機(jī)誤差,如相同顏色的飲料在不同的商場銷售量也不同。用‘組內(nèi)方差’表示。一元單因素方差分析Spss選項:分析(Analyze)—比較均值(CompareMean)—單因素ANOVA(One-WayANOVA)zf64當(dāng)前64頁,總共96頁。SPSS輸出結(jié)果:可看出F值為10.486,P值是0.000。推斷零假設(shè)不成立。表明顏色不同飲料的銷量也不同。zf65當(dāng)前65頁,總共96頁。如何用SPSS對方差分析的‘方差相等’要求進(jìn)行判定?(因正態(tài)分布的要求不是很嚴(yán)格,分析忽略)Spss選項:在One-WayANOVA中選擇Option,選定Homogeneity-of–variancezf66當(dāng)前66頁,總共96頁。進(jìn)一步考察:究竟是哪一個水平對觀察變量產(chǎn)生了顯著影響,即那種顏色的飲料對銷售量有顯著影響?運用單因素方差分析的多重比較檢驗SPSS窗口中PostHoc選項進(jìn)行選擇。

zf67當(dāng)前67頁,總共96頁。zf68當(dāng)前68頁,總共96頁。例2:為了迎合消費者的需求,某音像公司擬推出一張新的DVD專輯.市場營銷部分收集不同年齡的消費者群體對新的DVD專輯的評價等相關(guān)數(shù)據(jù)信息。(見數(shù)據(jù)文件

dvdplayer.sav

從該數(shù)據(jù)文件我們想知道:

是否不同消費者群體對DVD的評價不一樣呢?32-38歲與39-45歲兩個年齡段的消費者全體對DVD的評價是否一樣呢?32歲以下與45歲以上的消費者群體對DVD的評價是否一樣呢?

zf69當(dāng)前69頁,總共96頁。SPSS的處理過程:(1)一元單因素方差分析的菜單選擇:

分析(Analyze)

—比較均值(CompareMean)—單因素方差分析(One-WayANOVA)

彈出One-wayANOVA對話框zf70當(dāng)前70頁,總共96頁。選擇TotalDVDassessment

作為因變量.選擇

AgeGroup

作為影響因素.點擊選項‘Options’按鈕.

多重比較檢驗:兩兩比較看哪些水平之間存在均值差異.

先驗比較檢驗:事先設(shè)定因變量在因素的不同不平下是否有差異.

描述性統(tǒng)計量、均值圖、缺失值的處理觀測變量(因變量)輸入框影響因素(自變量)輸入框彈出Option對話框zf71當(dāng)前71頁,總共96頁。統(tǒng)計量選擇描述性統(tǒng)計.如:均值、方差等固定效應(yīng)、隨機(jī)效應(yīng)模型的標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、置信區(qū)間等方差同質(zhì)性(相等)檢驗

當(dāng)F檢驗方差相等不成立時,用Brown-Forsythe統(tǒng)計量或Welch統(tǒng)計量檢驗組間均值是否相等,比F檢驗更可取。

選擇均值圖Meansplot.

點擊繼續(xù)Continue.

點擊一元單因素對話框中的兩兩比較‘PostHoc’.均值示意圖可直觀看出組間均值差異彈出雙重比較檢驗對話框組均值示意圖缺失值處理zf72當(dāng)前72頁,總共96頁。假設(shè)組間方差相等時的多重比較檢驗假設(shè)組間方差不等時的多重比較檢驗確定顯著性水平選擇方差不等時的‘Tamhane'sT2’.

點擊‘繼續(xù)Continue’.

點擊一元單因素方差分析中的‘對比Contrasts’按鈕.

彈出Contrasts對話框zf73當(dāng)前73頁,總共96頁。第1組系數(shù)賦值為0,點擊

Add.

第二組系數(shù)賦值為0,點擊Add.緊接著,給第3和第4組系數(shù)賦值,要使兩系數(shù)和為0.給第3組賦值-1

,點擊Add.給第4組系數(shù)賦值為1.

給第5和第6組賦值為0.點擊Next進(jìn)入下一組先驗對比檢驗.

首先,比較第3和第4個年齡段的消費者群體;其他年齡段的忽略不考慮,賦值為0.零假設(shè)為:兩組無差異zf74當(dāng)前74頁,總共96頁。

其次,對第1、2兩個年齡段的消費者與第5、6兩個年齡段的消費者進(jìn)行先驗對比。第3和4兩個年齡段的消費者不考慮。

給第1組賦值.5,點擊Add.

給第2組賦值.5,點擊Add.

分別給第3和第4組賦值為0,點擊Add.

分別給第5和第6組賦值-.5,點擊Add.點擊Continue.點擊一元單因素對話框中的OK,輸出分析結(jié)果output.

zf75當(dāng)前75頁,總共96頁。(2)結(jié)果分析:方差齊性(相等)檢驗

從上表可看出:各總體方差相等的零假設(shè)成立。因為統(tǒng)計量Levenestatistic為0.574,該統(tǒng)計量實現(xiàn)的可能性sig.值為0.720,說明零假設(shè)發(fā)生可能性是很大的,我們沒有充分的理由拒絕它,由此接受零假設(shè)。zf76當(dāng)前76頁,總共96頁。差異表現(xiàn)如何,究竟來自哪兒?

由此表可看出,對DVD的評價的差異主要來自不同年齡的消費者群體的組間差異,因為F

統(tǒng)計量為4.601;同時依據(jù)sig值0.001,也可說明我們最初的零假設(shè)‘不同年齡群體對DVD的評價無差異’發(fā)生的可能性為0.001,我們沒有充分理由接受它.方差分析表zf77當(dāng)前77頁,總共96頁。組均值示意圖

該圖給我們較為直觀的印象:32-45歲的消費者對DVD的評價高于其他消費者群體.

若要作更細(xì)致和精確的分析,可通過一元方差分析中的‘先驗比較’和‘多重比較’來完成。

zf78當(dāng)前78頁,總共96頁。對比系數(shù)表

檢驗32-38和39-45兩個群體對DVD的評價是否有差異,零假設(shè)認(rèn)為:二者無差異。其他年齡段的消費者群體忽略不考慮,所以分別賦值為0;而32-38和39-45兩個群體分別賦值-1和1類似地,若想對比32歲以下和45歲以上的消費者群體對DVD的評價是否有差異,零假設(shè)認(rèn)為二者無差異,所以,分別給18-24、25-31賦值為.5,分別給46-52、53-59賦值為-.5,其他群體不考慮賦值為0。Thesignificancevaluesforthetestsofthefirstcontrastarebothlargerthan0.10.Thisindicatesthattheage39-45groupisnotsignificantlymorefavorabletowardtheDVDplayerthantheage32-38group.

Likewise,thesignificancevaluesforthetestsofthesecondcontrastarelargerthan0.10.Participantsunder32andover45havestatisticallyequivalentassessmentscores.

假設(shè)方差不等時的檢驗結(jié)果假設(shè)方差相等時的檢驗結(jié)果zf79當(dāng)前79頁,總共96頁。PostHocTests雙重假設(shè)檢驗zf80當(dāng)前80頁,總共96頁。2.1.2一元多因素方差分析基本思想:研究兩個或兩個以上因素(控制變量)是否對某個觀測變量產(chǎn)生顯著性影響。如:飲料銷售,除了關(guān)心飲料顏色之外,還想了解銷售地區(qū)、銷售策略是否影響銷售量?若把飲料的顏色看作影響銷售量的因素A,飲料的銷售地區(qū)看作影響因素B,銷售策略看作影響因素C。對因素A和因素B同時進(jìn)行分析,就屬于雙因素方差分析。對因素A、B以及C(或更多因素)同時進(jìn)行分析,就屬多因素方差分析。zf81當(dāng)前81頁,總共96頁。雙(多)因素方差分析有兩種類型:1、無交互作用的雙(多)因素方差分析,它假定因素A和因素B的效應(yīng)是相互獨立的,不存在相互關(guān)系;2、有交互作用的雙(多)因素方差分析,它假定因素A和因素B的結(jié)合會產(chǎn)生出一種新的效應(yīng)(相互影響)。例如,若假定不同地區(qū)的消費者對某種顏色有與其他地區(qū)消費者不同的特殊偏愛,這就是兩個因素結(jié)合后產(chǎn)生的新效應(yīng),屬于有交互作用的背景;否則,就是無交互作用的背景。

zf82當(dāng)前82頁,總共96頁。案例分析:廣告城市與銷售額數(shù)據(jù)目標(biāo):企業(yè)對不同廣告形式在不同地區(qū)的廣告效果(銷售額)進(jìn)行評估;zf83當(dāng)前83頁,總共96頁。例2:某雜貨店對其消費者的購買習(xí)慣作了一項問卷調(diào)查。重要想關(guān)注:不同性別、不同的購買習(xí)慣是否會影響到其在一個月內(nèi)的消費金額。(數(shù)據(jù)見:grocery_1month.sav)因變量dependentvariable:Amountspent自變量Independentvariables:gendershoppingstyle一元雙因素問題zf84當(dāng)前84頁,總共96頁。(1)建立假設(shè):對于因素:gender

零假設(shè)H0:

備擇假設(shè)H1:對于因素:shoppingstyle

零假設(shè)H0:

備擇假設(shè)H1:交互影響因素:

零假設(shè)H0:

備擇假設(shè)H1:zf85當(dāng)前85頁,總共96頁。(2)一元多因素的SPSS處理過程:

菜單選擇:分析(Analyze)—一般線性模型(GeneralLinearModel)—單變量(Univariate)彈出univariate對話框zf86當(dāng)前86頁,總共96頁。因變量選擇固定因素隨機(jī)因素(協(xié)方差分析時)協(xié)變量選擇(協(xié)方差分析時)權(quán)數(shù)變量選擇模型選擇按鈕實現(xiàn)先驗對比檢驗和趨勢檢驗圖形分析雙重比較檢驗將分析結(jié)果以變量的形式存入SPSS數(shù)據(jù)編輯窗口中置信水平和描述性統(tǒng)計等選擇

Amountspentas作為因變量.

選擇

GenderandShoppingstyle

進(jìn)入固定因素框.

點擊‘Model’按鈕.

zf87當(dāng)前87頁,總共96頁。GenderShoppingstyleGenderShoppingstyle飽和模型(考慮交互效應(yīng)gender*Shoppingstyle)非飽和模型(不考慮交互效應(yīng),系統(tǒng)默認(rèn)模型)若選擇非飽和模型,則點擊custom.點擊作圖‘

Plots’進(jìn)入形象分析對話框.zf88當(dāng)前88頁,總共96頁。選擇style作為橫坐標(biāo)變量.

選擇gender

作為縱坐標(biāo)變量.點擊‘

Add’按鈕.點擊‘Continue.’按鈕再點擊‘

PostHoc’按鈕進(jìn)入雙重比較對話框.形象分析:用圖形直觀分析控制變量間是否存在交互作用zf89當(dāng)前89頁,總共96頁。假設(shè)方差相等雙重假設(shè)檢驗假設(shè)方差不等選擇

style

作為雙重比較檢驗的因素.

選擇方差相等中的Tukey

統(tǒng)計量選項.

選擇方差不等中的Tamhane'sT2

統(tǒng)計量選項.

點擊Continue.

再點擊Options.zf90當(dāng)前90頁,總共96頁。選擇ge

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論