多元回歸分析的精辟分析spss_第1頁
多元回歸分析的精辟分析spss_第2頁
多元回歸分析的精辟分析spss_第3頁
全文預(yù)覽已結(jié)束

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1、 利用OLS(ordinaryleastsquares來做多元回歸可能是社會學(xué)研究中最常用的統(tǒng)計分析方法。利用此法的基本條件是應(yīng)變項為一個分?jǐn)?shù)型的變項(等距尺度測量的變項),而自變項之測量尺度則無特別的限制。當(dāng)自變項為類別變項時,我們可依類別數(shù)(k)建構(gòu)k-1個數(shù)值為0與1之虛擬變項(dummyvariable)來代表不同之類別。因此,如果能適當(dāng)?shù)氖褂玫脑挘嘣貧w分析是一相當(dāng)有力的工具。2、 多元回歸分析主要有三個步驟:5G7M5K"T5d乙p”I8N一第一、利用單變項和雙變項分析來檢視各個準(zhǔn)備納入復(fù)回歸分析的變項是否符合OLS線性回歸分析的基本假定。一選定回歸模式,并評估所得

2、到的參數(shù)估計和適合度檢定(goodnessoffit)o2L!2Z3o,A$J*g一在我們認(rèn)真考慮所得到的回歸分析結(jié)果前,應(yīng)做殘余值(residuals之診斷分析(diagnosis)°但通常我們是先確定回歸模式之設(shè)定(specification)是否恰當(dāng)后,才會做深入之殘余值分析。3、 回歸分析的第一步是一一檢視每個即將納入回歸分析模式的變項。首先,我們必須先確定應(yīng)變項有足夠的變異(variability),而且是接近常態(tài)分配(回歸系數(shù)的估計并不要求應(yīng)變項是常態(tài)分配,但對此估計做假設(shè)測定時,則是要求殘余值應(yīng)為常態(tài)分配。而應(yīng)變項離開常態(tài)分配的狀態(tài)很遠(yuǎn)時,殘余值不是常態(tài)分配的可能性增大

3、)。其次,各自變項也應(yīng)該有適當(dāng)?shù)淖儺?,并且要了解其分配之形狀和異常的個案(outlyingcasesoutliers)。7t%'+K3y2Y9P%o7n1AY我們可用直方圖(histogram)和NormalP-P(probabilityplot)圖等來測定應(yīng)變項是否拒絕其為常態(tài)分配的假設(shè),以及是否有異常之個案。同樣的,我們可用直方圖和其它單變項之統(tǒng)計來檢視各個自變項之分配形狀、程度,以及異常個案等。在SPSS中,我們可用Analyze內(nèi)的DescriptiveStatistics中的Explore來得到上述之統(tǒng)計和圖。2a(Q-s.'i*wM%:?(z4、 做雙變項相關(guān)之分析

4、之主要目的是檢視變項間之關(guān)系是否為線性關(guān)系(linearity)和是否為共線性(collinearity)之情況。最基本的作法是看雙變項之相關(guān)矩陣。如果應(yīng)變項與自變項間之關(guān)系很弱或比自變項間之相關(guān)弱的話,就應(yīng)質(zhì)疑所設(shè)定之多元回歸模式是否適當(dāng)。9A9I6eo,0:F-W檢視自變項與應(yīng)變項間是否為線性關(guān)系的基本作法是看雙變項間之散布圖(scatterplot)。進(jìn)階且比較好的作法是在控制其它自變項后,再看某一自變項與應(yīng)變項間之部分線性關(guān)系(partiallinearity)。線性關(guān)系是回歸分析重要的假定,而且指的是自變項與應(yīng)變項間之部份線性關(guān)系。我們并不用太關(guān)心自變項間是否為線性關(guān)系,但如對自變項

5、間關(guān)系之設(shè)定有誤時,也會導(dǎo)致我們對虛假關(guān)系不適當(dāng)?shù)目刂坪徒忉屔系腻e誤。#N9o#G8m8-0N-W探索自變項與應(yīng)變項間部分線性關(guān)系的方式是在控制其它自變項后,逐一檢視某一自變項及進(jìn)一步加入此自變項之平方后,看看兩個回歸模式間是否達(dá)顯著之差異。如果是的話,則此自變項與應(yīng)變項間之關(guān)系并不是線性關(guān)系。當(dāng)發(fā)現(xiàn)自變項與應(yīng)變項間并非線性關(guān)系時,除了將該自變項之平方加入回歸分析的方法外,也可將該自變項做對數(shù)轉(zhuǎn)換(logtransformation),例如我們常將個人之收入做對數(shù)轉(zhuǎn)換之處理。究竟如何處理是適當(dāng)?shù)?,是以理論為基礎(chǔ)。在SPSS中,我們可用Analyze內(nèi)之Correlate中的Bivariate及

6、Graphs中的Scatter來得至U雙變項之相關(guān)矩陣及散布圖。部份線性相關(guān)之檢視則需用到Transform內(nèi)的Compute來建構(gòu)一個變項的平方,然后用Analyze內(nèi)之Regression中的Linear來檢視。3k8'A-j;/I0i4D(Y:b6Pv5、 在決定回歸分析的模式后,我們應(yīng)進(jìn)一步檢視自變項間是否有多元共線性(multicollinearity)的問題,也就是自變項間是否有高度相關(guān)的問題。如果自變項間高度相關(guān)的話,會影響到對回歸系數(shù)之假設(shè)測定。我們可以用因素分析來檢查自變項間是否有多元共線性,或者是逐一將某一自變項(當(dāng)成為應(yīng)變項)和所有其它自變項做多元回歸分析。在以S

7、PSS做回歸分析時,我們也可在其Statistic之選項中選擇partialcorrelation與collinearity之統(tǒng)計。SPSS所提供之collinearity的統(tǒng)計包括Tolerance、VIF(varianceinflationfactor)和ConditionIndex等。這些統(tǒng)計是有關(guān)連性的。如Tolerance與VIF就是互為倒數(shù),如果是Tolerance越小,就表示該自變項與其它自變項間之共線性越高或幾乎是其它自變項的線性組合。3k!p'g"+X;O$n4N6、 如果自變項是類別的變項,我們可以將這些類別一一建構(gòu)成為虛擬變項。依照類別數(shù)目(k),我們只

8、需建構(gòu)k-1個虛擬變項即可。如性別有兩類,因此我們只需建構(gòu)一個男性的虛擬變項。如果受訪者為男性,則其男性變項為1,如為女性,則其男性變項為0。同理,如果一個類別變項有四類,如臺灣地區(qū)別是分成北、中、南、東等四區(qū),則我們可將此類別變項建構(gòu)成中部、南部及東部等三個虛擬變項。當(dāng)受訪者是在北部時,其在此三虛擬變項的值會都是0。至于將那個類別做為參考類別(referencecategory),也就是不建構(gòu)為虛擬變項的類別,通常是次數(shù)最多的類別。我們也可依理論或研究假設(shè)的需要,來考慮是將那個類別做為參考類別。&p$O:t:G"h+1p*X當(dāng)我們將這些虛擬變項納入回歸模式后,個別虛擬變項的

9、回歸系數(shù)(如果達(dá)統(tǒng)計顯著的話),就是此虛擬變項所代表之類別與參考類別間在截距上的差距。如果我們假設(shè)此類別變項對應(yīng)變項的影響,不只是在截距上的不同,且會有不同的斜率,也就是與另一自變項間有交互作用(interaction),我們可以進(jìn)一步將虛擬變項與此另一自變項相乘而成另一新變項(如男性*受教育年數(shù))。我們可將原來的兩個自變項及此新變項一起納入回歸分析中。如果此新變項之回歸系數(shù)達(dá)顯著的話,則其意義是與虛擬變項相乘之自變項(如受教育年數(shù))對應(yīng)變項的影響會因虛擬變項所代表的類別不同(如性別)而有不同的斜率(即影響力)。例如當(dāng)受教育年數(shù)對收入的影響,男性比女性來得大時,則回歸分析結(jié)果可能一方面表現(xiàn)在男

10、性此一虛擬變項的正向系數(shù)達(dá)顯著,表示在受同樣教育年數(shù)的條件下,男性的起薪比女性高,另一方面也表現(xiàn)在男性*受教育年數(shù)之正向系數(shù)達(dá)顯著,表示男性每年受教育對收入的回報大過女性。此外,當(dāng)我們假設(shè)自變項與應(yīng)變項的關(guān)系為n型時,或是應(yīng)變項會隨自變項之?dāng)?shù)值增大而變化趨緩時,我們就可建構(gòu)一自變項的平方,將此自變項及其平方一起納入,如果此平方的變項達(dá)顯著,則我們可知此自變項對應(yīng)變項的影響不是直線性的。7、在完成以上之基礎(chǔ)工作后,而且發(fā)現(xiàn)沒有問題或?qū)栴}做了適當(dāng)?shù)奶幚砗?,我們就可開始做多元回歸的分析。*o+I/r/B;D/i:x6T5R檢視多元回歸分析之結(jié)果的步驟是先檢視整體模式之適合度(goodnessoff

11、it)。這是看回歸分析結(jié)果之ANOVA表中之Ftest是否達(dá)到顯著。如果是的話,我們可說此模式在母群體之R2不是0,或自至少有一個自變項對應(yīng)變項有解釋力。R2(或納入自變項數(shù)目做了調(diào)整后之a(chǎn)djustedR2)的意義是所有自變項解釋了多少比例之應(yīng)變項的變異量。在檢視完整體模式之解釋力后,下一步是逐一檢視各自變項之斜率(slope),也就是回歸系數(shù)是否達(dá)到顯著(即測定其是否為0之虛無假設(shè))。這是要看每一自變項回歸系數(shù)的T-test及p值(通常應(yīng)至少小于0.05)。如果某一自變項之系數(shù)達(dá)顯著水平的話,則其意義是在控制其它自變項的情況下,此一自變項對應(yīng)變項之獨(dú)特影響力(uniqueeffect)為何

12、。另一說法是,自變項每增加一個測量時用的單位,會改變多少應(yīng)變項測量時之單位。我們可代入此自變項一個數(shù)值(如此變項之平均數(shù)),然后計算在此數(shù)值和B(unstandardizedcoefficient)乘積,這乘積就是此自變項在此數(shù)值時,應(yīng)變項的數(shù)值有多大。1?7A7b,u:L)U2f*e如果我們要知道和其它自變項比較,那一個自變項對應(yīng)變項之獨(dú)特影響力比較大,則我們是要看Beta(standardizedcoefficient)或部分相關(guān)系數(shù)(看此比較好)。3z!s!/L"Q8、如果我們的回歸分析是建立在一個因果模式上,那我們可進(jìn)行階層式回歸分析(hierarchicalregressi

13、on??次覀冄芯康慕裹c(diǎn)為何,我們可逐一將自變項加入回歸模式中,然后看不同階段之回歸模式的整體解釋力和各個自變項解釋力的變化。.C-w$o&f&RT&x'U9、嚴(yán)謹(jǐn)?shù)幕貧w分析是要進(jìn)一步對residuals做檢視后,才報告分析所得到之結(jié)果。殘余值是指每個個案將其自變項之?dāng)?shù)值代入回歸模式中計算在應(yīng)變項之預(yù)測值,然后將實際觀察到之值與此預(yù)測值相減后所得到之殘余。對殘余值之診斷主要有兩項:6T/?4N&g#_k-p7a4.J!,9'一Influencediagnosis.:此診斷要看的是有無一些異常的個案可能對回歸模式的估計造成不當(dāng)之的影響,并膨脹standarderrors。特別是當(dāng)樣本數(shù)較小時,我們要當(dāng)心此可能性。在SPSS的回歸分析之Save的選項中,可將標(biāo)準(zhǔn)化處理后之殘余值(standardizedresidual©儲存起來。SPSS也會將標(biāo)準(zhǔn)化之殘余值大于3的個案之ID報告出來。如果此類個案數(shù)目不多的話(依機(jī)率,每一百個標(biāo)準(zhǔn)化之殘余值中會有5個殘余值之z值大于2),那我們就可說是沒有異常個案影響回歸模式估計的問題。Normality與hetroskedasticity:OLS回歸分析假定在predictionfunction之不同le

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論