版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
回歸分析是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計(jì)方法,其用意是研究一個(gè)被解釋變量(又稱(chēng)因變量)與一個(gè)或多個(gè)解釋變量(又稱(chēng)自變量)之間的統(tǒng)計(jì)關(guān)系。其次,可以利用回歸關(guān)系對(duì)目標(biāo)變量進(jìn)行控制。第八章回歸分析§8.1輸入式線性回歸8.1.1問(wèn)題引入例1
研究我國(guó)31個(gè)省市自治區(qū)的“人均食品支出”對(duì)“人均收入”的依賴(lài)關(guān)系。(數(shù)據(jù)文件為“CH8例1例2一元與多元回歸”)設(shè)“人均食品支出”用隨機(jī)變量Y來(lái)表示,“人均收入”用隨機(jī)變量X來(lái)表示,那么這道題所求的兩個(gè)變量之間的不確定關(guān)系,可以用下式來(lái)表示
(8.2)式中,“人均食品支出”是被解釋變量,“人均收入”是解釋變量,是待估參數(shù)(截距項(xiàng)),是待估參數(shù)(斜率項(xiàng),反映了X的邊際效益),u是隨機(jī)干擾項(xiàng),與X無(wú)關(guān),它反映了Y被X解釋的不確定性。如果隨機(jī)干擾項(xiàng)的均值為0,那么對(duì)上式兩邊在的條件下求均值,有
(8.3)反映出從“平均”角度看的確定函數(shù)關(guān)系。第八章回歸分析我們可以先從SPSS的操作方面來(lái)看看這個(gè)問(wèn)題是怎么解答的。在上一章討論兩個(gè)變量:“人均食品支出”和“人均收入”存在顯著性相關(guān)關(guān)系的前提下,接著(1)錄入數(shù)據(jù),點(diǎn)擊:【分析】→【回歸】→【線性】,系統(tǒng)彈出一個(gè)對(duì)話窗口。(2)在左欄中選擇變量“人均食出”,點(diǎn)擊向右的箭頭,放入“因變量”框中。在左欄中選擇變量“人均收入”,點(diǎn)擊向右的箭頭,放入“自變量”框中,如圖8.1所示。第八章回歸分析(3)點(diǎn)擊窗口右側(cè)的【Statistic…】按鈕,彈出一個(gè)新的對(duì)話框,如圖8.1所示。在該“線性回歸:統(tǒng)計(jì)”窗口的“回歸系數(shù)”框中,有三項(xiàng)選擇:①估計(jì):這是系統(tǒng)的默認(rèn)值。選擇此項(xiàng),系統(tǒng)會(huì)輸出:回歸系數(shù)B、B的標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)回歸系數(shù)Beta、B的值及其雙尾檢驗(yàn)的值。②誤差條形圖的表征:復(fù)選項(xiàng)。選擇此項(xiàng),系統(tǒng)輸出每一個(gè)B(非標(biāo)準(zhǔn)化回歸系數(shù))的95%的置信區(qū)間。我們選擇此項(xiàng)。③協(xié)方差矩陣:不選擇。點(diǎn)擊【繼續(xù)】,回到主對(duì)話窗口。(4)點(diǎn)擊【確定】,輸出結(jié)果。(5)結(jié)果分析:第八章回歸分析表8.2模型總體參數(shù)表模型RR平方調(diào)整后的R平方標(biāo)準(zhǔn)估算的錯(cuò)誤1.921a.848.84373.635a.預(yù)測(cè)變量:(常量),人均收入表8.3方差分析表模型平方和自由度均方F顯著性1回歸878568.6211878568.621162.035.000b殘差157240.218295422.076
總計(jì)1035808.83930
a.因變量:人均食品支出b.預(yù)測(cè)變量:(常量),人均收入表8.4是回歸系數(shù)表,該表第一列是對(duì)模型的解釋變量的說(shuō)明。第八章回歸分析表8.4回歸系數(shù)及顯著性檢驗(yàn)表a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)t顯著性B的95.0%置信區(qū)間B標(biāo)準(zhǔn)錯(cuò)誤貝塔下限值上限1(常量)-50.94667.745
-.752.458-189.50087.607人均收入.422.033.92112.729.000.354.490a.因變量:人均食品支出§8.1輸入式線性回歸8.1.2定義定義1:一元線性回歸的總體回歸函數(shù)有兩種表現(xiàn)形式:(1)條件期望表現(xiàn)形式當(dāng)自變量X取某一固定值時(shí),Y的取值并不確定,Y的不同取值會(huì)形成一定的分布,這是Y在X取不同值時(shí)的條件分布。
(8.4)(2)個(gè)別值表現(xiàn)形式
(8.5)其中為樣本對(duì),n為樣本個(gè)數(shù)。ui為各個(gè)Yi與條件期望的偏差,顯然ui是個(gè)可負(fù)可正的隨機(jī)變量,代表排除在自變量Xi以外的所有因素對(duì)Yi的影響,稱(chēng)為隨機(jī)誤差項(xiàng)。第八章回歸分析第八章回歸分析第八章回歸分析第八章回歸分析第八章回歸分析第八章回歸分析第八章回歸分析第八章回歸分析§8.1輸入式線性回歸8.1.3擬合優(yōu)度的度量樣本回歸直線是對(duì)樣本數(shù)據(jù)的一種擬合,不同估計(jì)方法可擬合出不同的回歸線,從例1的散點(diǎn)圖上看,樣本回歸直線與樣本觀測(cè)值總是一定程度上存在或正或負(fù)的偏離。對(duì)所估計(jì)出的樣本回歸線首先要考察對(duì)樣本觀測(cè)數(shù)據(jù)擬合的優(yōu)劣程度,即對(duì)所謂的擬合優(yōu)度進(jìn)行度量。對(duì)樣本回歸擬合優(yōu)度的度量是建立在對(duì)因變量總離差平方和分解的基礎(chǔ)上的?;仡櫼呀?jīng)估計(jì)的樣本回歸函數(shù)
(8.27)如果以平均值為基準(zhǔn),比較觀測(cè)值和估計(jì)值對(duì)的偏離程度,(8.24)式可以用離差表示為
(8.28)將上式兩邊平方,并對(duì)所有觀測(cè)值加總,近似得
(8.29)第八章回歸分析第八章作業(yè)第八章作業(yè)§8.1輸入式線性回歸8.1.4兩個(gè)假設(shè)檢驗(yàn)1、關(guān)于回歸效果的F檢驗(yàn)在線性回歸中,當(dāng)有多個(gè)自變量作用于因變量時(shí)就要考察聯(lián)合起來(lái)后與因變量之間是否存在顯著性的線性關(guān)系了,即應(yīng)當(dāng)對(duì)回歸系數(shù)進(jìn)行整體檢驗(yàn)。該檢驗(yàn)是在方差分析的基礎(chǔ)上利用檢驗(yàn)進(jìn)行的。對(duì)回歸效果進(jìn)行假設(shè)檢驗(yàn)的基本思想是,用“已解釋平方和”即回歸平方和與“未解釋平方和”殘差平方和的比值即(服從F分布)與的比較,來(lái)判別在a水平上,回歸效果是否顯著。① 求出F統(tǒng)計(jì)量的值定義8:檢驗(yàn)回歸效果的F統(tǒng)計(jì)量定義為
(8.33)第八章回歸分析第八章回歸分析第八章回歸分析3、多元線性回歸示例例2研究我國(guó)31個(gè)省市自治區(qū)的“人均食品支出”對(duì)“人均收入”、“糧食單價(jià)”的依賴(lài)關(guān)系。(數(shù)據(jù)文件為“CH8例1例2一元與多元回歸”)(1)打開(kāi)數(shù)據(jù)文件后,點(diǎn)擊:【分析】→【回歸】→【線性】,系統(tǒng)彈出一個(gè)對(duì)話窗口。(2)在左欄中選擇變量“人均食品支出”,點(diǎn)擊向右的箭頭,放入“因變量”框中。在左欄中選擇變量“人均收入”、“糧食平均單價(jià)”,點(diǎn)擊向右的箭頭,放入“自變量”框中,如圖8.3左側(cè)所示。(3)點(diǎn)擊窗口右側(cè)的【Statistic…】按鈕,彈出一個(gè)新的對(duì)話框,如圖8.3右側(cè)所示。在該“線性回歸:統(tǒng)計(jì)”窗口的“回歸系數(shù)”框中,有三項(xiàng)選擇:估計(jì):這是系統(tǒng)的默認(rèn)值。選擇此項(xiàng),系統(tǒng)會(huì)輸出:回歸系數(shù)B、B的標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)回歸系數(shù)Beta、B的值及其雙尾檢驗(yàn)的值。誤差條形圖的表征:復(fù)選項(xiàng)。系統(tǒng)會(huì)輸出每一個(gè)B(非標(biāo)準(zhǔn)化回歸系數(shù))的95%的置信區(qū)間。我們選擇此項(xiàng)。協(xié)方差矩陣:不選擇。點(diǎn)擊【繼續(xù)】,回到主對(duì)話窗口。第八章回歸分析3、多元線性回歸示例例2(4)點(diǎn)擊【方法】對(duì)應(yīng)的箭頭,出現(xiàn)一個(gè)下拉菜單,提供一些可供選擇的其他方法,我們先采用系統(tǒng)默認(rèn)的“輸入”方法,意味著兩個(gè)自變量都輸入回歸方程參與分析。(5)點(diǎn)擊【確定】,輸出結(jié)果。(6)結(jié)果分析第八章回歸分析表8.6模型摘要模型RR平方調(diào)整后的R平方標(biāo)準(zhǔn)估算的錯(cuò)誤1.940a.883.87565.651a.預(yù)測(cè)變量:(常量),人均收入,糧食平均單價(jià)表8.7回歸的方差分析表模型平方和自由度均方F顯著性1回歸915129.0502457564.525106.164.000b殘差120679.788284309.992
總計(jì)1035808.83930
a.因變量:人均食品支出b.預(yù)測(cè)變量:(常量),人均收入,糧食平均單價(jià)表8.8回歸系數(shù)及顯著性檢驗(yàn)表模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)t顯著性B的95.0%置信區(qū)間B標(biāo)準(zhǔn)錯(cuò)誤貝塔下限值上限1(常量)-87.36861.680
-1.416.168-213.71438.979糧食平均單價(jià)213.42373.278.2432.913.00763.320363.526人均收入.352.038.7679.185.000.273.430a.因變量:人均食品支出定義9:標(biāo)準(zhǔn)回歸系數(shù)標(biāo)準(zhǔn)回歸系數(shù)的設(shè)立原因是用來(lái)描述自變量的一種相對(duì)的重要性,比如說(shuō),雖然我們不能絕對(duì)地說(shuō)出教育程度和工齡在決定收入上的重要性,但如果大家的教育程度比較相似,那么在收入上,工作年數(shù)就是決定因素;反之,如果工作年數(shù)沒(méi)有太大區(qū)別,那么受教育程度就成為了重要原因。這里的重要性是相對(duì)的,是根據(jù)不同情況而改變的。對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化,即將原始數(shù)據(jù)減去相應(yīng)變量的均值后再除以該變量的標(biāo)準(zhǔn)差,然后再按照上面的回歸方法計(jì)算得到的回歸方程稱(chēng)為標(biāo)準(zhǔn)化回歸方程,相應(yīng)的回歸系數(shù)稱(chēng)為標(biāo)準(zhǔn)化回歸系數(shù)。標(biāo)準(zhǔn)化過(guò)程如下
,(8.36)式中,,,。第八章回歸分析也可以在SPSS中,點(diǎn)擊【分析】→【描述統(tǒng)計(jì)】→【描述】,勾選復(fù)選框“將標(biāo)準(zhǔn)化得分另存為變量”,然后按上述線性回歸分析的步驟點(diǎn)擊。結(jié)果如下,我們可以看到,此時(shí)的非標(biāo)準(zhǔn)化的回歸系數(shù)和標(biāo)準(zhǔn)系數(shù)貝塔的值是一樣的。第八章回歸分析表8.9數(shù)據(jù)標(biāo)準(zhǔn)化后的回歸系數(shù)及顯著性檢驗(yàn)表模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)t顯著性B標(biāo)準(zhǔn)錯(cuò)誤貝塔1(常量)-1.817E-16.063
.0001.000Zscore:糧食平均單價(jià).243.083.2432.913.007Zscore:人均收入.767.083.7679.185.000a.因變量:Zscore:人均食品支出§8.2逐步回歸問(wèn)題8.2.1逐步回歸法問(wèn)題引入例3研究某城市散戶(hù)股民的證券市場(chǎng)的“投入市場(chǎng)總資金”是否可以用變量“證券市場(chǎng)外的收入”、“受教育程度”、“入市年份”和“股民年齡”來(lái)說(shuō)明。數(shù)據(jù)見(jiàn)文件“CH8例3證券市場(chǎng)”。(1)打開(kāi)數(shù)據(jù)文件后,點(diǎn)擊:【分析】→【回歸】→【線性】,系統(tǒng)彈出一個(gè)對(duì)話窗口。(2)在左欄中選擇變量“投入市場(chǎng)總資金”,點(diǎn)擊向右的箭頭,放入“因變量”框中。在左欄中選擇變量“證券市場(chǎng)以外年收入”、“受教育程度”、“入市年份”和“年齡”(股民年齡)點(diǎn)擊向右的箭頭,放入“自變量”框中,如圖8.4左側(cè)所示。(3)點(diǎn)擊【方法】對(duì)應(yīng)的箭頭,出現(xiàn)一個(gè)下拉菜單,本例題我們選擇“逐步法”,選擇后如圖8.4所示。第八章回歸分析8.2.1逐步回歸法問(wèn)題引入例3(4)點(diǎn)擊主窗口右下角的【選項(xiàng)】按鈕,見(jiàn)圖8.4,可以發(fā)現(xiàn)在上述三種逐步回歸法(逐步、后退、前進(jìn))中,SPSS所默認(rèn)的進(jìn)入回歸方程的變量的系數(shù)的F統(tǒng)計(jì)量的概率為0.05,所默認(rèn)的從回歸方程中刪除變量的系數(shù)的F統(tǒng)計(jì)量的概率為0.10。兩者的差距有明顯的作用,它能夠使進(jìn)入回歸方程的變量不容易從方程中刪除。在逐步回歸的過(guò)程中,當(dāng)新的解釋變量進(jìn)入方程后,一般會(huì)改變已經(jīng)進(jìn)入方程的“貢獻(xiàn)”,使原來(lái)的統(tǒng)計(jì)量的顯著性概率發(fā)生變化,例如變?yōu)?.08。如果從方程中刪除自變量的顯著性概率值還是0.05,那么這個(gè)變量Xj就應(yīng)該從方程中刪除了。但是現(xiàn)在不用從方程中刪除,因?yàn)?.08還小于設(shè)定的顯著性概率值0.10。正因?yàn)槿绱耍疟苊饬巳缦滤姥h(huán)的發(fā)生:一個(gè)解釋變量Xj剛進(jìn)方程→新的解釋變量進(jìn)方程后改變了Xj的統(tǒng)計(jì)量的顯著性概率,例如變?yōu)?.08(大于0.05)→于是,Xj出方程→然后Xj又進(jìn)方程→……。本例接受系統(tǒng)的默認(rèn)值。點(diǎn)擊【繼續(xù)】,返回主窗口。(5)點(diǎn)擊窗口右側(cè)的【Statistic…】按鈕,彈出一個(gè)新的對(duì)話框,如圖8.5所示。第八章回歸分析8.2.1逐步回歸法問(wèn)題引入例3(6)點(diǎn)擊【繼續(xù)】,回到主對(duì)話窗口。(7)點(diǎn)擊主窗口右上方的【繪圖】按鈕,系統(tǒng)彈出所要繪制圖形的對(duì)話窗,見(jiàn)圖8.6。(8)點(diǎn)擊【繼續(xù)】,返回主對(duì)話框。(9)在主對(duì)話窗口中,點(diǎn)擊【保存】按鈕,可選擇有關(guān)計(jì)算結(jié)果保存下來(lái)。(10)點(diǎn)擊【確定】,系統(tǒng)輸出結(jié)果。(11)結(jié)果分析:第八章回歸分析表8.10回歸問(wèn)題中的方差分析表模型平方和自由度均方F顯著性1回歸43028.424143028.42418.978.000b殘差326494.0941442267.320
總計(jì)369522.517145
2回歸54693.770227346.88512.421.000c殘差314828.7481432201.600
總計(jì)369522.517145
a.因變量:投入證券市場(chǎng)總資金b.預(yù)測(cè)變量:(常量),證券市場(chǎng)以外年收入c.預(yù)測(cè)變量:(常量),證券市場(chǎng)以外年收入,年齡8.2.1逐步回歸法問(wèn)題引入例3(表8.11是回歸系數(shù)表,第一列是對(duì)模型的解釋變量的說(shuō)明。第二列B為回歸系數(shù)非標(biāo)準(zhǔn)化的回歸系數(shù)。第三列為“標(biāo)準(zhǔn)系數(shù)貝塔”。第四列為t值,第五列“顯著性”為t值的顯著性概率p值。第八章回歸分析表8.11回歸系數(shù)與顯著性檢驗(yàn)表a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)t顯著性B標(biāo)準(zhǔn)錯(cuò)誤貝塔1(常量)15.7317.674
2.050.042證券市場(chǎng)以外年收入5.9921.375.3414.356.0002(常量)-8.63713.010
-.664.508證券市場(chǎng)以外年收入5.8261.357.3324.292.000年齡7.8503.410.1782.302.023a.因變量:投入證券市場(chǎng)總資金表8.12排除的系數(shù)顯著性檢驗(yàn)表a模型輸入貝塔t顯著性偏相關(guān)共線性統(tǒng)計(jì)容許1年齡.178b2.302.023.189.997受教育程度-.067b-.838.403-.070.968入市年份-.151b-1.950.053-.1611.0002受教育程度-.031c-.388.699-.033.927入市年份-.105c-1.288.200-.107.895a.因變量:投入證券市場(chǎng)總資金b.模型中的預(yù)測(cè)變量:(常量),證券市場(chǎng)以外年收入c.模型中的預(yù)測(cè)變量:(常量),證券市場(chǎng)以外年收入,年齡8.2.2逐步回歸的原理第八章回歸分析8.2.2逐步回歸的原理第八章回歸分析8.2.2逐步回歸的原理向前法的優(yōu)點(diǎn)是可以自動(dòng)去掉高度相關(guān)的自變量,但也有一定的局限性,向前法在自變量選擇的過(guò)程中,只在自變量引入模型時(shí)考察其是否有統(tǒng)計(jì)學(xué)意義,并不考慮在引入模型后每個(gè)自變量值的變化,后續(xù)變量的引入可能會(huì)使先進(jìn)入方程的自變量變得無(wú)統(tǒng)計(jì)學(xué)意義。向后法與向前法正好相反,它事先將全部自變量選入回歸模型,任何逐個(gè)剔除對(duì)殘差平方和貢獻(xiàn)較小的自變量。如果說(shuō)向前法是選拔員工,那么后退法就相當(dāng)于公司裁員,每一次裁掉一個(gè)對(duì)公司貢獻(xiàn)最小且無(wú)顯著性意義的員工(例如:剔除標(biāo)準(zhǔn)p>0.01),然后對(duì)剩下的員工再次進(jìn)行評(píng)估,裁掉一個(gè)貢獻(xiàn)最小的員工,以此類(lèi)推不斷有員工被裁掉,直到公司認(rèn)為即使再裁掉其他員工,也不會(huì)額外減少對(duì)公司的貢獻(xiàn),此時(shí)裁員停止,以上即為向后法的基本流程。向后法的優(yōu)點(diǎn)是考慮了自變量的組合作用,但是當(dāng)自變量數(shù)目較多或者自變量間高度相關(guān)時(shí),可能得不出正確的結(jié)論。第八章回歸分析8.2.2逐步回歸的原理逐步回歸法,是在向前法和向后法的基礎(chǔ)上,進(jìn)行雙向篩選變量的一種方法。逐步回歸分析的實(shí)施過(guò)程是:每一步都要對(duì)已引入回歸方程的變量計(jì)算其偏回歸平方和(即貢獻(xiàn)),然后選一個(gè)偏回歸平方和最小的變量,在預(yù)先給定的水平下進(jìn)行顯著性檢驗(yàn),若顯著則該變量不必從回歸方程中剔除,這時(shí)方程中其他幾個(gè)變量也都不需要剔除(因?yàn)槠渌麕讉€(gè)變量的偏回歸平方和都大于最小的一個(gè)更不需要剔除)。相反,如果不顯著,則該變量需要剔除,然后按偏回歸平方和由小到大地依次對(duì)方程中其他變量進(jìn)行檢驗(yàn)。對(duì)影響不顯著的變量全部剔除,保留的都是顯著的。接著再對(duì)未引入回歸方程中的變量分別計(jì)算其偏回歸平方和,并選其中偏回歸方程和最大的一個(gè)變量,同樣在給定水平下作顯著性檢驗(yàn),如果顯著則將該變量引入回歸方程,這一過(guò)程一直持續(xù)下去,直到在回歸方程中的變量都不能剔除而又無(wú)新變量可以引入時(shí)為止,這時(shí)逐步回歸過(guò)程結(jié)束。第八章回歸分析8.2.2逐步回歸的原理向前法的優(yōu)點(diǎn)是可以自動(dòng)去掉高度相關(guān)的自變量,但也有一定的局限性,向前法在自變量選擇的過(guò)程中,只在自變量引入模型時(shí)考察其是否有統(tǒng)計(jì)學(xué)意義,并不考慮在引入模型后每個(gè)自變量值的變化,后續(xù)變量的引入可能會(huì)使先進(jìn)入方程的自變量變得無(wú)統(tǒng)計(jì)學(xué)意義。向后法與向前法正好相反,它事先將全部自變量選入回歸模型,任何逐個(gè)剔除對(duì)殘差平方和貢獻(xiàn)較小的自變量。如果說(shuō)向前法是選拔員工,那么后退法就相當(dāng)于公司裁員,每一次裁掉一個(gè)對(duì)公司貢獻(xiàn)最小且無(wú)顯著性意義的員工(例如:剔除標(biāo)準(zhǔn)p>0.01),然后對(duì)剩下的員工再次進(jìn)行評(píng)估,裁掉一個(gè)貢獻(xiàn)最小的員工,以此類(lèi)推不斷有員工被裁掉,直到公司認(rèn)為即使再裁掉其他員工,也不會(huì)額外減少對(duì)公司的貢獻(xiàn),此時(shí)裁員停止,以上即為向后法的基本流程。向后法的優(yōu)點(diǎn)是考慮了自變量的組合作用,但是當(dāng)自變量數(shù)目較多或者自變量間高度相關(guān)時(shí),可能得不出正確的結(jié)論。第八章回歸分析§8.3線性回歸中的虛擬解釋變量問(wèn)題8.3.1問(wèn)題引入例4
某研究者調(diào)查了16家公司CEO的年收入(萬(wàn)元)、年齡、是否有MBA學(xué)位的數(shù)據(jù),見(jiàn)表(數(shù)據(jù)見(jiàn)文件“CH8例4CEO”),試分析獲MBA學(xué)位對(duì)年收入的影響。讀入數(shù)據(jù)后:(1)點(diǎn)擊:【圖形】→【舊對(duì)話框】→【折線圖】→【多線線圖】→【定義】。(2)在圖8.7的左側(cè)框中,把變量“年齡”拖到右邊的“類(lèi)別軸”框中,把虛擬變量“獲MBA”拖入右邊的“定義線的方式”框中。這里“定義線的方式”的含義是,用不同類(lèi)型的線條(例如實(shí)線、虛線等)來(lái)區(qū)別變量“MBA”對(duì)應(yīng)的不同的值。本例在數(shù)據(jù)窗口設(shè)置了兩個(gè)含義相同的虛擬變量,一個(gè)名為“獲MBA”,是數(shù)值型的;另一個(gè)是“MBA”是字符串型的。此時(shí)兩種類(lèi)型的變量均可以作為“定義線的方式”。(3)點(diǎn)擊【確定】按鈕,系統(tǒng)輸出多線線圖,見(jiàn)圖8.8所示。第八章回歸分析年收入232716.833322034274332273545423926年齡25273640414245465051555060616353獲MBA0101101001001100§8.3線性回歸中的虛擬解釋變量問(wèn)題8.3.1問(wèn)題引入例4
在解釋變量中含有虛擬變量的線性回歸,與不含有虛擬變量的線性回歸的點(diǎn)擊過(guò)程是完全相同的。讀入數(shù)據(jù)后:(1)錄入數(shù)據(jù),點(diǎn)擊:【分析】→【回歸】→【線性】,系統(tǒng)彈出一個(gè)對(duì)話窗口,與圖8.1相同。(2)在左欄中選擇變量“年收入”,點(diǎn)擊向右的箭頭,放入“因變量”框中。在左欄中選擇變量“年齡”和“獲MBA”,點(diǎn)擊向右的箭頭,放入“自變量”框中。(3)接受“方法”中的“輸入”方法,點(diǎn)擊【確定】,系統(tǒng)輸出回歸計(jì)算結(jié)果。也可以用逐步回歸方法。第八章回歸分析§8.3線性回歸中的虛擬解釋變量問(wèn)題8.3.1問(wèn)題引入例4
下面我們來(lái)看一下結(jié)果。由表8.13的數(shù)據(jù)可見(jiàn),假設(shè)顯著性檢測(cè)水平,自變量“年齡”和虛擬變量“獲MBA”的作用都是顯著的,因?yàn)橄鄳?yīng)回歸系數(shù)的統(tǒng)計(jì)值的顯著性概率分別為0.000和0.001均小于0.01(見(jiàn)最后一列)。虛擬變量“獲MBA”的回歸系數(shù)為8.464,表明在“年齡”變量保持不變的情況下,變量“獲MBA”從0變?yōu)?時(shí),CEO的年收入約增加8.464萬(wàn)元,也就是說(shuō),具有MBA學(xué)位的CEO的年收入比不具有MBA學(xué)位的年收人(平均)高出約8.5萬(wàn)元。第八章回歸分析表8.12方差分析表a模型平方和自由度均方F顯著性1回歸661.9382330.96918.966.000b殘差226.8621317.451
總計(jì)888.80015
a.因變量:萬(wàn)元b.預(yù)測(cè)變量:(常量),獲MBA,年齡表8.13回歸系數(shù)表a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)t顯著性B標(biāo)準(zhǔn)錯(cuò)誤貝塔1(常量)5.4234.716
1.150.271年齡.455.097.6604.709.000獲MBA8.4642.105.5634.020.001a.因變量:萬(wàn)元§8.3線性回歸中的虛擬解釋變量問(wèn)題8.3.2解釋變量是虛擬解釋變量的情況虛擬變量是用以反映變量屬性的一個(gè)人工變量,是量化了的自變量,通常取值為0或1。引入虛擬變量雖然使線形回歸模型變得更復(fù)雜,但對(duì)問(wèn)題描述更簡(jiǎn)明,一個(gè)方程能達(dá)到兩個(gè)方程的作用,而且更接近現(xiàn)實(shí)。例如,反映文化程度的虛擬變量可取為:1:本科學(xué)歷;0:非本科學(xué)歷。一般地,在虛擬變量的設(shè)置中:基礎(chǔ)類(lèi)型、肯定類(lèi)型取值為1;比較類(lèi)型,否定類(lèi)型取值為0。第八章回歸分析§8.3線性回歸中的虛擬解釋變量問(wèn)題8.3.3解釋變量是順序級(jí)變量的情況一般說(shuō)來(lái),在順序級(jí)變量的背后,都可以找到某種刻度級(jí)的含義。例如,“收入的等級(jí)”的背后是收入的貨幣量,“受教育的等級(jí)”背后的刻度級(jí)的量可以是每個(gè)等級(jí)的受教育年限,“受歡迎程度的等級(jí)”背后的刻度級(jí)的量,似乎難找,其實(shí)可以用“受歡迎的比例(所考察人群中的受歡迎的比例)”作為這個(gè)等級(jí)變量背后支撐這個(gè)等級(jí)的刻度級(jí)的量。如果順序級(jí)變量背后的刻度級(jí)的量,在順序級(jí)變量的各個(gè)等級(jí)上的區(qū)間跨度大致是相同的,通常可以把這個(gè)順序級(jí)的變量的等級(jí)“作為”刻度級(jí)的量來(lái)處理(在回歸分析中,作為刻度級(jí)的自變量來(lái)處理),也就是,回歸方程的形式不變.如果這個(gè)順序變量的回歸系數(shù)顯著異于0,那么它就有著非常清晰的含義:當(dāng)其他自變量保持不變時(shí),這個(gè)順序級(jí)自變量每增加一個(gè)等級(jí)(也就是其背后的刻度級(jí)的量每增加一個(gè)同樣的區(qū)間跨度)對(duì)的邊際貢獻(xiàn)。第八章回歸分析§8.4曲線回歸與SPSS應(yīng)用定義10:曲線回歸(curvilinearregression)是指對(duì)于非線性關(guān)系的變量進(jìn)行回歸分析的方法,曲線回歸方程一般是以自變量的多項(xiàng)式表達(dá)因變量。方法是:根據(jù)數(shù)據(jù)的特點(diǎn)先進(jìn)行某些變換,如對(duì)數(shù)變換、
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- CCAA - 2023年01月建筑施工領(lǐng)域?qū)I(yè)答案及解析 - 詳解版(65題)
- 營(yíng)銷(xiāo)業(yè)務(wù)市場(chǎng)調(diào)查報(bào)告作業(yè)模板
- 2026年上海市松江區(qū)中考一模物理試題(含答案)
- 養(yǎng)老院志愿者服務(wù)管理制度
- 養(yǎng)老院環(huán)境保護(hù)管理制度
- 企業(yè)項(xiàng)目管理制度
- 統(tǒng)編版(2024)七年級(jí)上冊(cè)歷史期末復(fù)習(xí):材料分析題解題方法+50題練習(xí)題(含答案解析)
- 建立健全現(xiàn)代企業(yè)制度提升管理水平
- 2025年福建省人資集團(tuán)漳州地區(qū)招聘考試真題
- 手持小型動(dòng)力工具制作工操作管理能力考核試卷含答案
- 中藥學(xué)教材課件
- 夢(mèng)雖遙追則能達(dá)愿雖艱持則可圓模板
- 能源與動(dòng)力工程測(cè)試技術(shù) 課件 第一章 緒論確定
- 配件售后管理制度規(guī)范
- 浙江省紹興市上虞區(qū)2024-2025學(xué)年七年級(jí)上學(xué)期期末語(yǔ)文試題(解析版)
- 《隸書(shū)千字文》-清席夔
- 2024校長(zhǎng)在寒假期末教職工大會(huì)上精彩發(fā)言主要引用3個(gè)關(guān)鍵詞善待自己改變自己提升自己
- 《鐵路技術(shù)管理規(guī)程》(普速鐵路部分)
- 2024-2025年度“地球小博士”全國(guó)地理科普知識(shí)大賽參考試題庫(kù)(含答案)
- 北師大版六年級(jí)上冊(cè)分?jǐn)?shù)混合運(yùn)算100題帶答案
- 2024年度工程成本控制優(yōu)化合同
評(píng)論
0/150
提交評(píng)論