版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
SPSS-回歸-多元線性回歸模型案例解析?。ㄒ唬?/p>
多元線性回歸,主要是研究一個(gè)因變量與多個(gè)自變最之間的相關(guān)關(guān)系,跟一元回歸原理
差不多,區(qū)別在于影響因素(自變量)更多些而已,例如:一元線性回歸方程為:
丫=0o+o】x+£
亳無疑問,多元線性回歸方程應(yīng)該為:
Y=0O+0E+#2必+…+4%+£
上圖中的xl,x2,xp分別代表''自變量二p截止,代表有P個(gè)自變量,如果有''N組樣本,
那么這個(gè)多元線性回歸,將會(huì)組成一個(gè)矩陣,如下圖所示:
記〃組樣本分別是(看“2,…,X爐,%),(,=L2,…⑼,令
那么,多元線性同歸方程矩陣形式為:Y=xp+E.
其中:£代表隨機(jī)受差,其中隨機(jī)誤差分為:可解釋的誤差和不可解釋的誤差,
隨機(jī)誤差必須滿足以下四個(gè)條件,多元線性方程才有意義(一元線性方程也i樣)
1:服成正太分布,即指:隨機(jī)誤差£必須是服成正太分別的隨機(jī)變量。
2:無偏性假設(shè),即指:期望值為0
3:同共方差性假設(shè),即指,所有的隨機(jī)誤差變量方差都相等
4:獨(dú)立性假設(shè),即指:所有的隨機(jī)誤差變最都相互獨(dú)立,可以用協(xié)方差解釋。
今天跟大家一起討論一下,SPSS--多元線性回歸的具體操作過程,下面以教程教程數(shù)據(jù)
為例,分析汽車特征與汽車銷化:量之間的關(guān)系.通過分析汽車特征跟汽車銷化:量的關(guān)系,
建立擬合多元線性回歸模型。數(shù)據(jù)如下圖所示:
1salesresaletypepriceengine_shcrsepowwheelbaswidthlengthcurt
16919163600215001.8140101.2673172.4
39.38419.875028.4003.2225108170.3192.9
14.114182250322251069706192.0
858829725042.00035210114.671.4196.6
20.39722255023.9901.8150102668.2178.0
1878023555033.950282001087761192.0
uao39.000062.0004.2310113.0M.O198.2
19,74702699025170107.36841760
9.23128675033.4002.8193107.3685176.0
17.52736125038.90028193111.4709188.0
91.56112475021.9753.1175109.0727194.6
39.35013.740025.3003.8240109.0727196.2
2785120190031.9653.8205113.87472068
83.25713.360027.8853.8205112.273.5200.0
63.72922525039,8954.6275115.374.5207.2
15.94327100044.4754.6275112275.0201.0
6.53625725039.6654.6275108075.5200.6
110103.0200107.470.31948
14.785?146.2255.7255117.577.0201.2
145,51992500132602211510416791809
135.12611,225016.5353.1170107.069.4190.4
24,62910310018,890311751075725200.9
42.59311.525019.3903.4180110.572.7197.9
點(diǎn)擊''分析〃一回歸一線性一進(jìn)入如下圖所示的界面:
展線性回歸
因變量?):__________________________
aa廠冢[manufact]|夕Log-transformedsales[Insales]
如Model[modell
塊1的1-
奪新車售價(jià)(單位:..
6侔后二手車售價(jià)…【下一張M
dVehicletype[type]
自變量Q):
"Priceinthousand...
dVehicletype[type]不
夕Enginesize[engi...
「"I6Priceinthousands[price]
"Horsepower[hor...
-----6Enginesize[engine_s]
"Wheelbase[whe...
6車寬(width]
方法M):逐步
6車長[length]
/車凈重[curb_wgt]
(------1選擇變量(£):
/Fuelcapacity[fue...
6耗油量:邁科[mpg]L^Jii%
6CooksDistance[...個(gè)案標(biāo)簽(£):
"95%LCIforlnsa...|Priceinthousands[price)
695%UClforInsa...WLS^M(H):
/95%LClforInsa...
[確定J粘貼(Bj重置取消||邈
將''銷售量"作為''因變量〃拖入因變量框內(nèi),將''車長,車寬,耗油率,車凈重等10個(gè)自變
量拖入自變量框內(nèi),如上圖所示,在''方法〃旁邊,選擇''逐步〃,當(dāng)然,你也可以選擇其它
的方式,如果你選擇''進(jìn)入"默認(rèn)的方式,在分析結(jié)果中,將會(huì)得到如下圖所示的結(jié)果:(所
有的自變量,都會(huì)強(qiáng)行進(jìn)入)
輸入/相去的變量b
模型輸入的變量移去的變量方法
1耗油量:邁科,輸入
車上,Pricein
thousands,
Vehicletype,
車寬,Engine
size,Fuel
capacity,
Wheelbase,
車凈重,
Horsepower
a.已輸入所有諳求的變量。
b,因變量:Log-transformedsales
如果你選擇
''逐步〃這個(gè)方法,將會(huì)得到如卜.圖所示的結(jié)果:(將會(huì)根據(jù)預(yù)先設(shè)定的叩統(tǒng)計(jì)量的概率值進(jìn)
行篩選,最先進(jìn)入回歸方程的''自變量"應(yīng)該是跟''因變量〃關(guān)系最為密切,貢獻(xiàn)最大的,如
下圖可以看出,車的價(jià)格和車軸跟因變量關(guān)系最為密切,符合判斷條件的概率值必須小于
0.05,當(dāng)概率值大于等于0.1時(shí)將會(huì)被剔除)
輸入/移去的變量a
摸型輸入的變量移去的變量方法
1Pricein步進(jìn)(準(zhǔn)則:F-
thousandsto-enter的概
率<=.050,
F-to-remove
的慨率>=.
100)。
2Wheelbase?步進(jìn)(準(zhǔn)則:F-
to-enter的概
率<=.050,
F-to-remove
的祗率>=.
100)。
a.因變量:Log-transformedsales
''選擇變量
(E)”框內(nèi),我并沒有輸入數(shù)據(jù),如果你需要對(duì)某個(gè)''自變量〃進(jìn)行條件篩選,可以將那個(gè)自
變量,移入''選擇變量框”內(nèi),有一個(gè)前提就是:該變量從未在另一個(gè)目標(biāo)列表中出現(xiàn)!再
點(diǎn)擊''規(guī)則〃設(shè)定相應(yīng)的''篩選條件〃即可,如下圖所示:
點(diǎn)擊''統(tǒng)計(jì)量"彈出如下所示的框,如下所示:
在''回歸系數(shù)〃下面勾選''估計(jì),在右側(cè)
勾選〃模型擬合度”和〃共線性診斷''兩個(gè)選項(xiàng),再勾選''個(gè)案診斷〃再點(diǎn)擊''離群值〃一般默認(rèn)
值為、'3〃,(設(shè)定異常值的依據(jù),只有當(dāng)殘差超過3倍標(biāo)準(zhǔn)差的觀測才會(huì)被當(dāng)做異常值)
點(diǎn)擊繼續(xù)。
提示:
共線性檢驗(yàn),如果有兩個(gè)或兩個(gè)以上的自變量之間存在線性相關(guān)關(guān)系,就會(huì)產(chǎn)生多重共線
性現(xiàn)象。這時(shí)候,川最小二乘法估計(jì)的模型參數(shù)就會(huì)不穩(wěn)定,回歸系數(shù)的估計(jì)值很容易引
起誤導(dǎo)或者導(dǎo)致錯(cuò)誤的結(jié)論。所以,需要勾選''共線性診斷〃來做判斷
通過容許度可以計(jì)算共線性的存在與否?容許度TOL=1-RI平方或方差膨脹因子
(VIF):VIF=1/1-RI平方,其中RI平方是用其他自變量預(yù)測第I個(gè)變量的復(fù)相關(guān)系數(shù),顯
然,VIF為TOL的倒數(shù),TOL的值越小,VIF的值越大,自變量XI與其他自變量之間存在
共線性的可能性越大。
提供三種處理方法:
1:從有共線性問題的變量里刪除不重要的變量
2:增加樣本品或重新抽取樣本。
3:采用其他方法擬合模型,如領(lǐng)回歸法,逐步回歸法,主成分分析法。
再點(diǎn)擊''繪制〃選項(xiàng),如下所示:
上圖中:
DEPENDENT(因變量)ZPRED(標(biāo)準(zhǔn)化預(yù)測值)ZRESID(標(biāo)準(zhǔn)化殘差)DRESID(剔除
殘差)ADJPRED(修正后預(yù)測值)SRSID(學(xué)生化殘差)SDRESID(學(xué)生化剔除殘差)
一般我們大部分以''自變量〃作為X軸,用''殘差〃作為Y軸,但是,也不要忽略特殊情況,
這里我們以''ZPRED(標(biāo)準(zhǔn)化預(yù)測值)作為女”軸,分別用''SDRESID(血生化剔除殘差)”
和''ZRESID(標(biāo)準(zhǔn)化殘差)作為Y軸,分別作為兩組繪圖變量。
再點(diǎn)擊〃保存''按鈕,進(jìn)入如下界面:
預(yù)測直殘差
□未標(biāo)準(zhǔn)化乜)口未標(biāo)準(zhǔn)化變)
B標(biāo)準(zhǔn)化(R)71標(biāo)準(zhǔn)化(A)
巴調(diào)節(jié)Q)□學(xué)生化@)
[均值預(yù)測值的S.E.(E)刪除&)
學(xué)生化己刪除(目
-距離影響統(tǒng)計(jì)量
匚MahalanobisSgS(H)□D18eta(B)
?CooK距離(K)□標(biāo)準(zhǔn)化DfBeta(Z)
杠桿值(g)□DfFit(F)
預(yù)測區(qū)間---------------□標(biāo)準(zhǔn)化DfFit(T)
□協(xié)方差比率包)
網(wǎng)均值率)叫單值Q)
置信區(qū)間(£)951%
系數(shù)統(tǒng)計(jì)
匚創(chuàng)建系數(shù)統(tǒng)計(jì)(2)
⑥創(chuàng)建新數(shù)據(jù)集(A)_____________________
數(shù)據(jù)集名稱(。):
?寫入審散據(jù)文件印)
[文件(L)..J
將模型信息輸出到XML文件
__________]]瀏覽?)…)
(V包含協(xié)方差矩陣Q9
[繼續(xù)]取消幫助:
如上圖所示:勾選''距離〃卜面的''cook距離〃選項(xiàng)(cook距離,主要是指:把一個(gè)個(gè)案從計(jì)
算回歸系數(shù)的樣本中剔除時(shí)所引起的殘差大小,cook距離越大,表明該個(gè)案對(duì)回歸系數(shù)的
影響也越大)
在''預(yù)測區(qū)間〃勾選''均值〃和''單值〃點(diǎn)擊''繼續(xù)〃按鈕,再點(diǎn)擊”確定按鈕,得到如下所示的分
析結(jié)果:(此分析結(jié)果,采用的是''逐步法〃得到的結(jié)果)
模型匯總c
標(biāo)準(zhǔn)估計(jì)的誤
模型RR方調(diào)整R方差
1.552a.304.3001.115534
2.655b.430.4221.013572
a,預(yù)測變量:痹量),Priceinthousands。
b預(yù)測變量:爆量),Priceinthousands,Wheelbase。
c因變量:Log-transformedsales
Anovac
模型平坪和df均方FSig.
1回歸81.720181.72055.670.000a
殘差186.6621501.244
總計(jì)268.383151
2回歸115.311257.65656.122.000b
殘差153.0721491.027
總計(jì)268.383151
a.預(yù)測變量:(常量),Priceinthousands0
b.預(yù)潮變量:潦量Priceinthousands.Wheelbase*
c.因變量:Log-transformedsales
已排除的變量c
共線性統(tǒng)計(jì)量
模型BetaIntSig.偏相關(guān)容差VIF最小容差
1Vehicletype.251a3.854.000.301.9981.002,998
Enginesize,342a4.128.000.320.6111.636.611
Horsepower257a2.062.041.167.2933.417.293
Wheelbase.356a5.718.000.424.9881.012.988
軍寬.24"3.517.001.277.8921.121.892
車長.308a4.790.000.365.9761.025.976
車凈重.346」4.600.000.353.7221.385.722
Fuelcapacity266a3.687.000.289.8201.219.820
耗油量:邁科-.1981-2.584.011-.207.7581.319.758
2Vehicletype.129b1.928.056.157.8351.197,827
Enginesize.145b1.576.117.128.4452.246.445
Horsepower.028b.229.819.019.2563.910.256
車寬-.025b-.275.784-.023.4702.126,470
車長027b.237.813.020.2903.448.290
車凈重.105b1.028.306.084.3652.741.365
Fuelcapacity.002b.024.981.002.4432.259,443
耗油量:邁科,014b.164.870.014.5591.790.559
a.模型中的預(yù)測變量:(常量),Priceinthousands。
b.模型中的預(yù)潮變量“常量Priceinthousands,Wheelbase*
c.囪變量:Log-transtormedsales
系顫3
非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)共線性統(tǒng)計(jì)量
模型B標(biāo)準(zhǔn)誤差試用版tSig.容差VIF
1(常量)4684.19424,090,000
Priceinthousands-051.006-.552-8.104.0001.0001.000
2(常量)-18221.151-1.583.116
Priceinthousands-055.006-.590-9.487,000.9881.012
Wheelbase061.011.3565.718.000.9881.012
a.因變疊Log-transformedsales
共線牲診斷&
方差比例
Pricein
模型維數(shù)特征值條件索引(常量)thousandsWheelbase
111.8851.000.06.06
2.1154.051.94.94
212.8471.000.00.02.00
2.1504.351.01.97.01
3.00333.412.99.00.99
a.因變量:Log-transfcrmedsales
殘差統(tǒng)計(jì)量2
?極小值~極大值-rnM~標(biāo)準(zhǔn)偏差?~NI
圖表
直方圖
回歸標(biāo)準(zhǔn)化殘差
散點(diǎn)圖
因變量:Log-transformedsales
82.6
O
71.02
O
701限平錯(cuò)格80563516.98
18.145
O
25.45
O
回歸標(biāo)準(zhǔn)化預(yù)計(jì)值
SPSS一回歸一多元線性回歸結(jié)果分析(二)
,最近一直很忙,公司的潮起潮落,就好比人生的跌巖起伏,眼看著一步步走向衰弱,卻
無能為力,也許要學(xué)習(xí)''步步驚心〃里面''四阿哥〃的座右銘:''行到水窮處”,〃坐看云起時(shí):
接著上一期的''多元線性回歸解析〃里面的內(nèi)容,上一次,沒有寫結(jié)果分析,這次補(bǔ)上,
結(jié)果分析如下所示:
結(jié)果分析1:
輸入/移去的變量a
摸型輸入的變量移去的變量方法
1Pricein步進(jìn)(準(zhǔn)則:F-
thousandsto-enter的概
率<=.050,
F-to-remove
的慨率>=.
100)。
2Wheelbase?步進(jìn)(準(zhǔn)則:F-
to-enter的概
率<=.050?
F-to-remove
的祗率>=.
100)。
a.因變量:Log-transformedsales
由于開始選擇
的是''逐步〃法,逐步法是n向前〃和''向后〃的結(jié)合體,從結(jié)果可以看出,最先進(jìn)入''線性回歸
模型〃的是''priceinthousands"建立了模型1,緊隨其后的是''Wheelbase”建立了模型2,
所以,模型中有此方法有個(gè)概率值,當(dāng)小于等于0.05時(shí),進(jìn)入''線性回歸模型〃(最先進(jìn)入
模型的,相關(guān)性最強(qiáng),關(guān)系最為密切)當(dāng)大于等0.1時(shí),從''線性模型中”剔除
模型匯總c
標(biāo)準(zhǔn)估計(jì)的誤
摸型RR方調(diào)整R方差
1.552a.304.3001.115534
2.655b.430.4221.013572
a.預(yù)測變量:(常量),Priceinthousands。
b,預(yù)測變量(常量),Priceinthousands,Wheelbase。
c.因變量:Log-transformedsales
Anovac
模型平充和df均方FSig.
1回歸81.720181.72065.670.000a
殘差186.6621501.244
總計(jì)268.383151
2回歸115.311257,65656.122,000b
殘差153.0721491.027
總計(jì)268.383151
a.頊測變量:(常量),Priceinthousands。
b瓶蒯變量,常量),Priceinthousands.Wheelbase?
c.因變量:Log-transformedsales
結(jié)
果分析:
1:從''模型匯總〃中可以看出,有兩個(gè)模型,(模型1和模型2)從R2擬合優(yōu)度來看,模
型2的擬合優(yōu)度明顯比模型1要好一些
(0.422>0,300)
2:從、'Anova”表中,可以看出、'模型2"中的''回歸平方和“為115.311,''殘差平方和〃為
153.072,由于總平方和二回歸平方和+殘差平方和,由于殘差平方和(即指隨即誤差,不可
解釋的誤差)由于''回歸平方和〃跟''殘差平方和“幾乎接近,所有,此線性回歸模型只解釋
了總平方和的一半,
3:根據(jù)后面的"F統(tǒng)計(jì)量〃的概率值為。為0,由于O.OOvD.Ol,隨著''自變量〃的引入,其顯
著性概率值均遠(yuǎn)小于0.01,所以可以顯著地拒絕總體gI歸系數(shù)為。的原假設(shè),通過
ANOVA方差分析表可以看出''銷售量〃與''價(jià)格〃和''軸距〃之間存在著線性關(guān)系,至于線性關(guān)
系的強(qiáng)弱,需要進(jìn)一步進(jìn)行分析。
已俳除的變量C
并線性統(tǒng)計(jì)量
模型BetaIntSig.偏相關(guān)容差VIF最小容差
1Vehicletype.251a3.854.000,301.9981.002,998
Enginesize.34234.128.000,320.6111.636,611
Horsepower.257a2.062.041.167.2933.417.293
Wheelbase?356&5.718.000,424.9881.012.988
車寬?24爐3.517.001.277.8921.121.892
車長,308a4.790.000.365.9761.025.976
車凈重.346」4.600.000.353.7221.385.722
Fuelcapacity.2bba3.M.UUU.289.82U1.21a.82U
耗油量:邁福-.198a-2.584.011-.207.7581.319.758
2Vehicletype.129b1.928.056.157.8351.197,827
Enginesize.145b1.576.117,128.4452.246.445
Horsepower.028b.229.819.019.2563.910.256
車寬-.025b-.275,784-.023,4702.126,470
車長.027b.237.813,020.2903.448.290
車凈重.105b1.028.306.084,3652.741.365
Fuelcapacity.002b.024.981,002.4432.259,443
耗油量:邁科.014b.164.870.014.5591.790.559
a.模型中的預(yù)測變量:(常量),Priceinthousands。
b.模型中的預(yù)涮變量:(常量iPriceinthousands,Wheelbase。
c.因變量:Log-transformedsales
結(jié)果分析:
1:從''己排除的變量〃表中,可以看出:''模型2〃中各變量的T檢的概率值都大于、'0.05"所
以,不能夠引入''線性回歸模型〃必須剔除。
系虢
非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)共線性統(tǒng)計(jì)量
模型B標(biāo)準(zhǔn)誤差試用版tSig.容差VIF
1(常量)4.684.19424,090,000
Priceinthousands-.051.006-.552-8.104.0001.0001.000
2(常量)-1.8221.151-1.583.116
Priceinthousands-.055.006-.590-9.487.000.9881.012
Wheelbase.061.011.3565.718.000.9881.012
a.因變基Log-transformedsales
從''系數(shù)屋表中可以看出:
1:多元線性回歸方程應(yīng)該為:銷售量=-1.822-0.055*價(jià)格+0.061*軸距
但是,由于常數(shù)項(xiàng)的sig為(0.116>0.1)所以常數(shù)項(xiàng)不具備顯著性,所以,我們再看后面
的''標(biāo)準(zhǔn)系數(shù)〃,在標(biāo)準(zhǔn)系數(shù)一列中,可以看到''常數(shù)項(xiàng)"沒有數(shù)值,已經(jīng)被剔除
所以:標(biāo)準(zhǔn)化的回歸方程為:銷售量=-0.59*價(jià)格+0.356*軸距
2:再看最后一歹『共線性統(tǒng)計(jì)量〃,其中''價(jià)格〃和''軸距"兩個(gè)容差和、'vif都一樣,而且VIF
都為1.012,且都小于5,所以兩個(gè)自變量之間沒有出現(xiàn)共線性,容忍度和
膨脹因子是互為倒數(shù)關(guān)系,容忍度越小,膨脹因子越大,發(fā)生共線性的可能性也越大
共線牲診斷a
方差比例
Pricein
模型維數(shù)特征值條件索引(常量)thousandsWheelbase
111.8851.000.06.06
2.1154.051.94.94
212.8471.000.00.02.00
2.1504.351.01.97.01
3.00333.412.99.00.99
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 心血管疾病基因組學(xué):國際數(shù)據(jù)整合研究
- 心腦血管病與慢阻肺共病社區(qū)干預(yù)策略
- 心臟移植供體分配的供體腦死亡判定標(biāo)準(zhǔn)
- 心臟微血管病變的微循環(huán)功能恢復(fù)策略
- 心臟介入術(shù)后康復(fù)期患者依從性提升策略
- 循環(huán)腫瘤DNA指導(dǎo)腫瘤精準(zhǔn)治療動(dòng)態(tài)調(diào)整
- 影像可視化在患者教育中意義
- 2025年觀賞魚培育銷售合同協(xié)議
- 康復(fù)機(jī)器人在兒童康復(fù)中的倫理邊界
- 康復(fù)醫(yī)療AI的個(gè)性化訓(xùn)練路徑設(shè)計(jì)
- 配電紅外測溫課件
- 江蘇省2025年普通高中學(xué)業(yè)水平合格性考試歷史試卷(含答案詳解)
- 小學(xué)階段人工智能在激發(fā)學(xué)生學(xué)習(xí)動(dòng)機(jī)中的應(yīng)用研究教學(xué)研究課題報(bào)告
- 2025年山西大地環(huán)境投資控股有限公司社會(huì)招聘116人備考題庫及完整答案詳解一套
- 民爆三大員培訓(xùn)題庫及答案
- 小學(xué)蘇教版科學(xué)三年級(jí)上冊(2024新教材)知識(shí)點(diǎn)梳理及2025秋期末測試卷及答案
- 2025醫(yī)美行業(yè)白皮書-羅蘭貝格x美團(tuán)醫(yī)美-202508
- 井下作業(yè)技術(shù)油水井措施酸化課件解析
- 勞動(dòng)教育融入思政課一體化建設(shè)路徑探索 論文
- 熱電有限公司突發(fā)事件安全保衛(wèi)應(yīng)急預(yù)案
- 財(cái)務(wù)管理形考任務(wù)4
評(píng)論
0/150
提交評(píng)論