版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
□思考與練習(xí)題
思考題
10.1.多重判定系數(shù)和修正的多重判定系數(shù)有什么作用?
多重判定系數(shù)是多元回歸中的回歸平方和占總平方和的比例,它是度量多元
回歸方程擬合程度的一個統(tǒng)計量,反映了在因變量y的變差中被估計的回歸方程
所解釋的比例,其計算公式為:
SSR力(生一寸-J)2
肥=*=q-----=1-聞-------------=1一些
SSTy(y-y)2Y(y-yY
i-li=l
修正的多重判定系數(shù)考慮了樣本量(〃)和模型中自變量的個數(shù)(Z)的影
響,這就使得的值永遠(yuǎn)小于R2,而且的值不會由于模型中自變量個數(shù)的增加而
越來越接近1,其計算公式為:
n-k-\
10.2.如何進(jìn)行回歸系數(shù)的顯著性檢驗?
將回歸均方(MSR)同殘差均方(MSE)加以比較,應(yīng)用F檢驗來分析二者之間的
差別是否顯著。
10.3.模型中虛擬變量是什么,為什么要引入虛擬變量?
虛擬變量是用以反映質(zhì)的屬性的一個人工變量,是量化了的自變量,通常取
值為。或1。引入虛擬變量可使線形回歸模型變得更復(fù)雜,但對問題描述更簡
明,一個方程能達(dá)到兩個方程的作用,而且接近現(xiàn)實。
10.4.多重共線性會導(dǎo)致什么后果,如何檢測并處理?
多重共線性是指回歸模型中兩個或兩個以上的自變量彼此相關(guān),多重共線可
能會使回歸的結(jié)果造成混亂,可能對參數(shù)估計值的正負(fù)號產(chǎn)生影響。
檢測多重共線性的最簡單的一種辦法是計算模型中各對口變量之間的相關(guān)系
數(shù),并對各相關(guān)系數(shù)進(jìn)行顯著性檢驗。將一個或多個相關(guān)的自變量從模型中剔
除,使保留的自變量盡可能不相關(guān)。
10.5.解釋向前回歸、向后剔除和逐步回歸的異同點。
逐步回歸法可以認(rèn)為是向前引入法與向后剔除法的綜合。逐步回歸法克服了向
前引入法與向后剔除法的缺點,吸收兩種方法的優(yōu)點。
10.6.多元線性回歸預(yù)測和因果分析有什么不同?
預(yù)測因果分析
遺漏變量對于預(yù)測的影響小的多。因果分析的主要目標(biāo)是得到回歸
遺
預(yù)測的目標(biāo)是基于可用的變量的線系數(shù)的無偏倚估計。因此遺漏的
漏
性組合,得到優(yōu)化的預(yù)測。因此不變量造成的偏倚是極具威脅的。
的
存在對預(yù)測來說“真正的”系數(shù)進(jìn)行特別是那些既影響因變量,又和
變優(yōu)化估計的說法。除非如果加入遺自變量相關(guān)的變量。這些變量的
量漏的變量,可以改進(jìn)預(yù)測。遺漏往往會導(dǎo)致無效結(jié)論。
當(dāng)R2小的時候,也能做好因果分
2反映了預(yù)測模型對數(shù)據(jù)的擬合
R析,檢驗自變量對因變量效果的
2度。最大化R2對預(yù)測建模是關(guān)鍵性
R假設(shè)??梢酝ㄟ^大樣本量抵消小
的。
斤的短處。
多多重共線性是因果分析的一個主
重預(yù)測不管多重共線性。看的是所有
要問題。當(dāng)兩個或更多自變量高
共自變量的組合對因變量的預(yù)測能
度相關(guān)時,對每個自變量獨立的
線力。因此可以不一個個地拆開對待
系數(shù)估計就能難得到可靠的結(jié)
性自變量。
論。
缺缺失數(shù)據(jù)對預(yù)測的影響可能有兩個
失方面。首先,某個數(shù)據(jù)缺失了本身
以前對缺失數(shù)據(jù)的研究都是為了
數(shù)對預(yù)測來說是一個有用的信息。其
做參數(shù)估計和假設(shè)檢驗C
據(jù)次,不僅僅訓(xùn)練數(shù)據(jù)會缺失,測試
數(shù)據(jù)也會有缺失C
測測量誤差會對因果分析的參數(shù)估
測量誤差對預(yù)測肯定有影響。但如
量計帶來誤差。因此需要盡量控
何干預(yù)要看情況。很多時候做預(yù)測
誤制。
的數(shù)據(jù)就長成那樣,也沒法干預(yù)。
差
練習(xí)題
10.7.為了分析薪酬與受教育年限、工作年限之間的關(guān)系,某調(diào)查機構(gòu)調(diào)查
了15個員工的情況,數(shù)據(jù)如下表所示:
員工編號薪酬(元)y受教育年限(年)不工作年限(年)馬
15500122
2485096
370001210
46850163
5350092
69000162
75400125
84950124
98250162
106700126
117950163
12435094
136300129
145900128
158500163
(1)建立回歸模型,得出估計方程并對解釋回歸系數(shù)的含義。
(2)根據(jù)估計方程說明N的含義。
解:
首先多元線性回歸模型需要滿足殘差零均值、方差齊性、正態(tài)性及獨立性的
假設(shè),同時還需要進(jìn)行多重共線性診斷。先做出因變量的分布圖以及回歸的殘差
圖,如下
直方圖
因變量:薪酬
均沮-333E-16
*.?仁心卒;0926
N=15
回歸標(biāo)準(zhǔn)化理并用標(biāo)準(zhǔn)PF圖敝點留
因受量:雷儀因支吊:前情
M
?
的K
枳M
率
刷溶的K的微率明歸林腐化依計做
從以上殘差圖可以看出,基本滿足零均值、正態(tài)性、方差齊性條件。
(1)設(shè)薪酬為了,受教育年限為工作年限為馬,根據(jù)最小二乘法估計
回歸模型參數(shù):
B\二=597.514,A=―々)?:田=135.281;
工(與一%)Z(々i—w)
A=—1897.305
可得估計方程為y=-1897.305+597.514%+135.28lx2
下面運用SPSS軟件進(jìn)行問歸分析,結(jié)果如下表所示
模型匯總b
模型RR方調(diào)整R方標(biāo)準(zhǔn)估計的誤差Durbin-Watson
1,926a.858.834659.3982.235
a.預(yù)測變量:(常量),工作年限,受教育年限。
b.因變量:薪酬
根據(jù)上表對于殘差獨立性的檢驗,DW值在2附近,說明模型不存在自相關(guān)。
模型的參數(shù)估計和檢驗a
非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)共線性統(tǒng)計量
模型tSig.容忍
標(biāo)準(zhǔn)誤差VIF
PB度
(常量)-1897.3051071.848-1.770.102
1受教育年限597.51470.730.9808.448.000.8791.138
工作年限135.28170.493.2231.919.079.8791.138
a.因變量:薪酬
從上表可以看出VIF<10,不存在較嚴(yán)重的多重共線性。
對于回歸系數(shù)的解釋:在控制其他變量不變的情況下,每增加1年受教育年
限,薪酬增加597.514元;在控制其他變量不變的情況下,每增加1年工作年
限,薪酬增加135.281元。
(2)收=0.958,修正后代=0,834,說明薪酬V能被回歸方程所解釋的比
例為83.4%o
10.8.某公司對于新上線的產(chǎn)品通過電腦端和手機端兩種渠道進(jìn)行推廣,為
調(diào)查收入與兩種推廣渠道的關(guān)系,選取了8Z個月的收入和渠道推廣費用數(shù)據(jù);
收入y(萬元)電腦端費用為(萬元)手機端費用4(萬元)
955.01.5
902.02.0
964.51.5
922.52.5
943.03.0
953.53.0
933.02.5
(1)確定估計方程。
(2)給出收入的預(yù)測值及95%置信區(qū)間和預(yù)測區(qū)間。
解:
首先多元線性回歸模型需要滿足殘差零均值、方差齊性、正態(tài)性及獨立性的
假設(shè),同時還需要進(jìn)行多重共線性診斷。先做出因變量的分布圖以及回歸的殘差
圖,如下
直方圖
因變星:收入
r,W?6.71E-1S
-0816
HCJ標(biāo)準(zhǔn)化線學(xué)
回歸標(biāo)準(zhǔn)化線并的標(biāo)準(zhǔn)PF圖做點圖
因變量:收入因受量:收入
劇H
笥
fl”
累
先
松
M殘
繪
率
觀淵的東枳概率標(biāo)?t化依討依
從殘差圖中可以發(fā)現(xiàn)零均值、方差齊性不滿足,可采用加權(quán)最小二乘法進(jìn)行
估計,殘差的正態(tài)性近似滿足。
(1)設(shè)收入為y,電腦端費用為占,手機端費用為4,根據(jù)最小二乘法估
計回歸模型參數(shù):
6二平產(chǎn)畢=2」76,后二盤/亨=34,
二(司A1)Z(*2i*2)
p(}--82.805
可得估計方程為:y=-82.805+2.176x1+1.514x2
下面運用SPSS軟件進(jìn)行回歸分析,結(jié)果如下表所示
模型匯總b
模型RR方調(diào)整R方標(biāo)準(zhǔn)估計的誤差Durbin-Watson
1.955”.912.868.7521.650
a.預(yù)測變量:(常量),手機端費用,電腦端費用。
b.因變量:收入
從上表看出,DW在2附近,基本滿足獨立性。
模型的參數(shù)估計和檢驗a
非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)共線性統(tǒng)計量
模型tSig.
標(biāo)準(zhǔn)誤差P容忍度VIF
(常量)82.8052.18137.968.000
1電腦端費用2.176.3421.1246.367.003.7061.417
手機端費用1.514.574.4652.635.058.7061.417
a.因變量:收入
從表中可以看出VIFvlO,不存在較嚴(yán)重的多重共線性。
(2)收入的預(yù)測值及95%置信區(qū)間和預(yù)測區(qū)間如下表所示
標(biāo)準(zhǔn)化置信區(qū)間置信區(qū)間預(yù)測區(qū)間預(yù)測區(qū)間
收入y預(yù)測值
預(yù)測值下限上限上限下限
9595.961.2194.3897.5493.3498.58
9090.19-1.7188.4291.9587.4592.92
9694.870.6693.4996.2592.3797.37
9292.03-0.7890.9893.0889.6994.37
9493.880.1592.6095.1591.4396.32
9594.960.7093.5196.4192.4297.51
9393.12-0.2392.2693.9790.8695.37
10.9.某地區(qū)為了研究農(nóng)作物產(chǎn)量與降水量和溫度的關(guān)系,隨機選取7組數(shù)據(jù)
進(jìn)行分析。
產(chǎn)量(公斤)y降水量(ml)X1溫度(℃)明
2350205
3400357
4750509
61508511
680010013
750011516
815012017
(1)建立二元線性回歸方程,對回歸模型的線性關(guān)系和回歸系數(shù)進(jìn)行檢驗
(a=O.O5)。
(2)判斷是否存在多重共線性。
解:首先多元線性回歸模型需要滿足殘差零均值、方差齊性、正態(tài)性及獨立
性的假設(shè)。先做出因變量的分布圖以及回歸的殘差圖,如下
立方圖
回歸標(biāo)準(zhǔn)化罪差的標(biāo)戲P-P圖股點圖
因變量:產(chǎn)量因攵量:產(chǎn)量
回
用
知
fi杯
的
案
例iff
化
概
殘
率X
?os-
-05000510
劇盟的米枳微率目歸標(biāo)淡化仍“仇
從殘差圖中看出正態(tài)性、零均值、方差齊性基本滿足。
模型匯總b
模型RR方.調(diào)整R方標(biāo)準(zhǔn)估計的誤差Durbin-Watson
1.993a.986.980309.1721.523
a.預(yù)測變量:(常量),溫度,降水量。
b.因變量:產(chǎn)量
根據(jù)上表DW值在2附近,說明殘差獨立性假設(shè)基本滿足。
模型的參數(shù)估計和校驗a
非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)共線性統(tǒng)計
模型B標(biāo)準(zhǔn)錯誤6tSig.容忍度VIF
1(常量)1243.750524.2262.373.077
降水量石41.05117.759.7602.312.082.03231.676
溫度Z113.358158.280.236.716.513.03231.676
a.因變量:產(chǎn)量y
(1)二元線性回歸方程為:懺1243.750+41.051%+113.358%
①首先對回歸方程總體進(jìn)行F檢驗:
提出假設(shè)“o:4=A=。,H、:四,凡至少有一個不為0
計算檢驗統(tǒng)計量:八內(nèi)泮「黑甘44351
SSE/(n-I2)MSE
根據(jù)給定的顯著性水平a=O.O5,查F分布表,得g(2,4)=6.944,顯然
FNFa,故拒絕原假設(shè)H。,這表明農(nóng)作物產(chǎn)量和降水量、溫度之間存在顯著的
關(guān)系。
②對回歸系數(shù)進(jìn)行t檢驗:
提出假設(shè)H。:用=0,H、:0產(chǎn)金(i=l,2)
A
r,二旦=2.312
人
心=2=0.716
一,
根據(jù)給定的顯著性水平a=0.05,自由度4查t分布表,得%2=2.776,顯
然4<%2/2<%2,故不拒絕原假設(shè)”°,這表明降水量、溫度和產(chǎn)量之間不存
在顯著的關(guān)系。
(2)由(1)可知,模型F檢驗顯著,但回歸系數(shù)4,分的t檢驗均不顯
著,模型可能存在多重共線性。VIF>10,再,工2的共線性超過容許界限,存在
嚴(yán)重共線性。
10.10.某房地產(chǎn)行業(yè)為對新開發(fā)地區(qū)房產(chǎn)進(jìn)行合理估價,選取了10棟房產(chǎn)的
評估數(shù)據(jù),以此建立模型實現(xiàn)價格預(yù)測。
房產(chǎn)編號售價(元仇2)y地產(chǎn)國房產(chǎn)超面積七(層)
14350800208912730
24800900295517250
35250380359410760
45700400217613430
563001000395812650
66650580446518820
77200610512718770
87650770539518530
981501030553919500
1084002270488918150
(1)進(jìn)行逐步回歸,確定估計方程。
(2)給出預(yù)測值及95%置信區(qū)間和預(yù)測區(qū)間。
解:首先多元線性回歸模型需要滿足殘差零均值、方差齊性、正態(tài)性及獨立
性的假設(shè)。先做出因變量的分布圖以及回歸的殘差圖,如卜
且方圖
因變量:售價
<3^~1676-16
?>??¥-■0416
N-1O
八
回歸標(biāo)腐化殘茶的標(biāo)辦PF圖敵點用
因變?:但價因受量:售價
回
期
卬n
的k
樂?
化
鈕
?殘
更
率
?15.10-050。05
觀潮的索枳強睪回白標(biāo)盤化f?計他
從殘差圖中看出零均值、方差齊性、獨立性基本滿足;正態(tài)性近似滿足。
(1)對3個自變量分別進(jìn)行一元線性回歸,計算F統(tǒng)計量。
6=3.152,8=31.882,月=7.976
在顯著性水平儀=0.05下/(1,8)=5.318,因此xi不適合來解釋因變量。
由此,選擇F統(tǒng)計量最大的自變量占進(jìn)入模型,可得到估計的回歸方程:
y=2497.690+0.982x2。
同時引入自變量七及交互項看芻,分別計算F統(tǒng)計量。
■=14.730,娉=15.436
在顯著性水平。=0.05下/(2,7)=4.737,因此x?可以來解釋因變量。
進(jìn)一步針對回歸系數(shù)進(jìn)行顯著性檢驗,提出假設(shè)"o:A=O,H、邛產(chǎn)0
(i=2,3)
=0.560/;=0.773,在顯著性水平a=0.05,自由度7查t分布表,得
^=2.365,顯然故不拒絕原假設(shè)”°,這表明面積及面積與
房產(chǎn)的交互項和售價之間不存在顯著的關(guān)系。
綜上,估計的回歸方程為^=2497.690+0.982/。下面運用SPSS軟件進(jìn)行
回歸分析、結(jié)果如下表所示
模型的參數(shù)估計,
非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)
模型標(biāo)準(zhǔn)錯誤tSig.
1(常量)2497.690730.4663.419.009
房產(chǎn).982.174.8945.646.000
a.因變量:售價y
排除的變量a
共線性統(tǒng)計
模型輸入St顯著性偏相關(guān)容許
1地產(chǎn).26個1.766.121.555.890
面積X3.133b.560.593.207.484
a.因變量:售價y
b.模型中的預(yù)測變量:(常量),房產(chǎn)冷
(2)預(yù)測值及95%置信區(qū)間和預(yù)測區(qū)間如下表
編售價y標(biāo)準(zhǔn)化置信區(qū)置信區(qū)預(yù)測區(qū)預(yù)測區(qū)
預(yù)測值
號(元/"理)預(yù)測值問下限間上限間上限間下限
143504549.58-1.503634.275464.892754.186344.98
248005400.20-0.834751.636048.763724.997075.40
352506027.84-0.335510.556545.144398.967656.73
457004635.03-1.443749.055521.022854.416415.66
563006385.38-0.055896.346874.424765.258005.51
666506883.370.356363.167403.585253.568513.18
772007533.610.866873.148194.095853.769213.46
876507796.851.077059.718533.996085.419508.30
981507938.291.187156.958719.646207.359669.24
1084007299.840.686699.467900.215642.708956.98
10.11.男女的薪資差異一直存在著爭議,某調(diào)查機構(gòu)為了研究性別與薪資的
關(guān)系,隨機調(diào)查了12名員工,相關(guān)數(shù)據(jù)如下。
月薪(元)y工作年限(年)X,性別々(1二男性,。二女)
55843.21
66903.91
45782.70
79554.71
73464.50
58683.41
57723.3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 請示報告重大事項制度
- 計量檢定實驗室八項制度
- 行政人事部績效制度
- 銀川公司審計制度
- 2026湖北武漢武昌區(qū)中南電力設(shè)計院有限公司數(shù)智科技公司招聘4人參考考試試題附答案解析
- 2026年淄博周村區(qū)事業(yè)單位公開招聘綜合類崗位人員(9人)參考考試題庫附答案解析
- 2026山東事業(yè)單位統(tǒng)考省文物考古研究院招聘初級綜合類崗位2人備考考試題庫附答案解析
- 2026福建三明市永安市羅坊鄉(xiāng)人民政府招聘編外聘用駕駛員1人參考考試試題附答案解析
- 2026西藏昌都卡若區(qū)招聘社區(qū)工作者48人參考考試試題附答案解析
- 2026湖北武漢武昌區(qū)中南電力設(shè)計院有限公司數(shù)智科技公司招聘4人參考考試題庫附答案解析
- 2025年大學(xué)生物(細(xì)胞結(jié)構(gòu)與功能)試題及答案
- 2026年新通信安全員c證考試題及答案
- 2026屆上海市徐匯區(qū)上海第四中學(xué)高一上數(shù)學(xué)期末學(xué)業(yè)質(zhì)量監(jiān)測試題含解析
- T-ZZB 2211-2021 單面干手器標(biāo)準(zhǔn)規(guī)范
- 快遞安檢協(xié)議書
- 水利水電建設(shè)工程驗收技術(shù)鑒定導(dǎo)則
- 特困供養(yǎng)政策培訓(xùn)課件
- 2025年品質(zhì)經(jīng)理年度工作總結(jié)及2026年度工作計劃
- 土壤監(jiān)測員職業(yè)資格認(rèn)證考試題含答案
- 2025中國胸痛中心診療指南
- 骨科常見疾病及康復(fù)治療
評論
0/150
提交評論