版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第二章一元線性回歸分析思考與練習(xí)參考答案2.1 一元線性回歸有哪些基本假定?答:假設(shè)1、解釋變量x是確定性變量,丫是隨機(jī)變量;假設(shè)2、隨機(jī)誤差項(xiàng)具有零均值、同方差和不序列相關(guān)性: e=0i=l,2, .,nvar(ej)=i=l,2, .,ncov(eif )=0/#/ ij=:.,n假設(shè)3、隨機(jī)誤差項(xiàng)與解釋變量x之間不相關(guān): cov(xu j=o i=l,2, .,n假設(shè)4、e服從零均值、同方差、零協(xié)方差的正態(tài)分布 sn(o, ; i=lf2f .,n2.2考慮過原點(diǎn)的線性回歸模型yi=pxj-f-i 1=1,2, .,n誤差(i=l,2,)仍滿足基本假定求氏的最小二乘估計(jì)解:紅尸mhl =
2、 -2(-a x, )xt = 0哦 ,a =dv)得:2.3 證明(2.27式),ze/=o , le/x=o 證明:其中:奴 ey-y,二(氏+紅-】;)=0|v(30+4vt-l;)a0bp:ee, =0 f seo2.4回歸方程e ( y) =hxx的參數(shù)a ,爲(wèi)的最小二乘估計(jì)與最大似然估計(jì)在 什么條件下等價(jià)?出證明.答:甶于trn(o, a2)i=l,2,n所以 k=/3b+ /v/v(爲(wèi)+爲(wèi)a;, n2)最大似然函數(shù):l(,a,ft2)= ni/,(yl)=(2ft2)-/2exp|-i7j y, -(a + aa,x,)】2l 2t- /=|lnmflql9a2) = lna)-
3、x l. (a +)fz2t(t z-i使得ln(l)最大的a , a就是爲(wèi),爲(wèi)的最大似然估計(jì)值。同時(shí)發(fā)現(xiàn)使得ln(l)最大就是使得下式最小,e = (d)2 = t(y,(a+m,)2 1上式怡好就是最小二乘估計(jì)的目標(biāo)函數(shù)相同。值得注意的是:最大似然估計(jì)是在的假設(shè)下求得,最小二乘估計(jì)則不要求分布假設(shè)。所以在ern(of d2 )的條件下,參數(shù)a,爲(wèi)的最小二乘估計(jì)與最大似然 估計(jì)等價(jià),2.5證明九是爲(wèi)的無偏估計(jì)。證明:= e(y-x) =-)w i=li=l ln |_ y yn 1_ y y=elx(-無一 wi =(一 - x -)(a + p、x, +)| /=l n1=1 nxx=ia
4、 +-i =凡 + (上-)= p. 1 w/si w2.6證明l2.8驗(yàn)證三種檢驗(yàn)的關(guān)系,即驗(yàn)證:證明:(1)_ 夕斤 _ a _ rh _ 廣久 _ 4r _ v2r 扣1 /l,jsse/(n-2) ,sse/sst vt-r2(2)側(cè)=玄(戈-乃2+=玄(歹+戎u -a)-y)2=(,u-t)2 :於l.f= ssr/1 jujsse/(n-2)&22.9 驗(yàn)證(2.63 )ic: varfejfl-)a2證明:var(c,) = var( y,-y,) = var(x) + var( x)-2 cov( y, y,)=var( y,) + var(戎 + )-2 cov( y,,歹+
5、戎(x,-x)= (72 +(72- +卜w丄+ 1】n ln其中:=co v( j.y.) +(x,. - x)cov(j,,xfo.otc,oj/i(3)=3. 182,所以拒絕原假設(shè),說明x對(duì)y有顯著的 影響。(8) 做梠關(guān)系數(shù)r的顯著性檢驗(yàn)r = mr1 = v0.817 = 0.904r值=0. 904ro5 (3)=0. 878,所以接受原假設(shè),說明x和y有顯著的 線性關(guān)系。(9) 對(duì)回歸方程作殘差圖并作相應(yīng)的分析殘差圖(略i .從殘差圖上看出,殘差是圍繞e=0在一個(gè)固定的帶子里 隨機(jī)波動(dòng),基本滿足模型的假設(shè)e/vfa o2但由于樣本里太少,所 以誤差較大.(10 )求廣告費(fèi)用為4
6、.2萬元時(shí),銷售收入將達(dá)到多少?并給出置信度為95%的置信區(qū)間.解:當(dāng)xo=4. 2時(shí),fo=o +axft=-l + 7x4.2 = 2k4所以廣告費(fèi)用為4.2萬元時(shí),銷售收入將達(dá)到28.4萬元.由于置信度為1-a時(shí),丫(,估計(jì)值的置信區(qū)間為:所以求得yo的95%的s信區(qū)間為:6.05932 , 50. 74068預(yù)測誤難大.2.15 家保險(xiǎn)公司十分關(guān)心其總公司營業(yè)部加班的制度,決定認(rèn)真調(diào)查一下現(xiàn) 狀。經(jīng)過十周時(shí)間,收集了每周加班工作時(shí)間的數(shù)據(jù)和簽發(fā)的新保單數(shù)目,x為每周新簽發(fā)的保單數(shù)目,y為每周加班工作時(shí)間(小時(shí))。見表2.7。 表 2.7周序號(hào)12345678910x8252151070
7、55048092013503256701215y3.51.04.02.01.03.04.51.53.05.01、畫散點(diǎn)圖w.c(闡200400tioo800100012001400松m1答發(fā)的新保中數(shù)i i2、由散點(diǎn)圖可以看出,x與y之間大致呈線性關(guān)系。3、用最小二乘法求出回歸系數(shù)冋i系fi顯茗性拉輪及校型未k準(zhǔn)化系數(shù)杈準(zhǔn)化系fttptfl95%回歸系數(shù)的wb 1標(biāo)準(zhǔn)誤3下限上1(ccoslatl).118.355.333748-.701.937發(fā)的折保申數(shù)hm.000.9498509.000.003.005a depen(fertvarie:m)ttl班丄作時(shí) fj (小時(shí))由表可知:po=
8、0.118(i, =0.00359回歸方程為:y = 0.118-0.003594、求回歸標(biāo)準(zhǔn)誤差j方差分析表b模s平方和自由度均hfpm1剛j殘差總和16.6821.84318.52518916.682.23072.396ooo3a predctors: (constant),每 mj 簽發(fā)的新保中數(shù) 11 b dependent variable: mj 加班 i :作吋問(小時(shí))由方差分析表可以得到:sse=1. 843故回歸標(biāo)準(zhǔn)誤差a =, a =0.48. zi-25、給出回歸系數(shù)的置信度為95%的區(qū)間估計(jì)id歸系性柃驗(yàn)發(fā)投中未妞準(zhǔn)化系數(shù)如準(zhǔn)化系數(shù)1ptfl95%冋w系&的sfnfc
9、問b標(biāo)準(zhǔn)我下限上限1(constant).118.355333.748701.937每w簽發(fā)的新保單數(shù)h.004.000.919a5ce.000.003.c05a dependert vaiabe:每詢fill班j:作時(shí)間(小時(shí))由回婦系數(shù)顯著性檢驗(yàn)表可以看出,當(dāng)置信度為95%時(shí):的預(yù)測區(qū)間為-0. 701, 0. 937, 八的預(yù)測區(qū)間為0. 003, 0. 005. 人的置信區(qū)間包含0,表示九不拒絕為零的假設(shè).模眾r決定系數(shù)調(diào)整后的決定系數(shù)估u位的標(biāo) 準(zhǔn)誤若durbin-wats on1.94滬.900.888.4800753a predctors: (constant),埒悶簽發(fā)的新保中
10、數(shù)f!b. dependent variade: mj 加班 t 作時(shí)問(小吋)6. 決定系數(shù)由模型概要表得到?jīng)Q定系數(shù)為0.9接近于1,說明模型的擬合優(yōu)度高。方差分析i5. 32(當(dāng)n;=l,n?=8時(shí),查表得對(duì)應(yīng)的值為5. 32)p值so,所以拒絕原假設(shè),說明回歸方程顯著。8. 對(duì)犀的顯著性檢驗(yàn)從上面回歸系數(shù)顯著性檢驗(yàn)表可以得到p、的t統(tǒng)計(jì)量為t=8. 509, 所對(duì)應(yīng)的p值近似為0,通過i檢驗(yàn)。說明每周簽發(fā)的新保單數(shù)目x對(duì)每周加班工作時(shí)間y有顯著的影響.9. 做相關(guān)系數(shù)顯著性檢驗(yàn)iu x分析k姆w簽發(fā)的新保中數(shù)11毎周加班工作時(shí)m(小時(shí)祕(mì)冏簽發(fā)的新保巾數(shù)h pea-son correlat
11、ion1.供 9*sig. (2-tailed).000n1010甸問加班1.作時(shí)問(小pearson correlation腳.1時(shí))sig.(2-taled).000n1010correlation is significant al the0.01 lesl (2-taled|.相關(guān)系數(shù)達(dá)到0.949,說明x與y顯著線性相關(guān)。10、對(duì)回歸方程作殘差圖并作相應(yīng)分析從殘差圖上看出,殘差是圍繞c=0隨即波動(dòng),滿足模型的基本 假設(shè)。11、該公司預(yù)計(jì)下一周簽發(fā)新保單xo=ioo 0張,需要的 加班時(shí)間是多少?當(dāng)x-1000張時(shí),y =0.00359 1 ()00= 3.703212、給出y。的置信
12、水平為95%的預(yù)測區(qū)間通過spss運(yùn)算得到y(tǒng)。的置信水平為95%的預(yù)測區(qū)間為:( 2. 5195, 4.8870 )。13給出e (ytl)的置信水平為95%的預(yù)測區(qū)間通過spss運(yùn)算得到y(tǒng)。的置信水平為95?(的預(yù)測區(qū)間為:(3.284 ,4.123 )2.16表是1985年美50個(gè)州和哥倫比亞特區(qū)公立學(xué)校中教師的人均年工資y(美元)和學(xué)生的人均經(jīng)費(fèi)投入x(美元).序號(hào)yx序號(hào)yx序號(hào)yx1195833346182081630593519538264222026331141918095296736204603124320325355420209393285372141927524268004
13、542212264439143825160342952947046692224624451739224823947626610488823271864349402096925097306785710243399050204127224544082717055362523382359442258924042925853416826206272821432264434021024500354727227953366442464028291124274315928215702920452234122971227170362129220802980462561029321330168378230222
14、50373147260153705142652542473120910285348257884123152736039823221800253349291323608162169035683322931272950414808349172197431553418443230551258453766解答:(1 )繪制y對(duì)x的散點(diǎn)圖可以用直線回歸描述兩者之間的關(guān)系嗎?由上圖可以看出y與x的散點(diǎn)分布大致呈直線趨勢.(2)建立y對(duì)x的線性回歸。利用spss進(jìn)行y和x的線性回歸,輸出結(jié)果如下:表1模型概要rr2調(diào)整后的r2隨機(jī)誤差項(xiàng)的標(biāo)準(zhǔn)差估計(jì)值0.83506970.6912323.25589表2方g分
15、析表醒平方和自由度和平均f值pte1回歸平方和6.089e816.089e8112.811000a殘差2.645e8495397517.938平方和總8.734e850平方和表3系數(shù)表鯉非碰化系數(shù)標(biāo)準(zhǔn)化系數(shù)t值p值b標(biāo)準(zhǔn)差回歸系數(shù)1常數(shù)對(duì)學(xué)生的人均經(jīng)費(fèi)投入12112 6293 3141197.768.312.83510.11310.6210000001)由表1可知,x與y決定系數(shù)為r3 = 0.697 ,說明模型的擬合效果一般。 x與y線性相關(guān)系數(shù)r=0. 835,說明x與y有較顯著的線性關(guān)系。2)由表2(方差分析表中)看到,卜112.811 ,顯著性sig.p0.(xx),說明 回歸方程顯著
16、。3)由表3可見對(duì)為的顯著性t檢驗(yàn)p值近似為零,故為顯著不為0 說明 x對(duì)y有顯著的線性影響。4)綜上,模型通過檢驗(yàn),可以用于預(yù)測和控制x與y的線性回歸方程為j = 12112629+3.314* x(3 )繪制標(biāo)準(zhǔn)殘差的直方圖和正態(tài)概率圖理論正圖1標(biāo)準(zhǔn)殘差的直方圖圖2標(biāo)準(zhǔn)殘差的正態(tài)概率p-p國e測值概率由圖1可見標(biāo)準(zhǔn)化后殘差近從正態(tài)分布由圖2可見正態(tài)概率圖中的 各個(gè)散點(diǎn)都分布在45線附近,所以沒有證據(jù)證明誤差項(xiàng)服從同方差的正態(tài)分 布的假定是不真實(shí)的,即殘差通過正態(tài)性檢驗(yàn),滿足模型基本假設(shè)。第3章多元線性回歸思考與練習(xí)參考答案3. 2討論樣本容量n與自變量個(gè)數(shù)p的關(guān)系,它們對(duì)模型的參數(shù)估計(jì)有何
17、影響?答:在多元線性回歸模型中,樣本容量n與自變量個(gè)數(shù)p的關(guān)系是: npo如果n=p對(duì)模型的參數(shù)估計(jì)會(huì)帶來很嚴(yán)重的影響。因?yàn)椋?. 在多元線性回歸模型中,有p+1個(gè)待估參數(shù)p,所以樣本容量的 個(gè)數(shù)應(yīng)該大于解釋變量的個(gè)數(shù),否則參數(shù)無法估計(jì)。,表明設(shè)計(jì)矩陣2. 解釋變量x是確定性變量,要求rank(x) = p + nx中的自變量列之間不相關(guān),即矩陣x是一個(gè)滿秩矩陣。若 (x)(-v,中心化后,則有y,-y = paxx,左右同時(shí)除以拉(yr對(duì),令無j2, = i,2,.,w z j = l二,pil樣本數(shù)據(jù)標(biāo)準(zhǔn)化的公式為則上式可以記為則有 3-10驗(yàn)釀定耐與f值之間的關(guān)系式:二一帥ssr/p證明
18、: f . ss_ - p -1) :ssr=lpn-p-fssen2 ssr ssr.r=sst ssr + sse nx pn-p-1 一f x p一 ffsse fxp + w-p-1 f + o-p-l)/pp1 3. 11研究貨運(yùn)總番y (萬噸)與工業(yè)總產(chǎn)值x 1 (億元)、農(nóng)亞總產(chǎn) 值x2 (億元),居民非商品支出x3 (億元)的關(guān)系。數(shù)據(jù)見表3. 9 (略),(1 )計(jì)算出y , xl , x2,x3的相關(guān)系數(shù)矩陣, spss輸出如下:yx1x2x3ypearson correlation1.566.731*.724*sig.(2-taled).095.016.018n10101
19、010xlpearson ca relation.5561.113.398sig.(2-taled).095.756254n101010102pearson correlation.731*.1131.547sig.(2-taldd).016.756.101n10101010x3pearson correlation.724*.398.5471sig.(2-taled).018254.101n10101010correlation is significant at the0.05level (2-tailad).coefficientmodelunstandard zed coefficie
20、ntsstancfardzaicoeffiaentstsifl.bistd. errorbeta1(constant)348.28017&4591.974.096xl3.7541.933.3851.942.100x27.1012880.5352465.049)612.44710.5s92771.178284a dependent variable: y對(duì)數(shù)據(jù)利用spss做線性回歸,得到回歸方程為 y =-34838 + 3.754x)+7.10lx2+ 12.447x5則相關(guān)系數(shù)矩陣為:(2)l .0000.5560.7310.7240.5561.0000.1130.3980.7310.113
21、1.0000.5470.7240.3980.5471.000求出y與xl , x2 , x3的三元?dú)w方程。(3 )對(duì)所求的方程作擬合優(yōu)度檢驗(yàn)。model summarymodelrr squareadjustedr squarestd error of jie estimate1.89護(hù)i .806 |.70823.44188a predctors: (constant), )6, x1fx2由上表可知調(diào)整后的決定系數(shù)為0. 708 ,說明回歸方程對(duì)樣本觀測值的擬合程度較好。(4 )對(duì)回歸方程作顯著性襝驗(yàn);h若分析model平方和|由度均方fsiq.1hl ij 1總和13655.370329
22、7.13016952.5003694551.790549.522a283.01 sa predctors: (constant),x3, xl,x2 b dependent variable: y原假設(shè):。:f統(tǒng)計(jì)量服從自由度為(3,6)的f分布,給定顯著性水平a=0. 05,衷得(3 6 = 4 76,由方查分析表得,h直退2834. 76,p值=0.015 ,拒絕原假設(shè)。,由方差分析表可以得到f =8.283. p = 0.015 27.1012880.5352465.049x312.44710.5692771.178.284a dependent variables做t檢驗(yàn):設(shè)原假設(shè)為a
23、=o,統(tǒng)計(jì)量從自由度為n-p-1 = 6的t分布,給定顯著性水平().05 ,查得單側(cè)檢驗(yàn)臨界值為1. 943,1的懂=1.9421. 943。拒絕原假設(shè)。由上表可得,在顯著性水平= 0 時(shí),只有&的w直0. 05,通過檢驗(yàn),即只有的回歸系數(shù)較為顯著;其余自變量的h直均大于0. 05,即xl , x2的系數(shù)均不顯著。(6 )如果有的回歸系數(shù)沒有通過顯著性檢驗(yàn),將其剔除,重新建立 回歸方程,并作回歸方程的顯著性檢驗(yàn)和回歸系數(shù)的顯著性檢驗(yàn)。解:用后退法對(duì)數(shù)據(jù)重新做回歸分析,結(jié)果如下:coefficients1modelunstarriardzedcoefficientsstandarclzedco
24、effidentstsiq.b istd. errorbeta1(constant)-348.28017&459-1.974.096xl3.7541.933.3851.942.100x27.1012880.5352465.049x312.44710.5662771.178.2842(constant)459.624151058-3.003.ceoxl4.6761.816.4792575.037x28.9712468.6763.634.008a deperdent variable: y選擇模型二,重新建立的回歸方程為:y = -459.624 + 4.676* + 8.97 lx2方差分析t方
25、和ih rti 度 i均方ifsi 1ii yi殘獪total12893.1994059.30116962.5002796446.600579.90011.117.007a predictors:(constant),農(nóng) 4k 總產(chǎn) 1ax2 ( f乙元.丄業(yè)總產(chǎn)但x1 (億元)b. dependent variable:貨記總櫨 y (萬噸)模rr square調(diào)整后的rsjuarestd. errcr cithe estimate改變統(tǒng)計(jì)飫r squarechanaef chanae(f102siq.f chenae1.87?.761.69224.061.76127.007a predck
26、rs: (constart). ik 總產(chǎn)值 x2對(duì)新的回歸方程做顯著性檢驗(yàn):臟設(shè):。:a=a=()f服從自由度為(2,7 )的f分布,給定顯著性水平 =0. 05,查表得 (2-7) = 4.74由方差分析表得,f 值=11. 1174. 74 z p 值:0. 007 , 拒絕原假設(shè).認(rèn)為在顯著性水平a=0. 05下,xl,x2整體上對(duì)y有顯著的線性影響,即回歸方程是顯著的。對(duì)每一個(gè)回歸系數(shù)做顯著性檢驗(yàn):做t檢驗(yàn):設(shè)原假設(shè)為 4 =,h統(tǒng)計(jì)量服從自由度為n-p-1 = 7的t分布,給定顯著性水平0. 05 ,查得單側(cè)檢驗(yàn)臨界值為1.895,xi的t=2. 5751. 895 ,拒絕原假設(shè)。
27、故顯著不為零,自變量xi對(duì)因變量v的線性效果顯著;同理即也通過檢驗(yàn)。同時(shí)從回歸系數(shù)顯著性檢驗(yàn)表可知:xi,x2的p值者p小于0. 05,可認(rèn)為對(duì)xl,x2分別對(duì)y都有顯著的影響。(7 )求出每一個(gè)回歸系數(shù)的置信水平為955d置信區(qū)間甶回歸系數(shù)表可以看到,pl置信水平為95%的置信區(qū)間 0.381,8.970,p2置信水平為95%的置信區(qū)間3. 134, 14. 808jcoefficientmoddunslandardzedcoefficientsstandardzedcoefficients1siq.bstd errabdalovver bcundup bourd1(caistant垂348
28、 2801764591.974.096-780.06083.5coxl37541.933.3851.942.100-.9778485x27.1012880.535z465.049.05314.149x312.44710.569.2771.178284-1341538.3102(constant)-459 624151058-1003.020821 547-97.700xl4.6761.816.4792575.037381a970x28.9712468.6761634.0083j3414.8c6a depenctent variable: y(8 )求標(biāo)準(zhǔn)化回歸方程由回歸系數(shù)表(上表)可得,標(biāo)準(zhǔn)
29、化后的回歸方程為:y*=0.479x;+0.676x2*(9)求當(dāng) xoi=75,x2=42 , xo3=3 1 時(shí)的y的預(yù)測值氕,給定置信水平95% ,用spss軟件計(jì)算精確置信區(qū)間,用手工計(jì)算近似預(yù)測區(qū)間;編號(hào)i貨運(yùn)總量農(nóng)產(chǎn)|居民非商| 品支出1pre_1i1160 0070 0035 001 00181 654122260 0075 0040 00240249 887083210.0065 0040 00200203.130774265.0074.0042.003.00 263.153375_ 240 0072 0038 001 20217 918266220.0068.0045 001
30、 50262.012477275 0078 0042 004 00281 855898160 0066 0036 00200171 922569275.0070.0044 003 20262 3927710250 0066 001 1 j42003 00221 0727075.0042003 10267 82900(由spss輸出結(jié)果可知,當(dāng)=75. =42, =3.1時(shí),丸=267.829 (見 上表),。的置信度為卯%的精確預(yù)測區(qū)間為(204. 4, 331. 2 )(見f表),&的置信度為95%的近似預(yù)測區(qū)間3(v02a),手工計(jì)算得: (219. 6,316.0 )。lici_1iui
31、ciji114 18036249 12788186.71910313.0550513927006266 99149200.92084325 385915559279 88094195 34073328 684222134631435024865105 13801238 7071?199 02041325 7651415611131286 03408204 43551331 22249(10 )結(jié)合回歸方程對(duì)問題做一些簡單分析,答:由回歸方程y = -459.624 + 4.676a- + 8.97 lx2可知農(nóng)業(yè)總產(chǎn)值固定的時(shí)候,工業(yè)總產(chǎn)值每増加1億元,貨運(yùn)總量増加1. 676萬噸;工業(yè)總產(chǎn)值
32、固定的時(shí)候,農(nóng)業(yè)總產(chǎn)值每増加1億 元,貨運(yùn)總量増加8. 971萬噸。而居民非商品支出對(duì)貨運(yùn)總量沒有 顯著的瞧影響。由標(biāo)準(zhǔn)化回歸方程f =(479 +()676可知:工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值與y都是正相關(guān)關(guān)系,比較回歸系數(shù)的大小可知農(nóng)業(yè)總產(chǎn)值x2對(duì)貨運(yùn)總量的影響程度大一些。第4章違背基本假設(shè)的情況思考與練習(xí)參考答案4.1試舉例說明產(chǎn)生異方差的原因。答:例4.1 :截面資料下研究居民家庭的儲(chǔ)蓄行為其中:&表示第/個(gè)家庭的儲(chǔ)!額,表示第/*個(gè)家庭的可支配收入。甶于高收入家庭儲(chǔ)蓄額的差異較大,低收入家庭的儲(chǔ)蓄額則更有規(guī)律性,差異 較小,所以/的方差呈現(xiàn)單調(diào)遞增型變化.例4 2:以某一行業(yè)的企業(yè)為樣本建立
33、企業(yè)生產(chǎn)函數(shù)模型y尸ap k!i2 lpe c 被解釋變量:產(chǎn)出單k,解釋變量:資本/c勞動(dòng)l、技術(shù),那么每個(gè)企業(yè)所 處的外部環(huán)境對(duì)產(chǎn)出量的影響被包含在隨機(jī)誤差項(xiàng)中。由于每個(gè)企業(yè)所處的外 部環(huán)境對(duì)產(chǎn)出量的影響程度不同,造成了隨機(jī)誤差項(xiàng)的異方差性。這時(shí),隨機(jī) 誤差項(xiàng)r的方差并不隨某一個(gè)解釋變堡觀測值的變化而呈規(guī)律性變化,呈現(xiàn)復(fù)雜 型。4.2異方差帶來的后果有哪些?答:回歸模型一旦出現(xiàn)異方差性,如果仍采用ols估計(jì)模型參數(shù),會(huì)產(chǎn)生下列 不良后果:1、參數(shù)估計(jì)量非有效2、變量的顯著性檢驗(yàn)失去意義3、回歸方程的應(yīng)用效果極不理想總的來說,當(dāng)模型出現(xiàn)異方差性時(shí),參數(shù)ols估計(jì)值的變異程度增大,從而造成對(duì)y
34、的預(yù)測誤差變大,降低預(yù)測精度,預(yù)測功能失效。4.3簡述用加權(quán)最小二乘法消除一元線性回歸中異方差性的思想與 方法 答:普通最小二乘估計(jì)就是尋找參數(shù)的估計(jì)值使離差平方和達(dá)極小。其中每個(gè) 平方項(xiàng)的權(quán)數(shù)相同,是普通最小二乘回歸參數(shù)估計(jì)方法。在誤差項(xiàng)等方差不相 關(guān)的條抖下,普通最小二乘估計(jì)是回歸參數(shù)的最小方差線性無偏估計(jì)。然而在 異方差的條件下,平方和中的每一項(xiàng)的地位是不相同的,誤差項(xiàng)的方差大的項(xiàng), 在殘差平方和中的取值就偏大,作用就大.因而普通最小二乘估計(jì)的回歸線就 被拉向方差大的項(xiàng),方差大的項(xiàng)的擬合程度就好,而方差小的項(xiàng)的擬合程度就 差。由ols求出的仍然是的無偏估計(jì),但不再是最小方差線性無偏估計(jì)。
35、所以 就是:對(duì)較大的殘差平方賦予較小的權(quán)數(shù),對(duì)較小的殘差平方賦予較大的權(quán)數(shù)。 這樣對(duì)殘差所提供信息的重要程度作一番校正,以提高參數(shù)估計(jì)的精度。加權(quán)最小二乘法的方法:nna乂 (久-免)2=e (乂 - a - a 心)2 r=1 ni=la. =x(n)2 :ia 戶1a,2=lx,21 表示 1w = =或x, =去4.4簡述用加權(quán)最小二乘法消餘多元線性回歸中異方差性的思想與方 法。?:運(yùn)用加權(quán)似小二乘法消除多元線性11歸屮異方及性的7g線性h們的類似。多元線性回歸加權(quán)最小二乘法是在平方和屮加入一個(gè)適a的權(quán)數(shù)vv.,以調(diào)糧各項(xiàng)在平方和中的作用,加權(quán)最小二乘的離差平方和為:ppxip、22)
36、m加權(quán)烺小二乘佔(zhàn)計(jì)就足尋找參數(shù),的佔(zhàn)計(jì)值h,,九使式(2 的離差f方和么達(dá)極小。所得加權(quán)訟小二乘經(jīng)驗(yàn)ton方程圮做九=式。+九文,+.+a”x/,(3)多元冋!tl模型加權(quán)誠小二乘法的方法:先找到權(quán)數(shù)w,,理論1:誠優(yōu)的權(quán)數(shù)w,為誤差項(xiàng)/差rr,2的倒數(shù),即 wt =(4)誤差項(xiàng)方差大的項(xiàng)接受小的權(quán)數(shù),以降低其在穴2)平方和屮的作用:誤 差項(xiàng)方差小的項(xiàng)接受大的權(quán)數(shù),以提卨其在平方和屮的作用。由(2)式求出的 加權(quán)最小二乘佔(zhàn)計(jì)h.禮就是參數(shù)h.,pp的最小方差線性無偏佔(zhàn) 計(jì)。個(gè)滿耍解決的問題是w差項(xiàng)的方若a,2是未知的,w此無法諢le按照代(4) 選取權(quán)數(shù)。/i:女際叫題屮誤差項(xiàng)城 通常勾fl變
37、m的水平冇關(guān)(如誤差項(xiàng)方 變ffi的增人w增人),可以利用這種關(guān)系確定權(quán)數(shù)。例如rr,2與第j個(gè) f!變m:収tf的平/成比例時(shí),吋,這時(shí)収權(quán)數(shù)為更一般的愔況足誤茇項(xiàng)某個(gè)自變ex,(與led的等級(jí)相x系數(shù) 大的白變s:)取值的函數(shù) 成比例,其中m是待定的未知參數(shù)。 此時(shí)權(quán)數(shù)為=-5-(6)這時(shí)確定權(quán)數(shù)的問題轉(zhuǎn)化為確定冪參數(shù)z77的問題.可以借助spss軟件解決.4.5 ( 4.5 )式一元加權(quán)最小二乘回歸系數(shù)估計(jì)公式。,奴一免)2 = z % (乂一 a-百xi )2 i=i證明:r=lcqcq =得:4.6驗(yàn)證(4.8 )式多元加權(quán)最小二乘回歸系數(shù)估計(jì)公式。證明:對(duì)于多元線性回歸模型y =
38、xp+c. (1)彐e(e)= 0,cov(e,er) = o-2w ,即存在異方差.設(shè)vv = dd,. 01)= : .:、 用d :左乘(1)式兩邊,得到一個(gè)新的的模型: d *y = d,xp + d e ,即 y. = x.p + 因?yàn)?(ee ) = (d iedi,) = d_w)dd = d vwd = rl , 故新的模型具有同方差性,故可以用廣義最小二乘法估計(jì)該模型,得 pw =(x x ) x y. =(xd id x) x d rd y = (x飛vx) xwy原式得證.4.7有同學(xué)認(rèn)為當(dāng)數(shù)據(jù)存在異方差時(shí),加權(quán)最小二乘回歸方程與普通最小二乘回歸方程之間必然有很大的差異,
39、異方差越嚴(yán)重,兩者 之間的差異就越大。你是否同意這位同學(xué)的觀點(diǎn)?說明原因。答:不同意。當(dāng)回歸模型存在異方差時(shí),加權(quán)最小二乘估計(jì)(wls )只是普通最小二乘估計(jì)(ols )的改逬,這種改逬可能是細(xì)微的,不能理解為wls定 會(huì)得到與0ls截然不同的方程來,或者大幅度的改逬.實(shí)際上可以構(gòu)造這樣的 數(shù)據(jù),回歸模型存在很強(qiáng)的異方差,但wls與ols的結(jié)果一樣。加權(quán)最小二 乘法不會(huì)消除異方差,只是消除異方差的不良影響,從而對(duì)模型進(jìn)行一點(diǎn)改進(jìn)。4.8對(duì)例4.3的據(jù),用公式=#,.計(jì)算出加權(quán)變換殘差e,、制加權(quán)變換殘差,根據(jù)繪制出的圖形說明加權(quán)最小二乘估計(jì)的效果。解:用公式么計(jì)算出加權(quán)變換殘差么,分別繪制加權(quán)
40、最小二乘估計(jì)后 的殘差圖和加權(quán)變換殘差圖(見下圖)0 40-0 20-加權(quán)變換ai殘尤0 00-20-40-10qoq2000030qot根據(jù)繪制出的兩個(gè)圖形可以發(fā)現(xiàn)加權(quán)最小二乘估計(jì)沒有消除異方差,只是對(duì)原ols的殘差有所改善,而經(jīng)過加權(quán)變換后的殘差不存在異方差。4.9參見參考文獻(xiàn)2,表4.12 ( p138)是用電高峰每小時(shí)用電s y 與每月總用電量x的數(shù)據(jù)。(1) 用普通最小二乘法建立y與x的回歸方程,并畫出殘差散點(diǎn)圖。解:spss輸出結(jié)果如下:coefficientmodelunstaretard zedcoefficientsslancbrdzedcoefficientstsiq.b
41、istd errorbeta1(constano831.442-1 882.065x.004.000.83911.030.000a dependent variable: y甶上表可得回歸方程為:y = -0.831 + 0.004x殘差圖為:2imhi30001000(2) 診斷該問題是否存在異方差;解:a由殘差散點(diǎn)圖可以明顯看出存在異方差.誤差的方差隨著.r的增加而增大,b用spss做等級(jí)相關(guān)系數(shù)的檢驗(yàn),結(jié)果如下表所示:correlationsxabsdspearman1 srhoxcorr el alien coefficial1 000.31sig.(2-taled)021n5353absei corr elab on coefficiait.318-1.000sig.(2-taled)021參n5353.correlation is significant a the0.05 leel (2-tailed).得到等級(jí)相關(guān)系數(shù)c =0-318 , p值=0.021 ,認(rèn)為殘差絕對(duì)值p,|與自變量x, 顯著相關(guān)存在異方差。(3) 如果存在異方差,用冪指數(shù)型的權(quán)函數(shù)建立加權(quán)最小二乘回歸方程:解:sps
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年永登縣招教考試備考題庫含答案解析(奪冠)
- 2025年平?jīng)雎殬I(yè)技術(shù)學(xué)院馬克思主義基本原理概論期末考試模擬題含答案解析(奪冠)
- 新員工酒水知識(shí)培訓(xùn)
- 2025內(nèi)蒙古土地資源收儲(chǔ)投資(集團(tuán))有限公司常態(tài)化招聘急需緊缺專業(yè)人員16人(第十三批)筆試參考題庫附帶答案詳解
- 2025云南紅河天源酒店管理有限公司招聘筆試歷年??键c(diǎn)試題專練附帶答案詳解
- 2025云南玉溪紅塔實(shí)業(yè)有限責(zé)任公司員工招聘29人(第二批)筆試參考題庫附帶答案詳解
- 2025云南昆明潤峰城市運(yùn)營管理有限公司招聘綜合運(yùn)營管理人員綜合筆試歷年典型考點(diǎn)題庫附帶答案詳解2套試卷
- 2025云南基投公司社會(huì)招聘12人筆試參考題庫附帶答案詳解
- 2025中鋁鄭州有色金屬研究院有限公司應(yīng)屆高校畢業(yè)生招聘23人筆試歷年典型考點(diǎn)題庫附帶答案詳解2套試卷
- 2025中鐵一局集團(tuán)新運(yùn)工程有限公司招聘筆試歷年??键c(diǎn)試題專練附帶答案詳解2套試卷
- 書店智慧空間建設(shè)方案
- 2026年中考英語復(fù)習(xí)專題課件:謂語動(dòng)詞的時(shí)態(tài)和被動(dòng)語態(tài)
- 糧食行業(yè)競爭對(duì)手分析報(bào)告
- 2025年危險(xiǎn)品運(yùn)輸企業(yè)重大事故隱患自查自糾清單表
- 2025至2030汽車傳感器清洗系統(tǒng)行業(yè)調(diào)研及市場前景預(yù)測評(píng)估報(bào)告
- 兒科MDT臨床技能情景模擬培訓(xùn)體系
- 無菌技術(shù)及手衛(wèi)生
- GB/Z 104-2025金融服務(wù)中基于互聯(lián)網(wǎng)服務(wù)的應(yīng)用程序編程接口技術(shù)規(guī)范
- (人教版)必修第一冊(cè)高一物理上學(xué)期期末復(fù)習(xí)訓(xùn)練 專題02 連接體、傳送帶、板塊問題(原卷版)
- 門窗工程掛靠協(xié)議書
- 供應(yīng)鏈韌性概念及其提升策略研究
評(píng)論
0/150
提交評(píng)論