多元回歸模型_第1頁
多元回歸模型_第2頁
多元回歸模型_第3頁
多元回歸模型_第4頁
多元回歸模型_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

多元回歸模型第1頁,共78頁,2023年,2月20日,星期四第3章多元回歸7、如何預測被解釋變量的期望值?8、如何預測被解釋變量的值?第2頁,共78頁,2023年,2月20日,星期四3.1三變量線性回歸模型b1刻劃了解釋變量X對Y的影響其他影響Y的因素被放入μ當中一元回歸分析的弱點

Y=b0+b1X+μ第3頁,共78頁,2023年,2月20日,星期四一元回歸分析的弱點要用OLS法得到b1的無偏估計量,必要條件是:μ與X不相關,或者說,E(μ|Xi)=0(零條件均值假定)

Y=b0+b1X+μ第4頁,共78頁,2023年,2月20日,星期四案例分析:工資與教育被解釋變量:工資(1976年每小時美元數(shù))解釋變量:教育(年數(shù))計量模型:

wage

=0

+1educ+1的含義?1>0第5頁,共78頁,2023年,2月20日,星期四E(μ|Xi)=0不成立的情況案例:影響工資的其他因素例如,工作經(jīng)驗exper初中學歷人群的平均工作經(jīng)驗:E(exper|9)大學學歷人群的平均工作經(jīng)驗:E(exper|16)第6頁,共78頁,2023年,2月20日,星期四如何處理工作經(jīng)驗的影響wage

=

0

+1

educ

+即使我們關心的是教育對工資的影響,如果把exper放在中,就不能得到1的無偏估計量解決的方法:多元回歸分析第7頁,共78頁,2023年,2月20日,星期四多元回歸分析請解釋b1在上述二元回歸模型中的含義給定保持x2不變……Y=b0+b1x1+b2x2+μ第8頁,共78頁,2023年,2月20日,星期四二元回歸模型1、確定性部分:b0+b1x1+b2x2

E(Y|X1,X2)2、隨機性部分:μVar(Y)Y=b0+b1x1+b2x2+μ第9頁,共78頁,2023年,2月20日,星期四被解釋變量的期望值b1表示給定x2保持不變,x1變化一個單位,引起的Y的均值的改變量多元回歸分析可以使我們明確控制其他影響因素E(Y|X1,X2)=b0+b1x1+b2x2第10頁,共78頁,2023年,2月20日,星期四案例:教育對工資的影響wage

=0

+1educ+2

exper+請解釋b1的含義采用一元回歸模型和二元回歸模型估計出的b1相等嗎?wage

=0

+1educ+wage

=0

+1educ+2

exper+運行eviews驗證第11頁,共78頁,2023年,2月20日,星期四多元回歸分析的優(yōu)勢1、更準確地估計斜率:無偏估計量2、更好地說明被解釋變量的變化:引入了更多的解釋變量第12頁,共78頁,2023年,2月20日,星期四多元回歸模型1、K個解釋變量2、k+1個待估參數(shù)3、b0稱為截距,b1

到bk稱為斜率Y=b0+b1x1+b2x2+...bkxk+μ第13頁,共78頁,2023年,2月20日,星期四3.2多元線性回歸模型的第6個假設一元線性回歸模型關于隨機誤差項的五個假設新增的關于多個解釋變量之間關系的假設第14頁,共78頁,2023年,2月20日,星期四

假設1、隨機誤差項與各解釋變量X之間不相關(更強的假設是各個解釋變量X都是確定性變量,不是隨機變量,這樣假設1自動滿足)Y=b0+b1x1+b2x2+...bkxk+μ第15頁,共78頁,2023年,2月20日,星期四假設2、隨機誤差項具有零均值

E(i)=0i=1,2,…,n

Y=b0+b1x1+b2x2+...bkxk+μ第16頁,共78頁,2023年,2月20日,星期四假設3、隨機誤差項同方差

Var(i)=2i=1,2,…,n

Y=b0+b1x1+b2x2+...bkxk+μ第17頁,共78頁,2023年,2月20日,星期四假設4、隨機誤差項無序列相關

Cov(i,j)=0i≠ji,j=1,2,…,n

Y=b0+b1x1+b2x2+...bkxk+μ第18頁,共78頁,2023年,2月20日,星期四假設5、服從正態(tài)分布i~N(0,2)i=1,2,…,nY=b0+b1x1+b2x2+...bkxk+μ第19頁,共78頁,2023年,2月20日,星期四假設6、Xi之間無完全的線性相關關系(完全共線性)即任何一個Xi都不能被表示成其他解釋變量的線性函數(shù)例如,X1=aX2

+bX3

+

cX4

Y=b0+b1x1+b2x2

+...bkxk+μ第20頁,共78頁,2023年,2月20日,星期四3.3多元回歸參數(shù)的估計雙變量模型OLS法:殘差平方和最小第21頁,共78頁,2023年,2月20日,星期四對于隨機抽取的n組觀測值可以得到Y的擬合值:i=1,2…n根據(jù)最小二乘原理,參數(shù)估計值應該是下列方程組的解

其中OLS估計法的基本原理第22頁,共78頁,2023年,2月20日,星期四案例分析:大學平均成績被解釋變量:大學平均成績colGPA解釋變量:(1)高中平均成績hsGPA;(2)大學能力測驗分數(shù)ACT計量模型:colGPA=0+1hsGPA+2ACT

+1的含義?第23頁,共78頁,2023年,2月20日,星期四Eviews運用Eviews,得到如下估計結果:colGPA=1.29+0.45hsGPA+0.0094ACT請解釋:1、1.292、0.453、0.0094第24頁,共78頁,2023年,2月20日,星期四錯誤的簡單回歸分析被解釋變量:大學平均成績colGPA解釋變量:大學能力測驗分數(shù)ACTcolGPA=2.40+0.027ACT請比較:多元回歸分析:0.0094一元回歸分析:0.027第25頁,共78頁,2023年,2月20日,星期四OLS估計量的性質(zhì)1、無偏性含義?E(i

)=i

2、有效性含義?第26頁,共78頁,2023年,2月20日,星期四斜率估計量的方差.其中,∑xj2為第j個解釋變量的離差平方和Rj2為第j個解釋變量對其余解釋變量進行回歸得到的擬合優(yōu)度:反映了第j個解釋變量和其他變量的線性相關關系Var(j

)=σ2(1-Rj2)∑2xj第27頁,共78頁,2023年,2月20日,星期四影響斜率估計量方差的因素1、總體的方差Var(Y)

σ22、解釋變量的變化程度∑xj23、和其他解釋變量的線性相關程度Rj2第28頁,共78頁,2023年,2月20日,星期四Var(i

)其中,Rj2為第j個解釋變量對其余解釋變量進行回歸得到的擬合優(yōu)度:反映了第j個解釋變量和其他變量的線性相關關系Var(j

)=σ2(1-Rj2)∑2xj第29頁,共78頁,2023年,2月20日,星期四多重共線性1、完全共線性Rj2=1如果存在完全共線性,則不能應用OLS估計法2、多重共線性Rj2接近于1后果:估計量的方差較大,導致估計結果不準確第30頁,共78頁,2023年,2月20日,星期四3.4多元判定系數(shù)則總離差平方和的分解第31頁,共78頁,2023年,2月20日,星期四

判定系數(shù)該統(tǒng)計量越接近于1,模型的擬合優(yōu)度越高。

評分標準:截面數(shù)據(jù):>50%時間序列數(shù)據(jù):>90%

第32頁,共78頁,2023年,2月20日,星期四

回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個顯著性的影響因素。

計量經(jīng)計學中,主要是針對變量的參數(shù)真值是否為零來進行顯著性檢驗的。稻草人假設:斜率參數(shù)為零

3.5多元回歸的假設檢驗第33頁,共78頁,2023年,2月20日,星期四解釋變量的顯著性如果1等于零,則X1對Y沒有影響1的估計值不等于零但是1真的不等于零嗎?Y=b0+b1x1+b2x2+μ第34頁,共78頁,2023年,2月20日,星期四假設檢驗采用的邏輯推理方法是反證法。先假定原假設正確,然后根據(jù)樣本信息,觀察由此假設而導致的結果是否合理,從而判斷是否接受原假設。判斷結果合理與否,是基于“小概率事件不易發(fā)生”這一原理的。如果結果是個小概率事件,那我們認為這是不可能發(fā)生的。會發(fā)生不可能發(fā)生的事情,一定是假設前提錯了。上述“小概率事件”的概率被稱為檢驗的“顯著性水平”,或者“犯第一類錯誤的概率”(拒絕了正確的虛擬假設)第35頁,共78頁,2023年,2月20日,星期四σ2(1-R12)∑2x1)tk-1)3.6對偏回歸系數(shù)進行假設檢驗第36頁,共78頁,2023年,2月20日,星期四斜率1的顯著性檢驗在上述t統(tǒng)計量中假設1等于零,得到

t

=

=

第37頁,共78頁,2023年,2月20日,星期四統(tǒng)計量t的解釋t是一個隨機變量,對應于不同的樣本,t取不同的值給定一個具體樣本,t是斜率的估計值和斜率的樣本標準差的比率。被稱為t比率

t

=

第38頁,共78頁,2023年,2月20日,星期四案例分析:工資被解釋變量:工資(1976年每小時美元數(shù))解釋變量:教育(年數(shù))工作經(jīng)驗(年數(shù))現(xiàn)職任期(年數(shù))計量模型:wage=b0+b1educ+b2exper+b3tenure+μ請解釋稻草人假設:b2=0的含義第39頁,共78頁,2023年,2月20日,星期四

ca(1-a)t分布臨界值c|t|>c的概率?在實踐中,一般取α=5%,確定一個小概率事件t~t(n-2)給定樣本容量n和顯著性水平α,就可以計算c0a/2(1-a)-ca/2第40頁,共78頁,2023年,2月20日,星期四H0:b1=0H1:b1

0c0a/2(1-a)-ca/2雙側檢驗拒絕域拒絕域Y=b0+b1x1+b2x2+...bkxk+μ第41頁,共78頁,2023年,2月20日,星期四雙側檢驗的步驟

(1)對總體參數(shù)提出假設

H0:1=0,H1:10(2)以原假設H0構造t統(tǒng)計量,并由樣本計算其值(3)給定顯著性水平,查t分布表,得臨界值c=t/2(n-2)(4)比較,判斷若|t|>t/2(n-2),則拒絕H0

,接受H1

;若|t|

t/2(n-2),則拒絕H1

,接受H0

;第42頁,共78頁,2023年,2月20日,星期四第43頁,共78頁,2023年,2月20日,星期四簡易判斷法則當n>30時,t分布近似于標準正態(tài)分布給定顯著性水平為5%,臨界值c約為2如果t的絕對值大于2,就可以拒絕稻草人假設,說明斜率b1顯著地不等于零因此,解釋變量X對被解釋變量Y具有影響第44頁,共78頁,2023年,2月20日,星期四p值p值是給定t比率后,能拒絕稻草人假設的最小顯著性水平即給定顯著性水平為p,根據(jù)樣本計算的t比率剛好可以拒絕稻草人假設如果顯著性水平大于p,則仍然可以拒絕如果顯著性水平小于p,則不可以拒絕問題:對于計量研究而言,p值越大還是越小好?第45頁,共78頁,2023年,2月20日,星期四案例分析:大學GPA的決定因素被解釋變量:大學平均成績colGPA解釋變量:1、高中平均成績hsGPA2、大學能力測驗成績ACT3、平均每周曠課次數(shù)skipped計量模型:colGPA=0+1hsGPA+2ACT+3skipped+Eviews的結果第46頁,共78頁,2023年,2月20日,星期四3.7檢驗聯(lián)合假設如果某些解釋變量沒有通過t檢驗,是否他們就沒有影響力呢?

t

=

問題:如果該解釋變量和其他某些解釋變量高度相關,會導致什么結果?Var(j

)=σ2(1-Rj2)∑2xjjj第47頁,共78頁,2023年,2月20日,星期四案例分析棒球運動員的薪水被解釋變量:棒球運動員的薪水解釋變量:1、加入俱樂部的年數(shù)years2、平均每年的比賽次數(shù)gamesyr3、平均每年擊球次數(shù)bavg4、平均每年本壘打次數(shù)hrunsyr5、平均每年的擊球跑壘得分rbisyr第48頁,共78頁,2023年,2月20日,星期四案例分析棒球運動員的薪水計量模型為:其中,第三到第五個解釋變量都是度量球員表現(xiàn)的指標運行Eviews,進行t檢驗第49頁,共78頁,2023年,2月20日,星期四Eviews的結果Log(SALARY)=11.19+0.07*YEARS+0.01*GAMESYR+0.0009786038654*BAVG+0.01*HRUNSYR+0.01*RBISYRVariable Coefficient Std.Error t-Statistic Prob.

C 11.19242 0.28882338.751840.0000 YEARS 0.068863 0.012115 5.684295 0.0000 GAMESYR 0.012552 0.002647 4.742442 0.0000 BAVG 0.000979 0.001104 0.886811 0.3758 HRUNSYR 0.014429 0.016057 0.898642 0.3695 RBISYR 0.010766 0.007175 1.500458 0.1344

第50頁,共78頁,2023年,2月20日,星期四同時檢驗多個假設:F檢驗

t檢驗只適用于檢驗單個解釋變量的顯著性;對多個解釋變量的聯(lián)合影響進行檢驗,需要運用隨機變量F。t檢驗是F檢驗的特例給定計量模型

Yi=0+1X1i+2X2i++kXki+ii=1,2,,n

可提出如下原假設與備擇假設:

H0:1=2=0H1:

1和2不全為0第51頁,共78頁,2023年,2月20日,星期四第52頁,共78頁,2023年,2月20日,星期四F檢驗的基本思想1、根據(jù)斜率為零的假設,得到新的計量模型(受限模型):Yi=0+3X31i+4X42i++kXki+ii=3,4,,n2、可以證明:其中,RSSR表示新(受限)模型的殘差平方和RSSU表示原(非受限)模型的殘差平方和第53頁,共78頁,2023年,2月20日,星期四F檢驗的基本思想3、設定顯著性水平,得到臨界值c4、根據(jù)樣本數(shù)據(jù),以稻草人假設為前提,計算F的取值5、如果F>c,則拒絕原假設說明:也可以計算p值,得到最低的顯著性水平。原理同t檢驗第54頁,共78頁,2023年,2月20日,星期四案例分析棒球運動員的薪水計量模型為:其中,第三到第五個解釋變量都是度量球員表現(xiàn)的指標運行Eviews,對上述三個解釋變量進行F檢驗第55頁,共78頁,2023年,2月20日,星期四Eviews稻草人假設:H0:3=4=5=01、運行eviews完成估計2、view\coefficienttests\wald3、在對話框中依次輸入假設為零的斜率,以逗號進行分隔第56頁,共78頁,2023年,2月20日,星期四回歸整體顯著性的F檢驗

即檢驗模型

Yi=0+1X1i+2X2i++kXki+ii=1,2,,n中的所有斜率參數(shù)j是否顯著不為0。

可提出如下原假設與備擇假設:

H0:1=2==k=0H1:j不全為0,j=1,2,……,k第57頁,共78頁,2023年,2月20日,星期四回歸整體顯著性的F檢驗給定顯著性水平,可得到臨界值c,由樣本求出統(tǒng)計量F的數(shù)值,通過

Fc來拒絕原假設H0。)1/(/--=knRSSkESSF可以證明:F統(tǒng)計量為第58頁,共78頁,2023年,2月20日,星期四案例分析棒球運動員的薪水計量模型為:運行Eviews,對回歸的整體顯著性進行F檢驗第59頁,共78頁,2023年,2月20日,星期四R2與解釋變量的個數(shù)wage

=0

+1educ+wage=0

+1educ+2

exper+3.8校正的判定系數(shù)第60頁,共78頁,2023年,2月20日,星期四問題:如何比較不同數(shù)量解釋變量的計量模型?R2與解釋變量的個數(shù)R2K變量個數(shù)第61頁,共78頁,2023年,2月20日,星期四懲罰新增的解釋變量第62頁,共78頁,2023年,2月20日,星期四R2K變量個數(shù)懲罰新增的解釋變量第63頁,共78頁,2023年,2月20日,星期四8.9什么時候增加新的解釋變量提高校正的判定系數(shù)VS顯著的解釋變量(通過t檢驗)t>1VSt>2第64頁,共78頁,2023年,2月20日,星期四3.10預測預測的含義:給定解釋變量X的取值,推測被解釋變量Y的取值預測要面對的四大問題:1、X的取值:已知;未知(需要預測)2、模型中的參數(shù):估計3、Y的隨機性4、模型本身的正確性Y=b0+b1x1+b2x2+μ第65頁,共78頁,2023年,2月20日,星期四1、期望值的預測確定性部分:b0+b1x1+b2x2

E(Y|X1,X2)1)通過樣本估計b,得到Y=b0+b1x1+b2x2+μY=b0+b1x1+b2x2^^^^2)根據(jù)給定的X估計E(Y),即計算Y^第66頁,共78頁,2023年,2月20日,星期四期望值的預測給定解釋變量X的取值,被解釋變量Y的期望值是唯一的但是,對Y期望值的估計值不是唯一的OLS估計量Y樣本數(shù)據(jù)Y期望值的估計值^X的取值第67頁,共78頁,2023年,2月20日,星期四2、預測被解釋變量Y的值:點預測Y是一個隨機變量問題:一定要用一個值來作為Y的代表,應該選用哪一個值?E(Y)Y因此,對Y的點預測等同于對Y期望值的預測Y=b0+b1x1+b2x2+μ^第68頁,共78頁,2023年,2月20日,星期四Eviews1、完成參數(shù)估計2、設定X的取值:1)Proc\structure;sample2)在對話框中增加樣本容量3)打開解釋變量,輸入設定的X的取值3、forcast4、在對話框中增加樣本容量5、打開Y的預測值Yf第69頁,共78頁,2023年,2月20日,星期四3、以95%的概率預測Y的取值區(qū)間給定已知的X0,對Y0的點預測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論