第2章一元線性回歸模型_第1頁
第2章一元線性回歸模型_第2頁
第2章一元線性回歸模型_第3頁
第2章一元線性回歸模型_第4頁
第2章一元線性回歸模型_第5頁
已閱讀5頁,還剩168頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

浙江財經(jīng)大學(xué)倪偉才1第二章一元線性回歸模型回歸分析是計量經(jīng)濟學(xué)的基礎(chǔ)內(nèi)容!本章介紹一元線性回歸模型,最小二乘估計方法及其性質(zhì),參數(shù)估計的假設(shè)檢驗、預(yù)測等。浙江財經(jīng)大學(xué)倪偉才2本章主要內(nèi)容2.1一元線性回歸模型2.2參數(shù)β0、β1的估計2.3最小二乘估計的性質(zhì)2.4回歸方程的顯著性檢驗2.5殘差分析2.6回歸系數(shù)的區(qū)間估計2.7預(yù)測和控制2.8本章小結(jié)與評注浙江財經(jīng)大學(xué)倪偉才3線性回歸分析基本特征1、分析方法主要是對因果關(guān)系的回歸分析,即x是原因,y是結(jié)果2、“線性”的含義“線性”可作兩種解釋:對變量為線性,對參數(shù)為線性。一般“線性回歸”一詞總是指對參數(shù)為線性的一種回歸(即參數(shù)只以它的1次方出現(xiàn))。浙江財經(jīng)大學(xué)倪偉才4學(xué)習(xí)一元線性回歸模型理由假設(shè):y和x是代表一個總體的兩個變量,我們的興趣在于用x來解釋y,或者說是研究y如何隨x而變化為什么先學(xué)習(xí)一元線性回歸模型:1、兩個變量之間線性因果關(guān)系在現(xiàn)實經(jīng)濟中比較簡單。2、雖然許多經(jīng)濟問題涉及到多變量關(guān)系或不是線性的,但多變量關(guān)系與兩變量線性關(guān)系分析方法相似,非線性關(guān)系多數(shù)可轉(zhuǎn)化為線性關(guān)系,因此先討論兩變量線性回歸有方便之處。3、簡單線性回歸分析的原理和方法,正是所有計量經(jīng)濟分析的基本原理和方法,對理解計量經(jīng)濟分析的思想方法,進一步學(xué)習(xí)各種復(fù)雜的計量經(jīng)濟分析技術(shù)有很大幫助。浙江財經(jīng)大學(xué)倪偉才5實際背景在實際中,經(jīng)常要研究某一現(xiàn)象與影響它的某一最主要因素的統(tǒng)計思想。例子(1)y大豆的產(chǎn)出,x化肥的用量;(2)y每小時的工資,x受教育的年數(shù);(3)

y社區(qū)的犯罪率,x警察的數(shù)目;(4)火災(zāi)損失與火災(zāi)發(fā)生地距最近的消防站的距離;……

浙江財經(jīng)大學(xué)倪偉才6例題(課本)例2.2

全國人均消費金額記作y(元);

人均國民收入記為x(元)表2.2 人均國民收入表浙江財經(jīng)大學(xué)倪偉才7散點圖(scatter)的重要性例:全國人均消費金額記為y(元);把人均國民收入記為x(元)。我們把收集到1980-1998年的19年的樣本數(shù)據(jù)(xi,yi),i=1,2,…,n.數(shù)據(jù)見一元線性模型(消費和收入).sav浙江財經(jīng)大學(xué)倪偉才8SPSS16output浙江財經(jīng)大學(xué)倪偉才9

一元回歸直線的直觀意義觀察散點圖,變量x,y具有明顯的線性關(guān)系。故經(jīng)過這些樣本點畫一條適當?shù)闹本€。Abetterprocedureistofindthebeststraightlineusingacriterionthat,foragivensetofdata,producesthesamelineregardlessofthepersondoingthefitting.浙江財經(jīng)大學(xué)倪偉才102.1一元線性回歸模型由于兩個變量y,x具有明顯的線性關(guān)系,故考慮直線方程y=0+1x(函數(shù)表達的是確定性關(guān)系,有缺陷!)y=0+1x+u,其中u表示除x外,影響y的其它一切因素。將y與x之間的關(guān)系用兩部分來描述:a.一部分0+1x

,由x的變化引起y變化;b.另一部分u

,除x外的其它一切因素引起y變化。參數(shù)(parameters)0,1;0稱為回歸常數(shù)(截距)(intercept,constant),1稱為回歸斜率(slope)浙江財經(jīng)大學(xué)倪偉才11回歸的術(shù)語y的各種名稱:因變量(dependentvariable)或被解釋變量(explainedvariable)或回歸子(regressand)或內(nèi)生(endogenous);X的各種名稱:自變量(independentvariable)或解釋變量(explanatoryvariable)或回歸元(regressor)或外生(exogenous)U的各種名稱:隨機誤差項或隨機擾動項(stochasticerrorterm,randomdisturbanceterm):表示其它因素的影響,是不可觀測的隨機誤差!浙江財經(jīng)大學(xué)倪偉才12隨機誤差項的意義隨機誤差項是從模型中省略下來的而又集體地影響著Y的全部變量的替代物。顯然的問題是:為什么不把這些變量明顯地引進到模型中來,而以隨機擾動項來替代?理由是多方面的:(1)理論含糊:理論不能完全說明影響因變量的所有影響因素。(2)數(shù)據(jù)欠缺:無法獲得有關(guān)數(shù)據(jù)。(3)核心變量:希望能找到與有較大影響的核心變量的關(guān)系。(4)替代變量:用來代替不可觀測變量的替代變量選擇,造成一定誤差。(5)簡單原則:研究中盡可能使回歸模型簡單。(6)錯誤函數(shù):回歸式的的選擇是主觀的浙江財經(jīng)大學(xué)倪偉才13隨機誤差項各種名稱及含義1:計量:error2:宏觀經(jīng)濟學(xué):shock例:銀行對房貸的政策,對溫州和杭州的市場的沖擊不同!3:金融:innovation浙江財經(jīng)大學(xué)倪偉才14下表表示總體數(shù)據(jù)

X:收入,y:消費;目的:條件期望XY80100120140160180200220240260556579801021101201351371506070849310711513613714515265749095110120140140155175708094103116130144152165178758598108118135145157175180-88-113125140-160189185---115---162-191戶數(shù)5657665765總支出32546244570767875068510439661211浙江財經(jīng)大學(xué)倪偉才15條件期望條件分布(Conditionaldistribution):以X取定值為條件的Y的條件分布條件概率(Conditionalprobability):給定X,Y的概率,記為P(Y|X)。例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。條件期望(conditionalExpectation):給定X的Y的期望值,記為E(Y|X)。例如,E(Y|X=80)=55×1/5+60×1/5+65×1/5+70×1/5+75×1/5=65浙江財經(jīng)大學(xué)倪偉才16總體回歸函數(shù)(PRF)總體回歸函數(shù)(PopularRegressionFunction,PRF)E(Y|Xi)=f(Xi)[注意是x的函數(shù)]當PRF的函數(shù)形式為線性函數(shù),則有,E(Y|Xi)=0+1Xi其中0和1為未知而固定的參數(shù),稱為回歸系數(shù)。0和1也分別稱為截距和斜率系數(shù)。稱為線性總體回歸函數(shù)浙江財經(jīng)大學(xué)倪偉才17樣本回歸函數(shù)(SRF)由于在大多數(shù)情況下,我們只知道變量值的一個樣本,要用樣本信息的基礎(chǔ)上估計PRFX(收入)80100120140160180200220240260Y(支出)55657980102110120135137150樣本1樣本2X(收入)80100120140160180200220240260Y(支出)708094103116130144152165178樣本回歸函數(shù)SRF:

在回歸分析中,我們用SRF估計PRF。浙江財經(jīng)大學(xué)倪偉才18不同樣本的回歸線數(shù)據(jù)見:SRF.sav浙江財經(jīng)大學(xué)倪偉才19SPSS11操作(1)Graphs-Scatter-Overlay(2)Chart-Options-Fitline(3)圓形和三角形的選擇浙江財經(jīng)大學(xué)倪偉才20誤差項和殘差的關(guān)系XiXPRF:E(Y|Xi)=0+1XiSRF:YE(Y|Xi)SRF是PRF的近似估計。為了使二者更為接近,即要使浙江財經(jīng)大學(xué)倪偉才21假定1:回歸模型對參數(shù)是線性的假定2:在重復(fù)抽樣中X的值是固定的(非隨機)假定3:干擾項的均值為零。即,E(ui|Xi)=0[練習(xí)!]假定4:同方差性或ui的方差相等。即

Var(ui|Xi)=2假定5:各個干擾項無自相關(guān)。即

Cov(ui,uj|Xi,Xj)==0假定6:ui和Xi的協(xié)方差為零。即

Cov(ui,Xi)==0假定7:觀測次數(shù)必須大于待估計的參數(shù)個數(shù)。假定8:解釋變量X的只要有變異性。即一個樣本中,Xi不能完全相同。假定9:模型沒有設(shè)定誤差。假定10:沒有完全的多重共線性,即解釋變量之間沒有完全的線性關(guān)系。浙江財經(jīng)大學(xué)倪偉才22課堂練習(xí)Wooldridge《IntroductoryEconometrics》(3rd)Problems2.2浙江財經(jīng)大學(xué)倪偉才23

Gauss-Markov條件

隨機誤差的高斯——馬爾柯夫條件:浙江財經(jīng)大學(xué)倪偉才24一元線性回歸模型的矩陣形式浙江財經(jīng)大學(xué)倪偉才252.2參數(shù)0,1的估計一、參數(shù)0,1的估計方法:普通最小二乘估計OLSE(ordinaryleastsquareestimation)目的:利用樣本數(shù)據(jù)得到0,1的理想估計值原則:使n個樣本點最靠近回歸直線浙江財經(jīng)大學(xué)倪偉才26例題(課本)例2.2

全國人均消費金額記作y(元);

人均國民收入記為x(元)表2.2 人均國民收入表浙江財經(jīng)大學(xué)倪偉才27例題例:在研究我國人均消費水平的問題中,把全國人均消費金額記為y(元);把人均國民收入記為x(元)。我們把收集到1980-1998年的19年的樣本數(shù)據(jù)(xi,yi),i=1,2,…,n.數(shù)據(jù)見:一元線性模型(消費和收入).sav要使樣本點最靠近回歸直線,考慮觀測值yi與回歸值(即平均值)E(yi|Xi)=0+1Xi的離差的平方和。思考:為什么不考慮∑(yi-E(yi|xi)),及∑|yi

–E(yi|xi)|[聯(lián)系分位數(shù)回歸checkfunction!]浙江財經(jīng)大學(xué)倪偉才28散點圖的深化Graphs-interactive-scatterplot-spike-fitline浙江財經(jīng)大學(xué)倪偉才29SPSS16浙江財經(jīng)大學(xué)倪偉才30樣本點最靠近回歸直線,就是使離差平方和最小最小二乘法名稱的由來浙江財經(jīng)大學(xué)倪偉才31殘差實際上是y的觀測值與回歸值的差或者說是y的實際值與回歸值的差浙江財經(jīng)大學(xué)倪偉才32隨機誤差項和殘差的關(guān)系請參考Greene5thedition<<EconometricAnalysis>>page20th,FIGURE3.1PopulationandSampleRegression.Spss使用小技巧:如何畫課本24頁的圖2-3Graphs-interactive-scatterplot-spike-fitline浙江財經(jīng)大學(xué)倪偉才33GreeneFig.3.1浙江財經(jīng)大學(xué)倪偉才34最小二乘估計公式的推導(dǎo)[要非常熟練掌握]利用二元微積分求極值的知識知:

作為極值問題解的必要條件是:在取值時,Q(0,1)關(guān)于0,1的偏導(dǎo)數(shù)必須為0:以上方程組稱為firstorderconditions(FOC)浙江財經(jīng)大學(xué)倪偉才35Normalequations:利用克萊姆法則,得出普通最小二乘估計(OLSE:ordinaryleastsquareestimators)浙江財經(jīng)大學(xué)倪偉才36問題:浙江財經(jīng)大學(xué)倪偉才37例題(課本)例2.1

表2.1列出了15起火災(zāi)事故的損失及火災(zāi)發(fā)生地與最近的消防站的距離。表2.1 火災(zāi)損失表浙江財經(jīng)大學(xué)倪偉才38參數(shù)β0、β1的估計(計算題!)例2.1回歸方程浙江財經(jīng)大學(xué)倪偉才39回歸直線經(jīng)過樣本的均值的上機驗證EXAMPLE2.7(WageandEducation)ForthedatainWAGE1.sav,theaveragehourlywageinthesampleis5.90,roundedtotwodecimalplaces,andtheaverageeducationis12.56.Ifweplugeduc

12.56intotheOLSregressionlinewage=-0.90+0.54educ,wegettheestimateofwage=5.8824,whichequals5.9whenroundedtothefirstdecimalplace.Thereasonthesefiguresdonotexactlyagreeisthatwehaveroundedtheaveragewageandeducation,aswellastheinterceptandslopeestimates.浙江財經(jīng)大學(xué)倪偉才40OLSE易忽視的問題OLS可以解出參數(shù)0,1

的估計值:但是有一個問題必須要清楚,該估計值真的能使殘差平方和達到最小嗎?請閱讀wooldridge一書的第二章附錄,你自然會明白!浙江財經(jīng)大學(xué)倪偉才41OLSE易忽視的問題

閱讀材料:Wooldridge<<IntroductoryEconometricsAMordenApproach>>page65Appendix浙江財經(jīng)大學(xué)倪偉才42浙江財經(jīng)大學(xué)倪偉才43浙江財經(jīng)大學(xué)倪偉才44SOC浙江財經(jīng)大學(xué)倪偉才45參數(shù)估計的本質(zhì)條件1:用OLSE估計參數(shù)的本質(zhì)條件是FOC2:因此,只要滿足FOC條件,就能估計出參數(shù)3:從E(u|x)=0這個條件就能估計參數(shù)!浙江財經(jīng)大學(xué)倪偉才46殘差的性質(zhì):(會證明!)浙江財經(jīng)大學(xué)倪偉才47殘差性質(zhì)的注解1:畫正交投影解釋殘差性質(zhì)(2)和(3)。2:通過上機驗證殘差性質(zhì)(1)-(4),加深直觀認識!數(shù)據(jù):一元線性模型(消費和收入).sav浙江財經(jīng)大學(xué)倪偉才48小結(jié)1:一元線性回歸模型的參數(shù)的估計公式不僅會推導(dǎo),而且要記住其結(jié)論!你記住了嗎?2:一元線性回歸模型斜率估計的3種等價公式,你會推導(dǎo)了嗎?3:殘差的性質(zhì)!浙江財經(jīng)大學(xué)倪偉才49最大似然估計(MLE)

目的:用最大似然估計法估計一元線性回歸模型!

思考:用最大似然估計需要另外的假設(shè)是什么?問題:用MLE估計得到參數(shù)的估計值與OLS得到的估計值是否會相同?浙江財經(jīng)大學(xué)倪偉才50MLE浙江財經(jīng)大學(xué)倪偉才51MLE(會推導(dǎo)!)y1,y2,…,yn的似然函數(shù)為:對數(shù)似然函數(shù)為:與最小二乘原理完全相同

在假設(shè)εi~N(0,σ2)時,yi服從如下正態(tài)分布:浙江財經(jīng)大學(xué)倪偉才522.3最小二乘估計的性質(zhì)(BLUE)浙江財經(jīng)大學(xué)倪偉才53線性的含義浙江財經(jīng)大學(xué)倪偉才54無偏性浙江財經(jīng)大學(xué)倪偉才55無偏性的證明浙江財經(jīng)大學(xué)倪偉才56無偏性模擬浙江財經(jīng)大學(xué)倪偉才57stata一次估計:drop_allsetobs20setseed12345genx=invnormal(uniform())gentruey=1+1*xgeny=truey+invnormal(uniform())regyx浙江財經(jīng)大學(xué)倪偉才58stata多次估計:drop_allsetobs20setseed12345genx=invnormal(uniform())gentruey=1+1*xsavetruthprogramsimulation1.version102.usetruth,clear3.geny=truey+invnormal(uniform())4.regressyx5.endsimulate_b,reps(500):simulationsumhist_b_xpnorm_b_xswilk_b_x浙江財經(jīng)大學(xué)倪偉才59對無偏性的注解并不是所有的估計值滿足無偏性(unbiased!)以下內(nèi)容摘自Wooldridge《EconometricAnalysisofCrossSectionandPanelData》P101:5.2.6PotentialPitfallswith2SLSOnethingtorememberisthat,unlikeOLSunderazeroconditionalmeanassumption,IVmethodsareneverunbiasedwhenatleastoneexplanatoryvariableisendogenousinthemodel.Thisisonereasonwerelyonlarge-sampleanalysistojustify2SLS.(consistent!)浙江財經(jīng)大學(xué)倪偉才60變異和方差的關(guān)系變異:指一個變量對其均值的離差平方和。

變異(variation)和方差(variance)差別:變異指一個變量對其均值的離差平方和;方差指該平方和除以適當?shù)淖杂啥?。方?變異/自由度浙江財經(jīng)大學(xué)倪偉才61系數(shù)估計值的方差浙江財經(jīng)大學(xué)倪偉才62思考題浙江財經(jīng)大學(xué)倪偉才63閱讀材料:abstractedfromWooldridge,page55th-56th浙江財經(jīng)大學(xué)倪偉才64con’s浙江財經(jīng)大學(xué)倪偉才65浙江財經(jīng)大學(xué)倪偉才66SomeCommentsontheStandardErrorEstimatorsChrisBrooks《introductoryeconometricsforfinance》Box2.4standarderrorestimators浙江財經(jīng)大學(xué)倪偉才67Con’d Considerwhathappensifissmallorlarge:浙江財經(jīng)大學(xué)倪偉才68估計值的協(xié)方差浙江財經(jīng)大學(xué)倪偉才69估計值協(xié)方差的注解浙江財經(jīng)大學(xué)倪偉才70方差、協(xié)方差之間的關(guān)系浙江財經(jīng)大學(xué)倪偉才71高斯——馬爾柯夫定理[要求會證明!]浙江財經(jīng)大學(xué)倪偉才72implicationofBLUEBestLinearUnbiasedEstimators(BLUE).Whatdoesthisacronymstandfor?1:Estimator:?αand?βareestimatorsofthetruevalueofαandβ2:Linear:?αand?βarelinearestimators--thatmeansthattheformulaefor?αand?βarelinearcombinationsoftherandomvariables(inthiscase,y)3:Unbiased:onaverage,theactualvaluesof?αand?βwillbeequaltotheirtruevalues4:Best:meansthattheOLSestimator?βhasminimumvarianceamong theclassoflinearunbiasedestimators.浙江財經(jīng)大學(xué)倪偉才73證明:浙江財經(jīng)大學(xué)倪偉才74浙江財經(jīng)大學(xué)倪偉才75補充練習(xí)(Homework)JamesH.Stock《IntroductiontoEconometrics》(2rd)EX.5.14浙江財經(jīng)大學(xué)倪偉才762.4回歸方程的顯著性檢驗浙江財經(jīng)大學(xué)倪偉才77Anintroductiontostatisticalinference

Often,financialtheorywillsuggestthatcertaincoefficientsshouldtakeonparticularvalues.Itisthusofinteresttodeterminewhethertherelationshipsexpectedfromfinancialtheoryareupheldbythedatatohandornot.Estimatesofαandβhavebeenobtainedfromthesample,butthesevaluesarenotofanyparticularinterest;thepopulationvaluesthatdescribethetruerelationshipbetweenthevariableswouldbeofmoreinterest,butareneveravailable.Instead,inferencesaremadeconcerningthelikelypopulationvaluesfromtheregressionparametersthathavebeenestimatedfromthesampleofdatatohand.Indoingthis,theaimistodeterminewhetherthedifferencesbetweenthecoefficientestimatesthatareactuallyobtained,andexpectationsarisingfromfinancialtheory,arealongwayfromoneanotherinastatisticalsense. --abstractedfromChrisBrooks《introductoryeconometricsforfinance》浙江財經(jīng)大學(xué)倪偉才78正態(tài)性假設(shè)的合理性浙江財經(jīng)大學(xué)倪偉才79正態(tài)性假設(shè)不成立!1:heavytail2:clustervolatility3:leverageeffectWhatdoesthet-distributionlooklike?Itlookssimilartoanormaldistribution,butwithfattertails,andasmallerpeakatthemean.浙江財經(jīng)大學(xué)倪偉才80正態(tài)性假設(shè)不成立的例子姜近勇教材P40評注2.4浙江財經(jīng)大學(xué)倪偉才81

回歸系數(shù)的t檢驗回歸系數(shù)的顯著性檢驗就是檢驗自變量x對因變量y影響程度是否顯著。[注意:課本P32有誤!]原假設(shè)H0:1=0對立假設(shè)H1:1≠0(是雙側(cè)假設(shè)驗)如果原假設(shè)成立,y和x之間并不存在真正的線性關(guān)系;拒絕原假設(shè),y和x之間存在線性關(guān)系。

浙江財經(jīng)大學(xué)倪偉才82構(gòu)造t統(tǒng)計量的理由:浙江財經(jīng)大學(xué)倪偉才83t統(tǒng)計量的幾點注解1:Asthedegreesoffreedominthetdistributiongetlarge,thetdistributionapproachesthestandardnormaldistribution.Thesearecloseenoughforpracticalpurposes;fordegreesoffreedomgreaterthan120,onecanusethestandardnormalcriticalvalues.浙江財經(jīng)大學(xué)倪偉才842:RecallthatthetstatisticfortestingH0:β1=0isdefinedbydividingtheestimatebyitsstandarderror:.Thus,t

canindicatestatisticalsignificanceeitherbecause

is“l(fā)arge”orbecause

is“small”.Itisimportantinpracticetodistinguishbetweenthesereasonsforstatisticallysignificanttstatistics.Toomuchfocusonstatisticalsignificancecanleadtothefalseconclusionthatavariableis“important”forexplainingyeventhoughitsestimatedeffectismodest.浙江財經(jīng)大學(xué)倪偉才85對t統(tǒng)計量的理解浙江財經(jīng)大學(xué)倪偉才86nullhypothesis1:Notethatthereisalwaysanequalityunderthenullhypothesis.So,forexample,β<0.5wouldnotbespecifiedunderthenullhypothesis. 2:Thispriorinformationshouldcomefromthefinancialtheoryoftheproblemunderconsideration,andnotfromanexaminationoftheestimatedvalueofthecoefficient.浙江財經(jīng)大學(xué)倪偉才87useofterminologyinconnectionwithhypothesistests1:itissaidthatthenullhypothesisiseitherrejectedornotrejected.2:itissaidthatthenullhypothesisiseitherrejectedornotrejected.Itisincorrecttostatethatifthenullhypothesisisnotrejected,itis‘a(chǎn)ccepted’

3:Onereasonwhyitisnotsensibletosaythatthenullhypothesisis‘a(chǎn)ccepted’isthatitisimpossibletoknowwhetherthenullisactuallytrueornot!4:

Inanygivensituation,manynullhypotheseswillnotberejected.Forexample,supposethatH0:β=0.5andH0:β=0.52areseparatelytestedagainsttherelevanttwo-sidedalternativesandneithernullisrejected.Clearlythenitwouldnotmakesensetosaythat‘H0:β=0.5isaccepted’and‘H0:β=0.52isaccepted’,sincethetrue(butunknown)valueofβcannotbeboth0.5and0.52.

浙江財經(jīng)大學(xué)倪偉才88回歸的標準誤

稱為回歸的標準誤(thestandarderroroftheregressionortherootmeansquarederror(Wooldridge

page58th)Standarderroroftheestimate:Thestandarderroroftheestimatemeasurestheamountbywhichtheactualyvaluesdifferfromtheestimatedvalues

.Itisanestimateofthestandarddeviationoftheerrortermuinthesimplelinearregressionmodel.(《BusinessForecasting》page221)浙江財經(jīng)大學(xué)倪偉才89(證明可參閱WooldridgeP57(orP62)Theorem2.3)浙江財經(jīng)大學(xué)倪偉才90Hint浙江財經(jīng)大學(xué)倪偉才91Example:HowtoCalculatetheParametersandStandardErrorsAssumewehavethefollowingdatacalculatedfromaregressionofyonasinglevariablexandaconstantover22observations.

Determinetheappropriatevaluesofthecoefficientestimatesandtheirstandarderrors.浙江財經(jīng)大學(xué)倪偉才92Solutions(estimators)浙江財經(jīng)大學(xué)倪偉才93Solutions(standarderrors)浙江財經(jīng)大學(xué)倪偉才94回歸結(jié)果的表示(務(wù)必會表示!)浙江財經(jīng)大學(xué)倪偉才95什么是P值?(P-value)P值即顯著性概率值SignificanceProbabilityValue.SPSS的輸出結(jié)果用sig.表示。浙江財經(jīng)大學(xué)倪偉才96P值P值被定義為一個原假設(shè)可被拒絕的最低顯著水平t值和P值關(guān)系:P{|t|>|t值|}=P值,其中t是檢驗統(tǒng)計量,是隨機變量,此時是服從自由度為n-2的t分布;t值指t統(tǒng)計量的樣本值。當P值=α?xí)r(通常α取5%),|t值|=t(α/2)P值越小,|t值|越大;P值越大,|t值|越小P值≤α,|t值|≥t(α/2)

,拒絕原假設(shè)H0:1=0P值>α,|t值|<t(α/2)

,接受原假設(shè)H0:1=0用P值代替t值的優(yōu)越性:①用P值做檢驗不需要查表,只需要直接用P值與顯著性水平α相比。當P值≤α?xí)r,拒絕原假設(shè)H0

;當P值>α?xí)r,接受原假設(shè)H0

。而用t值需要查表求臨界值。②用P值做檢驗具有可比性,而用t值做檢驗與自由度有關(guān),可比性差③用P值做檢驗可以準確地知道檢驗的顯著性,實際上P值就是犯棄真錯誤的真實概率,也就是檢驗的真實顯著性。浙江財經(jīng)大學(xué)倪偉才97上機驗證題目見:wooldridge57頁EX2.4數(shù)據(jù):bwght.sav,regressbwghtoncigs1:回歸方程[要求能正確寫出回歸方程!]2:預(yù)測值[利用回歸方程]和殘差[利用預(yù)測值]3:殘差平方和[transform-compute,reports-reportsummarizesincolumns],

標準誤Std.ErroroftheEstimate[注意自由度]4:residual:meansquare注意:

Std.ErroroftheEstimate和meansquareofresidual之間的關(guān)系5:std.errorincludinginterceptandslope[重點]6:tstatistic,P值浙江財經(jīng)大學(xué)倪偉才98統(tǒng)計意義上的顯著與現(xiàn)實意義上的顯著

如果我們能夠以5%的置信水平拒絕某個檢驗的零假設(shè),則稱這個檢驗在統(tǒng)計上是顯著的。統(tǒng)計意義上顯著的結(jié)論可能在現(xiàn)實意義上不重要,注意兩者的不同。

例子:如果我們檢驗一批罐頭的重量是否是500克,隨機樣本數(shù)據(jù)顯示均值是499克,并且顯著地不同于500克的假設(shè)值。則罐頭實際重量在統(tǒng)計意義上不同于500克,但是在現(xiàn)實意義沒什么不同。浙江財經(jīng)大學(xué)倪偉才99SST=SSE+SSR總平方和(totalsumofsquares)表示觀測值yi圍繞其均值的總變異解釋平方和(explainedsumofsquares)表示估計值圍繞其均值的變異殘差平方和(residualsumofsquares)表示殘差圍繞回歸線的變異SST=SSE+SSR,其中SSE是由解釋變量x引起的,SSR是由殘差(其它因素)引起的。證明:SST=SSE+SSR體會:若模型不含常數(shù)項,則此等式不成立!浙江財經(jīng)大學(xué)倪偉才100SSR注解SSRisalsoknownasalossfunction. 浙江財經(jīng)大學(xué)倪偉才101說明y的觀測值圍繞其均值的總變異可分解為兩部分:一部分來自回歸線,而另一部分來自隨機誤差項,因為并非所有的實際的y觀測值都落在擬合的直線上XiXPRFSRFYSST=SSE+SSR幾何意義浙江財經(jīng)大學(xué)倪偉才102(樣本)判定系數(shù)R2(coefficientofdetermination)SST=SSE+SSR,在總平方和SST中,如果解釋平方和SSE所占的比重越大,則線性回歸效果越好,稱回歸直線和樣本觀測值擬合優(yōu)度(goodnessoffit)較好;如果殘差平方和SSR所占的比重越大,則回歸直線和樣本觀測值擬合得不理想。判定系數(shù)R2=SSE/SST(或1-SSR/SST)R2

的性質(zhì):(1)非負,(2)0≤R2≤1浙江財經(jīng)大學(xué)倪偉才103R2其它表達式浙江財經(jīng)大學(xué)倪偉才104介紹Rsuqared的等價定義浙江財經(jīng)大學(xué)倪偉才105Rsquared計算浙江財經(jīng)大學(xué)倪偉才106補充練習(xí)(課堂練習(xí))JamesH.Stock《IntroductiontoEconometrics》(2rd)EX.4.9浙江財經(jīng)大學(xué)倪偉才107補充練習(xí)(homework)Greene5thedition<<EconometricAnalysis>>chapter3EX11Threevariables,N,D,andY,allhavezeromeansandunitvariances.AfourthvariableisC=N+D.IntheregressionofConY,theslopeis0.8.IntheregressionofConN,theslopeis0.5.IntheregressionofDonY,theslopeis0.4.WhatisthesumofsquaredresidualsintheregressionofConD?Thereare21observationsandallmomentsarecomputedusing1/(n?1)asthedivisor.浙江財經(jīng)大學(xué)倪偉才108Hint浙江財經(jīng)大學(xué)倪偉才109自由度(df)

[務(wù)必要相當清楚!]

自由度(numberofdegreeoffreedom)是指樣本觀測值的總數(shù)(n)減去對它們的獨立(線性)約束或限制的個數(shù)。換句話,它是指觀測值的總個數(shù)中獨立的觀測值個數(shù)。浙江財經(jīng)大學(xué)倪偉才110樣本相關(guān)系數(shù)相關(guān)系數(shù):表示兩個隨機變量之間的相關(guān)程度。定義為:以樣本方差和樣本協(xié)方差估計x、y的方差和協(xié)方差,樣本相關(guān)系數(shù)為:浙江財經(jīng)大學(xué)倪偉才111(樣本)相關(guān)系數(shù)性質(zhì)③相關(guān)系數(shù)的平方與判定系數(shù)相等,但二者意義不同④一元線性回歸的回歸系數(shù)^1的符號和相關(guān)系數(shù)R的符號相同。性質(zhì):①可正可負,其符號和分子兩變量的協(xié)變異有關(guān)。②|R|≤1③是指線性關(guān)系,而不是非線性關(guān)系浙江財經(jīng)大學(xué)倪偉才112相關(guān)系數(shù)的顯著性檢驗浙江財經(jīng)大學(xué)倪偉才113相關(guān)程度的強弱兩變量間相關(guān)程度的強弱分為以下幾個等級:當|r|≥0.8時,視為高度相關(guān);當0.5≤|r|<0.8時,視為中度相關(guān);當0.3≤|r|<0.5時,視為低度相關(guān);當|r|<0.3時,表明兩個變量之間的相關(guān)程度極弱,在實際應(yīng)用中可視為不相關(guān)。浙江財經(jīng)大學(xué)倪偉才114相關(guān)系數(shù)顯著性檢驗用SPSS軟件做相關(guān)系數(shù)的顯著性檢驗浙江財經(jīng)大學(xué)倪偉才115補充練習(xí)(課堂練習(xí))JamesH.Stock《IntroductiontoEconometrics》(2rd)EX.4.12浙江財經(jīng)大學(xué)倪偉才116復(fù)習(xí)ttest浙江財經(jīng)大學(xué)倪偉才117樣本決定系數(shù)R2

能夠說明樣本的擬和優(yōu)度。但是我們還需要對總體做出推斷,檢驗總體的線性是否成立。思路:若SSE/SSR比較大,則X對Y的解釋程度就比較高,可以推測總體存在線性。但是SSE/SSR樣本不同而不同,對于給定的樣本,利用SSE/SSR對總體進行推斷,必須進行統(tǒng)計檢驗。浙江財經(jīng)大學(xué)倪偉才118方差分析(analysisofvariance,ANOVA)

[務(wù)必非常清楚此表是如何構(gòu)造的!]ssdfMeanSquareFRegressionSSE1SSE/1[SSE/1]/[SSR/(n-2)]ResidualSSRn-2SSR/(n-2)TotalSSTn-1浙江財經(jīng)大學(xué)倪偉才119對F統(tǒng)計量的注解1:SSE服從卡方分布,SSR也服從卡方分布!2:可以證明SSE和SSR獨立!3:考慮分子、分母的自由度!因此,服從F分布!浙江財經(jīng)大學(xué)倪偉才120計算ANOVA數(shù)據(jù):bwght.sav,regressbwghtoncigs浙江財經(jīng)大學(xué)倪偉才121t檢驗和F檢驗的關(guān)系t檢驗是對回歸系數(shù)進行顯著性的檢驗,針對個別系數(shù);F檢驗是對回歸方程進行顯著性的檢驗,針對整個回歸方程對于一元線性回歸,兩種檢驗是等價的;對于多元線性回歸,兩種檢驗是不等價的浙江財經(jīng)大學(xué)倪偉才122ttest,Ftest浙江財經(jīng)大學(xué)倪偉才123三種檢驗的關(guān)系對于一元線性回歸模型,三種是等價的!請完成課后習(xí)題2.8!根據(jù)習(xí)題2.8的結(jié)論,易得習(xí)題2.11的結(jié)論!浙江財經(jīng)大學(xué)倪偉才124習(xí)題2.8和習(xí)題2.11浙江財經(jīng)大學(xué)倪偉才125三種檢驗關(guān)系的等價性數(shù)據(jù):bwght.sav,regressbwghtoncigs目的:通過上機驗證三種檢驗關(guān)系的等價性,加深直觀認識等價性具體體現(xiàn):1:它們的P值均為:0.0000000166153817026412,

P值完全相同!浙江財經(jīng)大學(xué)倪偉才126F檢驗的注解1:ItcanbeshownthattheFstatisticfortestingexclusionofasinglevariableisequaltothesquareofthecorrespondingtstatistic.2:Sincet2

n-k-1hasanF1,n-k-1distribution,thetwoapproachesleadtoexactlythesameoutcome,providedthatthealternativeistwo-sided.3:Thetstatisticismoreflexiblefortestingasinglehypothesisbecauseitcanbeusedtotestagainstone-sidedalternatives4:SincetstatisticsarealsoeasiertoobtainthanFstatistics,thereisreallynoreasontouseanFstatistictotesthypothesesaboutasingleparameter.(Wooldridgepage146th)浙江財經(jīng)大學(xué)倪偉才127增加練習(xí)(很重要的題型!)《RegressionAnalysisbyExamples》p76thEX3.5:Thefollowingtableshowstheregressionoutput,withsomenumberserased,whenasimpleregressionmodelrelatingaresponsevariableytoapredictorvariablex1isfittedbasedontwentyobservations.Computethe12missingnumbers.浙江財經(jīng)大學(xué)倪偉才128SourceSumofSquaresdfMeanSquareF-testRegression1848.76_______________Residuals_______________VariableCoefficientset-testpConstant-23.432512.74____0.0824x1________0.15288.32<0.0001n=__R2=__AdjustedR2

=____^σ=___浙江財經(jīng)大學(xué)倪偉才129SourceSumofSquaresdfMeanSquareF-testRegression1848.7611848.7669.22Residuals480.61826.7VariableCoefficientset-testpConstant-23.432512.74-1.8390.0824x11.270.15288.32<0.0001n=20R2=0.79AdjustedR2=0.78^σ=5.17練習(xí)參考答案浙江財經(jīng)大學(xué)倪偉才130作業(yè)《RegressionAnalysisbyExamples》p76thEX3.6:Thefollowingtableshowstheregressionoutput,withsomenumberserased,whenasimpleregressionmodelrelatingaresponsevariableytoapredictorvariablex1isfittedbasedoneighteenobservations.Computethe12missingnumbers,thencomputeVar(y)andVar(x1).浙江財經(jīng)大學(xué)倪偉才131SourceSumofSquaresdfMeanSquareF-testRegression____________________Residuals_______________VariableCoefficientset-testpConstant3.43179____0.2650.7941x1________0.1421____<0.0001n=__R2=0.716AdjustedR2=____^σ=7.342浙江財經(jīng)大學(xué)倪偉才132OthertestsWaldtestLagrangeMultiplier(LM)testLikelihoodRatio(LR)test浙江財經(jīng)大學(xué)倪偉才133LMtest參考Wooldridge《EconometricAnalysisofcrosssectionandpaneldata》4.2.4LagrangeMultiplier(Score)testsLM的具體步驟Example4.1WageEquationforMarried,WorkingWomenTBA浙江財經(jīng)大學(xué)倪偉才134浙江財經(jīng)大學(xué)倪偉才1352.5殘差分析一個線性回歸方程通過了t檢驗或F檢驗,只是表明變量x和y之間的線性關(guān)系是顯著的,或者說線性回歸方程是有效的,但不能保證數(shù)據(jù)擬合得很好,理由是可能由于意外的原因而導(dǎo)致數(shù)據(jù)的不完全可靠,如異常值等。線性回歸擬合時使用的是最小二乘法。即保證各觀測點至直線縱向距離的平方和為最小,這就產(chǎn)生了一個問題:如果存在異常點,它們離回歸直線較遠,相應(yīng)距離的平方就非常大,為了保證平方和為最小,回歸直線不得不強烈的向該點所在方向偏移,顯然,這可能會導(dǎo)致錯誤的分析結(jié)論。因此,有必要進行殘差分析。浙江財經(jīng)大學(xué)倪偉才136殘差分析的內(nèi)容殘差分析主要分析兩大方面:①殘差分布是否是正態(tài)分布?是否是同方差?采用殘差圖及一些相關(guān)的指標如標準化殘差,庫克距離等;②殘差是否相關(guān)?采用DW統(tǒng)計量進行殘差的相關(guān)性檢驗(在第四章介紹)浙江財經(jīng)大學(xué)倪偉才137為什么要找異常點:因為有些觀察值在各個變量單獨描述時處于正常范圍內(nèi),但幾個變量聯(lián)合描述則為異常。例如:年齡10歲和體重70公斤單獨存在時都不奇怪,但如果同一個人年齡10歲并且體重70公斤顯然就不正常!

異常點:在y軸方向嚴重偏離的數(shù)據(jù)點;高杠桿點:在x軸方向嚴重偏離的數(shù)據(jù)點;強影響點:對統(tǒng)計推斷影響特別大的點,其中異常點和高杠桿點都有可能形成強影響點。浙江財經(jīng)大學(xué)倪偉才138殘差性質(zhì)浙江財經(jīng)大學(xué)倪偉才139杠桿值(leverage)浙江財經(jīng)大學(xué)倪偉才140殘差方差的證明浙江財經(jīng)大學(xué)倪偉才141浙江財經(jīng)大學(xué)倪偉才142浙江財經(jīng)大學(xué)倪偉才143殘差圖殘差圖:通常指以自變量x為橫軸,以殘差為縱軸的散點圖。(當然還有其他的殘差圖,如spssplots)判斷下列殘差圖哪些符合基本的假定?(正常的,異方差,曲線,蛛網(wǎng)現(xiàn)象,異常點,高杠桿點。)浙江財經(jīng)大學(xué)倪偉才144正常的殘差圖正常的殘差圖:①在殘差應(yīng)在e=0附近隨機變化,②并且在變化幅度不大的帶狀圖形內(nèi)。浙江財經(jīng)大學(xué)倪偉才145標準化殘差、學(xué)生化殘差浙江財經(jīng)大學(xué)倪偉才146練習(xí):殘差數(shù)據(jù):火災(zāi)損失表.sav(1)畫火災(zāi)損失的殘差圖(2)由ZRE,SRE判斷是否存在強影響點(3)學(xué)會scatter-overlay的使用浙江財經(jīng)大學(xué)倪偉才1472.6回歸系數(shù)的區(qū)間估計Hypothesistestsareusefulifyouhaveaspecificnullhypothesisinmind.Beingabletoacceptorrejectthisnullhypothesisbasedonthestatisticalevidenceprovidesapowerfultoolforcopingwiththeuncertaintyinherentinusingasampletolearnaboutthepopulation.Yet,therearemanytimesthatnosinglehypothesisaboutaregressioncoefficientisdominant,andinsteadonewouldliketoknowarangeofvaluesofthecoefficientthatareconsistentwiththedata.Thiscallsforconstructingaconfidenceinterval.浙江財經(jīng)大學(xué)倪偉才148置信區(qū)間和顯著性水平95%confidenceintervalfor1

isanintervalthathasa95%probabilityofcontainingthetruevaluesof1;thatis,in95%ofpossiblesamplesthatmightbedrawn,theconfidenceintervalwillcontainthetrueof15%significancelevel

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論