計量經(jīng)濟學基礎 第3版 課件 第7、8章 多元線性回歸模型的推斷、多重共線性_第1頁
計量經(jīng)濟學基礎 第3版 課件 第7、8章 多元線性回歸模型的推斷、多重共線性_第2頁
計量經(jīng)濟學基礎 第3版 課件 第7、8章 多元線性回歸模型的推斷、多重共線性_第3頁
計量經(jīng)濟學基礎 第3版 課件 第7、8章 多元線性回歸模型的推斷、多重共線性_第4頁
計量經(jīng)濟學基礎 第3版 課件 第7、8章 多元線性回歸模型的推斷、多重共線性_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第7章多元線性回歸模型的推斷第7章

多元線性回歸模型的推斷理解多元線性回歸模型的古典假定理解多元最小二乘估計量的統(tǒng)計性質(zhì)掌握多元線性回歸模型的檢驗會運用多元線性回歸模型解決實際問題LEARNINGTARGET學習目標前面我們討論了多元線性回歸模型的設定及矩陣表示,多元線性回歸直線的代數(shù)性質(zhì),以及多元線性回歸模型的估計方法。在實際的應用中,我們總是用樣本的回歸系數(shù)對總體的回歸系數(shù)進行推斷,這就需要知道樣本的OLS估計量的統(tǒng)計性質(zhì),與一元線性回歸的情形一樣,要得到樣本回歸系數(shù)好的統(tǒng)計性質(zhì),必須要有一些前提條件—古典假定。7.古典假定7.1多元線性回歸模型的古典假定假設多元線性回歸模型為:其中--回歸系數(shù)(j=0,1,2,…,k)

--隨機擾動項對模型和隨機擾動動項提出如下假定:1,對模型和變量的假定(1)在重復抽樣中,諸X的值是固定的。也就是說,我們認為,在一個回歸過程中,諸X是確定性變量,而不是隨機變量。(2)模型的設定是正確的。也就是說,模型沒有設定偏誤,即無論是從變量的設定還是函數(shù)形式的設定,模型都是正確的。7.1多元線性回歸模型的古典假定2.對隨機擾動項的假定(1)零均值假定。即的條件均值為0(2)同方差假定。即的條件方差相同(4)與諸X之間不存在線性相關,即與諸X的協(xié)方差為0(5)正態(tài)性假定。即服從正態(tài)分布在多元線性回歸模型中,還必須有一個特殊的假定:無多重共線性假定(3)無自相關假定。即對于不同的之間不存在線性相關性7.1多元線性回歸模型的古典假定2.對隨機擾動項的假定(6)無多重共線性假定這個假定的含義是在諸X之間不存在線性相關性;或者說在諸X中,不存在其中某一個X被其他的X線性表示。即不存在實數(shù)使得下式成立:為什么要有這樣的一個假定呢?我們以二元線性回歸模型為例來說明。設二元線性回歸模型為:,如果兩個解釋變量之間存在線性有關系,則有,其中。將代入到原回歸模型得:這是一個一元線性回歸模型,說明原來設定的模型是有偏誤的。7.1多元線性回歸模型的古典假定這些古典假定可以用矩陣的形式表示如下:(1)零均值假定(2)、(3)同方差與無自相關假定由于故有:

=7.1多元線性回歸模型的古典假定(4)隨機擾動項與解釋變量不相關(5)正態(tài)性假定(6)無多重共線性假定即矩陣X滿秩7.2多元線性回歸OLS估計量的統(tǒng)計性質(zhì)一元線性回歸OLS估計量有一個非常重要的統(tǒng)計性質(zhì),即:在滿足古典假定的條件下,OLS估計量是最佳線性無偏估計量(BLUE),這個結論被稱之為高斯-馬爾可夫定理。與一元線性回歸OLS一樣,多元線性回歸OLS估計量也有這樣的結論。即OLS估計量可以被表示為Y的線性組合,這個性質(zhì)的重要性在于我們可以據(jù)此推斷偏回歸系數(shù)估計量的分布。由式(6-33)可以看出,可以被表示為Y的線性組合。(1)線性性即OLS估計量的數(shù)學期望等于其對應的參數(shù)。(2)無偏性則有:由零均值假定可得:。即OLS估計量是無偏估計量。7.2多元線性回歸OLS估計量的統(tǒng)計性質(zhì)即OLS估計量的方差是所有估計量中方差最小的估計量。這個性質(zhì)的證明較復雜,讀者可以參考其他教材給出的證明。我們可以得到OLS估計量的協(xié)方差矩陣,而其對角線上對應元素就是方差:(3)最小方差性具體的每個估計量的方差為:式中是矩陣中第j行第j列位置上的元素這個結果在形式上比較復雜,以二元線性回歸模型(5-11)為例,其估計量的方差為:7.2多元線性回歸OLS估計量的統(tǒng)計性質(zhì)由于是總體隨機擾動項的方差,一般是未知的,故需要用樣本方差來估計:n-k-1稱之為自由度,在二元線性回歸模型中,由于k=2,所以自由度為n-3。將代入到(7-6)、(7-7)、(7-8)中,可得到對應方差的估計值,從而可以得到標準差的估計值:這些計算結果都可以在Eviews回歸結果中得到。例如在【例6-3】的回歸結果中,Std.Error對應的就是標準誤差的估計值,即:7.2多元線性回歸OLS估計量的統(tǒng)計性質(zhì)同樣的,我們可以得到一般的多元線性回歸模型對應的結果。綜合上述三個性質(zhì),我們可以得到一個非常重要的結論:多元線性回歸模型在滿足古典假定的條件下,OLS估計量是最佳線性無偏估計量(BestLinearUnbiasedEstimator,BLUE)。這個結論稱為高斯-馬爾可夫定理。由高斯-馬爾可夫定理可知,多元線性回歸OLS估計量在滿足古典假定的條件下,OLS估計量是最佳線性無偏估計量。據(jù)此我們可以得到其抽樣分布:7.3多元線性回歸模型參數(shù)的檢驗與區(qū)間估計1.經(jīng)濟意義檢驗經(jīng)濟意義檢驗就是要檢驗各項系數(shù)的符號是否與經(jīng)濟理論或者預期相同。如果相同則通過檢驗,如果不相同則不能通過檢驗。在【例6-3】中,、,說明當收入增加時,消費也增加;當物價上漲時,消費也會增加,符合經(jīng)濟理論。2.擬合優(yōu)度檢驗多元線性回歸模型的擬合優(yōu)度檢驗要用調(diào)整后的判定系數(shù)。在【例6-3】中,,說明擬合的程度非常高。3.參數(shù)的檢驗多元線性回歸模型參數(shù)的檢驗與一元線性回歸模型參數(shù)的檢驗不同,需要進行兩個檢驗:模型設定整體的顯著性檢驗和模型設定變量的顯著性檢驗。(1)模型設定整體的顯著性檢驗(F檢驗)對于多元線性回歸模型(7-1),如果有,則說明諸X都沒有對Y做出解釋,模型的設定是有問題的。于是我們就要對這樣的假設進行檢驗:7.3多元線性回歸模型參數(shù)的檢驗與區(qū)間估計這個假設檢驗相當于檢驗k個總體均值是否都等于0,需要用到方差分析的方法.構造檢驗統(tǒng)計量:給定顯著性水平,如果F檢驗統(tǒng)計量的值>,則我們就有理由拒絕原假設,說明模型設定整體上是顯著的;否則不能拒絕原假設,說明模型設定在整體上是不顯著的。如圖7-1所示。圖7-1F檢驗示意圖7.3多元線性回歸模型參數(shù)的檢驗與區(qū)間估計需要指出的是,F(xiàn)檢驗核計量與可決系數(shù)有著確定性的關系這樣,我們也可以通過可決系數(shù)得到F檢驗統(tǒng)計量的值。F檢驗檢驗也可以采用p值方法,在Eviews中我們可以得到F檢驗統(tǒng)計量的值和其對應的伴隨概率(即p值),可以簡便的做F檢驗。在【例6-3】中,可以得到F=23812.43,對應的伴隨概率為0.000000,故拒絕原假設,說明模型整體上是顯著的。7.3多元線性回歸模型參數(shù)的檢驗與區(qū)間估計(2)模型設定變量的顯著性檢驗(t檢驗)如果模型通過了F檢驗,則說明模型的偏回歸系數(shù)不全為0,模型在整體上是顯著的。但是,我們并不知道具體哪一個不為0,或者為0。于是我們對這樣的假設進行檢驗:(j=1,2,…,k)對于這樣的假設檢驗,與一元線性回歸模型顯著性檢驗一樣采用t檢驗,但是自由度為n-k-1。給定顯著性水平,如果t檢驗統(tǒng)計量的絕對值>,則我們有理由拒絕原假設,說明不為0,對應的顯著的對對Y做出了解釋;反之,則說明沒有顯著的對Y做出了解釋。t檢驗也可以采用p值方法,在Eviews中我們可以得到t檢驗統(tǒng)計量的值和其對應的伴隨概率(即p值),可以簡便的做t檢驗。7.3多元線性回歸模型參數(shù)的檢驗與區(qū)間估計以【例6-3】的回歸結果為例,對模型做F檢驗和t檢驗。首先寫出多元線性回歸結果的報告。由表6-2的結果,報告如下:結果中的se、t、p值的含義與一元線性回歸結果的含義是相同的,表示調(diào)整后的可決系數(shù),F(xiàn)及p值表示F檢驗統(tǒng)計量的值和與之對應的p值。系數(shù),F(xiàn)及p值表示F檢驗統(tǒng)計量的值和與之對應的p值7.3多元線性回歸模型參數(shù)的檢驗與區(qū)間估計對于給定的顯著性水平,F(xiàn)檢驗統(tǒng)計量的值非常大,而其對應的p值非常小,這樣我們就有足夠的理由拒絕原假設,說明模型設定整體上是顯著的。(j=1,2)由于偏回歸系數(shù)對應的p值都非常的小,我們有足夠的理由拒絕原假設,說明每一個X都顯著的對Y做出了解釋。如果模型通過了F檢驗和t檢驗,說明模型的設定是合適的和可靠的,這樣我們就可以進行基本的運用—對參數(shù)做區(qū)間估計。3.偏回歸系數(shù)的區(qū)間估計偏回歸系數(shù)的區(qū)間估計與一元線性回歸模型的區(qū)間估計是相同的,基本的估計方法是:的的置信區(qū)間為(j=1,2,…,k)滿足:7.3多元線性回歸模型參數(shù)的檢驗與區(qū)間估計7.4多元線性回歸模型的預測多元線性回歸模型的另外一個重要的應用是進行預測,即在給定樣本以外的各個解釋變量的取值的條件下,對對應的被解釋變量的平均值或個別值進行估計,這種預測可以是點預測,也可以是區(qū)間預測。1.點預測設多元線性回歸模型為,其樣本回歸方程為,并且經(jīng)過檢驗,樣本回歸方程是可靠的。給定樣本以外的各個解釋變量的取值:,代入到樣本回歸方程得:容易證明,這個點預測是對總體平均值的無偏估計,即2.總體平均值的區(qū)間預測對總體預期平均值做區(qū)間預測,必須確定點預測值與平均值的關系以及的分布。由點預測結果可知,是的無偏估計量。而,服從正態(tài)分布,所以也服從正態(tài)分布。7.4多元線性回歸模型的預測可以證明,的方差,所以有:由于總體方差未知,故用其估計值代替,的自由度為n-k-1。于是:這樣,我們可以得到總體預期平均值的預測區(qū)間:3.個別值的區(qū)間預測個別值的區(qū)間預測方法與總體平均值的區(qū)間預測方法基本相同,只是這時的方差有所不同??紤]則有可以證明,個別值的方差由于總體方差未知,故用其估計值代替,的自由度為n-k-1。7.4多元線性回歸模型的預測構造t統(tǒng)計量:設顯著性水平為α,則置信水平為1-α。于是個別值的1-α置信區(qū)間為:7.5案例分析7.5案例分析解:打開Eviews錄入數(shù)據(jù),并對變量命名:其中Y—人均消費支出、X1—人均工資性收入、X2—人均經(jīng)營性收入、X3—其他收入DependentVariable:Y

Method:LeastSquares

Date:04/29/22Time:08:15

Sample:131

Includedobservations:31

VariableCoefficientStd.Errort-StatisticProb.

C4175.5501054.8533.9584200.0005X10.6352980.0658789.6435280.0000X20.4493840.1614392.7836200.0097X30.3524460.1050483.3551030.0024

R-squared0.973891Meandependentvar21012.36AdjustedR-squared0.970990S.D.dependentvar6765.676S.E.ofregression1152.352Akaikeinfocriterion17.05691Sumsquaredresid35853678Schwarzcriterion17.24194Loglikelihood-260.3821Hannan-Quinncriter.17.11723F-statistic335.7089Durbin-Watsonstat1.628715Prob(F-statistic)0.000000

7.5案例分析1.經(jīng)濟意義檢驗。由于估計結果的偏回歸系數(shù)都大于0,符合經(jīng)濟學理論。2.擬合優(yōu)度檢驗。由于

,說明擬合程度非常高。3.F檢驗。設顯著性水平為0.05,由于F檢驗統(tǒng)計量的伴隨概率p=0.000000<0.05,說明模型整體而言是顯著的。4.t檢驗。由于所有系數(shù)對應t統(tǒng)計量的p值都小于0.05,故總體模型的系數(shù)都顯著的不為0,t檢驗是顯著的。經(jīng)過檢驗,說明模型設定是可靠的。7.5案例分析7.5案例分析當其他變量保持不變時,工資性收入增加一元,消費會增加約0.635298元;當其他變量保持不變時,經(jīng)營性收入增加一元,消費會增加約0.449384元;當其他變量保持不變時,其他收入增加一元,消費會增加約0.352446元。利用估計結果進行預測。當工資性收入達到20000元、經(jīng)營性收入達到5000元、其他收入達到10000元時,消費支出的點預測值為22652.89。與第4章中的區(qū)間預測方法一樣,我們可以得到消費支出均值的95%置信水平的區(qū)間預測:(20244.96,25060.82)。通過以上分析,我們可以得到如下結論:工資性收入是提高消費水平的主要影響因素,為了保持經(jīng)濟增長,應采取穩(wěn)步提高居民工資性收入水平。第7章

多元線性回歸模型的推斷本章小結多元線性回歸模型的古典假定相比一元線性回歸模型多了一個無多重共線性假定,這是由于多元線性回歸模型的特殊性決定的,我們可以運用矩陣來表示這些古典假定。在滿足古典假定的也能得到OLS估計量的統(tǒng)計性質(zhì):高斯-馬爾可夫定理。對多元線性回歸模型做統(tǒng)計檢驗需要進行對模型整體的顯著性進行檢驗,即F檢驗,t檢驗是對個別變量的顯著性檢驗;參數(shù)的區(qū)間估計方法以及預測方法與一元線性回歸模型基本相同。第7章

多元線性回歸模型的推斷學習建議學習多元線性回歸模型的推斷要理解多元線性回歸模型的古典假定,正確理解高斯-馬爾可夫定理,掌握多元線性回歸模型的參數(shù)的統(tǒng)計檢驗和區(qū)間估計的方法。1.本章重點多元線性回歸模型的古典假定高斯-馬爾可夫定理參數(shù)的統(tǒng)計檢驗和區(qū)間估計2.本章難點多元線性回歸模型古典假定高斯-馬爾可夫定理核心概念古典假定高斯-馬爾可夫定理假定檢驗區(qū)間估計預測第8章多重共線性第8章

多重共線性1.掌握統(tǒng)計學的基本方法2.了解多重共線性的意義3.·理解多重共線性產(chǎn)生的原因4.·掌握判斷多重共線性的方法5.·掌握修正多重共線性的方法LEARNINGTARGET學習目標8.1多重共線性的含義與一元線性回歸模型相比較,多元線性回歸模型的古典假定中有一條無多重共線性假定。為什么要有這條假定?如果我們設定的模型違背了這條假定會有怎樣的后果?多重共線性是怎樣產(chǎn)生的?怎樣修正多重共線性?這些問題都是我們要在本章回答的問題?!纠?-1】國家財政收入是政府有效實施其各項職能的重要保障。財政收入依靠經(jīng)濟的增長,主要來自各項稅收收入,其中工業(yè)企業(yè)是稅收的重要來源。除此之外,還有社會整體消費情況、固定資產(chǎn)投資情況以及居民消費水平等都會影響財政收入。為了研究影響財政收入的因素,選取了1980-2019年我國的相關數(shù)據(jù)(數(shù)據(jù)見教學資源data8-1,數(shù)據(jù)來源:中國統(tǒng)計年鑒2020),其中Y—財政收入,X1—GDP,X2—稅收總收入,X3—工業(yè)增加值,X4—社會消費品零售總額,X5—固定資產(chǎn)投資,X6—居民消費水平。預計這些因素都會對財政收入產(chǎn)生正方向的影響,并且應該是顯著的影響。建立多元線性回歸模型,并檢驗模型中是否存在多重共線性。8.1多重共線性的含義估計結果如下:DependentVariable:Y

Method:LeastSquares

Date:07/12/22Time:15:09

Sample:19802019

Includedobservations:40

VariableCoefficientStd.Errort-StatisticProb.

C-4.083309350.5799-0.0116470.9908X1-0.0018130.053250-0.0340560.9730X21.1167620.1119939.9716750.0000X3-0.0732040.074899-0.9773670.3355X40.1419250.1327111.0694310.2926X50.0050200.0148690.3376090.7378X6-0.8113040.997454-0.8133750.4218

R-squared0.999776Meandependentvar46526.68AdjustedR-squared0.999735S.D.dependentvar61110.96S.E.ofregression994.8116Akaikeinfocriterion16.80061Sumsquaredresid32658452Schwarzcriterion17.09617Loglikelihood-329.0122Hannan-Quinncriter.16.90747F-statistic24522.94Durbin-Watsonstat1.776700Prob(F-statistic)0.000000

8.1多重共線性的含義通過估計結果我們發(fā)現(xiàn),X1、X3、X6的系數(shù)為負,說明X1、X3、X6與Y之間是反向關系,這個結果與我們事先的預計不相符。此外我們還發(fā)現(xiàn),雖然模型可以通過F檢驗,說明模型在整體上是可靠的,但在進行t檢驗時,只有X2通過,說明其他變量沒有對Y顯著的做出解釋。造成這種矛盾結果的原因是模型中存在多重共線性。造成這種矛盾結果的原因是模型中存在多重共線性。什么是多重共線性呢?回憶第5章中對多元線性回歸模型的古典假定中的無多重共線性假定:諸X之間不存在線性相關性;用矩陣表示為:,即矩陣X滿秩。而例8-1中的模型中很可能沒有滿足這個假定,即諸X之間存在線性相關性,即存在不全為0的(i=0,1,2,…k),使得下式成立:8.1多重共線性的含義或者,

這種情形我們稱之為多重共線。如果式(8-1)成立,我們稱之為完全的多重共線;而在實際運用中我們常常遇到的是不完全的多重共線,即存在不全為0的(i=0,1,2,…k),使得下式成立:其中--隨機誤差項當諸X相關程度較高,或隨機誤差項足夠小時,這種不完全多重共線性可能會給我們估計的結果帶來一些重要的影響。在多元線性回歸模型中,解釋變量之間的線性相關程度可以用其相關系數(shù)來度量。8.1多重共線性的含義設表示解釋變量和的線性相關系數(shù),則有:1) 當時,解釋變量和之間不存在線性相關性。這時可以分別用和對Y做回歸得到其影響的系數(shù)。2) 當時,解釋變量和之間存在完全的線性相關性。此時模型的參數(shù)將無法估計,這是因為在這種情形下,我們無法固定一個變量不變而使另外一個變量發(fā)生變化。3) 當時,解釋變量和之間存在不完全的線性相關性。實際運用中遇到最多的是這種情形,這時模型的參數(shù)是否能正確的估計,要看和之間相關程度的高低,如果相關程度高,可能會對估計的結果帶來很大的影響。8.2產(chǎn)生多重共線性的原因在多元線性回歸模型中往往會產(chǎn)生多重共線性,一般來說由時間序列數(shù)據(jù)構造的模型可能性大,其原因可以歸納為以下幾個方面:1.經(jīng)濟變量之間具有共同變化的趨勢經(jīng)濟運行的特點之一就是經(jīng)濟變量在一定時期表現(xiàn)出共同的變化趨勢。在例8-1的解釋變量中,國內(nèi)生產(chǎn)總值、稅收總收入、工業(yè)增加值的共同的變化趨勢非常明顯,我們可以繪制變量的線圖來觀察其變化,如圖8-1所示。

從圖8-1中可以清楚的看到,三個變量的變化的非常強的共同趨勢,可以推斷這三個變量之間應該具有很高的相關性,于是模型中就有可能存在多重共線性了。1.經(jīng)濟變量之間具有共同變化的趨勢8.2產(chǎn)生多重共線性的原因2.經(jīng)濟變量內(nèi)在的聯(lián)系在經(jīng)濟系統(tǒng)中,各要素(變量)之間是相互依存、相互制約的,所以其運行的結果—數(shù)據(jù)一定會存在某種程度相關關系。例如,生產(chǎn)函數(shù)中的勞動投入與資金投入、消費函數(shù)中的收入與財產(chǎn)等等,都會表現(xiàn)有一定的相關關系。而且這種關系無論是時間序列數(shù)據(jù)還是截面數(shù)據(jù)都會表現(xiàn)出來,從這個意義上講,多重共線性是不可避免的,只是程度上的問題。3.模型中包含了滯后變量在很多模型中要考慮滯后因素的影響。所謂滯后變量是指過去時期的,但對當期被解釋變量產(chǎn)生影響的變量,可以分為滯后的解釋變量和滯后的響應變量。滯后變量的表示方法為:或。如果模型中包含了這些滯后變量,就可能產(chǎn)生多重共線性。例如模型包含了滯后變量,而之間、之間都可能存在非常高的相關性,于是就產(chǎn)生了多重共線性。8.2產(chǎn)生多重共線性的原因在很多情況下我們使用的是年度數(shù)據(jù),這些數(shù)據(jù)是由月度數(shù)據(jù)或季度數(shù)據(jù)合并而成,從而消除了短期波動,形成了更高的相關性。4.數(shù)據(jù)的影響由于各種條件的限制,我們可能只能得到一個較小的樣本,但需要有較多的變量。在這種情況下建立的線性模型比較容易產(chǎn)生多重共線性。通過以上分析我們可以看到,在多元線性回歸模型中,都會在不同程度上都會存在多重共線性,只是程度高低而已。此外,多重共線性是樣本特征,而不是總體特征。5.樣本過小而變量較多8.3多重共線性對OLS估計量的影響如果模型中存在多重共線性,則會對OLS估計量會產(chǎn)生一些重要的影響。1.完全的多重共線性的影響如果模型存在完全多重共線性時,會對OLS估計量產(chǎn)生非常大的影響。下面我們以二元線性回歸模型為例來說明。對于二元線性回歸模型的樣本回歸方程,用OLS進行估計的結果為:式中--的平均值

--的離差8.3多重共線性對OLS估計量的影響將其代入(8-4)和(8-5)得:上述兩式都是不定式,說明我們在完全的多重共線性條件下無法用OLS得到參數(shù)的估計值。這個結果很容易理解。我們知道,偏回歸系數(shù)表示當保持不變的條件下,變動一個單位對被解釋變量的平均值變動的影響。但由于現(xiàn)在有

的存在,所以我們無法使保持不變且使變動一個單位,反之亦然。也就是說我們現(xiàn)在無法分解X1和X2各自對Y的影響。如果X1與X2存在完全的多重共線性,則存在不為0的,使從而有。8.3多重共線性對OLS估計量的影響此外,完全的多重共線性還會使OLS估計量的方差變?yōu)闊o窮大。二元線性回歸方程OLS估計量的方差為:將代入(8-7)和(8-8)得:8.3多重共線性對OLS估計量的影響這表明在完全的多重共線性條件下,OLS估計量的方差為無窮大。以上是以二元線性回歸模型為例,在更多元的線性回歸模型情形下也會有相同的結果。由此看來,當模型中存在完全的多重共線性時,其后果是非常嚴重的。2. 不完全的多重共線性的影響大多數(shù)情況下,我們遇到的都是不完全的多重共線性。還是以二元線性回歸模型為例,當X1與X2相關程度很高時,會對估計結果產(chǎn)生較大的影響。(1)OLS估計量接近不定式假設存在不為0的,使,其中是隨機誤差項,并且滿足

,這是為了保證與不相關。將代入(8-4)和(8-5)中得:8.3多重共線性對OLS估計量的影響當X1與X2相關程度足夠高時,就會足夠小,以至于非常接近0。這樣,OLS估計量就會趨近于不定式。(2)OLS估計量的方差變大在存在不完全的多重共線性的條件下,OLS估計量的方差與變量之間的相關系數(shù)有關。設表示X1與X2之間的相關系數(shù),則有:8.3多重共線性對OLS估計量的影響由式(8-7)和(8-8)得注意到,記:則統(tǒng)計量的方差為:顯然,當X1與X2相關程度很高時,的值就很接近1,則VIF的值就會趨向于無窮大。所以我們稱VIF為方差膨脹因子(VarianceInflationFactor),它會使估計量的方差膨脹,而VIF的值取決于的值。8.3多重共線性對OLS估計量的影響(3)參數(shù)的置信區(qū)間變寬當X1與X2相關程度很高時,VIF的值會很大,從而估計量的方差也會變得很大,這會導致對應的標準差變大,其直接后果是參數(shù)的置信區(qū)間變寬,影響估計的精度。下面我們以為例給出不同的值對其置信區(qū)間的影響。表8-2方差的擴大因子對參數(shù)置信區(qū)間的影響其他參數(shù)也是相似的結果。8.3多重共線性對OLS估計量的影響從表8-2可以看到,隨著X1與X2相關程度的提高,方差膨脹因子的值會以非??斓乃俣仍黾?,同時參數(shù)的置信區(qū)間的寬度也會以較快的速度變寬。例如,相關系數(shù)時的置信區(qū)間寬度是時的置信區(qū)間寬度的大約7倍。由于相關程度很高時置信區(qū)間的寬度變寬,所以就降低了參數(shù)估計的精度。(4)t檢驗可能做出錯誤的判斷以的t檢驗為例。我們要檢驗,需要計算t檢驗統(tǒng)計量,其計算方法為:。雖然此時的OLS估計量仍然是無偏估計,但是當X1與X2相關程度很高時,由于方差膨脹因子的作用會變大,這樣有可能使t檢驗統(tǒng)計量的絕對值變小,從而使我們作用不拒絕原假設的判斷(即),但是這個判斷是在會變大的條件下做出的,很可能是一個錯誤的判斷。更多元的線性回歸方程的情形可以得到相同的結果。通過以上分析,我們可以看到:完全的多重共線性會對OLS估計量產(chǎn)生非常嚴重的影響,一般情況下這樣的情形不會出現(xiàn);不完全的多重共線性當相關程度較高時也會對OLS估計量產(chǎn)生嚴重的影響,而這種情形是經(jīng)常會遇到的。8.4多重共線性的檢驗當多元線性回歸模型中多重共線性較嚴重時,會對OLS估計量產(chǎn)生影響,那么我們怎樣判斷模型中是否存在多重共線性呢?(1) 經(jīng)驗判斷法根據(jù)經(jīng)驗,一般出現(xiàn)下述情形中的一項或幾項則表明模型中可能存在較嚴重的多重共線性:① 當增加或剔除一個解釋變量,或者改變一個觀測值時,OLS估計量發(fā)生較大變化;② 一些解釋變量估計量的系數(shù)的符號出現(xiàn)與理論或者經(jīng)驗不相符;③ 重要解釋變量OLS估計的結果對應的se的值較大或者t檢驗統(tǒng)計量的值較??;④ OLS估計結果中可決系數(shù)、F檢驗統(tǒng)計量的值非常高?;仡櫪?-1的OLS估計結果。我們可以發(fā)現(xiàn)結果中出現(xiàn)了上述的某些情形。這樣,我們就可以根據(jù)檢驗推斷,模型中可能存在較嚴重的多重共線性。8.4多重共線性的檢驗(2) 相關系數(shù)判斷法由于多重共線性是本質(zhì)是解釋變量之間存在線性相關性,所以我們可以計算諸兩兩解釋變量之間的相關系數(shù)。當某些解釋變量之間的相關系數(shù)較高時,我們就有理由相信模型中存在較嚴重的多重共線性,相關系數(shù)越高,我們推斷的理由越充分。一般來說,當相關系數(shù)的值超過0.8時,我們就可以認為模型中存在多重共線性。在Eviews中可以直接計算變量之間的相關系數(shù),得到相關系數(shù)矩陣。方法是在命令窗口里輸入命令:cor解釋變量名稱回車。以【例8-1】的結果為例,相關系數(shù)矩陣為:

從表8-3中可以看到,X2與X3、X2與X4、X3與X4之間的相關系數(shù)都超過了0.9,相關程度較高,說明模型中可能存在較嚴重的多重共線性。X1X2X3X4X5X6X11.00000.99710.99440.99860.97500.9986X20.99711.00000.99520.99600.98590.9924X30.99440.99521.00000.98890.97830.9898X40.99860.99600.98891.00000.97740.9980X50.97500.98590.97830.97741.00000.9670X60.99860.99240.98980.99800.96701.00008.4多重共線性的檢驗(3) 方差膨脹因子法在上一節(jié)里我們得到了二元線性回歸模型的方差膨脹因子,更多元的線性回歸模型也可以得到相對應的方差膨脹因子。選定一個解釋變量作為被解釋變量(比如),做其與其余解釋變的回歸,得到回歸的可決系數(shù),則可以證明對應的OLS估計量的方差為:其中為變量對應的OLS估計量的方差膨脹因子8.4多重共線性的檢驗由于可決系數(shù)度量了與其他解釋變量的線性相關程度,所以這種相關程度越高,的值就越大,從而VIF的值也就越大,說明模型中多重共線性越嚴重,反之亦然。一般認為,當某一個解釋變量對應的VIF的值大于等于10時,則模型中存在較嚴重的多重共線性,這個條件等價于。8.4多重共線性的檢驗(4)輔助回歸法相關系數(shù)矩陣只能判斷解釋變量兩兩之間的相關程度。當模型中解釋變量多于2個并呈現(xiàn)出較為復雜相關關系時,我們就不能從相關系數(shù)矩陣來判斷多重共線性了。這時我們可以通過輔助回歸的方法來判斷。輔助回歸是指用一個選定的解釋變量(比如)作為被解釋變量,與其他的解釋變量所做的回歸稱為輔助回歸。由輔助回歸得到其對應的可決系數(shù)

??梢宰C明由可決系數(shù)構造的統(tǒng)計量:8.4多重共線性的檢驗服從F分布。如果由此計算得到的F值超過設定的臨界值,則說明模型中存在較嚴重的多重共線性。8.5多重共線性的修正如果模型中存在較嚴重的多重共線性,會給OLS估計結果帶來嚴重的影響。通過檢驗我們可以判斷模型中是否存在多重共線性,若存在,就有必要對模型進行修正。1.增加樣本容量產(chǎn)生多重共線性的一個重要原因就是樣本過小而變量個數(shù)較多,所以解釋多重共線性的方法之一就是增加樣本容量。但是,這種方法會增加成本,包括時間成本和經(jīng)濟成本。以二元線性回歸模型為例,估計量的方差為:。當兩個變量間的相關程度一定時,即一定時,的值會隨著樣本容量增加而增加,從而估計量的方差會隨著樣本容量增加而減少。這樣,就會減少估計的誤差,直觀的看是減少了多重共線性的影響。2.變量變換我們還通過變量代換的方法來修正或降低多重共線性,這種方法有兩種形式。其一,差分變換。假設時間序列模型為:8.5多重共線性的修正則有:由(8-13)減去(8-14)得記:則(8-15)可以寫成:式(8-16)稱為一階差分形式。對(8-16)進行估計,可以較有效的修正多重共線性.其二,比率變換。如果在式(8-13)中,Y表示消費支出,X1表示GDP,X2表示人口數(shù)。則GDP可能會與人口數(shù)存在較嚴重的相關性。我們可以通過比率變換來消除這種相關性,方法如下:在式(8-13)中,同除以X2,得:8.5多重共線性的修正通過這樣的變換可以減少多重共線性。這兩種變換雖然能修正或減少多重共線性,但也會帶來其他的一些問題,經(jīng)過這樣的變換后模型可能會不滿足其他的古典假定了。3.利用先驗的信息我們在長期的實踐中可以觀察到有些變量之間會存在很高的相關性,這些信息對我們設定模型時避免和減少多重共線性是非常有幫助的。例如,對于消費模型,其中X1表示收入,X2表示財富。我們觀察到,收入和財富具有很高的相關性,在重復觀察中可以估計出這兩個變量之間的相關程度,比如,我們就可以將原來的二元線性回歸模型設定為一個一元線性回歸模型:,其中,從而避免多重共線性。8.5多重共線性的修正4.截面數(shù)據(jù)與時間序列數(shù)據(jù)并用也稱為數(shù)據(jù)合并法,這種方法的基本思想是:由于截面數(shù)據(jù)是同一時點上產(chǎn)生的數(shù)據(jù),某些變量的數(shù)據(jù)還不至于產(chǎn)生較大的變化。所以先用截面數(shù)據(jù)求出一個或多個回歸系數(shù)的估計值,再把它們代入原時間序列數(shù)據(jù)模型中,通過用因變量與上述估計值所對應的解釋變量相減從而得到新的因變量,然后建立新因變量對那些保留解釋變量的回歸模型,并利用時間序列樣本估計回歸系數(shù)。下面通過一個例子具體介紹合并數(shù)據(jù)法。設有某種商品的銷售量模型如下,式中Yt表示銷售量,Pt表示平均價格,It表示消費者收入,下標t表示時間。我們的目的是要估計價格彈性和收入彈性。在時間序列數(shù)據(jù)中,平均價格Pt與收入It一般高度相關,所以當用最小二乘法估計模型時,會遇到多重共線性問題。8.5多重共線性的修正我們先利用截面數(shù)據(jù)估計收入彈性,因為在截面數(shù)據(jù)中,平均價格不會發(fā)生較大變化,所以這個估計是可靠的。即估計模型:注意,這是由截面數(shù)據(jù)估計的回歸。再把用截面數(shù)據(jù)得到的收入彈性系數(shù)估計值代入原模型中得:移項整理:這時模型已變換為一元線性回歸模型,排除了收入變量的影響。利用時間序列數(shù)據(jù)對上述模型進行估計,求出,,則可得到估計式:其中是用截面數(shù)據(jù)估計的,、是由時間序列數(shù)據(jù)估計的。8.5多重共線性的修正由于把估計過程分作兩步,從而避免了多重共線性問題。顯然這種估計方法默認了一種假設,即相對于時間序列數(shù)據(jù)各個時期截面數(shù)據(jù)所對應的收入彈性系數(shù)估計值都與第一步求到的相同。當這種假設不成立時,這種估計方法會帶來估計誤差。5.剔除變量法模型中產(chǎn)生多重共線性的一個重要原因是模型的變量設定有偏誤。當然,解決這一問題的方法就是剔除變量。這里又要談到模型設定的問題。我們說模型被正確設定一般是指模型的函數(shù)形式被正確設定、變量也被正確設定。如果模型中設定的變量多了或者少了,都會產(chǎn)生模型設定的偏誤,而設定的變量多了可能會產(chǎn)生多重共線性。當模型中存在多重共線性時,我們可能通過剔除變量的方法進行修正,但剔除哪個變量卻是一個不好處理的問題。一般可以根據(jù)經(jīng)濟理論來確定哪個變量是核心變量或重要變量,以此來判斷剔除哪個變量。如果沒有相關的經(jīng)濟理論為依據(jù),可以根據(jù)多元回歸的系數(shù)符號是否與實際相符或者t檢驗的顯著性水平的高低來判斷剔除哪個變量。8.5多重共線性的修正6.逐步回歸法我們還可以運用逐步回歸的方法來避免多重共線性。具體的方法如下:(1)用被解釋變量對每一個所考慮的解釋變量做簡單回歸。(2)以對被解釋變量貢獻最大的解釋變量所對應的回歸方程為基礎,以對被解釋變量貢獻大小為順序逐個引入其余的解釋變量。這個過程可能會出現(xiàn)3種情形。①若新變量的引入沒有改變系數(shù)的符號,并且改進了R2,回歸參數(shù)的t檢驗在統(tǒng)計上也是顯著的,則該變量在模型中予以保留。②若新變量的引入未能改進R2,且對其他回歸參數(shù)估計值的t檢驗也未帶來什么影響,則認為該變量是多余的,應該舍棄。③若新變量的引入未能改進R2,且顯著地影響了其他回歸參數(shù)估計值的符號與數(shù)值,同時本身的回歸參數(shù)也通不過t檢驗,這說明出現(xiàn)了嚴重的多重共線性。舍棄該變量。此外,修正多重共線性還有主成分法,嶺回歸法等等,有興趣的讀者可以參閱其他教材和相關資料。8.6案例分析【例8-2】影響糧食產(chǎn)量的因素是多種多樣的,以河南省為例,將糧食產(chǎn)量作為被解釋變量,農(nóng)業(yè)機械總動力、灌溉面積、化肥施用量、糧食播種面積、農(nóng)村用電量為解釋變量建立多元線性回歸模型(數(shù)據(jù)見教學資源data8-2,數(shù)據(jù)來源:河南統(tǒng)計年鑒2021),用最小二乘法對模型進行估計,并檢驗模型中是否存在多重共線性。解:打開Eviews錄入數(shù)據(jù),并對變量命名:其中Y—糧食產(chǎn)量,X1—農(nóng)業(yè)機械總動力,X2—灌溉面積,X3—化肥施用量,X4—糧食播種面積,X5-農(nóng)村用電量。多元線性回歸模型的估計結果如下:8.6案例分析DependentVariable:Y

Method:LeastSquares

Date:06/26/22Time:11:00

Sample:19782020

Includedobservations:43

VariableCoefficientStd.Errort-StatisticProb.

C636.39941626.8000.3911970.6979X1-0.1841780.056512-3.2590720.0024X2-0.0369150.181080-0.2038580.8396X34.5855240.9350354.9041220.0000X40.1701220.1339021.2704950.2118X59.0176362.1863894.1244420.0002

R-squared0.984431Meandependentvar4224.698AdjustedR-squared0.982327S.D.dependentvar1495.880S.E.ofregression198.8624Akaikeinfocriterion13.55189Sumsquaredresid1463212.Schwarzcriterion13.79764Loglikelihood-285.3657Hannan-Quinncriter.13.64252F-statistic467.8993Durbin-Watsonstat1.729130Prob(F-statistic)0.000000

8.6案例分析表8-5解釋變量的相關系數(shù)矩陣從相關系數(shù)矩陣可以看到,諸解釋變量之間存在較高的相關性,故模型中可能存在多重共線性。X1X2X3X4X5

X11.0000000.9541940.9864860.7983260.973916X20.9541941.0000000.9619830.6926270.937275X30.9864860.9619831.0000000.7706820.966887X40.7983260.6926270.7706821.0000000.876123X50.9739160.9372750.9668870.8761231.0000008.6案例分析我們可以用逐步回歸法修正多重共線性。先做一元線性回歸估計,得到如下比較結果表8-6一元線性回歸估計結果從結果看,6個解釋變量的一元線性回歸結果的對應的斜率項系數(shù)均為正,t檢驗都是顯著的。比較可決系數(shù)發(fā)現(xiàn)X1對應的最高,故選擇X5作為基礎變量做二元線性回歸。變量估計值(斜率項)t統(tǒng)計量P值可決系數(shù)x10.38000722.837320.00000.927117x21.75691816.340100.00000.866883x36.36633026.047600.00000.943014x41.67152610.775950.00000.739055x512.5914839.179840.00000.9739868.6案例分析表8-7二元線性回歸估計結果變量估計值(斜率項)t統(tǒng)計量P值調(diào)整后的可決系數(shù)X512.180158.5035500.00000.972744x10.0130650.2948600.7696X511.9949612.926370.00000.973003x20.0941300.6858590.4968X59.3977808.0802680.00000.977269x31.6972582.8400030

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論