多重共線性概念課件_第1頁(yè)
多重共線性概念課件_第2頁(yè)
多重共線性概念課件_第3頁(yè)
多重共線性概念課件_第4頁(yè)
多重共線性概念課件_第5頁(yè)
已閱讀5頁(yè),還剩49頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

一、多重共線性的概念二、實(shí)踐經(jīng)濟(jì)問(wèn)題中的多重共線性三、多重共線性的后果四、多重共線性的檢驗(yàn)五、抑制多重共線性的方法六、案例第六章多重共線性問(wèn)題的提出在前述根本假定下OLS估計(jì)具有BLUE的優(yōu)良性。然而實(shí)踐問(wèn)題中,這些根本假定往往不能滿足,使OLS方法失效不再具有BLUE特性。估計(jì)參數(shù)時(shí),必需檢驗(yàn)根本假定能否滿足,并針對(duì)根本假定不滿足的情況,采取相應(yīng)的補(bǔ)救措施或者新的方法。檢驗(yàn)根本假定能否滿足的檢驗(yàn)稱為計(jì)量經(jīng)濟(jì)學(xué)檢驗(yàn)回想6項(xiàng)根本假定〔1〕解釋變量間不相關(guān)〔無(wú)多重共線性〕〔2〕E(ui)=0〔隨機(jī)項(xiàng)均值為零〕〔3〕Var(ui)=2〔同方差〕〔4〕Cov(ui,uj)=0〔隨機(jī)項(xiàng)無(wú)自相關(guān)〕〔5〕Cov(X,ui)=0〔隨機(jī)項(xiàng)與解釋變量X不相關(guān)〕〔6〕隨機(jī)擾動(dòng)服從正態(tài)分布。不滿足根本假定的情形〔1〕1、通常不會(huì)發(fā)生隨機(jī)擾動(dòng)項(xiàng)均值不等于0的情形。假設(shè)發(fā)生也不會(huì)影響解釋變量的系數(shù),只會(huì)影響截距項(xiàng)。2、隨機(jī)擾動(dòng)項(xiàng)正態(tài)性假設(shè)普通可以成立,就算不成立,在大樣本下也會(huì)近似成立的。所以不討論此假定能否違背。不滿足根本假定的情形〔2〕3、解釋變量之間相關(guān)=>多重共線4、隨機(jī)擾動(dòng)項(xiàng)相關(guān)=>序列自相關(guān)時(shí)間序列數(shù)據(jù)經(jīng)常出現(xiàn)序列相關(guān)5、隨機(jī)擾動(dòng)項(xiàng)方差不等于常數(shù)=>異方差截面數(shù)據(jù)時(shí),經(jīng)常出現(xiàn)異方差處理問(wèn)題的思緒1、定義違反各個(gè)根本假定的根本概念2、違反根本假定的緣由、背景3、診斷根本假定的違反4、違反根本假定的補(bǔ)救措施〔修正〕一、多重共線性的概念對(duì)于模型Yi=0+1X1i+2X2i++kXki+ii=1,2,…,n其根本假設(shè)之一是解釋變量是相互獨(dú)立的。假設(shè)某兩個(gè)或多個(gè)解釋變量之間出現(xiàn)了相關(guān)性,那么稱為多重共線性(Multicollinearity)。假設(shè)存在c1X1i+c2X2i+…+ckXki=0i=1,2,…,n其中:ci不全為0,那么稱為解釋變量間存在完全共線性〔perfectmulticollinearity〕。假設(shè)存在c1X1i+c2X2i+…+ckXki+vi=0i=1,2,…,n其中ci不全為0,vi為隨機(jī)誤差項(xiàng),那么稱為近似共線性〔approximatemulticollinearity〕或交相互關(guān)(intercorrelated)。在矩陣表示的線性回歸模型

Y=X+

中,完全共線性指:秩(X)<k+1,即中,至少有一列向量可由其他列向量〔不包括第一列〕線性表出。如:X2=X1,那么X2對(duì)Y的作用可由X1替代。二、實(shí)踐經(jīng)濟(jì)問(wèn)題中的多重共線性普通地,產(chǎn)生多重共線性的主要緣由有以下三個(gè)方面:〔1〕經(jīng)濟(jì)變量相關(guān)的共同趨勢(shì)時(shí)間序列樣本:經(jīng)濟(jì)昌盛時(shí)期,各根本經(jīng)濟(jì)變量〔收入、消費(fèi)、投資、價(jià)錢(qián)〕都趨于增長(zhǎng);衰退時(shí)期,又同時(shí)趨于下降。

〔2〕滯后變量的引入在經(jīng)濟(jì)計(jì)量模型中,往往需求引入滯后經(jīng)濟(jì)變量來(lái)反映真實(shí)的經(jīng)濟(jì)關(guān)系。例如,消費(fèi)=f(當(dāng)期收入,前期收入〕顯然,兩期收入間有較強(qiáng)的線性相關(guān)性。橫截面數(shù)據(jù):消費(fèi)函數(shù)中,資本投入與勞動(dòng)力投入往往出現(xiàn)高度相關(guān)情況,大企業(yè)二者都大,小企業(yè)都小?!?〕樣本資料的限制由于完全符合實(shí)際模型所要求的樣本數(shù)據(jù)較難搜集,特定樣本能夠存在某種程度的多重共線性。普通閱歷:時(shí)間序列數(shù)據(jù)樣本:簡(jiǎn)單線性模型,往往存在多重共線性。截面數(shù)據(jù)樣本:?jiǎn)栴}不那么嚴(yán)重,但多重共線性依然是存在的。三、多重共線性的后果1.完全共線性下參數(shù)估計(jì)量不存在假設(shè)存在完全共線性,那么(X’X)-1不存在,無(wú)法得到參數(shù)的估計(jì)量。的OLS估計(jì)量為:例:對(duì)離差方式的二元回歸模型假設(shè)兩個(gè)解釋變量完全相關(guān),如x2=x1,那么這時(shí),只能確定綜合參數(shù)1+2的估計(jì)值:2.近似共線性下OLS估計(jì)量非有效近似共線性下,可以得到OLS參數(shù)估計(jì)量,但參數(shù)估計(jì)量方差的表達(dá)式為由于|X’X|0,引起(X’X)-1主對(duì)角線元素較大,使參數(shù)估計(jì)值的方差增大,OLS參數(shù)估計(jì)量非有效。仍以二元線性模型y=1x1+2x2+為例:恰為X1與X2的線性相關(guān)系數(shù)的平方r2由于r21,故1/(1-r2)1多重共線性使參數(shù)估計(jì)值的方差增大,1/(1-r2)為方差膨脹因子(VarianceInflationFactor,VIF)當(dāng)完全不共線時(shí),r2=0當(dāng)近似共線時(shí),0<r2<1當(dāng)完全共線時(shí),r2=1,3.參數(shù)估計(jì)量經(jīng)濟(jì)含義不合理假設(shè)模型中兩個(gè)解釋變量具有線性相關(guān)性,例如X2=X1,這時(shí),X1和X2前的參數(shù)1、2并不反映各自與被解釋變量之間的構(gòu)造關(guān)系,而是反映它們對(duì)被解釋變量的共同影響。1、2曾經(jīng)失去了應(yīng)有的經(jīng)濟(jì)含義,于是經(jīng)常表現(xiàn)出似乎反常的景象:例如1本來(lái)應(yīng)該是正的,結(jié)果恰是負(fù)的。4.變量的顯著性檢驗(yàn)失去意義存在多重共線性時(shí)參數(shù)估計(jì)值的方差與規(guī)范差變大容易使經(jīng)過(guò)樣本計(jì)算的t值小于臨界值,誤導(dǎo)作出參數(shù)為0的推斷能夠?qū)⒅匾慕忉屪兞颗懦谀P椭?.模型的預(yù)測(cè)功能失效變大的方差容易使區(qū)間預(yù)測(cè)的“區(qū)間〞變大,使預(yù)測(cè)失去意義。留意:除非是完全共線性,多重共線性并不意味著任何根本假設(shè)的違背;因此,即使出現(xiàn)較高程度的多重共線性,OLS估計(jì)量仍具有線性性等良好的統(tǒng)計(jì)性質(zhì)。問(wèn)題在于,即使OLS法仍是最好的估計(jì)方法,它卻不是“完美的〞,尤其是在統(tǒng)計(jì)推斷上無(wú)法給出真正有用的信息。多重共線性檢驗(yàn)的義務(wù)是:〔1〕檢驗(yàn)多重共線性能否存在;〔2〕估計(jì)多重共線性的范圍,即判別哪些變量之間存在共線性。多重共線性表現(xiàn)為解釋變量之間具有相關(guān)關(guān)系,所以用于多重共線性的檢驗(yàn)方法主要是統(tǒng)計(jì)方法:如斷定系數(shù)檢驗(yàn)法、逐漸回歸檢驗(yàn)法等。四、多重共線性的檢驗(yàn)1.檢驗(yàn)多重共線性能否存在(1)對(duì)兩個(gè)解釋變量的模型,采用簡(jiǎn)單相關(guān)系數(shù)法求出X1與X2的簡(jiǎn)單相關(guān)系數(shù)r,假設(shè)|r|接近1,那么闡明兩變量存在較強(qiáng)的多重共線性。(2)對(duì)多個(gè)解釋變量的模型,采用綜合統(tǒng)計(jì)檢驗(yàn)法假設(shè)在OLS法下:R2與F值較大,但t檢驗(yàn)值較小,闡明各解釋變量對(duì)Y的結(jié)合線性作用顯著,但各解釋變量間存在共線性而使得它們對(duì)Y的獨(dú)立作用不能分辨,故t檢驗(yàn)不顯著。即R2較大但t值顯著的不多。另外判別參數(shù)估計(jì)值的符號(hào),假設(shè)不符合經(jīng)濟(jì)實(shí)際或?qū)嵺`情況,能夠存在多重共線性。2.判明存在多重共線性的范圍假設(shè)存在多重共線性,需進(jìn)一步確定終究由哪些變量引起。(1)斷定系數(shù)檢驗(yàn)法使模型中每一個(gè)解釋變量分別以其他解釋變量為解釋變量進(jìn)展回歸,并計(jì)算相應(yīng)的擬合優(yōu)度。假設(shè)某一種回歸:Xji=1X1i+2X2i+LXLi的斷定系數(shù)較大,闡明Xj與其他X間存在共線性。詳細(xì)可進(jìn)一步對(duì)上述回歸方程作F檢驗(yàn):式中:Rj?2為第j個(gè)解釋變量對(duì)其他解釋變量的回歸方程的決議系數(shù),構(gòu)造如下F統(tǒng)計(jì)量在模型中排除某一個(gè)解釋變量Xj,估計(jì)模型;假設(shè)擬合優(yōu)度與包含Xj時(shí)非常接近,那么闡明Xj與其它解釋變量之間存在共線性。另一等價(jià)的檢驗(yàn)是:假設(shè)存在較強(qiáng)的共線性,那么Rj?2較大且接近于1,這時(shí)〔1-Rj?2〕較小,從而Fj的值較大。因此,給定顯著性程度,計(jì)算F值,并與相應(yīng)的臨界值比較,來(lái)斷定能否存在相關(guān)性。(2)逐漸回歸法以Y為被解釋變量,逐個(gè)引入解釋變量,構(gòu)成回歸模型,進(jìn)展模型估計(jì)。根據(jù)擬合優(yōu)度的變化決議新引入的變量能否獨(dú)立。假設(shè)擬合優(yōu)度變化顯著,那么闡明新引入的變量是一個(gè)獨(dú)立解釋變量;假設(shè)擬合優(yōu)度變化很不顯著,那么闡明新引入的變量與其它變量之間存在共線性關(guān)系。找出引起多重共線性的解釋變量,將它排除。以逐漸回歸法得到最廣泛的運(yùn)用。留意:這時(shí),剩余解釋變量參數(shù)的經(jīng)濟(jì)含義和數(shù)值都發(fā)生了變化。假設(shè)模型被檢驗(yàn)證明存在多重共線性,那么需求開(kāi)展新的方法估計(jì)模型,最常用的方法有三類(lèi)。五、抑制多重共線性的方法1.第一類(lèi)方法:排除引起共線性的變量剔除變量與設(shè)定偏誤面對(duì)嚴(yán)重多重共線性,最簡(jiǎn)單的做法之一是剔除共線性諸變量之一,但是從模型中刪除一個(gè)變量,能夠?qū)е略O(shè)定偏誤或設(shè)定誤差。也就是說(shuō)在分析中運(yùn)用了不正確設(shè)定的模型。由上面的討論可見(jiàn),從模型中除掉一個(gè)變量以緩解多重共線性的問(wèn)題會(huì)導(dǎo)致設(shè)定上的偏誤,因此在某些情形中,治療也許比疾病更糟糕,多重共線性雖然有礙于對(duì)模型參數(shù)的準(zhǔn)確估計(jì),但是剔除變量,那么對(duì)參數(shù)的真值有嚴(yán)重的誤導(dǎo),應(yīng)該記得,在近似共線性情形下,OLS估計(jì)量仍是BLUE。2.第二類(lèi)方法:差分法時(shí)間序列數(shù)據(jù)、線性模型:將原模型變換為差分模型:Yi=1X1i+2X2i++kXki+i可以有效地消除原模型中的多重共線性。普通講,增量之間的線性關(guān)系遠(yuǎn)比總量之間的線性關(guān)系弱得多。例如:在中國(guó)消費(fèi)模型中的2個(gè)變量:由表中的比值可以直觀地看到,兩變量增量的線性關(guān)系弱于總量之間的線性關(guān)系。進(jìn)一步分析:Y與C(-1)之間的相關(guān)系數(shù)為0.9845,△Y與△C(-1)之間的相關(guān)系數(shù)為0.7456。普通以為:兩個(gè)變量之間的相關(guān)系數(shù)大于0.8時(shí),二者之間存在線性關(guān)系。所以,原模型經(jīng)檢驗(yàn)地被以為具有多重共線性,而差分模型那么可以為不具有多重共線性。3.第三類(lèi)方法:減小參數(shù)估計(jì)量的方差多重共線性的主要后果是參數(shù)估計(jì)量具有較大的方差,所以采取適當(dāng)方法減小參數(shù)估計(jì)量的方差,雖然沒(méi)有消除模型中的多重共線性,但確能消除多重共線性呵斥的后果。

例如:添加樣本容量,可使參數(shù)估計(jì)量的方差減小。4.變量變換銷(xiāo)量出廠價(jià)錢(qián)市場(chǎng)價(jià)錢(qián)高度相關(guān)市場(chǎng)總供應(yīng)量相對(duì)價(jià)錢(qián)5.用被解釋變量的滯后值替代解釋變量的滯后值個(gè)人消費(fèi)現(xiàn)期收入前期收入高度相關(guān)線性關(guān)系較弱6.利用先驗(yàn)信息改動(dòng)約束方式先驗(yàn)信息:在此之前的研討成果所提供的信息。利用某些先驗(yàn)信息,可以把有共線性的變量組合成新的變量,從而消除共線性。如其中Y=消費(fèi),X2=收入X3=財(cái)富。由于收入與財(cái)富有高度共線的趨勢(shì),假設(shè)先驗(yàn)以為那么代入消去利用先驗(yàn)信息改動(dòng)約束方式高度相關(guān)知α+β=1,即規(guī)模報(bào)酬不變,那么將β=1-α代入7.截面數(shù)據(jù)和時(shí)序數(shù)據(jù)結(jié)合有時(shí)在時(shí)間序列數(shù)據(jù)中多重共線性嚴(yán)重的變量,在截面數(shù)據(jù)中不一定有嚴(yán)重的共線性。在假定截面數(shù)據(jù)估計(jì)出的參數(shù)在時(shí)間序列數(shù)據(jù)中變化不大的前提下,可先用截面數(shù)據(jù)估計(jì)出一些變量的參數(shù),再代入原模型估計(jì)另一些變量的參數(shù)。例:銷(xiāo)量與商品價(jià)錢(qián)、消費(fèi)者收入。六、案例一——中國(guó)糧食消費(fèi)函數(shù)根據(jù)實(shí)際和閱歷分析,影響糧食消費(fèi)〔Y〕的主要要素有:農(nóng)業(yè)化肥施用量〔X1〕糧食播種面積(X2)成災(zāi)面積(X3)農(nóng)業(yè)機(jī)械總動(dòng)力(X4)農(nóng)業(yè)勞動(dòng)力(X5)知中國(guó)糧食消費(fèi)的相關(guān)數(shù)據(jù),建立中國(guó)糧食消費(fèi)函數(shù):Y=0+1X1+2X2+3X3+4X4+4X5+1.用OLS法估計(jì)上述模型:R2接近于1;給定=5%,得F臨界值F0.05(5,12)=3.11F=638.4>15.19,故認(rèn)上述糧食消費(fèi)的總體線性關(guān)系顯著成立。但X4、X5的參數(shù)未經(jīng)過(guò)t檢驗(yàn),且符號(hào)不正確,故解釋變量間能夠存在多重共線性。T=(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)2.檢驗(yàn)簡(jiǎn)單相關(guān)系數(shù)發(fā)現(xiàn):X1與X4間存在高度相關(guān)性。列出X1,X2,X3,X4,X5的相關(guān)系數(shù)矩陣:3.找出最簡(jiǎn)單的回歸方式可見(jiàn),應(yīng)選第一個(gè)式子為初始的回歸模型。分別作Y與X1,X2,X4,X5間的回歸:(25.58)(11.49)R2=0.8919F=132.1DW=1.56(-0.49)(1.14)R2=0.075F=1.30DW=0.12(17.45)(6.68)R2=0.7527F=48.7DW=1.11(-1.04)(2.66)R2=0.3064F=7.07DW=

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論