理學(xué)多重共線性_第1頁
理學(xué)多重共線性_第2頁
理學(xué)多重共線性_第3頁
理學(xué)多重共線性_第4頁
理學(xué)多重共線性_第5頁
已閱讀5頁,還剩71頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

會計(jì)學(xué)1理學(xué)多重共線性回顧6項(xiàng)基本假定(1)解釋變量間不相關(guān)(無多重共線性)(2)E(ui)=0(隨機(jī)項(xiàng)均值為零)

(3)Var(ui)=2(同方差)

(4)Cov(ui,uj)=0(隨機(jī)項(xiàng)無自相關(guān))(5)Cov(X,ui)=0(隨機(jī)項(xiàng)與解釋變量X不相關(guān))(6)隨機(jī)擾動項(xiàng)服從正態(tài)分布。up第1頁/共76頁1.線性特征

是的線性函數(shù)

2.無偏特性

3.最小方差特性

在所有的線性無偏估計(jì)中,OLS估計(jì)具有最小方差結(jié)論:在古典假定條件下,OLS估計(jì)式是最佳線性無偏估計(jì)式(BLUE)

OLS估計(jì)式的統(tǒng)計(jì)性質(zhì)——高斯定理up第2頁/共76頁不滿足基本假定的情形1、解釋變量之間相關(guān)=>多重共線2、隨機(jī)擾動項(xiàng)方差不等于常數(shù)=>異方差截面數(shù)據(jù)時,經(jīng)常出現(xiàn)異方差3、隨機(jī)擾動項(xiàng)相關(guān)=>序列自相關(guān)時間序列數(shù)據(jù)經(jīng)常出現(xiàn)序列相關(guān)第3頁/共76頁解決問題的思路?1、定義違反各個基本假定的基本概念?2、違反基本假定的原因、后果?3、違反基本假定的檢驗(yàn)?4、違反基本假定的補(bǔ)救措施up第4頁/共76頁?什么是多重共線性?多重共線性產(chǎn)生的后果(1)?多重共線性的檢驗(yàn)?多重共線性的補(bǔ)救措施(2)

案例分析

本章小結(jié)本章討論第四章多重共線性第5頁/共76頁第一節(jié)什么是多重共線性兩個實(shí)例例1:某地區(qū)為研究不同家庭的消費(fèi)Y與收入X2的關(guān)系,在此基礎(chǔ)上,還引進(jìn)了消費(fèi)者家庭財(cái)富狀況X3作為第二個解釋變量。回歸方程為:SE=(6.7525)(0.8229)(0.0807)

t=(3.6690)(1.1442)(-0.5261)

F=92.4020

=24.7747+0.9415X2-0.0424*X3

(1)第6頁/共76頁消費(fèi)支出、收入和財(cái)富的截面數(shù)據(jù)

單位:美元消費(fèi)支出收入財(cái)富7080810651001009901201273951401425110160163311518018761202002052140220220115524024351502602686第7頁/共76頁這一回歸結(jié)果說明什么?可決系數(shù)和修正可決系數(shù)都很理想F統(tǒng)計(jì)量高度顯著,說明X1、X2聯(lián)合對Y的影響顯著各變量參數(shù)的t檢驗(yàn)都不顯著,不能否定等于零的假設(shè)財(cái)產(chǎn)變量的系數(shù)竟然與預(yù)期的符號相反。第8頁/共76頁僅對Y和X2的回歸,看會出現(xiàn)什么情況:

Y=24.4545+0.5091X2

(2)

(6.4138)(0.0357)

(3.8128)(14.2432)

在二元線性模型(1)中,收入變量是統(tǒng)計(jì)上不顯著的,而在現(xiàn)在的一元線性模型(2)中則是高度顯著的。同樣,我們做對Y和X3的回歸

Y=24.411+0.0498X3

(3)

(6.874)(0.0037)

(3.551)(13.29)

我們看到財(cái)富現(xiàn)在對消費(fèi)支出也有顯著的影響第9頁/共76頁再比如課本例題

發(fā)展農(nóng)業(yè)和建筑業(yè)會減少財(cái)政收入嗎?

為了分析各主要因素對財(cái)政收入的影響,建立財(cái)政收入模型:其中:CS財(cái)政收入(億元);NZ農(nóng)業(yè)增加值(億元);GZ工業(yè)增加值(億元);JZZ建筑業(yè)增加值(億元);TPOP總?cè)丝?萬人);CUM最終消費(fèi)(億元);SZM受災(zāi)面積(萬公頃)數(shù)據(jù)樣本時期1978年-2007年采用普通最小二乘法得到以下估計(jì)結(jié)果第10頁/共76頁

●可決系數(shù)為0.989654,校正的可決系數(shù)為0.986955,模型擬合很好。模型對財(cái)政收入的解釋程度高達(dá)98.7%?!馞統(tǒng)計(jì)量為366.6801,說明0.05水平下回歸方程整體上顯著。●t檢驗(yàn)結(jié)果表明,除了農(nóng)業(yè)增加值、建筑業(yè)增加值以外,其他因素對財(cái)政收入影響均不顯著。●農(nóng)業(yè)增加值的回歸系數(shù)是負(fù)數(shù)。

農(nóng)業(yè)的發(fā)展反而會使財(cái)政收入減少嗎?!

這樣的異常結(jié)果顯然與理論分析和實(shí)踐經(jīng)驗(yàn)不相符。若模型設(shè)定和數(shù)據(jù)真實(shí)性沒問題,問題出在哪里呢?模型估計(jì)與檢驗(yàn)結(jié)果分析第11頁/共76頁一.多重共線性的概念多重共線性:在多元線性回歸模型中,解釋變量之間存在著完全的線性關(guān)系或接近的線性關(guān)系完全多重共線性近似多重共線性第12頁/共76頁不存在多重共線性只說明解釋變量之間沒有線性關(guān)系,而不排除他們之間存在某種非線性關(guān)系

第13頁/共76頁1、經(jīng)濟(jì)變量的共同變化趨勢

許多經(jīng)濟(jì)變量在隨時間的變化過程中往往存在共同的變動趨勢。這就使得它們之間容易產(chǎn)生多重共線性。例如在經(jīng)濟(jì)繁榮時期,收入、消費(fèi)、儲蓄、投資、就業(yè)都趨向于增長;在經(jīng)濟(jì)衰退時期,都趨向于下降。如果將這些變量作為解釋變量同時引入模型,則它們之間極有可能存在很強(qiáng)的相關(guān)性。

二、產(chǎn)生多重共線性的原因第14頁/共76頁2、模型中采用滯后變量

例如:在計(jì)量經(jīng)濟(jì)模型中,往往需要引入滯后變量來反映真實(shí)的經(jīng)濟(jì)關(guān)系。

例如,消費(fèi)=f(當(dāng)期收入,前期收入)顯然,兩期收入間有較強(qiáng)的線性相關(guān)性。第15頁/共76頁3、用截面數(shù)據(jù)建立模型也可能出現(xiàn)多重共線性比如建立企業(yè)生產(chǎn)函數(shù)模型,以產(chǎn)出量為解釋變量,選擇資本、勞動、技術(shù)等投入要素為解釋變量。而這些投入要素的數(shù)量往往與產(chǎn)出量呈正比,產(chǎn)出量高的企業(yè),投入的各種要素都比較多,這就使得投入要素之間出現(xiàn)線性相關(guān)性。

第16頁/共76頁一般來講,解釋變量之間存在多重共線性是難以避免的,所以在多元線性回歸模型中,我們關(guān)心的并不是多重共線性的有無,而是多重共線性的程度。當(dāng)多重共線性程度過高時,給最小二乘估計(jì)量帶來嚴(yán)重的后果。因此,我們追求的也是使多重共線性的程度盡可能地減弱。up第17頁/共76頁第二節(jié)多重共線性產(chǎn)生的后果

一、完全多重共線性下的后果二、不完全多重共線性下的后果up第18頁/共76頁1、參數(shù)估計(jì)值不確定一、完全多重共線性下的后果例:以二元線性回歸模型為例第19頁/共76頁EVIEWS遇到完全多重共線性時,會顯示Nearsingularmatrix,無法進(jìn)行估計(jì)第20頁/共76頁2、參數(shù)估計(jì)值的方差無限大即:up第21頁/共76頁1、估計(jì)量的方差增大由于1/(1-r2)稱為方差膨脹因子(VarianceInflatingFactor),記成VIF。方差膨脹因子二、不完全多重共線性下的后果第22頁/共76頁2.t檢驗(yàn)容易作出錯誤的判斷3.可能造成可決系數(shù)較高,但對各個參數(shù)單獨(dú)的t檢驗(yàn)卻可能不顯著,甚至可能使估計(jì)的回歸系數(shù)符號相反,得出完全錯誤的結(jié)論。

up第23頁/共76頁練習(xí)題4.5從模型擬合結(jié)果可知,樣本觀測個數(shù)為27,消費(fèi)模型的判定系數(shù),F(xiàn)統(tǒng)計(jì)量為107.37,在0.05置信水平下查分子自由度為3,分母自由度為23的F臨界值為3.028,計(jì)算的F值遠(yuǎn)大于臨界值,表明回歸方程是顯著的。模型整體擬合程度較高。依據(jù)參數(shù)估計(jì)量及其標(biāo)準(zhǔn)誤,可計(jì)算出各回歸系數(shù)估計(jì)量的t統(tǒng)計(jì)量值:第24頁/共76頁除t1外,其余的t值都很小。工資收入X1的系數(shù)的t檢驗(yàn)值雖然顯著,但該系數(shù)的估計(jì)值過大,該值為工資收入對消費(fèi)邊際效應(yīng),因?yàn)樗鼮?.059,意味著工資收入每增加一美元,消費(fèi)支出的增長平均將超過一美元,這與經(jīng)濟(jì)理論和常識不符。另外,理論上非工資—非農(nóng)業(yè)收入與農(nóng)業(yè)收入也是消費(fèi)行為的重要解釋變量,但兩者的t檢驗(yàn)都沒有通過。這些跡象表明,模型中存在嚴(yán)重的多重共線性,不同收入部分之間的相互關(guān)系,掩蓋了各個部分對解釋消費(fèi)行為的單獨(dú)影響。up第25頁/共76頁習(xí)題第26頁/共76頁第27頁/共76頁第28頁/共76頁up第29頁/共76頁

第三節(jié)多重共線性的檢驗(yàn)一、簡單相關(guān)系數(shù)檢驗(yàn)法二、方差膨脹因子三、綜合判斷法四、逐步回歸檢測法up第30頁/共76頁一、簡單相關(guān)系數(shù)檢驗(yàn)法

含義:簡單相關(guān)系數(shù)檢驗(yàn)法是利用解釋變量之間的線性相關(guān)程度去判斷是否存在嚴(yán)重多重共線性的一種簡便方法。判斷規(guī)則:一般而言,如果每兩個解釋變量的簡單相關(guān)系數(shù)(零階相關(guān)系數(shù))比較高,例如大于0.8,則可認(rèn)為存在著較嚴(yán)重的多重共線性。第31頁/共76頁例如(例1)Quick—groupstatistics--correlationX1 X2X1 1 0.999X2 0.999 1說明X1 、X2近似完全線性關(guān)系。可以判定模型存在嚴(yán)重的多重共線性第32頁/共76頁NZGZJZZTPOPCUMSZMNZ

1.000

0.981

0.982

0.946

0.985

0.590GZ

0.981

1.000

0.999

0.904

0.999

0.570JZZ

0.982

0.999

1.000

0.904

0.998

0.567TPOP

0.946

0.904

0.904

1.000

0.917

0.639CUM

0.985

0.999

0.998

0.917

1.000

0.575SZM

0.570

0.570

0.567

0.639

0.575

1.000例如(引子)第33頁/共76頁

注意:

較高的簡單相關(guān)系數(shù)只是多重共線性存在的充分條件,而不是必要條件。特別是在多于兩個解釋變量的回歸模型中,有時較低的簡單相關(guān)系數(shù)也可能存在多重共線性。因此并不能簡單地依據(jù)相關(guān)系數(shù)進(jìn)行多重共線性的準(zhǔn)確判斷。第34頁/共76頁up第35頁/共76頁二、方差膨脹因子在二元回歸模型中,VIF表明:當(dāng)x1、x2高度相關(guān)時(r12→1),VIF→+∞;OLS估計(jì)量的方差將成倍增長,直至趨于無窮大。經(jīng)驗(yàn):VIF<5,存在輕度的多重共線性5≤VIF<10,存在較重的多重共線性VIF≥10,存在嚴(yán)重的多重共線性

第36頁/共76頁多元中VIF怎么表示呢VIFi=1/(1-Ri2)其中Ri2表示第i個解釋變量用其他解釋變量輔助線性回歸的可決系數(shù)VIF方法直觀,但是Eviews不能直接計(jì)算VIF的數(shù)值。需要逐個進(jìn)行回歸,較為麻煩。up第37頁/共76頁三、綜合判斷法

另外判斷參數(shù)估計(jì)值的符號,如果不符合經(jīng)濟(jì)理論或?qū)嶋H情況,可能存在多重共線性。up第38頁/共76頁四、逐步回歸檢測法

逐步回歸的基本思想將變量逐個的引入模型,每引入一個解釋變量后,都要進(jìn)行F檢驗(yàn),并對已經(jīng)選入的解釋變量逐個進(jìn)行t檢驗(yàn),當(dāng)原來引入的解釋變量由于后面解釋變量的引入而變得不再顯著時,則將其剔除。以確保每次引入新的變量之前回歸方程中只包含顯著的變量。在逐步回歸中,高度相關(guān)的解釋變量,在引入時會被剔除。因而也是一種檢測多重共線性的有效方法。up第39頁/共76頁第四節(jié)多重共線性的補(bǔ)救措施一、刪除不重要的解釋變量二、增加樣本容量三、利用差分變換四、利用先驗(yàn)信息五、數(shù)據(jù)的結(jié)合六、逐步回歸法up第40頁/共76頁二、增加樣本容量建模時樣本數(shù)據(jù)太少,易產(chǎn)生多重共線性。例如,二元線性回歸模型up第41頁/共76頁先驗(yàn)信息:在此之前的研究成果所提供的信息。利用某些先驗(yàn)信息,將信息重疊的一些變量合為一個變量,從而消除共線性。例如建立模型為:Y=a0+a1X1+a2X2+u此時發(fā)現(xiàn)被解釋變量存在多重共線性,且根據(jù)資料可得到a1=1/4a2,如何解決多重共線性?四、利用先驗(yàn)信息up第42頁/共76頁例如,對國民經(jīng)濟(jì)生產(chǎn)函數(shù)研究,建立回歸方程:若通過經(jīng)濟(jì)理論分析或經(jīng)驗(yàn)判斷可認(rèn)為該經(jīng)濟(jì)系統(tǒng)存在規(guī)模效益不變的特征,即有上述回歸模型就轉(zhuǎn)變?yōu)椋旱?3頁/共76頁

即可將Y對L和K的二元雙對數(shù)線性回歸模型轉(zhuǎn)化為勞動生產(chǎn)率(資本產(chǎn)出率)Y/L對勞動資本裝備程度(勞動對資本的投入率)K/L的一元雙對數(shù)線性回歸模型,避免了多重共線性的影響。

up第44頁/共76頁五、數(shù)據(jù)的結(jié)合

如果經(jīng)濟(jì)計(jì)量建模利用的是時間序列數(shù)據(jù)(又存在多重共線性),可考慮用時間序列數(shù)據(jù)與截面數(shù)據(jù)相結(jié)合的辦法來修正多重共性的影響up第45頁/共76頁三、利用差分變換

一般講,增量之間的線性關(guān)系遠(yuǎn)比總量之間的線性關(guān)系弱得多。則模型變化為up第46頁/共76頁六、逐步回歸法

首先,用因變量Y對每一個解釋變量Xi分別進(jìn)行回歸,從中確定一個基本回歸方程。然后,逐一引入其它解釋變量,重新再作回歸,逐步擴(kuò)大模型的規(guī)模。

第47頁/共76頁引入每個新變量之后,如果1)擬合優(yōu)度得以改進(jìn)(提高),而且每個參數(shù)統(tǒng)計(jì)檢驗(yàn)顯著,則引入的變量保留;

2)擬合優(yōu)度無明顯提高甚至下降,對其他參數(shù)無明顯影響,則舍棄該變量.3)擬合優(yōu)度提高,但方程內(nèi)其他參數(shù)的符號和數(shù)值明顯變化,可以肯定產(chǎn)生了嚴(yán)重多重共線性。第48頁/共76頁注意:這時對于3),需考察變量間線性相關(guān)的形式和程度,經(jīng)過經(jīng)濟(jì)意義的綜合權(quán)衡,在線性相關(guān)程度最高的兩個變量中,略去其中對因變量影響較小,經(jīng)濟(jì)意義相對次要的一個,保留影響較大,經(jīng)濟(jì)意義相對重要的一個。此時不宜輕率舍去新引入變量,否則會造成模型設(shè)定偏誤和隨機(jī)項(xiàng)與解釋變量相關(guān)的后果。up第49頁/共76頁一、刪除不重要的解釋變量up第50頁/共76頁習(xí)題第51頁/共76頁二、判斷題

1、盡管有完全的多重共線性,OLS估計(jì)量仍然是最優(yōu)線性無偏估計(jì)量。2、在高度多重共線的情形中,要評價一個或多個偏回歸系數(shù)的個別顯著性是不可能的。3、如果有某一輔助回歸顯示出高的值,則高度共線性的存在是肯定無疑的了。4、變量的兩兩高度相關(guān)并不表示高度多重共線性。第52頁/共76頁5、在多元回歸中,根據(jù)通常的t檢驗(yàn),每個參數(shù)都是統(tǒng)計(jì)上不顯著的,你就不會得到一個高的值。6、變量不存在兩兩高度相關(guān)表示不存在高度多重共線性。7、多重共線性的存在降低OLS估計(jì)的方差。8.多重共線性問題是隨機(jī)擾動項(xiàng)違背古典假定引起的。第53頁/共76頁第54頁/共76頁第55頁/共76頁回答下列問題(1)請根據(jù)上表中已由數(shù)據(jù),填寫表中畫線處缺失結(jié)果(注意給出計(jì)算步驟);(2)模型是否存在多重共線性?為什么?up第56頁/共76頁

第五節(jié)案例分析一、研究的目的要求提出研究的問題——為了規(guī)劃中國未來國內(nèi)旅游產(chǎn)業(yè)的發(fā)展,需要定量地分析影響中國國內(nèi)旅游市場發(fā)展的主要因素。二、模型設(shè)定及其估計(jì)影響因素分析與確定——影響因素主要有國內(nèi)旅游人數(shù),城鎮(zhèn)居民人均旅游支出,農(nóng)村居民人均旅游支出,并以公路里程次和鐵路里程

作為相關(guān)基礎(chǔ)設(shè)施的代表

理論模型的設(shè)定其中:——第t年全國國內(nèi)旅游收入第57頁/共76頁數(shù)據(jù)的收集與處理年份國內(nèi)旅游收入Y國內(nèi)旅游人數(shù)X2城鎮(zhèn)居民人均旅游花費(fèi)X3農(nóng)村居民人均旅游花費(fèi)X4公路里程X5鐵路里程X619941023.552400414.754.9111.785.919951375.76290046461.5115.75.9719961638.463900534.170.5118.586.4919972112.764400599.8145.7122.646.619982391.269450607197127.856.6419992831.971900614.8249.5135.176.7420003175.574400678.6226.6140.276.8720013522.478400708.3212.7169.87.0120023878.487800739.7209.1176.527.1920033442.387000684.9200180.987.320044710.7110200731.8210.2187.077.4420055285.9121200737.1227.6193.057.5420066229.74139400766.4221.9345.77.7120077770.62161000906.9222.5358.377.8第58頁/共76頁該模型,可決系數(shù)很高,F(xiàn)檢驗(yàn)值593.4168,明顯顯著。但是當(dāng)時、不僅、系數(shù)的t檢驗(yàn)不顯著,而且系數(shù)的符號與預(yù)期的相反,這表明很可能存在嚴(yán)重的多重共線性。OLS法估計(jì)的結(jié)果第59頁/共76頁計(jì)算各解釋變量的相關(guān)系數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論