第八章 多重共線性:解釋變量相關(guān)會有什么后果.ppt_第1頁
第八章 多重共線性:解釋變量相關(guān)會有什么后果.ppt_第2頁
第八章 多重共線性:解釋變量相關(guān)會有什么后果.ppt_第3頁
第八章 多重共線性:解釋變量相關(guān)會有什么后果.ppt_第4頁
第八章 多重共線性:解釋變量相關(guān)會有什么后果.ppt_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二部分,回歸分析在實踐中,基本假設(shè)的違背:基本假設(shè)不滿足的情況。(1)模型設(shè)置有錯誤;所選模型設(shè)置正確。(2)解釋變量之間存在多重共線性。(3)隨機誤差序列具有異方差性;(4)隨機誤差序列中存在序列相關(guān)性。所選模型設(shè)置正確,解釋變量之間沒有完美的線性關(guān)系,誤差項的方差是常數(shù),誤差項之間沒有相關(guān)性?;炯僭O(shè),基本假設(shè),基本假設(shè),基本假設(shè),第8章多重共線性,多重共線性,1。多重共線性的性質(zhì)。多重共線性的實際后果。多重共線性的診斷??朔嘀毓簿€性的方法。案件。1.多重共線性的性質(zhì):1。完全多重共線性;2.近似(不完全)多重共線性。對于模型yi=0 1x1i2x2i kxki I=1,2,n,其基本

2、假設(shè)之一是解釋變量相互獨立。如果兩個或多個解釋變量之間存在相關(guān)性,則稱為多重共線性。完全共線性很少見,但一般在一定程度上是共線性,即近似共線性。一個奇怪的模式,商店銷售=B1營業(yè)區(qū)B2店員號B3店租金B(yǎng)4宣傳費用ui為什么奇怪?用這種方式來解釋事物,以及生產(chǎn)函數(shù)的多重共線性,與其說是“解釋”,不如說是“蠱惑”。如果技術(shù)保持不變,勞動力和資本投資將會是相等的比例。例如,每增加一臺縫紉機,就必須增加一名工人。此時,輸入完全共線,也就是說,它們以相等的比例變化。在多渠道廣告中,不可能區(qū)分銷售變化來自哪種廣告形式。各種廣告形式之間往往存在共線性。為什么我們不能容忍多重共線性?模型中的變量違背常識。例如

3、,一些積極因素已經(jīng)被“計算”成消極因素模型,這應(yīng)該盡可能簡單。奧卡姆剃刀:如果它是不必要的,不要添加實體,并產(chǎn)生多重共線性。背景經(jīng)濟變量有一個共同的變化趨勢。哲學觀點:事物是普遍聯(lián)系的。接觸的程度各不相同。多重共線性經(jīng)常發(fā)生。如果回歸方程中的幾個獨立變量之間有很強的相關(guān)性,這些獨立變量可以相互解釋。我們只能留下一個獨立變量:讓y=x1 x2 c,其中x1=ax2。那么y=ax2 x2 c=(a 1)x2 c模型包含滯后變量,用橫截面數(shù)據(jù)建模也可能導致多重共線性?!把a充產(chǎn)品”和“替代品”的樣本數(shù)據(jù)是有原因的。心理學家的調(diào)查數(shù)據(jù)往往來自大學生,8.1多重共線性的本質(zhì),表8-1,每次x2上升1,x3

4、就會下降2,這是完全的共線性。它們之間的函數(shù)關(guān)系是x3=300-2x2,也就是說,x3中的一列數(shù)字可以被x2完全替換,反之亦然。此時,無法根據(jù)表12-1中的數(shù)據(jù)估算回歸方程。當解釋變量之間存在完全線性相關(guān)或完全多重共線性時,我們不可能獲得所有參數(shù)的唯一估計值。因為我們不能得到他們的唯一估計,所以我們不能根據(jù)某個樣本做出任何統(tǒng)計推斷。在完全多重共線性的情況下,如果解釋變量X1、X2、Xk之間存在線性關(guān)系,則不可能在多元回歸模型中估計和假設(shè)檢驗單個回歸系數(shù)。當變量之間存在線性關(guān)系時,存在不全為零的常數(shù)。這種關(guān)系完全是多重共線性,變量之間的相關(guān)系數(shù)為1。事實上,解釋變量之間往往存在不完全的線性關(guān)系:

5、有些數(shù)字不全為零,其中vi是一個隨機項。解釋變量之間完全或不完全的線性關(guān)系稱為多重共線性。由于經(jīng)濟變量的性質(zhì),多重共線性是強還是弱,這是普遍的。假設(shè)10,8.2接近或不完全多重共線性,在接近或不完全多重共線性的情況下,x4包含x2中的大部分信息,而x2幾乎是完全重復的信息。用這種方法得到的回歸方程很奇怪:總體上有很好的解釋能力,但在每一個解釋變量上都與常識相反。OLS估計量的多重共線性、方差和協(xié)方差、OLS估計量的方差和協(xié)方差的示意圖提供了估計量b的置信度信息。樣本越接近,統(tǒng)計量的變化程度就越小,根據(jù)該樣本估計的參數(shù)就越準確。r23是T XT2值和XT3值之間的相關(guān)系數(shù),是影響b2方差的因素,

6、也是影響誤差項U方差2的因素,OLS估計量的變異程度越大,樣本量越大,OLS估計量的變異程度越小。var(b2)公式中的t很大,分母也很大。var(b2)對均值的變異程度越大,OLS估計量的變異程度越小,X2和X3的相關(guān)系數(shù)越大,b2的方差越大。如果X2和X3完全相關(guān),r23=1,并且var(b2)不能計算,如果c1X1i c2X2i ckXki=0 i=1,2,n,其中: ci不全是0,如果c1X1i c2X2i ckXki vi=0 i=1,2,n,其中ci不全是0,vi是隨機誤差項,1。解釋變量之間存在完美的多重共線性;2.接近/完美/高度多重共線性,不可能獲得所有參數(shù)的唯一估計值,也不

7、可能基于樣本進行任何統(tǒng)計推斷。OLS估計量仍然是最佳線性無偏估計量。注:除非完全共線,多重共線性并不意味著違反基本假設(shè);因此,即使存在高度的多重共線性,OLS估計仍然具有良好的統(tǒng)計特性,例如線性。問題是,即使OLS仍然是最好的估計方法,它也不是“完美的”,特別是它不能給出統(tǒng)計推斷中真正有用的信息。OLS估計仍然是最優(yōu)線性無偏估計,但它不代表單樣本估計的性質(zhì)(如最小方差等)。),多重共線性本質(zhì)上是一種樣本(回歸)現(xiàn)象。當存在不完全多重共線性時,參數(shù)估計的方差和標準差變大,容易使樣本計算的T值小于臨界值,誤導參數(shù)為0的推斷,并可能從模型中排除重要的解釋變量。概念:差異膨脹系數(shù)。根據(jù)P76的第4章,

8、R2增加了b2和b3的方差(或標準差),并增加(或擴大)。1/(1-R2)是方差膨脹因子,VIF),當完全不共線時,R2=0,當近似共線時,R2=0。時間序列樣本:在經(jīng)濟繁榮時期,所有基本經(jīng)濟變量(收入、消費、投資和價格)都趨于增加;在經(jīng)濟衰退期間,它往往會同時下降。橫截面數(shù)據(jù):在生產(chǎn)函數(shù)中,資本投入和勞動力投入高度相關(guān),無論是大企業(yè)還是小企業(yè)。補充:多重共線性的主要原因(理解),(1)與經(jīng)濟變量相關(guān)的共同趨勢,(2)滯后變量的引入。在經(jīng)濟計量模型中,通常需要引入滯后的經(jīng)濟變量來反映真實的經(jīng)濟關(guān)系。例如,消費=f(當前收入,以前的收入)顯然,這兩個時期的收入之間有很強的線性相關(guān)性。(3)樣本數(shù)

9、據(jù)的局限性,由于很難收集到完全符合理論模型要求的樣本數(shù)據(jù),特定樣本中可能存在一定程度的多重共線性。一般經(jīng)驗:時間序列數(shù)據(jù)樣本:簡單的線性模型,通常具有多重共線性。橫斷面數(shù)據(jù)樣本:問題不那么嚴重,但多重共線性仍然存在。8.4多重共線性的實際后果,(1)普通最小二乘估計量的方差和標準差較大,(2)置信區(qū)間較寬,(3)T值不顯著,(4)R2值較高,但T值不完全顯著。(5)普通最小二乘估計量及其標準差對數(shù)據(jù)的微小變化非常敏感,并且往往不穩(wěn)定。(6)回歸系數(shù)的符號是錯誤的(7)很難測量每個解釋變量對回歸平方和或R2的貢獻。在高度共線性的條件下,很難衡量每個解釋變量對整個R2的貢獻。8.5多重共線性的診斷

10、是去相關(guān)。(1)多重共線性是一個程度問題,而不是存在問題。(2)因為多重共線性是在解釋變量是非隨機的假設(shè)下的問題,所以它是樣本的特征,而不是整體的特征。我們不是“檢測多重共線性”,而是測量給定樣本的多重共線性。根據(jù)一些經(jīng)驗規(guī)則,或者在具體的應(yīng)用中,它可以給我們提供一些關(guān)于多重共線性存在的線索,多重共線性的線索1,(1)高R2但沒有很多顯著的t值(2)解釋變量之間的高度成對相關(guān)(3)檢驗偏相關(guān)系數(shù)檢驗偏相關(guān)(4)從屬或輔助回歸,或者輔助回歸,檢驗模型中哪個變量與其他變量高度共線的方法是使每個變量回歸到其他剩余變量并計算相應(yīng)的R2值。多重共線性線索2,(5)方差膨脹因子隨著R22的增加,b2和b3

11、的方差也增加或擴大。方差擴展因子與b2和b3呈線性關(guān)系,單調(diào)遞增。兩個自變量之間的關(guān)系越密切,回歸系數(shù)的變異程度越大。沒有一種測試方法可以完全解決多重共線性問題。沒有簡單的方法來解決這個多重共線性問題。方差擴展因子檢驗經(jīng)驗法則。VIF表示除了Ri之外的所有其他變量加到模型中引起的方差擴展。較大的方差擴展因子表明解釋變量中存在冗余信息。判斷系數(shù)Ri2=0.9,VIF=10,判斷系數(shù)Ri2=0.8,VIF=5。當VIF8或10時,多重共線性被認為是顯著的,并且Xi是冗余變量。如果多個變量的方差擴展因子較大,則方差擴展因子最大的變量是多余的。8.6多重共線性一定不好嗎?如果研究是用模型來預測解釋變量

12、的未來均值,多重共線性本身并不一定是件壞事。如果研究不僅是為了預測,而且是為了可靠地估計所選模型的參數(shù),嚴重的共線性將是一件“壞事”,因為它將導致估計器的標準偏差增加。如果要精確地估計一組系數(shù)(例如,兩個系數(shù)的和或差),那么即使存在多重共線性,也可以達到目的。(2)估計多重共線性的范圍,即判斷哪些變量存在共線性。(1)沒有單一的方法來衡量多重共線性;(2)有一些經(jīng)驗規(guī)則,可以在具體應(yīng)用中為判斷多重共線性的存在提供一些線索。任務(wù):注意:1。對于多解釋變量模型,采用綜合統(tǒng)計檢驗方法。在OLS方法下,如果R2值和F值較大,而T檢驗值較小,說明各解釋變量對Y的聯(lián)合線性效應(yīng)顯著,但解釋變量之間存在共線性

13、,使得它們對Y的獨立效應(yīng)不可區(qū)分,所以T檢驗不顯著。第三,診斷多重共線性時,R2值較高,但解釋變量T值無統(tǒng)計學意義。這是共線性的典型特征。首先,檢查是否存在多重共線性(1) (2)。其次,對于兩個解釋變量的模型,用簡單相關(guān)系數(shù)法計算這些解釋變量之間的相關(guān)系數(shù)。如果某些相關(guān)系數(shù)較高(如超過0.8),則可認為存在嚴重的共線性。3.多重共線性診斷,得到X1和X2之間的簡單相關(guān)系數(shù)。如果|r|接近1,則表明兩個變量之間存在很強的多重共線性。然而,這個標準是不可靠的。有時,成對相關(guān)系數(shù)可能較低,但仍可能存在共線性。、和進一步確定是哪些變量引起的。3.從屬回歸或輔助回歸(判斷系數(shù)的檢驗方法)。第一步:將模

14、型中的每個解釋變量與其他解釋變量進行回歸作為解釋變量(這些回歸稱為從屬回歸或輔助回歸,Ste:2:首先觀察這些輔助回歸對應(yīng)的擬合優(yōu)度(或判斷系數(shù));然后,這些輔助回歸通過H0f檢驗進行檢驗:RJ.2=0,Xji=1 x1 2x 2 xli。如果最初的假設(shè)被拒絕,XJ和其他解釋變量之間存在顯著的線性關(guān)系。3。相依回歸或輔助回歸(判斷系數(shù)檢驗法),Rj2:的J解釋變量對其他解釋變量回歸方程的判斷系數(shù)相對較大,接近1 (1-Rj2)相對較小,因此給定顯著性水平,計算F值并與相應(yīng)的臨界值進行比較,判斷是否存在相關(guān)性。以便Fj的值更大。4.克服多重共線性的方法。排除引起多重共線性的變量,找出引起多重共線性的解釋變量并排除它們。(補充)逐步回歸法:用Y作為解釋變量,將解釋變量逐一引入,形成回歸模型。對模型進行估計,根據(jù)擬合優(yōu)度的變化確定新引入的變量是否獨立。如果擬合優(yōu)度發(fā)生顯著變化,這意味著新引入的變量是獨立

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論