面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗的若干問題_第1頁
面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗的若干問題_第2頁
面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗的若干問題_第3頁
面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗的若干問題_第4頁
面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗的若干問題_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗的若干問題

面板數(shù)據(jù)作為計量經(jīng)濟學(xué)中的一個小分支,多數(shù)本科學(xué)校沒有學(xué)過,此課程主要面向研

究生及以上,但是面板數(shù)據(jù)的實證分析在核心刊物上屢屢出現(xiàn)(例子:前天小編去市圖R館,

看某經(jīng)濟類核心期刊,一共有10篇文章,其中3篇用的是面板數(shù)據(jù),但不是簡單的面板數(shù)

據(jù),主要面板數(shù)據(jù)和別的模型的結(jié)合)。

一、面板數(shù)據(jù)哪里好

一般而言,面板數(shù)據(jù)模型的誤差項由兩部分組成,一部分是與個體觀察單位有關(guān)的,它

概括了所有影響被解釋變吊,但不隨時間變化的因素,因此,面板數(shù)據(jù)模型也常常被成為非

觀測效應(yīng)模型:另外一部分概括了因截面因時間而變化的不可觀測因素,通常被成為特異性

誤差或特異擾動項(事實上這第二部分誤差還可分成兩部分,一部分是不因截面變化但隨時

間變化的非觀測因素對應(yīng)的誤差項Vt,這一部分一般大家的處理辦法是通過在模型中引入

時間虛擬變量來加以剝離和控制,另一部分才是因截面因時間而變化的不可觀測因素。不過

一般計量經(jīng)濟學(xué)的面板數(shù)據(jù)分析中都主要討論兩部分,在更高級一點的統(tǒng)計學(xué)或計量經(jīng)濟學(xué)

中會討論誤差分量模型,它一般討論三部分誤差)。

非觀測效應(yīng)模型一般根據(jù)灼時不變非觀測效應(yīng)的不同假設(shè)可分為固定效應(yīng)模型和隨機

效應(yīng)模型。傳統(tǒng)上,大家都習(xí)慣這樣分類:如果把非觀測效應(yīng)看作是各個截面或個體特有的

可估計參數(shù),并且不隨時間而變化,則模型為固定效應(yīng)模型;如果把非觀測效應(yīng)看作隨機變

量,并且符合一個特定的分布,則模型為隨機效應(yīng)模型。

不過,上述定義不是十分嚴(yán)謹(jǐn),而且一個非常容易讓人產(chǎn)生誤解的地方是似乎固定效應(yīng)

模型中的非觀測效應(yīng)是隨時間不變的,是固定的,而隨機效應(yīng)模型中的非觀測效應(yīng)則不是固

定的,而是隨時間變化的,

一個邏輯上比較一致和嚴(yán)謹(jǐn),并且越來越為大家所接受的假設(shè)是(參見Wooldridge的教

材和Mundlakl978年的論文),不論固定效應(yīng)還是隨機效應(yīng)都是隨機的,都是概括「那些沒

有觀測到的,不隨時間而變化的,但影響被解釋變量的因素(尤其當(dāng)截面?zhèn)€體比較大的時候,

這種假設(shè)是比較合理的)。非觀測效應(yīng)究竟應(yīng)假設(shè)為固定效應(yīng)還是隨機效應(yīng),關(guān)鍵看這部分

不隨時間變化的非觀測效應(yīng)對應(yīng)的因素是否與模型中控制的觀測到的解釋變量相關(guān),如果這

個效應(yīng)與可觀測的解釋變量不相關(guān),則這個效應(yīng)成為隨機效應(yīng)。這也正是HAUSMAN設(shè)定

檢驗所需要檢驗的假說。

非觀測效應(yīng)模型因為.對非觀測效應(yīng)假設(shè)的不同,因為使用面板數(shù)據(jù)信息的不同,可以用

不同方法來估計并且得到不同的估計量,一般有四個:

⑴組內(nèi)估計晟(WITHINESTIMATOR)(FE或FD:FirstDifference)

(2)組間估計量(BETWEENESTIMATOR)

(3)混合OLS估計量(POOLEDOLSESTIMATOR)

⑷隨機效應(yīng)估計量(RE,GLS或FGLS估計量)

這四個估計量因為假設(shè)和使用信息的不同而不同,各有優(yōu)劣勢,相互之間也有密切關(guān)系。

3和4分別是I和2的加權(quán)平均;4在特定的假設(shè)分別可以轉(zhuǎn)化成I和3;如果HAUSMAN

檢驗表明4和1沒有區(qū)別的時候意味著1和2沒有區(qū)別。

RE假設(shè)未觀察因素與解釋變量是正交的,只不過在未觀察因素里有兩個部分,一是與

個體單位有關(guān)的,二是完全隨機的,RE在做估計的時候,是用這兩個部分的方差計算出一

個指數(shù)X,來做quasi-demcan,也就是說在去平均的時候是用原值的y或x減去九乘以y或

x的均值,然后用GLS估計。極端地,當(dāng)人為0時,非觀測效應(yīng)是一個常數(shù),并且所有個體

都一樣,就等價于PooledOLS,當(dāng)人為1時,說明完全隨機的部分可以忽略,所有未觀察

因素都是與單位有關(guān)的,于是就等價于FE。但FE不需要假定未觀察因素與解釋變量是正

交的,在做FE時,固定效應(yīng)都被差分掉了,所以也可得到consistent的結(jié)果。

PANEL數(shù)據(jù)的好處之一是,如果未觀察到的是固定效應(yīng),那么在做DEMEAN時,未觀

察因素就被差分掉了。這樣就可以減少由于未觀察的因素可能與解群變量相關(guān)而導(dǎo)致的內(nèi)生

性問題。

二、那么PANEL的FE或者RE分析就避免了內(nèi)生性問題嗎?

只能說好?些,如果內(nèi)生的問題只是由于與單位有關(guān)的并不隨時間變化的遺漏變量與解

釋變量有關(guān)造成的,這時:數(shù)據(jù)的差分就解決了問題,但是,別忘記還有一部分誤差,如果

這部分誤差里包含的因素也可能影響解釋變量,那么,差分只能解決前面講的問題,由隨機

項里包括的因素與解釋變量之間的關(guān)系導(dǎo)致的內(nèi)生性問題還可能存在。

三、如何處理內(nèi)生性問題?

找IV解決。類似于在OLS基礎(chǔ)上找IV,但對PANEL的工具應(yīng)該具有PANEL結(jié)構(gòu),

除非你基礎(chǔ)的估計沒有使用PANEL的方法,比如說對數(shù)據(jù)用了pooledOLS方法,但能夠用

pooledOLS方法分析PANELDATA的條件是很嚴(yán)格的。

四、工具變量選擇問題

1,IV應(yīng)該盡量是外生的(如歷史/自然/氣候/地理之類),它應(yīng)該在理論上對被解釋變量

(以下稱Y)沒有直接影響,但應(yīng)該通過影響被工具的變景(以下稱X)而間接影響被解釋變最

Y。

2,如果上述理論邏輯通的話,將內(nèi)生變量X作為解釋變量,IV和其他變量(X》作為解

釋變量,看IV是否顯著,它應(yīng)該顯著。如果選了多個IV,就用FTEST看其是否都不顯著。

同時,如果在多個IV111,有一個是確定為外生的,那么,可以用Sargantestofoveridentifying

restrictions來檢驗其他的IV是不是確實是外生的。

3,如果上述都沒有問題,做一下IV回歸。完成后,用HAUSMAN檢驗,這個檢驗的

原假說是IV回歸與原回歸(不用IV的回歸)的變量的系數(shù)并沒有顯著的不同??匆幌翽值,

如果P小于比如說0.1,或者0.05,那么,說明IV回歸與原來的回歸顯著不同,原來的方程

的確有內(nèi)生性問題導(dǎo)致的估計偏誤。反之,如果P很高,超過0.1,或0.05,那說明IV回歸

與原來的回歸沒有顯著不同,無法拒絕原來的回歸沒有顯著的內(nèi)生問題導(dǎo)致的估計偏誤的原

假設(shè)。

4,如果選擇的IV本身就影響Y,那它就不能被作為IV。例如,Y在左邊,右邊是X(被

工具的),Xz,IVo當(dāng)IV被放在方程右邊時,它最好是不顯著影響Y的。在Acemogki(2001)

里.,他就檢驗了他們的IV是否直接影響被解釋變量,結(jié)果說明不直接影響,于是這個IV是

好的。當(dāng)然,一個好的IV在前面的回歸中也可能是顯著的(不過一般如果理論和邏輯上IV

是通過被工具的內(nèi)生解釋變顯間接影響被解釋變后的話,一般來說應(yīng)該是被T具的內(nèi)生解釋

變量使得IV不顯著,或者由于兩者相關(guān)性很高,兩者都不顯著),但判斷的標(biāo)準(zhǔn)還只是t值。

這個變量顯著完全有可能是因為它影響了其他顯著的變量(比如被工具的變量),如果是這樣,

當(dāng)包括了IV在原方程中以后,其他變量(特別需要注意的是被工具的變量X)的系數(shù)可能發(fā)

生明顯變化。

五、關(guān)于HAUSMANTEST檢驗的若干問題

具體參見Statacorporation.2001,STATA7ReferenceH-P.StataPress

1,含義:“Thenullhypothesisisthattheefficientestimatorisaconsistentandefficient

estimatorofthetrueparameters.Ifitis,thereshouldbenosystematicdifferencebetweenthe

coefficientsoftheefficientestimatorandaconiparisonestimatorthatisknowntobeconsistentfor

(hetrueparameters.Ifthetwomodelsdisplayasystematicdifferenceintheestimatedcoefficients,

thenwehavereasontodoubttheassumptionsonwhichtheefficientestimatorisbased.”參見手冊

Statacorporation,2001,STATA7ReferenceH-P,StataPresso該方法是Hausman(1978)的程序

化。所以,HausmanTest的命令(hausman)假設(shè)使用者知道需要比較的兩個方程中哪一個是

“無論原假說成立與否都是consistent",哪一個“在原假說下不僅efficieni而且consistent,但

若原假說不成立,則inconsistent”,[1]然后,在STATA8下,步驟是:

(1)obtainanestiniatcrthatisconsistentwhetherornotthehypothesisistrue;

(2)storetheestimationresultsunderaname-consistentusingestimatesstore;

(3)obtainanestimatorthatisefficient(andconsistent)underthehypothesisthatyouarc

testing,butinconsistentotherwise;

(4)storetheestimationresultsunderaname-efficientusingestimatesstore;

(5)usehausinantoperformthelest

hausmanname-consistentname-efficient[,options]

舉例:

(1)在關(guān)于是FE還是RE的檢驗中,原假說是非觀測效應(yīng)與解釋變量不相關(guān),備擇假說

是兩者相關(guān)。FE是無論原假說成立與否都是consistent,而RE在原假說卜.是consistent,并

且Asymplolicallyefficient樣本越大越有效),但如果原假說被拒絕,則RE不是consistent的

(Hausman,1978)。

所以做法應(yīng)該是(STATA8的命令):

sortcodeyear(排序)

tisyear(時間變量是year)

iiscode(表示單位的是code)

xtregyxx2,fe(假設(shè)其中x是需要被工具的變量)

eslslorefixed(在STATA8里命令有變化,不再是HAUSMAN,SAVE了,這里的fixed

實際上就是個變量名,用什么都行)

xtregyxx2,re

hausmanfixed

(2)比較OLS(或FE)和IV(或IVFE)

先做IV,因為,它無論如何都是consistent的,但OLS只有在原假設(shè)成立,即OLS結(jié)

果與IV結(jié)果相同,內(nèi)生性問題沒有時,才是consistent的。所以,應(yīng)該先做IV。

在老版本的STATA里,如果不加特殊說明,STATA就會默認(rèn)為先寫的回歸命令得到的

是總是一致的估計結(jié)果,后寫的得到的是備擇假設(shè)下不一致的估計結(jié)果?,F(xiàn)在HAUSMAN

命令規(guī)范了,而且擴展了。先跑哪個不重要,關(guān)鍵在于寫最后HAUSMAN命令時候的順序,

而且如果最近跑的一個沒有用EST存名字的話,要用代替。

2,注意:

(1)對以上檢驗的理解的另一種方式是,我們先做一個假設(shè)條件要求更松的估計,然后再

做?個假設(shè)條件更嚴(yán)格的,相比之下,IV(IVFE)比OLS(FE)要求更松。容易搞混的是FE比

RE假設(shè)條件更松。RE假設(shè)未觀察因素與解釋變量是正交的,只不過在未觀察因素里有兩個

部分,一是與個體單位有關(guān)的,二是完全隨機的,RE在做估計的時候,是用這兩個部分的

方差計算出一個指數(shù)人來做quasi-demean,也就是說在去平均的時候是用原值的y或x減

去九乘以y或x的均值,然后用GLS估計。當(dāng)九為0時,就等價于pooledOLS,當(dāng)X為1

時,說明完全隨機的部分可以忽略,所有未觀察因素都是與單位有關(guān)的,于是就等價FFE。

但FE不需要假定未觀察因素與解樣變量是正交的,在做FE時,固定效應(yīng)都被差分掉了,

所以也可得到consistent的結(jié)果。當(dāng)我們先做假設(shè)更嚴(yán)格的估計時,HT與一般檢驗一樣,檢

驗值大,P小,則原假說拒絕,應(yīng)該接受假設(shè)更松的。在FE與RE的比較里,卡方大,接

受FE。在OLS(FE)與IV(或IVFE)的比較里,當(dāng)卡方值大時,P小時,拒絕原假說,IV結(jié)果

和OLS(或FE)有不同,于是接受IV結(jié)果。

(2)從以上討論可以看出,我們需要事先知道HT時兩個方程的順序和性質(zhì)。在STATA7

以下,當(dāng)使用hausman命令時,它默認(rèn)的順利(缺省參數(shù)more)就是上面的順序。如果你做的

順序相反,就應(yīng)該加上參數(shù),命令為hausman,less,如果沒有寫less,那么,STATA是不知

道誰更efficient的,這時,你本來應(yīng)該得到一個正的結(jié)果,就完全可能因為順序錯了,又忘

記了參數(shù)less而得到一個相反的負(fù)數(shù)結(jié)果。

在STATA8里命令變化,可以變順序,但要使用者注意正確使用參數(shù):

Theorderofcomputing(hetwoestimatorsmaybereversed.Youhavelobecarefulthough

tospecifytohausmanthemodelsintheorder"alwaysconsistent"firstand"efficientunderHO"

second.Ilispossibletoskipstoringthesecondmodelandrefertothelastestimationresultsby

aperiod(.).

(3)在其他可比較的情況下,順序并不重要(如果沒有讒更有效的差別)

hausmanmaybeusedinanycontext.Theorderinwhichyouspecifytheregressorsineach

modeldocsnotmatter,butitisyourresponsibilitytoassurethattheestimatorsandmodelsarc

comparable,andsatisfythetheoreticalconditions(see(l)and(3)above).

(4)當(dāng)HT出現(xiàn)負(fù)值時

先看一下是不是方程順序錯了。如果沒有錯,那么在小樣本數(shù)據(jù)下也并不是不可能得到

負(fù)值。當(dāng)HAUSMAN檢驗的X2值是負(fù)的時候,意思是強烈地表明兩個被比較的回歸結(jié)果

系數(shù)相同(或者說無顯著差異)的原假說不能被拒絕,尤其是小樣本中很可能出現(xiàn)。這是

STATA7的使用手冊上的一個例子說的。但在STATA8里,又說,出現(xiàn)負(fù)值這種情況時,If

thisisthecase,theHausmantestisundefined.Unfortunately,thisisnotarareevent.Stata

supportsageneralizedHausmantestthatovercomesbolhofiheseproblems.Seesuestfordetails.可

以通過helpsuestY解。

3,STATA命令

⑴比較FE和RE

sortcodeyear(排序)

tisyear(時間變量是year)

iiscode(表示單位的是code)

xtregyxx2,fe(假設(shè)其中x是需要被工具的變量)

eststorefixed(在STATA8里命令有變化,不再是HAUSMAN,SAVE了,這里的fixed

實際上就是個變量名,用什么都行)

xtregyxx2,re

hausmanfixed

(2)比較IVFE和IVRE

xtivregy(x=iv)x2,fe

eststorefl

xtivregy(x=iv)x2,re

hausmanfl

一般來說用不著這個比較,因為在這之前,你已經(jīng)知道FE和RE誰好了,就將好的結(jié)

果與它的IV結(jié)果比就行了。

⑶比較IVFE和FE

xtivregy(x=iv)x2,fe

esistoref2

xtregyxx2,fe

hausmanf2

再重復(fù)一遍,如果結(jié)果是P小,卡方大才說明IV回歸是必要的,原來是有內(nèi)生問題。

六、舉例

Acemoglu等人(2001)的文章是非常有代表性的使用工具變量的論文。他們試圖驗證制

度對人均收入有影響,顯然,直接做回歸的話,制度就是內(nèi)生的,因為好的制度可能在人均

收入高的地方產(chǎn)生。他們找的工具變量是殖民地時代一個國家的死亡率,死亡率高歐洲人就

不會定居下來,于是就會在當(dāng)時建議掠奪性的制度,反之就會建立好

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論