工具變量法解決內(nèi)生性問(wèn)題_第1頁(yè)
工具變量法解決內(nèi)生性問(wèn)題_第2頁(yè)
工具變量法解決內(nèi)生性問(wèn)題_第3頁(yè)
工具變量法解決內(nèi)生性問(wèn)題_第4頁(yè)
工具變量法解決內(nèi)生性問(wèn)題_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

工具變量法解決內(nèi)生性問(wèn)題做實(shí)證研究的人大概都有過(guò)這樣的經(jīng)歷:辛辛苦苦收集了數(shù)據(jù),搭好模型跑回歸,結(jié)果審稿人一句話就把信心打回原形——“你的模型存在內(nèi)生性問(wèn)題,估計(jì)結(jié)果不可信”。這時(shí)候,工具變量法往往會(huì)被當(dāng)作“救星”推上前臺(tái)。但工具變量法到底怎么用?為什么能解決內(nèi)生性?用錯(cuò)了會(huì)有什么后果?這些問(wèn)題像一層窗戶(hù)紙,不捅破總讓人心里發(fā)虛。作為在計(jì)量經(jīng)濟(jì)學(xué)領(lǐng)域摸爬滾打多年的“老研究”,我想結(jié)合自己的經(jīng)驗(yàn)和學(xué)界共識(shí),好好嘮嘮這個(gè)“既熟悉又陌生”的工具變量法。一、內(nèi)生性問(wèn)題:實(shí)證研究的“達(dá)摩克利斯之劍”要理解工具變量法,首先得搞清楚它要解決的核心問(wèn)題——內(nèi)生性。簡(jiǎn)單來(lái)說(shuō),內(nèi)生性就是解釋變量與誤差項(xiàng)之間存在相關(guān)性,這會(huì)導(dǎo)致普通最小二乘法(OLS)估計(jì)的系數(shù)有偏且不一致。就像用一把變形的尺子量身高,結(jié)果要么偏高要么偏低,根本反映不了真實(shí)情況。1.1內(nèi)生性的三大“罪魁禍?zhǔn)住眱?nèi)生性的產(chǎn)生原因主要有三個(gè),這三個(gè)“罪魁禍?zhǔn)住痹趯?shí)證研究中太常見(jiàn)了,幾乎每個(gè)模型都得仔細(xì)排查。第一個(gè)是遺漏變量。比如我們想研究教育年限對(duì)收入的影響,但能力、家庭背景這些關(guān)鍵變量沒(méi)被納入模型。能力強(qiáng)的人往往受教育年限更長(zhǎng),同時(shí)收入也更高,這時(shí)候教育年限就和誤差項(xiàng)里的“能力”相關(guān)了,OLS估計(jì)的教育回報(bào)就會(huì)被高估。我之前做過(guò)一個(gè)關(guān)于企業(yè)研發(fā)投入與績(jī)效的研究,一開(kāi)始沒(méi)控制行業(yè)競(jìng)爭(zhēng)程度,結(jié)果研發(fā)投入的系數(shù)特別大,后來(lái)加入行業(yè)競(jìng)爭(zhēng)變量后,系數(shù)直接降了一半——這就是遺漏變量在“搞鬼”。第二個(gè)是測(cè)量誤差?,F(xiàn)實(shí)中很多變量很難準(zhǔn)確測(cè)量,比如“企業(yè)創(chuàng)新能力”這種抽象概念,我們可能用專(zhuān)利數(shù)量代替,但有些企業(yè)可能申請(qǐng)了很多“防御性專(zhuān)利”,實(shí)際創(chuàng)新能力并不強(qiáng);再比如“居民消費(fèi)意愿”,用問(wèn)卷調(diào)查數(shù)據(jù)可能存在主觀偏差。測(cè)量誤差會(huì)讓解釋變量變成“帶噪音的變量”,這時(shí)候解釋變量與誤差項(xiàng)相關(guān),OLS估計(jì)會(huì)向零偏誤,俗稱(chēng)“attenuationbias”。我有個(gè)同事做家庭金融研究,用自我報(bào)告的“風(fēng)險(xiǎn)偏好”數(shù)據(jù)做解釋變量,結(jié)果發(fā)現(xiàn)系數(shù)顯著性總不穩(wěn)定,后來(lái)?yè)Q用客觀的金融資產(chǎn)配置數(shù)據(jù),結(jié)果才靠譜了些。第三個(gè)是反向因果。這是最讓研究者頭疼的情況——解釋變量和被解釋變量互為因果。比如研究金融發(fā)展與經(jīng)濟(jì)增長(zhǎng)的關(guān)系,到底是金融發(fā)展促進(jìn)了經(jīng)濟(jì)增長(zhǎng),還是經(jīng)濟(jì)增長(zhǎng)帶動(dòng)了金融發(fā)展?再比如教育與生育決策,受教育程度高的女性可能更晚生育,但生育時(shí)間也會(huì)影響后續(xù)教育機(jī)會(huì)。我曾經(jīng)看過(guò)一篇關(guān)于“社交媒體使用與幸福感”的論文,作者用OLS發(fā)現(xiàn)社交媒體使用時(shí)間越長(zhǎng),幸福感越低,但后來(lái)有人指出,可能是幸福感低的人更傾向于長(zhǎng)時(shí)間刷社交媒體,這就是典型的反向因果。1.2內(nèi)生性的后果:從“可信”到“不可信”的崩塌內(nèi)生性的存在會(huì)讓OLS估計(jì)完全失效。舉個(gè)簡(jiǎn)單的例子:假設(shè)真實(shí)模型是(Y=_0+_1X+u),其中(X)和(u)相關(guān)(存在內(nèi)生性)。OLS估計(jì)量(_1==_1+),如果(Cov(X,u)),那么(_1)就不再是(_1)的無(wú)偏或一致估計(jì)量。這意味著我們得到的系數(shù)可能夸大或縮小了真實(shí)效應(yīng),甚至符號(hào)都可能錯(cuò)誤。我之前評(píng)審過(guò)一篇研究“數(shù)字金融對(duì)農(nóng)戶(hù)創(chuàng)業(yè)影響”的論文,作者用OLS得出數(shù)字金融使用強(qiáng)度每提高10%,創(chuàng)業(yè)概率增加5%的結(jié)論。但仔細(xì)看數(shù)據(jù)就會(huì)發(fā)現(xiàn),創(chuàng)業(yè)意愿強(qiáng)的農(nóng)戶(hù)可能更主動(dòng)使用數(shù)字金融獲取資金,這就存在反向因果。后來(lái)作者用“所在村是否通4G網(wǎng)絡(luò)”作為工具變量重新估計(jì),結(jié)果系數(shù)降到了2%——這說(shuō)明原來(lái)的OLS結(jié)果高估了數(shù)字金融的作用,而工具變量法幫我們“撥正”了結(jié)論。二、工具變量法:用“第三方”破解內(nèi)生性困局既然內(nèi)生性讓OLS失效,那有沒(méi)有辦法“隔離”解釋變量中與誤差項(xiàng)相關(guān)的部分?工具變量法(InstrumentalVariables,IV)就是這樣一種“隔離術(shù)”。它通過(guò)引入一個(gè)與內(nèi)生解釋變量相關(guān),但與誤差項(xiàng)無(wú)關(guān)的“工具變量”,將解釋變量分解為“外生部分”和“內(nèi)生部分”,只保留外生部分來(lái)估計(jì)因果效應(yīng)。2.1工具變量的“兩大鐵律”:相關(guān)性與外生性工具變量(記作(Z))要發(fā)揮作用,必須滿(mǎn)足兩個(gè)核心條件,這兩個(gè)條件就像“鐵律”,缺一不可。第一個(gè)條件是相關(guān)性(Relevance):工具變量(Z)必須與內(nèi)生解釋變量(X)高度相關(guān)。簡(jiǎn)單說(shuō),(Z)得能“帶動(dòng)”(X)變化。如果(Z)和(X)沒(méi)關(guān)系,那(Z)根本無(wú)法傳遞信息到(X),也就無(wú)法幫助估計(jì)(X)對(duì)(Y)的影響。統(tǒng)計(jì)學(xué)上,我們可以通過(guò)第一階段回歸(后面會(huì)講)的F統(tǒng)計(jì)量來(lái)檢驗(yàn)相關(guān)性,如果F統(tǒng)計(jì)量太?。ㄍǔUJ(rèn)為小于10),就說(shuō)明存在“弱工具變量”問(wèn)題,這時(shí)候IV估計(jì)量可能比OLS更差。第二個(gè)條件是外生性(Exogeneity):工具變量(Z)必須與誤差項(xiàng)(u)不相關(guān),也就是(Z)只能通過(guò)(X)影響(Y),不能有其他路徑。這是最難滿(mǎn)足的條件,因?yàn)樗枰碚摵椭贫缺尘暗闹?。比如,用“季度出生”作為教育年限的工具變量(Angrist和Krueger的經(jīng)典研究),背后的邏輯是:很多地區(qū)規(guī)定1月1日滿(mǎn)6歲才能入學(xué),所以12月出生的孩子比1月出生的孩子晚一年入學(xué),最終受教育年限可能少一年;而季度出生本身與個(gè)人能力、收入等無(wú)關(guān),因此滿(mǎn)足外生性。但如果有研究發(fā)現(xiàn),冬季出生的孩子可能營(yíng)養(yǎng)攝入不同,影響認(rèn)知能力,那這個(gè)工具變量的外生性就被破壞了。2.2兩階段最小二乘法(2SLS):工具變量法的“標(biāo)準(zhǔn)操作”實(shí)際應(yīng)用中,工具變量法最常用的實(shí)現(xiàn)方式是兩階段最小二乘法(Two-StageLeastSquares,2SLS)。我第一次用2SLS時(shí),覺(jué)得“兩階段”聽(tīng)起來(lái)復(fù)雜,其實(shí)拆開(kāi)來(lái)很清晰。第一階段:用工具變量(Z)對(duì)內(nèi)生解釋變量(X)做回歸,得到(X)的預(yù)測(cè)值()。回歸方程是(X=_0+_1Z+v),這里(=_0+_1Z)。這一步的目的是把(X)分解為兩部分:由(Z)解釋的外生部分(())和與誤差項(xiàng)相關(guān)的內(nèi)生部分((X-))。第二階段:用()代替原(X),對(duì)被解釋變量(Y)做回歸,得到因果效應(yīng)估計(jì)值?;貧w方程是(Y=_0+_1+),這里的(_1)就是我們關(guān)心的因果效應(yīng)。為什么這樣做有效?因?yàn)?)是(Z)的線性組合,而(Z)與誤差項(xiàng)(u)不相關(guān)(外生性),所以()也與(u)不相關(guān),這就消除了內(nèi)生性問(wèn)題。舉個(gè)具體例子:研究教育年限((X))對(duì)收入((Y))的影響,存在遺漏能力變量的內(nèi)生性。我們選擇“父親的教育年限”((Z))作為工具變量(假設(shè)父親教育年限影響子女教育年限,但與子女能力無(wú)關(guān))。第一階段用父親教育年限回歸子女教育年限,得到預(yù)測(cè)的教育年限();第二階段用()回歸收入,得到的系數(shù)就是教育對(duì)收入的凈效應(yīng)。2.3工具變量的“百寶箱”:常見(jiàn)類(lèi)型與構(gòu)造思路找合適的工具變量是實(shí)證研究的“老大難”,但學(xué)界已經(jīng)積累了一些常用的工具變量類(lèi)型,這些“套路”能幫我們打開(kāi)思路。自然實(shí)驗(yàn)類(lèi)工具變量:利用政策變動(dòng)、自然災(zāi)害、地理位置等外生沖擊。比如,研究最低工資對(duì)就業(yè)的影響,用“相鄰州的最低工資標(biāo)準(zhǔn)”作為工具變量(Card和Krueger的經(jīng)典研究);研究金融開(kāi)放對(duì)經(jīng)濟(jì)增長(zhǎng)的影響,用“國(guó)際貨幣基金組織的貸款條件”作為工具變量(外生政策沖擊)。這類(lèi)工具變量的優(yōu)勢(shì)是“自然發(fā)生”,外生性容易論證,但需要研究者有敏銳的“政策嗅覺(jué)”,能捕捉到合適的外生事件。滯后變量類(lèi)工具變量:用解釋變量的滯后項(xiàng)作為工具變量。比如,研究當(dāng)期投資對(duì)企業(yè)績(jī)效的影響,用滯后一期的投資作為工具變量(假設(shè)滯后投資與當(dāng)期誤差項(xiàng)無(wú)關(guān))。不過(guò)這種方法需要滿(mǎn)足“序列外生性”假設(shè),即誤差項(xiàng)不存在序列相關(guān),否則滯后變量可能仍然與誤差項(xiàng)相關(guān)。地理或環(huán)境變量:利用地理距離、氣候條件等自然因素。比如,研究貿(mào)易開(kāi)放對(duì)經(jīng)濟(jì)增長(zhǎng)的影響,用“到主要港口的距離”作為工具變量(距離影響貿(mào)易成本,但與經(jīng)濟(jì)增長(zhǎng)無(wú)直接關(guān)系);研究教育投資對(duì)生育率的影響,用“所在地區(qū)的歷史學(xué)校密度”作為工具變量(歷史因素外生,影響當(dāng)前教育資源可得性)。這類(lèi)工具變量的關(guān)鍵是論證“自然因素”與被解釋變量無(wú)直接因果關(guān)系。隨機(jī)分配類(lèi)工具變量:在實(shí)驗(yàn)或準(zhǔn)實(shí)驗(yàn)中,用隨機(jī)分配的“參與狀態(tài)”作為工具變量。比如,扶貧項(xiàng)目通常只能覆蓋部分村莊,用“是否被隨機(jī)選為試點(diǎn)村”作為工具變量,估計(jì)項(xiàng)目對(duì)農(nóng)戶(hù)收入的影響。這類(lèi)工具變量的外生性最強(qiáng),因?yàn)殡S機(jī)分配天然與誤差項(xiàng)無(wú)關(guān),但現(xiàn)實(shí)中很多研究無(wú)法做隨機(jī)實(shí)驗(yàn),只能尋找“準(zhǔn)實(shí)驗(yàn)”機(jī)會(huì)。三、工具變量法的“驗(yàn)金石”:檢驗(yàn)與robustness分析工具變量法不是“套上就能用”的魔法,必須經(jīng)過(guò)嚴(yán)格的檢驗(yàn),否則可能從“解決內(nèi)生性”變成“引入新偏差”。我剛開(kāi)始用工具變量時(shí),總覺(jué)得找到一個(gè)工具變量就萬(wàn)事大吉,后來(lái)被審稿人要求“做10個(gè)檢驗(yàn)”才明白:嚴(yán)謹(jǐn)?shù)臋z驗(yàn)比找工具變量更重要。3.1第一關(guān):弱工具變量檢驗(yàn)——工具變量夠“強(qiáng)”嗎?如果工具變量(Z)與(X)的相關(guān)性很弱(弱工具變量),即使?jié)M足外生性,IV估計(jì)量也會(huì)有嚴(yán)重的偏誤,甚至比OLS更差。檢驗(yàn)弱工具變量最常用的方法是看第一階段回歸的F統(tǒng)計(jì)量。經(jīng)驗(yàn)法則是,如果F統(tǒng)計(jì)量小于10,說(shuō)明存在弱工具變量問(wèn)題;如果大于10,通常認(rèn)為工具變量足夠強(qiáng)。我之前有篇論文用“地區(qū)降雨量”作為農(nóng)業(yè)投資的工具變量,第一階段F統(tǒng)計(jì)量只有8.5,審稿人直接指出可能存在弱工具變量偏誤。后來(lái)我換用“降雨量與灌溉設(shè)施的交互項(xiàng)”作為工具變量,F(xiàn)統(tǒng)計(jì)量提高到15,結(jié)果才被接受。這說(shuō)明,工具變量的“強(qiáng)度”直接關(guān)系到估計(jì)結(jié)果的可信度。3.2第二關(guān):外生性檢驗(yàn)——工具變量夠“干凈”嗎?外生性是工具變量的“靈魂”,但嚴(yán)格檢驗(yàn)外生性幾乎是不可能的,因?yàn)槲覀儫o(wú)法直接觀測(cè)誤差項(xiàng)。不過(guò),當(dāng)存在多個(gè)工具變量(過(guò)度識(shí)別)時(shí),可以用Sargan檢驗(yàn)或HansenJ檢驗(yàn)來(lái)判斷工具變量是否與誤差項(xiàng)無(wú)關(guān)?;具壿嬍牵喝绻泄ぞ咦兞慷紳M(mǎn)足外生性,那么用不同工具變量估計(jì)的系數(shù)應(yīng)該一致;如果不一致,說(shuō)明至少有一個(gè)工具變量不滿(mǎn)足外生性。比如,我們用“父親教育”和“母親教育”兩個(gè)工具變量估計(jì)教育對(duì)收入的影響,Sargan檢驗(yàn)的原假設(shè)是“所有工具變量外生”。如果p值大于0.1,通常不拒絕原假設(shè),認(rèn)為工具變量外生;如果p值很小,說(shuō)明至少有一個(gè)工具變量與誤差項(xiàng)相關(guān),需要剔除或?qū)ふ移渌ぞ咦兞俊?.3第三關(guān):穩(wěn)健性檢驗(yàn)——結(jié)果經(jīng)得起“折騰”嗎?即使通過(guò)了前兩關(guān),還需要做一系列穩(wěn)健性檢驗(yàn),確保結(jié)果的可靠性。常見(jiàn)的檢驗(yàn)包括:替換工具變量:用不同的工具變量重新估計(jì),看系數(shù)是否一致。比如,原來(lái)用“季度出生”作為教育的工具變量,現(xiàn)在換用“是否有兄弟姐妹”(假設(shè)兄弟姐妹多的家庭可能減少單個(gè)子女教育投入),如果兩次估計(jì)的系數(shù)接近,說(shuō)明結(jié)果穩(wěn)健??刂聘嘧兞浚杭尤敫嗫赡艿倪z漏變量,看IV估計(jì)系數(shù)是否變化不大。如果加入變量后系數(shù)大幅變動(dòng),說(shuō)明可能還有重要遺漏變量未被控制。安慰劑檢驗(yàn):構(gòu)造一個(gè)“假的內(nèi)生變量”,比如用“虛構(gòu)的教育年限”(如將實(shí)際教育年限加1)作為內(nèi)生變量,用原工具變量估計(jì),如果系數(shù)不顯著,說(shuō)明工具變量不會(huì)影響“假變量”,間接支持外生性。我去年做的一個(gè)研究中,用“高鐵開(kāi)通時(shí)間”作為城市創(chuàng)新的工具變量(高鐵開(kāi)通促進(jìn)人才流動(dòng),進(jìn)而影響創(chuàng)新),除了做F檢驗(yàn)和Sargan檢驗(yàn),還做了安慰劑檢驗(yàn)——將高鐵開(kāi)通時(shí)間提前5年作為“假工具變量”,結(jié)果估計(jì)系數(shù)不顯著,這說(shuō)明原工具變量的效果確實(shí)來(lái)自高鐵開(kāi)通本身,而不是其他時(shí)間趨勢(shì)。四、工具變量法的“使用說(shuō)明書(shū)”:常見(jiàn)挑戰(zhàn)與應(yīng)對(duì)策略工具變量法雖然強(qiáng)大,但在實(shí)際應(yīng)用中會(huì)遇到各種挑戰(zhàn),有些是方法本身的局限,有些是數(shù)據(jù)和現(xiàn)實(shí)條件的約束。了解這些挑戰(zhàn),才能避免“誤用”和“濫用”。4.1挑戰(zhàn)一:“完美工具變量”可遇不可求理想的工具變量需要同時(shí)滿(mǎn)足強(qiáng)相關(guān)性和嚴(yán)格外生性,但現(xiàn)實(shí)中這樣的工具變量非常稀缺。很多時(shí)候,我們只能找到“近似滿(mǎn)足”條件的工具變量,這就需要研究者結(jié)合理論和制度背景,詳細(xì)論證工具變量的合理性。比如,用“河流密度”作為農(nóng)業(yè)技術(shù)采用的工具變量,需要說(shuō)明河流密度影響灌溉條件(從而影響技術(shù)采用),但與農(nóng)民的管理能力、市場(chǎng)環(huán)境等無(wú)關(guān)。這時(shí)候,研究者需要查閱地理資料、農(nóng)業(yè)政策文件,甚至做實(shí)地調(diào)研,證明河流密度的外生性。我有個(gè)朋友為了論證“地震災(zāi)害”作為企業(yè)投資的工具變量,專(zhuān)門(mén)收集了30年的地震數(shù)據(jù),證明地震發(fā)生是隨機(jī)的,與企業(yè)基本面無(wú)關(guān)——這種“刨根問(wèn)底”的精神是找工具變量的關(guān)鍵。4.2挑戰(zhàn)二:過(guò)度識(shí)別與不足識(shí)別的兩難當(dāng)工具變量數(shù)量多于內(nèi)生解釋變量數(shù)量時(shí)(過(guò)度識(shí)別),可以用Sargan檢驗(yàn)等方法檢驗(yàn)外生性,但過(guò)度識(shí)別也可能導(dǎo)致估計(jì)效率下降;當(dāng)工具變量數(shù)量等于內(nèi)生解釋變量數(shù)量時(shí)(恰好識(shí)別),無(wú)法檢驗(yàn)外生性,只能依賴(lài)?yán)碚撜撟C;當(dāng)工具變量數(shù)量少于內(nèi)生解釋變量數(shù)量時(shí)(不足識(shí)別),IV估計(jì)無(wú)法進(jìn)行。應(yīng)對(duì)過(guò)度識(shí)別的一個(gè)方法是“篩選工具變量”,保留相關(guān)性最強(qiáng)、外生性最可信的工具變量;對(duì)于恰好識(shí)別,需要更詳細(xì)地闡述工具變量的外生性邏輯,可能的話用“反事實(shí)分析”(比如如果工具變量不滿(mǎn)足外生性,結(jié)果會(huì)如何變化)來(lái)增強(qiáng)說(shuō)服力;不足識(shí)別時(shí),可能需要尋找更多工具變量,或者放松模型設(shè)定(比如將多個(gè)內(nèi)生變量合并為一個(gè)指標(biāo))。4.3挑戰(zhàn)三:異質(zhì)性效應(yīng)與LATE的解釋工具變量法估計(jì)的是“局部平均處理效應(yīng)”(LocalAverageTreatmentEffect,LATE),即工具變量變化所影響的那部分樣本的平均效應(yīng),而不是總體的平均處理效應(yīng)(ATE)。這意味著,IV估計(jì)結(jié)果的解釋

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論