工具變量法的有限信息最大似然估計(jì)_第1頁
工具變量法的有限信息最大似然估計(jì)_第2頁
工具變量法的有限信息最大似然估計(jì)_第3頁
工具變量法的有限信息最大似然估計(jì)_第4頁
工具變量法的有限信息最大似然估計(jì)_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

工具變量法的有限信息最大似然估計(jì)在計(jì)量經(jīng)濟(jì)學(xué)的研究中,我們常常會遇到這樣的困境:當(dāng)解釋變量與誤差項(xiàng)存在相關(guān)性(內(nèi)生性問題)時,普通最小二乘法(OLS)的估計(jì)量會偏離真實(shí)值,就像用一把刻度不準(zhǔn)的尺子量身高,結(jié)果自然不可靠。這時候,工具變量法(InstrumentalVariables,IV)就像一把“校準(zhǔn)尺”,通過引入與內(nèi)生變量高度相關(guān)但與誤差項(xiàng)無關(guān)的工具變量,為我們打開了一扇解決內(nèi)生性問題的大門。而在工具變量法的眾多估計(jì)方法中,有限信息最大似然估計(jì)(LimitedInformationMaximumLikelihood,LIML)因其獨(dú)特的統(tǒng)計(jì)性質(zhì)和在小樣本下的優(yōu)勢,逐漸成為學(xué)術(shù)研究和實(shí)際應(yīng)用中不可忽視的工具。一、從內(nèi)生性問題到工具變量法:理解LIML的背景1.1內(nèi)生性問題:計(jì)量分析的“攔路虎”說句實(shí)在話,做實(shí)證研究的人最怕什么?不是數(shù)據(jù)缺失,也不是模型復(fù)雜,而是內(nèi)生性問題。它就像藏在數(shù)據(jù)背后的“幽靈”,悄悄扭曲著我們的估計(jì)結(jié)果。內(nèi)生性的來源主要有三個:遺漏變量(比如研究教育對收入的影響時,遺漏了個人能力這個關(guān)鍵變量)、測量誤差(比如用自我報(bào)告的收入數(shù)據(jù)代替真實(shí)收入)、互為因果(比如企業(yè)規(guī)模與創(chuàng)新投入可能互相影響)。這時候,OLS估計(jì)量會變得有偏且不一致,就像在迷霧中找方向,越走越偏。1.2工具變量法:破解內(nèi)生性的“鑰匙”工具變量法的核心思想很樸素:既然內(nèi)生變量和誤差項(xiàng)“糾纏不清”,我們就找一個“中間人”——工具變量(Z),它需要滿足兩個條件:一是與內(nèi)生變量(X)高度相關(guān)(相關(guān)性條件),二是與誤差項(xiàng)(ε)不相關(guān)(外生性條件)。打個比方,這就像給內(nèi)生變量找一個“代言人”,通過工具變量的變化來“驅(qū)動”內(nèi)生變量的變化,從而分離出內(nèi)生變量對被解釋變量(Y)的真實(shí)影響。1.3從2SLS到LIML:工具變量估計(jì)方法的演進(jìn)早期的工具變量估計(jì)主要采用兩階段最小二乘法(2SLS),它通過兩個階段的OLS回歸實(shí)現(xiàn):第一階段用工具變量Z對內(nèi)生變量X進(jìn)行回歸,得到X的擬合值;第二階段用Y對X的擬合值進(jìn)行OLS回歸,得到參數(shù)估計(jì)。2SLS操作簡單、計(jì)算方便,一度成為工具變量法的“標(biāo)配”。但隨著研究的深入,學(xué)者們發(fā)現(xiàn)2SLS在小樣本或弱工具變量(工具變量與內(nèi)生變量相關(guān)性較弱)情況下會出現(xiàn)嚴(yán)重的偏差,估計(jì)量的分布可能偏離正態(tài)分布,導(dǎo)致假設(shè)檢驗(yàn)失效。這時候,LIML作為一種更穩(wěn)健的估計(jì)方法進(jìn)入了研究者的視野。二、LIML的原理:從極大似然到有限信息的“精準(zhǔn)捕捉”2.1極大似然估計(jì):統(tǒng)計(jì)推斷的“最優(yōu)準(zhǔn)則”要理解LIML,首先需要回顧極大似然估計(jì)(MLE)的基本思想。極大似然估計(jì)的核心是“概率最大化”:假設(shè)我們有一組觀測數(shù)據(jù),我們需要找到一組參數(shù),使得在這組參數(shù)下觀測到當(dāng)前數(shù)據(jù)的概率最大。打個比方,就像根據(jù)腳印推斷腳印主人的身高,我們會選擇那個最可能產(chǎn)生當(dāng)前腳印的身高值作為估計(jì)結(jié)果。MLE具有漸近有效性(在大樣本下方差最?。?、不變性(對參數(shù)的連續(xù)函數(shù)保持估計(jì)性質(zhì))等優(yōu)良性質(zhì),是統(tǒng)計(jì)學(xué)中最重要的估計(jì)方法之一。2.2LIML的“有限信息”從何而來?LIML中的“有限信息”指的是,該方法僅利用了模型中與內(nèi)生變量相關(guān)的信息,而不考慮模型系統(tǒng)中其他方程的信息(如果是聯(lián)立方程模型的話)。與“完全信息最大似然估計(jì)”(FIML,利用系統(tǒng)中所有方程的信息)相比,LIML更聚焦于單個方程的估計(jì),這使得它在計(jì)算上更簡單,同時也避免了因引入過多無關(guān)信息而導(dǎo)致的估計(jì)偏差。2.3LIML的具體推導(dǎo):從似然函數(shù)到估計(jì)量假設(shè)我們有如下的結(jié)構(gòu)方程(StructuralEquation):[Y=+X+]其中X是內(nèi)生解釋變量,Z是外生工具變量(包含k個工具變量)。為了應(yīng)用極大似然估計(jì),我們需要構(gòu)建內(nèi)生變量X和被解釋變量Y的聯(lián)合分布。通常假設(shè)(X,Y)服從多元正態(tài)分布,其均值和協(xié)方差矩陣可以通過結(jié)構(gòu)方程和簡化式方程(ReducedFormEquation)來表示。簡化式方程描述了內(nèi)生變量X如何被外生變量Z決定,即:[X=_0+Z+v]其中π是簡化式參數(shù),v是簡化式誤差項(xiàng)。結(jié)構(gòu)方程和簡化式方程共同構(gòu)成了一個聯(lián)立方程系統(tǒng),誤差項(xiàng)(ε,v)服從二維正態(tài)分布,協(xié)方差矩陣為:[=]LIML的似然函數(shù)基于(X,Y)的聯(lián)合分布構(gòu)建,通過最大化似然函數(shù)來估計(jì)結(jié)構(gòu)參數(shù)β。經(jīng)過數(shù)學(xué)推導(dǎo)(這里不展開復(fù)雜的矩陣運(yùn)算),LIML估計(jì)量可以等價(jià)地表示為求解一個廣義特征值問題:找到最小的λ,使得矩陣(Y-βX)’M_Z(Y-βX)=λ(X’M_ZX),其中M_Z是投影矩陣(用于消除Z的影響)。這個λ被稱為“LIML估計(jì)的偏誤因子”,當(dāng)λ=1時,LIML退化為2SLS估計(jì)量。2.4LIML的統(tǒng)計(jì)性質(zhì):小樣本下的“穩(wěn)健優(yōu)勢”LIML的獨(dú)特魅力在于其統(tǒng)計(jì)性質(zhì)。在大樣本下,LIML和2SLS都是一致估計(jì)量(隨著樣本量增大,估計(jì)值趨近于真實(shí)值),但在小樣本下,LIML的偏差通常小于2SLS。尤其是當(dāng)工具變量較弱時(即工具變量與內(nèi)生變量的相關(guān)性較低),2SLS的偏差會顯著增大,而LIML對弱工具變量的穩(wěn)健性更強(qiáng)。此外,LIML估計(jì)量具有“不變性”,即對被解釋變量的尺度變換不敏感(比如將Y從“萬元”轉(zhuǎn)換為“元”,估計(jì)結(jié)果的數(shù)值會相應(yīng)調(diào)整,但統(tǒng)計(jì)性質(zhì)不變),這在實(shí)際應(yīng)用中非常有用。三、LIML與2SLS的對比:方法選擇的“天平”3.1目標(biāo)函數(shù)的差異:最小二乘vs最大似然2SLS的目標(biāo)函數(shù)是最小化第二階段回歸的殘差平方和,本質(zhì)上是一種矩估計(jì)(MethodofMoments,MM),通過構(gòu)造工具變量與誤差項(xiàng)的正交條件(E[Z’ε]=0)來估計(jì)參數(shù)。而LIML的目標(biāo)函數(shù)是最大化似然函數(shù),基于數(shù)據(jù)的聯(lián)合分布假設(shè),利用了更多的概率信息。這種差異導(dǎo)致兩者在小樣本下的表現(xiàn)不同:MM方法(如2SLS)通常計(jì)算簡單,但可能忽略分布信息;MLE方法(如LIML)利用了分布信息,統(tǒng)計(jì)性質(zhì)更優(yōu),但計(jì)算復(fù)雜度稍高。3.2小樣本偏差:LIML的“溫柔一刀”為了更直觀地理解兩者的差異,我們可以考慮一個簡單的蒙特卡洛模擬(假設(shè)數(shù)據(jù)生成過程已知)。假設(shè)真實(shí)模型為Y=0.5X+ε,X=Z+v,其中Z是工具變量,ε和v服從均值為0、方差為1的正態(tài)分布,且ε和v的相關(guān)系數(shù)為0.8(內(nèi)生性較強(qiáng))。當(dāng)樣本量n=50(小樣本)且工具變量Z與X的相關(guān)系數(shù)為0.2(弱工具)時,2SLS的平均估計(jì)值為0.72(偏差為0.22),而LIML的平均估計(jì)值為0.61(偏差為0.11),偏差減少了一半。當(dāng)工具變量相關(guān)性提高到0.5(強(qiáng)工具)時,兩者的偏差都減小,但LIML仍略優(yōu)。3.3假設(shè)檢驗(yàn)的可靠性:LIML的“穩(wěn)定輸出”在假設(shè)檢驗(yàn)中,2SLS通常使用t檢驗(yàn)或F檢驗(yàn),但在小樣本或弱工具情況下,這些檢驗(yàn)的實(shí)際顯著性水平(TypeIError)可能遠(yuǎn)高于名義水平(如5%),導(dǎo)致“假陽性”結(jié)果。而LIML的檢驗(yàn)統(tǒng)計(jì)量(如似然比檢驗(yàn))在小樣本下更接近理論分布,檢驗(yàn)結(jié)果更可靠。例如,在上述模擬中,當(dāng)使用2SLS進(jìn)行t檢驗(yàn)時,拒絕真實(shí)原假設(shè)(β=0.5)的概率為12%(名義水平5%),而LIML的拒絕概率為6.5%,更接近5%的名義水平。3.4計(jì)算復(fù)雜度:從“手動計(jì)算”到“軟件支持”早期的LIML計(jì)算需要求解特征值問題,對研究者的數(shù)學(xué)能力要求較高,而2SLS只需兩次OLS回歸,操作簡單。但隨著計(jì)量軟件的發(fā)展(如Stata、R、EViews等),LIML的計(jì)算已經(jīng)變得非常便捷。例如,在Stata中,只需輸入“ivregresslimlY(X=Z)”即可得到LIML估計(jì)結(jié)果,與2SLS的命令“ivregress2slsY(X=Z)”僅一字之差。這使得LIML的應(yīng)用門檻大大降低,越來越多的研究者開始嘗試使用。四、LIML的實(shí)際應(yīng)用:從理論到實(shí)踐的“最后一公里”4.1應(yīng)用場景的選擇:何時該用LIML?LIML并非“包治百病”的萬能藥,它的適用場景需要結(jié)合具體問題來判斷。以下幾種情況,LIML可能是更好的選擇:-小樣本研究:當(dāng)樣本量較?。ㄈ鏽<100)時,2SLS的偏差可能較大,LIML的小樣本性質(zhì)更優(yōu);-弱工具變量:工具變量與內(nèi)生變量的相關(guān)性較弱(通常用第一階段F統(tǒng)計(jì)量判斷,一般認(rèn)為F<10時存在弱工具問題);-嚴(yán)格的統(tǒng)計(jì)推斷:需要進(jìn)行可靠的假設(shè)檢驗(yàn)或置信區(qū)間估計(jì)時,LIML的檢驗(yàn)結(jié)果更接近理論分布;-聯(lián)立方程模型的單方程估計(jì):在聯(lián)立方程系統(tǒng)中,若只關(guān)注單個方程的估計(jì),LIML的“有限信息”特性可以避免引入其他方程的干擾。4.2操作步驟:從數(shù)據(jù)準(zhǔn)備到結(jié)果解讀使用LIML進(jìn)行估計(jì)的具體步驟如下:1.識別問題診斷:首先需要確認(rèn)模型存在內(nèi)生性問題(可以通過豪斯曼檢驗(yàn)HausmanTest判斷OLS和2SLS估計(jì)量是否有顯著差異);2.工具變量選擇:選擇滿足相關(guān)性和外生性的工具變量(相關(guān)性可以通過第一階段F統(tǒng)計(jì)量檢驗(yàn),外生性可以通過過度識別檢驗(yàn)SarganTest或HansenJ檢驗(yàn));3.模型設(shè)定:明確結(jié)構(gòu)方程和簡化式方程的形式,確保工具變量的數(shù)量不少于內(nèi)生變量的數(shù)量(恰好識別或過度識別);4.LIML估計(jì):使用計(jì)量軟件進(jìn)行估計(jì),得到參數(shù)估計(jì)值、標(biāo)準(zhǔn)誤、t統(tǒng)計(jì)量等結(jié)果;5.結(jié)果驗(yàn)證:檢查估計(jì)量的符號和大小是否符合理論預(yù)期,進(jìn)行穩(wěn)健性檢驗(yàn)(如更換工具變量、改變樣本范圍等),確保結(jié)果的可靠性。4.3常見問題與注意事項(xiàng)在實(shí)際應(yīng)用中,使用LIML需要注意以下幾點(diǎn):-工具變量的外生性:外生性是工具變量的“生命線”,如果工具變量與誤差項(xiàng)相關(guān),LIML估計(jì)量同樣會有偏。雖然過度識別檢驗(yàn)可以檢驗(yàn)多個工具變量的聯(lián)合外生性,但無法檢驗(yàn)恰好識別情況下的外生性,此時需要依賴經(jīng)濟(jì)理論和常識進(jìn)行判斷;-弱工具變量的處理:即使使用LIML,弱工具變量仍然會導(dǎo)致估計(jì)量的方差增大,置信區(qū)間變寬。因此,在選擇工具變量時,應(yīng)盡量選擇強(qiáng)工具變量(第一階段F統(tǒng)計(jì)量>10);-多重共線性:如果工具變量之間存在高度相關(guān)性(多重共線性),會導(dǎo)致第一階段回歸的擬合效果下降,影響LIML的估計(jì)結(jié)果??梢酝ㄟ^計(jì)算方差膨脹因子(VIF)來檢驗(yàn)多重共線性;-異方差與自相關(guān):LIML假設(shè)誤差項(xiàng)是同方差且無自相關(guān)的,如果存在異方差或自相關(guān),需要使用穩(wěn)健標(biāo)準(zhǔn)誤(如異方差穩(wěn)健標(biāo)準(zhǔn)誤)進(jìn)行修正。五、總結(jié)與展望:LIML在計(jì)量經(jīng)濟(jì)學(xué)中的“未來之路”回顧工具變量法的發(fā)展歷程,從2SLS到LIML,再到近年來興起的GMM(廣義矩估計(jì))、JackknifeIV等方法,每一次進(jìn)步都是為了更好地解決內(nèi)生性問題,提高估計(jì)的準(zhǔn)確性和可靠性。LIML作為其中的重要一員,憑借其在小樣本和弱工具變量下的穩(wěn)健性,已經(jīng)在勞動經(jīng)濟(jì)學(xué)、發(fā)展經(jīng)濟(jì)學(xué)、金融經(jīng)濟(jì)學(xué)等領(lǐng)域得到了廣泛應(yīng)用。例如,在研究教育對收入的影響時,學(xué)者們常用出生季度、距離學(xué)校的遠(yuǎn)近等作為工具變量,此時LIML的估計(jì)結(jié)果往往比2SLS更可信。當(dāng)然,LIML也并非完美無缺。它對誤差項(xiàng)的正態(tài)分布假設(shè)較為敏感(盡管大樣本下漸近正態(tài)性可以緩解這一問題),計(jì)算過程依賴計(jì)量軟件的支持,對于復(fù)雜模型(如非線性模型)的擴(kuò)展也存在一定難度。但隨著計(jì)量經(jīng)濟(jì)學(xué)理論的發(fā)展和計(jì)算技術(shù)的進(jìn)步,這些問題正在逐步得到解決。例如,非參數(shù)LIML、分位數(shù)LIML等擴(kuò)展方法的提出,使得LIML的應(yīng)用范圍進(jìn)一步擴(kuò)大。作為一名在計(jì)量經(jīng)濟(jì)學(xué)領(lǐng)域摸爬滾打多年的研究者,我深刻體會到,方法的選擇從來不是“非此即彼”的,而是需

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論