下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
空間誤差模型的極大似然實(shí)現(xiàn)引言:從“空間無(wú)關(guān)”到“空間依賴”的計(jì)量革命剛?cè)胄凶鰠^(qū)域經(jīng)濟(jì)分析時(shí),我總覺(jué)得用普通線性回歸就能解決大部分問(wèn)題——把影響因素列出來(lái),跑個(gè)OLS,看系數(shù)顯著性,一切都“科學(xué)”得很。直到有次用省際GDP數(shù)據(jù)做研究,導(dǎo)師指著殘差圖問(wèn):“你看浙江和江蘇的殘差都是正的,福建和廣東也是正的,這真的只是隨機(jī)誤差嗎?”我這才意識(shí)到,地理相鄰的區(qū)域可能存在某種“隱性關(guān)聯(lián)”,傳統(tǒng)計(jì)量模型假設(shè)的“誤差項(xiàng)獨(dú)立同分布”在現(xiàn)實(shí)中可能不成立。這種空間依賴現(xiàn)象,正是空間計(jì)量經(jīng)濟(jì)學(xué)要解決的核心問(wèn)題,而空間誤差模型(SpatialErrorModel,SEM)就是其中最常用的工具之一。一、空間誤差模型的基礎(chǔ)設(shè)定:從經(jīng)典回歸到空間修正1.1經(jīng)典線性回歸模型的“空間盲視”經(jīng)典線性回歸模型的基本形式是(y=X+),其中誤差項(xiàng)()滿足(E()=0)、(Var()=^2I)。這一假設(shè)隱含了“空間無(wú)關(guān)”的前提——每個(gè)觀測(cè)點(diǎn)的誤差只受自身因素影響,與其他點(diǎn)無(wú)關(guān)。但現(xiàn)實(shí)中,相鄰地區(qū)的經(jīng)濟(jì)活動(dòng)可能通過(guò)貿(mào)易、技術(shù)溢出、政策模仿等渠道相互影響,導(dǎo)致誤差項(xiàng)存在空間相關(guān)性。比如,某縣的農(nóng)業(yè)產(chǎn)出殘差為正(實(shí)際值高于預(yù)測(cè)值),可能是因?yàn)橄噜徔h的農(nóng)業(yè)補(bǔ)貼政策帶動(dòng)了本縣農(nóng)產(chǎn)品運(yùn)輸成本下降,這種“鄰居效應(yīng)”無(wú)法被經(jīng)典模型捕捉。1.2空間誤差模型的修正邏輯空間誤差模型通過(guò)引入空間滯后誤差項(xiàng)來(lái)刻畫這種相關(guān)性,其核心設(shè)定為:(y=X+u)(u=Wu+)其中,(W)是(nn)的空間權(quán)重矩陣(描述觀測(cè)點(diǎn)間的空間關(guān)系,常見(jiàn)如鄰接矩陣、距離倒數(shù)矩陣),()是空間誤差系數(shù)((||<1)保證模型平穩(wěn)),(N(0,^2I))是獨(dú)立同分布的隨機(jī)誤差。簡(jiǎn)單來(lái)說(shuō),模型認(rèn)為誤差項(xiàng)(u)不僅包含獨(dú)立誤差(),還包含由空間鄰居誤差(Wu)帶來(lái)的傳導(dǎo)效應(yīng)——就像往平靜的湖面扔一顆石子,漣漪會(huì)擴(kuò)散到周圍區(qū)域。1.3空間權(quán)重矩陣的“地基作用”理解SEM的關(guān)鍵第一步是明確(W)的構(gòu)造。我曾在實(shí)際操作中吃過(guò)虧:一開(kāi)始為了省事直接用了一階鄰接矩陣(只考慮直接接壤的鄰居),結(jié)果模型擬合效果很差。后來(lái)才知道,當(dāng)研究對(duì)象是人口流動(dòng)時(shí),可能需要用距離衰減矩陣(權(quán)重與距離平方成反比);當(dāng)研究政策擴(kuò)散時(shí),可能需要用經(jīng)濟(jì)相似度矩陣(權(quán)重與人均GDP差的絕對(duì)值成反比)。(W)就像模型的“地基”,不同的構(gòu)造方式會(huì)直接影響()的估計(jì)結(jié)果,甚至改變對(duì)空間依賴性的判斷。實(shí)踐中通常需要嘗試多種權(quán)重矩陣,并通過(guò)似然比檢驗(yàn)等方法選擇最優(yōu)形式。二、極大似然估計(jì)的理論框架:從概率密度到對(duì)數(shù)似然2.1為什么選擇極大似然估計(jì)?空間計(jì)量模型的估計(jì)方法主要有極大似然(MLE)、廣義矩估計(jì)(GMM)和貝葉斯估計(jì)(Bayesian)。選擇MLE的原因很實(shí)際:一方面,MLE在大樣本下具有一致性、漸近有效性和漸近正態(tài)性,統(tǒng)計(jì)性質(zhì)優(yōu)良;另一方面,空間誤差模型的似然函數(shù)可以通過(guò)矩陣行列式和逆的運(yùn)算顯式表達(dá),計(jì)算相對(duì)可行(相比之下,空間滯后模型的MLE需要處理因變量的空間滯后項(xiàng),計(jì)算更復(fù)雜)。我在做碩士論文時(shí)比較過(guò)MLE和GMM的結(jié)果,發(fā)現(xiàn)當(dāng)樣本量超過(guò)100時(shí),MLE的標(biāo)準(zhǔn)誤明顯更小,估計(jì)值更接近真實(shí)參數(shù)。2.2似然函數(shù)的構(gòu)造步驟要構(gòu)造似然函數(shù),首先需要明確誤差項(xiàng)(u)的分布。根據(jù)模型設(shè)定,(u=(IW)^{-1})(通過(guò)移項(xiàng)(uWu=)可得((IW)u=),進(jìn)而(u=(IW)^{-1}))。由于()服從正態(tài)分布,(u)也服從多元正態(tài)分布,其均值為0,協(xié)方差矩陣為(=^2(IW)^{-1}(IW)^{-T})(因?yàn)?Var(u)=(IW)^{-1}Var()(IW)^{-T}=^2(IW)^{-1}(IW)^{-T}))。觀測(cè)值(y)的條件分布為(y|XN(X,)),因此似然函數(shù)為:(L(,,^2|y,X,W)=(2)^{-n/2}||^{-1/2})為了計(jì)算方便,通常取對(duì)數(shù)似然函數(shù)(對(duì)數(shù)變換不改變極大值點(diǎn)):(L=-(2)||(yX)^T^{-1}(yX))代入()的表達(dá)式,注意到(||=^{2n}|(IW)^{-1}(IW)^{-T}|=^{2n}|IW|^{-2})(因?yàn)榫仃囆辛惺降某朔e等于乘積的行列式,且轉(zhuǎn)置行列式不變),因此(||=2n|IW|)。同時(shí),(^{-1}=(IW)^T(IW)),代入后對(duì)數(shù)似然函數(shù)可簡(jiǎn)化為:(L=-(2)n+|IW|(yX)^T(IW)^T(IW)(yX))這一步推導(dǎo)剛開(kāi)始看時(shí)特別頭疼,尤其是矩陣行列式和逆的運(yùn)算。后來(lái)我把(IW)想象成一個(gè)“空間過(guò)濾矩陣”——它把原始誤差()過(guò)濾成具有空間相關(guān)性的(u),而對(duì)數(shù)似然函數(shù)中的(|IW|)項(xiàng)正是在“懲罰”這種空間相關(guān)性的強(qiáng)度。2.3關(guān)鍵參數(shù)的分離與簡(jiǎn)化觀察對(duì)數(shù)似然函數(shù)可以發(fā)現(xiàn),參數(shù)()、()、(^2)并非完全獨(dú)立。對(duì)于給定的(),可以先估計(jì)()和(^2)。令(e=(IW)(yX)),則((yX)^T(IW)^T(IW)(yX)=e^Te)。對(duì)()求偏導(dǎo)并令其為0,可得()的條件極大似然估計(jì)為(()=(X^T(IW)^T(IW)X){-1}XT(IW)^T(IW)y),這類似于加權(quán)最小二乘估計(jì),權(quán)重矩陣為((IW)^T(IW))。將(())代入對(duì)數(shù)似然函數(shù),可得到關(guān)于()和(^2)的輪廓對(duì)數(shù)似然函數(shù)。進(jìn)一步對(duì)(^2)求導(dǎo),可得(^2()=),其中(e=(IW)(yX()))。最終,對(duì)數(shù)似然函數(shù)簡(jiǎn)化為僅關(guān)于()的函數(shù):(L()=-(1+(2))+|IW|())這一步的意義在于將三維參數(shù)估計(jì)((,,^2))轉(zhuǎn)化為一維優(yōu)化問(wèn)題(僅估計(jì)()),大大降低了計(jì)算復(fù)雜度。我在用Stata的spreg命令時(shí),軟件底層其實(shí)就是在不斷迭代()的值,每次計(jì)算對(duì)應(yīng)的()和(^2),直到對(duì)數(shù)似然值不再增加。三、極大似然估計(jì)的實(shí)現(xiàn)步驟:從理論到代碼的落地3.1數(shù)據(jù)準(zhǔn)備與權(quán)重矩陣構(gòu)建實(shí)際操作的第一步是整理數(shù)據(jù)。假設(shè)我們要研究某國(guó)30個(gè)省份的人均GDP((y)),解釋變量包括資本存量((X_1))、勞動(dòng)力數(shù)量((X_2))、教育水平((X_3)),需要將這些變量整理成(n)的(y)向量和(nk)的(X)矩陣((n=30,k=3))。接下來(lái)是構(gòu)建空間權(quán)重矩陣(W)。最常用的是一階鄰接矩陣:如果省份(i)和(j)有共同邊界,(W_{ij}=1),否則為0;然后行標(biāo)準(zhǔn)化(每行元素之和為1),使權(quán)重具有可比性。我曾用地理信息系統(tǒng)(GIS)軟件直接導(dǎo)出鄰接關(guān)系,比手動(dòng)編寫代碼高效得多。需要注意的是,(W)必須是對(duì)稱矩陣嗎?不一定,比如用經(jīng)濟(jì)距離時(shí),(W_{ij})可以是(i)對(duì)(j)的貿(mào)易額,這時(shí)候(W)可能不對(duì)稱,但實(shí)踐中通常會(huì)強(qiáng)制對(duì)稱(如取(W_{ij}=W_{ji}=(貿(mào)易額_{ij}+貿(mào)易額_{ji})/2)),以避免模型出現(xiàn)奇異性。3.2對(duì)數(shù)似然函數(shù)的數(shù)值計(jì)算雖然理論上對(duì)數(shù)似然函數(shù)可以簡(jiǎn)化為(L()),但實(shí)際計(jì)算中需要處理兩個(gè)難點(diǎn):矩陣行列式的計(jì)算:(|IW|)的計(jì)算復(fù)雜度為(O(n^3)),當(dāng)(n)很大時(shí)(比如500個(gè)縣級(jí)數(shù)據(jù)),直接計(jì)算會(huì)非常耗時(shí)。常用的優(yōu)化方法是利用(W)的特征值分解——如果(W=QQ^T)((Q)是正交矩陣,()是特征值對(duì)角矩陣),則(|IW|=_{i=1}^n(1_i)),其中(_i)是(W)的第(i)個(gè)特征值。這一步將行列式的計(jì)算從矩陣運(yùn)算轉(zhuǎn)化為特征值的乘積,計(jì)算量大幅降低。殘差平方和的計(jì)算:(e^Te=[(IW)(yX())]^T[(IW)(yX())]),其中(())涉及(X^T(IW)^T(IW)X)的逆矩陣。實(shí)際計(jì)算中可以先對(duì)(X)進(jìn)行“空間過(guò)濾”——令(X^*=(IW)X),(y^*=(IW)y),則(()=(X^{T}X){-1}X{T}y),這其實(shí)就是對(duì)過(guò)濾后的數(shù)據(jù)做普通OLS,計(jì)算起來(lái)更直觀。3.3優(yōu)化算法的選擇與收斂性檢驗(yàn)得到(L())的表達(dá)式后,需要找到使(L())最大的()值。常用的優(yōu)化算法包括牛頓-拉夫森法(Newton-Raphson)、BFGS擬牛頓法、Nelder-Mead單純形法等。我在實(shí)踐中發(fā)現(xiàn),當(dāng)()的初始值接近真實(shí)值時(shí)(比如用OLS殘差的空間自相關(guān)系數(shù)Moran’sI作為初始值),牛頓法收斂速度最快;但如果初始值偏差較大,BFGS法更穩(wěn)健,不容易陷入局部極大值。收斂性檢驗(yàn)是關(guān)鍵步驟。軟件通常會(huì)輸出迭代次數(shù)、對(duì)數(shù)似然值的變化量(如兩次迭代的對(duì)數(shù)似然差小于(10^{-5}))、參數(shù)估計(jì)值的變化量(如()的變化小于(10^{-4}))等指標(biāo)。有次我跑模型時(shí),發(fā)現(xiàn)對(duì)數(shù)似然值在第5次迭代后不再變化,但()的估計(jì)值從0.3跳到0.8,后來(lái)檢查發(fā)現(xiàn)是權(quán)重矩陣沒(méi)有行標(biāo)準(zhǔn)化,導(dǎo)致(W)的特征值超過(guò)1,違反了(||<1)的平穩(wěn)性條件,調(diào)整后收斂正常。3.4標(biāo)準(zhǔn)誤與假設(shè)檢驗(yàn)得到參數(shù)估計(jì)值()、()、(^2)后,需要計(jì)算它們的標(biāo)準(zhǔn)誤以進(jìn)行統(tǒng)計(jì)推斷。極大似然估計(jì)的標(biāo)準(zhǔn)誤可以通過(guò)信息矩陣的逆得到,信息矩陣(I()=-E),其中(=(^T,,2)T)。實(shí)際中常用“三明治估計(jì)量”(Huber-Whiteestimator)來(lái)計(jì)算穩(wěn)健標(biāo)準(zhǔn)誤,尤其是當(dāng)誤差項(xiàng)存在異方差時(shí)。假設(shè)檢驗(yàn)主要包括:空間誤差系數(shù)()的顯著性:檢驗(yàn)(H_0:=0),若拒絕原假設(shè),說(shuō)明存在顯著的空間誤差相關(guān)性;解釋變量(X)的顯著性:檢驗(yàn)(H_0:_j=0),與經(jīng)典回歸類似;模型整體擬合優(yōu)度:常用偽(R^2)(如(1)),但需注意空間模型的(R^2)通常高于OLS,因?yàn)椴蹲搅丝臻g相關(guān)性。四、實(shí)際應(yīng)用中的常見(jiàn)問(wèn)題與解決思路4.1權(quán)重矩陣的敏感性問(wèn)題權(quán)重矩陣的選擇對(duì)結(jié)果影響有多大?我曾用同一組數(shù)據(jù)分別構(gòu)造鄰接矩陣、距離矩陣(閾值100公里)、經(jīng)濟(jì)矩陣(人均GDP差的倒數(shù)),結(jié)果()的估計(jì)值分別為0.42、0.58、0.31,顯著性也不同。解決方法是:理論驅(qū)動(dòng):根據(jù)研究問(wèn)題選擇權(quán)重矩陣——研究地理溢出用鄰接/距離矩陣,研究經(jīng)濟(jì)溢出用經(jīng)濟(jì)相似度矩陣;穩(wěn)健性檢驗(yàn):報(bào)告多種權(quán)重矩陣下的估計(jì)結(jié)果,說(shuō)明結(jié)論的一致性;數(shù)據(jù)驅(qū)動(dòng):使用空間自相關(guān)檢驗(yàn)(如Moran’sI)選擇最優(yōu)權(quán)重矩陣,比如當(dāng)Moran’sI在距離矩陣下最大時(shí),說(shuō)明距離衰減效應(yīng)更顯著。4.2多重共線性與弱工具變量問(wèn)題在空間誤差模型中,解釋變量(X)可能存在多重共線性(如資本存量和勞動(dòng)力數(shù)量高度相關(guān)),導(dǎo)致((X{T}X^){-1})矩陣接近奇異,估計(jì)值不穩(wěn)定。解決方法包括:主成分分析:將高度相關(guān)的變量降維為少數(shù)主成分;嶺回歸:在(X^{T}X^)中加入一個(gè)小的對(duì)角矩陣(kI)((k>0)),緩解奇異性;逐步回歸:通過(guò)統(tǒng)計(jì)檢驗(yàn)剔除冗余變量。4.3大樣本下的計(jì)算效率問(wèn)題當(dāng)(n)超過(guò)1000時(shí),計(jì)算((IW))的特征值或逆矩陣會(huì)非常耗時(shí)。這時(shí)候可以采用稀疏矩陣技術(shù)(因?yàn)?W)通常是稀疏的,大部分元素為0),或者使用近似方法(如基于特征值的截?cái)啵槐A羟?00個(gè)最大的特征值計(jì)算行列式)。我曾用Python的scipy.sparse模塊處理過(guò)5000個(gè)觀測(cè)點(diǎn)的空間數(shù)據(jù),計(jì)算時(shí)間從原來(lái)的幾小時(shí)縮短到幾分鐘,效率提升顯著。五、結(jié)論:從模型實(shí)現(xiàn)到經(jīng)濟(jì)解釋的跨越回顧整個(gè)過(guò)程,空間誤差模型的極大似然實(shí)現(xiàn)就像搭建一座房子——權(quán)重矩陣是地基,似然函數(shù)是框架,優(yōu)化算法是施工工具,而最終的參數(shù)估計(jì)則是房子的“完工驗(yàn)收”。它不僅是一個(gè)數(shù)學(xué)過(guò)程,更是對(duì)現(xiàn)實(shí)空間依賴關(guān)系的嚴(yán)謹(jǐn)刻畫。在實(shí)際應(yīng)用中,我們不能只盯著()是否顯著,更要思考其經(jīng)濟(jì)含義。比如,若(=0.6)且顯著,說(shuō)明某地區(qū)的誤差有60%來(lái)自相鄰地區(qū)的誤差傳導(dǎo),這可能意味著政策效果存在“溢出衰減”——一個(gè)縣的扶貧政策不僅影響本縣,還會(huì)通過(guò)鄰縣的產(chǎn)業(yè)聯(lián)動(dòng)間接發(fā)揮作用。這種空間依賴性的量化,為區(qū)域政策設(shè)計(jì)提供
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東公路養(yǎng)護(hù)統(tǒng)計(jì)調(diào)查制度
- 山西師范大學(xué)現(xiàn)代文理學(xué)院《電視節(jié)目綜合制作》2023-2024學(xué)年第二學(xué)期期末試卷
- 山東旅游職業(yè)學(xué)院《醫(yī)用化學(xué)實(shí)驗(yàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 安徽藝術(shù)學(xué)院《數(shù)字圖像處理》2023-2024學(xué)年第二學(xué)期期末試卷
- 浙江體育職業(yè)技術(shù)學(xué)院《信息技術(shù)在心理健康教育中的應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 上海東海職業(yè)技術(shù)學(xué)院《SOC數(shù)字集成系統(tǒng)設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 農(nóng)家書(shū)屋三個(gè)制度
- 湖南財(cái)政經(jīng)濟(jì)學(xué)院《麻醉藥理學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 鄭州商學(xué)院《塑性加工設(shè)備》2023-2024學(xué)年第二學(xué)期期末試卷
- 南京醫(yī)科大學(xué)《獸醫(yī)免疫學(xué)實(shí)驗(yàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2026國(guó)家國(guó)防科技工業(yè)局所屬事業(yè)單位第一批招聘62人備考題庫(kù)及答案詳解一套
- 學(xué)堂在線 雨課堂 學(xué)堂云 西方哲學(xué)精神探源 期末考試答案
- 玻璃安裝合同范本
- 江蘇省南京市2024-2025學(xué)年高一上學(xué)期期末考試歷史試卷(含答案)
- 小學(xué)四年級(jí)多位數(shù)乘除法400題
- 煙草物理檢驗(yàn)競(jìng)賽考試題庫(kù)及答案附有答案
- 國(guó)際經(jīng)濟(jì)學(xué) 課件14 匯率理論
- 身份證籍貫自動(dòng)對(duì)照自動(dòng)生成
- 銀屑病病人的護(hù)理
- 農(nóng)場(chǎng)農(nóng)業(yè)光伏大棚項(xiàng)目一期工程施工組織設(shè)計(jì)(完整版)資料
- 中醫(yī)學(xué)基礎(chǔ)-緒論課件
評(píng)論
0/150
提交評(píng)論