版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、讓“跳躍”更有意義:斷點(diǎn)回歸設(shè)計(jì) (RDD)原創(chuàng) 2016-09-24 張立龍 定量群學(xué)在一個(gè)高度依賴規(guī)則的世界里,有些規(guī)則的出現(xiàn)十分隨意,這種隨意性為我們提供了性質(zhì)良好的實(shí)驗(yàn) ( Angrist& Pischke , 2009 ) 。 斷點(diǎn)回歸設(shè)計(jì)( RegressionDiscontinuity Design )是一種僅次于隨機(jī)實(shí)驗(yàn)的能夠有效利用現(xiàn)實(shí)約束條件分析變量之間因果關(guān)系的實(shí)證方法。Lee ( 2008 )認(rèn)為在隨機(jī)實(shí)驗(yàn)不可得的情況下,斷點(diǎn)回歸能夠避免參數(shù)估計(jì)的內(nèi)生性問題,從而真實(shí)反映出變量之間的因果關(guān)系。斷點(diǎn)回歸方法首先是由美國(guó)西北大學(xué)心理學(xué)家Campbell 于 1958 年提出
2、的;并與 1960 年,與 Thistlethwaite 正式發(fā)表了第一篇關(guān)于斷點(diǎn)回歸的論文,提出斷點(diǎn)回歸是在非實(shí)驗(yàn)的情況下處理處置效應(yīng)(Treatment Effects )的一種有效的方法,主要應(yīng)用于心理學(xué)和教育學(xué)領(lǐng)域。 1963 年, Campbell and Stanley 為斷點(diǎn)回歸提供了更加清晰化的概念,但由于當(dāng)時(shí)還缺乏嚴(yán)密的統(tǒng)計(jì)證明,加之 IV 方法在處理內(nèi)生性的思路和范式上具有更廣闊的適用范圍,因此在隨后的幾十年間,RD 方法一直沒有得到經(jīng)濟(jì)學(xué)者的重視。直到上世紀(jì)90 年代末,隨著該方法的理論基礎(chǔ)得到進(jìn)一步發(fā)展,大量經(jīng)濟(jì)學(xué)文獻(xiàn)才開始使用RD 方法對(duì)變量 之間的因果關(guān)系進(jìn)行識(shí)別。
3、斷點(diǎn)回歸可以分為兩類,一類是模糊斷點(diǎn)回歸( Fuzzy RD ) , 另一類是清晰斷點(diǎn)回歸(SharpRD)。清晰斷點(diǎn)回歸可以看作是一種基于可觀察變量進(jìn)行的選擇( selection-on-observablesstory ),而模糊斷點(diǎn)回歸則常被視為一種工具變量的方法( instrumental-variables-type )。清晰斷點(diǎn)回歸(Sharp RD)當(dāng)處理狀態(tài)是協(xié)變量確定型、不連續(xù)函數(shù)時(shí),可以使用清晰間斷點(diǎn)回歸法。對(duì)于清晰斷點(diǎn)回歸,個(gè)體在臨界值的一邊接受處理效應(yīng)(treatment effect )的概率為0,而在臨界值另一邊的概率則為1 。 最早使用清晰斷點(diǎn)回歸方法的典型例子是
4、:獲得國(guó)家杰出獎(jiǎng)學(xué)金的學(xué)生是不是會(huì)更愿意讀研究生(Thistlewaithe and Campbell,1960; Campbell, 1969)。清晰斷點(diǎn)回歸通過比較PSAT 分?jǐn)?shù)剛好高于或低于國(guó)家杰出獎(jiǎng)學(xué)金分?jǐn)?shù)線的那些高中生的研究生入學(xué)率來回答這一問題。一般情況下,在 PAST 考試中得分越高的學(xué)生,其將來讀研究生的概率也就越大。通過回歸來擬合研究生院入學(xué)率和PSAT 之間的關(guān)系,可以控制這一趨勢(shì),將分?jǐn)?shù)線附近PSAT 成績(jī)和大學(xué)入學(xué)率之間的關(guān)系中出現(xiàn)的跳躍視為存在處理效應(yīng)的證據(jù)。Imben and Limieux(2008) 認(rèn)為斷點(diǎn)回歸的有效性依賴于我們對(duì)協(xié)變量的外推,或者至少在協(xié)變量
5、有不連續(xù)的那個(gè)領(lǐng)域內(nèi)外推,因此, 條件期望函數(shù)的具體形式的設(shè)定很重要。給予具體函數(shù)形式得到的斷點(diǎn)回歸估計(jì)值的有效性依賴于多項(xiàng)式模型能否精確的描述條件期望函數(shù)。 如果不能,那么看上去由于個(gè)體被處理而發(fā)生的跳躍可能只不過是條件期望函數(shù)的某個(gè)點(diǎn)的不連續(xù),在設(shè)定期望函數(shù)之前我們并沒有預(yù)計(jì)到這種不連續(xù)。為了使得這種錯(cuò)誤降低到最低,斷點(diǎn)回歸在實(shí)際操作中只去考察在不連續(xù)點(diǎn)的領(lǐng)域中的數(shù)據(jù),也就是考察區(qū)間x0- ,x0+ ,其中為某個(gè)很小的正數(shù)。換言之,在x0 左側(cè)和右側(cè)一個(gè)足夠小領(lǐng)域內(nèi)比較Y1i和 Y0i 的平均值之間的差別,就可估計(jì)出處理效應(yīng),而這種方法與條件期望函數(shù)的具體的形式無關(guān)。斷點(diǎn)回歸估計(jì)方法可以分
6、為參數(shù)估計(jì)和非參數(shù)方法的估計(jì)。大部分利用斷點(diǎn)回歸進(jìn)行的經(jīng)驗(yàn)研究中,仍然是參數(shù)型估計(jì)。參數(shù)估計(jì)方法內(nèi)涵一個(gè)思想是:賦予靠近臨界值的數(shù)據(jù)點(diǎn)更大的權(quán)重。隨著不連續(xù)樣本窗口的縮小,斷點(diǎn)回歸估計(jì)值會(huì)變得不精確,但是用來模型化函數(shù)f( xi )的多項(xiàng)式的階數(shù)也會(huì)下降。當(dāng)以X0 為中心不斷調(diào)整樣本窗口大小時(shí),控制變量會(huì)逐漸變少,但Di 的處理效應(yīng)會(huì)保持穩(wěn)定。非參數(shù)方法的應(yīng)用越來越廣泛。使用非參數(shù)方法對(duì)斷點(diǎn)回歸進(jìn)行估計(jì)時(shí),需要分別對(duì)x0 左側(cè)和右側(cè)領(lǐng)域中的Yi 的平均值做出精確估計(jì),但這至少會(huì)遇到兩個(gè)問題:如果在臨界值很小的領(lǐng)域中進(jìn)行估計(jì),那么可用的數(shù)據(jù)就相對(duì)較少;在有界領(lǐng)域中對(duì)條件期望函數(shù)的估計(jì)是有偏的。針
7、對(duì)這一問題,Hahn, Todd and van der Klaauw 在 2001 年提出了使用非參數(shù)的局部線性回歸,感興趣的讀者可以進(jìn)一步閱讀。清晰斷點(diǎn)回歸的一個(gè)經(jīng)典例子是關(guān)于執(zhí)政黨地位對(duì)其再次當(dāng)選的研究。在美國(guó)的議會(huì)政治中,執(zhí)政黨被再次高概率當(dāng)選已經(jīng)成為美國(guó)議會(huì)政治中最為引人注目的事實(shí)。Lee 在其一文中試圖回答的問題是:如果民主黨在上次競(jìng)選中獲勝,那么是否會(huì)在本次競(jìng)選中獲得優(yōu)勢(shì)。這項(xiàng)研究可能遇到的問題是:議會(huì)會(huì)員是否會(huì)利用他們的官方身份所帶來的權(quán)利和資源為他而是在滿們自己的黨派謀取利益。也就說, 執(zhí)政黨的成功并不必然是反映真正的選舉優(yōu)勢(shì),足投票者或者換取選票方面更高明。為了尋求執(zhí)政黨地
8、位所帶來的因果效應(yīng),Lee 將民主黨候選人獲勝看作是由Di=1 ( xi=0 )決定,xi 是選舉勝利者在邊際上的得票份額(民主黨和共和黨的得票之差)。Di 是 xi 的確定性函數(shù),在xi 之外并無其他變量干擾。Lee 通過將民主黨獲勝的概率(Y 軸)和在上一次選舉中民主黨與共和黨得票份額之差(X 軸)在坐標(biāo)抽中繪出,發(fā)現(xiàn)民主黨在0 點(diǎn)處獲勝的概率大幅提高,民主黨得多數(shù)票,由于這一點(diǎn)跳躍,執(zhí)政黨大約可以將再次當(dāng)選的概率提高40% 。 Lee 的分析認(rèn)為以往選舉中的獲勝率應(yīng)該與上次選舉中的獲勝的斷點(diǎn)沒有關(guān)系,這一檢驗(yàn)符合了Sharp RD 識(shí)別策略的假設(shè)。在給定的處理狀態(tài)下,協(xié)變量應(yīng)該是像在隨機(jī)
9、實(shí)驗(yàn)中一樣被處理平衡。然而需要解決的一個(gè)問題是,在選舉中存在私利的人可能會(huì)控制操縱處在臨界值附近的xi , 從而使得臨界值兩邊的狀況不可比,但Lee 通過計(jì)算接近x0 處的 xi 的比例來考察不連續(xù)點(diǎn)附近的xi 的分布密度發(fā)現(xiàn),這種情況不太可能出現(xiàn)。作者通過清晰斷點(diǎn)回歸設(shè)計(jì),創(chuàng)造出“近似實(shí)驗(yàn)( near-experimental )”方法,驗(yàn)證了執(zhí)政黨的選舉優(yōu)勢(shì)。模糊斷點(diǎn)回歸(Fuzzy RD )作為一種工具變量法的模糊斷點(diǎn)回歸是在給定某個(gè)協(xié)變量的情況下,處理狀態(tài)的概率和期望值所發(fā)生的不連續(xù)變化。與清晰斷點(diǎn)回歸不同的是,處理狀態(tài)不再是變量Xi 的確定函數(shù),而是一種概率函數(shù)。由于個(gè)體被處理的概率
10、會(huì)有一個(gè)跳躍,不連續(xù)性成了針對(duì)處理狀態(tài)的工具變量, 不再和處理狀態(tài)有確定性的聯(lián)系。模糊斷點(diǎn)回歸設(shè)計(jì)提供了一個(gè)簡(jiǎn)單的工具變量估模糊斷點(diǎn)回歸方法的第一個(gè)例子是關(guān)于助學(xué)金是否是高校爭(zhēng)奪優(yōu)質(zhì)生源的有效工具的研究。Van der Klaauw(2002) 的 ,文中關(guān)注的是助學(xué)金是否是高校爭(zhēng)奪優(yōu)質(zhì)生源的有效工具?Van der Klaauw 使用了 Fuzz RD 設(shè)計(jì)估計(jì)了大學(xué)生資助學(xué)金對(duì)大學(xué)入學(xué)率的影響。學(xué)生的入學(xué)決策受到很多因素的影響,其中一些因素是學(xué)校管理者無法觀測(cè)的。正是由于遺漏變量的存在,當(dāng)我們?cè)u(píng)估助學(xué)金對(duì)入學(xué)率的影響時(shí),助學(xué)金常常很難被看作是外生變量。為了尋求能夠解決內(nèi)生性問題的辦法,作者
11、對(duì)決策的規(guī)則進(jìn)行了深入的分析。 學(xué)校給予學(xué)生的資助金額受到很多客觀和主觀評(píng)價(jià)的影響,因此很難用一個(gè)簡(jiǎn)單的公式進(jìn)行描述。盡管有一些評(píng)價(jià)因素在學(xué)校的數(shù)據(jù)庫(kù)中能夠找到,如學(xué)生的學(xué)術(shù)能力,民族、父母的收入等。但其他的一些信息如學(xué)生的學(xué)習(xí)目的、已修課程、筆記是否工整、推薦信等在數(shù)據(jù)庫(kù)中則不能找到。然而,在很多學(xué)校,助學(xué)金的評(píng)判過程都是客觀和公平的。例如,學(xué)校 x 通過 SAT 和 GPA 的成績(jī)構(gòu)建一個(gè)綜合指數(shù)S, 通過這個(gè)構(gòu)建的指數(shù)將學(xué)生分為不同的等級(jí)。依據(jù)這一指數(shù),將學(xué)生分為四個(gè)不同等級(jí)。三個(gè)切點(diǎn)分別為S1 、 S2 、 S3, S3 其中最高的一個(gè)等級(jí)。不同等級(jí)的學(xué)生可以得到不同等級(jí)的助學(xué)金。盡管
12、助學(xué)金的評(píng)定并不僅僅看 S 的等級(jí),這使得不同的等級(jí)內(nèi)部的助學(xué)金也會(huì)存在差異。在給定學(xué)生的指數(shù)是決定其能否得到助學(xué)金主要變量后,因此, 學(xué)生得到的助學(xué)金是學(xué)生成績(jī)的函數(shù),并會(huì)在切點(diǎn)處出現(xiàn)跳躍。那些比切點(diǎn)處的綜合指數(shù)大的得到助學(xué)金較大,而比切點(diǎn)處的綜合指數(shù)小的得到助學(xué)金較小。由于學(xué)生得到助學(xué)金的多少是學(xué)生綜合指數(shù)S 的函數(shù)且存在間斷點(diǎn),這其實(shí)符合了模糊斷點(diǎn)方法的設(shè)定原則。因此, 作者利用模糊RD 的方法,通過分析助學(xué)金在學(xué)生 綜合指數(shù)的切點(diǎn)處的變化,得出助學(xué)金是高校爭(zhēng)奪優(yōu)質(zhì)生源的有效工具的結(jié)論。另外一篇相對(duì)更早的使用模糊斷點(diǎn)回歸設(shè)計(jì)進(jìn)行因果效應(yīng)估計(jì)是Angrist & Lavy 在 一文中完成的
13、班級(jí)規(guī)模對(duì)學(xué)生成績(jī)影響的準(zhǔn)實(shí)驗(yàn)分析。在以色列,學(xué)校的班級(jí)規(guī)模方面,存在一個(gè)“邁蒙尼德”法則,認(rèn)為班級(jí)規(guī)模不能超過 40 人。如果一個(gè)年級(jí)的學(xué)生不足40 人,那么這些學(xué)生將被編入一個(gè)班級(jí)。而如果超過40 人, 如 41 人, 那么這些學(xué)生將會(huì)被分為兩個(gè)班,81 名學(xué)生時(shí)將會(huì)被分為3 個(gè)班。 Angrist & Lavy 對(duì)所選的兩個(gè)年級(jí)的學(xué)生的實(shí)際班級(jí)規(guī)模和用邁蒙尼德法則計(jì)算班級(jí)規(guī)模進(jìn)行對(duì)比發(fā)現(xiàn),邁蒙尼德法則并沒有很好的預(yù)測(cè)班級(jí)規(guī)模,大部分是因?yàn)槟昙?jí)人數(shù)沒有超過40 人,也被分為了兩個(gè)班;但總體來看, 學(xué)生人數(shù)為40,80,120 處發(fā)生的班級(jí)規(guī)模的劇降。作者認(rèn)為可以運(yùn)用模糊RD 來進(jìn)行研究設(shè)計(jì)
14、。當(dāng)不存在控制變量時(shí),班級(jí)規(guī)模和考試成績(jī)存在強(qiáng)烈的正相關(guān)。當(dāng)把學(xué)校中具有殘障或者貧困等不利背景的學(xué)生比例作為控制變量加入回歸后,班級(jí)規(guī)模和學(xué)生成績(jī)之間的相互關(guān)系不在顯著。但作者利用模糊斷點(diǎn)回歸的方法(將利用“邁蒙尼德”法則計(jì)算的班級(jí)規(guī)模作為實(shí)際班級(jí)規(guī)模的工具變量)的估計(jì)得出班級(jí)規(guī)模對(duì)考試成績(jī)具有顯著影響,這與利用 STAR 實(shí)驗(yàn)的相關(guān)研究得出的結(jié)論一致。參考文獻(xiàn):Lee, David S. (2008):“ Randomized experimentsfrom non-random selection in U.S.House elections ” , Journal of Economet
15、rics,142, 675-697.Thistlethwaiite, D., and D. Campbell (1960):“ Regression-DiscontinuityAnalysis: AnAlternative to the Ex Post Facto Experiment, ” Journal of EducationalPsychology, 51,309 317.Campbell, Donald Thomas (1969):Reforms asExperiments, AmericanPsychologist, 24, 409-429.Campbell, Donald Tho
16、mas, and Julian C. Stanley(1963):“ Experimental andQuasi-experimental Designs for Research ” . RandMcNally, Chicago.Imbens, Guido, and Thomas Lemieux (2008):“ RegressionDiscontinuity Designs: AGuide to Practice ” , Journal of Econometrics, 142,615635Hahn, Jinyong, Petra Todd, and Wilbur van derKlaau
17、w (2001):“ Identification andEstimation of Treatment Effects with aRegression-Discontinuity Design” ,Econometrica, 69, 201-209.Van der Klaauw, Wilbert (2002):“ Estimating theEffect of Financial Aid Offers onCollege Enrollment: ARegression-Discontinuity Approach” , International EconomicReview, 43.Angrist, Joshua D., and Victor La
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 鵝口瘡的日常護(hù)理實(shí)踐
- 城管協(xié)管考試題及答案
- 自考審計(jì)準(zhǔn)則試題及答案
- 乘警執(zhí)法規(guī)定解讀
- 2025-2026人教版一年級(jí)語文上期末卷
- 2025-2026一年級(jí)體育上學(xué)期試卷
- 衛(wèi)生院工程建設(shè)制度
- 衛(wèi)生學(xué)校誰管理制度
- 家屬區(qū)衛(wèi)生責(zé)任制度
- 劃分衛(wèi)生責(zé)任區(qū)制度
- 北京市順義區(qū)2025-2026學(xué)年八年級(jí)上學(xué)期期末考試英語試題(原卷版+解析版)
- 中學(xué)生冬季防溺水主題安全教育宣傳活動(dòng)
- 2026年藥廠安全生產(chǎn)知識(shí)培訓(xùn)試題(達(dá)標(biāo)題)
- 初中九年級(jí)上一元二次方程計(jì)算練習(xí)題及答案詳解B2
- 冷庫(kù)防護(hù)制度規(guī)范
- 廣東省廣州市番禺區(qū)2026屆高一數(shù)學(xué)第一學(xué)期期末聯(lián)考試題含解析
- 2026年廣東省佛山市高三語文聯(lián)合診斷性考試作文題及3篇范文:可以“重讀”甚至“重構(gòu)”這些過往
- 2025年汽車駕駛員技師考試試題及答案含答案
- 觀看煤礦警示教育片寫心得體會(huì)
- 2025年國(guó)際中文教師證書考試真題附答案
- 濕地保護(hù)法宣傳解讀課件
評(píng)論
0/150
提交評(píng)論