版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、RD方法(regression discontinuity design)l 什么是regression discontinuity design?下面將用一篇文章來介紹:如何理解由于使用燃煤取暖,中國 5 億北方居民預期壽命將縮短 5.5 年?7月8日發(fā)表在美國國家科學院院刊(PNAS)的一篇論文,向已經(jīng)逐漸意識到空氣污染危害的中國民眾再次展現(xiàn)了殘酷的現(xiàn)實:以淮河為界,燒煤供暖的中國北方地區(qū)空氣污染水平高于中國南方,北方5億居民因嚴重的空氣污染,平均每人失去5年壽命。這篇文章由清華大學的李宏彬、北京大學的陳玉宇和另外兩位作者共同完成。前兩位完成了這篇論文的主要部分。這個回答首先介紹他們的研究
2、方法,再談一談研究者和媒體對這篇文章的引申。l 科學家如何得出使用燃煤取暖中國5億北方居民預期壽命將縮短5.5年這個結論的?首先要說的是這篇文章使用的RD方法(regression discontinuity design),即斷點回歸方法。斷點回歸方法是最近的政策評估中非常重要的一個方法,他可以在沒有隨機性的情況下識別出政策的效果。在早期的研究中,要識別一個處理(Treatment)的效果,我們必須擁有隨機性,比如兩組隨機分開的小白鼠,一組加上某種處理,一組沒有處理,最后觀察兩者的區(qū)別。為什么我們那么需要隨機性呢?因為研究的基礎需要幾組十分類似的群體,他們的任何特征都服從一個相同的分布,無論
3、是性別、年齡、教育、健康程度這樣,我們才能確定幾組對象之間出現(xiàn)的差別是來自于實驗處理的差異,而非某些個人特征。從一個大樣本中嚴格隨機抽取的樣本,正好滿足這樣的同分布假設。但對于政策研究來說,我們不可能找到這樣隨機分開的兩組人,而且也無法用實驗的方法來獲得結果你能將隨機分開的100人放在干凈空氣中,將另外100人放在骯臟空氣中并觀察一段時間嗎?一些研究者面對這種缺乏隨機性的情況,采用了增加控制變量的方式。比如,把性別年齡教育健康程度全部放進回歸式中,然后聲稱,兩組人之間由于性別年齡教育健康的不同而造成的差別都已經(jīng)去掉了,剩下的就是這個政策的效果了。可是,這很容易遭到批評,而且是沒完沒了的批評。為
4、什么不控制工資高低?婚姻狀況?從事行業(yè)?只要沒有隨機分開,任何特征變量的差異造成的結果,都可能混淆在政策結果中,你不控制這個變量,政策的效果就仍然沒有識別干凈。遭到批評的研究者只能繼續(xù)加變量,沒完沒了的加變量。更關鍵的是,前面說的還是可以量化的東西,努力程度?性格特征?甚至,智商?這些不可觀測的變量可能影響更大。舉一個例子,科學家想知道上了“一本”大學對學生未來的工資有什么影響。上了一本和沒上一本的大學生,顯然不是隨機分開的兩個群體。當然也沒法用控制變量的方法來消除“一本”之外的影響,因為肯定有一些不可觀測的變量是你控制不了的。控制變量法至此完敗。但科學家并沒有束手無策,他們找到了RD方法。所
5、謂RD方法,就是觀察那些在一本線上下2分的學生,看“上一本”和“沒上一本”的學生的未來工資差異。這個想法的天才之處在于,高考的上下5分,實在是一件隨機性非常大的事情。讓這批學生重新考一次,不少學生的情況可能就要逆轉。對于這5分區(qū)間內(nèi)的學生來說,一條一本線,就像一個天然的分割線,將兩組人隨機分開了。退一步說,即使我們將高考視為一項沒有隨機性的考試,RD方法還有另外一個假設連續(xù)性假設。那些剛好上了一本的學生,比起差幾分沒上一本的學生,可能要聰明一點;也可能家庭環(huán)境好一點,請了好一點的家庭教師;也可能更努力一些,多做了幾道習題。但注意,如果我們將智商、努力程度、家庭環(huán)境等等變量都視為連續(xù)的變量,那么
6、上了一本的學生,比起沒上一本的,也只是多了那么“一點點”。于是,我們可以開始觀察這批學生的工資了。RD方法的所有目光,都聚焦在了那個“間斷點”上。首先看一本線下1分的學生,和線下2分的學生,線上2分的學生和線上1分的學生,是否有工資差別?直觀上想,可能沒有,可能前者比后者高10塊,這說明在沒有其他顯著差別時,各種連續(xù)變量產(chǎn)出的工資,也應該是一個連續(xù)變量。但我們再看線上0分的學生,和線下1分的學生時,顯著的工資差異出現(xiàn)了,乖乖,差1000塊。線上0分的學生,和線下1分的學生,各種特征都應該是差不多的,即便有差別,在連續(xù)性假設下也應該是很小很小的差別,那么產(chǎn)生這樣顯著的工資差異,只能由前者上了一本
7、,而后者沒上一本來解釋了,因為這是兩者間唯一的區(qū)別。于是,科學家們說,“上一本”這個事情,可以增加大學生大約1000元工資。我們回到這篇論文上,作者正是觀察到了這樣一條天然的分割線:淮河以北地區(qū),政府提供了暖氣,用燒煤的方式進行,而淮河以南則沒有。那么,淮河兩岸十分接近的兩個地區(qū),理論上來說也應該服從這樣的“連續(xù)性”假設,也就是各種變量都差不多,唯一的區(qū)別就是有沒有燒煤。于是作者發(fā)現(xiàn),由于燒煤,淮河以北的空氣總懸浮物比淮河以南多了而空氣污染造成的結果,淮河兩岸的人均壽命差異則是驚人的5年。同時,不考慮空氣污染,用其他變量預測出來的人均壽命則幾乎沒有差別。這說明了連續(xù)性假設是成立的,淮河兩岸的兩
8、個十分接近的地區(qū)幾乎擁有相同的特征。作者還發(fā)現(xiàn),淮河以北的超額死亡率,正是由和空氣污染相關的心肺疾病相關,并進而與空氣總懸浮物相關,而與謀殺、自殺等因素無關。至此,作者終于給出結論:燒煤將使空氣總懸浮物大幅度上升,并使中國北方地區(qū)的居民人均壽命降低5年。l Regression Discontinuity Design的局限性由于使用燃煤取暖,中國5億北方居民預期壽命將縮短5.5年這個結論有什么問題?如果看完上面那段,你感到心服口服,感嘆科學家真聰明,RD方法真奇妙,進而相信了這個結論,那你可能不是從事學術工作的。這項研究主要存在以下三個問題。第一個問題:連續(xù)性假設是否對所有變量都成立?淮河分
9、界線兩邊的城市,真的在所有變量上都是連續(xù)的嗎?作者在Figure4中控制了許多變量,并驗證他們都是連續(xù)的,但那些沒有控制的變量呢?我們可能可以說說高考差5分的學生沒有什么顯著差別,但一條河流兩旁的城市,我們就很難說他沒有顯著差別。由于河流兩側的流速不同,地勢不同,我們常常能發(fā)現(xiàn)一條河兩側的氣候特征相差較大,甚至作物種植不同,這些都會導致死亡率的差異,也有可能造成空氣總懸浮物的不同,而且他們都沒有被控制在作者的圖中。也就是說,淮河這個間斷點,在識別燒煤取暖對空氣污染以及死亡率的作用上,還不夠干凈。第二個問題:無法消除的自選擇性還是從“一本和工資”的故事開始講??茖W家們雖然能研究一本線上的學生和線
10、下1分學生的工資差異,可卻忘記了一個問題:可能有好些剛好越過一本線的學生,并不是因為他考上了一本,而是他老爹有一些手腕,買通了官員,將他兒子的分數(shù)改了。而且,又不好太張揚,于是,就改一個躺在一本線上的分數(shù)。所以,他們的工資差異,還有一部分來自那些躺在一本線上學生的“有手腕的老爹”。對于這一項研究來說,所謂的自選擇,就是遷移。一些在淮河以北的居民可能發(fā)現(xiàn),淮河以北空氣太差,他還是搬到淮河以南吧。而另一些淮河以南的居民感到?jīng)]有暖氣太冷,于是他選擇搬到淮河以北。于是,搬到淮河以南的人,更注重自身健康;搬到淮河以北的人,由于體弱而怕冷。如此,兩岸居民的分布就出現(xiàn)了差異,其壽命差異,有一部分就來自這些不
11、可觀測的自選擇效應。第三個問題:小范圍的有效性回到上一本和工資的那個例子上。“科學家們說,“上一本”這個事情,可以增加大學生大約1000元工資?!边@句話,就有問題。你最多只能說:一本線上2分的學生,能因為上一本這個事情,增加約1000元的工資。舉一個極端的例子,一個因為家庭情況不允許復讀,而且本來可以超過一本線100多分,甚至可以上清華北大的學生,卻因為試卷丟失而少了一門成績,從而沒上成一本。對他來說,“上一本”這個事情,可能就不止1000元工資的差異了。這個例子的意思是,RD方法得出的結論,僅僅在他所研究的那個小范圍內(nèi)有效。超出這個范圍太多,就沒有那么有效了。同樣的,我們可以說“淮河以北,且
12、緊鄰淮河的地區(qū),因為燒煤取暖導致的空氣總懸浮物增加,損失了5.5年的壽命”。但將結論推到北方所有地區(qū),就有問題。比如,也許從淮河向北,人們擁有一個隨緯度升高而逐漸上升的“空氣總懸浮物耐受能力”,但科學家卻無法觀察到這點,“5.5年壽命差異”的外推便失效了。鑒于以上三個缺點,燒煤取暖到5.5年壽命差異這個邏輯鏈條,我們都不能夠完全相信。更別說將這個壽命差異推廣到整個北方地區(qū)了。當然,我們也不能矯枉過正,全盤否定這項研究的意義。l 這一項研究的重要意義在于:1,消除了無休止的口水仗,識別了空氣污染和健康之間的因果關系。要知道在使用RD方法之前,“空氣污染有害論”者還在不停地增加控制變量,“空氣污染
13、無害論”者還在argue不可觀測的健康特征呢。2,雖然有上述提到的幾個問題,但他們的數(shù)據(jù)選取讓我相信這幾個問題都不是特別嚴重,我們大致可以下定論,淮河以北十分接近的幾個城市,由空氣污染所導致的壽命減少大致是5年左右。這是一個十分醒目的結果,會引起一批人的重視。3,上一點私貨。鑒于兩位主要作者都是經(jīng)濟學家,這個研究,是經(jīng)濟學帝國主義的又一次擴張。以后,在這樣的自然科學刊物上,來自經(jīng)濟學家的貢獻可能會越來越多。因為經(jīng)濟學最關注的就是因果識別,經(jīng)濟學的好些識別方法,早就溢出到了社會科學的其他領域,也正在逐漸蔓延到一些和政策相關的自然科學領域。前陣子的人類學家大戰(zhàn)經(jīng)濟學家事件也只是經(jīng)濟學帝國主義的一個
14、縮影,作為經(jīng)濟學研究人員,我感到十分高興。在因果關系分析的實證方法中,最優(yōu)的選擇應當為隨機實驗,但是隨機實驗的時間成本和經(jīng)濟成本都比較高,而在隨機實驗不可得的情況下,需要考慮使用其它方法。斷點回歸(Regression Discontinuity):是僅次于隨機實驗的,能夠有效利用現(xiàn)實約束條件分析變量之間因果關系的實證方法。在使用斷點回歸的情況下,存在一個變量,如果該變量大于一個臨界值時,個體接受處置,而在該變量小于臨界值時,個體不接受處置。一般而言,個體在接受處置的情況下,無法觀測到其沒有接受處置的情況,而在斷點回歸中,小于臨界值的個體可以作為一個很好的可控組(Control Group)來反映個體沒有接受處置時的情況,尤其是在變量連續(xù)的情況下,臨界值附近樣本的差別可以很好的反映處置和經(jīng)濟變量之間的因果聯(lián)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職植物保護(農(nóng)藥殘留檢測)試題及答案
- 2025年中職(大數(shù)據(jù)與會計)財務管理基礎試題及答案
- 2025年中職(畜牧獸醫(yī))動物防疫階段測試題及答案
- 2025年高職測繪與地理信息技術(測繪地理信息)試題及答案
- 2024指揮中心建設白皮書
- 2026廣東廣州市白云區(qū)人民政府棠景街道辦事處第一次招聘政府雇員9人備考題庫及答案詳解一套
- 2026中國科學院高能物理研究所黨委辦公室主任崗位招聘1人備考題庫及1套參考答案詳解
- 2025年鐵嶺市事業(yè)單位公開招聘動物檢疫崗位工作人員77人備考題庫及參考答案詳解1套
- 2026中國科學院長春光學精密機械與物理研究所動態(tài)成像室學術秘書招聘1人備考題庫(吉林)及答案詳解1套
- 2026河南鄭州軌道工程職業(yè)學院寒假教師與輔導員招聘76人備考題庫有完整答案詳解
- 河道治理、拓寬工程 投標方案(技術方案)
- 政治審查表(模板)
- 《最奇妙的蛋》完整版
- 三年級科學上冊蘇教版教學工作總結共3篇(蘇教版三年級科學上冊知識點整理)
- 種子室內(nèi)檢驗技術-種子純度鑒定(種子質量檢測技術課件)
- SEMI S1-1107原版完整文檔
- 心電監(jiān)測技術操作考核評分標準
- 2023年中級財務會計各章作業(yè)練習題
- 金屬罐三片罐成型方法與罐型
- 大疆植保無人機考試試題及答案
- 《LED顯示屏基礎知識培訓》
評論
0/150
提交評論