二元選擇模型.ppt_第1頁
二元選擇模型.ppt_第2頁
二元選擇模型.ppt_第3頁
二元選擇模型.ppt_第4頁
二元選擇模型.ppt_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、2020/8/5,1,關(guān)于虛擬因變量的回歸:線性概率模型、對數(shù)單位、概率單位及托比模型,1、虛擬應(yīng)變量 2、線性概率模型(LPM) 3、線性概率模型的估計問題 4、一個線性概率模型的例子 5、線性概率模型的應(yīng)用 6、線性概率模型以外的其他方法 7、對數(shù)單位模型 8、對數(shù)單位模型的估計 9、對數(shù)單位模型例子 10、概率單位模型 11、概率單位模型的例子 12、托比模型,2020/8/5,2,12.1虛擬應(yīng)變量,在前面所考慮的虛擬變量回歸模型中,我們隱含 假定應(yīng)變量Y是定量的,而解釋變量是定量的、定 性的或二者兼有。然而有的應(yīng)變量可以是二分性質(zhì) 的。如一個人或者在勞動力行列中或者不在,從而 勞動力

2、參與這個應(yīng)變量只能取兩個值:如果這個人 在勞動力行列中,則取值1;如果不在其中則取值 0。又如考察學(xué)院教授是不是屬于工會成員,因此 工會會員資格這個應(yīng)變量就是一個取值0或1的虛擬 變量:0表示非工會會員,1表示工會會員。,2020/8/5,3,1虛擬因變量,這些例子的一個特性是,因變量屬于僅要求 回答是或否這樣一種類型;就是說它是二分 類的。處理二分類變量有四種模型: 1.線性概率模型 2.對數(shù)單位模型 3.概率單位模型 4.托比單位模型,2020/8/5,4,2線性概率模型,為了建立概念,考慮如下模型: (12.2.1) 其中 X=家庭收入 Y=1 如果該家庭擁有住宅 =0 如果該家庭不擁有

3、住宅 該模型把二分變量 表達(dá)為解釋變量 的函數(shù)。像(12.2.1)這樣的模型,稱為線性概率模型。因為, 在給定 下的條件期望 可解釋為在給定 下事件(家庭擁有住宅)將發(fā)生的條件概率,即,2020/8/5,5,2線性概率模型,假定 ,我們得到: (12.2.2) 現(xiàn)在,令 (即事件發(fā)生)的概率,而 (即事件不發(fā)生)的概率。 由數(shù)學(xué)期望定義有: (12.2.3) 比較(12.2.2)和(12.2.3)得: (12.2.4),2020/8/5,6,2線性概率模型,就是說,模型(12.2.1)的條件期望事實上 可解釋為Y的條件概率。條件概率必須落在0 與1之間。即:,2020/8/5,7,3線性概率模

4、型的估計問題,我們不能用標(biāo)準(zhǔn)的OLS法去估計線性概率模型。因 為有以下一些問題: 1.干擾項 的非正態(tài)性 為了統(tǒng)計推斷的目的我們假設(shè)干擾項服從正態(tài)分布。 但在線性概率模型中干擾項的正態(tài)性不成立。我們把 (12.2.1)寫為: (12.3.1) 當(dāng) 時: 當(dāng) 時: (12.3.2),2020/8/5,8,3線性概率模型的估計問題,顯然,我們不再可能假定干擾項是正態(tài)分布的:實際 上,它遵循二項分布。 2.干擾項的異方差性 由(12.3.2)中可以得到 的概率分布: 當(dāng) 概率為 ; 當(dāng) 概率為 ,進(jìn)而可得到: (12.3.4),出現(xiàn)異方差時,OLS估計雖然無偏,但不是有效,即OLS估計量不具有最小方

5、差性。,2020/8/5,9,3線性概率模型的估計問題,方程(12.3.4)表明 誤差項的方差為異方差性。解決異方差問題的一個方法是進(jìn)行數(shù)據(jù)變換,將模型 (12.2.1)的兩邊除以 即, 得: (12.3.5),2020/8/5,10,3線性概率模型的估計問題,(12.3.5)中的干擾必定是同方差性的了。 真 是不知道的,從而權(quán) 是不知 道的,為了估計 ,可采用如下兩步法: 1。對(12.2.1)作最小二乘回歸,暫且撇 開異方差性問題。于是得到 真 的OLS估計值。再由此求 的估計值 2。用估計值 做如同(12.3.5)的數(shù)據(jù)變換,然后對變換后的數(shù)據(jù)做OLS回歸。,2020/8/5,11,3線

6、性概率模型的估計問題,3.不被滿足 在線性概率模型中 的估計量 不一定在0和1之間,解決的辦法是當(dāng) 小于0時取0,大于1時取1。 4.可疑的擬合優(yōu)度: 值 在二分模型中計算出來的 值較低。,2020/8/5,12,4線性概率模型:一個數(shù)值例子,我們用一個數(shù)值例子來說明線性概率模型的一 些問題。表16.1給出40各家庭的住宅所有權(quán)Y (1擁有住宅,0不擁有住宅)和家庭收入 X(千美元)的虛構(gòu)數(shù)據(jù)。根據(jù)這些數(shù)據(jù),用 OLS估計的線性概率模型如下: (0.1128)(0.0082) t(-7.6984)(12.515) (12.4.1),2020/8/5,13,4線性概率模型:一個數(shù)值例子,首先我們

7、來解釋這一回歸。截距值-0.9457給出 零收入的家庭擁有自己的住房的概率。由于是 負(fù)值,而概率又不可能是負(fù)值,我們就把該值 當(dāng)作零看待,這樣做在本例中是說得過去的。 斜率值0.1021意味著收入每增加1單位,平均地 說擁有住宅的概率增加0.1021或約10。當(dāng) 然,對某一給定的收入水平,我們可以從 (12.4.1)估計出擁有住宅的實際概率。例 如,對于X12(12000美元),估計擁有住宅 的概率是,2020/8/5,14,4線性概率模型:一個數(shù)值例子,0.2795 就是說,收入為12000 美元的家庭擁有住宅的 概率為28。 對于上面的估計受異方差的影響,因此我們可 以用WLS來獲得更有效

8、的估計值。由于某些是 負(fù)的,和某些 大于1,對于這些 來說, 將 是負(fù)的,因此刪去這些值 。得到的WLS回歸為:,2020/8/5,15,4線性概率模型:一個數(shù)值例子,(0.1206) (0.0069) t(-10.332) (17.454)(16.4.2),2020/8/5,16,5線性概率模型的應(yīng)用,例16.1:科恩-雷-勒曼研究 在為美國勞工部做的一項研究工作中,科恩、雷和勒 曼把各類勞工的“勞動力參與”當(dāng)作一些社會人口 統(tǒng)計變量的函數(shù)來分析。在所有的回歸中應(yīng)變量都是 一個虛擬變量:如果一個人參與勞動隊伍,它就取值 1;如果不參與取值0。在表16.3中我們復(fù)制了他們幾 個虛擬變量回歸中的

9、一個。 上述回歸是用OLS估計的,后又對它進(jìn)行異方差校 正,由于是大樣本所以結(jié)果相差不大,t檢驗和F檢驗,2020/8/5,17,5 線性概率模型的應(yīng)用,現(xiàn)在轉(zhuǎn)到對結(jié)果的解釋,每一斜率系數(shù)都給出 對應(yīng)于解釋變量的一個給定單位變化,事件發(fā) 生的條件概率的變化率。比如說,變量“65歲及 以上”的系數(shù)-0.2753表示在保持其他因素不變 的情況下,該年齡組的婦女參與勞動的概率要 低出27。 現(xiàn)在考慮婚姻狀況和年齡的交互作用。表中數(shù) 據(jù)表明,從未結(jié)婚的女人(和基底類相比),,2020/8/5,18,5線性概率模型的應(yīng)用,其勞動力參與概率要高出29,而年齡為65歲 及以上的婦女,勞動參與概率要低出28。

10、以 下依此類推。仿照以上的程序,不難解釋表 16.3中其余系數(shù)。 例16.2 對債券評級的預(yù)測(P545) 例16.3 預(yù)測債券違約(P546),2020/8/5,19,6線性概率模型以外的其他方法,線性概率模型的根本問題在于其在邏輯上不是 一個很有吸引力的模型,因為它假定 隨X而線性地增加,即X的邊際或增補(bǔ)效應(yīng)一直 保持不變。這顯然不現(xiàn)實。 因此我們需要的是具有如下二分性質(zhì)的模型: (1)隨著 增加, 也增加,但不超出0-1這個區(qū)間。 (2) 和 之間是非線性的,即”隨著 變 小概率趨于零的速度越來越慢,,2020/8/5,20,6線性概率模型以外的其他方法,而隨著 變得很大,概率趨于1的速

11、度也 越來越慢”。因此下面我們將討論滿足這 些條件的對數(shù)單位模型和概率單位模型。,2020/8/5,21,7對數(shù)單位模型,我們用住房所有權(quán)的例子說明對數(shù)單位模型的基 本概念。解釋住房所有權(quán)對收入的線性關(guān)系時的 線性概率模型曾是: (12.7.1) 其中X為收入,而Y1表示家庭擁有住房,但現(xiàn) 在考慮如下住房所有權(quán)的表達(dá)式: (12.7.2),2020/8/5,22,7對數(shù)單位模型,(12.7.2)可以寫成: (12.7.3) 其中 方程(12.7.3)代表一個(累積)邏輯斯蒂分布函 數(shù)為名的模型。 隨著 從 變到 , 從0變到1,而且 對 有非線性關(guān)系,這樣就滿足了上述兩點要求。,2020/8/

12、5,23,0,P,1,CDF,-, X,圖16.2 累計分布函數(shù)(CDF),2020/8/5,24,在進(jìn)行估計時我們可以將(12.7.2)化成線性形式進(jìn)行估計,擁有住房的概率為 ,則不擁有住房的 概率 是: (12.7.4) 因此,可得: (12.7.5),2020/8/5,25,7對數(shù)單位模型,現(xiàn)在 就是有利于擁有住房的機(jī)會比 率一個家庭將擁有住房的概率對不擁有住 房的概率之比。 對(12.7.5)取自然對數(shù)得: (12.7.6) 即機(jī)會比率的對數(shù) 不僅對 為線性,而且對 參數(shù)也是線性。 被稱為對數(shù)單位模型(Logit)。,2020/8/5,26,7對數(shù)單位模型,像(12.7.6)這樣的模型

13、取名為對數(shù)單位模型 對數(shù)模型的特點: 1、 從0變到1,對數(shù)單位從 變到 2、雖然 對 為線性,但概率本身卻不然。 對LPM模型,概率隨X而線性地增大。 3、斜率系數(shù)給出 每單位變化的 的變化,它告知人們隨著收入變化一單位,有利于擁有住房的對數(shù)機(jī)會比率是怎樣變化的。截距是當(dāng)收入為零時的有利于擁有住房的對數(shù)機(jī)會比率的值。,2020/8/5,27,7對數(shù)單位模型,4、對給定的某個收入水平,我們其實想 估計的并不是有利于擁有住房的機(jī)會比, 而是擁有住房本身的概率。但根據(jù)1和2的估計值很容易求出擁有住房的概率P. 5、對數(shù)單位模型假定機(jī)會比率的對數(shù)與 有線性關(guān)系。,2020/8/5,28,8對數(shù)單位模

14、型的估計,把對數(shù)單位模型寫成如下形式: 如果對這個模型用微觀數(shù)據(jù)直接估計會遇到一 些問題,例如當(dāng)或時,取不到有意義 的值,在這種情形下只有用最大似然估計求解。 另外的一種估計方法,當(dāng)我們擁有的數(shù)據(jù)如下表 所示時可以用OLS求解。,2020/8/5,29,8對數(shù)單位模型的估計,表16.4,2020/8/5,30,8對數(shù)單位模型的估計,根據(jù)上表的數(shù)據(jù)求出 利用估計的可以得到估計的對數(shù)單位線性 模型。 這時還不能用OLS直接估計,因為隨機(jī)誤差項的 性質(zhì)還沒考慮。,2020/8/5,31,8對數(shù)單位模型的估計,隨機(jī)誤差項的滿足如下分布: 顯然模型中存在異方差,因此我們考慮使用加權(quán)最小 二乘法,權(quán)重取。

15、用代替則可求出。,2020/8/5,32,8對數(shù)單位模型的估計,總結(jié)估計對數(shù)單位模型的各個步驟: 1、對每一收入水平,計算擁有住房的概率。 2、求每一 的對數(shù)單位 3、作如下變換 消除異方差,其中。 4、用過原點回顧的OLS估計上式。 5、按普通最小二乘法建立置信區(qū)間和假設(shè)檢驗。,2020/8/5,33,(加權(quán)最小二乘法:教材11.6,P371),對于對數(shù)單位模型,2020/8/5,34,9對數(shù)單位模型的例子,這里只是通過演算一個數(shù)值問題,以促進(jìn)對 對數(shù)單位模型的理解(具體數(shù)據(jù)見表16.5)。 用加權(quán)最小二乘法可以求出如下結(jié)果: 對于系數(shù)經(jīng)濟(jì)意義的解釋可以參照書上的解釋。,2020/8/5,3

16、5,10概率單位模型,為了解釋二分應(yīng)變量,有必要使用適當(dāng)CDF。 對數(shù)單位模型使用的是累積邏輯斯蒂函數(shù)。在 實際應(yīng)用中發(fā)現(xiàn)正態(tài)CDF效果也不錯。使用正 態(tài)CDF的估計模型通常稱為概率單位模型。 引入概率單位模型有兩種途徑:一是模仿前面 邏輯斯蒂函數(shù)的形式,直接用正態(tài)分布函數(shù)替 換;二是依據(jù)麥克法登的效用理論或行為的理 性選擇引入概率單位模型。,2020/8/5,36,10概率單位模型,下面根據(jù)效用理論闡明使用概率單位模型的 動機(jī)。 表示一種不可觀測的效用指數(shù),表示收入,仍然研究家庭擁有住房的概率。 當(dāng)越大時,認(rèn)為擁有住房的概率越大。 現(xiàn)在假定有這樣一個臨界值,當(dāng)時,該 家庭擁有住房,否則不擁有

17、。,2020/8/5,37,10概率單位模型,在正態(tài)性假定下,的概率可由標(biāo)準(zhǔn)化正態(tài) CDF算出。 t是標(biāo)準(zhǔn)化正態(tài)變量,。,2020/8/5,38,10概率單位模型,1,(a),(b),2020/8/5,39,10概率單位模型,根據(jù)獲得關(guān)于效用函數(shù)以及和的信息,可 得到: 如果我們掌握了表16.7的分組數(shù)據(jù),便可由計 算出,一旦有了,就可很輕松的估計和 在對數(shù)單位分析中,被稱為正態(tài)等效離差(n.e.d.)。當(dāng)時,將是負(fù)數(shù),在實際 中通常把5加到上,其結(jié)果稱為概率單位.,2020/8/5,40,10概率單位模型,現(xiàn)在估計和。通過下面的式子: 概率單位模型的估計步驟: 1、從分組數(shù)據(jù)中估計出。 2、

18、根據(jù),從標(biāo)準(zhǔn)正態(tài)CDF中求出n.e.d. 3、用最為回歸的應(yīng)變量。 4、由于隨機(jī)誤差項存在異方差,因此還要進(jìn)行數(shù)據(jù)轉(zhuǎn)換或用WLS估計出最后結(jié)果。 5、用普通方式進(jìn)行假設(shè)檢驗,但得到的結(jié)果只在大樣本下有效,同時已沒有多大價值,2020/8/5,41,11概率單位模型的例子,根據(jù)表16.8所給的數(shù)據(jù),可以估計出如下結(jié)果。 以n.e.d.作為應(yīng)變量: 以概率單位作為應(yīng)變量: 除截距外,兩種回歸結(jié)果沒有差別。,2020/8/5,42,11概率單位模型的例子,比較對數(shù)單位與概率單位的估計值 雖然對數(shù)單位模型和概率單位模型給出性質(zhì) 相同的結(jié)果,但是兩個模型參數(shù)的估計值不 可直接比較。一般兩者參數(shù)有如下關(guān)系: 另外,LPM的系數(shù)與對數(shù)單位模型的系數(shù)有如下 關(guān)系: 不含截距項時 含有截距項時,2020/8/5,43,圖16.6對數(shù)單位與概率單位的累計分布圖,概率單位累計分布,對數(shù)單位累計分布,2020/8/5,44,三類模型回歸系數(shù)比較,線性概率模型LPM,對數(shù)單位模型logit-M,概率單位模型probit-M,線性概率模型LPM,斜率系數(shù)直接測出X 單位變化引起的事件發(fā)生

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論