中級計量五章 離散選擇變量(20090202)1_第1頁
中級計量五章 離散選擇變量(20090202)1_第2頁
中級計量五章 離散選擇變量(20090202)1_第3頁
中級計量五章 離散選擇變量(20090202)1_第4頁
中級計量五章 離散選擇變量(20090202)1_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第五章離散選擇模型第一節(jié)模型的基礎(chǔ)與對應(yīng)的現(xiàn)象一、問題的提出在研究社會經(jīng)濟(jì)現(xiàn)象時,常常遇見一些特殊的被解釋變量,其表現(xiàn)是選擇與決策問題,是定性的,沒有觀測數(shù)據(jù)所對應(yīng);或者其觀測到的是受某種限制的數(shù)據(jù)。1、被解釋變量是定性的選擇與決策問題,可以用離散數(shù)據(jù)表示,即取值是不連續(xù)的。例如,某一事件發(fā)生與否,分別用1和0表示;對某一建議持反對、中立和贊成5種觀點,分別用0、1、2表示。由離散數(shù)據(jù)建立的模型稱為離散選擇模型。2、被解釋變量取值是連續(xù)的,但取值的范圍受到限制,或者將連續(xù)數(shù)據(jù)轉(zhuǎn)化為類型數(shù)據(jù)。例如,消費者購買某種商品,當(dāng)消費者愿意支付的貨幣數(shù)量超過該商品的最低價值時,則表示為購買價格;當(dāng)消費者愿意支付的貨幣數(shù)量低于該商品的最低價值時,則購買價格為0。這種類型的數(shù)據(jù)成為審查數(shù)據(jù)。再例如,在研究居民儲蓄時,調(diào)查數(shù)據(jù)只有存款一萬元以上的帳戶,這時就不能以此代表所有居民儲蓄的情況,這種數(shù)據(jù)稱為截斷數(shù)據(jù)。這兩種數(shù)據(jù)所建立的模型稱為受限被解釋變量模型。有的時候,人們甚至更愿意將連續(xù)數(shù)據(jù)轉(zhuǎn)化為上述類型數(shù)據(jù)來度量,例如,高考分?jǐn)?shù)線的設(shè)置,就把高出分?jǐn)?shù)線和低于分?jǐn)?shù)線劃分為了兩類。下面是幾個離散數(shù)據(jù)的例子例5.1研究家庭是否購買住房。由于,購買住房行為要受到許多因素的影響,不僅有家庭收入、房屋價格,還有房屋的所在環(huán)境、人們的購買心理等,所以人們購買住房的心理價位很難觀測到,但我們可以觀察到是否購買了住房,即“ [1,購買Y=< t0, 不購買我們希望研究買房的可能性,即概率P(Y=1)的大小。例5.2分析公司員工的跳槽行為。員工是否愿意跳槽到另一家公司,取決于薪資、發(fā)展?jié)摿Φ戎T多因素的權(quán)衡。員工跳槽的成本與收益是多少,我們無法知道,但我們可以觀察到員工是否跳槽,即

“[1,跳槽=<0,不跳槽例5.3對某項建議進(jìn)行投票。建議對投票者的利益影響是無法知道的,但可以觀察到投票者的行為只有三種,即I支持=<2,反對3棄權(quán)研究投票者投各種票的可能性,即P(Y=j),j=1,2,3。從上述被解釋變量所取的離散數(shù)據(jù)看,如果變量只有兩個選擇,則建立的模型為二元離散選擇模型,又稱二元型響應(yīng)模型;如果變量有多于二個的選擇,則為多元選擇模型。本章主要介紹二元離散選擇模型。離散選擇模型起源于Fechner于1860年進(jìn)行的動物條件二元反射研究。1962年,Warner首次將它應(yīng)用于經(jīng)濟(jì)研究領(lǐng)域,用于研究公共交通工具和私人交通工具的選擇問題。70-80年代,離散選擇模型被普遍應(yīng)用于經(jīng)濟(jì)布局、企業(yè)選點、交通問題、就業(yè)問題、購買行為等經(jīng)濟(jì)決策領(lǐng)域的研究。模型的估計方法主要發(fā)展于20世紀(jì)80年代初期。(參見李子奈,高等計量經(jīng)濟(jì)學(xué),清華大學(xué)出版社,2000年,第155頁-第156頁)二、線性概率模型對于二元選擇問題,可以建立如下計量經(jīng)濟(jì)模型。1、線性概率模型的概念。設(shè)家庭購買住房的選擇主要受到家庭的收入水平,則用如下模型表示Y=p+pX+ui12ii其中X為家庭的收入水平,Y為家庭購買住房的選擇,即ii[1 家庭已購買住房Y=<0 家庭無購買住房Y01概率1-PP由于Y是取值為0和1的隨機(jī)變量,并定義取Y值為1的概率是p,則Y的分布為 則Y的數(shù)學(xué)期望為E(Y)二0x(1—p)+lxp顯然P(Y二1X)二p二E(Y)i從而E(Y/X)二B+pX二pTOC\o"1-5"\h\zI 1 2i上述數(shù)學(xué)模型的經(jīng)濟(jì)學(xué)解釋是,因為選擇購買住房變量取值是1,其概率是p,并且這時對應(yīng)p的表示是一線性關(guān)系,因此,Y在給定X下的條件期望E(Y|X)I I可解釋為在給定X下,事件(家庭購買住房)將發(fā)生的條件概率為P(Y=1|X),I I I亦即家庭選擇購買住房的概率是家庭收入的一個線性函數(shù)。我們稱這一關(guān)系式為線性概率函數(shù)。2、線性概率函數(shù)的估計。對線性概率函數(shù)的估計存在以下困難:(1)隨機(jī)誤差項的非正態(tài)性表現(xiàn)。u二Y—P—PXTOC\o"1-5"\h\zii1 2i二1,u二1—P—PX\o"CurrentDocument"i i 1 2i二0,u二—P—PX\o"CurrentDocument"i i 1 2i表明u服從兩點分布。i(2)u的異方差性。事實上,iVar(u)=E(u一E(u))2=E(u2)i i i i=(一卩一卩X)2(1—p)+(1一卩-卩X)2p1 2i 1 2i=p2(1—p)+(1—p)2p=p(1—p)[p+1—p]=p(1—p)上式中,p隨著i的變動是一個變動的量,則u的方差不是一個固定常數(shù)。i(3)利用加權(quán)最小二乘法修正異方差。取權(quán)數(shù)為v'W+~p(T^~p)尋申2X)(氣書2X)可以證明具有同方差。在具體估計線性概率模型時,用f作為P的估計來計可以證明i算權(quán)數(shù)w的估計W。3、可決系數(shù)R2的非真實性。由于,被解釋變量Y只取值1或0不可能有估計的線性概率模型能很好地擬合這些點,所以,這時計算的R2會比1小許多,在大多數(shù)例子中,R2介于0.2與0.6之間。4、0WE(Y\X)W1不成立??朔@一問題可直接從對線性概率模型的估計,I i求出Y,用人工的方法定義當(dāng)Y>1時,取F=1;當(dāng)Y<0時,取Y=0。但要比較i i i i i好地解決這類問題,只能考慮采用新的估計方法,這就是將要介紹的Logit模型和Probit模型。

EVievs-[Equation:EQ02Torkfile:GUARATIPP549\Untit]IIIFileEditObjectViewFrocQuickOji+iunsWindowHelpViewIProcIObjectIPrintINameIFreezeIEstimateIFore匚於11StatsIResidsID即endentVariableYWMethodLeastSquaresDate:02/07/09Time:20:58Sample(adjusted)240Includedobservations:28afteradjustmentsVariableCoefficientStd.Errort-StatisticProbW1-1.2455920120566-10.3321100000XW0.119589000686217.4543800000R-squared0981050Meandependentvar2.191518AdjustedR-squared0980321SD.dependentvar3.556681SEcif「Eg「Essicm0.498942AkaikeinfocritE「ion1516095Sumsquaredresid6.472517Schwarzcriterion16112S2Loglikelihood19.22533Durbin-Watsonstat1882836第二節(jié)Logit模型一、Logit模型的產(chǎn)生1、 產(chǎn)生Logit模型的背景。由上述介紹可知,對于線性概率模型來說,存在一些問題,有的問題盡管可以用適當(dāng)?shù)姆椒右詮浹a(bǔ),但并不完善和理想。古典假定不再成立,如異方差性,可用加權(quán)OLS方法加以彌補(bǔ)。在線性概率模型中,對于不滿足OWE(Y|X)W1的情況,用人工的方I i法處理,即當(dāng)Y>1時,取Y=1ii當(dāng)Y<0時,取Y=0ii雖然能夠彌補(bǔ)不足,但仍然具有較強(qiáng)的主觀因素。(3)經(jīng)濟(jì)意義也不能很好地得到體現(xiàn)。在線性概率模型E(Y,;X)=B+pX=p中,概率P(Y=1)會隨著X的變化而線性變化,但這與實i 1 2i i際情況通常不符。例如購買住房,通常收入很高或很低,對于購買住房的可能性都不會有太大的影響,而當(dāng)收入增加很快時,對購買住房的影響將會很大。顯然,購買住房的可能性與收入之間應(yīng)該是一種非線性關(guān)系。2、 Logit模型的含義。綜合上述討論,我們所需要的是具有如下二分性質(zhì)的模型:隨著X的減小,p趨近0的速度會越來越慢;反過來隨著X的增大,i i ip接近1的速度也越來越慢,而當(dāng)X增加很快時,p的變化會比較快。故p與Xi i i i i之間應(yīng)呈非線性關(guān)系。p的變化始終在0和1之間。i因此,一個很自然的想法是采用隨機(jī)變量的分布函數(shù)來表示p與X的這種ii非線性關(guān)系。從幾何圖形看,所需要的模型有點像圖5.1那樣,概率位于0與1之間,并隨著X非線性地變化。

如圖5.1所示的S型曲線,就是隨機(jī)變量的一個累積分布函數(shù)(CDF)。因此,當(dāng)回歸中的被解釋變量是取0和1的二分變量時,并且概率值的變化與解釋變量X之間有上述變化特征,則可用CDF去建立回歸模型。在二分被解釋變量i的研究中可使用多種分布函數(shù)(Cox,1970)。但最常用的是Logistic分布函數(shù)和標(biāo)準(zhǔn)正態(tài)分布函數(shù),前者導(dǎo)出Logit模型,后者導(dǎo)出Probit模型。3)設(shè)11+e一(卩]+卩2x,)式中,Z=p+PX。并且在該表達(dá)式中,有如下變動規(guī)律,i1 2i當(dāng)ZT+8時,pT1;ii當(dāng)ZT—g時,pT0;ii1當(dāng)Z二0時,p=oi i2(4)Logit模型。1+e1+e—Zi11+ez.p 1+eZii 1—p1+e—Z..(*)/.ln( .—)=Z=B+PX(*)1—p.12..其中一J為機(jī)會概率比(簡稱機(jī)會比,下同),即事件發(fā)生與不發(fā)生所對應(yīng)的概1—p.率之比。稱(*)式為Logit模型。3、Logit模型的特點。隨著p從o變到i(亦即z從—g變到a),nL從—g變到a。可TOC\o"1-5"\h\zi i—p以看出,在LPM中概率必須在0與1之間,但在Logit模型并不受此約束。ln(—L)對X為線性函數(shù)。i—p i當(dāng)ln(—L)為正的時候,意味著隨著X的增加,選擇1的可能性也增i—p i大了。當(dāng)In(丄)為負(fù)的時候,隨著X的增加,選擇1的可能性將減小。換言之,\o"CurrentDocument"1—p i當(dāng)機(jī)會比由1變到0時,ln(—L)會變負(fù)并且在幅度上越來越大;當(dāng)機(jī)會比由11—p變到無窮時,In(丄)為正,并且也會越來越大。1—p二、Logit模型的估計為了估計Logit模型,除了X夕卜,我們還應(yīng)有In(丄)的數(shù)值。由于p只取i 1—p i值為1和0,使得ln(—1)無意義,所以直接對Logit模型進(jìn)行估計有困難。這1—p時,通常有以下估計方法。1、根據(jù)數(shù)據(jù)類型選用OLS方法??赏ㄟ^市場調(diào)查獲得分組或重復(fù)數(shù)據(jù)資料,用相對頻數(shù)p=2作為p的估in ii計。以購買住房為例,將購買住房的情況分組,假設(shè)第i組共有n個家庭,收入i為X,其中有r個家庭已購買住房,其余未購買。則收入為X的家庭,購買住i i i房的頻率為rp=-i-ini將其作為p的估計,并代入對數(shù)機(jī)會比,有i1—p 1—pii于是,樣本回歸函數(shù)為八In(出)=P+PX1—p12ii對上式可直接運用OLS法估計未知參數(shù)了。具體應(yīng)用可參見DamodarN.Gujarati《計量經(jīng)濟(jì)學(xué)基礎(chǔ)》(第四版)下冊,中國人民大學(xué)出版社,2005年。第559頁-第560頁。2、最大似然估計方法。在線性回歸中估計總體未知參數(shù)時主要采用OLS方法,這一方法的原理是根據(jù)線性回歸模型選擇參數(shù)估計,使被解釋變量的觀測值與模型估計值之間的離差平方值為最小。而最大似然估計方法則是統(tǒng)計分析中常用的經(jīng)典方法之一,在線性回歸分析中最大似然估計法可以得到與最小二乘法一致的結(jié)果。但是,與最小二乘法相比,最大似然估計法既可以用于線性模型,又可以用于非線性模型,由于Logit回歸模型是非線性模型,因此,最大似然估計法是估計Logit回歸模型最常用的方法。下面,以單變量為例,說明具體的估計方法。假設(shè)有n個樣本觀測數(shù)據(jù)(X,Y),i=1,2,,n,由于樣本是隨機(jī)抽取,所以,ii在給定X條件下得到的Y=1和Y=0的概率分別是p和1-p。于是,一個觀測i i i i i值的概率為P(Y)=pYi(—pi-)i i i其中,Y二1或Y二0。因為,各項觀察相互獨立,貝h次觀察所得的樣本數(shù)據(jù)的ii聯(lián)合分布可表示為各邊際分布的連乘積l(p,卩)=Hp(y)=npYi(1—p)(1—Yi)1 2 i i ii=1 i=1稱上式為n次觀察的似然函數(shù)。由最大似然估計法的原理知,最大似然估計就是求解出具有最大可能取所給定的樣本觀測數(shù)據(jù)的參數(shù)估計。于是,最大似然估計的關(guān)鍵是估計出p和p,使得上述表達(dá)式取得最大值。將上式兩端取對數(shù)得12

In[l(P,P)]=InH12pYi(1-pIn[l(P,P)]=InH12pYi(1-p)(1-Yi)iii=1=yn[Yinp+(1-Y)in(1-p)]i=1=yniii=1i=1Yln(—)+ln(l-p)i 1-p iiY(p+pX)+in(1—刖"疤)

i1 2i 1+ep1+p2Xi稱上式為對數(shù)似然函數(shù)。為了估計能使in[L(p,p)]有最大的總體參數(shù)估計p和112P,先分別對P,P求偏導(dǎo)數(shù),然后令其為0,得212aink(p,p)]y12 =dapaink(p,p』=yi=1ep1+p2XiY-i 1+ep1+p2Xiep1+p2Xiap2i=1Y-i 1+epi+柑Xi在線性回歸中,似然函數(shù)是通過把偏離差平方和分別對P,P求偏導(dǎo)數(shù)得到,它12對于未知參數(shù)都是線性的,因此,很容易求解。但是對于Logit回歸中的上述兩個方程是關(guān)于p,p的非線性函數(shù),求解十分困難。隨著現(xiàn)代計算機(jī)技術(shù)的發(fā)展,12許多計量經(jīng)濟(jì)學(xué)和統(tǒng)計學(xué)的軟件包均有Logit回歸的參數(shù)最大似然估計值,常用的EViews軟件就含有該估計方法。Logit回歸最大似然估計的統(tǒng)計性質(zhì)(1) 參數(shù)估計具有一致性,即當(dāng)樣本觀測增大時,模型的參數(shù)估計值將比較接近參數(shù)的真值。(2) 參數(shù)估計為漸近有效,即當(dāng)樣本觀測增大時,參數(shù)估計的標(biāo)準(zhǔn)誤相應(yīng)減小。(3) 參數(shù)估計滿足漸近正態(tài)性,即隨著樣本觀測的增大,估計的分布近似于正態(tài)分布。這意味著,可以利用這一性質(zhì)對未知參數(shù)進(jìn)行假設(shè)檢驗和區(qū)間估計了。有關(guān)證明可參見Aidrich,John&ForrestD.Nelson.1984.LinearProbability,Logit,andProbitModels.NewburyPark,SagePubiications三、Logit回歸模型的評價和參數(shù)的統(tǒng)計檢驗與一般線性回歸模型一樣,在得到Logit回歸模型的參數(shù)估計后,還應(yīng)對模型進(jìn)行評價和相應(yīng)的統(tǒng)計檢驗。1、模型的擬合優(yōu)度檢驗。模型估計完成以后,需要對模型是否有效地描述了模型與觀測數(shù)據(jù)的匹配程度進(jìn)行評價。如果模型的預(yù)測值能夠與對應(yīng)的觀測值有較高的一致性,就認(rèn)為該模型能擬合數(shù)據(jù),否則,將不接受這一模型。對Logit回歸模型的評價有多種方法,不同的計算軟件給出的評價結(jié)果也有差異。這里,我們將根據(jù)EViews軟件,介紹模型擬合優(yōu)度的檢驗方法。(1)McFaddenR2在前面的介紹中,已經(jīng)提到對于離散選擇模型,通常的擬合優(yōu)度R2沒有多大意義。在EViews軟件里,有一種方法即McFaddenR2,簡記為R2。其計McF算公式為R2McF1R2McF丄— ur-LIF式中,LIF為模型中包含所有解釋變量的無約束對數(shù)似然函數(shù)值,LIF為模型ur r中僅含有截距項的有約束的對數(shù)似然函數(shù)值。從概念上講,LIF和LIF分別等ur r價于普通線性回歸模型中的TSS和RSS。R2與R2一樣,也在0到1之間變動。McF(2)期望-預(yù)測表檢驗。該方法的原理是,在模型參數(shù)估計后,選取適當(dāng)?shù)慕財嘀祊(0<p<1),將觀測數(shù)據(jù)分成兩組,一組為1/(1+e-z)Wp,另一組為1/(1+e-z)>p,其中,Z=0+(3X。如果樣本中的一個觀測數(shù)據(jù)的Y數(shù)值為0,并且該樣本屬于第1i12i組,或者一個觀測數(shù)據(jù)的Y數(shù)值為1,并且屬于第2組,就稱這個觀測數(shù)據(jù)是分

組恰當(dāng)?shù)?,否則就稱這個觀測數(shù)據(jù)是分組不恰當(dāng)?shù)?。如果模型估計與實際觀測數(shù)

據(jù)比較一致,則大多數(shù)的觀測數(shù)據(jù)應(yīng)該是分組恰當(dāng)?shù)?,反之,如果分組不恰當(dāng)?shù)?/p>

觀測數(shù)據(jù)所占的比重很大,說明模型估計與實際觀測數(shù)據(jù)的擬合程度較差,模型

需要調(diào)整。因此,該方法的思想是利用分組恰當(dāng)與否,得到觀測數(shù)據(jù)占總樣本的

比重來檢驗?zāi)P偷臄M合優(yōu)度。利用軟件EViews進(jìn)行期望-預(yù)測表檢驗的步驟如下:第一步,在估計好模型的窗口中按此路徑選擇View/ExpectationPredictionTable。第二步,出現(xiàn)一個對話框,在對話框里輸入一個截斷值p(0<p<1),系統(tǒng)默認(rèn)的截斷值是0.5。第三步,點擊OK后可生成對應(yīng)的期望-預(yù)測表。這時便可利用該表進(jìn)行擬合優(yōu)度的判斷。有關(guān)Logit回歸模型的擬合優(yōu)度其它檢驗方法,可參見相關(guān)文獻(xiàn),如王濟(jì)川、郭志剛,Logistic回歸模型——方法與應(yīng)用,高等教育出版社,2001年。2、參數(shù)的顯著性檢驗。2、參數(shù)的顯著性檢驗。對模型中參數(shù)的顯著性檢驗,就是決策判斷某個解釋變量對事件的發(fā)生(即選取Y=1)是否有顯著性影響。如果檢驗結(jié)果表明該解釋變量對選取Y=1的發(fā)生有顯著性影響,則認(rèn)為將該解釋變量放入Logit回歸模型中是恰當(dāng)?shù)?。否則,需要對模型進(jìn)行適當(dāng)?shù)恼{(diào)整。(1)Z檢驗。以一元Logit回歸模型為例,設(shè)模型為P(Y=P(Y=11X)=i11+e-(Pj+P2x.)1+exp(-P-PX)12.對該模型中的參數(shù)P的顯著性檢驗的原假設(shè)為H:P二0,即解釋變量X對事件202.Y=1發(fā)生的概率沒有顯著性影響。根據(jù)參數(shù)的最大似然估計性質(zhì)可知,在大樣本條件下,P漸近服從正態(tài)分布,于是,在H:P二0成立的前提下,檢驗統(tǒng)計202量為Z=JLse(p)2漸近服從標(biāo)準(zhǔn)正態(tài)分布。式中,se(P)為最大似然估計P的標(biāo)準(zhǔn)誤差。因此,22

可按常規(guī)查標(biāo)準(zhǔn)正態(tài)分布表,對原假設(shè)進(jìn)行判斷,從而檢驗?zāi)P椭袇?shù)的顯著性。(2)Wald檢驗對模型中參數(shù)顯著性檢驗還可使用Wald檢驗,其檢驗統(tǒng)計量為八W二(2)2se(0)2在H:0=0下,W漸近服從自由度為1的咒2分布。因此,可根據(jù)咒2分布表,02在給定的顯著性水平a下,得到相應(yīng)的臨界值,從而判斷參數(shù)的顯著性??蓞㈤咹auck,W.W.&A.Donner.1977.Wald'testsasappliedtohypothesesinlogitanalysis.JournaloftheAmericanStatisticalAssociation,Vol.72:851-853(3)似然比檢驗。統(tǒng)計學(xué)上已經(jīng)證明,在大樣本情況下,兩個模型之間如果具有嵌套關(guān)系,則兩個模型之間的對數(shù)似然值乘以-2的結(jié)果之差近似服從X2分布。這一統(tǒng)計量就是似然比統(tǒng)計量。該檢驗的思想是,假設(shè)一個模型記為Model、中有解釋變量X,另一個模型j記為Model2包含了Modell中所有其它解釋變量,而沒有包含X,則稱Model2嵌j套于Modell,亦即Modell中包含了Model2。通過這一模型之間嵌套關(guān)系,我們實際上需要判斷的是X出現(xiàn)在模型中是否合適。Hanushek&Jackson,1977;jAldrich&Nelso,1984;Greene,1990;Long,1997分別證實了似然比統(tǒng)計量為LR=(-2liL( -))-(L2ln(moedl2 meold=-2ln^moed^2 )的最大似然函數(shù)moedl1的最大似然函數(shù)其中,ln(L )為所設(shè)定的原模型(即包含了所有解釋變量)model1的對數(shù)值,ln(的對數(shù)值,ln(L )為省略模型(即省略了解釋變量X.)的最大似然函數(shù)的model2 j對數(shù)值,兩者之間的差乘以-2近似地服從X2分布,其自由度為省略了的解釋變量的個數(shù)。接下來,可根據(jù)X2分布表,在給定的顯著性水平a下,得到臨界值,從而判斷參數(shù)的顯著性。例分析某種教學(xué)方法對成績影響的有效性,被解釋變量GRADE為接受新

教學(xué)方法后成績是否改善,如果改善取1,否則取0;GPA為平均分?jǐn)?shù);TUCE為測驗得分;PSI為是否接受新教學(xué)方法,如果接受取1,否則取0。運用EViews軟件中Logit模型估計方法得到如下結(jié)果E¥ie<s-[Equation:EQ01Torkfile:GREEHP204\GreFileEditObjectViewFrocQuickOptionsWindowHelp

View|P「uiz|Object|P「int|Name|F「e^E^|Estimate|Fu「亡cast|Stats|Reside|DependentVariableGRADEMethodML-BinaryLogit(Quadratichillclimbing:Date:06/04/06Time:22:11Sample:132Includedobservations:32Convergenceachievedafter5iterationsCovariancematrixcomputedusingsecondderivatives由表格寫出估MeandependentvarSEofregressionresid034375003847164.144171-12.88963-2059173SDdependentvarAkaikeinfocriterionSchwarzcriterionHannan-Quinncriter-■1 由表格寫出估MeandependentvarSEofregressionresid034375003847164.144171-12.88963-2059173SDdependentvarAkaikeinfocriterionSchwarzcriterionHannan-Quinncriter-■1 ::: '4':::latestrloglikelihoodP^(Y曲1*GPA,TUCE,PSI)二McFaddenR-squared1+e-z0.482569105560212388191116333-0.4028010374038VariableCoefficientStdErrorz-StatisticProbC-13.021364.931317-2.64064100083GPA2.82611312629402.23772600252TUCE009515801415640.67223506014PSI2.37868810646632.23442600256ObswithDep=1 11四、Logit模型回歸系數(shù)的解釋由前面的推導(dǎo)可知,將事件發(fā)生的條件概率定義為P(Y=11X)二p,則我們ii可得到如下模型P(Y=11P(Y=11X)=i11+e-(Pj+P2x.)1+exp(一卩-PX)12.進(jìn)一步,在發(fā)生比的基礎(chǔ)上,我們還可得到如下模型ln(—)=P+PX1-p12..對此模型,由于等式右端為一線性表示,則可完全按照線性回歸模型系數(shù)那樣來解釋。一個解釋變量的作用如果是增加對數(shù)發(fā)生比的話,也就增加了事件發(fā)生的概率。具體來講,Logit模型的系數(shù)如果是正的并且統(tǒng)計顯著,則在控制其它變量的情況下,對數(shù)發(fā)生比隨對應(yīng)的解釋變量值增加而增加,相反,一個顯著的負(fù)

系數(shù)代表對數(shù)發(fā)生比隨對應(yīng)解釋變量的增加而減少。如果系數(shù)的統(tǒng)計性質(zhì)不顯著,說明對應(yīng)解釋變量的作用在統(tǒng)計上與0無差異。1、按發(fā)生比率來解釋Logit模型的系數(shù)。對Logit模型的回歸系數(shù)進(jìn)行解釋時,很難具體把握以對數(shù)單位測量的作用幅度,所以通常是將Logit作用轉(zhuǎn)換成對應(yīng)的發(fā)生比來解釋。設(shè)模型為ln(—=卩+卩X1—p 1 2ii轉(zhuǎn)換成發(fā)生比的形式p 1+eZi—二 -二ez.二eP,+P2x;二eP,xeP2x;i12i12i1—p1+e—Z;;式中,截距P可以作為基準(zhǔn)發(fā)生比的對數(shù)?;鶞?zhǔn)的意思是指當(dāng)Logit模型中沒有1任何解釋變量時所產(chǎn)生的發(fā)生比?;蛘?,除了常量外,所有解釋變量都取0值時所產(chǎn)生的發(fā)生比。對于解釋變量的作用的解釋,由上式看出,各項作用之間已經(jīng)由加法的關(guān)系轉(zhuǎn)變?yōu)槌朔P(guān)系。因此,系數(shù)P的作用可解釋為,當(dāng)P為正值時,22eP2將大于1,則在其它條件不變的情況下,X每增加一個單位值時發(fā)生比會相;應(yīng)增加;當(dāng)P為負(fù)值時,eP2將小于1,說明X每增加一個單位值時發(fā)生比會相2;應(yīng)減少;而當(dāng)P為0時,eP2將等于1,那么X不論怎樣變化發(fā)生比都不會變化。2;例如,在新教學(xué)方法采納的分析中,已估計的方程可按指數(shù)運算法則轉(zhuǎn)變?yōu)镻(Y=11GPA,P(Y=11GPA,TUCE,PSI)=11+e-z1+e—(—13.0214+2.8261GPA+0.0952TUCE+2.3787PSI)=e—(—13.0214+2.8261GPA+0.0952TUCE+2.3787PSI)1—p=e13.0214xe2.8261GPAXe0.0952TUCEXe2.3787PSI由上述表達(dá)式可以看出,由于GPA>0,則e2.826卜1,因此,在其它條件不變的情況下,平均分?jǐn)?shù)每增加一個單位,將導(dǎo)致接受新教學(xué)方法后成績有所改善的發(fā)生比會相應(yīng)提高。同理,對于變量TUCE也可作類似的討論;由于PSI為虛擬解釋變量,表示是否接受新教學(xué)方法,如果接受取1,否則取0,因此,在其它條件

不變的情況下,當(dāng)PSI=1時,則將會使接受新教學(xué)方法后,學(xué)習(xí)成績改善的發(fā)生比有所提高,而當(dāng)PSI=0時,則將會使接受新教學(xué)方法后,學(xué)習(xí)成績改善的發(fā)生比保持不變。2、用概率來解釋Logit模型的系數(shù)。除了解釋變量對于對數(shù)發(fā)生比的偏作用外,有時也用事件發(fā)生的概率來解釋模型中系數(shù)的偏作用。對事件發(fā)生概率的偏作用可以通過對Logit模型P(P(Y=IIX)=i11+e-(Pj+P2x.)求X的偏導(dǎo)數(shù)來加以解釋。其求導(dǎo)結(jié)果如下ieP1+PeP1+P2XidpdXid(匚三一)1+eP,+P2x.- 2dX (1+eP1+P2Xi)2iPeP1+P2Xi-P2p(1-p)于是,變量X對事件發(fā)生概率的偏作用就等于該解釋變量的系數(shù)P與p(1-p)的i2乘積。偏作用的符號由P決定,因為p(1-p)永遠(yuǎn)為正值,作用的幅度依賴于P22的幅度和對應(yīng)于X特定值的概率,而它與模型中所有其它解釋變量有關(guān)。因此i不同于對發(fā)生比作用的解釋,對事件發(fā)生概率的偏作用是隨p值的變化而變化的。這就需要在討論變量X對事件發(fā)生概率的偏作用時,應(yīng)將概率p值計算出i來后,才能解釋其偏作用。3、預(yù)測概率。與一般線性回歸模型一樣,根據(jù)Logit模型也可以獲得事件發(fā)生的預(yù)測概率。以一個解釋變量的Logit模型為例,如果我們知道參數(shù)估計P和P,并確定某一12事件的X(i豐1,2, ,n),便可將其代入Logit模型,計算預(yù)測概率。計算公式為i入 1 eA+^Xp— —Y 入 入 Y 入 入1+e-(P1+P2Xi) 1+eP1+P2Xi在計算預(yù)測概率的基礎(chǔ)上,還進(jìn)一步計算在解釋變量發(fā)生離散變化時預(yù)測概率的變化,這種方法被稱為概率離散變化法。其計算公式是Ap—P[y—1IX]-P[y—1%]—P[y—AX]i+1 i

e卩i正卩jXjie卩i正卩jXjie j=1(i=1,2,…,n)一(久+^p.X..) p,+^p.X..1+e1 j=i jji1+e1j=ijji相應(yīng)的對數(shù)發(fā)生比為ln4^扌p+才pX i?毛1…2,n,)1—p 1 jjii j=1類似多元線性回歸模型,在Logit模型中,由于多個解釋變量可能會以多個不同的尺度加以測量,這個時候要直接對比不同解釋變量對發(fā)生比的影響是不行的,因此,需要對解釋變量進(jìn)行標(biāo)準(zhǔn)化變換,將解釋變量和被解釋變量由非標(biāo)準(zhǔn)化變量轉(zhuǎn)換為標(biāo)準(zhǔn)化變量,從而,才直接對比各個解釋變量對發(fā)生比的影響大小。其變換方法與多元線性回歸模型一樣。可參見王濟(jì)川、郭志剛,Logistic回歸模型——方法與應(yīng)用,高等教育出版社,2001年。第115頁-第117頁。第三節(jié)Probit模型_、Probit模型及參數(shù)估計在前面已經(jīng)看到,由S型曲線,可分別得到累積分布函數(shù)和標(biāo)準(zhǔn)正態(tài)分布函數(shù),對于后者可建立一個二元選擇的Probit模型。單一解釋變量X的Probit模i型為p1+p2XiP(Y=11X)=?(p+pX)=112'p(z)dzi12i—g式中①(z),申(z)分別為標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)和密度函數(shù)。與Logit模型的參數(shù)估計相似,對Probit模型的參數(shù)估計也可采用最大似然估計方法。有的教科書還介紹了一種運用效用行為選擇理論建立Probit模型,并采用群組數(shù)據(jù)對Probit模型的參數(shù)應(yīng)用OLS方法進(jìn)行估計(參見DamodarN.Gujarati《計量經(jīng)濟(jì)學(xué)基礎(chǔ)》(第四版)下冊,中國人民大學(xué)出版社,2005年,

第569頁-573頁)。這里我們僅根據(jù)計算軟件Eviews的功能,介紹最大似然估計對Probit模型參數(shù)的估計。在樣本分布與總體分布一致的前提下,按隨機(jī)抽樣原則抽取樣本,對n則抽取樣本,對n個樣本(X,Y)iii二1,2, ,n,建立對數(shù)似然函數(shù)ln[Lln[L0P]扌[Y1 2 ii=1)丄郵40(X]1 2i))上述模型的最大似然估計就是使該表達(dá)式有最大值時的0、0的估計0、121具體求解過程這里不再贅述。例在前述新教學(xué)方法的例子里,運

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論