管理研究方法:邏輯、軟件與案例 課件 第2章:計量經(jīng)濟(jì)學(xué)_第1頁
管理研究方法:邏輯、軟件與案例 課件 第2章:計量經(jīng)濟(jì)學(xué)_第2頁
管理研究方法:邏輯、軟件與案例 課件 第2章:計量經(jīng)濟(jì)學(xué)_第3頁
管理研究方法:邏輯、軟件與案例 課件 第2章:計量經(jīng)濟(jì)學(xué)_第4頁
管理研究方法:邏輯、軟件與案例 課件 第2章:計量經(jīng)濟(jì)學(xué)_第5頁
已閱讀5頁,還剩129頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第2章:計量經(jīng)濟(jì)學(xué)Econometrics2.1多元線性回歸分析2.1.1多元線性回歸模型

例題1:CD生產(chǎn)函數(shù)

這是一個非線性函數(shù),但取對數(shù)可以轉(zhuǎn)變?yōu)橐粋€對參數(shù)線性的模型注意:“線性”的含義是指方程對參數(shù)而言是線性的

例題2:新凱恩斯混合Phillips曲線根據(jù)經(jīng)濟(jì)學(xué)理論數(shù)理模型被表述為:對應(yīng)的計量經(jīng)濟(jì)學(xué)模型為:計量模型有時來源于經(jīng)濟(jì)學(xué)理論,隨機(jī)誤差項(xiàng)包含一些次要的、沒有出現(xiàn)在經(jīng)濟(jì)模型中的影響因素一般形式可以表述為如下的形式:均值方程線性回歸方程與均值方程的聯(lián)系

這部分是解釋變量無法解釋的隨機(jī)噪聲。并且被分解的這兩部分是正交的,即這兩部分沒有信息的重疊。

多元線性回歸方程將被解釋變量分解成為兩部分:

這部分是可以由解釋變量來解釋。

(2)(1)【偏效應(yīng)】解釋變量的估計參數(shù)表示對被解釋變量均值的偏效應(yīng)。表示其他被解釋變量均保持不變時,變化一個單位,導(dǎo)致被解釋變量均值變化個單位。為什么叫偏效應(yīng)?這是因?yàn)樗暮x恰好類似于高等數(shù)學(xué)中偏導(dǎo)數(shù)的含義。2.1.2多元線性回歸模型的OLS估計一、回歸系數(shù)的估計1.回歸系數(shù)的OLS估計:一般形式

其樣本回歸函數(shù)為:是OLS估計量OLS的估計思想:(1)尋找參數(shù)估計量,使得樣本回歸函數(shù)與所有樣本觀測點(diǎn)的偏離最小,即殘差平方和最小。

為什么不選擇離差之和最小化或者離差絕對值之和最小化呢?

因?yàn)殡x差之和會使正負(fù)誤差抵消,而離差絕對值不便于數(shù)學(xué)上做優(yōu)化處理,所以選擇了離差平方和最小化作為優(yōu)化目標(biāo),這也就是為什么這種估計方法被稱為最小二乘法的原因。(2)優(yōu)化目標(biāo)根據(jù)其一階優(yōu)化條件:得到計算回歸系數(shù)估計量的正規(guī)方程組:

注意:只有回歸方程中包含常數(shù)項(xiàng),由OLS估計所得殘差總和才一定為0。含義:OLS估計所的殘差與解釋變量不相關(guān)。即殘差中不存在任何可解釋的成份?;貧w模型的解釋變量之間不能存在完全的多重共線性。

“完全的多重共線性”:是指一個解釋變量是其他解釋變量的線性組合。說明該解釋變量所提供的信息與其他解釋變量是完全重復(fù)的。當(dāng)存在完全共線性時,模型的參數(shù)不可識別。即任何方法都無法得到參數(shù)估計值,包括OLS。存在不完全共線性時,可以得到參數(shù)估計值。OLS估計量是BLUE。但與沒有多重共線性時相比,估計量的方差較大,估計精度下降。高斯——馬爾可夫定理

如果多元線性回歸方程滿足經(jīng)典假定條件,則回歸系數(shù)的OLS估計量是線性的、無偏的,最優(yōu)的(在所有無偏估計量中具有最小方差)估計量,即BLUE。

最關(guān)鍵的假定:解釋變量是外生變量,它保證了OLS估計量的無偏性。

討論:如果解釋變量不滿足外生性假定,例如,解釋變量與誤差項(xiàng)相關(guān),那么誤差項(xiàng)對被解釋變量的影響由誰反映?

例子:基于某數(shù)據(jù)估計中國宏觀生產(chǎn)函數(shù)Se:0.78800.09020.0220t值:-11.313677.353434.1171p值:0.00000.00000.0000P值非常小,這表明各個解釋變量對被解釋變量有顯著的解釋作用。

回憶:P值是檢驗(yàn)結(jié)論犯第一類“棄真”錯誤的概率。P值非常小的含義是什么呢?二、隨機(jī)誤差項(xiàng)方差的估計的無偏估計量可以表述為:自由度為什么是N-(K+1)?多元回歸模型的OLS估計中,我們基于正規(guī)方程組中的K+1個約束估計了K+1個回歸系數(shù),所以損失了K+1個自由度,獨(dú)立的觀測信息只剩下N-(K+1)個。三、判定系數(shù)的調(diào)整總平方和等于解釋平方和加上殘差平方和

TSS=ESS+RSS判定系數(shù)

后果:在回歸模型中增加新的解釋變量時,只可能增加,而決不會下降。缺陷:只反映擬合效果,不反映自由度損失。

調(diào)整思想:對進(jìn)行自由度調(diào)整。2.1.3多元線性回歸模型的假設(shè)檢驗(yàn)一、參數(shù)假設(shè)檢驗(yàn)的基本思想基于對誤差項(xiàng)分布的假定,得到參數(shù)估計量的分布;對參數(shù)估計量進(jìn)行標(biāo)準(zhǔn)化,使之服從某一標(biāo)準(zhǔn)分布,如我們熟悉的t分布,得到檢驗(yàn)統(tǒng)計量;以原假設(shè)的參數(shù)值作為檢驗(yàn)統(tǒng)計量中的參數(shù)真值。如果原假設(shè)為“真”,則檢驗(yàn)統(tǒng)計量就服從相應(yīng)的理論分布。反之,檢驗(yàn)統(tǒng)計量就不服從該分布?;谒x擇的顯著性水平,將檢驗(yàn)統(tǒng)計量的理論分布區(qū)間劃分為小概率的“拒絕域”和大概率的“不拒絕域”。根據(jù)參數(shù)的估計值計算檢驗(yàn)統(tǒng)計量的值。如果檢驗(yàn)統(tǒng)計值出現(xiàn)在拒絕域,根據(jù)“小概率事件原理”,原假設(shè)很可能是“假”的,則拒絕原假設(shè)。反之,就沒有充分的理由拒絕原假設(shè)。二、單參數(shù)的顯著性檢驗(yàn)

1.隨機(jī)誤差項(xiàng)方差的顯著性檢驗(yàn)如果隨機(jī)誤差項(xiàng)是經(jīng)典誤差項(xiàng),且滿足正態(tài)性假定,則:=

來源:標(biāo)準(zhǔn)化殘差服從標(biāo)準(zhǔn)正態(tài)分布,統(tǒng)計量實(shí)際上是N-(K+1)個相互獨(dú)立的標(biāo)準(zhǔn)化殘差的平方和。而服從標(biāo)準(zhǔn)正態(tài)分布的多個獨(dú)立統(tǒng)計量平方加總,所得到的新統(tǒng)計量就服從分布。2.單個回歸系數(shù)的顯著性檢驗(yàn)如果隨機(jī)誤差項(xiàng)是經(jīng)典誤差項(xiàng),并且滿足正態(tài)性假定

用估計量的標(biāo)準(zhǔn)誤替代標(biāo)準(zhǔn)差,統(tǒng)計量服從t分布。即:

注意:與一元回歸的唯一區(qū)別是自由度。三、多參數(shù)的線性約束檢驗(yàn)1:模型的總體顯著性檢驗(yàn)、…、若隨機(jī)誤差項(xiàng)滿足中至少一個不為0。則在原假設(shè)成立情況下:有2:模型參數(shù)之間的線性約束檢驗(yàn):

例子:柯布-道格拉斯生產(chǎn)函數(shù)檢驗(yàn)假設(shè)為:=1

這樣的多參數(shù)單個線性約束,有兩種檢驗(yàn)方法.本例中:=5.9456。p值為0.0000

結(jié)論:拒絕規(guī)模報酬不變的原假設(shè),而認(rèn)為規(guī)模報酬是遞增的(為什么?)。

(1)t檢驗(yàn)(2)F檢驗(yàn):無約束回歸方程將原假設(shè)中的約束條件帶入回歸方程,得到了所謂的“有約束回歸方程”。將其RSS記為,自由度為N-3。將其RSS記為,自由度為N-2?;诤停谠僭O(shè)成立的情況下,有如果原假設(shè)為真,我們會傾向于得到較小的F值。反之,我們會傾向于得到較大的F值。檢驗(yàn)統(tǒng)計量判定:若F值大于臨界值,或p值小于顯著性水平,則拒絕原假設(shè)。中國生產(chǎn)函數(shù)的例子:=39.2330。=0.0279,=0.0700,

F檢驗(yàn)統(tǒng)計值為:該F統(tǒng)計值的p值為0.0000,所以,我們可以拒絕中國經(jīng)濟(jì)規(guī)模報酬不變的原假設(shè)。3:參數(shù)的線性約束檢驗(yàn):F檢驗(yàn)一般形式對于多元線性回歸模型:參數(shù)的多個約束:待檢驗(yàn)假設(shè):原假設(shè)中至少有一個約束條件不成立。

基于和,在原假設(shè)成立的情況下,有如果原假設(shè)為真,我們會傾向于得到較小的F值。反之,我們會傾向于得到較大的F值。檢驗(yàn)統(tǒng)計量判定:若F值大于臨界值,或p值小于顯著性水平,則拒絕原假設(shè)。4:結(jié)構(gòu)穩(wěn)定性檢驗(yàn):F檢驗(yàn)的一個例子——鄒檢驗(yàn)例:中國宏觀生產(chǎn)函數(shù)在1992年前后是否不同?1978~1992年:1993~2006年:無約束回歸:參數(shù)可以不同受約束回歸:參數(shù)不變1978~2006年:F檢驗(yàn)統(tǒng)計量:在原假設(shè)為真時,其分布為

本例中,鄒檢驗(yàn)結(jié)果:P=0.0000。

結(jié)論:拒絕中國生產(chǎn)函數(shù)保持穩(wěn)定的原假設(shè)。待檢驗(yàn)假設(shè)::原假設(shè)中約束條件至少有一個不成立。半彈性,不變的條件下,每增加一個單位,平均增加0.01×個百分點(diǎn)?!?.1.4線性回歸模型的擴(kuò)展一、含有對數(shù)化變量的模型

對的彈性,不變的條件下,每增加一個百分點(diǎn),平均增加個百分點(diǎn)。半彈性,不變的條件下,每增加一個單位

平均增加100×個百分點(diǎn)。二、多項(xiàng)式模型廠商平均成本與產(chǎn)量之間的U型關(guān)系產(chǎn)量平均成本

廠商平均成本曲線環(huán)境污染與人均收入的關(guān)系人均收入環(huán)境污染

環(huán)境庫茲涅茨曲線環(huán)境庫茲涅茨曲線的回歸方程:

(1)回歸系數(shù)不再反映解釋變量對被解釋變量的偏效應(yīng)(2)多項(xiàng)式模型可以幫助估計經(jīng)濟(jì)關(guān)系發(fā)生轉(zhuǎn)換的位置經(jīng)濟(jì)關(guān)系發(fā)生轉(zhuǎn)換的位置是:即WG:排污量;PGDP:人均GDP三、變量的時間趨勢考察一個經(jīng)濟(jì)體的生產(chǎn)函數(shù)時,受知識積累等多方面因素影響,其總產(chǎn)出可能會包含一個隨時間變化的確定性成份對數(shù)變換的形式為通過引入時間變量作為解釋變量以退化被解釋變量時間趨勢的同時,還同時退化了其他所有解釋變量的時間趨勢。2.2離散因變量

2.2.1logistic回歸分析logistic回歸為概率型非線性回歸模型,是研究分類觀察結(jié)果(y)與一些影響因素(x)之間關(guān)系的一種多變量分析方法。1.多元線性回歸方法要求Y的取值為連續(xù)性隨機(jī)變量2.多元線性回歸方程要求Y與X間關(guān)系為線性關(guān)系3.多元線性回歸結(jié)果不能回答“發(fā)生與否”logistic回歸方法補(bǔ)充多元線性回歸的不足37

值得注意的是,因變量并不僅僅局限于“是”或“否”這樣的二分變量。

比如,美國總統(tǒng)的選舉問題。假定有三個政黨——民主黨、共和黨和獨(dú)立黨派,因變量就是三分變量。此外,還可能存在五分變量或者多分因變量的問題。

在這種情況下,我們運(yùn)用相應(yīng)的模型來預(yù)測每種事件發(fā)生的概率,因此,含有定性變量作為因變量的模型通常被成為概率模型。38

因?yàn)橥ǔG闆r下,我們考慮被解釋變量為二元變量的模型,這種模型也因此被稱為二元選擇模型或者離散選擇模型,如果為多元,則稱之為多元選擇模型。

離散選擇模型起源于Fechner于1860年所進(jìn)行的動物條件二元反射研究,1962年Warner首次將這一方法應(yīng)用與經(jīng)濟(jì)研究領(lǐng)域。Mcfadden因?yàn)樵陔x散選擇模型領(lǐng)域里的突出貢獻(xiàn)而獲得了2000年的諾貝爾經(jīng)濟(jì)學(xué)獎。39例如,公共交通和私人交通的選擇問題

對某種商品的購買決定問題離散選擇模型在實(shí)際生活中的應(yīng)用

大學(xué)生對職業(yè)的選擇問題40一、基本概念

1.變量的取值

logistic回歸要求應(yīng)變量(Y)取值為分類變量(兩分類或多個分類);自變量(Xi)稱為危險因素或暴露因素,可為連續(xù)變量、等級變量、分類變量;可有m個自變量X1,X2,…Xm

412.兩值因變量的logistic回歸模型方程一個自變量與Y關(guān)系的回歸模型其中:記家庭擁有自有住房的條件概率為P(Yi=1|Xi),則不擁有自己住房的概率就是1-P(Yi=1|Xi):條件期望:那么:42例如,我們對一個是否擁有自有住房的案例進(jìn)行回歸,結(jié)果如下:回歸擬合的很好,經(jīng)濟(jì)學(xué)意義也非常明確,收入Xi每增加1單位(1萬元人民幣),平均擁有住房的概率將增加10.56%:但問題是,當(dāng)收入10萬元,或者更少的情況下,平均擁有住房的概率為負(fù)值,而當(dāng)收入為20萬元,或者更多的情況下,平均擁有住房的概率大于1,因此,我們必須考慮相應(yīng)的方法對這一問題進(jìn)行處理。43對同樣的問題,我們采用如下的模型形式:那么:從而:這樣的事件發(fā)生比Li,不僅對Xi是線性的,對參數(shù)也是線性的,而且發(fā)生概率將永遠(yuǎn)落在0和1之間,Li就被稱為logit,像*這樣的模型也就被稱為logit模型。參數(shù)的含義是什么?44現(xiàn)在定義:當(dāng)X變化一個單位時:因此有:45二、logit模型的估計為了估計事件發(fā)生的概率之比Li,除了需要知道解釋變量的數(shù)據(jù)之外,還得知道Li的數(shù)值。此時,該如何處理?依然以是否擁有自有住房為例進(jìn)行說明,不同的收入水平下有很多個家庭N,在這一收入水平下有n個家庭擁有自己的住房,其余N-n個家庭沒有自己的住房,那么我們就可以用事件發(fā)生的相對頻率作為事件發(fā)生概率的估計值Pi,并利用這個估計值得到Li。事實(shí)上,當(dāng)樣本容量足夠大的時候,這樣的頻率將是概率的良好估計。對模型*估計之后,如何計算指定收入水平下?lián)碛凶》康母怕剩?.一般情況下的估計46回歸結(jié)果如下:這就意味著,當(dāng)收入增加1萬元時,根據(jù)該樣本回歸的結(jié)果認(rèn)為,擁有自有住房的發(fā)生比將增加8.2%472.解釋變量同樣為定性變量的情況Xi=1時:Xi=0時:如果定義:那么就有:例:抽煙與否與患食道癌的概率Y(患食道癌)X(抽煙習(xí)慣)發(fā)生的頻數(shù)1115520119310128400164其中,Y=0表示沒有罹患食道癌,Y=1則表示患了食道癌;X=0表示沒有抽煙習(xí)慣,X=1則表示有抽煙的習(xí)慣49回歸的結(jié)果如下:表示什么含義?這意味著在其他條件都相同的情況下,抽煙人士患食道癌的可能性是不抽煙人士的3.7倍還要多。3.多個解釋變量的情況在很多情況下,解釋變量既有定性變量,又有連續(xù)變量,而且連續(xù)變量并非分組變量,很難計算出解釋變量取不同值時事件發(fā)生的頻率,在這種情況下,又該如何處理?例如:新的教學(xué)方法對大一新生成績的影響如果學(xué)生期末成績?yōu)锳,則記為被解釋變量PJ=1,如果期末成績?yōu)锽或者C或者更低,則記為被解釋變量PJ=0。考慮使用的解釋變量為:學(xué)生的平均學(xué)分GPA

學(xué)生在期初時的成績PRES

是否使用新的教學(xué)方法(1,是;0,否)51建立如下logit模型:回歸結(jié)果如下:52這意味著在其他條件都相同的情況下,或者說控制了其他影響學(xué)生期末成績的情況下,接受新教學(xué)方法的學(xué)生得到A的可能性是沒有接受新教學(xué)方法學(xué)生的6倍多。需要注意的是,在logit模型中,模型的擬合優(yōu)度衡量的是正確預(yù)測次數(shù)的概率,這樣的擬合優(yōu)度對于回歸而言是次要的,回歸系數(shù)的期望符號以及他們在統(tǒng)計上的顯著性才是首要的。此外,這種logit估計是針對大樣本的,對于小樣本并不適用。532.2.2probit回歸分析probit模型也是一種廣義的線性模型。服從正態(tài)分布。當(dāng)因變量是名義變量時,Logit和Probit并沒有本質(zhì)的區(qū)別,一般情況下可以換用。區(qū)別在于采用的分布函數(shù)不同,Logit模型假設(shè)隨機(jī)變量服從邏輯概率分布,而Probit模型則假設(shè)隨機(jī)變量服從正態(tài)分布。這兩種分布函數(shù)的區(qū)別在于邏輯概率分布函數(shù)的尾巴比正態(tài)分布粗一些。但當(dāng)因變量是序次變量時,回歸時只能用有序Probit模型。有序Probit可以看作是Probit的擴(kuò)展54一、使用群組數(shù)據(jù)的Probit估計假定在是否擁有自有住房的回歸中,第i個家庭對是否擁有住房的決定,依賴于一種不可觀測的效用指數(shù)Ii,而后者又按照某種方式取決于解釋變量,比如說取決于收入:而且指數(shù)Ii的值越大,家庭擁有住房的概率就越高。其中Xi表示第i個家庭的收入水平。Xi仍然具有分組的特征55擁有自有住房的決定如何與Ii發(fā)生關(guān)系呢?一個合理的假定就是:對每一個家庭而言,都存在一個門檻值Ii*,當(dāng)Ii*≤Ii時,該家庭擁有自己住房,否則不擁有,因此有:其中F(?)是標(biāo)準(zhǔn)正態(tài)分布函數(shù),Ii是效用函數(shù)。

因?yàn)镻i=F(Ii),F(xiàn)(?)為單調(diào)遞增函數(shù),因此,Ii=F-1(Pi),其中F-1(?)是正態(tài)CDF的反函數(shù)。56累積分布函數(shù)P(Yi=1|Xi)表示給定解釋變量X的值時,擁有自有住房這一事件出現(xiàn)的概率,如下圖所示:57對于模型:估計步驟如下:從分組數(shù)據(jù)得到根據(jù)得到的,從標(biāo)準(zhǔn)正態(tài)CDF中得到Ii=F-1(Pi)用得到的Ii作為模型(1)中的因變量,用OLS對模型(1)進(jìn)行回歸,得到相應(yīng)的參數(shù)。58對是否擁有自有住房的例子,回歸結(jié)果如下:Xi的系數(shù)0.0487代表什么含義?59對Probit模型中系數(shù)的解釋:考察X的單位變動對Y=1這一事件發(fā)生概率的影響,也就是求:其中,是在處取值的標(biāo)準(zhǔn)正態(tài)概率密度函數(shù)。60就本例而言,當(dāng)Xi=5萬元時,標(biāo)準(zhǔn)正態(tài)密度函數(shù)的值為:查標(biāo)準(zhǔn)正態(tài)分布表可知:-0.7478處的標(biāo)準(zhǔn)正態(tài)密度約為0.3011,將該值乘以斜率系數(shù)的估計值0.0487,得到0.0147。

這意味著,從5萬元開始,如果收入上升1萬元,一個家庭購買住宅的可能性將上升約1.47%。61例:貸款決策模型某商業(yè)銀行從歷史貸款客戶中隨機(jī)抽取78個樣本,根據(jù)設(shè)計的指標(biāo)體系分別計算它們的“商業(yè)信用支持度”(CC)和“市場競爭地位等級”(CM)。目的是研究客戶的貸款結(jié)果JG與CC、CM之間的關(guān)系,并為正確貸款決策提供支持。62cmcccmcccmcc636465結(jié)果表示:當(dāng)CC和CM已知時,代入方程,可以計算貸款成功的概率JGF。例如,將表中第19個樣本:CC=15、CM=-1代入方程右邊,括號內(nèi)的值為0.1326552;查標(biāo)準(zhǔn)正態(tài)分布表,對應(yīng)于0.1326552的累積正態(tài)分布為0.5517;于是,JG的預(yù)測值JGF=1-0.5517=0.4483,即對應(yīng)于該客戶,貸款成功的概率為0.4483。66二、非群組數(shù)據(jù)的Probit估計仍然以前面新的教學(xué)方法與學(xué)生成績之間的關(guān)系為例:如果學(xué)生期末成績?yōu)锳,則記為被解釋變量PJ=1,如果期末成績?yōu)锽或者C或者更低,則記為被解釋變量PJ=0??紤]使用的解釋變量為:學(xué)生的平均學(xué)分GPA

學(xué)生在期初時的成績PRES

是否使用新的教學(xué)方法(1,是;0,否)67用Logit回歸的結(jié)果如下:用Probit回歸的結(jié)果如下:68由于要考察新的教學(xué)方法TAN對學(xué)生成績的影響,現(xiàn)在求概率函數(shù)對TAN的導(dǎo)數(shù):帶入各解釋變量的均值,得到:查標(biāo)準(zhǔn)正態(tài)分布表可知:-0.6212處的標(biāo)準(zhǔn)正態(tài)密度約為0.3292,將該值乘以斜率系數(shù)的估計值1.1281,得到0.3713,也就是說,接受新的教學(xué)方法的學(xué)生得到A的可能性比未接受新教學(xué)方法的學(xué)生高37.13%。69三、Ordered-Probit估計當(dāng)被解釋變量為有序的分類變量時,或者,分類的個數(shù)超過兩個的時候,我們需要用Probit模型去進(jìn)行估計,具有這樣特征的Probit模型就是Ordered-Probit模型。比如,因變量為:70與一般的Probit模型一樣,我們需要設(shè)定一個狀態(tài)變量或者效用函數(shù),使之具有如下特征:或者寫成向量的形式:ui為標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)誤差項(xiàng):71被解釋變量和效用函數(shù)之間的關(guān)系定義如下(以3種分類為例):因?yàn)椋@種關(guān)系也可以寫成:ui的概率密度為:72與一般的Probit模型一樣,解釋變量X的變化對事件發(fā)生概率的邊際影響為:很明顯:P(Yi=0)的導(dǎo)數(shù)與系數(shù)β符號相反;P(Yi=2)的導(dǎo)數(shù)與系數(shù)β符號相同;P(Yi=1)的導(dǎo)數(shù)的符號則不確定,它取決于密度函數(shù)和的大小比較。73例:居民的幸福感與居民收入差距之間的關(guān)系本例中幸福感(HAPPINESS)在數(shù)字1到5之間變化,具體表達(dá)式如下:HAPPINESS=1,如果HAPPINESS≤C1非常不幸福HAPPINESS=2,如果C1<HAPPINESS≤C2不幸福HAPPINESS=3,如果C2<HAPPINESS≤C3一般HAPPINESS=4,如果C3<HAPPINESS≤C4幸福HAPPINESS=5,如果C4<HAPPINESS非常幸福居民收入差距用基尼系數(shù)來衡量74樣本的基本情況:75變量之間的相關(guān)性:可見,不管樣本來自于城市還是農(nóng)村,其基尼系數(shù)與居民之間的幸福感都呈現(xiàn)負(fù)相關(guān)關(guān)系,基尼系數(shù)越大,居民的幸福感越低。因此,隨著收入差距的拉大,居民幸福感就會降低,但農(nóng)村居民基尼系數(shù)與幸福感之間的負(fù)相關(guān)關(guān)系并不顯著。76解釋變量主要有以下四類:個體特征變量(personal):包括性別(sex)、

年齡(age)、

宗教信仰(religion)、工作狀況(job)、受教育程度(education)和婚姻狀況(marital);收入變量(income):用樣本家庭全年總收入(family-income)衡量;收入差距變量(inequality),用基尼系數(shù)(gini)衡量;滿意度變量(satisfaction),包括家庭經(jīng)濟(jì)狀況滿意度,家庭關(guān)系滿意度人際關(guān)系滿意度個人健康狀況滿意度住房狀況滿意度社區(qū)滿意度以及工作滿意度,分別用satisfaction1-7表示。具體的模型設(shè)定如下:happiness=f(personal,income,inequality,satisfaction)其中收入變量取其對數(shù)值77回歸的結(jié)果如下:略782.2.3tobit回歸分析

Tobit模型是Probit模型的一個擴(kuò)展,最先由諾貝爾經(jīng)濟(jì)學(xué)家詹姆斯?托賓提出。例:對人們購買住房的情況進(jìn)行分析時,不僅想知道樣本個體是否購買了住房,還想知道其花在購買住房上的金額。此時就存在這樣一個問題:如果一個消費(fèi)者沒有購買住房,那么我們就無法得到他花在購買住房上的具體金額。

Tobit模型就是針對這種情況而言的:對統(tǒng)計調(diào)查取得的數(shù)據(jù)進(jìn)行研究的時候,被解釋變量不能被完全觀察的情形,我們稱之為數(shù)據(jù)出現(xiàn)了截取或者斷尾的現(xiàn)象。79一、截取數(shù)據(jù)截取和斷尾的共同之處在于:樣本因?yàn)槟撤N原因,不能夠代表真實(shí)的總體,因此簡單的OLS估計將會得到不一致的結(jié)果,如果借助極大似然估計方法,就必須對總體分布施加更強(qiáng)的假設(shè),才能夠從有偏的樣本中得到一致的參數(shù)估計結(jié)果。當(dāng)被解釋變量y的取值被限定在一個特定的范圍內(nèi)時,就出現(xiàn)了數(shù)據(jù)截取問題。此時,我們觀察到y(tǒng)在一個特定的范圍之內(nèi)并不等于其真實(shí)值y*,通常情況下,y在這一特定范圍之內(nèi)會等于某一常數(shù)。1.定義80數(shù)據(jù)截取分為從上截取和從下截取,又稱為右截取和左截取。在從上截取的情形中,當(dāng)真實(shí)值y*大于某一值c時,我們就無法觀測到真實(shí)的y*,而是觀察到y(tǒng)=c,因此從上截取更詳細(xì)的表達(dá)式為:相應(yīng)的,在從下截取的情形中,當(dāng)真實(shí)值y*小于某一值c時,我們就無法觀測到真實(shí)的y*,而是觀察到y(tǒng)=c,因此從下截取更詳細(xì)的表達(dá)式為:2.產(chǎn)生截取數(shù)據(jù)的原因角點(diǎn)解的存在:在消費(fèi)者或者廠商問題中,會面臨預(yù)算約束或者資源約束,當(dāng)這些約束條件成立時,就會產(chǎn)生角點(diǎn)解。例如:在耐用消費(fèi)品的選擇中,如果最優(yōu)消費(fèi)數(shù)量y*小于1,消費(fèi)者就會選擇不購買,此時我們就只能觀測到y(tǒng)=0;

在電影或者球賽的門票銷售中,由于受到場地的限制,當(dāng)電影或比賽備受歡迎,門票的需求量超過了座位數(shù)c時,我們也只能觀測到y(tǒng)=c。82數(shù)據(jù)分類:在對數(shù)據(jù)進(jìn)行分類整理時,我們常常會把低于某個下限或者高于某個上限的數(shù)值用下限或者上限來代替,從而產(chǎn)生數(shù)據(jù)截取的問題。比較典型的例子就是:對收入調(diào)查數(shù)據(jù)進(jìn)行處理時,對于高收入群體,調(diào)查中就經(jīng)常采用類似“高于2萬元”這樣的選項(xiàng),從而使得這一樣本個體的具體收入情況無法得知,也就產(chǎn)生了從上截取的現(xiàn)象。83二、斷尾數(shù)據(jù)當(dāng)被解釋變量y的取值在某一范圍內(nèi)時,我們無法獲得有關(guān)的樣本信息,此時就出現(xiàn)了數(shù)據(jù)斷尾的問題。數(shù)據(jù)斷尾實(shí)際上是一個樣本缺失的問題,由于缺失的樣本在某個截取點(diǎn)之外,因此就稱之為“斷尾”。1.定義由此可見,數(shù)據(jù)“斷尾”情況下,數(shù)據(jù)的缺失不是隨機(jī)的,它具有系統(tǒng)性,從而導(dǎo)致所得到的的樣本并不具有對總體的代表性,我們可以這樣表示從上“斷尾”的情形:842.產(chǎn)生斷尾數(shù)據(jù)的原因

樣本選擇是產(chǎn)生斷尾數(shù)據(jù)的主要原因。所謂樣本選擇是指所觀察到的樣本由于在抽樣的過程中,或多或少受到因變量取值的影響,而因此成為非隨機(jī)樣本。被調(diào)查對象的“自選擇”行為:具有某種特定行為或特征的被調(diào)查對象很容易進(jìn)入到樣本中來,而其他的被調(diào)查對象則容易被排除在外。例如:對工資與工作時間關(guān)系的研究時,容易出現(xiàn)“自選擇”的情況。在勞動力市場中,我們所觀察到的工資和工作時間都是從就業(yè)群體中獲得的,而那些失業(yè)者能夠接受的保留工資和意愿工作時間則無法觀察到。85抽樣方案設(shè)計不當(dāng):如果抽樣方案設(shè)計不當(dāng),也會產(chǎn)生數(shù)據(jù)斷尾的情形,在這種情況下,因?yàn)槌闃臃桨冈O(shè)計不當(dāng)而導(dǎo)致的樣本選擇是可以通過一定的途徑得到修正的。比如:在對人們購物習(xí)慣(網(wǎng)購)進(jìn)行調(diào)查時,如果對抽樣方案進(jìn)行設(shè)計時,確定通過網(wǎng)絡(luò)調(diào)查來獲得樣本數(shù)據(jù)。這樣就會導(dǎo)致樣本中的“網(wǎng)蟲”比例過高;再比如:研究消費(fèi)者的收入水平時,如果選擇在高檔的消費(fèi)場合進(jìn)行調(diào)查,就必然導(dǎo)致樣本中高收入群體的比重過高。86值得說明的是:因?yàn)闃颖具x擇而系統(tǒng)地缺失特定群體的信息,從而會導(dǎo)致數(shù)據(jù)的斷尾,但樣本選擇并不一定會導(dǎo)致數(shù)據(jù)斷尾。如果樣本選擇只與外生的解釋變量有關(guān),也就是說,選擇的偏差出現(xiàn)在外生的解釋變量一方時,標(biāo)準(zhǔn)的OLS估計仍然能夠得到一致的估計。如果樣本選擇與被解釋變量有關(guān),也就是說,在抽取樣本時,不管是有意考慮了被解釋變量的取值,還是無意之間受到了被解釋變量取值的影響,就會產(chǎn)生數(shù)據(jù)斷尾的情況,從而導(dǎo)致OLS估計得到有偏和不一致的估計結(jié)果。87三、運(yùn)用tobit模型進(jìn)行估計以耐用消費(fèi)品的消費(fèi)為例,說明tobit模型的估計問題。問題:當(dāng)y*>0時,是否可以進(jìn)行OLS估計?88∵對y*>0部分的數(shù)據(jù)進(jìn)行OLS估計的結(jié)果:89f(εi)

εi90

Y*

=-40+1.2X+u

Y=Y* ifY*>0

Y=0ifY*0

Y*>0 意味著:

u>40-1.2X

例如:91Y*XTobit模型的估計92YX全部實(shí)際觀察到的數(shù)據(jù)93

YXOLS:用全部實(shí)際觀察到的數(shù)據(jù)參數(shù)估計向下偏誤,但是截距出現(xiàn)了高估的情況94案例:上市商業(yè)銀行的經(jīng)營效率被解釋變量:上市商業(yè)銀行的經(jīng)營效率(Efficiency)解釋變量:商業(yè)銀行的不良貸款率(A,Asset)商業(yè)銀行人均營業(yè)費(fèi)用(M,Management)

商業(yè)銀行存貸比(L,Liquidity)

商業(yè)銀行上市年數(shù)(T,ListingTime)選擇11家上市商業(yè)銀行連續(xù)3年的數(shù)據(jù)進(jìn)行分析95Tobit回歸的結(jié)果如下:962.3面板數(shù)據(jù)模型2.3.1、面板數(shù)據(jù)類型時間維度+截面維度如我們在分析中國31省份的經(jīng)濟(jì)增長時,共有31個截面,每個截面都取1979-1998共20年的數(shù)據(jù),共有620個觀察值,這是一個典型的平行面板數(shù)據(jù)上市公司財務(wù)數(shù)據(jù),研究一段時期內(nèi)(1998-2008)上市公司股利的發(fā)放數(shù)額與股票賬面價值之間的關(guān)系,共有20×11=220個觀測值強(qiáng)調(diào)經(jīng)濟(jì)理論基礎(chǔ)、強(qiáng)調(diào)微觀行為基礎(chǔ)表11996-2002年中國東北、華北、華東15個省級地區(qū)的居民家庭人均消費(fèi)數(shù)據(jù)(不變價格)地區(qū)人均消費(fèi)1996199719981999200020012002CP-AH(安徽)3282.4663646.1503777.4103989.5814203.5554495.1744784.364CP-BJ(北京)5133.9786203.0486807.4517453.7578206.2718654.43310473.12CP-FJ(福建)4011.7754853.4415197.0415314.5215522.7626094.3366665.005CP-HB(河北)3197.3393868.3193896.7784104.2814361.5554457.4635120.485CP-HLJ(黑龍江)2904.6873077.9893289.9903596.8393890.5804159.0874493.535CP-JL(吉林)2833.3213286.4323477.5603736.4084077.9614281.5604998.874CP-JS(江蘇)3712.2604457.7884918.9445076.9105317.8625488.8296091.331CP-JX(江西)2714.1243136.8733234.4653531.7753612.7223914.0804544.775CP-LN(遼寧)3237.2753608.0603918.1674046.5824360.4204654.4205402.063CP-NMG(內(nèi)蒙古)2572.3422901.7223127.6333475.9423877.3454170.5964850.180CP-SD(山東)3440.6843930.5744168.9744546.8785011.9765159.5385635.770CP-SH(上海)6193.3336634.1836866.4108125.8038651.8939336.10010411.94CP-SX(山西)2813.3363131.6293314.0973507.0083793.9084131.2734787.561CP-TJ(天津)4293.2205047.6725498.5035916.6136145.6226904.3687220.843CP-ZJ(浙江)5342.2346002.0826236.6406600.7496950.7137968.3278792.210表2上市公司的投資與股票賬面價值:N=20,T=4面板數(shù)據(jù)模型和stata軟件應(yīng)用二、面板數(shù)據(jù)模型有以下幾個優(yōu)點(diǎn):第一,PanelData模型可以通過設(shè)置虛擬變量對個別差異(非觀測效應(yīng))進(jìn)行控制;第二,PanelData模型通過對不同橫截面單元不同時間觀察值的結(jié)合,增加了自由度,減少了解釋變量之間的共線性,從而改進(jìn)了估計結(jié)果的有效性;第三,PanelData模型是對同一截面單元集的重復(fù)觀察,能更好地研究經(jīng)濟(jì)行為變化的動態(tài)性舉例交通死亡率與酒后駕車人數(shù)(一段時間內(nèi)江蘇省各市)其他的非觀測(潛在)因素:南京與蘇州汽車本身狀況道路質(zhì)量當(dāng)?shù)氐娘嬀莆幕瘑挝坏缆返能囕v密度非觀測效應(yīng)導(dǎo)致估計結(jié)果不準(zhǔn)確,面板數(shù)據(jù)可以控制和估計非觀測效應(yīng)面板數(shù)據(jù)模型形式:其中,i=1,2,3...N,截面標(biāo)示;t=1,2,...T,時間標(biāo)示

;xit為k×1解釋變量,β為k×1系數(shù)列向量對于特定的個體i而言,αi表示那些不隨時間改變的影響因素,而這些因素在多數(shù)情況下都是無法直接觀測或難以量化的,如個人的消費(fèi)習(xí)慣、地區(qū)的經(jīng)濟(jì)結(jié)構(gòu),法律和產(chǎn)權(quán)制度等,一般稱其為“個體效應(yīng)”(individualeffects)面板數(shù)據(jù)模型的誤差項(xiàng)由兩部分組成:一部分是與個體觀察單位有關(guān)的,它概括了所有影響被解釋變量,但不隨時間變化的因素,因此,面板數(shù)據(jù)模型也常常被成為非觀測效應(yīng)模型;另外一部分概括了隨截面隨時間而變化的不可觀測因素,通常被成為特異性誤差或特異擾動項(xiàng)GDPX(Invest、edu)北京江蘇省山西省基礎(chǔ)設(shè)施更加完善,受教育程度較好、經(jīng)濟(jì)結(jié)構(gòu)以服務(wù)業(yè)為主、法制更健全面板模型選擇:固定效應(yīng)還是隨機(jī)效應(yīng)對“個體效應(yīng)”的處理主要有兩種方式:一種是視其為不隨時間改變的固定性因素,相應(yīng)的模型稱為“固定效應(yīng)”模型;另一種是視其為隨機(jī)因素,相應(yīng)的模型稱為“隨機(jī)效應(yīng)”模型固定效應(yīng)模型中的個體差異反映在每個個體都有一個特定的截距項(xiàng)上;隨機(jī)效應(yīng)模型則假設(shè)所有的個體具有相同的截距項(xiàng),個體的差異主要反應(yīng)在隨機(jī)干擾項(xiàng)的設(shè)定上FE(FixedEffects)ModelRE(RandomEffects)Model其中,是截距中的隨機(jī)變量部分,代表個體的隨機(jī)影響(Replacewithdummyvariables)固定效應(yīng)模型1、例如,在研究財政支出與經(jīng)濟(jì)增長的關(guān)系,運(yùn)用全國的時間序列數(shù)據(jù)來檢驗(yàn)財政支出與經(jīng)濟(jì)增長的關(guān)系可能存在設(shè)定誤差并且受統(tǒng)計資料的制約,僅用時間序列資料不能夠滿足大樣本的要求同時,由于我國不同地區(qū)的體制變革和財政政策的不斷調(diào)整,造成各個地區(qū)財政支出結(jié)構(gòu)隨時間而不斷變化面板數(shù)據(jù)(PanelData)從某種程度上克服了這一困難??紤]到中國各省份財政支出結(jié)構(gòu)與經(jīng)濟(jì)增長的關(guān)系存在明顯的地區(qū)差異,從時間序列的角度,考慮各省差異的動態(tài)性,是面板數(shù)據(jù)模型的優(yōu)勢例如,在研究中國地區(qū)經(jīng)濟(jì)增長的過程中,以全國某28個省區(qū)為研究對象,可以認(rèn)為這28個省區(qū)幾乎代表了整個總體同時假設(shè)在樣本區(qū)間內(nèi),各省區(qū)的經(jīng)濟(jì)結(jié)構(gòu)人口素質(zhì)等不可觀測的特質(zhì)性因素是固定不變的,因此采用固定效應(yīng)模型是比較合適的2、而當(dāng)我們研究某個縣市居民的消費(fèi)行為時,由于樣本數(shù)相對于江蘇省幾千萬人口是個很小的樣本,此時,可以認(rèn)為個體居民在個人能力、消費(fèi)習(xí)慣等方面的差異是隨機(jī)的,采用隨機(jī)效應(yīng)模型較為合適隨機(jī)效應(yīng)模型:RE認(rèn)為個體的差異是隨機(jī)的,其中非觀測的個體差異效應(yīng)與隨機(jī)擾動項(xiàng)一樣都是隨機(jī)變量隨機(jī)效應(yīng)模型總結(jié):如果把非觀測效應(yīng)看做是各個截面或個體特有的可估計參數(shù),并且不隨時間而變化,則模型為固定效應(yīng)模型;如果把非觀測效應(yīng)看作隨機(jī)變量,并且符合一個特定的分布,則模型為隨機(jī)效應(yīng)模型3、在實(shí)證分析中,一般通過hausman檢驗(yàn)判斷:由于隨機(jī)效應(yīng)模型把個體效應(yīng)設(shè)定為干擾項(xiàng)的一部分,所以就要求解釋變量與個體效應(yīng)不相關(guān),而固定效應(yīng)模型并不需要這個假設(shè)條件因此,我們可以通過檢驗(yàn)該假設(shè)條件是否滿足,如果滿足,那么就應(yīng)該采用隨機(jī)效應(yīng)模型,反之,就需要采用固定效應(yīng)模型Hausman檢驗(yàn)的基本思想是:在固定效應(yīng)u_i和其他解釋變數(shù)不相關(guān)的原假設(shè)下,用OLS估計的固定效應(yīng)模型和用GLS估計的隨機(jī)效應(yīng)模型的參數(shù)估計都是一致的。反之,OLS是一致的,但GLS則不是因此,在原假設(shè)下,二者的參數(shù)估計應(yīng)該不會有系統(tǒng)的差異,我們可以基于二者參數(shù)估計的差異構(gòu)造統(tǒng)計檢驗(yàn)量。如果拒絕了原假設(shè),我們就認(rèn)為選擇固定效應(yīng)模型是比較合適的。

2.3.2、stata軟件簡介STATA軟件估計與應(yīng)用:打開數(shù)據(jù)庫:use"E:\ProgramFiles\Stata10.0綠色軟件\Stata10\東部.dta“或者重新輸入數(shù)據(jù):edit相關(guān)系數(shù):corgdpinvesteduscihealth簡單回歸:regressgdpinvestculturesci無常數(shù):regressgdpinvestculturesci,noconstant估計結(jié)果回歸診斷:是否存在異方差:estathettest懷特檢驗(yàn):

estatimtest,white回歸信息檢驗(yàn):estatimtest是否遺漏重要解釋變量:estatovtest擬合圖:rvfplot單一變量的相關(guān)圖:cprplotinvest畫圖菜單與命令結(jié)合twoway(scattergdpinvest)twoway(scattergdpinvest||lfitgdpinvest)基本建設(shè)支出與GDP的相關(guān)關(guān)系圖各省教育支出的增長趨勢:1998-2006Durbin-Watson統(tǒng)計量:estatdwatson序列相關(guān)檢驗(yàn):estatdurbinalt滯后階數(shù)選擇:estatdurbinalt,lags(2)條件異方差檢驗(yàn):estatarchlm,lags(2)可選變量的異方差檢驗(yàn):estatszroetergdpinvestculturesci2.3.3、Stata對面板數(shù)據(jù)模型的估計隨機(jī)效應(yīng)模型Stata對面板數(shù)據(jù)模型的估計首先對面板數(shù)據(jù)進(jìn)行聲明:前面是截面單元,后面是時間標(biāo)識:tssetcompanyyeartssetindustryyear產(chǎn)生新的變量:gennewvar=human*lnrd產(chǎn)生滯后變量Genfiscal(2)=L2.fiscal產(chǎn)生差分變量Genfiscal(D)=D.fiscal

描述性統(tǒng)計:xtdes:對PanelData截面?zhèn)€數(shù)、時間跨度的整體描述Xtsum:分組內(nèi)、組間和樣本整體計算各個變量的基本統(tǒng)計量xttab采用列表的方式顯示某個變量的分布Stata中用于估計面板模型的主要命令:xtregxtregdepvar[varlist][ifexp],model_type[level(#)]Modeltype模型beBetween-effectsestimatorfeFixed-effectsestimatorreGLSRandom-effectsestimatorpaGEEpopulation-averagedestimatormleMaximum-likelihoodRandom-effectsestimator主要估計方法:xtreg:Fixed-,between-andrandom-effects,andpopulation-averagedlinearmodelsxtregar:Fixed-andrandom-effectslinearmodelswithanAR(1)disturbancextpcse:OLSorPrais-Winstenmodelswithpanel-correctedstandarderrorsxtrchh:Hildreth-Houckrandomcoefficientsmodelsxtivreg:Instrumentalvariablesandtwo-stageleastsquaresforpanel-datamodelsxtabon

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論