初級計量經濟學_第1頁
初級計量經濟學_第2頁
初級計量經濟學_第3頁
初級計量經濟學_第4頁
初級計量經濟學_第5頁
已閱讀5頁,還剩162頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、初級計量經濟學課件1第1頁,共167頁,2022年,5月20日,13點40分,星期一第一部分 緒論什么叫計量經濟學(Econometrics)?19世紀20年代挪威經濟學家R.Frish將它定義為“經濟理論”、“統(tǒng)計學”、“數(shù)學”三者的結合。(計算機科學)2第2頁,共167頁,2022年,5月20日,13點40分,星期一計量經濟學家的榮耀1969年首屆諾貝爾經濟學獎獲得者弗里斯(Frisch)1980年諾貝爾經濟學獎獲得者克萊因(Klein)計量經濟學鼻祖2000年諾貝爾經濟學獎獲得者:在微觀計量經濟學作出杰出貢獻的赫克曼(Heckman)和麥克法登(Mc Fadden)3第3頁,共167頁,

2、2022年,5月20日,13點40分,星期一計量經濟學家的榮耀最近一屆(2003)諾貝爾經濟學獎獲得者:計量經濟學家格蘭杰(Granger)和恩格爾(Engle)半數(shù)以上的諾貝爾經濟學獎授予了在計量模型上頗有建樹的經濟學家,諾貝爾經濟學獎引領經濟學發(fā)展潮流4第4頁,共167頁,2022年,5月20日,13點40分,星期一計量經濟學的內容體系廣義計量經濟學和狹義計量經濟學廣義是利用經濟理論、數(shù)學以及統(tǒng)計學定量研究經濟現(xiàn)象的方法統(tǒng)稱。(回歸分析、投入產出分析、時間序列分析等)狹義以揭示經濟變量間的關系為目的,主要應用回歸分析方法。單方程模型和聯(lián)立方程模型對股票市場的研究VS對金融市場的研究5第5頁

3、,共167頁,2022年,5月20日,13點40分,星期一計量經濟學的內容體系線性模型、內在線性模型與非線性模型(均從參數(shù)進入模型的角度來定義)參數(shù)模型、半參數(shù)模型和非參數(shù)模型(均從模型的函數(shù)形式是否確定來定義)6第6頁,共167頁,2022年,5月20日,13點40分,星期一計量經濟學的內容體系因數(shù)據類型差異而導致模型的差異:a. 橫截面數(shù)據集(cross-sectional data set):即給定時點對個人、家庭、企業(yè)、城市、國家或一系列其他單位采集的樣本所構成的數(shù)據集(應該忽略細小的時間差別)7第7頁,共167頁,2022年,5月20日,13點40分,星期一計量經濟學的內容體系b.時

4、間序列數(shù)據集(time series data set):是由一個或幾個變量在不同時間的觀測值所構成的。c.混合橫截面數(shù)據(pooled cross section):有些數(shù)據既有橫截面數(shù)據的特點又有時間序列的特點,但每一時點的樣本不同,通常是分析政府政策效果的有力數(shù)據8第8頁,共167頁,2022年,5月20日,13點40分,星期一計量經濟學的內容體系d.綜列數(shù)據(panel data):由橫截面數(shù)據集中每個數(shù)據的一個時間序列組成。(定點長期調查)其他專門數(shù)據類型: 1、離散數(shù)據(discrete data):通常在考察個人或家庭或企業(yè)的決策行為時,通過問卷調查獲得,由此發(fā)展出“離散選擇模型

5、”9第9頁,共167頁,2022年,5月20日,13點40分,星期一計量經濟學的內容體系 2、持續(xù)數(shù)據(survival data):用于考察變量從開始到結束或調查終止前所經過的時間長度,如失業(yè)持續(xù)時間、罷工持續(xù)時間、甚至懷孕間隔3、cohort(一代人) data - 為持續(xù)收集特定社會群體在一段時間內的變化的數(shù)據。如:調查七十年代出生的樣本在10年間的汽車持有率數(shù)據或就業(yè)率數(shù)據等。10第10頁,共167頁,2022年,5月20日,13點40分,星期一計量經濟學的內容體系理論計量經濟學和應用計量經濟學:方法的證明VS方法的應用11第11頁,共167頁,2022年,5月20日,13點40分,星

6、期一怎樣應用計量經濟學企業(yè)競爭力評估的一個例子一、理論模型的設計1。確定模型所包含的變量2。確定模型的數(shù)學形式或解決方法12第12頁,共167頁,2022年,5月20日,13點40分,星期一怎樣應用計量經濟學企業(yè)競爭力評估的一個例子二、樣本數(shù)據的收集1。幾類常用的樣本數(shù)據2。樣本數(shù)據的質量:(研究結果不能比數(shù)據的質量更好)三、模型參數(shù)的估計和檢驗13第13頁,共167頁,2022年,5月20日,13點40分,星期一計量經濟學模型成功的三要素理論方法數(shù)據14第14頁,共167頁,2022年,5月20日,13點40分,星期一計量經濟學模型的應用一、結構分析當一個變量或幾個變量發(fā)生變化時對其他變量或

7、經濟系統(tǒng)的影響(彈性和乘數(shù))二、經濟預測如通過回歸分析總收入和總消費之間的關系,從而在知道一變量數(shù)據的情況下可以預測另一變量的走勢。15第15頁,共167頁,2022年,5月20日,13點40分,星期一計量經濟學模型的應用三、政策評價建立模型對政策效果進行評估四、實證檢驗對經濟理論的檢驗;對某一行業(yè)如醫(yī)藥衛(wèi)生、農業(yè)新方法效果的檢驗。16第16頁,共167頁,2022年,5月20日,13點40分,星期一課堂小測試對“回歸”的認識你所應用過的計量經濟學內容17第17頁,共167頁,2022年,5月20日,13點40分,星期一回歸“回歸”一詞的歷史淵源加爾頓回歸到中等(或平均)回歸分析是關于研究一個

8、叫做應變量的變量對另一個或多個叫做自變量的變量的依賴關系,其用意在于通過后者的已知或給定值,去估計和預測前者的(總體)均值18第18頁,共167頁,2022年,5月20日,13點40分,星期一幾個例子XY父親身高與兒子平均身高年齡與平均身高個人可支配收入與平均消費支出壟斷商的定價與產品平均需求19第19頁,共167頁,2022年,5月20日,13點40分,星期一幾個關系統(tǒng)計關系和確定性(函數(shù))關系計量經濟學主要處理的是隨機(random或stochastic)的應變量,也就是有著概率分布的變量,這是一種統(tǒng)計關系。也可以從有無隨機干擾項的角度來區(qū)分。回歸與因果關系從邏輯上來說,回歸關系式本身并不

9、意味著任何因果關系,因果關系應該來自統(tǒng)計學之外?;貧w與相關關系變量是否是確定的;變量之間是否對稱;相關系數(shù)度量VS估計或預測應變量的平均值20第20頁,共167頁,2022年,5月20日,13點40分,星期一術語應變量(Dependent)與自變量(Independent)被解釋變量(Explained)與解釋變量(Explanatory)預測子(Predictand)與預測元(Predictor)回歸子(Regressand)與回歸元(Regressor)響應(Response)與刺激或控制變量(Stimulus or control variable)內生(Endogenous )與外生(

10、Exogenous )21第21頁,共167頁,2022年,5月20日,13點40分,星期一線性回歸模型消費函數(shù)的一個例子隨機干擾項的意義:1。理論的含糊性(其他因素)2。數(shù)據的欠缺(如財富)3。核心變量與周邊變量(或上或下的隨機影響)4。人類行為的內在隨機性5。糟糕的替代變量(永久消費和永久收入)6。節(jié)省原則(多重共線性的影響)7。錯誤的函數(shù)形式22第22頁,共167頁,2022年,5月20日,13點40分,星期一線性回歸模型的假定1。函數(shù)形式:2。干擾項的零均值:3。同方差性:4。無自相關:5。回歸量與干擾項的非相關:6。正態(tài)性:23第23頁,共167頁,2022年,5月20日,13點40

11、分,星期一各種假定的含義干擾項的零均值的意思是凡是模型不顯著含有的并因而歸屬u的因素,對y的均值都沒有系統(tǒng)的影響;正的u值抵銷了負的u值,以至于他們對y的平均值的影響為零。24第24頁,共167頁,2022年,5月20日,13點40分,星期一各種假定的含義u的同方差性同時也意味著y的同方差性,即隨著x的變動,y的取值的分布是一定的,是分布不變的。25第25頁,共167頁,2022年,5月20日,13點40分,星期一各種假定的含義干擾項之間的無自相關意味著y的決定與其他期的u值無關,即不存在u(t-1)決定u(t)從而決定y的情況干擾項與自變量之間的非相關,干擾項本身是獨立于自變量之外的,且如果

12、干擾項與自變量存在相關,則不能獨自說明其作用26第26頁,共167頁,2022年,5月20日,13點40分,星期一普通最小二乘法總體回歸函數(shù)(PRF)與樣本回歸函數(shù)(SRF)之差的平方和最小為最小二乘法的準則。27第27頁,共167頁,2022年,5月20日,13點40分,星期一估計參數(shù)的特性最小二乘估計量的線性和無偏性質所謂線性即估計量是y的一個線性函數(shù)所謂無偏即系數(shù)估計量的期望等于系數(shù)原值估計參數(shù)的方差、標準差,協(xié)方差(注意到x的變差越大,則估計參數(shù)的方差越?。ㄈ绻麉f(xié)方差為負,那么的過高估計意味著的過低估計。28第28頁,共167頁,2022年,5月20日,13點40分,星期一高斯馬爾科

13、夫定理在給定經典線性回歸模型的假定下,最小二乘估計量,在無偏線性估計量一類中,有最小方差,也即BLUE (best linear unbias estimator)最小方差的證明29第29頁,共167頁,2022年,5月20日,13點40分,星期一估計參數(shù)的特性干擾項方差的一個無偏估計量30第30頁,共167頁,2022年,5月20日,13點40分,星期一回歸擬合的評價Y的總變差是離差的平方和:方差分解:總平方和回歸平方和誤差平方和SST=SSR+SSE決定系數(shù)SSR/SST對單個估計系數(shù)的t檢驗31第31頁,共167頁,2022年,5月20日,13點40分,星期一相關系數(shù)r相關系數(shù)相關系數(shù)是

14、兩個變量間的線性關聯(lián)的一個度量相關系數(shù)落在-1,1間,如果兩變量獨立,則它們之間的相關系數(shù)為零,反之不成立32第32頁,共167頁,2022年,5月20日,13點40分,星期一蒙特卡羅實驗1。給定25個X值,給定 , 的真值,給定零均值的正態(tài)分布隨機數(shù)25個,計算y的25個值2。利用上述X值和y值做回歸,得出 , 的估計值3。給定同一分布的不同隨機數(shù)取值,重復上述實驗100次,求得100個估計值4。比較100個估計值的均值,看是否與 , 的真值接近,以此來求證估計值的無偏性33第33頁,共167頁,2022年,5月20日,13點40分,星期一正態(tài)性假定我們不僅要用ols法做點估計,我們還要進行

15、假設檢驗(hypothesis testing),即對系數(shù)的真值做出推斷,而這需要干擾項的概率分布。從干擾項的概率分布-估計量的概率分布-系數(shù)真值的統(tǒng)計推斷34第34頁,共167頁,2022年,5月20日,13點40分,星期一為何是正態(tài)分布而不是其他?原因1:中心極限定理證明,如果存在大量獨立且相同分布的隨機變量,那么,除了少數(shù)例外情形,隨著這些變量的個數(shù)無限的增大,它們的總和將趨向于正態(tài)分布原因2:中心極限定理的另一解說是,即使變量個數(shù)并不是很大或這些變量還不是嚴格獨立的,它們的總和仍可視為正態(tài)分布檢驗數(shù)據是否為正態(tài)分布:Kolmogorov D檢驗,零假設為數(shù)據是均值和方差未知的正態(tài)分布3

16、5第35頁,共167頁,2022年,5月20日,13點40分,星期一由于正態(tài)性假定而新增的性質1。系數(shù)估計量也是服從正態(tài)分布的(根據系數(shù)估計量是y的線性函數(shù),而y又是干擾項的線性函數(shù))2。Ols的系數(shù)估計量在整個無偏估計量中,無論是線性的還是非線性的估計,都有最小方差(參見Rao的證明),所以我們說最小二乘估計量是最優(yōu)無偏估計量(BUE)36第36頁,共167頁,2022年,5月20日,13點40分,星期一由于正態(tài)性假定而新增的性質3。 遵循n-2個自由度的卡方分布4。隨著樣本容量無限地增大,系數(shù)估計量將收斂于它們的真值(一致性)37第37頁,共167頁,2022年,5月20日,13點40分,

17、星期一其他分布卡方分布F分布t分布38第38頁,共167頁,2022年,5月20日,13點40分,星期一最大似然法(ML)原則:當從總體隨機抽取n組樣本觀測值后,參數(shù)估計量應當使得從模型中抽取該n組樣本觀測值(y)的概率最大將樣本觀測值聯(lián)合概率密度函數(shù)稱為變量的或然函數(shù)(LF)。在已經取得樣本觀測值的情況下,使或然函數(shù)取極大值的總體分布參數(shù)所代表的總體具有最大的概率取得這些樣本觀測值(y),該總體參數(shù)即是所要求的參數(shù),即ML估計量。39第39頁,共167頁,2022年,5月20日,13點40分,星期一一個回歸實例用SPSS作體重與肺活量的回歸(corr.sav注意預測值與殘差)40第40頁,共

18、167頁,2022年,5月20日,13點40分,星期一課堂作業(yè)推導一般線性回歸方程的系數(shù)的方差及協(xié)方差證明高斯馬爾科夫定理推導干擾項的方差的一個無偏估計量41第41頁,共167頁,2022年,5月20日,13點40分,星期一區(qū)間估計與假設檢驗估計與假設檢驗構成統(tǒng)計學的兩個主要分支,估計理論又主要由點估計與區(qū)間估計組成?;仡櫼恍└拍睿褐眯艆^(qū)間、置信系數(shù)、顯著性水平、置信限、置信下限、置信上限42第42頁,共167頁,2022年,5月20日,13點40分,星期一回歸系數(shù)的置信區(qū)間回歸估計量的置信區(qū)間置信區(qū)間的寬度與估計量的標準誤成正比,即標準誤越大,對未知參數(shù)的真值進行估計的不確定性愈大。43第4

19、3頁,共167頁,2022年,5月20日,13點40分,星期一假設檢驗什么是假設檢驗:問某一給定的觀測是否與某聲稱的假設相符,這個聲稱的假設叫做虛擬假設(null hypothesis),即 ,與之相對的為對立假設(maintained hypothesis),即 假設檢驗就是要設計一個程序用來決定拒絕或不拒絕虛擬假設,通常采用兩種互為補充的方法:置信區(qū)間和顯著性檢驗44第44頁,共167頁,2022年,5月20日,13點40分,星期一置信區(qū)間的方法檢驗方法:構造一個參數(shù)的 的置信區(qū)間。如果參數(shù)在假設 下落入此區(qū)間,就不拒絕零假設。但如果它落在此區(qū)間之外,則拒絕零假設。第一類錯誤(拒真):原假

20、設正確,卻拒絕了第二類錯誤(納假):原假設不正確,卻接受“統(tǒng)計上高度顯著”指:當拒絕原假設時,犯第一類錯誤的概率是一個很小的數(shù),通常小于1%45第45頁,共167頁,2022年,5月20日,13點40分,星期一顯著性檢驗方法構造一個檢驗統(tǒng)計量,利用該統(tǒng)計量的分布特征,來決定是否接受零假設。通常一個大的t絕對值,便是與虛擬假設相抵觸的跡象單尾檢驗46第46頁,共167頁,2022年,5月20日,13點40分,星期一一些實際操作問題“接受”和“拒絕”假設的含義:正如一個法庭宣告某一判決為“無罪” (not guilty)而不為“清白”(innocent)統(tǒng)計檢驗的結論也應為“不拒絕”而不為接受。2

21、-t屈指一算法則:如果自由度=20且顯著水平定為0.05,則只要t統(tǒng)計量大于2,就可拒絕“零”假設(單尾)47第47頁,共167頁,2022年,5月20日,13點40分,星期一一些實際操作問題在進行調查研究之前建立假設而不是相反,以免犯循環(huán)推理(circular reasoning)的錯誤P值被定義為一個虛擬假設可被拒絕的最低顯著水平,或犯第一類錯誤的精確概率。由于選擇顯著性水平的武斷性,直接選取p值并決定是否在給定的p值水平上拒絕虛擬假設會較好48第48頁,共167頁,2022年,5月20日,13點40分,星期一一些實際操作問題區(qū)分統(tǒng)計上的顯著性和經濟上的顯著性。當樣本非常大時,幾乎任何虛擬

22、假設都一定會被拒絕,點估計的大小成為唯一可研究的問題兩種檢驗方法的選擇,置信區(qū)間法優(yōu)于顯著性檢驗法(點與面之分)49第49頁,共167頁,2022年,5月20日,13點40分,星期一一些實際操作問題一點建議:集中討論系數(shù)的大小并報告其置信水平,而不去提顯著性檢驗。如果全部或幾乎全部虛擬假設都是錯誤的,討論一個估計值是否無異于它在虛擬假設下的預測值,都是無意義的。我們更想探明的是什么模型可充當良好的逼近式,這就需要知道被經驗估計所排斥的參數(shù)值域。50第50頁,共167頁,2022年,5月20日,13點40分,星期一回歸分析與方差分析對SST=SSR+SSE進行研究就叫做從回歸的觀點做方差分析(a

23、nalysis of variance ANOVA)F檢驗:F檢驗主要用在多元回歸問題中,對全部系數(shù)為0做檢驗,其對立假設為非全部系數(shù)同時為051第51頁,共167頁,2022年,5月20日,13點40分,星期一預測問題均值預測與個值預測置信帶報告回歸分析的結果52第52頁,共167頁,2022年,5月20日,13點40分,星期一過原點回歸考慮資產組合理論中的特征線方程: 其中 為特定資產組合的收益率 為無風險收益率 為市場組合收益率 為特定資產組合的系統(tǒng)風險53第53頁,共167頁,2022年,5月20日,13點40分,星期一課上作業(yè)練習題:資產組合理論的資本市場線(CML)在期望收益率與總

24、風險(由標準差來衡量)之間所設的一個線性關系如下:其中 為資產組合的期望收益率 為資產組合的標準差。下表給出1954-1963年間美國34個共同基金的期望收益率與標準差數(shù)據,請檢驗這些數(shù)據是否支持該理論(5%的顯著性水平)54第54頁,共167頁,2022年,5月20日,13點40分,星期一回歸模型的函數(shù)形式1。對數(shù)線性模型(斜率系數(shù)測度了Y對X的彈性)2。線性到對數(shù)模型(斜率系數(shù)測度了X的絕對改變量對應的Y的相對改變量,即增長模型)3。對數(shù)到線性模型(斜率系數(shù)測度了X的相對改變量對應的Y的絕對改變量)55第55頁,共167頁,2022年,5月20日,13點40分,星期一回歸模型的函數(shù)形式4.

25、倒數(shù)模型(隨著X無限地增大, (1/X)項趨于零,而Y趨于極限或漸近值 )在菲利普斯曲線中,工資變化對失業(yè)水平的反應中,存在有不對稱性:當失業(yè)率低于經濟學家所稱的自然失業(yè)率時,由失業(yè)的單位變化引起的工資上升,要快于當失業(yè)率高于自然水平時,由失業(yè)的同樣變化引起的工資下降。而常數(shù)項系數(shù)表示工資變化的漸近底限。56第56頁,共167頁,2022年,5月20日,13點40分,星期一課上作業(yè)恩格爾支出曲線把一個消費者在某一商品上的支出同他的總收入聯(lián)系起來。令Y=對某一商品的消費支出,X=消費者收入,考慮上述5類所學模型,你會選擇哪個(些)模型做恩格爾支出曲線,描繪其曲線圖形,并作解釋?(提示:解釋各種斜

26、率系數(shù),常數(shù)項系數(shù))57第57頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸模型三變量模型的符號與假定:干擾項零均值無序列相關同方差性干擾項與每一X變量之間都有零協(xié)方差無設定偏誤無多重共線性58第58頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸模型多重共線性初探1、維恩Venn圖2、不存在一組不全為零的數(shù) 和 ,使得59第59頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸模型OLS估計量和估計量的方差、標準誤最小二乘擬合的一些性質:殘差和為零,殘差與解釋變量X2和X3均不相關60第60頁,共167頁,2022年,5月20

27、日,13點40分,星期一多變量回歸模型OLS估計量的性質:1。三變量回歸線通過Y、X2、X3的均值2。估計的Y的均值等于真實Y的均值3。殘差和等于殘差的均值4。殘差與X2、X3,Y的估計值均不相關5。自變量X2和X3的相關系數(shù)朝著1增大,估計系數(shù)的方差越大(同樣也隨 的增大而增大)6。在經典線性模型的假定下,可以證明偏回歸系數(shù)的OLS估計量是BLUE61第61頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸模型ML估計量:在總體干擾 遵循零均值和常數(shù)方差 的正態(tài)分布的假定下,ML估計量和OLS估計量是相等的,但 的ML估計量始終都是 而 的OLS估計量為62第62頁,共1

28、67頁,2022年,5月20日,13點40分,星期一多變量回歸模型復判定系數(shù)R-square: Y的變異由變量X2和X3聯(lián)合解釋的比例63第63頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸模型設定偏誤初探:所用的回歸模型是否是正確設定的?一個三變量回歸的例子-期望擴充的菲利普斯曲線a.假定三變量回歸模型正確,檢驗錯誤設定的模型(原始菲利普斯曲線)b.錯誤模型的估計系數(shù)(X2對Y的總影響=X2對Y的直接影響+X2對Y的間接影響64第64頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸模型校正的 值原因: 值隨著X變量個數(shù)的增加而增加事實上,關于 的

29、最重要的事情是,它在經典回歸(CR)模型中是不重要的。CR模型是用來研究一個總體中的參數(shù)的,它不問在一個樣本中擬合的好壞,如果人們堅持要有對預測成功有一個度量,那么有了標準誤也許足夠了,因為它對于適當取定的X值來說,對于參數(shù)估計來說,是富有信息的。 65第65頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸模型簡單相關系數(shù):r12(Y與X2之間的相關),r13(Y與X3之間的相關),r23(X2與X3之間的相關)偏相關系數(shù):r12.3(X3保持不變下的Y和X2的偏相關系數(shù)),r13.2(X2保持不變下的Y和X3的偏相關系數(shù)),r23.1(Y保持不變下的X2和X3的偏相關系

30、數(shù))X3保持不變下的Y和X2的偏相關,就是從Y對X3回歸和從X2對X3回歸分別得到的殘差之間的簡單相關系數(shù)。66第66頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸模型偏相關系數(shù)的一個例子:令Y=農作物收成;X2=雨量;X3=氣溫假定r12=0,即農作物收成和雨量沒有關聯(lián)再假定r13是正的,r23是負的,這時r12.3將是正的;就是說,在氣溫保持不變的情況下,收成和雨量有正的關聯(lián)。67第67頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸模型關于多項式回歸模型:并不違反無多重共線性假定無需提出新的估計問題68第68頁,共167頁,2022年,5月2

31、0日,13點40分,星期一多變量模型之時間變量需要考慮有關時間變量的3種情況:1。發(fā)現(xiàn)應變量怎樣在時間上變動.2。常常用來代替一個影響著因變量的基本變量。(如生產函數(shù)中的技術常用時間來代替)3。引進時間變量以避免謬誤相關69第69頁,共167頁,2022年,5月20日,13點40分,星期一課堂練習用回歸模型研究過去幾年的個人消費支出的行為,數(shù)據見EXCEL表格,要求去除時間因素對個人消費支出和個人可支配收入的影響70第70頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸的假設檢驗如果我們僅是對回歸模型的參數(shù)作點估計,那么并不需要有關干擾項概率分布的任何假定,而如果涉及到假

32、設檢驗,則要假定干擾項服從某個概率分布。71第71頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸的假設檢驗總論1。檢驗關于個別偏回歸系數(shù)的假設(t檢驗)2。檢驗所估計的多變量回歸模型的總顯著性(F檢驗)3。檢驗兩個或多個系數(shù)是否相等(t檢驗)4。檢驗諸回歸系數(shù)是否滿足某種線性約束條件(t檢驗)5。檢驗所估計的回歸模型在時間上或在不同橫截面單元上的穩(wěn)定性(鄒檢驗)6。檢驗回歸模型的函數(shù)形式72第72頁,共167頁,2022年,5月20日,13點40分,星期一鄒至莊檢驗的過程鄒檢驗基本假定:第1、2個方程的干擾項獨立同正態(tài)分布,即均值都為0,方差都為1。合并全部n1和n2次

33、觀測值,用以估計第3個方程并獲得它的SSE,記作s1,其自由度為(n1+n2-k),其中k為所估參數(shù)的個數(shù)(包括截距項)2。分別估計第1、2個方程并獲得它們的SSE,分別記作s2和s3,其自由度分別為(n1-k)和(n2-k)。記s4=s2+s3,其自由度為(n1+n2-2k)73第73頁,共167頁,2022年,5月20日,13點40分,星期一鄒至莊檢驗的過程3。求出s5=s1-s44。在鄒檢驗的基本假定下,可證明F值遵循自由度為(k,n1+n2-2k)的F分布5。如果F值大于選定顯著性水平的臨界F值,則拒絕結構穩(wěn)定性假設。74第74頁,共167頁,2022年,5月20日,13點40分,星期

34、一鄒至莊檢驗的直觀理解直觀上,如果兩個時期的回歸方程并無結構上的區(qū)別,則兩個時期的回歸方程的殘差平方和之和應該和整個時期的回歸方程的殘差平方和相等,而如果兩者相差很大,則我們可以構造F檢驗來檢驗結構的差異75第75頁,共167頁,2022年,5月20日,13點40分,星期一檢驗回歸的函數(shù)形式MWD檢驗(麥金農,懷特,戴維森):在線性與對數(shù)線性回歸模型之間進行選擇步驟1:估計線性模型并獲得Y的估計值,記為Yf步驟2:估計對數(shù)線性模型并獲得lnY的估計值,記為lnf步驟3:算出Z1=(lnYf-lnf)步驟4:做Y對諸X和得自步驟3的Z1的回歸。如果按通常的t檢驗Z1的系數(shù)是統(tǒng)計上顯著的,就拒絕H

35、0(H0:線性模型是合適的)76第76頁,共167頁,2022年,5月20日,13點40分,星期一多變量回歸的其他問題用多變量回歸做預測假設檢驗三聯(lián)體:似然比(LR),瓦爾德(Wald,簡記W)與拉格朗日(Lagrange)乘數(shù)(LM)檢驗只在非線性回歸模型或大樣本環(huán)境下有更高的效率麥金農,戴維森語:對于線性回歸模型,不管它的誤差是或不是正態(tài)分布的,當然都不需要過問LM,W和LR,因為我們不能從這些統(tǒng)計量得到任何不為F所含的信息77第77頁,共167頁,2022年,5月20日,13點40分,星期一線性模型的矩陣表示78第78頁,共167頁,2022年,5月20日,13點40分,星期一線性模型的

36、矩陣表示79第79頁,共167頁,2022年,5月20日,13點40分,星期一回歸模型假定的矩陣表示80第80頁,共167頁,2022年,5月20日,13點40分,星期一干擾項的方差協(xié)方差矩陣81第81頁,共167頁,2022年,5月20日,13點40分,星期一最小二乘法的矩陣表示82第82頁,共167頁,2022年,5月20日,13點40分,星期一放寬經典模型的假定全部11個假定:假定1:回歸模型對參數(shù)而言是線性的假定2:諸回歸元X的值在重復抽樣中是固定的假定3:對給定的X,干擾項的均值為零假定4:對給定的X,干擾項的方差不變或有同方差性假定5:對給定的X,干擾項無自相關83第83頁,共16

37、7頁,2022年,5月20日,13點40分,星期一放寬經典模型的假定假定6:如果X是隨機的,則干擾項與諸X是獨立的或至少是不相關的。假定7:觀測次數(shù)必定大于回歸元的個數(shù)假定8:回歸元的取值必須有足夠的變異性假定9:回歸模型是正確設定的假定10:回歸元之間無準確的線性關系假定11:隨機(干擾)項是正態(tài)分布的84第84頁,共167頁,2022年,5月20日,13點40分,星期一應用經典線性模型的主要問題第1類:關于對模型設定和對干擾項的假定問題(1、2、3、4、5、9和11)第2類:對數(shù)據的假定問題(6、7、8和10),此外,異常值(outliers)問題和測量誤差等也可歸屬此類。85第85頁,共

38、167頁,2022年,5月20日,13點40分,星期一不去深究的某些假定的原因假定1:對參數(shù)為線性的回歸模型原因1:對參數(shù)為線性的模型,應用于許多經驗現(xiàn)象中是相當成功的;原因2:有時這種模型是更為復雜的非線性回歸模型的初次近似86第86頁,共167頁,2022年,5月20日,13點40分,星期一不去深究的某些假定的原因假定2和6:固定的回歸元和隨機的回歸元原因1:經濟學不同其他實驗科學,經濟學更多依賴于第二手材料(如政府或私人機構收集的數(shù)據),因此,即使變量本身實質上也許是隨機的,我們也假定變量值是固定的;原因2:因為干擾項是隨機的,而如果X也是隨機的,則我們必須明確X的分布和干擾項的分布是獨

39、立的,才不致改變OLS的優(yōu)良性質與估計的可行性87第87頁,共167頁,2022年,5月20日,13點40分,星期一不去深究的某些假定的原因假定3:干擾項的零均值原因:干擾項的其他均值會導致截距項估計的有偏性假定11:干擾項的正態(tài)性做假設檢驗時在大樣本和正態(tài)性之間的取舍,也就是說,如果正態(tài)性得不到滿足,那么則要求有大的樣本支持。原因:中心極限定理(如果干擾項是獨立同分布的,并有零均值和不變方差,而X是非隨機的,則OLS系數(shù)估計量是漸近正態(tài)分布的,且無偏,也就是說t和F檢驗仍漸近有效)88第88頁,共167頁,2022年,5月20日,13點40分,星期一多重共線性與微數(shù)缺測性(micronume

40、rosity)嚴格地說,多重共線性即指存在有1個以上的準確線性關系;而共線性是指存在1個線性關系;但在實踐中很少區(qū)分。完全共線性:其中為常數(shù),但不同時為0欠完全共線性:其中為常數(shù),但不同時為0 為隨機誤差項89第89頁,共167頁,2022年,5月20日,13點40分,星期一多重共線性與微數(shù)缺測性如果多重共線性是完全的,那么諸X變量的回歸系數(shù)是不確定的,并且它們的標準誤為無窮大;如果多重共線性是欠完全的,那么,雖然回歸系數(shù)可以確定,卻有較大的標準誤(相對于系數(shù)本身來說),意思是系數(shù)不能以很高的精確或準確度來估計微數(shù)缺測性問題即指假定7觀測次數(shù)必須大于回歸元個數(shù)的問題,和假定8回歸元的取值必須有

41、足夠的變異都是對多重共線性假定的補充。90第90頁,共167頁,2022年,5月20日,13點40分,星期一多重共線性的來源1。數(shù)據采集所用的方法。例如,抽樣限于總體中諸回歸元所取值的一個有限制的范圍內。2。模型或從中取樣的總體受到約束。3。模型設定。例如當X變量的變化范圍較小時在回歸中添加多項式項, 。4。一個過度決定的模型。這種情況出現(xiàn)在模型的回歸元個數(shù)大于觀測次數(shù)時。91第91頁,共167頁,2022年,5月20日,13點40分,星期一存在多重共線性問題時的估計多變量回歸模型的偏回歸系數(shù)要求其它變量保持不變,而完全共線性注定了變量之間的共變性,因此帶來破壞性的后果92第92頁,共167頁

42、,2022年,5月20日,13點40分,星期一(近似)多重共線性的后果1。雖然OLS估計量BLUE,但有大的方差和協(xié)方差,故難以作出精確的估計2。由于后果1,置信區(qū)間將要寬得多,以致的不拒絕“零虛擬假設”更為容易3。仍由于后果1,1個或多個系統(tǒng)的t比率傾向于統(tǒng)計上不顯著4。雖然1或多個系數(shù)在統(tǒng)計意義上不顯著,總的擬合優(yōu)度仍非常高5。OLS估計量及其標準誤對數(shù)據的小小變化也會是敏感的。93第93頁,共167頁,2022年,5月20日,13點40分,星期一多重共線性的偵察克曼塔(Kmenta)的忠告:1。多重共線性是一個程度問題而不是有無的問題2。由于多重共線性是對被假定為非隨機的解釋變量的情況而

43、言的,所以這是一種樣本而非總體特征。94第94頁,共167頁,2022年,5月20日,13點40分,星期一多重共線性的偵察出現(xiàn)多重共線性的一些規(guī)則可供參考:1。R平方值高而顯著的t比率少2。回歸元之間有高度的兩兩相關,但在多變量模型中,簡單相關系數(shù)只是多重共線性存在的充分而非必要條件3。檢查偏相關(一種輔助手段)95第95頁,共167頁,2022年,5月20日,13點40分,星期一多重共線性的偵察4。特征值(eigenvalues,自變量的交叉乘積矩陣XX)和病態(tài)指數(shù)(condition index)如果CI在10與30之間,就算有中強度的多重共線性,而如果CI在30之上,就算有嚴重多重共線性

44、5。方差膨脹因子VIF,當VIF超過10時,我們說該變量是高度共線的96第96頁,共167頁,2022年,5月20日,13點40分,星期一多重共線性的補救措施1。先驗信息,即用先驗信息去替換有共線性的變量;先驗信息來自先前遇到的同樣共線問題的經驗研究工作,或者來自該研究領域的有關基礎理論2。剔除變量但要注意設定偏誤問題,有時醫(yī)治也許比疾病糟糕3。變量代換(一次差分形式)97第97頁,共167頁,2022年,5月20日,13點40分,星期一多重共線性的補救措施4。補充新數(shù)據換一個樣本或是增加新數(shù)據一般能減輕多重共線性的癥狀5。其他方法,如因子分析法、脊回歸法98第98頁,共167頁,2022年,

45、5月20日,13點40分,星期一思考題考慮以下模型:其中Y消費,X收入,t=時間。上述模型假定了時間t的消費支出不僅是時間t的收入,而且是以前多期的收入的函數(shù)。這類模型叫做分布滯后模型(distributed lag models)1。你預期在這類模型中有多重共線性嗎?為什么?.2。如果預期有多重共線性,你會怎樣解決這個問題?99第99頁,共167頁,2022年,5月20日,13點40分,星期一異方差性異方差性的性質:假定4指明給定自變量的干擾項的方差是一個常數(shù),即同方差性(homoscedasticity),意謂等同的(homo)分散程度(scedasticity),但如果方差不等,即為異方

46、差性問題。(見收入、儲蓄例)100第100頁,共167頁,2022年,5月20日,13點40分,星期一異方差性的來源1。按照邊錯邊改學習模型(error learning models),人們在學習的過程中,其行為誤差隨時間而減少)2。隨著收入的增長,人們有更多的備用收入(discretionary income),從而如何支配他們的收入有更大的選擇范圍。類比利潤較豐厚的公司在分紅政策方面比利潤微薄的公司有更大的變化。101第101頁,共167頁,2022年,5月20日,13點40分,星期一異方差性的來源3。數(shù)據采集技術的改進4。異方差性還可能因為異常值的出現(xiàn)而產生5。異方差的另一來源是回歸模

47、型設定的不正確性(如在商品的需求函數(shù)中,沒有把有關互補或互替的商品價格包括進來)102第102頁,共167頁,2022年,5月20日,13點40分,星期一出現(xiàn)異方差時的估計當異方差出現(xiàn)時,系數(shù)仍是線性和無偏的,但不再是最優(yōu)的廣義最小二乘法(GLS):先將原始變量轉換成滿足經典模型假設的轉換變量,然后對它們使用OLS程序,這樣求得的估計量是BLUE的加權最小二乘法(WLS)是GLS的一個特例103第103頁,共167頁,2022年,5月20日,13點40分,星期一異方差的危害如果我們忽視異方差性而一味使用慣常的檢驗程序,則無論我們得出什么結論或作出什么推斷,都可能產生嚴重的誤導104第104頁,

48、共167頁,2022年,5月20日,13點40分,星期一異方差的偵察和多重共線性類似,并不存在有偵察異方差性的嚴明的法則,只有少數(shù)經驗法則可供參考。在大多數(shù)計量經濟調查研究中,異方差性不過是一種直覺,先前經驗或純粹的猜想。(因為我們通常只能得到Y的樣本數(shù)據)105第105頁,共167頁,2022年,5月20日,13點40分,星期一異方差的偵察非正式方法:1。問題的性質:在涉及不均勻(heterogeneous)單元的橫截面數(shù)據中,異方差性可能是一種常規(guī)而非例外(如研究一些財務指標時,樣本包括大、中、小廠家)2。圖解法:在無異方差性的假定下做回歸分析,然后對殘差平方做圖,看這些殘差平方是否呈現(xiàn)任

49、何系統(tǒng)性的樣式。(如橫軸是Y的估計值,縱軸是殘差平方,即殘差圖)106第106頁,共167頁,2022年,5月20日,13點40分,星期一異方差的偵察正式方法:1。帕克檢驗:提出是解釋變量X的某個函數(shù)從而把圖解法公式化。2。格萊澤(Glejser)檢驗:原理上類似帕克檢驗。3。斯皮爾曼(Spearman)的等級相關檢驗:從排序的角度來定義殘差與X之間的相關性。107第107頁,共167頁,2022年,5月20日,13點40分,星期一異方差的偵察4。戈德菲爾德匡特檢驗(適用于和回歸模型中解釋變量之一有正向關系的情形)步驟1:從最小X值開始,按X值的大小順序將觀測值排列步驟2:略去居中的C個觀測值

50、,其中C是預定的,并將其余(n-c)個觀測值分成兩組,每組(n-c)/2個步驟3:分別對前后兩段回歸,得RSS1和RSS2步驟4:計算比率:F(RSS2/df)/(RSS1/df)如果F值大于選定顯著性水平的臨界F值,則拒絕同方差性假設。108第108頁,共167頁,2022年,5月20日,13點40分,星期一異方差的偵察戈德菲爾德匡特檢驗說明:1。略去居中的C個觀測值是為了突出或激化小方差組和大方差組之間的差異.2。當樣本大小為60時,C約為163。求得的F值服從分子和分母自由度各為(n-c-2k)/2的F分布,其中k是包含截距項在內的待估參數(shù)的個數(shù)。4。要求按照被認定為引起異方差性的X變量

51、把觀測值重新排序。109第109頁,共167頁,2022年,5月20日,13點40分,星期一異方差的偵察懷特(White)的一般異方差檢驗步驟1:對給定的數(shù)據,估計并獲得殘差步驟2:做如下輔助回歸:步驟3:在無異方差性的虛擬假設下,可以證明,步驟4:如果算得的值超過選定顯著性水平的臨界值,結論就是有異方差性110第110頁,共167頁,2022年,5月20日,13點40分,星期一異方差的偵察懷特檢驗的原理在于檢驗輔助方程中的殘差項與諸X及其交叉乘積項之間是否有顯著的線性關系,或相關關系。111第111頁,共167頁,2022年,5月20日,13點40分,星期一異方差的補救措施1。當已知時,用加

52、權最小二乘法2。當未知時,列出懷特程序(White option)估計量,更專門化的名詞是異方差性相一致協(xié)方差矩陣估計量(heteroscedasticity-consistent covariance matrix estimators或簡記為HCCME)但要注意這僅限于大樣本的前提下112第112頁,共167頁,2022年,5月20日,13點40分,星期一異方差的補救措施3。異方差性假定下的變量變換假定1:誤差方差正比于假定2:誤差方差正比于假定3:誤差方差正比于Y均值的平方4。對數(shù)變換113第113頁,共167頁,2022年,5月20日,13點40分,星期一自相關自相關可定義為按時間(時

53、間序列數(shù)據如季度產出)或空間(橫截面數(shù)據如家庭消費支出)排序的觀測值序列的成員之間的相關。即違反干擾項之間無自相關的假設。(從回歸模型的因變量角度)自相關(autocorrelation)與序列相關(serial correlation)的區(qū)別:變量本身與不同變量的區(qū)別114第114頁,共167頁,2022年,5月20日,13點40分,星期一自相關的來源1。慣性,特別是一些宏觀經濟指標,如GNP、價格指數(shù)等2。設定偏誤:應含而未含變量的情形,如替代商品價格;不正確的函數(shù)形式,如產出成本方程中未包括產出二次項3。蛛網模型(農產品供給)4。滯后效應(消費習慣)5?!熬幵臁钡臄?shù)據,如季度數(shù)據由月度數(shù)

54、據求平均而成,這樣使數(shù)據更平滑而顯自相關。(內插與外推等數(shù)據揉合技術)115第115頁,共167頁,2022年,5月20日,13點40分,星期一自相關出現(xiàn)時的估計首先必須清楚各種干擾項的發(fā)生機制:一階自回歸模型AR(1)一階移動平均MA(1)自回歸與移動平均過程ARMA(1,1)116第116頁,共167頁,2022年,5月20日,13點40分,星期一自相關出現(xiàn)時的估計在存在自相關時,用OLS法估計出來的參數(shù)雖然仍是線性和無偏的,但不再有效,與異方差問題類似,可以用GLS求得BLUE的估計參數(shù)。117第117頁,共167頁,2022年,5月20日,13點40分,星期一自相關問題的后果1?;貧w模

55、型低估了真實的干擾項方差2。因此很可能高估了R平方3。因此,置信區(qū)間變得更寬了3。由此,通常的t和F等顯著性檢驗都變成無效的了。118第118頁,共167頁,2022年,5月20日,13點40分,星期一偵察自相關1殘差圖:1。用殘差(或標準化殘差)對時間描點2。用殘差對滯后一期的殘差描點,是對AR(1)假設的一種檢驗(如對工資的回歸模型)119第119頁,共167頁,2022年,5月20日,13點40分,星期一偵察自相關2游程檢驗又稱吉爾里(Geary檢驗),是對殘差序列是否具有系統(tǒng)性樣式的統(tǒng)計檢驗過程。在殘差獨立的虛擬假設下,并當n1(正值的殘差)10,n2(負值的殘差)10的條件下,游程個

56、數(shù)(k)將遵循正態(tài)分布。決策規(guī)則:在95%的置信度下,k落在,就不要拒絕隨機性假設。120第120頁,共167頁,2022年,5月20日,13點40分,星期一偵察自相關3德賓沃森檢驗,又稱DW檢驗,偵察自相關的最普遍應用的檢驗方法,其特點在于它僅依賴于殘差值。D-W檢驗的基本假定:1?;貧w含有截距項,X非隨機或在重復抽樣中固定2。干擾項是按一階自回歸模型產生的3?;貧w模型不把滯后因變量當作解釋變量4。沒有缺失數(shù)據121第121頁,共167頁,2022年,5月20日,13點40分,星期一偵察自相關3D-W檢驗:步驟1:做OLS回歸并取殘差步驟2:計算d步驟3:對給定樣本大小和給定的解釋變量個數(shù)找

57、出臨界 和值。步驟4:比對決策規(guī)則122第122頁,共167頁,2022年,5月20日,13點40分,星期一自相關的補救措施GLS法123第123頁,共167頁,2022年,5月20日,13點40分,星期一ARCHARCH指回歸模型t時刻的干擾項的方差依賴于t-1時刻的干擾項平方,即依賴于在涉及金融數(shù)據,如股票價格、通貨膨脹率、外匯匯率等金融時間序列預測的研究工作時,經常用到ARCH模型,因為研究人員發(fā)現(xiàn)他們對這些金融變量的預測能力隨時期的不同而有相當大的變化。當出現(xiàn)ARCH時應用GLS法進行估計124第124頁,共167頁,2022年,5月20日,13點40分,星期一設定偏誤設定偏誤的類型:

58、1。漏掉一個有關變量2。包含一個無需變量3。采用錯誤函數(shù)形式4。測量誤差125第125頁,共167頁,2022年,5月20日,13點40分,星期一設定偏誤的后果1。略去有關變量,則估計系數(shù)有偏誤且非一致,系數(shù)方差將增大,誤差方差將不正確2。加入多余變量,則估計系數(shù)仍無偏且一致,系數(shù)方差正確,但是誤差方差將不正確126第126頁,共167頁,2022年,5月20日,13點40分,星期一設定偏誤的檢驗1。殘差圖分析2。再次使用D-W統(tǒng)計量步驟1:從原回歸方程求得OLS殘差步驟2:按遺漏的解釋變量Z的遞增次序對殘差排序步驟3:從這樣排列的殘差計算d步驟4:比對D-W表,如果d值顯示有相關性,則模型設

59、定偏誤127第127頁,共167頁,2022年,5月20日,13點40分,星期一殘差圖分析128第128頁,共167頁,2022年,5月20日,13點40分,星期一有關測量誤差的兩點說明如果因變量有測量誤差,則OLS估計量是無偏的,且有一致性,但效率較低。如果自變量有測量誤差,則OLS估計量是有偏誤的,而且非一致129第129頁,共167頁,2022年,5月20日,13點40分,星期一正確設定模型的6種途徑1。理論+約束2。代理變量3。假設檢驗4。簡化5。數(shù)據選擇6。數(shù)據后模型構建130第130頁,共167頁,2022年,5月20日,13點40分,星期一在模型之間進行選擇1。嵌套模型,如B被嵌

60、套在A中(檢驗系數(shù)是否為零)2。非嵌套模型判別方法(根據某些擬合優(yōu)度準則,如R平方、AIC準則等)辨識方法(把供選擇的非嵌套模型組合成一個嵌套模型再做檢驗)131第131頁,共167頁,2022年,5月20日,13點40分,星期一利用兼容性準則對模型進行選擇戴維森-麥金農J檢驗步驟1:估計模型D并得到Y的估計值步驟2:將步驟1中得到的Y的估計值作為自變量加入到模型C中步驟3:對步驟2中的Y的估計值系數(shù)做t檢驗,如果不拒絕零假設,則D模型不含有足以改進模型C的任何額外信息,故模型C兼容了模型D步驟4:上述過程C和D對調,再做檢驗132第132頁,共167頁,2022年,5月20日,13點40分,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論