單方程回歸分析_第1頁
單方程回歸分析_第2頁
單方程回歸分析_第3頁
單方程回歸分析_第4頁
單方程回歸分析_第5頁
已閱讀5頁,還剩346頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

單方程計(jì)量經(jīng)濟(jì)學(xué)模型

理論與方法

TheoryandMethodologyofSingle-EquationEconometricModel

§2.1回歸分析概述§2.2一元線性回歸模型及其參數(shù)估計(jì)§2.3多元線性回歸模型的參數(shù)估計(jì)§2.4多元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)§2.5單方程線性模型的區(qū)間估計(jì)§2.6異方差性§2.7序列相關(guān)性

§2.8多重共線性

§2.9隨機(jī)解釋變量§2.1回歸分析概述

IntroductiontoRegressionAnalysis一、變量間的關(guān)系及回歸分析的基本概念二、總體回歸函數(shù)三、隨機(jī)擾動(dòng)項(xiàng)四、樣本回歸函數(shù)一、變量間的關(guān)系及回歸分析的基本概念變量間的關(guān)系

確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。

統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系?!鹘?jīng)濟(jì)變量之間的關(guān)系,大體可分為兩類:△對變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的:二、總體回歸函數(shù)⒈例子例2.1:一個(gè)假想的社區(qū)有60戶家庭組成,要研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。即如果知道了家庭的月收入,能否預(yù)測該社區(qū)家庭的平均月消費(fèi)支出水平。為達(dá)到此目的,將該60戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費(fèi)支出(表2.1)。

由于不確定因素的影響,對同一收入水平X,不同家庭的消費(fèi)支出不完全相同;但由于調(diào)查的完備性,給定收入水平X的消費(fèi)支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditionaldistribution)是已知的,如:P(Y=550|X=800)=1/5。因此,給定收入X的值Xi,可得消費(fèi)支出Y的條件均值(conditionalmean)或條件期望(conditionalexpectation):該例中:E(Y|X=800)=650⒉分析

從散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,消費(fèi)“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。YX⒊概念

回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。函數(shù)形式可以是線性或非線性的。三、隨機(jī)擾動(dòng)項(xiàng)

⒈隨機(jī)擾動(dòng)項(xiàng)的引入

總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費(fèi)支出水平。但對某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平有偏差。記由(2.1.2)式,個(gè)別家庭的消費(fèi)支出為:(2.1.3)式稱為總體回歸函數(shù)(方程)PRF的隨機(jī)設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機(jī)性影響。

由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)學(xué)模型,因此也稱為總體回歸模型。⒉隨機(jī)誤差項(xiàng)的影響因素在解釋變量中被忽略的因素的影響;變量觀測值的觀測誤差的影響;模型關(guān)系的設(shè)定誤差的影響;其它隨機(jī)因素的影響。⒊產(chǎn)生并設(shè)計(jì)隨機(jī)誤差項(xiàng)的主要原因理論的含糊性;數(shù)據(jù)的欠缺;節(jié)省原則。四、樣本回歸函數(shù)(SRF)⒈問題的提出由于總體的信息往往無法掌握,現(xiàn)實(shí)的情況只能是在一次觀測中得到總體的一組樣本。問題是能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?例2.2:在例2.1的總體中有如下一個(gè)樣本,問:能否從該樣本估計(jì)總體回歸函數(shù)PRF?該樣本的散點(diǎn)圖(scatterdiagram):

樣本散點(diǎn)圖近似于一條直線,畫一條直線以盡可能好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以該線近似地代表總體回歸線。該線稱為樣本回歸線(sampleregressionlines),其函數(shù)形式記為:

注意:這里

將(2.1.4)看成(2.1.1)的近似替代。

⒉樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型

由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型。⒊回歸分析的主要目的根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF?!?.2一元線性回歸模型及其參數(shù)估計(jì)

SimpleLinearRegressionModelandItsEstimation一、線性回歸模型及其普遍性二、線性回歸模型的基本假設(shè)三、一元線性回歸模型的參數(shù)估計(jì)四、最小二乘估計(jì)量的統(tǒng)計(jì)性質(zhì)五、參數(shù)估計(jì)量的概率分布與隨機(jī)項(xiàng)方差的估計(jì)一、線性回歸模型及其普遍性1、線性回歸模型的特征一個(gè)例子

凱恩斯絕對收入假設(shè)消費(fèi)理論:消費(fèi)(C)是由收入(Y)唯一決定的,是收入的線性函數(shù):

C=+Y(2.2.1)

但實(shí)際上上述等式不能準(zhǔn)確實(shí)現(xiàn)。原因⑴消費(fèi)除受收入影響外,還受其他因素的影響;⑵線性關(guān)系只是一個(gè)近似描述;⑶收入變量觀測值的近似性:收入數(shù)據(jù)本身并不絕對準(zhǔn)確地反映收入水平。因此,一個(gè)更符合實(shí)際的數(shù)學(xué)描述為:

C=+Y+(2.2.2)其中:

是一個(gè)隨機(jī)誤差項(xiàng),是其他影響因素的“綜合體”。線性回歸模型的特征:

⑴通過引入隨機(jī)誤差項(xiàng),將變量之間的關(guān)系用一個(gè)線性隨機(jī)方程來描述,并用隨機(jī)數(shù)學(xué)的方法來估計(jì)方程中的參數(shù);⑵在線性回歸模型中,被解釋變量的特征由解釋變量與隨機(jī)誤差項(xiàng)共同決定。

2、線性回歸模型的普遍性

線性回歸模型是計(jì)量經(jīng)濟(jì)學(xué)模型的主要形式,許多實(shí)際經(jīng)濟(jì)活動(dòng)中經(jīng)濟(jì)變量間的復(fù)雜關(guān)系都可以通過一些簡單的數(shù)學(xué)處理,使之化為數(shù)學(xué)上的線性關(guān)系。結(jié)論:實(shí)際經(jīng)濟(jì)活動(dòng)中的許多問題,都可以最終化為線性問題,所以,線性回歸模型有其普遍意義。即使對于無法采取任何變換方法使之變成線性的非線性模型,目前使用得較多的參數(shù)估計(jì)方法——非線性最小二乘法,其原理仍然是以線性估計(jì)方法為基礎(chǔ)。線性模型理論方法在計(jì)量經(jīng)濟(jì)學(xué)模型理論方法的基礎(chǔ)。二、線性回歸模型的基本假設(shè)1、技術(shù)線路由于回歸分析的主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準(zhǔn)確地估計(jì)總體回歸函數(shù)(模型)PRF。即通過估計(jì)采用普通最小二乘或者普通最大似然方法估計(jì)。需要對解釋變量和隨機(jī)項(xiàng)作出假設(shè)。2、線性回歸模型在上述意義上的基本假設(shè)

(1)解釋變量X是確定性變量,不是隨機(jī)變量;解釋變量之間互不相關(guān)。(2)隨機(jī)誤差項(xiàng)具有0均值和同方差:E(

i)=0i=1,2,…,nVar(

i)=

2i=1,2,…,n

(3)隨機(jī)誤差項(xiàng)在不同樣本點(diǎn)之間是獨(dú)立的,不存在序列相關(guān):

Cov(

i,

j)=0i≠ji,j=1,2,…,n

(5)隨機(jī)誤差項(xiàng)服從0均值、同方差的正態(tài)分布:

i~N(0,

2)i=1,2,…,n注意:如果第(1)條假設(shè)滿足,則第(4)條也滿足;

模型對變量和函數(shù)形式的設(shè)定是正確的,即不存在設(shè)定誤差。(4)隨機(jī)誤差項(xiàng)與解釋變量之間不相關(guān):

Cov(Xi,

i)=0i=1,2,…,n重要提示幾乎沒有哪個(gè)實(shí)際問題能夠同時(shí)滿足所有基本假設(shè);通過模型理論方法的發(fā)展,可以克服違背基本假設(shè)帶來的問題;違背基本假設(shè)問題的處理構(gòu)成了單方程線性計(jì)量經(jīng)濟(jì)學(xué)理論方法的主要內(nèi)容:

異方差問題(違背同方差假設(shè))序列相關(guān)問題(違背序列不相關(guān)假設(shè))共線性問題(違背解釋變量不相關(guān)假設(shè))隨機(jī)解釋變量(違背解釋變量確定性假設(shè))0均植、正態(tài)性假設(shè)是由模型的數(shù)理統(tǒng)計(jì)理論決定的。三、一元線性回歸模型的參數(shù)估計(jì)1、普通最小二乘法(OrdinaryLeastSquare,OLS)

給定一組樣本觀測值Xi,Yi(i=1,2,…n),要求樣本回歸函數(shù)盡可能好地?cái)M合這組值,即樣本回歸線上的點(diǎn)與真實(shí)觀測點(diǎn)的“總體誤差”盡可能地小。

2、最大或然法(MaximumLikelihood,ML)

最大或然法,也稱最大似然法,是不同于最小二乘法的另一種參數(shù)估計(jì)方法,是從最大或然原理出發(fā)發(fā)展起來的其它估計(jì)方法的基礎(chǔ)。

基本原理:對于最大或然法,當(dāng)從模型總體隨機(jī)抽取n組樣本觀測值后,最合理的參數(shù)估計(jì)量應(yīng)該使得從模型中抽取該n組樣本觀測值的聯(lián)合概率最大。

將該或然函數(shù)極大化,即可求得到模型參數(shù)的極大或然估計(jì)量。

由于或然函數(shù)的極大化與或然函數(shù)的對數(shù)的極大化是等價(jià)的,所以,取對數(shù)或然函數(shù)如下:

可見,在滿足一系列基本假設(shè)的情況下,模型結(jié)構(gòu)參數(shù)的最大或然估計(jì)量與普通最小二乘估計(jì)量是相同的。但是,隨機(jī)誤差項(xiàng)的方差的估計(jì)量是不同的。3、參數(shù)估計(jì)的離差形式(deviationform)注:在計(jì)量經(jīng)濟(jì)學(xué)中,往往以小寫字母表示對均值的離差(deviation)。4、樣本回歸線的數(shù)值性質(zhì)(numericalproperties)樣本回歸線通過Y和X的樣本均值;Y估計(jì)值的均值等于觀測值的均值;殘差的均值為0。四、最小二乘估計(jì)量的統(tǒng)計(jì)性質(zhì)

高斯-馬爾可夫定理

當(dāng)模型參數(shù)估計(jì)完成,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。一個(gè)用于考察總體的統(tǒng)計(jì)量,可從三個(gè)方面考察其優(yōu)劣性:(1)線性性(linear):即是否是另一隨機(jī)變量的線性函數(shù);(2)無偏性(unbiased):即它的均值或期望值是否等于總體的真實(shí)值;(3)有效性(efficient):即它是否在所有線性無偏估計(jì)量中具有最小方差。高斯—馬爾可夫定理(Gauss-Markovtheorem)

在給定經(jīng)典線性回歸的假定下,最小二乘估計(jì)量是具有最小方差的線性無偏估計(jì)量。

普通最小二乘估計(jì)量具有線性性、無偏性、最小方差性等優(yōu)良性質(zhì)。具有這些優(yōu)良性質(zhì)的估計(jì)量又稱為最佳線性無偏估計(jì)量,即BLUE估計(jì)量(theBestLinearUnbiasedEstimators)。顯然這些優(yōu)良的性質(zhì)依賴于對模型的基本假設(shè)。§2.3多元線性回歸模型的參數(shù)估計(jì)

EstimationofMultipleLinearRegressionModel

一、多元線性回歸模型二、多元線性回歸模型的參數(shù)估計(jì)三、OLS估計(jì)量的統(tǒng)計(jì)性質(zhì)四、參數(shù)估計(jì)量的方差-協(xié)方差矩陣和隨機(jī)誤差項(xiàng)

2方差的估計(jì)五、樣本容量問題六、多元線性回歸模型實(shí)例一、多元線性回歸模型1、多元線性回歸模型的形式由于:在實(shí)際經(jīng)濟(jì)問題中,一個(gè)變量往往受到多個(gè)原因變量的影響;“從一般到簡單”的建模思路。所以,在線性回歸模型中的解釋變量有多個(gè),至少開始是這樣。這樣的模型被稱為多元線性回歸模型。多元線性回歸模型參數(shù)估計(jì)的原理與一元線性回歸模型相同,只是計(jì)算更為復(fù)雜。

多元線性回歸模型的一般形式為:

習(xí)慣上把常數(shù)項(xiàng)看成為一個(gè)虛變量的系數(shù),在參數(shù)估計(jì)過程中該虛變量的樣本觀測值始終取1。這樣:模型中解釋變量的數(shù)目為(k+1)。

多元線性回歸模型的矩陣表達(dá)式為:

2、多元線性回歸模型的基本假定

模型(2.3.1)或(2.3.2)在滿足下述所列的基本假設(shè)的情況下,可以采用普通最小二乘法(OLS)估計(jì)參數(shù)。關(guān)于經(jīng)典回歸模型的假定二、多元線性回歸模型的參數(shù)估計(jì)1、普通最小二乘估計(jì)普通最小二乘估計(jì)

估計(jì)過程的矩陣表示:2、最大或然估計(jì)Y的隨機(jī)抽取的n組樣本觀測值的聯(lián)合概率

對數(shù)或然函數(shù)為參數(shù)的最大或然估計(jì)

結(jié)果與參數(shù)的普通最小二乘估計(jì)相同

3、矩估計(jì)(MomentMethod,MM)用每個(gè)解釋變量分別乘以模型的兩邊,并對所有樣本點(diǎn)求和,即得到:

對每個(gè)方程的兩邊求期望,有:

得到一組矩條件求解這組矩條件,即得到參數(shù)估計(jì)量與OLS、ML估計(jì)量等價(jià)矩方法是工具變量方法(InstrumentalVariables,IV)和廣義矩估計(jì)方法(GeneralizedMomentMethod,GMM)的基礎(chǔ)在矩方法中關(guān)鍵是利用了如果某個(gè)解釋變量與隨機(jī)項(xiàng)相關(guān),只要能找到1個(gè)工具變量,仍然可以構(gòu)成一組矩條件。這就是IV。如果存在>k+1個(gè)變量與隨機(jī)項(xiàng)不相關(guān),可以構(gòu)成一組包含>k+1方程的矩條件。這就是GMM。4、多元回歸方程及偏回歸系數(shù)的含義稱為多元回歸方程(函數(shù))。

多元回歸分析(multipleregressionanalysis)是以多個(gè)解釋變量的固定值為條件的回歸分析,并且所獲得的是諸變量X值固定時(shí)Y的平均值。諸

i稱為偏回歸系數(shù)(partialregressioncoefficients)。偏回歸系數(shù)的含義如下:

1度量著在X2,X3,…,Xk保持不變的情況下,X1每變化1個(gè)單位時(shí),Y的均值E(Y)的變化,或者說

1給出X1的單位變化對Y均值的“直接”或“凈”(不含其他變量)影響。其他參數(shù)的含義與之相同。三、OLS估計(jì)量的統(tǒng)計(jì)性質(zhì)四、參數(shù)估計(jì)量的方差-協(xié)方差矩陣和隨機(jī)誤差項(xiàng)

2方差的估計(jì)1、一個(gè)疑問與回答疑問:在無偏性證明中將參數(shù)估計(jì)量看作隨機(jī)量,而在正規(guī)方程組的推導(dǎo)中又將它看作確定值。如何解釋?解釋:將一組具體樣本資料代入?yún)?shù)估計(jì)量的表達(dá)式給出的參數(shù)估計(jì)結(jié)果是一個(gè)“估計(jì)值”,或者“點(diǎn)估計(jì)”,是參數(shù)估計(jì)量的一個(gè)具體數(shù)值,是確定的;但從另一個(gè)角度,僅僅把它看成是參數(shù)估計(jì)量的一個(gè)表達(dá)式,那么,則是被解釋變量觀測值的函數(shù),而被解釋變量是隨機(jī)變量,所以參數(shù)估計(jì)量也是隨機(jī)變量,在這個(gè)角度上,稱之為“估計(jì)量”。2、參數(shù)估計(jì)量的方差-協(xié)方差將參數(shù)估計(jì)量看作隨機(jī)量,具有數(shù)字特征。參數(shù)估計(jì)量的方差以及不同參數(shù)估計(jì)量之間的協(xié)方差在模型理論中具有重要性。具體描述如下:3、隨機(jī)誤差項(xiàng)

2方差的估計(jì)五、樣本容量問題⒈

最小樣本容量所謂“最小樣本容量”,即從最小二乘原理和最大或然原理出發(fā),欲得到參數(shù)估計(jì)量,不管其質(zhì)量如何,所要求的樣本容量的下限。樣本最小容量必須不少于模型中解釋變量的數(shù)目(包括常數(shù)項(xiàng))。2、滿足基本要求的樣本容量

從參數(shù)估計(jì)角度:>3×解釋變量數(shù)目從檢驗(yàn)的有效性角度:>303、模型的良好性質(zhì)只有在大樣本下才能得到理論上的證明六、多元線性回歸模型實(shí)例中國消費(fèi)函數(shù)模型根據(jù)消費(fèi)模型的一般形式,選擇消費(fèi)總額為被解釋變量,國內(nèi)生產(chǎn)總值和前一年的消費(fèi)總額為解釋變量,變量之間關(guān)系為簡單線性關(guān)系,選取1981年至1996年統(tǒng)計(jì)數(shù)據(jù)為樣本觀測值。

中國消費(fèi)數(shù)據(jù)表單位:億元

模型估計(jì)結(jié)果擬合效果

StatisticalTestofMultipleLinearRegressionModel

一、擬合優(yōu)度檢驗(yàn)二、方程顯著性檢驗(yàn)三、變量顯著性檢驗(yàn)說明由計(jì)量經(jīng)濟(jì)模型的數(shù)理統(tǒng)計(jì)理論要求的以多元線性模型為例將參數(shù)估計(jì)量和預(yù)測值的區(qū)間檢驗(yàn)單獨(dú)列為一節(jié),在一些教科書中也將它們放在統(tǒng)計(jì)檢驗(yàn)中包含擬合優(yōu)度檢驗(yàn)、總體顯著性檢驗(yàn)、變量顯著性檢驗(yàn)、偏回歸系數(shù)約束檢驗(yàn)、模型對時(shí)間或截面?zhèn)€體的穩(wěn)定性檢驗(yàn)等一、擬合優(yōu)度檢驗(yàn)

TestingtheSimulationLevel1、概念檢驗(yàn)?zāi)P蛯颖居^測值的擬合程度。

通過構(gòu)造一個(gè)可以表征擬合程度的統(tǒng)計(jì)量來實(shí)現(xiàn)。問題:采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合了樣本觀測值,為什么還要檢驗(yàn)擬合程度?答案:選擇合適的估計(jì)方法所保證的最好擬合,是同一個(gè)問題內(nèi)部的比較;擬合優(yōu)度檢驗(yàn)結(jié)果所表示的優(yōu)劣是不同問題之間的比較。

2、總體平方和、殘差平方和和回歸平方和

定義TSS為總體平方和(TotalSumofSquares),反映樣本觀測值總體離差的大??;ESS為回歸平方和(ExplainedSumofSquares),反映由模型中解釋變量所解釋的那部分離差的大小;RSS為殘差平方和(ResidualSumofSquares),反映樣本觀測值與估計(jì)值偏離的大小,也是模型中解釋變量未解釋的那部分離差的大小。

既然ESS反映樣本觀測值與估計(jì)值偏離的大小,可否直接用它作為擬合優(yōu)度檢驗(yàn)的統(tǒng)計(jì)量?

不行

統(tǒng)計(jì)量必須是相對量TSS、ESS、RSS之間的關(guān)系

TSS=RSS+ESS4、擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量:可決系數(shù)r2和調(diào)整后的可決系數(shù)R2可決系數(shù)r2

模型與樣本觀測值完全擬合時(shí),r2=1。該統(tǒng)計(jì)量越接近于1,模型的擬合優(yōu)度越高。問題:要使得模型擬合得好,就必須增加解釋變量;增加解釋變量必定使得自由度減少。

調(diào)整的可決系數(shù)R2為什么以R2作為檢驗(yàn)統(tǒng)計(jì)量避免片面增加解釋變量的傾向?

二、方程顯著性檢驗(yàn)

TestingtheOverallSignificance1、關(guān)于假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的一個(gè)主要內(nèi)容,它的基本任務(wù)是根據(jù)樣本所提供的信息,對未知總體分布的某些方面的假設(shè)作出合理的判斷。假設(shè)檢驗(yàn)的程序是,先根據(jù)實(shí)際問題的要求提出一個(gè)論斷,稱為統(tǒng)計(jì)假設(shè);然后根據(jù)樣本的有關(guān)信息,對的真?zhèn)芜M(jìn)行判斷,作出拒絕或接受的決策。

假設(shè)檢驗(yàn)的基本思想是概率性質(zhì)的反證法。概率性質(zhì)的反證法的根據(jù)是小概率事件原理,該原理認(rèn)為“小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生的”。2、方程的顯著性檢驗(yàn)

對模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。用以進(jìn)行方程的顯著性檢驗(yàn)的方法主要有三種:F檢驗(yàn)、t檢驗(yàn)、r檢驗(yàn)。它們的區(qū)別在于構(gòu)造的統(tǒng)計(jì)量不同,即設(shè)計(jì)的“事件”不同。應(yīng)用最為普遍的F檢驗(yàn)。

3、方程顯著性的F檢驗(yàn)方程顯著性的F檢驗(yàn)F檢驗(yàn)的思想來自于總離差平方和的分解式:

TSS=ESS+RSS由于回歸平方和ESS是解釋變量X聯(lián)合體對被解釋變量Y的線性作用的結(jié)果,所以,如果ESS/RSS的比值較大,則X的聯(lián)合體對Y的解釋程度高,可認(rèn)為總體存在線性關(guān)系,反之總體上可能不存在線性關(guān)系。因此,可通過該比值的大小對總體線性關(guān)系進(jìn)行推斷。進(jìn)一步根據(jù)數(shù)理統(tǒng)計(jì)學(xué)中的定義,如果構(gòu)造一個(gè)統(tǒng)計(jì)量則該統(tǒng)計(jì)量服從自由度為(n-k-1)的F分布。在消費(fèi)模型中,k=2,n=16,給定α=0.01,查得F0.01(2,13)=3.80,而F=28682.51>3.80,所以該線性模型在0.99的水平下顯著成立。

關(guān)于擬合優(yōu)度檢驗(yàn)與方程顯著性檢驗(yàn)關(guān)系的討論

可見,F與R2同向變化:當(dāng)R2

=0時(shí),F=0;當(dāng)R2=時(shí),F為無窮大;R2越大,F值也越大。回答前面的問題:R2多大才算通過擬合優(yōu)度檢驗(yàn)?在消費(fèi)模型中,R2>0.28→F>3.80→該線性模型在0.99的水平下顯著成立。

有許多著名的模型,R2小于0.5,支持了重要的結(jié)論,例如收入差距的倒U型規(guī)律。不要片面追求擬合優(yōu)度。三、變量顯著性檢驗(yàn)

TestingtheIndividualSignificance1、變量顯著性檢驗(yàn)

對于多元線性回歸模型,方程的總體線性關(guān)系是顯著的,并不能說明每個(gè)解釋變量對被解釋變量的影響都是顯著的。因此,必須對每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn),以決定是否作為解釋變量被保留在模型中。變量顯著性檢驗(yàn)的數(shù)理統(tǒng)計(jì)學(xué)基礎(chǔ)相同于方程顯著性檢驗(yàn),檢驗(yàn)的思路與程序也與方程顯著性檢驗(yàn)相似。用以進(jìn)行變量顯著性檢驗(yàn)的方法主要有三種:F檢驗(yàn)、t檢驗(yàn)、z檢驗(yàn)。它們的區(qū)別在于構(gòu)造的統(tǒng)計(jì)量不同。應(yīng)用最為普遍的t檢驗(yàn)。

2、變量顯著性的F檢驗(yàn)如果構(gòu)造一個(gè)統(tǒng)計(jì)量

已經(jīng)知道

提出原假設(shè)與備擇假設(shè):

H0:

i=0,H1:i0在消費(fèi)模型中,

tc=6.412,tgdp=22.00,tcons(-1)=4.188

給定α=0.01,查得t0.005(13)=3.012,所以所有變量都在0.99的水平下顯著。3、在一元線性回歸(k=1)中,t檢驗(yàn)與F檢驗(yàn)是一致的。4、關(guān)于檢驗(yàn)標(biāo)準(zhǔn)的判斷科學(xué)性靈活性關(guān)鍵是講清楚在什么置信水平下顯著直觀判斷§2.5單方程線性模型的區(qū)間估計(jì)

IntervalEstimationofMultipleLinearRegressionModel一、參數(shù)估計(jì)量的區(qū)間估計(jì)二、預(yù)測值的區(qū)間估計(jì)一、參數(shù)估計(jì)量的區(qū)間估計(jì)1、問題的提出人們經(jīng)常說,“通過建立生產(chǎn)函數(shù)模型,得到資本的產(chǎn)出彈性是0.5”,“通過建立消費(fèi)函數(shù)模型,得到收入的邊際消費(fèi)傾向是0.6”,等等。其中0.5、0.6是模型具有特定經(jīng)濟(jì)含義的參數(shù)估計(jì)值。

這樣的說法正確嗎?

應(yīng)該如何表述才是正確的?

線性回歸模型的參數(shù)估計(jì)量是隨機(jī)變量,利用一次抽樣的樣本觀測值,估計(jì)得到的只是參數(shù)的一個(gè)點(diǎn)估計(jì)值。如果用參數(shù)估計(jì)量的一個(gè)點(diǎn)估計(jì)值近似代表參數(shù)值,那么,二者的接近程度如何?以多大的概率達(dá)到該接近程度?

這就要構(gòu)造參數(shù)的一個(gè)區(qū)間,以點(diǎn)估計(jì)值為中心的一個(gè)區(qū)間(稱為置信區(qū)間,confidenceinterval),該區(qū)間以一定的概率(稱為置信水平,confidencecoefficient

)包含該參數(shù)。參數(shù)估計(jì)量的區(qū)間估計(jì)的目的就是求得與α相對應(yīng)的a。2、參數(shù)估計(jì)量的區(qū)間估計(jì)3、如何縮小置信區(qū)間增大樣本容量n,因?yàn)樵谕瑯拥臉颖救萘肯?,n越大,t分布表中的臨界值越小,同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減?。惶岣吣P偷臄M合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型優(yōu)度越高,殘差平方和應(yīng)越小。提高樣本觀測值的分散度。二、預(yù)測值的區(qū)間估計(jì)1、問題的提出

但是,嚴(yán)格地說,這只是被解釋變量的預(yù)測值的估計(jì)值,而不是預(yù)測值。

為什么?由于隨機(jī)因素的影響,模型中的參數(shù)估計(jì)量是不確定的。所以,我們得到的僅能是預(yù)測值的一個(gè)估計(jì)值,預(yù)測值僅以某一個(gè)置信水平處于以該估計(jì)值為中心的一個(gè)區(qū)間中。于是,又是一個(gè)區(qū)間估計(jì)問題。下面進(jìn)行置信區(qū)間的推導(dǎo):2、預(yù)測值置信區(qū)間的推導(dǎo)

利用該統(tǒng)計(jì)量,類似于前面的推導(dǎo)過程,得到在給定(1-α)的置信水平下,預(yù)測值Y0的置信區(qū)間為:這就是說,當(dāng)給定解釋變量值X0后,能得到被解釋變量Y0以(1-

)的置信水平處于該區(qū)間的結(jié)論。3、一點(diǎn)啟示計(jì)量經(jīng)濟(jì)學(xué)模型用于預(yù)測時(shí),必須嚴(yán)格科學(xué)地描述預(yù)測結(jié)果。如果要求給出一個(gè)“準(zhǔn)確”的預(yù)測值,那么真實(shí)值與該預(yù)測值相同的概率為0。如果要求以100%的概率給出區(qū)間,那么該區(qū)間是∞。模型研制者的任務(wù)是盡可能地縮小置信區(qū)間。4、如何縮小置信區(qū)間增大樣本容量n,因?yàn)樵谕瑯拥臉颖救萘肯?,n越大,t分布表中的臨界值越小,同時(shí),增大樣本容量,還可使隨機(jī)誤差項(xiàng)的標(biāo)準(zhǔn)差減?。惶岣吣P偷臄M合優(yōu)度,模型優(yōu)度越高,殘差平方和應(yīng)越小。提高樣本觀測值的分散度。三、多元線性回歸分析計(jì)算步驟及主要公式

例:設(shè)某中心城市對各地區(qū)商品流出量Y取決于各地區(qū)的社會(huì)商品購買力X1以及各地區(qū)對該市的商品流入X2,即可能有如下總體回歸方程:

Y=

0+1X1+2X2(2)統(tǒng)計(jì)檢驗(yàn)擬合優(yōu)度檢驗(yàn):總體顯著性檢驗(yàn)(F檢驗(yàn)):參數(shù)顯著性檢驗(yàn)(t檢驗(yàn))

Eviews軟件輸出(1)模型中包括X1與X2:(2)模型中僅包括X1§2.5單方程線性模型的區(qū)間估計(jì)§2.6異方差性

Heteroskedasticity一、異方差性的概念二、異方差性的后果三、異方差性的檢驗(yàn)四、異方差性的估計(jì)五、案例回歸分析,是在對線性回歸模型提出若干基本假設(shè)的條件下,應(yīng)用普通最小二乘法得到了無偏的、有效的參數(shù)估計(jì)量。但是,在實(shí)際的計(jì)量經(jīng)濟(jì)學(xué)問題中,完全滿足這些基本假設(shè)的情況并不多見。如果違背了某一項(xiàng)基本假設(shè),那么應(yīng)用普通最小二乘法估計(jì)模型就不能得到無偏的、有效的參數(shù)估計(jì)量,OLS法失效,這就需要發(fā)展新的方法估計(jì)模型。如果隨機(jī)誤差項(xiàng)序列不具有同方差性,即出現(xiàn)異方差性。說明一、異方差的概念

1、異方差的概念即對于不同的樣本點(diǎn),隨機(jī)誤差項(xiàng)的方差不再是常數(shù),則認(rèn)為出現(xiàn)了異方差性。2、異方差的類型

同方差性假定的意義是指每個(gè)

i圍繞其零平均值的變差,并不隨解釋變量X的變化而變化,不論解釋變量觀測值是大還是小,每個(gè)

i的方差保持相同,即

i2=常數(shù)在異方差的情況下,

i2已不是常數(shù),它隨X的變化而變化,即

i2=f(Xi)

異方差一般可歸結(jié)為三種類型:(1)單調(diào)遞增型:

i2隨X的增大而增大;(2)單調(diào)遞減型:

i2隨X的增大而減小;(3)復(fù)雜型:

i2與X的變化呈復(fù)雜形式。3、實(shí)際經(jīng)濟(jì)問題中的異方差性

在該模型中,

i的同方差假定往往不符合實(shí)際情況。對高收入家庭來說,儲蓄的差異較大;低收入家庭的儲蓄則更有規(guī)律性(如為某一特定目的而儲蓄),差異較小。

因此,

i的方差往往隨Xi的增加而增加,呈單調(diào)遞增型變化。

例如:在截面資料下研究居民家庭的儲蓄形為

Yi=

0+1Xi+i

Yi和Xi分別為第i個(gè)家庭的儲蓄額和可支配收入。

一般情況下:居民收入服從正態(tài)分布,處于中等收入組中的人數(shù)最多,處于兩端收入組中的人數(shù)最少。而人數(shù)多的組平均數(shù)的誤差小,人數(shù)少的組平均數(shù)的誤差大。所以樣本觀測值的觀測誤差隨著解釋變量觀測值的增大而先減后增。

如果樣本觀測值的觀測誤差構(gòu)成隨機(jī)誤差項(xiàng)的主要部分,那么對于不同的樣本點(diǎn),隨機(jī)誤差項(xiàng)的方差隨著解釋變量觀測值的增大而先減后增,出現(xiàn)了異方差性。

例如,以絕對收入假設(shè)為理論假設(shè)、以截面數(shù)據(jù)作樣本建立居民消費(fèi)函數(shù):

Ci=

0+1Yi+i

將居民按照收入等距離分成n組,取組平均數(shù)為樣本觀測值。例如,以某一行業(yè)的企業(yè)為樣本建立企業(yè)生產(chǎn)函數(shù)模型

Yi=Ai1

Ki2

Li3eI產(chǎn)出量為被解釋變量,選擇資本、勞動(dòng)、技術(shù)等投入要素為解釋變量,那么每個(gè)企業(yè)所處的外部環(huán)境對產(chǎn)出量的影響被包含在隨機(jī)誤差項(xiàng)中。由于每個(gè)企業(yè)所處的外部環(huán)境對產(chǎn)出量的影響程度不同,造成了隨機(jī)誤差項(xiàng)的異方差性。

這時(shí),隨機(jī)誤差項(xiàng)的方差并不隨某一個(gè)解釋變量觀測值的變化而呈規(guī)律性變化,為復(fù)雜型的一種。二、異方差性的后果1、參數(shù)估計(jì)量非有效

普通最小二乘法參數(shù)估計(jì)量仍然具有無偏性,但不具有有效性。因?yàn)樵谟行宰C明中利用了

E(NN’)=

2I

而且,在大樣本情況下,參數(shù)估計(jì)量仍然不具有漸近有效性,這就是說參數(shù)估計(jì)量不具有一致性。以一元線性回歸模型為例進(jìn)行說明:(1)仍存在無偏性:證明過程與方差無關(guān)(2)不具備最小方差性2、變量的顯著性檢驗(yàn)失去意義在該統(tǒng)計(jì)量中包含有隨機(jī)誤差項(xiàng)共同的方差,并且有t統(tǒng)計(jì)量服從自由度為(n-k-1)的t分布。如果出現(xiàn)了異方差性,t檢驗(yàn)就失去意義。其它檢驗(yàn)也類似。

3、模型的預(yù)測失效

一方面,由于上述后果,使得模型不具有良好的統(tǒng)計(jì)性質(zhì);另一方面,在預(yù)測值的置信區(qū)間中也包含有隨機(jī)誤差項(xiàng)共同的方差

2。所以,當(dāng)模型出現(xiàn)異方差性時(shí),參數(shù)OLS估計(jì)值的變異程度增大,從而造成對Y的預(yù)測誤差變大,降低預(yù)測精度,預(yù)測功能失效。三、異方差性的檢驗(yàn)1、檢驗(yàn)方法的共同思路

由于異方差性就是相對于不同的解釋變量觀測值,隨機(jī)誤差項(xiàng)具有不同的方差。那么:

檢驗(yàn)異方差性,也就是檢驗(yàn)隨機(jī)誤差項(xiàng)的方差與解釋變量觀測值之間的相關(guān)性及其相關(guān)的“形式”。問題在于用什么來表示隨機(jī)誤差項(xiàng)的方差

一般的處理方法:

2、圖示檢驗(yàn)法(1)用X-Y的散點(diǎn)圖進(jìn)行判斷

看是否存在明顯的散點(diǎn)擴(kuò)大、縮小或復(fù)雜型趨勢(即不在一個(gè)固定的帶型域中)看是否形成一斜率為零的直線

3、解析法(1)戈德菲爾德-匡特(Goldfeld-Quandt)檢驗(yàn)☆

G-Q檢驗(yàn)以F檢驗(yàn)為基礎(chǔ),適用于樣本容量較大、異方差遞增或遞減的情況。

G-Q檢驗(yàn)的思想:

先將樣本一分為二,對子樣①和子樣②分別作回歸,然后利用兩個(gè)子樣的殘差之比構(gòu)造統(tǒng)計(jì)量進(jìn)行異方差檢驗(yàn)。由于該統(tǒng)計(jì)量服從F分布,因此假如存在遞增的異方差,則F遠(yuǎn)大于1;反之就會(huì)等于1(同方差)、或小于1(遞減方差)。G-Q檢驗(yàn)的步驟:①將n對樣本觀察值(Xi,Yi)按解釋變量觀察值Xi的大小排隊(duì)②將序列中間的c=n/4個(gè)觀察值除去,并將剩下的觀察值劃分為較小與較大的相同的兩個(gè)子樣本,每個(gè)子樣樣本容量均為(n-c)/2(2)戈里瑟(Gleiser)檢驗(yàn)與帕克(Park)檢驗(yàn)戈里瑟檢驗(yàn)與帕克檢驗(yàn)的思想:

如果存在某一種函數(shù)形式,使得方程顯著成立,則說明原模型存在異方差性。注意:由于f(Xj)的具體形式未知,因此需要進(jìn)行各種形式的試驗(yàn)。四、異方差性的估計(jì)

——加權(quán)最小二乘法(WLS)

WeightedLeastSquares1、加權(quán)最小二乘法的基本思想加權(quán)最小二乘法是對原模型加權(quán),使之變成一個(gè)新的不存在異方差性的模型,然后采用普通最小二乘法估計(jì)其參數(shù)。

例如,在遞增異方差下,對來自較小Xi的子樣本,其真實(shí)的總體方差較小,Yi與回歸線擬合值之間的殘差ei的信度較大,應(yīng)予以重視;而對較大Xi的子樣本,由于真實(shí)總體的方差較大,殘差反映的信息應(yīng)打折扣。

加權(quán)最小二乘法就是對加了權(quán)重的殘差平方和實(shí)施OLS法:對較小的殘差平方ei2賦予較大的權(quán)數(shù),對較大的殘差平方ei2賦予較小的權(quán)數(shù)。2、一個(gè)例子例如,如果在檢驗(yàn)過程中已經(jīng)知道:3、一般情況對于模型

Y=XB+N(2.4.8)

這就是原模型(2.4.8)的加權(quán)最小二乘估計(jì)量,它是無偏、有效的。這里權(quán)矩陣為D-1,它來自于矩陣W

。4、求得權(quán)矩陣W的一種實(shí)用方法

從前面的推導(dǎo)過程看,它來自于原模型(2.4.8)殘差項(xiàng)N的方差-協(xié)方差矩陣,因此仍然可對原模型(2.4.8)首先采用OLS法,得到隨機(jī)誤差項(xiàng)的近似估計(jì)量,以此構(gòu)成權(quán)矩陣的估計(jì)量,即5、加權(quán)最小二乘法具體步驟6、注意

在實(shí)際建模過程中,尤其是截面數(shù)據(jù)作樣本時(shí),人們通常并不對原模型進(jìn)行異方差性檢驗(yàn),而是直接選擇加權(quán)最小二乘法,尤其是采用截面數(shù)據(jù)作樣本時(shí)。如果確實(shí)存在異方差,則被有效地消除了;如果不存在異方差性,則加權(quán)最小二乘法等價(jià)于普通最小二乘法。在應(yīng)用軟件中,給出了權(quán)矩陣的多種選擇。例如在Eviews中給出了權(quán)矩陣的3種選擇:White權(quán)矩陣、Newey-West權(quán)矩陣和自己輸入權(quán)矩陣。White,1980,Aheteroskedasticity-consistentconvariancematrixanddirecttestforheteroskedaticity,Econometrica,48,817-38Newey,West,1987,ASimplePositiveSemi-Definite,HeteroskedasticityandAutocorrelationConsistentCovarianceMatrix,Econometrica,55,703-8五、案例—1

—某地區(qū)居民儲蓄模型某地區(qū)31年來居民收入與儲蓄額數(shù)據(jù)表1、普通最小二乘估計(jì)2、異方差檢驗(yàn)(1)圖示檢驗(yàn)⑵G-Q檢驗(yàn)①求兩個(gè)子樣本(n1=n2=12)回歸方程的殘差平方和RSS1與RSS2;②計(jì)算F統(tǒng)計(jì)量F=RSS2/RSS1=769899.2/162899.2=4.726③查表

在5%的顯著性水平下,第1和第2自由度均為(31-7)/2-2=10的F分布臨界值為

F0.05(10,10)=2.97由于F=4.72>F0.05(10,10)=2.97因此,否定兩組子樣方差相同的假設(shè),從而該總體隨機(jī)項(xiàng)存在遞增異方差性。⑶Park檢驗(yàn)

顯然,lnXi前的參數(shù)表現(xiàn)為統(tǒng)計(jì)上顯著的,表明原數(shù)據(jù)存在異方差性。3、異方差模型的估計(jì)與OLS估計(jì)結(jié)果相比較,擬合效果更差。為什么?關(guān)于異方差形式的假定…與OLS估計(jì)結(jié)果相比較,擬合效果更好。

五、案例—2

—居民消費(fèi)二元模型1、OLS估計(jì)結(jié)果2、WLS估計(jì)結(jié)果3、比較各項(xiàng)統(tǒng)計(jì)檢驗(yàn)指標(biāo)全面改善R2:0.999739→0.999999F:28682→980736∑e2:438613→29437t:6.422.04.2→25.2134.122.9D.W.:1.45→1.81§2.7序列相關(guān)性

SerialCorrelation一、序列相關(guān)性二、序列相關(guān)性的后果三、序列相關(guān)性的檢驗(yàn)四、具有序列相關(guān)性模型的估計(jì)五、案例

如果模型的隨機(jī)誤差項(xiàng)違背了互相獨(dú)立的基本假設(shè)的情況,稱為序列相關(guān)性。

普通最小二乘法(OLS)要求計(jì)量模型的隨機(jī)誤差項(xiàng)相互獨(dú)立或序列不相關(guān)。一、序列相關(guān)性1、序列相關(guān)的概念

如果對于不同的樣本點(diǎn),隨機(jī)誤差項(xiàng)之間不再是不相關(guān)的,而是存在某種相關(guān)性,則認(rèn)為出現(xiàn)了序列相關(guān)性。稱為一階序列相關(guān),或自相關(guān)(autocorrelation)。這是最常見的一種序列相關(guān)問題。

自相關(guān)往往可寫成如下形式:其中:

被稱為自協(xié)方差系數(shù)(coefficientofautocovariance)或一階自相關(guān)系數(shù)(first-ordercoefficientofautocorrelation)。2、序列相關(guān)產(chǎn)生的原因

(1)慣性

大多數(shù)經(jīng)濟(jì)時(shí)間數(shù)據(jù)都有一個(gè)明顯的特點(diǎn),就是它的慣性。

GDP、價(jià)格指數(shù)、生產(chǎn)、就業(yè)與失業(yè)等時(shí)間序列都呈周期性,如周期中的復(fù)蘇階段,大多數(shù)經(jīng)濟(jì)序列均呈上升勢,序列在每一時(shí)刻的值都高于前一時(shí)刻的值,似乎有一種內(nèi)在的動(dòng)力驅(qū)使這一勢頭繼續(xù)下去,直至某些情況(如利率或課稅的升高)出現(xiàn)才把它拖慢下來。(2)設(shè)定偏誤:模型中遺漏了顯著的變量

例如:如果對牛肉需求的正確模型應(yīng)為Yt=

0+1X1t+2X2t+3X3t+t其中:Y=牛肉需求量,X1=牛肉價(jià)格,X2=消費(fèi)者收入,X3=豬肉價(jià)格。如果模型設(shè)定為:Yt=

0+1X1t+2X2t+vt那么該式中的隨機(jī)誤差項(xiàng)實(shí)際上是:vt=

3X3t+t,

于是在豬肉價(jià)格影響牛肉消費(fèi)量的情況下,這種模型設(shè)定的偏誤往往導(dǎo)致隨機(jī)項(xiàng)中有一個(gè)重要的系統(tǒng)性影響因素,使其呈序列相關(guān)性。

(3)設(shè)定偏誤:不正確的函數(shù)形式

例如:如果邊際成本模型應(yīng)為:

Yt=

0+1Xt+2Xt2+t其中:Y=邊際成本,X=產(chǎn)出。但建模時(shí)設(shè)立了如下模型:

Yt=

0+1Xt+vt因此,由于vt=

2Xt2+t,

,包含了產(chǎn)出的平方對隨機(jī)項(xiàng)的系統(tǒng)性影響,隨機(jī)項(xiàng)也呈現(xiàn)序列相關(guān)性。(4)蛛網(wǎng)現(xiàn)象

例如,農(nóng)產(chǎn)品供給對價(jià)格的反映本身存在一個(gè)滯后期:供給t=

0+1價(jià)格t-1+t意味著,農(nóng)民由于在年度t的過量生產(chǎn)(使該期價(jià)格下降)很可能導(dǎo)致在年度t+1時(shí)削減產(chǎn)量,因此不能期望隨機(jī)干擾項(xiàng)是隨機(jī)的,往往產(chǎn)生一種蛛網(wǎng)模式。(5)數(shù)據(jù)的“編造”

例如,季度數(shù)據(jù)來自月度數(shù)據(jù)的簡單平均,這種平均的計(jì)算減弱了每月數(shù)據(jù)的波動(dòng)而引進(jìn)了數(shù)據(jù)中的勻滑性,這種勻滑性本身就能使干擾項(xiàng)中出現(xiàn)系統(tǒng)性的因素,從而出現(xiàn)序列相關(guān)。還有就是兩個(gè)時(shí)間點(diǎn)之間的“內(nèi)插”技術(shù)往往導(dǎo)致隨機(jī)項(xiàng)的序列相關(guān)性。二、序列相關(guān)性的后果1、參數(shù)估計(jì)量非有效

OLS參數(shù)估計(jì)量仍具無偏性

OLS估計(jì)量不具有有效性在大樣本情況下,參數(shù)估計(jì)量仍然不具有漸近有效性,這就是說參數(shù)估計(jì)量不具有一致性

2、變量的顯著性檢驗(yàn)失去意義

在關(guān)于變量的顯著性檢驗(yàn)中,當(dāng)存在序列相關(guān)時(shí),參數(shù)的OLS估計(jì)量的方差增大,標(biāo)準(zhǔn)差也增大,因此實(shí)際的t統(tǒng)計(jì)量變小,從而接受原假設(shè)

i=0的可能性增大,檢驗(yàn)就失去意義。采用其它檢驗(yàn)也是如此。3、模型的預(yù)測失效

區(qū)間預(yù)測與參數(shù)估計(jì)量的方差有關(guān),在方差有偏誤的情況下,使得預(yù)測估計(jì)不準(zhǔn)確,預(yù)測精度降低。所以,當(dāng)模型出現(xiàn)序列相關(guān)性時(shí),它的預(yù)測功能失效。三、序列相關(guān)性的檢驗(yàn)1、基本思路序列相關(guān)性檢驗(yàn)方法有多種,但基本思路是相同的。首先采用普通最小二乘法估計(jì)模型,以求得隨機(jī)誤差項(xiàng)的“近似估計(jì)量”:

然后,通過分析這些“近似估計(jì)量”之間的相關(guān)性,以達(dá)到判斷隨機(jī)誤差項(xiàng)是否具有序列相關(guān)性的目的。2、圖示法2、解析法(1)回歸檢驗(yàn)法

具體應(yīng)用時(shí)需要反復(fù)試算?;貧w檢驗(yàn)法的優(yōu)點(diǎn)是:一旦確定了模型存在序列相關(guān)性,也就同時(shí)知道了相關(guān)的形式;它適用于任何類型的序列相關(guān)性問題的檢驗(yàn)。

對各方程估計(jì)并進(jìn)行顯著性檢驗(yàn),如果存在某一種函數(shù)形式,使得方程顯著成立,則說明原模型存在序列相關(guān)性。(2)杜賓-瓦森(Durbin-Watson)檢驗(yàn)法

D-W檢驗(yàn)是杜賓(J.Durbin)和瓦森(G.S.Watson)于1951年提出的一種檢驗(yàn)序列自相關(guān)的方法。該方法的假定條件是:(1)解釋變量X非隨機(jī);(2)隨機(jī)誤差項(xiàng)

i為一階自回歸形式:

i=i-1+i(3)回歸模型中不應(yīng)含有滯后應(yīng)變量作為解釋變量,即不應(yīng)出現(xiàn)下列形式:

Yi=

0+1X1i+kXki+Yi-1+i(4)回歸含有截距項(xiàng);(5)沒有缺落數(shù)據(jù)。

D.W.統(tǒng)計(jì)量該統(tǒng)計(jì)量的分布與出現(xiàn)在給定樣本中的X值有復(fù)雜的關(guān)系,因此其精確的分布很難得到。但是,Durbin和Watson成功地導(dǎo)出了臨界值的下限dL和上限dU

,且這些上下限只與樣本的容量n和解釋變量的個(gè)數(shù)k有關(guān),而與解釋變量X的取值無關(guān)。檢驗(yàn)步驟①計(jì)算該統(tǒng)計(jì)量的值,②根據(jù)樣本容量n和解釋變量數(shù)目k查D.W.分布表,得到臨界值dL和dU,③按照下列準(zhǔn)則考察計(jì)算得到的D.W.值,以判斷模型的自相關(guān)狀態(tài)。

可以看出,當(dāng)D.W.值在2左右時(shí),模型不存在一階自相關(guān)。如果存在完全一階正相關(guān),即

=1,則D.W.0

如果存在完全一階負(fù)相關(guān),即

=-1,則D.W.4如果完全不相關(guān),即

=0,則D.W.2

(1)從判斷準(zhǔn)則看到,存在一個(gè)不能確定的D.W.值區(qū)域,這是這種檢驗(yàn)方法的一大缺陷。(2)D.W.檢驗(yàn)雖然只能檢驗(yàn)一階自相關(guān),但在實(shí)際計(jì)量經(jīng)濟(jì)學(xué)問題中,一階自相關(guān)是出現(xiàn)最多的一類序列相關(guān);(3)經(jīng)驗(yàn)表明,如果不存在一階自相關(guān),一般也不存在高階序列相關(guān)。

所以在實(shí)際應(yīng)用中,對于序列相關(guān)問題一般只進(jìn)行D.W.檢驗(yàn)。注意:四、具有序列相關(guān)性模型的估計(jì)如果模型被檢驗(yàn)證明存在序列相關(guān)性,則需要發(fā)展新的方法估計(jì)模型。最常用的方法是廣義最小二乘法(GLS:Generalizedleastsquares)、一階差分法(First-OrderDifference)和廣義差分法(GeneralizedDifference)。

1、廣義最小二乘法

對于模型

Y=XB+N(2.5.7)

如果存在序列相關(guān),同時(shí)存在異方差,即有

設(shè)

=DD’

用D-1左乘(2.5.7)兩邊,得到一個(gè)新的模型:

D-1

Y=D-1

XB+D-1N(2.5.8)

即Y*=X*B+N*

該模型具有同方差性和隨機(jī)誤差項(xiàng)互相獨(dú)立性。

于是,可以用OLS法估計(jì)模型(2.5.8),得(2.5.9)

這就是原模型(2.5.7)的廣義最小二乘估計(jì)量(GLSestimators),是無偏的、有效的估計(jì)量。

如何得到矩陣

?

仍然是對原模型(2.5.7)首先采用普通最小二乘法,得到隨機(jī)誤差項(xiàng)的近似估計(jì)量,以此構(gòu)成矩陣的估計(jì)量

,即可行的廣義最小二乘法(FGLS,FeasibleGeneralizedLeastSquares)文獻(xiàn)中常見的術(shù)語如果能夠找到一種方法,求得到Ω的估計(jì)量,使得GLS能夠?qū)崿F(xiàn),都稱為FGLS

前面提出的方法,就是FGLS2、一階差分法

即使對于非完全一階正相關(guān)的情況,只要存在一定程度的一階正相關(guān),差分模型就可以有效地加以克服。

如果原模型存在完全一階正自相關(guān),即在

i=i-1+i中,

=1。(2.5.10)可變換為:

Yi=1Xi+I由于

i不存在序列相關(guān),該差分模型滿足應(yīng)用OLS法的基本假設(shè),用OLS法估計(jì)可得到原模型參數(shù)的無偏的、有效的估計(jì)量。3、廣義差分法

模型(2.5.12)為廣義差分模型,該模型不存在序列相關(guān)問題。采用OLS法估計(jì)可以得到原模型參數(shù)的無偏、有效的估計(jì)量。

廣義差分法可以克服所有類型的序列相關(guān)帶來的問題,一階差分法是它的一個(gè)特例。4、隨機(jī)誤差項(xiàng)相關(guān)系數(shù)

的估計(jì)

應(yīng)用廣義差分法,必須已知不同樣本點(diǎn)之間隨機(jī)誤差項(xiàng)的相關(guān)系數(shù)

1,

2,…,

l

。實(shí)際上,人們并不知道它們的具體數(shù)值,所以必須首先對它們進(jìn)行估計(jì)。

常用的方法有:

(1)科克倫-奧科特(Cochrane-Orcutt)迭代法。(2)杜賓(durbin)兩步法(1)科克倫-奧科特迭代法

首先,采用OLS法估計(jì)原模型

Yi=

0+1Xi+i得到的隨機(jī)誤差項(xiàng)的“近似估計(jì)值”,并以之作為觀測值采用OLS法估計(jì)下式

i=1

i-1+2

i-2+L

i-L+i

類似地,可進(jìn)行第三次、第四次迭代。

關(guān)于迭代的次數(shù),可根據(jù)具體的問題來定。一般是事先給出一個(gè)精度,當(dāng)相鄰兩次

1,2,,L的估計(jì)值之差小于這一精度時(shí),迭代終止。實(shí)踐中,有時(shí)只要迭代兩次,就可得到較滿意的結(jié)果。兩次迭代過程也被稱為科克倫-奧科特兩步法。(2)杜賓(durbin)兩步法

該方法仍是先估計(jì)

1,2,,L,再對差分模型進(jìn)行估計(jì)。5、應(yīng)用軟件中的廣義差分法在Eview/TSP軟件包下,廣義差分采用了科克倫-奧科特(Cochrane-Orcutt)迭代法估計(jì)

。在解釋變量中引入AR(1)、AR(2)、…,即可得到參數(shù)和ρ1、ρ2、…的估計(jì)值。其中AR(m)表示隨機(jī)誤差項(xiàng)的m階自回歸。在估計(jì)過程中自動(dòng)完成了ρ1、ρ2、…的迭代.

6、虛假序列相關(guān)問題

由于隨機(jī)項(xiàng)的序列相關(guān)往往是在模型設(shè)定中遺漏了重要的解釋變量或?qū)δP偷暮瘮?shù)形式設(shè)定有誤,這種情形可稱為虛假序列相關(guān),應(yīng)在模型設(shè)定中排除。避免產(chǎn)生虛假序列相關(guān)性的措施是在開始時(shí)建立一個(gè)“一般”的模型,然后逐漸剔除確實(shí)不顯著的變量。五、案例:地區(qū)商品出口模型1、某地區(qū)商品出口總值與國內(nèi)生產(chǎn)總值的數(shù)據(jù)2、序列相關(guān)性檢驗(yàn)

(1)圖示法檢驗(yàn)(2)D.W.檢驗(yàn)

在5%在顯著性水平下,n=19,k=2(包含常數(shù)項(xiàng)),查表得dL=1.18,dU=1.40,由于DW=0.9505<dL,故存在正自相關(guān)。3、自相關(guān)的處理

⑴一階差分法R2=0.4747,D.W.=1.8623由于DW>du=1.39(注:樣本容量為18個(gè)),已不存在自相關(guān)。

⑵廣義差分法①采用杜賓兩步法估計(jì)

由于DW>=1.39(注:樣本容量為19-1=18個(gè)),已不存在自相關(guān)。于是原模型估計(jì)式為:②采用科克倫-奧科特迭代法估計(jì)

一階廣義差分的結(jié)果:

由于DW>du=1.39(注:樣本容量為18個(gè)),已不存在自相關(guān)。

二階廣義差分的結(jié)果:

由于DW>du=1.38(注:樣本容量為19-2=17個(gè)),已不存在自相關(guān)。但由于AR[2]前的系數(shù)的t值為-0.15,在5%的顯著性水平下并不顯著,說明隨機(jī)干擾項(xiàng)不存在二階序列相關(guān)性,模型中應(yīng)去掉AR[2]項(xiàng)。

§2.8多重共線性

Multi-Collinearity一、多重共線性的概念二、多重共線性的后果三、多重共線性的檢驗(yàn)四、克服多重共線性的方法五、案例六、分部回歸與多重共線性一、多重共線性的概念1、多重共線性

對于模型

Yi=

0+1X1i+2X2i++kXki+i

i=1,2,…,n(2.6.1)其基本假設(shè)之一是解釋變量是互相獨(dú)立的。

如果某兩個(gè)或多個(gè)解釋變量之間出現(xiàn)了相關(guān)性,則稱為多重共線性。

如果存在

c1X1i+c2X2i+…+ckXki=0i=1,2,…,n(2.6.2)

其中:ci不全為0,即某一個(gè)解釋變量可以用其它解釋變量的線性組合表示,則稱為解釋變量間存在完全共線性。

如果存在

c1X1i+c2X2i+…+ckXki+vi=0i=1,2,…,n(2.6.3)其中ci不全為0,為隨機(jī)誤差項(xiàng),則稱為一般共線性(近似共線性)或交互相關(guān)(intercorrelated)。

在矩陣表示的線性回歸模型

Y=XB+N

中,完全共線性指:秩(X)<k+1,即矩陣

例如,X2=X1,這時(shí)X1與X2的相關(guān)系數(shù)為1,解釋變量X2對因變量的作用完全可由X1代替。

注意:完全共線性的情況并不多見,一般出現(xiàn)的是在一定程度上的共線性,即近似共線性。2、實(shí)際經(jīng)濟(jì)問題中的多重共線性現(xiàn)象

經(jīng)濟(jì)變量的共同變化趨勢

時(shí)間序列樣本:經(jīng)濟(jì)繁榮時(shí)期,各基本經(jīng)濟(jì)變量(收入、消費(fèi)、投資、價(jià)格)都趨于增長;衰退時(shí)期,又同時(shí)趨于下降。

橫截面數(shù)據(jù):生產(chǎn)函數(shù)中,資本投入與勞動(dòng)力投入往往出現(xiàn)高度相關(guān)情況,大企業(yè)二者都大,小企業(yè)都小。

滯后變量的引入

在計(jì)量經(jīng)濟(jì)模型中,往往需要引入滯后經(jīng)濟(jì)變量來反映真實(shí)的經(jīng)濟(jì)關(guān)系。

例如,消費(fèi)=f(當(dāng)期收入,前期收入)顯然,兩期收入間有較強(qiáng)的線性相關(guān)性。

一般經(jīng)驗(yàn)

對于采用時(shí)間序列數(shù)據(jù)作樣本、以簡單線性形式建立的計(jì)量經(jīng)濟(jì)學(xué)模型,往往存在多重共線性。以截面數(shù)據(jù)作樣本時(shí),問題不那么嚴(yán)重,但多重共線性仍然是存在的。二、多重共線性的后果

1、完全共線性下參數(shù)估計(jì)量不存在如果存在完全共線性,則(X’X)-1不存在,無法得到參數(shù)的估計(jì)量。2、近似共線性下普通最小二乘法參數(shù)估計(jì)量非有效

在一般共線性(或稱近似共線性)下,雖然可以得到OLS法參數(shù)估計(jì)量,但是由參數(shù)估計(jì)量方差的表達(dá)式為

可見,由于此時(shí)|X’X|0,引起(X’X)-1主對角線元素較大,從而使參數(shù)估計(jì)值的方差增大,OLS參數(shù)估計(jì)量非有效。即:多重共線性使參數(shù)估計(jì)值的方差增大,方差擴(kuò)大因子(VarianceInflationFactor)為1/(1-r2),其增大趨勢見下表:3、參數(shù)估計(jì)量經(jīng)濟(jì)含義不合理

如果模型中兩個(gè)解釋變量具有線性相關(guān)性,例如X1和X2,那么它們中的一個(gè)變量可以由另一個(gè)變量表征。這時(shí),X1和X2前的參數(shù)并不反映各自與被解釋變量之間的結(jié)構(gòu)關(guān)系,而是反映它們對被解釋變量的共同影響。所以各自的參數(shù)已經(jīng)失去了應(yīng)有的經(jīng)濟(jì)含義,于是經(jīng)常表現(xiàn)出似乎反常的現(xiàn)象,例如本來應(yīng)該是正的,結(jié)果恰是負(fù)的。4、變量的顯著性檢驗(yàn)失去意義存在多重共線性時(shí)參數(shù)估計(jì)值的方差與標(biāo)準(zhǔn)差變大使t統(tǒng)計(jì)量的拒絕域變?。ㄅR界值增大)容易使通過樣本計(jì)算的t值小于臨界值,誤導(dǎo)作出參數(shù)為0的推斷可能將重要的解釋變量排除在模型之外三、多重共線性的檢驗(yàn)

由于多重共線性表現(xiàn)為解釋變量之間具有相關(guān)關(guān)系,所以用于多重共線性的檢驗(yàn)方法主要是統(tǒng)計(jì)方法:如判定系數(shù)檢驗(yàn)法、逐步回歸檢驗(yàn)法等。

多重共線性檢驗(yàn)的任務(wù)是:(1)檢驗(yàn)多重共線性是否存在;(2)估計(jì)多重共線性的范圍,即判斷哪些變量之間存在共線性。1、檢驗(yàn)多重共線性是否存在

(1)對兩個(gè)解釋變量的模型,采用簡單相關(guān)系數(shù)法

求出X1與X2的簡單相關(guān)系數(shù)r,若|r|接近1,則說明兩變量存在較強(qiáng)的多重共線性。

(2)對多個(gè)解釋變量的模型,采用綜合統(tǒng)計(jì)檢驗(yàn)法若在OLS法下,模型的R2與F值較大,但各參數(shù)估計(jì)值的t檢驗(yàn)值較小,說明各解釋變量對Y的聯(lián)合線性作用顯著,但各解釋變量間存在共線性而使得它們對Y的獨(dú)立作用不能分辨,故t檢驗(yàn)不顯著。2、判明存在多重共線性的范圍(1)判定系數(shù)檢驗(yàn)法

使模型中每一個(gè)解釋變量分別以其余解釋變量為解釋變量進(jìn)行回歸計(jì)算,并計(jì)算相應(yīng)的擬合優(yōu)度,也稱為判定系數(shù)。如果在某一種形式

Xji=

1X1i+2X2i+LXLi中判定系數(shù)較大,則說明在該形式中作為被解釋變量的Xj可以用其他X的線性組合代替,即Xj與其他X之間存在共線性。

等價(jià)的檢驗(yàn)是對上述回歸方程作F檢驗(yàn)

式中:Rj?2為第j個(gè)解釋變量對其他解釋變量的回歸方程的決定系數(shù),若存在較強(qiáng)的共線性,則Rj?2較大且接近于1,這時(shí)(1-Rj?2

)較小,從而Fj的值較大。因此,可以在給定的顯著性水平下,通過計(jì)算F值的方法進(jìn)行檢驗(yàn)。

另一等價(jià)的檢驗(yàn):

在模型中排除某一個(gè)解釋變量Xj,估計(jì)模型,如果擬合優(yōu)度與包含Xj時(shí)十分接近,則說明Xj與其它解釋變量之間存在共線性。(2)逐步回歸法

以Y為被解釋變量,逐個(gè)引入解釋變量,構(gòu)成回歸模型,進(jìn)行模型估計(jì)。根據(jù)擬合優(yōu)度的變化決定新引入的變量是否可以用其它變量的線性組合代替,而不作為獨(dú)立的解釋變量。

如果擬合優(yōu)度變化顯著,則說明新引入的變量是一個(gè)獨(dú)立解釋變量;

如果擬合優(yōu)度變化很不顯著,則說明新引入的變量不是一個(gè)獨(dú)立解釋變量,它可以用其它變量的線性組合代替,也就是說它與其它變量之間存在共線性關(guān)系。四、克服多重共線性的方法

1、第一類方法:排除引起共線性的變量

找出引起多重共線性的解釋變量,將它排除出去,是最為有效的克服多重共線性問題的方法。以逐步回歸法得到最廣泛的應(yīng)用。注意:剩余解釋變量參數(shù)的經(jīng)濟(jì)含義和數(shù)值都發(fā)生了變化。2、第二類方法:差分法

對于以時(shí)間序列數(shù)據(jù)為樣本、以直接線性關(guān)系為模型關(guān)系形式的計(jì)量經(jīng)濟(jì)學(xué)模型,將原模型變換為差分模型

Yi=1X1i+2X2i++kXki+i可以有效地消除存在于原模型中的多重共線性。

一般講,增量之間的線性關(guān)系遠(yuǎn)比總量之間的線性關(guān)系弱得多。例如:在中國消費(fèi)模型中的2個(gè)變量:

由表中的比值可以直觀地看到,兩變量增量的線性關(guān)系弱于總量之間的線性關(guān)系。

進(jìn)一步分析:

Y與C(-1)之間的判定系數(shù)為0.9845,△Y與△C(-1)之間的判定系數(shù)為0.7456。

一般認(rèn)為:兩個(gè)變量之間的判定系數(shù)大于0.8時(shí),二者之間存在線性關(guān)系。所以,原模型經(jīng)檢驗(yàn)地被認(rèn)為具有多重共線性,而差分模型則可認(rèn)為不具有多重共線性。3、第三類方法:減小參數(shù)估計(jì)量的方差

多重共線性的主要后果是參數(shù)估計(jì)量具有較大的方差,所以采取適當(dāng)方法減小參數(shù)估計(jì)量的方差,雖然沒有消除模型中的多重共線性,但確能消除多重共線性造成的后果。

例如,增加樣本容量,可使參數(shù)估計(jì)量的方差減小。

再如:嶺回歸法(RidgeRegression)

70年代發(fā)展的嶺回歸法,以引入偏誤為代價(jià)減小參數(shù)估計(jì)量的方差,受到人們的重視。具體方法是:引入矩陣D,使參數(shù)估計(jì)量為

其中矩陣D一般選擇為主對角陣,即

D=aI(2.6.6)a為大于0的常數(shù)。

顯然,與未含D的參數(shù)B的估計(jì)量相比,(2.6.5)的估計(jì)量有較小的方差。五、案例一:服裝市場需求函數(shù)□1、建立模型

根據(jù)理論和經(jīng)驗(yàn)分析,影響居民服裝類支出的主要因素有:可支配收入、居民流動(dòng)資產(chǎn)擁有量、服裝價(jià)格指數(shù)、物價(jià)總指數(shù)。已知某地區(qū)的有關(guān)資料,根據(jù)散點(diǎn)圖判斷,建立線性服裝消費(fèi)支出模型:

Y=

0+1X+2K+3P1+4P0+2、樣本數(shù)據(jù)

由于R2較大且接近于1,而且F=638.4,大于臨界值:F0.05(4,5)=15.19,故認(rèn)為服裝支出與上述解釋變量間總體線性關(guān)系顯著。但由于參數(shù)K的估計(jì)值的t檢驗(yàn)值較?。ㄎ茨芡ㄟ^檢驗(yàn)),故解釋變量間存在多重共線性。3、估計(jì)模型(2)檢驗(yàn)簡單相關(guān)系數(shù)各解釋變量間存在高度相關(guān)性,其中尤其以P1,P0間的相關(guān)系數(shù)為最高。(3)找出最簡單的回歸形式可見,應(yīng)選①為初始的回歸模型。(4)逐步回歸

將其他解釋變量分別導(dǎo)入上述初始回歸模型,尋找最佳回歸方程。4、討論:

①在初始模型中引入P1,模型擬合優(yōu)度提高,且參數(shù)符號合理,但P1的t檢驗(yàn)未通過;②再引入K,擬合優(yōu)度雖有提高,但K與P1的t檢驗(yàn)未能通過,且X與P1的t檢驗(yàn)值及F檢驗(yàn)值有所下降,表明引入K并未對回歸模型帶來明顯的“好處”,K可能是多余的;③去掉K,加入P0,擬合優(yōu)度有所提高,且各解釋變量的t檢驗(yàn)全部通過,F(xiàn)值也增大了。④將4個(gè)解釋變量全部包括進(jìn)模型,擬合優(yōu)度未有明顯改觀,K的t檢驗(yàn)未能通過,K顯然是多余的。

5、結(jié)論回歸方程以Y=f(X,P1,P0)為最優(yōu):

Y=-12.45+0.10X-0.19P1+0.31P01、OLS估計(jì)結(jié)果五、案例二:中國消費(fèi)函數(shù)模型2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論