第二章簡單線性回歸模型.ppt_第1頁
第二章簡單線性回歸模型.ppt_第2頁
第二章簡單線性回歸模型.ppt_第3頁
第二章簡單線性回歸模型.ppt_第4頁
第二章簡單線性回歸模型.ppt_第5頁
已閱讀5頁,還剩128頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第 二 章 簡單線性回歸模型,引例:居民收入與消費(fèi)有何種關(guān)系?,西方經(jīng)濟(jì)學(xué)理論代表福利經(jīng)濟(jì)學(xué) 家凱恩斯(Keyness)認(rèn)為: 隨著收入的增加,消費(fèi)也會(huì)增加。 收入直接制約著消費(fèi),而收入分 配的嚴(yán)重不均,不僅會(huì)使社會(huì)中 產(chǎn)生不安因素,而且還大大影響 消費(fèi)需求的提高。 居民收入與消費(fèi)相關(guān)密切程度如何? 居民收入和消費(fèi)有著何種數(shù)量關(guān)系? 怎樣根據(jù)收入的變動(dòng)來估計(jì)消費(fèi)的變動(dòng)?,顯然,對(duì)居民消費(fèi)起決定性影響作用的有“居民的可支配收入”,“對(duì)未來收入的預(yù)期”以及“物價(jià)水平”等因素。為了不使問題復(fù)雜化, 我們先對(duì)最簡單的單一變量間數(shù)量關(guān)系加以討論“居民消費(fèi)”(Y)與“居民可支配收入”(X)有怎樣的數(shù)量關(guān)系

2、呢? 能否用某種線性或非線性關(guān)系式 Y= f ( X ) 去表現(xiàn)這種數(shù)量關(guān)系呢?具體該怎樣去表現(xiàn)呢?,需要研究經(jīng)濟(jì)變量之間數(shù)量關(guān)系的方法,為什么先討論簡單線性回歸模型呢?,在計(jì)量經(jīng)濟(jì)模型中,只有兩個(gè)變量且為線性的回歸模型最簡單,稱為簡單線性回歸模型。簡單線性回歸的原理可以直接用代數(shù)式去表述,較為直觀,更容易理解和接受。 先討論 簡單線性回歸模型,然后很容易拓展到多元的情況。 本章主要討論的問題 : 回歸分析的基本概念 線性回歸模型參數(shù)的估計(jì) 參數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn) 回歸方程的擬合優(yōu)度回歸模型預(yù)測(cè),第一節(jié) 回歸分析與回歸函數(shù) 一、相關(guān)分析與回歸分析 1、經(jīng)濟(jì)變量之間的相互關(guān)系 性質(zhì)上可能有三種

3、情況: 確定性的函數(shù)關(guān)系 Y=f (X) 可用數(shù)學(xué)方法計(jì)算 例如: 個(gè)人收入與所得稅之間的關(guān)系,經(jīng)濟(jì)變量之間的相互關(guān)系,不確定的統(tǒng)計(jì)關(guān)系相關(guān)關(guān)系 Y= f(X,) (為隨機(jī)變量) 可用統(tǒng)計(jì)方法分析 例如:收入與消費(fèi)之間的關(guān)系,沒有關(guān)系 不用分析 例如: 收入與天氣的關(guān)系,2、相關(guān)關(guān)系, 相關(guān)關(guān)系的描述 最直觀的描述方式坐標(biāo)圖(散布圖、散點(diǎn)圖),函數(shù)關(guān)系(線性),相關(guān)關(guān)系(線性),沒有關(guān)系,相關(guān)關(guān)系(非線性),相關(guān)關(guān)系的類型, 從涉及的變量數(shù)量看 簡單相關(guān) 多重相關(guān)(復(fù)相關(guān)) 從變量相關(guān)關(guān)系的表現(xiàn)形式看 線性相關(guān)散布圖接近一條直線 非線性相關(guān)散布圖接近一條曲線 從變量相關(guān)關(guān)系變化的方向看 正相關(guān)

4、變量同方向變化,同增同減 負(fù)相關(guān)變量反方向變化,一增一減 不相關(guān),3、相關(guān)程度的度量相關(guān)系數(shù),如果 和 總體的全部數(shù)據(jù)都已知, 和 的方差和 協(xié)方差也已知,則 X和Y的總體線性相關(guān)系數(shù): 其中: -X 的方差 -Y的方差 -X和Y的協(xié)方差 如果只知道 和 的樣本觀測(cè)值,則 X和Y的樣本線性相關(guān)系數(shù): 其中: 和 分別是變量X和Y的樣本觀測(cè)值, 和 分別是變量 X 和Y 樣本值的平均值。,特點(diǎn): 線性相關(guān)系數(shù)(包括總體和樣本相關(guān)系數(shù))只反映變量間的線性相關(guān)程度,不能說明非線性相關(guān)關(guān)系。 X和Y 都是相互對(duì)稱的隨機(jī)變量, , 注意: 對(duì)于特定的總體來說, 和 的分布是既定的,總體相關(guān)系數(shù) 是客觀存

5、在的特定數(shù)值。 總體的兩個(gè)變量 和 的全部數(shù)值通常不可能直接觀測(cè),所以總體相關(guān)系數(shù)一般是未知的。 樣本相關(guān)系數(shù) 是隨抽樣而變動(dòng)的隨機(jī)變量,是總體相關(guān)系數(shù)的樣本估計(jì)值。,對(duì)相關(guān)系數(shù)的正確理解和使用,只是相關(guān)分析還不能達(dá)到經(jīng)濟(jì)計(jì)量分析的目的,相關(guān)分析的局限: 相關(guān)系數(shù)只能反映變量間的線性相關(guān)程度,不能確 定變量間的因果關(guān)系 相關(guān)系數(shù)只能說明兩個(gè)變量線性相關(guān)的方向和程度,不 能說明相關(guān)關(guān)系具體接近哪條直線,也就不能說明一個(gè) 變量的變動(dòng)會(huì)導(dǎo)致另一個(gè)變量變動(dòng)的具體數(shù)量規(guī)律。 計(jì)量經(jīng)濟(jì)學(xué)關(guān)心的問題: 是經(jīng)濟(jì)變量間的因果關(guān)系以及隱藏在隨機(jī)性后面的具 體統(tǒng)計(jì)規(guī)律性 在這方面回歸分析方法可以發(fā)揮更為重要的作用。

6、,4、回歸分析,回歸的古典意義: 高爾頓遺傳學(xué)的回歸概念 ( 父母身高與子女身高的關(guān)系) 子女的身高有向人的平均身高回歸的趨勢(shì) 回歸的現(xiàn)代意義: 一個(gè)被解釋變量對(duì)若干個(gè) 解釋變量依存關(guān)系的研究 回歸的目的(實(shí)質(zhì)): 由固定的解釋變量去估計(jì) 被解釋變量的平均值,注意明確幾個(gè)概念(為深刻理解“回歸”) 被解釋變量Y的條件分布和條件概率: 當(dāng)解釋變量X取某固定值時(shí)(條件),Y的值不確定,Y的不同取值會(huì)形成一定的分布,這是Y的條件分布。 X取某固定值時(shí),Y取不同值的概率稱為條件概率。 被解釋變量Y的條件期望: 對(duì)于X 的每一個(gè)取值, 對(duì)Y所形成的分布確 定其期望或均值,稱 為Y的條件期望或條件均 值,

7、用 表示。 注意:Y的條件期望是隨X的變動(dòng)而變動(dòng)的,Y,X,回歸線:對(duì)于每一個(gè)X的取值 ,都有Y的條件期望 與之對(duì)應(yīng),代表Y的條件期望的點(diǎn)的軌跡形成的直線或曲線稱為回歸線。 回歸函數(shù):被解釋變量Y 的條件期望 隨 解釋變量X的變化而有規(guī)律 的變化,如果把Y的條件期 望表現(xiàn)為 X 的某種函數(shù) , 這個(gè)函數(shù)稱為回歸函數(shù)。 回歸函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù),X,Y,舉例: 假如已知由100個(gè)家庭構(gòu)成的總體的數(shù)據(jù) (單位:元),二、總體回歸函數(shù)(PRF),16,家庭消費(fèi)支出的條件期望與家庭收入的關(guān)系的圖形:,對(duì)于本例的總體,家庭消費(fèi)支出的條件期望 與家庭收入 基本是線性關(guān)系, 可以把家庭消費(fèi)

8、支出的條件均值表示為家庭收入的線性函數(shù):,17,1. 總體回歸函數(shù)的概念 前提:假如已知所研究的經(jīng)濟(jì)現(xiàn)象的總體的被解釋變量Y 和解釋變量X的每個(gè)觀測(cè)值(通常這是不可能的?。?,那 么,可以計(jì)算出總體被解釋變量Y的條件期望 , 并將其表現(xiàn)為解釋變量X的某種函數(shù) 這個(gè)函數(shù)稱為總體回歸函數(shù)(PRF) 本質(zhì): 總體回歸函數(shù)實(shí)際上表現(xiàn)的是特定總體中被解釋變 量隨解釋變量的變動(dòng)而變動(dòng)的某種規(guī)律性。 計(jì)量經(jīng)濟(jì)學(xué)的根本目的是要探尋變量間數(shù)量關(guān)系的規(guī)律,也 就是要去尋求總體回歸函數(shù)。,18,條件期望表現(xiàn)形式 例如Y的條件期望 是解 釋變量X的線性函數(shù),可表示為: 個(gè)別值表現(xiàn)形式(隨機(jī)設(shè)定形式) 對(duì)于一定的 ,Y的

9、各個(gè)別值 并不一定等于條件期望,而 是分布在 的周圍,若令各個(gè) 與條件期望 的 偏差為 ,顯然 是個(gè)隨機(jī)變量 則有,2.總體回歸函數(shù)的表現(xiàn)形式,PRF,3.如何理解總體回歸函數(shù),作為總體運(yùn)行的客觀規(guī)律,總體回歸函數(shù)是客觀存在 的,但在實(shí)際的經(jīng)濟(jì)研究中總體回歸函數(shù)通常是未知的, 只能根據(jù)經(jīng)濟(jì)理論和實(shí)踐經(jīng)驗(yàn)去設(shè)定。 計(jì)量經(jīng)濟(jì)學(xué)研究中“計(jì)量”的根本目的就是要尋求總體 回歸函數(shù)。 我們所設(shè)定的計(jì)量模型實(shí)際就是在設(shè)定總體回歸函 數(shù)的具體形式。 總體回歸函數(shù)中 Y 與 X 的關(guān)系可以是線性的,也可以 是非線性的。,19,20,計(jì)量經(jīng)濟(jì)學(xué)中,線性回歸模型的“線性” 有兩種解釋: 就變量而言是線性的 Y的條件

10、期望(均值)是X的線性函數(shù) 就參數(shù)而言是線性的 Y的條件期望(均值)是參數(shù)的線性函數(shù) 例如: 對(duì)變量、參數(shù)均為“線性” 對(duì)參數(shù)“線性”,對(duì)變量”非線性” 對(duì)變量“線性”,對(duì)參數(shù)”非線性” 注意:在計(jì)量經(jīng)濟(jì)學(xué)中,線性回歸模型主要指就參數(shù)而言是“線性”的,因?yàn)橹灰獙?duì)參數(shù)而言是線性的,都可以用類似的方法去估計(jì)其參數(shù),都可以歸于線性回歸。,“線性”的判斷,三、隨機(jī)擾動(dòng)項(xiàng)u,概念 在總體回歸函數(shù)中,各 個(gè) 的值與其條件期望 的偏差 有很重 要的意義。若只有 影響Y, 與 不應(yīng)有偏差。 若偏差 存在,說明還有其他影響因素, 實(shí)際代表了排除在模型以外的所有因素對(duì) Y 的影響。 性質(zhì) 是其期望為 0 有一定分

11、布的隨機(jī)變量 重要性:隨機(jī)擾動(dòng)項(xiàng)的性質(zhì)決定著計(jì)量經(jīng)濟(jì)分析結(jié) 果的性質(zhì)和計(jì)量經(jīng)濟(jì)方法的選擇,21,引入隨機(jī)擾動(dòng)項(xiàng) 的原因,是未知影響因素的代表(理論的模糊性) 是無法取得數(shù)據(jù)的已知影響因素的代表(數(shù)據(jù)欠缺) 是眾多細(xì)小影響因素的綜合代表(非系統(tǒng)性影響) 模型可能存在設(shè)定誤差(變量、函數(shù)形式的設(shè)定) 歸并誤差(不同種類糧食不合理的歸并為“糧食產(chǎn)量”) 模型中變量可能存在觀測(cè)誤差(變量數(shù)據(jù)不符合實(shí)際) 變量可能有內(nèi)在隨機(jī)性(人類經(jīng)濟(jì)行為的內(nèi)在隨機(jī)性),22,四、樣本回歸函數(shù)(SRF),樣本回歸線: 對(duì)于X的一定值,取得Y 的樣本觀測(cè)值,可計(jì)算其條件 均值,樣本觀測(cè)值條件均值的軌跡,稱為樣本回歸線。

12、樣本回歸函數(shù): 如果把被解釋變量Y的樣本條件 均值 表示為解釋變量X的某種 函數(shù),這個(gè)函數(shù)稱為樣本回歸函 數(shù)(SRF)。,23,X,Y,SRF,24,樣本回歸函數(shù)如果為線性函數(shù),可表示為 其中: 是與 相對(duì)應(yīng)的 Y 的樣本條件均值 和 分別是樣本回歸函數(shù)的參數(shù) 個(gè)別值(實(shí)際值)形式: 被解釋變量Y的實(shí)際觀測(cè)值 不完全等于樣本條件均值 ,二者之差用 表示, 稱為剩余項(xiàng)或殘差項(xiàng): 則 或,樣本回歸函數(shù)的函數(shù)形式,條件均值形式:,對(duì)樣本回歸的理解,如果能夠通過某種方式獲得 和 的數(shù)值,顯然: 和 是對(duì)總體回歸函數(shù)參數(shù) 和 的估計(jì) 是對(duì)總體條件期望 的估計(jì) 在概念上類似總體回歸函數(shù)中的 ,可視 為對(duì)

13、的估計(jì)。,25,對(duì)比: 總體回歸函數(shù) 樣本回歸函數(shù),樣本回歸函數(shù)的特點(diǎn),樣本回歸線隨抽樣波動(dòng)而變化: 每次抽樣都能獲得一個(gè)樣本,就可以擬合一條樣本回歸 線,(SRF不唯一) Y SRF1 SRF2 樣本回歸函數(shù)的函數(shù)形式 應(yīng)與設(shè)定的總體回歸函數(shù)的 函數(shù)形式一致。 X 樣本回歸線只是樣本條件均值的軌跡,還不是總體回歸 線,它至多只是未知的總體回歸線的近似表現(xiàn)。,26,樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系,SRF PRF A X,27,28,目的: 計(jì)量經(jīng)濟(jì)分析的目標(biāo)是尋求總體回歸函數(shù)。即用樣本回歸函數(shù)SRF去估計(jì)總體回歸函數(shù)PRF。 由于樣本對(duì)總體總是存在代表性誤差,SRF 總會(huì) 過高或過低估計(jì)PR

14、F。 要解決的問題: 尋求一種規(guī)則和方法,使其得到的SRF的參數(shù) 和 盡可能“接近”總體回歸函數(shù)中的參數(shù) 和 的真實(shí)值。這樣的“規(guī)則和方法”有多種,如矩估計(jì)、極大似然估計(jì)、最小二乘估計(jì)等。其中最常用的是最小二乘法。,回歸分析的目的,第二節(jié) 簡單線性回歸模型的最小二乘估計(jì),用樣本去估計(jì)總體回歸函數(shù),總要使用特定的方法,而任 何估計(jì)參數(shù)的方法都需要有一定的前提條件假定條件 一、簡單線性回歸的基本假定 為什么要作基本假定? 只有具備一定的假定條件,所作出的估計(jì)才具有良好的統(tǒng)計(jì)性質(zhì)。 因?yàn)槟P椭杏须S機(jī)擾動(dòng)項(xiàng),估計(jì)的參數(shù)是隨機(jī)變量,顯然參數(shù)估計(jì)值的分布與擾動(dòng)項(xiàng)的分布有關(guān),只有對(duì)隨機(jī)擾動(dòng)的分布作出假定,才

15、能比較方便地確定所估計(jì)參數(shù)的分布性質(zhì),也才可能進(jìn)行假設(shè)檢驗(yàn)和區(qū)間估計(jì)等統(tǒng)計(jì)推斷。 假定分為:對(duì)模型和變量的假定對(duì)隨機(jī)擾動(dòng)項(xiàng)的假定,29,1.對(duì)模型和變量的假定,如對(duì)于 假定模型設(shè)定是正確的(變量和模型無設(shè)定誤差) 假定解釋變量X在重復(fù)抽樣中取固定值。 假定解釋變量X是非隨機(jī)的,或者雖然X是隨機(jī)的, 但與擾動(dòng)項(xiàng)u是不相關(guān)的。(從變量X角度看) 注意: 解釋變量非隨機(jī)在自然科學(xué)的實(shí)驗(yàn)研究中容易 滿足,經(jīng)濟(jì)領(lǐng)域變量的觀測(cè)是被動(dòng)不可控的,X非隨機(jī) 的假定不容易滿足。,30,2.對(duì)隨機(jī)擾動(dòng)項(xiàng)u的假定,假定1:零均值假定: 在給定X的條件下, 的條件期望為零 假定2:同方差假定: 在給定X的條件下,的條件

16、方差為某個(gè)常數(shù),31,32,假定3:無自相關(guān)假定: 隨機(jī)擾動(dòng)項(xiàng) 的逐次值互不相關(guān) 假定4:解釋變量 是非隨機(jī)的,或者雖然 是隨 機(jī)的但與擾動(dòng)項(xiàng) 不相關(guān) (從隨機(jī)擾動(dòng) 角度看),33,假定5:對(duì)隨機(jī)擾動(dòng)項(xiàng)分布的正態(tài)性假定, 即假定 服從均值為零、方差為 的正態(tài)分布 (說明:正態(tài)性假定不影響對(duì)參數(shù)的點(diǎn)估計(jì),所以有時(shí)不列入基本假定,但這對(duì)確定所估計(jì)參數(shù)的分布性質(zhì)是需要的。且根據(jù)中心極限定理,當(dāng)樣本容量趨于無窮大時(shí), 的分布會(huì)趨近于正態(tài)分布。所以正態(tài)性假定有合理性) 注意: 并不是參數(shù)估計(jì)的每一具體步驟都要用到所有的假定,但對(duì)全部假定有完整的認(rèn)識(shí),對(duì)學(xué)習(xí)計(jì)量經(jīng)濟(jì)學(xué)的原理是有益的。,在對(duì) 的基本假定下

17、Y 的分布性質(zhì),由于 其中的 和 是非隨機(jī)的,因此 的分布性質(zhì)決定了 的分布性質(zhì)。 對(duì) 的一些假定可以等價(jià)地表示為對(duì) 的假定: 假定1:零均值假定 假定2:同方差假定 假定3:無自相關(guān)假定 假定5:正態(tài)性假定,34,二、普通最小二乘法(OLS) (rdinary Least Squares),1. OLS的基本思想: 對(duì)于 不同的估計(jì)方法可以得到不同的樣本回歸參數(shù) 和 ,所估計(jì)的 也就不同。 理想的估計(jì)方法應(yīng)使估計(jì)的 與真實(shí)的 的差(即剩余 )總的來說越小越好 因 可正可負(fù),總有 ,所以可以取 最 小,即 在觀測(cè)值Y和X確定時(shí), 的大小決定于 和 。,35,2. 正規(guī)方程和估計(jì)式,用克萊姆法則

18、求解得以觀測(cè)值表現(xiàn)的OLS估計(jì)式:,36,取偏導(dǎo)數(shù)并令其為0,可得正規(guī)方程,或整理得,即,37,為表達(dá)得更簡潔,或者用離差形式OLS估計(jì)式: 容易證明 由正規(guī)方程: 注意:其中: 本課程中大寫的 和 均表示觀測(cè)值; 小寫的 和 均表示觀測(cè)值的離差 而且由 樣本回歸函數(shù)可用離差形式寫為,用離差表現(xiàn)的OLS估計(jì)式,3. OLS回歸線的數(shù)學(xué)性質(zhì) 可以證明:(見教材P33P34證明) (證明過程用到OLS正規(guī)方程的結(jié)論,但與基本假定無關(guān)),回歸線通過樣本均值 估計(jì)值 的均值等于實(shí) 際觀測(cè)值 的均值 剩余項(xiàng) 的均值為零,38,(由OLS第一個(gè)正規(guī)方程直接得到),(由OLS正規(guī)方程 兩邊同除n得到),被解

19、釋變量估計(jì)值 與剩余項(xiàng) 不相關(guān),解釋變量 與剩余項(xiàng) 不相關(guān),由OLS正規(guī)方程有:,(注意:紅色的項(xiàng)為0),4. OLS估計(jì)式的統(tǒng)計(jì)性質(zhì),回顧第1章:參數(shù)估計(jì)式的優(yōu)劣需要有評(píng)價(jià)的標(biāo)準(zhǔn) 參數(shù)無法通過觀測(cè)直接確定,只能通過樣本估計(jì),但因 存在抽樣波動(dòng),參數(shù)估計(jì)值不一定等于總體參數(shù)的真實(shí)值。 參數(shù)估計(jì)方法及所確定的估計(jì)式不一定完備,不一定 能得到總體參數(shù)的真實(shí)值,需要對(duì)估計(jì)方法作評(píng)價(jià)與選擇。 比較不同估計(jì)方法的估計(jì)結(jié)果時(shí),需要有一定的評(píng)價(jià)標(biāo)準(zhǔn) 基本要求:參數(shù)估計(jì)值應(yīng)盡可能地接近總體參數(shù)的真實(shí)值 估計(jì)準(zhǔn)則:“盡可能地接近” 原則 決定于參數(shù)估計(jì)式的統(tǒng)計(jì)性質(zhì):無偏性、有效性、一致性等。,40,41,(1)

20、 無偏性,前提:重復(fù)抽樣中估計(jì)方法固定、樣本數(shù)不變、經(jīng) 重復(fù)抽樣的觀測(cè)值,可得一系列參數(shù)估計(jì)值 , 的分布稱為 的抽樣分布,其密度函數(shù)記為 如果 稱 是參數(shù)的無偏估計(jì)式,否則 則稱 是有偏的估計(jì),其偏倚為 (見圖2),42,概 率 密 度 估計(jì)值 偏倚,圖2,43,(2)有效性,前提:樣本相同、用不同的方法估計(jì)參數(shù),可以找到若干 個(gè)不同的無偏估計(jì)式 目標(biāo): 努力尋求其抽樣分布具有最小方差的估計(jì)式 (見圖3) 既是無偏的同時(shí)又具有最小方差特性的估計(jì)式,稱為最佳 (有效)估計(jì)式。,44,概 率 密 度,圖 3,估計(jì)值,(3)漸近性質(zhì)(大樣本性質(zhì)),思想:當(dāng)樣本容量較小時(shí),有時(shí)很難找到方差最小的無偏

21、估計(jì), 需要考慮樣本擴(kuò)大后的性質(zhì)(估計(jì)方法不變,樣本數(shù)逐步增大) 一致性: 當(dāng)樣本容量 n 趨于無窮大時(shí),如果估計(jì)式 依概率收斂于總體參數(shù)的真實(shí)值,就稱這個(gè)估計(jì)式 是 的一致估計(jì)式。即 或 (漸近無偏估計(jì)式是當(dāng)樣本容量變得足夠大時(shí)其偏倚趨于零的 估計(jì)式) (見圖4) 漸近有效性:當(dāng)樣本容量 n 趨于無窮大時(shí),在所有的一致估計(jì) 式中,具有最小的漸近方差。,45,46,概 率 密 度 估計(jì)值,圖 4,4.分析OLS估計(jì)式的統(tǒng)計(jì)性質(zhì),先明確幾點(diǎn): 由OLS估計(jì)式可以看出 都由可觀測(cè)的樣本值 和 唯一表示。 因存在抽樣波動(dòng),OLS估計(jì) 是隨機(jī)變量 OLS估計(jì)式是點(diǎn)估計(jì)式,47,OLS估計(jì)是否符合“盡可

22、能地接近總體參數(shù)真實(shí)值”的要求呢?,1、 線性特征 是Y的線性函數(shù),2、 無偏特性 可以證明 (證明見教材P37),48,OLS估計(jì)式的統(tǒng)計(jì)性質(zhì)高斯定理,3、 最小方差特性 (證明見教材P68附錄21) 可以證明:在所有的線性無偏估計(jì)中,OLS估計(jì) 具有最小方差 (注意:無偏性和最小方差性的證明中用到了基本假定1-假定4) 結(jié)論(高斯定理): 在古典假定條件下,OLS估計(jì)式是最佳線性無偏估計(jì)式(BLUE),49,第三節(jié) 擬合優(yōu)度的度量,概念: 樣本回歸線是對(duì)樣本數(shù)據(jù)的 一種擬合。 不同的模型(不同函數(shù)形式) 可擬合出不同的回歸線 相同的模型用不同方法估計(jì) 參數(shù),可以擬合出不同的回歸線 擬合的回

23、歸線與樣本觀測(cè)值總是有偏離。樣本回歸 線對(duì)樣本觀測(cè)數(shù)據(jù)擬合的優(yōu)劣程度稱為擬合優(yōu)度 如何度量擬合優(yōu)度呢? 擬合優(yōu)度的度量建立在對(duì) Y 的總變差分解的基礎(chǔ)上,50,一、總變差的分解,分析Y的觀測(cè)值 、估計(jì)值 與平均值 有以下關(guān)系 將上式兩邊平方加總,可證得(提示:交叉項(xiàng) ) (TSS) (ESS) (RSS) 或者表示為 總變差 (TSS):被解釋變量Y的觀測(cè)值與其平均值的離差平 方和(總平方和)(說明 Y 的變動(dòng)程度) 解釋了的變差 (ESS):被解釋變量Y的估計(jì)值與其平均值的 離差平方和(回歸平方和) 剩余平方和 (RSS):被解釋變量觀測(cè)值與估計(jì)值之差的平方 和(未解釋的平方和),51,Y

24、X,52,變差分解的圖示(以某一個(gè)觀測(cè)值為例),二、可決系數(shù),以TSS同除總變差等式兩邊: 或 定義:回歸平方和(解釋了的變差ESS) 在總變 差(TSS) 中所占的比重稱為可決系數(shù),用 或 表示:,53,或,可決系數(shù)的作用,可決系數(shù)越大,說明在總變差中由模型作出了解釋的部分占的比重越大,模型擬合優(yōu)度越好。反之可決系數(shù)越小,說明模型對(duì)樣本觀測(cè)值的擬合程度越差。 可決系數(shù)的特點(diǎn): 可決系數(shù)取值范圍: 隨抽樣波動(dòng),樣本可決系數(shù) 是隨抽樣而變 動(dòng)的隨機(jī)變量 可決系數(shù)是非負(fù)的統(tǒng)計(jì)量,54,可決系數(shù)與相關(guān)系數(shù)的數(shù)值關(guān)系,聯(lián)系:數(shù)值上可決系數(shù)是相關(guān)系數(shù)的平方,55,可決系數(shù)與相關(guān)系數(shù)的區(qū)別,區(qū)別: 可決系

25、數(shù) 相關(guān)系數(shù) 就模型而言 就兩個(gè)變量而言 說明解釋變量對(duì)被解釋 說明兩變量線性依存程度 變量的解釋程度 度量的不對(duì)稱的因果關(guān)系 度量的對(duì)稱的相關(guān)關(guān)系 取值 0 1 取值 -1r1 有非負(fù)性 可正可負(fù),56,運(yùn)用可決系數(shù)時(shí)應(yīng)注意:, 可決系數(shù)只是說明列入模型的所有解釋變量對(duì) 被解釋變量的聯(lián)合的影響程度,不說明模型中每個(gè)解 釋變量的影響程度(在多元中) 如果回歸的主要目的是經(jīng)濟(jì)結(jié)構(gòu)分析,不能只追 求高的可決系數(shù),而是要得到總體回歸系數(shù)可信的 估計(jì)量。可決系數(shù)高并不一定每個(gè)回歸系數(shù)都可信任。 如果研究的主要目的只是為了預(yù)測(cè)被解釋變量的值, 不是為了正確估計(jì)回歸系數(shù),一般可考慮有較高的可 決系數(shù)。,5

26、7,58,第四節(jié) 回歸系數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),為什么要作區(qū)間估計(jì)? 運(yùn)用OLS法可以估計(jì)出參數(shù)的一個(gè)估計(jì)值,但OLS估計(jì)只是通過樣本得到的點(diǎn)估計(jì),它不一定等于真實(shí)參數(shù),還需要尋求真實(shí)參數(shù)的可能范圍,并說明其可靠性。 為什么要作假設(shè)檢驗(yàn)? OLS 估計(jì)只是用樣本估計(jì)的結(jié)果,是否可靠? 是否抽樣的偶然結(jié)果呢?還有待統(tǒng)計(jì)檢驗(yàn)。 區(qū)間估計(jì)和假設(shè)檢驗(yàn)都是建立在確定參數(shù)估計(jì)值 概率分布性質(zhì)的基礎(chǔ)上。,59,一、OLS估計(jì)的分布性質(zhì) 基本思想 是隨機(jī)變量,必須確定其分布性質(zhì)才可能進(jìn)行區(qū)間估計(jì)和假設(shè)檢驗(yàn) 怎樣確定 的分布性質(zhì)呢? 是服從正態(tài)分布的隨機(jī)變量,決定 了 也是服從正態(tài)分布的隨機(jī)變量; 是 的線性函

27、數(shù),決定了 也服從正態(tài)分布 正態(tài) 正態(tài) 正態(tài) 只要確定 的期望和方差,即可確定 的分布性質(zhì),線性特征,60, 的期望: (已證明是無偏估計(jì)) 的方差和標(biāo)準(zhǔn)誤差 (證明見P38,要求看懂!) (標(biāo)準(zhǔn)誤差是方差的平方根) 注意:以上各式中 均未知,但是個(gè)常數(shù),其余均是已 知的樣本觀測(cè)值,這時(shí) 和 都不是隨機(jī)變量。,的期望和方差,61,基本思想: 是 的方差,而 不能直接觀測(cè),只能從由樣本得到的 去獲得有關(guān) 的某些信息,去對(duì) 作出估計(jì)。 可以證明(見附錄2.2)其無偏估計(jì)為 (n-2為自由度, 即可自由變化的樣本觀測(cè)值個(gè)數(shù)) 注意區(qū)別: 是未知的確定的常數(shù); 是由樣本信息估計(jì)的,是個(gè)隨機(jī)變量,對(duì)隨機(jī)

28、擾動(dòng)項(xiàng)方差 的估計(jì),62,對(duì) 作標(biāo)準(zhǔn)化變換,為什么要對(duì) 作標(biāo)準(zhǔn)化變換? 在 正態(tài)性假定下,由前面的分析已知 但在對(duì)一般正態(tài)變量 作實(shí)際分析時(shí),要具體確定 的取值及對(duì)應(yīng)的概率,要通過正態(tài)分布密度函數(shù)或 分布函數(shù)去計(jì)算是很麻煩的,為了便于直接利用“標(biāo) 準(zhǔn)化正態(tài)分布的臨界值”,需要對(duì) 作標(biāo)準(zhǔn)化變換。 標(biāo)準(zhǔn)化的方式:,分布函數(shù),分布函數(shù),63,在 已知時(shí)對(duì) 作標(biāo)準(zhǔn)化變換,所得Z統(tǒng)計(jì)量為標(biāo)準(zhǔn)正態(tài)變量。,1. 已知時(shí),對(duì) 作標(biāo)準(zhǔn)化變換,注意:這時(shí) 和 都不是隨機(jī)變量(X、 、 都是非隨機(jī)的),64,條件: 當(dāng) 未知時(shí),可用 (隨機(jī)變量)代替 去估計(jì)參數(shù)的標(biāo)準(zhǔn)誤差。這時(shí)參數(shù)估計(jì)的標(biāo)準(zhǔn)誤差是個(gè)隨機(jī)變量。 樣本

29、為大樣本時(shí),作標(biāo)準(zhǔn)化變換所得的統(tǒng)計(jì)量Zk,也可以 視為標(biāo)準(zhǔn)正態(tài)變量(根據(jù)中心極限定理)。 樣本為小樣本時(shí),,用估計(jì)的參數(shù)標(biāo)準(zhǔn)誤差對(duì) 作標(biāo)準(zhǔn)化變換,所得的統(tǒng) 計(jì)量用t表示,這時(shí)t將不再服從正態(tài)分布,而是服從 t 分布(注意這時(shí)分母是隨機(jī)變量) :,2. 未知時(shí),對(duì) 作標(biāo)準(zhǔn)化變換,二、回歸系數(shù)的區(qū)間估計(jì),基本思想: 對(duì)參數(shù)作出的點(diǎn)估計(jì)是隨機(jī)變量,雖然是無偏估計(jì),但 還不能說明這種估計(jì)的可靠性和精確性。如果能找到包含 真實(shí)參數(shù)的一個(gè)范圍,并確定這樣的范圍包含參數(shù)真實(shí)值 的可靠程度,將是對(duì)真實(shí)參數(shù)更深刻的認(rèn)識(shí)。 方法:如果在確定參數(shù)估計(jì)式概率分布性質(zhì)的基礎(chǔ)上,可 找到兩個(gè)正數(shù)和 ,能使得 這樣的區(qū)間包

30、含真實(shí) 的概率為 ,即 這樣的區(qū)間稱為所估計(jì)參數(shù)的置信區(qū)間。 討論:“如果已經(jīng)得出了 的特定估計(jì)值,并確定了某個(gè)置信區(qū)間,這說明真實(shí)參數(shù)落入這個(gè)區(qū)間的概率為1- 。這種說法對(duì)嗎?,65,怎樣正確理解置信區(qū)間?,注意: 是未知但確定的數(shù), 是隨抽樣而變化的隨機(jī)區(qū)間。 從重復(fù)抽樣的觀點(diǎn)看,每次抽樣都可構(gòu)造一個(gè)區(qū)間,象這樣構(gòu)造的區(qū)間,平均來說有( )比例的次數(shù)包含 的真實(shí)值。但對(duì)特定樣本,一但估計(jì)出特定的 ,區(qū)間 就不再是隨機(jī)的,而是特定的,這時(shí)它或者包含 (包含的概率為1),或者不包含 (包含的概率為0)。,問題: 是給定的,如何去尋找合適的 呢?,67,樣本容量充分大,樣本容量較小,總體方差 已

31、知,總 體 方 差 未 知,Z將接近 標(biāo)準(zhǔn)正態(tài)分布,服從 t 分布,三 種 情 況,基本思想:利用 標(biāo)準(zhǔn)化后統(tǒng)計(jì)量的分布性質(zhì)去尋求 :,置信區(qū)間:,標(biāo)準(zhǔn)正態(tài)分布,回歸系數(shù)的區(qū)間估計(jì) (分三種情況尋找合適的 ),(1) 當(dāng)總體方差 已知時(shí)( Z 服從正態(tài)分布) 取定 (例如 =0.05),查標(biāo)準(zhǔn)正態(tài)分布表得與 對(duì) 應(yīng)的臨界值z(mì) (例如z為1.96),則標(biāo)準(zhǔn)化變量Z*(統(tǒng)計(jì)量) 因?yàn)?或 即,68,(2)當(dāng)總體方差 未知,而樣本容量充分大時(shí),方法:可用無偏估計(jì) 去代替未知的 , 由于樣本容量充分大,標(biāo)準(zhǔn)化變量Z*(統(tǒng)計(jì)量)將 接近標(biāo)準(zhǔn)正態(tài)分布 注意:這里的“ ”,表示“估計(jì)的”, 這時(shí)區(qū)間估計(jì)的方

32、式也可利用標(biāo)準(zhǔn)正態(tài)分布 只是這時(shí),69,(3)當(dāng)總體方差 未知,且樣本容量較小時(shí),方法:用無偏估計(jì) 去代替未知的 , 由于樣本容量較小,“標(biāo)準(zhǔn)化變量” t (統(tǒng)計(jì)量)不再 服從正態(tài)分布,而服從 t 分布。 這時(shí)可用 t 分布去建立參數(shù)估計(jì)的置信區(qū)間。選定, 查 t 分布表得顯著性水平為 ,自由度為n-2的臨界值 (n-2) ,則有 即,70,例1:研究某市城鎮(zhèn)居民人均鮮蛋需求量Y(公斤)與人均可支配收入X(元,1980年不變價(jià)計(jì))的關(guān)系 設(shè)定模型: 1995-2005年樣本數(shù)據(jù): 估計(jì)參數(shù):,計(jì)算可決系數(shù) 例1:由前面的估計(jì)結(jié)果可計(jì)算出 由數(shù)據(jù)Y 可計(jì)算出: 則,估計(jì)結(jié)果:,估計(jì) : 給定 查

33、df=n-2=9的t分布臨界值 參數(shù)區(qū)間估計(jì): 若給定 查df=9的t分布臨界值,73,若給定 則,若給定 則,則,74,74,統(tǒng)計(jì)量 t,計(jì)算的統(tǒng)計(jì)量為:,相對(duì)于顯著性水平 的臨界值為: (單側(cè))或 (雙側(cè)),基本概念回顧: 臨界值與概率、大概率事件與小概率事件,0,(大概率事件),(小概率事件),目的:簡單線性回歸中,檢驗(yàn)X對(duì)Y是否真有顯著影響,三、回歸系數(shù)的假設(shè)檢驗(yàn),75,雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn),76,76,1. 假設(shè)檢驗(yàn)的基本思想,在某種條件下,在一次抽樣中,大概率事件出現(xiàn)被認(rèn)為是合理的,而小概率事件被認(rèn)為基本不會(huì)發(fā)生,如果小概率事件竟然發(fā)生了,認(rèn)為是不合理的。 在事先作出的某種原假設(shè)成立

34、的條件下,利用樣本構(gòu)造適當(dāng)統(tǒng)計(jì)量(一次抽樣的結(jié)果),并確定統(tǒng)計(jì)量的抽樣分布。給定顯著性水平,構(gòu)造一個(gè)小概率事件。如果在一次抽樣中該小概率事件竟然發(fā)生,就認(rèn)為原假設(shè)不真實(shí),從而拒絕原假設(shè),不拒絕備擇假設(shè)。反之,如果大概率事件發(fā)生,則不拒絕原假設(shè)。,77,2. 回歸系數(shù)的檢驗(yàn)方法,確立假設(shè):原假設(shè)為 備擇假設(shè)為 (本質(zhì):檢驗(yàn) 是否為0,即檢驗(yàn) 是否對(duì)Y有顯著影響) (1)當(dāng)已知 或樣本容量足夠大時(shí) 可利用正態(tài)分布作Z檢驗(yàn) 給定 , 查正態(tài)分布表得臨界值 Z 如果 (大概率事件發(fā)生)則不拒絕原假設(shè) 如果 或 (小概率事件發(fā)生)則 拒絕原假設(shè),78,(2) 當(dāng) 未知,且樣本容量較小時(shí),只能用 去代替

35、,可利用 t分布作 t 檢驗(yàn):,給定 , 查 t 分布表得 如果 或者 (小概率事件發(fā)生) 則拒絕原假設(shè) 而不拒絕備擇假設(shè) 如果 (大概率事件發(fā)生) 則不拒絕原假設(shè),用 P 值判斷參數(shù)的顯著性,假設(shè)檢驗(yàn)的 p 值: p 值是基于既定的樣本數(shù)據(jù)所計(jì)算的統(tǒng)計(jì)量,原假設(shè)可以被拒絕的最高顯著性水平。 統(tǒng)計(jì)分析軟件中通常都給出了檢驗(yàn)的 p 值,P,統(tǒng)計(jì)量 t,相對(duì)于計(jì)算的統(tǒng)計(jì)量 :,相對(duì)于顯著性水平 的臨界值: 或,注意: t檢驗(yàn)是比較 和 用P值檢驗(yàn)是比較 和 p,與 相對(duì)應(yīng),與 P 相對(duì)應(yīng),80,用 P 值判斷參數(shù)顯著性的方法,方法:將給定的顯著性水平 與 p 值比較: 若 值,則在顯著性水平 下拒

36、絕原假設(shè) ,即認(rèn)為 對(duì) Y 有顯著影響 若 值,則在顯著性水平 下不拒絕原假設(shè) ,即認(rèn)為 對(duì) Y 沒有顯著影響 規(guī)則:當(dāng) 時(shí),P值越小,越能拒絕原 假設(shè),81,舉例:對(duì)例1參數(shù)的顯著性檢驗(yàn) 給定 查df=9的 t分布臨界值 計(jì)算統(tǒng)計(jì)量 判斷:因 拒絕 說明 顯著不為0, X對(duì)Y 確有顯著影響 用P值檢驗(yàn): (需要確定與 對(duì)應(yīng)的P值) 由 ,df=9,查 t 分布表知道P0.0005(t= 4.781時(shí) ) 因t=5.00時(shí)的P值 0.0005 則在顯著性水平 下更應(yīng)拒絕原假設(shè) 即認(rèn)為 對(duì) Y 有顯著影響,一、極大似然估計(jì)的思想: 舉例:對(duì)一種藥物,藥劑師認(rèn)為有效率為70%。生產(chǎn)該藥物的公司聲稱

37、:有效率為90%,誰的說法更可信呢? 統(tǒng)計(jì)學(xué)家抽取10個(gè)病人,發(fā)現(xiàn)有8人被治愈 若真實(shí)概率為P=0.7時(shí): 產(chǎn)生“10個(gè)病人有8個(gè)治愈” 結(jié)果的概率為:(實(shí)驗(yàn)結(jié)果只有“治愈”和“未治愈”是二項(xiàng)分布),第五節(jié) 簡單線性回歸模型的極大似然估計(jì),82,若真實(shí)概率為P=0.9時(shí),產(chǎn)生“10個(gè)病人有8個(gè)治愈” 結(jié)果的概率為:,統(tǒng)計(jì)學(xué)家判斷:有效率為0.7作為真實(shí)有效率的估計(jì)值比0.9更為可信。(為什么?),極大似然原理:“一個(gè)事件由于與實(shí)際最近似而發(fā)生”,原理:一個(gè)事件之所以會(huì)發(fā)生,是因?yàn)榇嬖谥a(chǎn)生這一事件概率最大的客觀現(xiàn)實(shí)(總體)。 總體的分布規(guī)律是由其分布性質(zhì)和參數(shù)決定的。 樣本觀測(cè)值是從總體中抽取

38、而得到的,從總體中隨機(jī)抽取容量為n的樣本觀測(cè)值時(shí),這n組樣本觀測(cè)值會(huì)以一定的概率出現(xiàn)。 當(dāng)從總體中隨機(jī)抽取n組樣本觀測(cè)值后,要尋求最可能產(chǎn)生該n組樣本的那個(gè)總體的參數(shù)。 最合理的參數(shù)估計(jì)量應(yīng)該是能夠使得從總體中抽取出該n組樣本觀測(cè)值的概率最大。,83,二、簡單線性回歸模型的極大似然估計(jì),在滿足基本假設(shè)的條件下,對(duì)簡單線性回歸模型 若隨機(jī)抽取n組樣本觀測(cè)值( , )(i=1,2,n) 為隨機(jī)變量,其分布特征與參數(shù) 和 及 有關(guān), 已知 假定 服從正態(tài)分布且是獨(dú)立分布的,則: 于是,每個(gè) 的概率密度函數(shù)為 (i=1,2,n),84,1.似然函數(shù) (likelihood function),因?yàn)楦鱾€(gè)

39、 相互獨(dú)立,因此獲得所有n組樣本觀測(cè)值 的聯(lián)合概率(即似然函數(shù))為: 其中未知參數(shù)為 ,為使產(chǎn)生 n個(gè)樣本觀測(cè)值 的聯(lián)合概率最大,可尋求能使該似然函數(shù)極大化的參 數(shù)值,即可求得模型參數(shù)的極大似然估計(jì)量。 為便于取最大化,取對(duì)數(shù)似然函數(shù),因?yàn)樗迫缓瘮?shù)的 極大化與似然函數(shù)的對(duì)數(shù)的極大化是等價(jià)的,所以,,85,(n個(gè)密度函數(shù)的乘積),將對(duì)數(shù)似然函數(shù)對(duì) 求偏導(dǎo)得:,86,令各方程為0,記參數(shù)估計(jì)量為 可得:,使 最大化 等價(jià)于使,最小化,注意到:,產(chǎn)生n組樣本觀測(cè)值的聯(lián)合概率的對(duì)數(shù)(對(duì)數(shù)似然函數(shù))為:,87,(A),(B),(C),經(jīng)簡化,由(A)(B)式有:,這與OLS正規(guī)方程相同,2.簡單線性回歸

40、模型的極大似然估計(jì)量,對(duì)L*求極大值,等價(jià)于對(duì) 求極小值: 解方程得參數(shù)估計(jì)量: 可見,在滿足基本假設(shè)的情況下,模型參數(shù)的最大似 然估計(jì)量與普通最小二乘估計(jì)量是相同的。,88,89,3. 的極大似然估計(jì)(ML),把參數(shù)估計(jì)量 代入(C)式并簡化,得 的極大似然估計(jì):,所以,結(jié)論: 的極大似然估計(jì)(ML)是有偏的。其偏誤因子 是隨 而趨于0的,因此 的ML估計(jì)只是一致估計(jì)量。,因?yàn)?所以 的ML估計(jì)為:,對(duì)比 的OLS估計(jì):,在OLS無偏性證明中有,90,4.極大似然估計(jì)與最小二乘估計(jì)的比較,1.在滿足基本假設(shè)的情況下,模型參數(shù)的最大似 然估計(jì)量與普通最小二乘估計(jì)量是相同的。,的普通最小二乘估計(jì)

41、是無偏估計(jì). 的極大似然估計(jì)(ML)是有偏的。 但 隨 , 是漸近無偏的,即,91,一、過原點(diǎn)的回歸 有時(shí)根據(jù)理論判斷模型可能沒有截距項(xiàng)(常數(shù)項(xiàng)),例如: 弗瑞德曼永久收入假說: 永久消費(fèi)正比于永久收入。 成本分析理論: 生產(chǎn)的可變成本正比于產(chǎn)出。 貨幣主義理論某些假說: 價(jià)格變化率(通貨膨脹率) 正比于貨幣供給變化率。 這時(shí)總體回歸函數(shù)可設(shè)定為: 這是截距項(xiàng)不出現(xiàn)或?yàn)榱愕幕貧w 模型。稱為過原點(diǎn)的回歸。,91,第六節(jié) 線性回歸模型的若干延伸,92,沒有截距項(xiàng)的過原點(diǎn)回歸模型為: 因?yàn)?對(duì) 求偏導(dǎo) 令其為零得 可以證明,92,對(duì)比有截距時(shí):,(注意:正規(guī)方程只有一個(gè)方程),即,過原點(diǎn)的回歸的OL

42、S估計(jì)量,注意:過原點(diǎn)回歸的特點(diǎn),在運(yùn)用過原點(diǎn)回歸模型時(shí)應(yīng)注意以下特點(diǎn): 1)在有截距的模型中,根據(jù)最小二乘原理的正規(guī)方程有: 則 但在截距項(xiàng)不存在時(shí),因?yàn)檎?guī)方程中只有一個(gè)方程, 而沒有 這樣的關(guān)系, 則有可能 從而,93,2)回歸線不通過樣本均值 過原點(diǎn)回歸模型 因?yàn)?有,94,3)估計(jì)值 的均值不等于實(shí)際觀測(cè)值 的均值,這說明過原點(diǎn)回歸最小二乘法的數(shù)學(xué)性質(zhì)不一定成立,由無截距模型的最小二乘正規(guī)方程有: 由正規(guī)方程導(dǎo)出的無偏估計(jì)量為: 由 有 若是 則有 顯然 的估計(jì)是有偏的! 結(jié)論:在過原點(diǎn)的回歸中,如果 成立, OLS估計(jì)則是有偏估計(jì).,95,即,4)如果 ,OLS估計(jì)可能是有偏的,9

43、6,5)有時(shí)零均值假定 不一定滿足 例如對(duì)于 如果: 假如已知 ,對(duì)于有截距的模型,此時(shí)模型可變換為 令 則 可見,有截距的模型可使得隨機(jī)擾動(dòng)具有零均值。而不含截距的模型 變換后成為有截距模型,若堅(jiān)持用無截距模型,則隨機(jī)項(xiàng)零均值不一定能保證。,97,6)有截距模型中 , 總為正 值,即 模型可決系數(shù)總是非負(fù)的。但對(duì)無截距的模型 ,可決系數(shù)可能出現(xiàn)負(fù)值,因此計(jì)算可 決系數(shù)的公式不一定適合于過原點(diǎn)的回歸模型。,一般規(guī)則:除非有充分的理由特別說明,否則模型還是應(yīng)當(dāng)包含常數(shù)項(xiàng)為好。,二、變量度量單位對(duì)回歸的影響,變量的度量單位對(duì)估計(jì)的參數(shù)數(shù)值會(huì)有什么影響? 例如美國1988年-1997年國內(nèi)總投資(Y

44、)與GDP的回歸 (數(shù)據(jù)略): A.當(dāng)總投資(Y)與GDP都以10億美元為度量單位時(shí),估計(jì) 結(jié)果為: B.當(dāng)總投資(Y)仍以10億美元計(jì),而GDP以百萬美元計(jì)時(shí) 估計(jì)結(jié)果為:,98,C.當(dāng)總投資(Y)與GDP都以百萬美元(縮小1000倍)計(jì)時(shí) 估計(jì)結(jié)果為: D.當(dāng)總投資(Y)以百萬美元計(jì),而GDP以10億美元計(jì)時(shí), 估計(jì)結(jié)果為: 注意:與A相比較,截距、斜率系數(shù)、標(biāo)準(zhǔn)誤差、可決系數(shù) 的變化。,99,變量度量單位對(duì)回歸影響的一般規(guī)律,1.當(dāng)被解釋變量測(cè)量單位改變(擴(kuò)大或縮小常數(shù)c倍),而解釋變量測(cè)量單位不變時(shí):OLS截距和斜率的估計(jì)值及標(biāo)準(zhǔn)誤差都縮小或擴(kuò)大為原來的c倍. (如D的情況) 2.當(dāng)解

45、釋變量測(cè)量單位改變(擴(kuò)大或縮小常數(shù)c倍),而被解釋變量測(cè)量單位不變時(shí):OLS斜率的估計(jì)值及標(biāo)準(zhǔn)誤差擴(kuò)大或縮小為原來的c倍,但不影響截距的估計(jì). (如B的情況) 3.當(dāng)被解釋變量和解釋變量測(cè)量單位同時(shí)改變相同倍數(shù)時(shí),OLS的截距估計(jì)值及標(biāo)準(zhǔn)誤差擴(kuò)大為原來的c倍,但不影響斜率的估計(jì). (如C的情況),100,101,僅被解釋變量測(cè)量單位改變,僅解釋變量測(cè)量單位改變,截距及標(biāo)準(zhǔn)誤差,斜率及標(biāo)準(zhǔn)誤差,被解釋變量和解釋變量測(cè)量單位同時(shí)改變相同倍數(shù),4.當(dāng)被解釋變量和解釋變量測(cè)量單位改變時(shí),不會(huì)影響擬合優(yōu)度.可決系數(shù)是純數(shù)沒有維度,所以不隨計(jì)量單位而變化。 (如B、C、D的情況),當(dāng)被解釋變量和解釋變量測(cè)

46、量單位同時(shí)改變相同倍數(shù)時(shí), 對(duì)斜率系數(shù)的影響相互抵消了.,擴(kuò)大或縮小方向相同 ; 擴(kuò)大或縮小方向相反,第七節(jié) 回歸模型預(yù)測(cè),一、回歸分析結(jié)果的報(bào)告 經(jīng)過模型的估計(jì)、檢驗(yàn),得到一系列重要的數(shù)據(jù),為了簡明、清晰、規(guī)范地表述這些數(shù)據(jù),計(jì)量經(jīng)濟(jì)學(xué)通常采用以下規(guī)范化的方式: 例如:回歸結(jié)果為 = 244545 + 05091 (64138) (00357) 標(biāo)準(zhǔn)誤差SE t = (38128) (142605) t 統(tǒng)計(jì)量 = 09621 df = 8 可決系數(shù)和自由度 F = 20287 DW = 2.3 F 統(tǒng)計(jì)量 DW統(tǒng)計(jì)量,102,二、被解釋變量平均值預(yù)測(cè),1. 基本思想 經(jīng)估計(jì)的計(jì)量經(jīng)濟(jì)模型可

47、用于: 經(jīng)濟(jì)結(jié)構(gòu)分析 經(jīng)濟(jì)預(yù)測(cè) 政策評(píng)價(jià) 驗(yàn)正理論 運(yùn)用計(jì)量經(jīng)濟(jì)模型作預(yù)測(cè):指利用所估計(jì)的樣本回歸函數(shù) 作預(yù)測(cè)工具,用解釋變量的已知值或預(yù)測(cè)值,對(duì)預(yù)測(cè)期或樣 本以外的被解釋變量的數(shù)值作出定量的估計(jì)。 計(jì)量經(jīng)濟(jì)預(yù)測(cè)是一種條件預(yù)測(cè): 條件:模型設(shè)定的關(guān)系式不變 所估計(jì)的參數(shù)不變 解釋變量在預(yù)測(cè)期的取值已作出預(yù)測(cè),103,對(duì)被解釋變量Y的預(yù)測(cè)分為: 平均值預(yù)測(cè)和個(gè)別值預(yù)測(cè)對(duì)被解釋變量Y的預(yù)測(cè)又分為: 點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè),平均值預(yù)測(cè) 個(gè)別值預(yù)測(cè) 區(qū)間預(yù)測(cè) 點(diǎn)預(yù)測(cè) 區(qū)間預(yù)測(cè),預(yù)測(cè)的類型,預(yù)測(cè)值、平均值、個(gè)別值的相互關(guān)系,Y 是對(duì)真實(shí)平均值的點(diǎn)估計(jì),105,點(diǎn)預(yù)測(cè)值,真實(shí)平均值,個(gè)別值,2. Y 平均值的點(diǎn)

48、預(yù)測(cè),點(diǎn)預(yù)測(cè): 用樣本估計(jì)的總體參數(shù)值所計(jì)算的Y的估計(jì)值直接作為Y的預(yù)測(cè)值 方法: 將解釋變量預(yù)測(cè)值直接代入估計(jì)的方程 這樣計(jì)算的 是一個(gè)點(diǎn)估計(jì)值,106,3. Y平均值的區(qū)間預(yù)測(cè),基本思想: 預(yù)測(cè)的目標(biāo)值是真實(shí)平均值,由于存在抽樣波動(dòng),預(yù) 測(cè)的平均值 是隨機(jī)變量,不一定等于真實(shí)平均值 ,還需要對(duì) 作區(qū)間估計(jì) 為對(duì)Y的平均值作區(qū)間預(yù)測(cè),必須確定平均值點(diǎn)預(yù)測(cè)值 的抽樣分布 必須找出點(diǎn)預(yù)測(cè)值 與預(yù)測(cè)目標(biāo)值 的關(guān)系,即找出與二者都有關(guān)的統(tǒng)計(jì)量,107,具體作法 (從 的分布分析),由 服從正態(tài)分布(為什么?) 已知 可以證明,108,當(dāng) 未知時(shí),只得用 代替,這時(shí)將 標(biāo)準(zhǔn)化,有,注意:,(較復(fù)雜不具

49、體證明),109,顯然這樣的 t 統(tǒng)計(jì)量與 和 都有關(guān)。 給定顯著性水平,查 t 分布表,得自由度n2的臨界 值 ,則有 Y平均值的置信度為 的預(yù)測(cè)區(qū)間為,構(gòu)建平均值的預(yù)測(cè)區(qū)間,三、被解釋變量個(gè)別值預(yù)測(cè),基本思想: 是對(duì)Y平均值的點(diǎn)預(yù)測(cè)。 由于存在隨機(jī)擾動(dòng) 的影響,Y的平均值并不等于Y的個(gè)別值 為了對(duì)Y的個(gè)別值 作區(qū)間預(yù)測(cè),需要尋找與點(diǎn)預(yù)測(cè)值 和預(yù)測(cè)目標(biāo)個(gè)別值 有關(guān)的統(tǒng)計(jì)量,并要明確其概率分布,110,具體作法:,已知剩余項(xiàng) 是與預(yù)測(cè)值 及個(gè)別值 都有關(guān)的變量,并且已知 服從正態(tài)分布,且可證明 當(dāng)用 代替 時(shí),對(duì) 標(biāo)準(zhǔn)化的 變量 t 為,111,(較復(fù)雜不具體證明),構(gòu)建個(gè)別值的預(yù)測(cè)區(qū)間,給定

50、顯著性水平 ,查 t 分布表得自由度為 n2 的臨界值 ,則有 因此,一元回歸時(shí)Y的個(gè)別值的置信度為 的 預(yù)測(cè)區(qū)間上下限為,113,被解釋變量Y區(qū)間預(yù)測(cè)的特點(diǎn),(1)Y平均值的預(yù)測(cè)值與真實(shí)平均值有誤差,主要是受抽樣波動(dòng)影響 預(yù)測(cè)區(qū)間 Y個(gè)別值的預(yù)測(cè)值與真實(shí)個(gè)別值的差異,不僅受抽樣波動(dòng)影響,而且還受隨機(jī)擾動(dòng)項(xiàng)的影響 預(yù)測(cè)區(qū)間,114,(2)平均值和個(gè)別值預(yù)測(cè)區(qū)間都不是常數(shù), 是隨 的變化而變化的,當(dāng) 時(shí),預(yù)測(cè)區(qū)間最小。 (3)預(yù)測(cè)區(qū)間上下限與樣本容量有關(guān),當(dāng)樣本容量n時(shí),個(gè)別值的預(yù)測(cè)區(qū)間只決定于隨機(jī)擾 動(dòng)的方差。,被解釋變量Y區(qū)間預(yù)測(cè)的特點(diǎn)(續(xù)),預(yù)測(cè)區(qū)間,115,SRF,各種預(yù)測(cè)值的關(guān)系,Y的個(gè)別值的預(yù)測(cè)區(qū)間,Y平均值的預(yù)測(cè)區(qū)間,116,第八節(jié) 案例分析,案例1:中國各地區(qū)城市居民人均年消費(fèi)支出 和可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論