版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
\h計量經濟學基礎(第2版)目錄\h第1章導論\h1.1計量經濟學的產生與發(fā)展\h1.2計量經濟學的性質\h1.3計量經濟學的研究方法\h1.4數(shù)據(jù)\h1.5預備知識:統(tǒng)計學基礎\h本章小結\h學習建議\h核心概念\h課后思考與練習\h第2章回歸與回歸分析\h2.1回歸的基本問題\h2.2相關分析\h2.3一元線性回歸分析\h2.4不同類型數(shù)據(jù)構建的模型\h本章小結\h學習建議\h核心概念\h課后思考與練習\h第3章一元線性回歸模型的估計\h3.1普通最小二乘法\h3.2樣本回歸直線的代數(shù)性質\h3.3擬合優(yōu)度的度量\h3.4案例分析\h本章小結\h學習建議\h核心概念\h課后思考與練習\h上機實驗3-1\h上機實驗3-2\h第4章一元線性回歸模型的推斷\h4.1古典假定\h4.2OLS估計量的統(tǒng)計性質\h4.3參數(shù)的檢驗與區(qū)間估計\h4.4預測\h4.5案例分析\h本章小結\h學習建議\h核心概念\h課后思考與練習\h上機實驗4-1\h上機實驗4-2\h第5章一元線性回歸模型的擴展\h5.1過原點的回歸\h5.2對數(shù)模型\h5.3倒數(shù)模型\h5.4模型函數(shù)形式的選擇\h5.5案例分析\h本章小結\h學習建議\h核心概念\h課后思考與練習\h上機實驗5-1\h上機實驗5-2\h第6章多元線性回歸模型的估計\h6.1多元線性回歸模型的設定\h6.2多元線性回歸模型的矩陣表示\h6.3多元線性回歸模型的估計\h6.4多元線性模型最小二乘估計量的代數(shù)性質\h6.5案例分析\h本章小結\h學習建議\h核心概念\h課后思考與練習\h上機實驗6-1\h上機實驗6-2\h第7章多元線性回歸模型的推斷\h7.1多元線性回歸模型的古典假定\h7.2多元線性回歸OLS估計量的統(tǒng)計性質\h7.3多元線性回歸模型參數(shù)的檢驗與區(qū)間估計\h7.4多元線性回歸模型的預測\h7.5案例分析\h本章小結\h學習建議\h核心概念\h課后思考與練習\h上機實驗7-1\h上機實驗7-2\h第8章多重共線性\h8.1多重共線性的含義\h8.2產生多重共線性的原因\h8.3多重共線性對OLS估計量的影響\h8.4多重共線性的檢驗\h8.5多重共線性的修正\h8.6案例分析\h本章小結\h學習建議\h核心概念\h課后思考與練習\h上機實驗8-1\h上機實驗8-2\h第9章虛擬變量回歸\h9.1虛擬變量\h9.2虛擬變量回歸模型\h9.3參數(shù)的結構變化\h9.4案例分析\h本章小結\h學習建議\h核心概念\h課后思考與練習\h上機實驗9-1\h上機實驗9-2\h第10章異方差\h10.1異方差概述\h10.2異方差產生的原因\h10.3異方差的后果\h10.4異方差的檢驗\h10.5異方差的修正\h10.6案例分析\h本章小結\h學習建議\h核心概念\h課后思考與練習\h上機實驗10-1\h上機實驗10-2\h第11章自相關\h11.1自相關的含義\h11.2自相關產生的原因\h11.3自相關的后果\h11.4自相關的檢驗\h11.5自相關的修正\h11.6案例分析\h本章小結\h學習建議\h核心概念\h課后思考與練習\h上機實驗11-1\h上機實驗11-2\h第12章時間序列模型\h12.1時間序列中的基本概念\h12.2時間序列平穩(wěn)性檢驗\h12.3協(xié)整\h12.4案例分析\h本章小結\h學習建議\h核心概念\h課后思考與練習\h上機實驗\h附錄A標準正態(tài)分布表\h附錄Bt分布表\h附錄Cχ2分布表\h附錄DF分布表\h附錄EDW檢驗臨界值表第1章導論學習目標·了解計量經濟學的產生與發(fā)展過程·理解計量經濟學的含義·了解計量經濟學的研究過程·掌握統(tǒng)計學的基本方法著名的經濟學家保羅·薩繆爾森曾說過:“第二次世界大戰(zhàn)后的經濟學是計量經濟學的時代?!庇嬃拷洕鷮W是現(xiàn)代經濟學的重要分支,在經濟學、金融學、管理學、營銷學以及一些相關學科的研究中,定量分析用得越來越多,而計量經濟學是進行定量分析的重要工具,就如R.克萊因所說:“在大多數(shù)大學和學院中,計量經濟學的講授已成為經濟學課程表中最有權威性的一部分?!?.1計量經濟學的產生與發(fā)展在現(xiàn)實的經濟活動中,我們經常要對諸如國民生產總值(GNP)、失業(yè)、通貨膨脹、進口、出口等經濟現(xiàn)象進行定量分析,如何對這些經濟現(xiàn)象進行測量呢?計量經濟學是利用經濟理論、數(shù)學、統(tǒng)計推斷等知識對經濟現(xiàn)象進行分析的一門社會科學。計量經濟學運用數(shù)理統(tǒng)計知識分析經濟數(shù)據(jù),對構建于數(shù)理經濟學基礎之上的數(shù)學模型提供經驗支持,并得出量化的結果。計量經濟學(econometrics)這個詞是挪威經濟學家、第一屆諾貝爾經濟學獎獲得者弗里希(R.Frisch)1926年在《論純經濟問題》一文中,按照“生物計量學”(biometrics)一詞的結構仿造出來的。econometrics一詞的本意是指“經濟度量”,研究經濟現(xiàn)象和經濟關系的計量方法,因此econometrics有時也譯為“經濟計量學”。將econometrics譯為計量經濟學,是為了強調計量經濟學是一門經濟學科,不僅要研究經濟現(xiàn)象的計量方法,而且要研究經濟現(xiàn)象發(fā)展變化的數(shù)量規(guī)律。計量經濟學的產生源于對經濟問題的定量研究,這是社會經濟發(fā)展到一定階段的客觀需要。經濟現(xiàn)象本來就充滿著數(shù)量關系,人們很早就在探索用定量的方式研究經濟問題。早在17世紀,英國經濟學家、統(tǒng)計學家威廉·配第在《政治算術》中就運用統(tǒng)計方法研究社會經濟問題,主張用“數(shù)字、重量和尺度”來闡明經濟現(xiàn)象。以后的相當一段時間內,經濟學家也力圖運用數(shù)學方法研究經濟活動,用數(shù)學語言和公式表達經濟范疇和經濟規(guī)律,但這些都還沒有形成計量經濟學。計量經濟學作為經濟學的一門獨立學科被正式確立,其標志一般被認為是1930年12月弗里希和丁伯根(J.Tinbergen)等經濟學家在美國克里夫蘭發(fā)起成立國際計量經濟學會。第二次世界大戰(zhàn)以后,計量經濟學在西方各國的影響迅速擴大,并發(fā)展成為經濟學的重要分支。特別是20世紀40~60年代,經典計量經濟學逐步完善并得到廣泛應用。美國著名經濟學家、諾貝爾經濟學獎獲得者薩繆爾森認為:“第二次世界大戰(zhàn)后的經濟學是計量經濟學的時代?!笔聦嵣?,在世界諾貝爾經濟學獎獲得者中,相當一部分都是計量經濟學家。20世紀70年代以來,計量經濟學的理論和應用又進入一個新階段。首先是計算機的廣泛應用和新的計算方法的大量提出,所使用的計量經濟模型的規(guī)模越來越大。更重要的是,非經典計量經濟學的理論和應用有了新的突破。微觀計量經濟學、非參數(shù)計量經濟學、時間序列計量經濟學和動態(tài)計量經濟學等的提出,使計量經濟學產生了新的理論體系,協(xié)整理論、面板數(shù)據(jù)、對策論、貝葉斯方法等理論在計量經濟學中的應用已成為新的研究課題。應該看到,計量經濟學的發(fā)展是與現(xiàn)代科學技術成就結合在一起的,它反映了社會化大生產對各種經濟因素和經濟活動進行數(shù)量分析的客觀要求。經濟學從定性研究向定量分析的發(fā)展,是經濟學逐步向更加精密、更加科學發(fā)展的表現(xiàn)。正如馬克思強調的:一種科學只有成功地運用了數(shù)學以后,才算達到了完善的地步。因此另一獲得諾貝爾經濟學獎的經濟學家克萊因認為:“計量經濟學已經在經濟學科中居于最重要的地位?!?.2計量經濟學的性質計量經濟學的奠基人弗里希在《計量經濟學》的創(chuàng)刊詞中說道:“用數(shù)學方法探討經濟學可以從好幾個方面著手,但任何一方面都不能與計量經濟學混為一談。計量經濟學與經濟統(tǒng)計學絕非一碼事;它也不同于我們所說的一般經濟理論,盡管經濟理論大部分都具有一定的數(shù)量特征;計量經濟學也不應被視為數(shù)學應用于經濟學的同義語。經驗表明,統(tǒng)計學、經濟理論和數(shù)學這三者對于真正了解現(xiàn)代經濟生活中的數(shù)量關系來說,都是必要的,但各自并非是充分條件。而三者結合起來,就有力量,這種結合便構成了計量經濟學?!焙髞砻绹嬃拷洕鷮W家克萊因也認為:計量經濟學是數(shù)學、統(tǒng)計技術和經濟分析的綜合。也可以說,計量經濟學不僅是指對經濟現(xiàn)象加以測量,而且是根據(jù)一定的經濟理論進行計量的。盡管這些經濟學家對計量經濟學定義的表述各不相同,但可以看出,計量經濟學不是對經濟的一般度量,它與經濟理論、統(tǒng)計學、數(shù)學都有密切的關系。事實上,計量經濟學是以經濟理論和經濟數(shù)據(jù)的事實為依據(jù),運用數(shù)學、統(tǒng)計學的方法,通過建立數(shù)學模型來研究經濟數(shù)量關系和規(guī)律的一門經濟學科。應當注意,計量經濟學所研究的主體是經濟現(xiàn)象及其發(fā)展變化的規(guī)律,所以它是一門經濟學科。計量經濟學當然會運用大量的數(shù)學方法,特別是許多數(shù)理統(tǒng)計方法,但是數(shù)學在這一學科中只是工具,而不是研究的主體。計量經濟學的用途或目的主要有兩個方面:其一是理論檢驗,這是計量經濟學用途最為主要的和可靠的方面,也是計量經濟學本身的一個主要內容;其二是預測應用,從理論研究和方法的最終目的來看,預測(包括政策評價)當然是計量經濟學的最終任務,必須注意學習和了解,但其預測的可靠性或有效性是我們應該特別注意的。1.3計量經濟學的研究方法運用計量經濟方法研究經濟問題一般可以分為以下步驟:理論或假說的陳述→建立理論的數(shù)學模型→建立理論的計量經濟學模型→抽樣、收集數(shù)據(jù)→估計回歸系數(shù)→參數(shù)的假設檢驗→模型的應用。為了闡明計量經濟學的方法論,我們來考慮這樣一個問題:居民的消費支出與居民的家庭收入之間有什么關系?或者說居民的家庭收入不同對于居民的消費支出會有影響嗎?1.3.1理論或假說的陳述根據(jù)經濟學中的凱恩斯消費理論可知:隨著收入水平的提高,消費也會增加,但消費的增加不及收入增加得多。這個理論我們如何來驗證它呢?居民的家庭收入變動,會引起居民的消費支出發(fā)生多大的變化呢?這個問題可以用計量經濟學的方法來回答。我們可以建立相應的模型來“計量”因收入變化而使消費變化的程度。這個問題中涉及兩個經濟變量:收入和消費。由經濟理論可知,收入影響消費,即收入是“自變量”,消費是“因變量”。我們應該用哪種函數(shù)形式來描述這兩個經濟變量的關系呢?1.3.2建立理論的數(shù)學模型經濟學理論和大量事實證明,收入與消費是線性關系。于是,我們可以建立數(shù)學模型:式中Y——消費;X——收入;β0,β1——回歸系數(shù)。我們將式(1-1)稱為一元線性回歸方程。這個方程從數(shù)學意義上刻畫兩個變量之間的關系,而且斜率項系數(shù)有著特定的經濟學意義——邊際消費傾向。根據(jù)斜率項系數(shù)的幾何意義可知:β1=ΔY/ΔX,即消費的增量比收入的增量,表示邊際消費傾向。1.3.3建立理論的計量經濟學模型由于消費是隨機變量,故這兩個變量之間的關系不會表現(xiàn)出像式(1-1)那樣嚴格的函數(shù)關系。也就是說,式(1-1)是“近似”地表示消費與收入的關系,那么這兩個經濟變量之間的真實關系應該是:式中u——誤差項。我們將式(1-2)稱為一元線性回歸模型。與式(1-1)相比,式(1-2)多了一個誤差項,這是因為對于同一收入水平(X)的居民,他們的消費(Y)也會有差異,有非常多的偶然因素影響到消費行為,這些因素都歸結到誤差項中。誤差在計量經濟學分析中有著非常重要的意義,我們認為這樣的誤差是隨機誤差。1.3.4抽樣、收集數(shù)據(jù)式(1-1)和式(1-2)描述的是總體情形。我們知道,一般來說,總體是不可全面觀測的,雖然斜率項系數(shù)表示邊際消費傾向,但是我們相信,總體中一部分人群的消費與收入的關系和總體人群的消費與收入的關系具有相同的特性,可以建立相同形式的樣本一元線性回歸方程和模型。于是,我們抽樣并收集樣本數(shù)據(jù),并用樣本數(shù)據(jù)得到樣本的斜率項系數(shù),即樣本的邊際消費傾向,再用樣本邊際消費傾向推斷總體邊際消費傾向,這個過程是可以實現(xiàn)的。1.3.5估計回歸系數(shù)收集到樣本數(shù)據(jù)后,我們可以用相應的統(tǒng)計方法得到樣本的截距項系數(shù)和斜率項系數(shù)。假如我們用某一個樣本數(shù)據(jù)得到如下結果:其中讀作“Y帽”,其含義是消費(Y)的估計值。在這個結果里,斜率項系數(shù)為0.65,即樣本邊際消費傾向是0.65,表示收入增加1元,消費會增加0.65元。但是,這個結果是一個樣本得到的結果,我們認為樣本是隨機抽取的,所以,樣本邊際消費傾向是一個隨機的結果,我們的目的是希望用樣本結果對總體特征做出估計。如何得到式(1-3)的結果,我們會在第3章中介紹。1.3.6參數(shù)的假設檢驗式(1-3)得到的結果是一個樣本結果,樣本結果帶有偶然性,那么這樣一個結果在統(tǒng)計意義上顯著嗎?為什么要提出這樣的問題呢?這是因為由樣本得到的斜率項系數(shù)為0.65,是不等于0的,這是一個偶然的結果嗎?或者說,我們是不是偶然得到了一個不等于0的斜率項系數(shù)呢?而總體的斜率實際是等于0的。這個問題的另外一個表達方式是,由樣本的這個結果能判斷總體的β1也不等于0嗎?我們建立模型式(1-2)的含義是“計量”X對Y影響的程度,如果β1=0,則式(1-2)變?yōu)閅=β0+u,這說明X沒有對Y產生影響,這個結果顯然與我們最初建立模型的意圖是不相符的,或者說建立這樣的模型是不可靠的。這樣的一個問題就是參數(shù)的假設檢驗。如果通過檢驗可以證實β1≠0,那么說明我們建立的模型式(1-2)是可靠的。1.3.7模型的應用如果通過了檢驗,說明模型是可靠的,那么我們就可以對模型進行應用了。模型的應用主要是兩個方面:一是對總體的系數(shù)做估計,例如,在消費模型中,斜率項系數(shù)表示邊際消費傾向,我們只能得到樣本的邊際消費傾向,我們可以運用統(tǒng)計學的方法對總體的邊際消費傾向進行估計;另一個是預測,對于樣本以外的X值,我們可以通過樣本方程預測其對應的Y值,例如,當收入(X)達到8000元時,對應的消費大約為5435.60元。1.4數(shù)據(jù)由上述分析可知,要“計量”收入對消費的影響,必須要有數(shù)據(jù),對于不同的現(xiàn)象表現(xiàn)出來的數(shù)據(jù)類型是不一樣的。最常用的數(shù)據(jù)有時間序列數(shù)據(jù)、截面數(shù)據(jù)和面板數(shù)據(jù)。1.時間序列數(shù)據(jù)時間序列數(shù)據(jù)(timeseriesdata)是同一總體在不同時間上的統(tǒng)計數(shù)據(jù)。比如不同年份的GNP、失業(yè)率、就業(yè)率、貨幣供給、政府赤字等數(shù)據(jù)就可以構成不同的時間序列。表1-1為中國近三年季度國內生產總值及構成數(shù)據(jù),這些數(shù)據(jù)按照時間先后的原則進行排列,反映了我國(同一總體)在近三年各季度(不同時間)國內生產總值及構成的情況。表1-1中國近三年各季度國內生產總值及構成(單位:萬億元)資料來源:新浪財經。2.截面數(shù)據(jù)截面數(shù)據(jù)(cross-sectionaldata)是不同總體在同一時間截面上的調查數(shù)據(jù)。例如,各國或各地區(qū)的工業(yè)普查數(shù)據(jù)、人口普查數(shù)據(jù)等。如表1-2為2013年我國華北地區(qū)人均可支配收入與消費支出的相關數(shù)據(jù),是不同地區(qū)(總體)在同一時間截面(2013年)的數(shù)據(jù)。表1-22013年我國華北地區(qū)人均可支配收入與消費支出(單位:元)資料來源:《中國統(tǒng)計年鑒2014》。3.面板數(shù)據(jù)面板數(shù)據(jù)(paneldata)中既有時間序列數(shù)據(jù)又有截面數(shù)據(jù)。例如表1-3的數(shù)據(jù),是巴西、中國、南非、印度、俄羅斯等不同的國家(總體),在不同時間的GDP增長率的數(shù)據(jù)。表1-3金磚國家GDP年增長率(%)資料來源:新浪財經。1.5預備知識:統(tǒng)計學基礎1.5.1隨機現(xiàn)象、隨機試驗與概率隨機現(xiàn)象是無法事先準確確定其結果的現(xiàn)象。在社會經濟領域中,隨機現(xiàn)象是普遍存在的,研究隨機現(xiàn)象,對認識這些現(xiàn)象是非常必要的。觀察隨機現(xiàn)象或為了觀察隨機現(xiàn)象而進行的試驗稱為隨機試驗。隨機現(xiàn)象具有可以重復多次;可能的結果不止一個,但事先可知;每次試驗都會出現(xiàn)上述結果中的某一個,但事先不能預知是哪一個等特點。隨機試驗的每個可能結果稱為一個樣本點,全體樣本點的集合稱為樣本空間。隨機試驗的結果稱為隨機事件,隨機事件由一系列樣本點組成。某隨機事件A發(fā)生的可能性稱為事件A發(fā)生的概率,記為p(A),(0≤p(A)≤1)。p(A)=0表示不可能發(fā)生的事件,p(A)=1表示必然發(fā)生的事件。1.5.2隨機變量以隨機試驗的結果為取值的變量稱為隨機變量。一個隨機變量具有下列特性:可以取許多不同的數(shù)值,取這些數(shù)值的概率為p。重復抽樣得到的樣本就是一個隨機變量,所謂“樣本容量為n的樣本”就是n個相互獨立且與總體有相同分布的隨機變量X1,…,Xn。每次具體抽樣所得的數(shù)據(jù),就是n元隨機變量的一個觀察值,記為(X1,…,Xn)。隨機變量可以分為離散隨機變量和連續(xù)隨機變量。一個離散隨機變量只能取有限(或可數(shù)無窮)多個值,例如,投擲骰子的所有可能點數(shù)為1~6中的任何一個,我們就可以定義隨機變量為點數(shù)X=1,2,3,4,5,6,因此它是一個離散隨機變量。連續(xù)隨機變量可以取某一區(qū)間的任何值,如人的身高、體重、學生的分數(shù)等都是連續(xù)隨機變量。若X為一隨機變量,對任意實數(shù)x,稱F(x)=p(X<x)為隨機變量X的分布函數(shù)。對于連續(xù)隨機變量如果有:其中f(x)≥0。我們稱f(x)為X的概率分布密度函數(shù),簡稱為分布密度。分布密度函數(shù)具有如下性質:(1)f(x)≥0(2)(3)(4)F′(x)=f(x)如果X的分布密度為f(x),則記為X~f(x)。1.5.3隨機變量的數(shù)字特征1.數(shù)學期望數(shù)學期望也稱為均值,它描述隨機變量(總體)的一般水平,從計算方法上來看它是一個加權平均值。離散隨機變量X的數(shù)學期望記為E(X)或μ,定義如下:式中p(x)——取x值的概率。連續(xù)隨機變量數(shù)學期望的定義如下:式中f(x)——分布密度。數(shù)學期望具有如下性質:(1)如果a,b為常數(shù),則E(aX+b)=aE(X)+b,特別的是E(b)=b;(2)如果X,Y為兩個隨機變量,則(X+Y)=E(X)+E(Y);(3)如果g(x)和f(x)分別為X的兩個函數(shù),則E[g(X)+f(X)]=E[g(X)]+E[f(X)];(4)如果X,Y是兩個獨立的隨機變量,則E(XY)=E(X)E(Y)。2.方差如果隨機變量X的數(shù)學期望E(X)存在,稱[X-E(X)]為隨機變量X的離均差或離差,顯然,隨機變量離均差的數(shù)學期望是0,即E[X-E(X)]=0隨機變量離差平方的數(shù)學期望叫作隨機變量的方差,記作Var(X)或σ2,即:方差的算術平方根稱為標準差,即:方差和標準差刻畫了隨機變量取值相對于均值的分散程度,方差或標準差的值越大,說明隨機變量的取值越分散。方差具有以下性質(c是常數(shù)):(1)Var(c)=0(2)Var(c+X)=Var(X)(3)Var(cX)=c2Var(X)(4)X,Y為相互獨立的隨機變量,則(5)Var(X)=E(X2)-(E(X))23.協(xié)方差設X,Y是兩個隨機變量,定義X,Y的協(xié)方差為:如果X=Y,則有Cov(X,Y)=E[X-E(X)]2=Var(X)=σ2。4.相關系數(shù)描述X與Y線性相關程度可以用相關系數(shù)度量,X與Y的相關定義為:相關系數(shù)的取值范圍為[-1,1],ρ>0說明X與Y是正相關,反之為負相關;|ρ|越接近1,說明X與Y的相關程度越高,反之越低。1.5.4重要的理論分布1.正態(tài)分布分布密度為:分布密度的圖像如圖1-1所示。圖1-1正態(tài)分布正態(tài)分布取決于兩個參數(shù):均值μ和方差σ2。如果X服從正態(tài)分布,則記為X~N(μ,σ2)。如果正態(tài)分布μ=0,σ2=1,則稱其為標準正態(tài)分布,記為Z~N(0,1)。標準正態(tài)分布的分布密度為:標準正態(tài)分布的分布函數(shù)記為Φ(Z),即,它有三個重要的性質:(1)p(a<Z<b)=Φ(b)-Φ(a)(2)Φ(-a)=1-Φ(a)(3)p(|Z|≤a)=2Φ(a)-1利用這三個性質,可以查標準正態(tài)分布表得到相應的概率??梢宰C明,對于任意一個正態(tài)分布都可以通過標準化變換為標準正態(tài)分布:這樣,我們可以求出任意一個正態(tài)分布所對應的概率。關于正態(tài)分布還有一個重要的結論:如果X1,X2,…,Xn都是服從Xi~N(μi,)的獨立隨機變量,那么其線性組合也服從均值為、方差為的正態(tài)分布,即:2.χ2分布設Z1,Z2,…,Zk是互相獨立的標準化的正態(tài)分布變量,則服從自由度為k的χ2分布,記為Z~χ2(k)。χ2分布取決于自由度k。χ2分布的分布密度圖像是一個右偏分布(見圖1-2),當k的值越來越大時,χ2分布的分布密度圖像會越來越趨于對稱。一般認為,當自由度超過100時,χ2分布近似為正態(tài)分布。查χ2分布表可以得到給定自由度及上側面積的臨界值。3.t分布如果Z1~N(0,1),Z2~χ2(k),則服從t分布,記為t~t(k)。圖1-2χ2分布圖t分布取決于自由度,形態(tài)是對稱分布,與標準正態(tài)分布近似,但比較平緩(見圖1-3),當自由度越來越大時,趨近于標準正態(tài)分布。圖1-3t分布與標準正態(tài)分布查t分布表可以得到給定自由度及上側面積的臨界值。4.F分布如果Z1~χ2(k1),Z2~χ2(k2),則F=(Z1/k1)/(Z2/k2)服從自由度為k1,k2的F分布,記為F~F(k1,k2),其中k1稱為分子自由度,k2稱為分母自由度。F分布取決于自由度,是右偏分布(見圖1-4)。圖1-4F分布查F分布表可以得到給定自由度及上側面積的臨界值。1.5.5統(tǒng)計推斷1.參數(shù)估計參數(shù)估計是用樣本統(tǒng)計量估計總體參數(shù)的統(tǒng)計方法。參數(shù)估計分為點估計和區(qū)間估計兩種,進行參數(shù)估計需要知道統(tǒng)計量的分布——抽樣分布。在參數(shù)估計中用得最多的是用樣本平均數(shù)估計總體均值,關于樣本平均數(shù)的抽樣分布的結論是中心極限定理:設總體均值為μ,且存在有限方差σ2,從中抽取樣本容量為n的樣本。當樣本容量足夠大時,樣本平均數(shù)X的抽樣分布近似地服從正態(tài)分布。這個結論用數(shù)學表達式表示為:根據(jù)中心極限定理,可以認為樣本平均數(shù)X圍繞在總體均值μ附近,故對于某一個樣本平均數(shù),可以認為μ=,即是μ的一個點估計值。在點估計的基礎上,給出μ的一個取值范圍,稱為區(qū)間估計。當總體方差已知,大樣本,顯著性水平為α時,μ的1-α的置信區(qū)間是:其中Z~N(0,1)。當總體方差未知,大樣本,顯著性水平為α時,μ的1-α的置信區(qū)間是:如果是小樣本,則要求總體服從正態(tài)分布,仍然可以用式(1-16)和式(1-17)進行估計。此外,我們可以得到常用的統(tǒng)計量樣本比率、樣本方差的抽樣分布,并運用這些分布對對應的總體比率和總體方差進行估計。2.假設檢驗假設檢驗也稱為“顯著性檢驗”,是用來判斷樣本與樣本、樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統(tǒng)計推斷方法。其基本原理是先對總體的特征做出某種假設,然后通過抽樣研究的統(tǒng)計推理,對此假設應該被拒絕還是接受做出推斷。假設檢驗的邏輯方法是反證法和小概率原理,并運用樣本統(tǒng)計量的分布來進行判斷。其基本步驟為:提出假設→建立檢驗統(tǒng)計量并確定其分布→設定顯著性水平并構造拒絕域→根據(jù)檢驗統(tǒng)計量的值做決策。假設檢驗的決策規(guī)則是:如果檢驗統(tǒng)計量的值落入拒絕域,則拒絕原假設,否則不拒絕。上述決策的方法稱為臨界值法,我們還可以根據(jù)檢驗統(tǒng)計量的伴隨概率——p值進行檢驗,決策的規(guī)則是:如果p值小于顯著性水平,則拒絕原假設,否則不拒絕。限于篇幅,統(tǒng)計學的具體內容讀者可參閱其他專門的統(tǒng)計學資料。本章小結計量經濟學是以經濟理論和經濟數(shù)據(jù)的事實為依據(jù),運用數(shù)學、統(tǒng)計學的方法,通過建立數(shù)學模型來研究經濟數(shù)量關系和規(guī)律的一門經濟學科。運用計量經濟方法研究經濟問題一般可以分為以下步驟:理論或假說的陳述、建立理論的數(shù)學模型、建立理論的計量經濟學模型、抽樣(收集數(shù)據(jù))、估計回歸系數(shù)、參數(shù)的假設檢驗、模型的應用。常用的數(shù)據(jù)類型有時間序列數(shù)據(jù)、截面數(shù)據(jù)和面板數(shù)據(jù)。學習建議本章的學習要深入理解計量經濟學的重要性,了解計量經濟學的研究方法,熟練掌握相關的統(tǒng)計學、經濟學和數(shù)學知識。1.本章重點計量經濟學的含義回歸方程回歸模型2.本章難點回歸方程回歸模型核心概念回歸方程回歸模型數(shù)據(jù)課后思考與練習1.計量經濟學的研究過程有哪些步驟?2.查閱《中國統(tǒng)計年鑒》,分別列舉出三個時間序列數(shù)據(jù)、截面數(shù)據(jù)和面板數(shù)據(jù)。3.對于一元線性回歸方程我們是更看重變量還是回歸系數(shù)?為什么?4.如果要“計量”影響經濟增長的因素,以GDP作為經濟總量的代表變量,你認為有哪些變量會影響GDP的變化?5.你查閱的《中國統(tǒng)計年鑒》中的數(shù)據(jù)是總體數(shù)據(jù)還是樣本數(shù)據(jù)?為什么?第2章回歸與回歸分析學習目標·掌握線性相關系數(shù)的意義及計算方法·理解統(tǒng)計關系與確定性關系的意義·理解總體線性回歸方程與總體回歸模型的意義·理解隨機擾動項的意義·理解樣本回歸方程與總體回歸模型的意義2.1回歸的基本問題最早使用“回歸”一詞的是英國遺傳學家弗朗西斯·高爾頓(FrancisGalton),他在研究父母身高與子女身高的關系時,發(fā)現(xiàn)子女身高有向平均身高“回歸”的趨向,這就是古典意義上的回歸?,F(xiàn)代意義上的“回歸”已經演變成建立回歸方程或模型,研究一個隨機變量(Y)對另一個變量(X)或多個變量(X1,X2,…,Xk)的相互依存關系的統(tǒng)計分析方法。在經濟領域,很多變量之間都存在相互依存關系?!纠?-1】邊際消費傾向是凱恩斯宏觀經濟學的核心概念之一。通俗地講,當人們的收入增加時,消費支出也會增加,但消費支出增加沒有收入增加得快,而消費支出的增加值比收入的增加值就是邊際消費傾向。在這個理論中,敘述了兩個經濟變量——收入與消費之間的關系,那么兩者之間存在怎樣的關系呢?我們搜集到2013年各地區(qū)居民現(xiàn)金可支配收入與現(xiàn)金消費支出的數(shù)據(jù)(數(shù)據(jù)見教學資源data2-1,數(shù)據(jù)來源:《中國統(tǒng)計年鑒2014》),并繪制散點圖,如圖2-1所示。圖2-12013年各地區(qū)居民可支配收入與消費支出的關系其中,X表示收入,Y表示消費。從圖2-1中可以看出,當X增加時,Y也在增加,并且這些散點散布在某條直線附近。于是我們可以用一條直線“近似”地表示收入(X)與消費支出(Y)的關系:而其中的斜率項系數(shù)b=ΔY/ΔX,即消費支出的增量比收入的增量,其含義是邊際消費傾向?!纠?-2】新西蘭經濟學家W.菲利普斯根據(jù)英國近百年貨幣工資變化的百分比(Y)與失業(yè)率(X)的經驗統(tǒng)計資料提出了一條用以表示失業(yè)率和貨幣工資變動率之間交替關系的曲線(見圖2-2)。這條曲線表明:當失業(yè)率較低時,貨幣工資增長率較高;反之,當失業(yè)率較高時,貨幣工資增長率較低,甚至是負數(shù)。根據(jù)成本推動的通貨膨脹理論,貨幣工資可以表示通貨膨脹率。因此,這條曲線就可以表示失業(yè)率與通貨膨脹率之間的交替關系。根據(jù)圖2-2,我們可以用一條雙曲線“近似”地表示貨幣工資增長率(Y)與失業(yè)率(X)這兩個變量的規(guī)律性,即:圖2-2菲利普斯曲線【例2-3】經濟理論告訴我們,影響經濟增長的主要因素是消費、投資和凈出口,如果用GDP作為經濟總量的代表變量,則可以用以下方程“近似”地表示這些變量的關系:式中Y——GDP;X1——消費;X2——投資;X3——凈出口。通過以上例子可以看到,我們可以用一些我們熟知的曲線“近似”地表示經濟變量之間的關系,再用這些曲線的特性來對經濟變量之間的關系做分析,這就是現(xiàn)代意義上的回歸分析。但是,要進行回歸分析,先要進行相關分析。2.2相關分析相關分析是研究現(xiàn)象(變量)之間是否存在某種依存關系(相關關系)的一種統(tǒng)計方法,主要研究變量之間相關關系的形式、方向和密切程度。2.2.1統(tǒng)計關系與確定性關系在我們所觀察的經濟變量中,存在著各種各樣的關系,從整體上劃分可以分為統(tǒng)計關系和確定性關系。確定性關系是指經濟變量之間的關系可以用精確的公式表示,如資產=負債+所有者權益、銷售額=銷售量×價格等,但是這類關系在經濟變量之間相對較少,大部分經濟變量之間的關系是如前面所舉例的關系——統(tǒng)計關系。經濟變量大多都是隨機變量,例如消費支出、失業(yè)率、凈出口等,正是由于這種隨機性,導致經濟變量之間很難保持確定性的關系。但是,經濟運行存在的內在規(guī)律性會使經濟變量之間存在著某種“相關”,這些“相關”在實踐中被反復大量觀察,并在某種程度上被證實,于是人們描述這些“相關”意義,總結成相應的經濟理論,這些“相關”就是我們所理解的經濟意義上的統(tǒng)計關系——相關關系。兩個變量之間存在相關關系,還需要考慮兩個變量之間的邏輯關系——因果關系,即哪個變量依賴于哪個變量。例如,消費支出與收入之間的關系,一定是消費支出依賴于收入,即收入是“自變量”,消費支出是“因變量”,但是也有一些經濟變量之間是互相依賴的關系,如某種商品的價格與供應量之間的關系就是互相依賴的關系。判斷因果關系的依據(jù)是相關的經濟理論,在統(tǒng)計意義上是無法判斷的,所以在進行相關分析時一般不區(qū)分因果關系。相關分析就是研究統(tǒng)計關系的形式、方向和密切程度的統(tǒng)計方法。為了表達問題的方便,我們約定在本書中,用大寫字母表示變量,如Y,X,X1,…,Xk等。2.2.2相關關系的種類1.按相關的程度可分為完全相關、不完全相關和不相關當兩個變量之間的關系是確定性關系時,稱這兩種現(xiàn)象間的關系為完全相關;當兩個變量之間彼此互不影響,其數(shù)量變化各自獨立時,稱為不相關;兩個變量之間的關系介于完全相關和不相關之間時,稱為不完全相關,一般的相關關系就是指這種不完全相關。2.按相關的方向可分為正相關和負相關當一個變量的數(shù)量增加(或減少),另一個變量的數(shù)量也隨之增加(或減少)時,稱為正相關;反之,當一個變量的數(shù)量增加(或減少),而另一個變量的數(shù)量向相反方向變動時,稱為負相關。3.按相關的形式可分為線性相關和非線性相關當兩種相關變量之間的關系大致呈現(xiàn)為線性關系時,稱為線性相關;如果兩種相關變量之間,并不表現(xiàn)為直線的關系,而是近似于某種曲線方程的關系,則這種相關關系稱為非線性相關。4.按所研究的變量多少可分為簡單相關、復相關兩個變量之間的相關,稱為簡單相關;當所研究的是一個變量對兩個或兩個以上其他變量的相關關系時,稱為復相關。2.2.3簡單線性相關關系的度量簡單線性相關關系是最簡單也是最常見的相關形式,一般用簡單線性相關系數(shù)度量這種關系的密切程度。簡單線性相關系數(shù)簡稱相關系數(shù)(correlationcoefficient),如果是根據(jù)總體全部數(shù)據(jù)計算的,則稱為總體相關系數(shù),通常記為ρ,計算公式為:式中Cov(X,Y)——變量X和Y的協(xié)方差;Var(X)——變量X的方差;Var(Y)——變量Y的方差??梢宰C明,ρ的取值范圍為-1≤ρ≤1;若ρ為正,則表明兩個變量為正相關;若ρ為負,則表明兩個變量為負相關;如果ρ=1或-1,則表明兩個變量完全相關。根據(jù)樣本數(shù)據(jù)計算的相關系數(shù)稱為樣本相關系數(shù),記為r。由于總體一般是不能全面觀測的,所以相關系數(shù)一般只能計算樣本相關系數(shù),計算公式為:式中X——變量X的平均數(shù);Y——變量Y的平均數(shù)。注意到式(2-5)中計算項都是離差,設xi=Xi-X,yi=Yi-Y,則有:式(2-6)稱為r的離差形式。r與ρ有相同的取值范圍與意義,但是,r是由樣本數(shù)據(jù)計算得到的,其值會隨樣本的波動而波動,故r是統(tǒng)計量,我們可以用r檢驗總體是否存在相關關系??梢宰C明,在ρ=0的條件下,關于r的統(tǒng)計量服從t分布:式中r——樣本相關系數(shù);n——樣本容量。顯著性檢驗的步驟如下:(1)提出假設:H0:ρ=0,H1:ρ≠0;(2)由式(2-7)計算檢驗統(tǒng)計量的值;(3)確定顯著性水平,根據(jù)給定的顯著性水平和自由度(n-2)查t分布表查構造拒絕域;(4)決策判斷:若|t|>tα/2,拒絕H0,表明總體的兩個變量之間存在顯著的線性相關關系。2.3一元線性回歸分析回歸分析是指在相關分析的基礎上,將變量之間的變動關系模型化,即尋找出一個能夠“近似”刻畫變量間變化關系的函數(shù)關系式,并據(jù)此“精確”地表達變量之間影響的結構、方向和程度。通過回歸分析,可以將相關變量之間的不確定、不規(guī)則的數(shù)量關系一般化、規(guī)范化,從而可以根據(jù)自變量的某一個給定值推斷出因變量的可能值(或估計值)?;貧w分析中最簡單、最基本的是一元線性回歸分析,即只考慮兩個變量之間的線性回歸。由于回歸分析要建立回歸方程,故要考慮兩個變量之間的因果關系。我們將數(shù)學意義上的自變量稱為“解釋變量”(比如X),因變量稱為“被解釋變量”或“響應變量”(比如Y),我們要尋找的就是用X解釋Y的函數(shù)關系式。2.3.1總體線性回歸方程與回歸模型我們通過一個人為設定的例子來說明如何建立總體線性回歸方程與總體回歸模型?!纠?-4】假設一個總體中只有100個家庭。由于這個總體非常小,因此我們可以對這個總體中的所有數(shù)據(jù)進行調查。經過調查,這100個家庭的月度收入和消費支出數(shù)據(jù)如表2-1所示。表2-1100個家庭月度收入與消費支出數(shù)據(jù)(單位:元)根據(jù)這些數(shù)據(jù),說明收入對消費支出影響的規(guī)律性。解:由經濟理論可知,收入是解釋變量,消費支出是被解釋變量。從這些數(shù)據(jù)可以看出,雖然每個收入水平對應下的消費支出是不相同的,但平均而言當收入增加時,消費支出也會增加。計算每個收入水平對應的平均消費支出,由于這個平均值是在給定的收入條件下得到的,所以稱為條件均值,一般用符號E(Y|Xi)表示,如E(Y|Xi=4000)=2720,表示在收入水平為4000元的條件下,消費支出是2720元。繪制X與Y的散點圖(見圖2-3):圖2-3收入與消費支出的散點圖由圖2-3可以看出,消費支出的條件均值可以用一條直線來表示:我們稱式(2-8)為總體線性回歸方程,因為它是一個一元一次方程,所以也稱為總體一元線性回歸方程。對于相同收入水平的家庭,消費支出并不一定相同。每個家庭的具體消費支出與其條件均值會有一個“偏差”,這個偏差記為ui,之所以加下標是因為在同一個收入水平下,這樣的偏差有多個。顯然有:由式(2-8)和式(2-9)可得:我們稱式(2-10)為總體回歸模型,它是刻畫總體真實統(tǒng)計關系的模型。由例2-4的分析可知,斜率項系數(shù)β1表示邊際消費傾向。由以上分析可知,收入對消費支出的影響可以用一元線性方程“近似”地來刻畫。對于總體線性回歸方程和模型我們要做如下理解和說明:第一,總體線性回歸方程是被解釋變量(Y)的條件均值與解釋變量(X)真實關系的描述,總體回歸模型是兩者統(tǒng)計關系的描述。第二,要確定總體線性回歸方程,只需確定截距項系數(shù)和斜率項系數(shù)即可,而且這些系數(shù)往往表示特定的經濟學含義,如在消費模型中斜率項系數(shù)表示邊際消費傾向。由于在研究的同一個問題中,總體是唯一確定的,所以這些系數(shù)也是唯一確定的,或者說是一種客觀存在,它們是統(tǒng)計意義上的參數(shù),稱為總體回歸系數(shù)。第三,ui表示在同一X水平下每個實際Y與其條件均值的離差,這樣的偏差是一種誤差,這種誤差的形成是由隨機原因造成的,故ui是隨機誤差,ui項也稱為隨機擾動項。第四,本例完全是一個假設的總體,在實際中這樣小的總體是不存在的。我們可以設想,當我們觀察的總體足夠大時,在同一收入水平下的消費支出數(shù)據(jù)是非常多的,它們在一個比較狹小的區(qū)域中“堆積”,會形成一個消費支出(Y)的分布,我們相信消費支出數(shù)據(jù)會在其均值附近集中,而偏差均值的數(shù)據(jù)是較少的。由于ui=Yi-E(Y|Xi),所以根據(jù)Y的分布可以得到關于ui的分布,而且這兩個分布在形態(tài)上應該是相同的。那么,這個分布的形態(tài)是怎樣的呢?我們用計算機隨機生成10000個收入水平為4000元的家庭消費支出數(shù)據(jù),這些數(shù)據(jù)以2720元為均值,繪制消費支出和隨機擾動項的直方圖??梢悦黠@看到,這個分布的形態(tài)近似的是正態(tài)分布(見圖2-4)。在模型中引入隨機擾動項的原因是復雜的,歸納起來有以下幾點:(1)隨機誤差項代表了模型中并未包括的變量的影響。例如,我們要研究居民的收入對消費行為的影響,即用收入(解釋變量X)解釋消費支出(被解釋變量Y)。但是從實際的經濟活動來看,不僅僅是收入會影響消費支出,如商品的價格、營銷策略、消費者對該商品的需求狀況、需求偏好等因素都會對消費支出造成影響,我們就可以把這些影響因素用隨機擾動項ui來表示。圖2-4由10000個模擬數(shù)據(jù)生成的分布圖(2)經濟行為內在的隨機性。雖然人類的經濟行為是理性的,但也不可以完全可預測,所以這些行為的結果——經濟變量是隨機變量,這是我們做何種努力都無法精確解釋的,隨機擾動項則反映了經濟行為中的一些內在隨機性。(3)數(shù)據(jù)的測量誤差。一般來說消費支出的數(shù)據(jù)相對真實,但收入數(shù)據(jù)可能是有偏差的,比如有些人會夸大或隱瞞收入,有些人可能會超前消費,故與消費支出數(shù)據(jù)對應的收入數(shù)據(jù)很可能不是與實際情況相吻合的;另外在數(shù)據(jù)統(tǒng)計時往往會四舍五入,也會產生誤差。所有這些誤差我們用隨機擾動項ui來表示。(4)引入隨機擾動項有利于建立比較簡單的模型。我們要考慮影響消費的所有因素,顯然是不現(xiàn)實的,此外模型中的解釋變量過多會使模型變得非常復雜,讓我們無從下手,也會影響我們分析核心的影響因素。特別需要說明的是,對于“線性”可以做兩方面的理解:一方面的理解是,對于變量而言是線性的,即解釋變量(X)與被解釋變量(Y)之間是線性關系;另一方面的理解是,對于系數(shù)而言是線性的,即回歸系數(shù)(β0,β1)與被解釋變量(Y)之間是線性關系,而且這種線性對于我們而言特別重要,這在以后的內容里會表現(xiàn)出來。例如,Y=β0+β1X對變量而言是線性的,對系數(shù)而言也是線性的;Y=β0+β1X2對變量而言不是線性的,對系數(shù)而言是線性的;Y=β0+對變量而言是線性的,對系數(shù)而言不是線性的。我們建立的總體的一元線性回歸方程和模型,只是在總體上確立了解釋變量與被解釋變量之間的關系。但是總體是不能被全面觀察的,例2-4只是假想的一個例子。如果要實際得到解釋變量與被解釋變量之間的關系,我們要進行抽樣,用樣本數(shù)據(jù)得到樣本回歸系數(shù),并估計總體回歸系數(shù)。2.3.2樣本回歸方程與回歸模型仍然以例2-4為例。對于各個收入水平,在其中隨機抽取消費支出數(shù)據(jù),表2-2顯示的是其中兩個樣本結果:表2-2在100個家庭里抽樣得到的兩個結果對于這個問題的抽樣,我們做如下理解和解釋:第一,為了保證樣本有好的代表性,選取的收入(X)與總體的收入完全一致,所以我們認為X的取值不是隨機的,或者說X不是隨機變量。第二,消費支出是隨機變量。第三,如果是重復抽樣,在100個家庭里抽取10個家庭做樣本,從理論上說最多可以得到10010個不同的樣本。也就是說,我們可以按這樣的方法抽樣,得到成千上萬個不同的樣本,表2-2僅僅顯示了其中的兩個樣本。我們將這兩個樣本的數(shù)據(jù)繪制成散點圖,如圖2-5所示。圖2-5兩個樣本的散點圖從兩個樣本的散點圖可以看到,收入(X)與消費支出(Y)之間近似一條直線,這樣我們就可以用直線來“近似”地表示這兩個變量之間的規(guī)律性。設定樣本回歸方程為:我們用,分別表示樣本回歸方程的截距項系數(shù)和斜率項系數(shù),稱為樣本回歸系數(shù)。這樣表示樣本回歸系數(shù),一是為了和總體回歸系數(shù)相區(qū)別,二是一般情況下在字母上加“^”表示是估計量。同理,表示Yi的估計值。從本質上來說,我們的思想是在給定的X(總體和樣本是相同的)條件下,用樣本回歸方程決定的去估計(近似)實際觀察到的Yi,這樣的過程也稱為擬合,也稱為Yi的擬合值。既然是Yi的擬合值,那么兩者之間就會有誤差,這個誤差記為ei,稱為殘差。則有:由式(2-11)和式(2-12)可得:式(2-13)稱為樣本回歸模型。對于樣本線性回歸方程和回歸模型做如下理解:第一,樣本線性回歸方程和回歸模型是總體線性回歸方程與模型的估計。我們認為,樣本的解釋變量(Xi)與總體的解釋變量(Xi)是相同的;樣本的被解釋變量(Yi)是從總體被解釋變量(Yi)中抽樣得到的,是Yi的擬合值,是對總體條件均值E(Y|Xi)的一個估計;樣本的殘差ei是對總體隨機擾動項ui的一個估計,樣本回歸系數(shù),是對總體回歸系數(shù)β0,β1的一個估計。第二,我們只需要確定樣本回歸系數(shù),,即可確定樣本回歸方程。第三,樣本回歸系數(shù),是統(tǒng)計量,是隨機變量。這是因為,是由樣本決定的,不同的樣本得到不同的,,而樣本是隨機抽樣得到的,故,的取值是隨機的,是隨機變量。第四,我們的目的是用樣本回歸系數(shù),對總體回歸系數(shù)β0,β1做估計。要實現(xiàn)這個目的,需要得到對于一個抽到的特定樣本(比如表2-2中的樣本1)所確定的,的值,以及它的抽樣分布與數(shù)量特征。用樣本去推斷總體,是統(tǒng)計學的基本思想。我們可以運用相應的統(tǒng)計學知識來得到樣本回歸系數(shù)的估計值,并推斷其分布,這些問題在下一章進行介紹。2.4不同類型數(shù)據(jù)構建的模型在第1章中,我們介紹了三種類型的數(shù)據(jù)——時間序列數(shù)據(jù)、截面數(shù)據(jù)和面板數(shù)據(jù),運用不同類型的數(shù)據(jù)可以構建不同的模型,一般稱為時間數(shù)據(jù)模型、截面數(shù)據(jù)模型和面板數(shù)據(jù)模型,我們可以用變量的下標來區(qū)別這些模型,例如:時間序列數(shù)據(jù)模型變量下標用t表示:Yt=β0+β1Xt+ut截面數(shù)據(jù)模型變量下標用i表示:Yi=β0+β1Xi+ui面板數(shù)據(jù)模型變量下標用it表示:Yit=β0+β1Xit+uit就經典的計量經濟學模型而言,構建的是時間序列數(shù)據(jù)模型和截面數(shù)據(jù)模型。本章小結相關分析與回歸分析是統(tǒng)計學的基本方法,也是計量經濟學的基本內容。判斷兩個變量是否存在相關關系的有效方法是繪制散點圖,在數(shù)量上判斷線性相關程度的指標是相關系數(shù)?;貧w分析是建立模型來刻畫變量之間的關系,由于總體往往是不能全面觀測的,所以我們可以用抽樣的方法得到樣本,建立樣本回歸模型,從而對總體對應的參數(shù)做估計。學習建議本章的學習要深入體會其基本思想——用樣本推斷總體,正確理解總體線性方程與模型以及樣本線性回歸方程與模型所表示的意義,掌握線性相關系數(shù)的計算方法,理解其表示的意義。1.本章重點散點圖的繪制相關系數(shù)的計算總體線性方程與模型樣本線性回歸方程與模型2.本章難點相關系數(shù)的計算總體線性方程與模型樣本線性回歸方程與模型核心概念相關分析回歸分析相關系數(shù)回歸系數(shù)隨機擾動項殘差課后思考與練習1.相關分析與回歸分析的關系是什么?2.如何直觀地判斷兩個變量之間是否存在相關性?3.為什么在建立總體回歸模型時要引入隨機擾動項?4.總體線性回歸方程與模型和樣本線性回歸模型是如何對應的?5.國家統(tǒng)計局發(fā)布的《中國統(tǒng)計年鑒2011》,公布了我國省會城市的相關經濟數(shù)據(jù),我們選取其中的地區(qū)生產總值和地方財政預算內收入兩個變量的數(shù)據(jù)(數(shù)據(jù)見教學資源data2-1)。(1)如果要做回歸分析,這兩個變量哪個是解釋變量,哪個是被解釋變量?(2)繪制其散點圖,判斷其相關的形式。(3)寫出相關系數(shù)的計算公式,并用Excel計算其相關系數(shù)。第3章一元線性回歸模型的估計學習目標·掌握普通最小二乘法(OLS)的基本原理·能夠運用OLS估計一元線性回歸模型的系數(shù)·了解一元線性回歸線的代數(shù)性質·理解擬合優(yōu)度的度量方法對于一個一元線性回歸模型來說,其對應的系數(shù)往往會有明確的經濟學含義。例如,消費模型Yi=β0+β1Xi+ui,其中Y表示消費,X表示收入,則斜率項系數(shù)β1表示邊際消費傾向?,F(xiàn)在的問題是,上述模型是總體的模型,而總體我們一般是不能全面觀察的。這也就意味著我們無法知曉表示重要經濟意義的參數(shù)β1。于是,我們抽取樣本,得到樣本數(shù)據(jù),再用樣本數(shù)據(jù)來估計對應的總體參數(shù)。3.1普通最小二乘法估計一元線性回歸模型參數(shù)的最常用、最簡潔的方法是普通最小二乘法(ordinaryleastsquares,OLS)。設總體一元線性回歸模型為:式中ui——隨機擾動項。樣本一元線性回歸模型為:式中ei——殘差項。樣本回歸方程為:我們的目的是通過估計樣本回歸方程式(3-3)得到總體線性回歸模型的系數(shù)β0,β1的估計值,。對于一個特定的樣本數(shù)據(jù),對應的點(Xi,Yi)不一定在同一條直線上,所以這些散點會與樣本回歸直線有誤差,這些誤差就是殘差項。從理論上講,近似地表示這些樣本點的直線有無數(shù)條,我們想要求的樣本回歸直線,是一條與所有樣本數(shù)據(jù)構成的點(Xi,Yi)誤差最小的直線(這種情形稱為擬合)。假定樣本容量為n,每個點(Xi,Yi)與假設最佳的理論的樣本回歸直線都會有一個誤差,所以就會有n個誤差,這些誤差就是殘差,計算公式為:其幾何意義,如圖3-1所示:圖3-1殘差的幾何意義由于這樣的殘差有n個,直觀地看,要使樣本回歸直線與樣本的散點(Xi,Yi)之間的誤差最小,則需要∑ei=∑(Yi-)為最小。但是,殘差的值可正可負(圖3-1只繪制了正離差的情形,負離差的情形請讀者自己繪制),求和時可以正負抵消,所以∑ei=∑(Yi-)的值會非常接近0,甚至為0。這樣,如果有兩條樣本回歸直線的殘差和都為0,我們就無法準確地判斷哪一條樣本回歸直線與散點的誤差更小。為了克服這個問題,我們可以用殘差的平方和來比較回歸直線與散點誤差的大小。由于殘差平方后為非負數(shù),求和時不會正負抵消,所以,能夠使殘差平方和為最小的回歸直線,就是與散點誤差最小的直線。于是由式(3-2)~式(3-4)得:由于樣本數(shù)據(jù)Xi,Yi都是已知且確定的,所以,上式中殘差平方和的值取決于系數(shù),的取值。這是一個顯而易見的事實,由于,是樣本回歸直線的截距和斜率,不同的,對應不同的直線,從而就有不同的殘差平方和。能夠使殘差平方和取得最小值的,所決定的直線就是我們要求的最佳的直線。由上述分析可知,殘差平方和是關于,的函數(shù),即:由高等數(shù)學知識可知,函數(shù)=Q(,)取得極值的必要條件是其偏導數(shù)為0,即:求上述兩個偏導數(shù)得:注意到ei=Yi-=Yi--Xi,式(3-7)、式(3-8)也可以表示為:對式(3-9)、式(3-10)進行整理得:式(3-11)和式(3-12)稱為正規(guī)方程,其中n是樣本容量。由這兩個正規(guī)方程組成的方程組是關于,的二元一次方程組,解這個方程組得:我們稱用這種方法得到的,為最小二乘估計量或OLS估計量,對應的直線為OLS回歸直線。由式(3-13)和式(3-14)可以看出,我們可以用樣本的觀測值計算出,,由此得到的直線是最佳直線。為了簡化計算,我們可以對上述兩個計算式進行簡化,得:式中X,Y——Xi,Yi的平均值,xi=Xi-X,yi=Yi-Y。式(3-15)和式(3-16)稱為最小二乘估計量的離差形式。對于最小二乘估計量(OLS估計量),,我們要做如下一些解釋:第一,OLS估計量,是由給定的樣本觀測值計算得到的。第二,OLS估計量,是總體參數(shù)β0,β1的點估計值。對于不同的樣本,用最小二乘法可以計算得到不同的值,所以,是統(tǒng)計量,是隨機變量。我們計算得到的是由給定樣本觀測值計算出的特定的一個值,它是成千上萬個估計值中的一個。第三,根據(jù)給定樣本觀測值計算得到,,便可以畫出樣本回歸直線的圖像。雖然進行了簡化,但在實際的計算過程中要得到這兩個最小二乘估計量的值還是非常煩瑣的。下面我們以一個實例來說明最小二乘法估計值的計算方法?!纠?-1】我們以表2-2中的樣本1為例。假定我們從100個家庭中抽到一個由10個家庭組成的樣本,觀測得到它們的收入和消費數(shù)據(jù)(見表3-1),計算OLS估計量,的值。解:用式(3-15)和式(3-16)進行計算。用Excel計算我們需要的各項數(shù)值,如表3-1所示:表3-1樣本數(shù)據(jù)和計算結果再代入公式得:則所求的樣本回歸直線為:其圖像,如圖3-2所示。圖3-2樣本回歸直線在實際運用中,我們可以用EViews軟件得到計算結果。EViews是EconometricsViews的縮寫,直譯為計量經濟學觀察,通常稱為計量經濟學軟件包,是專門用于數(shù)據(jù)分析、回歸分析和預測的工具,在科學數(shù)據(jù)分析與評價、金融分析、經濟預測、銷售預測和成本分析等領域應用非常廣泛。下面以例3-1的數(shù)據(jù)為例介紹EViews的操作方法。由于篇幅有限,所以只介紹主要的操作步驟,更為詳細的操作讀者可以參閱其他文獻。以下操作用EViews9完成,操作步驟如下。1.啟動雙擊EViews圖標即可啟動進入EViews主窗口,如圖3-3所示。2.建立工作文件在主菜單上依次點擊File/New/Workfile,將彈出一個對話框(見圖3-4),即選擇新建對象的類型為工作文件。在建立工作文件時,必須設定數(shù)據(jù)性質。由于本例數(shù)據(jù)是截面數(shù)據(jù),所以在Workfilestructuretype窗口選擇Unstructured/undated(非時序數(shù)據(jù)),在Datarange中輸入數(shù)據(jù)的個數(shù)后,點擊“OK”。如果是時間序列數(shù)據(jù),則要選擇Dated-regularfrequency,并在Dataspecification中選擇時間單位、起始期和終止期,點擊“OK”。其中時間單位有:Annual——年度、Monthly——月度、Semi-annual——半年度、Weekly——周、Quarterly——季度、Daily——日。工作文件窗口,如圖3-5所示。圖3-3EViews主窗口圖3-4工作文件對話框圖3-5工作文件窗口工作文件窗口是EViews的子窗口,工作文件一建立就包含了兩個對象,一個是系數(shù)向量C(用來保存估計系數(shù)),另一個是殘差序列RESID(實際值與擬合值之差)。3.建立工作對象在工作文件窗口上選擇Objects/NewObject,彈出一個對象窗口,選擇組(Group)對象并命名,點擊“OK”,如圖3-6所示。圖3-6組對象窗口4.輸入數(shù)據(jù)數(shù)據(jù)可以用復制/粘貼來輸入,但對應的數(shù)據(jù)文件是與EViews兼容的文件。為了操作方便,輸入數(shù)據(jù)后可以對變量進行重新命名,命名后可以直接關閉對象窗口,文件將自動保存,同時生成組對象中對應的變量序列,如圖3-7所示。圖3-7組文件和序列文件5.作圖在命令窗口中輸入EViews:scatxy回車,即可得到散點圖(注意,命令中橫坐標的變量在前,縱坐標的變量在后)。在圖窗口中點擊“Name”,命名,點擊“OK”,結果如圖3-8所示。圖3-8散點圖6.估計在命令窗口中輸入EViews:lsycx回車,即可得到OLS估計值(注意,命令中的順序,C表示截距項)。在方程窗口中點擊“Name”,命名,點擊“OK”,結果如表3-2所示。表3-2EViews估計的結果在這個結果中,C對應的是截距項系數(shù)(29.27273),X對應的是斜率項系數(shù)(0.662436),計算結果與前面手工計算的結果相同。7.保存用鼠標單擊工作文件空白處,然后在主菜單中選擇File/Save,給文件命名,點擊“確定”。以上操作還可以用菜單命令來完成,讀者可以參閱相關文獻。3.2樣本回歸直線的代數(shù)性質由OLS估計量所確定的樣本回歸直線是總體回歸的估計結果,其具有以下代數(shù)性質:(1)樣本回歸直線經過X和Y的樣本均值,即點(X,Y)在樣本回歸直線上。由式(3-16)整理得:即點(X,Y)在樣本回歸直線上。(2)估計的Y值()的均值等于實際觀測的Y的均值,即=Y。由式(3-16)得:對等式兩邊求和,注意到∑(Xi-X)=0,則有∑=∑Yi,再除以樣本容量n,即=Y。由以上兩條性質,我們可以得到樣本回歸模型和方程的離差形式。用式(3-2)減式(3-17)得Yi-Y=(Xi-X)+ei,則有:同理,用式(3-3)減式(3-17),由于=Y,可得:式(3-18)、式(3-19)分別被稱為樣本回歸模型和方程的離差形式,其中xi=Xi-X,yi=Yi-Y,=-Y。離差形式在以后的推導過程中起著重要的作用。(3)殘差(ei)的均值為0,即∑ei=0,由式(3-9)可得。(4)殘差(ei)與估計的Y值()不相關,即∑ei=0。由于∑ei=0,=-Y,則有:再由式(3-18)、式(3-19)得:由式(3-15)可得∑xiyi=,代入上式得∑ei=∑ei=0。(5)殘差(ei)與X值不相關,即∑Xiei=0,由式(3-10)可得。3.3擬合優(yōu)度的度量在第一節(jié)中,我們講述了如何用最小二乘法求出最佳的樣本回歸直線,即OLS回歸直線。在實例中,我們也求出了一條具體的樣本回歸直線,并繪制了圖像。從圖3-2可以看出,樣本回歸直線實際上是對樣本數(shù)據(jù)所決定的散點的一種近似或者逼近。既然是近似或者逼近,我們自然就會想到一個問題:如何度量近似的程度,或者說如何度量擬合的程度。這個問題就是擬合優(yōu)度的度量。由于對于一個給定的Xi,對應一個實際的觀測值Yi和一個估計值,所以從本質上講,這種擬合優(yōu)度是由Yi-決定的。因為樣本容量為n,一個最直觀的想法是用∑(Yi-)來度量擬合優(yōu)度,但是由OLS回歸直線的性質可知,∑(Yi-)=∑ei=0。于是我們又會想到用∑(Yi-)2來度量擬合優(yōu)度,由于∑(Yi-)2=,用最小二乘法得到的殘差平方和取得最小值,所以我們無法從取值來判斷擬合優(yōu)度。通過上述分析可以看出,直接比較Yi-不能很好地度量擬合優(yōu)度,于是人們就采用間接比較的方法??紤]到=Y,我們可以以Y為比較的基準,分別計算Yi-Y和-Y,由于∑(Yi-Y)=0、∑(-Y)=0,所以我們要計算∑(Yi-Y)2、∑(-Y)2。注意到Yi-Y=(-Y)+(Yi-),即yi=+ei。于是有:由OLS回歸直線的代數(shù)性質(4)得∑ei=0,代入式(3-21)有:式(3-22)和式(3-23)中各項平方和表示的意義是:=∑(Yi-Y)2是實際的樣本觀測值圍繞其均值Y的總變異,稱為總平方和(totalsumofsquares),記為TSS,它描述了所有的觀測值相對于Y的總偏離程度;=∑(-Y)2是回歸估計值圍繞其均值Y的總變異,稱為回歸平方和(explainedsumofsquares),記為ESS,它描述了所有的來自回歸的估計值相對于Y的偏離程度;=∑(Yi-)2是所有觀測值圍繞著OLS回歸直線的變異,稱為殘差平方和(residualssumofsquares),記為RSS,它描述了沒有被OLS回歸直線解釋的偏離程度。所以有:式(3-24)說明,Y的觀測值圍繞其均值Y的總變異可以分解為兩個部分,一部分來自回歸線,另一部分來自隨機的影響。其幾何意義如圖3-9所示:由式(3-24)得:圖3-9Yi變異的分解我們定義:顯然有:我們稱R2為判定系數(shù),或可決系數(shù)。由于其描述了回歸估計值對其均值偏離的程度占實際觀測值對其均值偏離的程度的百分數(shù),所以可決系數(shù)描述了擬合優(yōu)度。顯然,R2的值為0~1。如果R2=1,則有Yi=,此時所有的觀測值都在同一條直線上,是一個完全的擬合;如果R2=0,則有=Y,此時估計的直線是與x軸平行的直線,即斜率項系數(shù)=0,則X與Y沒有線性關系。如果R2越接近1,則說明擬合的程度越高,反之,如果R2越接近0,則說明擬合的程度越低。例如,R2=0.95說明Y中有95%的成分是由X做出的解釋。在一元線性回歸模型中,可以證明R2=r2,其中r是X與Y的相關系數(shù)。但是,可決系數(shù)與相關系數(shù)還是有區(qū)別的,這些區(qū)別表現(xiàn)在以下幾點。(1)R2是就模型而言的,r是就變量而言的;(2)R2描述的是解釋變量對被解釋變量解釋的程度,r描述的是兩個變量的依存關系;(3)R2所度量的是非對稱的關系,r度量的是對稱的關系;(4)R2的取值范圍是0~1,r的取值范圍是-1~1。R2有很多種計算方法,但無論用哪種方法計算量都很大。在EViews中會自動給出R2的結果。如在例3-1中,求樣本回歸方程的估計結果(見表3-2)中的R-squared就是R2,在這個問題中,其值等于0.984528,說明X對Y的解釋大約占98%。3.4案例分析【例3-2】GDP是一國總體經濟活動運行表現(xiàn)的概括性衡量指標,消費需求是經濟增長的助推器。我們選取了1978~2015年我國GDP和最終消費的數(shù)據(jù)(數(shù)據(jù)見教學資源data3-2),來分析消費對GDP的影響程度。解:1.建立工作文件打開EViews,選擇數(shù)據(jù)類型以及起始日期和終止日期,如圖3-10所示。圖3-10工作文件對話框2.輸入數(shù)據(jù)在命令窗口輸入:dataxy回車,即可快速建立Group。輸入對應的解釋變量和被解釋變量,如圖3-11所示。圖3-11組對象窗口3.作圖在命令窗口輸入:scatxy回車,即可得到散點圖。也可以在Group窗口中點擊View—Graph,選擇Graphtype為scatter,也可獲得散點圖,如圖3-12所示。圖3-12散點圖4.估計觀察散點圖發(fā)現(xiàn),樣本點近似于一條直線,于是可以考慮用一元線性回歸模型來近似表示兩個變量之間的規(guī)律性。在命令窗口中輸入命令:lsycx回車,得到樣本回歸方程,如表3-3所示。表3-3OLS估計結果由回歸結果得到樣本回歸方程:=-6909.806+2.002534Xt。這個結果說明,當消費增加1個單位時,GDP平均增加約2個單位。5.做樣本回歸直線在Group窗口中,點擊View-Graph,選擇Graphtype為scatter,F(xiàn)itlines選擇RegressionLine,點擊“OK”,即可得到如圖3-13所示的樣本回歸直線。圖3-13樣本回歸直線本章小結一元線性回歸模型是最簡單的回歸模型,它是學習計量經濟學的基礎性內容,并且在很多情況下有非常廣泛的運用。學習本章內容要正確理解模型的設定以及系數(shù)的意義;掌握用普通最小二乘法進行估計的方法,特別是要掌握EViews的基本操作方法;掌握樣本回歸方程的代數(shù)性質;理解擬合優(yōu)度的度量。學習建議本章是計量經濟學的基礎內容,在學習時要正確理解相關的基本概念,掌握基本方法,并掌握EViews的基本操作方法。1.本章重點模型的設定以及系數(shù)的意義普通最小二乘法擬合優(yōu)度的度量2.本章難點模型的設定以及系數(shù)的意義普通最小二乘法核心概念模型的設定隨機擾動項殘差普通最小二乘法課后思考與練習1.根據(jù)最小二乘法原理,所估計的模型已經使得擬合誤差達到最小,為什么還要討論模型的擬合優(yōu)度問題?2.為什么用決定系數(shù)R2評價擬合優(yōu)度,而不用殘差平方和作為評價標準?3.表3-4列出若干對自變量與因變量。每一對變量,你認為它們之間的關系如何?是正的、負的,還是無法確定的?并說明理由。表3-4上機實驗3-1實驗目的(1)收集、整理數(shù)據(jù)。(2)掌握EViews的基本操作。(3)建立城鎮(zhèn)居民、農村居民消費模型。實驗步驟和內容1.收集、整理數(shù)據(jù)以國家統(tǒng)計局公布的官方數(shù)據(jù)為準。(1)登錄國家統(tǒng)計局網站。(2)進入“統(tǒng)計數(shù)據(jù)”—“年度數(shù)據(jù)”—“中國統(tǒng)計年鑒”。(3)查找“各地區(qū)消費支出”和“各地區(qū)收入”的截面數(shù)據(jù)(城鎮(zhèn)和農村),并下載。(4)整理數(shù)據(jù)。設定“消費支出”為被解釋變量,“收入”為解釋變量。2.EViews的基本操作(1)建立“工作文件”。(2)建立“工作對象”。(3)錄入數(shù)據(jù)。(4)繪制“城鎮(zhèn)居民消費支出”變量、“城鎮(zhèn)居民可支配收入”變量的線圖。掃二維碼可詳細了解上機實驗操作過程。(5)繪制“農村居民消費支出”變量、“農村居民純收入”變量的線圖。(6)分別對以上兩個變量序列進行基本分析(描述統(tǒng)計)。(7)分別計算兩個變量的相關系數(shù)。(8)分別繪制兩個變量的散點圖。(9)分別估計城鎮(zhèn)、農村的消費模型對應的回歸方程。掃二維碼可詳細了解上機實驗操作過程。3.實驗要求與結果在實驗報告中記錄EViews的基本操作的步驟,并報告以下內容。(1)“城鎮(zhèn)居民消費支出”變量、“城鎮(zhèn)居民可支配收入”變量的線圖,并敘述兩個線圖之間有何關系。(2)“農村居民消費支出”變量、“農村居民純收入”變量的線圖,并敘述兩個線圖之間有何關系。(3)對城鎮(zhèn)、農村兩個變量序列進行基本分析(描述統(tǒng)計)的結果。(4)城鎮(zhèn)、農村兩個變量的相關系數(shù)。(5)城鎮(zhèn)、農村兩個變量的散點圖。(6)城鎮(zhèn)、農村消費模型對應的回歸方程的估計結果并畫出樣本回歸線。上機實驗3-2實驗目的(1)收集、整理數(shù)據(jù)。(2)掌握EViews的基本操作。(3)建立國內生產總值與貨幣供應量的回歸方程。實驗步驟和內容1.收集、整理數(shù)據(jù)以國家統(tǒng)計局公布的官方數(shù)據(jù)為準。(1)登錄國家統(tǒng)計局網站。(2)進入“統(tǒng)計數(shù)據(jù)”—“年度數(shù)據(jù)”—“中國統(tǒng)計年鑒”。(3)查找“國內生產總值”和“貨幣供應量”的時間序列數(shù)據(jù),并下載。(4)整理數(shù)據(jù)。設定“國內生產總值”為被解釋變量,“貨幣供應量”為解釋變量。2.EViews的基本操作(1)建立“工作文件”。(2)建立“工作對象”。(3)錄入數(shù)據(jù)。(4)繪制每個變量的線圖,并對每個變量序列做基本分析。掃二維碼可詳細了解上機實驗操作過程。(5)繪制國內生產總值與貨幣供應量的散點圖、線圖。(6)估計國內生產總值與貨幣供應量的回歸方程并畫出樣本回歸線。3.實驗要求與結果在實驗報告中記錄EViews的基本操作的步驟,并報告以下內容。(1)國內生產總值與貨幣供應量的散點圖、線圖,并說明其特點。(2)對變量序列進行基本分析(描述統(tǒng)計)的結果。(3)國內生產總值與貨幣供應量的回歸方程的估計結果。(4)做國內生產總值與貨幣供應量的樣本回歸直線。(5)驗證模型中的R2是否等于r2。第4章一元線性回歸模型的推斷學習目標·理解一元線性回歸模型的古典假定·掌握一元線性回歸模型估計量的統(tǒng)計性質·掌握一元線性回歸模型的檢驗·掌握一元線性回歸模型的點預測和區(qū)間預測·能夠運用一元線性回歸模型解決實際問題在上一章中,我們用最小二乘法估計了樣本回歸方程,得到系數(shù),,這樣做的一個重要目的是對對應的總體回歸方程的參數(shù)β0,β1進行估計,這樣的估計有其深遠的經濟學背景。例如,在消費模型中,斜率項系數(shù)就表示重要的經濟學概念——邊際消費傾向。但是,,僅是β0,β1的點估計值,而我們希望對β0,β1進行區(qū)間估計。于是我們就需要知道,的統(tǒng)計性質,推斷其分布形態(tài),這就需要,滿足一定的條件,這樣才能得到好的統(tǒng)計性質,這些條件就是古典假定,也稱為基本假定或高斯假定。4.1古典假定一般來說,古典假定可以分為兩個部分:一是對模型和變量的假定,二是對隨機擾動項ui的假定。1.對模型和變量的假定(1)在重復抽樣中,X的值是固定的。也就是說,我們認為,在一個回歸過程中,X是確定性變量,而不是隨機變量。(2)模型的設定是正確的。也就是說,模型沒有設定偏誤,即無論是從變量的設定還是函數(shù)形式的設定,模型都是正確的。2.對隨機擾動項ui的假定(1)零均值假定。零均值假定,即ui的條件均值為0。為了方便,我們將ui的條件均值簡記為E(ui),即E(ui|Xi)=E(ui)=0。這是一個非常直觀合理的假定,因為E(ui)表示的是每個Y圍繞給定的X均值的偏離,這種偏離可正可負,當試驗的次數(shù)非常多的時候,這樣的偏離就會正負抵消,其均值為0。(2)同方差假定。同方差假定,即ui的條件方差相同。為了方便,我們將ui的條件方差簡記為Var(ui),即Var(ui|Xi)=Var(ui)=E(ui-E(ui))2=E()=σ2。這個假定的意義是,我們希望對于不同的X,對應的Y的分散程度是相同的,于是它們均值的代表程度也相同。(3)無自相關假定。無自相關假定,即對于不同的ui之間不存在線性相關性,即Cov(ui,uj)=E(ui-E(ui))(uj-E(uj))=E(uiuj)=0(i≠j)。這個假定的含義是,我們不希望不同的ui之間,特別是時間序列模型中前后ui之間存在線性相關關系,ui是一個純粹的隨機誤差項。(4)ui與X之間不存在線性相關,即ui與X的協(xié)方差為0,即Cov(ui,Xi)=E(ui-E(ui))(Xi-E(Xi))=E(uiXi)=0。這個假定的含義是,我們要測定X對Y的影響,這種影響一定是“單純”的影響,如果ui與X之間存在線性相關,則我們無法測定X對Y的影響。(5)正態(tài)性假定。正態(tài)性假定,即ui服從正態(tài)分布。由零均值假定和同方差假定,得出ui~N(0,σ2)。由于ui是隨機誤差項,我們有足夠的理由相信其是服從正態(tài)分布的。我們給出了相關的古典假定,特別需要說明的是,古典假定是保證我們能夠得到OLS估計量理想統(tǒng)計性質的條件。也就是說,如果模型和ui滿足古典假定,OLS估計量就會有非常好的統(tǒng)計性質。但是,在實際運用中,古典假定是不一定能被滿足的,這時就需要有其他的估計方法,本章我們假定古典假定總是被滿足的。4.2OLS估計量的統(tǒng)計性質我們可以證明,在滿足古典假定的條件下,OLS估計量,具有非常好的統(tǒng)計性質。1.線性性線性性是指OLS估計量與Y之間是線性的。以為例,即要證明可以表示為Y的線性組合。設
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年江西省宜春市單招職業(yè)適應性測試題庫及參考答案詳解1套
- 2026年商丘學院單招職業(yè)適應性考試題庫及答案詳解一套
- 2026年重慶移通學院單招綜合素質考試題庫及參考答案詳解
- 2026年六盤水幼兒師范高等??茖W校單招職業(yè)技能測試題庫含答案詳解
- 2026年甘肅財貿職業(yè)學院單招職業(yè)傾向性考試題庫帶答案詳解
- 2026年山東文化產業(yè)職業(yè)學院單招綜合素質考試題庫附答案詳解
- 2026年廈門華廈學院單招職業(yè)傾向性測試題庫及參考答案詳解一套
- 2026年蘭州航空職業(yè)技術學院單招職業(yè)傾向性考試題庫參考答案詳解
- 2026年黑龍江省黑河市單招職業(yè)適應性測試題庫及完整答案詳解1套
- 2026年陜西旅游烹飪職業(yè)學院單招職業(yè)傾向性考試題庫及答案詳解1套
- 2025陜西榆林市榆陽區(qū)部分區(qū)屬國有企業(yè)招聘20人考試筆試模擬試題及答案解析
- 老年慢性病管理及康復護理
- 2025廣西自然資源職業(yè)技術學院下半年招聘工作人員150人(公共基礎知識)測試題帶答案解析
- 2026年海南經貿職業(yè)技術學院單招(計算機)考試參考題庫及答案1套
- 代辦執(zhí)照合同范本
- 2025天津大學管理崗位集中招聘15人備考考點試題及答案解析
- 口腔腫瘤腓骨皮瓣移植
- 2025昆明市呈貢區(qū)城市投資集團有限公司及下屬子公司第一批招聘(12人)(公共基礎知識)測試題附答案解析
- 2025年國家公務員錄用考試《行測+申論》真題卷(地市級)及答案解析
- (2025年)教育博士(EdD)教育領導與管理方向考試真題附答案
- 2025年起重機司機(限門式起重機)理論考試考題(有答案)
評論
0/150
提交評論