一元線性回歸模型理論與方法_第1頁
一元線性回歸模型理論與方法_第2頁
一元線性回歸模型理論與方法_第3頁
一元線性回歸模型理論與方法_第4頁
一元線性回歸模型理論與方法_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章一元線性回歸模型理論與辦法§1、回歸分析概述§2、一元線性回歸模型§2.1回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念二、總體回歸函數(shù)(方程)PRF三、總體回歸函數(shù)(方程)PRF的隨機設(shè)定四、隨機誤差項的含義五、樣本回歸方程(函數(shù))SRF一、變量間的關(guān)系及回歸分析的基本概念經(jīng)濟變量間的關(guān)系⑴擬定性關(guān)系(函數(shù)關(guān)系):研究的是擬定現(xiàn)象而非隨機變量間的關(guān)系。例如:圓的面積S=*r2其中,r為半徑。⑵統(tǒng)計依賴關(guān)系(有關(guān)關(guān)系):研究的是非擬定現(xiàn)象隨機變量間的關(guān)系。例如:農(nóng)作物的產(chǎn)量=F(氣溫,降雨量,陽光,施肥量)。統(tǒng)計依賴(有關(guān)關(guān)系)線性有關(guān)非線性有關(guān)正有關(guān)不有關(guān)負有關(guān)正有關(guān)不有關(guān)負有關(guān)有關(guān)系數(shù)(-1≤≤1)有因果關(guān)系無因果關(guān)系回歸分析有關(guān)分析注意:⑴不線性有關(guān)并不意味著不有關(guān)。⑵有有關(guān)關(guān)系并不意味著一定有因果關(guān)系。⑶回歸分析與有關(guān)分析研究一種變量對另一種(些)變量的統(tǒng)計依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。⑷回歸分析對變量的解決辦法存在不對稱性,即分辨被解釋變量和解釋變量:前者是隨機變量,后者不是。有關(guān)分析則對稱地看待被解釋變量和解釋變量,兩者都被看作是隨機的?;貧w分析:回歸分析是研究一種變量有關(guān)另一種(些)變量的統(tǒng)計依賴關(guān)系的計算辦法和理論。其用旨在于通過后者的已知或設(shè)定值,去預計和(或)預測前者的(總體)均值。前一種變量稱為被解釋變量(ExplainedVariable)或應變量(DependentVariable),后一種變量稱為解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)?;貧w分析的重要內(nèi)容:⑴根據(jù)樣本觀察值對計量經(jīng)濟模型參數(shù)進行預計,求得回歸方程。⑵對回歸方程、參數(shù)預計值進行明顯性檢查。⑶運用回歸方程進行分析、評價及預測。二、總體回歸函數(shù)(方程)PRF(populationregressionfunction)回歸分析是研究一種變量有關(guān)另一種(些)變量的統(tǒng)計依賴關(guān)系的計算辦法和理論。其用旨在于通過后者的已知或設(shè)定值,去預計和(或)預測前者的(總體)均值?;貧w分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值。例2.1:一種假想的社區(qū)人口總體有60戶家庭構(gòu)成,要研究該社區(qū)每月家庭消費支出Y與每月可支配家庭收入X的關(guān)系,即懂得了家庭的每月收入,預測每月消費支出的(總體)水平。為達成此目的,將該60戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費支出。表2.1某社區(qū)每月家庭收入與消費支出調(diào)查統(tǒng)計表每月家庭收入X(元)800100012001400160018002000220024002600每月家庭消費支出Y(元)550650790800102011001200135013701500600700840930107011501360137014501520650740900950110012001400140015501750700800940103011601300144015201650178075085098010801180135014501570175018000880011301250140001600189018500001150000162001910共計325046204450707067807500685010430966012110f(Y|X)1/51/61/51/71/61/61/51/71/61/7E(Y|X)6507708901010113012501370149016101730PRF總體回歸函數(shù):在給定解釋變量Xi條件下,被解釋變量Yi的盼望軌跡稱為總體回歸線(populationregressionline),更普通稱為總體回歸曲線(populationregressioncurve)。其對應的函數(shù)(方程)E(Y/Xi)=f(Xi)稱為(雙變量)總體回歸函數(shù)(方程)。其中,f代表一種函數(shù)關(guān)系。注意:⑴回歸函數(shù)(PRF)闡明被解釋變量Yi的平均狀態(tài)(總體條件盼望)隨解釋變量Xi變化的規(guī)律。⑵總體回歸函數(shù)的函數(shù)形式能夠是線性的,也能夠是非線性的。以線性函數(shù)為例,其形式為:其中,

0與1為固定的參數(shù),稱為回歸系數(shù)。三、PRF的隨機設(shè)定個別家庭的消費支出與給定收入水平間的關(guān)系:其中,i稱為觀察值Yi圍繞它的盼望值E(Y/Xi)的離差(deviation),是一種不可觀察的隨機變量,又稱為隨機干擾項或隨機誤差項。將上述公式加以變幻,可得出個別家庭的消費支出以下:公式表明,給定收入水平Xi,個別家庭的支出可表達為兩部分之和:⑴該收入水平下全部家庭的平均消費支出E(Y/Xi),稱為系統(tǒng)性(systematic)部分,或擬定性(deterministic)部分。⑵隨機或非擬定性部分該公式稱為總體回歸函數(shù)(PRF)的隨機設(shè)定形式。它表明被解釋變量Y除了受解釋變量X的系統(tǒng)性影響外,還受其它未涉及在模型中而又集體地影響著Y的全部變量的隨機性影響,i即為這些集體變量的替代物。正是由于模型中引入了隨機項,才稱為計量經(jīng)濟學模型,又稱為總體回歸模型。四、隨機誤差項的含義隨機誤差項是在模型設(shè)定中省略下來而又集體地影響著被解釋變量Y的全部變量的替代物。重要內(nèi)容涉及:⑴在解釋變量中被無視的因素的影響。在研究一經(jīng)濟現(xiàn)象時,影響某一經(jīng)濟變量的因素有許多,但是,在建立計量經(jīng)濟學模型時,我們不可能將全部因素都作為自變量涉及在模型中,只能選擇重要因素,其它被省略掉的因素對被解釋變量的影響都歸入了隨機誤差項。⑵變量觀察值的觀察誤差的影響。對于變量的樣本觀察值,無論是實際測量得來的,或是調(diào)查統(tǒng)計得來得,都不可避免的會產(chǎn)生誤差。這些誤差歸并到隨機誤差項中。⑶模型關(guān)系的設(shè)定誤差的影響。即為數(shù)學模型形式的誤差。經(jīng)濟現(xiàn)象事實上是很復雜的,自變量與因變量之間的關(guān)系在許多狀況下并非完全的線性關(guān)系,可是我們?yōu)榱撕啒闫鹨娡镁€性模型來替代,這就造成了模型形式的誤差,它對因變量的影響也涉及在隨機誤差項中。⑷其它隨機因素的影響。由于經(jīng)濟行為不象科學實驗那樣完全在人為地控制下進行,有些因素是無法控制的,是一種隨機現(xiàn)象。如一種消費者對某種商品的購置,可能由于廣告的宣傳本不想買而購置了;也可能由于某些人的勸告本想買反而不購置了等等。將這些不易預測和無法度量的因素,在模型中都有隨機誤差項表達。產(chǎn)生并設(shè)計隨機誤差項的重要因素:⑴理論的含糊性;⑵數(shù)據(jù)的欠缺;⑶節(jié)省原則。五、樣本回歸方程(函數(shù))SRF(sampleregressionfunction)例2.2:在例2.1的總體中有以下一種樣本(見下表),問:能否用該樣本預測總體中對應于選定X的平均每月消費支出?即能否用該樣本預計總體回歸函數(shù)PRF?表2.2X800100012001400160018002000220024002600Y700650900950110011501200140015501500每月家庭收入與消費支出數(shù)據(jù)表(樣本)X800100012001400160018002000220024002600Y700650900950110011501200140015501500SRF樣本回歸曲線(sampleregressionlines)和樣本回歸函數(shù)(sampleregressionfunction):上圖中的樣本散點圖近似于一條直線,劃一條直線以盡量好地擬合該散點圖,該直線稱為樣本回歸曲線。將上述樣本回歸線以函數(shù)形式表達為:稱為樣本回歸函數(shù)(SRF)。對比這兩個公式,能夠看出:公式(2)是公式(1)的近似替代物;是E(Y/Xi)的預計量;為0的預計量;(1)(2)是1的預計量。樣本回歸函數(shù)的隨機形式及樣本回歸模型:其中,樣本殘差項(residual),代表了其它影響Yi的隨機因素的集合體,可當作為i的預計量。該模型由于引入了隨機項,成為計量經(jīng)濟模型,將該模型稱為樣本回歸模型。樣本殘差項回歸分析的重要目的:根據(jù)樣本回歸函數(shù)(SRF),預計總體回歸函數(shù)(PRF),即根據(jù)公式(2)預計公式(1)。(1)(2)即:設(shè)計一“辦法”構(gòu)造SRF,使得SRF盡量地“靠近”PRF,或者說使盡量地靠近0和1。樣本與總體回歸線YXiXSRFPRF§2.2一元線性回歸模型一、線性回歸模型的特性二、線性回歸模型的普遍性三、線性回歸模型的基本假定四、參數(shù)預計:OLS1、OLS2、離差形式3、SRF的性質(zhì)五、OLS預計量的性質(zhì)五、OLS預計量的性質(zhì)1、線性性2、無偏性3、有效性六、參數(shù)預計量的概率分布和隨機誤差項的方差預計七、統(tǒng)計檢查1、擬合優(yōu)度檢查2、參數(shù)的明顯性檢查(t檢查)八、回歸系數(shù)的置信區(qū)間檢查九、回歸分析的應用:預測問題一、線性回歸模型的特性單方程線性回歸模型的概念和普通形式:單方程計量經(jīng)濟學模型是以單一經(jīng)濟現(xiàn)象為研究對象而建立的模型,模型中只涉及一種方程,是應用最為普遍的計量經(jīng)濟學模型,分為線性模型和非線性模型兩大類。普通形式為:i=1,2,…,n。其中,i為觀察下標,n為樣本容量。一元線性回歸模型:形如的計量經(jīng)濟學模型稱為一元線性回歸模型(雙變量線性模型)。其中,Y為被解釋變量,X為解釋變量,

0與1為待估參數(shù),為隨機誤差項。一元線性回歸模型舉例:凱恩斯的絕對收入假設(shè)消費理論認為,消費是由收入唯一決定的,是收入的線性函數(shù),事實上,消費與收入之間的關(guān)系并不是精確實現(xiàn)的,其計量經(jīng)濟學模型為:每給定一種收入Y的值,消費C并不是單一擬定的,而是由許多因素共同擬定,其概率分布與隨機誤差項的概率分布相似。線性回歸模型的特性:⑴通過引入隨機誤差項,將變量之間的關(guān)系用一種線性隨機方程來描述,并用隨機數(shù)學的辦法來預計方程中的參數(shù)。⑵在線性回歸模型中,被解釋變量的特性由解釋變量與隨機誤差項共同決定。二、線性回歸方程的普遍性將非線性關(guān)系轉(zhuǎn)化為線性關(guān)系的慣用的解決辦法:⑴直接置換法雙曲線:如商品的需求曲線是一種雙曲線形式,商品需求量q與商品價格p之間的關(guān)系體現(xiàn)為雙曲線關(guān)系?,F(xiàn)令:y=1/q;x=1/p則原方程轉(zhuǎn)換為:y=a+bx拋物線:如拉弗曲線描述的稅收s和稅率r的關(guān)系是一種拋物線的形式:s=a+br+cr2c<0現(xiàn)令:x1=r,x2=r2原方程置換為:s=a+bx1+cx2c<0⑵對數(shù)變換法冪函數(shù):如出名的Cobb-Dauglas生產(chǎn)函數(shù)將產(chǎn)出量Q與投入要素(K,L)之間的關(guān)系描述為冪函數(shù)的形式:現(xiàn)將方程兩邊取對數(shù),則變換為線性形式以下:指數(shù)函數(shù):如生產(chǎn)中成本C與產(chǎn)出量q的關(guān)系:將方程兩邊取對數(shù)后,即成為線性形式以下:結(jié)論:實際經(jīng)濟生活中的許多問題,都能夠最后轉(zhuǎn)化為線性問題,因此,線性回歸模型含有普遍意義。即使對于無法采用任何變換辦法使之變成線性的非線性模型,現(xiàn)在使用的較多的參數(shù)預計辦法——非線性最小二乘法,其原理仍然是一線性預計辦法為基礎(chǔ)。三、線性回歸模型的基本假定回歸分析的重要目的:通過樣本回歸函數(shù)(模型)SRF盡量精確地預計總體回歸函數(shù)(模型)PRF。即通過預計

技術(shù)線路:⑴使預計量與Yi的“總體”誤差盡量地小——最小二乘法。⑵使回歸系數(shù)的預計量盡量地與其本身靠近。要滿足上述規(guī)定,必須對解釋變量和隨機誤差項做出合理假定。線性回歸模型的基本假設(shè):⑴解釋變量X1,X2,…,Xk是擬定性變量,不是隨機變量,并且解釋變量之間互不有關(guān)。⑵隨機誤差項含有0均值和同方差。即:解釋:對X的每個觀察值來說能夠取不同的值,有些不不大于零,有些不大于零,但其總體的平均值,即均值等于零。隨機誤差項含有同方差,是指各次觀察所受的隨機影響的程度相似,即等方差性。樣本與總體回歸線YXiXSRFPRF⑶隨機誤差項在不同樣本點之間是獨立的,不存在序列有關(guān)。即:該假設(shè)表明,在任意兩次觀察時,i,j是不有關(guān)的,即在某次觀察中取的值與任何其它次觀察中取的值互不影響。⑷隨機誤差項與解釋變量之間不有關(guān)。即:該假設(shè)是指,隨機誤差項與解釋變量不有關(guān)。由于在建立回歸模型時,隨機誤差項代表了全部未涉及在模型中的自變量及其它因素對因變量的影響,因此,應把X和各自對Y的影響分辨開,即兩者之間不有關(guān)。⑸隨機誤差項服從0均值、同方差的正態(tài)分布。即:該假設(shè)符合經(jīng)濟實際,由于從實際經(jīng)驗和理論分析可知,隨機影響可看作或近似看作服從正態(tài)分布。注意:在實際建立模型的過程中,除了基本假設(shè)⑸之外,對模型與否滿足假設(shè)都要進行檢查。由于解釋變量Xi是擬定性變量,隨機誤差項i是隨機性變量,因此被解釋變量Yi是隨機變量,且其分布(特性)與i相似。四、一元線性回歸模型的參數(shù)預計:普通最小二乘法(OLS)1、普通最小二乘法OLS2、參數(shù)預計的離差形式3、樣本回歸線SRF的性質(zhì)1、普通最小二乘法(OLS)已知一組樣本觀察值(Yi,Xi)(i=1,2,…,n),規(guī)定樣本回歸函數(shù)盡量好地擬合這組值,即樣本回歸線上的點與真實觀察點Yi的“總體”誤差盡量地小。在技術(shù)解決上我們普通采用“最小二乘法”。最小二乘原則:由于預計值和實測值之差可正可負,簡樸求和可能將很大的誤差抵消掉,因此,只有平方和才干反映兩者在總體上的靠近程度。最小二乘法給出的判斷原則是:兩者之差的平方和最小。即:最小。也就是說在給定樣本觀察值之下,選擇出、能使得Yi與之差的平方和最小。用最小二乘法預計和:是、的二次非負函數(shù),故該函數(shù)存在極小值。根據(jù)微積分辦法,當Q對、的一階偏導數(shù)為0時,Q達成最小。即:求偏導后得:或該方程組稱為正則方程組(normalequations)解上述二元一次方程組得:2、參數(shù)預計的離差形式(deviationform)記則xi、yi分別表達對各自均值的離差。將離差帶入正則方程組,則參數(shù)預計量的離差形式為:由于、的預計成果是從最小二乘原理得到的,故稱之為最小二乘預計量。3、樣本回歸線SRF的性質(zhì)⑴樣本回歸線通過Y和X的樣本均值。證明:由于即:故,樣本回歸線通過Y和X的樣本均值。⑵預計的Y的均值等于實測的Y的均值證明:由于則有,即預計的Y的均值與實測的Y的均值相等。(3)殘差的均值為零。由正則方程組:可知:即:因此,即殘差的均值為零。(4)殘差和預測的Yi不有關(guān)。(5)殘差與Xi不有關(guān)。五、OLS預計量的性質(zhì)1、線性性2、無偏性3、有效性1、線性性指的是預計量、是Yi的線性組合。令則令則2、無偏性預計量、的均值(盼望值)等于總體回歸參數(shù)真值0與1。即證:易知:同樣地,容易得出:3、有效性(最小方差性)在全部線性無偏預計量中,最小二乘預計量、含有最小方差。高斯—馬爾可夫定理:在給定典型線性回歸的假定下,最小二乘預計量是含有最小方差的線性無偏預計量。最佳線性無偏預計量——BLUE預計量(theBestLinearUnbiasedEstimator)普通最小二乘預計量OLS含有線性性、無偏性、最小方差性等優(yōu)良性質(zhì)。含有這些優(yōu)良性質(zhì)的預計量稱為最佳線性無偏預計量,即BLUE預計量。全部預計量線性無偏預計量BLUE預計量六、參數(shù)預計量的概率分布和隨機誤差項的方差預計1、和的概率分布、分別是Yi的線性組合,因此,和的概率分布取決于Y。我們懂得,在是正態(tài)分布的假設(shè)下,Y是正態(tài)分布,因此,、也服從正態(tài)分布,其分布特性由其均值和方差共同決定。記、的原則差分別為:

1S(

^)2、隨機誤差項的方差2的預計在預計的參數(shù)和的方差和原則差的體現(xiàn)式中,都含有隨機誤差項方差2=var(i)。2又稱為總體方差。由于隨機誤差項i不可觀察,2事實上是未知的,只能從i的預計量——殘差ei出發(fā),對總體方差2進行預計??傮w方差2的無偏預計量為:在總體方差的無偏預計量求出后,和的方差和原則差的預計量分別為:的樣本方差:的樣本原則差為:的樣本方差:的樣本原則差為:思考:例2.3:在例2.1的總體中有以下一種樣本(見下表),求預計的參數(shù)和及其樣本原則

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論