版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第2章一元線性回歸分析§2.1:回歸分析及回歸模型§2.2:一元線性模型的參數(shù)估計(jì)§2.3:參數(shù)估計(jì)值的性質(zhì)及統(tǒng)計(jì)推斷§2.4:一元線性模型的統(tǒng)計(jì)檢驗(yàn)§2.5:一元線性模型的預(yù)測(cè)1/2/20231朱晉第2章一元線性回歸分析§2.1:回歸分析及回歸模型12§2.1:回歸分析及回歸模型一、變量間的關(guān)系及回歸分析的基本概念二、總體回歸函數(shù)三、隨機(jī)擾動(dòng)項(xiàng)和總體回歸模型的基本假設(shè)四、樣本回歸函數(shù)1/2/20232朱晉§2.1:回歸分析及回歸模型一、變量間的關(guān)系及回歸分析的基“回歸”一詞的歷史淵源“回歸”一詞最早由FrancisGalton引入。Galton發(fā)現(xiàn),雖然父母的身高對(duì)子女的身高起到?jīng)Q定性作用,但給定父母的身高后,他們兒女輩的平均身高卻趨向于或者“回歸”到社會(huì)平均水平。Galton的普遍回歸定律(lawofuniversalregression)。Galton的朋友KarlPearson通過收集一些家庭的1000多名成員的父子身高數(shù)據(jù),證明兒子確實(shí)“回歸到中等(regressiontomediocrity)”1/2/20233朱晉“回歸”一詞的歷史淵源“回歸”一詞最早由FrancisG2.1.1、變量間的關(guān)系
確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。
統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系?!鹘?jīng)濟(jì)變量之間的關(guān)系,大體可分為兩類:1/2/20234朱晉2.1.1、變量間的關(guān)系確定性關(guān)系或函數(shù)關(guān)系:研究的是確△對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的:1/2/20235朱晉△對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correl△幾點(diǎn)注意
不線性相關(guān)并不意味著不相關(guān);有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;
相關(guān)分析研究一個(gè)變量對(duì)另一個(gè)(些)變量的統(tǒng)計(jì)依賴關(guān)系,但它們并不意味著一定有因果關(guān)系;
相關(guān)分析對(duì)稱地對(duì)待任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的。回歸分析對(duì)變量的處理方法存在不對(duì)稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是。1/2/20236朱晉△幾點(diǎn)注意12/18/20226朱晉
回歸分析是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。這里前一個(gè)變量被稱為被解釋變量(ExplainedVariable)或應(yīng)變量(DependentVariable),后一個(gè)(些)變量被稱為解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)。2.1.2、回歸分析的基本概念1/2/20237朱晉回歸分析是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系回歸分析回歸分析通過樣本數(shù)據(jù)討論解釋變量與被解釋變量之間因果關(guān)系的數(shù)學(xué)聯(lián)系式,即有總體回歸模型:利用樣本觀察值找出參數(shù)和的估計(jì)值,得到樣本回歸模型:檢驗(yàn)估計(jì)值的性質(zhì),并利用樣本回歸模型分析被解釋變量的總體平均規(guī)律。1/2/20238朱晉回歸分析回歸分析通過樣本數(shù)據(jù)討論解釋變量與被解釋變量之間因果由于變量間關(guān)系的隨機(jī)性,回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當(dāng)解釋變量取某個(gè)確定值時(shí),與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出現(xiàn)的對(duì)應(yīng)值的平均值。1/2/20239朱晉由于變量間關(guān)系的隨機(jī)性,回歸分析關(guān)心的是根據(jù)解釋變量的已知或回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:(1)根據(jù)樣本觀察值對(duì)計(jì)量經(jīng)濟(jì)模型參數(shù)進(jìn)行估計(jì),求得回歸方程;(2)對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行檢驗(yàn);(3)利用回歸方程進(jìn)行分析、評(píng)價(jià)及預(yù)測(cè)。1/2/202310朱晉回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:12/2.1.2總體回歸函數(shù)(PRF)⒈例子例2.1:一個(gè)假想的社區(qū)有60戶家庭組成,要研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。即如果知道了家庭的月收入,能否預(yù)測(cè)該社區(qū)家庭的平均月消費(fèi)支出水平。為達(dá)到此目的,將該60戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費(fèi)支出(表2.1)。1/2/202311朱晉2.1.2總體回歸函數(shù)(PRF)⒈例子12/18/201/2/202312朱晉12/18/202212朱晉
由于不確定因素的影響,對(duì)同一收入水平X,不同家庭的消費(fèi)支出不完全相同;但由于調(diào)查的完備性,給定收入水平X的消費(fèi)支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditionaldistribution)是已知的,如:P(Y=550|X=800)=1/5。因此,給定收入X的值Xi,可得消費(fèi)支出Y的條件均值(conditionalmean)或條件期望(conditionalexpectation):該例中:E(Y|X=800)=650⒉分析1/2/202313朱晉由于不確定因素的影響,對(duì)同一收入水平X,不同家庭的消費(fèi)支
從散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,消費(fèi)“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。YX1/2/202314朱晉從散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,消費(fèi)“平均地說”也在增加,Y1/2/202315朱晉Y12/18/202215朱晉0y·····總體回歸模型的均值概念總體回歸函數(shù)樣本回歸函數(shù)⒊概念1/2/202316朱晉0y·····總體回歸模型的均值概念總體回歸函數(shù)樣本回歸函數(shù)
回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。函數(shù)形式可以是線性或非線性的。1/2/202317朱晉回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期2.1.3隨機(jī)擾動(dòng)(誤差)項(xiàng)
⒈隨機(jī)擾動(dòng)項(xiàng)的引入
總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費(fèi)支出水平。但對(duì)某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平有偏差。記稱為觀察值圍繞它的期望值的離差(deviation),它是一不可測(cè)度的隨機(jī)量,所以也稱隨機(jī)擾動(dòng)項(xiàng)(stochasticdisturbance),或隨機(jī)誤差項(xiàng)(stochasticerror)(2.1.2)1/2/202318朱晉2.1.3隨機(jī)擾動(dòng)(誤差)項(xiàng)
⒈隨機(jī)擾動(dòng)項(xiàng)的引入由(2.1.2)式,個(gè)別家庭的消費(fèi)支出為:(2.1.3)(2.1.3)稱為總體回歸模型。1/2/202319朱晉由(2.1.2)式,個(gè)別家庭的消費(fèi)支出為:(2.1.3)(22、隨機(jī)誤差項(xiàng)產(chǎn)生的原因:1)理論的含糊性;2)數(shù)據(jù)的欠缺;3)節(jié)省原則隨機(jī)誤差項(xiàng)主要包括下列因素的影響:(1)在解釋變量中被忽略的因素的影響;(2)變量觀測(cè)值的觀測(cè)誤差的影響;(3)模型關(guān)系的設(shè)定誤差的影響;(4)其他隨機(jī)因素的影響。1/2/202320朱晉2、隨機(jī)誤差項(xiàng)產(chǎn)生的原因:12/18/2022203、總體線性回歸模型(2.1.3)的基本假設(shè)有:1、隨機(jī)誤差項(xiàng)的均值為零2、隨機(jī)誤差項(xiàng)各分量的方差相等(等方差)3、隨機(jī)誤差項(xiàng)在不同樣本點(diǎn)之間是獨(dú)立的,不存在序列相關(guān)。即4、隨機(jī)誤差項(xiàng)與解釋變量之間不相關(guān)。即5、解釋變量x為確定性變量(非隨機(jī)變量)。6、隨機(jī)誤差項(xiàng)服從正態(tài)分布。~1/2/202321朱晉3、總體線性回歸模型(2.1.3)的基本假設(shè)有:12/18/yi,ui為隨機(jī)變量,xi為確定性變量,yi和xi有樣本值,是待估參數(shù)。ui服從正態(tài)分布:yi服從正態(tài)分布。在總體回歸模型:中1/2/202322朱晉yi,ui為隨機(jī)變量,xi為確定性變量,yi和xi有樣本值2.1.4、樣本回歸函數(shù)(SRF)1/2/202323朱晉2.1.4、樣本回歸函數(shù)(SRF)12/18/202223朱⒈問題的提出由于總體的信息往往無法掌握,現(xiàn)實(shí)的情況只能是在一次觀測(cè)中得到總體的一組樣本。問題是能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?例2.2:在例2.1的總體中有如下一個(gè)樣本,問:能否從該樣本估計(jì)總體回歸函數(shù)PRF?1/2/202324朱晉⒈問題的提出12/18/202224朱晉該樣本的散點(diǎn)圖(scatterdiagram):
樣本散點(diǎn)圖近似于一條直線,畫一條直線以盡可能好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以該線近似地代表總體回歸線。該線稱為樣本回歸線(sampleregressionlines),其函數(shù)形式記為:1/2/202325朱晉該樣本的散點(diǎn)圖(scatterdiagram):
注意:這里
將(2.1.4)看成(2.1.1)的近似替代。
1/2/202326朱晉注意:這里
將(2.1.4)看成(2.⒉樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型。1/2/202327朱晉⒉樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型由于方程中⒊回歸分析的主要目的根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。1/2/202328朱晉⒊回歸分析的主要目的根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函1/2/202329朱晉12/18/202229朱晉§2.2:一元線性模型的參數(shù)估計(jì)1/2/202330朱晉§2.2:一元線性模型的參數(shù)估計(jì)12/18/202230朱2.2普通最小二乘法(OLS)1/2/202331朱晉2.2普通最小二乘法(OLS)12/18/202231朱OLS回歸函數(shù)的特征1、樣本均值落在回歸直線上;2、y的理論估計(jì)值的均值即為;3、殘差一階和為0:4、殘差與解釋變量不相關(guān):5、殘差與y的理論預(yù)測(cè)值亦不相關(guān):1/2/202332朱晉OLS回歸函數(shù)的特征§2.3參數(shù)估計(jì)值的性質(zhì)及統(tǒng)計(jì)推斷高斯—馬爾可夫定理OLS下的統(tǒng)計(jì)推斷1/2/202333朱晉§2.3參數(shù)估計(jì)值的性質(zhì)及統(tǒng)計(jì)推斷高斯—馬爾可夫定理1
當(dāng)模型參數(shù)估計(jì)完成,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。一個(gè)用于考察總體的統(tǒng)計(jì)量,可從三個(gè)方面考察其優(yōu)劣性:(1)線性性(linear):即是否是另一隨機(jī)變量的線性函數(shù);(2)無偏性(unbiased):即它的均值或期望值是否等于總體的真實(shí)值;(3)有效性(efficient):即它是否在所有線性無偏估計(jì)量中具有最小方差。1/2/202334朱晉當(dāng)模型參數(shù)估計(jì)完成,需考慮參數(shù)估計(jì)值的精度,即是否能代2.3.1高斯—馬爾可夫定理若一元線性模型滿足計(jì)量經(jīng)濟(jì)基本假設(shè),則參數(shù)的最小二乘估計(jì)是最小方差的線性無偏估計(jì)。(BLUE)高斯—馬爾可夫定理的初步證明回顧:點(diǎn)估計(jì)的三個(gè)性質(zhì)---無偏性、有效性和一致性。(注:參數(shù)估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩類)1/2/202335朱晉2.3.1高斯—馬爾可夫定理若一元線性模型滿足計(jì)量經(jīng)濟(jì)基
有效性的圖形表示:1/2/202336朱晉有效性的圖形表示:12/18/202236朱
2.3.2OLS下的統(tǒng)計(jì)推斷1/2/202337朱晉2.3.2OLS下的統(tǒng)計(jì)推斷12/18/2022372、參數(shù)估計(jì)值的總體方差1/2/202338朱晉2、參數(shù)估計(jì)值的總體方差12/18/202238朱晉3、隨機(jī)誤差變量的方差估計(jì)值4、參數(shù)估計(jì)量的樣本方差標(biāo)準(zhǔn)差為方差的平方根,Eviews的結(jié)果一般用標(biāo)準(zhǔn)差表示。1/2/202339朱晉3、隨機(jī)誤差變量的方差估計(jì)值標(biāo)準(zhǔn)差為方差的平方根,第二周作業(yè):一、書p61-62:2.1(1)\(3),2.2二、證明OLS特征:3、殘差一階和為0:4、殘差與解釋變量不相關(guān):5、殘差與y的理論預(yù)測(cè)值亦不相關(guān):三、熟悉Eviews軟件,利用普通股交易資料作1-3只股票的單指數(shù)模型的樣本回歸模型。1/2/202340朱晉第二周作業(yè):一、書p61-62:2.1(1)\(3),2.2§2.4一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)
一、擬合優(yōu)度檢驗(yàn)
二、變量的顯著性檢驗(yàn)
三、參數(shù)的置信區(qū)間
1/2/202341朱晉§2.4一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)一、擬合優(yōu)度檢回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計(jì)性質(zhì)上已知,如果有足夠多的重復(fù)抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。主要包括擬合優(yōu)度檢驗(yàn)、變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間估計(jì)。1/2/202342朱晉回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說
2.4.1擬合優(yōu)度檢驗(yàn)
擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。
度量擬合優(yōu)度的指標(biāo):判定系數(shù)(可決系數(shù))R2
問題:采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合了樣本觀測(cè)值,為什么還要檢驗(yàn)擬合程度?1/2/202343朱晉2.4.1擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn):對(duì)樣本擬合度檢驗(yàn)的原理:y的理論預(yù)測(cè)值和真實(shí)的樣本值的距離越小,擬合度越好。所以有絕對(duì)指標(biāo)和相對(duì)指標(biāo)。定義:
此處利用到等式:1/2/202344朱晉擬合度檢驗(yàn)的原理:12/18/202244朱晉1、總離差平方和的分解
已知由一組樣本觀測(cè)值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線
1/2/202345朱晉1、總離差平方和的分解已知由一組樣本觀測(cè)值(Xi,Y如果Yi=?i即實(shí)際觀測(cè)值落在樣本回歸“線”上,則擬合最好??烧J(rèn)為,“離差”全部來自回歸線,而與“殘差”無關(guān)。1/2/202346朱晉如果Yi=?i即實(shí)際觀測(cè)值落在樣本回歸“線
對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:記總體平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares
)1/2/202347朱晉對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平TSS=ESS+RSS
Y的觀測(cè)值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機(jī)勢(shì)力(RSS)。在給定樣本中,TSS不變,如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此
擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS1/2/202348朱晉TSS=ESS+RSSY的觀測(cè)值圍繞其均值的總2、可決系數(shù)R2統(tǒng)計(jì)量
稱R2為(樣本)可決系數(shù)/判定系數(shù)(coefficientofdetermination)。
可決系數(shù)的取值范圍:[0,1]R2越接近1,說明實(shí)際觀測(cè)點(diǎn)離樣本線越近,擬合優(yōu)度越高。1/2/202349朱晉2、可決系數(shù)R2統(tǒng)計(jì)量稱R2為(樣本)可決系數(shù)/判定系在例2.1.1的收入-消費(fèi)支出例中,
注:可決系數(shù)是一個(gè)非負(fù)的統(tǒng)計(jì)量。它也是隨著抽樣的不同而不同。為此,對(duì)可決系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在第3章中進(jìn)行。
1/2/202350朱晉在例2.1.1的收入-消費(fèi)支出例中,注:可決系2.4.2一元線性模型的顯著性檢驗(yàn)回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。在一元線性模型中,就是要判斷X是否對(duì)Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。1/2/202351朱晉2.4.2一元線性模型的顯著性檢驗(yàn)回歸分析是要判斷解釋變1、顯著性檢驗(yàn)的原理:假設(shè)檢驗(yàn)通過對(duì)總體回歸模型中參數(shù)是否為零的統(tǒng)計(jì)學(xué)檢驗(yàn),推斷模型所表示的因果關(guān)系能否成立。一般分為單個(gè)參數(shù)的t-檢驗(yàn)和整體參數(shù)的F-檢驗(yàn)。一般先假設(shè)參數(shù)為0(原假設(shè)),在此基礎(chǔ)上建立統(tǒng)計(jì)量,再給出顯著性水平(如1%,5%),如果原假設(shè)成立,概率小于顯著性水平的事件應(yīng)該不成立,但若統(tǒng)計(jì)量顯示小概率事件亦會(huì)發(fā)生,只能推翻原假設(shè),選擇備選假設(shè)。1/2/202352朱晉1、顯著性檢驗(yàn)的原理:假設(shè)檢驗(yàn)通過對(duì)總體回歸模型中參數(shù)是否為回顧:t-分布與F-分布若隨機(jī)變量服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),則變量的平方服從-分布。K個(gè)獨(dú)立的,服從分布的隨機(jī)變量的和也服從分布,自由度為k.T-分布為一個(gè)標(biāo)準(zhǔn)正態(tài)分布與一個(gè)的平方根的商的隨機(jī)變量,即有其中為自由度。F-分布為兩個(gè)分布的商,有:,其中為自由度。1/2/202353朱晉回顧:t-分布與F-分布若隨機(jī)變量服從標(biāo)準(zhǔn)正態(tài)分布N(2、方程顯著性檢驗(yàn):
F-檢驗(yàn)及統(tǒng)計(jì)量:統(tǒng)計(jì)量為:
在給出顯著性水平后,可查表得到臨界值,若統(tǒng)計(jì)量的實(shí)際值大于臨界值,則原假設(shè)所有參數(shù)為0不能成立。1/2/202354朱晉2、方程顯著性檢驗(yàn):
F-檢驗(yàn)及統(tǒng)計(jì)量:統(tǒng)計(jì)量為:12/183、變量顯著性檢驗(yàn):
單個(gè)參數(shù)的t-檢驗(yàn)原理:給出原假設(shè)H0:β=0,根據(jù)t分布構(gòu)造相應(yīng)的t-統(tǒng)計(jì)量,并根據(jù)給出的數(shù)據(jù)算出統(tǒng)計(jì)量的值。再利用t分布的雙側(cè)特征,給定顯著性水平α,查表找出tα/2的臨界值。若統(tǒng)計(jì)量值的絕對(duì)值大于臨界值,則概率小于α的小概率事件發(fā)生,原假設(shè)不能成立。反之,不能推翻原假設(shè)。統(tǒng)計(jì)檢驗(yàn)1/2/202355朱晉3、變量顯著性檢驗(yàn):
單個(gè)參數(shù)的t-檢驗(yàn)原理:給出原假設(shè)H
假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)檢驗(yàn)的置信區(qū)間估計(jì)。
2.4.3參數(shù)的置信區(qū)間
1/2/202356朱晉假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)間(confidenceinterval);
1-稱為置信系數(shù)(置信度)(confidencecoefficient),
稱為顯著性水平(levelofsignificance);置信區(qū)間的端點(diǎn)稱為置信限(confidencelimit)或臨界值(criticalvalues)。1/2/202357朱晉如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)間(confide一元線性模型中,i(i=1,2)的置信區(qū)間:在變量的顯著性檢驗(yàn)中已經(jīng)知道:
意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2,t/2)的概率是(1-)。表示為:
即1/2/202358朱晉一元線性模型中,i(i=1,2)的置信區(qū)間:在變量的顯著于是得到:(1-)的置信度下,i的置信區(qū)間是
在上述收入-消費(fèi)支出例中,如果給定=0.01,查表得:
由于于是,1、0的置信區(qū)間分別為:(0.6345,0.9195)
(-433.32,226.98)
1/2/202359朱晉于是得到:(1-)的置信度下,i的置信區(qū)間是在上
由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。
要縮小置信區(qū)間,需
(1)增大樣本容量n,因?yàn)樵谕瑯拥闹眯潘较?,n越大,t分布表中的臨界值越??;同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減小;
(2)提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。1/2/202360朱晉由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)§2.5一元線性模型的預(yù)測(cè)
對(duì)于模型如果給定樣本以外的解釋變量的觀測(cè)值,有:因不是原來回歸方程中的樣本,所以和原模型中的不相關(guān)。如何求出的合理的值或范圍,就是回歸分析中預(yù)測(cè)的內(nèi)容。具體分為點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè)二塊。預(yù)測(cè)與置信區(qū)間1/2/202361朱晉§2.5一元線性模型的預(yù)測(cè)
對(duì)于模型12/18/202一、?f是條件均值E(Y|X=Xf)或個(gè)值Yf的一個(gè)無偏估計(jì)二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間
1/2/202362朱晉一、?f是條件均值E(Y|X=Xf)或個(gè)值Yf的一個(gè)無偏估計(jì)
對(duì)于一元線性回歸模型
給定樣本以外的解釋變量的觀測(cè)值Xf,可以得到被解釋變量的預(yù)測(cè)值?f
,可以此作為其條件均值E(Y|X=Xf)或個(gè)別值Yf的一個(gè)近似估計(jì)。
注意:嚴(yán)格地說,?f只是被解釋變量Yf的預(yù)測(cè)值的點(diǎn)估計(jì)值,而不是預(yù)測(cè)值。原因:(1)參數(shù)估計(jì)量不確定;(2)隨機(jī)項(xiàng)的影響1/2/202363朱晉對(duì)于一元線性回歸模型給定樣本以外的解釋變量的觀測(cè)值X一、?f是條件均值E(Y|X=Xf)或個(gè)值Yf的一個(gè)無偏估計(jì)對(duì)總體回歸函數(shù)E(Y|X=Xi)=0+1Xi,X=Xf時(shí)
E(Y|X=Xf)=0+1Xf于是可見,?f是條件均值E(Y|X=Xf)的無偏估計(jì)。1/2/202364朱晉一、?f是條件均值E(Y|X=Xf)或個(gè)值Yf的一個(gè)對(duì)總體回歸模型Y=0+1X+,當(dāng)X=Xf時(shí)于是而通過樣本回歸函數(shù),求得擬合值
的期望值為擬合值與樣本值的期望值相等,即:所以,的無偏估計(jì)。1/2/202365朱晉對(duì)總體回歸模型Y=0+1X+,當(dāng)X=Xf時(shí)于是而通過樣
二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間
1、總體均值預(yù)測(cè)值的置信區(qū)間
由于
于是可以證明
1/2/202366朱晉二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間1因此,有:
故
其中將未知的用它的無偏估計(jì)量代替,可構(gòu)造統(tǒng)計(jì)量:1/2/202367朱晉因此,有:故其中將未知的用它的無偏估計(jì)量這樣,在1-的置信度下,總體均值E(Y|Xf)的置信區(qū)間為:展開有:1/2/202368朱晉這樣,在1-的置信度下,總體均值E(Y|Xf)的置信區(qū)間為2、總體個(gè)值預(yù)測(cè)值的預(yù)測(cè)區(qū)間
如果已經(jīng)知道實(shí)際的預(yù)測(cè)值,那么預(yù)測(cè)誤差為:于是:有:1/2/202369朱晉2、總體個(gè)值預(yù)測(cè)值的預(yù)測(cè)區(qū)間如果已經(jīng)知道實(shí)際的預(yù)測(cè)值,那么從而在1-的置信度下,Yf的置信區(qū)間為:1/2/202370朱晉從而在1-的置信度下,Yf的置信區(qū)間為:12/18/2在上述收入-消費(fèi)支出例中,得到的樣本回歸函數(shù)為
則在X0=1000處,?0=–103.172+0.777×1000=673.84
而因此,總體均值E(Y|X=1000)的95%的置信區(qū)間為:673.84-2.30661.05<E(Y|X=1000)<673.84+2.30661.05或
(533.05,814.62)
1/2/202371朱晉在上述收入-消費(fèi)支出例中,得到的樣本回歸函數(shù)為則在X同樣地,對(duì)于Y在X=1000的個(gè)體值,其95%的置信區(qū)間為:673.84-2.30661.05<Yx=1000<673.84+2.30661.05或(372.03,975.65)總體回歸函數(shù)的置信帶(域)(confidenceband)個(gè)體的置信帶(域)
1/2/202372朱晉同樣地,對(duì)于Y在X=1000的個(gè)體值,其95%的置信區(qū)間為:對(duì)于Y的總體均值E(Y|X)與個(gè)體值的預(yù)測(cè)區(qū)間(置信區(qū)間):(1)樣本容量n越大,預(yù)測(cè)精度越高,反之預(yù)測(cè)精度越低;(2)樣本容量一定時(shí),置信帶的寬度當(dāng)在X均值處最小,其附近進(jìn)行預(yù)測(cè)(插值預(yù)測(cè))精度越大;X越遠(yuǎn)離其均值,置信帶越寬,預(yù)測(cè)可信度下降。1/2/202373朱晉對(duì)于Y的總體均值E(Y|X)與個(gè)體值的預(yù)測(cè)區(qū)間(置信區(qū)間作業(yè)二:課外練習(xí)部分1、書上第二章后面習(xí)題5和6。2、給出國(guó)家文教科學(xué)衛(wèi)生事業(yè)費(fèi)支出額ED(億元)和國(guó)家財(cái)政收入額FI(億元),作一元線性模型回歸分析,并對(duì)所有結(jié)果作出分析評(píng)估。若2003年預(yù)期的國(guó)家財(cái)政收入為12050億元,試求文教衛(wèi)支出2003年的點(diǎn)預(yù)測(cè)值和區(qū)間預(yù)測(cè)值(部分?jǐn)?shù)據(jù)為模擬數(shù)據(jù))。與第一次作業(yè)一起交;年份EDFI年份EDFI1991708314919981987932019927933483199920219876199395843492000221310356199412785218200125361158919951467624220022960130101996170474082003
14268199719048651
1/2/202374朱晉作業(yè)二:課外練習(xí)部分1、書上第二章后面習(xí)題5和6。年份EDFEviews練習(xí)題操作順序1、建立工作文件;2、編輯序列,輸入數(shù)據(jù)或修改數(shù)據(jù)3、統(tǒng)計(jì)分析,作散點(diǎn)圖或其它圖形4、利用LS作回歸分析5、針對(duì)結(jié)果作統(tǒng)計(jì)檢驗(yàn),并討論效果6、查看預(yù)測(cè)值1/2/202375朱晉Eviews練習(xí)題操作順序1、建立工作文件;12/18/2第2章一元線性回歸分析§2.1:回歸分析及回歸模型§2.2:一元線性模型的參數(shù)估計(jì)§2.3:參數(shù)估計(jì)值的性質(zhì)及統(tǒng)計(jì)推斷§2.4:一元線性模型的統(tǒng)計(jì)檢驗(yàn)§2.5:一元線性模型的預(yù)測(cè)1/2/202376朱晉第2章一元線性回歸分析§2.1:回歸分析及回歸模型12§2.1:回歸分析及回歸模型一、變量間的關(guān)系及回歸分析的基本概念二、總體回歸函數(shù)三、隨機(jī)擾動(dòng)項(xiàng)和總體回歸模型的基本假設(shè)四、樣本回歸函數(shù)1/2/202377朱晉§2.1:回歸分析及回歸模型一、變量間的關(guān)系及回歸分析的基“回歸”一詞的歷史淵源“回歸”一詞最早由FrancisGalton引入。Galton發(fā)現(xiàn),雖然父母的身高對(duì)子女的身高起到?jīng)Q定性作用,但給定父母的身高后,他們兒女輩的平均身高卻趨向于或者“回歸”到社會(huì)平均水平。Galton的普遍回歸定律(lawofuniversalregression)。Galton的朋友KarlPearson通過收集一些家庭的1000多名成員的父子身高數(shù)據(jù),證明兒子確實(shí)“回歸到中等(regressiontomediocrity)”1/2/202378朱晉“回歸”一詞的歷史淵源“回歸”一詞最早由FrancisG2.1.1、變量間的關(guān)系
確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。
統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。△經(jīng)濟(jì)變量之間的關(guān)系,大體可分為兩類:1/2/202379朱晉2.1.1、變量間的關(guān)系確定性關(guān)系或函數(shù)關(guān)系:研究的是確△對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的:1/2/202380朱晉△對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correl△幾點(diǎn)注意
不線性相關(guān)并不意味著不相關(guān);有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;
相關(guān)分析研究一個(gè)變量對(duì)另一個(gè)(些)變量的統(tǒng)計(jì)依賴關(guān)系,但它們并不意味著一定有因果關(guān)系;
相關(guān)分析對(duì)稱地對(duì)待任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的?;貧w分析對(duì)變量的處理方法存在不對(duì)稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是。1/2/202381朱晉△幾點(diǎn)注意12/18/20226朱晉
回歸分析是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。這里前一個(gè)變量被稱為被解釋變量(ExplainedVariable)或應(yīng)變量(DependentVariable),后一個(gè)(些)變量被稱為解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)。2.1.2、回歸分析的基本概念1/2/202382朱晉回歸分析是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系回歸分析回歸分析通過樣本數(shù)據(jù)討論解釋變量與被解釋變量之間因果關(guān)系的數(shù)學(xué)聯(lián)系式,即有總體回歸模型:利用樣本觀察值找出參數(shù)和的估計(jì)值,得到樣本回歸模型:檢驗(yàn)估計(jì)值的性質(zhì),并利用樣本回歸模型分析被解釋變量的總體平均規(guī)律。1/2/202383朱晉回歸分析回歸分析通過樣本數(shù)據(jù)討論解釋變量與被解釋變量之間因果由于變量間關(guān)系的隨機(jī)性,回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當(dāng)解釋變量取某個(gè)確定值時(shí),與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出現(xiàn)的對(duì)應(yīng)值的平均值。1/2/202384朱晉由于變量間關(guān)系的隨機(jī)性,回歸分析關(guān)心的是根據(jù)解釋變量的已知或回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:(1)根據(jù)樣本觀察值對(duì)計(jì)量經(jīng)濟(jì)模型參數(shù)進(jìn)行估計(jì),求得回歸方程;(2)對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行檢驗(yàn);(3)利用回歸方程進(jìn)行分析、評(píng)價(jià)及預(yù)測(cè)。1/2/202385朱晉回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:12/2.1.2總體回歸函數(shù)(PRF)⒈例子例2.1:一個(gè)假想的社區(qū)有60戶家庭組成,要研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。即如果知道了家庭的月收入,能否預(yù)測(cè)該社區(qū)家庭的平均月消費(fèi)支出水平。為達(dá)到此目的,將該60戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費(fèi)支出(表2.1)。1/2/202386朱晉2.1.2總體回歸函數(shù)(PRF)⒈例子12/18/201/2/202387朱晉12/18/202212朱晉
由于不確定因素的影響,對(duì)同一收入水平X,不同家庭的消費(fèi)支出不完全相同;但由于調(diào)查的完備性,給定收入水平X的消費(fèi)支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditionaldistribution)是已知的,如:P(Y=550|X=800)=1/5。因此,給定收入X的值Xi,可得消費(fèi)支出Y的條件均值(conditionalmean)或條件期望(conditionalexpectation):該例中:E(Y|X=800)=650⒉分析1/2/202388朱晉由于不確定因素的影響,對(duì)同一收入水平X,不同家庭的消費(fèi)支
從散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,消費(fèi)“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。YX1/2/202389朱晉從散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,消費(fèi)“平均地說”也在增加,Y1/2/202390朱晉Y12/18/202215朱晉0y·····總體回歸模型的均值概念總體回歸函數(shù)樣本回歸函數(shù)⒊概念1/2/202391朱晉0y·····總體回歸模型的均值概念總體回歸函數(shù)樣本回歸函數(shù)
回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。函數(shù)形式可以是線性或非線性的。1/2/202392朱晉回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期2.1.3隨機(jī)擾動(dòng)(誤差)項(xiàng)
⒈隨機(jī)擾動(dòng)項(xiàng)的引入
總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費(fèi)支出水平。但對(duì)某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平有偏差。記稱為觀察值圍繞它的期望值的離差(deviation),它是一不可測(cè)度的隨機(jī)量,所以也稱隨機(jī)擾動(dòng)項(xiàng)(stochasticdisturbance),或隨機(jī)誤差項(xiàng)(stochasticerror)(2.1.2)1/2/202393朱晉2.1.3隨機(jī)擾動(dòng)(誤差)項(xiàng)
⒈隨機(jī)擾動(dòng)項(xiàng)的引入由(2.1.2)式,個(gè)別家庭的消費(fèi)支出為:(2.1.3)(2.1.3)稱為總體回歸模型。1/2/202394朱晉由(2.1.2)式,個(gè)別家庭的消費(fèi)支出為:(2.1.3)(22、隨機(jī)誤差項(xiàng)產(chǎn)生的原因:1)理論的含糊性;2)數(shù)據(jù)的欠缺;3)節(jié)省原則隨機(jī)誤差項(xiàng)主要包括下列因素的影響:(1)在解釋變量中被忽略的因素的影響;(2)變量觀測(cè)值的觀測(cè)誤差的影響;(3)模型關(guān)系的設(shè)定誤差的影響;(4)其他隨機(jī)因素的影響。1/2/202395朱晉2、隨機(jī)誤差項(xiàng)產(chǎn)生的原因:12/18/2022203、總體線性回歸模型(2.1.3)的基本假設(shè)有:1、隨機(jī)誤差項(xiàng)的均值為零2、隨機(jī)誤差項(xiàng)各分量的方差相等(等方差)3、隨機(jī)誤差項(xiàng)在不同樣本點(diǎn)之間是獨(dú)立的,不存在序列相關(guān)。即4、隨機(jī)誤差項(xiàng)與解釋變量之間不相關(guān)。即5、解釋變量x為確定性變量(非隨機(jī)變量)。6、隨機(jī)誤差項(xiàng)服從正態(tài)分布。~1/2/202396朱晉3、總體線性回歸模型(2.1.3)的基本假設(shè)有:12/18/yi,ui為隨機(jī)變量,xi為確定性變量,yi和xi有樣本值,是待估參數(shù)。ui服從正態(tài)分布:yi服從正態(tài)分布。在總體回歸模型:中1/2/202397朱晉yi,ui為隨機(jī)變量,xi為確定性變量,yi和xi有樣本值2.1.4、樣本回歸函數(shù)(SRF)1/2/202398朱晉2.1.4、樣本回歸函數(shù)(SRF)12/18/202223朱⒈問題的提出由于總體的信息往往無法掌握,現(xiàn)實(shí)的情況只能是在一次觀測(cè)中得到總體的一組樣本。問題是能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?例2.2:在例2.1的總體中有如下一個(gè)樣本,問:能否從該樣本估計(jì)總體回歸函數(shù)PRF?1/2/202399朱晉⒈問題的提出12/18/202224朱晉該樣本的散點(diǎn)圖(scatterdiagram):
樣本散點(diǎn)圖近似于一條直線,畫一條直線以盡可能好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以該線近似地代表總體回歸線。該線稱為樣本回歸線(sampleregressionlines),其函數(shù)形式記為:1/2/2023100朱晉該樣本的散點(diǎn)圖(scatterdiagram):
注意:這里
將(2.1.4)看成(2.1.1)的近似替代。
1/2/2023101朱晉注意:這里
將(2.1.4)看成(2.⒉樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型。1/2/2023102朱晉⒉樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型由于方程中⒊回歸分析的主要目的根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。1/2/2023103朱晉⒊回歸分析的主要目的根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函1/2/2023104朱晉12/18/202229朱晉§2.2:一元線性模型的參數(shù)估計(jì)1/2/2023105朱晉§2.2:一元線性模型的參數(shù)估計(jì)12/18/202230朱2.2普通最小二乘法(OLS)1/2/2023106朱晉2.2普通最小二乘法(OLS)12/18/202231朱OLS回歸函數(shù)的特征1、樣本均值落在回歸直線上;2、y的理論估計(jì)值的均值即為;3、殘差一階和為0:4、殘差與解釋變量不相關(guān):5、殘差與y的理論預(yù)測(cè)值亦不相關(guān):1/2/2023107朱晉OLS回歸函數(shù)的特征§2.3參數(shù)估計(jì)值的性質(zhì)及統(tǒng)計(jì)推斷高斯—馬爾可夫定理OLS下的統(tǒng)計(jì)推斷1/2/2023108朱晉§2.3參數(shù)估計(jì)值的性質(zhì)及統(tǒng)計(jì)推斷高斯—馬爾可夫定理1
當(dāng)模型參數(shù)估計(jì)完成,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。一個(gè)用于考察總體的統(tǒng)計(jì)量,可從三個(gè)方面考察其優(yōu)劣性:(1)線性性(linear):即是否是另一隨機(jī)變量的線性函數(shù);(2)無偏性(unbiased):即它的均值或期望值是否等于總體的真實(shí)值;(3)有效性(efficient):即它是否在所有線性無偏估計(jì)量中具有最小方差。1/2/2023109朱晉當(dāng)模型參數(shù)估計(jì)完成,需考慮參數(shù)估計(jì)值的精度,即是否能代2.3.1高斯—馬爾可夫定理若一元線性模型滿足計(jì)量經(jīng)濟(jì)基本假設(shè),則參數(shù)的最小二乘估計(jì)是最小方差的線性無偏估計(jì)。(BLUE)高斯—馬爾可夫定理的初步證明回顧:點(diǎn)估計(jì)的三個(gè)性質(zhì)---無偏性、有效性和一致性。(注:參數(shù)估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩類)1/2/2023110朱晉2.3.1高斯—馬爾可夫定理若一元線性模型滿足計(jì)量經(jīng)濟(jì)基
有效性的圖形表示:1/2/2023111朱晉有效性的圖形表示:12/18/202236朱
2.3.2OLS下的統(tǒng)計(jì)推斷1/2/2023112朱晉2.3.2OLS下的統(tǒng)計(jì)推斷12/18/2022372、參數(shù)估計(jì)值的總體方差1/2/2023113朱晉2、參數(shù)估計(jì)值的總體方差12/18/202238朱晉3、隨機(jī)誤差變量的方差估計(jì)值4、參數(shù)估計(jì)量的樣本方差標(biāo)準(zhǔn)差為方差的平方根,Eviews的結(jié)果一般用標(biāo)準(zhǔn)差表示。1/2/2023114朱晉3、隨機(jī)誤差變量的方差估計(jì)值標(biāo)準(zhǔn)差為方差的平方根,第二周作業(yè):一、書p61-62:2.1(1)\(3),2.2二、證明OLS特征:3、殘差一階和為0:4、殘差與解釋變量不相關(guān):5、殘差與y的理論預(yù)測(cè)值亦不相關(guān):三、熟悉Eviews軟件,利用普通股交易資料作1-3只股票的單指數(shù)模型的樣本回歸模型。1/2/2023115朱晉第二周作業(yè):一、書p61-62:2.1(1)\(3),2.2§2.4一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)
一、擬合優(yōu)度檢驗(yàn)
二、變量的顯著性檢驗(yàn)
三、參數(shù)的置信區(qū)間
1/2/2023116朱晉§2.4一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)一、擬合優(yōu)度檢回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計(jì)性質(zhì)上已知,如果有足夠多的重復(fù)抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。主要包括擬合優(yōu)度檢驗(yàn)、變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間估計(jì)。1/2/2023117朱晉回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說
2.4.1擬合優(yōu)度檢驗(yàn)
擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。
度量擬合優(yōu)度的指標(biāo):判定系數(shù)(可決系數(shù))R2
問題:采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合了樣本觀測(cè)值,為什么還要檢驗(yàn)擬合程度?1/2/2023118朱晉2.4.1擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn):對(duì)樣本擬合度檢驗(yàn)的原理:y的理論預(yù)測(cè)值和真實(shí)的樣本值的距離越小,擬合度越好。所以有絕對(duì)指標(biāo)和相對(duì)指標(biāo)。定義:
此處利用到等式:1/2/2023119朱晉擬合度檢驗(yàn)的原理:12/18/202244朱晉1、總離差平方和的分解
已知由一組樣本觀測(cè)值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線
1/2/2023120朱晉1、總離差平方和的分解已知由一組樣本觀測(cè)值(Xi,Y如果Yi=?i即實(shí)際觀測(cè)值落在樣本回歸“線”上,則擬合最好。可認(rèn)為,“離差”全部來自回歸線,而與“殘差”無關(guān)。1/2/2023121朱晉如果Yi=?i即實(shí)際觀測(cè)值落在樣本回歸“線
對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:記總體平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares
)1/2/2023122朱晉對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平TSS=ESS+RSS
Y的觀測(cè)值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機(jī)勢(shì)力(RSS)。在給定樣本中,TSS不變,如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此
擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS1/2/2023123朱晉TSS=ESS+RSSY的觀測(cè)值圍繞其均值的總2、可決系數(shù)R2統(tǒng)計(jì)量
稱R2為(樣本)可決系數(shù)/判定系數(shù)(coefficientofdetermination)。
可決系數(shù)的取值范圍:[0,1]R2越接近1,說明實(shí)際觀測(cè)點(diǎn)離樣本線越近,擬合優(yōu)度越高。1/2/2023124朱晉2、可決系數(shù)R2統(tǒng)計(jì)量稱R2為(樣本)可決系數(shù)/判定系在例2.1.1的收入-消費(fèi)支出例中,
注:可決系數(shù)是一個(gè)非負(fù)的統(tǒng)計(jì)量。它也是隨著抽樣的不同而不同。為此,對(duì)可決系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在第3章中進(jìn)行。
1/2/2023125朱晉在例2.1.1的收入-消費(fèi)支出例中,注:可決系2.4.2一元線性模型的顯著性檢驗(yàn)回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。在一元線性模型中,就是要判斷X是否對(duì)Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。1/2/2023126朱晉2.4.2一元線性模型的顯著性檢驗(yàn)回歸分析是要判斷解釋變1、顯著性檢驗(yàn)的原理:假設(shè)檢驗(yàn)通過對(duì)總體回歸模型中參數(shù)是否為零的統(tǒng)計(jì)學(xué)檢驗(yàn),推斷模型所表示的因果關(guān)系能否成立。一般分為單個(gè)參數(shù)的t-檢驗(yàn)和整體參數(shù)的F-檢驗(yàn)。一般先假設(shè)參數(shù)為0(原假設(shè)),在此基礎(chǔ)上建立統(tǒng)計(jì)量,再給出顯著性水平(如1%,5%),如果原假設(shè)成立,概率小于顯著性水平的事件應(yīng)該不成立,但若統(tǒng)計(jì)量顯示小概率事件亦會(huì)發(fā)生,只能推翻原假設(shè),選擇備選假設(shè)。1/2/2023127朱晉1、顯著性檢驗(yàn)的原理:假設(shè)檢驗(yàn)通過對(duì)總體回歸模型中參數(shù)是否為回顧:t-分布與F-分布若隨機(jī)變量服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),則變量的平方服從-分布。K個(gè)獨(dú)立的,服從分布的隨機(jī)變量的和也服從分布,自由度為k.T-分布為一個(gè)標(biāo)準(zhǔn)正態(tài)分布與一個(gè)的平方根的商的隨機(jī)變量,即有其中為自由度。F-分布為兩個(gè)分布的商,有:,其中為自由度。1/2/2023128朱晉回顧:t-分布與F-分布若隨機(jī)變量服從標(biāo)準(zhǔn)正態(tài)分布N(2、方程顯著性檢驗(yàn):
F-檢驗(yàn)及統(tǒng)計(jì)量:統(tǒng)計(jì)量為:
在給出顯著性水平后,可查表得到臨界值,若統(tǒng)計(jì)量的實(shí)際值大于臨界值,則原假設(shè)所有參數(shù)為0不能成立。1/2/2023129朱晉2、方程顯著性檢驗(yàn):
F-檢驗(yàn)及統(tǒng)計(jì)量:統(tǒng)計(jì)量為:12/183、變量顯著性檢驗(yàn):
單個(gè)參數(shù)的t-檢驗(yàn)原理:給出原假設(shè)H0:β=0,根據(jù)t分布構(gòu)造相應(yīng)的t-統(tǒng)計(jì)量,并根據(jù)給出的數(shù)據(jù)算出統(tǒng)計(jì)量的值。再利用t分布的雙側(cè)特征,給定顯著性水平α,查表找出tα/2的臨界值。若統(tǒng)計(jì)量值的絕對(duì)值大于臨界值,則概率小于α的小概率事件發(fā)生,原假設(shè)不能成立。反之,不能推翻原假設(shè)。統(tǒng)計(jì)檢驗(yàn)1/2/2023130朱晉3、變量顯著性檢驗(yàn):
單個(gè)參數(shù)的t-檢驗(yàn)原理:給出原假設(shè)H
假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)檢驗(yàn)的置信區(qū)間估計(jì)。
2.4.3參數(shù)的置信區(qū)間
1/2/2023131朱晉假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)間(confidenceinterval);
1-稱為置信系數(shù)(置信度)(confidencecoefficient),
稱為顯著性水平(levelofsignificance);置信區(qū)間的端點(diǎn)稱為置信限(confidencelimit)或臨界值(criticalvalues)。1/2/2023132朱晉如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)間(confide一元線性模型中,i(i=1,2)的置信區(qū)間:在變量的顯著性檢驗(yàn)中已經(jīng)知道:
意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2,t/2)的概率是(1-)。表示為:
即1/2/2023133朱晉一元線性模型中,i(i=1,2)的置信區(qū)間:在變量的顯著于是得到:(1-)的置信度下,i的置信區(qū)間是
在上述收入-消費(fèi)支出例中,如果給定=0.01,查表得:
由于于是,1、0的置信區(qū)間分別為:(0.6345,0.9195)
(-433.32,226.98)
1/2/2023134朱晉于是得到:(1-)的置信度下,i的置信區(qū)間是在上
由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。
要縮小置信區(qū)間,需
(1)增大樣本容量n,因?yàn)樵谕瑯拥闹眯潘较?,n越大,t分布表中的臨界值越小;同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減??;
(2)提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。1/2/2023135朱晉由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)§2.5一元線性模型的預(yù)測(cè)
對(duì)于模型如果給定樣本以外的解釋變量的觀測(cè)值,有:因不是原來回歸方程中的樣本,所以和原模型中的不相關(guān)。如何求出的合理的值或范圍,就是回歸分析中預(yù)測(cè)的內(nèi)容。具體分為點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè)二塊。預(yù)測(cè)與置信區(qū)間1/2/2023136朱晉§2.5一元線性模型的預(yù)測(cè)
對(duì)于模型12/18/202一、?f是條件均值E(Y|X=Xf)或個(gè)值Yf的一個(gè)無偏估計(jì)二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間
1/2/2023137朱晉一、?f是條件均值E(Y|X=Xf)或個(gè)值Y
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 衢州2025年浙江衢州龍游縣招聘公辦幼兒園勞動(dòng)合同制教師25人筆試歷年參考題庫(kù)附帶答案詳解
- 潮州2025年廣東潮州市委黨校招聘專業(yè)技術(shù)人員6人筆試歷年參考題庫(kù)附帶答案詳解
- 淮安2025年江蘇淮安生態(tài)文化旅游區(qū)社會(huì)事業(yè)局招聘初中教師59人筆試歷年參考題庫(kù)附帶答案詳解
- 河南2025年河南黃淮學(xué)院碩士專任教師招聘20人筆試歷年參考題庫(kù)附帶答案詳解
- 棗莊2025年山東棗莊市口腔醫(yī)院急需緊缺人才引進(jìn)4人筆試歷年參考題庫(kù)附帶答案詳解
- 文山2025年云南文山馬關(guān)縣第二幼兒園招聘編外教師12人筆試歷年參考題庫(kù)附帶答案詳解
- 廣西2025年廣西醫(yī)科大學(xué)招聘項(xiàng)目聘用制工作人員筆試歷年參考題庫(kù)附帶答案詳解
- 山東2025年山東省公共衛(wèi)生臨床中心醫(yī)療類崗位招聘67人筆試歷年參考題庫(kù)附帶答案詳解
- 孝感2025年湖北孝感市云夢(mèng)縣城區(qū)學(xué)校面向農(nóng)村中小學(xué)遴選教師25人筆試歷年參考題庫(kù)附帶答案詳解
- 職業(yè)人群熱健康管理方案
- 7.1《集體生活成就我》課件 2025-2026道德與法治七年級(jí)上冊(cè) 統(tǒng)編版
- 瓦斯發(fā)電安全規(guī)程培訓(xùn)課件
- 私有云入門課件
- 財(cái)政評(píng)審廉政管理辦法
- 公司人員服從管理制度
- 演出單位薪酬管理制度
- 企業(yè)財(cái)務(wù)數(shù)字化轉(zhuǎn)型的路徑規(guī)劃及實(shí)施方案設(shè)計(jì)
- DB32T 1712-2011 水利工程鑄鐵閘門設(shè)計(jì)制造安裝驗(yàn)收規(guī)范
- 百度人才特質(zhì)在線測(cè)評(píng)題
- DL∕T 5142-2012 火力發(fā)電廠除灰設(shè)計(jì)技術(shù)規(guī)程
- 2024年水合肼行業(yè)發(fā)展現(xiàn)狀分析:水合肼市場(chǎng)需求量約為11.47萬噸
評(píng)論
0/150
提交評(píng)論