版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第三章回歸模型的估計(jì):概論RegressionModelEstimation:GeneralApproaches第一頁,共四十六頁。
第二章指出,當(dāng)聯(lián)合概率分布p(X,Y)已知時(shí),在MSE最小化準(zhǔn)則下,E(Y|X)是Y的最佳代表,被稱為是Y關(guān)于X的回歸函數(shù)(regressionfunction),也可稱為總體回歸函數(shù)(populationregressionfunction)。
而當(dāng)上述總體回歸函數(shù)呈現(xiàn)線性形式
E(Y|X)=X’0時(shí),則稱回歸模型Y=X’+u關(guān)于E(Y|X)正確設(shè)定,這時(shí)“真實(shí)”參數(shù)0等于最佳線性最小二乘解*:
0=*=[E(XX’)]-1E(XY)且E(u|X)=0E(Xu)=0第二頁,共四十六頁。
問題是:我們往往不知道總體的p(X,Y)。因此,只能通過樣本來估計(jì)總體的相關(guān)信息。
根據(jù)樣本估計(jì)總體構(gòu)成了回歸分析的主體內(nèi)容。第三頁,共四十六頁。§3.1參數(shù)估計(jì):概論
ParameterEstimation:GeneralApproaches
設(shè)(Y1,Y2,…,Yn)’是從未知總體Y~f(Y)中隨機(jī)抽取的一個(gè)樣本,并由此估計(jì)總體的特征,如參數(shù)。我們可以尋找一個(gè)關(guān)于的估計(jì)量(estimator)T,它是關(guān)于所抽樣本Y的函數(shù):T=h(Y)
對于某一樣本(Y1,Y2,…,Yn)’,則有一個(gè)估計(jì)值(estimate):t=h(Y1,Y2,…,Yn)第四頁,共四十六頁。一、衡量參數(shù)估計(jì)量優(yōu)劣的準(zhǔn)則
CriteriaforanEstimator
1、有限樣本準(zhǔn)則
記T為所選取的統(tǒng)計(jì)量,則T與參數(shù)的差異可用均方誤(meansquareerror,MSE)刻畫:
E(T-)2由于T關(guān)于的均方誤有如下分解式
E(T-)2=Var(T)+[E(T)-]2記[E(T)-]=E(T)-為T關(guān)于的偏差(bias)。
Var(T)刻畫了統(tǒng)計(jì)量T的真正的離散程度,如果它較小,表明T不太受數(shù)據(jù)隨機(jī)波動的影響;如果E(T)-較小,表明T的分布密切圍攏著。第五頁,共四十六頁。對無偏估計(jì)量,MSE=Variance,因此,在實(shí)踐中還希望從無偏估計(jì)量中選擇方差最小的。于是,有如下最小方差無偏準(zhǔn)則(minimumvarianceunbiasednesscriterion)
定義:
Tisaminimumvarianceunbiasedestimator,orMVUE,ofiff
(a)E(T-)=0forall,and(b)V(T)≤V(T*)forallT*suchthatE(T*-)=0定義:
TisanunbiasedestimatorofiffE(T-)=0,forall.最小方差無偏估計(jì)量也稱為無偏有效估計(jì)量(Unbiasedandefficientestimator)第六頁,共四十六頁。2、無限樣本準(zhǔn)則(AsymptoticCriteria)
有限樣本往往需要知道估計(jì)量的精確分布,而這是建立在對總體分布已知的情況下的。如果總體分布未知,則需要依賴無限樣本準(zhǔn)則:注意:(1)一致性的充分條件是:limE(Tn)=,且limVar(Tn)=0(2)同一參數(shù)可能會有多個(gè)一致估計(jì)量。如從對稱分布的總體中抽樣,則樣本均值與樣本中位數(shù)都是總體期望=E(Y)的一致估計(jì)量。第七頁,共四十六頁。在實(shí)踐中,為了區(qū)分同一參數(shù)不同的一致估計(jì)量,需要從退化極限分布(degeneratelimitingdistribution)轉(zhuǎn)向漸近分布(asymtoticdistribution)
尤其是,一致估計(jì)量具有以參數(shù)真實(shí)值為中心的漸近正態(tài)分布(asymptoticnormaldistribution)。因此,有如下最佳漸近正態(tài)估計(jì)量準(zhǔn)則:第八頁,共四十六頁。注意:
(1)大樣本BAN準(zhǔn)則是小樣本MVUE準(zhǔn)則的漸近版本(version);(2)在計(jì)量經(jīng)濟(jì)學(xué)中,除了精確分布已知的情況,最佳漸近正態(tài)性,或稱為漸近有效性(asymptoticefficiency),是最常選擇的準(zhǔn)則。(3)漸近有效估計(jì)量的直觀表述為第九頁,共四十六頁。二、類比估計(jì)法(TheAnalogyPrinciple)總體參數(shù)是關(guān)于總體某特征的描述,估計(jì)該參數(shù),可使用相對應(yīng)的描述樣本特征的統(tǒng)計(jì)量。
(1)估計(jì)總體矩,使用相應(yīng)的樣本矩(2)估計(jì)總體矩的函數(shù),使用相應(yīng)的樣本矩的函數(shù)對線性回歸模型:Y=0+1X+u1、基本原理第十頁,共四十六頁。
上述方法都是通過樣本矩估計(jì)總體矩,因此,也稱為矩估計(jì)法(momentmethods,MM)。(3)類比法還有:用樣本中位數(shù)估計(jì)總體中位數(shù);用樣本最大值估計(jì)總體最大值;用樣本均值函數(shù)mY|X估計(jì)總體期望函數(shù)Y|X,等
Questions:Areanalogestimatorsensiblefromastatisticalpointofview?Howreliablearethey?Whatshallwedowhenananalogestimatorisunreliable?第十一頁,共四十六頁。2、總體均值的估計(jì)對E(Y)=,Var(Y)=2的某總體隨機(jī)抽樣,由類比法(矩法)知:記T=∑iciYi,ci為不全為0的常數(shù)。
E(T)=E(∑ciYi)=∑ciE(Yi)=∑ci
Var(T)=∑ci2Var(Yi)=2∑ci2于是,任何無截距項(xiàng),系數(shù)和為1的Yi的線性組合都是的無偏估計(jì)量。第十二頁,共四十六頁。要尋找最佳估計(jì)量,則需在約束∑ci=1下求解
min∑ci2記Q=∑ci2-(∑ci-1)則Q/ci=2ci-(i=1,2,…,n)
Q/=-
(∑ci-1)由極值求解條件得:ci=/2,∑ci=1于是∑ci=n/2
=2/n,ci=1/nTheorem.從任何總體中進(jìn)行簡單隨機(jī)抽樣,樣本均值是總體期望的最小方差線性無偏估計(jì)量(minimumvariancelinearunbiasedestimator,MVLUE)。第十三頁,共四十六頁。樣本均值是樣本的1階原點(diǎn)矩,它是總體期望,即總體1階原點(diǎn)矩的無偏估計(jì)量。
事實(shí)上,對總體的任何階原點(diǎn)矩(rawmoment)
=s=E(Ys)簡單隨機(jī)抽樣中,對應(yīng)的樣本原點(diǎn)矩
Ms’=(1/n)∑iYis是總體原點(diǎn)矩的無偏估計(jì)量。第十四頁,共四十六頁。3、總體方差的估計(jì)對=2=E(Y-Y)2=2(Y未知),類比法得第十五頁,共四十六頁。則E(S*2)=2,S*2為總體方差2的無偏估計(jì)。
盡管S2是2的有偏估計(jì),但卻是2的一致估計(jì)量。第十六頁,共四十六頁。4、總體協(xié)方差的估計(jì)
對=XY=Cov(X,Y)=E[(X-X)(Y-Y)],類比法得為了討論該統(tǒng)計(jì)量的性質(zhì),需考察二元聯(lián)合分布:記(X,Y)的聯(lián)合pdf為f(x,y),則有如下1階、2階矩
E(X)=X,E(Y)=Y
Var(X)=X2,Var(Y)=Y2,Cov(X,Y)=XY且可記出如下原點(diǎn)矩與中心矩:
E(XrYs)=rs’,E(X*rY*s)=rs其中,
X*=X-X,Y*=Y-Y第十七頁,共四十六頁。V的總體期望與方差如下:
E(V)=E(X*Y*)=Cov(X,Y)=XY=11Var(V)=E(V2)-E2(V)=E(X*2Y*2)-E2(X*Y*)=22-112第十八頁,共四十六頁。同時(shí)有如下結(jié)論:下面考察SXY的統(tǒng)計(jì)性質(zhì):第十九頁,共四十六頁。容易證明:無限樣本下,樣本協(xié)方差SXY是總體協(xié)方差XY的一致估計(jì)量。第二十頁,共四十六頁。5、一元線性回歸方程參數(shù)的估計(jì)
對一元線性回歸模型Y=0+1X+u,在假設(shè)E(u|X)=0的條件下,E(Y|X)=0+1X,從而1=XY/X2,0=Y-1X可以證明:b1
,b0分別是1
,0的無偏估計(jì)量。Proof:第二十一頁,共四十六頁。求b1的條件期望(給定X=(X1,X2…,Xn)’):E(b1|X)=E[∑WiYi|X]=∑E(WiYi|X)=∑WiE(Yi|X)=∑Wi(0+1Xi)=0∑Wi+1∑WiXi=1E(b1)=E(E(b1|X))=E(1)=1同理:E(b0|X)=E(Y|X)-E(b1|X)X=(0+1X)-1X=0E(b0)=E(E(b0|X))=E(0)=0第二十二頁,共四十六頁。
注意:(a)通常情況,如果T1、T2分別是1、2的無偏估計(jì)量,=1/2,則T=T1/T2并不是的無偏估計(jì)量,因?yàn)?/p>
E(T)=E(T1/T2)E(T1)/E(T2)=1/2=
(b)由于大樣本下,樣本矩是總體矩的一致估計(jì)量,而任何樣本矩的連續(xù)函數(shù)是對應(yīng)總體矩函數(shù)的一致估計(jì),即有因此,第二十三頁,共四十六頁。
三、極大似然估計(jì)
MaximumlikelihoodEstimation
極大似然估計(jì)是在假設(shè)隨機(jī)變量Y的分布形態(tài)已知,而分布的若干參數(shù)未知的情形下,根據(jù)樣本信息估計(jì)這些未知參數(shù)的一種估計(jì)方法。
基本思想:在總體分布形態(tài)已知的情況下,隨機(jī)抽取的樣本可能來自不同參數(shù)決定的不同的總體,而最可能來自哪個(gè)總體呢?它們所來自的總體應(yīng)使其分布盡可能地?cái)M合樣本數(shù)據(jù)。1、基本原理第二十四頁,共四十六頁。對離散分布,分布特征由pmf(probabilitymassfunction)f(Y;)=P(Y)刻畫,因此,極大似然估計(jì),就是在所抽樣本Y=(Y1,Y2,…Yn)’下,尋找適當(dāng)?shù)模允筆(Y)=f(Y;)最大。對連續(xù)分布,分布特征由pdf(probabilitydensityfunction)f(Y;)刻畫。依照pmf的特征,極大似然估計(jì),就是在所抽樣本Y=(Y1,Y2,…Yn)’下,尋找適當(dāng)?shù)?,以使f(Y;)最大。第二十五頁,共四十六頁。2、極大似然估計(jì)
對具有pdf或pmf為f(Y;)的隨機(jī)變量Y(其參數(shù)未知),隨機(jī)抽取一容量為n的樣本Y=(Y1,Y2,…Yn)’其聯(lián)合分布為:
gn(Y1,Y2,…Yn;)=if(Yi;)可將其視為給定Y=(Y1,Y2,…Yn)’時(shí)關(guān)于的函數(shù),稱其為關(guān)于的似然函數(shù)(likelihoodfunction),簡記為L():
L()=
gn(Y1,Y2,…Yn;)=if(Yi;)
對離散型分布,似然函數(shù)L()就是實(shí)際觀測結(jié)果的概率。極大似然估計(jì)就是估計(jì)參數(shù),以使這一概率最大;對連續(xù)型分布,同樣也是通過求解L()的最大化問題,來尋找的極大似然估計(jì)值的。第二十六頁,共四十六頁。例:假設(shè)有一正態(tài)隨機(jī)樣本Yi~N(,2),i=1,2,…,n,其中未知參數(shù)=(,2)。該似然函數(shù)與其對數(shù)函數(shù)在相同的=(,2)處達(dá)到最大。因此可求對數(shù)函數(shù)的極大值:
lnL(,2)=-(n/2)ln(2π)-(n/2)ln(2)-(1/22)(Yi-)2極值的一階偏導(dǎo)條件:
ln(L)/=(1/2)(Yi-)=0
ln(L)/2=-(n/22)+(1/24)(Yi-)2=0第二十七頁,共四十六頁??梢?,總體均值的極大似然估計(jì)就是樣本均值,總體方差的極大似然估計(jì)就是樣本方差。3、極大似然估計(jì)的統(tǒng)計(jì)性質(zhì)第二十八頁,共四十六頁。由數(shù)理統(tǒng)計(jì)學(xué)知識:(n-1)s*2/2~2(n-1)因此,Var[(n-1)s*2/2]=2(n-1)Var(S*2)=24/(n-1)第二十九頁,共四十六頁。第三十頁,共四十六頁。§3.2估計(jì)總體關(guān)系
EstimatingaPopulationRelation一、問題的引入(Introduction)
現(xiàn)在我們系統(tǒng)地討論第二章所引出的問題:利用樣本信息估計(jì)Y與X的總體關(guān)系。如果線性模型是正確設(shè)定的,即Y與X間的關(guān)系為Y=E(Y|X)+U=0+1X+U則有1=XY/X2,0=Y-1X且E(Y|X)=0+1X為minE(U2)的解,E(U)=0,E(UX)=0
第三十一頁,共四十六頁。由類比法,在一個(gè)容量為n的隨機(jī)樣本下,可以寫出樣本線性回歸模型:
Yi=b0+b1Xi+ii=1,2,…,n且有b1=SXY/SX2,b0=Y-b1X
上述b1,b0是mini2/n的解,
且i/n=0,Xii/n=0按此,我們可以通過樣本信息估計(jì)總體的條件期望函數(shù)(conditionalexpectationfunction,CEF)E(Y|X).以下我們假設(shè)總體CEF的函數(shù)形式已知,即E(Y|X)=h(X;),只有參數(shù)未知。第三十二頁,共四十六頁。二、估計(jì)線性條件期望函數(shù)
EstimatingalinearCEF假設(shè)總體的CEF是線性的:E(Y|X)=0+1X則有最佳最小二乘解(minE(Y-(0+1X))2)
1=XY/X2,0=Y-1X且b1、b0分別是1、0的無偏且一致的估計(jì)量。第三十三頁,共四十六頁。Theorem.從總體回歸函數(shù)為E(Y|X)=0+1X的總體中簡單隨機(jī)抽樣,則樣本回歸函數(shù)的系數(shù)b0、b1分別是0、1的無偏且一致的估計(jì)量。
b1、b0的方差第三十四頁,共四十六頁。第三十五頁,共四十六頁。對多元線性回歸模型:
Y=0+1X1+2X2+…+kXk+U
最佳線性最小二乘解是通過求解如下極值問題得到
minE(U2)=minE[Y-(0+1X1+…+kXk)]2
一階極值條件為:
E(U2)/0=-2E(U)=0E(U2)/j=-2E(XjU)=0
(j=1,2,…k)或:E(U)=0,E(XjU)=0
(j=1,2,…k)解為:
=[E(XX’)]-1E(XY)其中,X=(1,X1,X2,…Xk)’,=(0,1,…k)’第三十六頁,共四十六頁。由類比法,在隨機(jī)抽取的容量為n的一個(gè)樣本下,對應(yīng)的多元樣本線性回歸模型:
Yi=b0+b1X1i+b2X2i+…+bkXki+ei(i=1,2,…,n)
最佳線性最小二乘解是通過求解如下極值問題得到
minei2=min[Yi-(b0+b1X1i+…+bkXki)]2
一階極值條件為:
ei2/b0=-2ei=0ei2/bj=-2Xjei=0
(j=1,2,…k)或:ei=0,Xjei=0
(j=1,2,…k)解為:
b=(X’X)-1(X’Y)其中,
第三十七頁,共四十六頁。三、估計(jì)非線性期望函數(shù)
EstimatinganonlinearCEF在MSE最小化準(zhǔn)則下,Y的最佳代表為CEF:E(Y|X)Question:當(dāng)已知CEF為非線性時(shí),如何通過樣本估計(jì)該CEF的未知參數(shù)呢?ANS:仍然可以使用類比法:
而h(X;)恰為下面極小化問題的解:
minE(U2)=minE[(Y-h(X;))2]設(shè)E(Y|X)=h(X;)是非線性的,總有
Y=h(X;)+U第三十八頁,共四十六頁。例:假設(shè)h(X;)=E(Y|X)=exp(0+1X)
則在一容量為n的樣本下,相應(yīng)的樣本回歸模型為
Yi=exp(b0+b1Xi)+ei相應(yīng)的極值問題問題為:選擇適當(dāng)?shù)腷0、b1以求解
minei2=min(Yi-exp(b0+b1Xi))第三十九頁,共四十六頁。非線性最小二乘估計(jì)是有偏的,但卻是一致的估計(jì)量。此方法也稱為非線性最小二乘法(nonlinearleastsquares,NLLS),解為非線性最小二乘估計(jì)(estimator)
一階極值條件為:
ei(h/b0)=0,ei(h/b1)=0或eihi=0,eihiXi=0
其中:hi=exp(b0+b1Xi)
(i=1,2,…,n)解非線性方程組,可求解參數(shù)的估計(jì)b0、b1。第四十頁,共四十六頁。四、估計(jì)二元響應(yīng)模型
EstimatingaBinaryResponseModel
二元響應(yīng)模型(binaryresponsemodel)指被解釋變量Y只取二個(gè)值,如0,1。易知:
E(Y|X)=1·P(Y=1|X)+0·P(Y=0|X)=P(Y=1|X)即在二元響應(yīng)模型中,CEF是在X取某值的條件下,Y取1時(shí)的條件概率??梢暺錇閄的函數(shù):
E(Y|X)=P(Y=1|X)=G(X;)顯然G(X;)的值應(yīng)屬于[0,1]。因此,可取G(·)為某一概率分布函數(shù),其自變量應(yīng)是X與的某種組合。第四十一頁,共四十六頁。設(shè)X與的組合為線性關(guān)系:0+1X則:E(Y|X)=F(0+1X)設(shè)定Y=F(0+1X)+U則F(0+1X)是下面極值問題的解:
minE(U2)=minE[(Y-F(0+1X))2]Question:如何通過樣本尋找參數(shù)的估計(jì)量?第四十二頁,共四十六頁。在一容量為n的隨機(jī)抽取的樣本下,記樣本模型為
Yi=F(b0+b1Xi)+ei(1)由于F(b0+b1Xi)是非線性的,可按非線性方法求解(類比法):
minei2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司級安全培訓(xùn)
- 2025-2030物聯(lián)網(wǎng)行業(yè)智能家居物聯(lián)網(wǎng)市場發(fā)展現(xiàn)狀及未來市場前景研究報(bào)告
- 2025-2030物聯(lián)網(wǎng)智能家居設(shè)備市場供需分析投資評估發(fā)展研究報(bào)告
- 2025-2030物聯(lián)網(wǎng)技術(shù)應(yīng)用前景分析及投資市場競爭研究報(bào)告
- 新聞宣傳稿培訓(xùn)課件
- 2025-2030物流行業(yè)市場現(xiàn)狀與發(fā)展投資評估規(guī)劃分析研究報(bào)告
- 2025-2030物流行業(yè)倉儲智能化轉(zhuǎn)型市場評估規(guī)劃
- 電商促銷活動策劃方案實(shí)戰(zhàn)
- 2025年徐州市泉山區(qū)法院系統(tǒng)招聘真題
- 電力工程項(xiàng)目預(yù)算審核流程
- 蒸汽管道-應(yīng)急預(yù)案
- 疊合板專項(xiàng)施工方案(完整版)
- 2025年智能眼鏡行業(yè)分析報(bào)告及未來發(fā)展趨勢預(yù)測
- 繪本閱讀應(yīng)用于幼小銜接的實(shí)踐研究
- 2025海康威視輕網(wǎng)管交換機(jī)使用手冊
- 翻車機(jī)工安全規(guī)范考核試卷及答案
- 水利工程單元工程施工質(zhì)量驗(yàn)收常用表格(建筑工程)單元工程施工質(zhì)量驗(yàn)收表
- 地源熱泵工程施工方案
- 雙臂操作助行器 要求和試驗(yàn)方法 第2輪式助行器
- 兒童樂園合伙協(xié)議書合同
評論
0/150
提交評論