版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、分位數(shù)回歸(QRM)方法及其應(yīng)用,夏先鋒,管理與經(jīng)濟學(xué)院,主要內(nèi)容:,分位數(shù)回歸的基本介紹,系數(shù)協(xié)方差的估計方法,模型評價與檢驗,基于Eviews的分位數(shù)回歸,傳統(tǒng)的回歸分析主要關(guān)注均值,即采用因變量條件均值的函數(shù)來描述自變量每一特定數(shù)值下的因變量均值,從而揭示自變量與因變量的關(guān)系。這類回歸模型實際上是研究被解釋變量的條件期望,描述了因變量條件均值的變化。 人們當(dāng)然也關(guān)心解釋變量與被解釋變量分布的中位數(shù),分位數(shù)呈何種關(guān)系。這就是分位數(shù)回歸,它最早由凱恩克(Koenker Roger)和巴西特(Bassett Gilbert Jr)于1978年提出,是估計一組回歸變量X與被解釋變量Y的分位數(shù)之間
2、線性關(guān)系的建模方法,強調(diào)條件分位數(shù)的變化。,一、分位數(shù)回歸的提出,分位數(shù)回歸(Quantile Regression)最早由科恩克和巴塞特 (Koenker 和Bassett, 1978)于1978年提出 ,它提供了回歸變量 X 和因變量Y 的分位數(shù)之間線性關(guān)系的估計方法。絕大多數(shù)的回歸模型都關(guān)注因變量的條件均值,但是人們對于因變量條件分布的其他方面的模擬方法也越來越有興趣,尤其是能夠更加全面地描述因變量的條件分布的分位數(shù)回歸。,利用分位數(shù)回歸解決經(jīng)濟學(xué)問題的文獻(xiàn)越來越多,尤其是在勞動經(jīng)濟學(xué)中取得了廣泛應(yīng)用。如在教育回報和勞動市場歧視等方面都出現(xiàn)了很好的研究成果。在經(jīng)濟學(xué)中的應(yīng)用研究還包括諸如
3、財富分配不均問題、失業(yè)持續(xù)時間問題、食品支出的恩格爾曲線問題、酒精需求問題和日間用電需求問題等。在金融學(xué)領(lǐng)域也涌現(xiàn)出大量使用分位數(shù)回歸的應(yīng)用研究成果,主要應(yīng)用領(lǐng)域包括風(fēng)險價值(Value at Risk, VaR)研究和刻畫共同基金投資類型的指數(shù)模型。,正如普通最小二乘OLS回歸估計量的計算是基于最小化殘差平方和一樣,分位數(shù)回歸估計量的計算也是基于一種非對稱形式的絕對值殘差最小化,其中,中位數(shù)回歸運用的是最小絕對值離差估計(LAD,least absolute deviations estimator)。它和OLS主要區(qū)別在于回歸系數(shù)的估計方法和其漸近分布的估計。,分位數(shù)回歸參數(shù)估計的思想,分
4、位數(shù)回歸參數(shù)估計的思想,與LR估計量明顯不同的QR估計量的特點在于,在QR中數(shù)據(jù)點到回歸線距離的測量通過垂直距離的加權(quán)總和(沒有平方)而求得,這里賦予擬合線之下的數(shù)據(jù)點的權(quán)重是1-,而賦予擬合線之上的數(shù)據(jù)點的權(quán)重則是.對于的每一個選擇,都會產(chǎn)生各自不同的條件分位數(shù)的擬合函數(shù),這一任務(wù)是為每一個可能的尋找適合的估計量。,中位數(shù)是一個特殊的分位數(shù),它表示一種分布的中心位置。中位數(shù)回歸是分位數(shù)回歸的一種特殊情況,其他分位數(shù)則可以用來描述一種分布的非中心位置。第p個百分位數(shù)表示因變量的數(shù)值低于這一百分位數(shù)的個數(shù)占總體的p%.因此,分位數(shù)可以指定分布中的任何一個位置。,4.7.1 分位數(shù)回歸的基本思想和
5、系數(shù)估計,假設(shè)隨機變量 Y 的概率分布為: (4.7.1) Y 的 分位數(shù)定義為滿足 F(y) 的最小 y 值,即: , (4.7.2),圖4.7.1 cs 變量的累積分布函數(shù)F(y) 圖4.7.2 cs 變量的分位數(shù)分布函數(shù)q(),F(y)的 分位數(shù)可以由最小化關(guān)于 的目標(biāo)函數(shù)得到,即: (4.7.3) 其中,argmin函數(shù)表示取函數(shù)最小值時 的取值, (u) u( I(u 0) 稱為檢查函數(shù)(check function),依據(jù) u 取值符號進(jìn)行非對稱的加權(quán),這里 u y 。,一般的 分位數(shù)回歸的檢查函數(shù)為:,其中, 為示性函數(shù),Z是指示關(guān)系式。當(dāng)分位數(shù)為0.5時,就是最小一乘回歸,即中
6、位數(shù)回歸。,考察此最小化問題的一階條件為: (4.7.4) 即F() = ,也就是說F(Y)的第 個分位數(shù)是上述優(yōu)化問題的解。 F(y) 可以由如下的經(jīng)驗分布函數(shù)替代: (4.7.5) 其中 y1,y2,yn 為Y 的 N 個樣本觀測值;I(z) 是指示函數(shù),z 是條件關(guān)系式,當(dāng) z 為真時,I(z) = 1;當(dāng) z 為假時,I(z) = 0。式(4.7.3)中條件關(guān)系式 z 為 yi y,當(dāng) yi y 時,I(yi y) = 1,否則取值為0。,相應(yīng)地,經(jīng)驗分位數(shù)為: , (4.7.6) 式(4.7.3)可以等價地表示為下面的形式: (4.7.7),現(xiàn)假設(shè) Y 的條件分位數(shù)由 k 個解釋變量
7、組成的矩陣 X 線性表示: (4.7.8) 其中,xi =(x1i,x2i,xki) 為解釋變量向量,( ) =(1,2,k )是 分位數(shù)下的系數(shù)向量。當(dāng) 在 (0, 1) 上變動時,求解下面的最小化問題就可以得到分位數(shù)回歸不同的參數(shù)估計: (4.7.9),類似OLS方法,可以通過最小化(4.7.3)式的目標(biāo)函數(shù)(V)獲得 的第 個分位點回歸估計量。例如,用 作為正誤差項的權(quán)重,用(1 ) 作為負(fù)誤差項的權(quán)重的非對稱絕對值誤差加權(quán)平均: (4.7.10) 當(dāng) =0.5時稱為最小絕對值離差法(Least Absolute Deviations, LAD),(4.7.10) 式的2倍就是LAD估計
8、的精確的目標(biāo)函數(shù): 針對LAD方法的回歸估計是條件分位點回歸的一種特殊情況,通常被人們稱為“中位數(shù)回歸”。 分位數(shù)回歸的系數(shù)估計需要求解線性規(guī)劃問題,很多種方法可以對此問題進(jìn)行求解。,1、條件均值(conditional mean),例2.1.1:一個假想的社區(qū)有99戶家庭組成,欲研究該社區(qū)每月家庭消費支出Y與每月家庭可支配收入X的關(guān)系。 即如果知道了家庭的月收入,能否預(yù)測該社區(qū)家庭的平均月消費支出水平。 為達(dá)到此目的,將該99戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費支出。,由于不確定因素的影響,對同一收入水平X,不同家庭的消費支出不完全相同; 但由于調(diào)查的完備性,給定收
9、入水平X的消費支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditional distribution)是已知的,例如:P(Y=561|X=800)=1/4。 因此,給定收入X的值Xi,可得消費支出Y的條件均值(conditional mean)或條件期望(conditional expectation):E(Y|X=Xi)。 該例中:E(Y | X=800)=605,描出散點圖發(fā)現(xiàn):隨著收入的增加,消費“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。,2、總體回歸函數(shù),在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(population reg
10、ression line),或更一般地稱為總體回歸曲線(population regression curve)。 相應(yīng)的函數(shù)稱為(雙變量)總體回歸函數(shù)(population regression function, PRF)。,含義:回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。 函數(shù)形式:可以是線性或非線性的。 例2.1.1中,將居民消費支出看成是其可支配收入的線性函數(shù)時:,為線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regression coefficients)。,1、樣本回歸函數(shù),問題:能否從一次抽樣中獲得總體的近似信息?如果可以,如何從抽
11、樣中獲得總體的近似信息? 在例2.1.1的總體中有如下一個樣本,能否從該樣本估計總體回歸函數(shù)?,回答:能,該樣本的散點圖(scatter diagram):,畫一條直線以盡好地擬合該散點圖,由于樣本取自總體,可以該直線近似地代表總體回歸線。該直線稱為樣本回歸線(sample regression lines)。,樣本回歸線的函數(shù)形式為:,稱為樣本回歸函數(shù)(sample regression function,SRF)。,注意:這里將樣本回歸線看成總體回歸線的近似替代,則,相對于最小二乘估計,分位數(shù)回歸模型具有四個方面的優(yōu)勢: (1)分位數(shù)模型特別適合具有異方差性的模型。 (2)對條件分布的刻畫
12、更加的細(xì)致,能給出條件分布的大體特征。每個分位點上的回歸都賦予條件分布上某個特殊點(中央或尾部)一些特征;把不同的分位點上的分位數(shù)回歸集中起來就能提供一個關(guān)于條件分布的更完整的統(tǒng)計特征描述。并且不同分位點下所給出的參數(shù)估計本身也可能有值得進(jìn)一步探討的意義。,(3)分位數(shù)回歸并不要求很強的分布假設(shè),在擾動項非正態(tài)的情形下,分位數(shù)估計量可能比最小二乘估計量更為有效。 (4)與最小二乘法通過使誤差平方和最小得到參數(shù)的估計不同,分位數(shù)回歸是通過使加權(quán)誤差絕對值之和最小得到參數(shù)的估計,因此估計量不容易受到異常值的影響,從而估計更加穩(wěn)健。,4.7.2 系數(shù)協(xié)方差的估計,一般地,分位數(shù)回歸的系數(shù)估計量漸近服
13、從正態(tài)分布,其漸近協(xié)方差依據(jù)模型的不同假定而具有不同形式。漸近系數(shù)協(xié)方差的計算在分位數(shù)回歸分析中非常重要,有三種估計方法: 1獨立同分布設(shè)定下協(xié)方差矩陣的直接估計方法 (1)Siddiqui 差商法 (2)稀疏度的核密度估計量 2獨立但不同分布設(shè)定下協(xié)方差矩陣的直接估計方法 (Hubert sandwich) 3自舉法(Bootstrap) (1)X-Y自舉法 (2)殘差自舉方法 (3)馬爾可夫鏈邊際自舉法,在EViews中進(jìn)行分位數(shù)回歸 1. 方法選擇,為了使用分位數(shù)回歸方法估計方程,在方程設(shè)定對話框的估計方法中選擇“QREG”,打開分位數(shù)回歸估計對話框:,“Quantile to esti
14、mate”后面輸入值,可以輸入01之間的任意數(shù)值,默認(rèn)值是0.5,即進(jìn)行中位數(shù)回歸。,例4.10 分位數(shù)回歸,利用例3.1的消費和收入數(shù)據(jù),我們建立如下的回歸方程研究政府支出對居民消費的影響: (4.7.44) 其中,cs為實際居民消費,inc為實際可支配收入,fe為財政支出,考慮到財政政策通常具有時滯的特點,模型中采用滯后一期的財政支出作為解釋變量。所有變量均為剔除了價格因素的年度數(shù)據(jù),樣本區(qū)間為19782006年。為了進(jìn)行比較,我們同時給出最小二乘法以及三個不同分位點的分位數(shù)回歸估計結(jié)果(見表4.4)。,OLS估計結(jié)果:,分位數(shù)回歸估計結(jié)果:,表4.4 最小二乘法和分位數(shù)回歸結(jié)果,從估計結(jié)
15、果可以看出,對于不同的估計方法,居民實際可支配收入、前期消費水平兩個變量的彈性系數(shù)變化不大。盡管在以往的研究中,政府支出對居民消費的影響還沒有得出一致的結(jié)論,但是在本例中三種估計的結(jié)果表明政府支出對居民消費的彈性值均為正,說明在我們所分析的樣本區(qū)間內(nèi)政府支出與居民消費之間是互補的,政府支出的增加有利于加強基礎(chǔ)設(shè)施建設(shè)和提高社會保障水平,使居民減少儲蓄,尤其是預(yù)防性儲蓄,從而增加消費。最小二乘估計給出的是政府支出對消費的平均影響效果,而分位數(shù)回歸給出的是消費處于不同分位水平時,政府支出對居民消費的影響。在20%,50%和80%的分位點上政府支出的彈性分別為0.048,0.034,0.026,并且
16、后兩個水平的估計是不顯著的,說明當(dāng)消費水平較低時,政府支出的影響相對較大,而對于較高的消費水平,政府支出的影響變小,并且是不顯著的。因為當(dāng)消費水平較高時,進(jìn)一步提升的空間變小,政府支出對其影響也變小。,例3.6:工資差別 為了解工作婦女是否受到了歧視,可以用美國統(tǒng)計局的“當(dāng)前人口調(diào)查”中的截面數(shù)據(jù)研究男女工資有沒有差別。這項多元回歸分析研究所用到的變量有: W 雇員的工資(美元/小時) 1;若雇員為婦女 SEX = 0;男性 ED 受教育的年數(shù) AGE 雇員的年齡 1;若雇員不是西班牙裔也不是白人 NONWH = 0;其他 1;若雇員是西班牙裔 HISP = 0;其他,對206名雇員的樣本所進(jìn)
17、行的研究得到的回歸結(jié)果為(括號內(nèi)是t統(tǒng)計量的值): (22.10)(-3.86) R2 = 0.068 D.W.=1.79 反映雇員性別的虛擬變量SEX在顯著性水平 1%下顯著。因為工資的總平均是9.60美元,該虛擬變量告訴我們,婦女的平均工資為8.12美元,或比總平均低1.48美元。,表4.4 最小二乘法和分位數(shù)回歸結(jié)果,4.7.3 模型評價和檢驗,1擬合優(yōu)度 與傳統(tǒng)的回歸分析的擬合優(yōu)度R2類似,分位數(shù)回歸模型也可以計算擬合優(yōu)度。在分位數(shù)回歸中,參數(shù)估計是通過 (4.7.29) 得到的。將數(shù)據(jù)寫為 xi = (1,xi1),( ) = ( 0( ), 1( ),這樣式(4.7.29)可以寫為
18、 (4.7.30) 最小化 分位數(shù)回歸的目標(biāo)函數(shù)(objective function),得到 (4.7.31),回歸方程中只包含常數(shù)項情形下,最小化分位數(shù)回歸的目標(biāo)函數(shù)(objective function),得到 (4.7.32) 定義分位數(shù)回歸方程的Machado擬合優(yōu)度為 (4.7.33) R1( )位于01之間,R1( )越大說明模型估計的越好,反之R1( )越小模型估計越差??梢钥闯?,這與用普通最小二乘法估計的傳統(tǒng)回歸方程中定義的擬合優(yōu)度R2類似,分位數(shù)回歸擬合優(yōu)度的計算是基于分位數(shù)回歸方程目標(biāo)函數(shù)的最小值與只用常數(shù)項作為解釋變量時的分位數(shù)回歸方程目標(biāo)函數(shù)最小值的關(guān)系。,2擬似然比
19、檢驗(Quasi-LR Test) 定義以下兩個檢驗統(tǒng)計量: (4.7.34) (4.7.35) 其中, 和 分別是無約束的和對原方程施加q個約束條件后,分位數(shù)回歸的目標(biāo)函數(shù)最小值。LN() 和 N() 這兩個統(tǒng)計量都漸近服從自由度為q的分布。分母中的 s() 是稀疏度值,在分位數(shù)回歸的冗余變量檢驗、遺漏變量檢驗中將都用到擬似然比檢驗的 LN() 和N()統(tǒng)計量。,3分位數(shù)過程檢驗(Quantile Process Testing) 有時候,我們不僅對某個分位數(shù)回歸感興趣,而是希望對不只一個分位數(shù)回歸的系數(shù)進(jìn)行聯(lián)合檢驗,比如下面將要研究的檢驗斜率系數(shù)是否相等,即不同分位數(shù)回歸計算出的斜率系數(shù)是
20、否相等,類似這種問題需要同時估計多于一個分位數(shù)回歸,這種分析稱為分位數(shù)過程(Quantile Process)分析。定義過程系數(shù)向量: (4.7.36),(1)斜率相等檢驗(Slope Equality Testing) (2)對稱檢驗(Symmetry Testing) 如果對于給定的X,Y的分布是對稱的,則應(yīng)該有: (4.7.42) 具體而言,假定分位數(shù)過程包含了s個分位數(shù)回歸,這里s是奇數(shù),中間值(s+1)/2為0.5,并且j = 1 ij+1, j =1,2,(s-1)/2,則對稱檢驗的原假設(shè)為: (4.7.43),例4.10的結(jié)果輸出如下(以0.2分位數(shù)的估計結(jié)果為例):,2. 分位
21、數(shù)回歸的輸出結(jié)果,輸出結(jié)果的上方顯示了設(shè)定的內(nèi)容,本例中設(shè)定用“Huber Sandwich”方法估計系數(shù)協(xié)方差,用“Siddiqui(mean fitted)”方法得到稀疏度,用“Hall-Sheather”方法計算帶寬。下面顯示了系數(shù)估計值、標(biāo)準(zhǔn)差、t 檢驗值和相應(yīng)的p值。最下方顯示了擬合優(yōu)度和調(diào)整值、稀疏度數(shù)值、目標(biāo)函數(shù)的最小值(“objective”)、僅包含常數(shù)的目標(biāo)函數(shù)的最小值(“Objective (const. only))、因變量序列的經(jīng)驗分位數(shù)(“Quantile dependent var”)、擬似然比檢驗值(“Quasi-LR statistic”)和相應(yīng)的 p 值(“Prob(Quasi-LR stat)”)等。,3分位數(shù)回歸中的視圖和過程 分位數(shù)回歸中的多數(shù)視圖和過程都與用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第6課 工業(yè)化國家的社會變化(備課筆記系列講義)歷史統(tǒng)編版九年級下冊
- 2025年高職(新能源汽車檢測與維修技術(shù))檢測技術(shù)階段測試題及答案
- 2025年中職應(yīng)用馬其頓語(日常馬語交流)試題及答案
- 2025年大學(xué)二年級(管理學(xué))應(yīng)用管理綜合測試題及答案
- 2025年高職高爾夫服務(wù)與管理(服務(wù)應(yīng)用)試題及答案
- 2025年大學(xué)化工類(化工性能測試)試題及答案
- 2025年大學(xué)作物生產(chǎn)與經(jīng)營管理(作物生產(chǎn)系統(tǒng))試題及答案
- 2025年中職廣播電視編導(dǎo)(廣播電視教育心理學(xué))試題及答案
- 2025年高職(生態(tài)農(nóng)業(yè)技術(shù))有機農(nóng)業(yè)種植測試題及答案
- 2025年中職幼兒教育學(xué)(幼兒教育基礎(chǔ))試題及答案
- 朱子治家格言(朱子家訓(xùn))課件
- 20S517 排水管道出水口
- vpap iv st說明總體操作界面
- 2023人事年度工作計劃七篇
- LY/T 1692-2007轉(zhuǎn)基因森林植物及其產(chǎn)品安全性評價技術(shù)規(guī)程
- 初中一年級(7年級)上學(xué)期生物部分單元知識點
- 長興中學(xué)提前招生試卷
- 2022年基礎(chǔ)教育國家級教學(xué)成果獎評審工作安排
- 生物統(tǒng)計學(xué)(課堂PPT)
- 突發(fā)公共衛(wèi)生事件應(yīng)急處理
- 腫瘤內(nèi)科中級分章試題精選
評論
0/150
提交評論