版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
多水平面板數(shù)據(jù)模型的估計理論及模擬研究
一、引言由于我們所處的社會具有分級結(jié)構(gòu),因而很多社會經(jīng)濟研究都涉及嵌套或分層數(shù)據(jù)。傳統(tǒng)的線性模型的基本假設(shè)是線性、正態(tài)、方差齊性及其獨立性,而方差齊性和獨立性的假設(shè)在具有嵌套或分層結(jié)構(gòu)的樣本中往往是不成立的。對這些分層數(shù)據(jù)的分析,傳統(tǒng)的最小二乘(OLS)估計方法已經(jīng)不再適合,由此發(fā)展了多水平模型[1]15-159[2]28-168。多水平模型(MultilevelModels)又稱為分層線性模型(HLM,HierarchicalLinearModeling),它是20世紀(jì)80年代由英美教育統(tǒng)計學(xué)家提出的,是專門針對具有嵌套或?qū)哟谓Y(jié)構(gòu)數(shù)據(jù)發(fā)展起來的一種新的統(tǒng)計模型。例如,當(dāng)數(shù)據(jù)處于兩個層次時,先以第一層的變量建立線性回歸模型,然后分別以該線性回歸模型的系數(shù)作為第二層解釋變量的線性函數(shù),建立第二層的線性回歸模型,通過這樣建立模型,就可以同時處理不同層次、跨層次變量之間的關(guān)系,還能將不同層次間的誤差項考慮進(jìn)來,進(jìn)而估計出各個層次上的差異性。事實上,面板數(shù)據(jù)也可以看成是具有層級結(jié)構(gòu)的分層數(shù)據(jù)[3-4]。近幾十年,絕大多數(shù)研究者對面板數(shù)據(jù)的分析多采用面板數(shù)據(jù)計量模型,較少考慮面板數(shù)據(jù)的分層結(jié)構(gòu)。面板數(shù)據(jù)模型中的變截距面板數(shù)據(jù)模型、變系數(shù)面板數(shù)據(jù)模型與多水平模型有很多相近的地方[5]141-175。張旭、石磊對兩水平模型與靜態(tài)面板數(shù)據(jù)模型進(jìn)行了對比分析,指出了兩者間的區(qū)別與聯(lián)系,以此將多水平模型與面板數(shù)據(jù)模型結(jié)合起來,但沒有對該模型的估計理論及相關(guān)問題進(jìn)行深入研究[6]?;诖耍P者將同時考慮面板數(shù)據(jù)的層次效應(yīng)和時間的隨機效應(yīng),分析多水平面板數(shù)據(jù)模型的方差協(xié)方差結(jié)構(gòu),導(dǎo)出模型參數(shù)的估計方法,并通過模擬數(shù)據(jù)對模型進(jìn)行驗證分析。二、多水平面板數(shù)據(jù)模型多水平面板數(shù)據(jù)模型是將多水平模型和面板數(shù)據(jù)模型結(jié)合起來,同時考慮數(shù)據(jù)的層次效應(yīng)和時間的隨機效應(yīng)。由于面板數(shù)據(jù)是對同一樣本多次重復(fù)觀測得到的數(shù)據(jù),重復(fù)觀測嵌套于個體對象中,因而將重復(fù)觀測作為第一水平,個體作為第二水平,同時在第一水平還引入時間隨機效應(yīng)。下面詳細(xì)介紹兩水平面板數(shù)據(jù)模型。(一)兩水平面板數(shù)據(jù)模型的一般形式在成熟的多水平模型和面板數(shù)據(jù)模型的理論基礎(chǔ)上,兩水平面板數(shù)據(jù)模型的一般形式如下水平1模型可表述為:水平2模型可表述為:將(2)(3)代入式(1),得到組合模型為:傳統(tǒng)的兩水平模型不考慮時間效應(yīng),而面板數(shù)據(jù)模型一般不考慮回歸系數(shù)的隨機性和層次效應(yīng),因此模型(1)是兩水平模型和面板數(shù)據(jù)模型的有機結(jié)合。(二)兩水平面板數(shù)據(jù)模型的假設(shè)條件根據(jù)多水平模型和面板數(shù)據(jù)模型理論,對模型(1)(2)(3)可作如下假設(shè):(三)兩水平面板數(shù)據(jù)模型的方差結(jié)構(gòu)模型(5)包含兩部分,一部分是固定效應(yīng)XWβ,另一部分是隨機效應(yīng)部分。隨機效應(yīng)部分用ε表示如下:由前面的假設(shè)條件(6)(7)(8),可以得到模型的協(xié)方差結(jié)構(gòu):(四)兩水平面板數(shù)據(jù)模型的參數(shù)估計根據(jù)多水平模型理論及其估計方法,可以采用迭代廣義最小二乘估計(IGLS)和限制迭代廣義最小二乘估計(RIGLS)對模型(4)(5)進(jìn)行參數(shù)估計[7]。IGLS和RIGLS都是從普通最小二乘(OLS)開始估計固定回歸系數(shù),計算出OLS殘差及其方差協(xié)方差矩陣V,然后以為權(quán)重的廣義最小二乘法(GLS)來估計模型隨機參數(shù)的方差協(xié)方差矩陣。這些估計出來的方差協(xié)方差矩陣又被用來作為新的GLS的權(quán)重,重新估計固定回歸系數(shù),又計算出新的GLS的殘差及其方差協(xié)方差矩陣。這兩部分的計算交替進(jìn)行,直到估計過程收斂。1.迭代廣義最小二乘估計(IGLS)若θ已知,則固定效應(yīng)參數(shù)β的最佳線性無偏估計就是廣義最小二乘估計:當(dāng)給定β和θ一個初始值,IGLS估計就開始在式(13)與(15)之間進(jìn)行迭代計算,直到迭代收斂,就可以估計出固定效應(yīng)參數(shù)β和隨機效應(yīng)參數(shù)θ的值,β和θ的協(xié)方差分別為:2.限制迭代廣義最小二乘估計(RIGLS)IGLS對參數(shù)θ的估計是一個有偏估計,當(dāng)θ給定時:由于筆者提出的多水平面板數(shù)據(jù)模型的方差結(jié)構(gòu)更復(fù)雜,不能采用現(xiàn)有的多水平統(tǒng)計軟件進(jìn)行參數(shù)估計,故本文編寫了Matlab程序?qū)δP偷膮?shù)進(jìn)行估計。三、模擬分析為了驗證上述估計方法對于多水平面板數(shù)據(jù)模型是否可行,首先,對于模型(1)~(3)中水平1只有一個解釋性變量,水平2不含解釋性變量的模型,模擬數(shù)據(jù)進(jìn)行驗證。模型結(jié)構(gòu)如下:水平1模型可表述為:針對模型(19),假定是從標(biāo)準(zhǔn)正態(tài)分布中隨機選取的數(shù)據(jù),并且根據(jù)模型假設(shè)條件(6)(7)(8),取參數(shù)的一組真實值。根據(jù)這組真實值,模擬1000次200個個體在10個時間點的觀測值,得到和組成的面板數(shù)據(jù),將該數(shù)據(jù)應(yīng)用到模型(19)中,并分別采用IGLS和RIGLS對模擬數(shù)據(jù)進(jìn)行參數(shù)估計。由于每次參數(shù)估計結(jié)果與真實值之間都有一定的偏差,將1000次估計結(jié)果作進(jìn)一步的處理。首先,對各參數(shù)的1000次估計結(jié)果進(jìn)行平均,用來說明參數(shù)估計值與真實值之間的平均偏差程度;其次,用1000次樣本參數(shù)估計的標(biāo)準(zhǔn)差的平均值表示結(jié)果的波動程度;最后,考察在0.05的顯著性水平下,各參數(shù)在1000次估計結(jié)果中顯著次數(shù)的比率,可以用來說明參數(shù)估計結(jié)果的可信度,用顯著率表示。將參數(shù)估計分析結(jié)果顯示在表1(見下頁)中。從表1知,參數(shù)的估計結(jié)果都顯著,這說明參數(shù)的估計結(jié)果是可信的。首先,從參數(shù)估計結(jié)果的平均值來看,參數(shù)估計結(jié)果的平均值與真實值之間都相當(dāng)接近,這說明參數(shù)估計結(jié)果與真實值之間的偏差程度很小;參數(shù)估計結(jié)果的平均標(biāo)準(zhǔn)誤都比較小,說明參數(shù)估計值的波動程度較弱。IGLS和RIGLS對參數(shù)的估計結(jié)果差別不明顯,但是RIGLS的無偏性更好,因此這兩種參數(shù)估計方法都可以運用到該模型中,并且都可以得到比較好的估計結(jié)果。其次,對于模型(1)~(3)中水平1只有一個解釋性變量,水平2也含一個解釋性變量的模型,模擬數(shù)據(jù)進(jìn)行驗證。模型結(jié)構(gòu)如下:水平1模型可表述為:對于模型(22),假定與都是從標(biāo)準(zhǔn)正態(tài)分布中隨機選取的數(shù)據(jù),并且根據(jù)模型假設(shè)條件(6)(7)(8),取參數(shù)的一組真實值。根據(jù)這組真實值,模擬1000次200個個體在10個時間點的觀測值,得到,與組成的面板數(shù)據(jù),將該數(shù)據(jù)應(yīng)用到模型(22)中,并分別采用IGLS和RIGLS對模擬數(shù)據(jù)進(jìn)行參數(shù)估計,將1000次估計結(jié)果按照前面的分析方法進(jìn)行分析,分析結(jié)果顯示在表2中。從表2可以看出,在顯著性水平為0.05的情況下,參數(shù)與的估計值90%都顯著,其他參數(shù)的估計結(jié)果全都是顯著的。在IGLS和RIGLS兩種估計方法下,各參數(shù)的估計平均值與真實值之間的偏差都很小,平均標(biāo)準(zhǔn)誤也說明了在估計過程中的波動程度不大。最后,按照前面模擬數(shù)據(jù)進(jìn)行參數(shù)估計的方法,將兩水平面板數(shù)據(jù)模型與兩水平模型、二維隨機誤差分解模型進(jìn)行比較分析。當(dāng)模型(16)中不含時間隨機效應(yīng)時,其組合模型(19)變?yōu)椋簭谋?可以看出,兩模型中的參數(shù)估計結(jié)果在0.05的顯著性水平下都顯著。從兩模型的參數(shù)估計結(jié)果的平均值與真實值的對比可以看出,兩模型中的參數(shù)估計值與真實值的偏差都很小。由于兩水平模型沒有考慮時間效應(yīng)的影響,因而參數(shù)估計結(jié)果中,時間隨機誤差的影響效應(yīng)被當(dāng)成了模型的設(shè)定誤差考慮,參數(shù)的估計結(jié)果大于真實值。這說明兩水平面板數(shù)據(jù)模型能夠詳細(xì)地解釋模型中方差變異的來源。從模擬數(shù)據(jù)估計的過程中還發(fā)現(xiàn),雖然模型(19)與模型(23)的估計結(jié)果中固定效應(yīng)參數(shù)的估計值相當(dāng)接近,隨機效應(yīng)參數(shù)的估計值也相差不大,但是每次估計結(jié)果中,模型(19)的似然比檢驗統(tǒng)計量-2LL的值都要小于模型(23)的似然比檢驗統(tǒng)計量-2LL的值。本文隨機選取一次估計結(jié)果中的-2LL值,顯示在表4中。從表4知,模型(23)與模型(19)的-2LL的差分別為203.8,215.4,與自由度為1的分布的臨界值(置信水平設(shè)為0.05,(1,0.95)=3.84)相比都是顯著的。由于似然比檢驗統(tǒng)計量可以用來衡量擬合模型的優(yōu)劣,-2LL的值越小,表示模型擬合得越好,并且統(tǒng)計量還達(dá)到了顯著水平。因此,模型(19)比模型(23)能更好地擬合數(shù)據(jù),這說明用真實模型(19)能得到更好的擬合效果。對于模型(16)~(19),若沒有考慮到數(shù)據(jù)的層次效應(yīng),則模型就是典型的二維隨機誤差分解模型[9]34-56,可將模型表示為:從表5中可以看出,兩種不同的模型中,固定效應(yīng)參數(shù)的估計結(jié)果與參數(shù)真實值之間相差都很小,參數(shù)估計結(jié)果的波動幅度也不大,但是對于不同模型,其解釋變量解釋的結(jié)局測量變異有很大的不同。兩水平面板數(shù)據(jù)模型的結(jié)局測量值受到不同層次效應(yīng)、時間效應(yīng)及其模型隨機誤差效應(yīng)的影響。而面板數(shù)據(jù)模型的結(jié)局測量值受到個體隨機效應(yīng)、時間隨機效應(yīng)和模型隨機誤差效應(yīng)的影響,它沒有考慮數(shù)據(jù)的層次結(jié)構(gòu),造成參數(shù)的估計值大于其真實值。并且在模擬數(shù)據(jù)估計的過程中,模型(24)中AIC的值都要大于模型(19)中AIC的值。本文分別隨機選取一次估計結(jié)果中的AIC的值,顯示在表6(見下頁)中。從表6知,模型(24)中AIC的值都要大于模型(19)中AIC的值。從模型的擬合優(yōu)度來看,AIC的值越小,說明模型擬合數(shù)據(jù)更好。因而,真實模型(19)比模型(24)對數(shù)據(jù)的擬合程度更好。四、結(jié)論對于實際問題中需要研究的面板數(shù)據(jù),應(yīng)該根據(jù)研究的不同目的、不同內(nèi)容,從多方面加以分析,找到適合的模型對數(shù)據(jù)進(jìn)行建模。多水平模型和面板數(shù)據(jù)模型都可以分析面板數(shù)據(jù)。多水平模型可以分析不同層次的數(shù)據(jù),通過建立不同層次的模型,解釋組群效應(yīng)和個體間的差異,但不能體現(xiàn)隨機時間效應(yīng)的影響。面板數(shù)據(jù)模型則可以很好地刻畫個體異質(zhì)性,在模型中可以引入個體和時間隨機因素,但是它不能分析數(shù)據(jù)的層次效應(yīng)。多數(shù)面板數(shù)據(jù)都是通過隨機選取N個個體在T個時間點的觀測值,相對于總體來說,個體和時間都存在隨機因素,在分析實際問題時,不應(yīng)該忽略這些隨機效應(yīng)的影響。本文提出的多水平面板數(shù)據(jù)模型是一個新
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年新疆兵團(tuán)第九師白楊市公安局面向社會招錄警務(wù)輔助人員30人備考題庫及一套參考答案詳解
- 2025年防城港市生態(tài)環(huán)境局招聘備考題庫及一套完整答案詳解
- 北京市水利規(guī)劃設(shè)計研究院2026年校園招聘備考題庫及一套答案詳解
- vfp視頻課程設(shè)計
- 2025 九年級語文下冊戲劇人物矛盾化解課件
- 2026中國醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)工程研究所招聘38人筆試重點試題及答案解析
- 2025年農(nóng)村電商服務(wù)站可持續(xù)發(fā)展報告
- 2025年興業(yè)銀行武漢分行社會招聘備考題庫及參考答案詳解1套
- 2026事業(yè)單位招聘考試核心題庫及答案解析
- 長沙市望城區(qū)人民醫(yī)院2025年面向社會公開招聘編外合同制專業(yè)技術(shù)人員備考題庫有答案詳解
- Know Before You Go:趣談“一帶一路”國家智慧樹知到期末考試答案章節(jié)答案2024年貴州理工學(xué)院
- JBT 11270-2024 立體倉庫組合式鋼結(jié)構(gòu)貨架技術(shù)規(guī)范(正式版)
- 求職OMG-大學(xué)生就業(yè)指導(dǎo)與技能開發(fā)智慧樹知到期末考試答案章節(jié)答案2024年中國海洋大學(xué)
- JBT 7387-2014 工業(yè)過程控制系統(tǒng)用電動控制閥
- A課堂懲罰游戲
- 整理收納師行業(yè)分析
- GB/T 228.1-2021金屬材料拉伸試驗第1部分:室溫試驗方法
- 氫能與燃料電池-課件-第五章-制氫技術(shù)
- 2023QC小組活動基礎(chǔ)知識培訓(xùn)
- 生理學(xué)期末考試復(fù)習(xí)試題庫及答案
- 旅游地理學(xué) 國家公園建設(shè)與管理
評論
0/150
提交評論