版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
地理加權(quán)回歸模型介紹TingBaowasrevisedonJanuary6,20021第三章地理加權(quán)回歸模型介紹基本模型在地學(xué)空間分析中,n組觀測數(shù)據(jù)通常是在n個不同地理位置上獲取的樣本數(shù)據(jù),全局空間回歸模型就是假定回歸參數(shù)與樣本數(shù)據(jù)的地理位置無關(guān),或者說在整個空間研究區(qū)域內(nèi)保持穩(wěn)定一致,那么在n個不同地理位置上獲取的樣本數(shù)據(jù),就等同于在同一地理位置上獲取的n個樣本數(shù)據(jù),其回歸模型與最小二乘法回歸模型相同,采用最小二乘估計得到的回歸參數(shù)戶既是該點的最優(yōu)無偏估計,也是研究區(qū)域內(nèi)所有點上的最優(yōu)無偏估計。而在實際問題研究中我們經(jīng)常發(fā)現(xiàn)回歸參數(shù)在不同地理位置上往往表現(xiàn)為不同,也就是說回歸參數(shù)隨地理位置變化,這時如果仍然采用全局空間回歸模型,得到的回歸參數(shù)估計將是回歸參數(shù)在整個研究區(qū)域內(nèi)的平均值,不能反映回歸參數(shù)的真實空間特征。為了解決這一問題,國外有些學(xué)者提出了空間變參數(shù)回歸模型(SpatiallyVarying-CoeffiCientRegressionModel)(FosterandGorr,1986;GorrandOlligschlaeger,1994),將數(shù)據(jù)的空間結(jié)構(gòu)嵌入回歸模型中,使回歸參數(shù)變成觀測點地理位置的函數(shù)。Fortheringham等(Brunsdonetal,1996;Fortheringhametal,1997;Brunsdonetal,1998)在空間變系數(shù)回歸模型基礎(chǔ)上利用局部光滑思想,提出了地理加權(quán)回歸模型(GeographicallyWeightedRegressionModel-GWR)。地理加權(quán)回歸模型(GWR)是對普通線性回歸模型(OLR)的擴展,將樣點數(shù)據(jù)的地理位置嵌入到回歸參數(shù)之中,即:y.=吐—門+£禺@門匚卞就十5」=12…,刀式中:(u,v)為第i個樣點的坐標(biāo)(如經(jīng)緯度);B(u,v)是第i個樣點iikii的第k個回歸參數(shù);£是第i個樣點的隨機誤差。為了表述方便,我們將上式簡寫i為:若]=2=???=,則地理加權(quán)回歸模型(GWR)就退變?yōu)槠胀ň€性回歸模型(OLR)。Fotheringhametal依據(jù)“接近位置i的觀察數(shù)據(jù)比那些離i位置遠(yuǎn)一些的數(shù)據(jù)對的估計有更多的影響"(Fotheringhametal,1996)的思想,利用加權(quán)最小二乘法來估計參數(shù),得
其中:其中:0血…0血,匕)0血叫)件仏山)…0血』J■■■?**!■!■*rkrfa0仏七)仗仏心)…0血七).亠是B的估計值,n是空間樣點數(shù),k是自變量的個數(shù),W.是對位置i刻畫模型in時賦予數(shù)據(jù)點n的權(quán)重。由于地理加權(quán)回歸模型中的回歸參數(shù)在每個數(shù)據(jù)采樣點上都是不同的,因此其未知參數(shù)的個數(shù)為nX(P+1),遠(yuǎn)遠(yuǎn)大于觀測個數(shù)n,這樣就不能直接利用參數(shù)回歸估計方法估計其中的未知參數(shù),而一些非參數(shù)光滑方法為擬合該模型提供了一個可行的思路。Foste&Gorr(1986)和Gorr&Olligsehiaeger(1994)利用廣義阻尼負(fù)反饋(generalizeddampednegativefeedback)方法估計未知參數(shù)在各地理位置的值,這種估計方法只是在很直觀的意義上考慮數(shù)據(jù)的空間結(jié)構(gòu),加之估計方法較為復(fù)雜,很難對估計量作深入的統(tǒng)計推斷方面的研究。Brunsdon等(1996)在局部多項式光滑思想上提出了偏差和方差折衷(Bias-VarianceTrade-off)的解題思路:假設(shè)回歸參數(shù)為一連續(xù)表面,位置相鄰的回歸參數(shù)非常相似,在估計采樣點i的回歸參數(shù)時,以采樣點i及其鄰域采樣點上的觀測值構(gòu)成局域子樣,建立全局線性回歸模型,然后采用最小二乘方法得到回歸參數(shù)估計亠(k=0,1,2,…,p)。對于另一個采樣點,i+1采用另一個相應(yīng)的局域子樣來估計,以此類推。由于在回歸分析過程中,以其它采樣點上的觀測值來估計i點上的回歸參數(shù),因此得到的i點上的參數(shù)估計不可避免存在偏差,即參數(shù)估計為有偏估計。顯然,參與回歸估計的子樣規(guī)模越大,參數(shù)估計的偏差就越大,參與回歸估計的子樣規(guī)模越小,參數(shù)估計的偏差就越小。從降低偏差這一角度考慮因盡量減少子樣規(guī)模,但子樣規(guī)模的減少必然導(dǎo)致回歸參數(shù)估計值的方差增加,精度降低??臻g權(quán)函數(shù)的選擇空間權(quán)重矩陣是地理加權(quán)回歸模型(GWR)的核心(Brunsdonetal,2000),空間權(quán)函數(shù)的選取對地理加權(quán)回歸模型(GWR)的參數(shù)估計影響很大。(1)距離閾值法距離閾值法是最簡單的空間權(quán)函數(shù),它的關(guān)鍵是選取合適的距離閾值D,然后將數(shù)據(jù)點j與回歸點i之間的距離d與其進行比較,若大于該閾值則權(quán)重為0,否則為ij1,即卩■」〔0兀>D這種權(quán)重函數(shù)的實質(zhì)就是一個移動窗口,計算雖然簡單,但其缺點為函數(shù)不連續(xù),因此在地理加權(quán)回歸模型的參數(shù)估計中不宜采用。(2)距離反比法Tobler(1970)地理學(xué)第一定律認(rèn)為空間相近的地物比相遠(yuǎn)的地物具有更強的相關(guān)性,因此在估計回歸點i的參數(shù)時,應(yīng)對回歸點的鄰域給予更多的關(guān)注。根據(jù)這種思路,人們自然想到用距離來衡量這種空間關(guān)系:這里a為合適的常數(shù),當(dāng)a取值為1或2時,對應(yīng)的是距離倒數(shù)和距離倒數(shù)的平方。這種方法簡潔明了,但對于回歸點本身也是樣本數(shù)據(jù)點的情況,就會出現(xiàn)回歸點觀測值權(quán)重?zé)o窮大的情況,若要從樣本數(shù)據(jù)中剔除卻又會大大降低參數(shù)估計精度,所以距離反比法在地理加權(quán)回歸模型參數(shù)估計中也不宜直接采用,需要對其進行修正。(3)高斯(Gauss)函數(shù)法高斯(Gauss)函數(shù)法就是表示w與d之間的連續(xù)單調(diào)遞減函數(shù),可以克服上述ijij空間權(quán)函數(shù)不連續(xù)的缺點。其函數(shù)形式如下:J=旳(-仏")')
式中是描述權(quán)重與距離之間函數(shù)關(guān)系的非負(fù)衰減參數(shù),稱之為帶寬(Bandwidth)。帶寬越大,權(quán)重隨距離增加衰減的越慢,帶寬越小,權(quán)重隨距離增加衰減的越快。(3)bi-square函數(shù)法在實際中,往往會將對回歸參數(shù)估計幾乎沒有影響的數(shù)據(jù)點截掉,不予計算,并以有限高斯函數(shù)來代替高斯函數(shù),最常采用的便是bi-square函數(shù)(Bmndonetal,1997;Fotheringhametal,1998):
1997;Fotheringhametal,1998):從上式可以看出,bi-square函數(shù)法可以看成是距離閾值法和高斯(Gauss)函數(shù)法的結(jié)合。帶寬范圍內(nèi)的回歸點,可以通過有限高斯函數(shù)來計算數(shù)據(jù)點的權(quán)重,而帶寬之外的數(shù)據(jù)點權(quán)重為0。本文分別選用高斯(Gauss)函數(shù)和bi-square函數(shù)兩類空間權(quán)函數(shù)方法進行地理加權(quán)回歸模型(GWR)的分析。帶寬的確定與優(yōu)化地理加權(quán)回歸分析對高斯(Gauss)權(quán)函數(shù)和bi-square權(quán)函數(shù)的選擇并不是很敏感,但對特定權(quán)函數(shù)的帶寬卻很敏感。因此,帶寬的確定是地理加權(quán)回歸分析巾的關(guān)鍵。
(c)bi^square權(quán)函數(shù)(c)bi^square權(quán)函數(shù)("=3〉(<J)ht-squareIV函數(shù)(乃=10)圖不同權(quán)函數(shù)與帶寬選擇對參數(shù)估計的影響在實際應(yīng)用中我們發(fā)現(xiàn),地理加權(quán)回歸分析對Gauss權(quán)函數(shù)和bi-Squar權(quán)函數(shù)的選擇并不是很敏感,但對特定權(quán)函數(shù)的帶寬卻很敏感(如圖),帶寬過大回歸參數(shù)估計的偏差過大,帶寬過小又會導(dǎo)致回歸參數(shù)估計的方差過大。最小二乘平方和是最常采用的優(yōu)化原則之一,但對于地理加權(quán)回歸分析中的帶寬選擇卻失去了作用,這是因為對Y_1[—亠()]2=而言,帶寬b越小,參與回歸分析的數(shù)據(jù)點的權(quán)=重越小,預(yù)測值亠()越接近實際觀測值從而Y=」一亠()]2?0,也就是說最優(yōu)帶是只包含一個樣本點的狹小區(qū)域。(1)交叉驗證方法基于此,Cleveland(1979)、Bowman(1984)建議采用用于局域回歸分析的交叉驗證方法(cross-validation,CV),該方法的公式表達為:cv=£[幾-九⑹]其中,亠工()是的擬和值,在刻畫過程中省略了點i的觀測值得。這樣當(dāng)b變得很小時,模型僅僅刻畫點i附近樣點而沒有包括i本身。在實際應(yīng)用中為了減少計算量,Loader于1999年提出了一種近似交叉驗證統(tǒng)計量的方法,稱為廣義交叉驗證方法(generalizedcrossvalidation,GCV):t£(另-戈(對GCV=一r二丹(1_"(£少)⑷)(?-fr(S(A))由帽子矩陣s的構(gòu)成可知,當(dāng)帶寬很小時,地理加權(quán)回歸分析的有效參數(shù)個數(shù)趨近樣本數(shù)量n,上式中的分母趨于零,這樣即便預(yù)測值亠()趨向y『GCV也不會等于0。(2)AIC準(zhǔn)則Akaike通過對極大似然原理的估計參數(shù)方法加以修正,提出了一種較為一般的模型選擇準(zhǔn)則,稱為Akaike信息量準(zhǔn)則(AkaikeInformationCriterion,AIC)。AIC定義為(Akaike,1974):AIC二-21,蠱)+羽其中,亠為。的極大似然估計,Q為未知參數(shù)的個數(shù)。AIC準(zhǔn)則應(yīng)用比較廣泛,Hurvichetal將AIC準(zhǔn)則擴展到非參數(shù)回歸分析中的光滑參數(shù)選擇(Hurvichetal,1998),Brunsdon和Fotheringham則在Hurvich等研究基礎(chǔ)上將其進一步用于地理加權(quán)回歸分析中的權(quán)函數(shù)帶寬選擇(Brunsdonet2002),其公式為:2002),其公式為:al,2002;Fotheringhametal,其中,下標(biāo)C表示“修正后的”AIC估計值,n是樣點的大小,亠是誤差項估計的標(biāo)準(zhǔn)離差,tr(S)是GWR的S矩陣的跡,它是帶寬的函數(shù)。AIC有利于評價GWR模型是否比OLS模型更好地模擬數(shù)據(jù)。其簡單形式表示為:AIC=2刀ln(cr)+nln(2^)十刀卡rr(51)3)貝葉斯信息準(zhǔn)則1978年SehwartZ提出了貝葉斯信息準(zhǔn)則(BayesianInformationCriterion,BIC),該準(zhǔn)則可以使自回歸模型的階數(shù)適中,故常被用來確定回歸模型中的最優(yōu)階數(shù),2002年Nakaya將其用于地理加權(quán)回歸分析中的權(quán)函數(shù)帶寬選擇。BIC準(zhǔn)則與AIC準(zhǔn)則非常相似,只是懲罰因子不同,其公式為BIC=-21n£<^Tx)+^lnn式中為e的極大似然估計,q為未知參數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 食堂自查報告及整改措施
- 2026年桶裝水菌落總數(shù)超標(biāo)應(yīng)急處置預(yù)案
- 餐飲管理餐廳運營中央廚房衛(wèi)生管理制度
- 嬰幼兒游泳館衛(wèi)生管理制度
- 我的成長伙伴與書為友的作文12篇
- 人才培養(yǎng)系統(tǒng)建設(shè)承諾書8篇
- 數(shù)據(jù)完備守秘保障履行承諾書(3篇)
- 公司遵法經(jīng)營責(zé)任承諾書(3篇)
- 銀行貸款客戶經(jīng)理績效評定表
- 單招機電考試?yán)}及答案
- 惠州園林管理辦法
- 山西省建筑工程施工安全管理標(biāo)準(zhǔn)
- 2025山西云時代技術(shù)有限公司校園招聘160人筆試參考題庫附帶答案詳解
- 拼多多公司績效管理制度
- 貿(mào)易公司貨權(quán)管理制度
- 生鮮采購年度工作總結(jié)
- 造價咨詢項目經(jīng)理責(zé)任制度
- 離婚協(xié)議書正規(guī)打印電子版(2025年版)
- FZ∕T 81008-2021 茄克衫行業(yè)標(biāo)準(zhǔn)
- 幼兒園大班社會課件:《我是中國娃》
- 村莊搬遷可行性報告
評論
0/150
提交評論