地理加權(quán)回歸-空間分析_第1頁
地理加權(quán)回歸-空間分析_第2頁
地理加權(quán)回歸-空間分析_第3頁
地理加權(quán)回歸-空間分析_第4頁
地理加權(quán)回歸-空間分析_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

地理加權(quán)回歸-空間分析地理加權(quán)回歸空間回歸模型中的回歸系數(shù)不隨空間位置而變化,因此空間回歸模型是全局模型。但是由于空間異質(zhì)性和空間非平穩(wěn)性,不同空間子區(qū)域中自變量和因變量的關(guān)系很可能不同,因此就需要處理空間異質(zhì)性的局部空間回歸方法,因此就有了地理加權(quán)回歸模型(GeographicallyWeightedRegression,GWR)的提出。地理加權(quán)回歸同時考慮了空間的相關(guān)性與異質(zhì)性。地理加權(quán)回歸模型一般形式如下:;其中,與是因變量與自變量在處的觀測值,為第個采樣點的坐標(biāo),是第個采樣點上的第個回歸參數(shù),點被稱為回歸點。,當(dāng)時,。簡便記為:地理加權(quán)回歸會得出個回歸方程,對應(yīng)每個回歸點,都會有一個回歸方程。若,則地理加權(quán)回歸模型退化為普通線性回歸模型。模型回歸參數(shù)需要通過局部加權(quán)最小二乘進(jìn)行估計。假設(shè)在位置的權(quán)重為,(),那么位置的參數(shù)估計為使達(dá)到最小的值。上式中的為權(quán)函數(shù),反映其他觀測點的樣本對回歸點的影響。權(quán)函數(shù)值越大,影響越大。該值通常由對應(yīng)兩點之間的距離決定。常用的權(quán)函數(shù)有:(1)Gauss函數(shù):(2)bi-square函數(shù):以上兩式中的為點到點的距離。被稱為帶寬,是需要人工選擇的參數(shù)。這兩個函數(shù)中,距離越大,函數(shù)值都越小。這說明選擇這兩個函數(shù)時,都假設(shè)觀測點越遠(yuǎn),影響越小。地理加權(quán)回歸模型將數(shù)據(jù)的空間位置嵌入到回歸參數(shù)中,因此考慮了空間的異質(zhì)性。同時,由于不同位置的觀測點對回歸參數(shù)的影響大小不同(通常離回歸點越近,影響越大),因此該模型也考慮了空間相關(guān)性。地理加權(quán)回歸的使用,也當(dāng)同時以空間相關(guān)性與異質(zhì)性為前提。如果沒有空間相關(guān)性,那么該模型就缺乏合理性。如果沒有空間異質(zhì)性,那么該模型就缺乏必要性?!景咐齋TYLEREF1\s7SEQ案例\*ARABIC\s12】以2011年北京、天津、唐山各縣(區(qū))疾病發(fā)病率和同期各縣(區(qū))的人口密度、人均GDP、年平均風(fēng)速、光照強度、相對濕度、年降水量等數(shù)據(jù)為例,研究社會經(jīng)濟和氣象因素對該疾病發(fā)病率在各地區(qū)影響的不穩(wěn)定性。本節(jié)所用的數(shù)據(jù)為2011年某地區(qū)某疾病的發(fā)病率(C:\Example\Data\7.3WGR\地區(qū)匯總.csv),命名為“地區(qū)匯總.csv”。此處只展示前10條表STYLEREF1\s7SEQ表\*ARABIC\s132011年某地區(qū)的某疾病發(fā)病情況codeprecprelHumsunShnwndspdPopuDenPerGdprate11010158.0684249.82301206.07552.19571615318.950.002438347.185911010262.5983552.05048202.89012.16938114956.040.003675447.718511010557.6593850.06015205.53022.1895718528.9130.000961139.06911010655.7398150.20182205.54772.2150267698.9810.0004191759.94311010752.3930550.77886205.67592.2558368249.2540.0005411561.69111010852.1307551.01494207.50232.2556938524.6850.0010211010.97311010944.6660853.70504218.36552.473628224.67190.00038758.615511011146.6229552.79277208.77742.333494532.45920.0004572082.54411011255.2302351.21378201.27612.1861711454.8070.000362406.25211011350.2272255.34219195.58192.014273967.65050.0012111643.1表STYLEREF1\s7SEQ表\*ARABIC\s14各變量的含義變量名稱變量含義單位code地理編碼無precp降水量毫米relHum相對濕度%sunShn日照強度瓦/平方米wndspd風(fēng)速千米/時popuDen人口密度千人/平方公里PerGdp人均國內(nèi)生產(chǎn)總值千元rate發(fā)病率此外,還需要的數(shù)據(jù)是包含該地區(qū)所有區(qū)縣的地圖文件(.dbf文件和.shp文件從光盤中獲取,C:\Example\Data\Geodata\JJT)。該文件也可以通過arcgis軟件從全國各區(qū)縣地圖中選擇生成。(2)采用R語言建立地理加權(quán)回歸模型第一步,加載如下程序包,代碼如下:library(spgwr)第二步,導(dǎo)入所需的數(shù)據(jù),代碼如下:hData<-read.csv("C:/Example/Data/7.3WGR/地區(qū)匯總.csv")#導(dǎo)入發(fā)病率和影響因素的數(shù)據(jù)dbf<-read.dbf("C:/Example/Data/Geodata/JJT.dbf")#導(dǎo)入地圖的數(shù)據(jù)(dbf格式)第三步,將導(dǎo)入的兩組數(shù)據(jù)合并,代碼如下:Data<-merge(hData,dbf,by.x="code",by.y="CNTY_CODE",all.x=T)第四步,確定帶寬,采用gwr.sel函數(shù)。所使用的參數(shù)如下:formula:模型公式,用于指出因變量與自變量;data:自變量與因變量取值的數(shù)據(jù)集;coords:代表空間觀測值位置的坐標(biāo)矩陣。代碼如下:col.bw<-gwr.sel(rate~PopuDen+PerGdp+precp+relHum+sunShn+wndspd,data=data,coords=cbind(data$x,data$y))#利用交叉驗證選擇最優(yōu)帶寬第五步,生成地理加權(quán)回歸模型,采用gwr函數(shù),使用的各參數(shù)意義如下:formula:模型公式,用于指出因變量與自變量;data:自變量與因變量取值的數(shù)據(jù)集;coords:代表空間觀測值位置的坐標(biāo)矩陣;bandwidth:帶寬,由上步gwr.sel生成;gweight:不指定時,默認(rèn)使用高斯函數(shù)確定權(quán)重矩陣;hatmatrix:如果為TRUE,帽子矩陣作為結(jié)果的一部分返回。代碼如下:col.gauss<-gwr(rate~PopuDen+PerGdp+precp+relHum+sunShn+wndspd,data=data,coords=cbind(data$x,data$y),bandwidth=col.bw,hatmatrix=TRUE)col.gauss#結(jié)果展示此外,地理加權(quán)回歸還經(jīng)常使用bi-square權(quán)函數(shù),該方法和Gauss權(quán)函數(shù)方法相似,這里只將實現(xiàn)代碼列出,代碼如下:col.d<-gwr.sel(rate~PopuDen+PerGdp+precp+relHum+sunShn+wndspd,data=data,coords=cbind(data$x,data$y),gweight=gwr.bisquare)#確定帶寬col.bisq<-gwr(rate~PopuDen+PerGdp+precp+relHum+sunShn+wndspd,data=data,coords=cbind(data$x,data$y),bandwidth=col.d,gweight=gwr.bisquare,hatmatrix=T)#建立地理加權(quán)回歸模型col.bisq#結(jié)果展示(3)結(jié)果分析建立的地理加權(quán)回歸截距和系數(shù)統(tǒng)計如REF_Ref472081692\h表75所示:表STYLEREF1\s7SEQ表\*ARABIC\s15加權(quán)回歸系數(shù)統(tǒng)計表變量最小四分之一分位數(shù)中位數(shù)四分之三分位數(shù)最大值全局截距-3478.00-2391.00896.504100.0011420.001223.24PopuDen-0.05-0.04-0.04-0.030.01-0.04PerGdp-191700.00-106600.00-24080.00-1769.0044410.00-37167.70precp-0.68-0.34-0.260.282.29-0.08relHum-133.90-72.10-21.8432.2652.46-31.49sunShn-16.880.500.841.452.940.66wndspd-91.81357.90625.00667.20874.70775.70從計算結(jié)果可以看出,由于地理加權(quán)回歸得出了影響因素在每個地區(qū)的影響系數(shù),各個因素對每個地區(qū)的影響程度并不相同,若系數(shù)的變化范圍較大,說明該影響因素總體上影響程度有很大的不穩(wěn)定性,若系數(shù)的變化范圍較小,說明該影響因素總體上影響比較穩(wěn)定。從該案例可以看出,當(dāng)月人均國內(nèi)生產(chǎn)總值對疾病的發(fā)病率影響最大,并且在大部分地區(qū)呈負(fù)相關(guān)關(guān)系,即當(dāng)月人均國內(nèi)生產(chǎn)總值越高,疾病發(fā)病率越低,此外該變量的系數(shù)變化范圍十分大,說明該因素在不同地區(qū)的影響程度有很大差別,具有不穩(wěn)定性。其次,風(fēng)速對該病的發(fā)病率影響也較大,但風(fēng)速與該病的發(fā)病率大部分呈正相關(guān),即風(fēng)速越大,該病的發(fā)病率越大,可以推斷該病可以通過空間傳染。在6個影響因素中人口密度對疾病的發(fā)病率影響最低。地理加權(quán)回歸模型的R2為0.47,即該模型能解釋疾病發(fā)病率總變異的47%,比全局普通線性回歸的R2(0.23)大一倍。因此對于存在空間相關(guān)性的變量,應(yīng)該使用地理加權(quán)回歸進(jìn)行計算??臻g回歸與地理加權(quán)回歸的比較:空間回歸與地理加權(quán)回歸的比較:空間回歸與地理加權(quán)回歸都是在經(jīng)典的回歸模型上考慮事物的空間屬性,從而發(fā)展出來的??臻g回歸通常只考慮空間相關(guān)性,而地理加權(quán)回歸同時考慮了空間相關(guān)性與異質(zhì)性。從本質(zhì)上說,兩種

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論