空間數(shù)據(jù)分析原理與方法_第1頁
空間數(shù)據(jù)分析原理與方法_第2頁
空間數(shù)據(jù)分析原理與方法_第3頁
空間數(shù)據(jù)分析原理與方法_第4頁
空間數(shù)據(jù)分析原理與方法_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第11章 面狀數(shù)據(jù)空間模式分析 面狀數(shù)據(jù)是地理學(xué)研究中的一類重要數(shù)據(jù),很多地理現(xiàn)象都通過規(guī)則的或不規(guī)則的多邊形表示,這類地理現(xiàn)象的顯著特點是空間過程與邊界明確的面積單元有關(guān)。面狀數(shù)據(jù)通過各個面積單元上變量的數(shù)值描述地理現(xiàn)象的分布特征,變量的值描述的是這個空間單元的總體特征,與面積單元內(nèi)的空間位置無關(guān)。例如氣候類型區(qū)、土壤類型區(qū)、土地利用類型區(qū)、行政區(qū)、人口普查區(qū)等。空間點模式主要從點的位置信息研究空間分布模式,而面狀數(shù)據(jù)的空間模式研究的是面積單元的空間關(guān)系作用下的變量值的空間模式,換句話說,面積單元之間的鄰接與否、距離遠(yuǎn)近等對于變量的空間分布具有重要影響。本章重點探討面狀數(shù)據(jù)空間模式的概念與測

2、度方法。11.1空間接近性與空間權(quán)重矩陣 在研究面積單元的空間模式之前,我們首先需要定義空間接近性,這是測度空間模式的基礎(chǔ)。實質(zhì)上“空間接近性”就是面積單元之間的“距離”關(guān)系,根據(jù)地理學(xué)第一定律,“空間接近性”描述了不同“距離”關(guān)系下的空間相互作用,而接近性程度一般使用空間權(quán)重矩陣描述。對“距離”的不同定義就產(chǎn)生了不同的空間接近性測度方法,于是就會有不同形式的空間權(quán)重矩陣。空間權(quán)重矩陣給出了一個面積單元受鄰近空間單元影響的可量化測度。111且 空間接近性 基于“距離”的空間接近性測度就是使用面積單元之間的距離定義接近性,那么如何測度任意兩個面積單元之間的距離呢?這就產(chǎn)生了兩種方法:其一是按照面

3、積單元之間是否有鄰接關(guān)系的鄰接法,其二是基于面積單元中心之間距離的重心距離法(圖111)。 (1)邊界鄰接法面積單元之間具有共享的邊界(即分界線),被稱為是空間接近的,用邊界鄰接首先可以定義一個面積單元的直接近鄰,然后根據(jù)近鄰的傳遞關(guān)系還可以定義間接近鄰,或者多重近鄰。 (2)重心距離法面積單元的重心或中心之間的距離小于某個指定的距離,則面積單元在空間上是接近的。顯然這個指定距離的大小對于一個單元的近鄰數(shù)量有影響。圖11.1不規(guī)則面積單元的空間接近性圖111描述了不規(guī)則面積單元的空間接近性。規(guī)則的正方形網(wǎng)格相當(dāng)于高度簡化的多邊形結(jié)構(gòu),其接近性的定義是類似的,一般分為3種方式(圖112),即類似

4、國際象棋棋子的行走方式,分別是車的行走方式、象的行走方式和王后的行走方式。常用的是按照車和王后的行走方式來定義空間上接近的網(wǎng)格單元。 對于圖112中的9個單元格,中心單元格為X,在“車行走方式”下的接近性相當(dāng)于具有共享邊界的情況,X有4個近鄰,分別為BDGE。在“王后行走方式”下,周圍8個面積單元都是X的近鄰,雖然有的多邊形僅是通過點相連接。這相當(dāng)于按照距離的接近性定義,假設(shè)網(wǎng)格的邊長為L,則中心之間的距離的網(wǎng)格單元定義為X的近鄰。對于圖112所示的情況,這些近鄰都是X的直接近鄰,所以稱為一階近鄰。一階近鄰的直接近鄰形成X的二階近鄰,據(jù)此我們可以推廣到n階近鄰。(a)按照車的行走方式 (b)按

5、照象的行走方式 (c)按照王后的行走方式圖11.2 規(guī)則格網(wǎng)的接近性1112 空間權(quán)重矩陣 空間權(quán)重矩陣是空間接近性的定量化測度。假設(shè)研究區(qū)域中有n個多邊形,任何兩個多邊形都存在一個空間關(guān)系,這樣就有nn對關(guān)系。于是需要nn的矩陣存儲這n個面積單元之間的空間關(guān)系。但是根據(jù)不同的準(zhǔn)則能夠定義不同的空間關(guān)系矩陣。下面將討論定義空間關(guān)系的方法及其相關(guān)的矩陣空間鄰接矩陣或空間權(quán)重矩陣,這一矩陣對于空間自相關(guān)統(tǒng)計量的計算具有重要的意義。1.二元鄰接矩陣前已指出不同的接近性定義可導(dǎo)出不同的矩陣。首先考慮最簡單的鄰近定義,共享邊界的面積單元定義為近鄰。兩個單元共享邊界,則權(quán)重矩陣的元素, 否則,即 (11.

6、1)根據(jù)重心距離也可以得到類似于式(11.1)的權(quán)重定義: (11.2)圖11.3 研究區(qū)域中的7個面積單元上述權(quán)重矩陣稱為二元鄰接矩陣,因為根據(jù)式(11.1)或式(112)定義的n個面積單元之間的接近性矩陣W是由0,1構(gòu)成的。下面我們以圖113為例,運(yùn)用式(111)得到的研究區(qū)域中面積單元的鄰接矩陣W,這是一個對稱的矩陣。圖113所示的面積單元之間的二元鄰接矩陣為(11.3) 二元鄰接矩陣C有很多重要的性質(zhì):對角線元素,因為面積單元i不能成為自己的鄰居。矩陣具有對稱性,即如果面積單元A是B的鄰居,則B是A的鄰居。矩陣的行元素之和表示該空間單元直接鄰居的數(shù)量, 。假設(shè)共享邊界的數(shù)量為J,則矩陣

7、的元素之和為。 由于二元連接矩陣中有大量的0出現(xiàn),以及對稱矩陣的性質(zhì),因此將引起存儲冗余問題。我們以圖114所示的美國俄亥俄州7個縣的空間鄰接情況說明這一問題。表111是用0和1表示的7個縣的二元鄰接矩陣。由于對稱關(guān)系,矩陣中出現(xiàn)很多0,即同時記錄了非直接近鄰。因此采用表112所示的方式進(jìn)行壓縮,使得記錄中只存放一個空間單元的近鄰多邊形。表111 美國俄亥俄州7個縣的二元鄰接矩陣我們還可以給出高階形式的二元鄰接矩陣。對于圖113的情況,考慮任意一個面積單元的3階最近鄰,則得到接近性矩陣W如式(114)所示,這是一個非對稱關(guān)系的接近性矩陣。矩陣各行求和的值,表示該行對應(yīng)的面積單元的3階近鄰的數(shù)量

8、。同理,根據(jù)距離也可以定義高階的鄰接矩陣。(11.4)2.行標(biāo)準(zhǔn)化權(quán)重矩陣在二元鄰接矩陣中,若面積單元是近鄰則權(quán)重為1。數(shù)學(xué)上,單位值權(quán)重對空間關(guān)系建模不一定很好。例如,我們期望分析一幢房屋的價值是如何受到周圍單元的影響的。根據(jù)房地產(chǎn)的實踐,我們認(rèn)為周圍每一個單元對房屋價值都將產(chǎn)生部分影響,如果有4個鄰居單元,每一個單元對于房屋的影響的權(quán)重都是o25。 已知二元矩陣1表示相對應(yīng)的行和列上的面積單元是相鄰的,因此對于每一行,行和記為,表示該面積單元的近鄰的總數(shù)。為了找出每一個近鄰單元對于所考察的面積單元的貢獻(xiàn),用矩陣元素的值除以就得到每一個近鄰面積單元的權(quán)重 (11.5) 以美國俄亥俄州7個縣為

9、例,其二元鄰接矩陣記為,見表111,根據(jù)式(115)可以得到這7個縣的行標(biāo)準(zhǔn)化矩陣,記為W,結(jié)果見表113。比較和可看出,該矩陣不再具有對稱性。1113 重心距離與權(quán)重矩陣 除了使用近鄰性測度來描述一組地理對象之間的空間關(guān)系和定義近鄰之外,經(jīng)常使用的另一種方法是采用面積單元之間的距離。使用距離的某種形式作為權(quán)重描述空間關(guān)系的能力非常強(qiáng),根據(jù)地理學(xué)第一定律,兩個對象之間的關(guān)系是其距離的函數(shù),因此使用距離作為權(quán)重描述空間關(guān)系有很好的理論基礎(chǔ)。 考慮到距離的遠(yuǎn)近對于變量值的貢獻(xiàn),接近性測度可定義為式(116)的形式,表示隨著重心之間距離的增加,第個面積單元對于第個面積單元的影響呈指數(shù)下降。 (11.

10、6)式中,是冪指數(shù)如果用距離表示的空間權(quán)重矩陣記為D,其元素記為,表示第個多邊形和第個多邊形之間的距離。距離權(quán)重一般使用倒數(shù)的方式,因為空間作用關(guān)系隨著距離的增加而減弱。因此,當(dāng)使用距離矩陣時,權(quán)重是距離的倒數(shù)。但是根據(jù)空間過程的經(jīng)驗研究,權(quán)重并非和距離倒數(shù)成正比關(guān)系,研究發(fā)現(xiàn),很多空間關(guān)系的強(qiáng)度隨著距離的減弱程度要強(qiáng)于線性比例關(guān)系,因此經(jīng)常采用平方距離的倒數(shù)作為權(quán)重。 仍然以美國俄亥俄州的7個縣為例,任意兩個縣重心之間的距離計算如表114所示,根據(jù)式(116),取2,則可采用式(117)計算基于距離的權(quán)重矩陣,見表115。式(117)認(rèn)為個面積單元對于另一個面積單元影響的權(quán)重按照距離二次方的

11、倒數(shù)遞減。 (11.7)按照距離定義空間權(quán)重矩陣時,需要注意距離的定義方式帶來的影響。通常,兩個點之間的距離易于定義,而兩個多邊形之間的距離定義存在多種方法。最為常用的是用兩個多邊形的重心間的距離表示多邊形的距離。重心指的是多邊形的幾何中心。但是確定多邊形幾何中心的方法有多種,得到的結(jié)果卻存在差異。一般而言,多邊形的不規(guī)則性對幾何中心的位置有重要的影響,計算的重心經(jīng)常會出現(xiàn)在不合意的位置上。當(dāng)多邊形是凹多形時,可能會產(chǎn)生重心位于多邊形外的情況,這時幾何中心的確定可以采用骨架算法。11.2面狀數(shù)據(jù)中趨勢分析空間數(shù)據(jù)的一階效應(yīng)反映了研究區(qū)域上變量的空間趨勢,通常用變量的均值描述這種空間變化。研究一

12、階效應(yīng)使用的方法主要是利用空間權(quán)重矩陣進(jìn)行空間滑動平均估計。如果面積單元數(shù)據(jù)是基于規(guī)則格網(wǎng)的,一般使用中位數(shù)光滑(media polish)的方法,此外核密度估計方法也是研究面狀數(shù)據(jù)一階效應(yīng)的常用方法。這些方法不僅用于探索面狀數(shù)據(jù)均值的空間變化,而且從一種面積單元到另一種面積單元變換時的空間插值,也經(jīng)常使用這一技術(shù)。521 空間滑動平均空間滑動平均是利用近鄰面積單元的值計算均值的一種方法,稱之為空間滑動平均。設(shè)區(qū)域中有個面積單元,對應(yīng)于第個面積單元的變量的值為,面積單元鄰近的面積單元的數(shù)量為個,則均值平滑的公式為: (11.8)最簡單的情況是假設(shè)近鄰面積單元對的貢獻(xiàn)是相同的,即,則有 (11.

13、9)式(118)和式(119)的作用是對變量進(jìn)行空間濾波,或用于空間插值。522 中位數(shù)光滑若面積單元是規(guī)則的格網(wǎng),則常用的方法是用中位數(shù)光滑來估計趨勢。趨勢估計中使用中位數(shù)替代均值是因為均值對于離群值比較敏感,當(dāng)數(shù)據(jù)中存在離群值時,中位數(shù)比均值更加穩(wěn)健。根據(jù)統(tǒng)計學(xué)的思想,一個變量的空間分布可看作是多種因素影響下的空間過程的一個實現(xiàn),在這個空間過程中包含了全局趨勢、局部效應(yīng)和隨機(jī)誤差。于是對于規(guī)則格網(wǎng)表示的變量的空間分布情況,變量的值可表示成式(1110)所示的分解: (11.10)式中, 是總的趨勢;和分別表示的是行和列的效應(yīng),相當(dāng)于局部效應(yīng); 是隨機(jī)誤差。于是總的均值為 (11.11)為了

14、計算規(guī)則格網(wǎng)中變量的空間趨勢,根據(jù)式(1111)得到中位數(shù)光滑算法的一般過程如下: (1)將每一行的中位數(shù)記錄在這一行的邊上,并在每一行中減去中位數(shù)。 (2)計算行中位數(shù)的中位數(shù),將其作為總的效應(yīng),從每一行中位數(shù)中減去總效應(yīng)。 (3)將每一列的中位數(shù)記錄在這一列的下面,并在每一列中減去中位數(shù)。 (4)計算列中位數(shù)的中位數(shù),將其和總效應(yīng)相加,從每一列中位數(shù)的總效應(yīng)中減去這一數(shù)值。 (5)重復(fù)步驟(1)(4),直到行或列的中位數(shù)不再變化。 經(jīng)過上述步驟計算即可產(chǎn)生的每一個網(wǎng)格的值山,作為均值的估計,提供了數(shù)據(jù)的全局趨勢: (11.12)同時,我們從觀測數(shù)據(jù)中剔出這一趨勢便得到殘差,可對殘差做深入的

15、分析,這需要使用112節(jié)以后的二階方法。在中位數(shù)光滑過程中,需要注意根據(jù)格子的方向進(jìn)行趨勢分解可能產(chǎn)生條帶效應(yīng),而這些方向可能和數(shù)據(jù)的趨勢方向并無關(guān)系;并且這一方法無法控制光滑的程度。 我們使用圖115的數(shù)據(jù)說明中位數(shù)光滑方法的應(yīng)用。圖115是一個33的規(guī)則網(wǎng)格,其變量的數(shù)值分布見圖中的數(shù)字。對其進(jìn)行的中位數(shù)光滑計算過程如下: (1)將每一行的中位數(shù)記錄在這一行的邊上,即記錄于列中,并在每一行中減去列對應(yīng)的中位數(shù),添加行,行元素充0,結(jié)果如圖116所示。(2)計算行中位數(shù)的中位數(shù),結(jié)果為5,將其作為總的效應(yīng),從每一行中位數(shù)中減去總效應(yīng),結(jié)果見列(圖117)。(3)將每一列的中位數(shù)記錄在這一列的

16、下面,并在每一列中減去中位數(shù)(圖11.8)(4)計算列中位數(shù)的中位數(shù),將其和總效應(yīng)相加,從每一列中位數(shù)的總效應(yīng)中減去這一數(shù)值,到此步為止,行和列的中位數(shù)不再變化(圖119)。 于是, ,表示在本例中所有單元格的均值都為5,而剩余的隨機(jī)殘差是各個網(wǎng)格中的數(shù)值減去該網(wǎng)格的均值。1123 核密度估計方法 在點模式的研究中,核密度估計方法(簡稱核估計)被用于探索點密度的變化,也常用于描述連續(xù)數(shù)據(jù)的一階趨勢的變化。核估計也同樣可用于描述面狀數(shù)據(jù)的一階趨勢。雖然我們在本章的開始就討論了接近性及其測度的矩陣w,但是在核密度估計方法的估計過程中不需要W矩陣,僅需考慮面積單元之間的距離。這里面積單元之間的距離是

17、由其重心之間的距離定義的,所以首先需要計算各個面積單元的重心,假設(shè)我們用對面積單元 (重心表示)周圍的單元的變量值估計的值,和之間的距離用向量表示為估計為 (11.13) 式中,是面積單元s 的估計;是核函數(shù);是寬帶,可解釋為對產(chǎn)生影響的距離。式(11.13)適用于面積單元中的變量時;連續(xù)數(shù)值的情況。如果變量的值是計數(shù)值(count),面積單元內(nèi)的觀測時計數(shù)值,則不適用,需要改寫核估計公式為 (11.14)式(11.14)表示單位面積內(nèi)總的計數(shù)值。 面積單元核估計的一個重要應(yīng)用是從一種面積單元變換到另一種面積單元時的空間插值。例如,為了研究人口密度的空間分布,需要將不規(guī)則的人口普查單元中的人口

18、統(tǒng)計數(shù)據(jù)轉(zhuǎn)換到規(guī)則的正方形格網(wǎng)上。通過核估計的應(yīng)用將一種面積單元中的人口數(shù)據(jù)重新聚集到另外一種面積單元中,滿足了分析使用的需要。 在點模式分析中,我們就指出了帶寬的選擇對核估計使用的影響,選擇一個合理的帶寬對于面積單元的估計具有同樣的重要性。由于核估計計算上比較繁瑣,在面積單元轉(zhuǎn)換的實際應(yīng)用中常采用其他近似的方法來獲得新的面積單元的數(shù)值估計。這些方法主要有:最近鄰重心賦值法,重心對多邊形賦值法,以及面積權(quán)重法。1.最近鄰重心賦值法 一種面積單元到另一種面積單元的插值是根據(jù)變換前后兩種面積單元重心的接近程度進(jìn)行的,原則是用變換后的面積單元的重心計算其變換前的最近鄰的面積單元的重心,用最近鄰的重心

19、對應(yīng)的面積單元的值對變換后的面積單元賦值。2.重心對多邊形賦值法 類似于最近鄰重心賦值法,這一方法將變換前的面積單元的重心和變換后的面積單元進(jìn)行多邊形疊加,根據(jù)重心落人的多邊形對新的面積單元賦值。這種方法需要根據(jù)兩個面積單元之間的關(guān)系進(jìn)行適當(dāng)?shù)奶幚怼?面積權(quán)重法面積權(quán)重法是根據(jù)一組面積單元和另外一組面積單元的疊加,用前一組面積單元落人的面積權(quán)重平均對另一組面積單元進(jìn)行插值,獲得新的面積單元中變量的估計。圖1110是面積權(quán)重法的應(yīng)用實例。在該實例中我們根據(jù)上海市浦東新區(qū)7000多個基本的人口普查單元中的人口數(shù)量,運(yùn)用面積權(quán)重法將面積單元中人口總量數(shù)據(jù)轉(zhuǎn)換到200m200m的網(wǎng)格上,圖1110(a

20、)是在GIS中對網(wǎng)格中人口數(shù)量分布的3維顯示,圖1110(b)則是經(jīng)過光滑處理后的人口密度分布效果圖。圖11.10 面積權(quán)重法應(yīng)用實例11.3空間自相關(guān)的概念531 空間自相關(guān) 空間自相關(guān)是空間地理數(shù)據(jù)的重要性質(zhì),空間上近鄰的面積單元中地理變量的相似性特征將導(dǎo)致二階效應(yīng)。在面狀數(shù)據(jù)的背景上,二階效應(yīng)又稱為空間自相關(guān)。 空間自相關(guān)的研究提供了空間數(shù)據(jù)分析中非常有用的統(tǒng)計技術(shù),大部分的空間數(shù)據(jù)存在一定程度的空間自相關(guān)(Anselin,1988)??臻g自相關(guān)是研究空間模式時間變化的有用工具。它能夠提供我們理解空間模式從過去到現(xiàn)在、從現(xiàn)在到未來變化的知識,并且通過空間模式時間變化的研究能夠揭示導(dǎo)致空間

21、模式變化的驅(qū)動因子。 空間自相關(guān)的概念來自于時間序列的自相關(guān),所描述的是在空間域中位置s上的變量與其鄰近位置上同一變量的相關(guān)性。對于任何空間變量(屬性)Z,空間自相關(guān)測度的是Z的近鄰值對于Z相似或不相似的程度。如果近鄰位置上相互間的數(shù)值接近,我們說空間模式表現(xiàn)出的是正空間自相關(guān);如果相互間的數(shù)值不接近,我們說空間模式表現(xiàn)出的是負(fù)空間自相關(guān)。、 顯然空間自相關(guān)是根據(jù)位置相似性和屬性相似性的匹配情況來測度的。根據(jù)11.1節(jié)的討論,位置的相似可通過空間接近性矩陣或權(quán)重矩陣W來描述,而屬性值的相似一般通過交叉乘積,或平方差異,或絕對差異來描述。若存在正空間自相關(guān),則在近鄰的空間位置上屬性值的差異小;若

22、在負(fù)的空間自相關(guān),則近鄰的位置上屬性值的差異大。此外空間自相關(guān)程度各不相同,其強(qiáng)度是可測度的。強(qiáng)的空間自相關(guān)意味著近鄰對象的屬性值高度接近,而無論是正值還是負(fù)值。圖111l是3種典型的空間自相關(guān)模式。11.3.2空間隨機(jī)性為了研究面積單元的空間自相關(guān),我們需要首先建立空間隨機(jī)性(spatial randomness)的概念。如果任意位置上觀測的屬性值不依賴于近鄰位置上的屬性值,我們說空間過程是隨機(jī)的。 Hanning則從完全獨(dú)立性的角度提出了更為嚴(yán)格的定義,對于連續(xù)空間變量,若式(1115)成立,則是空間獨(dú)立的: (11.15)式中,n為研究區(qū)域中面積單元的數(shù)量,若變量是類型數(shù)據(jù),則空間獨(dú)立性

23、改寫為 (11.16)式中, ,是變量的兩個可能的類型, 。 Hanning還描述了3類空間隨機(jī)過程,其中前兩種過程的因變量服從式(11.15)和式(1116): (1)賦值到n個位置上的連續(xù)變量來自于正態(tài)分布N(0, )。(2)賦值到n個位置上的離散變量的值來自于n次硬幣的投擲。 (3)坐標(biāo)為(,)的位置上的變量的值在一定程度上受到近鄰位置的值的影響。 例如: ,其中, ,是來 自于均值為0,方差為常數(shù)的正態(tài)分布的誤差項。為了計算方便,空間位置規(guī)定 為規(guī)則格子的中心。 顯然對于上述3個過程中,(1)和(2)產(chǎn)生的空間分布模式是空間隨機(jī)性 模式;而(3)將產(chǎn)生具有一定程度的相似性的空間模式。圖

24、1112通過模擬的方式分別給出了確定性的函數(shù)關(guān)系,即空間自相關(guān)和空間隨機(jī)性關(guān)系的3種空間模 式。其中,變量x,y的取值范圍為(一1,1),規(guī)則網(wǎng)格的邊長為0.02。 1133 關(guān)于空間自相關(guān)的測度 根據(jù)空間接近性矩陣w和描述近鄰屬性值差異的數(shù)學(xué)形式,可以提出多種空間自相關(guān)的測度。如果被研究的空間屬性或變量是名義變量或二元變量(屬性只有兩個值),那么可以使用連接計數(shù)統(tǒng)計量。如果空間變量是間距變量或比率變量,合適的空間自相關(guān)統(tǒng)計量是Morans I和Gearys C,那么還可用使用廣義統(tǒng)計量。如果假設(shè)面積單元的屬性值是位于其重心之上的,則還可以使用協(xié)方差圖和方差圖揭示不同空間尺度上的相關(guān)性,這將在

25、第7章中討論。 這些測度都被作為“空間自相關(guān)或空間聯(lián)系的全局測度”,因為統(tǒng)計量是從全部研究區(qū)域上得到的,描述的是所有面積單元的整體空間關(guān)系。但是沒有任何理由說明空間過程都是同質(zhì)性的分布??臻g自相關(guān)的程度隨著空間位置會發(fā)生變化,因此一個分布或空間模式可以是空間異質(zhì)性的。為了描述這種異質(zhì)性條件下的空間自相關(guān),我們必須能夠在局部尺度上探測空間自相關(guān)的測度方法。LISA(空間聯(lián)系局部化指標(biāo))和局部統(tǒng)計量就是為這一目的而設(shè)計的。 11.4名義變量的空間自相關(guān)測度連接計數(shù)法 我們首先應(yīng)用連接計數(shù)法(join counts)研究規(guī)則網(wǎng)格上分布的二元數(shù)據(jù)的空間自相關(guān)問題。眾多的地理問題表現(xiàn)為名義標(biāo)度的變量,最

26、簡單的情況是二元名義數(shù)據(jù),例如對于溫度場的高低劃分、城市和郊區(qū)的劃分等。 假設(shè)規(guī)則網(wǎng)格中分布的二元數(shù)據(jù)的變量或?qū)傩詾楣ぃ瑒t變量在任何網(wǎng)格單元上的取值只能是1或0兩個數(shù),或黑白兩種顏色: (11.17) 對于二元數(shù)據(jù)的網(wǎng)格單元,其連接類型可分為, , 3種情況,我們使用交叉積計算如下3種連接的統(tǒng)計量,其中BB表示黑色單元和黑色單元鄰接,余同。 設(shè)研究區(qū)域共劃分為個單元,其中編碼為1的單元有個,編碼為0的單元有個,則,于是上述3種情況的計數(shù)可寫成: (11.19)式中,為接近性矩陣,規(guī)則網(wǎng)格取值可根據(jù)鄰接規(guī)則的不同而不同。前指出按照車的行走方式和王后的行:方式定義的兩種鄰接規(guī)則是最為常用的,圖11

27、.13是按照車(rook)的連接方式計算的鄰接矩陣的實例。當(dāng)接近性矩陣確定后,我們就能計算連接計數(shù)統(tǒng)計量。圖1114分別給出了按照車和王后兩種連接方式的3種空間模式連接計數(shù)統(tǒng)計量的計算結(jié)果。其中,圖11.14(a)是黑色的單元和白色的單元在空間上聚集在一起,因此無論采用哪種連接方式,和兩種們況的計數(shù)值都大,表明鄰近位置上的變量值的相似性,正相關(guān);圖11.14(b)所示的情況中,黑白兩種單元相間排列,于是和的計數(shù)值小,而白計數(shù)值大,表明相近的位置上變量的值不相似,負(fù)相關(guān)。圖11.14(c)是黑白兩種單元隨機(jī)排列的情況,因此其,和的計數(shù)值介于上述兩種情況之間于是通過比較,的計數(shù)值可以判斷空間模式的

28、一般性結(jié)論;當(dāng)相鄰的單元具有相似的名義變量時,存在正空間自相關(guān);當(dāng)相鄰的單元具有更多的不相似的名義變量時,存在負(fù)空間自相關(guān)。但是要確切地給出空間模式的推斷還必須和隨機(jī)空間模式進(jìn)行比較。在完全隨機(jī)條件下, 個單元可以組合成種空間模式,和 3種連接方式的期望計數(shù)值分別為 (11.20)式中, ;和分別是一個單元被編碼為或的概率。 在采樣位置不可置換的情況下,個單元可以組合的空間模式的數(shù)量是,、和 3種連接方式的期望計數(shù)值分別為 (12.21) 式中, 。若相似的編碼單元相互排列在一起,則,和增大;當(dāng)不相似的編碼單元排列在一起時, , ,。 在完全隨機(jī)條件下,、和的標(biāo)準(zhǔn)差的期望為 (11.22)式中

29、,和的意義同前,而m按照式(1123)計算 (11.23)式中,是第個單元的連接數(shù)量。根據(jù)上述公式,可以計算圖1114所示實例的期望連接數(shù)量與方差。根據(jù)圖1114, ,考慮車的連接方式,即N-S和E-W方向上的連接,從圖1114(b)可以得到總的連接數(shù)量,而m的計算較為復(fù)雜,分別有位于角上的2種連接,位于“邊”上的3種連接,以及位于“中間”的4種連接,于是有在隨機(jī)條件下,在得到各種連接類型計數(shù)的均值和方差的基礎(chǔ)上,我們可進(jìn)步構(gòu)造一個服從正態(tài)分布的統(tǒng)計量: (11.24)式中,表示上述3種連接方式的計數(shù)值。通過實際計算的值和一定顯著性水平上對應(yīng)的值的比較即可得到觀測的空間模式是否顯著地異于隨機(jī)模

30、式的推斷。對于上面的例子,我們得到車連接方式的值的計算結(jié)果,見表116。在的顯著性水平上,只有分布模式(c)位于獨(dú)立隨機(jī)性的數(shù)值范圍內(nèi),于是(a)和(b)是非隨機(jī)的模式,且對于模式(c)拒絕隨機(jī)模式的零假設(shè)是不充分的。11.5空間自相關(guān)統(tǒng)計量Morans I和Gearys C 雖然連接計數(shù)統(tǒng)計量提供了直觀且簡易的方法測度二元名義尺度變量的全局空間自相關(guān),但是這種條件相當(dāng)嚴(yán)格,在應(yīng)用中存在諸多缺陷。其一,連接計數(shù)法只能用于二元名義變量,即黑白、高低、干濕等情況;其二,計算相當(dāng)繁瑣,且在統(tǒng)計推斷中統(tǒng)計量轉(zhuǎn)換為Z值后造成解釋上的困難;其三,現(xiàn)實世界的大部分變量是以間距或比率尺度量測的。于是在空間自相

31、關(guān)的研究中提出了其他的測度方法。這就是本節(jié)介紹的Morans I統(tǒng)計量和Gearys C統(tǒng)計量。 Morans I統(tǒng)計量和Gearys C統(tǒng)計量具有某些共同的特點,但是其統(tǒng)計性質(zhì)是不同的。分析人員大多喜歡采用Morans I是因為該統(tǒng)計量的分布特征更加合意(A.DCliff,JKOrd,1981)。并且兩個統(tǒng)計量都是基于鄰近面積單元上變量值的比較。如果研究區(qū)域中鄰近面積單元具有相似的值,統(tǒng)計指示正的空間自相關(guān);若鄰近面積單元具有不相似的值,則表示可能存在強(qiáng)的負(fù)空間相關(guān)。但是兩個統(tǒng)計量使用了不同的方法來比較近鄰面積單元的值。1151 Morans I統(tǒng)計 設(shè)研究區(qū)域中存在,個面積單元,第個單元上

32、的觀測值記為,觀測變量在個單元中的均值記為,則Morans I定義為式中,等號右邊第二項類似于方差,是最重要的項,事實上這是一個協(xié)方差,鄰接矩陣W和的乘積相當(dāng)于規(guī)定對相鄰的單元進(jìn)行計算,于是J值的大小決定于i和j單元中的變量值對于均值的偏離符號,若在相鄰的位置上,和是同號的,則為正;和是異號的,則為負(fù)。在形式上Morans I與協(xié)變異圖為了簡化公式,還可寫成矩陣的形式: (11.26)式中,W是矩陣, ;是構(gòu)成的列向量。 Morans I 指數(shù)的變化范圍為(-1,1)。如果空間過程是不相關(guān)的,則I的期望接近于0,當(dāng)I取負(fù)值時,一般表示負(fù)相關(guān),I取正值,則表示正的自相關(guān),用I指數(shù)推斷空間模式還必

33、須與隨機(jī)模式中的I指數(shù)作比較。 假設(shè)隨機(jī)變量Y的觀測值來自于正態(tài)分布,并且和是空間依賴的,那么抽樣得到I的分布是近似的正態(tài)分布,并且有 (11.27)式中, (11.29) (11.30) (11.31) 在獲得理論I值的基礎(chǔ)上,可構(gòu)造服從正態(tài)分布的統(tǒng)計量Z,以此檢驗空間自相關(guān)的顯著性。Z統(tǒng)計量表示為 (11.32)下面用Moran,sJ檢驗美國俄亥俄州首府哥倫布市的犯罪率的空間分布是否在顯著的空間自相關(guān)。圖1115是關(guān)于犯罪率分布的分層設(shè)色地圖,從淺亮到暗色的變化表示犯罪率的從低到高的變化。疊加在城市空間單元上的連線是使多邊形重心構(gòu)成的鄰接圖。計算中使用的接近性矩陣按照共享邊界的方法計乙首先

34、作出如下假設(shè): H。:在俄亥俄州首府哥倫布市的犯罪率不存在空間自相關(guān)。 H1:在俄亥俄州首府哥倫布市的犯罪率存在正空間自相關(guān)。計算得到犯罪率的標(biāo)準(zhǔn)差為5.5894,p值為1.139e-08,根據(jù)樣本得到的統(tǒng)計量估計為 Morans I 期望 方差 0. -0. 0.于是,在和的顯著性水平上拒絕,俄亥俄州首都哥倫布市犯罪率的空間分布為顯著正空間自相關(guān)。11.5.2 Gearys 統(tǒng)計量Gearys 也是一種測度空間自相關(guān)的統(tǒng)計量,采用的也是交叉積的形式,定義為 (11.33)式中, ,即指數(shù)是非負(fù)的。 完全空間隨機(jī)過程的期望值,如果,表示正的空間自相關(guān);表示負(fù)的空間自相關(guān)。當(dāng)相似的值聚集時趨向于

35、0,當(dāng)不相似的值聚集時趨向于2。顯然和相比較,是一種反向關(guān)系。 與相似,也可以應(yīng)用于任何類型的空間權(quán)重矩陣,雖然最常用的是二元矩陣和行標(biāo)準(zhǔn)化矩陣,將的計算公式和的計算公式想比較,顯著的差異是的分子采用的是交叉積的形式,采用的是兩個近鄰的數(shù)值對于均值的離差;而采用的是直接比較兩個近鄰數(shù)值的方法。在很大的程度上,我們不關(guān)心比大多少或小多少,但是比較兩個數(shù)值大小的目的是關(guān)心兩個近鄰的數(shù)值的相似程度。因此,對近鄰值的差求平方可消除差異的方向性影響。值的變化范圍為(0,2),其中,0表示完全的正空間自相關(guān)(即所有的近鄰值一致,這樣交叉積項為0),2表示完全的空間負(fù)自相關(guān)。與不同的是,的期望值不受樣本數(shù)量

36、的影響,是常數(shù)1。11.6廣義統(tǒng)計量 和都具有描述全局空間自相關(guān)的良好統(tǒng)計特性,但是它們不具有識別不同類型的空間聚集模式的能力。這些模式有時被稱為“hot spots和“cold spots。如果高值面積單元相互之間接近,和將指示相對高的正空間自相關(guān),這些高值面積單元的聚集可被標(biāo)注為“hot spots。但是和指出的高的正空間自相關(guān)也可由相互接近的低值面積單元構(gòu)成。這種類型的聚集可被描述為“cold spots。和不能區(qū)分這兩種類型的空間自相關(guān)。廣義統(tǒng)計量(A.Getis,JKOrd,1992)的優(yōu)勢是能檢測研究區(qū)域中的“hot spots或“cold spots。 廣義統(tǒng)計量也采用交叉積的形

37、式。交叉積還常被作為空間聯(lián)系(spatial association)的測度。廣義統(tǒng)計量一般定義為 (11.34)式中, 。統(tǒng)計量是根據(jù)距離定義的,在距離之內(nèi)的面積單元可作為的近鄰。當(dāng)單元和的距離小于時,權(quán)重為1,否則為0。于是權(quán)重矩陣是二元對稱矩陣,但是近鄰關(guān)系由距離定義。權(quán)重矩陣元素的和定義為,其中。由于權(quán)重的這種性質(zhì),當(dāng)和的距離大于時,的點對將不能包括在分子中。另一方面,分母包括所有的,而不管這些單元對之間的距離有多遠(yuǎn)。顯然,分母總是大于和等于(當(dāng)值很大時)分子?;旧?,當(dāng)近鄰的數(shù)值變大時,的分子將變大;反之,當(dāng)近鄰的值變小時,也變小,這是統(tǒng)計量的獨(dú)特性質(zhì)。中等水平的反應(yīng)了高和中等數(shù)值的

38、空間聯(lián)系,低水平的表示低和低于均值的空間聯(lián)系。 在計算廣義統(tǒng)計量之前,必須首先定義近鄰的距離。在美國俄亥俄州的例子中,選擇,根據(jù)表114中7個縣中心之間的距離,按照門限計算二元權(quán)重矩陣,見表117。30mile對于每個縣至少包含一個近鄰來說已經(jīng)是非常大的距離了,但是對于任何一個縣包含所有的縣來說這一距離又很小。計算得到該例中的統(tǒng)計量為但是對于廣義統(tǒng)計量的更為詳細(xì)的解釋依賴于期望值和標(biāo)準(zhǔn)化后的變量Z值。 為了導(dǎo)出Z并檢驗廣義統(tǒng)計量,我們必須知道的期望和方差。的數(shù)學(xué)期望為(11.35) (11.35)本例中, ,直觀上,由于觀測的輕微地大于期望的,我們認(rèn)為觀測模式展示出一定的正向空間聯(lián)系,但是在檢

39、驗之前我們不能斷定統(tǒng)計是顯著的,于是需要導(dǎo)出Z值。的方差為 (11.36)式中, (11.37)于是, ; 。檢驗統(tǒng)計量為這一數(shù)值小于005顯著水平上的標(biāo)準(zhǔn)閾值196,即計算的具有輕微的空間聯(lián)系。Z值表明具有高的中位數(shù)家庭收入的縣與中等收入水平的縣相聯(lián)系(30mile近鄰尺度上)。這一關(guān)系不是統(tǒng)計上顯著的,即這樣的模式可能是小概率的事件而不是系統(tǒng)的過程。 11.7局部空間自相關(guān)統(tǒng)計量前述所有的空間自相關(guān)統(tǒng)計量都是全局統(tǒng)計量,因為它們是對于整個研究區(qū)域概括出的統(tǒng)計量。假定研究區(qū)域上具有不同的空間自相關(guān)值是合理的,或者說,在某些區(qū)域上的空間自相關(guān)的值可能是高的,另外一些區(qū)域上的值可能是低的,甚至可

40、能在研究區(qū)域的某一部分中找到正的空間自相關(guān)而在另一些區(qū)域中找到的是負(fù)的空間自相關(guān)。這一現(xiàn)象出現(xiàn)的原因在于空間異質(zhì)性的存在。 為了獲取空間異質(zhì)性的測度,我們必須依賴于其他的測度。對全局測度統(tǒng)計量(、及廣義的適當(dāng)修正可用于探測局部尺度上的空間自相關(guān)。1171 空間聯(lián)系局部指標(biāo)LISA LISA是與和相關(guān)的局部化版本(L.Anselin,1995)。為了說明在局部尺度上空間自相關(guān)的水平,需要在任意面積單元上導(dǎo)出空間自相關(guān)數(shù)值。對于面積單元,其局部Morans I統(tǒng)計量定義為 (11.38)式中, ,分別是對于均值和標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)化變量; , 為的標(biāo)準(zhǔn)差。 局部Morans I的高值表示具有相似變量值的面積單元的空間聚集(可以是高或低),而局部MoransJ的低值說明不相似值的空間單元的空間聚集。一般地, 可以使用行標(biāo)準(zhǔn)化矩陣,但是其他的空間權(quán)重矩陣也適用。 如果權(quán)重是行標(biāo)準(zhǔn)化的形式,那么面積單元的局部Morans I是的均值扁差乘以所有值均值偏差的積的和,空間權(quán)重定義了和之間的關(guān)系。 以美國俄亥俄州7個縣的例子說明LISA的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論