版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、會計學(xué)1空間數(shù)據(jù)分析空間數(shù)據(jù)分析(fnx)分析分析(fnx)解析解析第一頁,共354頁。 空間數(shù)據(jù)描述性與探索性分析技術(shù)與方法,特別是對規(guī)模龐大的數(shù)據(jù)集,通過數(shù)據(jù)圖形化與地圖化的探索性分析,研究(ynji)數(shù)據(jù)中潛在的模式,異常等,為 后續(xù)分析做準(zhǔn)備.1.3空間統(tǒng)計分析 用統(tǒng)計的方法研究(ynji)空間數(shù)據(jù)的性質(zhì),這種統(tǒng)計方法與傳統(tǒng)的統(tǒng)計分析方法不同.第1頁/共354頁第二頁,共354頁。1.4空間建模 建立模型(mxng)預(yù)測空間過程與結(jié)果2空間分析的研究進(jìn)展 線性回歸是計量革命的核心技術(shù),于是就出現(xiàn)了計量地理學(xué),但計量地理學(xué)主要移植了統(tǒng)計分析方法,如相關(guān)分析,回歸分析,聚類分析,因子分析,
2、而對空間模式,空間過程,空間相互作用等理論與方法介紹的很少,因此受到了批評. 第2頁/共354頁第三頁,共354頁。 1970-1980,空間分析方法發(fā)展中非常重要的時代,在這一時期圍繞地理現(xiàn)象的空間本質(zhì)(bnzh)或地理數(shù)據(jù)的空間性質(zhì),建立了地理學(xué)的空間分析方法與體系.1969年,Tobler提出了地理學(xué)第一定理:任何事物都是空間相關(guān)的,距離近的事物空間相關(guān)性大.Clifford在1973年出版的專著中揭示了空間自相關(guān)的概念,展示空間隨機(jī)條件下如何檢驗回歸誤差,第3頁/共354頁第四頁,共354頁。并揭示了空間加權(quán)矩陣的本質(zhì). 1981年Ripley對空間點分布模式進(jìn)行了研究,提出了測度空間
3、點模式的K函數(shù)方法,OpenShaw對空間數(shù)據(jù)中的可塑面積單元問題進(jìn)行了深入研究,這對正確使用空間數(shù)據(jù)及解釋空間結(jié)果意義(yy)重大.第4頁/共354頁第五頁,共354頁。 Anslin提出描述局部相關(guān)性的測度方法(fngf)與統(tǒng)計量,這一時期空間相關(guān)性的空間回歸模型與空間自回歸模型被提出,導(dǎo)致空間計量經(jīng)濟(jì)學(xué)的出現(xiàn). 20世紀(jì)90年代,空間分析的發(fā)展與GIS的發(fā)展緊密結(jié)合在一起, GIS為空間分析提供了廣泛的數(shù)據(jù)源,空間分析集中體現(xiàn)在以下4個方面:第5頁/共354頁第六頁,共354頁。1)GIS的數(shù)據(jù)革命極大地促進(jìn)了空間分析在眾多領(lǐng)域的應(yīng)用.2)數(shù)據(jù)環(huán)境發(fā)生了巨大的變化,空間分析需要的海量數(shù)據(jù)
4、,迫切需要新一代的以數(shù)據(jù)為驅(qū)動的地理探索與建模工具(gngj),使分析處理過程中多維復(fù)雜性不被忽略.3)高性能計算機(jī)的出現(xiàn),使復(fù)雜數(shù)據(jù)處理的空間分析成為可能.4)神經(jīng)網(wǎng)絡(luò),遺傳算法成為空間分析的范例第6頁/共354頁第七頁,共354頁。 空間分析的研究(ynji)內(nèi)容1)空間數(shù)據(jù)模型與地理世界的表示2)探索性空間數(shù)據(jù)分析與可視化3)空間數(shù)據(jù)的性質(zhì)4)空間數(shù)據(jù)分析的點模式方法5)面數(shù)據(jù)的空間分析方法與空間回歸模型6)空間連續(xù)(linx)數(shù)據(jù)的分析方法7)地圖代數(shù)與柵格數(shù)據(jù)建模技術(shù)第7頁/共354頁第八頁,共354頁。8)地理模型與決策(juc)支持第2章 空間數(shù)據(jù)的性質(zhì)(xngzh)2.1地理(
5、dl)世界的概念模型與數(shù)據(jù)模型 對現(xiàn)實世界進(jìn)行高度抽象,概括其概念模型,然后建立適應(yīng)于計算機(jī)存儲與表示的數(shù)據(jù)模型.地理(dl)世界的概念模型第8頁/共354頁第九頁,共354頁。1)離散實體 通過其獨特的局部化特征相互區(qū)別,通過特定屬性的個體被識別,如建筑物,街道等. 離散對象觀的重要特征是可以計數(shù)(j sh). 維數(shù)是離散實體的顯著特征,實體自然被抽象為點(只有位置的0維實體),線(具有長度屬性的一維實體)和多邊形(占據(jù)一定面積的2維實體).第9頁/共354頁第十頁,共354頁。 點,線與多邊形的抽象與研究與空間尺度有關(guān),如大尺度時城市就是一個點,城市為研究對象時就是一個多邊形. 具有連續(xù)變
6、化的自然現(xiàn)象不適合用離散對象方法表示. 空間對象的幾何形態(tài)與屬性特征共同構(gòu)成地理信息的完整(wnzhng)信息.屬性特征常用表描述,表的一行是一個離散實體,一列是對象一個屬性.第10頁/共354頁第十一頁,共354頁。 離散對象也可以表示連續(xù)變化的場,如用等高線表示地形的連續(xù)起伏(qf),線的稀疏表示空間變化的剃度.2)連續(xù)場(標(biāo)量場與矢量場) 用連續(xù)表面描述地理現(xiàn)象的方法叫場的觀點,場的觀點認(rèn)為世界被很多變量描述,每一變量在任何可能的位置都是可測量的. 連續(xù)場描述的是空間-時間框架下地理變量的空間變化.第11頁/共354頁第十二頁,共354頁。 表示連續(xù)世界的空間數(shù)據(jù)模型都是某種程度的近似,
7、這些模型包括:規(guī)則(不規(guī)則)的空間點,等值線,規(guī)則單元格,不規(guī)則三角網(wǎng),及多邊形等.點模型與線模型不能完整地表示場,因為所關(guān)心的地理變量的值只存在于特定的點或線的位置(wi zhi)上. 空間插值的方法將基于點或線的模型轉(zhuǎn)化為基于面的模型,如三角網(wǎng),多邊形.第12頁/共354頁第十三頁,共354頁。 不規(guī)則多邊形表示場是經(jīng)常使用的一種近似技術(shù),如Thiessen多邊形. 提出及原理:荷蘭氣候?qū)WAHThiessen提出根據(jù)離散分布?xì)庀笳镜慕涤炅坑嬎闫骄涤炅康姆椒?fngf),即將所有相鄰氣象站連成三角形,作這些三角形各邊的垂直平分線,每個氣象站周圍的若干垂直平分線便圍成一個多邊形。用這個多邊形
8、內(nèi)所包含的一個唯一氣象站的降雨強(qiáng)度來表示這個多邊形區(qū)域內(nèi)的降雨強(qiáng)度第13頁/共354頁第十四頁,共354頁。 泰森多邊形的特性是:1),每個泰森多邊形內(nèi)僅含有一個(y )離散點數(shù)據(jù);2),泰森多邊形內(nèi)的點到相應(yīng)離散點的距離最近;3),位于泰森多邊形邊上的點到其兩邊的離 散點的距離相等第14頁/共354頁第十五頁,共354頁??臻g數(shù)據(jù)(shj)模型-矢量與柵格 離散對象與連續(xù)場只考慮了地理現(xiàn)象的概念或方式,不能以數(shù)字的形式表示地理數(shù)據(jù)(shj).1)柵格數(shù)據(jù)(shj) 柵格表示中,地理空間被劃分成矩形單元格矩陣,所有的地理變化通過對單元格賦予性質(zhì)或?qū)傩詠肀硎?但單元格內(nèi)部的細(xì)節(jié)變化信息都丟失了,
9、單元格有時被稱為像素,如遙感影象是典型的柵格數(shù)據(jù)(shj).第15頁/共354頁第十六頁,共354頁。最大份額法:當(dāng)一個單元格是多個區(qū)域的交 叉地域時,單元格中占面積份額最大的區(qū)域擁有這個單元格.中心點法:中心點所屬區(qū)域擁有此單元格.2)矢量數(shù)據(jù) 矢量數(shù)據(jù)表示中,所有(suyu)的線通過點直線連接而成,區(qū)域通過一系列點之間的直線連接,用多折線表示曲線.第16頁/共354頁第十七頁,共354頁。矢量形式表示的區(qū)域:形成區(qū)域多邊形頂點的 點被獲取,此方法表示區(qū)域比柵格簡單,因柵格表示多邊形需列出所有單元格.屬性數(shù)據(jù)的測度 地理信息中的屬性非常(fichng)廣泛,有的是自然或環(huán)境的,有的是社會或經(jīng)
10、濟(jì)的,區(qū)分屬性信息的測度類型很重要. 量測層次上將屬性數(shù)據(jù)分為離散尺度或連續(xù)尺度,定性的或定量的.第17頁/共354頁第十八頁,共354頁。更詳細(xì)的劃分(hu fn)如下:變量類型變量類型空間表示空間表示 點點 線線 面面 表示表示名義名義(=)案發(fā)地的案發(fā)地的分類分類道路是否道路是否在修補(bǔ)在修補(bǔ)環(huán)境保護(hù)環(huán)境保護(hù)的功能區(qū)的功能區(qū)土地利用土地利用類型類型序數(shù)序數(shù)( )區(qū)域中城區(qū)域中城鎮(zhèn)按收入鎮(zhèn)按收入水平排序水平排序道路的等道路的等級分類級分類城市中各城市中各縣的收入縣的收入水平水平土壤質(zhì)量土壤質(zhì)量等級等級間距間距各城鎮(zhèn)的各城鎮(zhèn)的產(chǎn)值份額產(chǎn)值份額河流的平河流的平均海拔高均海拔高度度城市中各城市中各
11、縣的產(chǎn)值縣的產(chǎn)值份額份額地表溫度地表溫度比率比率連鎖店銷連鎖店銷售額售額道路道路.河流河流長度長度區(qū)域的人區(qū)域的人均收入均收入降水量降水量,第18頁/共354頁第十九頁,共354頁。名義屬性:是對地理實體的分類,地理對象的名稱是最好的例子,名義屬性包括數(shù)字,文字,甚至顏色.對數(shù)字的名義屬性進(jìn)行運算沒有任何意義.序數(shù)屬性:序數(shù)屬性的類型存在等級關(guān)系,序數(shù)屬性的算術(shù)運算也沒有任何意義.如區(qū)域收入等級劃分.平均數(shù)無意義,中位數(shù)則有意義.間距屬性:一個值對另一個值的差異幅度,而不是該值與真實零點之間的差值,因此數(shù)量關(guān)系的運算受到限制,加減運算有效(yuxio),乘除無效.第19頁/共354頁第二十頁,
12、共354頁。 比率(bl)屬性:數(shù)值與真實零點之間差異幅度的度量,兩個比率(bl)數(shù)值之間的加減乘除運算是有效的,如100Kg人的重量是50Kg人的兩倍. 空間廣延量(面積)與空間強(qiáng)度量(密度). 此外還要注意數(shù)據(jù)的方向與周期. 空間數(shù)據(jù)的性質(zhì)空間數(shù)據(jù)的性質(zhì)直接影響空間分析與建模.第20頁/共354頁第二十一頁,共354頁。1空間依賴性與空間異質(zhì)性1.1空間依賴性 空間上距離相近事物的相似性比距離遠(yuǎn)的事物的相似性大.其含義如下: 空間某一位置i,某變量(binling)的值與其鄰近位置j上的觀測值有關(guān),其形式為:jiniyfyji;, 2 , 1),(第21頁/共354頁第二十二頁,共354頁
13、。 假如地理現(xiàn)象是由一個過程及其表述的環(huán)境定義,過程表示現(xiàn)象基本因素的變化,環(huán)境表示現(xiàn)象的觀測框架(空間與時間),空間依賴性表示環(huán)境對過程的重要影響. 這樣傳統(tǒng)統(tǒng)計理論關(guān)于獨立同分布的假設(shè)是不成立的. 空間依賴性是通過空間自相關(guān)測度的,空間自相關(guān)的指標(biāo)多樣(du yn),可分為全局測度與局部測度.第22頁/共354頁第二十三頁,共354頁。全局測度給出研究區(qū)域整體的一個參數(shù)或指數(shù)局部測度提供與數(shù)據(jù)觀測點等量的參數(shù)或指數(shù)1.2空間異質(zhì)性 異質(zhì)性表明空間數(shù)據(jù)的變化不是平穩(wěn)的,但在局部其變化可能是一致的,于是就出現(xiàn)了局部模型,但局部模型的應(yīng)用(yngyng)會增加空間數(shù)據(jù)分析的誤差與不確定性.空間每
14、一點的地理要素之間存在不同的關(guān)系:如iiiixyiiyx ,都是空間觀測(gunc)數(shù)據(jù)第23頁/共354頁第二十四頁,共354頁。如房屋(fngw)價格與CBD距離關(guān)系的空間異質(zhì)性1.3可塑性面積單元問題與生態(tài)繆誤 面積單元對分析結(jié)果的影響,1)尺度效應(yīng):空間單元經(jīng)聚合改變尺度大小時,空間數(shù)據(jù)的統(tǒng)計分析結(jié)果也會發(fā)生變化,且不同聚合方案得到不同的結(jié)果.2)劃區(qū)效應(yīng):不同聚合方式對分析結(jié)果的影響. 可塑性面積單元問題是由區(qū)域數(shù)量,規(guī)模,形狀對空間數(shù)據(jù)分析的影響.第24頁/共354頁第二十五頁,共354頁。P24有關(guān)兩種效應(yīng)的說明MAUP對政治也有影響.分析結(jié)果僅對所采用的面積單元有效,在其他尺度
15、上無效,因此將某一尺度上的結(jié)果推廣到其他尺度上將導(dǎo)致(dozh)生態(tài)繆誤.第25頁/共354頁第二十六頁,共354頁。空間數(shù)據(jù)的不確定性 空間數(shù)據(jù)的質(zhì)量對建模分析,表示,結(jié)果及決策的正確性意義重大. 空間數(shù)據(jù)使用者主要依賴二次數(shù)據(jù)源,且記錄的時間誤差也隱含在數(shù)據(jù)集中,空間數(shù)據(jù)的不確定性取決于誤差結(jié)構(gòu)隨著地圖上位置的而變化(binhu).如遙感數(shù)據(jù)雖然經(jīng)過幾何校正,但位置誤差還是不均勻的.第26頁/共354頁第二十七頁,共354頁。 明確不確定性的類型,來源及產(chǎn)生機(jī)制對提高空間數(shù)據(jù)質(zhì)量,建立控制與修正機(jī)制意義重大.1.不確定性的類型1.1空間不確定性 這種不確定性是由對象定義的主觀性引起的,如不
16、清晰(qngx)的邊界,空間對象的屬性具有主觀性.第27頁/共354頁第二十八頁,共354頁。1.2對象定義的不確定性 對象定義依賴于人為規(guī)定1.3關(guān)系不確定性 生物量與測樹因子的關(guān)系1.4分區(qū)問題 氣候類型區(qū)的劃分,很多專家意見不一.2地理現(xiàn)象(xinxing)測度的不確定性2.1物理測量誤差(高山海拔測量)第28頁/共354頁第二十九頁,共354頁。2.2數(shù)字化誤差2.3不同來源數(shù)據(jù)集整合時的誤差3地理對象表示的不確定性3.1柵格數(shù)據(jù)表示的不確定性 柵格數(shù)據(jù)將空間劃分為等面積的單元格(像素),一個單元格不完全是一個屬性構(gòu)成,而包含了某幾個(j )屬性,這樣的單元格為混合元,但一個單元格只能
17、有一個值,這樣混合元的值為其優(yōu)勢值或中心點值.第29頁/共354頁第三十頁,共354頁。這樣就會丟失某些信息,使柵格數(shù)據(jù)結(jié)構(gòu)(jigu)扭曲空間對象的形狀.3.2矢量數(shù)據(jù)表示的不確定性(數(shù)據(jù)聚集引起)第30頁/共354頁第三十一頁,共354頁。探索性空間(kngjin)數(shù)據(jù)分析與可視化1.EDA ESDA與可視化 EDA技術(shù)(jsh)的特點是數(shù)據(jù)不做假設(shè),而是利用統(tǒng)計圖表,圖形和統(tǒng)計概括方法對數(shù)據(jù)特征進(jìn)行分析與描述,從而對數(shù)據(jù)進(jìn)行更為復(fù)雜的建模分析. ESDA技術(shù)(jsh)是EDA的推廣,空間數(shù)據(jù)存在自相關(guān)性,使數(shù)據(jù)無法滿足獨立性假設(shè).第31頁/共354頁第三十二頁,共354頁。1.1EDA
18、與可視化基本方法包括兩種類型:1)計算EDA,2)圖形EDA技術(shù)箱線圖 屬性數(shù)據(jù)表不能反映總體特征,分布特征與相互之間關(guān)系,需要通過統(tǒng)計方法集中反映數(shù)據(jù)集中性,分散性,偏態(tài)性,異常性等.箱線圖是反映屬性數(shù)據(jù)這些(zhxi)特征的常用方法.1)中位數(shù)與分位數(shù)某一變量的n個記錄為:nxxx,21第32頁/共354頁第三十三頁,共354頁。數(shù)據(jù)(shj)的值從小到大進(jìn)行排序)()2()1(,nxxx中位數(shù)是從小到大排列數(shù)據(jù)(shj)中位于中間位置的數(shù):為偶數(shù)為奇數(shù)nxxnxMnnn,)(21,)21()2()21(中位數(shù)的本質(zhì)是數(shù)據(jù)排列的位置(wi zhi),不受異常值的影響,比均值穩(wěn)定.第33頁/
19、共354頁第三十四頁,共354頁。中位數(shù)反映數(shù)據(jù)的集中性,描述(mio sh)分散性的統(tǒng)計量是極差:)1()(xxRn分位數(shù)是另一種利用數(shù)據(jù)的位序描述數(shù)據(jù)的統(tǒng)計(tngj)量,設(shè)p是0,1)之間的一個數(shù),有n個位序統(tǒng)計(tngj)量,則p分位數(shù)為:是整數(shù)不是整數(shù)npxxnpxQnpnpnpp),(21)1()(),1(第34頁/共354頁第三十五頁,共354頁。是np位序位置上的數(shù)值(shz),最常用的分位數(shù):)(npxp=0.75,p=0.25,分別記為 ,其含義(hny)為小于 的數(shù)據(jù)的個數(shù)分別占數(shù)據(jù)總數(shù)的75%和25%,因此也稱為上,下四分位數(shù).2)極差上下四分位數(shù)之間的差值為半極差(H
20、):13,QQ13,QQ13QQH極差是度量(dling)數(shù)據(jù)分散性的指標(biāo).第35頁/共354頁第三十六頁,共354頁。若數(shù)據(jù)序列(xli) 符合正臺分布總體nxxx,21),(2N,則其總體(zngt)的上下四分位數(shù)為:674. 0,674. 013rr當(dāng)數(shù)據(jù)存在異常值時,標(biāo)準(zhǔn)差 缺乏(quf)穩(wěn)定性,因此 可作為數(shù)據(jù)分散性的穩(wěn)健度量.3)三均值31412141QMQMM第36頁/共354頁第三十七頁,共354頁。4)異常數(shù)據(jù)與極端數(shù)據(jù)異常數(shù)據(jù)的判斷(pndun)標(biāo)準(zhǔn):設(shè)A1,A2分別是異常數(shù)據(jù)的上下截斷點,HQAHQA5 . 1,5 . 13311非異常(ychng)數(shù)據(jù)的分布區(qū)間為:),
21、(31AA異常(ychng)數(shù)據(jù)的分布范圍為:)3,5 . 1(),5 . 1,3(3311HQHQHQHQ異常數(shù)據(jù)中分離出極端數(shù)據(jù)的分布范圍:) ,3,3(31HQHQ以外的數(shù)據(jù)第37頁/共354頁第三十八頁,共354頁。5)箱線圖莖葉圖與直方圖1)莖葉圖的構(gòu)造P39的數(shù)據(jù),P40表示(biosh)構(gòu)造方法.2)莖葉圖的行數(shù)選擇根據(jù)數(shù)據(jù)個數(shù)n確定行數(shù)的方法有:log1 2log10210nLnLnL第38頁/共354頁第三十九頁,共354頁。3)直方圖的區(qū)間(q jin)寬度(f,xt= hist(x,k)LHh H為極差,L的計算(j sun)見以上3式.3/113)(2nQQh散點圖與散
22、點圖矩陣(j zhn)1)散點圖與變量之間關(guān)系的可視化P41的4組數(shù)據(jù)說明.2)散點圖與異常點的分析bar(xt,f),第39頁/共354頁第四十頁,共354頁。3)散點圖與不同類別的數(shù)據(jù)4)散點圖矩陣 研究多個變量(binling)之間的關(guān)系,但只能研究多個成對變量(binling)間的關(guān)系.5)平行坐標(biāo)圖具體方法是將相鄰兩坐標(biāo)軸的間距設(shè)為等距,坐標(biāo)軸之間平行的, 就可以表示高維空間變量(binling)之間的關(guān)系.第40頁/共354頁第四十一頁,共354頁。對于(duy)連續(xù)變量首先進(jìn)行標(biāo)準(zhǔn)化,然后畫平行坐標(biāo)圖.繪制方法:從y軸開始,做實軸的N個拷貝,標(biāo)記為x1,x2,xN,等距放置并且垂
23、直于x軸,N個軸都具有和y軸一樣的正方向,點 被表示成一條折線,其N個頂點(dngdin)位于 軸上,從而建立了RN中的點與頂點(dngdin)分別在x1,x2,xN軸上的平面折線間的一一對應(yīng)關(guān)系),(21Nxxxixix第41頁/共354頁第四十二頁,共354頁。歐式空間(kngjin)與平行坐標(biāo)空間(kngjin)的映射關(guān)系*點的對應(yīng)關(guān)系 歐式空間的點對應(yīng)平行坐標(biāo)的直線,如M(A,B)*線的對應(yīng)關(guān)系 在笛卡爾坐標(biāo)系下的線由兩點唯一(wi y)確定,同理在平行坐標(biāo)下的兩點也確定一線,不過這時的線表示成一點,如ax+by=c第42頁/共354頁第四十三頁,共354頁。ESDA與空間數(shù)據(jù)可視化
24、地圖是空間數(shù)據(jù)可視化的重要手段, ESDA是將地圖與各種統(tǒng)計圖結(jié)合起來.1主題地圖 名義變量用獨立值表示,但該數(shù)值不能進(jìn)行任何運算. 序數(shù)變量用等級符號與分層設(shè)色圖表示. 間隔變量與比率變量體現(xiàn)數(shù)據(jù)的連續(xù)(linx)變化,用等級符號,范圍圖表示.第43頁/共354頁第四十四頁,共354頁。2主題地圖表示的數(shù)據(jù)分類問題 數(shù)據(jù)分類方法有:等間隔,等范圍,自然分割法,分位數(shù)分類,自定義等. 同一數(shù)據(jù)用不同的分類方法會產(chǎn)生不同的解釋.分類需要注意的問題:1)包含(bohn)所有范圍的數(shù)據(jù)(最大與最小)2)使用不重疊的值和不空的類3)分類數(shù)量足夠大以保證數(shù)據(jù)的精確性122nnx分類(fn li)數(shù)量n:
25、第44頁/共354頁第四十五頁,共354頁。5)劃分?jǐn)?shù)據(jù)(shj)集到合理等價的觀測組中6)如果可能給出一個邏輯數(shù)學(xué)關(guān)系P49的分類實例*應(yīng)根據(jù)實際情況進(jìn)行自定義分類第45頁/共354頁第四十六頁,共354頁??臻g點模式(msh)方法 根據(jù)地理實體或時間(shjin)的空間位置研究其分布模式的方法為空間點模式1.點模式的概念及空間分析技術(shù)研究區(qū)域R內(nèi)的一系列點的組合),(,),(),(222111nnnyxSyxSyxSiS是第i個觀測事件的空間(kngjin)位置.第46頁/共354頁第四十七頁,共354頁。點模式分為3種類型:聚集分布,隨機(jī)分布,均勻分布. 點模式的分析方法:1)以聚集性為
26、基礎(chǔ)的基于密度的方法,常用(chn yn)樣方計數(shù)法和核函數(shù)法,2) 以分散性為基礎(chǔ)的基于距離的方法,常用(chn yn)最近鄰指數(shù),G-函數(shù),F-函數(shù),K-函數(shù)等. 空間依賴性所產(chǎn)生的空間效應(yīng):1)一階效應(yīng),描述某個參數(shù)均值的總體變化,即全局趨勢第47頁/共354頁第四十八頁,共354頁。2)二階效應(yīng),是由空間依賴性產(chǎn)生的,表達(dá)的是鄰近值相互(xingh)趨同的傾向,通過與均值的偏差獲得. 一階效應(yīng)用點過程密度 描述,在點s處單位面積內(nèi)事件的平均數(shù)目.)(s)(lim)(0ssdddYEsssd:點s周圍一個足夠(zgu)小的領(lǐng)域,)(sdY: 內(nèi)的事件(shjin)數(shù)目sd第48頁/共35
27、4頁第四十九頁,共354頁。二階效應(yīng)通過(tnggu)研究區(qū)域中兩個足夠夠小的子區(qū)域內(nèi)事件數(shù)目之間的相互關(guān)系,)()(lim),(0,jijijsisssssddjidddYdYEss基于(jy)密度的方法樣方計數(shù)法與核函數(shù)法1.樣方計數(shù)法將區(qū)域劃分(hu fn)為面積相等的子區(qū)域(樣方),根據(jù)每一個樣方中的事件數(shù)量計算與概括統(tǒng)計量,再將計算值除樣方面積得點分布的密度.第49頁/共354頁第五十頁,共354頁。 一般使用隨機(jī)分布模式作為理論上的標(biāo)準(zhǔn)分布,然后將計算得到的點密度與理論分布作比較,判斷點模式是屬于聚集(jj)分布,均勻分布還是隨機(jī)分布. 樣方形狀,采樣方式,樣方起點、方向、大小都會
28、影響到點的觀測頻次與分布.樣方的形狀與大小必須一樣,以保證采樣的均勻性. 樣方尺寸的計算公式為:nAQ/2第50頁/共354頁第五十一頁,共354頁。Q:樣方面積,A:研究(ynji)區(qū)域面積,n:研究(ynji)區(qū)域中點的數(shù)量(shling).觀測頻率與已知頻率的顯著性差異(chy)用K-S檢驗,1.1K-S檢驗通過比較觀測頻率分布與某一標(biāo)準(zhǔn)頻率分布,確定觀測分布模式的顯著性.過程如下:1)假設(shè)兩個頻率分布之間不存在顯著性差異.第51頁/共354頁第五十二頁,共354頁。2)給出一個顯著性水平(shupng)a,如a=0.053)計算兩個頻率分布的累積頻率分布4)計算K-S檢驗的D統(tǒng)計量,i
29、iEOD maxiiEO ,分別是兩個(lin )分布的第i個等級上的累積頻率.5)計算作為(zuwi)比較基礎(chǔ)的門限值mDa/36. 105. 0(m是樣方數(shù)量)第52頁/共354頁第五十三頁,共354頁。如果是兩個(lin )樣本模式的比較,則使用如下公式:212105. 0/36. 1mmmmDam1,m2分別是兩個樣本模式的數(shù)量.6)如果計算(j sun)得到的D值大于 ,則兩個分布的差異在統(tǒng)計意義上是顯著的.1.2 實例(P62-P64)05. 0aD第53頁/共354頁第五十四頁,共354頁。隨機(jī)分布(fnb)點模式是通過泊松過程產(chǎn)生,泊松分布(fnb)公式:!)(kekxpk隨機(jī)
30、分布點模式:研究區(qū)域(qy)中存在n個隨機(jī)分布的點時,一個樣方中恰好有1,2,k,n個點落入其中的概率分布,mn/其含義(hny)是平均每個樣方中包含的點的數(shù)量.第54頁/共354頁第五十五頁,共354頁。概率(gil)計算的遞推公式為:kkxpkxpkxppxepx) 1()(,)0() 1 (, 1)0(, 01.3方差均值比的X2檢驗泊松分布的重要特征是均值=方差=因此, X2檢驗是隨機(jī)分布點模式的另外(ln wi)一種方法.第55頁/共354頁第五十六頁,共354頁。方差均值比 ,如果空間點模式(msh)接近泊松分布,則1)基本原理:假設(shè)m個樣方中分別有 個事件的記數(shù),然后定義統(tǒng)計量I
31、(分散性指數(shù)):XXSR,21R),(21mnnn2112)() 1(miixxxxsmI第56頁/共354頁第五十七頁,共354頁。根據(jù)樣方計數(shù)計算I,后將I與顯著性水平為a的 值進(jìn)行比較,如果I顯著大于表示(biosh)聚集分布,反之表示(biosh)均勻分布. 還可以定義聚集性指數(shù)如果E(ICS)0,表示(biosh)聚集分布模式,反之表示(biosh)規(guī)則分布模式.*樣方計數(shù)法只能獲得樣方內(nèi)的信息,不能獲得樣方內(nèi)點之間的信息,有局限性(P66)21m21m1)(2xsICS第57頁/共354頁第五十八頁,共354頁。1.2核函數(shù)方法 地理事件可以發(fā)生在空間的任意位置上,不同位置上事件發(fā)
32、生的概率不一樣,點密集的區(qū)域事件發(fā)生的概率高. 空間模式在點s上的密度通過研究區(qū)域中單位面積上的事件數(shù)量來估計,最常用的方法是使用滑動(hudng)的圓來統(tǒng)計落在圓域內(nèi)的事件數(shù)量,再除以圓的面積,就得到點s處的事件密度.第58頁/共354頁第五十九頁,共354頁。設(shè)s處的事件(shjin)密度為 ,則)(s2),(#)(rrsCSs),(rsC:以s為中心(zhngxn),r為半徑的圓域#表示事件S落在圓域C中的數(shù)量核密度估計的定義為:設(shè)X1,X2,Xn是從密度函數(shù)f的總體中抽取的樣本,要依據(jù)(yj)這些樣本對每一個x估計第59頁/共354頁第六十頁,共354頁。f(x)的值, f(x)的估計
33、有參數(shù)與非參數(shù)估計問題,這里討論非參數(shù)估計:用點 把直線分成若干個小計數(shù)(j sh)區(qū)間,這樣計數(shù)(j sh)區(qū)間的端點與寬度都是固定的,記Ni為樣本點落在第i個區(qū)間ai,ai+1)里的個數(shù),則f(x)在ai,ai+1)里的函數(shù)估計值為:kiia1kiaxaaanNxfiiiiin, 1,)()(11第60頁/共354頁第六十一頁,共354頁。如果(rgu)對每個x各作一個以x為中心的小計數(shù)區(qū)間x-h,x+h,再對落在該區(qū)間的樣本點計數(shù),設(shè)為N(x,h),則密度估計為:nhhxNxfn2),()(再引進(jìn)(ynjn)函數(shù)其它, 011, 2/1)(xxK則有第61頁/共354頁第六十二頁,共35
34、4頁。niinhXxknhxf1)(1)(niiinhXxkhxf1)(1)(加權(quán)模型(mxng)事實上可以對這種矩形核函數(shù)(hnsh)放寬限制,只需要以下條件的K(x)都可以:dxxKxKxxKdxxKxKx)(,)(sup0)(lim1)(, 0)(2對于(duy)一般的概率密度函數(shù)這些條件都滿足.第62頁/共354頁第六十三頁,共354頁。K():核函數(shù),h0,為寬度,(x-Xi):估計點到事件Xi處的距離.K()一般為概率密度函數(shù),常用正態(tài)核函數(shù),四次多項式核函數(shù),均勻核函數(shù)等,h的選擇很重要:取得(qd)太小,會增加隨機(jī)的影響,使fn(x)波動較大,呈現(xiàn)出不規(guī)則的形態(tài),第63頁/共3
35、54頁第六十四頁,共354頁。取得太大,則x經(jīng)過了(x-Xi)/h的壓縮之后平均作用變得突出,會使得fn(x)過于平穩(wěn)(pngwn),靈敏性不好,一般來說在數(shù)據(jù)密集區(qū),h選小一點,反之大一點.* h選擇問題:觀察到的樣本容量, min06. 1min)()(25. 075. 05/12為nXXRnRhxfxfEMISEnn第64頁/共354頁第六十五頁,共354頁。1)核函數(shù)估計的邊緣效應(yīng)靠近研究(ynji)區(qū)域R邊界的地方會扭曲核估計的邊緣效應(yīng),因此在區(qū)域R的邊界上建立一個警戒區(qū),另外還可以邊緣校正的核函數(shù):duussssksRini)(1)()(1)(1212第65頁/共354頁第六十六頁
36、,共354頁。計算樣本向量x的概率密度估計,返回在xi點的概率密度f,使用(shyng)plot(xi,f)就可以繪制出概率密度曲線 2)實例(shl) ksdensityf,xi = ksdensity(x) f = ksdensity(x,xi) ,與上面(shng min)相同,只是此時的xi已經(jīng)給定第66頁/共354頁第六十七頁,共354頁。 基于距離的方法1.最鄰近距離法 使用最鄰近點對之間的距離描述(mio sh)分布模式,形式上相當(dāng)于密度的倒數(shù),可看作是與點密度相反的概念. 計算最鄰近點對之間的平均距離,再比較觀測模式與已知模式(隨機(jī)模式)之間的相似性,第67頁/共354頁第六十
37、八頁,共354頁。 當(dāng)觀測模式的最鄰近距離(jl)大于隨機(jī)模式的最鄰近距離(jl),則觀測模式趨于均勻,否則趨于聚集.1.1最鄰近距離(jl) 任意一點到其最鄰近點之間的距離(jl)。事件si的最鄰近距離(jl)記為dmin(si),點對之間的最鄰近距離(jl)不是相互的,但必然存在很多點對之間的最鄰近距離(jl)是相互的.(P71)第68頁/共354頁第六十九頁,共354頁。1.2最鄰近指數(shù)測度方法1)計算任意一點到其最鄰近點的距離(dmin)2)對所有(suyu)的dmin按照模式中的點的數(shù)量n,求平均距離,3)在CSR模式中同樣可以得到平均的最鄰近距離,其期望為E(dmin),最鄰近指數(shù)
38、R定義為:niisdnd1minmin)(1第69頁/共354頁第七十頁,共354頁。AndRordEdR/2,)(minminmin21/21)(minAndE考慮(kol)區(qū)域邊界的修正,則:npndE)041. 00541. 0(21)(minP為邊界(binji)周長第70頁/共354頁第七十一頁,共354頁。判斷如下:1)當(dāng)R=1,觀測事件過程來自于完全(wnqun)隨機(jī)模式,屬于隨機(jī)分布.2) R1,表明大量事件點在空間上相互接近,屬于空間聚集模式.3) RZa or Z-Za則觀測模式與CSR之間存在(cnzi)顯著差異. 如果存在(cnzi)顯著差異,則當(dāng)Z為負(fù)數(shù)時,模式趨于聚
39、集,否則趨于均勻.AnSEr/26136. 02rSEdEdZ)(minminaaZZZ第73頁/共354頁第七十四頁,共354頁。1.4實例 G函數(shù)與F函數(shù) 最鄰近距離揭示空間(kngjin)點模式分布特征存在忽略最鄰近距離分布信息的缺陷(P76所示是一種偏態(tài)分布與P75得到的均勻分布不一致). G函數(shù)與F函數(shù)是用最鄰近距離的分布特征揭示空間(kngjin)點模式的方法.第74頁/共354頁第七十五頁,共354頁。1.G函數(shù) G函數(shù)記為G(d),使用所有最鄰近事件(shjin)的距離構(gòu)造出一個最鄰近距離的累積頻率函數(shù):ndsddGi)(#)(minis為研究區(qū)域的一個(y )事件,n是事件的
40、數(shù)量,d是距離,#dmin(si)=d:距離小于d的最鄰近點的計數(shù)(j sh),隨著d的增大,最鄰近距離點積累個數(shù)也增加,G(d)也增加,0=G(d)=1第75頁/共354頁第七十六頁,共354頁。計算G(d)的過程如下:1)計算任意一點到其最鄰近點的距離dmin.2)將所有最鄰近距離列表,并按照從小到大順序排序.3)計算最鄰近距離的變程R和組距D,R=max(dmin)-min(dmin),k=1+Lg(n)/Lg(2),D=R/k,4)根據(jù)組距的上限值,累積計數(shù)點的數(shù)量(shling),并計算累計頻數(shù)G(d).第76頁/共354頁第七十七頁,共354頁。5)畫G(d)關(guān)于d的曲線圖. G函
41、數(shù)分析空間點模式的依據(jù)是G(d)曲線的形狀,如果空間點分布計較聚集,則具有較小的最鄰近距離的點數(shù)目就多,則G函數(shù)會在較短的距離內(nèi)快速上升, G函數(shù)先平緩后快速增長,則是均勻分布模式.2.F函數(shù) F函數(shù)與G函數(shù)的思想一致(yzh), F函數(shù)在被研究第77頁/共354頁第七十八頁,共354頁。的區(qū)域(qy)內(nèi)產(chǎn)生一新的隨機(jī)點集imipppppP),(21是第i個隨機(jī)(su j)點位置然后計算隨機(jī)點到事件點S之間的最鄰近距離,再沿用G函數(shù)的思想,計算不同最鄰近距離上的累積(lij)點數(shù)和累積(lij)頻率,公式為:mdSpddFi),(#)(min),(minSpdi隨機(jī)選擇的pi點到事件點S的最鄰
42、近距離,即任一隨機(jī)點到其最鄰近事件點的距離.第78頁/共354頁第七十九頁,共354頁。*G函數(shù)與F函數(shù)的區(qū)別: G函數(shù)通過事件點之間的接近性描述分布模式, F函數(shù)是通過選擇的隨機(jī)點與事件之間的分散(fnsn)程度描述分布模式, F函數(shù)曲線緩慢增加到最大,表明是聚集,快速增加到最大表明是均勻分布模式.3.F函數(shù)與G函數(shù)的統(tǒng)計推斷過程中的G和F 完全隨機(jī)過程的泊松點過程,在最鄰近距離第79頁/共354頁第八十頁,共354頁。變化范圍(fnwi)內(nèi)的某個距離d內(nèi),點的數(shù)量均值等于 ,在最鄰近距離小于等于d時的累計概率分布為:2d21)()(dedFEdGE*G(d)與CSR(G(d)判斷(pndu
43、n)點分布模式見P81*F(d)與CSR(F(d)判斷(pndun)點分布模式見P81*G-F坐標(biāo)圖判斷(pndun)點分布模式見P82第80頁/共354頁第八十一頁,共354頁。4顯著性檢驗的隨機(jī)模擬方法 檢驗方法用蒙特卡羅隨機(jī)模擬方法:首先在研究區(qū)域R上利用(lyng)蒙特卡羅隨機(jī)模擬方法,產(chǎn)生m次的CSR點模式,并估計理論分布:miidGmdG1)(1)(), 2 , 1()(midGi是在R區(qū)域(qy)上模擬的n個CSR事件的m次獨立隨機(jī)模擬,且沒有(mi yu)經(jīng)過邊第81頁/共354頁第八十二頁,共354頁。緣校正的經(jīng)驗(jngyn)分布函數(shù)的估計.為了評價觀測模式與CSR模式差異
44、的顯著性,需要計算m次隨機(jī)模擬中分布函數(shù)G的上界U(d)與下界L(d):)(min)()(max)(, 2, 1, 2, 1dGdLdGdUimiimi畫出 及觀測模式(msh)的如果觀測模式(msh)與CSR一致,則畫出的是直線,)(),(),(dLdUdG)(dGi第82頁/共354頁第八十三頁,共354頁。計算得到的模擬m次CSR經(jīng)驗分布函數(shù)的上界與下界提供了與CSR差異顯著性的方法,得到的概率公式為:顯著性水平?jīng)Q定產(chǎn)生的隨機(jī)模擬次數(shù),如果G(d)函數(shù)曲線位于U(d)的上方,則觀測模式為顯著聚集(jj),位于L(d)下放,則顯著均勻,位于U(d)與L(d)之間,則與CSR(d)無顯著差異
45、.11)()(Pr()()(Pr(mdLdGdUdG第83頁/共354頁第八十四頁,共354頁。 K函數(shù)(hnsh)與L函數(shù)(hnsh) 最鄰近(ln jn)距離只考慮了點在最短尺度上的關(guān)系,實際的地理事件可能存在多種不同的尺度作用,于是出現(xiàn)了基于二階性質(zhì)的K函數(shù)與L函數(shù)方法.1.K函數(shù)1.1定義與K函數(shù)估計第84頁/共354頁第八十五頁,共354頁。 K函數(shù)(hnsh)也是基于研究區(qū)域R中所有事件間距離的方法。對于變量為一系列距離為d的K函數(shù)(hnsh),計算的最容易方法是依次在各個事件中心設(shè)置半徑為d的圓,計算落入每個半徑為d的圓內(nèi)其它事件的數(shù)量,并計算出所有事件的平均數(shù)量。 對于一系列d
46、值這個過程不斷重復(fù).第85頁/共354頁第八十六頁,共354頁。第86頁/共354頁第八十七頁,共354頁。在研究區(qū)域R內(nèi)的兩個點S1,S2的每一個領(lǐng)域內(nèi)發(fā)現(xiàn)至少一個點的概率(gil)( ),忽略在一個領(lǐng)域中發(fā)現(xiàn)多于一個點的概率(gil),于是有:),(21,2121SSrddPSSddSS21,SSddPr是二階性質(zhì)(xngzh)的描述,引入一階性質(zhì)(xngzh),有:)()(),(2121,2121SSSSrPPPSSSSdddd)()(),(2121SSSSr是二階性質(zhì)(xngzh)與一階性質(zhì)(xngzh)比值,第87頁/共354頁第八十八頁,共354頁。稱為(chn wi)徑向分布函數(shù)
47、,或點對相關(guān)函數(shù),將其記為:2121,21),(SSSSddddPPPSSg如果點過程(guchng)是各向同性的,那么g(.)僅依賴于兩個點S1與S2之間的距離d,記為g(d),若點過程(guchng)又是獨立分布的,則2121,SSSSddddPPP于是(ysh)g(.)=1.第88頁/共354頁第八十九頁,共354頁。1)定義點Si的近鄰是距離(jl)小于等于給定距離(jl)d的所有點,近鄰點數(shù)量的數(shù)學(xué)期望記為于是有:則K函數(shù)定義為:),(#dSCSEidgdSCSEdi02)(),(#ddgdK02)()(第89頁/共354頁第九十頁,共354頁。)(dK表示以任意點為中心(zhngx
48、n),半徑為d的圓域內(nèi)點的數(shù)量.2)K函數(shù)(hnsh)的估計anndSCSdKni/),(#)(1,a為研究區(qū)域(qy)的面積.K(d)的計算過程如下:第90頁/共354頁第九十一頁,共354頁。(1)對每一個事件設(shè)置一個半徑為d的圓,(2)計算d距離內(nèi)點的數(shù)量,(3)將所有事件d距離內(nèi)點的數(shù)量求和(qi h),然后用n乘以密度,這樣可得到每一個事件 .(4)對任意距離d重復(fù)執(zhí)行上述過程.3)K函數(shù)的邊緣效應(yīng)與校正)(dK dddddIdInadKijijijdninijjijd, 0, 1)(, )()(1, 12第91頁/共354頁第九十二頁,共354頁。當(dāng)dij超出研究區(qū)域范圍時,需進(jìn)行
49、校正(jiozhng)消除邊緣效應(yīng).,)()(1, 12 ninijjijijdwdInadKwij是較正因子,實際中周長校正法與面積校正法較常用,具體見有關(guān)文獻(xiàn).1.2 K函數(shù)點模式判別準(zhǔn)則如果點過程是相互(xingh)獨立的CSR,對于所有的第92頁/共354頁第九十三頁,共354頁。有 ,且 ,或,比較 就能建立判別空間點模式的準(zhǔn)則. ,表示d距離(jl)上 和CSR過程事件的期望值相同.2)1)(g2)(ddK2)(ddKE)(),(dKdK2)(ddK)(dK2)(ddK,表示d距離(jl)上點的數(shù)量比期望數(shù)量(shling)多,d距離上的點是聚集的.第93頁/共354頁第九十四頁,
50、共354頁。3) ,情況(qngkung)與上相反.4)1.3 實例P865)L函數(shù)6) K函數(shù)在使用上不靈活,于是就提出了L函數(shù),2)(ddKddKdL)()(CSR模式中,L(d)=0,因此L函數(shù)更容易(rngy)比較觀測值與CSR模式的理論值之間的差異. L函數(shù)中,正峰值表示點在這一尺度上聚集第94頁/共354頁第九十五頁,共354頁。負(fù)的峰值(fn zh)表示點的均勻分布.(P87)蒙特卡羅方法:所求解問題是某種隨機(jī)事件出現(xiàn)的概率,或者是某個隨機(jī)變量的期望值時,通過某種“實驗”的方法,以這種事件出現(xiàn)的頻率估計這一隨機(jī)事件的概率,或者得到(d do)這個隨機(jī)變量的某些數(shù)字特征,并將其作為
51、問題的解。三個主要步驟 :1)構(gòu)造或描述概率過程 第95頁/共354頁第九十六頁,共354頁。 對于本來不是隨機(jī)性質(zhì)的確定性問題,比如計算定積分,就必須(bx)事先構(gòu)造一個人為的概率過程,它的某些參量正好是所要求問題的解。即要將不具有隨機(jī)性質(zhì)的問題轉(zhuǎn)化為隨機(jī)性質(zhì)的問題。 2)實現(xiàn)從已知概率分布抽樣 第96頁/共354頁第九十七頁,共354頁。)(dL)(dL第97頁/共354頁第九十八頁,共354頁。一尺度上顯著異于CSR.具體過程如下:1)按照CSR過程,創(chuàng)建于觀測事件模式數(shù)量相同的點,2)計算 ,3)以上兩步驟重復(fù)n,4)對于(duy)每個d,確定最小與最大的模擬 值5)根據(jù)最大與最小的
52、,畫出 的包跡線.2.2 實例P89)(dL)(dL)(dL)(dL第98頁/共354頁第九十九頁,共354頁。K函數(shù)(hnsh)方法的擴(kuò)展-二元模式與時間空間模式 當(dāng)考慮某種類型的事件聚集分布與其他類型事件聚集有關(guān)時,若兩事件模式趨于比期望的兩個獨立模式更接近時,則在空間上相互吸引,否則(fuz)相互排斥. 由于地理過程的動態(tài)性,隨著時間的變化,事件發(fā)生在不同的點上,引起對時間-空間聚集性的探索.第99頁/共354頁第一百頁,共354頁。1.兩元模式與交叉(jioch)K函數(shù) 設(shè)觀測的第一類事件為案例事件,共有n1個,第二類事件為環(huán)境異質(zhì)性的控制事件,共有n2個.將兩個事件合并在一起,希望n
53、1個案例事件隨機(jī)地附在兩個事件的組合中,是事件的一個隨機(jī)標(biāo)記, 在隨機(jī)標(biāo)記的條件下,證明了案例事件K11函數(shù)與控制事件的K22函數(shù)完全相同,用此結(jié)果研究二元模式的空間集聚性問題.第100頁/共354頁第一百零一頁,共354頁。交叉(jioch)K函數(shù)定義為:21211212),(#1)(niidSCSndK21211212),(#)(niidSCSnnadK或S1是模式2中以任意事件S2i為中心,距離d為半徑的范圍內(nèi)第一個模式中事件的數(shù)量(shling).不管兩個事件模式基本分布如何,如果相互之間是獨立的,則交叉K函數(shù)與CSR的相同第101頁/共354頁第一百零二頁,共354頁。2.D函數(shù)在C
54、SR條件下,K11(d)=K22(d)=K12(d),于是將兩個事件合并為一個點集,計算案例事件樣本與控制事件樣本K函數(shù)的差異,定義一個D函數(shù)檢驗(jinyn)案例事件是否有顯著的聚集性:)()()(2211dKdKdD當(dāng) ,環(huán)境的空間異質(zhì)性存在,案例(n l)事件在尺度d上聚集,0)(dD第102頁/共354頁第一百零三頁,共354頁。0)(dD環(huán)境的空間異質(zhì)性存在(cnzi),案例事件在尺度d上均勻.3.顯著性檢驗1)案例事件(S1)與控制事件(S2)組合為一個點集.2)在組合的點集中隨機(jī)抽取n1個事件樣本(yngbn)模擬案例事件.3)根據(jù)模擬案例事件與控制事件,計算)(),(2211d
55、KdK第103頁/共354頁第一百零四頁,共354頁。4)重復(fù)m次,5)獲得隨機(jī)模擬的最大與最小的根據(jù)以上準(zhǔn)則,就可判斷案例事件與控制事件的空間點模式.4.實例(shl)P915.空間-時間模式與D函數(shù) 對每一個事件附加一個時間標(biāo)記,于是空間-時間K函數(shù)定義為:)(dD第104頁/共354頁第一百零五頁,共354頁。)| ),(#),(TtdSCSEtdKiTDD事件的空間(kngjin)密度,T事件(shjin)的時間密度,)| ),(#TtdSCSEi在時間(shjin)間隔t內(nèi),以任意點Si為中心,d為半徑的距離內(nèi)事件數(shù)量的期望.如果運行在時間與空間上的過程是獨立的,則K(d,t)=K(
56、d)K(t).第105頁/共354頁第一百零六頁,共354頁。這時的D函數(shù)(hnsh)為:)()(),(),(tKdKtdKtdDTD面狀數(shù)據(jù)空間(kngjin)模式分析方法 空間接近性與空間權(quán)重矩陣1.空間接近性 空間接近性實質(zhì)上是面積單元之間的距離(jl)關(guān)系,而接近程度用空間權(quán)矩陣描述.1.1邊界鄰接法第106頁/共354頁第一百零七頁,共354頁。面積單元之間具有共享的邊界,稱為是空間接近的,用邊界鄰接定義一個面積單元的直接鄰接,后根據(jù)臨界的鄰接關(guān)系定義間接鄰接或多重鄰接.1.2重心距離(jl)法(P95中圖5.2的說明)面積單元的重心或中心之間的距離(jl)小于某個指定的距離(jl)
57、,則面積單元在空間上是接近的.第107頁/共354頁第一百零八頁,共354頁。2.空間權(quán)重矩陣假設(shè)研究區(qū)域中有n個多邊形,任意兩個多邊形都存在一個空間關(guān)系,這樣就有n*n對關(guān)系,需要n階矩陣存儲這些(zhxi)空間關(guān)系.2.1二元鄰接矩陣共享邊界定義鄰接:其他共享邊界與, 0, 1jiijAAW第108頁/共354頁第一百零九頁,共354頁。重心(zhngxn)距離法也可以類似的定義:其他重心的距離小于與, 0, 1dAAWjiij這樣構(gòu)成的權(quán)重矩陣稱為二元鄰接矩陣.二元鄰接矩陣的性質(zhì):1)對角線元素cii=0;2)矩陣具有對稱性,cij=cji;3)矩陣的行元素和等于(dngy)該空間單元直
58、接鄰居的數(shù)量;第109頁/共354頁第一百一十頁,共354頁。高階形式的二元鄰接矩陣,考慮任意一個面積單元的三階最近鄰(jn ln),則得接近性矩陣W,這是一個非對稱的接近性矩陣,矩陣各行求和值等于該行對應(yīng)面積單元的3階近鄰(jn ln)數(shù)量.2.2 行標(biāo)準(zhǔn)化權(quán)重矩陣行和記為Ci,Wij=Cij/Ci.2.3重心矩陣與權(quán)重矩陣(距離描述近鄰(jn ln)關(guān)系)第110頁/共354頁第一百一十一頁,共354頁。其他中心距離, 0,ijrijijddW一般(ybn)采用二次方的倒數(shù).21ijijdW 面狀數(shù)據(jù)的趨勢(qsh)分析1.空間滑動(hudng)平均第111頁/共354頁第一百一十二頁,共
59、354頁。 空間滑動平均(pngjn):利用近鄰面積單元的值計算均值的一種方法. 設(shè)區(qū)域R中有m個面積單元,對應(yīng)于第j個面積單元的變量Y的值為yj,面積單元i鄰近的面積單元數(shù)為n,則滑動平均(pngjn)公式:njijnjjijiWyW11或njjiyn112.中位數(shù)光滑(gung hu)第112頁/共354頁第一百一十三頁,共354頁。當(dāng)數(shù)值中存在離群值時,中位數(shù)更加穩(wěn)定.一個變量的空間(kngjin)分布可看作是多種因素影響下的空間(kngjin)過程的一個實現(xiàn),這個空間(kngjin)過程包含了全局趨勢,局部效應(yīng)和隨機(jī)誤差.變量yij分解為:ijjiijy:總趨勢, :行和列效應(yīng)(xio
60、yng)或局部效應(yīng)(xioyng)ji,總的均值(jn zh)為:jiij第113頁/共354頁第一百一十四頁,共354頁。中位數(shù)光滑算法的一般過程如下:1)將每一行(yxng)的中位數(shù)記錄在該行的邊上,并在每一行(yxng)中減去中位數(shù).2)計算行中位數(shù)的中位數(shù),將其作為總的效應(yīng),從每一行(yxng)中位數(shù)中減去總效應(yīng).3)將每一列的中位數(shù)記錄在該列的邊上,并在每一列中減去中位數(shù).4)計算列中位數(shù)的中位數(shù),將其和總效應(yīng)相加,從每一列中位數(shù)的總效應(yīng)中減去這一數(shù)值.第114頁/共354頁第一百一十五頁,共354頁。5)重復(fù)步驟1-4,直到行列中位數(shù)不再發(fā)生變化.例子:P101-1023.核密度估
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 托運物品活動策劃方案(3篇)
- 燒烤氣氛活動策劃方案(3篇)
- 監(jiān)獄戒毒場所后勤管理制度(3篇)
- 針灸推拿科管理制度目錄(3篇)
- 《GA 2114-2023警用服飾 禮服女皮鞋》專題研究報告
- 獸藥GMP培訓(xùn)課件
- 《GA 425.9-2003指紋自動識別系統(tǒng)基礎(chǔ)技術(shù)規(guī)范 第9部分:指紋圖像數(shù)據(jù)轉(zhuǎn)換的技術(shù)條件》專題研究報告
- 2026河北石家莊城市更新集團(tuán)有限公司勞務(wù)派遣制人員招聘6人參考題庫附答案
- 交通警察執(zhí)法規(guī)范制度
- 2026湖北省定向鄭州大學(xué)選調(diào)生招錄備考題庫附答案
- 2025年秋招機(jī)械工程師筆試真題及答案
- 動力電池儲能車間事故應(yīng)急處置預(yù)案
- 床上擦浴及洗頭課件
- JIS K 6253-1-2012 硫化橡膠或熱塑性橡膠硬度測定.第1部分-一般指南
- 圓柱齒輪減速機(jī)維修課件
- 河道整治施工過程中的風(fēng)險控制方案
- 小學(xué)心理教學(xué)工作總結(jié)
- GB/T 5576-2025橡膠和膠乳命名法
- 【語文】荊州市小學(xué)三年級上冊期末試卷(含答案)
- 壓瘡及失禁性皮炎護(hù)理
- 儲備園長筆試題目及答案
評論
0/150
提交評論