版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一章地理空間數(shù)據(jù)分析與GIS2023/2/11
GIS中存貯了海量數(shù)據(jù),迫切需要高效、精確、科學地分析,找出數(shù)據(jù)所蘊涵的意義,進而了解事物的性質與規(guī)律,為科學決策提供必需的信息。(對數(shù)據(jù)“點石成金”
)因此,GIS領域由原來重點關注數(shù)據(jù)庫創(chuàng)建和系統(tǒng)開發(fā)建設,逐漸轉向重點關注空間分析和空間建模。
2023/2/12GIS的奠基人之一M.F.Goodchild曾指出:“地理信息系統(tǒng)真正的功能在于它利用空間分析技術,對空間數(shù)據(jù)的分析”。
空間分析使GIS超越一般空間數(shù)據(jù)庫、信息系統(tǒng)和地圖制圖系統(tǒng),能挖掘出對科學決策具有指導意義的信息,從而解決復雜的地學應用問題,進行地學綜合研究的技術系統(tǒng)。2023/2/13
目前多數(shù)GIS的應用還局限于數(shù)據(jù)庫型GIS層面上,沒有充分利用和開發(fā)GIS的空間分析功能。因此,建立完善的空間數(shù)據(jù)分析理論和方法體系,集成先進的空間數(shù)據(jù)分析工具,增強GIS的空間分析能力,使數(shù)據(jù)庫型GIS上升為分析型GIS,是GIS技術與應用的發(fā)展目標和趨勢。2023/2/141.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS2023/2/15第一節(jié):簡要回顧20世紀50年代以來地理空間數(shù)據(jù)處理與建模領域重要的技術方法--數(shù)量地理學、地理信息系統(tǒng)和地理計算;第二節(jié):論述數(shù)據(jù)分析領域中迅速發(fā)展的新技術——數(shù)據(jù)挖掘;第三節(jié):討論GIS環(huán)境下空間分析的基本框架。2023/2/161.1地理空間數(shù)據(jù)處理與建模
地理空間數(shù)據(jù)分析:
是地理學和地理信息科學領域的重要研究內容。通過研究地理空間數(shù)據(jù)及其相應分析理論、方法和技術,探索、證明地理要素之間的關系,揭示地理特征和過程的內在規(guī)律和機理,實現(xiàn)對地理空間信息的認知、解釋、預測和調控。2023/2/171.1地理空間數(shù)據(jù)處理與建模地理空間數(shù)據(jù)分析的發(fā)展:從對地理現(xiàn)象及其空間關系的文字記載,到利用數(shù)學概念和方法進行解釋性描述;從傳統(tǒng)統(tǒng)計學方法和數(shù)學模型對地理現(xiàn)象和過程的模擬,到基于地理信息系統(tǒng)的多維地理空間數(shù)據(jù)表達、管理、地理過程的動態(tài)模擬、可視化分析和決策支持;
從空間數(shù)據(jù)挖掘技術到高性能計算技術支撐下的地理計算方法。數(shù)量地理學
地理信息系統(tǒng)地理計算2023/2/181.1地理空間數(shù)據(jù)處理與建模1.1.1數(shù)量地理學1.1.2地理信息系統(tǒng)1.1.3地理計算2023/2/191.1.1數(shù)量地理學
數(shù)量地理學(QuantitativeGeography)又稱計量地理學或地理數(shù)量方法,是應用數(shù)學思想方法和計算機技術進行地理學研究的科學。
數(shù)量地理學是地理學領域中最先(上世紀50年代)采用數(shù)學原理方法來探討地理數(shù)據(jù)分析處理與建模的學科2023/2/1101.1.1數(shù)量地理學數(shù)量地理學的產生與發(fā)展數(shù)量地理學與傳統(tǒng)地理學的比較數(shù)量地理學中地理數(shù)據(jù)分析模擬方法2023/2/111數(shù)量地理學的發(fā)展階段
數(shù)量地理學發(fā)展初期階段數(shù)量地理學發(fā)展中期階段數(shù)量地理學日趨成熟階段20世紀50年代末至60年代末20世紀60年代末至70年代20世紀70年代末至今把統(tǒng)計學方法引入地理學研究在地理學研究中應用多元統(tǒng)計方法和計算機技術
地理學與運籌學、模糊數(shù)學、系統(tǒng)科學、GIS技術等結合2023/2/112數(shù)量地理學與傳統(tǒng)地理學的比較
數(shù)學方法是人們進行數(shù)字運算和求解的工具,能以嚴密的邏輯和簡潔的形式描述復雜的問題,表達極為豐富的實質性思想。對于現(xiàn)代地理學而言,數(shù)學方法不僅是應用地理學研究中進行預測、決策、規(guī)劃及優(yōu)化設計的工具,也是理論地理學研究中進行邏輯推理和理論演繹的手段。2023/2/113數(shù)量地理學與傳統(tǒng)地理學研究方法比較
傳統(tǒng)地理學方法數(shù)量地理學方法實地考察收集資料根據(jù)已有的概念體系條理化比較歸納、概括地理解釋建立理論與法則觀察實踐先期模式資料篩選建立理論與法則反復檢驗成功建立模型提出假設失敗
傳統(tǒng)地理學分析方法所采用的推理方式以經驗歸納型綜合為主,以觀察材料和事實為基礎,由直接的類推得出現(xiàn)實世界的結論,這一方法難以回避特殊情況或解釋者的主觀好惡問題。數(shù)量地理學以理論演繹為主,整個研究過程經歷了提出假設、建立模式、檢驗假設和建立理論四個步驟,符合感性-理性-實踐這一認識的過程規(guī)律。2023/2/114地理系統(tǒng)分析123隨機數(shù)學方法地理系統(tǒng)數(shù)學模擬數(shù)量地理學中地理數(shù)據(jù)分析模擬方法
2023/2/115
地理系統(tǒng)分析:指揚棄地理事物繁瑣的枝節(jié),抽象出地理事物在結構與功能上的主線,揭示地理事物動態(tài)演變的方向與強度,預測其狀態(tài)變化和穩(wěn)定性程度,將復雜、高級的地理系統(tǒng)簡化為次一級簡單的系統(tǒng),進而探討地理要素之間的數(shù)量關系。
步驟:(1)列出所研究等級系統(tǒng)的要素清單;(2)根據(jù)地理系統(tǒng)的實際繪出各要素的聯(lián)系框圖;(3)再以定量方法研究系統(tǒng)要素之間的關系。地理系統(tǒng)分析2023/2/116隨機數(shù)學方法
地理系統(tǒng)輸入與輸出之間一般具有隨機性,數(shù)量地理學研究方法中隨機數(shù)學占很大比重。
(1)地理系統(tǒng)是多級、多元系統(tǒng),在進行系統(tǒng)分析時,分析一組或幾組地理要素之間的關系經常應用多元統(tǒng)計分析方法(多元線性回歸、逐步回歸、主成分分析、因子分析等);(2)地理系統(tǒng)是具有空間范圍和地域界線的系統(tǒng),確定界線、進行地理區(qū)域的劃分等(二級判別分析、多級判別、逐步判別等數(shù)學分類技術);(3)在探討地理系統(tǒng)結構、類型組合、空間關系時,常運用系統(tǒng)聚類分析方法;(4)分析地理系統(tǒng)的空間特性時,常用趨勢面分析方法;(5)地理系統(tǒng)研究中十分重視系統(tǒng)目標、系統(tǒng)結構的研究,以使地理系統(tǒng)達到符合一定目標的最佳狀態(tài),常用運籌學方法;(6)模擬地理系統(tǒng)狀態(tài)的轉移規(guī)律時還包括馬爾柯夫鏈、多元線性方程組、微分方程的應用等。2023/2/117
地理系統(tǒng)的數(shù)學模擬(簡稱地理模型):
建立地理系統(tǒng)數(shù)學模型的過程。
地理系統(tǒng)數(shù)學模擬的一般過程:(1)從實際的地理系統(tǒng)或其要素出發(fā),對空間狀態(tài)、空間成分、空間相互作用進行分析,建立地理系統(tǒng)或要素的數(shù)學模型。(2)經驗檢查,若與實際情況不符,則要重新分析,修改模型;若大致相符,則選擇計算方法,進行程序設計、程序調試和上機運算,從而輸出模型解。(3)分析模型解,若模型解出錯,則修改模型;若模型解正確,則對成果進行地理解釋,提出切實可行的方案。
可見,地理系統(tǒng)數(shù)學模擬過程是反復修改數(shù)學模型、調試和修改程序的過程。地理系統(tǒng)數(shù)學模擬2023/2/1181.1.2地理信息系統(tǒng)
英國著名地理學家R.J.Johnston在1995年曾指出“計量革命的直接成果是導致了GIS革命的到來”。
GIS起源于20世紀60年代,是對地理空間數(shù)據(jù)進行采集、存儲、表達、更新、檢索、管理、綜合分析與輸出的計算機應用技術系統(tǒng)。
GIS是以應用為導向的空間信息技術,強調空間實體及其關系,注重空間分析與模擬,是重要的地理空間數(shù)據(jù)管理和分析工具。2023/2/119GIS是客觀現(xiàn)實世界抽象化的數(shù)字模型GIS是地理空間數(shù)據(jù)管理、顯示與制圖的集成工具GIS是地理空間數(shù)據(jù)分析模擬與可視化的技術平臺2023/2/120
客觀現(xiàn)實世界極其復雜,運用各種數(shù)據(jù)采集手段和量測工具,如野外調查、遙感技術等,獲取有關客觀世界的數(shù)據(jù),把各種來源和類型的地理空間數(shù)據(jù)數(shù)字化,輸入計算機,按一定的規(guī)則組織管理,構建客觀現(xiàn)實世界的抽象化數(shù)字模型,即GIS。2023/2/121空間數(shù)據(jù)管理GIS空間數(shù)據(jù)獲取空間數(shù)據(jù)輸入基于數(shù)學法則客觀世界數(shù)據(jù)數(shù)據(jù)庫客觀世界的抽象化過程2023/2/1221.1.3地理計算
隨著計算機技術、數(shù)學方法的不斷進步,空間數(shù)據(jù)分析處理方法論也隨之革新,20世紀90年代,一門融合了計算機科學、地理學、地球信息科學(Geomatics)、信息科學、數(shù)學和統(tǒng)計學理論與方法的地理計算(GeoComputation)開始形成并逐漸發(fā)展起來,數(shù)量地理學進入全新的計算地理學(GeocomputationalGeography)時代,地理空間數(shù)據(jù)分析與建模有了一個新的技術平臺。2023/2/1231.1.3地理計算1.地理計算的概念與內涵2.地理計算模型與方法2023/2/1241.地理計算的概念與內涵
20世紀90年代中期,英國著名地理學家,里茲大學計算地理研究中心StanOpenshaw教授認為空間數(shù)據(jù)挖掘已成為數(shù)量地理學中一個重要分支,并以地理計算命名這個新的學科。StanOpenshaw因此被稱為“地理計算之父”。
2023/2/125地理計算的各種定義Openshaw在2000年進一步深化對于地理計算的理解,認為:地理計算是一種高性能計算,用以解決目前不能解決的、甚至未知的空間問題的科學。具有三方面特點:(1)是強調地理主題;(2)對現(xiàn)存問題承認有新的或更好的解決辦法,且可以解決以前不能解決的問題;(3)地理計算需要獨特的思考方式,由于基于海量計算代替殘缺的知識或理論的過程,故能夠增強機器的智能。
英國里茲大學著名地理學家Rees等提議將地理計算定義為:應用計算技術求解地理問題的理論、方法和過程。2023/2/126Gahegan在1999年發(fā)表的論文中細致地談到“…地理計算關注利用一系列方法的工具箱豐富地理模擬和分析大量高度復雜的、非確定性的問題…這是人類有意識的努力去探索地理學與計算機科學之間的關聯(lián)。這是一個真正的對于數(shù)量地理學家的技術,也是計算機科學家進行計算性應用的豐富源泉?!盋onclelis(1998)采用相對簡潔的定義:地理計算是應用數(shù)學計算方法與技術來描述空間特征、解釋地理現(xiàn)象、解決地理問題。
Openshaw和Abrahart(2000)認為:地理計算是一門新興的交叉學科,它是在科學方法的整體范圍內利用各種不同類型的地理數(shù)據(jù)發(fā)展相關的地理工具和模型。
2003年8月,我國亞運村地理學術沙龍談到“虛擬地理實驗室”建設,認為地理計算既不是數(shù)量地理學,也不是GIS,而是智能計算在地理學中的精確應用,是強大的高性能計算,其理論驅動是科學。
2023/2/127地理計算定義(廣義、狹義)
廣義:地理計算是以計算機方法為基本科學工具的處理地理信息和分析地理現(xiàn)象的地理學分支,它包括地理信息處理與管理、地理數(shù)據(jù)挖掘、地理過程建模模擬以及支持這些處理與分析的軟件工程和計算體系研究,如地理信息系統(tǒng)、地理決策支持系統(tǒng)和空間網(wǎng)格體系。它是地理信息科學的另一種說法,外延包括數(shù)量地理學、遙感、地理信息系統(tǒng)、建模模擬和計算體系。
狹義:地理計算是地理信息科學的核心內容之一,主要研究地理信息科學的方法學問題,包括算法、建模和計算體系。我們主張一般情況下采用狹義定義。地理計算的內容除了建模、算法之外,還有一般方法學問題。2023/2/1282.地理計算模型與方法
地理計算的目標:是將地理學領域的知識引入計算機工具,設計合適的地理數(shù)據(jù)挖掘和知識發(fā)現(xiàn)操作,研發(fā)時空尺度上的集群算法,獲得超越目前軟件、硬件能力的地理數(shù)據(jù)分析方法,用可視化和虛擬現(xiàn)實的手段實現(xiàn)地理問題的理解與交流。
計算地理學是數(shù)量地理學向深層次的拓展,強調數(shù)學模型與模擬實驗并重的理念,憑借計算機工具對地理學問題進行定量或非定量分析的抽象概括和綜合研究,解決海量、復雜數(shù)據(jù)集或數(shù)據(jù)庫分析的復雜空間問題。2023/2/129
地理計算學包含豐富的模型和方法體系,不僅采納了傳統(tǒng)的數(shù)量地理學理論與模型還涉及一系列新的理論技術方法:(1)GIS:創(chuàng)建數(shù)據(jù)庫;
(2)人工智能技術(AI)和智能計算技術(CI):提供計算原理和計算工具;
智能計算技術:神經網(wǎng)絡模型(NN)、模糊邏輯模型、遺傳算法模型(GA)、元胞自動機模型(CA)以及分形分析等
(3)高性能計算服務系統(tǒng):提供動力。
高性能計算:是利用超級計算機對大容量資料、需要進行實時分析與控制的系統(tǒng)以及那些復雜而又不能用其他手段來處理的現(xiàn)實世界所實施的計算。2023/2/1301.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS2023/2/1311.2地理空間數(shù)據(jù)挖掘產生背景:(1)人類正被數(shù)據(jù)淹沒(數(shù)據(jù)豐富)
◆空間科學技術的發(fā)展,獲得了大量對地觀測數(shù)據(jù)?!魯?shù)據(jù)庫技術的成熟與應用普及,人類累積的數(shù)據(jù)量正在呈指數(shù)級增長,全世界每天存入數(shù)據(jù)數(shù)量超過萬兆字符。(2)人類饑渴信息(知識貧乏)面臨浩如煙海的數(shù)據(jù),人們呼喚從數(shù)據(jù)的汪洋大海中去蕪存精、去偽存真2023/2/1321.2地理空間數(shù)據(jù)挖掘1.2.1地理空間數(shù)據(jù)挖掘概述1.2.2地理空間數(shù)據(jù)立方體1.2.3聯(lián)機分析處理技術1.2.4地理空間數(shù)據(jù)挖掘典型方法2023/2/1331.2.1地理空間數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘(1)技術上定義:是從大量的數(shù)據(jù)中,抽取出潛在的、有價值的知識(模型、規(guī)則、規(guī)律)的過程。(2)學科定義:是一個由數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計和可視化等多學科與技術交叉、滲透、融合形成的交叉學科。數(shù)據(jù)挖掘的過程2023/2/134
數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設的前提下去挖掘信息、發(fā)現(xiàn)知識。
數(shù)據(jù)挖掘所得到的信息應具有三個特征:
(1)先前未知。先前未知的信息是指該信息是預先未曾預料到的,即數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值.
(2)有效。
(3)可實用。2023/2/135進化階段技術手段數(shù)據(jù)搜集(20世紀60年代)數(shù)據(jù)訪問(20世紀80年代)數(shù)據(jù)倉庫(20世紀90年代)數(shù)據(jù)挖掘(目前)
計算機、磁帶和磁盤關系數(shù)據(jù)庫、結構化查詢語言、ODBC
聯(lián)機分析處理、多維數(shù)據(jù)庫、數(shù)據(jù)倉庫
高級算法、多處理器計算機、海量數(shù)據(jù)庫數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的進化歷程
數(shù)據(jù)倉庫包含了完整的、主題明確的、凈化的、綜合性的數(shù)據(jù),可以為數(shù)據(jù)挖掘提供新的支撐平臺。2023/2/1361.2.1地理空間數(shù)據(jù)挖掘概述
地理空間數(shù)據(jù)挖掘是數(shù)據(jù)挖掘的一個研究分支。其實質是從地理空間數(shù)據(jù)庫中挖掘時空系統(tǒng)中潛在的、有價值的信息、規(guī)律和知識的過程,包括空間模式與特征、空間與非空間數(shù)據(jù)之間的概要關系等。由于空間數(shù)據(jù)具有海量、多維和自相關性等特征,使得地理空間數(shù)據(jù)挖掘更為復雜。
2023/2/137空間數(shù)據(jù)挖掘的原型系統(tǒng)加拿大西蒙菲莎(SimonFraser)大學計算機科學系HanJiawei教授領導的小組進行了基于關系數(shù)據(jù)庫挖掘系統(tǒng)的研究,在MapInfo平臺上開發(fā)了空間數(shù)據(jù)挖掘原型系統(tǒng)GeoMiner,并設計了專門用于空間數(shù)據(jù)挖掘的語言GMQL,實現(xiàn)了空間數(shù)據(jù)特征描述、空間比較、空間關聯(lián)、空間聚類和空間分類等空間數(shù)據(jù)分析方法的集成。GeoMiner原型系統(tǒng)圖形用戶接口各種數(shù)據(jù)挖掘模塊空間數(shù)據(jù)庫空間數(shù)據(jù)庫服務器和數(shù)據(jù)立方體空間數(shù)據(jù)庫
空間數(shù)據(jù)庫2023/2/138空間數(shù)據(jù)挖掘的基本過程2023/2/139空間聚類規(guī)則發(fā)現(xiàn)空間關聯(lián)規(guī)則發(fā)現(xiàn)空間序列模式發(fā)現(xiàn)空間預測模型發(fā)現(xiàn)空間異常值發(fā)現(xiàn)空間趨勢模型發(fā)現(xiàn)空間數(shù)據(jù)立方體圖形用戶界面空間依賴關系發(fā)現(xiàn)未來空間發(fā)現(xiàn)模塊挖掘模塊集合空間數(shù)據(jù)庫服務器空間數(shù)據(jù)庫非空間數(shù)據(jù)庫相關概念數(shù)據(jù)庫和知識庫
四個組成部分:(1)圖形用戶界面(2)挖掘模塊集合(3)空間數(shù)據(jù)庫服務器(4)數(shù)據(jù)庫和知識庫
空間數(shù)據(jù)挖掘的體系結構2023/2/140
(1)地理空間數(shù)據(jù)立方體通過訪問地理空間數(shù)據(jù)立方體,才能進行深層次的分析,尋求有意義的信息。(2)聯(lián)機分析處理(OLAP)模塊OLAP為數(shù)據(jù)挖掘提供了一個極佳的操作平臺
(3)空間數(shù)據(jù)挖掘模塊。
進行相應的數(shù)據(jù)挖掘
地理空間數(shù)據(jù)挖掘系統(tǒng)三大支柱模塊
2023/2/1411.2.2地理空間數(shù)據(jù)立方體人們很容易理解一個二維表,對于三立方體同樣也容易理解,但是要再加一維或任意多維,則圖形很難想象,也不容易在屏幕上畫出來。地理空間數(shù)據(jù)立方體(又稱為多維數(shù)據(jù)集)是一個面向對象的、集成的、以時間為變量的、持續(xù)采集空間與非空間數(shù)據(jù)的多維數(shù)據(jù)集合,組織和匯總成一個由一組維度和度量值定義的多維結構,用以支持地理空間數(shù)據(jù)挖掘技術和決策支持過程。
作用:基于空間數(shù)據(jù)立方體中的數(shù)據(jù)進行挖掘,可以利用已有的聚合信息和計算結果,有效地提供數(shù)據(jù)挖掘算法的執(zhí)行效率。2023/2/142數(shù)據(jù)立方體在邏輯上一般由一個事實數(shù)據(jù)表和多個維度表構成一種星形構架,其核心是事實數(shù)據(jù)表。事實數(shù)據(jù)表是數(shù)據(jù)立方體中度量值的源,維度表是數(shù)據(jù)立方體中維度的源。2023/2/143地理空間數(shù)據(jù)立方體涉及的概念
●維度是數(shù)據(jù)立方體的一種結構特性,是描述事實數(shù)據(jù)表中數(shù)據(jù)級別的有組織的層次結構。包括:(1)非空間維度;(2)空間-非空間維度;(3)空間-空間維度?!穸攘恐凳窃跀?shù)據(jù)立方體內基于該數(shù)據(jù)立方體的事實數(shù)據(jù)表中某列的一組值,它們通常是數(shù)字。包括:數(shù)值度量、空間度量?!癯蓡T屬性是維度表的一個可選特性,為最終用戶提供成員的其他信息,僅從屬于級別。2023/2/1441.2.3聯(lián)機分析處理技術OLAP的概念:是共享多維信息的、針對特定問題的聯(lián)機數(shù)據(jù)訪問和分析的軟件技術,具有匯總、合并、聚集以及從不同角度觀察消息的能力。
是一種軟件技術,它使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達到深入理解數(shù)據(jù)的目的。這些信息是從原始數(shù)據(jù)轉換過來的,按照用戶的理解,反映了真實情況。聯(lián)機分析處理
(OLAP)的概念最早是由關系數(shù)據(jù)庫之父E.F.Codd于1993年提出的。它可以跨越空間數(shù)據(jù)庫模式的多個版本,處理來自不同組織的信息和由多個數(shù)據(jù)存儲集成的信息。2023/2/145當今的數(shù)據(jù)處理大致可以分成兩大類:聯(lián)機事務處理OLTP(on-linetransactionprocessing)、聯(lián)機分析處理OLAP(On-LineAnalyticalProcessing)。OLTP是傳統(tǒng)的關系型數(shù)據(jù)庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應用,支持復雜的分析操作,側重決策支持,并且提供直觀易懂的查詢結果。下表列出了OLTP與OLAP之間的比較。2023/2/146聯(lián)機分析處理是共享多維信息的快速分析。體現(xiàn)了四個特征:(1)快速性:用戶對OLAP的快速反應能力有很高的要求。(2)可分析性:OLAP系統(tǒng)應能處理任何邏輯分析和統(tǒng)計分析。(3)多維性:系統(tǒng)必須提供對數(shù)據(jù)分析的多維視圖和分析。(4)信息性:OLAP系統(tǒng)應能及時獲得信息,并且管理大容量的信息。2023/2/147●數(shù)據(jù)切片:多維數(shù)據(jù)是由多個維度組成的,如果在某個維度上選定一個取值,則多維數(shù)據(jù)從n維下降成n-1維●數(shù)據(jù)切塊:將完整的數(shù)據(jù)立方體切取一部分數(shù)據(jù)而得到的新的數(shù)據(jù)立方體?!駭?shù)據(jù)鉆取(下鉆):從較高的維度層次下降到較低的維度層次上來觀察多維數(shù)據(jù)●數(shù)據(jù)聚合(上卷):對數(shù)據(jù)進行高層次綜合的操作●數(shù)據(jù)旋轉:改變維度的位置關系,使最終用戶可從其他視角來觀察多維數(shù)據(jù)。OLAP的基本操作2023/2/148
業(yè)務處理系統(tǒng)數(shù)據(jù)提取數(shù)據(jù)準備區(qū)OLAP服務器多維化處理客戶端可視化處理地理空間數(shù)據(jù)立方體數(shù)據(jù)加載地理空間數(shù)據(jù)立方體與OLAP的關系
OLAP技術則可利用數(shù)據(jù)立方體中的數(shù)據(jù)進行聯(lián)機分析,將復雜的分析查詢結果快速地返回用戶。2023/2/1491.2.4地理空間數(shù)據(jù)挖掘典型方法1.地理空間統(tǒng)計方法2.地理空間聚類方法3.地理空間關聯(lián)分析4.地理空間分類與預測分析5.異常值分析112023/2/1501.地理空間統(tǒng)計方法
地理空間統(tǒng)計是指分析地理空間數(shù)據(jù)的統(tǒng)計方法,主要是基于空間中鄰近的要素通常比相離較遠的要素具有較高的相似性這一原理。地理空間統(tǒng)計分析與傳統(tǒng)分析主要有兩大差異:(1)空間數(shù)據(jù)間并非獨立,而是在D維空間中具有某種空間相關性,且在不同的空間分辨率下呈現(xiàn)不同的相關程度;(2)大多數(shù)空間問題僅有一組(不規(guī)則分布空間中)觀測值,而無重復觀測的資料。2023/2/151目前地理空間統(tǒng)計模型大致可分為三類:●地統(tǒng)計:是以區(qū)域化變量理論為基礎,以變差函數(shù)為主要工具,研究空間分布上既具有隨機性又具有結構性的自然現(xiàn)象的科學?!窀窬W(wǎng)空間模型:用以描述分布于有限(或無窮離散)空間點(或區(qū)域)上數(shù)據(jù)的空間關系?!窨臻g點分布形態(tài):在自然科學研究中,許多資料是由點(或小區(qū)域)所構成的集合,比如,地震發(fā)生地點分布、樹木在森林中的分布、某種鳥類鳥巢的分布、生物組織中細胞核的分布,太空中星球的分布等,稱之為空間點分布形態(tài),其中點的位置為事件。2023/2/152
優(yōu)勢:
空間數(shù)據(jù)統(tǒng)計分析是分析空間數(shù)據(jù)廣泛使用的一種方法,能夠很好地處理數(shù)字數(shù)據(jù),提出空間現(xiàn)象的現(xiàn)實模型。
局限性:
然而,需要指出的是統(tǒng)計分析方法往往假設在空間中分布的數(shù)據(jù)具有統(tǒng)計獨立性,而在現(xiàn)實中,空間物體相關性很大。此外,絕大多數(shù)統(tǒng)計模型需要在有豐富領域知識和統(tǒng)計專門技術的專家的協(xié)助下才能實現(xiàn)。而且,統(tǒng)計模型不能很好地處理字符值、不完整或非確定性數(shù)據(jù)。2023/2/1532.地理空間聚類方法
地理空間數(shù)據(jù)聚類是按照某種距離度量準則,在大型、多維數(shù)據(jù)集中標識出聚類或稠密分布的區(qū)域,從而發(fā)現(xiàn)數(shù)據(jù)集的整體空間分布模式。該方法把空間數(shù)據(jù)庫中的對象分為有意義的子類,使同一子類內部的成員有盡可能多的相同屬性,而不同的子類之間差異較大。2023/2/154
目前,地理空間聚類方法主要有四類:
分割法、層次法、基于密度的方法及基于網(wǎng)格的方法。
而經典聚類法包括K-mean、K-mediods、ISODATA等。
2023/2/155完全的空間任意分布地理空間聚類聚集型分布分散型分布11222233333341:極密2:密3:一般密4:稀疏經典聚類完全的空間任意分布模式空間聚類分散分布模式2023/2/1563.地理空間關聯(lián)分析
地理空間關聯(lián)分析:利用空間關聯(lián)規(guī)則提取算法發(fā)現(xiàn)空間數(shù)據(jù)庫中空間目標間的關聯(lián)程度,是空間數(shù)據(jù)庫知識發(fā)現(xiàn)研究中的一個重要研究課題。
GIS數(shù)據(jù)庫是典型的空間數(shù)據(jù)庫,從GIS數(shù)據(jù)庫中挖掘空間關聯(lián)規(guī)則是理解GIS模型和將GIS數(shù)據(jù)轉化成知識的一種有效方法。2023/2/157
地理空間關聯(lián)分析的核心內容是挖掘空間關聯(lián)規(guī)則??臻g關聯(lián)規(guī)則是指空間目標間相鄰(如村落與道路相鄰)、相連(如火車站與鐵路相連)、共生(如蒙古包與草場的關系)、包含(如區(qū)域中包含的城市)等空間相關關系。具體而言,空間關聯(lián)規(guī)則中包含各種不同的空間謂詞,它們不但可以表示空間對象之間的拓撲關系(如相交、不相交、相鄰等),還可以表示空間方位、排列次序(如東、西、南、北等)以及距離信息(如靠近、遠離等)。
2023/2/158
空間關聯(lián)規(guī)則指明了空間謂詞與非空間謂詞間存在的關聯(lián)性。例如,通過挖掘GIS數(shù)據(jù)庫,可能發(fā)現(xiàn)“靠近海灘的房屋”有90%“價格很貴”,“加油站”有75%“靠近高速公路”等??臻g關聯(lián)規(guī)則提取算法并不唯一,較常用的是利用MBR技術、R+樹及其他快速方法進行空間分析,并采用概念層次樹對拓撲關系進行概化形成拓撲關系數(shù)據(jù)表,從而提取關聯(lián)規(guī)則。2023/2/1594.地理空間分類與預測分析
地理空間分類與預測是根據(jù)已知的分類模型把數(shù)據(jù)庫中的數(shù)據(jù)映射到給定類別中,進行數(shù)據(jù)趨勢預測分析的方法。
分類是將數(shù)據(jù)庫中的對象根據(jù)一定的意義劃分為若干個子集。
預測是利用歷史數(shù)據(jù)記錄自動推導出對給定數(shù)據(jù)的推廣描述,實現(xiàn)對未來數(shù)據(jù)的趨勢分析。2023/2/160
分類和聚類算法的差別在于:聚類算法是根據(jù)一定要求將對象聚為一個集合,最后得到的分布模式是聚類之前未確知的;分類算法則是根據(jù)已知分布模式的屬性要求,將數(shù)據(jù)庫對象歸入相應的分類中。在機器學習中,數(shù)據(jù)分類一般稱為監(jiān)督學習,而數(shù)據(jù)聚類則稱為非監(jiān)督學習。
地理空間數(shù)據(jù)分類包括兩個步驟:通過分析數(shù)據(jù)庫中各數(shù)據(jù)行的內容建立一個分類模型(分類器),描述已知數(shù)據(jù)集類別或概念。利用所獲得的分類模型(分類器)進行分類操作。2023/2/161
分類和回歸都可用于預測,空間回歸規(guī)則與空間分類規(guī)則相似,也是一種分類器,其差別在于空間分類規(guī)則的預測值是離散的,空間回歸規(guī)則的預測值是連續(xù)的。二者常表現(xiàn)為一棵決策樹,根據(jù)數(shù)據(jù)值從樹根開始搜索,沿著滿足條件的分支往上走,走到樹葉就能確定類別??臻g分類或回歸的規(guī)則是普及知識,實質是對給定數(shù)據(jù)對象集的抽象和概括,可用宏元組表示。2023/2/1625.異常值分析
若一個數(shù)據(jù)庫包含的數(shù)據(jù)目標與通常的行為或數(shù)據(jù)模型不一致,則這些數(shù)據(jù)目標被稱為異常值。絕大多數(shù)數(shù)據(jù)挖掘方法把異常值作為噪音或例外數(shù)據(jù),然而,在很多情況下這將會導致重要隱含信息的丟失。
基于計算機的異常值分析方法主要有三種:基于統(tǒng)計的異常值分析;基于距離的異常值探測;基于偏差的異常值探測。2023/2/1631.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS2023/2/1641.3GIS環(huán)境下的空間分析1.3.1空間分析概念1.3.2空間分析的萌芽與發(fā)展1.3.3GIS與空間分析1.3.4GIS環(huán)境下空間分析框架2023/2/1651.3.1空間分析概念
空間分析(SpatialAnalysis,SA)是地理學的精髓,是為解答地理空間問題而進行的數(shù)據(jù)分析與挖掘。
空間分析是集空間數(shù)據(jù)分析和空間模擬于一體的技術方法,通過地理計算和空間表達挖掘潛在空間信息,以解決實際問題。
理解:以地理空間數(shù)據(jù)庫為基礎,運用邏輯運算、一般統(tǒng)計和地統(tǒng)計、圖形與形態(tài)分析、數(shù)據(jù)挖掘等技術,提取隱含在空間數(shù)據(jù)內部的與空間信息有關的知識和規(guī)律,包括位置、形態(tài)、分布、格局以及過程等內容,以解決涉及地理空間的各種理論和實際問題。1.空間分析的定義2023/2/166空間分析的本質特征包括:●探測空間數(shù)據(jù)中的模式;●研究空間數(shù)據(jù)間的關系并建立相應的空間數(shù)據(jù)模型;●提高適合于所有觀察模式處理過程的理解;●改進發(fā)生地理空間事件的預測能力和控制能力。2023/2/1672.空間分析的研究對象
空間分析的研究對象:空間目標。
空間分析主要通過對空間數(shù)據(jù)和空間模型的聯(lián)合分析來挖掘空間目標的潛在信息??臻g目標具有空間位置、分布、形態(tài)、空間關系(距離、方位、拓撲、相關場)等基本特征??臻g分析的主要內容
●空間位置:借助于空間坐標系傳遞空間對象的定位信息,是空間對象表述的研究基礎,即投影與轉換理論。
●空間分布:同類空間對象的群體定位信息,包括分布、趨勢、對比等內容。
●空間形態(tài):空間對象的幾何形態(tài)
●空間距離:空間物體的接近程度
●空間關系:空間對象的相關關系,包括拓撲、方位、相似、相關等。2023/2/1683.空間分析研究的主要目標
(或稱:空間分析功能的實現(xiàn)分為以下5個層次)
●認知。有效獲取空間數(shù)據(jù),并對其進行科學的組織描述,利用數(shù)據(jù)再現(xiàn)事物本身,例如繪制風險圖。
●解釋。理解和解釋地理空間數(shù)據(jù)的背景過程,認識事件的本質規(guī)律,例如住房價格中的地理鄰居效應。
●預報。在了解、掌握事件發(fā)生現(xiàn)狀與規(guī)律的前提下,運用有關預測模型對未來的狀況做出預測,例如傳染病的爆發(fā)。
●調控。對地理空間發(fā)生的事件進行調控,例如合理分配資源。
空間分析的根本目標:是建立有效的空間數(shù)據(jù)模型來表達地理實體的時空特性,發(fā)展面向應用的時空分析模擬方法,以數(shù)字化方式動態(tài)地、全局地描述地理實體和地理現(xiàn)象的空間分布關系,從而反映地理實體的內在規(guī)律和變化趨勢。2023/2/1691.3.2空間分析的萌芽與發(fā)展(1)在古代,人類出于生存和發(fā)展的需要,要學會分析周圍地理事物的空間關系,因而始終在進行著各種類型的空間分析。從某種意義上講,空間分析孕育了地理學。(2)地圖的出現(xiàn)使人類的空間分析能力大大增強。為使地圖有助于空間分析,地理學家試圖尋找一種能以形象方式描述數(shù)據(jù)空間分布的方法,這就是早期的空間統(tǒng)計方法。(3)隨著地圖理論與應用的廣泛深入,物理、數(shù)學概念與方法的不斷引入以及地學各分支的發(fā)展,傳統(tǒng)的空間分析能力大大加強,人們對地圖表達空間信息的理解與解譯能力顯著提高。2023/2/1701.3.2空間分析的萌芽與發(fā)展(4)現(xiàn)代“空間分析”概念的提出源于20世紀60年代地理與區(qū)域科學的計量革命。
初始階段主要是應用統(tǒng)計分析方法,定量描述點、線、面的空間分布模式;后期逐漸強調地理空間本身的特征、空間決策過程和復雜空間系統(tǒng)的時空演化過程。GIS使空間分析能力發(fā)生了質的飛躍。
(5)新一代空間分析的主要目的是從現(xiàn)有數(shù)據(jù)的空間關系中挖掘新的信息。隨著GIS技術的不斷進步,空間分析成為地理信息系統(tǒng)的核心,是地理信息系統(tǒng)區(qū)別于一般空間數(shù)據(jù)庫和普通制圖系統(tǒng)的標志?!皬哪撤N意義上講,空間分析與GIS間的關系類似于統(tǒng)計學與統(tǒng)計軟件包間的關系”。2023/2/171國內外GIS軟件空間分析比較2023/2/1721.3.3GIS與空間分析空間分析一般采用專業(yè)分析模型與GIS集成方式(兩種):專業(yè)模型
統(tǒng)計分析
網(wǎng)絡分析
其他空間分析模塊
用戶界面GIS管理系統(tǒng)空間數(shù)據(jù)庫(1)緊耦合。把空間分析模塊作為一個高級應用模塊嵌入GIS軟件包中,GIS不僅可以為空間分析提供圖形顯示功能,而且GIS中的有關數(shù)據(jù)直接參與空間分析計算。這種方式可以為用戶提供方便、全面、有效的使用功能,但造價高,實現(xiàn)周期長。GIS與空間分析的緊耦合2023/2/173GIS與空間分析的松耦合數(shù)據(jù)交換接口用戶GIS管理系統(tǒng)空間分析模型空間數(shù)據(jù)庫數(shù)據(jù)文件(2)松耦合。在兩個相對獨立的GIS軟件和空間分析軟件之間增加數(shù)據(jù)交換接口,使空間分析數(shù)據(jù)及相關的影響因素和空間分析結果能夠在GIS中以各種簡單的或復雜的圖形方式顯示出來,這種方式適用于短期且費用較小的情況。2023/2/1741.3.4GIS環(huán)境下空間分析框架空間分析是GIS的核心空間分析是GIS的核心功能2023/2/175GIS環(huán)境中的空間分析(AnselinL提出的一般性框架)縮放瀏覽空間查詢緩存視圖選擇空間采樣地圖提取質心鑲嵌聚集分散空間權重拓撲插補覆蓋空間分布全局空間組織局域空間組織空間回歸模型評價模型診斷空間預測探索空間數(shù)據(jù)分析操作確認空間數(shù)據(jù)分析模型確定一般性框架2023/2/176
考慮到GIS環(huán)境下空間分析的易理解性和可操作性,將GIS環(huán)境下空間分析方法分為如下六個方面:●確定性空間分析●探索性空間數(shù)據(jù)分析●時空數(shù)據(jù)分析●專業(yè)模型集成分析●智能化的空間分析●可視化空間分析2023/2/1771.
確定性空間分析
確定性空間分析是指分析處理確定性空間數(shù)據(jù)或解決確定性空間問題的方法,它是高級空間分析的基礎。從算法來看,確定性空間分析的算法基本上是基于經典數(shù)學方法建模的,其在GIS空間分析技術中已經相當成熟。
2023/2/178
2.探索性空間數(shù)據(jù)分析(ESDA)
是利用統(tǒng)計學原理和圖形圖表相結合對空間數(shù)據(jù)的性質進行分析、鑒別,用以引導確定性模型的結構和解法的一種技術,本質上是一種“數(shù)據(jù)驅動”的分析方法。
ESDA技術注重研究數(shù)據(jù)的空間相關性與空間異質性,在知識發(fā)現(xiàn)中用于選取感興趣的數(shù)據(jù)子集,以發(fā)現(xiàn)隱含在數(shù)據(jù)中的某些特征和規(guī)律。相對于傳統(tǒng)的統(tǒng)計分析而言,ESDA技術不是預設數(shù)據(jù)具有某種分布或某種規(guī)律,而是一步步地、試探性地分析數(shù)據(jù),逐步地認識和理解數(shù)據(jù)。
2023/2/179
探索性歸納學習方法(EIL
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年建筑陶瓷釉料五年成本控制報告
- 2025陜西聚旺偉業(yè)房地產開發(fā)有限公司招聘(4人)筆試參考題庫附帶答案詳解(3卷合一版)
- 2025年CFA二級英文真題集
- 2025遼寧大連海創(chuàng)投資集團有限公司高級管理人員擬聘任人選筆試參考題庫附帶答案詳解(3卷)
- 2025福建省高速公路集團招聘50人筆試參考題庫附帶答案詳解(3卷合一版)
- 2025福建南平武夷新區(qū)城市服務有限公司招聘7人筆試參考題庫附帶答案詳解(3卷合一版)
- 律師職業(yè)資格考試復習資料及答案參考
- 2025湖南人才市場有限公司選聘13人筆試參考題庫附帶答案詳解(3卷合一版)
- 2025浙江舟山昊思信息技術有限公司招聘2人筆試參考題庫附帶答案詳解(3卷合一版)
- 2025浙江溫州市人才資源開發(fā)有限公司招聘勞務派遣人員招聘37人筆試參考題庫附帶答案詳解(3卷合一版)
- 鋼軌探傷工勞動安全培訓課件
- 新疆交通投資責任有限公司 筆試內容
- 檢修安全培訓內容課件
- 公路養(yǎng)護培訓課件
- 2025年6月浙江省高考化學試卷真題(含答案及解析)
- 天車安全培訓教學課件
- 2025年丹梔逍遙丸行業(yè)研究報告及未來行業(yè)發(fā)展趨勢預測
- 醫(yī)院清潔消毒培訓
- 安全事故三要素培訓總結課件
- 儲能項目并網(wǎng)消防專篇
- 智能投資顧問課件
評論
0/150
提交評論