數(shù)據(jù)庫與空間數(shù)據(jù)庫_第1頁
數(shù)據(jù)庫與空間數(shù)據(jù)庫_第2頁
數(shù)據(jù)庫與空間數(shù)據(jù)庫_第3頁
數(shù)據(jù)庫與空間數(shù)據(jù)庫_第4頁
數(shù)據(jù)庫與空間數(shù)據(jù)庫_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

YUNNANNORMALUNIVERSITY姓名 彭彬 學(xué)號 12081603004 學(xué)院旅游與地理科學(xué)學(xué)院 專業(yè) 地圖制圖學(xué)與地理信息工程任課教師 楊昆 空間數(shù)據(jù)庫數(shù)據(jù)庫1.1數(shù)據(jù)庫的基本概念數(shù)據(jù)庫是存儲在一起的相關(guān)數(shù)據(jù)的集合,這些數(shù)據(jù)是結(jié)構(gòu)化的,不必要的冗余,并為多種應(yīng)用服務(wù);數(shù)據(jù)的存儲獨立于使用它的程序;對數(shù)據(jù)庫插入新數(shù)據(jù),修改和檢索原有數(shù)據(jù)均能按一種公用的和可控制的方式進(jìn)行。當(dāng)某個系統(tǒng)中存在結(jié)構(gòu)上完全分開的若干個數(shù)據(jù)庫時,則該系統(tǒng)包含一個“數(shù)據(jù)庫集合”。1.2數(shù)據(jù)庫中數(shù)據(jù)的性質(zhì)(1) 數(shù)據(jù)整體性:數(shù)據(jù)庫是一個單位或是一個應(yīng)用領(lǐng)域的通用數(shù)據(jù)處理系統(tǒng),他存儲的是屬于企業(yè)和事業(yè)部門、團(tuán)體和個人的有關(guān)數(shù)據(jù)的集合。數(shù)據(jù)庫中的數(shù)據(jù)是從全局觀點出發(fā)建立的,他按一定的數(shù)據(jù)模型進(jìn)行組織、描述和存儲。其結(jié)構(gòu)基于數(shù)據(jù)間的自然聯(lián)系,從而可提供一切必要的存取路徑,且數(shù)據(jù)不再針對某一應(yīng)用,而是面向全組織,具有整體的結(jié)構(gòu)化特征。(2) 數(shù)據(jù)共享性:數(shù)據(jù)庫中的數(shù)據(jù)是為眾多用戶所共享其信息而建立的,已經(jīng)擺脫了具體程序的限制和制約。不同的用戶可以按各自的用法使用數(shù)據(jù)庫中的數(shù)據(jù);多個用戶可以同時共享數(shù)據(jù)庫中的數(shù)據(jù)資源,即不同的用戶可以同時存取數(shù)據(jù)庫中的同一個數(shù)據(jù)。數(shù)據(jù)共享性不僅滿足了各用戶對信息內(nèi)容的要求,同時也滿足了各用戶之間信息通信的要求。1.3數(shù)據(jù)庫發(fā)展階段(1) 人工管理階段50年代中期之前,計算機(jī)的軟硬件均不完善。硬件存儲設(shè)備只有磁帶、卡片和紙帶,軟件方面還沒有操作系統(tǒng),當(dāng)時的計算機(jī)主要用于科學(xué)計算。這個階段由于還沒有軟件系統(tǒng)對數(shù)據(jù)進(jìn)行管理,程序員在程序中不僅要規(guī)定數(shù)據(jù)的邏輯結(jié)構(gòu),還要設(shè)計其物理結(jié)構(gòu),包括存儲結(jié)構(gòu)、存取方法、輸入輸出方式等。當(dāng)數(shù)據(jù)的物理組織或存儲設(shè)備改變時,用戶程序就必須重新編制。由于數(shù)據(jù)的組織面向應(yīng)用,不同的計算程序之間不能共享數(shù)據(jù),使得不同的應(yīng)用之間存在大量的重復(fù)數(shù)據(jù),很難維護(hù)應(yīng)用程序之間數(shù)據(jù)的一致性。這一階段的主要特征可歸納為如下幾點:計算機(jī)中沒有支持?jǐn)?shù)據(jù)管理的軟件。數(shù)據(jù)組織面向應(yīng)用,數(shù)據(jù)不能共享,數(shù)據(jù)重復(fù)。在程序中要規(guī)定數(shù)據(jù)的邏輯結(jié)構(gòu)和物理結(jié)構(gòu),數(shù)據(jù)與程序不獨立。數(shù)據(jù)處理方式——批處理。(2) 文件系統(tǒng)階段這一階段的主要標(biāo)志是計算機(jī)中有了專門管理數(shù)據(jù)庫的軟件——操作系統(tǒng)(文件管理)。上世紀(jì)50年代中期到60年代中期,由于計算機(jī)大容量存儲設(shè)備(如硬盤)的出現(xiàn),推動了軟件技術(shù)的發(fā)展,而操作系統(tǒng)的出現(xiàn)標(biāo)志著數(shù)據(jù)管

理步入一個新的階段。在文件系統(tǒng)階段,數(shù)據(jù)以文件為單位存儲在外存,且由操作系統(tǒng)統(tǒng)一管理。操作系統(tǒng)為用戶使用文件提供了友好界面。文件的邏輯結(jié)構(gòu)與物理結(jié)構(gòu)脫鉤,程序和數(shù)據(jù)分離,使數(shù)據(jù)與程序有了一定的獨立性。用戶的程序與數(shù)據(jù)可分別存放在外存儲器上,各個應(yīng)用程序可以共享一組數(shù)據(jù),實現(xiàn)了以文件為單位的數(shù)據(jù)共享。但由于數(shù)據(jù)的組織仍然是面向程序,所以存在大量的數(shù)據(jù)冗余。而且數(shù)據(jù)的邏輯結(jié)構(gòu)不能方便地修改和擴(kuò)充,數(shù)據(jù)邏輯結(jié)構(gòu)的每一點微小改變都會影響到應(yīng)用程序。由于文件之間互相獨立,因而它們不能反映現(xiàn)實世界中事物之間的聯(lián)系,操作系統(tǒng)不負(fù)責(zé)維護(hù)文件之間的聯(lián)系信息。如果文件之間有內(nèi)容上的聯(lián)系,那也只能由應(yīng)用程序去處理。(3)數(shù)據(jù)庫系統(tǒng)階段60年代后,隨著計算機(jī)在數(shù)據(jù)管理領(lǐng)域的普遍應(yīng)用,人們對數(shù)據(jù)管理技術(shù)提出了更高的要求:希望面向企業(yè)或部門,以數(shù)據(jù)為中心組織數(shù)據(jù),減少數(shù)據(jù)的冗余,提供更高的數(shù)據(jù)共享能力,同時要求程序和數(shù)據(jù)具有較高的獨立性,當(dāng)數(shù)據(jù)的邏輯結(jié)構(gòu)改變時,不涉及數(shù)據(jù)的物理結(jié)構(gòu),也不影響應(yīng)用程序,以降低應(yīng)用程序研制與維護(hù)的費用。數(shù)據(jù)庫技術(shù)正是在這樣一個應(yīng)用需求的基礎(chǔ)上發(fā)展起來的。數(shù)據(jù)庫技術(shù)有如下特點:面向企業(yè)或部門,以數(shù)據(jù)為中心組織數(shù)據(jù),形成綜合性的數(shù)據(jù)庫,為各應(yīng)用共享。采用一定的數(shù)據(jù)模型。數(shù)據(jù)模型不僅要描述數(shù)據(jù)本身的特點,而且要描述數(shù)據(jù)之間的聯(lián)系。數(shù)據(jù)冗余小,易修改、易擴(kuò)充。不同的應(yīng)用程序根據(jù)處理要求,從數(shù)據(jù)庫中獲取需要的數(shù)據(jù),這樣就減少了數(shù)據(jù)的重復(fù)存儲,也便于增加新的數(shù)據(jù)結(jié)構(gòu),便于維護(hù)數(shù)據(jù)的一致性。程序和數(shù)據(jù)有較高的獨立性。具有良好的用戶接口,用戶可方便地開發(fā)和使用數(shù)據(jù)庫。對數(shù)據(jù)進(jìn)行統(tǒng)一管理和控制,提供了數(shù)據(jù)的安全性、完整性、以及并發(fā)控制。1.4層次、網(wǎng)狀和關(guān)系數(shù)據(jù)庫系統(tǒng)(1)層次結(jié)構(gòu)模型層次結(jié)構(gòu)模型實質(zhì)上是一種有根結(jié)點的定向有序樹(在數(shù)學(xué)中〃樹〃被定義為一個無回的連通圖)。下圖是一個高等學(xué)校的組織結(jié)構(gòu)圖。這個組織結(jié)構(gòu)圖像一棵樹,校部就是樹根(稱為根結(jié)點),各系、專業(yè)、教師、學(xué)生等為枝點(稱為結(jié)點),樹根與枝點之間的聯(lián)系稱為邊,樹根與邊之比為1:N,即樹根只有一個,樹枝有N個。按照層次模型建立的數(shù)據(jù)庫系統(tǒng)稱為層次模型數(shù)據(jù)庫系統(tǒng)。IMS(InformationManage-mentSystem)是其典型代表。

網(wǎng)狀結(jié)構(gòu)模型按照網(wǎng)狀數(shù)據(jù)結(jié)構(gòu)建立的數(shù)據(jù)庫系統(tǒng)稱為網(wǎng)狀數(shù)據(jù)庫系統(tǒng),其典型代表是DBTG(DataBaseTaskGroup)。用數(shù)學(xué)方法可將網(wǎng)狀數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)化為層次數(shù)據(jù)結(jié)構(gòu)。關(guān)系結(jié)構(gòu)模型關(guān)系式數(shù)據(jù)結(jié)構(gòu)把一些復(fù)雜的數(shù)據(jù)結(jié)構(gòu)歸結(jié)為簡單的二元關(guān)系(即二維表格形式)。例如某單位的職工關(guān)系就是一個二元關(guān)系。由關(guān)系數(shù)據(jù)結(jié)構(gòu)組成的數(shù)據(jù)庫系統(tǒng)被稱為關(guān)系數(shù)據(jù)庫系統(tǒng)。在關(guān)系數(shù)據(jù)庫中,對數(shù)據(jù)的操作幾乎全部建立在一個或多個關(guān)系表格上,通過對這些關(guān)系表格的分類、合并、連接或選取等運算來實現(xiàn)數(shù)據(jù)的管理。1.5常用的數(shù)據(jù)庫IBM的DB2作為關(guān)系數(shù)據(jù)庫領(lǐng)域的開拓者和領(lǐng)航人,IBM在1977年完成了SystemR系統(tǒng)的原型,1980年開始提供集成的數(shù)據(jù)庫服務(wù)器一一System/38,隨后是SQL/DSforVSE和VM,其初始版本與SystemR研究原型密切相關(guān)°DB2forMVSV1在1983年推出。該版本的目標(biāo)是提供這一新方案所承諾的簡單性,數(shù)據(jù)不相關(guān)性和用戶生產(chǎn)率。1988年DB2forMVS提供了強(qiáng)大的在線事務(wù)處理(OLTP)支持,1989年和1993年分別以遠(yuǎn)程工作單元和分布式工作單元實現(xiàn)了分布式數(shù)據(jù)庫支持。最近推出的DB2UniversalDatabase6。1則是通用數(shù)據(jù)庫的典范,是第一個具備網(wǎng)上功能的多媒體關(guān)系數(shù)據(jù)庫管理系統(tǒng),支持包括Linux在內(nèi)的一系列平臺。OracleOracle前身叫SDL,由LarryEllison和另兩個編程人員在1977創(chuàng)辦,他們開發(fā)了自己的拳頭產(chǎn)品,在市場上大量銷售,1979年,Oracle公司引入了第一個商用SQL關(guān)系數(shù)據(jù)庫管理系統(tǒng)。Oracle公司是最早開發(fā)關(guān)系數(shù)據(jù)庫的廠商之一,其產(chǎn)品支持最廣泛的操作系統(tǒng)平臺。目前Oracle關(guān)系數(shù)據(jù)庫產(chǎn)品的市場占有率名列前茅。InformixInformix在1980年成立,目的是為Unix等開放操作系統(tǒng)提供專業(yè)的關(guān)系型數(shù)據(jù)庫產(chǎn)品。公司的名稱Informix便是取自Information和Unix的結(jié)合。Informix第一個真正支持SQL語言的關(guān)系數(shù)據(jù)庫產(chǎn)品是InformixSE(StandardEngine)。InformixSE是在當(dāng)時的微機(jī)Unix環(huán)境下主要的數(shù)據(jù)庫產(chǎn)品。它也是第一個被移植到Linux上的商業(yè)數(shù)據(jù)庫產(chǎn)品。SybaseSybase公司成立于1984年,公司名稱"Sybase”取自"system”和“database"相結(jié)合的含義。Sybase公司的創(chuàng)始人之一BobEpstein是Ingres大學(xué)版(與System/R同時期的關(guān)系數(shù)據(jù)庫模型產(chǎn)品)的主要設(shè)計人員。公司的第一個關(guān)系數(shù)據(jù)庫產(chǎn)品是1987年5月推出的SybaseSQLServer]。0。Sybase首先提出Client/Server數(shù)據(jù)庫體系結(jié)構(gòu)的思想,并率先在SybaseSQLServer中實現(xiàn)。SQLServer1987年,微軟和IBM合作開發(fā)完成OS/2,IBM在其銷售的OS/2ExtendedEdition系統(tǒng)中綁定了OS/2DatabaseManager,而微軟產(chǎn)品線中尚缺少數(shù)據(jù)庫產(chǎn)品。為此,微軟將目光投向Sybase,同Sybase簽訂了合作協(xié)議,使用Sybase的技術(shù)開發(fā)基于OS/2平臺的關(guān)系型數(shù)據(jù)庫。1989年,微軟發(fā)布了SQLServer1。0版。PostgreSQLPostgreSQL是一種特性非常齊全的自由軟件的對象一一關(guān)系性數(shù)據(jù)庫管理系統(tǒng)(ORDBMS),它的很多特性是當(dāng)今許多商業(yè)數(shù)據(jù)庫的前身。PostgreSQL最早開始于BSD的Ingres項目。PostgreSQL的特性覆蓋了SQL-2/SQL-92和SQL-3。首先,它包括了可以說是目前世界上最豐富的數(shù)據(jù)類型的支持;其次,目前PostgreSQL是唯一支持事務(wù)、子查詢、多版本并行控制系統(tǒng)、數(shù)據(jù)完整性檢查等特性的唯一的一種自由軟件的數(shù)據(jù)庫管理系統(tǒng)。mySQLmySQL是一個小型關(guān)系型數(shù)據(jù)庫管理系統(tǒng),開發(fā)者為瑞典MySQLAB公司。在2008年1月16號被Sun公司收購。目前MySQL被廣泛地應(yīng)用在Internet上的中小型網(wǎng)站中。由于其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點,許多中小型網(wǎng)站為了降低網(wǎng)站總體擁有成本而選擇了MySQL作為網(wǎng)站數(shù)據(jù)庫。Access數(shù)據(jù)庫美國Microsoft公司于1994年推出的微機(jī)數(shù)據(jù)庫管理系統(tǒng)。它具有界面友好、易學(xué)易用、開發(fā)簡單、接口靈活等特點,是典型的新一代桌面數(shù)據(jù)庫管理系統(tǒng)。其主要特點如下:完善地管理各種數(shù)據(jù)庫對象,具有強(qiáng)大的數(shù)據(jù)組織、用戶管理、安全檢查等功能。強(qiáng)大的數(shù)據(jù)處理功能,在一個工作組級別的網(wǎng)絡(luò)環(huán)境中,使用Access開發(fā)的多用戶數(shù)據(jù)庫管理系統(tǒng)具有傳統(tǒng)的XBASE(DBASE、FoxBASE的統(tǒng)稱)數(shù)據(jù)庫系統(tǒng)所無法實現(xiàn)的客戶服務(wù)器(Cient/Server)結(jié)構(gòu)和相應(yīng)的數(shù)據(jù)庫安全機(jī)制,Access具備了許多先進(jìn)的大型數(shù)據(jù)庫管理系統(tǒng)所具備的特征,如事務(wù)處理/出錯回滾能力等??梢苑奖愕厣筛鞣N數(shù)據(jù)對象,利用存儲的數(shù)據(jù)建立窗體和報表,可視性好。作為Office套件的一部分,可以與Office集成,實現(xiàn)無縫連接。能夠利用Web檢索和發(fā)布數(shù)據(jù),實現(xiàn)與Internet的連接。Access主要適用于中小型應(yīng)用系統(tǒng),或作為客戶機(jī)/服務(wù)器系統(tǒng)中的客戶端數(shù)據(jù)庫。SQLiteSQLite是遵守ACID的關(guān)聯(lián)式資料庫管理系統(tǒng),它包含在一個相對小的C庫中。它是D。RichardHipp建立的公有領(lǐng)域項目。不像常見的客戶端/服務(wù)器結(jié)構(gòu)范例,SQLite引擎不是個程序與之通信的獨立進(jìn)程,而是連接到程序中成為它的一個主要部分。所以主要的通信協(xié)議是在編程語言內(nèi)的直接API調(diào)用。這在消耗總量、延遲時間和整體簡單性上有積極的作用。整個數(shù)據(jù)庫(定義、表、索引和數(shù)據(jù)本身)都在宿主主機(jī)上存儲在一個單一的文件中。它的簡單的設(shè)計是通過在開始一個事務(wù)的時候鎖定整個數(shù)據(jù)文件而完成的。FoxPro數(shù)據(jù)庫最初由美國Fox公司1988年推出,1992年Fox公司被Microsoft公司收購后,相繼推出了FoxPro2。5、2。6和VisualFoxPro等版本,其功能和性能有了較大的提高。FoxPro2。5、2。6分為DOS和Windows兩種版本,分別運行于DOS和Windows環(huán)境下。FoxPro比FoxBASE在功能和性能上又有了很大的改進(jìn),主要是引入了窗口、按紐、列表框和文本框等控件,進(jìn)一步提高了系統(tǒng)的開發(fā)能力??臻g數(shù)據(jù)庫2.1空間數(shù)據(jù)庫:指的是地理信息系統(tǒng)在計算機(jī)物理存儲介質(zhì)上存儲的與應(yīng)用相關(guān)的地理空間數(shù)據(jù)的總和,一般是以一系列特定結(jié)構(gòu)的文件的形式組織在存儲介質(zhì)之上的。空間數(shù)據(jù)庫的研究始于20世紀(jì)70年代的地圖制圖與遙感圖像處理領(lǐng)域,其目的是為了有效地利用衛(wèi)星遙感資源迅速繪制出各種經(jīng)濟(jì)專題地圖。2.2空間數(shù)據(jù)管理適用的行業(yè)和人群司機(jī) 最近加油站在哪,附近有沒有餐館(GPS)軍隊指揮家 敵軍動向(電子沙盤)公司供貨經(jīng)理新的物流倉庫和零售店應(yīng)建在什么地方(選址)環(huán)境專家該地區(qū)的總體環(huán)境評價(多因素多因子空間疊置分析)交通專家路網(wǎng)建設(shè)怎樣能改善交通狀況(網(wǎng)絡(luò)分析)應(yīng)急服務(wù)求助人的位置?最佳路線怎么走(最短路徑分析)停車場 附近有哪些停車場,有多少空位(GPS+LBS(通過電信移動運營商的公共衛(wèi)生事件 感染源在哪里?帶有5000m緩沖的隔離區(qū),發(fā)生原因及趨勢(空間自相關(guān)空間分析)空間數(shù)據(jù)的特征(1) 空間特征每個空間對象都具有空間坐標(biāo),即空間對象隱含了空間分布特征。這意味著在空間數(shù)據(jù)組織方面,要考慮它的空間分布特征。除了通用性數(shù)據(jù)庫管理系統(tǒng)或文件系統(tǒng)關(guān)鍵字的索引和輔關(guān)鍵字索引以外,一般需要建立空間索引。(2) 非結(jié)構(gòu)化特征在當(dāng)前通用的關(guān)系數(shù)據(jù)庫管理系統(tǒng)中,數(shù)據(jù)記錄一般是結(jié)構(gòu)化的。即它滿足關(guān)系數(shù)據(jù)模型的第一范式要求,每一條記錄是定長的,數(shù)據(jù)項表達(dá)的只能是原子數(shù)據(jù),不允許嵌套記錄。而空間數(shù)據(jù)則不能滿足這種結(jié)構(gòu)化要求。若將一條記錄表達(dá)一個空間對象,它的數(shù)據(jù)項可能是變長的,例如,1條弧段的坐標(biāo),其長度是不可限定的,它可能是2對坐標(biāo),也可能是10萬對坐標(biāo);其二,1個對象可能包含另外的1個或多個對象,例如,1個多邊形,它可能含有多條弧段。若1條記錄表示1條弧段,在這種情況下,1條多邊形的記錄就可能嵌套多條弧段的記錄,所以它不滿足關(guān)系數(shù)據(jù)模型的范式要求,這也就是為什么空間圖形數(shù)據(jù)難以直接采用通用的關(guān)系數(shù)據(jù)管理系統(tǒng)的主要原因。(3) 空間關(guān)系特征空間數(shù)據(jù)除了前面所述的空間坐標(biāo)隱含了空間分布關(guān)系外。空間數(shù)據(jù)中記錄的拓?fù)湫畔⒈磉_(dá)了多種空間關(guān)系。這種拓?fù)鋽?shù)據(jù)結(jié)構(gòu)一方面方便了空間數(shù)據(jù)的查詢和空間分析,另一方面也給空間數(shù)據(jù)的一致性和完整性維護(hù)增加了復(fù)雜性。特別是有些幾何對象,沒有直接記錄空間坐標(biāo)的信息,如拓?fù)涞拿鏍钅繕?biāo),僅記錄組成它的弧段的標(biāo)識,因而進(jìn)行查找、顯示和分析操作時都要操縱和檢索多個數(shù)據(jù)文件方能得以實現(xiàn)。(4) 分類編碼特征一般而言,每一個空間對象都有一個分類編碼,而這種分類編碼往往屬于國家標(biāo)準(zhǔn),或行業(yè)標(biāo)準(zhǔn),或地區(qū)標(biāo)準(zhǔn),每一種地物的類型在某個GIS中的屬性項個數(shù)是相同的。因而在許多情況下,一種地物類型對應(yīng)于一個屬性數(shù)據(jù)表文件。當(dāng)然,如果幾種地物類型的屬性項相同,也可以多種地物類型共用一個屬性數(shù)據(jù)表文件。(5)海量數(shù)據(jù)特征空間數(shù)據(jù)量是巨大的,通常稱海量數(shù)據(jù)。之所以稱為海量數(shù)據(jù),是指它的數(shù)據(jù)量比一般的通用數(shù)據(jù)庫要大得多。一個城市地理信息系統(tǒng)的數(shù)據(jù)量可能達(dá)幾十GB,如果考慮影像數(shù)據(jù)的存貯,可能達(dá)幾百個GB。這樣的數(shù)據(jù)量在城市管理的其他數(shù)據(jù)庫中是很少見的。正因為空間數(shù)據(jù)量大,所以需要在二維空間上劃分塊或者圖幅,在垂直方向上劃分層來進(jìn)行組織。空間數(shù)據(jù)庫管理系統(tǒng)的演變(1) 文件與關(guān)系數(shù)據(jù)庫混合管理系統(tǒng)由于空間數(shù)據(jù)具有以上幾個特征,市場上通用的關(guān)系數(shù)據(jù)庫管理系統(tǒng)難以滿足要求。因而,大部分GIS軟件采用混合管理的模式。即用文件系統(tǒng)管理幾何圖形數(shù)據(jù),用商用關(guān)系數(shù)據(jù)庫管理系統(tǒng)管理屬性數(shù)據(jù),它們之間的聯(lián)系通過目標(biāo)標(biāo)識或者內(nèi)部連接碼進(jìn)行連接。在這種管理模式中,幾何圖形數(shù)據(jù)與屬性數(shù)據(jù)除它們的oid作為連接關(guān)鍵字段以外,兩者幾乎是獨立地組織、管理與檢索。就幾何圖形而言,由于GIS系統(tǒng)采用高級語言編程,可以直接操縱數(shù)據(jù)文件,所以圖形用戶界面與圖形文件處理是一體的,中間沒有裂縫。但對屬性數(shù)據(jù)來說,則因系統(tǒng)和歷史發(fā)展而異。早期系統(tǒng)由于屬性數(shù)據(jù)必須通過關(guān)系數(shù)據(jù)庫管理系統(tǒng),圖形處理的用戶界面和屬性的用戶界面是分開的,它們只是通過一個內(nèi)部碼連接,如圖2所示。導(dǎo)致這種連接方式的主要原因是早期的數(shù)據(jù)庫管理系統(tǒng)不提供編程的高級語言如Fortran或C的接口,只能采用數(shù)據(jù)庫操縱語言。這樣通常要同時啟動兩個系統(tǒng)(GIS圖形系統(tǒng)和關(guān)系數(shù)據(jù)庫管理系統(tǒng)),甚至兩個系統(tǒng)來回切換,使用起來很不方便。最近幾年,隨著數(shù)據(jù)庫技術(shù)的發(fā)展,越來越多的數(shù)據(jù)庫管理系統(tǒng)提供高級編程語言C和Fortran等接口,使得地理信息系統(tǒng)可以在C語言的環(huán)境下,直接操縱屬性數(shù)據(jù),并通過C語言的對話框和列表框顯示屬性數(shù)據(jù),或通過對話框輸入SQL語句,并將該語句通過C語言與數(shù)據(jù)庫的接口查詢屬性數(shù)據(jù)庫,并在GIS的用戶界面下,顯示查詢結(jié)果。這種工作模式,并不需要啟動一個完整的數(shù)據(jù)庫管理系統(tǒng),用戶甚至不知道何時調(diào)用了關(guān)系數(shù)據(jù)庫管理系統(tǒng),圖形數(shù)據(jù)和屬性數(shù)據(jù)的查詢與維護(hù)完全在一個界面之下。(2) 全關(guān)系型空間數(shù)據(jù)庫管理系統(tǒng)全關(guān)系型空間數(shù)據(jù)庫管理系統(tǒng)是指圖形和屬性數(shù)據(jù)都用現(xiàn)有的關(guān)系數(shù)據(jù)庫管理系統(tǒng)管理。關(guān)系數(shù)據(jù)庫管理系統(tǒng)的軟件廠商不作任何擴(kuò)展,由GIS軟件商在此基礎(chǔ)上進(jìn)行開發(fā),使之不僅能管理結(jié)構(gòu)化的屬性數(shù)據(jù),而且能管理非結(jié)構(gòu)化的圖形數(shù)據(jù)。用關(guān)系數(shù)據(jù)庫管理系統(tǒng)管理圖形數(shù)據(jù)有兩種模式,一種是基于關(guān)系模型的方式,圖形數(shù)據(jù)按照關(guān)系數(shù)據(jù)模型組織。這種組織方式由于涉及一系列關(guān)系連接運算,相當(dāng)費時,例如,為了顯示一個多邊形,需要找出組成多邊形的采樣點坐標(biāo)。它要涉及到4個關(guān)系表,作多次連接投影運算,這一查詢的語句如下:SeletX,YFrom P,E,N,CWhereP?P#=E?P#andE?E#=N?E#and(N-BN=C-N#andN-EN=C-N#)對于這樣簡單的實例,需要作如此復(fù)雜的關(guān)系連接運算,非常費時。由此可見,關(guān)系模型在處理空間目標(biāo)方面效率不高。用關(guān)系數(shù)據(jù)庫管理系統(tǒng)管理圖形數(shù)據(jù)的另一種方式是將圖形數(shù)據(jù)的變長部分處理成Binary二進(jìn)制塊Block字段。目前大部分關(guān)系數(shù)據(jù)庫管理系統(tǒng)都提供了二進(jìn)制塊的字段域,以適應(yīng)管理多媒體數(shù)據(jù)或可變長文本字符。GIS利用這種功能,通常把圖形的坐標(biāo)數(shù)據(jù),當(dāng)作一個二進(jìn)制塊,交由關(guān)系數(shù)據(jù)庫管理系統(tǒng)進(jìn)行存貯和管理。這種存貯方式,雖然省去了前面所述的大量關(guān)系連接操作,但是二進(jìn)制塊的讀寫效率要比定長的屬性字段慢得多,特別是涉牽對象的嵌套,速度更慢。(3) 對象一關(guān)系數(shù)據(jù)庫管理系統(tǒng)由于直接采用通用的關(guān)系數(shù)據(jù)庫管理系統(tǒng)的效率不高,而非結(jié)構(gòu)化的空間數(shù)據(jù)又十分重要,所以許多數(shù)據(jù)庫管理系統(tǒng)的軟件商紛紛在關(guān)系數(shù)據(jù)庫管理系統(tǒng)中進(jìn)行擴(kuò)展,使之能直接存貯和管理非結(jié)構(gòu)化的空間數(shù)據(jù),如Ingres,Informix和Oracle等都推出了空間數(shù)據(jù)管理的專用模塊,定義了操縱點、線、面、圓、長方形等空間對象的API函數(shù)。這些函數(shù),將各種空間對象的數(shù)據(jù)結(jié)構(gòu)進(jìn)行了預(yù)先的定義,用戶使用時必須滿足它的數(shù)據(jù)結(jié)構(gòu)要求,用戶不能根據(jù)GIS要求(即使是GIS軟件商)再定義。例如,這種函數(shù)涉及的空間對象一般不帶拓?fù)潢P(guān)系,多邊形的數(shù)據(jù)是直接跟隨邊界的空間坐標(biāo),那么GIS用戶就不能將設(shè)計的拓?fù)鋽?shù)據(jù)結(jié)構(gòu)采用這種對象一關(guān)系模型進(jìn)行存貯。這種擴(kuò)展的空間對象管理模塊主要解決了空間數(shù)據(jù)變長記錄的管理,由于由數(shù)據(jù)庫軟件商進(jìn)行擴(kuò)展,效率要比前面所述的二進(jìn)制塊的管理高得多。但是它仍然沒有解決對象的嵌套問題,空間數(shù)據(jù)結(jié)構(gòu)也不能由用戶任意定義,使用上仍然受到一定限制。(4) 面向?qū)ο罂臻g數(shù)據(jù)庫管理系統(tǒng)面向?qū)ο竽P妥钸m應(yīng)于空間數(shù)據(jù)的表達(dá)和管理,它不僅支持變長記錄,而且支持對象的嵌套、信息的繼承與聚集。面向?qū)ο蟮目臻g數(shù)據(jù)庫管理系統(tǒng)允許用戶定義對象和對象的數(shù)據(jù)結(jié)構(gòu)以及它的操作。這樣,我們可以將空間對象根據(jù)GIS的需要,定義出合適的數(shù)據(jù)結(jié)構(gòu)和一組操作。這種空間數(shù)據(jù)結(jié)構(gòu)可以是不帶拓?fù)潢P(guān)系的面條數(shù)據(jù)結(jié)構(gòu),也可以是拓?fù)鋽?shù)據(jù)結(jié)構(gòu),當(dāng)采用拓?fù)鋽?shù)據(jù)結(jié)構(gòu)時,往往涉及對象的嵌套、對象的連接和對象與信息聚集??臻g數(shù)據(jù)挖掘5.1空間數(shù)據(jù)挖掘是指從空間數(shù)據(jù)庫中抽取沒有清楚表現(xiàn)出來的隱含的知識和空間關(guān)系,并發(fā)現(xiàn)其中有用的特征和模式的理論、方法和技術(shù)??臻g數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的過程大致可分為以下多個步驟:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理、數(shù)據(jù)縮減或者數(shù)據(jù)變換、確定數(shù)據(jù)挖掘目標(biāo)、確定知識發(fā)現(xiàn)算法、數(shù)據(jù)挖掘、模式解釋、知識評價等,而數(shù)據(jù)挖掘只是其中的一個關(guān)鍵步驟。但是為了簡便,人們常常用空間數(shù)據(jù)挖掘來代替空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)。5.2常用的空間數(shù)據(jù)挖掘方法(1) 基于概率論的方法。這是一種通過計算不確定性屬性的概率來挖掘空間知識的方法,所發(fā)現(xiàn)的知識通常被表示成給定條件下某一假設(shè)為真的條件概率。在用誤差矩陣描述遙感分類結(jié)果的不確定性時,可以用這種條件概率作為背景知識來表示不確定性的置信度。(2) 空間分析方法。指采用綜合屬性數(shù)據(jù)分析、拓?fù)浞治?、緩沖區(qū)分析、密度分析、距離分析、疊置分析、網(wǎng)絡(luò)分析、地形分析、趨勢面分析、預(yù)測分析等在內(nèi)的分析模型和方法,用以發(fā)現(xiàn)目標(biāo)在空間上的相連、相鄰和共生等關(guān)聯(lián)規(guī)則,或挖掘出目標(biāo)之間的最短路徑、最優(yōu)路徑等知識。目前常用的空間分析方法包括探測性的數(shù)據(jù)分析、空間相鄰關(guān)系挖掘算法、探測性空間分析方法、探測性歸納學(xué)習(xí)方法、圖像分析方法等。(3) 統(tǒng)計分析方法。指利用空間對象的有限信息和/或不確定性信息進(jìn)行統(tǒng)計分析,進(jìn)而評估、預(yù)測空間對象屬性的特征、統(tǒng)計規(guī)律等知識的方法。它主要運用空間自協(xié)方差結(jié)構(gòu)、變異函數(shù)或與其相關(guān)的自協(xié)變量或局部變量值的相似程度實現(xiàn)包含不確定性的空間數(shù)據(jù)挖掘。(4) 歸納學(xué)習(xí)方法。即在一定的知識背景下,對數(shù)據(jù)進(jìn)行概括和綜合,在空間數(shù)據(jù)庫(數(shù)據(jù)倉庫)中搜索和挖掘一般的規(guī)則和模式的方法。歸納學(xué)習(xí)的算法很多,如由Quinlan提出的著名的C5。0決策樹算法、HanJiawei教授等提出的面向?qū)傩缘臍w納方法、裴健等人提出的基于空間屬性的歸納方法等。(5) 空間關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論