空間數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)_第1頁
空間數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)_第2頁
空間數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)_第3頁
空間數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、薛愛萍,等:空間數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)電子商務(wù)空間數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)薛愛萍,任志國2(1.山東科技大學(xué),山東泰安271019;2.泰山醫(yī)學(xué)院,山東泰安271019)摘要隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展與成熟,空間數(shù)據(jù)挖掘已經(jīng)成為人們研究的熱點(diǎn)之一。本文針對(duì)地理信息系統(tǒng)(GIS)的需要,介紹了空間數(shù)據(jù)挖掘(SDM)的理論、方法和一般處理過程,并給出了基于GIS的空間數(shù)據(jù)挖掘的框架結(jié)構(gòu)。關(guān)鍵詞數(shù)據(jù)挖掘;地理信息系統(tǒng);空間數(shù)據(jù)挖掘;體系結(jié)構(gòu)中圖分類號(hào)F715文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào)10056432(2011)32009101取出有關(guān)的知識(shí)。(6)歸納方法。歸納方法就是對(duì)數(shù)據(jù)進(jìn)行概括和綜合,歸納出高層次的模式或特征。歸

2、納法一般需要背景知識(shí),常以概念樹的形式給出。在地理信息系統(tǒng)數(shù)據(jù)庫中,有屬性概念樹和空間關(guān)系概念樹兩類。背景知識(shí)由用戶提供,在有些情況下也可以作為知識(shí)發(fā)現(xiàn)任務(wù)的一部分自動(dòng)獲取。(7)云理論。云理論是用于處理不確定性的一種新理論,由云模型(cloudmodel)、不確定性推理(reason-ingunderuncertainty)和云變換(cloudtransform)三大支柱構(gòu)成。云理論將模糊性和隨機(jī)性結(jié)合起來,彌補(bǔ)了作為模糊集理論基石的隸屬函數(shù)概念的固有缺陷,為SDM中定量與定性相結(jié)合的處理方法奠定了基礎(chǔ)。1SDM技術(shù)概述空間數(shù)據(jù)包括了空間屬性數(shù)據(jù)和非空間屬性數(shù)據(jù),空間屬性描述了空間拓?fù)潢P(guān)系和

3、方位、距離等關(guān)系,空間屬性數(shù)據(jù)按照空間索引結(jié)構(gòu)存儲(chǔ)和查找。空間數(shù)據(jù)挖掘(SpatialDataMining,即SDM),就是從空間數(shù)據(jù)中提取信息,提取的信息包含了復(fù)雜的空間關(guān)系,因此空間數(shù)據(jù)挖掘與其他數(shù)據(jù)挖掘方法上有其獨(dú)有的特點(diǎn)。空間數(shù)據(jù)挖掘需要綜合數(shù)據(jù)挖掘與空間數(shù)據(jù)庫技術(shù)??臻g數(shù)據(jù)挖掘可用于對(duì)空間數(shù)據(jù)的理解,空間關(guān)系和空間與非空間數(shù)據(jù)間關(guān)系的發(fā)現(xiàn),空間知識(shí)庫的構(gòu)造,空間數(shù)據(jù)庫的重組和空間查詢的優(yōu)化。2SDM方法(1)特征規(guī)則挖掘。知識(shí)是具有粒度的,人們希望從大量細(xì)節(jié)數(shù)據(jù)中進(jìn)行總結(jié)并上升到較高層次,在這一過程中數(shù)據(jù)挖掘稱為數(shù)據(jù)概括,也稱為特征抽取。數(shù)據(jù)概括就是將數(shù)據(jù)從低層次概念抽象到較高層次,

4、空間數(shù)據(jù)概括的實(shí)現(xiàn)方法分為空間數(shù)據(jù)立方體和面向?qū)傩詺w納法兩類。(2)空間關(guān)聯(lián)分析。空間關(guān)聯(lián)規(guī)則形如A Bs%,c%,其中A和B是空間和非空間謂詞的集合,s%表示規(guī)則的支持度,c%表示規(guī)則的可信度。各種各樣的空間謂詞可以用來構(gòu)成空間關(guān)聯(lián)規(guī)則。(3)空間聚類方法??臻g數(shù)據(jù)聚類是要在一個(gè)較大的多維數(shù)據(jù)集中根據(jù)距離的度量找出簇,或稠密區(qū)域,也就是把空間數(shù)據(jù)庫中的對(duì)象分為有意義的子類,使得同一子類內(nèi)部的成員有盡可能多的相同屬性,而不同的子類之間盡可能的不同??臻g聚類分析是以概念分析為基礎(chǔ)。(4)空間分類和空間趨勢(shì)分析??臻g分類是指分析空間對(duì)象導(dǎo)出與一定空間特征有關(guān)的分類模式,如地區(qū)、高速公路或河流的領(lǐng)域

5、??臻g趨勢(shì)分析是根據(jù)空間維找出變化趨勢(shì),研究空間上的非空間與空間數(shù)據(jù)的變化。(5)統(tǒng)計(jì)空間數(shù)據(jù)分析。統(tǒng)計(jì)空間數(shù)據(jù)分析一般是首先建立一個(gè)數(shù)學(xué)模型或統(tǒng)計(jì)模型,然后根據(jù)這種模型提3SDM處理過程(1)數(shù)據(jù)準(zhǔn)備與問題理解。這個(gè)階段主要是了解空間數(shù)據(jù)挖掘相關(guān)領(lǐng)域的有關(guān)情況,熟悉有關(guān)的背景知識(shí),弄清楚用戶的需求。此階段是數(shù)據(jù)挖掘的必經(jīng)步驟,往往要花費(fèi)很多的時(shí)間。(2)數(shù)據(jù)選擇。根據(jù)用戶的要求從空間數(shù)據(jù)庫中提取與空間數(shù)據(jù)挖掘相關(guān)的數(shù)據(jù),空間數(shù)據(jù)挖掘?qū)⒅饕獜倪@些數(shù)據(jù)中進(jìn)行知識(shí)提取。在此過程中,會(huì)利用一些數(shù)據(jù)庫操作對(duì)數(shù)據(jù)進(jìn)行處理。(3)數(shù)據(jù)預(yù)處理與數(shù)據(jù)縮減。此階段主要是對(duì)數(shù)據(jù)選擇階段產(chǎn)生的數(shù)據(jù)進(jìn)行再加工,檢查數(shù)

6、據(jù)的完整性及一致性,對(duì)其中的噪音數(shù)據(jù)進(jìn)行處理,對(duì)丟失的數(shù)據(jù)利用統(tǒng)計(jì)方法進(jìn)行填補(bǔ);然后再對(duì)經(jīng)過預(yù)處理的數(shù)據(jù),根據(jù)知識(shí)發(fā)現(xiàn)的任務(wù)對(duì)數(shù)據(jù)進(jìn)行再處理(主要通過投影或數(shù)據(jù)庫中的其他操作減少數(shù)據(jù)量)。(4)確定空間數(shù)據(jù)挖掘的目標(biāo),根據(jù)目標(biāo)確定數(shù)據(jù)挖掘算法。根據(jù)用戶的要求,確定空間數(shù)據(jù)挖掘發(fā)現(xiàn)何種類型的知識(shí)。在確定了目標(biāo)之后,有很多的數(shù)據(jù)挖掘算法,但我們需要知道選擇哪種算法和怎樣應(yīng)用它。算法的選擇直接影響著所挖掘模式的質(zhì)量。選擇(下轉(zhuǎn)P100)采購與供應(yīng)鏈費(fèi)能夠快捷便利。再次,要優(yōu)化農(nóng)村的社會(huì)、文化環(huán)境對(duì)農(nóng)民進(jìn)行消費(fèi)教育,引導(dǎo)農(nóng)民正確消費(fèi)。最后,加快農(nóng)村流通業(yè)的發(fā)展,發(fā)揮流通業(yè)對(duì)農(nóng)村的積極作用。另外,在改善

7、農(nóng)民消費(fèi)環(huán)境的同時(shí)應(yīng)注重生態(tài)環(huán)境的保護(hù),應(yīng)當(dāng)使農(nóng)民樹立保護(hù)生態(tài)環(huán)境的意識(shí),走可持續(xù)發(fā)展的道路。4.5政府應(yīng)該采取相應(yīng)的措施縮小城鄉(xiāng)消費(fèi)差異政府要實(shí)行城鄉(xiāng)一體的公共產(chǎn)品供給制度,平等享有公共產(chǎn)品,是增加農(nóng)民收入的基礎(chǔ),也是增加農(nóng)民消費(fèi)的基礎(chǔ)。農(nóng)村的純公共產(chǎn)品,如公共衛(wèi)生、社會(huì)保障、義務(wù)教育和文化娛樂設(shè)施的建設(shè)等應(yīng)由政府完全提供,農(nóng)村的準(zhǔn)公共產(chǎn)品也應(yīng)當(dāng)以政府供給為主導(dǎo),可以吸納社會(huì)或企業(yè)資本進(jìn)行投資。另外,政府有必要取消戶籍制度的約束,增加農(nóng)村居民的自由流動(dòng)性,為農(nóng)村居民進(jìn)城務(wù)工創(chuàng)造良好的體制環(huán)境保障。這些措施也將是當(dāng)?shù)卣幕菝裾叩靡詫?shí)施的一個(gè)良好契機(jī)和途徑。(上接P91)合適的知識(shí)發(fā)現(xiàn)算法,

8、包括選取合適的模型和參數(shù),并使得知識(shí)發(fā)現(xiàn)算法和整個(gè)空間數(shù)據(jù)挖掘的評(píng)判標(biāo)準(zhǔn)相一致。(5)進(jìn)行空間數(shù)據(jù)挖掘。此階段運(yùn)用選定的數(shù)據(jù)挖掘算法,從空間數(shù)據(jù)提取出用戶所需要的知識(shí),這些知識(shí)可以用一種特定的方式表示或使用一些常用表示方式。在進(jìn)行空間數(shù)據(jù)挖掘過程中要用一些標(biāo)準(zhǔn)來度量產(chǎn)生的模式,來獲取有意義的模式。由于可預(yù)測(cè)型模式是預(yù)測(cè)某一屬性的值,而這個(gè)屬性的值又存在于訓(xùn)練集合中,所以一般來說,通過把預(yù)測(cè)的值與存在于訓(xùn)練集合中的那個(gè)屬性的實(shí)際輸出值相比較,計(jì)算模式的誤差程度,從而做出對(duì)模式的評(píng)估。(6)模式解釋與知識(shí)評(píng)價(jià)。對(duì)發(fā)現(xiàn)的知識(shí)進(jìn)行解釋,在此過程中,為了取得更為有效的知識(shí),可能會(huì)返回前面處理步驟中的某些

9、步驟以反復(fù)提取,從而取得更為有效的知識(shí)。然后將發(fā)現(xiàn)的知識(shí)以用戶能了解的方式呈現(xiàn)給用戶。這期間也包含對(duì)知識(shí)的一致性檢驗(yàn),以確信本次發(fā)現(xiàn)的知識(shí)不與以前發(fā)現(xiàn)的知識(shí)相抵觸。(7)重新精化數(shù)據(jù)和問題。如果用戶對(duì)生成模式的評(píng)價(jià)是滿意的。那么,就要重新進(jìn)行新一輪的數(shù)據(jù)挖掘過程。經(jīng)過幾次反復(fù)精化之后,如果模式的執(zhí)行情況足夠好,而且得到了用戶的認(rèn)可,就可以進(jìn)入到使用結(jié)果的階段了。(8)使用結(jié)果。在上述7個(gè)階段完成之后,用戶就可以應(yīng)用挖掘出來的模式或知識(shí)了。中國市場(chǎng)2011年第32期(總第643期)參考文獻(xiàn):1曹俊杰,高峰.我國城鄉(xiāng)居民消費(fèi)觀念差異之比較J經(jīng)濟(jì)問題,2004(3):7476.2胡雪萍.優(yōu)化農(nóng)村消費(fèi)

10、環(huán)境與擴(kuò)大農(nóng)民消費(fèi)需求J農(nóng)業(yè)經(jīng)濟(jì)問題,2003(7):2427.3劉文斌.收入差距對(duì)消費(fèi)需求的制約J經(jīng)濟(jì)研究,2000(9):1316.4張志敏.90年代以來中國居民消費(fèi)特征及影響因素分析J中央財(cái)經(jīng)大學(xué)學(xué)報(bào),2003(11):52565龔志民,毛中根.論我國目前農(nóng)民消費(fèi)偏低的原因及對(duì)策J消費(fèi)經(jīng)濟(jì),2002(2):4951.6劉玉玲,我國農(nóng)民消費(fèi)現(xiàn)狀及對(duì)策研究J當(dāng)代經(jīng)濟(jì)研究,2002(6):5356.檶檶檶檶檶檶檶檶檶基金項(xiàng)目云南省教育廳科學(xué)研究基金項(xiàng)目09Y0371。作者簡(jiǎn)介鄭翠霞(1971),女,漢族,湖南湘潭人,大理學(xué)院政法與經(jīng)管學(xué)院副教授,研究方向:農(nóng)村經(jīng)濟(jì)。檵檵檵檵檵檵檵檵檵檵檵檵檵檵

11、檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵參數(shù)。用戶接口包括三部分:數(shù)據(jù)定義、挖掘向?qū)Ш湍J胶Y選。數(shù)據(jù)定義是根據(jù)用戶指令和一些相關(guān)的背景知識(shí)來進(jìn)行數(shù)據(jù)定義。挖掘向?qū)墙邮沼脩糁噶?,觸發(fā)數(shù)據(jù)挖掘核心模塊。空間數(shù)據(jù)庫和其他數(shù)據(jù)源根據(jù)數(shù)據(jù)定義,來進(jìn)行數(shù)據(jù)預(yù)處理與數(shù)據(jù)縮減,然后抽取出正確可靠的數(shù)據(jù)。數(shù)據(jù)挖掘核心包括特征規(guī)則挖掘,空間關(guān)聯(lián)規(guī)則,空間分類與空間趨勢(shì)分析等。數(shù)據(jù)挖掘核心把抽取到的正確可靠的數(shù)據(jù)轉(zhuǎn)換成模式集合,然后進(jìn)行模式解釋與結(jié)果評(píng)價(jià)。數(shù)據(jù)挖掘是一個(gè)反復(fù)的過程,過程的終止條件是用戶對(duì)挖掘出來的知識(shí)滿意,因此用戶對(duì)發(fā)現(xiàn)模式的判斷和篩選就是整個(gè)系統(tǒng)的反饋環(huán)節(jié)。用戶對(duì)模式進(jìn)

12、行判斷和篩選,如果滿意,模式就成為知識(shí),經(jīng)過一些表達(dá)處理,添加到知識(shí)庫里去。如果不滿意,就要反饋?zhàn)饔糜谕诰蛳驅(qū)?,進(jìn)而調(diào)整挖掘內(nèi)核的操作,實(shí)現(xiàn)挖掘流程的繼續(xù),并逐漸接近用戶的挖掘目標(biāo)。5結(jié)論數(shù)據(jù)挖掘是一個(gè)飛速發(fā)展的領(lǐng)域,空間數(shù)據(jù)挖掘很多都是關(guān)系數(shù)據(jù)庫挖掘的延伸。本文簡(jiǎn)要介紹了空間數(shù)據(jù)挖掘技術(shù)和一些常用的空間數(shù)據(jù)挖掘方法,并且基于SDM的一般步驟,提出了一個(gè)新的空間數(shù)據(jù)挖掘體系結(jié)構(gòu)。在SDM的理論和方法方面,重要的研究方向有:背景知識(shí)概念樹的自動(dòng)生成、不確定性情況下的數(shù)據(jù)挖掘、遞增式數(shù)據(jù)挖掘、柵格矢量一體化數(shù)據(jù)挖掘、多分辨率及多層次數(shù)據(jù)挖掘、并行數(shù)據(jù)挖掘、新算法和高效率算法的研究、空間數(shù)據(jù)挖掘查詢語言、規(guī)則的可視化表達(dá)等。在SDM系統(tǒng)的實(shí)現(xiàn)方面,要研究多算法的集成、SDM系統(tǒng)中的人機(jī)交互技術(shù)和可視化技術(shù)、SDM系統(tǒng)與地理信息系統(tǒng)、遙感解譯專家系統(tǒng)、空間決策支持系統(tǒng)的集成等。4SDM體系結(jié)構(gòu)借鑒有關(guān)專家提出的數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu),本文提出了一種空間數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu),其系統(tǒng)流程是:用戶提出一些問題,通過用戶接口,數(shù)據(jù)挖掘模塊觸發(fā)數(shù)據(jù)挖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論