《商業(yè)分析概論》復(fù)雜數(shù)據(jù)的挖掘_第1頁(yè)
《商業(yè)分析概論》復(fù)雜數(shù)據(jù)的挖掘_第2頁(yè)
《商業(yè)分析概論》復(fù)雜數(shù)據(jù)的挖掘_第3頁(yè)
《商業(yè)分析概論》復(fù)雜數(shù)據(jù)的挖掘_第4頁(yè)
《商業(yè)分析概論》復(fù)雜數(shù)據(jù)的挖掘_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

商業(yè)分析概論復(fù)雜數(shù)據(jù)的挖掘目錄CONTENTS復(fù)雜數(shù)據(jù)挖掘概述多媒體數(shù)據(jù)的存儲(chǔ)多媒體數(shù)據(jù)標(biāo)引與檢索多媒體數(shù)據(jù)的挖掘分析空間數(shù)據(jù)庫(kù)挖掘12345目錄目錄CONTENTS1234511.1復(fù)雜數(shù)據(jù)挖掘概述復(fù)雜數(shù)據(jù)挖掘概述多媒體數(shù)據(jù)的存儲(chǔ)空間數(shù)據(jù)庫(kù)挖掘多媒體數(shù)據(jù)標(biāo)引與檢索多媒體數(shù)據(jù)的挖掘分析11.1復(fù)雜數(shù)據(jù)挖掘概述計(jì)算機(jī)的發(fā)展、虛擬現(xiàn)實(shí)技術(shù)、信息可視化促進(jìn)了包括視頻、圖像等在內(nèi)的多媒體技術(shù)的飛速發(fā)展,對(duì)大量多媒體信息進(jìn)行有效的處理、組織和存儲(chǔ)、分析和挖掘也成為信息工作者面臨的挑戰(zhàn),這其中包括對(duì)多媒體信息的檢索、知識(shí)挖掘、空間數(shù)據(jù)倉(cāng)庫(kù)等等研究方向。背景多媒體(Multimedia),顧名思義,就是指多種單一或復(fù)雜媒體集成起來(lái)新的媒體,更確切點(diǎn)說(shuō),它一般是指文字、圖像、聲音、動(dòng)畫(huà)、視頻等多種媒體和計(jì)算機(jī)程序融合在一起形成的信息傳播媒體,它是計(jì)算機(jī)軟件和硬件的結(jié)合。11.1復(fù)雜數(shù)據(jù)挖掘概述復(fù)雜數(shù)據(jù)挖掘圖像挖掘音頻挖掘視頻挖掘空間數(shù)據(jù)挖掘11.1復(fù)雜數(shù)據(jù)挖掘概述(1)

圖像數(shù)據(jù)挖掘圖像挖掘(ImageMining)指對(duì)圖形圖像數(shù)據(jù)信息的自動(dòng)處理和知識(shí)發(fā)現(xiàn),包含模式識(shí)別、圖像檢索以及特征分析等。一般的圖像包含豐富的視覺(jué)和空間特性,如典型的視覺(jué)特性有顏色(color)、紋理(grain)、形狀(shape)、輪廓(outline)等。圖像的空間特性是非常重要的特性,包括圖像中各種對(duì)象的模式、布局、空間層次等。圖像數(shù)據(jù)挖掘的應(yīng)用基于視覺(jué)和空間特性的圖像挖掘技術(shù)可以廣泛用于衛(wèi)星遙測(cè)圖片庫(kù)、氣象衛(wèi)星云圖、醫(yī)療CT掃描片、分子顯微圖片以及其他圖像資料數(shù)據(jù)庫(kù)等方面的隱含知識(shí)發(fā)現(xiàn),而基于人臉識(shí)別技術(shù)、筆跡分析技術(shù)、指紋鑒別技術(shù)的圖像挖掘系統(tǒng)在公安、交通、機(jī)場(chǎng)安檢等地方的應(yīng)用已經(jīng)十分廣泛。11.1復(fù)雜數(shù)據(jù)挖掘概述(2)音頻數(shù)據(jù)挖掘音頻挖掘(AudioMining)指對(duì)音頻信息的自動(dòng)處理和分析過(guò)程。音頻是聽(tīng)覺(jué)媒體,如語(yǔ)音、音樂(lè)、自然聲音等,使用最多的音頻媒體是語(yǔ)音(Voice)。例如廣播節(jié)目中的語(yǔ)音和伴隨視頻的語(yǔ)音。如今,語(yǔ)音處理和識(shí)別技術(shù)已經(jīng)取得了很大進(jìn)展,軟件系統(tǒng)經(jīng)過(guò)訓(xùn)練后,可以把數(shù)字語(yǔ)音識(shí)別為文本,然后可以利用傳統(tǒng)的文本挖掘方法對(duì)其進(jìn)行挖掘。音頻數(shù)據(jù)挖掘的應(yīng)用國(guó)外監(jiān)聽(tīng)衛(wèi)星電話的分析對(duì)數(shù)字音頻中音樂(lè)(Music)的數(shù)據(jù)挖掘針對(duì)聽(tīng)覺(jué)特性中的基音、音調(diào)、旋律、音頻事件和對(duì)象結(jié)構(gòu),挖掘出隱含在音頻流中的節(jié)奏模式和規(guī)律,然后可以將其分類(lèi),如自動(dòng)將音頻數(shù)據(jù)庫(kù)進(jìn)行“流行音樂(lè)”、“民族音樂(lè)”等類(lèi)別標(biāo)引。11.1復(fù)雜數(shù)據(jù)挖掘概述(3)視頻數(shù)據(jù)挖掘視頻挖掘(VideoMining)指對(duì)動(dòng)畫(huà)視頻信息的自動(dòng)處理,如電視信息的主題提取、視頻文件的自動(dòng)摘要等等。視頻媒體是一系列圖像媒體的組合視覺(jué)特性空間特性時(shí)間特性視頻對(duì)象特性運(yùn)動(dòng)特性等視頻數(shù)據(jù)挖掘的應(yīng)用新聞視頻系統(tǒng)監(jiān)控視頻系統(tǒng)記錄影片系統(tǒng)數(shù)字視頻圖書(shū)館(4)空間數(shù)據(jù)挖掘空間數(shù)據(jù)挖掘(SpatialDataMining,簡(jiǎn)稱(chēng)SDM)是針對(duì)空間數(shù)據(jù)庫(kù)的知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryfromSpatialDatabase)研究,是指從空間數(shù)據(jù)庫(kù)中提取用戶(hù)感興趣的空間模式、特征、空間與非空間數(shù)據(jù)的普遍關(guān)系及其他一些隱含在數(shù)據(jù)庫(kù)中的普遍數(shù)據(jù)特征的過(guò)程,它是數(shù)據(jù)挖掘技術(shù)在空間數(shù)據(jù)庫(kù)方面應(yīng)用的延伸。空間數(shù)據(jù)挖掘的應(yīng)用它可用于對(duì)空間數(shù)據(jù)的理解,空間關(guān)系和空間與非空間數(shù)據(jù)間關(guān)系的發(fā)現(xiàn),空間知識(shí)庫(kù)的構(gòu)造,空間數(shù)據(jù)庫(kù)的重組和空間數(shù)據(jù)查詢(xún)的優(yōu)化。911.1復(fù)雜數(shù)據(jù)挖掘概述目錄CONTENTS134511.2多媒體數(shù)據(jù)的存儲(chǔ)復(fù)雜數(shù)據(jù)挖掘概述多媒體數(shù)據(jù)的存儲(chǔ)空間數(shù)據(jù)庫(kù)挖掘多媒體數(shù)據(jù)標(biāo)引與檢索多媒體數(shù)據(jù)的挖掘分析211.2多媒體數(shù)據(jù)的存儲(chǔ)11.2多媒體數(shù)據(jù)的存儲(chǔ)(圖像存儲(chǔ))

位圖位圖是把一幅彩色圖像分成許許多多的像素,用若干數(shù)字來(lái)指定每個(gè)像素的顏色、亮度和屬性。因此一幅圖就由許許多多描述每個(gè)像素的數(shù)據(jù)組成。描述每個(gè)像素點(diǎn)的RGB的強(qiáng)度可以用不同位的二進(jìn)制數(shù)據(jù),這也決定了圖像文件的大小,表示強(qiáng)度的二進(jìn)制位數(shù)越大,色彩越豐富,圖像文件也就越大矢量圖矢量圖是用一系列計(jì)算機(jī)指令來(lái)表示一幅圖,比如畫(huà)點(diǎn)、畫(huà)線、畫(huà)圓等等。這種方法實(shí)際上是用數(shù)學(xué)表達(dá)式來(lái)描述一幅圖,然后再編程,用計(jì)算機(jī)的語(yǔ)言或程序來(lái)表達(dá)。在顯示圖像時(shí),計(jì)算機(jī)一邊計(jì)算一邊顯示,由于復(fù)雜的計(jì)算往往需要花費(fèi)比較長(zhǎng)的時(shí)間,所以通常能夠看到繪圖的過(guò)程。目錄CONTENTS1245復(fù)雜數(shù)據(jù)挖掘概述多媒體數(shù)據(jù)的存儲(chǔ)空間數(shù)據(jù)庫(kù)挖掘多媒體數(shù)據(jù)標(biāo)引與檢索多媒體數(shù)據(jù)的挖掘分析311.3多媒體數(shù)據(jù)標(biāo)引與檢索11.3多媒體數(shù)據(jù)標(biāo)引與檢索多媒體數(shù)據(jù)標(biāo)引文本標(biāo)引圖像標(biāo)引音頻標(biāo)引視頻標(biāo)引總的看來(lái),多媒體數(shù)據(jù)的標(biāo)引主要有兩種方式:根據(jù)外在特征進(jìn)行標(biāo)引的元數(shù)據(jù)方式和基于內(nèi)容的元數(shù)據(jù)方式。11.3多媒體數(shù)據(jù)標(biāo)引與檢索基于內(nèi)容的標(biāo)引方法自由文本法編碼系統(tǒng)法自動(dòng)處理的特征描述法11.3多媒體數(shù)據(jù)標(biāo)引與檢索基于內(nèi)容的多媒體數(shù)據(jù)檢索基于相似性的檢索

這種檢索方法是用戶(hù)輸入一種多媒體信息,如一幅圖像,一段聲音等,然后匹配多媒體數(shù)據(jù)庫(kù)中相似的數(shù)據(jù)?;谀0宓臋z索

這種檢索方法主要針對(duì)多媒體信息的某些特征參數(shù)建立通用模板,然后通過(guò)這些模板對(duì)數(shù)據(jù)庫(kù)進(jìn)行匹配檢索?;谡Z(yǔ)義的檢索

這是多媒體檢索的最高級(jí)的應(yīng)用,它依賴(lài)于多媒體數(shù)據(jù)庫(kù)的語(yǔ)義標(biāo)引情況和自然語(yǔ)言理解。目錄CONTENTS1235復(fù)雜數(shù)據(jù)挖掘概述多媒體數(shù)據(jù)的存儲(chǔ)空間數(shù)據(jù)庫(kù)挖掘多媒體數(shù)據(jù)標(biāo)引與檢索多媒體數(shù)據(jù)的挖掘分析411.4多媒體數(shù)據(jù)的挖掘分析1999年,O.R.Zaiane在其博士論文中介紹了多媒體數(shù)據(jù)挖掘的一個(gè)系統(tǒng)原型MMMiner。數(shù)據(jù)倉(cāng)庫(kù)的多維性是通過(guò)數(shù)據(jù)立方體表現(xiàn)出來(lái)的,多媒體數(shù)據(jù)倉(cāng)庫(kù)可能包括這樣一些立方體,如色彩立方體,其中包括顏色、紋理信息;尺寸立方體,包括媒體的大小、寬度、高度等。MMMiner系統(tǒng)采用的基本立方體還包括一個(gè)稱(chēng)之為PopCube的立方體,它記錄的是影像數(shù)據(jù)的普及程度(Popularity)、在網(wǎng)頁(yè)上的分布程度(Richness)等。11.4多媒體數(shù)據(jù)的挖掘分析MMMiner多媒體挖掘模型11.4多媒體數(shù)據(jù)的挖掘分析MMMiner多媒體挖掘模型主要包括3個(gè)模塊,即特征化處理、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)和分類(lèi)。目錄CONTENTS1234復(fù)雜數(shù)據(jù)挖掘概述多媒體數(shù)據(jù)的存儲(chǔ)空間數(shù)據(jù)庫(kù)挖掘多媒體數(shù)據(jù)標(biāo)引與檢索多媒體數(shù)據(jù)的挖掘分析511.5空間數(shù)據(jù)庫(kù)挖掘11.5空間數(shù)據(jù)庫(kù)挖掘農(nóng)業(yè)數(shù)據(jù)衛(wèi)星數(shù)據(jù)……數(shù)據(jù)提煉數(shù)據(jù)轉(zhuǎn)換元數(shù)據(jù)處理……空間數(shù)據(jù)庫(kù)統(tǒng)計(jì)分類(lèi)聚類(lèi)規(guī)則發(fā)現(xiàn)……氣象預(yù)測(cè)軍事決策……空間數(shù)據(jù)挖掘過(guò)程11.5空間數(shù)據(jù)庫(kù)挖掘空間數(shù)據(jù)挖掘的幾種方式空間關(guān)聯(lián)規(guī)則空間對(duì)象分類(lèi)空間對(duì)象聚類(lèi)11.5空間數(shù)據(jù)庫(kù)挖掘空間關(guān)聯(lián)規(guī)則空間關(guān)聯(lián)規(guī)則樣式其中P、Q是和空間信息有關(guān)的屬性、空間謂詞等,且其中至少有一項(xiàng)為空間謂詞。所謂空間謂詞包括拓?fù)潢P(guān)系(Intersects,Overlap,disjoint等)、方位關(guān)系(Lefe-of,West-of等)、距離信息(Close-to,far-away等)。如:

11.5空間數(shù)據(jù)庫(kù)挖掘空間對(duì)象分類(lèi)

空間數(shù)據(jù)分類(lèi)的目標(biāo)是為了發(fā)現(xiàn)空間分類(lèi)模式,與普通對(duì)象不同的是,空間對(duì)象不僅包含描述性的非空間屬性信息,同時(shí)還包含對(duì)象之間的空間關(guān)聯(lián)信息,如拓?fù)潢P(guān)系,距離關(guān)系以及方位關(guān)系等。因此,在空間分類(lèi)中用于標(biāo)志空間對(duì)象類(lèi)的類(lèi)標(biāo)簽屬性主要有以下四類(lèi):對(duì)象的非空間屬性;具有非空間值的空間相關(guān)屬性;空間謂詞;空間函數(shù),空間函數(shù)是空間謂詞的組合

11.5空間數(shù)據(jù)庫(kù)挖掘

街區(qū)編號(hào)人口平均收入犯罪率發(fā)生數(shù)A5000255050B4500500040C5500255045H6000325050I5000455030…………空間對(duì)象分類(lèi)OID高利潤(rùn)空間謂詞1Yclose_to(x,Oak_park),close_to(x,Swan_lake)2Yclose_to(x,Blue_river)3Nclose_to(x,F(xiàn)ir_park),close_to(x,Blue_river)4N

5Nclose_to(x,Oak_park)OID高利潤(rùn)空間謂詞1Yclose_to(x,park)close_to(x,water)2YClose_to(x,water)3Nclose_to(x,park)close_to(x,water)4N

5NClose_to(x,park)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論