數(shù)據(jù)可視化原理及應(yīng)用 課件 第3、4章 數(shù)據(jù)可視化過程;數(shù)據(jù)可視化方法_第1頁
數(shù)據(jù)可視化原理及應(yīng)用 課件 第3、4章 數(shù)據(jù)可視化過程;數(shù)據(jù)可視化方法_第2頁
數(shù)據(jù)可視化原理及應(yīng)用 課件 第3、4章 數(shù)據(jù)可視化過程;數(shù)據(jù)可視化方法_第3頁
數(shù)據(jù)可視化原理及應(yīng)用 課件 第3、4章 數(shù)據(jù)可視化過程;數(shù)據(jù)可視化方法_第4頁
數(shù)據(jù)可視化原理及應(yīng)用 課件 第3、4章 數(shù)據(jù)可視化過程;數(shù)據(jù)可視化方法_第5頁
已閱讀5頁,還剩69頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)可視化原理及應(yīng)用

樊銀亭夏敏捷主編清華大學(xué)出版社第3章數(shù)據(jù)可視化過程3.1數(shù)據(jù)可視化流程3.2數(shù)據(jù)處理和數(shù)據(jù)變換3.3可視化映射3.1數(shù)據(jù)可視化流程數(shù)據(jù)可視化是一個流程,有點(diǎn)像流水線,但這些流水線之間是可以相互作用的、雙向的。可視化流程以數(shù)據(jù)流為主線,其主要包括數(shù)據(jù)采集、數(shù)據(jù)處理和變換、可視化映射、用戶感知這些模塊。圖3-1列出一個數(shù)據(jù)可視化流程。3.2數(shù)據(jù)處理和數(shù)據(jù)變換當(dāng)今現(xiàn)實(shí)世界的數(shù)據(jù)庫極易受噪聲、缺失值和不一致數(shù)據(jù)的侵?jǐn)_,有大量數(shù)據(jù)預(yù)處理技術(shù)。數(shù)據(jù)清理可以清除數(shù)據(jù)中的噪聲,糾正不一致。數(shù)據(jù)集成將數(shù)據(jù)由多個數(shù)據(jù)源合并成一致的數(shù)據(jù)存儲,如數(shù)據(jù)倉庫。數(shù)據(jù)歸約可以通過如聚集、刪除冗余特征或聚類來降低數(shù)據(jù)的規(guī)模。數(shù)據(jù)變換(例如規(guī)范化)可以用來把數(shù)據(jù)壓縮到較小的區(qū)間,如0.0到1.0。這可以提高涉及距離度量的挖掘算法的精確率和效率。這些技術(shù)不是相互排斥的,可以一起使用。例如,數(shù)據(jù)清理可能涉及糾正錯誤數(shù)據(jù)的變換,如通過把一個數(shù)據(jù)字段的所有項都變換成公共格式進(jìn)行數(shù)據(jù)清理。數(shù)據(jù)如果能滿足其應(yīng)用要求,那么它是高質(zhì)量的。數(shù)據(jù)質(zhì)量涉及許多因素,包括準(zhǔn)確性、完整性、一致性、時效性、可信性和可解釋性。數(shù)據(jù)處理和數(shù)據(jù)變換主要步驟:數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換與數(shù)據(jù)離散化以及數(shù)據(jù)配準(zhǔn)。3.2.1數(shù)據(jù)清理現(xiàn)實(shí)世界的數(shù)據(jù)一般是不完整的、有噪聲的和不一致的。數(shù)據(jù)清理試圖填充缺失的值,光滑噪聲和識別或刪除離群點(diǎn),并糾正數(shù)據(jù)中的不一致來“清理”數(shù)據(jù)。1.缺失值2.噪聲數(shù)據(jù)與離群點(diǎn)3.2.1數(shù)據(jù)清理給定一個數(shù)值屬性,可以采用下面的數(shù)據(jù)光滑技術(shù)“光滑”數(shù)據(jù),去掉噪聲。(1)分箱3.2.1數(shù)據(jù)清理(2)回歸回歸(regression)用一個函數(shù)擬合數(shù)據(jù)來光滑數(shù)據(jù)。線性回歸涉及找出擬合兩個屬性(或變量)的“最佳”直線,使得一個屬性能夠預(yù)測另一個。圖3-4即對數(shù)據(jù)進(jìn)行線性回歸擬合。此圖中已知10個點(diǎn),此時獲得信息將在橫坐標(biāo)7的位置出現(xiàn)一個新的點(diǎn),卻不知道縱坐標(biāo)。請預(yù)測最有可能的縱坐標(biāo)值。這是典型的預(yù)測問題,可以通過回歸來實(shí)現(xiàn)。預(yù)測結(jié)果如圖3-4所示,預(yù)測點(diǎn)采用菱形標(biāo)出。3.2.1數(shù)據(jù)清理離群點(diǎn)分析可以通過如聚類來檢測離群點(diǎn)。聚類將類似的值組織成群或“簇”。直觀地,落在簇集合之外的值被視為離群點(diǎn)。3.2.1數(shù)據(jù)清理3.不一致數(shù)據(jù)對于有些事務(wù),所記錄的數(shù)據(jù)可能存在不一致。有些數(shù)據(jù)不一致可以根據(jù)其它材料上信息人工地加以更正。例如,數(shù)據(jù)輸入時的錯誤可以使用紙上的記錄加以更正。也可以用糾正不一致數(shù)據(jù)的程序工具來檢測違反限制的數(shù)據(jù)。例如知道屬性間的函數(shù)依賴,可以查找違反函數(shù)依賴的值。3.2.2數(shù)據(jù)集成上述數(shù)據(jù)清理方法一般應(yīng)用于同一數(shù)據(jù)源的不同數(shù)據(jù)記錄上。在實(shí)際應(yīng)用中,經(jīng)常會遇到來自不同數(shù)據(jù)源的同類數(shù)據(jù),且在用于分析之前需要進(jìn)行合并操作。實(shí)施這種合并操作的步驟稱數(shù)據(jù)集成。有效的數(shù)據(jù)集成過程有助于減少合并后的數(shù)據(jù)沖突,降低數(shù)據(jù)冗余程度等。數(shù)據(jù)集成需要解決的問題有:(1)屬性匹配(2)冗余去除(3)數(shù)據(jù)沖突檢測與處理3.2.3數(shù)據(jù)變換與數(shù)據(jù)離散化在數(shù)據(jù)處理階段,數(shù)據(jù)被變換或統(tǒng)一,使得數(shù)據(jù)可視化分析更有效,挖掘的模式可能更容易理解。數(shù)據(jù)離散化是一種數(shù)據(jù)變換形式。1.?dāng)?shù)據(jù)變換策略概述數(shù)據(jù)變換策略包括如下幾種:(1)光滑:去掉數(shù)據(jù)中的噪音。這種技術(shù)包括分箱、聚類和回歸。(2)屬性構(gòu)造(或特征構(gòu)造):可以由給定的屬性構(gòu)造新的屬性并添加到屬性集中,以幫助挖掘過程。(3)聚集:對數(shù)據(jù)進(jìn)行匯總和聚集。例如,可以聚集日銷售數(shù)據(jù),計算月和年銷售量。通常這一步用來為多個抽象層的數(shù)據(jù)分析構(gòu)造數(shù)據(jù)立方體。(4)規(guī)范化:把屬性數(shù)據(jù)按比例縮放,使之落入一個特定的小區(qū)間,如-1.0到1.0或0.0到1.0。(5)離散化:數(shù)值屬性(例如,年齡)的原始值用區(qū)間標(biāo)簽(例如0到10,11到20等)或概念標(biāo)簽(例如,youth,adult,senior)替換。這些標(biāo)簽可以遞歸地組織成更高層概念,導(dǎo)致數(shù)值屬性的概念分層。(6)由標(biāo)稱數(shù)據(jù)產(chǎn)生概念分層:屬性如street,可以泛化到較高的概念層,如city或country。3.2.3數(shù)據(jù)變換與數(shù)據(jù)離散化2.通過規(guī)范化變換數(shù)據(jù)規(guī)范化數(shù)據(jù)可賦予所有屬性相等的權(quán)重。有許多數(shù)據(jù)規(guī)范化的方法,常用的是最小-最大規(guī)范化、z-score規(guī)范化和小數(shù)定標(biāo)規(guī)范化。3.2.3數(shù)據(jù)變換與數(shù)據(jù)離散化3.通過分箱離散化分箱是一種基于指定的箱個數(shù)的自頂向下的分裂技術(shù)。前面光滑噪聲時已經(jīng)介紹。分箱并不使用分類信息,因此是一種非監(jiān)督的離散化技術(shù)。它對用戶指定的箱個數(shù)很敏感,也容易受離群點(diǎn)的影響。4.通過直方圖分析離散化像分箱一樣,直方圖分析也是一種非監(jiān)督離散化技術(shù),因為它也不使用分類信息。直方圖把屬性A的值劃分成不相交的區(qū)間,稱作桶或箱。桶安放在水平軸上,而桶的高度(和面積)是該桶所代表值的出現(xiàn)頻率。通常,桶表示給定屬性的一個連續(xù)區(qū)間。3.2.3數(shù)據(jù)變換與數(shù)據(jù)離散化5.通過聚類、決策樹離散化聚類分析是一種流行的離散化方法。通過將屬性A的值劃分成簇或組,聚類算法可以用來離散化數(shù)值屬性A。聚類考慮A的分布以及數(shù)據(jù)點(diǎn)的鄰近性,因此可以產(chǎn)生高質(zhì)量的離散化結(jié)果。為分類生成決策樹的技術(shù)可以用來離散化。這類技術(shù)使用自頂向下劃分方法。離散化的決策樹方法是監(jiān)督的,因為它使用分類標(biāo)號。其主要思想是選擇劃分點(diǎn)使得一個給定的結(jié)果分區(qū)包含盡可能多的同類記錄。6.標(biāo)稱數(shù)據(jù)的概念分層產(chǎn)生概念分層可以用來把數(shù)據(jù)變換到多個粒度值。例如由用戶或?qū)<以谀J郊夛@式地說明屬性的部分序或全序,可以很容易地定義概念分層。例如,關(guān)系數(shù)據(jù)庫或數(shù)據(jù)倉庫的維location可能包含如下一組屬性:street,city,province_or_state和country??梢栽谀J郊壵f明一個全序,如street<city<province_or_state<country,來定義分層結(jié)構(gòu)。使用概念分層變換數(shù)據(jù)使得較高層的知識模式可以被發(fā)現(xiàn)。3.2.4數(shù)據(jù)配準(zhǔn)數(shù)據(jù)可視化往往需要在同一空間中顯示不同時間、不同角度、不同儀器或模擬算法產(chǎn)生的數(shù)據(jù)。例如醫(yī)生在觀察病人的醫(yī)學(xué)圖像時會比較當(dāng)前的圖像和該病人以前掃描的圖像或健康人的圖像,觀察其異同。氣象專家在觀察氣象數(shù)據(jù)時會比較模擬算法產(chǎn)生的結(jié)果、氣象臺觀測數(shù)據(jù)以及衛(wèi)星圖片等。這種不同數(shù)據(jù)之間的比較需要在同一空間中配準(zhǔn)。圖3-7示意數(shù)據(jù)配準(zhǔn)過程。不同尺寸、方向的數(shù)據(jù)通過配準(zhǔn)統(tǒng)一取目標(biāo)數(shù)據(jù)的尺寸和方向。配準(zhǔn)后數(shù)據(jù)更便于比較和發(fā)現(xiàn)細(xì)微的不同點(diǎn)。圖3-7數(shù)據(jù)配準(zhǔn)3.3可視化映射根據(jù)人類視覺特點(diǎn)將數(shù)據(jù)信息映射成可視化元素,這里引入一個概念——可視化映射(可視化編碼visualencoding),可視化映射是數(shù)據(jù)可視化的核心步驟,指將數(shù)據(jù)信息映射成可視化元素。映射結(jié)果通常具有表達(dá)直觀、易于理解和記憶等特性。數(shù)據(jù)對象由屬性描述,例如學(xué)生成績數(shù)據(jù)中,學(xué)生數(shù)據(jù)對象由學(xué)號、姓名、成績等屬性組成,“學(xué)號”屬性取值為數(shù)字串,“姓名”屬性取值為字符串,“成績”屬性取值為數(shù)字。屬性和它的值對應(yīng)可視化元素分別是圖形標(biāo)記和視覺通道。3.3可視化映射3.3.1圖形標(biāo)記和視覺通道可視化映射(可視化編碼)是信息可視化的核心內(nèi)容。數(shù)據(jù)通常有屬性和它的值,因此可視化編碼類似地由兩方面組成:圖形標(biāo)記和視覺通道。標(biāo)記通常是一些幾何圖形元素如點(diǎn)、線、面等(如圖3-8)。視覺通道用于控制標(biāo)記的視覺特征。3.3可視化映射3.可視化表達(dá)常用的視覺通道第二章已經(jīng)介紹了可視化視覺通道。視覺通道用于控制標(biāo)記的視覺特征,通??捎玫囊曈X通道包括位置、大小、形狀、方向、色調(diào)、飽和度、亮度等(見第2章圖2-14)。例如,對于柱狀圖(圖3-10a)而言,圖形標(biāo)記就是矩形,視覺通道就是矩形的顏色、高度或?qū)挾鹊?。對于散點(diǎn)圖(圖3-10b)而言,圖形標(biāo)記就是點(diǎn),視覺通道就是豎直位置和水平位置,這樣達(dá)到數(shù)據(jù)編碼的目的。圖形標(biāo)記的自由度與數(shù)據(jù)能夠映射到圖形的視覺通道數(shù)量相關(guān)。3.3.2可視化編碼的選擇圖形標(biāo)記的選擇通?;谌藗儗τ谑挛锢斫獾闹庇X。然而,不同的視覺通道在表達(dá)信息的作用和能力上可能具有截然不同的特性??梢暬O(shè)計人員必須了解和掌握每個視覺通道的特性以及它們可能存在的相互影響,圖3-11給出視覺通道在數(shù)值型數(shù)據(jù)可視化編碼的優(yōu)先級。3.3.2可視化編碼的選擇圖3-12顯示視覺通道這種可視化元素對數(shù)值型數(shù)據(jù)、有序型數(shù)據(jù)和類別型數(shù)據(jù)的有效性排序。不同視覺通道元素在這三種數(shù)據(jù)中的排序不一樣,又有一定的聯(lián)系。例如,標(biāo)記的位置是最準(zhǔn)確反映各種類型數(shù)據(jù)的可視化元素。顏色對數(shù)值型數(shù)據(jù)的映射效果不佳,卻能很好地反映類別型數(shù)據(jù)甚至有序型數(shù)據(jù)。而長度、角度和方向等元素對數(shù)值型數(shù)據(jù)有很好的效果,卻不能很好地反映有序型數(shù)據(jù)和類別型數(shù)據(jù)。3.3.3源于統(tǒng)計圖表的可視化統(tǒng)計圖表是使用最早的可視化圖形,在數(shù)百年的進(jìn)化過程中,逐漸形成了基本“套路”,符合人類感知和認(rèn)知,進(jìn)而被廣泛接受。常見于各種統(tǒng)計分析報告的有柱狀圖、折線圖、餅圖、散點(diǎn)圖、氣泡圖、雷達(dá)圖,在可視化設(shè)計中我們將常見的圖形標(biāo)記定義成圖表類型。1.柱狀圖柱狀圖(BarChart)是最常見的圖表,也最容易解讀。3.3.3源于統(tǒng)計圖表的可視化2.折線圖折線圖(LineChart)是用直線段將各數(shù)據(jù)點(diǎn)連接起來而組成的圖形,以折線方式顯示數(shù)據(jù)的變化趨勢和對比關(guān)系。折線圖可以顯示隨時間而變化的連續(xù)數(shù)據(jù),因此非常適用于顯示在相等時間間隔下數(shù)據(jù)的趨勢。折線圖適合二維的大數(shù)據(jù)集,尤其是適合研究趨勢的場合。它還適合多個二維數(shù)據(jù)集的比較。圖3-14是一個二維數(shù)據(jù)集(月銷售額)的折線圖。3.3.3源于統(tǒng)計圖表的可視化3.餅圖餅圖(PieChart)是用扇形面積,也就是圓心角的度數(shù)來表示數(shù)量。餅圖可以根據(jù)圓中各個扇形面積的大小,來判斷某一部分在總體中所占比例的多少。餅圖是一種應(yīng)該避免使用的圖表,因為肉眼對面積大小不敏感。3.3.3源于統(tǒng)計圖表的可視化4.散點(diǎn)圖散點(diǎn)圖(ScatterChart)表示因變量隨自變量而變化的大致趨勢,據(jù)此可以選擇合適的函數(shù)對數(shù)據(jù)點(diǎn)進(jìn)行擬合。散點(diǎn)圖通常用于顯示和比較數(shù)值,如科學(xué)數(shù)據(jù)、統(tǒng)計數(shù)據(jù)和工程數(shù)據(jù)。當(dāng)不考慮時間的情況而比較大量數(shù)據(jù)點(diǎn)時,散點(diǎn)圖就是最好的選擇。散點(diǎn)圖中包含的數(shù)據(jù)越多,比較的效果就越好。在默認(rèn)情況下,散點(diǎn)圖以圓點(diǎn)顯示數(shù)據(jù)點(diǎn)。如果在散點(diǎn)圖中有多個序列,可考慮將每個點(diǎn)的標(biāo)記形狀更改為方形、三角形、菱形或其地形狀。散點(diǎn)圖適用于兩維比較。3.3.3源于統(tǒng)計圖表的可視化4.氣泡圖氣泡圖(BubbleChart)是散點(diǎn)圖的一種變體,通過每個點(diǎn)的面積大小,反映第三維。圖3-17是卡特里娜颶風(fēng)的路徑,三個維度分別為經(jīng)度、緯度、強(qiáng)度。點(diǎn)的面積越大,就代表強(qiáng)度越大。因為用戶不善于判斷面積大小,所以氣泡圖只適用不要求精確辨識第三維的場合。3.3.3源于統(tǒng)計圖表的可視化5.雷達(dá)圖雷達(dá)圖(RadarChart)它將多個維度的數(shù)據(jù)量映射到坐標(biāo)軸上,這些坐標(biāo)軸起始于同一個圓心點(diǎn),通常結(jié)束于圓周邊緣,將同一組的點(diǎn)使用線連接起來就稱為了雷達(dá)圖。雷達(dá)圖適用于多維數(shù)據(jù)(四維以上),且每個維度必須可以排序。但是,它有一個局限,就是數(shù)據(jù)點(diǎn)最多6個,否則無法辨別,因此適用場合有限。需要注意的時候,用戶不熟悉雷達(dá)圖,解讀有困難。使用時盡量加上說明,減輕解讀負(fù)擔(dān)。3.3.3源于統(tǒng)計圖表的可視化6.直方圖直方圖(Histogram)又稱質(zhì)量分布圖,是一種統(tǒng)計報告圖,也是數(shù)據(jù)屬性頻率的統(tǒng)計工具。直方圖由一系列高度不等的縱向條紋或線段表示數(shù)據(jù)分布的情況,一般用橫軸表示數(shù)據(jù)類型,縱軸表示分布情況。例如某次考試成績分布對應(yīng)直方圖如圖3-19所示。3.3.3源于統(tǒng)計圖表的可視化除了常用的圖表之外,可供我們選擇的還有:漏斗圖:漏斗圖適用于業(yè)務(wù)流程比較規(guī)范、周期長、環(huán)節(jié)多的流程分析,通過漏斗各環(huán)節(jié)業(yè)務(wù)數(shù)據(jù)的比較,能夠直觀地發(fā)現(xiàn)和說明問題所在。(矩形)樹圖:一種有效的實(shí)現(xiàn)層次結(jié)構(gòu)可視化的圖表結(jié)構(gòu),適用于表示類似文件目錄結(jié)構(gòu)的數(shù)據(jù)集。熱力圖:以特殊高亮的形式顯示訪客熱衷的頁面區(qū)域和訪客所在的地理區(qū)域的圖示,用于顯示人或物品的相對密度。關(guān)系圖:基于3D空間中的點(diǎn)—線組合,再加以顏色、粗細(xì)等維度的修飾,適用于表征各節(jié)點(diǎn)之間的關(guān)系。詞云:各種關(guān)鍵詞的集合,往往以字體的大小或顏色代表對應(yīng)詞的頻次。?;鶊D:一種有一定寬度的曲線集合表示的圖表,適用于展現(xiàn)分類維度間的相關(guān)性,以流的形式呈現(xiàn)共享同一類別的元素數(shù)量,比如展示特定群體的人數(shù)分布等。日歷圖:顧名思義,以日歷為基本維度的對單元格加以修飾的圖表。

數(shù)據(jù)可視化原理及應(yīng)用

樊銀亭夏敏捷主編清華大學(xué)出版社第4章數(shù)據(jù)可視化方法4.1標(biāo)量數(shù)據(jù)可視化方法4.2三維標(biāo)量數(shù)據(jù)可視化方法4.3向量場可視化方法4.4時間序列數(shù)據(jù)可視化方法4.5地理空間數(shù)據(jù)可視化4.6文本與文檔可視化4.1標(biāo)量數(shù)據(jù)可視化方法所謂標(biāo)量(Scalar),是指只有大小而沒有方向的量,比如長度、質(zhì)量等。標(biāo)量場可視化是指通過圖形的方式揭示標(biāo)量場(ScalarField)中數(shù)據(jù)對象空間分布的內(nèi)在關(guān)系。由于很多科學(xué)測量或者模擬數(shù)據(jù)都是以標(biāo)量場的形式出現(xiàn),對標(biāo)量場的可視化是科學(xué)可視化研究的核心課題之一。標(biāo)量場的空間中每一點(diǎn)的屬性都可以由一個單一數(shù)值(標(biāo)量)來表示。常見的標(biāo)量場包括溫度場,壓力場,勢場等。標(biāo)量場既可以是一維、二維,也可以是三維數(shù)據(jù)場。三維標(biāo)量場也常被稱為體數(shù)據(jù)。體數(shù)據(jù)中的單元稱為體素(Voxel),對應(yīng)于二維圖像的像素。每個體素的數(shù)值對應(yīng)于在三維空間中的網(wǎng)格格點(diǎn)上采樣的數(shù)值。最常見的二維標(biāo)量場可視化方法包括顏色映射法,等值線法、高度映射法以及標(biāo)記法。4.1.1顏色映射法顏色映射常用于二維標(biāo)量數(shù)據(jù)可視化。二維標(biāo)量數(shù)據(jù)比一維數(shù)據(jù)更為常見,如用于醫(yī)學(xué)診斷的X光片,實(shí)測的地球表面溫度、遙感觀測的衛(wèi)星影像等。顏色映射是一系列顏色,它們從起始顏色漸變到結(jié)束顏色,在可視化中,顏色映射用于突出數(shù)據(jù)的規(guī)律,例如你可能用較淺的顏色來顯示較小的值,并使用較深的顏色來顯示較大的值。圖4-1中使用顏色代表交通事故每天(在每小時)的發(fā)生數(shù)量,深色代表交通事故越多。4.1.2等值線法等值線中的點(diǎn)(xi,yi)滿足條件F(xi,yi)=Fi(Fi為一給定值),將這些點(diǎn)按一定順序連接組成了函數(shù)F(x,y)的值為Fi的等值線。常見的等值線如等高線、等溫線,是以一定的高度、溫度作為度量的。等值線的抽取算法可分為兩類,網(wǎng)格序列法和網(wǎng)格無關(guān)法。4.1.2等值線法網(wǎng)格序列法的基本思想是按網(wǎng)格單元的排列順序,逐個處理每一個單元,尋找每一個單元內(nèi)相應(yīng)的等值線段。處理完所有單元后,自然就生成了該網(wǎng)格中的等值線分布。網(wǎng)格無關(guān)法則通過給定等值線的起始點(diǎn),利用起始點(diǎn)附近的局部幾何性質(zhì),計算等值線的下一點(diǎn),然后利用計算出的新點(diǎn),重復(fù)計算下一點(diǎn),直至達(dá)到邊界區(qū)域或回到原始起始點(diǎn)。4.1.3高度映射法高度映射法(立體圖法)則是根據(jù)二維標(biāo)量場數(shù)值的大小,將表面的高度在原幾何面的法線方向做相應(yīng)的提升。這樣表面的高低起伏對應(yīng)與二維標(biāo)量場數(shù)值的大小和變化。圖4-4呈現(xiàn)了美國人口密度分布圖,將人口密度以高度的形式表現(xiàn),越高的地方人口密度越大。4.1.4標(biāo)記法

可視化二維標(biāo)量數(shù)據(jù)的常用方法還有標(biāo)記法。標(biāo)記是離散的可視化元素,可采用標(biāo)記的顏色、大小和形狀等直接進(jìn)行可視表達(dá),向不需要對數(shù)據(jù)進(jìn)行插值等操作。如果標(biāo)記布局稀疏,還可以設(shè)計背景圖形顯示其他數(shù)據(jù),并將標(biāo)記和背景疊加在一個場景中,達(dá)到多變量可視化的目的。圖4-5顯示了對于二維標(biāo)量場數(shù)據(jù)的兩種標(biāo)記法實(shí)例。4.2三維標(biāo)量數(shù)據(jù)可視化方法三維標(biāo)量場也被稱為三維體數(shù)據(jù)場(VolumetricField),三維標(biāo)量場與二維數(shù)據(jù)場不同,它是對三維空間中的采樣,表示了一個三維空間內(nèi)部的詳細(xì)信息,這類數(shù)據(jù)場最典型的醫(yī)學(xué)CT采樣數(shù)據(jù),每個CT的照片實(shí)際上是一個二維數(shù)據(jù)場,照片的灰度表示了某一片物體的密度。將這些照片按一定的順序排列起來,就組成了一個三維數(shù)據(jù)場。此外,用大規(guī)模計算機(jī)計算的航天飛機(jī)周圍的密度分布,也是一個三維標(biāo)量場的例子。三維標(biāo)量場其主要可視化方法包括直接體繪制和等值面的提取與繪制。4.2.1直接體繪制體繪制(VolumeRendering)的目的就在于提供一種基于體素的繪制技術(shù),它有別于傳統(tǒng)的基于面的繪制技術(shù),能顯示出對象體豐富的內(nèi)部細(xì)節(jié)。體繪制直接研究光線穿過三維體數(shù)據(jù)場時的變化,得到最終的繪制結(jié)果,所以體繪制也被稱為直接體繪制。從結(jié)果圖像質(zhì)量上講,體繪制優(yōu)于面繪制,但從交互性能和算法效率上講,至少在目前的硬件平臺上,面繪制優(yōu)于體繪制,這是因為面繪制采用的是傳統(tǒng)的圖形學(xué)繪制算法,現(xiàn)有的交互算法與圖形硬件和圖形加速技術(shù)能充分發(fā)揮作用。4.2.1直接體繪制體繪制方法提供二維結(jié)果圖像的生成方法。根據(jù)不同的繪制次序,體繪制方法主要分為兩類:以圖像空間為序的體繪制方法和以物體空間為序的體繪制方法。4.2.1直接體繪制體繪制方法提供二維結(jié)果圖像的生成方法。根據(jù)不同的繪制次序,體繪制方法主要分為兩類:以圖像空間為序的體繪制方法和以物體空間為序的體繪制方法。4.2.1直接體繪制以圖像空間為序的體繪制方法(光線投射方法)是從屏幕上每一像素點(diǎn)出發(fā),根據(jù)視點(diǎn)方向,發(fā)射出一條射線,這條射線穿過三維數(shù)據(jù)場,沿射線進(jìn)行等距采樣,求出采樣點(diǎn)處物體的不透明度和顏色值??砂从汕暗胶蠡蛴珊蟮角暗膬煞N順序,將一條光線上的采樣點(diǎn)的顏色和不透明度進(jìn)行合成,從而計算出屏幕上該像素點(diǎn)的顏色值。這種方法是從反方向模擬光線穿過物體的過程。

4.2.1直接體繪制以物體空間為序的體繪制方法(投影體繪制方法)首先根據(jù)每個數(shù)據(jù)點(diǎn)的函數(shù)值計算該點(diǎn)的顏色及不透明度,然后根據(jù)給定的視平面和觀察方向,將每個數(shù)據(jù)點(diǎn)投影到圖像平面上,并按數(shù)據(jù)點(diǎn)在空間中的先后遮擋順序,合成計算不透明度和顏色,最后得到圖像。投影體繪制方法的主要步驟如下:確定數(shù)據(jù)場中體元的前后遮擋次序,以從前到后或從后到前的順序遍歷體元。每個體元分解為一組子體元,要求子體元的投影輪廓在觀察平面上互不重疊。子體元向圖像平面投影,得到投影多邊形;計算投影多邊形頂點(diǎn)的值,以掃描轉(zhuǎn)換的方式計算出投影多邊形對所覆蓋像素的光亮度貢獻(xiàn),并與像素原值合成顯示像素。4.2.1直接體繪制直接體繪制通過顏色映射,可以直接將三維標(biāo)量場投影為二維圖像。這種算法并不構(gòu)作中間幾何圖元,而是由離散的三維數(shù)據(jù)場直接產(chǎn)生屏幕上的二維圖像。選擇三維標(biāo)量場的顏色映射方案就是對體數(shù)據(jù)的直接體繪制設(shè)計傳遞函數(shù)的問題。如何設(shè)計合理的傳遞函數(shù)一直是可視化研究中的重要課題。4.2.2等值面方法等值面方法是一種使用廣泛的三位標(biāo)量場數(shù)據(jù)可視化方法,他利用等值面提取技術(shù)獲取數(shù)據(jù)中的層面信息,直觀的展示數(shù)據(jù)中的形狀和拓?fù)湫畔ⅰ5戎得胬L制先提取顯式的幾何表達(dá)(等值面、等值線、特征線等),再用曲面繪制方法進(jìn)行可視化,可以更好地表示特定曲面的特征和信息。但是與直接體繪制方法相比,丟失了指定等值面以外的數(shù)據(jù)場信息。另一方面,直接體繪制雖然顯示了包括全部三維數(shù)據(jù)場的信息,但是由于數(shù)據(jù)之間的遮擋以及體繪制中的合成計算,特征之間可能發(fā)生干擾。如何通過選擇合理的傳遞函數(shù),使得體數(shù)據(jù)可視化最佳地揭示內(nèi)在特征是一個很大的挑戰(zhàn)。此外,三維標(biāo)量場還可以通過設(shè)立切面(Slicing)的方式對特定平面的信息可視化,這種方法在醫(yī)學(xué)成像數(shù)據(jù)方面使用較多。圖4-7展示了對三維CT圖像數(shù)據(jù)的直接體和等值面繪制的可視化效果圖。4.2.2等值面方法4.3向量場可視化方法所謂向量(Vector),也叫矢量,是既有大小也有方向的量,如力、速度等。假如一個空間中的每一個點(diǎn)的屬性都可以以一個向量來代表的話,那么這個場就是一個向量場。向量場同標(biāo)量場一樣,也分為二維、三維等,但向量場中每個采樣點(diǎn)的數(shù)據(jù)不是溫度、壓力、密度等標(biāo)量,而是速度等向量。向量場可視化技術(shù)的難點(diǎn)是很難找出在三維空間中表示向量的方法。4.3.1向量簡化為標(biāo)量向量簡化為標(biāo)量不是直接對向量進(jìn)行可視化處理,而是將向量轉(zhuǎn)換為能夠反映其物理本質(zhì)的標(biāo)量數(shù)據(jù),然后對標(biāo)量數(shù)據(jù)可視化。例如,向量的大小、單位體積中粒子的密度等。這些標(biāo)量的可視化可采用常規(guī)的可視化技術(shù):等值面抽取和體繪制等。4.3.2箭頭表示方法向量最直接的方法是在向量場中有限的離散點(diǎn)上顯示帶有箭頭的有向線段,用線段的長度表示向量的大小,用箭頭表示其方向。這種方法適用于二維向量場,如圖4-8所示。對于二維平面上的三維向量,也可用箭頭來表示,箭頭可指向顯示表面或由顯示表面指出。4.3.3流線、跡線、脈線、時線流線是某一確定瞬時流場中的空間曲線族,每一條曲線上每一點(diǎn)的切線方向,都和該瞬時通過該點(diǎn)的流體速度方向相同。跡線(PathLine)是特定流體質(zhì)點(diǎn)隨時間改變位置而形成的軌跡,及一個粒子的運(yùn)動軌跡。脈線(StreakLine)是在某一時間間隔內(nèi)相繼經(jīng)過空間一固定點(diǎn)的流體質(zhì)點(diǎn)依次串連起來而成的曲線。在觀察流場流動時,可以從流場的某一特定點(diǎn)不斷向流體內(nèi)輸入顏色液體(或煙霧),這些液體(或煙霧)質(zhì)點(diǎn)在流場中構(gòu)成的曲線即為脈線。對定常流場,脈線就是跡線(跡線是一個粒子的運(yùn)動軌跡),同時也就是流線;但對非定常場,三者各不相同。脈線是一系列連續(xù)釋放的粒子組成的線,煙筒中冒出的煙霧是典型的脈線的例子。時線(TimeLine)是由一系列相鄰流體質(zhì)點(diǎn)在不同瞬時組成的曲線。某一時刻沿一垂直于流動方向的直線同時釋放許多小粒子,這些粒子在不同時刻組成的線就是時線。4.4時間序列數(shù)據(jù)可視化方法4.4時間序列數(shù)據(jù)可視化方法稀疏的散點(diǎn)圖用線連接的稀疏散點(diǎn)圖4.4時間序列數(shù)據(jù)可視化方法時間序列數(shù)據(jù)和分類數(shù)據(jù)一樣,條形圖一直以來都是觀察數(shù)據(jù)最直觀的方式,只是坐標(biāo)軸上不再用分類,而是用時間序列數(shù)據(jù)。條形圖通常對于離散的時間點(diǎn)很有用。條形圖看起來像是一個連續(xù)的整體,然而不容易區(qū)分變化,當(dāng)用連續(xù)的線時,會更容易看到坡度。折線圖以相同的標(biāo)尺顯示了與條形圖一樣的數(shù)據(jù),但通過方向這一視覺通道直接展現(xiàn)出了變化,使變化趨勢更加明顯。同樣,也可以用散點(diǎn)圖,散點(diǎn)圖的數(shù)據(jù)、坐標(biāo)軸和條形圖一樣,但視覺通道不同。散點(diǎn)圖為重點(diǎn)在每個數(shù)值上,趨勢不是那么明顯。如果數(shù)據(jù)量不大,可以用線連接上起來以顯示趨勢。徑向分布圖與折線圖類似,按時間規(guī)律圍繞成一圈。除了以上常用可視化方法還有下面星狀圖、日歷視圖、郵票圖表法描述在時間上規(guī)律性變化。4.4.1星狀圖圖4-10時序數(shù)據(jù)的星狀圖4.4.2日歷視圖4.4.3郵票圖表法當(dāng)數(shù)據(jù)空間本身是二維或三維時,直接將時間映射到顯示空間會造成數(shù)據(jù)在視覺空間中的重疊。一種簡單的方法可以解決這個問題,即郵票圖表法。郵票圖表法指基于某種可視化方法將時間序列數(shù)據(jù)按時間點(diǎn)生成一系列圖表,并在一個視圖空間內(nèi)有序地平鋪展示。圖4-11顯示了1989~2003年間美國各地的技術(shù)公司數(shù)目變化與美國自然災(zāi)害的的比較可視化。4.5地理空間數(shù)據(jù)可視化地圖是地理空間信息的載體,可以承載各種類型的復(fù)雜信息。大部分地理數(shù)據(jù)的空間區(qū)域?qū)傩钥梢栽诘厍虮砻妫ǘS曲面)中表示和呈現(xiàn)。將地理信息數(shù)據(jù)投影到地球表面(二維曲面)的方法稱為地圖投影。4.5.1地圖投影地圖投影是地理空間數(shù)據(jù)可視化基礎(chǔ),它將地球球面映射到平面上,將地球表面上的一個點(diǎn)與平面(即地圖平面)的某個點(diǎn)建立對應(yīng)關(guān)系。即建立之間的數(shù)學(xué)轉(zhuǎn)換公式。地圖投影作為一個不可展平的曲面即地球表面投影到一個平面的方法,保證了空間信息在區(qū)域上的聯(lián)系與完整。這個投影過程將產(chǎn)生投影變形,而且不同的投影方法具有不同性質(zhì)和大小的投影變形。通常有三種投影方法:(1)圓柱投影(cylindricalprojection)

(2)圓錐投影(conicalprojection)

(3)平面投影(planeprojection)三種投影方法4.5.2墨卡托投影墨卡托投影是最常用的圓柱投影之一,并且通常以赤道為切線。經(jīng)線以幾何方式投影到圓柱面上,而緯線以數(shù)學(xué)方式進(jìn)行投影。這種投影方式產(chǎn)生成90度的經(jīng)緯網(wǎng)格。將圓柱沿任意一條經(jīng)線“剪開”可以獲得最終的圓柱投影。經(jīng)線等間距排列,而緯線間的間距越靠近極點(diǎn)越大。此投影是等角投影,并沿直線顯示真實(shí)的方向。在墨卡托投影中,恒向線、等方位角線是直線,但大多數(shù)的大圓都不是直線。墨卡托投影后的地圖如圖4-13所示。4.5.3摩爾威德投影摩爾威德投影(MollweideProjection)是經(jīng)線投影成為橢圓曲線的一種等面積偽圓柱投影。該投影用橢圓表示地球,所有和赤道平行的緯線都被投影成平行的直線,所有的經(jīng)線被平均投影為橢球上的曲線。摩爾威德投影后的地圖如圖4-14所示。該投影常用于繪制世界地圖,近年來國外許多地圖書刊,特別是通俗讀物,很多用此投影制作世界地圖。這主要是由于本投影具有橢球形感、等面積性質(zhì)和緯線為平行于赤道的直線等特點(diǎn),因此適宜于表示具有緯度地帶性的各種自然地理現(xiàn)象的世界分布圖。4.5.4地理空間可視化方法4.5.4地理空間可視化方法地理空間數(shù)據(jù)可視化中常用視覺通道有大?。▓D形標(biāo)記的大小、寬度),形狀(圖形標(biāo)記的形狀),亮度,顏色、方向(某個區(qū)域中圖形標(biāo)記的朝

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論