可視化技術(shù)在情報研究中的應(yīng)用_第1頁
可視化技術(shù)在情報研究中的應(yīng)用_第2頁
可視化技術(shù)在情報研究中的應(yīng)用_第3頁
可視化技術(shù)在情報研究中的應(yīng)用_第4頁
可視化技術(shù)在情報研究中的應(yīng)用_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

可視化技術(shù)在情報研究中的應(yīng)用

1987年,美國國家科學委員會(nationalacademyofinformationsecurity)舉行了一次視覺研討會,首次正式提出了視覺概念,并開始發(fā)展成為一個研究領(lǐng)域??梢暬铋_始應(yīng)用在科學計算中,把科學數(shù)據(jù)以直觀的圖形圖像形式表示,使隨時間和空間變化的物理現(xiàn)象或物理量呈現(xiàn)在研究者面前,讓科學家可以從一個全新的角度對產(chǎn)生的科學數(shù)據(jù)進行觀察分析,彌補了傳統(tǒng)方法的一些缺陷。隨著數(shù)據(jù)倉庫技術(shù)、電子商務(wù)技術(shù)等新技術(shù)的發(fā)展,提出了數(shù)據(jù)可視化的概念,它是可視化技術(shù)在非空間數(shù)據(jù)領(lǐng)域的應(yīng)用,使人們不再局限于通過關(guān)系數(shù)據(jù)表來觀察和分析數(shù)據(jù),而且還能以更直觀的方式看到數(shù)據(jù)及其結(jié)構(gòu)關(guān)系。1989年,R.Card和Mackinlay首次提出了“信息可視化”這個概念。信息可視化是對非空間的、非數(shù)值型的和高維信息進行交互式視覺表現(xiàn)的理論、技術(shù)與方法。其主要的對象是非空間、非數(shù)值的和高維的大數(shù)據(jù)集,其目的是發(fā)現(xiàn)海量信息背后之間的相互關(guān)系以及發(fā)展趨勢,使人們能夠更好地掌握和利用目前正在飛速增長的海量信息。M.J.Eppler和R.A.Burkard于2004年提出知識可視化。知識可視化應(yīng)用視覺表征手段,促進群體知識的傳播和創(chuàng)新。知識可視化的目標在于傳輸見解、經(jīng)驗、態(tài)度、價值觀、期望和預(yù)測等,并以這種方式幫助他人正確地重構(gòu)、記憶和應(yīng)用這些知識。不同領(lǐng)域需要不同的可視化技術(shù)來幫助其進行信息分析,數(shù)學中需要科學計算可視化,空間數(shù)據(jù)、生物數(shù)據(jù)、地理數(shù)據(jù)和醫(yī)學數(shù)據(jù)等需要數(shù)據(jù)可視化的相關(guān)方法與技術(shù),而情報分析等領(lǐng)域則需要信息可視化,因為這些領(lǐng)域的信息一般是矢量,非結(jié)構(gòu)化的,抽象的,現(xiàn)實中不可見的??梢暬夹g(shù)應(yīng)用在情報分析中,可以大大提高情報分析的效果,是情報學領(lǐng)域一個較新的研究熱點。梁戰(zhàn)平指出:第9個基本原理是可視化原理。信息可視化技術(shù)應(yīng)用在情報研究中可以彌補傳統(tǒng)方法的一些缺陷,對信息從一個全新的角度進行觀察分析,發(fā)現(xiàn)以往的方法所不能發(fā)現(xiàn)的隱藏情報,并對其進行分析解釋,得出有價值的結(jié)論得出對決策都有用的情報,從而大大提高情報分析的效率和效果。1情報分析過程一個完整的情報研究過程應(yīng)包括信息搜集、信息組織(整序)、情報分析(抽象)和情報服務(wù)(成果表達)4個過程。下面就從這4個方面來討論信息可視化在情報學中的應(yīng)用。1.1海量信息可視化技術(shù)信息檢索系統(tǒng)有效地引入可視化技術(shù)可以為用戶提供更好的服務(wù)。信息檢索可視化是指把文獻信息、用戶提問、各類情報檢索模型以及利用檢索模型進行信息檢索的過程中不可見的內(nèi)部語義關(guān)系轉(zhuǎn)化成圖形,在一個二維或三維的可視化空間中顯示出來,并向用戶提供信息檢索的技術(shù)。信息檢索所面臨的是海量的大規(guī)模的網(wǎng)絡(luò)HTML文件,多媒體文件,等等,面向網(wǎng)絡(luò)海量信息可視化技術(shù)主要包括:基于分類的可視化技術(shù),網(wǎng)狀結(jié)構(gòu)的可視化技術(shù),層次結(jié)構(gòu)的可視化技術(shù)等。其中雙曲線瀏覽技術(shù)是其中的重要技術(shù)。面向網(wǎng)絡(luò)的特殊類型信息可視化技術(shù)包括:文獻信息可視化技術(shù),網(wǎng)頁超鏈接可視化技術(shù),網(wǎng)站拓撲結(jié)構(gòu)可視化技術(shù),日志信息可視化技術(shù)等??梢暬夹g(shù)在信息檢索中的應(yīng)用已經(jīng)比較廣泛,有很多系統(tǒng)中都應(yīng)用了可視化技術(shù),如Websphinx系統(tǒng)、TouchGraph系統(tǒng)、IBM的CoBrowse等。1.2知識組織工具傳統(tǒng)的信息組織方法中都不同程度地運用了可視化的一些理論與方法,如分類組織法、主題組織法等。像書目目錄、文件樹和網(wǎng)頁中的超鏈接等就是典型的可視化的信息組織。由信息組織發(fā)展而來的知識組織已經(jīng)成為了目前解決“信息爆炸”和“信息迷航”等問題的重要手段,學術(shù)界提出的知識組織工具包括主題地圖(TopicMap)以及本體。目前對主題地圖和本體的可視研究較多,成果也很豐富。本體可視化的發(fā)展已取得了一定的進展,開發(fā)出了一些比較成熟的本體可視化工具,如Protégé和OntoSphere,它們都能提供多種可視化技術(shù)表達本體。主題地圖具有先天的易于可視化的特點,根據(jù)地圖尺寸大小分為兩類:小主題地圖可視化和大主題地圖可視化。目前已經(jīng)有很多針對主題地圖的可視化方法,如樹形可視化、等級可視化以及圖可視化等。1.3文獻計量學中可視化技術(shù)的應(yīng)用傳統(tǒng)的情報研究在信息的科學抽象過程中所采用的有多種定量和定性方法,這些方法在長期的情報研究實踐中已經(jīng)形成了其基本模式和應(yīng)用范圍,這些方法的應(yīng)用與實踐已經(jīng)形成固定的方式,其分析效果也是毋庸置疑的。目前可視化技術(shù)在這些傳統(tǒng)方法中的應(yīng)用不多,其中文獻計量學的方法中有一些可視化技術(shù)的應(yīng)用,但也僅是簡單的為提高其分析效果,其應(yīng)用不深入,也沒有應(yīng)用可視化的最新技術(shù)。數(shù)據(jù)挖掘技術(shù)是情報分析領(lǐng)域的常用的研究方法,把可視化技術(shù)應(yīng)用到數(shù)據(jù)挖掘中,可以大大提高其挖掘的效率和其挖掘出有用信息的可能性。很多數(shù)據(jù)挖掘系統(tǒng)中都集成了可視化插件,如Oracle,SGIMineSet和SPSSClementine等。Xmdvtool系統(tǒng)是其中最典型的代表之一,它把散點圖(Scatterplots)、星狀浮雕(StarGlyphs)、平行坐標(ParallelCoordinates)、高維疊加(DimensionalStacking)和基于像素的方法(Pixel-orientedDisplay)集成到一起,并且實現(xiàn)了很多交互變形的技術(shù)供用戶對數(shù)據(jù)進行操作。1.4可視化技術(shù)情報研究成果可以以文字、表格等形式出現(xiàn)。目前應(yīng)用的最多的是文字形式的研究報告。情報研究成果是情報工作的結(jié)晶,是為用戶服務(wù)情報研究最終產(chǎn)品,因此對情報研究結(jié)果的可視化是情報服務(wù)的最重要的部分。怎樣把情報研究的成果以用戶可理解的、易接受的形式呈現(xiàn)給用戶,是要研究的非常重要的問題。目前情報研究工作的成果主要是以分析報告的形式給出,其中可能附有相關(guān)的圖表等,其可視化程度不高。針對情報分析結(jié)果可視化的研究還不多,實際工作中采用新型的復雜的可視化方法來優(yōu)化情報分析成果的也很少??梢暬夹g(shù)應(yīng)用最多的領(lǐng)域主要有地理信息,氣象信息等,這些領(lǐng)域的研究成果先天具有易于可視化的特征,應(yīng)用可視化技術(shù)優(yōu)化研究結(jié)果是很自然的。但其也僅是應(yīng)用現(xiàn)有的軟件對其成果進行簡單的可視化(如案例3),而沒有進行相關(guān)的深入挖掘。因此,在情報研究應(yīng)以用戶為核心的理念的指導下,情報研究成果可視化的研究是很有意義的。2比較與應(yīng)用的例子2.1建立專利文獻引用關(guān)系網(wǎng)絡(luò)圖2.1.1可視化技術(shù)在專利文獻引入分析中的應(yīng)用(專利文獻引用關(guān)聯(lián)可視化系統(tǒng)的構(gòu)建)1)背景。專利文獻是科技情報研究的基本信息之一。任何專利發(fā)明都是建立在已有的技術(shù)成果上的,所以專利之間存在著互相引用的關(guān)聯(lián)信息。在海量的專利文獻信息中,快速地分析其相互之間的關(guān)聯(lián)關(guān)系,是科技情報人員面臨的一大挑戰(zhàn)。而采用信息可視化技術(shù)有助于情報人員高效快速的進行分析。美國專利數(shù)據(jù)庫(USPTO)提供特有的參考文獻間的引用關(guān)系檢索(CitedReference)功能,本案例的專利數(shù)據(jù)就由此網(wǎng)站的檢索系統(tǒng)得到。2)系統(tǒng)構(gòu)建過程及結(jié)果。具體如下:①獲取美國專利文獻。專利數(shù)據(jù)由該網(wǎng)站得到,并以HTML純文本方式的保存。②解析HTML文本。將文本中的專利編號、公告時間、專利名稱、發(fā)明者姓名、擁有者、美國專利分類號以及被引用的專利信息提取出來。③專利分析信息的數(shù)據(jù)庫存儲。對分析后的專利信息采用關(guān)系型數(shù)據(jù)庫進行存儲。④可視化關(guān)聯(lián)圖的實現(xiàn)。通過使用開源軟件Prefuse開發(fā)包完成可視化關(guān)聯(lián)圖的實現(xiàn)。見圖1。3)討論。本例應(yīng)用圖論的方法,以專利文獻名稱為節(jié)點,以專利文獻間的引用關(guān)系為邊,利用開源軟件Prefuse開發(fā)包建立了專利文獻信息間引用關(guān)系網(wǎng)絡(luò)圖,將專利數(shù)據(jù)間的引用關(guān)系可視化,利于情報分析人員深入挖掘隱藏在專利文獻內(nèi)部的有用信息,提高了情報分析的效果。同時為企業(yè)或?qū)@墨I檢索單位開發(fā)建構(gòu)未來系統(tǒng)時提供了參考。2.1.2基于河流模型的媒體報道比較分析1)背景及過程。本案例中,在沒有設(shè)定研究主題的情況下,收集了2005年11月16日至30日相關(guān)媒體(新華網(wǎng)、新浪網(wǎng)、鳳凰網(wǎng))的滾動報道12000余份。對其利用河流模型與關(guān)聯(lián)分析模型進行分析,利用不同的灰度代表不同的事件,并按照新聞報道的每日統(tǒng)計數(shù)據(jù)來構(gòu)造河流模型。河流模型屬于專題可視化結(jié)構(gòu)樣式,其效果是使用戶不必逐個閱讀文檔,就可以了解某個事件在某個時間段或整個時間區(qū)間內(nèi)的發(fā)展趨勢,以及多個事件在時間維上的對比情況。關(guān)聯(lián)分析模型,由于互聯(lián)網(wǎng)新聞報道中,其報道要素一般都包括地點、實體等要素,因此在原型系統(tǒng)中構(gòu)造關(guān)聯(lián)分析模型,用于發(fā)現(xiàn)新聞報道中地點、實體之間的關(guān)系,并表現(xiàn)出地點、實體之間關(guān)聯(lián)關(guān)系的耦合程度等。2)結(jié)果。其媒體報道重點分析結(jié)果如圖2,從河流模型可以清楚地看出,針對大陸和國際新聞,新華網(wǎng)的報道與另外兩者相比占有絕對的優(yōu)勢,而對于臺港澳新聞的報道則是鳳凰網(wǎng)最多。本案例同時對3家媒體在國際新聞上的關(guān)注重點進行了分析,發(fā)現(xiàn)三者在所關(guān)注的重點國家(地區(qū))方面趨于相同,圖3中的3個圖分別表示3家媒體(同上)關(guān)注的重點國家(地區(qū))關(guān)聯(lián)圖,3個圖均顯示國家(地區(qū))1、3、4、5、6為在此期間3個媒體所關(guān)注的重點國家(地區(qū))。在關(guān)聯(lián)程度方面,國家(地區(qū))1、3、6之間的耦合程度比其他國家(地區(qū))的關(guān)聯(lián)關(guān)系更為緊密,耦合程度更高。3)討論。本案例應(yīng)用河流模型從整體上分析事件隨時間的發(fā)展情況與過程,發(fā)現(xiàn)了總體上的隱含情報。以國家/地區(qū)為節(jié)點,節(jié)點間的耦合關(guān)系以連線表示,構(gòu)造出了關(guān)聯(lián)分析模型,用于發(fā)現(xiàn)新聞報道中地點、實體之間的關(guān)系,并表現(xiàn)出地點、實體之間關(guān)聯(lián)關(guān)系的耦合程度等。同時把節(jié)點按重要程度分級,連線也有粗細之分,情報分析人員可以按等級過濾次要節(jié)點,使得模型圖更加清晰明了,易于分析。這在一定程度上解決了大量信息建模的問題,提高了情報分析的效果。利用兩個可視化模型,發(fā)現(xiàn)傳統(tǒng)方法所難以發(fā)現(xiàn)的情報,在很大程度上提高了情報分析的效果。2.1.3吉林西部生態(tài)環(huán)境研究及質(zhì)量評價及結(jié)果可視化分析1)背景及過程。吉林西部在自然和人為因素的影響下,生態(tài)系統(tǒng)遭到了嚴重破壞,林地和草地減少,沙地、鹽堿地增多,每年鹽堿荒漠化的發(fā)展速率高達1.4%。本案例對該區(qū)生態(tài)與環(huán)境進行質(zhì)量評價,為實現(xiàn)可持續(xù)發(fā)展提供決策依據(jù)。①確定所用評價指標體系。②確定評價模型。本案例采取模糊綜合評價——灰色聚類分析復合模型對吉林西部生態(tài)環(huán)境質(zhì)量進行評價。③結(jié)果及可視化處理。確定出5級評價基準,運用環(huán)境質(zhì)量的多級模糊綜合評判一灰色關(guān)聯(lián)優(yōu)勢分析復合模型對吉林西部各市縣環(huán)境進行評價。同時利用Mapinfo軟件制圖,形成吉林西部各市縣環(huán)境質(zhì)量評價結(jié)果圖,如圖4所示。2)討論。本案例中對吉林省西部生態(tài)環(huán)境的研究及評價均采用了常規(guī)的分析方法,最后對分析結(jié)果用Mapinfo軟件進行了簡單的可視化,使得用戶對研究成果更容易接受和理解。但其所進行的可視化處理過于簡單,沒有進行系統(tǒng)的可視化處理,只是對分析結(jié)果進行了簡單的優(yōu)化處理,并沒有達到為用戶提供最優(yōu)化服務(wù)的目標。2.1.4網(wǎng)絡(luò)尋址定位技術(shù)(PFNETs)在作者同被引分析(ACA)中的應(yīng)用1)背景及分析過程。1981年,德瑞克賽大學(DrexelUniversity)的H.D.White和K.W.Mccain創(chuàng)立了作者同被引技術(shù)(AuthorCo2citationAnalysis,ACA),以同被引頻次越高,則作者學術(shù)相關(guān)性越強作為分析的大前提來描述各學科的科學結(jié)構(gòu)。White于1998年沿用傳統(tǒng)ACA對情報科學結(jié)構(gòu)進行了描述。2003年White采用PFNETs對1998年的同一數(shù)據(jù)進行了第二次分析,同時將可視化技術(shù)引入ACA中,取得了很好的效果。在1998年工作的基礎(chǔ)上,White首先采用KNOT軟件將121位作者所產(chǎn)生的7260個組合縮減到較為重要的126個。然后采用用于大型網(wǎng)絡(luò)分析Pajek軟件,采用大小不同的點代表不同的作者,以突出作者在學科中的不同影響力及其重要程度。結(jié)果如圖5所示。2)結(jié)果。由圖5可分析出共有4位情報科學的領(lǐng)袖人物:G.Salton,E.Garfield,F.WLancaster,D.Price。以領(lǐng)袖人物為核心聚集成情報科學作者鏈:Markey-Bates-Berlkin-Saracevic-Salton-Lancaster-Garfield-Price-Brookes。并圍繞這些作者構(gòu)成了1972—1995年間情報科學研究范式:Salton和Garfield各自統(tǒng)領(lǐng)兩個最大的學術(shù)集團,即檢索學家和文獻計量學家,Lancaster是一般理論集團的焦點人物成為連接兩大集團的紐帶。3)討論。本案例把可視化引入ACA中,采用了PFNETs(網(wǎng)絡(luò)尋址定標技術(shù)),PFNETs計算快捷并具有很強的可視性。采用大小不同的點代表作者,作者間的同被引關(guān)系用連線表示,得到了上述可視化圖形。2003年的分析結(jié)果中反映了多個學術(shù)集團并存的格局,并突出了核心人物,這樣更加符合情報科學的認知結(jié)構(gòu)。顯然,2003年P(guān)ENETs的分析結(jié)果優(yōu)于1998年的傳統(tǒng)ACA的分析結(jié)果。2.2比較分析的結(jié)果對上述4個案例在應(yīng)用階段﹑使用的可視化技術(shù)﹑使用的工具和應(yīng)用效果4個方面進行對比分析,得到如表1所示的結(jié)果。3可視化技術(shù)及其在情報學中應(yīng)用的局限性從以上案例分析可以看出,現(xiàn)階段可視化技術(shù)尤其是信息可視化技術(shù)已經(jīng)在情報

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論