信息管理學(xué)基礎(chǔ)課件5.信息組織_第1頁(yè)
信息管理學(xué)基礎(chǔ)課件5.信息組織_第2頁(yè)
信息管理學(xué)基礎(chǔ)課件5.信息組織_第3頁(yè)
信息管理學(xué)基礎(chǔ)課件5.信息組織_第4頁(yè)
信息管理學(xué)基礎(chǔ)課件5.信息組織_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

5 信息組織

信息組織,又稱信息整序,是從無(wú)序到有序的轉(zhuǎn)換過(guò)程。借助特定規(guī)則、方法和技術(shù),對(duì)信息特征進(jìn)行揭示與描述,按參數(shù)和序列公式排列,使信息從無(wú)序集合轉(zhuǎn)換為有序集合。這就像整理書架,將雜亂的書籍按一定規(guī)則排列,方便查找。

信息特征分為外部特征和內(nèi)部特征。外部特征由信息的物理載體直接反映,如題名、作者、出版社、日期等,它們構(gòu)成信息外在的、形式的特征。這些特征就像書籍的封面,直觀地展示信息的基本情況。內(nèi)部特征則是信息包含的內(nèi)容,由主題詞、關(guān)鍵詞或其它知識(shí)單元表達(dá)。這如同書籍的內(nèi)容,是信息的核心所在。

理解信息組織的概念和內(nèi)容,有助于我們更好地管理和利用信息。通過(guò)對(duì)信息的有效組織,我們可以提高信息檢索的效率,更快速地獲取所需信息。同時(shí),也能更好地把握信息的內(nèi)在邏輯和關(guān)聯(lián),為進(jìn)一步的分析和決策提供支持。

信息組織過(guò)程包含四個(gè)關(guān)鍵步驟,每個(gè)步驟都對(duì)信息從無(wú)序到有序的轉(zhuǎn)化起著重要作用。

信息選擇是信息組織的首要環(huán)節(jié),需從采集到的無(wú)序信息流中精準(zhǔn)甄別有用信息,剔除無(wú)用信息。這如同在茫茫大海中篩選出珍貴的珍珠,去除無(wú)用的沙石,為后續(xù)的信息處理奠定基礎(chǔ)。

信息分析是對(duì)選擇后的信息進(jìn)行深度加工。按一定邏輯關(guān)系,從語(yǔ)義、語(yǔ)用和語(yǔ)法上對(duì)信息的內(nèi)、外部特征進(jìn)行細(xì)化、挖掘、加工整理并歸類。就像一位技藝精湛的工匠,對(duì)原材料進(jìn)行精心雕琢,使其更具價(jià)值。

信息描述與揭示則是根據(jù)信息組織和檢索的需要,對(duì)信息的主題內(nèi)容、形式特征、物質(zhì)形態(tài)等進(jìn)行分析和記錄。這一步驟如同為信息貼上標(biāo)簽,方便后續(xù)的查找和使用。

信息存貯是將經(jīng)過(guò)加工整理序化后的信息按一定格式與順序存儲(chǔ)在特定的載體中。這就好比將整理好的物品放入合適的倉(cāng)庫(kù),以便隨時(shí)取用。

這四個(gè)步驟環(huán)環(huán)相扣,共同構(gòu)成了信息組織的完整過(guò)程,確保信息能夠被有效管理和利用。

信息組織的類型豐富多樣,可從不同維度進(jìn)行劃分。從信息表現(xiàn)形式來(lái)看,有文字信息組織、圖像信息組織、聲音信息組織和視頻信息組織。文字信息組織以文字為載體,能夠精準(zhǔn)、詳細(xì)地傳達(dá)信息,像書籍、論文等;圖像信息組織通過(guò)直觀的畫面?zhèn)鬟f信息,具有很強(qiáng)的視覺(jué)沖擊力,例如海報(bào)、圖表等;聲音信息組織以聲音為媒介,能營(yíng)造出獨(dú)特的氛圍,如廣播、有聲讀物等;視頻信息組織則融合了圖像、聲音等多種元素,信息更加生動(dòng)、全面,像電影、教學(xué)視頻等。

從信息加工程度來(lái)分,存在一次信息組織、二次信息組織和三次信息組織。一次信息組織是對(duì)原始信息的初步整理;二次信息組織是在一次信息的基礎(chǔ)上進(jìn)行加工、提煉,如索引、文摘等;三次信息組織則是對(duì)二次信息的進(jìn)一步綜合分析,形成綜述、評(píng)論等。

從信息的傳播載體劃分,可分為文獻(xiàn)信息組織和非文獻(xiàn)信息組織。文獻(xiàn)信息組織依托傳統(tǒng)的文獻(xiàn)載體,如書籍、期刊等;非文獻(xiàn)信息組織則借助現(xiàn)代的電子設(shè)備和網(wǎng)絡(luò)平臺(tái),如網(wǎng)頁(yè)、社交媒體信息等。不同類型的信息組織各有特點(diǎn)和優(yōu)勢(shì),在實(shí)際應(yīng)用中相互補(bǔ)充,共同為信息的有效傳播和利用服務(wù)。

信息組織工作需遵循四大原則。

客觀性原則是基礎(chǔ),要求在信息組織過(guò)程中,尊重信息的客觀事實(shí),不添加主觀偏見(jiàn),確保信息的真實(shí)性和可靠性。只有基于客觀事實(shí)的信息組織,才能為后續(xù)的信息使用提供堅(jiān)實(shí)的基礎(chǔ)。

系統(tǒng)性原則強(qiáng)調(diào)信息組織的整體性和關(guān)聯(lián)性。要將信息視為一個(gè)有機(jī)的整體,按照一定的邏輯結(jié)構(gòu)進(jìn)行分類和整合,使信息之間形成有序的聯(lián)系。這樣有助于用戶更全面、深入地理解和利用信息。

目的性原則明確了信息組織的方向。我們?cè)诮M織信息時(shí),要根據(jù)特定的目標(biāo)和需求,篩選和整理信息,使信息能夠更好地服務(wù)于特定的目的。不同的目的會(huì)導(dǎo)致不同的信息組織方式。

現(xiàn)代化原則要求我們緊跟時(shí)代步伐,運(yùn)用現(xiàn)代信息技術(shù)和方法進(jìn)行信息組織。隨著科技的不斷發(fā)展,新的技術(shù)和工具為信息組織帶來(lái)了更多的可能性,我們要充分利用這些資源,提高信息組織的效率和質(zhì)量。

這四大原則相輔相成,共同保障信息組織工作的科學(xué)性和有效性。

信息組織并非憑空而來(lái),它有著堅(jiān)實(shí)的理論基礎(chǔ)。首先是語(yǔ)言學(xué),它為信息組織提供了表達(dá)和理解信息的基本工具。語(yǔ)言是信息的載體,通過(guò)對(duì)語(yǔ)言的準(zhǔn)確運(yùn)用和理解,我們才能更好地揭示和描述信息的內(nèi)容。

邏輯學(xué)則確保了信息組織的嚴(yán)謹(jǐn)性和合理性。在信息分析、整理和歸類的過(guò)程中,邏輯推理起著至關(guān)重要的作用,幫助我們從無(wú)序的信息中找出規(guī)律和聯(lián)系。

知識(shí)分類是將信息按照一定的標(biāo)準(zhǔn)進(jìn)行劃分和組織,使信息更加有序和易于查找。它就像一個(gè)龐大的圖書館分類系統(tǒng),讓我們能夠快速定位所需的信息。

系統(tǒng)論強(qiáng)調(diào)信息的整體性和關(guān)聯(lián)性。信息不是孤立存在的,而是相互影響、相互作用的一個(gè)整體。通過(guò)系統(tǒng)論的方法,我們可以更好地把握信息之間的關(guān)系,構(gòu)建出高效的信息系統(tǒng)。

耗散結(jié)構(gòu)理論關(guān)注信息系統(tǒng)的開(kāi)放性和動(dòng)態(tài)性。信息系統(tǒng)需要不斷與外界進(jìn)行物質(zhì)、能量和信息的交換,才能保持有序和穩(wěn)定。

協(xié)同論研究信息系統(tǒng)中各要素之間的協(xié)同作用。在信息組織中,不同的信息要素需要相互配合、協(xié)同工作,才能實(shí)現(xiàn)信息的有效組織和利用。

自組織理論則強(qiáng)調(diào)信息系統(tǒng)的自我調(diào)節(jié)和自我優(yōu)化能力。信息系統(tǒng)能夠在一定條件下自發(fā)地形成有序結(jié)構(gòu),不斷適應(yīng)環(huán)境的變化。

這些理論基礎(chǔ)相互關(guān)聯(lián)、相互補(bǔ)充,共同為信息組織提供了堅(jiān)實(shí)的理論支撐,使信息能夠從無(wú)序走向有序。

信息組織中,分類法是構(gòu)建有序化信息系統(tǒng)的常用手段。它依據(jù)信息資源的內(nèi)容屬性與其他特征,對(duì)資源進(jìn)行系統(tǒng)的分類和揭示,以分類號(hào)代表各種概念,并按學(xué)科性質(zhì)排列。

分類法的第一個(gè)特征是基于信息內(nèi)容特征的相互關(guān)系進(jìn)行組織。這意味著它不是隨意地將信息歸類,而是深入挖掘信息之間內(nèi)在的邏輯聯(lián)系,就像搭建一座知識(shí)大廈,每一塊磚都有其特定的位置和作用,從而使信息形成一個(gè)有機(jī)的整體,便于我們從宏觀層面把握知識(shí)體系。

分類法的第二個(gè)特征是從一定角度出發(fā)組織和揭示信息資源。不同的分類角度會(huì)帶來(lái)不同的信息組織方式和呈現(xiàn)效果。這就如同從不同的視角觀察一座城市,能看到不同的風(fēng)景和特色。通過(guò)選擇合適的分類角度,我們可以更精準(zhǔn)地滿足特定的信息需求,提高信息檢索和利用的效率。

總之,分類法在信息組織中具有重要的地位和價(jià)值,它為我們管理和利用信息提供了一種科學(xué)、系統(tǒng)的方法。

在信息組織的分類法中,國(guó)內(nèi)外有一些主要的分類法。首先是《杜威十進(jìn)制分類法》,它由美國(guó)圖書館學(xué)專家麥維爾·杜威所創(chuàng)。這部分類法具有開(kāi)創(chuàng)性,為后續(xù)的分類法發(fā)展奠定了基礎(chǔ)。它的出現(xiàn),使得信息的分類有了一個(gè)較為系統(tǒng)和規(guī)范的模式,讓圖書館等機(jī)構(gòu)在信息組織方面有了更科學(xué)的依據(jù)。

接著是《國(guó)際十進(jìn)制分類法》,它也稱《通用十進(jìn)分類法》,是由比利時(shí)的奧特勒和拉封丹在《杜威十進(jìn)制分類》的基礎(chǔ)上擴(kuò)充而成。這一擴(kuò)充,使得分類法更加完善,能夠適應(yīng)更多不同類型信息的分類需求,在國(guó)際上得到了更廣泛的應(yīng)用。

最后是我國(guó)的《中國(guó)圖書館分類法》,簡(jiǎn)稱《中圖法》。它是我國(guó)建國(guó)后編制出版的一部具有代表性的大型綜合性分類法,也是當(dāng)今國(guó)內(nèi)圖書館使用最廣泛的分類法體系。《中圖法》充分考慮了我國(guó)的文化特點(diǎn)和信息資源的實(shí)際情況,為我國(guó)的信息組織和管理提供了有力的支持,對(duì)我國(guó)圖書館事業(yè)的發(fā)展起到了重要的推動(dòng)作用。

主題法是依據(jù)文獻(xiàn)主題特征來(lái)組織排列信息的方法,其用受控的自然語(yǔ)言語(yǔ)詞直接表達(dá)主題概念。這種方法具有顯著的特征和明確的分類。

主題法的第一個(gè)特征是以特定事物、問(wèn)題、對(duì)象,也就是主題為核心來(lái)集中信息資源。這意味著它能精準(zhǔn)聚焦,將與某一主題相關(guān)的信息匯聚在一起,讓我們能快速獲取特定主題下的所有信息,避免信息分散帶來(lái)的查找困難。第二個(gè)特征是直接以語(yǔ)詞作為信息的組織和檢索標(biāo)識(shí)。這種方式簡(jiǎn)單直接,使用者可以直接用自己熟悉的語(yǔ)詞進(jìn)行檢索,無(wú)需在復(fù)雜的分類體系中尋找,降低了檢索門檻。第三個(gè)特征是以字順作為主要檢索途徑。字順檢索符合人們?nèi)粘2檎倚畔⒌牧?xí)慣,方便快捷,能讓我們迅速定位到所需信息。

主題法具體可分為標(biāo)題法、單元詞法、敘詞法和關(guān)鍵詞法。不同的分類適用于不同的信息組織和檢索場(chǎng)景,為我們提供了多樣化的選擇。與分類法相比,主題法更直觀,能滿足特性檢索,直接面向?qū)ο?、事?shí)或概念進(jìn)行信息組織,為我們提供了一種更高效、更直接的信息獲取方式。

分類法和主題法作為信息組織的兩種重要方法,各有其獨(dú)特優(yōu)勢(shì)。分類法具有較強(qiáng)的系統(tǒng)性,它依據(jù)學(xué)科性質(zhì)對(duì)概念進(jìn)行分類和系統(tǒng)排列,能夠滿足族性檢索需求,與人們的思維和檢索習(xí)慣相契合,方便進(jìn)行分類目錄瀏覽。例如,在圖書館中,我們可以按照?qǐng)D書的分類輕松找到相關(guān)領(lǐng)域的書籍。

主題法則更加直觀,它以特定的主題為中心,將與該主題相關(guān)的信息資源集中起來(lái),直接面向?qū)ο?、事?shí)或概念進(jìn)行信息組織。這種方法能夠滿足特性檢索的需求,使用戶更精準(zhǔn)地獲取所需信息。

為了進(jìn)一步提升信息檢索的效率,將族性檢索與特性檢索相結(jié)合成為了必然趨勢(shì)。如今,搜索引擎在進(jìn)行分類檢索時(shí)添加了關(guān)鍵詞索引手段,這使得用戶在瀏覽分類目錄的同時(shí),還能通過(guò)關(guān)鍵詞快速定位到具體信息。而一些采用主題檢索的搜索引擎也輔助以分類索引功能,方便用戶從不同角度進(jìn)行信息查找。

以CNKI為例,它在信息組織方面就很好地體現(xiàn)了分類-主題一體化的思想。通過(guò)這種方式,我們能夠更加全面、高效地獲取所需信息,滿足不同用戶的多樣化需求。

確保信息組織質(zhì)量、提高信息檢索效率,需要對(duì)信息進(jìn)行精準(zhǔn)描述與揭示。這意味著我們要正確判斷和表達(dá)信息的特征與內(nèi)容,避免遺漏有價(jià)值的信息,也不能將無(wú)價(jià)值或不存在的內(nèi)容納入分析結(jié)果。

信息組織的深度和質(zhì)量在很大程度上取決于對(duì)信息揭示的深度和水平。因?yàn)橹挥猩钊虢沂拘畔ⅲ拍茏屝畔⒁愿行?、更易獲取的方式呈現(xiàn),從而更好地滿足用戶的檢索需求。

為了實(shí)現(xiàn)這一目標(biāo),人們創(chuàng)造了多種技術(shù)、方法、規(guī)則和標(biāo)準(zhǔn)。這些技術(shù)、方法、規(guī)則和標(biāo)準(zhǔn)就像是一把把鑰匙,能夠幫助我們打開(kāi)信息寶庫(kù)的大門,讓我們更高效地管理和利用信息。它們從不同角度、不同層面為信息的描述與揭示提供了支持,使得信息能夠被更準(zhǔn)確地理解和應(yīng)用。

信息標(biāo)引是確保信息組織質(zhì)量、提高檢索效率的關(guān)鍵環(huán)節(jié)。它指的是分析信息對(duì)象的內(nèi)容與外表屬性,并用特定語(yǔ)言表達(dá)這些屬性,作為存儲(chǔ)和檢索依據(jù)的處理過(guò)程。由于它是在對(duì)文獻(xiàn)信息對(duì)象分析基礎(chǔ)上發(fā)展起來(lái)的,所以也被稱為文獻(xiàn)標(biāo)引。

信息標(biāo)引過(guò)程包含兩個(gè)重要環(huán)節(jié)。主題分析是首要環(huán)節(jié),需要深入剖析信息對(duì)象,提煉出核心主題,這是精準(zhǔn)理解信息內(nèi)涵的關(guān)鍵步驟。轉(zhuǎn)換標(biāo)識(shí)則是將分析得出的主題,用特定的語(yǔ)言或標(biāo)識(shí)系統(tǒng)進(jìn)行表達(dá),以便于信息的存儲(chǔ)和檢索。這兩個(gè)環(huán)節(jié)相輔相成,共同構(gòu)成了信息標(biāo)引的完整過(guò)程。

標(biāo)引語(yǔ)言作為一種專用語(yǔ)言或標(biāo)識(shí)系統(tǒng),在信息標(biāo)引中發(fā)揮著重要作用。它能夠簡(jiǎn)明、單義且關(guān)聯(lián)地表達(dá)文獻(xiàn)主題概念和檢索需求主題概念,是根據(jù)標(biāo)引和檢索的實(shí)際需要而精心編制的。有了標(biāo)引語(yǔ)言,信息的組織和檢索才能更加高效、準(zhǔn)確,從而更好地滿足人們對(duì)信息的需求。第13頁(yè)

前面我們已經(jīng)了解了信息標(biāo)引的基本概念、過(guò)程和標(biāo)引語(yǔ)言?,F(xiàn)在來(lái)探討信息標(biāo)引的類型。信息標(biāo)引的類型劃分十分重要,它能讓我們更精準(zhǔn)地對(duì)信息進(jìn)行處理和檢索。不同類型的信息標(biāo)引適用于不同的信息資源和檢索需求。

比如,從不同的角度可以有不同的分類方式。按照標(biāo)引的自動(dòng)化程度,可分為人工標(biāo)引和自動(dòng)標(biāo)引。人工標(biāo)引準(zhǔn)確性高,但效率較低;自動(dòng)標(biāo)引效率高,但可能存在一定誤差。按照標(biāo)引的深度,又可分為淺標(biāo)引和深標(biāo)引。淺標(biāo)引只對(duì)信息的表面特征進(jìn)行標(biāo)引,而深標(biāo)引則深入挖掘信息的內(nèi)涵和關(guān)聯(lián)。

了解信息標(biāo)引的類型,有助于我們根據(jù)具體情況選擇合適的標(biāo)引方法,從而提高信息組織的質(zhì)量和信息檢索的效率,更好地滿足用戶對(duì)信息的需求。第14頁(yè)

在信息組織領(lǐng)域,MARC即機(jī)器可讀目錄是一種極為重要的存在,它是計(jì)算機(jī)能夠識(shí)別和閱讀的目錄。MARC具有諸多顯著特點(diǎn),這些特點(diǎn)使其在信息存儲(chǔ)和檢索方面發(fā)揮著關(guān)鍵作用。

首先,MARC伸縮性強(qiáng)、適應(yīng)面廣,這意味著它能夠靈活地適應(yīng)不同類型和規(guī)模的信息資源。無(wú)論是小型圖書館的館藏,還是大型科研機(jī)構(gòu)的海量數(shù)據(jù),MARC都能游刃有余地進(jìn)行處理。其次,MARC包括001-999個(gè)字段,字段內(nèi)容著錄詳盡,作用強(qiáng)化。這使得它能夠詳細(xì)地記錄信息的各種屬性和特征,為信息的精準(zhǔn)檢索提供了豐富的依據(jù)。此外,每條MARC記錄可分為頭標(biāo)區(qū)、目次區(qū)、數(shù)據(jù)區(qū),這種清晰的結(jié)構(gòu)劃分有助于計(jì)算機(jī)更高效地處理和管理信息。

在實(shí)際應(yīng)用中,MARC有不同的格式。USMARC是美國(guó)國(guó)會(huì)圖書館機(jī)讀目錄通信格式,在國(guó)際上具有廣泛的影響力;UNIMARC是國(guó)際機(jī)讀目錄通信格式,促進(jìn)了全球范圍內(nèi)信息的交流與共享;CNMARC則是中國(guó)機(jī)讀目錄格式,它結(jié)合了中國(guó)的實(shí)際情況和需求,為我國(guó)的信息組織和管理提供了有力支持。第15頁(yè)

在信息組織與檢索的范疇中,MARC記錄格式是一項(xiàng)重要內(nèi)容。這里以《格林童話》為例,這本由格林兄弟所著、蔡昌卓翻譯、長(zhǎng)江文藝出版社于2007年出版的圖書,其在武漢大學(xué)圖書館書目檢索系統(tǒng)里的MARC記錄格式被呈現(xiàn)出來(lái)。MARC作為機(jī)器可讀目錄,具備伸縮性強(qiáng)、適應(yīng)面廣等特點(diǎn),涵蓋001-999個(gè)字段,字段內(nèi)容著錄詳盡且作用強(qiáng)化,每條記錄還可分為頭標(biāo)區(qū)、目次區(qū)、數(shù)據(jù)區(qū)。通過(guò)《格林童話》的MARC記錄格式,我們能更直觀地了解其在圖書館系統(tǒng)中的信息存儲(chǔ)與組織方式。這不僅有助于圖書館高效管理圖書資源,也方便讀者進(jìn)行精準(zhǔn)檢索。它是信息檢索與管理的重要工具,以規(guī)范的格式將圖書的各種屬性和特征進(jìn)行記錄,為信息的有效流通和利用奠定了基礎(chǔ)。第16頁(yè)

元數(shù)據(jù),簡(jiǎn)單來(lái)說(shuō)就是關(guān)于數(shù)據(jù)的數(shù)據(jù)。它是組織信息的關(guān)鍵工具,是為了對(duì)網(wǎng)上信息資源進(jìn)行標(biāo)引和著錄而產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)。

在如今這個(gè)信息爆炸的時(shí)代,網(wǎng)絡(luò)上的信息資源浩如煙海,如何對(duì)這些信息進(jìn)行有效的搜集、開(kāi)發(fā)、組織與利用,就成了一個(gè)亟待解決的問(wèn)題。而元數(shù)據(jù)的出現(xiàn),正好為我們提供了一個(gè)很好的解決方案。它就像是一個(gè)信息的“導(dǎo)游”,能夠幫助我們更好地描述網(wǎng)上信息資源,讓我們快速地了解信息的內(nèi)容、特征等。

元數(shù)據(jù)不僅僅是對(duì)單個(gè)數(shù)據(jù)的描述,它還涉及到組織數(shù)據(jù)、各種數(shù)據(jù)域以及它們之間的相互關(guān)系。通過(guò)元數(shù)據(jù),我們可以清晰地看到數(shù)據(jù)之間的關(guān)聯(lián),從而更好地對(duì)信息進(jìn)行管理和利用??梢哉f(shuō),元數(shù)據(jù)在網(wǎng)絡(luò)信息資源的管理和利用中,發(fā)揮著至關(guān)重要的作用,是我們有效利用網(wǎng)絡(luò)信息的重要保障。第17頁(yè)

元數(shù)據(jù)的數(shù)據(jù)類型包含多個(gè)關(guān)鍵要素。元素名稱是對(duì)數(shù)據(jù)的命名,如同給每個(gè)數(shù)據(jù)賦予獨(dú)特的“名字”,方便識(shí)別和區(qū)分不同的數(shù)據(jù)。元素描述則是對(duì)元素的詳細(xì)闡釋,就像為數(shù)據(jù)撰寫的“說(shuō)明書”,讓使用者能深入了解數(shù)據(jù)的內(nèi)涵。

元素標(biāo)識(shí)是數(shù)據(jù)的特定標(biāo)記,如同數(shù)據(jù)的“身份證”,能精準(zhǔn)地定位和識(shí)別每一個(gè)數(shù)據(jù)。元素代碼是數(shù)據(jù)的編碼形式,這有助于計(jì)算機(jī)系統(tǒng)更高效地處理和存儲(chǔ)數(shù)據(jù),提升數(shù)據(jù)處理的速度和準(zhǔn)確性。

元素語(yǔ)義涉及數(shù)據(jù)的意義和邏輯關(guān)系,它賦予數(shù)據(jù)以“靈魂”,使得數(shù)據(jù)不僅僅是簡(jiǎn)單的符號(hào),而是具有實(shí)際意義的信息。元素分類則是按照一定的標(biāo)準(zhǔn)對(duì)數(shù)據(jù)進(jìn)行歸類,就像把書籍按照不同的學(xué)科領(lǐng)域分類擺放,方便對(duì)數(shù)據(jù)進(jìn)行管理和檢索。這些要素相互配合,共同構(gòu)成了元數(shù)據(jù)的完整體系,為信息的組織、存儲(chǔ)和檢索提供了有力的支持。第18頁(yè)

元數(shù)據(jù)在信息管理領(lǐng)域發(fā)揮著至關(guān)重要的作用,具體體現(xiàn)在描述、定位、搜尋、評(píng)價(jià)和選擇五個(gè)方面。描述功能如同給信息對(duì)象繪制一幅精準(zhǔn)的畫像,不僅呈現(xiàn)其內(nèi)容和特征,還標(biāo)注出它的位置,讓我們對(duì)信息對(duì)象有一個(gè)全面且清晰的認(rèn)識(shí)。

定位功能則像一位貼心的向?qū)?,為我們提供信息資源的位置信息,確保我們能夠準(zhǔn)確無(wú)誤地訪問(wèn)所需信息,節(jié)省大量的時(shí)間和精力。

搜尋功能如同一位智慧的整理師,從信息對(duì)象中提取重要內(nèi)容,進(jìn)行合理組織,并賦予其語(yǔ)義,建立數(shù)據(jù)之間的聯(lián)系,同時(shí)指出相關(guān)數(shù)據(jù)的地址和存取方法,使我們能夠更高效地獲取和利用信息。

評(píng)價(jià)功能為我們提供信息對(duì)象的基本屬性,如名稱、年代、格式、制作者等,這些信息就像一個(gè)個(gè)參考坐標(biāo),幫助我們?cè)诖嫒『屠眯畔r(shí)做出更明智的決策。

選擇功能通過(guò)記錄信息資源的特征,為我們提供判斷信息資源使用價(jià)值的依據(jù),就像在購(gòu)物時(shí)的商品說(shuō)明書,讓我們能夠根據(jù)自己的需求和偏好,決定是否使用該信息資源。

綜上所述,元數(shù)據(jù)的這些作用相互關(guān)聯(lián)、相互支持,共同為我們?cè)谛畔⒌暮Q笾袑?dǎo)航,提升我們獲取和利用信息的效率和質(zhì)量。第19頁(yè)

都柏林核心集是用于描述網(wǎng)絡(luò)信息資源的簡(jiǎn)單元數(shù)據(jù),旨在提供一種Internet資源的描述規(guī)范,助力發(fā)掘西文電子資源,它包含15個(gè)數(shù)據(jù)單元。

從其目的來(lái)看,隨著網(wǎng)絡(luò)信息資源的爆炸式增長(zhǎng),如何高效發(fā)掘和利用西文電子資源成為關(guān)鍵問(wèn)題。都柏林核心集的出現(xiàn),就像是一把精準(zhǔn)的鑰匙,為我們打開(kāi)了西文電子資源寶庫(kù)的大門,讓我們能夠更有針對(duì)性地去探索和使用這些資源。

再看其特點(diǎn),通俗易懂是一大優(yōu)勢(shì)。這意味著無(wú)論是專業(yè)的信息管理人員,還是普通的網(wǎng)絡(luò)用戶,都能夠輕松理解和運(yùn)用都柏林核心集來(lái)描述和查找網(wǎng)絡(luò)信息資源,降低了使用門檻。運(yùn)用靈活則使其可以根據(jù)不同的需求和場(chǎng)景進(jìn)行調(diào)整和應(yīng)用,適應(yīng)多樣化的網(wǎng)絡(luò)信息環(huán)境。國(guó)際通用讓它在全球范圍內(nèi)得到廣泛認(rèn)可和應(yīng)用,促進(jìn)了不同國(guó)家和地區(qū)之間的信息交流與共享??蓴U(kuò)展性則保證了它能夠隨著網(wǎng)絡(luò)技術(shù)和信息資源的發(fā)展不斷更新和完善,始終保持其有效性和實(shí)用性。

總之,都柏林核心集以其獨(dú)特的優(yōu)勢(shì),在網(wǎng)絡(luò)信息資源的描述和管理方面發(fā)揮著重要作用。第20頁(yè)

都柏林核心集(DublinCore)作為描述網(wǎng)絡(luò)信息資源的簡(jiǎn)單元數(shù)據(jù),其15個(gè)元素的分類具有重要意義。這15個(gè)元素可分為與資源內(nèi)容有關(guān)的元素、與資源知識(shí)產(chǎn)權(quán)有關(guān)的元素和與資源外部屬性有關(guān)的元素這三種類型。

與資源內(nèi)容有關(guān)的元素,就像是資源的靈魂,它能讓我們深入了解資源本身所包含的信息,比如資源的主題、內(nèi)容摘要等,幫助我們快速判斷資源是否符合我們的需求。與資源知識(shí)產(chǎn)權(quán)有關(guān)的元素,則如同資源的保護(hù)盾,明確了資源的版權(quán)歸屬、使用權(quán)限等,保障了創(chuàng)作者的權(quán)益,也規(guī)范了資源的使用。而與資源外部屬性有關(guān)的元素,好比資源的定位器,它包含資源的創(chuàng)建時(shí)間、發(fā)布者等信息,能讓我們更好地掌握資源的背景和來(lái)源。

這種分類方式不僅有助于我們系統(tǒng)地描述和管理網(wǎng)絡(luò)信息資源,還能提高信息檢索的效率和準(zhǔn)確性,為我們?cè)诤A康木W(wǎng)絡(luò)信息中快速找到所需資源提供了有力支持。5.1.1信息組織的概念與內(nèi)容

信息組織,也叫信息整序,是利用一定的規(guī)則、方法和技術(shù)對(duì)信息的外部特征和內(nèi)容特征進(jìn)行揭示和描述,并按給定的參數(shù)和序列公式排列,使信息從無(wú)序集合轉(zhuǎn)換為有序集合的過(guò)程。外部特征:信息的物理載體直接反映的信息對(duì)象,構(gòu)成信息的外在的、形式的特征(題名、作者、出版社、日期等)內(nèi)部特征:信息包含的內(nèi)容,由主題詞、關(guān)鍵詞或其它知識(shí)單元表達(dá)5.1信息組織的基本原理(1)信息選擇從采集到的無(wú)序的信息流中甄別出有用的信息,剔除無(wú)用信息。(2)信息分析按一定邏輯關(guān)系從語(yǔ)義、語(yǔ)用和語(yǔ)法上對(duì)選擇過(guò)的信息內(nèi)、外部特征進(jìn)行細(xì)化、挖掘、加工整理并歸類。(3)信息描述與揭示根據(jù)信息組織和檢索的需要,對(duì)信息的主題內(nèi)容、形式特征、物質(zhì)形態(tài)等進(jìn)行分析和記錄。(4)信息存貯將經(jīng)過(guò)加工整理序化后的信息按一定格式與順序存儲(chǔ)在特定的載體中。5.1.1信息組織的概念與內(nèi)容按信息表現(xiàn)形式劃分

文字信息組織、圖像信息組織、

聲音信息組織、視頻信息組織按信息加工程度劃分一次信息組織、二次信息組織、三次信息組織按信息的傳播載體劃分

文獻(xiàn)信息組織、非文獻(xiàn)信息組織5.1.2信息組織的類型客觀性原則系統(tǒng)性原則目的性原則現(xiàn)代化原則5.1.3信息組織的原則語(yǔ)言學(xué)邏輯學(xué)知識(shí)分類系統(tǒng)論耗散結(jié)構(gòu)理論協(xié)同論自組織理論5.1.4信息組織的理論基礎(chǔ)5.2.1分類法

信息的分類組織是構(gòu)建有序化信息系統(tǒng)的常用方法,是指根據(jù)信息資源的內(nèi)容屬性和其他特征,將資源分門別類地、系統(tǒng)地組織和揭示的方法。它用分類號(hào)來(lái)表達(dá)各種概念,將各種概念按學(xué)科性質(zhì)進(jìn)行分類和系統(tǒng)排列。分類法的特征:

第一,是按照信息內(nèi)容特征的相互關(guān)系進(jìn)行組織的。

第二,是從一定角度出發(fā)組織和揭示信息資源。5.2信息組織的思想方法

國(guó)內(nèi)外主要的分類法《杜威十進(jìn)制分類法》((DeweyDecimalClassification,簡(jiǎn)稱DDC)),由美國(guó)圖書館學(xué)專家麥維爾·杜威(MelvilDewey,1851-1931)所創(chuàng)?!秶?guó)際十進(jìn)制分類法》((UniversalDecimalClassification,簡(jiǎn)稱UDC)))也稱《通用十進(jìn)分類法》,由比利時(shí)的奧特勒(P.Otlet)和拉封丹(H.Lafontaine)在《杜威十進(jìn)制分類》的基礎(chǔ)上擴(kuò)充而成?!吨袊?guó)圖書館分類法》簡(jiǎn)稱《中圖法》,原名《中國(guó)圖書館圖書分類法》,是我國(guó)建國(guó)后編制出版的一部具有代表性的大型綜合性分類法,是當(dāng)今國(guó)內(nèi)圖書館使用最廣泛的分類法體系。5.2.1分類法根據(jù)文獻(xiàn)主題特征來(lái)組織排列信息的一種方法,由受控的自然語(yǔ)言語(yǔ)詞直接表達(dá)主題概念。

主題法的特征:

第一,以特定事物、問(wèn)題、對(duì)象,即主題為中心集中信息資源。

第二,直接以語(yǔ)詞作為信息的組織和檢索標(biāo)識(shí)。

第三,以字順作為主要檢索途徑。主題法可分為:

標(biāo)題法、單元詞法、敘詞法、關(guān)鍵詞法5.2.2主題法分類法系統(tǒng)性強(qiáng),滿足族性檢索,符合人們的思維與檢索習(xí)慣,分類目錄瀏覽。主題法直觀,滿足特性檢索,提供了一種直接面向?qū)ο?、事?shí)或概念的信息組織方法。族性檢索與特性檢索相結(jié)合搜索引擎在分類檢索的同時(shí)添加了關(guān)鍵詞索引手段,而一些主題檢索的搜索引擎也輔助以分類索引功能

CNKI中的組織法搜索引擎的分類搜索5.2.3分類-主題一體化為了確保信息組織的質(zhì)量,提高信息檢索的效率,我們要對(duì)信息進(jìn)行描述和揭示,正確判斷、表達(dá)信息的特征和內(nèi)容,既不遺漏有價(jià)值的信息內(nèi)容,又不將無(wú)價(jià)值的內(nèi)容或信息對(duì)象中根本不存在的東西作為分析結(jié)果。一般來(lái)說(shuō),信息組織的深度和質(zhì)量取決于對(duì)信息揭示的深度和水平,為此,人們創(chuàng)造了多種技術(shù)、方法、規(guī)則和標(biāo)準(zhǔn)對(duì)信息進(jìn)行描述和揭示。5.3信息的描述與揭示(1)標(biāo)引的基本概念信息標(biāo)引,是指分析信息對(duì)象的內(nèi)容屬性(特征)及相關(guān)外表屬性,并用特定語(yǔ)言表達(dá)分析出的屬性或特征,作為信息存儲(chǔ)和檢索依據(jù)的處理過(guò)程。它是在對(duì)文獻(xiàn)信息對(duì)象分析基礎(chǔ)上發(fā)展起來(lái)的,故又稱為文獻(xiàn)標(biāo)引。信息標(biāo)引過(guò)程一般包括兩個(gè)環(huán)節(jié):一是主題分析,二是轉(zhuǎn)換標(biāo)識(shí)。(2)標(biāo)引語(yǔ)言標(biāo)引語(yǔ)言是表達(dá)文獻(xiàn)主題概念和檢索需求主題概念的簡(jiǎn)明性、單義性和關(guān)聯(lián)性的概念標(biāo)識(shí)系統(tǒng),是根據(jù)標(biāo)引和檢索需要而編制的一種專用語(yǔ)言或標(biāo)識(shí)系統(tǒng)。5.3.1信息標(biāo)引分類標(biāo)引是指對(duì)文獻(xiàn)進(jìn)行主題分析,用特定的分類語(yǔ)言表達(dá)分析出的主題,賦予文獻(xiàn)分類檢索標(biāo)識(shí)(分類號(hào))的過(guò)程。習(xí)慣上,分類標(biāo)引被稱為分類。文獻(xiàn)分類是指根據(jù)文獻(xiàn)內(nèi)容及其他相關(guān)屬性,以分類語(yǔ)言(分類法)為工具,分門別類地系統(tǒng)揭示和組織文獻(xiàn)的過(guò)程和方法。主題標(biāo)引是指對(duì)文獻(xiàn)進(jìn)行主題分析,用主題語(yǔ)言(主題法)表達(dá)分析出的主題,賦予文獻(xiàn)主題檢索標(biāo)識(shí)(標(biāo)題詞、敘詞等)的過(guò)程。5.3.1信息標(biāo)引(3)信息標(biāo)引的類型MARC(MachineReadableCatalogue)機(jī)器可讀目錄,是一種計(jì)算機(jī)能夠識(shí)別和閱讀的目錄特點(diǎn)伸縮性強(qiáng),適應(yīng)面廣包括001-999個(gè)字段字段內(nèi)容著錄詳盡,作用強(qiáng)化每條記錄可分為頭標(biāo)區(qū)、目次區(qū)、數(shù)據(jù)區(qū)USMARC(美國(guó)國(guó)會(huì)圖書館機(jī)讀目錄通信格式UNIMARC(國(guó)際機(jī)讀目錄通信格式)CNMARC(中國(guó)機(jī)讀目錄格式)5.3.2機(jī)器可讀目錄(MARC)001000663115

00520091224112412.0

010|a978-7-5354-3093-9|dCNY14.00

099|aCAL012009189818

100|a20091223d2007

ekmy0chiy50

ea

1011|achi|beng|cger

102|aCN|b420000

105|aaf

z

000fy

106|ar

2001|a格林童話|Agelintonghua|f(丹麥)格林兄弟著|d=Grimm'sfairytales|fGrimmBrothers|g蔡昌卓譯|zeng

205|a插圖本

210|a武漢|c長(zhǎng)江文藝出版社|d2007

215|a[8],270頁(yè),[5]頁(yè)圖版|c圖|d21cm

2252|a世界文學(xué)名著典藏|Ashijiewenxuemingzhudiancang

330|a本書收錄格林兄弟童話作品《青蛙王子》《貓和老鼠交朋友》《忠實(shí)的約翰》《小母雞之死》等等。

4100|12001

|a世界文學(xué)名典藏

5101|aGrimm'sfairytales|zeng

6060|a童話|Atonghua|y德國(guó)|z近代|j選集

690|aI516.88|v4

7011|a格林|Agelin|g(Grimm,Jakob),|f1785-1863|4著

7011|a格林|Agelin|g(Grimm,Wilhelm),|f1786-1859|4著

7020|a蔡昌卓|Acaichangzhuo|4譯

8010|aCN|bWUL|c20091223

905|aZT|dI516.88|eG284|i格林|sI516.88/G284b

《格林童話》(格林兄弟著;蔡昌卓譯.長(zhǎng)江文藝出版社,2007年)這本圖書在武漢大學(xué)圖書館書目檢索系統(tǒng)中的MARC記錄格式5.3.2機(jī)器可讀目錄(MARC)(1)元數(shù)據(jù)的概念關(guān)于數(shù)據(jù)的數(shù)據(jù)(dataaboutdata)元數(shù)據(jù)(Medadata)是組織信息的基本工具,是為標(biāo)和著錄網(wǎng)上信息資源而產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù),它是用來(lái)描述網(wǎng)上信息資源,加強(qiáng)對(duì)網(wǎng)上信息資源的搜集、開(kāi)發(fā)、組織與利用的網(wǎng)絡(luò)數(shù)據(jù)集合元數(shù)據(jù)是組織數(shù)據(jù)、各種數(shù)據(jù)域及它們之間相互關(guān)系的信息5.3.3元數(shù)據(jù)數(shù)據(jù)類型元素名稱(Elementnames)元素描述(Elementdescription)元素標(biāo)識(shí)(Elementrepresentation)元素代碼(Elementcoding)元素語(yǔ)義(Elementsemantics)元素分類(Elementclassification)5.3.3元數(shù)據(jù)

元數(shù)據(jù)的作用描述:對(duì)信息對(duì)象的內(nèi)容、特征和位置進(jìn)行描述定位:提供信息資源位置的信息,以便用戶訪問(wèn)時(shí)使用搜尋:將信息對(duì)象中重要內(nèi)容抽取并加以組織,賦予語(yǔ)義,建立數(shù)據(jù)之間的聯(lián)系,指出相關(guān)數(shù)據(jù)的地址和存取方法評(píng)價(jià):提供有關(guān)信息對(duì)象的名稱、年代、格式、制作者等基本屬性,作為用戶存取與利用的參考選擇:通過(guò)記錄信息資源的特征,供用戶對(duì)信息資源的使用價(jià)值進(jìn)行判斷,決定是否使用5.3.3元數(shù)據(jù)(2)都柏林核心集(

DublinCore)

描述網(wǎng)絡(luò)信息資源的一種簡(jiǎn)單元數(shù)據(jù),其目的是提供一種Internet資源的描述規(guī)范,以便發(fā)掘西文電子資源,包括15個(gè)數(shù)據(jù)單元(element)。特點(diǎn):通俗易懂,運(yùn)用靈活,國(guó)際通用,可擴(kuò)展性5.3.3元數(shù)據(jù)資源內(nèi)容描述類元素資源知識(shí)產(chǎn)權(quán)描述類元素資源外部屬性描述類元素題名(Title)作者或創(chuàng)作者(AuthororCreator)日期(Date)主題和關(guān)鍵詞(Subject)出版者(Publisher)類型(Type)描述(Description)其他責(zé)任者(Contributors)格式(Format)來(lái)源(Source)權(quán)限管理(Rights)資源標(biāo)識(shí)符(Identifier)語(yǔ)種(Language)

關(guān)聯(lián)(Relation)

覆蓋范圍(Coverage)

表5-3都柏林核心集元素類別DC的15個(gè)元素可分為三種類型:與資源內(nèi)容有關(guān)的元素、與資源知識(shí)產(chǎn)權(quán)有關(guān)的元素和與資源外部屬性有關(guān)的元素。5.3.3元數(shù)據(jù)(3)其他元數(shù)據(jù)規(guī)范目前,數(shù)字圖書館常用的元數(shù)據(jù)標(biāo)準(zhǔn)有:MARC(美國(guó)的USMARC、國(guó)際標(biāo)準(zhǔn)UNIMARC、中國(guó)的CNMARC、日本的JMARC、英國(guó)的UKMARC、加拿大的CANMARC、東南亞的SEA-MARC)、都柏林核心數(shù)據(jù)(DublinCore)、VRA核心類目(VRACoreCategory)、藝術(shù)作品著錄類目(CategoriesfortheDescriptionofWorksofArts)、CDWA、REACH著錄單元集合(REACHelementset)、PICS、WebCollections、CDF、MCF、RDF等。另外,還有《政府信息定位服務(wù)》(GovernmentInformationLocatorService,簡(jiǎn)稱GILS)、《聯(lián)合地理數(shù)據(jù)委員會(huì)的數(shù)字地球空間元數(shù)據(jù)》(ContentStandardDigitalGeospatialMetadata,簡(jiǎn)稱CSDGM)、《可視資源核心范疇》(CoreCategoriesfor-visualResources,簡(jiǎn)稱CCVR)、《編碼檔案描述》(EncodedArchivalDescription,簡(jiǎn)稱EDA)、《博物館信息的計(jì)算機(jī)交換》(ComputerInterchangeofMuseumInformation,簡(jiǎn)稱CIMI)等描述規(guī)范。5.3.3元數(shù)據(jù)通用置標(biāo)語(yǔ)言標(biāo)準(zhǔn)SGML(StandardGeneralizedMarkupLanguage)

超文本置標(biāo)語(yǔ)言HTML(Hyper-textMarkupLanguage)

可擴(kuò)展的置標(biāo)語(yǔ)言XML(eXtensibleMarkupLanguage)MARCXML5.3.4通用標(biāo)記語(yǔ)言及相關(guān)標(biāo)準(zhǔn)5.4.1網(wǎng)絡(luò)信息組織的特點(diǎn)

(1)海量網(wǎng)絡(luò)信息及信息生產(chǎn)、傳播速度的加快,對(duì)傳統(tǒng)信息加工方式提出了挑戰(zhàn)。(2)信息種類增多,數(shù)據(jù)庫(kù)成分復(fù)雜化,過(guò)去主要適用于文本信息的信息組織方法適用性降低。(3)不同于以往信息用戶,網(wǎng)絡(luò)信息用戶的信息行為對(duì)信息組織有專門需求,他們要求信息組織方式透明化、易用化,希望信息傳播快速便捷,組織方式簡(jiǎn)便實(shí)用。(4)網(wǎng)絡(luò)信息形式上的非線性、交互性和動(dòng)態(tài)性,需要信息組織方法及時(shí)而靈活。5.4網(wǎng)絡(luò)應(yīng)用:

網(wǎng)絡(luò)信息資源組織傳統(tǒng)分類組織是一種比較成熟的信息組織方法,在網(wǎng)絡(luò)信息組織中仍得到普遍的應(yīng)用。目前,網(wǎng)絡(luò)上的信息分類組織主要采用兩種方式來(lái)進(jìn)行:一是沿用傳統(tǒng)的文獻(xiàn)分類方法,主要以學(xué)術(shù)資源為主;二是采用自編的分類系統(tǒng),在門戶網(wǎng)站上較為常用。5.4.2網(wǎng)絡(luò)信息的分類組織

傳統(tǒng)文獻(xiàn)分類法的應(yīng)用英國(guó)國(guó)內(nèi)綜合性網(wǎng)上資源的BUBLsubjecttree(http://bubl.ac.uk/),按照DDC分類體系將網(wǎng)絡(luò)資源進(jìn)行組織圖5-4BUBLLINK

CatalogueofInternetResources的網(wǎng)絡(luò)資源目錄5.4.2網(wǎng)絡(luò)信息的分類組織“加拿大學(xué)科資源”(CanadianInformationbySubject)網(wǎng)站(http://www.collectionscanada.gc.ca/caninfo/ecaninfo.htm

)也依據(jù)DDC分類構(gòu)建了學(xué)科主題樹(shù)瀏覽目錄(subjecttree)圖5-5CanadianInformationbySubject的主題樹(shù)(采用DDC分類體系)5.4.2網(wǎng)絡(luò)信息的分類組織維普資訊的《中文科技期刊數(shù)據(jù)庫(kù)》的分類體系就是以《中國(guó)圖書館分類法》為標(biāo)準(zhǔn)圖5-6《中文科技期刊數(shù)據(jù)庫(kù)》的分類體系(采用《中圖法》)5.4.2網(wǎng)絡(luò)信息的分類組織

自編分類系統(tǒng)的應(yīng)用Yahoo!目錄(Yahoo!Directory)將Yahoo!所收錄的信息分為16個(gè)大類(如表5-4所示)。其中前面14個(gè)大類包括了藝術(shù)人文、商業(yè)經(jīng)濟(jì)、計(jì)算機(jī)與互聯(lián)網(wǎng)等不同的主題領(lǐng)域;后面的2個(gè)大類與前面14個(gè)大類有所不同,不是按照主題領(lǐng)域設(shè)置,而更側(cè)重于應(yīng)用功能。Arts&HumanitiesRecreation&SportsBusiness&EconomyReferenceComputer&InternetRegionalEducationScienceEntertainmentSocialScienceGovernmentSociety&CultureHealthNewAdditionsNews&MediaTheSparkBlog表5-4Yahoo!目錄中的分類大類5.4.2網(wǎng)絡(luò)信息的分類組織與英文Yahoo!相比較,臺(tái)灣Yahoo!奇摩的分類目錄就有所差異,圖5-8中顯示了Yahoo!奇摩的分類目錄。圖5-8臺(tái)灣Yahoo!奇摩的分類目錄5.4.2網(wǎng)絡(luò)信息的分類組織

網(wǎng)絡(luò)自編分類體系作為一種新型的體系,與傳統(tǒng)的文獻(xiàn)分類法相比,具有以下特點(diǎn):①

重視以事物為中心設(shè)置類目。②

類目收錄范圍寬泛。③

多重列類、重復(fù)反映。④

直接以語(yǔ)詞作為分類標(biāo)識(shí)。⑤

更新迅速。5.4.2網(wǎng)絡(luò)信息的分類組織主題法是網(wǎng)絡(luò)信息組織的另一種主要方式,主要可分為兩種形式:一是采用現(xiàn)有的詞表(如敘詞表,即主題詞表),主要應(yīng)用于學(xué)科專業(yè)型數(shù)據(jù)庫(kù)中;二是采用關(guān)鍵詞法,在搜索引擎等網(wǎng)站中使用較普遍。5.4.3網(wǎng)絡(luò)信息的主題組織

敘詞表的應(yīng)用敘詞表,又稱主題詞表,是敘詞法的詞匯管理工具,是為采用敘詞法標(biāo)引和檢索信息的用戶提供規(guī)范化的敘詞及其語(yǔ)義關(guān)系信息的一種索引詞匯表。按照功能和有用性,網(wǎng)絡(luò)環(huán)境下的敘詞表可分為兩種類型:①獨(dú)立敘詞表,此類敘詞表不附屬于某個(gè)信息系統(tǒng),如《ASIS圖書館和信息科學(xué)敘詞表》、《藝術(shù)與建筑敘詞表》(Art&ArchitectureThesaurus,AAT)等;②集成在數(shù)據(jù)庫(kù)或信息檢索系統(tǒng)中的敘詞表,如美國(guó)教育資源信息數(shù)據(jù)庫(kù)使用的《教育資源敘詞表》(ERIC)、美國(guó)國(guó)立醫(yī)學(xué)圖書館編制的《醫(yī)學(xué)主題詞表》(MedicalSubjectHeadings,MeSH)等。5.4.3網(wǎng)絡(luò)信息的主題組織

關(guān)鍵詞法的應(yīng)用在網(wǎng)絡(luò)環(huán)境中,用戶迫切需要采用自然語(yǔ)言,關(guān)鍵詞法成為網(wǎng)絡(luò)信息組織中的一種常見(jiàn)方法。與敘詞相比,關(guān)鍵詞是一種不受控或者受控程度較低的標(biāo)引語(yǔ)言。因而,關(guān)鍵詞技術(shù)在網(wǎng)絡(luò)搜索引擎和自他信息系統(tǒng)的信息組織中被廣泛采用。應(yīng)用:網(wǎng)絡(luò)搜索引擎中的自動(dòng)索引軟件,如Robot、Spider、Crawler等都采用了關(guān)鍵詞技術(shù),從網(wǎng)站、網(wǎng)頁(yè)的題名、地址、摘要,甚至網(wǎng)頁(yè)的正文中抽取關(guān)鍵詞作為索引詞。Google、Baidu、Bing等搜索引擎都采用了關(guān)鍵詞法來(lái)組織網(wǎng)絡(luò)信息。一些文獻(xiàn)數(shù)據(jù)庫(kù)(如中國(guó)期刊網(wǎng)CNKI、重慶維普數(shù)據(jù)庫(kù)等),也廣泛使用了詞語(yǔ)標(biāo)識(shí)系統(tǒng)5.4.3網(wǎng)絡(luò)信息的主題組織

語(yǔ)義網(wǎng)語(yǔ)義網(wǎng)(SemanticWeb)是萬(wàn)維網(wǎng)的一個(gè)延伸,是一個(gè)由大量機(jī)器可理解的數(shù)據(jù)所構(gòu)成的一個(gè)分布式的萬(wàn)維網(wǎng)。它通過(guò)在現(xiàn)有萬(wàn)維網(wǎng)基礎(chǔ)之上加入可被機(jī)器“理解和處理”的內(nèi)容,從而使得現(xiàn)有的萬(wàn)維網(wǎng)具有一定的智能。5.4.4基于本體的網(wǎng)絡(luò)信息組織圖5-9語(yǔ)義網(wǎng)信息組織結(jié)構(gòu)模型

語(yǔ)義網(wǎng)的信息組織機(jī)制核心由兩大模塊組成:①以XML與RDF為手段的信息描述模塊,管理信息,具備部分語(yǔ)義;②以本體為手段的語(yǔ)義注釋模塊,提供“意義”,實(shí)現(xiàn)機(jī)器間的語(yǔ)義互操作。

本體的概念與構(gòu)成本體是共享概念模型的明確的形式化規(guī)范說(shuō)明。上述定義揭示了四層含義:①概念模型(conceptualization)②明確(explicit)③形式化(formal)④共享(share)就理論層面而言,可以認(rèn)為本體由概念(concept)、屬性(property)、公理(Axiom)、取值(value)及名義(Nominal)這五要素構(gòu)成。5.4.3網(wǎng)絡(luò)信息的主題組織基于本體的網(wǎng)絡(luò)信息組織

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論