信息組織概論第三章課件_第1頁(yè)
信息組織概論第三章課件_第2頁(yè)
信息組織概論第三章課件_第3頁(yè)
信息組織概論第三章課件_第4頁(yè)
信息組織概論第三章課件_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章信息組織的技術(shù)標(biāo)準(zhǔn)第三章信息組織的技術(shù)標(biāo)準(zhǔn)1學(xué)習(xí)要求主要內(nèi)容:本章主要介紹信息組織的技術(shù)標(biāo)準(zhǔn)基本知識(shí),傳統(tǒng)信息組織技術(shù)標(biāo)準(zhǔn)和網(wǎng)絡(luò)信息組織技術(shù)標(biāo)準(zhǔn)。掌握:MARC格式及其特點(diǎn);元數(shù)據(jù)含義、元數(shù)據(jù)類(lèi)型、元數(shù)據(jù)作用、元數(shù)據(jù)格式和創(chuàng)建;DC的元素和限定詞;DC的設(shè)計(jì)原則和句法;了解:ISBD和AACR2;MARC格式起源;

SGML、HTML、XML、DTD;元數(shù)據(jù)應(yīng)用;

DC的擴(kuò)展;

TEI、VRACore3.0、FGDC數(shù)字地理空間元數(shù)據(jù)標(biāo)準(zhǔn)。學(xué)習(xí)要求主要內(nèi)容:本章主要介紹信息組織的技術(shù)標(biāo)準(zhǔn)基本知識(shí),2第三章信息組織技術(shù)標(biāo)準(zhǔn)傳統(tǒng)信息組織技術(shù)標(biāo)準(zhǔn)信息組織的技術(shù)標(biāo)準(zhǔn)概述

章節(jié)簡(jiǎn)介網(wǎng)絡(luò)信息組織技術(shù)標(biāo)準(zhǔn)第三章信息組織技術(shù)標(biāo)準(zhǔn)傳統(tǒng)信息組織技術(shù)標(biāo)準(zhǔn)信息組織的技術(shù)標(biāo)33.1信息組織的技術(shù)標(biāo)準(zhǔn)概述信息組織技術(shù)標(biāo)準(zhǔn)及意義1信息組織技術(shù)標(biāo)準(zhǔn)類(lèi)型23.1信息組織的技術(shù)標(biāo)準(zhǔn)概述信息組織技術(shù)標(biāo)準(zhǔn)及意義1信息組織4信息組織技術(shù)標(biāo)準(zhǔn)

信息組織的技術(shù)標(biāo)準(zhǔn)都是圍繞著各類(lèi)型和各種載體的數(shù)據(jù)或信息的內(nèi)容和形式特征描述與標(biāo)引的的技術(shù)和方法的規(guī)范和統(tǒng)一為目的的。只不過(guò)數(shù)字信息環(huán)境和社會(huì)信息化中,更多地依賴(lài)計(jì)算機(jī)和通信技術(shù),所以,必須與其相關(guān)標(biāo)準(zhǔn)相協(xié)調(diào),使其能夠反映出數(shù)字信息對(duì)描述、鏈接、交換、查詢(xún)、互操作等方面的技術(shù)統(tǒng)一和協(xié)調(diào)的要求。

3.1.1信息組織技術(shù)標(biāo)準(zhǔn)及意義信息組織技術(shù)標(biāo)準(zhǔn)信息組織的技術(shù)5信息組織技術(shù)標(biāo)準(zhǔn)的意義3.1.1信息組織技術(shù)標(biāo)準(zhǔn)及意義信息組織的標(biāo)準(zhǔn)是信息組織工作的基礎(chǔ)

在建設(shè)信息資源庫(kù)時(shí),統(tǒng)一標(biāo)準(zhǔn)非常重要,它直接影響到資源庫(kù)的制作質(zhì)量和查詢(xún)效果,特別是對(duì)信息資源的定義和描述過(guò)程中,執(zhí)行有關(guān)標(biāo)準(zhǔn)才能保證信息組織的規(guī)范性和有效性。信息資源的標(biāo)準(zhǔn)化和規(guī)范化是實(shí)現(xiàn)圖書(shū)館資源共建共享的前提和根本保障。WEB上的元數(shù)據(jù)的各種標(biāo)準(zhǔn)太多,標(biāo)準(zhǔn)間互不相容,且仍在制定,都柏林核心有望成為國(guó)際標(biāo)準(zhǔn)。數(shù)字圖書(shū)館各自采用自己的標(biāo)準(zhǔn)和方法,情況不容樂(lè)觀(guān),但開(kāi)始了標(biāo)準(zhǔn)化的研究信息組織技術(shù)標(biāo)準(zhǔn)的意義3.1.1信息組織技術(shù)標(biāo)準(zhǔn)及意義信63.1.2信息組織技術(shù)標(biāo)準(zhǔn)類(lèi)型信息組織技術(shù)標(biāo)準(zhǔn)網(wǎng)絡(luò)信息組織技術(shù)標(biāo)準(zhǔn)傳統(tǒng)信息組織技術(shù)標(biāo)準(zhǔn)傳統(tǒng)信息組織技術(shù)標(biāo)準(zhǔn)是針對(duì)傳統(tǒng)的信息資源的加工組織,如紙質(zhì)文獻(xiàn)信息,很多標(biāo)準(zhǔn)經(jīng)過(guò)多年實(shí)踐完善,已經(jīng)成為各國(guó)都遵循的成熟的國(guó)際標(biāo)準(zhǔn)。如ISBD、AACR2、MARC等。網(wǎng)絡(luò)信息組織技術(shù)標(biāo)準(zhǔn)是針對(duì)日益擴(kuò)展的網(wǎng)絡(luò)信息而制定的信息組織標(biāo)準(zhǔn)。如置標(biāo)語(yǔ)言、元數(shù)據(jù)等。3.1.2信息組織技術(shù)標(biāo)準(zhǔn)類(lèi)型信息組織網(wǎng)絡(luò)信息組織技術(shù)標(biāo)準(zhǔn)傳73.2傳統(tǒng)信息組織技術(shù)標(biāo)準(zhǔn)著錄標(biāo)準(zhǔn)1機(jī)讀目錄23.2傳統(tǒng)信息組織技術(shù)標(biāo)準(zhǔn)著錄標(biāo)準(zhǔn)1機(jī)讀目錄283.2.1著錄標(biāo)準(zhǔn)1、國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(ISBD)(1)背景概況《國(guó)際標(biāo)準(zhǔn)書(shū)目著錄》是為了實(shí)現(xiàn)文獻(xiàn)著錄的統(tǒng)一和規(guī)范而制定的一套供各類(lèi)型文獻(xiàn)著錄用的國(guó)際標(biāo)準(zhǔn)。目的:A、使不同來(lái)源的數(shù)據(jù)交換成為可能B、可以跨越語(yǔ)言障礙,幫助人們解釋書(shū)目記錄C、使書(shū)目數(shù)據(jù)轉(zhuǎn)換為電子格式更為容易ISDB的發(fā)展和維護(hù)工作是由國(guó)際圖圖聯(lián)書(shū)目控制部的編目組負(fù)責(zé)承擔(dān)的3.2.1著錄標(biāo)準(zhǔn)1、國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(ISBD)(1)93.2.1著錄標(biāo)準(zhǔn)英文簡(jiǎn)稱(chēng)英文全稱(chēng)中文譯名說(shuō)明ISBD(G)GeneralInternationalStandardBibliographicDescription《國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(總則)》1977年第1標(biāo)準(zhǔn)版,1987年第2版。2004修訂版。ISBD(M)InternationalStandardBibliographicDescriptionforMonographicPublications《國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(專(zhuān)著出版物)》1971年推薦本,1974年第1標(biāo)準(zhǔn)版,1987年第2版,2002年修訂版。ISBD(S)InternationalStandardBibliographicDescriptionforSerials

《國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(連續(xù)出版物)》1974初版。1977年第1標(biāo)準(zhǔn)版,1987年第2版。2002被ISBD(CR)取代。ISBD(CM)InternationalStandardBibliographicDescriptionforCartographicMaterials《國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(地圖資料)》1977年第1標(biāo)準(zhǔn)版,1987年第2版。2004修訂征求意見(jiàn)稿。ISBD(NBM)InternationalStandardBibliographicDescriptionforNon-BookMaterial《國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(非書(shū)資料)》1977年公布,1987年第2版。由于正在考慮一體的ISBD,修訂工作推遲表:ISBD體系結(jié)構(gòu)一覽表3.2.1著錄標(biāo)準(zhǔn)英文簡(jiǎn)稱(chēng)英文全稱(chēng)中文譯名說(shuō)明ISBD(103.2.1著錄標(biāo)準(zhǔn)英文簡(jiǎn)稱(chēng)英文全稱(chēng)中文譯名說(shuō)明ISBD(A)InternationalStandardBibliographicDescriptionforAntiquarianMaterials《國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(古籍)》用來(lái)著錄1801年以前出版的專(zhuān)著,1980初版。1991修訂2版。ISBD(PM)InternationalStandardBibliographicDescriptionforPrintedMusic《國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(樂(lè)譜)》1980初版。1991修訂2版。由于正在考慮一體的ISBD,修訂工作推遲ISBD(CF)InternationalStandardBibliographicDescriptionforComputerFiles《國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(計(jì)算機(jī)文件)》1990從ISBD(NBM)分出初版。1997由ISBD(ER)取代。ISBD(ER)InternationalStandardBibliographicDescriptionforElectronicResources《國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(電子資源)》1997根據(jù)ISBD(CF)修訂初版。2004修訂征求意見(jiàn)稿。ISBD(CP)InternationalStandardBibliographicDescriptionforComponentParts《國(guó)際標(biāo)準(zhǔn)書(shū)目著錄(析出文獻(xiàn))》1988初版。2003年在IFLANET發(fā)布。表:ISBD體系結(jié)構(gòu)一覽表3.2.1著錄標(biāo)準(zhǔn)英文簡(jiǎn)稱(chēng)英文全稱(chēng)中文譯名說(shuō)明ISBD(113.2.1著錄標(biāo)準(zhǔn)(2)體系結(jié)構(gòu)A、在文獻(xiàn)著錄規(guī)則的編制體例上,ISBD采用了總則與分則相結(jié)合的方式,形成了一整套完整的文獻(xiàn)著錄規(guī)則;B、ISBD遵循“客觀(guān)描述”的著錄原則,即依據(jù)受編文獻(xiàn)本身的情況如實(shí)著錄;C、ISBD明確規(guī)定了獲取著錄信息的來(lái)源,保證了對(duì)同一種文獻(xiàn)著錄的信息采集具有一致性;D、ISBD還規(guī)定了各個(gè)著錄項(xiàng)目、著錄單元項(xiàng)目的內(nèi)容、次序及其著錄用標(biāo)識(shí)符。3.2.1著錄標(biāo)準(zhǔn)(2)體系結(jié)構(gòu)A、在文獻(xiàn)著錄規(guī)則的編制123.2.1著錄標(biāo)準(zhǔn)3.2.1著錄標(biāo)準(zhǔn)133.2.1著錄標(biāo)準(zhǔn)(1)背景概況AACR2是在現(xiàn)代編目理論指導(dǎo)下,緊密配合ISBD而產(chǎn)生的一部最為著名的編目條例。它的制定為英語(yǔ)世界的文獻(xiàn)編目工作提供了標(biāo)準(zhǔn)化工具,對(duì)世界編目事業(yè)的標(biāo)準(zhǔn)化起到了重要的推動(dòng)作用,也為各國(guó)編目規(guī)則的制定樹(shù)立了典范2、AACR2(《英美編目條例》(第2版)

)3.2.1著錄標(biāo)準(zhǔn)(1)背景概況AACR2是在現(xiàn)代編目理論143.2.1著錄標(biāo)準(zhǔn)貫徹標(biāo)準(zhǔn)化原則堅(jiān)持著者原則

實(shí)行統(tǒng)一標(biāo)目原則(2)AACR2(《英美編目條例》(第2版)

)編制原則3.2.1著錄標(biāo)準(zhǔn)貫徹標(biāo)準(zhǔn)化原則堅(jiān)15(3)AACR2結(jié)構(gòu)和內(nèi)容

AACR2是一部綜合性的著錄條例,它不僅適用于普通圖書(shū),也適用于連續(xù)性出版物及各類(lèi)型文獻(xiàn)。AACR2全書(shū)共分19章,由三部分組成。第一部分為“著錄”,共13章,依據(jù)ISBD的各分則,規(guī)定了各類(lèi)型文獻(xiàn)的著錄項(xiàng)目、著錄項(xiàng)目的順序、標(biāo)識(shí)符號(hào)的使用以及著錄方法等。第二部分為“標(biāo)目、統(tǒng)一題名與參照”,共6章。這一部分對(duì)檢索點(diǎn)的選取、個(gè)人著者與機(jī)關(guān)團(tuán)體標(biāo)目、地理名稱(chēng)、統(tǒng)一題名和參照的著錄分別做出了明確規(guī)定。第三部分是在書(shū)末所附的4種附錄。3.2.1著錄標(biāo)準(zhǔn)(3)AACR2結(jié)構(gòu)和內(nèi)容AAC163.2.1著錄標(biāo)準(zhǔn)ISDB和AACR2與我國(guó)文獻(xiàn)著錄AACR2對(duì)我國(guó)圖書(shū)館的西文文獻(xiàn)著錄工作起到了統(tǒng)一、規(guī)范的作用。2005年,參照《國(guó)際標(biāo)準(zhǔn)著錄規(guī)則》(ISBD)和《英美編目條目規(guī)則》(AACR2)的最新版,《中國(guó)文獻(xiàn)編目規(guī)則》(第二版)完成修訂并出版。這次的修訂主要面向信息化、面向世界、面向社會(huì)需求,實(shí)現(xiàn)與國(guó)際書(shū)目情報(bào)順利交流,使中文書(shū)目數(shù)據(jù)為全世界所共享。3.2.1著錄標(biāo)準(zhǔn)ISDB和AACR2與我國(guó)文獻(xiàn)著錄AACR17機(jī)讀目錄(MARC)

機(jī)讀目錄通常稱(chēng)(Machine-ReadableCatalogue,MARC)譯為“機(jī)器可讀的目錄”為機(jī)讀目錄,它是以代碼形式和特定格式結(jié)構(gòu)記錄在計(jì)算機(jī)存貯載體上,能夠被計(jì)算機(jī)識(shí)別并編輯輸出書(shū)目信息的目錄形式。

3.2.2機(jī)讀目錄機(jī)讀目錄(MARC)機(jī)讀目錄通18可變格式可變長(zhǎng)字段的記錄格式;

采用目次方式;每條MARC記錄分3個(gè)區(qū):它們是頭標(biāo)區(qū)、目次區(qū)和數(shù)據(jù)區(qū);物理記錄和邏輯記錄的關(guān)系。MARC總體結(jié)構(gòu)特點(diǎn)3.2.2機(jī)讀目錄可變格式可變長(zhǎng)字段的記錄格式;采用目次方式;每條MARC記19(1)UNIMARC(2)USMARC

1977年,IFLA為了統(tǒng)一各國(guó)機(jī)讀目錄格式,主持制定了《國(guó)際機(jī)讀目錄格式》(UniversalMARCFor-mat,簡(jiǎn)稱(chēng)UNIMARC)。許多國(guó)家都使用UNIMARC格式作為國(guó)際機(jī)讀書(shū)目記錄交換的格式。

USMARC是美國(guó)國(guó)會(huì)圖書(shū)館的機(jī)讀目錄通信格式,它的前身是MARCII格式。USMARC格式與國(guó)際標(biāo)準(zhǔn)化組織制定的“文獻(xiàn)目錄信息交換用磁帶格式”ISO2709的規(guī)定一致,只不過(guò)在其字段標(biāo)識(shí)和內(nèi)容項(xiàng)目上略有不同。3.2.2機(jī)讀目錄(1)UNIMARC(2)USMARC20(3)CNMARC

中國(guó)機(jī)讀目錄格式《WH/T0503一96》,通常稱(chēng)為CNMARC。它是由國(guó)家書(shū)目機(jī)構(gòu)編制的,由中華人民共和國(guó)文化部于1996年發(fā)布的文化行業(yè)標(biāo)準(zhǔn)。主要用于中國(guó)國(guó)內(nèi)圖書(shū)情報(bào)部門(mén)和其他國(guó)家書(shū)目機(jī)構(gòu)間的書(shū)目信息交換。CNMARC格式是以UNIMARC為依據(jù)的,凡是UNIMARC中定義的字段適合于中國(guó)出版物的有關(guān)規(guī)定都予以保留,并補(bǔ)充了中國(guó)出版物特有而UNIMARC中沒(méi)有的字段定義。

3.2.2機(jī)讀目錄(3)CNMARC中國(guó)機(jī)讀目錄格式《WH/T21記錄頭標(biāo)區(qū)地址目次區(qū)數(shù)據(jù)字段區(qū)記錄分隔符0標(biāo)識(shí)塊1編碼信息塊2著錄塊3附錄塊4連接款目塊5相關(guān)題名塊6主題分析塊7責(zé)任者塊8國(guó)際使用塊9國(guó)內(nèi)使用塊CNMARC記錄結(jié)構(gòu)3.2.2機(jī)讀目錄數(shù)據(jù)字段區(qū)01編碼信息塊2著錄塊3附錄塊4連接款目塊5相關(guān)題223.3網(wǎng)絡(luò)信息組織技術(shù)標(biāo)準(zhǔn)置標(biāo)語(yǔ)言1元數(shù)據(jù)2都柏林核心元素集3其它元數(shù)據(jù)簡(jiǎn)介43.3網(wǎng)絡(luò)信息組織技術(shù)標(biāo)準(zhǔn)置標(biāo)語(yǔ)言1元數(shù)據(jù)2都柏林核心元素集23(1)標(biāo)準(zhǔn)通用置標(biāo)語(yǔ)言(SGML)

標(biāo)準(zhǔn)通用置標(biāo)語(yǔ)言

(StandardGeneralizedMarkupLanguage,SGML)是,是ISO組織于1986年發(fā)布的ISO8879國(guó)際標(biāo)準(zhǔn)。實(shí)際上是一種通用的文檔結(jié)構(gòu)描述置標(biāo)語(yǔ)言,主要用來(lái)定義文獻(xiàn)模型的邏輯和物理類(lèi)結(jié)構(gòu)。它是適合書(shū)目、文獻(xiàn)全文、電子文獻(xiàn)及多媒體信息進(jìn)行描述的一種新的標(biāo)準(zhǔn),它使得信息的描述獨(dú)立于系統(tǒng),獨(dú)立于語(yǔ)種,結(jié)構(gòu)與內(nèi)容分開(kāi),充分地實(shí)現(xiàn)了信息的共享。

3.3.1置標(biāo)語(yǔ)言置標(biāo)語(yǔ)言(markuplanguage),是一種用文本添加標(biāo)記的語(yǔ)言。置標(biāo):就數(shù)據(jù)本身的信息對(duì)數(shù)據(jù)進(jìn)行編碼的方法。(1)標(biāo)準(zhǔn)通用置標(biāo)語(yǔ)言(SGML)24超文本置標(biāo)語(yǔ)言(HTML)

HTML是由SGML派生的實(shí)例置標(biāo)語(yǔ)言,不能作為定義其它置標(biāo)語(yǔ)言的元語(yǔ)言。HTML是一種用來(lái)制作超文本文檔的簡(jiǎn)單標(biāo)記語(yǔ)言。用HTML編寫(xiě)的超文本文檔稱(chēng)為HTML文檔,它能獨(dú)立于各種操作系統(tǒng)平臺(tái)(如UNIX,WINDOWS等)。生成一個(gè)HTML文檔主要有以下3種途徑:手工直接編寫(xiě)(例如用你所喜愛(ài)的ASCII文本編輯器或其它HTML的編輯工具);通過(guò)某些格式轉(zhuǎn)換工具將現(xiàn)有的其它格式文檔(如WORD文檔)轉(zhuǎn)換成HTML文檔;由Web服務(wù)器(或稱(chēng)HTTP服務(wù)器)一方實(shí)時(shí)動(dòng)態(tài)地生成。3.3.1置標(biāo)語(yǔ)言超文本置標(biāo)語(yǔ)言(HTML)25可擴(kuò)展的置標(biāo)語(yǔ)言(XML)

可擴(kuò)展的置標(biāo)語(yǔ)言(ExtensibleMarkupLanguage,XML),是W3C組織于1998年2月發(fā)布的標(biāo)準(zhǔn)。W3C組織制定XML標(biāo)準(zhǔn)的初衷是,定義一種互聯(lián)網(wǎng)上交換數(shù)據(jù)的標(biāo)準(zhǔn)。W3C采取了簡(jiǎn)化SGML的策略,在SGML基礎(chǔ)上,去掉語(yǔ)法定義部分,適當(dāng)簡(jiǎn)化DTD部分,并增加了部分互聯(lián)網(wǎng)的特殊成分。所以XML也可以作為派生其它置標(biāo)語(yǔ)言的元語(yǔ)言。

3.3.1置標(biāo)語(yǔ)言可擴(kuò)展的置標(biāo)語(yǔ)言(XML)26文件類(lèi)型定義(DTD)

DTD規(guī)定了一個(gè)語(yǔ)法分析器解釋一個(gè)“有效的”XML文件所需知道的所有規(guī)則的細(xì)節(jié)。這個(gè)規(guī)則可以非常簡(jiǎn)單,僅僅列出所有有效的元素,例如元素、標(biāo)記、屬性、實(shí)體;也可以非常復(fù)雜,不但列出這些元素,還指出這些元素之間的內(nèi)在聯(lián)系。我們可以把DTD看作一個(gè)或多個(gè)XML文件的模板,這些XML文件中的元素、元素的屬性、元素的排列方式/順序、元素能夠包含的內(nèi)容等,都必須符合DTD中的定義。XML文件中的元素,即我們所創(chuàng)建的標(biāo)記,是根據(jù)我們應(yīng)用的實(shí)際情況來(lái)創(chuàng)建的。3.3.1置標(biāo)語(yǔ)言文件類(lèi)型定義(DTD)273.3.2元數(shù)據(jù)

元數(shù)據(jù)含義

元數(shù)據(jù)法

“元數(shù)據(jù)(Metadata)”就是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”,是對(duì)數(shù)據(jù)進(jìn)行組織和處理的基礎(chǔ)。

元數(shù)據(jù)法就是對(duì)信息單元及其集合進(jìn)行規(guī)范描述從而形成元數(shù)據(jù),并依其將分布式的信息資源整合成有機(jī)信息體系的基準(zhǔn)、方法和工具。

3.3.2元數(shù)據(jù)元數(shù)據(jù)含義元數(shù)據(jù)法“28元數(shù)據(jù)概念的新內(nèi)涵

新的單元:源于數(shù)據(jù)對(duì)象的新技術(shù),而非信息管理系統(tǒng)的新技術(shù),不僅僅針對(duì)印刷型資源。新的功能:目錄記錄、題名清單或其它方面元數(shù)據(jù)單元的熱鏈接為檢索者生成了從外部制作的元數(shù)據(jù)到資源本身的直接的鏈接。通過(guò)使用相關(guān)性排序和概念映射等技術(shù)的運(yùn)算法則,搜索引擎可模仿人工標(biāo)引者的行為生成元數(shù)據(jù)能夠設(shè)定目錄和數(shù)據(jù)庫(kù)檢索軟件以隱藏元數(shù)據(jù)。新的模式:數(shù)據(jù)庫(kù)模式和標(biāo)記模式。3.3.2元數(shù)據(jù)元數(shù)據(jù)概念的新內(nèi)涵新的單元293.3.2元數(shù)據(jù)元數(shù)據(jù)類(lèi)型依據(jù)元數(shù)據(jù)的功能

依據(jù)元數(shù)據(jù)格式的結(jié)構(gòu)復(fù)雜程度

分為全文索引、簡(jiǎn)單結(jié)構(gòu)化格式、特定領(lǐng)域使用的結(jié)構(gòu)更復(fù)雜的元數(shù)據(jù)格式。管理型元數(shù)據(jù)、描述型元數(shù)據(jù)、保存型、技術(shù)型元數(shù)據(jù)和使用型元數(shù)據(jù)。3.3.2元數(shù)據(jù)元數(shù)據(jù)依據(jù)元數(shù)據(jù)的功能依據(jù)元數(shù)據(jù)格式的結(jié)構(gòu)30元數(shù)據(jù)的作用3.3.2元數(shù)據(jù)1)描述:根據(jù)元數(shù)據(jù)的定義,它最基本的功能就在于對(duì)信息對(duì)象的內(nèi)容和位置進(jìn)行描述,從而為信息對(duì)象的存取與利用奠定必要的基礎(chǔ)。都柏林核心元素集所提供的,是信息對(duì)象的識(shí)別而言最為基本的描述信息;而機(jī)讀目錄格式,則為信息對(duì)象提供詳細(xì)級(jí)別的描述。2)定位:元數(shù)據(jù)包含有關(guān)網(wǎng)絡(luò)信息資源位置方面的信息,因而可確定資源的位置所在,促進(jìn)了網(wǎng)絡(luò)環(huán)境中信息對(duì)象的發(fā)現(xiàn)和檢索。3)搜尋:識(shí)別資源的價(jià)值,發(fā)現(xiàn)其真正需要的資源。4)評(píng)估:價(jià)值評(píng)估,作為存取與利用的參考。5)選擇:對(duì)信息對(duì)象的取舍,選擇合適用戶(hù)使用的資源元數(shù)據(jù)的作用3.3.2元數(shù)據(jù)1)描述:根據(jù)元數(shù)據(jù)的定義,它31元數(shù)據(jù)格式

元數(shù)據(jù)的格式通過(guò)三層結(jié)構(gòu)來(lái)完整定義:內(nèi)容結(jié)構(gòu)(ContentStructure),對(duì)該元數(shù)據(jù)的構(gòu)成元素及其定義標(biāo)準(zhǔn)進(jìn)行描述;句法結(jié)構(gòu)(SyntaxStructure),定義元數(shù)據(jù)整體結(jié)構(gòu)以及如何描述這種結(jié)構(gòu);語(yǔ)義結(jié)構(gòu)(SemanticStructure),定義元數(shù)據(jù)元素的具體描述方法。

3.3.2元數(shù)據(jù)元數(shù)據(jù)格式元數(shù)據(jù)的格式通過(guò)三32元數(shù)據(jù)開(kāi)發(fā)應(yīng)用的目的3.3.2元數(shù)據(jù)1)確認(rèn)和檢索:DC是典型的代表2)著錄描述:MARC3)資源組織體系:資源集合的基本描述和對(duì)資源集合的知識(shí)組織體系的描述。4)資源管理:支持對(duì)資源利用和管理過(guò)程的政策與控制機(jī)制的描述。5)資源的保護(hù)和長(zhǎng)期保存6)系統(tǒng)功能和執(zhí)行7)系統(tǒng)建模元數(shù)據(jù)開(kāi)發(fā)應(yīng)用的目的3.3.2元數(shù)據(jù)1)確認(rèn)和檢索:DC是333.3.2元數(shù)據(jù)1)首先需要根據(jù)元數(shù)據(jù)的具體應(yīng)用領(lǐng)域、應(yīng)用目標(biāo)和現(xiàn)有標(biāo)準(zhǔn)體系,利用標(biāo)準(zhǔn)的編碼語(yǔ)言、代碼體系、標(biāo)準(zhǔn)詞匯和描述規(guī)則,定義可描述特定數(shù)據(jù)對(duì)象的元數(shù)據(jù)集,并可能通過(guò)標(biāo)準(zhǔn)復(fù)用機(jī)制在這個(gè)元數(shù)據(jù)集中復(fù)用其它元數(shù)據(jù)集中的某些元素;2)利用標(biāo)準(zhǔn)的標(biāo)記語(yǔ)言(例如XML/RDF)以及所復(fù)用的其它元數(shù)據(jù)集元素來(lái)準(zhǔn)確標(biāo)記元數(shù)據(jù)格式;3)建立一定的系統(tǒng)機(jī)制來(lái)實(shí)現(xiàn)元數(shù)據(jù)標(biāo)注(例如利用標(biāo)引模板系統(tǒng)進(jìn)行DC數(shù)據(jù)標(biāo)引或MARC數(shù)據(jù)標(biāo)引);4)在元數(shù)據(jù)標(biāo)注過(guò)程中可能借助元數(shù)據(jù)挖掘機(jī)制,從所標(biāo)注的數(shù)據(jù)資源中發(fā)現(xiàn)、分析、確認(rèn)和抽取合適的元數(shù)據(jù)元素進(jìn)行標(biāo)注,或者將描述這些數(shù)據(jù)資源的用其它格式定義的元數(shù)據(jù)轉(zhuǎn)換為當(dāng)前格式的元數(shù)據(jù)元素,而這些過(guò)程需要相關(guān)的文獻(xiàn)結(jié)構(gòu)知識(shí)、語(yǔ)義知識(shí)和檢索轉(zhuǎn)換知識(shí)的支持;5)元數(shù)據(jù)標(biāo)注后形成的元數(shù)據(jù)記錄被存放于元數(shù)據(jù)記錄庫(kù)里,該數(shù)據(jù)庫(kù)系統(tǒng)通過(guò)開(kāi)放界面支持標(biāo)準(zhǔn)檢索協(xié)議下對(duì)元數(shù)據(jù)記錄的檢索,并可能支持與其他元數(shù)據(jù)格式間的轉(zhuǎn)換;6)元數(shù)據(jù)記錄可能需要長(zhǎng)期保存,可依照開(kāi)放存檔信息系統(tǒng)模型來(lái)建立長(zhǎng)期保存信息模式和管理機(jī)制。元數(shù)據(jù)開(kāi)發(fā)應(yīng)用生命周期

3.3.2元數(shù)據(jù)1)首先需要根據(jù)元數(shù)據(jù)的具體應(yīng)用領(lǐng)域、應(yīng)用目343.3.2元數(shù)據(jù)1)元數(shù)據(jù)實(shí)驗(yàn)系統(tǒng)(MetadataExperimentalSystem,MES)

元數(shù)據(jù)的應(yīng)用:MES是中國(guó)臺(tái)灣的一個(gè)信息描述與檢索的實(shí)驗(yàn)系統(tǒng),其建立的目的有兩個(gè):一是讓讀者通過(guò)這個(gè)系統(tǒng),對(duì)元數(shù)據(jù)及未來(lái)的可能運(yùn)作方式,有更為具體的了解與認(rèn)識(shí);二是希望利用此實(shí)驗(yàn)系統(tǒng)來(lái)測(cè)試和驗(yàn)證元數(shù)據(jù)的功能與作用,如都柏林核心元素集這種簡(jiǎn)單的信息描述格式,是否如制定者所設(shè)想的,可以滿(mǎn)足網(wǎng)絡(luò)信息資源的描述和檢索需求。就其目前狀況而言,MES仍處于測(cè)試中,初步測(cè)試已顯示運(yùn)作良好,其中包括兩種元數(shù)據(jù)——DC和URN(UniformResourcenames)架構(gòu)。

3.3.2元數(shù)據(jù)1)元數(shù)據(jù)實(shí)驗(yàn)系統(tǒng)(MetadataEx353.3.2元數(shù)據(jù)元數(shù)據(jù)實(shí)驗(yàn)系統(tǒng)的特征:開(kāi)放式設(shè)計(jì)描述和檢索部分開(kāi)放給任何人使用。

MES面向所有人,采用開(kāi)放式描述,但這樣則會(huì)產(chǎn)生描述的結(jié)果不統(tǒng)一、描述的質(zhì)量參差不齊的問(wèn)題,但目前尚無(wú)解決的辦法。b)具有描述和檢索的雙重功能提供精確檢索和模糊檢索c)使用統(tǒng)一資源名稱(chēng)作為信息資源的唯一識(shí)別符3.3.2元數(shù)據(jù)元數(shù)據(jù)實(shí)驗(yàn)系統(tǒng)的特征:開(kāi)放式設(shè)計(jì)b)363.3.2元數(shù)據(jù)2)網(wǎng)絡(luò)信息資源的描述和檢索工具——Spectrum系統(tǒng)

Spectrum系統(tǒng)是OCLC為沒(méi)有專(zhuān)業(yè)編目或標(biāo)記知識(shí)背景的個(gè)人制作描述網(wǎng)絡(luò)信息資源的記錄而設(shè)計(jì)的一種工具。Spectrum系統(tǒng)允許用戶(hù)注冊(cè)和描述因特網(wǎng)上可檢索的信息資源,它由3個(gè)部分組成:記錄生成子系統(tǒng)、記錄轉(zhuǎn)換子系統(tǒng)、記錄檢索子系統(tǒng)。

元數(shù)據(jù)的應(yīng)用:3.3.2元數(shù)據(jù)2)網(wǎng)絡(luò)信息資源的描述和檢索工具——Spe373.3.3都柏林核心元素集都柏林核心元素集(dublincoreelementsSet)通常也被稱(chēng)為都柏林核心(dublincore,DC),是為描述網(wǎng)絡(luò)資源、支持網(wǎng)絡(luò)檢索而建立的元數(shù)據(jù)模式。DC可以說(shuō)是最小的元數(shù)據(jù)元素集,也是目前世界上使用最為廣泛的元數(shù)據(jù)格式。3.3.3都柏林核心元素集都柏林核心元素集(dublinc383.3.3都柏林核心元素集都柏林核心元素集是定位在簡(jiǎn)單的資源描述格式,提供一個(gè)基本數(shù)據(jù)庫(kù),作為各種專(zhuān)業(yè)進(jìn)一步加工處理的基礎(chǔ)。DC具備一下特色,使其成為電子資源描述方面的杰出代表;簡(jiǎn)單明了語(yǔ)義互操作性:提高跨學(xué)科領(lǐng)域語(yǔ)義互操作的可能性國(guó)際認(rèn)同可擴(kuò)展性3.3.3都柏林核心元素集都柏林核心元素集是定位在簡(jiǎn)單的資源393.3.3都柏林核心元素集資源內(nèi)容描述類(lèi)元素title、subject、description、source、language、relation、coverage知識(shí)產(chǎn)權(quán)描述類(lèi)元素creator、publisher、contributor、rights外部屬性描述類(lèi)元素date、type、format、identifier

DC元數(shù)據(jù)的元素(15個(gè))3.3.3都柏林核心元素集資源內(nèi)容描述類(lèi)元素DC元數(shù)據(jù)的元403.3.3都柏林核心元素集為了豐富DC的內(nèi)涵并不斷擴(kuò)充其應(yīng)用的范圍,就需要對(duì)DC元素的內(nèi)容和語(yǔ)義做進(jìn)一步的限定或說(shuō)明,這樣可使其意義更加明確,體現(xiàn)了DC簡(jiǎn)明的特點(diǎn)。

語(yǔ)言(lang):指明元素值的描述元素的語(yǔ)言,并不是所描述的信息資源本身的語(yǔ)言。模式(scheme):指明元素值的確遵從已有或正在討論中的一個(gè)體系架構(gòu)中的合法值類(lèi)型(type):指明元素值是何種類(lèi)型的值,指定了給定元素的一個(gè)方面。

DC元數(shù)據(jù)的限定詞(三類(lèi))3.3.3都柏林核心元素集DC元數(shù)據(jù)的限定詞(三類(lèi))413.3.3都柏林核心元素集類(lèi)型詞表

空間點(diǎn)編碼模式

空間區(qū)域編碼模式時(shí)間編碼模式DC的內(nèi)容編碼規(guī)則

結(jié)構(gòu)化數(shù)值編碼3.3.3都柏林核心元素集類(lèi)型詞表空間點(diǎn)423.3.3都柏林核心元素集內(nèi)在本質(zhì)原則可擴(kuò)展原則語(yǔ)法獨(dú)立原則可選擇性原則可重復(fù)原則可修飾原則

DC設(shè)計(jì)原則3.3.3都柏林核心元素集內(nèi)在本質(zhì)原則DC設(shè)計(jì)原則433.3.3都柏林核心元素集DC元數(shù)據(jù)的基本句法是:<metaname="DC.Element-Name(元素名)"content="Value(元素值)">【例如】<metaname="DC.Title"

content="CrimeandPunishment"><metaname="DC.Contributor.Photographer"

content="Adama,Ansel"><metaname="DC.Type"content="Image;woodblock">

DC的基本句法3.3.3都柏林核心元素集DC元數(shù)據(jù)的基本句法是:DC的基443.3.3都柏林核心元素集DC擴(kuò)展DC應(yīng)用領(lǐng)域擴(kuò)展

DC內(nèi)容描述擴(kuò)展

DC內(nèi)容描述擴(kuò)展工作主要是在DC框架上建立對(duì)特殊類(lèi)別元數(shù)據(jù)的擴(kuò)充或復(fù)用機(jī)制,所建立的各個(gè)特殊元素集作為專(zhuān)門(mén)的命名域可被DC引入和復(fù)用。項(xiàng)目主要包括代理項(xiàng)目、引用項(xiàng)目、藏品項(xiàng)目、教育項(xiàng)目、管理項(xiàng)目。DC應(yīng)用領(lǐng)域擴(kuò)展主要是考慮在具體應(yīng)用領(lǐng)域中如何選擇應(yīng)用DC元素集、限制屬性集和編碼規(guī)則。包括政府機(jī)構(gòu)項(xiàng)目、圖書(shū)館項(xiàng)目、注冊(cè)項(xiàng)目。3.3.3都柏林核心元素集DC擴(kuò)展DC應(yīng)用領(lǐng)域擴(kuò)展DC內(nèi)容453.3.4其它元數(shù)據(jù)簡(jiǎn)介在圖書(shū)館界對(duì)編目標(biāo)準(zhǔn)應(yīng)用于網(wǎng)絡(luò)信息資源的可行性進(jìn)行評(píng)估的同時(shí),人文計(jì)算學(xué)者們開(kāi)發(fā)了一種用于電子文本結(jié)構(gòu)的初始化編碼體系——TEI(TextEncodingInitiative)。TEI項(xiàng)目是一個(gè)合作研究的國(guó)際項(xiàng)目,該項(xiàng)目是由3個(gè)主要的專(zhuān)業(yè)協(xié)會(huì)主持組織的,即美國(guó)計(jì)算語(yǔ)言協(xié)會(huì)(theAssociationforComputationalLinguistics,ACL)、美國(guó)文學(xué)與語(yǔ)言計(jì)算協(xié)會(huì)(theAssociationforLiteraryandLinguisticComputing,AILC)、美國(guó)計(jì)算和人文協(xié)會(huì)(theAssociationforComputingandtheHumanities,ACH)。TEI項(xiàng)目的目的是減少現(xiàn)存編碼的多樣性,提供一個(gè)通用的支持復(fù)雜文本結(jié)構(gòu)的編碼方案。后來(lái)TEI的使用擴(kuò)大到各個(gè)學(xué)科領(lǐng)域,成為電子文本交換的國(guó)際編碼標(biāo)準(zhǔn)。TEI規(guī)定了對(duì)電子文本的描述方法、標(biāo)記定義和記錄結(jié)構(gòu)等,包括元數(shù)據(jù)和內(nèi)容兩部分,使用SGML作為編碼語(yǔ)言,具有平臺(tái)獨(dú)立性、應(yīng)用靈活性和可擴(kuò)展性,能支持對(duì)各種類(lèi)型或特征的電子文本進(jìn)行編碼。電子文本編碼體系(TEI)

3.3.4其它元數(shù)據(jù)簡(jiǎn)介在圖書(shū)館界對(duì)編目標(biāo)準(zhǔn)463.3.4其它元數(shù)據(jù)簡(jiǎn)介可視資源協(xié)會(huì)(V

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論