ecip 自動(dòng)編目軟件系統(tǒng)設(shè)計(jì)思想的探討_第1頁(yè)
ecip 自動(dòng)編目軟件系統(tǒng)設(shè)計(jì)思想的探討_第2頁(yè)
ecip 自動(dòng)編目軟件系統(tǒng)設(shè)計(jì)思想的探討_第3頁(yè)
ecip 自動(dòng)編目軟件系統(tǒng)設(shè)計(jì)思想的探討_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

ECIP自動(dòng)編目軟件系統(tǒng)設(shè)計(jì)思想的探討兼與張麗娟等同志商榷蔣小耘摘要本文對(duì)ECIP計(jì)劃中自動(dòng)編目的MARC標(biāo)準(zhǔn)設(shè)定問題及自動(dòng)編目系統(tǒng)實(shí)現(xiàn)的設(shè)計(jì)思想提出了自己的不同見解。參考文獻(xiàn)6。關(guān)鍵詞ECIP計(jì)劃、自動(dòng)編目、MARC標(biāo)準(zhǔn)、系統(tǒng)設(shè)計(jì)分類號(hào)G25436ABSTRACTTHEDIFFERENTVIEWISRAISEDINTHISPAPERABOUTMARCSTANDARDPROBLEMINAUTOMATICCATALOGINGINECIPPROJECTANDDESIGNIDEAOFTHEREALIZATIONOFAUTOMATICCATALOGINGSYSTEM6REFSKEYWORDSECIPPROJECTAUTOMATICCATALOGINGMARCSTANDARDSYSTEMDESIGNCLASSNUMBERG25436近年來(lái)有關(guān)專家提出在我國(guó)推行ECIP(ELECTRONICCATALOGINGINPUBLICATION)計(jì)劃的構(gòu)想,即利用出版社印前電子文本加注結(jié)構(gòu)標(biāo)簽的方法進(jìn)行自動(dòng)編目,其預(yù)期目標(biāo)是由圖書的電子文本自動(dòng)產(chǎn)生新書預(yù)報(bào)與正式書目數(shù)據(jù)以后,全社會(huì)都可以享用這一成果,發(fā)行界和圖書館界都不用另行編目,(見中國(guó)圖書館學(xué)報(bào)04年第4期張麗娟CNMARC存在的問題與ECIP計(jì)劃的實(shí)施。)令人振奮。進(jìn)一步研讀了ECIP實(shí)施方案的有關(guān)著述(見陳源蒸中文圖書ECIP與自動(dòng)編目手冊(cè)),對(duì)其中系統(tǒng)實(shí)現(xiàn)的設(shè)計(jì)思想產(chǎn)生了不同看法。本文擬就此問題進(jìn)行探討。ECIP自動(dòng)編目系統(tǒng)的設(shè)計(jì)思想可簡(jiǎn)單概括為對(duì)圖書的印前電子文本用XML語(yǔ)言描述的DC元數(shù)據(jù)在電子文本上加注結(jié)構(gòu)標(biāo)簽使線性文件轉(zhuǎn)換為數(shù)據(jù)庫(kù)文件從而達(dá)到一次錄入,生成兩種產(chǎn)品(圖書館機(jī)讀目錄、圖書)的目的。這一轉(zhuǎn)換過程是通過簡(jiǎn)化CNMARC字段;限制字段指示符的選擇性定義以達(dá)到MARC與DC的匹配來(lái)實(shí)現(xiàn)的。筆者認(rèn)為,這一設(shè)計(jì)思想忽略了其產(chǎn)品的使用者對(duì)組織知識(shí)的需要,所導(dǎo)致的方法論上的錯(cuò)位制約了其目標(biāo)的實(shí)現(xiàn)。圖書館編制機(jī)讀目錄的目的,一是為了多重揭示文獻(xiàn),滿足讀者獲取文獻(xiàn)知識(shí)的需求,二是數(shù)據(jù)交換、資源共享。這兩方面的主導(dǎo)因素被設(shè)計(jì)者忽略了。1ECIP的自動(dòng)編目MARC標(biāo)準(zhǔn)設(shè)定中忽略的因素11與國(guó)際接軌的因素IFLA(國(guó)際圖書館協(xié)會(huì)聯(lián)合會(huì))的UBC(UNIVERSALBIBLIOGRAPHICCONTROL,國(guó)際書目控制)計(jì)劃要求“對(duì)世界各國(guó)發(fā)表的主要出版物以一種國(guó)際上可接受的方式,全面而迅速地作出基本目錄。”這個(gè)國(guó)際上可接受的方式在我國(guó)即物化為采用UNIMARC基礎(chǔ)上的CNMARC格式編制可用于書目信息交流的機(jī)讀目錄。既然ECIP產(chǎn)生的是”圖書館都不用編目”的源頭書目數(shù)據(jù),其采用的MARC格式將CNMARC的479個(gè)字段及近千個(gè)子字段中,處理中文圖書的123個(gè)字段簡(jiǎn)化為47個(gè)字段,159個(gè)子字段,其書目描述如此不統(tǒng)一是不利于書目數(shù)據(jù)共享和交換的。其標(biāo)準(zhǔn)與國(guó)際標(biāo)準(zhǔn)相去甚遠(yuǎn)。12圖書館業(yè)務(wù)規(guī)范因素我國(guó)自90年在UNIMARC的基礎(chǔ)上制定了機(jī)讀目錄標(biāo)準(zhǔn)CNMARC,經(jīng)過圖書館人的10多年努力實(shí)現(xiàn)了圖書館服務(wù)流程的自動(dòng)化,但我們不能不看到存在的隱憂,大量的回溯建庫(kù)過程中,圖書的快速進(jìn)入數(shù)據(jù)庫(kù)只要能外借就行;各館自編MARC在相關(guān)字段未作連接等即簡(jiǎn)單著錄形成的不規(guī)范機(jī)讀目錄,對(duì)于圖書館來(lái)說(shuō),表面上雖已完成了編目數(shù)據(jù)但結(jié)果帶來(lái)的負(fù)面影響是,由于書目數(shù)據(jù)建設(shè)是一個(gè)不可逆過程,作為被描述的對(duì)象圖書一旦入庫(kù)如特征描述的不充分就不能被讀者檢索到,無(wú)形中因?yàn)榇嬖跈z出障礙未被讀者利用而使得隱性文獻(xiàn)不時(shí)產(chǎn)生,這樣的資源浪費(fèi)現(xiàn)象是普遍存在的。這就從一個(gè)側(cè)面提示我們實(shí)體特征描述如果標(biāo)準(zhǔn)過于簡(jiǎn)單,則會(huì)阻礙圖書館目標(biāo)的實(shí)現(xiàn)。13讀者利用文獻(xiàn)的需求因素讀者期望圖書館提供的機(jī)讀目錄應(yīng)該是能夠滿足其多方面需要的一個(gè)完整的檢索體系,MARC作為機(jī)讀目錄的著錄標(biāo)準(zhǔn),應(yīng)當(dāng)將著錄過程中對(duì)文獻(xiàn)實(shí)體描述的各種數(shù)據(jù)元素盡量考慮周全,應(yīng)當(dāng)圍繞怎樣充分地揭示文獻(xiàn)的各種特征,使之充分展現(xiàn)出來(lái)為出發(fā)點(diǎn)來(lái)設(shè)置各項(xiàng)字段的定義及功用。機(jī)讀目錄作為一個(gè)完整的檢索體系,就要考量影響讀者查準(zhǔn)、查全的各種因素,予以避免,才能滿足使用者各種目的的需要。ECIP的MARC對(duì)CNMARC的3、4、5字段均有大量的合并。僅以512517、540這7個(gè)字段合并為共用一個(gè)517而言,將7種不同的定義混為一種來(lái)描述,只能是對(duì)檢索點(diǎn)的減少及對(duì)特征描述準(zhǔn)確性的削弱,給讀者快速準(zhǔn)確的檢出形成障礙。例如由機(jī)械工業(yè)出版社出版的2003年(第2版)的封面書名為最新考研英語(yǔ)閱讀理解220篇,書名頁(yè)、版權(quán)記錄、書脊等處的書名均是碩士研究生入學(xué)考試英語(yǔ)理解220篇按照?qǐng)D書著錄主要信息源為書名頁(yè)和版權(quán)頁(yè)的編目規(guī)則CNMARC著錄2001A碩士研究生入學(xué)考試英語(yǔ)理解220篇5121A最新考研英語(yǔ)閱讀理解220篇其意義當(dāng)封面題名與正題名區(qū)別較大時(shí),用512字段為讀者增設(shè)檢索點(diǎn),生成附注導(dǎo)語(yǔ)為“封面題名”,專指度明確、特征醒目易檢得。當(dāng)讀者對(duì)兩個(gè)不同題名難以判斷準(zhǔn)確入口時(shí),用有專指的封面題名入口進(jìn)入,一檢即得。ECIP的MARC數(shù)據(jù)為2001A碩士研究生入學(xué)考試英語(yǔ)理解220篇5171A最新考研英語(yǔ)閱讀理解220篇其意義將“封面題名”512字段檢索點(diǎn)取消放入“其他題名”中去檢索,專指度模糊、特征隱去,范圍擴(kuò)大,不易檢得。甚至當(dāng)讀者將醒目的封面題名錯(cuò)當(dāng)成正題名、又將在內(nèi)部的書名頁(yè)正題名當(dāng)成其它題名來(lái)檢索時(shí),就會(huì)形成無(wú)法檢出的局面。因此,筆者認(rèn)為,CNMARC格式不但不能認(rèn)為“復(fù)雜煩瑣”,而是應(yīng)當(dāng)進(jìn)一步充實(shí)增設(shè)新的識(shí)別功能字段,才能達(dá)到一個(gè)利于讀者使用的完整檢索體系的要求。字段中,既要有反映文獻(xiàn)內(nèi)容與特征的基本著錄數(shù)據(jù)元素,以滿足基本檢索,又要進(jìn)一步揭示文獻(xiàn)多方面不同關(guān)系的輔助著錄元素,以反映現(xiàn)代科技發(fā)展各學(xué)科之間相互滲透和交叉的關(guān)系,滿足讀者多元檢索的需要,傳統(tǒng)圖書文獻(xiàn)編目中有“用、代、屬、分、參、族”等參照關(guān)系著錄,正是為了從多重角度揭示圖書,書目數(shù)字存儲(chǔ)的著錄元素與傳統(tǒng)的圖書著錄元素沒什么本質(zhì)的區(qū)別。現(xiàn)有CNMARC3字段附注塊、4字段連接款目塊、5字段相關(guān)題名塊各自所定義的內(nèi)容及所起的作用是互不相同的,其各子字段的設(shè)置,正是涵蓋了剖析印刷版圖書的物理結(jié)構(gòu),確定書目記錄所需要的數(shù)據(jù)元素過程中,須處理的各種千差萬(wàn)別的不同狀況,就象醫(yī)生看病對(duì)癥下藥,不同的癥狀就要用不同的藥方一樣,根據(jù)檢索數(shù)據(jù)的需要而有所選擇,它是對(duì)文獻(xiàn)附屬特征進(jìn)行多重立體揭示的不可或缺的工具。對(duì)其進(jìn)行刪減是不切實(shí)際的。MARC格式在反映文獻(xiàn)內(nèi)容特征上還應(yīng)有新的建樹,應(yīng)擴(kuò)充6字段主題、類目塊,以適應(yīng)當(dāng)今信息交叉相互滲透所帶來(lái)的隱性文獻(xiàn)不時(shí)產(chǎn)生的嚴(yán)峻現(xiàn)實(shí),因?yàn)橐环N圖書在圖書館面對(duì)讀者的實(shí)際架位中只能擁有一個(gè)分類號(hào),而對(duì)于文獻(xiàn)內(nèi)容涉及廣泛的分支、交叉、邊緣科學(xué)時(shí),一個(gè)分類號(hào)是難以將文獻(xiàn)中其他的內(nèi)容特征反映出來(lái)的,無(wú)形中使這部分文獻(xiàn)淹沒在知識(shí)的海洋中。因此應(yīng)增加析出類目、交替類目主標(biāo)題字段、并生成附注,將“互見”與“參見”等功能反映出來(lái),可以幫助讀者去發(fā)現(xiàn)更多的有用文獻(xiàn),使許多表面上看上去不相干實(shí)際卻相互牽連的文獻(xiàn)浮出水面。總之,從讀者的角度來(lái)說(shuō),文獻(xiàn)特征揭示的越充分,就越有利于其需求的實(shí)現(xiàn)。MARC字段的簡(jiǎn)化不利于文獻(xiàn)的深層揭示。2關(guān)于ECIP的自動(dòng)編目系統(tǒng)實(shí)現(xiàn)的問題21取消規(guī)范控制字段收縮檢索功能MARC數(shù)據(jù)記錄進(jìn)行組織、序化形成機(jī)讀目錄須有賴于機(jī)器的識(shí)別,識(shí)別的過程須有標(biāo)記的指引,即指示符與檢索點(diǎn)字段連接而成的檢索數(shù)據(jù)的作用。用適當(dāng)?shù)能浖ぞ邔繑?shù)據(jù)、檢索數(shù)據(jù)轉(zhuǎn)化為能在計(jì)算機(jī)上運(yùn)行的軟件,完成規(guī)范控制,從而建立完整的檢索系統(tǒng)。ECIP的“自動(dòng)編目”對(duì)書目的規(guī)范控制處理方法中,取消了500、540與730字段,6塊和7塊的3子字段,認(rèn)為“對(duì)于用戶而言,更不可能進(jìn)行規(guī)范檢索?!惫P者認(rèn)為這一觀點(diǎn)更是違背了客觀實(shí)際的需要。以500字段來(lái)分析500字段的功能是當(dāng)文獻(xiàn)有多個(gè)題名時(shí),選擇一個(gè)人們通常慣用的題名來(lái)標(biāo)識(shí)并形成檢索點(diǎn)。例如2001A石頭記F曹雪芹著50010A紅樓夢(mèng)紅樓夢(mèng)作為統(tǒng)一題名并作為檢索點(diǎn),在檢索時(shí)使石頭記也同時(shí)被檢出。此項(xiàng)功能滿足了族性檢索的需要,國(guó)際圖聯(lián)數(shù)目控制機(jī)構(gòu)在其出版的文件中也有這方面的要求即那些主要是用于古典的佚名作品的統(tǒng)一題名,是記錄的主要組成部分,必須交換,因?yàn)檫@樣的統(tǒng)一題名很可能是唯一的檢索點(diǎn)。至于其他那些不作為主款目標(biāo)目的統(tǒng)一題名,雖然意義較小,但還是建議將他們包括在交換記錄中。包括條約、法律、協(xié)定等的統(tǒng)一標(biāo)目也應(yīng)放在500字段中作為統(tǒng)一題名處理。ECIP書目作為源頭書目,不考慮這些因素,就不能夠形成一個(gè)高質(zhì)量的可交換書目。同時(shí)500、540字段的取消進(jìn)一步削弱了族性檢索的功能。22取消字段指示符選擇性定義制約客體描述的完整性、準(zhǔn)確性字段指示符在檢索系統(tǒng)中的作用是為字段內(nèi)容、記錄中某些數(shù)據(jù)處理時(shí)所需的操作通過定義提供選擇性信息。ECIP自動(dòng)編目取消字段指示符的選擇性定義,只采用一種賦值即計(jì)算機(jī)自動(dòng)插入其固定賦值(使原來(lái)的對(duì)實(shí)體描述由不同選擇變?yōu)橐环N選擇)以便于軟件系統(tǒng)自動(dòng)轉(zhuǎn)換數(shù)據(jù)(DC元數(shù)據(jù)MARC數(shù)據(jù)),使線性文件轉(zhuǎn)換為數(shù)據(jù)庫(kù)文件。這樣的結(jié)果,MARC與DC是實(shí)現(xiàn)了對(duì)接,但客觀上弱化了事物之間的相互聯(lián)系與事物多樣性的客觀規(guī)律,結(jié)果不可能令人滿意。原因在于兩者有著不同的學(xué)術(shù)意義和應(yīng)用價(jià)值,簡(jiǎn)單的等同只能獲得對(duì)客體平面的描述。不妨剖析一下兩者的不同價(jià)值。(1)元數(shù)據(jù)的意義和應(yīng)用價(jià)值元數(shù)據(jù)是針對(duì)網(wǎng)絡(luò)信息標(biāo)引發(fā)展起來(lái)的,其本意是用盡可能少的元數(shù)據(jù)反映盡可能多的原始數(shù)據(jù)信息,沒有詞匯控制和標(biāo)準(zhǔn)描述,是簡(jiǎn)化問題的一種追求,包含15個(gè)元素。其適用格式主要是HTML文檔、XML文檔,致使其在描述其他領(lǐng)域的信息資源時(shí)存在著較大的局限性,即類目或元素不足,在文獻(xiàn)信息處理中,元數(shù)據(jù)主要關(guān)注文獻(xiàn)的外在形式特征,因而適用于組織信息?;谠獢?shù)據(jù)的信息組織的一個(gè)顯著特點(diǎn)是實(shí)體描述模型為樹型結(jié)構(gòu),各元素在概念上沒有交叉滲透。(2)MARC的意義和應(yīng)用價(jià)值MARC是書目標(biāo)引的機(jī)讀格式,其基本元素是某一領(lǐng)域的元概念,其對(duì)實(shí)體描述的模型為網(wǎng)型結(jié)構(gòu),各級(jí)概念間可以相互交叉滲透。這種模型的框架基礎(chǔ)是形式本體論,形式本體論是針對(duì)特定領(lǐng)域的知識(shí)處理發(fā)展起來(lái)的,它以特定領(lǐng)域的知識(shí)資源作背景,通過某領(lǐng)域的形式本體論將該領(lǐng)域的知識(shí)組織起來(lái),構(gòu)成基于本體論的知識(shí)研究系統(tǒng),因而在知識(shí)組織與知識(shí)處理中具有特別的學(xué)術(shù)意義和應(yīng)用價(jià)值。在文獻(xiàn)信息處理中,本體論主要關(guān)注文獻(xiàn)的內(nèi)在內(nèi)容特征,因而適用于組織知識(shí)。相對(duì)于信息而言,知識(shí)具有穩(wěn)定的內(nèi)容結(jié)構(gòu);相對(duì)于知識(shí)而言,信息具有動(dòng)態(tài)的價(jià)值功能。這一區(qū)別構(gòu)成了組織信息適用元數(shù)據(jù)而組織知識(shí)適用本體論的局面。圖書館面對(duì)讀者提供的書目檢索系統(tǒng)正是一個(gè)組織知識(shí)的過程,化簡(jiǎn)MARC、取消字段指示符的選擇性定義以適應(yīng)DC的對(duì)應(yīng),不等于削足適履嗎3結(jié)束語(yǔ)綜上所述,ECIP自動(dòng)編目采用XML語(yǔ)言描述的DC元數(shù)據(jù)在圖書的印前電子文本上加注結(jié)構(gòu)標(biāo)簽,使線性文件轉(zhuǎn)換為數(shù)據(jù)庫(kù)文件,從而達(dá)到一次錄入,兩種產(chǎn)品的目的是可以實(shí)現(xiàn)的,但由于其構(gòu)造軟件系統(tǒng)在方法論上的錯(cuò)位則必然導(dǎo)致結(jié)果的簡(jiǎn)單化,其能夠產(chǎn)生供圖書館進(jìn)一步加以擴(kuò)充的基本書目數(shù)據(jù),滿足圖書館能夠把書借出去的初級(jí)要求,要完成圖書館深層揭示文獻(xiàn)外部與內(nèi)容特征的要求,還需依賴于基于形式化表達(dá)的本體論的知識(shí)組織模式。兩者有效融合的契機(jī)應(yīng)該有個(gè)顛倒,即用于ECIP自動(dòng)編目的DC元數(shù)據(jù)標(biāo)準(zhǔn)擴(kuò)充改造,以適應(yīng)文獻(xiàn)深層揭示的需要,這是有待進(jìn)一步研究的問題。參考文獻(xiàn)1張麗娟CNMARC存在的問題與ECIP計(jì)劃的實(shí)施中國(guó)圖書館學(xué)報(bào),2004(4)67692陳源蒸中文圖書ECIP與自動(dòng)編目手冊(cè)北京北京圖書館出版社,20033潘太明等中國(guó)機(jī)讀目錄格式使用手冊(cè)(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論