版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
信息檢索技術(shù)
第五講:壹主題語(yǔ)言的演變貳代碼語(yǔ)言叁計(jì)算機(jī)檢索技術(shù)肆檢索流程及效果評(píng)價(jià)目錄CONTENTS主題檢索語(yǔ)言的演變
主題是一組具有共性事物的總稱,用以表達(dá)文獻(xiàn)所論述和研究的具體對(duì)象與問(wèn)題,即文獻(xiàn)的中心內(nèi)容,表達(dá)主題概念的詞匯就是主題詞。以主題詞作為文獻(xiàn)內(nèi)容標(biāo)識(shí)和檢索依據(jù)的語(yǔ)言就是主題語(yǔ)言,它以自然語(yǔ)言的字符為字符,用一組名詞術(shù)語(yǔ)作為檢索標(biāo)識(shí)。以主題語(yǔ)言來(lái)描述和表達(dá)信息內(nèi)容的信息處理方法稱為主題法。主題語(yǔ)言包括四種
(1)標(biāo)題詞語(yǔ)言,是最早使用的一種主題語(yǔ)言。它以規(guī)范化的自然語(yǔ)義作為標(biāo)識(shí),來(lái)表達(dá)文獻(xiàn)涉及的主題概念,表達(dá)主題的詞語(yǔ)稱為標(biāo)題詞。
(2)單元詞語(yǔ)言,是從文獻(xiàn)內(nèi)容中抽選出來(lái)的最基本的詞匯,將代表最一般、最基本的、不可再分割的概念的詞作為單獨(dú)標(biāo)引文獻(xiàn)的單位。
(3)敘詞語(yǔ)言,是從自然語(yǔ)言中優(yōu)選出來(lái)并經(jīng)過(guò)規(guī)范化處理的名詞術(shù)語(yǔ)。采用表示單元概念的規(guī)范化詞語(yǔ)的組配,對(duì)文獻(xiàn)內(nèi)容主題進(jìn)行描述,也是目前使用最廣泛的主題語(yǔ)言。
(4)關(guān)鍵詞語(yǔ)言,以關(guān)鍵詞作為文獻(xiàn)內(nèi)容標(biāo)識(shí)和檢索依據(jù)的一種主題語(yǔ)言。關(guān)鍵詞是指人文獻(xiàn)內(nèi)容中抽出來(lái)的關(guān)鍵的、未經(jīng)規(guī)范化處理的自由詞匯,關(guān)鍵詞不受詞表控制。
案例:《大學(xué)圖書(shū)館的圖書(shū)采購(gòu)》標(biāo)題詞法:圖書(shū)館,大學(xué),學(xué)府
,購(gòu)置單元詞法:大學(xué)—圖書(shū)館—圖書(shū)—采購(gòu)敘詞法:
大學(xué)圖書(shū)館&院校圖書(shū)館院校圖書(shū)館—圖書(shū)采購(gòu)關(guān)鍵詞法:大學(xué)圖書(shū)館—采購(gòu)大學(xué)圖書(shū)館—圖書(shū)采購(gòu)大學(xué)—圖書(shū)館采購(gòu)大學(xué)圖書(shū)館采購(gòu)標(biāo)題法開(kāi)始:1856年,英國(guó)Crestadoro發(fā)表《圖書(shū)館的編目技術(shù)》形成:1895年出版的《美國(guó)圖書(shū)館學(xué)會(huì)標(biāo)題表》和1911年誕生的《美國(guó)國(guó)會(huì)圖書(shū)館標(biāo)題表》
標(biāo)題法:以“標(biāo)題”表達(dá)文獻(xiàn)內(nèi)容主題,“標(biāo)題”最初取自篇名,逐漸發(fā)展到取自文獻(xiàn)的主題內(nèi)容標(biāo)題法標(biāo)題詞描述語(yǔ)言:
標(biāo)題語(yǔ)言是最早產(chǎn)生的一種主題語(yǔ)言。標(biāo)題是主題標(biāo)目(SubjectHeading)的簡(jiǎn)稱,它是直接表達(dá)文獻(xiàn)主題的標(biāo)識(shí),大多是對(duì)文獻(xiàn)內(nèi)容所論及事物名稱及特征的規(guī)范表達(dá)。眾多標(biāo)題集合而成的主題標(biāo)識(shí)系統(tǒng),就是標(biāo)題語(yǔ)言。標(biāo)題法TEXTTEXTTEXT優(yōu)點(diǎn):(1)對(duì)標(biāo)題詞進(jìn)行規(guī)范,達(dá)到詞的單義(2)對(duì)標(biāo)題細(xì)分:帶說(shuō)明語(yǔ)的單級(jí)標(biāo)題,如“十二指腸潰瘍”多級(jí)標(biāo)題,如“胃-潰瘍”、“胃-生理”、“胃-腫瘤”倒置標(biāo)題,如“肝炎,中毒性”、“肝炎,酒精性”、“肝炎,先天性”帶限定詞的標(biāo)題,如“桔(樹(shù))”、“桔(水果)”標(biāo)題法(3)為集中同一主題的文獻(xiàn),將方面概念作副標(biāo)題,如“病因”、“診斷”、“治療”(4)用參照系統(tǒng)顯示標(biāo)題詞間等同關(guān)系、等級(jí)和相關(guān)關(guān)系總之,大量采用詞組或短語(yǔ)作標(biāo)題,含義明確、結(jié)構(gòu)穩(wěn)定、專指度比較高。標(biāo)題法缺點(diǎn):先組式語(yǔ)言,標(biāo)題固定不能多元標(biāo)引和多元檢索,不靈活不能解決文獻(xiàn)“集中與分散”的矛盾
20世紀(jì)30-40年代,分面分類理論逐步發(fā)展,由此產(chǎn)生單元詞法、敘詞法。單元詞法早期的后組式主題檢索語(yǔ)言
20世紀(jì)50年代初,美國(guó)陶伯(M.Taube)等創(chuàng)立單元詞法:以字面上不能再分的詞匯單元——元詞作標(biāo)識(shí),以字面組配表達(dá)文獻(xiàn)主題。單元詞法優(yōu)點(diǎn):與標(biāo)題語(yǔ)言一樣,標(biāo)識(shí)受控將“標(biāo)題”分解為單元詞,通過(guò)若干單元詞的組配專指地表達(dá)主題概念,是后組式檢索語(yǔ)言如:胃+潰瘍+治療每個(gè)單元詞都可作為檢索入口,提供多途徑檢索可利用單元詞的增減擴(kuò)大、縮小或改變檢索范圍單元詞法缺點(diǎn):對(duì)詞組的分解是字面分解,組配也是字面組配,易導(dǎo)致語(yǔ)義失真及誤檢
字面組配概念組配香蕉蘋(píng)果香蕉+蘋(píng)果香蕉味食品+蘋(píng)果胃潰瘍出血胃+潰瘍+出血胃潰瘍+消化性潰瘍出血
缺乏完善的參照系統(tǒng),不利于族性檢索敘詞法新型的后組式主題檢索語(yǔ)言
與單元詞出現(xiàn)同期,美國(guó)穆?tīng)査?C.N.Mooers)創(chuàng)造是對(duì)單元詞語(yǔ)言的直接繼承,但克服了單元詞語(yǔ)言的不足,吸收并綜合了多種標(biāo)引語(yǔ)言的原理和方法,是能結(jié)合計(jì)算機(jī)使用的后組式語(yǔ)言。敘詞法AtthefirstGodmadetheheavenandtheearthAtthefirstGodmadetheheavenandtheearth概念組配與字面組配在形式上有時(shí)相同,有時(shí)不同;而從性質(zhì)上來(lái)看兩者區(qū)別是很大的。字面組配是詞的分析與組合(拆詞);概念組配是概念的分析與綜合(拆義)。例如:字面組配
概念組配
文獻(xiàn)+檢索-->文獻(xiàn)檢索
文獻(xiàn)+檢索-->文獻(xiàn)檢索
廣東+潮?。?gt;廣東潮劇廣東地方劇+潮?。?gt;廣東潮劇
香蕉+蘋(píng)果-->香蕉蘋(píng)果
香蕉味食品+蘋(píng)果-->香蕉蘋(píng)果敘詞法AtthefirstGodmadetheheavenandtheearthAtthefirstGodmadetheheavenandtheearth在以上第一例中,無(wú)論是字面組配還是概念組配,其結(jié)果都是“文獻(xiàn)檢索”,第二例“廣東”和“潮劇”,如果用“廣東”檢索則范圍太廣泛,用“廣東地方劇”更符合檢索要求;第三例中,根據(jù)字面組配原理,“香蕉”和“蘋(píng)果”組配是“香蕉蘋(píng)果”,而概念組配的結(jié)果應(yīng)是指“一種香蕉和蘋(píng)果雜交的品種”,而這樣的品種目前是不存在的。所謂“香蕉蘋(píng)果”只能是一種有香蕉味的蘋(píng)果,因此,根據(jù)概念組配原理,這個(gè)概念應(yīng)當(dāng)用“香蕉味的食品”和“蘋(píng)果”兩個(gè)詞組配,才符合概念邏輯。敘詞法AtthefirstGodmadetheheavenandtheearthAtthefirstGodmadetheheavenandtheearth優(yōu)點(diǎn):
概念組配準(zhǔn)確,標(biāo)引能力強(qiáng)
結(jié)構(gòu)完備,詞匯控制嚴(yán)格
適合多途徑檢索,檢索效率高
對(duì)檢索系統(tǒng)的適應(yīng)性強(qiáng)缺點(diǎn):
敘詞表編制和管理難度較大
利用敘詞語(yǔ)言標(biāo)引和檢索較復(fù)雜,信息報(bào)道速度相對(duì)較慢敘詞法AtthefirstGodmadetheheavenandtheearthAtthefirstGodmadetheheavenandtheearth我國(guó)目前使用最廣的《中國(guó)分類主題詞表》(前身是《漢語(yǔ)主題詞表》)就是屬于敘詞法,有電子版和印刷版兩種形式?!吨袊?guó)分類主題詞表》是分類主題一體化的詞表,與《中圖法》相互對(duì)應(yīng),這對(duì)文獻(xiàn)信息的組織和檢索十分方便??梢钥闯?,各個(gè)主題詞及其之間的關(guān)系是嚴(yán)格控制的,從而構(gòu)成一個(gè)嚴(yán)密的語(yǔ)義網(wǎng)絡(luò),為建立高效的文獻(xiàn)信息檢索系統(tǒng)提供了保證。
《中國(guó)分類主題詞表》實(shí)例關(guān)鍵詞法/1127AtthefirstGodmadetheheavenandtheearthAtthefirstGodmadetheheavenandtheearth自然語(yǔ)言形式的情報(bào)檢索語(yǔ)言
隨計(jì)算機(jī)出現(xiàn),為適應(yīng)索引編制自動(dòng)化的需要產(chǎn)生直接以自然語(yǔ)言中未經(jīng)控制或只作少量控制的語(yǔ)詞為文獻(xiàn)主題標(biāo)識(shí),通過(guò)關(guān)鍵詞輪排方法揭示文獻(xiàn)主題。關(guān)鍵詞法AtthefirstGodmadetheheavenandtheearth例如:“國(guó)際聯(lián)機(jī)檢索概論”中的“國(guó)際聯(lián)機(jī)”、“聯(lián)機(jī)”、“檢索”都是能描述這篇文獻(xiàn)的主題的,可以作為檢索詞。eavenandtheearth它與標(biāo)題詞語(yǔ)言、敘詞語(yǔ)言同屬主題法系統(tǒng)。但是,標(biāo)題詞語(yǔ)言、敘詞語(yǔ)言使用的都是經(jīng)規(guī)范化的自然語(yǔ)言,而關(guān)鍵詞語(yǔ)言基本上不作規(guī)范化處理。關(guān)鍵詞法AtthefirstGodmadetheheavenandtheearthAtthefirstGodmadetheheavenandtheearth優(yōu)點(diǎn):
直接源于自然詞匯,專指性優(yōu)于其它主題語(yǔ)言
標(biāo)引無(wú)需查表,簡(jiǎn)便易行,節(jié)省人力
及時(shí)更新詞匯,報(bào)道信息快(新冠)
適于計(jì)算機(jī)自動(dòng)抽詞標(biāo)引,標(biāo)引一致性高、標(biāo)引深
度大關(guān)鍵詞法AtthefirstGodmadetheheavenandtheearthAtthefirstGodmadetheheavenandtheearth缺點(diǎn):詞語(yǔ)不規(guī)范,不能顯示詞間的等同關(guān)系、等級(jí)關(guān)系和相關(guān)關(guān)系,查全率、查準(zhǔn)率相對(duì)較低代碼語(yǔ)言代碼語(yǔ)言
代碼語(yǔ)言是指對(duì)事物的某方面特征,用某種代碼系統(tǒng)來(lái)表示和排列事物概念,從而提共檢索的檢索語(yǔ)言。代碼多種多樣,通常用數(shù)字、字母或用它們結(jié)合的形式或以分段的方式來(lái)表示其各部分的含義。例如,科技報(bào)告有報(bào)告號(hào),還有合同號(hào)、撥款號(hào)等;專利文獻(xiàn)有專利號(hào)、入藏號(hào)、公司代碼等。類型特點(diǎn)優(yōu)點(diǎn)缺點(diǎn)分類語(yǔ)言聚集相同學(xué)科門(mén)類和主題內(nèi)容的文獻(xiàn),使雜亂無(wú)序的文獻(xiàn)有序化按學(xué)科分門(mén)別類地集中文獻(xiàn),揭示各個(gè)類目在內(nèi)容上的邏輯聯(lián)系,提供從學(xué)科角度進(jìn)行族性檢索的途徑;便于隨時(shí)放寬或縮小檢索范圍無(wú)法反映新學(xué)科和新技術(shù)的內(nèi)容;不能全面檢索有關(guān)跨學(xué)科專業(yè)的某事物的所有文獻(xiàn);不適應(yīng)新興學(xué)科和邊緣學(xué)科的檢索主題語(yǔ)言以代表文獻(xiàn)內(nèi)容特征和科學(xué)概念的名詞術(shù)語(yǔ)作為檢索標(biāo)識(shí)使檢索具有直接性與直觀性;適合于從事物出發(fā)按專題進(jìn)行特性檢索缺乏按學(xué)科進(jìn)行族性檢索的能力;缺乏表述專度較高的復(fù)雜概念的能力分類語(yǔ)言
PK主題語(yǔ)言計(jì)算機(jī)檢索技術(shù)
檢索技術(shù),是指利用光盤(pán)數(shù)據(jù)庫(kù)、聯(lián)機(jī)數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、搜索引繁等進(jìn)行信息檢索,采用的相關(guān)技術(shù),主要包括布爾邏輯檢索、截詞檢索、字段檢索、詞位置檢索加權(quán)檢索等1、布爾邏輯檢索
所謂布爾邏輯檢索,是用布爾邏輯運(yùn)算符將檢索詞、短語(yǔ)或代碼進(jìn)行邏輯組配來(lái)指定文獻(xiàn)的命中條件和組配次序,用以檢索出符合邏輯組配所規(guī)定條件的記錄。它是計(jì)算機(jī)檢索系統(tǒng)中最常用的一種檢索方法。
布爾邏輯運(yùn)算符有三種,即邏輯與、邏輯或和邏輯非。名稱表達(dá)形式檢索式圖示作用邏輯與AND、﹡、并且、并含A
ANDB縮小檢索范圍邏輯或OR、+、或者、或含A
ORB擴(kuò)大檢索范圍邏輯非NOT、一、非,、不含ANOTB縮小檢索范圍布爾邏輯運(yùn)算符及其作用BABABA2、截詞檢索
截詞檢索是指用給定的詞干作為檢索詞,用以檢索出含有該詞干的全部檢索詞的記錄。它可以起到擴(kuò)大檢索范圍、提高查全率、減少檢索詞的輸入量、節(jié)省檢索時(shí)間等作用。檢索時(shí),當(dāng)遇到名詞的單復(fù)數(shù)形式、詞的不同拼寫(xiě)法、詞的前綴或后綴變化時(shí)均可采用此方法。
截詞的方式有多種。按截?cái)嗖课豢煞譃榍敖財(cái)?、后截?cái)唷⒅虚g截?cái)?、前后截?cái)嗟劝唇財(cái)嘧址臄?shù)量,可以分為有限截?cái)嗪蜔o(wú)限截?cái)唷8鳈z索系統(tǒng)使用的截詞符號(hào)各不相同,有*、?、$、%等。(1)前截?cái)?截去某個(gè)詞的前部,進(jìn)行詞的后方一致比較,也稱后方一致檢索。例如,輸入“*logy”能夠檢出含有biology、technology等詞的記錄(2)后截?cái)?截去某個(gè)詞的后部,進(jìn)行詞的前方一致比較,也稱前方一致檢索。例如,輸入“integra*”能夠檢出含有integral、integrate、integrated、integrating、integration、integrative、integrator等詞的記錄(3)中間截?cái)?截去某個(gè)詞的中間部分,進(jìn)行詞的兩邊一致比較檢索例如,輸入“rac??et”能夠檢索含有racquet、racket等詞的記錄。(4)前后截?cái)?截去某個(gè)詞的前部和后部,進(jìn)行詞的中間一致比較檢索。例如,輸入“*chemi*”可以檢出chemical、chemistry、biochemical等詞的記錄。注:不同的檢索系統(tǒng)所用的截詞符不一樣,使用前應(yīng)先查一下幫助或檢索提示(tips)加以確認(rèn)。3、字段檢索
字段檢索是指將檢索詞限定(Within)在某個(gè)或某些字段中,用以檢索某個(gè)或某些字段含有該檢索詞的記錄。通常有兩種方式。(1)通過(guò)下拉菜單選擇檢索字段。此時(shí),字段名一般用全稱表示,如題名、摘要、Title、Abstract等。(2)輸入檢索字段符限定檢索字段。此時(shí),字段名一般用字段符表示,各檢索系統(tǒng)的字段符各不相同。檢索字段符是對(duì)檢索詞出現(xiàn)的字段范圍進(jìn)行限定。執(zhí)行時(shí),機(jī)器只對(duì)指定的字段進(jìn)行檢索,經(jīng)常應(yīng)用于檢索結(jié)果的調(diào)整。常用的檢索字段見(jiàn)下表。字段全稱中文名稱簡(jiǎn)稱字段全稱中文名稱簡(jiǎn)稱Title標(biāo)題tiJournalName期刊名稱jnAbstract文摘abSource來(lái)源出版物信息soKeywords關(guān)鍵詞keLanguage語(yǔ)種laSubject/Topic主題詞DEDocumentType文獻(xiàn)類型DTAuthor作者auPublicationYear出版年代pyFull-text全文FTDocumentNo記錄號(hào)DNCorporateSource單位或機(jī)構(gòu)名稱coCountry出版國(guó)co
常用的檢索字段案例:要查詢高波教授的文章,就應(yīng)將“高波”限制在“作者”字段,如果要查詢高波教授指導(dǎo)研究生的畢業(yè)論文,就應(yīng)將“高波”限制在“導(dǎo)師”字段。又如要檢索關(guān)于研究老舍的論文,輸入“老舍”時(shí)必須選擇途徑為“標(biāo)題”或“關(guān)鍵詞”,不能選擇作者途徑。這是因?yàn)椤袄仙帷痹谶@里是被研究的對(duì)象而不是論文的作者。選擇的字段不同,得到的檢索結(jié)果也會(huì)不同。選自全文字段,得到的檢索結(jié)果的數(shù)量最多,但相關(guān)度最低;選擇題名和關(guān)鍵字段,得到的檢索結(jié)果的數(shù)量最少,但相關(guān)度最高;選擇文摘字段,得到的檢索結(jié)果則介于兩者之間。通常用核心概念、前提概念限定篇名、關(guān)鍵詞;用次要概念、集合概念限定主題、文摘。需要注意的是限定文摘字段,會(huì)漏檢沒(méi)有摘要的論文。4、詞位置檢索詞位置檢索,是指在檢索詞之間使用位置算符,來(lái)規(guī)定算符兩邊的檢索詞出現(xiàn)在記錄中的位置,用以檢索出含有檢索詞且檢索詞之間的位置也符合特定要求的記錄。1.詞位置算符詞位置算符包括(W)、(N)算符,用于限定檢索詞的相互位置以滿足某些條件。W是With的縮寫(xiě),表示其兩側(cè)的檢索詞必須按前后順序出現(xiàn)在記錄中,且兩詞之間不允許插入其他詞,只可能有空格或一個(gè)標(biāo)點(diǎn)符號(hào)。其可擴(kuò)展為(nW),n為自然數(shù),表示其兩側(cè)的檢索詞之間最多可插入n個(gè)詞。例如,“l(fā)ight(W)rail”,表示rail必須緊跟在light之后,中間不允許插入其他詞,q且位置不能顛倒?!發(fā)ight(4W)rail”表示light之間最多可插入4個(gè)詞,但兩個(gè)詞的位置不能顛倒。N是Near的縮寫(xiě),(N)表示其兩側(cè)的檢索詞位置可以顛倒,在兩次之間不能插入其他詞。(nN)為其擴(kuò)展,表示其兩側(cè)的檢索詞之間最多可插入n個(gè)詞。例如,“computer(N)network”,其檢中記錄可包含“computernetwork”或“networkcomputer”。“computer(2N)network”,表示computer與network之間可插入2個(gè)詞,其先后順序可以顛倒。
加權(quán)檢索是指根據(jù)檢索詞對(duì)檢索課題的重要程度,事先指定不同的權(quán)值。檢索時(shí),系統(tǒng)先查找這些檢索詞在數(shù)據(jù)庫(kù)記錄中是否存在,再對(duì)存在的檢索詞計(jì)算它們的權(quán)值總和。凡是在用戶指定的臨界值(閾值)之上者作為命中記錄輸出。臨界值可視命中記錄的多少而靈活地調(diào)整。臨界值越高,命中記錄越少。搜索引擎通常以“+”和“-”來(lái)表示檢索詞一定在檢索結(jié)果中出現(xiàn),或一定不在檢索結(jié)果中出現(xiàn),這相當(dāng)于加杈檢索。5、加權(quán)檢索
檢索式是指將各檢索單元(其中最多的是表達(dá)主題內(nèi)容的檢索詞)之間的邏輯關(guān)系、位置關(guān)系等,用檢索系統(tǒng)規(guī)定的各種組配符(也稱算符)連接起來(lái),成為計(jì)算機(jī)可識(shí)別和執(zhí)行的命令形式。檢索式是檢索策略的具體體現(xiàn),它控制著檢索過(guò)程。檢索式是否合理關(guān)系到能否檢索到最相關(guān)的信息。a、針對(duì)不同搜索引擎、數(shù)據(jù)庫(kù)和不同的信息需求,有不同的檢索策略,其檢索式的構(gòu)造也各有不同。b、設(shè)計(jì)合理的檢索式成為控制和提高檢索質(zhì)量的關(guān)鍵。c、檢索式的表達(dá)不是唯一的,而是有多種選擇、組配、限定的。
d、當(dāng)檢索過(guò)于復(fù)雜,檢索要求難以用一個(gè)檢索式來(lái)表達(dá)時(shí),應(yīng)該采用分步檢索或二次檢索以提高查準(zhǔn)率。
e、編寫(xiě)檢索式時(shí)最重要的是注意檢索途徑與檢索詞的正確匹配。檢索式用邏輯“與”、邏輯“或”邏輯“非”檢索“法律的淵源”的信息。作答正常使用主觀題需2.0以上版本雨課堂可為此題添加文本、圖片、公式等解析,且需將內(nèi)容全部放在本區(qū)域內(nèi)。正常使用需3.0以上版本不能單憑字面解析,需要先了解概念層面,區(qū)分要檢索的是論文還是課題。主觀題10分答案解析寫(xiě)出“防撞氣囊在汽車安全中的應(yīng)用”的檢索式。作答正常使用主觀題需2.0以上版本雨課堂可為此題添加文本、圖片、公式等解析,且需將內(nèi)容全部放在本區(qū)域內(nèi)。正常使用需3.0以上版本“防撞氣囊”*“汽車”主觀題10分答案解析研究“法律與經(jīng)濟(jì)和政治的關(guān)系”的課題,要如何設(shè)置檢索式?作答正常使用主觀題需2.0以上版本雨課堂可為此題添加文本、圖片、公式等解析,且需將內(nèi)容全部放在本區(qū)域內(nèi)。正常使用需3.0以上版本法律*(經(jīng)濟(jì)+政治)主觀題10分答案解析檢索流程及效果評(píng)價(jià)信息需求與信息檢索的對(duì)應(yīng)關(guān)系
一般情況下,大部分的信息需求,最后會(huì)轉(zhuǎn)化為信息檢索的行為。信息檢索人員認(rèn)識(shí)到的信息需求不同于客觀信息需求。由于主觀因素、專業(yè)知識(shí)、認(rèn)識(shí)能力等的差異,檢索人員有可能對(duì)信息需求產(chǎn)生錯(cuò)誤的或片面的認(rèn)識(shí),或者是對(duì)認(rèn)識(shí)到的問(wèn)題存在表達(dá)障礙。也就是說(shuō),有時(shí)候用戶能夠正確地表達(dá)出來(lái)的信息需求,與其客觀信息需求之間存在著相當(dāng)大的差距。這些因素都會(huì)導(dǎo)致信息檢索策略的不準(zhǔn)確或檢索結(jié)果的失敗。信息需求及其對(duì)應(yīng)的信息檢索類型如下表所示。檢索類型需求特點(diǎn)檢索特點(diǎn)適用類型重點(diǎn)文獻(xiàn)普查類需要全面收集某一主題的文獻(xiàn)資料需求帶有普查、追溯的特點(diǎn),要求高的查全率立項(xiàng)、綜述、申請(qǐng)發(fā)明、編寫(xiě)教材,進(jìn)行基礎(chǔ)理論研究的用戶專利、期刊及會(huì)議論文、科技報(bào)告、各類綜述等攻關(guān)類需要收集有關(guān)特定方面的文獻(xiàn)資料具有專指性的特點(diǎn),要求盡量高的查準(zhǔn)率科研、生產(chǎn)中需要解決某一關(guān)鍵問(wèn)題的用戶專利、期刊和會(huì)議論文、產(chǎn)品說(shuō)明書(shū)、標(biāo)準(zhǔn)探索類需要了解和掌握某一領(lǐng)域的最新研究動(dòng)向或研發(fā)成果信息需求具有及時(shí)的特點(diǎn),要求檢索結(jié)果盡可能“新”研究、開(kāi)發(fā)和應(yīng)用新技術(shù)、新理論的用戶期刊及會(huì)議論文檢索流程檢索流程是從確立信息需求到信息需求滿足的全過(guò)程。對(duì)于不同的檢索系統(tǒng)、不同的課題、不同的用戶來(lái)說(shuō),其具體檢索流程有所不同。通用信息檢索流程一般包括:分析檢索課題、選擇檢索工具、確定檢索策略、調(diào)整檢索策略及獲取原始文獻(xiàn)等流程,見(jiàn)圖3-11。信息需求用戶信息分析選擇檢索工具確定檢索策略檢索匹配輸出檢索結(jié)果檢索結(jié)束用戶評(píng)價(jià)滿意不滿意調(diào)整檢索策略圖3-11檢索通用流程圖調(diào)整檢索策略之前,首先要分析結(jié)果不理想的原因。若是檢索結(jié)果輸出的篇數(shù)過(guò)多,其原因可能是:選用了多個(gè)多義性的檢索詞;截詞截得過(guò)短;輸入的檢索詞太少;應(yīng)該使用AND卻用了OR;優(yōu)先運(yùn)算符用錯(cuò)。若是檢索結(jié)果輸出的篇數(shù)過(guò)少,其原因可能是:錯(cuò)選數(shù)據(jù)庫(kù);檢索詞概念錯(cuò)誤或拼寫(xiě)錯(cuò)誤;檢索詞過(guò)于冷僻或者具體;沒(méi)有使用截詞符;位置算符與字段算符用得過(guò)多;使用過(guò)多的AND算符。選用了不規(guī)范的主題詞或某些產(chǎn)品的俗稱、商品名作為檢索詞;同義詞、近義詞或隱含概念沒(méi)有得到充分考慮,上位概念或下位概念沒(méi)有得到完整運(yùn)用等。檢索結(jié)果不理想的原因檢索效果評(píng)價(jià)信息檢索效果是利用檢索系統(tǒng)進(jìn)行檢索所產(chǎn)生的有效結(jié)果。檢索效果評(píng)價(jià)是根據(jù)一定指標(biāo),對(duì)實(shí)施信息檢索活動(dòng)所取得的成果進(jìn)行客觀科學(xué)的評(píng)價(jià),以進(jìn)一步完善檢索工作的過(guò)程檢索系統(tǒng)的檢索效果指標(biāo)包括收錄范圍、查全率、查準(zhǔn)率、響應(yīng)時(shí)間、用戶負(fù)擔(dān)及輸出形式。其中兩個(gè)主要的衡量指標(biāo)是查全率和查準(zhǔn)率。這些指標(biāo)不僅可進(jìn)行定性的,也可進(jìn)行定量的評(píng)價(jià)。查全率=被檢出的相關(guān)文獻(xiàn)篇數(shù)/數(shù)據(jù)庫(kù)中的相關(guān)文獻(xiàn)篇數(shù)x100%查準(zhǔn)率-被檢出的相關(guān)文獻(xiàn)篇數(shù)/被檢出的文獻(xiàn)的總篇數(shù)x100%
(1)網(wǎng)絡(luò)環(huán)境下信息檢索方法主要是關(guān)鍵詞檢索,其主要考慮的是關(guān)鍵詞出現(xiàn)的位置和頻率。此方法有兩個(gè)缺陷:一是檢索結(jié)果多是在字面上符合用戶的要求,實(shí)際內(nèi)容往往偏離用戶的實(shí)際需要;二是用戶輸入的檢索詞稍有偏差,檢索系統(tǒng)就無(wú)法確定用戶的真正需要,因而無(wú)法提交正確的結(jié)果。
(2)無(wú)法發(fā)掘隱性信息,由于一些隱性信息的存在,用戶不能及時(shí)準(zhǔn)確地從繁雜的檢索系統(tǒng)中找到自己所需的信息。造成檢索系統(tǒng)的檢索效果不佳的原因主要有以下兩點(diǎn)從用戶的角度考慮,可以從檢索到的文獻(xiàn)的相關(guān)性、適用性、新穎性三個(gè)方面判斷檢索效果是否滿意。
(1)相關(guān)性。即用戶判斷檢索到的文獻(xiàn)信息與實(shí)際信息需求之間關(guān)系的標(biāo)準(zhǔn)?,F(xiàn)實(shí)的信息系統(tǒng)是回答用檢索式表達(dá)后的信息提問(wèn)。雖然檢出的是與信息提問(wèn)相關(guān)的信息,但不一定是真正切題的信息,用戶只有在閱讀文獻(xiàn)信息后才能對(duì)其切題性作出判斷。
(2)適用性。即檢索到的文獻(xiàn)對(duì)用戶的實(shí)際需要的滿足程度或能夠給用戶帶來(lái)的效果和產(chǎn)生的效益。
(3)新穎性。即對(duì)用戶而言,從檢索系統(tǒng)中檢出來(lái)的、含有新穎信息的文獻(xiàn)數(shù)與文檔中總相關(guān)文
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 機(jī)加班組安全培訓(xùn)教材課件
- 《數(shù)控機(jī)床電氣控制》-05任務(wù)九 了解常見(jiàn)的典型數(shù)控系統(tǒng)
- 癌痛護(hù)理疼痛評(píng)估質(zhì)量控制
- 機(jī)具使用安全培訓(xùn)課件
- 機(jī)關(guān)安全消防培訓(xùn)課件
- 2026年青海建筑職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試備考試題帶答案解析
- 2026年重慶電力高等??茖W(xué)校單招職業(yè)技能筆試模擬試題帶答案解析
- 2026年紹興職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試備考試題帶答案解析
- 2026年宿州職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試參考題庫(kù)帶答案解析
- 2026年江西交通職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能筆試模擬試題帶答案解析
- 2025中國(guó)甲狀腺相關(guān)眼病診斷和治療指南
- 測(cè)繪測(cè)量設(shè)備保密制度范文
- 腦卒中后吞咽障礙的護(hù)理
- 麻醉機(jī)檢查流程
- 廣告標(biāo)識(shí)牌采購(gòu)?fù)稑?biāo)方案
- 提升信息素養(yǎng)教學(xué)課件
- 2025CSCO子宮內(nèi)膜癌新進(jìn)展及指南更新要點(diǎn)
- 血站采血操作規(guī)范
- 學(xué)校“1530”安全教育記錄表(2024年秋季全學(xué)期)
- DBJ50T-306-2018 建設(shè)工程檔案編制驗(yàn)收標(biāo)準(zhǔn)
- 植物生物化學(xué)
評(píng)論
0/150
提交評(píng)論