文獻(xiàn)信息檢索基本原理及方法.ppt_第1頁(yè)
文獻(xiàn)信息檢索基本原理及方法.ppt_第2頁(yè)
文獻(xiàn)信息檢索基本原理及方法.ppt_第3頁(yè)
文獻(xiàn)信息檢索基本原理及方法.ppt_第4頁(yè)
文獻(xiàn)信息檢索基本原理及方法.ppt_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三章文獻(xiàn)信息檢索基本原理及方法,3.1.1 文獻(xiàn)信息檢索的基本含義,一、文獻(xiàn)信息檢索的基本含義,“檢索”即“查找”之意。信息檢索,是將信息按照一定的方式組織、存儲(chǔ)起來(lái),并針對(duì)用戶的需要查找所需信息的過(guò)程。因此信息檢索包含了信息的存儲(chǔ)和檢索兩個(gè)不可分的部分。我們通常所說(shuō)的信息檢索是指狹義的信息檢索,即從檢索工具和檢索系統(tǒng)中查找所需信息的過(guò)程及其所采取的一系列方法和策略。,3.1.2 文獻(xiàn)信息檢索的類(lèi)型,手工檢索和計(jì)算機(jī)檢索的關(guān)系:手檢是基礎(chǔ),機(jī)檢是發(fā)展方向。,3.1.2 文獻(xiàn)信息檢索的類(lèi)型,按檢索要求劃分:,相關(guān)性檢索是系統(tǒng)不直接回答用戶所提出的技術(shù)問(wèn)題本身,而是只提供與之相關(guān)的文獻(xiàn)供用戶參考

2、。 確定性檢索是以數(shù)據(jù)或事實(shí)為檢索對(duì)象,系統(tǒng)要直接問(wèn)答用戶提出的技術(shù)問(wèn)題,即直接提供用戶需要的確切的數(shù)據(jù)或事實(shí)。,文獻(xiàn)信息檢索的類(lèi)型,根據(jù)檢索對(duì)象劃分 書(shū)目檢索:是以文獻(xiàn)線索為檢索對(duì)象的文獻(xiàn)檢索,即檢索檢索系統(tǒng)存儲(chǔ)的是以二次文獻(xiàn)為對(duì)象(目錄、索引、文摘)的信息,他們是文獻(xiàn)信息的外部特征與內(nèi)容特征的描述集合體,信息用戶通過(guò)檢索,獲取的是原文的“替代物”。用戶通過(guò)檢索獲得的是與檢索課題有關(guān)的一系列文獻(xiàn)線索,然后再通過(guò)閱讀決定取舍。 全文檢索:是以文獻(xiàn)所含的全部信息作為檢索內(nèi)容的文獻(xiàn)檢索,即檢索系統(tǒng)提供的是整篇文章或整部圖書(shū)的全部?jī)?nèi)容,檢索時(shí)可以查找到原文以及有關(guān)的句、段、接、章等文字,并可進(jìn)行各種

3、頻率統(tǒng)計(jì)和內(nèi)容分析。全文檢索主要是用自然語(yǔ)言表達(dá)檢索課題。較適用于某些參考價(jià)值大的典據(jù)性文獻(xiàn)。全文檢索是當(dāng)前計(jì)算機(jī)檢索的發(fā)展方向之一。 數(shù)據(jù)信息檢索:數(shù)據(jù)信息是指檢索系統(tǒng)中存儲(chǔ)的是數(shù)值型數(shù)據(jù),如科學(xué)技術(shù)常數(shù)、各種統(tǒng)計(jì)數(shù)據(jù)等,信息用戶可用通過(guò)檢索獲得的經(jīng)過(guò)核實(shí)、整理的數(shù)值信息再做定量分析。 事實(shí)信息檢索:又稱事項(xiàng)檢索。是指系以事實(shí)為檢索內(nèi)容的情報(bào)檢索,其檢索對(duì)象包括事實(shí)、概念、思想、知識(shí)、人物的基本信息等內(nèi)容,事實(shí)檢索也是一種確定性檢索,用戶獲得的是有關(guān)某一事物的具體答案。,3.2 文獻(xiàn)信息檢索原理,文獻(xiàn)信息檢索的基本原理:就是用戶根據(jù)課題需要,將代 表需要查找的檢索提問(wèn)標(biāo)識(shí)與文獻(xiàn)庫(kù)中所存儲(chǔ)的文

4、獻(xiàn)特征標(biāo)識(shí) 進(jìn)行比較,當(dāng)文獻(xiàn)庫(kù)中所存儲(chǔ)的文獻(xiàn)特征標(biāo)識(shí)與檢索提問(wèn)標(biāo)識(shí) 相一致,或文獻(xiàn)特征標(biāo)識(shí)包含了檢索提問(wèn)標(biāo)識(shí)時(shí),那么具有這 些特征的標(biāo)識(shí)就被檢出,即是命中的結(jié)果。,文獻(xiàn)信息,信息存儲(chǔ)與檢索原理流程圖,文獻(xiàn)信息,檢索課題,文獻(xiàn)信息特征,檢索課題信息,檢索語(yǔ)言和名稱規(guī)范,文獻(xiàn)信息標(biāo)識(shí),檢索提問(wèn)標(biāo)識(shí),文 獻(xiàn) 信 息 檢 索 系 統(tǒng),檢 索 結(jié) 果,分 析,標(biāo) 引,形 成,輸 入,匹配 輸出,輸 入,形成,選 用,分析,檢索語(yǔ)言,在信息檢索工作中,檢索語(yǔ)言亦稱情報(bào)檢索語(yǔ)言,在存儲(chǔ)和檢索過(guò)程中,檢索語(yǔ)言起著重要的作用。它把信息的內(nèi)容特征和外表特征簡(jiǎn)明而有效的揭示出來(lái),并保證了文獻(xiàn)存儲(chǔ)的集中化和系統(tǒng)化,使

5、有規(guī)律的檢索成為可能;溝通檢索人員和標(biāo)引人員的思想,引導(dǎo)檢索人員和標(biāo)引人員理解一致,避免檢索的漏誤。具體而言:它能夠保證不同標(biāo)引人員表達(dá)文獻(xiàn)的一致性,保證不同檢索人員檢索提問(wèn)的一致性,保證檢索提問(wèn)與文獻(xiàn)標(biāo)引的一致性。,檢索語(yǔ)言的定義:檢索語(yǔ)言是從自然語(yǔ)言精選出來(lái)的 一整套詞匯、符號(hào),用以對(duì)文獻(xiàn)內(nèi)容和信息特征進(jìn)行 概括和規(guī)范。它是文獻(xiàn)的標(biāo)引系統(tǒng),也是讀者檢索使 用的一種符號(hào)系統(tǒng),是檢索工具和參考工具書(shū)的重要 組成部分。,檢索語(yǔ)言,檢 索 語(yǔ) 言,詞匯,語(yǔ)法,詞匯是指收錄在類(lèi)表和詞表中的所有標(biāo)識(shí),如分類(lèi)號(hào)、檢索詞、代碼等,是可識(shí)別詞匯。,語(yǔ)法是指如何創(chuàng)造和運(yùn)用標(biāo)識(shí)來(lái)準(zhǔn)確表達(dá)信息內(nèi)容特征,以有效實(shí)現(xiàn)

6、信息檢索的一整套規(guī)則。,檢索語(yǔ)言,檢索語(yǔ)言須具備三個(gè)基本要素: 有一套專用字符來(lái)構(gòu)建詞匯; 有一定數(shù)量的基本詞匯用來(lái)表達(dá)基本概念; 有一套專用語(yǔ)法規(guī)則,用嚴(yán)格的句法手段和詞法對(duì)詞匯 進(jìn)行控制,以準(zhǔn)確表達(dá)各種各樣的概念。,一種較好的檢索語(yǔ)言應(yīng)具有對(duì)多種檢索要求的 廣泛適應(yīng)性,保證有較高的查全率和查準(zhǔn)率; 具有對(duì)多種學(xué)科和多種信息類(lèi)型的適應(yīng)性;具 有與其他檢索語(yǔ)言的兼容性和國(guó)際通用性。,檢索語(yǔ)言,檢索語(yǔ)言的分類(lèi)劃分,檢索語(yǔ)言,分類(lèi)語(yǔ)言,概 念,是指以數(shù)字、字母或數(shù)字與字母結(jié)合作為基本字 符,以基本類(lèi)目為基本詞匯,以類(lèi)目的從屬關(guān)系 來(lái)表達(dá)概念間相互關(guān)系的一類(lèi)檢索語(yǔ)言。,分類(lèi)原理:分類(lèi)是對(duì)知識(shí)概念的劃

7、分。分類(lèi)語(yǔ)言是用分類(lèi)號(hào)來(lái)表達(dá)學(xué)科體 系的各種概念,將各種知識(shí)要領(lǐng)按學(xué)科性質(zhì)進(jìn)行分類(lèi)和系統(tǒng)排列。即以學(xué) 科分類(lèi)為基礎(chǔ),按照概念劃分的原理,將知識(shí)分門(mén)別類(lèi)地按一定的邏輯次 序,從總到分,從具體到一般,從簡(jiǎn)單到復(fù)雜、進(jìn)行層層劃分,層層隸屬, 形成一個(gè)嚴(yán)格有序、層次分明的知識(shí)門(mén)類(lèi)體系,以便從知識(shí)分類(lèi)的角度按 學(xué)科、分專業(yè)地集中信息,揭示各類(lèi)信息在內(nèi)容上的聯(lián)系與區(qū)別,提供從 學(xué)科分類(lèi)角度檢索信息的途徑。,檢索語(yǔ)言,是一種描述概念性語(yǔ)言,它用語(yǔ)詞直接表達(dá)文獻(xiàn)的主題, 這些語(yǔ)詞就是表達(dá)主題概念的標(biāo)識(shí)。將這些作標(biāo)識(shí)的語(yǔ) 詞按字順序排列并使用參照系統(tǒng)來(lái)間接表達(dá)各種概念之 間的關(guān)系,這就是主題語(yǔ)言。,主題語(yǔ)言,檢

8、索語(yǔ)言,又稱標(biāo)題詞語(yǔ)言,是最早使用的一種主題詞語(yǔ)言,以標(biāo)題詞作為表達(dá)文獻(xiàn)內(nèi)容和檢索依據(jù)、完全先組式規(guī)范化的檢索語(yǔ)言。 標(biāo)題詞主標(biāo)題詞和副標(biāo)題詞。 利用標(biāo)題詞語(yǔ)言編制的檢索工具質(zhì)量較好,組配固定,不易混亂,有較好通用性、直接性和專指性。可通過(guò)“見(jiàn)”和“參見(jiàn)”擴(kuò)大檢索范圍,提高查全率。 缺點(diǎn)是系統(tǒng)性差,內(nèi)容相關(guān)的分散在多處,靈活性差,不能任意組配檢索。,是從文獻(xiàn)標(biāo)題或文章正文中抽出來(lái)的,對(duì)表達(dá)文獻(xiàn)主題具有實(shí)質(zhì)意義的詞匯,它對(duì)能否檢索到文獻(xiàn)起著關(guān)鍵性的作用,故稱為關(guān)鍵詞。關(guān)鍵詞語(yǔ)言也是主題詞語(yǔ)言之一,但和標(biāo)題詞語(yǔ)言、敘詞語(yǔ)言不同,它是一種用自然語(yǔ)言作標(biāo)識(shí)的檢索語(yǔ)言。,是以單元詞作為文獻(xiàn)內(nèi)容標(biāo)識(shí)和檢索

9、依據(jù)的一種主題語(yǔ)言。單元詞是從文獻(xiàn)正文、摘要或題目中抽取出來(lái)的、最基本的、其概念不可再分的詞。,敘詞語(yǔ)言是在分類(lèi)語(yǔ)言、標(biāo)題詞語(yǔ)言、關(guān)鍵詞語(yǔ)言和單元詞語(yǔ)言的基礎(chǔ)上發(fā)展起來(lái)的,它是以自然語(yǔ)言為基礎(chǔ),其基本性質(zhì)是采用表示單元概念的規(guī)范化詞匯進(jìn)行組培,用它來(lái)描述文獻(xiàn)主題的概念。 敘詞語(yǔ)言是主題詞語(yǔ)言的高級(jí)形式,是一種后組式信息檢索語(yǔ)言,現(xiàn)已占據(jù)了主題詞語(yǔ)言的主導(dǎo)地位,特別適用于計(jì)算機(jī)檢索。,檢索語(yǔ)言,主題語(yǔ)言,敘 詞 的 組 配,概念的相交組配,概念并列組配,概念限定組配,由于不同概念相交就會(huì) 形成一個(gè)新概念,這個(gè) 新概念是組配前各概念的 下位概念。如:“電子”和 “信息”組配產(chǎn)生電子信息。 組配結(jié)果

10、,可提高查準(zhǔn)率。,同級(jí)詞間不同概念并 列也會(huì)形成一個(gè)新概 念,這個(gè)新概念是組配 前各概念的上位概念。 如“數(shù)字計(jì)算機(jī)”和“模 擬計(jì)算機(jī)”組培后得 到“計(jì)算機(jī)”這一新的 上位概念。組配結(jié)果, 提高查全率。,是不同級(jí)詞間的組配,是用 時(shí)間、空間和學(xué)科范圍某一 方面的屬性進(jìn)行限定的一種 概念關(guān)系。如:“建筑物”為 主體事物,“設(shè)計(jì)”為某個(gè)方 面,組配結(jié)果被限定為“建 筑物設(shè)計(jì)”這個(gè)新概念,組配 結(jié)果可使檢索到的文獻(xiàn)專指度 和查全率提高。,檢索語(yǔ)言,按規(guī)范化程度劃分:規(guī)范化語(yǔ)言(受控語(yǔ)言) 和非規(guī)范化語(yǔ)言(自然語(yǔ)言) 規(guī)范化語(yǔ)言(人工語(yǔ)言):是人為地對(duì)標(biāo)引詞和檢索詞 的詞義進(jìn)行控制和規(guī)范,使每一個(gè)詞只

11、能表達(dá)一個(gè)概念。 如:分類(lèi)語(yǔ)言、標(biāo)題詞語(yǔ)言、敘詞語(yǔ)言。 非規(guī)范化語(yǔ)言(自然語(yǔ)言):在信息檢索系統(tǒng)中使用 直接從原始信息中抽取出來(lái)的未經(jīng)規(guī)范化處理、用以揭 示信息主題概念的自由詞,如:關(guān)鍵詞語(yǔ)言。,檢索語(yǔ)言,按組配方式劃分:先組式語(yǔ)言和后組式語(yǔ)言 先組式語(yǔ)言:指描述文獻(xiàn)主題概念的標(biāo)識(shí)在檢索之前就已經(jīng) 事先固定好了的標(biāo)識(shí)系統(tǒng)。如:分類(lèi)語(yǔ)言、標(biāo)題詞語(yǔ)言。 后組式的檢索語(yǔ)言:指描述文獻(xiàn)的標(biāo)識(shí)在檢索之前未固定組配, 而是在檢索時(shí)根據(jù)檢索的實(shí)際需要,按照組培規(guī)則臨時(shí)進(jìn)行組 配的標(biāo)識(shí)系統(tǒng),如敘詞語(yǔ)言、關(guān)鍵詞語(yǔ)言。,檢索語(yǔ)言,檢索語(yǔ)言的功能: 保證標(biāo)引的一致性 保證檢索提問(wèn)和文獻(xiàn)標(biāo)引的一致性 保證檢索結(jié)果和檢

12、索要求的一致性 對(duì)內(nèi)容相同或相關(guān)的信息,加以集中或揭示,表述 其相關(guān)性。 便于對(duì)大量信息加以系統(tǒng)化或組織的有序化,并力爭(zhēng) 從多方面揭示文獻(xiàn)信息。,檢索原理、方法、途徑和步驟,反映文獻(xiàn)外部特征 檢索標(biāo)識(shí),反映文獻(xiàn)內(nèi)容特征 檢索標(biāo)識(shí),文獻(xiàn)序號(hào),篇名 出版社,分類(lèi)號(hào),主題詞,關(guān)鍵詞,人工語(yǔ)言,自然語(yǔ)言,分類(lèi)語(yǔ)言,檢索標(biāo)識(shí)種類(lèi),著者,檢索原理、方法、途徑和步驟,檢索方法,檢 索 方 法,常用法,順查法,倒查法,抽查法,追溯法,循環(huán)法,瀏覽法,根據(jù)檢索課題的起始年代,利用選定的檢索工按照從舊到新、由遠(yuǎn)及近、由過(guò)去到現(xiàn)在順時(shí)序逐年查找,直至滿足課題要求為止的查檢方法。 這種方法費(fèi)力、費(fèi)時(shí),工作量大,多在缺

13、少評(píng)述文獻(xiàn)采取此法。因此可用于事實(shí)性檢索。,倒查法與順查法相反。這種方法多用于新課題、新觀點(diǎn)、新理論、新技術(shù)的檢索,檢索的重點(diǎn)在近期信息上,只需查到基本滿足需要時(shí)為止。此法查處的信息新穎,但查全率不高。,是利用檢索工具進(jìn)行重點(diǎn)抽查檢索的方法。針對(duì)某學(xué)科的發(fā)展重點(diǎn)和發(fā)展階段,擬出一定時(shí)間范圍,進(jìn)行逐年檢索的一種方法。此法檢索效率較高,但漏檢的可能性大,檢索人員必須熟悉學(xué)科的發(fā)展特點(diǎn)。,又稱追溯法、引文法、引證法、是一種跟蹤查找的方法。即以文獻(xiàn)后面所附的參考文獻(xiàn)為線索,逐一追溯查找相關(guān)文獻(xiàn)的方法。在沒(méi)有檢索工具或檢索工具不齊美的情況下,利用此法能夠獲取一些所需要的文獻(xiàn)資料,但往往查全率不高,回溯年

14、代越遠(yuǎn),所獲取的文獻(xiàn)越成舊。 這類(lèi)檢索工具著名的有美國(guó)的科學(xué)引文索引社會(huì)科學(xué)引文索引藝術(shù)和人文科學(xué)索引,中國(guó)的有中國(guó)科學(xué)引文索引、中國(guó)社會(huì)科學(xué)引文索引。,又稱綜合法、交替法、或分段法,是交替使用 常用法和追溯法來(lái)進(jìn)行檢索的綜合方法。在查找文獻(xiàn)時(shí),一般先用常用法,即利用檢索工具查出一批文獻(xiàn)資料,然后再選擇出與檢索課題針對(duì)性較強(qiáng)的文獻(xiàn),利用這些文獻(xiàn)所附的參考文獻(xiàn)追溯查找,交替、循環(huán)使用常用法和循環(huán)法,不斷擴(kuò)檢,直到滿足檢索需求為止。,是指直接利用檢索工具進(jìn)行信息檢索的方法。 這種方法多用于查找一些內(nèi)容概念較穩(wěn)定較成熟、有定論可依的指示性問(wèn)題的答案。即可解決事實(shí)性的檢索和數(shù)據(jù)性的檢索。,檢索原理、方

15、法、途徑和步驟,檢索途徑:文獻(xiàn)信息檢索有兩類(lèi)不同的檢索途徑。 根據(jù)文獻(xiàn)的特征檢索文獻(xiàn)信息是最簡(jiǎn)捷的途徑。其特 征有兩個(gè),一是根據(jù)文獻(xiàn)的外部特征,二是按照文獻(xiàn) 的內(nèi)部特征。,檢索原理、方法、途徑和步驟,分類(lèi)途徑:分類(lèi)途徑是以課題的學(xué)科屬性為出發(fā)點(diǎn),按學(xué)科分類(lèi) 體系來(lái)查找文獻(xiàn)信息,以分類(lèi)作為檢索點(diǎn),利用學(xué)科分類(lèi)表、 分類(lèi)目錄、分類(lèi)索引等按學(xué)科體系編排的檢索工具來(lái)查找有關(guān) 某一學(xué)科或相關(guān)學(xué)科領(lǐng)域的文獻(xiàn)信息。 主題途徑:以課題的主題內(nèi)容為出發(fā)點(diǎn),按主題詞、關(guān)鍵詞、 敘詞、標(biāo)題詞等來(lái)查找文獻(xiàn)。以主題作為檢索點(diǎn), 利用主題詞表、主題目錄、主題索引等按主題詞的 字順編排的檢索工具來(lái)查找有關(guān)某一主題或某一事物

16、 的文獻(xiàn)信息,能滿足特性檢索的需求。適合查找比較 具體的課題。,檢索原理、方法、途徑和步驟,關(guān)鍵詞途徑:是按照文獻(xiàn)題目或內(nèi)容中具有實(shí)際意義并能表述 文獻(xiàn)的主要內(nèi)容、起關(guān)鍵作用的詞或詞組按照關(guān)鍵詞的字順在 檢索系統(tǒng)中使用的檢索途徑。 題名途徑:可查找圖書(shū)、期刊、單篇文獻(xiàn)。檢索工具中的書(shū)名 索引、會(huì)議名稱索引、書(shū)目索引、刊名索引等都提供了從題名 進(jìn)行文獻(xiàn)檢索的途徑。,檢索原理、方法、途徑和步驟,著者途徑:包含個(gè)人責(zé)任者、團(tuán)體責(zé)任者、專利發(fā)明人、專利權(quán) 人、合同戶、學(xué)術(shù)會(huì)議主辦單位等。利用責(zé)任者檢索文獻(xiàn),主要 利用的是作者索引、作者目錄、個(gè)人作者索引、團(tuán)體作者索引、 專利權(quán)人索引等。 序號(hào)途徑:據(jù)文獻(xiàn)信息出版時(shí)所編的號(hào)碼順序來(lái)檢索文獻(xiàn)信息 的途徑。特定編號(hào)如:技術(shù)標(biāo)準(zhǔn)的標(biāo)準(zhǔn)號(hào)、 專利說(shuō)明書(shū)的專利號(hào)、科技報(bào)告的報(bào)告好、 合同號(hào)、任務(wù)號(hào)、館藏單位編的館藏號(hào)、 索取號(hào)、排架號(hào)等。,檢索原理、方法、途徑和步驟,分子式途徑:以化學(xué)物質(zhì)的分子式作為檢索標(biāo)識(shí)來(lái)檢索文獻(xiàn)信息 的一種檢索途徑。使

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論