版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
計(jì)算機(jī)文獻(xiàn)檢索是隨著計(jì)算機(jī)的出現(xiàn)而發(fā)展起來的。計(jì)算機(jī)檢索經(jīng)歷了脫機(jī)檢索、聯(lián)機(jī)檢索、光盤檢索及網(wǎng)絡(luò)信息檢索等階段。計(jì)算機(jī)檢索以其檢索效率高、檢索效果好而在文獻(xiàn)信息檢索中得到了廣泛的使用。重點(diǎn)掌握:計(jì)算機(jī)檢索的基本原理、數(shù)據(jù)庫的定義、類型和結(jié)構(gòu);計(jì)算機(jī)檢索的基本步驟與方法。
第七章計(jì)算機(jī)信息檢索
第一節(jié)計(jì)算機(jī)檢索概述第二節(jié)計(jì)算機(jī)檢索原理第三節(jié)計(jì)算機(jī)檢索技術(shù)第四節(jié)計(jì)算機(jī)檢索步驟
本章主要內(nèi)容
計(jì)算機(jī)信息檢索的特點(diǎn)計(jì)算機(jī)信息檢索的定義計(jì)算機(jī)信息檢索系統(tǒng)的類型計(jì)算機(jī)信息檢索系統(tǒng)的構(gòu)成數(shù)據(jù)庫第一節(jié)計(jì)算機(jī)檢索概述計(jì)算機(jī)信息檢索的定義
簡稱機(jī)檢狹義上是指人們根據(jù)特定的情報(bào)需求,利用計(jì)算機(jī)從相關(guān)的機(jī)讀數(shù)據(jù)庫中識別并獲取所需情報(bào)信息的過程。廣義上包括信息存儲和信息檢索兩個(gè)方面,即數(shù)據(jù)庫的建立與利用兩個(gè)方面。
項(xiàng)目手檢 機(jī)檢
總體特征 手翻、眼看、大腦判斷策略、查尋、機(jī)器匹配
標(biāo)引及索引特點(diǎn)檢索點(diǎn)較少 檢索點(diǎn)較多
檢索時(shí)間 較慢較快
檢索要求 專業(yè)知識、外語知識、專業(yè)知識、外語知識、機(jī)檢
檢索工具知識系統(tǒng)知識
查全查準(zhǔn)率 查準(zhǔn)率較高 查全率較高
綜合效率 較低 較高
手檢與機(jī)檢的比較文獻(xiàn)信息檢索經(jīng)歷了手工檢索、機(jī)械檢索、計(jì)算機(jī)檢索三個(gè)階段。計(jì)算機(jī)用于信息檢索的研究始于20世紀(jì)50年代初。從50年代開始,美國最先使用計(jì)算機(jī)進(jìn)行信息檢索并解決了信息存貯和檢索速度等問題。60年代中期,計(jì)算機(jī)檢索逐步實(shí)用化,利用單臺計(jì)算機(jī)回溯檢索和新文獻(xiàn)的定題檢索,提供脫機(jī)檢索服務(wù)。70年代初,計(jì)算機(jī)檢索進(jìn)入聯(lián)機(jī)檢索階段。80年代以后,計(jì)算機(jī)檢索進(jìn)入國際聯(lián)機(jī)信息檢索階段。80年代末、90年代初,計(jì)算機(jī)檢索發(fā)展成計(jì)算機(jī)網(wǎng)絡(luò)信息檢索。同時(shí),光盤誕生了進(jìn)入光盤檢索階段。90年后,進(jìn)入網(wǎng)絡(luò)檢索階段計(jì)算機(jī)信息檢索系統(tǒng)的類型數(shù)據(jù)庫類型(按內(nèi)容分型)書目數(shù)據(jù)庫(如圖書館書目數(shù)據(jù)庫)數(shù)值數(shù)據(jù)庫(如人口統(tǒng)計(jì)數(shù)據(jù)庫)事實(shí)數(shù)據(jù)庫(科研機(jī)構(gòu)數(shù)據(jù)庫)全文數(shù)據(jù)庫中國學(xué)術(shù)期刊全文數(shù)據(jù)庫、中文科技期刊全文數(shù)據(jù)庫等軟件數(shù)據(jù)庫書目型數(shù)據(jù)庫(BibliographicDatabase)
如:國外三大農(nóng)業(yè)數(shù)據(jù)庫、館藏書目數(shù)據(jù)庫全文型數(shù)據(jù)庫(FullTextDatabase)
如:中國學(xué)術(shù)期刊全文數(shù)據(jù)庫、中文科技期刊全文數(shù)據(jù)庫等。
數(shù)值型數(shù)據(jù)庫(NumericDatabase)
存貯有科學(xué)數(shù)據(jù),統(tǒng)計(jì)資料等數(shù)據(jù)。
事實(shí)型數(shù)據(jù)庫(FactDatabase)
存貯有企業(yè)名錄、百科全書、人名錄等有利用價(jià)值的信息。
超文本型數(shù)據(jù)庫(HypertextDatabase)數(shù)據(jù)庫
數(shù)據(jù)庫的定義美國著名信息檢索專家Martha,E.Williams給數(shù)據(jù)庫的定義是“包含書目及與文獻(xiàn)有關(guān)的數(shù)據(jù)的機(jī)讀記錄的有組織的集合?!卑磧?nèi)容性質(zhì)分:字段(Field)、記錄(Record)和文檔(File)數(shù)據(jù)庫的結(jié)構(gòu)計(jì)算機(jī)信息檢索是利用計(jì)算機(jī)對信息進(jìn)行存儲與檢索的過程,即數(shù)據(jù)庫的建立與利用。示意圖數(shù)據(jù)庫的建立:按照既定的建庫方針、目的、標(biāo)準(zhǔn)等從信息源中選擇所需文獻(xiàn),對需錄入的文獻(xiàn)進(jìn)行加工,也就是對文獻(xiàn)的外表特征和內(nèi)容特征進(jìn)行分析和標(biāo)引,形成文獻(xiàn)特征的標(biāo)識,把這些標(biāo)識輸入計(jì)算機(jī),計(jì)算機(jī)再按事先設(shè)計(jì)好的規(guī)則自動(dòng)把這些標(biāo)識排序形成多種索引,建成數(shù)據(jù)庫,為信息檢索提供有規(guī)可循的檢索途徑。數(shù)據(jù)庫的利用:計(jì)算機(jī)信息存儲的逆過程。將課題的主題概念按系統(tǒng)詞表進(jìn)行規(guī)范化處理,轉(zhuǎn)換成系統(tǒng)語言,形成檢索提問特征標(biāo)識,根據(jù)需要使用布爾邏輯運(yùn)算符制定檢索策略,將檢索提問式輸入計(jì)算機(jī),在數(shù)據(jù)庫中查找所需信息。第二節(jié)計(jì)算機(jī)檢索的基本原理打開數(shù)據(jù)庫輸入檢索提問(檢索式)在索引詞典文檔中比較和匹配從記錄號倒排文檔中調(diào)取記錄號集合記錄號集合間的邏輯運(yùn)算順排文檔中調(diào)取記錄輸出命中記錄結(jié)束檢索記錄內(nèi)容不合要求重新調(diào)整檢索策略篇數(shù)不合要求結(jié)果不匹配重新輸入檢索標(biāo)識另選數(shù)據(jù)庫計(jì)算機(jī)文獻(xiàn)信息數(shù)據(jù)庫的檢索原理示意圖第三節(jié)計(jì)算機(jī)檢索技術(shù)
1、布爾邏輯檢索功能2、詞間位置檢索功能3、截詞檢索功能4、字段限定檢索功能主要是三種簡例:邏輯運(yùn)算AND計(jì)算機(jī)在圖書館中的應(yīng)用計(jì)算機(jī)圖書館簡例:邏輯運(yùn)算OR微量元素與克山病的關(guān)系A(chǔ)CBAorBorC詞間位置檢索功能文獻(xiàn)記錄中詞語的相對次序不同,所表達(dá)的意思就可能不同。同樣在檢索式中,檢索詞的相對次序不同,表達(dá)的檢索意圖也不一樣,布爾邏輯運(yùn)算符有時(shí)難以表達(dá)某些檢索課題的確切提問要求,用詞間位置算符來限定和組配檢索詞,可彌補(bǔ)布爾邏輯算符只是定性規(guī)定檢索詞的范圍,而沒有限定檢索詞位置關(guān)系,易造成誤檢的不足。
詞間位置檢索技術(shù)就是利用一些特定的位置算符來表達(dá)檢索詞之間的位置關(guān)系,并且可以不用敘詞表而直接使用自由詞進(jìn)行檢索的方法。有的書上還把這種檢索稱為原文檢索。這種檢索在利用TI和AB途徑檢索時(shí),對檢索質(zhì)量影響很大。
例:檢索“小麥中氨基酸的測定”(determinationofaminoacidsinwheat)檢索式:determinationwithaminoacidswithwheat
詞間位置算符在不同系統(tǒng)中的使用方法不同:L在Dialog系統(tǒng)中主要位置算符及其使用方法L在SPIRS系統(tǒng)中,位置算符只使用兩個(gè):
with、near那么,位置算符的應(yīng)用,能縮小檢索范圍提高查準(zhǔn)率。
截詞檢索功能
截詞運(yùn)算符號有兩個(gè):“?、*”
L其在不同系統(tǒng)中表示的含義不同。見書111L在SPIRS系統(tǒng)中?為有限截?cái)唷?為無限截?cái)?;L在中刊庫中只有?表示無限截?cái)唷@?、teen*teen,teens,teenage,teenager等。2、teen???Teen,teens,teenage在詞尾加?號,以?號的個(gè)數(shù)表示詞后最多可跟字母的個(gè)數(shù)
字段限定檢索功能
將檢索詞限定在某一字段中,檢索時(shí),計(jì)算機(jī)只對限定字段進(jìn)行運(yùn)算,以提高檢索效果。常用的檢索符號有:
in、=、<、>、≤、≥例:Englishinla;py≥1992
總結(jié):在一個(gè)復(fù)雜的檢索式中,不僅可以有多個(gè)運(yùn)算符,也可以使用括號來指定運(yùn)算的優(yōu)先順序、以及體現(xiàn)概念的完整性。
例3:查“玉米方面的英文”文獻(xiàn)
(maizeorzea-maysorcorn)indeand(Englishinla)
l
所以,計(jì)算機(jī)檢索就是使用這些檢索技術(shù)來實(shí)現(xiàn)文獻(xiàn)情報(bào)的有無、多少、異同的比較,以達(dá)到檢索的目的,在結(jié)合使用這些方法的時(shí),一定要注意,每一個(gè)概念表達(dá)的完整性,注重括號的使用。
分析課題確定主題概念選擇檢索方式和數(shù)據(jù)庫確定檢索途徑
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河南活動(dòng)策劃方案公司(3篇)
- 班級服務(wù)與安全管理制度(3篇)
- 病理科試劑管理制度(3篇)
- 美國非稅收入管理制度(3篇)
- 設(shè)備創(chuàng)新工作管理制度(3篇)
- 《GA 814-2009警用約束帶》專題研究報(bào)告:技術(shù)創(chuàng)新、應(yīng)用深化與未來展望
- 納稅評估培訓(xùn)
- 中學(xué)學(xué)生社團(tuán)活動(dòng)風(fēng)險(xiǎn)管理制度
- 養(yǎng)老院消防通道及疏散預(yù)案制度
- 2026河北省定向長安大學(xué)選調(diào)生招錄考試備考題庫附答案
- 2026年年長租公寓市場分析
- 生態(tài)環(huán)境監(jiān)測數(shù)據(jù)分析報(bào)告
- 金融機(jī)構(gòu)衍生品交易操作規(guī)范
- 醫(yī)院檢查、檢驗(yàn)結(jié)果互認(rèn)制度
- 學(xué)堂在線 雨課堂 學(xué)堂云 實(shí)繩結(jié)技術(shù) 章節(jié)測試答案
- 110kV線路運(yùn)維方案
- 智能化弱電工程常見質(zhì)量通病的避免方法
- 《中國古代文學(xué)通識讀本》pdf
- 罐區(qū)加溫操作規(guī)程
- 昆明醫(yī)科大學(xué)第二附屬醫(yī)院進(jìn)修醫(yī)師申請表
- 國有企業(yè)干部選拔任用工作系列表格優(yōu)質(zhì)資料
評論
0/150
提交評論