版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第三章計算機信息檢索概述
本章的主要內(nèi)容為:計算機信息檢索的發(fā)展過程、計算機信息檢索系統(tǒng)的組成和工作原理、計算機檢索的策略。
1第一節(jié)
計算機信息檢索的發(fā)展過程
計算機信息檢索的發(fā)展過程主要內(nèi)容包括:計算機信息檢索技術(shù)的發(fā)展計算機信息檢索技術(shù)的特征
2一、計算機信息檢索技術(shù)的發(fā)展
1954年,美國海軍軍械中心(NOTS)利用IBM-701型電子計算機建立了世界上第一個計算機信息檢索系統(tǒng),實現(xiàn)了單元詞組配檢索功能。1964年,美國國立醫(yī)學(xué)圖書館(NLM)建立了以醫(yī)學(xué)為主的信息檢索系統(tǒng),這一時期可稱為脫機檢索時期。1967年美國洛克希德公司的DLALOG系統(tǒng)研制成功
。1971年美國國立醫(yī)學(xué)圖書館建立了MEDLINE系統(tǒng),計算機檢索進入聯(lián)機檢索期。20世紀(jì)80年代中期光盤(CD-ROM)產(chǎn)品開始投放市場。20世紀(jì)90年代,計算機信息檢索系統(tǒng)跨入互聯(lián)網(wǎng)新的階段。3二、計算機信息檢索技術(shù)的特征
速度快、效率高。
檢索范圍廣
不受時空的限制
數(shù)據(jù)更新頻率高
輔助功能完善
4第二節(jié)
計算機信息檢索系統(tǒng)的組成和工作原理
一、計算機信息檢索系統(tǒng)的組成(一)計算機信息檢索系統(tǒng)一個完整的信息檢索系統(tǒng),通常由信息源、信息組織管理、系統(tǒng)功能、用戶接口和系統(tǒng)支持技術(shù)等幾個有機部分組成。51.信息源
信息源是指計算機檢索系統(tǒng)信息或數(shù)據(jù)的來源。信息檢索系統(tǒng)中的數(shù)據(jù)主要來自各種公開文獻,如一次文獻中的期刊、圖書、研究報告、會議論文、??莆墨I、政府出版物、學(xué)位論文;二次文獻中的摘要、索引和目錄;三次文獻中的百科全書、??圃~典、名錄、指南、手冊等。62.信息組織管理
信息組織管理主要是指信息標(biāo)引的方法、組織方式和更新周期。信息組織管理科學(xué)、實用、合理與否,會直接關(guān)系到信息檢索的效果。
73.系統(tǒng)功能
信息檢索系統(tǒng)的功能取決于系統(tǒng)所能提供的檢索途徑、檢索方式和檢索方法。信息檢索系統(tǒng)功能的狀況會在很大程度上影響到檢索的結(jié)果,例如詞表管理。
84.用戶接口
用戶接口承擔(dān)著用戶與系統(tǒng)之間的通訊功能,是二者之間實現(xiàn)通訊不可缺少的連接系統(tǒng)(軟硬件)。它通常由用戶模型、信息顯示、命令語言和反饋機制等部分構(gòu)成。95.系統(tǒng)技術(shù)支持
系統(tǒng)技術(shù)支持主要是指系統(tǒng)及其軟、硬件平臺的通用性、兼容性、可靠性和穩(wěn)定性。用戶輸入檢索詞或提問式后,系統(tǒng)要將檢索詞或提問式與數(shù)據(jù)庫中存儲的數(shù)據(jù)進行比較運算,然后把運算結(jié)果輸出給用戶。
10(二)
計算機信息檢索系統(tǒng)的基本結(jié)構(gòu)
1.硬件部分
硬件是指以計算機主機為中心的一系列機器設(shè)備,包括主機、外圍設(shè)備以及與數(shù)據(jù)處理或數(shù)據(jù)傳送有關(guān)的其他設(shè)備。
112.軟件部分
軟件部分是信息檢索系統(tǒng)中的有關(guān)程序和各種文件資料的總稱。存取系統(tǒng)的軟件一般包括操作系統(tǒng)、數(shù)據(jù)庫管理程序、編譯程序與匯編程序、自動標(biāo)引程序、文件管理程序、詞表管理程序、SDI程序、回溯檢索程序、記賬統(tǒng)計程序、通訊管理程序、總控程序等。
12聯(lián)機系統(tǒng)軟件構(gòu)成的示意圖
133.數(shù)據(jù)庫
數(shù)據(jù)庫是將數(shù)據(jù)按一定格式存儲在計算機內(nèi)的數(shù)據(jù)的倉庫,即存儲在計算機內(nèi)的相關(guān)數(shù)據(jù)的集合。數(shù)據(jù)庫是有組織、可共享的各類數(shù)據(jù)的集合,數(shù)據(jù)庫中的數(shù)據(jù)按照一定的規(guī)格組織、描述和存儲,具有較小冗余度和較高的數(shù)據(jù)獨立性、易維護性與擴展性。14數(shù)據(jù)庫類型(1)
參考數(shù)據(jù)庫(referencedatabase)
數(shù)目數(shù)據(jù)庫(bibliographicdatabase)
指南數(shù)據(jù)庫(referraldatabase)
15(2)
源數(shù)據(jù)庫(sourcedatabase)
數(shù)值數(shù)據(jù)庫(numericdatabase)文本—數(shù)值數(shù)據(jù)庫(textual-numericdatabase)全文數(shù)據(jù)庫(full-textdatabase)術(shù)語數(shù)據(jù)庫(terminologicaldatabase)
圖像數(shù)據(jù)庫(graphicdatabase)
16(3)
混合型數(shù)據(jù)庫(mixeddatabase)
混合型數(shù)據(jù)庫是能夠同時存儲多種不同類型數(shù)據(jù)的數(shù)據(jù)庫。17數(shù)據(jù)庫的其它分類
(1)
從數(shù)據(jù)的存取方式來看,數(shù)據(jù)庫可以劃分為:關(guān)系型數(shù)據(jù)庫、層次型數(shù)據(jù)庫和網(wǎng)絡(luò)型數(shù)據(jù)庫等三種類型。
(2)
從數(shù)據(jù)存儲的介質(zhì)來看,數(shù)據(jù)庫可以劃分為:磁帶數(shù)據(jù)庫、磁盤數(shù)據(jù)庫和光盤數(shù)據(jù)庫等三種類型。
(3)
從數(shù)據(jù)本身的性質(zhì)來看,數(shù)據(jù)庫可以劃分為:文獻數(shù)據(jù)庫、數(shù)據(jù)型數(shù)據(jù)庫、事實型數(shù)據(jù)庫、多媒體數(shù)據(jù)庫和超媒體數(shù)據(jù)庫等幾種形式。
18(三)
計算機信息檢索系統(tǒng)的工作流程與功能
計算機信息存儲系統(tǒng)的功能可以概括為6個方面,即:輸入功能、處理功能、存儲功能、傳輸功能、輸出功能和控制功能。這6個功能相互聯(lián)系,構(gòu)成了信息系統(tǒng)工作流程的6個工作環(huán)節(jié)。
19計算機信息檢索系統(tǒng)的工作流程
201.輸入環(huán)節(jié)
輸入子系統(tǒng)的功能包括兩個方面:其一,針對系統(tǒng)建設(shè)的目標(biāo),搜集和選擇特定范圍內(nèi)的信息資源;其二,把收集的信息資源按照所規(guī)定的格式進行登載與記錄。信息資源的輸入方式有兩種:一是人工方式,二是計算機自動方式。
212.處理環(huán)節(jié)處理子系統(tǒng)的功能是處理經(jīng)過選擇的數(shù)據(jù)和信息
處理形式包括兩種:其一,人工數(shù)據(jù)處理,其二,計算機數(shù)據(jù)處理。223.存儲環(huán)節(jié)
存儲子系統(tǒng)的功能是將加工處理后的信息,按照某種規(guī)則和程序聚積在存儲載體上,構(gòu)成可檢索的文檔。存儲的對象由三個方面的內(nèi)容構(gòu)成:即計算機需要執(zhí)行的各種程序、數(shù)據(jù)和文檔。
234.傳輸環(huán)節(jié)
傳輸子系統(tǒng)的功能主要是通過計算機與通信線路的連接,完成信息編碼的傳遞、轉(zhuǎn)接、接收與處理等工作。
245.輸出環(huán)節(jié)
控制子系統(tǒng)的功能是根據(jù)存取系統(tǒng)內(nèi)部狀態(tài)和外部環(huán)境的變化,進行管理與調(diào)節(jié),來保證系統(tǒng)的有效輸入、有效存儲、有效輸出等環(huán)節(jié)的協(xié)調(diào)運行。對信息系統(tǒng)進行控制的方式主要有三種,即:集中控制、分散控制和多層控制。
25二、計算機信息檢索的方法
計算機的檢索方法大致可分為以下幾種類型,即菜單檢索、指令檢索、瀏覽式檢索和提問—回答式檢索。
261.菜單檢索
(EasyMenuSearch)
菜單檢索這是計算機存取系統(tǒng)中最普遍的查詢方式之一。用戶在系統(tǒng)給出的菜單中選擇項目來完成各種操作。在檢索過程中,用戶還可以參考屏幕提示的信息或按下F1鍵來獲取幫助。菜單方式的缺陷是檢索的步驟多,而且檢索的精確度不及指令檢索。
272.指令檢索(CommandSearch)
指令檢索是一種依靠各種指令來完成操作的檢索方法。檢索指令包括檢索過程中所使用的功能鍵。指令檢索一般適用于有經(jīng)驗的用戶。應(yīng)用各種指令有助于用戶表達檢索提問和進行各種方案的檢索比較,以獲取比較理想的檢索結(jié)果。
283.瀏覽式檢索
(BrowsingSearch)
瀏覽式檢索一般用于網(wǎng)絡(luò)信息資源的超文本或超媒體查詢。瀏覽式檢索通過跟蹤信息節(jié)點之間的鏈路,在網(wǎng)絡(luò)系統(tǒng)中查找與檢索概念相關(guān)的信息資源。Internet互聯(lián)網(wǎng)與Web都具有導(dǎo)航瀏覽式檢索的功能。這種檢索方式的缺陷是用戶在漫游中可能會“迷航”。
294.提問—回答式檢索(Quiz&AnswerSearch)
提問檢索目標(biāo)明確,技術(shù)規(guī)范,不僅檢索速度快,而且“查全率”和“查準(zhǔn)率”比較高,適用于大型檢索系統(tǒng),可以廣泛應(yīng)用與光盤數(shù)據(jù)庫和Web網(wǎng)上的各類搜索引擎。提問—回答式檢索可以劃分為基本檢索、二次檢索、詞組檢索、索引詞典檢索、高級檢索和綜合檢索等幾種方式。30第三節(jié)
計算機檢索的策略
計算機檢索的策略主要內(nèi)容為:計算機信息檢索的策略
計算機檢索策略的制定
計算機檢索策略的應(yīng)用與調(diào)整
31一、計算機信息檢索的策略
所謂檢索策略,就是在分析課題內(nèi)容具有哪些概念單元的基礎(chǔ)上,確定檢索系統(tǒng)、檢索文檔、檢索途徑和檢索詞,并科學(xué)安排各檢索詞之間的位置關(guān)系和邏輯關(guān)系以及查找步驟等。對一個檢索課題來說,要達到什么目標(biāo),要求什么范圍,選擇什么檢索系統(tǒng),通過什么途徑、選用什么檢索詞和邏輯組配方法以及需要哪些反饋等一系列問題的考慮與安排,都屬于檢索策略的研究范疇。
32二、計算機檢索策略的制定
檢索策略的制定是確定檢索系統(tǒng)、檢索文檔、檢索途徑和檢索詞,并科學(xué)安排各檢索詞之間的位置關(guān)系和邏輯關(guān)系以及查找步驟。制定檢索策略之前,對目標(biāo)數(shù)據(jù)庫必須有比較清醒的認識和了解,弄清檢索課題的內(nèi)容要求和檢索目的。
33(二)實現(xiàn)計算機檢索策略的步驟
(1)填寫檢索提問表,列出待檢課題的學(xué)科專業(yè)范圍、主題內(nèi)容及其檢索目標(biāo)。
(2)選擇相關(guān)數(shù)據(jù)庫,并確定在待檢數(shù)據(jù)庫中的檢索途徑,以便編制適合所選數(shù)據(jù)庫的檢索策略。(3)對信息提問進行概念分析,完成用戶檢索需求由概念表達到計算機系統(tǒng)所能接受的檢索標(biāo)識轉(zhuǎn)換。(4)擬檢索表達式并編排具體的檢索程序。
34
檢索策略構(gòu)造及實現(xiàn)過程的示意圖
35三、計算機檢索策略的應(yīng)用與調(diào)整
廣泛地瀏覽數(shù)據(jù)庫
選擇合適的數(shù)據(jù)庫試查
調(diào)整檢索策略
利用檢出文獻的信息,拓寬檢索
充分利
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國聯(lián)通IT支持工程師技術(shù)能力考試題庫含答案
- 比亞迪汽車銷售經(jīng)理面試題目詳解
- 網(wǎng)絡(luò)教育中的教育產(chǎn)品經(jīng)理面試題
- 狼瘡性腎炎飲食安全與營養(yǎng)協(xié)同策略
- 人力資源專員面試題及答案寶典
- 人力資源崗位面試題及答案
- 2026屆八省聯(lián)考(T8聯(lián)考)2026屆高三年級12月檢測訓(xùn)練英語試卷(含答案詳解)+聽力音頻+聽力材料
- 冷軋板(卷)建設(shè)項目可行性分析報告(總投資9000萬元)
- 律師面試問題集法律專業(yè)篇
- 深度解析(2026)《GBT 18805-2002商品條碼印刷適性試驗》(2026年)深度解析
- DLT817-2014立式水輪發(fā)電機檢修技術(shù)規(guī)程
- 高三下學(xué)期二模語文試卷匯編:寫作專題
- 外科學(xué)手術(shù)器械的維護與保養(yǎng)
- 自愿放棄入伍承諾書
- 鋁板拆除施工方案
- 植入式靜脈給藥裝置(輸液港)-中華護理學(xué)會團體標(biāo)準(zhǔn)2023
- 0031預(yù)防成人經(jīng)口氣管插管非計劃性拔管護理專家共識
- THMSRX型實訓(xùn)指導(dǎo)書
- 原發(fā)性支氣管肺癌教案
- GB/T 23280-2009開式壓力機精度
- 金壇區(qū)蘇教版六年級上冊數(shù)學(xué)第6單元《百分?jǐn)?shù)》教材分析(定稿)
評論
0/150
提交評論