第二章 信息檢索基_第1頁
第二章 信息檢索基_第2頁
第二章 信息檢索基_第3頁
第二章 信息檢索基_第4頁
第二章 信息檢索基_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第二章信息檢索基本知識主要內(nèi)容第一節(jié)信息檢索概論第二節(jié)信息檢索語言第三節(jié)計算機信息檢索技術(shù)第四節(jié)文獻檢索的方法與途徑第五節(jié)信息檢索的基本步驟第六節(jié)信息檢索效果評價第一節(jié)信息檢索概論信息檢索狹義:依據(jù)一定的方法,從已經(jīng)組織好的大量有關(guān)文獻集合中,查找并獲取特定的相關(guān)文獻的過程。廣義:包括信息的存儲和檢索(storageandretrieval)2個過程第一節(jié)信息檢索概論信息存儲的步驟信息的選擇與收集信息的標(biāo)引形成大量有序可檢的信息集合第一節(jié)信息檢索概論信息檢索的發(fā)展手工檢索:是一種傳統(tǒng)的檢索方法,即以手工翻檢的方式,利用工具書(包括圖書、期刊、目錄卡片等)來檢索信息的一種檢索手段計算機檢索:指人們在計算機或計算機檢索網(wǎng)絡(luò)的終端機上,使用特定的檢索指令、檢索詞和檢索策略,從計算機檢索系統(tǒng)的數(shù)據(jù)庫中檢索出需要的信息,繼而再由終端設(shè)備顯示或打印的過程第一節(jié)信息檢索概論手工檢索的特點優(yōu)點:簡單、靈活,容易掌握缺點:費時、費力,容易造成誤檢和漏檢計算機檢索的特點檢索速度快檢索功能強大,具有多種檢索途徑獲得信息類型多檢索范圍大資源共享第一節(jié)信息檢索概論信息檢索的基本原理通過對大量的、分散無序的文獻信息進行搜集、加工、組織、存儲,建立各種各樣的檢索系統(tǒng),并采用一定的方法和手段使存儲與檢索這兩個過程所采用的特征標(biāo)識達到一致,以便有效地獲得和利用信息資源。第一節(jié)信息檢索概論第一節(jié)信息檢索概論信息檢索工具含義:根據(jù)檢索語言,將無序列文獻按一定方式系統(tǒng)組織起來,用于報道、存儲和檢索文獻的工具。構(gòu)成要素:文獻、檢索語言及文獻條目第一節(jié)信息檢索概論信息檢索工具的特征必須詳細描述文獻的內(nèi)容特征(也稱內(nèi)部特征)和外部特征(也稱外表特征)。每條用于描述文獻的記錄或款目都必須具有各種檢索標(biāo)識。全部文獻條目按一定順序科學(xué)地組成一個有機的整體。能夠提供多種檢索途徑。第一節(jié)信息檢索概論信息檢索工具的職能報道職能存儲職能檢索職能第一節(jié)信息檢索概論信息檢索的類型根據(jù)檢索對象的形式劃分:文獻檢索、事實檢索和數(shù)據(jù)檢索根據(jù)檢索方式劃分:手工檢索和計算機檢索其他分類方法:目錄、題錄、文摘、索引、參考工具書、搜索引擎第一節(jié)信息檢索概論信息檢索的意義和作用信息檢索是信息素質(zhì)教育的主要內(nèi)容信息檢索是創(chuàng)新型人才應(yīng)具備的基本技能信息檢索是科學(xué)研究的重要環(huán)節(jié)信息檢索是開發(fā)信息資源的有效途徑信息檢索是科學(xué)決策的前提第一節(jié)信息檢索概論大學(xué)生學(xué)習(xí)信息檢索知識的意義信息檢索是獲取知識的捷徑信息檢索是科學(xué)研究的向?qū)畔z索是終身學(xué)習(xí)的基礎(chǔ)第二節(jié)信息檢索語言檢索語言含義:是應(yīng)文獻信息的加工、存儲和檢索的共同需要而編制的,用于描述信息系統(tǒng)中文獻信息的內(nèi)容特征和外部特征、表達用戶信息檢索提問的一種專用語言,是表達一系列概括文獻信息內(nèi)容和檢索課題內(nèi)容的概念及其相互關(guān)系的一種概念標(biāo)識系統(tǒng)。第二節(jié)信息檢索語言檢索語言的作用標(biāo)引文獻信息內(nèi)容及其外部特征,保證不同標(biāo)引人員表征文獻的一致性;對內(nèi)容相同及相關(guān)的文獻信息加以集中或揭示其相關(guān)性;使文獻信息的存儲集中化、系統(tǒng)化、組織化,便于檢索者按一定的排列次序進行有序化檢索;便于將標(biāo)引用語和檢索用語進行相符性比較,保證不同檢索人員表述相同文獻內(nèi)容的一致性,以及檢索人員與標(biāo)引人員對相同文獻內(nèi)容表述的一致性;保證檢索者按不同需要檢索文獻時,都能獲得最高查全率和查準(zhǔn)率。第二節(jié)信息檢索語言檢索語言的類型表達文獻外部特征的檢索語言表達文獻內(nèi)容特征的檢索語言分類語言主題語言代碼語言第二節(jié)信息檢索語言第二節(jié)信息檢索語言分類語言含義:是用分類號和相應(yīng)的分類款目名稱來表達信息內(nèi)容的主題概念,并按學(xué)科體系的邏輯次序?qū)⑿畔①Y源系統(tǒng)地加以劃分和組織的語言特點具有按學(xué)科或?qū)I(yè)集中、系統(tǒng)地揭示文獻內(nèi)容的功能,具有較高的查全率,能夠較好地滿足族性檢索的要求;具有良好的等級結(jié)構(gòu),便于擴大和縮小檢索范圍;既能用于組織檢索工具和檢索系統(tǒng),又能用于組織文獻的分類排架;用分類號檢索,可不受文種限制。第二節(jié)信息檢索語言第二節(jié)信息檢索語言《中圖法》的標(biāo)記符號采用字母與阿拉伯?dāng)?shù)字相結(jié)合的混合制標(biāo)記符號(標(biāo)記符號也稱分類號,是類目的代號),字母代表基本大類,阿拉伯?dāng)?shù)字代表各級類目,并可根據(jù)大類的實際配號需要再展開一位字母第二節(jié)信息檢索語言主題語言和主題詞表主題:即文獻論述或涉及的主要事物或問題。主題詞:是用于描述、存儲、查找文獻主題的受控詞匯,是主題表中能表達一定意義的最基本的詞匯單元。主題詞一般劃分為標(biāo)題詞、單元詞、敘詞和關(guān)鍵詞。主題詞表:是把主題詞按一定方式組織與展示的詞匯表。按照類型不同的主題詞的特點,主題詞表可劃分為標(biāo)題詞表、單元詞表和敘詞表第二節(jié)信息檢索語言主題語言的要素語詞標(biāo)識字順系統(tǒng)參照系統(tǒng)主題檢索工具第二節(jié)信息檢索語言自然語言自然語言是相對于受控語言而言的。它在本質(zhì)上是未經(jīng)加工和規(guī)范化處理的非受控語言優(yōu)點:直接抽取信息的原詞,直觀性與專指性強全面反映信息的外部特征和全文內(nèi)容,檢索途徑多利用計算機自動抽詞、標(biāo)引,省時而且標(biāo)引速度快可以隨時增補新詞,以反映科學(xué)的最新發(fā)展動態(tài)對使用者的要求不高,檢索方便,容易被掌握進行標(biāo)引和檢索的方法:關(guān)鍵詞法、自然語言檢索等第二節(jié)信息檢索語言關(guān)鍵詞法能夠用做文獻的主題檢索標(biāo)識的原因:文獻題名,尤其是科技文獻的題名通常都具有報道性,大多能基本表達文獻的主題以文獻題名中抽取的關(guān)鍵詞作為檢索入口,能夠有效地將用戶指向可能包含相關(guān)情報的信息資保留關(guān)鍵詞前后的上下文有助于解釋關(guān)鍵詞的含義,因而可以將其用做限定標(biāo)目的說明語第二節(jié)信息檢索語言關(guān)鍵詞法關(guān)鍵詞索引的優(yōu)點:標(biāo)引時無需查看詞表,直接根據(jù)題名、文摘中的語詞進行標(biāo)引,簡便易行,可以降低對標(biāo)引人員的要求,節(jié)省標(biāo)引時間易于使用計算機進行編制,實現(xiàn)檢索工具編制過程的計算機化,保證通報文獻的及時性,以及生產(chǎn)過程的高效率和低成本能夠及時更新詞匯,出現(xiàn)在題名、文摘中具有檢索意義的詞匯均可立即用于標(biāo)引和檢索第二節(jié)信息檢索語言關(guān)鍵詞法關(guān)鍵詞語言的不足包括:用關(guān)鍵詞語言建立的檢索工具,質(zhì)量往往不穩(wěn)定,會導(dǎo)致漏檢、誤檢會增加用戶負擔(dān),影響檢全率題名中的不少語詞為通用概念,它們?yōu)闄z索入口建立的檢索款目沒有實際檢索意義漢語由于存在分詞難題,應(yīng)用計算機進行漢語關(guān)鍵詞抽詞標(biāo)引仍需要解決詞匯切分問題第二節(jié)信息檢索語言自然語言檢索定義:自然語言檢索亦稱為文本檢索,指不對文獻進行任何標(biāo)引,直接通過計算機以自然語言中的語詞匹配查找文本檢索進行匹配的對象:既可以是整個出版的文本,也可以是它的部分常用的文本檢索技術(shù):

布爾檢索、截詞檢索、精確檢索、限定范圍檢索、相關(guān)檢索等第二節(jié)信息檢索語言網(wǎng)絡(luò)環(huán)境下信息檢索語言的發(fā)展趨勢自然語言成為網(wǎng)絡(luò)信息檢索語言的主流傳統(tǒng)情報檢索語言大量應(yīng)用于網(wǎng)絡(luò)信息環(huán)境下自然語言需要人工語言的支持第二節(jié)信息檢索語言自然語言成為網(wǎng)絡(luò)信息檢索語言主流的原因在全文檢索技術(shù)的支撐下,自然語言作為全面反映網(wǎng)絡(luò)信息特征的原詞,比人工語言更能有效地對網(wǎng)絡(luò)信息進行揭示和標(biāo)引大量社會終端用戶的介入使具有受控語言背景知識的專業(yè)用戶比例急劇減少第二節(jié)信息檢索語言傳統(tǒng)情報檢索語言大量應(yīng)用于網(wǎng)絡(luò)信息環(huán)境下傳統(tǒng)情報檢索語言在網(wǎng)絡(luò)環(huán)境下的直接應(yīng)用傳統(tǒng)情報檢索語言在網(wǎng)絡(luò)環(huán)境下的間接應(yīng)用分類法和主題法原理的應(yīng)用分類-主題一體化思想的應(yīng)用實現(xiàn)了體系分類法和組配分類法的結(jié)合第二節(jié)信息檢索語言自然語言需要人工語言的支持自然語言檢索的缺點冗余信息太多,準(zhǔn)確率不高在一定程度上會造成漏檢計算機對自然語言的理解力影響檢索效率存在它能否最準(zhǔn)確、充分地表達信息中有價值內(nèi)容的詞,以及這些詞與檢索課題是否能有效匹配的問題第三節(jié)計算機信息檢索技術(shù)布爾邏輯檢索定義:布爾邏輯檢索是采用布爾代數(shù)中的邏輯“與”、邏輯“或”、邏輯“非”等運算符,將檢索提問式轉(zhuǎn)換成邏輯表達式,限定檢索詞在記錄中必須存在的條件或不能出現(xiàn)的條件的一種檢索技術(shù)類型邏輯“或”組配邏輯“與”組配邏輯“非”組配第三節(jié)計算機信息檢索技術(shù)邏輯“或”組配定義:邏輯“或”是一種具有概念并列(或同義、近義、反義)關(guān)系的組配優(yōu)點:可以擴大檢索范圍,提高查全率邏輯表達式:AORB或A+B含義:檢索記錄中凡含有檢索詞A或檢索詞B,或同時含有檢索詞A和B的,均為命中文獻第三節(jié)計算機信息檢索技術(shù)第三節(jié)計算機信息檢索技術(shù)邏輯“與”組配定義:邏輯“與”組配是一種具有概念交叉(或限定、形容、修飾)關(guān)系的組配優(yōu)點:可增強檢索專指度,提高查準(zhǔn)率邏輯表達式:AANDB或A*B含義:檢索記錄中只有同時含有檢索詞A和B的文獻,才能成為命中文獻第三節(jié)計算機信息檢索技術(shù)第三節(jié)計算機信息檢索技術(shù)邏輯“非”組配定義:邏輯“非”組配是一種具有概念排除關(guān)系的組配優(yōu)點:可提高查準(zhǔn)率,但會影響查全率邏輯表達式:ANOTB或A-B含義:只有檢索記錄中含有檢索詞A,但不含有檢索詞B的文獻,才算命中文獻第三節(jié)計算機信息檢索技術(shù)第三節(jié)計算機信息檢索技術(shù)截詞檢索截詞檢索是防止漏檢,提高查全率的一種檢索技術(shù),用于外文數(shù)據(jù)庫算符:“*”或“?”功能:相當(dāng)于布爾邏輯“或”類型自動截詞人工截詞第三節(jié)計算機信息檢索技術(shù)人工截詞按截詞位置前截詞中截詞后截詞按截詞數(shù)量有限截詞無限截詞第三節(jié)計算機信息檢索技術(shù)二次檢索定義:二次檢索是在前次檢索的基礎(chǔ)上進行的檢索,也叫進階檢索、再次檢索、在檢索結(jié)果中檢索等,各次檢索相互間為邏輯“與”操作優(yōu)點可以逐步縮小檢索范圍,提高查準(zhǔn)率簡化了檢索表達式的書寫,通過簡單檢索與進階檢索完全可以滿足復(fù)雜檢索表達式達到的檢索精度第三節(jié)計算機信息檢索技術(shù)限制檢索字段限制匹配度限制時間限制第三節(jié)計算機信息檢索技術(shù)詞位檢索優(yōu)點:可彌補布爾邏輯算符只是定性規(guī)定檢索詞的范圍這一缺陷,以提高檢準(zhǔn)率類型鄰位檢索字段檢索第三節(jié)計算機信息檢索技術(shù)鄰位檢索ONEAR:詞序不可顛倒NEAR:詞序可顛倒字段檢索同句檢索:“ASB”,表示A、B兩詞必須同時出現(xiàn)在非標(biāo)題字段中的一個句子(或兩個標(biāo)點符號)中,不限制詞距同段檢索:“AFB”,表示A、B兩詞必須同時出現(xiàn)在同一個文摘字段中,不限制詞序,也不限制詞距。第四節(jié)文獻檢索的方法與途徑文獻檢索的方法瀏覽法直接法追溯法循環(huán)法第四節(jié)文獻檢索的方法與途徑瀏覽法定義:就是科技人員對本專業(yè)或本學(xué)科的核心期刊每到一期便瀏覽閱讀的方法優(yōu)點能最快地獲取信息能直接閱讀原文內(nèi)容基本上能了解本學(xué)科發(fā)展的動態(tài)和水缺點科技人員必須事先知道本學(xué)科的核心期刊檢索的范疇不夠?qū)?因而漏檢率較大第四節(jié)文獻檢索的方法與途徑直接法定義:直接法又稱常規(guī)法,是指直接利用檢索系統(tǒng)(工具)檢索文獻信息的方法類型順查法倒查法抽查法分段法第四節(jié)文獻檢索的方法與途徑追溯法定義:追溯法又稱回溯法,是一種傳統(tǒng)的查找文獻的方法具體檢索方法:在查到一篇參考價值較大的新文獻后,利用文獻后面所列的參考文獻,逐一追查原文(被引用文獻),然后再從這些原文后所列的參考文獻目錄逐一擴大文獻信息范圍,一環(huán)扣一環(huán)地追查下去第四節(jié)文獻檢索的方法與途徑循環(huán)法定義:循環(huán)法又稱綜合法,是交替使用追溯法和直接法來進行檢索的綜合方法具體檢索方法:首先利用檢索工具查出一批文獻資料,再利用這些文獻資料所附的參考文獻追溯查找相關(guān)文獻,如此交替、循環(huán)使用直接法和追溯法,不斷擴展,直到達到檢索要求為止。第四節(jié)文獻檢索的方法與途徑文獻檢索的途徑著者途徑篇名途徑分類途徑主題途徑引文途徑序號途徑代碼途徑專門項目途徑第五節(jié)信息檢索的基本步驟分析研究課題確定檢索工具選擇檢索方法確定檢索途徑和檢索策略實施檢索并調(diào)整檢索策略索取原始文獻第五節(jié)信息檢索的基本步驟分析研究課題分析主題內(nèi)容分析問題類型分析查找年代確定檢索工具學(xué)科、專業(yè)范圍信息類型文種課題內(nèi)容第五節(jié)信息檢索的基本步驟選擇檢索方法根據(jù)檢索工具的條件選擇根據(jù)檢索課題的要求選擇根據(jù)學(xué)科發(fā)展特點選擇確定檢索途徑和檢索策略確定檢索途徑確定檢索策略第五節(jié)信息檢索的基本步驟實施檢索并調(diào)整檢索策略誤檢原因分析漏檢原因分析縮小檢索范圍的方法擴大檢索范圍的方法第五節(jié)信息檢索的基本步驟索取原始文獻原始

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論