信息資源檢索教程_第1頁
信息資源檢索教程_第2頁
信息資源檢索教程_第3頁
信息資源檢索教程_第4頁
信息資源檢索教程_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

信息資源檢索教程第一頁,共五十三頁,2022年,8月28日第四章計算機檢索技術計算機檢索的實質:匹配運算計算機檢索技術檢索提問檢索表達式掃描、匹配識別數據庫檢索詞的組配技術計算機檢索技術檢索表達式的構成規(guī)則檢索詞:主題詞、關鍵詞、名稱、分類號分子式等。檢索表達式:運用各種運算符,把檢索詞連接組配。第二頁,共五十三頁,2022年,8月28日第四章計算機檢索技術布爾邏輯位置邏輯截詞字段限制加權計算機檢索技術其他4.14.24.34.44.64.5第三頁,共五十三頁,2022年,8月28日4.1布爾邏輯檢索技術布爾邏輯檢索技術就是利用布爾邏輯算符進行檢索項的邏輯組配,用以表達檢索者的提問概念。布爾邏輯算符指規(guī)定檢索詞之間相互關系的運算符號,在檢索表達式中起著邏輯組配的作用復雜概念的檢索式組配檢索詞檢索詞檢索詞簡單第四頁,共五十三頁,2022年,8月28日4.1布爾邏輯檢索技術常用的布爾邏輯運算符:

邏輯“與(AND)”

邏輯“或(OR)”

邏輯“非(NOT)”運算順序第五頁,共五十三頁,2022年,8月28日

邏輯“與”運算符:AND或*用于交叉概念或限定關系的組配,實現檢索詞概念范圍的交集。

表達式:AandB或A*BBAnd兩側的檢索詞必須同時出現在檢索字段中檢出同時含有檢索詞A和檢索詞B的記錄A第六頁,共五十三頁,2022年,8月28日

邏輯“與”作用縮小檢索范圍,提高查準率。

舉例檢索“人口控制”或者“控制人口”方面的文獻信息。人口and控制返回第七頁,共五十三頁,2022年,8月28日

邏輯“或”運算符:OR或+

用于檢索詞并列關系(同義詞、近義詞)的組配,實現檢索詞概念范圍的并集。

表達式:AorB或A+BB在文獻記錄中只要含有檢索詞A和檢索詞B中的任何一個即算命中檢索出的記錄含有檢索詞A或者檢索詞BA第八頁,共五十三頁,2022年,8月28日

邏輯“或”作用擴大檢索范圍,防止漏檢,提高查全率。

舉例檢索“計算機”方面的文獻信息。計算機or電腦使用的注意事項如果檢索詞涉及表達整體概念,要針對具體情況分別列出每個表達部分概念的檢索詞,否則將出現漏檢。返回第九頁,共五十三頁,2022年,8月28日

邏輯“非”運算符:NOT或-

一種排斥關系的組配,用來從原來的檢索范圍中排除不需要的概念。

表達式:AnotB或A-BB適用于排除含有某個指定檢索詞的記錄A檢索出的記錄含有檢索詞A,但同時不含檢索詞B第十頁,共五十三頁,2022年,8月28日

邏輯“非”作用縮小檢索范圍,增強檢索的準確性。但使用不當,易排除有用文獻信息,從而導致漏檢

舉例檢索有關能源方面的文獻信息,但不包括核能。

energynotnuclear使用的注意事項兩個關系緊密的檢索詞不宜用not返回第十一頁,共五十三頁,2022年,8月28日4.1布爾邏輯檢索技術優(yōu)先級高優(yōu)先級低NOTANDOR布爾邏輯運算符的運算順序返回第十二頁,共五十三頁,2022年,8月28日4.2位置邏輯檢索技術位置邏輯檢索利用位置邏輯算符限定檢索詞之間的位置,或指定檢索詞在記錄中某一特定位置進行檢索。位置算符又稱鄰接運算符。位置邏輯檢索的作用表達各個檢索詞之間的順序與相對位置關系。與布爾邏輯檢索的區(qū)別使用布爾邏輯檢索時,計算機只判斷參加運算的檢索詞在數據庫記錄中出現與否,不能確定檢索詞之間的相對位置關系。而通過與位置算符配合使用可以減少檢索誤差。第十三頁,共五十三頁,2022年,8月28日4.2位置邏輯檢索技術Dialog系統(tǒng)中的幾種位置算符同詞位檢索(W)——(With/Word)、(nW)

(N)——(NEAR)、(nN)同字段檢索(F)——(Field)(L)——(Link)其他位置算符(S)——(Subfield)(C)——(Citation)第十四頁,共五十三頁,2022年,8月28日4.2.1同詞位檢索允許在連接的兩個詞之間最多夾入n個其他單元詞,只強調插入單元詞個數沒限定插入單元詞的具體范圍,同時詞序不能顛倒此算符兩側的檢索詞必須按輸入時的前后順序排列,而且所連接的詞之間除可以有一個空格或一個標點符號或一個鏈接號外不得夾有任何其他單詞或字母(W)/()(nW)舉例舉例嚴密性強嚴密性差第十五頁,共五十三頁,2022年,8月28日4.2.1同詞位檢索允許兩個檢索詞之間最多可以插入n個單詞,且這兩個檢索詞的詞序任意此算符兩側的檢索詞必須緊密相連,所連接的詞間不允許插入任何其他單詞或字母,但詞序可以顛倒(N)(nN)舉例舉例第十六頁,共五十三頁,2022年,8月28日(N)舉例檢索式

chemistry(N)physics命中含有chemistryphysics或physicschemistry的文獻返回第十七頁,共五十三頁,2022年,8月28日檢索式

economic(2N)recovery(nN)舉例命中含有economicrecovery或recoveryoftheeconomic的文獻返回第十八頁,共五十三頁,2022年,8月28日(W)/()舉例檢索式

American()Literature命中有關AmericanLiterature或American,Literature的文獻返回第十九頁,共五十三頁,2022年,8月28日(nW)舉例檢索式

knowledge(1W)economy命中有關knowledgeeconomy或knowledge-basedeconomy的文獻返回第二十頁,共五十三頁,2022年,8月28日舉例舉例4.2.2同字段檢索(L)(F)表示此算符兩側的檢索詞必須同時出現在同一字段內。如:篇名字段、文摘字段、敘詞字段等,但兩詞的詞序中間插入的次數不限。表示兩個檢索詞之間存在從屬關系或限制關系。如果其中一個為一級主題詞,另一個就為二級主題詞。第二十一頁,共五十三頁,2022年,8月28日(L)舉例檢索式

control(L)stability命中標題含有control和stability兩個檢索詞的文獻記錄。返回第二十二頁,共五十三頁,2022年,8月28日(F)舉例檢索式

economic(F)knowledge命中標題為“theEconomicImpactofKnowledge-Based”的文獻記錄。返回原因:算符兩側的檢索詞在同一標題字段中第二十三頁,共五十三頁,2022年,8月28日4.2.3其他位置邏輯檢索(S)——(Subfield)

表示在此算副輛車的檢索詞必須出現在同一個子字段中,順序不變,中間可插入詞數不限。舉例

(basicorcobolorpascal)(S)(program*orcompil*)Basic(S)program*basic(S)compil*Cobol(S)program*cobol(S)compil*Pascal(S)program*pascal(S)compil*第二十四頁,共五十三頁,2022年,8月28日4.2.3其他位置邏輯檢索(C)——(Citation)

表示兩側的檢索詞只能出現在同一條記錄中,且對它們的相對位置或次序沒有任何限制,作用和布爾算符and完全相同第二十五頁,共五十三頁,2022年,8月28日位置邏輯算符的優(yōu)先順序C(S)(N)(W)(F)4.2位置邏輯檢索技術嚴謹寬松返回第二十六頁,共五十三頁,2022年,8月28日4.3截詞檢索技術實質截詞檢索就是用截詞符號將檢索詞截斷,用檢索詞的片段進行匹配運算。注意在截斷時,截斷的詞干不能太短,詞干一般應在3個字符以上,以免增加檢索時間,產生誤檢。第二十七頁,共五十三頁,2022年,8月28日4.3截詞檢索技術截詞形式按截詞的字符數量

有限截斷、無限截斷按截詞的位置

右截斷、左截斷、中間截斷第二十八頁,共五十三頁,2022年,8月28日4.3.1按截詞數量截斷有限截斷指限定截去有限個字符。截斷符號

??——截斷1個字符

???——截斷2個字符依此類推。舉例輸入:product??

結果:含有product、products的記錄第二十九頁,共五十三頁,2022年,8月28日4.3.1按截詞數量截斷無限截斷檢索詞詞干可變化兩個以上字符時,連續(xù)使用若干個“?”或“*”代替變化字符。用法

可同時查找含有該詞干的所有文獻記錄,亦可用于年代的查找。第三十頁,共五十三頁,2022年,8月28日4.3.2其他截斷方式1.把截詞符號置放在一個檢索詞的中間;2.中截斷不允許有限截斷1.將截詞符號放在一個字符串左方,表示其左的有限或無限個字符不影響該字符串的檢索;2.實質:后方一致檢索1.最常用的截詞檢索技術;2.放在字符串右方,表示其右有限或無限個字符不影響該字符串的檢索;3.實質:后截斷是前方一致檢索后截斷前截斷中截斷舉例舉例舉例返回第三十一頁,共五十三頁,2022年,8月28日后截斷舉例輸入:

computer*檢索結果

computeracy

computerise

computerization

computers隱含OR運算特性第三十二頁,共五十三頁,2022年,8月28日后截斷注意事項后截斷主要使用于如下幾種情況:檢索詞的單復數的描述;如:book?

同根詞的表達;

如:chemi*可以檢索出chemical、

chemistry、chemist等同根詞年代的表達;

如:20??(21世紀),199?(20世紀90年代)作者

如:Moyer*可以檢索出所有姓Moyer的作者返回第三十三頁,共五十三頁,2022年,8月28日前截斷舉例輸入:*computer檢索結果

microcomputer

minicomputer返回第三十四頁,共五十三頁,2022年,8月28日中截斷舉例輸入:

organi?ation檢索結果

organization

organisation中截斷主要使用于如下幾種情況:檢索詞的拼寫方式存在美式、英式之分;檢索詞在某個元音位置出現的單復數不同;

如:man與men作用

擴大檢索范圍,提高檢全率,減少檢索詞的輸入量返回第三十五頁,共五十三頁,2022年,8月28日4.4字段限制檢索技術在檢索系統(tǒng)中,通常有一些縮小或約束檢索結果的方法,稱為限制檢索。限制檢索的方式字段限制檢索1使用限制符檢索2第三十六頁,共五十三頁,2022年,8月28日4.4.1字段限制檢索特點及作用

使檢索出的文獻信息達到一定的專指度。將檢索詞限制在記錄的某個特定字段內檢索,不但可以減輕機器負擔,提高運算速度,還可以使檢索結果更準確。用法

將需要檢索的內容限制在相關的字段內。

如:作者姓名作者字段

關鍵詞關鍵詞或題名字段第三十七頁,共五十三頁,2022年,8月28日4.4.1字段限制檢索字段種類

基本字段:表達文獻內容特征的字段

輔助字段:表達文獻外表特征的字段字段檢索形式

1.通過菜單選擇檢索字段

2.用命令的方式輸入字段限制算符篇名字段、文摘字段、敘詞字段、分類類目等作者、機構、文獻類型、語種等返回第三十八頁,共五十三頁,2022年,8月28日4.4.2使用限制符檢索Web檢索方式通常通過菜單選擇檢索字段,在聯(lián)機Web高級檢索中,還可以用表示語種、文獻類型、出版國家、出版年代等額字段標識符來限制檢索范圍。在Dialog系統(tǒng)中,用專門的字符表示不同字段。第三十九頁,共五十三頁,2022年,8月28日4.4.2使用限制符檢索前綴限制字符

AU= 限查特定作者

JN= 限查特定刊名

LA= 限查特定語種

PN= 限查特定專利號

PY= 限查特定年代后綴限制符

/TI 限在題目中查

/AB 限在文摘中查

/DE 限在敘詞標引中查

查找2004年出版的英文或法文的宏觀經濟學方面的期刊檢索式:(macroeconomics/de,ti,ab)ANDPY=2004AND(LA=ENORFR)ANDDT=Serial舉例限制字符的使用返回第四十頁,共五十三頁,2022年,8月28日4.5加權檢索技術與其他檢索技術的區(qū)別基本方法

1.在每個檢索詞后面給定表示重要程度的數值,稱為權值。

2.檢索時,查找這些檢索詞在數據庫記錄中是否存在

3.計算存在的檢索詞的權值總和。

4.權值之和達到或超過預先給定的闕值,即為命中其他檢索技術加權檢索技術側重點判定檢索詞或字符串在數據庫中,與別的檢索詞或字符串是什么關系判定檢索詞或字符串在滿足檢索邏輯后對文獻信息命中與否的影響程度返回第四十一頁,共五十三頁,2022年,8月28日4.6其他輔助檢索技術4.6.1信息的瀏覽式檢索與鏈接技術4.6.2檢索結果的翻譯和多語種(或跨語種)

檢索技術4.6.3檢索結果的后處理技術第四十二頁,共五十三頁,2022年,8月28日4.6.1信息的瀏覽式檢索與鏈接技術用戶在計算機檢索系統(tǒng)中,“瀏覽”方式的實現主要得益于超文本鏈接技術的成功應用。某種信息組織結構(或導航機制)鏈接信息系統(tǒng)預定義相關或未曾預料的有用信息訪問、探尋提供第四十三頁,共五十三頁,2022年,8月28日4.6.1信息的瀏覽式檢索與鏈接技術搜索引擎

目前,基于瀏覽式檢索的技術方法已在網絡搜索引擎中得到了廣泛應用,以Yahoo為首創(chuàng)的一類網絡搜索引擎就是通過分類目錄導航機制實現對同絡信息的瀏覽式檢索的。此外,超文本鏈接技術在傳統(tǒng)的基于關鍵詞匹配的信息檢索系統(tǒng)中,也越來越顯現出重要的應用價值。第四十四頁,共五十三頁,2022年,8月28日4.6.1信息的瀏覽式檢索與鏈接技術參考文獻鏈接(CitedReference)相關記錄鏈接(RelatedRecords)被引次數鏈接

(TimesCited)內鏈接第四十五頁,共五十三頁,2022年,8月28日被引次數鏈接舉例在系統(tǒng)檢索結果列表中,該鏈接點首先給出該文獻的被引用次數,單擊該鏈接點,系統(tǒng)會進一步顯示引用該篇文獻的所有其他文獻;點擊第四十六頁,共五十三頁,2022年,8月28日參考文獻鏈接舉例該鏈接點不僅可以顯示該檢索結果文獻所使用的參考文獻數量,單擊它還可顯示這些參考文獻的具體列表;點擊第四十七頁,共五十三頁,2022年,8月28日相關記錄鏈接通過該鏈接點可以查看在不同年份中與當前所檢索的記錄共同引用同一篇(或多篇)參考文獻的一組文獻,即相關記錄,并按共同引用參考文獻的多少排序。

第四十八頁,共五十三頁,2022年,8月28日4.6.1信息的瀏覽式檢索與鏈接技術外部鏈接

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論