版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二節(jié) 計(jì)算機(jī)文獻(xiàn)檢索策略,計(jì)算機(jī)文獻(xiàn)信息檢索包含制定檢索表達(dá)式、制定合理的檢索策略、檢索策略的調(diào)整三個(gè)過程,一、檢索表達(dá)式及構(gòu)成要素 二、計(jì)算機(jī)檢索策略的制定 三、調(diào)整計(jì)算機(jī)檢索策略,檢索表達(dá)式的基本含義:檢索表達(dá)式是一個(gè)既能反映檢索課題內(nèi)容、又能為計(jì)算機(jī)識(shí)別的式子,是進(jìn)行計(jì)算機(jī)文獻(xiàn)信息檢索的依據(jù),它主要是運(yùn)用各種邏運(yùn)算符號(hào)、邏輯位置符號(hào)及邏輯限制符號(hào),把檢索詞連接組配起來,確定檢索詞之間的關(guān)系,準(zhǔn)確表達(dá)檢索課題的內(nèi)容,構(gòu)成檢索表達(dá)式的基本要素 (一)檢索詞 (二)運(yùn)算符,檢索詞:表達(dá)檢索課題主題概念的名詞術(shù)語,包括敘詞和自由詞。敘詞是規(guī)范詞,大型數(shù)據(jù)庫(kù)都有自己專用的詞表,檢索者可以從選擇合
2、適的詞進(jìn)行檢索。,關(guān)鍵詞:,構(gòu)成檢索表達(dá)式的基本要素 (一)檢索詞 (二)運(yùn)算符,1.布爾邏輯算符 常用的布爾邏輯算符有三種,分別是邏輯或OR,邏輯與AND,邏輯非NOT。下面分別簡(jiǎn)釋它們各自的含義與用法。,(1)邏輯或“OR” 邏輯或“OR”可以擴(kuò)大信息的檢索范圍,使用它相當(dāng)于增加檢索詞主題的同義詞與近義詞,能提高檢索的查全率。,(2)邏輯與“AND” 邏輯與“AND”可以縮小信息的檢索范圍,提高檢索的查準(zhǔn)率。,(3)邏輯非“NOT” 邏輯非“NOT”可以用來排除不希望出現(xiàn)的檢索詞,它與邏輯與“AND”的作用類似,能夠縮小命中信息的范圍,提高檢索的查準(zhǔn)率。,新浪的使用(,搜狐的使用(,百度的
3、使用(,雅虎的使用(,2鄰近檢索 位置檢索也叫全文檢索、鄰近檢索。所謂全文檢索,就是利用記錄中的自然語言進(jìn)行檢索,詞與詞之間的邏輯關(guān)系用位置算符組配,對(duì)檢索詞之間的相對(duì)位置進(jìn)行限制。,這是一種可以不依賴主題詞表而直接使用自由詞進(jìn)行檢索的技術(shù)方法。不同的檢索系統(tǒng)其位置算符的表示方法不盡相同,美國(guó)DIALOG 檢索系統(tǒng)的位置算符的用法意義如下:,(1)(W)With (W)表示該算符兩側(cè)的檢索詞相鄰,且兩者之間只允許只有一個(gè)空格或標(biāo)點(diǎn)符號(hào),不允許有任何字母或詞,順序不能顛倒。(W)也可以簡(jiǎn)寫為( )。 例如: Aircraft( )design 可檢索出含有Aircraft design 的文獻(xiàn)記
4、錄。 Computer( )aided( )design 可檢索出含有Computer aided design 的文獻(xiàn)記錄。,(2) (nW)nWords (nW)表示在此算符兩側(cè)的檢索詞之間最多允許間隔n 個(gè)詞(實(shí)詞或虛詞),且兩者的相 對(duì)位置不能顛倒。 例如:laser(1w)printer 可檢出含有l(wèi)aser printer 和laser color printer 的文獻(xiàn)記錄。,(3) (N)Near (N)表示該算符兩側(cè)的檢索詞相鄰,但兩者的相對(duì)位置可以顛倒。 例如:computer(N)network 可檢出含有computer network、network computer
5、 形式的文獻(xiàn)記錄。,(4)(nN)nNear (nN)表示此算符兩側(cè)的檢索詞之間允許間隔最多n 個(gè)詞,且兩者的順序可以顛倒。 例如 computer(2N)system 可檢出含有computer system,computer code system, computer aided design system,system using modern computer 等形式的文獻(xiàn)記錄。,(5)(S)Subfield (S)表示其兩側(cè)的檢索詞必須是在文獻(xiàn)記錄的同一子字段中,而不限定它們?cè)谠撟幼侄沃械南鄬?duì)次序和相對(duì)位置的距離。在文摘字段中,一個(gè)句子就是一個(gè)子字段。,例如computer( )co
6、ntrol(s)system 可檢出文摘中含有“This paper is concerned with an application of the computer control technique in a intelligent system for testing inner walls of pipes.”這樣一句話的文獻(xiàn)記錄。,這樣的文獻(xiàn)記錄也是可以被檢索到的“Design of a System for Data Acquisition and Computer Control of a Pulmonary Physiology Lab”,(6)(F)Field (F)表示其兩
7、側(cè)的檢索詞必須是在文獻(xiàn)記錄的同一字段中,而它們?cè)谠撟侄沃械南鄬?duì)次序和相對(duì)位置的距離不限。 例如:water( )pollution(F)control 表示在同一個(gè)字段中(如篇名、文摘、敘詞等)同時(shí)含有water pollution 和control 的文獻(xiàn)記錄均可檢索出來。,3截詞檢索 截詞檢索是計(jì)算機(jī)檢索系統(tǒng)中應(yīng)用非常普遍的一種技術(shù)。由于西文的構(gòu)詞特性,在 檢索中經(jīng)常會(huì)遇到名詞的單復(fù)數(shù)形式不一致;同一個(gè)意思的詞,英美拼法不一致;詞干加上不同性質(zhì)的前綴和后綴就可以派生出許多意義相近的詞等等。,所謂截詞,就是指在檢索詞的適當(dāng)位置截?cái)?。不同的檢索系統(tǒng)其截詞檢索的表示是不同的。 例如,美國(guó)Dial
8、og 系統(tǒng)用“?”表示截詞符。有以下截詞方式:,1) 后方截詞 后方截詞,也稱前方一致。它是將截詞符放在一串字符的后面,用以表示以相同字符串開頭,而結(jié)尾不同的所有詞。 后方截詞又分為詞尾的有限截?cái)嗪驮~尾的無限截?cái)鄡煞N情況。,(1)詞尾的有限截?cái)?相同字符串后可能變化一個(gè)字符時(shí),則在其后使用一個(gè)“?” 例如用system? 可以查出sytem 和systems 的 文獻(xiàn)。,相同字符串后可能變化兩個(gè)以上字符時(shí),則在其后連續(xù)使用若干個(gè)“?”代替可能變 化的字符。例如,?表示兩個(gè)字符,?表示三個(gè)字符,以此類推。,(2)詞尾的無限截?cái)?相同字符串后可能變化任何字符串時(shí),則在其后使用一個(gè)“*”。這種方法可
9、以查找出含有相同字符串的所有檢索詞。 例如, comput* 可查出compute , computer ,computing,computation,computerisation 等等。,2) 中間截詞 中間截詞又稱中間屏蔽, 是一種用截詞符屏蔽詞中不同字符的方法。 例如:“ woman ” 和“ women ” , 可用“ wom?n” 代替; “ defence ” 和“ defense ” 可用“defen?e”代替。 截詞符具有“OR”運(yùn)算符的功能,能夠擴(kuò)大檢索范圍,而且減少了輸入檢索詞的時(shí) 間,節(jié)約了機(jī)時(shí)。,4字段限制檢索 1)檢索系統(tǒng)中的限制檢索 在檢索系統(tǒng)中,使用縮小和限定檢
10、索范圍的方法稱為限制檢索。限定檢索條件多種多樣,主要和常用的是字段限制。,通常數(shù)據(jù)庫(kù)中可供檢索的字段分為主題字段和非主題字段。其中,主題字段如題名(Title)、敘詞(Descriptor)、標(biāo)識(shí)詞(Identifier)、文摘(Abstract)等,非主題字段如作者(Author)、文獻(xiàn)類型(Document Type)、語種(Language)、出版年份(Publication Year)等。,2)搜索引擎中的限制檢索 搜索引擎中的字段檢索多表現(xiàn)為前綴符限制形式。 其中,表示內(nèi)容特征的主題字段有Title,Keywords,Subject,Summary等,表示外部特征的非主題字段限制有i
11、mage,text等。,此外,搜索引擎還提供了帶有典型網(wǎng)絡(luò)檢索特征的字段限制類型,如主機(jī)名限制(host),URL限制(url),E-mail限制(from),新聞組限制(newsgroups),Link限制(link),網(wǎng)址限制(site)等。這些字段限定了檢索詞在記錄中出現(xiàn)的位置,用來控制檢索結(jié)果的相關(guān)性。,5短語檢索 短語用“”表示,檢索出與“”內(nèi)形式完全相同的短語,以提高檢索的精度和準(zhǔn)確度,因而也有人稱之為“精確檢索”(exact search)。,6括號(hào)檢索 用于改變運(yùn)算的先后次序,括號(hào)內(nèi)的運(yùn)算優(yōu)先進(jìn)行。,7自然語言檢索 即直接采用自然語言中的字、詞、句進(jìn)行提問式檢索,同一般口語一樣
12、。如“布什是誰?流星是什么?”這種基于自然語言的檢索方式又被稱為“智能檢索”(intelligent search),特別適合不太熟悉網(wǎng)絡(luò)檢索技術(shù)的人士使用。支持自然語言檢索的又中文的baidu,英文的google、AltaVista、Excite、Infoseek、HotBot、Ask Jeeves等。,8多語種檢索 提供多種語言的檢索環(huán)境供用戶選擇,系統(tǒng)按用戶選定的語種進(jìn)行檢索并反饋結(jié)果,支持多語種檢索的如中文天網(wǎng),英文AltaVista等。,9模糊檢索 又稱概念檢索。當(dāng)我們輸入一個(gè)檢索詞時(shí),搜索引擎不僅反饋包括了該關(guān)鍵詞的網(wǎng)址,同時(shí)也發(fā)來與關(guān)鍵詞意義相近的內(nèi)容。,例如,我們查找“查詢”一
13、詞時(shí),模糊檢索會(huì)反饋來包含了“查詢”、“查找”、“查一查”、“尋找”、“搜索”等內(nèi)容的網(wǎng)址。反饋網(wǎng)址的排列,一般是完全符合關(guān)鍵詞的在最前邊,其次是相近的?,F(xiàn)在大多數(shù)搜索引擎都有這種功能,只是模糊的程度不同。,10區(qū)分大小寫的檢索 輸入時(shí),如果用戶的檢索式用小寫字母表示,搜索工具既匹配大寫又匹配小寫,如china,將檢索出china(瓷器),China(中國(guó)):但如果用大寫字母表示,搜索工具認(rèn)為用戶指定了只要大寫,就只會(huì)查找那些與用戶鍵入的輸入形式完全相同的結(jié)果,如China,只檢索出China。,以上十種檢索方法中,自然語言檢索、模糊檢索、多語種檢索和區(qū)分大小寫的檢索是網(wǎng)絡(luò)檢索所特有的。,在實(shí)
14、際的檢索中,往往將上述多種檢索技術(shù)混合使用,如要查找標(biāo)題中含有“網(wǎng)絡(luò)營(yíng)銷”的資料,可以利用布爾邏輯運(yùn)算符AND、OR和截詞檢索、區(qū)分大小寫檢索,并將檢索結(jié)果限制在題名字段:ti:(Web OR Internet OR WWW) AND market*。,一、檢索表達(dá)式及構(gòu)成要素 二、計(jì)算機(jī)檢索策略的制定 三、調(diào)整計(jì)算機(jī)檢索策略,計(jì)算機(jī)檢索策略,又稱計(jì)算機(jī)檢索提問邏輯,是對(duì)計(jì)算機(jī)檢索的全面規(guī)劃。 在操作上主要指檢索系統(tǒng)和文獻(xiàn)數(shù)據(jù)庫(kù)的選擇和檢索表達(dá)式的編制。,1.分析檢索課題,明確檢索目的 2.選擇檢索系統(tǒng)和文獻(xiàn)數(shù)據(jù)庫(kù) 3.確定檢索詞及檢索途徑 4.制定檢索表達(dá)式和檢索順序,一、檢索表達(dá)式及構(gòu)成要
15、素 二、計(jì)算機(jī)檢索策略的制定 三、調(diào)整計(jì)算機(jī)檢索策略,調(diào)整策略之間,首先分析造成檢索結(jié)果不理想的原因,對(duì)于檢索出文獻(xiàn)數(shù)量較多的情況,應(yīng)分析是否可能是如下原因造成: a選用了多個(gè)多義性的檢索詞 b 截詞截得過短 c輸入的檢索詞 d應(yīng)該使用“與”(AND)卻使用了“或”(OR) e優(yōu)先運(yùn)算符“()”使用錯(cuò)誤,對(duì)于檢索出文獻(xiàn)數(shù)量較少的情況,應(yīng)分享是否是如下原因造成: a 檢索詞輸入錯(cuò)誤 b 遺漏重要的同義詞或隱含概念 c 檢索詞過于具體 d 沒有使用截詞算符 e位置算符和字段算符號(hào)使用的過多 f使用過多的“與”(AND)算符,針對(duì)上述原因,如果屬于需要擴(kuò)大檢索范圍,提高檢索結(jié)果檢全率的,調(diào)整策略的方法有:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職(學(xué)前教育)學(xué)前心理學(xué)期末測(cè)試題及解析
- 2025年高職第一學(xué)年(食品質(zhì)量與安全)微生物檢測(cè)試題及答案
- 2025年中職醫(yī)學(xué)影像技術(shù)(影像診斷基礎(chǔ))試題及答案
- 2025年大學(xué)第三學(xué)年(護(hù)理學(xué))傳染病護(hù)理學(xué)階段測(cè)試試題及答案
- 2025年高職土木港口航道(航道疏浚)試題及答案
- 2025年大學(xué)大四(藥學(xué))臨床藥學(xué)實(shí)踐綜合測(cè)試卷
- 2025年中職(會(huì)計(jì)電算化)賬務(wù)處理模擬試題及答案
- 2025年大學(xué)護(hù)理倫理學(xué)(護(hù)理道德實(shí)踐)試題及答案
- 2025年高職旅游服務(wù)與管理(旅游線路策劃)試題及答案
- 高一生物(遺傳的基本規(guī)律)2025-2026年下學(xué)期期末測(cè)試卷
- 2026年寧夏黃河農(nóng)村商業(yè)銀行科技人員社會(huì)招聘?jìng)淇碱}庫(kù)及完整答案詳解1套
- 初三數(shù)學(xué)備課組年終工作總結(jié)
- 2026年尼勒克縣輔警招聘考試備考題庫(kù)必考題
- 湖南名校聯(lián)考聯(lián)合體2026屆高三年級(jí)1月聯(lián)考物理試卷+答案
- 2024年黑龍江三江美術(shù)職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)附答案解析
- 成都傳媒集團(tuán)招聘筆試題庫(kù)2026
- 污泥處置合同協(xié)議
- 2025年蘇州工業(yè)園區(qū)領(lǐng)軍創(chuàng)業(yè)投資有限公司招聘?jìng)淇碱}庫(kù)及一套完整答案詳解
- 鄉(xiāng)村振興視角下人工智能教育在初中英語閱讀教學(xué)中的應(yīng)用研究教學(xué)研究課題報(bào)告
- 2026廣東深圳市檢察機(jī)關(guān)招聘警務(wù)輔助人員13人備考筆試試題及答案解析
- 2026年中國(guó)禮品行業(yè)展望白皮書
評(píng)論
0/150
提交評(píng)論