文獻(xiàn)檢索課件_第1頁
文獻(xiàn)檢索課件_第2頁
文獻(xiàn)檢索課件_第3頁
文獻(xiàn)檢索課件_第4頁
文獻(xiàn)檢索課件_第5頁
已閱讀5頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二講常用文獻(xiàn)檢索數(shù)據(jù)庫和檢索技術(shù),信息檢索基本流程,信息檢索就是從信息集合中找出與用戶需求相關(guān)的信息。信息集合找出用戶需求相關(guān)信息使用搜索引擎的經(jīng)驗:輸入關(guān)鍵詞/句(用戶需求)搜索引擎(信息檢索系統(tǒng))從網(wǎng)上(信息集合)“找出”包含這些關(guān)鍵詞的若干網(wǎng)頁(相關(guān)信息),這就是用戶體驗到的檢索流程。,常見中外文獻(xiàn)檢索庫,中文文獻(xiàn)檢索庫中國知網(wǎng)(CNKI)維普期刊全文數(shù)據(jù)庫萬方數(shù)據(jù)讀秀學(xué)術(shù)搜索數(shù)據(jù)庫外文文獻(xiàn)檢索庫Webofscience(三大引文數(shù)據(jù)庫SCIE,SSCI,ADesignofLandspace;DesignofPlantinglandspace,5)“(F)”同字段檢索含義:“(F)”算符中F的含義為“Field”。這個算符表示其兩側(cè)的檢索詞必須在同一個詞段中出現(xiàn),(例如;同在題目字段或文摘字段)詞序不限,中間可插任意檢索詞項。例如:POLLUTION(F)CONTRON可命中Contronandmanagementofindustrialpollution同在題目中(F)鄰近算符與AND布爾邏輯主要區(qū)別在于:(F)使兩個檢索項在同一字段,AND布爾邏輯中兩個檢索詞會發(fā)生在不同字段中。,6)“(s)”同句檢索含義:“(s)”算符中的S含義為“Sentence”。這個算符表示其兩側(cè)的檢索詞必須在同一自然句子(子字段)中出現(xiàn),兩詞的詞序可以顛倒。放寬了詞位置檢索的要求,使表達(dá)同一概念但不滿足詞位置條件的文獻(xiàn)也可以被檢索出來,從而提高了查全率。,以上介紹的各種位置算符,按照限制程度的大小,(W)、(nW)最強,(N)、(nN)次之,(S)再次之。當(dāng)(nN)的n10時,其作用已經(jīng)相當(dāng)于(S)。,3、截詞檢索技術(shù),含義:用截斷的詞(詞的片段)的一個局部進(jìn)行的檢索,并認(rèn)為凡滿足這個詞局部中的所有字符(串)的文獻(xiàn),都為命中的文獻(xiàn)。檢索者將檢索詞在合適的地方截斷,然后截出的片斷進(jìn)行檢索。,原因:由于西文的構(gòu)詞特性,在檢索中經(jīng)常會遇到名詞的單復(fù)數(shù)形式不一致;同一個意思的詞,英美拼法不一致;詞干加上不同性質(zhì)的前綴和后綴就可以派生出許多意義相近的詞等等。為了保證查全,就得在檢索式中加上這些具有各種變化形式的相關(guān)意義的檢索詞,這樣就會出現(xiàn)檢索式過于冗長,輸入檢索詞的時間太久,同時也占太多機時。,截詞的方式,(1)按截斷的字符數(shù)量來分:有限截斷和無限截斷有限截斷:有具體截去的字符數(shù)。無限截斷:不指明具體截去的字符數(shù)。(2)按截斷的位置區(qū)分:后截斷、前截斷以及中間截斷。(3)截斷常使用截斷符號,各檢索系統(tǒng)所使用的截斷符號有所不同,常用的符號有“?”,“”,“”以及“*”。以下舉例中用“?”來表示有限截斷,用“*”表示無限截斷。注意:不同的數(shù)據(jù)庫所用的截詞符不一樣,使用應(yīng)先查一下各數(shù)據(jù)庫的幫助加以確認(rèn)。,后方截詞(前方一致或右截斷),含義:將截詞符放在一串字符的后面,用以表示以相同字符串開頭,而結(jié)尾不同的所有詞。(1)詞尾的有限截斷相同字符串后可能變化一個字符時,則在其后使用一個“?”、空格、再加一個“?”,常用來表示檢索詞的單復(fù)數(shù)變化。例如:用system?可以查出sytem和systems的文獻(xiàn)。相同字符串后可能變化兩個以上字符時,則在其后連續(xù)使用若干個“?”代替可能變化的字符。例如:?表示兩個字符,?表示三個字符,以此類推。,(2)詞尾的無限截斷,相同字符串后可能變化任何字符串時,則在其后使用一個“?”。這種方法可以查找出含有相同字符串的所有檢索詞。例如:comput?可查出compute,computer,computing,computation,computerisation等。,后截詞主要使用在如下4個方面,詞的單復(fù)數(shù),如book?,potato?;年代,如198?(80年代),19?(20世紀(jì));作者,如用Lancaster*可檢出所有姓Lancaster的作者;同根詞,如用biolog*,可檢出biological、biologist、biology等同根詞。,有限截詞檢索法注意事項,(1)有限截斷比較精確,只檢索出用戶需要的詞匯;(2)使用時無限截斷必須注意:詞干不要太短,否則會檢出許多無關(guān)的文獻(xiàn);(3)應(yīng)盡量選用不會引起誤檢的截斷詞。,中間截詞(中間屏蔽),將提問字符串中間的字符用符號代替,主要用于英式美式不同拼法的英文單詞,或單復(fù)數(shù)不同的單詞。截詞符具有“OR”運算符的功能,能夠擴大檢索范圍,而且減少了輸入檢索詞的時間,節(jié)約了機時。例如:“woman”和“women”,可用“wom?n”代替;“defence”和“defense”可用“defen?e”代替。檢索時為防止漏檢可用中間屏蔽的檢索方法:m?nwom?norgani?ationdefen?e當(dāng)然使用中間屏蔽的方法也要注意是否可能誤檢其它詞匯的文獻(xiàn)。,前截斷(后方一致或左截斷),前截斷檢索常用于復(fù)合詞。例:?computer表示minicomputer,microcomputers等。前截斷與后截斷也可以組合起來使用。例如:*chemi*可以檢出下列詞匯chemical、chemistry、chemist、eletrochemical、electrochemistry、physicochemistry、thermochemistry等。,4、字段限定檢索,含義:限定檢索詞在數(shù)據(jù)庫記錄中的一個或幾個字段范圍內(nèi)查找的一種檢索方法。(規(guī)定的字段范圍內(nèi)出現(xiàn)的信息方為命中信息的一種檢索方法。)適用于在已有一定數(shù)量輸出記錄的基礎(chǔ)上,通過指定字段的方法,減少輸出篇數(shù),提高檢索結(jié)果的查準(zhǔn)率。由于字段限制采用前綴和后綴的形式,又可稱為前綴限制和后綴限制。,限制檢索主要有兩種方式:字段檢索利用字段進(jìn)行限制,如題名、摘要、全文等通常的字段限制范圍的大小順序是:題名關(guān)鍵詞=1994,5、擴檢與縮檢,1)擴檢含義:指初始設(shè)定的檢索范圍太小,命中文獻(xiàn)不多,需擴大檢索范圍的方法。擴檢方法:概念的擴大范圍的擴大增加同義詞年代的擴大,擴大檢索范圍,提高查全率的技術(shù)方法:,(1)考慮同義詞或近義詞(使用布爾邏輯符or連接)(2)選擇較大檢索范圍的字段如摘要(3)使用截詞符(4)使用上位詞(如飛行器航天飛機載人航天飛機),含義:縮檢是指開始的檢索范圍太大,命中文獻(xiàn)太多,或查準(zhǔn)率太低的一個方法??s檢方法:概念的縮小范圍的限定年代的減少核

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論