中科大文獻(xiàn)檢索課件02檢索語言_第1頁
中科大文獻(xiàn)檢索課件02檢索語言_第2頁
中科大文獻(xiàn)檢索課件02檢索語言_第3頁
中科大文獻(xiàn)檢索課件02檢索語言_第4頁
中科大文獻(xiàn)檢索課件02檢索語言_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二講

檢索語言一、檢索語言的概述P261、原理:檢索語言是保證存儲和檢索的一致的一種共同性的人工語言,它把文獻(xiàn)的存儲與檢索聯(lián)系起來,使文獻(xiàn)的標(biāo)引者和檢索者取得共同理解,從而實現(xiàn)檢索。2、分類:

二、分類語言概述

分類語言具有良好的系統(tǒng)性,它把同一學(xué)科,同一專業(yè),同一職能活動的文獻(xiàn)集中在各個類目之下,以滿足人們族性檢索(類檢索)的需要。缺點:1)不能確切地代表科學(xué)體系;2)常出現(xiàn)無類可歸,無類可查的情況;3)體系分類法嚴(yán)格的邏輯體系給增加、刪減類目造成困難;4)必須了解學(xué)科的分門別類的體系

三、《中國圖書館分類法》

1、基本部類。2、基本大類。3、簡表。4、詳表。5、輔助表。也稱復(fù)分表,它是用于輔助主表的不足,對主表中列舉的類目進(jìn)一步細(xì)分。總論復(fù)分、世界地區(qū)表(歐、亞、非)、中國地區(qū)表(華北、東北)國際時代表、中國時代表、中國民族表、通用時間表等。6、網(wǎng)上中圖法(上海交大)/chinese/virtual_reference_desk/ztfjj.htm中圖法1、論學(xué)習(xí)“三個代表”重要思想2、論陳云評價毛澤東功過3、比較數(shù)學(xué)教育學(xué)研究方法的探討4、熱的產(chǎn)生5、物理光學(xué)實驗——益光教學(xué)儀器

6、神秘白金漢宮中圖法7、器官移植技術(shù)8、加拿大AR-5型空勤人員防毒面具9、化學(xué)雙語教學(xué)的理性思考與實踐研究10、我國南極隕石研究與展望11、天然氣水合物的環(huán)境效應(yīng)12、概率論與紅樓夢中圖法13、與人類息息相關(guān)的微生物14、青少年犯罪心理研究15、豬也會哭16、滲流與抗滑樁的抗滑穩(wěn)定性分析

17、中國計算機(jī)化的核數(shù)據(jù)庫建成18、經(jīng)濟(jì)全球化與我國的經(jīng)濟(jì)安全四、

國外的分類語言簡介1.杜威十進(jìn)制分類法(DeweyDecimalClassificationandRelativeIndex)

2.國際十進(jìn)分類法(UniversalDecimalClassification)

/五、主題語言概述1、定義:描述性的語言。用于自然語言中的名詞、名詞性詞組或句子,描述文獻(xiàn)所論述或研究的事物的主題概念。2、特點:用詞語來表述概念,一篇文獻(xiàn)可用多個主題,擴(kuò)大了檢索范圍。

3、 主題檢索語言分類及其使用1)標(biāo)題詞檢索語言是用規(guī)范化的自然語言經(jīng)過標(biāo)準(zhǔn)化處理的名詞術(shù)語作為標(biāo)識,來直接表達(dá)文獻(xiàn)信息或涉及到的事物主題。通常用“事物—事物的方面”來表。如:SHE1)see(見):用來從不作為標(biāo)題詞的自由詞引見到作為標(biāo)題詞規(guī)范化詞匯。(1)AeroplaneseeAircraft(2)CommunicationSeeDataTransmission(3)AlloysteelSeeSteel2)Seealso(參見):用于擴(kuò)大檢索COMPUTERS,DIGITALSeealsoCOMPUTERSSYSTEMS,DIGITAL練習(xí)(1)ACCELERATORS(Useforgeneralsubjectofparticleacceleratorsandforspecificparticleacceleratorsnotelsewhereclassifiable.SeeinvertedheadingsforspecifictypesACCELERATORS,BETAON)練習(xí)(2)CHEMICALPLANTS(forsubheadings,seeBUILDINGSandforINDUSTRIALPLANTS)(3)AIRCRAFT(Useforgeneralsubject,Forspecificaircraft,Seeinvertedheadings,asAIRCRAFTAMPHIBIAN,etc.)

2)單元詞語言:不能再分解的概念單元的規(guī)范化的名詞作為文獻(xiàn)主題概念表識例如:“公路橋梁”----“公路”+“橋梁”金魚洗衣粉香蕉蘋果虛假組配

3)關(guān)鍵詞語言:文獻(xiàn)的題目、摘要以及正文部分出現(xiàn)的,能表現(xiàn)文獻(xiàn)主題內(nèi)容的具有實質(zhì)意義的詞。例如:地震對高層建筑地基的振動效應(yīng)。同一概念,塑料---聚乙烯

同一著者,杜彥良

4、敘詞檢索語言:以自然語言詞匯為基礎(chǔ),以概念組配為基本原理,適用于現(xiàn)代信息檢索需要而發(fā)展起來的一種信息檢索語言類型。

如:INSPEC敘詞表漢語題詞表1)噴氣式垂直起落飛機(jī)噴氣式飛機(jī)+垂直起落飛機(jī)2)飛機(jī)起落架飛機(jī)+起落架3)腎結(jié)石腎病+結(jié)石練習(xí)學(xué)名和俗稱電子計算機(jī)-----電腦新稱與舊稱形式邏輯--------名學(xué)全稱與簡稱中國---中華人民共和國不同譯名電動機(jī)---------馬達(dá)第三講計算機(jī)檢索

第一節(jié)計算機(jī)檢索的基礎(chǔ)知識一、概述1、定義:簡稱機(jī)檢,狹義上是指人們根據(jù)特定的情報需求,利用計算機(jī)從相關(guān)的機(jī)讀數(shù)據(jù)庫中識別并獲取所需情報信息的過程。廣義上包括信息存儲和信息檢索兩個方面,即數(shù)據(jù)庫的建立與利用兩個方面。二、計算機(jī)檢索的優(yōu)缺點1、優(yōu)點:1)速度快,效率高2)檢索途徑多3)用戶界面友好,使用方便4)資源更新快5)直接輸出檢索結(jié)果6)信息內(nèi)容的廣泛、訪問快速且搜索具有網(wǎng)絡(luò)性2、缺點:檢索費用較高;網(wǎng)絡(luò)數(shù)據(jù)庫逐漸增多。三、步驟與方法1、分析課題確定主題2、選擇數(shù)據(jù)庫1)收錄文獻(xiàn)的來源、學(xué)科特點2)收錄文獻(xiàn)的文獻(xiàn)類型和時間范圍3)收費標(biāo)準(zhǔn)及能否索取到原文3、選擇檢索詞

4、制定檢索策略

1)查找文獻(xiàn)在類型、文種、時間等方面;

2)進(jìn)行概念分析、選擇檢索詞;

3)運用邏輯運算符、位置運算符、截詞符等構(gòu)造檢索表達(dá)式;

①邏輯運算符:

“OR”:邏輯或(和),用“+”表示,。“AND”:邏輯與(積),用“*”表示?!癗OT”:邏輯非(差),用“-”表示。

“太陽”“能量”

練習(xí)1、PATENT*/+/-CHINA2、在秦嶺隧道中發(fā)表的有關(guān)掘進(jìn)機(jī)和TBM的文章3、除發(fā)表的有關(guān)秦嶺隧道中掘進(jìn)機(jī)和TBM的文章KEYS:2、(掘進(jìn)機(jī)+TBM)*秦嶺隧道3、(掘進(jìn)機(jī)+TBM)-秦嶺隧道思考:還可以有那種形式COMPUTERNETWORKS(1)Applications(2)023065(3)Computerinformationcommunicationnetworksandexpertsystems.(4)Computerizeddatacommunicationnetworkswhichprovidedatatouserslocatedasadistancefromeachotherareconsidered.Thepossibilitiesofsuchcommunicationnetworksforusersofdifferentprofessionsareindicated,andtheadvantagesofthisnewinformationexchangetechnologyarereviewed.(Authorabstract)(5)8Refs.(6)InRussian.(7)Pahtavan,K(8)(WorcesterpolytechnicInst).(9)Liefer,MarkE.

(11)ACMTransOffInfSystv6n3Jul1988p277-302(10)②位置運算符:(w)算符With:(w)要求檢索詞必須按指定順序緊密相連,詞序不可變,詞之間除允許有空格、標(biāo)點、連字符外,不得夾單詞或字母;(Nw)表示連接的兩個詞之間最多可夾入N個詞(N為自然數(shù)),詞序不得顛倒例如:input(w)outputinputoutput;input,output;input-outputwear(1w)materialswearmaterials、wearofmaterials。(n)算符near:

(n)要求被連接的檢索詞必須緊密相連,詞之間除允許有空格、標(biāo)點、連字符外,不得夾單詞或字母,詞序不限;(Nn)表示兩個檢索詞之間最多可以夾N個詞(N為自然數(shù)1、2、3…),且詞序任意。例如:information(n)retrieval

informationretrieval、

retrieval-information,economic(2n)recoveryeconomicrecovery、recoveryfromeconomictroubles1、building(w)construction2、building(1w)construction3、building(n)constructionKeys:1、buildingconstruction;building-construction2、buildingandconstruction;buildingunderconstruction3、constructionbuilding;Construction-building③截詞符無限截詞符“*”,代表零至無數(shù)多個字母;computer*

computer;computered;computering;有限截詞符“?”,只能代表一個字母;teen?

teens例如:*chemi*chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry1、ne?t2、查找檢索結(jié)果為”ZhejiangUnivTechnol”的文獻(xiàn)3、查找刊名中含有”情報”兩字的期刊.Keys:1、neat;nest;next2、ZhejiangandUniv*andTech*3、情報%(CNKI)情報科學(xué)、情報理論與科學(xué)、現(xiàn)代科學(xué)④限制檢索(Range)1)字段檢索:

1、基本索引字段:描述文獻(xiàn)內(nèi)容特征的字段,一般用后綴形式表示。/ABABSTRACT文摘/DEDESCRIPTOR敘詞/IDIDENTIFIER自由標(biāo)引詞/TITITLE篇名

例如查找微型機(jī)和個人計算機(jī)方面的文章。要求“微型機(jī)”一詞出現(xiàn)在敘詞字段、標(biāo)題字段或文摘字段中,“個人計算機(jī)”一詞出現(xiàn)在標(biāo)題字段或文摘字段中

microcomputer*/de,ti,ab

OR(personalcomputer+PC)/ti,ab

2、輔助索引字段:描述文獻(xiàn)外部特征的字段,檢索時輔助索引字段代碼置于檢索詞之前,一般不單獨使用,常與基本索引字段配合使用。

AA=AUTHORAFFILIATION著者單位AD=APPLICATIONDATE專利申請日AN=ABSTRACTNUMBER,文摘號APPLICATIONNUMBER專利申請?zhí)朅U=AUTHORORINVENTOR著者或發(fā)明者PY=PUBLICATIONYEAR出版年CY=CONFERENCEYEAR會議年份例如查找微型機(jī)和個人計算機(jī)方面的文章。要求“微型機(jī)”一詞出現(xiàn)在敘詞字段、標(biāo)題字段或文摘字段中,“個人計算機(jī)”一詞出現(xiàn)在標(biāo)題字段或文摘字段中。要查找1999年出版的英文或法文的微型機(jī)或個人計算機(jī)方面的期刊

(microcomputer*)/de,ti,abOR(personalcomputer+PC)/ti,ab)ANDPY=1999AND(LA=ENORFR)ANDDT=Serials

4.進(jìn)行查找、檢出相關(guān)文獻(xiàn)并分析檢索結(jié)果;

5.對檢索式進(jìn)行反饋修改。四、檢索實例1、“心臟病與吸煙之間的聯(lián)系”(英文)2、門式起重機(jī)的研究3、西紅柿的病蟲害預(yù)防與養(yǎng)殖

4、搜索計算機(jī)行業(yè)的營銷狀況,但不需要查詢方正計算機(jī)的營銷狀況.5、查找1989-1999年的文獻(xiàn).6、查找杜彥良發(fā)表的有關(guān)掘進(jìn)機(jī)和TBM的文章7、查找除了石家莊鐵道學(xué)院發(fā)表的有關(guān)掘進(jìn)機(jī)和TBM的文章1、(HEART(5N)DISEASE+HEART(5N)ATTACK)*(SMOK*+TOBACCO)

2、門式起重機(jī)門式*起重機(jī)3、(番茄+西紅柿)*(病蟲害*預(yù)防+養(yǎng)殖)4、(計算機(jī)AND營銷)NOT方正5、PY=1989:1999;PY=1989TOPY=1999.6、作者=杜彥良AND(題名=掘進(jìn)機(jī)OR題名=TBM)7、(題名=掘進(jìn)機(jī)OR題名=TBM)NOT機(jī)構(gòu)=石家莊鐵道學(xué)院

搜索引擎最根本的任務(wù)是向網(wǎng)絡(luò)訪問者提供一個高效的訪問機(jī)制。搜索引擎本身是個網(wǎng)站,但搜索引擎的數(shù)據(jù)庫中存放的是其他網(wǎng)站的信息,而不是自己的信息。搜索引擎不僅接受用戶的訪問,還根據(jù)用戶的搜索要求,在龐大的數(shù)據(jù)庫中搜索出滿足用戶需要的站點。五、搜索引擎概述

搜索引擎(SearchEngines)是指對WWW站點資源和其他網(wǎng)絡(luò)資源進(jìn)行標(biāo)引和檢索的一類檢索系統(tǒng)機(jī)制。

搜索引擎常用的檢索方法有關(guān)鍵詞檢索和目錄瀏覽兩種形式。

關(guān)鍵詞檢索:用戶直接輸入檢索詞,搜索引擎通過查找索引數(shù)據(jù)庫中包含有檢索詞的記錄來提供用戶所需的信息資源。檢索方便直接,而且可以使用邏輯算符、位置算符、截詞符等來構(gòu)成檢索式,可以限制檢索對象的地區(qū)、數(shù)據(jù)類型、時間等,因而可準(zhǔn)確檢索滿足特定條件的網(wǎng)絡(luò)資源。

目錄瀏覽:用戶通過瀏覽層次型的目錄來尋找相關(guān)的信息資源。目錄按一定的主題分類體系組織,并輔之年代、地區(qū)等分類。用戶一般采取逐層瀏覽目錄、逐步細(xì)化來尋找合適的類別直至具體資源。檢索和瀏覽在信息查詢過程中各有其功用。一般地說,檢索便于有的放矢,直接獲取檢索結(jié)果;瀏覽利于邊查邊看,發(fā)現(xiàn)未曾預(yù)料的結(jié)果。

(三)幾種常用的搜索引擎1.一種典型的搜索引擎介紹———Yahoo!

(1)分類瀏覽

(2)關(guān)鍵詞檢索

在檢索

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論