版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
一、計算機信息檢索(jiǎnsuǒ)方式二、數(shù)據(jù)庫三、計算機檢索(jiǎnsuǒ)技術(shù)第三節(jié)計算機信息檢索第一頁,共51頁。計算機信息檢索的基本涵義(hányì)定義:簡稱機檢,指利用計算機信息檢索系統(tǒng)從文獻(xiàn)信息數(shù)據(jù)庫或因特網(wǎng)上查詢所需文獻(xiàn)信息的過程。
第二頁,共51頁。計算機檢索(jiǎnsuǒ)方式1光盤數(shù)據(jù)庫檢索2聯(lián)機檢索3網(wǎng)絡(luò)信息檢索第三頁,共51頁。計算機檢索(jiǎnsuǒ)的對象——數(shù)據(jù)庫
第四頁,共51頁。數(shù)據(jù)庫(Database)數(shù)據(jù)庫的概念:是指一定專業(yè)范圍內(nèi)的信息(xìnxī)記錄及其索引的集合體。
第五頁,共51頁。數(shù)據(jù)庫的類型(lèixíng)1文獻(xiàn)數(shù)據(jù)庫2數(shù)值數(shù)據(jù)庫3事實數(shù)據(jù)庫書目(shūmù)數(shù)據(jù)庫全文(quánwén)數(shù)據(jù)庫2多媒體數(shù)據(jù)庫第六頁,共51頁。書目(shūmù)數(shù)據(jù)庫(BibliographicDatabase)是檢索工具,存儲(cúnchǔ)的是二次文獻(xiàn),檢索結(jié)果是所需文獻(xiàn)的線索而非原文。例:CBM、CMCC、CMACMEDLINE、PubMed題錄型數(shù)據(jù)庫-文摘型數(shù)據(jù)庫-書目型數(shù)據(jù)庫文獻(xiàn)數(shù)據(jù)庫第七頁,共51頁。全文(quánwén)數(shù)據(jù)庫(FullTextDatabase)存儲的是原始文獻(xiàn)的全文(一次文獻(xiàn)),如期刊論文、學(xué)位論文、會議論文等數(shù)據(jù)庫。例:中國學(xué)術(shù)期刊網(wǎng)絡(luò)(wǎngluò)出版總庫萬方數(shù)字化期刊中文科技期刊數(shù)據(jù)庫(全文版)OVID文獻(xiàn)數(shù)據(jù)庫第八頁,共51頁。書目(shūmù)數(shù)據(jù)庫與全文數(shù)據(jù)庫的比較第九頁,共51頁。數(shù)值(shùzí)數(shù)據(jù)庫(NumericDatabase)
主要包含(bāohán)的是數(shù)值數(shù)據(jù),如各種統(tǒng)計數(shù)據(jù)、科學(xué)實驗數(shù)據(jù)、科學(xué)測量數(shù)據(jù)等。如醫(yī)學(xué)上使用的化學(xué)制劑、藥物的各種理化參數(shù)、人體生理上的各種數(shù)值,都可收入數(shù)值數(shù)據(jù)庫。例:的RTECS核酸序列數(shù)值型數(shù)據(jù)庫GENBANK第十頁,共51頁。事實(shìshí)數(shù)據(jù)庫(FactDatabase)存儲(cúnchǔ)的是用來描述人物、機構(gòu)、事物等對象的事實性信息。如名人錄、機構(gòu)指南、大事記等。例:MEDLARS系統(tǒng)的醫(yī)生咨詢數(shù)據(jù)庫能提供有關(guān)癌癥治療和臨床實驗的相關(guān)病因、診斷標(biāo)準(zhǔn)、治療方案以及最新研究進(jìn)展等信息。第十一頁,共51頁。多媒體數(shù)據(jù)庫(MultimediaDatabase)是數(shù)據(jù)庫技術(shù)和多媒體技術(shù)相結(jié)合的產(chǎn)物(chǎnwù)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB和可視人計劃數(shù)據(jù)庫第十二頁,共51頁。2022/12/13復(fù)旦大學(xué)(fùdàndàxué)圖書館文獻(xiàn)檢索教研室13第十三頁,共51頁。數(shù)據(jù)庫的結(jié)構(gòu)(掌握)記錄(Record):描述一原始信息的外部特征和內(nèi)容特征。書目數(shù)據(jù)庫中的一條記錄通常代表一篇(yīpiān)文獻(xiàn),其它類型數(shù)據(jù)庫中的記錄則是某種信息單元
字段(Field):比記錄小,組成記錄的數(shù)據(jù)(shùjù)項目文檔(File):兩種含義1.數(shù)據(jù)庫的結(jié)構(gòu)(順排文檔和倒排文檔)2.數(shù)據(jù)庫中的一部分記錄(jìlù)的集合(子集subset)
第十四頁,共51頁。記錄(jìlù)字段舉例第十五頁,共51頁。第十六頁,共51頁。第十七頁,共51頁。第十八頁,共51頁。題錄(參考文獻(xiàn)常用字段)作者、篇名、來源(刊名、年、卷、期、頁碼(yèmǎ))格式:作者.篇名.刊名,年,卷(期):起始頁碼(yèmǎ)-終止頁碼(yèmǎ)姜春林,劉則淵,梁水霞.H指數(shù)和G指數(shù)——期刊學(xué)術(shù)影響力評價的新指標(biāo)[J].圖書情報工作,2006,50(12):63-65SamuelsOB,JosephGJ,LynnMJ,etal.Astandardizedmethodformeasuringintracranialarterialstenosis.AJNRAmJNeuroradiol.2000;21:643–646.第十九頁,共51頁。文檔的概念第二十頁,共51頁。第二十一頁,共51頁。
數(shù)據(jù)庫的結(jié)構(gòu)(jiégòu)數(shù)據(jù)庫文檔記錄字段若干個記錄(jìlù)構(gòu)成的信息集合稱為文檔。大型的數(shù)據(jù)庫分割成若干文檔。記錄是構(gòu)成數(shù)據(jù)庫的完整的信息(xìnxī)單元,每條記錄描述了原始信息(xìnxī)的外部特征和內(nèi)部特征。組成記錄的數(shù)據(jù)項目第二十二頁,共51頁。數(shù)據(jù)庫的訪問(fǎngwèn)1.數(shù)據(jù)庫的存放地點2.數(shù)據(jù)庫使用的免費與收費3.并發(fā)(bìngfā)用戶數(shù)與超時退出第二十三頁,共51頁。一名北京大學(xué)學(xué)生2002年10月1日-4日通過圖書館代理服務(wù)器批量下載了著名的西文過刊全文庫—JSTOR中的數(shù)千篇文獻(xiàn)。導(dǎo)致JSTOR立刻封鎖該館的訪問權(quán)限長達(dá)數(shù)月,并對此明顯的惡意侵權(quán)行為委托律師向北大圖書館提出(tíchū)法律質(zhì)詢,嚴(yán)重?fù)p害了北京大學(xué)的聲譽。對方律師親自到場監(jiān)督該同學(xué)刪除其之前所下載的全部數(shù)據(jù)。最直接的經(jīng)濟影響:2萬余元龐大國際通訊費用的損失,使得圖書館的代理服務(wù)器幾乎無以為繼。電子資源違規(guī)使用(shǐyòng)案例第二十四頁,共51頁。截詞檢索2限定檢索3位置檢索4加權(quán)檢索5計算機檢索(jiǎnsuǒ)技術(shù)布爾邏輯檢索1二次檢索6第二十五頁,共51頁。舉例(jǔlì):高血壓高血壓的治療特殊類型高血壓的藥物治療術(shù)前抗高血壓治療對麻醉(mázuì)誘導(dǎo)血流動力學(xué)的影響高血壓高血壓的治療(zhìliáo)特殊類型高血壓的藥物治療術(shù)前抗高血壓治療對麻醉誘導(dǎo)血流動力學(xué)的影響第二十六頁,共51頁。230第二十七頁,共51頁。15927第二十八頁,共51頁。1.布爾邏輯(luójí)檢索布爾邏輯由英國(yīnɡɡuó)數(shù)學(xué)家喬治.布爾提出。在檢索過程中用于表達(dá)詞于詞之間的邏輯關(guān)系的算符就稱為布爾邏輯運算符。分為三種邏輯關(guān)系:邏輯與、邏輯或、邏輯非;分別用AND、OR、NOT表示。第二十九頁,共51頁。邏輯(luójí)與(積)ANDAANDB:檢索(jiǎnsuǒ)詞A和檢索(jiǎnsuǒ)詞B同時出現(xiàn)在一條記錄中例如查有關(guān)“婦女吸煙”的文獻(xiàn)(wénxiàn),檢索式可寫成:Womenandsmoking其作用是縮小檢索范圍,提高查準(zhǔn)率。第三十頁,共51頁。邏輯(luójí)或(和)ORAORB:記錄中出現(xiàn)檢索詞A或檢索詞B或兩詞同時(tóngshí)出現(xiàn)在一條記錄中。
檢索(jiǎnsuǒ)有關(guān)“計算機”的文獻(xiàn)資料,因為“計算機”也稱為“電腦”檢索(jiǎnsuǒ)式:計算機OR電腦其作用是擴大檢索范圍,提高查全率第三十一頁,共51頁。邏輯(luójí)非(差)NOTANOTB:記錄必須(bìxū)包含檢索詞A但不能包含檢索詞B。即在含有A檢索詞的文獻(xiàn)中去除含有B檢索詞的文獻(xiàn)。例如(lìrú)檢索非小鼠的動物模型,檢索式可寫成:動物模型NOT小鼠其作用是縮小檢索范圍,提高查準(zhǔn)率第三十二頁,共51頁。運算規(guī)則當(dāng)編制(biānzhì)比較復(fù)雜的檢索式時,通常有兩個或多個運算符,此時,布爾邏輯運算符的運算順序是:not>and>or()改變運算順序第三十三頁,共51頁。
檢索有關(guān)“艾滋病疫苗”的文獻(xiàn)(wénxiàn)艾滋病or愛滋病or獲得性免疫缺陷綜合癥orAIDSand疫苗(艾滋病or愛滋病or獲得性免疫缺陷綜合癥orAIDS)and疫苗√第三十四頁,共51頁。邏輯(luójí)“與”第三十五頁,共51頁。2.截詞檢索:概念:是把檢索詞從某處截斷(jiéduàn),用特定的符號代替被截去的一個或多個字符。截詞符(通配符):有*?#$:作用:擴大檢索范圍應(yīng)用:西文數(shù)據(jù)庫較常用第三十六頁,共51頁。截詞符(通配符)*代表0-n個字符,多用于詞尾(cíwěi),也可用于詞中,但不能用于詞首?代表0-1個字符,多用于詞中,也可用于詞尾(cíwěi),但不能用于詞首。第三十七頁,共51頁。無限(wúxiàn)截斷:medic*-medicine-medicale*ology-ecology-embryology-etiology-epidemiology有限截斷:pain?-pains-paintcol??r-color-colourm?n——man、men葉?平——葉京平、葉選平第三十八頁,共51頁。應(yīng)用(yìngyòng)截詞時注意:1.不能截詞過短car*——cars、care、carry、cardiac、cardial、cardiant、cardia2.要在西文狀態(tài)(zhuàngtài)時輸入第三十九頁,共51頁。3.限定檢索(jiǎnsuǒ)(1)限定字段檢索(jiǎnsuǒ)概念:限定檢索(jiǎnsuǒ)詞在數(shù)據(jù)庫記錄中一個或幾個字段范圍內(nèi)查找的一種檢索(jiǎnsuǒ)方法。(2)限定條件檢索(jiǎnsuǒ)發(fā)表時間、研究對象年齡、語種、文獻(xiàn)類型等目的:縮小檢索(jiǎnsuǒ)范圍,提高查準(zhǔn)率。第四十頁,共51頁。2000;21:643–646.高血壓的治療(zhìliáo)檢索(jiǎnsuǒ)有關(guān)“計算機”的文獻(xiàn)資料,因為“計算機”也稱為“電腦”邏輯(luójí)非(差)數(shù)據(jù)庫中的一部分記錄(jìlù)的集合(子集subset)car*——cars、care、carry、cardiac、cardial、cardiant、cardia截詞符(通配符):有*?#$:題錄(參考文獻(xiàn)常用字段)第四十五頁,共51頁。m?n——man、men目的:縮小檢索(jiǎnsuǒ)范圍,提高查準(zhǔn)率。數(shù)據(jù)庫的類型(lèixíng)計算機檢索(jiǎnsuǒ)技術(shù)第三十三頁,共51頁。特殊類型高血壓的藥物治療AORB:記錄中出現(xiàn)檢索詞A或檢索詞B或兩詞同時(tóngshí)出現(xiàn)在一條記錄中。字段限定符有:CBM:in,=癌癥(áizhènɡ)inTIMEDLINE:in,=CancerinTIOVID:.PubMed:[]Cancer[TI](1)限定(xiàndìng)字段檢索第四十一頁,共51頁。模糊(móhu):張平inAU可檢出“張平”、“張平彩”“沈張平、宋張平”等作者精確:AU=張平只檢出“張平”
模糊:癌癥inTA檢索(jiǎnsuǒ)出的期刊有:《癌癥》《中國癌癥雜志》《實用癌癥雜志》精確:TA=癌癥只檢出《癌癥》
有些字段有模糊和精確檢索(jiǎnsuǒ):作者和刊名字段第四十二頁,共51頁。精確、模糊(móhu)匹配第四十三頁,共51頁。(2)限定條件(tiáojiàn)檢索第四十四頁,共51頁。4.位置(wèizhi)檢索(P24)位置(wèizhi)運算符:NearWithFieldSubfield第四十五頁,共51頁。5.加權(quán)檢索(jiǎnsuǒ)加權(quán)檢索是一種定量檢索技術(shù),它能判定檢索詞或字符串在滿足檢索條件后對文獻(xiàn)(wénxiàn)重要程度運用加權(quán)檢索可以命中核心概念文獻(xiàn)(wénxiàn)縮小檢索范圍提高檢準(zhǔn)率第四十六頁,共51頁。6.二次檢索(jiǎnsuǒ)也稱“在結(jié)果中檢索”,是指在最后一個檢索式檢索結(jié)果的范圍內(nèi)進(jìn)行進(jìn)一步查詢當(dāng)查詢到的文獻(xiàn)過多時,利用二次檢索,可以縮小檢索范圍,提高(tígāo)查準(zhǔn)率二次檢索即是新檢索提問標(biāo)識和最后一次檢索結(jié)果的提問標(biāo)識進(jìn)行了邏輯與(and)的組合第四十七頁,共51頁。小結(jié)擴大檢索范圍(fànwéi)邏輯或組合(OR)截詞檢索總結(jié)(zǒngjié)縮小(suōxiǎo)檢索范圍邏輯與組合(AND)邏輯非組合(NOT)限定檢索位置檢索加權(quán)檢索二次檢索第四十八頁,共51頁。思考題計算機檢索的特點(或缺點)是什么?如何解決這一問題?了解MEDLARS和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 營銷與管理考試題及答案
- 電廠倉儲管理試題及答案
- 大一大物考試試題及答案
- 2026黑龍江省社會主義學(xué)院招聘專職教師2人備考題庫附答案
- 中共攀枝花市委社會工作部2025年社會化選聘新興領(lǐng)域黨建工作專員(20人)參考題庫附答案
- 興業(yè)銀行2026春季校園招聘參考題庫必考題
- 北京市房山區(qū)衛(wèi)生健康委員會所屬事業(yè)單位面向應(yīng)屆畢業(yè)生(含社會人員)招聘110人考試備考題庫附答案
- 宜賓學(xué)院2025年公開選調(diào)工作人員(2人)備考題庫附答案
- 廣發(fā)證券2026校園招聘備考題庫附答案
- 新疆分院招聘廣東電信規(guī)劃設(shè)計院2026屆校招開啟(12人)考試備考題庫必考題
- 中東地區(qū)禮儀規(guī)范
- 病蟲害防治操作規(guī)程編制
- 豆制品企業(yè)生產(chǎn)過程節(jié)能降耗方案
- 臨床醫(yī)學(xué)三基三嚴(yán)培訓(xùn)
- 北師版一年級上冊數(shù)學(xué)全冊教案教學(xué)設(shè)計含教學(xué)反思
- 危化品安全培訓(xùn)
- 云南少數(shù)民族介紹
- A公司新員工入職培訓(xùn)問題及對策研究
- 鑄件清理工上崗證考試題庫及答案
- 柴油單軌吊培訓(xùn)課件
- GB/T 32223-2025建筑門窗五金件通用要求
評論
0/150
提交評論