文獻(xiàn)檢索第二章信息檢索基礎(chǔ).ppt_第1頁(yè)
文獻(xiàn)檢索第二章信息檢索基礎(chǔ).ppt_第2頁(yè)
文獻(xiàn)檢索第二章信息檢索基礎(chǔ).ppt_第3頁(yè)
文獻(xiàn)檢索第二章信息檢索基礎(chǔ).ppt_第4頁(yè)
文獻(xiàn)檢索第二章信息檢索基礎(chǔ).ppt_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一節(jié) 信息檢索及其類型 第二節(jié) 信息檢索語(yǔ)言 第三節(jié) 信息檢索技術(shù) 第四節(jié) 檢索工具,第二章 信息檢索基礎(chǔ)知識(shí),第一節(jié) 信息檢索及其類型,一、信息檢索的概念 二、信息檢索的類型 三、信息檢索的意義,一、信息檢索 信息檢索:是指將信息 (主要指文獻(xiàn)信息)按一定 的方式組織和存儲(chǔ)起來,并 根據(jù)用戶的需要找出相關(guān)信 息的過程。,信息檢索,存儲(chǔ),檢索,存儲(chǔ):是對(duì)信息進(jìn)行著錄、 標(biāo)引、整序,編制檢索工 具和建立檢索系統(tǒng)的過程。,檢索:是指面向信息需求 而進(jìn)行高度選擇性的查找 過程。,二、信息檢索的類型,(一)按檢索內(nèi)容劃分,2、數(shù)據(jù)檢索 是以數(shù)據(jù)為檢索內(nèi)容的信息檢索,要求從檢索系統(tǒng)存儲(chǔ)的大量原始調(diào)查數(shù)

2、據(jù)和其它統(tǒng)計(jì)數(shù)據(jù)中查出所需的數(shù)字資料。,1、書目檢索 是以文獻(xiàn)線索為檢索內(nèi)容的信息檢索。,3、事實(shí)檢索 是以具體事項(xiàng)為檢索內(nèi)容的信息檢索,要求從檢索系統(tǒng)存儲(chǔ)的各種原始信息資源中查出專門的事實(shí)材料。,4、全文檢索 即檢索系統(tǒng)存儲(chǔ)的是整篇文章或整本圖書。 5、圖像檢索 即以圖形、圖像或圖文信息為檢索內(nèi)容的信息檢索。 6、多媒體檢索 是以文字、圖像、聲音等多媒體信息為檢索內(nèi)容的信息檢索。,(二)按是否使用檢索工具劃分 1、直接檢索 就是指利用一次文獻(xiàn)進(jìn)行檢索,這是以前比較常用的一種查找方法。所花時(shí)間多和精力大,檢出文獻(xiàn)少。 2、間接檢索 就是指利用各種檢索工具獲得文獻(xiàn)線索,再根據(jù)線索去查找原始文獻(xiàn)的

3、方法。,(三)按信息檢索手段劃分 1、傳統(tǒng)信息檢索 就是手工信息檢索,是利用各種印刷型檢索工具來查找文獻(xiàn)的一種方法。 2、現(xiàn)代信息檢索 現(xiàn)代信息檢索即計(jì)算機(jī)信息檢索,是指利用計(jì)算機(jī)和網(wǎng)絡(luò)來處理和查找文獻(xiàn)信息的檢索方式。,1、信息檢索是現(xiàn)代人才的基本生存技能 2、信息檢索是現(xiàn)代人才信息素質(zhì)的重要方面 3、信息檢索是科學(xué)交流的重要途徑 4、信息檢索是開發(fā)信息資源的工具 5、信息檢索是管理決策的基礎(chǔ) 6、信息檢索是繼承和借鑒前人成果,避免重 復(fù)研究的必由之路 7、信息檢索是治學(xué)之道,三、信息檢索的意義,第二節(jié) 信息檢索語(yǔ)言,一、檢索語(yǔ)言的含義及作用 二、檢索語(yǔ)言的類型,一、檢索語(yǔ)言的含義及作用,檢索

4、語(yǔ)言:是根據(jù)檢索需要而創(chuàng)造的一種人工語(yǔ)言。,作用:1、保證不同標(biāo)引人員表征文獻(xiàn)信息的一致性。 2、使內(nèi)容相同及相關(guān)的文獻(xiàn)集中化。 3、保證檢索提問與文獻(xiàn)信息標(biāo)引的一致性。 4、保證檢索者按不同需求檢索文獻(xiàn)信息時(shí), 都能獲得最高的查全率和查準(zhǔn)率。,二、檢索語(yǔ)言的類型,檢索語(yǔ)言的類型,表述文獻(xiàn)外表 特征的語(yǔ)言,表述文獻(xiàn)內(nèi)容 特征的語(yǔ)言,題名 責(zé)任者 號(hào)碼 引文,分類法,主題法,標(biāo)題詞法 敘詞法 關(guān)鍵詞法,分類語(yǔ)言 按知識(shí)門類的邏輯次序?qū)⑿畔⑾到y(tǒng)地組織和劃分的語(yǔ)言,具體體現(xiàn)為用分類號(hào)和類名來表達(dá)信息的主題概念。 中國(guó)圖書館圖書分類法(X 環(huán)境科學(xué)、安全科學(xué)) 美國(guó)國(guó)會(huì)圖書館分類法 杜威十進(jìn)位分類法

5、IPC國(guó)際專利分類法,標(biāo)題詞語(yǔ)言 是從文獻(xiàn)的題目和內(nèi)容中抽出來,經(jīng)過規(guī)范 化處理的主題語(yǔ)言。 關(guān)鍵詞語(yǔ)言 直接從文獻(xiàn)信息的標(biāo)題、摘要或內(nèi)容本身抽 取出來的用于揭示信息主題內(nèi)容的自由詞。,敘詞語(yǔ)言 是以表達(dá)文獻(xiàn)主題內(nèi)容的概念單元為基礎(chǔ), 經(jīng)過規(guī)范化處理,可以進(jìn)行邏輯組配的一種主語(yǔ) 語(yǔ)言。,第三節(jié) 檢索技術(shù),一、概念檢索 二、布爾邏輯運(yùn)算符組配檢索 三、截詞檢索 四、字段限制檢索 五、位置運(yùn)算符 六、檢索技巧和方法,一、概念檢索 檢索標(biāo)識(shí)是具體的檢索詞或詞組,每個(gè)檢索詞表達(dá)一個(gè)概念,具體檢索時(shí),將檢索詞與數(shù)據(jù)庫(kù)中的文獻(xiàn)特征標(biāo)識(shí)進(jìn)行類比,兩者相同,則該記錄為命中文獻(xiàn)。,二、 布爾邏輯算符組配檢索 布

6、爾邏輯組配運(yùn)算是采用布爾代數(shù)中的邏輯“與”邏輯“或”、邏輯“非”等算符,將檢索提問式轉(zhuǎn)換成邏輯表達(dá)式,限定檢索詞在記錄中必須存在的條件或不能出現(xiàn)的條件。凡符合布爾邏輯所規(guī)定的條件的文獻(xiàn),既為命中文獻(xiàn)。,布爾邏輯運(yùn)算符 ,1、邏輯“或” 2、邏輯“與” 3、邏輯“非”,1、邏輯“或”(和) ,用符號(hào)“or”或“+”表示,其邏輯表達(dá)式為: A or B 或 A+B 其意義為檢索記錄中凡含有檢索詞A或檢索詞B, 或同時(shí)含有檢索詞A和B的,均為命中文獻(xiàn)。,2、邏輯“與” ,用符號(hào)“and”或“*”表示,其邏輯表達(dá)式為: A * B 或 A and B 其意義為檢索記錄中必須同時(shí)含有檢索詞A和B的文獻(xiàn),

7、才算命中文獻(xiàn)。,3、邏輯“非” ,用符號(hào)“not”或“-”,其邏輯表達(dá)式為: A not B 或 A-B 其意義為:檢索記錄中含有檢索詞A,但不能 含有檢索詞B的文獻(xiàn),才算命中文獻(xiàn)。,布爾邏輯運(yùn)算符 ,在三種邏輯運(yùn)算符中,其運(yùn)算優(yōu)選級(jí)順序?yàn)檫壿嫛胺恰保╪ot)、邏輯“與”(and)、邏輯“或”(or),但可以用括號(hào)改變它們之間的運(yùn)算順序,則先執(zhí)行括號(hào)內(nèi)的運(yùn)算。 如:(A or C) and B,三、截詞檢索,截詞檢索主要是利用檢索詞的詞干或不完整的詞形進(jìn)行檢索。 截詞符一般用“?”、“ *” 等表示 1、后方截詞:用于前方一致的派生詞檢索。 如:信息? 則表示在數(shù)據(jù)庫(kù)中含有信息、信息技術(shù)、信息

8、檢索等方面的文獻(xiàn)記錄均為命中文獻(xiàn)。 2、前方截詞:用于后方一致的派生詞檢索。 如:?經(jīng)濟(jì) 則數(shù)據(jù)庫(kù)中含有經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)、農(nóng)業(yè)經(jīng)濟(jì)等方面的文獻(xiàn)均為命中文獻(xiàn)。,3、有限截詞 在檢索詞后面加上一個(gè)或一個(gè)以上(最多4 個(gè))的“?”,空一格,再加一個(gè)“?”。如: Comput? ? 可檢索出: Computer,Computers,Computing,注意:截詞檢索在不同的計(jì)算機(jī)檢索系統(tǒng)中規(guī) 定不同,請(qǐng)使用時(shí)注意。,四、字段限制檢索,為了縮小檢索范圍,可利用字段代碼來限制 檢索詞出現(xiàn)的字段,以提高檢索速度和命中率。 如:rice in ti(表示只在題目字段中查找文獻(xiàn)) rice in ab(只在文摘中

9、查找) au = Smith,J.C (查作者為Smith,J.C 的 文獻(xiàn)) py = 1998(只查1998年的文獻(xiàn)) la =Chinese (只查語(yǔ)種為中文的文獻(xiàn)),五、位置運(yùn)算符,With:設(shè)定需檢索的兩個(gè)詞或詞組在同一字段中,但不限制位置的先后。 Near:設(shè)定需檢索的兩個(gè)詞或詞組在同一語(yǔ)句中,相對(duì)于“with”更接近。此外,在使用“near”運(yùn)算符時(shí),還可以在該運(yùn)算符后添加一個(gè)數(shù)字以便進(jìn)一步限定兩個(gè)詞之間的鄰近程度,如“near3” 設(shè)定需檢索的兩個(gè)詞或詞組在同一句子中且相隔不超過3個(gè)單詞。,1、檢索策略 計(jì)算機(jī)檢索,實(shí)際上是由計(jì)算機(jī)將用戶輸入的檢索策略與系統(tǒng)中存儲(chǔ)的文獻(xiàn)特征標(biāo)識(shí)

10、及邏輯組配關(guān)系進(jìn)行類比、匹配,并把完全匹配的文獻(xiàn)輸出的過程。 檢索策略是科學(xué)地運(yùn)用檢索詞和邏輯運(yùn)算符正確地構(gòu)造邏輯提問式的原則和方法。其核心內(nèi)容在于檢索策略的構(gòu)造與檢索的步驟。,六、檢索的技巧和方法,A、弄清提問要求,并確定要查找的文獻(xiàn)學(xué)科范圍、類型、文種、時(shí)間等。 B、選擇相關(guān)的數(shù)據(jù)庫(kù)并確定在待檢數(shù)據(jù)庫(kù)中的檢索途徑,以便制定適合所選擇數(shù)據(jù)庫(kù)的檢索策略。 C、對(duì)情報(bào)提問進(jìn)行概念分析 D、擬定檢索邏輯式 E、對(duì)數(shù)據(jù)庫(kù)文檔進(jìn)行查找,檢出相關(guān)文獻(xiàn)并分析檢索結(jié)果。 F、如有必要,對(duì)提問式進(jìn)行反饋、修改,重復(fù)上步,直到用戶滿意為止。,制定檢索策略的步驟:,A、擴(kuò)大檢索范圍,2、檢索技巧和方法,* 概念的

11、擴(kuò)大。 * 范圍的擴(kuò)大。 * 增加同義詞、近義詞、相關(guān)詞和縮略詞。 * 用“or”、”?”、等 * 去掉連字符可擴(kuò)大檢索范圍。 * 換另外的數(shù)據(jù)庫(kù)或是另外的光盤繼續(xù)進(jìn)行檢索。,B、縮小檢索范圍的方法,* 核心概念的限定。 * 核心期刊的限定。 * 語(yǔ)種的限定。 * 用布爾邏輯算符“and”或者“not”組配檢 索詞。 * 使用位置算符“near”和字段算符“in”提 高查準(zhǔn)率。 * 使用“Index”和敘詞表,選擇確切的檢索 詞縮小檢索范圍,分析課題 選擇檢索系統(tǒng)及數(shù)據(jù)庫(kù) 確定檢索詞 構(gòu)建檢索提問式 實(shí)施檢索并調(diào)整檢索策略 輸出檢索結(jié)果,3、信息檢索的一般程序,第四節(jié) 檢索工具,檢索工具:是在

12、不同學(xué)科范圍內(nèi)對(duì) 某階段出版的有關(guān)文獻(xiàn)進(jìn)行收集、整理 或?qū)π挛墨I(xiàn)加以及時(shí)報(bào)道的二次文獻(xiàn)。,一、檢索工具的作用 二、檢索工具的特點(diǎn) 三、檢索工具的類型,一、檢索工具的作用,1、報(bào)道作用 2、存儲(chǔ)作用 3、檢索作用,二、檢索工具的特點(diǎn),1、詳細(xì)而又完整地記錄了文獻(xiàn)的外部特征和內(nèi)部特征。 2、對(duì)所著錄的文獻(xiàn),標(biāo)引了可供檢索的檢索標(biāo)識(shí)。 3、提供必要的檢索手段,配備各種體系的索引。,三、檢索工具的類型,1、目錄,是一批相關(guān)文獻(xiàn)的著錄集合。對(duì)文獻(xiàn)的描述較簡(jiǎn)單,只報(bào)道其外部特征,通常以一個(gè)完整的出版單位或收藏單位為基本著錄對(duì)象。(書/刊名、作者、出版年、卷期號(hào)等)。,2、題錄,是將書籍、期刊等文獻(xiàn)中所刊載

13、的論文題目、作者、出處及學(xué)科主題等分別摘錄出來,并按一定的原則和方法排列起來的一種檢索工具。,3、文摘,是一種著錄文獻(xiàn)題錄和內(nèi)容摘要的檢索工具。,4、搜索引擎,通過網(wǎng)絡(luò)搜索軟件或網(wǎng)站登錄等方式,將互聯(lián)網(wǎng)上大量信息資源組織起來建成數(shù)據(jù)庫(kù)。,數(shù)據(jù)庫(kù)概述,數(shù)據(jù)庫(kù)是計(jì)算機(jī)技術(shù)與信息檢索技術(shù)相結(jié)合的產(chǎn)物,是現(xiàn)代重要的信息資源,也是信息檢索的重要資料來源。,定義:將信息標(biāo)引、著錄后形成的信息記錄,按一定格式錄入計(jì)算機(jī),形成供計(jì)算機(jī)檢索用的數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)是被收集在一起的一組有序的信息單元,每個(gè)信息單元由若干個(gè)獨(dú)立的結(jié)構(gòu)單元組成,數(shù)據(jù)元存儲(chǔ)在字段中,每個(gè)數(shù)據(jù)元描述信息單元的一個(gè)特征(如作者、標(biāo)題、出版年等)

14、。,一個(gè)數(shù)據(jù)庫(kù)可能包含數(shù)千甚至幾十萬(wàn)條記錄,每條記錄又包含若干個(gè)數(shù)據(jù)字段(構(gòu)成記錄的最小信息單元)。,檢索字段,為方便檢索,每一個(gè)字段都有自己特定的標(biāo)識(shí)符(字段名)。 如:TI代表篇名字段,AU代表著者字段,CS代表著者所在單位字段,SO代表文獻(xiàn)出處字段(刊名、卷期、頁(yè)等),LA代表語(yǔ)種字段,PY代表出版年字段, AB代表文摘字段,,注意:不同的數(shù)據(jù)庫(kù),其記錄的字段種類、數(shù)目、名稱、代碼等不盡相同,在檢索時(shí)可根據(jù)數(shù)據(jù)庫(kù)的說明查詢字段的設(shè)置情況和使用方法進(jìn)行操作。,我校圖書館可查詢本專業(yè)信息的中文數(shù)據(jù)庫(kù),超星數(shù)字圖書館; CNKI(含期刊全文、優(yōu)秀博士/碩士論文、工具書、重要會(huì)議論文、重要報(bào)紙全

15、文等7個(gè)子庫(kù)); 萬(wàn)方數(shù)據(jù)(含數(shù)字化期刊全文、科技信息、商務(wù)信息、中國(guó)學(xué)位論文、中國(guó)會(huì)議論文全文等5個(gè)子庫(kù)); 維普資訊(含中文科技期刊、外文科技期刊等4個(gè)子庫(kù));,方正Apabi(含教學(xué)參考書、中國(guó)工具書、中國(guó)報(bào)紙、中國(guó)年鑒4個(gè)全文子庫(kù)); 超星名師講壇視頻資源; 讀秀知識(shí)庫(kù)-讀秀學(xué)術(shù)搜索; 臺(tái)灣科學(xué)期刊數(shù)據(jù)庫(kù)(TEPS),三種主要中文期刊全文數(shù)據(jù)庫(kù)的比較,我校圖書館可查詢本專業(yè)信息的外文數(shù)據(jù)庫(kù),Ei Village 2 - - Engineering Village 2 ; Elsevier - - SDOL( Science Direct Online); ISI - - SCIE( S

16、cience Citation Index Expanded); Springerlink (施普林格); WSNWorld SciNet (世界科技出版公司科技期刊網(wǎng)) ACS Publications(美國(guó)化學(xué)學(xué)會(huì)電子期刊) RSC - Royal Society of Chemistry(英國(guó)皇家化學(xué)學(xué)會(huì)電子期刊),世界三大檢索系統(tǒng),SCI:Science Citation Index 科學(xué)引文索引 EI:Engineering Index 工程索引 ISTP:Index to Scientific &Technical Proceedings 科技會(huì)議錄索引 對(duì)于以上三大檢索工具,有印

17、刷版(print)、光盤版(CD-ROM)、網(wǎng)絡(luò)版(web)和聯(lián)機(jī)版(online)四種利用方式。,SCI 創(chuàng)刊于1961年, 1961-1965年不定期出版;1966年改為季刊,1979年改為雙月刊。 SCI是目前世界上最權(quán)威的多學(xué)科綜合性檢索工具。收錄了世界上40多個(gè)國(guó)家和地區(qū)自然科學(xué)領(lǐng)域的5000多種期刊、會(huì)議錄及論文集。 對(duì)工程技術(shù)及應(yīng)用科學(xué)方面的文獻(xiàn)報(bào)道相對(duì)較少。,EI創(chuàng)刊于1884年,由美國(guó)工程協(xié)會(huì)聯(lián)合會(huì)下設(shè)的工程索引公司編輯出版;1906年起,由美國(guó)工程雜志公司出版;1919年起,由美國(guó)機(jī)械工程師學(xué)會(huì)購(gòu)買所有權(quán)。 EI是世界著名的工程技術(shù)類綜合性檢索刊物,為文摘類索引刊物,報(bào)道美國(guó)工程科學(xué)圖書館收藏的各種期刊、會(huì)議錄、技術(shù)報(bào)告、論文集、政府出版物和圖書等。 及時(shí)報(bào)道尖端科學(xué),但對(duì)各學(xué)科純理論方面的文獻(xiàn)一般不予報(bào)道,也不報(bào)道專利文獻(xiàn)。,ISTP是專門檢索會(huì)議文獻(xiàn)的權(quán)威性檢索工具,每年收錄報(bào)道4000多種會(huì)議錄及其論文20多萬(wàn)篇,約占每年全世界主要會(huì)議論文的75%以上,覆蓋學(xué)科150多個(gè),幾乎囊括了科學(xué)和工程方面的所有領(lǐng)域,是檢索全世界會(huì)議文獻(xiàn)的綜合性檢索工具。 出版類型:印刷版(月刊+年度累積本)、光盤版(季更新) 、網(wǎng)絡(luò)版(檢索平臺(tái) ISI Web of Knowledge) 。,CA 美國(guó)化學(xué)文摘,CA(Chemical Abst

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論