版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第一節(jié) 信息檢索及其類型 第二節(jié) 信息檢索語言、途徑 第三節(jié) 信息檢索技術(shù) 第四節(jié) 檢索工具,第二章 信息檢索基礎(chǔ)知識,第一節(jié) 信息檢索及其類型,一、信息檢索的概念 二、信息檢索的類型 三、信息檢索的意義,一、信息檢索 信息檢索:是指將信息 (主要指文獻信息)按一定 的方式組織和存儲起來,并 根據(jù)用戶的需要找出相關(guān)信 息的過程。,信息檢索,存儲,檢索,存儲:是對信息進行著錄、 標引、整序,編制檢索工 具和建立檢索系統(tǒng)的過程。,檢索:是指面向信息需求 而進行高度選擇性的查找 過程。,(信息機構(gòu)),(用戶),信息檢索簡圖,系統(tǒng) 檢索 語言,二、信息檢索的類型,(一)按檢索內(nèi)容劃分,2、數(shù)值檢索 是
2、以特定的數(shù)值為檢索內(nèi)容的信息檢索,要求從檢索系統(tǒng)存儲的大量原始調(diào)查數(shù)據(jù)和其它統(tǒng)計數(shù)據(jù)中查出所需的數(shù)字資料。如電話號碼、銀行賬號、某一統(tǒng)計數(shù)據(jù)、某一數(shù)學公式、某一材料的成分、性能、某種元件的型號、參數(shù)等。例如檢索“2008年中國國民生產(chǎn)總值是多少?” ( 30.067萬億),1、書目檢索 是以文獻線索為檢索內(nèi)容的信息檢索。主要檢索圖書、 期刊論文,比如圖書館目錄檢索系統(tǒng)。,3、事實檢索 是以具體事項為檢索內(nèi)容的信息檢索,要求從檢索系統(tǒng)存儲的各種原始信息資源中查出專門的事實材料。如查找名詞術(shù)語的解釋,了解某人或某機構(gòu)的簡況,或考證某一事件發(fā)生的前因后果等。例如查找“2005年世界軍費支出最高的國家
3、”。,4、全文檢索 即檢索系統(tǒng)存儲的是整篇文章或整本圖書,快捷查找文檔中的任何文字內(nèi)容。 5、圖像檢索 即以圖形、圖像或圖文信息為檢索內(nèi)容的信息檢索。 6、多媒體檢索 是以文字、圖像、聲音等多媒體信息為檢索內(nèi)容的信息檢索。,(二)按是否使用檢索工具劃分 1、直接檢索 就是指利用一次文獻進行檢索,這是以前比較常用的一種查找方法。所花時間多和精力大,檢出文獻少。 2、間接檢索 就是指利用各種檢索工具獲得文獻線索,再根據(jù)線索去查找原始文獻線索的方法。,(三)按信息檢索手段劃分 1、傳統(tǒng)信息檢索 就是手工信息檢索,是利用各種印刷型檢索工具來查找文獻的一種方法。 2、現(xiàn)代信息檢索 現(xiàn)代信息檢索即計算機信
4、息檢索,是指利用計算機和網(wǎng)絡(luò)來處理和查找文獻信息的檢索方式。,(四)按用戶使用信息的目的不同劃分,1、撰寫論文的信息檢索 2、學科建設(shè)與科學研究的信息檢索 3、生產(chǎn)開發(fā)的信息檢索 4、回答或解決單一問題的信息檢索 5、對已知文獻的查找,1、信息檢索是現(xiàn)代人才的基本生存技能 2、信息檢索是現(xiàn)代人才信息素質(zhì)的重要方面 3、信息檢索是科學交流的重要途徑 4、信息檢索是開發(fā)信息資源的工具 5、信息檢索是管理決策的基礎(chǔ) 6、信息檢索是繼承和借鑒前人成果,避免重 復研究的必由之路 7、信息檢索是治學之道,三、信息檢索的意義,第二節(jié) 信息檢索語言、途徑,一、檢索語言的含義及作用 二、檢索語言的類型 三、檢索
5、途徑,一、檢索語言的含義及作用,檢索語言:用于描述信息系統(tǒng)中信息的內(nèi)容特征及外部特征和表達用戶信息提問的一種專門語言。它要求文獻的標引者和檢索者共同遵守。按其使用的場合不同,檢索語言常使用不同的名稱,在存儲的過程中用來標引文獻,稱為標引語言,用以編制索引就稱為索引語言,用來檢索文獻則稱為檢索語言。是根據(jù)檢索需要而創(chuàng)造的一種人工語言。,作用:1、保證不同標引人員表征文獻信息的一致性。 2、使內(nèi)容相同及相關(guān)的文獻集中化。 3、保證檢索提問與文獻信息標引的一致性。 4、保證檢索者按不同需求檢索文獻信息時, 都能獲得最高的查全率和查準率。,二、檢索語言的類型,檢索語言的類型,表述文獻外表 特征的語言,
6、表述文獻內(nèi)容 特征的語言,題名 責任者 機構(gòu) 號碼,分類法,主題法,單元詞語言 標題詞語言 敘詞語言 關(guān)鍵詞語言 純自然語言,分類語言 按知識門類的邏輯次序?qū)⑿畔⑾到y(tǒng)地組織和劃分的語言,具體體現(xiàn)為用分類號和類名來表達信息的主題概念。如U2 鐵路工程 *中國圖書館圖書分類法(5部類,22大類) *美國國會圖書館分類法 * 杜威十進位分類法 * IPC國際專利分類法,中圖法大類表,中圖法體系細分如下所示:,T工業(yè)技術(shù) TP 自動化技術(shù)、計算技術(shù) 3 計算技術(shù)、計算機 31 計算機軟件 316 操作系統(tǒng) .1 分時操作系統(tǒng) .2 實時操作系統(tǒng) .7 Windows操作系統(tǒng) 39 計算機的應(yīng)用 391
7、 信息處理(信息加工) 391.7 機器輔助技術(shù) 391.72 CAD 391.73 CAM ,T 工業(yè)技術(shù) TB 一般工業(yè)技術(shù) TB1 工程基礎(chǔ)科學 TB11 工程數(shù)學 TB12 工程力學 TB2 工程設(shè)計與測繪 TB21 工程設(shè)計 TB22 工程測量 TB23 工程制圖 TB3 工程材料學 U 交通運輸 U2 鐵路運輸 U21 鐵路線路工程 U4 公路運輸 U41 道路工程 U416 路基、路面工程 U44 橋涵工程 U45 隧道工程 ,主題語言 是直接以代表信息內(nèi)容特征和科學概念的概念詞作為檢索標識,并按字順組織起來的一種檢索語言,如”鐵路”、“鐵路軌道”。主題語言分為規(guī)范主題語言與非規(guī)
8、范主題語言。 規(guī)范主題語言:規(guī)范主題語言是以自然語言為基礎(chǔ),經(jīng)過標準化、規(guī)范化處理的詞語,具有概念性、規(guī)范性、組配性、語義性和動態(tài)性。規(guī)范主題語言包括單元詞語言、標題詞語言和敘詞語言。 *單元詞語言 是一種最基本的、不能再分的單位詞語,亦稱元詞,它從文獻內(nèi)容中抽出,再經(jīng)規(guī)范,能表達一個獨立的概念。比如“天氣雷達”不是單元詞,只有“天氣”和“雷達”才是單元詞,在英語中,單元詞經(jīng)常是一個單詞。如WPI-規(guī)范化主題詞表 *標題詞語言 是從文獻的題目和內(nèi)容中抽出來,經(jīng)過規(guī)范化處理的主題語言。美國工程信息公司出版的工程標題詞表(簡稱SHE)是典型的標題詞語言,但該公司1993年以后改用工程索引敘詞表(E
9、i Thesaurns)。,* 敘詞語言 是以表達文獻主題內(nèi)容的概念單元為基礎(chǔ),經(jīng)過規(guī)范化處理,可以進行邏輯組配的一種主語語言。如漢語主題詞表、INSPEC敘詞表(科學文摘)、工程索引敘詞表等。 非規(guī)范主題語言:它是相對于規(guī)范主題語言而言的,以自然語言的語詞作檢索標識,其所用詞匯未經(jīng)過規(guī)范化處理。非規(guī)范主題語言包括關(guān)鍵詞語言和純自然語言。 關(guān)鍵詞語言 直接從文獻信息的標題、摘要或內(nèi)容本身抽取出來的用于揭示信息主題內(nèi)容的自由詞。 純自然語言 指完全使用自然語言,即對一條完整的信息中任何詞匯都可以進行檢索。它采用全文匹配法檢索,主要運用于計算機全文數(shù)據(jù)庫和網(wǎng)絡(luò)信息檢索中。使用純自然語言中檢索中最大
10、的問題是誤檢率極高。,關(guān)鍵詞語言的提煉,1、反映信息概念的準確性(作為檢索詞應(yīng)當科學,表達的意思要準確,普遍使用,同時應(yīng)該簡明、精練,盡可能簡短明了,易輸易檢,詞匯不宜過長) 古代語言演變=古代語言*語言演變 =古代語言*演變 2、反映信息內(nèi)容的全面性 協(xié)同設(shè)計+協(xié)同工作 3、注意檢索詞的多樣性 軌道 鐵軌 過程和規(guī)律 微型計算機 微機 電腦 “加熱設(shè)備”可抽象化為“溫度控制設(shè)備” “溫度計”即“溫度測量儀器” 4、少用或不用副詞、助詞、指示代詞等不反映檢索內(nèi)容的詞或詞組。 如a,the,is,http,com 5、刪除具有包含關(guān)系的其中一個 教學用的信息檢索課多媒體課件信息檢索*多媒體*課件
11、 6、補充 A、補充還原詞組:WTO世貿(mào)組織世界貿(mào)易組織 B、補充同義詞或相關(guān)詞: 計算機病毒(計算機+電腦)*病毒 C、增加限定詞(解決一詞多義現(xiàn)象): 杜鵑杜鵑(動物)、杜鵑(植物) 7、注意輸入錯別字、濫用多義詞。如JAVA,既可只太平洋上的一個島,也可是一種著名的咖啡,還是一種計算機語言。 8、切忌想要什么就輸什么。 另外:首次利用關(guān)鍵詞檢索時,不要把條件限制得過于嚴格,最 好是檢索出一些結(jié)果再使用其他限定條件,進行二次檢索。,三、檢索途徑,檢索途徑又稱檢索入口,指信息用戶在檢索時,把所需信息的某種特征標識轉(zhuǎn)換為檢索標識,以此為入口進行檢索,信息檢索途徑及其選擇,內(nèi)容特征檢索途徑 主題
12、途徑 指通過能表達文獻內(nèi)容的主題詞來檢索文獻的一種途徑。是信息檢索的一種主要途徑。 【如何提取檢索詞】: 1、切分 切分就是以詞為單位劃分句子和詞組。 例:有關(guān)|鐵路|軌道|不平順|方面的論文 要點:A.詞是語義切分的最小單元,也是檢索的最小單元。切分必須徹底,必須“到詞為止”。如:“信息檢索”可切分為:“信息|檢索”。 B.切分也要適度,不能因切分而改變語義。如:不能將“操作系統(tǒng)”切分為“操作|系統(tǒng)”,2、刪除 將課題轉(zhuǎn)換成關(guān)鍵詞的集合 A.刪除不具有檢索意義的虛詞(a,the,is等)和關(guān)鍵詞(因使用太寬泛而不具有檢索意義,如:http,com等) B.刪除過分寬泛和過份具體的限定詞 無損
13、檢測技術(shù)在材料性能評價中的應(yīng)用無損檢測 (太寬泛) C.刪除具有包含關(guān)系的其中一個 教學用的信息檢索課多媒體課件信息檢索*多媒體*課件 3、替換 用更本質(zhì)的概念替換表達欠佳的概念 西部地區(qū)社會發(fā)展狀況(社會發(fā)展狀況=文化教育+醫(yī)療衛(wèi)生+工業(yè)水平+農(nóng)業(yè)水平+) 水果營養(yǎng)(水果fruit=梨pear+橙orange+蘋果apple+),4、補充 A、補充還原詞組:WTO世貿(mào)組織世界貿(mào)易組織 B、補充同義詞或相關(guān)詞: 計算機病毒(計算機+電腦)*病毒 C、增加限定詞(解決一詞多義現(xiàn)象): 杜鵑杜鵑(動物)、杜鵑(植物) 【獲得主題詞的技巧】:在圖書的版權(quán)頁可以找到該書的主題詞和分類號,或者通過圖書館
14、的館藏數(shù)據(jù)來查找主題詞。,分類途徑 指根據(jù)文獻所屬的類別,利用特定的分類號來檢索文獻的途徑。 優(yōu)點:能夠從學科或?qū)I(yè)角度廣泛地獲得較系統(tǒng)的文獻,能夠達到較高的查全率。當所需要的信息范圍比較寬泛或涉及內(nèi)容復雜,僅用幾個詞語已無法涵蓋檢索需求時多采用分類途徑。 例:檢索“鐵路線路構(gòu)造”的信息,該用何種途徑? 分析: A、如果明確知道“鐵路線路構(gòu)造”有哪些,而且知道具體名稱,就用主題途徑;(如路基、軌道、軌枕、鋼軌、鋼軌聯(lián)接及扣件、道岔、道床、道口及線路附屬設(shè)備等 ) B、如果課題所指內(nèi)容不是特定的幾種,而是多種,也不知道具體的名稱,就用分類途徑。(U213 鐵路線路構(gòu)造 ),著者途徑 即根據(jù)已知文
15、獻著者來查找文獻的途徑。 【排列規(guī)則】 1、統(tǒng)一采用姓+名的順序。英文的人名需實行倒置! 如:Arrow BSmith (阿羅B史密斯) Smith,Arrow.B. 2、復姓作者,將復姓作整體看待 例: Margaret Martin-SmithMartin-Smith,Margaret 【中文翻譯成英文的處理】 3、音譯:直接用漢語拼音。 西南交通大學Xi nan(southwest) jiaotong university 4、意譯:通常有多種寫法,檢索式必須列舉各種寫法,才能保證查全率。 例:原西南師范大學在歐洲專利數(shù)據(jù)庫中就有三種寫法:Southwest China Normal U
16、niwersity/Southwest University/Xinan Teachers,University 【拼寫形式】 如:張建國Zhang JG或Zhang JianGuo(通常),Zhang J(有時),Jianguo Z(偶爾),其他途徑 題名途徑 即直接利用圖書的書名、期刊的刊名、標準文獻的標準名來查找所需停息的方法途徑。 機構(gòu)名稱途徑 主要包括作者所在的單位,以及圖書期刊的出版發(fā)行單位等。 代碼途徑 如專利號、標準書號(ISBN)、標準刊號(ISSN)、館藏號等。在已知文獻特定代碼的前提下,利用代碼途徑檢索文獻是最為快捷的方法之一。 引文途徑 從被引論文去檢索引用論文的一種途
17、徑。,第三節(jié) 檢索技術(shù),一、概念檢索 二、布爾邏輯運算符組配檢索 三、截詞檢索 四、字段限制檢索 五、位置運算符 六、檢索技巧和方法,一、概念檢索 檢索標識是具體的檢索詞或詞組,每個檢索詞表達一個概念,具體檢索時,將檢索詞與數(shù)據(jù)庫中的文獻特征標識進行類比,兩者相同,則該記錄為命中文獻。如:“鐵路”、“橋涵”,二、 布爾邏輯算符組配檢索 布爾邏輯組配運算是采用布爾代數(shù)中的邏輯“與”邏輯“或”、邏輯“非”等算符,將檢索提問式轉(zhuǎn)換成邏輯表達式,限定檢索詞在記錄中必須存在的條件或不能出現(xiàn)的條件。凡符合布爾邏輯所規(guī)定的條件的文獻,既為命中文獻。,布爾邏輯運算符 ,1、邏輯“或” 2、邏輯“與” 3、邏輯
18、“非”,1、邏輯“或”(和) ,用符號“or”或“+”表示,其邏輯表達式為: A or B 或 A + B 其意義為檢索記錄中凡含有檢索詞A或檢索詞B, 或同時含有檢索詞A和B的,均為命中文獻。 如:鐵路 or 公路,2、邏輯“與” ,用符號“and”或“*”表示,其邏輯表達式為: A*B 或 A and B 其意義為檢索記錄中必須同時含有檢索詞A和B的文獻,才算命中文獻。如:鐵路 and 軌道,3、邏輯“非” ,用符號“not”或“-”,其邏輯表達式為: A not B 或 A-B 其意義為:檢索記錄中含有檢索詞A,但不能 含有檢索詞B的文獻,才算命中文獻。 如:鐵路 and 橋涵 not 公路,三、截詞檢索,截詞檢索主要是利用檢索詞的詞干或不完整的詞形進行檢索。 不同的系統(tǒng)截詞符也不同:一般用“?” “ *” 表示. 1、后方截詞:用于前方一致的派生詞檢索。 如:信息? 則表示在數(shù)據(jù)庫中含有信息、信息技術(shù)、信息檢索等方面的文獻記錄均為命中文獻。 2、前方截詞:用于后方一致的派生詞檢索。 如:?經(jīng)濟 則數(shù)據(jù)庫中含有經(jīng)濟、工業(yè)經(jīng)濟、農(nóng)業(yè)經(jīng)濟等
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年天津市和平區(qū)教育系統(tǒng)事業(yè)單位進駐東北師范大學公開招聘教師70人備考題庫完整答案詳解
- 2026年1月招聘森林消防護林員備考題庫及參考答案詳解1套
- 2026年懷化市教育局直屬學校公開招聘教職工備考題庫及一套答案詳解
- 2025年紹興市上虞區(qū)中醫(yī)醫(yī)院醫(yī)共體公開招聘編外人員備考題庫(三)含答案詳解
- 2026年東北林業(yè)大學計算機與控制工程學院實驗技術(shù)派遣人才公開招聘備考題庫及完整答案詳解一套
- 2026年義烏市社會治理中心、義烏市訴調(diào)銜接人民調(diào)解委員會關(guān)于人民調(diào)解員招聘備考題庫及答案詳解一套
- 2026年成都市溫江區(qū)涌泉街道社區(qū)衛(wèi)生服務(wù)中心編外人員招聘備考題庫及參考答案詳解一套
- 2026年南寧市第四十三中學關(guān)于公開招聘高中英語頂崗教師的備考題庫及一套完整答案詳解
- 2026年佛山市高明區(qū)富灣湖實驗中學公開招聘臨聘教師備考題庫及一套完整答案詳解
- 2026年南方醫(yī)科大學珠江醫(yī)院三水醫(yī)院公開招聘4名高層次人才備考題庫有答案詳解
- 部編版九年級語文上冊期末復習課件
- 歷年復試專業(yè)課筆試真題-華電09電力
- 藥物臨床試驗與GCP課件
- 精品工程實施方案內(nèi)容
- 一線作業(yè)人員績效考核管理規(guī)定
- 骨關(guān)節(jié)疾病講解課件
- 第1課時 利用邊判定平行四邊形
- SJG 85-2020 邊坡工程技術(shù)標準-高清現(xiàn)行
- 附錄 表E.10 防火卷簾系統(tǒng)調(diào)試、檢測、驗收記錄(續(xù)表16)
- DL∕T 5610-2021 輸電網(wǎng)規(guī)劃設(shè)計規(guī)程
- 第二章世界貿(mào)易組織的基本架構(gòu)
評論
0/150
提交評論