版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第7章e7d195523061f1c01da5a1f0837ac25283df40ff0a16bfd61AE6AB84AD7EB485CA8019BF267F2027DE2BF09650313B56A435BB3664F8B916CA3777391AC088C283181605E184D6D6879568EB73EB808A103F0784C8DFC3E9CDD14B61FDDA6A8A6237D2DFE3BBAEC8979D824A43E015648F6CB3D1F8D3E352A4BDC9925C075CFF312C4A0BE75FDF5C信息檢索技術(shù)計算機與人工智能基礎(chǔ)FundamentalsofcomputersandArtificialIntelligence課前導(dǎo)讀2信息檢索是人們獲取信息的重要方法和手段,本章主要介紹了信息檢索的基本概念、基本原理以及檢索方法,重點介紹搜索引擎的使用和中文學(xué)術(shù)信息資源檢索系統(tǒng)的使用方法。e7d195523061f1c01da5a1f0837ac25283df40ff0a16bfd61AE6AB84AD7EB485CA8019BF267F2027DE2BF09650313B56A435BB3664F8B916CA3777391AC088C283181605E184D6D6879568EB73EB808A103F0784C8DFC3E9CDD14B61FDDA6A8A6237D2DFE3BBAEC8979D824A43E015648F6CB3D1F8D3E352A4BDC9925C075CFF312C4A0BE75FDF5C內(nèi)容導(dǎo)航第7章7.2搜索引擎
7.1
信息檢索基礎(chǔ)7.3
中文學(xué)術(shù)信息資源檢索系統(tǒng)
廣義的信息檢索指將信息按照一定的方式組織和存儲起來,并根據(jù)信息用戶的需求找出相關(guān)信息的過程,包括信息的存儲和檢索兩個過程。
狹義的信息檢索只包含信息搜索這一過程,是指用戶根據(jù)需要采用一定的方法,借助檢索工具,從信息集合中找出所需要信息的查找過程。(1)信息檢索定義7.1.1信息檢索概述
信息檢索的基本原理就是對大量、分散無序的信息進行搜集、加工、組織、存儲,形成各種檢索系統(tǒng),然后用特定的方法將檢索詞與檢索系統(tǒng)中的信息特征進行匹配,最終提取出與檢索系統(tǒng)相符合的信息的過程。(2)信息檢索原理7.1.1信息檢索概述7.1.1信息檢索概述按檢索對象內(nèi)容:文獻檢索(獲取含所需信息的文獻)、數(shù)據(jù)檢索(獲取文獻中的數(shù)據(jù))、事實檢索(獲取文獻中的事實)。按檢索工具和方式:手工檢索、機械檢索、計算機檢索(含網(wǎng)絡(luò)信息檢索,通過搜索引擎或瀏覽獲取信息)。按檢索途徑:直接檢索(直接查詢、瀏覽文獻原文,如翻閱報刊、用數(shù)據(jù)庫)、間接檢索(先查檢索工具獲線索,再索取原文)。(3)信息檢索分類7.1.1信息檢索概述
又稱工具法,是利用檢索工具及檢索系統(tǒng)來查找信息,可分為順檢法和倒檢法。順檢法按時間順序從過去到現(xiàn)在進行檢索,獲取信息全面但耗時長、效率低;倒檢法是按時間順序從近期向遠期檢索,強調(diào)近期資料,效果較好。(1)常規(guī)法7.1.2信息檢索方法追溯法利用文獻末尾參考文獻為線索追蹤查找,不依賴檢索工具,針對性強,但全面性較差。(2)追溯法交替法是常規(guī)法和追溯法結(jié)合,先用檢索工具查找,再利用參考文獻追溯,循環(huán)交替,既保證全面性又提高效率。(3)交替法7.1.2信息檢索方法7.1.3信息檢索技術(shù)(1)布爾邏輯檢索定義:基于布爾邏輯運算,用布爾運算符連接檢索詞形成表達式,限定檢索范圍和條件,是信息檢索中最基本、最常用的技術(shù)。常用布爾運算符:邏輯“與”:用AND或符號“*”表示邏輯“或”:用OR或符號“+”表示邏輯“非”:用NOT或符號“-”表示(2)截詞檢索定義:在檢索詞合適位置用截詞符截斷,以詞的局部進行檢索,包括有限截詞檢索和無限截詞檢索。有限截詞檢索通常用“?”代表0個或1個字符,無限截詞檢索通常用“*”代表多個字符。按照截詞的位置,截詞檢索可分為前截斷、中截斷、后截斷。前截斷:截詞符在字符串開頭,適用于檢索詞有相同詞綴的情況。中截斷:截詞符在字符串中間,適用于檢索詞有單復(fù)數(shù)、英美拼寫差異等情況。后截斷:截詞符在字符串末尾,適用于單復(fù)數(shù)、年代、詞根檢索。7.1.3信息檢索技術(shù)7.1.3信息檢索技術(shù)(3)位置檢索定義:又稱鄰近檢索,通過位置算符規(guī)定檢索詞在結(jié)果中的位置,可提高查準率。常用位置算符:鄰接算符(N或NEAR):表示兩檢索詞相鄰,中間可插入若干詞,順序可顛倒。順序鄰接算符(P或PRE):表示兩檢索詞相鄰,中間可插入若干詞,順序固定。同字段算符(W或WITH):表示兩檢索詞需在同一字段(如標題、摘要)出現(xiàn)。7.1.3信息檢索技術(shù)(4)限制檢索定義:全稱是限制字段檢索,它是一種通過限制算符來限制檢索范圍,達到優(yōu)化檢索結(jié)果、提高檢索效率等目的的信息檢索方法。限制檢索在各種檢索系統(tǒng)中的應(yīng)用都十分廣泛。e7d195523061f1c01da5a1f0837ac25283df40ff0a16bfd61AE6AB84AD7EB485CA8019BF267F2027DE2BF09650313B56A435BB3664F8B916CA3777391AC088C283181605E184D6D6879568EB73EB808A103F0784C8DFC3E9CDD14B61FDDA6A8A6237D2DFE3BBAEC8979D824A43E015648F6CB3D1F8D3E352A4BDC9925C075CFF312C4A0BE75FDF5C內(nèi)容導(dǎo)航第7章7.2搜索引擎
7.1
信息檢索基礎(chǔ)7.3
中文學(xué)術(shù)信息資源檢索系統(tǒng)7.2.1搜索引擎概述
根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上采集信息,在對信息進行組織和處理后,為用戶提供檢索服務(wù),將檢索的相關(guān)信息展示給用戶的系統(tǒng)。。(1)搜索引擎定義
搜索引擎的工作原理可以分為網(wǎng)頁抓取、索引構(gòu)建、搜索服務(wù)與結(jié)果排序三個階段。(2)搜索引擎工作原理7.2.1搜索引擎概述1)全文搜索引擎2)目錄搜索引擎3)元搜索引擎4)垂直搜索引擎(3)搜索引擎的分類7.2.1搜索引擎概述7.2.2搜索引擎的使用搜索引擎都提供了簡單檢索框,用戶只需要在檢索框內(nèi)輸入檢索詞,就可以得到檢索結(jié)果。(1)簡單檢索高級檢索通過高級檢索界面和高級檢索語法實現(xiàn),可輸入更多限定條件,提高準確率。(2)高級檢索1)高級檢索界面大多數(shù)搜索引擎提供高級檢索界面,用戶可輸入更多檢索限定條件以提高結(jié)果準確率。如百度的高級檢索界面:7.2.2搜索引擎的使用2)高級檢索語法①“intitle”:用于僅搜索網(wǎng)頁標題中包含關(guān)鍵詞的內(nèi)容語法格式:“intitle:關(guān)鍵詞”例如:搜索“紅色文化intitle:井岡山”,此時搜索結(jié)果僅僅顯示與井岡山有關(guān)的信息。7.2.2搜索引擎的使用②“filetype”:用于指定搜索文件的類型語法格式:“關(guān)鍵詞filetype:文件格式”,常見文件格式有pdf、doc、xls、ppt、rtf等例如:在搜索框中輸入“中國農(nóng)村電子商務(wù)發(fā)展報告filetype:PDF”,此時搜索結(jié)果均為PDF文檔。7.2.2搜索引擎的使用③“site”:用于在指定網(wǎng)站內(nèi)搜索內(nèi)容語法格式:“關(guān)鍵詞site:網(wǎng)址”例如:在檢索框中輸入“電商扶貧site:”,搜索結(jié)果中只保留來自央視網(wǎng)的網(wǎng)頁。7.2.2搜索引擎的使用e7d195523061f1c01da5a1f0837ac25283df40ff0a16bfd61AE6AB84AD7EB485CA8019BF267F2027DE2BF09650313B56A435BB3664F8B916CA3777391AC088C283181605E184D6D6879568EB73EB808A103F0784C8DFC3E9CDD14B61FDDA6A8A6237D2DFE3BBAEC8979D824A43E015648F6CB3D1F8D3E352A4BDC9925C075CFF312C4A0BE75FDF5C內(nèi)容導(dǎo)航第7章7.2搜索引擎
7.1
信息檢索基礎(chǔ)7.3
中文學(xué)術(shù)信息資源檢索系統(tǒng)7.3.1中國知網(wǎng)
中國知網(wǎng)即中國國家知識基礎(chǔ)設(shè)施(ChinaNationalKnowledgeInfrastructure,CNKI)工程,是國內(nèi)最知名的學(xué)術(shù)文獻檢索系統(tǒng)之一,由清華大學(xué)、清華同方共同發(fā)起,1999年開始建設(shè)?。是全球最大的中文學(xué)術(shù)資源數(shù)據(jù)庫,收錄95%以上正式出版的中文學(xué)術(shù)資源?,包括學(xué)術(shù)期刊、博碩士論文、會議論文、報紙、工具書、年鑒、專利等?,涵蓋自然科學(xué)、工程技術(shù)、農(nóng)業(yè)、醫(yī)學(xué)、人文社會科學(xué)等各個領(lǐng)域?。檢索方式多樣,包括一框式檢索、高級檢索、出版物檢索等,還具備查重、文獻分析等功能,為學(xué)術(shù)研究提供全面便捷服務(wù)。(1)中國知網(wǎng)概況①一框式檢索
進入首頁,選擇檢索字段(主題、關(guān)鍵詞等),選擇單個或多個數(shù)據(jù)庫,輸入檢索詞,單擊搜索按鈕。這種檢索方式便捷,能獲取全面海量文獻,但結(jié)果冗余多;若進行二次檢索或配合高級檢索可提高查準率。(2)中國知網(wǎng)的使用7.3.1中國知網(wǎng)②高級檢索首頁單擊“高級檢索”標簽或在一框式檢索結(jié)果頁面單擊“高級檢索”標簽。支持多字段邏輯組合,可選擇精確或模糊匹配方式、進行檢索控制;多字段組合檢索按從上到下順序運算優(yōu)先級。7.3.1中國知網(wǎng)③專業(yè)檢索
在高級檢索頁面中可切換專業(yè)檢索,專業(yè)檢索功能強大,適合熟練掌握檢索技術(shù)的專業(yè)人員。7.3.1中國知網(wǎng)7.3.2維普中文期刊服務(wù)平臺(1)維普中文期刊服務(wù)平臺概況
維普中文期刊服務(wù)平臺是由原中國科學(xué)技術(shù)情報研究所重慶分所,現(xiàn)重慶維普資訊有限公司推出的中文學(xué)術(shù)期刊大數(shù)據(jù)服務(wù)平臺。該平臺源于1989年創(chuàng)建的維普中文科技期刊數(shù)據(jù)庫,累計收錄中文學(xué)術(shù)期刊15000余種,文獻總量近7000萬篇,是我國數(shù)字圖書館建設(shè)的核心資源之一,廣泛被我國高等院校、公共圖書館、科研機構(gòu)采用,是高校圖書館文獻保障系統(tǒng)的重要組成部分,也是科研工作者進行科技查證和科技查新的必備數(shù)據(jù)庫。(2)維普中文期刊服務(wù)平臺的使用①簡單檢索
登錄維普中文期刊服務(wù)平臺,首頁默認是“簡單檢索”方式,使用一框式檢索,類似于搜索引擎的檢索。7.3.2維普中文期刊服務(wù)平臺②高級檢索
支持“與”“或”“非”三種邏輯運算,可通過布爾邏輯關(guān)系組配多個檢索詞,可選擇限定多個字段,通過時間限定、期刊范圍、學(xué)科限定進行檢索,還可選擇“精確”和“模糊”兩種匹配方式進行檢索。7.3.2維普中文期刊服務(wù)平臺7.3.2維普中文期刊服務(wù)平臺③檢索式檢索
主要服務(wù)于專業(yè)用戶,允許用戶直接在檢索窗口中編制并書寫完整的檢索式,可以進行邏輯組配,也可以進行字段限定,支持用戶選擇時間限定、期刊范圍、學(xué)科限定等。7.3.3萬方數(shù)據(jù)知識服務(wù)平臺
萬方數(shù)據(jù)知識服務(wù)平臺源自萬方數(shù)據(jù)資源系統(tǒng),是北京萬方數(shù)據(jù)股份有限公司在中國科學(xué)技術(shù)信息研究所數(shù)十年積累的全部信息服務(wù)資源的基礎(chǔ)上建立起來的,是以科技信息為主,集經(jīng)濟、金融、社會、人文信息為一體,實現(xiàn)網(wǎng)絡(luò)化服務(wù)的信息資源系統(tǒng)。目前,平臺收錄范圍包括學(xué)術(shù)期刊、會議文獻、學(xué)位論文、標準、專利、法律法規(guī)、科技成果、地方志等,內(nèi)容覆蓋自然科學(xué)和社會科學(xué)等各個專業(yè)領(lǐng)域。(1)萬方數(shù)據(jù)知識服務(wù)平臺概況①簡單檢索首頁檢索框為輸入框,可單擊檢索字段(題名、作者等)限定檢索,或直接輸入檢索詞,支持“與”“或”“非”的邏輯運算,檢索詞使用雙引號””可以表示精確匹配。(2)萬方數(shù)據(jù)知識服務(wù)平臺的使用7.3.3萬方數(shù)據(jù)知識服務(wù)平臺②高級檢索支持多個檢索類型、多個檢索字段和條件之間的邏輯組配檢索,方便構(gòu)建復(fù)雜檢索表達式,可選擇文獻類型,通過“+”“-”添加或減少檢索條件,用“與”“或”“非”限定條件,還可限定文獻發(fā)表時間和萬方數(shù)據(jù)文獻更新時間,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 辦公場地租賃押金管理細則協(xié)議2025年
- 2024年中考道德與法治(上海)第二次模擬考試(含答案)
- 2025年海南省公需課學(xué)習-重點排污單位自動監(jiān)測數(shù)據(jù)標記規(guī)則第344期
- 冰點文庫撈鐵牛課件
- 2025年中考沈陽歷史試卷及答案
- 2025年共同條例考核試卷及答案
- 景區(qū)輪船維修合同范本
- 2025年高熱度智商測試題及答案
- 2025年行政管理常識題庫及答案
- 礦山承包協(xié)議合同范本
- 男性性教育課件
- 藝術(shù)鑒賞教程課件
- 三級醫(yī)院臨床科室醫(yī)療質(zhì)量管理考核標準
- 2025 年高職酒店管理(人力資源管理)試題及答案
- 危重患者的容量管理
- 2025秋四年級上冊勞動技術(shù)期末測試卷(人教版)及答案(三套)
- 2025年應(yīng)急物資準備安全培訓(xùn)試卷及答案:物資管理人員應(yīng)急物資使用測試
- 電商售后客服主管述職報告
- 2025昆明市呈貢區(qū)城市投資集團有限公司及下屬子公司第一批招聘(12人)筆試考試參考試題及答案解析
- 受控文件管理流程
- 2025年黑龍江省哈爾濱市中考數(shù)學(xué)真題含解析
評論
0/150
提交評論