中科大信息檢索與利用課件08INTERNET 信息檢索_第1頁
中科大信息檢索與利用課件08INTERNET 信息檢索_第2頁
中科大信息檢索與利用課件08INTERNET 信息檢索_第3頁
中科大信息檢索與利用課件08INTERNET 信息檢索_第4頁
中科大信息檢索與利用課件08INTERNET 信息檢索_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第八講INTERNET信息檢索搜索引擎(SEARCHENGINE)概念及類型(一)搜索引擎又稱檢索引擎,其英文名稱有:searchengine、robot、spider、crawler、worm。廣義上是指一種基于因特網(wǎng)的信息查詢系統(tǒng),包括信息存取、信息管理、信息檢索;狹義上是指一種為搜集因特網(wǎng)上的網(wǎng)頁而設(shè)計的檢索軟件?,F(xiàn)有的搜索引擎基本上分三類:一種是獨立搜索引擎,如:yahoo、altavista、天網(wǎng)等,特點是僅在搜索引擎自身的數(shù)據(jù)庫中查詢信息;一種是元搜索引擎,如:cyber411()、Mamma:motherofallsearchengine(),特點是查詢時要

搜索引擎(SEARCHENGINE)概念及類型(二)

調(diào)用其他多個獨立的搜索引擎,并能把查詢結(jié)果進行不同程度的處理;第三種是網(wǎng)絡(luò)搜索軟件,如3W搜霸,它是由QUARTERDECK公司研制,包括43個著名搜索引擎,分8大類(GERNERAL、HEALTH等),為網(wǎng)站自動編制文摘、支持布爾邏輯運算。搜索引擎(SEARCHENGINE)常用搜索引擎舉要(一)Altavista(http://www.altavista.):是Compaq公司下屬的Altavista網(wǎng)絡(luò)公司設(shè)計開發(fā)的,有兩種查詢模式:Mainsearch和AdvancedSearch,前者通過輸入關(guān)鍵詞即可提交檢索,適用于概括檢索;后者必須運用有關(guān)標(biāo)識符構(gòu)建檢索表達式,使用于精確查詢。

Altavista

支持布爾邏輯運算,檢索表達式可容納800個字符。Altavista的檢索速度非???,擁有最大的,最詳細的URL索引。如果想進行有效的檢索,最好輸入盡可能多且詳細的關(guān)鍵詞進行高級查詢。搜索引擎(SEARCHENGINE)常用搜索引擎舉要(二)excite(/)是excite公司設(shè)計開發(fā)的搜索引擎,它主要由ExciteSearch,ExciteCitynet,ExciteLive和ExciteReference組成。ExciteSearch用于關(guān)鍵詞檢索;ExciteCitynet用于查看美國城市的信息;ExciteLive提供諸如運動、新聞、股市行情、電視節(jié)目、天氣預(yù)報等各種日常生活信息;ExciteReference提供黃頁、尋人、電子郵件、地圖、共享軟件等服務(wù)。Excite提供網(wǎng)頁、新聞和視聽信息的高級檢索,不能使用+、—、()及布爾運算符。Excite最大的特點是采用一個被稱之為“智能概念抽取”的專用查詢軟件,可通過自然語句檢索網(wǎng)絡(luò)資源,有多種全球區(qū)域版本.搜索引擎(SEARCHENGINE)常用搜索引擎舉要(三)天網(wǎng)(http://pccms.pku.edu.cn:8000/gbindex.htm):是由北大計算機系網(wǎng)絡(luò)研究室設(shè)計開發(fā)的,搜集的信息范圍限于國內(nèi)中文網(wǎng)絡(luò),.查詢方式分為簡單查詢和復(fù)雜查詢兩種.運算符為:或,與.模糊匹配技術(shù)似的有拼寫錯誤的查詢請求也能被搜索到,單騎檢索結(jié)果重復(fù)較多,無效連接也不少.網(wǎng)絡(luò)資源目錄(一)Yahoo(/中文雅虎(http://cn.)(http://tw.)(http://hk.)搜狐(http://www.sohu.com)網(wǎng)絡(luò)資源目錄(二)網(wǎng)絡(luò)資源目錄是由網(wǎng)絡(luò)開發(fā)者將網(wǎng)絡(luò)信息收集后,以某種分類法進行組織整理,并和建所發(fā)集成在一起的信息查詢工具.它一般是引導(dǎo)網(wǎng)絡(luò)用戶的查詢概念(而不是確切的概念)來幫助用戶找到所需的網(wǎng)絡(luò)信息.網(wǎng)絡(luò)資源目錄一般采用人工方式采集和存儲網(wǎng)絡(luò)信息,它把采集到的新鮮主體性質(zhì)進行分類,以某種分類體系為依據(jù),講信息分成若干領(lǐng)域的主題范疇,然后再細分為個學(xué)科專題目錄,最后列出具體的相關(guān)網(wǎng)站,形成一個有信息鏈組成的樹狀結(jié)構(gòu),即:總目—專題目錄—鏈接—文本.網(wǎng)絡(luò)資源目錄(三)Yahoo(/,它是WWW上最早最最著名的目錄,最流行的web導(dǎo)航指南,於1994年創(chuàng)立.在主題查詢方式中,Yahoo將網(wǎng)絡(luò)信息分為14個總類,每個總類下鏈接若干小類,逐級鏈接,最后與相關(guān)類目、網(wǎng)站、網(wǎng)頁、新聞等相鏈接。Yahoo還提供關(guān)鍵詞查詢,有簡單查詢和高級檢索兩種方式,其中高級檢索可指定檢索范圍,但檢索表達符僅限于AND和NOT兩種。Yahoo的優(yōu)點:一是很好地解決了信息內(nèi)容交叉的問題;二是很好地解決了語言障礙的問題。中文雅虎(http://cn.)(http://tw.)(http://hk.)網(wǎng)絡(luò)資源目錄(四)搜狐(http://www.sohu.com):它是愛特信公司創(chuàng)辦的大型中文網(wǎng)絡(luò)系統(tǒng),于1998年正式問世,搜狐站點的全部內(nèi)容采用人工分類,提供分類查詢和關(guān)鍵詞全文檢索兩種方式,收錄中英文網(wǎng)絡(luò)信息,并將其分為18個大類,組織形式與YAHOO相似。其優(yōu)點是反映速度快,很好地滿足了中國人的信息檢索習(xí)慣。專門檢索系統(tǒng)(一)查詢地圖及其相關(guān)信息MAPBLAST(www.mapblast.com):它是由VICINITYCORPORATION公司提供的免費服務(wù)站點,為用戶提供精確的交互地圖和行車指南,同時提供廣泛的信息服務(wù)和指南,分為3種方式:MAP、DRIVE和FIND,其中:MAP提供歐美街區(qū)及郵政編碼、地圖等等;DRIVE提供行車路線指南;FIND提供地址查詢。對顯示的地圖可放大、縮小或打印、E-MAIL發(fā)送。圖行天下—中國地圖搜索引擎()是檢索中國地圖信息的檢索工具可在地圖上查詢?nèi)珖鞔蟪鞘械牡貓D信息。專門檢索系統(tǒng)(二)圖象信息檢索VisualSEEK--

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論