版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第四章搜索引擎、學習目標、知識目標熟悉搜索引擎的基本知識各種搜索引擎的特征能力目標學會使用各種搜索引擎獲取信息(1)網(wǎng)絡基本知識1、網(wǎng)絡通信協(xié)議互聯(lián)網(wǎng)通信協(xié)議群集(TCP/IP): TCP傳輸控制協(xié)議IP internet協(xié)議:向指定的地址發(fā)送信息,負責信息傳輸時的定位和尋址。 2 .網(wǎng)站:互聯(lián)網(wǎng)上計算機的地址。 IP地址:用32位的二進制表示,用“.”符號分為4段。 0255示例: 24域名:以英文字符串表示網(wǎng)絡上計算機的地址,以便于讀取和寫入。 結構主機名.機構名.網(wǎng)絡類型.頂級域名示例: URL (統(tǒng)一資源定位符) :確定特定信息資源在網(wǎng)絡中的位置。 結構:應用協(xié)
2、議、主機地址、文件路徑和文件名示例: (http是超文本傳輸協(xié)議吉林大學圖書館的主機地址/jsk/index.htm是目錄路徑和文件名。) (1)網(wǎng)絡基本知識3、互聯(lián)網(wǎng)上的信息資源(由其傳輸協(xié)議分開) WWW萬維網(wǎng):世界規(guī)模的信息網(wǎng)絡。 是互聯(lián)網(wǎng)上最主要最直觀的信息資源。 互聯(lián)網(wǎng)論壇:是最豐富、自由、開放的網(wǎng)絡信息資源。 FTP文件傳輸服務:可以從遠程計算機獲取和下載文件,也可以將文件從本地計算機上載到遠程計算機。 (2)網(wǎng)絡信息檢索的一般方法通過網(wǎng)絡資源指南,利用搜索信息的網(wǎng)絡信息檢索工具,搜索信息的:網(wǎng)絡檢索工具搜索引擎。 有機地組織世界各地的相關信息資源,用戶可以通過互聯(lián)網(wǎng)獲得所需的文本
3、、圖像、電影、聲音等信息。 (3)www搜索引擎,定義:廣義的搜索引擎,是指基于互聯(lián)網(wǎng)提供信息管理、查詢、搜索等服務的工具、系統(tǒng)和網(wǎng)站。 狹義的搜索引擎是指為了利用ROBOT軟件自動搜索互聯(lián)網(wǎng)上的面對面和網(wǎng)站信息資源而特別修正的搜索服務軟件。 常用的更嚴格的搜索引擎定義: (1)目錄搜索引擎:初始搜索引擎收集因特網(wǎng)中的資源服務器的地址,按照所提供的資源的類型分類為不同的目錄,進一步分級。 多數(shù)信息面向網(wǎng)站,提供目錄閱覽服務和直接檢索服務。 優(yōu)勢:信息準確,導航質(zhì)量高的缺點:需要人工干預,維護量大,信息量少,來不及更新信息。 代表:雅虎! 搜索狐分類目錄,2個搜索引擎的類型,(2)全文搜索引擎:
4、大型機運行的程序按照某些策略自動在互聯(lián)網(wǎng)上收集和發(fā)現(xiàn)信息,索引器將收集的信息建立索引,搜索器根據(jù)用戶的查詢輸入建立索引服務方式面向全文檢索服務。 優(yōu)勢:信息量大、更新及時、無需人工干預的缺點:返回的信息太多,可能有很多不相關的信息,用戶必須從結果中過濾。 代表:谷歌,百度,天網(wǎng)系統(tǒng)結構信息收集子系統(tǒng)(搜索器)索引子系統(tǒng)(索引器)搜索子系統(tǒng)(搜索器)用戶界面,2搜索引擎類型,(3)元搜索:沒有自己的數(shù)據(jù),用戶的問題3搜索引擎的搜索功能和技術(常用語法規(guī)則),搜索技術選擇合適的搜索工具,同時至少使用2個搜索工具進行搜索。提取合適的關鍵字是指檢索關鍵字正確使用布爾邏輯或其他操作符號的作用來限制“域”
5、的功能、3檢索引擎的檢索功能和技術(常用語法規(guī)則)、修正器運算符1、使用邏輯運算符(布爾邏輯檢索技術) (1)AND(* ) :邏輯上“and”。 搜索表達式表示:NC機床*目錄(2)OR () :邏輯上表示“or”,如果用它連接兩個詞匯,或者表示該詞匯或者該詞匯出現(xiàn)在搜索結果中,當然可能出現(xiàn)兩個詞匯擴大檢索范圍,提高全檢查率。 /檢索修正算法和編程語言的文獻。 檢索式:補正機算法OR補正機編程語言。 (3)NOT(-) :邏輯上表示“不”,使用它連接兩個詞匯的話,就會檢索包含NOT以前的詞匯的文件,但包含NOT以后的詞匯的文件除外。 例:檢索互聯(lián)網(wǎng)以外的補正機關文獻檢索式: computer
6、 - Internet或computer NOT Internet的優(yōu)先順序: NOT AND OR用括弧變更該檢索式,構筑多層次檢索式。 例如:“汽車使用和維護”用布爾邏輯關系表示其檢索式汽車AND (使用OR維護),2、優(yōu)先運算符: () 3、位置運算符: Nn(near):運算符兩側的檢索詞接近,詞序必須顛倒。 Wn(with ) :運算符兩側的檢索詞必須接近,語序也不能顛倒。 4、切片檢索技術:“?” “*”字符串檢索也稱為精密檢索,需要雙引號、引號的使用目的,是為了向檢索引擎?zhèn)鬟_將幾個關鍵字作為完整的組合字符串進行檢索。 (檢索句子和句子整體)字段限制檢索(限定檢索)加權檢索擴展檢索
7、,高級檢索功能1,自然語言檢索:將自然語言中的某個詞,某個詞,某個句子直接作為檢索提問方式進行信息檢索。 2 .模糊檢索3、精密檢索4、管道檢索5、區(qū)分大小寫的檢索6、概念檢索7、相關信息反饋檢索8、檢索范圍的限制、檢索引擎檢索技巧簡單檢索雙引號(“)檢索加號()檢索:某詞匯必須出現(xiàn)在檢索結果中減號(-)搜索:強調(diào)搜索結果中不顯示單詞。 括號()搜索:空間搜索通配符(*? 搜索:區(qū)分大小寫進行搜索的布爾邏輯搜索元詞搜索,(4)常用的中文搜索引擎和特點,1996年2月服務的臺灣番茄芋藤搜索引擎,標志著中文搜索引擎的正式開始。 此后,華澤、奇摩、悠游等中文搜索引擎相繼出現(xiàn)在港臺的中國大陸上,四路利
8、方公司(新浪網(wǎng)前身)開發(fā)了國內(nèi)最早的中文搜索引擎Richsurf后,又開發(fā)了網(wǎng)易、搜索客、常青藤、北極星、搜索狐、新浪、北大天網(wǎng)、百度等搜索引擎。 以下是一些著名的中文搜索引擎: 1、谷歌搜索引擎2、百度搜索引擎3、中文雅虎4、搜索狐搜索引擎5、新浪搜索引擎6、網(wǎng)易搜索引擎7、天網(wǎng)中文搜索引擎、(4)常用中文搜索引擎和特征谷歌在全球每天處理的搜索請求達到2億次,谷歌數(shù)據(jù)庫中存儲了42.8億個WEB文件。 不是第一個搜索引擎,而是當前最成功的搜索引擎。 03年全球市場占有率達到79,Yahoo! 中斷合作后,市場占有率仍為51 . 2000年進入中國,迅速成為大眾喜愛的搜索引擎。 谷歌學術搜索為
9、搜索學術文獻提供了專業(yè)搜索工具。 1、谷歌搜索引擎,谷歌特征(1)提供常規(guī)和高級搜索功能。用戶可以從10到100個信息條目中選擇搜索結果頁面中包含的條目數(shù)。 提供網(wǎng)站內(nèi)的咨詢、橫向的相關咨詢,提供特殊的主題搜索等。 (2)語言支持:允許用100種以上的語言進行檢索。 (3)搜索規(guī)則:按關鍵字搜索時,短語搜索返回結果中包含的關鍵字的全部和部分,默認情況下不支持單詞的多形態(tài)和斷詞搜索。 1、谷歌中文搜索引擎、基本搜索(1)布爾邏輯技術在谷歌的應用自動使用“and”進行查詢,不需要在關鍵詞之間加上“and”或“”。 如果想縮小搜索范圍,可以輸入更多關鍵詞,在關鍵詞之間留出空格。 例:圣誕老人2000
10、報價! 搜索結果必須不包含特定的信息。 減號“-”“表示邏輯”不是“動作”(-前面加空格)。 例:“歷史-文化”! 您可以使用“”將這些單詞壓在搜索詞上,但必須在“”前加空格。 不要! 支持“或”搜索。 archie OR蜘蛛”(2)谷歌不支持詞干法、通配符。 (3)無視詞問題可以自動忽略“http”、“com”、“www”、“的”和“*”、“”等符號無視詞,用英語雙引號將這些無視詞壓在檢索項目上。 基本檢索(4)用專用語詢問。 用雙引號括住術語可以進行準確的搜索。 用于搜索明文或專用名詞。 /對社會的貢獻等于價值。 (5)搜索不區(qū)分字母大小寫,用小寫處理所有字符。 (6)拼音漢字自動轉換,支
11、持模糊的拼音檢索。 搜索“萬羅興文”后,發(fā)現(xiàn)“您在找什么:網(wǎng)絡新聞嗎? 否則這些變更僅會影響目前的文件。 谷歌的特殊功能(高級檢索) (1)限制檢索的網(wǎng)站。 只需在搜索框中鍵入site:即可搜索中文教育科研網(wǎng)站()上包括古龍在內(nèi)的所有頁面。 搜索:“古龍site: (2)在某種文件中搜索信息。 要查找PDF、Microsoft(doc、ppt、xls、rtf )等各種格式的文件,輸入“關鍵字filetype:doc”即可。 例:“電子商務filetype:doc” (3)訂正計算機。 內(nèi)置了提供簡單的修正算法、復雜的科學修正算法、單位換算、各種物理常數(shù)等的修正算法機。 (4)相似頁面。 單擊“
12、類似于網(wǎng)頁”后,搜索引擎將搜索與該網(wǎng)頁相關的網(wǎng)頁。 (5)鏈接搜索:搜索鏈接到某個URL地址的所有網(wǎng)頁.在搜索框中輸入 link: ,將顯示指向該網(wǎng)站的所有網(wǎng)頁. 但是,不能與關鍵詞檢索并用。 例如,“l(fā)ink:”指定要搜索的范圍,并且“1”、“intitle (或title )”將搜索范圍限制為頁面標題中的頁面標題,這通常是頁面內(nèi)容的抽出表達式的總結。 如果將詢問內(nèi)容的范圍限定為網(wǎng)頁標題,則有時得到良好的效果。 例如,intitle:劉德華注意不要在intitle:和后續(xù)關鍵字之間加空格。 例如:搜索劉德華的寫真集:照片intitle:劉德華指定搜索范圍,2,site將搜索范圍限定在特定網(wǎng)站
13、的site,知道某個網(wǎng)站有自己想要搜索的內(nèi)容,將搜索范圍限定在這個網(wǎng)站,提高搜索效率使用方法是在詢問內(nèi)容后面加上“site:域名”。 例如,文獻檢索site 3360注意“site:”后面的站點域名不要有“http:/”,并且不要在site 3360和站點名之間加入空格或site。 site還可以搜索域中的示例內(nèi)容。 關鍵字site:edu在教育網(wǎng)絡(.edu )中搜索示例。 搜索中文教育科學研究網(wǎng)站()上的所有內(nèi)容:“古龍site:注意:關鍵字和site之間必須有空格,冒號和點必須為半角,指定搜索對象的范圍,3,inurl在url鏈接中的網(wǎng)頁url中實現(xiàn)方法是“inurl:”,后面是出現(xiàn)在u
14、rl中的關鍵字。 例如:查找photoshop的用法搜索表達式: photoshop inurl:jiqiao上的此查詢字符串的“photoshop”可以在網(wǎng)頁上的任意位置顯示,“jiqiao”必須顯示在網(wǎng)頁的url上inurl:語法和后續(xù)關鍵字不得包含空格。 搜索同義詞-,可以在單詞前面加上符號來搜索同義詞。 例如,您可以搜索house,搜索house,搜索定義define。 define:關鍵字示例: define:css相當于搜索css的定義。 如果無法打開網(wǎng)頁結果,請單擊網(wǎng)頁的快照以顯示該網(wǎng)頁。 (7)手的調(diào)子好:按下“手的調(diào)子好”按鈕,谷歌就會自動進入搜索的第一頁,完全看不到其他的搜
15、索結果。 (8)自動糾錯功能:糾錯軟件系統(tǒng)自動掃描輸入的關鍵字,檢查是否有誤字,提供糾正可能誤字的提示。 (9)中英語詞典。 只要輸入“(翻譯、FY、FY中的任意一個)想查的中(英)句的單詞”即可。 (十)查詢天氣、股票、郵政編碼、手機號碼。 要查看天氣,只需輸入城市名稱天氣(天氣、TQ、TQ之一)即可查詢股價和股市行情,只需輸入股名或代碼股。要查詢郵政編碼或長途電話號碼, 只需輸入“想查的城市地名或者郵政編碼或者電話號碼或者區(qū)號”就可以常用的中文搜索引擎和特點2、百度搜索引擎百度公司于1999年底在美國的硅谷設立,回國發(fā)展。 百度()作為國內(nèi)最大的商業(yè)化搜索引擎,其功能完整,搜索結果匹配度極
16、高,尤其是其MP3搜索功能,是目前國內(nèi)技術水平最高的搜索引擎之一。 目前,全國有36個大網(wǎng)站采用百度引擎。 百度搜索引擎、百度產(chǎn)品(1)網(wǎng)頁搜索:擁有世界上最大的中文搜索引擎,總量超過3.5億網(wǎng)頁。 (2)MP3檢索:從每天更新的3億5千萬的中文網(wǎng)頁中提取MP3下載鏈接,構筑MP3歌庫。 提供歌曲名稱歌詞檢索功能,還具有自動驗證下載速度的功能,下載速度最快者排名靠前。 (3)新聞檢索:是目前世界上最大的中文新聞檢索平臺,每天發(fā)布8萬到10萬條新聞。 新聞來源包括500多個權威網(wǎng)站(4)的帖子。 如果web搜索不能滿足您的要求,請發(fā)布查詢請求,用別人的知識、想法和經(jīng)驗來解決您的問題。 百度搜索引擎,(5)圖片搜索:目前世界上最大的中文畫廊。 可以直接輸入任意關鍵字,搜索所需的圖像數(shù)據(jù),支持圖像大小和圖像格式的搜索,還可以快速分類圖像閱覽導航。 下車吧。 用戶可以與互聯(lián)網(wǎng)上的其他用戶輕松、快速、安全地上傳和下載大容量電影、游戲、音樂、軟件和照片。 (7)網(wǎng)站:百度網(wǎng)站導航采用主題分類的方法,人工維持更新,推薦最優(yōu)秀的網(wǎng)絡資源,目前網(wǎng)站導航共分為4大類,60多個子類別。 (8)搜索風云榜。 基于每天數(shù)千萬次的搜索數(shù)據(jù),提供最有權威的中文搜索風云排行榜,例如金曲排行榜、小說排行榜、人物排行榜等。 (9)地區(qū)檢索:通過選擇某省、自治區(qū)、地區(qū)的信息資源進行檢索
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年太湖創(chuàng)意職業(yè)技術學院單招職業(yè)技能考試備考題庫帶答案解析
- 2026年天津機電職業(yè)技術學院高職單招職業(yè)適應性考試備考試題帶答案解析
- 2026年金山職業(yè)技術學院高職單招職業(yè)適應性測試備考題庫帶答案解析
- 2026年智能包裝設計啤酒項目可行性研究報告
- 2026年智能茶吧機項目公司成立分析報告
- 2026年山西運城農(nóng)業(yè)職業(yè)技術學院單招職業(yè)技能筆試備考題庫帶答案解析
- 2026年湖南工業(yè)職業(yè)技術學院單招職業(yè)技能筆試參考題庫帶答案解析
- 2026年天津交通職業(yè)學院高職單招職業(yè)適應性考試模擬試題帶答案解析
- 2026年四川司法警官職業(yè)學院單招職業(yè)技能筆試備考試題帶答案解析
- 2026年江西航空職業(yè)技術學院單招職業(yè)技能考試備考題庫帶答案解析
- 全球AI應用平臺市場全景圖與趨勢洞察報告
- 2026.05.01施行的中華人民共和國漁業(yè)法(2025修訂)課件
- 維持性血液透析患者管理
- 2025年大學大四(臨床診斷學)癥狀鑒別診斷試題及答案
- 2026液態(tài)氧儲罐泄漏事故應急處置方案
- 直腸解剖課件
- 2025年消控員初級證試題及答案
- 遼寧省丹東市鳳城市2024-2025學年八年級上學期1月期末語文試題
- 樓宇智能弱電系統(tǒng)培訓資料
- 下水箱液位控制系統(tǒng)設計
- FABE銷售法培訓課件
評論
0/150
提交評論