版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
搜索引擎相關(guān)概念I(lǐng)P地址:Internet上每臺計算機(jī)相對應(yīng)的地址,是一連串的數(shù)字。域名:與數(shù)字型IP地址相對應(yīng)的字符型地址,有類別域名和行政區(qū)域名兩套。
類別域名:
AC科研機(jī)構(gòu)COM工、商、金融等企業(yè)EDU教育機(jī)構(gòu)GOV政府部門
NET互聯(lián)網(wǎng)絡(luò)、接入網(wǎng)絡(luò)的信息中心(NIC)和運行中心(NOC)
ORG各種非盈利性的組織
行政區(qū)域名是按照各個行政區(qū)劃劃分而成的。
URL:統(tǒng)一資源定位器,即平時所說的網(wǎng)頁地址。其格式為:傳輸協(xié)議://主機(jī)IP地址或域名地址/資源所在路徑和文件名
網(wǎng)絡(luò)信息資源的特點(1)信息數(shù)量龐大且重復(fù)。網(wǎng)頁就有上百億個(2)信息處于動態(tài)變化之中(3)信息組織上處于無結(jié)構(gòu)化、半結(jié)構(gòu)化之中信息通常是無組織的,沒有數(shù)據(jù)庫中數(shù)據(jù)的結(jié)構(gòu)化特性,或者是只有有限的結(jié)構(gòu)特性(4)無統(tǒng)一的信息評價機(jī)制和標(biāo)準(zhǔn).
隨意發(fā)布信息,信息雜亂無章,質(zhì)量無法保證(5)信息發(fā)布在異構(gòu)平臺上概念
搜索引擎(SearchEngine)是通過因特網(wǎng)查詢網(wǎng)絡(luò)信息的重要工具。搜索引擎是一種網(wǎng)絡(luò)資源的檢索工具,是一種網(wǎng)頁網(wǎng)址檢索系統(tǒng)。有的提供分類和關(guān)鍵詞檢索途徑,有的僅提供關(guān)鍵詞檢索途徑。是將因特網(wǎng)上的網(wǎng)站資源地址或/和內(nèi)容收集、整理后,加以分類,形成網(wǎng)絡(luò)資源數(shù)據(jù)庫,作為一種新的網(wǎng)絡(luò)資源提供給人們使用。搜索引擎的工作原理
1.從互聯(lián)網(wǎng)上抓取網(wǎng)頁
2.建立索引數(shù)據(jù)庫
3.在索引數(shù)據(jù)庫中搜索排序搜索引擎分類1.全文搜索引擎(Searchengine)
:
國內(nèi)著名的有百度(Baidu)、一搜等,國外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等。它們都是通過從互聯(lián)網(wǎng)上提取的各個網(wǎng)站的信息(以網(wǎng)頁文字為主)而建立。2.目錄索引類(SearchIndex/Directory):
按目錄分類的網(wǎng)站鏈接列表而查找。YAHOO。
3.元搜索引擎(MetaSearchEngine):基本的工作原理是在接受用戶查詢請求后,同時在其他多個引擎上進(jìn)行搜索,并將結(jié)果返回給用戶。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。搜索引擎的使用(一)分類瀏覽(二)關(guān)鍵詞檢索
1.詞組或短語搜索
2.二次檢索
3.邏輯運算:“與”、“或”、“非”三種基本形式,邏輯運算符號分別用and(+或空格)、or、not(-或andnot)4.字段限制檢索
5.截詞和通配符檢索
6.大小寫區(qū)分:對于人名、地名(如GeorgeBush,Taxas)、專有詞(AIDS、Aids)檢索有幫助。
7.臨近檢索:
有的搜索引擎提供臨近檢索符搜索引擎存在的問題(1)檢索精度差(2)沒有有效地適應(yīng)信息源變化的機(jī)制,無效鏈接經(jīng)常出現(xiàn)(3)動態(tài)網(wǎng)頁索引能力較差(4)檢索結(jié)果顯示方式過于簡單(5)人機(jī)交互較為簡單,沒有考慮用戶的反饋(6)主動性信息服務(wù)功能差,注重”拉”,忽視”推”綜合性搜索引擎介紹YAHOO()Vivisimo(http://)Google()YAHOO(http://)
早期的YAHOO!只有分類目錄,是目錄型搜索引擎的代表。如今它也提供關(guān)鍵詞檢索。http:///dirVivisimo()
字面上的意思是美觀、亮麗、聰明,是一個聚類搜索引擎,有目前最好的搜索結(jié)果自動分類技術(shù)。這個搜索引擎是美國卡耐基大學(xué)(CarnegieUniversity)的作品,除了常用搜索引擎的索引與查尋服務(wù)外,還提供了其他搜索引擎的集成查尋功能。同時,Vivisimo還對其搜索引擎技術(shù)隨時進(jìn)行改進(jìn),目前還開發(fā)出了Clusty聚類功能。
Clusty是VIVISIMO開發(fā)并擁有的利用自己的特有的聚類搜索引擎技術(shù),將搜索到的結(jié)果放到相似的文件夾里面。利于用戶集中精力看自己感興趣的內(nèi)容而不是所有檢索結(jié)果。禽流感Google20
Google()是一個搜索引擎,由兩個斯坦福大學(xué)博士生LarryPage與SergeyBrin于1998年9月發(fā)明,GoogleInc.于1999年創(chuàng)立。2000年7月份,Google替代Inktomi成為Yahoo公司的搜索引擎,同年9月份,Google成為中國網(wǎng)易公司的搜索引擎。是目前最優(yōu)秀的搜索引擎之一。Google(http://)Google提供的服務(wù)Google提供的服務(wù)(續(xù))基本檢索技術(shù):邏輯運算1.邏輯“與”:Google無需用明確的符號表示,只要在關(guān)鍵詞間留一空格即可。
2.邏輯“或”:用大寫“OR”表示。OR的前面必須有空格。
3.邏輯“非”:用“-”表示,“-”號前必須有空格。將輸入的詞作為整體來檢索,可提高查準(zhǔn)率表達(dá)方式:“檢索詞”例:查找lungcancer基本檢索技術(shù):詞組檢索
不加引號:19,200,000條結(jié)果
加上引號:15,000,000條結(jié)果表達(dá)方式:使用截詞符“*”。例:張衡是*人基本檢索技術(shù):截詞檢索智能化檢索按鈕,直接跳到它認(rèn)為最符合要求的網(wǎng)站,不出現(xiàn)其他結(jié)果。例:輸入”重慶醫(yī)科大學(xué)”,然后按”手氣不錯”按鈕。(用于查找、訪問特定的網(wǎng)站)特色功能:手氣不錯
重慶醫(yī)科大學(xué)可搜索文件標(biāo)題或內(nèi)容中含有檢索詞的特定類型文件,有有PDF、PPT、XLS、DOC、SWF、DWF等多種類型。表達(dá)方式:檢索詞
filetype:文件類型例:文獻(xiàn)檢索filetype:ppt30特色功能:特定類型文檔搜索
31在某個特定的域或站點中進(jìn)行搜索(可用于查找政府/組織出版物)表達(dá)方式:檢索詞
site:域名例:全科醫(yī)師崗位培訓(xùn)工作評估指標(biāo)體系
site:特色功能:指定網(wǎng)域搜索
32指定檢索詞出現(xiàn)在網(wǎng)頁的標(biāo)題欄表達(dá)方式:“intitle”和“allintitle”兩種格式,相當(dāng)于“題名檢索”。例:intitle:重慶醫(yī)科大學(xué)畢業(yè)生allintitle:重慶醫(yī)科大學(xué)畢業(yè)生4,200
條結(jié)果
166
條結(jié)果
特色功能:網(wǎng)頁標(biāo)題搜索
33特色功能:圖片搜索
34特色功能:地圖搜索
查看字詞或詞組的定義,舉例:輸入:定義納米35特色功能:定義搜索
36只需輸入一個關(guān)鍵詞(“翻譯”,“fy”和“FY”任選其一)和要查的中(英)文單詞,Google會直接顯示您要查的單詞的英文(或中文)翻譯。如輸入:翻譯維他命如輸入:翻譯禽流感特色功能:中英文翻譯
可從Google服務(wù)器緩存中調(diào)出網(wǎng)頁。當(dāng)網(wǎng)頁因移動或刪除而無法顯示時可使用此功能。特色功能:網(wǎng)頁快照
高級檢索界面不了解檢索規(guī)則時可利用高級檢索完成復(fù)雜的檢索專業(yè)搜索1、HealthWeb2、H0Ncode3、scirus4、Medscape5、MedFinder6、Google學(xué)術(shù)搜索7、CNKI知識搜索HealthWeb
http://
是美國中西部各醫(yī)學(xué)中心的醫(yī)學(xué)信息專家管理的一個搜索引擎,目的是為健康工作者和健康消費者提供各種醫(yī)學(xué)信息資源。它根據(jù)疾病所屬學(xué)科的第一個字母進(jìn)行分類,同時提供簡單檢索和高級檢索功能。在高級檢索中可以用醫(yī)學(xué)主題詞(MeSH)進(jìn)行檢索。提供有關(guān)愛滋病的有關(guān)學(xué)會、會議、電子文獻(xiàn)、資源庫以及其預(yù)防、研究、治療等方面的信息。簡單檢索高級檢索HON(http://www.hon.ch)
由在瑞士日內(nèi)瓦的非盈利性組織“網(wǎng)絡(luò)健康基金會”(TheHealthontheNetFoundation)1996年建立的一個醫(yī)學(xué)信息站點,該站點專門診斷因特網(wǎng)所提供的信息的正確性和可靠性,并提倡網(wǎng)絡(luò)倫理。這個組織發(fā)展了一套用以檢測網(wǎng)站信息的正確性和可靠性的系統(tǒng),運用此系統(tǒng),上網(wǎng)者可隨時確知自己瀏覽的資料的可信度。HON醫(yī)學(xué)搜索引擎
HON建立的醫(yī)學(xué)搜索引擎,包括MedHunt和HONselect。
HON還根據(jù)使用信息對象的不同,提供三種不同對象的登陸入口,包括個人、醫(yī)學(xué)專業(yè)人員和網(wǎng)絡(luò)出版者,針對不同的用戶群體提供一些他們感興趣的信息。
HONcoderen認(rèn)證的網(wǎng)站
醫(yī)藥網(wǎng)站
查詢MeSH主題詞
新聞
醫(yī)學(xué)會議
醫(yī)學(xué)圖片患者/個人醫(yī)學(xué)專業(yè)人士網(wǎng)站發(fā)行者對一些值得特別關(guān)注的專題進(jìn)行深入報道報道新聞主持、資助的項目制定醫(yī)藥衛(wèi)生領(lǐng)域的網(wǎng)站開發(fā)者的道德規(guī)范scirus科技檢索引擎SCIRUS
Scirus是目前互聯(lián)網(wǎng)上最全面、綜合性最強(qiáng)的科技文獻(xiàn)門戶網(wǎng)站之一。其涵蓋的資源大體分為網(wǎng)絡(luò)站點資源和科技文獻(xiàn)資源兩大部分。目前Scirus搜集的與科技相關(guān)的網(wǎng)頁已超過1.5億,其中包括:?4,500,000.edusites?14,800,000.orgsites?5,500,000.ac.uksites?18,000,000.comsites?4,700,000.govsites
?40,000,000STMandUniversitysitesSCIRUS從SCIRUS可以檢索到文獻(xiàn)資源有:?1千3百萬篇MEDLINE文摘;?4千5百萬篇ScienceDirect全文?1百萬篇美國專利?675,000Beilstein化學(xué)化工文摘?10,600NASA技術(shù)報告?1,070BioMedCentral生物醫(yī)學(xué)全文?20余萬篇電子預(yù)印本簡介:共收藏了近20個臨床學(xué)科2.5萬篇文獻(xiàn),是Web上最大的免費提供臨床醫(yī)學(xué)全文文獻(xiàn)和繼續(xù)醫(yī)學(xué)教育資源的網(wǎng)點檢索方法:分類和關(guān)鍵詞檢索特點:可檢索圖像、聲頻、視頻資料。MedScape
http://MedScape
http://根據(jù)疾病名稱、所屬學(xué)科和內(nèi)容性質(zhì)(會議報告、雜志文章的全文或摘要等)的英文逐個字母的分類檢索??梢赃M(jìn)行MEDLINE檢索。直接查閱《Merriam-Webster》醫(yī)學(xué)詞典中55,000條目的內(nèi)容。直接查詢其中200,000種藥物的使用劑量、毒副作用、使用注意事項等內(nèi)容最新動態(tài)新聞醫(yī)學(xué)繼續(xù)教育新聞資源中心患者教育期刊資料專家觀點MedFinder
http://
是一個由專家手工編制的醫(yī)學(xué)專業(yè)搜索引擎,可按主題詞進(jìn)行檢索,也可按提供的分類進(jìn)行檢索,其特點是影像學(xué)方面的內(nèi)容特別豐富,該網(wǎng)站提供了大量的病理切片、ECG、CT、MRI、核醫(yī)學(xué)、超聲醫(yī)學(xué)方面的內(nèi)容,其形式包括各種圖片、照片、視頻和動畫。在提供資源的同時,還可以進(jìn)行交互性學(xué)習(xí)。提供MEDLINE檢索進(jìn)行注冊資源介紹檢索讀者教育Google學(xué)術(shù)搜索
(Googlescholar)61概況
Google學(xué)術(shù)搜索提供可廣泛搜索學(xué)術(shù)文獻(xiàn)的簡便方法。您可以從一個位置搜索眾多學(xué)科和資料來源:來自學(xué)術(shù)著作出版商、專業(yè)性社團(tuán)、預(yù)印本、各大學(xué)及其他學(xué)術(shù)組織的經(jīng)同行評論的文章、論文、圖書、摘要和文章。Google學(xué)術(shù)搜索可幫助您在整個學(xué)術(shù)領(lǐng)域中確定相關(guān)性最強(qiáng)的研究。
Googlescholar的訪問方式Googlescholar的訪問方式http:///Googlescholar的主界面Googlescholar高級檢索自由詞、句題名作者名刊名出版時間舉例檢索刊登在“中華病理學(xué)雜志”上,2000以來,題名含有SARS的學(xué)術(shù)資料檢索結(jié)果被引次數(shù)演示點擊題名的顯示結(jié)果小結(jié)將Googlescholar作為跨庫檢索平臺Googlescholar提供引用次數(shù)可作為重要的學(xué)術(shù)評價參考數(shù)據(jù)Googlescholar的“圖書館搜索”便于館際互借Googlescholar的相關(guān)文獻(xiàn)及被引文獻(xiàn)可作為重要的相關(guān)文獻(xiàn)查找方法。CNKI知識搜索
http:///搜索引擎使用中的注意事項選擇合適的搜索引擎應(yīng)該使用新浪還是搜狐?Google還是百度?分析你的需求,比較不同搜索引擎的強(qiáng)項和弱點,然后為這次搜索選擇最適合的搜索工具。合理使用各種運算符
“
”
短語檢索。
AND/OR/NOT邏輯運算符通配符 *?各個搜索引擎在支持運算方面不盡相同,表示方法上也不完全一樣。搜索引擎使用中的注意事項充分利用各搜索引擎的特色檢索如:Google的文件類型檢索、URL檢索、圖像檢索 百度的MP3檢索、FLASH檢索搜索引擎使用中的注意事項根據(jù)檢索結(jié)果不斷調(diào)整檢索策略 選擇更恰當(dāng)?shù)臋z索詞。 如果是太多,可以利用邏輯運算限定檢索。如果檢索結(jié)果太少或沒有,則可能需要減少檢索詞數(shù)量甚至更換檢索詞重新檢索。搜索引擎使用中的注意事項多積累,多總結(jié)每次成功檢索后可略作一些分析和小結(jié)。 對網(wǎng)絡(luò)資源特點作較深的了解。搜索引擎使用中的注意事項搜索引擎中常見的錯誤錯誤1:錯別字經(jīng)常發(fā)生的一種錯誤是,你輸入的關(guān)鍵詞含有錯別字。筆者所做的統(tǒng)計表明,常有大量的錯誤搜索,光一個謝霆鋒就有“謝霆鋒”、“謝庭鋒”、“謝霆峰”、“謝廷鋒”、“謝庭峰”、“謝廷峰”6種查法,還有什么“星際爭吧”、“以德制國”之類的,這樣的關(guān)鍵詞能搜索到什么有用資料嗎?所以每當(dāng)你覺得某種內(nèi)容網(wǎng)上應(yīng)該有不少、卻搜索不到結(jié)果時,你應(yīng)該先查一下是否有錯別字。搜索引擎中常見的錯誤錯誤2:關(guān)鍵詞太常見
如,搜索“電話”,有無數(shù)網(wǎng)站提供跟“電話”相關(guān)的信息,從網(wǎng)上黃頁到電話零售商到個人電話號碼都有。所以當(dāng)搜索結(jié)果太多太亂的時候,你應(yīng)該嘗試使用更多的關(guān)鍵詞或者減號來搜索,不使用過于通用的詞匯來搜索,設(shè)計一個類似“上海常用電話”這樣特殊的搜索關(guān)鍵詞,會給你真正有用的結(jié)果。搜索引擎中常見的錯誤錯誤3:多義詞的使用
要小心使用多義詞,比如搜索“Java”,你要找的信息究竟是太平洋上的一個島、一種著名的咖啡、還是一種計算機(jī)語言?搜索引擎是不能理解辨別多義詞的。最好的解決辦法是,在搜索之前先問自己這個問題,然后用短語、用多個關(guān)鍵詞或者用其他的詞語來代替多義詞作為搜索關(guān)鍵詞。比如用“爪哇印尼”、“爪哇咖啡”、“Java語言”分別搜索可以滿足不同的需求。
搜索引擎中常見的錯誤錯誤4:在不支持自然語言查詢的搜索引擎中使用自然語言查詢
搜索失敗的另一個常見原因是類似這樣的搜索:“現(xiàn)代愛情故事歌詞”、“信息早報在濟(jì)南發(fā)行情況”、“羚羊車的各種圖案”、“上海到成都列車時刻表”。應(yīng)該這樣搜索:“現(xiàn)代愛情故事歌詞”、“信息早報濟(jì)南發(fā)行”、“鈴羊車圖案”“上海成都列車時刻表”。搜索引擎中常見的錯誤錯誤5:在錯誤的地方搜索
2001年7月23日這一天,正逢高考發(fā)榜,各大搜索引擎竟有超過100萬次以上的搜索跟高考查分有關(guān)??忌鷤儾恢?,搜索引擎從抓取網(wǎng)頁、解析、索引到提供檢索是有一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 免疫性疾病的飲食輔助
- 遼寧省2025秋九年級英語全冊Unit5Whataretheshirtsmadeof課時6SectionB(3a-SelfCheck)課件新版人教新目標(biāo)版
- 2025年濕電子化學(xué)品項目發(fā)展計劃
- 干性皮膚的清潔與保養(yǎng)方法
- 腹瀉的藥物治療與護(hù)理配合
- 術(shù)前焦慮的識別與干預(yù)策略
- 護(hù)理實踐中的問題解決與決策制定
- 心臟瓣膜疾病的護(hù)理與跨學(xué)科合作
- 子宮肉瘤患者的日常護(hù)理
- 體位引流護(hù)理的社區(qū)推廣應(yīng)用
- 物流金融風(fēng)險管理
- 國開24273丨中醫(yī)藥學(xué)概論(統(tǒng)設(shè)課)試題及答案
- 國家開放大學(xué)電大《當(dāng)代中國政治制度(本)》形考任務(wù)4試題附答案
- 河道臨時圍堰施工方案
- 2025年廣東省公需課《人工智能賦能制造業(yè)高質(zhì)量發(fā)展》試題及答案
- 有機(jī)肥可行性研究報告
- 2025年-基于華為IPD與質(zhì)量管理體系融合的研發(fā)質(zhì)量管理方案-新版
- 法律職業(yè)資格考試客觀題(試卷一)試卷與參考答案(2025年)
- 腹壁下動穿支課件
- 廣西協(xié)美化學(xué)品有限公司年產(chǎn)7400噸高純有機(jī)過氧化物項目環(huán)評報告
- 智慧樹知道網(wǎng)課《艾滋病、性與健康》課后章節(jié)測試答案
評論
0/150
提交評論