網(wǎng)絡(luò)信息檢索概述(2012研)課件_第1頁
網(wǎng)絡(luò)信息檢索概述(2012研)課件_第2頁
網(wǎng)絡(luò)信息檢索概述(2012研)課件_第3頁
網(wǎng)絡(luò)信息檢索概述(2012研)課件_第4頁
網(wǎng)絡(luò)信息檢索概述(2012研)課件_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、網(wǎng)絡(luò)信息檢索文獻(xiàn)檢索教研室馮勤2012.09主要內(nèi)容一、Internet基礎(chǔ)二、網(wǎng)絡(luò)信息資源三、Web檢索工具一、Internet基礎(chǔ) Internet歷史與發(fā)展(因特網(wǎng)、國際互聯(lián)網(wǎng))1. ARPANet (1969年,美國國防部研制)2. NSFNet(1985年美國國家科學(xué)基金會建立,1989年取代ARPANet)3. Internet(1990年后迅速普及全球)1.Internet的入網(wǎng)方式1.通過局域網(wǎng)方式(校園網(wǎng))2.通過ISP接入( ISP是提供Internet入網(wǎng)服務(wù)的機(jī)構(gòu))撥號接入:計算機(jī)、Modem、電話線、ISP 帳號。 (ADSL)專線接入:租用數(shù)據(jù)專線或光纜、DDN等以

2、及配套網(wǎng)絡(luò)設(shè)備。3.無限上網(wǎng)(wifi)2.Internet 的管理1.TCP/IP協(xié)議:是計算機(jī)網(wǎng)絡(luò)協(xié)議中最核心的兩個協(xié)議。TCP是傳輸控制協(xié)議,處理由于路徑不同及其它可能原因造成的數(shù)據(jù)包顛倒、數(shù)據(jù)丟失、數(shù)據(jù)失真等問題。IP是網(wǎng)際協(xié)議,利用路由算法解決路由選擇的問題。查看自己的IP2.IP地址和域名DN : IP地址是Internet上每臺主機(jī)和用戶終端的識別標(biāo)識。 IP地址在全球范圍內(nèi)都是唯一的。 IP地址一般由用 “”分開的4組十進(jìn)制數(shù)字組成,每段數(shù)字取值范圍為0-255。IP地址的表示:23.常用網(wǎng)絡(luò)名:com(商業(yè)機(jī)構(gòu))、edu(教育機(jī)構(gòu))、mil(軍事部門)、gov(政府部門)、o

3、rg(非盈利組織)、net(網(wǎng)絡(luò)服務(wù)商)最高域名:cn(中國)、uk(英國)、jp(日本)美國享有國家域名默認(rèn)權(quán)。Internet 提供的主要服務(wù)電子郵件服務(wù)( E-mail)文件傳輸服務(wù)(FTP)遠(yuǎn)程登錄(Telnet)電子論壇( Electronic Forum )WWW信息查詢服務(wù)Internet 提供的主要服務(wù)電子郵件服務(wù)( E-mail)E-mail地址格式:用戶名電子郵件服務(wù)器名如:郵件服務(wù)器使用的2個協(xié)議:SMTP(簡單郵件傳輸協(xié)議):用于發(fā)送郵件POP3(郵局協(xié)議):用于接收郵件WWW組成瀏覽器(Browser): 如:IE、360、火狐、谷歌、搜狗、QQ瀏覽器等Web服務(wù)器(

4、Web Server):提供信息和服務(wù)的高性能計算機(jī)。超文本傳輸協(xié)議(HTTP):是Web客戶機(jī)與Web服務(wù)器之間的應(yīng)用層傳輸協(xié)議??蛻魴C(jī)/服務(wù)器(client/server)模式服務(wù)器:是指向全球Internet用戶提供信息和服務(wù)的高性能計算機(jī),包括Web服務(wù)器、郵件服務(wù)器、文件傳輸服務(wù)器??蛻魴C(jī):是指連接在服務(wù)器上的工作站(網(wǎng)絡(luò)終端)??蛻魴C(jī)通過有關(guān)程序(如瀏覽器等)向服務(wù)器發(fā)出指令或請求(URL),服務(wù)器進(jìn)行處理后將結(jié)果返回。二、網(wǎng)絡(luò)信息資源(教材P37)1.數(shù)據(jù)庫資源(中外數(shù)據(jù)庫等)2.電子出版物(電子圖書、電子期刊、電子報紙)3.聯(lián)機(jī)館藏目錄(包括網(wǎng)上數(shù)字圖書館)4.網(wǎng)上參考工具書5

5、.網(wǎng)上動態(tài)信息:電子郵件、電子公告、在線論壇、新聞組等6. 網(wǎng)絡(luò)資源指南和搜索引擎維普中文科技期刊數(shù)據(jù)庫(VIP)中國知網(wǎng)數(shù)據(jù)庫(CNKI)萬方數(shù)據(jù)庫超星數(shù)字圖書館讀秀中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(CBM)中文生物醫(yī)學(xué)期刊數(shù)據(jù)庫(CMCC )MEDLINE/PubMed(美國生物醫(yī)學(xué)數(shù)據(jù)庫)EBSCOOVID1. 數(shù)據(jù)庫資源數(shù)據(jù)庫訪問注意網(wǎng)絡(luò)數(shù)據(jù)庫可以在網(wǎng)上免費檢索,但只有在校園網(wǎng)內(nèi)可以查看已購資源的全文。校外用戶可以在網(wǎng)管申請VPN訪問鏡像資源。數(shù)據(jù)庫有遠(yuǎn)程與本地鏡像兩種鏈接:一般情況下,遠(yuǎn)程訪問的資源內(nèi)容更豐富、更新較快;本地訪問則速度較快,一般以內(nèi)網(wǎng)IP地址顯示。各種試用數(shù)據(jù)庫有試用期,一般1

6、月,或更長期限。有的有IP限制,或給出登錄賬號。請隨時關(guān)注圖書館主頁公告。數(shù)據(jù)庫檢索注意事項數(shù)據(jù)庫的選擇(收錄年限、學(xué)科范圍、數(shù)據(jù)量、文獻(xiàn)類型)檢索詞的確定(主題標(biāo)引)檢索途徑的選?。宏P(guān)鍵詞途徑、主題詞途徑、分類途徑等不同檢索功能的應(yīng)用檢索結(jié)果的選取、著錄原文的下載和閱讀(參見文獻(xiàn)傳遞服務(wù))2. 電子期刊(Electronic Journal)(1)數(shù)據(jù)庫型電子期刊:維普、萬方、CNKI、Elsevier、SpringerLink、EBSCO、OVID等;(2)網(wǎng)站型期刊:Nature、Science、中國科學(xué)系列雜志、中國科技論文在線等;(3)簡短型期刊:學(xué)術(shù)性內(nèi)容較少,主要是娛樂、計算機(jī)、

7、股市、英語、商業(yè)等方面。如IEbook 、ZCOM、POCO。電子期刊的查找1.電子期刊全文數(shù)據(jù)庫。2.網(wǎng)絡(luò)數(shù)據(jù)庫提供的期刊鏈接服務(wù):如PubMed的期刊鏈接,free full text。3.網(wǎng)上虛擬圖書館:國內(nèi)外許多大學(xué)圖書館和公共圖書館的網(wǎng)站提供電子期刊鏈接。4.商業(yè)出版社或代理商網(wǎng)址。5.搜索引擎:輸入要查找期刊或論文的關(guān)鍵詞,或利用搜索引擎提供的“Journal”類目。 HighWire Press(/)是提供免費全文的、全球最大的學(xué)術(shù)文獻(xiàn)出版商之一,于1995年由美國斯坦福大學(xué)圖書館創(chuàng)立。學(xué)科覆蓋范圍:生命科學(xué)、醫(yī)學(xué)、物理學(xué)、社會科學(xué)等。Directory of Open Acce

8、ss Journals (DOAJ ) 是專門OA期刊文獻(xiàn)檢索系統(tǒng),是由瑞典Lund大學(xué)圖書館創(chuàng)建和維護(hù)的一個開放獲取期刊目錄數(shù)據(jù)庫。該系統(tǒng)收錄期刊的文章都是經(jīng)過同行評議或嚴(yán)格評審的,包括很多SCI收錄的期刊。具有免費、全文、高質(zhì)量的特點。該系統(tǒng)提供主題檢索、期刊瀏覽以及學(xué)科主題目錄等功能。按刊名或關(guān)鍵詞查找 專門提供免費全文醫(yī)學(xué)期刊服務(wù)的網(wǎng)站,目前提供3300多種免費電子醫(yī)學(xué)期刊,可以通過主題、字母順序、語種進(jìn)行瀏覽(標(biāo)注有時限的全文期刊)。 用戶可參加該站點的通訊組。只要選擇主題,確定想要的期刊,填寫有關(guān)表格,就可以及時方便地得到所定制的相關(guān)信息。的服務(wù)包括每周向用戶發(fā)最新出版物的目錄、個

9、人主頁一周更新的信息(所定制期刊的文摘)、過去年相關(guān)期刊的醫(yī)學(xué)文獻(xiàn)概況等,所有服務(wù)都是免費的。/PubMed Central (/)NLM建立的生命科學(xué)電子期刊全文數(shù)據(jù)庫。目前有250萬篇全文。加入PMC的期刊已有1148種期刊,還有200多種NIH基金合作期刊,以及1800多種選擇性免費的期刊。免費全文訪問的時間延遲是出版后0-24個月。PMC 的所有論文在 PubMed 中都有相應(yīng)的記錄,并且直接鏈接全文。BioMedCentral(/)BioMed Central是一家獨立出版社,致力于提供生物醫(yī)學(xué)文獻(xiàn)的開放獲取(Open Access )。收錄200多種OA期刊,主題涵蓋生命科學(xué)領(lǐng)域。

10、所有期刊都經(jīng)同行評審。提供大量不同的雜志和其他服務(wù) 。3. 電子圖書(E-Book )(1)通過個人網(wǎng)站獲?。唬?)通過公益性網(wǎng)站:圖書情報機(jī)構(gòu)、學(xué)校、教育、政府網(wǎng)站(3)通過商業(yè)性網(wǎng)站:超星、北大方正、書生之家。 我館的電子圖書: 超星數(shù)字圖書館、 方正Apabi電子書、 讀秀知識庫(可申請文獻(xiàn)傳遞) 金圖國際外文原版數(shù)字圖書館(注:電子圖書均需安裝相應(yīng)的閱讀器)選擇要查找的圖書所在的分類,點擊分類選項逐層進(jìn)入二級分類、三級分類等,直至顯示書目列表。在初級檢索欄中輸入檢索關(guān)鍵詞,選擇檢索字段。點擊“檢索”鍵便可以檢索了。兩種閱讀方式在未選擇閱讀方式時,只提供了圖書前17頁的瀏覽閱讀。 選擇I

11、E閱讀、閱覽器閱讀兩種方式可以全文閱讀。 在第一次使用IE閱讀時,需先下載安裝插件;在進(jìn)行閱覽器閱讀時需先下載安裝超星4.0版本的閱覽器。隨書光盤是指在印刷型圖書中夾帶的光盤。目前圖書館提供隨書光盤的網(wǎng)絡(luò)下載和閱讀。館藏資源:查詢到相應(yīng)的圖書,查看其隨書光盤,有鏈接即可下載。館藏圖書查詢4.網(wǎng)上虛擬圖書館國家科技圖書文獻(xiàn)中心(NSTL)/由科技部聯(lián)合有關(guān)部委于2000年6月12日組建的一個虛擬的科技文獻(xiàn)信息服務(wù)機(jī)構(gòu),成員單位包括中國科學(xué)院文獻(xiàn)情報中心、工程技術(shù)圖書館、中國農(nóng)業(yè)科學(xué)院圖書館、中國醫(yī)學(xué)科學(xué)院圖書館等。NSTL現(xiàn)收藏理、工、農(nóng)、醫(yī)各類科技文獻(xiàn),包括期刊、圖書、會議論文、學(xué)位論文、科技

12、報告等類型,其中中文現(xiàn)期科技期刊近4000種,外文科技期刊15000種,所訂購?fù)馕奈墨I(xiàn)占國內(nèi)引進(jìn)相應(yīng)文獻(xiàn)品種總數(shù)的60%以上 。文獻(xiàn)檢索、全文傳遞服務(wù)全文文獻(xiàn)(開放獲?。╅_放獲取期刊圖書館資源導(dǎo)航三、Web檢索工具Web檢索工具是指提供萬維網(wǎng)信息資源查詢的專門站點或服務(wù)器。Web檢索工具的工作原理對采集到的網(wǎng)頁信息數(shù)據(jù), Robot等會自動抽取表達(dá)網(wǎng)頁主題意義的詞作為關(guān)鍵詞來構(gòu)建數(shù)據(jù)庫索引。有的網(wǎng)絡(luò)檢索工具同時采用人工標(biāo)引。利用網(wǎng)絡(luò)自動搜索軟件Robot或Spider,以一個URL清單為向?qū)Вㄆ趯nternet上的網(wǎng)頁進(jìn)行掃描搜索,記錄下網(wǎng)頁的有關(guān)事項。信息采集數(shù)據(jù)標(biāo)引數(shù)據(jù)組織檢索功能We

13、b檢索工具的工作原理標(biāo)引后的網(wǎng)頁數(shù)據(jù)形成檢索工具數(shù)據(jù)庫中的一條條記錄,每條記錄對應(yīng)于一個網(wǎng)站或一個網(wǎng)頁。記錄內(nèi)容包括網(wǎng)頁標(biāo)題、摘要或關(guān)鍵詞、網(wǎng)址、網(wǎng)站網(wǎng)頁與輸入關(guān)鍵詞的相關(guān)程度等 。布爾算符檢索(AND + 、OR、NOT -),截詞檢索,詞組檢索 ,自然語言檢索、概念檢索、分類瀏覽,檢索限定,語種翻譯,自動排序等。數(shù)據(jù)標(biāo)引數(shù)據(jù)組織檢索功能信息采集Web檢索工具的類型按信息內(nèi)容的組織方式劃分:1.目錄式檢索工具2.搜索引擎按專業(yè)范疇劃分:1.綜合性搜索引擎2.專業(yè)性搜索引擎按檢索功能劃分:1.獨立搜索引擎2. 元搜索引擎(集成搜索引擎)目錄式檢索工具以分類目錄檢索為主,接受網(wǎng)站推薦,人工參與網(wǎng)

14、頁信息的篩選標(biāo)引。優(yōu)點:系統(tǒng)、層次清楚缺點:人工實現(xiàn),搜索站點少,更新慢代表:Yahoo!、搜狐兩種基本類型:1.學(xué)術(shù)性專業(yè)目錄:由主題專家日常建立和維護(hù)。2.商業(yè)目錄:為普通大眾和商人服務(wù)。搜索引擎 (search engine)由計算機(jī)檢索程序(Spider/Robot)自動搜索采集網(wǎng)頁信息,自動標(biāo)引。優(yōu)點:數(shù)據(jù)量大,關(guān)鍵詞檢索功能強(qiáng)。缺點:過于繁多,不夠準(zhǔn)確典型:AltaVista, Excite 等 中文:天網(wǎng)、悠游、北極星 特別提示:多數(shù)檢索工具同時具有關(guān)鍵詞檢索和目錄瀏覽功能。網(wǎng)頁檢索與網(wǎng)站查詢網(wǎng)頁檢索:通過關(guān)鍵詞查找具體的文章、新聞、數(shù)據(jù)、事實等信息。(主題檢索途徑)網(wǎng)站查詢:通

15、過瀏覽主題目錄(Directory)層層深入,逐步縮小主題,最終獲取信息。適合查找相關(guān)領(lǐng)域重要學(xué)術(shù)站點等專業(yè)網(wǎng)站。(分類檢索途徑)常用通用搜索引擎Yahoo!()Google()百度()搜狐()新浪()網(wǎng)易()/Yahoo!(雅虎)是最早最著名的目錄型檢索工具,在全球共有24個網(wǎng)站,支持38種語言版本。(參見中國雅虎)注:網(wǎng)站目錄檢索功能比較適用于學(xué)科專業(yè)的重要網(wǎng)站查找。Yahoo分類目錄瀏覽/Health/.hk/ 兩位斯坦福大學(xué)的博士生 Larry Page 和 Sergey Brine 在 1998 年創(chuàng)立了 Google。2000年投入商業(yè)運營。2006年啟用中國域名。2010年3月退

16、出中國,搜索服務(wù)由中國內(nèi)地轉(zhuǎn)至香港。Google特點提供搜索引擎功能,速度極快。提供80 億個網(wǎng)址的檢索,搜索引擎中排名第一。支持多語種搜索;包括簡體和繁體中文;具有“手氣不錯”、“網(wǎng)頁快照”、圖片搜索、新聞組搜索等功能;具有強(qiáng)大的翻譯功能 可對字詞、網(wǎng)頁進(jìn)行翻譯;界面非常簡潔。運算符:空格表示邏輯“與”;減號“”表示邏輯“非”;“OR”表示邏輯“或”;對短語或句子搜索時必須加英文引號。高級搜索Google Scholar()Google Scholar專門用于檢索學(xué)術(shù)文獻(xiàn),涉及醫(yī)藥、物理、經(jīng)濟(jì)以及計算機(jī)科學(xué)等多個領(lǐng)域,可以檢索到網(wǎng)上與輸入的檢索詞相關(guān)的學(xué)術(shù)性期刊論文、圖書、學(xué)位論文、預(yù)印本(

17、preprint)、科技報告、文摘等。也可以查找不同的學(xué)術(shù)出版商、專業(yè)學(xué)/協(xié)會、預(yù)印本倉儲、大學(xué)主頁等。中文Web檢索工具百度搜狐 新浪網(wǎng)易 百度1999年底成立于美國硅谷,2000年回國發(fā)展。百度是全球最大的中文搜索引擎,支持搜索10億的中文網(wǎng)頁,中國所有提供搜索引擎的門戶網(wǎng)站中,超過80%以上都由百度提供搜索引擎技術(shù)支持。2012年福布斯全球富豪榜,百度公司首席執(zhí)行官李彥宏以102億美元(約643.6億人民幣)身價,再次成為中國國內(nèi)首富。百度():對檢索的文獻(xiàn)類型進(jìn)行限定,例:filetype:doc/ppt/pdf/txt * 檢索出來的資料就全部是word/ppt/pdf/txt格式的

18、資料,并且排除不相關(guān)的網(wǎng)頁、網(wǎng)站信息,檢索結(jié)果相關(guān)度提高很多。支持邏輯關(guān)系組配搜索:空格或“+”表示邏輯“與”; “|”表示邏輯“或”;減號“-”表示邏輯“非”(注意符號前后要求留的空格)支持用“ ”表示的短語強(qiáng)制搜索。專業(yè)文檔搜索/醫(yī)學(xué)搜索引擎Medscape(醫(yī)景): http:/Medical Matrix (醫(yī)源): http:/Medical world search(醫(yī)學(xué)世界檢索): http:/HealthFinder :http:/Medwebplus:http:/Health A to Z:Medscape 簡介:共收藏了近20個臨床學(xué)科2.5萬篇文獻(xiàn),是Web 上最大的免費提供臨床醫(yī)學(xué)全文文獻(xiàn)和繼續(xù)醫(yī)學(xué)教育資源的網(wǎng)點。特點:可檢索圖像、聲頻、視頻資料。同時可搜索Me

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論