版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
參考書1于雙城等,科技信息檢索與利用,北京:清華大學(xué)出版社,20122于光等,信息檢索,哈爾濱:電子工業(yè)出版社,20103徐慶寧等,信息檢索與利用,上海:華東理工大學(xué)出版社,20044符紹宏等,因特網(wǎng)信息資源檢索與利用,北京:清華大學(xué)出版社,2000成績?cè)u(píng)定方法1上課考勤占30%2檢索實(shí)習(xí)作業(yè)70%第一頁,共112頁。
教學(xué)大綱1、計(jì)算機(jī)信息檢索基礎(chǔ)知識(shí)(2個(gè)學(xué)時(shí))2、國外兩大文摘數(shù)據(jù)庫的檢索與利用(2個(gè)學(xué)時(shí))3、引文索引及其檢索方法(2個(gè)學(xué)時(shí))4、特種文獻(xiàn)資源的檢索與利用(2個(gè)學(xué)時(shí))5、專利文獻(xiàn)信息資源的檢索與利用(2個(gè)學(xué)時(shí))6、外文全文數(shù)據(jù)庫的檢索與利用(2個(gè)學(xué)時(shí))第二頁,共112頁。
學(xué)習(xí)文獻(xiàn)檢索課的目的信息檢索既是一門科學(xué),又是一門技巧,在某種程度上也是一門藝術(shù)。1、拓寬獲取與利用信息的途徑。2、可以獲取學(xué)術(shù)動(dòng)態(tài),尋找未知問題的答案。
3、寫論文、做課題能積極主動(dòng)有意識(shí)地利用信息。4、培養(yǎng)從主要記憶信息到主要應(yīng)用信息和創(chuàng)新信息的能力。以最少的時(shí)間、精力獲取自己需要的信息第三頁,共112頁。學(xué)習(xí)文獻(xiàn)檢索課的目的Whereisit?第四頁,共112頁。獲取信息的總路線第五頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)計(jì)算機(jī)信息檢索的常用方法與步驟我館引進(jìn)資源總體介紹網(wǎng)絡(luò)搜索引擎的利用
計(jì)算機(jī)信息檢索基礎(chǔ)知識(shí)第六頁,共112頁??萍嘉墨I(xiàn)的定義記錄有科技信息知識(shí)的紙張、膠片、磁帶、磁盤、光盤以及一些網(wǎng)絡(luò)資源,稱為科技文獻(xiàn)。
計(jì)算機(jī)信息檢索技術(shù)第七頁,共112頁。文獻(xiàn)的類型
按文獻(xiàn)的出版形式劃分(1)科技圖書(6)科技報(bào)告(2)科技期刊(7)標(biāo)準(zhǔn)文獻(xiàn)(3)會(huì)議文獻(xiàn)(8)政府出版物(4)專利文獻(xiàn)(9)科技檔案(5)學(xué)位論文(10)產(chǎn)品樣本第八頁,共112頁。文獻(xiàn)的類型按文獻(xiàn)的出版形式劃分(1)科技圖書
是對(duì)已發(fā)表的科研成果,生產(chǎn)技術(shù)和經(jīng)驗(yàn)總結(jié)性的概括和論述。是存儲(chǔ)和傳播科學(xué)文化知識(shí)的主要載體。閱讀型:教科書(Textbook)、專著(Monograph)、文集(Anthology)等
工具性:
詞典、百科全書及手冊(cè)等著錄格式:(版權(quán)頁)書名、作者、內(nèi)容、出版社、出版時(shí)間、價(jià)格、頁次、ISBN號(hào)特點(diǎn):帶有總結(jié)性、成熟定性(內(nèi)容詳實(shí))傳授知識(shí),而不是報(bào)道最新信息(發(fā)表滯后)
第九頁,共112頁。(2)科技期刊(journal,periodical)
采用統(tǒng)一名稱的周期性出版刊物。
特點(diǎn):名稱固定有連續(xù)的卷、年月順序號(hào)數(shù)量大,內(nèi)容豐富;
出版周期短,報(bào)道速度快;
在科學(xué)家和專家們所利用的全部科技信息中,由期刊提供的占70%左右。期刊是獲取信息的最重要來源。
著錄格式:刊名、卷、期、年、月、頁次、ISSN號(hào)
ISSN1005-1805Vol26No2;V26n2;26(2)
第十頁,共112頁。EI數(shù)據(jù)庫舉例:第十一頁,共112頁。(3)會(huì)議文獻(xiàn)是科技人員在各級(jí)學(xué)術(shù)會(huì)議上,交流科技新成果、新進(jìn)展及發(fā)展趨勢(shì)的討論記錄。特點(diǎn):內(nèi)容新穎、傳遞及時(shí)、針對(duì)性強(qiáng)著錄格式:會(huì)議名稱、會(huì)議地址、會(huì)期、主辦單位。conference(大會(huì))、meeting(小型會(huì)議)、symposium(討論會(huì))、proceeding(會(huì)議錄)、paper(單篇論文)、transaction(學(xué)報(bào)、會(huì)議記錄)等。
IEEE(TheInstituteofElectricalandElectronicEngineers)最大的電子、工程類的專業(yè)技術(shù)學(xué)會(huì),宗旨,召開各種學(xué)術(shù)會(huì)議,主持編輯多種出版物,期刊幾百種,標(biāo)準(zhǔn):1000多個(gè),會(huì)議1000多個(gè)最大的電子、工程類信息源例如:圖書館收藏地點(diǎn)一區(qū)五樓網(wǎng)上萬方和CNKI有專門的會(huì)議論文數(shù)據(jù)庫第十二頁,共112頁。EI中會(huì)議文獻(xiàn)舉例:第十三頁,共112頁。(4)科技報(bào)告是科研成果的總結(jié)或各階段進(jìn)展情況的實(shí)際記錄。有科研項(xiàng)目的研究方案、實(shí)驗(yàn)記錄、實(shí)驗(yàn)數(shù)據(jù)、圖表等。
特點(diǎn):獨(dú)立成冊(cè);內(nèi)容新穎;內(nèi)容詳實(shí)專深;保密性;著錄格式:報(bào)告名稱、年代、順序號(hào)。美國政府四大報(bào)告:PB報(bào)告AD報(bào)告NASA報(bào)告DOE報(bào)告(NTIS、NTRL)PB報(bào)告(美國商務(wù)出版局)PB+年代+順序號(hào)民用工程、科學(xué)技術(shù)、城市規(guī)劃、環(huán)保、生物醫(yī)學(xué)等AD報(bào)告(美國軍事國防部)AD+A(B、C….)+順序號(hào)
A非密公開B非密限制C絕密機(jī)密導(dǎo)彈、火箭、遙感、雷達(dá)、高能燃料等
NASA報(bào)告(美國宇航局)N+年代+順序號(hào)空間動(dòng)力學(xué)、飛行器及結(jié)構(gòu)材料、試驗(yàn)設(shè)備、飛行器制導(dǎo)、航天與宇宙飛行
DOE報(bào)告(美國能源部)DE+年代+順序號(hào)
涉及核能、原子能、核安全、風(fēng)能、電能和能源管理系統(tǒng)的報(bào)告。
第十四頁,共112頁。(5)專利文獻(xiàn)
是一切與專利制度有關(guān)的專利文件的統(tǒng)稱。如專利說明書和專利請(qǐng)求書。專利文獻(xiàn)反映了當(dāng)前最新的技術(shù)成果。
專利文獻(xiàn)識(shí)別:國別代碼+專利號(hào)中國專利:CN97223700.3
美國專利:US6691162第十五頁,共112頁。(6)學(xué)位論文作者為獲取某種學(xué)位而撰寫的論文稱之為學(xué)位論文??煞譃閷W(xué)士、碩士、博士三種形式。著錄格式:學(xué)校名稱、授予學(xué)位學(xué)校、導(dǎo)師姓名、地址時(shí)間、頁次特點(diǎn):碩士、博士論文具有較高的參考價(jià)值一般偏重于理論,附有大量的參考文獻(xiàn),借此可以看出有關(guān)專題的發(fā)展,一般不出版發(fā)行,而是保存在授予單位的圖書館里。萬方中學(xué)位論文全文庫和CNKI中優(yōu)秀博碩論文全文庫PQDT國外博碩論文全文庫第十六頁,共112頁。(7)標(biāo)準(zhǔn)文獻(xiàn)是對(duì)工農(nóng)業(yè)產(chǎn)品及工程建設(shè)的質(zhì)量、規(guī)格及其檢驗(yàn)方法等所做的技術(shù)上的規(guī)定。可劃分為:ISO(國際標(biāo)準(zhǔn))、國家標(biāo)準(zhǔn)、機(jī)構(gòu)和企業(yè)標(biāo)準(zhǔn)著錄格式:標(biāo)準(zhǔn)代號(hào)、種次號(hào)和公布年代(8)政府出版物(略)是各國政府部門及其設(shè)立的專門機(jī)構(gòu)所發(fā)表、出版的文件。(9)科技檔案(略)是科研生產(chǎn)活動(dòng)中形成的有具體事物對(duì)象的技術(shù)文件、圖紙、圖表、照片和原始記錄等的總稱。(10)產(chǎn)品資料(略)是廠商為推銷產(chǎn)品而印發(fā)或放在網(wǎng)站上介紹產(chǎn)品情況的文獻(xiàn),包括產(chǎn)品樣本、產(chǎn)品說明書、產(chǎn)品目錄、廠商介紹等。第十七頁,共112頁。文獻(xiàn)的類型
按文獻(xiàn)的加工程度劃分零次文獻(xiàn):口頭信息、未公開發(fā)表的文字資料(手稿、書信、筆記、博客等);時(shí)效性強(qiáng);大量而無序一次文獻(xiàn):期刊論文、專利文獻(xiàn)、科技報(bào)告、會(huì)議錄等;研究人員最終索取的文獻(xiàn)類型二次文獻(xiàn):檢索工具;如EI、SCI、ISTP等三次文獻(xiàn):選用大量有關(guān)的文獻(xiàn),經(jīng)過綜合、分析、研究而編寫出來的文獻(xiàn)。如:綜述、評(píng)論、評(píng)述、進(jìn)展、動(dòng)態(tài)等;研究人員最終需要的文獻(xiàn)類型
計(jì)算機(jī)信息檢索技術(shù)第十八頁,共112頁。哈爾濱工業(yè)大學(xué)文摘數(shù)據(jù)庫第十九頁,共112頁。哈爾濱工業(yè)大學(xué)全文數(shù)據(jù)庫第二十頁,共112頁。信息檢索的基本概念廣義的信息檢索指將信息按一定的方式組織和存儲(chǔ)起來,并根據(jù)信息用戶的需要找出有關(guān)的信息的過程和技術(shù)。狹義的信息檢索指用戶找出有關(guān)信息的過程。
計(jì)算機(jī)信息檢索技術(shù)第二十一頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)
信息檢索語言
是信息組織與信息檢索時(shí)所用的語言,也稱文獻(xiàn)檢索語言、情報(bào)語言等。第二十二頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)(一)分類檢索語言是按學(xué)科范疇和體系來劃分事物而構(gòu)成的一種檢索語言,集中體現(xiàn)學(xué)科的系統(tǒng)性,反映事物的從屬、派生關(guān)系,由上至下,從總體到局部層層劃分、展開,是一種等級(jí)體系。用分類號(hào)表達(dá)概念廣泛用于圖書資料的是圖書分類法中國圖書分類法中國科學(xué)院圖書分類法杜威十進(jìn)制分類法國際十進(jìn)制分類法第二十三頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)中國圖書館分類法類目簡表5個(gè)基本部類22個(gè)基本大類馬列、毛澤東思想A馬列、毛澤東思想哲學(xué)B哲學(xué)、宗教社會(huì)科學(xué)C社會(huì)科學(xué)總論;D政治、法律;E軍事;F經(jīng)濟(jì)G文化、科學(xué)、教育、體育;H語言、文字;I文學(xué);J藝術(shù);K歷史、地理自然科學(xué)N自然科學(xué)總論;O數(shù)理科學(xué)和化學(xué);P天文學(xué)、地球科學(xué);Q生物科學(xué);R醫(yī)學(xué)、衛(wèi)生;S農(nóng)業(yè)科學(xué)T工業(yè)技術(shù);U交通運(yùn)輸;V航空、航天;X環(huán)境科學(xué)、勞動(dòng)保護(hù)科學(xué)(安全科學(xué))綜合性圖書Z綜合性圖書第二十四頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)(一)分類檢索語言
TV水利工程TK能源與動(dòng)力工程TB一般工業(yè)技術(shù)TB3工程材料學(xué)第二十五頁,共112頁。(二)主題法檢索語言是利用詞語來表達(dá)信息資源中論述的主題概念。用來表達(dá)信息內(nèi)容的詞語稱為主題詞。主題詞:通過文獻(xiàn)內(nèi)容的分析,從中找出那些具有實(shí)質(zhì)意義的,能夠表達(dá)事物特征的,并經(jīng)過規(guī)范化處理的詞或詞組。主題詞表是對(duì)主題詞進(jìn)行規(guī)范化處理的依據(jù),也是文獻(xiàn)處理者和檢索者共同參照的依據(jù)。計(jì)算機(jī)信息檢索技術(shù)第二十六頁,共112頁。關(guān)鍵詞、主題詞的比較計(jì)算機(jī)信息檢索技術(shù)關(guān)鍵詞Keyword主題詞Subject未經(jīng)規(guī)范化的名詞例如:腳踏車、單車土豆、洋芋規(guī)范化的名詞例如:自行車馬鈴薯必須是直接從文獻(xiàn)或標(biāo)題中抽出的詞匯可以是文獻(xiàn)中的詞匯,也可以不是第二十七頁,共112頁。外文文獻(xiàn)調(diào)研是開題前必須做的工作:從文中選詞檢索易漏檢或誤檢由于作者的用詞習(xí)慣不同,會(huì)發(fā)生如下情況:一個(gè)概念會(huì)有多種表示——導(dǎo)致漏檢檢索時(shí)需要收集同義詞,費(fèi)時(shí)麻煩且易漏檢一個(gè)詞可以表示多個(gè)概念——導(dǎo)致誤檢cell細(xì)胞、電池cellwnti檢出的文獻(xiàn)中有solarcell,tumorcells等除了用文中詞匯檢索外:還有無更好的辦法?
第二十八頁,共112頁。Ei的解決方案:對(duì)文獻(xiàn)進(jìn)行主題標(biāo)引采用規(guī)范化詞組對(duì)文獻(xiàn)進(jìn)行主題標(biāo)引做到標(biāo)引詞與概念一一對(duì)應(yīng)標(biāo)引詞源于詞表,故EI的標(biāo)引詞也稱受控詞如“計(jì)算機(jī)層析”這一概念在文中可以有如下表示:CT,computedtomography,computedtomography,computerizedtomography,computerisedtomography,computer-aidedtomograpyEI主題標(biāo)引時(shí),統(tǒng)一表示為“ComputerizedTomography”
第二十九頁,共112頁。Ei同時(shí)采用受控詞和非受控詞進(jìn)行主題標(biāo)引
采用受控詞標(biāo)引—提高主題檢索效率標(biāo)引詞取自敘詞表相應(yīng)字段
EIcontrolledterm,CVEImainheading,MH
非受控詞標(biāo)引字段—解決詞表更新滯后的問題標(biāo)引詞直接取自文中詞,如關(guān)鍵詞及摘要相應(yīng)字段uncontrolledterm,FL第三十頁,共112頁。信息檢索技術(shù)信息檢索技術(shù)是指利用現(xiàn)代信息檢索系統(tǒng),如聯(lián)機(jī)數(shù)據(jù)庫、光盤數(shù)據(jù)庫和網(wǎng)絡(luò)數(shù)據(jù)庫檢索有關(guān)信息而采用的相關(guān)技術(shù),主要信息檢索技術(shù)有:布爾邏輯檢索、截詞檢索、位置檢索、字段限定檢索。計(jì)算機(jī)信息檢索技術(shù)第三十一頁,共112頁。
1.布爾邏輯檢索布爾邏輯檢索算符有以下三種:
(1)邏輯與AND
(2)邏輯或OR
(3)邏輯非NOT計(jì)算機(jī)信息檢索技術(shù)(*)(+)()第三十二頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)1)邏輯與AND(*)邏輯與AND(*):這是一種用于交叉概念或限定關(guān)系的組配,可以縮小檢索范圍,提高查準(zhǔn)率?!纠坎檎摇案邚?qiáng)度低合金鋼”方面的文獻(xiàn),可以將概念分解為:“highstrength”、“l(fā)owalloy”和“steel”三個(gè)基本概念。如用A、B、C三個(gè)圓分別代表“steel”、“highstrength”和“l(fā)owalloy”,則三圓交叉的斜線部分才是三個(gè)檢索詞同時(shí)存在的文獻(xiàn)記錄。第三十三頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)2)邏輯或OR(+)邏輯或OR(+):這是一種用于并列概念的組配,可以擴(kuò)大檢索范圍,避免漏檢,提高了查全率。【例】查找有關(guān)“太陽能”方面的文獻(xiàn),不能確定主題詞用“sun”或“solar”,則采用“或”組配。如用A、B兩圓分別代表“sun”或“solar”,則斜線部分為其中任何一個(gè)詞或兩個(gè)詞同時(shí)存在的文獻(xiàn)記錄。
第三十四頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)3)邏輯非NOT(–)邏輯非NOT(–):用于從原來的檢索范圍中排除不需要的概念或影響檢索結(jié)果的概念。用邏輯非,能夠縮小命中文獻(xiàn)范圍,提高查準(zhǔn)率?!纠坎檎摇安话ê四艿哪茉础钡奈墨I(xiàn),用A、B兩圓分別代表“energy”、“nuclear”,斜線部分從energy中排除了nuclear的文獻(xiàn)。第三十五頁,共112頁。布爾邏輯運(yùn)算的優(yōu)先執(zhí)行順序:Not>And>Or括號(hào)可以改變其執(zhí)行順序三個(gè)邏輯運(yùn)算符和括號(hào)的運(yùn)用可以將檢索詞組配成比較復(fù)雜的邏輯提問式,以滿足復(fù)雜的信息檢索的需要.例如:A*(B+C)第三十六頁,共112頁。2.截詞檢索是將檢索詞在被認(rèn)為合適的地方用截詞符進(jìn)行截?cái)嗟姆椒?。截詞符用?或*表示,前者通常表示有限截?cái)?,后者表示無限截?cái)?。第三十七頁,?12頁。1)后截?cái)嗬巛斎隿omputer*computers,computered,computerize,…輸入computer??computer,computers,computered注意:使用后截?cái)嘤锌赡軝z索出無關(guān)詞匯,尤其是在使用無限后截?cái)鄷r(shí),所選詞干不能太短,否則將造成大量誤檢,或發(fā)生溢出,導(dǎo)致檢索失敗。第三十八頁,共112頁。2)前截?cái)嗬巛斎?computermicrocomputer,minicomputer,computer第三十九頁,共112頁。3)中間截?cái)嗬鏰naly?eanalyze,analysewom?nwoman,women它將截詞符號(hào)置于一個(gè)檢索詞的中間。它對(duì)于解決英、美不同拼法、不規(guī)則的單、復(fù)數(shù)變化等很有用。第四十頁,共112頁。4)前后截?cái)嗬?/p>
*Computer??minicomputers它是將前截?cái)嗪秃蠼財(cái)嘟Y(jié)合使用。第四十一頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)3.位置檢索位置檢索又稱鄰近檢索,用位置算符表示檢索詞之間的位置鄰近關(guān)系。在某種情況下,若不限制詞的位置關(guān)系則會(huì)造成誤檢,影響查準(zhǔn)率。比如:檢索“生物防治”文獻(xiàn),若用檢索式“biological*control”檢索,則會(huì)將“抑制生物”(controlbiological)的文獻(xiàn)也檢索出來,因此,大部分檢索系統(tǒng)設(shè)定了位置算符以確定詞之間的位置關(guān)系。常用的位置算符有以下幾種:(W)算符、(nW)算符、(N)算符、(nN)算符、(S)算符、(F)算符。第四十二頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)1)(W)算符W是With的縮寫,(W)表示其兩側(cè)的檢索詞必須按前后順序出現(xiàn)在記錄中,在兩詞之間不能插入其他詞,只可能有空格或一個(gè)標(biāo)點(diǎn)符號(hào)。(W)算符嚴(yán)密性較強(qiáng),它基本等價(jià)于詞組檢索,可以簡寫為()。例如,online()information()retrieval第四十三頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)2)(nW)算符W是Words的縮寫,n為自然數(shù)。(nW)表示其兩側(cè)的檢索詞之間允許最多插入n個(gè)詞,但它們之間的位置不能顛倒。如laser(1W)printer可檢出“l(fā)aserprinter”、“l(fā)asercolourprinter”和“l(fā)aserandprinter”第四十四頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)3)(N)算符N是near的縮寫,(N)表示其兩側(cè)的檢索詞必須彼此相鄰,并且這兩個(gè)檢索詞的次序任意。如factory(N)automation可檢出factoryautomation和automationfactory的信息。4)(nN)算符表示在其兩側(cè)的檢索詞之間允許最多插入n個(gè)單詞,且兩詞詞序可以改變。如information(1N)retrieval可檢出informationretrieval或retrievalofinformation的信息第四十五頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)5)(S)算符S是subfield的縮寫,(S)表示其兩側(cè)的檢索詞必須出現(xiàn)在同一子字段,即一個(gè)句子或短語中,詞序不限,并且夾在其間的詞量不限。例如,computer(S)application只要computer和application
在一個(gè)句子或短語中即為命中文獻(xiàn)。第四十六頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)6)(F)算符F是field的縮寫,(F)表示其兩側(cè)的檢索詞必須出現(xiàn)在同一個(gè)字段中,如篇名字段、敘詞字段、文摘字段等,詞序不限,并且夾在其間的詞量不限。例如,Pollution(F)control表示一篇標(biāo)題為ControlandManagementofIndustrialPollution的文獻(xiàn)記錄為命中文獻(xiàn)。第四十七頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)4.字段限定檢索字段限定檢索是利用檢索字段符來限定檢索字段,即指定檢索詞在記錄中出現(xiàn)的字段。檢索字段符分為兩類,即后綴方式和前綴方式。前者對(duì)應(yīng)于基本索引,反映文獻(xiàn)的主題內(nèi)容;后者對(duì)應(yīng)于輔助索引,反映文獻(xiàn)的外部特征。第四十八頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)4.字段限定檢索1)后綴方式后綴方式在檢索詞后加上指定檢索字段的后綴字段代碼,反映文獻(xiàn)的主題內(nèi)容。常用的代碼有/TI(篇名)、/AB(文摘)、/DE(敘詞)。例如,information()retrieval/TI表示僅在TI字段中檢索information()retrieval。第四十九頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)4.字段限定檢索2)前綴方式前綴方式是在檢索詞之前加上指定檢索字段的前綴字段代碼,反映文獻(xiàn)的外部特征。常用的代碼有AU=(作者)、ISBN=(ISBN號(hào))、CC=(分類號(hào)或類目名稱)、CD=(會(huì)議日期)、CS=(機(jī)構(gòu)名稱)、DT=(文獻(xiàn)類型)、JN=(刊名)、PY=(出版年)等。第五十頁,共112頁。第五十一頁,共112頁。計(jì)算機(jī)信息檢索技術(shù)2)前綴方式例如,AU=Liu,MingzhuANDCS=(HarbinInstituteofTechnology)表示查找哈爾濱工業(yè)大學(xué)的劉明珠老師發(fā)表的文獻(xiàn)。
第五十二頁,共112頁。計(jì)算機(jī)信息檢索的
常用方法與步驟1、信息檢索方法基于數(shù)據(jù)庫的常用檢索方法:計(jì)算機(jī)檢索方法沒有固定模式,常用的可以歸納為以下幾種:
(1)基本檢索(快速檢索、簡單檢索):是一種最簡單的檢索方法,多數(shù)數(shù)據(jù)庫只提供一個(gè)檢索框且只能輸一詞或一個(gè)詞組檢索,但也有的數(shù)據(jù)庫可對(duì)兩詞或多詞進(jìn)行邏輯組配檢索。第五十三頁,共112頁。計(jì)算機(jī)信息檢索的
常用方法與步驟基于數(shù)據(jù)庫的常用檢索方法:(2)高級(jí)檢索:用戶可通過點(diǎn)選檢索系統(tǒng)給定的檢索字段對(duì)多詞進(jìn)行邏輯組配。高級(jí)檢索提供的檢索框也較多,一般一個(gè)檢索框只能輸一詞或一個(gè)詞組,檢索框經(jīng)??刂圃?-5個(gè)。第五十四頁,共112頁。計(jì)算機(jī)信息檢索的
常用方法與步驟基于數(shù)據(jù)庫的常用檢索方法:(3)專業(yè)檢索:一般只有一個(gè)大檢索框,要求用戶自己輸詞、字段、檢索算符進(jìn)行組配檢索。要求用戶有熟練的檢索技術(shù)。(4)分類檢索:一般按分類表進(jìn)行限定檢索,或按學(xué)科進(jìn)行一級(jí)一級(jí)瀏覽。(5)二次檢索:是在以上單項(xiàng)檢索的基礎(chǔ)上,進(jìn)一步選用新詞進(jìn)行縮小范圍的檢索。第五十五頁,共112頁。第五十六頁,共112頁。計(jì)算機(jī)信息檢索的
常用方法與步驟
2、信息檢索步驟第五十七頁,共112頁。圖書館引進(jìn)全部電子資源的總體介紹
第五十八頁,共112頁。第五十九頁,共112頁。哈爾濱工業(yè)大學(xué)文摘數(shù)據(jù)庫第六十頁,共112頁。哈爾濱工業(yè)大學(xué)全文數(shù)據(jù)庫第六十一頁,共112頁。外文數(shù)據(jù)庫一般由3種機(jī)構(gòu)出版(1)大、中型專業(yè)出版公司如世界著名的Elsevier(愛思唯爾)出版公司、JohnWiley&Sons出版公司、Springer出版公司、劍橋大學(xué)出版社等(2)專業(yè)學(xué)協(xié)會(huì)如美國航空航天學(xué)會(huì)(AIAA)、美國電子電器工程師學(xué)會(huì)(IEEE)、英國皇家物理學(xué)會(huì)(IOP)等。(3)專門從事數(shù)據(jù)庫制作和銷售的數(shù)據(jù)庫商如EBSCO公司、ProQuest公司等;自己沒有出版物,但他們買出版公司的產(chǎn)品,然后建立檢索平臺(tái)供讀者檢索,例如iGroup公司建立了Scitation平臺(tái),在上面可以看到AIP(美國物理學(xué)會(huì))、ASME(美國機(jī)械工程師協(xié)會(huì))等幾十個(gè)專業(yè)學(xué)協(xié)會(huì)的電子期刊。第六十二頁,共112頁。第六十三頁,共112頁。第六十四頁,共112頁。學(xué)術(shù)資源發(fā)現(xiàn)簡單檢索第六十五頁,共112頁。高級(jí)檢索第六十六頁,共112頁。"liquidbearing"第六十七頁,共112頁。第六十八頁,共112頁。擴(kuò)展館藏之外的檢索結(jié)果第六十九頁,共112頁。第七十頁,共112頁。第七十一頁,共112頁。檢索結(jié)果處理第七十二頁,共112頁。第七十三頁,共112頁。第七十四頁,共112頁。輸入檢索詞第七十五頁,共112頁。第七十六頁,共112頁。第七十七頁,共112頁。第七十八頁,共112頁。第七十九頁,共112頁。網(wǎng)絡(luò)搜索引擎的利用1.網(wǎng)絡(luò)信息資源的特點(diǎn)數(shù)據(jù)量大、傳播廣泛檢索方便、成本低廉內(nèi)容豐富、形式多樣分散無序、缺乏管理分布不均、質(zhì)量不一第八十頁,共112頁。網(wǎng)絡(luò)信息資源2、搜索引擎檢索和利用1)搜索引擎的產(chǎn)生是為了解決從海量信息中搜索所需信息的需求而出現(xiàn)的工具。搜索引擎就是指互聯(lián)網(wǎng)上專門提供查詢服務(wù)的網(wǎng)站。這些網(wǎng)站通過復(fù)雜的網(wǎng)絡(luò)搜索系統(tǒng),將互聯(lián)網(wǎng)上大量網(wǎng)站頁面收集到一起,而能夠?qū)τ脩籼岢龅母鞣N查詢作出響應(yīng),提供給用戶所需要的信息。第八十一頁,共112頁。搜索引擎檢索式的構(gòu)成常用限定代碼網(wǎng)站:site文檔:filetype標(biāo)題:intitle鏈接:link檢索詞+限定代碼常用檢索符號(hào)《檢索詞》“檢索詞”檢索詞*邏輯算符
and,or,not第八十二頁,共112頁。a)使用關(guān)鍵詞的技巧每個(gè)關(guān)鍵詞之間用逗號(hào)連接,會(huì)搜索到與其中任何一個(gè)關(guān)鍵詞相關(guān)的網(wǎng)站和網(wǎng)頁,這樣可以使搜索范圍擴(kuò)大,有效避免漏檢。另外,要盡量選用專指詞、特定概念或?qū)I(yè)術(shù)語作為關(guān)鍵詞,避免使用普通詞和太泛的詞,如計(jì)算機(jī)、網(wǎng)絡(luò)等詞,太多太泛被稱為檢索“禁用詞”。網(wǎng)絡(luò)信息資源第八十三頁,共112頁。網(wǎng)絡(luò)信息資源b)減號(hào)“”的運(yùn)用“”的作用是為了去除包含特定的關(guān)鍵詞但與檢索目標(biāo)無關(guān)的搜索結(jié)果,提高搜索結(jié)果相關(guān)性。若在搜索結(jié)果中有很多不相關(guān)的結(jié)果,則可用“”減掉不相關(guān)結(jié)果的關(guān)鍵詞第八十四頁,共112頁。網(wǎng)絡(luò)信息資源例,檢索“手機(jī)”,輸入“手機(jī)電視劇”來進(jìn)行搜索,查詢的結(jié)果里就不會(huì)有手機(jī)電視劇的信息。需要注意的是,前一個(gè)關(guān)鍵詞和減號(hào)之間必須有空格,否則,減號(hào)會(huì)被當(dāng)成連字符處理,而失去減號(hào)語法功能。減號(hào)和后一個(gè)關(guān)鍵詞之間,有無空格均可。第八十五頁,共112頁。第八十六頁,共112頁。網(wǎng)絡(luò)信息資源c)利用雙引號(hào)“”進(jìn)行精確匹配搜索使用雙引號(hào)進(jìn)行精確匹配檢索,能縮小檢索結(jié)果范圍,提高查準(zhǔn)率,得到的信息結(jié)果最少最精確。如,輸入“哈爾濱工業(yè)大學(xué)”,可以得到與輸入詞完全匹配的結(jié)果,否則,搜索引擎就會(huì)將“哈爾濱”或“大學(xué)”等詞分別檢索出來。第八十七頁,共112頁。網(wǎng)絡(luò)信息資源d)停用詞的應(yīng)用停用詞(StopWords)主要常見于英文搜索引擎中,指的是使用過于頻繁的單詞,如who、I、what、it、and、how、的、地等。搜索引擎不支持停用詞的檢索。如果在搜索的檢索詞中必須使用停用詞,可以用加號(hào)“+”來解決。如搜索影片名稱“WhoamI”時(shí),其中“Who”和“I”是停用詞,用“+”號(hào)強(qiáng)制對(duì)其進(jìn)行搜索,此時(shí)的搜索條件即+Who+am+I或?qū)⑷繖z索詞用“”引起來,進(jìn)行精確匹配搜索。第八十八頁,共112頁。網(wǎng)絡(luò)信息資源3)常用的搜索引擎常用的中文搜索引擎a)百度()百度是全球最大的中文搜索引擎。2000年1月1日,百度公司創(chuàng)始人李彥宏、徐勇以120萬美元投資創(chuàng)建了百度公司。同年10月,百度搜索引擎正式發(fā)布。百度采用基于內(nèi)容和基于超鏈接分析相結(jié)合的方法進(jìn)行相關(guān)度評(píng)價(jià),能夠客觀分析網(wǎng)頁所包含的信息,從而最大限度地保證了檢索結(jié)果相關(guān)性。第八十九頁,共112頁。網(wǎng)絡(luò)信息資源百度的網(wǎng)頁搜索特色功能包括以下方面。(1)百度快照。每個(gè)未被禁止搜索的網(wǎng)頁,在百度上都會(huì)自動(dòng)生成臨時(shí)緩存頁面,稱為“百度快照”。當(dāng)網(wǎng)站服務(wù)器暫時(shí)出現(xiàn)故障或網(wǎng)絡(luò)傳輸堵塞時(shí),可以通過“百度快照”快速瀏覽頁面文本內(nèi)容。因?yàn)榘俣瓤煺罩慌R時(shí)緩存網(wǎng)頁的文本內(nèi)容,所以那些圖片、音樂等非文本信息,仍是存儲(chǔ)于原網(wǎng)頁。第九十頁,共112頁。網(wǎng)絡(luò)信息資源第九十一頁,共112頁。網(wǎng)絡(luò)信息資源百度的網(wǎng)頁搜索特色功能包括以下方面。(2)專業(yè)文檔搜索。很多有價(jià)值的資料,在互聯(lián)網(wǎng)上并非是普通的網(wǎng)頁,而是以Word、PowerPoint、PDF等格式存在。百度支持對(duì)Office文檔(包括Word、Excel、PowerPoint)、AdobePDF文檔進(jìn)行的全文搜索。要搜索這類文檔,在普通的檢索詞后,加一個(gè)“filetype:”文檔類型限定,“filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。第九十二頁,共112頁。網(wǎng)絡(luò)信息資源第九十三頁,共112頁。網(wǎng)絡(luò)信息資源b)搜狗(
)。搜狗是搜狐公司于2004年8月3日推出的全球首個(gè)第三代互動(dòng)式中文搜索引擎。2007年1月1日正式推出的全面升級(jí)的搜狗網(wǎng)頁搜索3.0版本憑借自主研發(fā)的服務(wù)器集群并行抓取技術(shù),成為全球首個(gè)中文網(wǎng)頁收錄量達(dá)到100億的搜索引擎,以每天5億網(wǎng)頁的速度更新。第九十四頁,共112頁。網(wǎng)絡(luò)信息資源c)新浪愛問搜索(/)。新浪“愛問iAsk”是新浪完全自主研發(fā)的搜索產(chǎn)品,采用了智慧型互動(dòng)搜索技術(shù),支持詞語檢索和目錄檢索。用戶可以使用中、英文兩種關(guān)鍵詞進(jìn)行檢索。第九十五頁,共112頁。網(wǎng)絡(luò)信息資源
d)天網(wǎng)搜索()。由北京大學(xué)網(wǎng)絡(luò)實(shí)驗(yàn)室開發(fā)的天網(wǎng)搜索引擎是國家“九五”重點(diǎn)科技攻關(guān)項(xiàng)目“中文編碼和分布式中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年抗心律失常藥項(xiàng)目建議書
- 2025年離合器分離軸承項(xiàng)目合作計(jì)劃書
- 2025年充換電站項(xiàng)目發(fā)展計(jì)劃
- 腸梗阻術(shù)前術(shù)后護(hù)理
- 遼寧省2025秋九年級(jí)英語全冊(cè)Unit5Whataretheshirtsmadeof課時(shí)4SectionB(1a-1e)課件新版人教新目標(biāo)版
- 員工溝通會(huì)課件
- 植皮術(shù)后護(hù)理要點(diǎn)解析
- 護(hù)理法律與醫(yī)療糾紛法律咨詢
- 急診護(hù)理倫理實(shí)踐競(jìng)賽
- 肌腱術(shù)后brace的使用與注意事項(xiàng)
- 國開機(jī)考答案-鋼結(jié)構(gòu)(本)(閉卷)
- 紀(jì)委談話筆錄模板經(jīng)典
- 消防安全制度和操作規(guī)程
- 叉車安全技術(shù)交底
- 單人徒手心肺復(fù)蘇操作評(píng)分表(醫(yī)院考核標(biāo)準(zhǔn)版)
- 國家預(yù)算實(shí)驗(yàn)報(bào)告
- 工業(yè)園區(qū)綜合能源智能管理平臺(tái)建設(shè)方案合集
- 附件1:中國聯(lián)通動(dòng)環(huán)監(jiān)控系統(tǒng)B接口技術(shù)規(guī)范(V3.0)
- 正弦函數(shù)、余弦函數(shù)的圖象 說課課件
- 閉合性顱腦損傷病人護(hù)理查房
- 《你看起來好像很好吃》繪本課件
評(píng)論
0/150
提交評(píng)論