版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
情報檢索與計算機信息檢索第1頁,共68頁,2023年,2月20日,星期一
課程目標
面對日益增長的Internet的信息和文獻資源,如何通過一種有效的方法,以最少的時間與精力來獲取自己所要的信息。──這就是本課程所希望解決的問題第2頁,共68頁,2023年,2月20日,星期一課程主要內(nèi)容1.理論基礎(chǔ)2.手工檢索3.計算機檢索第3頁,共68頁,2023年,2月20日,星期一情報檢索基礎(chǔ)(第一章緒論)四個主要概念:1、信息2、文獻3、情報4、情報檢索第4頁,共68頁,2023年,2月20日,星期一1.信息
在日常生活中信息常被理解為人們口頭、書面或者以其它方式傳遞的消息。信息不是物質(zhì)本身,是物質(zhì)的一種基本屬性。是關(guān)于事物運動的知識。每個人每天都在不斷地通過感覺器官從外界接受信息。從書刊報紙、電視、收音機、交談中不斷獲得信息。
第5頁,共68頁,2023年,2月20日,星期一信息的特點(1)時效性:重要特點。如果信息傳遞很慢,那么有用的信息也會失去應有的價值。如新聞、預告。(2)可擴散性:在時間或空間上從一點轉(zhuǎn)移到另一點?!耙粋魇?,十傳百”。(3)可擴充性:人們對世界認識是無無限的,因此信息資源的擴充與累積也是無限的。(4)共享性:信息可以多次傳播,不失其內(nèi)容,與實物交易不同。第6頁,共68頁,2023年,2月20日,星期一2.文獻
記錄有知識的一切載體。即用文字、圖形、符號、聲頻、視頻等技術(shù)手段記錄人類知識的一種載體。文獻的范圍很廣。古代:甲骨文、碑刻、竹簡、帛書是文獻?,F(xiàn)代:圖書、報紙、期刊現(xiàn)今:機讀資料、縮微制品、電子出版物。第7頁,共68頁,2023年,2月20日,星期一文獻的級次(按信息的加工程度劃分)零次文獻信息資源——指尚未被記錄下來,只是通過口頭攜帶和傳播的信息資源。零次信息資源的出現(xiàn)和傳遞帶有極大的偶然性。其特點是鮮活、生命力旺盛。
一次文獻信息資源——
指經(jīng)加工或粗略加工的原始信息資源,如正在研究或創(chuàng)造過程中產(chǎn)生的信息,包括會議記錄、論文報告、統(tǒng)計報表、專利等。其特點是比較零散,系統(tǒng)性不強,半包括所有的主要內(nèi)容。2023/4/298第8頁,共68頁,2023年,2月20日,星期一文獻的級次(按信息的加工程度劃分)二次文獻信息資源——指在一次信息資源基礎(chǔ)上加工整理而成的信息資源,如文摘、索引、目錄等,它們是引導和使用一次信息資源必不可少的工具。三次文獻信息資源——通過二次信息資源提供的線索,對某范圍內(nèi)的一次文獻進行分析、研究加工而成的信息資源,亦稱三次文獻,包括綜述、述評、專題情報研究報告、百科全書、年鑒、指南、手冊、詞典等。2023/4/299第9頁,共68頁,2023年,2月20日,星期一文獻的特征:外部特征:與文獻精確對應的書名(或篇名)和作者內(nèi)部特征:與文獻模糊對應的主題詞和分類號第10頁,共68頁,2023年,2月20日,星期一3.情報
是一種人工信息,信息與知識都是它的來源。是激活了的,活化了的知識。情報與信息在英文中同為Information,但信息的外延比情報廣,信息是包含情報的。情報就是人們在一定時間內(nèi)為一定目的而傳遞的有使用價值的知識或信息,它有明確的接收對象。第11頁,共68頁,2023年,2月20日,星期一4.情報檢索情報檢索就是從任何信息集合中識別和獲得所需信息的過程類型:文獻檢索數(shù)據(jù)檢索事實檢索
第12頁,共68頁,2023年,2月20日,星期一(1)文獻檢索
是以文獻為檢索對象的信息檢索。文獻檢索根據(jù)檢索內(nèi)容不同分為:①文獻的線索檢索:利用書目、文摘和書目型數(shù)據(jù)庫檢索工具,檢索的結(jié)果提供了文獻的線索;②文獻的全文檢索:這種檢索以查找到文獻全文為目的。第13頁,共68頁,2023年,2月20日,星期一(2)數(shù)據(jù)檢索
以數(shù)值、圖表、公式或化學分子式等形式表示的數(shù)據(jù)為檢索對象的信息檢索,其檢索結(jié)果為數(shù)據(jù)信息。如:“長江有多長,洪水期最高水位有多高?”等。第14頁,共68頁,2023年,2月20日,星期一(3)事實檢索
以事實為檢索目的和對象的信息檢索。其檢索對象既包括一些事實、概念、思想、知識等非數(shù)值信息也包括一些數(shù)據(jù)信息。從廣義上講事實也是一種全文,知識內(nèi)容特殊、比較簡短的全文。第15頁,共68頁,2023年,2月20日,星期一情報檢索基礎(chǔ)(第二章情報源與工具書)2.12.2情報源情報源分為:文獻情報源與非文獻情報源(電視、廣播、交往、實物展覽等信息)文獻情報源又分為:印刷型文獻情報源和非印刷型文獻情報源(縮微型、機讀型、視聽型)印刷型文獻情報源的類型又稱文獻類型有10種,也可分為3種(圖書、期刊和特種文獻:會議文獻、科技報告、專利文獻、技術(shù)標準、政府出版物、學位論文、產(chǎn)品樣本、技術(shù)檔案P11)除此之外還有報紙、新聞稿等。
2023/4/2916第16頁,共68頁,2023年,2月20日,星期一情報檢索基礎(chǔ)(情報源的整序(2.3)與整序后形成工具書(2.4)示意圖)
2023/4/2917情報源無序流整序方法(即編排方法)外部特征文獻篇名作者姓名(含團體作者)等等內(nèi)部特征分類—(表)P15P26主題—(詞表)P15時序、地序法規(guī)范化處理工具書工具類數(shù)據(jù)庫有序流情報服務(wù)機構(gòu)檢索工具參考工具用戶全文全文數(shù)據(jù)庫定義P16定義P17查找文獻線索的工具定義P21查找數(shù)據(jù)和事實情報的工具目錄題錄文摘索引百科全書詞典年鑒手冊名錄第17頁,共68頁,2023年,2月20日,星期一附加內(nèi)容:文獻著錄著錄(Description)就是編制文獻目錄等二次文獻時,對文獻內(nèi)容和形式特征進行分析、選擇和記錄的過程。它將有關(guān)某一文獻的基本信息摘錄下來,供人們間接地了解、識別該文獻。下面,我們分別對不同文獻情報源的著錄特征及其識別方法進行講述。第18頁,共68頁,2023年,2月20日,星期一圖書的著錄項目包括書名、著者,出版項(出版地、出版社、出版年)、總頁碼等。圖書:第19頁,共68頁,2023年,2月20日,星期一目錄第20頁,共68頁,2023年,2月20日,星期一圖書的識別主要依據(jù)出版項(出版地、出版社、出版年)、ISBN(10位)、總頁碼(PPorP)等著錄項。第21頁,共68頁,2023年,2月20日,星期一ISBN是國際標準書號,InternationalStandardBookNumber的縮寫,是世界各國廣泛使用的書號編碼系統(tǒng)。一個ISBN是由10位阿拉伯數(shù)字組成,并用連字符分隔為四部分:第一部分表示組號,也叫地域編號,是指國家、地理、語言等地域信息;第二部分是出版社編號;前兩部分合稱“出版者前綴”;第三部分為書名編號,即該出版社出版的圖書種數(shù)的流水號;第四部分為校驗碼。前三部分的數(shù)位都是可變的,但其位數(shù)之和始終為9位。第22頁,共68頁,2023年,2月20日,星期一例:ISBN7?-5383?-0276?-0?/TP·99??是地域號(國家、地區(qū)、語言區(qū))。其中7代表中國,0和1表示英語區(qū)、2是法語區(qū)、3是德語區(qū)、4是日語區(qū)、5是俄語區(qū)、88是意大利語區(qū)、9971是新加坡語區(qū)?是出版社號;?是該出版社出版的圖書種數(shù)的流水號?是計算機檢驗位;?是我國出版的圖書在ISBN后加的一個中圖法的大類類號。
第23頁,共68頁,2023年,2月20日,星期一作用:具有可識別可檢驗的功能。用加權(quán)因數(shù)10-2分別與ISBN的1-9位數(shù)對應相乘,將乘積與校驗數(shù)值相加,再以模數(shù)“11”相除,如被整除就是正確的編號,否則為錯誤編號。
如:ISBN7538302760
加權(quán)
1098765432
乘積
70+45+24+56+18+0+8+21+12+0
總和
264/11=24(被整除)第24頁,共68頁,2023年,2月20日,星期一期刊期刊的著錄:刊名(一般用縮寫)、出版年月、卷、期、起止頁碼等。第25頁,共68頁,2023年,2月20日,星期一文摘第26頁,共68頁,2023年,2月20日,星期一Aestheticsinmastandtowerdesign(1),Theveryrapidlyintheneedfor……(2)Fuchs,M.B.(3)(TelAvivUniv,RamatAviv,Isr)(4),Comput.Struct.
(5)v73n4,2001,p1-5(6)說明:(1)文獻篇名;(2)文摘內(nèi)容;(3)著者姓名;(4)著者工作單位或通訊地址;(5)刊名縮寫;(6)出版卷、期、年份、頁碼。本條摘自EI文摘第27頁,共68頁,2023年,2月20日,星期一期刊的識別:(1)卷號或期號(vol.noorv.n);(2)刊名縮寫(如PE&RS);(3)ISSN號(8位)第28頁,共68頁,2023年,2月20日,星期一科技報告著錄:篇名;著者和著者工作單位;報告號;出版年月識別:根據(jù)報告號
a、一般有report;b、有時候有PR(progressreport)進展報告、AR(annualreport)年度報告、FR(finalreport)年終報告、CR(contractreport)合同報告、TR(technicalreport)技術(shù)報告
第29頁,共68頁,2023年,2月20日,星期一000,050③PCA04/MFA01④PB90-10490/GAR(1)InternationalPotatoCenter,Lima(Peru)(2)TraditionalPotatoStorageinperu:Farmers’KnowledgeandPractices.Potatoesinfoodsystemsresearchseries(3)R.Rhoades,M.Benavides,J.Rechate,E.(4)1988,629(5).REPT–4,AID–PN–ABC–429(6)SponsoredbyAgencyforInternationalDevelopment,WashingtonDC,OfficeofAgriculture.(7)Inthelastdecade,theimportanceofreducingfood……(8)說明:(1)NTIS登記號;(2)團體或報告完成機構(gòu)名稱;(3)報告篇名;(4)個人著者;(5)完成日期、報告頁數(shù);(6)原報告號;團體著者或資助招標機構(gòu)所編代號;(7)資助機構(gòu)名;(8)文摘。本條摘自美國《政府報告通告與索引》(GovernmentReportsAnnouncementsandInder簡稱GRA&I)
文摘第30頁,共68頁,2023年,2月20日,星期一著錄:論文名稱、著者和著者工作單位;會議錄名稱、會議地點、會議時間;會議錄出版情況,論文頁碼。識別:會議錄名稱、會議地點、會議時間、會議屆次。會議錄名稱常含有:congress(會議)、convention(大會)、symposium(專題討論會)、workshop(專題學術(shù)討論會)、seminar(學術(shù)研討會)、conference(學術(shù)討論會)colloquium(學術(shù)討論會)、proceedings(會議錄)
會議文獻第31頁,共68頁,2023年,2月20日,星期一文摘第32頁,共68頁,2023年,2月20日,星期一Performanceanalysisofthird-ordernonlinearwieneradaptiveSystems(1).Shue-LeeChang(2)(Dept.ofElectr.Eng.,SantaUniv.,CA.USA)(3)2002IEEEInternationalSymposiumonCircuitsandSystems(4).Proceedings,Phoenix-Scottsdale,AZ,USA,26-29May2002(5),P.II-197-200(6)vol.2(7)Thispaperpresentsadetailedperformanceanalysisofthird-order……(8)(16refs)(9)說明:(1)論文題目;(2)著者姓名;(3)著者工作單位或通訊地址;(4)會議錄名稱;(5)會議召開的地點和時間;(6)論文在會議錄中的頁碼;(7)卷號;(8)文摘內(nèi)容;(9)參考文獻條數(shù)。本條摘自SA文摘第33頁,共68頁,2023年,2月20日,星期一專利文獻著錄:專利題目;著者;受讓人或單位以及專利發(fā)表時間;專利國別及專利號識別:有patent;專利國別及專利號。專利國別代碼是由國際標準化組織(ISO)規(guī)定的,專利文獻由各國專利局出版發(fā)行,因此,無出版地、出版社等項目。第34頁,共68頁,2023年,2月20日,星期一文摘第35頁,共68頁,2023年,2月20日,星期一Wastewatertreatmentprocess.(1)Reyna,C.(2)(NewWorkingWaters,Llc,USA)(3)U.SUs6319412(4)(Cl.210-666;(5)Co2Fq/00(6)),20Nov2001,(7)USAppl.955182,(8)21Oct1997(9);6pp(10),(Eng)(11),Thisinventionrelatestowastewatertreatment……(12)說明:(1)專利標題;(2)發(fā)明人姓名;(3)專利權(quán)所有者;(4)專利國別代號和專利號;(5)美國專利分類號;(6)國際專利分類號;(7)專利公布日期;(8)專利申請?zhí)?;?)專利申請日期;(10)專利總頁數(shù);(11)文種;(12)文摘內(nèi)容。本條摘自CA文摘第36頁,共68頁,2023年,2月20日,星期一標準文獻著錄:標準制定單位;標準題目;表示標準的詞,如standard,recommendation等;標準號。標準號由標準頒布機構(gòu)代碼、順序號和頒布年份三部分組成。如ANSITI-601-1988識別:標準號第37頁,共68頁,2023年,2月20日,星期一文摘第38頁,共68頁,2023年,2月20日,星期一學位論文著錄:論文名稱;著者;學位;授予學位的大學名稱;時間、論文頁碼;導師或答辯委員會顧問的姓名。識別方法:學位名稱、大學名稱。如“dissertation”、”thesis”。例子中的“Ph.D.”博士學位的簡稱。第39頁,共68頁,2023年,2月20日,星期一文摘第40頁,共68頁,2023年,2月20日,星期一INVERTIBLEFUNCTIONS(1)orderNoDA8528622(2)
ALLENDER,ERICWARREN,Ph,D(3)
GeorgiaInstituteofTechnology,1985(4)
107PP(5)chairman:K.N.King(6)ThisThesisexploresthequestionofhowharda(7)說明:(1)論文題目;(2)訂購論文的訂購號;(3)論文作者和學位類別;(4)授予學位單位和時間;(5)論文頁數(shù);(6)學位論文指導教師;(7)文摘。本條摘自《國際學位論文文摘》(DissertationAbstractsInternational(簡稱DAI)文摘第41頁,共68頁,2023年,2月20日,星期一一、檢索語言概述語言是一種人們用以交流溝通的重要工具。人與計算機對話,需要有計算機語言,人與檢索系統(tǒng)對話來實施檢索,則需要有檢索語言(retrievallanguage)。
檢索語言是用于描述檢索系統(tǒng)中信息的內(nèi)部及外部特征和表達用戶信息提問的一種專門語言,檢索的匹配正是通過語言的比較匹配來實現(xiàn)的。檢索語言也稱索引語言,后者是從檢索系統(tǒng)的標引角度出發(fā)的,而前者是從用戶的信息檢索角度出發(fā)的。情報檢索基礎(chǔ)(第三章檢索語言)第42頁,共68頁,2023年,2月20日,星期一
也可以說,所謂的檢索語言就是組織文獻與檢索文獻時所使用的語言,也就是說,文獻存儲時,文獻的內(nèi)容特征(如分類、主題等)和外表特征(如書名、刊名、著者等)按照一定的語言來加以描述,檢索文獻時的提問也按照一定的語言來加以表達,這種在文獻的存儲和檢索過程中,共同使用、共同理解的語言就是檢索語言。檢索語言是由符號、代碼或科技詞語組成的。其中符號、代碼是按照學科門類嚴格編制的,科技詞語是經(jīng)過優(yōu)選的和規(guī)范化的。第43頁,共68頁,2023年,2月20日,星期一二、檢索語言與編排方法關(guān)聯(lián)圖
2023/4/2944情報源無序流整序方法(即編排方法)外部特征精確文獻篇名作者姓名(含團體作者)等等內(nèi)部特征模糊分類—(表P26)主題—(詞表)時序、地序法即分類語言族性即主題語言特性規(guī)范化處理有序流情報服務(wù)機構(gòu)檢索工具參考工具用戶定義P16定義P17定義P21目錄題錄文摘索引百科全書詞典年鑒手冊名錄工具書工具類數(shù)據(jù)庫全文全文數(shù)據(jù)庫第44頁,共68頁,2023年,2月20日,星期一檢索語言描述文獻內(nèi)容特征的語言分類語言主題語言描述文獻外表特征的語言題名(書名、刊名、篇名)著者出版事項代碼/序號體系分類語言組配分類語言混合分類語言關(guān)鍵詞語言敘詞語言標題詞語言單元詞語言三、檢索語言種類第45頁,共68頁,2023年,2月20日,星期一
信息源信息的選擇與收集信息特征標識語言檢索工具匹配檢索式提問檢索結(jié)果數(shù)據(jù)庫用戶信息需求檢索提問檢索提問式四、檢索語言的橋梁作用第46頁,共68頁,2023年,2月20日,星期一
情報檢索基礎(chǔ)(第四章檢索程序與檢索效率)
一、檢索程序
課題分析研究課題制定檢索策略選擇檢索工具確定檢索途徑選定檢索方法檢索調(diào)整檢索策略結(jié)果評價獲取原始文獻第47頁,共68頁,2023年,2月20日,星期一1.分析研究課題
在查找文獻信息之前,必須對檢索課題進行分析研究。目的是了解課題的學科和專業(yè)范圍,弄清檢索的真正意圖及實質(zhì)。這是制定檢索策略的根本出發(fā)點,也是檢索效率高低和成敗的關(guān)鍵。具體需要明確的問題有:專業(yè)范圍、時間范圍、地理范圍、語種范圍、文獻類型。
第48頁,共68頁,2023年,2月20日,星期一制定檢索策略
檢索策略是指為實現(xiàn)檢索目標而制定的檢索方案或?qū)Σ?,也就是將課題的提問及其檢索詞與檢索工具的收錄內(nèi)容、編排特點相匹配而確定的檢索方案或程序。制定檢索策略的主要內(nèi)容是,在分析課題的基礎(chǔ)上,確定要利用那些檢索工具,確定查找年限和專業(yè)范圍的選擇,確定檢索用詞并判明各檢索詞之間的邏輯關(guān)系與查找步驟。第49頁,共68頁,2023年,2月20日,星期一2.選擇檢索工具
(或數(shù)據(jù)庫)根據(jù)檢索課題的主題及專業(yè)范圍選擇質(zhì)量較高、檢索手段比較完善的檢索工具。這就必須了解和掌握各種檢索工具的適用范圍、收錄特點。第50頁,共68頁,2023年,2月20日,星期一在選擇檢索工具是,要考慮的主要問題是:(1)在內(nèi)容和時間方面,要考慮檢索工具、數(shù)據(jù)庫內(nèi)容對課題內(nèi)容的覆蓋面和一致性,如應綜合考慮檢索工具、數(shù)據(jù)庫收錄文獻的齊全、編制的質(zhì)量、使用的方便等因素。(2)在手段和技術(shù)上,有機檢條件的一般就不選手檢工具。但必須了解數(shù)據(jù)庫收錄文獻的年代范圍。(3)考慮價格和可獲得性,應選擇就近容易獲得的檢索工具。
第51頁,共68頁,2023年,2月20日,星期一3.確定檢索途徑
檢索途徑是進入檢索的入口。分為兩類:反映文獻內(nèi)容特征的途徑(分類、主題)和反映文獻外部特征的途徑(著者、題名、代碼等)。第52頁,共68頁,2023年,2月20日,星期一分類途徑是按照學科分類體系查找文獻的途徑,采用的是“分類目錄”和“分類索引”。按分類進行查找,用分類途徑能夠把同一學科的文獻信息集中在一起檢索出來。其缺點是分類表是事先編制好的,一些新學術(shù)論文增補不及時,依此途徑檢索,所得文獻容易落后于學科發(fā)展;又由于每篇文獻是按學科規(guī)類的,查出的結(jié)果涉及面寬,針對性不強,因而還需要進一步篩選。
第53頁,共68頁,2023年,2月20日,星期一主題途徑根據(jù)文獻的主題特征,利用各類主題目錄和索引進行檢索的途徑,即利用從文獻中抽象出來的或經(jīng)過人工規(guī)范化的,能夠代表文獻內(nèi)容的詞來檢索。主題目錄和主題索引就是將文獻按表征其內(nèi)容特征的主題詞組織起來的索引系統(tǒng)。利用主題途徑檢索時,只要根據(jù)所選用主題詞的字順(字母順序、音序、筆畫順序等)找到所查主題詞,就可查得相關(guān)文獻。主題途徑具有直觀、專指、方便等特點,打破了按學科分類的方法,時分散在各個學科領(lǐng)域里的有關(guān)課題的文獻集中于同一主題。
第54頁,共68頁,2023年,2月20日,星期一著者途徑利用著者(個人或單位著者)目錄和著者索引進行檢索的途徑。國外對著者途徑非常重視,許多檢索工具都把著者索引作為最基本的輔助索引。著者途徑的特點是:科研人員一般是各有所長,尤其是有些領(lǐng)域的知名學者、專家,他們的文章一般都代表了一定的水平和動向,通過著者線索,可以系統(tǒng)地發(fā)現(xiàn)和掌握他們研究的進展和他們的最新論著。一定程度上可以引導查找到同類或相關(guān)文獻。這種途徑的檢索既快速又方便,但查得的文獻缺乏系統(tǒng)性和完整性。第55頁,共68頁,2023年,2月20日,星期一題名途徑根據(jù)文獻的名稱,如書名、刊名、會議名稱進行檢索的途徑。它以文獻的題名按照字順編排誠一個體系,既簡單易行,也便于查檢,比較符合一般用戶對文獻的使用習慣。
第56頁,共68頁,2023年,2月20日,星期一代碼途徑根據(jù)文獻的序號特征,利用其序號索引進行檢索的途徑。許多文獻具有唯一的序號,如ISBN、ISSN、專利號等。根據(jù)這些序號可真誠不同的序號索引。在已知序號的前提下,利用序號途徑能方便地查找所需文獻。
第57頁,共68頁,2023年,2月20日,星期一其它途徑有些檢索工具還有一些特殊的索引,可用特殊途徑找到所需文獻的線索。計算機檢索系統(tǒng)中的檢索途徑還很多,幾乎文獻的每一個特征(如出版社、出版年代等)都可作為檢索途徑。
第58頁,共68頁,2023年,2月20日,星期一4.選擇檢索方法常用法順查法:從遠及近查,用于了解某一事物發(fā)展的全過程,倒查法:由近及遠查,重點為近期抽查法:查找某一段時間的文獻第59頁,共68頁,2023年,2月20日,星期一調(diào)整檢索策略
檢索中,會不可避免地產(chǎn)生一些和檢索目標相差甚遠的情況。檢索詞過于寬泛會造成擴檢,這時可以對原檢索詞增加限定條件,如時間、語種或增加新檢索詞等。另外也可以換用下位類檢索詞進行專指性更強的檢索。檢索詞過于偏窄會造成漏檢,這時可以減少限定條件、用上位類檢索詞或是用相關(guān)主題詞進行檢索。第60頁,共68頁,2023年,2月20日,星期一5.獲取原始文獻
這是檢索過程的終結(jié),也是文獻檢索的最終目的。獲取原文一般有三個步驟:(1)整理文獻出處。將文獻出處中有縮寫語、有音譯刊名的還原成全稱或原刊名;(2)判斷文獻的出版類型;(3)在上面2個步驟的基礎(chǔ)上查找全文數(shù)據(jù)庫、或通過查找圖書館館藏目錄、聯(lián)合目錄確定館藏位置,從而獲得原文,如果是特種文獻,可分別在國圖、中信所、中科院、專利局索取原文、或通圖書館文獻傳遞服務(wù)獲得原文。
第61頁,共68頁,2023年,2月20日,星期一二、檢索效果(率)的分析及評估所謂檢索效果(retrievaleffectiveness)是指檢索結(jié)果的有效程度。反映了檢索系統(tǒng)的檢索能力。檢索效果包括檢索的技術(shù)效果和經(jīng)濟效果兩個方面。技術(shù)效果是由檢索系統(tǒng)完成其功能的能力確定,主要指性能和質(zhì)量。經(jīng)濟效果由完成這些功能的價值確定,主要指檢索系統(tǒng)服務(wù)的成本和時間。第62頁,共68頁,2023年,2月20日,星期一檢索效果評價是根據(jù)一定評價指標對實施信息檢索活動所取得的成果進行客觀科學評價,以進一步完善檢索工作的過程。常用的評價指標有:收錄范圍、查全率、查準率、響應時間、用戶負擔和輸出形式。其中最主要的指標是查全率和查準率。
第63頁,共68頁,2023年,2月20日,星期一檢索效果評估相關(guān)數(shù)據(jù)表
a+b+c+db+da+c總計c+ddca+bba檢出文獻總計無關(guān)文獻相關(guān)文獻系統(tǒng)相關(guān)性未檢出文獻用戶相關(guān)性第64頁,共68頁,2023年,2月20日,星期一查全率(recallratio)查全率是指檢出的相關(guān)文獻數(shù)與檢索工具中的相關(guān)文獻總數(shù)之比,用字母R表示。第65頁,共68頁,2023年,2月20日,星期一查準率(precisionratio)
查準率是指檢出的相關(guān)文獻數(shù)與檢出的文獻總數(shù)之比,用字母P表示。
第66頁,共68頁,2023年,2月20日,星期一查全率是衡量系統(tǒng)檢出與課題相關(guān)文獻的能力;查準率是衡量系統(tǒng)拒絕無關(guān)文獻的能力。兩者結(jié)合起來,即表示檢索系統(tǒng)的檢索效率。檢索者的理想是要求查全率和查準率都是100%,但這是不可能的。實驗表明:查全率和查準率之間存在相反的相互依賴關(guān)系,即提高查全率會降低查準率,反之亦然。第67頁,共68頁,2023年,2月20日,星期一常用檢索途徑的檢索效率分類途徑:利用分類名和分類號進行檢索。其結(jié)果是該類目所有的文獻,檢索結(jié)果較全。題名(篇名)途徑:利用篇名中的字詞或篇名的一部分進行檢索。其結(jié)果是所有在篇名中出現(xiàn)該字、該詞或該部分的文章,檢索結(jié)果較準。主題詞/關(guān)鍵詞途徑:利用文章篇首標明的與該篇文獻主題相關(guān)的詞進行檢索。其結(jié)果是包含該主題詞或關(guān)鍵詞的所有文獻,結(jié)果較準。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職植物保護(農(nóng)藥殘留檢測)試題及答案
- 2025年中職(大數(shù)據(jù)與會計)財務(wù)管理基礎(chǔ)試題及答案
- 2025年中職(畜牧獸醫(yī))動物防疫階段測試題及答案
- 2025年高職測繪與地理信息技術(shù)(測繪地理信息)試題及答案
- 2024指揮中心建設(shè)白皮書
- 2026廣東廣州市白云區(qū)人民政府棠景街道辦事處第一次招聘政府雇員9人備考題庫及答案詳解一套
- 2026中國科學院高能物理研究所黨委辦公室主任崗位招聘1人備考題庫及1套參考答案詳解
- 2025年鐵嶺市事業(yè)單位公開招聘動物檢疫崗位工作人員77人備考題庫及參考答案詳解1套
- 2026中國科學院長春光學精密機械與物理研究所動態(tài)成像室學術(shù)秘書招聘1人備考題庫(吉林)及答案詳解1套
- 2026河南鄭州軌道工程職業(yè)學院寒假教師與輔導員招聘76人備考題庫有完整答案詳解
- 河道治理、拓寬工程 投標方案(技術(shù)方案)
- 政治審查表(模板)
- 《最奇妙的蛋》完整版
- 三年級科學上冊蘇教版教學工作總結(jié)共3篇(蘇教版三年級科學上冊知識點整理)
- 種子室內(nèi)檢驗技術(shù)-種子純度鑒定(種子質(zhì)量檢測技術(shù)課件)
- SEMI S1-1107原版完整文檔
- 心電監(jiān)測技術(shù)操作考核評分標準
- 2023年中級財務(wù)會計各章作業(yè)練習題
- 金屬罐三片罐成型方法與罐型
- 大疆植保無人機考試試題及答案
- 《LED顯示屏基礎(chǔ)知識培訓》
評論
0/150
提交評論