版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
知識發(fā)現(xiàn)與信息檢索
2課程目標(biāo)面對日益增長的Internet的信息和文獻(xiàn)資源,如何通過一種有效的方法,以最少的時間與精力來獲取自己所要的信息,并綜合成章。──這就是本課程所希望解決的問題。分三部分:1.知識發(fā)現(xiàn)2.信息檢索基本概念3.信息檢索4第一部分:知識發(fā)現(xiàn)5
知識經(jīng)濟(jì)時代,知識、知識創(chuàng)新與知識資源利用問題引起社會的高度關(guān)注。
知識成為經(jīng)濟(jì)社會發(fā)展的首要資源,是衡量國家能力的主要因素。知識作為一種創(chuàng)造財富的戰(zhàn)略資源,隨著現(xiàn)代信息技術(shù)和國家信息化進(jìn)程的迅速發(fā)展,以及科技、文化的進(jìn)步在經(jīng)濟(jì)發(fā)展競爭中作用日益增強(qiáng),人們對獲取知識的能力和利用知識的水平得到了空前的提高。
*51知識發(fā)現(xiàn)6
偉大的科學(xué)家牛頓說過:“假如說我比別人看的略微遠(yuǎn)些,那是因為我站在巨人的肩膀上?!?61知識發(fā)現(xiàn)7塞繆爾·約翰遜(SamuelJohnson)說:知識分成兩類:一類是我們要掌握的學(xué)科知識;另一類是要知道在哪兒可以找到有關(guān)知識的信息。Knowledgeisoftwokinds.Weknowasubjectourselves,orweknowwherewecanfindinformationuponit.1知識發(fā)現(xiàn)8
知識資源利用創(chuàng)新必然成為知識資源的高度共享乃至整個國家信息化發(fā)展戰(zhàn)略的重要組成部分。美國和西方發(fā)達(dá)國家均視其知識為國家發(fā)展的重要戰(zhàn)略資源。我國將“發(fā)展國家知識與創(chuàng)新體系”、“強(qiáng)化信息資源共享”作為基本國策,充分體現(xiàn)了這一戰(zhàn)略資源及其知識資源共享的重要戰(zhàn)略意義。必須大力提高人們獲取與利用知識的能力,在更大程度上、更大規(guī)模上、更大范圍內(nèi)實現(xiàn)知識資源的高度共享,充分滿足人們在知識創(chuàng)新過程中對知識的需求。
*81知識發(fā)現(xiàn)9
傳統(tǒng)文獻(xiàn)信息資源的數(shù)量龐大,類型多樣,但開發(fā)利用是有限的。傳統(tǒng)的文獻(xiàn)資源共享主要是信息物質(zhì)載體的共享,即文獻(xiàn)的共享。這種共享由于受共享交易成本的限制,只能是在一定時間、空間范圍內(nèi)有限的共享。*91知識發(fā)現(xiàn)10
現(xiàn)代計算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的發(fā)展,改變了人們獲取、利用和交流知識的方式,打破了知識信息傳遞的時空限制,使知識信息的交流、獲取形式更為生動和直觀,為知識信息服務(wù)提供了嶄新的信息環(huán)境,開辟了知識資源無限共享的新天地。*101知識發(fā)現(xiàn)11
網(wǎng)絡(luò)信息技術(shù)加快了知識的傳送,拓展了知識領(lǐng)域的廣度。網(wǎng)絡(luò)環(huán)境下信息和知識服務(wù)已不再局限于一個固定建筑實體形態(tài),其服務(wù)邊界不斷擴(kuò)大并日益模糊化,知識提供與傳播形式呈現(xiàn)多向性、共享性、交互性、實時性等特點,社會知識需求的復(fù)雜性日益增加,查詢、利用知識信息的手段趨于計算機(jī)化、網(wǎng)絡(luò)化。*111知識發(fā)現(xiàn)12
知識的獲得、組織與傳播,通過異地共享和遠(yuǎn)程傳播越來越顯示出無比的優(yōu)勢?;谟嬎銠C(jī)網(wǎng)絡(luò)的快速、虛擬知識空間,可構(gòu)建一個具有擴(kuò)展和輻射能力的開放化、立體化的知識資源共享保障服務(wù)系統(tǒng)。在這種現(xiàn)代技術(shù)網(wǎng)絡(luò)環(huán)境之中,可最大限度地滿足人們對知識信息的無時空障礙的知識需求,實現(xiàn)知識資源共享所應(yīng)達(dá)到的一種高級境界。*121知識發(fā)現(xiàn)13
為了使人們進(jìn)入網(wǎng)絡(luò)環(huán)境下知識資源高度共享的境界,多年來國內(nèi)外專家、學(xué)者和企業(yè)在知識資源共享方式的設(shè)計和服務(wù)技術(shù)的實現(xiàn)上不斷改革創(chuàng)新,陸續(xù)推出了不少新的知識產(chǎn)品和服務(wù)技術(shù)與模式:*131知識發(fā)現(xiàn)14
知識挖掘、個性化服務(wù)、知識可視化等。
“知識服務(wù)”理念,成為當(dāng)今知識資源共享模式設(shè)計的核心指導(dǎo)思想。在這種共享模式之下,人們從知識資源中獲取的不僅僅是一條條信息,而是一個個針對特定問題的解決方案,即知識。這樣的知識資源共享方式,已經(jīng)成為現(xiàn)代知識服務(wù)業(yè)所追求實現(xiàn)的高級境界。**141知識發(fā)現(xiàn)15
基于“知識元”水平上的全文關(guān)聯(lián)的、數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)化的、人與資源可實時以多媒體信息交互的知識服務(wù)平臺,無論數(shù)據(jù)庫的物理位置何在,無論數(shù)據(jù)庫專業(yè)性質(zhì)和具體結(jié)構(gòu)如何,都可使其在知識信息的內(nèi)容上跨越數(shù)據(jù)庫界限而渾然成為一體。人們在這個平臺上可以用平臺的各種個性化服務(wù)手段,從所有數(shù)據(jù)庫中任意獲取所需要的知識信息,并可在人與人的交流互動過程中得到新的知識。*151知識發(fā)現(xiàn)16第二部分:信息檢索基本概念17信息知識文獻(xiàn)2信息檢索基本概念182.1信息定義——物質(zhì)存在的一種方式,一般指數(shù)據(jù)、消息中所包含的意義。可以使消息中所描述的事件的不定性減少。(*注:中國《情報與文獻(xiàn)工作詞匯基本術(shù)語》(GB48944-85)有關(guān)信息的定義。
2信息檢索基本概念19信息的概念十分廣泛,圍繞信息而出現(xiàn)的信息資源、信息技術(shù)、信息系統(tǒng)、信息產(chǎn)業(yè)、信息化社會和社會信息化等相關(guān)術(shù)語不勝枚舉。那么,什么是信息,至今仍無確切、統(tǒng)一的定義,站在不同的角度舊有不同的理解或解釋。2信息檢索基本概念20
信息既不是物質(zhì),也不是能量,而是依附于自然界客觀事物而存在,只要有物質(zhì)存在,就有表征其屬性的信息。*202信息檢索基本概念21信息的概念,實際上就是客觀事物運動狀態(tài)、時空特征、能量大小、質(zhì)料系統(tǒng)特征、相互聯(lián)系方式等一切反映事物客觀屬性的總稱。從這種意義上看,信息比客觀事物的屬性更具一般性與普遍性。*212信息檢索基本概念22
信息概念的實質(zhì)在于它以某種編碼形式儲存或傳輸于某種介質(zhì)之中,如儲存在書本、紙張上的文字信息,記錄在唱片、錄音帶上的聲音信息,印制在畫報、照片、錄象帶上的圖像(形)信息,計算機(jī)系統(tǒng)種的信息系統(tǒng)各種數(shù)字、數(shù)據(jù)信息等。*222信息檢索基本概念23
例子:據(jù)說上古時期,諾亞的方舟在洪水中飄蕩許久,當(dāng)放出的飛鴿銜回一束橄欖,意味著帶回了洪水已退的信息。*232信息檢索基本概念24
從自然界角度看,表征物質(zhì)的屬性:地球晝夜的變化是一種信息,它反映出地球繞太陽自轉(zhuǎn)的運動特性和狀態(tài);山的高度是一種信息,它反映出山的空間特性;樹干的年輪是一種住處它反映了樹木成長的時間特性——樹齡等等。
*242信息檢索基本概念251)按信息的加工程度劃分l
零次信息資源——指尚未被記錄下來,只是通過口頭攜帶和傳播的信息資源。零次信息資源的出現(xiàn)和傳遞帶有極大的偶然性。其特點是鮮活、生命力旺盛。l
一次信息資源——
指經(jīng)加工或粗略加工的原始信息資源,如正在研究或創(chuàng)造過程中產(chǎn)生的信息,包括會議記錄、論文報告、統(tǒng)計報表、專利等。其特點是比較零散,系統(tǒng)性不強(qiáng),半包括所有的主要內(nèi)容。l
二次信息資源——指在一次信息資源基礎(chǔ)上加工整理而成的信息資源,如文摘、索引、目錄等,它們是引導(dǎo)和使用一次信息資源必不可少的工具。l
三次信息資源——通過二次信息資源提供的線索,對某范圍內(nèi)的一次文獻(xiàn)進(jìn)行分析、研究加工而成的信息資源,亦稱三次文獻(xiàn),包括綜述、述評、專題情報研究報告、百科全書、年鑒、指南、手冊、詞典等。*252信息檢索基本概念262)按信息表現(xiàn)形式劃分文字信息圖像信息數(shù)值數(shù)據(jù)信息語音信息*262信息檢索基本概念27信息交流渠道:正式渠道:信息是指由正式組織發(fā)布并經(jīng)由正式組織渠道向外傳播,如官方新聞發(fā)布會、正式報告、國家統(tǒng)計部門發(fā)布統(tǒng)計信息等。非正式渠道:非正式渠道信息指從正式渠道以外獲取的信息。*272信息檢索基本概念282.2知識是人類的主觀世界對客觀世界概括和反映,是大量有組織的信息,是關(guān)于事實和思想的有組織的陳述。提供某種經(jīng)過思考的判斷和某種實驗的結(jié)果。
*282信息檢索基本概念29知識的來源:第一類是直接源于產(chǎn)生信息的客觀事物;第二類是通過信息載體或媒介(文獻(xiàn)、電視、廣播、他人等)的傳遞、交流而間接獲得。*292信息檢索基本概念30據(jù)經(jīng)合組織(OCED)出版的《以知識為基礎(chǔ)的經(jīng)濟(jì)》報告對知識的分類:1)“知事(Know-what)”,關(guān)于事實方面的知識,可理解為Know-when、Know-where;即在什么樣的時間(Know-when)、什么樣的地點或條件下(Know-where)能解決什么樣的問題;2)“知因(Know-why)”,自然原理和規(guī)律方面的科學(xué)理論,知識生產(chǎn)是在專門研究機(jī)構(gòu)如實驗室和大學(xué)完成的;3)
“知道怎樣做的知識(Know-how)”,做某些事的技藝和能力,稱為技術(shù)情報和商業(yè)秘密,其典型是企業(yè)開發(fā)和保存于其內(nèi)部的技術(shù)訣竅或?qū)S屑夹g(shù);4)
“誰以及是怎樣創(chuàng)造知識的(Know-who)”側(cè)重創(chuàng)造思想、方法、手段、過程以及特點等的了解。*302信息檢索基本概念312.3文獻(xiàn)記錄有知識的一切載體。權(quán)威的定義主要1)是《文獻(xiàn)情報術(shù)語國際標(biāo)準(zhǔn)(草案)》(ISO/DIS5127):“為了把人類知識傳播開來和繼承下去,人們用文字、圖形、符號、聲頻、視頻等手段將其記錄下來,或?qū)懺诩埳希驎裨谒{(lán)圖上,或攝制在感光片上,或錄到唱片上,或存貯在磁盤上。這種附著在各種載體上的記錄統(tǒng)稱為文獻(xiàn)。”2)國標(biāo):各種媒介和形式的信息集合,包括文字、聲像印刷品、電子信息、數(shù)據(jù)庫等。*312信息檢索基本概念321)按文獻(xiàn)出版類型劃分a圖書b期刊c政府出版物d科技報告e專利文獻(xiàn)f會議文獻(xiàn)g學(xué)位論文h技術(shù)標(biāo)準(zhǔn)和規(guī)范i產(chǎn)品樣本說明書j技術(shù)檔案*322信息檢索基本概念33按文獻(xiàn)的存儲載體分:印刷型縮微型聲像型電子型*332信息檢索基本概念34文獻(xiàn)的構(gòu)成要素:A、文獻(xiàn)信息是文獻(xiàn)的內(nèi)容B、符號系統(tǒng)是信息的攜帶者
C、載體是符號賴以依附的“寄主”D、記錄方式是將文獻(xiàn)的符號進(jìn)入載體的方法和過程*342信息檢索基本概念35*352信息檢索基本概念傳遞運用后事物運動
知識新的信息信息產(chǎn)生人腦有序化用于實踐文獻(xiàn)記錄在載體上36知識是有組織的大量的信息,獲得知識有賴于獲得信息;信息是知識得以形成和傳播的中介,而不是知識本身,知識是經(jīng)過精心研究、領(lǐng)會后的有用信息,是人類對信息加工處理后的產(chǎn)物。*362信息檢索基本概念37第三部分:信息檢索383.1概述3.1.1信息檢索概念信息檢索InformationRetrieval/Access:是從任何信息集合中識別和獲取所需信息的過程及其所采取的一系列方法和策略。從原理上看,它包括存儲與檢索兩方面。
**383信息檢索39文獻(xiàn)檢索原理是:將檢索提問標(biāo)識與存貯在檢索工具中的標(biāo)引標(biāo)識相比較,兩者一致或信息標(biāo)識包含著檢索提問標(biāo)識,則含有該標(biāo)識的信息就從檢索工具中輸出;對信息的著錄是按一定規(guī)則對信息的外表特征和內(nèi)容特征加以簡單明確的表述,信息的標(biāo)引是對其內(nèi)容按一定的分類表或主題詞表給出分類號或主題詞;檢索過程則是按同樣的主題詞表或分類表及組配原則分析課題,形成檢索提問標(biāo)識,根據(jù)檢索工具所提供的檢索途徑,從信息集合中查找與檢索提問標(biāo)識相符的信息特征標(biāo)識的過程。(如下圖)
*393信息檢索40
3信息檢索信息源信息的選擇與收集信息特征標(biāo)識語言檢索工具匹配檢索式提問檢索結(jié)果數(shù)據(jù)庫用戶信息需求檢索提問檢索提問式41What?
Where?
How?42檢索是信息組織的反變換過程。信息組織的目的是將零散的信息組成一個有序的體系,檢索的目的則是迅速從這個體系中搜尋所需的信息。3信息檢索43信息檢索分類1).按存儲和檢索的內(nèi)容劃分為:文獻(xiàn)信息檢索數(shù)據(jù)信息檢索事實數(shù)據(jù)檢索
Referencebook
Database:
NumericDatabase(數(shù)字)
PropertyDatabase(特性)
Textual-numericDatabase(文本數(shù)字)
Full-textDatabase(全文)
TerminologicalDatabase(專業(yè))
GraphicDatabase(圖形)...**433信息檢索44對應(yīng)于信息檢索方法的操作主體,檢索方法可分為:手工檢索;機(jī)器檢索。3信息檢索45信息檢索特征:1)有確定的目標(biāo);2)有一個可能的信息解的集合;3)有一定的線索(即啟發(fā)信息);4)搜索過程是針對一定的目標(biāo)、遵循一定的線索,不斷縮小搜索范圍的求解過程。*453信息檢索46從信息資源管理的角度講,信息檢索是從已存儲的信息資源中檢索出與用戶提問相關(guān)的文獻(xiàn)、知識、事實、數(shù)據(jù)的邏輯運算和技術(shù)操作過程的總和,以文獻(xiàn)檢索為本源。
*463信息檢索47也就是說,這是一種從大量集合的文獻(xiàn)中查找出主題及其屬性符合用戶要求的情報過程。查找的對象不一定就是文獻(xiàn),有時也可能是正在研究中的項目,或正在進(jìn)行某項工作的人員與機(jī)構(gòu),或圖書館的藏書目錄等,但基本原理是一致的。48信息檢索能力(信息技能):
——尋求有關(guān)新知識的能力
具體表現(xiàn)為以下6種技能:
*483信息檢索49
1)明確任務(wù)(TaskDefinition):了解問題的癥結(jié),確定所需信息和目的,分清任務(wù)的輕重緩急;
2)信息查詢策略(InformationSeekingStrategies):了解各種信息源,能夠作出評價并確定優(yōu)先查找的次序;
*493信息檢索50
3)查找和檢索(LocationandAccess):確定信息藏址,從信息源中找出信息;
4)信息利用(UseofInformation):能夠讀懂(或聽懂、理解)查出的信息,了解信息在滿足需求中的特定價值;
*503信息檢索51
5)信息綜合(Synthesis):能夠組織信息,提供信息產(chǎn)品(論文、報告等);
6)信息評價(Evaluation):評價查找結(jié)果和解決問題的過程(效率)。
*513信息檢索52
檢索者一方面要弄清文獻(xiàn)的組織編排方式,要具有“解構(gòu)”能力;另一方面要善于分析提問,善于將信息需求轉(zhuǎn)化為可檢索的概念術(shù)語。這是一個雙向分析和匹配的過程,是一個以滿足用戶信息需求為目標(biāo),以用戶提問為線索,不斷縮小檢索范圍并查找用戶所需信息的過程。*523信息檢索53信息檢索方法:檢索方法的運用離不開各種檢索工具(如目錄、索引、文摘等),檢索技術(shù)的利用則離不開相關(guān)硬件和軟件。它們共同構(gòu)成了聯(lián)結(jié)信息資源體系和用戶信息需求的紐帶與橋梁。
*533信息檢索54
對應(yīng)于信息組織方法,信息檢索方法可分為:字順(如題名、著者等)檢索方法;類號檢索方法;主題檢索方法;
**543信息檢索55
檢索點:主題subject
分類classification
著者author
名稱title
號碼
code,coden...*553信息檢索56
主題途徑:是根據(jù)文獻(xiàn)所論述的主題,利用主題語言編制的主題索引而進(jìn)行的信息檢索。主題索引大多按字母排列方式,因此,檢索也要用相應(yīng)的方式。*563信息檢索57
分類途徑(classification):
是根據(jù)文獻(xiàn)所論述的主題內(nèi)容,利用分類語言的學(xué)科專業(yè)體系進(jìn)行的檢索。大多數(shù)檢索工具都采用分類語言作為正文編排體系的依據(jù),分類目次通常不采用字順排列類目和檢索類目,而是按照學(xué)科專業(yè)角度的層層邏輯劃分建立分類類目體系。檢索時要選擇合適的分類類目。
*573信息檢索58
著者途徑:作者(Author)/團(tuán)體著者(CorporateAuthor/Authors’Affiliation)檢索中,著者是一個廣義的概念,是對文獻(xiàn)內(nèi)容負(fù)有責(zé)任的作者、編者、譯者等,可以是個人、團(tuán)體、機(jī)構(gòu)、組織,甚至還包括著者的單位。通過著者途徑進(jìn)行檢索,主要可利用著者索引。所有著者索引都采用字順排列方式,如果著者是個人,就以個人姓名字順排列,如果著者是機(jī)構(gòu),就以機(jī)構(gòu)名稱字順排列。因此,檢索也應(yīng)該按相應(yīng)的途徑。*583信息檢索59
題名途徑(Title):檢索中,文獻(xiàn)題名是一個廣泛的概念,包括文獻(xiàn)篇名、圖書書名、期刊刊名。常見的題名索引主要有篇名索引、書名索引、刊名索引等。題名索引通常按字順排檢方式,因此,檢索也應(yīng)該采取相應(yīng)的途徑。*593信息檢索60
序號途徑:許多文獻(xiàn)除普通外表特征外,還具有序號特征,如,專利文獻(xiàn)有專利號、標(biāo)準(zhǔn)文獻(xiàn)有標(biāo)準(zhǔn)號、館藏文獻(xiàn)有索書號。序號索引一般按照文獻(xiàn)序號的大小順序排列,如文獻(xiàn)序號純粹由數(shù)字組成,就按數(shù)字大小生序排列,如果序號包含數(shù)字和字母,就按數(shù)字大小和字母順序升序排列。如果前面是字母后面是數(shù)字混合組成的序號,就先按字母順序排列,字母相同,再按后面的數(shù)字大小排列。因此,序號檢索也應(yīng)按照同樣方法。*603信息檢索61直檢法:專業(yè)核心期刊跟蹤常規(guī)法:順查法,倒查法,抽查法追溯法:參考文獻(xiàn),引用目錄綜合法:分段法,循環(huán)法,交替法3信息檢索62常用法順查法:從遠(yuǎn)及近查,用于了解某一事物發(fā)展的全過程,倒查法:由近及遠(yuǎn)查,重點為近期抽查法:查找某一段時間的文獻(xiàn)3信息檢索63
檢索詞/語言:SearchingLanguage&Thesaurus
描述檢索系統(tǒng)中信息特征與表達(dá)用戶信息提問的一種專門語言,是為溝通文獻(xiàn)信息用戶和文獻(xiàn)信息之間的語言,理論上講,是用于文獻(xiàn)標(biāo)引和檢索提問的約定語言。
非規(guī)范詞(非受控詞自由詞)uncontrolled,free-term/自然語言naturalLanguage規(guī)范詞(受控詞)controlled/人工語言ArtificialLanguage
主題詞表*633信息檢索64
按照表達(dá)文獻(xiàn)主題概念的語詞形式,有分類語言和主題語言。描述文獻(xiàn)信息內(nèi)容特征的語言:標(biāo)題詞語言SubjectHeading
單元詞語言Uniterm
敘詞語言Descriptor
關(guān)鍵詞語言Keyword
分類語言*643信息檢索65
例如規(guī)定:aircraft表示“飛機(jī)”而不用airplane;plane;aeroplane。作到文獻(xiàn)存儲和檢索的一致性。這些規(guī)范化詞的集合構(gòu)成了詞表。*653信息檢索66檢索效果查全率R(Recallratio)R=檢出的相關(guān)文獻(xiàn)量/檢索系統(tǒng)中相關(guān)文獻(xiàn)總量*100%查準(zhǔn)率P(Precisionratio)P=檢出的相關(guān)文獻(xiàn)量/檢出的文獻(xiàn)總量*100%3信息檢索67檢索方式
(1)命令檢索(commandsearch)
算符(operator)
檢索式(statementformula)(2)菜單檢索(menusearch)
提示選項填空*673信息檢索
68
檢索技術(shù)
(1)常用算符
邏輯算符(booleanoperator)*683信息檢索69
常用的布爾邏輯算符有三種:分別是邏輯或OR,+邏輯與AND,*,+邏輯非NOT,-。*693信息檢索70
(1)邏輯或“OR”邏輯或(AORB)檢索出凡含有檢索詞A或者含有檢索詞B或者同時含有檢索詞A和B的信息資源。邏輯或“OR”可以擴(kuò)大信息的檢索范圍,使用它相當(dāng)于增加檢索詞主題的同義詞與近義詞,能提高檢索的查全率。*E概念大小、關(guān)系*703信息檢索71
(2)邏輯與“AND”邏輯與(AANDB)檢索出同時含有檢索詞A和檢索詞B的信息。如果A和B無關(guān),則沒有命中文獻(xiàn),Q=0;如果A和B有一定相關(guān)性,則有M>Q>0,或N>Q>0;這表明,邏輯與“AND”可以縮小信息的檢索范圍,提高檢索的查準(zhǔn)率。*t*713信息檢索72(3)邏輯非“NOT”邏輯非(ANOTB)檢索出含有檢索詞A而不含有檢索詞B的信息資源。如果A與B無關(guān),則Q=M;如果A與B有一定相關(guān)性,則Q<M;如果A與B密切相關(guān),則當(dāng)M>N時,Q=M-N,當(dāng)M<N時,Q=0;因此,邏輯非“NOT”可以用來排除不希望出現(xiàn)的檢索詞,它與邏輯與“AND”的作用類似,能夠縮小命中信息的范圍,提高檢索的查準(zhǔn)率。*W
*723信息檢索73信息檢索過程和檢索策略無論是作為一種方法還是一種技術(shù),信息檢索都表現(xiàn)為一種過程,該過程始于用戶的信息提問而終于檢索結(jié)果的輸出。檢索策略是針對一定的檢索目標(biāo),圍繞信息檢索過程而制訂的具體實施計劃或?qū)嵤┓桨?,其實質(zhì)是對檢索過程的科學(xué)規(guī)劃,與檢索方法和檢索技術(shù)相比較,檢索策略更為具體,更為實用,更富于可操作性。3.信息檢索743信息檢索開始提問弄清(明確)問題的實質(zhì)提問的分析綜合處理用情報檢索語言表達(dá)提問,編制提問檢索式和檢索提問式切題文獻(xiàn)和信息的檢索形成檢索結(jié)果顯示檢索結(jié)果分析結(jié)果與提問的相關(guān)性結(jié)果不相關(guān)相關(guān)75維藥老鼠瓜抗風(fēng)濕性關(guān)節(jié)炎有效部位的新藥研究
ThestudyconcerningwithCapparisspinosaL.asanewmedicine
76檢索詞#1老鼠瓜或槌果藤或野西瓜CapparisspinosaL.#2類風(fēng)濕性關(guān)節(jié)炎RheumatoidarthritisorRA
檢索式#1*#2
77聚合物光漂白及其在光波導(dǎo)器件制備技術(shù)中的研究Studyonphotobleachingofpolymeranditsapplicationinfabricatingofopticalwaveguides78檢索策略:檢索詞:
#1光漂白photobleaching;#2聚合物polymer(PMMA/DR1、Poly-3BCMU和polydiacetylene);
#3波導(dǎo)光柵waveguidegrating;
#4、非線性光學(xué)
thethirdordernonlinearities;#5單光束掃描法z-scan;#6、雙光束掃描法twobeamscantechnique#7非線性定向耦合器nonlineardirectionalcoupler;#8
光柵耦合器chirpedgratingcoupler;檢索式:
#1*(#2+#3+#4+#5+#6+#7+#8)79精氨酸基因工程菌中試發(fā)酵工藝研究檢索詞:1.精氨酸arginine
2.基因工程菌gene-engineeringstrain3.黃色短桿菌brevibacteriumflavum
4.大腸桿菌escherichiacoli
5.合成componentorsynthesisorsynthetiae
6.發(fā)酵fermentation
檢索式:1*(2+3+4+5+6)80計算機(jī)檢索的特點信息量大信息及時檢索功能強(qiáng)檢索效率高3信息檢索81確定檢索點/詞檢索課題用戶
主題分析選擇檢索系統(tǒng)
選擇數(shù)據(jù)庫制定檢索式計算機(jī)處理結(jié)果檢驗
詞表NY82數(shù)據(jù)庫檢索網(wǎng)絡(luò)資源檢索3信息檢索833.2數(shù)據(jù)庫檢索3.2.1數(shù)據(jù)庫的基本概念數(shù)據(jù)庫的定義:
至少由一種文檔組成,能滿足特定目的的或特定數(shù)據(jù)處理系統(tǒng)需要的數(shù)據(jù)集合.3信息檢索84
3.2.2.數(shù)據(jù)庫的類型
(1)參考數(shù)據(jù)庫書目數(shù)據(jù)(bibliographicdatabase)目錄數(shù)據(jù)庫(catalogdatabase)文摘索引數(shù)據(jù)庫(abstract/index database)指南數(shù)據(jù)庫(directorydatabase)
3信息檢索85(2)源數(shù)據(jù)庫(sourcedatabase,databank)
數(shù)值數(shù)據(jù)庫(numericdatabase)
文本-數(shù)值數(shù)據(jù)庫(text-numericdatabase)全文數(shù)據(jù)庫(full-textdatabase)3信息檢索86有3.2.3四個必要的層次:字段(field)記錄(record)文檔(file)數(shù)據(jù)庫(database)3信息檢索871.字段(數(shù)據(jù)項)是組成數(shù)據(jù)庫的最小基本單位。它的作用是描述一個數(shù)據(jù)處理對象的某些屬性。如書目型的數(shù)據(jù)庫,字段可為文獻(xiàn)的篇名,作者,作者單位,刊名等。882.記錄與某一數(shù)據(jù)處理對象有關(guān)的一切數(shù)據(jù)項構(gòu)成了該對象的一條記錄。如書目型數(shù)據(jù)庫,一條記錄反映了一篇文獻(xiàn)的相關(guān)信息89例2書目型數(shù)據(jù)庫中的記錄
AutomaticdetectionoflungcancersinchestCTimagesbythevariableN-quoitfilter
Miwa,Tomoko;Kako,Jun-Ichi;Yamamoto,Shinji;Matsumoto,Mitsuomi;Tateno,Yukio;Iinuma,Takeshi;Matsumoto,Toru
AuthorAffiliation:Knowledge-BasedInfo.Eng.Dept.,ToyohashiUniversityofTechnologySource:SystemsandComputersinJapanv33n1January2002p53-63.InEnglish
Abstract
90
內(nèi)容Content
范圍Coverage
時效Currency
費用Cost選庫的4C原則:91中文數(shù)據(jù)庫的類型1)按提供信息加工的層次分參考數(shù)據(jù)庫包括書目數(shù)據(jù)庫、指南數(shù)據(jù)庫。源數(shù)據(jù)庫包括全文數(shù)據(jù)庫、數(shù)值數(shù)據(jù)庫、多媒體數(shù)據(jù)庫。2)按是否需要在線使用分:光盤數(shù)據(jù)庫:單機(jī)使用光盤、光盤鏡像。網(wǎng)絡(luò)聯(lián)機(jī)數(shù)據(jù)庫92《萬方數(shù)據(jù)資源系統(tǒng)》數(shù)據(jù)庫介紹
93概況是由中國科技信息研究所、萬方數(shù)據(jù)集團(tuán)公司開發(fā)的網(wǎng)上數(shù)據(jù)庫聯(lián)機(jī)檢索系統(tǒng)。2)收錄特色是一個以科技信息為主,集經(jīng)濟(jì)、金融、社會、文化、教育、衛(wèi)生等各行業(yè)信息于一體的信息服務(wù)系統(tǒng)。它包括110余個數(shù)據(jù)庫,歸屬5個子系統(tǒng),內(nèi)容涉及自然科學(xué)和社會科學(xué)各個專業(yè)領(lǐng)域,收錄范圍包括期刊、會議、文獻(xiàn)、題錄、報告、論文、標(biāo)準(zhǔn)專利、連續(xù)出版物、最新科技成果,稱得上是一個擁有海量信息的中文信息檢索系統(tǒng)。943.3網(wǎng)絡(luò)資源檢索基礎(chǔ)95因特網(wǎng)基礎(chǔ)96進(jìn)入90年代后,隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,尤其是互聯(lián)網(wǎng)的迅猛發(fā)展,使計算機(jī)檢索進(jìn)入一個嶄新的時期。檢索方法更簡單,檢索結(jié)果更全面;經(jīng)過40多年的發(fā)展,從早期的書目信息到后來的全文本信息,到今天的網(wǎng)絡(luò)與多媒體信息,網(wǎng)絡(luò)信息資源已成為現(xiàn)代社會不可缺少的資源財富;其處理技術(shù)從簡單的字段與關(guān)鍵詞檢索到全文檢索,再到今天成為網(wǎng)絡(luò)主流的超文本與多媒體處理。處理技術(shù)的演進(jìn)與發(fā)展,一方面使網(wǎng)絡(luò)信息資源的內(nèi)容從單一的書目到圖文并茂的多媒體,更富有吸引力和使用價值;另一方面,超文本的廣泛利用改變傳統(tǒng)的信息組織的線性方法,使電子資源的組織更接近于“自然”,大大方便了用戶的使用,使電資源的利用變得非常容易,用戶不需要太多的檢索知識與技術(shù)。97按提供的內(nèi)容網(wǎng)絡(luò)信息資源可分為:參考型數(shù)據(jù)庫:指引用戶到另一信息源以獲得原文或其他細(xì)節(jié)的一類數(shù)據(jù)庫。包括各種書目數(shù)據(jù)庫和引文數(shù)據(jù)庫。這種數(shù)據(jù)庫具有參考和評價的功能,多用于查新、開題。如:SCI、EI、維普的中文期刊數(shù)據(jù)庫……全文數(shù)據(jù)庫:指存儲文獻(xiàn)全文或其中主要部分的數(shù)據(jù)庫。如新聞消息全文庫、法律法規(guī)全文庫、人大報刊資料庫、博碩論文全文庫等。事實型數(shù)據(jù)庫:直接提供事實或數(shù)值的數(shù)據(jù)庫。如:萬方的企業(yè)產(chǎn)品數(shù)據(jù)庫、彼得森大學(xué)指南等。電子圖書:計算機(jī)利用計算機(jī)檢索并下載閱讀的圖書。如:書生之家、超星數(shù)字圖書館、各種數(shù)字圖書館等。電子期刊:直接在網(wǎng)上就可以檢索和閱讀的期刊。如:萬方數(shù)字化期刊,中國期刊網(wǎng)全文數(shù)據(jù)庫,scienceonline等電子報紙:如:人民日報的網(wǎng)絡(luò)版。其它類型:如軟件,新聞等98網(wǎng)絡(luò)信息資源的特點以網(wǎng)絡(luò)為傳播媒體以多媒體為內(nèi)容特征以現(xiàn)代信息技術(shù)為記錄手段數(shù)據(jù)結(jié)構(gòu)縣通用性、開放性和標(biāo)準(zhǔn)化高度的整合性,便于多種媒體一體化交互性能增強(qiáng)動態(tài)性、缺乏管理結(jié)構(gòu)復(fù)雜,分布廣泛99常用網(wǎng)絡(luò)類型代碼:
com商業(yè)機(jī)構(gòu)
mil軍事部門
edu教育機(jī)構(gòu)
net網(wǎng)管組織
gov政府部門
org非營利組織
int國際組織100WWW檢索工具的含義及類型廣義一種基于環(huán)球網(wǎng)(WWW)的信息查詢系統(tǒng)。包括信息存儲、信息管理和信息檢索。狹義一種為搜索環(huán)球網(wǎng)(WWW)上的網(wǎng)頁而設(shè)計的檢索軟件。101按檢索功能分:主題指南/目錄(SubjectGuidesorDirectory)按某種分類規(guī)則建成樹狀等級目錄.字順法、時序法、地序法。由人工干預(yù),保證了查準(zhǔn)率,但查全率較低。如Yahoo檢索引擎(SearchEngines)
通過Robot、Spider等自動跟蹤標(biāo)引軟件搜尋網(wǎng)絡(luò)資源。它不需要人工干涉,查全率較高,但查準(zhǔn)率較低。如AltaVista102按檢索內(nèi)容分:通用檢索工具是綜合性的信息檢索系統(tǒng),它往往基于檢索詞去匹配相關(guān)的內(nèi)容。時常也會因檢出內(nèi)容太泛而無法一一過目。如Yahoo、Go、AltaVista等。專業(yè)檢索工具是專業(yè)信息機(jī)構(gòu)根據(jù)專業(yè)需求,將Internet上資源進(jìn)行篩選整理、重新組織而形成專業(yè)信息檢索系統(tǒng),專業(yè)針對性較強(qiáng)。如MedicalWorldSearch、MedicalMatrix等。103Web通用檢索工具的使用104Yahoo!1994.4由美籍華人楊致遠(yuǎn)等創(chuàng)建。120萬個網(wǎng)址;14個主題逐級細(xì)分。有150個編輯人員維護(hù)。鼓勵用戶利用聯(lián)機(jī)表格遞交自己的網(wǎng)址。目錄提供多項服務(wù)(購物、免費郵件、拍賣、聊天和新聞等)的門戶105簡單檢索分類目錄點擊檢索
檢出結(jié)果:網(wǎng)址例:查找數(shù)字化圖書館106107108109高級檢索點擊AdvancedSearch3信息檢索110檢索方法:
1.檢索欄輸入:
必須檢索Hepatoma+diagnosis
排除檢索Liver-kidney
短語檢索“kidneyfailure”
右截詞檢索cap*
3信息檢索1112.其它方式選擇:
邏輯檢索(and,or);
區(qū)域選擇;
時間選擇等。3信息檢索112Google(http://www.google.com)"手氣不錯"按鈕自動將您帶到Google推薦的網(wǎng)頁。您無須查看其他結(jié)果,省時方便。不支持“or”,空格即代表and不支持“*”對大小寫不敏感專用詞語上加上雙引號支持“-”功能,用以有目的地刪除某些無關(guān)的網(wǎng)頁,但減號之前必須留一空格。3信息檢索113中文搜索引擎1.雅虎中文
http://cn.(簡體中文)2.搜狐
http://www.sohu.com.cn3.新浪網(wǎng)
http://www.sina.com4.Google中文
http://www.google.com114網(wǎng)絡(luò)資源查找圖書期刊技術(shù)報告專利會議文獻(xiàn)學(xué)位論文標(biāo)準(zhǔn)文獻(xiàn)115網(wǎng)上圖書資源網(wǎng)上中文數(shù)字化圖書
超星數(shù)據(jù)圖書館網(wǎng)址:書生數(shù)字圖書館網(wǎng)址:
中國數(shù)字圖書館網(wǎng)址:http://www.d-L.cn網(wǎng)上外文數(shù)字化圖書
NetLibrarye-book
網(wǎng)址:http://www.netlibrary.comSpringerLink
網(wǎng)址:http://link.springer.de/116網(wǎng)上期刊文獻(xiàn)資源
中文全文期刊重要數(shù)據(jù)庫:
重慶維普全文數(shù)據(jù)庫中國期網(wǎng)
網(wǎng)址:
萬方數(shù)據(jù)庫
網(wǎng)址:http://www.wanfangdata.com.cn/
中國期刊網(wǎng)
網(wǎng)址:
萬方數(shù)據(jù)庫網(wǎng)址:46
天津工業(yè)大學(xué)網(wǎng)址:0
117118中國期刊網(wǎng)Http://www.cnki.net119中國期刊網(wǎng)
http://www.cnki.net萬方數(shù)據(jù)資源系統(tǒng)http://www.wanfangdata.com.cn/121網(wǎng)上科技報告國研報告http://www.drcnet.com.cn
中國商業(yè)報告http://www.bjinfobank.comU.S.DepartmentofEnergy美國能源部科學(xué)技術(shù)信息網(wǎng)站。http://www.osti.gov.ScientificandTechnicalReportCollection
美國國防部(DepartmentofDefense)提供的科技報告,涉及國防極其相關(guān)領(lǐng)域。Http://www.dtic.milNASAScientificandTechnicalInformationProgramNASA(NationalAeronautices&SpaceAdministration)提供的有關(guān)航空航天方面的豐富的科技報告全文。http://www.sti.nasa.govNationalTechnicalInformationService(NTIS)
提供美國政府工作報告。http://www.ntis.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 衣物代洗協(xié)議書
- 語文合作協(xié)議書
- 幼兒代餐協(xié)議書
- 裝修勞務(wù)協(xié)議書
- 小程序合同協(xié)議
- 自愿走讀協(xié)議書
- 學(xué)生招聘協(xié)議書
- 詳細(xì)雇傭合同范本
- 2026年上半年湖南株洲市市直單位公益性崗位招聘16人考試重點題庫及答案解析
- 資產(chǎn)頂賬協(xié)議書
- Know Before You Go:趣談“一帶一路”國家智慧樹知到期末考試答案章節(jié)答案2024年貴州理工學(xué)院
- JBT 11270-2024 立體倉庫組合式鋼結(jié)構(gòu)貨架技術(shù)規(guī)范(正式版)
- 求職OMG-大學(xué)生就業(yè)指導(dǎo)與技能開發(fā)智慧樹知到期末考試答案章節(jié)答案2024年中國海洋大學(xué)
- JBT 7387-2014 工業(yè)過程控制系統(tǒng)用電動控制閥
- A課堂懲罰游戲
- 整理收納師行業(yè)分析
- GB/T 228.1-2021金屬材料拉伸試驗第1部分:室溫試驗方法
- 氫能與燃料電池-課件-第五章-制氫技術(shù)
- 2023QC小組活動基礎(chǔ)知識培訓(xùn)
- 生理學(xué)期末考試復(fù)習(xí)試題庫及答案
- 旅游地理學(xué) 國家公園建設(shè)與管理
評論
0/150
提交評論