文獻(xiàn)檢索語言.ppt_第1頁
文獻(xiàn)檢索語言.ppt_第2頁
文獻(xiàn)檢索語言.ppt_第3頁
文獻(xiàn)檢索語言.ppt_第4頁
文獻(xiàn)檢索語言.ppt_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、文獻(xiàn)信息檢索語言,一,文獻(xiàn)信息檢索語言及其應(yīng)用,(一)文獻(xiàn)檢索語言的含義和種類1 .檢索語言的含義檢索語言是描述信息系統(tǒng)中文獻(xiàn)信息的內(nèi)容特征和外部特征,用于表達(dá)用戶信息檢索問題的專用語言。 分為正規(guī)化語言和非正規(guī)化語言。 正規(guī)化語言是人工控制和規(guī)范文獻(xiàn)檢索用語的概念,對同義詞、多義詞、同義詞等進(jìn)行正規(guī)化處理,用同一個(gè)詞表達(dá)一個(gè)概念。 非正規(guī)化語言也稱為關(guān)鍵詞、自由語等自然語言。 2 .檢索語言的種類(1)文獻(xiàn)內(nèi)容特征檢索語言a分類檢索語言b主題檢索語言c代碼檢索語言;(2)文獻(xiàn)外部特征檢索語言a標(biāo)題索引系統(tǒng)b著者索引系統(tǒng)c文獻(xiàn)編號索引d引用索引系統(tǒng)2分類檢索語言的應(yīng)用現(xiàn)在分類檢索語言的應(yīng)用主要

2、是體系分類語言。 從知識分類的角度揭示文獻(xiàn)內(nèi)容上的差異和聯(lián)系,從學(xué)科分類中提供以分類編號為檢索標(biāo)志的檢索路徑。 (3)主題檢索語言及其應(yīng)用1主題檢索語言的含義是按文獻(xiàn)研究內(nèi)容和主題制作的檢索語言,是以主題語、關(guān)鍵詞為檢索標(biāo)識的一種檢索語言。 2主題檢索語言的應(yīng)用主題檢索語言的應(yīng)用主要是主題字句和關(guān)鍵詞法。 (1)主題字句主題語(Subject headings )也被稱為敘利亞語(Descriptor ),是規(guī)范的統(tǒng)一的科學(xué)技術(shù)名詞用語。 (2)關(guān)鍵詞法關(guān)鍵詞是能夠表現(xiàn)從文獻(xiàn)的編名、標(biāo)題、摘要、正文中提取的文檔主題的概念,被稱為檢索條目的重要名詞和用語。 關(guān)鍵詞適合修訂機(jī)自動(dòng)建立索引的需要。

3、(4)醫(yī)學(xué)信息檢索語言及其應(yīng)用1醫(yī)學(xué)信息檢索語言的含義用于表達(dá)醫(yī)學(xué)信息的語言、文字、圖形、圖像等都有一定的規(guī)律性,必須加上人和計(jì)算機(jī)識別和處理容易的代碼,即數(shù)字、文字、文字等符號。 這就是醫(yī)學(xué)信息代碼,是醫(yī)學(xué)數(shù)據(jù)庫交換和醫(yī)學(xué)信息保存、檢索、交流、共享的基礎(chǔ),又稱醫(yī)學(xué)信息檢索語言。 2醫(yī)學(xué)信息檢索語言的應(yīng)用目前沒有關(guān)于醫(yī)學(xué)術(shù)語和編碼的正式國際標(biāo)準(zhǔn),但以下醫(yī)學(xué)信息編碼系統(tǒng)已為世界各國所參考。 2醫(yī)學(xué)信息檢索語言的應(yīng)用目前對于醫(yī)學(xué)術(shù)語和編碼還沒有正式的國際標(biāo)準(zhǔn),但以下醫(yī)學(xué)信息編碼系統(tǒng)已為世界各國所參考。 (1)國際疾病分類法(ICD) (2)國際系統(tǒng)醫(yī)學(xué)術(shù)語表(SNOMED) (3)一體化醫(yī)學(xué)語言系

4、統(tǒng)(UMLS) (4)現(xiàn)代操作術(shù)語表(CPT ),二、醫(yī)學(xué)主題詞表及其應(yīng)用,但是自然語言在信息檢索方面有不足之處。 2詞匯控制(1)壓縮、優(yōu)選、規(guī)范處理自然語言詞匯。 (2)對自然語言進(jìn)行語義處理,構(gòu)筑具有與概念體系相對應(yīng)的層次結(jié)構(gòu)的用語體系(即詞匯體系)。 (二)醫(yī)學(xué)主題詞表(Medical Subject Headings )簡稱(MeSH )此表是美國國家醫(yī)學(xué)圖書館(NLM )為生物醫(yī)學(xué)文獻(xiàn)的指標(biāo)和檢索制定的權(quán)威性術(shù)語控制工具。 收集了約2萬2千個(gè)標(biāo)準(zhǔn)化的醫(yī)學(xué)主題語和83個(gè)副主題語。 是Medline、PubMed、CBMdisc等數(shù)據(jù)庫系統(tǒng)的主題詞檢索指南,也是主題指標(biāo)者和檢索者檢索文

5、獻(xiàn)和文獻(xiàn)時(shí)的用語上的標(biāo)準(zhǔn)一致。 MeSH詞表由字序表(Alphabetic List )和樹結(jié)構(gòu)表(Tree Structures )兩部分組成。單字順序表(Alphabetic List )將主題詞、項(xiàng)目詞、類別詞按字母順序排列,通過詞下的樹結(jié)構(gòu)編號、注釋和參照系統(tǒng)揭示詞之間的復(fù)雜語義關(guān)系,幫助讀者在檢索時(shí)選擇規(guī)范的主題詞。 2樹結(jié)構(gòu)表(Tree Structure) (1)樹結(jié)構(gòu)表的結(jié)構(gòu)a .類別表b .類別表(2)樹結(jié)構(gòu)表的功能a .檢索者能夠按學(xué)科體系選擇主題語。 b .有助于檢索者擴(kuò)大檢索范圍、提高對照率、縮小檢索范圍、提高對照率。 c .用樹形編號決定所選單詞的學(xué)科范圍。 (3)樹

6、結(jié)構(gòu)表的應(yīng)用,三,文獻(xiàn)主題分析和指標(biāo),(1)主題指標(biāo)的概念1主題指標(biāo)的定義指標(biāo)從字面解釋,“指標(biāo)”用標(biāo)記,“引用”用指導(dǎo),指標(biāo)用標(biāo)記指導(dǎo)。 這里所說的索引是指文獻(xiàn)處理的索引。 即指標(biāo)是對文獻(xiàn)進(jìn)行主題分析,從自然語言向規(guī)范化的檢索語言轉(zhuǎn)換的過程,對文獻(xiàn)賦予分類編號的過程,對稱為分類指標(biāo)的文獻(xiàn)賦予主題詞標(biāo)識的過程,稱為主題指標(biāo)。 2索引與檢索的關(guān)系主題索引與文獻(xiàn)檢索有著密切的關(guān)系,索引所采用的主題詞是建立檢索系統(tǒng)索引的目的依據(jù),是文獻(xiàn)記憶與檢索的橋梁。 文獻(xiàn)用引號編入檢索系統(tǒng),檢索是引號的反過程,通過在檢索時(shí)對用戶的課題進(jìn)行主題分析,將課題內(nèi)容變換為主題詞,在該主題詞與文獻(xiàn)記憶時(shí)的主題詞一致的情況

7、下,表示檢索命中。 因此,指標(biāo)是基礎(chǔ)手段,檢索是目的。 (2)指標(biāo)深度和指標(biāo)等級,1指標(biāo)深度指標(biāo)深度分析一個(gè)文獻(xiàn)內(nèi)容特征和外部特征,描述達(dá)到的深度,根據(jù)分析結(jié)果給出指標(biāo)的數(shù)量。 一般IM的指標(biāo)深度為25個(gè),MEDLINE為十幾個(gè)。 指標(biāo)深度多根據(jù)讀者的對象、文獻(xiàn)數(shù)、專業(yè)內(nèi)容、檢索方式來決定指標(biāo)深度。 2指標(biāo)等級(1)主要指標(biāo)(Major MeSH Headings,Mjme )也被稱為一級指標(biāo)。 是文獻(xiàn)論述的重點(diǎn)、文獻(xiàn)核心主題概念的標(biāo)志。 醫(yī)學(xué)領(lǐng)域最常見的是a某實(shí)驗(yàn)研究的直接目的和結(jié)果。 b臨床疾病的預(yù)防、診斷、治療等重要手段、方法及創(chuàng)新。 在c1篇文章中占了篇幅多的內(nèi)容。 d篇幅雖少,但材料

8、新穎、創(chuàng)造性、有關(guān)心讀者的內(nèi)容。 e主要用加權(quán)符號“*”表示。 像“存儲新聞/調(diào)查”一樣。 f敘詞表和索引規(guī)則中規(guī)定了成為主要索引的概念。 主要指標(biāo)用于IM,也用于MEDLINE檢索系統(tǒng)。 (2)次要指標(biāo)(Minor MeSH Headings,Mime )也稱為次要指標(biāo)。 指文章論述的下一個(gè)重點(diǎn)概念的標(biāo)志。 最常見的是,a有主要指標(biāo)的分組指標(biāo)詞。 b為某研究目的而提供的職業(yè)、條件、方法和手段。 c治療學(xué)中提到的藥物的劑型、劑量、給藥方式。 d機(jī)器檢索的特征語,例如是人的性別、年齡組、動(dòng)物的種類(大鼠、鼠、狗、貓)、妊娠等。 在e文獻(xiàn)中作為主題語的關(guān)鍵詞、抽出詞或者附加成分。 例如地名、時(shí)代、

9、文獻(xiàn)類型、語言等。 二次指標(biāo)僅用于MEDLINE等數(shù)據(jù)檢索系統(tǒng)。 IM不是次要指標(biāo)。 (3)主題指標(biāo)的基本原則,1指標(biāo)者根據(jù)詞典選擇最符合文獻(xiàn)概念的主題詞進(jìn)行指標(biāo)。 2指標(biāo)的主題詞專業(yè)性要適當(dāng)。 如果詞典中有專業(yè)的下位主題語的話,就不用上位主題語的指標(biāo)。 例如,在與“左心室肥大”有關(guān)的文章中,文章的內(nèi)容主要是在討論“左心室肥大”時(shí),應(yīng)該指主題詞“左心室肥大”,而不是指其上位主題詞“心臟肥大”。 3指標(biāo)文獻(xiàn)的主題概念必須全面。 例如,有關(guān)“老年糖尿病患者肝葡萄糖代謝”的文章,必須考慮各個(gè)概念:按照標(biāo)準(zhǔn)規(guī)則:糖尿病/代謝肝臟/代謝葡萄糖/代謝特征詞:老年人; 男性。這樣,可以從不同的角度檢索相同的

10、文獻(xiàn)。 4文獻(xiàn)中的某個(gè)主題概念在詞典中找不到正確的先行主題語的情況下,應(yīng)該考慮用主題語和副主題語組合的共同概念來標(biāo)識。 例如,“腎靜脈造影術(shù)”在同義詞詞典中僅設(shè)有靜脈造影術(shù)(phlebography ),與腎靜脈造影術(shù)的概念相比還存在差異的情況下,可以用“renal veins/radiography”更恰當(dāng)?shù)刂笜?biāo)這個(gè)文獻(xiàn)。 用、5個(gè)詞表示。 文獻(xiàn)中的一些主題概念找不到與詞典相對應(yīng)的主題詞,無法分組的情況下,可以采用單詞基準(zhǔn)。 可以采用高級主題詞索引,也可以選擇同義詞索引。 也就是說,您可以選擇意義相近的主題詞來編制索引。 如果需要,也可以選擇自由詞基準(zhǔn)。 例如,(1)上級主題詞指標(biāo):甲基蓮心

11、堿生物堿類(上級) (2)同義詞指標(biāo):上消化道出血胃腸出血。 用詞表擴(kuò)大檢索范圍,可以得到更密切相關(guān)的文獻(xiàn)。 (4)主題索引的具體原則,1 )分組配置原則(1)詞典規(guī)定的范圍和分組配置原則(2)主題語的規(guī)范化(3)主題語(4)副主題語的使用次數(shù),2 )分組配置的類型(1) 主題語和主題語精神分裂癥時(shí)腦的5 -羥色胺代謝2眼結(jié)核致失明3食脂肪致動(dòng)脈硬化4組胺致消化性潰瘍5抑郁癥時(shí)腦脊髓液中的鋰6 -阿莫西林對胃炎7 -姜黃素的抗腫瘤治療的實(shí)驗(yàn)研究8腦外科手術(shù)后腦出血9肝臟的肝糖原的生物合成10高麗參的化學(xué)成分和藥理作用4, 一體化醫(yī)學(xué)語言系統(tǒng)(Unified Medical Language S

12、ystem,UMLS ),(一)建立一體化醫(yī)學(xué)語言系統(tǒng)的意義一體化醫(yī)學(xué)語言系統(tǒng)是1986年至今由美國國家醫(yī)學(xué)圖書館主辦的長期研究與開發(fā)計(jì)劃。 本研究建立了計(jì)算機(jī)化的可持續(xù)生物醫(yī)學(xué)檢索語言集成系統(tǒng)和機(jī)器讀取信息資源指南系統(tǒng),其目標(biāo)是提高計(jì)算機(jī)程序理解生物醫(yī)學(xué)術(shù)語含義的能力,利用這一理解,用戶可以通過多種交互式檢索程序, 由于不同的系統(tǒng)檢索語言的差異和不同的數(shù)據(jù)庫相關(guān)信息的分散性,有很多的信息檢索,(2)一體化醫(yī)學(xué)語言系統(tǒng)的主要構(gòu)成部分1超級詞典2語義網(wǎng)絡(luò)(1)語義類型(2)語義關(guān)系(3)語義網(wǎng)絡(luò)3專家詞典,The End,醫(yī)學(xué)主題詞典因此,在分組指標(biāo)時(shí)根據(jù)副主題詞的使用范圍和注釋表有規(guī)律地分組。

13、 因此,在醫(yī)學(xué)主題詞表的基礎(chǔ)上,對表現(xiàn)幾個(gè)主題概念的同義詞、同義詞、多義詞、學(xué)名和俗名進(jìn)行規(guī)范化處理,選擇規(guī)范化的主題詞進(jìn)行主題指標(biāo)。 同一主題的文獻(xiàn)根據(jù)指標(biāo)分散,不影響調(diào)查率。 中風(fēng)可見腦血管事故。維生素c可見抗壞血酸等。 所以,根據(jù)專業(yè)的指導(dǎo)原則,第一組的主題語必須優(yōu)先,如果有第一組的主題語的話,副主題語也可以不分組。 例如,“肝糖原”不是“肝糖原”而是“肝糖原”。 “血管緊張素轉(zhuǎn)換酶抑制劑”不是“血管緊張素轉(zhuǎn)換酶類/拮抗劑和抑制劑”,而是標(biāo)記為“血管緊張素轉(zhuǎn)換酶抑制劑”。 于是,在同一主題語下,對多方面進(jìn)行論述,IM最多只能分配3次子主題語群。 如果需要使用三個(gè)以上的副主題語,則主題語與

14、副主題語群不一致。例如:胰腺炎的診斷、治療和預(yù)防標(biāo)記:胰腺炎/診斷胰腺炎/胰腺炎的治療/預(yù)防和控制、回?fù)簦?a用兩個(gè)以上的主題概念組合例:出血性胃潰瘍:胃潰瘍消化性潰瘍出血鞏膜疾病:眼病鞏膜b主題語和地理名詞組合例:南京的空氣污染:空氣污染南京c主題語和文獻(xiàn)類型組合例:嬰兒肝癌的一例報(bào)告:肝腫瘤嬰兒病例報(bào)告d主題語和人的年齡組合例:老年人的心率和動(dòng)物名稱的組合例:大鼠的實(shí)驗(yàn)性糖尿病:糖尿病,實(shí)驗(yàn)性大鼠動(dòng)物,回報(bào)例: a .高血壓的病因?qū)W標(biāo)準(zhǔn):高血壓/病因?qū)Wb .糖尿病的飲食療法標(biāo)準(zhǔn):糖尿病/飲食療法不標(biāo)準(zhǔn):糖尿病/治療c .尿激酶治療心肌梗塞標(biāo)準(zhǔn):心肌梗塞/藥物療法尿激酶/治療應(yīng)用d .甲狀腺

15、功能亢進(jìn)所致充血性心力衰竭標(biāo)準(zhǔn):甲狀腺功能亢進(jìn)充血性/病因?qū)We甲醛中毒所致失明標(biāo)志:甲醛中毒盲化學(xué)誘導(dǎo),返回以下為常用主題詞和副主題詞的組合模式: (1)一種疾病引起另一種疾病時(shí),疾病A/與并發(fā)癥兩種疾病有因果關(guān)系疾病B /病因?qū)W例:高血壓所致腦血管意外高血壓/并發(fā)癥腦血管意外/病因?qū)W疾病A /并發(fā)癥兩種疾病有因果關(guān)系疾病B /并發(fā)癥例:類類風(fēng)濕性關(guān)節(jié)炎伴心肌炎、類風(fēng)濕性并發(fā)癥心肌炎/并發(fā)癥、(2)治療某些藥物時(shí)的疾病/藥物療法藥物/治療應(yīng)用例:卡托普利治療高血壓卡托普利/治療應(yīng)用高血壓/藥物療法(3)某些化學(xué)物質(zhì)引起疾病時(shí)的疾病/化學(xué)誘導(dǎo)藥物/副作用或中毒例:甲醛中毒致盲的甲醛/中毒盲/化學(xué)

16、誘導(dǎo)(4) 實(shí)施某種治療技術(shù)產(chǎn)生的某種疾病時(shí)技術(shù)操作/副作用與手術(shù)直接相關(guān)的疾病/病因?qū)W例:門腔靜脈分流術(shù)后肝昏睡門腔靜脈分流術(shù),外科/副作用肝昏睡/病因?qū)W疾病手術(shù)與并發(fā)癥之間無直接關(guān)系的手術(shù)名稱手術(shù)后并發(fā)癥例:膽囊切除術(shù)后并發(fā)肺炎的膽囊切除術(shù)后并發(fā)癥,(5) 化學(xué)藥品對器官、組織或生理過程代謝的影響和作用器官、組織/藥物作用藥物或化學(xué)物質(zhì)/藥理學(xué)例子:甘露醇對冠狀動(dòng)脈超微結(jié)構(gòu)的影響甘露醇/藥理學(xué)冠狀動(dòng)脈/藥物作用冠狀動(dòng)脈/超微結(jié)構(gòu);(6)疾病狀態(tài)下血液、尿、腦脊髓液中的化學(xué)物質(zhì)疾病/血液(尿、腦脊髓液)化學(xué)物質(zhì)血液(尿、腦脊髓液)例:孕婦血液中5 -羥色胺含量妊娠/血液5 -羥色胺/血液,(7)檢測疾病狀態(tài)時(shí)血液、尿、腦脊髓液中的酶變化疾病/酶學(xué)酶/血液(尿、腦脊髓液)例:腦膜炎患者血中的醛化酶腦膜炎/酶學(xué)醛化酶/血液,(8)疾病狀態(tài)多語言生物醫(yī)學(xué)詞典,包括代謝疾病/概念、術(shù)語、詞匯及其等級類別、屬性與詞語之間的關(guān)系。 修改UMLS語義網(wǎng)絡(luò)來表示概念、術(shù)語之間的復(fù)雜關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論