華科大信息檢索課件3-1檢索語(yǔ)言概述_第1頁(yè)
華科大信息檢索課件3-1檢索語(yǔ)言概述_第2頁(yè)
華科大信息檢索課件3-1檢索語(yǔ)言概述_第3頁(yè)
華科大信息檢索課件3-1檢索語(yǔ)言概述_第4頁(yè)
華科大信息檢索課件3-1檢索語(yǔ)言概述_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Chap3RetrievalLanguage3-1檢索語(yǔ)言概述3-2分類檢索語(yǔ)言3-3主題檢索語(yǔ)言思考題

課題4:經(jīng)濟(jì)管理網(wǎng)絡(luò)信息分類的基本特征13-1檢索語(yǔ)言概述一、檢索語(yǔ)言的概念和特點(diǎn)二、檢索語(yǔ)言的類型與譜系三、檢索語(yǔ)言的構(gòu)成和基本功能四、檢索語(yǔ)言的基本原理五、檢索語(yǔ)言的基本要求2一、信息檢索語(yǔ)言的概念和特點(diǎn)信息檢索語(yǔ)言是根據(jù)信息檢索的需要而創(chuàng)制的人工語(yǔ)言,其實(shí)質(zhì)是表達(dá)一系列概括文獻(xiàn)信息內(nèi)容的概念及其相互關(guān)系的概念標(biāo)識(shí)系統(tǒng)。它可以是從自然語(yǔ)言中精選出來(lái)并加以規(guī)范化的一套詞匯,也可以是代表某種分類體系的一套分類號(hào)碼,還可以是代表某一類事物的某一方面特征的一套代碼,用以對(duì)文獻(xiàn)內(nèi)容和信息需要進(jìn)行主題標(biāo)引、邏輯分類或特征描述。⑴簡(jiǎn)明扼要地表達(dá)文獻(xiàn)及其檢索課題的主題概念,使詞語(yǔ)和概念一一對(duì)應(yīng),排除一詞多義、多詞一義或詞義含糊等現(xiàn)象。⑵科學(xué)準(zhǔn)確地匹配概念,即將檢索時(shí)的標(biāo)引用語(yǔ)和檢索用語(yǔ)進(jìn)行相符性比較。⑶全面有效地顯示概念之間的相互關(guān)系。采用等級(jí)結(jié)構(gòu)、參照系統(tǒng)、輪排聚類法、范疇聚類法和圖示法等各種顯示概念之間關(guān)系的方法,來(lái)實(shí)現(xiàn)對(duì)內(nèi)容相同或相關(guān)的信息加以集中或揭示其相關(guān)性。3二、檢索語(yǔ)言的類型與譜系2、1依據(jù)檢索語(yǔ)言的構(gòu)成原理,把檢索語(yǔ)言劃分為分類檢索語(yǔ)言、主題檢索語(yǔ)言、分類-主題一體化語(yǔ)言、代碼語(yǔ)言和引文語(yǔ)言等類型。2、2依據(jù)檢索語(yǔ)言的受控情況,把檢索語(yǔ)言分為ArtificialLanguage和NaturalLanguage。此外,可以按檢索語(yǔ)言的學(xué)科或?qū)I(yè)范圍、適用范圍、檢索標(biāo)識(shí)的組合使用方法以及對(duì)信息特征的描述等標(biāo)準(zhǔn),對(duì)檢索語(yǔ)言進(jìn)行劃分。2、3檢索語(yǔ)言的譜系42、1按構(gòu)成原理對(duì)檢索語(yǔ)言進(jìn)行劃分分類檢索語(yǔ)言是指使用分類號(hào)碼表達(dá)文獻(xiàn)主題標(biāo)識(shí),并按照知識(shí)分類的原理加以排列的一類信息檢索語(yǔ)言。主題檢索語(yǔ)言則是指使用名詞術(shù)語(yǔ)表達(dá)文獻(xiàn)主題標(biāo)識(shí),并照按字順加以排列的一類信息檢索語(yǔ)言。分類檢索語(yǔ)言和主題檢索語(yǔ)言相互影響、滲透、補(bǔ)充和結(jié)合,從而出現(xiàn)了分類主題一體化語(yǔ)言,即分類語(yǔ)言和敘詞語(yǔ)言在術(shù)語(yǔ)系統(tǒng)、參照系統(tǒng)、標(biāo)識(shí)系統(tǒng)和索引系統(tǒng)等方面完全實(shí)現(xiàn)兼容所組成的統(tǒng)一體。如分面敘詞表、敘詞表式字順?biāo)饕?、分類?敘詞表對(duì)照索引及集成詞表等等。代碼檢索語(yǔ)言是指用來(lái)標(biāo)引、檢索特定專業(yè)文獻(xiàn)的某種代碼系統(tǒng)。引文檢索語(yǔ)言則是基于文獻(xiàn)之間的引證關(guān)系而形成的一種檢索語(yǔ)言。它以引文為檢索詞,根據(jù)引證關(guān)系將有關(guān)文獻(xiàn)自然地耦合在一起。52、2按語(yǔ)言受控情況對(duì)檢索語(yǔ)言進(jìn)行劃分ArtificialLanguage是指采用Controlledterm并進(jìn)行人工控制的語(yǔ)言,或稱受控語(yǔ)言。所謂規(guī)范詞是指采用特定的詞匯來(lái)專指或網(wǎng)羅相應(yīng)的概念,它們能夠?qū)νx詞、近義詞、相關(guān)詞、多義詞及縮略語(yǔ)等進(jìn)行規(guī)范。使用規(guī)范詞能夠提高檢索效率。單元詞語(yǔ)言、標(biāo)題詞語(yǔ)言、敘詞語(yǔ)言等都是規(guī)范語(yǔ)言。NaturalLanguage是指采用Uncontrolledterm,即不加規(guī)范、不受控制的Freeterm,它們直接來(lái)自所處理的文獻(xiàn)本身的標(biāo)引用語(yǔ)或檢索用語(yǔ),在使用前未經(jīng)優(yōu)選和規(guī)范化處理。62、3檢索語(yǔ)言的譜系一般地,可以將檢索語(yǔ)言類型按親屬關(guān)系劃分為4個(gè)層次,從而構(gòu)成檢索語(yǔ)言的譜系。

檢索語(yǔ)言語(yǔ)系檢索語(yǔ)言語(yǔ)族檢索語(yǔ)言語(yǔ)支檢索語(yǔ)言語(yǔ)種描述文獻(xiàn)內(nèi)容分類檢索語(yǔ)言標(biāo)題詞法特征的檢索語(yǔ)言主題檢索語(yǔ)言元詞法分類主題一體敘詞法漢語(yǔ)主題詞表描述文獻(xiàn)外在化語(yǔ)言鍵詞法特征的檢索語(yǔ)言

7三、檢索語(yǔ)言的構(gòu)成和基本功能1、檢索語(yǔ)言的構(gòu)成。檢索語(yǔ)言包括兩個(gè)部分:一是檢索語(yǔ)言詞匯,即登錄在分類表、詞表中的全部標(biāo)識(shí)。一個(gè)標(biāo)識(shí)(分類號(hào)、檢索詞、代碼)就是它的一個(gè)語(yǔ)詞,而分類表、詞表、代碼表則是它的詞典。二是檢索語(yǔ)言語(yǔ)法,它是指如何創(chuàng)造和運(yùn)用那些標(biāo)識(shí)來(lái)正確表達(dá)文獻(xiàn)內(nèi)容和信息需要,以有效地實(shí)現(xiàn)信息檢索的一整套規(guī)則。檢索語(yǔ)言語(yǔ)法可以進(jìn)一步分為詞法和句法兩個(gè)方面。2、檢索語(yǔ)言的基本功能。對(duì)文獻(xiàn)的信息知識(shí)內(nèi)容及某些外部特征加以標(biāo)引;對(duì)內(nèi)容相同或相關(guān)的信息加以集中或揭示其相關(guān)性;對(duì)大量信息加以系統(tǒng)化或組織化;便于對(duì)標(biāo)引用語(yǔ)和檢索用語(yǔ)進(jìn)行相符性比較。8四、檢索語(yǔ)言的基本原理1、基本原理與機(jī)制之一:概念邏輯概念邏輯是揭示事物本質(zhì)屬性及各種事物之間聯(lián)系與區(qū)別的科學(xué)思維方式,它反映概念之間的關(guān)系,確定概念的類型、內(nèi)涵和外延等。檢索語(yǔ)言就是運(yùn)用概念之間的各種關(guān)系,對(duì)文獻(xiàn)內(nèi)容和外部特征進(jìn)行標(biāo)引。具體而言,概念的劃分與概括,側(cè)重于概念的隸屬關(guān)系和并列關(guān)系,并據(jù)此建立檢索語(yǔ)言的概念等級(jí)體系。概念的分析與綜合,主要是利用概念的交叉關(guān)系,依此建立檢索語(yǔ)言的概念組配體系。2、基本原理與機(jī)制之二:知識(shí)分類知識(shí)分類是指以各門科學(xué)所研究的運(yùn)動(dòng)形態(tài)的固有特征及其互相關(guān)聯(lián)與轉(zhuǎn)變的次序?yàn)橐罁?jù),對(duì)整個(gè)科學(xué)知識(shí)領(lǐng)域所做的分類。目的是考察各門科學(xué)之間的區(qū)別與聯(lián)系,確定各門科學(xué)的內(nèi)部結(jié)構(gòu),建立相應(yīng)的分類體系,以反映當(dāng)代科技水平并指導(dǎo)科學(xué)的發(fā)展。9五、信息檢索語(yǔ)言的基本要求1、保證較高的檢全率和檢準(zhǔn)率。2、能滿足多種檢索要求。從學(xué)科、專業(yè)出發(fā)的族性檢索,從事物出發(fā)的特性檢索,多途徑、多因素檢索以及檢索范圍的自由改變。3、易于標(biāo)引,易于檢索,減少

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論