外文翻譯--模糊數(shù)據(jù)表示和XML數(shù)據(jù)庫(kù)查詢_第1頁(yè)
外文翻譯--模糊數(shù)據(jù)表示和XML數(shù)據(jù)庫(kù)查詢_第2頁(yè)
外文翻譯--模糊數(shù)據(jù)表示和XML數(shù)據(jù)庫(kù)查詢_第3頁(yè)
外文翻譯--模糊數(shù)據(jù)表示和XML數(shù)據(jù)庫(kù)查詢_第4頁(yè)
外文翻譯--模糊數(shù)據(jù)表示和XML數(shù)據(jù)庫(kù)查詢_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、(附件1:外文譯文一)International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems Vol. 15, Suppl. (February 2007) 43-57 World Scientific Publishing Company模糊數(shù)據(jù)表示和XML數(shù)據(jù)庫(kù)查詢EKlN USTUNKAYA and ADNAN YAZICIDepartment of Computer Engineering, Middle East Technical University, 06531, Ankara - Turkey E

2、mail: ell2925, HYPERLINK mailto:yazicij.tr yazicij.trROY GEORGE*Department of Computer Science, Clark-Atlanta University, Atlanta, GA, USAEmail: HYPERLINK mailto:rkavil rkavil真實(shí)世界的信息,包括主觀的意見(jiàn)和判斷,需要不精確數(shù)據(jù)為藍(lán)本來(lái)表示并在數(shù)據(jù)庫(kù)中 查詢。近年來(lái),可擴(kuò)展標(biāo)記語(yǔ)言(XML)事實(shí)上已經(jīng)成為數(shù)據(jù)建模和交流的標(biāo)準(zhǔn)。在XML中, 對(duì)不精確性的建模和代表這些數(shù)據(jù)做出的努力沒(méi)有得到充分發(fā)展。本文中,提出了基于匚 的模

3、糊數(shù)據(jù)表示和查詢系統(tǒng)。用模糊擴(kuò)展的XML來(lái)表示復(fù)雜和不精確的數(shù)據(jù)。這種表示法形 成了一個(gè)基礎(chǔ)系統(tǒng),能夠在XML文檔使用XML的一種查詢語(yǔ)言XQuery進(jìn)行模糊查詢。該系 統(tǒng)還可以通過(guò)XML架構(gòu)重組,合并XML元素文件。通過(guò)使用此功能的系統(tǒng),應(yīng)用程序特定的 XML架構(gòu)和XML文件可以從現(xiàn)有的文件中產(chǎn)生。關(guān)鍵字:模糊查詢,XML,原生XML數(shù)據(jù)庫(kù)。1、簡(jiǎn)介數(shù)據(jù)庫(kù)是數(shù)據(jù)的一個(gè)有組織的集合。傳統(tǒng)的數(shù)據(jù)庫(kù)管理系統(tǒng)特別適合于代表那些使用標(biāo) 準(zhǔn)結(jié)構(gòu)的清晰、明確界定的數(shù)據(jù),。然而,現(xiàn)實(shí)世界的信息,包括主觀的意見(jiàn)和判斷,需要 復(fù)雜和不準(zhǔn)確的數(shù)據(jù)建模同時(shí)也需要明確界定的數(shù)據(jù)。在數(shù)據(jù)庫(kù)中代表這種不確定性和復(fù)雜 的數(shù)

4、據(jù)仍然是一個(gè)正在研究中的問(wèn)題。擴(kuò)展非第一范式(ExNF2)1數(shù)據(jù)模型是一個(gè)已為擬 議的代表這種不確定和不精確數(shù)據(jù)模型。可擴(kuò)展標(biāo)記語(yǔ)言(XML)2345,被廣泛用于數(shù)據(jù)代表和交換。XML允許內(nèi)容和 表現(xiàn)的分離,也就是說(shuō),XML文檔簡(jiǎn)單定義了數(shù)據(jù)表示但是并不處理它的表現(xiàn)形式。XML可 以用來(lái)表示復(fù)雜和層次性的信息,這是ExNF模型的基本造型結(jié)構(gòu)。選擇最合適的數(shù)據(jù)庫(kù)管理系統(tǒng),以處理基于應(yīng)用程序和數(shù)據(jù)結(jié)構(gòu)的XML數(shù)據(jù)。隨著越來(lái) 越大的數(shù)據(jù)量作為XML文檔表示,有必要有效地存儲(chǔ)和查詢這些XML文檔。在管理XML數(shù)據(jù) 中,原生的XML數(shù)據(jù)庫(kù)比傳統(tǒng)的數(shù)據(jù)庫(kù)管理系統(tǒng)具有幾個(gè)優(yōu)點(diǎn)。當(dāng)數(shù)據(jù)是半結(jié)構(gòu)化時(shí),映射 到一

5、個(gè)關(guān)系數(shù)據(jù)庫(kù)結(jié)果中將導(dǎo)致大量的空列(浪費(fèi)空間)或大量的表(低效的)。另一個(gè)在 原生XML數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù)的原因是檢索速度。原生XML數(shù)據(jù)庫(kù)在物理存儲(chǔ)數(shù)據(jù)方面,檢索數(shù) 據(jù)比關(guān)系型數(shù)據(jù)庫(kù)快得多。這是因?yàn)樵鶻ML運(yùn)用存儲(chǔ)策略存儲(chǔ)整個(gè)文件或在文件的各部分 中使用物理(而不是邏輯)指針;允許要檢索的文件沒(méi)有連接或存在物理連接,這兩者速度 都比關(guān)系型數(shù)據(jù)庫(kù)上的邏輯連接據(jù)庫(kù)快得多11。幾個(gè)XML查詢語(yǔ)言(如XML- QL的6,XPATH7和XQuery8)已經(jīng)被XML提出。XML 的一個(gè)特有優(yōu)勢(shì)在于它在代表來(lái)自不同來(lái)源的信息時(shí)具有的靈活性。要利用此靈活性,XML 查詢語(yǔ)言必須為這些不同來(lái)源的信息提供檢索和解

6、釋功能。XQuery8已被W3C批準(zhǔn)作為用 于XML查詢的標(biāo)準(zhǔn)語(yǔ)言9。在數(shù)據(jù)庫(kù)領(lǐng)域中,傳統(tǒng)的查詢語(yǔ)言允許在精確的數(shù)據(jù)的基礎(chǔ)上進(jìn)行數(shù)據(jù)選擇。查詢的價(jià) 值在于能在那些完全滿足查詢條件和那些不滿足條件的地方產(chǎn)生Boolean分區(qū)數(shù)據(jù)?,F(xiàn)實(shí)世 界信息是既復(fù)雜又不確切,許多知識(shí)密集的應(yīng)用程序需要使用這些數(shù)據(jù)10,12,13, 14,15,16,17。使用模糊邏輯查詢?cè)试S用戶自定義軟目標(biāo)和約束,并向用戶提供 查詢數(shù)據(jù)的相對(duì)重要性。本文中,我們介紹了將復(fù)雜和不確定的數(shù)據(jù)映射到XML代表的方法。這項(xiàng)研究的動(dòng)機(jī)是 為了在XML文檔中的結(jié)合模糊和不確定的數(shù)據(jù)代表處理ExNF數(shù)據(jù)模型性并推廣XML數(shù)據(jù)庫(kù) 系統(tǒng)的使用

7、。XML的結(jié)構(gòu)非常類似于關(guān)系數(shù)據(jù)庫(kù)元組,因此,將INF文件的元組映射到XML元素是很 簡(jiǎn)單的1819。然而,ExNF模型1 介紹的是經(jīng)擴(kuò)展的,較復(fù)雜的,不確定的和模糊的數(shù) 據(jù),不容易用XML表示。在這項(xiàng)研究中,XML文檔適用于ExNF2模型的格式,包括代表不精 確、復(fù)雜性數(shù)據(jù)的元素和屬性。我們使用這些概念,開(kāi)發(fā)一個(gè)系統(tǒng),允許在XML文檔中進(jìn)行 模糊查詢。系統(tǒng)中XML文檔的概念通過(guò)模糊屬性得到擴(kuò)展。除了模糊查詢,系統(tǒng)可通過(guò)合并 XML文檔的元素重組XML架構(gòu)。通過(guò)使用此功能的系統(tǒng),特定的XML Schema應(yīng)用程序和XML 文檔可從現(xiàn)有的文件中產(chǎn)生。要查詢的XML文檔在原生XML數(shù)據(jù)庫(kù)管理系統(tǒng)塔

8、米諾20中存 儲(chǔ)。本文的組織構(gòu)架如下:第2節(jié)將描述以XML為基礎(chǔ)的模糊查詢系統(tǒng)的設(shè)計(jì)。第3節(jié)將描 述在實(shí)施這項(xiàng)研究中所做的細(xì)節(jié)性工作。最后,第4節(jié)作出結(jié)論總結(jié)。2、基于XML的模糊查詢系統(tǒng)的設(shè)計(jì)本節(jié)中,我們首先提出包括在這項(xiàng)研究中的模糊和其他不確定屬性的定義以及它們的XML表示。參考模型是ExNF數(shù)據(jù)庫(kù)模型1。2.1系統(tǒng)目標(biāo)這項(xiàng)研究的主要目標(biāo)是開(kāi)發(fā)一個(gè)系統(tǒng),它通過(guò)使用由非第一擴(kuò)展范式(ExNF2)1的 擴(kuò)展介紹,在XML中,為現(xiàn)實(shí)世界的數(shù)據(jù)提供了一個(gè)模型。在XML數(shù)據(jù)中執(zhí)行模糊查詢,并 允許XML模式轉(zhuǎn)型。該系統(tǒng)應(yīng)以圖形用戶界面提供用戶構(gòu)建模糊查詢和XML重組架構(gòu)。2.2復(fù)雜和不確定的數(shù)據(jù)建模

9、本節(jié)引入在ExNF模型1 中介紹的屬性類型的定義以及在屬性類型的XML表示。在ExNF 模型中屬性類型的介紹包括原子,空值,設(shè)定值,關(guān)系值,模糊值,范圍值屬性以及XML 表示形式的基礎(chǔ)。2.2.1在ExNF數(shù)據(jù)模型中不確定性的代表在數(shù)據(jù)庫(kù)中不確定性可以通過(guò)擴(kuò)展的嵌套關(guān)系2122代表而非INF數(shù)據(jù)模型23, 24,25。擴(kuò)展模型,即擴(kuò)展非第一范式(ExNF)1,在數(shù)據(jù)庫(kù)中提供包括不確定性的 擴(kuò)展是必要的。ExNF關(guān)系可以定義如下1:定義:定義SchR是一個(gè)與屬性R相關(guān)的屬性(A1,A2,,An)。每個(gè)屬性Aj可能是簡(jiǎn) 單的設(shè)定值,模糊值,范圍值或關(guān)系值,如下文定義。假設(shè))1,D2,,Dn是有限域

10、設(shè) 置。使e,R的一個(gè)實(shí)例,組成一套有序的形式,這是(D1xD2x x Dn)的一個(gè)子集。Dj (1jk)的域,可以是以下內(nèi)容中的一個(gè):(一)Dj是一個(gè)原子值屬性域。每個(gè)值A(chǔ)j是Dj的一個(gè)元素;也就是說(shuō),它是一個(gè)典型的 簡(jiǎn)單明確界定的屬性值。(二)Dj是一個(gè)空值的屬性域。域名Dj組成了明確定義的值a1,a2,an可以擴(kuò)展 到域 Dj= DjU unk,dne,ni。(三)Dj是一個(gè)不完整(范圍)值的屬性,其值可以是原子或一個(gè)區(qū)間。區(qū)間表示為aj1- aj2,其中aj1為最小值,aj2是范圍的最大值。這兩個(gè)值都取自域Dj。(四)Dj是一個(gè)模糊值屬性域。域包含了一組模糊集語(yǔ)言。一個(gè)模糊的屬性值是一

11、個(gè)非空子集的Dj和aj1,aj2,ajm的代表。,ajm。任何這個(gè)屬性(五)Dj是集值屬性域,其值代表明確界定的集aj1,aj2, 的值都是Dj的一個(gè)子集。(六)Dj是關(guān)系值(復(fù)合)屬性域。這個(gè)屬性的任何值,Aj,是一個(gè)元組的形式,這是(Dj1 x Dj2xxDjm)的一個(gè)元素,其中1 m并且1jk。當(dāng)Dj是一個(gè)關(guān)系值(復(fù)合)設(shè)置屬性域時(shí),其中每個(gè)Aj值是, 的一個(gè)元組,這是(Dj1x Dj2 x xDjm)的一個(gè)子集,可以通 過(guò)關(guān)系值和設(shè)定值的組合來(lái)形成這種屬性。定義:假設(shè)R和S是RelA和AttA中的屬性,且是dom中存在的常數(shù)。在這里使用的類型 比那些關(guān)系數(shù)據(jù)模型更復(fù)雜。他們的抽象語(yǔ)法為

12、:x = dom| fdom| ndom| idom| (B1: x1, ,Bm : xm) | xs,其中xs尹fdom| idom|X且B1, Bm是截然不同的屬性。直觀地看,一個(gè)元素dom 是一個(gè)常數(shù)(傳統(tǒng)的明確界定的原子屬性),fdom是一個(gè)模糊值排序?qū)傩裕赡苄纬梢粋€(gè)集 或語(yǔ)義)v1, ,vm的形式,其中vj是dom的一種并且是任何本集的子集元素;ndom是unk,dne,ni,x 一個(gè)空值的排序?qū)傩孕问?,其中x排序dom; idom是v1 - vj的一個(gè) 排序不完整的形式,vj的排序dom和元素是vj,v1 WviWvj; (B 1: x1, Bm: xm)的 排序元素是K元組在B

13、j的排序xi的一個(gè)元素,1im;排序元素xi是排序X的一個(gè)有限集 合元素。定義:從形式上看,排序x的值(即x的解釋),記為t x,定義如下:(一)t dom = dom,(二)tfdom= v1, vj |Vi: 1 Wi Wj: vitdom,(三)t ndom= vi | Vi: 1Wi Wj: vi tunk,dne,ni U dom,(四)tidom= v1 - vj | Vi: 1 Wi W j: v1 WviWvj,vi tdom,(五)txs = v1,vj | Vi,j: 1WiWj:vit xs。如果 txs = ,那么vi = dne,(六)t (B1:x1,Bm:xm)

14、= (B1: x1,Bm: xm) | Vi: 1 WiWm: Vitxi。R由關(guān)系名和數(shù)據(jù)庫(kù)架構(gòu)的關(guān)系名稱的有限集合組成。關(guān)系名稱R的一種關(guān)系是有限排 序值(R)。比如I的架構(gòu)R是R的函數(shù),在這里I是R關(guān)系的實(shí)例。當(dāng)關(guān)系R有一個(gè)排序, 即(R) = (B1:x1, ,Bm: xm),這種關(guān)系由元組組成,其中每個(gè)xi可能是上述給出的解 釋之一。2.2.2.在XML中表示不確定性XML文檔是一個(gè)由邏輯結(jié)構(gòu)(由文檔對(duì)象聲明,注釋,字符引用,元素,和處理指令構(gòu) 成),和物理結(jié)構(gòu)(由實(shí)體,開(kāi)始的根,或文檔實(shí)體組成)構(gòu)成的。每個(gè)元素都有一個(gè)類型, 有名稱標(biāo)識(shí),并且可能有一組屬性規(guī)范。屬性規(guī)范有相應(yīng)的名稱

15、和值XML架構(gòu)的元素有兩 種主要類型:簡(jiǎn)單的和復(fù)雜的。簡(jiǎn)單的元素內(nèi)他們定義為零屬性和零元素,而復(fù)雜元素的定 義允許有一個(gè)或多個(gè)屬性或一個(gè)或多個(gè)元素。復(fù)雜的因素可能會(huì)進(jìn)一步歸類為:空元素,只 包含其他元素的元素,只包含文本的元素,同時(shí)包含文本和其他元素的元素。在XML文檔中,原子屬性代表了明確界定的數(shù)據(jù)。這些原子屬性在XML文檔中可以作為 元素的值。例如,一本書(shū)的標(biāo)題是一個(gè)原子屬性。在XML中的空值可以代表新值或引入的字符數(shù)據(jù),如ni (無(wú)信息),unk(未知),和dne (不存在)。例如,可以用以上的值來(lái)形象的描述一本書(shū)的封面。集值屬性是指在一個(gè)屬性中有幾個(gè)值。其中每個(gè)值可以作為一個(gè)元素添加到

16、XML,這是 使用XML的一種使用方式,而不是僅僅把一個(gè)個(gè)值串起來(lái)。例如,一本書(shū)可能有多個(gè)作者, 每個(gè)作者在“作者”的標(biāo)簽內(nèi)添加“作者”的標(biāo)簽。圖1顯示了一個(gè)例子。 Thomas H. Cormcn Charles E. Lciscrson Ronald L. Rivesl Clifford Stein cTroductlni圖1 XML集值屬性的示例模糊值屬性用來(lái)表示不精確或模糊的數(shù)據(jù)。用于表示模糊值屬性,如“紅色”或“綠 色”,被用于表示一本書(shū)的顏色。一個(gè)模糊值(集)用來(lái)存儲(chǔ)元素的值。模糊數(shù)據(jù)的語(yǔ)義在“色”元素中作為一個(gè)模糊術(shù)語(yǔ)用來(lái)表示“模糊謂詞”屬性。模糊值屬性可能有各種語(yǔ)義,如“或”,

17、“異”,“和”等有關(guān)的模糊值。圖2是給出的一個(gè)例子。 imagoredcolouf FuzzyPredicaie-tOR5rccn圖2 XML模糊值屬性示例范圍值(或不完整的值)屬性,是用來(lái)指定一個(gè)字符串格式的范圍值。我們?yōu)闀?shū)的價(jià)格信息存儲(chǔ)價(jià)值不等的屬性“最低價(jià)”和“最高價(jià)”標(biāo)簽。如圖3所示是一個(gè)例子。ProductInfo $ 12.95$8C)Jf)C)圖3 XML范圍值屬性示例在關(guān)系值屬性中,字段的內(nèi)容是其他元組的指針。關(guān)系值屬性代表設(shè)置值屬性,即對(duì) 于每個(gè)值,都作為一個(gè)完整關(guān)系的元素在元組中出現(xiàn)。舉例來(lái)說(shuō),關(guān)系值屬性代表“形象”, “顏色”,“說(shuō)明”的“形象”元素。如圖4所示就是一個(gè)例

18、子。Ihllp: Z/imag e s. iiinaz on.cDin/iiTiag e s/irruigeGreenciinage-dcscriptionxirtjlcsiumbcrs 圖4 XML關(guān)系值屬性的示例2.3.數(shù)據(jù)對(duì)象和數(shù)據(jù)庫(kù)設(shè)計(jì)在這項(xiàng)研究中,所有的數(shù)據(jù)都是XML格式,并存儲(chǔ)在原生XML數(shù)據(jù)庫(kù)管理系統(tǒng)中。除 了數(shù)據(jù),就是模糊屬性的相似性表,與屬性值相關(guān),也以XML形式存儲(chǔ)在數(shù)據(jù)庫(kù)中。在系統(tǒng)書(shū)籍(如圖5所示為一個(gè)完整的示例)作為數(shù)據(jù)對(duì)象被選擇。產(chǎn)品信息是由Web 服務(wù)檢索從XML文檔中獲得的,這些文件被轉(zhuǎn)化為本地XML架構(gòu)使其適合應(yīng)用程序。這種轉(zhuǎn) 變后,這些文件插入到數(shù)據(jù)庫(kù)中XML

19、文檔存儲(chǔ)在數(shù)據(jù)庫(kù)中有一個(gè)示例9。用來(lái)表示存儲(chǔ) 產(chǎn)品信息的XML文檔XML構(gòu)架如圖5所示。一本書(shū)的封面用模糊的“顏色”屬性來(lái)表示。一本書(shū)的封面可能有多種顏色。由于“顏色” 是一個(gè)模糊屬性,糊的顏色值的相似矩陣10,11存儲(chǔ)在一個(gè)XML文檔中。為了說(shuō)明概念模糊的“主體”屬性,有關(guān)問(wèn)題的相似性值將存儲(chǔ)在一個(gè)XML文檔中。77皿斕曰知mdgHMi:【菱匚三OLuuk: title三 O authorsOauthnr-i publicationEXate; - book_urlr - ) publisher 三 iis好timogc_ur三 OtokirE;口: = FuzzyPrsdie-ate- f

20、 J imaqn dp-s rriplinni ) minPrice + maKpric&-!-yatt_ r i Hi s-.1 I = i. .VMA.VVXA.VX.= = n.:-:-:-!.1.:-!-:- 2 Mh- JE-猝.;.:,w-.國(guó).:-:J:-b -Mi:AAS-MVH-圖6查詢處理的體系結(jié)構(gòu)概述圖7顯示了 XQuery表達(dá)式為查詢生成“顯示所有出版商是“托馬斯鄧恩圖書(shū)”書(shū)籍” 的一個(gè)例子。圖8顯示了與ProductInfo應(yīng)用程序相關(guān)的一個(gè)示例。wheie $b/publisfer Thomas Books rettini $bM圖7 XQuery的一個(gè)例子如果查詢

21、包括模糊值屬性的搜索條件,執(zhí)行查詢?nèi)缦拢浩鸪鯔z索的是非模糊屬性值。這 個(gè)結(jié)果第一步是根據(jù)模糊值屬性的結(jié)果設(shè)置“和”。對(duì)于模糊值屬性我們利用模糊值的相似 矩陣1011。例如,如果查詢“顯示所有的書(shū)籍,其發(fā)行者是”托馬斯鄧恩圖書(shū)并且主題 是閾值為0,7的“科學(xué)”,首先檢索滿足出版商標(biāo)準(zhǔn)的書(shū)籍,然后使用主題屬性的相似矩陣 檢索滿足主題標(biāo)準(zhǔn)的書(shū)籍。如果在查詢中“科學(xué)”的其他域值大于或等于指定的閾值,那么 這些元組還將包括在答案集中。圖8顯示了 XQuery表達(dá)式用來(lái)查找相似值主題為“科學(xué)”和“歷史”的一個(gè)示例。讓 我們假設(shè)這個(gè)表達(dá)式的結(jié)果是“0,5”。圖11顯示了查詢結(jié)果。圖12可以看出,有7條記錄

22、滿足“出版商為托馬斯鄧恩圖書(shū)”書(shū)籍”的搜索條件,但在圖11中記錄的數(shù)量是3。有四 本書(shū)不符合指定的標(biāo)準(zhǔn):“閾值為0,7主題為科學(xué)的書(shū)籍”。由于科學(xué)和計(jì)算機(jī)之間的相似性 為0.9(大于指定閾值0.7),圖11中是檢索元組中的第二個(gè)元組(作者是“C.J. Date”)。 請(qǐng)注意,閾值是在查詢處理后在考慮的。for $b in iEiputO/SubjefitSimihirityTable/ceUI where- Science1 andSb/ secon d_bj ect $ to ry!remm妙si第力牡角成曲應(yīng)圖8 XQuery檢索相似度值的示例3.2.模糊查詢正如以上示例,模糊屬性“主題”

23、和“顏色”可以與閾值以及“和”,“或”謂詞一起 查詢。下面將給出執(zhí)行模糊的“顏色”屬性查詢的例子。執(zhí)行命名為“欺騙點(diǎn)”書(shū)籍的查詢。 圖9給出了此書(shū)的XML表示。以上.:技、.httpjViiajncspacDs.s o fewin/比 irino/Ta m :nt)S chumDefiii ition鹽洞臨旗對(duì)Hhggj您華峪 遂仞UXMLSchcma-i尚 Deception Point matiocolors)blackcolour Predicate = xblue圖9書(shū)籍“欺騙點(diǎn)”的XML表示當(dāng)執(zhí)行“黑”,“藍(lán)”顏色以及“或”謂詞查詢時(shí),該查詢返回“欺騙點(diǎn)”的紀(jì)錄,因?yàn)?這些書(shū)符合顏色

24、為“黑色”和“藍(lán)色”以及“或”模糊謂詞。當(dāng)執(zhí)行“黑”“藍(lán)”顏色以及“和”謂詞查詢時(shí),查詢結(jié)果沒(méi)有返回記錄,因?yàn)闆](méi)有書(shū)符合“黑“藍(lán)”以及“和”謂詞 條件。如圖13所示是這個(gè)查詢的結(jié)果。當(dāng)圖13中的顏色閾值改為“0.3”,查詢返回的記錄為“欺騙點(diǎn)”。雖然這本書(shū)是這些顏色用“或”謂詞連接,但“黑色”和“藍(lán)色”的相似值為0.6” 9。由于在查詢中閾值小于相似度值,查詢條件是滿足的。圖14顯示了此查詢結(jié)果。4005恐04 AflCfeMA餡曲丫網(wǎng)3睫 T9W,11廈嬲尊!.睥TZgTZgTfw. r. ir.t rr.irm rmirawaviM ihmtvi打獲!茂33提3:版昂新E l CSG一而!

25、更福i TUjO 53F-i*tifiaa1mf .“Ua卜r呵amm.u.um “ fij Jrari nin*-!, ir-1 4tl- g電 i:. :,* y PE,.:1 1 涔.1:PM; rr 輸” $1 項(xiàng).都 H塞豪函虱莉逾函勒亟亟筌網(wǎng)豆遠(yuǎn)瓦二王逐?S3 ,!,r , 上 f ! i fji I 15 J n,rgn 呻 - - r - -| ;,! nf w ,Jf Ub 1 Ik 1 H ,“ :T 4 4 卜 J - $,$* * AS J -X 1“ “1 111 I:Jin Slebmk Tt敢WsAiPi ChwA. M HlacifYJhaveiI jDsn g

26、rown:AngelsIfJHlsInrYXtessic .方671 位/3;60 卜如叔蜜切:衛(wèi)血1|DW1 Brpytfnjpecetfion PdrT Htejury.c必遷皿7337 rhOlflSE CWft Borts J;2002、一*Dari Brown瘋射對(duì)Ftjrirass : A T .if HlffiaFvSiziBnce p312S5164 ThotnB AmneBadks 凱004jHiardcwer. _1剖彳:酩匚MLFaeifkiur:口49 9CJ4.Per tack ”1,il 1.7 T#EniB圖10相關(guān)的ProductInfo應(yīng)用程序示例3.3.合并

27、XML構(gòu)架該系統(tǒng)還允許用戶合并存儲(chǔ)在塔米諾XML數(shù)據(jù)庫(kù)服務(wù)器中的XML架構(gòu)中的元素。重組 一個(gè)XML構(gòu)架,改變的XML架構(gòu)文件會(huì)被選中,然后會(huì)顯示被選擇的XML構(gòu)架元素。要合 并的元素會(huì)被選中,合并名稱為新的元素,這是選定的元素合并形成的。除了新的XML構(gòu)架, 新的XML文件包括合并對(duì)象(或元組)的原始文檔將根據(jù)新的XML構(gòu)架生成并同時(shí)加載到數(shù) 據(jù)庫(kù)中。區(qū)卵:FublisrFrPLJE3hcatidri OlLtQ:FfrmtACPriiuei;圖11滿足條件“主題是科學(xué)并且閾值為0,7”的查詢結(jié)果HSSN:Fubliihi*r:Form就是FW日曲 Titfe TFie 5 of rwrrn

28、 i n m:! Tin sit b jmsrisnfttittiwi i沖儀.咿點(diǎn)電魚(yú)是扁討J la dminT j( gl 443.崖CmfM& Art ufWir 瑚Wn gF!用WL:留一統(tǒng),&nvrn 珂蟹”1 FErcm. A Irriter J rFzicr (ciEnq t ;IK3t231 卸 Ehebs Dunre khxa NK*4 M金 念口閹&如由 名,成曲拓?fù)?。?嘉omwAriing由由式LRipi瓦航51沛福礦謊福嘉瓦X呢宥云亍 hhacryj.19;n-: n ge mBMS&Duntt 20C3iTrmirim+iT n ma niHim v|rwrE:-n

29、rMir.TnnmiBTm e-3 ia-iiriimrrrwrwtwrwtnranrwih 源里金理$ g現(xiàn)歸眼如悠 好蛔.9.密 JhgmiK Mjttc ftockm圖12滿足條件“出版商為托馬斯鄧恩圖書(shū)書(shū)籍”的查詢結(jié)果m W:就 *EE:g 1T:“ m 樸二二二 is?:;-:;:;:器徘:;:!HH-tLH-H-tHI圖13執(zhí)行“黑”,“藍(lán)”顏色,“和”謂詞以及“閾值0.7”的查詢結(jié)果圖14執(zhí)行“黑”,“藍(lán)”顏色,“和”謂詞以及“閾值0.3”的查詢結(jié)果圖15表示ExNF數(shù)據(jù)模型,這也作為一個(gè)XML文檔的代表。在ExNF中每列元素XML架 構(gòu)中的元素對(duì)應(yīng)。例如,在圖15和圖16所示,

30、如果用戶選擇這個(gè)XML架構(gòu)的所有元素,除 了 “出版商”元素被名稱為“ Publisherinfo ”的屬性合并,產(chǎn)生了一個(gè)新的以 PublisherlnfoSchema (由用戶命名)命名的XML架構(gòu)。具有相同的出版商的圖書(shū)被合并從 而形成一個(gè)新的合并關(guān)系。這種合并的關(guān)系,可以達(dá)到更有效的查詢目的或根據(jù)用戶的要求 生成耳目一新的數(shù)據(jù)庫(kù)構(gòu)架。包括了合并和取消合并的操作細(xì)節(jié)1。3.4.開(kāi)發(fā)環(huán)境為了實(shí)現(xiàn)了平臺(tái)的獨(dú)立性,根據(jù)系統(tǒng)的開(kāi)發(fā)程度選擇Java編程語(yǔ)言。該系統(tǒng)是作為Borland JBuilder第9企業(yè)版的一個(gè)獨(dú)立應(yīng)用程序?qū)嵤┑?。Java的塔米諾API用來(lái)訪問(wèn)和 操縱塔米諾數(shù)據(jù)庫(kù)20中存儲(chǔ)的

31、數(shù)據(jù)?!八字Z執(zhí)行XQuery,被稱為塔米諾XQuery4是用 于執(zhí)行查詢的,也可在塔米諾API為Java訪問(wèn)。Software AG的塔米諾XML服務(wù)器4.1.420 被用來(lái)充當(dāng)XML數(shù)據(jù)庫(kù)系統(tǒng)。Software AG的塔米諾架構(gòu)編輯器被用于設(shè)計(jì)XML構(gòu)架。 I芝DiCHTlBEfirta.95Diitr c E&il sHardt膈網(wǎng) H 訥Abfe Co31制M JO.w 散 irrafii而血郵4胡蠕岳7色Jb 3北!南成 mg : n二 _ 成二二aoiig 帕NT白引Efe沛酸I!IS-4? M rfW*上熟度us號(hào) 業(yè)三火一Qg 怙騏!1竺器上* ?1些 心 hr 巨 Eiafe

32、ijaiBalggc T?ie二:丈 I:*:片:.akt.-A - A.-.?. A =f痿站神w陸l物1般pomaa- i;. i-1. :i-WQW砒 :tt&M-*無(wú)盤Me臥 瞄姐 泌 #:S村酬塢沖:財(cái)蜘墮也型業(yè)白璀蜘” ” “, . ” HTmrrA ” 4,i. ,. rK ” a*|*mrirrirwri:位一五#W如rU牝帕加擊出就云圖15合并前的XML構(gòu)架結(jié)構(gòu). V- V 、 V. -A , . -圖16新的XML構(gòu)架結(jié)構(gòu)結(jié)論“可擴(kuò)展標(biāo)記語(yǔ)言(XML)是數(shù)據(jù)表示以及進(jìn)行格式轉(zhuǎn)換的的一種方法。XML文檔定義 數(shù)據(jù)表示但并不處理數(shù)據(jù)的表現(xiàn)形式。XML也可以用來(lái)表示復(fù)雜和不準(zhǔn)確的

33、除了明確界定 的數(shù)據(jù)格式。XML可以處理復(fù)雜,層次化的信息,同時(shí)也可用于商業(yè)交易。本文中,復(fù)雜和不確定的數(shù)據(jù)是用XML來(lái)表示的。用戶可以在開(kāi)發(fā)系統(tǒng)上執(zhí)行XML文檔 的模糊查詢。該系統(tǒng)中XML文檔包含模糊屬性。用戶可以指定一個(gè)模糊的屬性和閾值進(jìn)行模 糊查詢。除了模糊查詢,系統(tǒng)可通過(guò)XML文檔中元素的合并進(jìn)行XML架構(gòu)重組。通過(guò)使用此 功能,系統(tǒng)可以生成一個(gè)新的XML架構(gòu)以及從現(xiàn)有文件中形成新的XML文檔。系統(tǒng)中的XML 文檔存儲(chǔ)在原生XML數(shù)據(jù)庫(kù)管理系統(tǒng)中,即塔米諾。參考文獻(xiàn)Adnan Yazici, Alper Soysal, Bill P. Buckles, and Fred E. Petr

34、y, Uncertainty in nested relational database model, Data & Knowledge Engineering 30 (1999) 275-301.Jennifer Widom, Data Management for XML: Research Directions. HYPERLINK http:/wwwdb http:/wwwdb. /widom/, (1999).Frank Jung, XML Backgrounder, Software AG, HYPERLINK /Corporate/ /Corporate/, (August 20

35、03).Guide to the W3C XML Specification (XMLspec) DTD,V.2.1, HYPERLINK / / XML/1998/, (1998).Charter of the XML Schema Working Group, HYPERLINK /2003/09/xmlap/xmlschema-wg-charter.html /2003/09/xmlap/xmlschema- wg-charter.html, June 2004.XML-QL: A Query Language for XML, HYPERLINK /TR/1998/NOTE-xml-q

36、l-19980819 /TR/1998/NOTE-xml-ql- 19980819, (August 1998).J. Clark, S. DeRose, XML Path Language (XPath) Version 1.0, W3C Recommendation, HYPERLINK /TR/xpath /TR/xpath, (November 1999).XQuery 1.0: An XML Query Language, HYPERLINK /TR/xquery/ /TR/xquery/, (July 2004).Bourret, R., XML and Databases, HY

37、PERLINK http:/www.rpbourret.coin/xml/XML http:/www.rpbourret.coin/xml/XML Databases, (2004).L.A. Zadeh, Similarity Relations and Fuzzy Orderings,Information Sciences, vol. 3, no. 2, (1971) pp. 177-200.Buckles B. P. and Petry F. E., A fuzzy representation of data for relational databases, FuzzySets a

38、nd Systems, Vol. 7, (1982) pp.213-226.Tahani V., A conceptual framework for fuzzy query processing - A step toward very intelligent database systems, Information processing Management,Vol. 13,(1977) pp.289-303.Zemankova M. and Kandel A., Fuzzy Relational Data Bases - A key to Expert Systems, Verlag

39、TUV Rheinland, Koln, (1984).Anvari, M., Rose G. F., Fuzzy relational databases, Analysis of Fuzzy Information, Bezdek ed., Vol II, CRC Press (1987).Ruspini E. H., Issues in the representation of imprecision and uncertainty in information systems, Analysis of Fuzzy Info - Vol. II: Artificial Intellig

40、ence and Decision Systems, CRC Press, Boca Raton, Fl. (1987) pp.231-239.Fuzzy Data Representation and Querying in XML Database 57Prade H. and Testemale C, Generalizing Database Relational Algebra for the Treatment of Incomplete/Uncertain Information and Vague Queries, Information Sciences, Vol. 34 (

41、1984) pp.115-143.Medina J. M., Pons O. and Vila M. A., GEFRED, A generalized model of fuzzy relational databases, Version 1.1, Information Sciences (1994).Lee D., Mani M., Chiu F. and Chu W., NeT and CoT: Translating relational schemas to XML Schemas using semantic constraints, Proceedings of CIKM,

42、McLean, Virginia (2002) pp.282-291.Fernandez M., Morishima A. and Suciu D., Efficient evaluation of XML middle-ware queries, Proceedings of ACM SIGMOD Int. Conf. on Management of Data, Santa Barbara, CA (May 2001),pp.l03-114. HYPERLINK /de/products/tamino /de/products/tamino.L. S. Colby, A recursive

43、 algebra for nested relations,Information Systems 15 (5) (1990) pp.567-662.S. J. Thomas, P. C. Fischer, Nested relational structures,Advances in Computing Research, vol. 3, JAI Press (1986) pp. 269-307.M. A. Roth, H. F. Korth, D. S. Batory, SQL/NF: a query language for non-INF relational databases,

44、Information Systems 12 (1987) pp. 99-114.H. J. Schek, M. H. SchoU, The relational model with relational-valued attributes, InformationSystemsll (2) (1986) pp.137-147.G. Ozsoyoglu, Z.M. Ozsoyoglu, V. Matos, Extending relational algebra and relational calculus with set-valued attributes and aggregate

45、functions, ACM Transactions on Database Systems 12 (4) (1987) pp.566-592.(附件2:外文原文一)International Journal of Uncertainty,Fuzziness and Knowledge-Based SystemsVol. 15, Suppl, (February 2007) 43-57 World Scientific Publishing CompanyFUZZY DATA REPRESENTATION AND QUERYING IN XML DATABASEEKlN USTUNKAYA

46、and ADNAN YAZICIDepartment of Computer Engineering, Middle East Technical University, 06531, Ankara - Turkey Email: ell2925, HYPERLINK mailto:yazicij.tr yazicij.trROY GEORGE*Department of Computer Science, Clark-Atlanta University, Atlanta, GA, USAEmail: HYPERLINK mailto:rkavil rkavilReal-world info

47、rmation including subjective opinions and judgments need imprecise data to bemodeled for representation and querying in databases. The Extensible Markup Language (XML) hasbecome a de-facto standard for data modeling and exchange in recent years. Efforts on modelingimprecision and representing such d

48、ata in XML have not been fully developed. In this paper, anXML based fuzzy data representation and querying system is presented. Complex and imprecisedata are represented using a fuzzy extension of XML. The representation forms the basis for asystem which enables fuzzy querying on XML documents usin

49、g XQuery, a XML query language. The system also enables restructuring of XML Schemas through merging of elements of the XMLdocuments. By using this feature of the system, application specific XML Schema and XMLdocuments can be generated from the existing documents. Keywords. Fuzzy query; XML; native

50、 XML databases.IntroductionA database is an organized collection of data. Traditional database management systemsare particularly suited to represent crisp, well defined data using standard structures. However, real-world information includes subjective opinions and judgments that requirethe modelin

51、g of complex and imprecise data along with crisp data. The representation ofsuch uncertain and complex data in a database is still a research issue. The Extended NonFirst Normal Form (ExNF2) 1 data model is a model that has been proposed for therepresentation of such uncertain and imprecise data.The

52、 Extensible Mark-up Language (XML) 2, 3, 4, 5 is widely used for datarepresentation and interchange. XML allows the separation of content and presentation, i.e., XML documents simply define the data representation and do not deal with thepresentation. XML can be used to represent complex and hierarc

53、hical information, whichare basic modeling constructs in the ExNF2 model.This work is partially supported by the NSF Grant No. HRD-0401679, AHPCRC Contract No. DAAD19-01-2-0014 and ARL Contract No. DAAL01-98-2-0065. The content of this work does not reflect the position orpolicy of the sponsors and

54、no official endorsement should be inferred. Choosing the most appropriate database management system to handle XML datadepends on the application and data structure. With increasingly large amount of databeing represented as XML documents, it becomes necessary to efficiently store and querythese XML

55、 documents. Native XML databases have several advantages over traditionaldatabase management systems in managing XML data. When the data is semi-structured, mapping it to a relational database results in either a large number of columns with nullvalues (which wastes space) or a large number of table

56、s (which is inefficient). Anotherreason to store data in a native XML database is retrieval speed. Depending on how thenative XML database physically stores data, it is possible to retrieve data much fasterthan a relational database. This is because the storage strategies used by native XMLdatabases

57、 store entire documents together physically or use physical (rather than logical) pointers between the parts of the document; permitting the documents to be retrievedeither without joins or with physical joins, both of which are faster than the logical joinsused by relational databases 11.Several XM

58、L query languages (such as XML-QL 6, XPath 7, and XQuery 8) have been proposed for XML. A particular strength of XML is its flexibility inrepresenting many different kinds of information from diverse sources. To exploit thisflexibility, an XML query language must provide features for retrieving and

59、interpretinginformation from these diverse sources. XQuery 8 has been endorsed by W3C as astandard for XML querying 9.Traditional query languages in database domain allow data selection based onprecise data. The evaluation of the query produces Boolean partitions of the data into those that fully sa

60、tisfy the query condition and those which do not. Real world information is both complex and imprecise and many knowledge-intensive applications require the use of such data 10, 12, 13, 14, 15, 16, 17. Querying using fuzzy logic permits the user to define soft goals and constraints, and provide them

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論