版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、徐俊剛 (),分布式數(shù)據(jù)庫系統(tǒng)及其應(yīng)用,2009年2月2009年6月,分布式數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)概述 自頂向下設(shè)計(jì)分布式數(shù)據(jù)庫 DATAID-D方法 實(shí)例研究:飛機(jī)訂票系統(tǒng) 自底向上設(shè)計(jì)分布式數(shù)據(jù)庫,分布式數(shù)據(jù)庫系統(tǒng)設(shè)計(jì),第2章,分布式數(shù)據(jù)庫設(shè)計(jì)概述,1,創(chuàng)建方法,組合法,剖析網(wǎng)絡(luò)功能 剖析原有數(shù)據(jù)庫系統(tǒng) 解決數(shù)據(jù)的一致性、完整性和可靠性 難度較大 通常是異構(gòu)或者同構(gòu)異質(zhì)DDBS,分布式數(shù)據(jù)庫設(shè)計(jì)概述,1,重構(gòu)法,根據(jù)實(shí)現(xiàn)環(huán)境和用戶需求 按照DDBS的設(shè)計(jì)思想和方法 從總體設(shè)計(jì)做起,包括LDBS,重新建立一個(gè)DDBS 可有效解決數(shù)據(jù)一致性、完整性和可靠性問題。 通常是同構(gòu)異質(zhì)或同構(gòu)同質(zhì)DDBS,DD
2、BS設(shè)計(jì),DDB設(shè)計(jì),應(yīng)用設(shè)計(jì),全局模式設(shè)計(jì),局部數(shù)據(jù)庫設(shè)計(jì),相關(guān)應(yīng)用需求,各個(gè)應(yīng)用的原發(fā)站點(diǎn),各個(gè)應(yīng)用在每個(gè)站點(diǎn)的激活頻率,各個(gè)應(yīng)用對要求訪問數(shù)據(jù)對象的訪問次數(shù)、類型和統(tǒng)計(jì)分布,分片和分布,DDBS 設(shè)計(jì)目標(biāo),本地性或近地性,存儲(chǔ)能力和費(fèi)用,盡量減少通信次數(shù)和通信量,90/10準(zhǔn)則,分片和分布方案(本地和遠(yuǎn)程訪問次數(shù))擇優(yōu),控制數(shù)據(jù)適當(dāng)冗余,冗余增加了可靠性、可用性,提高了效率,維護(hù)數(shù)據(jù)一致性開銷增加,工作負(fù)荷分布,各站點(diǎn)可以分擔(dān)整個(gè)工作任務(wù),本地性降低,DDBS 設(shè)計(jì)方法,自頂向下方法(重構(gòu)法),混合方法,自底向上方法(組合法),假若有全局關(guān)系R 被分片為子關(guān)系(片段)集合 R = R1,
3、 R2, , Rn, 則 R滿足 完整性 ?x R, RiR 必有 xRi ,i=1,2,n 可重構(gòu)性 存在函數(shù) g 使得R = g(R1, R2, , Rn) 即,R= Ri (水平分片),R= Ri (垂直分片) 不相交性 Ri Rj =空集,ij,i,j=1,2,n(水平分片) Ri Rj =主鍵屬性,i,j=1,2,n(垂直分片),分片原則,職工關(guān)系 E (e#, name, loc, sal,) 查詢: Qa: select * Qb: select * from E from E where loc=Sa where loc=Sb and and .,舉例,e# NM Loc Sa
4、l E,5,7,8,Sa,1000,Sally,Sb,2500,Tom,Sa,500,Joe,e# NM Loc Sal,e# NM Loc Sal,5,8,Sa,1000,Tom,Sa,500,Joe,7,Sb,2500,Sally,.,.,.,.,F,站點(diǎn)Sa,站點(diǎn) Sb,舉例,基本水平分片 以關(guān)系自身的屬性性質(zhì)為基礎(chǔ),執(zhí)行“選擇”操作,將關(guān)系分割成若干個(gè)不相交的片段。 R = R1, R2 R1 = loc=Sa(E) R2 = loc=Sb(E),基本水平分片,若 R = R1, R2, , Rn, 則 完整性 對于每一個(gè)元組 tR, RiR 使得 tRi 不相交性 對tRi, Rj
5、使得 tRj, i j 可重構(gòu)性 操作是 (可以忽略, 因?yàn)橥暾跃吞N(yùn)含著) R = R1, R2, , Rn P = p1, p2, , pn是一簡單謂詞集合,為保證分片的正確性,P必須是: 完整的:同一分片中的任意兩個(gè)元組被應(yīng)用同樣概率訪問。 最小的:集合P中的所有謂詞與應(yīng)用密切相關(guān)。 具有完整性和最小性不是必要條件, 但是對于簡化分配問題有好處,基本水平分片,例子 EMP ( E#, NAME, DEPT, JOB, SAL, TEL, ) DEPT=1,2 JOB=P, -P 假定,應(yīng)用經(jīng)常查詢的內(nèi)容是屬于部門1且是程序員的職員。 則可能有的水平分段限定 P= DEPT=1 (不是完整
6、的) P=DEPT=1, JOB=P (是完整的、最小的) P=DEPT=1, JOB=P, SAL500 (完整的,不是最小的),基本水平分片,如何保證分片原則,“手工”檢查! e.g., R1 = loc=Sa E ; R2 = loc=Sb E 生成具有滿足分段原則的限定謂詞,基本水平分片,設(shè)有關(guān)系 E (e#,name,Loc,sal,A,), 查詢使用的簡單謂詞(Ai Value)是: A5, Loc = Sa, Loc = Sb 下一步: - 生成 “小項(xiàng)” 謂詞 - 消除無用謂詞 給定簡單謂詞集 Pr= p1, p2,. pn , 則“小項(xiàng)”謂詞(minterm predicat
7、e)形式: p1* p2* pn* 這里 pk* 是 pk 或是 pk,謂詞生成舉例,(1) A5 Loc=SA Loc=SB (2) A5 Loc=SA (Loc=SB) (3) A5 (Loc=SA) Loc=SB (4) A5 (Loc=SA) (Loc=SB) (5) A5) Loc=SA Loc=SB (6) A5) Loc=SA (Loc=SB) (7) A5) (Loc=SA) Loc=SB (8) A5) (Loc=SA) (Loc=SB),小項(xiàng)謂詞選擇,(9) (A5 Loc=SA Loc=SB (10) (A5 Loc=SA (Loc=SB) (11) (A5 (Loc=S
8、A) Loc=SB (12) (A5 (Loc=SA) (Loc=SB) (13) (A5) Loc=SA Loc=SB (14) (A5) Loc=SA (Loc=SB) (15) (A5) (Loc=SA) Loc=SB (16) (A5) (Loc=SA) (Loc=SB),小項(xiàng)謂詞選擇,R2:5 A 10 Loc=SA R3:5 A 10 Loc=SB R6:A 5 Loc=SA R7:A 5 Loc=SB R10:A 10 Loc=SA R11:A 10 Loc=SB,分片結(jié)果,注:無用段的消除依賴于應(yīng)用的語義,e.g.: 如果 LOC 可以是 SA, SB, 則最終分段集合應(yīng)該加上
9、 R4:5 A 10 Loc SA Loc SB R8:A 5 Loc SA Loc SB R12:A 10 Loc SA Loc SB,小項(xiàng)選擇率(minterm selectivity) 對某一給定小項(xiàng)謂詞用戶查詢可能選擇到的元組數(shù) 訪問頻率(Access frequency)用戶應(yīng)用訪問數(shù)據(jù)的頻率 小項(xiàng)訪問頻率可以通過用戶查詢頻率獲得,分片數(shù)量信息,例子 E(#, NM, LOC, SAL,) 有查詢應(yīng)用 Qa: select *Qb: select * from Efrom E where LOC=Sa where LOC=Sb and and .,如何選擇小項(xiàng)謂詞舉例,(1) Pr
10、= R1 = E (2) Pr = LOC=Sa, LOC=Sb R2= loc=Sa E, loc=Sb E (3) Pr = LOC=Sa, LOC=Sb, Sal1000 R3= loc=Sa sal1000 E, loc=Sa sal1000 E, loc=Sb sal1000E, loc=Sb sal1000 E ,三種選擇,Loc=Sa sal 1000,Loc=Sa sal 1000,Loc=Sb sal 1000,Loc=Sb sal 1000,R1,R3,R2,Qa: Select loc = Sa .,Qb: Select loc = Sb .,圖示,Loc=Sa sal
11、1000,Loc=Sa sal 1000,Loc=Sb sal 1000,Loc=Sb sal 1000,R1,Qa: Select loc = Sa .,Qb: Select loc = Sb .,此處元組有較 高的選擇概率,此處元組選 擇概率較低,分段內(nèi)元組選擇概率不等 因此 R1 不好.,理由,Loc=Sa sal 1000,Loc=Sa sal 1000,Loc=Sb sal 1000,Loc=Sb sal 1000,R2,Qa: Select loc = Sa .,Qb: Select loc = Sb .,元組選擇 概率相等,因此 R2好.,R3不好 .,理由,導(dǎo)出分片 從另一個(gè)關(guān)
12、系的屬性性質(zhì)或水平分片推導(dǎo)出來 例子 SC(S#, C#, GRADE) S ( S#, SNAME, AGE, SEX) 要求: 將SC劃分為男生各門課成績和女生的各門成績,導(dǎo)出水平分片,按S的屬性導(dǎo)出 Define fragment SC1 as Select SC.S#,C#,GRADE From SC, S Where SC.S#=S.S# and SEX=M Define fragment SC2 as Select SC.S#,C#,GRADE From SC, S Where SC.S#=S.S# and SEX=F 按S的水平分片(SF/SM)導(dǎo)出 Define fragmen
13、t SC1 as Select * From SC Where S# in (Select SF.S from SF) Define fragment SC2 as Select * From SC Where S# in (Select SM.S from SM),導(dǎo)出水平分片例子,通過“投影”操作把一個(gè)全局關(guān)系的屬性分成若干組,基本目標(biāo)是將使用頻繁的屬性聚集在一起 全局關(guān)系R=Ri,i=1,2,n 如果屬性AR,必有ARi,i=1,2,n,而且RiRj=Ap,ij,Ap為R的碼或元組標(biāo)識(shí)符,則稱Ri,i=1,2,n是關(guān)系R的一個(gè)垂直分片。 如果屬性AR,必有ARi,i=1,2,n,而且Ri
14、Rj=(Ap, A-p),ij,A-p為R的一個(gè)或多個(gè)非碼屬性時(shí),稱Ri,i=1,2,n是關(guān)系R的一個(gè)垂直群集。,垂直分片和垂直群集,EMP(E#, NAME, SAL, TEL, MAGNUM, DEPT) 假定 Key: E# 主要應(yīng)用: Sa 站點(diǎn)查詢NAME, SAL, TEL; Sb 站點(diǎn)查詢NAME, MAGNUM, DEPT 垂直分片:EMP1(E#, NAME, SAL, TEL) EMP2(E#, MAGNUM, DEPT) 垂直群集:EMP1(E#, NAME, SAL, TEL) EMP2(E#, NAME, MAGNUM, DEPT),垂直分片/垂直群集例子,E1,E,
15、E2,垂直分片例子,例子: E1(#,NM,LOC) E2(#,SAL) E(#,NM,LOC,SAL) E1(#,NM) E2(#,LOC) E3(#,SAL),?,垂直分片設(shè)計(jì),非鍵屬性 A1, A2,An 應(yīng)用 Q1, Q2,.,Qm freq(Qi) = Qi 的訪問頻率,屬性的親和關(guān)系,R1K,A1,A2,A3 R2K,A4,A5,屬性親和矩陣,行列調(diào)整尋找分割點(diǎn),屬性和矩陣,窮舉屬性親和矩陣的列排列 行與列要同時(shí)調(diào)整 發(fā)現(xiàn)好的 “分割點(diǎn)” 極大化每個(gè)分割內(nèi)的親合力(affinity), 極小化跨分割的訪問,垂直分片算法,水平 基本: R 根據(jù) local屬性 導(dǎo)出 根據(jù)外鍵關(guān)系 垂
16、直 R,分片小結(jié),混合分段,R,R1,R2,R11,R12,R21,R22,水平,垂直,分片小結(jié),混合分段的重構(gòu),R11,R12,R21,R22,水平,垂直,U,在滿足用戶需求的前提下, 把設(shè)計(jì)好的數(shù)據(jù)片段分配到相應(yīng)的站點(diǎn)上存儲(chǔ) 例子: E(#,NM,LOC,SAL) R1 = loc=Sa E ; R2 = loc=Sb E Qa: select where loc=Sa. Qb: select where loc=Sb,Site a,Site b,R1,R2 存 放在哪?,?,分配方法,非冗余分配設(shè)計(jì)方法,最佳適應(yīng)法,其他方法,冗余分配的設(shè)計(jì)方法,所有得益站點(diǎn)法,附加復(fù)制法,應(yīng)用需求,確定
17、非復(fù)制問題的解 確定一組站點(diǎn)分配副本,確定非復(fù)制問題的解 從最有益處增加副本 到附加復(fù)制無好處為止,什么是段的最好配置/什么是最好的冗余副本數(shù): 極小化查詢響應(yīng)時(shí)間 極大化吞吐量 極小化 “代價(jià)” . 約束? 有效的存儲(chǔ)空間 有效的帶寬, 站點(diǎn)處理能力, 保持 90% 的響應(yīng)時(shí)間低于 X(如0.5秒) .,單個(gè)片段 F 站點(diǎn) S1, Sm 變量 X1, , Xm 0 如果 F 不在 Sj上存儲(chǔ) 1 如果 F 在 Sj上存儲(chǔ) Total cost = Read Cost + Write Cost + Storage Cost 確定 Xj 的值, 1 j m, 使總代價(jià)極小,Xj =,讀代價(jià),Re
18、ad cost = ti MIN Cij i:讀申請?jiān)凑军c(diǎn) ti: 站點(diǎn)Si上的讀申請激活次數(shù) Cij: 從 Si讀Sj站點(diǎn)分段F的代價(jià),i=1,m,j,寫代價(jià),Write cost = Xj ui Cij i: 寫申請?jiān)凑军c(diǎn) j: 被更新站點(diǎn) Xj: 0 if F not stored at Sj 1 if F stored at Sj ui: 站點(diǎn) Si 上更新激活次數(shù) Cij: 從站點(diǎn) Si 更新 Sj 分段 F 的代價(jià),i=1,j=1,m,m,Updates,ui,存儲(chǔ)代價(jià),Store Cost = Xi di Xi: 0 if F not stored at Si 1 if F st
19、ored at Si di: 站點(diǎn) Si 存儲(chǔ)分段 F 的代價(jià),i=1,m,目標(biāo)函數(shù),min ti MIN Cij + Xj ui Cij + Xi di,j,i=1,j=1,i=1,m,m,m,即使最簡單的公式也是 NP-完全問題 通常, 使用方法 盡可能將片段分配在被局部訪問位置,“最佳適應(yīng)” 方法(非冗余分配) Bij = k Fkj Nki “所有得益站點(diǎn)” 方法(冗余分配) Bij = k Fkj Rki - c k jjFkj Uki i 片段下標(biāo) j 站點(diǎn)下標(biāo) k 應(yīng)用下標(biāo) Fkj 應(yīng)用k 在站點(diǎn)j上激活的頻率 Rki 應(yīng)用k被激活一次,對片段i讀的次數(shù) Uki 應(yīng)用k被激活一次
20、,對片段i寫的次數(shù) Nki 應(yīng)用k被激活一次,對片段i讀寫的總次數(shù),最佳適應(yīng)法 將片斷Ri分配到訪問Ri次數(shù)最多的那個(gè)站點(diǎn)上 Bij= kFkj*Nki 所有得益站點(diǎn)法 將片斷Ri的副本分配到所有得益站點(diǎn)j上 Bij= kFkj*Rki -c*k jj Fkj*Uki 如Bij 0,則站點(diǎn)j是得益站點(diǎn),放置Ri的一個(gè)副本 附加復(fù)制法 Di表示片斷Ri的冗余度(副本個(gè)數(shù)),Fi表示Ri在所有站點(diǎn)都復(fù)制的得益,假設(shè)關(guān)系R垂直分片R1和R2, R1分配到s站點(diǎn), R2分配到t站點(diǎn). 應(yīng)用組As: 自站點(diǎn)s發(fā)出, 只使用Rs, 得益 BAs = Fks Nki ( k As) 應(yīng)用組Ar: 自站點(diǎn)t發(fā)
21、出, 只使用Rt, 得益 BAt = Fkt Nki ( k At) 應(yīng)用組A1: 由站點(diǎn)r發(fā)出, 原先使用Rt或Rs(本地), 現(xiàn)在要一次遠(yuǎn)程,損失 BA1 = Fkr Nki ( k A1) 應(yīng)用組A2: 由站點(diǎn)r發(fā)出, 原先使用R(本地), 現(xiàn)在要兩次遠(yuǎn)程,損失 BA2 = Fkr Nki ( k A2) 應(yīng)用組A3: 由不同于站點(diǎn)r,s,t的站點(diǎn)發(fā)出, 要訪問Rt和Rs, 損失 BA3 = Fkj Nki ( k A3,j r,s,t) 分配得益 Bist = BAs + BAt - BA1 - BA2 - BA3,分布式數(shù)據(jù)庫設(shè)計(jì)階段 需求分析 概念設(shè)計(jì) 分布要求設(shè)計(jì) 全局邏輯設(shè)計(jì)
22、分布設(shè)計(jì) 局部邏輯設(shè)計(jì) 局部物理設(shè)計(jì),收集分布信息 水平分片謂詞 每一應(yīng)用在各站點(diǎn)激活頻率 概念設(shè)計(jì)之后進(jìn)行,收集分布信息 分布要求和全局邏輯模式作為輸入 形式為全局?jǐn)?shù)據(jù)庫模式和邏輯訪問表 輸出為分片模式和分配模式 全局邏輯設(shè)計(jì)之后進(jìn)行,說明: 1.設(shè)計(jì)數(shù)據(jù)字典; 2.全局?jǐn)?shù)據(jù)模式; 3.全局操作模式; 4.簡化全局模式; 5.邏輯訪問表; 6.各站點(diǎn)邏輯模式; 7.各站點(diǎn)訪問表; 8.局部邏輯模式 (關(guān)系或Codasyl); 9.局部物理模式 (關(guān)系或Codasyl),分布要求分析階段 頻率表:各站點(diǎn)上每一應(yīng)用激活次數(shù)(假設(shè)所有應(yīng)用在所有站點(diǎn)上都能執(zhí)行) 劃分表:可用于模式中各實(shí)體的潛在水平
23、分片規(guī)則 極化表:指明由一個(gè)站點(diǎn)發(fā)出的一給定應(yīng)用訪問一給定片段的頻率(定量分析方法),分布設(shè)計(jì)階段 分片設(shè)計(jì) 非冗余分配 冗余分配 局部模式的重新構(gòu)造,分布設(shè)計(jì),全局?jǐn)?shù)據(jù)模式,邏輯訪問表,分布要求,站點(diǎn)邏輯模式,站點(diǎn)邏輯訪問表,三個(gè)站點(diǎn) 站點(diǎn)1:丹佛機(jī)場(CO) 站點(diǎn)1:紐約機(jī)場(NY) 站點(diǎn)1:亞特蘭大機(jī)場(GA) 數(shù)據(jù)庫存儲(chǔ)內(nèi)容 機(jī)場規(guī)程 班機(jī)調(diào)度 班機(jī)可用情況 旅客訂票情況 三個(gè)應(yīng)用 訂票應(yīng)用 登記應(yīng)用 起飛應(yīng)用,實(shí)體左下角和右下角的數(shù)字表示:示例總數(shù)和應(yīng)用選擇的平均示例數(shù) 訪問數(shù)據(jù)庫中的起飛與到達(dá)機(jī)場、起飛與到達(dá)時(shí)間和班機(jī)日期,以k表示這些關(guān)鍵詞 確定班機(jī)后,建立旅客的一個(gè)新的示例及聯(lián)
24、系“訂票”的一個(gè)示例,把用戶的信息(名字、電話寫入數(shù)據(jù)庫 O表示輸出,w表示寫入,根據(jù)數(shù)據(jù)庫中的旅客名字,班機(jī)號,班機(jī)日期,查明有關(guān)旅客和班機(jī)的示例,顯示“種類”信息。 根據(jù)“種類”信息和座位圖,將一個(gè)座位號分配給旅客,并寫入座位圖和座位號屬性,以及旅客的檢查行李號,產(chǎn)生即將離開機(jī)場的30架班機(jī)的信息顯示在TV監(jiān)視器上。 根據(jù)數(shù)據(jù)庫中的機(jī)場符號,當(dāng)前日期,起飛時(shí)間,到達(dá)時(shí)間,查明班機(jī)號、 起飛時(shí)間、 出入口、 延期、目的地機(jī)場符號、目的地城市,顯示出來。,實(shí)體訪問表:班機(jī),實(shí)體訪問表:機(jī)場,實(shí)體訪問表:旅客,聯(lián)系訪問表:從,聯(lián)系訪問表:到,聯(lián)系訪問表:訂票,聯(lián)系訪問表:登記,站點(diǎn)1:丹佛(CO
25、) 站點(diǎn)2:紐約(NY) 站點(diǎn)3:亞特蘭大(GA) 應(yīng)用a:訂票 應(yīng)用b:登記 應(yīng)用c:起飛,將機(jī)場的區(qū)域?qū)傩赃x作為機(jī)場實(shí)體的劃分準(zhǔn)則 將旅客電話號碼前三位(區(qū)域碼)作為旅客實(shí)體的劃分屬性 謂詞選擇性表示按照該準(zhǔn)則劃分各類元組所占的百分?jǐn)?shù),兩種方法劃分班機(jī)實(shí)體,應(yīng)用不同的聯(lián)系“從”或“到”和機(jī)場劃分區(qū)域于同一基本劃分,結(jié)果不同。 根據(jù)第一訂票地點(diǎn)和班機(jī)起飛區(qū)域做導(dǎo)出劃分 機(jī)場班機(jī)乘客,分四步: 對每一實(shí)體選擇分片原則 確定非冗余分配 在非冗余分配上引入冗余 在每一站點(diǎn)上重新構(gòu)造局部模式,機(jī)場實(shí)體: 基于區(qū)域的水平分段 機(jī)場1, 機(jī)場2, 機(jī)場3 班機(jī)實(shí)體:基于起飛機(jī)場的導(dǎo)出水平分段 班機(jī)1,班
26、機(jī)2, 班機(jī)3 旅客實(shí)體: 基于旅客預(yù)定的所有班機(jī)起飛的導(dǎo)出水平分段 旅客1,旅客2,旅客3,旅客4,旅客5,旅客6,旅客7,,1. 分片設(shè)計(jì),根據(jù)分片原則 站點(diǎn)1:機(jī)場1, 班機(jī)1, 旅客1 站點(diǎn)2:機(jī)場2, 班機(jī)2, 旅客2 站點(diǎn)3:機(jī)場3, 班機(jī)3, 旅客3 根據(jù)極化表和頻率表 站點(diǎn)2:旅客4,旅客5,旅客6,旅客7 站點(diǎn)3:旅客5,2. 確定非冗余分配,冗余超出了同一實(shí)體所有片斷的效益 機(jī)場實(shí)體:不進(jìn)行冗余分配 班機(jī)實(shí)體:不進(jìn)行冗余分配 有限冗余 旅客實(shí)體: 預(yù)定離開兩個(gè)區(qū)域的乘客:,旅客4,旅客5,旅客6,放到兩個(gè)站點(diǎn)上 預(yù)定離開三個(gè)區(qū)域的乘客:旅客7,放到三個(gè)站點(diǎn)上,3. 冗余分配
27、,BC,站點(diǎn)1的局部模式,4. 局部邏輯模式,自然分配,班機(jī)2,從,到,訂票,登記,到,機(jī)場2,旅客2u 旅客4u 旅客6u 旅客7,AC,站點(diǎn)2的局部模式,4. 局部邏輯模式,自然分配,班機(jī)3,從,到,訂票,登記,到,機(jī)場3,旅客3u 旅客5u 旅客6u 旅客7,AB,站點(diǎn)3的局部模式,4. 局部邏輯模式,自然分配,將現(xiàn)有的各種不同的數(shù)據(jù)庫模式集成為全局模式. 三個(gè)問題 選擇公用數(shù)據(jù)庫模型來描述數(shù)據(jù)庫的全局模式 把每個(gè)站點(diǎn)上的本地模式翻譯成公用數(shù)據(jù)模型 把各站點(diǎn)上的本地?cái)?shù)據(jù)模式集成為一公用的全局模式,自底向上方法主要問題是構(gòu)造一個(gè)全局模式(超視圖). 把各站點(diǎn)上的數(shù)據(jù)庫模式看成是全局模式的一
28、個(gè)視圖 這個(gè)問題就可看作是視圖綜合問題 概括分層結(jié)構(gòu)支持視圖綜合 經(jīng)典方法就是生成三個(gè)實(shí)體:一個(gè)具有共同屬性(超類型),兩個(gè)具有不相交屬性(子類型) 視圖綜合次序 一次把一個(gè)視圖和全局模式進(jìn)行綜合,逐步構(gòu)造起全局視圖 通常,最好首先綜合最大的或最重要的視圖,然后跟著綜合小的或者不重要的視圖,班 機(jī),機(jī)號,日期,可用座位,出入口,座位圖,延期,班 機(jī),機(jī)號,日期,可用座位,機(jī)型,座位圖,識(shí)別相似性 模式命名相似性 模式結(jié)構(gòu)相似性 不同Site上有相似應(yīng)用, 使用各自DB的數(shù)據(jù)副本, 則這兩Site之間有某些相似點(diǎn). 識(shí)別沖突 命名沖突:同物異名(EMP,EMPLOYEE),異物同名 域差異 定標(biāo)
29、差異:計(jì)量單位不同(天、小時(shí)、分鐘、秒) 結(jié)構(gòu)差異:同一對象有的用實(shí)體描述, 有的用屬性描述. 處理操作期間不一致的數(shù)據(jù)策略(5種,p64-65),系統(tǒng)B概念模式,班機(jī),訂票,旅客,標(biāo)識(shí)符,起飛,起飛時(shí)間,座位圖,可用座位,種類,名字,電話,到達(dá),到達(dá)時(shí)間,班機(jī),班機(jī)B,班機(jī)A,飛機(jī)符(機(jī)號),日期 (1,3),可用座位,座位圖,出入口,登記,訂票,從,到,機(jī)場,到達(dá)時(shí)間,到達(dá)機(jī)場,起飛時(shí)間,起飛機(jī)場,起飛時(shí)間,到達(dá)時(shí)間,座位號,檢查行李,旅 客,種類,名字,電話,綜合后建立的全局模式,數(shù)據(jù)集成,XML Ontology View,Exercise 1 已知有如下兩種段分配: A R1在Sit
30、e1, R2在Site2, R3在Site3. B R1和R2在Site1, R2和R3在Site3. 另已知有如下應(yīng)用(所有應(yīng)用的頻率相同) A1: 在Site1上發(fā)出, 讀5個(gè) R1記錄, 5個(gè) R2記錄 A2: 在Site3上發(fā)出, 讀5個(gè)R3記錄 , 5個(gè)R2記錄 A3: 在Site2上發(fā)出, 讀10個(gè)R2記錄. 問: 1. 如果以本地應(yīng)用為主要設(shè)計(jì)目標(biāo), 那個(gè)分配較優(yōu)? 2. 假定A3改為要修改10個(gè)R2記錄, 并仍以本地應(yīng)用為其設(shè)計(jì)目標(biāo), 則那個(gè)分配方案較優(yōu)?,站點(diǎn)1,站點(diǎn)2,站點(diǎn)3,站點(diǎn)3,站點(diǎn)2,站點(diǎn)1,A1 R1,A3 R2,A2 R3,A1 R1, R2,A3,A2 R2, R3,方案A,方案B,讀取,更新,10,10,10,5,5,圖2-12 COMPANY關(guān)系數(shù)據(jù)庫模式, 主碼用下劃線標(biāo)出,EMPLOY,DEPARTMENT,DEPT_LOCATION,PROJECT,WORKS_ON,DEPENDENT,Exercise 2,三個(gè)站點(diǎn)A,B,C 部門1(總部),部門2,部門3 在站點(diǎn)B上頻繁訪問EMPLOYEE,PROJECT中有關(guān)工作在部門2的雇員和該部門管轄的項(xiàng)目信息 在站點(diǎn)C上頻繁訪問EMPLOYEE,PRO
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年四川啟賽微電子有限公司關(guān)于招聘質(zhì)量工程師崗位的備考題庫參考答案詳解
- 2026年安徽理工大學(xué)科技園經(jīng)開園區(qū)招聘備考題庫及完整答案詳解一套
- 2026年四川九州電子科技股份有限公司關(guān)于招聘技術(shù)員的備考題庫及完整答案詳解1套
- 2026年大連城投城市服務(wù)集團(tuán)有限公司招聘備考題庫含答案詳解
- 2026年臺(tái)州市黃巖城市建設(shè)開發(fā)投資集團(tuán)有限公司下屬公司公開招聘工作人員12人備考題庫及完整答案詳解1套
- 2026年平武縣光大國有投資(集團(tuán))有限公司關(guān)于面向社會(huì)公開招聘會(huì)計(jì)經(jīng)理的備考題庫及1套參考答案詳解
- 2026年宜昌金輝大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司招聘50人備考題庫完整參考答案詳解
- 2026年北京市海淀區(qū)實(shí)驗(yàn)小學(xué)教育集團(tuán)招聘備考題庫帶答案詳解
- 2026年定州市人民醫(yī)院(定州市急救中心)招聘備考題庫及完整答案詳解1套
- 2026年廣東碧桂園職業(yè)學(xué)院招聘33人備考題庫有答案詳解
- 2025年全國注冊監(jiān)理工程師繼續(xù)教育題庫附答案
- 鍋爐原理培訓(xùn)課件
- 重慶市高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)消防救援支隊(duì)政府專職消防員招錄(聘)114人參考題庫附答案
- 2026年林學(xué)概論選擇試題及答案
- 2026年安全員之A證考試題庫500道附參考答案(黃金題型)
- 兒童早教中心接待服務(wù)流程
- 腫瘤課件模板
- 大學(xué)計(jì)算機(jī)教程-計(jì)算與人工智能導(dǎo)論(第4版)課件 第3章 算法和數(shù)據(jù)結(jié)構(gòu)
- 帶脈的課件教學(xué)課件
- 自建房消防安全及案例培訓(xùn)課件
- 2025年廣東省第一次普通高中學(xué)業(yè)水平合格性考試(春季高考)思想政治試題(含答案詳解)
評論
0/150
提交評論