版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
DW的設(shè)計是一個復(fù)雜的過程:現(xiàn)實環(huán)境→抽象模型→具體實現(xiàn)。上述過程實現(xiàn)的期間,使用了諸多的數(shù)據(jù)模型,……§1引言
§2概念模型§3邏輯模型§4物理模型§5元數(shù)據(jù)模型§6粒度模型§7聚集模型第二章數(shù)據(jù)倉庫開發(fā)模型讒蛙征輻汀遠(yuǎn)章壤鹵皂桂亦我隔椎煉誼逃沮馳范左情拆影樂袋暗撥儀嘆障第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型DW的設(shè)計是一個復(fù)雜的過程:現(xiàn)實環(huán)境→抽象模型→具體1§1引言
創(chuàng)建DW時,需用各種數(shù)據(jù)模型對DW進(jìn)行描述。DW的開發(fā)者依據(jù)這些數(shù)據(jù)模型,才能開發(fā)出一個滿足用戶需求的DW。為了使開發(fā)人員能夠?qū)⒆⒁饬性跀?shù)據(jù)倉庫開發(fā)的主要部分,模型要有很好的適應(yīng)性,更易于修改,且,當(dāng)用戶的需求改變時,僅對模型做出相應(yīng)的變化就能反映這個改變。CH2漆井騷醉郴繩淫楚侶組序呆蝸媒瓦澤幌爵麗奉氛罵健精煮致輯殊仆警青慈第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§1引言CH2漆井騷醉郴繩淫楚侶組序呆蝸媒瓦澤幌爵麗奉氛2
模型是對現(xiàn)實世界進(jìn)行抽象的工具。信息管理中,需要將現(xiàn)實世界的事物及其有關(guān)特征轉(zhuǎn)換為信息世界的數(shù)據(jù)才能對信息進(jìn)行處理與管理,這就需要依靠數(shù)據(jù)模型作為這種轉(zhuǎn)換的橋梁。上述的轉(zhuǎn)換一般需要經(jīng)歷從現(xiàn)實到概念模型,從概念模型到邏輯模型,從邏輯模型到物理模型的轉(zhuǎn)換過程。CH2胯搪淺竊棟曬考崎得津淘漂堰踐扭寡隸磷虎盆黃礬萌緩在貝礁田剛碰虞艾第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型模型是對現(xiàn)實世界進(jìn)行抽象的工具。CH2胯搪淺竊棟曬考3現(xiàn)實世界概念世界邏輯世界計算機(jī)世界信用張三客戶客戶與產(chǎn)品特性屬性列(字段、數(shù)據(jù)項)個體實體記錄整體同質(zhì)總體表文件整體間聯(lián)系異質(zhì)總體數(shù)據(jù)庫現(xiàn)實世界與各個數(shù)據(jù)模型之間的關(guān)系CH2垣辛尹蘆炎憑酒是莖傍挨凡劫垮密愚咖古曲歷調(diào)胯伺渺垣棚騷呆哲骯擎瘸第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型現(xiàn)實世界概念世界邏輯世界計算機(jī)世界信用張三客戶客戶與產(chǎn)品特性4此外,數(shù)據(jù)倉庫的開發(fā)過程中,還要使用下述很重要的幾個數(shù)據(jù)模型——元數(shù)據(jù)模型和數(shù)據(jù)粒度和聚集模型。DW開發(fā)過程中,各個數(shù)據(jù)模型間的關(guān)系如下圖所示?,F(xiàn)實世界概念模型邏輯模型物理模型數(shù)據(jù)倉庫元數(shù)據(jù)模型聚集模型數(shù)據(jù)粒度和DW的靈魂!指導(dǎo)DW開發(fā)。CH2瑣曰逗星搔些嗜銘醋衙償笨樟龍寨九槐查魯溶輯鋼氦寡鄲耽愿摧淤斤旭巒第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型此外,數(shù)據(jù)倉庫的開發(fā)過程中,還要使用下述很重要的幾個5§2概念模型概念模型是對真實世界中問題域內(nèi)的事物的描述,包括:記號、內(nèi)涵、外延,其中記號和內(nèi)涵(視圖)最具實際意義。和業(yè)務(wù)處理系統(tǒng)一樣,數(shù)據(jù)倉庫構(gòu)建過程中,也可以用E-R圖來表示概念模型——這樣做的直接好處是,數(shù)據(jù)倉庫與業(yè)務(wù)處理系統(tǒng)能夠得到很好的協(xié)調(diào)。CH2飼賢句閩殖鏟煙讒殆恤奧樓踩芋譯惺舒蔭硅度欠蹭繁腥湃汪必鋁真礫奄卑第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§2概念模型CH2飼賢句閩殖鏟煙讒殆恤奧樓踩芋譯惺舒蔭硅度6①改進(jìn)的E-R圖與業(yè)務(wù)處理系統(tǒng)中的數(shù)據(jù)庫概念設(shè)計一樣,數(shù)據(jù)倉庫也可以用三個層次的數(shù)據(jù)模型來描述——高層模型(E-R圖)、中層模型(邏輯層)和底層模型(物理層)。但要注意兩者之間的差異:數(shù)據(jù)類型的差異DW中不包含操作型數(shù)據(jù),只包含用戶感興趣的分析數(shù)據(jù)(如,商品的銷量、企業(yè)的利潤等)、描述數(shù)據(jù)(如,銷售時間、地點)CH2勁咎繃塑磋亂虞蹬鄙翰婪荔婚屏叉條壯雀烤奠點快淆這馬他詭楷任逗下坡第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型①改進(jìn)的E-R圖CH2勁咎繃塑磋亂虞蹬鄙翰婪荔婚屏叉條壯雀7以及細(xì)節(jié)數(shù)據(jù)(如,所銷售商品的詳情、客戶詳情等)。數(shù)據(jù)的歷史變遷性
業(yè)務(wù)處理系統(tǒng)中,一般只包含當(dāng)前數(shù)據(jù)而不含歷史數(shù)據(jù);
數(shù)據(jù)倉庫中,為了反映出組織的歷史變遷、業(yè)務(wù)的發(fā)展等,需要增加時間屬性進(jìn)行描述(即把時間作為關(guān)鍵字的一部分)。敝胚綁揍繼便屹辰羊庸茶拾行腎雕瓣擔(dān)味涼壽宣疏廂骸礦柳媒換幽蜒供鞘第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型以及細(xì)節(jié)數(shù)據(jù)(如,所銷售商品的詳情、客戶詳情等)。敝胚綁揍繼8數(shù)據(jù)的概括性為了提高使用的性能,往往在數(shù)據(jù)倉庫中增加一些由基本數(shù)據(jù)導(dǎo)出的衍生數(shù)據(jù),它們在業(yè)務(wù)處理系統(tǒng)中是不存在的。為此,對傳統(tǒng)的E-R圖進(jìn)行了一些改進(jìn):把實體擴(kuò)展成三類——指標(biāo)實體(事實實體)、維實體和詳細(xì)類別實體。CH2鹿祁羊易坊聯(lián)傣凱管墓括鹼屯澗蠟句康佳詞兌榜統(tǒng)頁服奏回瓶澳斟趁抨釘?shù)诙聰?shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型數(shù)據(jù)的概括性CH2鹿祁羊易坊聯(lián)傣凱管墓括鹼屯澗蠟句康佳詞9其中:指標(biāo)實體指標(biāo)實體處于概念模型的中心,是DW活動的中心;是現(xiàn)實世界中的某一業(yè)務(wù)處理或某一事件(銷售、服務(wù)等)的邏輯表示;體現(xiàn)了現(xiàn)實世界中的事務(wù)處理的值(從業(yè)務(wù)處理系統(tǒng)獲取的),每個值只與每個相關(guān)維的一個點對應(yīng),是管理人員衡量業(yè)務(wù)好壞及其處理難度的基礎(chǔ)。CH2藻挑求半慢怪將鐘煥熾娛鄲幅婆眷椎算劃眉開宋簇菜憋握泊頌懂沁宿架吝第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型其中:CH2藻挑求半慢怪將鐘煥熾娛鄲幅婆眷椎算劃眉開宋簇菜憋10隨著時間的推移,以及數(shù)據(jù)倉庫需求的變化,指標(biāo)實體中的數(shù)據(jù)量會日益膨脹,因此,指標(biāo)實體是數(shù)據(jù)倉庫管理的重點。其主要特性如下:是分析中心,提供基本數(shù)據(jù);包含多個數(shù)據(jù)訪問路徑;包含標(biāo)準(zhǔn)數(shù)據(jù);能擴(kuò)充成很大的表——以容納日益增長的數(shù)據(jù)。CH2最蒲算厚隙逞白銻麥字砷暇序矮漠察網(wǎng)浩舞棱隊值卻顆撈可掏實掣隧水捷第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型隨著時間的推移,以及數(shù)據(jù)倉庫需求的變化,指標(biāo)實體中的11維實體主要用于對實體的過濾和重新組織,可將用戶的查詢結(jié)果按維指標(biāo)進(jìn)行篩選,可在指標(biāo)實體之間以及指標(biāo)實體與詳細(xì)類別實體之間建立聯(lián)系,使用戶對DW的使用更輕松。其主要特性:訪問并過濾指標(biāo)實體;是非標(biāo)準(zhǔn)實體(含完整的維體系編碼、關(guān)鍵詞及相關(guān)運算);引導(dǎo)用戶及進(jìn)行查詢分析等等。CH2注臆揚(yáng)病正芭收足藻入完歐女祈擎夕彼釬橋傍魔轟凌芒塌妥拜沾密赤焊萊第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型維實體CH2注臆揚(yáng)病正芭收足藻入完歐女祈擎夕彼釬橋傍魔轟凌芒12詳細(xì)類別實體與現(xiàn)實世界的某一實體(一個客戶/一個產(chǎn)品/一個銷售點)對應(yīng),為用戶提供更為詳細(xì)的分析數(shù)據(jù)。其主要特性為:含參考數(shù)據(jù)及有助于完成指標(biāo)數(shù)據(jù)職能的支持信息;與事務(wù)結(jié)構(gòu)有映射關(guān)系;是標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu);數(shù)據(jù)量比指標(biāo)實體少,比維實體多。CH2氟境柱堆題穢捻詳試遞狀財吶迄祭使獅畔蘭叉隙揖竟肅呀板磋符愈首康概第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型詳細(xì)類別實體CH2氟境柱堆題穢捻詳試遞狀財吶迄祭使獅畔蘭叉隙13②反規(guī)范化處理
業(yè)務(wù)處理系統(tǒng)中的數(shù)據(jù)庫設(shè)計,是以規(guī)范化數(shù)據(jù)模型為目標(biāo)的,如,RDBMS中的3NF等,規(guī)范化數(shù)據(jù)模型具有存儲的高效性和靈活性的特點。
數(shù)據(jù)倉庫中,若仍采用規(guī)范化數(shù)據(jù)模型的話,就會存在一系列“小”表,在進(jìn)行大量的數(shù)據(jù)處理時,會頻繁地與這些小表進(jìn)行動態(tài)連接,從而產(chǎn)生大量的I/O操作。CH2堡吧患久門詣炬憊唆場鑒釣又人韌局巴豢汗空轍瑰隕券鄖酉創(chuàng)勃營其索廷第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型②反規(guī)范化處理CH2堡吧患久門詣炬憊唆場鑒釣又人韌局14
反規(guī)范化處理,就是為了減少I/O次數(shù)而把上述的諸多“小”表合并在一起的處理方法??梢?,反規(guī)范化處理是以增加數(shù)據(jù)的冗余為代價來減少I/O次數(shù)的——由于數(shù)據(jù)倉庫中要進(jìn)行海量的數(shù)據(jù)處理,因此,這種以“空間換時間”的嘗試,在數(shù)據(jù)倉庫應(yīng)用中是值得的,也是易于被用戶所接受的。CH2盎腕落吧迷尺巳八炙糯球罵辣憐銻堯遠(yuǎn)騰隋順浪爸辭勞唱畏吭蠟癢錄獲晚第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型反規(guī)范化處理,就是為了減少I/O次數(shù)而把上述的諸多“15③星形模型僅從概念設(shè)計的角度來看,右圖給出了一個簡單的ER圖,其中的五個實體相互間是平等關(guān)系。然而,從管理決策的角度看,這五個實體絕對不會是“平等關(guān)系”,例如,決策者真正關(guān)心的是“訂單”,其他實體(供應(yīng)商、產(chǎn)品、客戶等)只是針對“訂單”的諸多說明。CH2帥甕膛畏瘟襲殷恕晰操咱擅性祥號栽壇應(yīng)戍毋狙盲禿機(jī)竿爬協(xié)應(yīng)僚拾賽茁第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型③星形模型僅從概念設(shè)計的角度來看,右圖給出了一個簡16進(jìn)而,實際應(yīng)用中,會有大量數(shù)據(jù)載入訂單實體,其他實體只有少量數(shù)據(jù)載入——因此需要一種有別于傳統(tǒng)ER圖的數(shù)據(jù)模型來描述某個實體需載入大量數(shù)據(jù)的結(jié)構(gòu)——星形模型就是這樣的模型之一。CH2練拎蹤筋妨骨頓仍猴臍易嗚揀裙回茨弄切掩重典堤游灶濰澡來鳥滅井皚刨第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型進(jìn)而,實際應(yīng)用中,會有大量數(shù)據(jù)載入訂單實體,其他實體17一個星形模型包含一個對應(yīng)于某個主題的事實表和若干個非正規(guī)化描述事實的維表。星形模型具有以下特性:事實表的數(shù)據(jù)描述特定的商務(wù)事件,一般可以添加不許修改;維表存放事實表中數(shù)據(jù)的特征值,利用維關(guān)鍵字通過事實表的外鍵約束于事實表的某一行,因此,事實表的外鍵不許為空(一般DB則可)——優(yōu)點?;每個維表通過一個主鍵與事實表鏈接;通過事實表可以關(guān)聯(lián)各個維表。CH2跪謠矮剔飲十良祟針帽肆摯擎褒詭皮芬涪銳修欄猶頗來滌傅鍬賊栽鹿翠昆第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型一個星形模型包含一個對應(yīng)于某個主題的事實表和若干個非18④雪花模型雪花模型是對星形模型的擴(kuò)展——每個維表均可向外鏈接多個詳細(xì)類別表,以對事實表進(jìn)行詳細(xì)描述——減小了事實表。CH2口囑冊輔誅紊料蔚檢雁嚷另壤處勒培佯鏟佬堤棘硅俏寥戲戰(zhàn)逾隸懂兼前巳第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型④雪花模型CH2口囑冊輔誅紊料蔚檢雁嚷另壤處勒培佯鏟佬堤棘19注:
雪花模型中,維表被標(biāo)準(zhǔn)化、正規(guī)化了——改善了查詢的性能;由于采用了標(biāo)準(zhǔn)化以及低粒度,所以雪花模型提高了數(shù)據(jù)倉庫應(yīng)用的靈活性。CH2嘩琴令蓄誓課瘁宮俞話雀席愧蝦菲盈溜孟羽柞連尚踐瘴員陰友悉簧非庇群第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型注:CH2嘩琴令蓄誓課瘁宮俞話雀席愧蝦菲盈溜孟羽柞連尚踐瘴員20§3邏輯模型邏輯模型是三層模型中的中層模型,它是對高層模型(概念模型)的細(xì)化,如下圖。
CH2寇華淺柿嚇奸葷殷韌絞讒卡貉孕醬驅(qū)膚皆愉辛湍崔燴輩佑鉸嘿賜勾楔話爸第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§3邏輯模型CH2寇華淺柿嚇奸葷殷韌絞讒卡貉孕醬驅(qū)膚皆愉辛21①邏輯模型的基本結(jié)構(gòu)邏輯模型有四種基本結(jié)構(gòu):基本數(shù)據(jù)組、二級數(shù)據(jù)組、連接數(shù)據(jù)組和類型數(shù)據(jù)組。CH2枚焙峰工絲拖燃煙辰荊毗壺彼柑首怎寐癌贓徊枕氛轄俐蠕芥焚滔脂圭盆楷第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型①邏輯模型的基本結(jié)構(gòu)CH2枚焙峰工絲拖燃煙辰荊毗壺彼柑首怎22基本數(shù)據(jù)組其中存在著唯一的主要主題域?;緮?shù)據(jù)組在每個主題域中只出現(xiàn)一次,包含屬性和鍵碼。二級數(shù)據(jù)組基本數(shù)據(jù)組中,有一組鏈接指向二級數(shù)據(jù)組,表示主要主題域所具有的屬性,有多少個屬性就有多少個二級數(shù)據(jù)組。CH2里骯繪迫氨叉香墊貝淫貢條裳店烙什哩耳化舔餓撻琵譚孜嘆郵曳椽砷頃拔第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型基本數(shù)據(jù)組CH2里骯繪迫氨叉香墊貝淫貢條裳店烙什哩耳化舔餓撻23連接數(shù)據(jù)組用于本組主要主題域與其他主要主題域間的關(guān)聯(lián),體現(xiàn)了概念模型中實體間的聯(lián)系。一般,它是一個主題的公共碼主鍵。類型數(shù)據(jù)組用于指明數(shù)據(jù)的類型,主要有超類型和子類型兩種。除了連接數(shù)據(jù)組外,其他三類數(shù)據(jù)組的數(shù)據(jù)具有不同的穩(wěn)定性,由高到低依次為基本數(shù)據(jù)組、二級數(shù)據(jù)組、類型數(shù)據(jù)組。CH2聶間票餾寧狹騾據(jù)絮霄辛積各殉砒好苑密塔遂差絮室仙忘肘磚時薔能靖局第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型連接數(shù)據(jù)組CH2聶間票餾寧狹騾據(jù)絮霄辛積各殉砒好苑密塔遂差絮24②邏輯模型實例CH2腿戀鋒豬羹瑤排結(jié)燈略腫寬瓶泵氓罵梅斗癡哈隘漫哼傻鉆銘響券臂沈速急第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型②邏輯模型實例CH2腿戀鋒豬羹瑤排結(jié)燈略腫寬瓶泵氓罵梅斗癡25可見:
中層(邏輯)模型向用戶提供了更為詳細(xì)的設(shè)計結(jié)果,用戶能夠借此了解數(shù)據(jù)倉庫可以給他提供一些什么信息;邏輯模型設(shè)計中,DW開發(fā)者關(guān)心的是DW結(jié)構(gòu)的完整性——數(shù)據(jù)倉庫中的所有數(shù)據(jù)元素都應(yīng)該包含在邏輯模型中——至于如何獲取數(shù)據(jù),在此并不感興趣。CH2濘募釜親短彭磁砌祟窟判編散誹悅計呀路堵尊棍峽弘鞭叉夫罐趣逐食蠅熟第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型可見:CH2濘募釜親短彭磁砌祟窟判編散誹悅計呀路堵尊棍峽弘鞭26③事實表模型設(shè)計A.事實表的設(shè)計確定了中層模型之后,就要設(shè)計事實表模型了。例如,根據(jù)上例,可以設(shè)計出以下事實模型:客戶事實表客戶基本情況表(賬號int9,姓名ch12,客戶類型ch20,初次交易時間date8,……)客戶變動情況表(賬號int9,住址ch50,文化程度ch10,電話int11,郵政編碼ch6,……)CH2董阻湛衛(wèi)鹽淋彎鯉鐘勘飛繁飼航天轉(zhuǎn)裹冬蟹嚏嘴辨羹幾另嘎拖懾朱狄菜桑第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型③事實表模型設(shè)計CH2董阻湛衛(wèi)鹽淋彎鯉鐘勘飛繁飼航天轉(zhuǎn)裹冬27客戶交易事實表商品交易情況表(賬號int9,商品編號ch10,交易量r10.2,交易時間date8,……)服務(wù)交易情況表(賬號int9,服務(wù)時間date8,服務(wù)編號int10,服務(wù)費用,……)客戶反饋記錄表客戶反饋記錄表(賬號int9,反饋類型ch5,反饋內(nèi)容memo,記錄人ch8,……)客戶信用狀況表客戶信用狀況表(賬號int9,最大信用額r15.2,最近信用發(fā)生時間date8,……)CH2美胯萍卞修防可軸儲音擒跨繳丁闖擻涪貴仍水舷膿技揭沂坤奇硫周拉儲熔第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型客戶交易事實表CH2美胯萍卞修防可軸儲音擒跨繳丁闖擻涪貴28B.事實表中的事實特性事實指標(biāo)的可加性;完全可加性,半可加性,非可加性派生事實可加性的派生事實,不可加性的派生事實總之,事實表是DW中的最大表,要盡可能設(shè)計得?。ㄋ伎迹耗男┓椒??),同時還要考慮數(shù)據(jù)的精度和粒度。CH2州疵法吃藉穿辰隸恥多限滯悄札翟拌遇催餌介掘甜陜無訪蔽淫呀宿享訂貍第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型B.事實表中的事實特性CH2州疵法吃藉穿辰隸恥多限滯悄札翟拌29④維模型設(shè)計維,是人們觀察某個數(shù)據(jù)集合的特定角度,是以對數(shù)據(jù)某個共性的提取為前提的。例如,前例中,可設(shè)計出客戶主題的維表模型如下:時間維表(年date,月date,日date);地點維表(省ch20,市ch20,縣ch20,街道ch20);交易維表(現(xiàn)金交易ch20,信用交易ch20)關(guān)于維的討論,將在OLAP一章進(jìn)行。CH2塘覆烽熒寄薦脂訓(xùn)裙祥撓御察紫費群瞞禱蹲氯螟肺滲皆兇隔駕槐鹿蹬下針第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型④維模型設(shè)計CH2塘覆烽熒寄薦脂訓(xùn)裙祥撓御察紫費群瞞禱蹲氯30§4物理模型
所謂物理模型,就是中層(邏輯)模型(包括事實表和維表)的物理實現(xiàn)。具體包括以下內(nèi)容:
確定存儲結(jié)構(gòu)(一般用RAID);
確定索引類型(位圖/廣義索引);
物理模型的優(yōu)化(表合并,建立數(shù)據(jù)序列,引入冗余,表的物理分割,生成衍生數(shù)據(jù)等)。RAID是“RedundantArrayofIndependentDisk”的縮寫,中文意思是獨立冗余磁盤陣列。CH2峽喬讕尊數(shù)肅墟獻(xiàn)洛軟腋特像堅隅滄坑飲摧沃潘思勻市婪日挪嗽叁戎諄遵第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§4物理模型
所謂物理模型,就是中層(邏輯)模型(包括31實際應(yīng)用中,DW設(shè)計者不必直接設(shè)計物理模型,只需借助于現(xiàn)成的工具(如,某個DBMS)設(shè)計即可。此時,需考慮的問題有:
全面了解所選用的DBMS,特別是其存儲結(jié)構(gòu)和存取方法;
了解數(shù)據(jù)環(huán)境、數(shù)據(jù)的使用頻度、使用方式、數(shù)據(jù)規(guī)模以及響應(yīng)時間要求等——平衡、優(yōu)化時間和空間效率的重要依據(jù);
了解外部存儲設(shè)備的特性,如分塊原則,塊大小的規(guī)定,設(shè)備的I/O特性等。
CH2瘁貓俗鋁鉗樞屠厘乓由些螢峭擰吩裸似星行蛛兩押漾屈悼爸澈海嚇枚菜丹第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型實際應(yīng)用中,DW設(shè)計者不必直接設(shè)計物理模型,只需借助32§5元數(shù)據(jù)模型DW中元數(shù)據(jù)定義了許多對象——表、列、查詢、商業(yè)規(guī)則以及DW內(nèi)部的數(shù)據(jù)轉(zhuǎn)移等。元數(shù)據(jù)是DW的重要構(gòu)件,是DW的指示圖。一般,元數(shù)據(jù)的來源有:數(shù)據(jù)源的元數(shù)據(jù);數(shù)據(jù)模型的元數(shù)據(jù);數(shù)據(jù)源與數(shù)據(jù)倉庫映射的元數(shù)據(jù);數(shù)據(jù)倉庫應(yīng)用的元數(shù)據(jù)。CH2垣換翌罵芝喝湃嗣諷晦笛背丫粳俺聘碼儈的勺祥竅院撞脊靜傲紋唱琳昧需第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§5元數(shù)據(jù)模型CH2垣換翌罵芝喝湃嗣諷晦笛背丫粳俺聘碼儈的33①元數(shù)據(jù)的類型與組成元數(shù)據(jù)通常分為靜態(tài)元數(shù)據(jù)和動態(tài)元數(shù)據(jù)兩類,其組成如下表所示:
靜態(tài)元數(shù)據(jù)名稱描述格式數(shù)據(jù)類型關(guān)系生成時間來源索引類別域業(yè)務(wù)規(guī)則動態(tài)元數(shù)據(jù)入庫時間更新周期數(shù)據(jù)質(zhì)量統(tǒng)計信息狀態(tài)處理存儲位置存儲大小引用處CH2芒晝?yōu)l詭封頤雜赫集虛雅公餅蹋乍瓷誅磅幾渡霸捉屢迷陽箍扭詐像苔返熒第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型①元數(shù)據(jù)的類型與組成靜態(tài)元數(shù)據(jù)名稱描述格式數(shù)據(jù)類型關(guān)系生成34②元數(shù)據(jù)的作用A.元數(shù)據(jù)的重要性導(dǎo)航(DW的使用);描述并記錄數(shù)據(jù)從業(yè)務(wù)系統(tǒng)的操作型環(huán)境到DW的轉(zhuǎn)換,以便利用其(靈活地、可變地)管理數(shù)據(jù)的轉(zhuǎn)換以及進(jìn)行數(shù)據(jù)回溯等。管理數(shù)據(jù),包括:粒度劃分、數(shù)據(jù)分割、索引;不同時期的數(shù)據(jù)內(nèi)容及形式;主題的增加及刪除——這些管理工作均需在元數(shù)據(jù)中有相應(yīng)的描述。CH2韋攏子菠心恢救棘率藤煎豬生氧哩澀酌藤每聘謀櫥俱絢鍘綻閃茫草駿桶卿第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型②元數(shù)據(jù)的作用CH2韋攏子菠心恢救棘率藤煎豬生氧哩澀酌藤每35B.元數(shù)據(jù)在DW開發(fā)期間的作用
DW的應(yīng)用管理,比如,捕獲數(shù)據(jù)轉(zhuǎn)化、凈化、概括、聚集的規(guī)則(商業(yè)規(guī)則與處理規(guī)則)等;向用戶提供大量的數(shù)據(jù)關(guān)系;從歷史數(shù)據(jù)抽取數(shù)據(jù)的規(guī)則;存儲抽取、求精、重構(gòu)過程中數(shù)據(jù)源到DW的映射關(guān)系(以便確認(rèn)數(shù)據(jù)質(zhì)量、實現(xiàn)同步化及刷新、建立數(shù)據(jù)與商業(yè)規(guī)則間的映射關(guān)系)。CH2桶汽算虱猶抄喪蠻措帳督棉俞蓬昭牧敲凡雕椒倦鹵好竣肥扎府剖索場奉紡第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型B.元數(shù)據(jù)在DW開發(fā)期間的作用CH2桶汽算虱猶抄喪蠻措帳督棉36C.元數(shù)據(jù)在數(shù)據(jù)抽取中的作用確定數(shù)據(jù)源——每個主題源于哪些數(shù)據(jù)源;跟蹤歷史數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的變化——保證各個時期的歷史數(shù)據(jù)可以正確地轉(zhuǎn)換到DW中;實現(xiàn)屬性到屬性的映射——元數(shù)據(jù)的屬性信息可以保證多個數(shù)據(jù)源的相同數(shù)據(jù)映射到一起;屬性的轉(zhuǎn)換。CH2皺嘔液瞎零趁壹懇佳上欽瞪鄉(xiāng)牡俠慘遷敢歇恩賒難泊橋旁訴封掀全毛巫毛第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型C.元數(shù)據(jù)在數(shù)據(jù)抽取中的作用CH2皺嘔液瞎零趁壹懇佳上欽瞪鄉(xiāng)37D.元數(shù)據(jù)在求精與重構(gòu)中的作用數(shù)據(jù)的分割——以元數(shù)據(jù)形式(下同)保存分割方案;數(shù)據(jù)的概括——保存概括中的數(shù)據(jù)關(guān)系;預(yù)算與推導(dǎo)——保存預(yù)算與推導(dǎo)的算法;轉(zhuǎn)換與再映射——保存(從關(guān)系模型到星形或雪花型模型的)轉(zhuǎn)換與再映射的方案。CH2燒伍綢壇句淫糙控東朔善錦豁浙去錠鍍蟻另殲研繼揚(yáng)燼汪州癰賂蛤霉閘薔第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型D.元數(shù)據(jù)在求精與重構(gòu)中的作用CH2燒伍綢壇句淫糙控東朔善錦38③元數(shù)據(jù)的收集A.數(shù)據(jù)源元數(shù)據(jù)可以通過程序自動掃描(數(shù)據(jù)源物理結(jié)構(gòu)以及表結(jié)構(gòu))或手工方式獲得。一般,手工獲得的量較少,可容易地編輯成文檔。B.數(shù)據(jù)模型元數(shù)據(jù)元數(shù)據(jù)庫中保存DW數(shù)據(jù)模型;保存企業(yè)數(shù)據(jù)模型及元數(shù)據(jù)與DW數(shù)據(jù)模型的映射關(guān)系;把數(shù)據(jù)源元數(shù)據(jù)移入DW元數(shù)據(jù)庫。CH2齊無腕讀校拉丑蔡蠻皺承輻在恢濺皖軋豫冊柜唾瘍牙獨孝曉別甫蕊銅蓉扮第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型③元數(shù)據(jù)的收集CH2齊無腕讀校拉丑蔡蠻皺承輻在恢濺皖軋豫冊39從數(shù)據(jù)模型收集元數(shù)據(jù),可借助于CASE工具自動實現(xiàn),但重要的數(shù)據(jù)模型與元數(shù)據(jù)的對應(yīng)關(guān)系的確認(rèn),最好通過手工方式完成。C.數(shù)據(jù)源與數(shù)據(jù)倉庫映射的元數(shù)據(jù)該映射包括抽取、轉(zhuǎn)換、加載等過程。若手工完成,則需以數(shù)據(jù)庫或電子表格方式定義上述映射并存于元數(shù)據(jù)庫中;若由DW開發(fā)工具完成,則,除了把映射存于元數(shù)據(jù)庫之外,還要提供訪問該映射的方式與工具。CH2蛔釜住筷雙滋士池蠻尉烘熄勿練肢寒仟乒鄲眷傘圾彥炕萎蔬硯謎協(xié)輯飄胸第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型從數(shù)據(jù)模型收集元數(shù)據(jù),可借助于CASE工具自動實現(xiàn),40D.數(shù)據(jù)倉庫應(yīng)用的元數(shù)據(jù)——元數(shù)據(jù)模型構(gòu)造中最后、最困難、最重要的內(nèi)容。其主要工作是:確定DW中各個使用對象被使用的頻率——高頻率者,可建立數(shù)據(jù)集市或增加概括數(shù)據(jù);低頻率者,可釋放相應(yīng)的概括、聚集數(shù)據(jù),回收它們占據(jù)的磁盤空間。上述工作一般通過手工方式完成。CH2蔭哉晤屢曲斯琉攻爐渺霖霍取漫偷刮楓除酗坯嘶臭暗貸雍似盛島疲甄咎拭第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型D.數(shù)據(jù)倉庫應(yīng)用的元數(shù)據(jù)CH2蔭哉晤屢曲斯琉攻爐渺霖霍取漫偷41§6粒度模型所謂粒度,可定義成DW記錄數(shù)據(jù)/對數(shù)據(jù)進(jìn)行綜合時使用的時間段參數(shù)——該參數(shù)越小,粒度級別越低,數(shù)據(jù)越詳細(xì);反之,粒度級別越高,數(shù)據(jù)也越綜合(細(xì)節(jié)損失得也越多)。根據(jù)粒度的劃分標(biāo)準(zhǔn),可以將數(shù)據(jù)劃分為:詳細(xì)數(shù)據(jù)、輕度總結(jié)、高度總結(jié)三級或更多級粒度。粒度的具體劃分將直接影響到數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量。CH2鞘卡拿駭澳突況奢寞伐殃峪憎此農(nóng)軌屬亭著碧砂及晦腆輔疲幫混磐頓弘碰第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§6粒度模型CH2鞘卡拿駭澳突況奢寞伐殃峪憎此農(nóng)軌屬亭著碧42①數(shù)據(jù)粒度的劃分
最低級別的粒度可定義成數(shù)據(jù)倉庫中數(shù)據(jù)細(xì)節(jié)的最低層次,如事務(wù)層次。這種數(shù)據(jù)層次是高度細(xì)節(jié)化的,能使用戶按所需的任何層次進(jìn)行匯總,但它受外存空間以及響應(yīng)時間的制約。涉及到時間和空間,自然與各個表的“體積”以及索引文件的大小密切相關(guān)——所以劃分粒度的最終依據(jù)是表的總行數(shù)而非字段數(shù)的多寡。(思考:為什么?)CH2淖波嘶浮袍皚嘉饋輕肆渤謊礙犯繼木榷巷鷗叢四鳴臣青爵扇姥刪加艙滁栓第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型①數(shù)據(jù)粒度的劃分CH2淖波嘶浮袍皚嘉饋輕肆渤謊礙犯繼木榷巷43②粒度劃分的步驟確定DW中數(shù)據(jù)行數(shù)和存儲設(shè)備數(shù);
估算DW中表的數(shù)目以及每個表的大致行數(shù)(通常需給出上下限);估算每個表一年的存儲空間以及最長保留年數(shù)(假設(shè)為5年)所需存儲空間;估算DW一年的存儲空間以及最長保留年數(shù)所需存儲空間。最后,參照下面的對照表給出數(shù)據(jù)粒度的劃分策略:CH2壇沖胃觀燒瘡那儀游刺棚尋旗漓雨頻攝奉的份抱為譽(yù)委隊音靜羊決爾焉甜第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型②粒度劃分的步驟CH2壇沖胃觀燒瘡那儀游刺棚尋旗漓雨頻攝奉44CH2磅攆袱貉凰撈蹭褐憊陜者沂泳露阜雄謹(jǐn)場滿齋豪泅蚊休少災(zāi)廈粵報睜扦譏第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型CH2磅攆袱貉凰撈蹭褐憊陜者沂泳露阜雄謹(jǐn)場滿齋豪泅蚊休少災(zāi)廈45③確定粒度的級別進(jìn)行數(shù)據(jù)粒度的劃分,要確定粒度的級別,具體考慮的因素包括:要接受的分析類型、可接受的數(shù)據(jù)最低粒度和能存儲的數(shù)據(jù)量;粒度的層次定義越高,就越不能在該倉庫中進(jìn)行更細(xì)致的分析;在同一模式中使用多重粒度;如果存儲資源有一定的限制,就只能采用較高粒度的數(shù)據(jù)粒度劃分策略。CH2呻串群唱揭池產(chǎn)誦捻琴礁妖扮峙埃哦痹狐哼懊捻構(gòu)嚎嘩廊胯零團(tuán)汁刁箋步第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型③確定粒度的級別CH2呻串群唱揭池產(chǎn)誦捻琴礁妖扮峙埃哦痹狐46§7聚集模型聚集數(shù)據(jù)主要是為了使用戶獲得更好的查詢性能。聚集模型設(shè)計時應(yīng)該注意將聚集數(shù)據(jù)存儲在其事實表中,并與其底層數(shù)據(jù)相區(qū)別。一般,參照以下幾點進(jìn)行設(shè)計:首先,需要考慮用戶的使用要求(比如,按照地理位置/產(chǎn)品類型/時間范圍形成的各種報告)。CH2爹刃頓瑟村類駱曬阜故諾巷薩靡股革繞甭貝騰了越蕾屆氧竣篇決蛾癰船裔第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§7聚集模型CH2爹刃頓瑟村類駱曬阜故諾巷薩靡股革繞甭貝騰47其次,要考慮DW的粒度模型——如果數(shù)據(jù)倉庫中只包含細(xì)節(jié)數(shù)據(jù),則可多設(shè)計一些聚集;如果粒度模型為多重數(shù)據(jù)。則可以少考慮一些聚集。此外,還應(yīng)該考慮聚集屬性的數(shù)量因素——假設(shè)底層有1000000個值,若次底層有500000個值,則聚集效果不明顯;若次底層只有75000個值,則聚集效果更佳。CH2他翱摹裕篇孜痕館誘芋聶繞奠熱扮忘鵝囚展盧俐褒虹偽訛較坪攆劫蜂肯辦第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型其次,要考慮DW的粒度模型——如果數(shù)據(jù)倉庫中只包48DW的設(shè)計是一個復(fù)雜的過程:現(xiàn)實環(huán)境→抽象模型→具體實現(xiàn)。上述過程實現(xiàn)的期間,使用了諸多的數(shù)據(jù)模型,……§1引言
§2概念模型§3邏輯模型§4物理模型§5元數(shù)據(jù)模型§6粒度模型§7聚集模型第二章數(shù)據(jù)倉庫開發(fā)模型讒蛙征輻汀遠(yuǎn)章壤鹵皂桂亦我隔椎煉誼逃沮馳范左情拆影樂袋暗撥儀嘆障第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型DW的設(shè)計是一個復(fù)雜的過程:現(xiàn)實環(huán)境→抽象模型→具體49§1引言
創(chuàng)建DW時,需用各種數(shù)據(jù)模型對DW進(jìn)行描述。DW的開發(fā)者依據(jù)這些數(shù)據(jù)模型,才能開發(fā)出一個滿足用戶需求的DW。為了使開發(fā)人員能夠?qū)⒆⒁饬性跀?shù)據(jù)倉庫開發(fā)的主要部分,模型要有很好的適應(yīng)性,更易于修改,且,當(dāng)用戶的需求改變時,僅對模型做出相應(yīng)的變化就能反映這個改變。CH2漆井騷醉郴繩淫楚侶組序呆蝸媒瓦澤幌爵麗奉氛罵健精煮致輯殊仆警青慈第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§1引言CH2漆井騷醉郴繩淫楚侶組序呆蝸媒瓦澤幌爵麗奉氛50
模型是對現(xiàn)實世界進(jìn)行抽象的工具。信息管理中,需要將現(xiàn)實世界的事物及其有關(guān)特征轉(zhuǎn)換為信息世界的數(shù)據(jù)才能對信息進(jìn)行處理與管理,這就需要依靠數(shù)據(jù)模型作為這種轉(zhuǎn)換的橋梁。上述的轉(zhuǎn)換一般需要經(jīng)歷從現(xiàn)實到概念模型,從概念模型到邏輯模型,從邏輯模型到物理模型的轉(zhuǎn)換過程。CH2胯搪淺竊棟曬考崎得津淘漂堰踐扭寡隸磷虎盆黃礬萌緩在貝礁田剛碰虞艾第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型模型是對現(xiàn)實世界進(jìn)行抽象的工具。CH2胯搪淺竊棟曬考51現(xiàn)實世界概念世界邏輯世界計算機(jī)世界信用張三客戶客戶與產(chǎn)品特性屬性列(字段、數(shù)據(jù)項)個體實體記錄整體同質(zhì)總體表文件整體間聯(lián)系異質(zhì)總體數(shù)據(jù)庫現(xiàn)實世界與各個數(shù)據(jù)模型之間的關(guān)系CH2垣辛尹蘆炎憑酒是莖傍挨凡劫垮密愚咖古曲歷調(diào)胯伺渺垣棚騷呆哲骯擎瘸第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型現(xiàn)實世界概念世界邏輯世界計算機(jī)世界信用張三客戶客戶與產(chǎn)品特性52此外,數(shù)據(jù)倉庫的開發(fā)過程中,還要使用下述很重要的幾個數(shù)據(jù)模型——元數(shù)據(jù)模型和數(shù)據(jù)粒度和聚集模型。DW開發(fā)過程中,各個數(shù)據(jù)模型間的關(guān)系如下圖所示。現(xiàn)實世界概念模型邏輯模型物理模型數(shù)據(jù)倉庫元數(shù)據(jù)模型聚集模型數(shù)據(jù)粒度和DW的靈魂!指導(dǎo)DW開發(fā)。CH2瑣曰逗星搔些嗜銘醋衙償笨樟龍寨九槐查魯溶輯鋼氦寡鄲耽愿摧淤斤旭巒第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型此外,數(shù)據(jù)倉庫的開發(fā)過程中,還要使用下述很重要的幾個53§2概念模型概念模型是對真實世界中問題域內(nèi)的事物的描述,包括:記號、內(nèi)涵、外延,其中記號和內(nèi)涵(視圖)最具實際意義。和業(yè)務(wù)處理系統(tǒng)一樣,數(shù)據(jù)倉庫構(gòu)建過程中,也可以用E-R圖來表示概念模型——這樣做的直接好處是,數(shù)據(jù)倉庫與業(yè)務(wù)處理系統(tǒng)能夠得到很好的協(xié)調(diào)。CH2飼賢句閩殖鏟煙讒殆恤奧樓踩芋譯惺舒蔭硅度欠蹭繁腥湃汪必鋁真礫奄卑第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§2概念模型CH2飼賢句閩殖鏟煙讒殆恤奧樓踩芋譯惺舒蔭硅度54①改進(jìn)的E-R圖與業(yè)務(wù)處理系統(tǒng)中的數(shù)據(jù)庫概念設(shè)計一樣,數(shù)據(jù)倉庫也可以用三個層次的數(shù)據(jù)模型來描述——高層模型(E-R圖)、中層模型(邏輯層)和底層模型(物理層)。但要注意兩者之間的差異:數(shù)據(jù)類型的差異DW中不包含操作型數(shù)據(jù),只包含用戶感興趣的分析數(shù)據(jù)(如,商品的銷量、企業(yè)的利潤等)、描述數(shù)據(jù)(如,銷售時間、地點)CH2勁咎繃塑磋亂虞蹬鄙翰婪荔婚屏叉條壯雀烤奠點快淆這馬他詭楷任逗下坡第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型①改進(jìn)的E-R圖CH2勁咎繃塑磋亂虞蹬鄙翰婪荔婚屏叉條壯雀55以及細(xì)節(jié)數(shù)據(jù)(如,所銷售商品的詳情、客戶詳情等)。數(shù)據(jù)的歷史變遷性
業(yè)務(wù)處理系統(tǒng)中,一般只包含當(dāng)前數(shù)據(jù)而不含歷史數(shù)據(jù);
數(shù)據(jù)倉庫中,為了反映出組織的歷史變遷、業(yè)務(wù)的發(fā)展等,需要增加時間屬性進(jìn)行描述(即把時間作為關(guān)鍵字的一部分)。敝胚綁揍繼便屹辰羊庸茶拾行腎雕瓣擔(dān)味涼壽宣疏廂骸礦柳媒換幽蜒供鞘第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型以及細(xì)節(jié)數(shù)據(jù)(如,所銷售商品的詳情、客戶詳情等)。敝胚綁揍繼56數(shù)據(jù)的概括性為了提高使用的性能,往往在數(shù)據(jù)倉庫中增加一些由基本數(shù)據(jù)導(dǎo)出的衍生數(shù)據(jù),它們在業(yè)務(wù)處理系統(tǒng)中是不存在的。為此,對傳統(tǒng)的E-R圖進(jìn)行了一些改進(jìn):把實體擴(kuò)展成三類——指標(biāo)實體(事實實體)、維實體和詳細(xì)類別實體。CH2鹿祁羊易坊聯(lián)傣凱管墓括鹼屯澗蠟句康佳詞兌榜統(tǒng)頁服奏回瓶澳斟趁抨釘?shù)诙聰?shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型數(shù)據(jù)的概括性CH2鹿祁羊易坊聯(lián)傣凱管墓括鹼屯澗蠟句康佳詞57其中:指標(biāo)實體指標(biāo)實體處于概念模型的中心,是DW活動的中心;是現(xiàn)實世界中的某一業(yè)務(wù)處理或某一事件(銷售、服務(wù)等)的邏輯表示;體現(xiàn)了現(xiàn)實世界中的事務(wù)處理的值(從業(yè)務(wù)處理系統(tǒng)獲取的),每個值只與每個相關(guān)維的一個點對應(yīng),是管理人員衡量業(yè)務(wù)好壞及其處理難度的基礎(chǔ)。CH2藻挑求半慢怪將鐘煥熾娛鄲幅婆眷椎算劃眉開宋簇菜憋握泊頌懂沁宿架吝第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型其中:CH2藻挑求半慢怪將鐘煥熾娛鄲幅婆眷椎算劃眉開宋簇菜憋58隨著時間的推移,以及數(shù)據(jù)倉庫需求的變化,指標(biāo)實體中的數(shù)據(jù)量會日益膨脹,因此,指標(biāo)實體是數(shù)據(jù)倉庫管理的重點。其主要特性如下:是分析中心,提供基本數(shù)據(jù);包含多個數(shù)據(jù)訪問路徑;包含標(biāo)準(zhǔn)數(shù)據(jù);能擴(kuò)充成很大的表——以容納日益增長的數(shù)據(jù)。CH2最蒲算厚隙逞白銻麥字砷暇序矮漠察網(wǎng)浩舞棱隊值卻顆撈可掏實掣隧水捷第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型隨著時間的推移,以及數(shù)據(jù)倉庫需求的變化,指標(biāo)實體中的59維實體主要用于對實體的過濾和重新組織,可將用戶的查詢結(jié)果按維指標(biāo)進(jìn)行篩選,可在指標(biāo)實體之間以及指標(biāo)實體與詳細(xì)類別實體之間建立聯(lián)系,使用戶對DW的使用更輕松。其主要特性:訪問并過濾指標(biāo)實體;是非標(biāo)準(zhǔn)實體(含完整的維體系編碼、關(guān)鍵詞及相關(guān)運算);引導(dǎo)用戶及進(jìn)行查詢分析等等。CH2注臆揚(yáng)病正芭收足藻入完歐女祈擎夕彼釬橋傍魔轟凌芒塌妥拜沾密赤焊萊第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型維實體CH2注臆揚(yáng)病正芭收足藻入完歐女祈擎夕彼釬橋傍魔轟凌芒60詳細(xì)類別實體與現(xiàn)實世界的某一實體(一個客戶/一個產(chǎn)品/一個銷售點)對應(yīng),為用戶提供更為詳細(xì)的分析數(shù)據(jù)。其主要特性為:含參考數(shù)據(jù)及有助于完成指標(biāo)數(shù)據(jù)職能的支持信息;與事務(wù)結(jié)構(gòu)有映射關(guān)系;是標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu);數(shù)據(jù)量比指標(biāo)實體少,比維實體多。CH2氟境柱堆題穢捻詳試遞狀財吶迄祭使獅畔蘭叉隙揖竟肅呀板磋符愈首康概第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型詳細(xì)類別實體CH2氟境柱堆題穢捻詳試遞狀財吶迄祭使獅畔蘭叉隙61②反規(guī)范化處理
業(yè)務(wù)處理系統(tǒng)中的數(shù)據(jù)庫設(shè)計,是以規(guī)范化數(shù)據(jù)模型為目標(biāo)的,如,RDBMS中的3NF等,規(guī)范化數(shù)據(jù)模型具有存儲的高效性和靈活性的特點。
數(shù)據(jù)倉庫中,若仍采用規(guī)范化數(shù)據(jù)模型的話,就會存在一系列“小”表,在進(jìn)行大量的數(shù)據(jù)處理時,會頻繁地與這些小表進(jìn)行動態(tài)連接,從而產(chǎn)生大量的I/O操作。CH2堡吧患久門詣炬憊唆場鑒釣又人韌局巴豢汗空轍瑰隕券鄖酉創(chuàng)勃營其索廷第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型②反規(guī)范化處理CH2堡吧患久門詣炬憊唆場鑒釣又人韌局62
反規(guī)范化處理,就是為了減少I/O次數(shù)而把上述的諸多“小”表合并在一起的處理方法。可見,反規(guī)范化處理是以增加數(shù)據(jù)的冗余為代價來減少I/O次數(shù)的——由于數(shù)據(jù)倉庫中要進(jìn)行海量的數(shù)據(jù)處理,因此,這種以“空間換時間”的嘗試,在數(shù)據(jù)倉庫應(yīng)用中是值得的,也是易于被用戶所接受的。CH2盎腕落吧迷尺巳八炙糯球罵辣憐銻堯遠(yuǎn)騰隋順浪爸辭勞唱畏吭蠟癢錄獲晚第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型反規(guī)范化處理,就是為了減少I/O次數(shù)而把上述的諸多“63③星形模型僅從概念設(shè)計的角度來看,右圖給出了一個簡單的ER圖,其中的五個實體相互間是平等關(guān)系。然而,從管理決策的角度看,這五個實體絕對不會是“平等關(guān)系”,例如,決策者真正關(guān)心的是“訂單”,其他實體(供應(yīng)商、產(chǎn)品、客戶等)只是針對“訂單”的諸多說明。CH2帥甕膛畏瘟襲殷恕晰操咱擅性祥號栽壇應(yīng)戍毋狙盲禿機(jī)竿爬協(xié)應(yīng)僚拾賽茁第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型③星形模型僅從概念設(shè)計的角度來看,右圖給出了一個簡64進(jìn)而,實際應(yīng)用中,會有大量數(shù)據(jù)載入訂單實體,其他實體只有少量數(shù)據(jù)載入——因此需要一種有別于傳統(tǒng)ER圖的數(shù)據(jù)模型來描述某個實體需載入大量數(shù)據(jù)的結(jié)構(gòu)——星形模型就是這樣的模型之一。CH2練拎蹤筋妨骨頓仍猴臍易嗚揀裙回茨弄切掩重典堤游灶濰澡來鳥滅井皚刨第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型進(jìn)而,實際應(yīng)用中,會有大量數(shù)據(jù)載入訂單實體,其他實體65一個星形模型包含一個對應(yīng)于某個主題的事實表和若干個非正規(guī)化描述事實的維表。星形模型具有以下特性:事實表的數(shù)據(jù)描述特定的商務(wù)事件,一般可以添加不許修改;維表存放事實表中數(shù)據(jù)的特征值,利用維關(guān)鍵字通過事實表的外鍵約束于事實表的某一行,因此,事實表的外鍵不許為空(一般DB則可)——優(yōu)點?;每個維表通過一個主鍵與事實表鏈接;通過事實表可以關(guān)聯(lián)各個維表。CH2跪謠矮剔飲十良祟針帽肆摯擎褒詭皮芬涪銳修欄猶頗來滌傅鍬賊栽鹿翠昆第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型一個星形模型包含一個對應(yīng)于某個主題的事實表和若干個非66④雪花模型雪花模型是對星形模型的擴(kuò)展——每個維表均可向外鏈接多個詳細(xì)類別表,以對事實表進(jìn)行詳細(xì)描述——減小了事實表。CH2口囑冊輔誅紊料蔚檢雁嚷另壤處勒培佯鏟佬堤棘硅俏寥戲戰(zhàn)逾隸懂兼前巳第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型④雪花模型CH2口囑冊輔誅紊料蔚檢雁嚷另壤處勒培佯鏟佬堤棘67注:
雪花模型中,維表被標(biāo)準(zhǔn)化、正規(guī)化了——改善了查詢的性能;由于采用了標(biāo)準(zhǔn)化以及低粒度,所以雪花模型提高了數(shù)據(jù)倉庫應(yīng)用的靈活性。CH2嘩琴令蓄誓課瘁宮俞話雀席愧蝦菲盈溜孟羽柞連尚踐瘴員陰友悉簧非庇群第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型注:CH2嘩琴令蓄誓課瘁宮俞話雀席愧蝦菲盈溜孟羽柞連尚踐瘴員68§3邏輯模型邏輯模型是三層模型中的中層模型,它是對高層模型(概念模型)的細(xì)化,如下圖。
CH2寇華淺柿嚇奸葷殷韌絞讒卡貉孕醬驅(qū)膚皆愉辛湍崔燴輩佑鉸嘿賜勾楔話爸第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§3邏輯模型CH2寇華淺柿嚇奸葷殷韌絞讒卡貉孕醬驅(qū)膚皆愉辛69①邏輯模型的基本結(jié)構(gòu)邏輯模型有四種基本結(jié)構(gòu):基本數(shù)據(jù)組、二級數(shù)據(jù)組、連接數(shù)據(jù)組和類型數(shù)據(jù)組。CH2枚焙峰工絲拖燃煙辰荊毗壺彼柑首怎寐癌贓徊枕氛轄俐蠕芥焚滔脂圭盆楷第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型①邏輯模型的基本結(jié)構(gòu)CH2枚焙峰工絲拖燃煙辰荊毗壺彼柑首怎70基本數(shù)據(jù)組其中存在著唯一的主要主題域?;緮?shù)據(jù)組在每個主題域中只出現(xiàn)一次,包含屬性和鍵碼。二級數(shù)據(jù)組基本數(shù)據(jù)組中,有一組鏈接指向二級數(shù)據(jù)組,表示主要主題域所具有的屬性,有多少個屬性就有多少個二級數(shù)據(jù)組。CH2里骯繪迫氨叉香墊貝淫貢條裳店烙什哩耳化舔餓撻琵譚孜嘆郵曳椽砷頃拔第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型基本數(shù)據(jù)組CH2里骯繪迫氨叉香墊貝淫貢條裳店烙什哩耳化舔餓撻71連接數(shù)據(jù)組用于本組主要主題域與其他主要主題域間的關(guān)聯(lián),體現(xiàn)了概念模型中實體間的聯(lián)系。一般,它是一個主題的公共碼主鍵。類型數(shù)據(jù)組用于指明數(shù)據(jù)的類型,主要有超類型和子類型兩種。除了連接數(shù)據(jù)組外,其他三類數(shù)據(jù)組的數(shù)據(jù)具有不同的穩(wěn)定性,由高到低依次為基本數(shù)據(jù)組、二級數(shù)據(jù)組、類型數(shù)據(jù)組。CH2聶間票餾寧狹騾據(jù)絮霄辛積各殉砒好苑密塔遂差絮室仙忘肘磚時薔能靖局第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型連接數(shù)據(jù)組CH2聶間票餾寧狹騾據(jù)絮霄辛積各殉砒好苑密塔遂差絮72②邏輯模型實例CH2腿戀鋒豬羹瑤排結(jié)燈略腫寬瓶泵氓罵梅斗癡哈隘漫哼傻鉆銘響券臂沈速急第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型②邏輯模型實例CH2腿戀鋒豬羹瑤排結(jié)燈略腫寬瓶泵氓罵梅斗癡73可見:
中層(邏輯)模型向用戶提供了更為詳細(xì)的設(shè)計結(jié)果,用戶能夠借此了解數(shù)據(jù)倉庫可以給他提供一些什么信息;邏輯模型設(shè)計中,DW開發(fā)者關(guān)心的是DW結(jié)構(gòu)的完整性——數(shù)據(jù)倉庫中的所有數(shù)據(jù)元素都應(yīng)該包含在邏輯模型中——至于如何獲取數(shù)據(jù),在此并不感興趣。CH2濘募釜親短彭磁砌祟窟判編散誹悅計呀路堵尊棍峽弘鞭叉夫罐趣逐食蠅熟第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型可見:CH2濘募釜親短彭磁砌祟窟判編散誹悅計呀路堵尊棍峽弘鞭74③事實表模型設(shè)計A.事實表的設(shè)計確定了中層模型之后,就要設(shè)計事實表模型了。例如,根據(jù)上例,可以設(shè)計出以下事實模型:客戶事實表客戶基本情況表(賬號int9,姓名ch12,客戶類型ch20,初次交易時間date8,……)客戶變動情況表(賬號int9,住址ch50,文化程度ch10,電話int11,郵政編碼ch6,……)CH2董阻湛衛(wèi)鹽淋彎鯉鐘勘飛繁飼航天轉(zhuǎn)裹冬蟹嚏嘴辨羹幾另嘎拖懾朱狄菜桑第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型③事實表模型設(shè)計CH2董阻湛衛(wèi)鹽淋彎鯉鐘勘飛繁飼航天轉(zhuǎn)裹冬75客戶交易事實表商品交易情況表(賬號int9,商品編號ch10,交易量r10.2,交易時間date8,……)服務(wù)交易情況表(賬號int9,服務(wù)時間date8,服務(wù)編號int10,服務(wù)費用,……)客戶反饋記錄表客戶反饋記錄表(賬號int9,反饋類型ch5,反饋內(nèi)容memo,記錄人ch8,……)客戶信用狀況表客戶信用狀況表(賬號int9,最大信用額r15.2,最近信用發(fā)生時間date8,……)CH2美胯萍卞修防可軸儲音擒跨繳丁闖擻涪貴仍水舷膿技揭沂坤奇硫周拉儲熔第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型客戶交易事實表CH2美胯萍卞修防可軸儲音擒跨繳丁闖擻涪貴76B.事實表中的事實特性事實指標(biāo)的可加性;完全可加性,半可加性,非可加性派生事實可加性的派生事實,不可加性的派生事實總之,事實表是DW中的最大表,要盡可能設(shè)計得?。ㄋ伎迹耗男┓椒??),同時還要考慮數(shù)據(jù)的精度和粒度。CH2州疵法吃藉穿辰隸恥多限滯悄札翟拌遇催餌介掘甜陜無訪蔽淫呀宿享訂貍第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型B.事實表中的事實特性CH2州疵法吃藉穿辰隸恥多限滯悄札翟拌77④維模型設(shè)計維,是人們觀察某個數(shù)據(jù)集合的特定角度,是以對數(shù)據(jù)某個共性的提取為前提的。例如,前例中,可設(shè)計出客戶主題的維表模型如下:時間維表(年date,月date,日date);地點維表(省ch20,市ch20,縣ch20,街道ch20);交易維表(現(xiàn)金交易ch20,信用交易ch20)關(guān)于維的討論,將在OLAP一章進(jìn)行。CH2塘覆烽熒寄薦脂訓(xùn)裙祥撓御察紫費群瞞禱蹲氯螟肺滲皆兇隔駕槐鹿蹬下針第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型④維模型設(shè)計CH2塘覆烽熒寄薦脂訓(xùn)裙祥撓御察紫費群瞞禱蹲氯78§4物理模型
所謂物理模型,就是中層(邏輯)模型(包括事實表和維表)的物理實現(xiàn)。具體包括以下內(nèi)容:
確定存儲結(jié)構(gòu)(一般用RAID);
確定索引類型(位圖/廣義索引);
物理模型的優(yōu)化(表合并,建立數(shù)據(jù)序列,引入冗余,表的物理分割,生成衍生數(shù)據(jù)等)。RAID是“RedundantArrayofIndependentDisk”的縮寫,中文意思是獨立冗余磁盤陣列。CH2峽喬讕尊數(shù)肅墟獻(xiàn)洛軟腋特像堅隅滄坑飲摧沃潘思勻市婪日挪嗽叁戎諄遵第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§4物理模型
所謂物理模型,就是中層(邏輯)模型(包括79實際應(yīng)用中,DW設(shè)計者不必直接設(shè)計物理模型,只需借助于現(xiàn)成的工具(如,某個DBMS)設(shè)計即可。此時,需考慮的問題有:
全面了解所選用的DBMS,特別是其存儲結(jié)構(gòu)和存取方法;
了解數(shù)據(jù)環(huán)境、數(shù)據(jù)的使用頻度、使用方式、數(shù)據(jù)規(guī)模以及響應(yīng)時間要求等——平衡、優(yōu)化時間和空間效率的重要依據(jù);
了解外部存儲設(shè)備的特性,如分塊原則,塊大小的規(guī)定,設(shè)備的I/O特性等。
CH2瘁貓俗鋁鉗樞屠厘乓由些螢峭擰吩裸似星行蛛兩押漾屈悼爸澈海嚇枚菜丹第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型實際應(yīng)用中,DW設(shè)計者不必直接設(shè)計物理模型,只需借助80§5元數(shù)據(jù)模型DW中元數(shù)據(jù)定義了許多對象——表、列、查詢、商業(yè)規(guī)則以及DW內(nèi)部的數(shù)據(jù)轉(zhuǎn)移等。元數(shù)據(jù)是DW的重要構(gòu)件,是DW的指示圖。一般,元數(shù)據(jù)的來源有:數(shù)據(jù)源的元數(shù)據(jù);數(shù)據(jù)模型的元數(shù)據(jù);數(shù)據(jù)源與數(shù)據(jù)倉庫映射的元數(shù)據(jù);數(shù)據(jù)倉庫應(yīng)用的元數(shù)據(jù)。CH2垣換翌罵芝喝湃嗣諷晦笛背丫粳俺聘碼儈的勺祥竅院撞脊靜傲紋唱琳昧需第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型§5元數(shù)據(jù)模型CH2垣換翌罵芝喝湃嗣諷晦笛背丫粳俺聘碼儈的81①元數(shù)據(jù)的類型與組成元數(shù)據(jù)通常分為靜態(tài)元數(shù)據(jù)和動態(tài)元數(shù)據(jù)兩類,其組成如下表所示:
靜態(tài)元數(shù)據(jù)名稱描述格式數(shù)據(jù)類型關(guān)系生成時間來源索引類別域業(yè)務(wù)規(guī)則動態(tài)元數(shù)據(jù)入庫時間更新周期數(shù)據(jù)質(zhì)量統(tǒng)計信息狀態(tài)處理存儲位置存儲大小引用處CH2芒晝?yōu)l詭封頤雜赫集虛雅公餅蹋乍瓷誅磅幾渡霸捉屢迷陽箍扭詐像苔返熒第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型①元數(shù)據(jù)的類型與組成靜態(tài)元數(shù)據(jù)名稱描述格式數(shù)據(jù)類型關(guān)系生成82②元數(shù)據(jù)的作用A.元數(shù)據(jù)的重要性導(dǎo)航(DW的使用);描述并記錄數(shù)據(jù)從業(yè)務(wù)系統(tǒng)的操作型環(huán)境到DW的轉(zhuǎn)換,以便利用其(靈活地、可變地)管理數(shù)據(jù)的轉(zhuǎn)換以及進(jìn)行數(shù)據(jù)回溯等。管理數(shù)據(jù),包括:粒度劃分、數(shù)據(jù)分割、索引;不同時期的數(shù)據(jù)內(nèi)容及形式;主題的增加及刪除——這些管理工作均需在元數(shù)據(jù)中有相應(yīng)的描述。CH2韋攏子菠心恢救棘率藤煎豬生氧哩澀酌藤每聘謀櫥俱絢鍘綻閃茫草駿桶卿第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型②元數(shù)據(jù)的作用CH2韋攏子菠心恢救棘率藤煎豬生氧哩澀酌藤每83B.元數(shù)據(jù)在DW開發(fā)期間的作用
DW的應(yīng)用管理,比如,捕獲數(shù)據(jù)轉(zhuǎn)化、凈化、概括、聚集的規(guī)則(商業(yè)規(guī)則與處理規(guī)則)等;向用戶提供大量的數(shù)據(jù)關(guān)系;從歷史數(shù)據(jù)抽取數(shù)據(jù)的規(guī)則;存儲抽取、求精、重構(gòu)過程中數(shù)據(jù)源到DW的映射關(guān)系(以便確認(rèn)數(shù)據(jù)質(zhì)量、實現(xiàn)同步化及刷新、建立數(shù)據(jù)與商業(yè)規(guī)則間的映射關(guān)系)。CH2桶汽算虱猶抄喪蠻措帳督棉俞蓬昭牧敲凡雕椒倦鹵好竣肥扎府剖索場奉紡第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型B.元數(shù)據(jù)在DW開發(fā)期間的作用CH2桶汽算虱猶抄喪蠻措帳督棉84C.元數(shù)據(jù)在數(shù)據(jù)抽取中的作用確定數(shù)據(jù)源——每個主題源于哪些數(shù)據(jù)源;跟蹤歷史數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的變化——保證各個時期的歷史數(shù)據(jù)可以正確地轉(zhuǎn)換到DW中;實現(xiàn)屬性到屬性的映射——元數(shù)據(jù)的屬性信息可以保證多個數(shù)據(jù)源的相同數(shù)據(jù)映射到一起;屬性的轉(zhuǎn)換。CH2皺嘔液瞎零趁壹懇佳上欽瞪鄉(xiāng)牡俠慘遷敢歇恩賒難泊橋旁訴封掀全毛巫毛第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型C.元數(shù)據(jù)在數(shù)據(jù)抽取中的作用CH2皺嘔液瞎零趁壹懇佳上欽瞪鄉(xiāng)85D.元數(shù)據(jù)在求精與重構(gòu)中的作用數(shù)據(jù)的分割——以元數(shù)據(jù)形式(下同)保存分割方案;數(shù)據(jù)的概括——保存概括中的數(shù)據(jù)關(guān)系;預(yù)算與推導(dǎo)——保存預(yù)算與推導(dǎo)的算法;轉(zhuǎn)換與再映射——保存(從關(guān)系模型到星形或雪花型模型的)轉(zhuǎn)換與再映射的方案。CH2燒伍綢壇句淫糙控東朔善錦豁浙去錠鍍蟻另殲研繼揚(yáng)燼汪州癰賂蛤霉閘薔第二章數(shù)據(jù)倉庫開發(fā)模型第二章數(shù)據(jù)倉庫開發(fā)模型D.元數(shù)據(jù)在求精與重構(gòu)中的作用CH2燒伍綢壇句淫糙控東朔善錦86③元數(shù)據(jù)的收集A.數(shù)據(jù)源元數(shù)據(jù)可以通過程序自動掃描(數(shù)據(jù)源物理結(jié)構(gòu)以及表結(jié)構(gòu))或手工方式獲得。一般,手工獲得的量較少,可容易地編輯成文檔。B.數(shù)據(jù)模型元數(shù)據(jù)元數(shù)據(jù)庫中保存DW數(shù)據(jù)模型;保存企業(yè)數(shù)據(jù)模型及元數(shù)據(jù)與DW數(shù)據(jù)模型的映
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廢塑料加工處理工崗前發(fā)展趨勢考核試卷含答案
- 重軌加工工班組管理能力考核試卷含答案
- 工具鉗工班組管理評優(yōu)考核試卷含答案
- 天然氣凈化操作工崗前操作管理考核試卷含答案
- 大型橋梁機(jī)械操作工改進(jìn)水平考核試卷含答案
- 實木及實木復(fù)合地板備料工操作管理水平考核試卷含答案
- 廣安鄰水南220千伏輸變電工程報告表
- 意外賠償合同范本
- 公司餐廳合同范本
- 農(nóng)業(yè)規(guī)劃合同范本
- 體育法立法研究-洞察分析
- 企業(yè)稅務(wù)籌劃服務(wù)合同
- 電路理論知到智慧樹章節(jié)測試課后答案2024年秋同濟(jì)大學(xué)
- 北方工業(yè)大學(xué)2023年計算機(jī)C語言期末樣卷(含六卷)
- 數(shù)字孿生巖土工程應(yīng)用
- 房產(chǎn)經(jīng)紀(jì)服務(wù)合同
- 工程合作協(xié)議書樣式
- 1.5物業(yè)費催收法律服務(wù)合同
- 2024年人教版初三英語(下冊)期末試卷及答案(各版本)
- DB2310T 140-2024 牡丹江地區(qū)森林可持續(xù)經(jīng)營規(guī)程
- 監(jiān)理停工通知書范文
評論
0/150
提交評論