數(shù)據(jù)模型基本概念及建模方法論課件_第1頁
數(shù)據(jù)模型基本概念及建模方法論課件_第2頁
數(shù)據(jù)模型基本概念及建模方法論課件_第3頁
數(shù)據(jù)模型基本概念及建模方法論課件_第4頁
數(shù)據(jù)模型基本概念及建模方法論課件_第5頁
已閱讀5頁,還剩97頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)模型的基本概念

及建模方法論NCR(中國)有限技術(shù)經(jīng)理1PPT學(xué)習(xí)交流數(shù)據(jù)模型的基本概念

及建模方法論NCR(中國)有限1PPT學(xué)內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模型方法論2PPT學(xué)習(xí)交流內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模什么是數(shù)據(jù)模型?以數(shù)學(xué)的方式對(duì)現(xiàn)實(shí)事物的一種抽象表達(dá),…特征:內(nèi)容:描述了數(shù)據(jù)、及其之間的關(guān)系形式:反映了數(shù)據(jù)的組織與管理形式用途:(數(shù)據(jù)倉庫)系統(tǒng)建設(shè)中的數(shù)據(jù)信息的藍(lán)圖(數(shù)據(jù)倉庫)系統(tǒng)建設(shè)的核心業(yè)務(wù)人員與IT人員溝通的語言和工具 3PPT學(xué)習(xí)交流什么是數(shù)據(jù)模型?以數(shù)學(xué)的方式對(duì)現(xiàn)實(shí)事物的一種抽象表達(dá),…數(shù)據(jù)模型的分類數(shù)據(jù)倉庫項(xiàng)目中數(shù)據(jù)模型可以分為以下幾種:ConceptualDataModel(CDM)概念數(shù)據(jù)模型LogicalDataModel(LDM)邏輯數(shù)據(jù)模型PhysicalDataModel(PDM)物理數(shù)據(jù)模型ApplicationDataModel(ADM)應(yīng)用數(shù)據(jù)模型4PPT學(xué)習(xí)交流數(shù)據(jù)模型的分類數(shù)據(jù)倉庫項(xiàng)目中數(shù)據(jù)模型可以分為以下幾種:4PP概念數(shù)據(jù)模型ConceptualDataModel(CDM)概念數(shù)據(jù)模型從全局上、宏觀上介紹模型設(shè)計(jì)思路、范圍和內(nèi)容。主要組成元素主題主題間關(guān)系主題中的重要實(shí)體實(shí)體間的相互關(guān)系目標(biāo)與用途圈定建模的范圍劃分建設(shè)主題理清主要業(yè)務(wù)關(guān)系構(gòu)造邏輯數(shù)據(jù)模型的框架5PPT學(xué)習(xí)交流概念數(shù)據(jù)模型ConceptualDataModel(CD定義:使用邏輯建模語言定義數(shù)據(jù)與數(shù)據(jù)之間的邏輯關(guān)系以圖形化的形式反映客戶的業(yè)務(wù)規(guī)則達(dá)到數(shù)據(jù)組織的設(shè)計(jì)目標(biāo)邏輯數(shù)據(jù)模型符號(hào)體系設(shè)計(jì)內(nèi)容表現(xiàn)形式反映內(nèi)容設(shè)計(jì)目標(biāo)6PPT學(xué)習(xí)交流定義:邏輯數(shù)據(jù)模型符號(hào)體系6PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型LogicalDataModel(LDM)邏輯數(shù)據(jù)模型設(shè)計(jì)人員:業(yè)務(wù)人員、IT人員設(shè)計(jì)目標(biāo)設(shè)計(jì)藍(lán)圖,指導(dǎo)整個(gè)數(shù)據(jù)倉庫系統(tǒng)的建設(shè)業(yè)務(wù)語言,業(yè)務(wù)人員與技術(shù)人員溝通的手段和方法業(yè)務(wù)視圖,獨(dú)立于數(shù)據(jù)庫技術(shù)實(shí)現(xiàn)設(shè)計(jì)內(nèi)容:實(shí)體、關(guān)系和屬性建模方法:3NF的設(shè)計(jì)方法后續(xù)工作:物理數(shù)據(jù)模型的輸入7PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型LogicalDataModel(LDM)物理數(shù)據(jù)模型PhysicalDataModel(PDM)物理數(shù)據(jù)模型設(shè)計(jì)目標(biāo):面向物理實(shí)施的具體細(xì)節(jié)輸入條件繼承于邏輯數(shù)據(jù)模型依賴于所選擇的數(shù)據(jù)庫決定于業(yè)務(wù)需求和性能之間的平衡設(shè)計(jì)內(nèi)容數(shù)據(jù)庫、表和字段、索引需要作非正則化處理后續(xù)工作:ETL、元數(shù)據(jù)管理和前端應(yīng)用輸入8PPT學(xué)習(xí)交流物理數(shù)據(jù)模型PhysicalDataModel(PDM)應(yīng)用數(shù)據(jù)模型ApplicationDataModel(ADM)應(yīng)用數(shù)據(jù)模型設(shè)計(jì)目標(biāo)滿足最終用戶對(duì)數(shù)據(jù)的訪問(內(nèi)容、形式要求)滿足應(yīng)用系統(tǒng)對(duì)數(shù)據(jù)的存取(性能、存儲(chǔ)要求)主要特征面向PowerUser和業(yè)務(wù)人員與具體的應(yīng)用相關(guān)多維分析時(shí)一般采用星型結(jié)構(gòu)或者雪花狀結(jié)構(gòu)的設(shè)計(jì)方法是事實(shí)表和維度表的組合9PPT學(xué)習(xí)交流應(yīng)用數(shù)據(jù)模型ApplicationDataModel(A邏輯數(shù)據(jù)模型與物理數(shù)據(jù)模型比較

邏輯數(shù)據(jù)模型物理數(shù)據(jù)模型包含內(nèi)容實(shí)體、屬性表、字段定位記錄主鍵主索引使用名稱業(yè)務(wù)名稱物理名稱(受限于DBMS)正則化3NF建設(shè)可能會(huì)按照性能、空間要求進(jìn)行非正則化冗余數(shù)據(jù)無冗余數(shù)據(jù)含冗余數(shù)據(jù)派生數(shù)據(jù)無派生數(shù)據(jù)包含派生數(shù)據(jù)開發(fā)人員業(yè)務(wù)人員與建模人員物理數(shù)據(jù)庫設(shè)計(jì)人員10PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型與物理數(shù)據(jù)模型比較

邏輯數(shù)據(jù)模型物理數(shù)據(jù)模型包含邏輯數(shù)據(jù)模型在數(shù)據(jù)倉庫中的定位存儲(chǔ)和管理采集回答業(yè)務(wù)問題

析取清洗

條件

剔除家庭關(guān)系

加載

業(yè)務(wù)系統(tǒng)

業(yè)務(wù)系統(tǒng)

業(yè)務(wù)數(shù)據(jù)

外部數(shù)據(jù)

關(guān)系數(shù)據(jù)庫管理系統(tǒng)聚集統(tǒng)計(jì)人工智能神經(jīng)網(wǎng)絡(luò)多維可視化EIS/DSS電子表對(duì)象語言

開發(fā)企業(yè)數(shù)據(jù)倉庫從屬數(shù)據(jù)集市業(yè)務(wù)人員IT用戶數(shù)據(jù)導(dǎo)入知識(shí)發(fā)現(xiàn)數(shù)據(jù)挖掘信息存取工具源數(shù)據(jù)邏輯數(shù)據(jù)模型應(yīng)用數(shù)據(jù)模型11PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型在數(shù)據(jù)倉庫中的定位存儲(chǔ)采集回答析取清洗條件內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模型方法論12PPT學(xué)習(xí)交流內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模邏輯數(shù)據(jù)模型基本術(shù)語(一)模型結(jié)構(gòu)

第三范式(3NF)結(jié)構(gòu)

星型結(jié)構(gòu)(多星型結(jié)構(gòu))雪花型結(jié)構(gòu)

模型分類概念數(shù)據(jù)模型邏輯數(shù)據(jù)模型物理數(shù)據(jù)模型應(yīng)用數(shù)據(jù)模型3NF基礎(chǔ)數(shù)據(jù)模型StarSchema匯總數(shù)據(jù)/已知應(yīng)用模型Snowflake星型結(jié)構(gòu)的演變13PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型基本術(shù)語(一)模型結(jié)構(gòu)模型分類3NFSta實(shí)體

獨(dú)立型實(shí)體

依賴型實(shí)體

子類實(shí)體

主題域?qū)用婧诵膶?shí)體關(guān)系實(shí)體特征實(shí)體分類實(shí)體邏輯數(shù)據(jù)模型基本術(shù)語(二)14PPT學(xué)習(xí)交流實(shí)體主題域核心實(shí)體邏輯數(shù)據(jù)模型基本術(shù)語(二)14PP屬性:(描述真實(shí)或抽象事物相關(guān)聯(lián)的特征或性質(zhì))

主鍵 (識(shí)別實(shí)體實(shí)例唯一性的屬性、屬性組)

可選鍵 (能識(shí)別實(shí)體實(shí)例唯一性的其他屬性、屬性組)外鍵 (通過父實(shí)體到子實(shí)體關(guān)系轉(zhuǎn)移到子實(shí)體的屬性)非鍵屬性(不是實(shí)體主鍵屬性的其他屬性)

基礎(chǔ)名 (外鍵的原來名稱)角色名 (外鍵的新名稱,表明取值是父實(shí)體屬性的子集)鑒別器(取值決定父實(shí)體實(shí)例屬于哪個(gè)子類的屬性)邏輯數(shù)據(jù)模型基本術(shù)語(三)15PPT學(xué)習(xí)交流屬性:(描述真實(shí)或抽象事物相關(guān)聯(lián)的特征或性質(zhì))邏輯數(shù)據(jù)模關(guān)系二元關(guān)系父實(shí)體的一個(gè)實(shí)例嚴(yán)格關(guān)系子實(shí)體的0,1或多個(gè)實(shí)例的這種關(guān)系是二元關(guān)系基數(shù)父、子實(shí)體實(shí)例的比例,如1:1,1:M識(shí)別(型)關(guān)系子實(shí)體實(shí)例唯一性的識(shí)別與父實(shí)體相關(guān)聯(lián),父實(shí)體的主鍵屬性成為子實(shí)體的主鍵屬性非識(shí)別(型)關(guān)系子實(shí)體不需要與父實(shí)體的關(guān)系就可以確定實(shí)例唯一性,父實(shí)體的主鍵屬性成為子實(shí)體的非鍵屬性邏輯數(shù)據(jù)模型基本術(shù)語(四)16PPT學(xué)習(xí)交流關(guān)系邏輯數(shù)據(jù)模型基本術(shù)語(四)16PPT學(xué)習(xí)交流關(guān)系確定關(guān)系父實(shí)體的一個(gè)實(shí)例對(duì)應(yīng)子實(shí)體的0、1或多個(gè)實(shí)例,并且子實(shí)體的一個(gè)實(shí)例對(duì)應(yīng)0或1個(gè)父實(shí)體的實(shí)例非確定關(guān)系

多對(duì)多關(guān)系子類關(guān)系子類實(shí)體和所屬父實(shí)體的關(guān)系完全子類群

所屬父實(shí)體的每個(gè)實(shí)例都能夠與子類群的一個(gè)實(shí)體實(shí)例相關(guān)聯(lián)不完全子類群

所屬父實(shí)體的每個(gè)實(shí)例不一定都有子類相關(guān)聯(lián)邏輯數(shù)據(jù)模型基本術(shù)語(五)17PPT學(xué)習(xí)交流關(guān)系邏輯數(shù)據(jù)模型基本術(shù)語(五)17PPT學(xué)習(xí)交流LogicalDataModel(LDM) Example

EntityKeyAttributeNonkeyAttributeRelationshipCardinalityOne-to-many1:MBusinessRule:onecustomerinvoiceatleastcontainsoneinvoiceitem邏輯數(shù)據(jù)模型基本術(shù)語(示例)18PPT學(xué)習(xí)交流LogicalDataModel(LDM)Ent范式理論NormalForm關(guān)系數(shù)據(jù)庫:原子性第一范式:每個(gè)屬性的值唯一第二范式:鍵值依賴非鍵屬性依賴所有的主鍵屬性。(不存在部分鍵屬性就決定的非鍵屬性)第三范式:完全鍵值依賴非鍵屬性完全依賴且只依賴與鍵屬性。(不存在非主鍵屬性依賴其他非主鍵屬性的情況)BCNF第四范式第五范式關(guān)系數(shù)據(jù)庫理論中對(duì)于實(shí)體劃分、實(shí)例(記錄)設(shè)計(jì)的規(guī)則TheKEY-1stNormalForm(1NF)

TheWHOLEKey-SecondNormalForm(2NF)

AndNOTHINGBUTtheKey-ThirdNormalForm(3NF)

--E.F.Codd19PPT學(xué)習(xí)交流范式理論NormalForm關(guān)系數(shù)據(jù)庫:原子性關(guān)系數(shù)據(jù)違反第一范式如果數(shù)Quantity屬性被定義為“不是與Order相關(guān),就是與Part相關(guān)”例如:在OLTP系統(tǒng)中常見的字段復(fù)用現(xiàn)象,屬此類問題11015220PPT學(xué)習(xí)交流違反第一范式如果數(shù)Quantity屬性被定義為“不是與Ord違反第二范式依賴了復(fù)合主鍵的一部分客戶經(jīng)理/地域客戶經(jīng)理編號(hào)21PPT學(xué)習(xí)交流違反第二范式依賴了復(fù)合主鍵的一部分客戶經(jīng)理/地域21PPT學(xué)違反第三范式依賴了非主鍵屬性(不參與主鍵的外鍵屬性)22PPT學(xué)習(xí)交流違反第三范式依賴了非主鍵屬性(不參與主鍵的外鍵屬性)22PP正則化LDM對(duì)數(shù)據(jù)庫物理實(shí)現(xiàn)的優(yōu)勢保留了更多的業(yè)務(wù)關(guān)系

更多的主索引選擇

最佳的數(shù)據(jù)分布

更少的全表掃描更多的連接選擇增強(qiáng)優(yōu)化器使用更有利于提高性能的合并、聚合連接方法

最佳的數(shù)據(jù)分離(耦合度)

最佳的底層模型與用戶分離

最佳的數(shù)據(jù)控制

每行更少的字段

最佳的與應(yīng)用分離

更小的行

最佳的數(shù)據(jù)塊大小

減少臨時(shí)與永久日志空間減少物理I/O要考慮正則化對(duì)數(shù)據(jù)庫性能的要求23PPT學(xué)習(xí)交流正則化LDM對(duì)數(shù)據(jù)庫物理實(shí)現(xiàn)的優(yōu)勢保留了更多的業(yè)務(wù)關(guān)系要考內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模型方法論24PPT學(xué)習(xí)交流內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模NCR數(shù)據(jù)倉庫實(shí)施方法論?規(guī)劃解決方案支持?jǐn)?shù)據(jù)倉庫管理(處理流程與操作)物理數(shù)據(jù)庫設(shè)計(jì)數(shù)據(jù)轉(zhuǎn)換應(yīng)用開發(fā)數(shù)據(jù)挖掘服務(wù)設(shè)計(jì)與實(shí)現(xiàn)支持與增強(qiáng)解決方案體系結(jié)構(gòu)設(shè)計(jì)元數(shù)據(jù)管理數(shù)據(jù)倉庫評(píng)估應(yīng)用增強(qiáng)邏輯數(shù)據(jù)模型回顧物理數(shù)據(jù)庫回顧性能調(diào)整容量規(guī)劃解決方案集成定制解決方案規(guī)劃詳細(xì)數(shù)據(jù)分析解決方案準(zhǔn)備就緒解決方案實(shí)施建議現(xiàn)成解決方案規(guī)劃數(shù)據(jù)倉庫策略開發(fā)業(yè)務(wù)探索業(yè)務(wù)探索解決方案定義邏輯數(shù)據(jù)模型設(shè)計(jì)修改邏輯數(shù)據(jù)模型驗(yàn)證解決方案數(shù)據(jù)倉庫的循環(huán)過程25PPT學(xué)習(xí)交流NCR數(shù)據(jù)倉庫實(shí)施方法論?規(guī)劃解決方案支持?jǐn)?shù)據(jù)倉庫管理物理數(shù)邏輯數(shù)據(jù)模型設(shè)計(jì)步驟Step1:定義業(yè)務(wù)需求與范圍Step2:定義實(shí)體Step3:定義關(guān)系Step4:定義非鍵屬性Step5:確認(rèn)模型26PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型設(shè)計(jì)步驟Step1:定義業(yè)務(wù)需求與范圍26PStep1:定義業(yè)務(wù)需求與范圍確認(rèn)已經(jīng)理解全部業(yè)務(wù)需求什么困難或問題需要解決?一般情況下這些問題主要關(guān)系到增加收入或降低成本等模型必須能夠回答哪些業(yè)務(wù)問題?有哪些業(yè)務(wù)功能必須處理?有哪些業(yè)務(wù)限制存在?是否每一個(gè)參與人員都可以共享他們的業(yè)務(wù)需求?決定搜集需求的方法回顧已經(jīng)存在的資料(例如現(xiàn)存的報(bào)表)新的業(yè)務(wù)需求訪談以上兩種混合的方法27PPT學(xué)習(xí)交流Step1:定義業(yè)務(wù)需求與范圍確認(rèn)已經(jīng)理解全部業(yè)務(wù)需求2Step2:定義實(shí)體制定初始的實(shí)體池(不加區(qū)分的實(shí)體集合)為每一個(gè)實(shí)體進(jìn)行定義刪除超出項(xiàng)目范圍的實(shí)體為剩下的每一個(gè)實(shí)體定義主鍵為可用的實(shí)體編寫文檔可選:使用帶樣本數(shù)據(jù)的表格形式與用戶進(jìn)行確認(rèn)必須:使用ER圖制定最終版本的交付材料28PPT學(xué)習(xí)交流Step2:定義實(shí)體制定初始的實(shí)體池(不加區(qū)分的實(shí)體集合Step3:定義關(guān)系識(shí)別實(shí)體間的關(guān)系對(duì)于每一個(gè)關(guān)系刪除超出項(xiàng)目范圍的關(guān)系刪除間接的關(guān)系為每一個(gè)剩余的關(guān)系進(jìn)行定義識(shí)別每一個(gè)可用的關(guān)系的基數(shù)(1:1,1:M,M:M)

參照完整性確保每一個(gè)關(guān)系(PK/FK參照)是完整的、有效的為模型中可用的關(guān)系編寫文檔,使用FK定義關(guān)系可選:使用帶樣本數(shù)據(jù)的表格形式與用戶進(jìn)行確認(rèn)必須:使用ER圖制定最終版本的交付材料29PPT學(xué)習(xí)交流Step3:定義關(guān)系識(shí)別實(shí)體間的關(guān)系29PPT學(xué)習(xí)交流Step4:定義非鍵屬性識(shí)別并定義相關(guān)的非鍵屬性刪除超出項(xiàng)目范圍的屬性

根據(jù)直覺或經(jīng)驗(yàn)將剩余的可用屬性放入一個(gè)表中逐一驗(yàn)證每一個(gè)可用屬性的擺放位置為模型中的每一個(gè)可用屬性編寫文檔可選:使用帶樣本數(shù)據(jù)的表格形式與用戶進(jìn)行確認(rèn)必須:使用ER圖制定最終版本的交付材料在模型的最終交付文檔中添加業(yè)務(wù)限制條件30PPT學(xué)習(xí)交流Step4:定義非鍵屬性識(shí)別并定義相關(guān)的非鍵屬性30PPStep5:確認(rèn)模型(1)根據(jù)需要重復(fù)以上步驟多次反復(fù)經(jīng)常是必須的(需求、業(yè)務(wù)規(guī)則、操作的復(fù)雜性決定)模型中的任何變更都會(huì)帶來連鎖反應(yīng),因此需要非常認(rèn)真的回顧與評(píng)審:

實(shí)體的變更經(jīng)常影響關(guān)系的定義和屬性的位置擺放關(guān)系的變更經(jīng)常影響屬性的位置擺放屬性的位置的變更可能影響其他屬性的擺放31PPT學(xué)習(xí)交流Step5:確認(rèn)模型(1)根據(jù)需要重復(fù)以上步驟31PPStep5:確認(rèn)模型(2)通過回答以下問題,持續(xù)地對(duì)模型的范圍進(jìn)行驗(yàn)證:

這一模型組件的含義、與業(yè)務(wù)的關(guān)系是什么?這一模型組件驅(qū)動(dòng)的業(yè)務(wù)需求是什么?對(duì)模型是否已經(jīng)滿足所有業(yè)務(wù)需求、業(yè)務(wù)問題及限制條件等,進(jìn)行驗(yàn)證絕對(duì)不要考慮任何與物理實(shí)施相關(guān)的問題!當(dāng)所有回答業(yè)務(wù)需求所必須的數(shù)據(jù)已經(jīng)齊備時(shí),停止對(duì)模型進(jìn)行優(yōu)化32PPT學(xué)習(xí)交流Step5:確認(rèn)模型(2)通過回答以下問題,持續(xù)地對(duì)模主要任務(wù):轉(zhuǎn)換邏輯數(shù)據(jù)模型(LDM)為物理數(shù)據(jù)模型定義主索引、次索引非正規(guī)化處理(demoralizations)數(shù)據(jù)庫建立設(shè)計(jì)優(yōu)化數(shù)據(jù)庫功能測試使用工具:ERWin交付項(xiàng)目:

物理數(shù)據(jù)模型(PDM)《物理數(shù)據(jù)模型說明書》《數(shù)據(jù)庫描述語言DDL》物理數(shù)據(jù)庫設(shè)計(jì)數(shù)據(jù)倉庫管理物理數(shù)據(jù)模型數(shù)據(jù)轉(zhuǎn)換應(yīng)用開發(fā)數(shù)據(jù)挖掘服務(wù)系統(tǒng)體系結(jié)構(gòu)設(shè)計(jì)元數(shù)據(jù)管理解決方案集成33PPT學(xué)習(xí)交流主要任務(wù):物理數(shù)據(jù)庫設(shè)計(jì)數(shù)據(jù)倉庫管理物理數(shù)據(jù)數(shù)據(jù)轉(zhuǎn)換應(yīng)用開發(fā)物理數(shù)據(jù)模型命名規(guī)范

序號(hào)主題縮寫中文1PARTYPAR參與人2OFFEROFR產(chǎn)品策劃3FINANCEFIN賬務(wù)4LOCATIONLOC地理區(qū)域5ADVERTISEMENTADT市場營銷6EVENTEVT事件7NETWORKNET網(wǎng)絡(luò)資源8REFERENCECODECDE代碼表34PPT學(xué)習(xí)交流物理數(shù)據(jù)模型命名規(guī)范序號(hào)主題縮寫中文1PARTYPAR參與內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模型方法論35PPT學(xué)習(xí)交流內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模建模注意事項(xiàng)劃分相應(yīng)的主題(客戶、產(chǎn)品、賬戶、事件、行銷活動(dòng)、渠道、地理區(qū)域)確定主題與主題之間的關(guān)系客戶購買產(chǎn)品產(chǎn)生賬戶、使用產(chǎn)品觸發(fā)事件運(yùn)營商通過各種渠道、在不同地理區(qū)域進(jìn)行個(gè)性化的行銷活動(dòng)確定每個(gè)主題中關(guān)鍵的實(shí)體和實(shí)體間的關(guān)系客戶主題中:如參與人、個(gè)人、組織等實(shí)體、以及實(shí)體間的關(guān)系,參與人由個(gè)人和組織組成進(jìn)入邏輯數(shù)據(jù)模型,細(xì)化概念數(shù)據(jù)模型設(shè)計(jì)36PPT學(xué)習(xí)交流建模注意事項(xiàng)劃分相應(yīng)的主題36PPT學(xué)習(xí)交流建模注意事項(xiàng)定義數(shù)據(jù)模型的命名規(guī)則命名規(guī)范意義統(tǒng)一命名,減少歧義防止冗余的實(shí)體或?qū)傩缘漠a(chǎn)生良好的命名規(guī)范有助于業(yè)務(wù)人員與技術(shù)人員間的溝通便于使用邏輯模型實(shí)體和屬性命名方法實(shí)體名:PAR_Party:主題域大寫+實(shí)體描述詞采用全稱屬性名:AccountNbr:詞采用全稱,首字母大寫,詞與詞之間使用空格連接37PPT學(xué)習(xí)交流建模注意事項(xiàng)定義數(shù)據(jù)模型的命名規(guī)則37PPT學(xué)習(xí)交流LDM與PDM的區(qū)別邏輯數(shù)據(jù)模型(LDM)內(nèi)容業(yè)務(wù)模型記錄業(yè)務(wù)規(guī)則和關(guān)系,與數(shù)據(jù)庫無關(guān)用途:與業(yè)務(wù)人員進(jìn)行溝通和理解的工具用來確認(rèn)可以回答業(yè)務(wù)問題物理數(shù)據(jù)模型(PDM)內(nèi)容數(shù)據(jù)庫模型表現(xiàn)物理數(shù)據(jù)屬性–數(shù)據(jù)類型,長度,索引與數(shù)據(jù)庫相關(guān)用途:支持業(yè)務(wù)系統(tǒng)運(yùn)行解決數(shù)據(jù)存儲(chǔ)問題解決應(yīng)用處理性能問題38PPT學(xué)習(xí)交流LDM與PDM的區(qū)別邏輯數(shù)據(jù)模型(LDM)物理數(shù)據(jù)模型(LDM實(shí)現(xiàn)為PDM的條件LDM業(yè)務(wù)規(guī)則PDM軟、硬件平臺(tái)特性應(yīng)用開發(fā)策略進(jìn)行PDM設(shè)計(jì)必須考慮的因素、缺一不可:核心業(yè)務(wù)規(guī)則軟、硬件平臺(tái)個(gè)性化用戶、開發(fā)商個(gè)性化70%10%20%主要考慮因素輸入內(nèi)容影響程度39PPT學(xué)習(xí)交流LDM實(shí)現(xiàn)為PDM的條件LDMPDM軟、硬件應(yīng)用開發(fā)策略進(jìn)行LDM業(yè)務(wù)規(guī)則PDM業(yè)務(wù)規(guī)則繼承PDM不應(yīng)違反LDM中界定的業(yè)務(wù)規(guī)則包括:業(yè)務(wù)概念相同業(yè)務(wù)關(guān)系相同核心業(yè)務(wù)要素相同LDM->PDM40PPT學(xué)習(xí)交流LDMPDM業(yè)務(wù)規(guī)則繼承PDM不應(yīng)違反LDM中界定的業(yè)務(wù)規(guī)則業(yè)務(wù)規(guī)則繼承(舉例)客戶編碼ABC…用戶編碼客戶編碼XY…業(yè)務(wù)規(guī)則:客戶的定義是XXX(實(shí)體定義)鑒別客戶唯一性的標(biāo)識(shí)為客戶編碼(主鍵)客戶核心屬性包括:A,B,C…(屬性)一個(gè)客戶可以擁有多個(gè)用戶(關(guān)系)識(shí)別用戶所屬客戶的標(biāo)識(shí)為客戶編碼(外鍵)客戶用戶CUST_IDABC…USER_IDCUST_IDXY…CUSTUSER41PPT學(xué)習(xí)交流業(yè)務(wù)規(guī)則繼承(舉例)客戶編碼用戶編碼業(yè)務(wù)規(guī)則:客戶用戶CU軟、硬件平臺(tái)特性考慮平臺(tái)特色PDM應(yīng)考慮實(shí)際數(shù)據(jù)庫平臺(tái)的特色包括:不同數(shù)據(jù)庫的數(shù)據(jù)類型、長度不同不同數(shù)據(jù)庫的索引機(jī)制不同不同的數(shù)據(jù)庫處理性能不同不同的硬件平臺(tái)、配置處理性能不同PDMLDM->PDM42PPT學(xué)習(xí)交流軟、硬件考慮平臺(tái)特色PDM應(yīng)考慮實(shí)際數(shù)據(jù)庫平臺(tái)的特色PDML考慮平臺(tái)特色(舉例)客戶編碼客戶姓名BC…用戶編碼客戶編碼XY…客戶用戶CUST_IDChar(8)Cust_NameChar(8)BC…USER_IDCUST_IDXY…CUSTUSERCust_IDLongintGuest_NameChar(12)BC…USER_IDCUST_IDXY…CUSTUSER例如:數(shù)據(jù)類型、長度不同等43PPT學(xué)習(xí)交流考慮平臺(tái)特色(舉例)客戶編碼用戶編碼客戶用戶CUST_ID應(yīng)用開發(fā)策略考慮應(yīng)用開發(fā)策略PDM應(yīng)考慮應(yīng)用系統(tǒng)的實(shí)施策略包括:表的橫向分割;表的縱向分割;創(chuàng)建匯總表、臨時(shí)表;屬性冗余;創(chuàng)建主索引(可能與LDM主鍵不同);PDMLDM->PDM44PPT學(xué)習(xí)交流應(yīng)用開發(fā)策略考慮應(yīng)用開發(fā)策略PDM應(yīng)考慮應(yīng)用系統(tǒng)的實(shí)施策略P考慮應(yīng)用開發(fā)策略(舉例)客戶編碼客戶姓名BC…用戶編碼客戶編碼XY…客戶用戶CUST_IDCust_NameBUSER_IDCUST_IDXY…CUST_BUSERCUST_IDCCUST_C橫向分表CUST_IDABC…USER_IDCUST_IDXYACUST1USERCUST_IDABC…CUST2CUST_IDABC…CUST3…1類(前1000條)2類(中2000條)3類(后1000條)共3000條例如:橫向表、縱向分表、子類、屬性冗余等45PPT學(xué)習(xí)交流考慮應(yīng)用開發(fā)策略(舉例)客戶編碼用戶編碼客戶用戶CUST_建模注意事項(xiàng)設(shè)計(jì)邏輯數(shù)據(jù)模型按照ERA設(shè)計(jì)流程設(shè)計(jì)邏輯數(shù)據(jù)模型確定實(shí)體Entity定義實(shí)體的主鍵KEY定義部分非鍵屬性Non-KeyAttribute定義非唯一屬性組,InversionEntry添加相應(yīng)的注釋內(nèi)容46PPT學(xué)習(xí)交流建模注意事項(xiàng)設(shè)計(jì)邏輯數(shù)據(jù)模型46PPT學(xué)習(xí)交流建模注意事項(xiàng)設(shè)計(jì)邏輯數(shù)據(jù)模型

確定實(shí)體與實(shí)體之間的關(guān)系Relationship確定實(shí)體間關(guān)系屬于1:1,1:M還是M:M通過ForeignKey進(jìn)行體現(xiàn)

補(bǔ)充實(shí)體的非鍵值屬性Attribute按照3NF的規(guī)則,判定每添加的一個(gè)屬性是否符合3NF的設(shè)計(jì)原則增加的屬性如果違反3NF,確定新的實(shí)體和關(guān)系 添加中文注釋部分

47PPT學(xué)習(xí)交流建模注意事項(xiàng)設(shè)計(jì)邏輯數(shù)據(jù)模型47PPT學(xué)習(xí)交流建模注意事項(xiàng)物理數(shù)據(jù)模型設(shè)計(jì)物理數(shù)據(jù)模型的輸入邏輯數(shù)據(jù)模型SDA源數(shù)據(jù)分析非正則化方面的需求,如性能和存儲(chǔ)的要求物理數(shù)據(jù)模型的輸出物理數(shù)據(jù)模型物理數(shù)據(jù)模型設(shè)計(jì)說明書生成DDL建表語句作為SDM(源數(shù)據(jù)對(duì)應(yīng))的輸入,SDM將提供ETL數(shù)據(jù)轉(zhuǎn)換規(guī)則48PPT學(xué)習(xí)交流建模注意事項(xiàng)物理數(shù)據(jù)模型設(shè)計(jì)48PPT學(xué)習(xí)交流建模注意事項(xiàng)物理數(shù)據(jù)模型設(shè)計(jì)以邏輯數(shù)據(jù)模型作為輸入按照RDBMS的要求對(duì)于相應(yīng)的表和字段進(jìn)行簡寫依照物理數(shù)據(jù)模型命名規(guī)范非正則化處理定義索引定義是否允許NULL定義是否可以壓縮定義是否大小寫敏感定義是否需要分區(qū)49PPT學(xué)習(xí)交流建模注意事項(xiàng)物理數(shù)據(jù)模型設(shè)計(jì)49PPT學(xué)習(xí)交流模型設(shè)計(jì)的后續(xù)工作模型的驗(yàn)證工作軟驗(yàn)證-業(yè)務(wù)案例硬驗(yàn)證-業(yè)務(wù)數(shù)據(jù)模型設(shè)計(jì)維護(hù)和擴(kuò)展工作數(shù)據(jù)模型是不斷增強(qiáng)的,可擴(kuò)展的,但要保證其相對(duì)的穩(wěn)定性前端應(yīng)用中的多維模型的設(shè)計(jì)前端應(yīng)用以及ETL從性能和使用上對(duì)于PDM的修改要求業(yè)務(wù)規(guī)則的變化以及新的產(chǎn)品的產(chǎn)生也會(huì)對(duì)LDM和PDM有修改或者擴(kuò)展的要求模型設(shè)計(jì)要考慮今后的可擴(kuò)展性,以適應(yīng)新的業(yè)務(wù)規(guī)則和業(yè)務(wù)需求。50PPT學(xué)習(xí)交流模型設(shè)計(jì)的后續(xù)工作模型的驗(yàn)證工作50PPT學(xué)習(xí)交流51PPT學(xué)習(xí)交流51PPT學(xué)習(xí)交流數(shù)據(jù)模型的基本概念

及建模方法論NCR(中國)有限技術(shù)經(jīng)理52PPT學(xué)習(xí)交流數(shù)據(jù)模型的基本概念

及建模方法論NCR(中國)有限1PPT學(xué)內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模型方法論53PPT學(xué)習(xí)交流內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模什么是數(shù)據(jù)模型?以數(shù)學(xué)的方式對(duì)現(xiàn)實(shí)事物的一種抽象表達(dá),…特征:內(nèi)容:描述了數(shù)據(jù)、及其之間的關(guān)系形式:反映了數(shù)據(jù)的組織與管理形式用途:(數(shù)據(jù)倉庫)系統(tǒng)建設(shè)中的數(shù)據(jù)信息的藍(lán)圖(數(shù)據(jù)倉庫)系統(tǒng)建設(shè)的核心業(yè)務(wù)人員與IT人員溝通的語言和工具 54PPT學(xué)習(xí)交流什么是數(shù)據(jù)模型?以數(shù)學(xué)的方式對(duì)現(xiàn)實(shí)事物的一種抽象表達(dá),…數(shù)據(jù)模型的分類數(shù)據(jù)倉庫項(xiàng)目中數(shù)據(jù)模型可以分為以下幾種:ConceptualDataModel(CDM)概念數(shù)據(jù)模型LogicalDataModel(LDM)邏輯數(shù)據(jù)模型PhysicalDataModel(PDM)物理數(shù)據(jù)模型ApplicationDataModel(ADM)應(yīng)用數(shù)據(jù)模型55PPT學(xué)習(xí)交流數(shù)據(jù)模型的分類數(shù)據(jù)倉庫項(xiàng)目中數(shù)據(jù)模型可以分為以下幾種:4PP概念數(shù)據(jù)模型ConceptualDataModel(CDM)概念數(shù)據(jù)模型從全局上、宏觀上介紹模型設(shè)計(jì)思路、范圍和內(nèi)容。主要組成元素主題主題間關(guān)系主題中的重要實(shí)體實(shí)體間的相互關(guān)系目標(biāo)與用途圈定建模的范圍劃分建設(shè)主題理清主要業(yè)務(wù)關(guān)系構(gòu)造邏輯數(shù)據(jù)模型的框架56PPT學(xué)習(xí)交流概念數(shù)據(jù)模型ConceptualDataModel(CD定義:使用邏輯建模語言定義數(shù)據(jù)與數(shù)據(jù)之間的邏輯關(guān)系以圖形化的形式反映客戶的業(yè)務(wù)規(guī)則達(dá)到數(shù)據(jù)組織的設(shè)計(jì)目標(biāo)邏輯數(shù)據(jù)模型符號(hào)體系設(shè)計(jì)內(nèi)容表現(xiàn)形式反映內(nèi)容設(shè)計(jì)目標(biāo)57PPT學(xué)習(xí)交流定義:邏輯數(shù)據(jù)模型符號(hào)體系6PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型LogicalDataModel(LDM)邏輯數(shù)據(jù)模型設(shè)計(jì)人員:業(yè)務(wù)人員、IT人員設(shè)計(jì)目標(biāo)設(shè)計(jì)藍(lán)圖,指導(dǎo)整個(gè)數(shù)據(jù)倉庫系統(tǒng)的建設(shè)業(yè)務(wù)語言,業(yè)務(wù)人員與技術(shù)人員溝通的手段和方法業(yè)務(wù)視圖,獨(dú)立于數(shù)據(jù)庫技術(shù)實(shí)現(xiàn)設(shè)計(jì)內(nèi)容:實(shí)體、關(guān)系和屬性建模方法:3NF的設(shè)計(jì)方法后續(xù)工作:物理數(shù)據(jù)模型的輸入58PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型LogicalDataModel(LDM)物理數(shù)據(jù)模型PhysicalDataModel(PDM)物理數(shù)據(jù)模型設(shè)計(jì)目標(biāo):面向物理實(shí)施的具體細(xì)節(jié)輸入條件繼承于邏輯數(shù)據(jù)模型依賴于所選擇的數(shù)據(jù)庫決定于業(yè)務(wù)需求和性能之間的平衡設(shè)計(jì)內(nèi)容數(shù)據(jù)庫、表和字段、索引需要作非正則化處理后續(xù)工作:ETL、元數(shù)據(jù)管理和前端應(yīng)用輸入59PPT學(xué)習(xí)交流物理數(shù)據(jù)模型PhysicalDataModel(PDM)應(yīng)用數(shù)據(jù)模型ApplicationDataModel(ADM)應(yīng)用數(shù)據(jù)模型設(shè)計(jì)目標(biāo)滿足最終用戶對(duì)數(shù)據(jù)的訪問(內(nèi)容、形式要求)滿足應(yīng)用系統(tǒng)對(duì)數(shù)據(jù)的存取(性能、存儲(chǔ)要求)主要特征面向PowerUser和業(yè)務(wù)人員與具體的應(yīng)用相關(guān)多維分析時(shí)一般采用星型結(jié)構(gòu)或者雪花狀結(jié)構(gòu)的設(shè)計(jì)方法是事實(shí)表和維度表的組合60PPT學(xué)習(xí)交流應(yīng)用數(shù)據(jù)模型ApplicationDataModel(A邏輯數(shù)據(jù)模型與物理數(shù)據(jù)模型比較

邏輯數(shù)據(jù)模型物理數(shù)據(jù)模型包含內(nèi)容實(shí)體、屬性表、字段定位記錄主鍵主索引使用名稱業(yè)務(wù)名稱物理名稱(受限于DBMS)正則化3NF建設(shè)可能會(huì)按照性能、空間要求進(jìn)行非正則化冗余數(shù)據(jù)無冗余數(shù)據(jù)含冗余數(shù)據(jù)派生數(shù)據(jù)無派生數(shù)據(jù)包含派生數(shù)據(jù)開發(fā)人員業(yè)務(wù)人員與建模人員物理數(shù)據(jù)庫設(shè)計(jì)人員61PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型與物理數(shù)據(jù)模型比較

邏輯數(shù)據(jù)模型物理數(shù)據(jù)模型包含邏輯數(shù)據(jù)模型在數(shù)據(jù)倉庫中的定位存儲(chǔ)和管理采集回答業(yè)務(wù)問題

析取清洗

條件

剔除家庭關(guān)系

加載

業(yè)務(wù)系統(tǒng)

業(yè)務(wù)系統(tǒng)

業(yè)務(wù)數(shù)據(jù)

外部數(shù)據(jù)

關(guān)系數(shù)據(jù)庫管理系統(tǒng)聚集統(tǒng)計(jì)人工智能神經(jīng)網(wǎng)絡(luò)多維可視化EIS/DSS電子表對(duì)象語言

開發(fā)企業(yè)數(shù)據(jù)倉庫從屬數(shù)據(jù)集市業(yè)務(wù)人員IT用戶數(shù)據(jù)導(dǎo)入知識(shí)發(fā)現(xiàn)數(shù)據(jù)挖掘信息存取工具源數(shù)據(jù)邏輯數(shù)據(jù)模型應(yīng)用數(shù)據(jù)模型62PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型在數(shù)據(jù)倉庫中的定位存儲(chǔ)采集回答析取清洗條件內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模型方法論63PPT學(xué)習(xí)交流內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模邏輯數(shù)據(jù)模型基本術(shù)語(一)模型結(jié)構(gòu)

第三范式(3NF)結(jié)構(gòu)

星型結(jié)構(gòu)(多星型結(jié)構(gòu))雪花型結(jié)構(gòu)

模型分類概念數(shù)據(jù)模型邏輯數(shù)據(jù)模型物理數(shù)據(jù)模型應(yīng)用數(shù)據(jù)模型3NF基礎(chǔ)數(shù)據(jù)模型StarSchema匯總數(shù)據(jù)/已知應(yīng)用模型Snowflake星型結(jié)構(gòu)的演變64PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型基本術(shù)語(一)模型結(jié)構(gòu)模型分類3NFSta實(shí)體

獨(dú)立型實(shí)體

依賴型實(shí)體

子類實(shí)體

主題域?qū)用婧诵膶?shí)體關(guān)系實(shí)體特征實(shí)體分類實(shí)體邏輯數(shù)據(jù)模型基本術(shù)語(二)65PPT學(xué)習(xí)交流實(shí)體主題域核心實(shí)體邏輯數(shù)據(jù)模型基本術(shù)語(二)14PP屬性:(描述真實(shí)或抽象事物相關(guān)聯(lián)的特征或性質(zhì))

主鍵 (識(shí)別實(shí)體實(shí)例唯一性的屬性、屬性組)

可選鍵 (能識(shí)別實(shí)體實(shí)例唯一性的其他屬性、屬性組)外鍵 (通過父實(shí)體到子實(shí)體關(guān)系轉(zhuǎn)移到子實(shí)體的屬性)非鍵屬性(不是實(shí)體主鍵屬性的其他屬性)

基礎(chǔ)名 (外鍵的原來名稱)角色名 (外鍵的新名稱,表明取值是父實(shí)體屬性的子集)鑒別器(取值決定父實(shí)體實(shí)例屬于哪個(gè)子類的屬性)邏輯數(shù)據(jù)模型基本術(shù)語(三)66PPT學(xué)習(xí)交流屬性:(描述真實(shí)或抽象事物相關(guān)聯(lián)的特征或性質(zhì))邏輯數(shù)據(jù)模關(guān)系二元關(guān)系父實(shí)體的一個(gè)實(shí)例嚴(yán)格關(guān)系子實(shí)體的0,1或多個(gè)實(shí)例的這種關(guān)系是二元關(guān)系基數(shù)父、子實(shí)體實(shí)例的比例,如1:1,1:M識(shí)別(型)關(guān)系子實(shí)體實(shí)例唯一性的識(shí)別與父實(shí)體相關(guān)聯(lián),父實(shí)體的主鍵屬性成為子實(shí)體的主鍵屬性非識(shí)別(型)關(guān)系子實(shí)體不需要與父實(shí)體的關(guān)系就可以確定實(shí)例唯一性,父實(shí)體的主鍵屬性成為子實(shí)體的非鍵屬性邏輯數(shù)據(jù)模型基本術(shù)語(四)67PPT學(xué)習(xí)交流關(guān)系邏輯數(shù)據(jù)模型基本術(shù)語(四)16PPT學(xué)習(xí)交流關(guān)系確定關(guān)系父實(shí)體的一個(gè)實(shí)例對(duì)應(yīng)子實(shí)體的0、1或多個(gè)實(shí)例,并且子實(shí)體的一個(gè)實(shí)例對(duì)應(yīng)0或1個(gè)父實(shí)體的實(shí)例非確定關(guān)系

多對(duì)多關(guān)系子類關(guān)系子類實(shí)體和所屬父實(shí)體的關(guān)系完全子類群

所屬父實(shí)體的每個(gè)實(shí)例都能夠與子類群的一個(gè)實(shí)體實(shí)例相關(guān)聯(lián)不完全子類群

所屬父實(shí)體的每個(gè)實(shí)例不一定都有子類相關(guān)聯(lián)邏輯數(shù)據(jù)模型基本術(shù)語(五)68PPT學(xué)習(xí)交流關(guān)系邏輯數(shù)據(jù)模型基本術(shù)語(五)17PPT學(xué)習(xí)交流LogicalDataModel(LDM) Example

EntityKeyAttributeNonkeyAttributeRelationshipCardinalityOne-to-many1:MBusinessRule:onecustomerinvoiceatleastcontainsoneinvoiceitem邏輯數(shù)據(jù)模型基本術(shù)語(示例)69PPT學(xué)習(xí)交流LogicalDataModel(LDM)Ent范式理論NormalForm關(guān)系數(shù)據(jù)庫:原子性第一范式:每個(gè)屬性的值唯一第二范式:鍵值依賴非鍵屬性依賴所有的主鍵屬性。(不存在部分鍵屬性就決定的非鍵屬性)第三范式:完全鍵值依賴非鍵屬性完全依賴且只依賴與鍵屬性。(不存在非主鍵屬性依賴其他非主鍵屬性的情況)BCNF第四范式第五范式關(guān)系數(shù)據(jù)庫理論中對(duì)于實(shí)體劃分、實(shí)例(記錄)設(shè)計(jì)的規(guī)則TheKEY-1stNormalForm(1NF)

TheWHOLEKey-SecondNormalForm(2NF)

AndNOTHINGBUTtheKey-ThirdNormalForm(3NF)

--E.F.Codd70PPT學(xué)習(xí)交流范式理論NormalForm關(guān)系數(shù)據(jù)庫:原子性關(guān)系數(shù)據(jù)違反第一范式如果數(shù)Quantity屬性被定義為“不是與Order相關(guān),就是與Part相關(guān)”例如:在OLTP系統(tǒng)中常見的字段復(fù)用現(xiàn)象,屬此類問題11015271PPT學(xué)習(xí)交流違反第一范式如果數(shù)Quantity屬性被定義為“不是與Ord違反第二范式依賴了復(fù)合主鍵的一部分客戶經(jīng)理/地域客戶經(jīng)理編號(hào)72PPT學(xué)習(xí)交流違反第二范式依賴了復(fù)合主鍵的一部分客戶經(jīng)理/地域21PPT學(xué)違反第三范式依賴了非主鍵屬性(不參與主鍵的外鍵屬性)73PPT學(xué)習(xí)交流違反第三范式依賴了非主鍵屬性(不參與主鍵的外鍵屬性)22PP正則化LDM對(duì)數(shù)據(jù)庫物理實(shí)現(xiàn)的優(yōu)勢保留了更多的業(yè)務(wù)關(guān)系

更多的主索引選擇

最佳的數(shù)據(jù)分布

更少的全表掃描更多的連接選擇增強(qiáng)優(yōu)化器使用更有利于提高性能的合并、聚合連接方法

最佳的數(shù)據(jù)分離(耦合度)

最佳的底層模型與用戶分離

最佳的數(shù)據(jù)控制

每行更少的字段

最佳的與應(yīng)用分離

更小的行

最佳的數(shù)據(jù)塊大小

減少臨時(shí)與永久日志空間減少物理I/O要考慮正則化對(duì)數(shù)據(jù)庫性能的要求74PPT學(xué)習(xí)交流正則化LDM對(duì)數(shù)據(jù)庫物理實(shí)現(xiàn)的優(yōu)勢保留了更多的業(yè)務(wù)關(guān)系要考內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模型方法論75PPT學(xué)習(xí)交流內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模NCR數(shù)據(jù)倉庫實(shí)施方法論?規(guī)劃解決方案支持?jǐn)?shù)據(jù)倉庫管理(處理流程與操作)物理數(shù)據(jù)庫設(shè)計(jì)數(shù)據(jù)轉(zhuǎn)換應(yīng)用開發(fā)數(shù)據(jù)挖掘服務(wù)設(shè)計(jì)與實(shí)現(xiàn)支持與增強(qiáng)解決方案體系結(jié)構(gòu)設(shè)計(jì)元數(shù)據(jù)管理數(shù)據(jù)倉庫評(píng)估應(yīng)用增強(qiáng)邏輯數(shù)據(jù)模型回顧物理數(shù)據(jù)庫回顧性能調(diào)整容量規(guī)劃解決方案集成定制解決方案規(guī)劃詳細(xì)數(shù)據(jù)分析解決方案準(zhǔn)備就緒解決方案實(shí)施建議現(xiàn)成解決方案規(guī)劃數(shù)據(jù)倉庫策略開發(fā)業(yè)務(wù)探索業(yè)務(wù)探索解決方案定義邏輯數(shù)據(jù)模型設(shè)計(jì)修改邏輯數(shù)據(jù)模型驗(yàn)證解決方案數(shù)據(jù)倉庫的循環(huán)過程76PPT學(xué)習(xí)交流NCR數(shù)據(jù)倉庫實(shí)施方法論?規(guī)劃解決方案支持?jǐn)?shù)據(jù)倉庫管理物理數(shù)邏輯數(shù)據(jù)模型設(shè)計(jì)步驟Step1:定義業(yè)務(wù)需求與范圍Step2:定義實(shí)體Step3:定義關(guān)系Step4:定義非鍵屬性Step5:確認(rèn)模型77PPT學(xué)習(xí)交流邏輯數(shù)據(jù)模型設(shè)計(jì)步驟Step1:定義業(yè)務(wù)需求與范圍26PStep1:定義業(yè)務(wù)需求與范圍確認(rèn)已經(jīng)理解全部業(yè)務(wù)需求什么困難或問題需要解決?一般情況下這些問題主要關(guān)系到增加收入或降低成本等模型必須能夠回答哪些業(yè)務(wù)問題?有哪些業(yè)務(wù)功能必須處理?有哪些業(yè)務(wù)限制存在?是否每一個(gè)參與人員都可以共享他們的業(yè)務(wù)需求?決定搜集需求的方法回顧已經(jīng)存在的資料(例如現(xiàn)存的報(bào)表)新的業(yè)務(wù)需求訪談以上兩種混合的方法78PPT學(xué)習(xí)交流Step1:定義業(yè)務(wù)需求與范圍確認(rèn)已經(jīng)理解全部業(yè)務(wù)需求2Step2:定義實(shí)體制定初始的實(shí)體池(不加區(qū)分的實(shí)體集合)為每一個(gè)實(shí)體進(jìn)行定義刪除超出項(xiàng)目范圍的實(shí)體為剩下的每一個(gè)實(shí)體定義主鍵為可用的實(shí)體編寫文檔可選:使用帶樣本數(shù)據(jù)的表格形式與用戶進(jìn)行確認(rèn)必須:使用ER圖制定最終版本的交付材料79PPT學(xué)習(xí)交流Step2:定義實(shí)體制定初始的實(shí)體池(不加區(qū)分的實(shí)體集合Step3:定義關(guān)系識(shí)別實(shí)體間的關(guān)系對(duì)于每一個(gè)關(guān)系刪除超出項(xiàng)目范圍的關(guān)系刪除間接的關(guān)系為每一個(gè)剩余的關(guān)系進(jìn)行定義識(shí)別每一個(gè)可用的關(guān)系的基數(shù)(1:1,1:M,M:M)

參照完整性確保每一個(gè)關(guān)系(PK/FK參照)是完整的、有效的為模型中可用的關(guān)系編寫文檔,使用FK定義關(guān)系可選:使用帶樣本數(shù)據(jù)的表格形式與用戶進(jìn)行確認(rèn)必須:使用ER圖制定最終版本的交付材料80PPT學(xué)習(xí)交流Step3:定義關(guān)系識(shí)別實(shí)體間的關(guān)系29PPT學(xué)習(xí)交流Step4:定義非鍵屬性識(shí)別并定義相關(guān)的非鍵屬性刪除超出項(xiàng)目范圍的屬性

根據(jù)直覺或經(jīng)驗(yàn)將剩余的可用屬性放入一個(gè)表中逐一驗(yàn)證每一個(gè)可用屬性的擺放位置為模型中的每一個(gè)可用屬性編寫文檔可選:使用帶樣本數(shù)據(jù)的表格形式與用戶進(jìn)行確認(rèn)必須:使用ER圖制定最終版本的交付材料在模型的最終交付文檔中添加業(yè)務(wù)限制條件81PPT學(xué)習(xí)交流Step4:定義非鍵屬性識(shí)別并定義相關(guān)的非鍵屬性30PPStep5:確認(rèn)模型(1)根據(jù)需要重復(fù)以上步驟多次反復(fù)經(jīng)常是必須的(需求、業(yè)務(wù)規(guī)則、操作的復(fù)雜性決定)模型中的任何變更都會(huì)帶來連鎖反應(yīng),因此需要非常認(rèn)真的回顧與評(píng)審:

實(shí)體的變更經(jīng)常影響關(guān)系的定義和屬性的位置擺放關(guān)系的變更經(jīng)常影響屬性的位置擺放屬性的位置的變更可能影響其他屬性的擺放82PPT學(xué)習(xí)交流Step5:確認(rèn)模型(1)根據(jù)需要重復(fù)以上步驟31PPStep5:確認(rèn)模型(2)通過回答以下問題,持續(xù)地對(duì)模型的范圍進(jìn)行驗(yàn)證:

這一模型組件的含義、與業(yè)務(wù)的關(guān)系是什么?這一模型組件驅(qū)動(dòng)的業(yè)務(wù)需求是什么?對(duì)模型是否已經(jīng)滿足所有業(yè)務(wù)需求、業(yè)務(wù)問題及限制條件等,進(jìn)行驗(yàn)證絕對(duì)不要考慮任何與物理實(shí)施相關(guān)的問題!當(dāng)所有回答業(yè)務(wù)需求所必須的數(shù)據(jù)已經(jīng)齊備時(shí),停止對(duì)模型進(jìn)行優(yōu)化83PPT學(xué)習(xí)交流Step5:確認(rèn)模型(2)通過回答以下問題,持續(xù)地對(duì)模主要任務(wù):轉(zhuǎn)換邏輯數(shù)據(jù)模型(LDM)為物理數(shù)據(jù)模型定義主索引、次索引非正規(guī)化處理(demoralizations)數(shù)據(jù)庫建立設(shè)計(jì)優(yōu)化數(shù)據(jù)庫功能測試使用工具:ERWin交付項(xiàng)目:

物理數(shù)據(jù)模型(PDM)《物理數(shù)據(jù)模型說明書》《數(shù)據(jù)庫描述語言DDL》物理數(shù)據(jù)庫設(shè)計(jì)數(shù)據(jù)倉庫管理物理數(shù)據(jù)模型數(shù)據(jù)轉(zhuǎn)換應(yīng)用開發(fā)數(shù)據(jù)挖掘服務(wù)系統(tǒng)體系結(jié)構(gòu)設(shè)計(jì)元數(shù)據(jù)管理解決方案集成84PPT學(xué)習(xí)交流主要任務(wù):物理數(shù)據(jù)庫設(shè)計(jì)數(shù)據(jù)倉庫管理物理數(shù)據(jù)數(shù)據(jù)轉(zhuǎn)換應(yīng)用開發(fā)物理數(shù)據(jù)模型命名規(guī)范

序號(hào)主題縮寫中文1PARTYPAR參與人2OFFEROFR產(chǎn)品策劃3FINANCEFIN賬務(wù)4LOCATIONLOC地理區(qū)域5ADVERTISEMENTADT市場營銷6EVENTEVT事件7NETWORKNET網(wǎng)絡(luò)資源8REFERENCECODECDE代碼表85PPT學(xué)習(xí)交流物理數(shù)據(jù)模型命名規(guī)范序號(hào)主題縮寫中文1PARTYPAR參與內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模型方法論86PPT學(xué)習(xí)交流內(nèi)容安排數(shù)據(jù)模型相關(guān)術(shù)語什么是數(shù)據(jù)模型建模注意事項(xiàng)數(shù)據(jù)模建模注意事項(xiàng)劃分相應(yīng)的主題(客戶、產(chǎn)品、賬戶、事件、行銷活動(dòng)、渠道、地理區(qū)域)確定主題與主題之間的關(guān)系客戶購買產(chǎn)品產(chǎn)生賬戶、使用產(chǎn)品觸發(fā)事件運(yùn)營商通過各種渠道、在不同地理區(qū)域進(jìn)行個(gè)性化的行銷活動(dòng)確定每個(gè)主題中關(guān)鍵的實(shí)體和實(shí)體間的關(guān)系客戶主題中:如參與人、個(gè)人、組織等實(shí)體、以及實(shí)體間的關(guān)系,參與人由個(gè)人和組織組成進(jìn)入邏輯數(shù)據(jù)模型,細(xì)化概念數(shù)據(jù)模型設(shè)計(jì)87PPT學(xué)習(xí)交流建模注意事項(xiàng)劃分相應(yīng)的主題36PPT學(xué)習(xí)交流建模注意事項(xiàng)定義數(shù)據(jù)模型的命名規(guī)則命名規(guī)范意義統(tǒng)一命名,減少歧義防止冗余的實(shí)體或?qū)傩缘漠a(chǎn)生良好的命名規(guī)范有助于業(yè)務(wù)人員與技術(shù)人員間的溝通便于使用邏輯模型實(shí)體和屬性命名方法實(shí)體名:PAR_Party:主題域大寫+實(shí)體描述詞采用全稱屬性名:AccountNbr:詞采用全稱,首字母大寫,詞與詞之間使用空格連接88PPT學(xué)習(xí)交流建模注意事項(xiàng)定義數(shù)據(jù)模型的命名規(guī)則37PPT學(xué)習(xí)交流LDM與PDM的區(qū)別邏輯數(shù)據(jù)模型(LDM)內(nèi)容業(yè)務(wù)模型記錄業(yè)務(wù)規(guī)則和關(guān)系,與數(shù)據(jù)庫無關(guān)用途:與業(yè)務(wù)人員進(jìn)行溝通和理解的工具用來確認(rèn)可以回答業(yè)務(wù)問題物理數(shù)據(jù)模型(PDM)內(nèi)容數(shù)據(jù)庫模型表現(xiàn)物理數(shù)據(jù)屬性–數(shù)據(jù)類型,長度,索引與數(shù)據(jù)庫相關(guān)用途:支持業(yè)務(wù)系統(tǒng)運(yùn)行解決數(shù)據(jù)存儲(chǔ)問題解決應(yīng)用處理性能問題89PPT學(xué)習(xí)交流LDM與PDM的區(qū)別邏輯數(shù)據(jù)模型(LDM)物理數(shù)據(jù)模型(LDM實(shí)現(xiàn)為PDM的條件LDM業(yè)務(wù)規(guī)則PDM軟、硬件平臺(tái)特性應(yīng)用開發(fā)策略進(jìn)行PDM設(shè)計(jì)必須考慮的因素、缺一不可:核心業(yè)務(wù)規(guī)則軟、硬件平臺(tái)個(gè)性化用戶、開發(fā)商個(gè)性化70%10%20%主要考慮因素輸入內(nèi)容影響程度90PPT學(xué)習(xí)交流LDM實(shí)現(xiàn)為PDM的條件LDMPDM軟、硬件應(yīng)用開發(fā)策略進(jìn)行LDM業(yè)務(wù)規(guī)則PDM業(yè)務(wù)規(guī)則繼承PDM不應(yīng)違反LDM中界定的業(yè)務(wù)規(guī)則包括:業(yè)務(wù)概念相同業(yè)務(wù)關(guān)系相同核心業(yè)務(wù)要素相同LDM->PDM91PPT學(xué)習(xí)交流LDMPDM業(yè)務(wù)規(guī)則繼承PDM不應(yīng)違反LDM中界定的業(yè)務(wù)規(guī)則業(yè)務(wù)規(guī)則繼承(舉例)客戶編碼ABC…用戶編碼客戶編碼XY…業(yè)務(wù)規(guī)則:客戶的定義是XXX(實(shí)體定義)鑒別客戶唯一性的標(biāo)識(shí)為客戶編碼(主鍵)客戶核心屬性包括:A,B,C…(屬性)一個(gè)客戶可以擁有多個(gè)用戶(關(guān)系)識(shí)別用戶所屬客戶的標(biāo)識(shí)為客戶編碼(外鍵)客戶用戶CUST_IDA

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論