版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)倉(cāng)庫(kù)與商業(yè)智能2009-4-20數(shù)據(jù)倉(cāng)庫(kù)與商業(yè)智能2009-4-201主要內(nèi)容數(shù)據(jù)倉(cāng)庫(kù)的起源和發(fā)展數(shù)據(jù)倉(cāng)庫(kù)定義和特點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)建設(shè)方法商業(yè)智能主要內(nèi)容數(shù)據(jù)倉(cāng)庫(kù)的起源和發(fā)展2數(shù)據(jù)倉(cāng)庫(kù)的起源和發(fā)展數(shù)據(jù)倉(cāng)庫(kù)的起源和發(fā)展3數(shù)據(jù)管理的歷史人工管理方式這一時(shí)期是在20世紀(jì)50年代中期以前,這一階段的計(jì)算機(jī)應(yīng)用主要用于科學(xué)計(jì)算,外存只有紙帶、磁帶、卡片等,數(shù)據(jù)處理的方式基本上是批處理。這一時(shí)期數(shù)據(jù)管理的特點(diǎn)是:數(shù)據(jù)不保存;沒(méi)有專用的數(shù)據(jù)管理軟件,每個(gè)應(yīng)用都必須自己完成存儲(chǔ)結(jié)構(gòu)、存取方法、輸入輸出等數(shù)據(jù)管理功能;一組數(shù)據(jù)對(duì)應(yīng)一個(gè)應(yīng)用,這使得程序之間可能有重復(fù)的數(shù)據(jù)。文件系統(tǒng)管理這一階段在20世紀(jì)50年代后期至60年代中后期,計(jì)算機(jī)應(yīng)用開(kāi)始用于信息管理,由于數(shù)據(jù)存儲(chǔ)、檢索和維護(hù)等需求,使得相應(yīng)的研究開(kāi)展起來(lái)了,在硬件和軟件方面都得到了發(fā)展,磁盤(pán)磁鼓出現(xiàn),操作系統(tǒng)也產(chǎn)生。數(shù)據(jù)庫(kù)系統(tǒng)(60年代末開(kāi)始)關(guān)系數(shù)據(jù)庫(kù)之父E.F.Codd提出了關(guān)系模型(ER),促進(jìn)了聯(lián)機(jī)事務(wù)處理(OLTP)的發(fā)展,數(shù)據(jù)以表格的形式而非文件方式存儲(chǔ)。數(shù)據(jù)管理的歷史人工管理方式4數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)傳統(tǒng)的數(shù)據(jù)庫(kù)環(huán)境中以數(shù)據(jù)庫(kù)為中心,數(shù)據(jù)資源組織方式單一;側(cè)重對(duì)數(shù)據(jù)的管理,操作型處理(OLTP,聯(lián)機(jī)事務(wù)處理),關(guān)心的是響應(yīng)時(shí)間,數(shù)據(jù)的安全性和完整性;問(wèn)題:“易進(jìn)不易出”
數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)傳統(tǒng)的數(shù)據(jù)庫(kù)環(huán)境中5數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)處理不斷有新需求(聯(lián)機(jī)事務(wù)、批處理、決策分析)分析型處理(OLAP,聯(lián)機(jī)分析處理)
用于管理人員的決策分析,經(jīng)常要訪問(wèn)大量的歷史數(shù)據(jù),而很少對(duì)數(shù)據(jù)庫(kù)進(jìn)行寫(xiě)操作,除非對(duì)數(shù)據(jù)庫(kù)進(jìn)行更新或裝入時(shí)。人們希望從中獲得跟公司經(jīng)營(yíng)效益緊密相關(guān)的信息。數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)處理不斷有新需求(聯(lián)機(jī)事務(wù)、批處理、決策6數(shù)據(jù)倉(cāng)庫(kù)的產(chǎn)生(1)數(shù)據(jù)集成(2)歷史數(shù)據(jù)的應(yīng)用需求(3)查詢性能數(shù)據(jù)倉(cāng)庫(kù)的產(chǎn)生(1)數(shù)據(jù)集成7數(shù)據(jù)集成企業(yè)全面的經(jīng)營(yíng)數(shù)據(jù)OLTP分散在不同系統(tǒng)中(核心、信貸、國(guó)結(jié))外部數(shù)據(jù)(市場(chǎng)數(shù)據(jù)、競(jìng)爭(zhēng)對(duì)手)集成的數(shù)據(jù)建立關(guān)聯(lián)的各業(yè)務(wù)系統(tǒng)之間的業(yè)務(wù)事件聯(lián)系統(tǒng)一的(統(tǒng)一的事實(shí)、維度)歷史的數(shù)據(jù)一般的全國(guó)股份制商業(yè)銀行一天的交易流水在150W左右通常業(yè)務(wù)系統(tǒng)只保留當(dāng)前的歷史數(shù)據(jù)查詢困難數(shù)據(jù)集成企業(yè)全面的經(jīng)營(yíng)數(shù)據(jù)8數(shù)據(jù)集成數(shù)據(jù)一致化在很多情況下,大型企業(yè)會(huì)產(chǎn)生數(shù)據(jù)不一致情況數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)要保持一致化和準(zhǔn)確性數(shù)據(jù)綜合各種不同粒度的數(shù)據(jù)的集成問(wèn)題詳細(xì)粒度中等聚集高層聚集外部數(shù)據(jù)集成數(shù)據(jù)集成數(shù)據(jù)一致化9查詢性能提高數(shù)據(jù)的查詢效率OLTP系統(tǒng)面向數(shù)據(jù)維護(hù)數(shù)據(jù)倉(cāng)庫(kù)面向數(shù)據(jù)查詢提高查詢功能為最主要目標(biāo)查詢性能提高數(shù)據(jù)的查詢效率10發(fā)展的動(dòng)力業(yè)務(wù)需求驅(qū)動(dòng)主要是詳細(xì)的分析科學(xué)的經(jīng)營(yíng)市場(chǎng)活動(dòng)的細(xì)化和實(shí)施等數(shù)據(jù)驅(qū)動(dòng)數(shù)據(jù)量不斷擴(kuò)大需要相關(guān)技術(shù)全面了解企業(yè)結(jié)論:以單一的數(shù)據(jù)組織方式進(jìn)行組織的數(shù)據(jù)庫(kù),不能滿足新型的數(shù)據(jù)處理多樣化的要求,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)應(yīng)運(yùn)而生發(fā)展的動(dòng)力業(yè)務(wù)需求驅(qū)動(dòng)11數(shù)據(jù)倉(cāng)庫(kù)的概念和特征數(shù)據(jù)倉(cāng)庫(kù)的概念和特征12數(shù)據(jù)倉(cāng)庫(kù)的概念數(shù)據(jù)倉(cāng)庫(kù)(EDW,EnterpriseDataWareHouse)數(shù)據(jù)倉(cāng)庫(kù)無(wú)非是所有數(shù)據(jù)集市的集合
--RalphKimball數(shù)據(jù)倉(cāng)庫(kù)無(wú)非是面向主題的、集成的、不同時(shí)間的、穩(wěn)定的數(shù)據(jù)集合以便支持管理決策--BillInmon數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)過(guò)程不是一個(gè)項(xiàng)目數(shù)據(jù)倉(cāng)庫(kù)的概念數(shù)據(jù)倉(cāng)庫(kù)(EDW,EnterpriseDat13數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)面向主題數(shù)據(jù)所代表的業(yè)務(wù)內(nèi)容劃分,而不是以應(yīng)用劃分集成的數(shù)據(jù)所代表的業(yè)務(wù)內(nèi)容劃分,而不是以應(yīng)用劃分不同時(shí)間的數(shù)據(jù)按照時(shí)間組織,并存儲(chǔ)在不同的時(shí)間切片穩(wěn)定的不允許對(duì)數(shù)據(jù)進(jìn)行更新,只允許初始加載和查詢數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)面向主題14數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)構(gòu)15數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)OperationalDataStoreETL數(shù)據(jù)源DataWarehouse數(shù)據(jù)源數(shù)據(jù)源DataMartDataMartDataMart分析報(bào)表可視化數(shù)據(jù)挖掘ODS(OperationalDataStore):操作型數(shù)據(jù)存儲(chǔ)區(qū)域ETL(ExtractTransferLoad):數(shù)據(jù)抽取轉(zhuǎn)換加載DW(DataWareHouse):數(shù)據(jù)倉(cāng)庫(kù)DM(DataMart):數(shù)據(jù)集市元數(shù)據(jù)(MetaData)數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)OperationalETL數(shù)據(jù)源Data數(shù)據(jù)源16數(shù)據(jù)源各種業(yè)務(wù)系統(tǒng)RDBMS文件系統(tǒng)如,銀行業(yè)中,核心系統(tǒng)、信貸系統(tǒng)、國(guó)結(jié)系統(tǒng)ERP系統(tǒng)數(shù)據(jù)源各種業(yè)務(wù)系統(tǒng)17ODS(操作型數(shù)據(jù)存儲(chǔ)區(qū)域)是一種數(shù)據(jù)倉(cāng)庫(kù)的混合形式,它包含及時(shí)的、最近的、面向主題的和集成的信息。是數(shù)據(jù)倉(cāng)庫(kù)環(huán)境的一個(gè)組成部分是操作型系統(tǒng)的一個(gè)集成環(huán)境為決策支持系統(tǒng)提供當(dāng)前詳細(xì)數(shù)據(jù)的查詢功能是面向主題的、集成的、經(jīng)常更新的詳細(xì)數(shù)據(jù)ODS(操作型數(shù)據(jù)存儲(chǔ)區(qū)域)是一種數(shù)據(jù)倉(cāng)庫(kù)的混18ETL(抽取轉(zhuǎn)換加載)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)是面向主題的,而業(yè)務(wù)數(shù)據(jù)庫(kù)總是圍繞一個(gè)或幾個(gè)業(yè)務(wù)處理流程,因此到數(shù)據(jù)倉(cāng)庫(kù)的過(guò)程需要十分復(fù)雜的數(shù)據(jù)整合過(guò)程。數(shù)據(jù)抽取數(shù)據(jù)轉(zhuǎn)換(一致化)數(shù)據(jù)加載作業(yè)控制ETL(抽取轉(zhuǎn)換加載)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)是面向主19數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型-多維數(shù)據(jù)模型粒度劃分(分割、匯總)FactTablefact1fact2fact3機(jī)構(gòu)粒度key機(jī)構(gòu)代碼地址聯(lián)系人attributeDimensionDimensionDimension粒度代碼attributeattributeattribute粒度:1-日2-月3-年日期2008-12-31數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型-多維數(shù)據(jù)模型FactTablefact120數(shù)據(jù)集市數(shù)據(jù)集市是數(shù)據(jù)倉(cāng)庫(kù)的子集。如果數(shù)據(jù)倉(cāng)庫(kù)是整個(gè)企業(yè)組織的所有主題數(shù)據(jù)存儲(chǔ)區(qū),那么數(shù)據(jù)集市就是某一個(gè)主題數(shù)據(jù)的存儲(chǔ)領(lǐng)域。數(shù)據(jù)集市即是數(shù)據(jù)倉(cāng)庫(kù)的一種實(shí)現(xiàn),也是實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)的重要過(guò)程,同時(shí)提供了分布式數(shù)據(jù)倉(cāng)庫(kù)的思想。數(shù)據(jù)集市數(shù)據(jù)集市是數(shù)據(jù)倉(cāng)庫(kù)的子集。如果數(shù)據(jù)倉(cāng)庫(kù)是整個(gè)企業(yè)組織21數(shù)據(jù)展現(xiàn)查詢報(bào)表多維分析(鉆取、切換)圖形數(shù)據(jù)展現(xiàn)查詢22元數(shù)據(jù)元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),它描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、碼、索引等項(xiàng)內(nèi)容。元數(shù)據(jù)分類技術(shù)元數(shù)據(jù)業(yè)務(wù)元數(shù)據(jù)元數(shù)據(jù)元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),它描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、碼、23三個(gè)關(guān)鍵部分三個(gè)關(guān)鍵部分24數(shù)據(jù)倉(cāng)庫(kù)建設(shè)方法數(shù)據(jù)倉(cāng)庫(kù)建設(shè)方法25數(shù)據(jù)倉(cāng)庫(kù)建設(shè)-頻繁變化-面向企業(yè)中不同業(yè)務(wù)和用戶數(shù)據(jù)倉(cāng)庫(kù)建設(shè)-頻繁變化26數(shù)據(jù)倉(cāng)庫(kù)建設(shè)策略自底向上的策略:即數(shù)據(jù)集市方法,提供了靈活性,低花費(fèi),并能迅速回報(bào)投資。此方法的核心是:從最關(guān)心的部分開(kāi)始,先以最少的投資,完成企業(yè)當(dāng)前的需求,獲得最快的回報(bào),然后再不斷擴(kuò)充,完善。數(shù)據(jù)倉(cāng)庫(kù)建設(shè)策略自底向上的策略:即數(shù)據(jù)集市方法,提供了靈活性27數(shù)據(jù)倉(cāng)庫(kù)建設(shè)策略自頂向下的策略:先建立一個(gè)全局?jǐn)?shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu),然后在此基礎(chǔ)上建立部門(mén)的數(shù)據(jù)集市和個(gè)人的數(shù)據(jù)倉(cāng)庫(kù)。這是一種系統(tǒng)解決方案,能最大限度地減少集成問(wèn)題,但開(kāi)發(fā)周期長(zhǎng),費(fèi)用高,并且缺乏靈活性。數(shù)據(jù)倉(cāng)庫(kù)建設(shè)策略自頂向下的策略:先建立一個(gè)全局?jǐn)?shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)28數(shù)據(jù)倉(cāng)庫(kù)建設(shè)層次分析型應(yīng)用要求千差萬(wàn)別,一個(gè)單一層次的數(shù)據(jù)倉(cāng)庫(kù)不能滿足所有的分析需求。一個(gè)好的解決方案:建立分層的數(shù)據(jù)倉(cāng)庫(kù)。操作型環(huán)境數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)集市個(gè)人倉(cāng)庫(kù)全局級(jí)部門(mén)級(jí)個(gè)人級(jí)數(shù)據(jù)倉(cāng)庫(kù)建設(shè)層次分析型應(yīng)用要求千差萬(wàn)別,一個(gè)單一層次的數(shù)29多層數(shù)據(jù)倉(cāng)庫(kù)企業(yè)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)集市數(shù)據(jù)集市分布式數(shù)據(jù)集市定義高層數(shù)據(jù)模型模型提煉模型提煉遞增、進(jìn)化地開(kāi)發(fā)數(shù)據(jù)倉(cāng)庫(kù)多層數(shù)據(jù)倉(cāng)庫(kù)企業(yè)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)集市數(shù)據(jù)集市分布式數(shù)據(jù)集市定30商業(yè)智能商業(yè)智能31商業(yè)智能商業(yè)智能,又稱商務(wù)智能,英文為BusinessIntelligence,簡(jiǎn)寫(xiě)為BI。起源于上世紀(jì)90年代。商業(yè)智能描述了一系列的概念和方法,通過(guò)應(yīng)用基于事實(shí)的支持系統(tǒng)來(lái)輔助商業(yè)決策的制定。商業(yè)智能技術(shù)提供使企業(yè)迅速分析數(shù)據(jù)的技術(shù)和方法,包括收集、管理和分析數(shù)據(jù),將這些數(shù)據(jù)轉(zhuǎn)化為有用的信息,然后分發(fā)到企業(yè)各處。
可以說(shuō)商務(wù)智能是一個(gè)可包含企業(yè)所有知識(shí)的系統(tǒng),服務(wù)于管理決策層或部門(mén)執(zhí)行經(jīng)理,幫助其進(jìn)行決策和分析。商業(yè)智能商業(yè)智能,又稱商務(wù)智能,英文為BusinessIn32商業(yè)智能結(jié)構(gòu)OLAP數(shù)據(jù)挖掘(DataMining)數(shù)據(jù)倉(cāng)庫(kù)其他的查詢和展現(xiàn)商業(yè)智能結(jié)構(gòu)OLAP33商業(yè)智能的功能記錄選擇查詢展現(xiàn)關(guān)聯(lián)分析買(mǎi)債券,保本型理財(cái)監(jiān)視功能月?tīng)I(yíng)業(yè)額小于10萬(wàn)元的分店展示功能查找、排序、統(tǒng)計(jì)數(shù)據(jù)輸出打印/導(dǎo)出,圖形、Excel商業(yè)智能的功能記錄選擇34商業(yè)智能實(shí)施步驟需求分析數(shù)據(jù)分析數(shù)據(jù)倉(cāng)庫(kù)建模數(shù)據(jù)處理(ETL)BI展現(xiàn)(報(bào)表、圖形、OLAP)數(shù)據(jù)模擬測(cè)試系統(tǒng)完善改進(jìn)(迭代)商業(yè)智能實(shí)施步驟需求分析35相關(guān)產(chǎn)品數(shù)據(jù)倉(cāng)庫(kù)解決方案Teradata,IBM,Oracle….建模軟件ERwin,PowerDesigner…ETL軟件DataStage,Informatic…數(shù)據(jù)倉(cāng)庫(kù)Teradata,Oracle,IBMDB2…BI軟件COGNOS,BO,Brio…相關(guān)產(chǎn)品數(shù)據(jù)倉(cāng)庫(kù)解決方案36商業(yè)智能的發(fā)展趨勢(shì)功能上具有可配置性、靈活性、可變化性解決方案更開(kāi)放、可擴(kuò)展、可按用戶定制,在保證核心技術(shù)的同時(shí),提供客戶化的界面從單獨(dú)的商業(yè)智能向嵌入式商業(yè)智能發(fā)展從傳統(tǒng)功能向增強(qiáng)型功能轉(zhuǎn)變
商業(yè)智能的發(fā)展趨勢(shì)功能上具有可配置性、靈活性、可變化性37商業(yè)智能前景產(chǎn)品為中心->客戶為中心客戶需求的增長(zhǎng)競(jìng)爭(zhēng)的加劇技術(shù)的進(jìn)步商業(yè)智能的作用決策支持(KPI,關(guān)鍵性能指標(biāo))客戶評(píng)價(jià)市場(chǎng)自動(dòng)化(促銷管理)商業(yè)智能前景產(chǎn)品為中心->客戶為中心38謝謝!謝謝!39數(shù)據(jù)倉(cāng)庫(kù)與商業(yè)智能2009-4-20數(shù)據(jù)倉(cāng)庫(kù)與商業(yè)智能2009-4-2040主要內(nèi)容數(shù)據(jù)倉(cāng)庫(kù)的起源和發(fā)展數(shù)據(jù)倉(cāng)庫(kù)定義和特點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)建設(shè)方法商業(yè)智能主要內(nèi)容數(shù)據(jù)倉(cāng)庫(kù)的起源和發(fā)展41數(shù)據(jù)倉(cāng)庫(kù)的起源和發(fā)展數(shù)據(jù)倉(cāng)庫(kù)的起源和發(fā)展42數(shù)據(jù)管理的歷史人工管理方式這一時(shí)期是在20世紀(jì)50年代中期以前,這一階段的計(jì)算機(jī)應(yīng)用主要用于科學(xué)計(jì)算,外存只有紙帶、磁帶、卡片等,數(shù)據(jù)處理的方式基本上是批處理。這一時(shí)期數(shù)據(jù)管理的特點(diǎn)是:數(shù)據(jù)不保存;沒(méi)有專用的數(shù)據(jù)管理軟件,每個(gè)應(yīng)用都必須自己完成存儲(chǔ)結(jié)構(gòu)、存取方法、輸入輸出等數(shù)據(jù)管理功能;一組數(shù)據(jù)對(duì)應(yīng)一個(gè)應(yīng)用,這使得程序之間可能有重復(fù)的數(shù)據(jù)。文件系統(tǒng)管理這一階段在20世紀(jì)50年代后期至60年代中后期,計(jì)算機(jī)應(yīng)用開(kāi)始用于信息管理,由于數(shù)據(jù)存儲(chǔ)、檢索和維護(hù)等需求,使得相應(yīng)的研究開(kāi)展起來(lái)了,在硬件和軟件方面都得到了發(fā)展,磁盤(pán)磁鼓出現(xiàn),操作系統(tǒng)也產(chǎn)生。數(shù)據(jù)庫(kù)系統(tǒng)(60年代末開(kāi)始)關(guān)系數(shù)據(jù)庫(kù)之父E.F.Codd提出了關(guān)系模型(ER),促進(jìn)了聯(lián)機(jī)事務(wù)處理(OLTP)的發(fā)展,數(shù)據(jù)以表格的形式而非文件方式存儲(chǔ)。數(shù)據(jù)管理的歷史人工管理方式43數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)傳統(tǒng)的數(shù)據(jù)庫(kù)環(huán)境中以數(shù)據(jù)庫(kù)為中心,數(shù)據(jù)資源組織方式單一;側(cè)重對(duì)數(shù)據(jù)的管理,操作型處理(OLTP,聯(lián)機(jī)事務(wù)處理),關(guān)心的是響應(yīng)時(shí)間,數(shù)據(jù)的安全性和完整性;問(wèn)題:“易進(jìn)不易出”
數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)傳統(tǒng)的數(shù)據(jù)庫(kù)環(huán)境中44數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)處理不斷有新需求(聯(lián)機(jī)事務(wù)、批處理、決策分析)分析型處理(OLAP,聯(lián)機(jī)分析處理)
用于管理人員的決策分析,經(jīng)常要訪問(wèn)大量的歷史數(shù)據(jù),而很少對(duì)數(shù)據(jù)庫(kù)進(jìn)行寫(xiě)操作,除非對(duì)數(shù)據(jù)庫(kù)進(jìn)行更新或裝入時(shí)。人們希望從中獲得跟公司經(jīng)營(yíng)效益緊密相關(guān)的信息。數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)處理不斷有新需求(聯(lián)機(jī)事務(wù)、批處理、決策45數(shù)據(jù)倉(cāng)庫(kù)的產(chǎn)生(1)數(shù)據(jù)集成(2)歷史數(shù)據(jù)的應(yīng)用需求(3)查詢性能數(shù)據(jù)倉(cāng)庫(kù)的產(chǎn)生(1)數(shù)據(jù)集成46數(shù)據(jù)集成企業(yè)全面的經(jīng)營(yíng)數(shù)據(jù)OLTP分散在不同系統(tǒng)中(核心、信貸、國(guó)結(jié))外部數(shù)據(jù)(市場(chǎng)數(shù)據(jù)、競(jìng)爭(zhēng)對(duì)手)集成的數(shù)據(jù)建立關(guān)聯(lián)的各業(yè)務(wù)系統(tǒng)之間的業(yè)務(wù)事件聯(lián)系統(tǒng)一的(統(tǒng)一的事實(shí)、維度)歷史的數(shù)據(jù)一般的全國(guó)股份制商業(yè)銀行一天的交易流水在150W左右通常業(yè)務(wù)系統(tǒng)只保留當(dāng)前的歷史數(shù)據(jù)查詢困難數(shù)據(jù)集成企業(yè)全面的經(jīng)營(yíng)數(shù)據(jù)47數(shù)據(jù)集成數(shù)據(jù)一致化在很多情況下,大型企業(yè)會(huì)產(chǎn)生數(shù)據(jù)不一致情況數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)要保持一致化和準(zhǔn)確性數(shù)據(jù)綜合各種不同粒度的數(shù)據(jù)的集成問(wèn)題詳細(xì)粒度中等聚集高層聚集外部數(shù)據(jù)集成數(shù)據(jù)集成數(shù)據(jù)一致化48查詢性能提高數(shù)據(jù)的查詢效率OLTP系統(tǒng)面向數(shù)據(jù)維護(hù)數(shù)據(jù)倉(cāng)庫(kù)面向數(shù)據(jù)查詢提高查詢功能為最主要目標(biāo)查詢性能提高數(shù)據(jù)的查詢效率49發(fā)展的動(dòng)力業(yè)務(wù)需求驅(qū)動(dòng)主要是詳細(xì)的分析科學(xué)的經(jīng)營(yíng)市場(chǎng)活動(dòng)的細(xì)化和實(shí)施等數(shù)據(jù)驅(qū)動(dòng)數(shù)據(jù)量不斷擴(kuò)大需要相關(guān)技術(shù)全面了解企業(yè)結(jié)論:以單一的數(shù)據(jù)組織方式進(jìn)行組織的數(shù)據(jù)庫(kù),不能滿足新型的數(shù)據(jù)處理多樣化的要求,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)應(yīng)運(yùn)而生發(fā)展的動(dòng)力業(yè)務(wù)需求驅(qū)動(dòng)50數(shù)據(jù)倉(cāng)庫(kù)的概念和特征數(shù)據(jù)倉(cāng)庫(kù)的概念和特征51數(shù)據(jù)倉(cāng)庫(kù)的概念數(shù)據(jù)倉(cāng)庫(kù)(EDW,EnterpriseDataWareHouse)數(shù)據(jù)倉(cāng)庫(kù)無(wú)非是所有數(shù)據(jù)集市的集合
--RalphKimball數(shù)據(jù)倉(cāng)庫(kù)無(wú)非是面向主題的、集成的、不同時(shí)間的、穩(wěn)定的數(shù)據(jù)集合以便支持管理決策--BillInmon數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)過(guò)程不是一個(gè)項(xiàng)目數(shù)據(jù)倉(cāng)庫(kù)的概念數(shù)據(jù)倉(cāng)庫(kù)(EDW,EnterpriseDat52數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)面向主題數(shù)據(jù)所代表的業(yè)務(wù)內(nèi)容劃分,而不是以應(yīng)用劃分集成的數(shù)據(jù)所代表的業(yè)務(wù)內(nèi)容劃分,而不是以應(yīng)用劃分不同時(shí)間的數(shù)據(jù)按照時(shí)間組織,并存儲(chǔ)在不同的時(shí)間切片穩(wěn)定的不允許對(duì)數(shù)據(jù)進(jìn)行更新,只允許初始加載和查詢數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)面向主題53數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)構(gòu)54數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)OperationalDataStoreETL數(shù)據(jù)源DataWarehouse數(shù)據(jù)源數(shù)據(jù)源DataMartDataMartDataMart分析報(bào)表可視化數(shù)據(jù)挖掘ODS(OperationalDataStore):操作型數(shù)據(jù)存儲(chǔ)區(qū)域ETL(ExtractTransferLoad):數(shù)據(jù)抽取轉(zhuǎn)換加載DW(DataWareHouse):數(shù)據(jù)倉(cāng)庫(kù)DM(DataMart):數(shù)據(jù)集市元數(shù)據(jù)(MetaData)數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)OperationalETL數(shù)據(jù)源Data數(shù)據(jù)源55數(shù)據(jù)源各種業(yè)務(wù)系統(tǒng)RDBMS文件系統(tǒng)如,銀行業(yè)中,核心系統(tǒng)、信貸系統(tǒng)、國(guó)結(jié)系統(tǒng)ERP系統(tǒng)數(shù)據(jù)源各種業(yè)務(wù)系統(tǒng)56ODS(操作型數(shù)據(jù)存儲(chǔ)區(qū)域)是一種數(shù)據(jù)倉(cāng)庫(kù)的混合形式,它包含及時(shí)的、最近的、面向主題的和集成的信息。是數(shù)據(jù)倉(cāng)庫(kù)環(huán)境的一個(gè)組成部分是操作型系統(tǒng)的一個(gè)集成環(huán)境為決策支持系統(tǒng)提供當(dāng)前詳細(xì)數(shù)據(jù)的查詢功能是面向主題的、集成的、經(jīng)常更新的詳細(xì)數(shù)據(jù)ODS(操作型數(shù)據(jù)存儲(chǔ)區(qū)域)是一種數(shù)據(jù)倉(cāng)庫(kù)的混57ETL(抽取轉(zhuǎn)換加載)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)是面向主題的,而業(yè)務(wù)數(shù)據(jù)庫(kù)總是圍繞一個(gè)或幾個(gè)業(yè)務(wù)處理流程,因此到數(shù)據(jù)倉(cāng)庫(kù)的過(guò)程需要十分復(fù)雜的數(shù)據(jù)整合過(guò)程。數(shù)據(jù)抽取數(shù)據(jù)轉(zhuǎn)換(一致化)數(shù)據(jù)加載作業(yè)控制ETL(抽取轉(zhuǎn)換加載)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)是面向主58數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型-多維數(shù)據(jù)模型粒度劃分(分割、匯總)FactTablefact1fact2fact3機(jī)構(gòu)粒度key機(jī)構(gòu)代碼地址聯(lián)系人attributeDimensionDimensionDimension粒度代碼attributeattributeattribute粒度:1-日2-月3-年日期2008-12-31數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型-多維數(shù)據(jù)模型FactTablefact159數(shù)據(jù)集市數(shù)據(jù)集市是數(shù)據(jù)倉(cāng)庫(kù)的子集。如果數(shù)據(jù)倉(cāng)庫(kù)是整個(gè)企業(yè)組織的所有主題數(shù)據(jù)存儲(chǔ)區(qū),那么數(shù)據(jù)集市就是某一個(gè)主題數(shù)據(jù)的存儲(chǔ)領(lǐng)域。數(shù)據(jù)集市即是數(shù)據(jù)倉(cāng)庫(kù)的一種實(shí)現(xiàn),也是實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)的重要過(guò)程,同時(shí)提供了分布式數(shù)據(jù)倉(cāng)庫(kù)的思想。數(shù)據(jù)集市數(shù)據(jù)集市是數(shù)據(jù)倉(cāng)庫(kù)的子集。如果數(shù)據(jù)倉(cāng)庫(kù)是整個(gè)企業(yè)組織60數(shù)據(jù)展現(xiàn)查詢報(bào)表多維分析(鉆取、切換)圖形數(shù)據(jù)展現(xiàn)查詢61元數(shù)據(jù)元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),它描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、碼、索引等項(xiàng)內(nèi)容。元數(shù)據(jù)分類技術(shù)元數(shù)據(jù)業(yè)務(wù)元數(shù)據(jù)元數(shù)據(jù)元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),它描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、碼、62三個(gè)關(guān)鍵部分三個(gè)關(guān)鍵部分63數(shù)據(jù)倉(cāng)庫(kù)建設(shè)方法數(shù)據(jù)倉(cāng)庫(kù)建設(shè)方法64數(shù)據(jù)倉(cāng)庫(kù)建設(shè)-頻繁變化-面向企業(yè)中不同業(yè)務(wù)和用戶數(shù)據(jù)倉(cāng)庫(kù)建設(shè)-頻繁變化65數(shù)據(jù)倉(cāng)庫(kù)建設(shè)策略自底向上的策略:即數(shù)據(jù)集市方法,提供了靈活性,低花費(fèi),并能迅速回報(bào)投資。此方法的核心是:從最關(guān)心的部分開(kāi)始,先以最少的投資,完成企業(yè)當(dāng)前的需求,獲得最快的回報(bào),然后再不斷擴(kuò)充,完善。數(shù)據(jù)倉(cāng)庫(kù)建設(shè)策略自底向上的策略:即數(shù)據(jù)集市方法,提供了靈活性66數(shù)據(jù)倉(cāng)庫(kù)建設(shè)策略自頂向下的策略:先建立一個(gè)全局?jǐn)?shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu),然后在此基礎(chǔ)上建立部門(mén)的數(shù)據(jù)集市和個(gè)人的數(shù)據(jù)倉(cāng)庫(kù)。這是一種系統(tǒng)解決方案,能最大限度地減少集成問(wèn)題,但開(kāi)發(fā)周期長(zhǎng),費(fèi)用高,并且缺乏靈活性。數(shù)據(jù)倉(cāng)庫(kù)建設(shè)策略自頂向下的策略:先建立一個(gè)全局?jǐn)?shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)67數(shù)據(jù)倉(cāng)庫(kù)建設(shè)層次分析型應(yīng)用要求千差萬(wàn)別,一個(gè)單一層次的數(shù)據(jù)倉(cāng)庫(kù)不能滿足所有的分析需求。一個(gè)好的解決方案:建立分層的數(shù)據(jù)倉(cāng)庫(kù)。操作型環(huán)境數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)集市個(gè)人倉(cāng)庫(kù)全局級(jí)部門(mén)級(jí)個(gè)人級(jí)數(shù)據(jù)倉(cāng)庫(kù)建設(shè)層次分析型應(yīng)用要求千差萬(wàn)別,一個(gè)單一層次的數(shù)68多層數(shù)據(jù)倉(cāng)庫(kù)企業(yè)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)集市數(shù)據(jù)集市分布式數(shù)據(jù)集市定義高層數(shù)據(jù)模型模型提煉模型提煉遞增、進(jìn)化地開(kāi)發(fā)數(shù)據(jù)倉(cāng)庫(kù)多層數(shù)據(jù)倉(cāng)庫(kù)企業(yè)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)集市數(shù)據(jù)集市分布式數(shù)據(jù)集市定69商業(yè)智能商業(yè)智能70商業(yè)智能商業(yè)智能,又稱商務(wù)智能,英文為BusinessIntellige
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年環(huán)境影響評(píng)價(jià)技術(shù)方法培訓(xùn)
- 2026年農(nóng)民田間學(xué)校教學(xué)方法指南
- 跨境貿(mào)易跨境電商平臺(tái)操作手冊(cè)
- 2026年酒店收益管理策略優(yōu)化課程
- 財(cái)稅制度管理培訓(xùn)課件
- 職業(yè)健康檔案電子化數(shù)據(jù)生命周期管理
- 職業(yè)健康政策下醫(yī)院?jiǎn)T工組織承諾的調(diào)節(jié)效應(yīng)
- 職業(yè)健康大數(shù)據(jù)與職業(yè)病防治投入產(chǎn)出趨勢(shì)關(guān)聯(lián)
- 青海2025年青海省生態(tài)環(huán)境監(jiān)測(cè)中心招聘筆試歷年參考題庫(kù)附帶答案詳解
- 邯鄲2025年河北邯鄲工程高級(jí)技工學(xué)校招聘8人筆試歷年參考題庫(kù)附帶答案詳解
- 婦產(chǎn)科臨床技能:新生兒神經(jīng)行為評(píng)估課件
- 基本農(nóng)田保護(hù)施工方案
- 股骨頸骨折患者營(yíng)養(yǎng)護(hù)理
- 二級(jí)醫(yī)院醫(yī)療設(shè)備配置標(biāo)準(zhǔn)
- 北師大版(2024)小學(xué)數(shù)學(xué)一年級(jí)上冊(cè)期末綜合質(zhì)量調(diào)研卷(含答案)
- 石方開(kāi)挖安全措施
- 山東省青島市市南區(qū)2024-2025學(xué)年四年級(jí)上學(xué)期期末英語(yǔ)試卷
- 空芯光纖行業(yè)分析報(bào)告
- 大眾試駕協(xié)議書(shū)
- 2026年醫(yī)療行業(yè)患者滿意度改善方案
- 安徽2026年國(guó)家電網(wǎng)招聘考試(公共與行業(yè)知識(shí))試題及答案
評(píng)論
0/150
提交評(píng)論