版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、為什么選擇數(shù)據(jù)倉庫 隨著信息化建設(shè)的不斷推進(jìn),產(chǎn)生了大量的數(shù)據(jù)。必須合理科學(xué)的應(yīng)用這些數(shù)據(jù),為業(yè)務(wù)決策提供強(qiáng)有力的數(shù)據(jù)支持。簡(jiǎn)單的報(bào)表應(yīng)用已經(jīng)無法滿足需求,因此需要使用更強(qiáng)大數(shù)據(jù)倉庫及其相關(guān)應(yīng)用。 平臺(tái)作為財(cái)政數(shù)據(jù)平臺(tái)有著標(biāo)準(zhǔn)化的存儲(chǔ)結(jié)構(gòu)和全面多樣的業(yè)務(wù)數(shù)據(jù),可以作為財(cái)政數(shù)據(jù)倉庫的可靠數(shù)據(jù)來源。數(shù)據(jù)倉庫 數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念 數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系結(jié)構(gòu) 主流數(shù)據(jù)倉庫產(chǎn)品對(duì)比分析 實(shí)例介紹數(shù)據(jù)倉庫概念 歷史 數(shù)據(jù)倉庫概念始于上世紀(jì)80年代中期,首次出現(xiàn)是在被譽(yù)為“數(shù)據(jù)倉庫之父”William H . Inmon的建立數(shù)據(jù)倉庫一書中。 定義 數(shù)據(jù)倉庫是在管理和決策中面向主題的
2、、集成的、隨時(shí)間變化的、相對(duì)穩(wěn)定的數(shù)據(jù)集合 按技術(shù)劃分 抽取、存儲(chǔ)與管理、數(shù)據(jù)的表現(xiàn) 決策支持系統(tǒng)(DSS, Decision Support System) 準(zhǔn)確、安全、可靠地取出數(shù)據(jù),經(jīng)過加工轉(zhuǎn)換成有規(guī)律信息之后,再供管理人員進(jìn)行分析使用。商業(yè)智能的概念(BI) 商業(yè)智能的核心內(nèi)容是從業(yè)務(wù)處理系統(tǒng)的數(shù)據(jù)中,提取出有用的數(shù)據(jù),進(jìn)行清理以保證數(shù)據(jù)的正確性,然后經(jīng)過抽?。‥xtraction)、轉(zhuǎn)換(Transformation)和裝載(Load),即ETL 過程,整合到一個(gè)企業(yè)級(jí)的數(shù)據(jù)倉庫里,從而得到企業(yè)信息的一個(gè)全局視圖,在此基礎(chǔ)上利用合適的查詢和分析工具、數(shù)據(jù)挖掘工具等對(duì)數(shù)據(jù)倉庫里的數(shù)據(jù)進(jìn)
3、行分析和處理,形成信息,甚至進(jìn)一步把信息提煉出輔助決策的知識(shí),最后把知識(shí)呈現(xiàn)給管理者,為管理者的決策過程提供支持。商業(yè)智能的概念(BI)傳統(tǒng)的決策模式商業(yè)智能環(huán)境下的決策流程數(shù)據(jù)倉庫與商業(yè)智能關(guān)系 數(shù)據(jù)倉庫是商業(yè)智能的基礎(chǔ)。 數(shù)據(jù)倉庫 數(shù)據(jù)倉庫從概念上更多地側(cè)重在對(duì)各類信息的整合工作,包括了數(shù)據(jù)的遷移,數(shù)據(jù)的組織和存儲(chǔ),數(shù)據(jù)的管理與維護(hù)這些我們平常稱之為后臺(tái)的基礎(chǔ)性的數(shù)據(jù)準(zhǔn)備工作。 商業(yè)智能 商業(yè)智能則側(cè)重在數(shù)據(jù)查詢和報(bào)告、多維/聯(lián)機(jī)數(shù)據(jù)分析、數(shù)據(jù)挖掘和數(shù)據(jù)可視化工具這些平常稱之為所謂前臺(tái)的數(shù)據(jù)應(yīng)用方面,其中數(shù)據(jù)挖掘是商業(yè)智能中比較高層次的一種應(yīng)用。數(shù)據(jù)倉庫 數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念
4、數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系結(jié)構(gòu) 主流數(shù)據(jù)倉庫產(chǎn)品對(duì)比分析 實(shí)例介紹數(shù)據(jù)倉庫、商業(yè)智能的體系結(jié)構(gòu)1. 數(shù)據(jù)源2. ETL3. 數(shù)據(jù)倉庫4. 數(shù)據(jù)集市5. 元數(shù)據(jù)6. OLAP1.數(shù)據(jù)源 平臺(tái)數(shù)據(jù)庫 外部數(shù)據(jù)(格式:txt、excel、dbf等文件格式) 其它數(shù)據(jù)庫2、ETL E : Extract 從源數(shù)據(jù)抽取數(shù)據(jù) T : Transform 把抽取的數(shù)據(jù)進(jìn)行轉(zhuǎn)換 L : Load 把轉(zhuǎn)換好的數(shù)據(jù)裝載到數(shù)據(jù)倉庫中。3、數(shù)據(jù)倉庫 數(shù)據(jù)倉庫的一個(gè)目的就是把企業(yè)的信息訪問基礎(chǔ)從一種非結(jié)構(gòu)化的改變成一種結(jié)構(gòu)化、發(fā)展中的環(huán)境改變成規(guī)劃良好的環(huán)境。 業(yè)務(wù)處理系統(tǒng)是面向應(yīng)用來設(shè)計(jì)的,更準(zhǔn)確地說是面向交易
5、來設(shè)計(jì)。而數(shù)據(jù)倉庫一般來說是按主題(Subject)來建模, 是面向查詢主題的。3.數(shù)據(jù)倉庫 數(shù)據(jù)倉庫的關(guān)鍵特征 星型模式 粒度 分割3.數(shù)據(jù)倉庫-關(guān)鍵特征 面向主題的(subject-oriented) 集成的(integrated) 時(shí)變的(time-variant) 非易失的(nonvolatile) 數(shù)據(jù)倉庫是一種語義上一致的數(shù)據(jù)存 儲(chǔ),它充當(dāng)決策支持?jǐn)?shù)據(jù)模型的物理實(shí)現(xiàn),并存放業(yè)務(wù)決策所需信息。數(shù)據(jù)倉庫通過將異種數(shù)據(jù)源中的數(shù)據(jù)集成在一起而構(gòu)造,支持結(jié)構(gòu)化的和專門的查詢、分析報(bào)告和決策。3.數(shù)據(jù)倉庫-星型模式3.數(shù)據(jù)倉庫-星型模式3.數(shù)據(jù)倉庫-粒度 粒度是對(duì)數(shù)據(jù)倉庫中的數(shù)據(jù)的匯總程度高低
6、的一個(gè)度量,(按省級(jí)匯總或按市級(jí)匯總就是不同的粒度)它既影響數(shù)據(jù)倉庫中的數(shù)據(jù)量的多少,也影響數(shù)據(jù)倉庫所能回答詢問信息的種類。在數(shù)據(jù)倉庫中,多維粒度是必不可少的。由于數(shù)據(jù)倉庫的主要作用是多維分析,因而絕大多數(shù)查詢都基于一定程度的匯總數(shù)據(jù)之上的,只有極少數(shù)查詢涉及到細(xì)節(jié)。分割 分割,目的在于提高效率。它是將數(shù)據(jù)分散到各自的物理單元中去, 以便能分別獨(dú)立處理,以實(shí)現(xiàn)查詢操作的并行。有許多數(shù)據(jù)分割的標(biāo)準(zhǔn)可供參考:如時(shí)間、地域、業(yè)務(wù)領(lǐng)域等等,也可以是其組合。一般而言,分割標(biāo)準(zhǔn)總應(yīng)包括一些能讓它十分自然而且分割均勻的項(xiàng)目,例如時(shí)間項(xiàng)。4、數(shù)據(jù)集市 數(shù)據(jù)集市分兩種,獨(dú)立的數(shù)據(jù)集市(Independent D
7、ata Mart)和從屬的數(shù)據(jù)集市(Dependent Data Mart)。兩種數(shù)據(jù)集市對(duì)比對(duì)比對(duì)比優(yōu)點(diǎn)優(yōu)點(diǎn)缺點(diǎn)缺點(diǎn)從屬數(shù)據(jù)集市 保證數(shù)據(jù)一致性;架構(gòu)比較理想,可擴(kuò)展能力強(qiáng)依賴與中心數(shù)據(jù)倉庫的實(shí)施;實(shí)施周期長(zhǎng);實(shí)施成本高;獨(dú)立數(shù)據(jù)集市實(shí)施周期短;實(shí)施成本低;沒有消除信息分割;可擴(kuò)展能力弱;后期整合困難。財(cái)政領(lǐng)域應(yīng)用在平臺(tái)實(shí)施的基礎(chǔ)上以從屬數(shù)據(jù)集市為主。5.元數(shù)據(jù)(Meta-data) 定義: “關(guān)于數(shù)據(jù)的數(shù)據(jù)”,是描述和管理數(shù)據(jù)倉庫自身內(nèi)容對(duì)象、用來表示數(shù)據(jù)項(xiàng)的意義及其在系統(tǒng)各組成部件之間的關(guān)系的數(shù)據(jù)。數(shù)據(jù)倉庫的元數(shù)據(jù)包括:(1)數(shù)據(jù)資源:包括各個(gè)數(shù)據(jù)源的模型,描述源數(shù)據(jù)表字段屬性及業(yè)務(wù)含義
8、,源數(shù)據(jù)到數(shù)據(jù)倉庫的映射關(guān)系;(2)數(shù)據(jù)組織:數(shù)據(jù)倉庫、數(shù)據(jù)集市表的結(jié)構(gòu)、屬性及業(yè)務(wù)含義,多維結(jié)構(gòu)等;(3)數(shù)據(jù)應(yīng)用:查詢與報(bào)表輸出格式描述、OLAP、數(shù)據(jù)挖掘等的數(shù)據(jù)模型的信息展現(xiàn)、商業(yè)術(shù)語;(4)數(shù)據(jù)管理:這里包括數(shù)據(jù)倉庫過程以及數(shù)據(jù)倉庫操作結(jié)果的模型,包括描述數(shù)據(jù)抽取和清洗規(guī)則、數(shù)據(jù)加載控制、臨時(shí)表結(jié)構(gòu)、用途和使用情況、數(shù)據(jù)匯總控制。5.元數(shù)據(jù)類型 業(yè)務(wù)元數(shù)據(jù)業(yè)務(wù)元數(shù)據(jù) 用業(yè)務(wù)名稱、定義、描述和別名來表示數(shù)據(jù)倉庫和業(yè)務(wù)系統(tǒng)中的各種屬性,直接供最終用戶使用。業(yè)務(wù)元數(shù)據(jù)使最終用戶能夠更好理解、使用數(shù)據(jù)倉庫,成為最終用戶在數(shù)據(jù)倉庫中的業(yè)務(wù)信息地圖。 技術(shù)元數(shù)據(jù)技術(shù)元數(shù)據(jù) 技術(shù)元數(shù)據(jù)描述了源系統(tǒng)
9、、數(shù)據(jù)轉(zhuǎn)換、抽取過程、工作流、加載策略以及目標(biāo)數(shù)據(jù)庫的定義等。用來進(jìn)行影響分析、變化管理、數(shù)據(jù)庫優(yōu)化、任務(wù)調(diào)度和安全管理等。 操作元數(shù)據(jù)操作元數(shù)據(jù) 操作元數(shù)據(jù)描述了目標(biāo)表中的信息,如粒度、創(chuàng)建目標(biāo)表和索引的信息、刷新時(shí)間、記錄數(shù)、按時(shí)執(zhí)行任務(wù)的設(shè)置以及有權(quán)訪問數(shù)據(jù)的用戶。操作元數(shù)據(jù)用于數(shù)據(jù)倉庫的維護(hù)和分布。多維分析OLAP OLAP (On-Line analytical Processing) 在線分析處理 切片和切塊(Slice and Dice) 鉆取(Drill) 旋轉(zhuǎn)(Rotate)6 、OLAP分析 是一類軟件技術(shù) 分析人員能從多個(gè)角度獲得對(duì)數(shù)據(jù)的更深入了解 特點(diǎn):快速、一致、交互
10、 多維視圖分析數(shù)據(jù)的工具 根據(jù)用戶常用的多種分析角度,事先計(jì)算好一些輔助結(jié)構(gòu),以便在查詢時(shí)能盡快訪問到所要的匯總數(shù)字,并快速地從一維轉(zhuǎn)變到另一維,將不同角度的信息以數(shù)字、直方圖、餅圖、曲線等等方式展現(xiàn)在用戶面前。切片和切塊(Slice and Dice) 切片取二維數(shù)據(jù),稱為切片。 切塊 取三維數(shù)據(jù),稱為切塊。切片和切塊(Slice and Dice)鉆取(Drill) 鉆取包含向下鉆取(Drill-down)和向上鉆取(Drill-up)操作, 鉆取的深度與維所劃分的層次相對(duì)應(yīng)。旋轉(zhuǎn)(Rotate)數(shù)據(jù)倉庫 數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念 數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系結(jié)構(gòu) 主流數(shù)據(jù)倉庫
11、產(chǎn)品對(duì)比分析 實(shí)例介紹主流數(shù)據(jù)倉庫產(chǎn)品對(duì)比分析 1.數(shù)據(jù)倉庫產(chǎn)品介紹 2.產(chǎn)品支撐技術(shù)主要數(shù)據(jù)倉庫產(chǎn)品供應(yīng)商介紹 Oracle IBM Microsoft SAS Teradata Sybase Business Objects(SAP)Oracle 介紹 Oracle公司的數(shù)據(jù)倉庫解決方案包含了數(shù)據(jù)庫平臺(tái)、開發(fā)工具和應(yīng)用系統(tǒng),能夠提供一系列的數(shù)據(jù)倉庫工具集和服務(wù),具有多用戶數(shù)據(jù)倉庫管理能力,多種分區(qū)方式,與OLAP工具的交互能力,及數(shù)據(jù)移動(dòng)機(jī)制等特性。Oracle的優(yōu)勢(shì)在于大多數(shù)業(yè)務(wù)系統(tǒng)采用oracle數(shù)據(jù)庫。IBM 介紹 IBM公司的數(shù)據(jù)倉庫產(chǎn)品稱為DB2 Data Warehouse E
12、dition,它結(jié)合了DB2數(shù)據(jù)服務(wù)器的長(zhǎng)處和IBM的商業(yè)智能基礎(chǔ)設(shè)施,集成了用于倉庫管理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘以及OLAP分析和報(bào)告的核心組件,提供了一套基于可視數(shù)據(jù)倉庫的商業(yè)智能解決方案。IBM的優(yōu)勢(shì)在于解決方案比較完善。Microsoft 介紹 微軟的SQL Server提供了三大服務(wù)和一個(gè)工具來實(shí)現(xiàn)數(shù)據(jù)倉庫系統(tǒng)的整合,為用戶提供了可用于構(gòu)建典型和創(chuàng)新的分析應(yīng)用程序所需的各種特性、工具和功能,可以實(shí)現(xiàn)建模、ETL、建立查詢分析或圖表、定制KPI、建立報(bào)表和構(gòu)造數(shù)據(jù)挖掘應(yīng)用及發(fā)布等功能。微軟的優(yōu)勢(shì)在于簡(jiǎn)單易用。SAS SAS公司的數(shù)據(jù)倉庫解決方案是一個(gè)由30多個(gè)專用模塊構(gòu)成的架構(gòu)體系,適應(yīng)于
13、對(duì)企業(yè)級(jí)的數(shù)據(jù)進(jìn)行重新整合,支持多維、快速查詢,提供服務(wù)于OLAP操作和決策支持的數(shù)據(jù)采集、管理、處理和展現(xiàn)功能。SAS優(yōu)勢(shì)在于數(shù)據(jù)挖掘和統(tǒng)計(jì)分析。Teradata Teradata公司提出了可擴(kuò)展數(shù)據(jù)倉庫基本架構(gòu),包括數(shù)據(jù)裝載、數(shù)據(jù)管理和信息訪問幾個(gè)部分,是高端數(shù)據(jù)倉庫市場(chǎng)最有力競(jìng)爭(zhēng)者,主要運(yùn)行在基于Unix操作系統(tǒng)平臺(tái)的NCR硬件設(shè)備上,在銀行領(lǐng)域應(yīng)用廣泛。Sybase 介紹 Sybase提供了稱為Warehouse Studio的一整套覆蓋整個(gè)數(shù)據(jù)倉庫建立周期的產(chǎn)品包,包括數(shù)據(jù)倉庫的建模、數(shù)據(jù)集成和轉(zhuǎn)換、數(shù)據(jù)存儲(chǔ)和管理、元數(shù)據(jù)管理和數(shù)據(jù)可視化分析等產(chǎn)品。Business Objects(
14、SAP) 介紹 Business Objects是BI工具,集查詢、報(bào)表和OLAP技術(shù)為一身的智能決策支持系統(tǒng),具有較好的查詢和報(bào)表功能,提供多維分析技術(shù),支持多種數(shù)據(jù)庫,同時(shí)它還支持基于Web瀏覽器的查詢、報(bào)表和分析決策。被SAP收購后,目前還沒有完整數(shù)據(jù)倉庫解決方案。主流數(shù)據(jù)倉庫產(chǎn)品對(duì)比分析 數(shù)據(jù)倉庫產(chǎn)品介紹 支撐技術(shù)數(shù)據(jù)倉庫技術(shù) 1、數(shù)據(jù)庫技術(shù) 2、ETL技術(shù) 3、OLAP技術(shù) 4、報(bào)表技術(shù) 5、數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)庫技術(shù) 數(shù)據(jù)庫技術(shù)是支撐數(shù)據(jù)倉庫技術(shù)的基礎(chǔ)技術(shù)。盡管在數(shù)據(jù)倉庫技術(shù)存儲(chǔ)模型方面,基于數(shù)據(jù)庫技術(shù)而發(fā)展的關(guān)系模式的理念已經(jīng)被顛覆,取而代之是各種各樣的數(shù)據(jù)倉庫數(shù)據(jù)模型,如星型模型,
15、雪花模型等。然而,在已有的數(shù)據(jù)倉庫實(shí)踐中,關(guān)系數(shù)據(jù)庫仍然是實(shí)質(zhì)的數(shù)據(jù)庫存儲(chǔ)工具,只是將數(shù)據(jù)庫表改稱為了事實(shí)表和維表,將屬性域之間的關(guān)系重新定義為維度,量度,層次,粒度等。數(shù)據(jù)倉庫后臺(tái)數(shù)據(jù)庫比較產(chǎn)品供應(yīng)商產(chǎn)品供應(yīng)商數(shù)據(jù)庫產(chǎn)品數(shù)據(jù)庫產(chǎn)品效率效率兼容性兼容性管理管理磁盤空間磁盤空間OracleOracle優(yōu)IBMDB2優(yōu)MicrosoftSQL Server優(yōu)SASTeradataTeradata差差SybaseSybase IQ優(yōu)優(yōu)SAPETL技術(shù) 數(shù)據(jù)倉庫系統(tǒng)是集成的、與時(shí)間相關(guān)的數(shù)據(jù)集合,ETL作為數(shù)據(jù)倉庫的核心,負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)進(jìn)行抽取、清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫或
16、數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。ETL能夠按照統(tǒng)一的規(guī)則集成并提高數(shù)據(jù)的價(jià)值,是負(fù)責(zé)完成數(shù)據(jù)從數(shù)據(jù)源向目標(biāo)數(shù)據(jù)倉庫轉(zhuǎn)化的過程,是實(shí)施數(shù)據(jù)倉庫的重要步驟。要實(shí)現(xiàn)數(shù)據(jù)倉庫中數(shù)據(jù)的自動(dòng)更新運(yùn)轉(zhuǎn),ETL技術(shù)是必不可少的關(guān)鍵技術(shù)之一。產(chǎn)品供應(yīng)商產(chǎn)品供應(yīng)商ETL 工具工具特點(diǎn)特點(diǎn)OracleOracle Warehouse Builder (OWB)數(shù)據(jù)倉庫組件IBMIBM WebSphere DataStage整個(gè)ETL過程提供了一個(gè)圖形化的開發(fā)環(huán)境,支持對(duì)多種操作數(shù)據(jù)源的數(shù)據(jù)抽取、轉(zhuǎn)換和維護(hù),并將其輸入數(shù)據(jù)集或數(shù)據(jù)倉庫MicrosoftIntegration Services數(shù)據(jù)倉庫組件
17、SASETL Studio管理ETL流程和建立數(shù)據(jù)倉庫、數(shù)據(jù)集市和OLAP結(jié)構(gòu)的單控制點(diǎn)TeradataETL Automation利用Teradata數(shù)據(jù)庫本身的并行處理能力,通過SQL語句實(shí)現(xiàn)數(shù)據(jù)的轉(zhuǎn)換,提供對(duì)ETL流程的支持,包括前后依賴、執(zhí)行和監(jiān)控等SybaseData Integration Suite數(shù)據(jù)倉庫組件SAPData Integrator數(shù)據(jù)倉庫組件InformaticaPowerCenter二次開發(fā)、集成和開放性強(qiáng)于其它OLAP技術(shù) 聯(lián)機(jī)分析處理(OLAP)是針對(duì)特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析,通過對(duì)信息進(jìn)行快速、穩(wěn)定、一致和交互式的存取,對(duì)數(shù)據(jù)進(jìn)行多層次、多階段的分析處
18、理,以獲得高度歸納的分析結(jié)果。聯(lián)機(jī)事務(wù)處理(OLTP)已不能滿足終端用戶對(duì)數(shù)據(jù)庫查詢分析的需要,SQL對(duì)大數(shù)據(jù)庫進(jìn)行的簡(jiǎn)單查詢也不能滿足用戶分析的需求。用戶的決策分析需要對(duì)關(guān)系數(shù)據(jù)庫進(jìn)行大量計(jì)算才能得到結(jié)果,而查詢的結(jié)果并不能滿足決策者提出的需求,由此出現(xiàn)了多維數(shù)據(jù)庫和多維分析的概念。產(chǎn)品供應(yīng)商產(chǎn)品供應(yīng)商OLAP產(chǎn)品產(chǎn)品OLAP分析工分析工具具數(shù)據(jù)庫數(shù)據(jù)庫特點(diǎn)特點(diǎn)OracleExpress/Discoverer支持DB2,Oracle,SQL Server,Sybase等對(duì)自己的數(shù)據(jù)庫產(chǎn)品的支持均好于其它數(shù)據(jù)庫,分析工具基于開放的OLE DB標(biāo)準(zhǔn),可以訪問支持OLE DB標(biāo)準(zhǔn)的數(shù)據(jù)立方體IBM
19、COGNOSMicrosoftAnalysis ServicesSASOLAP ServerTeradata提供了相關(guān)技術(shù),用于提升運(yùn)行于Teradata數(shù)據(jù)庫上的OLAP應(yīng)用系統(tǒng)的性能SybasePower Dimension標(biāo)準(zhǔn)OLAP API能夠?qū)icrosoft、IBM等OLAP數(shù)據(jù)進(jìn)行劃分、鉆取等處理,兼容第三方報(bào)表和展現(xiàn)工具SAPOLAP Intelligence報(bào)表技術(shù) 報(bào)表技術(shù)主要是將集成在數(shù)據(jù)模型里的數(shù)據(jù),按照復(fù)雜的格式、指定行列統(tǒng)計(jì)項(xiàng),計(jì)算形成的特殊表格。一般的簡(jiǎn)單報(bào)表可以使用通用的前臺(tái)展現(xiàn)技術(shù)實(shí)現(xiàn),而復(fù)雜的報(bào)表則需要使用特定的報(bào)表技術(shù)。主流的報(bào)表技術(shù)都可以靈活的制定各種
20、報(bào)表模版庫和指標(biāo)庫,并根據(jù)每個(gè)區(qū)塊或單元格的需要引用指標(biāo),實(shí)現(xiàn)一系列復(fù)雜的符合要求的報(bào)表的自動(dòng)生成。產(chǎn)品供應(yīng)商產(chǎn)品供應(yīng)商報(bào)表工具報(bào)表工具特點(diǎn)特點(diǎn)OracleOracle Reports提供了自由的數(shù)據(jù)格式方式,可以自動(dòng)生成個(gè)性化字母或矩陣風(fēng)格的布局,包括動(dòng)態(tài)、數(shù)據(jù)驅(qū)動(dòng)的圖表IBMCOGNOS覆蓋了各種報(bào)表需求,包括管理報(bào)表、商業(yè)報(bào)表、賬單和發(fā)票等?;贠lap server 實(shí)現(xiàn)查詢分析操作.MicrosoftReporting Services (SSRS)(含)處理組件、一整套可用于創(chuàng)建和管理報(bào)表的工具、在自定義應(yīng)用程序中集成和擴(kuò)展數(shù)據(jù)和報(bào)表處理的APISASReport Studio功能
21、、性能、二次開發(fā)等方面都還存在著一定的差距TeradataBTEQSybaseInfoMakerSAPCrystal Reports提供了一個(gè)完整的企業(yè)報(bào)表解決方案Crystal Reports Server,支持通過Web快速便捷的創(chuàng)建、管理和交付報(bào)表數(shù)據(jù)挖掘技術(shù) 當(dāng)數(shù)據(jù)積累到一定數(shù)量時(shí),某些潛在聯(lián)系、分類、推導(dǎo)結(jié)果和待發(fā)現(xiàn)價(jià)值隱藏在其中,可以使用數(shù)據(jù)發(fā)掘工具幫助發(fā)現(xiàn)這些有價(jià)值的數(shù)據(jù)。數(shù)據(jù)挖掘就是從海量數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又可能有用的信息和知識(shí)的過程。通過數(shù)據(jù)挖掘能找出數(shù)據(jù)庫中隱藏的信息,實(shí)現(xiàn)用模型來擬合數(shù)據(jù)、探索型數(shù)據(jù)分析,數(shù)據(jù)驅(qū)動(dòng)型的發(fā)現(xiàn),演繹型學(xué)習(xí)等功能。產(chǎn)品供
22、應(yīng)商產(chǎn)品供應(yīng)商挖掘工具挖掘工具特點(diǎn)特點(diǎn)OracleOracle Data Miner提供圖形用戶界面,通過向?qū)碇笇?dǎo)完成數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、模型評(píng)估和模型評(píng)價(jià)過程,根據(jù)需要自動(dòng)生成將數(shù)據(jù)挖掘步驟轉(zhuǎn)換成一個(gè)集成的數(shù)據(jù)挖掘/BI應(yīng)用程序所需的代碼IBMIBM Intelligent Miner數(shù)據(jù)集自動(dòng)生成、關(guān)聯(lián)發(fā)現(xiàn)、序列規(guī)律發(fā)現(xiàn)、概念性分類和可視化呈現(xiàn),可以自動(dòng)實(shí)現(xiàn)數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)發(fā)掘和結(jié)果呈現(xiàn)這一整套數(shù)據(jù)發(fā)掘操作Microsoft數(shù)據(jù)挖掘平臺(tái)不同于傳統(tǒng)數(shù)據(jù)挖掘應(yīng)用程序,它支持組織中數(shù)據(jù)的整個(gè)開發(fā)生命周期,允許第三方添加自定義算法以支持特定的挖掘需求,支持實(shí)時(shí)根據(jù)挖掘的數(shù)據(jù)集進(jìn)行數(shù)據(jù)驗(yàn)證
23、。SASSAS Enterprise Miner數(shù)據(jù)挖掘過程簡(jiǎn)單流程化,支持關(guān)聯(lián)、聚類、決策樹、神經(jīng)元網(wǎng)絡(luò)和經(jīng)典的統(tǒng)計(jì)回歸技術(shù)TeradataTeradata Warehouse Miner將數(shù)據(jù)挖掘技術(shù)整合到數(shù)據(jù)倉庫來簡(jiǎn)化數(shù)據(jù)挖掘流程,還可實(shí)現(xiàn)將多家廠商的數(shù)據(jù)挖掘技術(shù)嵌入Teradata企業(yè)級(jí)數(shù)據(jù)倉庫環(huán)境中運(yùn)行Sybase無SAP無數(shù)據(jù)倉庫 數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念 數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系結(jié)構(gòu) 主流數(shù)據(jù)倉庫產(chǎn)品對(duì)比分析 實(shí)例介紹實(shí)例介紹 1、數(shù)據(jù)建模 2、ETL過程 3、Cognos8 4、與Portal整合數(shù)據(jù)倉庫創(chuàng)建過程 1、數(shù)據(jù)建模、數(shù)據(jù)建模 2、ETL過程 3、Co
24、gnos8 4、與Portal整合數(shù)據(jù)建模 業(yè)務(wù)梳理 整理并提取出維度、度量和事實(shí)表 建立模型數(shù)據(jù)建模-業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫結(jié)構(gòu) 關(guān)系型數(shù)據(jù)庫1.指標(biāo)表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額001001203010120080101301010120333.00 2.計(jì)劃表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額0010012030101200801013010101444.00 3.支付表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額0010012030101200801013010101333.00 模型-星型模型預(yù)算單位預(yù)算單位功能分類功能分類指標(biāo)來源指標(biāo)來源資金性質(zhì)資金性質(zhì)業(yè)務(wù)處室業(yè)
25、務(wù)處室指標(biāo)類型指標(biāo)類型預(yù)算項(xiàng)目預(yù)算項(xiàng)目支付方式支付方式數(shù)據(jù)建模過程 業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫數(shù)據(jù)倉庫數(shù)據(jù)倉庫1.指標(biāo)表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額001001203010120080101301010120333.00 2.計(jì)劃表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額0010012030101200801013010101444.00 3.支付表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額0010012030101200801013010101333.00 數(shù)據(jù)倉庫創(chuàng)建過程 1、數(shù)據(jù)建模 2、ETL過程 3、Cognos8 4、與Portal整合ETL的本質(zhì) ETL代表抽取(Ext
26、ract),轉(zhuǎn)換(Transform),裝載(Load ),ETL的過程就是數(shù)據(jù)流動(dòng)的過程,從不同的異構(gòu)數(shù)據(jù)源流向統(tǒng)一的目標(biāo)數(shù)據(jù),其間,數(shù)據(jù)的抽取、清洗、轉(zhuǎn)換和裝載形成串行或并行的過程 。數(shù)據(jù)倉庫中ETL的特點(diǎn) 數(shù)據(jù)同步 ETL周期性的,經(jīng)常性的活動(dòng),不是一次性完成的。 數(shù)據(jù)量 ETL的數(shù)據(jù)量一般都是巨大的,值得將數(shù)據(jù)流動(dòng)過程拆分為E、T、L。項(xiàng)目實(shí)施中ETL的特點(diǎn) 實(shí)施時(shí)間長(zhǎng) 整個(gè)項(xiàng)目實(shí)施工作量的60%70% 過程復(fù)雜 貫穿整個(gè)業(yè)務(wù)建模和存儲(chǔ)的整個(gè)過程 決定項(xiàng)目成敗的關(guān)鍵 數(shù)據(jù)的準(zhǔn)確性、過程的執(zhí)行成功與否ETL設(shè)計(jì)策略 切實(shí)可行的ETL設(shè)計(jì)策略 抽取策略 在數(shù)據(jù)抽取分析時(shí)需要對(duì)業(yè)務(wù)深刻理解不
27、能簡(jiǎn)單的了解,哪一個(gè)表取不是隨便的、簡(jiǎn)單的,一定要理解其中的含義這就需要對(duì)業(yè)務(wù)非常的清楚 轉(zhuǎn)換策略 將數(shù)據(jù)由原來的格式轉(zhuǎn)換成數(shù)據(jù)倉庫格式 。包括數(shù)據(jù)格式轉(zhuǎn)換數(shù)據(jù)類型、轉(zhuǎn)換數(shù)據(jù)匯總計(jì)算、數(shù)據(jù)拼接等等,但這些工作可以在不同的過程中處理視具體情況而定比如可以在數(shù)據(jù)抽取時(shí)轉(zhuǎn)換可以在數(shù)據(jù)加載時(shí)轉(zhuǎn)換 裝載策略維表加載策略事實(shí)表加載策略引用約束問題數(shù)據(jù)倉庫創(chuàng)建過程 1、數(shù)據(jù)建模、數(shù)據(jù)建模 2、ETL過程 3、Cognos 4、與Portal整合COGNOS主要模塊 Query Studio 查詢:自助報(bào)表生成工具查詢:自助報(bào)表生成工具 Report Studio 查詢:專有報(bào)表構(gòu)筑工具查詢:專有報(bào)表構(gòu)筑工具
28、 Analysis Studio 分析:多維數(shù)據(jù)展示工具分析:多維數(shù)據(jù)展示工具 Transformer 分析:多維數(shù)據(jù)設(shè)計(jì)工具分析:多維數(shù)據(jù)設(shè)計(jì)工具 Framework Manager 查詢:業(yè)務(wù)數(shù)據(jù)組織工具查詢:業(yè)務(wù)數(shù)據(jù)組織工具幾個(gè)模塊在Cognos體系中的位置 應(yīng)用應(yīng)用(Consumer) 專業(yè)專業(yè) (profession)查詢查詢Query StudioReport StudioFramework Manager分析分析Analysis StudioTransformerFramework Manager Framework Manager是一個(gè)元數(shù)據(jù)建模工具,它使用數(shù)據(jù)查詢來獲取數(shù)據(jù),
29、模型中能包含多個(gè)數(shù)據(jù)源的各種物理信息和業(yè)務(wù)信息的元數(shù)據(jù),以滿足報(bào)表顯現(xiàn)和數(shù)據(jù)分析的需要。Framework Manager能根據(jù)業(yè)務(wù)需求創(chuàng)建面向報(bào)表的關(guān)系型,或面向OLAP分析和報(bào)表的維度化建模關(guān)系型(DMR) 。Framework Manager工作流程 Framework Manager將生成的模型發(fā)布到Content Store中,這些模型為Tansformer或前端展現(xiàn)工具提供數(shù)據(jù)服務(wù)。幾個(gè)模塊在Cognos體系中的位置 應(yīng)用應(yīng)用(Consumer) 專業(yè)專業(yè) (profession)查詢查詢Query StudioReport StudioFramework Manager分析分析A
30、nalysis StudioTransformerTransformer Transformer是Cognos BI的數(shù)據(jù)建模工具,用戶能使用它建立一個(gè)多數(shù)據(jù)源的多維業(yè)務(wù)模型。在選定了語言、維度、度量和業(yè)務(wù)視圖后,Transformer將以這些條件建立數(shù)據(jù)方(pq),這些數(shù)據(jù)方被發(fā)布到Cognos的Content Store中后,前端展現(xiàn)工具,如Analysis Studio等,能圍繞這些PwoerCube進(jìn)行各種OLAP分析。Transformer的工作界面理解Cognos Connection Cognos Connection 是Cognos8的門戶。Query Studio,Repor
31、t Studio 和Analysis Studio的入口都被組織在了這個(gè)門戶中。 進(jìn)入門戶:http:/ /Cognos8 在Cognos Connection 門戶中可以: (1)創(chuàng)建和運(yùn)行報(bào)表 (2)執(zhí)行管理性任務(wù),例如調(diào)度報(bào)表 可以通過在文件夾中創(chuàng)建和儲(chǔ)存條目來對(duì)Cognos Connection 中的數(shù)據(jù)進(jìn)行組織。Cognos的工作區(qū)Query Studio 應(yīng)用應(yīng)用(Consumer) 專業(yè)專業(yè) (profession)查詢查詢Query StudioReport StudioFramework Manager分析分析Analysis StudioTransformerQuery S
32、tudio Query Studio是業(yè)務(wù)人員即時(shí)查詢數(shù)據(jù)的日常工具,此工具一般使用直接數(shù)據(jù)源,可以對(duì)業(yè)務(wù)系統(tǒng)或數(shù)據(jù)倉庫中的某類或某條明細(xì)信息進(jìn)行檢索,可將這些查詢保存,以供日后再次使用。此工具提供了最簡(jiǎn)單的非正式的報(bào)表功能,報(bào)表在設(shè)計(jì)的同時(shí)即展現(xiàn)出報(bào)表結(jié)果。進(jìn)入Query Studio在在Query Studio中創(chuàng)建報(bào)表中創(chuàng)建報(bào)表Report Studio 應(yīng)用應(yīng)用(Consumer) 專業(yè)專業(yè) (profession)查詢查詢Query StudioReport StudioFramework Manager分析分析Analysis StudioTransformerReport Stu
33、dio Report Studio是用來制作更加精細(xì)的專有報(bào)表的工具,專有報(bào)表的設(shè)計(jì)和運(yùn)行兩個(gè)過程是分開的。Report Studio中能夠建立列表,交叉表,圖表等各種類型的報(bào)表,并能實(shí)現(xiàn)報(bào)表的鉆取功能。對(duì)于報(bào)表的數(shù)據(jù)源,可以設(shè)置復(fù)雜的匯總、過濾、分組、重新計(jì)算等操作。表樣可精細(xì)加工成用戶所需要的樣式。進(jìn)入Report Studio用Report Studio創(chuàng)建報(bào)表Report Studio交叉表界面交叉表界面定義交叉表行定義交叉表列定義交叉表度量交叉表運(yùn)行效果表樣一:預(yù)算指標(biāo)執(zhí)行情況表表樣二:用款計(jì)劃執(zhí)行情況表表樣三:預(yù)算支出情況表圖表結(jié)合報(bào)表 第一步 先制定相應(yīng)的交叉表n第二步 插入圖圖表結(jié)合報(bào)表表樣四:部門月度計(jì)劃表樣五:業(yè)務(wù)數(shù)據(jù)對(duì)比表樣六:業(yè)務(wù)指標(biāo)對(duì)比Analysis Studio 應(yīng)用應(yīng)用(Consumer) 專業(yè)專業(yè) (profession)查詢查詢Query StudioReport StudioFramework Manager分析分析Analysis StudioTran
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 實(shí)際操作的營養(yǎng)師試題及答案
- 采訪目的試題及答案
- 國畫技法試題大全及答案
- 地震安全考試試題及答案
- 永州市新田縣輔警考試公安基礎(chǔ)知識(shí)考試真題庫及答案
- 湛江市赤坎區(qū)輔警招聘公安基礎(chǔ)知識(shí)題庫附含答案
- 浙江會(huì)計(jì)從業(yè)資格考試電算化模擬試卷及答案
- 長(zhǎng)沙市長(zhǎng)沙縣輔警考試公安基礎(chǔ)知識(shí)考試真題庫及參考答案
- 2025年政治理論時(shí)政熱點(diǎn)知識(shí)試題庫(含答案)
- 國企人力考試試題及答案
- 如何做部門管理和運(yùn)營匯報(bào)
- 2025年發(fā)酵飲料行業(yè)研究報(bào)告及未來行業(yè)發(fā)展趨勢(shì)預(yù)測(cè)
- 2025-2030中國建筑行業(yè)專利技術(shù)布局與創(chuàng)新成果轉(zhuǎn)化研究
- 合同變更協(xié)議(收款賬戶變更)
- 2025年馬口鐵包裝容器行業(yè)當(dāng)前市場(chǎng)規(guī)模及未來五到十年發(fā)展趨勢(shì)報(bào)告
- 2024版電網(wǎng)典型設(shè)計(jì)10kV配電站房分冊(cè)
- 《SPSS與AMOS在中介效應(yīng)與調(diào)節(jié)效應(yīng)分析中的應(yīng)用》
- 家屬院停車管理暫行辦法
- 錫圓電子科技有限公司高端半導(dǎo)體封測(cè)項(xiàng)目環(huán)評(píng)資料環(huán)境影響
- T/CGAS 031-2024城鎮(zhèn)燃?xì)饧映艏夹g(shù)要求
- T/CGAS 026.2-2023瓶裝液化石油氣管理規(guī)范第2部分:平臺(tái)建設(shè)
評(píng)論
0/150
提交評(píng)論