BI-數(shù)據(jù)倉庫基礎(chǔ)_第1頁
BI-數(shù)據(jù)倉庫基礎(chǔ)_第2頁
BI-數(shù)據(jù)倉庫基礎(chǔ)_第3頁
BI-數(shù)據(jù)倉庫基礎(chǔ)_第4頁
BI-數(shù)據(jù)倉庫基礎(chǔ)_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1

RT

BusinessIntelligence,即商業(yè)智能,商務(wù)智能綜合企業(yè)所有沉淀下來的信息,用科學(xué)的分析方法,為企

業(yè)領(lǐng)導(dǎo)提供科學(xué)決策信息的過程。

BOSS業(yè)務(wù)運營支撐系

BPM企業(yè)績效管理

BPR業(yè)務(wù)流程重整

CRM客戶關(guān)系管理

CUBE立方體

DM(Datamart)數(shù)據(jù)集市數(shù)據(jù)倉庫的子集,它含有較少的主題域且歷史時間更短數(shù)據(jù)量更少,一般只能為某個

局部范圍內(nèi)的管理人員效勞,因此也稱之為部門級數(shù)據(jù)倉庫。

DM(DataMine)數(shù)據(jù)挖掘

DSS決策支持系統(tǒng)

EDM企業(yè)數(shù)據(jù)模型

3

ERP

EnterpriseResoursePlanning企業(yè)資源規(guī)劃。它是一個以管理會計為核心的信息系統(tǒng),

識別和規(guī)劃企業(yè)資源,從而獲取客戶訂單,完成加工和交付,最后得到客戶付款。換言

之,ERP將企業(yè)內(nèi)部所有資源整合在一起,對人十采購、生產(chǎn)、本錢、庫存、分箱、運輸、

財務(wù)、人力資源進(jìn)行規(guī)劃,從而到達(dá)最正確資源組合,取得最正確效益。

4

ETL

數(shù)據(jù)抽取(Extract)、轉(zhuǎn)換(Transform)、清洗(Cleansing)、裝載(Load)的過

程。構(gòu)建數(shù)據(jù)倉庫的重要一環(huán),用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗,最終

按照預(yù)先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。

KDD數(shù)據(jù)庫中知識發(fā)現(xiàn)

5KPI

企業(yè)關(guān)鍵業(yè)績指標(biāo)(KPI:KeyProcessIndication)是通過對組織內(nèi)部流程的輸入端、輸出

端的關(guān)鍵參數(shù)進(jìn)行設(shè)置、取樣、計算、分析,衡供流程績效的一種目標(biāo)式量化管理指標(biāo),

是把企業(yè)的戰(zhàn)略目標(biāo)分解為可操作的工作FI標(biāo)的工具,是企業(yè)績效管理的基礎(chǔ)。

LDM邏輯數(shù)據(jù)模型

6MDD

多維數(shù)據(jù)庫(MultiDimesionalDatabase,MDD)可以簡單地理解為:將數(shù)據(jù)存放在一

個n維數(shù)組中,而不是像關(guān)系數(shù)據(jù)庫那樣以記錄的形式存放。因此它存在大量稀疏矩陣,

人們可以通過多維視圖來觀察數(shù)據(jù)。多維數(shù)據(jù)庫增加了一個時間維,與關(guān)系數(shù)據(jù)庫相比,

它的優(yōu)勢在于可以提高數(shù)據(jù)處理速度,加快反應(yīng)時間,提高查詢效軋______________

Metadata(元數(shù)據(jù)),它是“關(guān)于數(shù)據(jù)的數(shù)據(jù),其內(nèi)容主要包括數(shù)據(jù)倉庫的數(shù)據(jù)字典、數(shù)據(jù)的定義、數(shù)據(jù)的抽取規(guī)

則、數(shù)據(jù)的轉(zhuǎn)換規(guī)則、數(shù)據(jù)加載頻率等信息。

M0LAP自行建立了多維數(shù)據(jù)庫,來存放聯(lián)機(jī)分析系統(tǒng)數(shù)據(jù)

7ODS(四個特點)

(OprationalDataStore)操作型數(shù)據(jù)存儲,是建立在數(shù)據(jù)準(zhǔn)備區(qū)和數(shù)據(jù)倉庫之間的一個部件。月來滿足企業(yè)集

成的、綜合的操作型處理需要,操作數(shù)據(jù)存儲是個可選的部件。對于一些準(zhǔn)實時的業(yè)務(wù)數(shù)據(jù)庫當(dāng)中的數(shù)據(jù)的暫時

存儲,支持一些同時關(guān)連到歷史數(shù)據(jù)與實時數(shù)據(jù)分析的數(shù)據(jù)暫時存儲區(qū)域。

8什么是數(shù)據(jù)集市DM

數(shù)據(jù)集市可以看作是數(shù)據(jù)倉庫的一個子集,它含有較少的主題域且歷史時間更短數(shù)據(jù)量更少,一般只能為某個局

部范圍內(nèi)的管理人員效勞.因此也稱之為部門級數(shù)據(jù)倉庫C

二數(shù)據(jù)倉庫

DW

Datawarchousc,數(shù)據(jù)倉庫是?個集合或過程,4要素面向主題,集成,時間相關(guān)(反映歷史變化),(穩(wěn)定)

不可修改的數(shù)據(jù)集合。

數(shù)據(jù)倉庫是在企業(yè)管理和決策中面向主題的、集成的、與時間相關(guān)的、不可修改的數(shù)據(jù)集合。與其他數(shù)據(jù)庫應(yīng)用

不同的是,數(shù)據(jù)倉庫更像一種過程,對分布在企業(yè)內(nèi)部各處的業(yè)務(wù)數(shù)據(jù)的整合、加工和分析的過程。

特點傳統(tǒng)操作型數(shù)據(jù)庫數(shù)據(jù)倉庫

面向主題菜市場1超市

按功能來分類按類型分類

每一個模塊就如一個小攤位,蘿卜,如都為利潤的分為一個事實表

青菜都有事實表和維表的分類

集成的與特定的應(yīng)用相關(guān),數(shù)據(jù)庫之間獨有聯(lián)系,ETL的過程已經(jīng)是將多個數(shù)據(jù)

立的庫聯(lián)系統(tǒng)一,去除之間的不一致性。

相對穩(wěn)定通常實時更新,數(shù)據(jù)根據(jù)需要及時供企業(yè)決策分析之用,數(shù)據(jù)操作主要是

發(fā)生變化數(shù)據(jù)查詢,一旦某個數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫

以后,一般情況下將被長期保存,也就

是數(shù)據(jù)倉庫中一般有大量的查詢操作,

但修改和刪除操作很少,通常定期的加

載、刷新。

反映歷史變主要關(guān)心當(dāng)前某一個時間段內(nèi)的數(shù)包含歷史信息,系統(tǒng)記錄/企業(yè)從過去

化據(jù)某一時點

下列圖是一個典型的企業(yè)數(shù)據(jù)倉庫系統(tǒng),通常包含數(shù)據(jù)源、數(shù)據(jù)存儲與管理、數(shù)據(jù)的訪問I三個局部:

最為重要的一張圖

這張圖可以看出四個型中L面向?qū)ο?集成,

數(shù)據(jù)源:是指企業(yè)炭作型數(shù)據(jù)庫中的各種生產(chǎn)運營數(shù)據(jù)即OLIP

數(shù)據(jù)的存儲與管理:數(shù)據(jù)倉庫的存儲主要由元數(shù)據(jù)的存儲及數(shù)據(jù)的存儲兩局部組

成。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)?,其內(nèi)容主要包括數(shù)據(jù)倉庫的數(shù)據(jù)字典、數(shù)據(jù)的定義、數(shù)

據(jù)的抽取規(guī)則、數(shù)據(jù)的轉(zhuǎn)換規(guī)則、數(shù)據(jù)加載頻率等信息。各操作數(shù)據(jù)庫中的數(shù)據(jù)按照元

數(shù)據(jù)庫中定義的規(guī)則,經(jīng)過抽取、清理、轉(zhuǎn)換、集成,按照主題重新組織,依照相應(yīng)的

存儲結(jié)構(gòu)進(jìn)行存儲

數(shù)據(jù)的訪問:由OLAP(聯(lián)機(jī)分析處理)、數(shù)據(jù)挖掘、統(tǒng)計報表、即席查詢等兒局部組

成。例如OLAP:針對特定的分析主題,設(shè)計多種可能的觀察形式,設(shè)計相應(yīng)的分析主題

結(jié)構(gòu)(即進(jìn)行事實表和維表的設(shè)計),使管理決策人員在多維數(shù)據(jù)模型的基礎(chǔ)上進(jìn)行快

速、檢定和交互性的訪問,并進(jìn)行各種復(fù)雜的分析和預(yù)測工作。

按照存儲方式來分,OLAP可以分成M0LAP以及ROLAP等方式,

MOLAP(Multi-DimensionOLAP)將OLAP分析所需的數(shù)據(jù)存放在多維數(shù)據(jù)庫中。分析主題的數(shù)據(jù)可以形成一個或多

個多維立方體。

ROLAP(RelationalOLAP)將OLAP分析所需的數(shù)據(jù)存放在關(guān)系型數(shù)據(jù)庫中。分析主題的數(shù)據(jù)以“事實表-維表〃的

星型模式組織。

三企業(yè)信息工廠

OLAP

Client

企業(yè)信息工廠(CorporateInformationFactory,簡稱EIF)是一種構(gòu)建數(shù)據(jù)倉庫的架構(gòu)。

企業(yè)信息工廠主要包括五個集成轉(zhuǎn)換層(I&T)、操作數(shù)據(jù)存儲(0DS)、企業(yè)級數(shù)據(jù)倉

庫(EDW)、數(shù)據(jù)集市(DM)、探索倉庫(EW)等部件。這些部件芍機(jī)的結(jié)合在一起,

為企業(yè)提供信息效勞。

企業(yè)級數(shù)據(jù)倉庫是企業(yè)信息工廠的核心部件,用來保存整個企業(yè)的數(shù)據(jù)。一般,也

稱數(shù)據(jù)倉庫,是用來滿足企業(yè)戰(zhàn)略決策的需要。數(shù)據(jù)倉庫的數(shù)據(jù)來自數(shù)據(jù)準(zhǔn)備區(qū)和操作

數(shù)據(jù)存儲。

數(shù)據(jù)集市

的數(shù)據(jù)來源是數(shù)據(jù)倉庫。企業(yè)信息工廠中的數(shù)據(jù)集市一般來說是非標(biāo)準(zhǔn)化的、定制的和

匯總的。而多維體系架構(gòu)中的數(shù)據(jù)集市分為兩種,分別是原子數(shù)據(jù)集市和聚集數(shù)據(jù)集市。

一般來說,企業(yè)信息工廠中的數(shù)據(jù)集市相當(dāng)于多維體系架構(gòu)中的聚集數(shù)據(jù)集市。

企業(yè)信息工廠中的數(shù)據(jù)流向一般是從源系統(tǒng)到數(shù)據(jù)準(zhǔn)備區(qū)到操作數(shù)據(jù)存儲到數(shù)據(jù)

倉庫到數(shù)據(jù)集市

維Dimension

維,是人們觀察數(shù)據(jù)的特定角度,是考慮問題時的一類屬性,屬性集合構(gòu)成一個維C商店、時間和產(chǎn)品都是維c

各個商店的集合是一個維,時間的集合是一個維,商品的集合也是一個維。

代理關(guān)鍵字(維ID)

代理關(guān)鍵字一般是指維度表中使用J順序(序列)分配的整數(shù)值作為主鍵,也稱為“代理鍵”。

代理關(guān)鍵字用于維度表和事實表的連接。

使用代理關(guān)鍵字可以用來處理緩慢變化維,維度表數(shù)據(jù)的歷史變化信息的保存是

數(shù)據(jù)倉庫設(shè)計的實施中非常重要的一局部。Kimball的緩慢變化維處理策略的核心就是

使用代理關(guān)鍵字。

優(yōu)點

1緩沖

2性能

3建不存在的維度記錄

4緩慢變化維處理

緩慢變化維(能力的表達(dá))

隨著時間的流失發(fā)生緩慢的變化

處理緩慢變化維的方法通常有三種方式:

第一種方式是直接覆蓋原值。這樣處理,最容易實現(xiàn),但是沒有保存歷史數(shù)據(jù),無

法分析歷史變化信號。第一?種方式通常簡稱為“TYPE1"。

第二種方式是添加維度行。這樣處理,需要代理鍵的支持。實現(xiàn)方式是當(dāng)有維度屬

性發(fā)生變化時,生成一條新的維度記錄,主鍵是新分配的代理鍵,通過自然鍵可以和原

維度記錄保持關(guān)聯(lián)不三種方式通常簡稱為“TYPE2〃。

第三種方式是添加屬性列,這種處理的實現(xiàn)方式是對于需要分析歷史信息的屬性添

加一列,來記錄該屬性變化前的值,而本屬性字段使用TYPE1來直接覆蓋。這種方式

的優(yōu)點是可以同時分析當(dāng)前及前一次變化的屬性值,缺點是只保存了最后一次變化信

息。第三種方式通常簡稱為“TYPE3"。

退化維度

事實表中的局部ID如訂單號,但他沒有對應(yīng)的維度表,這編號稱為退化維

微型維度

為了解決快變超大維度,解決的方法是,將分析頻率比較面或者變化

頻率匕較大的字段提取出來,建立一個單獨的維度表。這個單獨的維度表就是微型維度

表。

多維體系結(jié)構(gòu)(MD)中的三個關(guān)鍵性概念,

一致性維度,總線架構(gòu)(BusArchitecture)和一致性事實(ConformedFact)

一致性維度

解決數(shù)據(jù)倉庫的集成問題

在多維體系結(jié)構(gòu)中,沒有物理上的數(shù)據(jù)倉庫,由物理上的數(shù)據(jù)集市組合成邏輯上的

數(shù)據(jù)倉庫。而且數(shù)據(jù)集市的建立是可以逐步完成的,最終組合在一起,成為一個數(shù)據(jù)倉

庫。如果分步建立數(shù)據(jù)集市的過程出現(xiàn)了問題,數(shù)據(jù)集市就會變成孤立的集市,不能組

合成數(shù)據(jù)倉庫,而一致性維度的提出正式為了解決這個問題。

一致性維度的范圍是總線架構(gòu)中的維

一致性維度建立的地點是多維體系結(jié)構(gòu)的后臺(BackRoom),即數(shù)據(jù)準(zhǔn)備區(qū)。

在同一個集市內(nèi),一致性維度的意思是兩個維度如果有關(guān)系

事實表

,主要有三種事實表,分別是事務(wù)粒度事實表

(TransactionGrainFactTable),周期快照粒度事實表(PeriodicSnapshotGrainFact

Table)和累積快照粒度事實表(AccumulatingSnapshotGrainFactTable);從用途

的不同來說,事實表可以分為三類,分別是原子事實表,聚集事實表和合并事實表。

粒度分類

事務(wù)事實表(Transactionfacttable)記錄的事務(wù)層面的事實,保存的是最原子的數(shù)

據(jù),也稱“原子事實表"

周期快照事實表(Periodicsnapshotfacttab1e)以具有規(guī)律性的、可預(yù)見的時間間

隔來記錄事實,時間間隔如每天、每月、每年等等

用途分類

聚集事實表(AggregatedFactTable)是原子事實表上的匯總數(shù)據(jù),也稱為匯總事

實表如只有月度維,求和,平均值筆

合并事實表

建立一個事實表,它的維度是兩個或多個事實表的相同維度的集合

聚集事實表和合并事實表的主要差異是合并事實表一般是從多個事實表合并而來。

但是它們的差異不是絕對的,一個事實表既是聚集事實表乂是合并事實表是很有可能

的。因為?般合并事實表需要按相向的維度合并,所以很可能在做合并的同時需要進(jìn)行

聚集,即粒度變粗。

非重點

預(yù)連接聚集表(pre-joinedaggregagletable)是通過對事實表和維度表的聯(lián)合查詢

而生成的一類匯總表。在預(yù)連接聚集表中,保存有維度表中的描述信息和事實表的事實

值。

切片事實表

切片事實表的結(jié)構(gòu)與相對應(yīng)的基礎(chǔ)表相同,數(shù)據(jù)來源:相對應(yīng)的基礎(chǔ)表。切片事實

表由于縮小「表中數(shù)據(jù)的記錄數(shù),所以查詢的效率得到了很大的提高

娛蚣事實表

)是指那些一張事實表中有太多維度的事實表事實表相關(guān)的維度在15個以下為正常,如果維度個數(shù)超過25個,

就出現(xiàn)

了維度過多的娛蚣事實表

一致性事實

一致性事實和一致性維度有些不同,一致性維度是由專人維護(hù)在后臺(BackRoom),

發(fā)生修改時同步復(fù)制到每個數(shù)據(jù)集市,而事實表一般不會在多個數(shù)據(jù)集市間復(fù)制。需要

查詢多個數(shù)據(jù)集市中的事實時,一般通過交叉探查(drillacross)來實現(xiàn)。

1.5數(shù)據(jù)集市

即席查詢

即席查詢的位置通常是在關(guān)系型的數(shù)據(jù)倉庫中

ODS:操作數(shù)據(jù)存儲(ODS)

是面向主題的、集成的、可變的、反映當(dāng)前數(shù)據(jù)值的和詳細(xì)的數(shù)據(jù)的集合,用來滿足企

業(yè)綜合的、集成的以及操作型的處理需求。

個人不建議ODS保存相當(dāng)長周期的數(shù)據(jù),同樣

ODS中的數(shù)據(jù)也盡量不做轉(zhuǎn)換,而是原封不動地與業(yè)務(wù)數(shù)據(jù)庫保持一致。即ODS只是

業(yè)務(wù)數(shù)據(jù)庫的一個備份或者映像,目的是為了使數(shù)據(jù)倉庫的處理和決策支持要求與

OLTP系統(tǒng)相隔離,減少決策支持要求對OLTP系統(tǒng)的影響。

ODS的四個作用

1在業(yè)務(wù)系統(tǒng)和數(shù)據(jù)倉庫之間形成?個隔離層

2分擔(dān)轉(zhuǎn)移一局《業(yè)務(wù)系統(tǒng)細(xì)節(jié)蟹的功能

3完成數(shù)據(jù)倉庫中不能完成的一些功能

ODS是細(xì)節(jié)數(shù)據(jù)倉庫是匯總

?!獢?shù)據(jù),in

隨著數(shù)據(jù)倉庫(DW)技術(shù)的不斷成熟,企業(yè)的數(shù)據(jù)逐漸變成了決策的主要依據(jù)。

數(shù)據(jù)倉庫中的數(shù)據(jù)是從許多業(yè)務(wù)處理系統(tǒng)中抽取、轉(zhuǎn)換而來,對于這樣一個復(fù)雜的企業(yè)

數(shù)據(jù)環(huán)境,如何以平安、高效的方式來對它們進(jìn)行管理和訪問就變得尤為重要。解決這

一問題的關(guān)鍵就是建立數(shù)據(jù)倉庫元數(shù)據(jù)

ETL(重點)

ETL/BI=l/3,(BI的成?。?/p>

T/ETL=2/3

soT/Bi=2/9~~l/4

ETL是BI工程重要的一個環(huán)節(jié)。通常情況下,在BI工程中ETL會花掉整個工程的1/3的時間,ETL設(shè)計的好壞直接關(guān)

接到BI工程的成敗。ETL三個局部中,花費時間最長的是'T"(Transform,清洗、轉(zhuǎn)換)的局部,一般情況

下這局部工作量是整個ETL的2/3。就是整個工程的2/9差不多四分之一

ETL的實現(xiàn)有多種方法,常用的有三種。一種是借助ETL工具實現(xiàn),一種是SQL方

式翅,〃外一種是ETL工具和SQL相結(jié)合

數(shù)據(jù)抽?。ㄈN情況)

1在DW數(shù)據(jù)庫效勞器和原業(yè)務(wù)系統(tǒng)之間建立直接的鏈接關(guān)系就可以寫select語句直接訪問

2不同的數(shù)據(jù)源解決方法:ODBC的方式建".數(shù)據(jù)庫鏈接或方法三

3txtxml利用數(shù)據(jù)庫工具將這些數(shù)據(jù)導(dǎo)入到指定的數(shù)據(jù)庫,然后從指定的數(shù)據(jù)庫中抽取

4增量更新的問題

數(shù)據(jù)清洗

1不完整的數(shù)據(jù)

2錯誤的數(shù)據(jù)

3重復(fù)的數(shù)據(jù)

數(shù)據(jù)轉(zhuǎn)換

1不一致數(shù)據(jù)轉(zhuǎn)換:抽取過來之后統(tǒng)一轉(zhuǎn)換成一個編碼

2數(shù)據(jù)粒度的轉(zhuǎn)換:業(yè)務(wù)系統(tǒng)數(shù)據(jù)按照數(shù)據(jù)倉庫粒度進(jìn)行聚合。

3商務(wù)規(guī)則的計算:ETL中將這些數(shù)據(jù)指標(biāo)計算好了之后存儲在數(shù)據(jù)倉庫中,以供分析使用

數(shù)據(jù)加載策略

1時間戳方式

2日志表方式

3全表比對方式upset

4全表刪除插入方式

OLAP

On-LineTransactionProcessing聯(lián)機(jī)事務(wù)處理系統(tǒng)(OLTP)

也稱為面向交易的處理系統(tǒng),其根本特征是顧客的原始數(shù)據(jù)可以立即傳送到計算中心進(jìn)行處理,并在

很短的時間內(nèi)給出處理結(jié)果。這樣做的最大優(yōu)點是可以即時地處理輸入的數(shù)據(jù),及時地答復(fù).也稱為實時

系統(tǒng)(RealtimeSystem)?

OLAP(聯(lián)機(jī)分析處理系統(tǒng))多維數(shù)據(jù)分析工具的集合________

聯(lián)機(jī)分析處理是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶

所理解的、并真實反映企業(yè)維持性的信息進(jìn)行快速、??致、交互地存取,從而獲得對數(shù)據(jù)的更深入

了解的一類軟件技術(shù)。

OLTP與OLAP的不同點:

OLTP數(shù)據(jù)OLAP數(shù)據(jù)

原始數(shù)據(jù)導(dǎo)出數(shù)據(jù)

細(xì)節(jié)性數(shù)據(jù)綜合性和提煉性數(shù)據(jù)

當(dāng)前值數(shù)據(jù)歷史數(shù)據(jù)

可更新不可更新,但周期性刷新

一次處理的數(shù)據(jù)量小一次處理的數(shù)據(jù)量大

面向應(yīng)用,事務(wù)驅(qū)動面向分析,分析驅(qū)動

面向操作人員,支持H常操作面向決策人員,支持管理需要

鉆取(Drill):它是改變維的層次,變換分析的粒度。鉆取包含向下體取(Drill-down)

和向上鉆取(DriU-up)/上卷(Roll-up)操作,rollup是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概

括到高層次的匯總數(shù)據(jù),或者減少維數(shù);而drilldown則相反,它從匯總數(shù)據(jù)深入到細(xì)

節(jié)數(shù)據(jù)進(jìn)行觀察或增加新維。

OLAP的實現(xiàn)方法,根據(jù)存儲數(shù)據(jù)的方式不同可以分為ROLAP、MOLAP、H0LAP

表示基于關(guān)系數(shù)據(jù)庫的OLAP實現(xiàn)

ROLAP(事實表維度表的設(shè)計)

將多維數(shù)據(jù)庫的多維結(jié)構(gòu)劃分為兩類表:一類是事實表,用來存儲數(shù)據(jù)和維關(guān)鍵字;另一類是維表,即對每個維

至少使用一個表來存放維的層次、成員類別等維的描述信息。維表和事實表通過主關(guān)鍵字和外關(guān)鍵字聯(lián)系在一起,

形成了“星型模型”。對于層次復(fù)雜的維,為防止冗余數(shù)據(jù)占用過大的存儲空間,可以使用多個表來描述,這種星

型模型的擴(kuò)展稱為“雪花模型"。

M0LAP

表示基于多維數(shù)據(jù)組織的OLAP實現(xiàn)(MultidimensionalOLAP)。以多維數(shù)據(jù)組織方式為核心,也就是說,MOLAP

使用多維數(shù)組存儲數(shù)據(jù).多維數(shù)據(jù)在存儲中將形成“立方塊(Cube)”的結(jié)構(gòu),在VOLAP中對立方塊的“旋轉(zhuǎn)”、

“切塊”、”切片"是產(chǎn)生多維數(shù)據(jù)報表的主要技術(shù)。

旋轉(zhuǎn)行列轉(zhuǎn)換?條記錄中的多個事實字段轉(zhuǎn)化為多條記錄

切塊

切片的字段結(jié)構(gòu)和相應(yīng)的基礎(chǔ)表完全相同,差異在于存儲的記錄的范圍。切片事實表中保存記錄的是相應(yīng)基礎(chǔ)表

中記錄的子集,記錄數(shù)通常與某個維度記錄數(shù)相同。

OLAP存儲方式優(yōu)缺點

多維存儲方式(MOLAP)

MOLAP在效勞器上對數(shù)據(jù)立方體數(shù)組及其管理技術(shù)的實現(xiàn),可以所有的信息查詢都從MOLAP效勞器上獲

得。

■優(yōu)勢

□性能好、響應(yīng)速度快;

□支持高性能的決策支持計算;

□復(fù)雜的跨維計算;

□多用戶的讀寫操作。

■缺點

□占用的存儲空間較大

□難以到達(dá)TB級數(shù)據(jù)量;

□需要進(jìn)行預(yù)計算,可能導(dǎo)致數(shù)據(jù)爆炸;

□無法支持維的動態(tài)變化;

□缺乏數(shù)據(jù)模型和數(shù)據(jù)訪問的標(biāo)準(zhǔn)。

關(guān)系數(shù)據(jù)庫存儲方式(ROLAP)

ROLAP充分利用關(guān)系數(shù)據(jù)庫技術(shù)將明細(xì)數(shù)據(jù)和聚合數(shù)據(jù)存儲在一個關(guān)系型結(jié)構(gòu)中的存儲方式。

■優(yōu)勢

□沒有大小限制;現(xiàn)有的關(guān)系數(shù)據(jù)庫的技術(shù)可以沿用;

□可以通過SQL實現(xiàn)詳細(xì)數(shù)據(jù)與概要數(shù)據(jù)的儲存;

□現(xiàn)有關(guān)系型數(shù)據(jù)庫已經(jīng)對OLAP做了很多優(yōu)化,包括并行存儲、并行查詢、位圖索引、SQ1的

OLAP擴(kuò)展等大大提高了ROALP的速度;

□查詢性能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論