版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第3章聯(lián)機分析處理
3.1OLAP概念3.2OLAP的數(shù)據(jù)模型3.3多維數(shù)據(jù)的顯示3.4多維數(shù)據(jù)分析3.5OLAP的結(jié)構(gòu)與分析工具1
聯(lián)機分析處理(OnLineAnalyticalProcessing,OLAP)在數(shù)據(jù)倉庫系統(tǒng)中,聯(lián)機分析處理是重要的數(shù)據(jù)分析工具。
OLAP的基本思想是從多方面和多角度以多維的形式來觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。23.1OLAP概念
OLAP是在OLTP的基礎(chǔ)上發(fā)展起來的。
OLTP是以數(shù)據(jù)庫為基礎(chǔ)的,面對的是操作人員和低層管理人員,對基本數(shù)據(jù)的查詢和增、刪、改等進(jìn)行處理。
OLAP是以數(shù)據(jù)倉庫為基礎(chǔ)的數(shù)據(jù)分析處理。它有兩個特點:一是在線性(OnLine),由客戶機/服務(wù)器這種體系結(jié)構(gòu)來完成的;二是多維分析,這也是OLAP的核心所在。33.1.1OLAP定義1.OLAP理事會給出的定義聯(lián)機分析處理(OLAP)是一種軟件技術(shù),它使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達(dá)到深入理解數(shù)據(jù)的目的。這些信息是從原始數(shù)據(jù)轉(zhuǎn)換過來的,按照用戶的理解,它反映了企業(yè)真實的方方面面。42.OLAP的簡單定義
聯(lián)機分析處理是共享多維信息的快速分析。它體現(xiàn)了四個特征:(1)快速性:用戶對OLAP的快速反應(yīng)能力有很高的要求。(2)可分析性:OLAP系統(tǒng)應(yīng)能處理任何邏輯分析和統(tǒng)計分析。(3)多維性:系統(tǒng)必須提供對數(shù)據(jù)分析的多維視圖和分析。(4)信息性:OLAP系統(tǒng)應(yīng)能及時獲得信息,并且管理大容量的信息。
5
1993年,E.F.Codd提出OLAP的12條準(zhǔn)則,用來評價分析處理工具,這也是他繼關(guān)系數(shù)據(jù)庫和分布式數(shù)據(jù)庫提出的兩個“12條準(zhǔn)則”后提出的第三個“12條準(zhǔn)則”。其主要的準(zhǔn)則有:多維數(shù)據(jù)分析;客戶/服務(wù)器結(jié)構(gòu);多用戶支持;一致的報表性能等。
3.1.2OLAP準(zhǔn)則
61.多維概念視圖企業(yè)的數(shù)據(jù)空間本身就是多維的。因此OLAP的概念模型也應(yīng)是多維的。用戶可以對多維數(shù)據(jù)模型進(jìn)行切片、切塊、旋轉(zhuǎn)坐標(biāo)或進(jìn)行多維的聯(lián)合(概括和聚集)分析。74.一致穩(wěn)定的報表性能
報表操作不應(yīng)隨維數(shù)增加而削弱,即當(dāng)數(shù)據(jù)維數(shù)和數(shù)據(jù)的綜合層次增加時,提供的報表能力和響應(yīng)速度不應(yīng)該有明顯的降低。
85.客戶/服務(wù)器體系結(jié)構(gòu)
OLAP是建立在客戶/服務(wù)器體系結(jié)構(gòu)上的。
多維數(shù)據(jù)庫服務(wù)器能夠被不同的應(yīng)用和工具所訪問。
客戶端負(fù)責(zé)應(yīng)用邏輯及用戶界面。9
8.多用戶支持能力
當(dāng)多個用戶要在同一分析模式上并行工作,OLAP工具應(yīng)能夠提供并發(fā)訪問等功能。
11.靈活的報表生成
報表必須充分反映數(shù)據(jù)分析模型的多維特征,并可按用戶需要的方式來顯示它。10
OLAP是針對特定問題的聯(lián)機數(shù)據(jù)訪問和分析。
(1)變量:變量是數(shù)據(jù)的實際意義,即描述數(shù)據(jù)“是什么”。
(2)維:維是人們觀察數(shù)據(jù)的特定角度。如產(chǎn)品維、顧客維、時間維等。
(3)維的層次:數(shù)據(jù)的細(xì)節(jié)不同程度為維的層次。如日、月、季、年是時間維的層次。
(4)維成員:維的一個取值稱為該維的一個維成員。如“某年某月某日”是時間維的一個成員。
3.1.3OLAP的基本概念
11(5)多維數(shù)組:一個多維數(shù)組可以表示為:(維1,維2,……,維n,變量)一個4維的結(jié)構(gòu),即(產(chǎn)品,地區(qū),時間,銷售渠道,銷售額)。(6)數(shù)據(jù)單元(單元格):多維數(shù)組的取值稱為數(shù)據(jù)單元。如:4維數(shù)據(jù)單元(牙膏,上海,1998年12月,批發(fā),銷售額為100000)。
OLAP的基本概念(續(xù))123.2OLAP的數(shù)據(jù)模型
3.2.1MOLAP數(shù)據(jù)模型3.2.2ROLAP數(shù)據(jù)模型3.2.3MOLAP與ROLAP的比較3.2.4HOLAP數(shù)據(jù)模型133.2.1MOLAP的數(shù)據(jù)模型
MOLAP是基于多維數(shù)據(jù)庫存儲方式建立的OLAP;表現(xiàn)為“超立方”結(jié)構(gòu),采用類似于多維數(shù)組的結(jié)構(gòu)。例如,二維MDDB(數(shù)組,即矩陣)的數(shù)據(jù)組織見表3.1所示。
北京上海廣州衣服600700500鞋800900700帽子10020080表3.1MOLAP的數(shù)據(jù)模型14在查詢中除查詢一般的“衣服在廣州的銷售量”外,有時查詢“衣服的總銷售量”等問題,涉及到多個數(shù)據(jù)項求和,如果采取臨時進(jìn)行累加,會使查詢效率大大降低,為此需增加匯總數(shù)據(jù)項。
北京上海廣州總和衣服6007005001800鞋8009007002400帽子10020080380總和1500180012804580表多維數(shù)據(jù)庫中晗綜合數(shù)據(jù)的組織153.2.2ROLAP數(shù)據(jù)模型ROLAP是基于關(guān)系數(shù)據(jù)庫的OLAP。它是一個平面結(jié)構(gòu),用關(guān)系數(shù)據(jù)庫表示多維數(shù)據(jù)時,采用星型模型。16產(chǎn)品名地區(qū)銷售量衣服北京600衣服上海700衣服廣州500鞋北京800鞋上海900鞋廣州700帽子北京100帽子上海200帽子廣州80表3.3關(guān)系數(shù)據(jù)庫RDBMS數(shù)據(jù)組織173.2.3MOLAP與ROLAP的比較1.數(shù)據(jù)存取速度2.數(shù)據(jù)存儲的容量3.多維計算的能力4.維度變化的適應(yīng)性5.數(shù)據(jù)變化的適應(yīng)性6.軟硬件平臺的適應(yīng)性7.元數(shù)據(jù)管理181.數(shù)據(jù)存取速度ROLAP服務(wù)器需要將SQL語句轉(zhuǎn)化為多維存儲語句,臨時“拼合”出多維數(shù)據(jù)立方體。因此,ROLAP的響應(yīng)時間較長。
MOLAP在數(shù)據(jù)存儲速度上性能好,響應(yīng)速度快。192.數(shù)據(jù)存儲的容量ROLAP使用的傳統(tǒng)關(guān)系數(shù)據(jù)庫的存儲方法,在存儲容量上基本沒有限制。MOLAP通常采用多平面疊加成立體的方式存放數(shù)據(jù)。當(dāng)數(shù)據(jù)量超過操作系統(tǒng)最大文件長度時,需要進(jìn)行數(shù)據(jù)分割。多維數(shù)據(jù)庫的數(shù)據(jù)量級難以達(dá)到太大的字節(jié)級。203.多維計算的能力MOLAP能夠支持高性能的決策支持計算。ROLAP無法完成多行的計算和維之間的計算。214.維度變化的適應(yīng)性MOLAP增加新的維度,則多維數(shù)據(jù)庫通常需要重新建立。ROLAP對于維表的變更有很好的適應(yīng)性。225.數(shù)據(jù)變化的適應(yīng)性當(dāng)數(shù)據(jù)頻繁的變化時,MOLAP需要進(jìn)行大量的重新計算,甚至重新建立索引乃至重構(gòu)多維數(shù)據(jù)庫。在ROLAP中靈活性較好,對于數(shù)據(jù)變化的適應(yīng)性高。236.軟硬件平臺的適應(yīng)性ROLAP對軟硬件平臺的適應(yīng)性很好,而MOLAP相對較差。7.元數(shù)據(jù)管理目前在元數(shù)據(jù)的管理,MOLAP和ROLAP都沒有成形的標(biāo)準(zhǔn)。24MOLAP和ROLAP的對比簡表MOLAPROLAP固定維可變維維交叉計算多維視圖行級計算超大型數(shù)據(jù)庫讀-寫應(yīng)用維數(shù)據(jù)變化速度快數(shù)據(jù)集市數(shù)據(jù)倉庫253.2.4HOLAP數(shù)據(jù)模型HOLAP(HybridOLAP),即混和OLAP介于MOLAP和ROLAP之間。在HOLAP中,對最常用的維度和維層次,使用多維數(shù)據(jù)表來存儲,對于用戶不常用的維度和數(shù)據(jù),采用ROLAP星型結(jié)構(gòu)來存儲。在HOLAP的多維數(shù)據(jù)表中的數(shù)據(jù)維度少于MOLAP中的維度表,數(shù)據(jù)存儲容量也少于MOLAP方式。HOLAP在數(shù)據(jù)存取速度上又低于MOLAP。263.3多維數(shù)據(jù)的顯示3.3.1多維數(shù)據(jù)顯示方法3.3.2多維類型結(jié)構(gòu)(MTS)3.3.3多維數(shù)據(jù)的分析視圖273.3.1多維數(shù)據(jù)顯示方法多維數(shù)據(jù)的顯示只能在平面上展現(xiàn)出來。三維數(shù)據(jù)無法在平面上展現(xiàn)出來。三維數(shù)據(jù)顯示見表3.6所示。28產(chǎn)品名地區(qū) 時間銷售量衣服北京1月100衣服北京2月200衣服北京3月300衣服上海1月200衣服上海2月300衣服上海3月400衣服廣州1月150衣服廣州2月250衣服廣州3月300鞋北京1月150鞋北京2月300鞋北京3月350鞋上海1月200鞋上海2月300鞋上海3月400鞋廣州1月150鞋廣州2月250鞋廣州3月300…………293.3.2多維類型結(jié)構(gòu)(MTS)表示方法是:每一個維度用一條線段來表示。維度中的每一個成員都用線段上的一個單位區(qū)間來表示。例如,用三個線段分別表示時間、產(chǎn)品和指標(biāo)三個維的多維類型結(jié)構(gòu)如圖3.3所示。30在圖3.3多維類型結(jié)構(gòu)(MTS)中,指定時間維成員是3月,產(chǎn)品維成員是鞋,指標(biāo)維成員是銷售量,這樣它代表了三維數(shù)據(jù)總得一個空間數(shù)據(jù)點,如圖3.4所示。313.3.3多維數(shù)據(jù)的分析視圖在平面的屏幕上顯示多維數(shù)據(jù),是利用行、列和頁面三個顯示組來表示的。例如,對上例的四維MTS實例,在頁面上選定商店維度中“商店3”,在行中選定時間維的“1月、2月、3月”共3個成員,在列中選定產(chǎn)品維中的“上衣、褲、帽子”三個成員,以及指標(biāo)維中的“固定成本、直接銷售”二個成員。該四維數(shù)據(jù)的顯示如圖3.6所示。商店3(頁面)上衣褲帽子直接銷售固定成本直接銷售固定成本直接銷售固定成本1月4503505504505004002月3802804603604003203月40031048041045040032對于更多維度的數(shù)據(jù)顯示,需要選擇維度及其成員分布在行或者列中。在頁面上可以選定多個維度,但每個維度只能顯示一個成員。在行或者列中一般只選擇二個維,每個維可以多個成員。例如,對6個維度數(shù)據(jù),它的MTS如圖3.7所示。33對以上6維數(shù)據(jù)中,設(shè)定頁面維度為商店的成員是“商店3”,客戶維度成員是“老年”。行維度含時間維和產(chǎn)品維共2個維度,其中時間維中成員為“1月、2月、3月”。產(chǎn)品維中成員為“桌子、臺燈”。列維度含指標(biāo)維和場景維共2個維度,其中指標(biāo)維中成員為“直接銷售、間接銷售、總銷售”。場景維中成員為“實際、計劃”。具體的顯示數(shù)據(jù)如圖3.8所示。商店3,老年(頁面)直接銷售間接銷售總銷售實際計劃實際計劃實際計劃1月桌子250300125150375450臺燈2653201331604004802月桌子333400167200500600臺燈2833401421704255103月桌子350420175210525630臺燈250300125150375450343.4OALP的多維數(shù)據(jù)分析3.4.1多維數(shù)據(jù)分析的基本操作3.4.2廣義OLAP功能3.4.3多維數(shù)據(jù)分析實例35例如,以“產(chǎn)品、城市、時間”三維數(shù)據(jù),如圖363.4.1多維數(shù)據(jù)分析的基本操作
1.切片選定多維數(shù)組的一個二維子集的操作叫做切片。例如:對三維數(shù)據(jù),通過“切片”,分別從城市和產(chǎn)品等不同的角度觀察銷售情況:
372.切塊切塊有兩種情況:(1)在多維數(shù)組的某一個維上選定某一區(qū)間的維成員的操作切塊可以看成是在切片的基礎(chǔ)上,確定某一個維成員的區(qū)間得到的片段,也即由多個切片疊合起來。(2)選定多維數(shù)組的一個三維子集的操作在多維數(shù)組(維1,維2,……,維n,變量)中選定3個維,維i、維j、維k,在這3個維上分別取一個區(qū)間,或任意維成員,而其它維都取定一個維成員。383.鉆取鉆取有向下鉆?。╠rilldown)和向上鉆?。╠rillup)操作。向下鉆取是使用戶在多層數(shù)據(jù)中能通過導(dǎo)航信息而獲得更多的細(xì)節(jié)性數(shù)據(jù)。向上鉆取獲取概括性的數(shù)據(jù)。39鉆?。豪纾?005年各部門銷售收入表如下:40對時間維進(jìn)行下鉆操作,獲得新表如下:2005年部門1季度2季度3季度4季度部門1200200350150部門225050150150部門3200150180270414.旋轉(zhuǎn)通過旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù)。旋轉(zhuǎn)操作相當(dāng)于平面數(shù)據(jù)將坐標(biāo)軸旋轉(zhuǎn)。例如,旋轉(zhuǎn)可能包含了交換行和列,或是把某一個行維移到列維中去?;蚴前秧撁骘@示中的一個維和頁面外的維進(jìn)行交換(令其成為新的行或列中的一個)42旋轉(zhuǎn)時間維產(chǎn)品維產(chǎn)品維時間維(a)行列交換旋轉(zhuǎn)以改變顯示布局時間維地區(qū)維產(chǎn)品維時間維產(chǎn)品維地區(qū)維43旋轉(zhuǎn)前的數(shù)據(jù)實例旋轉(zhuǎn)后的數(shù)據(jù)旋轉(zhuǎn)后再切片443.4.2廣義OLAP功能
1、基本代理操作
當(dāng)系統(tǒng)處于某種特殊狀態(tài)時“代理”提醒分析員。
(1)示警報告
定義一些條件,一但條件滿足,系統(tǒng)會提醒分析員去做分析。如每日報告完成或月定貨完成等通知分析員作分析。(2)時間報告按日歷和時鐘提醒分析員。
(3)異常報告
當(dāng)超出邊界條件時提醒分析員。如銷售情況已超出預(yù)定義閾值的上限或下限時提醒分析員。452.?dāng)?shù)據(jù)分析模型E.F.Codd將數(shù)據(jù)模型分為4類模型:(1)絕對模型通過比較歷史數(shù)據(jù)值或行為來描述過去發(fā)生的事實。絕對模型只能對歷史數(shù)據(jù)進(jìn)行比較,并且利用回歸分析等一些分析方法得出趨勢信息。46(2)解釋模型利用系統(tǒng)已有的多層次的綜合路徑層層細(xì)化,找出事實發(fā)生的原因。
假設(shè)今年銷售量下降,那么解釋模型應(yīng)當(dāng)能找出原因,即下滑與時間、地區(qū)、商品及銷售渠道四者中的何種因素有關(guān)。47(3)思考模型說明在一維或多維上引入一組具體變量或參數(shù)后將會發(fā)生什么。例如該公司決策者為了了解某商品的銷售量是否與顧客的年齡有關(guān),引入了行變量-年齡,即在當(dāng)前的多維視圖上增加了顧客的年齡維。48(4)公式模型該模型表示在多個維上,需要引入哪些變量或參數(shù),以及引入后所產(chǎn)生的結(jié)果。公式模型自動完成上述變量引入工作,從而最終找出與銷量有關(guān)的全部因素,并給出了引入后的結(jié)果。493.商業(yè)分析模型具體的商業(yè)分析模型有:(1)分銷渠道的分析模型(2)客戶利潤貢獻(xiàn)度模型(3)客戶關(guān)系(信用)優(yōu)化模型(4)風(fēng)險評估模型50(1)分銷渠道的分析模型通過客戶、渠道、產(chǎn)品或服務(wù)三者之間的關(guān)系,了解客戶的購買行為、客戶和渠道對業(yè)務(wù)收入的貢獻(xiàn)、哪些客戶比較喜好由什么渠道在何時和銀行打交道。為此,銀行需要建立客戶購買傾向模型和渠道喜好模型等。51(2)客戶利潤貢獻(xiàn)度模型通過該模型能了解每一位客戶對銀行的總利潤貢獻(xiàn)度。知道哪些利潤高的客戶需要留住,采用什么方法留住客戶,交叉銷售改善客戶的利潤貢獻(xiàn)度,哪些客戶應(yīng)該爭取,完成個性化服務(wù)。52(3)客戶關(guān)系(信用)優(yōu)化模型銀行對客戶的每一筆交易中,知道客戶需要什么產(chǎn)品或服務(wù),例如,定期存款是希望退休養(yǎng)老使用,申請信用卡需要現(xiàn)金消費,詢問放貸利息需要住房貸款等。通過模型計算,主動地對客戶溝通并進(jìn)行交叉銷售,達(dá)到留住客戶和增加利潤的目標(biāo)。53(4)風(fēng)險評估模型模擬風(fēng)險和利潤間的關(guān)系,建立風(fēng)險評估的數(shù)學(xué)模型,在滿足高利潤、低風(fēng)險客戶需求的前提下,達(dá)到銀行收益的極大化。54
假設(shè)有一個5維數(shù)據(jù)模型,5個維分別為:商店,方案,部門,時間,銷售。
1.多維數(shù)據(jù)存儲
在指定“商店=ALL,方案=現(xiàn)有”情況的三維表(行為部門,列為時間和銷售量)3.4.3多維數(shù)據(jù)分析實例
55
20042005%增長率銷售量利潤增長%銷售量利潤增長%銷售量利潤增長服裝234,67027.2381,10221.562.4(20.0)家具62,54833.866,00531.15.6(8.0)汽車375,09822.4325,40227.2(13.2)21.4所有其它202,38821.3306,67721.750.71.9指定商店、方案后的三維表
56
20042005%增長率銷售利潤增長%銷售利潤增長%銷售利潤增長汽車375,09822.4325,40227.2(13.2)21.4維修195,05114.2180,78615.0(7.3)5.6附件116,28043.9122,54547.55.38.2音樂63,7678.222,07114.2(63.4)7.3
2、向下鉆取對汽車部門向下鉆取出具體項目的銷售情況和利潤增長情況。
57
2005銷售量服裝381,102家具66,005汽車325,402所有其它306,6773、切片表切片(Slice)操作是除去一些列或行不顯示
58
2005銷售量現(xiàn)有計劃差量差量%服裝381,102350,00031.18.9家具66,00569,000(2,995)(4.3)汽車325,402300,00025,4028.5所有其它306,677350,000(44,322)12.74、旋轉(zhuǎn)表這次旋轉(zhuǎn)操作得到2005年的交叉表方案為:現(xiàn)有、計劃、差量、差量%。593.5OLAP結(jié)構(gòu)與分析工具
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年工程測量員(三級)測繪安全生產(chǎn)考試試卷及答案
- 麻醉科發(fā)展規(guī)劃
- 2025年《安全評價師(高級)職業(yè)技能鑒定真題及答案解析》
- 《雷雨》讀書筆記1
- 設(shè)施管理2026年安全標(biāo)準(zhǔn)
- 2026 年無財產(chǎn)離婚協(xié)議書正規(guī)模板
- 2026 年離婚協(xié)議書規(guī)范正規(guī)范本
- 房產(chǎn)項目策劃年終總結(jié)(3篇)
- 店鋪數(shù)據(jù)年終總結(jié)范文(3篇)
- 2026嘔吐護理常規(guī)試題及答案
- 高校宿舍管理員培訓(xùn)課件
- 河南省開封市2026屆高三年級第一次質(zhì)量檢測歷史試題卷+答案
- 員工通勤安全培訓(xùn)課件
- 歲末年初安全知識培訓(xùn)課件
- 全國秸稈綜合利用重點縣秸稈還田監(jiān)測工作方案
- 吞咽障礙患者誤吸的預(yù)防與管理方案
- 中小企業(yè)人才流失問題及對策分析
- 2026年湖南鐵路科技職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫含答案
- (新教材)2025年人教版八年級上冊歷史期末復(fù)習(xí)全冊知識點梳理
- 招標(biāo)人主體責(zé)任履行指引
- 鋁方通吊頂施工技術(shù)措施方案
評論
0/150
提交評論