版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘數(shù)據(jù)倉庫與數(shù)據(jù)挖掘第第0505章章 OLAP OLAP技術(shù)及應(yīng)用技術(shù)及應(yīng)用5.1 OLAP概述概述5.2 OLAP的多維分析的多維分析操作操作5.3 OLAP系統(tǒng)的分類系統(tǒng)的分類5.4 OLAP、DW與與DM的關(guān)系的關(guān)系5.5 DOLAM決策支持系統(tǒng)方案決策支持系統(tǒng)方案5.6 警務(wù)數(shù)據(jù)倉庫的警務(wù)數(shù)據(jù)倉庫的OLAP應(yīng)用應(yīng)用25.1.1 OLAP的定義的定義n20世紀(jì)世紀(jì)80年代開始,年代開始,聯(lián)機事務(wù)處理聯(lián)機事務(wù)處理(OLTP)的數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)庫系統(tǒng)已在已在企事業(yè)單企事業(yè)單位得到廣泛的應(yīng)用。位得到廣泛的應(yīng)用。n為了獲得及時準(zhǔn)確的決策信息,在為了獲得及時準(zhǔn)確的決策信息,在OLT
2、P數(shù)據(jù)庫系統(tǒng)中增加了一些簡單數(shù)據(jù)庫系統(tǒng)中增加了一些簡單的分析處理功能,形成一種的分析處理功能,形成一種“事務(wù)處理與分析處理事務(wù)處理與分析處理”合二為一的系統(tǒng)。合二為一的系統(tǒng)。n由于傳統(tǒng)數(shù)據(jù)庫的事務(wù)處理方式和決策的分析處理對數(shù)據(jù)需求存在明顯由于傳統(tǒng)數(shù)據(jù)庫的事務(wù)處理方式和決策的分析處理對數(shù)據(jù)需求存在明顯的沖突,導(dǎo)致傳統(tǒng)數(shù)據(jù)庫系統(tǒng)無法很好地支持決策分析活動。的沖突,導(dǎo)致傳統(tǒng)數(shù)據(jù)庫系統(tǒng)無法很好地支持決策分析活動。n數(shù)據(jù)庫之父數(shù)據(jù)庫之父E.F.Codd及其同仁于及其同仁于1993年提出了聯(lián)機分析處理年提出了聯(lián)機分析處理(On-Line Analysis Processing,OLAP)的概念,并為的概念
3、,并為OLAP系統(tǒng)提出了系統(tǒng)提出了12條廣為人知的準(zhǔn)則,使條廣為人知的準(zhǔn)則,使OLAP系統(tǒng)與系統(tǒng)與OLTP系統(tǒng)或系統(tǒng)或OLTP混合決策支持混合決策支持功能的系統(tǒng)區(qū)分開來功能的系統(tǒng)區(qū)分開來35.1.1 OLAP的定義的定義 定義定義5-1(OLAP委員會委員會):從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能:從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶所理解的、并真實反映企業(yè)多維特性的數(shù)據(jù)稱夠真正為用戶所理解的、并真實反映企業(yè)多維特性的數(shù)據(jù)稱為為信息數(shù)據(jù)信息數(shù)據(jù)。 定義定義5-2(OLAP委員會委員會):聯(lián)機分析處理:聯(lián)機分析處理(OLAP)是一種是一種軟件技術(shù),它使分析人員軟件技術(shù),它使分析人員(管理人員或執(zhí)行人員管
4、理人員或執(zhí)行人員)能夠從多種能夠從多種角度對信息數(shù)據(jù)進行快速、一致、交互地存取,以達(dá)到深入角度對信息數(shù)據(jù)進行快速、一致、交互地存取,以達(dá)到深入理解數(shù)據(jù)的目的。理解數(shù)據(jù)的目的。 定義定義5-3(簡簡):OLAP是針對特定問題的聯(lián)機多維數(shù)據(jù)快是針對特定問題的聯(lián)機多維數(shù)據(jù)快速訪問和分析處理的軟件技術(shù),能幫助決策者對數(shù)據(jù)進行深速訪問和分析處理的軟件技術(shù),能幫助決策者對數(shù)據(jù)進行深入的多角度觀察。入的多角度觀察。4以信息數(shù)據(jù)為分析對象,以以信息數(shù)據(jù)為分析對象,以O(shè)LAP技術(shù)開發(fā)的數(shù)據(jù)分析系統(tǒng)稱技術(shù)開發(fā)的數(shù)據(jù)分析系統(tǒng)稱為聯(lián)機為聯(lián)機分析分析處理系統(tǒng),簡稱處理系統(tǒng),簡稱OLAP系統(tǒng)或系統(tǒng)或OLAP工具或工具或O
5、LAP產(chǎn)品。產(chǎn)品。OLAP(聯(lián)機分析處理聯(lián)機分析處理)作為一個系統(tǒng)或一類產(chǎn)品已同作為一個系統(tǒng)或一類產(chǎn)品已同OLTP (聯(lián)機事務(wù)處理聯(lián)機事務(wù)處理) 明顯地區(qū)分開來。明顯地區(qū)分開來。OLAP的用戶是企業(yè)中的專業(yè)分析人員及管理決策人員,他們的用戶是企業(yè)中的專業(yè)分析人員及管理決策人員,他們在分析業(yè)務(wù)經(jīng)營數(shù)據(jù)時,希望從不同的角度來審視業(yè)務(wù)的衡在分析業(yè)務(wù)經(jīng)營數(shù)據(jù)時,希望從不同的角度來審視業(yè)務(wù)的衡量指標(biāo)是一種很自然的思考模式。量指標(biāo)是一種很自然的思考模式。 5 例如例如:分析分析賓館入住數(shù)據(jù)賓館入住數(shù)據(jù),可能會綜合時間周期、,可能會綜合時間周期、賓館轄賓館轄區(qū)區(qū)、旅客來源旅客來源、是否有前科是否有前科等多種
6、因素,主要為等多種因素,主要為社會公共安社會公共安全部門的全部門的決策提供服務(wù)支持。而決策提供服務(wù)支持。而OLTP則是是對傳統(tǒng)數(shù)據(jù)庫進則是是對傳統(tǒng)數(shù)據(jù)庫進行聯(lián)機的日常操作,比如對行聯(lián)機的日常操作,比如對入住入住記錄記錄、常住人口、常住人口的查詢和修的查詢和修改,主要為改,主要為賓館、派出所等賓館、派出所等單位的特定數(shù)據(jù)管理和應(yīng)用服務(wù)單位的特定數(shù)據(jù)管理和應(yīng)用服務(wù)。65.1.2 OLAP的的12條準(zhǔn)則條準(zhǔn)則 E.F.Codd的意思是,即使一個軟件系統(tǒng)有決策支持功能,的意思是,即使一個軟件系統(tǒng)有決策支持功能,若不滿足這若不滿足這12條準(zhǔn)條準(zhǔn)就不能稱為就不能稱為OLAP系統(tǒng)的衡量標(biāo)準(zhǔn)?,F(xiàn)階系統(tǒng)的衡量標(biāo)
7、準(zhǔn)?,F(xiàn)階段段許多人許多人仍仍將其作為將其作為評價和購買評價和購買OLAP產(chǎn)品的參考標(biāo)準(zhǔn)。產(chǎn)品的參考標(biāo)準(zhǔn)。準(zhǔn)則準(zhǔn)則1 多維概念的視圖多維概念的視圖 (multidimensional conceptual view) 從用戶的角度來看,整個企業(yè)的數(shù)據(jù)視圖本質(zhì)上是多維的從用戶的角度來看,整個企業(yè)的數(shù)據(jù)視圖本質(zhì)上是多維的(時間、地理、品種),因此(時間、地理、品種),因此OLAP的概念模型也應(yīng)該是多維的概念模型也應(yīng)該是多維的。的。準(zhǔn)則準(zhǔn)則2 透明性(透明性(transparency) 用戶不必關(guān)心表格或圖顯的數(shù)據(jù)用戶不必關(guān)心表格或圖顯的數(shù)據(jù)來源來源,只用,只用OLAP工具查詢數(shù)工具查詢數(shù)據(jù);據(jù);OL
8、AP系統(tǒng)應(yīng)該是開放系統(tǒng)系統(tǒng)應(yīng)該是開放系統(tǒng)的一個部分的一個部分,當(dāng)按用戶需要將,當(dāng)按用戶需要將OLAP系統(tǒng)嵌入到結(jié)構(gòu)的任何地方都不影響系統(tǒng)嵌入到結(jié)構(gòu)的任何地方都不影響OLAP分析工具的分析工具的性能。性能。7準(zhǔn)則準(zhǔn)則3 存取能力(存取能力(accessibility) OLAP系統(tǒng)應(yīng)該有能力利用自有的邏輯結(jié)構(gòu)訪問異構(gòu)數(shù)據(jù)系統(tǒng)應(yīng)該有能力利用自有的邏輯結(jié)構(gòu)訪問異構(gòu)數(shù)據(jù)源,并且進行必要的轉(zhuǎn)換以提供給用戶一個連貫的展示源,并且進行必要的轉(zhuǎn)換以提供給用戶一個連貫的展示。此此外,外,OLAP系統(tǒng)不僅能進行開放的存取,而且還能提供高效的系統(tǒng)不僅能進行開放的存取,而且還能提供高效的存取策略。存取策略。準(zhǔn)則準(zhǔn)則4
9、 穩(wěn)定的報表性能穩(wěn)定的報表性能(consistent reporting performance) 當(dāng)數(shù)據(jù)的維度和數(shù)據(jù)綜合層次增加時,當(dāng)數(shù)據(jù)的維度和數(shù)據(jù)綜合層次增加時,OLAP系統(tǒng)為最終系統(tǒng)為最終用戶提供報表的能力和響應(yīng)速度不應(yīng)該有明顯的降低和減慢用戶提供報表的能力和響應(yīng)速度不應(yīng)該有明顯的降低和減慢。8準(zhǔn)則準(zhǔn)則5 客戶客戶/服務(wù)器體系結(jié)構(gòu)(服務(wù)器體系結(jié)構(gòu)(client/server architecture) OLAP系統(tǒng)應(yīng)該是一種客戶系統(tǒng)應(yīng)該是一種客戶/服務(wù)器服務(wù)器(C/S)應(yīng)用結(jié)構(gòu),并有應(yīng)用結(jié)構(gòu),并有足夠的智能保證多維數(shù)據(jù)服務(wù)器能被不同的客戶應(yīng)用工具以足夠的智能保證多維數(shù)據(jù)服務(wù)器能被不同的
10、客戶應(yīng)用工具以最小的代價訪問。最小的代價訪問。 當(dāng)時普遍使用的文件當(dāng)時普遍使用的文件/服務(wù)器服務(wù)器(F/S)結(jié)構(gòu)結(jié)構(gòu),現(xiàn)在普遍現(xiàn)在普遍C/S或或B/S結(jié)構(gòu)。結(jié)構(gòu)。準(zhǔn)則準(zhǔn)則6 維的等同性(維的等同性(generic dimensionality) 每個數(shù)據(jù)維度應(yīng)該具有等同的層次結(jié)構(gòu)和操作能力,比如每個數(shù)據(jù)維度應(yīng)該具有等同的層次結(jié)構(gòu)和操作能力,比如對每個維度都可以進行對每個維度都可以進行“切片切片”、“切塊切塊”和和“旋轉(zhuǎn)旋轉(zhuǎn)”等相等相同的操作。同的操作。9準(zhǔn)準(zhǔn)則則7 動動態(tài)態(tài)的的稀稀疏疏矩矩陣陣處處理理能能力力(dynamic sparse matrix handling)多多維維數(shù)數(shù)據(jù)據(jù)集集的
11、的稀稀疏疏特特性性,即即大大多多數(shù)數(shù)單單元元格格的的值值都都是是零零;如如果果存存儲儲所所有有這這些些零零值值數(shù)數(shù)據(jù)據(jù)就就會會占占用用大大量量的的存存儲儲空空間間;OLAP系系統(tǒng)統(tǒng)應(yīng)應(yīng)該該為為這這種種具具有有稀稀疏疏性性的的多多維維數(shù)數(shù)據(jù)據(jù)集集的的存存儲儲和和查查詢詢分分析析提提供供一一種種“最最優(yōu)優(yōu)”處處理理能能力力,既既盡盡量量減減少少零零值值單單元元格格的的存存儲儲空空間間,又又保保證證動動態(tài)態(tài)查查詢詢分分析析的的快快速速、高高效效。準(zhǔn)準(zhǔn)則則8多多用用戶戶支支持持能能力力(multi-user support) OLAP應(yīng)應(yīng)提提供供并并發(fā)發(fā)獲獲取取和和更更新新訪訪問問,保保證證完完整整性
12、性和和安安全全性性的的能能力力。10準(zhǔn)則準(zhǔn)則9 非受限的跨維操作非受限的跨維操作(unrestricted cross-dimensional operations) 多維數(shù)據(jù)之間存在固有的層次關(guān)系,這就要求多維數(shù)據(jù)之間存在固有的層次關(guān)系,這就要求OLAP工具能工具能自己推導(dǎo)出而不是最終用戶明確定義出相關(guān)的計算。自己推導(dǎo)出而不是最終用戶明確定義出相關(guān)的計算。準(zhǔn)則準(zhǔn)則10 直觀的數(shù)據(jù)操縱(直觀的數(shù)據(jù)操縱(intuitive data manipulation) OLAP工具應(yīng)為數(shù)據(jù)的分析操縱提供直觀易懂操作界面,工具應(yīng)為數(shù)據(jù)的分析操縱提供直觀易懂操作界面,比如比如“下鉆下鉆”、“上卷上卷”、“切
13、片切片”等多維數(shù)據(jù)分析方法都等多維數(shù)據(jù)分析方法都可以通過直觀、方便的點擊操作完成。可以通過直觀、方便的點擊操作完成。11準(zhǔn)則準(zhǔn)則11 靈活的報表生成(靈活的報表生成(flexible reporting) OLAP提供的報表功能應(yīng)該以用戶需要的任何方式展現(xiàn)信提供的報表功能應(yīng)該以用戶需要的任何方式展現(xiàn)信息,以充分反映數(shù)據(jù)分析模型的多維特征。息,以充分反映數(shù)據(jù)分析模型的多維特征。準(zhǔn)則準(zhǔn)則12 非受限維與聚集層次非受限維與聚集層次(unlimited dimensions and aggregation levels) OLAP工具不應(yīng)該為多維數(shù)據(jù)的維度數(shù)量和維度層次數(shù)量工具不應(yīng)該為多維數(shù)據(jù)的維度數(shù)
14、量和維度層次數(shù)量設(shè)置任何限制。設(shè)置任何限制。 說明:說明:這個要求對系統(tǒng)要求有點高,可以適當(dāng)降低要求。這個要求對系統(tǒng)要求有點高,可以適當(dāng)降低要求。因為在實際應(yīng)用中,多維數(shù)據(jù)集的維度數(shù)量很少超過因為在實際應(yīng)用中,多維數(shù)據(jù)集的維度數(shù)量很少超過15個,個,維度層次也通常在維度層次也通常在6個以內(nèi)。個以內(nèi)。125.1.3 OLAP的簡要準(zhǔn)則的簡要準(zhǔn)則1、Codd的的12條準(zhǔn)則提出后,引起軟件供應(yīng)商不少爭議條準(zhǔn)則提出后,引起軟件供應(yīng)商不少爭議。有的。有的說只要說只要9就足夠了就足夠了,還有,還有說不夠說不夠,甚至,甚至Codd也也補充了補充了6條準(zhǔn)則條準(zhǔn)則。2、隨著人們對隨著人們對OLAP理解的深入,有
15、些學(xué)者提出了更為簡要的理解的深入,有些學(xué)者提出了更為簡要的定義,比如,一個獨立于軟件廠商的定義,比如,一個獨立于軟件廠商的OLAP研究機構(gòu)研究機構(gòu)OLAP Report提出了簡稱提出了簡稱FASMI的定義或簡明準(zhǔn)則,也得到業(yè)界的的定義或簡明準(zhǔn)則,也得到業(yè)界的廣泛認(rèn)可。廣泛認(rèn)可。13 定定義義5-4 聯(lián)聯(lián)機機分分析析處處理理(OLAP)就就是是共共享享多多維維信信息息的的快快速速分分析析,即即FASMI (Fast Analysis of Shared Multidimensional Information)。n 從從定定義義可可以以發(fā)發(fā)現(xiàn)現(xiàn),F(xiàn)ASMI本本質(zhì)質(zhì)上上概概括括了了OLAP的的5個
16、個主主要要特特征征。 n(1) 快快速速性性(Fast):用用戶戶對對OLAP系系統(tǒng)統(tǒng)的的快快速速反反應(yīng)應(yīng)能能力力有有很很高高的的要要求求,希希望望系系統(tǒng)統(tǒng)能能在在5秒秒內(nèi)內(nèi)對對用用戶戶的的大大部部分分分分析析要要求求做做出出反反應(yīng)應(yīng)。 n 快快速速性性需需求求必必須須在在線線響響應(yīng)應(yīng)才才能能完完成成,故故又又稱稱為為在在線線性性;n 快快速速性性還還需需要要一一些些專專門門的的技技術(shù)術(shù)支支持持,如如專專門門的的數(shù)數(shù)據(jù)據(jù)存存儲儲結(jié)結(jié)構(gòu)構(gòu)、大大量量數(shù)數(shù)據(jù)據(jù)的的預(yù)預(yù)先先計計算算、還還有有硬硬件件特特別別設(shè)設(shè)計計等等。 n(2) 分分析析性性(Analysis):OLAP系系統(tǒng)統(tǒng)應(yīng)應(yīng)能能處處理理與與
17、應(yīng)應(yīng)用用有有關(guān)關(guān)的的任任何何邏邏輯輯分分析析和和統(tǒng)統(tǒng)計計分分析析,例例如如,連連續(xù)續(xù)時時間間序序列列分分析析、成成本本分分析析、意意外外報報警警等等。此此外外,還還應(yīng)應(yīng)使使用用戶戶無無須須編編程程就就可可以以定定義義新新的的計計算算,并并作作為為查查詢詢分分析析的的一一部部分分,以以用用戶戶理理想想的的方方式式給給出出報報告告。 n(3) 共共享享性性(Shared):OLAP系系統(tǒng)統(tǒng)必必須須提提供供并并發(fā)發(fā)訪訪問問控控制制機機制制,讓讓多多個個用用戶戶共共享享同同一一OLAP數(shù)數(shù)據(jù)據(jù)集集的的查查詢詢分分析析,并并保保證證數(shù)數(shù)據(jù)據(jù)完完整整性性和和安安全全性性。14 定義定義5-4 聯(lián)機分析處理
18、(聯(lián)機分析處理(OLAP)就是共享多維信息的快)就是共享多維信息的快速分析速分析,即,即FASMI (Fast Analysis of Shared Multidimensional Information)。n(4) 多維性多維性。OLAP系統(tǒng)必須提供對數(shù)據(jù)分析的多維視圖,包括對層次系統(tǒng)必須提供對數(shù)據(jù)分析的多維視圖,包括對層次維和多重層次維的完全支持。事實上,多維分析是分析企業(yè)數(shù)據(jù)最有效維和多重層次維的完全支持。事實上,多維分析是分析企業(yè)數(shù)據(jù)最有效的方法,是的方法,是OLAP系統(tǒng)的靈魂和關(guān)鍵特性。系統(tǒng)的靈魂和關(guān)鍵特性。n(5) 信息性信息性。不論數(shù)據(jù)量有多大,也不管數(shù)據(jù)存儲在何處,。不論數(shù)據(jù)
19、量有多大,也不管數(shù)據(jù)存儲在何處,OLAP系統(tǒng)系統(tǒng)應(yīng)能及時獲得信息,并且能管理大容量信息。應(yīng)能及時獲得信息,并且能管理大容量信息。n 在以上在以上5個特性中,個特性中,快速性快速性(在線性在線性)和和多維性多維性就是就是OLAP系統(tǒng)的兩系統(tǒng)的兩個關(guān)鍵特征。個關(guān)鍵特征。n(1) 在線在線(On-Line)性:表現(xiàn)為對用戶請求的快速響應(yīng)和交互操作性:表現(xiàn)為對用戶請求的快速響應(yīng)和交互操作,它是通過使用,它是通過使用C/S或或B/S應(yīng)用結(jié)構(gòu)實現(xiàn)的。應(yīng)用結(jié)構(gòu)實現(xiàn)的。n(2) 多維分析多維分析(Multi-Analysis):通過建立多維數(shù)據(jù)模型實現(xiàn)對數(shù):通過建立多維數(shù)據(jù)模型實現(xiàn)對數(shù)據(jù)的多維分析,是據(jù)的多維
20、分析,是OLAP技術(shù)的關(guān)鍵所在。技術(shù)的關(guān)鍵所在。 155.1.4 OLAP系統(tǒng)的基本結(jié)構(gòu)系統(tǒng)的基本結(jié)構(gòu) 根據(jù)根據(jù)OLAP的定義和的定義和12(5)條準(zhǔn)則,可以給出條準(zhǔn)則,可以給出OLAP系統(tǒng)的系統(tǒng)的基本體系結(jié)構(gòu)基本體系結(jié)構(gòu)(圖圖5-1)。它不僅描述了。它不僅描述了OLAP系統(tǒng)的所有組成系統(tǒng)的所有組成部分,還描述了從數(shù)據(jù)源中抽取數(shù)據(jù)、形成分析使用的多維部分,還描述了從數(shù)據(jù)源中抽取數(shù)據(jù)、形成分析使用的多維數(shù)據(jù)集,通過數(shù)據(jù)集,通過OLAP分析工具對其進行分析分析工具對其進行分析,并為用戶提供各并為用戶提供各種分析結(jié)果等組成部分之間的相互關(guān)系種分析結(jié)果等組成部分之間的相互關(guān)系165.1.4 OLAP系
21、統(tǒng)的基本結(jié)構(gòu)系統(tǒng)的基本結(jié)構(gòu)1、數(shù)據(jù)源與數(shù)據(jù)倉庫的數(shù)據(jù)源類似,數(shù)據(jù)源與數(shù)據(jù)倉庫的數(shù)據(jù)源類似,并并根據(jù)決策需要將其抽取根據(jù)決策需要將其抽取集成為多維數(shù)據(jù)集,再利用集成為多維數(shù)據(jù)集,再利用OLAP分析工具對多維分析工具對多維(信息信息)數(shù)據(jù)數(shù)據(jù)集進行各種分析,并為用戶提供分析結(jié)果,支持用戶決策。集進行各種分析,并為用戶提供分析結(jié)果,支持用戶決策。2、從圖從圖5-1發(fā)現(xiàn),發(fā)現(xiàn),OLAP系統(tǒng)的開發(fā)人員不僅要開發(fā)多維數(shù)據(jù)系統(tǒng)的開發(fā)人員不僅要開發(fā)多維數(shù)據(jù)的多維分析工具軟件,還的多維分析工具軟件,還必須必須開發(fā)多維數(shù)據(jù)抽取和多維數(shù)據(jù)開發(fā)多維數(shù)據(jù)抽取和多維數(shù)據(jù)集成軟件方法。集成軟件方法。3、如果每個如果每個OL
22、AP系統(tǒng)的建立都直接從業(yè)務(wù)處理系統(tǒng)的數(shù)據(jù)源系統(tǒng)的建立都直接從業(yè)務(wù)處理系統(tǒng)的數(shù)據(jù)源中抽取數(shù)據(jù)來構(gòu)造多維數(shù)據(jù)集,將增加數(shù)據(jù)抽取部分的工作中抽取數(shù)據(jù)來構(gòu)造多維數(shù)據(jù)集,將增加數(shù)據(jù)抽取部分的工作量;導(dǎo)致數(shù)據(jù)源和結(jié)論的不統(tǒng)一;加大量;導(dǎo)致數(shù)據(jù)源和結(jié)論的不統(tǒng)一;加大OLAP系統(tǒng)的維護工作系統(tǒng)的維護工作量;缺乏對元數(shù)據(jù)的有效管理;加大量;缺乏對元數(shù)據(jù)的有效管理;加大OLAP系統(tǒng)的開發(fā)投入。系統(tǒng)的開發(fā)投入。175.1.4 OLAP系統(tǒng)的基本結(jié)構(gòu)系統(tǒng)的基本結(jié)構(gòu)4、 OLAP系統(tǒng)基本結(jié)構(gòu)與數(shù)據(jù)倉庫系統(tǒng)體系結(jié)構(gòu)不同系統(tǒng)基本結(jié)構(gòu)與數(shù)據(jù)倉庫系統(tǒng)體系結(jié)構(gòu)不同,前者,前者沒沒有明確給出多維數(shù)據(jù)的管理工具。有明確給出多維數(shù)據(jù)的
23、管理工具。1819 OLAP的多維分析操作包括對多維數(shù)據(jù)集的切片的多維分析操作包括對多維數(shù)據(jù)集的切片(slice)、切塊切塊(dice)、下鉆、下鉆(drill-down)、上卷、上卷(roll-up)、旋轉(zhuǎn)、旋轉(zhuǎn)(pivot)等數(shù)據(jù)分析方法,以便讓用戶能從多個角度、多個側(cè)等數(shù)據(jù)分析方法,以便讓用戶能從多個角度、多個側(cè)面觀察數(shù)據(jù),從而深入地了解包含在數(shù)據(jù)中的有用信息,以面觀察數(shù)據(jù),從而深入地了解包含在數(shù)據(jù)中的有用信息,以支持企業(yè)的決策。支持企業(yè)的決策。 5.2.1 切片切片 定義定義5-5 在在n( 3)維數(shù)據(jù)集的某一維上,指定一個維成員維數(shù)據(jù)集的某一維上,指定一個維成員的選擇操作稱為切片的選
24、擇操作稱為切片(Slice)操作,其結(jié)果稱為操作,其結(jié)果稱為n( 3)維數(shù)據(jù)維數(shù)據(jù)集的一個切片。集的一個切片。201、若對一個若對一個n維數(shù)據(jù)集進行切片操作,則將得到一個維數(shù)據(jù)集進行切片操作,則將得到一個n-1維的維的數(shù)據(jù)集。數(shù)據(jù)集。2、多維數(shù)據(jù)集的維度越高,人們對其理解就越困難。多維數(shù)據(jù)集的維度越高,人們對其理解就越困難。3、切片操作是對多維數(shù)據(jù)集進行降維處理,方便用戶理解多維切片操作是對多維數(shù)據(jù)集進行降維處理,方便用戶理解多維數(shù)據(jù)蘊藏的決策信息。數(shù)據(jù)蘊藏的決策信息。 例例 5-1 對于圖對于圖5-2所示的所示的3維數(shù)據(jù)集維數(shù)據(jù)集(n=3),若在時間維上,若在時間維上指定維成員指定維成員“2
25、月月”,請給出其切片結(jié)果。為教學(xué)方便,假設(shè),請給出其切片結(jié)果。為教學(xué)方便,假設(shè)每個單元格的數(shù)值都大于零,它表示某省、某月入住某個轄每個單元格的數(shù)值都大于零,它表示某省、某月入住某個轄區(qū)內(nèi)賓館的人次數(shù)。區(qū)內(nèi)賓館的人次數(shù)。21 解:根據(jù)切片的定義解:根據(jù)切片的定義5-5,對,對3維數(shù)據(jù)集進行切片操作的結(jié)維數(shù)據(jù)集進行切片操作的結(jié)果是一個果是一個2維數(shù)據(jù)集。因此,可得在時間維指定維成員維數(shù)據(jù)集。因此,可得在時間維指定維成員“2月月”的切片結(jié)果如的切片結(jié)果如表表5-1所示。它表示所示。它表示2月份從廣東、湖南、江月份從廣東、湖南、江蘇、福建等四省來的旅客,入住鹿城等轄區(qū)賓館的人次數(shù)。蘇、福建等四省來的旅
26、客,入住鹿城等轄區(qū)賓館的人次數(shù)。22 定定義義5-6 從從n( 2)維維數(shù)數(shù)據(jù)據(jù)集集中中選選擇擇一一個個2維維子子集集的的操操作作稱稱為為局局部部切切片片(Partial/local Slice)操操作作,所所得得的的2維維子子集集稱稱為為一一個個局局部部切切片片。即即對對任任意意n( 2)維維數(shù)數(shù)據(jù)據(jù)集集,其其局局部部切切片片操操作作結(jié)結(jié)果果永永遠(yuǎn)遠(yuǎn)是是2維維數(shù)數(shù)據(jù)據(jù)集集。(1) 為為方方便便理理解解,可可將將定定義義5-5的的切切片片操操作作稱稱為為全全局局切切片片操操作作。(2) 由由于于2維維數(shù)數(shù)據(jù)據(jù)是是人人們們最最易易接接受受和和理理解解的的多多維維數(shù)數(shù)據(jù)據(jù)展展示示方方法法,因因此此
27、,局局部部切切片片操操作作是是最最常常用用的的一一種種多多維維數(shù)數(shù)據(jù)據(jù)分分析析方方法法。(3) 對對n( 3)維維數(shù)數(shù)據(jù)據(jù)集集進進行行局局部部切切片片操操作作,必必須須先先指指定定n-2個個維維度度成成員員以以獲獲得得由由剩剩余余兩兩個個維維度度組組成成的的二二維維數(shù)數(shù)據(jù)據(jù)集集,然然后后從從這這個個二二維維數(shù)數(shù)據(jù)據(jù)集集中中獲獲得得局局部部切切片片。 23 例例5-2 對于圖對于圖5-5所示的所示的3維數(shù)據(jù)集,請給出兩個局部切片結(jié)維數(shù)據(jù)集,請給出兩個局部切片結(jié)果。果。 解:根據(jù)局部切片的定義,只要從三維數(shù)據(jù)集中任意選擇解:根據(jù)局部切片的定義,只要從三維數(shù)據(jù)集中任意選擇一個一個2維子集都是一個局部
28、切片。維子集都是一個局部切片。(1) 如果在時間維上指定維成員如果在時間維上指定維成員“2月月”,則表,則表5-1的任何一個的任何一個連續(xù)連續(xù)2維子集都是維子集都是3維數(shù)據(jù)集的一個局部切片,表維數(shù)據(jù)集的一個局部切片,表5-2就是一就是一個局部切片。個局部切片。24(2)如果在地理維上指定維成員)如果在地理維上指定維成員“廣東廣東”,則圖,則圖5-3是是3維數(shù)維數(shù)據(jù)集的另一個局部切片。據(jù)集的另一個局部切片。255.2.2 切塊切塊 定義定義5-7 在在n( 3)維數(shù)據(jù)集的某一維上指定若干維成員的選維數(shù)據(jù)集的某一維上指定若干維成員的選擇操作稱為切塊擇操作稱為切塊(Dice)操作,其結(jié)果稱為操作,其
29、結(jié)果稱為n維數(shù)據(jù)集一個切塊。維數(shù)據(jù)集一個切塊。 對于對于n( 3)維數(shù)據(jù)集,如果某一維上指定的維度成員數(shù)大于維數(shù)據(jù)集,如果某一維上指定的維度成員數(shù)大于等于等于2,則切塊操作的結(jié)果仍然是一個,則切塊操作的結(jié)果仍然是一個n維數(shù)據(jù)集,僅當(dāng)指定一維數(shù)據(jù)集,僅當(dāng)指定一個維度成員時,其切塊操作的結(jié)果是一個切片。即切片是切塊的個維度成員時,其切塊操作的結(jié)果是一個切片。即切片是切塊的特殊情況。特殊情況。 例例5-3對于圖對于圖5-2所示的所示的3維數(shù)據(jù)集,如果在時間維度上指定維數(shù)據(jù)集,如果在時間維度上指定“2月月”、“3月月”兩個維成員,試給出相應(yīng)的切塊結(jié)果。兩個維成員,試給出相應(yīng)的切塊結(jié)果。 解:由于在時間
30、維度上指定了解:由于在時間維度上指定了“2月月”、“3月月”兩個維成員兩個維成員,對于圖,對于圖5-2所示所示3維數(shù)據(jù)集切塊操作,相當(dāng)于去掉了維數(shù)據(jù)集切塊操作,相當(dāng)于去掉了“1月月”份份有關(guān)的單元格,其結(jié)果如圖有關(guān)的單元格,其結(jié)果如圖5-3所示。所示。26如果在地理維度上指定如果在地理維度上指定“湖南湖南”和和“江蘇江蘇”兩個維成員,請讀兩個維成員,請讀者給出相應(yīng)的切塊操作結(jié)果。者給出相應(yīng)的切塊操作結(jié)果。27 定義定義5-8 在在n( 3)維數(shù)據(jù)集上選擇一個三維子集的操作維數(shù)據(jù)集上選擇一個三維子集的操作稱稱為為長方體切塊長方體切塊(Dice)操作,其操作,其操作操作結(jié)果稱為結(jié)果稱為n維數(shù)據(jù)集的
31、一個維數(shù)據(jù)集的一個長方體切塊或局部切塊。長方體切塊或局部切塊。 從定義從定義5-8可知,可知,n( 3)維數(shù)據(jù)集的切塊永遠(yuǎn)是維數(shù)據(jù)集的切塊永遠(yuǎn)是3維數(shù)據(jù)集維數(shù)據(jù)集,即長方體。圖,即長方體。圖5-4就是圖就是圖5-2的一個長方體切塊。的一個長方體切塊。285.2.3 旋轉(zhuǎn)旋轉(zhuǎn) 定義定義5-9 在多維數(shù)據(jù)集展示的時候,對其改變維的顯示方在多維數(shù)據(jù)集展示的時候,對其改變維的顯示方向的操作稱為旋轉(zhuǎn)向的操作稱為旋轉(zhuǎn)(Rotate ),它相當(dāng)于解析幾何中坐標(biāo)軸的,它相當(dāng)于解析幾何中坐標(biāo)軸的旋轉(zhuǎn),故又稱轉(zhuǎn)軸旋轉(zhuǎn),故又稱轉(zhuǎn)軸(Pivot)。 多維數(shù)據(jù)集的旋轉(zhuǎn)結(jié)果仍然是原先的多維數(shù)據(jù)集,它僅僅多維數(shù)據(jù)集的旋轉(zhuǎn)結(jié)
32、果仍然是原先的多維數(shù)據(jù)集,它僅僅改變了數(shù)據(jù)集展示的方位,方便用戶觀察數(shù)據(jù)。改變了數(shù)據(jù)集展示的方位,方便用戶觀察數(shù)據(jù)。 例如,對圖例如,對圖5-2展示的展示的3維數(shù)據(jù)集,將其沿著時間維反時針維數(shù)據(jù)集,將其沿著時間維反時針旋轉(zhuǎn)旋轉(zhuǎn)90度,就得圖度,就得圖5-5所示的所示的3維數(shù)據(jù)集。維數(shù)據(jù)集。295.2.4 鉆取鉆取 多維數(shù)據(jù)集的鉆取多維數(shù)據(jù)集的鉆取(Drill)就是改變數(shù)據(jù)所屬的維度層次,就是改變數(shù)據(jù)所屬的維度層次,變換數(shù)據(jù)分析的粒度,它是下鉆變換數(shù)據(jù)分析的粒度,它是下鉆(drill down)和上卷(和上卷(roll up)這兩個相反操作的統(tǒng)稱。多維數(shù)據(jù)集鉆?。┻@兩個相反操作的統(tǒng)稱。多維數(shù)據(jù)集
33、鉆取(Drill)操作的操作的目的是方便用戶從不同維度的不同層次觀察多維數(shù)據(jù)。下面目的是方便用戶從不同維度的不同層次觀察多維數(shù)據(jù)。下面分別給出其詳細(xì)定義。分別給出其詳細(xì)定義。 定義定義5-10 對多維數(shù)據(jù)選定的維度成員,按照其上層次維對多維數(shù)據(jù)選定的維度成員,按照其上層次維度對數(shù)據(jù)進行求和計算并展示的操作稱為上卷(度對數(shù)據(jù)進行求和計算并展示的操作稱為上卷(roll up)操作操作,簡稱上卷。,簡稱上卷。 30 下鉆的操作與上卷相反,它從由當(dāng)前的匯總數(shù)據(jù)深入到其下鉆的操作與上卷相反,它從由當(dāng)前的匯總數(shù)據(jù)深入到其下一層次的細(xì)節(jié)數(shù)據(jù),以便用戶觀察到更為細(xì)粒度的數(shù)據(jù),下一層次的細(xì)節(jié)數(shù)據(jù),以便用戶觀察到
34、更為細(xì)粒度的數(shù)據(jù),其定義如下。其定義如下。 定義定義5-11 對多維數(shù)據(jù)選定的維度成員,按照其下層次維度對多維數(shù)據(jù)選定的維度成員,按照其下層次維度對數(shù)據(jù)進行分解的操作稱為下鉆對數(shù)據(jù)進行分解的操作稱為下鉆(drill down)操作操作,簡稱下,簡稱下鉆。鉆。 對表對表5-4所示所示“1季度季度”這個數(shù)據(jù)集,將其下鉆到下層次這個數(shù)據(jù)集,將其下鉆到下層次“月月”,就得到圖,就得到圖5-2所示的所示的3維數(shù)據(jù)。為了更為直觀的理解下維數(shù)據(jù)。為了更為直觀的理解下鉆,我們另外給一個鉆,我們另外給一個2維數(shù)據(jù)下鉆的例子予以說明。維數(shù)據(jù)下鉆的例子予以說明。315.2.4 鉆取鉆取 由上卷的定義可知,它是在某一
35、個維度上,將低層次的細(xì)由上卷的定義可知,它是在某一個維度上,將低層次的細(xì)節(jié)數(shù)據(jù)概括為高層次的匯總數(shù)據(jù),以增大數(shù)據(jù)的粒度,并減節(jié)數(shù)據(jù)概括為高層次的匯總數(shù)據(jù),以增大數(shù)據(jù)的粒度,并減少了數(shù)據(jù)單元格的個數(shù)或數(shù)據(jù)的維度。少了數(shù)據(jù)單元格的個數(shù)或數(shù)據(jù)的維度。 例例5-4 對于圖對于圖5-2所示的所示的3維數(shù)據(jù)集,若在時間維的維數(shù)據(jù)集,若在時間維的“月份月份”層次,上卷為層次,上卷為“季度季度”的層次,試給出其上卷結(jié)果。的層次,試給出其上卷結(jié)果。 解:對圖解:對圖5-2所示的所示的3維數(shù)據(jù)集,把時間維的維數(shù)據(jù)集,把時間維的“1月月”,“2月月”,“3月月”上卷恰好為上卷恰好為“季度季度”的層次,即的層次,即“
36、1季度季度”,其上,其上卷結(jié)果為一個卷結(jié)果為一個2維數(shù)據(jù)集(表維數(shù)據(jù)集(表5-4)。)。32 例例5-12 設(shè)設(shè)表表5-5表表示示“2月月”轄轄區(qū)區(qū)賓賓館館各各省省人人員員入入住住情情況況,且且時時間間維維度度“月月”層層次次的的下下層層為為“旬旬”,請請給給出出下下鉆鉆的的結(jié)結(jié)果果。 解解:因因為為每每月月有有上上、中中、下下三三個個旬旬,因因此此,其其下下鉆鉆結(jié)結(jié)果果如如圖圖5-6所所示示。 33 OLAP系統(tǒng)的類型是按照多維數(shù)據(jù)集存儲管理的數(shù)據(jù)庫系統(tǒng)的類型是按照多維數(shù)據(jù)集存儲管理的數(shù)據(jù)庫系系統(tǒng)統(tǒng)來劃分的,主要有多維來劃分的,主要有多維OLAP系統(tǒng),關(guān)系系統(tǒng),關(guān)系OLAP系統(tǒng)和混合系統(tǒng)和混
37、合OLAP系統(tǒng),并分別簡記為系統(tǒng),并分別簡記為MOLAP,ROLAP和和HOLAP。5.3.1 多維多維OLAP 1、多維多維OLAP:使用專門的多維數(shù)據(jù)庫使用專門的多維數(shù)據(jù)庫(Multi-Dimensional DataBase,MDDB),比如,比如2.5節(jié)介紹的節(jié)介紹的Cach來存儲來存儲和管理和管理OLAP需要的多維數(shù)據(jù)集,因此需要的多維數(shù)據(jù)集,因此MOLAP又稱為多維聯(lián)機分析處理。又稱為多維聯(lián)機分析處理。(1) MOLAP將將OLAP所用到的多維數(shù)據(jù)在物理上存儲為多維數(shù)組的形式所用到的多維數(shù)據(jù)在物理上存儲為多維數(shù)組的形式,即即“立方體立方體”的結(jié)構(gòu)。的結(jié)構(gòu)。(2) 維的屬性值被映射成
38、多維數(shù)組的下標(biāo)值或下標(biāo)的范圍,而匯總數(shù)據(jù)維的屬性值被映射成多維數(shù)組的下標(biāo)值或下標(biāo)的范圍,而匯總數(shù)據(jù)作為多維數(shù)組的值存儲在數(shù)組的單元中。作為多維數(shù)組的值存儲在數(shù)組的單元中。(3) 因因MOLAP采用了新的存儲結(jié)構(gòu),從物理層實現(xiàn)多維存儲,采用了新的存儲結(jié)構(gòu),從物理層實現(xiàn)多維存儲,所以所以又稱又稱為物理為物理OLAP(Physical OLAP)。345.3.2 關(guān)系關(guān)系OLAP 使用傳統(tǒng)的關(guān)系數(shù)據(jù)庫使用傳統(tǒng)的關(guān)系數(shù)據(jù)庫(Relational DataBase,RDB)來來存儲多維數(shù)據(jù)集,并通過純關(guān)系數(shù)據(jù)庫管理系統(tǒng)存儲多維數(shù)據(jù)集,并通過純關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS)對對其進行管理控制,對應(yīng)的其進
39、行管理控制,對應(yīng)的OLAP系統(tǒng)稱為關(guān)系系統(tǒng)稱為關(guān)系OLAP系統(tǒng)系統(tǒng)(Relational OLAP),簡記為,簡記為ROLAP。 純關(guān)系數(shù)據(jù)庫管理系統(tǒng)通過一些軟件工具或中間件實現(xiàn)多維數(shù)據(jù)管理,純關(guān)系數(shù)據(jù)庫管理系統(tǒng)通過一些軟件工具或中間件實現(xiàn)多維數(shù)據(jù)管理,物理層仍采用關(guān)系數(shù)據(jù)庫的存儲結(jié)構(gòu),因此也稱為虛擬物理層仍采用關(guān)系數(shù)據(jù)庫的存儲結(jié)構(gòu),因此也稱為虛擬OLAP (Virtual OLAP)。 ROLAP將分析用的多維數(shù)據(jù)用星形模型或雪花模型表示,并存儲在關(guān)將分析用的多維數(shù)據(jù)用星形模型或雪花模型表示,并存儲在關(guān)系數(shù)據(jù)庫中。系數(shù)據(jù)庫中。 將一些主要的計算結(jié)果,比如計算工作量比較大的查詢視圖等,都直接將
40、一些主要的計算結(jié)果,比如計算工作量比較大的查詢視圖等,都直接存儲在關(guān)系數(shù)據(jù)庫中。存儲在關(guān)系數(shù)據(jù)庫中。 RDMBS還針對還針對OLAP特點作了相應(yīng)的優(yōu)化,比如并行存儲、并行查詢特點作了相應(yīng)的優(yōu)化,比如并行存儲、并行查詢、并行數(shù)據(jù)管理、基于成本的查詢優(yōu)化、位圖索引等。、并行數(shù)據(jù)管理、基于成本的查詢優(yōu)化、位圖索引等。355.3.3 多維多維OLAP與關(guān)系與關(guān)系OLAP的比較的比較ROLAP和和MOLAP都能夠?qū)崿F(xiàn)聯(lián)機分析處理的基本功能,但兩都能夠?qū)崿F(xiàn)聯(lián)機分析處理的基本功能,但兩者在查詢效率,儲空間、維度管理等許多方面各有千秋(表者在查詢效率,儲空間、維度管理等許多方面各有千秋(表5-7)。)。365
41、.3.4 混合混合OLAP1、混合、混合OLAP的概念的概念 因為因為MOLAP與與ROLAP各自擁有不同的優(yōu)點和缺點,且它各自擁有不同的優(yōu)點和缺點,且它們的結(jié)構(gòu)也完全不同。為避免們的結(jié)構(gòu)也完全不同。為避免OLAP的設(shè)計人員在兩種結(jié)構(gòu)之的設(shè)計人員在兩種結(jié)構(gòu)之間選擇時陷入困境,人們提出了混合間選擇時陷入困境,人們提出了混合OLAP(Hybrid OLAP, HOLAP)的概念。一般地,可以將的概念。一般地,可以將HOLAP用以下公式表示。用以下公式表示。HOLAP= *MOLAP+(1- )* ROLAP ,其中,其中(0,1) 根據(jù)根據(jù)OLAP應(yīng)用的不同優(yōu)化目標(biāo),應(yīng)用的不同優(yōu)化目標(biāo),若若應(yīng)用優(yōu)
42、先考慮效率和應(yīng)用優(yōu)先考慮效率和時間,那么時間,那么MOLAP的比重就應(yīng)該加大,即的比重就應(yīng)該加大,即(0.5, 1),即將,即將常用的匯總數(shù)據(jù)都采用多維數(shù)據(jù)庫來存儲常用的匯總數(shù)據(jù)都采用多維數(shù)據(jù)庫來存儲。 若若應(yīng)用對存儲容量要求較高,那么應(yīng)該充分利用關(guān)系數(shù)據(jù)庫應(yīng)用對存儲容量要求較高,那么應(yīng)該充分利用關(guān)系數(shù)據(jù)庫的存儲能力,把大部分統(tǒng)計數(shù)據(jù)用的存儲能力,把大部分統(tǒng)計數(shù)據(jù)用ROLAP 的模式來存儲,即的模式來存儲,即(0, 0.5)。372、HOLAP的實現(xiàn)的實現(xiàn) 目前,目前,HOLAP都使用一種都使用一種準(zhǔn)多維準(zhǔn)多維數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)(RDBMS)實現(xiàn)多維數(shù)據(jù)集的管理控制。實現(xiàn)多維數(shù)據(jù)集的
43、管理控制。 所謂準(zhǔn)多維數(shù)據(jù)庫管理系統(tǒng),是在傳統(tǒng)關(guān)系數(shù)據(jù)庫管理系所謂準(zhǔn)多維數(shù)據(jù)庫管理系統(tǒng),是在傳統(tǒng)關(guān)系數(shù)據(jù)庫管理系統(tǒng)基礎(chǔ)上,增加了多維數(shù)據(jù)集的存儲管理和查詢分析功能而統(tǒng)基礎(chǔ)上,增加了多維數(shù)據(jù)集的存儲管理和查詢分析功能而形成的數(shù)據(jù)庫管理系統(tǒng),而不是僅僅通過一些軟件工具或中形成的數(shù)據(jù)庫管理系統(tǒng),而不是僅僅通過一些軟件工具或中間件來實現(xiàn)多維數(shù)據(jù)集的關(guān)系數(shù)據(jù)庫存儲管理。間件來實現(xiàn)多維數(shù)據(jù)集的關(guān)系數(shù)據(jù)庫存儲管理。 現(xiàn)在市場上的商品化數(shù)據(jù)庫管理系統(tǒng),比如現(xiàn)在市場上的商品化數(shù)據(jù)庫管理系統(tǒng),比如ORACLE、SQL Server,DB2等都早已在它們先前的純關(guān)系數(shù)據(jù)庫管理等都早已在它們先前的純關(guān)系數(shù)據(jù)庫管理系統(tǒng)
44、中增加了多維數(shù)據(jù)管理和分析的功能,形成市場廣泛接系統(tǒng)中增加了多維數(shù)據(jù)管理和分析的功能,形成市場廣泛接受的準(zhǔn)多維數(shù)據(jù)庫管理系統(tǒng)。受的準(zhǔn)多維數(shù)據(jù)庫管理系統(tǒng)。385.4.1 OLAP、DW與與DM的聯(lián)系的聯(lián)系(1) OLAP(聯(lián)機分析處理聯(lián)機分析處理)、DW(數(shù)據(jù)倉庫數(shù)據(jù)倉庫)與與DM(數(shù)據(jù)挖掘數(shù)據(jù)挖掘)是是相互獨立而又相互聯(lián)系的相互獨立而又相互聯(lián)系的3個概念。個概念。(2)相互獨立相互獨立:它們在不同的時間,由不同的學(xué)者或組織分別提它們在不同的時間,由不同的學(xué)者或組織分別提出,因此它們在基本內(nèi)涵、解決的主要問題和使用的基本技出,因此它們在基本內(nèi)涵、解決的主要問題和使用的基本技術(shù)上都有很大的區(qū)別。術(shù)
45、上都有很大的區(qū)別。39(3)相互聯(lián)系相互聯(lián)系:它們都是為了支持它們都是為了支持企業(yè)的管理決策這一中心任務(wù),企業(yè)的管理決策這一中心任務(wù),即共同目標(biāo)而提出的。因此,我即共同目標(biāo)而提出的。因此,我們可以用們可以用“一個中心,三個基本一個中心,三個基本點點”來形容來形容DW、OLAP與與DM之之間的間的聯(lián)系聯(lián)系。5.4.2 OLAP、DW與與DM的區(qū)別的區(qū)別 OLAP與與DW不僅提出的不僅提出的學(xué)者和學(xué)者和時間不同,時間不同,還有還有三個巨大區(qū)三個巨大區(qū)別。別。1、概念的內(nèi)涵不同、概念的內(nèi)涵不同 DW是一個綜合歷史數(shù)據(jù)的集合,核心是數(shù)據(jù)本身的存儲是一個綜合歷史數(shù)據(jù)的集合,核心是數(shù)據(jù)本身的存儲管理;管理
46、;OLAP是對大量數(shù)據(jù)進行聯(lián)機分析處理的軟件技術(shù),其是對大量數(shù)據(jù)進行聯(lián)機分析處理的軟件技術(shù),其核心是數(shù)據(jù)的快速多維分析核心是數(shù)據(jù)的快速多維分析多維分析工具。多維分析工具。 DW可作為可作為OLAP的一個數(shù)據(jù)分析對象,但的一個數(shù)據(jù)分析對象,但OLAP的分析對的分析對象不局限于象不局限于DW,還可以是其它數(shù)據(jù)對象,比如數(shù)據(jù)庫、數(shù)據(jù),還可以是其它數(shù)據(jù)對象,比如數(shù)據(jù)庫、數(shù)據(jù)文件、文件、XML文檔、文檔、Excel工作表等。工作表等。 同樣地同樣地,DW的分析工具也不限于的分析工具也不限于OLAP工具,還有數(shù)據(jù)挖工具,還有數(shù)據(jù)挖掘以及其它統(tǒng)計分析工具。掘以及其它統(tǒng)計分析工具。402、解決的問題不同、解決
47、的問題不同 DW概念是為了解決集成數(shù)據(jù)本身的組織和存儲問題而提概念是為了解決集成數(shù)據(jù)本身的組織和存儲問題而提出。出。OLAP概念是為了對數(shù)據(jù)進行多維統(tǒng)計分析與展示而提出概念是為了對數(shù)據(jù)進行多維統(tǒng)計分析與展示而提出來的,它要解決的問題是數(shù)據(jù)的聯(lián)機來的,它要解決的問題是數(shù)據(jù)的聯(lián)機(快速快速)分析處理方法。分析處理方法。3、使用的技術(shù)不同、使用的技術(shù)不同 DW的數(shù)據(jù)組織和存儲主要使用數(shù)據(jù)庫及其相關(guān)技術(shù),而的數(shù)據(jù)組織和存儲主要使用數(shù)據(jù)庫及其相關(guān)技術(shù),而OLAP主要應(yīng)用軟件工程和統(tǒng)計分析技術(shù),開發(fā)聯(lián)機的多維分主要應(yīng)用軟件工程和統(tǒng)計分析技術(shù),開發(fā)聯(lián)機的多維分析和可視化軟件。但在對數(shù)據(jù)進行分析之前,析和可視
48、化軟件。但在對數(shù)據(jù)進行分析之前,OLAP工具需將工具需將數(shù)據(jù)源中的數(shù)據(jù)抽取出來組成立方體數(shù)據(jù)源中的數(shù)據(jù)抽取出來組成立方體(多維數(shù)據(jù)集多維數(shù)據(jù)集),才能對,才能對其進行切片、切塊、下鉆、上卷等多維分析。其進行切片、切塊、下鉆、上卷等多維分析。 同同DW和和DM(數(shù)據(jù)挖掘數(shù)據(jù)挖掘)之間的關(guān)系一樣,之間的關(guān)系一樣,DW不是為不是為OLAP而生的,反過來而生的,反過來OLAP也不是為也不是為DW而活的。當(dāng)然,這而活的。當(dāng)然,這句話對于句話對于OLAP與與DW之間的關(guān)系同樣適用。之間的關(guān)系同樣適用。41OLAP、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘三者之間的主要區(qū)別(表、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘三者之間的主要區(qū)別(表5-8)。
49、)。425.4.2 OLAP與與DW的的關(guān)關(guān)系系1、雖雖然然OLAP技技術(shù)術(shù)并并不不是是針針對對DW(數(shù)數(shù)據(jù)據(jù)倉倉庫庫)而而提提出出的的,但但因因其其強強大大的的數(shù)數(shù)據(jù)據(jù)分分析析能能力力和和豐豐富富的的數(shù)數(shù)據(jù)據(jù)呈呈現(xiàn)現(xiàn)方方法法, OLAP可可以以成成為為數(shù)數(shù)據(jù)據(jù)倉倉庫庫一一個個十十分分重重要要的的分分析析工工具具。2、雖雖然然DW也也不不是是針針對對OLAP而而提提出出的的,但但因因其其業(yè)業(yè)已已集集成成的的數(shù)數(shù)據(jù)據(jù)抽抽取取工工具具和和面面向向主主題題的的數(shù)數(shù)據(jù)據(jù)集集合合,如如果果OLAP把把DW作作為為一一個個優(yōu)優(yōu)質(zhì)質(zhì)數(shù)數(shù)據(jù)據(jù)源源,就就能能真真正正體體現(xiàn)現(xiàn)“快快速速性性、多多維維性性、分分析析
50、性性、信信息息性性、共共享享性性”等等OLAP特特性性。 3、OLAP可可以以是是DW分分析析工工具具的的一一部部分分,但但不不是是必必須須的的一一個個部部分分。 4、DW是是OLAP工工具具一一個個優(yōu)優(yōu)質(zhì)質(zhì)的的分分析析數(shù)數(shù)據(jù)據(jù)源源,但但并并不不是是唯唯一一的的分分析析數(shù)數(shù)據(jù)據(jù)源源。 5、將將OLAP作作為為DW的的一一個個主主要要分分析析工工具具,已已成成為為目目前前DW系系統(tǒng)統(tǒng)的的標(biāo)標(biāo)準(zhǔn)準(zhǔn)配配置置,即即數(shù)數(shù)據(jù)據(jù)倉倉庫庫(DW)+聯(lián)聯(lián)機機事事務(wù)務(wù)處處理理(OLAP)就就是是一一個個支支持持決決策策的的數(shù)數(shù)據(jù)據(jù)倉倉庫庫系系統(tǒng)統(tǒng),亦亦即即基基于于數(shù)數(shù)據(jù)據(jù)倉倉庫庫的的決決策策支支持持系系統(tǒng)統(tǒng)。43
51、5.4.4 OLAP與與DM的的關(guān)關(guān)系系 OLAP是是一一種種驗驗證證型型多多維維數(shù)數(shù)據(jù)據(jù)分分析析工工具具,有有一一定定的的局局限限性性。1、很很難難發(fā)發(fā)現(xiàn)現(xiàn)數(shù)數(shù)據(jù)據(jù)之之間間的的重重要要影影響響因因素素 OLAP只只能能羅羅列列多多維維數(shù)數(shù)據(jù)據(jù)集集中中已已存存在在的的事事實實,如如去去年年2月月江江蘇蘇來來龍龍灣灣入入住住賓賓館館的的有有233人人次次,但但很很難難從從發(fā)發(fā)現(xiàn)現(xiàn)其其中中重重要要的的影影響響因因素素。 2、 不不能能發(fā)發(fā)現(xiàn)現(xiàn)數(shù)數(shù)據(jù)據(jù)之之間間的的重重要要關(guān)關(guān)聯(lián)聯(lián) OLAP告告訴訴用用戶戶系系統(tǒng)統(tǒng)過過去去和和當(dāng)當(dāng)前前的的事事實實,卻卻不不能能告告訴訴用用戶戶這這些些事事實實之之間間潛
52、潛在在的的重重要要關(guān)關(guān)聯(lián)聯(lián)關(guān)關(guān)系系。 數(shù)數(shù)據(jù)據(jù)挖挖掘掘(DM) 恰恰好好具具有有從從大大量量不不完完全全的的、有有噪噪聲聲的的、模模糊糊的的或或者者隨隨機機的的數(shù)數(shù)據(jù)據(jù)中中提提取取人人們們事事先先不不知知道道、但但又又有有潛潛在在使使用用價價值值的的模模式式和和知知識識(如如關(guān)關(guān)聯(lián)聯(lián)規(guī)規(guī)則則、分分類類規(guī)規(guī)則則等等)的的能能力力。 因因此此,OLAP與與DM各各有有所所長長,互互為為補補充充。44 DM作作為為一一種種發(fā)發(fā)掘掘型型數(shù)數(shù)據(jù)據(jù)深深度度分分析析技技術(shù)術(shù)恰恰好好彌彌補補了了OLAP分分析析能能力力的的弱弱點點。 如如果果能能將將二二者者結(jié)結(jié)合合起起來來,發(fā)發(fā)展展一一種種建建立立在在OLA
53、P和和DM基基礎(chǔ)礎(chǔ)上上的的新新型型分分析析挖挖掘掘技技術(shù)術(shù),將將更更能能適適應(yīng)應(yīng)實實際際決決策策分分析析的的需需要要。 OLAM(On-Line Analytical Mining,聯(lián)聯(lián)機機分分析析挖挖掘掘)正正是是這這種種結(jié)結(jié)合合的的產(chǎn)產(chǎn)物物。并并具具有有如如下下幾幾個個特特點點: 1、OLAM是是充充分分發(fā)發(fā)揮揮計計算算機機優(yōu)優(yōu)勢勢,進進行行大大量量運運算算及及分分析析對對比比,產(chǎn)產(chǎn)生生諸諸如如切切片片、切切塊塊、下下鉆鉆、旋旋轉(zhuǎn)轉(zhuǎn)等等操操作作,形形成成新新的的模模式式。2、OLAM是是一一個個多多維維的的、深深層層次次的的挖挖掘掘工工作作階階段段。 3、OLAM是是一一個個面面向向主主題
54、題,形形成成新新知知識識的的層層次次階階段段。4、OLAM具具有有多多維維分分析析的的在在線線性性、靈靈活活性性和和數(shù)數(shù)據(jù)據(jù)處處理理的的深深入入性性。5、OLAM通通過過與與WEB技技術(shù)術(shù)的的結(jié)結(jié)合合,特特別別適適合合數(shù)數(shù)據(jù)據(jù)量量巨巨大大、信信息息類類型型復(fù)復(fù)雜雜、表表現(xiàn)現(xiàn)形形式式繁繁多多的的網(wǎng)網(wǎng)絡(luò)絡(luò)信信息息資資源源分分析析。 45 從不同的角度提出了數(shù)據(jù)倉庫、聯(lián)機分析處理和數(shù)據(jù)挖掘等技從不同的角度提出了數(shù)據(jù)倉庫、聯(lián)機分析處理和數(shù)據(jù)挖掘等技術(shù),以期提高決策支持的能力。隨著術(shù),以期提高決策支持的能力。隨著DW技術(shù),技術(shù),OLAP技術(shù)和技術(shù)和DM技術(shù)的不斷發(fā)展,人們才找到結(jié)合三者優(yōu)點的決策支持系技
55、術(shù)的不斷發(fā)展,人們才找到結(jié)合三者優(yōu)點的決策支持系統(tǒng)解決方案統(tǒng)解決方案DOLAP(圖(圖5-5)。)。46 OLAM本本質(zhì)質(zhì)上上是是DW與與OLAP工工具具、DM 工工具具和和其其它它查查詢詢工工具具集集成成的的數(shù)數(shù)據(jù)據(jù)倉倉庫庫系系統(tǒng)統(tǒng)(DWS),它它具具有有如如下下幾幾個個特特點點。1、數(shù)數(shù)據(jù)據(jù)來來源源豐豐富富多多樣樣。數(shù)數(shù)據(jù)據(jù)來來源源不不僅僅包包含含企企業(yè)業(yè)各各個個部部門門的的數(shù)數(shù)據(jù)據(jù),而而且且包包括括企企業(yè)業(yè)外外部部的的數(shù)數(shù)據(jù)據(jù),如如法法律律法法規(guī)規(guī)、市市場場信信息息、競競爭爭對對手手的的信信息息,以以及及各各級級政政府府發(fā)發(fā)布布的的統(tǒng)統(tǒng)計計數(shù)數(shù)據(jù)據(jù)等等;不不僅僅有有結(jié)結(jié)構(gòu)構(gòu)化化的的數(shù)數(shù)據(jù)據(jù),也也有有非非結(jié)結(jié)構(gòu)構(gòu)化化的的數(shù)數(shù)據(jù)據(jù)。2、數(shù)數(shù)據(jù)據(jù)管管理理環(huán)環(huán)境境優(yōu)優(yōu)良良。通通過過專專門門的的ETL工工具具,對對數(shù)數(shù)據(jù)據(jù)來
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 子宮肉瘤患者的口腔護理
- 小兒驚厥護理中的溝通與協(xié)調(diào)
- 護理倫理與醫(yī)療安全
- 大豐市小海中學(xué)高二生物三同步課程講義第講期中期末串講之種群和群落
- 《信息通信建設(shè)數(shù)字化工程監(jiān)理服務(wù)能力評價標(biāo)準(zhǔn)》征求意見稿
- 太陽能建筑一體化原理與應(yīng) 課件 第5章 太陽能集熱器
- 2025年中國奢侈品行業(yè)市場研究報告
- DB32∕T 5212-2025 泵站遠(yuǎn)程集控少人值守技術(shù)規(guī)范
- 2026 年中職掘進技術(shù)(巷道掘進)試題及答案
- 黨建試題及答案多選
- 不合格食品管理制度
- QGDW10384-2023輸電線路鋼管塔加工技術(shù)規(guī)程
- 咖啡店5s管理制度
- 供電營業(yè)規(guī)則(2024版)
- T/SSBME 1-2024醫(yī)療器械上市后研究和風(fēng)險管控計劃編寫指南
- 鋼筋棚拆除合同范本
- 斷絕親子協(xié)議書
- 【MOOC答案】《光纖光學(xué)》(華中科技大學(xué))章節(jié)作業(yè)期末慕課答案
- 小學(xué)生班級管理交流課件
- DB21T 3722.7-2025高標(biāo)準(zhǔn)農(nóng)田建設(shè)指南 第7部分:高標(biāo)準(zhǔn)農(nóng)田工程施工質(zhì)量評定規(guī)范
- 近八年寧夏中考數(shù)學(xué)試卷真題及答案2024
評論
0/150
提交評論