數(shù)據(jù)倉(cāng)庫(kù)5-聯(lián)機(jī)分析處理技術(shù)2_第1頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)5-聯(lián)機(jī)分析處理技術(shù)2_第2頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)5-聯(lián)機(jī)分析處理技術(shù)2_第3頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)5-聯(lián)機(jī)分析處理技術(shù)2_第4頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)5-聯(lián)機(jī)分析處理技術(shù)2_第5頁(yè)
已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1第第5 5講講 聯(lián)機(jī)分析處理技術(shù)聯(lián)機(jī)分析處理技術(shù)2 22v 多維數(shù)據(jù)模型構(gòu)成的多維數(shù)據(jù)空間稱(chēng)作為數(shù)據(jù)立方體(Data Cube,簡(jiǎn)記為cube)。v 是從不同角度對(duì)同一數(shù)據(jù)進(jìn)行觀(guān)察得到的數(shù)據(jù)交點(diǎn)。數(shù)據(jù)立方體數(shù)據(jù)立方體3v 一個(gè)二維數(shù)據(jù)立方體對(duì)應(yīng)的某地區(qū)商店銷(xiāo)售額表數(shù)據(jù)立方體數(shù)據(jù)立方體時(shí)間(季度)產(chǎn)品類(lèi)型彩電冰箱洗衣機(jī)家用電器第一季度500萬(wàn)200萬(wàn)240萬(wàn)1500萬(wàn)第二季度200萬(wàn)300萬(wàn)420萬(wàn)2100萬(wàn)第三季度240萬(wàn)500萬(wàn)250萬(wàn)1000萬(wàn)第四季度80萬(wàn)100萬(wàn)320萬(wàn)1700萬(wàn)4v 商店銷(xiāo)售額表的三維數(shù)據(jù)立方體數(shù)據(jù)立方體5v 維是觀(guān)察數(shù)據(jù)的特定角度,是每個(gè)事物的屬性。v 每個(gè)維都有

2、一個(gè)唯一的名字,如:時(shí)間維、地區(qū)維、產(chǎn)品維等。1 1) )維維6v 維成員(member) 維由一些維成員構(gòu)成。維的一個(gè)取值稱(chēng)為維的一個(gè)成員。如果維已經(jīng)分成了若干個(gè)維層次,那么維成員就是不同維層次取值的組合。1)維-維成員商品商品城市城市日期日期牛奶牛奶浴巾浴巾毛巾毛巾可樂(lè)可樂(lè)果汁果汁4 43 32 21 1商品、城市、日期維工業(yè) 國(guó)家 年商品 市 日類(lèi)別 省 月7v 維層(level) 人們觀(guān)察數(shù)據(jù)時(shí),除了要從某一個(gè)角度去觀(guān)察外,還需要從不同的細(xì)節(jié)程度去觀(guān)察,這些不同的細(xì)節(jié)程度就稱(chēng)為不同的維層次。 如:銷(xiāo)售地區(qū)維有分區(qū)、省、市,對(duì)于時(shí)間維有日、月、季度。1)維-維層8v 維層次(hierar

3、chy) 在一個(gè)維中可以有多種分類(lèi)方法,把每種分類(lèi)方法叫做一個(gè)層次。 如:時(shí)間維的兩個(gè)層次。1 1)維)維- -維層次維層次年季度月星期日9v 維屬性(attribute) 維屬性說(shuō)明維成員所具有的特征。 如:在地區(qū)維的商店這一層定義“負(fù)責(zé)人”、“商店類(lèi)型”等屬性,在城市層上定義“人口”、“面積”等屬性。1 1)維)維- -維屬性維屬性10v 度量是要分析的目標(biāo)或?qū)ο?,是多維數(shù)據(jù)集的核心值,是最終用戶(hù)在數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用中需查看的數(shù)據(jù)。v 常見(jiàn)的度量有:銷(xiāo)售量、供應(yīng)量、營(yíng)業(yè)額等。v 通常是具體數(shù)據(jù)值。2)度量商品商品城市城市日期日期牛奶牛奶浴巾浴巾毛巾毛巾可樂(lè)可樂(lè)果汁果汁4 43 32 21 1究竟

4、想了解什么?究竟想了解什么?11121.1.星形模型星形模型v 星形模型是多維數(shù)據(jù)模型的基本結(jié)構(gòu),通常由一個(gè)很大的中心表(事實(shí)表)和一組較小的表(維度表)組成。131.星形模型142.2.雪花模型雪花模型154.3 4.3 多維分析操作多維分析操作4.4 4.4 多維查詢(xún)語(yǔ)言多維查詢(xún)語(yǔ)言聯(lián)機(jī)分析處理技術(shù)聯(lián)機(jī)分析處理技術(shù)2 216v 關(guān)系數(shù)據(jù)模型的核心概念是關(guān)系,基本操作是:選擇、投影、鏈接。v 多維數(shù)據(jù)模型結(jié)構(gòu)復(fù)雜,操作的種類(lèi)也相對(duì)較多。v 常用的多維分析操作有:切片、切塊、旋轉(zhuǎn)、下鉆、上卷4.34.3 多維分析操作多維分析操作17v 聚集是對(duì)細(xì)節(jié)數(shù)據(jù)進(jìn)行綜合的過(guò)程,是多維分析的基礎(chǔ)。v 最常

5、用的5種聚集函數(shù): 求和 計(jì)數(shù) 求最大值 求最小值 求平均值4.3.14.3.1 多維分析基礎(chǔ):聚集多維分析基礎(chǔ):聚集18v 舉例:零售商對(duì)產(chǎn)品的銷(xiāo)售分析時(shí),設(shè)置了時(shí)間維(Time)、地區(qū)維(Store)和商品維(Product),度量是銷(xiāo)售額(Sales),其中該地區(qū)維是指商店所在地區(qū)。v 假設(shè)數(shù)據(jù)倉(cāng)庫(kù)中有一張銷(xiāo)售表(如下圖),只列出在時(shí)間T1、商品P1在濟(jì)南地區(qū)的商店(S1、S2、S3)的銷(xiāo)售額,分別為:(T1,S1,P1:100),(T1,S2,P1:78),(T1,S3,P1:97)4.3.14.3.1 多維分析基礎(chǔ):聚集多維分析基礎(chǔ):聚集19TimeStoreProductSales

6、T1S1P1100T1S2P178T1S3P1974.3.14.3.1 多維分析基礎(chǔ):聚集多維分析基礎(chǔ):聚集20v 如何獲得濟(jì)南地區(qū)在時(shí)間T1對(duì)商品P1的銷(xiāo)售額?即如何獲得數(shù)據(jù)單元(T1,“濟(jì)南”,P1:X)v 即:X=sum(100,78,97)4.3.14.3.1 多維分析基礎(chǔ):聚集多維分析基礎(chǔ):聚集21n 分布型聚集函數(shù)v 將數(shù)據(jù)分成n份,對(duì)其中的每一份應(yīng)用該函數(shù),可以得到n個(gè)聚集值,對(duì)這n個(gè)聚集值進(jìn)行計(jì)算得到的結(jié)果如果和整個(gè)數(shù)據(jù)(不劃分)應(yīng)用該函數(shù)得出的結(jié)果一致,則稱(chēng)該函數(shù)是分布型的。v count、sum、min、max4.3.14.3.1 多維分析基礎(chǔ):聚集函數(shù)分類(lèi)多維分析基礎(chǔ):聚

7、集函數(shù)分類(lèi)22n 代數(shù)型聚集函數(shù)v 如果一個(gè)函數(shù)可以由若干個(gè)分布型函數(shù)進(jìn)行代數(shù)運(yùn)算得出,則說(shuō)該函數(shù)是代數(shù)型。v Avg=sum/count4.3.14.3.1 多維分析基礎(chǔ):聚集函數(shù)分類(lèi)多維分析基礎(chǔ):聚集函數(shù)分類(lèi)23n 整體型聚集函數(shù)v 如果一個(gè)函數(shù)不能由其它函數(shù)進(jìn)行代數(shù)運(yùn)算得出,則稱(chēng)其為整體。v Median、rankv 在計(jì)算時(shí),需要同時(shí)得到所有的數(shù)據(jù),需要消耗較多的資源,有較大的計(jì)算代價(jià)。4.3.14.3.1 多維分析基礎(chǔ):聚集函數(shù)分類(lèi)多維分析基礎(chǔ):聚集函數(shù)分類(lèi)24v 多維分析操作是指對(duì)數(shù)據(jù)立方體執(zhí)行切片、切塊、旋轉(zhuǎn)、下鉆、上卷等各種分析操作,剖析數(shù)據(jù),使用戶(hù)能從多角度、多側(cè)面觀(guān)察數(shù)據(jù)庫(kù)

8、中的數(shù)據(jù),從而深入了解包含在數(shù)據(jù)中的信息和內(nèi)涵。4.3.24.3.2 常用多維分析操作常用多維分析操作251. 1. 切片(切片(SliceSlice)v 定義:在數(shù)據(jù)立方體的某一維上選定一個(gè)維成員的動(dòng)作。v 有多維數(shù)據(jù)集(維1,維2,維i,維n,觀(guān)察變量),如果確定了某個(gè)維成員維i 的值,則稱(chēng):在維i上的一個(gè)切片為(維 1,維2,維i成員,維n,觀(guān)察變量)。261. 1. 切片(切片(SliceSlice)272. 2. 切塊(切塊(dicedice)v 定義:如果在一個(gè)多維數(shù)據(jù)集上對(duì)兩個(gè)及其以上的維選定維成員的操作稱(chēng)為切塊。v 如有多維數(shù)據(jù)集(維1,維2,維i,維k,維n,觀(guān)察變量),對(duì)維

9、i,維k,選定了維成員,那么(維1,維2,維i成員,維k成員,維n,觀(guān)察變量)就是多維數(shù)據(jù)集(維1,維2,維i,維k,維n,觀(guān)察變量)在維i,維k上的一個(gè)切塊。 28v 定義:改變數(shù)據(jù)立方體維的次序的動(dòng)作。3.3. 旋轉(zhuǎn)(旋轉(zhuǎn)(rotaterotate)293.3. 旋轉(zhuǎn)(旋轉(zhuǎn)(rotaterotate)30v 舉例:旋轉(zhuǎn)前的維方向2002年2003年1季度2季度3季度4季度1季度2季度3季度4季度北京市123564566134562355上海市13410398871021399782天津市67735996736962943.3. 旋轉(zhuǎn)(旋轉(zhuǎn)(rotaterotate)31v 旋轉(zhuǎn)后的維方向(

10、不同維度間的旋轉(zhuǎn)操作)北京市上海市天津市2002年1季度123134672季度56103733季度4598594季度6687962003年1季度134102732季度56139693季度2397622002年2003年1季度2季度3季度4季度1季度2季度3季度4季度北京市123564566134562355上海市13410398871021399782天津市67735996736962943.3. 旋轉(zhuǎn)(旋轉(zhuǎn)(rotaterotate)32v 旋轉(zhuǎn)后的維方向(維度層次上的旋轉(zhuǎn)操作)2002年2003年1季度2季度3季度4季度1季度2季度3季度4季度北京市123564566134562355上海

11、市13410398871021399782天津市67735996736962941季度2季度3季度4季度20022003200220032002200320022003北京市123134565645236655上海市13410210313998978782天津市67737369596296943.3. 旋轉(zhuǎn)(旋轉(zhuǎn)(rotaterotate)33v 定義:是指在某一個(gè)分析過(guò)程中,用戶(hù)可能需要從更多的維或者某個(gè)維的更細(xì)層次上來(lái)觀(guān)察數(shù)據(jù)的操作。4.4. 下鉆下鉆(drill downdrill down)34v 定義:是與下鉆操作相反的操作類(lèi)型。是指為了看到更粗的數(shù)據(jù)的操作過(guò)程。5.5. 上卷(上卷

12、(roll uproll up)35v 舉例:部門(mén)銷(xiāo)售部門(mén)190部門(mén)260部門(mén)3802004年部門(mén)1季度2季度3季度4季度部門(mén)120203515部門(mén)22551515部門(mén)3201518275.5. 上卷(上卷(roll uproll up)36v 除上述幾種常用多維分析操作以外,包有:維操作、屬性操作等。4.3.34.3.3 維操作與屬性操作維操作與屬性操作37v 維是多維數(shù)據(jù)模型中的核心概念。v 一個(gè)維中又包含有:層次、層和成員。1 1)維操作)維操作銷(xiāo)售地區(qū)銷(xiāo)售地區(qū)西南西南華中華中華東華東四川四川云南云南河南河南湖北湖北江蘇江蘇上海上海38v 維的操作 給定維標(biāo)識(shí)求維名字;給定維名字求維標(biāo)識(shí)

13、;求一個(gè)維中成員的個(gè)數(shù)。 給定層次的標(biāo)識(shí)或名,求層次中的所有層。 給定層標(biāo)識(shí)或名字,求層中成員的個(gè)數(shù);1 1)維操作)維操作39v 舉例:結(jié)合下圖,以時(shí)間維為例,給出的一些典型操作。 求時(shí)間維中的成員個(gè)數(shù):時(shí)間.counts,其中此處counts是操作符。 求“2月份”的父成員:時(shí)間.年 .季度.月.2月份.parent,得到的結(jié)果將是:時(shí)間.年 .季度.第1季度。年年季度季度月月星期星期日日1 1)維操作)維操作40v 目的:按照成員的屬性進(jìn)行特征分析。v 成員屬性:用于進(jìn)一步說(shuō)明成員的特征。v 屬性操作:豐富了多維數(shù)據(jù)分析,使得不僅可以根據(jù)層次進(jìn)行操作,而且還可以按成員的屬性進(jìn)行特征分析。

14、v 舉例:商品維的層次為商品代碼(ArticalID)FamilyGroupAreaTop(如表4.5),商店維的層次為(ShopID)CityRegionCountryTop(如表4.6)2)屬性操作412)屬性操作42v 其中:CAMC的Video在德國(guó)北部銷(xiāo)售89臺(tái),南部銷(xiāo)售137臺(tái),VCR.2)屬性操作434.3 4.3 多維分析操作多維分析操作4.4 4.4 多維查詢(xún)語(yǔ)言多維查詢(xún)語(yǔ)言聯(lián)機(jī)分析處理技術(shù)聯(lián)機(jī)分析處理技術(shù)2 244v MDX(多維表達(dá)式的英文首字母縮寫(xiě)詞)是一種語(yǔ)法,支持多維對(duì)象與數(shù)據(jù)的定義和操作。v 提供了對(duì)數(shù)據(jù)立方體、維、度量等OLAP環(huán)境下的對(duì)象進(jìn)行創(chuàng)建、修改、刪除的

15、命令。v MDX查詢(xún)的語(yǔ)法與 SQL 查詢(xún)的語(yǔ)法類(lèi)似。4.4.14.4.1 MDXMDX簡(jiǎn)介簡(jiǎn)介45v MDX語(yǔ)句的構(gòu)成: 查詢(xún)所涉及的數(shù)據(jù)立方體; 產(chǎn)生的結(jié)果數(shù)據(jù)集合中軸的個(gè)數(shù); 數(shù)據(jù)立方體的維與結(jié)果數(shù)據(jù)集合中軸的對(duì)應(yīng)關(guān)系; 每個(gè)維上所要查詢(xún)的成員。4.4.14.4.1 MDXMDX簡(jiǎn)介簡(jiǎn)介46v 舉例:假設(shè)要對(duì)一個(gè)具有三個(gè)維度的數(shù)據(jù)立方體SALESCUBE進(jìn)行查詢(xún),該數(shù)據(jù)立方體的三個(gè)維度分別是時(shí)間維、地區(qū)維、產(chǎn)品維,有一個(gè)度量值:銷(xiāo)售額sales?,F(xiàn)在用戶(hù)需要了解北京和上海第一季度和第二季度四月份所銷(xiāo)售的電視機(jī)情況和在第一、二季度銷(xiāo)售寸衣的情況,并且要求結(jié)果數(shù)據(jù)集合中產(chǎn)品維和時(shí)間維在同一個(gè)

16、軸上。4.4.14.4.1 MDXMDX簡(jiǎn)介簡(jiǎn)介47v 該查詢(xún)語(yǔ)句格式:SELECT(TV,Qtr1),(TV,Qtr2.Apr),(Clothes.Shrit,Qtr1),(Clothes.Shrit,Qtr2)ONCOLUMNSBeijing,ShanghaiONROWSFROMSALESCUBEWHEREsales4.4.14.4.1 MDXMDX簡(jiǎn)介簡(jiǎn)介48v 有關(guān)說(shuō)明: MDX關(guān)鍵字:SELECT 、COLUMNS、ROWS、FROM 、WHERE4.4.14.4.1 MDXMDX簡(jiǎn)介簡(jiǎn)介49v 查詢(xún)結(jié)果:4.4.14.4.1 MDXMDX簡(jiǎn)介簡(jiǎn)介50514.3 4.3 多維分析操作

17、多維分析操作4.4 4.4 多維查詢(xún)語(yǔ)言多維查詢(xún)語(yǔ)言4.5 4.5 多維數(shù)據(jù)展示多維數(shù)據(jù)展示聯(lián)機(jī)分析處理技術(shù)聯(lián)機(jī)分析處理技術(shù)2 252v 多維數(shù)據(jù)往往超過(guò)三維,如何在計(jì)算機(jī)屏幕上方便、清楚地展示三維分析的結(jié)果?4.54.5 多維數(shù)據(jù)展示多維數(shù)據(jù)展示53v 要解決的主要問(wèn)題: 某個(gè)具體的維安排在空間的哪個(gè)方向? 如何展示維的層次?4.5.14.5.1 三維數(shù)據(jù)展示三維數(shù)據(jù)展示54v 核心思想: 切片 嵌套:按照層的抽象程度,依次在水平和垂直方向排列。4.5.14.5.1 三維數(shù)據(jù)展示三維數(shù)據(jù)展示55v 舉例:假設(shè)一個(gè)數(shù)據(jù)立方體有時(shí)間維、地區(qū)維、商品維。商品維有兩個(gè)層,具體商品層和商品大類(lèi)層。時(shí)間維有年、季度、月和日4個(gè)層。地區(qū)維有商店、城市、地區(qū)和國(guó)家4個(gè)層。v 北京在2011年4個(gè)季度中部分商品的銷(xiāo)售額如何展示?4.5.14.5.1 三維數(shù)據(jù)展示三維數(shù)據(jù)展示56v 展示結(jié)果之一:其它展示結(jié)果?4.5.14.5.1 三維數(shù)據(jù)展示三維數(shù)據(jù)展示57v 基本思路: 切片:按地區(qū)維,成員北京 時(shí)間維和商品維分別安排在垂直和水平方向 嵌套:時(shí)間維展示年、季度兩層

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論