數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例_第1頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例_第2頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例_第3頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例_第4頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例_第5頁(yè)
已閱讀5頁(yè),還剩72頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)倉(cāng)庫(kù)與OLAP

廣東工業(yè)大學(xué)艾丹祥數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例

案例背景Pub是美國(guó)的一家圖書出版公司,希望構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)。其中銷售部門的需求比較急迫,希望能在短時(shí)間內(nèi)實(shí)現(xiàn)對(duì)銷售業(yè)績(jī)的分析。根據(jù)Pub公司的情況,考慮采用金博爾的DMDW的開發(fā)模式,即先為銷售部門設(shè)計(jì)一個(gè)數(shù)據(jù)集市,其他部門數(shù)據(jù)集市的設(shè)計(jì)可參照此模型。收集項(xiàng)目需求準(zhǔn)備:研究選定的業(yè)務(wù)過程(術(shù)語(yǔ)、步驟、度量方法)采訪:鉆研選定的業(yè)務(wù)過程(理解使其運(yùn)作所需的分析、數(shù)據(jù)模型和技術(shù))分析:業(yè)務(wù)過程相關(guān)的數(shù)據(jù)資源歸檔對(duì)于Pub公司:選定“銷售”業(yè)務(wù)過程后,通過采訪了解其與銷售分析相關(guān)的問題,如通過什么方式銷售、有哪些銷售地區(qū)等。收集項(xiàng)目需求基本業(yè)務(wù)狀況Pub公司在美國(guó)各地均有出版社,出版社負(fù)責(zé)聯(lián)系作者、出版圖書,已出版的圖書將由各地的代銷書店進(jìn)行銷售。收集項(xiàng)目需求業(yè)務(wù)分析需求銷售部門最關(guān)心銷售的業(yè)績(jī),主要通過銷售額和銷售量進(jìn)行考核。數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例業(yè)務(wù)分析需求希望針對(duì)每個(gè)出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)國(guó)家的出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)州的出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每城市的出版社作圖書銷售業(yè)績(jī)分析。希望針對(duì)每本圖書作銷售業(yè)績(jī)分析。希望針對(duì)每類圖書做銷售業(yè)績(jī)分析。希望針對(duì)每年出版的圖書做銷售業(yè)績(jī)分析。希望針對(duì)每位作者所編寫的圖書做銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)書店作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)州的書店作圖書銷售業(yè)績(jī)分析。希望針對(duì)每個(gè)城市的書店作圖書銷售業(yè)績(jī)分析。希望針對(duì)年、月、日作銷售業(yè)績(jī)分析。數(shù)據(jù)倉(cāng)庫(kù)開發(fā)實(shí)例銷售業(yè)務(wù)的總線矩陣業(yè)務(wù)實(shí)體業(yè)務(wù)過程出版社圖書書店出版日期銷售XXXX收集項(xiàng)目需求數(shù)據(jù)資源狀況公司的業(yè)務(wù)數(shù)據(jù)庫(kù)為Pubs數(shù)據(jù)庫(kù)收集項(xiàng)目需求數(shù)據(jù)資源狀況Pubs中與銷售業(yè)務(wù)有關(guān)的表根據(jù)總線矩矩陣建立模模型氣泡圖圖建立多維數(shù)數(shù)據(jù)模型業(yè)務(wù)實(shí)體業(yè)務(wù)過程出版社圖書書店銷售日期銷售XXXX訂單銷售日期圖書書店出版社銷售日期建立多維數(shù)數(shù)據(jù)模型訂單銷售日期圖書書店出版社銷售日期日期維度的的粒度級(jí)別別通常為一一天日期維度表表需要專門門生成(如如利用Excel工具)日期維度表表中的時(shí)間間范圍根據(jù)據(jù)業(yè)務(wù)需求求決定建立多維數(shù)數(shù)據(jù)模型銷售日期日期維度至至少要包含含年、月、、日期三個(gè)個(gè)屬性建立多維數(shù)數(shù)據(jù)模型DimDate屬性名稱功能描述FullDate日期DateName日期名Month月MonthName月名Year年其中FullDate、Month、MonthName形成層次。。出版社建立多維數(shù)數(shù)據(jù)模型訂單銷售日期圖書書店出版社出版社建立多維數(shù)數(shù)據(jù)模型字段名稱說明pub_id出版社編號(hào)pub_name出版社名city所在市state所在州country所在國(guó)出版社出版社維度度可以直接接包含出版版社名、市市、州、國(guó)國(guó)家等屬性性建立多維數(shù)數(shù)據(jù)模型DimPublisher屬性名稱功能描述pub_id出版社編號(hào)pub_name出版社名稱pub_city城市pub_state州pub_country國(guó)家其中pub_name、pub_city、pub_state、pub_country形成層次。。書店建立多維數(shù)數(shù)據(jù)模型訂單出版日期圖書書店出版社書店建立多維數(shù)數(shù)據(jù)模型字段名稱說明stor_id書店編號(hào)stor_name書店名稱city所在市state所在州書店書店維度可可以直接包包含書店名名、市、州州等屬性建立多維數(shù)數(shù)據(jù)模型圖書建立多維數(shù)數(shù)據(jù)模型訂單出版日期圖書書店出版社圖書建立多維數(shù)數(shù)據(jù)模型字段名稱說明title_id圖書編號(hào)pub_id出版社編號(hào)title圖書名type圖書類型price圖書單價(jià)pubdate出版日期圖書圖書維度可可以直接包包含圖書名名、類型、、出版年等等屬性建立多維數(shù)數(shù)據(jù)模型DimBook屬性名稱功能描述book_id圖書編號(hào)book_name圖書名book_type圖書類型pubyear出版年其中book_name、book_type形成層次結(jié)構(gòu)構(gòu)。圖書圖書維度無(wú)法法直接包含作作者屬性建立多維數(shù)據(jù)據(jù)模型作者建立多維數(shù)據(jù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)系系作者建立多維數(shù)據(jù)據(jù)模型字段名稱說明au_id作者編號(hào)au_lname作者名au_fname作者姓作者作者維度可以以直接包含作作者名等屬性性建立多維數(shù)據(jù)據(jù)模型DimAuthor屬性名稱功能描述au_id作者編號(hào)au_name作者名au_fname+au_lname圖書作者關(guān)系系建立多維數(shù)據(jù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)系系圖書作者關(guān)系系建立多維數(shù)據(jù)據(jù)模型字段名稱說明au_id作者編號(hào)title_id圖書編號(hào)建立多維數(shù)據(jù)據(jù)模型圖書作者關(guān)系系圖書作者關(guān)系系事實(shí)表只包包含鍵值列,,不包含度量量值列,其目目的是為了記記錄圖書和作作者之間的關(guān)關(guān)系事實(shí)。FactBookAuthor(中間事實(shí)表)屬性名稱功能描述鍵值列book_id圖書編號(hào)au_id作者編號(hào)訂單建立多維數(shù)據(jù)據(jù)模型訂單出版日期圖書書店出版社作者圖書作者關(guān)系系訂單建立多維數(shù)據(jù)據(jù)模型字段名稱說明stor_id書店編號(hào)title_id圖書編號(hào)qty訂購(gòu)數(shù)量ord_date訂購(gòu)日期建立多維數(shù)據(jù)據(jù)模型訂單訂單事實(shí)表中中要包含日期期、出版社、、書店、圖書書等鍵值列,,還要包含銷銷售額、銷售售量2個(gè)度量值列,,其目的是為為了記錄銷售售事實(shí)。建立多維數(shù)據(jù)據(jù)模型訂單FactSales屬性名稱來(lái)源功能描述鍵值列pub_idpublishers表出版社編號(hào)stor_idstores表書店編號(hào)book_idtitles表圖書編號(hào)ord_datesales表銷售日期度量值列qtysales表銷售量amount計(jì)算生成(qty*price)銷售額建立多維數(shù)據(jù)據(jù)模型最終,確定數(shù)數(shù)據(jù)集市包括括以下多維數(shù)數(shù)據(jù)模型:主題——圖書銷售業(yè)績(jī)績(jī)度量值——圖書銷售量圖書銷售額維度——出版社(國(guó)別別-州-城市-出版社)作者(作者姓姓名)圖書(圖書類類別-單一圖書,圖圖書出版年))書店(州-市-書店)銷售日期(年年-月-日)Microsoft數(shù)據(jù)倉(cāng)庫(kù)工具具集核心數(shù)據(jù)倉(cāng)庫(kù)庫(kù)工具集——SQLServer關(guān)系引擎(RDBMS):實(shí)現(xiàn)關(guān)系系數(shù)據(jù)庫(kù)SQLServerIntegrationService(SSIS):實(shí)現(xiàn)ETL系統(tǒng)SQLServerAnalysisService(SSAS):實(shí)現(xiàn)多維數(shù)據(jù)據(jù)庫(kù),支持OLAP查詢,實(shí)現(xiàn)數(shù)數(shù)據(jù)挖掘SQLServerReportingService(SSRS):定義報(bào)表開發(fā)和管理工工具:SQLServerBIDevelopmentStudio(BIDS)和SQLServerManagementStudio。Microsoft數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)統(tǒng)的體系結(jié)構(gòu)構(gòu)源系統(tǒng)數(shù)據(jù)庫(kù)ETL聚合(支持OLAP)源系統(tǒng)數(shù)據(jù)庫(kù)源系統(tǒng)數(shù)據(jù)庫(kù)事實(shí)表和維度表度量和維度前端工具核心數(shù)據(jù)倉(cāng)庫(kù)RDBMSSSISSSASSSRSETL過程利用SQLServerIntegrationService對(duì)Pubs數(shù)據(jù)庫(kù)進(jìn)行抽抽取和整理,,形成Pubs_DW數(shù)據(jù)倉(cāng)庫(kù)。先將數(shù)據(jù)從源源事務(wù)數(shù)據(jù)中中提取到中間間數(shù)據(jù)庫(kù)Pubs_Stage再對(duì)中間數(shù)據(jù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)進(jìn)行轉(zhuǎn)換并加加載到目標(biāo)關(guān)關(guān)系數(shù)據(jù)倉(cāng)庫(kù)庫(kù)Pubs_DWETL過程Pubs數(shù)據(jù)庫(kù)(業(yè)務(wù)數(shù)據(jù)庫(kù))PublishersPub_infoEmployeeJobsRoychedTitlesAuthorsTitleauthorSalesStoresDiscountsPubs_Stage(臨時(shí)數(shù)據(jù)庫(kù))PublishersTitlesTitleauthorAuthorSalesStoresDatePubs_DW(數(shù)據(jù)倉(cāng)庫(kù))FactSalesFactBookAuthorDimPublisherDimBookDimAuthorDimStoreDimDateDTSSSISDate.xlsETL過程利用DTS和SQLServerIntegrationService對(duì)Pubs數(shù)據(jù)庫(kù)進(jìn)行抽抽取和整理,,形成Pubs_DW數(shù)據(jù)倉(cāng)庫(kù)。先將數(shù)據(jù)從源源事務(wù)數(shù)據(jù)中中提取到中間間數(shù)據(jù)庫(kù)Pubs_Stage(DTS工具)再對(duì)中間數(shù)據(jù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)進(jìn)行轉(zhuǎn)換并加加載到目標(biāo)關(guān)關(guān)系數(shù)據(jù)倉(cāng)庫(kù)庫(kù)Pubs_DW(SSIS工具)ETL過程利用DTS將pubs數(shù)據(jù)庫(kù)和date.xls中的數(shù)據(jù)直接接導(dǎo)出到pubs_stage數(shù)據(jù)庫(kù)中。Pubs_Stage的結(jié)構(gòu)ETL過程新建pubs_DW數(shù)據(jù)倉(cāng)庫(kù)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的的DimDate表DimDate屬性名稱功能描述Sqlserver數(shù)據(jù)類型FullDate日期DatetimeDateName日期名varchar(20)Month月intMonthName月名varchar(20)Year年intETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的的DimPublisher表DimPublisher屬性名稱功能描述Sqlserver數(shù)據(jù)類型pub_id出版社編號(hào)Varchar(4)pub_name出版社名稱varchar(40)pub_city城市varchar(20)pub_state州varchar(2)pub_country國(guó)家varchar(30)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的的DimStore表DimStore屬性名稱功能描述Sqlserver數(shù)據(jù)類型store_id書店編號(hào)Varchar(4)store_name書店名稱varchar(40)store_city城市varchar(20)store_state州varchar(2)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的的DimBook表DimBook屬性名稱功能描述Sqlserver數(shù)據(jù)類型book_id圖書編號(hào)Varchar(6)book_name圖書名varchar(80)book_type圖書類型varchar(12)pubyear出版年intETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的的DimAuthor表DimAuthor屬性名稱功能描述Sqlserver數(shù)據(jù)類型au_id作者編號(hào)varchar(11)au_name作者名au_fname+au_lnamevarchar(80)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的的FactBookAuthor表FactBookAuthor屬性名稱功能描述Sqlserver數(shù)據(jù)類型book_id圖書編號(hào)Varchar(6)au_id作者編號(hào)varchar(11)ETL過程pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中的的FactSales表FactSales屬性名稱來(lái)源功能描述Sqlserver數(shù)據(jù)類型pub_idpublishers表出版社編號(hào)Varchar(4)stor_idstores表書店編號(hào)Varchar(4)book_idtitles表圖書編號(hào)Varchar(6)ord_datesales表銷售日期datetimeqtysales表銷售量smallintamount計(jì)算生成(qty*price)銷售額moneyETL過程新建SSIS項(xiàng)目,并將pubs_stage數(shù)據(jù)庫(kù)中的數(shù)數(shù)據(jù)轉(zhuǎn)換并加加載到pubs_DW數(shù)據(jù)倉(cāng)庫(kù)中。。SSIS項(xiàng)目由若干SSIS程序包的構(gòu)成成,其中一個(gè)個(gè)為主程序包包(啟動(dòng))。。SSIS程序包由一個(gè)個(gè)控制流和若若干個(gè)數(shù)據(jù)流流構(gòu)成。多維數(shù)據(jù)集和和OLAPOLAP的提出(1993年)1981年圖靈獎(jiǎng)獲得得者:埃德加·科德(EdgarFrankCodd)—“關(guān)系數(shù)據(jù)庫(kù)之之父”多維數(shù)據(jù)集和和OLAP1995年OLAP專門研究機(jī)構(gòu)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)??焖傩裕‵ast)——OLAP系統(tǒng)必須能快快速響應(yīng)用戶戶的分析查詢?cè)円?,?duì)于于用戶大部分分分析要求在在5秒鐘內(nèi)作出反反應(yīng),否則超超過30秒用戶可能會(huì)會(huì)失去分析的的主線索,影影響分析質(zhì)量量。多維數(shù)據(jù)集和和OLAP1995年OLAP專門研究機(jī)構(gòu)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。分析性(Analysis)——OLAP系統(tǒng)能處理任任何與用戶和和應(yīng)用有關(guān)的的邏輯分析和和統(tǒng)計(jì)分析,,在需要的情情況下還允許許用戶無(wú)需編編程就可為分分析和生成報(bào)報(bào)表定義一些些新的特殊運(yùn)運(yùn)算,將其作作為分析的一一部分,并以以用戶理想的的方式給出報(bào)報(bào)告。用戶可可以在OLAP平臺(tái)上進(jìn)行數(shù)數(shù)據(jù)分析,也也可以與其他他外部分析工工具交互信息息,同時(shí)應(yīng)提提供靈活開放放的報(bào)表處理理功能,保存存分析結(jié)果。。多維數(shù)據(jù)集和和OLAP1995年OLAP專門研究機(jī)構(gòu)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。共享性(Shared)——OLAP系統(tǒng)應(yīng)能實(shí)現(xiàn)現(xiàn)在多用戶環(huán)環(huán)境下的安全全保密要求和和并發(fā)控制。。多個(gè)用戶同同時(shí)使用,能能夠根據(jù)用戶戶所屬的安全全級(jí)別,讓他他們只能看到到自身權(quán)限下下的信息。多維數(shù)據(jù)集和和OLAP1995年OLAP專門研究機(jī)構(gòu)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。多維性(Multidimensional)——OLAP系統(tǒng)能對(duì)數(shù)據(jù)據(jù)進(jìn)行多維視視圖和分析,,是OLAP的關(guān)鍵屬性。。多維數(shù)據(jù)集和和OLAP1995年OLAP專門研究機(jī)構(gòu)構(gòu)OLAPReport提出關(guān)于OLAP的簡(jiǎn)明定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。信息性(Information)——OLAP系統(tǒng)具有管理理數(shù)據(jù)和獲得得信息的能力力,能管理大大量的數(shù)據(jù)并并即時(shí)地獲得得用戶所需信信息。多維數(shù)據(jù)集和和OLAPOLAP與數(shù)據(jù)倉(cāng)庫(kù)關(guān)關(guān)系緊密OLAP分析與數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的關(guān)系十十分緊密。數(shù)數(shù)據(jù)倉(cāng)庫(kù)的建建立,解決了了依據(jù)主題進(jìn)進(jìn)行數(shù)據(jù)存儲(chǔ)儲(chǔ)的問題,提提高了數(shù)據(jù)的的存取速度;;而OLAP分析構(gòu)成了數(shù)數(shù)據(jù)倉(cāng)庫(kù)的表表現(xiàn)層,將數(shù)數(shù)據(jù)倉(cāng)庫(kù)中的的數(shù)據(jù)通過不不同的維和指指標(biāo),靈活地地展現(xiàn)出來(lái),,提高了數(shù)據(jù)據(jù)的展現(xiàn)能力力,進(jìn)而提高高了數(shù)據(jù)的分分析能力。多維數(shù)數(shù)據(jù)集集和OLAP多維數(shù)數(shù)據(jù)集集多維數(shù)數(shù)據(jù)集集(cube)——OLAP中的主主要對(duì)對(duì)象,,通常常也稱稱作多多維立立方體體。cube是一個(gè)個(gè)數(shù)據(jù)據(jù)集合合,通通常由由數(shù)據(jù)據(jù)倉(cāng)庫(kù)庫(kù)的子子集構(gòu)構(gòu)造,,把一一組維維度和和度量量值合合理組組織,,最后后匯總總成多多維結(jié)結(jié)構(gòu)。。多維數(shù)數(shù)據(jù)集集和OLAP多維數(shù)數(shù)據(jù)集集銷售數(shù)量10000玩具電器銷售地區(qū)北京上海江蘇1234服裝化妝品產(chǎn)品時(shí)間(月)以時(shí)間、銷售地區(qū)、產(chǎn)品三個(gè)維度構(gòu)成的多維數(shù)據(jù)集多維數(shù)數(shù)據(jù)集集和OLAP的實(shí)現(xiàn)現(xiàn)以Pubs_DW數(shù)據(jù)庫(kù)庫(kù)為基基礎(chǔ),,利用用SQLServerAnalysisService開發(fā)PubsAS多維數(shù)數(shù)據(jù)庫(kù)庫(kù)以支支持OLAP分析。。Pubs_DW(關(guān)系系數(shù)據(jù)據(jù)庫(kù)))FactSalesFactBookAuthorDimPublisherDimBookDimAuthorDimStoreDimDateSSASPubs_AS(多維維數(shù)據(jù)據(jù)集))SalesCube(Sales多維數(shù)數(shù)據(jù)集集)Sales度量值值組::SalesAmountSalesQtyBookAuthor中間度度量值值組維度::BookAuthorStorePublisherDate多維數(shù)數(shù)據(jù)集集和OLAP的實(shí)現(xiàn)現(xiàn)多維數(shù)據(jù)庫(kù)的數(shù)據(jù)源(DS)pubs_DW數(shù)據(jù)源視圖(DSV)多維數(shù)據(jù)庫(kù)pubs_AS多維數(shù)據(jù)集(Cube)度量值和維度聚合SSAS多維數(shù)數(shù)據(jù)庫(kù)庫(kù)體系系結(jié)構(gòu)構(gòu)多維數(shù)數(shù)據(jù)集集和OLAP的實(shí)現(xiàn)現(xiàn)分析服服務(wù)項(xiàng)項(xiàng)目開開發(fā)步步驟創(chuàng)建數(shù)數(shù)據(jù)源源創(chuàng)建數(shù)數(shù)據(jù)源源視圖圖創(chuàng)建維維度((公共共維度度)創(chuàng)建多多維數(shù)數(shù)據(jù)集集(度度量值值)處理、、部署署項(xiàng)目目瀏覽多多維數(shù)數(shù)據(jù)集集多維數(shù)數(shù)據(jù)集集和OLAP的實(shí)現(xiàn)現(xiàn)分析服服務(wù)項(xiàng)項(xiàng)目開開發(fā)要要點(diǎn)每個(gè)分分析服服務(wù)項(xiàng)項(xiàng)目必必須至至少包包含一一個(gè)數(shù)數(shù)據(jù)源源每個(gè)分分析服服務(wù)項(xiàng)項(xiàng)目必必須至至少包包含一一個(gè)數(shù)數(shù)據(jù)源源視圖圖每個(gè)分分析服服務(wù)項(xiàng)項(xiàng)目必必須包包含至至少一一個(gè)維維度和和多維維數(shù)據(jù)據(jù)集多維數(shù)數(shù)據(jù)集集必須須包含含在一一個(gè)分分析服服務(wù)項(xiàng)項(xiàng)目中中每個(gè)分分析服服務(wù)項(xiàng)項(xiàng)目可可以包包含多多個(gè)多多維數(shù)數(shù)據(jù)集集多維數(shù)數(shù)據(jù)集集和OLAP多維數(shù)數(shù)據(jù)分分析方方法OLAP多維分分析對(duì)對(duì)多維維數(shù)據(jù)據(jù)集中中的數(shù)數(shù)據(jù)進(jìn)進(jìn)行上卷、、下鉆鉆、切切片、、切塊塊、旋旋轉(zhuǎn)等各種種分析析操作作,以以便剖剖析數(shù)數(shù)據(jù),,使用用戶從從多個(gè)個(gè)角度度、多多個(gè)側(cè)側(cè)面、、多個(gè)個(gè)層次次來(lái)觀觀察多多維數(shù)數(shù)據(jù),,從而而發(fā)掘掘數(shù)據(jù)據(jù)中蘊(yùn)蘊(yùn)涵的的對(duì)自自己有有用的的信息息。多維數(shù)數(shù)據(jù)集集和OLAP多維數(shù)數(shù)據(jù)分分析方方法多維數(shù)數(shù)據(jù)集集和OLAP多維數(shù)數(shù)據(jù)分分析方方法——切片切片((Slice)——對(duì)多維維數(shù)據(jù)據(jù)集的的某個(gè)個(gè)維選選定一一個(gè)維維成員員,這這種選選擇操操作就就稱為為切片片。例如::Cube(維1,維2,…,維i,…,維n,度量量值))對(duì)維i選定定了了某某個(gè)個(gè)維維成成員員,,則則(維維1,維維2,…,維i成員員,…,維維n,度度量量值值))就是是該該Cube在維維i上的的一一個(gè)個(gè)切切片片,,切切片片的的數(shù)數(shù)量量取取決決于于維維i上的的維維成成員員的的個(gè)個(gè)數(shù)數(shù)。。多維維數(shù)數(shù)據(jù)據(jù)集集和和OLAP多維維數(shù)數(shù)據(jù)據(jù)分分析析方方法法———切片片“時(shí)間間==第第1季度度”在三三維維立立方方體體上上切切片片的的結(jié)結(jié)果果是是得得到到一一個(gè)個(gè)二二維維的的平平面面數(shù)數(shù)據(jù)據(jù)4.1OLAP概述述多維維數(shù)數(shù)據(jù)據(jù)分分析析方方法法———切塊塊切塊塊((Dice)———在一一個(gè)個(gè)多多維維數(shù)數(shù)據(jù)據(jù)集集中中對(duì)對(duì)兩兩個(gè)個(gè)及及兩兩個(gè)個(gè)以以上上的的維維選選定定維維成成員員的的操操作作可可以以稱稱為為切切塊塊。。例如如::Cube(維維1,維2,……,維i,……,維k,……,維n,度量量值值))對(duì)維維i,…,維維k,選選定定了了維維成成員員,,則則(維維1,維2,……,維i成員員,……,維k成員員,……,維n,度量量值值)就是是該該Cube在維維i,……,維k上的的一一個(gè)個(gè)切切塊塊。。顯然然,,當(dāng)當(dāng)i=k時(shí),,切切塊塊操操作作就就退退化

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論