版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)倉(cāng)庫(kù)與OLAP
廣東工業(yè)大學(xué)艾丹祥數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)實(shí)例
案例背景Pub是美國(guó)的一家圖書(shū)出版公司,希望構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)。其中銷(xiāo)售部門(mén)的需求比較急迫,希望能在短時(shí)間內(nèi)實(shí)現(xiàn)對(duì)銷(xiāo)售業(yè)績(jī)的分析。根據(jù)Pub公司的情況,考慮采用金博爾的DMDW的開(kāi)發(fā)模式,即先為銷(xiāo)售部門(mén)設(shè)計(jì)一個(gè)數(shù)據(jù)集市,其他部門(mén)數(shù)據(jù)集市的設(shè)計(jì)可參照此模型。收集項(xiàng)目需求準(zhǔn)備:研究選定的業(yè)務(wù)過(guò)程(術(shù)語(yǔ)、步驟、度量方法)采訪:鉆研選定的業(yè)務(wù)過(guò)程(理解使其運(yùn)作所需的分析、數(shù)據(jù)模型和技術(shù))分析:業(yè)務(wù)過(guò)程相關(guān)的數(shù)據(jù)資源歸檔對(duì)于Pub公司:選定“銷(xiāo)售”業(yè)務(wù)過(guò)程后,通過(guò)采訪了解其與銷(xiāo)售分析相關(guān)的問(wèn)題,如通過(guò)什么方式銷(xiāo)售、有哪些銷(xiāo)售地區(qū)等。收集項(xiàng)目需求基本業(yè)務(wù)狀況Pub公司在美國(guó)各地均有出版社,出版社負(fù)責(zé)聯(lián)系作者、出版圖書(shū),已出版的圖書(shū)將由各地的代銷(xiāo)書(shū)店進(jìn)行銷(xiāo)售。收集項(xiàng)目需求業(yè)務(wù)分析需求銷(xiāo)售部門(mén)最關(guān)心銷(xiāo)售的業(yè)績(jī),主要通過(guò)銷(xiāo)售額和銷(xiāo)售量進(jìn)行考核。數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)實(shí)例業(yè)務(wù)分析需求希望針對(duì)每個(gè)出版社作圖書(shū)銷(xiāo)售業(yè)績(jī)分析。希望針對(duì)每個(gè)國(guó)家的出版社作圖書(shū)銷(xiāo)售業(yè)績(jī)分析。希望針對(duì)每個(gè)州的出版社作圖書(shū)銷(xiāo)售業(yè)績(jī)分析。希望針對(duì)每城市的出版社作圖書(shū)銷(xiāo)售業(yè)績(jī)分析。希望針對(duì)每本圖書(shū)作銷(xiāo)售業(yè)績(jī)分析。希望針對(duì)每類(lèi)圖書(shū)做銷(xiāo)售業(yè)績(jī)分析。希望針對(duì)每年出版的圖書(shū)做銷(xiāo)售業(yè)績(jī)分析。希望針對(duì)每位作者所編寫(xiě)的圖書(shū)做銷(xiāo)售業(yè)績(jī)分析。希望針對(duì)每個(gè)書(shū)店作圖書(shū)銷(xiāo)售業(yè)績(jī)分析。希望針對(duì)每個(gè)州的書(shū)店作圖書(shū)銷(xiāo)售業(yè)績(jī)分析。希望針對(duì)每個(gè)城市的書(shū)店作圖書(shū)銷(xiāo)售業(yè)績(jī)分析。希望針對(duì)年、月、日作銷(xiāo)售業(yè)績(jī)分析。數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)實(shí)例銷(xiāo)售業(yè)務(wù)的總線矩陣業(yè)務(wù)實(shí)體業(yè)務(wù)過(guò)程出版社圖書(shū)書(shū)店出版日期銷(xiāo)售XXXX收集項(xiàng)目需求數(shù)據(jù)資源狀況公司的業(yè)務(wù)數(shù)據(jù)庫(kù)為Pubs數(shù)據(jù)庫(kù)收集項(xiàng)目需求數(shù)據(jù)資源狀況Pubs中與銷(xiāo)售業(yè)務(wù)有關(guān)的表根據(jù)據(jù)總總線線矩矩陣陣建建立立模模型型氣氣泡泡圖圖建立立多多維維數(shù)數(shù)據(jù)據(jù)模模型型業(yè)務(wù)實(shí)體業(yè)務(wù)過(guò)程出版社圖書(shū)書(shū)店銷(xiāo)售日期銷(xiāo)售XXXX訂單銷(xiāo)售日期圖書(shū)書(shū)店出版社銷(xiāo)售售日日期期建立立多多維維數(shù)數(shù)據(jù)據(jù)模模型型訂單銷(xiāo)售日期圖書(shū)書(shū)店出版社銷(xiāo)售售日日期期日期期維維度度的的粒粒度度級(jí)級(jí)別別通通常常為為一一天天日期期維維度度表表需需要要專(zhuān)專(zhuān)門(mén)門(mén)生生成成((如如利利用用Excel工具))日期維維度表表中的的時(shí)間間范圍圍根據(jù)據(jù)業(yè)務(wù)務(wù)需求求決定定建立多多維數(shù)數(shù)據(jù)模模型銷(xiāo)售日日期日期維維度至至少要要包含含年、、月、、日期期三個(gè)個(gè)屬性性建立多多維數(shù)數(shù)據(jù)模模型DimDate屬性名稱(chēng)功能描述FullDate日期DateName日期名Month月MonthName月名Year年其中FullDate、Month、MonthName形成層層次。。出版社社建立多多維數(shù)數(shù)據(jù)模模型訂單銷(xiāo)售日期圖書(shū)書(shū)店出版社出版社社建立多多維數(shù)數(shù)據(jù)模模型字段名稱(chēng)說(shuō)明pub_id出版社編號(hào)pub_name出版社名city所在市state所在州country所在國(guó)出版社社出版社社維度度可以以直接接包含含出版版社名名、市市、州州、國(guó)國(guó)家等等屬性性建立多多維數(shù)數(shù)據(jù)模模型DimPublisher屬性名稱(chēng)功能描述pub_id出版社編號(hào)pub_name出版社名稱(chēng)pub_city城市pub_state州pub_country國(guó)家其中pub_name、pub_city、pub_state、pub_country形成層層次。。書(shū)店建立多多維數(shù)數(shù)據(jù)模模型訂單出版日期圖書(shū)書(shū)店出版社書(shū)店建立多多維數(shù)數(shù)據(jù)模模型字段名稱(chēng)說(shuō)明stor_id書(shū)店編號(hào)stor_name書(shū)店名稱(chēng)city所在市state所在州書(shū)店書(shū)店維維度可可以直直接包包含書(shū)書(shū)店名名、市市、州州等屬屬性建立多多維數(shù)數(shù)據(jù)模模型圖書(shū)建立多多維數(shù)數(shù)據(jù)模模型訂單出版日期圖書(shū)書(shū)店出版社圖書(shū)建立多多維數(shù)數(shù)據(jù)模模型字段名稱(chēng)說(shuō)明title_id圖書(shū)編號(hào)pub_id出版社編號(hào)title圖書(shū)名type圖書(shū)類(lèi)型price圖書(shū)單價(jià)pubdate出版日期圖書(shū)圖書(shū)維維度可可以直直接包包含圖圖書(shū)名名、類(lèi)類(lèi)型、、出版版年等等屬性性建立多多維數(shù)數(shù)據(jù)模模型DimBook屬性名稱(chēng)功能描述book_id圖書(shū)編號(hào)book_name圖書(shū)名book_type圖書(shū)類(lèi)型pubyear出版年其中book_name、book_type形成層層次結(jié)結(jié)構(gòu)。。圖書(shū)圖書(shū)維維度無(wú)無(wú)法直直接包包含作作者屬屬性建立多多維數(shù)數(shù)據(jù)模模型作者建立多多維數(shù)數(shù)據(jù)模模型訂單出版日期圖書(shū)書(shū)店出版社作者圖書(shū)作作者關(guān)關(guān)系作者建立多多維數(shù)數(shù)據(jù)模模型字段名稱(chēng)說(shuō)明au_id作者編號(hào)au_lname作者名au_fname作者姓作者作者維維度可可以直直接包包含作作者名名等屬屬性建立多多維數(shù)數(shù)據(jù)模模型DimAuthor屬性名稱(chēng)功能描述au_id作者編號(hào)au_name作者名au_fname+au_lname圖書(shū)作作者關(guān)關(guān)系建立多多維數(shù)數(shù)據(jù)模模型訂單出版日期圖書(shū)書(shū)店出版社作者圖書(shū)作作者關(guān)關(guān)系圖書(shū)作作者關(guān)關(guān)系建立多多維數(shù)數(shù)據(jù)模模型字段名稱(chēng)說(shuō)明au_id作者編號(hào)title_id圖書(shū)編號(hào)建立多多維數(shù)數(shù)據(jù)模模型圖書(shū)作作者關(guān)關(guān)系圖書(shū)作作者關(guān)關(guān)系事事實(shí)表表只包包含鍵鍵值列列,不不包含含度量量值列列,其其目的的是為為了記記錄圖圖書(shū)和和作者者之間間的關(guān)關(guān)系事事實(shí)。。FactBookAuthor(中間事實(shí)表)屬性名稱(chēng)功能描述鍵值列book_id圖書(shū)編號(hào)au_id作者編號(hào)訂單建立多多維數(shù)數(shù)據(jù)模模型訂單出版日期圖書(shū)書(shū)店出版社作者圖書(shū)作作者關(guān)關(guān)系訂單建立多多維數(shù)數(shù)據(jù)模模型字段名稱(chēng)說(shuō)明stor_id書(shū)店編號(hào)title_id圖書(shū)編號(hào)qty訂購(gòu)數(shù)量ord_date訂購(gòu)日期建立多多維數(shù)數(shù)據(jù)模模型訂單訂單事事實(shí)表表中要要包含含日期期、出出版社社、書(shū)書(shū)店、、圖書(shū)書(shū)等鍵鍵值列列,還還要包包含銷(xiāo)銷(xiāo)售額額、銷(xiāo)銷(xiāo)售量量2個(gè)度量量值列列,其其目的的是為為了記記錄銷(xiāo)銷(xiāo)售事事實(shí)。。建立多多維數(shù)數(shù)據(jù)模模型訂單FactSales屬性名稱(chēng)來(lái)源功能描述鍵值列pub_idpublishers表出版社編號(hào)stor_idstores表書(shū)店編號(hào)book_idtitles表圖書(shū)編號(hào)ord_datesales表銷(xiāo)售日期度量值列qtysales表銷(xiāo)售量amount計(jì)算生成(qty*price)銷(xiāo)售額建立多多維數(shù)數(shù)據(jù)模模型最終,,確定定數(shù)據(jù)據(jù)集市市包括括以下下多維維數(shù)據(jù)據(jù)模型型:主題——圖書(shū)銷(xiāo)銷(xiāo)售業(yè)業(yè)績(jī)度量值值——圖書(shū)銷(xiāo)銷(xiāo)售量量圖書(shū)銷(xiāo)銷(xiāo)售額額維度——出版社社(國(guó)國(guó)別-州-城市-出版社社)作者((作者者姓名名)圖書(shū)((圖書(shū)書(shū)類(lèi)別別-單一圖圖書(shū),,圖書(shū)書(shū)出版版年))書(shū)店((州-市-書(shū)店))銷(xiāo)售日日期((年-月-日)Microsoft數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)工工具集集核心數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)工工具集集——SQLServer關(guān)系引引擎((RDBMS):實(shí)實(shí)現(xiàn)關(guān)關(guān)系數(shù)數(shù)據(jù)庫(kù)庫(kù)SQLServerIntegrationService(SSIS):實(shí)現(xiàn)ETL系統(tǒng)SQLServerAnalysisService(SSAS):實(shí)現(xiàn)多多維數(shù)數(shù)據(jù)庫(kù)庫(kù),支支持OLAP查詢(xún),,實(shí)現(xiàn)現(xiàn)數(shù)據(jù)據(jù)挖掘掘SQLServerReportingService(SSRS):定義報(bào)報(bào)表開(kāi)發(fā)和和管理理工具具:SQLServerBIDevelopmentStudio(BIDS)和SQLServerManagementStudio。Microsoft數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)系系統(tǒng)的的體系系結(jié)構(gòu)構(gòu)源系統(tǒng)數(shù)據(jù)庫(kù)ETL聚合(支持OLAP)源系統(tǒng)數(shù)據(jù)庫(kù)源系統(tǒng)數(shù)據(jù)庫(kù)事實(shí)表和維度表度量和維度前端工具核心數(shù)據(jù)倉(cāng)庫(kù)RDBMSSSISSSASSSRSETL過(guò)程利用SQLServerIntegrationService對(duì)Pubs數(shù)據(jù)庫(kù)庫(kù)進(jìn)行行抽取取和整整理,,形成成Pubs_DW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)。。先將數(shù)數(shù)據(jù)從從源事事務(wù)數(shù)數(shù)據(jù)中中提取取到中中間數(shù)數(shù)據(jù)庫(kù)庫(kù)Pubs_Stage再對(duì)中中間數(shù)數(shù)據(jù)庫(kù)庫(kù)的數(shù)數(shù)據(jù)進(jìn)進(jìn)行轉(zhuǎn)轉(zhuǎn)換并并加載載到目目標(biāo)關(guān)關(guān)系數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)Pubs_DWETL過(guò)程Pubs數(shù)據(jù)庫(kù)(業(yè)務(wù)數(shù)據(jù)庫(kù))PublishersPub_infoEmployeeJobsRoychedTitlesAuthorsTitleauthorSalesStoresDiscountsPubs_Stage(臨時(shí)數(shù)據(jù)庫(kù))PublishersTitlesTitleauthorAuthorSalesStoresDatePubs_DW(數(shù)據(jù)倉(cāng)庫(kù))FactSalesFactBookAuthorDimPublisherDimBookDimAuthorDimStoreDimDateDTSSSISDate.xlsETL過(guò)程利用DTS和SQLServerIntegrationService對(duì)Pubs數(shù)據(jù)庫(kù)庫(kù)進(jìn)行行抽取取和整整理,,形成成Pubs_DW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)。。先將數(shù)數(shù)據(jù)從從源事事務(wù)數(shù)數(shù)據(jù)中中提取取到中中間數(shù)數(shù)據(jù)庫(kù)庫(kù)Pubs_Stage(DTS工具)再對(duì)中中間數(shù)數(shù)據(jù)庫(kù)庫(kù)的數(shù)數(shù)據(jù)進(jìn)進(jìn)行轉(zhuǎn)轉(zhuǎn)換并并加載載到目目標(biāo)關(guān)關(guān)系數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)Pubs_DW(SSIS工具)ETL過(guò)程利用DTS將pubs數(shù)據(jù)庫(kù)庫(kù)和date.xls中的數(shù)數(shù)據(jù)直直接導(dǎo)導(dǎo)出到到pubs_stage數(shù)據(jù)庫(kù)庫(kù)中。。Pubs_Stage的結(jié)構(gòu)構(gòu)ETL過(guò)程新建pubs_DW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)ETL過(guò)程pubs_DW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中中的DimDate表DimDate屬性名稱(chēng)功能描述Sqlserver數(shù)據(jù)類(lèi)型FullDate日期DatetimeDateName日期名varchar(20)Month月intMonthName月名varchar(20)Year年intETL過(guò)程pubs_DW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中中的DimPublisher表DimPublisher屬性名稱(chēng)功能描述Sqlserver數(shù)據(jù)類(lèi)型pub_id出版社編號(hào)Varchar(4)pub_name出版社名稱(chēng)varchar(40)pub_city城市varchar(20)pub_state州varchar(2)pub_country國(guó)家varchar(30)ETL過(guò)程pubs_DW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中中的DimStore表DimStore屬性名稱(chēng)功能描述Sqlserver數(shù)據(jù)類(lèi)型store_id書(shū)店編號(hào)Varchar(4)store_name書(shū)店名稱(chēng)varchar(40)store_city城市varchar(20)store_state州varchar(2)ETL過(guò)程pubs_DW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中中的DimBook表DimBook屬性名稱(chēng)功能描述Sqlserver數(shù)據(jù)類(lèi)型book_id圖書(shū)編號(hào)Varchar(6)book_name圖書(shū)名varchar(80)book_type圖書(shū)類(lèi)型varchar(12)pubyear出版年intETL過(guò)程pubs_DW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中中的DimAuthor表DimAuthor屬性名稱(chēng)功能描述Sqlserver數(shù)據(jù)類(lèi)型au_id作者編號(hào)varchar(11)au_name作者名au_fname+au_lnamevarchar(80)ETL過(guò)程pubs_DW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中中的FactBookAuthor表FactBookAuthor屬性名稱(chēng)功能描述Sqlserver數(shù)據(jù)類(lèi)型book_id圖書(shū)編號(hào)Varchar(6)au_id作者編號(hào)varchar(11)ETL過(guò)程pubs_DW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中中的FactSales表FactSales屬性名稱(chēng)來(lái)源功能描述Sqlserver數(shù)據(jù)類(lèi)型pub_idpublishers表出版社編號(hào)Varchar(4)stor_idstores表書(shū)店編號(hào)Varchar(4)book_idtitles表圖書(shū)編號(hào)Varchar(6)ord_datesales表銷(xiāo)售日期datetimeqtysales表銷(xiāo)售量smallintamount計(jì)算生成(qty*price)銷(xiāo)售額moneyETL過(guò)程新建SSIS項(xiàng)目,,并將將pubs_stage數(shù)據(jù)庫(kù)庫(kù)中的的數(shù)據(jù)據(jù)轉(zhuǎn)換換并加加載到到pubs_DW數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中中。SSIS項(xiàng)目由由若干干SSIS程序包包的構(gòu)構(gòu)成,,其中中一個(gè)個(gè)為主主程序序包((啟動(dòng)動(dòng))。。SSIS程序包包由一一個(gè)控控制流流和若若干個(gè)個(gè)數(shù)據(jù)據(jù)流構(gòu)構(gòu)成。。多維數(shù)數(shù)據(jù)集集和OLAPOLAP的提出出(1993年)1981年圖靈獎(jiǎng)獎(jiǎng)獲得者者:埃德加·科德(EdgarFrankCodd)—“關(guān)系數(shù)據(jù)據(jù)庫(kù)之父父”多維數(shù)據(jù)據(jù)集和OLAP1995年OLAP專(zhuān)門(mén)研究究機(jī)構(gòu)OLAPReport提出關(guān)于于OLAP的簡(jiǎn)明定定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。快速性((Fast)——OLAP系統(tǒng)必須須能快速速響應(yīng)用用戶(hù)的分分析查詢(xún)?cè)円?,,?duì)于用用戶(hù)大部部分分析析要求在在5秒鐘內(nèi)作作出反應(yīng)應(yīng),否則則超過(guò)30秒用戶(hù)可可能會(huì)失失去分析析的主線線索,影影響分析析質(zhì)量。。多維數(shù)據(jù)據(jù)集和OLAP1995年OLAP專(zhuān)門(mén)研究究機(jī)構(gòu)OLAPReport提出關(guān)于于OLAP的簡(jiǎn)明定定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。分析性((Analysis)——OLAP系統(tǒng)能處處理任何何與用戶(hù)戶(hù)和應(yīng)用用有關(guān)的的邏輯分分析和統(tǒng)統(tǒng)計(jì)分析析,在需需要的情情況下還還允許用用戶(hù)無(wú)需需編程就就可為分分析和生生成報(bào)表表定義一一些新的的特殊運(yùn)運(yùn)算,將將其作為為分析的的一部分分,并以以用戶(hù)理理想的方方式給出出報(bào)告。。用戶(hù)可可以在OLAP平臺(tái)上進(jìn)進(jìn)行數(shù)據(jù)據(jù)分析,,也可以以與其他他外部分分析工具具交互信信息,同同時(shí)應(yīng)提提供靈活活開(kāi)放的的報(bào)表處處理功能能,保存存分析結(jié)結(jié)果。多維數(shù)據(jù)據(jù)集和OLAP1995年OLAP專(zhuān)門(mén)研究究機(jī)構(gòu)OLAPReport提出關(guān)于于OLAP的簡(jiǎn)明定定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。共享性((Shared)——OLAP系統(tǒng)應(yīng)能能實(shí)現(xiàn)在在多用戶(hù)戶(hù)環(huán)境下下的安全全保密要要求和并并發(fā)控制制。多個(gè)個(gè)用戶(hù)同同時(shí)使用用,能夠夠根據(jù)用用戶(hù)所屬屬的安全全級(jí)別,,讓他們們只能看看到自身身權(quán)限下下的信息息。多維數(shù)據(jù)據(jù)集和OLAP1995年OLAP專(zhuān)門(mén)研究究機(jī)構(gòu)OLAPReport提出關(guān)于于OLAP的簡(jiǎn)明定定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。多維性((Multidimensional)——OLAP系統(tǒng)能對(duì)對(duì)數(shù)據(jù)進(jìn)進(jìn)行多維維視圖和和分析,,是OLAP的關(guān)鍵屬屬性。多維數(shù)據(jù)據(jù)集和OLAP1995年OLAP專(zhuān)門(mén)研究究機(jī)構(gòu)OLAPReport提出關(guān)于于OLAP的簡(jiǎn)明定定義FASMI(FastAnalysisofSharedMultidimensionalInformation)。信息性((Information)——OLAP系統(tǒng)具有有管理數(shù)數(shù)據(jù)和獲獲得信息息的能力力,能管管理大量量的數(shù)據(jù)據(jù)并即時(shí)時(shí)地獲得得用戶(hù)所所需信息息。多維數(shù)據(jù)據(jù)集和OLAPOLAP與數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)關(guān)系系緊密OLAP分析與數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的關(guān)系系十分緊緊密。數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的建立立,解決決了依據(jù)據(jù)主題進(jìn)進(jìn)行數(shù)據(jù)據(jù)存儲(chǔ)的的問(wèn)題,,提高了了數(shù)據(jù)的的存取速速度;而而OLAP分析構(gòu)成成了數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的表現(xiàn)層層,將數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中的數(shù)數(shù)據(jù)通過(guò)過(guò)不同的的維和指指標(biāo),靈靈活地展展現(xiàn)出來(lái)來(lái),提高高了數(shù)據(jù)據(jù)的展現(xiàn)現(xiàn)能力,,進(jìn)而提提高了數(shù)數(shù)據(jù)的分分析能力力。多維數(shù)據(jù)據(jù)集和OLAP多維數(shù)據(jù)據(jù)集多維數(shù)據(jù)據(jù)集(cube)——OLAP中的主要要對(duì)象,,通常也也稱(chēng)作多多維立方方體。cube是一個(gè)數(shù)數(shù)據(jù)集合合,通常常由數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的子集構(gòu)構(gòu)造,把把一組維維度和度度量值合合理組織織,最后后匯總成成多維結(jié)結(jié)構(gòu)。多維數(shù)據(jù)據(jù)集和OLAP多維數(shù)據(jù)據(jù)集銷(xiāo)售數(shù)量10000玩具電器銷(xiāo)售地區(qū)北京上海江蘇1234服裝化妝品產(chǎn)品時(shí)間(月)以時(shí)間、銷(xiāo)售地區(qū)、產(chǎn)品三個(gè)維度構(gòu)成的多維數(shù)據(jù)集多維數(shù)據(jù)據(jù)集和OLAP的實(shí)現(xiàn)以Pubs_DW數(shù)據(jù)庫(kù)為為基礎(chǔ),,利用SQLServerAnalysisService開(kāi)發(fā)PubsAS多維數(shù)據(jù)據(jù)庫(kù)以支支持OLAP分析。Pubs_DW(關(guān)系數(shù)數(shù)據(jù)庫(kù)))FactSalesFactBookAuthorDimPublisherDimBookDimAuthorDimStoreDimDateSSASPubs_AS(多維數(shù)數(shù)據(jù)集))SalesCube(Sales多維數(shù)據(jù)據(jù)集)Sales度量值組組:SalesAmountSalesQtyBookAuthor中間度量量值組維度:BookAuthorStorePublisherDate多維數(shù)據(jù)據(jù)集和OLAP的實(shí)現(xiàn)多維數(shù)據(jù)庫(kù)的數(shù)據(jù)源(DS)pubs_DW數(shù)據(jù)源視圖(DSV)多維數(shù)據(jù)庫(kù)pubs_AS多維數(shù)據(jù)集(Cube)度量值和維度聚合SSAS多維數(shù)據(jù)據(jù)庫(kù)體系系結(jié)構(gòu)多維數(shù)據(jù)據(jù)集和OLAP的實(shí)現(xiàn)分析服務(wù)務(wù)項(xiàng)目開(kāi)開(kāi)發(fā)步驟驟創(chuàng)建數(shù)據(jù)據(jù)源創(chuàng)建數(shù)據(jù)據(jù)源視圖圖創(chuàng)建維度度(公共共維度))創(chuàng)建多維維數(shù)據(jù)集集(度量量值)處理、部部署項(xiàng)目目瀏覽多維維數(shù)據(jù)集集多維數(shù)據(jù)據(jù)集和OLAP的實(shí)現(xiàn)分析服務(wù)務(wù)項(xiàng)目開(kāi)開(kāi)發(fā)要點(diǎn)點(diǎn)每個(gè)分析析服務(wù)項(xiàng)項(xiàng)目必須須至少包包含一個(gè)個(gè)數(shù)據(jù)源源每個(gè)分析析服務(wù)項(xiàng)項(xiàng)目必須須至少包包含一個(gè)個(gè)數(shù)據(jù)源源視圖每個(gè)分析析服務(wù)項(xiàng)項(xiàng)目必須須包含至至少一個(gè)個(gè)維度和和多維數(shù)數(shù)據(jù)集多維數(shù)據(jù)據(jù)集必須須包含在在一個(gè)分分析服務(wù)務(wù)項(xiàng)目中中每個(gè)分析析服務(wù)項(xiàng)項(xiàng)目可以以包含多多個(gè)多維維數(shù)據(jù)集集多維數(shù)據(jù)據(jù)集和OLAP多維數(shù)據(jù)據(jù)分析方方法OLAP多維分析析對(duì)多維維數(shù)據(jù)集集中的數(shù)數(shù)據(jù)進(jìn)行行上卷、下下鉆、切切片、切切塊、旋旋轉(zhuǎn)等各種分分析操作作,以便便剖析數(shù)數(shù)據(jù),使使用戶(hù)從從多個(gè)角角度、多多個(gè)側(cè)面面、多個(gè)個(gè)層次來(lái)來(lái)觀察多多維數(shù)據(jù)據(jù),從而而發(fā)掘數(shù)數(shù)據(jù)中蘊(yùn)蘊(yùn)涵的對(duì)對(duì)自己有有用的信信息。多維數(shù)據(jù)據(jù)集和OLAP多維數(shù)據(jù)據(jù)分析方方法多維數(shù)據(jù)據(jù)集和OLAP多維數(shù)據(jù)據(jù)分析方方法——切片切片(Slice)——對(duì)多維數(shù)數(shù)據(jù)集的的某個(gè)維維選定一一個(gè)維成成員,這這種選擇擇操作就就稱(chēng)為切切片。例如:Cube(維1,維2,…,維i,…,維n,度量量值))對(duì)維i選定了了某個(gè)個(gè)維成成員,,則(維1,維2,…,維i成員,…,維n,度量量值))就是該該Cube在維i上的一一個(gè)切切片,,切片片的數(shù)數(shù)量取取決于于維i上的維維成員員的個(gè)個(gè)數(shù)。。多維數(shù)數(shù)據(jù)集集和OLAP多維數(shù)數(shù)據(jù)分分析方方法——切片“時(shí)間==第1季度”在三維維立方方體上上切片片的結(jié)結(jié)果是是得到到一個(gè)個(gè)二維維的平平面數(shù)數(shù)據(jù)4.1OLAP概述多維數(shù)數(shù)據(jù)分分析方方法——切塊切塊((Dice)——在一個(gè)個(gè)多維維數(shù)據(jù)據(jù)集中中對(duì)兩兩個(gè)及及兩個(gè)個(gè)以上上的維維選定定維成成員的的操作作可以以稱(chēng)為為切塊塊。例如::Cube(維1,維2,……,維i,……,維k,……,維n,度量值值)對(duì)維i,…,維k,選定定了維維成員員,則則(維1,維2,……,維i成員,……,維k成員,……,維n,度量值值)就是該該Cube在維i,……,維k上的一一個(gè)切切塊。。顯然,,當(dāng)i=k時(shí),切切塊操操作就就退化化成切切片操操作。。多維數(shù)數(shù)據(jù)集集和OLAP多維數(shù)數(shù)據(jù)分分析方方法——切塊(貸款==“正?!眔r“次級(jí)”)And(時(shí)間間=“1季度”or“2季度”)And(經(jīng)濟(jì)濟(jì)性質(zhì)質(zhì)=“集體“or”個(gè)人”or”其它“)切塊的的結(jié)果果是得得到了了一個(gè)個(gè)子立立方體體多維數(shù)數(shù)據(jù)集集和OLAP多維數(shù)數(shù)據(jù)分分析方方法——上卷上卷((Roll-up)——上卷是是對(duì)數(shù)數(shù)據(jù)進(jìn)進(jìn)行更更為宏宏觀的的觀察察。通通過(guò)在在維的的等級(jí)級(jí)中上上升或或通過(guò)過(guò)消除除某個(gè)個(gè)或某某些維
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程熱處理工創(chuàng)新意識(shí)模擬考核試卷含答案
- 低壓電器及元件裝配工操作評(píng)估強(qiáng)化考核試卷含答案
- 塑料模具工操作評(píng)優(yōu)考核試卷含答案
- 鋰冶煉工操作能力模擬考核試卷含答案
- 自然保護(hù)區(qū)社區(qū)共管聯(lián)絡(luò)工班組考核測(cè)試考核試卷含答案
- 焊工安全生產(chǎn)能力知識(shí)考核試卷含答案
- 飛機(jī)燃油動(dòng)力系統(tǒng)安裝調(diào)試工安全防護(hù)競(jìng)賽考核試卷含答案
- 改性瀝青防水卷材生產(chǎn)工安全專(zhuān)項(xiàng)測(cè)試考核試卷含答案
- 油墨顏料制作工安全操作測(cè)試考核試卷含答案
- 出軌保證合同范本
- 壓裝法教學(xué)講解課件
- 囊袋皺縮綜合征課件
- 預(yù)防坍塌專(zhuān)項(xiàng)方案(人工挖孔樁)
- 2023版北京協(xié)和醫(yī)院重癥醫(yī)學(xué)科診療常規(guī)
- 2022年河北省普通高等學(xué)校對(duì)口招生考試機(jī)械類(lèi)試題
- 團(tuán)課學(xué)習(xí)筆記
- 混凝土路面裂縫的控制技術(shù)
- 倍加福 KFU8-UFC 信號(hào)隔離或轉(zhuǎn)換模塊中文操作指導(dǎo)
- 普外科出科考試卷答案普外科考試題及答案
- 繪本閱讀課《Daddy Robot》
- 廠房潔凈彩鋼板墻板、吊頂施工方案(32頁(yè))
評(píng)論
0/150
提交評(píng)論