版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與聯(lián)機(jī)分析處理數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與聯(lián)機(jī)分析處理Data Warehouse & OLAP 數(shù)據(jù)庫(kù)處理的兩大應(yīng)用數(shù)據(jù)庫(kù)處理的兩大應(yīng)用聯(lián)機(jī)事務(wù)處理聯(lián)機(jī)事務(wù)處理(OLTP)決策支持系統(tǒng)決策支持系統(tǒng)(DSS) 數(shù)據(jù)庫(kù)處理的兩大應(yīng)用數(shù)據(jù)庫(kù)處理的兩大應(yīng)用聯(lián)機(jī)事務(wù)處理聯(lián)機(jī)事務(wù)處理(OLTP) 操作型處理,為企業(yè)的特定應(yīng)用服務(wù)操作型處理,為企業(yè)的特定應(yīng)用服務(wù) 是對(duì)數(shù)據(jù)庫(kù)的聯(lián)機(jī)的日常操作,通常是對(duì)是對(duì)數(shù)據(jù)庫(kù)的聯(lián)機(jī)的日常操作,通常是對(duì)一個(gè)或一組記錄的查詢和修改一個(gè)或一組記錄的查詢和修改 人們關(guān)心的是響應(yīng)時(shí)間、數(shù)據(jù)的安全性和人們關(guān)心的是響應(yīng)時(shí)間、數(shù)據(jù)的安全性和完整性完整性決策支持系統(tǒng)決策支持系統(tǒng)(DS
2、S) 數(shù)據(jù)庫(kù)處理的兩大應(yīng)用數(shù)據(jù)庫(kù)處理的兩大應(yīng)用聯(lián)機(jī)事務(wù)處理聯(lián)機(jī)事務(wù)處理(OLTP)決策支持系統(tǒng)決策支持系統(tǒng)(DSS) 分析型處理,用于管理人員的決策分析分析型處理,用于管理人員的決策分析 經(jīng)常需要訪問(wèn)大量的歷史數(shù)據(jù)經(jīng)常需要訪問(wèn)大量的歷史數(shù)據(jù) 數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù) + 聯(lián)機(jī)分析處理聯(lián)機(jī)分析處理 + 數(shù)據(jù)挖掘數(shù)據(jù)挖掘 ( DW + OLAP + DM ) DSS 數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、非易失的是一個(gè)面向主題的、集成的、非易失的(不可修改)且隨時(shí)間變化的數(shù)據(jù)集合,(不可修改)且隨時(shí)間變化的數(shù)據(jù)集合,用來(lái)支持管理人員的決策用來(lái)支持管理人員的決策 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)面向主題面向
3、主題 主題是在較高層次上對(duì)數(shù)據(jù)抽象主題是在較高層次上對(duì)數(shù)據(jù)抽象 面向主題的數(shù)據(jù)組織分為兩步驟面向主題的數(shù)據(jù)組織分為兩步驟抽取主題抽取主題確定每個(gè)主題所包含的數(shù)據(jù)內(nèi)容確定每個(gè)主題所包含的數(shù)據(jù)內(nèi)容 每個(gè)主題在數(shù)據(jù)倉(cāng)庫(kù)中都是由每個(gè)主題在數(shù)據(jù)倉(cāng)庫(kù)中都是由一組關(guān)系一組關(guān)系表實(shí)現(xiàn)的表實(shí)現(xiàn)的集成的集成的數(shù)據(jù)不可更改數(shù)據(jù)不可更改隨時(shí)間變化的隨時(shí)間變化的 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 面向主題面向主題 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)面向主題面向主題集成的集成的 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是從原有的分散數(shù)據(jù)庫(kù)數(shù)據(jù)中抽數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是從原有的分散數(shù)據(jù)庫(kù)數(shù)據(jù)中抽取來(lái)的取來(lái)的 消除數(shù)據(jù)表述的不一致性(數(shù)據(jù)的清洗)消除數(shù)據(jù)表述的不一致
4、性(數(shù)據(jù)的清洗) 數(shù)據(jù)的綜合數(shù)據(jù)的綜合數(shù)據(jù)不可更改數(shù)據(jù)不可更改隨時(shí)間變化的隨時(shí)間變化的 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 集成集成 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)面向主題面向主題集成的集成的數(shù)據(jù)不可更改數(shù)據(jù)不可更改 數(shù)據(jù)倉(cāng)庫(kù)的主要數(shù)據(jù)操作是查詢、分析數(shù)據(jù)倉(cāng)庫(kù)的主要數(shù)據(jù)操作是查詢、分析 不進(jìn)行一般意義上的數(shù)據(jù)更新(過(guò)期數(shù)據(jù)可能被不進(jìn)行一般意義上的數(shù)據(jù)更新(過(guò)期數(shù)據(jù)可能被刪除)刪除) 數(shù)據(jù)倉(cāng)庫(kù)強(qiáng)化查詢、淡化并發(fā)控制和完整性保護(hù)數(shù)據(jù)倉(cāng)庫(kù)強(qiáng)化查詢、淡化并發(fā)控制和完整性保護(hù)等技術(shù)等技術(shù)隨時(shí)間變化的隨時(shí)間變化的 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)數(shù)據(jù)不可更改數(shù)據(jù)不可更改 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)面向主題面向主題集
5、成的集成的數(shù)據(jù)不可更改數(shù)據(jù)不可更改隨時(shí)間變化的隨時(shí)間變化的 不斷增加新的數(shù)據(jù)內(nèi)容不斷增加新的數(shù)據(jù)內(nèi)容 不斷刪除舊的數(shù)據(jù)內(nèi)容不斷刪除舊的數(shù)據(jù)內(nèi)容 定時(shí)綜合定時(shí)綜合 數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)表的數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)表的鍵碼鍵碼都包含時(shí)間項(xiàng),以標(biāo)明都包含時(shí)間項(xiàng),以標(biāo)明數(shù)據(jù)的歷史時(shí)期數(shù)據(jù)的歷史時(shí)期 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn) 隨時(shí)間變化隨時(shí)間變化 數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)OLTP系統(tǒng)系統(tǒng)RDBMSSybaseVSAMSAP/ERP5-10 年年過(guò)去過(guò)去詳細(xì)數(shù)據(jù)詳細(xì)數(shù)據(jù)當(dāng)前當(dāng)前詳細(xì)數(shù)據(jù)詳細(xì)數(shù)據(jù)輕度輕度匯總數(shù)據(jù)匯總數(shù)據(jù)高度高度匯總數(shù)據(jù)匯總數(shù)據(jù)數(shù)據(jù)集市數(shù)據(jù)集市分析型分析型CRM業(yè)務(wù)指標(biāo)分析業(yè)務(wù)指標(biāo)分析數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)
6、/決策分析系統(tǒng)決策分析系統(tǒng)EXCEL 數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu) 數(shù)據(jù)由操作型環(huán)境(綜合)導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)由操作型環(huán)境(綜合)導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù)具有不同的細(xì)節(jié)級(jí)數(shù)據(jù)具有不同的細(xì)節(jié)級(jí) 早期細(xì)節(jié)級(jí)(過(guò)期數(shù)據(jù))早期細(xì)節(jié)級(jí)(過(guò)期數(shù)據(jù)) 當(dāng)前細(xì)節(jié)級(jí)當(dāng)前細(xì)節(jié)級(jí) 輕度綜合數(shù)據(jù)級(jí)(數(shù)據(jù)集市)輕度綜合數(shù)據(jù)級(jí)(數(shù)據(jù)集市) 高度綜合數(shù)據(jù)級(jí)高度綜合數(shù)據(jù)級(jí) 數(shù)據(jù)倉(cāng)庫(kù)建立的過(guò)程數(shù)據(jù)倉(cāng)庫(kù)建立的過(guò)程 粒度粒度 是指數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合是指數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級(jí)別程度的級(jí)別 粒度級(jí)越小,細(xì)節(jié)程度越高,綜合程度越低,回答粒度級(jí)越小,細(xì)節(jié)程度越高,綜合程度越低,回答查詢的種類越多查詢
7、的種類越多 粒度影響數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)量的大小粒度影響數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)量的大小 粒度問(wèn)題是設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)重要方面粒度問(wèn)題是設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)重要方面 雙重粒度雙重粒度 在數(shù)據(jù)倉(cāng)庫(kù)的細(xì)節(jié)級(jí)上創(chuàng)建兩種粒度在數(shù)據(jù)倉(cāng)庫(kù)的細(xì)節(jié)級(jí)上創(chuàng)建兩種粒度 短期儲(chǔ)存的低粒度(真實(shí)檔案),滿足細(xì)節(jié)查詢短期儲(chǔ)存的低粒度(真實(shí)檔案),滿足細(xì)節(jié)查詢 具有綜合的高粒度(輕度綜合),做分析具有綜合的高粒度(輕度綜合),做分析 分割分割 是指把數(shù)據(jù)分散到各自的物理單元中去,以便能分是指把數(shù)據(jù)分散到各自的物理單元中去,以便能分別獨(dú)立處理,提高數(shù)據(jù)處理效率別獨(dú)立處理,提高數(shù)據(jù)處理效率 是粒度之后的第二個(gè)主要設(shè)計(jì)問(wèn)題是粒度之后的第二個(gè)主要
8、設(shè)計(jì)問(wèn)題 兩個(gè)層次的分割兩個(gè)層次的分割 系統(tǒng)層:系統(tǒng)層:DBMS,一種定義,一種定義 應(yīng)用層:開發(fā)者,多種定義應(yīng)用層:開發(fā)者,多種定義 多種分割的標(biāo)準(zhǔn)多種分割的標(biāo)準(zhǔn) 日期:最常用的日期:最常用的 地理位置地理位置 組織單位組織單位. 數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)組織形式數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)組織形式 簡(jiǎn)單堆積簡(jiǎn)單堆積 輪轉(zhuǎn)綜合輪轉(zhuǎn)綜合 數(shù)據(jù)按一定的格式進(jìn)行輪轉(zhuǎn)的累加數(shù)據(jù)按一定的格式進(jìn)行輪轉(zhuǎn)的累加 簡(jiǎn)化直接簡(jiǎn)化直接 按一定的時(shí)間間隔,對(duì)數(shù)據(jù)進(jìn)行提取,是操作型數(shù)據(jù)的按一定的時(shí)間間隔,對(duì)數(shù)據(jù)進(jìn)行提取,是操作型數(shù)據(jù)的一個(gè)快照一個(gè)快照 連續(xù)連續(xù) 把新的快照追加到以前的連續(xù)數(shù)據(jù)上去把新的快照追加到以前的連續(xù)數(shù)據(jù)上去 數(shù)據(jù)倉(cāng)
9、庫(kù)中的數(shù)據(jù)組織形式數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)組織形式 簡(jiǎn)單堆積簡(jiǎn)單堆積 每日由數(shù)據(jù)庫(kù)中提取并加工的數(shù)據(jù)逐天積累堆積每日由數(shù)據(jù)庫(kù)中提取并加工的數(shù)據(jù)逐天積累堆積 數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)組織形式數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)組織形式 輪轉(zhuǎn)綜合輪轉(zhuǎn)綜合 數(shù)據(jù)按一定的格式進(jìn)行輪轉(zhuǎn)的累加數(shù)據(jù)按一定的格式進(jìn)行輪轉(zhuǎn)的累加 數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)組織形式數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)組織形式 簡(jiǎn)單堆積與輪轉(zhuǎn)綜合的比較簡(jiǎn)單堆積與輪轉(zhuǎn)綜合的比較 數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)組織形式數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)組織形式 簡(jiǎn)化直接簡(jiǎn)化直接 按一定的時(shí)間間隔,對(duì)數(shù)據(jù)進(jìn)行提取,是操作型數(shù)據(jù)的按一定的時(shí)間間隔,對(duì)數(shù)據(jù)進(jìn)行提取,是操作型數(shù)據(jù)的一個(gè)快照一個(gè)快照 數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)組織形式數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)
10、組織形式 連續(xù)連續(xù) 把新的快照追加到以前的連續(xù)數(shù)據(jù)上去把新的快照追加到以前的連續(xù)數(shù)據(jù)上去 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)追加數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)追加 數(shù)據(jù)追加數(shù)據(jù)追加 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)初裝完成以后,再向數(shù)據(jù)倉(cāng)庫(kù)輸入數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)初裝完成以后,再向數(shù)據(jù)倉(cāng)庫(kù)輸入數(shù)據(jù)的過(guò)程稱為的過(guò)程稱為數(shù)據(jù)追加數(shù)據(jù)追加 變化數(shù)據(jù)的捕獲變化數(shù)據(jù)的捕獲 時(shí)標(biāo)法:加標(biāo)識(shí)時(shí)標(biāo)法:加標(biāo)識(shí) DELTA法:對(duì)更新作記錄法:對(duì)更新作記錄 前后映象法:兩次快照的對(duì)比前后映象法:兩次快照的對(duì)比 日志法日志法:利用:利用DBMS的日志,需改進(jìn)的日志,需改進(jìn) 數(shù)據(jù)庫(kù)的體系化環(huán)境數(shù)據(jù)庫(kù)的體系化環(huán)境 是在一個(gè)企業(yè)或組織內(nèi)部,由各面向應(yīng)用的是在一個(gè)企業(yè)或組織內(nèi)部,
11、由各面向應(yīng)用的OLTP數(shù)據(jù)庫(kù)及各級(jí)面向主題的數(shù)據(jù)倉(cāng)庫(kù)所組成的完整的數(shù)據(jù)庫(kù)及各級(jí)面向主題的數(shù)據(jù)倉(cāng)庫(kù)所組成的完整的數(shù)據(jù)環(huán)境數(shù)據(jù)環(huán)境 操作型環(huán)境、分析型環(huán)境操作型環(huán)境、分析型環(huán)境 四層體系化環(huán)境四層體系化環(huán)境 操作型環(huán)境操作型環(huán)境OLTP 全局級(jí)全局級(jí)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù) 部門級(jí)部門級(jí)局部倉(cāng)庫(kù)局部倉(cāng)庫(kù) 個(gè)人級(jí)個(gè)人級(jí)個(gè)人倉(cāng)庫(kù),用于啟發(fā)式的分析個(gè)人倉(cāng)庫(kù),用于啟發(fā)式的分析 數(shù)據(jù)集市(數(shù)據(jù)集市(Data Mart) 特定的、面向部門的小型數(shù)據(jù)倉(cāng)庫(kù)特定的、面向部門的小型數(shù)據(jù)倉(cāng)庫(kù) 是為滿足用戶特定需求而創(chuàng)建的數(shù)據(jù)倉(cāng)庫(kù)是為滿足用戶特定需求而創(chuàng)建的數(shù)據(jù)倉(cāng)庫(kù) 是數(shù)據(jù)倉(cāng)庫(kù)的子集是數(shù)據(jù)倉(cāng)庫(kù)的子集 數(shù)據(jù)庫(kù)的體系化環(huán)境數(shù)據(jù)庫(kù)的體
12、系化環(huán)境 數(shù)據(jù)庫(kù)的體系化環(huán)境數(shù)據(jù)庫(kù)的體系化環(huán)境 數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)生命周期數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)生命周期 數(shù)據(jù)倉(cāng)庫(kù)的基本數(shù)據(jù)模式數(shù)據(jù)倉(cāng)庫(kù)的基本數(shù)據(jù)模式 星型模式星型模式(Star Schema) 事實(shí)表事實(shí)表(fact table),存放基本數(shù)據(jù),相關(guān)主題的數(shù),存放基本數(shù)據(jù),相關(guān)主題的數(shù)據(jù)主體(據(jù)主體(BCNF) 維維(dimension),影響、分析主體數(shù)據(jù)的因素,影響、分析主體數(shù)據(jù)的因素 量量(measure),事實(shí)表中的數(shù)據(jù)屬性,事實(shí)表中的數(shù)據(jù)屬性 維表維表(dimension table),表示維的各種表,表示維的各種表 維是量的取值條件,維用外鍵表示維是量的取值條件,維用外鍵表示 以事實(shí)表為中心
13、,加上若干維表,組成星型數(shù)據(jù)以事實(shí)表為中心,加上若干維表,組成星型數(shù)據(jù)模式模式 例:產(chǎn)品例:產(chǎn)品-商店商店-銷售額銷售額 數(shù)據(jù)倉(cāng)庫(kù)的基本數(shù)據(jù)模式數(shù)據(jù)倉(cāng)庫(kù)的基本數(shù)據(jù)模式CustSalesLocationSalesProdSalesTimeSalesSalestime idproduct idlocation idcustomer idsales revenueunits soldProductproduct idmakemodelTimetime iddateyearquartermonthweekLocationlocation idregiondistrictstoreCustomercus
14、tomer idcategorygroupSales factSales measuresTime dimensionAttributes of the time dimension 數(shù)據(jù)倉(cāng)庫(kù)的基本數(shù)據(jù)模式數(shù)據(jù)倉(cāng)庫(kù)的基本數(shù)據(jù)模式雪花模式雪花模式(Snowflake Schema) 維一般是由若干層次組成維一般是由若干層次組成 把維按其把維按其層次層次結(jié)構(gòu)表示成若干個(gè)表結(jié)構(gòu)表示成若干個(gè)表 規(guī)范化、節(jié)省存儲(chǔ)空間規(guī)范化、節(jié)省存儲(chǔ)空間 但需多做連接操作但需多做連接操作 數(shù)據(jù)倉(cāng)庫(kù)的解決方案數(shù)據(jù)倉(cāng)庫(kù)的解決方案 通用的關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)通用的關(guān)系數(shù)據(jù)庫(kù)系統(tǒng) 專門的數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器專門的數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)
15、的體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的體系結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)層數(shù)據(jù)倉(cāng)庫(kù)層 數(shù)據(jù)倉(cāng)庫(kù)工具層數(shù)據(jù)倉(cāng)庫(kù)工具層 最終用戶最終用戶 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng) 數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)居系統(tǒng)的核心地位居系統(tǒng)的核心地位是信息挖掘的基礎(chǔ)是信息挖掘的基礎(chǔ) 數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng)是整個(gè)系統(tǒng)的引擎是整個(gè)系統(tǒng)的引擎負(fù)責(zé)管理整個(gè)系統(tǒng)的運(yùn)轉(zhuǎn)負(fù)責(zé)管理整個(gè)系統(tǒng)的運(yùn)轉(zhuǎn) 數(shù)據(jù)倉(cāng)庫(kù)工具數(shù)據(jù)倉(cāng)庫(kù)工具一般的查詢工具、功能強(qiáng)大的分析工具一般的查詢工具、功能強(qiáng)大的分析工具是整個(gè)系統(tǒng)發(fā)揮作用的關(guān)鍵是整個(gè)系統(tǒng)發(fā)揮作用的關(guān)鍵 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng) 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)lDesignlWarehouse ArchitectlManagelSybase A
16、SIQlIntegratelInformatica lEnterprise ConnectlReplication ServerlVisualizelBriolCognoslAdministerlWarehouse Control Center 數(shù)據(jù)分析模型數(shù)據(jù)分析模型 早期早期靜態(tài)數(shù)據(jù)值的相互比較靜態(tài)數(shù)據(jù)值的相互比較 需求需求從多個(gè)不同的數(shù)據(jù)源中綜合數(shù)據(jù)從多個(gè)不同的數(shù)據(jù)源中綜合數(shù)據(jù)從不同的角度觀察數(shù)據(jù)從不同的角度觀察數(shù)據(jù)多變的主題、多維數(shù)據(jù)多變的主題、多維數(shù)據(jù)E-R不能完全支持不能完全支持 四種分析模型四種分析模型(Codd) 絕對(duì)模型絕對(duì)模型靜態(tài)數(shù)據(jù)分析靜態(tài)數(shù)據(jù)分析只能對(duì)歷史數(shù)據(jù)進(jìn)行值的比
17、較,描述基本事實(shí)只能對(duì)歷史數(shù)據(jù)進(jìn)行值的比較,描述基本事實(shí)用戶交互少用戶交互少 解釋模型解釋模型 思考模型思考模型 公式模型公式模型 四種分析模型四種分析模型(Codd) 絕對(duì)模型絕對(duì)模型 解釋模型解釋模型靜態(tài)數(shù)據(jù)分析靜態(tài)數(shù)據(jù)分析在當(dāng)前多維視圖的基礎(chǔ)上找出事件發(fā)生的原因在當(dāng)前多維視圖的基礎(chǔ)上找出事件發(fā)生的原因 思考模型思考模型 公式模型公式模型 四種分析模型四種分析模型(Codd) 絕對(duì)模型絕對(duì)模型 解釋模型解釋模型 思考模型思考模型動(dòng)態(tài)數(shù)據(jù)分析動(dòng)態(tài)數(shù)據(jù)分析多維分析多維分析在決策者的參與下,找出關(guān)鍵變量在決策者的參與下,找出關(guān)鍵變量需要高級(jí)數(shù)據(jù)分析人員的介入需要高級(jí)數(shù)據(jù)分析人員的介入 公式模型公
18、式模型 四種分析模型四種分析模型(Codd) 絕對(duì)模型絕對(duì)模型 解釋模型解釋模型 思考模型思考模型 公式模型公式模型動(dòng)態(tài)性最高的一類動(dòng)態(tài)性最高的一類自動(dòng)完成變量的引入工作自動(dòng)完成變量的引入工作 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的工具層數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的工具層 查詢工具查詢工具主要是對(duì)分析結(jié)果的查詢主要是對(duì)分析結(jié)果的查詢很少有對(duì)記錄級(jí)數(shù)據(jù)的查詢很少有對(duì)記錄級(jí)數(shù)據(jù)的查詢 驗(yàn)證型工具驗(yàn)證型工具多維分析工具多維分析工具用戶首先提出假設(shè),然后利用各種工具通過(guò)反復(fù)、用戶首先提出假設(shè),然后利用各種工具通過(guò)反復(fù)、遞歸的檢索查詢以驗(yàn)證或否定假設(shè)遞歸的檢索查詢以驗(yàn)證或否定假設(shè) 發(fā)掘型工具發(fā)掘型工具從大量數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)模式從大量數(shù)據(jù)中發(fā)現(xiàn)
19、數(shù)據(jù)模式預(yù)測(cè)趨勢(shì)和行為預(yù)測(cè)趨勢(shì)和行為 聯(lián)機(jī)分析處理聯(lián)機(jī)分析處理OLAPOLAP 是針對(duì)特定問(wèn)題的聯(lián)機(jī)訪問(wèn)和分析。是針對(duì)特定問(wèn)題的聯(lián)機(jī)訪問(wèn)和分析。 通過(guò)對(duì)信息的很多種可能的觀察形式進(jìn)行快速、穩(wěn)通過(guò)對(duì)信息的很多種可能的觀察形式進(jìn)行快速、穩(wěn)定一致和交互性的存取,允許分析人員對(duì)數(shù)據(jù)進(jìn)行定一致和交互性的存取,允許分析人員對(duì)數(shù)據(jù)進(jìn)行深入觀察深入觀察 一些概念一些概念變量變量是數(shù)據(jù)的實(shí)際意義,描述數(shù)據(jù)是什么是數(shù)據(jù)的實(shí)際意義,描述數(shù)據(jù)是什么維維是人們觀察數(shù)據(jù)的特定角度是人們觀察數(shù)據(jù)的特定角度維的層次維的層次是維在不同細(xì)節(jié)程度的描述是維在不同細(xì)節(jié)程度的描述維成員維成員是維的一個(gè)取值是維的一個(gè)取值 多層次維的維成
20、員是各層次取值的組合多層次維的維成員是各層次取值的組合 對(duì)應(yīng)一個(gè)數(shù)據(jù)項(xiàng),維成員是該數(shù)據(jù)項(xiàng)在該維中位置的描述對(duì)應(yīng)一個(gè)數(shù)據(jù)項(xiàng),維成員是該數(shù)據(jù)項(xiàng)在該維中位置的描述多維數(shù)組多維數(shù)組可以表示為(維可以表示為(維1,維維2,變量變量),如(地),如(地區(qū)區(qū),時(shí)間時(shí)間,銷售渠道銷售渠道,銷售額銷售額) 多維數(shù)組的取值稱為多維數(shù)組的取值稱為數(shù)據(jù)單元(單元格)數(shù)據(jù)單元(單元格) 可以理解為交叉表的數(shù)據(jù)格可以理解為交叉表的數(shù)據(jù)格 一些基本操作一些基本操作 在多維數(shù)組的某一維選定一個(gè)維成員的動(dòng)作稱在多維數(shù)組的某一維選定一個(gè)維成員的動(dòng)作稱為為切片切片。舍棄一些觀察角度舍棄一些觀察角度 在多維數(shù)組的某一維上選定某一區(qū)間
21、的維成員在多維數(shù)組的某一維上選定某一區(qū)間的維成員切塊切塊多個(gè)切片的疊加多個(gè)切片的疊加旋轉(zhuǎn)旋轉(zhuǎn)是改變一個(gè)報(bào)告或頁(yè)面顯示的維方向是改變一個(gè)報(bào)告或頁(yè)面顯示的維方向以用戶容易理解的角度來(lái)觀察數(shù)據(jù)以用戶容易理解的角度來(lái)觀察數(shù)據(jù) 基于多維數(shù)據(jù)庫(kù)的基于多維數(shù)據(jù)庫(kù)的OLAPMOLAP 以多維方式組織數(shù)據(jù)(以多維方式組織數(shù)據(jù)(綜合綜合數(shù)據(jù))數(shù)據(jù)) 以多維方式顯示(觀察)數(shù)據(jù)以多維方式顯示(觀察)數(shù)據(jù) 多維數(shù)據(jù)庫(kù)的形式類似于交叉表,可直觀地表多維數(shù)據(jù)庫(kù)的形式類似于交叉表,可直觀地表述一對(duì)多、多對(duì)多的關(guān)系述一對(duì)多、多對(duì)多的關(guān)系如:產(chǎn)品、地區(qū)、銷售額如:產(chǎn)品、地區(qū)、銷售額關(guān)系關(guān)系多維多維 多維數(shù)據(jù)庫(kù)由許多經(jīng)壓縮的、類
22、似于數(shù)組的對(duì)多維數(shù)據(jù)庫(kù)由許多經(jīng)壓縮的、類似于數(shù)組的對(duì)象構(gòu)成,帶有高度壓縮的索引及指針結(jié)構(gòu)象構(gòu)成,帶有高度壓縮的索引及指針結(jié)構(gòu) 以關(guān)系數(shù)據(jù)庫(kù)存放細(xì)節(jié)數(shù)據(jù)、以多維數(shù)據(jù)庫(kù)存以關(guān)系數(shù)據(jù)庫(kù)存放細(xì)節(jié)數(shù)據(jù)、以多維數(shù)據(jù)庫(kù)存放綜合數(shù)據(jù)放綜合數(shù)據(jù) 基于關(guān)系數(shù)據(jù)庫(kù)的基于關(guān)系數(shù)據(jù)庫(kù)的OLAPROLAP 以以二維表二維表與與多維聯(lián)系多維聯(lián)系來(lái)表達(dá)多維數(shù)據(jù)(來(lái)表達(dá)多維數(shù)據(jù)(綜合綜合數(shù)數(shù)據(jù))據(jù))星型結(jié)構(gòu)星型結(jié)構(gòu)事實(shí)表,存儲(chǔ)事實(shí)的量及各維的碼值(事實(shí)表,存儲(chǔ)事實(shí)的量及各維的碼值(BCNF)維表,對(duì)每一個(gè)維,至少有一個(gè)表用來(lái)保存該維維表,對(duì)每一個(gè)維,至少有一個(gè)表用來(lái)保存該維的元數(shù)據(jù)(多層次、冗余)的元數(shù)據(jù)(多層次、冗余)事實(shí)表
23、通過(guò)外鍵與每個(gè)維表相聯(lián)系事實(shí)表通過(guò)外鍵與每個(gè)維表相聯(lián)系雪花、星座、雪暴雪花、星座、雪暴 模擬多維方式顯示(觀察)數(shù)據(jù)模擬多維方式顯示(觀察)數(shù)據(jù) MOLAP與與ROLAPMOLAP計(jì)算速度較快計(jì)算速度較快支持的數(shù)據(jù)容量較小支持的數(shù)據(jù)容量較小缺乏細(xì)節(jié)數(shù)據(jù)的缺乏細(xì)節(jié)數(shù)據(jù)的OLAPROLAP結(jié)構(gòu)較復(fù)雜結(jié)構(gòu)較復(fù)雜以關(guān)系模擬多維以關(guān)系模擬多維支持適當(dāng)細(xì)節(jié)的支持適當(dāng)細(xì)節(jié)的OLAP較成熟較成熟HOLAP是以上兩種的綜合是以上兩種的綜合 桌面級(jí)工具桌面級(jí)工具 BrioQuery (ROLAP) Business Objects (ROLAP) Cognos Impromptu (ROLAP) Cognos P
24、owerPlay (MOLAP) 服務(wù)器級(jí)服務(wù)器級(jí)OLAP Arbor Software Essbase (MOLAP) MicroStrategy DSS Agent (ROLAP ) Oracles Express (hybrid MOLAP/ROLAP) SQL3對(duì)聚集的擴(kuò)展對(duì)聚集的擴(kuò)展(在在Group By中擴(kuò)展中擴(kuò)展)SP(S#,P#,QTY)S#P#QTYS1P1300S1P2200S2P1300S2P2400S3P2200S4P2200Select sum(QTY) as TOTQTYFromSP;Select S#,Sum(QTY) as TOTQTYFromSPGroup B
25、y S#;. SQL3對(duì)聚集的擴(kuò)展對(duì)聚集的擴(kuò)展(在在Group By中擴(kuò)展中擴(kuò)展) Grouping Sets:支持多個(gè)分組同時(shí)運(yùn)算:支持多個(gè)分組同時(shí)運(yùn)算Select S#,P#,SUN(QTY) as TOTQTYFrom SPGroup By Grouping Sets (S#) , (P#)S#P#TOTQTYS1Null500S2Null 700S3Null 200S4Null 200NullP1600NullP21000 SQL3對(duì)聚集的擴(kuò)展對(duì)聚集的擴(kuò)展(在在Group By中擴(kuò)展中擴(kuò)展) Rollup:上卷:上卷Select S#,P#,SUN(QTY) as TOTQTYFrom
26、 SPGroup By Rollup (S# , P#)等同于等同于Group By Grouping Sets (S#, P#) , (S#),( )S#P#TOTQTYS1P1300S1P2200S2P1300S2P2400S3P2200S4P2200S1Null500S2Null 700S3Null 200S4Null 200NullNull1600SQL3對(duì)聚集的擴(kuò)展對(duì)聚集的擴(kuò)展(在在Group By中擴(kuò)展中擴(kuò)展) Cube:立方體(交叉表):立方體(交叉表)Select S#,P#,SUN(QTY) as TOTQTYFrom SPGroup By Cube (S# , P#)等同于等同于Group By Grouping Sets (S#, P#) , (S#) , (P#) , ( )S#P#TOTQTYS1P1300S1P2200S2P1300S2P2400S3P2200S4P2200S1Null500S2Null 700S3Null 200S4Null 200NullP1600NullP21000NullNull1600 數(shù)據(jù)挖掘數(shù)據(jù)挖掘(Data Mining) 探測(cè)型的數(shù)據(jù)分析探測(cè)型的數(shù)據(jù)分析 發(fā)現(xiàn)信息、發(fā)現(xiàn)知識(shí)發(fā)現(xiàn)信息、發(fā)現(xiàn)知識(shí) 基于基于人工智能人工智能、機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)統(tǒng)計(jì)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 可穿戴設(shè)備市場(chǎng)發(fā)展趨勢(shì)分析
- 2026年物流管理專業(yè)學(xué)生實(shí)踐考試題物流規(guī)劃與優(yōu)化案例分析題
- 2026年工業(yè)自動(dòng)化系統(tǒng)調(diào)試模擬題
- 2026年銀行職員招聘考試金融知識(shí)會(huì)計(jì)實(shí)務(wù)模擬試題
- 2026年電子商務(wù)營(yíng)銷專家網(wǎng)絡(luò)營(yíng)銷策略分析與實(shí)施模擬試題及答案
- 2026年電氣工程師專業(yè)招聘筆試題庫(kù)大全
- 2026年大學(xué)入學(xué)考試英語(yǔ)筆試模擬題
- 2026年會(huì)計(jì)師中級(jí)職稱考試核心題目與詳解
- 2026年注冊(cè)會(huì)計(jì)師財(cái)務(wù)成本管理預(yù)測(cè)模擬試題
- 2026年能源行業(yè)面試問(wèn)題及答案參考
- 2026年上半年眉山天府新區(qū)公開選調(diào)事業(yè)單位工作人員的參考題庫(kù)附答案
- 水產(chǎn)養(yǎng)殖技術(shù)手冊(cè)
- 英國(guó)汽車工業(yè)市場(chǎng)分析現(xiàn)狀供需格局投資前景未來(lái)規(guī)劃研究報(bào)告
- 2025年及未來(lái)5年市場(chǎng)數(shù)據(jù)中國(guó)吸塑、注塑行業(yè)發(fā)展前景預(yù)測(cè)及投資戰(zhàn)略數(shù)據(jù)分析研究報(bào)告
- GB/T 7948-2024滑動(dòng)軸承塑料軸套極限PV試驗(yàn)方法
- DL∕T 1057-2023 自動(dòng)跟蹤補(bǔ)償消弧線圈成套裝置技術(shù)條件
- AQ 2003-2018 軋鋼安全規(guī)程(正式版)
- 兒童特發(fā)性矮身材診斷與治療中國(guó)專家共識(shí)(2023版)解讀
- 村委會(huì)指定監(jiān)護(hù)人證明書模板
- 送給業(yè)主禮物方案
- JJG 393-2018便攜式X、γ輻射周圍劑量當(dāng)量(率)儀和監(jiān)測(cè)儀
評(píng)論
0/150
提交評(píng)論