數據倉庫、OLAP與數據挖掘關系概述_第1頁
數據倉庫、OLAP與數據挖掘關系概述_第2頁
數據倉庫、OLAP與數據挖掘關系概述_第3頁
數據倉庫、OLAP與數據挖掘關系概述_第4頁
數據倉庫、OLAP與數據挖掘關系概述_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 關鍵詞:數據倉庫 OLAP 數據挖掘 特征(1)數據倉庫的數據是面向主題的。主題是一個抽象的概念,是較高層次 (2)數據倉庫的數據是集成的 。數據倉庫的數據是從原有的分散的數據庫 (3)數據倉庫的數據是不可更新的。數據倉庫的數據主要供企業(yè)決策分析 (4)數據倉庫的數據是隨時間不斷變化的。數據倉庫的用戶進行分析處理 類型 和數據集市(Data Marts)。(1)企業(yè)數據倉庫為通用數據倉庫,它既含有大量詳細的數據,也含有大 (2)操作型數據庫既可以被用來針對工作數據做決策支持,又可用做將數 。(3)數據集市是為了特定的應用目的或應用范圍,從而數據倉庫中獨立出 數據,也可稱為部門數據或主題數據。

2、幾組數據集市可以組成一個 度方式分析數據,而能彈性地提供積存上鉆(Roll-up)、下鉆(Drill-down)、和 透視分析(pivot)等操作,呈現集成性決策信息的方法,多用于決策支持系統(tǒng)、 決策提供參考和支持。與之相區(qū)別的是聯(lián)機交易處理(OLTP)。 同的理解。廣義上的理解與字面意思相 即與多維分析相關,基于立方體(CUBE)計算而進行的分析。 需要的不是某一指標單一的值,而是希望 等各 (1)切片操作:是在給定的多維數據集的某一個維上選定一維成員,從而 得到一個多維數據子集的動作。如果有(維1,維 2,維i,維n,度量) 維 n,度量)就是多維數據集(維 1,維 2,維 i,維 n,度

3、量)在維 i (2)切塊操作:在多維數據集的某一維上選定某一區(qū)間的維成員的操作稱 (3)旋轉是一種目視操作,它轉動多維數據集的視角,提供數據的替代表 (4)鉆取分為向下鉆取和向上鉆取。下鉆操作是由不太詳細的高層次匯總 (6)其它的 OLAP 操作還包括計算統(tǒng)計表中的最高或最低 N 項、平均值、 數據挖掘(Data mining),又譯為資料探勘、數據挖掘、數據采礦。它是數 數據挖掘一般是指從大量的數據中自動搜索隱藏于其中的有著特殊關系性(屬于 3.1 數據挖掘與傳統(tǒng)數據分析的區(qū)別 連鎖店通過數據挖掘發(fā)現了小孩尿布和啤酒之間有 用的、最終可理解的模式的過程;而數據挖掘是 3.2 數據挖掘的分析方法 (1)關聯(lián)分析,即利用關聯(lián)規(guī)則進行數據挖掘。在數據挖掘研究領域,對 研究開展得比較深入,人們提出了多種關聯(lián)規(guī)則的挖掘算法,如 (3)分類分析,設有一個數據庫和一組具有不同特征的標記,該數據庫中 。(4) 聚類分析與分類分析不同,聚類分析輸入的是一組未分類記錄,并且 不知道。聚類分析就是通過分析數據庫中的記錄數 合理地劃分記錄集合,確定每個記錄所在類別。它所 動態(tài)聚類法、模糊聚類法、運籌方法等。采用不同的 掘是從巨 息的一種過程與技術”。 一系列假設驅動,通過 OLAP 來證實或者推翻這些假設,是一個演繹推理的過 數據倉庫可以作為數據挖掘和 OLA

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論