CRM系統(tǒng)中的商業(yè)智能技術(shù)培訓(xùn)課件_第1頁(yè)
CRM系統(tǒng)中的商業(yè)智能技術(shù)培訓(xùn)課件_第2頁(yè)
CRM系統(tǒng)中的商業(yè)智能技術(shù)培訓(xùn)課件_第3頁(yè)
CRM系統(tǒng)中的商業(yè)智能技術(shù)培訓(xùn)課件_第4頁(yè)
CRM系統(tǒng)中的商業(yè)智能技術(shù)培訓(xùn)課件_第5頁(yè)
已閱讀5頁(yè),還剩77頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第7章 CRM系統(tǒng)中的商業(yè)智能技術(shù)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)數(shù)據(jù)挖掘理解三種技術(shù)的的應(yīng)用CRM系統(tǒng)中商業(yè)智能技術(shù)本章主要內(nèi)容:)聯(lián)機(jī)分析處理數(shù)據(jù)挖掘 OLAP的應(yīng)用 數(shù)據(jù)挖掘應(yīng)用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能第一節(jié)商商業(yè)業(yè)智能商業(yè)智能能是從大量量的數(shù)據(jù)據(jù)和信息息中發(fā)掘掘有用的的知識(shí),并用于于決策以以增加商商業(yè)利潤(rùn)潤(rùn),是一一個(gè)從數(shù)數(shù)據(jù)到信信息到知知識(shí)的處處理過(guò)程程。商業(yè)業(yè)智能用用來(lái)輔助助商業(yè)活活動(dòng)作出出快速反反應(yīng),加加快知識(shí)識(shí)的獲取取速度,減少企企業(yè)不確確定性因因素的影影響。因因此能很很好地滿滿足管理理層和決決策層對(duì)對(duì)信息知知識(shí)的時(shí)時(shí)間性和和準(zhǔn)確性性的

2、要求求。商業(yè)智能能在我國(guó)國(guó)尚處于于起步階階段,雖雖然其在在發(fā)展和和應(yīng)用過(guò)過(guò)程中仍仍存在很很多不足足,但商商業(yè)智能能正朝著著實(shí)時(shí)性、標(biāo)準(zhǔn)化、集成性、實(shí)用性、大眾化方向發(fā)展展。商業(yè)智能能的定義義數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能支撐技術(shù):數(shù)據(jù)倉(cāng)庫(kù)為平臺(tái),數(shù)據(jù)挖掘OLAP互補(bǔ),進(jìn)行分析體系結(jié)構(gòu)構(gòu):以Web服務(wù)形式式提供,以XML形式發(fā)放放BI應(yīng)用的分分析結(jié)果果是新的的發(fā)展趨趨勢(shì)。應(yīng)用系統(tǒng)統(tǒng):BI系統(tǒng)將更更具專業(yè)業(yè)化和行行業(yè)化的的特點(diǎn),與企業(yè)業(yè)門戶、企業(yè)應(yīng)應(yīng)用集成成緊密相相連商業(yè)智能的發(fā)展商業(yè)智

3、能能的發(fā)展展第一節(jié)商商業(yè)業(yè)智能數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)倉(cāng)庫(kù)決策支持企業(yè)決策層OLAP數(shù)據(jù)挖掘數(shù)據(jù)存儲(chǔ)提取、清洗、轉(zhuǎn)化業(yè)務(wù)數(shù)據(jù)庫(kù)決策信息反饋到實(shí)際的業(yè)務(wù)系統(tǒng)中商業(yè)智能能系統(tǒng)的的構(gòu)成商業(yè)智能能系統(tǒng)由由業(yè)務(wù)數(shù)據(jù)據(jù)倉(cāng)庫(kù)系系統(tǒng)、決策支持持系統(tǒng)等部分構(gòu)構(gòu)成。圖7-12商業(yè)智能能系統(tǒng)的的數(shù)據(jù)處處理循環(huán)環(huán)第一節(jié)商商業(yè)業(yè)智能數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能商務(wù)智能能系統(tǒng)的的三大支支撐

4、技術(shù)術(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)OLAP數(shù)據(jù)倉(cāng)庫(kù)庫(kù)完成了了數(shù)據(jù)的收集、集成、存儲(chǔ)、管理等等工作,商務(wù)智能面對(duì)對(duì)的是經(jīng)經(jīng)過(guò)加工的數(shù)據(jù)據(jù),能更更專注于信息的的提取和和知識(shí)的發(fā)現(xiàn)。OLAP從多種種角度對(duì)對(duì)原始數(shù)據(jù)據(jù)進(jìn)行分分析,將其轉(zhuǎn)轉(zhuǎn)化為用用戶所理解、并真實(shí)實(shí)反映企業(yè)經(jīng)經(jīng)營(yíng)情況況的信息,為為決策提提供依據(jù)。數(shù)據(jù)挖掘掘技術(shù)數(shù)據(jù)挖掘掘技術(shù)能能高度自動(dòng)動(dòng)化地分分析數(shù)據(jù),做出歸歸納性推理理,挖掘掘出潛在的的模式,幫助決策策者作出出正確的決決策。商業(yè)智能能系統(tǒng)的的支撐技技術(shù)第一節(jié)商商業(yè)業(yè)智能數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用

5、商業(yè)智能能客戶智能能是創(chuàng)新和和使用客客戶知識(shí)識(shí),幫助助企業(yè)提提高優(yōu)化化客戶關(guān)關(guān)系的決決策能力力和整體體運(yùn)營(yíng)能能力的概概念、方方法、過(guò)過(guò)程以及及軟件的的集合??蛻糁悄苣芸蛻糁悄艿睦斫?理論基礎(chǔ)信息系統(tǒng)層面數(shù)據(jù)分析層面知識(shí)發(fā)現(xiàn)層面戰(zhàn)略層面客戶智能能的定義義第一節(jié)商商業(yè)業(yè)智能數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能客戶知識(shí)識(shí),顧名思思義,是是有關(guān)客客戶的知知識(shí)??涂蛻糁R(shí)識(shí)包括客客戶的消消費(fèi)偏好好、喜歡歡選用的的接觸渠渠道、消消費(fèi)特征征等許多多描述客客戶的知知識(shí)??涂蛻糁R(shí)識(shí)是人們們通過(guò)實(shí)實(shí)踐認(rèn)識(shí)識(shí)

6、到的、與客戶戶有關(guān)的的規(guī)律性性,而客客戶智能能是獲得得客戶知知識(shí)并使使用客戶戶知識(shí)求求解問(wèn)題題的能力力??蛻糁悄苣苁菍?duì)企企業(yè)戰(zhàn)略略決策真真正有價(jià)價(jià)值的事事物和行行動(dòng)。生生成客戶戶知識(shí)的的過(guò)程稱稱之為客戶知識(shí)識(shí)的加工工處理過(guò)過(guò)程,客戶智智能不僅僅包括了了客戶知知識(shí)的生生成,而而且強(qiáng)調(diào)調(diào)了客戶戶知識(shí)在在企業(yè)中中的分發(fā)發(fā)、使用用,直到到產(chǎn)生客客戶智能能 ??蛻糁R(shí)識(shí)第一節(jié)商商業(yè)業(yè)智能數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能客戶知識(shí)生成客戶知識(shí)分發(fā)客戶檔案客戶知識(shí)使用營(yíng)銷客戶服務(wù)。客戶智能客戶智能圖7

7、-13客戶智能能的生成成、分發(fā)發(fā)和使用用第一節(jié)商商業(yè)業(yè)智能數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能(1)客戶知識(shí)識(shí)的生成成(generation):使用商業(yè)業(yè)智能提提供的OLAP分析工具具、數(shù)據(jù)據(jù)挖掘工工具或兩兩種工具具的組合合,發(fā)現(xiàn)現(xiàn)存在于于客戶數(shù)數(shù)據(jù)中的的模式、規(guī)則、概念、規(guī)律的的整個(gè)過(guò)過(guò)程,稱稱為客戶戶知識(shí)的的生成。(2)客戶知識(shí)識(shí)的分發(fā)發(fā)(distribution):客戶知識(shí)識(shí)必須到到達(dá)組織織內(nèi)每一一個(gè)需要要客戶知知識(shí)的部部分。將將客戶知知識(shí)存儲(chǔ)儲(chǔ)與動(dòng)態(tài)態(tài)知識(shí)庫(kù)庫(kù),借助助CRM的系統(tǒng)平

8、平臺(tái),將將客戶知知識(shí)分發(fā)發(fā)到需要要的終端端。(3)客戶知識(shí)識(shí)的使用用(usingit):將客戶信信息和知知識(shí)投入入使用是是CRM的最后一一個(gè)環(huán)節(jié)節(jié)。許多多CRM和知識(shí)發(fā)發(fā)現(xiàn)沒(méi)有有成功,很大程程度上在在于產(chǎn)生生的與客客戶有關(guān)關(guān)的信息息和知識(shí)識(shí)不能投投入使用用。第一節(jié)商商業(yè)業(yè)智能數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的產(chǎn)生生沒(méi)有(一一致的)全局信信息 很難難產(chǎn)生正正確的決決策沒(méi)有(完完整的)歷史數(shù)數(shù)據(jù)歷史數(shù)據(jù)據(jù)分析(經(jīng)驗(yàn))發(fā)展趨勢(shì)勢(shì)預(yù)測(cè)隱含信息息挖掘更難支支持企

9、企業(yè)決策策研究企業(yè)范圍圍內(nèi)的數(shù)數(shù)據(jù)集成成多數(shù)據(jù)庫(kù)庫(kù)系統(tǒng)面向問(wèn)題題的分析析海量數(shù)據(jù)據(jù)存儲(chǔ)產(chǎn)生一項(xiàng)項(xiàng)新的信信息技術(shù)術(shù)DataWarehousingDW的概念起起源于20世紀(jì)80年代美國(guó)著著名信息息工程學(xué)學(xué)家W.H.Inmon博士RecordSystemAtomicData提出數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的概概念DecisionSupportDatabase數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述早期數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的定定義的重重要文文獻(xiàn):MartinHubel1986.10DataBasean

10、dtheDataWarehousingConcept數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的定義義B.A.DevilinP.T.MurphyAnArchitectureforaBusinessandInformationSystemIBMSystemJournal其中,披披露了一一項(xiàng)IBM的 內(nèi)部部研究計(jì)計(jì)劃目的:構(gòu)構(gòu)造一種種“以關(guān)系數(shù)數(shù)據(jù)庫(kù)為為基礎(chǔ)的的公司數(shù)數(shù)據(jù)的集集成化倉(cāng)倉(cāng)儲(chǔ)”倉(cāng)儲(chǔ)的使使用者:不不是IT人員而是各級(jí)級(jí)決策者者數(shù)據(jù)倉(cāng)庫(kù)庫(kù)1991年,IBM公司正正式公公布其其DW構(gòu)架INDEPTH成功開(kāi)開(kāi)發(fā)DW數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)

11、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述數(shù)據(jù)倉(cāng)庫(kù)庫(kù)(datawarehouse)是一個(gè)面面向主題題的(subjectoriented)、集成的的(integrated)、非易失失的(non-volatile)、隨時(shí)間間變化的的(timevariant)數(shù)據(jù)集合合,用于于支持管管理決策策。面向主題集成性非易失性時(shí)變性 在數(shù)據(jù)倉(cāng)庫(kù)中,所有數(shù)據(jù)都是圍繞一定主題進(jìn)行。對(duì)于同一主題:關(guān)系數(shù)據(jù)庫(kù)中,數(shù)據(jù)分布在相關(guān)的數(shù)據(jù)表中,在數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)存放在同一數(shù)據(jù)表中。數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)都經(jīng)過(guò)清洗、過(guò)濾、轉(zhuǎn)換。都有統(tǒng)一得格式、消除了源數(shù)據(jù)中結(jié)構(gòu)、表示方式、代碼含義,不一致性 對(duì)于支持決策,歷史數(shù)據(jù)非常重

12、要。數(shù)據(jù)一旦寫入,幾乎不再更改,除非錯(cuò)誤。對(duì)數(shù)據(jù)倉(cāng)庫(kù)的操作只是數(shù)據(jù)追加。 所以數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)是非易失的(穩(wěn)定的)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)是只增不刪的,所以記錄了所有的數(shù)據(jù)。反映企業(yè)各個(gè)時(shí)期的信息,即反映企業(yè)隨時(shí)間動(dòng)態(tài)變化的數(shù)據(jù)。 數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的定義義數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述面向主題案例數(shù)據(jù)結(jié)構(gòu)構(gòu):銷售管理理系統(tǒng)顧客(顧顧客號(hào),姓名,性別,年齡,文化程程度,地地址,電電話)銷售(員員工號(hào),顧客號(hào)號(hào),商品號(hào),數(shù)量,單價(jià),日期)采購(gòu)管理理系統(tǒng)訂單單(訂單號(hào)號(hào),供應(yīng)應(yīng)商號(hào),

13、總金額額,日期期)訂單細(xì)則則(訂單單號(hào),商品號(hào),類別,單價(jià),數(shù)量)供 應(yīng)商商(供供應(yīng)商號(hào)號(hào),供應(yīng)應(yīng)商名,地址,電話)庫(kù)存管理理系統(tǒng)領(lǐng)料單(領(lǐng)料單單號(hào),領(lǐng)領(lǐng)料人,商品號(hào),數(shù)量,日期)進(jìn)料單(進(jìn)料單單號(hào),訂訂單號(hào),進(jìn)料人人,收料料人,日日期)庫(kù)存存(商品品號(hào),庫(kù)庫(kù)房號(hào),庫(kù)存量量,日期期)庫(kù)房房(庫(kù)房房號(hào),倉(cāng)倉(cāng)庫(kù)管理理員,地地點(diǎn),庫(kù)庫(kù)存商品品描述)數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述面向主題案例這種數(shù)據(jù)據(jù)組織的的特點(diǎn):對(duì)相關(guān)部部門的數(shù)數(shù)據(jù)進(jìn)行行收集和和處理,重點(diǎn)是是“數(shù)據(jù)

14、”和“處理”數(shù)據(jù)按部部門的組組織結(jié)構(gòu)構(gòu)和業(yè)務(wù)務(wù)活動(dòng)特特點(diǎn)進(jìn)行行;數(shù)據(jù)是不不斷變化化和反復(fù)復(fù)更新的的,所以以,是動(dòng)動(dòng)態(tài)的,要求的的是處理的速速度和即即時(shí)性(只反映映當(dāng)時(shí)的的情況);數(shù)據(jù)庫(kù)中中存儲(chǔ)的的表與部部門中的的業(yè)務(wù)報(bào)報(bào)表基本本上是對(duì)對(duì)應(yīng)的,所以,直觀,處處理方便便,易理理解;數(shù)據(jù)庫(kù)建建立的本本質(zhì):數(shù)數(shù)據(jù)與處處理分離離(在程程序中不不分離)因?yàn)椋汉芎芏鄳?yīng)用用涉及同同一數(shù)據(jù)據(jù)項(xiàng),而而同一數(shù)數(shù)據(jù)項(xiàng)分分散在不不同的數(shù)據(jù)庫(kù)中中 造造成數(shù)數(shù)據(jù)的不不一致性性。 這樣的數(shù)數(shù)據(jù)處理理方式稱稱為“聯(lián)機(jī)事務(wù)務(wù)處理”O(jiān)LTP數(shù)據(jù)庫(kù)的的存儲(chǔ)要要求冗冗余小小 (各各種范式式)速度快(保留留一定的的冗余)數(shù)據(jù)挖掘掘OLA

15、P的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述按主題組組織數(shù)據(jù)據(jù)的數(shù)據(jù)據(jù)結(jié)構(gòu):商品品商品固有有信息(商品號(hào),商品名,類別,顏色,)商品采購(gòu)購(gòu)信息(商品號(hào),供應(yīng)商號(hào)號(hào),供應(yīng)價(jià),供應(yīng)日期期,供應(yīng)量,)商品銷售售信息(商品號(hào),顧客號(hào),售價(jià),銷售日期期,銷售量,.)商品庫(kù)存存信息(商品號(hào),庫(kù)房號(hào),庫(kù)存量,日期,)供應(yīng)商供應(yīng)商固固有信息息(供應(yīng)商號(hào)號(hào),供應(yīng)信息息,地址,電話,)供應(yīng)商品品信息(供應(yīng)商號(hào)號(hào),商品號(hào),供應(yīng)價(jià),供應(yīng)日期期,供應(yīng)量,)顧客客顧客固有有信息(顧客號(hào),顧客名,性別,年齡,文化程度度

16、,住址,電話,)顧客購(gòu)物物信息(顧客號(hào),商品號(hào),售價(jià),購(gòu)買日期期,購(gòu)買量,)企業(yè)關(guān)心心的業(yè)務(wù)務(wù)方向:客戶,商品,供應(yīng)商商對(duì)上述分分析對(duì)象象,可圍圍繞主題題進(jìn)行數(shù)數(shù)據(jù)組織織:采購(gòu)銷售庫(kù)存商品(一致)信息,便于聯(lián)聯(lián)機(jī)分分析處理理OLAP數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能(1)數(shù)據(jù)粒粒度面向數(shù)據(jù)據(jù)挖掘面向OLAP粒度的大大小反映映數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的數(shù)據(jù)綜綜合程度度。粒度度越小,數(shù)據(jù)據(jù)越詳細(xì)細(xì),數(shù)據(jù)據(jù)量也越大。(表)反映的是是抽樣率率。抽樣樣率的確定取決決于源數(shù)數(shù)據(jù)量的的大小和數(shù)據(jù)挖挖掘的具具體要求求

17、。源數(shù)據(jù)量越越大,抽抽樣率越越低。表數(shù)數(shù)據(jù)粒度度的相關(guān)關(guān)指標(biāo)數(shù)據(jù)粒度度的劃分分是設(shè)計(jì)計(jì)最重要要的工作作,需考考慮數(shù)據(jù)據(jù)倉(cāng)庫(kù)可可接受的的分析類類型和最最低粒度度以及能能存儲(chǔ)的的數(shù)據(jù)量量。一般般數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)都選選擇多重重粒度的的結(jié)構(gòu)。重要概念念第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)分割割常見(jiàn)形形式垂直分割水平分割圖解分割(2)數(shù)據(jù)分分割數(shù)據(jù)分割割就是將大大量的數(shù)數(shù)據(jù)分成成獨(dú)立的的、較小小的單元元進(jìn)行存存儲(chǔ)以提提高數(shù)據(jù)據(jù)處理的的效率。在進(jìn)行行分割時(shí)時(shí)要考慮慮數(shù)據(jù)量量、數(shù)據(jù)

18、據(jù)對(duì)象和和粒度劃劃分策略略等幾個(gè)個(gè)方面。一個(gè)表垂垂直分成兩部分分,把一個(gè)大表表分成兩個(gè)表,表之間通過(guò)關(guān)關(guān)鍵字段關(guān)聯(lián)聯(lián)。表按行分分成兩部分,表表被用來(lái)存儲(chǔ)用用戶聯(lián)系緊密的的本地重要數(shù)據(jù)據(jù),減少網(wǎng)絡(luò)查查詢。經(jīng)過(guò)多個(gè)個(gè)分布系系統(tǒng)把一個(gè)個(gè)圖分解解成兩部分分,從指指定的服務(wù)務(wù)器或在在多個(gè)服務(wù)務(wù)器之間間建立連接接而得到到一個(gè)表所所需要的的全部數(shù)據(jù)據(jù)。第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述數(shù)據(jù)倉(cāng)庫(kù)庫(kù)與數(shù)據(jù)據(jù)庫(kù)的區(qū)區(qū)別表2數(shù)據(jù)庫(kù)和和數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的區(qū)區(qū)別數(shù)據(jù)庫(kù)只只

19、存儲(chǔ)當(dāng)當(dāng)前數(shù)據(jù)據(jù),而數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)存放歷歷史數(shù)據(jù)據(jù);數(shù)據(jù)據(jù)庫(kù)主要要面向業(yè)業(yè)務(wù)操作作,而數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)面向數(shù)數(shù)據(jù)分析析和決策策支持;數(shù)據(jù)庫(kù)庫(kù)中的數(shù)數(shù)據(jù)是動(dòng)動(dòng)態(tài)變化化的,隨隨時(shí)刷新新,而數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中的數(shù)數(shù)據(jù)是靜靜態(tài)的,一般不不會(huì)改變變;數(shù)據(jù)據(jù)庫(kù)使用用頻率比比數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)高,數(shù)據(jù)訪訪問(wèn)量少少,要求求響應(yīng)時(shí)時(shí)間短。數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能企業(yè)外部部數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)存儲(chǔ)業(yè)務(wù)操作作型系統(tǒng)統(tǒng)數(shù)據(jù)清洗/轉(zhuǎn)換數(shù)據(jù)提取提取倉(cāng)庫(kù)數(shù)據(jù)挖掘系統(tǒng)/數(shù)據(jù)展現(xiàn)系統(tǒng)數(shù)據(jù)集市數(shù)據(jù)集市數(shù)據(jù)集市數(shù)據(jù)集市數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的體系系結(jié)

20、構(gòu)數(shù)據(jù)據(jù)元數(shù)數(shù)據(jù)據(jù)圖3數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的體系結(jié)結(jié)構(gòu)圖第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的體系系結(jié)構(gòu)由于數(shù)據(jù)據(jù)庫(kù)和數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)應(yīng)用的的出發(fā)點(diǎn)點(diǎn)不同,因此數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)與業(yè)務(wù)務(wù)數(shù)據(jù)庫(kù)庫(kù)系統(tǒng)是是相互獨(dú)獨(dú)立的,但數(shù)據(jù)據(jù)倉(cāng)庫(kù)又又同業(yè)務(wù)務(wù)數(shù)據(jù)庫(kù)庫(kù)系統(tǒng)密密切相關(guān)關(guān)。數(shù)據(jù)倉(cāng)庫(kù)庫(kù)是將業(yè)業(yè)務(wù)操作作型系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)提取取出來(lái),輔以企企業(yè)外部部數(shù)據(jù),這些數(shù)數(shù)據(jù)經(jīng)過(guò)過(guò)清洗和和轉(zhuǎn)換,存儲(chǔ)在在數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中。數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)不只只存儲(chǔ)業(yè)業(yè)務(wù)數(shù)據(jù)據(jù),還存存儲(chǔ)記錄錄數(shù)據(jù)信信息的元元數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中

21、還可可以抽取取部門型型數(shù)據(jù)倉(cāng)倉(cāng)庫(kù),即即數(shù)據(jù)集集市。數(shù)數(shù)據(jù)最終終傳送給給數(shù)據(jù)挖挖掘系統(tǒng)統(tǒng)或數(shù)據(jù)據(jù)展現(xiàn)系系統(tǒng),以以供數(shù)據(jù)據(jù)分析或或展現(xiàn)給給用戶。所以,數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)不是是簡(jiǎn)單地地對(duì)數(shù)據(jù)據(jù)進(jìn)行存存儲(chǔ),而而是對(duì)數(shù)數(shù)據(jù)進(jìn)行行“再組組織”。第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能傳統(tǒng)數(shù)據(jù)據(jù)庫(kù)面向向操作型型環(huán)境,系統(tǒng)設(shè)設(shè)計(jì)人員員能夠明明確了解解用戶需需求,因因此傳統(tǒng)統(tǒng)數(shù)據(jù)庫(kù)庫(kù)一般采采用系統(tǒng)生命命周期法法(system development lifecycle,SDLC)。而數(shù)據(jù)據(jù)倉(cāng)庫(kù)面

22、面向分析析型應(yīng)用用,設(shè)計(jì)計(jì)人員要要在與用用戶不斷斷溝通的的基礎(chǔ)上上,逐步步明確與與完善系系統(tǒng)需求求,因此此數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)設(shè)計(jì)計(jì)采用CLDS(cycle lifedevelopmentsystem)方法。需求分析析貫穿整整個(gè)數(shù)據(jù)據(jù)倉(cāng)庫(kù)設(shè)設(shè)計(jì)過(guò)程程。數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的設(shè)計(jì)計(jì)方法與與步驟第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的設(shè)計(jì)計(jì)方法與與步驟第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述圖7-4SDLC方方法和CLDS方法比比較數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)

23、庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的設(shè)計(jì)計(jì)方法與與步驟第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述表7-3數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)設(shè)計(jì)計(jì)與數(shù)據(jù)據(jù)庫(kù)設(shè)計(jì)計(jì)的區(qū)別別數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的設(shè)計(jì)計(jì)方法與與步驟第二節(jié)數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)概述述圖7-5數(shù)據(jù)據(jù)倉(cāng)庫(kù)設(shè)設(shè)計(jì)的主主要步驟驟數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)最終用戶

24、信息使用者 知識(shí)挖掘者 數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的用戶戶信息使用用者使用用數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)是經(jīng)經(jīng)常性的的、重復(fù)復(fù)性的,只訪問(wèn)問(wèn)很少的的一部分分?jǐn)?shù)據(jù)。每次查查詢也許許是相同同的幾個(gè)個(gè)指標(biāo),運(yùn)用數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)可以快快速、準(zhǔn)準(zhǔn)確地得得到他們們所需要要的信息息。信息息使用者者是操作作型用戶戶。知識(shí)挖掘掘者不只只查詢數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)目前能能夠提供供的信息息,還通通過(guò)數(shù)據(jù)據(jù)分析找找到其中中的隱含含信息,用以發(fā)發(fā)現(xiàn)更深深層次的的知識(shí)來(lái)來(lái)指導(dǎo)決決策。知知識(shí)挖掘掘者是分分析型用用戶。知識(shí)挖掘掘者在使使用數(shù)據(jù)據(jù)倉(cāng)庫(kù)時(shí)時(shí),先對(duì)對(duì)數(shù)據(jù)進(jìn)進(jìn)行概括括分析,然后根根據(jù)需要要從數(shù)據(jù)據(jù)倉(cāng)庫(kù)中中抽取數(shù)數(shù)據(jù),對(duì)對(duì)抽取出出來(lái)的數(shù)數(shù)據(jù)選擇擇合適的的數(shù)據(jù)挖挖掘算

25、法法進(jìn)行建建模分析析,最后后是根據(jù)據(jù)建模分分析得到到的知識(shí)識(shí)對(duì)數(shù)據(jù)據(jù)倉(cāng)庫(kù)進(jìn)進(jìn)行分類類處理。數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能客戶數(shù)據(jù)倉(cāng)庫(kù)的功能動(dòng)態(tài)、整整合的客客戶數(shù)據(jù)據(jù)管理和和查詢功功能基于數(shù)據(jù)據(jù)倉(cāng)庫(kù)支支持的客客戶關(guān)系系結(jié)構(gòu)和和忠誠(chéng)客客戶識(shí)別別功能基于WEB數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的信息息共享功功能基于數(shù)據(jù)據(jù)倉(cāng)庫(kù)支支持的客客戶購(gòu)買買行為參參考功能能基于數(shù)據(jù)據(jù)倉(cāng)庫(kù)支支持的客客戶流失失警示功功能CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的功能能CRM的數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)必須須是動(dòng)態(tài)態(tài)的、整整合的數(shù)數(shù)據(jù)庫(kù)系系統(tǒng)。動(dòng)態(tài)指數(shù)據(jù)庫(kù)庫(kù)能夠

26、實(shí)實(shí)時(shí)地提提供客戶戶的基本本資料和和歷史交交易行為為等信息息,并在在客戶每每次交易易完成后后,能夠夠自動(dòng)補(bǔ)補(bǔ)充新的的信息;整合是指客戶戶數(shù)據(jù)庫(kù)庫(kù)與企業(yè)業(yè)其他資資源和信信息系統(tǒng)統(tǒng)要綜合合、統(tǒng)一一,各業(yè)業(yè)務(wù)部門門及人員員可根據(jù)據(jù)職能、權(quán)限的的不同實(shí)實(shí)施信息息查詢和和更新功功能,客客戶數(shù)據(jù)據(jù)倉(cāng)庫(kù)與與企業(yè)的的各交易易渠道和和聯(lián)絡(luò)中中心必須須緊密結(jié)結(jié)合等。實(shí)施忠誠(chéng)誠(chéng)客戶管管理的企企業(yè)需要要制定一一套合理理的建立立和保持持客戶關(guān)關(guān)系的格格式或結(jié)結(jié)構(gòu)。即即企業(yè)要要像建立立雇員的的提升計(jì)計(jì)劃一樣樣,建立立一套把把新客戶戶提升為為老客戶戶的計(jì)劃劃和方法法。例如如,航空空公司的的里程積積累計(jì)劃劃客戶飛行行了一定定

27、的里程程數(shù),便便可以獲獲得相應(yīng)應(yīng)的免費(fèi)費(fèi)里程,或根據(jù)據(jù)客戶要要求提升升艙位等等級(jí)等。企業(yè)運(yùn)用用客戶數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù),可以以使每一一個(gè)服務(wù)務(wù)人員在在為客戶戶提供產(chǎn)產(chǎn)品和服服務(wù)時(shí),明確客客戶的偏偏好和習(xí)習(xí)慣,從從而提供供更具有有針對(duì)性性的個(gè)性性化服務(wù)務(wù)。例如如,讀者者俱樂(lè)部部都有定定制寄送送服務(wù),他們能能根據(jù)會(huì)會(huì)員最后后一次的的選擇和和購(gòu)買記記錄,以以及他們們最近一一次與會(huì)會(huì)員交流流獲得的的有關(guān)個(gè)個(gè)人生活活信息,向會(huì)員員推薦不不同的書書籍。企業(yè)的客客戶數(shù)據(jù)據(jù)倉(cāng)庫(kù)將將通過(guò)對(duì)對(duì)客戶歷歷史交易易行為的的觀察和和分析,發(fā)揮警警示客戶戶異常購(gòu)購(gòu)買行為為的功能能。如一一位客戶戶的購(gòu)買買周期或或購(gòu)買量量出現(xiàn)顯顯著萎

28、縮縮變化時(shí)時(shí),就是是潛在的的客戶流流失跡象象??蛻魬魯?shù)據(jù)庫(kù)庫(kù)通過(guò)自自動(dòng)監(jiān)視視客戶的的交易資資料,對(duì)對(duì)客戶的的潛在流流失現(xiàn)象象作出警警示。Web數(shù)據(jù)倉(cāng)庫(kù)庫(kù)將成為為企業(yè)信信息共享享的基礎(chǔ)礎(chǔ)架構(gòu)。客戶數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)應(yīng)擁有有可以通通過(guò)瀏覽覽器使用用的接口口,以成成為支持持客戶關(guān)關(guān)系管理理的基本本架構(gòu),并且數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)要能夠夠通過(guò)用用戶的簡(jiǎn)簡(jiǎn)單點(diǎn)擊擊就可以以獲得分分析結(jié)果果。CRM環(huán)境下連連接分散散單位的的數(shù)據(jù)中中心建成成關(guān)鍵在在于Web數(shù)據(jù)倉(cāng)庫(kù)庫(kù)構(gòu)造之之初就為為其所有有部分確確立一致致的數(shù)據(jù)據(jù)元,并并通過(guò)一一致的數(shù)數(shù)據(jù)元實(shí)實(shí)現(xiàn)數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的總線體體系結(jié)構(gòu)構(gòu)。第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)數(shù)據(jù)挖掘

29、掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能圖7-6客戶數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的體系結(jié)結(jié)構(gòu)數(shù)據(jù)挖掘?qū)Ψ治龅慕Y(jié)果進(jìn)行評(píng)估客戶信息客戶活動(dòng)清洗、轉(zhuǎn)換外部數(shù)據(jù)聯(lián)機(jī)分析處理數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)準(zhǔn)備客戶數(shù)據(jù)集市CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的系統(tǒng)統(tǒng)結(jié)構(gòu)第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的系統(tǒng)統(tǒng)結(jié)構(gòu)數(shù)據(jù)通過(guò)過(guò)抽取、轉(zhuǎn)轉(zhuǎn)換和裝裝載,形成數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù),并通通過(guò)OLAP和報(bào)表

30、,將客戶戶的整體體行為分分析和企企業(yè)運(yùn)營(yíng)營(yíng)分析等等傳遞給給數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)用戶戶。在數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中,利用數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的ETL(extraction-transformation-loading)工具,針針對(duì)行為為分組和和尋找重重點(diǎn)客戶戶的需要要,產(chǎn)生生相應(yīng)的的數(shù)據(jù)集市市(DM),將分析析結(jié)果與與性能評(píng)評(píng)價(jià)等傳傳遞給CRM用戶。對(duì)對(duì)于客戶戶量巨大大、市場(chǎng)場(chǎng)策略對(duì)對(duì)企業(yè)影影響較大大的企業(yè)業(yè),CRM要以數(shù)據(jù)據(jù)倉(cāng)庫(kù)為為核心。數(shù)據(jù)來(lái)源客戶信息息客戶行為為生產(chǎn)系統(tǒng)統(tǒng)其他相關(guān)關(guān)數(shù)據(jù)第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶

31、智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能分析建立企業(yè)模型 概念模型設(shè)計(jì) 邏輯模型設(shè)計(jì) 物理模型設(shè)計(jì) 數(shù)據(jù)倉(cāng)庫(kù)生成確定系統(tǒng)邊界及主題域技術(shù)準(zhǔn)備工作確定數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu) 確定數(shù)據(jù)存放位置 確定存儲(chǔ)分配 CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的設(shè)計(jì)計(jì)與實(shí)施施第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能客戶數(shù)據(jù)倉(cāng)庫(kù)的建立注意問(wèn)題數(shù)據(jù)信息息收集和和集成確保數(shù)據(jù)據(jù)的質(zhì)量量按規(guī)則更更新客戶戶數(shù)據(jù),保持對(duì)已已有客戶戶的統(tǒng)一一看法數(shù)據(jù)倉(cāng)庫(kù)庫(kù)統(tǒng)一共共享,以以發(fā)揮最最大作用用為進(jìn)一步步了解客

32、客戶身份份及其需需求,并并做出預(yù)預(yù)測(cè),企企業(yè)需要要花費(fèi)一一些精力力進(jìn)行分分析,因因此產(chǎn)生生了數(shù)據(jù)據(jù)信息搜搜集。成成功地使使用數(shù)據(jù)據(jù)信息搜搜集是CRM建設(shè)的重重要步驟驟。CRM的客戶數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)需要把把企業(yè)內(nèi)內(nèi)外的客客戶數(shù)據(jù)據(jù)集成起起來(lái)。就就客戶數(shù)數(shù)據(jù)集成成來(lái)講,企業(yè)需需要對(duì)客客戶進(jìn)行行匹配和和合并。首先,在在建立CRM數(shù)據(jù)庫(kù)時(shí)時(shí),一定定要確認(rèn)認(rèn)由應(yīng)用用程序所所生成的的客戶編編碼的唯唯一性;其次,建立完完整、準(zhǔn)準(zhǔn)確的客客戶數(shù)據(jù)據(jù)倉(cāng)庫(kù),姓名和和地址這這兩個(gè)信信息片段段是很重重要的,一定要要進(jìn)行分分解和規(guī)規(guī)范化;最后,對(duì)企業(yè)業(yè)想收集集又沒(méi)有有一定結(jié)結(jié)構(gòu)且信信息量比比較大的的數(shù)據(jù)一一定要非非常慎重重,

33、比如如文本信信息。首先識(shí)別別新數(shù)據(jù)據(jù)性質(zhì),新客戶戶的數(shù)據(jù)據(jù)給一個(gè)個(gè)獨(dú)立的的標(biāo)識(shí),在數(shù)據(jù)據(jù)倉(cāng)庫(kù)中中插入一一條新的的記錄;如果是是已有客客戶的數(shù)數(shù)據(jù),更更新客戶戶記錄的的相關(guān)信信息片段段。數(shù)據(jù)據(jù)更新要要求同步步化是CRM數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的特點(diǎn)點(diǎn)之一。統(tǒng)一共享享的客戶戶數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)把銷銷售、市市場(chǎng)營(yíng)銷銷和客戶戶服務(wù)的的所有信信息連接接起來(lái)。如果一一個(gè)企業(yè)業(yè)的信息息來(lái)源互互相獨(dú)立立,那么么這些信信息會(huì)不不可避免免地出現(xiàn)現(xiàn)重復(fù)、互相沖沖突等現(xiàn)現(xiàn)象,這這對(duì)企業(yè)業(yè)的整體體運(yùn)作效效率將產(chǎn)產(chǎn)生消極極的影響響。第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的設(shè)計(jì)計(jì)與實(shí)施施數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘

34、掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能CRM中數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用客戶行為為分析重點(diǎn)客戶戶發(fā)現(xiàn)市場(chǎng)性能能評(píng)估客戶行為為分析包包括整體行為為分析和群體行為為分析兩個(gè)方面面。整體行行為分析析用來(lái)發(fā)發(fā)現(xiàn)企業(yè)業(yè)所有客客戶的行行為規(guī)律律,行為為分組時(shí)時(shí)按照客客戶的不不同種類類的行為為,將客客戶劃分分成不同同的群體體。在行為分分組完成成后,要要進(jìn)行客客戶理解解、客戶戶行為規(guī)規(guī)律發(fā)現(xiàn)現(xiàn)和客戶戶組間交交叉分析析等。重點(diǎn)客戶戶發(fā)現(xiàn)主主要是發(fā)發(fā)現(xiàn)能為為企業(yè)帶帶來(lái)潛在在效益的的重要客客戶。根根據(jù)客戶戶的屬性性特點(diǎn)就就可以挖挖掘出重重點(diǎn)客戶戶,然后后做

35、好保保持和提提高這些些重點(diǎn)客客戶的忠忠誠(chéng)度工工作。此此外,通通過(guò)數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的數(shù)據(jù)清清洗與集集中過(guò)程程,可以以將客戶戶對(duì)市場(chǎng)場(chǎng)的反饋饋?zhàn)詣?dòng)輸輸入數(shù)據(jù)據(jù)倉(cāng)庫(kù)中中,這個(gè)個(gè)獲得客客戶反饋饋的過(guò)程程,稱為為客戶行為為追蹤。根據(jù)客戶戶行為分分析,企企業(yè)可以以準(zhǔn)確地地制定市市場(chǎng)策略略和市場(chǎng)場(chǎng)活動(dòng)。然而,這這些市場(chǎng)場(chǎng)活動(dòng)是是否能夠夠達(dá)到預(yù)預(yù)定的目目標(biāo),是是改進(jìn)市市場(chǎng)策略略和評(píng)價(jià)價(jià)客戶行行為分組組性能的的重要指指標(biāo)。因因此,在在CRM中必須須對(duì)行為為分析和和市場(chǎng)策策略進(jìn)行行評(píng)估。第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的應(yīng)用用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施

36、數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用OLAP是共享多多維信息息的、針針對(duì)特定定問(wèn)題的的聯(lián)機(jī)數(shù)數(shù)據(jù)快速訪問(wèn)和分分析的軟軟件技術(shù)術(shù)。它通通過(guò)對(duì)信信息的多多種可能能的觀察察形式進(jìn)進(jìn)行快速速、穩(wěn)定定一致和和交互性性的存取取,允許許管理決決策人員員對(duì)數(shù)據(jù)據(jù)進(jìn)行深深入觀察察。相關(guān)概念變量 維 維的層次次性維成員多維數(shù)組組數(shù)據(jù)單元元聯(lián)機(jī)分析析處理的的概念數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能變量:分析數(shù)據(jù)據(jù)時(shí)要考

37、考慮的屬屬性,即即描述數(shù)數(shù)據(jù)“是是什么”。維:是人們觀觀察數(shù)據(jù)據(jù)的特定定角度,是考慮慮問(wèn)題時(shí)時(shí)的一類類屬性,屬性集集合構(gòu)成一個(gè)維維。維的層次次性:人們觀察察數(shù)據(jù)的的某個(gè)特特定角度度(即某某個(gè)維)還可以以存在細(xì)細(xì)節(jié)程度不同同的各個(gè)個(gè)描述方方面,我我們稱這這多個(gè)描描述方面面為維的的層次。一個(gè)維維往往具有多多個(gè)層次次。維成員:維的一個(gè)個(gè)取值,若維分分為幾個(gè)個(gè)層次,那么維維成員就就是不同同維層次取值的的組合。多維數(shù)組組:多維數(shù)組組是維和和變量的的組合表表示。一一個(gè)多維維數(shù)組可可以表示示為:(維1,維2,維維n,變變量)。數(shù)據(jù)單元元:數(shù)據(jù)單元元是多維維數(shù)組的的取值。當(dāng)多維維數(shù)組的的各個(gè)維維都選中中一個(gè)維

38、成員員,這些些維成員員的組合合就唯一一確定了了一個(gè)變變量的值值。那么么數(shù)據(jù)單單元就可以表表示為:(維1維成員員,維2維成員員,維n維維成員,變量的的值)。聯(lián)機(jī)分析析處理的的概念第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能多維數(shù)據(jù)據(jù)模型上上的OLAP操作對(duì)多維數(shù)數(shù)據(jù)集(維1、維2、維3維n、變量值值)在維維度i上選定一一個(gè)維成成員,得得到一個(gè)個(gè)n1維多維數(shù)數(shù)據(jù)集,稱得到到的這個(gè)個(gè)n1維多維數(shù)數(shù)據(jù)集為為原數(shù)據(jù)據(jù)集在第第i維上的數(shù)數(shù)據(jù)切片片。OLAP的分析

39、方法數(shù)據(jù)切片數(shù)據(jù)切塊數(shù)據(jù)鉆 取 數(shù)據(jù)聚 集 數(shù)據(jù)旋 轉(zhuǎn) 在多維數(shù)數(shù)據(jù)立方方體中,確定某某些維度度的取值值范圍,得到一一個(gè)原立立方體的的子立方方體的過(guò)過(guò)程被稱稱為數(shù)據(jù)據(jù)切塊。數(shù)據(jù)切切塊與數(shù)數(shù)據(jù)切片片得到的的多維數(shù)數(shù)組都是是原多維維立方體體的子集集,不同同的是數(shù)數(shù)據(jù)切片片使多維維立方體體降低了了一個(gè)維維度,而而數(shù)據(jù)切切塊得到到的多維維立方體體與原立立方體的的維度是是相同的的。數(shù)據(jù)鉆取取(數(shù)據(jù)下鉆鉆),是由概概括的數(shù)數(shù)據(jù)到詳詳細(xì)的數(shù)數(shù)據(jù)的過(guò)過(guò)程。數(shù)數(shù)據(jù)鉆取取對(duì)應(yīng)于于維的層層次,它它是由維維的高層層次展開(kāi)開(kāi)到低層層次的一一個(gè)動(dòng)作作。比如如,我們們由“年”數(shù)據(jù)下鉆鉆到“季度”數(shù)據(jù),這這無(wú)疑會(huì)會(huì)增加數(shù)數(shù)據(jù)

40、細(xì)節(jié)節(jié)和數(shù)據(jù)據(jù)量,得得到更詳詳細(xì)的數(shù)數(shù)據(jù)。數(shù)數(shù)據(jù)鉆取取的具體體操作參參見(jiàn)圖圖72中的數(shù)據(jù)據(jù)鉆取部部分。數(shù)據(jù)聚集集又叫數(shù)數(shù)據(jù)上卷卷,是數(shù)數(shù)據(jù)鉆取取的逆過(guò)過(guò)程。數(shù)數(shù)據(jù)聚集集是將詳詳細(xì)的數(shù)數(shù)據(jù)聚集集為較概概括的數(shù)數(shù)據(jù),是是一個(gè)綜綜合數(shù)據(jù)據(jù)的動(dòng)作作。數(shù)據(jù)旋轉(zhuǎn)轉(zhuǎn)即變換換維度的的位置,也就是是轉(zhuǎn)動(dòng)數(shù)數(shù)據(jù)的視視角,給給用戶提提供一個(gè)個(gè)從不同同的角度度觀察數(shù)數(shù)據(jù)的方方法。第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能原數(shù)據(jù)立立方體包包含了時(shí)時(shí)間(年年)、城城市、產(chǎn)產(chǎn)品

41、三個(gè)個(gè)維度,其中a1,a2為產(chǎn)品名名。鉆取取過(guò)程是是按時(shí)間間下鉆,由年數(shù)數(shù)據(jù)得到到季度數(shù)數(shù)據(jù),數(shù)數(shù)據(jù)由原原來(lái)的兩兩行展為為八行。聚集過(guò)過(guò)程是按按地區(qū)維維度上卷卷,將城城市維上上卷為國(guó)國(guó)家維,即將北北京、上上海兩城城市數(shù)據(jù)據(jù)統(tǒng)計(jì)為為中國(guó)的的數(shù)據(jù),將東京京、大阪阪兩城市市的數(shù)據(jù)據(jù)統(tǒng)計(jì)為為日本的的數(shù)據(jù)。數(shù)據(jù)聚聚集和數(shù)數(shù)據(jù)鉆取取為用戶戶提供了了不同層層次觀察察數(shù)據(jù)的的方法。2007 3季2007 1季2006 1季2006 3季2007 4季2007 2季2006 4季2006 2季a1a2 北京 上海 東京 大阪鉆取聚集a2a120062007中國(guó) 日本20062007北京 上海 東京 大阪a1a2

42、圖7-7 數(shù)據(jù)鉆取與聚集 聚集鉆取第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能20062007A1200230A2456478A3100120A1A2A320062004561002007230478120圖7-8數(shù)據(jù)旋轉(zhuǎn)轉(zhuǎn)圖7-8是數(shù)數(shù)據(jù)旋轉(zhuǎn)轉(zhuǎn)的一個(gè)個(gè)簡(jiǎn)單示示例,只只體現(xiàn)了了二維表表的旋轉(zhuǎn)轉(zhuǎn)。當(dāng)數(shù)數(shù)據(jù)是三三維或是是三維以以上的多多維數(shù)據(jù)據(jù)時(shí),數(shù)數(shù)據(jù)旋轉(zhuǎn)轉(zhuǎn)將更有有意義,每進(jìn)行行一次數(shù)數(shù)據(jù)旋轉(zhuǎn)轉(zhuǎn)就可以以從一個(gè)個(gè)新的視視角觀察察數(shù)據(jù)。第四節(jié)OLAP技術(shù)及

43、其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能OLAP的特點(diǎn)聯(lián)機(jī)分析析處理的的用戶是是企業(yè)中中的專業(yè)業(yè)分析人人員及管管理決策策人員,在分析析業(yè)務(wù)經(jīng)經(jīng)營(yíng)的數(shù)數(shù)據(jù)時(shí),從不同同的角度度來(lái)審視視業(yè)務(wù)的的衡量指指標(biāo)是一一種很自自然的思思考模式式。比如如,分析析銷售數(shù)數(shù)據(jù)時(shí),綜合時(shí)時(shí)間周期期、產(chǎn)品品類別、分銷渠渠道、地地理分布布、客戶戶群類生生成一張張張報(bào)表表,各個(gè)個(gè)分析角角度的不不同組合合又可以以生成不不同的報(bào)報(bào)表,使使得IT人員的工工作量相相當(dāng)大。聯(lián)機(jī)分析析處理的的主要特特點(diǎn)是直

44、直接仿照照用戶的的多角度度思考模模式,預(yù)預(yù)先為用用戶組建建多維的的數(shù)據(jù)模模型。一一旦多維維數(shù)據(jù)模模型建立立完成,用戶可可以快速速地從各各個(gè)分析析角度獲獲取數(shù)據(jù)據(jù),也能能動(dòng)態(tài)地地在各個(gè)個(gè)角度之之間切換換或者進(jìn)進(jìn)行多角角度綜合合分析,具有極極大的分分析靈活活性。這這也是聯(lián)聯(lián)機(jī)分析析處理近近年來(lái)被被廣泛關(guān)關(guān)注的根根本原因因,它從從設(shè)計(jì)理理念和真真正實(shí)現(xiàn)現(xiàn)上都與與舊的管管理信息息系統(tǒng)有有著本質(zhì)質(zhì)的區(qū)別別。第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能OLAP的

45、應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)庫(kù)系統(tǒng)核核心是聯(lián)機(jī)分析處理理,從應(yīng)用的的角度來(lái)來(lái)說(shuō),數(shù)據(jù)倉(cāng)庫(kù)還可可以采用用傳統(tǒng)的的報(bào)表或或數(shù)理統(tǒng)統(tǒng)計(jì)和數(shù)數(shù)據(jù)挖掘掘等人工工智能方方法,涵蓋的范范圍更廣廣;從應(yīng)用的的范圍來(lái)來(lái)說(shuō),聯(lián)機(jī)分析析處理往往往根據(jù)據(jù)用戶分分析的主主題進(jìn)行應(yīng)用分分類,如銷售分分析、市市場(chǎng)推廣廣分析、客戶利利潤(rùn)率分分析等,每一個(gè)分析析的主題題形成一一個(gè)OLAP應(yīng)用,而而所有的的OLAP應(yīng)用實(shí)際際上只是是數(shù)據(jù)倉(cāng)庫(kù)庫(kù)系統(tǒng)的的一部分分。以某家電電企業(yè)為為例介紹紹OLAP的應(yīng)用。家電的的多維分分析涉及及產(chǎn)品、銷銷售數(shù)量量、地區(qū)區(qū)和時(shí)間間4個(gè)維。所所有抽查查的數(shù)據(jù)據(jù)都是第第1季度的。第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的

46、應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能冰箱銷售第1季度,冰冰箱在什什么地區(qū)區(qū)銷售情情況最好好?第1季度,哪哪個(gè)省份份的冰箱箱銷量處處于領(lǐng)先先地位?第1季度,哪哪個(gè)城市市的冰箱箱銷售數(shù)數(shù)量最高高?負(fù)責(zé)冰箱箱銷售的的副總裁裁提出了了以下3個(gè)問(wèn)題:解決方法法需要用用到OLAP的兩種多多維分析析方法,即數(shù)據(jù)切切片/切塊和數(shù)數(shù)據(jù)鉆取取,其他的分分析方法法還有數(shù)數(shù)據(jù)旋轉(zhuǎn)轉(zhuǎn)和數(shù)據(jù)據(jù)聚集等等。第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)

47、據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能產(chǎn)品地點(diǎn)時(shí)間電視冰箱空調(diào)華東東北西北2006.42007.12007.22007.3冰箱圖7-9運(yùn)用數(shù)據(jù)據(jù)切片來(lái)來(lái)進(jìn)行數(shù)數(shù)據(jù)分析析首先使用用數(shù)據(jù)切切片方法法來(lái)對(duì)第第一個(gè)問(wèn)問(wèn)題進(jìn)行行分析。在圖7-9的數(shù)據(jù)立方方體中,時(shí)間、地區(qū)和和產(chǎn)品分分別是3個(gè)維度,銷售額額是度量變量量。在產(chǎn)產(chǎn)品維上上選定“冰箱”則形成在在產(chǎn)品維維上的數(shù)數(shù)據(jù)切片,顯示示了冰箱箱在各地地區(qū)和各各月份的的銷售情情況。第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)

48、庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)鉆取取和聚集集會(huì)改變變維的層層次,變變換分析析的粒度度,在家家電企業(yè)業(yè)的例子中中,必須須采用聯(lián)聯(lián)機(jī)分析析處理工工具深入入的地區(qū)區(qū)維中,通過(guò)數(shù)數(shù)據(jù)鉆取來(lái)查看看某地區(qū)區(qū)維中更更細(xì)致的的數(shù)據(jù)。 (如如圖7-10所所示)。表4按按地區(qū)劃劃分的銷銷售數(shù)據(jù)據(jù)通過(guò)模型型驅(qū)動(dòng)工工具來(lái)查查詢數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的數(shù)據(jù),如表7-4第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能冰箱44899西北79954華東36040東北25

49、309浙江29344江蘇17866吉林18174遼寧西北東北華東冰箱24632陜西20267甘肅25301山東圖7-10運(yùn)用數(shù)據(jù)據(jù)鉆取來(lái)來(lái)進(jìn)行數(shù)數(shù)據(jù)分析析圖7-10表表示的是是對(duì)地區(qū)區(qū)維數(shù)據(jù)據(jù)鉆取的的第一步步,即顯顯示了該該家電企企業(yè)按地地區(qū)劃分分的各省省份的冰冰箱銷售售量(如表7-5所示示);更深一一步的鉆鉆取可以以顯示出出各城市市的銷售售情況,得到表表7-6。第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能表5按按地地區(qū)和省省進(jìn)行劃劃分的銷銷售數(shù)據(jù)據(jù)

50、第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能表6按按地區(qū)區(qū)、省和和城市進(jìn)進(jìn)行劃分分的銷售售數(shù)據(jù)第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能通過(guò)OLAP得出了負(fù)負(fù)責(zé)冰箱箱銷售的的副總裁裁所提出出的3個(gè)問(wèn)題的的答案:2007年第1季度,冰冰箱在華華東地區(qū)區(qū)銷售情情況最好好。2007年第1季度,在在華東地地區(qū),江

51、江蘇的冰冰箱銷售售量處于于領(lǐng)先地地位。2007年第1季度,江江蘇的南南京冰箱箱銷售量量最高。OLAP的應(yīng)用第四節(jié)OLAP技術(shù)及其其在CRM系統(tǒng)統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能第五節(jié)數(shù)數(shù)據(jù)據(jù)挖掘概概述數(shù)據(jù)挖掘掘(data mining)是從大量量的、不不完全的的、有噪噪聲的、模糊的的、隨機(jī)機(jī)的實(shí)際際應(yīng)用數(shù)數(shù)據(jù)中提提取人們們感興趣趣的知識(shí)識(shí),這些些知識(shí)是是隱含的的、事先先未知的的、潛在在有用的的信息。它是通通過(guò)分析析數(shù)據(jù)發(fā)發(fā)現(xiàn)數(shù)據(jù)據(jù)內(nèi)部的的信息和和知識(shí)過(guò)過(guò)程。數(shù)據(jù)挖掘掘的基礎(chǔ)礎(chǔ)

52、是大量量數(shù)據(jù),所以具具有高效效處理大大量數(shù)據(jù)據(jù)的能力力。這也也是目前前數(shù)據(jù)挖挖掘技術(shù)術(shù)的一個(gè)個(gè)難題,一些算算法在小小數(shù)據(jù)集集上效果果很好,但數(shù)據(jù)據(jù)量增加加到一定定程度,算法的的實(shí)現(xiàn)代代價(jià)過(guò)大大、效率率太低,甚至無(wú)無(wú)法實(shí)現(xiàn)現(xiàn)。數(shù)據(jù)挖掘掘的定義義數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)來(lái)源源事務(wù)數(shù)據(jù)據(jù)庫(kù)高級(jí)數(shù)據(jù)據(jù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)關(guān)系數(shù)據(jù)據(jù)庫(kù)數(shù)據(jù)挖掘掘的數(shù)據(jù)據(jù)來(lái)源關(guān)系數(shù)據(jù)據(jù)庫(kù):關(guān)系數(shù)據(jù)據(jù)庫(kù)中的的數(shù)據(jù)是是最豐富富、最詳詳細(xì)的。在進(jìn)行行數(shù)據(jù)挖挖掘之前前也要對(duì)對(duì)數(shù)據(jù)進(jìn)行行清洗和和轉(zhuǎn)換。數(shù)據(jù)的的真實(shí)性性和一

53、致致性是進(jìn)進(jìn)行數(shù)據(jù)據(jù)挖掘的的前提和和保證。數(shù)據(jù)倉(cāng)庫(kù)庫(kù):數(shù)據(jù)經(jīng)過(guò)過(guò)清洗和和轉(zhuǎn)換,不存在在錯(cuò)誤和和不一致致的情況況,數(shù)據(jù)據(jù)倉(cāng)庫(kù)在在獲取數(shù)數(shù)據(jù)后就不需要要再進(jìn)行行這些數(shù)數(shù)據(jù)處理理工作了了。數(shù)據(jù)倉(cāng)庫(kù)庫(kù)、數(shù)據(jù)據(jù)挖掘和和聯(lián)機(jī)分分析處理理共同構(gòu)構(gòu)成了系系統(tǒng)的決決策支持持模塊。事務(wù)數(shù)據(jù)據(jù)庫(kù):數(shù)據(jù)挖掘掘可從事事務(wù)數(shù)據(jù)據(jù)庫(kù)中提提取數(shù)據(jù)據(jù)。其每每個(gè)記錄錄代表一一個(gè)事務(wù)務(wù)。在進(jìn)行數(shù)數(shù)據(jù)挖掘掘時(shí),可可以只將將一個(gè)或或幾個(gè)事事務(wù)數(shù)據(jù)據(jù)庫(kù)集中中到數(shù)據(jù)據(jù)挖掘庫(kù)庫(kù)中進(jìn)行行挖掘。高級(jí)數(shù)據(jù)據(jù)庫(kù):面向?qū)ο笙蟮臄?shù)據(jù)據(jù)庫(kù)、空空間數(shù)據(jù)據(jù)庫(kù)、時(shí)時(shí)間和時(shí)時(shí)間序列列數(shù)據(jù)庫(kù)庫(kù)、文本本和多媒媒體數(shù)據(jù)庫(kù)庫(kù)等新的的數(shù)據(jù)庫(kù)庫(kù)。這些些結(jié)構(gòu)更更為復(fù)雜雜的數(shù)據(jù)

54、據(jù)庫(kù)為數(shù)數(shù)據(jù)挖掘掘提供了了更加全全面、更更加多元化化的數(shù)據(jù)據(jù),也為為數(shù)據(jù)挖挖掘技術(shù)術(shù)提出了了更大的的挑戰(zhàn)。第五節(jié)數(shù)數(shù)據(jù)據(jù)挖掘概概述數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)挖掘掘的基本本步驟數(shù)據(jù)挖掘掘包括確確定分析析和預(yù)測(cè)測(cè)目標(biāo)、建立數(shù)數(shù)據(jù)挖掘掘庫(kù)、分分析數(shù)據(jù)據(jù)、建立立模型、模型評(píng)估與與驗(yàn)證、模型實(shí)實(shí)施等幾幾個(gè)基本本步驟。第五節(jié)數(shù)數(shù)據(jù)據(jù)挖掘概概述圖7-11數(shù)數(shù)據(jù)挖掘掘的基本本步驟數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)

55、成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)挖掘掘的基本本步驟第五節(jié)數(shù)數(shù)據(jù)據(jù)挖掘概概述數(shù)據(jù)挖掘的基本步驟1)確確定分析析和預(yù)測(cè)測(cè)目標(biāo)確定分析析和預(yù)測(cè)測(cè)目標(biāo)相相當(dāng)于需需求分析析,主要要是明確確業(yè)務(wù)目目標(biāo)。確確定分析析和預(yù)測(cè)測(cè)目標(biāo)是是數(shù)據(jù)挖挖掘的基基礎(chǔ)條件件。同時(shí)時(shí),定義義了數(shù)據(jù)據(jù)挖掘的的分析目目標(biāo)也就就定義了了評(píng)價(jià)這這一挖掘掘模型的的標(biāo)準(zhǔn)。2)建建立數(shù)據(jù)據(jù)挖掘庫(kù)庫(kù)首先要進(jìn)進(jìn)行數(shù)據(jù)收集集,對(duì)于收收集到的的數(shù)據(jù),應(yīng)對(duì)數(shù)數(shù)據(jù)的來(lái)來(lái)源、大大小、存存儲(chǔ)位置置和數(shù)據(jù)據(jù)在使用用上的限限制等進(jìn)進(jìn)行詳細(xì)細(xì)的記錄。完成數(shù)數(shù)據(jù)收集集后,要要對(duì)數(shù)據(jù)據(jù)進(jìn)行描描述。數(shù)據(jù)挖掘掘庫(kù)可以是一一個(gè)單獨(dú)獨(dú)的數(shù)據(jù)據(jù)庫(kù),也也可以和和數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)建立立

56、在相同同的物理理介質(zhì)上上。數(shù)據(jù)據(jù)挖掘庫(kù)庫(kù)中還應(yīng)應(yīng)包括數(shù)數(shù)據(jù)的元元數(shù)據(jù)。3)分分析數(shù)據(jù)據(jù)分析數(shù)據(jù)據(jù)即對(duì)數(shù)數(shù)據(jù)挖掘掘庫(kù)中的的數(shù)據(jù)進(jìn)進(jìn)行分析析,對(duì)數(shù)數(shù)據(jù)有了了全面、細(xì)致的的了解以以后,就就可以針針對(duì)數(shù)據(jù)據(jù)挖掘分分析目標(biāo)標(biāo)選擇合合適的變變量和記記錄。對(duì)對(duì)于變量量的選擇擇,首先先要考慮慮對(duì)結(jié)果果有影響響、可以以反映結(jié)結(jié)果的變變量。4)建建立模型型建立模型型是選擇擇合適的的方法和和算法對(duì)對(duì)數(shù)據(jù)進(jìn)進(jìn)行分析析,得到到一個(gè)數(shù)數(shù)據(jù)挖掘掘模型的的過(guò)程。建立模模型是一一個(gè)反復(fù)復(fù)進(jìn)行的的過(guò)程,它需要要不斷地地改進(jìn)或或更換算算法以尋尋找對(duì)目目標(biāo)分析析作用最最明顯的的模型,最后得得到一個(gè)個(gè)最合理理、最適適用的模模型。5)模

57、模型評(píng)估估與驗(yàn)證證為了驗(yàn)證證模型的的有效性性,一般般會(huì)將數(shù)數(shù)據(jù)集分分為兩部部分:一一部分用用于建立立模型,另一部部分則用用于測(cè)試試模型。對(duì)模型型的驗(yàn)證證主要需需要考慮慮以下幾幾個(gè)方面面:(1)模型的準(zhǔn)準(zhǔn)確性;(2)模型的可可理解性性;(3)模型的性性能。模型建建立和模模型檢驗(yàn)驗(yàn)是一個(gè)個(gè)反復(fù)的的過(guò)程。6)模型型實(shí)施模型的實(shí)實(shí)施有兩兩種情況況:一種種是將數(shù)數(shù)據(jù)挖掘掘模型得得到的結(jié)結(jié)果提供供給信息息需求者者或者管管理者,以輔助助管理者者的決策策分析;還有一種種情況就就是保留留模型,以后每每遇到類類似問(wèn)題題就用這這個(gè)模型型進(jìn)行分分析,或或者將模模型用于于不同的的數(shù)據(jù)集集上(這這些數(shù)據(jù)據(jù)分析需需要采用用

58、相同的的方法)進(jìn)行分分析。在模型的的使用過(guò)過(guò)程中,隨時(shí)間間及環(huán)境境的變化化,還應(yīng)應(yīng)對(duì)模型型進(jìn)行重重新測(cè)試試,并對(duì)對(duì)模型進(jìn)進(jìn)行相應(yīng)應(yīng)的修改改,這就就是模型維護(hù)護(hù)的過(guò)程程。數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)挖掘掘工具及及其選擇擇第五節(jié)數(shù)數(shù)據(jù)據(jù)挖掘概概述數(shù)據(jù)挖掘掘工具包包括數(shù)據(jù)挖掘掘(datamining)工具具和文本挖掘掘(textmining)工具具。數(shù)據(jù)挖挖掘工具具主要是是用來(lái)進(jìn)進(jìn)行聚類類分析、關(guān)聯(lián)分分析、時(shí)時(shí)間序列列分析以以及統(tǒng)計(jì)計(jì)分析的的。文本本挖掘工工具主要要應(yīng)用在在市場(chǎng)調(diào)調(diào)研

59、報(bào)告告中或呼呼叫中心心(callcenter)的客客戶抱怨怨定級(jí)、專利的的分類、網(wǎng)頁(yè)的的分類以以及電子子郵件的的分類等等方面。一般而而言,目目前市場(chǎng)場(chǎng)上這些些數(shù)據(jù)挖挖掘工具具又可以以分成兩兩類:企企業(yè)級(jí)工工具以及及小型工工具。數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能數(shù)據(jù)挖掘掘工具及及其選擇擇第五節(jié)數(shù)數(shù)據(jù)據(jù)挖掘概概述數(shù)據(jù)挖掘工具的選擇公司的的數(shù)據(jù)挖挖掘需求求是短期期行為還還是長(zhǎng)期期使用公司的的數(shù)據(jù)挖挖掘經(jīng)驗(yàn)驗(yàn)和水平平公司的的數(shù)據(jù)狀狀態(tài)公司的的預(yù)算工具的的性能數(shù)據(jù)挖掘掘OLAP的應(yīng)用數(shù)據(jù)挖掘掘應(yīng)用

60、基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能CRM中常用的的數(shù)據(jù)挖挖掘算法法1)關(guān)聯(lián)分分析(associationanalysis)設(shè)I=i1, i2,im是項(xiàng)的集集合。設(shè)任務(wù)相相關(guān)的數(shù)數(shù)據(jù)D是數(shù)據(jù)庫(kù)庫(kù)事務(wù)的的集合,其中每每個(gè)事務(wù)務(wù)T是項(xiàng)的集集合,使使得TI。每一個(gè)個(gè)事務(wù)有有一個(gè)標(biāo)標(biāo)識(shí)符,稱作TID。設(shè)A是一個(gè)項(xiàng)項(xiàng)集,事事務(wù)T包含A當(dāng)且僅當(dāng)當(dāng)AT。項(xiàng)的集合合稱為項(xiàng)項(xiàng)集(Itemset)。包含k個(gè)項(xiàng)的集集合稱為為K-項(xiàng)集。項(xiàng)集的出出現(xiàn)頻率率是包含含項(xiàng)集的的事務(wù)數(shù)數(shù),簡(jiǎn)稱稱為項(xiàng)集集的頻率率、支持持計(jì)數(shù)或或計(jì)數(shù)。關(guān)聯(lián)規(guī)則則是形如AB的蘊(yùn)含式

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論