版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第三章 數(shù)據(jù)挖掘與CRM,數(shù)據(jù)挖掘的基本知識(shí) CRM中的數(shù)據(jù)挖掘應(yīng)用,4.1 數(shù)據(jù)挖掘的基本知識(shí),數(shù)據(jù)挖掘的產(chǎn)生背景,數(shù)據(jù)爆炸但知識(shí)匱乏,數(shù)據(jù):一般的業(yè)務(wù)操作,通常都會(huì)產(chǎn)生大量的數(shù)據(jù),如訂單、庫存、交易帳目、通話記錄、及客戶資料等。,信息:如何利用企業(yè)的歷史數(shù)據(jù)增進(jìn)對(duì)業(yè)務(wù)情況的了解,幫助我們?cè)跇I(yè)務(wù)管理及發(fā)展上作出及時(shí)、正確的判斷,需要從數(shù)據(jù)成為信息,美國三大電視網(wǎng)電視劇廣告間隙,美國自來水公司的用水高峰,如何拋棄不必要的數(shù)據(jù),從大量數(shù)據(jù)中及時(shí)提取有用的知識(shí)?,數(shù)據(jù)挖掘,從大量的數(shù)據(jù)中挖掘出有用的知識(shí),1.Walmart,and,2.NASDAQ,3.NBA,Advanced Scout,數(shù)據(jù)挖
2、掘的定義,數(shù)據(jù)挖掘 Data Mining 技術(shù)角度的定義 數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識(shí)的過程。 商業(yè)角度的定義 數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點(diǎn)是對(duì)商業(yè)數(shù)據(jù)庫中的海量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。,知識(shí)發(fā)現(xiàn) (KDD) :數(shù)據(jù)挖掘過程,數(shù)據(jù)挖掘知識(shí)發(fā)現(xiàn)過程的核心,數(shù)據(jù)清理,數(shù)據(jù)集成,數(shù)據(jù)庫,數(shù)據(jù)倉庫,知識(shí),任務(wù)相關(guān)的數(shù)據(jù),選擇,數(shù)據(jù)挖掘,模式評(píng)估,數(shù)據(jù)挖掘: 多種技術(shù)的融合,數(shù)據(jù)挖掘 VS 傳統(tǒng)分析方法 有何區(qū)別?,數(shù)據(jù)挖掘是
3、在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí)。,數(shù)據(jù)挖掘過程,數(shù)據(jù)挖掘過程包括: 數(shù)據(jù)準(zhǔn)備(選擇、預(yù)處理、轉(zhuǎn)換) 確定主題 讀入數(shù)據(jù)、建立模型、理解模型 解釋與評(píng)價(jià) 知識(shí)應(yīng)用,分析問題,整合數(shù)據(jù),建立模型,理解規(guī)則,預(yù)測(cè)未來,數(shù)據(jù)挖掘技術(shù)分類,數(shù)據(jù)挖掘,描述,預(yù)測(cè),可視化,聚類,關(guān)聯(lián)規(guī)則,匯總描述,分類,統(tǒng)計(jì)回歸,時(shí)間序列,決策樹,神經(jīng)網(wǎng)絡(luò),數(shù)據(jù)挖掘的模型(1),分類( Classification )與決策樹(Decision trees) 分類分析是為了找出描述和區(qū)分?jǐn)?shù)據(jù)類或概念的模型,常常通過決策樹、神經(jīng)網(wǎng)絡(luò)等模型進(jìn)行表示。 決策樹: 根節(jié)點(diǎn)、節(jié)點(diǎn)、分支、葉子。,CHAID決策樹分析-市場(chǎng)
4、分析,在貸款申請(qǐng)中,要對(duì)申請(qǐng)人的風(fēng)險(xiǎn)大小做出判斷,多變量分析 根據(jù)細(xì)分變量區(qū)分群體的差異性程度(卡方統(tǒng)計(jì)值Chi-square)的大小,將樣本分為不同特征的細(xì)分群體。 過程 確定細(xì)分的目的與細(xì)分變量(人口統(tǒng)計(jì)變量、心理變量、行為變量) 變量類型:分類變量或有序變量 根據(jù)卡方值最顯著的變量將樣本分為不同細(xì)分群體 樣本量敏感(父節(jié)點(diǎn)樣本30,子節(jié)點(diǎn)5),數(shù)據(jù)挖掘的模型(2),聚類(Cluster) 聚類是把一組個(gè)體按照相似性歸成若干類別的過程。 原則:最大化類內(nèi)部的相似性、最小化類之間的相似性 聚類方法包括統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和面向數(shù)據(jù)庫的方法。,數(shù)據(jù)挖掘的模型(3),關(guān)聯(lián)(Ass
5、ociation) 在購買面包的顧客中,有90%的人同時(shí)也買了牛奶:(面包)(牛奶),計(jì)為XY。 評(píng)估關(guān)聯(lián)規(guī)則的四個(gè)重要指標(biāo)是: (1)支持度(support):交易集中包含X和Y的交易數(shù)與所有交易數(shù)之比,記為support(XY) (2)可信度(confidence):包含X和Y的交易數(shù)與包含X的交易數(shù)之比,記為confidence(XY) (3)期望可信度(expected confidence):描述了在沒有物品集X的作用下,物品集Y本身的支持度,記為E-confidence(Y) (4)作用度(lift):作用度是可信度對(duì)期望可信度的比值。描述了物品集X對(duì)物品集Y的影響力的大小。記為L
6、ift(XY)。一股情況要求大于1。,設(shè) supmin = 50%, confmin = 50% 符合條件的關(guān)聯(lián)規(guī)則有哪些?,A D (60%, 100%),D A (60%, 75%),數(shù)據(jù)挖掘的模型(4),序列模式(Sequential Pattern) 分析數(shù)據(jù)之間的前后(因果)關(guān)系,類似于關(guān)聯(lián)分析 用于發(fā)現(xiàn)客戶潛在的購物模式 先購買PC,再購買數(shù)碼相機(jī),接著還要買存儲(chǔ)卡 5天之內(nèi),X股票最多上漲10,Y股票漲幅在1020之間,Z股票在下星期上漲的概率為68。 指標(biāo) 最小支持度 最小可信度,4.2 CRM中的數(shù)據(jù)挖掘應(yīng)用,在CRM中的應(yīng)用范圍,客戶盈利能力; 客戶保留; 客戶細(xì)分; 客戶
7、傾向; 渠道優(yōu)化; 風(fēng)險(xiǎn)管理; 欺詐監(jiān)測(cè); 購物傾向分析; 需求預(yù)測(cè); 價(jià)格優(yōu)化。,案例:基于DM的客戶營銷管理,流失預(yù)警模型,交叉銷售模型,客戶行為 細(xì)分模型,更多模型,營銷信息預(yù)警,營銷方案策劃,績效管理,主動(dòng)營銷,客戶,行為數(shù)據(jù),業(yè)務(wù)系統(tǒng),數(shù)據(jù)倉庫,數(shù)據(jù)挖掘,模型,行為數(shù)據(jù),行為數(shù)據(jù),客戶挽留,營銷信息層,分析企劃層,管理實(shí)施層,客戶行為細(xì)分,低 端,中 端,高 端,ARPU值相似的客戶需求特點(diǎn)卻差別很大,客戶細(xì) 分之謎,根據(jù)ARPU值進(jìn)行客戶細(xì)分的方法,基于數(shù)據(jù)挖掘技術(shù)的以需求為基準(zhǔn)的細(xì)分,客戶行為 價(jià)值細(xì)分模型,海量客戶 行為數(shù)據(jù)/ 特征數(shù)據(jù),組內(nèi)行為特點(diǎn)相似組間行為差異較大的客戶分
8、組,客戶行為細(xì)分(續(xù)),客戶行為細(xì)分模型,客戶流失傾向 預(yù)警模型,價(jià)格敏感度模型,客戶信用評(píng)分模型,交叉銷售模型,營銷效果預(yù)測(cè)模型,客戶價(jià)值 評(píng)估模型,客戶行為細(xì)分模型通過上百個(gè)變量描述客戶,性別,年齡,建檔時(shí)間,證件號(hào)碼,繳款方式,信息費(fèi),應(yīng)收金額,優(yōu)惠金額,滯納金應(yīng)收,SMS次數(shù),國際呼叫,呼入/呼出比例,短消息話單類型,信息長度,贈(zèng)送費(fèi)用,呼轉(zhuǎn)類型,漫游話費(fèi),通話時(shí)長,贈(zèng)送分鐘數(shù),費(fèi)用類型,動(dòng)態(tài)漫游號(hào),IMSI號(hào)碼,月均基本通話,月均國內(nèi)長途,工作日呼叫次數(shù),工作日呼叫時(shí)間,WAP呼叫時(shí)間,繁忙時(shí)段呼叫次數(shù),非繁忙時(shí)段呼叫次數(shù),SMS次數(shù),WAP次數(shù),IP呼叫次數(shù),語音呼叫次數(shù),非語音呼
9、叫次數(shù),月均國際長途,非IP呼叫時(shí)間,數(shù)據(jù)挖掘自動(dòng)生成影響客戶分組的主要因子,性別,年齡,繳款方式,SMS次數(shù),國際呼叫,其它,優(yōu)惠金額,短消息話單類型,贈(zèng)送費(fèi)用,費(fèi)用類型,漫游次數(shù),應(yīng)收金額,IDD次數(shù),月均國內(nèi)長途,月均基本通話,非語音呼叫次數(shù),SMS次數(shù),WAP次數(shù),月均國際長途,語音呼叫次數(shù),費(fèi)用類型,聚類分析根據(jù)自身所具有的特征自動(dòng)聚為一些行為特點(diǎn)相似的群體,1,2,8,4,5,3,7,6,因素二(國內(nèi)呼叫次數(shù)),因素三(IP呼叫次數(shù)),因素一(繁忙時(shí)段呼叫次數(shù)),16個(gè)組中呈現(xiàn)出差別明顯的優(yōu)勢(shì)、弱勢(shì)特征,各類客戶人數(shù)及收入貢獻(xiàn)一覽,人數(shù) 百分比,收入貢獻(xiàn) 百分比,59.61%,56
10、.41%,15.08%,28.51%,14.89%,25.91%,優(yōu)質(zhì),普通,弱勢(shì),示例:全球通(后付費(fèi))客戶的17個(gè)客戶分組,對(duì)細(xì)分客戶組進(jìn)行特征描述,業(yè)務(wù)推廣與客戶服務(wù)建議,本組市場(chǎng)建議 業(yè)務(wù)推廣建議 彩信業(yè)務(wù)統(tǒng)計(jì)分析發(fā)現(xiàn)本組客戶彩信使用人數(shù)比例明顯大于其他16個(gè)客戶分組 GPRS業(yè)務(wù)估計(jì)本組客戶中有相當(dāng)部分人群是商務(wù)人士 客戶服務(wù)建議 免費(fèi)贈(zèng)送香港天氣預(yù)報(bào) 與航空公司里程積點(diǎn)互換 空港VIP休息室,2、產(chǎn)品交叉銷售,交叉銷售研究要點(diǎn),交叉銷售通過研究客戶的產(chǎn)品使用情況、消費(fèi)行為特點(diǎn),發(fā)現(xiàn)老客戶的潛在需求 交叉銷售通過產(chǎn)品之間的關(guān)聯(lián),尋找實(shí)現(xiàn)產(chǎn)品捆綁銷售的機(jī)會(huì) 交叉銷售為新產(chǎn)品尋找已有用戶
11、中的目標(biāo)群體,相關(guān)性弱,根據(jù)產(chǎn)品業(yè)務(wù)關(guān)聯(lián)性評(píng)分表,形成某一產(chǎn)品與其他產(chǎn)品關(guān)聯(lián)關(guān)系圖,以形象說明本產(chǎn)品與其他產(chǎn)品之間的關(guān)聯(lián)關(guān)系(正相關(guān)或是負(fù)相關(guān))及其關(guān)聯(lián)性強(qiáng)弱。,正向關(guān)聯(lián),負(fù)向關(guān)聯(lián),客戶取消產(chǎn)品時(shí)作為替補(bǔ)品,考慮產(chǎn)品捆綁銷售,替代性弱,相關(guān)性強(qiáng),替代性強(qiáng),產(chǎn)品業(yè)務(wù)關(guān)聯(lián)關(guān)系圖說明,產(chǎn)品A與語音信箱、移動(dòng)夢(mèng)網(wǎng)、隨E行、數(shù)據(jù)通信、呼轉(zhuǎn)小叮鐺、彩信、百寶箱、20元/0元GPRS套餐都有正向關(guān)聯(lián)關(guān)系。,某一產(chǎn)品與其他產(chǎn)品/業(yè)務(wù)的關(guān)聯(lián)關(guān)系,(次),產(chǎn)品A分組普及率分析,7短信專家組、4短信潛力組用戶對(duì)產(chǎn)品A的興趣相當(dāng)較濃,可作為大規(guī)模推廣該產(chǎn)品的突破口。9夜間積極組、15差旅人士組、8組長途電話組根據(jù)用戶行為分析,也應(yīng)用有較大的交叉銷售機(jī)會(huì)。,產(chǎn)品A客戶分組交叉銷售機(jī)會(huì),問題描述:預(yù)測(cè)信用水平是好還是差,銀行據(jù)此決定是否向客戶發(fā)放貸款,發(fā)放多少 結(jié)果描述:(決策樹),收入大于5萬元/年,是,否,有無儲(chǔ)蓄帳戶,是否房主,是,是,否,否,批準(zhǔn),不批準(zhǔn),批準(zhǔn),客戶信用評(píng)價(jià),問題描述:根據(jù)客戶信息,預(yù)測(cè)客戶流失可能性 結(jié)果描述:(神經(jīng)網(wǎng)絡(luò)),輸 入,流失概率 (0.87)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 南京南京審計(jì)大學(xué)金審學(xué)院公開招聘人員筆試歷年參考題庫附帶答案詳解
- 北京北京市朝陽區(qū)衛(wèi)生健康委員會(huì)所屬事業(yè)單位2025年第二批招聘295人筆試歷年參考題庫附帶答案詳解
- 內(nèi)江2025年下半年內(nèi)江市事業(yè)單位招才引智考核招聘62人(成都場(chǎng))筆試歷年參考題庫附帶答案詳解
- 佛山廣東佛山大學(xué)招聘事業(yè)編制輔導(dǎo)員6人筆試歷年參考題庫附帶答案詳解
- 云南2025年下半年云南國際經(jīng)濟(jì)技術(shù)交流中心招聘2人筆試歷年參考題庫附帶答案詳解
- 2025年高職市場(chǎng)營銷(促銷策略設(shè)計(jì))試題及答案
- 2025年大學(xué)建筑錯(cuò)位設(shè)計(jì)期末模擬卷
- 2025年高職酒店管理與數(shù)字化運(yùn)營(客房服務(wù)管理)試題及答案
- 2025年高職冷鏈物流技術(shù)與管理(冷藏運(yùn)輸管理)試題及答案
- 2025年中職農(nóng)業(yè)(作物栽培技術(shù))試題及答案
- 智能安全帽解決方案-智能安全帽
- 中醫(yī)臨床路徑18脾胃科
- 2024年版煙霧病和煙霧綜合征診斷與治療專家共識(shí)(完整版)
- 零星維修合同模板
- 九三學(xué)社申請(qǐng)入社人員簡歷表
- 聚氨酯門窗研究匯報(bào)
- 醫(yī)院電子病歷四級(jí)建設(shè)需求
- 上海2023屆高三二模數(shù)學(xué)卷匯總(全)
- 《銳角三角函數(shù)》復(fù)習(xí)(公開課)課件
- 計(jì)算機(jī)視覺PPT完整全套教學(xué)課件
- YC/T 564-2018基于消費(fèi)體驗(yàn)的中式卷煙感官評(píng)價(jià)方法
評(píng)論
0/150
提交評(píng)論