數(shù)據(jù)挖掘方法簡介_第1頁
數(shù)據(jù)挖掘方法簡介_第2頁
數(shù)據(jù)挖掘方法簡介_第3頁
數(shù)據(jù)挖掘方法簡介_第4頁
數(shù)據(jù)挖掘方法簡介_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)挖掘方法簡介

聚類分析

目的:根據(jù)分析對象的相似性和差異性分群,從而了解不同群體行為特征和需求。思想:物以類聚,人以群分。案例:玩家區(qū)隔分析聚類分析所有個(gè)體聚類分析聚類分析群體一群體二群體三群體四聚類分析

案例簡介:資料:在線時(shí)長、上線次數(shù)、上線時(shí)長、充值次數(shù)、充值金額、技能數(shù)量、仇人數(shù)量、好友數(shù)量、完成任務(wù)次數(shù)、幻獸數(shù)量、配偶數(shù)量、加入家族數(shù)量、加入軍團(tuán)數(shù)量(玩家升至60級的累計(jì)數(shù)量)。分析方法:k-means、兩步聚類等聚類分析

結(jié)果:將到達(dá)60級的玩家分成五個(gè)群體:高價(jià)值貢獻(xiàn)者、不熱衷社交的游戲技巧專家、全方位平衡玩家、重視技巧的社交連接者和打發(fā)時(shí)間者。應(yīng)用:1)可根據(jù)不同群體的特征,改進(jìn)游戲的玩點(diǎn)。

2)可描述出不同群體的特征及需求,從而使個(gè)性化服務(wù)成為可能。判別分析

案例同“聚類分析”案例目的:對未參加分群的玩家進(jìn)行類別歸類,即,當(dāng)新的玩家達(dá)到60級時(shí),判斷他屬于哪種類型,從而投其所好,提出其所需的玩點(diǎn)和需求。思想:假定玩家群體穩(wěn)定,預(yù)測新玩家類別。判別分析建模數(shù)據(jù)(已知分類)利用工具建立模型得到判別方程式類別1類別4類別2類別3判別分析判別方程輸入輸出新樣本判別結(jié)果判別分析分析方法:判別分析(也可用多項(xiàng)Logistic回歸等模型)結(jié)果:當(dāng)一個(gè)玩家到達(dá)60級時(shí),把其屬性指標(biāo)代入判別方程或其它恰當(dāng)?shù)哪P?,判斷其屬于上?類中的哪一個(gè)類別。游戲中的可能應(yīng)用:當(dāng)有需求點(diǎn)對點(diǎn)接觸玩家時(shí),可用該方法判別玩家群體。也可對人為已分好的群體進(jìn)行判別分析。分類估計(jì)和預(yù)測

案例:有線電視服務(wù)銷售。目的:找出愿意預(yù)訂有線電視交互服務(wù)的用戶。思想:根據(jù)已有資料預(yù)測新用戶是否響應(yīng)某種服務(wù)或活動(dòng)。案例介紹:資料:用戶的年齡、性別、教育、收入、每天看電視的時(shí)間和子女?dāng)?shù)、是否有意預(yù)定有線電視交互服務(wù)。分類估計(jì)和預(yù)測分析方法:分類回歸樹、二項(xiàng)Logistic回歸、C5.0模型等根據(jù)已有客戶上述資料用分類回歸樹方法對有線電視交互服務(wù)響應(yīng)情況歸納規(guī)則,當(dāng)提供新用戶屬性資料時(shí),將該資料輸入模型,則預(yù)測出該新客戶是否響應(yīng)該服務(wù)。分類估計(jì)和預(yù)測模型訓(xùn)練集工具建模決策樹模型決策列表模型神經(jīng)網(wǎng)絡(luò)模型Logistic回歸模型

……

建立模型評價(jià)模型選出多個(gè)較優(yōu)的模型分類估計(jì)和預(yù)測選出的多個(gè)較優(yōu)模型進(jìn)出模型測試集測試模型精度判斷模型好壞選出最優(yōu)模型分類估計(jì)和預(yù)測估計(jì)或預(yù)測樣本最優(yōu)模型輸入輸出估計(jì)或預(yù)測結(jié)果分類估計(jì)和預(yù)測結(jié)果:預(yù)測用戶是否愿意預(yù)訂有線電視交互服務(wù)及預(yù)訂該服務(wù)的概率。應(yīng)用:針對愿意預(yù)訂該服務(wù)的客戶或者針對預(yù)訂該服務(wù)的高概率用戶進(jìn)行營銷,做到有針對性的營銷。在游戲中的可能應(yīng)用:玩家流失預(yù)測。市場購物籃分析(規(guī)則歸納)

案例:超市購物籃分析目的:找出消費(fèi)者所購買商品之間的聯(lián)系并歸納其規(guī)則,并描述購買產(chǎn)品組的購買者特征。思想:根據(jù)歷史購買數(shù)據(jù)歸納購買者的購買習(xí)慣和行為。市場購物籃分析(規(guī)則歸納)案例介紹:資料:顧客的性別、年齡、收入等屬性特征,購買價(jià)格、支付方法及所購買產(chǎn)品類別的相關(guān)信息。分析方法:GRI-歸納所購物品之間的關(guān)聯(lián);決定樹C5.0-分析購買物品的玩家特征。市場購物籃分析(規(guī)則歸納)結(jié)果:

1)購買魚的顧客還同時(shí)購買果蔬;

2)購買酒的顧客還同時(shí)購買糖果;3)購買啤酒、凍肉的顧客同時(shí)購買罐裝蔬菜。應(yīng)用:

1)可以根據(jù)關(guān)聯(lián)規(guī)則,將顧客習(xí)慣性一起購買的物品放在一起銷售或打包銷售;

2)自定義某類產(chǎn)品與其人口特征的需求匹配。在游戲中的應(yīng)用:打包銷售虛擬物品。欺詐行為

案例:農(nóng)業(yè)發(fā)展財(cái)政補(bǔ)貼申請中的欺詐探測。目的:在申請農(nóng)業(yè)財(cái)政補(bǔ)貼時(shí),是否存在欺詐行為。思想:用估計(jì)值(預(yù)測值)與實(shí)際值之間差值的大小來判斷個(gè)體行為是否異常。欺詐行為

案例介紹:資料:申請補(bǔ)貼田地的相關(guān)信息,包括申請序號、申請人姓名、田地所在區(qū)域、田地大小、降雨量、田地的收入、主要農(nóng)作物、申請類型和申請金額。分析方法:根據(jù)資料中相關(guān)數(shù)據(jù),用異常值診斷及各種預(yù)測模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論