游戲數(shù)據(jù)分析用戶流失模型的建立_第1頁
游戲數(shù)據(jù)分析用戶流失模型的建立_第2頁
游戲數(shù)據(jù)分析用戶流失模型的建立_第3頁
游戲數(shù)據(jù)分析用戶流失模型的建立_第4頁
游戲數(shù)據(jù)分析用戶流失模型的建立_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

用戶流失模型建立流失預測模型在很多行業(yè)都有引用到切實市場運行當中,而接下來就開門見山說一下游戲行業(yè)關于用戶流失模型建立。目標:關于游戲用戶流失,普片衡量指標有周流失與月流失,接下來研究問題有兩個:①關于付費用戶月登陸流失問題②關于付費用戶月付費流失(付費用戶月登陸流失定義:本月充值用戶在下個月不再有登陸行為。付費用戶月付費流失:本月充值用戶在下個月不在有付費行為。但有可能還有登陸行為,這部分用戶被稱為緘默付費用戶。)數(shù)據(jù)指標了解:影響流失普片判斷有:在線活躍、充值或消費活躍、還有玩家賬號一些屬性(假如細分還有副本活躍度,一些活動活躍度,或者社交數(shù)據(jù)等)。本文在做流失預測模型之前做以下數(shù)據(jù)準備:玩家ID玩家角色名等級注冊時間本月充值總額本月銅幣活躍(銅幣交易次數(shù))本月綁定銅幣活躍(綁定銅幣交易次數(shù))本月元寶活躍(元寶交易次數(shù))本月活躍天數(shù)(登陸天數(shù))本月登陸次數(shù)本月登陸總時長下月充值總額下月登陸天數(shù)以上是從數(shù)據(jù)庫中取出來基本指標,而進行分析指標能夠在這個基礎指標基礎上再進行豐富,比如:每活躍天在線時長=登陸總時長/活躍天數(shù);每活躍天登陸次數(shù)=登陸次數(shù)/活躍天數(shù);活躍度=活躍天數(shù)/本月已注冊時長(大家將發(fā)覺這里衍生“活躍度”指標在后面分析會起到神奇效果)。數(shù)據(jù)都準備好了之后,現(xiàn)在就開始建立模型,以下用到是SPSSModeler軟件。首先采取源節(jié)點來錄入數(shù)據(jù),數(shù)據(jù)分為兩份,第一份為“11月預測12月”數(shù)據(jù),第二份為“12月預測1月”數(shù)據(jù)。接著利用“導出”節(jié)點導出我們所需要衍生字段。因為這里“下月充值流失”是依照下月是否有充值來判斷轉(zhuǎn)換,下月充值為0即為流失則標志為T,不然為F(“下月登陸流失”同理)。利用導出節(jié)點,我們依次衍生了以下字段:下月充值流失下月登陸流失每活躍天銅幣交換次數(shù)每活躍天綁定銅幣交易次數(shù)每活躍天元寶交易次數(shù)每活躍天登陸次數(shù)每活躍天登陸時長每活躍天充值額度活躍度(登陸天數(shù)/本月已注冊天數(shù))接下來就是對一些多出字段過濾還有數(shù)據(jù)清理(如包含空值數(shù)據(jù),或者不合理數(shù)據(jù),如活躍度>1為不合理數(shù)據(jù))。添加“過濾”&“選擇”節(jié)點。把無用字段過濾掉(依照自己源數(shù)據(jù)來過濾,如這里下月充值(元寶)字節(jié)已經(jīng)轉(zhuǎn)換成“下月充值流失”字節(jié),所以能夠刪除過濾掉),點擊確定。打開“選擇”節(jié)點,模式選擇“拋棄”,條件寫上一些需要去除數(shù)據(jù),點擊確定。模型之前數(shù)據(jù)準備都基本完成了,最終添加一個類型節(jié)點。我們先研究是下月登陸流失,所以現(xiàn)將下月充值流失角色設為無,下月登陸流失設為目標,接下來就是選擇需要預測模型。這里選擇了貝葉斯與C5.0算法。貝葉斯這里利用了三種方法:TAN、Markov、Markov_FS分別添加三個貝葉斯節(jié)點,名字分別命名:TAN、Markov、Markov_FS(方便辨識)。TAN設置結構類型為TAN;Markov設置結構類型為MarkovBlanket;Markov_FS設置結構類型為MarkovBlanket而且勾選“包含特征選擇預處理步驟”。分別運行得到3個模型,最終連接一個“分析”節(jié)點,默認狀態(tài)下按運行。分析節(jié)點運行結果:大家能夠顯著發(fā)覺,利用貝葉斯三種方法準確率基本都為83%,這說明三種方法差異并不大。其實在通常預測來說,80%以上已經(jīng)算比很好結果了。不過這里將深入采取C5.0算法與其比較。添加C5.0算法節(jié)點,默認狀態(tài)下按運行,得到C5.0模型,點擊C5.0模型節(jié)點能夠看到每一個變量主要性,而“活躍度”這個變量主要性是最高。(這也說明了一些衍生字段對后期分析主要性)接下來再添加“分析”節(jié)點發(fā)覺準確率達成85%,比貝葉斯要稍微好點。(有一些情況對決議樹使用boosting方法或者進行截枝修剪嚴重性會得到愈加好效果)我們再用C5.0模型深入進行流失分析,添加“直方圖”節(jié)點:選擇字段levelOR注冊時間,交疊字段顏色選擇我們經(jīng)過C5.0預測出來“$C-下月登陸流失”字段,點擊運行。用這個方法能夠深入預測分析下月流失等級分布,或者注冊時間分布,或者更多關于玩家信息,原理一樣在這里不再做拓展。到這里流失預測模型已經(jīng)建好能夠投入使用了。接上我們需要預測1月份數(shù)據(jù),我們能夠深入看到這個預測模型在下個月準確性仍能夠保持在85%左右,說明預測效果還是不錯,之后能夠直接進行一系列分析。(在這里說明一下,通常預測模型會伴

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論