依托客戶投訴與關鍵kpi的關聯(lián)分析研究,搭建以客戶感知為主導的投訴預警體系_第1頁
依托客戶投訴與關鍵kpi的關聯(lián)分析研究,搭建以客戶感知為主導的投訴預警體系_第2頁
依托客戶投訴與關鍵kpi的關聯(lián)分析研究,搭建以客戶感知為主導的投訴預警體系_第3頁
依托客戶投訴與關鍵kpi的關聯(lián)分析研究,搭建以客戶感知為主導的投訴預警體系_第4頁
依托客戶投訴與關鍵kpi的關聯(lián)分析研究,搭建以客戶感知為主導的投訴預警體系_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

成果上報申請書成果名稱依托客戶投訴與關鍵KPI關聯(lián)分析研究,搭建以客戶感知為主導的投訴預警體系成果申報單位成果承擔部門/分公司項目負責人姓名項目負責人聯(lián)系電話和EMAIL成果專業(yè)類別網管所屬專業(yè)部門網絡線條成果研究類別相關網絡解決方案省內評審結果優(yōu)秀關鍵詞索引(35個)投訴、KPI、關聯(lián)、數(shù)據(jù)挖潛應用投資產品版權歸屬單位對企業(yè)現(xiàn)有標準規(guī)范的符合度滿足如果該成果來源于研發(fā)項目,請?zhí)顚懷邪l(fā)項目的年度、名稱和類型(類型包括集團重點研發(fā)項目、集團聯(lián)合研發(fā)項目、省公司重點研發(fā)項目、其他研發(fā)項目),可填寫多個成果簡介一、項目研究目的與意義用戶投訴是當前網絡質量客戶感知最直接,也是最關鍵的表現(xiàn)。在基礎通信類投訴管理的環(huán)節(jié)中,面臨最大的挑戰(zhàn)在于現(xiàn)網的網絡質量KPI不斷提升,而同期用戶投訴卻沒有得到相應的改善,甚至是出現(xiàn)逐年攀升的趨勢。用戶投訴所呈現(xiàn)出日趨復雜化的嚴峻形勢,正是由于在預防投訴和解決投訴方面還缺乏高效的方法和機制來關聯(lián)網絡質量與用戶投訴(感知)。所以,在當前注重客戶感知為導向的網絡質量管理的轉變工作中,研究用戶投訴與網絡關鍵指標的關聯(lián)性是非常具有創(chuàng)新和現(xiàn)實意義的。本項目的研究有著以下兩個顯著特點方法創(chuàng)新推動成果創(chuàng)新用戶投訴的管理和監(jiān)控是眾多網絡業(yè)務質量監(jiān)控項目中唯一取決于終端客戶反饋的,而且用戶投訴工單與其他的測量項目在測量原理上缺乏直接的相關性。因此,在這一類具有概率意義的網絡質量問題分析上,本項目將數(shù)據(jù)挖掘建模技術創(chuàng)新性地引入了本課題的研究,來分析深層次用戶投訴與網絡質量之間的關聯(lián)規(guī)則。該方法論在現(xiàn)網的實際應用是集團內的首次應用;研究輸出成果是基礎通信類用戶投訴與網絡質量KPI及其他因素之間的量化關聯(lián)規(guī)則模型曁投訴預警體系,在集團內也是首次呈現(xiàn)。理論研究與網絡實際相承接用戶投訴與網絡質量的分析,除了選取科學的挖掘分析算法之外,依托了普遍的現(xiàn)網歷史數(shù)據(jù)(100,000條以上的投訴工單量),結合豐富的網絡優(yōu)化經驗,得到了符合我省用戶投訴與網絡質量關聯(lián)規(guī)則模型。同時,在現(xiàn)網中開展了嚴謹?shù)尿炞C,模型推廣有效指導了與投訴相關的網絡日常工作。二、項目解決的問題1、引入和實踐的反復論證,找出了適合本課題中各階段、各類型類研究的不同方法論,填補用戶投訴與網絡質量KPI研究的技術空白。2、本項目還開創(chuàng)性的利用非網絡質量因素的方法來量化地域,經濟,文化,認可等對用戶投訴的影響,提出了按照我省各地市用戶主觀特性開展分級用戶投訴管理的建議與實施方案。3、輸出的關鍵成果在區(qū)別認識地市投訴水平的基礎上,本課題對三類地市分別開展了用戶投訴與網絡質量KPI管理關聯(lián)分析的工作。之前,用戶投訴與網絡質量KPI存在著模糊的關聯(lián)關系,集團內部只有個別各省公司涉及過該類課題的探討,但是僅限于理論層面的關聯(lián)研究,至今無基于現(xiàn)網海量數(shù)據(jù)得出的量化關系結論。我省為此創(chuàng)新性的采用了數(shù)據(jù)挖掘的方法來發(fā)現(xiàn)不同地市、不同投訴類型所對應的敏感性KPI(統(tǒng)計相關性算法),并建立引發(fā)不同地市、不同投訴類型的KPI觸發(fā)門限規(guī)則模型(數(shù)據(jù)挖掘決策樹算法)。這一成果完全依托現(xiàn)網普遍的投訴數(shù)據(jù)與網絡質量KPI,首次建立起用戶投訴與網絡質量KPI進行了量化的關聯(lián)的橋梁這將在本質上破解用戶感知與網絡質量相對孤立的網絡質量管理局限。同時我們對本課題的模型結果進行了二次驗證,模型的數(shù)學統(tǒng)計精度普遍達到約80,并在投訴的預測實踐中,準確性達到5070。三、項目的社會與經濟效益本課題的研究成果可以被廣泛深入的應用到日常網絡工作中。1網絡質量管理工作從根本上建立起客戶感知與網絡質量的關聯(lián),真正從用戶角度觸發(fā)來管理網絡質量水平,加速網絡質量從網絡KPI到客戶感知的轉變步伐。2客戶服務工作由于發(fā)現(xiàn)了誘發(fā)用戶投訴的網絡質量KPI及其門限,可以提高用戶投訴的處理效率,并提前預警用戶投訴的發(fā)生(局部現(xiàn)網驗證投訴預測準確性5070),將網絡工作預防提前,有助于降低用戶投訴的發(fā)生,提高用戶服務水平,減少客戶流失率。3網絡發(fā)展規(guī)劃工作規(guī)劃是網絡質量的基礎。以往的網絡規(guī)劃主要從宏觀角度出發(fā),以滿足網絡級的容量需求為目標。根據(jù)用戶投訴對網絡質量的需求,可以結合用戶類型,小區(qū)價值,業(yè)務分布來精細的分場景的提出資源規(guī)劃方案,提高經濟投資產出比。4網管支撐系統(tǒng)融合正是由于本課題所建立的用戶投訴與網絡質量KPI關聯(lián)規(guī)則,在投訴錄入,全量分析以及投訴處理優(yōu)化等環(huán)節(jié)上得到了統(tǒng)一。本方案的成果可以指導各相關網管支撐系統(tǒng)的融合,來提高工作效率。省內試運行效果正是基于用戶投訴這一綜合課題的研究基礎,需要逐步梳理和完善現(xiàn)有的用戶投訴管理體系進行。本課題的成果可以應用于數(shù)據(jù)流管理標準化、投訴分析條理化、優(yōu)化與預防精確化,資源投放合理化,用戶分級管理等多個應用領域。A數(shù)據(jù)流管理稽核質檢這是用戶投訴管理體系的基礎,是我們獲取客戶投訴數(shù)據(jù)和網絡質量數(shù)據(jù)的數(shù)據(jù)庫,為了后面的分析和研究,基礎數(shù)據(jù)的準確性和標準化是非常重要的,只有高質量的數(shù)據(jù)才可能輸出具有參考意義的結果,才能引導我們做出正確的決策。所以,要想建立好的用戶投訴管理體系,前提是建立完整、科學、規(guī)范的數(shù)據(jù)流管理系統(tǒng)。本課題提出了投訴工單記錄稽核質檢方案,修正各地市話音基本業(yè)務網絡覆蓋中錯誤分類32的投訴項,進一步證實了業(yè)務分類方面需要進一步完善,見下圖。該方案可以大大的糾正用戶投訴對網絡工作重點的判斷與后續(xù)關聯(lián)分析的準確性。B投訴分析條理化有了良好的數(shù)據(jù)基礎,這些數(shù)據(jù)怎么用呢到底哪些KPI與投訴相關這就需要關聯(lián)分析,利用統(tǒng)計學的關聯(lián)分析原理,我們在大量的KPI中尋找與每類投訴相關的KPI,這些KPI有可能包括我們從業(yè)務上就認為是與投訴相關的KPI,也可能包括我們不重視的一些信息。通過交叉的分析可以發(fā)現(xiàn)很多深入的用戶投訴工作建議。C優(yōu)化與預防精確化基于投訴與網絡指標的關聯(lián)關系,從客戶感知的角度出發(fā),把投訴問題轉換為特定指標優(yōu)化,同時依據(jù)KPI及其他指標的綜合現(xiàn)狀,預估未來的投訴情況,這樣可以在投訴處理與預防方面做到有的放矢,實現(xiàn)高效精確地網絡優(yōu)化。在現(xiàn)網中,利用觸發(fā)用戶投訴的網絡質量KPI及其門限,可以提高用戶投訴的處理效率,并提前預警用戶投訴的發(fā)生(局部現(xiàn)網驗證投訴預測準確性5070),將網絡工作預防提前,有助于降低用戶投訴的發(fā)生,提高用戶服務水平,減少客戶流失率。D資源投放合理化投訴的預防是投訴管理的理想目標,而資源投放的前瞻性、合理性對用戶投訴至關重要,基于性能分析指導資源投放,并預防投訴是實現(xiàn)這一目標可能的途徑。E用戶投訴的分級管理對我省各地市用戶投訴統(tǒng)計分析,萬人投訴比的日常波動形成了統(tǒng)計上的差異,可以考慮分類分級差異化管理。地域區(qū)塊差異建議各地市統(tǒng)一投訴錄入與受理信息。在此前提下,確認地市的萬人投訴比差異,為不同的管理行政區(qū)劃分投訴管理等級與考核要求。以此來科學的對待投訴問題主觀因素的影響。文章主體(3000字以上,可附在表格后)根據(jù)成果研究類別,主體內容的要求有差異,具體要求見表格后的“填寫說明6”。附文章主體(3000字以上)客戶投訴與關鍵KPI關聯(lián)分析研究搭建以客戶感知為主導的投訴預警體系一、背景情況根據(jù)西方營銷專家的研究和企業(yè)運營的經驗,吸引一個新用戶所耗費的成本遠遠超過保留現(xiàn)有用戶的成本。同時,一個公司如果將其顧客流失率降低5,利潤就能增加25至85。在競爭激烈的電信市場的環(huán)境下,如何爭取新增用戶,保留現(xiàn)有用戶成為市場競爭焦點。其中一個重要的舉措就是提高顧客滿意程度,這是保持顧客的根本辦法??蛻魸M意度通常通過主動的客戶感知調查與客服部門受理的用戶投訴兩個方面體現(xiàn)。其中,用戶投訴是對影響客戶感知的具體網絡及服務問題的反饋,直接影響了用戶滿意度和忠誠度,需要更為高效和針對性的應對和加以解決。因此,我們啟動了此次用戶投訴專題分析創(chuàng)新研究課題,服務的目標旨在基于大量的歷史基礎通信類用戶投訴和網絡性能的統(tǒng)計數(shù)據(jù),利用數(shù)據(jù)挖掘分析方法,量化分析影響用戶投訴的網絡質量及非網絡質量因素,建立用戶投訴與網絡性能指標之間的關聯(lián)模型,指導針對用戶投訴的網絡日常工作。二、項目研究思路與框架什么情況下用戶會因網絡KPI問題發(fā)生投訴如何從網絡質量著手管理用戶投訴首先將用戶投訴行為以及與之相關的網絡質量進行了象限歸類投訴兼具主觀性和客觀性,需區(qū)別對待;網絡質量問題類投訴是研究重點,通過現(xiàn)網投訴用戶與正常用戶的挖掘,發(fā)現(xiàn)KPI誘發(fā)投訴的規(guī)則,并推廣發(fā)現(xiàn)沉默用戶?;谟脩敉对V管理的實際流程,本次研究主要分為兩個部分。第一部分是投訴概況分析,包括從各個維度分析投訴現(xiàn)狀、對投訴進行重新分類和梳理、利用數(shù)據(jù)挖掘的聚類算法對全省地市進行分類,從而為投訴分級標準、差異化管理提供重要依據(jù)。第二個部分,也是項目的核心,即投訴與網絡質量常用KPI的關聯(lián)分析,我們將基于歷史用戶投訴和網絡性能的統(tǒng)計數(shù)據(jù),利用數(shù)據(jù)挖掘的決策樹方法,分析和建立用戶投訴與網絡性能指標之間的關聯(lián)模型,指導針對用戶投訴的投訴管理與優(yōu)化工作。三、項目研究的主要成果31全網用戶投訴綜合分析全網用戶投訴數(shù)據(jù)是本課題研究的重要信息源,通過從宏觀與微觀,靜態(tài)與動態(tài)的全息分析,可以對網絡的投訴問題進行全方位的分析與透視,并為后續(xù)的投訴與網絡質量關聯(lián)研究奠定基礎。本課題分析的內容包括以下內容研究發(fā)現(xiàn)一為了后續(xù)的用戶投訴與網絡質量關聯(lián)對應,以“獨立性與完備性”為梳理的原則,將現(xiàn)在的投訴分類進行重新梳理,同時兼容了客戶感知的維度也可匹配到基礎的網絡指標項目。具體如下圖所示。該建議方案可以推廣到全網來標準化投訴信息。研究發(fā)現(xiàn)二用戶投訴是通過終端用戶的直接表述與客服人員的記錄來得到的。在內容表述記錄的準確度上都存在著不確定性。例如,在現(xiàn)網原始投訴記錄的統(tǒng)計中,網絡覆蓋投訴占比約96,主要為室內外網絡覆蓋,通話質量占比約3,主要集中在串線。這在網絡優(yōu)化和客戶感知層面的先驗信息角度來看,是有些出入的。例如,網絡中覆蓋與干擾并存,某些區(qū)域實際上是干擾型的網絡,但在投訴中無法體現(xiàn)。另外,在用戶投訴過程中,往往最直接的觸發(fā)投訴的是撥打失敗,話音質量差,非常長掉話等現(xiàn)象,而這些問題在投訴記錄中比例反而是微乎其微。因此,本課題提出了投訴工單記錄稽核質檢方案建議。各地市話音基本業(yè)務網絡覆蓋中,最低的錯誤分類也有32,進一步證實了業(yè)務分類方面需要進一步完善,見下圖。該方案可以大大的糾正用戶投訴對網絡工作重點的判斷與后續(xù)關聯(lián)分析的準確性。研究發(fā)現(xiàn)三對我省各地市用戶投訴統(tǒng)計分析,萬人投訴比的日常波動形成了統(tǒng)計上的差異,可以考慮分類分級差異化管理。地域區(qū)塊差異建議各地市統(tǒng)一投訴錄入與受理信息。在此前提下,確認地市的萬人投訴比差異,為不同的管理行政區(qū)劃分投訴管理等級與考核要求。以此來科學的對待投訴問題主觀因素的影響。關鍵點,即投訴錄入要嚴格統(tǒng)一規(guī)范;管理分級規(guī)則建議每年進行核準與調整。這以方案可以量化的衡量投訴的非網絡質量因素影響,為科學合理的開創(chuàng)差異化用戶投訴管理提供了實踐依據(jù),并可以開展試點與推廣。以下是差異化管理分析建議方案對比參與聚類的靜態(tài)屬性因素,分類1是典型省會城市,投訴顯著區(qū)分于其他地市;分類2是以山區(qū)丘陵為主的地市,人口密度小,投訴比例最低;分類3是以平原為主的地市,人口密度較高,投訴比例也處于中等水平;分類2由于人口密度小,整網的話務密度,小區(qū)密度和載頻密度都較小,因此從頻率復用,系統(tǒng)內干擾等因素來考慮,分類2相對來說2G的網絡的部署是比較有彈性的,這也在客觀上提供了良好質量的基礎。從基礎通信的占比看,分類2與3基本相當,表明總體而言,分類2的投訴習慣相對較低。影響投訴差異的靜態(tài)數(shù)據(jù)最關鍵因素地方的經濟發(fā)展水平;人口密度;地形地貌;用戶群品牌分布等河南地市萬人投訴比統(tǒng)計分布說明上圖為箱線圖,是一種用來描述數(shù)據(jù)分布的統(tǒng)計圖形,利用箱圖可以直觀地反映觀測數(shù)據(jù)的中位數(shù)、4分位數(shù)和極值等描述性統(tǒng)計量,從視覺的角度觀測變量值的分布情況。依據(jù)單個變量,即萬人投訴比的統(tǒng)計均值,我們可將河南全省各地市分為四個類別,那么從數(shù)據(jù)挖掘的角度進行分類,是否能進一步證明我們這樣的分類是有意義的呢本文采用數(shù)據(jù)挖掘里常用的聚類方法進行研究,得到了明確的結論。以下是對聚類算法的介紹說明。聚類分析又稱群分析,是依據(jù)研究對象的個體特征,對其進行分類的方法。聚類分析是一種建立分類的多元統(tǒng)計分析方法,它能夠將一批樣本(或變量)數(shù)據(jù)根據(jù)其諸多特征,按照在性質上的親疏程度在沒有先驗知識的情況下進行自動分類,產生多個分類結果。類內部個體特征之間具有相似性,不同類間個體特征的差異性較大。本次聚類分析的數(shù)據(jù)都為連續(xù)的數(shù)值型,所以選擇的K均值聚類方法建立模型。K均值算法給定N個對象或數(shù)據(jù)元組的數(shù)據(jù)庫,劃分方法構建數(shù)據(jù)的K個劃分,分個劃分表示一簇。K均值算法是比較常用的劃分方法,而K眾數(shù)算法和K中心點算法是K均值算法的擴展。K均值算法以K為輸入參數(shù),把N個對象的集合分為K個簇,使得結果簇內的相似度高,而簇之間的相似度低,如下圖所示32分地域用戶投訴與網絡質量關聯(lián)研究本課題研究的重要目的之一就是發(fā)現(xiàn)影響用戶投訴的敏感性指標以及觸發(fā)門限,并以之為基礎指導優(yōu)化與投訴預防。因此關聯(lián)性規(guī)則建??梢苑譃閮刹糠?,一是客戶發(fā)生投訴時,如何從客戶感知的角度給出需要優(yōu)化的KPI及門限值,二是如何根據(jù)KPI情況來預測小區(qū)未來投訴發(fā)生的情況。本課題以現(xiàn)網的投訴與網絡質量為基礎,通過完整的數(shù)據(jù)挖掘過程,發(fā)現(xiàn)符合現(xiàn)網的用戶投訴與網絡質量KPI關聯(lián)規(guī)則模型。建模流程如下所示第一步數(shù)據(jù)采集,依據(jù)研究目的確定數(shù)據(jù)源;1、網絡開封、鄭州、駐馬店2、內容投訴數(shù)據(jù)、網絡KPI數(shù)據(jù);第二步數(shù)據(jù)梳理,保證基礎數(shù)據(jù)的質量,包括投訴類型重新分類、投訴類型重新梳理、投訴類型的初步及逐條糾正;第二步數(shù)據(jù)準備,包括投訴與KPI的映射關系、不同系統(tǒng)數(shù)據(jù)間的關聯(lián)、模型的樣本數(shù)據(jù)選??;第三步統(tǒng)計分析,從相關性等統(tǒng)計角度分析投訴與KPI的關系;第四步模型選取,依據(jù)研究目的、數(shù)據(jù)特點、模型精度等方面選取模型;第五步模型建立,確定進入模型的變量,進行建模;第六步結果評估,驗證模型結果;第七步優(yōu)化建議,依據(jù)模型結果提出優(yōu)化建議;關鍵成果之投訴敏感性指標的發(fā)現(xiàn)下表為用戶投訴與網絡質量相關性指標的設計,它主要源于日常豐富的網絡優(yōu)化與投訴受理經驗。本課題在這一基礎上,通過現(xiàn)網數(shù)據(jù)樣本的相關性分析來發(fā)現(xiàn)和過濾其中敏感性關鍵指標。投訴分類劃分主要KPI輔助KPI投訴分類劃分主要KPI輔助KPI半速率比例全速率ERLAVE_DL_LEVMSPOWEROUT_BAND1切換失敗率AVE_UL_LEVBSPOWERUQ05RUQ0RAVG_TAPK_TADQ05RDQ0R網絡覆蓋切換次數(shù)每呼叫半速率ERLTRF236通信質量切換次數(shù)每呼叫TBF38C掉話率DCR_3J切換失敗率TBF_34OUT_BAND1AVG_TABLCK_33AVE_DL_LEVULQ0_5TBF_15AVE_UL_LEVDLQ0_5TBF_16TCH掉話數(shù)DAP_13A切換次數(shù)每呼叫TBF_FALL_DL掉話SDCCH可用率BLERTCH擁塞率TCH擁塞次數(shù)數(shù)據(jù)業(yè)務(EGPRS)RTO_DL_MCS69接通SD擁塞率TCHERLGSM網接通率OUT_BAND1SDCCH可用率AVE_DL_LEVAVE_UL_LEVAVG_TASD擁塞次數(shù)變量間的關系分為確定性和非確定性關系兩類確定性關系即通常所說的函數(shù)關系,非確定性關系即相關關系。相關分析用于描述兩個變量之間關系的密切程度,它反映的是當控制了其中一個變量的取值后,另一個變量的變異程度。其顯著特點是變量不分主次,被置于同等地位。數(shù)據(jù)度量不同,相關分析的方法也不同,需要根據(jù)數(shù)據(jù)的特點選擇不同的相關系數(shù)。若兩個變量都是數(shù)值型變量,我們常用PEARSON簡單相關系數(shù),若兩個都是分類變量,我們常用SPEARMAN等級相關系數(shù)和KENDALL相關系數(shù)或通過列聯(lián)表進行獨立性檢驗,當一個是數(shù)值連續(xù)變量,另一個是分類變量時,常用ETA統(tǒng)計量。ETA統(tǒng)計量表明等間隔測度的因變量和具有一定數(shù)量分類值的自變量關聯(lián)性,0表示行列變量之間沒有關聯(lián)性,1表示行列變量之間存在很高的關聯(lián)性。2ETA,即相關比率,還可用于分析兩個定比變量之間的非線性關系,但需要將其中一個(視為自變量)降低為定類層次,然后,計算其相關比率2ETA。比較2T的值與R的值,兩值相差越大,表明兩變量之間的關系越是非線性關系。ETA統(tǒng)計量的具體公式如下TSRTSETAINJIJMIYS12INJIIJMIT12其中,M為分類變量值個數(shù),NI為分類變量取某值的情況下的連續(xù)變量個數(shù)。此次研究中,各KPI及告警數(shù)據(jù)均為連續(xù)的數(shù)值變量,而投訴變量為二值分類變量(即要么發(fā)生此類型投訴,要么不發(fā)生),所以我們用ETA統(tǒng)計量計算相關性。通過相關性的統(tǒng)計分析,結合相關性和業(yè)務理解,將相關性排在前列、業(yè)務上認為重要的KPI作為關鍵的敏感指標。模型會將所有輸入變量按重要性排序,然后再依據(jù)重要性不斷調試輸入變量,這樣循序漸進,并結合業(yè)務理解,選取最合理的結果,同時確定最終輸入模型的變量,如下圖所示關鍵成果之觸發(fā)投訴的指標門限規(guī)則完成各地域不同類型投訴關鍵指標的發(fā)現(xiàn)之后,接下來就是需要通過數(shù)據(jù)挖掘算法了得到觸發(fā)用戶投訴的目標門限。數(shù)據(jù)挖掘有很多類別,如回歸、分類、聚類、神經網絡等,我們此次研究屬于二元分類問題,能夠解決此類問題的算法較多,可用的算法有CART、QUEST、C50、神經網絡、邏輯回歸、貝葉斯、決策列表、GRI、APRI、CARMA等,以開封數(shù)據(jù)第一階段數(shù)據(jù)為例(此數(shù)據(jù)為階段性研究里最先得到的數(shù)據(jù)),將各模型參數(shù)設為常用值即默認值,初步分析后,發(fā)現(xiàn)決策樹尤其是C50和CR算法的總體精度最高,所以選擇決策樹算法做為我們的研究模型,如下圖各投訴類別適用模型的精度排名(前七名)決策樹DECISIONTREE是一種基于貪心算法的分類方法,采用自頂向下遞歸的思想進行構造。其中每個內部結點代表一個屬性上的測試,每個分支代表一個測試輸出,而每個樹葉結點代表一個類或類分布。以使用條件屬性I和條件屬性J來預測決策屬性的取值是否為真為例,其簡單的決策樹模型如下圖簡單的決策樹模型對訓練集數(shù)據(jù)進行學習后構造判定樹,并使用判定樹對類別未知的數(shù)據(jù)樣本進行分類,因此分類的過程就是樣本屬性在判定樹上進行測試的過程。當某個類別未知的樣本的測試路徑滿足判定樹中從根結點到某個葉結點的路徑時,此樣本被劃入該葉結點所表征的類中,從而實現(xiàn)類別未知的樣本從條件屬性到決策屬性的映射。因此判定樹的路徑實際就是分類規(guī)則,可以用IFTHEN的形式表示,故具有較好的可解釋性。在決策樹算法中,對數(shù)據(jù)進行分類最常用的方法是信息增益法,它通過選擇能夠導致熵函數(shù)下降最大的屬性,對節(jié)點進行分支。所謂熵函數(shù)就是假定S節(jié)點中有S個對象,對象中M有JC個不同類中的樣本數(shù),則對于給定節(jié)點的熵函數(shù)是121,LNMIIKSIS由信息增益生成的基于屬性JX的分支公式可以表示如下111LNLNVVVCVCWKKWKKJKKKNNGX其中JX是信息增益值,WK是父節(jié)點中類的對象數(shù),是父節(jié)點中的對象數(shù),VN是子節(jié)點V中的對象數(shù),VKN是子節(jié)點V中類K的對象數(shù),1LNCWKKKN表示父節(jié)點的熵,11LNVCWVVKK表示的是子節(jié)點的加權熵函數(shù),父節(jié)點的熵函數(shù)值與子節(jié)點的加權熵函數(shù)值之間的差值,反映的是屬性JX的信息增益。在分支中選擇的最終屬性是信息增益最大的悟性。此外,GINI系數(shù)法也是常用的一種,其公式表示如下2211VCRCWKWKJKVNDX使用GINI系數(shù)法的是為了增加子節(jié)點中的純度,理想狀態(tài)是當節(jié)點中只包含一個對象的時候,那么,此時節(jié)點的純度就最高。GINI系數(shù)法中使用雜質的減少量來確定分支屬性,最優(yōu)分支屬性在這里選擇的是雜質減少量最大的那一個。關鍵成果之模型的結果模型結果將給出每類投訴發(fā)生時,大多投訴記錄符合的KPI規(guī)則。此外,還將給出每個規(guī)則的精度及概率,其中精度即投訴數(shù)據(jù)中,某規(guī)則下,預測的投訴數(shù)量與實際投訴數(shù)量的比值;概率,即某規(guī)則下,可能發(fā)生投訴的概率。以鄭州為例,詳細結果如下鄭州1、數(shù)據(jù)業(yè)務規(guī)則TBF38C25或TBF38C87DBPK_TA4400M精度及概率27975/40587,863、通信質量規(guī)則DLQ0_50795精度及概率42/4986,455、接通規(guī)則GSM接通率25或TBF38C87DBPK_TA4400M精度(第一階段數(shù)據(jù)、第二階段數(shù)據(jù))87,903、通信質量規(guī)則DLQ0_50795精度(第一階段數(shù)據(jù)、第二階段數(shù)據(jù))86,835、接通規(guī)則GSM接通率998精度(第一階段數(shù)據(jù)、第二階段數(shù)據(jù))78,92對比第一階段數(shù)據(jù)與第二階段數(shù)據(jù)的模型精度,差別不大。說明本課題依據(jù)第一階段數(shù)據(jù)建立的模型是比較穩(wěn)定的,結果是可以應用的,即當客戶發(fā)生投訴時,規(guī)則給出的指標以及門限值是值得信賴的。關鍵成果之模型的應用實踐利用觸發(fā)投訴的規(guī)則模型,基于敏感性網絡質量KPI與歷史投訴記錄開展投訴的預測。根據(jù)排名先后,靠前的小區(qū)就是最有可能發(fā)生投訴且KPI指標較差的小區(qū),需要重點監(jiān)控。由于每個月的輸入都是持續(xù)的,所以整個邏輯圖是動態(tài)運轉。本項目在實踐中提取了鄭州201011242010128的KPI及投訴數(shù)據(jù)為輸入,預測201012920101223的投訴,并依據(jù)201012920101223實際發(fā)生的投訴檢驗預測的效果。這里以鄭州數(shù)據(jù)業(yè)務投訴為例。通過對上半個月數(shù)據(jù)業(yè)務投訴的綜合排名,可以看到TOP10小區(qū)里有7個小區(qū)在下半個月再次發(fā)生投訴,占比70,而且部分小區(qū)依然是投訴的熱點。TOP100小區(qū)里下半月投訴50,占比50。四、項目效果總結投訴是反映客戶感知的重要途徑,也是我們去了解用戶對我們所提供的網絡業(yè)務質量的重要評價。作為網絡運營服務企業(yè),要建立暢通的渠道準確的傾聽用戶的所反應的問題,及時準確的加以解決和回復。所以對于投訴問題,可以分為三個階段。第一階段建設和維護好優(yōu)質的通信業(yè)務服務網絡,從基礎上服務好終端用戶,減少用戶投訴;第二階段對于用戶投訴,做好投訴的投訴受理和標準化管理,正確的將投訴問題落實到網絡業(yè)務質量支撐部門;第

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論