本科畢業(yè)論文--基于數(shù)據(jù)挖掘的edpcrm系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)_第1頁
本科畢業(yè)論文--基于數(shù)據(jù)挖掘的edpcrm系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)_第2頁
本科畢業(yè)論文--基于數(shù)據(jù)挖掘的edpcrm系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)_第3頁
本科畢業(yè)論文--基于數(shù)據(jù)挖掘的edpcrm系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)_第4頁
本科畢業(yè)論文--基于數(shù)據(jù)挖掘的edpcrm系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)_第5頁
已閱讀5頁,還剩62頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

畢業(yè)設(shè)計(jì)論文基于數(shù)據(jù)挖掘的EDP-CRM系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)

摘要CRM(CustomerRelationshipManagement)系統(tǒng)的目的在于建立一個(gè)整合客戶服務(wù)、市場(chǎng)競(jìng)爭、銷售以及技術(shù)支持的系統(tǒng),為企業(yè)帶來長久的競(jìng)爭優(yōu)勢(shì)。作為一種典型的交互式系統(tǒng),CRM系統(tǒng)是企業(yè)管理中信息技術(shù)和應(yīng)用解決方案的集成。它既是管理客戶關(guān)系的一系列信息技術(shù)、方法和措施,又是運(yùn)用信息技術(shù)將企業(yè)涉及的銷售、客戶服務(wù)、內(nèi)部管理等業(yè)務(wù)流程自動(dòng)化的軟件及硬件系統(tǒng)。而隨著企業(yè)對(duì)CRM系統(tǒng)的長期使用,會(huì)積累大量的數(shù)據(jù),他們迫切需要從現(xiàn)有大量數(shù)據(jù)中提取出數(shù)據(jù)中潛在的知識(shí),因此對(duì)CRM系統(tǒng)進(jìn)行數(shù)據(jù)挖掘的需求已經(jīng)必不可少。本文以某高校EDP-CRM項(xiàng)目為背景,介紹了CRM系統(tǒng)中客戶管理模塊和數(shù)據(jù)挖掘模塊的設(shè)計(jì)與實(shí)現(xiàn)。通過該EDP-CRM系統(tǒng),既可以方便地對(duì)客戶開展基本的客戶管理、產(chǎn)品管理、售后管理等客戶管理功能,又可以在此基礎(chǔ)上對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行聚類、分類、關(guān)聯(lián)、時(shí)間序列分析等數(shù)據(jù)挖掘操作。本文主要研究在數(shù)據(jù)挖掘的基礎(chǔ)上構(gòu)建CRM系統(tǒng)的技術(shù)。圍繞某高校EDP-CRM系統(tǒng)的客戶關(guān)系管理和數(shù)據(jù)挖掘兩大功能模塊進(jìn)行了詳細(xì)的研究分析。文中詳細(xì)介紹了客戶關(guān)系管理系統(tǒng)和數(shù)據(jù)挖掘技術(shù)。首先,客戶管理模塊著重介紹了模塊的軟硬件架構(gòu),流程設(shè)計(jì)和功能實(shí)現(xiàn),從而保證CRM系統(tǒng)的基本功能的實(shí)現(xiàn)。而數(shù)據(jù)挖掘模塊描述了模塊實(shí)現(xiàn)的流程和技術(shù),并在系統(tǒng)現(xiàn)有功能情況基礎(chǔ)上,作者研究了數(shù)據(jù)挖掘的建模方案,主要重點(diǎn)討論了數(shù)據(jù)倉庫的構(gòu)建模型和構(gòu)建過程,從操作型環(huán)境抽取數(shù)據(jù)并導(dǎo)入數(shù)據(jù)倉庫方法,對(duì)數(shù)據(jù)進(jìn)行綜合處理的實(shí)現(xiàn)技術(shù),以及后期數(shù)據(jù)如何追加到數(shù)據(jù)倉庫的機(jī)制,并詳細(xì)介紹了關(guān)聯(lián)規(guī)則挖掘模型,聚類挖掘模型和分類挖掘模型的實(shí)現(xiàn)技術(shù)。在確定了系統(tǒng)的關(guān)鍵技術(shù)后,完成了其CRM的系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)。最后作者總結(jié)全文,并提出了進(jìn)一步工作的方向。第一章緒論一、研究背景及研究意義隨著市場(chǎng)對(duì)知識(shí)要求的提高,越來越多的企業(yè)高層對(duì)知識(shí)在企業(yè)競(jìng)爭發(fā)揮的作用有了深刻認(rèn)識(shí),EDP教育也逐步發(fā)展起來。但是,當(dāng)前EDP教育產(chǎn)業(yè)在國內(nèi)由于發(fā)展時(shí)間較短,也存在一些問題影響EDP教育的進(jìn)一步發(fā)展,其中,如何在激烈的市場(chǎng)競(jìng)爭環(huán)境下開發(fā)和占領(lǐng)市場(chǎng)以使EDP教育產(chǎn)業(yè)獲得生存和發(fā)展是決定一個(gè)EDP教育產(chǎn)業(yè)能否良性發(fā)展的關(guān)鍵問題。為了解決這個(gè)問題,客戶資源的有效利用是一個(gè)關(guān)鍵。對(duì)于現(xiàn)代企業(yè)來說,客戶資源正成為最具價(jià)值的資產(chǎn),建立客戶信息數(shù)據(jù)庫,對(duì)這些最有價(jià)值的資產(chǎn)進(jìn)行有效管理,成為企業(yè)的核心任務(wù)之一。EDP教育產(chǎn)業(yè)也是如此。因此,在解決客戶資源管理環(huán)節(jié),EDP教育產(chǎn)業(yè)也可以借鑒其他產(chǎn)業(yè)的經(jīng)驗(yàn),將CRM(CustomerRelationshipManagement,客戶關(guān)系管理)引入到EDP教育的客戶資源管理之中。CRM是90年代西方發(fā)展起來的新型的管理策略,它在國外的應(yīng)用己經(jīng)取得了極大的成功,而我國對(duì)它的認(rèn)識(shí)和應(yīng)用才剛剛起步。當(dāng)今許多企業(yè)的CRM數(shù)據(jù)庫或數(shù)據(jù)倉庫中都搜集和存儲(chǔ)大量關(guān)于客戶的寶貴數(shù)據(jù),這些數(shù)據(jù)涵蓋了從客戶基本數(shù)據(jù)、購買記錄及客戶反饋的個(gè)個(gè)環(huán)節(jié)。充分利用這些數(shù)據(jù),深入分析、挖掘隱含在這些數(shù)據(jù)中的有用信息,將有助于企業(yè)更好地管理客戶關(guān)系,實(shí)現(xiàn)CRM的功能和目標(biāo)。然而,由于缺乏在大量數(shù)據(jù)中發(fā)現(xiàn)深層次信息的能力,許多企業(yè)對(duì)于這些數(shù)據(jù)的利用還只是停留在基礎(chǔ)層的瀏覽、檢索、查詢和應(yīng)用層的繼承、組合、整理等方面,而無法將這些數(shù)據(jù)轉(zhuǎn)化為更加有用的知識(shí)。因此,如何更加有效地管理企業(yè)數(shù)據(jù)庫中快速增長的海量數(shù)據(jù),將數(shù)據(jù)資源的利用提高到知識(shí)創(chuàng)新的高級(jí)階段,己經(jīng)成為企業(yè)當(dāng)前需要迫切解決的問題,數(shù)據(jù)挖掘(DataMining,簡稱DM)技術(shù)的運(yùn)用就可以幫助企業(yè)很好地解決這個(gè)問題。所謂數(shù)據(jù)挖掘,簡單地說,就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘作為一門交叉學(xué)科,受到多門學(xué)科的影響,包括數(shù)據(jù)庫系統(tǒng)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、可視化和信息科學(xué)。需要特別指出的是,數(shù)據(jù)挖掘從一開始就是面向應(yīng)用的,因此如何利用數(shù)據(jù)挖掘技術(shù)解決特定領(lǐng)域的問題,是研究數(shù)據(jù)挖掘應(yīng)用的核心問題[1][2][3][4]。近年來,該技術(shù)已經(jīng)在商務(wù)管理,生產(chǎn)控制,市場(chǎng)分析,工程設(shè)計(jì)和科學(xué)探索等領(lǐng)域得到廣泛的應(yīng)用。綜上所述,為了解決EDP教育中存在的客戶關(guān)系管理混亂無序的現(xiàn)狀,本文將根數(shù)EDP教育的特點(diǎn)設(shè)計(jì)EDP-CRM系統(tǒng)并將其實(shí)現(xiàn),并為了進(jìn)一步開發(fā)客戶關(guān)系中的潛在的價(jià)值,將數(shù)據(jù)挖掘技術(shù)引入到EDP-CRM系統(tǒng)之后,通過對(duì)客戶資源進(jìn)一步進(jìn)行細(xì)分,提高客戶開發(fā)的效率,并對(duì)客戶資源進(jìn)行進(jìn)一步的有效開發(fā),從而達(dá)到有效利用客戶的價(jià)值目的。二、國內(nèi)外研究綜述(一)國外研究現(xiàn)狀1.數(shù)據(jù)挖掘研究現(xiàn)狀隨著信息技術(shù)的迅猛發(fā)展,數(shù)據(jù)庫的規(guī)模不斷擴(kuò)大,從而產(chǎn)生了大量的數(shù)據(jù)。這些數(shù)據(jù)背后隱藏著許多重要的信息,人們希望通過對(duì)這些信息進(jìn)行更高層次的分析,以便更好地利用這些數(shù)據(jù)。但大量復(fù)雜的數(shù)據(jù)往往使人們無法辨別隱藏在其中的能對(duì)決策提供支持的信息,而傳統(tǒng)的查詢、報(bào)表工具無法滿足挖掘這些信息的需求。因此,需要一種新的數(shù)據(jù)分析技術(shù)處理大量數(shù)據(jù),并從中抽取有價(jià)值的潛在知識(shí),數(shù)據(jù)挖掘(DataMining)技術(shù)由此應(yīng)運(yùn)而生。數(shù)據(jù)挖掘技術(shù)也正是伴隨著數(shù)據(jù)倉庫技術(shù)的發(fā)展而逐步完善起來的[5,6]。數(shù)據(jù)挖掘最早出現(xiàn)在20世紀(jì)80年代后期,它是在計(jì)算機(jī)信息技術(shù)的基礎(chǔ)上發(fā)展而來的,而數(shù)據(jù)挖掘的概念是1989年在美國底特律召開的第十一屆國際聯(lián)合人工智能學(xué)術(shù)會(huì)議上最早被正式提出來。此次會(huì)議首次正式提出了KDD(KnowledgeDiscoveryinDatabase)這個(gè)術(shù)語。并且在后來的1991年、1993年和1994年都舉行了關(guān)于KDD的專題討論會(huì),匯集來自各個(gè)領(lǐng)域的研究人員和應(yīng)用開發(fā)者,集中討論數(shù)據(jù)統(tǒng)計(jì)、海量數(shù)據(jù)分析算法、知識(shí)表示、知識(shí)運(yùn)用等問題。隨著與會(huì)人員的不斷增多,KDD國際會(huì)議發(fā)展成為年會(huì)。1998年在美國紐約舉行的第四屆知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘國際學(xué)術(shù)會(huì)議21不僅進(jìn)行了學(xué)術(shù)討論,并且有30多家軟件公司展示了他們的數(shù)據(jù)挖掘軟件產(chǎn)品,不少軟件已在北美、歐洲等國得到應(yīng)用。經(jīng)歷十多年的發(fā)展,數(shù)據(jù)挖掘已經(jīng)成為一個(gè)自成體系的應(yīng)用學(xué)科。目前,國外數(shù)據(jù)挖掘的發(fā)展趨勢(shì)及其研究主要有以下方面:Berry和Linoff[7]主要側(cè)重于基于數(shù)據(jù)挖掘的商務(wù)應(yīng)用對(duì)數(shù)據(jù)挖掘進(jìn)行了介紹;Fayyad等[8]介紹了數(shù)據(jù)挖掘以及如何將數(shù)據(jù)挖掘與整個(gè)知識(shí)發(fā)現(xiàn)過程協(xié)調(diào);Lambert[9]考察統(tǒng)計(jì)學(xué)在大型數(shù)據(jù)集上的應(yīng)用,并對(duì)數(shù)據(jù)挖掘與統(tǒng)計(jì)學(xué)各自的角色提出一些評(píng)論;Glymour等[10]考慮統(tǒng)計(jì)學(xué)可能為數(shù)據(jù)挖掘提供的教訓(xùn);Smyth等[11]討論諸如數(shù)據(jù)流、圖形和文本等新的數(shù)據(jù)類型和應(yīng)用如何推動(dòng)數(shù)據(jù)挖掘演變。在數(shù)據(jù)挖掘的應(yīng)用方面,數(shù)據(jù)挖掘技術(shù)使得KDD商業(yè)軟件工具不斷完善和發(fā)展,使得KDD更注重建立解決問題的整體系統(tǒng),而不是孤立的過程。數(shù)據(jù)挖掘的用戶主要集中在大型銀行、保險(xiǎn)公司、電信公司和銷售業(yè)。國外很多計(jì)算機(jī)公司非常重視數(shù)據(jù)挖掘的開發(fā)應(yīng)用,IBM和微軟都成立了相應(yīng)的研究中心進(jìn)行這方面的工作,此外,一些公司的相關(guān)軟件也開始在國內(nèi)銷售,如Platinum、BO以及IBM[12]。2.CRM研究現(xiàn)狀客戶關(guān)系管理(CRM)的理論基礎(chǔ)來源于西方的市場(chǎng)營銷理論,它是在關(guān)系營銷和數(shù)據(jù)庫營銷基礎(chǔ)上誕生的一種全新的管理模式。和客戶關(guān)系管理相關(guān)聯(lián)最早的理論應(yīng)該算是20世紀(jì)80年代初的“接觸管理”(ContactManagement),即專門收集整理客戶與公司聯(lián)系的所有信息。到20世紀(jì)90年代初期這一理論則演變成為包括電話服務(wù)中心與支持資料分析的客戶關(guān)懷(CustomerCare),后來又從重視贏得新客戶和處理基礎(chǔ)營銷工作逐漸轉(zhuǎn)移到對(duì)客戶關(guān)系進(jìn)行有效管理的客戶保持工作上來[13]??蛻絷P(guān)系管理這個(gè)名詞首先從北美傳出,但是一般認(rèn)為把客戶關(guān)系管理理論最早概念化的是美國的計(jì)算機(jī)咨詢集團(tuán)——GartnerGroup,該機(jī)構(gòu)在1997年提出:客戶關(guān)系管理就是為企業(yè)提供全方位的管理視角,賦予企業(yè)更完善的客戶交流能力,最大化客戶的收益率[14]。在“客戶關(guān)系管理”被正式提出之后,國外涌現(xiàn)出了很多關(guān)于實(shí)施客戶關(guān)系管理的研究著作。如StanleyA.Brown[15]《Customerrelationshipmanagement:astrategicintheworldofe-business》一書,對(duì)客戶忠誠、客戶關(guān)懷、客戶獲得等客戶戰(zhàn)略問題,網(wǎng)絡(luò)、工作流管理、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等技術(shù)問題進(jìn)行論述。JillDyche[16]所著的《TheCRMhandbook:abusinessguidetocustomerrelationshipmanagement》是一本涉及到客戶關(guān)系管理各個(gè)層面的著作。JoePeppard[17]等提出了基于企業(yè)電子商務(wù)、渠道管理、關(guān)系管理和前后端辦公室整合的客戶關(guān)系管理框架,對(duì)金融服務(wù)業(yè)的客戶關(guān)系管理進(jìn)行了研究。國外很多學(xué)者根據(jù)實(shí)際的經(jīng)驗(yàn),針對(duì)實(shí)施客戶關(guān)系管理的一些問題提出了自己的觀點(diǎn)。這些研究成果對(duì)于成功地實(shí)施客戶關(guān)系管理提供了很好的借鑒經(jīng)驗(yàn)。商業(yè)戰(zhàn)略家和演講家弗列德·威爾斯馬在《客戶聯(lián)盟》中通過對(duì)大量國際上享有盛名的企業(yè)進(jìn)行調(diào)查和細(xì)致研究,全面闡述了被這些成功企業(yè)大量運(yùn)用并被證明是行之有效的新型商業(yè)運(yùn)作模式—客戶聯(lián)盟,同時(shí)對(duì)客戶關(guān)系管理及客戶聯(lián)盟的概念及關(guān)系做了深入的闡述。Lawrence認(rèn)為客戶關(guān)系管理并不只是收集、存儲(chǔ)、處理客戶信息,它應(yīng)該對(duì)客戶服務(wù)進(jìn)行根本性的改變??蛻絷P(guān)系管理需要的是由技術(shù)支持的商業(yè)戰(zhàn)略,而不僅僅是削減營銷成本或與客戶更有效地進(jìn)行交互。實(shí)施客戶關(guān)系管理需要圍繞關(guān)系戰(zhàn)略重新設(shè)計(jì)和分配相關(guān)流程、技術(shù)和人力資源。PaulineA.Wilcox提出,一個(gè)高效的客戶關(guān)系管理戰(zhàn)略需要引入以客戶為中心的企業(yè)文化。3.數(shù)據(jù)挖掘在CRM中的研究現(xiàn)狀目前,學(xué)者們已經(jīng)意識(shí)到客戶是極為重要的商業(yè)資源,隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展并引入到CRM之中,大大提高了企業(yè)CRM系統(tǒng)的運(yùn)作效率。國外一些學(xué)者對(duì)數(shù)據(jù)挖掘在CRM系統(tǒng)中的應(yīng)用作了重要闡述。Tillett.L.Scott[18]認(rèn)為數(shù)據(jù)挖掘優(yōu)化了CRM的服務(wù)功能,可以為客戶服務(wù)提供準(zhǔn)確的參考信息,提高對(duì)客戶事務(wù)處理的能力。AdamRombe[19]認(rèn)為客戶關(guān)系管理為客戶與銀行之間創(chuàng)建了一個(gè)溝通渠道,數(shù)據(jù)挖掘技術(shù)進(jìn)一步優(yōu)化銀行內(nèi)部的業(yè)務(wù)流程,使這一渠道變得更加高效與快捷,并且通過分析客戶得交易行為,更好的了解客戶和保留客戶,挖掘客戶的愛好和興趣,從而以最快的速度響應(yīng)客戶的需求,為客戶提供最優(yōu)質(zhì)的服務(wù),極大地提高客戶的忠誠度。GrothR[20]認(rèn)為集成有數(shù)據(jù)挖掘技術(shù)的營銷輔助工具可以提供高精確度的模式識(shí)別和預(yù)測(cè)功能,使商業(yè)人員有效地策劃和開展?fàn)I銷活動(dòng)。除了研究數(shù)據(jù)挖掘在CRM領(lǐng)域的應(yīng)用之外,外國學(xué)者還研究了數(shù)據(jù)挖掘中的各種規(guī)則(如分類規(guī)則、聚類規(guī)則、關(guān)聯(lián)規(guī)則等)在不同領(lǐng)域的CRM系統(tǒng)中的應(yīng)用。ZengyouHe[21]向我們介紹了數(shù)據(jù)挖掘的概念、算法和應(yīng)用,并將其應(yīng)用到客戶關(guān)系管理之中。接下來IrajMahdavi[22]對(duì)用一種帶自主機(jī)制的聚類算法對(duì)e-CRM上的文檔數(shù)據(jù)進(jìn)行分析,從而設(shè)計(jì)了一種客戶利益導(dǎo)向型的客戶關(guān)系管理模式,然后,IrajMahdavi[23]進(jìn)一步研究,著重研究一種自適應(yīng)的遺傳算法,通過遺傳算法,將客戶數(shù)據(jù)引導(dǎo)到以客戶為中心上來進(jìn)行客戶關(guān)系管理。BeomsooShim[24]研究了關(guān)聯(lián)規(guī)則和序列分析在小規(guī)模電子購物網(wǎng)站的客戶關(guān)系管理中的策略,通過關(guān)聯(lián)規(guī)則對(duì)客戶進(jìn)行分類從而實(shí)施不同的營銷策略。(二)國內(nèi)研究現(xiàn)狀1.數(shù)據(jù)挖掘研究現(xiàn)狀與國外相比,國內(nèi)對(duì)數(shù)據(jù)挖掘的研究起步稍晚且不成熟。1993年國家自然科學(xué)基金首次支持我國在該領(lǐng)域的研究項(xiàng)目。目前,國內(nèi)的許多科研單位和高等院校紛紛開展知識(shí)發(fā)現(xiàn)的基礎(chǔ)理論及其應(yīng)用研究,這些單位包括清華大學(xué)、中科院計(jì)算技術(shù)研究所、空軍第三研究所、海軍裝備論證中心等。其中,北京系統(tǒng)工程研究所對(duì)模糊方法在知識(shí)發(fā)現(xiàn)中的應(yīng)用進(jìn)行了較深入的研究,北京大學(xué)也在開展對(duì)數(shù)據(jù)立方體代數(shù)的研究,華中理工大學(xué)、復(fù)旦大學(xué)、浙江大學(xué)、中國科技大學(xué)、中科院數(shù)學(xué)研究所、吉林大學(xué)等單位開展了對(duì)關(guān)聯(lián)規(guī)則開采算法的優(yōu)化和改造;南京大學(xué)、四川聯(lián)合大學(xué)和上海交通大學(xué)等單位探討、研究了非結(jié)構(gòu)化數(shù)據(jù)的知識(shí)發(fā)現(xiàn)以及Web數(shù)據(jù)挖掘。除了這些學(xué)校和科研機(jī)構(gòu)之外,我國的一些研究者也對(duì)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的展開了研究。王毅凱、張大雷[32]描述了數(shù)據(jù)挖掘技術(shù)的概念,然后對(duì)數(shù)據(jù)挖掘系統(tǒng)的構(gòu)成和數(shù)據(jù)挖掘的流程進(jìn)行了介紹,最后詳細(xì)分析了數(shù)據(jù)挖掘的常用方法。蔡雅琳[33]對(duì)數(shù)據(jù)庫中數(shù)據(jù)挖掘技術(shù)包括數(shù)據(jù)挖掘技術(shù)的產(chǎn)生背景、應(yīng)用領(lǐng)域、分類及主要挖掘技術(shù)作了概述,還從模式識(shí)別的角度討論了數(shù)據(jù)挖掘技術(shù)的重要任務(wù),包括分類、回歸、聚類和關(guān)聯(lián)等4種模式的識(shí)別;列舉了當(dāng)前數(shù)據(jù)挖掘技術(shù)的實(shí)際應(yīng)用并指出今后的發(fā)展趨勢(shì)。唐笑林[34]論述了數(shù)據(jù)挖掘的概念、算法、實(shí)際的挖掘過程,分析了C5.0決策樹算法。張雪松、毛云龍、檀竹南[35]總結(jié)并評(píng)價(jià)了國內(nèi)外數(shù)據(jù)挖掘技術(shù)的發(fā)展現(xiàn)狀,對(duì)各個(gè)領(lǐng)域的數(shù)據(jù)挖掘技術(shù)應(yīng)用進(jìn)行了系統(tǒng)的評(píng)價(jià)與綜述。劉明亮、李雄飛、孫濤、許曉晴[36]在將數(shù)據(jù)挖掘標(biāo)準(zhǔn)劃分為過程標(biāo)準(zhǔn)、接口標(biāo)準(zhǔn)、語言標(biāo)準(zhǔn)和Web標(biāo)準(zhǔn)等四類進(jìn)行分析介紹后,給出一個(gè)綜合多種標(biāo)準(zhǔn)的應(yīng)用程序框架,最后總結(jié)出數(shù)據(jù)挖掘標(biāo)準(zhǔn)化領(lǐng)域面臨的問題和挑戰(zhàn),并對(duì)發(fā)展趨勢(shì)予以展望。王銳、馬德濤、陳晨[37]論述了數(shù)據(jù)挖掘的主要方法以及對(duì)數(shù)據(jù)挖掘在國民經(jīng)濟(jì)和軍事領(lǐng)域的應(yīng)用作了介紹。2.CRM研究現(xiàn)狀我國最初客戶關(guān)系管理(CRM)是由國外的IT廠商基于軟件的使用而引入的。1999年8月6日,朗訊科技公司商業(yè)通訊系統(tǒng)部在北京舉辦了以“營造完美電信呼叫中心”為主題的研討會(huì),介紹了其全新的客戶關(guān)系管理解決方案,并強(qiáng)調(diào)指出,商業(yè)部門必須著眼于客戶關(guān)系,提供獨(dú)具特色的個(gè)性化服務(wù),才能在網(wǎng)絡(luò)時(shí)代中立于不敗之地。國外先進(jìn)管理理念的傳入和信息時(shí)代的到來,為我國客戶關(guān)系管理研究奠定了理論基礎(chǔ)和技術(shù)支持??蛻絷P(guān)系管理是在關(guān)系營銷等理論基礎(chǔ)上進(jìn)一步發(fā)展起來的,它綜合運(yùn)用數(shù)據(jù)庫、網(wǎng)絡(luò)、圖形圖像、媒體、人工智能等技術(shù),整合先進(jìn)的管理思想、業(yè)務(wù)流程及信息技術(shù)于一體,構(gòu)筑出現(xiàn)實(shí)信息平臺(tái)的一種管理系統(tǒng)。我國的一些研究者也對(duì)客戶關(guān)系管理展開了研究。陳旭[25]研究了客戶關(guān)系管理的內(nèi)涵和管理思想,分析了客戶關(guān)系管理的主要功能,辨析了客戶關(guān)系管理與SCM和ERP的關(guān)系,討論了客戶關(guān)系管理的發(fā)展趨勢(shì)。成棟、宋遠(yuǎn)方[26]在研究當(dāng)前各種客戶關(guān)系管理的管理理論的基礎(chǔ)上提出了客戶關(guān)系管理的理論框架體系,以澄清客戶關(guān)系管理與其他管理理論的關(guān)系。周權(quán)[27]認(rèn)為傳統(tǒng)企業(yè)的銷售、市場(chǎng)、客戶服務(wù)及技術(shù)支持等部門的工作很多都是獨(dú)立和垂立進(jìn)行的,各部門的溝通存在障礙,客戶關(guān)系管理能夠解決上述的問硯。他主要介紹客戶關(guān)系管理的概念、體系以及分析型客戶關(guān)系管理的概念、特點(diǎn)、利弊問題的研究,重點(diǎn)立足于其業(yè)內(nèi)一般性定義的分析型客戶關(guān)系管理的利弊問題進(jìn)行探討。謝良安[28]提出實(shí)施客戶關(guān)系管理的策略包括以客戶為中心的商業(yè)戰(zhàn)略、企業(yè)文化建設(shè)、利用信息技術(shù)對(duì)企業(yè)的業(yè)務(wù)流程進(jìn)行重組。黃中實(shí)[29]認(rèn)為實(shí)施客戶關(guān)系管理的主要步驟包括擬定客戶關(guān)系管理目標(biāo)和實(shí)施路線,構(gòu)建客戶智能平臺(tái),構(gòu)建客戶交互平臺(tái),重新設(shè)計(jì)工作流程,績效的分析與衡量。魯江、熊燕[30]認(rèn)為實(shí)施客戶關(guān)系管理的關(guān)鍵因素包括:企業(yè)全體員工的營銷理念的更新,企業(yè)高層管理的大力支持,組織的再造和業(yè)務(wù)流程的重構(gòu)。孫國輝[31]提出,客戶關(guān)系管理項(xiàng)目應(yīng)該是由業(yè)務(wù)驅(qū)動(dòng),選擇合適的中國軟件企業(yè)實(shí)施客戶關(guān)系管理需要解決信息流、貨幣流、物流、服務(wù)、產(chǎn)品、組織機(jī)構(gòu)等幾個(gè)方面的問題。3.數(shù)據(jù)挖掘在CRM中的研究現(xiàn)狀 在中國,將數(shù)據(jù)挖掘引入到CRM中進(jìn)行研究并不久,但是,卻在這個(gè)領(lǐng)域出來了很多的研究成果。魏曉云[38]將數(shù)據(jù)挖掘技術(shù)引入到CRM系統(tǒng)中,充分闡述了數(shù)據(jù)挖掘的原理以及具體聚類和分類算法的應(yīng)用的思路。易珺[39]將數(shù)據(jù)挖掘技術(shù)應(yīng)用于酒店的CRM系統(tǒng)之中,來提高酒店的競(jìng)爭力。陳建輝[40]具體的提出了一種基于數(shù)據(jù)挖掘的CRM系統(tǒng)的框架,并將其實(shí)現(xiàn)。滕蕾[41]則具體的就聚類規(guī)則在CRM系統(tǒng)中的應(yīng)用進(jìn)行了闡述。三、論文的研究目標(biāo)、內(nèi)容及框架(一)研究內(nèi)容本文的組織結(jié)構(gòu)是按照CRM系統(tǒng)的客戶關(guān)系管理和數(shù)據(jù)挖掘兩大功能模塊的分析,設(shè)計(jì)和實(shí)現(xiàn)的順序進(jìn)行,并對(duì)每個(gè)步驟按照提出問題,解決問題,進(jìn)行驗(yàn)證的方法組織內(nèi)容。闡述了項(xiàng)目中遇到的問題以及解決問題的具體方法和所采用的新技術(shù)。(二)論文結(jié)構(gòu)本論文的總體結(jié)構(gòu)如下:1.介紹了研究背景,課題來源,CRM的發(fā)展現(xiàn)狀,數(shù)據(jù)挖掘的發(fā)展現(xiàn)狀,課題完成的工作以及本論文的組織結(jié)構(gòu)。2.介紹了CRM和數(shù)據(jù)挖掘的理論,并簡單介紹了EDP教育的內(nèi)容以及當(dāng)前的發(fā)展現(xiàn)狀。3.詳細(xì)介紹了福州大學(xué)管理學(xué)院EDP教育中心CRM系統(tǒng)的總體分析以及進(jìn)一步的設(shè)計(jì)。包括CRM系統(tǒng)應(yīng)用,系統(tǒng)架構(gòu),客戶關(guān)系管理模塊的需求分析和核心功能分析,數(shù)據(jù)挖掘模塊的基本介紹和核心功能介紹。4.詳細(xì)闡述了CRM客戶關(guān)系管理數(shù)據(jù)挖掘的設(shè)計(jì)和實(shí)現(xiàn),包括模塊功能結(jié)構(gòu),模塊流程設(shè)計(jì),以及實(shí)現(xiàn)技術(shù)。5.詳細(xì)闡述了CRM數(shù)據(jù)挖掘模塊的設(shè)計(jì)和實(shí)現(xiàn),介紹了模塊的實(shí)現(xiàn)描述,包括模塊的實(shí)現(xiàn)流程,采用技術(shù),并對(duì)銷售分析模塊的應(yīng)用進(jìn)行分析,研究了如何進(jìn)行銷售分析建模,來更好地指導(dǎo)市場(chǎng)營銷活動(dòng)方案。6.總結(jié)本論文并展望未來CRM的發(fā)展。第二章相關(guān)理論綜述一、客戶關(guān)系管理理論(一)CRM的產(chǎn)生發(fā)展隨著信息技術(shù)的發(fā)展和網(wǎng)絡(luò)化經(jīng)濟(jì)的快速進(jìn)步,傳統(tǒng)的商業(yè)模式發(fā)生了根本性的變化。在很多行業(yè),所提供的產(chǎn)品和服務(wù)日益商品化,產(chǎn)品的同質(zhì)化傾向越來越強(qiáng),獨(dú)特的競(jìng)爭優(yōu)勢(shì)越來越難以獲得,業(yè)務(wù)比以前更具競(jìng)爭性。與此同時(shí),客戶的期望也在快速變化。由于計(jì)算機(jī)、通訊技術(shù)和網(wǎng)絡(luò)的飛速發(fā)展,客戶完全可以控制要選擇誰、何時(shí)選擇和如何選擇,客戶選擇擺脫了傳統(tǒng)地理關(guān)系的限制,變成了“點(diǎn)擊鼠標(biāo)的一瞬間”;客戶對(duì)隨時(shí)隨地得到服務(wù)的要求更高,對(duì)質(zhì)量、個(gè)性化和價(jià)值的要求更挑剔。在這種環(huán)境下,客戶的親和力和忠誠度是取得成功的重要因素,建立和維持客戶關(guān)系成為企業(yè)取得競(jìng)爭優(yōu)勢(shì)的最重要的基礎(chǔ)。據(jù)統(tǒng)計(jì),93%的CEO認(rèn)為客戶關(guān)系管理是企業(yè)成功和更有競(jìng)爭能力的重要因素,2/3的客戶離開其供應(yīng)商是因?yàn)榭蛻絷P(guān)懷不夠,一個(gè)非常滿意的客戶其購買意愿將六倍于一個(gè)滿意的客戶,在客戶滿意度方而的5%的提高將使企業(yè)利潤加倍。為了提高客戶滿意度,企業(yè)必須完整掌握客戶信息,準(zhǔn)確把握客戶要求,快速響應(yīng)個(gè)性化需求,提供便捷的購買渠道、良好的售后服務(wù)與經(jīng)常性的客戶關(guān)懷等。而在傳統(tǒng)的客戶關(guān)系管理(CustomerRelationshipManagement,簡稱CRM)中,來自銷售、客戶服務(wù)、市場(chǎng)、制造、庫存等部門的信息分散在企業(yè)內(nèi),客戶信息的分散性和片段性使得無法對(duì)客戶有全而的了解,就是在同一個(gè)企業(yè)內(nèi)部對(duì)客戶的定義和理解也極不相同,各部門難以在統(tǒng)一的信息的基礎(chǔ)上面對(duì)客戶。這種客戶信息的分散性和片段性對(duì)企業(yè)的經(jīng)營活動(dòng)造成了極大的困擾,浪費(fèi)了很多的資源,失去了很多的機(jī)會(huì),在市場(chǎng)競(jìng)爭中處于不利的地位。加強(qiáng)對(duì)客戶關(guān)系管理的研究具有重要意義。在我國,許多企業(yè)的內(nèi)部管理混亂和隨意,有的企業(yè)脫胎于過去的“計(jì)劃經(jīng)濟(jì)”,連市場(chǎng)營銷、公共關(guān)系、細(xì)分市場(chǎng)等都是新名詞,如何在客戶數(shù)據(jù)中分析購買習(xí)慣,針對(duì)不同的客戶進(jìn)行不同的營銷策略,企業(yè)沒有積累經(jīng)驗(yàn);自動(dòng)銷售系統(tǒng)在我國還沒有普及,我國企業(yè)中真正運(yùn)用CTI而不僅僅是電話交換系統(tǒng)的呼叫中心屈指可數(shù),網(wǎng)上商城則尚在萌芽階段。要在手工操作的基礎(chǔ)上一步達(dá)到多渠道和客戶進(jìn)行友好持續(xù)交流的目的,非常有挑戰(zhàn)性。另一方面,我國企業(yè)的這種跨越式的發(fā)展和飛躍也能少走彎路,充分發(fā)揮我國企業(yè)的后發(fā)優(yōu)勢(shì),在CRM整體設(shè)計(jì)、多系統(tǒng)兼容和接口問題等方面我國會(huì)比比國外企業(yè)容易。技術(shù)發(fā)展與現(xiàn)實(shí)需要的反差,是我國企業(yè)發(fā)展的現(xiàn)狀與競(jìng)爭環(huán)境的挑戰(zhàn),使加強(qiáng)CRM研究成為具有重要的理論、現(xiàn)實(shí)意義和緊迫性的課題(二)CRM的定義目前對(duì)CRM的定義有很多,但總的來說,CRM實(shí)際上是一種以客戶為中心的管理機(jī)制和經(jīng)營戰(zhàn)略,它以信息技術(shù)為手段,對(duì)業(yè)務(wù)功能進(jìn)行重新設(shè)計(jì),并且對(duì)工作流程進(jìn)行重組,提高客戶滿意度,從而最終達(dá)到企業(yè)利潤最大化。它所強(qiáng)調(diào)的是客戶價(jià)值,要充分利用以客戶為中心的各種資源,采用先進(jìn)的數(shù)據(jù)庫和其他信息技術(shù)來獲取客戶數(shù)據(jù),從而有針對(duì)性地為顧客提供產(chǎn)品或服務(wù)。由此可知,客戶關(guān)系管理實(shí)際上包含了3個(gè)方面的含義:a.CRM首先是一種管理理念。其核心思想是將企業(yè)的客戶(最終客戶、分銷商、和合作伙伴)作為最重要的企業(yè)資源,通過完善的客戶服務(wù)和深人的客戶分析來滿足客戶的需求。b.CRM也是一種旨在改善企業(yè)和客戶之間關(guān)系的新型管理機(jī)制。是企業(yè)戰(zhàn)略的一種,它實(shí)施于企業(yè)的市場(chǎng)營銷、銷售、客戶與技術(shù)支持等與客戶相關(guān)的領(lǐng)域,以使企業(yè)更好地圍繞顧客行為來有效地管理自己的經(jīng)營。c.CRM又是一種管理軟件和技術(shù)。它將最佳的商業(yè)實(shí)踐與數(shù)據(jù)挖掘、數(shù)據(jù)倉庫、一對(duì)一營銷、銷售自動(dòng)化以及其他信息技術(shù)緊密結(jié)合在一起,為企業(yè)的銷售、客戶服務(wù)和決策支持等領(lǐng)域提供一個(gè)業(yè)務(wù)自動(dòng)化的解決方案。(三)CRM的分類目前的CRM產(chǎn)品按照功能可分為3類:操作型、分析型和協(xié)作型。1.操作型操作型CRM主要設(shè)計(jì)目的是讓銷售、營銷、客戶服務(wù)、技術(shù)支持等部門的業(yè)務(wù)人員在日常工作中能夠共享客戶資源,減少信息流動(dòng)滯留點(diǎn),同時(shí)具有一定的分析能力。很容易通過多個(gè)渠道快速、全面的獲得客戶的信息,以及相關(guān)的聯(lián)系等,使得與客戶的聯(lián)系變得連續(xù),呈現(xiàn)給客戶的信息一致。2.分析型分析型CRM主要利用大量的客戶數(shù)據(jù),從中提取有用的信息進(jìn)行分析,以及對(duì)將來的趨勢(shì)做出預(yù)測(cè),協(xié)助企業(yè)制定市場(chǎng)計(jì)劃和發(fā)展方向。3.協(xié)作型協(xié)作型CRM是指能夠讓企業(yè)銷售、客戶服務(wù)人員同客戶一起完成某項(xiàng)活動(dòng)。協(xié)作型目前主要應(yīng)用于呼叫中心(CallCenter)、多渠道聯(lián)絡(luò)中心、幫助臺(tái)、以及自助服務(wù)幫助導(dǎo)航等。二、數(shù)據(jù)挖掘理論(一)數(shù)據(jù)挖掘的定義數(shù)據(jù)挖掘(DataMining),也叫數(shù)據(jù)開采,數(shù)據(jù)采掘等,是按照既定的業(yè)務(wù)目標(biāo)從海量數(shù)據(jù)中提取出潛在、有效并能被人理解的模式的高級(jí)處理過程。在較淺的層次上,它利用現(xiàn)有數(shù)據(jù)庫管理系統(tǒng)的查詢、檢索及報(bào)表功能,與多維分析、統(tǒng)計(jì)分析方法相結(jié)合,進(jìn)行聯(lián)機(jī)分析處理(OLAP),從而得出可供決策參考的統(tǒng)計(jì)分析數(shù)據(jù)。在深層次上,則是從數(shù)據(jù)庫中發(fā)現(xiàn)前所未有的、隱含的知識(shí),OLAP的出現(xiàn)早于數(shù)據(jù)挖掘,它們都是從數(shù)據(jù)庫中抽取有用信息的方法,就決策支持的需要而言兩者是相輔相成的。OLAP可以看作一種廣義的數(shù)據(jù)挖掘方法,它旨在簡化和支持聯(lián)機(jī)分析,而數(shù)據(jù)挖掘的目的是便這一過程盡可能自動(dòng)化。數(shù)據(jù)挖掘基于的數(shù)據(jù)庫類型主要有:關(guān)系型數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、事務(wù)數(shù)據(jù)庫、演繹數(shù)據(jù)庫、時(shí)態(tài)數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、主動(dòng)數(shù)據(jù)庫、空間數(shù)據(jù)庫、遺留數(shù)據(jù)庫、異質(zhì)數(shù)據(jù)庫、文本型、Internet信息庫以及新興的數(shù)據(jù)倉庫(DateWarehouse)等。而挖掘后獲得的知識(shí)包括關(guān)聯(lián)規(guī)則、特征規(guī)則、區(qū)分規(guī)則、分類規(guī)則、總結(jié)規(guī)則、偏差規(guī)則、聚類規(guī)則、模式分析及趨勢(shì)分析等。(二)數(shù)據(jù)挖掘的模式1.分類模式(Classification)分類就是構(gòu)造一個(gè)分類函數(shù)(分類模型),把具有某些特征的數(shù)據(jù)項(xiàng)映射到某個(gè)給定的類別上。該過程由兩步構(gòu)成:模型創(chuàng)建和模型使用.模型創(chuàng)建是指通過對(duì)訓(xùn)練數(shù)據(jù)集的學(xué)習(xí)來建立分類模型;模型使用是指使用分類模型對(duì)測(cè)試數(shù)據(jù)和新的數(shù)據(jù)進(jìn)行分類。其中的訓(xùn)練數(shù)據(jù)集是帶有類標(biāo)號(hào)的,也就是說在分類之前,要?jiǎng)澐值念悇e是己經(jīng)確定的。通常分類模型是以分類規(guī)則、決策樹或數(shù)學(xué)表達(dá)式的形式給出的。2.聚類模式(Clustering)聚類就是將數(shù)據(jù)項(xiàng)分組成多個(gè)類或簇,類之間的數(shù)據(jù)差別應(yīng)盡可能大,類內(nèi)的數(shù)據(jù)差別應(yīng)盡可能小,即為“最小化類間的相似性,最大化類內(nèi)的相似性”,原則。與分類模式不同的是,聚類中要?jiǎng)澐值念悇e是未知的,它是一種不依賴于預(yù)先定義的類和帶類標(biāo)號(hào)的訓(xùn)練數(shù)據(jù)集的非監(jiān)督學(xué)習(xí)(unsupervisedlearning),無需背景知識(shí),其中類的數(shù)量由系統(tǒng)按照某種性能指標(biāo)自動(dòng)確定。3.回歸模式(Regression)回歸模式的函數(shù)定義與分類模式相似,主要差別在于分類模式采用離散預(yù)測(cè)值(例如類標(biāo)號(hào)),而回歸模式采用連續(xù)的預(yù)測(cè)值。在這種觀點(diǎn)下,分類和回歸都是預(yù)測(cè)問題,但在數(shù)據(jù)挖掘業(yè)界,大家普遍認(rèn)為:用預(yù)測(cè)法預(yù)測(cè)類標(biāo)號(hào)為分類,預(yù)測(cè)連續(xù)值(例如使用回歸方法)為預(yù)測(cè)。許多問題可以用線性回歸解決,對(duì)于許多非線性問題可以通過對(duì)變量進(jìn)行變換,從而轉(zhuǎn)換為線性問題來解決。4.關(guān)聯(lián)模式(Association)關(guān)聯(lián)分析用于發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有意義的關(guān)聯(lián)或相互關(guān)系,尋找給定數(shù)據(jù)集中數(shù)據(jù)項(xiàng)之間的有趣聯(lián)系。關(guān)聯(lián)規(guī)則的支持度和置信度是兩個(gè)規(guī)則興趣度的度量標(biāo)準(zhǔn),它們分別反映發(fā)現(xiàn)規(guī)則的有用性和確定性。5.序列模式(Sequential)實(shí)時(shí)狀態(tài)數(shù)據(jù)的存在需要在數(shù)據(jù)挖掘過程中加入時(shí)間因素。序列模式分析主要是通過對(duì)歷史事件中頻繁發(fā)生的事件序列進(jìn)行分析,形成預(yù)測(cè)模式.來對(duì)未來行為進(jìn)行預(yù)測(cè)。6.偏差模式(Deviation)數(shù)據(jù)庫中可能包含一些數(shù)據(jù)對(duì)象與大部分?jǐn)?shù)據(jù)對(duì)象的一般行為或模式不一致,這些不一致的數(shù)據(jù)就成為孤立點(diǎn)。大部分?jǐn)?shù)據(jù)挖掘方法將孤立點(diǎn)視為噪聲或異常數(shù)據(jù)丟掉,然而在一些應(yīng)用中,罕見的事件可能比正常的事件包含更多潛在有用的知識(shí)。由此可見,從數(shù)據(jù)集合中檢測(cè)這些孤立點(diǎn)并加以分析是十分有意義的。數(shù)據(jù)演變分析描述行為隨時(shí)間變化的對(duì)象的規(guī)律或趨勢(shì)。它包括趨勢(shì)分析、相似性查找和周期性模式分析等方面。(三)數(shù)據(jù)挖掘的過程數(shù)據(jù)挖掘是一個(gè)完整的、反復(fù)的人機(jī)交互處理過程,該過程需要經(jīng)歷多個(gè)相互聯(lián)系的步驟。而且因?yàn)閼?yīng)用領(lǐng)域的分析目標(biāo)需求不同,以及數(shù)據(jù)來源和含義的不同,其中的步驟也不會(huì)完全一樣。一般來說,數(shù)據(jù)挖掘的過程主要包含五個(gè)階段:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、轉(zhuǎn)換模型及模式評(píng)價(jià)。1.數(shù)據(jù)準(zhǔn)備數(shù)據(jù)是數(shù)據(jù)挖掘工作成功與否的基礎(chǔ)。要進(jìn)行數(shù)據(jù)挖掘,數(shù)據(jù)準(zhǔn)備階段必不可少。因?yàn)閿?shù)據(jù)挖掘要處理的數(shù)據(jù)來自不同的數(shù)據(jù)源,數(shù)據(jù)量龐大,數(shù)據(jù)結(jié)構(gòu)復(fù)雜,還有大量數(shù)據(jù)重復(fù),并且里面夾雜著空缺數(shù)據(jù)、噪聲數(shù)據(jù)、冗余數(shù)據(jù)等對(duì)數(shù)據(jù)挖掘有負(fù)面影響的數(shù)據(jù)。因此,數(shù)據(jù)準(zhǔn)備在數(shù)據(jù)挖掘過程中起著至關(guān)重要作用,是數(shù)據(jù)挖掘工作的基礎(chǔ)。數(shù)據(jù)準(zhǔn)備主要包含以下三個(gè)方面:1)確定項(xiàng)目目標(biāo),制定挖掘計(jì)劃、2)數(shù)據(jù)收集和獲取、3)數(shù)據(jù)集成。2.數(shù)據(jù)選擇數(shù)據(jù)挖掘通常并不需要使用一個(gè)部門或者用戶所擁有的全部數(shù)據(jù),有些數(shù)據(jù)對(duì)于建立模型和發(fā)掘模式是沒有任何意義的,而且如果數(shù)據(jù)與此挖掘項(xiàng)目的目標(biāo)有所偏差,則還有可能給數(shù)據(jù)挖掘帶來負(fù)面影響,造成挖掘結(jié)果不準(zhǔn)確,模式不可用。數(shù)據(jù)選擇就是在相關(guān)領(lǐng)域?qū)<业闹笇?dǎo)下,數(shù)據(jù)挖掘人員從經(jīng)過集成后的數(shù)據(jù)庫或數(shù)據(jù)倉庫中檢索出與此次挖掘項(xiàng)目任務(wù)相關(guān)的數(shù)據(jù)集合,從而縮小范圍,保證數(shù)據(jù)正確性和語義完整性,避免盲目搜索,從而提高數(shù)據(jù)挖掘的質(zhì)量和效率。3.數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理可以保證數(shù)據(jù)挖掘所需數(shù)據(jù)集合的質(zhì)量。對(duì)于數(shù)據(jù)挖掘來說,數(shù)據(jù)質(zhì)量是一個(gè)關(guān)鍵的問題,因?yàn)槿绻麛?shù)據(jù)挖掘基于的數(shù)據(jù)不準(zhǔn)確,那么挖掘出來的結(jié)果也會(huì)是不準(zhǔn)確的。挖掘基于的原始數(shù)據(jù)是從各個(gè)實(shí)際應(yīng)用系統(tǒng)中獲取的,由于各應(yīng)用系統(tǒng)的數(shù)據(jù)缺乏統(tǒng)一的標(biāo)準(zhǔn)定義,數(shù)據(jù)結(jié)構(gòu)也有較大的差異,因此各系統(tǒng)間的數(shù)據(jù)存在較大的不一致性,往往不能直接拿來使用。面對(duì)這些問題數(shù)據(jù),需要對(duì)收集好數(shù)據(jù)進(jìn)行清理,以使其適用于以后的數(shù)據(jù)處理。4.數(shù)據(jù)挖掘數(shù)據(jù)挖掘就是建立模型解決問題的過程。這是一個(gè)反復(fù)的過程。需要分別考察不同的模型以判斷模型對(duì)相關(guān)問題有效性。先用一部分?jǐn)?shù)據(jù)建立模型,然后再用剩下的數(shù)據(jù)來測(cè)試和驗(yàn)證這個(gè)模型。有時(shí)還有第三個(gè)數(shù)據(jù)集,稱為驗(yàn)證集,因?yàn)闇y(cè)試集可能受模型的特性的影響,這時(shí)需要一個(gè)獨(dú)立的數(shù)據(jù)集來驗(yàn)證模型的準(zhǔn)確性。訓(xùn)練和測(cè)試數(shù)據(jù)挖掘模型需要把數(shù)據(jù)至少分成兩個(gè)部分:一個(gè)用于模型訓(xùn)練,另一個(gè)用于模型測(cè)試。5.轉(zhuǎn)換模型及模式評(píng)價(jià)數(shù)據(jù)挖掘完成之后,必須評(píng)價(jià)得到結(jié)果、解釋模型的價(jià)值。從測(cè)試集中得到的準(zhǔn)確率只對(duì)用于建立模型的數(shù)據(jù)有意義。在實(shí)際應(yīng)用中,需要進(jìn)一步了解錯(cuò)誤的類型和由此帶來的相關(guān)成本。經(jīng)驗(yàn)證有效的模型并不一定是正確的模型。造成這一點(diǎn)的直接原因就是模型建立中隱含的各種假定。因此直接在現(xiàn)實(shí)世界中測(cè)試模型很重要。先在小范圍內(nèi)應(yīng)用,取得測(cè)試數(shù)據(jù)以及測(cè)試結(jié)果,對(duì)模式評(píng)價(jià)通過之后再將模式推廣應(yīng)用。三、EDP教育介紹第三章EDP-CRM系統(tǒng)分析一、背景介紹作者在撰寫碩士論文期間,參加了福州大學(xué)EDP中心CRM系統(tǒng)的研究、設(shè)計(jì)和開發(fā)工作。通過對(duì)系統(tǒng)的設(shè)計(jì)、分析和開發(fā),使我對(duì)CRM系統(tǒng)的總體結(jié)構(gòu)有了一個(gè)較為全面的認(rèn)識(shí)。在系統(tǒng)設(shè)計(jì)和開發(fā)過程中,還將數(shù)據(jù)挖掘技術(shù)與企業(yè)的具體情況相結(jié)合,對(duì)數(shù)據(jù)挖掘在CRM系統(tǒng)實(shí)際應(yīng)用進(jìn)行了的嘗試和探索性的研究。因此,在論文中,我以福州大學(xué)EDP中心的CRM系統(tǒng)為背景,以系統(tǒng)設(shè)計(jì)開發(fā)的具體過程為線索,依次介紹客戶管理管理、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的理論發(fā)展及其它們?cè)谙到y(tǒng)中的實(shí)際應(yīng)用情況。最后在此基礎(chǔ)上,論述了基于數(shù)據(jù)挖掘的EDP-CRM系統(tǒng)的框架體系及實(shí)現(xiàn)。二、EDP-CRM系統(tǒng)可行性分析(一)EDP-CRM客戶信息管理模塊可行性分析1.經(jīng)濟(jì)可行性EDP中心的服務(wù)都是針對(duì)特定領(lǐng)域的客戶,而中心能否良好發(fā)展的關(guān)鍵在于客戶需要的滿足。而實(shí)施CRM系統(tǒng),能夠保證為客戶提供良好的服務(wù),能夠及時(shí)準(zhǔn)確的向客戶提供產(chǎn)品服務(wù)的信息,在發(fā)掘新客戶、保持老客戶、防止老客戶流失等方面都有明顯的效果,而由于EDP中心的特點(diǎn),每增加一名客戶,能夠獲得非常大的經(jīng)濟(jì)效益,因此實(shí)施CRM系統(tǒng)能夠明顯提高企業(yè)的經(jīng)濟(jì)效益。與之相比,雖然實(shí)施CRM系統(tǒng)需要在前期投入一筆軟件開發(fā)與運(yùn)行維護(hù)的成本,但與提高客戶滿意度從而增加的利潤相比只是九牛一毛。因此,福州大學(xué)管理學(xué)院EDP中心實(shí)施客戶關(guān)系管理系統(tǒng)在經(jīng)濟(jì)上完全是可行的。2.技術(shù)可行性進(jìn)入21世紀(jì),信息技術(shù)的不斷進(jìn)步,也進(jìn)一步推進(jìn)了CRM的發(fā)展。計(jì)算機(jī)技術(shù)、通訊技術(shù)、網(wǎng)絡(luò)應(yīng)用技術(shù)使得CRM系統(tǒng)的實(shí)施與應(yīng)用不在僅僅停留在想象階段。而伴隨著企業(yè)信息化水平的提升,辦公自動(dòng)化程度、員工計(jì)算機(jī)應(yīng)用能力也不斷提高,同時(shí)企業(yè)管理方式也相應(yīng)轉(zhuǎn)變,這些都有利于客戶關(guān)系管理的實(shí)施。3.管理可行性福州大學(xué)管理學(xué)院EDP中心由于受所處高校影響,管理理念非常先進(jìn)。中心的管理思想早已成功完成從以產(chǎn)品為中心向以客戶為中心的轉(zhuǎn)變,而管理思想的轉(zhuǎn)變也影響了管理方式的轉(zhuǎn)變。而先進(jìn)的思想將有利于中心工作人員輕松適應(yīng)CRM系統(tǒng)的應(yīng)用。因此發(fā)展CRM的時(shí)機(jī)己經(jīng)成熟,通過CRM對(duì)該企業(yè)的客戶資源進(jìn)行有效的管理,不但會(huì)提高企業(yè)收益,也將進(jìn)一步改變企業(yè)運(yùn)行的戰(zhàn)略思維。(二)EDP-CRM數(shù)據(jù)挖掘模塊可行性分析數(shù)據(jù)挖掘可以從大量數(shù)據(jù)中挖掘隱藏的知識(shí),為決策人員和客戶經(jīng)理提供決策和工作的依據(jù)。對(duì)EDP中心而言,對(duì)中心客戶進(jìn)行數(shù)據(jù)挖掘是可行的,因?yàn)楦V荽髮W(xué)管理學(xué)院EDP中心的客戶資料已達(dá)到了數(shù)據(jù)挖掘所需要的海量;而公司的經(jīng)營者也希望獲得更大的利潤,所以都支持?jǐn)?shù)據(jù)挖掘,希望充分利用現(xiàn)有的數(shù)據(jù),挖掘數(shù)據(jù)背后的知識(shí),提高中心效益;而且公司的信息化建設(shè)比較好,數(shù)據(jù)比較完備,網(wǎng)絡(luò)設(shè)置和員工的計(jì)算機(jī)水平都比較好。三、EDP-CRM系統(tǒng)需求分析需求分析是軟件開發(fā)中的一個(gè)重要的階段,他就是描述系統(tǒng)的需求的過程。分析的根本目的是在系統(tǒng)開發(fā)者與用戶之間建立一種理解和溝通的機(jī)制。(一)主要業(yè)務(wù)分析一個(gè)企業(yè)業(yè)務(wù)流程是系統(tǒng)設(shè)計(jì)的關(guān)鍵,要實(shí)施開發(fā)CRM系統(tǒng),必須確定系統(tǒng)的功能需求,這就必須先了解企業(yè)的業(yè)務(wù)流程,從業(yè)務(wù)流程中分析系統(tǒng)的需求。而EDP-CRM系統(tǒng)的主要業(yè)務(wù)流程如下圖:(二)、業(yè)務(wù)用例業(yè)務(wù)用例是在調(diào)研階段得到的信息基礎(chǔ)上提取的,是從用戶和業(yè)務(wù)的角度來描述系統(tǒng)提供需要執(zhí)行的功能。福州大學(xué)管理學(xué)院EDP中心客戶管理管理系統(tǒng)主要實(shí)現(xiàn)五大功能,其用例圖如下:1.基本信息管理基本信息管理功能是整個(gè)CRM系統(tǒng)的核心模塊,它將所有基礎(chǔ)信息作為連接其余各個(gè)系統(tǒng)模塊的主線,也是CRM系統(tǒng)的主要數(shù)據(jù)來源。主要包括客戶信息管理、產(chǎn)品信息管理、員工信息管理??蛻粜畔⒐芾硎菍?duì)EDP中心的客戶信息進(jìn)行詳細(xì)的管理,主要實(shí)現(xiàn)對(duì)個(gè)人客戶信息管理和對(duì)集團(tuán)客戶信息管理的兩個(gè)子功能。產(chǎn)品信息管理是對(duì)EDP中心的產(chǎn)品信息進(jìn)行詳細(xì)的管理,主要實(shí)現(xiàn)對(duì)集團(tuán)產(chǎn)品和對(duì)個(gè)人產(chǎn)品兩個(gè)子功能。但是這兩個(gè)子功能又可以進(jìn)一步細(xì)分,具體的就是將集團(tuán)產(chǎn)品管理功能繼續(xù)細(xì)分為企業(yè)優(yōu)化咨詢信息管理和集團(tuán)培訓(xùn)信息管理。而個(gè)人產(chǎn)品管理功能又可以繼續(xù)細(xì)分為包括學(xué)位教育信息管理和講座公開課信息管理。員工信息管理是對(duì)EDP中心的員工信息進(jìn)行詳細(xì)的管理,主要實(shí)現(xiàn)對(duì)營銷人員信息管理、對(duì)教師信息進(jìn)行管理和對(duì)教務(wù)人員進(jìn)行管理三個(gè)子功能?;拘畔⒐芾淼男枨髨D如下所示:集團(tuán)客戶信息管理主要是對(duì)以下信息進(jìn)行管理:客戶名稱、性質(zhì)、地址、聯(lián)系人信息、客戶經(jīng)營狀況信息(客戶檔案、客戶戰(zhàn)略發(fā)展、財(cái)務(wù)狀況信息。此外客戶信息還包括客戶與本企業(yè)發(fā)生的業(yè)務(wù)信息、接受本企業(yè)服務(wù)的信息等;個(gè)人客戶信息管理主要是對(duì)以下信息進(jìn)行管理:客戶姓名、年齡、學(xué)歷、性別、職位、所屬單位、地址、手機(jī)、電話、傳真、電子郵箱、身份證號(hào)碼等;咨詢優(yōu)化信息管理主要是對(duì)以下信息進(jìn)行管理:項(xiàng)目名稱、項(xiàng)目起始時(shí)間、項(xiàng)目客戶、優(yōu)化內(nèi)容、價(jià)格等;集團(tuán)培訓(xùn)信息管理主要是對(duì)以下信息進(jìn)行管理:培訓(xùn)名稱、培訓(xùn)起始時(shí)間、培訓(xùn)地點(diǎn)、培訓(xùn)客戶、培訓(xùn)對(duì)象、培訓(xùn)價(jià)格、培訓(xùn)內(nèi)容等;學(xué)位教育信息管理主要是對(duì)以下信息進(jìn)行管理:班級(jí)名稱、價(jià)格、學(xué)制、證書性質(zhì)、課程、授課形式、授課時(shí)間等信息;講座公開課信息管理主要是對(duì)以下信息進(jìn)行管理:講座公開課名稱、講座公開課時(shí)間、講座公開課地點(diǎn)、講座公開課內(nèi)容、講座公開課教師、講座公開課價(jià)格等信息;銷售人員信息管理主要是對(duì)以下信息進(jìn)行管理:員工姓名、年齡、學(xué)歷、性別、職位、家庭地址、手機(jī)、電話、傳真、電子郵箱、身份證號(hào)碼、負(fù)責(zé)產(chǎn)品等;教師信息管理主要是對(duì)以下信息進(jìn)行管理:教師姓名、年齡、性別、職務(wù)、所屬單位、聯(lián)系地址、手機(jī)、電話、傳真、電子郵箱、身份證號(hào)碼、研究領(lǐng)域等;教務(wù)人員信息管理主要是對(duì)以下信息進(jìn)行管理:員工姓名、年齡、學(xué)歷、性別、職位、家庭地址、手機(jī)、電話、傳真、電子郵箱、身份證號(hào)碼、服務(wù)項(xiàng)目等。2.業(yè)務(wù)管理業(yè)務(wù)管理是根據(jù)福州大學(xué)管理學(xué)院EDP中心的業(yè)務(wù)流程,從開發(fā)新客戶開始到產(chǎn)品服務(wù)銷售完畢之間發(fā)生的一系列業(yè)務(wù)的過程,主要記錄這些業(yè)務(wù)的數(shù)據(jù)。主要包括營銷管理、銷售管理、客戶服務(wù)管理、售后管理。該功能模塊是整個(gè)系統(tǒng)的客戶信息收集的渠道。營銷行為管理是用來記錄銷售人員與客戶的一系列接觸過程,分布記錄營銷每個(gè)階段的客戶信息,實(shí)現(xiàn)客戶資源有記錄,保證客戶資源有記錄,保證中心掌握客戶資源。銷售管理可以明細(xì)記錄銷售過程和銷售業(yè)務(wù)信息,并能夠動(dòng)態(tài)的查看銷售狀態(tài),保證銷售過程按計(jì)劃進(jìn)行??蛻舴?wù)管理記錄的是客戶在購買產(chǎn)品后接受產(chǎn)品服務(wù)過程中的一系列數(shù)據(jù),保證了客戶能夠接受良好的服務(wù),并記錄顧客在服務(wù)中的表現(xiàn)。售后管理就是客戶反饋管理,是記錄客戶對(duì)產(chǎn)品質(zhì)量的反饋意見,以及客戶服務(wù)人員對(duì)客戶意見的處理結(jié)果,增加與客戶的交流。業(yè)務(wù)管理與企業(yè)的業(yè)務(wù)流程息息相關(guān),因此我們根據(jù)業(yè)務(wù)流程圖畫出業(yè)務(wù)管理的需求圖如下:營銷管理主要是對(duì)營銷信息的管理,主要記錄的是營銷員工編號(hào)、客戶編號(hào)、營銷時(shí)間、營銷內(nèi)容;銷售管理主要是對(duì)銷售信息的管理,主要記錄的是員工編號(hào)、客戶編號(hào)、產(chǎn)品編號(hào)、銷售時(shí)間;客戶服務(wù)管理主要是對(duì)客戶服務(wù)信息的管理,主要記錄的是員工編號(hào)、教師編號(hào)、客戶編號(hào)、產(chǎn)品編號(hào);售后管理主要是對(duì)售后服務(wù)信息的管理,主要記錄的是員工編號(hào)、客戶編號(hào)、售后服務(wù)時(shí)間、售后服務(wù)內(nèi)容。3.綜合管理流程管理是記錄產(chǎn)品從營銷至售后之間的詳細(xì)流程,從而保證中心的運(yùn)作符合規(guī)定的流程,保證中心合理、安全、有效的運(yùn)行。而費(fèi)用管理是對(duì)公司發(fā)生的業(yè)務(wù)的費(fèi)用管理,保證公司的成本控制在合理范圍以內(nèi)。主要包括營銷流程管理、銷售流程管理、客戶服務(wù)流程管理、售后流程管理和費(fèi)用管理。其需求圖如下所示:4.查詢分析管理查詢分析模塊主要包括綜合查詢、綜合統(tǒng)計(jì)和分析預(yù)測(cè)的功能。綜合查詢能夠?qū)F(xiàn)有數(shù)據(jù)按查詢的條件展示信息,綜合統(tǒng)計(jì)模塊能夠按照條件對(duì)數(shù)據(jù)進(jìn)行簡單操作,進(jìn)行進(jìn)一步統(tǒng)計(jì),而分析預(yù)測(cè)模塊根據(jù)要求和分析預(yù)測(cè)模型來對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行分析預(yù)測(cè),通過以上模塊,管理者能對(duì)中心運(yùn)行現(xiàn)狀有清晰的了解,也能進(jìn)一步對(duì)未來可能的發(fā)展有一個(gè)預(yù)測(cè)。該模塊是整個(gè)系統(tǒng)的核心模塊,也是體現(xiàn)數(shù)據(jù)挖掘效果的模塊。通過數(shù)據(jù)的綜合查詢、統(tǒng)計(jì)、分析,發(fā)現(xiàn)數(shù)據(jù)背后潛在的知識(shí),從而達(dá)到輔助決策的目的,實(shí)現(xiàn)CRM系統(tǒng)對(duì)企業(yè)管理和指導(dǎo)功能。該模塊是體現(xiàn)數(shù)據(jù)挖掘功能的模塊,當(dāng)前階段需要的是三個(gè)功能,分別是潛在客戶識(shí)別、潛在客戶分類以及客戶滿意度分析。潛在客戶識(shí)別是通過數(shù)據(jù)挖掘的分類技術(shù)對(duì)當(dāng)前客戶進(jìn)行分析,進(jìn)而得出客戶的特征,用這些客戶特征作為標(biāo)準(zhǔn)來分析潛在客戶;潛在客戶分類是通過數(shù)據(jù)挖掘的聚類技術(shù)將潛在客戶分類,針對(duì)不同類的特點(diǎn)設(shè)計(jì)營銷方式;客戶滿意度分析是通過數(shù)據(jù)挖掘的聚類技術(shù)將影響客戶滿意度的因素進(jìn)行分類,針對(duì)滿意度因素的重要性和當(dāng)前滿意度進(jìn)行有針對(duì)性的改進(jìn)措施。5.系統(tǒng)后臺(tái)管理系統(tǒng)后臺(tái)管理是對(duì)負(fù)責(zé)系統(tǒng)管理和維護(hù)的用戶進(jìn)行授權(quán),對(duì)系統(tǒng)部門進(jìn)行管理;同時(shí)還要保證及時(shí)準(zhǔn)確地對(duì)數(shù)據(jù)進(jìn)行備份、恢復(fù)操作,保證系統(tǒng)安全穩(wěn)定的運(yùn)行;同時(shí)還要記錄系統(tǒng)的更新及版本信息。(二)業(yè)務(wù)用例分析與建模業(yè)務(wù)建模是需求工程中最基礎(chǔ)的階段,也是整個(gè)項(xiàng)目的初始階段。其最主要的目的就是要梳理業(yè)務(wù)的流程,所以要保證需求的技術(shù)無關(guān)性,還要保證需求不要深入細(xì)節(jié)。用例模型描述的是外部執(zhí)行者所理解的系統(tǒng)功能。它的建立是系統(tǒng)開發(fā)者和用戶反復(fù)討論的結(jié)果,表明了開發(fā)者和用戶對(duì)需求規(guī)格達(dá)成的共識(shí)。在需求分析階段,可以用用例來捕獲用戶需求,以描述對(duì)系統(tǒng)感興趣的外部角色及其對(duì)系統(tǒng)的功能要求。1.業(yè)務(wù)主角、業(yè)務(wù)角色業(yè)務(wù)主角:參與處理業(yè)務(wù)的用戶就叫做業(yè)務(wù)主角,在本模型中,業(yè)務(wù)主角主要包括業(yè)務(wù)人員(銷售人員、教師、教務(wù)人員)、管理人員(部門經(jīng)理、高層管理)、系統(tǒng)管理員。業(yè)務(wù)角色:不同參與到系統(tǒng)中的人員所獲得的權(quán)限就是業(yè)務(wù)角色。在企業(yè)中,需要根據(jù)業(yè)務(wù)主角的工作任務(wù)來確定他們的管理權(quán)限,管理權(quán)限主要有瀏覽、查詢、修改、審批等。2.用例視角用例總是從參與者視角出發(fā),將用例表達(dá)出來。通常我們根據(jù)參與者的請(qǐng)求,來確定系統(tǒng)所要執(zhí)行事件的先后順序,從而能夠?yàn)閰⑴c者提供有序、可靠、可觀察、有價(jià)值的結(jié)果。下圖展示了本系統(tǒng)的業(yè)務(wù)用例圖((UseCaseDiagrams),它展示了整個(gè)系統(tǒng)。它的主要目的是幫助開發(fā)者以一種可視化的方式理解系統(tǒng)的功能需求,包括基于基本流程的“角色”(actors)關(guān)系,以及系統(tǒng)內(nèi)用例之間的關(guān)系。第四章、EDP-CRM系統(tǒng)設(shè)計(jì)一、設(shè)計(jì)目標(biāo)隨著客戶的不斷增加,和客戶相關(guān)的信息資料也不斷增加,這就要求更多的人力和物力,才能整理這些龐雜信息資料。而且,為了能夠進(jìn)一步利用現(xiàn)有的信息資源,對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的數(shù)據(jù)挖掘是必然的選擇。但是,顯而易見,如果僅僅依靠以往的人工技術(shù)或者簡單的應(yīng)用office工具的話,這將是一項(xiàng)幾乎不可能的工作。因此,福州大學(xué)管理學(xué)院EDP中心客戶關(guān)系系統(tǒng)的設(shè)計(jì)目標(biāo)首先是解決現(xiàn)有與客戶相關(guān)信息的管理工作,其次在此基礎(chǔ)上能夠運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)現(xiàn)有信息進(jìn)行進(jìn)一步分析。二、EDP-CRM系統(tǒng)功能結(jié)構(gòu)設(shè)計(jì)根據(jù)企業(yè)的組織結(jié)構(gòu)以及上文分析的企業(yè)的需求的功能,并結(jié)合CRM系統(tǒng)的特點(diǎn),我們將福州大學(xué)管理學(xué)院EDP-CRM系統(tǒng)劃分為信息管理模塊、業(yè)務(wù)管理模塊、綜合管理模塊、決策管理模塊以及后臺(tái)管理模塊等五個(gè)模塊。通過這五個(gè)功能模塊主要完成以下功能:客戶信息管理、產(chǎn)品信息管理、員工信息管理、營銷管理、銷售管理、服務(wù)管理、售后管理、流程管理、費(fèi)用管理、查詢決策支持分析、后臺(tái)管理等功能。具體的福州大學(xué)管理學(xué)院EDP-CRM系統(tǒng)功能模塊結(jié)構(gòu)圖如下所示:三、EDP-CRM系統(tǒng)結(jié)構(gòu)設(shè)計(jì)福州大學(xué)管理學(xué)院EDP中心的系統(tǒng)結(jié)構(gòu),主要是兩大部分組成,分別是信息管理和數(shù)據(jù)挖掘。其中,信息管理是數(shù)據(jù)的根本,為EDP中心的運(yùn)營提供保障,也為數(shù)據(jù)挖掘提供數(shù)據(jù)支持;而數(shù)據(jù)挖掘是數(shù)據(jù)的進(jìn)一步升華,是對(duì)數(shù)據(jù)基本功能外的進(jìn)一步開發(fā),挖掘數(shù)據(jù)內(nèi)在的價(jià)值。數(shù)據(jù)挖掘和信息管理兩個(gè)部分的管理如下圖所示:四、EDP-CRM系統(tǒng)平臺(tái)結(jié)構(gòu)設(shè)計(jì)福州大學(xué)管理學(xué)院EDP中心客戶關(guān)系管理系統(tǒng)擬采用Browser/Server平臺(tái)結(jié)構(gòu),由網(wǎng)絡(luò)服務(wù)器平臺(tái)、網(wǎng)絡(luò)數(shù)據(jù)庫平臺(tái)、系統(tǒng)文件和輔助開發(fā)工具組成。網(wǎng)絡(luò)服務(wù)平臺(tái)是Microsoft公司的IIS平臺(tái),網(wǎng)絡(luò)數(shù)據(jù)庫平臺(tái)為Microsoft公司的SQLServer2000數(shù)據(jù)庫平臺(tái),輔助開發(fā)工具選用的是Macromedia公司的可視化網(wǎng)頁編輯工具Dreamweaver8,在這個(gè)平臺(tái)下采用JSP進(jìn)行開發(fā)。五、EDP-CRM系統(tǒng)數(shù)據(jù)庫設(shè)計(jì)六、EDP-CRM系統(tǒng)數(shù)據(jù)倉庫設(shè)計(jì)(一)、概念模型設(shè)計(jì)1.確定系統(tǒng)邊界隨著我國經(jīng)濟(jì)發(fā)展,整個(gè)社會(huì)對(duì)知識(shí)的需求日益增加,尤其是企業(yè)的中高層人員,擁有大量管理經(jīng)驗(yàn)但缺乏相應(yīng)的理論體系的指導(dǎo)。同時(shí),隨著科技水平的告訴發(fā)展,越來越多的高新技術(shù)更快的投入到應(yīng)用,也要求企業(yè)的管理人員需要與之相適應(yīng)的技術(shù)能力和管理能力的支持。因此,近年來EDP高層教育培訓(xùn)越來越受到社會(huì)大眾的關(guān)注,大量企業(yè)中高層精英愿意并開始參與到了EDP的學(xué)習(xí)之中。同時(shí),進(jìn)入新世紀(jì)以來,計(jì)算機(jī)技術(shù)的迅速發(fā)展以及數(shù)據(jù)庫管理系統(tǒng)的廣泛應(yīng)用,使得EDP中心應(yīng)用了許多業(yè)務(wù)系統(tǒng),比如教務(wù)管理系統(tǒng)、辦公自動(dòng)化系統(tǒng)等。這些系統(tǒng)都是面向應(yīng)用和事務(wù)的,它僅僅向管理者提供了進(jìn)行簡單的歸類和匯總的業(yè)務(wù)數(shù)據(jù)。隨著這些系統(tǒng)的運(yùn)行,積累的數(shù)據(jù)越來越多。激增的數(shù)據(jù)背后隱藏著許多重要的信息,管理者們希望能夠?qū)ζ溥M(jìn)行進(jìn)一步的分析,以便更好地發(fā)掘這些數(shù)據(jù)背后的價(jià)值,來提高企業(yè)的效益。目前的數(shù)據(jù)庫系統(tǒng)可以高效地實(shí)現(xiàn)數(shù)據(jù)的錄入、查詢、刪除、查詢等功能,但無法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)來預(yù)測(cè)未來的產(chǎn)品、企業(yè)的發(fā)展趨勢(shì)。缺乏挖掘數(shù)據(jù)的手段,導(dǎo)致了“數(shù)據(jù)爆炸但知識(shí)貧乏”的現(xiàn)象。隨著我國教育體制改革進(jìn)程的不斷推進(jìn),越來越多的高校推出了高層培訓(xùn)的課程服務(wù)。高校高層培訓(xùn)市場(chǎng)的競(jìng)爭愈演愈烈。面對(duì)激烈的市場(chǎng)競(jìng)爭,福州大學(xué)EDP中心為了吸引新顧客、維持老顧客、發(fā)展新業(yè)務(wù)、提高顧客利潤率,需要建立科學(xué)的、適合本身業(yè)務(wù)需求的CRM系統(tǒng)。為了解決這些問題,福州大學(xué)管理學(xué)院EDP中心目前分析的對(duì)象主要是:客戶信息(包括個(gè)人客戶與集團(tuán)客戶)、產(chǎn)品信息(包括集團(tuán)產(chǎn)品與個(gè)人產(chǎn)品)、員工信息(包括教師、營銷人員和教務(wù)人員)。2.確定主題域主題是對(duì)應(yīng)分析領(lǐng)域的分析對(duì)象,對(duì)原有分散的數(shù)據(jù)庫的分析,考慮各級(jí)分析人員的需求,在完成系統(tǒng)邊界劃分的基礎(chǔ)上我們確定福州大學(xué)管理學(xué)院EDP中心的數(shù)據(jù)倉庫的幾個(gè)基本主題。(1)客戶個(gè)人客戶是以個(gè)體為單位向福州大學(xué)管理學(xué)院EDP中心購買服務(wù),一般以提升個(gè)人知識(shí)水平,從而達(dá)到提升自我素質(zhì)的目的的客戶。中心向個(gè)人客戶提供各種學(xué)位班、講座、公開課等服務(wù),從而收取相應(yīng)的費(fèi)用。集團(tuán)客戶是以集團(tuán)為單位向福州大學(xué)管理學(xué)院EDP中心購買服務(wù),一般以滿足集團(tuán)客戶企業(yè)優(yōu)化、內(nèi)部培訓(xùn)目標(biāo),從而使集團(tuán)企業(yè)更好優(yōu)化為目的的客戶。中心想集團(tuán)客戶提供短訓(xùn)班、流程優(yōu)化項(xiàng)目等服務(wù),收取相應(yīng)的費(fèi)用。(2)產(chǎn)品福州大學(xué)管理學(xué)院EDP中心的業(yè)務(wù)就是它所提供的培訓(xùn)項(xiàng)目,它是向企業(yè)中高層認(rèn)識(shí)提供的服務(wù)型產(chǎn)品,通過免費(fèi)、收費(fèi)的不同業(yè)務(wù),能分別起到提高中心知名度和提高中心經(jīng)濟(jì)效益的作用。而中心業(yè)務(wù)是否受歡迎,直接影響到中心各部門的經(jīng)濟(jì)效益。(3)員工當(dāng)前,福州大學(xué)管理學(xué)院EDP中心的員工主要分為教師、教務(wù)人員與銷售人員。在福州大學(xué)管理學(xué)院EDP中心,銷售人員就是負(fù)責(zé)將中心的教育培訓(xùn)服務(wù)介紹給客戶,并與客戶保持聯(lián)系,進(jìn)而達(dá)成客戶購買服務(wù)。他們的目標(biāo)主要是發(fā)展新客戶、維持老客戶并進(jìn)一步挖掘客戶價(jià)值。教師是EDP-CRM系統(tǒng)區(qū)別于其他CRM系統(tǒng)的一個(gè)特殊主題。從本質(zhì)上講,教師是EDP教育培訓(xùn)服務(wù)的生產(chǎn)者,但是在授課過程中又部分承擔(dān)了銷售人員的角色。他們的任務(wù)是將顧客所需的知識(shí)傳授給顧客,從而提高顧客滿意度。教務(wù)人員負(fù)責(zé)對(duì)現(xiàn)有客戶進(jìn)行管理,同時(shí)也是現(xiàn)有客戶接受購買服務(wù)的時(shí)候服務(wù)的提供者之一。同時(shí),教務(wù)人員還承擔(dān)收集顧客在接受服務(wù)時(shí)的數(shù)據(jù),從而為下一步的數(shù)據(jù)分析提供信息支持,進(jìn)一步提高顧客滿意度。(二)、邏輯模型設(shè)計(jì)邏輯模型設(shè)計(jì)是指在數(shù)據(jù)倉庫中如何描述主題。它是對(duì)概念模型設(shè)計(jì)的進(jìn)一步細(xì)化。一般來說,數(shù)據(jù)倉庫都是在現(xiàn)有的關(guān)系型數(shù)據(jù)庫基礎(chǔ)上發(fā)展起來的。所以數(shù)據(jù)倉庫中的數(shù)據(jù)仍然是以數(shù)據(jù)表格的形式進(jìn)行組織的。邏輯模型就是要把不同主題和維的信息映射到數(shù)據(jù)倉庫的具體的表中。這一階段的設(shè)計(jì)主要包括:分析主題和維信息,確定粒度層次劃分;關(guān)系模式的定義。1.分析主題域2.粒度劃分3.星型模型和雪花模型(三)、物理模型設(shè)計(jì)(四)、數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu)七、EDP-CRM系統(tǒng)數(shù)據(jù)挖掘設(shè)計(jì)當(dāng)今社會(huì),企業(yè)間競(jìng)爭越來越激烈,從而導(dǎo)致了客戶關(guān)系越來越重要,客戶關(guān)系已不再是從前那種簡單的用電話、短信或者郵件等方式來增加與客戶的溝通。現(xiàn)在,針對(duì)客戶的決策會(huì)很大程度上影響到企業(yè)原有客戶和潛在客戶的去留,可以決定企業(yè)的成敗。因此,通過分析顧客的信息,經(jīng)客戶信息進(jìn)行數(shù)據(jù)挖掘,發(fā)現(xiàn)數(shù)據(jù)間信息,從而做出正確的決策,對(duì)企業(yè)都顯得至關(guān)重要。事實(shí)上,數(shù)據(jù)挖掘在客戶關(guān)系管理中可以發(fā)揮相當(dāng)巨大的作用,在客戶關(guān)系管理的各個(gè)階段都可以應(yīng)用數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘能夠分析客戶的特點(diǎn),從而將客戶分為不同類型,進(jìn)而提供有針對(duì)性的服務(wù);數(shù)據(jù)挖掘,能夠分析客戶對(duì)產(chǎn)品的不同方面的滿意度,從而進(jìn)一步促進(jìn)企業(yè)改進(jìn)產(chǎn)品,提高客戶的滿意度;企業(yè)可以分析購買某一商品的客戶的特征,從而可以對(duì)具有相同特征的客戶進(jìn)行針對(duì)性的營銷,提高營銷的準(zhǔn)確性。本文著重從數(shù)據(jù)挖掘的角度出發(fā),結(jié)合EDP教育的特點(diǎn),EDP-CRM系統(tǒng)的數(shù)據(jù)信息,主要實(shí)現(xiàn)EDP客戶關(guān)系管理中三個(gè)數(shù)據(jù)挖掘的功能。(一)功能設(shè)計(jì) 數(shù)據(jù)挖掘模塊共設(shè)計(jì)三個(gè)子模塊,分別是潛在客戶識(shí)別、潛在客戶分類以及影響客戶滿意度因素分析。 潛在客戶識(shí)別是通過對(duì)現(xiàn)有客戶的分析,對(duì)現(xiàn)有客戶進(jìn)行分類,并通過數(shù)據(jù)挖掘的分類功能提取客戶分類的規(guī)則,按照規(guī)則對(duì)現(xiàn)有潛在客戶進(jìn)行分析,識(shí)別其中的客戶類別,并針對(duì)不同客戶類別的特點(diǎn)進(jìn)行有針對(duì)性的營銷。 潛在客戶分類是通過對(duì)現(xiàn)有潛在客戶接受的營銷數(shù)據(jù)進(jìn)行分析,通過數(shù)據(jù)挖掘的聚類功能將潛在客戶按照營銷進(jìn)度的不同進(jìn)行聚類,按照聚類后的每個(gè)類的進(jìn)度安排進(jìn)一步的營銷的安排。 客戶滿意度分析是通過調(diào)查問卷,收集影響客戶滿意度的因素,對(duì)影響客戶滿意度的因素進(jìn)行聚類,按照聚類結(jié)果提出相應(yīng)的改進(jìn)措施。(二)EDP-CRM系統(tǒng)的客戶識(shí)別對(duì)于許多企業(yè)來說,新客戶的獲得對(duì)他們是非常重要的,企業(yè)的發(fā)展需要不斷的獲得新的客戶。而對(duì)于EDP培訓(xùn)教育來說,它的教育具有產(chǎn)品服務(wù)周期長、單個(gè)產(chǎn)品價(jià)格高、產(chǎn)品種類少、同產(chǎn)品無法重復(fù)購買的特點(diǎn),因此,不管如何維持老客戶關(guān)系,它的老客戶也會(huì)不斷的流失,所以對(duì)EDP教育來說,獲得新客戶至關(guān)重要??蛻舴诸惞δ艿闹饕獙?duì)象主要是企業(yè)以前沒有關(guān)注到的客戶,由于某些客觀原因或者缺少數(shù)據(jù)支持的主觀推測(cè),企業(yè)并沒有意識(shí)到那些客戶有購買企業(yè)產(chǎn)品的需求。通過數(shù)據(jù)挖掘,能夠幫企業(yè)成功識(shí)別這些具有潛在消費(fèi)能力的客戶群體,從而使?fàn)I銷行為更加有針對(duì)性,從而提高市場(chǎng)活動(dòng)的響應(yīng)率。1.功能實(shí)現(xiàn)流程2.算法選擇及介紹(1)算法選擇分類是數(shù)據(jù)挖掘技術(shù)的一個(gè)重要分支,因此,學(xué)者們份份展開了針對(duì)分類算法的研究,目前存在的主要分類算法有決策樹方法、KNN方法、神經(jīng)網(wǎng)絡(luò)和貝葉斯方法等。本文根據(jù)CRM中的客戶分類挖掘中的要求,選擇以決策樹方法進(jìn)行CRM客戶分類研究,再根據(jù)數(shù)據(jù)的特點(diǎn),選擇經(jīng)典的ID3算法進(jìn)行實(shí)現(xiàn)。(2)ID3算法簡介ID3算法是一種其理論清晰,方法簡單,學(xué)習(xí)能力強(qiáng)的算法,普遍認(rèn)為ID3算法適用于處理大規(guī)模的學(xué)習(xí)問題,一般來說,數(shù)據(jù)庫越大,ID3算法的效果越好,所以,ID3算法已經(jīng)成為了數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)極好范例,在世界上廣為使用,得到極大的關(guān)注。要理解ID3算法,首先要了解信息增益的概念。信息增益基于信息論中的熵的概念。熵是對(duì)事件對(duì)應(yīng)的屬性的不確定性的度量。一個(gè)屬性的熵越大,它蘊(yùn)含的不確定信息越大,越有利于數(shù)據(jù)的分類。因此,ID3算法首先根據(jù)信息增益找出熵最大的因素,然后將數(shù)據(jù)根據(jù)這個(gè)因素分成多個(gè)子集,每個(gè)子集又選擇最熵進(jìn)行劃分,一直進(jìn)行到所有子集僅包含同一類型的數(shù)據(jù)為止。據(jù)此,我們可以獲得一顆決策樹,根據(jù)決策樹,我們可以對(duì)新的樣例進(jìn)行分類。(3)信息增益的計(jì)算設(shè)是個(gè)數(shù)據(jù)樣本的集合。假定類標(biāo)號(hào)屬性具有個(gè)不同值,定義個(gè)不同類。設(shè)是類中的樣本數(shù)量。對(duì)給定的樣本分類所需的期望信息由以下公式給出:(1)其中是任意樣本屬于的概率,一般用來估計(jì)。設(shè)屬性具有個(gè)不同值??梢杂脤傩?將劃分為個(gè)子集,其中包含中這樣一些樣本,他們?cè)?上具有值。如果作為測(cè)試屬性,則這些子集相對(duì)應(yīng)于包含集合的節(jié)點(diǎn)生長出來的分支。設(shè)是子集中類的樣本數(shù)。根據(jù)由劃分成子集的熵由以下公式給出:(2)這里充當(dāng)?shù)?個(gè)子集的權(quán),并且等于子集中的樣本數(shù)除以中的樣本總數(shù)。熵值越小,子集劃分的純度越高。注意,根據(jù)上面給出的期望信息計(jì)算公式,對(duì)于給定的子集,其期望信息由以下公式計(jì)算(3)其中是中樣本屬于類的概率。 由期望信息和熵值可以得到對(duì)應(yīng)的信息增益值。對(duì)于上分支將獲得的信息增益可以由下面的公式得到: (4) ID3算法計(jì)算每個(gè)屬性的信息增益,并選取具有最高增益的屬性作為給定集合的測(cè)試屬性。對(duì)被選取的測(cè)試屬性創(chuàng)建一個(gè)節(jié)點(diǎn),并以該屬性標(biāo)記,對(duì)該屬性的每個(gè)值創(chuàng)建一個(gè)分支,并依此劃分樣本。(三)EDP-CRM系統(tǒng)的客戶分類當(dāng)企業(yè)掌握了足夠多的潛在客戶資源之后,就會(huì)針對(duì)客戶進(jìn)行營銷行為,并會(huì)積累相應(yīng)的營銷數(shù)據(jù)信息。這是,就會(huì)有另一個(gè)困擾管理者的問題,那就是無法區(qū)分潛在客戶之間的區(qū)別,這樣導(dǎo)致的結(jié)果是對(duì)所有潛在客戶采取同樣的措施,這就導(dǎo)致了兩個(gè)問題,首先是營銷成本的提高,其次還會(huì)影響營銷的效果,進(jìn)而降低企業(yè)的效益。通過數(shù)據(jù)挖掘技術(shù),企業(yè)能夠按照他們的需求,將客戶根據(jù)現(xiàn)在的營銷進(jìn)度進(jìn)行分類,將具有相同營銷進(jìn)度的顧客歸為相同的類,對(duì)給定類的客戶根據(jù)這一類的特點(diǎn)制定針對(duì)性強(qiáng)、具有差異化的營銷策略。這樣做不僅能夠降低營銷的規(guī)模,有效的降低營銷的成本;同時(shí),因?yàn)樯婕暗臓I銷策略是完全針對(duì)這一類的特點(diǎn),從而使得營銷策略更加有針對(duì)性,提高營銷的效率。從這兩方面入手,能夠有效降低企業(yè)成本,提高企業(yè)的效益。更進(jìn)一步的,企業(yè)甚至能根據(jù)這些類的特點(diǎn)來設(shè)計(jì)產(chǎn)品服務(wù),從而提高企業(yè)競(jìng)爭力。1.功能實(shí)現(xiàn)流程2.算法選擇及介紹聚類也是數(shù)據(jù)挖掘的重要模塊,聚類算法有很多,其中,K均值算法是聚類分析中一種基本的劃分方法,其理論可靠、算法簡單、收斂速度快、能有效處理大數(shù)據(jù)集,因此被廣泛使用。我們也選用K均值算法作為EDP-CRM系統(tǒng)的聚類算法。但該方法需要實(shí)現(xiàn)確定聚類中心數(shù)量K,而且算法受初始值影響很大,容易收斂于局部最優(yōu)解,所以,我們對(duì)K均值聚類算法進(jìn)行適當(dāng)改進(jìn),提出基于遺傳算法的可變K均值聚類方法,以提高算法的功能。(1)聚類分析的數(shù)學(xué)模型聚類是將樣本數(shù)據(jù)分類到不同的類或者簇的一個(gè)過程,聚類結(jié)果有效性可以通過內(nèi)部驗(yàn)證指標(biāo)和外部驗(yàn)證指標(biāo)進(jìn)行驗(yàn)證[5]。本文選取這些內(nèi)部指標(biāo)中的Calinski-Harabaszindex(簡稱為CHindex)作為聚類的目標(biāo)函數(shù)。設(shè)是給定空間中的有限數(shù)據(jù)集,將個(gè)數(shù)據(jù)樣本按照它們之間的相似度分為類,聚類的內(nèi)部聚合度用類內(nèi)的平方和表示:(1)式中,表示聚類中心:聚類的類外部分離度用類中心到樣本中心的平方和與類數(shù)量的乘積表示:(2)式中,表示所有個(gè)點(diǎn)的中心所以,聚類問題的目標(biāo)函數(shù)是(3)式中,;為屬于第類的樣本個(gè)數(shù);表示樣本屬于第類;;為聚類中心個(gè)數(shù);為樣本數(shù)。對(duì)于聚類問題而言,類內(nèi)聚合度越小越好,而類間相似度越大越好,所以聚類問題的目標(biāo)函數(shù)越大越好。(2)K均值算法簡介k均值算法,又稱為k-平均算法(k-Means),是一種得到最廣泛使用的聚類算法。k均值算法以k為參數(shù),把n個(gè)對(duì)象分為k個(gè)簇,以使得簇內(nèi)具有較高的相似度。相似度的計(jì)算根據(jù)是一個(gè)簇內(nèi)的平均值來進(jìn)行。算法首先隨機(jī)的選擇k個(gè)對(duì)象,每個(gè)對(duì)象初始地代表了一個(gè)簇的平均值或者中心。對(duì)剩余的每個(gè)對(duì)象根據(jù)其余各個(gè)簇中心的距離,將它賦予最近的簇。然后重新計(jì)算每個(gè)簇的平均值。這個(gè)過程不斷重復(fù),直到準(zhǔn)則函數(shù)收斂。k均值算法的準(zhǔn)則函數(shù)定義為即為上節(jié)聚類模型的內(nèi)部聚合度:這個(gè)準(zhǔn)則可以保證生成的結(jié)果簇盡可能的緊湊和獨(dú)立。(3)算法改進(jìn)k均值算法雖然有以上優(yōu)點(diǎn),但是需要事先確定聚類中心數(shù)量k,因此具有先天的限制。本文算法的思想是在:在研究聚類問題時(shí),將K均值算法與遺傳算法結(jié)合,來解決K均值無法求解K值缺點(diǎn)。(1)算法流程Step1.初始種群生成Step2.用K均值算法對(duì)篩選出來的個(gè)體進(jìn)行優(yōu)化,并用優(yōu)化后的個(gè)體取代原來的個(gè)體Step3、對(duì)種群中的個(gè)體進(jìn)行選擇、交叉、變異操作,并在完成后重新計(jì)算K值Step3.重復(fù)步驟Step2和Step3至滿足終止條件(2)染色體編碼設(shè)計(jì)染色體編碼方法很多,在聚類分析中常用基于聚類中心的浮點(diǎn)數(shù)編碼和基于聚類劃分的整數(shù)編碼。由于聚類算法具有多維、量大的特點(diǎn),聚類樣本數(shù)目一般遠(yuǎn)遠(yuǎn)大于聚類數(shù)目,因此本文采用基于聚類中心的浮點(diǎn)數(shù)編碼。染色體結(jié)構(gòu)為,其中K為基因的長度,為隨機(jī)產(chǎn)生的聚類中心個(gè)數(shù),為染色體第位的基因,它有個(gè)維度。,。(3)適應(yīng)度函數(shù)設(shè)計(jì)遺傳算法中的適應(yīng)度函數(shù)是用來評(píng)價(jià)個(gè)體、區(qū)別個(gè)體優(yōu)劣的標(biāo)準(zhǔn)。個(gè)體的適應(yīng)度越高,其存活的概率就越大。本文以聚類的目標(biāo)函數(shù)作為適應(yīng)度函數(shù)。(4)選擇算子設(shè)計(jì)為了保證適應(yīng)度函數(shù)越大的染色體保留到下一代的概率越大,本文采用了遺傳算法中經(jīng)典的輪盤賭選擇算子。該選擇算子具體操作如下:Step1.進(jìn)行K均值操作,更新染色體;Step2.根據(jù)適應(yīng)度函數(shù),計(jì)算當(dāng)前種群染色體的適應(yīng)度,并記錄其中適應(yīng)度最大的個(gè)體;Step3.再根據(jù)個(gè)體的適應(yīng)度值,來計(jì)算各個(gè)體的選擇概率;其中,個(gè)體選擇概率的計(jì)算方法是,為種群規(guī)模,即為聚類目標(biāo)函數(shù)的值,為所有個(gè)體適應(yīng)度的總和。Step4、根據(jù)計(jì)算出的選擇概率,使用輪盤賭法選出個(gè)體。(5)交叉算子設(shè)計(jì)隨機(jī)從種群中選擇對(duì)染色體作為父代,對(duì)每對(duì)染色體,產(chǎn)生隨機(jī)數(shù),當(dāng)時(shí),在兩個(gè)染色體中分別隨機(jī)產(chǎn)生交叉點(diǎn),其中他們的交叉點(diǎn)范圍分別為和,對(duì)交叉點(diǎn)后的基因進(jìn)行交叉運(yùn)算,并重新計(jì)算交叉后的染色體長度,直到所有個(gè)體進(jìn)行過交叉為止。(其中為交叉概率,)。(6)變異算子設(shè)計(jì)對(duì)每一個(gè)個(gè)體,每一個(gè)基因位,產(chǎn)生隨機(jī)數(shù),當(dāng)時(shí),對(duì)該基因位進(jìn)行隨機(jī)變異運(yùn)算,生成下一代種群。(其中為交叉概率)。(7)K均值操作本文的K均值操作,主要是在遺傳算法進(jìn)行到變異之后,在下一次選擇之前進(jìn)行,主要的操作主要有以下兩點(diǎn):Step1.檢查染色體長度,當(dāng)染色體長度大于最大聚類個(gè)數(shù)時(shí),將這條染色體從種群中刪去;Setp2、先以變異并通過檢查后產(chǎn)生的染色體基因?yàn)橹行?進(jìn)行K均值聚類,然后用K均值聚類的結(jié)果來取代原來的染色體中的基因。(8)循環(huán)終止條件循環(huán)代數(shù)開始為0,每進(jìn)行一次循環(huán),代數(shù)加1,若循環(huán)代數(shù)達(dá)到最大循環(huán)代數(shù)時(shí)結(jié)束循環(huán),輸出最后的聚類結(jié)果。(四)EDP-CRM系統(tǒng)的客戶滿意度分析在實(shí)現(xiàn)了潛在客戶發(fā)現(xiàn)與分類功能之后,如何分析和保證現(xiàn)有客戶的滿意度也是一個(gè)對(duì)企業(yè)至關(guān)重要的問題。客戶滿意程度是直接影響到客戶的忠誠度,通過客戶滿意度分析,企業(yè)能夠不斷改進(jìn)影響客戶滿意度的環(huán)節(jié),增加現(xiàn)有客戶忠誠度,也增加自身產(chǎn)品服務(wù)的吸引力。客戶滿意度分析模塊通過對(duì)影響EDP教育服務(wù)客戶滿意度的因素進(jìn)行分析,設(shè)計(jì)適用于EDP教育的客戶滿意度評(píng)價(jià)指標(biāo),并依據(jù)經(jīng)驗(yàn)和專業(yè)知識(shí)選擇適當(dāng)?shù)姆椒ù_定各評(píng)價(jià)指標(biāo)的權(quán)重,通過一定的計(jì)算方法來獲得客戶對(duì)培訓(xùn)服務(wù)的滿意情況,然后對(duì)客戶滿意度進(jìn)行綜合分析,調(diào)整響應(yīng)的客戶策略,使酒店有針對(duì)性的改善硬件產(chǎn)品和服務(wù)質(zhì)量,從而提高客戶的滿意度,促進(jìn)改善客戶關(guān)系。1.功能實(shí)現(xiàn)流程客戶滿意度就是反映的是客戶滿意的程度,屬于心理范疇,無法直接從客戶信息數(shù)據(jù)庫中獲得。因此,本文采用建立客戶滿意度評(píng)價(jià)指標(biāo)體系,對(duì)客戶進(jìn)行問卷調(diào)查的方式來衡量客戶的滿意度。調(diào)查研究工作主要分為以下步驟:確定研究的主要目標(biāo)和研究對(duì)象;根據(jù)調(diào)研結(jié)果分析影響EDP中心客戶滿意度的主要因素,確定評(píng)價(jià)指標(biāo)并建立滿意度評(píng)價(jià)模型;制定滿意度調(diào)查方案;實(shí)施調(diào)查;收集調(diào)查結(jié)果,將結(jié)果量化;對(duì)客戶滿意度情況進(jìn)行分析,支持EDP中心的決策。具體流程如下圖所示:2.算法選擇與簡介在滿意度分析中,我們也采用k均值聚類的算法對(duì)滿意度進(jìn)行分析,這樣能使計(jì)算的效率更高,具體的算法簡介如上節(jié)所述。第五章EDP-CRM系統(tǒng)架構(gòu)與實(shí)現(xiàn)一、系統(tǒng)開發(fā)二、數(shù)據(jù)挖掘模塊的實(shí)現(xiàn)(一)客戶識(shí)別1.數(shù)據(jù)獲得與處理為了實(shí)現(xiàn)對(duì)客戶分類,必須從現(xiàn)有數(shù)據(jù)中提取每個(gè)客戶的特征信息,而EDP培訓(xùn)教育的客戶涉及不同產(chǎn)業(yè),而且涉及的客戶所處的崗位、所承擔(dān)的工作各不相同,再加上客戶資料收集方式各不相同,因此,客戶的特征信息也五花八門。因此,我們選取客戶的通用特征信息來進(jìn)行分析。福州大學(xué)管理學(xué)院EDP中心從建立以來一直都以客戶為中心,一直關(guān)注于客戶信息的搜集與信息反饋,因此,我們提取了中心306名客戶的信息。為了實(shí)現(xiàn)對(duì)客戶的分類劃分,需要對(duì)客戶各屬性信息進(jìn)行處理,才能交由進(jìn)行相應(yīng)分類操作。(1)屬性選擇首先要對(duì)客戶特征表進(jìn)行屬性選擇,刪除可用其它屬性來代替的屬性,或者有大量的不同取值且無法進(jìn)行量化的客戶屬性。如客戶信息表中的身份證號(hào)碼、手機(jī)電話傳真號(hào)碼、郵箱等,它們的取值太多且雜,往往無法在該取值域內(nèi)進(jìn)行量化操作,所以應(yīng)將其刪除即可得到如下表所示的特征屬性表。編號(hào)性別年齡婚否年收入單位性質(zhì)公司規(guī)模職位學(xué)歷地區(qū)1男53已婚30萬事業(yè)單位600人老師博士福州2女26未婚8萬公務(wù)員50-100人職員本科福州3女44已婚40萬私企100-500人財(cái)務(wù)總監(jiān)中專廈門4男38已婚120萬外企10-50人運(yùn)營總監(jiān)碩士福州5男49離異1000萬上市公司1000人以上總裁大專福州(2)屬性概化對(duì)離散的數(shù)據(jù),我們用屬性概化閥值控制技術(shù)沿屬性概念分層進(jìn)行概化。具體的離散方法如下,我們將客戶文化程度分為0-5六類,分別代表小學(xué)、初中、高中、大學(xué)、碩士、博士;對(duì)于單位類別可以按工作性質(zhì)分為0-2三類,分別代表集體、私人和公職;客戶職位可以分為0-3,分別代表最高管理層、高級(jí)管理層、低級(jí)管理層、普通職員;而客戶性別顯然可分為0-1兩類,分別代表男和女;客戶婚否分為0-2三類,分別代表未婚、已婚以及離婚寡居;至于地區(qū),由于學(xué)校地處福州,主要客戶群在福州,因此我們將其分為0-1兩類,分別代表福州地區(qū)以及福州意外地區(qū)。而對(duì)于連續(xù)的數(shù)據(jù),我們將其按區(qū)間進(jìn)行劃分。表中客戶年齡、年收入等數(shù)據(jù)為連續(xù)型數(shù)據(jù),一般在分類時(shí),系統(tǒng)執(zhí)行離散型數(shù)據(jù)速度較快,因此需要對(duì)連續(xù)型數(shù)據(jù)進(jìn)行離散化處理,根據(jù)數(shù)據(jù)特點(diǎn),我們將客戶年齡分為0-3四類,分別代表20-30歲,30-40歲,40-50歲以及50-60歲;對(duì)于客戶年收入,我們將其分為分別代表0-3四類,分別代表0-10萬、10-100萬、100-1000萬、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論