【《數(shù)據(jù)挖掘相關(guān)理論及技術(shù)概述》2100字】_第1頁
【《數(shù)據(jù)挖掘相關(guān)理論及技術(shù)概述》2100字】_第2頁
【《數(shù)據(jù)挖掘相關(guān)理論及技術(shù)概述》2100字】_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

附錄PAGE5數(shù)據(jù)挖掘相關(guān)理論及技術(shù)概述1.1數(shù)據(jù)挖掘定義數(shù)據(jù)挖掘,英文全稱為DataMining,可基于數(shù)據(jù)庫進行知識要素發(fā)現(xiàn)和數(shù)據(jù)分析,通過大數(shù)據(jù)處理技術(shù)將雜亂無序的數(shù)據(jù)進行整理和處理,然后結(jié)合具體的業(yè)務(wù)需要提取有用的數(shù)據(jù),可實現(xiàn)歷史數(shù)據(jù)的分析和未來數(shù)據(jù)的預(yù)測[22]。1)挖掘目標(biāo)的確立針對特定的數(shù)據(jù)源進行數(shù)據(jù)挖掘前,需要根據(jù)企業(yè)的業(yè)務(wù)需要確定數(shù)據(jù)挖掘的目標(biāo)和計劃,而且數(shù)據(jù)挖掘計劃需要體現(xiàn)在具體的數(shù)據(jù)挖掘內(nèi)容和問題定義過程中,并且形成程序可讀懂的程序語言[23]。2)數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備階段主要從最初的原始數(shù)據(jù)中提取出可用于數(shù)據(jù)挖掘的數(shù)據(jù),實現(xiàn)數(shù)據(jù)的初步篩選,包括從海量的數(shù)據(jù)中選取可能與挖掘?qū)ο笙嚓P(guān)的數(shù)據(jù)表格、數(shù)據(jù)記錄、不同數(shù)據(jù)對象的屬性,并初步實現(xiàn)數(shù)據(jù)的清洗和預(yù)處理[24]。(1)數(shù)據(jù)的選擇:原始的數(shù)據(jù)庫內(nèi)的數(shù)據(jù)量較大,需要對數(shù)據(jù)庫中與挖掘業(yè)務(wù)的相關(guān)數(shù)據(jù)進行初步提取,鎖定數(shù)據(jù)挖掘的范圍。在進行數(shù)據(jù)選擇時,除了考慮數(shù)據(jù)的業(yè)務(wù)關(guān)聯(lián)性外,還需要保證數(shù)據(jù)的質(zhì)量,能夠反映業(yè)務(wù)搜索的實際屬性[25]。(2)數(shù)據(jù)的預(yù)處理:對數(shù)據(jù)的質(zhì)量進行控制,完成冗余數(shù)據(jù)的刪除和數(shù)據(jù)格式的標(biāo)準(zhǔn)化處理。(3)數(shù)據(jù)的轉(zhuǎn)換:將數(shù)據(jù)挖掘范圍內(nèi)待挖掘的數(shù)據(jù)使用統(tǒng)一的格式進行存儲和應(yīng)用,并保證數(shù)據(jù)的有效性[26]。3)數(shù)據(jù)挖掘根據(jù)數(shù)據(jù)挖掘的數(shù)據(jù)源和數(shù)據(jù)挖掘的目標(biāo),對數(shù)據(jù)挖掘應(yīng)用的模型和算法進行對比選擇,然后將待挖掘的數(shù)據(jù)源進行導(dǎo)入,對模型的參數(shù)進行調(diào)整,實時收集數(shù)據(jù)挖掘結(jié)果。此過程是整個數(shù)據(jù)挖掘的核心,需要對模型的參數(shù)進行精準(zhǔn)地設(shè)置,以保證數(shù)據(jù)挖掘的效果最佳,能夠完全提取出數(shù)據(jù)源內(nèi)與業(yè)務(wù)相關(guān)的數(shù)據(jù)。如果數(shù)據(jù)挖掘過程中對數(shù)據(jù)源初步處理的數(shù)據(jù)具有具體的要求,需要重新進行數(shù)據(jù)準(zhǔn)備[27]。4)解釋評價解釋評價過程重要根據(jù)數(shù)據(jù)挖掘目標(biāo)從數(shù)據(jù)挖掘的結(jié)果數(shù)據(jù)中提取符合結(jié)果數(shù)據(jù)評價標(biāo)準(zhǔn)的數(shù)據(jù),以保證數(shù)據(jù)挖掘的質(zhì)量。在進行數(shù)據(jù)應(yīng)用時,需以數(shù)據(jù)挖掘為主要前提,判斷數(shù)據(jù)挖掘的過程是否滿足了企業(yè)業(yè)務(wù)目標(biāo)[28]。5)知識應(yīng)用數(shù)據(jù)挖掘的根本目的是對數(shù)據(jù)進行應(yīng)用。通過應(yīng)用過程中的數(shù)據(jù)使用效果和知識評價情況對數(shù)據(jù)挖掘的模型進行不斷地調(diào)整和分析,將用戶感興趣的知識數(shù)據(jù)推送給客戶,同時客戶可對知識數(shù)據(jù)進行展示和操作[29]。在此過程中,用戶占主導(dǎo)地位,可對數(shù)據(jù)挖掘的效果和質(zhì)量進行綜合分析。1.2數(shù)據(jù)挖掘工具介紹數(shù)據(jù)挖掘是一個數(shù)據(jù)操作和數(shù)據(jù)特征提取的過程,需要數(shù)據(jù)挖掘的工具的參與。數(shù)據(jù)挖掘工具往往具有完整的數(shù)據(jù)挖掘模型和方法,企業(yè)可結(jié)合自身數(shù)據(jù)挖掘需求對工具進行配置,以保證良好的數(shù)據(jù)挖掘效果。選取數(shù)據(jù)挖掘工具時,需要對不同工具的適用性和特點進行充分分析,包括數(shù)據(jù)挖掘的模型類型、模型能力、數(shù)據(jù)的可視化呈現(xiàn)能力、工具的操作性能以及數(shù)據(jù)的存儲能力等[30]。通常情況下,在特定的應(yīng)用場景下需要選擇針對性的數(shù)據(jù)挖掘工具,解決對應(yīng)的業(yè)務(wù)數(shù)據(jù)挖掘問題。不同的數(shù)據(jù)工具的算法往往需要對數(shù)據(jù)具有特殊的要求,需要對初始數(shù)據(jù)進行處理,以保證最終數(shù)據(jù)挖掘結(jié)果的有效性和質(zhì)量[32]。目前市面上常用的數(shù)據(jù)挖掘工具包括以下幾種:(1)SPSSClementine數(shù)據(jù)挖掘工具SPSSClementine是目前應(yīng)用較為廣泛且簡單的常規(guī)數(shù)據(jù)挖掘工具,其功能模塊覆蓋整個數(shù)據(jù)挖掘的過程,實現(xiàn)數(shù)據(jù)的處理、數(shù)據(jù)的轉(zhuǎn)換、數(shù)據(jù)的挖掘、數(shù)據(jù)的評價和應(yīng)用的全生命周期管理[32]。Clementine數(shù)據(jù)挖掘工具在實際應(yīng)用的過程中符合數(shù)據(jù)挖掘行業(yè)標(biāo)準(zhǔn),并提供可視化呈現(xiàn)的方式,并對不同數(shù)據(jù)間的關(guān)系進行描述,提升數(shù)據(jù)挖掘應(yīng)用的效率[33]。(2)SASEnterpriseMiner數(shù)據(jù)挖掘工具SASEnterpriseMiner數(shù)據(jù)挖掘工具通常應(yīng)用與專業(yè)的業(yè)務(wù)場景,可實現(xiàn)數(shù)據(jù)的處理、數(shù)據(jù)的轉(zhuǎn)換、數(shù)據(jù)的挖掘、數(shù)據(jù)的評價和應(yīng)用。通過與捆綁的SAS(StatisticalAnalysisSystem,數(shù)據(jù)分析系統(tǒng))數(shù)據(jù)倉庫進行關(guān)聯(lián),實現(xiàn)OLAP(OnlineAnalyticalProcessing,聯(lián)機分析處理)集成,可實現(xiàn)多維數(shù)據(jù)的應(yīng)用和數(shù)據(jù)集成,提升數(shù)據(jù)挖掘的有效性[34]。參考文獻朱琦,朱正鍵,劉肖.基于聚類分析運營商流量精準(zhǔn)營銷研究[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2019,32(03):39-42.石三平,徐笛,周慧中.5G時代電信運營商公眾市場關(guān)系營銷策略[J].現(xiàn)代商貿(mào)工業(yè),2020,000(014):31-34.成晨,韓玉輝,程新洲,等.基于電信大數(shù)據(jù)的信用卡精準(zhǔn)營銷算法研究及應(yīng)用[J].郵電設(shè)計技術(shù),2019(9):46-48.王顯峰,王衛(wèi),史浩鵬,等.用電側(cè)大數(shù)據(jù)多維聚類挖掘營銷策略與客戶行為趨勢分析模型建構(gòu)[J].中國管理信息化,2020,023(007):76-78.董靈心.重疊營銷對客戶價值持續(xù)創(chuàng)造的影響機制研究[D].北京郵電大學(xué),2019.江明.安徽移動滁州分公司集團客戶市場營銷策略研究[D].安徽大學(xué),2019.KaarC,StaryC.Intelligentbusinesstransformationthroughmarket‐specificvaluenetworkanalysis:Structuredinterventionsandprocessbootstrappingingeomarketing[J].KnowledgeandProcessManagement,2019,26(2):34-37.BoothD.Marketinganalyticsintheageofmachinelearning[J].AppliedMarketingAnalytics,2019,3(4):12-16.BatcHaNaboyinaMR,DevarakondaN.DesignandEvaluationofOutlierDetectionBasedonSemanticCondensedNearestNeighbor[J].JournalofIntelligentSystems,2019,3(4):12-14.ShashishekarMS,AnandS.TheImpactofProficiencyofMarketingActivitiesandValuePropositionInnovationonNewIntelligentProducts'Performance[J].IndianJournalofMarketing,2019,49(12):7.于亞芳,郭磊.JavaEE框架技術(shù)課程建設(shè)研究[J].電腦知識與技術(shù):學(xué)術(shù)交流,2018(7Z):119-121.封琪,王貴鑫.Java技術(shù)框架的發(fā)展及其應(yīng)用[J].黑龍江科技信息,2018,000(009):67-69.宋曉慧.基于JavaWeb的數(shù)據(jù)分析系統(tǒng)的設(shè)計與實現(xiàn)[D].北京郵電大學(xué),2019.封琪,王貴鑫.Java技術(shù)框架的發(fā)展及其應(yīng)用[J].科學(xué)技術(shù)創(chuàng)新,2018(09):67-69.賈飛俠.JavaEE的多層軟件體系架構(gòu)安全研究[J].佳木斯職業(yè)學(xué)院學(xué)報,2017(2):21-23.LoYC,ShuYC.SSHI-basedzeroquiescentpowercontrolfortheelectromagneticenergyharvester[C]//ActiveandPassiveSmartStructuresandIntegratedSystemsXV.2021.JackS,GunnarS.AssessingsocietalimpactofSSHinanengagingworld:focuso

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論