資料探勘(Data Mining)_第1頁
資料探勘(Data Mining)_第2頁
資料探勘(Data Mining)_第3頁
資料探勘(Data Mining)_第4頁
資料探勘(Data Mining)_第5頁
已閱讀5頁,還剩64頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1,資料探勘(Data Mining),2,課程特色,理論與實(shí)務(wù)並重 深入淺出,減少繁雜的學(xué)理性探討,著重觀念及實(shí)際應(yīng)用 以SQL 2005及自行開發(fā)之DMAS 2.0作為實(shí)務(wù)講解工具 提供教學(xué)資源網(wǎng)站 (.tw/data-mining),3,內(nèi)容概要,PART I:基本與進(jìn)階之資料探勘技術(shù) PART II:資料探勘之深入應(yīng)用 PART III:軟體工具和專案實(shí)作 中英對照表 P.S. 書中標(biāo)示*及*的章節(jié)表示選擇性授課單元,如授課時(shí)數(shù)有限時(shí),可略過。,4,授課計(jì)畫(1),PART I 基本與進(jìn)階之資料探勘技術(shù)(38hr40hr) 第一章 簡介(4h

2、r) 第二章資料倉儲(6hr) 第三章 資料前置處理(3hr) 第四章 資料精簡(3hr) 第五章 資料分類法(6hr) 第六章 資料群集分析(6hr) 第七章 關(guān)連法則探勘(6hr) 第八章 時(shí)間序列分析(4hr6hr),5,授課計(jì)畫(2),PART II 資料探勘之深入應(yīng)用 (3hr11hr) 第九章 網(wǎng)頁資料探勘(3hr) 第十章 網(wǎng)路入侵偵測系統(tǒng)(0hr4hr) 第十一章 數(shù)位學(xué)習(xí)(0hr4hr) PART III軟體工具和專案實(shí)作 (4hr7hr) 第十二章 工具介紹 (3hr6hr) 第十三章 案例探討-圖書借閱 (1hr),6,第一章 簡 介,7,為什麼?,8,運(yùn)用探勘技術(shù)從大量

3、資料中挖掘出資料之間的關(guān)連性以及隱藏的知識,要實(shí)現(xiàn)神機(jī)妙算客服系統(tǒng)所提供的個(gè)人化服務(wù),並非遙不可及! 企業(yè)現(xiàn)階段急需運(yùn)用資料探勘技術(shù),輔助決策者在對的時(shí)刻做對的決策! 學(xué)術(shù)界積極培養(yǎng)資料探勘技術(shù)應(yīng)用人才為當(dāng)務(wù)之急!,9,第一章 資料探勘簡介,緣起 何謂資料探勘 資料探勘的演進(jìn) 資料探勘與其他系統(tǒng)的比較 知識發(fā)現(xiàn)的過程 資料探勘常用的技術(shù) 資料探勘的模型 資料探勘的應(yīng)用 資料探勘的工具 資料探勘未來的發(fā)展與挑戰(zhàn),10,資料探勘的目的,從大量資料中挖掘有價(jià)值的資訊,供管 理人員做為決策參考,開創(chuàng)新商業(yè)契機(jī) 成功經(jīng)驗(yàn) 美國超級市場(Wal-Mart) 銷售資料分析發(fā)現(xiàn),尿布和啤酒常會一起購買,於是將

4、商品放在一起促銷,得到意想不到的業(yè)績成長 美國銀行 (Bank of America) 從客戶資料中,找出既有客戶申請貸款的時(shí)機(jī), 規(guī)劃全新行銷方案;該方案推出後,接受率立即 成長兩倍以上,11,資料探勘的應(yīng)用,以類似PC-Home之線上購物商店為例 可獲取之資料 顧客居住地區(qū)、年齡、性別、個(gè)人資料、交易紀(jì)錄 可進(jìn)行之資料探勘應(yīng)用: 建立個(gè)人化行銷模式 找出潛在的客戶名單 了解顧客族群的屬性 預(yù)測目前哪些顧客可能流失,12,資料探勘的興起,歸功三項(xiàng)技術(shù)的成熟 大量資料的收集技術(shù): 網(wǎng)路發(fā)達(dá)、關(guān)聯(lián)式資料庫(relational database)應(yīng)用廣泛、整合技術(shù)成熟 高效能的多處理器電腦架構(gòu)

5、平行處理架構(gòu),使大量資料處理能在可容忍的時(shí)間內(nèi)完成 資料探勘演算法的成熟 包括統(tǒng)計(jì)學(xué)(statistics)、人工智慧(artificial intelligence) 、機(jī)器學(xué)習(xí)(machine learning) 、 基因演算法( genetic algorithms ) 等等,13,資料探勘的功能,預(yù)測未來的趨勢 股市行情預(yù)測 天氣預(yù)測 地震預(yù)測 消費(fèi)行為預(yù)測 商品出貨量預(yù)測等等 找出未知的樣式 找出會購買筆記型電腦的顧客特徵 依消費(fèi)習(xí)性相近的顧客進(jìn)行群組 推薦鑑別消費(fèi)者可能會同時(shí)購買的商品組合等等,14,第一章 資料探勘簡介,緣起 何謂資料探勘 資料探勘的演進(jìn) 資料探勘與其他系統(tǒng)的比較

6、 知識發(fā)現(xiàn)的過程 資料探勘常用的技術(shù) 資料探勘的模型 資料探勘的應(yīng)用 資料探勘的工具 資料探勘未來的發(fā)展與挑戰(zhàn),15,何謂資料探勘(1),學(xué)者曾對資料探勘做過的定義 Frawley 資料庫中挖掘潛在、明確、而且非常有用資訊的過程 Grupe & Owrang 從已存在的資料庫當(dāng)中挖掘出專家仍未知的新事實(shí) Fayyad 定義知識發(fā)掘 (Knowledge Discovery) 為從大量資料中選取合適的資料,進(jìn)行資料處理、轉(zhuǎn)換等工作,再進(jìn)行資料探勘與結(jié)果評估的一系列過程 Berry & Linoff 使用自動或半自動的方法,對大量資料分析,找出有意義的關(guān)係或法則。,16,何謂資料探勘(2),資料探

7、勘=資料庫之知識發(fā)掘(Knowledge Discovery in Databases,簡稱KDD) 從大型資料庫裡頭所儲存的資料當(dāng)中去萃取出一些有趣的知識 知識指的就是一些規(guī)則 大型資料庫包括線上作業(yè)的資料庫 (On-line Database) 及資料倉儲 (Data Warehouse)等等 知識範(fàn)例 如果顧客的年齡是在三十歲到四十歲之間,而且年收入是在四十萬到六十萬之間,那麼此顧客很有可能會購買筆記型電腦。,17,第一章 資料探勘簡介,緣起 何謂資料探勘 資料探勘的演進(jìn) 資料探勘與其他系統(tǒng)的比較 知識發(fā)現(xiàn)的過程 資料探勘常用的技術(shù) 資料探勘的模型 資料探勘的應(yīng)用 資料探勘的工具 資料探

8、勘未來的發(fā)展與挑戰(zhàn),18,資料探勘歷史,19,資料探勘的演進(jìn),20,第一章 資料探勘簡介,緣起 何謂資料探勘 資料探勘的演進(jìn) 資料探勘與其他系統(tǒng)的比較 知識發(fā)現(xiàn)的過程 資料探勘常用的技術(shù) 資料探勘的模型 資料探勘的應(yīng)用 資料探勘的工具 資料探勘未來的發(fā)展與挑戰(zhàn),21,與決策支援系統(tǒng)的不同點(diǎn),決策支援系統(tǒng) (Decision Support System,DSS) 依決策模型或推論規(guī)則、提供建議 可以來自於領(lǐng)域?qū)<?Domain Expert)的經(jīng)驗(yàn)法則 可運(yùn)用知識工程(Knowledge Engineering)的技術(shù)自專家腦中擷取 可以用資料探勘技術(shù)所分析歸納出來的隱藏規(guī)則 資料探勘系統(tǒng) 自

9、動化的資料分析與預(yù)測,22,與線上分析的不同點(diǎn),線上分析 (On-Line Analytical Processing,簡稱OLAP) 對制式化、關(guān)連性低的資料分析,統(tǒng)計(jì)數(shù)據(jù)供決策人員參考 讓零售業(yè)瞭解不同產(chǎn)品、銷售區(qū)域?qū)冻杀炯盃I業(yè)毛利之影響,但無法了解顧客的購買行為模式,23,與統(tǒng)計(jì)分析的不同點(diǎn)(1),統(tǒng)計(jì)分析(Statistical Analysis) 以假設(shè)(Hypothesis)及驗(yàn)證(Verification)為基礎(chǔ) 對較少資料,資料間的關(guān)連性或統(tǒng)計(jì)學(xué)上不同標(biāo)的分析 由具專業(yè)專家對統(tǒng)計(jì)結(jié)果加以檢測 資料探勘 以發(fā)現(xiàn)(Discovery)為基礎(chǔ),著重樣式辨認(rèn) 供不具專業(yè)背景的使用者(

10、高層決策人員)使用,24,與統(tǒng)計(jì)分析的不同點(diǎn)(2),範(fàn)例 統(tǒng)計(jì)分析 女性和男性消費(fèi)者個(gè)別在本月的消費(fèi)總額 不同網(wǎng)域的消費(fèi)者在本月的消費(fèi)總額 不同年齡層的消費(fèi)者在本月的消費(fèi)總額等 資料探勘 找出如下的規(guī)則: IF 住在臺北 AND 性別是男性 AND 年齡介於 37到42歲之間 THEN 購買筆記型電腦的可能性是 85%,25,第一章 資料探勘簡介,緣起 何謂資料探勘 資料探勘的演進(jìn) 資料探勘與其他系統(tǒng)的比較 知識發(fā)現(xiàn)的過程 資料探勘常用的技術(shù) 資料探勘的模型 資料探勘的應(yīng)用 資料探勘的工具 資料探勘未來的發(fā)展與挑戰(zhàn),26,知識發(fā)現(xiàn)的過程,27,資料收集,知識發(fā)現(xiàn)的第一個(gè)步驟 原始資料來源 資料

11、庫系統(tǒng) Excel表格 文字檔 網(wǎng)際網(wǎng)路 問卷調(diào)查等等,28,資料前置處理,原因 真實(shí)的資料非常雜亂,且收集資料的工具並沒有做精確的檢查,導(dǎo)致收集到的資料,並不見得全都可用 資料探勘有80%時(shí)間花費(fèi)在前置作業(yè) 包含資料的淨(jìng)化、格式轉(zhuǎn)換、表格的連結(jié)等前置作業(yè),29,資料倉儲的建立,決策支援系統(tǒng)的基礎(chǔ) 含整合資料、詳細(xì)資料、總合性(summarized)資料、歷史性資料、描述資料綱要資料 線上分析處理(On-Line Analytical Processing,OLAP) 統(tǒng)計(jì)、分析功能 可由關(guān)聯(lián)式資料庫建構(gòu) Sybase、Oracle、Redbrick等 OLAP 提供多維度結(jié)構(gòu)(multidi

12、mensional structures) 使用者依據(jù)不同維度,例如產(chǎn)品、地區(qū)、其它更透徹的觀察角度做統(tǒng)計(jì),30,資料探勘,用統(tǒng)計(jì)與模型化的方法 資料倉儲所提供的資訊,供資料探勘做進(jìn)步挖掘,而萃取隱藏知識後,再轉(zhuǎn)到知識庫 資料探勘是知識發(fā)現(xiàn)的一部分 知識發(fā)現(xiàn)的過程會影響資料探勘的成功,31,樣式評估,樣式評估(pattern evaluation) 評估所挖掘的知識是不是真的有用 ? 過濾沒用的資訊,最後剩下有價(jià)值的知識供給使用者 範(fàn)例 天氣好,旅遊人數(shù)就多;天氣差,旅遊人數(shù)就少,這樣的探勘結(jié)果我們可能認(rèn)為它“有趣”的程度並不高,因?yàn)樗菍凫兑话愠WR,32,結(jié)果展示,複雜的探勘結(jié)果要讓使用者看

13、懂並不容易 需要圖形化介面,把有趣的知識做好的呈現(xiàn) 例如:Microsoft SQL Server 2005的圖形化介面非常豐富 用類似油表的燈號,讓使用者看到現(xiàn)在的預(yù)算消耗量是加滿油的狀態(tài)、還是沒有油的狀態(tài),33,第一章 資料探勘簡介,緣起 何謂資料探勘 資料探勘的演進(jìn) 資料探勘與其他系統(tǒng)的比較 知識發(fā)現(xiàn)的過程 資料探勘常用的技術(shù) 資料探勘的模型 資料探勘的應(yīng)用 資料探勘的工具 資料探勘未來的發(fā)展與挑戰(zhàn),34,資料探勘常用的技術(shù),傳統(tǒng)技術(shù) 以統(tǒng)計(jì)分析為代表 包括敘述統(tǒng)計(jì)、機(jī)率論、迴歸分析、類別資料分析 用高等統(tǒng)計(jì)學(xué)含括的變因分析 (factor analysis)精簡變數(shù) 用區(qū)隔分析 (di

14、scriminated analysis) 來做分類 用群集分析 (cluster analysis) 對象 大多是變數(shù)繁多且筆數(shù)龐大的資料,35,資料探勘常用的技術(shù)(續(xù)),改良技術(shù) 類神經(jīng)網(wǎng)路(artificial neural network) 決策樹(decision tree) 基因演算法(genetic algorithms) 規(guī)則推論法(rules induction) 模糊理論(fuzzy logic),36,類神經(jīng)網(wǎng)路,何謂類神經(jīng)網(wǎng)路 模仿生物神經(jīng)網(wǎng)路,用大量人工神經(jīng)元(neuron)模擬 高速的運(yùn)算功能,有記憶、學(xué)習(xí)、容錯能力 運(yùn)算方法 用許多參數(shù)建立一個(gè)模式,過程中需要提供

15、資料給網(wǎng)路,能夠產(chǎn)生一組最佳結(jié)果的加權(quán)值 (weights) 訓(xùn)練方法回溯 (back-propagation) 特性 預(yù)測根據(jù)不明確 對於測試資料可以做相當(dāng)正確的預(yù)測,但對於真實(shí)資料的預(yù)測,準(zhǔn)確性差,37,類神經(jīng)網(wǎng)路運(yùn)算範(fàn)例,n維的輸入向量x,透過矩陣相乘(scalar product)和 非線性函數(shù)映射的方法,對應(yīng)到變數(shù)y,38,決策樹,何謂決策樹 用樹狀結(jié)構(gòu)產(chǎn)生規(guī)則 內(nèi)部節(jié)點(diǎn)(internal node)某項(xiàng)屬性的測試 分支(brache)被測試屬性當(dāng)中一個(gè)可能的值 葉節(jié)點(diǎn)(leaf node)布林函數(shù) 運(yùn)算方法 樹的每個(gè)節(jié)點(diǎn)都是判斷式,判斷所輸入資料是否等於某個(gè)屬性值,構(gòu)成樹狀結(jié)構(gòu) 特

16、性 適用於所有的分類問題 不一定較準(zhǔn)確,但容易了解,39,決策樹範(fàn)例-購買筆記型電腦,40,基因演算法,1960 年代John Von Neumann 提出一個(gè)自我複製 (self-reproducing) 的理論,奠定了基因演算法的基礎(chǔ) 美國密西根大學(xué)教授John Holland 延續(xù)此觀念,於1970 年發(fā)展出簡單基因演算法(Simple Genetic Algorithms 簡稱SGA),使 基因演算法的架構(gòu)有了初步的雛型,41,基因演算法(續(xù)),基因演算法(最佳化空間搜尋法) 適合解決最佳化問題 物競天擇、適者生存,不適者淘汰 運(yùn)算方法 選擇(selection)、複製 (reprod

17、uction) 、交配(crossover) 、突變(mutation)進(jìn)行演化,求最佳解 特性 高度的問題獨(dú)立性 不容易陷入局部最佳化(local optimum) ,而向整體最佳解收斂(global optimum),42,基因演算法範(fàn)例,43,規(guī)則推論法,規(guī)則推論法 最直接也最為一般使用者所瞭解方法 瞭解資料庫中資料之特性規(guī)律,稱之為規(guī)則(Rule) 運(yùn)算方法 一連串如果./則.(If / Then)之邏輯規(guī)則對資料進(jìn)行細(xì)分的技術(shù) 特性 實(shí)際運(yùn)用時(shí),如何界定規(guī)則為有效是最大的問題 通常需先將資料中發(fā)生數(shù)太少的項(xiàng)目先剔除,以避免產(chǎn)生無意義的邏輯規(guī)則,44,規(guī)則推論法範(fàn)例-購買筆記型電腦,以

18、購買筆記型電腦為例: IF 婚姻狀態(tài)=單身 AND 年齡=30歲 THEN 購買筆記型電腦=是 IF 婚姻狀態(tài)=已婚 AND 收入=低 THEN 購買筆記型電腦=否 IF 婚姻狀態(tài)=已婚 AND 收入=中 THEN 購買筆記型電腦=否 IF 婚姻狀態(tài)=已婚 AND 收入=高 THEN購買筆記型電腦=是,45,模糊理論,模糊理論 嘗試用人類思維去簡化問題複雜度 美國加州大學(xué)L. A. Zadeh(扎德)教授提出模糊集合 (Fuzzy Sets) 運(yùn)算方法 人類主觀表現(xiàn)的概念作大略的定量化處理 傳統(tǒng)必須依靠數(shù)學(xué)模型來達(dá)成控制 特性 和人類主觀感覺有關(guān)係,人們無法清楚了解他人的感受,只能從語意做大概

19、判斷,達(dá)到彼此溝通目的,46,模糊理論運(yùn)算範(fàn)例,傳統(tǒng)電腦決策 不是對(1)就是錯(0) 例如 168公分以下算矮,那168公分以上就算高 何謂模糊 在對(1)與錯(0)之間,再多加幾各等級 幾乎對(0.8) 可能對(0.6) 可能錯(0.4) 幾乎錯(0.2) 168公分算不算高?,47,迴歸分析,迴歸分析 分析多個(gè)獨(dú)立變數(shù)(independent variable) 對於某個(gè)依變數(shù)(dependent variable)的影響,主要功能如下 利用獨(dú)立變數(shù)解釋依變數(shù) 利用獨(dú)立變數(shù)預(yù)測依變數(shù) 利用依變數(shù)控制獨(dú)立變數(shù) 分析必須做下列假設(shè) 各母體(population)之間必須要是獨(dú)立的 每個(gè)母體必

20、須要符合常態(tài)分配 樣本是從母體當(dāng)中隨機(jī)的被抽取出來,48,迴歸分析範(fàn)例,原始迴歸係數(shù): 適於預(yù)測之用。 當(dāng)資料為原始分?jǐn)?shù)時(shí),則預(yù)測方程式為: Y = ab1X1b2X2biXi (a:截矩 b:斜率),範(fàn)例 設(shè)客戶年齡為獨(dú)立變數(shù)X1,客戶年收入為獨(dú)立變數(shù)X2,筆記型電腦售價(jià)為依變數(shù)Y,分析客戶年齡、客戶年收入與客戶所購買的筆記型電腦售價(jià)三者之歷史數(shù)據(jù),建立出一個(gè)迴歸分析模型 Y = 542 X1 + 0.026 X2,49,第一章 資料探勘簡介,緣起 何謂資料探勘 資料探勘的演進(jìn) 資料探勘與其他系統(tǒng)的比較 知識發(fā)現(xiàn)的過程 資料探勘常用的技術(shù) 資料探勘的模型 資料探勘的應(yīng)用 資料探勘的工具 資料

21、探勘未來的發(fā)展與挑戰(zhàn),50,資料探勘的模型,主要有以下四種 資料分類 (data classification) 資料關(guān)連 (data association) 資料分群 (data clustering) 循序樣式探勘 (sequential pattern mining),51,資料分類,何謂分類(classification) 監(jiān)督式學(xué)習(xí) (supervised learning) 分析資料的屬性,分門別類加以定義,以建立 類組(class) 適用領(lǐng)域 顧客分類、疾病因素分析等 範(fàn)例 將信用卡申請者的風(fēng)險(xiǎn)屬性,區(qū)分為高度風(fēng)險(xiǎn)、中度風(fēng)險(xiǎn)、低度風(fēng)險(xiǎn)申請者,52,資料關(guān)連,資料關(guān)連 探討資料項(xiàng)

22、目間的關(guān)係,找出某一事件或資料中會同時(shí)出現(xiàn)的項(xiàng)目 也叫做關(guān)連法則探勘 適用領(lǐng)域 購物籃分析(market basket analyses) 幫助零售業(yè)者瞭解客戶的消費(fèi)行為 範(fàn)例 如果顧客買NB,同時(shí)購買隨身碟的機(jī)率是80% 如果買全麥麵包及低脂優(yōu)酪乳,那麼顧客同時(shí)也買低脂牛奶的機(jī)率是85%,53,資料分群,資料分群(Clustering) 非監(jiān)督式學(xué)習(xí)(unsupervised learning) 從大量資料中找出案例間相似性,案例中每個(gè)屬性都可視為一個(gè)維度,如果案例有n個(gè)屬性,就可將每個(gè)案例都各投射到n維空間上的一點(diǎn) 適用領(lǐng)域 顧客分群、群組推薦等等 範(fàn)例 一群住在附近的人,駕駛相同的汽車,

23、使用相同家電,並且食用相同的食物。而另一群從事相同行業(yè)的人,家庭成員人數(shù)接近,年收入接近,出國次數(shù)也很接近。透過觀察資料為何被群集在一起的,可以更了解資料間的關(guān)係,以及這些關(guān)係將會如何影響預(yù)言的結(jié)果,54,循序樣式探勘,循序樣式探勘 分析序列狀態(tài)轉(zhuǎn)變,從相關(guān)的序列當(dāng)中預(yù)測未來的狀態(tài) 與關(guān)連法則所不同的是循序樣式探勘中相關(guān)的項(xiàng)目(item)是以時(shí)間區(qū)分 適用領(lǐng)域 股市行情預(yù)測、行為預(yù)測等等 舉例 在通訊品質(zhì)不佳的無線網(wǎng)路環(huán)境中時(shí),此舉尚可提供客戶在離開無線網(wǎng)路涵蓋區(qū)時(shí),仍能離線瀏覽網(wǎng)頁的功能,55,第一章 資料探勘簡介,緣起 何謂資料探勘 資料探勘的演進(jìn) 資料探勘與其他系統(tǒng)的比較 知識發(fā)現(xiàn)的過程

24、 資料探勘常用的技術(shù) 資料探勘的模型 資料探勘的應(yīng)用 資料探勘的工具 資料探勘未來的發(fā)展與挑戰(zhàn),56,資料探勘的應(yīng)用實(shí)例 (1),成功案例 LTV鋼鐵公司(全美第三大) 偵測品質(zhì)問題,使不良品減少99% 美國匯豐銀行(HSBC-Bank-USA) 在顧客資料中進(jìn)行探勘,用生活方式區(qū)隔進(jìn)行行銷,對行銷資源做最佳化規(guī)劃,銷售量提高了50% Jubii(丹麥最受歡迎的入口網(wǎng)站) 運(yùn)用資料探勘探索哪一種瀏覽路徑最有可能促成交易?,改善網(wǎng)站設(shè)計(jì),使得瀏覽率提升30%50%,媒體銷售業(yè)績成長10%15%,57,資料探勘的應(yīng)用實(shí)例(2),金融保險(xiǎn)業(yè) 信用評等、客製化金融服務(wù)、客戶資產(chǎn)管理、呆帳分析、保險(xiǎn)潛在

25、客戶名單分析、直效行銷、分析購買行為、偵測信用卡詐騙行為、股匯市行情預(yù)測 零售製造業(yè) 分店設(shè)點(diǎn)區(qū)位分析、銷售產(chǎn)品組合、庫存管理、即時(shí)輔助購買決策、連續(xù)銷售、促銷商品組合、DM名單、庫存分析 醫(yī)療生技業(yè) 預(yù)防醫(yī)學(xué)分析、院內(nèi)感染分析、臨床病徵分析、基因圖譜比對、基因定序、演化分析 教育業(yè) 學(xué)生來源分析、課程規(guī)劃、學(xué)習(xí)評量、適性化教學(xué),58,資料探勘在顧客關(guān)係管理之應(yīng)用,零售業(yè)者而言 瞭解顧客消費(fèi)特性,發(fā)掘顧客採購模式,強(qiáng)化客戶關(guān)係,達(dá)到留住顧客目的 銀行業(yè)者而言 瞭解信用卡發(fā)放可能產(chǎn)生之弊端,找出最有利潤、忠誠度佳的顧客 保險(xiǎn)業(yè)者而言 分析保戶要求理賠之模式,並可加強(qiáng)稽核,以防止詐財(cái)之發(fā)生 優(yōu)點(diǎn)

26、有效地在不同層面增加公司收益,達(dá)成營運(yùn)目標(biāo),59,資料探勘在網(wǎng)路行銷之應(yīng)用,分析顧客於網(wǎng)站上之行為模式 當(dāng)顧客拜訪網(wǎng)站時(shí),往往提供許多寶貴的資料,如個(gè)人資料、點(diǎn)選的網(wǎng)頁內(nèi)容、在網(wǎng)頁所停留的時(shí)間、利用搜尋引擎時(shí)所使用的關(guān)鍵字、以及顧客到訪網(wǎng)站的時(shí)間點(diǎn)等,企業(yè)可藉由分析這些資訊來瞭解顧客的行為模式,藉以提高顧客對公司所提供之產(chǎn)品與服務(wù)的滿意度。 應(yīng)用範(fàn)例 可用以下特性區(qū)分訪客的特質(zhì) 地理區(qū)隔 包括訪客地址、收入、購買能力 人格特質(zhì) 訪客之購買特性,是否為衝動性或精打細(xì)算型 訪客使用之資訊設(shè)備 網(wǎng)路頻寬、操作系統(tǒng)、瀏覽器或伺服器,60,資料探勘在網(wǎng)路入侵行為分析之應(yīng)用,發(fā)掘異常網(wǎng)路行為 傳統(tǒng)分析突發(fā)

27、網(wǎng)路狀況,需很長時(shí)間 利用高速運(yùn)算,分析異常網(wǎng)路行為、動態(tài)調(diào)整與更新防禦機(jī)制 應(yīng)用範(fàn)例 協(xié)助網(wǎng)管執(zhí)行進(jìn)階的網(wǎng)路控管,並動態(tài)調(diào)整與更新防禦機(jī)制,進(jìn)而遏阻網(wǎng)路入侵攻擊的潛在威脅 協(xié)助網(wǎng)管建立正常網(wǎng)路行為模型、異常的行為模型,61,資料探勘在網(wǎng)路學(xué)習(xí)之應(yīng)用,適性化網(wǎng)路學(xué)習(xí)(Adaptive E-learning) 提供適合學(xué)習(xí)路徑給不同背景學(xué)習(xí)者 建構(gòu)學(xué)習(xí)概念圖(concept map)規(guī)劃學(xué)生學(xué)習(xí)路徑 分析成績了解試題關(guān)連性,推導(dǎo)對應(yīng)之概念 應(yīng)用範(fàn)例 利用關(guān)連法則探勘技術(shù) 分析學(xué)習(xí)者的學(xué)習(xí)成績並了解試題間的關(guān)連性 推導(dǎo)出相對應(yīng)於試題之概念間的關(guān)連 找出可以幫助領(lǐng)域?qū)<医?gòu)學(xué)習(xí)概念圖的法則 構(gòu)建適切

28、的課程概念圖。,62,第一章 資料探勘簡介,緣起 何謂資料探勘 資料探勘的演進(jìn) 資料探勘與其他系統(tǒng)的比較 知識發(fā)現(xiàn)的過程 資料探勘常用的技術(shù) 資料探勘的模型 資料探勘的應(yīng)用 資料探勘的工具 資料探勘未來的發(fā)展與挑戰(zhàn),63,資料探勘的工具,整合型系統(tǒng) 將資料倉儲、資料探勘、及專家系統(tǒng)/決策支援系統(tǒng)整合 Cognos出品的SCENARIO () Business Objects出品的BusinessMiner () 一般性套裝軟體 單純只做資料探勘工作 IBM的Intelligent Miner SPSS的Clementine 客製化軟體 依照某企業(yè)體或是某行業(yè)的需要所量身訂做的軟體 針對零售業(yè)開發(fā)的KD1 針對信用卡詐欺或呆帳偵測所開發(fā)的HNC,64,M

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論