版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
金融數(shù)據(jù)挖掘和商業(yè)數(shù)據(jù)挖掘
建構(gòu)信用卡評(píng)分模型之商業(yè)智能流程鄭宇庭謝邦昌程兆慶
臺(tái)灣政治大學(xué)資料采礦中心7/2/20231報(bào)告大綱研究目的分析工具
建模流程結(jié)論與建議Q&A7/2/20232研究目的有效地篩選出償債能力不佳的個(gè)人信用卡客戶,依此開發(fā)出一套信用風(fēng)險(xiǎn)系統(tǒng),以幫助銀行做出正確的核卡決策。這個(gè)系統(tǒng)的開發(fā)、維護(hù)、與更新的成本預(yù)期將比銀行現(xiàn)有系統(tǒng)的成本低。7/2/20233分析工具M(jìn)icrosoftSQLSever2005價(jià)格自動(dòng)化以及開發(fā)延伸程度目前SPSS跟微軟之間是采取合作的態(tài)度7/2/20234建模流程:CRISP-DMDATAMINING執(zhí)行階段商業(yè)理解資料理解資料準(zhǔn)備建模評(píng)估發(fā)布資料源DATAMINING處理流程7/2/20235圖表來源:楊自強(qiáng)企業(yè)如何應(yīng)用商業(yè)智慧來提升執(zhí)行力與競爭力微軟商業(yè)智慧解決方案SSIS
分析服務(wù)報(bào)表服務(wù)分析服務(wù)(DataMining)資料來源檢視表(DataSourceView)整合性服務(wù)(SSIS)商業(yè)理解資料理解資料準(zhǔn)備建模評(píng)估發(fā)布資料源資料源7/2/20236圖表來源:楊自強(qiáng)企業(yè)如何應(yīng)用商業(yè)智慧來提升執(zhí)行力與競爭力資料采礦無處不在商業(yè)問題Microsoft算法預(yù)測類別變量,例如營銷響應(yīng)、顧客流失、違約預(yù)測(巴塞爾資本協(xié)定IRB)…決策樹貝氏機(jī)率分類群集類神經(jīng)網(wǎng)絡(luò)羅吉斯回歸預(yù)測連續(xù)變量,例如預(yù)測銷售量、預(yù)測客戶價(jià)值變動(dòng)、預(yù)測金融商品價(jià)格波動(dòng)...回歸樹時(shí)間序列類神經(jīng)網(wǎng)絡(luò)預(yù)測序列,例如找出網(wǎng)站使用者的點(diǎn)選路徑模式、客戶繳款行為模式、商品購物順序時(shí)序群集找出產(chǎn)品交叉銷售關(guān)聯(lián)性,又稱為購物籃分析關(guān)聯(lián)規(guī)則決策樹找出潛在相似性,例如市場區(qū)隔、偵測晶圓瑕疵分配、文件分類、保險(xiǎn)浮濫理賠偵測、偽卡偵測群集時(shí)序群集7/2/20237商業(yè)理解(BusinessUnderstanding)厘清商業(yè)問題目前呆帳率是多少?信用卡審核流程?信用卡評(píng)分模型=分類模型7/2/20238資料理解(DataUnderstanding)資料來源某銀行的信用卡資料數(shù)據(jù)內(nèi)容申請(qǐng)數(shù)據(jù)文件繳款紀(jì)錄文件總共有1220個(gè)變數(shù),502,333筆原始資料違約戶定義繳款期間曾經(jīng)有逾期60天以上未繳之卡戶
7/2/20239建模繞流程憐圖選擇墨20儲(chǔ)01削.4較~2閣00侄1.侍6原始最資料清除眠遺漏俊值、門異常盯值數(shù)據(jù)籌轉(zhuǎn)換誤差禽抽樣訓(xùn)練毀組測試論組建模評(píng)估評(píng)估6/徐27掃/2肺02烘310資料成準(zhǔn)備討(D睜at膨a國Pr閑ep縫ar眼at徐io弓n)選擇僚合理突的建狐模變壯量基本例數(shù)據(jù)性別復(fù)、教兇育程搬度、盼職業(yè)仆別……聯(lián)合松征信中心芽(J霉CI小C)刮的資疊料被查惜詢總狹家數(shù)摧、延煉遲月約數(shù)比坦率……與銀沈行往帖來的秒資料申請(qǐng)健卡別茄類型凈、有搜沒有棋使用灣扣款杜服務(wù)……6/董27如/2銷02旱311資料宇準(zhǔn)備膚(D圍at開a回Pr筆ep逝ar紛at校io鍬n)選擇粘合理宿的建院模時(shí)祖間時(shí)間淚間隔鉛取為12個(gè)月哥至18個(gè)月清除該遺漏禽值、判異常蝕值數(shù)據(jù)免轉(zhuǎn)換連續(xù)御型轉(zhuǎn)豆成離禾散型踐:被弄查詢限總家眾數(shù)…合并捆變項(xiàng)磁太多背之變前量:稠職業(yè)個(gè)別…衍生柿新的序變數(shù)6/威27爆/2蹲02草312類型變量名稱數(shù)據(jù)類型個(gè)人資料教育別類別型(2類)性別旗標(biāo)型行業(yè)別類別型(3類)職稱別類別型(3類)工作年資類別型(5類)緊急聯(lián)絡(luò)人與正卡關(guān)系類別型(4類)與銀行往來紀(jì)錄是否申請(qǐng)結(jié)余代償旗標(biāo)型扣款賬號(hào)旗標(biāo)型金融聯(lián)合征信中心<過去六個(gè)月>延遲月數(shù)比率連續(xù)型<過去六個(gè)月>循還月數(shù)比率連續(xù)型近一年M2次數(shù)整數(shù)型<最近一個(gè)月>近期是否逾期旗標(biāo)型負(fù)債所得比連續(xù)型有效卡張數(shù)類別型(3類)被查詢總家數(shù)類別型(4類)6/千27頑/2發(fā)02病313建模購(M悄od提el靜in候g)誤差頌抽樣踩(O梨ve柿r-嘗Sa攔mp麻li鍬ng劑)將稀月有事糊件透鋸過抽痕樣的沿方式難將其炎比重?fù)u提高多的洲少抽賄(R啊ed悄uc澆e)漢:正付常戶寄抽取菊率0培.1違約許戶抽滋取率1將資殖料分股成訓(xùn)輝練組蟲與測爛試組避免榜過度遙學(xué)習(xí)借(O叛ve叮r-務(wù)fi獅tt鵝in牢g)建模臨方法揉選擇羅吉王斯回酸歸、斃決策蟲樹、希類神嬌經(jīng)網(wǎng)還絡(luò)6/跟27像/2即02都314Da助ta計(jì)M啞in穩(wěn)in捆g撿Mo雕de辭l敏Ev禿al毅ua糖ti害on6/掛27數(shù)/2走02艘315Da詢ta府M怒in漸in恩g均Mo階de繞l孔Ev箭al態(tài)ua瞞ti比on分類撞矩陣橫軸揮為預(yù)借測結(jié)丑果,拴縱軸如為實(shí)巴際結(jié)閉果增益瀉圖橫軸撓為名索單百臂分比掛,縱裁軸為宗累積小占全他體之會(huì)百分倉比收益勝圖根據(jù)朱成本日以及拍銷售丈成功斗利潤捉,并賠計(jì)算需出累江積利填潤圖散布底圖針對(duì)懸連續(xù)編變量螺,可板以利栗用此備功能劇了解堡實(shí)際糖值與喇預(yù)測沾值間答之差腫異性烏以及終預(yù)測拖之趨在勢(shì)變宵動(dòng)情遷形6/虹27象/2關(guān)02赤316選擇“vTargetMail(dbo)”勾選需要比較之模型Da梅ta兇M聞in紐奉in竊g跑Mo逐de稠l蜓Ev震al肆ua峰ti蒜on說明板:在進(jìn)閃行模韻型效聾益評(píng)尺估前逝必須概先選然入數(shù)刃據(jù)表漠,并齒在模感型中字勾選符要進(jìn)找行評(píng)敢估比歉較之處模型6/羅27覽/2悔02缺317Da氧ta糕M知in泳in站g你Mo抵de磨l籃Ev耕al醒ua戴ti氣on分類脈矩陣藉由分類矩陣進(jìn)一步比較,判別兩模型的預(yù)測能力,由決策樹模型發(fā)現(xiàn),預(yù)測正確的資料有7103+5857=12960;而群集分析模型的正確預(yù)測數(shù)據(jù)為5395+5308=10703,也可看出決策樹分類結(jié)果較群集分析分類結(jié)果好6/首27遵/2鄰02塞318Da揮ta白M價(jià)in熊in丸g污Mo擺de組l百Ev杰al鴉ua罩ti肚on增益甲圖增益賓圖:主要臨展現(xiàn)炭在整幟體的煎百分很上所賤累積帖的效撕益狀者況6/撇27然/2寒02礦319Da形ta載M煎in松in依g降Mo陡de煎l草Ev寺al雖ua單ti澡on收益贏圖收益猛圖:可根朽據(jù)所逮設(shè)定閃之固術(shù)定成侍本、鳳單位漫成本緣瑞以及槳單位失營收集加以訊計(jì)算北,找識(shí)出最錦佳獲白利點(diǎn)6/虛27控/2叮02摧320Da征ta患M鄉(xiāng)豐in裳in鬧g貞Mo迅de節(jié)l專Ev繩al茄ua膠ti曾on散布脖圖散布圖:了解各模型之預(yù)測值、預(yù)測趨勢(shì)以及實(shí)際值6/救27示/2位02象321評(píng)估膚(E襯va刃l(wèi)u致at哥io翻n)增益頑圖(癥li喉ft戰(zhàn)c撓ha宿r(nóng)t巨)6/乎27釘/2勺02嗓322評(píng)估被(E畝va虜lu母at俊io郵n)分類璃矩陣尊(c獄la捕ss獎(jiǎng)if齊ic票at加io鈔n松ma膝tr洗ix加)衡量掙指標(biāo)Pr碌ec句is抬e蘿=貪a/襯a+信bRe由ca所ll呼=借a株/a步+cAc首cu分ra壟cy遵=丸a值+d狗/a戶+b城+c飾+d實(shí)際預(yù)測違約戶正常戶違約戶ab正常戶cd6/烘27捆/2健02絲式323發(fā)布咽(D唱ep廳lo會(huì)ym卸en萌t)產(chǎn)生冷預(yù)測形的違詢約機(jī)態(tài)率值單一酸查詢整批糕查詢6/葡27帆/2行02號(hào)324結(jié)論澤與建棍議本研做究以高羅吉焦斯回羊歸模沒型預(yù)逮測能儀力最澇好本研簡究目碗的在另于幫購助作比核卡蛙的決萍策,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026內(nèi)蒙古包頭市眼科醫(yī)院招聘控制數(shù)人員3人備考題庫附答案
- 2026上海市退役軍人事務(wù)局系統(tǒng)招聘4人備考題庫及完整答案詳解一套
- 2026嵐圖汽車品牌傳播中心招聘備考題庫附答案詳解(輕巧奪冠)
- 2026中國海峽人才市場南平工作部招聘見習(xí)生備考題庫及答案詳解(有一套)
- 2026年1月廣東深圳市第七高級(jí)中學(xué)招聘專任教師4人備考題庫及答案詳解1套
- 2026年及未來5年市場數(shù)據(jù)中國橡木原木行業(yè)市場發(fā)展數(shù)據(jù)監(jiān)測及投資潛力預(yù)測報(bào)告
- 2026湖南懷化國際陸港經(jīng)濟(jì)開發(fā)區(qū)內(nèi)國有企業(yè)招聘4人備考題庫及參考答案詳解一套
- 2026貴州貴陽花溪區(qū)劍橋?qū)W校招聘6人備考題庫帶答案詳解
- 四川大學(xué)附屬中學(xué)新城分校教師招聘備考題庫及完整答案詳解一套
- 2026浙江嘉興大學(xué)醫(yī)學(xué)院招錄非編工作人員1人備考題庫(第一批)有答案詳解
- 專利免責(zé)合同范例
- 《我國中藥飲片產(chǎn)業(yè)國際競爭力探析》9200字(論文)
- 檢驗(yàn)項(xiàng)目管理培訓(xùn)
- 《梅毒診斷及治療》課件
- DB45T 2313-2021 奶水牛同期發(fā)情-人工授精操作技術(shù)規(guī)程
- 購買助動(dòng)車合同模板
- 兩個(gè)合伙人股權(quán)協(xié)議書范文模板
- GB/T 44082-2024道路車輛汽車列車多車輛間連接裝置強(qiáng)度要求
- 控?zé)熤嗅t(yī)科普知識(shí)講座
- 脫碳塔CO2脫氣塔設(shè)計(jì)計(jì)算
- 產(chǎn)品報(bào)價(jià)單貨物報(bào)價(jià)表(通用版)
評(píng)論
0/150
提交評(píng)論