版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、項目目標:運用邏輯回歸建立信用卡欺詐評分卡本次實驗的數(shù)據(jù)均來自于我行真實數(shù)據(jù),只是在本文的作業(yè)中不會出現(xiàn)實際客戶信息以及真實的變量內(nèi)容以及全部代碼,僅僅只是一次嘗試,僅供參考。一】數(shù)據(jù)樣本的確定本次嘗試選取了時間窗口12年11月到13年1月,13年5月到13年7月1000140筆樣本數(shù)據(jù)。并按照6:4的比例分成測試集和訓練集二】變量確定X變量:從申請表,第三方信息源等數(shù)據(jù)表中提煉出85個初始變量,包括原始變量,根據(jù)經(jīng)驗確定的中間變量。Y變量:在實際業(yè)務中被認定的壞客戶,其他的為好客戶,分別用1和0表示三】變量異常值剔除,缺失值填補數(shù)值變量:運用計算99分位數(shù),把大于2倍99分位數(shù)的數(shù)值置為99
2、分位數(shù),把缺失值總量超過20%以上的變量剔除分類變量:運用插值法,把缺失的變量填回去。四】變量篩選1、 首先進行單變量的邏輯回歸,刪除掉P值大于0.3的變量,2、 把數(shù)值變量進行分段操作,使得分出的段之間有較大差異,并且是單調(diào)的。3、 計算IV值,把IV值小于0.02的剔除,小于0.02的被認為是沒有預測能力的4、 運用聚類的方法,把分類變量進行聚類,以降低分類變量的緯度最后篩選出的變量如下表(實際意義不加以說明,表示的是一些客戶的屬性)最終10變量IVPBC_CC_CNT_OPEN_L6TH_B0.572
3、6102PBC_CC_OPENDATE_INT_B0.3712097SPREADER_HIRE_DATE_B0.3466377APP_LOANCARD_NUM_B0.2145266PBC_SAME_MOBILE0.2075589APP_CITY0.1969697PBC_CC_LOAN0.1809676APP_SAME_OTHERMOBILE0.1449625APP_EDUCATION_DEGREE_B0.0929062SAME_COMPANY0.0867273PBC_COMPADDR_TIME_B0.0649564PBC_SAME_COMMUADDR0.0584656五】邏輯回歸運用逐步回歸法
4、,計算各變量的參數(shù)估計Proc logistic data=lg.F_BS_NEW_IND_TRAIN descoutest=LG.param_est;model TARGET_VAR_NEW=PBC_CC_CNT_OPEN_L6TH_WOEPBC_CC_OPENDATE_INT_WOEPBC_COMPADDR_TIME_WOESPREADER_HIRE_DATE_WOEAPP_LOANCARD_NUM_WOEPBC_SAME_MOBILE_WOEAPP_CITY_WOEPBC_SAME_COMMUADDR_WOEPBC_CC_LOAN_WOEAPP_SAME_OTHERMOBILE_WOEA
5、PP_EDUCATION_DEGREE_WOE/ selection=stepwise slentry=0.05 slstay=0.05outroc=LG.ROC ctable pprob=(0 to 1 by 0.1) details lackfit stb;output out=LG.PRED p=phat;Run;proc sort data=LG.PRED;by descending phat;Run;輸出結(jié)果六】模型評價運用洛倫茨圖和ROC圖來看下模型的效果提升圖:每一段的實際壞客戶占比單調(diào)下降,說明模型的效果不錯,如果呈現(xiàn)的是非單調(diào)的,則說明模型不可用。洛倫茨圖在30%的水平下比隨
6、機提升35%左右,模型效果可以再看下ROC圖,誤判30%的好客戶可以區(qū)分出75%的壞客戶,C值在0.76,一般評分卡的C值大于0.75就可以運用此模型。七】輸出評分卡/*/
7、 /*/
8、0; /* Automatically Generated Scorecard */
9、;
10、 /*/
11、0; /* SAS CODE */
12、0; /* Scorecard Scale : */ &
13、#160;
14、160; /* Odds of 1 : 1/300 at 1000 Points
15、0; with PDO of 120 */&
16、#160;
17、160; /*/
18、 /*/
19、0; /* START OF
20、SCORING DATA STEP */
21、 /*/
22、; /*/
23、60; DATA LG.MODELING; /* Modify */
24、160;
25、60; SET LG.MODELING; /* Modify */ &
26、#160; /*/
27、; /*/
28、60; /*/ &
29、#160; /* Base P
30、oints */
31、 /*/
32、 Points=520 ; &
33、#160;
34、160; /*/
35、 /* Variable : APP_LOA
36、NCARD_NUM */
37、0; /*/
38、160; IF APP_LOANCARD_NUM LE (1) THEN Points=Points +(62);
39、;
40、 IF APP_LOANCARD_NUM GT (1) AND APP_LOANCARD_NUM LE (2) THEN Points=Points +(-47);
41、 IF APP_LOANCARD_NUM GT (2) THEN Points=Points +(-112); &
42、#160; /*/
43、 /* Variable : PBC_CC_CNT_OPEN_L6TH */
44、;
45、 /*/
46、0; IF PBC_CC_CNT_OPEN_L6TH LE (0) THEN Points=Points +(8);
47、0; IF PBC_CC_CNT_OPEN_L6TH GT (0) AND PBC_CC_CNT_OPEN_L6TH LE (1) THEN Points=Points +(-27);
48、60; IF PBC_CC_CNT_OPEN_L6TH GT (1) THEN Points=Points +(-32); &
49、#160; /*/
50、 &
51、#160; /* Variable : PBC_CC_OPENDATE_INT */
52、 /*/
53、; IF PBC_CC_OPENDATE_INT LE (0) THEN Points=Point
54、s +(38);
55、 IF PBC_CC_OPENDATE_INT GT (0) AND PBC_CC_OPENDATE_INT LE (24) THEN Points=Points +(-26);
56、; IF PBC_CC_OPENDATE_INT GT (24) AND PBC_CC_OPENDATE_INT LE (48) THEN Points=Points +(-32); IF P
57、BC_CC_OPENDATE_INT GT (48) THEN Points=Points +(-47);
58、160; /*/ &
59、#160; /* Variable : SPREADER_HIRE_DATE */ &
60、#160; /*/
61、 &
62、#160; IF SPREADER_HIRE_DATE LE (6) THEN Points=Points +(22);
63、160; IF SPREADER_HIRE_DATE GT (6) THEN Points=Points +(-18);
64、60; IF SPREADER_HIRE_DATE = ""
65、THEN Points=Points +(66);
66、0; /*/
67、160; /* Variable : APP_CITY */
68、 /*/
69、0;
70、; IF APP_CITY = "Y" THEN Points=Points +(47);
71、 IF APP_CITY = "N" THEN Points=Points +(-40); &
72、#160;
73、160; IF APP_CITY = "U" THEN Points=Points +(-45);
74、60; /*/ &
75、#160; /* Variable : APP_EDUCATION_DEGREE &
76、#160; */ &
77、#160; /*/
78、; IF APP_EDUCATION_DEGREE = "F" THEN Points=Points +(-43); &
79、#160; IF APP_EDUCATIO
80、N_DEGREE = "E" THEN Points=Points +(-8);
81、; IF APP_EDUCATION_DEGREE = "D" THEN Points=Points +(-8); &
82、#160; IF APP_EDUCATION_DEGREE = "A" THEN Points=Points +(21);
83、0; IF APP_EDUCA
84、TION_DEGREE = "B" THEN Points=Points +(21);
85、160; IF APP_EDUCATION_DEGREE = "C" THEN Points=Points +(21);
86、; IF APP_EDUCATION_DEGREE = "G" THEN Points=Points +(52); &
87、#160; /*/
88、
89、 /* Variable : APP_SAME_OTHERMOBILE */
90、; /*/
91、60; IF APP_SAME_OTHERMOBILE = "Y&quo
92、t; THEN Points=Points +(-124);
93、; IF APP_SAME_OTHERMOBILE = "N" THEN Points=Points +(4);
94、0; /*/
95、60; /* Variable : PBC_CC_LOAN */
96、0;
97、; /*/
98、60; IF PBC_CC_LOAN = "Y" THEN Points=Points +(25);
99、160;
100、60; IF PBC_CC_LOAN = "N" THEN Points=Points +(-46); &
101、#160; /*/
102、; /* Variable : PBC_SAME_MOBILE */
103、160;
104、60; /*/
105、160; IF PBC_SAME_MOBILE = "Y" THEN Points=Points +(130);
106、60; IF PBC_SAME_MOBILE = "N" THEN
107、; Points=Points +(-76);
108、; IF PBC_SAME_MOBILE = "U" THEN Points=Points +(-66);
109、 /*/
110、 /* Variable : SAME_COMPANY */
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職教育學(班級管理基礎)試題及答案
- 2025年中職(護理)無菌操作試題及答案
- 2025年大學環(huán)境保護(環(huán)境影響評價)試題及答案
- 2025年大學美術(shù)類(素描基礎訓練)試題及答案
- 2025年高職農(nóng)業(yè)機械應用技術(shù)(農(nóng)機故障診斷)試題及答案
- 2025年中職能源動力類(能源基礎常識)試題及答案
- 2025年大學健康運營管理(管理技術(shù))試題及答案
- 2025年大學大三(水利工程管理)水庫調(diào)度運行綜合測試試題及答案
- 2025年高職第二學年(房地產(chǎn)經(jīng)營與管理)房產(chǎn)租賃專項測試試題及答案
- 2025年中職(烹飪工藝與營養(yǎng))中式面點制作基礎試題及答案
- 史海啟智心育潤心:高中歷史教學與心理健康教育的融合探索
- 產(chǎn)品推廣項目管理辦法
- (2025秋新版)人教版二年級數(shù)學上冊全冊教案(教學設計)
- 內(nèi)科護理副高答辯題庫及答案
- 小學無廢校園教學課件
- 地產(chǎn)公司品牌策劃方案
- 2025年高考真題-化學(黑吉遼卷) 含答案(黑龍江、吉林、遼寧、內(nèi)蒙古)
- 初三英語閱讀競賽含答案
- 中學生英語詞匯表3500(全)
- 2025年全國基層退役軍人服務中心(站)工作人員職業(yè)技能競賽備考試題庫(含答案)
- 物業(yè)催費技巧培訓
評論
0/150
提交評論