版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
基于神經(jīng)網(wǎng)絡(luò)的支付交易數(shù)據(jù)異常檢測技術(shù)分析案例概述目錄TOC\o"1-3"\h\u14835基于神經(jīng)網(wǎng)絡(luò)的支付交易數(shù)據(jù)異常檢測技術(shù)分析案例概述 1156551.1系統(tǒng)整體總體架構(gòu) 157501.2支付交易數(shù)據(jù)抽取過程 331921.3交易數(shù)據(jù)的預(yù)處理 14257471.4基于BP算法的人工神經(jīng)網(wǎng)絡(luò)風(fēng)險(xiǎn)分析 15117891.1.1BP算法特點(diǎn) 1570911.1.2BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用 15302593.1.3數(shù)據(jù)可用性的檢驗(yàn)及說明 16141561.1.4神經(jīng)網(wǎng)絡(luò)的模型構(gòu)建及數(shù)據(jù)模擬 1644511.5模型結(jié)果驗(yàn)證 181.1系統(tǒng)整體總體架構(gòu)圖4SEQ圖\*ARABIC\s11總體架構(gòu)圖1)整體分為4個(gè)模塊:基礎(chǔ)數(shù)據(jù)、數(shù)據(jù)庫、任務(wù)定時(shí)調(diào)度系統(tǒng)、結(jié)果展示業(yè)務(wù)系統(tǒng)。數(shù)據(jù)的抽取,轉(zhuǎn)換,加載都是通過QUARTZ定時(shí)調(diào)度系統(tǒng)進(jìn)行處理任務(wù)來實(shí)現(xiàn)。2)基礎(chǔ)數(shù)據(jù)主要是客戶數(shù)據(jù)和交易數(shù)據(jù),分別來自業(yè)務(wù)系統(tǒng)、交易系統(tǒng)和清算系統(tǒng)。3)在基礎(chǔ)數(shù)據(jù)的基礎(chǔ)上,QUARTZ通過定時(shí)執(zhí)行配置的獲取數(shù)據(jù)的任務(wù)將基礎(chǔ)數(shù)據(jù)抽取到數(shù)據(jù)倉庫的數(shù)據(jù)庫中。有了基礎(chǔ)數(shù)據(jù)后再根據(jù)不同的業(yè)務(wù)主題進(jìn)行數(shù)據(jù)的轉(zhuǎn)換,轉(zhuǎn)換后再按照最終需要呈現(xiàn)的分析結(jié)果進(jìn)行相應(yīng)的數(shù)據(jù)匯總統(tǒng)計(jì)得出主題數(shù)據(jù)。4)最后將結(jié)果以報(bào)表的形式進(jìn)行展現(xiàn),此時(shí)需要實(shí)時(shí)查詢數(shù)據(jù)庫中的數(shù)據(jù)。5)上圖業(yè)務(wù)系統(tǒng)還可以查看風(fēng)險(xiǎn)案例的信息。根據(jù)實(shí)際情況制定風(fēng)險(xiǎn)規(guī)則,再利用定時(shí)任務(wù)對己有的數(shù)據(jù)進(jìn)行定期的風(fēng)險(xiǎn)檢查,如果觸犯了風(fēng)險(xiǎn)規(guī)則就生成相應(yīng)的風(fēng)險(xiǎn)案例數(shù)據(jù),最后在通過業(yè)務(wù)系統(tǒng)展示。下面卡種交易主題交易數(shù)據(jù)信息要素進(jìn)行分析:圖4SEQ圖\*ARABIC\s12卡種交易主題交易數(shù)據(jù)信息要素圖1)首先,市場提出對需要對數(shù)據(jù)進(jìn)行分析2)開發(fā)結(jié)合市場的需求確定分析的主題,以及如何將主題數(shù)據(jù)以報(bào)表形式展現(xiàn)給市場3)結(jié)合主題進(jìn)行主題執(zhí)行任務(wù)的開發(fā)以及報(bào)表模板的開發(fā)4)將主題任務(wù)添加到定時(shí)任務(wù)系統(tǒng),定時(shí)任務(wù)系統(tǒng)根據(jù)配置的任務(wù)進(jìn)行數(shù)據(jù)的提取,轉(zhuǎn)換形成主題分析數(shù)據(jù)5)最后通過發(fā)布報(bào)表模板對主題數(shù)據(jù)進(jìn)行展示1.2支付交易數(shù)據(jù)抽取過程圖4SEQ圖\*ARABIC\s13數(shù)據(jù)庫架構(gòu)使用Oracle數(shù)據(jù)庫實(shí)現(xiàn),從以下幾個(gè)點(diǎn)進(jìn)行分析:1)OracleWarehouseBuilder(OWB)是與Oracle數(shù)據(jù)庫集成在一起的ETL工具。OWB為用戶提供了一個(gè)用于建立ETL過程模型的圖形化環(huán)境「16]2)存儲(chǔ):數(shù)據(jù)量大,讀取頻繁,以及數(shù)據(jù)的可靠性,使用RA}_5磁盤陣列來為系統(tǒng)提供數(shù)據(jù)安全保障和磁盤的讀取速度。3)容災(zāi):通過對數(shù)據(jù)進(jìn)行備份,以達(dá)到一定的容災(zāi)能力,選擇DG同步保證數(shù)據(jù)安全。4)索引策略:索引策略的選擇,D數(shù)索引,位圖索引,保證查詢精準(zhǔn),快速。5)并行處理:多節(jié)點(diǎn),多cpu,多內(nèi)存。6)設(shè)計(jì)規(guī)則:保證異構(gòu)的數(shù)據(jù)源與數(shù)據(jù)倉庫中信息實(shí)體的語義一致性。7)數(shù)據(jù)庫命名規(guī)則:a)實(shí)體(表)的命名基礎(chǔ)信息表,前綴"INFO”,表以名詞或名詞短語命名,根據(jù)此表的用途以單詞縮寫表示,每個(gè)單詞間以“_”分隔。在命名過程當(dāng)中,根據(jù)語義拼湊縮寫即可。如果表或者是字段的名稱僅有一個(gè)單詞,那么建議不使用縮寫,而是用完整的單詞。歷史表,后綴“_111S",是哪個(gè)表的歷史,則直接在表名后加上后綴。主題數(shù)據(jù)表,前綴“FACT_"。屬性(列)的命名列名需要能直觀的看出其意義,表字段的命名需要指定比較詳細(xì)的設(shè)計(jì)規(guī)則。每一個(gè)表都將有一個(gè)自動(dòng)ID作為主鍵,都以狀態(tài),創(chuàng)建人,創(chuàng)建時(shí)間,修改人,修改時(shí)間等要素。如果是數(shù)據(jù)庫自動(dòng)生成的編碼,命為:REC_ID;如果其他特殊情況下的字段編碼則用縮寫加“ID”的方法命名。如果此鍵是數(shù)字類型,可以用“_NO”作為后綴。所有的屬性加上有關(guān)類型的后綴,注意,如果還需要其它的后綴,都放在類型后綴之前。注:數(shù)據(jù)類型是文本的字段,類型后綴“TX”可以不寫。有些類型比較明顯的字段,可以不寫類型后綴。視圖的命名:視圖以“V”作為前綴,其他命名規(guī)則和表的命名類似;命名應(yīng)盡量體現(xiàn)各視圖的功能。觸發(fā)器的命名:觸發(fā)器以“TR”作為前綴,觸發(fā)器名為相應(yīng)的表名加上后綴,Insert觸發(fā)器加“_I",Delete觸發(fā)器加“_D",Update觸發(fā)器加“_U",如:TRMer_I,TR_Mer_D,TR_Mer_U。存儲(chǔ)過程名:存儲(chǔ)過程應(yīng)以“UP”開頭,和系統(tǒng)的存儲(chǔ)過程區(qū)分;后續(xù)部分主要以動(dòng)賓格式構(gòu)成,各個(gè)組成部分使用下劃線分割,如增加客戶的事實(shí)數(shù)據(jù)提取的存儲(chǔ)過程為UP_Info_Mero。變量名:變量名小寫,若屬于詞組形式,每個(gè)單詞中間用下劃線分隔,如my_err_nu。設(shè)計(jì)的原則是:既要使數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)合理,訪問效率高,節(jié)省存儲(chǔ)空間;又要在這種可用結(jié)構(gòu)下減少或消除任何信息丟失。命名中其他注意事項(xiàng)命名不超過30個(gè)字符,變量名的長度限制為數(shù)據(jù)對象、變量的命名統(tǒng)一使用英文字符,不允許使用中文,且不可在對象名的字符中間留空格。注意不要保留字,字段名不使用保留字、數(shù)據(jù)庫系統(tǒng)或者常用訪問方法沖突。保持字段名和類型的一致性,在命名字段并為其指定數(shù)據(jù)類型的時(shí)候一定要保證一致性。假如數(shù)據(jù)類型在一個(gè)表里是整數(shù),那在另一個(gè)表里不能變成字符型。1.2.1.1客戶信息.表名:info_mer.表更新周期:每天更新.表更新范圍:每日備份到歷史表(info_mer_his)并重新提取數(shù)據(jù),歷史表結(jié)果跟其一致.表的分區(qū)設(shè)計(jì):客戶量就幾十萬,無需分區(qū).表的索引設(shè)計(jì):mer_no,busi_code.表的唯一約束:rec_id表的用途:存儲(chǔ)從業(yè)務(wù)系統(tǒng)獲取的客戶基礎(chǔ)數(shù)據(jù).表設(shè)計(jì)如下:表4SEQ表\*ARABIC\s11客戶信息要素字段名字段類型是否可為空默認(rèn)值描述MER-NOVARCHAR2(15)N客戶編號BUSI-CODEVARCHAR2(8)N業(yè)務(wù)類型MER-NAMEVARCHAR2(200)N客戶名稱MER-ADDRVARCHAR2(200)Y客戶地址REC-STATVARCHAR2(1)Y客戶狀態(tài),0-正常,1-停用CRE-UIDVARCHAR2(50)Y創(chuàng)建人CRE-DTMDATEY創(chuàng)建時(shí)間MOD-UIDVARCHR2(50)Y修改人MOD-MTDDATEY修改時(shí)間MACCVARCHR2(6)YMCC-NAMEVARCHR2(100)YMCC名稱PBCBANKVARCHR2(8)Y行別COUNTRY-CODINGVARCHR2(8)Y收款人常駐國家編碼SFZIDVARCHR2(30)Y身份證編號SFZID-BEGIN-DATEDATEY法人身份證有效期SFZID-END-DATEDATEY法人身份證有效期LEGALREPVARCHR2(50)Y法人代表YYZZIDVARCHR2(40)Y營業(yè)執(zhí)照編號LEGALREPVARCHR2(20)Y聯(lián)系人YYZZIDVARCHR2(26)Y聯(lián)系人電話LINK-MANDATEY入網(wǎng)時(shí)間LINK-MAN-TELVARCHR2(15)Y行業(yè)編號TRAND-NAMEVARCHR2(100)Y行業(yè)名稱BANK-PROVINCEVARCHR2(20)Y開戶行省BANKPCODEVARCHR2(6)Y開戶行省編號BANK-CITYVARCHR2(30)Y開戶行市BANK-CCODEVARCHR2(6)Y開戶行市編號BANK-AREAVARCHR2(30)Y開戶行區(qū)BANK-CCODEVARCHR2(6)Y開戶行市編號BANKCODEVARCHR2(12)Y電子聯(lián)行號BANKNAMEVARCHR2(200)Y開戶銀行ACCNAMEVARCHR2(50)Y賬戶名稱BANK-ACCNOVARCHR2(30)Y銀行賬號ACCOUNT-ATTRIBUTECHAR(1)Y賬戶屬性SALEMANNAMEVARCHR2(20)Y拓展人INPUT-DTMDATEY導(dǎo)入時(shí)間1.2.1.2終端信息.表名:info_term.表更新周期:每天更新.表更新范圍:每日備份到歷史表(info_term_his)并重新提取數(shù)據(jù),歷史表結(jié)果跟其一致.表的分區(qū)設(shè)計(jì):終端量就幾十萬,無需分區(qū).表的索引設(shè)計(jì):mer_no,term_no,busi_code.表的主鍵:Key.表的用途:rec.存儲(chǔ)從業(yè)務(wù)系統(tǒng)獲取的終端基礎(chǔ)數(shù)據(jù).表設(shè)計(jì)如下:表4SEQ表\*ARABIC\s12終端信息要素字段名字段類型是否可為空默認(rèn)值描述REC-IDVARCHAR2(50)N記錄IDMER-NOVARCHAR2(20)N客戶編號TERM-NOVARCHAR2(15)N終端編號BUSI-CODEVARCHAR2(8)N業(yè)務(wù)類型TERM-ADDRVARCHAR2(200)Y裝機(jī)地址FIR-INS-DTMDATEY首次裝機(jī)時(shí)間LAS-INS-DTMDATEY最后裝機(jī)時(shí)間LAS-STP-DTMDATEY最后暫停用時(shí)間END-DTMDATEY撤機(jī)時(shí)間MAC-NOVARCHAR2(20)Y機(jī)身號MAC-MODELVARCHAR2(20)Y機(jī)具型號MAC-BRANDVARCHAR2(20)Y機(jī)具品牌ORG-IDVARCHAR2(8)Y維護(hù)機(jī)構(gòu)REC-STATVARCHAR2(1)Y終端狀態(tài),0-啟用,1-停用,3-暫停用CRE-UIDVARCHAR2(50)Y創(chuàng)建人CRE-DTMDATEY創(chuàng)建時(shí)間MOD-UIDVARCHAR2(1)Y修改人MOD-DTMDATEY修改時(shí)間DEVICE-TYPEVARCHAR2(2)Y設(shè)備類型:01-有線POS:02-無線POS(GPRS);03-無線POS(CDMA):04-無線POS(WIFI):05-網(wǎng)絡(luò)POS11自助終端:12-自助終端(3G):13-自助終端(CDMA):14-自助終端(GRRS),15-自助終端(網(wǎng)絡(luò));21-農(nóng)行PSAMEND-REASONVARCHAR2(200)Y撤機(jī)原因明細(xì)STREETVARCHAR2(50)Y街道LINK-MAN1VARCHAR2(20)Y聯(lián)系人1LINK-MANI-TEL1VARCHAR2(30)Y聯(lián)系人電話1LINK-MAN2VARCHAR2(20)Y聯(lián)系人2LINK-MANI-TEL2VARCHAR2(30)Y聯(lián)系人電話21.2.1.3銀行信息.表名:info_bank.表更新周期:每天更新.表更新范圍:刪除后重新提取,不進(jìn)行備份.表的分區(qū)設(shè)計(jì):無需分區(qū).表的索引設(shè)計(jì):bank_name.表的唯一約束:banck_code.表的用途:存儲(chǔ)從業(yè)務(wù)系統(tǒng)獲取的基礎(chǔ)數(shù)據(jù).表設(shè)計(jì)如下:表4SEQ表\*ARABIC\s13銀行信息要素字段名字段類型是否可為空默認(rèn)值描述BANK-CODEVARCHAR2(8)N銀行代碼BANK-NAMEVARCHAR2(255)N銀行名稱DSCRVARCHAR2(255)Y備注1.2.1.4MCC信息.表名:info_mcc.表更新周期:每天更新.表更新范圍:刪除后重新提取,不進(jìn)行備份.表的分區(qū)設(shè)計(jì):無.表的索引設(shè)計(jì):mcc_type.表的唯一約束:mcc.表的用途:記錄著行業(yè)的分類信息.表設(shè)計(jì)如下:表4SEQ表\*ARABIC\s14MCC信息要素字段名字段類型是否可為空默認(rèn)值描述MCCVARCHAR2(4)NMCC代碼NAMEVARCHAR2(100)NMCC名稱MCC-TYPEVARCHAR2(2)NMCC類別MCC-TYPE-NAMEVARCHAR2(100)YMCC類別名稱STD-MCC-TYPEVARCHAR2(1)Y銀聯(lián)標(biāo)準(zhǔn)行業(yè)大類1.2.1.5業(yè)務(wù)信息.表名:info_busi_type表更新周期:每天更新表更新范圍:刪除后重新提取,不進(jìn)行備份表的分區(qū)設(shè)計(jì):表的索引設(shè)計(jì):busi表的唯一:表的用途:busi_type_id記錄著業(yè)務(wù)信息表設(shè)計(jì)如下:表4SEQ表\*ARABIC\s15業(yè)務(wù)信息要素字段名字段類型是否可為空默認(rèn)值描述BUSI-TYPE-IDVARCHAR2(8)N業(yè)務(wù)類型IDBUSI-TYPE-NAMEVARCHAR2(100)N業(yè)務(wù)類型名稱DSCRVARCHAR2(255)Y備注1.2.1.6交易明細(xì)表名:trx_avp_detail表更新范圍:疊加表的分區(qū)設(shè)計(jì):按月分區(qū)表的索引設(shè)計(jì):MER_NO,PA_YesMER_NO;SETT_REC_ID;MER_NO,SETT_DATE;SETT_DATE,DATA_SOURCE_ID;SETT_DATE,REC_ID;表的唯一:sett_date,rec_id表的用途:存儲(chǔ)從清算系統(tǒng)獲取每日清算數(shù)據(jù),用于進(jìn)行統(tǒng)計(jì)表設(shè)計(jì)如下:表更新周期:每天表4SEQ表\*ARABIC\s16交易明細(xì)信息要素字段名字段類型是否可為空默認(rèn)值描述SETT-DATEVARCHAR2(8)N清算日期REC-IDVARCHAR2(32)N記錄IDSYS-TRA-NOVARCHAR2(6)N系統(tǒng)跟蹤號RESP-CD4VARCHAR2(2)N應(yīng)答碼TRX-CODEVARCHAR2(4)N銀聯(lián)交易代碼TRX-AMTVARCHAR2(12,2)N交易金額MESSAGE-TYPEVARCHAR2(4)N消息類型LOC-TRANDS-DT-TMVARCHAR2(20)N本地交易日期時(shí)間:格式:YYYYMMDDhhmmssMCCVARCHAR2(4)N客戶類型(MCC碼)RETRI-REF-NOVARCHAR2(12)N檢索參考號PRI-ACCT-NOVARCHAR2(21)N主賬號BINVARCHAR2(14)Y卡BINCARD-ATTRVARCHAR2(2)Y卡性質(zhì),01:貸記卡02:準(zhǔn)貸記卡03:借記卡:(二期新增)99:其他CARD-MEDIAVARCHAR2(1)Y卡介質(zhì),1:磁條2:pbocic卡3:emvic卡:(二期新增)4:無卡5:FallbackTERM-NOVARCHAR2(8)Y受卡機(jī)終端標(biāo)識(shí)碼(終端編號)MER-NOVARCHAR2(20)N受卡方標(biāo)識(shí)代碼(客戶編號)CARD-ACCPTR-NM-LOCVARCHAR2(40)N受卡方名稱地址(客戶簡稱)ACQ-INS-ID-CDVARCHAR2(13)N受理機(jī)構(gòu)標(biāo)識(shí)碼FWD-INS-ID-CDVARCHAR2(13)Y轉(zhuǎn)發(fā)機(jī)構(gòu)標(biāo)識(shí)碼RCV-INS-ID-CDVARCHAR2(13)Y接受機(jī)構(gòu)標(biāo)識(shí)碼ISS-INS-ID-CDVARCHAR2(13)Y發(fā)卡機(jī)構(gòu)標(biāo)識(shí)碼ORIG-SYS-TRA-NOVARCHAR2(6)Y原始系統(tǒng)跟蹤號ORIG-TRANSMSN-DT-TMVARCHAR2(20)Y原始系統(tǒng)日期時(shí)間:格式:YYYYMMDDDhhmmssRSN-CDVARCHAR2(4)Y原因碼AUTH-DTVARCHAR2(4)Y授權(quán)日期AUTH-ID-RESP-CDVARCHAR2(7)Y授權(quán)標(biāo)識(shí)應(yīng)答碼POS-ENTRY-MD-CDVARCHAR2(3)Y服務(wù)點(diǎn)輸入方式POS-COND-CDVARCHAR2(2)Y服務(wù)點(diǎn)條件代碼PROC-CDVARCHAR2(6)N交易處理碼SUBINST-CODEVARCHAR2(12,2)N交易所屬分支機(jī)構(gòu):默認(rèn)為100400ORIG-TRANS-ATVARCHAR2(32)N原始交易金額LOCAL-REC-IDN本地增值流水ID,用來追溯本地增值流水記錄BUSI-CODEVARCHAR2(8)N業(yè)務(wù)類型代碼PROD-CODEVARCHAR2(4)N產(chǎn)品類型代碼:默認(rèn)為業(yè)務(wù)類型代碼前四位UMS-UN-BUSI-CODEVARCHAR2(2)Y銀商統(tǒng)一后業(yè)務(wù)類型,應(yīng)為“產(chǎn)品編碼”后兩位PRE-PCHNLVARCHAR2(3)N前置渠道PAL-PCHNLVARCHAR2(3)N支付渠道ACQ-MER-NOVARCHAR2(15)N受理端客戶編號ACQ-TRERM-NOVARCHAR2(8)N受理點(diǎn)終端編號SRTT-REC-IDVARCHAR2(128)Y清分流水IDSRTT-AMTVARCHAR2(15,2)Y清分交易金額MER-FEEVARCHAR2(15,2)Y清分手續(xù)費(fèi)金額ISS-FEEVARCHAR2(15,2)Y發(fā)行卡交易金額RCV-FEEVARCHAR2(15,2)Y轉(zhuǎn)接方受益金額ACQ-FEEVARCHAR2(15,2)Y收單受益金額BRAND-FEEVARCHAR2(15,2)Y品牌服務(wù)費(fèi)ERROR-ENTER-AMTVARCHAR2(15,2)Y差錯(cuò)應(yīng)收金額ERROR-OUT-AMTVARCHAR2(15,2)Y差錯(cuò)應(yīng)付金額TERM-TYPEVARCHAR2(15,2)N終端類型,00:其他:01:自動(dòng)柜員機(jī):03:POS終端:05:多媒體終端:06:銀行柜臺(tái)和柜面:07:個(gè)人電腦:08:手機(jī)設(shè)備:09:Ⅰ型固定電話:10:基于PBOC電子錢包/存折標(biāo)準(zhǔn)的交易終端:11:移動(dòng)POS:16:數(shù)字機(jī)頂盒:17:Ⅱ型固定電話RESV1VARCHAR2(255)Y保留域1RESV2VARCHAR2(255)Y保留域2:對多路由數(shù)據(jù)=D1文件RESV3VARCHAR2(255)Y保留域3:對多路由數(shù)據(jù)=D1文件RESV4VARCHAR2(255)Y保留域4:對多路由數(shù)據(jù)=D1文件RESV5VARCHAR2(255)Y保留域5:對多路由數(shù)據(jù)=D1文件CRE-DTMDATEY創(chuàng)建時(shí)間DATA-SOURCE-IDVARCHAR2(2)N數(shù)據(jù)源:定義參見表AVP-TRX-CODEVARCHAR2(4)Y增值交易代碼UNS-BUSI-CODEVARCHAR2(6)Y銀商業(yè)務(wù)類型代碼UNS-PROD-CODEVARCHAR2(4)Y銀商產(chǎn)品類型代碼MER-INST-CODEVARCHAR2(8)Y客戶所屬機(jī)構(gòu)SETT-MER-NOVARCHAR2(20)Y清算客戶號PCHNL-MER-NOVARCHAR2(20)Y渠道客戶號PCHNL-TERM-NOVARCHAR2(8)Y渠道終端號1.3交易數(shù)據(jù)的預(yù)處理本文采用銀行的交易歷史數(shù)據(jù)作為模型的檢測數(shù)據(jù),其中的風(fēng)險(xiǎn)交易己經(jīng)人工或反欺詐處理系統(tǒng)標(biāo)記出來并通過人工核對。由于是本次采集的交易數(shù)據(jù),基本不存在特征值缺失的情況,本實(shí)驗(yàn)處理不進(jìn)行缺失值補(bǔ)全等過程。針對銀行交易數(shù)據(jù)存在時(shí)間上的相關(guān)性,主要使用兩種常見的方式進(jìn)行處理。一種是基于時(shí)間范圍的變量衍生方法,例如時(shí)間范圍內(nèi)交易的次數(shù)或平均的交易金額、當(dāng)前交易金額與過去一段時(shí)間交易金額均值或均方差的比。另一種為基于事件頻率的變量衍生方法,例如賬戶的關(guān)鍵信息有沒有發(fā)生變更、使用的交易設(shè)備是否發(fā)生變化、過去10次20次交易的平均交易金額等。本文采用的衍生的的變量有過去1天、7天、14天、30天、90天、180天是否發(fā)生交易。交易頻率相關(guān)的衍生變量有過去1天的交易次數(shù)、過去7天的日均交易次數(shù)、過去14天的日均交易次數(shù)、過去30天的日均交易次數(shù)、過去90天的日均交易次數(shù)、過去180天的日均交易次數(shù)。交易金額相關(guān)的衍生變量有過去1天的交易額、過去7天的日均交易額、過去14天的日均交易額、過去30天的交易額、過去90天的日均交易額、過去180天的日均交易額。賬戶余額相關(guān)的衍生變量有過去1天的余額、過去7天的日均余額、過去14天的日均余額、過去30天的日均余額、過去90天的日均余額、過去180天的日均余額。2.變量離散化數(shù)據(jù)標(biāo)準(zhǔn)化處理布爾轉(zhuǎn)換,對于客戶性別、婚姻狀態(tài)等屬性進(jìn)行布爾轉(zhuǎn)換。連續(xù)變量的離散化處理,主要針對交易金額、賬戶余額、客戶年齡、客戶賬齡等連續(xù)性變量。本實(shí)驗(yàn)采用等頻的連續(xù)變量的離散化處理方法。首先確定一個(gè)初始分組數(shù)量和組距,通過調(diào)整分組后計(jì)算分組后的事件率相等找出最優(yōu)分組。1.4基于BP算法的人工神經(jīng)網(wǎng)絡(luò)風(fēng)險(xiǎn)分析應(yīng)用決策樹模型,依據(jù)上文提取的網(wǎng)絡(luò)節(jié)點(diǎn)結(jié)構(gòu)和性質(zhì)對支付交易中的節(jié)點(diǎn)識(shí)別為正常交易賬號和異常交易賬號,并對生成決策樹模型的C1.5算法中連續(xù)型特征離散化的步驟進(jìn)行了改進(jìn),使連續(xù)型特征離散化選取的閡值更加準(zhǔn)確,在保證足夠信息量的前提下減少離散化的區(qū)間數(shù)目,進(jìn)而簡化生成的決策樹模型結(jié)構(gòu)。最后利用生成的決策樹模型完成識(shí)別大量交易數(shù)據(jù)中的異常交易賬號工作。1.1.1BP算法特點(diǎn)自學(xué)習(xí)特點(diǎn),BP神經(jīng)網(wǎng)絡(luò)在被輸入一個(gè)樣本的數(shù)據(jù)和對應(yīng)的預(yù)期輸出結(jié)果的時(shí)候,BP神經(jīng)網(wǎng)絡(luò)可以通過訓(xùn)練,自己學(xué)會(huì)這個(gè)樣本中輸入和輸出之間是怎樣的關(guān)系,然后皆可以對相差不多的其他數(shù)據(jù)信息進(jìn)行評估。高速尋找優(yōu)化解的能力。BP神經(jīng)網(wǎng)絡(luò),能夠有效地讓計(jì)算機(jī)進(jìn)行高速的計(jì)算,然后我們可以用非常少的時(shí)間,得到一個(gè)模型的最優(yōu)解情況。不確定性信息處理能力。這也是人工神經(jīng)網(wǎng)絡(luò)的最大特點(diǎn)。神經(jīng)網(wǎng)絡(luò)中有很多很多的神經(jīng)元,而且其網(wǎng)絡(luò)化的結(jié)構(gòu),可以比同等的線性結(jié)構(gòu)容納更多的信息數(shù)據(jù),而且其每個(gè)神經(jīng)元之間形成的網(wǎng)絡(luò)結(jié)構(gòu),讓數(shù)據(jù)間的關(guān)系聯(lián)系更加復(fù)雜和密切,即使有一個(gè)或者一些數(shù)據(jù)缺失或者模糊,甚至數(shù)據(jù)錯(cuò)誤的情況下,BP神經(jīng)網(wǎng)絡(luò)都能夠利用強(qiáng)大的網(wǎng)絡(luò)關(guān)系,找出最佳的輸出結(jié)果??箟盒裕珺P神經(jīng)網(wǎng)絡(luò)通過一定的學(xué)習(xí)和訓(xùn)練,即使在某些神經(jīng)元失效的情況下,仍能夠正常有效的預(yù)測。1.1.2BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用本文將采用B-P神經(jīng)網(wǎng)絡(luò)方法進(jìn)行分析,從最上層的“總體感知風(fēng)險(xiǎn)”到底層的各類具體風(fēng)險(xiǎn)因素,共分為兩個(gè)部分進(jìn)行神經(jīng)網(wǎng)絡(luò)模擬。首先以各風(fēng)險(xiǎn)維度作為輸入項(xiàng),對應(yīng)的風(fēng)險(xiǎn)因素為輸出,216份有效問卷共有216對輸入和輸出數(shù)據(jù)作為樣本,模擬得出底層權(quán)重及變量間關(guān)系,通過神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),再根據(jù)具體風(fēng)險(xiǎn)因素作為輸入項(xiàng),可以輸出一組預(yù)測的“感知風(fēng)險(xiǎn)維度”數(shù)據(jù),再以此作為輸入項(xiàng),用戶感知的總體風(fēng)險(xiǎn)程度作為輸出,進(jìn)行頂層模擬,可以確定各風(fēng)險(xiǎn)維度的相對重要性。經(jīng)過上述流程,第一層的預(yù)測值又作為第二層的輸入值進(jìn)行模擬,數(shù)據(jù)從底層至頂層能夠完全連通。1.3數(shù)據(jù)可用性的檢驗(yàn)及說明針對上述樣本集,首先在系統(tǒng)內(nèi)建立“數(shù)據(jù)審核”節(jié)點(diǎn),對數(shù)據(jù)進(jìn)行可用性檢驗(yàn)。以感知經(jīng)濟(jì)風(fēng)險(xiǎn)指標(biāo)體系為例。Clementine的數(shù)據(jù)質(zhì)量探索輸出結(jié)果非常直觀,以“感知經(jīng)濟(jì)風(fēng)險(xiǎn)”為例,可以看出樣本數(shù)據(jù)的大致分布,以及伊特特征指標(biāo)量,例如最大值、最小值、峰度偏度等。除此之外,Clementine還具有圖文并茂的特點(diǎn),用一張圖幾乎說明了數(shù)據(jù)源各種質(zhì)量問題。如上圖所示,可以明顯的看出,感知經(jīng)濟(jì)風(fēng)險(xiǎn)下屬的3項(xiàng)基礎(chǔ)指標(biāo)基本都呈散點(diǎn)均勻分布于坐標(biāo)軸上。我們可以發(fā)現(xiàn)變量的完整性達(dá)到了100%,同時(shí)僅有“感知經(jīng)濟(jì)風(fēng)險(xiǎn)”指標(biāo)的樣本中不存在離群值和極值,通過上述診斷,數(shù)據(jù)質(zhì)量問題一目了然。據(jù)此可以看出,樣本數(shù)量十分完整,僅有少量極值出現(xiàn),不影響后續(xù)的模型訓(xùn)練和預(yù)測,屬于數(shù)據(jù)質(zhì)量可控的范圍內(nèi)。由此我們可以得出結(jié)論,樣本符合數(shù)據(jù)可用性的前提,下面將利用上述樣本進(jìn)行各部分的神經(jīng)網(wǎng)絡(luò)模擬。1.1.4神經(jīng)網(wǎng)絡(luò)的模型構(gòu)建及數(shù)據(jù)模擬在擁有“感知經(jīng)濟(jì)風(fēng)險(xiǎn)”、“感知時(shí)間風(fēng)險(xiǎn)”、‘憾知技術(shù)風(fēng)險(xiǎn)”、“感知隱私風(fēng)險(xiǎn)”、“感知社會(huì)風(fēng)險(xiǎn),以及“感知信譽(yù)風(fēng)險(xiǎn)”各項(xiàng)體系下屬的基礎(chǔ)指標(biāo)數(shù)據(jù)和對應(yīng)類別的“風(fēng)險(xiǎn)感知程度”后,就可以構(gòu)建相應(yīng)的B-P神經(jīng)網(wǎng)絡(luò)模型,本課題采用SpssClementine17.0對相關(guān)數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)模擬,采用該軟件需要設(shè)置一些基礎(chǔ)參數(shù)。以“感知經(jīng)濟(jì)風(fēng)險(xiǎn)”為例,共有3個(gè)輸入指標(biāo),1個(gè)輸出指標(biāo),輸入數(shù)據(jù)元有:1.不合理收費(fèi)帶來的風(fēng)險(xiǎn)一使用第三方移動(dòng)支付產(chǎn)品的過程中遭到不合理收費(fèi)的風(fēng)險(xiǎn)。2設(shè)備或密碼丟失的風(fēng)險(xiǎn)一(2)移動(dòng)終端設(shè)備丟失或被竊而導(dǎo)致的可能財(cái)產(chǎn)損失的風(fēng)險(xiǎn)。3賬戶或密碼丟失或被竊導(dǎo)致的可能財(cái)產(chǎn)損失的風(fēng)險(xiǎn)。輸入數(shù)據(jù)元:用戶感知的經(jīng)濟(jì)風(fēng)險(xiǎn)程度。即輸入神經(jīng)元個(gè)數(shù)為6,輸出神經(jīng)元個(gè)數(shù)為l。由于本課題采用的是含有一層隱含層的B-P神經(jīng)網(wǎng)絡(luò),因而還需要確定隱藏層神經(jīng)元個(gè)數(shù),本文將以神經(jīng)網(wǎng)絡(luò)的模擬估計(jì)精度為標(biāo)準(zhǔn),確定在該指標(biāo)體系中隱藏層神經(jīng)元個(gè)數(shù)。隨著模型不斷擬合,該精度值最終會(huì)穩(wěn)定在某一位置,稱為“模擬估計(jì)精度”。此處,本文在對比調(diào)整藏層神經(jīng)元個(gè)數(shù)的過程中,觀察模擬估計(jì)精度的變化情況,最終確定感知經(jīng)濟(jì)風(fēng)險(xiǎn)體系指標(biāo)的隱藏層神經(jīng)元個(gè)數(shù)為15個(gè)。除此之外,關(guān)于B-P神經(jīng)網(wǎng)絡(luò)的具體訓(xùn)練方法,經(jīng)過課題組多次實(shí)驗(yàn),最終確定采用“快速訓(xùn)練法”的“專家模式”進(jìn)行模擬,同時(shí)在模擬過程中還需要設(shè)置其他相關(guān)參數(shù)如下,其中Eta表示的是學(xué)習(xí)率,即神經(jīng)網(wǎng)絡(luò)每次模擬移動(dòng)的距離,Alpha表示沖量項(xiàng),在反向傳播中,引入沖量項(xiàng)的目的是加快學(xué)習(xí)速度。表4SEQ表\*ARABIC\s17神經(jīng)網(wǎng)絡(luò)其他相關(guān)參數(shù)Alpha初始Eta高EtaEta衰減低Eta0.90.30.1300.01在確定上述參數(shù)后,可以構(gòu)建B-P神經(jīng)網(wǎng)絡(luò)模擬數(shù)據(jù)流,以“感知經(jīng)濟(jì)風(fēng)險(xiǎn)”指標(biāo)體系為例,如圖4-7所示,從“分區(qū)”節(jié)點(diǎn)開始向右延伸共有5條分支,第一條“分區(qū),,—“感知經(jīng)濟(jì)風(fēng)險(xiǎn)”表示采用100%的樣本數(shù)據(jù)進(jìn)行感知經(jīng)濟(jì)風(fēng)險(xiǎn)指標(biāo)體系的神經(jīng)網(wǎng)絡(luò)模擬過程,第二條“分區(qū)’~‘選擇,七一一一‘‘感知經(jīng)濟(jì)風(fēng)險(xiǎn)”表示采用70%的樣本數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)模擬,第三條“分區(qū)”一‘選擇,一‘70%感知經(jīng)濟(jì)風(fēng)險(xiǎn)”模型一‘表”表示針對70%樣本輸入指標(biāo)進(jìn)行預(yù)測輸出,第四條“分區(qū)”“選擇,一‘100%感知經(jīng)濟(jì)風(fēng)險(xiǎn)”模型“表”表示針對全部樣本輸入指標(biāo)進(jìn)行預(yù)測輸出,第五條“分區(qū)”一“表”僅用來查看輸入系統(tǒng)的數(shù)據(jù),以“表”的形式呈現(xiàn)。2)、模擬過程中發(fā)現(xiàn)的一些問題及處理方法在模擬過程中,本文嘗試采用70%的樣本數(shù)據(jù)進(jìn)行模擬,30%的數(shù)據(jù)進(jìn)行檢驗(yàn),但在模擬過程中發(fā)現(xiàn),如果對數(shù)據(jù)進(jìn)行“分區(qū)”處理,樣本檢驗(yàn)的結(jié)果普遍不好,預(yù)測結(jié)果與輸出原值的誤差浮動(dòng)在30%左右。在此本文進(jìn)行研究分析認(rèn)為,由于該模型樣本數(shù)量的限制,若采取不完全樣本進(jìn)行訓(xùn)練,會(huì)忽略掉大量屬于模型的關(guān)鍵信息,因而造成樣本檢驗(yàn)大部分不達(dá)標(biāo)的情況。因此本文最終采用100%樣本數(shù)據(jù)進(jìn)行模擬,隨后針對系統(tǒng)模擬,將100%數(shù)據(jù)進(jìn)行預(yù)測,在經(jīng)過上述方法修正后,總體樣本數(shù)據(jù)的誤差范圍能夠控制在10%,預(yù)測的準(zhǔn)確性明顯提升,因而本文決定采用100%的數(shù)據(jù)進(jìn)行訓(xùn)練。3)、數(shù)據(jù)模擬在成功構(gòu)建相應(yīng)數(shù)據(jù)流,并確定模擬樣本數(shù)量后,可以對第三方移動(dòng)支付感知風(fēng)險(xiǎn)指標(biāo)體系進(jìn)行B-P神經(jīng)網(wǎng)絡(luò)模擬,以“感知經(jīng)濟(jì)風(fēng)險(xiǎn)”的指標(biāo)體系模擬過程為例。1.5模型結(jié)果驗(yàn)證本次模型采用newff,函數(shù)構(gòu)建模型,對于新版本的newff函數(shù),可采用提前結(jié)束,防止過訓(xùn)練的策略,通過少數(shù)迭代次數(shù),達(dá)到收斂。模型的構(gòu)建中,利用MATLAB中的默認(rèn)值設(shè)置隱含層節(jié)點(diǎn)數(shù)、傳遞函數(shù)。模型中的訓(xùn)練函數(shù)trainlm函數(shù),并設(shè)置最大迭代次數(shù)為1500次,調(diào)用train函數(shù)進(jìn)行訓(xùn)練。具體代碼如下:%創(chuàng)建BP網(wǎng)絡(luò)net=newff(trainx,trainy);%設(shè)置最大訓(xùn)練次數(shù)net.trainParam.epochs=1500;%目標(biāo)誤差net.trainParam.goal=1e-13;%顯示級別net.trainParam.snov}l;%訓(xùn)練net=train(net,trainx,trainy);為了消除因?yàn)橛须S機(jī)的因素對訓(xùn)練造成影響,在訓(xùn)練的過程中,選擇了相同的訓(xùn)練和測試樣本,一直重復(fù)運(yùn)算40次,分別統(tǒng)計(jì)其正確的概率,最終得到平均正確率為87.27%,最低正確率為81.42%,迭代次數(shù)為6。在訓(xùn)練及擬合完成后,針對上述建立的支付交易風(fēng)險(xiǎn)度量模型,利用Sim函數(shù)引入新的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職美發(fā)與形象設(shè)計(jì)(發(fā)型修剪技術(shù))試題及答案
- 2025年中職裝配式建筑工程技術(shù)(建筑常識(shí)基礎(chǔ))試題及答案
- 2025-2026年高三地理(同步復(fù)習(xí))下學(xué)期期中檢測卷
- 2025年高職航空導(dǎo)航技術(shù)(航空導(dǎo)航基礎(chǔ))試題及答案
- 2025年高職(中藥學(xué))中藥炮制工藝階段測試題及評分標(biāo)準(zhǔn)
- 2025年大學(xué)藥物分析(藥物分析基礎(chǔ))試題及答案
- 第2部分 第10章 第3講 服務(wù)業(yè)區(qū)位因素及其變化
- 2025年工作總結(jié)報(bào)告年終匯報(bào)及2026新年計(jì)劃
- 深度解析(2026)GBT 18310.6-2001纖維光學(xué)互連器件和無源器件 基本試驗(yàn)和測量程序 第2-6部分試驗(yàn) 鎖緊機(jī)構(gòu)抗拉強(qiáng)度
- 深度解析(2026)《GBT 18114.1-2010稀土精礦化學(xué)分析方法 第1部分:稀土氧化物總量的測定 重量法》
- GB 17625.1-2022電磁兼容限值第1部分:諧波電流發(fā)射限值(設(shè)備每相輸入電流≤16 A)
- 國際稅收智慧樹知到期末考試答案章節(jié)答案2024年中央財(cái)經(jīng)大學(xué)
- 2024工程停工補(bǔ)償協(xié)議
- 偉大的《紅樓夢》智慧樹知到期末考試答案章節(jié)答案2024年北京大學(xué)
- JB-T 8532-2023 脈沖噴吹類袋式除塵器
- (正式版)SHT 3045-2024 石油化工管式爐熱效率設(shè)計(jì)計(jì)算方法
- 《婦病行》教師教學(xué)
- 《養(yǎng)老護(hù)理員》-課件:協(xié)助臥床老年人使用便器排便
- 初三勵(lì)志、拼搏主題班會(huì)課件
- Cuk斬波完整版本
- GB/T 3521-2023石墨化學(xué)分析方法
評論
0/150
提交評論