版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
資料採礦分類分析系統(tǒng)之建構(gòu)與應(yīng)用
-信用貸款違約與選股系統(tǒng)應(yīng)用
指導(dǎo)教授:姜林杰祐博士學(xué)生:陳冠名第一頁,共五十五頁。摘要本研究以資料採礦的分類方法為核心,嘗試建構(gòu)一開放式的分類分析系統(tǒng),其內(nèi)含的分類演算法包括ID3、C4.5、貝氏分類法與記憶基礎(chǔ)推論法等。為驗(yàn)證本系統(tǒng)的有效性,本研究以銀行信用貸款資料庫為例,分類正常戶與違約戶;並將此分類工具應(yīng)用於股市的分析、預(yù)測,期能以此系統(tǒng)發(fā)展資料趨導(dǎo)式的選股模型CompanyLogo第二頁,共五十五頁。報(bào)告大綱第一章、研究目的與動(dòng)機(jī)。第二章、文獻(xiàn)探討。第三章、資料採礦分類分析系統(tǒng)開發(fā)。第四章、實(shí)例應(yīng)用一。第五章、實(shí)例應(yīng)用二。第六章、結(jié)論與未來研究。CompanyLogo第三頁,共五十五頁。研究動(dòng)機(jī)與目的
近年來資料氾濫,如何在過度氾濫的資料中去蕪存菁,將無用的資料過濾,進(jìn)而獲得有用的資訊、知識(shí)是相當(dāng)重要的議題,而資料採礦即是對資料進(jìn)行分析,以求在大量資料中獲取資訊的有效方法。CompanyLogo第四頁,共五十五頁。資料採礦方法在財(cái)金領(lǐng)域應(yīng)用現(xiàn)況PhilipJoos等(1998)將LogitModel以及決策樹用於比利時(shí)某大型銀行資料庫進(jìn)行信用分類,獲得80%以上之的準(zhǔn)確度。NazliIkizler等(2000)使用決策樹C4.5演算法對銀行放款資料進(jìn)行分析,試圖找出令人感興趣的分類規(guī)則,此研究結(jié)果發(fā)現(xiàn)數(shù)條有用之分類規(guī)則,可供決策運(yùn)用。Muh-CherngWu等(2006)以決策樹結(jié)合濾嘴法則,應(yīng)用於股市交易,獲得13%的報(bào)酬率。CompanyLogo第五頁,共五十五頁。資料採礦於金融業(yè)之應(yīng)用資料來源:吳振晃(2003)應(yīng)用領(lǐng)域應(yīng)用情況信用卡公司信用卡公司使用資料採礦來增加信用卡的應(yīng)用,作購買授權(quán)決定,分析持卡人購買行為,並偵測詐騙行為金融服務(wù)機(jī)構(gòu)分析師使用資料採礦技術(shù),來分析大量的財(cái)務(wù)資料,建立交易模型來發(fā)展投資策略銀行銀行使用資料倉儲(chǔ)來促進(jìn)資料採礦作業(yè),並詳細(xì)的分析客戶資料,然後整合這些成果以形成行銷策略,也可以使用資料採礦技術(shù),識(shí)別客戶的貸款活動(dòng),調(diào)整金融商品以符合客戶需求,尋找新客源,加強(qiáng)客戶服務(wù)。保險(xiǎn)公司資料採礦技術(shù)最近已提供保險(xiǎn)業(yè)者,從大型資料庫中取得有價(jià)值的資訊以進(jìn)行決策,這些資訊可讓保險(xiǎn)業(yè)者進(jìn)一步認(rèn)識(shí)客戶,並可有效的偵測保險(xiǎn)詐欺。CompanyLogo第六頁,共五十五頁。資料採礦方法分群。分群是針對樣本進(jìn)行劃分,與分類不同的是,進(jìn)行分類時(shí)使用者必須明確知道要以何種準(zhǔn)則來對樣本進(jìn)行劃分,而分群屬於非監(jiān)督式學(xué)習(xí)法,使用者不需知道樣本要依何種準(zhǔn)則進(jìn)行劃分(有時(shí)也無法得知),分群演算法會(huì)自動(dòng)對樣本進(jìn)行劃分,在圖形辨識(shí)、市場區(qū)隔等領(lǐng)域都有優(yōu)異的表現(xiàn),主要演算法有K-平均法、K-物件法等。關(guān)聯(lián)。此演算法主要是要探究,當(dāng)某一事件發(fā)生時(shí),是否會(huì)帶動(dòng)另一事件跟著發(fā)生,是一種探究因果關(guān)係的方法,最著名的應(yīng)用為購物籃分析,用以發(fā)現(xiàn)消費(fèi)者的購買行為,以Apriori演算法最為經(jīng)典。分類。為一監(jiān)督式學(xué)習(xí)方法,主要用於對樣本進(jìn)行類別的劃分,如對銀行客戶進(jìn)行信用分級(jí)、預(yù)測違約戶…等都是其主要應(yīng)用領(lǐng)域,分類包含了眾多演算法可供使用,如決策樹、類神經(jīng)網(wǎng)路、支援向量機(jī)(SVM)、貝氏分類法、記憶基礎(chǔ)推論法(MBR)…等都是知名的分類演算法。CompanyLogo第七頁,共五十五頁。決策樹ID3:以資訊理論作為屬性選擇之依據(jù)C4.5:改良自ID3CompanyLogo第八頁,共五十五頁。貝氏分類法貝氏定理:現(xiàn)實(shí)中,類別C中出現(xiàn)X客戶的機(jī)率無法求得再假設(shè)各屬性值相互獨(dú)立由上述可得CompanyLogo第九頁,共五十五頁。記憶基礎(chǔ)推論法步驟1選取訓(xùn)練樣本集步驟2計(jì)算屬性距離絕對差:平方差:標(biāo)準(zhǔn)差:步驟3計(jì)算資料距離,將上述求得各屬性距離加以組合成一個(gè)值,用以代表兩資料間的距離,常用合成方式如下總和:標(biāo)準(zhǔn)化總和:歐基里徳距離:CompanyLogo第十頁,共五十五頁。記憶基礎(chǔ)推論法(續(xù))步驟4選取k筆鄰近資料進(jìn)行表決,為了避免表決時(shí)有平手的情況,k應(yīng)取單數(shù)為佳。步驟5表決方式選擇,判定方式以選出之k個(gè)鄰近資料進(jìn)行多數(shù)決,多者即為該預(yù)測樣本歸屬之類別,常用判定方式如下:民主選舉法:所選之k個(gè)鄰近樣本具有相同權(quán)重,以多者為勝。加權(quán)選舉法:依據(jù)所選之k個(gè)鄰近樣本與預(yù)測樣本的距離給予權(quán)重,距離預(yù)測樣本愈近,則權(quán)重愈大。CompanyLogo第十一頁,共五十五頁。系統(tǒng)架構(gòu)CompanyLogo第十二頁,共五十五頁。決策樹流程CompanyLogo第十三頁,共五十五頁。貝氏分類法流程CompanyLogo第十四頁,共五十五頁。記憶基礎(chǔ)推論法流程CompanyLogo第十五頁,共五十五頁。銀行信用貸款違約分析實(shí)驗(yàn)流程決策樹分析貝式分類法分析記憶基礎(chǔ)推論法分析CompanyLogo第十六頁,共五十五頁。實(shí)驗(yàn)流程資料獲取:將欲進(jìn)行分析之資料載入資料表資料前置處理:共有雜訊處理、資料離散化、訓(xùn)練/測試樣本選取三部份雜訊處理:將兩標(biāo)準(zhǔn)差以外之資料視為雜訊。資料離散化:以等寬裝箱法將連續(xù)型資料分為五類。訓(xùn)練/測試樣本選取:隨機(jī)挑選151筆資料進(jìn)行訓(xùn)練,75筆資料用於測試。探勘方法選?。阂朗褂谜咝枨筮x取合適之探勘方法,系統(tǒng)提供方法有決策樹、貝氏分類法、記憶基礎(chǔ)推論法。CompanyLogo第十七頁,共五十五頁。決策樹分析實(shí)驗(yàn)設(shè)定
參與屬性
貸款金額、性別、學(xué)歷、婚姻、職業(yè)、是否雙薪、保證人、收入、年齡、子女人數(shù)、負(fù)債、信用卡、用卡狀況、建物樣式、建物坪數(shù)、建築年數(shù)、押品樓層、寬緩本金、信用型態(tài)…等19個(gè)屬性。目標(biāo)屬性
信用型態(tài),0代表不違約,1代表違約。雜訊處理
將2標(biāo)準(zhǔn)差以外的資料視為雜訊,予以刪除。資料離散化
以等寬裝箱法,將連續(xù)型資料分為5類樣本選取原本300筆資料,經(jīng)過雜訊處理後剩下226筆,隨機(jī)挑選151筆為訓(xùn)練樣本,75筆為測試樣本。探勘演算法
ID3、C4.5。中止條件
最大深度1、2、3層,及無限制。CompanyLogo第十八頁,共五十五頁。決策樹分析(續(xù))實(shí)驗(yàn)結(jié)果
ID3實(shí)驗(yàn)結(jié)果C4.5實(shí)驗(yàn)結(jié)果
無限制最大深度1最大深度2最大深度3樣本內(nèi)準(zhǔn)確度10.73510.7550.9338樣本外準(zhǔn)確度0.520.70670.53330.5733無限制最大深度1最大深度2最大深度3樣本內(nèi)準(zhǔn)確度10.72190.74170.7616樣本外準(zhǔn)確度0.61330.73330.69330.7067CompanyLogo第十九頁,共五十五頁。決策樹分析(續(xù))分類規(guī)則
CompanyLogo第二十頁,共五十五頁。決策樹分析(續(xù))樹狀圖CompanyLogo第二十一頁,共五十五頁。貝式分類法分析實(shí)驗(yàn)設(shè)定實(shí)驗(yàn)結(jié)果參與屬性貸款金額、性別、學(xué)歷、婚姻、職業(yè)、是否雙薪、保證人、收入、年齡、子女人數(shù)、負(fù)債、信用卡數(shù)、用卡狀況、建物樣式、建物坪數(shù)、建築年數(shù)、押品樓層、寬緩本金、信用型態(tài)…等19個(gè)屬性目標(biāo)屬性信用型態(tài),0代表不違約,1代表違約。雜訊處理將2標(biāo)準(zhǔn)差以外的資料視為雜訊,予以刪除。資料離散化以等寬裝箱法,將連續(xù)型資料分為5類樣本選取原本300筆資料,經(jīng)過雜訊處理後剩下226筆,隨機(jī)挑選151筆為訓(xùn)練樣本,75筆。探勘演算法貝氏分類法。樣本內(nèi)準(zhǔn)確度0.7610樣本外準(zhǔn)確度0.6578CompanyLogo第二十二頁,共五十五頁。記憶基礎(chǔ)推論法分析實(shí)驗(yàn)設(shè)定參與屬性
貸款金額、性別、學(xué)歷、婚姻、職業(yè)、是否雙薪、保證人、收入、年齡、子女人數(shù)、負(fù)債、信用卡、用卡狀況、建物樣式、建物坪數(shù)、建築年數(shù)、押品樓層、寬緩本金、信用型態(tài)…等19個(gè)屬性。目標(biāo)屬性
信用型態(tài),0代表不違約,1代表違約。雜訊處理
將2標(biāo)準(zhǔn)差以外的資料視為雜訊,予以刪除。資料離散化
以等寬裝箱法,將連續(xù)型資料分為5類樣本選取各類別隨機(jī)挑選30筆,共60筆資料作為訓(xùn)練樣本集;挑選15筆鄰近資料作為表決資料集,隨機(jī)挑選75比為測試資料集。探勘演算法
記憶基礎(chǔ)推論法。其他
1.針對各距離函數(shù)及合成方式一一測試,共有九種測試組合2.判定方式採民主選舉法CompanyLogo第二十三頁,共五十五頁。記憶基礎(chǔ)推論法分析(續(xù))實(shí)驗(yàn)結(jié)果
總和標(biāo)準(zhǔn)化總和歐基里徳距離絕對差0.760.760.6267平方差0.62670.62670.56標(biāo)準(zhǔn)差0.880.880.9333CompanyLogo第二十四頁,共五十五頁。實(shí)例一總結(jié)決策樹因?yàn)橛幸粭l條的分類規(guī)則輸出,較易解釋獲得之分類結(jié)果,在實(shí)務(wù)上較受歡迎,且輸出之規(guī)則可做為未來決策判斷之用。貝氏分類法以貝氏定理為基礎(chǔ)簡單易用,且只需知道各類別所包含的資料個(gè)數(shù),即可計(jì)算出機(jī)率,因此此方法具漸增性–當(dāng)資料增加時(shí)不必從頭計(jì)算,只需將新舊資料各類別之資料數(shù)加總即可。記憶基礎(chǔ)推論法之預(yù)測效果最優(yōu),對於小樣本也可獲得不錯(cuò)的準(zhǔn)確度,然而卻也是此方法之缺點(diǎn),此法因?yàn)橛?jì)算量太過龐大,不適於大樣本之預(yù)測。CompanyLogo第二十五頁,共五十五頁。資料導(dǎo)向的選股模型建構(gòu)臺(tái)灣上市公司個(gè)股應(yīng)用臺(tái)灣大盤指數(shù)應(yīng)用CompanyLogo第二十六頁,共五十五頁。臺(tái)灣上市公司個(gè)股應(yīng)用此部份將資料探勘技術(shù)應(yīng)用於股票市場,分析上市公司的財(cái)務(wù)資料,用以預(yù)測下一季的股票平均季報(bào)酬,進(jìn)而使用這些規(guī)則來協(xié)助投資者建立選股模型。本實(shí)驗(yàn)採決策樹以及貝氏分類法進(jìn)行測試,詳細(xì)如下CompanyLogo第二十七頁,共五十五頁。決策樹實(shí)驗(yàn)設(shè)定
參與屬性
現(xiàn)金週轉(zhuǎn)率、資產(chǎn)週轉(zhuǎn)率、營收成長率、成本率、營業(yè)比率、股東權(quán)益報(bào)酬率、資產(chǎn)報(bào)酬率、財(cái)務(wù)槓桿度、資產(chǎn)、負(fù)債、股本、營業(yè)淨(jìng)利、稅後淨(jìng)利成長率、營業(yè)外收支、基本EPS、季平均報(bào)酬…等16個(gè)屬性目標(biāo)屬性
季平均報(bào)酬,0代表低於門檻,1代表高於門檻。門檻值
目標(biāo)屬性分類的依據(jù),此實(shí)驗(yàn)測試季平均報(bào)酬0%、3%、5%三種情況。雜訊處理
將2標(biāo)準(zhǔn)差以外的資料視為雜訊,予以刪除。資料離散化
以等寬裝箱法,將連續(xù)型資料分為3類,詳細(xì)資料請見下列資料轉(zhuǎn)換前數(shù)值表,以及資料轉(zhuǎn)換後數(shù)值表。實(shí)驗(yàn)資料
臺(tái)灣上市公司2000年第一季至2007第三季。樣本選取
經(jīng)過雜訊處理後剩下11548筆,隨機(jī)挑選7698筆為訓(xùn)練樣本,3850筆為測試樣本。探勘演算法
C4.5中止條件
最大深度5層,最低樣本比例1%,以及無限制。CompanyLogo第二十八頁,共五十五頁。決策樹(續(xù))實(shí)驗(yàn)結(jié)果
季平均報(bào)酬0%實(shí)驗(yàn)結(jié)果
季平均報(bào)酬3%實(shí)驗(yàn)結(jié)果季平均報(bào)酬5%實(shí)驗(yàn)結(jié)果無限制最大深度5最低樣本比例1%樣本內(nèi)準(zhǔn)確度0.55720.52360.5423樣本外準(zhǔn)確度0.49320.52470.5106無限制最大深度5最低樣本比例1%樣本內(nèi)準(zhǔn)確度0.70170.69560.6945樣本外準(zhǔn)確度0.6660.68520.6813無限制最大深度5最低樣本比例1%樣本內(nèi)準(zhǔn)確度0.78940.78440.7832樣本外準(zhǔn)確度0.75420.7750.7732CompanyLogo第二十九頁,共五十五頁。決策樹(續(xù))分類規(guī)則由圖中規(guī)則可知,營收成長率、股東權(quán)益報(bào)酬率、資產(chǎn)週轉(zhuǎn)率…等屬性較為重要,投資者在分析公司財(cái)務(wù)狀況時(shí),可以多留意這些屬性,例如,由圖15之規(guī)則我們可知營收成長率介於1612.85~3437.00,且資產(chǎn)週轉(zhuǎn)率介於0.14~0.34則平均季報(bào)酬大於5%,因此在進(jìn)行股票選擇時(shí),投資者可優(yōu)先考量符合此條件之公司。CompanyLogo第三十頁,共五十五頁。貝氏分類法實(shí)驗(yàn)設(shè)定參與屬性
現(xiàn)金週轉(zhuǎn)率、資產(chǎn)週轉(zhuǎn)率、營收成長率、成本率、營業(yè)比率、股東權(quán)益報(bào)酬率、資產(chǎn)報(bào)酬率、財(cái)務(wù)槓桿度、資產(chǎn)、負(fù)債、股本、營業(yè)淨(jìng)利、稅後淨(jìng)利成長率、營業(yè)外收支、基本EPS、季平均報(bào)酬…等16個(gè)屬性目標(biāo)屬性
季平均報(bào)酬,0代表低於門檻,1代表高於門檻。門檻值
目標(biāo)屬性分類的依據(jù),此實(shí)驗(yàn)測試季平均報(bào)酬0%、3%、5%三種情況。雜訊處理
將2標(biāo)準(zhǔn)差以外的資料視為雜訊,予以刪除。資料離散化
以等寬裝箱法,將連續(xù)型資料分為3類,,詳細(xì)資料請見下列資料轉(zhuǎn)換前數(shù)值表,以及資料轉(zhuǎn)換後數(shù)值表。實(shí)驗(yàn)資料
臺(tái)灣上市公司2000年第一季至2007第三季。樣本選取
經(jīng)過雜訊處理後剩下11548筆,隨機(jī)挑選7698筆為訓(xùn)練樣本,3850筆為測試樣本。探勘演算法
貝氏分類CompanyLogo第三十一頁,共五十五頁。貝氏分類法(續(xù))實(shí)驗(yàn)結(jié)果
門檻值0%門檻值3%門檻值5%樣本內(nèi)準(zhǔn)確度0.50520.6843
0.7708樣本外準(zhǔn)確度0.49640.68180.7734CompanyLogo第三十二頁,共五十五頁。臺(tái)灣上市公司個(gè)股應(yīng)用總結(jié)以季平均報(bào)酬5%所得預(yù)測效果不管終止條件為何皆較其他為好。實(shí)驗(yàn)最佳準(zhǔn)確度約為70%,表現(xiàn)並不優(yōu)異,可就參與屬性多做調(diào)整,已達(dá)到更理想的目標(biāo)。CompanyLogo第三十三頁,共五十五頁。臺(tái)灣大盤指數(shù)應(yīng)用本案例使用技術(shù)指標(biāo),結(jié)合決策樹C4.5演算法,用以預(yù)測臺(tái)灣大盤趨勢,先利用系統(tǒng)求得分類規(guī)則,再挑選出具代表性之規(guī)則,利用所挑選之規(guī)則進(jìn)行回測,以測試投資績效。CompanyLogo第三十四頁,共五十五頁。資料區(qū)間資料為1968年1月至2007年12月每日之TES指數(shù),本實(shí)驗(yàn)以移動(dòng)視窗法將資料進(jìn)行分段,每段十五年,共分六段,每段中以前八年為訓(xùn)練樣本,次兩年為測試樣本,最後五年之資料進(jìn)行回測,每段移動(dòng)幅度為五年,如下圖:CompanyLogo第三十五頁,共五十五頁。資料數(shù)值說明變數(shù)名稱
資料型態(tài)
數(shù)值說明
移動(dòng)平均(MA)類別0:其他1:MA走勢向上,指數(shù)由下向上突破MA(黃金交叉)2:MA走勢向下,指數(shù)由上向下突破MA(死亡交叉)3:MA走勢向上,指數(shù)向下突破MA(假跌破)4:MA走勢向下,指數(shù)向上突破MA(假突破)5:指數(shù)由上而下逼近MA,但沒有跌破MA,且向上翻升(拉回)6:指數(shù)由下而上逼近MA,但沒有突破MA,且向下反轉(zhuǎn)(反彈)乖離率(BIAS)類別0:其他1:BIAS小於-4.5%2:BIAS大於5%指數(shù)平滑異同移動(dòng)平均(MACD)類別0:其他1:DIF由下而上突破MACD2:DIF由下突破MACDCompanyLogo第三十六頁,共五十五頁。實(shí)驗(yàn)設(shè)定參與屬性
MA、BIAS、MACD、KD…等十三個(gè)技術(shù)指標(biāo)目標(biāo)屬性
指數(shù)投資報(bào)酬率探勘演算法
C4.5中止條件
最大深度5層,最大深3層。CompanyLogo第三十七頁,共五十五頁。實(shí)驗(yàn)結(jié)果最大深度3層實(shí)驗(yàn)準(zhǔn)確度最大深度5層實(shí)驗(yàn)準(zhǔn)確度期間
1968~1977
1973~1982
1978~1987
1983~1992
1988~1997
1993~2002
1998~2007
準(zhǔn)確度
0.59720.58180.60490.65270.5610.640206061期間
1968~1977
1973~1982
1978~1987
1983~1992
1988~1997
1993~2002
1998~2007
準(zhǔn)確度
0.6736
0.6695
0.6224
0.7047
0.6272
0.685
0.6551
CompanyLogo第三十八頁,共五十五頁。有效規(guī)則篩選期間買賣訊號(hào)使用指標(biāo)規(guī)則說明1968~1997買DMI,BR,BIAS,OBV(1)+DI由上而下突破-DI且BR介於0.6~5.2間(2)乖離率介於-0.045~0.05間且OBV值由正轉(zhuǎn)負(fù)賣DMI,BIAS,%R,OBV(1)+DI由下而上突破-DI且WMS%R介於20~80間(2)乖離率介於-0.045~0.05間且OBV值由負(fù)轉(zhuǎn)正1973~1982買BIAS,MA,DMI,%R(1)乖離率介於-0.045~0.05間且MA走勢向下,指數(shù)由上向下突破MA(死亡交叉)(2)乖離率介於-0.045~0.05間且MA走勢向上,指數(shù)向下突破MA(假跌破)(3)乖離率介於-0.045~0.05間且指數(shù)由下而上逼近MA,但沒有突破MA,且向下反轉(zhuǎn)(反彈)賣BIAS,MA,DMI,PSY(1)乖離率介於-0.045~0.05間且MA走勢向上,指數(shù)由下向上突破MA(黃金交叉)(2)乖離率介於-0.045~0.05間且MA走勢向下,指數(shù)向上突破MA(假突破)(3)乖離率介於-0.045~0.05間且指數(shù)由上而下逼近MA,但沒有跌破MA,且向上翻升(拉回)(4)+DI由下而上突破-DI且乖離率介於25%~75%間1978~1987買BIAS,DMI,%R(1)乖離率介於-0.045~0.05間且9日WMS%R值大於80(2)乖離率介於-0.045~0.05間且+DI由上而下突破-DI賣BIAS,DMI,%R(1)乖離率介於-0.045~0.05間且9日WMS%R值小於20(2)乖離率介於-0.045~0.05間且+DI由下而上突破-DICompanyLogo第三十九頁,共五十五頁。有效規(guī)則篩選
(續(xù))期間買賣訊號(hào)使用指標(biāo)規(guī)則說明1983~1992買BIAS,DMI,%R乖離率小於-0.045乖離率介於-0.045~0.05間且9日WMS%R值大於80乖離率介於-0.045~0.05間且+DI由上而下突破-DI賣BIAS,DMI,%R(1)乖離率介於-0.045~0.05間且9日WMS%R值小於20(2)乖離率介於-0.045~0.05間且+DI由下而上突破-DI且WMS%R介於20~80間1988~1997買BIAS,MA,DMI乖離率小於-0.045乖離率介於-0.045~0.05間且MA走勢向下,指數(shù)由上向下突破MA(死亡交叉)乖離率介於-0.045~0.05間且MA走勢向上,指數(shù)向下突破MA(假跌破)乖離率介於-0.045~0.05間且+DI由上而下突破-DI賣BIAS,MA,DMI(1)乖離率介於-0.045~0.05間且MA走勢向上,指數(shù)由下向上突破MA(黃金交叉)(2)乖離率介於-0.045~0.05間且MA走勢向下,指數(shù)向上突破MA(假突破)(3)乖離率介於-0.045~0.05間且指數(shù)由上而下逼近MA,但沒有跌破MA,且向上翻升(拉回)(4)乖離率介於-0.045~0.05間且指數(shù)由下而上逼近MA,但沒有突破MA,且向下反轉(zhuǎn)(反彈)(5)乖離率介於-0.045~0.05間且+DI由下而上突破-DI且WMS%R介於20~80間1993~2002買BIAS,DMI,%R,PSY(1)乖離率介於-0.045~0.05間且9日WMS%R值大於80(2)乖離率介於-0.045~0.05間且+DI由上而下突破-DI(3)乖離率小於-0.045且PSY介於25%~75%之間賣BIAS,DMI,%R(1)乖離率介於-0.045~0.05間且9日WMS%R值小於20(2)乖離率介於-0.045~0.05間且+DI由下而上突破-DICompanyLogo第四十頁,共五十五頁?;販y系統(tǒng)所獲得之分類規(guī)則,無非想建立一選股模型,以運(yùn)用於股票市場,期能對投資者有所幫助,此處說明將先前獲得之分類規(guī)則做適當(dāng)處理,再利用程式交易軟體”TradeStation”對選股規(guī)則進(jìn)行回測,驗(yàn)證選股模型對投資者是否有所幫助。報(bào)酬率回測期間1978~19821983~19871988~19921993~19971998~20022003~2007總報(bào)酬率53%-574.8%1707.8%985%-629.2%866.8%CompanyLogo第四十一頁,共五十五頁。交易資訊以及報(bào)酬曲線期間一(1978~1982)交易資訊
期間一(1978~1982)報(bào)酬曲線期初金額100000期末淨(jìng)利53000交易次數(shù)30獲利次數(shù)23勝率76.67%平均交易獲利/損失1766.67最大獲利金額30000最大損失金額-26000平均獲利交易金額4452.17平均損失交易金額-7057.14期末報(bào)酬率53%CompanyLogo第四十二頁,共五十五頁。交易資訊以及報(bào)酬曲線(續(xù))期間二(1983~1987)交易資訊期間二(1983~1987)報(bào)酬曲線期初金額100000期末淨(jìng)利-574800交易次數(shù)154獲利次數(shù)96勝率62.34%平均交易獲利/損失-3732.47最大獲利交易金額167800最大損失交易金額-286200平均獲利交易金額4608.33平均損失交易金額-17537.93期末報(bào)酬率-574.8%CompanyLogo第四十三頁,共五十五頁。交易資訊以及報(bào)酬曲線(續(xù))期間三(1988~1992)交易資訊期間三(1988~1992)報(bào)酬曲線期初金額100000期末淨(jìng)利交易次數(shù)114獲利次數(shù)56勝率49.12%平均交易獲利/損失14980.7最大獲利交易金額934800最大損失交易金額-287800平均獲利交易金額86514.29平均損失交易金額-54086.21期末報(bào)酬率1707.8%CompanyLogo第四十四頁,共五十五頁。交易資訊以及報(bào)酬曲線(續(xù))期間四(1993~1997)交易資訊期間四(1993~1997)報(bào)酬曲線期初金額100000期末淨(jìng)利985000交易次數(shù)186獲利次數(shù)106勝率56.99%平均交易獲利/損失5295.7最大獲利交易金額293200最大損失交易金額-104000平均獲利交易金額33416.98平均損失交易金額-31965期末報(bào)酬率985%CompanyLogo第四十五頁,共五十五頁。交易資訊以及報(bào)酬曲線(續(xù))期間五(1998~2002)交易資訊
期間五(1998~2002)報(bào)酬曲線期初金額100000期末淨(jìng)利-629200交易次數(shù)243獲利次數(shù)144勝率59.26%平均交易獲利/損失-2589.3最大獲利交易金額203200最大損失交易金額-395800平均獲利交易金額27530.56平均損失交易金額-46400期末報(bào)酬率-629.2%CompanyLogo第四十六頁,共五十五頁。交易資訊以及報(bào)酬曲線(續(xù))期間六(2003~2007)交易資訊期間六(2003~2007)報(bào)酬曲線期初金額100000期末淨(jìng)利-629200交易次數(shù)217獲利次數(shù)144勝率65.44%平均交易獲利/損失-2589.3最大獲利交易金額204000最大損失交易金額-395800平均獲利交易金額20814.08平均損失交易金額-46400期末報(bào)酬率866.8%CompanyLogo第四十七頁,共五十五頁。臺(tái)灣大盤指數(shù)應(yīng)用總結(jié)由實(shí)驗(yàn)結(jié)果看出,第二及第五段訓(xùn)練期間所得之規(guī)則,使用移動(dòng)平均作為判斷依據(jù),在TradeStation回測下所得之報(bào)酬皆為負(fù)報(bào)酬,且由報(bào)酬曲線可看出,隨著交易次數(shù)增多,投資報(bào)酬率漸漸趨向於負(fù),曲線呈負(fù)斜率,投資者在做投資時(shí)可稍加留意。由第三、第四以及第六訓(xùn)練期間所得之規(guī)則,同時(shí)使用乖離率、趨向指標(biāo)以及威廉指標(biāo)作為選股依據(jù),可獲得良好之報(bào)酬率,再觀察報(bào)酬曲線,可發(fā)現(xiàn)使用此三項(xiàng)指標(biāo)作為策略依據(jù)之報(bào)酬曲線,期間雖小有震盪,但大致趨勢呈正斜率,此三指標(biāo)應(yīng)可作為投資者參考之用。CompanyLogo第四十八頁,共五十五頁。結(jié)論與未來研究此篇論文簡單說明了資料採礦方法及其應(yīng)用,並以自建系統(tǒng)操作兩個(gè)實(shí)例,分別為銀行和股市方面的應(yīng)用,期望能以系統(tǒng)所得之分類規(guī)則幫助使用者決策。在銀行應(yīng)用方面,對銀行貸款資料進(jìn)行分析,以本系統(tǒng)所提供之各方法求得之分類規(guī)則,準(zhǔn)確度約為70%
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 跨境包裹運(yùn)輸協(xié)議2025
- 朝陽單招考試題目及答案
- 礦山救護(hù)工試題及答案
- 2025-2026九年級(jí)道德與法治上學(xué)期期末測試
- 衛(wèi)生院應(yīng)急值守管理制度
- 中學(xué)生教室衛(wèi)生管理制度
- 落實(shí)美發(fā)店衛(wèi)生管理制度
- 行車室衛(wèi)生管理制度
- 鄉(xiāng)鎮(zhèn)衛(wèi)生院廉政管理制度
- 寢室值日衛(wèi)生制度
- 四川省遂寧市2026屆高三上學(xué)期一診考試英語試卷(含答案無聽力音頻有聽力原文)
- 福建省寧德市2025-2026學(xué)年高三上學(xué)期期末考試語文試題(含答案)
- 建筑施工行業(yè)2026年春節(jié)節(jié)前全員安全教育培訓(xùn)
- 2026屆高考語文復(fù)習(xí):小說人物形象復(fù)習(xí)
- 2026及未來5年中國防病毒網(wǎng)關(guān)行業(yè)市場全景調(diào)查及發(fā)展前景研判報(bào)告
- 2026年山東省煙草專賣局(公司)高校畢業(yè)生招聘流程筆試備考試題及答案解析
- 八年級(jí)下冊《昆蟲記》核心閱讀思考題(附答案解析)
- 煤礦復(fù)產(chǎn)安全培訓(xùn)課件
- 2025年中職藝術(shù)設(shè)計(jì)(設(shè)計(jì)理論)試題及答案
- 2026屆高考?xì)v史二輪突破復(fù)習(xí):高考中外歷史綱要(上下兩冊)必考??贾R(shí)點(diǎn)
- 鐵路交通法律法規(guī)課件
評論
0/150
提交評論