版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于MLP神經(jīng)網(wǎng)絡(luò)的AI量化模型的構(gòu)建分析案例目錄基于MLP神經(jīng)網(wǎng)絡(luò)的AI量化模型的構(gòu)建分析案例 11.1AI量化投資模型的概述 11.2AI量化模型的構(gòu)建 3 51.2.2量化投資策略的構(gòu)建 8 1.1AI量化投資模型的概述行交易。AI量化模型就是把人工智能中各種機器學(xué)習(xí)的算法引入量化模型開發(fā)我們把AI量化模型看作一個函數(shù),它試圖解釋自變量(因子特征)和因變量(目標)之間的關(guān)系。我們以“一線穿多陽”的選股邏輯作為例子,來解釋AI量化模型如何把選股邏輯轉(zhuǎn)化為可量化的因子特征和目標,并通過對這些數(shù)據(jù)的機器學(xué)習(xí)總結(jié)選股規(guī)律,我們用圖4-1展示這個流程:選股邏輯選股邏輯·收盤價和10日均線的比例·收盤價和20日均線的比例·開盤價和5日均線的比例·開盤價和10日均線的比例·開盤價和20日均線的比例·收盤價和開盤價比例機器學(xué)習(xí)新的因子特征數(shù)據(jù)決策模型預(yù)測未來5日收益率圖4-1“一線穿多陽”為選股邏輯的AI量化模型的簡單示意圖以及與影響目標的因子特征(“收盤價和5日均線比例”等的因子特征);接著把目標和因子特征數(shù)據(jù)合并起來,通過機器學(xué)習(xí)來探索目標(未來5日收益率的漲跌)與因子特征之間規(guī)律,進而構(gòu)建選股的決策模型;然后在決策模型中輸入新的因子特征數(shù)據(jù),用來預(yù)測“未來5日收益率”;最后根據(jù)預(yù)測結(jié)果選擇股票以上是簡化版的AI量化模型,我們把AI量化模型展開,它是一個包含了多開發(fā)一個AI量化模型,主要包括以下流程:第一步數(shù)據(jù)準備第二步機器學(xué)習(xí)算法模型的構(gòu)建第三步量化投資策略的構(gòu)建第五步量化模型的優(yōu)化根據(jù)以上的開發(fā)流程,本文基于MLP神經(jīng)網(wǎng)絡(luò)的AI量化模型的構(gòu)建的技術(shù)線路如圖4-2所示:投資邏輯投資邏輯優(yōu)化訓(xùn)練數(shù)據(jù)年因子歷史數(shù)據(jù)因子歷史數(shù)據(jù)合并數(shù)據(jù)1.2AI量化模型的構(gòu)建投資邏輯:以Fama-French三因子模型為基礎(chǔ),我們認為上個公司指標作為因子特征、未來5日收益率作為目標標簽。模型簡介(原始版)因子數(shù)量:2個是否對因子數(shù)據(jù)預(yù)處理:是標注:未來5日收益(不做離散化)是否對標注數(shù)據(jù)標準化處理:是訓(xùn)練集數(shù)據(jù):2010/01/01~2019/01/01實驗集數(shù)據(jù):2019/01/01~2020/02/11持股數(shù):5持倉天數(shù):5機器學(xué)習(xí)算法:MLP神經(jīng)網(wǎng)絡(luò)損失函數(shù):MESBatch-size:1024個(每次訓(xùn)練1024個樣本)Epoch:5輪(共訓(xùn)練5輪)神經(jīng)網(wǎng)絡(luò)層數(shù):2層表4-3模型簡介(原始版)BB■圖4-4AI量化模型(原始版)1.2.1.1數(shù)據(jù)獲取(2)回溯時間:量化投資模型的研發(fā)與構(gòu)建需要大量的數(shù)據(jù)樣本,訓(xùn)練就變差。訓(xùn)練數(shù)據(jù)使用2010年1月1日到2019年1月1日之間的數(shù)據(jù)。在機器學(xué)習(xí)中,訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)比例一般是8:2,或者7:3。測試數(shù)據(jù)使用2019年1月1日到2020年02月11日之間的數(shù)據(jù)。(3)股票數(shù)量:為了適用于更廣泛的市場環(huán)境,需要選擇大量的股票。誤導(dǎo)模型的學(xué)習(xí)。本文采用A股市場的股票過濾了ST、*ST、股票數(shù)量是3560個;在測試數(shù)據(jù)中,股票數(shù)量是4159個。訓(xùn)練數(shù)據(jù)的因子特征數(shù)據(jù)和目標標簽數(shù)據(jù)需要分開處理,然后進行數(shù)據(jù)合b)固定比例去極值:把某列數(shù)據(jù)以降序排列,以1%和99%分位的值為界,大于99%的數(shù)據(jù),重設(shè)為99%分位的值;小于1%的數(shù)以1%重設(shè)為1%分為的值。其標準差,得到一個新的近似服從均值為0、方差為1的序列。為序列為Di,DM為該序列中位數(shù),DM1為序列、Di-DM|的中位數(shù),則將序列Di中所有大于DM+5DM1的數(shù)重設(shè)為DM+5DM1,將序列Di中所有小于DM+5M?的數(shù)重設(shè)為DM+5DM1,將序列Di中所有小于DM-5DM1的數(shù)成設(shè)為DM-5DM1。會讓模型在學(xué)習(xí)中陷入混亂,從而導(dǎo)致輸出誤導(dǎo)性的規(guī)律。缺失值處理的方法有多種,在這里,我們使用缺失值中位數(shù)填充。所謂缺失值中位數(shù)據(jù)總量是5232590行、10列(股票數(shù)量3560個,因子數(shù)量2個,時間-值類型:字符型唯一值:3560o圖4-5訓(xùn)練數(shù)據(jù)總量(原始版)數(shù)據(jù)共1870286行,4列缺失值:0o圖4-6測試數(shù)據(jù)總量(原始版)1.2.2量化投資策略的構(gòu)建策略的構(gòu)建包括:投資組合、風(fēng)險管理、交易成本。這三個部分都與模型的預(yù)期收益密切相關(guān),相互影響。如何分配投資組合中各個股票的比例,主要考慮期望收益、風(fēng)險控制、交易成本之間的平衡。如果我們過于強調(diào)交易機會,那么就會因為忽視對風(fēng)險的管理而導(dǎo)致?lián)p失;如果我們過于強調(diào)風(fēng)險管理,那么會因為忽視交易機會而造成收益的減少;如果我們過于強調(diào)交易成本,那么我們可能會因為不愿意承擔(dān)投資組合更新的交易成本,而過度延長股票的持倉時間。常見的投資組合模型有兩大類:相等權(quán)重組合、非等權(quán)重組合。等權(quán)重組合,是指每一個股票的資金分配都一樣。非等權(quán)重組合,是指每一個股票的資金分配與預(yù)測結(jié)果排名相關(guān),排名越靠前,資金分配越重。這兩種權(quán)重組合各有優(yōu)點和缺點。對于等權(quán)重組合,如果模型預(yù)測有誤,它會把損失降低;但如果模型預(yù)測準確,也會把效益降低。對于非等權(quán)重組合,如果模型預(yù)測有誤,它會把損失增加;但如果模型預(yù)測準確,也會把效益增加。本文使用非等權(quán)重組合買入股票:根據(jù)模型對股票未來5個日的收益率的預(yù)測值進行降序排序,按照非等權(quán)重組合,做多排名前面五只股票。持有一定量的股票后,賣出持倉的股票:按模型預(yù)測的收益率排序進行末位淘汰,做空排名靠后的股票。簡單來說,模型每天發(fā)出指令:做多排名靠前的5只股票、做空排名靠后的5只股票,構(gòu)成多、空對沖的投資組合。資金在買入和賣出中循環(huán)滾動中,通過多、空對沖的價差組合盈利。一般來說,風(fēng)險管理可以控制模型收益的波動性,優(yōu)點是降低重大損失發(fā)生的可能,缺點是會降低盈利水平。在量化投資中,資金規(guī)??刂剖秋L(fēng)險管理中的重要手段。一個量化模型,如果缺乏對資金規(guī)模的控制,它會根據(jù)算法讓所有的資金投在某一次交易中。無論這個模型的盈利看起來有多么確定無疑,但是這種“把所有雞蛋都放在同一個籃子中”的做法,顯然風(fēng)險太高,并不是一個好的選擇。本文通過以下方式對資金規(guī)??刂苼斫档惋L(fēng)險:(1)控制總的資金規(guī)模。量化策略都要設(shè)定一個初始資金。我們開發(fā)模型中,設(shè)定初始資金是100萬。(2)控制每日資金規(guī)模。模型開始運行的時候,我們按照持倉天數(shù)(模型中的持倉天數(shù)是5天),把資金分為5等份,每天使用等量資金,并且規(guī)定每天買入最多使用等量資金的1.5倍;之后就使用剩余資金。剩余資金由每天賣出股票(3)控制每只股票的資金規(guī)模。每天按照非等權(quán)重方法買入5只股票,同時強行規(guī)定每只股票占用的最大資金比例是20%,無論算法給出的信號多么強烈。我們用資金規(guī)??刂苼砉芾盹L(fēng)險:犧牲來自模型正確判斷的部分收益,同時也避免因為模型誤判而導(dǎo)致重大損失的風(fēng)險,通過這種折中的辦法來提高模型收益的穩(wěn)定性。在量化投資中,所有交易都是有成本,因此,進行交易需要有足夠的理由,要不就是為了增加盈利、要不就是為了降低虧損。但是,把交易成本降到最低,并不是量化模型的目的。這是因為,如果在開發(fā)模型的時候,高估了交易成本,會導(dǎo)致交易次數(shù)過少,錯失盈利或者止損的最佳時機;低估了交易成本,會導(dǎo)致交易過于頻繁,交易成本過高導(dǎo)致入不敷出。交易成本由三個部分構(gòu)成,分別是手續(xù)費、滑價、市場沖擊成本。本文的交入手續(xù)費為0.03%、賣出手續(xù)費為0.13%(0.13%的手續(xù)費已經(jīng)包含了0.03%的傭金加上0.1%的印花稅)、每筆交易最低手續(xù)費為5元。手續(xù)費和投資組合中股確定了代碼運行正常后,我們首先要看模型在訓(xùn)練數(shù)據(jù)上的表現(xiàn)。本文的MLP神經(jīng)網(wǎng)絡(luò)用于回歸任務(wù),我們使用R2是檢驗?zāi)P驮谟?xùn)練數(shù)據(jù)上,解釋被預(yù)測數(shù)據(jù)的變異程度,它的公式是率。R2的值在0~1之間。R2越接近1,表示模型在訓(xùn)練數(shù)據(jù)上的解釋過去的能追求模型泛化能力的目標最終是表現(xiàn)在模型能否達公式中的rp表示模型的總收益;Vt表示模型最終的股票和現(xiàn)金的總價值;行天數(shù)(每年交易天數(shù)250天)。基準收益率是模型的標桿(benchmark),它通常與模型的總收益率進行比較。在本文,我們使用A股市場通常使用的滬深300指數(shù)作為基準收益率。阿爾法是模型相對于基準收益的超額收益,阿爾法大于0,就是我們常說的“跑贏大盤”。夏普比率(Sharpratio,SR),用衡量投資組合收益減去無風(fēng)險收益率之差的總波動性,它的計算公式:公式中,SR是夏普比率,它衡量每增加一單位風(fēng)險,會增加多少超額收益率;Ip、rf分別代表該時期的資產(chǎn)收益率和無風(fēng)險收益率,0是投資組合收益率的標準差。信息比率(informationratio,IR)是資產(chǎn)組合相對于基準收益的超額收益和主動風(fēng)險的比值。如果信息比率=0時,則說明投資組合收益率與基準收益率持平;如果信息比率<0時,則說明投資組合收益率跑輸基準收益率;如果信息比率>0時,則說明投資組合收益率跑贏基準收益率。勝率是指盈利的交易次數(shù)占總體的交易次數(shù)的比例。對于量化模型來說,勝率起碼需要超過50%。(9)盈虧比盈虧比是指在平均盈利金額與平均虧損金額的比值。收益波動率是衡量模型在周期內(nèi)收益率穩(wěn)定性。收益率波動率越高,模型的收益越不穩(wěn)定。(11)最大回撤最大回撤(maxdrawdown),是指在一定時間周期內(nèi),模型可能達到最壞的情況。最大回撤的大小與選取的樣本區(qū)間有很大的關(guān)系,樣本區(qū)間越長,最大回撤可能越大。最大回撤表示模型在某段時間內(nèi)所承受最大風(fēng)險水平。1.2.3.4回測結(jié)果模型在訓(xùn)練數(shù)據(jù)(2010/01/01~2019/01/01)R2平均值達到99.95%。模型在測試數(shù)據(jù)(2019/01/01~2021/02/11)的收益指標和風(fēng)險指標如圖4-3所示:交易詳情每日持倉和收益輸出日志
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鏟車考試題庫及答案
- 沈陽五年級試題及答案
- 2025-2026人教版初中九年級語文上期末練習(xí)卷
- 腸道菌群與糖尿病管理新策略
- 2025-2026七年級美術(shù)期末測試冀教版
- 腮腺惡性腫瘤患者的護理效果評價與改進
- 腸梗阻的病因診斷與手術(shù)時機選擇
- 鵝口瘡的藥物治療與護理
- 衛(wèi)生所十項規(guī)章制度
- 養(yǎng)鴿場環(huán)境衛(wèi)生管理制度
- 2025年健康體檢中心服務(wù)與質(zhì)量管理手冊
- 2025-2030中國駱駝市場前景規(guī)劃與投資運作模式分析研究報告
- 2026中國電信四川公用信息產(chǎn)業(yè)有限責(zé)任公司社會成熟人才招聘備考題庫及完整答案詳解一套
- 鋼結(jié)構(gòu)玻璃雨棚安裝施工方案
- 2025初三英語中考英語滿分作文
- 2025云南保山電力股份有限公司招聘(100人)筆試歷年參考題庫附帶答案詳解
- 解析卷蘇科版八年級物理下冊《物質(zhì)的物理屬性》單元測試試題(含解析)
- 孕期梅毒課件
- 24年中央一號文件重要習(xí)題及答案
- (2025年標準)租金欠款還款協(xié)議書
- 2025年東航管理測試題庫及答案
評論
0/150
提交評論