20230511-華泰證券-金工:神經(jīng)網(wǎng)絡(luò)多頻率因子挖掘模型_第1頁
20230511-華泰證券-金工:神經(jīng)網(wǎng)絡(luò)多頻率因子挖掘模型_第2頁
20230511-華泰證券-金工:神經(jīng)網(wǎng)絡(luò)多頻率因子挖掘模型_第3頁
20230511-華泰證券-金工:神經(jīng)網(wǎng)絡(luò)多頻率因子挖掘模型_第4頁
20230511-華泰證券-金工:神經(jīng)網(wǎng)絡(luò)多頻率因子挖掘模型_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

12017201820192020202120222023告金工華泰研究2017201820192020202120222023告金工華泰研究研究人工智能68:構(gòu)建神經(jīng)網(wǎng)絡(luò)多頻率因子挖掘模型,并用于指數(shù)增強(qiáng)神經(jīng)網(wǎng)絡(luò)能自動提取股票原始量價數(shù)據(jù)中的特征,實現(xiàn)端到端的因子挖掘和因子合成。本文重點(diǎn)研究如何設(shè)計網(wǎng)絡(luò)結(jié)構(gòu)以有效挖掘不同頻率的股票量價數(shù)據(jù)。我們先將神經(jīng)網(wǎng)絡(luò)運(yùn)用于15分鐘頻量價數(shù)據(jù)的挖掘,取得了較好效果,隨后再加入日頻數(shù)據(jù)構(gòu)建多頻率混合模型,并引入因子增量貢獻(xiàn)的思想神經(jīng)網(wǎng)絡(luò)多頻率因子挖掘模型研究研究員SACNo.S0570516010001SFCNo.BPY421研究員SACNo.S0570519110003SFCNo.BRV743研究員SACNo.S0570520080004SFCNo.BRB318linxiaoming@+(86)75582080134liziyu@+(86)75523987436hekang@+(86)2128972039設(shè)計了兩階段增量學(xué)習(xí)模型。在對比測試中,多頻率增量混合模型表現(xiàn)最好,構(gòu)建的各類指數(shù)增強(qiáng)策略表現(xiàn)優(yōu)秀。神經(jīng)網(wǎng)絡(luò)在15分鐘頻量價數(shù)據(jù)上表現(xiàn)較好,加入注意力機(jī)制后無改進(jìn)考慮到神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的特征提取能力,本文省去人工構(gòu)建因子的步驟,直接對標(biāo)準(zhǔn)化后的原始15分鐘K線數(shù)據(jù)進(jìn)行學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)骨干部分使用GRU網(wǎng)絡(luò)。樣本空間為全A股,模型在2017/1/4~2023/4/28的回測期內(nèi)周度RankIC均值為9.30%,分10層TOP組合年化超額收益率為24.18%(不計交易成本)。我們還嘗試對GRU加入注意力機(jī)制,希望幫助模型更好地記憶長程序列信息,但在本文的測試中,加入注意力機(jī)制后沒有改進(jìn)效果?;谌疹l+15分鐘頻數(shù)據(jù)的多頻率混合模型分層測試效果明顯提升為了融入更多市場信息,我們在15分鐘頻數(shù)據(jù)的模型上,加入日頻數(shù)據(jù),構(gòu)建多頻率混合模型。模型通過兩個輸入分別接收日頻量價和15分鐘頻量價數(shù)據(jù),并分別使用GRU提取特征,最后將兩部分特征拼接并對接輸出。樣本空間為全A股,模型在2017/1/4~2023/4/28的回測期內(nèi)周度RankIC均值為8.58%,分10層TOP組合年化超額收益率為30.12%(不計交易成本),TOP組合表現(xiàn)相比15分鐘頻模型提升明顯?;趨?shù)凍結(jié)+殘差預(yù)測的多頻率增量混合模型表現(xiàn)最好針對多頻率數(shù)據(jù)混合模型,我們引入因子增量貢獻(xiàn)的思想,設(shè)計了一個兩階段訓(xùn)練的增量學(xué)習(xí)模型。第一階段:只使用日頻量價數(shù)據(jù)訓(xùn)練對應(yīng)的神經(jīng)網(wǎng)絡(luò)分支,即先讓網(wǎng)絡(luò)學(xué)習(xí)日頻級別的量價信息,第一階段訓(xùn)練直到模型的loss收斂為止。第二階段:將日頻量價數(shù)據(jù)分支網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)凍結(jié),只前向傳播,然后引入15分鐘頻數(shù)據(jù)學(xué)習(xí)殘差,即再讓網(wǎng)絡(luò)學(xué)習(xí)分鐘頻量價數(shù)據(jù)能夠貢獻(xiàn)的增量信息。樣本空間為全A股,模型在2017/1/4~2023/4/28的回測期內(nèi)周度RankIC均值為10.22%,分10層TOP組合年化超額收益率為36.36%(不計交易成本),在本文的所有模型中表現(xiàn)最好。基于多頻率增量混合模型構(gòu)建多個指數(shù)增強(qiáng)組合,回測表現(xiàn)優(yōu)秀我們基于多頻率增量混合模型構(gòu)建多個指數(shù)增強(qiáng)組合,并回測了周雙邊換手率分別控制為30%、40%和50%的情況。在2017/1/4~2023/4/28的回測期內(nèi),滬深300增強(qiáng)組合年化超額收益率為8.77%~9.48%,信息比率為1.21~1.40。中證500增強(qiáng)組合年化超額收益率為17.39%~18.18%,信息29。中證1000增強(qiáng)組合年化超額收益率為28.93%~31.57%,信息比率為4.45~4.79。國證2000增強(qiáng)組合年化超額收益率為29.38%~31.19%,信息比率為4.09~4.25。風(fēng)險提示:通過人工智能模型構(gòu)建的選股策略是歷史經(jīng)驗的總結(jié),存在失效的可能。神經(jīng)網(wǎng)絡(luò)受隨機(jī)性影響較大、可解釋性較差,使用需謹(jǐn)慎。中證1000增強(qiáng)組合累積超額收益換手率=50%,超額收益回撤(右軸)換手率換手率=50%,超額收益回撤(右軸)換手率=50%,累積超額收益(左軸)400%300%200%100%0%5%0%-5%資料來源:華泰研究金工金工研究 加入注意力機(jī)制的15分鐘頻數(shù)據(jù)模型 6 基于參數(shù)凍結(jié)+殘差預(yù)測的增量學(xué)習(xí)模型 8 測試結(jié)果:15分鐘頻模型和15分鐘頻注意力模型 10測試結(jié)果:多頻率混合模型和多頻率增量混合模型 12 挖掘有效的因子是量化投資領(lǐng)域關(guān)注度經(jīng)久不衰的話題,AI技術(shù)的不斷發(fā)展為因子挖掘不斷提供新的可能。如下圖所示,在華泰金工前期研究《基于遺傳規(guī)劃的選股因子挖掘》(2019.6.10)和《AlphaNet:因子挖掘神經(jīng)網(wǎng)絡(luò)》(2020.6.14)中,已系統(tǒng)討論了基于遺傳規(guī)劃和神經(jīng)網(wǎng)絡(luò)的因子挖掘框架,其中神經(jīng)網(wǎng)絡(luò)能實現(xiàn)端到端的因子挖掘和因子合成。資料來源:華泰研究本文將進(jìn)一步探索將神經(jīng)網(wǎng)絡(luò)運(yùn)用于量價因子挖掘,并構(gòu)建超額收益顯著的選股策略。與前期研究相比,本文的特點(diǎn)在于:1.前期研究主要針對日頻量價數(shù)據(jù)挖掘,本文將著重研究日內(nèi)分鐘頻數(shù)據(jù)挖掘,并與日頻量價數(shù)據(jù)進(jìn)行整合。2.本文根據(jù)數(shù)據(jù)特性,嘗試了多種網(wǎng)絡(luò)結(jié)構(gòu),并在某些方向上取得了顯著的改進(jìn)效果。本文研究內(nèi)容如下圖所示。資料來源:華泰研究金工金工研究2017-012017-072018-012018-072019-012019-072020-012020-072021-012021-072022-012022-072023-01經(jīng)過測試,基于參數(shù)凍結(jié)+殘差預(yù)測的增量學(xué)習(xí)模型具有最好的選股效果,基于該模型構(gòu)建2017-012017-072018-012018-072019-012019-072020-012020-072021-012021-072022-012022-072023-01500%450%400%350%300%250%200%150%100% 50% 0%-50%換手率=30%,超額收益回撤(右軸)換手率=50%,超額收益回撤(右軸)換手率=40%,超額收益回撤(右軸)換手率=30%,累積超額收益(左軸) 換手率=40%,累積超額收益(左軸)換手率=50%,累積超額收益(左軸)10%8%6%4%2%0%-2%-4%-6%-8%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究換手率=30%換手率=40%換手率=50%年化收益率23.70%24.09%-4.27%年化波動率22.88%23.01%22.92%夏普比率1.041.051.13-0.19最大回撤28.66%29.09%28.46%年化超額收益率28.93%29.38%31.57%年化跟蹤誤差6.51%6.56%6.59%超額收益最大回撤5.52%5.57%4.62%信息比率Calmar比率4.454.484.795.245.274.454.484.79相對基準(zhǔn)月勝率82.67%90.67%90.67%調(diào)倉雙邊換手率32.84%42.27%51.42%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究2017年收益率2018年收益率2019年收益率2020年收益率2021年收益率2022年收益率2023年收益率換手率=30%4.62%-10.60%57.97%38.29%63.38%1.58%9.87%換手率=40%11.75%-12.21%60.37%37.92%59.81%-0.12%9.86%換手率=50%10.91%-8.66%64.26%39.92%61.92%0.45%11.18%中證1000-19.06%-36.87%25.67%19.39%20.52%-21.58%7.03%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究金工金工研究本章的模型具有以下要點(diǎn):1.針對日內(nèi)分鐘頻數(shù)據(jù),可先人工構(gòu)建因子再輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)。但考慮到神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的特征提取能力,我們將省去人工構(gòu)建因子的步驟,直接對股票原始的15分鐘K線數(shù)據(jù)進(jìn)行學(xué)習(xí)。2.為了保證模型訓(xùn)練的穩(wěn)定,輸入數(shù)據(jù)的分布要有較高的一致性,因此雖然輸入的是原始K線數(shù)據(jù),仍需要對數(shù)據(jù)進(jìn)行時序和截面標(biāo)準(zhǔn)化。3.標(biāo)準(zhǔn)化后的數(shù)據(jù)即可輸入到常用的時序神經(jīng)網(wǎng)絡(luò)GRU中進(jìn)行訓(xùn)練。模型的具體細(xì)節(jié)如下方圖表所示。資料來源:華泰研究特征和標(biāo)簽?zāi)P徒Y(jié)構(gòu)模型其他參數(shù)特征X:個股過去20個交易日的15分鐘頻開、高、低、收、vwap、成交量數(shù)據(jù),序列長度為20*16=320標(biāo)簽y:個股未來10個交易日的收益率。特征預(yù)處理:每個特征先進(jìn)行時間序列標(biāo)準(zhǔn)化,即將特征時間序列的每個值除以該序列的均值。再對每個特征進(jìn)行截面z-score標(biāo)準(zhǔn)化。標(biāo)簽預(yù)處理:對標(biāo)簽進(jìn)行截面z-score標(biāo)準(zhǔn)化。樣本內(nèi)訓(xùn)練數(shù)據(jù)從2013年開始,每5個交易日采樣一次,訓(xùn)練集和驗證集依時間先后按照4:1的比例劃分。GRU:輸入維度6*320,輸出維度30,層數(shù)為1層。BN:對GRU的輸出進(jìn)行批標(biāo)準(zhǔn)化。FC:全連接層,輸入維度30,輸出維度1,對接模型輸出。損失函數(shù):預(yù)測值與標(biāo)簽之間IC的相反數(shù)。batch_size:5000。訓(xùn)練最大迭代輪數(shù):100,早停輪數(shù):10。m模型每隔半年重新訓(xùn)練一次。資料來源:華泰研究注意力機(jī)制(Attention)是當(dāng)前深度學(xué)習(xí)領(lǐng)域常用的技術(shù)。當(dāng)時序網(wǎng)絡(luò)GRU接收的序列過長時,可能會出現(xiàn)信息“遺忘”的問題,此時對GRU的輸出序列計算注意力可幫助模型更好地記憶長程序列信息。假設(shè)GRU模型輸出長度為M的特征序列zi,則針對zi的注意力計算過程如下。ui=tanh(wwzi+bw)∑1exp(uj)∑1exp(uj)yi=o=yizi模型的具體細(xì)節(jié)如下方圖表所示,我們參考微軟qlib(/microsoft/qlib)中ALSTM模型的相關(guān)代碼來實現(xiàn)。資料來源:華泰研究特征和標(biāo)簽?zāi)P徒Y(jié)構(gòu)模型其他參數(shù)特征X:個股過去20個交易日的15分鐘頻開、高、低、收、vwap、成交量數(shù)據(jù),序列長度為20*16=320標(biāo)簽y:個股未來10個交易日的收益率。數(shù)據(jù)預(yù)處理方法與圖表7中一致。GRU:輸入維度6*320,輸出維度30,層數(shù)為1層。Attention:計算GRU輸出序列之間的attentionscore,再加權(quán)到GRU輸出序列之上,輸出維度30。Concat:將GRU和Attention的輸出拼接,輸出維度為60BN:對Concat的輸出進(jìn)行批標(biāo)準(zhǔn)化。FC:全連接層,輸入維度60,輸出維度1,對接模型輸出。損失函數(shù):預(yù)測值與標(biāo)簽之間IC的相反數(shù)。batch_size:5000。訓(xùn)練最大迭代輪數(shù):100,早停輪數(shù):10。m模型每隔半年重新訓(xùn)練一次。資料來源:華泰研究為了融入更多市場信息,本章開始我們將在15分鐘頻數(shù)據(jù)的模型上加入日頻數(shù)據(jù),構(gòu)建多頻率數(shù)據(jù)混合模型。模型結(jié)構(gòu)如下圖所示,通過兩個輸入分別接收日頻量價和15分鐘頻量價數(shù)據(jù),并分別使用GRU提取特征,最后將兩部分特征拼接并對接輸出。模型整體結(jié)構(gòu)并不復(fù)雜。資料來源:華泰研究特征和標(biāo)簽?zāi)P徒Y(jié)構(gòu)模型其他參數(shù)日頻特征X:個股過去40個交易日的日頻開、高、低、收、vwap、成交量數(shù)據(jù)。標(biāo)簽y:個股未來10個交易日的收益率。特征預(yù)處理:每個特征先進(jìn)行時間序列標(biāo)準(zhǔn)化,即將特征時間序列的每個值除以該序列的最后一個值。再對每個特征進(jìn)行截面z-score標(biāo)準(zhǔn)化。分鐘頻數(shù)據(jù)及數(shù)據(jù)預(yù)處理方法與圖表7中一致。GRU1:輸入維度6*40,輸出維度30,輸出使用BN進(jìn)行批標(biāo)準(zhǔn)化。GRU2:輸入維度6*320,輸出維度30,輸出使用BN進(jìn)行批標(biāo)準(zhǔn)化。Concat:將GRU1和GRU2的輸出拼接,輸出維度為60。FC:全連接層,輸入維度60,輸出維度1,對接模型輸出。損失函數(shù):預(yù)測值與標(biāo)簽之間IC的相反數(shù)。batch_size:5000。訓(xùn)練最大迭代輪數(shù):100,早停輪數(shù):10。m模型每隔半年重新訓(xùn)練一次。資料來源:華泰研究基于參數(shù)凍結(jié)+殘差預(yù)測的增量學(xué)習(xí)模型本章模型是在上一章模型上的進(jìn)一步改進(jìn)。傳統(tǒng)量化投資中經(jīng)常討論的一個話題是因子的“增量貢獻(xiàn)”,實際上我們可以將因子增量貢獻(xiàn)的思想引入到神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)中,以實現(xiàn)端到端的增量學(xué)習(xí)模型。這不僅與傳統(tǒng)量化投資的思想吻合,也可能取得更好的模型效果。具體而言,我們設(shè)計了一個兩階段訓(xùn)練的增量學(xué)習(xí)模型:第一階段:只使用日頻量價數(shù)據(jù)訓(xùn)練對應(yīng)的神經(jīng)網(wǎng)絡(luò)分支,即先讓網(wǎng)絡(luò)學(xué)習(xí)日頻級別的量價信息。第一階段訓(xùn)練直到模型的loss收斂為止。第二階段:將日頻量價數(shù)據(jù)分支網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)凍結(jié),只前向傳播。然后引入15分鐘頻數(shù)據(jù),學(xué)習(xí)y和1之間的殘差,即再讓網(wǎng)絡(luò)學(xué)習(xí)分鐘頻量價數(shù)據(jù)能夠貢獻(xiàn)的增量信息。模型的具體細(xì)節(jié)如下方圖表所示。資料來源:華泰研究特征和標(biāo)簽?zāi)P徒Y(jié)構(gòu)模型其他參數(shù)數(shù)據(jù)預(yù)處理方法與圖表11中一致。GRU1:輸入維度6*40,輸出維度30,輸出使用BN進(jìn)行批標(biāo)準(zhǔn)化,再經(jīng)過全連接層FC1得到1。GRU2:輸入維度6*320,輸出維度30,輸出使用BN進(jìn)行批標(biāo)準(zhǔn)化,再經(jīng)過全連接層FC2得到2。損失函數(shù):預(yù)測值1+2與標(biāo)簽之間IC的相反數(shù)。batch_size:5000。訓(xùn)練最大迭代輪數(shù):100,早停輪數(shù):10。m模型每隔半年重新訓(xùn)練一次。資料來源:華泰研究下圖左側(cè)為常規(guī)模型訓(xùn)練過程中IC的變化,右側(cè)為兩階段訓(xùn)練模型訓(xùn)練過程中IC的變化,可知第一階段訓(xùn)練在第9個epoch收斂,隨后開始第二階段訓(xùn)練,第二階段訓(xùn)練在第40個epoch附近收斂。資料來源:Wind,華泰研究金工金工研究模型測試和對比本章我們將使用單因子測試的方式,對以下4個模型進(jìn)行測試和對比,為了減輕隨機(jī)性干擾,4個模型都用不同隨機(jī)數(shù)種子訓(xùn)練三次,將三次的模型等權(quán)集成。15分鐘頻模型:基于GRU的15分鐘頻數(shù)據(jù)模型。15分鐘頻注意力模型:加入注意力機(jī)制的15分鐘頻數(shù)據(jù)模型。多頻率混合模型:日頻+15分鐘頻數(shù)據(jù)混合模型。多頻率增量混合模型:基于參數(shù)凍結(jié)+殘差預(yù)測的增量學(xué)習(xí)模型。單因子測試方法如下:PT股票,剔除每個截面期下一交易日停牌、漲停的股票。2.回測區(qū)間:2017/1/4~2023/4/28。4.因子預(yù)處理:因子進(jìn)行去極值、行業(yè)市值中性化、標(biāo)準(zhǔn)化。15分鐘頻模型和15分鐘頻注意力模型的輸入數(shù)據(jù)完全一致,區(qū)別在于網(wǎng)絡(luò)結(jié)構(gòu),我們將對二者的測試結(jié)果進(jìn)行對比展示。整體來看,15分鐘頻注意力模型并未呈現(xiàn)出優(yōu)勢。CRankIC均值RankIC標(biāo)準(zhǔn)差I(lǐng)C_IRIC>0占比TOP組合年化超額收益率TOP組合信息比率TOP組合勝率TOP組合換手率15分鐘頻模型5.86%5.86%14.98%0.3966.78%15.39%1.6065.79%15分鐘頻注意力模型5.60%5.60%14.45%0.39115.95%1.6069.74%116.73%15分鐘頻模型66.57%10.97%0.6073.62%17.33%2.1468.42%122.66%15分鐘頻注意力模型66.24%10.58%0.5976.22%110.58%1.4065.79%118.76%15分鐘頻模型8.97%8.97%8.95%1.0085.67%23.77%3.4282.89%126.28%15分鐘頻注意力模型8.49%8.49%8.94%0.9584.36%118.40%2.7977.63%116.98%15分鐘頻模型9.30%9.30%1.1586.97%3.9580.26%15分鐘頻注意力模型9.01%9.01%8.94%1.0185.67%20.06%3.4884.21%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究3.000.50.0第1層第2層3層第4層 第7層 第8層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究3.000.50.0第2層第4第2層第4層第3層 第7層 第8層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究金工金工研究3.02.52.0500.50.0第1層 3層 第7層第2層第4層 第8層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究4.03.53.02.52.0500.50.0第1層 3層 第7層第2層第4層 第8層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究4.54.03.53.02.52.0500.50.0第1層 3層 第7層第2層第4層 第8層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究2.08640.20.0第1層第2層第3層 第7層第4層 第8層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究3.53.02.52.05.00.50.0第1層 第3層 第7層第2層第4層 第8層第9層第10層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究3.53.02.52.0500.50.0第1層 第3層 第7層第2層第4層 第8層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究在下圖的三個模型對比中,可得以下結(jié)論:1.兩個多頻率混合模型的TOP組合年化超額收益率相比15分鐘頻模型有較大提升,說明引入日頻量價信息對模型有較大貢獻(xiàn)。2.多頻率增量混合模型在各個股票池內(nèi)都表現(xiàn)最好,且TOP組合換手率最低,體現(xiàn)出增量學(xué)習(xí)模型的優(yōu)勢。CRankIC均值RankIC標(biāo)準(zhǔn)差I(lǐng)C_IRIC>0占比TOP組合年化超額收益率TOP組合信息比率TOP組合勝率TOP組合換手率15分鐘頻模型5.86%5.86%14.98%0.3966.78%15.39%1.6065.79%多頻率混合模型7.02%13.48%0.5271.01%29.25%2.9776.32%110.94%多頻率增量混合模型13.46%0.5372.88%229.42%3.0980.26%105.83%15分鐘頻模型66.57%10.97%0.6073.62%17.33%2.1468.42%122.66%多頻率混合模型0.7176.55%21.67%2.6875.00%110.88%多頻率增量混合模型8.08%8.08%9.80%0.8280.39%226.53%3.4277.63%104.47%15分鐘頻模型8.97%8.95%1.0085.67%23.77%3.4282.89%126.28%多頻率混合模型8.58%8.58%8.34%1.0386.32%4.26111.60%多頻率增量混合模型110.07%8.75%1.1589.54%36.39%36.39%5.1793.42%107.77%15分鐘頻模型9.30%1.1586.97%3.9580.26%多頻率混合模型8.39%8.39%8.21%1.0286.97%30.00%4.80108.42%多頻率增量混合模型110.22%7.71%1.3390.85%36.36%5.9594.74%105.25%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究6.05.04.03.02.000.0第1層 3層 第7層第2層第4層 第8層9層第10層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究6.05.04.03.02.000.0第1層 第3層 第7層第2層第4層 第8層第9層第10層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究4.03.53.02.52.0500.50.0第1層 3層第2層第4層 第7層 第7層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究6.05.04.03.02.000.0第1層 3層第2層第4層 第7層 第7層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究6.05.04.03.02.000.0第1層 3層 第7層第2層第4層 第8層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究4.54.03.53.02.52.0500.50.0第1層 第3層 第7層第2層第4層 第8層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究7.06.05.04.03.02.000.0 第1層第3層 第7層 第2層 第8層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究7.06.05.04.03.02.000.0 第1層第3層 第7層 第2層 第8層2017/012017/072018/012018/072019/012019/072020/012020/072021/012021/072022/012022/072023/01注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究0.68640.51480.46290.55270.45760.73020.68640.51480.552700.68640.51480.46290.55270.45760.73020.68640.51480.55270.46290.4576本章測試的四個模型間相關(guān)性如下。15分鐘頻模型15分鐘頻注意力模型多頻率混合模型多頻率增量混合模型15分鐘頻模型15分鐘頻注意力模型多頻率混合模型0.7302多0.7302資料來源:Wind,華泰研究金工金工研究2017-012017-072018-012018-072019-012019-072020-012020-072021-012021-072022-012022-072023-0110%8%2017-012017-072018-012018-072019-012019-072020-012020-072021-012021-072022-012022-072023-0110%8%6%4%2%0%-2%-4%-6%-8%從上一章的測試可以看出,基于參數(shù)凍結(jié)+殘差預(yù)測的增量學(xué)習(xí)模型表現(xiàn)最好,本章我們將基于該模型構(gòu)建各類指數(shù)增強(qiáng)策略,并展示回測結(jié)果。滬深300增強(qiáng)組合構(gòu)建方法如下。優(yōu)化目標(biāo)最大化預(yù)期收益成分股權(quán)重約束不低于80%個股權(quán)重偏離上限0.8%風(fēng)格因子約束行業(yè)市值中性換手率約束周雙邊換手率上限分別為30%、40%和50%調(diào)倉頻率和交易成本周頻調(diào)倉,調(diào)倉當(dāng)日以vwap價格成交,交易成本雙邊千分之四資料來源:華泰研究滬深300增強(qiáng)組合回測結(jié)果如下圖。100%80%60%40%20%0%-20%換手率=30%,超額收益回撤(右軸)換手率=50%,超額收益回撤(右軸)換手率=40%,累積超額收益(左軸)換手率=40%,超額收益回撤(右軸)換手率=30%,累積超額收益(左軸)換手率=50%,累積超額收益(左軸)注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究換手率=30%換手率=40%換手率=50%年化收益率12.76%12.88%12.03%2.79%年化波動率18.78%18.76%18.85%19.00%夏普比率0.680.690.640.15最大回撤27.56%27.35%27.67%39.59%年化超額收益率9.48%9.58%8.77%年化跟蹤誤差5.72%5.79%5.87%超額收益最大回撤7.84%6.85%7.08%信息比率Calmar比率1.661.661.491.211.661.661.49相對基準(zhǔn)月勝率68.00%65.33%66.67%調(diào)倉雙邊換手率32.80%41.95%51.33%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究2017年收益率2018年收益率2019年收益率2020年收益率2021年收益率2022年收益率2023年收益率換手率=30%26.95%-19.55%36.18%37.12%19.37%-11.40%4.61%換手率=40%28.33%-18.74%36.21%39.75%16.09%-11.51%4.23%換手率=50%26.55%-18.18%34.83%39.20%13.77%-11.76%3.96%滬深30019.67%-25.31%36.07%27.21%-5.20%-21.63%4.07%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究2017-012017-072018-012018-072019-012019-072020-012020-072021-012021-072022-012022-072023-012017-012017-072018-012018-072019-012019-072020-012020-072021-012021-072022-012022-072023-01中證500增強(qiáng)組合構(gòu)建方法如下。優(yōu)化目標(biāo)最大化預(yù)期收益成分股權(quán)重約束不低于60%個股權(quán)重偏離上限0.8%風(fēng)格因子約束行業(yè)市值中性換手率約束周雙邊換手率上限分別為30%、40%和50%調(diào)倉頻率和交易成本周頻調(diào)倉,調(diào)倉當(dāng)日以vwap價格成交,交易成本雙邊千分之四資料來源:華泰研究中證500增強(qiáng)組合回測結(jié)果如下圖。200%160%120%80%40%0%-40%換手率=40%,超額收益回撤(右軸)換手率換手率=40%,超額收益回撤(右軸)換手率=30%,累積超額收益(左軸)換手率=50%,累積超額收益(左軸)10%8%6%4%2%0%-2%-4%-6%-8%換手率=50%,超額收益回撤(右軸)換手率=40%,累積超額收益(左軸)注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究換手率=30%換手率=40%換手率=50%年化收益率17.71%17.58%16.93%-0.61%年化波動率20.55%20.55%20.57%20.89%夏普比率0.860.860.82-0.03最大回撤29.74%28.84%28.71%年化超額收益率18.05%17.39%年化跟蹤誤差5.52%5.55%5.59%超額收益最大回撤7.41%7.60%信息比率Calmar比率3.2952.213.293.253.11相對基準(zhǔn)月勝率78.67%77.33%74.67%調(diào)倉雙邊換手率32.54%41.68%50.89%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究2017年收益率2018年收益率2019年收益率2020年收益率2021年收益率2022年收益率2023年收益率換手率=30%17.63%-17.56%47.28%29.47%36.66%-0.02%8.93%換手率=40%17.63%-16.06%45.43%32.59%38.35%-2.61%6.72%換手率=50%17.57%-15.41%45.68%32.00%37.31%-4.40%5.50%中證500-2.25%-33.32%26.38%20.87%15.58%-20.31%6.42%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究2017-012017-072018-012018-072019-012019-072020-012020-072021-012021-072022-012022-072023-012017-012017-072018-012018-072019-012019-072020-012020-072021-012021-072022-012022-072023-01中證1000增強(qiáng)組合構(gòu)建方法如下。優(yōu)化目標(biāo)最大化預(yù)期收益成分股權(quán)重約束不低于80%個股權(quán)重偏離上限0.8%風(fēng)格因子約束行業(yè)暴露<0.02,市值暴露<0.2換手率約束周雙邊換手率上限分別為30%、40%和50%調(diào)倉頻率和交易成本周頻調(diào)倉,調(diào)倉當(dāng)日以vwap價格成交,交易成本雙邊千分之四資料來源:華泰研究中證1000增強(qiáng)組合回測結(jié)果如下圖。500%450%400%350%300%250%200%150%100% 50% 0%-50%換手率=30%,超額收益回撤(右軸)換手率=40%,超額收益回撤(右軸)換手率=50%,超額收益回撤(右軸)換手率=40%,累積超額收益(左軸)換手率=30%,累積超額收益(左軸) 換手率=50%,累積超額收益(左軸)10%8%6%4%2%0%-2%-4%-6%-8%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究換手率=30%換手率=40%換手率=50%年化收益率23.70%24.09%-4.27%年化波動率22.88%23.01%22.92%夏普比率1.041.051.13-0.19最大回撤28.66%29.09%28.46%年化超額收益率28.93%29.38%31.57%年化跟蹤誤差6.51%6.56%6.59%超額收益最大回撤5.52%5.57%4.62%信息比率Calmar比率4.454.484.795.245.274.454.484.79相對基準(zhǔn)月勝率82.67%90.67%90.67%調(diào)倉雙邊換手率32.84%42.27%51.42%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究2017年收益率2018年收益率2019年收益率2020年收益率2021年收益率2022年收益率2023年收益率換手率=30%4.62%-10.60%57.97%38.29%63.38%1.58%9.87%換手率=40%11.75%-12.21%60.37%37.92%59.81%-0.12%9.86%換手率=50%10.91%-8.66%64.26%39.92%61.92%0.45%11.18%中證1000-19.06%-36.87%25.67%19.39%20.52%-21.58%7.03%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究2017-012017-072018-012018-072019-012019-072020-012020-072021-012021-072022-012022-072023-012017-012017-072018-012018-072019-012019-072020-012020-072021-012021-072022-012022-072023-01國證2000增強(qiáng)組合構(gòu)建方法如下。優(yōu)化目標(biāo)最大化預(yù)期收益成分股權(quán)重約束不低于80%個股權(quán)重偏離上限%風(fēng)格因子約束行業(yè)暴露<0.02,市值暴露<0.2換手率約束周雙邊換手率上限分別為30%、40%和50%調(diào)倉頻率和交易成本周頻調(diào)倉,調(diào)倉當(dāng)日以vwap價格成交,交易成本雙邊千分之四資料來源:華泰研究國證2000增強(qiáng)組合回測結(jié)果如下圖。500%450%400%350%300%250%200%150%100%50%0%-50%換手率=30%,超額收益回撤(右軸)換換手率=30%,超額收益回撤(右軸)換手率=50%,超額收益回撤(右軸)換手率=40%,累積超額收益(左軸)10%換手率=30%換手率=50%,超額收益回撤(右軸)換手率=40%,累積超額收益(左軸)10%8%6%4%2%0%-2%-4%-6%-8%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究換手率=30%換手率=40%換手率=50%年化收益率26.81%27.77%28.42%-2.21%年化波動率22.77%23.34%22.66%夏普比率2-0.10最大回撤26.52%24.92%24.99%49.91%年化超額收益率29.38%30.47%年化跟蹤誤差7.24%7.34%超額收益最大回撤5.48%4.02%3.80%信息比率Calmar比率4.0964.094.214.25相對基準(zhǔn)月勝率88.00%86.67%86.67%調(diào)倉雙邊換手率32.45%41.70%50.93%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究2017年收益率2018年收益率2019年收益率2020年收益率2021年收益率2022年收益率2023年收益率換手率=30%3.41%-1.44%59.41%29.12%67.28%14.29%9.39%換手率=40%5.75%3.28%57.07%35.34%64.11%11.74%7.95%換手率=50%7.30%4.24%53.66%37.62%63.89%10.28%10.56%國證2000-18.64%-33.77%23.45%16.87%29.19%-17.20%6.75%注:回測期:2017/1/4~2023/4/28資料來源:Wind,華泰研究金工金工研究神經(jīng)網(wǎng)絡(luò)能自動提取股票原始量價數(shù)據(jù)中的特征,實現(xiàn)端到端的因子挖掘和因子合成。本文重點(diǎn)研究如何設(shè)計網(wǎng)絡(luò)結(jié)構(gòu)以有效挖掘不同頻率的股票量價數(shù)據(jù)。全文總結(jié)如下:神經(jīng)網(wǎng)絡(luò)在15分鐘頻量價數(shù)據(jù)上表現(xiàn)較好,加入注意力機(jī)制后無改進(jìn)??紤]到神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的特征提取能力,本文省去人工構(gòu)建因子的步驟,直接對標(biāo)準(zhǔn)化后的原始15分鐘K線數(shù)據(jù)進(jìn)行學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)骨干部分使用GRU網(wǎng)絡(luò)。樣本空間為全A股,模型在2017/1/4~2023/4/28的回測期內(nèi)周度RankIC均值為9.30%,分10層TOP組合年化超額收益率為24.18%(不計交易成本)。我們還嘗試對GRU加入注意力機(jī)制,希望幫助模型更好地記憶長程序列信息,但在本文的測試中,加入注意力機(jī)制后沒有改進(jìn)效果?;谌疹l+15分鐘頻數(shù)據(jù)的多頻率混合模型分層測試效果明顯提升。為了融入更多市場信息,我們在15分鐘頻數(shù)據(jù)的模型上,加入日頻數(shù)據(jù),構(gòu)建多頻率混合模型。模型通過兩個輸入分別接收日頻量價和15分鐘頻量價數(shù)據(jù),并分別使用GRU提取特征,最后將兩部分特征拼接并對接輸出。樣本空間為全A股,模型在2017/1/4~2023/4/28的回測期內(nèi)周度RankIC0層TOP組合年化超額收益率為30.12%(不計交易成本),TOP組合表現(xiàn)相比15分鐘頻模型提升明顯?;趨?shù)凍結(jié)+殘差預(yù)測的多頻率增量混合模型表現(xiàn)最好。針對多頻率數(shù)據(jù)混合模型,我們引入因子增量貢獻(xiàn)的思想,設(shè)計了一個兩階段訓(xùn)練的增量學(xué)習(xí)模型。第一階段:只使用日頻量價數(shù)據(jù)訓(xùn)練對應(yīng)的神經(jīng)網(wǎng)絡(luò)分支,即先讓網(wǎng)絡(luò)學(xué)習(xí)日頻級別的量價信息,第一階段訓(xùn)練直到模型的loss收斂為止。第二階段:將日頻量價數(shù)據(jù)分支網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)凍結(jié),只前向傳播,然后引入15分鐘頻數(shù)據(jù)學(xué)習(xí)殘差,即再讓網(wǎng)絡(luò)學(xué)習(xí)分鐘頻量價數(shù)據(jù)能夠貢獻(xiàn)的增量信息。樣本空間為全A股,模型在2017/1/4~2023/4/28的回測期內(nèi)周度RankIC均值為10.22%,分10層TOP組合年化超額收益率為36.36%(不計交易成本),在本文的所有模型中表現(xiàn)最好?;诙囝l率增量混合模型構(gòu)建多個指數(shù)增強(qiáng)組合,回測表現(xiàn)優(yōu)秀。我們基于多頻率增量混合模型構(gòu)建多個指數(shù)增強(qiáng)組合,并回測了周雙邊換手率分別控制為30%、40%和50%的情8.77%~9.48%,信息比率為1.21~1.40。中證500增強(qiáng)組合年化超額收益率為28.93%~31.57%,信息比率為4.45~4.79。國證2000增強(qiáng)組合年化超額收益率為29.38%~31.19%,信息比率為4.09~4.25。提示通過人工智能模型構(gòu)建的選股策略是歷史經(jīng)驗的總結(jié),存在失效的可能。神經(jīng)網(wǎng)絡(luò)受隨機(jī)性影響較大、可解釋性較差,使用需謹(jǐn)慎。金工金工研究20分析師聲明本人,林曉明、李子鈺、何康,茲證明本報告所表達(dá)的觀點(diǎn)準(zhǔn)確地反映了分析師對標(biāo)的證券或發(fā)行人的個人意見;彼以往、現(xiàn)在或未來并無就其研究報告所提供的具體建議或所表迖的意見直接或間接收取任何報酬。一般聲明及披露本報告由華泰證券股份有限公司(已具備中國證監(jiān)會批準(zhǔn)的證券投資咨詢業(yè)務(wù)資格,以下簡稱“本公司”)制作。本報告所載資料是僅供接收人的嚴(yán)格保密資料。本報告僅供本公司及其客戶和其關(guān)聯(lián)機(jī)構(gòu)使用。本公司不因接收人收到本報告而視其為客戶。本報告基于本公司認(rèn)為可靠的、已公開的信息編制,但本公司及其關(guān)聯(lián)機(jī)構(gòu)(以下統(tǒng)稱為“華泰”)對該等信息的準(zhǔn)確性及完整性不作任何保證。本報告所載的意見、評估及預(yù)測僅反映報告發(fā)布當(dāng)日的觀點(diǎn)和判斷。在不同時期,華泰可能會發(fā)出與本報告所載意見、評估及預(yù)測不一致的研究報告。同時,本報告所指的證券或投資標(biāo)的的價格、價值及投資收入可能會波動。以往表現(xiàn)并不能指引未來,未來回報并不能得到保證,并存在損失本金的可能。華泰不保證本報告所含信息保持在最新狀態(tài)。華泰對本報告所含信息可在不發(fā)出通知的情形下做出修改,投資者應(yīng)當(dāng)自行關(guān)注相應(yīng)的更新或修改。本公司不是FINRA的注冊會員,其研究分析師亦沒有注冊為FINRA的研究分析師/不具有FINRA分析師的注冊資華泰力求報告內(nèi)容客觀、公正,但本報告所載的觀點(diǎn)、結(jié)論和建議僅供參考,不構(gòu)成購買或出售所述證券的要約或招攬。該等觀點(diǎn)、建議并未考慮到個別投資者的具體投資目的、財務(wù)狀況以及特定需求,在任何時候均不構(gòu)成對客戶私人投資建議。投資者應(yīng)當(dāng)充分考慮自身特定狀況,并完整理解和使用本報告內(nèi)容,不應(yīng)視本報告為做出投資決策的唯一因素。對依據(jù)或者使用本報告所造成的一切后果,華泰及作者均不承擔(dān)任何法律責(zé)任。任何形式的分享證券投資收益或者分擔(dān)證券投資損失的書面或口頭承諾均為無效。除非另行說明,本報告中所引用的關(guān)于業(yè)績的數(shù)據(jù)代表過往表現(xiàn),過往的業(yè)績表現(xiàn)不應(yīng)作為日后回報的預(yù)示。華泰不承諾也不保證任何預(yù)示的回報會得以實現(xiàn),分析中所做的預(yù)測可能是基于相應(yīng)的假設(shè),任何假設(shè)的變化可能會顯著影響所預(yù)測的回報。華泰及作者在自身所知情的范圍內(nèi),與本報告所指的證券或投資標(biāo)的不存在法律禁止的利害關(guān)系。在法律許可的情況下,華泰可能會持有報告中提到的公司所發(fā)行的證券頭寸并進(jìn)行交易,為該公司提供投資銀行、財務(wù)顧問或者金融產(chǎn)品等相關(guān)服務(wù)或向該公司招攬業(yè)務(wù)。華泰的銷售人員、交易人員或其他專業(yè)人士可能會依據(jù)不同假設(shè)和標(biāo)準(zhǔn)、采用不同的分析方法而口頭或書面發(fā)表與本報告意見及建議不一致的市場評論和/或

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論