版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
目錄TOC\o"1-2"\h\z\u前言 1GAN_GRU模型簡介 1GRU模型基本假設 1GAN模型簡介 2GAN特征生成模型構(gòu)建 4GAN_GRU因子表現(xiàn) 6GAN_GRU因子多頭組合 7風險提示 8圖目錄圖1:深度學習選股模型結(jié)構(gòu) 2圖2:生成對抗網(wǎng)絡(GAN)模型示意 4圖3:卷積神經(jīng)網(wǎng)絡(CNN)模型示意 5圖4:GAN_GRU模型示意 5圖5:GAN_GRU因子各行業(yè)近期IC表現(xiàn) 6圖6:GAN_GRU因子各行業(yè)近期多頭組合表現(xiàn) 7表目錄表1:深度學習選股量價特征表 1表2:GAN_GRU因子歷史表現(xiàn) 6表3:2025年11月末模型輸出各行業(yè)排名第一個股 7表4:因子得分排名前十的個股 8前言(20247日)GAN_GRUGAN_GRU年以來表現(xiàn)情況。其中GAN_GRU因子為利用生成式對抗神經(jīng)網(wǎng)絡GAN模型進行量價時序特征處理后再利用模型進行時序特征編碼得到的選股因子。模型簡介模型基本假設前期報告《量價時序特征挖掘模型在深度學習因子中的應用》中,主要構(gòu)建了GRU+MLP的神經(jīng)網(wǎng)絡股票收益預測基本模型,其中模型細節(jié)如下:量價特征:包括收盤價、開盤價、成交量、換手率等在內(nèi)的18個量價特征。調(diào)倉頻率:以月頻調(diào)倉方式進行預測和回測。訓練與預測方式:訓練數(shù)據(jù)及輸入特征設定:所有個股過去400天內(nèi)的18個量價特征,每5個交易日做一次特征采樣。特征采樣形狀為4018,即利用過去40天的量價特征來預測未來20個交易日的累計收益。訓練集驗證集比例:80%:20%。數(shù)據(jù)處理:每次采樣的40天內(nèi),每個特征在時序上去極值標準化、每個特征在個股層面上截面標準化。模型訓練方式:的預測,訓練時間點為每年的6301231日。股票篩選方式:ST及上市不足半年的股票。訓練樣本篩選方式:為空值的樣本。超參數(shù):batch_size為截面股票數(shù)量、優(yōu)化器Adam、學習速率、損失函數(shù)、早停輪數(shù)、最大訓練輪數(shù)。表1:深度學習選股量價特征表特征名稱特征助記符特征說明頻次前收盤價PrevClosePrice當日前一天收盤價日頻特征開盤價OpenPrice當日開盤價收盤價ClosePrice當日收盤價最高價HighPrice當日最高價最低價LowPrice當日最低價成交量(萬股)TurnoverVolume當日成交量成交金額(萬元)TurnoverValue當日成交金額特征名稱特征助記符特征說明頻次漲跌幅(%)ChangePCT當日漲跌幅振幅(%)RangePCT當日振幅換手率(%)TurnoverRate當日換手率均價AvgPrice當日均價月成交金額(萬元)TurnoverValueRM當月成交金額月頻特征月漲跌幅(%)ChangePCTRM當月漲跌幅月振幅(%)RangePCTRM當月振幅月?lián)Q手率(%)TurnoverRateRM當月?lián)Q手率月收盤最高價(元)HighestClosePriceRM當月收盤價最高價月收盤最低價(元)LowestClosePriceRM當月收盤價最低價月日均換手率(%)TurnoverRatePerDayRM當月日均換手率、恒生聚源、整理圖1:深度學習選股模型結(jié)構(gòu)南證券GRU(128,128)MLP(256,64,64),作為選股因子。對因子的測試均建立在對因子已做行業(yè)市值中性化標準化處理,后文將不再贅述。模型簡介GAN生成式對抗網(wǎng)絡(GenerativeAdversarialNetworks,GANs是由Goodfellow等人于(Generator)和判別器(Discriminator)兩個部分。生成器的目標是生成看起來真實的數(shù)據(jù),判別器目標是區(qū)分真實數(shù)據(jù)和生成器生成的數(shù)據(jù)。兩者在訓練過程中相互競爭,從而使生成器生成的數(shù)據(jù)越來越逼真。生成器(G)聲(通常是高斯分布或均勻分布)作為輸入,通過一系列的非線性變換生成數(shù)據(jù)。生成器的真實的,因此生成器的目標是最大化判別器輸出為真的概率,其損失函數(shù)可以寫為:????=?????~????(??)[log(??(??(??)))]其中z(一般為服從高斯分布的隨機噪聲??()表示生成器生成的數(shù)據(jù),??(??(??))表示為判別器對生成數(shù)據(jù)的輸出概率,即判別器判斷生成器生成數(shù)據(jù)為真實數(shù)據(jù)的概率。生成器的訓練過程可以分為以下幾個步驟:生成噪聲數(shù)據(jù):。生成假數(shù)據(jù):通過生成器??將噪聲數(shù)據(jù)z轉(zhuǎn)換成生成數(shù)據(jù)??(??)。計算生成器損失:將生成的數(shù)據(jù)輸入判別器D,計算生成器的損失????。反向傳播和更新生成器參數(shù)下降算法更新生成器的參數(shù),以最小化損失????。判別器(D)個概率,表示輸入數(shù)據(jù)為真實數(shù)據(jù)的概率。判別器的損失函數(shù)由兩部分組成:一部分是對真實數(shù)據(jù)的損失,另一部分是對生成數(shù)據(jù)的損失。具體來說,判別器希望最大化對真實數(shù)據(jù)的輸出概率,同時最小化對生成數(shù)據(jù)的輸出概率,其損失函數(shù)可以表示為:????=?????(??)[logD(??)]?????~????(??)[log(1???(??(??)))]其中,??是真實數(shù)據(jù),D(??)是判別器對真實數(shù)據(jù)的輸出概率,??(??(??)))是判別器對生成數(shù)據(jù)的輸出概率。生成器的訓練過程可以分為以下幾個步驟:(1)采樣真實數(shù)據(jù):從真實數(shù)據(jù)分布中采樣一組真實數(shù)據(jù)??。(2)生成假數(shù)據(jù):從隨機噪聲分布中采樣一組噪聲??,并通過生成器??生成數(shù)據(jù)??(??)。(3)計算判別器損失:將真實數(shù)據(jù)??和生成數(shù)據(jù)??(??)輸入判別器??,計算判別器損失????。(4)反向傳播更新判別器參數(shù):通過反向傳播算法計算判別器的梯度,并使用梯度下降算法更新判別器的參數(shù),以最小化損失????。模型(G+D)GAN的訓練過程是生成器和判別器交替訓練的過程,具體步驟參考如下:Step1.初始化生成器和判別器的參數(shù)。Step2.迭代訓練過程:訓練判別器:從真實數(shù)據(jù)分布中采樣一組真實數(shù)據(jù)。從隨機噪聲分布中采樣一組噪聲數(shù)據(jù)z,并通過生成器G生成數(shù)據(jù)G(z)。計算判別器損失LD并更新判別器參數(shù)。訓練生成器:從隨機噪聲分布中采樣一組噪聲數(shù)據(jù)??。通過生成器??生成數(shù)據(jù)??(??)。計算生成器損失????并更新生成器參數(shù)。Step3.重復上述步驟,直到收斂。通過這種對抗訓練,生成器生成特征的能力逐漸提升,其生成的特征也越來越逼真,而判別器區(qū)分真假特征的能力也在逐漸提升,變得越來越擅長區(qū)分真假特征。理想狀態(tài)下,生成模型能夠生成無法被判別模型區(qū)分的完美數(shù)據(jù)樣本,判別模型無法區(qū)分真實樣本與生成樣本。圖2:生成對抗網(wǎng)絡(GAN)模型示意南證券特征生成模型構(gòu)建LSTM生成器+CNN判別器:為了適配本文的量價特征模式,希望處理后的特征仍然能保留時序的性質(zhì),因此本文采取可以保留輸入特征時序性的LSTM模型做為生成器(G)。而量價時序特征本質(zhì)上是二維數(shù)據(jù)特征圖片,因此本文則采取常用于二維圖像處理的CNN模型做為識別特征的判別器(卷積神經(jīng)網(wǎng)絡(的深度學習模型,核心思想是利用卷積層和池化層來有效地提取輸入數(shù)據(jù)的特征。能夠逐漸學習到輸入數(shù)據(jù)的抽象特征,從而實現(xiàn)對復雜模式的學習和識別。本文將CNN模型用以匹配二維構(gòu)造的量價時序特征,并學習量價時序二維特征圖片的內(nèi)在特性。圖3:卷積神經(jīng)網(wǎng)絡(CNN)模型示意南證券對于訓練完成的GAN模型,本文利用其中的生成器部分進行特征生成,具體生成器生成特征的過程為輸入原始量價時序特征,Input_Shape=(40,18),輸出經(jīng)LSTM處理后的量價時序特征,Input_Shape=(40,18)。圖4:GAN_GRU模型示意南證券因子表現(xiàn)自2019年1月至2025年11月,月頻調(diào)倉的基礎上,GAN_GRU因子在全A范圍內(nèi)IC均值0.1131,多頭組合年化超額收益率23.14%;截至2025年11月27日,GAN_GRU最新一期IC為0.1241,近一年IC均值為0.0867。(IC測試中、、分別代表參數(shù)在1%、5%、10%的顯著性水平下顯著,下同,不再特殊強調(diào))。表2:GAN_GRU因子歷史表現(xiàn)ICICIR(未年化)換手率近期IC近一年IC0.11310.900.830.12410.0867年化收益率年化波動信息比率最大回撤率年化超額收益率37.52%23.52%1.5927.29%23.14%、,截至2025年11月27日在申萬一級行業(yè)分類下,測試GAN_GRU因子近期在各個行業(yè)內(nèi)部的表現(xiàn)。截至2025年11月,10月當期因子IC排名前五的行業(yè)(除綜合)分別為社會服務、房地產(chǎn)、鋼鐵、非銀金融、煤炭、商貿(mào)零售,IC分別為0.2198、0.2027、0.1774、0.1754以及0.1537;近一年因子IC均值排名前五的行業(yè)(除綜合)分別為非銀金融、鋼鐵、商貿(mào)零售、紡織服飾、公用事業(yè)行業(yè),IC均值分別為0.1401、0.1367、0.1152、0.1124以及0.1092。圖5:GAN_GRU因子各行業(yè)近期IC表現(xiàn)、整理,截至2025年11月27日GAN_GRU月,月當期多頭組合超額收益最高的五個行業(yè)(除綜合織服飾、建筑材料,多頭組合相對行業(yè)指數(shù)超額收益分別為7.24%4.37%4.03%3.89%2.91%30個申萬一級行業(yè)(除綜合)5個行業(yè)多頭組合未跑贏行業(yè)指數(shù)。近一年來看,多頭組合月平均超額收益最高的五個行業(yè)(除綜合)分別為建筑材料、房地產(chǎn)、社會服務、紡織服飾、商貿(mào)零售,超額收益分別為2.15%、1.97%、1.77%、1.71%以及1.62%。且30個申萬一級行業(yè)(除綜合)中,除通信行業(yè)以外,GAN_GRU因子多頭組合近一年,僅有2個行業(yè)未跑贏對應申萬一級行業(yè)指數(shù)(煤炭、通信。圖6:GAN_GRU因子各行業(yè)近期多頭組合表現(xiàn)、整理,截至2025年11月27日因子多頭組合27GAN_GRU模型輸出的多頭組合(A股因子10%)內(nèi),篩選出各申萬一級行業(yè)(除綜合行業(yè))內(nèi)排名第一的股票如下:表3:2025年11月末模型輸出各行業(yè)排名第一個股代碼簡稱申萬一級行業(yè)代碼簡稱申萬一級行業(yè)002393.SZ力生制藥醫(yī)藥生物600195.SH中牧股份農(nóng)林牧漁600395.SH盤江股份煤炭600901.SH江蘇金租非銀金融001288.SZ運機集團機械設備300051.SZ璉升科技電力設備601801.SH皖新傳媒傳媒601939.SH建設銀行銀行300674.SZ宇信科技計算機600533.SH棲霞建設房地產(chǎn)603826.SH坤彩科技基礎化工002956.SZ西麥食品食品飲料600938.SH中國海油石油石化301381.SZ賽維時代商貿(mào)零售601518.SH吉林高速交通運輸688363.SH華熙生物美容護理301039.SZ中集車輛汽車300196.SZ長海股份建筑材料603324.SH盛劍科技環(huán)保600509.SH天富能源公用事業(yè)002139.SZ拓邦股份電子301135.SZ瑞德智能家用電器603195.SH公牛集團輕工制造000959.SZ首鋼股份鋼鐵代碼簡稱申萬一級行業(yè)代碼簡稱申萬一級行業(yè)002375.SZ亞廈股份建筑裝飾600862.SH中航高科國防軍工002123.SZ夢網(wǎng)科技通信000526.SZ學大教育社會服務002721.SZ金一文化紡織服飾300224.SZ正海磁材有色金屬、,截至2025年11月27日根據(jù)因子得分篩選排名前10的股票為力生制藥、盤江股份、運機集團、皖新傳媒、千宇信科技、坤彩科技、中國海油、吉林高速、中集車輛、中炬高新:表4:因子得分排名前十的個股代碼簡稱申萬一級行業(yè)1002393.SZ力生制藥醫(yī)藥生物26
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 惠州廣東惠州市公安局仲愷高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)分局招聘警務輔助人員40人筆試歷年參考題庫附帶答案詳解
- 巴中2025年四川巴中平昌縣考調(diào)中小學教師100人筆試歷年參考題庫附帶答案詳解
- 臺州2025年浙江臺州仙居縣行政事業(yè)單位編外人員招聘78人筆試歷年參考題庫附帶答案詳解
- 職業(yè)性肌肉骨骼疾病政策解讀
- 公司工資薪金獎金制度
- 2026年社區(qū)安全防范與應急處置技能測試
- 2026年P(guān)DU認證知識要點項目管理師必刷題集
- 2026年數(shù)控加工工程師技能測試題庫
- 2026年生產(chǎn)車間安全生產(chǎn)4E標準考核題及答案
- 2026年城市防洪排澇應急預案與實施模擬題
- 膀胱壓力監(jiān)測新課件
- 2025年山東省威海市環(huán)翠區(qū)數(shù)學六年級第一學期期末考試試題含解析
- 惠州園林管理辦法
- 山西省建筑工程施工安全管理標準
- 2025山西云時代技術(shù)有限公司校園招聘160人筆試參考題庫附帶答案詳解
- 拼多多公司績效管理制度
- 貿(mào)易公司貨權(quán)管理制度
- 生鮮采購年度工作總結(jié)
- 造價咨詢項目經(jīng)理責任制度
- 離婚協(xié)議書正規(guī)打印電子版(2025年版)
- FZ∕T 81008-2021 茄克衫行業(yè)標準
評論
0/150
提交評論