基于SVM-GARCH方法的 滬深300指數(shù)的波動(dòng)性分析_第1頁(yè)
基于SVM-GARCH方法的 滬深300指數(shù)的波動(dòng)性分析_第2頁(yè)
基于SVM-GARCH方法的 滬深300指數(shù)的波動(dòng)性分析_第3頁(yè)
基于SVM-GARCH方法的 滬深300指數(shù)的波動(dòng)性分析_第4頁(yè)
基于SVM-GARCH方法的 滬深300指數(shù)的波動(dòng)性分析_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

緒論1.1研究背景與意義1.1.1研究背景衡量市場(chǎng)風(fēng)險(xiǎn)的關(guān)鍵指標(biāo)為股票市場(chǎng)的波動(dòng)性,對(duì)波動(dòng)性的準(zhǔn)確預(yù)測(cè)有助于投資者進(jìn)行有效的風(fēng)險(xiǎn)管理,也有助于監(jiān)管機(jī)構(gòu)監(jiān)控市場(chǎng)的穩(wěn)定性。滬深300指數(shù)在我國(guó)金融市場(chǎng)上扮演著重要角色,因此,對(duì)該指數(shù)波動(dòng)性的研究至關(guān)重要。準(zhǔn)確預(yù)測(cè)波動(dòng)性有助于投資者進(jìn)行風(fēng)險(xiǎn)管理和優(yōu)化投資組合。同時(shí),這一準(zhǔn)確性還能夠?yàn)楸O(jiān)管機(jī)構(gòu)提供了監(jiān)測(cè)市場(chǎng)穩(wěn)定性的重要工具REF_Ref1463\r\h[1]。傳統(tǒng)的波動(dòng)性模型,如GARCH模型,雖然在預(yù)測(cè)波動(dòng)性方面有一定的效果,但它們通常假設(shè)波動(dòng)性是隨時(shí)間平穩(wěn)的,并且在面對(duì)市場(chǎng)突變時(shí)可能表現(xiàn)不佳,機(jī)器學(xué)習(xí)在金融領(lǐng)域的應(yīng)用:隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,越來(lái)越多的研究人員正試圖通過(guò)使用機(jī)器學(xué)習(xí)算法來(lái)改進(jìn)機(jī)器學(xué)習(xí)在金融領(lǐng)域的應(yīng)用方式REF_Ref1633\r\h[2]。支持向量機(jī)(SVM)作為一種強(qiáng)大的分類(lèi)和回歸工具,被證明在處理非線性關(guān)系和復(fù)雜數(shù)據(jù)結(jié)構(gòu)方面具有優(yōu)勢(shì)。SVM-GARCH模型的提出,將SVM與GARCH模型結(jié)合,可以綜合利用GARCH模型在描述波動(dòng)性聚集現(xiàn)象方面的能力和SVM在捕捉數(shù)據(jù)非線性特征和預(yù)測(cè)方面的優(yōu)勢(shì)。兩者模型相結(jié)合的目的為很好的預(yù)測(cè)股票價(jià)格的波動(dòng)性。1.1.2研究意義波動(dòng)性與風(fēng)險(xiǎn)和回報(bào)密切相關(guān),適度的波動(dòng)性對(duì)市場(chǎng)和經(jīng)濟(jì)有積極影響,能夠?yàn)槭袌?chǎng)參與者和投資者帶來(lái)利益。因此,準(zhǔn)確描述和預(yù)測(cè)波動(dòng)性是金融風(fēng)險(xiǎn)研究的重要領(lǐng)域之一,對(duì)于有效的風(fēng)險(xiǎn)管理和投資決策至關(guān)重要。該研究通過(guò)提高波動(dòng)性預(yù)測(cè)的準(zhǔn)確性,可以幫助投資者更有效地分配資產(chǎn)、調(diào)整投資組合,并制定相應(yīng)的對(duì)沖策略。模型創(chuàng)新與性能的提升,結(jié)合SVM和GARCH模型的混合方法可能提供比傳統(tǒng)模型更準(zhǔn)確的預(yù)測(cè)結(jié)果,特別是在處理非線性關(guān)系和復(fù)雜市場(chǎng)動(dòng)態(tài)時(shí)。這種創(chuàng)新有助于推動(dòng)金融時(shí)間序列分析領(lǐng)域的發(fā)展。了解和預(yù)測(cè)市場(chǎng)波動(dòng)性是維護(hù)市場(chǎng)穩(wěn)定性的關(guān)鍵,該研究可以為監(jiān)管機(jī)構(gòu)提供更先進(jìn)的工具,以便監(jiān)測(cè)市場(chǎng)風(fēng)險(xiǎn)和制定相應(yīng)的監(jiān)管政策。對(duì)于政策制定者來(lái)說(shuō),了解市場(chǎng)波動(dòng)性的驅(qū)動(dòng)因素和變化趨勢(shì)對(duì)于宏觀經(jīng)濟(jì)管理和政策制定具有重要意義。該研究可以為政策制定者提供有關(guān)市場(chǎng)波動(dòng)性的深入分析和預(yù)測(cè)。在金融科技快速發(fā)展的背景下,該研究有助于推動(dòng)金融技術(shù)創(chuàng)新,特別是在智能投顧、算法交易和自動(dòng)化風(fēng)險(xiǎn)管理等領(lǐng)域。通過(guò)這些要點(diǎn),可以展示出基于SVM-GARCH模型對(duì)滬深300指數(shù)波動(dòng)性分析的研究不僅具有學(xué)術(shù)價(jià)值,而且在金融實(shí)踐、監(jiān)管和政策制定等方面都具有重要的應(yīng)用意義。1.2文獻(xiàn)綜述1.2.1支持向量機(jī)方面1995年,CorinnaCortes和Vapnik等人首次開(kāi)發(fā)了被稱(chēng)為支持向量機(jī)(SVM)的算法來(lái)解決分類(lèi)問(wèn)題。它是一種受約束的二元分類(lèi)器,通過(guò)優(yōu)化參數(shù)來(lái)確定最佳分類(lèi)超平面。在解決凸二次優(yōu)化問(wèn)題時(shí),SVM可以有效簡(jiǎn)化高維空間中的特征向量分類(lèi)。SVM經(jīng)常在機(jī)器學(xué)習(xí)中使用,因?yàn)樗梢栽诰€性可分和線性不可分的特征向量上產(chǎn)生強(qiáng)大的結(jié)果REF_Ref1725\r\h[3]。SVM基本數(shù)學(xué)概念是在高維空間的特征參數(shù)中找到最佳分類(lèi)超平面,以平衡學(xué)習(xí)樣本的自適應(yīng)精度和目標(biāo)樣本的識(shí)別能力,并產(chǎn)生強(qiáng)大的泛化效果REF_Ref7482\r\h[3]。支持向量機(jī)(SVM)是一個(gè)應(yīng)用廣泛的模型,代表了國(guó)內(nèi)外學(xué)者們的共同努力和智慧。Mukherjee、Osuna和Girosi(1997年)在研究中將SVM用于混沌時(shí)間序列,發(fā)現(xiàn)其在分類(lèi)性能上優(yōu)于其他方法。另外,根據(jù)WeiHuang、Nakamori和Shou-YangWang(1999年)的研究,他們對(duì)日經(jīng)225指數(shù)的周走勢(shì)進(jìn)行了詳盡分析。他們的研究發(fā)現(xiàn),支持向量機(jī)(SVM)在分類(lèi)效果上明顯優(yōu)于其他方法,尤其是在與其他方法結(jié)合使用時(shí)表現(xiàn)更加出色。1.2.2GARCH方面GARCH模型是一種專(zhuān)門(mén)用于金融時(shí)間序列波動(dòng)性建模和預(yù)測(cè)的工具,源于上世紀(jì)80年代初恩格爾提出的ARCH模型。自那時(shí)起,學(xué)術(shù)界和實(shí)踐領(lǐng)域廣泛采用GARCH模型及其相關(guān)擴(kuò)展,為金融統(tǒng)計(jì)學(xué)注入了新的理論和方法。學(xué)者們已經(jīng)將GARCH模型成功應(yīng)用于金融領(lǐng)域。以YanHu等人的研究為例,他們利用LSTM-ANN網(wǎng)絡(luò)和GARCH模型結(jié)合,有效預(yù)測(cè)了銅價(jià)格的波動(dòng)。另外,YuliangZhang等人的研究則揭示了GARCH模型對(duì)波羅的海干散貨指數(shù)波動(dòng)的準(zhǔn)確反映,包括波動(dòng)聚類(lèi)效應(yīng)和尾部特征。此外,GARCH模型在金融衍生品定價(jià)中發(fā)揮著重要作用。雖然對(duì)于封閉式期權(quán),可能需要借助數(shù)值模擬或其他方法進(jìn)行定價(jià),但GARCH模型為這一過(guò)程提供了基礎(chǔ)和支持??偟膩?lái)看,GARCH模型在金融市場(chǎng)的研究和實(shí)踐中發(fā)揮著不可或缺的作用,其應(yīng)用范圍廣泛,為金融領(lǐng)域的實(shí)際操作提供了有力的支持。

2滬深300指數(shù)及相關(guān)模型介紹2.1滬深300指數(shù)滬深300指數(shù)在我國(guó)股市上有著重要地位,該指數(shù)于2005年4月8日正式發(fā)布,由300家在深圳和上海證券交易所上市的規(guī)模最大、最具代表性和流動(dòng)性最好的股票組成。該指數(shù)旨在反映深滬股票市場(chǎng)上市公司證券的整體表現(xiàn)。采用嚴(yán)格的選擇標(biāo)準(zhǔn),主要根據(jù)證券的規(guī)模和流動(dòng)性,選擇前300只股票作為指數(shù)樣本。這種抽樣技術(shù)保證了指數(shù)的代表性、穩(wěn)定性和流動(dòng)性。滬深300指數(shù)包括的300家公司,從市值規(guī)模上占到國(guó)內(nèi)股市全部規(guī)模的60%以上,因此被認(rèn)為是中國(guó)股市最具代表性的指數(shù)之一。這個(gè)指數(shù)不僅覆蓋了滬深兩市的主要公司,而且其行業(yè)分布也相對(duì)均衡,使得它成為一個(gè)廣泛使用的投資業(yè)績(jī)比較基準(zhǔn)。作為中國(guó)股市最典型的指數(shù)之一,滬深300指數(shù)由300家企業(yè)組成,這些企業(yè)的市值規(guī)模合計(jì)占國(guó)內(nèi)股市規(guī)模的60%以上。由于該指數(shù)由滬深股市中的重要公司組成,且行業(yè)分布均衡,因此是衡量投資業(yè)績(jī)的常用基準(zhǔn)。由于滬深300指數(shù)由上海證券交易所和深圳證券交易所的股票組成,因此它有兩個(gè)代碼:000300和399300。值得一提的是,該指數(shù)不能直接買(mǎi)賣(mài),只能用于觀察市場(chǎng)走勢(shì)。在行業(yè)分布方面,滬深300指數(shù)涵蓋多個(gè)行業(yè),其中銀行和房地產(chǎn)行業(yè)所占比重最大,達(dá)到30%。信息技術(shù)、醫(yī)療衛(wèi)生、消費(fèi)和工業(yè)也是重要的行業(yè)。這個(gè)指數(shù)與A股的行業(yè)結(jié)構(gòu)高度相似,各行業(yè)的占比也比較接近,因此能夠較好地代表市場(chǎng)的總體表現(xiàn)。滬深300指數(shù)的十大權(quán)重股包括了中國(guó)平安、招商銀行、興業(yè)銀行等金融地產(chǎn)行業(yè)的公司,以及貴州茅臺(tái)、五糧液、伊利股份等消費(fèi)板塊的公司。這些公司在各自的行業(yè)中都占據(jù)重要地位,并且具有穩(wěn)定性和成長(zhǎng)性,因此使得滬深300指數(shù)具備較高的投資價(jià)值。2.2支持向量機(jī)介紹支持向量機(jī)(SVM)是一種用于回歸分析和模式識(shí)別的流行機(jī)器學(xué)習(xí)方法。方法SVM是一種監(jiān)督學(xué)習(xí)技術(shù),旨在確定給定訓(xùn)練數(shù)據(jù)集的最佳決策邊界,以區(qū)分多個(gè)類(lèi)別。SVM旨在在給定的訓(xùn)練數(shù)據(jù)集上找到一個(gè)最優(yōu)的決策邊界,以區(qū)分不同的類(lèi)別。SVM的核心概念在于最大化數(shù)據(jù)點(diǎn)之間的間隔,這被稱(chēng)為邊際最大化,使用不同的超平面。這種超平面可以在由輸入數(shù)據(jù)特征向量組成的高維特征空間中找到。通過(guò)優(yōu)化最近的訓(xùn)練數(shù)據(jù)點(diǎn)和這個(gè)超平面在分類(lèi)問(wèn)題中,SVM通過(guò)尋找一個(gè)能夠最好地將兩類(lèi)數(shù)據(jù)點(diǎn)分開(kāi)的超平面來(lái)實(shí)現(xiàn)。這個(gè)超平面位于一個(gè)高維特征空間中,該空間由輸入數(shù)據(jù)的特征向量構(gòu)成。通過(guò)最大化這個(gè)超平面與最近的訓(xùn)練數(shù)據(jù)點(diǎn)(稱(chēng)為支持向量)之間的距離,SVM能夠構(gòu)建一個(gè)預(yù)測(cè)強(qiáng)的分類(lèi)器,即使在面對(duì)新的、未見(jiàn)過(guò)的數(shù)據(jù)時(shí)也能表現(xiàn)良好。2.2.1線性可分支持向量機(jī)定義一個(gè)訓(xùn)練樣本數(shù)據(jù)集,其在特征空間中(2-1) (2-1)在給定的數(shù)據(jù)集中,我們定義了一組樣本點(diǎn)(xi,yi),其中xi表示第i個(gè)特征向量,它屬于n維實(shí)數(shù)空間Rn。每個(gè)樣本點(diǎn)都被賦予一個(gè)類(lèi)標(biāo)記yi,它們分別屬于{+1,-1}集合。當(dāng)類(lèi)標(biāo)記yi為+1時(shí),我們將對(duì)應(yīng)的特征向量xi稱(chēng)為正例;而當(dāng)類(lèi)標(biāo)記yi為-1時(shí),則稱(chēng)xi為負(fù)例。這樣的定義使得我們能夠?qū)?shù)據(jù)集中的樣本進(jìn)行分類(lèi)和分析。REF_Ref1725\r\h[6]。圖2-1線性可分示意圖在圖2-1中,圖中所示的黑線可以視為一種超平面可以很好的將兩類(lèi)完全區(qū)別開(kāi)來(lái),這條黑線為“支持向量”即距離最優(yōu)超平面最近的樣本,。對(duì)于線性可分的數(shù)據(jù)集,最大化間隔或求解相關(guān)的凸二次規(guī)劃問(wèn)題來(lái)學(xué)習(xí)到分離超平面 (2-2)相應(yīng)的分類(lèi)決策函數(shù) (2-3)這就是線性可分SVM。要找到所需的分離超平面,可以通過(guò)最大化區(qū)間或求解等效的凸二次編程問(wèn)題來(lái)實(shí)現(xiàn)。在此之前,我們首先介紹有兩個(gè)關(guān)鍵概念:函數(shù)間隔和幾何間隔。

1.函數(shù)間隔在定義2.2中,我們引入了函數(shù)區(qū)間的概念。對(duì)于給定的訓(xùn)練樣本數(shù)據(jù)集M和超平面(ω,b),我們定義一個(gè)超平面(ω,b)關(guān)于樣本點(diǎn)(xi,yi)的函數(shù)區(qū)間是一個(gè)數(shù)值。 (2-4)函數(shù)間隔最小值 (2-5)為超平面(ω,b)關(guān)于訓(xùn)練樣本數(shù)據(jù)集M的函數(shù)間隔。2.幾何間隔定義2.3(幾何間隔)超平面(ω,b)關(guān)于樣本點(diǎn)(xi,yi)的幾何間隔為 (2-6)超平面(ω,b)關(guān)于M數(shù)據(jù)集中所有樣本點(diǎn)的幾何間隔的最小值 (2-7)為超平面(ω,b)關(guān)于訓(xùn)練樣本數(shù)據(jù)集M的幾何間隔。函數(shù)間隔和幾何間隔的關(guān)系有下面的公式: (2-8) (2-9)最大間隔分離超平面。這個(gè)問(wèn)題可以表示為一個(gè)求解約束最優(yōu)化問(wèn)題REF_Ref9526\r\h[4]: (2-10)通過(guò)上述函數(shù)間隔與幾何間隔關(guān)系的公式,我們可以將約束最優(yōu)化問(wèn)題進(jìn)行改寫(xiě) (2-11)假設(shè)將ω和b同時(shí)乘相同的比例系數(shù)θ,由上式可知,最優(yōu)化問(wèn)題中的不等式約束并沒(méi)有被這樣的一個(gè)改變影響,即最優(yōu)化問(wèn)題的解不會(huì)被函數(shù)間隔的范圍取值所影響??梢匀?,代入上述最優(yōu)化問(wèn)題。且我們注意到最大化和最小化是等價(jià)的。線性可分SVM學(xué)習(xí)所對(duì)應(yīng)的最優(yōu)化問(wèn)題可以改寫(xiě)為: (2-12)此時(shí),上述約束最優(yōu)化問(wèn)題變?yōu)橐粋€(gè)凸二次規(guī)劃問(wèn)題。通過(guò)求解對(duì)偶問(wèn)題來(lái)最終得到原始問(wèn)題及最優(yōu)化問(wèn)題的解。對(duì)每一個(gè)不等式:式,引進(jìn)拉格朗日乘子αi≥0,i=1,2,???,n,利用拉格朗日乘子法求解上述二次規(guī)劃問(wèn)題。我們定義拉格朗日函數(shù)REF_Ref1725\r\h[3]: (2-13)其中,α=(α1,α2,???,αn)T是拉格朗日乘子向量。根據(jù)拉格朗日對(duì)偶性,我們用極大極小問(wèn)題來(lái)完成對(duì)原始最優(yōu)化問(wèn)題的對(duì)偶問(wèn)題的轉(zhuǎn)化: (2-14)在理想情況下,我們會(huì)假設(shè)數(shù)據(jù)能夠被一個(gè)超平面完全分開(kāi),這種情況稱(chēng)為線性可分。但實(shí)際情況很少會(huì)如此理想化。在真實(shí)應(yīng)用中,我們的數(shù)據(jù)通常是不可分的,可能包含噪聲或特異點(diǎn),這使得無(wú)法簡(jiǎn)單地通過(guò)一個(gè)超平面將不同類(lèi)別的樣本完全分隔開(kāi)來(lái)。2.2.2線性SVM在處理線性不可分割的實(shí)例時(shí),必須使用軟區(qū)間最大化來(lái)代替?zhèn)鹘y(tǒng)的線性可分離支持向量機(jī)(SVM)理論,針對(duì)給定的訓(xùn)練數(shù)據(jù)集M,我們假設(shè)其不具備線性可分性,轉(zhuǎn)換過(guò)程。我們假設(shè)所提供的訓(xùn)練數(shù)據(jù)集M缺乏線性可分性,這意味著存在噪聲或異常樣本。因此,某些樣本點(diǎn)可能不符合我們?cè)O(shè)定的約束條件,即函數(shù)區(qū)間必須等于或大于1。消除這些特異點(diǎn)后,剩余的樣本點(diǎn)更有可能達(dá)到線性可分的狀態(tài)。我們引進(jìn)一個(gè)松弛變量ξi≥0對(duì)應(yīng)于每一個(gè)樣本點(diǎn)(xi,yi),以確保該樣本點(diǎn)的函數(shù)間隔與松弛變量之和大于等于1。這一變化使得約束條件變?yōu)椋? (2-15)對(duì)引入的松弛變量ξi,需要支付一個(gè)代價(jià),因此得到的最優(yōu)化問(wèn)題中的目標(biāo)函數(shù)將由原來(lái)的變?yōu)? (2-16)在這個(gè)式子中,C被稱(chēng)為懲罰參數(shù),其具體數(shù)值應(yīng)根據(jù)問(wèn)題的實(shí)際情況確定。這個(gè)懲罰參數(shù)C的作用是調(diào)節(jié)對(duì)特異點(diǎn)造成損失的重視程度REF_Ref1725\r\h[3]。換句話說(shuō),隨著C值的增大,我們更關(guān)注特異點(diǎn)可能引起的損失,因?yàn)樵谔禺慄c(diǎn)的松弛變量總和不變的情況下,目標(biāo)函數(shù)的損失也會(huì)增加。將上述這種引入松弛變量的情況稱(chēng)為軟間隔最大化。那么,線性不可分SVM的凸二次規(guī)劃問(wèn)題(原始問(wèn)題)就變?yōu)椋? (2-17) (2-18) (2-19)下面給出線性SVM的定義。定義2.3(線性SVM)對(duì)于給定的訓(xùn)練數(shù)據(jù)集,該數(shù)據(jù)集線性不可分,通過(guò)求解上述凸二次規(guī)劃問(wèn)題式(2.9)~式(2.11)得到ω*,b*,從而得到分離超平面為 (2-20)相應(yīng)的分類(lèi)決策函數(shù)為 (2-21)稱(chēng)為線性SVM。根據(jù)線性可分的情況,我們可以同理推出,線性SVM的凸二次規(guī)劃問(wèn)題的對(duì)偶問(wèn)題為: (2-22) (2-23) (2-24)線性SVM的原始問(wèn)題所對(duì)應(yīng)的拉格朗日函數(shù)為: (2-25)其中,αi*≥0,μi*≥0。2.2.3非線性SVM在面對(duì)非線性數(shù)據(jù)集時(shí),傳統(tǒng)的線性SVM模型無(wú)法勝任,因?yàn)樗荒芴幚砭€性分類(lèi)問(wèn)題,對(duì)于非線性數(shù)據(jù)的分類(lèi)則顯得力不從心。我們必須想辦法對(duì)這個(gè)非線性分類(lèi)問(wèn)題進(jìn)行特定的非線性修改,使之成為我們習(xí)以為常的問(wèn)題線性分類(lèi)的問(wèn)題REF_Ref10009\r\h[8]。我們用一個(gè)最簡(jiǎn)單易懂的圖來(lái)表示:圖2-2示意圖非線性支持向量機(jī)使用核函數(shù)將數(shù)據(jù)從低維特征空間轉(zhuǎn)換到高維特征空間,這使其有別于線性支持向量機(jī)。因此,該空間中的數(shù)據(jù)可以線性分離。使用這種方法可以將原來(lái)數(shù)據(jù)的線性不可分轉(zhuǎn)變成高緯度空間下線性可分。進(jìn)而更容易地找到一個(gè)分離超平面,如圖所示。

2.3GARCH模型2.3.1GARCH的由來(lái)美國(guó)經(jīng)濟(jì)學(xué)家羅伯特·恩格爾在1982年提出自回歸條件異方差模型(AutoregressiveConditionalHeteroskedasticity,ARCH)。ARCH模型問(wèn)世的目的在于描述時(shí)間序列數(shù)據(jù)的波動(dòng)性,就是方差的變化。ARCH模型被廣泛用于分析和預(yù)測(cè)金融市場(chǎng)的波動(dòng)性。當(dāng)自回歸條件異方差模型(ARCH)被提出以來(lái),對(duì)金融時(shí)間序列數(shù)據(jù)的建模和分析產(chǎn)生了重大影響。經(jīng)濟(jì)學(xué)家恩格爾也因此獲得了2003年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。在此以后,ARCH模型不斷得到發(fā)展和擴(kuò)展,諸如GARCH(GeneralizedARCH)、TGARCH(ThresholdARCH)等GARCH群模型也相繼出現(xiàn),以適應(yīng)金融數(shù)據(jù)的更加復(fù)雜特征。2.3.2集群效應(yīng)集群效應(yīng)(ClusteringEffect)是指在時(shí)間序列數(shù)據(jù)中,大波動(dòng)緊跟大波動(dòng),小波動(dòng)緊跟小波動(dòng)的趨勢(shì)被稱(chēng)為波動(dòng)的聚類(lèi)現(xiàn)象REF_Ref10329\r\h[9]。這種現(xiàn)象違反了傳統(tǒng)時(shí)間序列分析中常用的獨(dú)立同分布假設(shè),即假設(shè)時(shí)間序列中的觀測(cè)值是獨(dú)立且具有恒定的方差。在金融領(lǐng)域,集群效應(yīng)特別明顯,例如股票價(jià)格的波動(dòng)。在某些時(shí)期,股票價(jià)格可能會(huì)經(jīng)歷連續(xù)的大幅波動(dòng),而在其他時(shí)期則相對(duì)平穩(wěn)。這種波動(dòng)性的集聚現(xiàn)象意味著金融資產(chǎn)的風(fēng)險(xiǎn)不是恒定的,而是在某些時(shí)期顯著增加。2.3.3ARCH模型ARCH模型是由RobertEngle于1982年提出的,用于應(yīng)對(duì)金融時(shí)間序列數(shù)據(jù)中普遍存在的波動(dòng)性聚集現(xiàn)象。在ARCH模型中,核心假設(shè)是當(dāng)前的方差或波動(dòng)性受到過(guò)去誤差平方(即歷史波動(dòng)性)的影響。具體來(lái)說(shuō),如果一個(gè)時(shí)間序列{εt}表示模型中的誤差項(xiàng),那么在ARCH模型中,εt的條件方差σt2依賴(lài)于過(guò)去的誤差平方。ε{t-1}2,ε{t-2}2,…,ε{t-p}2,其中p是模型指定的滯后階數(shù)。ARCH模型的一般形式可以表示為: (3-1)如果所有的ai都為0,那么模型就退化為了恒定方差模型,即沒(méi)有條件異方差性。2.3.4GARCH模型GARCH模型是一種強(qiáng)大的工具,能夠有效的捕捉金融市場(chǎng)產(chǎn)生的波動(dòng)性,并能給出描述和預(yù)測(cè),因此在金融領(lǐng)域中得到廣泛應(yīng)用,GARCH模型是ARCH模型的進(jìn)一步拓展,GARCH模型在高階自回歸和高階移動(dòng)平均過(guò)程中很好的處理,而且還可以更加全面地描述金融時(shí)間序列的異方差性質(zhì)REF_Ref2303\r\h[7]。其數(shù)學(xué)表達(dá)式為: (3-2)

3對(duì)滬深300指數(shù)波動(dòng)性的實(shí)例分析3.1數(shù)據(jù)采集及預(yù)處理數(shù)據(jù)來(lái)源,原始數(shù)據(jù)選取2016年1月4日-2023年12月29日,共8年的滬深300指數(shù)的收盤(pán)價(jià)進(jìn)行研究,數(shù)據(jù)來(lái)源于國(guó)泰安數(shù)據(jù)庫(kù)。其中2022年1月04日-2023年12月29日的數(shù)據(jù)用于支持向量機(jī)建模。一般情況下,如果金融資產(chǎn)價(jià)格的時(shí)間序列不符合平穩(wěn)性條件,就需要對(duì)其收益率時(shí)間序列進(jìn)行分析。在金融資產(chǎn)研究領(lǐng)域,許多學(xué)者傾向于使用對(duì)數(shù)收益率來(lái)表達(dá)價(jià)格收益率。公式如下: (4-1)將原始數(shù)據(jù)2022年1月04日-2023年12月29日的收盤(pán)價(jià)進(jìn)行預(yù)處理,自變量分別為前3天、前4天、前5天和前6天數(shù)據(jù),用后一天收盤(pán)價(jià)減去前一天收盤(pán)價(jià),若結(jié)果大于0,視為漲,記為1類(lèi),否則視為跌,記為0類(lèi)。3.2GARCH模型的構(gòu)建3.2.1時(shí)序圖與特征量觀察圖3-1收盤(pán)價(jià)的原序列圖根據(jù)圖表3-1的趨勢(shì)分析結(jié)果,能夠看出滬深300指數(shù)的收盤(pán)價(jià)原始序列波動(dòng)較大,且圍繞平均值的波動(dòng)不夠穩(wěn)定,說(shuō)明該序列是不平穩(wěn)的。圖3-2對(duì)數(shù)收益率序列圖滬深300指數(shù)對(duì)數(shù)收益率的一階差分時(shí)間序列如圖3-2所示。我們初步注意到,滬深300指數(shù)的對(duì)數(shù)收益率時(shí)間序列在均值附近表現(xiàn)出小幅波動(dòng)和穩(wěn)定,這表明根據(jù)圖3-2所示的趨勢(shì)分析,該序列可能是平穩(wěn)的。從圖3-2的表現(xiàn)可以看出,可能存在異方差,對(duì)數(shù)收益率序列顯示出波動(dòng)率的聚集趨勢(shì)。在建立廣義自回歸條件異方差(GARCH)模型時(shí),金融時(shí)間序列通常被假定為正態(tài)分布。然而,在與金融市場(chǎng)相關(guān)的實(shí)證數(shù)據(jù)中經(jīng)常會(huì)出現(xiàn)肥尾和高峰等統(tǒng)計(jì)特征。本文使用JarqueBera(JB)檢驗(yàn)來(lái)評(píng)估序列的正態(tài)性。一種名為JB檢驗(yàn)的統(tǒng)計(jì)檢驗(yàn)用于確定數(shù)據(jù)樣本的偏度和峰度是否符合正態(tài)分布。正態(tài)分布的對(duì)稱(chēng)性是通過(guò)偏度來(lái)衡量的,偏度是指分布的對(duì)稱(chēng),而峰度則是指頂端尖銳或者平坦。檢驗(yàn)結(jié)果如圖3-3和表3-1所示。表3-1滬深300指數(shù)對(duì)數(shù)收益序列的統(tǒng)計(jì)特征滬深300均值最大值最小值標(biāo)準(zhǔn)差Skewness(偏度)Kurtosis(峰度)JB檢驗(yàn)收益率-0.567*10-60.057774-0.0820870.011974-0.5556327.4102561673.782圖3-3描述性統(tǒng)計(jì)根據(jù)圖中3-3的統(tǒng)計(jì)檢驗(yàn)結(jié)果,滬深300指數(shù)的對(duì)數(shù)收益率序列其峰度值為7.410256大于3,這表明相較于正態(tài)分布,該序列包含更多的極端值。偏度為-0.555632小于0,說(shuō)明序列呈現(xiàn)左偏態(tài),具有非對(duì)稱(chēng)性和長(zhǎng)尾特征。J-B統(tǒng)計(jì)量的值為1673.782,其對(duì)應(yīng)的P值接近于0,這意味著我們可以拒絕滬深300對(duì)數(shù)收益率服從正態(tài)分布的假設(shè)。滬深300指數(shù)的對(duì)數(shù)收益率具有尖峰厚尾、左偏和波動(dòng)聚集等特征。因此,使用正態(tài)分布擬合時(shí)會(huì)出現(xiàn)精確度低和一定的誤差。尖峰厚尾可能是由于大量信息的突然出現(xiàn)導(dǎo)致價(jià)格大幅波動(dòng),或者投資者對(duì)信息做出非線性反應(yīng),進(jìn)而導(dǎo)致信息的累積效應(yīng),形成大幅波動(dòng)的尖峰后尾特性REF_Ref2440\r\h[10]。3.2.2序列平穩(wěn)性檢驗(yàn)要確定收益率序列是否為平穩(wěn)序列,可以采用多種技術(shù),如ADF單位根檢驗(yàn)和Phillips-Perron檢驗(yàn)。在此,我們選擇了廣泛使用的ADF單位根檢驗(yàn)進(jìn)行評(píng)估。下表顯示了滬深300指數(shù)的ADF檢驗(yàn)結(jié)果。滬深300指數(shù)的ADF檢驗(yàn)結(jié)果如下表:表3-2ADF平穩(wěn)性檢驗(yàn)t-StatisticProb.*ADF檢測(cè)統(tǒng)計(jì)值-45312020.0001檢驗(yàn)臨界值:1%level-3.4335195%level-2.86282610%level-2.567501根據(jù)ADF檢驗(yàn)結(jié)果,t統(tǒng)計(jì)量為-45.31202,小于1%、5%和10%顯著性水平的臨界值。此外,P值為0.0001,小于0.05的顯著性水平。因此,收益率序列是穩(wěn)定的,驗(yàn)證了備擇假設(shè),拒絕了原假設(shè)。使用Eviews8.0程序?qū)Σ罘趾蟮氖找媛市蛄羞M(jìn)行自相關(guān)和偏自相關(guān)分析。表3-3自相關(guān)偏自相關(guān)性檢驗(yàn)p值小于0.05,在95%置信水平下拒絕了原假設(shè),說(shuō)明序列存在自相關(guān)性,不是白噪聲序列。由表4-3自相關(guān)偏自相關(guān)圖,我們發(fā)現(xiàn)AR模型能適合該序列。因此我們可以選擇構(gòu)建AR(6),MA(6),ARMA(6,6),ARMA(5,6),和ARMA(6,5)五個(gè)模型進(jìn)行參數(shù)估計(jì),然后利用信息準(zhǔn)則AIC和SC進(jìn)一步確定最優(yōu)模型。3.2.3建立AR模型1.模型定階可以嘗試使用AR(6),MA(6),ARMA(6,6),ARMA(5,6),ARMA(6,5)這五種模型進(jìn)行序列擬合。對(duì)擬合好的五種模型進(jìn)行系數(shù)檢驗(yàn),結(jié)果顯示只有AR(6)和MA(6)模型的p值均小于0.01,說(shuō)明AR(6)和MA(6)它們的系數(shù)是顯著的。再次利用信息準(zhǔn)則AIC和SC,發(fā)現(xiàn)AR(6)模型的AIC和SC比MA(6)的AIC和SC低,因此選擇AR(6)模型來(lái)擬合序列。表3-4AIC和SC數(shù)值A(chǔ)R(6)MA(6)ARMA(5,6)ARMA(6,6)ARMA(6,5)AIC-6.039872-6.012325-6.049547-6.050126-6.04924SC-6.019739-5.992243-6.015047-6.012735-6.0147252.模型檢驗(yàn)為了驗(yàn)證AR(6)模型擬合的好壞,需要AR(6)模型擬合后的殘差項(xiàng)進(jìn)行白噪聲檢驗(yàn)表3-5殘差檢驗(yàn)p值大于0.05,說(shuō)明模型擬合效果好。AR(6)模型擬合后的殘差項(xiàng)通過(guò)了白噪聲檢驗(yàn),說(shuō)明擬合AR(6)模型對(duì)信息的提取比較完全,構(gòu)建均值方程是合理的。均值方程的形式為: (4-2)建立模型: (4-3)還需要驗(yàn)證該方程的殘差序列是否存在著ARCH效應(yīng)。3.2.4ARCH效應(yīng)檢驗(yàn)殘差序列是否存在ARCH效應(yīng),常用方法是過(guò)殘差平方的自相關(guān)檢驗(yàn),ARCH-LM檢驗(yàn)對(duì)異方差效應(yīng)進(jìn)行判斷。表3-6殘差平方檢驗(yàn)顯然,對(duì)于殘差平方序列中的每一個(gè)p值,Q統(tǒng)計(jì)量對(duì)應(yīng)的置信水平都小于0.01。因此,我們可以排除AR(6)模型擬合的殘差平方序列缺乏自相關(guān)性的假設(shè),得出AR(6)模型的殘差序列具有ARCH效應(yīng)的結(jié)論。表3-7ARCH-LM檢驗(yàn)由表4-7ARCH-LM檢驗(yàn)表可以看出p值小于0.05,因此AR(6)模型存在ARCH效應(yīng)。在研究收益波動(dòng)率時(shí),我們經(jīng)常發(fā)現(xiàn)εt條件方差σt2與之前時(shí)刻的變化量相關(guān)。因此可以構(gòu)建GARCH模型。3.2.5模型檢驗(yàn)常見(jiàn)的不同階數(shù)的GARCH模型分別為GARCH(1,1)、GARCH(1,2)、GARCH(2,1)和GARCH(2,2),用來(lái)擬合股票收益率序列。綜合各種信息準(zhǔn)則的結(jié)果,我們發(fā)現(xiàn)在AIC和HQ準(zhǔn)則下,GARCH(2,1)模型的數(shù)值最小,表明該模型最適合描述收益率波動(dòng)率的特征。因此,通過(guò)對(duì)比AIC,SC和HQ的數(shù)值,我們選擇了AR(6)-GARCH(2,1)模型來(lái)對(duì)收益率序列進(jìn)行擬合。表3-8選取最優(yōu)模型參考標(biāo)準(zhǔn)AICSCHQGARCH(1,1)-6.204695-6.175933-6.194117GARCH(1,2)-6.205906-6.174268-6.194270GARCH(2,1)-6.206305-6.174667-6.194669GARCH(2,2)-6.205298-6.170783-6.192604根據(jù)擬合的結(jié)果我們可以得出方差方程的常數(shù)項(xiàng)不顯著,其他參數(shù)系數(shù)都展現(xiàn)出了顯著性。在條件異方差實(shí)證分析中,常數(shù)項(xiàng)不是關(guān)鍵的參數(shù)標(biāo)準(zhǔn),因此其顯著性較低,不會(huì)產(chǎn)生其他影響。由上述可知,GARCH(2,1)模型能夠有效地?cái)M合數(shù)據(jù)這一結(jié)論。為了評(píng)估建立的AR(6)-GARCH(2,1)模型,我們還需要對(duì)殘差項(xiàng)進(jìn)行檢驗(yàn),來(lái)判斷模型質(zhì)量的好壞,判斷AR(6)-GARCH(2,1)模型是否可以充分地捕捉波動(dòng)信息。因此還需要做ARCH-LM檢驗(yàn)和殘差平方檢驗(yàn),結(jié)果顯示,兩個(gè)檢驗(yàn)的p值均大于0.05。這表明AR(6)-GARCH(2,1)模型能夠有效地提取水平和波動(dòng)信息,因此具有顯著的擬合效果。該模型的擬合方程為: (4-4)表3-9最優(yōu)擬合模型數(shù)據(jù)表3-10殘差平方檢驗(yàn)表3-11ARCH-LM檢驗(yàn)3.3基于SVM-GARCH模型的波動(dòng)性分析3.3.1基于單位收益波動(dòng)本文整理了滬深300指數(shù)中的2022年1月4日至2023年12月29日的股票預(yù)測(cè)的收益率和條件方差數(shù)據(jù),收益率與條件方差的比值作為特征值,其中,將特征值的前70%位的股票價(jià)格數(shù)據(jù)作為訓(xùn)練集,后30%位的股票數(shù)據(jù)作為測(cè)試集。共481組股票數(shù)據(jù)。使用R語(yǔ)言中的e1071包,下載并加載到Rstudio后,使用tune.svm函數(shù)來(lái)執(zhí)行參數(shù)調(diào)優(yōu),利用十折交叉驗(yàn)證法確定最優(yōu)參數(shù)。十折交叉驗(yàn)證方式的目的是為了降低過(guò)擬合的風(fēng)險(xiǎn),降低隨機(jī)因素對(duì)模型評(píng)估的影響,提高評(píng)估的穩(wěn)健性。十折交叉驗(yàn)證方式做法是在這10次試驗(yàn)中,選擇誤差最小的一組參數(shù)作為最優(yōu)參數(shù)。自變量分別為前3天、前4天、前5天和前6天數(shù)據(jù),用后一天收盤(pán)價(jià)減去前一天收盤(pán)價(jià),若結(jié)果大于0,視為漲,記為1類(lèi),否則視為跌,記為0類(lèi)。在計(jì)算模型準(zhǔn)確率時(shí)需要用到混淆矩陣(ConfusionMatrix),也稱(chēng)為錯(cuò)誤矩陣,是一種特別適用于監(jiān)督學(xué)習(xí)的評(píng)估分類(lèi)模型性能的工具。典型的混淆矩陣如下所示:表3-12混肴矩陣預(yù)測(cè)正類(lèi)預(yù)測(cè)負(fù)類(lèi)實(shí)際正類(lèi)TP(真正類(lèi))FN(假負(fù)類(lèi))實(shí)際負(fù)類(lèi)FP(假正類(lèi))TN(真負(fù)類(lèi)) (4-5)下面是我們要執(zhí)行的步驟:導(dǎo)入必要的庫(kù)和數(shù)據(jù),準(zhǔn)備數(shù)據(jù),將其分為自變量和因變量,執(zhí)行參數(shù)調(diào)優(yōu),選取核函數(shù),使用十折交叉驗(yàn)證法確定最優(yōu)參數(shù),構(gòu)建最優(yōu)模型,進(jìn)行二分類(lèi)預(yù)測(cè)。關(guān)于核函數(shù)及參數(shù)的選取,介紹5種常用的核函數(shù),目前常用的核函數(shù)為:1.線性核函數(shù)線性核函數(shù)的表達(dá)式為: (4-6)線性核函數(shù)只有1種參數(shù)變量,線性核函數(shù)是一種比較簡(jiǎn)單的核函數(shù)。2.高斯徑向基核函數(shù)其表達(dá)式為: (4-7)3.Sigmoid核函數(shù)其表達(dá)式為: (4-8)Sigmoid核函數(shù)中有參數(shù)γ和r,其中,γ>0,r<0。4.多項(xiàng)式核函數(shù) (4-9)三個(gè)參數(shù)分別為:γ,r,d,其中d表示最高項(xiàng)次數(shù)。5.拉普拉斯徑向基核函數(shù)(拉普拉斯RBF) (4-10)徑向基核函數(shù)有2種參數(shù)變量,徑向基核函數(shù)是一種比較復(fù)雜的核函數(shù)。選擇不同的核函數(shù)對(duì)數(shù)據(jù)分類(lèi)有不同程度的效果;為了得到更準(zhǔn)確的結(jié)果,可以根據(jù)實(shí)際情況選擇更合適的核函數(shù)。由于支持向量機(jī)經(jīng)常使用高斯徑向基函數(shù)和線性核函數(shù),因此我們選擇了這兩種核函數(shù)。以第1天,第2天,第3天數(shù)據(jù)為自變量,第4天與第3天差值,若結(jié)果大于0,視為漲,記為1類(lèi),否則視為跌,記為0類(lèi),用類(lèi)別作為因變量。1.線性核函數(shù)線性核函數(shù)下,懲罰參數(shù)C取值設(shè)定為0.001,0.01,0.1,1,10,對(duì)應(yīng)的不同參數(shù)下的預(yù)測(cè)錯(cuò)誤率如圖所示:圖3-4線性核函數(shù)不同參數(shù)組合下預(yù)測(cè)錯(cuò)誤率最優(yōu)模型的結(jié)果顯示模型的懲罰參數(shù)cost為0.001。2.非線性核函數(shù)徑向基核函數(shù)下,包含gamma和懲罰參數(shù)C兩個(gè)可調(diào)參數(shù),設(shè)gamma取值設(shè)定為(0.000001,0.01),懲罰參數(shù)C取值設(shè)定為0.001,0.01,0.1,1,100,1000對(duì)應(yīng)的不同參數(shù)下的預(yù)測(cè)錯(cuò)誤率如圖所示:圖3-5徑向基核函數(shù)不同參數(shù)組合下預(yù)測(cè)錯(cuò)誤率最優(yōu)模型的結(jié)果顯示模型的懲罰參數(shù)cost為100,gamma為0.001。線性核函數(shù)在懲罰參數(shù)cost為0.001,訓(xùn)練集預(yù)測(cè)準(zhǔn)確度為53.59%,測(cè)試集為57.82%。二分類(lèi)混淆矩陣如表所示:表3-13混淆矩陣二分類(lèi)表訓(xùn)練集測(cè)試集01accuracy01accuracy017915553.59%0846257.82%100101徑向基核函數(shù)在懲罰參數(shù)cost為100,gamma為0.001,訓(xùn)練集預(yù)測(cè)準(zhǔn)確度為56.88%,測(cè)試集為53.06%。二分類(lèi)混淆矩陣如表所示:表3-14徑向基核函數(shù)二分類(lèi)表訓(xùn)練集測(cè)試集01accuracy01accuracy017714256.88%0735853.06%12131115上述的線性核函數(shù)和徑向基核函數(shù)相比,在選擇最優(yōu)參數(shù)后,徑向基核函數(shù)測(cè)試集和訓(xùn)練集的差距較小,說(shuō)明此模型穩(wěn)定性較強(qiáng)。按照上述方法按照前4天、前5天和前6天的數(shù)據(jù)作為自變量,后一天收盤(pán)價(jià)減去前一天收盤(pán)價(jià),若結(jié)果大于0,視為漲,記為1類(lèi),否則視為跌,記為0類(lèi),以類(lèi)別為因變量。分別得出線性核函數(shù)的最優(yōu)參數(shù)懲罰參數(shù)cost,徑向基核函數(shù)的最優(yōu)參數(shù)懲罰參數(shù)cost和gamma值,選擇最優(yōu)的參數(shù)后,訓(xùn)練集和測(cè)試集準(zhǔn)確度如下表所示:表3-15訓(xùn)練集和測(cè)試集準(zhǔn)確度前4天數(shù)據(jù)為自變量前5天數(shù)據(jù)為自變量前6天數(shù)據(jù)為自變量線性核函數(shù)cost0.0010.0010.1Train準(zhǔn)確度53.89%53.89%55.09%Test準(zhǔn)確度56.84%57.24%55.56徑向基核函數(shù)cost1001100gamma0.0010.010.001Train準(zhǔn)確度58.38%59.58%60.48%Test準(zhǔn)確度52.06%49.66%50%上述的線性核函數(shù)和徑向基核函數(shù)相比,以前6天數(shù)據(jù)為自變量那一組結(jié)果,在選擇最優(yōu)參數(shù)后,線性核函數(shù)測(cè)試集和訓(xùn)練集的差距最小,說(shuō)明此模型穩(wěn)定性較強(qiáng)。3.3.2基于風(fēng)險(xiǎn)溢價(jià)投資者因承擔(dān)更多風(fēng)險(xiǎn)而預(yù)期獲得的額外回報(bào)被稱(chēng)為風(fēng)險(xiǎn)溢價(jià)(RiskPremium),風(fēng)險(xiǎn)溢價(jià)是金融市場(chǎng)中不可或缺的一部分,它影響著投資決策、資產(chǎn)定價(jià)、風(fēng)險(xiǎn)管理等多個(gè)方面。投資者在構(gòu)建投資組合時(shí),會(huì)考慮風(fēng)險(xiǎn)溢價(jià),以確保他們的投資能夠得到合理的風(fēng)險(xiǎn)調(diào)整后回報(bào)。投資者可以選擇獲得的利率,或資金在一段時(shí)間內(nèi)無(wú)風(fēng)險(xiǎn)增長(zhǎng)的利率,稱(chēng)為無(wú)風(fēng)險(xiǎn)利率。通常情況下,無(wú)風(fēng)險(xiǎn)利率通常被視為金融市場(chǎng)的基準(zhǔn),因?yàn)樗砹送顿Y資本的最基本回報(bào),而不需要承擔(dān)任何風(fēng)險(xiǎn)。這個(gè)利率通常以政府債券的收益率作為參考,因?yàn)檎畟徽J(rèn)為是風(fēng)險(xiǎn)最低的投資工具。因此參考國(guó)債的收益率,2024年4月12日,中國(guó)不同期限國(guó)債的收益率如下:3個(gè)月期限的國(guó)債收益率為1.55%,6個(gè)月期限的國(guó)債收益率為1.61%,1年期限的國(guó)債收益率為1.70%。年收益率和日收益率轉(zhuǎn)換公式 (4-11)3個(gè)月期限的日收益率為0.0421%,6個(gè)月期限的日收益率為0.0438%,1年期限的日收益率為0.0462%。和上述方法相同,只是將風(fēng)險(xiǎn)溢價(jià)作為特征值,其中,將特征值的前70%位的股票價(jià)格數(shù)據(jù)作為訓(xùn)練集,后30%位的股票數(shù)據(jù)作為測(cè)試集,無(wú)風(fēng)險(xiǎn)利率取0.0421%。以第1天,第2天,第3天數(shù)據(jù)為自變量,第4天與第3天差值,若結(jié)果大于0,視為漲,記為1類(lèi),否則視為跌,記為0類(lèi),用類(lèi)別作為因變量。共481組股票數(shù)據(jù)。1.線性核函數(shù)線性核函數(shù)下,懲罰參數(shù)C取值設(shè)定為10^(-4:3),對(duì)應(yīng)的不同參數(shù)下的預(yù)測(cè)錯(cuò)誤率如圖所示:圖3-6線性核函數(shù)不同參數(shù)組合下預(yù)測(cè)錯(cuò)誤率最優(yōu)模型的結(jié)果顯示模型的懲罰參數(shù)cost為0.0001。2.非線性核函數(shù)徑向基核函數(shù)下,包含gamma和懲罰參數(shù)C兩個(gè)可調(diào)參數(shù),設(shè)gamma取值設(shè)定為(0.000001,0.01),懲罰參數(shù)C取值設(shè)定為0.001,0.01,0.1,1,100,1000對(duì)應(yīng)的不同參數(shù)下的預(yù)測(cè)錯(cuò)誤率如圖所示:圖3-7徑向基核函數(shù)不同參數(shù)下的預(yù)測(cè)錯(cuò)誤率最優(yōu)模型的結(jié)果顯示模型的懲罰參數(shù)cost為100,gamma為0.01。線性核函數(shù)在懲罰參數(shù)cost為0.0001,訓(xùn)練集預(yù)測(cè)準(zhǔn)確度為53.89%,測(cè)試集為57.14%。二分類(lèi)混淆矩陣如表所示:表3-16線性核函數(shù)二分類(lèi)混淆矩陣訓(xùn)練集測(cè)試集01accuracy01accuracy017915453.89%0846357.14%101100徑向基核函數(shù)在懲罰參數(shù)cost為100,gamma為0.001,訓(xùn)練集預(yù)測(cè)準(zhǔn)確度為58.68%,測(cè)試集為54.42%。二分類(lèi)混淆矩陣如表所示:表3-17徑向基核函數(shù)二分類(lèi)混淆矩陣訓(xùn)練集測(cè)試集01accuracy01accuracy017113058.68%0745754.42%18251106上述的線性核函數(shù)和徑向基核函數(shù)相比,在選擇最優(yōu)參數(shù)后,徑向基核函數(shù)測(cè)試集和訓(xùn)練集的差距較小,說(shuō)明此模型穩(wěn)定性較強(qiáng)。按照上述方法按照前4天、前5天和前6天的數(shù)據(jù)作為自變量,后一天收盤(pán)價(jià)減去前一天收盤(pán)價(jià),若結(jié)果大于0,視為漲,記為1類(lèi),否則視為跌,記為0類(lèi),以類(lèi)別為因變量。表3-18無(wú)風(fēng)險(xiǎn)利率下準(zhǔn)確度0.0421%前4天數(shù)據(jù)為自變量前5天數(shù)據(jù)為自變量前6天數(shù)據(jù)為自變量線性核函數(shù)cost0.0010.0010.001Train準(zhǔn)確度54.19%54.49%54.79%Test準(zhǔn)確度54.11%57.24%56.94%徑向基核函數(shù)cost1001100gamma0.0010.010.001Train準(zhǔn)確度63.47%62.58%65.27%test準(zhǔn)確度55.48%54.48%49.31%上述的線性核函數(shù)和徑向基核函數(shù)相比,以前4天數(shù)據(jù)為自變量那一組結(jié)果,在選擇最優(yōu)參數(shù)后,線性核函數(shù)測(cè)試集和訓(xùn)練集的差距最小,說(shuō)明此模型穩(wěn)定性較強(qiáng)。無(wú)風(fēng)險(xiǎn)利率分別取0.0438%、0.0462%。前3天、前4天、前5天和前6天的數(shù)據(jù)作為自變量以第1天,第2天,第3天數(shù)據(jù)為自變量,第4天與第3天差值,若結(jié)果大于0,視為漲,記為1類(lèi),否則視為跌,記為0類(lèi),用類(lèi)別作為因變量。表3-19無(wú)風(fēng)險(xiǎn)利率下的準(zhǔn)確度0.0438%前3天數(shù)據(jù)作為自變量前4天數(shù)據(jù)作為自變量前5天數(shù)據(jù)作為自變量前6天數(shù)據(jù)作為自變量線性核函數(shù)cost0.010.010.010.01Trai準(zhǔn)確度53.89%54.19%54.49%54.79%Tes準(zhǔn)確度57.14%56.84%57.24%56.94%徑向基核函數(shù)cost0.0010.010.010.01gamma100100010100Trai準(zhǔn)確度59.2863.77%59.58%65.87%Tes準(zhǔn)確度53.74%56.85%51.72%49%上述的線性核函數(shù)和徑向基核函數(shù)相比,以前6天數(shù)據(jù)為自變量那一組結(jié)果,在選擇最優(yōu)參數(shù)后,線性核函數(shù)測(cè)試集和訓(xùn)練集的差距最小,說(shuō)明此模型穩(wěn)定性較強(qiáng)。表3-20無(wú)風(fēng)險(xiǎn)利率下的準(zhǔn)確度0.0462%前3天數(shù)據(jù)作為自變量前4天數(shù)據(jù)作為自變量前5天數(shù)據(jù)作為自變量前6天數(shù)據(jù)作為自變量線性核函數(shù)cost0.010.010.0011000Trai準(zhǔn)確度53.89%54.19%54.49%63.47%Tes準(zhǔn)確度57.14%56.85%57.24%52.08%徑向基核函數(shù)cost0.010.010.0010.001gamma10001101000Trai準(zhǔn)確度58.98%63.77%59.88%70.06%Tes準(zhǔn)確度55.78%53.42%52.41%54%上述的線性核函數(shù)和徑向基核函數(shù)相比,以前4天數(shù)據(jù)為自變量那一組結(jié)果,在選擇最優(yōu)參數(shù)后,徑向基核函數(shù)測(cè)試集和訓(xùn)練集的差距最小,說(shuō)明此模型穩(wěn)定性較強(qiáng)。在引入無(wú)風(fēng)險(xiǎn)利率后,預(yù)測(cè)的數(shù)據(jù)更穩(wěn)定,變化幅度小,說(shuō)明風(fēng)險(xiǎn)溢價(jià)與模型結(jié)合更能很好的預(yù)測(cè)滬深300指數(shù)的漲跌。3.4SVM與SVM-GARCH模型以原始數(shù)據(jù)收盤(pán)價(jià)的第1天,第2天,第3天數(shù)據(jù)為自變量,第4天與第3天差值,若結(jié)果大于0,視為漲,記為1類(lèi),否則視為跌,記為0類(lèi),用類(lèi)別作為因變量。共481組股票數(shù)據(jù)。1.線性核函數(shù)線性核函數(shù)下,懲罰參數(shù)C取值設(shè)定為10^(-4:3),對(duì)應(yīng)的不同參數(shù)下的預(yù)測(cè)錯(cuò)誤率如圖所示:圖3-8線性核函數(shù)不同參數(shù)組合下的預(yù)測(cè)錯(cuò)誤率最優(yōu)模型的結(jié)果顯示模型的懲罰參數(shù)cost為0.001。2.非線性核函數(shù)徑向基核函數(shù)下,包含gamma和懲罰參數(shù)C兩個(gè)可調(diào)參數(shù),設(shè)gamma取值設(shè)定為(0.000001,0.01),懲罰參數(shù)C取值設(shè)定為0.001,0.01,0.1,1,100,1000對(duì)應(yīng)的不同參數(shù)下的預(yù)測(cè)錯(cuò)誤率如圖所示:圖3-9徑向基核函數(shù)不同參數(shù)下的預(yù)測(cè)錯(cuò)誤率線性核函數(shù)在懲罰參數(shù)C為1時(shí),訓(xùn)練集預(yù)測(cè)準(zhǔn)確度為53.59%,測(cè)試集為57.14%。二分類(lèi)混淆矩陣如表所示:表3-21線性核函數(shù)二分類(lèi)混淆矩陣訓(xùn)練集測(cè)試集01accuracy01accuracy017915553.59%0846357.14%100100徑向基核函數(shù)在懲罰參數(shù)cost為1000,gamma為1e-06,訓(xùn)練集預(yù)測(cè)準(zhǔn)確度為59.28%,測(cè)試集為57.82%。二分類(lèi)混淆矩陣如表所示:表3-22徑向基核函數(shù)二分類(lèi)混淆矩陣訓(xùn)練集測(cè)試集01accuracy01accuracy017113059.28%0745757.82%18251106上述的線性核函數(shù)和徑向基核函數(shù)相比,在選擇最優(yōu)參數(shù)后,徑向基核函數(shù)測(cè)試集和訓(xùn)練集的差距較小,說(shuō)明此模型穩(wěn)定性較強(qiáng)。表3-23原始數(shù)據(jù)的預(yù)測(cè)準(zhǔn)確度前4天數(shù)據(jù)為自變量前5天數(shù)據(jù)為自變量前6天數(shù)據(jù)為自變量線性核函數(shù)cost0.0010.0011000Trai準(zhǔn)確度56.29%57.19%53.89%Tes準(zhǔn)確度53.42%56.55%56.94%徑向基核函數(shù)cost10001e-41e-4gamma1e-61e-61e-6Trai準(zhǔn)確度53.89%53.89%53.89%Tes準(zhǔn)確度56.85%57.24%56.94%上述的線性核函數(shù)和徑向基核函數(shù)相比,以前5天數(shù)據(jù)為自變量那一組結(jié)果,在選擇最優(yōu)參數(shù)后,線性核函數(shù)測(cè)試集和訓(xùn)練集的差距最小,且準(zhǔn)確度較高,說(shuō)明此模型穩(wěn)定性較強(qiáng)。與SVM-GARCH模型相比,SVM模型結(jié)構(gòu)簡(jiǎn)單,前者更為復(fù)雜,由預(yù)測(cè)的數(shù)據(jù)來(lái)看SVM-GARCH模型準(zhǔn)確度更高,說(shuō)明對(duì)于滬深300指數(shù)漲跌預(yù)測(cè)方面有更好的表現(xiàn)。因此對(duì)滬深300指數(shù)波動(dòng)性分析,SVM-GARCH模型更加合適。

結(jié)論GARCH模型:本文利用2016年1月13日至2023年

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論