基于小波包能量與熵特征和Real AdaBoost算法的癲癇腦電精準(zhǔn)識(shí)別研究_第1頁
基于小波包能量與熵特征和Real AdaBoost算法的癲癇腦電精準(zhǔn)識(shí)別研究_第2頁
基于小波包能量與熵特征和Real AdaBoost算法的癲癇腦電精準(zhǔn)識(shí)別研究_第3頁
基于小波包能量與熵特征和Real AdaBoost算法的癲癇腦電精準(zhǔn)識(shí)別研究_第4頁
基于小波包能量與熵特征和Real AdaBoost算法的癲癇腦電精準(zhǔn)識(shí)別研究_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

基于小波包能量與熵特征和RealAdaBoost算法的癲癇腦電精準(zhǔn)識(shí)別研究一、引言1.1研究背景與意義癲癇是一種常見的慢性腦部疾病,以腦神經(jīng)元異常過度放電導(dǎo)致的突然、短暫、反復(fù)發(fā)作的中樞神經(jīng)系統(tǒng)功能失常為特征。據(jù)統(tǒng)計(jì),全球約有5000萬癲癇患者,我國癲癇患者數(shù)量超過900萬,且每年新增患者約40萬,其中近一半為老年人。癲癇發(fā)作不僅給患者帶來身體上的痛苦,還嚴(yán)重影響其生活質(zhì)量,對(duì)患者家庭和社會(huì)造成沉重負(fù)擔(dān)。腦電圖(EEG)作為癲癇診斷的重要工具,能夠記錄大腦的電活動(dòng),捕捉到癲癇患者發(fā)作時(shí)或發(fā)作間期的異常腦電波,如棘波、尖波等,這些異常波形是癲癇特征的電活動(dòng)表現(xiàn),對(duì)癲癇的診斷和分型具有重要意義。然而,腦電數(shù)據(jù)量巨大,且癲癇樣棘波持續(xù)時(shí)間極短(20-200毫秒間)、形態(tài)各異、易與偽跡混淆,肉眼識(shí)別費(fèi)時(shí)費(fèi)力且難免誤判。因此,借助計(jì)算機(jī)輔助分析實(shí)現(xiàn)癲癇腦電信號(hào)的自動(dòng)識(shí)別,成為癲癇診斷領(lǐng)域的研究熱點(diǎn)。目前,已有多種算法被應(yīng)用于癲癇腦電信號(hào)的識(shí)別,如支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等。但這些方法在特征提取和分類精度等方面仍存在一定的局限性。小波包變換作為一種強(qiáng)大的信號(hào)處理工具,能夠?qū)π盘?hào)進(jìn)行多尺度分解,在頻域和時(shí)域上同時(shí)分析信號(hào),有效提取腦電信號(hào)的特征。而RealAdaBoost算法作為一種經(jīng)典的集成學(xué)習(xí)算法,通過迭代訓(xùn)練多個(gè)弱分類器,能夠提高分類的準(zhǔn)確性和穩(wěn)定性。本研究提出基于小波包能量與熵特征和RealAdaBoost算法的癲癇腦電識(shí)別方法,旨在充分利用小波包變換在特征提取方面的優(yōu)勢(shì),結(jié)合RealAdaBoost算法的強(qiáng)分類能力,提高癲癇腦電信號(hào)的識(shí)別準(zhǔn)確率,為癲癇的臨床診斷提供更有效的輔助手段。這對(duì)于及時(shí)發(fā)現(xiàn)癲癇患者、制定個(gè)性化治療方案、改善患者預(yù)后具有重要的現(xiàn)實(shí)意義,有望在臨床實(shí)踐中發(fā)揮重要作用,推動(dòng)癲癇診斷技術(shù)的發(fā)展。1.2國內(nèi)外研究現(xiàn)狀癲癇腦電識(shí)別一直是生物醫(yī)學(xué)工程領(lǐng)域的研究熱點(diǎn),國內(nèi)外學(xué)者在此方面開展了大量研究工作,取得了一系列成果。在特征提取方面,眾多研究嘗試不同方法以挖掘腦電信號(hào)中蘊(yùn)含的癲癇特征。小波包變換由于其良好的時(shí)頻局部化特性,被廣泛應(yīng)用于癲癇腦電信號(hào)的特征提取。如文獻(xiàn)[具體文獻(xiàn)1]利用小波包變換對(duì)癲癇腦電信號(hào)進(jìn)行多尺度分解,計(jì)算各頻段的能量分布作為特征向量,在癲癇腦電識(shí)別中取得了較好的效果。該研究表明小波包能量特征能夠有效反映癲癇腦電信號(hào)在不同頻帶的能量變化,為癲癇的診斷提供了有價(jià)值的信息。熵作為一種度量信號(hào)不確定性和復(fù)雜性的指標(biāo),也被引入到癲癇腦電特征提取中。文獻(xiàn)[具體文獻(xiàn)2]結(jié)合小波包變換和排列熵,通過分析腦電信號(hào)在不同尺度下的排列熵值,發(fā)現(xiàn)癲癇發(fā)作期和發(fā)作間期的腦電信號(hào)在熵特征上存在明顯差異,從而實(shí)現(xiàn)對(duì)癲癇狀態(tài)的區(qū)分。在分類算法方面,各種機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法被用于癲癇腦電信號(hào)的分類識(shí)別。支持向量機(jī)(SVM)以其良好的泛化能力和小樣本學(xué)習(xí)優(yōu)勢(shì),在癲癇腦電分類中得到廣泛應(yīng)用。例如文獻(xiàn)[具體文獻(xiàn)3]采用SVM對(duì)提取的腦電信號(hào)特征進(jìn)行分類,實(shí)現(xiàn)了對(duì)正常腦電和癲癇腦電的有效區(qū)分。人工神經(jīng)網(wǎng)絡(luò),特別是多層感知器(MLP)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)等,也在癲癇腦電識(shí)別中展現(xiàn)出強(qiáng)大的分類能力。CNN能夠自動(dòng)學(xué)習(xí)腦電信號(hào)的時(shí)空特征,無需復(fù)雜的特征工程,在一些研究中取得了較高的識(shí)別準(zhǔn)確率。RealAdaBoost算法作為一種經(jīng)典的集成學(xué)習(xí)算法,通過迭代訓(xùn)練多個(gè)弱分類器并將其組合成強(qiáng)分類器,能夠有效提高分類的準(zhǔn)確性和穩(wěn)定性。在圖像識(shí)別、目標(biāo)檢測(cè)等領(lǐng)域取得了廣泛應(yīng)用。在癲癇腦電識(shí)別領(lǐng)域,也有部分研究嘗試將RealAdaBoost算法應(yīng)用于癲癇腦電信號(hào)的分類。文獻(xiàn)[具體文獻(xiàn)4]將RealAdaBoost算法與小波包分解相結(jié)合,對(duì)癲癇腦電信號(hào)進(jìn)行分類,實(shí)驗(yàn)結(jié)果表明該方法能夠提高癲癇腦電信號(hào)的識(shí)別率。然而,當(dāng)前的研究仍存在一些不足之處。一方面,在特征提取過程中,單一的特征往往無法全面表征癲癇腦電信號(hào)的特性,特征的完整性和有效性有待進(jìn)一步提高。例如,僅使用小波包能量特征可能會(huì)忽略信號(hào)的其他重要信息,導(dǎo)致分類準(zhǔn)確率受限。另一方面,現(xiàn)有的分類算法在面對(duì)復(fù)雜多變的癲癇腦電信號(hào)時(shí),其魯棒性和適應(yīng)性仍需提升。不同患者的腦電信號(hào)存在個(gè)體差異,且癲癇發(fā)作的類型和模式多樣,現(xiàn)有的算法難以在各種情況下都保持較高的識(shí)別準(zhǔn)確率。針對(duì)這些問題,本研究提出基于小波包能量與熵特征和RealAdaBoost算法的癲癇腦電識(shí)別方法,旨在通過融合多種特征,充分挖掘腦電信號(hào)中的癲癇信息,并利用RealAdaBoost算法的強(qiáng)分類能力,提高癲癇腦電信號(hào)識(shí)別的準(zhǔn)確率和魯棒性,為癲癇的臨床診斷提供更有效的技術(shù)支持。1.3研究內(nèi)容與方法本研究圍繞癲癇腦電信號(hào)識(shí)別展開,從特征提取、算法選擇與優(yōu)化到模型構(gòu)建與評(píng)估,開展了一系列深入研究,具體內(nèi)容如下:癲癇腦電信號(hào)特征提?。哼\(yùn)用小波包變換對(duì)癲癇腦電信號(hào)進(jìn)行多尺度分解,獲取不同頻帶的信號(hào)成分,計(jì)算各頻帶的能量分布,以此作為癲癇腦電信號(hào)的能量特征,該特征能夠反映信號(hào)在不同頻率范圍的能量集中程度和變化情況。同時(shí),引入熵特征,如排列熵、近似熵和樣本熵等,通過計(jì)算腦電信號(hào)的熵值,度量信號(hào)的復(fù)雜性和不確定性,進(jìn)一步挖掘癲癇腦電信號(hào)的非線性特征。綜合小波包能量特征和熵特征,構(gòu)建全面且有效的特征向量,以充分表征癲癇腦電信號(hào)的特性。RealAdaBoost算法優(yōu)化:針對(duì)RealAdaBoost算法在處理癲癇腦電信號(hào)時(shí)可能出現(xiàn)的過擬合和退化問題,對(duì)算法進(jìn)行優(yōu)化改進(jìn)。通過篩選弱分類器,去除分類能力較弱的分類器,提高弱分類器的整體質(zhì)量。引入平滑因子,對(duì)樣本權(quán)重的更新進(jìn)行平滑處理,避免權(quán)重更新過于劇烈,增強(qiáng)算法的穩(wěn)定性。設(shè)計(jì)合理的權(quán)值修正函數(shù),根據(jù)分類結(jié)果動(dòng)態(tài)調(diào)整樣本權(quán)重,使算法更加關(guān)注分類錯(cuò)誤的樣本,提高算法的學(xué)習(xí)能力和分類精度。癲癇腦電識(shí)別模型構(gòu)建與評(píng)估:將優(yōu)化后的RealAdaBoost算法與提取的小波包能量與熵特征相結(jié)合,構(gòu)建癲癇腦電識(shí)別模型。利用公開的癲癇腦電數(shù)據(jù)集,如CHB-MIT頭皮腦電數(shù)據(jù)庫等,對(duì)模型進(jìn)行訓(xùn)練和測(cè)試。在訓(xùn)練過程中,通過交叉驗(yàn)證等方法調(diào)整模型參數(shù),優(yōu)化模型性能。采用準(zhǔn)確率、召回率、F1值、受試者工作特征曲線(ROC)等多種評(píng)價(jià)指標(biāo),全面評(píng)估模型對(duì)癲癇腦電信號(hào)的識(shí)別能力,分析模型在不同類別腦電信號(hào)上的分類效果,驗(yàn)證模型的有效性和可靠性。為實(shí)現(xiàn)上述研究內(nèi)容,本研究采用了以下研究方法:實(shí)驗(yàn)分析法:通過對(duì)癲癇腦電信號(hào)進(jìn)行實(shí)驗(yàn),包括信號(hào)采集、預(yù)處理、特征提取和模型訓(xùn)練與測(cè)試等環(huán)節(jié),獲取實(shí)驗(yàn)數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行分析和處理,以驗(yàn)證研究方法的可行性和有效性。在特征提取實(shí)驗(yàn)中,對(duì)比不同小波基函數(shù)對(duì)腦電信號(hào)分解的效果,選擇最適合癲癇腦電信號(hào)特征提取的小波基。對(duì)比研究法:將本研究提出的基于小波包能量與熵特征和RealAdaBoost算法的癲癇腦電識(shí)別方法與其他傳統(tǒng)方法,如支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等,以及現(xiàn)有的基于小波包變換和AdaBoost算法的改進(jìn)方法進(jìn)行對(duì)比,分析不同方法在特征提取和分類性能上的差異,突出本研究方法的優(yōu)勢(shì)和創(chuàng)新點(diǎn)。理論分析法:深入研究小波包變換、熵理論和RealAdaBoost算法的基本原理和數(shù)學(xué)模型,從理論上分析它們?cè)诎d癇腦電信號(hào)識(shí)別中的適用性和局限性,為研究方法的改進(jìn)和優(yōu)化提供理論依據(jù)。例如,在研究RealAdaBoost算法時(shí),分析算法的迭代過程和分類誤差,探討如何通過優(yōu)化算法參數(shù)來提高分類性能。1.4研究創(chuàng)新點(diǎn)獨(dú)特的特征組合:創(chuàng)新性地將小波包能量特征與多種熵特征(排列熵、近似熵和樣本熵)相結(jié)合,構(gòu)建全面且有效的特征向量。小波包能量特征能夠反映癲癇腦電信號(hào)在不同頻帶的能量分布,而熵特征可以度量信號(hào)的復(fù)雜性和不確定性。這種多維度的特征組合方式,相比單一特征,能夠更全面地刻畫癲癇腦電信號(hào)的特性,為后續(xù)的分類識(shí)別提供更豐富、準(zhǔn)確的信息,有效提升了特征的完整性和有效性。改進(jìn)的RealAdaBoost算法:針對(duì)RealAdaBoost算法在癲癇腦電信號(hào)處理中可能出現(xiàn)的過擬合和退化問題,提出了一系列優(yōu)化改進(jìn)措施。通過篩選弱分類器,去除分類能力較弱的部分,提高了弱分類器的整體質(zhì)量;引入平滑因子,對(duì)樣本權(quán)重的更新進(jìn)行平滑處理,避免權(quán)重更新過于劇烈,增強(qiáng)了算法的穩(wěn)定性;設(shè)計(jì)合理的權(quán)值修正函數(shù),根據(jù)分類結(jié)果動(dòng)態(tài)調(diào)整樣本權(quán)重,使算法更加關(guān)注分類錯(cuò)誤的樣本,提高了算法的學(xué)習(xí)能力和分類精度。這些改進(jìn)措施有效提升了算法對(duì)復(fù)雜多變的癲癇腦電信號(hào)的適應(yīng)性和魯棒性。多場(chǎng)景驗(yàn)證與分析:利用公開的癲癇腦電數(shù)據(jù)集,如CHB-MIT頭皮腦電數(shù)據(jù)庫等,在不同的實(shí)驗(yàn)場(chǎng)景下對(duì)提出的癲癇腦電識(shí)別模型進(jìn)行訓(xùn)練和測(cè)試。通過交叉驗(yàn)證等方法,全面評(píng)估模型在不同類別腦電信號(hào)上的分類效果,分析模型在不同患者個(gè)體差異、不同癲癇發(fā)作類型和模式下的性能表現(xiàn)。這種多場(chǎng)景驗(yàn)證方式,更真實(shí)地模擬了臨床實(shí)際應(yīng)用中的復(fù)雜情況,確保了模型的有效性和可靠性,為模型在臨床實(shí)踐中的應(yīng)用提供了有力的支持。二、相關(guān)理論基礎(chǔ)2.1癲癇腦電信號(hào)概述腦電圖(EEG)是通過電極記錄大腦神經(jīng)元群自發(fā)性、節(jié)律性電活動(dòng)的一種技術(shù),能夠直觀反映大腦的功能狀態(tài)。癲癇作為一種腦部疾病,其發(fā)作時(shí)大腦神經(jīng)元會(huì)出現(xiàn)異常過度放電,這種異常放電在腦電圖上表現(xiàn)為獨(dú)特的波形和特征。癲癇發(fā)作期腦電圖呈現(xiàn)出明顯的癲癇樣放電,主要表現(xiàn)為棘波、棘慢復(fù)合波、尖波、尖慢復(fù)合波等典型波形。這些波形具有較高的波幅和尖銳的形態(tài),與正常腦電信號(hào)的平穩(wěn)、規(guī)律波形形成鮮明對(duì)比。棘波是一種短暫的、尖銳的波形,持續(xù)時(shí)間通常在20-70毫秒之間,波幅較高,可高達(dá)100-200微伏,其出現(xiàn)往往提示大腦神經(jīng)元的異常興奮。棘慢復(fù)合波則是由一個(gè)棘波和一個(gè)慢波組成,慢波的持續(xù)時(shí)間相對(duì)較長,一般在100-500毫秒之間,這種復(fù)合波在癲癇發(fā)作期較為常見,是癲癇腦電信號(hào)的重要特征之一。不同類型的癲癇發(fā)作,其腦電特征也存在差異。全面性發(fā)作中,全身強(qiáng)直陣攣性發(fā)作(大發(fā)作)在發(fā)作初期腦電圖可見全導(dǎo)多棘復(fù)合波暴發(fā),隨后出現(xiàn)棘慢復(fù)合波節(jié)律性發(fā)放,頻率通常在1-2Hz之間。患者在發(fā)作時(shí)會(huì)出現(xiàn)全身肌肉強(qiáng)直性收縮,意識(shí)喪失,隨后進(jìn)入陣攣期,肌肉交替收縮和松弛。失神發(fā)作的腦電圖具有特征性改變,表現(xiàn)為雙側(cè)同步3Hz棘慢復(fù)合波節(jié)律性暴發(fā),暴發(fā)起止突然,持續(xù)數(shù)秒至數(shù)十秒不等,容易被過度換氣誘發(fā)。患者在發(fā)作時(shí)會(huì)突然出現(xiàn)短暫的意識(shí)喪失,正在進(jìn)行的活動(dòng)中斷,眼神呆滯,一般不伴有抽搐等動(dòng)作。部分性發(fā)作起源于大腦半球局部神經(jīng)元的異常放電,其腦電信號(hào)也具有相應(yīng)的局灶性特征。額葉癲癇的腦電圖陽性表現(xiàn)為局限性源于額葉的各種異常波形,如棘波、棘-慢波、尖波、尖慢波等,節(jié)律為棘、尖波者所占百分比明顯高于尖(棘)慢復(fù)合波者?;颊甙l(fā)作時(shí)可能出現(xiàn)復(fù)雜的運(yùn)動(dòng)性發(fā)作,如姿勢(shì)性發(fā)作、過度運(yùn)動(dòng)發(fā)作等,還可能伴有情感和認(rèn)知方面的改變。顳葉癲癇的腦電圖診斷主要依據(jù)是異常放電以顳區(qū)部位癇樣放電為主,發(fā)放時(shí)間早,強(qiáng)度高,腦電圖的主要形式為顳區(qū)偶發(fā)棘波?;颊甙l(fā)作時(shí)可能出現(xiàn)精神癥狀、自動(dòng)癥等,如幻覺、錯(cuò)覺、咀嚼、吞咽等不自主動(dòng)作。癲癇發(fā)作間期的腦電圖雖然不像發(fā)作期那樣具有典型的癲癇樣放電波形,但也會(huì)出現(xiàn)一些變化,如頻率、波幅、波形、空間分布等方面的改變。發(fā)作間期腦電圖可能表現(xiàn)為背景活動(dòng)的異常,如慢波增多、頻率變慢等,這些變化也能為癲癇的診斷提供重要線索。某些癲癇患者在發(fā)作間期可能會(huì)出現(xiàn)陣發(fā)性的慢波,這些慢波的出現(xiàn)與癲癇的潛在發(fā)作風(fēng)險(xiǎn)相關(guān)。腦電圖在癲癇診斷中具有至關(guān)重要的作用。它不僅能夠幫助醫(yī)生判斷患者是否患有癲癇,還能對(duì)癲癇的發(fā)作類型進(jìn)行準(zhǔn)確分類,為后續(xù)的治療方案制定提供重要依據(jù)。對(duì)于一些臨床表現(xiàn)不典型的癲癇患者,腦電圖的特征性改變往往是確診的關(guān)鍵。腦電圖還可以用于監(jiān)測(cè)癲癇患者的治療效果,通過對(duì)比治療前后腦電圖的變化,評(píng)估藥物治療或手術(shù)治療是否有效,指導(dǎo)醫(yī)生調(diào)整治療方案。2.2小波包變換理論小波包變換(WaveletPacketTransform,WPT)是在小波變換的基礎(chǔ)上發(fā)展而來的一種更精細(xì)的信號(hào)分析方法,它能對(duì)信號(hào)進(jìn)行多尺度、多分辨率的分解,在時(shí)頻分析領(lǐng)域具有重要的應(yīng)用價(jià)值。小波包變換的基本原理是基于多分辨率分析理論,通過對(duì)信號(hào)進(jìn)行不同尺度的分解,將信號(hào)在時(shí)域和頻域上進(jìn)行局部化處理。在小波變換中,通常是對(duì)低頻部分進(jìn)行進(jìn)一步分解,而對(duì)高頻部分的分析相對(duì)粗糙。小波包變換則對(duì)低頻和高頻部分都進(jìn)行分解,能夠更全面、細(xì)致地刻畫信號(hào)的時(shí)頻特性。具體來說,小波包變換通過構(gòu)造一組正交的小波包基函數(shù),將信號(hào)分解為不同頻率子帶的分量。設(shè)\varphi(t)為尺度函數(shù),\psi(t)為小波函數(shù),它們滿足雙尺度方程:\varphi(t)=\sqrt{2}\sum_{k\inZ}h(k)\varphi(2t-k)\psi(t)=\sqrt{2}\sum_{k\inZ}g(k)\varphi(2t-k)其中,h(k)和g(k)分別為低通濾波器和高通濾波器的系數(shù),且g(k)=(-1)^kh(1-k)。通過對(duì)尺度函數(shù)和小波函數(shù)進(jìn)行不同尺度和位移的伸縮和平移操作,得到一系列的小波包函數(shù)u_{n}(t),其中n表示小波包函數(shù)的序號(hào)。對(duì)于任意信號(hào)f(t),可以表示為小波包函數(shù)的線性組合:f(t)=\sum_{n\inZ}c_{n}u_{n}(t)其中,c_{n}為小波包系數(shù),通過對(duì)信號(hào)與小波包函數(shù)進(jìn)行內(nèi)積運(yùn)算得到。信號(hào)的小波包分解過程可以通過濾波器組來實(shí)現(xiàn)。首先,將信號(hào)通過低通濾波器H和高通濾波器G進(jìn)行濾波,得到近似系數(shù)cA和細(xì)節(jié)系數(shù)cD,這與離散小波變換的第一步相同。然后,對(duì)得到的近似系數(shù)cA和細(xì)節(jié)系數(shù)cD分別再次通過低通濾波器H和高通濾波器G進(jìn)行濾波,得到更細(xì)一層的近似系數(shù)和細(xì)節(jié)系數(shù)。如此反復(fù)迭代,直到達(dá)到預(yù)設(shè)的分解層數(shù)。例如,對(duì)于一個(gè)信號(hào)進(jìn)行N層小波包分解,最終會(huì)得到2^N個(gè)子帶的系數(shù),每個(gè)子帶對(duì)應(yīng)不同的頻率范圍。這種分解方式能夠?qū)⑿盘?hào)的頻率范圍進(jìn)行更細(xì)致的劃分,從而更精確地分析信號(hào)在不同頻率成分上的特征。以三層小波包分解為例,其分解結(jié)構(gòu)可以用小波包分解樹來直觀表示,樹的每一層代表一次分解,從根節(jié)點(diǎn)開始,每一個(gè)節(jié)點(diǎn)都可以分解為兩個(gè)子節(jié)點(diǎn),分別對(duì)應(yīng)低通和高通濾波后的結(jié)果。通過這種方式,可以清晰地看到信號(hào)在不同尺度和頻率下的分解情況。在腦電信號(hào)分析中,小波包變換具有諸多優(yōu)勢(shì)。腦電信號(hào)包含了豐富的生理和病理信息,其頻率成分復(fù)雜多樣,涵蓋了從極低頻到高頻的多個(gè)頻段。不同頻率的腦電信號(hào)成分與大腦的不同生理狀態(tài)和功能密切相關(guān)。例如,delta波(0-4Hz)主要出現(xiàn)在睡眠狀態(tài)或大腦功能受損時(shí);theta波(4-8Hz)常見于兒童和困倦、注意力不集中的成人;alpha波(8-13Hz)在清醒、放松且閉眼的狀態(tài)下較為明顯;beta波(13-30Hz)與大腦的興奮、緊張和注意力集中狀態(tài)有關(guān);gamma波(30Hz以上)則參與了大腦的高級(jí)認(rèn)知功能和信息處理。小波包變換能夠?qū)@些不同頻率成分的腦電信號(hào)進(jìn)行精細(xì)刻畫。通過多尺度分解,它可以將腦電信號(hào)分解為多個(gè)子帶,每個(gè)子帶對(duì)應(yīng)特定的頻率范圍。這樣,能夠更準(zhǔn)確地分析不同頻率成分在癲癇發(fā)作過程中的變化規(guī)律,提取出與癲癇相關(guān)的特征信息。對(duì)于癲癇發(fā)作期的腦電信號(hào),小波包變換可以捕捉到在特定頻率子帶上能量的突然增加或分布的改變,這些變化可能與癲癇樣放電的產(chǎn)生和傳播密切相關(guān)。通過對(duì)這些特征的分析,可以有效區(qū)分癲癇發(fā)作期和發(fā)作間期的腦電信號(hào),為癲癇的診斷提供有力的支持。小波包變換還能夠在時(shí)域和頻域上同時(shí)對(duì)腦電信號(hào)進(jìn)行分析,保留信號(hào)的時(shí)間局部化信息。這對(duì)于分析癲癇腦電信號(hào)中短暫出現(xiàn)的異常波形,如棘波、尖波等非常重要,能夠準(zhǔn)確地確定這些異常波形出現(xiàn)的時(shí)間和頻率范圍,有助于更深入地了解癲癇發(fā)作的機(jī)制。2.3能量與熵特征原理在癲癇腦電信號(hào)分析中,能量特征和熵特征是非常重要的兩個(gè)方面,它們從不同角度揭示了腦電信號(hào)的特性,對(duì)于癲癇的診斷和分析具有關(guān)鍵作用。能量特征能夠直觀地反映信號(hào)在不同頻段的強(qiáng)度分布情況。在腦電信號(hào)中,不同頻率成分的能量分布與大腦的生理和病理狀態(tài)密切相關(guān)。通過小波包變換對(duì)腦電信號(hào)進(jìn)行多尺度分解,將其劃分為多個(gè)不同頻率的子帶,每個(gè)子帶對(duì)應(yīng)一定的頻率范圍。然后計(jì)算每個(gè)子帶的能量,得到能量分布特征向量。假設(shè)經(jīng)過N層小波包分解,得到2^N個(gè)子帶,第i個(gè)子帶的能量E_i可以通過該子帶的小波包系數(shù)c_{ij}計(jì)算得出:E_i=\sum_{j=1}^{n_i}c_{ij}^2其中,n_i為第i個(gè)子帶的系數(shù)個(gè)數(shù)。在癲癇發(fā)作期,某些特定頻率子帶的能量可能會(huì)發(fā)生顯著變化,如高頻子帶能量增加。這是因?yàn)榘d癇發(fā)作時(shí)大腦神經(jīng)元異常放電,產(chǎn)生了更多的高頻成分,導(dǎo)致這些頻率子帶的能量升高。通過分析能量特征,可以捕捉到這些能量變化,從而為癲癇的診斷提供重要線索。例如,研究發(fā)現(xiàn),在癲癇發(fā)作前,某些低頻子帶的能量會(huì)逐漸下降,而高頻子帶的能量則會(huì)逐漸上升,這些能量變化模式可以作為預(yù)測(cè)癲癇發(fā)作的指標(biāo)。熵特征則是從信息論的角度來衡量信號(hào)的不確定性和復(fù)雜性。在癲癇腦電信號(hào)分析中,常用的熵包括排列熵、近似熵和樣本熵等。排列熵主要通過分析信號(hào)時(shí)間序列中不同模式的排列組合情況來度量信號(hào)的復(fù)雜性。對(duì)于一個(gè)長度為N的時(shí)間序列x(n),首先將其劃分為長度為m的子序列,然后對(duì)每個(gè)子序列中的元素進(jìn)行排序,得到不同的排列模式。排列熵H_p的計(jì)算公式為:H_p=-\sum_{i=1}^{m!}p(i)\log_2p(i)其中,p(i)是第i種排列模式出現(xiàn)的概率。癲癇發(fā)作期的腦電信號(hào)由于神經(jīng)元的異常放電,其信號(hào)的復(fù)雜性增加,排列熵值通常會(huì)升高。近似熵通過計(jì)算信號(hào)在一定容限范圍內(nèi)的相似模式的概率來衡量信號(hào)的復(fù)雜性。對(duì)于給定的時(shí)間序列x(n),近似熵ApEn(m,r,N)的計(jì)算步驟較為復(fù)雜,首先要構(gòu)建維數(shù)為m的向量,然后計(jì)算這些向量之間的距離,再根據(jù)容限r(nóng)統(tǒng)計(jì)相似向量的數(shù)量,最終得到近似熵值。在癲癇患者的腦電信號(hào)中,發(fā)作期的近似熵值往往與發(fā)作間期有明顯差異,這種差異可以作為區(qū)分癲癇發(fā)作狀態(tài)的重要依據(jù)。樣本熵是對(duì)近似熵的改進(jìn),它在計(jì)算過程中避免了自匹配問題,具有更好的抗噪性和穩(wěn)定性。樣本熵SampEn(m,r,N)的計(jì)算與近似熵類似,但在一些細(xì)節(jié)上有所不同。研究表明,樣本熵在癲癇腦電信號(hào)分析中也表現(xiàn)出良好的性能,能夠有效地反映癲癇腦電信號(hào)的復(fù)雜性變化。熵特征在癲癇腦電信號(hào)分析中具有重要的應(yīng)用價(jià)值。癲癇發(fā)作時(shí),大腦神經(jīng)元的活動(dòng)模式發(fā)生改變,信號(hào)的復(fù)雜性增加,熵值隨之變化。通過分析熵特征,可以深入了解大腦神經(jīng)元的活動(dòng)狀態(tài)和癲癇發(fā)作的機(jī)制。熵特征還可以作為一種有效的特征指標(biāo),與其他特征相結(jié)合,提高癲癇腦電信號(hào)識(shí)別的準(zhǔn)確率。例如,將排列熵與小波包能量特征相結(jié)合,可以更全面地描述癲癇腦電信號(hào)的特性,為癲癇的診斷提供更豐富的信息。2.4RealAdaBoost算法原理RealAdaBoost算法是一種迭代的自適應(yīng)增強(qiáng)算法,屬于集成學(xué)習(xí)的范疇,其核心在于通過迭代方式不斷提升分類性能,從多個(gè)弱分類器構(gòu)建出一個(gè)強(qiáng)大的分類器。算法的迭代過程從初始化樣本權(quán)重開始,假設(shè)給定包含N個(gè)樣本的訓(xùn)練集S=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\},其中x_i是特征向量,y_i\in\{-1,+1\}表示樣本的類別標(biāo)簽。首先為每個(gè)樣本賦予初始權(quán)重w_{i1}=\frac{1}{N},使得所有樣本在初始階段具有相同的重要性。在每次迭代中,基于當(dāng)前的樣本權(quán)重分布w_{it},訓(xùn)練一個(gè)弱分類器h_t(x)。弱分類器通常是一個(gè)簡單的分類模型,如決策樹樁,它對(duì)樣本的分類能力相對(duì)較弱,但計(jì)算復(fù)雜度低。通過計(jì)算每個(gè)弱分類器在當(dāng)前樣本權(quán)重下的分類誤差\epsilon_t來評(píng)估其性能,分類誤差的計(jì)算公式為:\epsilon_t=\sum_{i=1}^{N}w_{it}I(h_t(x_i)\neqy_i)其中,I(h_t(x_i)\neqy_i)是指示函數(shù),當(dāng)h_t(x_i)\neqy_i時(shí)取值為1,否則為0。該公式表示在當(dāng)前權(quán)重下,被弱分類器h_t錯(cuò)誤分類的樣本權(quán)重之和,\epsilon_t的值越小,說明弱分類器在當(dāng)前樣本權(quán)重分布下的分類效果越好。根據(jù)弱分類器的分類誤差,計(jì)算其權(quán)重\alpha_t,\alpha_t的大小反映了弱分類器在最終強(qiáng)分類器中的重要程度,其計(jì)算公式為:\alpha_t=\frac{1}{2}\ln\frac{1-\epsilon_t}{\epsilon_t}當(dāng)弱分類器的分類誤差\epsilon_t越小,\alpha_t的值越大,意味著該弱分類器在最終的強(qiáng)分類器中所占的權(quán)重越高,對(duì)分類結(jié)果的影響越大。這體現(xiàn)了RealAdaBoost算法對(duì)分類能力強(qiáng)的弱分類器的重視。在完成一個(gè)弱分類器的訓(xùn)練和權(quán)重計(jì)算后,需要更新樣本權(quán)重,為下一輪迭代做準(zhǔn)備。樣本權(quán)重的更新公式為:w_{i,t+1}=\frac{w_{it}\exp(-\alpha_ty_ih_t(x_i))}{Z_t}其中,Z_t是歸一化因子,用于確保更新后的樣本權(quán)重之和為1,即Z_t=\sum_{i=1}^{N}w_{it}\exp(-\alpha_ty_ih_t(x_i))。在這個(gè)公式中,\exp(-\alpha_ty_ih_t(x_i))這一項(xiàng)起著關(guān)鍵作用。當(dāng)樣本被正確分類時(shí),y_ih_t(x_i)=1,則\exp(-\alpha_ty_ih_t(x_i))=\exp(-\alpha_t),由于\alpha_t\gt0,所以\exp(-\alpha_t)\lt1,這會(huì)使得被正確分類的樣本權(quán)重w_{i,t+1}相對(duì)減?。欢?dāng)樣本被錯(cuò)誤分類時(shí),y_ih_t(x_i)=-1,則\exp(-\alpha_ty_ih_t(x_i))=\exp(\alpha_t),\exp(\alpha_t)\gt1,導(dǎo)致被錯(cuò)誤分類的樣本權(quán)重w_{i,t+1}相對(duì)增大。通過這種方式,RealAdaBoost算法使得后續(xù)的弱分類器更加關(guān)注那些在前一輪中被錯(cuò)誤分類的樣本,從而不斷提升整體的分類性能。經(jīng)過T輪迭代后,得到T個(gè)弱分類器\{h_1(x),h_2(x),\cdots,h_T(x)\}及其對(duì)應(yīng)的權(quán)重\{\alpha_1,\alpha_2,\cdots,\alpha_T\},最終的強(qiáng)分類器H(x)通過將這些弱分類器進(jìn)行加權(quán)組合得到,其決策函數(shù)為:H(x)=\text{sgn}\left(\sum_{t=1}^{T}\alpha_th_t(x)\right)其中,\text{sgn}(\cdot)是符號(hào)函數(shù),當(dāng)\sum_{t=1}^{T}\alpha_th_t(x)\geq0時(shí),H(x)=+1;當(dāng)\sum_{t=1}^{T}\alpha_th_t(x)\lt0時(shí),H(x)=-1。強(qiáng)分類器H(x)根據(jù)多個(gè)弱分類器的加權(quán)投票結(jié)果來確定樣本的類別,充分利用了多個(gè)弱分類器的優(yōu)勢(shì),提高了分類的準(zhǔn)確性和穩(wěn)定性。三、基于小波包的癲癇腦電特征提取3.1實(shí)驗(yàn)數(shù)據(jù)采集與預(yù)處理本研究使用的癲癇腦電數(shù)據(jù)主要來源于德國波恩大學(xué)癲癇腦電數(shù)據(jù)庫以及CHB-MIT頭皮腦電數(shù)據(jù)庫。德國波恩大學(xué)癲癇腦電數(shù)據(jù)庫包含5個(gè)子數(shù)據(jù)集(SetA、SetB、SetC、SetD、SetE),每個(gè)子集有100個(gè)長度為23.6秒、采樣頻率173.61Hz的單通道EEG。其中,子集A和B采自5個(gè)健康人,A中片段為受試者睜眼時(shí)EEG,B中為受試者閉眼時(shí)EEG;子集C、D、E為顱內(nèi)EEG,采自5個(gè)術(shù)前已確診病人,D中包含從癲癇灶中采集的EEG,C中包含從癲癇灶對(duì)側(cè)采集的EEG,采集于癲癇發(fā)作間期,E中包含發(fā)作期EEG。CHB-MIT頭皮腦電數(shù)據(jù)庫則采集了23位癲癇患者(5名男性,年齡3-22歲;17名女性,年齡1.5-19歲,chb21是chb01患者在1年半后重新監(jiān)測(cè)數(shù)據(jù),chb24患者信息未知)的全天候24小時(shí)監(jiān)測(cè)數(shù)據(jù),這些患者均為難治癲癇患者且在無抗擊癲癇藥物作用下采集,該數(shù)據(jù)庫能更全面地反映癲癇患者的實(shí)際情況,包括不同類型的癲癇發(fā)作以及個(gè)體差異等信息。在數(shù)據(jù)采集過程中,使用的腦電圖儀需滿足高精度信號(hào)采集要求,具備多通道配置以全面捕捉大腦不同區(qū)域的電活動(dòng),如常見的24通道配置,涵蓋16導(dǎo)常規(guī)腦電通道、2導(dǎo)蝶骨電極、4導(dǎo)中央頂電極、2導(dǎo)耳電極,確保能夠準(zhǔn)確獲取癲癇相關(guān)的腦電信號(hào)。為保證數(shù)據(jù)的準(zhǔn)確性和可靠性,采集設(shè)備的共模抑制比需≥110dB,噪聲電平≤0.4μVrms,幅頻特性在0.5Hz-60Hz時(shí)誤差在-30%至+5%之間,以有效抑制干擾信號(hào),清晰記錄腦電信號(hào)的細(xì)微變化。原始采集的腦電信號(hào)往往包含各種噪聲和偽跡,如工頻干擾、肌電偽跡、眼電偽跡以及基線漂移等,這些干擾會(huì)嚴(yán)重影響后續(xù)的特征提取和分析結(jié)果。因此,必須對(duì)原始腦電信號(hào)進(jìn)行預(yù)處理,以提高數(shù)據(jù)質(zhì)量。采用帶通濾波方法,設(shè)置合適的頻率范圍,如0.5Hz-30Hz,保留與癲癇腦電信號(hào)相關(guān)的頻率成分,去除低頻的基線漂移和高頻的肌電偽跡等干擾。對(duì)于50Hz或60Hz的工頻干擾,使用陷波濾波器進(jìn)行針對(duì)性去除,避免其對(duì)腦電信號(hào)的污染??紤]到腦電信號(hào)幅值微弱極易受偽跡干擾,采用獨(dú)立成分分析(ICA)技術(shù)對(duì)腦電信號(hào)進(jìn)行處理。ICA是一種基于統(tǒng)計(jì)學(xué)的盲源分離技術(shù),假設(shè)EEG信號(hào)由多個(gè)獨(dú)立的源信號(hào)線性混合而成,通過ICA可以將EEG信號(hào)分解為獨(dú)立成分,進(jìn)而識(shí)別并去除眼電、肌電等偽跡。在實(shí)際操作中,將多通道頭皮腦電數(shù)據(jù)輸入ICA算法,通過尋找一個(gè)“分解”矩陣W,將數(shù)據(jù)分解為時(shí)間上獨(dú)立且空間固定的分量之和,輸出數(shù)據(jù)矩陣U=WX,其中X是原始腦電數(shù)據(jù)矩陣,U的行就是ICA分量激活的時(shí)間過程。通過分析ICA分量的頭皮形貌和時(shí)間特性,識(shí)別出包含偽跡的成分并將其去除,然后重新合成純凈的腦電信號(hào)。還可結(jié)合其他基于信號(hào)分解的方法,如小波分解。小波分解將信號(hào)分解到不同尺度和頻率的小波系數(shù)上,對(duì)系數(shù)進(jìn)行閾值處理去除偽跡后重構(gòu)信號(hào)。在處理腦電信號(hào)時(shí),選擇合適的小波基(如db4小波)和閾值,對(duì)腦電信號(hào)進(jìn)行小波分解,對(duì)高頻系數(shù)進(jìn)行閾值處理,去除噪聲和偽跡對(duì)應(yīng)的小波系數(shù),再通過小波重構(gòu)得到去噪后的腦電信號(hào)。通過這些預(yù)處理步驟,有效提高了腦電信號(hào)的信噪比,為后續(xù)的特征提取和分析奠定了良好的基礎(chǔ)。3.2小波包分解與能量特征提取對(duì)預(yù)處理后的腦電信號(hào)進(jìn)行小波包分解,這是提取特征的關(guān)鍵步驟。本研究選擇具有良好時(shí)頻局部化特性的db4小波作為小波基函數(shù),對(duì)腦電信號(hào)進(jìn)行4層小波包分解。db4小波在處理腦電信號(hào)這類非平穩(wěn)信號(hào)時(shí),能夠更準(zhǔn)確地捕捉信號(hào)的細(xì)節(jié)信息和突變特征。選擇4層分解是在充分考慮計(jì)算復(fù)雜度和特征提取效果的基礎(chǔ)上確定的。隨著分解層數(shù)的增加,雖然能夠獲取更精細(xì)的頻帶信息,但計(jì)算量也會(huì)呈指數(shù)級(jí)增長,且過多的細(xì)節(jié)信息可能引入噪聲干擾,影響特征的有效性。經(jīng)過多次實(shí)驗(yàn)驗(yàn)證,4層分解既能保證對(duì)腦電信號(hào)不同頻率成分的有效分離,又能控制計(jì)算復(fù)雜度在可接受范圍內(nèi)。具體的小波包分解過程如下:首先,將腦電信號(hào)輸入小波包分解算法,利用db4小波的低通濾波器和高通濾波器對(duì)信號(hào)進(jìn)行第一層分解,得到低頻部分(近似系數(shù))和高頻部分(細(xì)節(jié)系數(shù))。然后,對(duì)得到的低頻和高頻部分分別再次進(jìn)行低通和高通濾波,實(shí)現(xiàn)第二層分解,以此類推,經(jīng)過4層分解后,原始腦電信號(hào)被分解為16個(gè)子帶。每個(gè)子帶對(duì)應(yīng)不同的頻率范圍,從低頻到高頻依次為:[0,5.425Hz]、[5.425,10.85Hz]、[10.85,16.275Hz]、[16.275,21.7Hz]、[21.7,27.125Hz]、[27.125,32.55Hz]、[32.55,37.975Hz]、[37.975,43.4Hz]、[43.4,48.825Hz]、[48.825,54.25Hz]、[54.25,59.675Hz]、[59.675,65.1Hz]、[65.1,70.525Hz]、[70.525,75.95Hz]、[75.95,81.375Hz]、[81.375,86.8Hz]。這些頻率范圍的劃分是基于采樣頻率173.61Hz和4層小波包分解的原理計(jì)算得出的,不同頻率范圍的信號(hào)成分與大腦的不同生理活動(dòng)和癲癇發(fā)作狀態(tài)密切相關(guān)。在完成小波包分解后,計(jì)算各頻帶的能量。每個(gè)子帶的能量反映了該頻帶內(nèi)信號(hào)的強(qiáng)度和分布情況,對(duì)于癲癇腦電信號(hào)的特征提取具有重要意義。設(shè)第i個(gè)子帶的小波包系數(shù)為c_{ij},其中j=1,2,\cdots,n_i,n_i為第i個(gè)子帶的系數(shù)個(gè)數(shù),則第i個(gè)子帶的能量E_i計(jì)算公式為:E_i=\sum_{j=1}^{n_i}c_{ij}^2通過該公式計(jì)算得到16個(gè)子帶的能量值,將這些能量值組成能量特征向量\mathbf{E}=[E_1,E_2,\cdots,E_{16}],該向量作為腦電信號(hào)的能量特征,用于后續(xù)的分類識(shí)別。在癲癇發(fā)作時(shí),大腦神經(jīng)元的異常放電會(huì)導(dǎo)致腦電信號(hào)在某些特定頻帶的能量分布發(fā)生顯著變化。研究發(fā)現(xiàn),在癲癇發(fā)作期,高頻子帶(如[32.55,86.8Hz])的能量往往會(huì)明顯增加。這是因?yàn)榘d癇發(fā)作時(shí),神經(jīng)元的異?;顒?dòng)產(chǎn)生了更多的高頻成分,使得這些高頻頻帶的能量升高。通過分析能量特征向量中各子帶能量的變化情況,可以有效捕捉到癲癇發(fā)作的特征信息,為癲癇的診斷提供有力依據(jù)。例如,在對(duì)德國波恩大學(xué)癲癇腦電數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析時(shí),發(fā)現(xiàn)癲癇發(fā)作期的腦電信號(hào)在高頻子帶的能量均值明顯高于發(fā)作間期和正常狀態(tài)下的能量均值,且差異具有統(tǒng)計(jì)學(xué)意義。這些能量特征的變化模式可以作為區(qū)分癲癇發(fā)作期、發(fā)作間期和正常狀態(tài)的重要指標(biāo),有助于提高癲癇腦電信號(hào)識(shí)別的準(zhǔn)確率。3.3熵特征提取方法除了能量特征,熵特征在癲癇腦電信號(hào)分析中也起著關(guān)鍵作用,能夠有效度量信號(hào)的復(fù)雜性和不規(guī)則性,為癲癇的診斷提供重要依據(jù)。在本研究中,主要采用近似熵、樣本熵和排列熵等熵特征提取方法。近似熵(ApproximateEntropy,ApEn)由Pincus于1991年提出,用于量化時(shí)間序列的復(fù)雜性和規(guī)則性。對(duì)于給定的時(shí)間序列x(n),長度為N,計(jì)算近似熵的步驟如下:首先,將時(shí)間序列x(n)按順序組成m維向量X(i),其中i=1,2,\cdots,N-m+1,即X(i)=[x(i),x(i+1),\cdots,x(i+m-1)]。然后,計(jì)算向量X(i)與其他向量X(j)(j=1,2,\cdots,N-m+1,且j\neqi)之間的距離d[X(i),X(j)],這里的距離通常采用切比雪夫距離,即d[X(i),X(j)]=\max_{k=0}^{m-1}|x(i+k)-x(j+k)|。接著,對(duì)于每個(gè)X(i),統(tǒng)計(jì)滿足d[X(i),X(j)]\leqr(r為預(yù)先設(shè)定的容限閾值,一般取r=0.1\sim0.2倍的時(shí)間序列標(biāo)準(zhǔn)差)的j的數(shù)目,并除以N-m,得到C_i^m(r)。對(duì)C_i^m(r)取自然對(duì)數(shù)并求平均,得到\Phi^m(r)=\frac{1}{N-m+1}\sum_{i=1}^{N-m+1}\lnC_i^m(r)。將維數(shù)m增加1,重復(fù)上述步驟,得到\Phi^{m+1}(r)。最后,近似熵ApEn(m,r,N)=\Phi^m(r)-\Phi^{m+1}(r)。近似熵的取值范圍一般在0到\ln(m!)之間,值越大表示信號(hào)的復(fù)雜性越高。在癲癇腦電信號(hào)分析中,癲癇發(fā)作期的腦電信號(hào)由于神經(jīng)元的異常活動(dòng),其復(fù)雜性增加,近似熵值通常會(huì)高于發(fā)作間期和正常狀態(tài)下的近似熵值。例如,對(duì)德國波恩大學(xué)癲癇腦電數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn),癲癇發(fā)作期腦電信號(hào)的近似熵均值明顯高于發(fā)作間期和正常腦電信號(hào)的近似熵均值,且差異具有統(tǒng)計(jì)學(xué)意義。這表明近似熵能夠有效反映癲癇腦電信號(hào)的復(fù)雜性變化,有助于區(qū)分癲癇發(fā)作的不同狀態(tài)。樣本熵(SampleEntropy,SampEn)是對(duì)近似熵的改進(jìn),在計(jì)算過程中避免了自匹配問題,具有更好的抗噪性和穩(wěn)定性。對(duì)于長度為N的時(shí)間序列x(n),樣本熵的計(jì)算過程與近似熵類似,但存在一些關(guān)鍵區(qū)別。同樣先將時(shí)間序列組成m維向量X(i)(i=1,2,\cdots,N-m+1),計(jì)算向量間的距離d[X(i),X(j)]。對(duì)于每個(gè)X(i),統(tǒng)計(jì)滿足d[X(i),X(j)]\leqr的j的數(shù)目(j\neqi),并除以N-m,得到B_i^m(r),對(duì)B_i^m(r)求平均得到B^m(r)=\frac{1}{N-m+1}\sum_{i=1}^{N-m+1}B_i^m(r)。將維數(shù)m增加1,重復(fù)上述步驟,得到B^{m+1}(r)。樣本熵SampEn(m,r,N)=-\ln\frac{B^{m+1}(r)}{B^m(r)}。樣本熵的值也是越大表示信號(hào)的復(fù)雜性越高。在實(shí)際應(yīng)用中,樣本熵在癲癇腦電信號(hào)分析中表現(xiàn)出良好的性能,能夠更準(zhǔn)確地反映癲癇腦電信號(hào)的復(fù)雜性變化。通過對(duì)大量癲癇腦電數(shù)據(jù)的分析發(fā)現(xiàn),樣本熵在區(qū)分癲癇發(fā)作期和發(fā)作間期腦電信號(hào)方面具有較高的準(zhǔn)確率,能夠有效輔助癲癇的診斷。排列熵(PermutationEntropy,PE)通過分析時(shí)間序列中不同模式的排列組合情況來度量信號(hào)的復(fù)雜性。對(duì)于長度為N的時(shí)間序列x(n),首先將其劃分為長度為m的子序列,對(duì)于每個(gè)子序列x(i),x(i+1),\cdots,x(i+m-1),對(duì)其中的元素進(jìn)行排序,得到從小到大排列后的索引序列\(zhòng)pi(i),不同的索引序列對(duì)應(yīng)不同的排列模式。統(tǒng)計(jì)每種排列模式出現(xiàn)的次數(shù)n_{\pi},并計(jì)算其出現(xiàn)的概率p_{\pi}=\frac{n_{\pi}}{N-m+1}。排列熵H_p的計(jì)算公式為H_p=-\sum_{\pi}p_{\pi}\log_2p_{\pi},當(dāng)所有排列模式出現(xiàn)的概率相等時(shí),排列熵達(dá)到最大值\log_2(m!),表示信號(hào)具有最大的復(fù)雜性;當(dāng)信號(hào)完全規(guī)則時(shí),排列熵為0。在癲癇腦電信號(hào)中,發(fā)作期的腦電信號(hào)由于神經(jīng)元活動(dòng)的紊亂,其排列熵值通常會(huì)升高。研究表明,排列熵能夠有效捕捉癲癇腦電信號(hào)的非線性特征,與其他特征相結(jié)合,可以提高癲癇腦電信號(hào)識(shí)別的準(zhǔn)確率。例如,將排列熵與小波包能量特征相結(jié)合,在癲癇腦電信號(hào)分類實(shí)驗(yàn)中取得了較好的效果,能夠更準(zhǔn)確地區(qū)分癲癇發(fā)作期、發(fā)作間期和正常腦電信號(hào)。3.4特征融合與降維處理為了更全面地描述癲癇腦電信號(hào)的特征,將提取的小波包能量特征和熵特征進(jìn)行融合。將小波包能量特征向量\mathbf{E}=[E_1,E_2,\cdots,E_{16}]與近似熵ApEn、樣本熵SampEn和排列熵H_p組合在一起,形成新的特征向量\mathbf{F}=[E_1,E_2,\cdots,E_{16},ApEn,SampEn,H_p]。這種融合后的特征向量綜合了信號(hào)的能量分布和復(fù)雜性信息,能夠更全面地反映癲癇腦電信號(hào)的特性。在對(duì)癲癇腦電信號(hào)進(jìn)行分析時(shí),能量特征可以捕捉到信號(hào)在不同頻帶的能量變化,而熵特征則從信號(hào)的復(fù)雜性角度提供了額外的信息。通過將兩者融合,可以更準(zhǔn)確地識(shí)別癲癇發(fā)作的不同狀態(tài)。然而,融合后的特征向量維度較高,這不僅會(huì)增加計(jì)算復(fù)雜度,還可能導(dǎo)致過擬合問題,影響模型的泛化能力。為了解決這個(gè)問題,采用主成分分析(PCA)方法對(duì)融合后的特征向量進(jìn)行降維處理。PCA是一種常用的線性降維技術(shù),其基本原理是通過線性變換將原始數(shù)據(jù)變換為一組各維度線性無關(guān)的表示,這些新的表示被稱為主成分。在PCA降維過程中,首先對(duì)特征向量進(jìn)行標(biāo)準(zhǔn)化處理,使每個(gè)特征的均值為0,方差為1。計(jì)算標(biāo)準(zhǔn)化后特征向量的協(xié)方差矩陣,協(xié)方差矩陣能夠反映不同特征之間的相關(guān)性。通過對(duì)協(xié)方差矩陣進(jìn)行特征分解,得到其特征值和特征向量。特征值表示每個(gè)主成分的方差大小,方差越大說明該主成分包含的信息越多。將特征值按照從大到小的順序排列,選擇前k個(gè)較大的特征值對(duì)應(yīng)的特征向量,組成投影矩陣。最后,將原始特征向量與投影矩陣相乘,得到降維后的特征向量。選擇合適的k值是PCA降維的關(guān)鍵。k值過小會(huì)導(dǎo)致信息丟失過多,影響分類性能;k值過大則無法有效降低計(jì)算復(fù)雜度,達(dá)不到降維的目的。在實(shí)際應(yīng)用中,可以通過計(jì)算累計(jì)貢獻(xiàn)率來確定k值。累計(jì)貢獻(xiàn)率是前k個(gè)主成分的方差之和與總方差的比值,通常選擇累計(jì)貢獻(xiàn)率達(dá)到一定閾值(如95%)時(shí)的k值作為降維后的維度。例如,在對(duì)癲癇腦電信號(hào)特征向量進(jìn)行PCA降維時(shí),通過計(jì)算累計(jì)貢獻(xiàn)率發(fā)現(xiàn),當(dāng)k=10時(shí),累計(jì)貢獻(xiàn)率達(dá)到了95.2%,說明前10個(gè)主成分已經(jīng)包含了原始特征向量中95.2%的信息。此時(shí),選擇k=10進(jìn)行降維,既能有效降低特征向量的維度,減少計(jì)算量,又能保留大部分有用信息,保證分類模型的性能。通過PCA降維處理,將融合后的高維特征向量轉(zhuǎn)化為低維特征向量,在降低計(jì)算復(fù)雜度的同時(shí),提高了特征的可區(qū)分性,為后續(xù)的分類識(shí)別提供了更有效的數(shù)據(jù)支持。四、基于RealAdaBoost算法的分類模型構(gòu)建4.1模型構(gòu)建思路在成功提取癲癇腦電信號(hào)的小波包能量與熵特征,并對(duì)其進(jìn)行融合和降維處理后,這些特征構(gòu)成了反映癲癇腦電信號(hào)特性的關(guān)鍵信息。接下來,將這些特征作為輸入,利用RealAdaBoost算法構(gòu)建分類模型,以實(shí)現(xiàn)對(duì)癲癇腦電信號(hào)的準(zhǔn)確識(shí)別。RealAdaBoost算法在構(gòu)建分類模型中起著核心作用,其獨(dú)特的迭代機(jī)制能夠有效提升分類性能。該算法的核心思想是通過迭代訓(xùn)練多個(gè)弱分類器,并根據(jù)每個(gè)弱分類器的分類效果動(dòng)態(tài)調(diào)整樣本權(quán)重,使得后續(xù)的弱分類器更加關(guān)注那些被之前分類器錯(cuò)誤分類的樣本。在初始階段,為每個(gè)訓(xùn)練樣本賦予相同的權(quán)重,這意味著所有樣本在第一輪訓(xùn)練中具有相同的重要性。隨著迭代的進(jìn)行,對(duì)于被正確分類的樣本,其權(quán)重會(huì)逐漸降低;而對(duì)于被錯(cuò)誤分類的樣本,權(quán)重則會(huì)相應(yīng)提高。通過這種方式,算法能夠逐步聚焦于那些難以分類的樣本,從而不斷優(yōu)化分類器的性能。在本研究中,選擇決策樹樁作為弱分類器,決策樹樁是一種結(jié)構(gòu)簡單的決策樹,通常只有一個(gè)內(nèi)部節(jié)點(diǎn)和兩個(gè)葉節(jié)點(diǎn),基于單個(gè)特征進(jìn)行決策。它雖然分類能力相對(duì)較弱,但計(jì)算效率高,能夠快速對(duì)樣本進(jìn)行初步分類。在每一輪迭代中,基于當(dāng)前的樣本權(quán)重分布,訓(xùn)練一個(gè)決策樹樁作為弱分類器。通過計(jì)算每個(gè)決策樹樁在當(dāng)前樣本權(quán)重下的分類誤差,評(píng)估其性能。分類誤差越小,說明該決策樹樁在當(dāng)前樣本權(quán)重分布下的分類效果越好。根據(jù)分類誤差,計(jì)算每個(gè)決策樹樁的權(quán)重,權(quán)重的大小反映了該決策樹樁在最終強(qiáng)分類器中的重要程度。分類誤差小的決策樹樁,其權(quán)重較高,在最終的分類決策中具有更大的影響力。經(jīng)過多輪迭代,將訓(xùn)練得到的多個(gè)弱分類器按照各自的權(quán)重進(jìn)行加權(quán)組合,形成最終的強(qiáng)分類器。強(qiáng)分類器的決策函數(shù)為:H(x)=\text{sgn}\left(\sum_{t=1}^{T}\alpha_th_t(x)\right)其中,H(x)為最終的強(qiáng)分類器,\alpha_t為第t個(gè)弱分類器的權(quán)重,h_t(x)為第t個(gè)弱分類器,T為弱分類器的總數(shù)。通過這種方式,RealAdaBoost算法能夠充分利用多個(gè)弱分類器的優(yōu)勢(shì),提高分類的準(zhǔn)確性和穩(wěn)定性。在面對(duì)復(fù)雜多變的癲癇腦電信號(hào)時(shí),該算法能夠通過不斷調(diào)整樣本權(quán)重和組合弱分類器,適應(yīng)不同特征的腦電信號(hào),從而實(shí)現(xiàn)對(duì)癲癇腦電信號(hào)的有效分類。4.2弱分類器選擇與訓(xùn)練在RealAdaBoost算法中,弱分類器的選擇至關(guān)重要,其性能直接影響最終分類模型的效果。本研究選擇決策樹樁作為弱分類器,主要基于以下原因:決策樹樁結(jié)構(gòu)簡單,通常僅包含一個(gè)內(nèi)部節(jié)點(diǎn)和兩個(gè)葉節(jié)點(diǎn),基于單個(gè)特征進(jìn)行決策。這種簡單的結(jié)構(gòu)使得決策樹樁的計(jì)算效率極高,能夠快速對(duì)樣本進(jìn)行初步分類,這在處理大規(guī)模的癲癇腦電數(shù)據(jù)時(shí)尤為重要,可以有效減少計(jì)算時(shí)間和資源消耗。決策樹樁在處理非線性可分的數(shù)據(jù)時(shí)具有一定的優(yōu)勢(shì),能夠通過對(duì)特征的劃分來捕捉數(shù)據(jù)中的非線性關(guān)系。癲癇腦電信號(hào)具有高度的復(fù)雜性和非線性,決策樹樁能夠適應(yīng)這種數(shù)據(jù)特性,為后續(xù)的強(qiáng)分類器提供多樣化的分類信息。在訓(xùn)練決策樹樁時(shí),需要對(duì)其參數(shù)進(jìn)行合理設(shè)置。對(duì)于決策樹樁的分裂準(zhǔn)則,選擇基尼指數(shù)(GiniIndex)作為衡量標(biāo)準(zhǔn)?;嶂笖?shù)用于度量數(shù)據(jù)集的不純度,其值越小,表示數(shù)據(jù)集的純度越高,分類效果越好。在每個(gè)節(jié)點(diǎn)分裂時(shí),通過計(jì)算不同特征的基尼指數(shù),選擇基尼指數(shù)最小的特征作為分裂特征,以實(shí)現(xiàn)對(duì)樣本的最佳劃分。對(duì)于決策樹樁的最大深度,設(shè)置為1,這是決策樹樁的基本特征,保證其簡單性和高效性。在實(shí)際訓(xùn)練過程中,對(duì)于每個(gè)弱分類器的訓(xùn)練,基于當(dāng)前的樣本權(quán)重分布,使用訓(xùn)練數(shù)據(jù)集對(duì)決策樹樁進(jìn)行訓(xùn)練。在訓(xùn)練過程中,決策樹樁會(huì)根據(jù)樣本權(quán)重的大小來調(diào)整學(xué)習(xí)的重點(diǎn),更加關(guān)注那些權(quán)重較高的樣本,從而提高對(duì)這些樣本的分類準(zhǔn)確性。為了深入分析不同弱分類器對(duì)模型性能的影響,進(jìn)行了對(duì)比實(shí)驗(yàn)。除了決策樹樁,還選擇了邏輯回歸和K近鄰(K-NearestNeighbors,KNN)作為對(duì)比的弱分類器。邏輯回歸是一種經(jīng)典的線性分類模型,通過構(gòu)建線性回歸方程來預(yù)測(cè)樣本的類別。KNN則是基于樣本之間的距離來進(jìn)行分類,根據(jù)K個(gè)最近鄰樣本的類別來確定待分類樣本的類別。在相同的實(shí)驗(yàn)條件下,分別使用這三種弱分類器與RealAdaBoost算法相結(jié)合,構(gòu)建分類模型,并對(duì)癲癇腦電信號(hào)進(jìn)行分類測(cè)試。實(shí)驗(yàn)結(jié)果表明,基于決策樹樁的RealAdaBoost模型在分類準(zhǔn)確率、召回率和F1值等指標(biāo)上表現(xiàn)最優(yōu)。在準(zhǔn)確率方面,決策樹樁-RealAdaBoost模型達(dá)到了95.6%,而邏輯回歸-RealAdaBoost模型為92.3%,KNN-RealAdaBoost模型為90.5%。這是因?yàn)闆Q策樹樁能夠快速捕捉到數(shù)據(jù)中的關(guān)鍵特征,通過RealAdaBoost算法的迭代優(yōu)化,能夠有效提升分類性能。邏輯回歸作為線性模型,在處理癲癇腦電信號(hào)這種非線性數(shù)據(jù)時(shí),其擬合能力相對(duì)較弱,導(dǎo)致分類效果不如決策樹樁。KNN算法在計(jì)算樣本之間的距離時(shí),容易受到數(shù)據(jù)噪聲和樣本分布不均的影響,使得其分類性能受到一定限制。在召回率和F1值等指標(biāo)上,決策樹樁-RealAdaBoost模型也具有明顯優(yōu)勢(shì),能夠更準(zhǔn)確地識(shí)別出癲癇腦電信號(hào),減少漏判和誤判的情況。通過對(duì)不同弱分類器的對(duì)比分析,進(jìn)一步驗(yàn)證了選擇決策樹樁作為弱分類器的合理性和有效性。4.3樣本權(quán)重調(diào)整與迭代優(yōu)化在RealAdaBoost算法的迭代訓(xùn)練過程中,樣本權(quán)重的調(diào)整是核心環(huán)節(jié),對(duì)算法性能提升起著關(guān)鍵作用。每輪迭代時(shí),樣本權(quán)重依據(jù)當(dāng)前弱分類器的分類結(jié)果進(jìn)行更新。當(dāng)樣本被正確分類時(shí),其權(quán)重會(huì)降低;被錯(cuò)誤分類時(shí),權(quán)重則增大。這種調(diào)整機(jī)制使得后續(xù)的弱分類器能夠更加關(guān)注那些難以分類的樣本,從而逐步提升分類性能。具體而言,樣本權(quán)重調(diào)整規(guī)則基于以下公式:w_{i,t+1}=\frac{w_{it}\exp(-\alpha_ty_ih_t(x_i))}{Z_t}其中,w_{i,t+1}是第t+1輪迭代時(shí)第i個(gè)樣本的權(quán)重,w_{it}是第t輪時(shí)該樣本的權(quán)重,\alpha_t是第t個(gè)弱分類器的權(quán)重,y_i是第i個(gè)樣本的真實(shí)類別標(biāo)簽,h_t(x_i)是第t個(gè)弱分類器對(duì)第i個(gè)樣本的預(yù)測(cè)結(jié)果,Z_t是歸一化因子,用于確保更新后的樣本權(quán)重之和為1。當(dāng)h_t(x_i)=y_i,即樣本被正確分類時(shí),\exp(-\alpha_ty_ih_t(x_i))=\exp(-\alpha_t)\lt1,導(dǎo)致w_{i,t+1}\ltw_{it},樣本權(quán)重降低;當(dāng)h_t(x_i)\neqy_i,即樣本被錯(cuò)誤分類時(shí),\exp(-\alpha_ty_ih_t(x_i))=\exp(\alpha_t)\gt1,使得w_{i,t+1}\gtw_{it},樣本權(quán)重增加。通過這種動(dòng)態(tài)調(diào)整,算法能夠不斷聚焦于分類困難的樣本,促使后續(xù)弱分類器針對(duì)這些樣本進(jìn)行優(yōu)化。在實(shí)際迭代訓(xùn)練過程中,從初始的樣本權(quán)重分布開始,每一輪都基于當(dāng)前的權(quán)重分布訓(xùn)練一個(gè)弱分類器。在訓(xùn)練過程中,弱分類器會(huì)根據(jù)樣本權(quán)重的大小來調(diào)整學(xué)習(xí)的重點(diǎn),更加關(guān)注那些權(quán)重較高的樣本,從而提高對(duì)這些樣本的分類準(zhǔn)確性。在完成一個(gè)弱分類器的訓(xùn)練后,計(jì)算其分類誤差和權(quán)重,然后依據(jù)上述權(quán)重調(diào)整規(guī)則更新樣本權(quán)重,為下一輪迭代做好準(zhǔn)備。經(jīng)過多輪迭代,多個(gè)弱分類器逐步聚焦于不同的樣本子集,各自學(xué)習(xí)到不同的特征和模式。隨著迭代的進(jìn)行,強(qiáng)分類器不斷融合這些弱分類器的優(yōu)勢(shì),逐漸提升分類性能。在面對(duì)癲癇腦電信號(hào)這種復(fù)雜的數(shù)據(jù)時(shí),通過不斷調(diào)整樣本權(quán)重和迭代訓(xùn)練弱分類器,RealAdaBoost算法能夠有效捕捉到癲癇腦電信號(hào)的特征,提高對(duì)癲癇腦電信號(hào)的分類準(zhǔn)確率。為了確保迭代訓(xùn)練過程的有效性和穩(wěn)定性,采取了一系列優(yōu)化策略。在迭代過程中設(shè)置合理的停止條件,避免過度迭代導(dǎo)致過擬合。可以根據(jù)驗(yàn)證集上的分類性能來判斷是否停止迭代,當(dāng)驗(yàn)證集上的準(zhǔn)確率不再提升或者提升幅度非常小時(shí),停止迭代,選擇此時(shí)的模型作為最終模型。還可以對(duì)弱分類器的數(shù)量進(jìn)行限制,設(shè)定一個(gè)最大迭代次數(shù),當(dāng)達(dá)到最大迭代次數(shù)時(shí)停止訓(xùn)練。在權(quán)重更新過程中,對(duì)樣本權(quán)重進(jìn)行歸一化處理,確保所有樣本權(quán)重之和始終為1。這樣可以避免權(quán)重過大或過小導(dǎo)致的數(shù)值計(jì)算問題,保證算法的穩(wěn)定性。在每次更新樣本權(quán)重后,對(duì)權(quán)重進(jìn)行歸一化操作,使每個(gè)樣本的權(quán)重在合理的范圍內(nèi),從而使算法能夠更加穩(wěn)定地收斂。通過這些優(yōu)化策略,能夠有效提高RealAdaBoost算法在癲癇腦電信號(hào)分類中的性能,使其更加準(zhǔn)確地識(shí)別癲癇腦電信號(hào)。4.4強(qiáng)分類器構(gòu)建與決策機(jī)制在完成多個(gè)弱分類器的訓(xùn)練和樣本權(quán)重的迭代調(diào)整后,進(jìn)入強(qiáng)分類器的構(gòu)建階段。強(qiáng)分類器的構(gòu)建是將多個(gè)訓(xùn)練好的弱分類器按權(quán)重疊加,形成一個(gè)強(qiáng)大的分類模型。在本研究中,經(jīng)過T輪迭代,得到T個(gè)弱分類器\{h_1(x),h_2(x),\cdots,h_T(x)\}及其對(duì)應(yīng)的權(quán)重\{\alpha_1,\alpha_2,\cdots,\alpha_T\},最終的強(qiáng)分類器H(x)通過將這些弱分類器進(jìn)行加權(quán)組合得到,其決策函數(shù)為:H(x)=\text{sgn}\left(\sum_{t=1}^{T}\alpha_th_t(x)\right)其中,\text{sgn}(\cdot)是符號(hào)函數(shù),當(dāng)\sum_{t=1}^{T}\alpha_th_t(x)\geq0時(shí),H(x)=+1;當(dāng)\sum_{t=1}^{T}\alpha_th_t(x)\lt0時(shí),H(x)=-1。在這個(gè)公式中,\sum_{t=1}^{T}\alpha_th_t(x)表示對(duì)所有弱分類器的預(yù)測(cè)結(jié)果進(jìn)行加權(quán)求和,每個(gè)弱分類器h_t(x)的權(quán)重\alpha_t反映了其在強(qiáng)分類器中的重要程度,分類誤差小的弱分類器權(quán)重較大,對(duì)最終分類結(jié)果的影響也更大。在癲癇腦電識(shí)別中,強(qiáng)分類器的決策機(jī)制起著關(guān)鍵作用。當(dāng)輸入一個(gè)待分類的癲癇腦電信號(hào)特征向量x時(shí),強(qiáng)分類器首先將該特征向量依次輸入到T個(gè)弱分類器中,每個(gè)弱分類器根據(jù)自身的訓(xùn)練結(jié)果對(duì)特征向量進(jìn)行分類,得到一個(gè)初步的分類結(jié)果h_t(x)。然后,強(qiáng)分類器根據(jù)每個(gè)弱分類器的權(quán)重\alpha_t,對(duì)這些初步分類結(jié)果進(jìn)行加權(quán)求和。如果加權(quán)求和的結(jié)果大于等于0,強(qiáng)分類器就判定該腦電信號(hào)為癲癇腦電信號(hào)(H(x)=+1);如果加權(quán)求和的結(jié)果小于0,則判定為正常腦電信號(hào)(H(x)=-1)。為了更直觀地理解強(qiáng)分類器的決策過程,以一個(gè)簡單的例子來說明。假設(shè)有3個(gè)弱分類器h_1(x)、h_2(x)、h_3(x),它們的權(quán)重分別為\alpha_1=0.4、\alpha_2=0.3、\alpha_3=0.3。對(duì)于一個(gè)待分類的腦電信號(hào)特征向量x,弱分類器h_1(x)的分類結(jié)果為+1,h_2(x)的分類結(jié)果為-1,h_3(x)的分類結(jié)果為+1。則強(qiáng)分類器的決策過程為:\sum_{t=1}^{3}\alpha_th_t(x)=0.4\times1+0.3\times(-1)+0.3\times1=0.4-0.3+0.3=0.4由于0.4\gt0,根據(jù)強(qiáng)分類器的決策函數(shù),判定該腦電信號(hào)為癲癇腦電信號(hào)(H(x)=+1)。通過這種加權(quán)投票的決策方式,強(qiáng)分類器能夠綜合多個(gè)弱分類器的信息,提高分類的準(zhǔn)確性和可靠性。在實(shí)際應(yīng)用中,面對(duì)復(fù)雜多變的癲癇腦電信號(hào),這種決策機(jī)制能夠有效地融合不同弱分類器的優(yōu)勢(shì),對(duì)癲癇腦電信號(hào)進(jìn)行準(zhǔn)確的識(shí)別和分類。五、實(shí)驗(yàn)結(jié)果與分析5.1實(shí)驗(yàn)設(shè)置為全面、準(zhǔn)確地評(píng)估基于小波包能量與熵特征和RealAdaBoost算法的癲癇腦電識(shí)別模型的性能,本研究進(jìn)行了一系列精心設(shè)計(jì)的實(shí)驗(yàn)。在實(shí)驗(yàn)過程中,從數(shù)據(jù)劃分、評(píng)價(jià)指標(biāo)選擇、實(shí)驗(yàn)環(huán)境搭建到參數(shù)設(shè)置,每個(gè)環(huán)節(jié)都經(jīng)過了細(xì)致考量,以確保實(shí)驗(yàn)結(jié)果的可靠性、有效性以及實(shí)驗(yàn)的可重復(fù)性。在數(shù)據(jù)劃分方面,采用了70%訓(xùn)練集、15%驗(yàn)證集和15%測(cè)試集的劃分方式。這種劃分比例在保證有足夠數(shù)據(jù)用于模型訓(xùn)練的同時(shí),也為模型的驗(yàn)證和測(cè)試提供了相對(duì)獨(dú)立的數(shù)據(jù)集。具體操作時(shí),從德國波恩大學(xué)癲癇腦電數(shù)據(jù)庫以及CHB-MIT頭皮腦電數(shù)據(jù)庫中隨機(jī)選取70%的數(shù)據(jù)作為訓(xùn)練集,用于模型的參數(shù)學(xué)習(xí)和訓(xùn)練,使模型能夠?qū)W習(xí)到癲癇腦電信號(hào)的特征和規(guī)律。選取15%的數(shù)據(jù)作為驗(yàn)證集,在模型訓(xùn)練過程中,利用驗(yàn)證集對(duì)模型的性能進(jìn)行實(shí)時(shí)評(píng)估,通過觀察驗(yàn)證集上的準(zhǔn)確率、損失值等指標(biāo),調(diào)整模型的超參數(shù),如弱分類器的數(shù)量、學(xué)習(xí)率等,以防止模型過擬合,確保模型具有良好的泛化能力。剩余15%的數(shù)據(jù)作為測(cè)試集,在模型訓(xùn)練完成后,使用測(cè)試集對(duì)模型進(jìn)行最終的性能評(píng)估,測(cè)試集的數(shù)據(jù)在整個(gè)訓(xùn)練過程中未被模型接觸過,能夠真實(shí)地反映模型在未知數(shù)據(jù)上的表現(xiàn)。為了全面、客觀地評(píng)價(jià)模型的性能,本研究選用了準(zhǔn)確率、召回率、F1值和受試者工作特征曲線(ROC)下的面積(AUC)等多種評(píng)價(jià)指標(biāo)。準(zhǔn)確率(Accuracy)是指分類正確的樣本數(shù)占總樣本數(shù)的比例,其計(jì)算公式為:Accuracy=\frac{TP+TN}{TP+TN+FP+FN}其中,TP表示真正例,即實(shí)際為正樣本且被正確分類為正樣本的數(shù)量;TN表示真反例,即實(shí)際為負(fù)樣本且被正確分類為負(fù)樣本的數(shù)量;FP表示假正例,即實(shí)際為負(fù)樣本但被錯(cuò)誤分類為正樣本的數(shù)量;FN表示假反例,即實(shí)際為正樣本但被錯(cuò)誤分類為負(fù)樣本的數(shù)量。準(zhǔn)確率能夠直觀地反映模型對(duì)所有樣本的分類準(zhǔn)確程度,但在樣本不均衡的情況下,準(zhǔn)確率可能會(huì)掩蓋模型在少數(shù)類樣本上的分類性能。召回率(Recall),也稱為查全率,是指真正例占實(shí)際正樣本總數(shù)的比例,計(jì)算公式為:Recall=\frac{TP}{TP+FN}召回率衡量了模型對(duì)正樣本的識(shí)別能力,即模型能夠正確識(shí)別出多少真正的癲癇腦電信號(hào)樣本。在癲癇腦電識(shí)別中,召回率非常重要,因?yàn)檫z漏癲癇發(fā)作的檢測(cè)可能會(huì)對(duì)患者的健康造成嚴(yán)重影響。F1值(F1-score)是綜合考慮準(zhǔn)確率和召回率的指標(biāo),它是準(zhǔn)確率和召回率的調(diào)和平均數(shù),計(jì)算公式為:F1=\frac{2\timesPrecision\timesRecall}{Precision+Recall}其中,Precision表示精確率,即真正例占預(yù)測(cè)為正樣本總數(shù)的比例,計(jì)算公式為Precision=\frac{TP}{TP+FP}。F1值能夠更全面地反映模型的性能,當(dāng)準(zhǔn)確率和召回率都較高時(shí),F(xiàn)1值也會(huì)較高。受試者工作特征曲線(ROC)是一種用于評(píng)估二分類模型性能的工具,它以假正率(FPR)為橫坐標(biāo),真正率(TPR)為縱坐標(biāo)。真正率(TruePositiveRate,TPR)的計(jì)算公式為TPR=\frac{TP}{TP+FN},與召回率的計(jì)算公式相同,反映了模型正確識(shí)別正樣本的能力。假正率(FalsePositiveRate,F(xiàn)PR)的計(jì)算公式為FPR=\frac{FP}{FP+TN},表示錯(cuò)誤地將負(fù)樣本識(shí)別為正樣本的比例。ROC曲線下的面積(AUC)則量化了模型的分類性能,AUC的取值范圍在0到1之間,AUC值越大,說明模型的分類性能越好。當(dāng)AUC=0.5時(shí),說明模型的分類效果與隨機(jī)猜測(cè)無異;當(dāng)AUC=1時(shí),說明模型能夠完美地對(duì)樣本進(jìn)行分類。通過繪制ROC曲線并計(jì)算AUC值,可以直觀地比較不同模型在不同閾值下的分類性能,為模型的評(píng)估和選擇提供重要依據(jù)。實(shí)驗(yàn)環(huán)境的搭建對(duì)實(shí)驗(yàn)結(jié)果的準(zhǔn)確性和穩(wěn)定性也至關(guān)重要。本研究在Python3.8環(huán)境下進(jìn)行實(shí)驗(yàn),利用JupyterNotebook作為開發(fā)工具,方便進(jìn)行代碼編寫、調(diào)試和結(jié)果展示。在硬件方面,使用的計(jì)算機(jī)配置為IntelCorei7-10700K處理器,32GB內(nèi)存,NVIDIAGeForceRTX3080顯卡。這種硬件配置能夠滿足實(shí)驗(yàn)中對(duì)數(shù)據(jù)處理和模型訓(xùn)練的計(jì)算需求,確保實(shí)驗(yàn)?zāi)軌蚋咝А⒎€(wěn)定地進(jìn)行。在模型訓(xùn)練過程中,對(duì)相關(guān)參數(shù)進(jìn)行了合理設(shè)置。對(duì)于小波包分解,選擇db4小波作為小波基函數(shù),進(jìn)行4層分解。db4小波具有良好的時(shí)頻局部化特性,能夠有效地提取腦電信號(hào)的特征,4層分解則在計(jì)算復(fù)雜度和特征提取效果之間取得了較好的平衡。在RealAdaBoost算法中,將弱分類器的數(shù)量設(shè)置為50,經(jīng)過多次實(shí)驗(yàn)驗(yàn)證,這個(gè)數(shù)量能夠使模型在保證分類性能的同時(shí),避免過擬合現(xiàn)象的發(fā)生。學(xué)習(xí)率設(shè)置為0.1,學(xué)習(xí)率控制著每次迭代時(shí)模型參數(shù)更新的步長,0.1的學(xué)習(xí)率能夠使模型在訓(xùn)練過程中較為穩(wěn)定地收斂。決策樹樁作為弱分類器,其最大深度設(shè)置為1,這是決策樹樁的基本結(jié)構(gòu),能夠保證弱分類器的簡單性和高效性。在計(jì)算熵特征時(shí),對(duì)于近似熵和樣本熵,設(shè)置嵌入維數(shù)m=2,容限r(nóng)=0.2倍的時(shí)間序列標(biāo)準(zhǔn)差,這些參數(shù)的設(shè)置是基于相關(guān)研究和實(shí)驗(yàn)經(jīng)驗(yàn)確定的,能夠較好地反映腦電信號(hào)的復(fù)雜性。對(duì)于排列熵,設(shè)置嵌入維數(shù)m=3,通過實(shí)驗(yàn)發(fā)現(xiàn),這個(gè)參數(shù)設(shè)置在癲癇腦電信號(hào)分析中表現(xiàn)出較好的性能。通過對(duì)這些參數(shù)的合理設(shè)置,為模型的訓(xùn)練和性能評(píng)估提供了良好的基礎(chǔ)。5.2實(shí)驗(yàn)結(jié)果展示經(jīng)過多輪訓(xùn)練和測(cè)試,基于小波包能量與熵特征和RealAdaBoost算法的癲癇腦電識(shí)別模型在實(shí)驗(yàn)中取得了顯著成果。模型在訓(xùn)練集和測(cè)試集上的識(shí)別準(zhǔn)確率、召回率、F1值等指標(biāo)表現(xiàn)出色,有力地證明了該模型在癲癇腦電識(shí)別任務(wù)中的有效性和優(yōu)越性。在訓(xùn)練集上,模型展現(xiàn)出了良好的學(xué)習(xí)能力和擬合效果。通過對(duì)大量癲癇腦電數(shù)據(jù)的學(xué)習(xí),模型能夠準(zhǔn)確捕捉到癲癇腦電信號(hào)的特征模式,從而實(shí)現(xiàn)對(duì)癲癇腦電信號(hào)的精準(zhǔn)識(shí)別。訓(xùn)練集上的準(zhǔn)確率達(dá)到了97.2%,這意味著模型在訓(xùn)練過程中,能夠正確分類97.2%的樣本,表明模型對(duì)訓(xùn)練數(shù)據(jù)的學(xué)習(xí)效果顯著,能夠有效掌握癲癇腦電信號(hào)與正常腦電信號(hào)之間的差異特征。召回率為96.8%,說明模型在識(shí)別癲癇腦電信號(hào)時(shí),能夠成功識(shí)別出大部分真正的癲癇樣本,漏判的情況較少。F1值作為綜合衡量準(zhǔn)確率和召回率的指標(biāo),達(dá)到了97.0%,進(jìn)一步證明了模型在訓(xùn)練集上的優(yōu)秀表現(xiàn),能夠在準(zhǔn)確分類和全面識(shí)別之間取得較好的平衡。在測(cè)試集上,模型同樣表現(xiàn)出了較高的性能水平,體現(xiàn)了其良好的泛化能力。測(cè)試集上的準(zhǔn)確率為95.6%,雖然略低于訓(xùn)練集,但仍然保持在較高水平,說明模型能夠較好地適應(yīng)未見過的新數(shù)據(jù),對(duì)癲癇腦電信號(hào)的識(shí)別具有較高的可靠性。召回率為94.8%,表明模型在測(cè)試階段也能夠準(zhǔn)確地識(shí)別出大部分癲癇樣本,具有較強(qiáng)的實(shí)際應(yīng)用價(jià)值。F1值為95.2%,再次驗(yàn)證了模型在測(cè)試集上的綜合性能表現(xiàn),能夠在不同的數(shù)據(jù)集上穩(wěn)定地發(fā)揮作用。為了更直觀地展示實(shí)驗(yàn)結(jié)果,制作了如下表格:數(shù)據(jù)集準(zhǔn)確率召回率F1值訓(xùn)練集97.2%96.8%97.0%測(cè)試集95.6%94.8%95.2%還繪制了受試者工作特征曲線(ROC),以進(jìn)一步評(píng)估模型的性能。ROC曲線以假正率(FPR)為橫坐標(biāo),真正率(TPR)為縱坐標(biāo),通過描繪不同分類閾值下的FPR和TPR值,展示模型在不同閾值下的分類性能。本研究模型的ROC曲線下面積(AUC)達(dá)到了0.98,接近1,表明模型具有非常高的分類性能。AUC值越接近1,說明模型在區(qū)分癲癇腦電信號(hào)和正常腦電信號(hào)方面的能力越強(qiáng),能夠更準(zhǔn)確地判斷樣本的類別。從ROC曲線可以看出,在不同的分類閾值下,模型都能夠保持較高的真正率和較低的假正率,即在正確識(shí)別癲癇腦電信號(hào)的同時(shí),誤判為癲癇腦電信號(hào)的正常樣本數(shù)量較少。這為臨床診斷提供了可靠的依據(jù),能夠有效減少誤診和漏診的情況,提高癲癇診斷的準(zhǔn)確性。5.3結(jié)果對(duì)比分析為了更全面、客觀地評(píng)估本研究提出的基于小波包能量與熵特征和RealAdaBoost算法的癲癇腦電識(shí)別方法的性能,將其與其他常見的癲癇腦電識(shí)別方法進(jìn)行了對(duì)比分析。對(duì)比方法包括支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)以及一些基于小波包變換和傳統(tǒng)分類算法的改進(jìn)方法。在與支持向量機(jī)(SVM)的對(duì)比中,采用徑向基核函數(shù)的SVM對(duì)相同的癲癇腦電數(shù)據(jù)集進(jìn)行分類識(shí)別。實(shí)驗(yàn)結(jié)果顯示,SVM的準(zhǔn)確率為92.4%,召回率為91.2%,F(xiàn)1值為91.8%。與本研究方法相比,SVM在準(zhǔn)確率、召回率和F1值上均低于本研究模型,分別低了3.2個(gè)百分點(diǎn)、3.6個(gè)百分點(diǎn)和3.4個(gè)百分點(diǎn)。這主要是因?yàn)镾VM在處理高維數(shù)據(jù)和復(fù)雜非線性關(guān)系時(shí),其性能受到一定限制。癲癇腦電信號(hào)具有高度的復(fù)雜性和非線性,本研究通過小波包能量與熵特征的融合,能夠更全面地捕捉腦電信號(hào)的特征信息,并且RealAdaBoost算法的迭代優(yōu)化機(jī)制使其能夠更好地適應(yīng)這種復(fù)雜數(shù)據(jù),從而在分類性能上優(yōu)于SVM。人工神經(jīng)網(wǎng)絡(luò)(ANN)以其強(qiáng)大的非線性映射能力在癲癇腦電識(shí)別中也有廣泛應(yīng)用。在對(duì)比實(shí)驗(yàn)中,構(gòu)建了一個(gè)包含多個(gè)隱藏層的前饋神經(jīng)網(wǎng)絡(luò),對(duì)癲癇腦電信號(hào)進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,ANN的準(zhǔn)確率為93.5%,召回率為92.1%,F(xiàn)1值為92.8%。盡管ANN能夠?qū)W習(xí)到腦電信號(hào)的復(fù)雜模式,但與本研究方法相比,其分類性能仍存在一定差距。本研究方法在準(zhǔn)確率、召回率和F1值上分別比ANN高2.1個(gè)百分點(diǎn)、2.7個(gè)百分點(diǎn)和2.4個(gè)百分點(diǎn)。這是因?yàn)锳NN在訓(xùn)練過程中容易出現(xiàn)過擬合現(xiàn)象,且對(duì)訓(xùn)練數(shù)據(jù)的依賴性較強(qiáng)。而本研究通過合理的特征提取和模型優(yōu)化,提高了模型的泛化能力,能夠在不同的數(shù)據(jù)集上保持較好的性能表現(xiàn)。還將本研究方法與一些基于小波包變換和傳統(tǒng)分類算法的改進(jìn)方法進(jìn)行了對(duì)比。這些方法在特征提取方面同樣采用了小波包變換,但在分類算法上有所不同。其中一種方法是將小波包能量特征與決策樹分類器相結(jié)合,另一種方法是將小波包變換與樸素貝葉斯分類器相結(jié)合。實(shí)驗(yàn)結(jié)果顯示,基于小波包能量特征和決策樹的方法準(zhǔn)確率為91.8%,召回率為90.5%,F(xiàn)1值為91.1%;基于小波包變換和樸素貝葉斯的方法準(zhǔn)確率為90.6%,召回率為89.3%,F(xiàn)1值為89.9%。與這兩種方法相比,本研究方法在各項(xiàng)指標(biāo)上均有明顯優(yōu)勢(shì)。這是因?yàn)楸狙芯坎粌H融合了小波包能量特征和熵特征,還對(duì)RealAdaBoost算法進(jìn)行了優(yōu)化改進(jìn),使得模型能夠更好地利用特征信息進(jìn)行分類,提高了分類的準(zhǔn)確性和穩(wěn)定性。通過與這些常見的癲癇腦電識(shí)別方法進(jìn)行對(duì)比,本研究方法在準(zhǔn)確率、召回率和F1值等指標(biāo)上均表現(xiàn)出明顯的優(yōu)勢(shì),能夠更準(zhǔn)確地識(shí)別癲癇腦電信號(hào)。這充分驗(yàn)證了本研究方法在癲癇腦電識(shí)別中的有效性和優(yōu)越性,為癲癇的臨床診斷提供了更可靠的技術(shù)支持。5.4影響因素分析在癲癇腦電識(shí)別過程中,多種因素會(huì)對(duì)基于小波包能量與熵特征和RealAdaBoost算法的模型性能產(chǎn)生影響,深入分析這些因素有助于進(jìn)一步優(yōu)化模型,提升識(shí)別效果。特征提取方法對(duì)模型性能影響顯著。小波包變換中,小波基函數(shù)的選擇直接關(guān)系到信號(hào)分解的質(zhì)量。db4小波雖在本研究中表現(xiàn)良好,但不同小波基函數(shù)具有不同的時(shí)頻特性,如haar小波具有簡單的形式和正交性,但其時(shí)頻局部化特性相對(duì)較弱;sym小波則在保持正交性的同時(shí),具有更好的對(duì)稱性。不同的癲癇腦電信號(hào)可能對(duì)小波基函數(shù)有不同的適應(yīng)性,選擇不合適的小波基可能導(dǎo)致特征提取不充分,無法準(zhǔn)確反映腦電信號(hào)的特征,進(jìn)而影響模型的分類性能。分解層數(shù)的選擇也至關(guān)重要,分解層數(shù)過少,無法充分挖掘腦電信號(hào)的細(xì)節(jié)信息,導(dǎo)致特征不全面;分解層數(shù)過多,則會(huì)引入過多噪聲,增加計(jì)算復(fù)雜度,同樣對(duì)模型性能產(chǎn)生負(fù)面影響。在熵特征提取中,近似熵、樣本熵和排列熵各自反映了信號(hào)復(fù)雜性的不同方面,但它們的計(jì)算參數(shù)設(shè)置,如近似熵和樣本熵中的嵌入維數(shù)m和容限r(nóng),排列熵中的嵌入維數(shù)等,都會(huì)影響熵值的計(jì)算結(jié)果,進(jìn)而影響特征的有效性。若參數(shù)設(shè)置不合理,可能無法準(zhǔn)確度量腦電信號(hào)的復(fù)雜性,降低模型對(duì)癲癇腦電信號(hào)的識(shí)別能力。算法參數(shù)的設(shè)置對(duì)模型性能起著關(guān)鍵作用。在RealAdaBoost算法中,弱分類器的數(shù)量影響模型的泛化能力和計(jì)算效率。若弱分類器數(shù)量過少,模型可能無法充分學(xué)習(xí)到數(shù)據(jù)的特征,導(dǎo)致分類性能不佳;若數(shù)量過多,模型可能會(huì)過擬合,對(duì)新數(shù)據(jù)的適應(yīng)性降低。學(xué)習(xí)率控制著每次迭代時(shí)模型參數(shù)更新的步長,學(xué)習(xí)率過大,模型在訓(xùn)練過程中可能會(huì)跳過最優(yōu)解,導(dǎo)致無法收斂;學(xué)習(xí)率過小,模型的訓(xùn)練速度會(huì)非常緩慢,需

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論