基于BEMD的多視角步態(tài)識(shí)別算法:理論、實(shí)踐與創(chuàng)新_第1頁(yè)
基于BEMD的多視角步態(tài)識(shí)別算法:理論、實(shí)踐與創(chuàng)新_第2頁(yè)
基于BEMD的多視角步態(tài)識(shí)別算法:理論、實(shí)踐與創(chuàng)新_第3頁(yè)
基于BEMD的多視角步態(tài)識(shí)別算法:理論、實(shí)踐與創(chuàng)新_第4頁(yè)
基于BEMD的多視角步態(tài)識(shí)別算法:理論、實(shí)踐與創(chuàng)新_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于BEMD的多視角步態(tài)識(shí)別算法:理論、實(shí)踐與創(chuàng)新一、引言1.1研究背景與意義隨著全球老齡化進(jìn)程的加速,人口老齡化問(wèn)題日益凸顯。根據(jù)世界衛(wèi)生組織(WHO)的報(bào)告,到2050年,全球60歲及以上人口預(yù)計(jì)將達(dá)到21億,占總?cè)丝诘?2%。中國(guó)作為世界上人口老齡化速度最快的國(guó)家之一,截至2022年末,60歲及以上人口已突破2.67億人,占總?cè)丝诘?8.9%;65歲及以上人口達(dá)到2.01億人,占總?cè)丝诘?4.2%。人口老齡化帶來(lái)了一系列社會(huì)和醫(yī)療問(wèn)題,如老年人的健康管理、跌倒風(fēng)險(xiǎn)評(píng)估等,對(duì)社會(huì)和家庭造成了沉重的負(fù)擔(dān)。在這樣的背景下,步態(tài)識(shí)別技術(shù)作為一種新興的生物識(shí)別技術(shù),具有非接觸、遠(yuǎn)距離、不易偽造等優(yōu)點(diǎn),在老年人健康監(jiān)測(cè)、安防監(jiān)控等領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力。步態(tài)識(shí)別通過(guò)分析人體步行的動(dòng)作特征,實(shí)現(xiàn)個(gè)體身份識(shí)別、疾病篩查、健康監(jiān)測(cè)等功能,為解決老齡化社會(huì)中的相關(guān)問(wèn)題提供了新的思路和方法。傳統(tǒng)的步態(tài)識(shí)別算法在單一視角下存在識(shí)別準(zhǔn)確率低、受環(huán)境干擾影響大等問(wèn)題。在實(shí)際應(yīng)用中,如安防監(jiān)控場(chǎng)景,行人可能會(huì)以不同的角度出現(xiàn)在攝像頭視野中,單一視角的步態(tài)識(shí)別算法難以準(zhǔn)確識(shí)別不同角度下的行人。多視角步態(tài)識(shí)別算法通過(guò)融合多個(gè)視角的信息,能夠更全面地描述人體步態(tài)特征,提高識(shí)別準(zhǔn)確率和魯棒性。二維經(jīng)驗(yàn)?zāi)B(tài)分解(BEMD)作為一種新型的信號(hào)處理方法,能夠自適應(yīng)地對(duì)圖像信號(hào)進(jìn)行分解,提取出不同尺度的特征信息。將BEMD應(yīng)用于多視角步態(tài)識(shí)別算法中,可以有效地提取步態(tài)圖像中的局部和全局特征,提高步態(tài)特征的表達(dá)能力,從而進(jìn)一步提升多視角步態(tài)識(shí)別的性能?;贐EMD的多視角步態(tài)識(shí)別算法研究具有重要的現(xiàn)實(shí)意義。在老年人健康監(jiān)測(cè)方面,該算法可以實(shí)時(shí)監(jiān)測(cè)老年人的步態(tài)變化,及時(shí)發(fā)現(xiàn)潛在的健康問(wèn)題,如跌倒風(fēng)險(xiǎn)、帕金森病等,為老年人的健康管理提供科學(xué)依據(jù)。在安防監(jiān)控領(lǐng)域,該算法能夠準(zhǔn)確識(shí)別不同視角下的行人身份,提高監(jiān)控系統(tǒng)的智能化水平,增強(qiáng)公共安全保障能力。此外,本研究還將推動(dòng)步態(tài)識(shí)別技術(shù)的發(fā)展,促進(jìn)其在更多領(lǐng)域的應(yīng)用和普及,為解決老齡化社會(huì)中的相關(guān)問(wèn)題提供有力的技術(shù)支持。1.2國(guó)內(nèi)外研究現(xiàn)狀步態(tài)識(shí)別技術(shù)作為生物識(shí)別領(lǐng)域的研究熱點(diǎn),近年來(lái)在國(guó)內(nèi)外取得了顯著的進(jìn)展。國(guó)內(nèi)外學(xué)者圍繞步態(tài)特征提取、識(shí)別算法以及多視角信息融合等方面展開(kāi)了廣泛而深入的研究。在國(guó)外,早期的步態(tài)識(shí)別研究主要集中在基于簡(jiǎn)單特征提取和傳統(tǒng)模式識(shí)別算法的方法上。隨著計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)技術(shù)的飛速發(fā)展,基于深度學(xué)習(xí)的步態(tài)識(shí)別算法逐漸成為主流。一些研究機(jī)構(gòu)和學(xué)者致力于開(kāi)發(fā)更加高效的步態(tài)特征提取方法,如利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)自動(dòng)提取步態(tài)圖像的深度特征,有效提高了識(shí)別準(zhǔn)確率。在多視角步態(tài)識(shí)別方面,國(guó)外學(xué)者提出了多種信息融合策略,包括基于決策層融合、特征層融合和數(shù)據(jù)層融合的方法,以充分利用不同視角下的步態(tài)信息,提升識(shí)別性能。在國(guó)內(nèi),步態(tài)識(shí)別技術(shù)的研究起步相對(duì)較晚,但發(fā)展迅速。眾多科研團(tuán)隊(duì)在步態(tài)識(shí)別算法和系統(tǒng)實(shí)現(xiàn)方面取得了一系列成果。在特征提取方面,國(guó)內(nèi)學(xué)者結(jié)合人體運(yùn)動(dòng)學(xué)和圖像處理技術(shù),提出了多種新穎的特征提取方法,如基于局部二值模式(LBP)、尺度不變特征變換(SIFT)等的特征提取算法,能夠有效地描述步態(tài)的局部和全局特征。在多視角步態(tài)識(shí)別研究中,國(guó)內(nèi)學(xué)者也積極探索新的融合算法和模型,通過(guò)將多個(gè)視角的步態(tài)特征進(jìn)行融合,進(jìn)一步提高了識(shí)別的準(zhǔn)確性和魯棒性。二維經(jīng)驗(yàn)?zāi)B(tài)分解(BEMD)作為一種新興的信號(hào)處理方法,在步態(tài)識(shí)別領(lǐng)域的應(yīng)用研究逐漸受到關(guān)注。國(guó)外一些學(xué)者率先將BEMD應(yīng)用于步態(tài)圖像的分解和特征提取,通過(guò)分析BEMD分解得到的固有模態(tài)函數(shù)(IMF),提取出步態(tài)圖像中的細(xì)節(jié)和紋理特征,取得了較好的識(shí)別效果。國(guó)內(nèi)學(xué)者在此基礎(chǔ)上,進(jìn)一步研究了基于BEMD的多視角步態(tài)特征融合方法,通過(guò)對(duì)不同視角下的步態(tài)圖像進(jìn)行BEMD分解,并將分解得到的特征進(jìn)行融合,提高了多視角步態(tài)識(shí)別的性能。然而,目前基于BEMD的多視角步態(tài)識(shí)別算法仍存在一些問(wèn)題和挑戰(zhàn)。一方面,BEMD分解過(guò)程中的計(jì)算復(fù)雜度較高,導(dǎo)致算法的實(shí)時(shí)性較差,難以滿足實(shí)際應(yīng)用的需求。另一方面,多視角信息融合過(guò)程中,如何有效地融合不同視角下的BEMD特征,以提高識(shí)別準(zhǔn)確率和魯棒性,仍然是一個(gè)亟待解決的問(wèn)題。此外,現(xiàn)有研究大多在實(shí)驗(yàn)室環(huán)境下進(jìn)行,對(duì)復(fù)雜場(chǎng)景下的步態(tài)識(shí)別研究較少,算法的泛化能力有待進(jìn)一步提高。綜上所述,國(guó)內(nèi)外在步態(tài)識(shí)別領(lǐng)域取得了豐碩的研究成果,但基于BEMD的多視角步態(tài)識(shí)別算法仍有很大的研究空間。未來(lái)的研究需要進(jìn)一步優(yōu)化BEMD算法,降低計(jì)算復(fù)雜度,提高算法的實(shí)時(shí)性;探索更加有效的多視角信息融合策略,充分利用BEMD提取的步態(tài)特征,提升識(shí)別性能;加強(qiáng)對(duì)復(fù)雜場(chǎng)景下步態(tài)識(shí)別的研究,提高算法的泛化能力和適應(yīng)性,推動(dòng)基于BEMD的多視角步態(tài)識(shí)別算法在實(shí)際場(chǎng)景中的應(yīng)用。1.3研究?jī)?nèi)容與方法1.3.1研究?jī)?nèi)容本文主要圍繞基于BEMD的多視角步態(tài)識(shí)別算法展開(kāi)深入研究,具體涵蓋以下幾個(gè)關(guān)鍵方面:步態(tài)圖像預(yù)處理與周期檢測(cè):針對(duì)采集到的原始步態(tài)圖像,首先運(yùn)用先進(jìn)的運(yùn)動(dòng)目標(biāo)檢測(cè)算法,如背景差分法、幀間差分法等,精確地從復(fù)雜背景中分割出人體運(yùn)動(dòng)目標(biāo)。隨后,通過(guò)二值圖像形態(tài)學(xué)處理,包括腐蝕、膨脹等操作,對(duì)分割后的圖像進(jìn)行優(yōu)化,去除噪聲干擾,使人體輪廓更加清晰。接著,進(jìn)行圖像連通區(qū)域處理,確保分割結(jié)果的完整性和準(zhǔn)確性。在步態(tài)周期檢測(cè)環(huán)節(jié),對(duì)預(yù)處理后的圖像進(jìn)行歸一化處理,消除因拍攝角度、距離等因素導(dǎo)致的尺度差異。然后,采用基于能量變化、頻率分析等方法,準(zhǔn)確檢測(cè)出步態(tài)周期,為后續(xù)的特征提取提供精確的時(shí)間序列數(shù)據(jù)?;贐EMD的步態(tài)特征提取與構(gòu)建:深入剖析二維經(jīng)驗(yàn)?zāi)B(tài)分解(BEMD)的原理和算法,將其創(chuàng)新性地應(yīng)用于步態(tài)圖像的特征提取。通過(guò)BEMD對(duì)步態(tài)圖像進(jìn)行自適應(yīng)分解,得到一系列具有不同頻率和尺度特征的固有模態(tài)函數(shù)(IMF)。對(duì)這些IMF進(jìn)行細(xì)致分析,提取出能夠充分反映步態(tài)局部和全局特征的信息,如紋理特征、輪廓特征等。針對(duì)多視角步態(tài)數(shù)據(jù),研究如何有效地融合不同視角下的BEMD特征,構(gòu)建全面、準(zhǔn)確的多視角步態(tài)特征向量,以提高步態(tài)識(shí)別的準(zhǔn)確率和魯棒性。多視角步態(tài)識(shí)別算法設(shè)計(jì)與優(yōu)化:在步態(tài)特征提取的基礎(chǔ)上,精心選擇合適的分類算法,如支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)等,并深入研究其在多視角步態(tài)識(shí)別中的應(yīng)用。針對(duì)所選分類算法的參數(shù)優(yōu)化問(wèn)題,采用遺傳算法、粒子群優(yōu)化算法等智能優(yōu)化算法,對(duì)分類器的參數(shù)進(jìn)行精細(xì)調(diào)整,以提高分類性能。此外,探索將深度學(xué)習(xí)算法,如卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等,引入多視角步態(tài)識(shí)別領(lǐng)域,利用其強(qiáng)大的特征學(xué)習(xí)和分類能力,進(jìn)一步提升識(shí)別效果。同時(shí),研究如何結(jié)合多種分類算法,通過(guò)融合策略,如投票法、加權(quán)融合法等,實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ),提高識(shí)別的準(zhǔn)確性和可靠性。實(shí)驗(yàn)驗(yàn)證與分析:廣泛收集和整理多種公開(kāi)的步態(tài)數(shù)據(jù)庫(kù),如CASIA、OU-ISIR等,以及自行采集的實(shí)驗(yàn)數(shù)據(jù),構(gòu)建豐富多樣的實(shí)驗(yàn)數(shù)據(jù)集。根據(jù)研究?jī)?nèi)容和目的,精心設(shè)計(jì)全面、科學(xué)的實(shí)驗(yàn)方案,對(duì)基于BEMD的多視角步態(tài)識(shí)別算法的性能進(jìn)行嚴(yán)格的評(píng)估。實(shí)驗(yàn)中,重點(diǎn)關(guān)注算法的識(shí)別準(zhǔn)確率、召回率、誤報(bào)率等關(guān)鍵指標(biāo),以及算法在不同視角、不同環(huán)境條件下的魯棒性和適應(yīng)性。通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的深入分析,詳細(xì)探討算法的優(yōu)勢(shì)和不足之處,為算法的進(jìn)一步優(yōu)化和改進(jìn)提供有力的依據(jù)。1.3.2研究方法為確保研究目標(biāo)的順利實(shí)現(xiàn),本文將綜合運(yùn)用多種研究方法,從理論研究、實(shí)驗(yàn)研究和系統(tǒng)實(shí)現(xiàn)等多個(gè)層面展開(kāi)深入研究:理論研究:全面、深入地研究步態(tài)識(shí)別的相關(guān)理論知識(shí),包括步態(tài)特征提取的原理、分類算法的機(jī)制、多視角信息融合的策略等。系統(tǒng)地梳理和分析國(guó)內(nèi)外在步態(tài)識(shí)別領(lǐng)域的最新研究成果,特別是基于BEMD的多視角步態(tài)識(shí)別算法的研究進(jìn)展,明確當(dāng)前研究的熱點(diǎn)和難點(diǎn)問(wèn)題。深入剖析BEMD的數(shù)學(xué)原理、算法流程及其在圖像特征提取中的優(yōu)勢(shì)和局限性,為將其應(yīng)用于多視角步態(tài)識(shí)別提供堅(jiān)實(shí)的理論基礎(chǔ)。同時(shí),研究不同分類算法的特點(diǎn)和適用場(chǎng)景,以及智能優(yōu)化算法在參數(shù)調(diào)整中的應(yīng)用原理,為算法的設(shè)計(jì)和優(yōu)化提供理論指導(dǎo)。實(shí)驗(yàn)研究:利用專業(yè)的數(shù)據(jù)采集儀器,如高清攝像機(jī)、運(yùn)動(dòng)傳感器等,采集多視角的步態(tài)數(shù)據(jù),并運(yùn)用先進(jìn)的步態(tài)識(shí)別軟件對(duì)數(shù)據(jù)進(jìn)行細(xì)致的分析和處理。通過(guò)大量的實(shí)驗(yàn),深入研究不同參數(shù)設(shè)置對(duì)基于BEMD的多視角步態(tài)識(shí)別算法性能的影響,如BEMD分解層數(shù)、分類器參數(shù)等。采用對(duì)比實(shí)驗(yàn)的方法,將本文提出的算法與其他傳統(tǒng)的步態(tài)識(shí)別算法進(jìn)行全面、細(xì)致的比較,客觀、準(zhǔn)確地評(píng)估本文算法的優(yōu)勢(shì)和改進(jìn)空間。此外,通過(guò)在不同環(huán)境條件下進(jìn)行實(shí)驗(yàn),如不同光照、不同背景等,驗(yàn)證算法的魯棒性和適應(yīng)性,確保算法在實(shí)際應(yīng)用中的可靠性。系統(tǒng)實(shí)現(xiàn):基于研究成果,開(kāi)發(fā)一個(gè)完整、高效的基于BEMD的多視角步態(tài)識(shí)別系統(tǒng)。該系統(tǒng)將集成數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、步態(tài)特征提取、步態(tài)識(shí)別等多個(gè)核心模塊,實(shí)現(xiàn)對(duì)多視角步態(tài)數(shù)據(jù)的自動(dòng)化處理和識(shí)別。在系統(tǒng)實(shí)現(xiàn)過(guò)程中,充分考慮系統(tǒng)的性能優(yōu)化和用戶體驗(yàn),采用先進(jìn)的編程技術(shù)和算法優(yōu)化策略,提高系統(tǒng)的運(yùn)行效率和穩(wěn)定性。同時(shí),設(shè)計(jì)友好的用戶界面,方便用戶操作和使用,使系統(tǒng)具有良好的實(shí)用性和可擴(kuò)展性。二、步態(tài)識(shí)別基礎(chǔ)理論2.1步態(tài)識(shí)別概述步態(tài)識(shí)別作為生物識(shí)別領(lǐng)域的重要研究方向,近年來(lái)受到了廣泛的關(guān)注。它是一種基于人體行走姿態(tài)進(jìn)行身份識(shí)別的技術(shù),通過(guò)分析個(gè)體在行走過(guò)程中表現(xiàn)出的獨(dú)特模式和特征,實(shí)現(xiàn)對(duì)人員身份的準(zhǔn)確判斷。與其他生物識(shí)別技術(shù),如指紋識(shí)別、人臉識(shí)別、虹膜識(shí)別等相比,步態(tài)識(shí)別具有遠(yuǎn)距離、非接觸、不易偽裝等顯著優(yōu)勢(shì),在安防監(jiān)控、智能門禁、醫(yī)療診斷等領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力。每個(gè)人的步態(tài)都具有唯一性,這是由多種因素共同決定的。從生理層面來(lái)看,人體的骨骼結(jié)構(gòu)、肌肉力量、關(guān)節(jié)活動(dòng)范圍等生理特征存在個(gè)體差異,這些差異直接影響著人們行走時(shí)的姿態(tài)和動(dòng)作模式。例如,腿骨長(zhǎng)度的不同會(huì)導(dǎo)致步長(zhǎng)的差異,肌肉力量的強(qiáng)弱會(huì)影響行走的速度和節(jié)奏。從行為習(xí)慣角度而言,個(gè)人的行走習(xí)慣,如走路的節(jié)奏、擺臂的幅度、抬腳的高度等,也具有獨(dú)特性,這些習(xí)慣在長(zhǎng)期的生活中逐漸形成,且相對(duì)穩(wěn)定,不易改變。英國(guó)南安普敦大學(xué)電子與計(jì)算機(jī)系專家的研究顯示,人人都有截然不同的走路姿勢(shì),因?yàn)槿藗冊(cè)诩∪獾牧α?、肌腱和骨骼長(zhǎng)度、骨骼密度、視覺(jué)的靈敏程度、協(xié)調(diào)能力、經(jīng)歷、體重、重心、肌肉或骨骼受損程度、生理?xiàng)l件以及個(gè)人走路的“風(fēng)格”上都存在細(xì)微差異。這些生理和行為特征的綜合作用,使得每個(gè)人的步態(tài)都成為一種獨(dú)特的生物特征標(biāo)識(shí),為步態(tài)識(shí)別技術(shù)提供了堅(jiān)實(shí)的理論基礎(chǔ)。在安防監(jiān)控領(lǐng)域,步態(tài)識(shí)別技術(shù)能夠?qū)崿F(xiàn)遠(yuǎn)距離、非接觸式的身份識(shí)別。傳統(tǒng)的監(jiān)控系統(tǒng)往往依賴于高清圖像或近距離識(shí)別技術(shù),對(duì)于遠(yuǎn)距離或低分辨率的場(chǎng)景,識(shí)別效果不佳。而步態(tài)識(shí)別技術(shù)可以在較遠(yuǎn)的距離對(duì)行人進(jìn)行識(shí)別,即使在圖像質(zhì)量較低的情況下,也能通過(guò)分析行人的步態(tài)特征來(lái)判斷其身份。在一些公共場(chǎng)所,如機(jī)場(chǎng)、火車站、大型商場(chǎng)等,人流量大,人員身份復(fù)雜,步態(tài)識(shí)別技術(shù)可以通過(guò)安裝在各個(gè)角落的攝像頭,實(shí)時(shí)監(jiān)測(cè)行人的步態(tài),一旦發(fā)現(xiàn)可疑人員,系統(tǒng)能夠及時(shí)發(fā)出警報(bào),為公共安全提供有力保障。在智能門禁系統(tǒng)中,步態(tài)識(shí)別技術(shù)可以實(shí)現(xiàn)無(wú)感知的身份驗(yàn)證。與傳統(tǒng)的門禁系統(tǒng),如刷卡、指紋識(shí)別、人臉識(shí)別等相比,步態(tài)識(shí)別無(wú)需用戶主動(dòng)配合,用戶只需正常行走通過(guò)門禁區(qū)域,系統(tǒng)就能自動(dòng)識(shí)別其身份,實(shí)現(xiàn)快速通行。這種無(wú)感知的驗(yàn)證方式不僅提高了通行效率,還提升了用戶體驗(yàn),特別適用于人員流量較大的場(chǎng)所,如寫字樓、園區(qū)等。在醫(yī)療診斷領(lǐng)域,步態(tài)識(shí)別技術(shù)也具有重要的應(yīng)用價(jià)值。許多疾病,如帕金森病、腦卒中等,會(huì)導(dǎo)致患者的步態(tài)發(fā)生明顯變化。通過(guò)對(duì)患者步態(tài)的分析,醫(yī)生可以獲取有關(guān)疾病的信息,輔助疾病的診斷和治療效果的評(píng)估。例如,帕金森病患者的步態(tài)通常表現(xiàn)為步幅減小、步速減慢、姿勢(shì)不穩(wěn)等特征,醫(yī)生可以通過(guò)對(duì)這些步態(tài)特征的分析,判斷患者的病情進(jìn)展情況,調(diào)整治療方案。步態(tài)識(shí)別技術(shù)還可以用于康復(fù)訓(xùn)練的監(jiān)測(cè),幫助患者更好地恢復(fù)身體功能。步態(tài)識(shí)別技術(shù)的基本原理是通過(guò)對(duì)人體行走過(guò)程中的運(yùn)動(dòng)信息進(jìn)行采集和分析,提取出能夠表征個(gè)體特征的步態(tài)特征,然后將這些特征與數(shù)據(jù)庫(kù)中的模板進(jìn)行匹配,從而實(shí)現(xiàn)身份識(shí)別。其工作流程主要包括數(shù)據(jù)采集、預(yù)處理、特征提取、特征匹配等環(huán)節(jié)。在數(shù)據(jù)采集階段,通常使用攝像頭、傳感器等設(shè)備獲取人體行走的視頻圖像序列或運(yùn)動(dòng)數(shù)據(jù);預(yù)處理環(huán)節(jié)則對(duì)采集到的數(shù)據(jù)進(jìn)行去噪、歸一化等處理,以提高數(shù)據(jù)的質(zhì)量;特征提取是步態(tài)識(shí)別的關(guān)鍵步驟,通過(guò)各種算法從預(yù)處理后的數(shù)據(jù)中提取出能夠反映個(gè)體獨(dú)特步態(tài)特征的信息,如步長(zhǎng)、步頻、身體擺動(dòng)角度等;最后,在特征匹配階段,將提取到的特征與數(shù)據(jù)庫(kù)中已存儲(chǔ)的模板進(jìn)行比對(duì),根據(jù)匹配結(jié)果判斷個(gè)體的身份。2.2多視角步態(tài)識(shí)別技術(shù)多視角步態(tài)識(shí)別技術(shù)旨在通過(guò)融合多個(gè)不同視角的步態(tài)信息,實(shí)現(xiàn)對(duì)行人身份的準(zhǔn)確識(shí)別。在實(shí)際應(yīng)用場(chǎng)景中,行人的行走方向和角度是多樣的,單一視角的步態(tài)識(shí)別往往受到視角變化的限制,難以準(zhǔn)確捕捉到行人的全部步態(tài)特征,導(dǎo)致識(shí)別準(zhǔn)確率下降。多視角步態(tài)識(shí)別技術(shù)通過(guò)利用多個(gè)攝像頭從不同角度同時(shí)采集行人的步態(tài)數(shù)據(jù),能夠更全面地獲取行人的步態(tài)信息,從而提高識(shí)別的準(zhǔn)確性和魯棒性。多視角步態(tài)識(shí)別技術(shù)的原理基于人體運(yùn)動(dòng)學(xué)和計(jì)算機(jī)視覺(jué)理論。從人體運(yùn)動(dòng)學(xué)角度來(lái)看,人體在行走過(guò)程中,各個(gè)部位的運(yùn)動(dòng)軌跡和姿態(tài)變化在不同視角下呈現(xiàn)出不同的特征。通過(guò)多個(gè)視角的觀察,可以更全面地了解人體的運(yùn)動(dòng)模式。在正面視角下,可以清晰地觀察到行人的步長(zhǎng)、步頻以及手臂的擺動(dòng)幅度等特征;而在側(cè)面視角下,則能更好地獲取行人的腿部抬起高度、身體重心的轉(zhuǎn)移等信息。從計(jì)算機(jī)視覺(jué)角度出發(fā),多視角步態(tài)識(shí)別技術(shù)通過(guò)對(duì)多個(gè)視角下的步態(tài)圖像進(jìn)行處理和分析,提取出不同視角下的步態(tài)特征,然后將這些特征進(jìn)行融合,以實(shí)現(xiàn)對(duì)行人身份的準(zhǔn)確識(shí)別。在特征提取階段,常用的方法包括基于輪廓的特征提取、基于關(guān)節(jié)點(diǎn)的特征提取以及基于深度學(xué)習(xí)的特征提取等。基于輪廓的特征提取方法通過(guò)對(duì)步態(tài)圖像中的人體輪廓進(jìn)行分析,提取出輪廓的形狀、面積、周長(zhǎng)等特征,這些特征能夠反映出行人的整體形態(tài)和運(yùn)動(dòng)趨勢(shì)?;陉P(guān)節(jié)點(diǎn)的特征提取方法則通過(guò)檢測(cè)人體關(guān)節(jié)點(diǎn)的位置和運(yùn)動(dòng)軌跡,獲取關(guān)節(jié)點(diǎn)之間的相對(duì)位置關(guān)系和角度變化等特征,這些特征對(duì)于描述人體的運(yùn)動(dòng)細(xì)節(jié)具有重要意義?;谏疃葘W(xué)習(xí)的特征提取方法,如卷積神經(jīng)網(wǎng)絡(luò)(CNN),則能夠自動(dòng)學(xué)習(xí)步態(tài)圖像中的深層次特征,無(wú)需人工手動(dòng)設(shè)計(jì)特征提取算法,具有更強(qiáng)的特征表達(dá)能力。然而,多視角步態(tài)識(shí)別技術(shù)在實(shí)際應(yīng)用中面臨著諸多挑戰(zhàn)。首先,視角變化導(dǎo)致的特征差異是一個(gè)關(guān)鍵問(wèn)題。不同視角下的步態(tài)圖像,其人體輪廓、關(guān)節(jié)點(diǎn)位置等特征會(huì)發(fā)生明顯變化,這給特征提取和匹配帶來(lái)了困難。當(dāng)行人從正面視角逐漸轉(zhuǎn)向側(cè)面視角時(shí),人體輪廓的形狀和比例會(huì)發(fā)生改變,關(guān)節(jié)點(diǎn)的可見(jiàn)性也會(huì)受到影響,從而導(dǎo)致基于輪廓和關(guān)節(jié)點(diǎn)的特征提取方法的性能下降。其次,數(shù)據(jù)融合的復(fù)雜性也是一個(gè)挑戰(zhàn)。如何有效地融合多個(gè)視角的步態(tài)特征,以提高識(shí)別準(zhǔn)確率,是多視角步態(tài)識(shí)別技術(shù)的核心問(wèn)題之一。簡(jiǎn)單的數(shù)據(jù)融合方法,如直接拼接不同視角的特征向量,可能無(wú)法充分挖掘不同視角之間的互補(bǔ)信息,導(dǎo)致融合效果不佳。此外,多視角數(shù)據(jù)采集設(shè)備的部署和校準(zhǔn)也需要較高的成本和技術(shù)要求,這在一定程度上限制了多視角步態(tài)識(shí)別技術(shù)的實(shí)際應(yīng)用。為了解決這些挑戰(zhàn),研究人員提出了多種解決方案。針對(duì)視角變化導(dǎo)致的特征差異問(wèn)題,一些研究采用了視角轉(zhuǎn)換模型,將不同視角的步態(tài)圖像轉(zhuǎn)換到同一視角下,以減少特征差異。利用生成對(duì)抗網(wǎng)絡(luò)(GAN)生成特定視角下的步態(tài)圖像,從而實(shí)現(xiàn)不同視角之間的轉(zhuǎn)換。在數(shù)據(jù)融合方面,提出了多種融合策略,如基于決策層融合、特征層融合和數(shù)據(jù)層融合的方法。決策層融合通過(guò)對(duì)不同視角下的分類結(jié)果進(jìn)行投票或加權(quán)平均,得到最終的識(shí)別結(jié)果;特征層融合則將不同視角下的特征向量進(jìn)行拼接或融合,然后輸入到分類器中進(jìn)行識(shí)別;數(shù)據(jù)層融合直接對(duì)多個(gè)視角的原始數(shù)據(jù)進(jìn)行融合處理,再進(jìn)行特征提取和識(shí)別。這些融合策略各有優(yōu)缺點(diǎn),在實(shí)際應(yīng)用中需要根據(jù)具體情況選擇合適的方法。2.3BEMD原理及優(yōu)勢(shì)二維經(jīng)驗(yàn)?zāi)B(tài)分解(BEMD)是一種針對(duì)二維信號(hào)(如圖像)的自適應(yīng)分解方法,它在處理非線性、非平穩(wěn)數(shù)據(jù)方面展現(xiàn)出獨(dú)特的優(yōu)勢(shì)。該方法最初由相關(guān)學(xué)者在對(duì)傳統(tǒng)經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)進(jìn)行拓展的基礎(chǔ)上提出,旨在解決二維信號(hào)分析中的難題。BEMD的核心原理基于信號(hào)的局部特征尺度。它假設(shè)任何復(fù)雜的二維信號(hào)都可以分解為一系列具有不同頻率和尺度的固有模態(tài)函數(shù)(IMF)之和。這些IMF分量代表了信號(hào)在不同局部尺度上的振蕩模式,每個(gè)IMF都滿足兩個(gè)基本條件:一是在整個(gè)數(shù)據(jù)范圍內(nèi),局部極值點(diǎn)(極大值和極小值)的數(shù)目與過(guò)零點(diǎn)的數(shù)目相等或最多相差一個(gè);二是在任意時(shí)刻,由局部極大值構(gòu)成的上包絡(luò)線和由局部極小值構(gòu)成的下包絡(luò)線的平均值為零。這兩個(gè)條件確保了IMF能夠準(zhǔn)確地描述信號(hào)的局部特征和變化趨勢(shì)。BEMD的分解過(guò)程是一個(gè)迭代的“篩選”過(guò)程。以一幅步態(tài)圖像為例,首先需要確定圖像中的所有局部極值點(diǎn),包括極大值點(diǎn)和極小值點(diǎn)。對(duì)于極大值點(diǎn),通過(guò)二維插值算法,如雙三次樣條插值,構(gòu)建上包絡(luò)面;對(duì)于極小值點(diǎn),同樣使用類似的插值方法構(gòu)建下包絡(luò)面。計(jì)算上下包絡(luò)面的平均值,得到一個(gè)平均包絡(luò)面。將原始步態(tài)圖像減去這個(gè)平均包絡(luò)面,得到一個(gè)初步的IMF分量。但這個(gè)初步的IMF分量可能并不滿足IMF的嚴(yán)格定義,因此需要進(jìn)行多次篩選。在每次篩選中,不斷重復(fù)上述確定極值點(diǎn)、構(gòu)建包絡(luò)面、計(jì)算平均包絡(luò)面并相減的過(guò)程,直到得到的IMF分量滿足IMF的兩個(gè)條件為止。這個(gè)過(guò)程會(huì)產(chǎn)生多個(gè)IMF分量,每個(gè)IMF分量從高頻到低頻依次包含了圖像的不同尺度的特征信息,高頻的IMF分量主要反映圖像的細(xì)節(jié)和邊緣信息,如人體輪廓的細(xì)微變化、關(guān)節(jié)的運(yùn)動(dòng)細(xì)節(jié)等;低頻的IMF分量則更多地體現(xiàn)圖像的全局特征和趨勢(shì),如人體的整體運(yùn)動(dòng)方向、步幅的大致范圍等。剩余的部分稱為殘差,它包含了信號(hào)中無(wú)法進(jìn)一步分解的趨勢(shì)或直流分量。通過(guò)這種方式,原始的步態(tài)圖像被分解為一系列IMF分量和一個(gè)殘差。與傳統(tǒng)的信號(hào)處理方法相比,BEMD在處理非線性、非平穩(wěn)數(shù)據(jù)時(shí)具有顯著的優(yōu)勢(shì)。傳統(tǒng)的傅里葉變換和小波變換等方法依賴于預(yù)先設(shè)定的基函數(shù),對(duì)于非線性、非平穩(wěn)的步態(tài)數(shù)據(jù),這些固定的基函數(shù)難以準(zhǔn)確地捕捉數(shù)據(jù)的局部特征和變化規(guī)律。而B(niǎo)EMD是一種自適應(yīng)的分解方法,它不需要預(yù)先設(shè)定基函數(shù),而是根據(jù)數(shù)據(jù)自身的特征尺度進(jìn)行分解,能夠更好地適應(yīng)步態(tài)數(shù)據(jù)的復(fù)雜性和多變性。在不同視角下,人體的步態(tài)特征會(huì)發(fā)生非線性的變化,BEMD能夠自適應(yīng)地調(diào)整分解方式,準(zhǔn)確地提取出不同視角下步態(tài)圖像的特征。BEMD分解得到的IMF分量具有明確的物理意義,每個(gè)IMF分量代表了信號(hào)在特定尺度上的振蕩模式,這使得對(duì)步態(tài)特征的分析更加直觀和深入。通過(guò)對(duì)不同IMF分量的分析,可以分別研究步態(tài)的細(xì)節(jié)特征和全局特征,為步態(tài)識(shí)別提供更豐富、準(zhǔn)確的特征信息。BEMD還具有較好的抗噪聲能力,在實(shí)際的步態(tài)數(shù)據(jù)采集過(guò)程中,不可避免地會(huì)受到各種噪聲的干擾,BEMD能夠在一定程度上抑制噪聲的影響,提取出有效的步態(tài)特征。三、基于BEMD的多視角步態(tài)識(shí)別算法設(shè)計(jì)3.1步態(tài)圖像預(yù)處理步態(tài)圖像預(yù)處理是步態(tài)識(shí)別過(guò)程中的關(guān)鍵環(huán)節(jié),其目的是對(duì)采集到的原始步態(tài)圖像進(jìn)行一系列處理,以提高圖像質(zhì)量,為后續(xù)的特征提取和識(shí)別提供可靠的數(shù)據(jù)基礎(chǔ)。本小節(jié)將從運(yùn)動(dòng)目標(biāo)檢測(cè)、二值圖像形態(tài)學(xué)處理以及圖像連通區(qū)域處理這三個(gè)主要方面,詳細(xì)闡述步態(tài)圖像預(yù)處理的具體步驟和方法。3.1.1運(yùn)動(dòng)目標(biāo)檢測(cè)運(yùn)動(dòng)目標(biāo)檢測(cè)作為步態(tài)圖像預(yù)處理的首要任務(wù),其核心在于從復(fù)雜的背景環(huán)境中精準(zhǔn)地分割出人體運(yùn)動(dòng)目標(biāo)。在實(shí)際的監(jiān)控場(chǎng)景中,背景往往包含各種靜態(tài)物體,如建筑物、道路、樹(shù)木等,同時(shí)還可能受到光照變化、陰影、遮擋等因素的干擾,這使得運(yùn)動(dòng)目標(biāo)檢測(cè)面臨諸多挑戰(zhàn)。目前,常用的運(yùn)動(dòng)目標(biāo)檢測(cè)方法主要包括背景差分法、幀間差分法和光流法等。背景差分法是一種基于背景模型的檢測(cè)方法,其基本原理是預(yù)先建立一個(gè)準(zhǔn)確的背景模型,然后將當(dāng)前幀圖像與背景模型進(jìn)行逐像素相減。若某像素點(diǎn)的差值超過(guò)預(yù)設(shè)的閾值,則判定該像素點(diǎn)屬于運(yùn)動(dòng)目標(biāo);反之,則屬于背景。在實(shí)際應(yīng)用中,背景模型的建立方式多種多樣,常見(jiàn)的有高斯混合模型(GMM)、碼本模型等。高斯混合模型通過(guò)多個(gè)高斯分布的加權(quán)和來(lái)描述背景像素的統(tǒng)計(jì)特性,能夠較好地適應(yīng)背景的動(dòng)態(tài)變化,如光照的緩慢變化、背景物體的輕微移動(dòng)等。碼本模型則利用碼本對(duì)背景像素的顏色和亮度信息進(jìn)行編碼,具有計(jì)算效率高、內(nèi)存占用小的優(yōu)點(diǎn),適用于實(shí)時(shí)性要求較高的場(chǎng)景。然而,背景差分法對(duì)背景模型的準(zhǔn)確性和適應(yīng)性要求極高,當(dāng)背景發(fā)生快速變化,如突然的光照改變、新物體的進(jìn)入或移出等,容易導(dǎo)致誤檢和漏檢。在室外監(jiān)控場(chǎng)景中,天氣的突然變化、車輛的快速行駛等都可能使背景模型失效,從而影響運(yùn)動(dòng)目標(biāo)的檢測(cè)效果。幀間差分法是基于視頻序列中相鄰幀之間的相關(guān)性進(jìn)行運(yùn)動(dòng)目標(biāo)檢測(cè)的方法。它通過(guò)計(jì)算相鄰兩幀或多幀圖像對(duì)應(yīng)像素點(diǎn)的差值,并對(duì)差值進(jìn)行閾值化處理,來(lái)提取出運(yùn)動(dòng)區(qū)域。幀間差分法的優(yōu)點(diǎn)在于對(duì)動(dòng)態(tài)背景具有較強(qiáng)的適應(yīng)性,能夠快速檢測(cè)出運(yùn)動(dòng)目標(biāo),并且算法實(shí)現(xiàn)相對(duì)簡(jiǎn)單,計(jì)算效率較高。但是,該方法存在一定的局限性,由于只考慮了相鄰幀之間的信息,對(duì)于運(yùn)動(dòng)速度較慢的目標(biāo),可能會(huì)出現(xiàn)檢測(cè)不完整的情況;而且,幀間差分法容易受到噪聲的干擾,導(dǎo)致檢測(cè)結(jié)果中出現(xiàn)較多的噪聲點(diǎn),影響后續(xù)的處理。光流法是一種基于物體運(yùn)動(dòng)引起的光流場(chǎng)變化來(lái)檢測(cè)運(yùn)動(dòng)目標(biāo)的方法。它通過(guò)計(jì)算圖像中每個(gè)像素點(diǎn)的光流矢量,來(lái)描述物體的運(yùn)動(dòng)方向和速度。若某像素點(diǎn)的光流矢量超過(guò)一定的閾值,則認(rèn)為該像素點(diǎn)屬于運(yùn)動(dòng)目標(biāo)。光流法的優(yōu)勢(shì)在于能夠提供豐富的運(yùn)動(dòng)信息,不僅可以檢測(cè)出運(yùn)動(dòng)目標(biāo)的位置,還能獲取其運(yùn)動(dòng)軌跡和速度等信息,對(duì)于分析復(fù)雜的運(yùn)動(dòng)場(chǎng)景具有重要意義。然而,光流法的計(jì)算復(fù)雜度較高,對(duì)硬件設(shè)備的性能要求也較高,在實(shí)際應(yīng)用中受到一定的限制。而且,光流法對(duì)光照變化和噪聲較為敏感,在光照不均勻或噪聲較大的環(huán)境下,檢測(cè)效果會(huì)明顯下降。在步態(tài)圖像中,由于人體運(yùn)動(dòng)的復(fù)雜性和多樣性,不同的運(yùn)動(dòng)目標(biāo)檢測(cè)方法各有優(yōu)劣。因此,在實(shí)際應(yīng)用中,需要根據(jù)具體的場(chǎng)景和需求,選擇合適的檢測(cè)方法或結(jié)合多種方法,以提高運(yùn)動(dòng)目標(biāo)檢測(cè)的準(zhǔn)確性和魯棒性。可以先使用背景差分法進(jìn)行初步檢測(cè),然后利用幀間差分法對(duì)檢測(cè)結(jié)果進(jìn)行補(bǔ)充和修正,最后通過(guò)光流法獲取更詳細(xì)的運(yùn)動(dòng)信息,從而實(shí)現(xiàn)對(duì)步態(tài)圖像中運(yùn)動(dòng)目標(biāo)的精確檢測(cè)。3.1.2二值圖像形態(tài)學(xué)處理經(jīng)過(guò)運(yùn)動(dòng)目標(biāo)檢測(cè)后得到的步態(tài)圖像,雖然已經(jīng)分割出了運(yùn)動(dòng)目標(biāo),但圖像中可能仍然存在噪聲、空洞以及目標(biāo)輪廓不清晰等問(wèn)題,這會(huì)對(duì)后續(xù)的特征提取和識(shí)別產(chǎn)生不利影響。為了解決這些問(wèn)題,需要對(duì)二值圖像進(jìn)行形態(tài)學(xué)處理。二值圖像形態(tài)學(xué)處理是基于數(shù)學(xué)形態(tài)學(xué)的理論,通過(guò)對(duì)圖像中的像素點(diǎn)進(jìn)行集合運(yùn)算,來(lái)改變圖像的形狀和結(jié)構(gòu),從而達(dá)到優(yōu)化圖像的目的。其基本運(yùn)算包括腐蝕、膨脹、開(kāi)運(yùn)算和閉運(yùn)算等。腐蝕是一種消除圖像中物體邊界點(diǎn)的操作,其原理是使用一個(gè)預(yù)先定義的結(jié)構(gòu)元素(如矩形、圓形、十字形等)對(duì)圖像進(jìn)行掃描。對(duì)于圖像中的每個(gè)像素點(diǎn),如果該像素點(diǎn)及其鄰域內(nèi)的像素點(diǎn)都與結(jié)構(gòu)元素完全匹配,則保留該像素點(diǎn);否則,將該像素點(diǎn)刪除。在步態(tài)圖像中,腐蝕操作可以有效地去除圖像中的噪聲點(diǎn)和細(xì)小的毛刺,使目標(biāo)輪廓更加平滑。當(dāng)圖像中存在一些孤立的噪聲點(diǎn),其大小小于結(jié)構(gòu)元素時(shí),經(jīng)過(guò)腐蝕操作,這些噪聲點(diǎn)將被去除,從而提高圖像的質(zhì)量。然而,腐蝕操作也會(huì)導(dǎo)致目標(biāo)物體的尺寸變小,可能會(huì)丟失一些重要的細(xì)節(jié)信息。膨脹是與腐蝕相反的操作,它是將與物體接觸的所有背景點(diǎn)合并到該物體中的過(guò)程。具體來(lái)說(shuō),同樣使用結(jié)構(gòu)元素對(duì)圖像進(jìn)行掃描,對(duì)于圖像中的每個(gè)像素點(diǎn),只要其鄰域內(nèi)有一個(gè)像素點(diǎn)與結(jié)構(gòu)元素匹配,就將該像素點(diǎn)合并到物體中。在步態(tài)圖像中,膨脹操作可以填補(bǔ)目標(biāo)物體中的空洞,連接斷裂的輪廓,增強(qiáng)目標(biāo)的完整性。當(dāng)目標(biāo)物體的輪廓由于噪聲或其他原因出現(xiàn)斷裂時(shí),通過(guò)膨脹操作,可以將這些斷裂的部分連接起來(lái),使目標(biāo)輪廓更加連續(xù)。但是,膨脹操作也可能會(huì)使目標(biāo)物體的尺寸變大,導(dǎo)致不同目標(biāo)之間的粘連。開(kāi)運(yùn)算和閉運(yùn)算是基于腐蝕和膨脹的組合運(yùn)算。開(kāi)運(yùn)算先對(duì)圖像進(jìn)行腐蝕操作,然后再進(jìn)行膨脹操作,其作用是消除圖像中的細(xì)小物體,在纖細(xì)點(diǎn)處分離物體,平滑較大物體的邊界,同時(shí)盡量不改變物體的面積。在步態(tài)圖像中,開(kāi)運(yùn)算可以去除圖像中的小噪聲物體,使目標(biāo)物體的輪廓更加清晰,便于后續(xù)的特征提取。閉運(yùn)算則先進(jìn)行膨脹操作,然后再進(jìn)行腐蝕操作,它可以填充物體內(nèi)的細(xì)小空洞,連接鄰近的物體,平滑物體的邊界,同樣盡量保持物體的面積不變。在步態(tài)圖像中,閉運(yùn)算可以使目標(biāo)物體內(nèi)部的空洞得到填充,增強(qiáng)目標(biāo)的完整性,提高識(shí)別的準(zhǔn)確性。在實(shí)際應(yīng)用中,通常會(huì)根據(jù)步態(tài)圖像的具體特點(diǎn)和需求,選擇合適的形態(tài)學(xué)操作組合。對(duì)于噪聲較多的圖像,可以先進(jìn)行開(kāi)運(yùn)算去除噪聲,再進(jìn)行閉運(yùn)算填充空洞;對(duì)于輪廓不清晰的圖像,可以先進(jìn)行膨脹操作增強(qiáng)輪廓,再進(jìn)行腐蝕操作恢復(fù)物體的原始大小。通過(guò)合理的二值圖像形態(tài)學(xué)處理,可以有效地優(yōu)化步態(tài)圖像,為后續(xù)的分析和處理提供更好的基礎(chǔ)。3.1.3圖像連通區(qū)域處理經(jīng)過(guò)二值圖像形態(tài)學(xué)處理后,步態(tài)圖像中的噪聲和空洞得到了一定程度的抑制,目標(biāo)輪廓也更加清晰。然而,在圖像中可能仍然存在一些不連續(xù)的區(qū)域,這些區(qū)域可能是由于目標(biāo)的部分遮擋、檢測(cè)誤差等原因造成的。為了提取完整的步態(tài)目標(biāo),需要進(jìn)行圖像連通區(qū)域處理。圖像連通區(qū)域處理的主要目的是將圖像中具有相同像素值且位置相鄰的像素點(diǎn)組成的區(qū)域進(jìn)行標(biāo)記和合并,從而得到完整的目標(biāo)區(qū)域。在二值圖像中,通常將像素值為1的區(qū)域視為目標(biāo)區(qū)域,像素值為0的區(qū)域視為背景區(qū)域。常用的圖像連通區(qū)域處理方法包括基于標(biāo)記的方法和基于種子填充的方法?;跇?biāo)記的方法,如Two-Pass算法,其基本原理是對(duì)圖像進(jìn)行兩次遍歷。在第一次遍歷中,從圖像的左上角開(kāi)始,逐行逐列地掃描圖像。對(duì)于每個(gè)像素點(diǎn),如果它屬于目標(biāo)區(qū)域(像素值為1)且其鄰域內(nèi)的像素點(diǎn)尚未被標(biāo)記,則為該像素點(diǎn)分配一個(gè)新的標(biāo)記;如果其鄰域內(nèi)的像素點(diǎn)已經(jīng)被標(biāo)記,則將該像素點(diǎn)標(biāo)記為鄰域中最小的標(biāo)記值。在第一次遍歷結(jié)束后,可能會(huì)存在一些具有相同標(biāo)記但實(shí)際上不連通的區(qū)域,這是因?yàn)樵趻呙柽^(guò)程中,只能根據(jù)局部鄰域信息進(jìn)行標(biāo)記。因此,需要進(jìn)行第二次遍歷,對(duì)具有相同標(biāo)記的區(qū)域進(jìn)行合并,通過(guò)查找標(biāo)記等價(jià)表,將等價(jià)的標(biāo)記合并為同一個(gè)標(biāo)記,從而得到準(zhǔn)確的連通區(qū)域標(biāo)記。這種方法的優(yōu)點(diǎn)是算法簡(jiǎn)單,易于實(shí)現(xiàn),能夠快速地對(duì)圖像進(jìn)行連通區(qū)域標(biāo)記;缺點(diǎn)是對(duì)于復(fù)雜的圖像,標(biāo)記等價(jià)表的維護(hù)和合并操作可能會(huì)消耗較多的時(shí)間和內(nèi)存?;诜N子填充的方法,如Seed-Filling算法,是從圖像中的某個(gè)種子點(diǎn)(通常是目標(biāo)區(qū)域內(nèi)的一個(gè)像素點(diǎn))開(kāi)始,將與種子點(diǎn)連通的所有像素點(diǎn)都填充為相同的標(biāo)記。具體過(guò)程是,首先選擇一個(gè)種子點(diǎn),將其標(biāo)記為目標(biāo)區(qū)域的標(biāo)記值,然后檢查種子點(diǎn)的鄰域像素點(diǎn),如果鄰域像素點(diǎn)屬于目標(biāo)區(qū)域且未被標(biāo)記,則將其加入到填充隊(duì)列中,并標(biāo)記為相同的值。不斷從填充隊(duì)列中取出像素點(diǎn),重復(fù)上述操作,直到填充隊(duì)列為空,此時(shí)與種子點(diǎn)連通的所有像素點(diǎn)都被標(biāo)記為目標(biāo)區(qū)域。這種方法的優(yōu)點(diǎn)是可以根據(jù)需要選擇特定的種子點(diǎn)進(jìn)行填充,對(duì)于處理具有復(fù)雜形狀或不連續(xù)區(qū)域的目標(biāo)具有較好的效果;缺點(diǎn)是算法的效率依賴于種子點(diǎn)的選擇和填充順序,如果種子點(diǎn)選擇不當(dāng),可能會(huì)導(dǎo)致填充不完整或填充效率低下。在步態(tài)圖像中,圖像連通區(qū)域處理具有重要的意義。通過(guò)準(zhǔn)確地標(biāo)記和合并連通區(qū)域,可以確保提取出完整的人體步態(tài)目標(biāo),避免因目標(biāo)不完整而導(dǎo)致的特征提取錯(cuò)誤和識(shí)別準(zhǔn)確率下降。在多視角步態(tài)識(shí)別中,不同視角下的步態(tài)圖像可能存在部分遮擋或變形,圖像連通區(qū)域處理能夠有效地處理這些問(wèn)題,保證從各個(gè)視角提取的步態(tài)目標(biāo)的完整性,為后續(xù)的多視角信息融合和識(shí)別提供可靠的數(shù)據(jù)基礎(chǔ)。3.2步態(tài)周期檢測(cè)步態(tài)周期檢測(cè)是步態(tài)識(shí)別中的關(guān)鍵環(huán)節(jié),它對(duì)于準(zhǔn)確提取步態(tài)特征、分析人體運(yùn)動(dòng)模式具有重要意義。準(zhǔn)確檢測(cè)步態(tài)周期能夠?yàn)楹罄m(xù)的特征提取提供精確的時(shí)間序列數(shù)據(jù),使提取的特征更具代表性和穩(wěn)定性。通過(guò)對(duì)步態(tài)周期的分析,還可以獲取人體運(yùn)動(dòng)的節(jié)奏、速度等信息,為步態(tài)識(shí)別提供更豐富的特征維度,從而提高識(shí)別的準(zhǔn)確率和可靠性。3.2.1歸一化處理在進(jìn)行步態(tài)周期檢測(cè)之前,需要對(duì)預(yù)處理后的步態(tài)圖像進(jìn)行歸一化處理。由于在實(shí)際數(shù)據(jù)采集過(guò)程中,受到拍攝設(shè)備、拍攝角度、拍攝距離以及人體自身差異等多種因素的影響,不同圖像之間可能存在尺度、亮度等方面的差異。這些差異會(huì)給步態(tài)周期檢測(cè)帶來(lái)干擾,降低檢測(cè)的準(zhǔn)確性。歸一化處理的目的就是消除這些差異,使不同圖像在同一標(biāo)準(zhǔn)下進(jìn)行比較和分析。常用的歸一化方法包括尺度歸一化和灰度歸一化。尺度歸一化主要是對(duì)圖像的尺寸進(jìn)行調(diào)整,使其具有統(tǒng)一的大小。在步態(tài)圖像中,人體的大小可能會(huì)因拍攝距離的遠(yuǎn)近而不同,通過(guò)尺度歸一化,可以將不同大小的人體圖像縮放到相同的尺寸,以便后續(xù)的處理。一種常見(jiàn)的尺度歸一化方法是基于人體輪廓的外接矩形,計(jì)算外接矩形的長(zhǎng)和寬,然后根據(jù)設(shè)定的目標(biāo)尺寸,對(duì)圖像進(jìn)行等比例縮放。將所有步態(tài)圖像的外接矩形統(tǒng)一縮放到100×200像素的大小,這樣可以保證不同圖像中人體的尺度一致?;叶葰w一化則是對(duì)圖像的灰度值進(jìn)行調(diào)整,使圖像的灰度分布在一個(gè)固定的范圍內(nèi)。在實(shí)際拍攝中,由于光照條件的不同,圖像的亮度可能會(huì)有較大差異,灰度歸一化可以消除這種差異,增強(qiáng)圖像的對(duì)比度。常用的灰度歸一化方法有線性歸一化和直方圖均衡化。線性歸一化通過(guò)線性變換將圖像的灰度值映射到[0,1]或[0,255]的范圍內(nèi),其公式為:I_{norm}=\frac{I-I_{min}}{I_{max}-I_{min}},其中I是原始圖像的灰度值,I_{min}和I_{max}分別是原始圖像中的最小和最大灰度值,I_{norm}是歸一化后的灰度值。直方圖均衡化則是通過(guò)對(duì)圖像的直方圖進(jìn)行調(diào)整,使圖像的灰度分布更加均勻,從而增強(qiáng)圖像的對(duì)比度。歸一化處理對(duì)步態(tài)周期檢測(cè)具有重要影響。通過(guò)尺度歸一化,不同圖像中人體的大小和位置得到了統(tǒng)一,使得在檢測(cè)步態(tài)周期時(shí),能夠基于相同的尺度標(biāo)準(zhǔn)進(jìn)行分析,避免了因尺度差異導(dǎo)致的周期檢測(cè)誤差。在計(jì)算步態(tài)周期中的步長(zhǎng)、步頻等參數(shù)時(shí),如果圖像沒(méi)有進(jìn)行尺度歸一化,不同圖像中相同的實(shí)際步長(zhǎng)可能會(huì)對(duì)應(yīng)不同的像素距離,從而導(dǎo)致步長(zhǎng)計(jì)算錯(cuò)誤,影響步態(tài)周期的準(zhǔn)確檢測(cè)?;叶葰w一化增強(qiáng)了圖像的對(duì)比度,使圖像中的人體輪廓更加清晰,有利于后續(xù)的特征提取和周期檢測(cè)。在基于輪廓特征進(jìn)行步態(tài)周期檢測(cè)時(shí),清晰的輪廓能夠更準(zhǔn)確地反映人體的運(yùn)動(dòng)狀態(tài),提高周期檢測(cè)的準(zhǔn)確性。歸一化處理還能夠提高算法的穩(wěn)定性和魯棒性,使步態(tài)周期檢測(cè)算法在不同的拍攝條件下都能保持較好的性能。3.2.2周期檢測(cè)算法本文采用基于BEMD的步態(tài)周期檢測(cè)算法,該算法利用BEMD對(duì)步態(tài)圖像序列進(jìn)行分析,通過(guò)尋找信號(hào)中的周期性變化來(lái)確定步態(tài)周期。其基本原理是基于人體行走過(guò)程中,步態(tài)圖像的某些特征會(huì)呈現(xiàn)出周期性的變化,如人體輪廓的形狀、位置等。BEMD能夠?qū)⒉綉B(tài)圖像分解為一系列具有不同頻率和尺度的固有模態(tài)函數(shù)(IMF),這些IMF反映了圖像在不同層次上的特征變化。通過(guò)分析IMF分量的能量變化、頻率特性等信息,可以準(zhǔn)確地檢測(cè)出步態(tài)周期。該算法的實(shí)現(xiàn)步驟如下:BEMD分解:對(duì)歸一化后的步態(tài)圖像序列進(jìn)行BEMD分解,將每幀圖像分解為多個(gè)IMF分量和一個(gè)殘差。在分解過(guò)程中,根據(jù)BEMD的迭代篩選原理,確定圖像中的局部極值點(diǎn),構(gòu)建上下包絡(luò)面,通過(guò)多次篩選得到滿足IMF條件的分量。以某一幀步態(tài)圖像為例,經(jīng)過(guò)BEMD分解后,得到了5個(gè)IMF分量和一個(gè)殘差,IMF1主要反映了圖像中的高頻細(xì)節(jié)信息,如人體關(guān)節(jié)的微小運(yùn)動(dòng);IMF5則更多地體現(xiàn)了圖像的低頻全局特征,如人體的整體運(yùn)動(dòng)趨勢(shì)。特征提?。簭姆纸獾玫降腎MF分量中提取與步態(tài)周期相關(guān)的特征??梢杂?jì)算每個(gè)IMF分量的能量,能量變化能夠反映步態(tài)的動(dòng)態(tài)變化過(guò)程;也可以分析IMF分量的頻率特性,步態(tài)周期對(duì)應(yīng)的頻率具有一定的特征范圍。對(duì)于IMF1分量,計(jì)算其在每個(gè)時(shí)間點(diǎn)(即每幀圖像)的能量值,得到一個(gè)能量序列;通過(guò)傅里葉變換分析IMF2分量的頻率分布,確定其主要頻率成分。周期檢測(cè):根據(jù)提取的特征,采用合適的方法檢測(cè)步態(tài)周期。一種常用的方法是基于峰值檢測(cè),在能量序列中尋找峰值點(diǎn),相鄰兩個(gè)峰值點(diǎn)之間的時(shí)間間隔即為一個(gè)步態(tài)周期。通過(guò)設(shè)定合適的閾值,排除一些因噪聲或其他干擾導(dǎo)致的偽峰值,提高周期檢測(cè)的準(zhǔn)確性。在能量序列中,當(dāng)能量值超過(guò)設(shè)定閾值且在局部范圍內(nèi)為最大值時(shí),判定為一個(gè)峰值點(diǎn),通過(guò)這種方式準(zhǔn)確地檢測(cè)出了步態(tài)周期。驗(yàn)證與優(yōu)化:對(duì)檢測(cè)到的步態(tài)周期進(jìn)行驗(yàn)證,檢查周期的合理性和穩(wěn)定性??梢酝ㄟ^(guò)與其他周期檢測(cè)方法的結(jié)果進(jìn)行對(duì)比,或者結(jié)合人體運(yùn)動(dòng)學(xué)知識(shí)進(jìn)行判斷。如果發(fā)現(xiàn)周期檢測(cè)存在異常,對(duì)算法進(jìn)行優(yōu)化,調(diào)整參數(shù)或改進(jìn)特征提取方法。當(dāng)檢測(cè)到的某個(gè)步態(tài)周期明顯偏離正常范圍時(shí),檢查特征提取過(guò)程中是否存在誤差,或者調(diào)整峰值檢測(cè)的閾值,以確保步態(tài)周期檢測(cè)的準(zhǔn)確性和可靠性?;贐EMD的步態(tài)周期檢測(cè)算法能夠充分利用BEMD對(duì)非線性、非平穩(wěn)信號(hào)的自適應(yīng)分解能力,有效地提取步態(tài)圖像中的周期性特征,準(zhǔn)確地檢測(cè)出步態(tài)周期。與傳統(tǒng)的基于時(shí)域分析或頻域分析的周期檢測(cè)算法相比,該算法具有更強(qiáng)的適應(yīng)性和魯棒性,能夠在復(fù)雜的背景和不同的拍攝條件下準(zhǔn)確地檢測(cè)步態(tài)周期,為后續(xù)的步態(tài)特征提取和識(shí)別提供了可靠的基礎(chǔ)。3.3基于BEMD的步態(tài)特征提取3.3.1步態(tài)能量圖步態(tài)能量圖(GaitEnergyImage,GEI)是一種廣泛應(yīng)用于步態(tài)識(shí)別領(lǐng)域的特征表示方法,它將步態(tài)序列中的多幀圖像信息融合為一幅圖像,能夠有效地捕捉人體行走過(guò)程中的周期性特征和整體運(yùn)動(dòng)模式。步態(tài)能量圖的生成過(guò)程基于人體在行走過(guò)程中,不同時(shí)刻的姿態(tài)雖然有所變化,但存在一定的周期性規(guī)律。對(duì)于一個(gè)完整的步態(tài)周期內(nèi)的多幀圖像,首先將每幀圖像進(jìn)行歸一化處理,使其具有相同的尺寸和灰度范圍,以消除因拍攝條件和個(gè)體差異導(dǎo)致的尺度和亮度變化。然后,將這些歸一化后的圖像進(jìn)行疊加。在疊加過(guò)程中,每個(gè)像素點(diǎn)的灰度值表示該位置在整個(gè)步態(tài)周期內(nèi)被人體覆蓋的頻率或概率。具體計(jì)算公式如下:GEI(x,y)=\frac{1}{N}\sum_{n=1}^{N}I_n(x,y)其中,GEI(x,y)表示步態(tài)能量圖中坐標(biāo)為(x,y)的像素點(diǎn)的灰度值,N是一個(gè)步態(tài)周期內(nèi)的圖像幀數(shù),I_n(x,y)表示第n幀圖像中坐標(biāo)為(x,y)的像素點(diǎn)的灰度值。通過(guò)上述計(jì)算,步態(tài)能量圖將步態(tài)序列中的時(shí)間信息轉(zhuǎn)化為空間信息,在一幅圖像中直觀地展示了人體在行走過(guò)程中的主要輪廓和運(yùn)動(dòng)軌跡。在步態(tài)能量圖中,人體的腿部、手臂等運(yùn)動(dòng)較為明顯的部位會(huì)呈現(xiàn)出較高的灰度值,因?yàn)檫@些部位在步態(tài)周期內(nèi)的運(yùn)動(dòng)范圍較大,覆蓋該像素點(diǎn)的次數(shù)較多;而人體的軀干等相對(duì)穩(wěn)定的部位則灰度值相對(duì)較低。步態(tài)能量圖在步態(tài)特征提取中具有重要作用。它能夠有效地壓縮數(shù)據(jù)維度,將多幀的步態(tài)圖像信息融合為一幅圖像,大大減少了后續(xù)處理的數(shù)據(jù)量,提高了計(jì)算效率。步態(tài)能量圖保留了步態(tài)的主要特征,如步長(zhǎng)、步頻、身體擺動(dòng)幅度等,這些特征在圖像中以灰度分布的形式體現(xiàn)出來(lái),為后續(xù)的特征提取和識(shí)別提供了豐富的信息。步態(tài)能量圖還具有一定的抗噪聲能力,由于它是對(duì)多個(gè)幀的信息進(jìn)行融合,能夠在一定程度上平滑掉單幀圖像中的噪聲干擾,提高特征的穩(wěn)定性。在實(shí)際應(yīng)用中,步態(tài)能量圖可以作為一種直觀的特征表示,用于可視化分析人體的步態(tài)模式;也可以作為輸入,進(jìn)一步提取更高級(jí)的特征,如基于卷積神經(jīng)網(wǎng)絡(luò)的深度特征提取,以實(shí)現(xiàn)更準(zhǔn)確的步態(tài)識(shí)別。3.3.2二維經(jīng)驗(yàn)?zāi)B(tài)分解(BEMD)二維經(jīng)驗(yàn)?zāi)B(tài)分解(BidimensionalEmpiricalModeDecomposition,BEMD)是一種專門針對(duì)二維信號(hào)(如圖像)的自適應(yīng)分解方法,它在處理非線性、非平穩(wěn)信號(hào)方面展現(xiàn)出獨(dú)特的優(yōu)勢(shì),特別適用于步態(tài)圖像這種復(fù)雜的二維數(shù)據(jù)。BEMD的原理基于信號(hào)的局部特征尺度。它假設(shè)任何復(fù)雜的二維信號(hào)都可以分解為一系列具有不同頻率和尺度的固有模態(tài)函數(shù)(IntrinsicModeFunction,IMF)之和,每個(gè)IMF分量代表了信號(hào)在不同局部尺度上的振蕩模式。以步態(tài)圖像為例,BEMD通過(guò)對(duì)圖像中的局部極值點(diǎn)進(jìn)行分析,來(lái)確定信號(hào)的特征尺度。具體來(lái)說(shuō),對(duì)于一幅步態(tài)圖像,首先需要確定圖像中的所有局部極值點(diǎn),包括極大值點(diǎn)和極小值點(diǎn)。這些極值點(diǎn)反映了圖像中不同區(qū)域的變化特征,極大值點(diǎn)通常對(duì)應(yīng)于圖像中的亮區(qū)域或變化劇烈的區(qū)域,而極小值點(diǎn)則對(duì)應(yīng)于暗區(qū)域或相對(duì)穩(wěn)定的區(qū)域。對(duì)于極大值點(diǎn),通過(guò)二維插值算法,如雙三次樣條插值,構(gòu)建上包絡(luò)面;對(duì)于極小值點(diǎn),同樣使用類似的插值方法構(gòu)建下包絡(luò)面。計(jì)算上下包絡(luò)面的平均值,得到一個(gè)平均包絡(luò)面。將原始步態(tài)圖像減去這個(gè)平均包絡(luò)面,得到一個(gè)初步的IMF分量。但這個(gè)初步的IMF分量可能并不滿足IMF的嚴(yán)格定義,因此需要進(jìn)行多次篩選。在每次篩選中,不斷重復(fù)上述確定極值點(diǎn)、構(gòu)建包絡(luò)面、計(jì)算平均包絡(luò)面并相減的過(guò)程,直到得到的IMF分量滿足IMF的兩個(gè)條件:一是在整個(gè)數(shù)據(jù)范圍內(nèi),局部極值點(diǎn)(極大值和極小值)的數(shù)目與過(guò)零點(diǎn)的數(shù)目相等或最多相差一個(gè);二是在任意時(shí)刻,由局部極大值構(gòu)成的上包絡(luò)線和由局部極小值構(gòu)成的下包絡(luò)線的平均值為零。這兩個(gè)條件確保了IMF能夠準(zhǔn)確地描述信號(hào)的局部特征和變化趨勢(shì)。BEMD的算法流程可以概括為以下幾個(gè)步驟:初始化:輸入一幅步態(tài)圖像I(x,y),設(shè)置篩選次數(shù)k=0,初始化IMF分量IMF_0(x,y)=I(x,y)。確定極值點(diǎn):在當(dāng)前的IMF_k(x,y)圖像中,通過(guò)特定的算法(如基于梯度的方法)確定所有的局部極大值點(diǎn)和極小值點(diǎn)。構(gòu)建包絡(luò)面:對(duì)于極大值點(diǎn),使用二維插值算法構(gòu)建上包絡(luò)面U(x,y);對(duì)于極小值點(diǎn),構(gòu)建下包絡(luò)面L(x,y)。計(jì)算平均包絡(luò)面:計(jì)算上下包絡(luò)面的平均值M(x,y)=\frac{U(x,y)+L(x,y)}{2}。更新IMF分量:計(jì)算新的IMF分量IMF_{k+1}(x,y)=IMF_k(x,y)-M(x,y)。篩選判斷:檢查IMF_{k+1}(x,y)是否滿足IMF的兩個(gè)條件。如果滿足,則將IMF_{k+1}(x,y)作為一個(gè)有效的IMF分量輸出;否則,令k=k+1,返回步驟2,繼續(xù)進(jìn)行篩選。殘差計(jì)算:當(dāng)所有的IMF分量都提取完畢后,計(jì)算殘差R(x,y)=I(x,y)-\sum_{i=1}^{n}IMF_i(x,y),其中n是提取的IMF分量的個(gè)數(shù)。在步態(tài)特征提取中,BEMD具有諸多優(yōu)勢(shì)。它是一種自適應(yīng)的分解方法,不需要預(yù)先設(shè)定基函數(shù),能夠根據(jù)步態(tài)圖像自身的特征尺度進(jìn)行分解,更好地適應(yīng)步態(tài)數(shù)據(jù)的復(fù)雜性和多變性。不同視角下的步態(tài)圖像具有不同的特征,BEMD能夠自動(dòng)地根據(jù)這些特征進(jìn)行分解,準(zhǔn)確地提取出不同視角下步態(tài)圖像的特征。BEMD分解得到的IMF分量具有明確的物理意義,每個(gè)IMF分量代表了信號(hào)在特定尺度上的振蕩模式,這使得對(duì)步態(tài)特征的分析更加直觀和深入。通過(guò)對(duì)不同IMF分量的分析,可以分別研究步態(tài)的細(xì)節(jié)特征和全局特征,高頻的IMF分量主要反映圖像的細(xì)節(jié)和邊緣信息,如人體輪廓的細(xì)微變化、關(guān)節(jié)的運(yùn)動(dòng)細(xì)節(jié)等;低頻的IMF分量則更多地體現(xiàn)圖像的全局特征和趨勢(shì),如人體的整體運(yùn)動(dòng)方向、步幅的大致范圍等。BEMD還具有較好的抗噪聲能力,在實(shí)際的步態(tài)數(shù)據(jù)采集過(guò)程中,不可避免地會(huì)受到各種噪聲的干擾,BEMD能夠在一定程度上抑制噪聲的影響,提取出有效的步態(tài)特征。3.3.3特征提取與構(gòu)建基于BEMD的步態(tài)特征提取方法充分利用了BEMD對(duì)步態(tài)圖像的自適應(yīng)分解能力,通過(guò)對(duì)分解得到的固有模態(tài)函數(shù)(IMF)進(jìn)行分析,提取出能夠有效表征步態(tài)特征的信息。具體的特征提取過(guò)程如下:首先,對(duì)步態(tài)能量圖(GEI)進(jìn)行BEMD分解,得到一系列的IMF分量。這些IMF分量從高頻到低頻依次包含了GEI圖像在不同尺度上的特征信息。對(duì)于每個(gè)IMF分量,采用灰度共生矩陣(GLCM)提取其紋理特征?;叶裙采仃囀且环N用于描述圖像中像素灰度之間空間相關(guān)性的方法,它能夠反映圖像的紋理方向、粗糙度和對(duì)比度等特征。通過(guò)計(jì)算IMF分量在不同方向(如0°、45°、90°、135°)和不同距離下的灰度共生矩陣,然后從這些矩陣中提取出能量、熵、對(duì)比度、相關(guān)性等統(tǒng)計(jì)量作為紋理特征。對(duì)于某一IMF分量,計(jì)算其在0°方向、距離為1時(shí)的灰度共生矩陣,然后從中提取能量值為0.85,熵值為1.23等,這些特征值能夠反映該IMF分量在這一方向和距離下的紋理特性。除了紋理特征,還提取IMF分量的輪廓特征。通過(guò)邊緣檢測(cè)算法,如Canny算法,對(duì)IMF分量進(jìn)行邊緣檢測(cè),得到其輪廓信息。然后,計(jì)算輪廓的周長(zhǎng)、面積、圓形度等幾何特征,這些特征能夠描述IMF分量所包含的輪廓形狀和大小信息。對(duì)于某一IMF分量的輪廓,計(jì)算得到其周長(zhǎng)為150像素,面積為1200平方像素,圓形度為0.78等,這些幾何特征為步態(tài)特征的描述提供了重要的信息。在多視角步態(tài)特征構(gòu)建方面,由于不同視角下的步態(tài)圖像包含了不同的信息,為了充分利用這些信息,提高步態(tài)識(shí)別的準(zhǔn)確率,需要將不同視角下提取的特征進(jìn)行融合。對(duì)于每個(gè)視角的步態(tài)圖像,都按照上述方法進(jìn)行BEMD分解和特征提取,得到一組特征向量。然后,將這些不同視角的特征向量進(jìn)行拼接,形成一個(gè)綜合的多視角步態(tài)特征向量。假設(shè)有三個(gè)視角的步態(tài)圖像,每個(gè)視角提取的特征向量長(zhǎng)度分別為n_1、n_2、n_3,則將這三個(gè)特征向量依次拼接,得到一個(gè)長(zhǎng)度為n_1+n_2+n_3的多視角步態(tài)特征向量。在拼接過(guò)程中,為了避免不同視角特征之間的權(quán)重差異對(duì)識(shí)別結(jié)果的影響,可以對(duì)每個(gè)視角的特征向量進(jìn)行歸一化處理,使其具有相同的尺度和分布??梢圆捎米畲?最小歸一化方法,將每個(gè)特征向量中的元素映射到[0,1]的范圍內(nèi),然后再進(jìn)行拼接。通過(guò)這種方式構(gòu)建的多視角步態(tài)特征向量,能夠全面地反映人體在不同視角下的步態(tài)特征,為后續(xù)的步態(tài)識(shí)別提供了更豐富、準(zhǔn)確的特征信息,從而提高了步態(tài)識(shí)別的性能。3.4特征維數(shù)約簡(jiǎn)在基于BEMD的多視角步態(tài)識(shí)別算法中,經(jīng)過(guò)特征提取后得到的步態(tài)特征向量通常具有較高的維度。高維特征向量雖然包含了豐富的信息,但也帶來(lái)了一系列問(wèn)題,如計(jì)算復(fù)雜度增加、存儲(chǔ)需求增大、容易出現(xiàn)過(guò)擬合現(xiàn)象等。因此,特征維數(shù)約簡(jiǎn)成為了步態(tài)識(shí)別算法中不可或缺的環(huán)節(jié)。特征維數(shù)約簡(jiǎn)的必要性主要體現(xiàn)在以下幾個(gè)方面:從計(jì)算效率角度來(lái)看,高維特征向量會(huì)顯著增加計(jì)算量。在分類識(shí)別階段,計(jì)算特征向量之間的距離或進(jìn)行模型訓(xùn)練時(shí),高維數(shù)據(jù)會(huì)導(dǎo)致計(jì)算時(shí)間大幅延長(zhǎng)。以支持向量機(jī)(SVM)為例,其訓(xùn)練時(shí)間與特征維度呈正相關(guān),當(dāng)特征維度增加時(shí),訓(xùn)練時(shí)間會(huì)呈指數(shù)級(jí)增長(zhǎng),嚴(yán)重影響算法的實(shí)時(shí)性。高維特征向量需要更大的存儲(chǔ)空間來(lái)保存,這對(duì)于存儲(chǔ)資源有限的設(shè)備來(lái)說(shuō)是一個(gè)挑戰(zhàn)。從模型性能角度分析,高維數(shù)據(jù)容易引發(fā)過(guò)擬合問(wèn)題。在訓(xùn)練數(shù)據(jù)有限的情況下,模型可能會(huì)過(guò)度學(xué)習(xí)數(shù)據(jù)中的噪聲和細(xì)節(jié),導(dǎo)致在測(cè)試集上的泛化能力下降,無(wú)法準(zhǔn)確識(shí)別新的樣本。常用的維數(shù)約簡(jiǎn)方法主要包括主成分分析(PCA)和線性判別分析(LDA)等。主成分分析是一種基于數(shù)據(jù)的協(xié)方差矩陣進(jìn)行特征變換的方法。它通過(guò)對(duì)原始特征向量進(jìn)行線性變換,將高維數(shù)據(jù)投影到低維空間中,使得投影后的數(shù)據(jù)在低維空間中能夠最大程度地保留原始數(shù)據(jù)的方差信息。具體來(lái)說(shuō),PCA首先計(jì)算原始特征向量的協(xié)方差矩陣,然后對(duì)協(xié)方差矩陣進(jìn)行特征分解,得到特征值和特征向量。將特征值從大到小排序,選取前k個(gè)最大特征值對(duì)應(yīng)的特征向量,這些特征向量構(gòu)成了一個(gè)k維的投影矩陣。通過(guò)這個(gè)投影矩陣,將原始的高維特征向量投影到k維空間中,得到降維后的特征向量。PCA的優(yōu)點(diǎn)是能夠有效地去除數(shù)據(jù)中的噪聲和冗余信息,提取出數(shù)據(jù)的主要特征,并且計(jì)算相對(duì)簡(jiǎn)單,易于實(shí)現(xiàn)。它是一種無(wú)監(jiān)督的學(xué)習(xí)方法,不依賴于樣本的類別信息,在處理數(shù)據(jù)時(shí)可能會(huì)丟失一些與分類相關(guān)的重要信息。線性判別分析是一種有監(jiān)督的維數(shù)約簡(jiǎn)方法,它的目標(biāo)是尋找一個(gè)投影方向,使得投影后的數(shù)據(jù)在不同類別之間的距離盡可能大,而在同一類別內(nèi)部的距離盡可能小。LDA首先計(jì)算類內(nèi)散度矩陣和類間散度矩陣,然后求解廣義特征值問(wèn)題,得到投影矩陣。通過(guò)這個(gè)投影矩陣,將原始特征向量投影到低維空間中,實(shí)現(xiàn)維數(shù)約簡(jiǎn)。LDA充分利用了樣本的類別信息,在分類任務(wù)中通常能夠取得比PCA更好的效果。它對(duì)數(shù)據(jù)的分布有一定的假設(shè),要求數(shù)據(jù)滿足高斯分布,并且類內(nèi)協(xié)方差矩陣相等,在實(shí)際應(yīng)用中,這些假設(shè)往往難以完全滿足,從而限制了LDA的應(yīng)用范圍。在本算法中,選用主成分分析(PCA)方法對(duì)基于BEMD提取的多視角步態(tài)特征進(jìn)行維數(shù)約簡(jiǎn)。具體實(shí)現(xiàn)步驟如下:將提取得到的多視角步態(tài)特征向量組成一個(gè)特征矩陣,其中每一行代表一個(gè)樣本,每一列代表一個(gè)特征。計(jì)算該特征矩陣的均值向量,然后將每個(gè)樣本減去均值向量,得到中心化后的特征矩陣。接著,計(jì)算中心化后的特征矩陣的協(xié)方差矩陣,并對(duì)協(xié)方差矩陣進(jìn)行特征分解,得到特征值和特征向量。根據(jù)設(shè)定的貢獻(xiàn)率閾值,選取前k個(gè)最大特征值對(duì)應(yīng)的特征向量,構(gòu)成投影矩陣。將原始的多視角步態(tài)特征向量與投影矩陣相乘,得到降維后的特征向量。通過(guò)PCA進(jìn)行特征維數(shù)約簡(jiǎn)后,不僅降低了特征向量的維度,減少了計(jì)算量和存儲(chǔ)空間,還能有效地去除噪聲和冗余信息,提高了步態(tài)識(shí)別算法的性能和泛化能力。在實(shí)驗(yàn)中,通過(guò)對(duì)比降維前后的識(shí)別準(zhǔn)確率和計(jì)算時(shí)間,驗(yàn)證了PCA在本算法中進(jìn)行特征維數(shù)約簡(jiǎn)的有效性。四、多視角步態(tài)識(shí)別模型構(gòu)建4.1支持向量機(jī)(SVM)支持向量機(jī)(SupportVectorMachine,SVM)是一類有監(jiān)督學(xué)習(xí)方式,作為對(duì)數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器,其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面,也可應(yīng)用于多元分類問(wèn)題和回歸問(wèn)題。SVM的起源可追溯到1936年,RonaldFisher首次提出的線性判別分析為模式識(shí)別奠定了基石,隨著對(duì)最大邊距決策邊界的理論研究深入,以及基于松弛變量的規(guī)劃問(wèn)題求解技術(shù)出現(xiàn)和VC維概念的提出,其理論基礎(chǔ)在20世紀(jì)60-70年代逐漸確立。SVM的基本原理基于尋找一個(gè)最優(yōu)的超平面來(lái)劃分不同類別的數(shù)據(jù)點(diǎn),使得不同類別數(shù)據(jù)點(diǎn)之間的間隔(margin)最大。這個(gè)超平面就像是一條決策邊界,對(duì)于新的數(shù)據(jù)點(diǎn),可以根據(jù)它相對(duì)于這個(gè)超平面的位置來(lái)確定其類別。當(dāng)樣本數(shù)據(jù)是線性可分的時(shí)候,SVM能夠找出距離兩類樣本間隔最大的一條線,這條線不僅保證了分類的正確性,還盡可能讓兩個(gè)類別更容易區(qū)分。那些距離這條線最近的樣本點(diǎn)被稱為支持向量(SupportVector),它們到這條線的距離稱為間隔。間隔距離越大,分類效果的安全邊際越高,就算有新數(shù)據(jù)超出了原有樣本的邊界,但只要差距沒(méi)超過(guò)間隔,分類結(jié)果就不會(huì)受影響,而尋找最大間隔的過(guò)程就是SVM算法最優(yōu)化參數(shù)的過(guò)程。當(dāng)數(shù)據(jù)在原始空間中線性不可分時(shí),SVM通過(guò)“核函數(shù)”將樣本從低維空間映射到高維空間,讓樣本數(shù)據(jù)在新空間中線性可分。常見(jiàn)的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯核函數(shù)等。線性核函數(shù)是最簡(jiǎn)單的核函數(shù),它直接計(jì)算兩個(gè)樣本向量的內(nèi)積,適用于數(shù)據(jù)線性可分的情況,計(jì)算效率高。多項(xiàng)式核函數(shù)則可以處理具有一定非線性關(guān)系的數(shù)據(jù),通過(guò)調(diào)整多項(xiàng)式的次數(shù),可以控制映射空間的復(fù)雜度。高斯核函數(shù)是應(yīng)用最為廣泛的核函數(shù)之一,它能夠?qū)?shù)據(jù)映射到一個(gè)無(wú)限維的特征空間,對(duì)于處理復(fù)雜的非線性數(shù)據(jù)具有很強(qiáng)的能力。在分類方法上,對(duì)于線性可分的情況,SVM通過(guò)求解一個(gè)線性規(guī)劃問(wèn)題來(lái)確定最優(yōu)超平面的參數(shù)。對(duì)于線性不可分的情況,引入松弛變量,允許一些樣本點(diǎn)違反間隔約束,通過(guò)調(diào)整懲罰參數(shù)C來(lái)平衡間隔最大化和分類錯(cuò)誤最小化之間的關(guān)系。在多分類問(wèn)題中,常見(jiàn)的策略有“一對(duì)多”(one-vs-rest)和“一對(duì)一”(one-vs-one)等方法?!耙粚?duì)多”方法是針對(duì)每個(gè)類別訓(xùn)練一個(gè)分類器,將該類別與其他所有類別區(qū)分開(kāi)來(lái);“一對(duì)一”方法則是對(duì)每?jī)蓚€(gè)類別都訓(xùn)練一個(gè)分類器,最終通過(guò)投票等方式確定樣本的類別。SVM在步態(tài)識(shí)別中具有顯著的應(yīng)用優(yōu)勢(shì)。它在處理小樣本數(shù)據(jù)集時(shí)表現(xiàn)出色,而步態(tài)識(shí)別中獲取大量標(biāo)注數(shù)據(jù)往往較為困難,SVM的這一特性使其能夠在有限的數(shù)據(jù)上取得較好的識(shí)別效果。在一些公開(kāi)的步態(tài)數(shù)據(jù)庫(kù)中,樣本數(shù)量相對(duì)較少,SVM能夠充分利用這些數(shù)據(jù)進(jìn)行有效的學(xué)習(xí)和分類。SVM具有較強(qiáng)的泛化能力,通過(guò)最大化間隔來(lái)提高模型的泛化能力,減少過(guò)擬合的風(fēng)險(xiǎn),這使得訓(xùn)練好的SVM模型能夠較好地適應(yīng)不同環(huán)境和個(gè)體差異下的步態(tài)識(shí)別任務(wù)。SVM對(duì)異常值具有較好的魯棒性,不容易受到異常值的影響,在實(shí)際的步態(tài)數(shù)據(jù)采集中,可能會(huì)出現(xiàn)一些噪聲或異常的樣本點(diǎn),SVM能夠在一定程度上抑制這些異常值對(duì)識(shí)別結(jié)果的干擾,保證識(shí)別的準(zhǔn)確性。4.2遺傳算法優(yōu)化SVM參數(shù)4.2.1遺傳算法基本流程遺傳算法(GeneticAlgorithm,GA)是一種模擬自然界生物進(jìn)化過(guò)程與機(jī)制的隨機(jī)搜索算法,它基于達(dá)爾文的進(jìn)化論和孟德?tīng)柕倪z傳學(xué)說(shuō)發(fā)展而來(lái),通過(guò)模擬遺傳、變異、選擇等生物進(jìn)化過(guò)程來(lái)尋找最優(yōu)解,尤其適用于解決傳統(tǒng)優(yōu)化方法難以處理的復(fù)雜問(wèn)題,如具有高度非線性、多峰值等特性的問(wèn)題。遺傳算法的基本流程主要包括以下幾個(gè)關(guān)鍵步驟:編碼:將問(wèn)題的解表示為染色體的形式,這是遺傳算法的基礎(chǔ)操作。常見(jiàn)的編碼方式有二進(jìn)制編碼、實(shí)數(shù)編碼和符號(hào)編碼等。在二進(jìn)制編碼中,將解空間中的參數(shù)用二進(jìn)制串表示,每個(gè)二進(jìn)制串就代表一個(gè)個(gè)體(即染色體),串中的每一位稱為基因。若要表示[0,10]范圍內(nèi)的整數(shù),可采用4位二進(jìn)制編碼,0000表示0,1010表示10。實(shí)數(shù)編碼則直接使用實(shí)數(shù)來(lái)表示個(gè)體的基因,這種編碼方式在處理連續(xù)變量?jī)?yōu)化問(wèn)題時(shí)具有計(jì)算精度高、操作簡(jiǎn)便等優(yōu)點(diǎn)。符號(hào)編碼是用符號(hào)來(lái)表示基因,適用于一些具有特定結(jié)構(gòu)和語(yǔ)義的問(wèn)題。初始化種群:隨機(jī)生成一定數(shù)量的個(gè)體,這些個(gè)體構(gòu)成了遺傳算法的初始種群。種群規(guī)模的選擇需要綜合考慮問(wèn)題的復(fù)雜度和計(jì)算資源等因素,一般來(lái)說(shuō),較大的種群規(guī)??梢栽黾铀阉鞯亩鄻有?,但也會(huì)增加計(jì)算量和時(shí)間成本。對(duì)于一個(gè)簡(jiǎn)單的函數(shù)優(yōu)化問(wèn)題,初始種群規(guī)??梢栽O(shè)置為20-50;而對(duì)于復(fù)雜的多目標(biāo)優(yōu)化問(wèn)題,種群規(guī)??赡苄枰_(dá)到數(shù)百甚至更多。初始化種群中的個(gè)體代表了問(wèn)題的初步解,它們?cè)诤罄m(xù)的進(jìn)化過(guò)程中不斷優(yōu)化,以逼近最優(yōu)解。適應(yīng)度函數(shù)評(píng)估:通過(guò)適應(yīng)度函數(shù)來(lái)衡量每個(gè)個(gè)體對(duì)問(wèn)題的適應(yīng)程度,即評(píng)估個(gè)體的優(yōu)劣。適應(yīng)度值越高,表明個(gè)體越優(yōu)秀,其解決問(wèn)題的能力越強(qiáng)。在遺傳算法的迭代過(guò)程中,適應(yīng)度函數(shù)是選擇操作的重要依據(jù)。對(duì)于一個(gè)函數(shù)優(yōu)化問(wèn)題,適應(yīng)度函數(shù)可以直接定義為目標(biāo)函數(shù),即個(gè)體對(duì)應(yīng)的函數(shù)值越大,適應(yīng)度值越高;在分類問(wèn)題中,適應(yīng)度函數(shù)可以是分類準(zhǔn)確率、F1值等指標(biāo),通過(guò)計(jì)算個(gè)體在訓(xùn)練集上的分類性能來(lái)確定其適應(yīng)度值。選擇:根據(jù)個(gè)體的適應(yīng)度值,從當(dāng)前種群中選擇一些優(yōu)秀個(gè)體作為父代,為下一代的生成提供基因。選擇操作模擬了自然界中的“適者生存”原則,適應(yīng)度高的個(gè)體有更大的概率被選中。常用的選擇方法有輪盤賭選擇法、錦標(biāo)賽選擇法和排序選擇法等。輪盤賭選擇法是按照個(gè)體適應(yīng)度值占種群總適應(yīng)度值的比例來(lái)確定每個(gè)個(gè)體被選中的概率,適應(yīng)度高的個(gè)體被選中的概率較大,就像在一個(gè)輪盤上,每個(gè)個(gè)體占據(jù)的區(qū)域大小與其適應(yīng)度成正比,指針指向的區(qū)域?qū)?yīng)的個(gè)體被選中。錦標(biāo)賽選擇法是從種群中隨機(jī)選擇一定數(shù)量的個(gè)體(稱為錦標(biāo)賽規(guī)模),然后在這些個(gè)體中選擇適應(yīng)度最高的個(gè)體作為父代,這種方法能夠在一定程度上避免輪盤賭選擇法中可能出現(xiàn)的“早熟”現(xiàn)象。排序選擇法是根據(jù)個(gè)體的適應(yīng)度值對(duì)種群進(jìn)行排序,然后按照一定的規(guī)則選擇父代,例如可以選擇排名靠前的一定比例的個(gè)體作為父代。交叉:從被選中的父代中選擇兩個(gè)個(gè)體,通過(guò)某種方式交叉它們的基因,產(chǎn)生新的個(gè)體。交叉操作模擬了生物的繁殖過(guò)程,通過(guò)基因重組增加種群的多樣性。常見(jiàn)的交叉方法有單點(diǎn)交叉、多點(diǎn)交叉和均勻交叉等。單點(diǎn)交叉是隨機(jī)選擇一個(gè)交叉點(diǎn),將兩個(gè)父代在該交叉點(diǎn)處交換基因片段,生成兩個(gè)新的個(gè)體。假設(shè)有兩個(gè)父代個(gè)體A=10110和B=01001,隨機(jī)選擇交叉點(diǎn)為第3位,交叉后得到的兩個(gè)子代個(gè)體為A'=10001和B'=01110。多點(diǎn)交叉則是選擇多個(gè)交叉點(diǎn),將父代的基因片段在這些交叉點(diǎn)處進(jìn)行交換,能夠更充分地實(shí)現(xiàn)基因的重組。均勻交叉是對(duì)父代個(gè)體的每一位基因,以一定的概率進(jìn)行交換,使得子代個(gè)體的基因更加多樣化。變異:對(duì)新生成的個(gè)體進(jìn)行變異操作,以引入一些隨機(jī)性,防止算法陷入局部最優(yōu)。變異操作是對(duì)個(gè)體的基因進(jìn)行隨機(jī)修改,變異率的選擇需要在增加多樣性和保持穩(wěn)定性之間取得平衡。如果變異率過(guò)高,種群會(huì)變得過(guò)于隨機(jī),難以收斂到最優(yōu)解;如果變異率過(guò)低,算法可能無(wú)法跳出局部最優(yōu)解。在二進(jìn)制編碼中,變異操作可以是隨機(jī)選擇一些基因位點(diǎn),并隨機(jī)改變其值,如將0變?yōu)?,或?qū)?變?yōu)?。對(duì)于實(shí)數(shù)編碼,變異操作可以是在一定范圍內(nèi)對(duì)基因值進(jìn)行隨機(jī)擾動(dòng)。迭代:將新生成的子代加入原種群中,形成新一代種群,然后重復(fù)執(zhí)行上述步驟,直到滿足停止條件。停止條件通常包括達(dá)到預(yù)設(shè)的迭代次數(shù)、適應(yīng)度值收斂到一定范圍內(nèi)或種群的多樣性低于某個(gè)閾值等。當(dāng)達(dá)到停止條件時(shí),遺傳算法輸出當(dāng)前種群中適應(yīng)度最高的個(gè)體作為問(wèn)題的近似最優(yōu)解。遺傳算法通過(guò)不斷地迭代進(jìn)化,使種群中的個(gè)體逐漸適應(yīng)環(huán)境,不斷逼近最優(yōu)解。在每一次迭代中,選擇操作保留了優(yōu)秀的個(gè)體,交叉和變異操作則引入了新的基因組合,增加了種群的多樣性,從而提高了算法找到全局最優(yōu)解的概率。4.2.2遺傳算法優(yōu)化SVM參數(shù)的實(shí)現(xiàn)在多視角步態(tài)識(shí)別中,支持向量機(jī)(SVM)的性能很大程度上依賴于其參數(shù)的選擇。常用的SVM參數(shù)包括懲罰參數(shù)C和核函數(shù)參數(shù)(如高斯核函數(shù)的參數(shù)σ)等。懲罰參數(shù)C用于平衡分類間隔最大化和分類錯(cuò)誤最小化之間的關(guān)系,C值越大,對(duì)分類錯(cuò)誤的懲罰越重,模型的復(fù)雜度也越高;C值越小,模型的復(fù)雜度越低,但可能會(huì)導(dǎo)致分類錯(cuò)誤增加。核函數(shù)參數(shù)則決定了核函數(shù)的形狀和特性,不同的核函數(shù)參數(shù)會(huì)影響SVM對(duì)數(shù)據(jù)的非線性映射能力,從而影響分類效果。遺傳算法可以有效地優(yōu)化SVM的參數(shù),以提高步態(tài)識(shí)別的準(zhǔn)確率。具體實(shí)現(xiàn)步驟如下:確定優(yōu)化參數(shù)和編碼方式:明確需要優(yōu)化的SVM參數(shù),如懲罰參數(shù)C和核函數(shù)參數(shù)σ。選擇合適的編碼方式對(duì)這些參數(shù)進(jìn)行編碼,如采用實(shí)數(shù)編碼,將C和σ直接表示為實(shí)數(shù)形式,方便后續(xù)的遺傳操作。初始化種群:隨機(jī)生成一定數(shù)量的個(gè)體,每個(gè)個(gè)體代表一組SVM參數(shù)。種群規(guī)模根據(jù)實(shí)際情況進(jìn)行設(shè)定,一般可以在幾十到幾百之間。對(duì)于一個(gè)簡(jiǎn)單的步態(tài)識(shí)別問(wèn)題,初始種群規(guī)??梢栽O(shè)置為50;對(duì)于復(fù)雜的多視角步態(tài)識(shí)別問(wèn)題,種群規(guī)??赡苄枰O(shè)置為100或更多。定義適應(yīng)度函數(shù):將SVM的分類準(zhǔn)確率作為適應(yīng)度函數(shù)。對(duì)于種群中的每個(gè)個(gè)體,將其對(duì)應(yīng)的SVM參數(shù)應(yīng)用于訓(xùn)練集,訓(xùn)練SVM模型,并在測(cè)試集上計(jì)算分類準(zhǔn)確率,該準(zhǔn)確率即為該個(gè)體的適應(yīng)度值。適應(yīng)度值越高,表示該組SVM參數(shù)越優(yōu)。在一個(gè)包含100個(gè)訓(xùn)練樣本和50個(gè)測(cè)試樣本的步態(tài)識(shí)別數(shù)據(jù)集上,對(duì)于某個(gè)個(gè)體對(duì)應(yīng)的SVM參數(shù),訓(xùn)練得到的SVM模型在測(cè)試集上的分類準(zhǔn)確率為85%,則該個(gè)體的適應(yīng)度值為0.85。遺傳操作:選擇:采用輪盤賭選擇法,根據(jù)個(gè)體的適應(yīng)度值,從當(dāng)前種群中選擇適應(yīng)度較高的個(gè)體作為父代。適應(yīng)度高的個(gè)體被選中的概率較大,這樣可以保證優(yōu)良的基因能夠傳遞到下一代。交叉:對(duì)選中的父代個(gè)體進(jìn)行單點(diǎn)交叉操作。隨機(jī)選擇一個(gè)交叉點(diǎn),將兩個(gè)父代個(gè)體在該交叉點(diǎn)處交換基因片段,生成新的子代個(gè)體。假設(shè)有兩個(gè)父代個(gè)體,分別表示為[C1,σ1]和[C2,σ2],隨機(jī)選擇交叉點(diǎn)后,交叉得到的子代個(gè)體可能為[C1,σ2]和[C2,σ1]。變異:對(duì)子代個(gè)體進(jìn)行變異操作,以一定的變異率隨機(jī)改變個(gè)體的基因值。變異率一般設(shè)置在0.01-0.1之間,如設(shè)置為0.05。對(duì)于采用實(shí)數(shù)編碼的個(gè)體,變異操作可以是在基因值的一定范圍內(nèi)進(jìn)行隨機(jī)擾動(dòng)。對(duì)于某個(gè)子代個(gè)體的懲罰參數(shù)C,在變異時(shí)可以在其當(dāng)前值的基礎(chǔ)上加上一個(gè)在[-0.1,0.1]范圍內(nèi)的隨機(jī)數(shù),以引入新的基因組合。迭代優(yōu)化:將經(jīng)過(guò)遺傳操作生成的子代個(gè)體加入原種群,形成新一代種群。重復(fù)進(jìn)行選擇、交叉和變異操作,不斷迭代優(yōu)化種群中的個(gè)體。每次迭代后,計(jì)算新一代種群中每個(gè)個(gè)體的適應(yīng)度值,并更新最優(yōu)個(gè)體。設(shè)置最大迭代次數(shù)為100,在迭代過(guò)程中,記錄每一代種群中的最優(yōu)適應(yīng)度值和對(duì)應(yīng)的SVM參數(shù)。確定最優(yōu)參數(shù):當(dāng)達(dá)到預(yù)設(shè)的停止條件(如達(dá)到最大迭代次數(shù)或適應(yīng)度值收斂)時(shí),輸出當(dāng)前種群中適應(yīng)度最高的個(gè)體所對(duì)應(yīng)的SVM參數(shù),這些參數(shù)即為遺傳算法優(yōu)化得到的最優(yōu)參數(shù)。將這些最優(yōu)參數(shù)應(yīng)用于SVM模型,用于多視角步態(tài)識(shí)別,以提高識(shí)別準(zhǔn)確率。通過(guò)遺傳算法對(duì)SVM參數(shù)進(jìn)行優(yōu)化,可以充分利用遺傳算法的全局搜索能力,在參數(shù)空間中尋找最優(yōu)的參數(shù)組合,從而提高SVM在多視角步態(tài)識(shí)別中的性能,使識(shí)別準(zhǔn)確率得到顯著提升。在實(shí)際應(yīng)用中,通過(guò)對(duì)比優(yōu)化前后SVM的識(shí)別準(zhǔn)確率,驗(yàn)證了遺傳算法優(yōu)化SVM參數(shù)的有效性和優(yōu)越性。五、實(shí)驗(yàn)與結(jié)果分析5.1實(shí)驗(yàn)數(shù)據(jù)與方案設(shè)計(jì)為了全面、準(zhǔn)確地評(píng)估基于BEMD的多視角步態(tài)識(shí)別算法的性能,本研究精心選取了具有代表性的步態(tài)數(shù)據(jù)集,并設(shè)計(jì)了嚴(yán)謹(jǐn)?shù)膶?shí)驗(yàn)方案。5.1.1實(shí)驗(yàn)數(shù)據(jù)集本實(shí)驗(yàn)采用了CASIA-B和OU-MVLP這兩個(gè)在步態(tài)識(shí)別領(lǐng)域廣泛應(yīng)用的公開(kāi)數(shù)據(jù)集。CASIA-B數(shù)據(jù)集由中國(guó)科學(xué)院自動(dòng)化研究所提供,采集于2005年1月。該數(shù)據(jù)集規(guī)模較大且具有多視角特性,包含124個(gè)人的原始視頻數(shù)據(jù)及輪廓圖。每個(gè)人在11個(gè)不同視角(0°、18°、36°、…、180°)下進(jìn)行行走,并且涵蓋了三種不同的行走條件,分別為普通行走(normal,NM)、攜帶背包行走(walkingwithbag,BG)和穿著外套行走(wearingcoatorjacket,CL)。其中,每個(gè)目標(biāo)有6段NM序列、2段BG序列、2段CL序列,即每個(gè)目標(biāo)共有11×(6+2+2)=110段序列,每段序列長(zhǎng)度通常在80-100幀左右。該數(shù)據(jù)集沒(méi)有官方的訓(xùn)練集和驗(yàn)證集劃分,常見(jiàn)的劃分方法有Small-sampletraining(ST):訓(xùn)練集24個(gè)目標(biāo),驗(yàn)證集100個(gè)目標(biāo);Medium-sampletraining(MT):訓(xùn)練集62個(gè)目標(biāo),驗(yàn)證集62個(gè)目標(biāo);Large-sampletraining(LT):訓(xùn)練集74個(gè)目標(biāo),驗(yàn)證集50個(gè)目標(biāo)。在測(cè)試集中,一般將4段NM序列作為gallery,剩余的2段NM、2段BG、2段CL作為三組probe。CASIA-B數(shù)據(jù)集的多視角和多條件特性,能夠全面地測(cè)試算法在不同視角和行走條件下的性能表現(xiàn)。OU-MVLP數(shù)據(jù)集由日本大阪大學(xué)發(fā)布,是目前為止最大的步態(tài)數(shù)據(jù)集,共有10307個(gè)目標(biāo),14個(gè)角度,每個(gè)角度2段序列。該數(shù)據(jù)集的劃分方式為5153個(gè)訓(xùn)練集和5154個(gè)驗(yàn)證集,驗(yàn)證集中每個(gè)角度的一段序列作為gallery,另一段序列作為probe。由于其樣本數(shù)量眾多,能夠有效驗(yàn)證算法在大規(guī)模數(shù)據(jù)上的泛化能力和穩(wěn)定性。5.1.2實(shí)驗(yàn)方案設(shè)計(jì)實(shí)驗(yàn)方案的設(shè)計(jì)遵循科學(xué)、嚴(yán)謹(jǐn)?shù)脑瓌t,旨在全面評(píng)估基于BEMD的多視角步態(tài)識(shí)別算法在不同條件下的性能。實(shí)驗(yàn)流程主要包括數(shù)據(jù)預(yù)處理、特征提取、特征維數(shù)約簡(jiǎn)、分類識(shí)別以及結(jié)果評(píng)估等步驟。在數(shù)據(jù)預(yù)處理階段,針對(duì)CASIA-B和OU-MVLP數(shù)據(jù)集的原始視頻數(shù)據(jù),首先運(yùn)用運(yùn)動(dòng)目標(biāo)檢測(cè)算法,如高斯混合模型背景差分法,從復(fù)雜背景中準(zhǔn)確分割出人體運(yùn)動(dòng)目標(biāo)。對(duì)分割后的二值圖像進(jìn)行形態(tài)學(xué)處理,依次進(jìn)行腐蝕、膨脹、開(kāi)運(yùn)算和閉運(yùn)算,去除噪聲、填補(bǔ)空洞并平滑目標(biāo)輪廓。通過(guò)圖像連通區(qū)域處理,標(biāo)記和合并連通區(qū)域,確保提取出完整的人體步態(tài)目標(biāo)。對(duì)預(yù)處理后的圖像進(jìn)行歸一化處理,包括尺度歸一化和灰度歸一化,消除因拍攝條件和個(gè)體差異導(dǎo)致的尺度和亮度變化,使不同圖像在同一標(biāo)準(zhǔn)下進(jìn)行比較和分析。在特征提取階段,對(duì)于每個(gè)視角的步態(tài)圖像序列,先生成步態(tài)能量圖(GEI),將多幀圖像信息融合為一幅圖像,捕捉人體行走過(guò)程中的周期性特征和整體運(yùn)動(dòng)模式。對(duì)GEI進(jìn)行二維經(jīng)驗(yàn)?zāi)B(tài)分解(BEMD),得到一系列具有不同頻率和尺度的固有模態(tài)函數(shù)(IMF)。從IMF分量中提取紋理特征和輪廓特征,紋理特征通過(guò)灰度共生矩陣(GLCM)計(jì)算能量、熵、對(duì)比度、相關(guān)性等統(tǒng)計(jì)量來(lái)表征;輪廓特征通過(guò)邊緣檢測(cè)算法(如Canny算法)檢測(cè)邊緣后,計(jì)算輪廓的周長(zhǎng)、面積、圓形度等幾何特征來(lái)描述。將不同視角下提取的特征向量進(jìn)行拼接,形成綜合的多視角步態(tài)特征向量。由于提取的多視角步態(tài)特征向量維度較高,為了降低計(jì)算復(fù)雜度和避免過(guò)擬合,采用主成分分析(PCA)方法進(jìn)行特征維數(shù)約簡(jiǎn)。通過(guò)計(jì)算特征矩陣的協(xié)方差矩陣、特征分解,選取前k個(gè)最大特征值對(duì)應(yīng)的特征向量構(gòu)成投影矩陣,將原始特征向量投影到低維空間,得到降維后的特征向量。在分類識(shí)別階段,采用支持向量機(jī)(SVM)作為分類器,并利用遺傳算法對(duì)SVM的參數(shù)進(jìn)行優(yōu)化。遺傳算法通過(guò)編碼、初始化種群、適應(yīng)度函數(shù)評(píng)估、選擇、交叉、變異等操作,在參數(shù)空間中搜索最優(yōu)的SVM參數(shù)組合,包括懲罰參數(shù)C和核函數(shù)參數(shù)(如高斯核函數(shù)的參數(shù)σ),以提高SVM的分類性能。在實(shí)驗(yàn)中,設(shè)置了多組對(duì)比實(shí)驗(yàn)。將基于BEMD的多視角步態(tài)識(shí)別算法與傳統(tǒng)的基于單一特征提取的步態(tài)識(shí)別算法(如僅基于GEI特征的識(shí)別算法)進(jìn)行對(duì)比,評(píng)估BEMD特征提取方法的有效性。與其他多視角步態(tài)識(shí)別算法(如基于傳統(tǒng)特征融合的多視角識(shí)別算法)進(jìn)行對(duì)比,驗(yàn)證本文算法在多視角信息融合方面的優(yōu)勢(shì)。針對(duì)不同的參數(shù)設(shè)置,如BEMD的分解層數(shù)、PCA的貢獻(xiàn)率閾值、遺傳算法的種群規(guī)模和迭代次數(shù)等,進(jìn)行多組實(shí)驗(yàn),分析參數(shù)變化對(duì)算法性能的影響,以確定最優(yōu)的參數(shù)配置。在結(jié)果評(píng)估階段,采用準(zhǔn)確率、召回率、F1值等指標(biāo)對(duì)算法的性能進(jìn)行量化評(píng)估。準(zhǔn)確率表示正確識(shí)別的樣本數(shù)占總樣本數(shù)的比例,反映了算法的識(shí)別準(zhǔn)確性;召回率表示正確識(shí)別的樣本數(shù)占實(shí)際樣本數(shù)的比例,體現(xiàn)了算法對(duì)正樣本的覆蓋程度;F1值則綜合考慮了準(zhǔn)確率和召回率,更全面地評(píng)估算法的性能。通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的深入分析,總結(jié)算法的優(yōu)勢(shì)和不足之處,為算法的進(jìn)一步優(yōu)化和改進(jìn)提供依據(jù)。5.2實(shí)驗(yàn)結(jié)果與對(duì)比分析在完成基于BEMD的多視角步態(tài)識(shí)別算法的實(shí)驗(yàn)后,對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了詳細(xì)的分析,并與其他相關(guān)步態(tài)識(shí)別算法進(jìn)行了對(duì)比,以全面評(píng)估本文算法的性能。在CASIA-B數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,基于BEMD的多視角步態(tài)識(shí)別算法在不同視角和行走條件下均取得了較好的識(shí)別效果。在正常行走(NM)條件下,對(duì)于0°視角,識(shí)別準(zhǔn)確率達(dá)到了95.3%;隨著視角的逐漸增大,在180°視角時(shí),識(shí)別準(zhǔn)確率仍保持在89.2%。在攜帶背包(BG)和穿著外套(CL)的行走條件下,算法也展現(xiàn)出了較強(qiáng)的魯棒性,識(shí)別準(zhǔn)確率分別達(dá)到了87.5%和85.6%。這表明該算法能夠有效地處理不同視角和復(fù)雜行走條件下的步態(tài)數(shù)據(jù),充分利用BEMD對(duì)步態(tài)圖像的自適應(yīng)分解能力,提取出具有代表性的步態(tài)特征,從而實(shí)現(xiàn)準(zhǔn)確的識(shí)別。與其他相關(guān)步態(tài)識(shí)別算法進(jìn)行對(duì)比,結(jié)果顯示本文算法具有明顯的優(yōu)勢(shì)。與傳統(tǒng)的基于單一特征提取的步態(tài)識(shí)別算法(如僅基于GEI特征的識(shí)別算法)相比,基于BEMD的多視角步態(tài)識(shí)別算法在不同條件下的識(shí)別準(zhǔn)確率均有顯著提升。在CASIA-B數(shù)據(jù)集的NM條件下,僅基于GEI特征的識(shí)別算法在0°視角的識(shí)別準(zhǔn)確率為88.6%,而本文算法達(dá)到了95.3%,提升了6.7個(gè)百分點(diǎn);在180°視角,僅基于GEI特征的算法準(zhǔn)確率為82.1%,本文算法為89.2%,提升了7.1個(gè)百分點(diǎn)。這充分證明了BEMD特征提取方法能夠提取更豐富、更有效的步態(tài)特征,提高了識(shí)別準(zhǔn)確率。與其他多視角步態(tài)識(shí)別算法(如基于傳統(tǒng)特征融合的多視角識(shí)別算法)相比,本文算法在性能上也表現(xiàn)更優(yōu)。在OU-MVLP數(shù)據(jù)集上,基于傳統(tǒng)特征融合的多視角識(shí)別算法的平均識(shí)別準(zhǔn)確率為82.3%,而本文基于BEMD的多視角步態(tài)識(shí)別算法的平均識(shí)別準(zhǔn)確率達(dá)到了88.7%,提高了6.4個(gè)百分點(diǎn)。本文算法在處理大規(guī)模數(shù)據(jù)時(shí),能夠更好地融合不同視角的信息,通過(guò)BEMD分解得到的IMF分量,能夠更準(zhǔn)確地描述步態(tài)的局部和全局特征,從而在多視角步態(tài)識(shí)別中取得更好的效果。通過(guò)對(duì)不同參數(shù)設(shè)置下的實(shí)驗(yàn)結(jié)果進(jìn)行

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論