版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
基于角度及輪廓特征的步態(tài)識別方法深度探究一、引言1.1研究背景與意義在現(xiàn)代社會中,安全問題愈發(fā)凸顯,人們對安全保障的需求也日益增長。無論是公共場所的安全監(jiān)控,還是個(gè)人隱私的保護(hù),都需要高效、準(zhǔn)確的身份識別技術(shù)作為支撐。生物特征識別技術(shù)應(yīng)運(yùn)而生,它利用人體固有的生理特征或行為特征來進(jìn)行身份鑒別,具有唯一性、穩(wěn)定性和不可復(fù)制性等優(yōu)點(diǎn),在安防、金融、醫(yī)療等多個(gè)領(lǐng)域得到了廣泛的應(yīng)用。常見的生物特征識別技術(shù)包括指紋識別、人臉識別、虹膜識別等,這些技術(shù)在一定程度上滿足了人們對身份識別的需求,但也存在著各自的局限性。例如,指紋識別需要物理接觸,容易受到污漬、磨損等因素的影響;人臉識別對光線、姿態(tài)變化較為敏感,在遠(yuǎn)距離或低分辨率的情況下識別精度會大幅下降;虹膜識別則要求被識別者保持靜止且配合度高,設(shè)備成本也相對較高。步態(tài)識別作為一種新興的生物特征識別技術(shù),近年來逐漸嶄露頭角。它通過分析個(gè)體行走時(shí)的動態(tài)特征,如步長、步頻、身體擺動幅度、關(guān)節(jié)運(yùn)動軌跡等,來實(shí)現(xiàn)身份識別。與其他生物識別技術(shù)相比,步態(tài)識別具有獨(dú)特的優(yōu)勢。首先,步態(tài)識別具有非接觸性和遠(yuǎn)距離識別的能力。在遠(yuǎn)距離的情況下,當(dāng)其他生物特征難以獲取時(shí),步態(tài)是唯一可感知的生物特征。例如,在監(jiān)控場景中,即使目標(biāo)人物距離攝像頭較遠(yuǎn),或者面部被遮擋,也仍然可以通過分析其步態(tài)信息來進(jìn)行身份識別。這一特性使得步態(tài)識別在智能監(jiān)控、公共安全等領(lǐng)域具有巨大的應(yīng)用潛力,可以實(shí)現(xiàn)對人員的自動識別和追蹤,為防范犯罪、維護(hù)社會穩(wěn)定提供有力支持。其次,步態(tài)難以偽裝。個(gè)體的走路方式是長期形成的習(xí)慣,受到骨骼結(jié)構(gòu)、肌肉力量、神經(jīng)系統(tǒng)等多種因素的綜合影響,即使刻意改變,也難以完全掩蓋其獨(dú)特的步態(tài)特征,這為身份識別的準(zhǔn)確性和可靠性提供了保障。再者,步態(tài)識別的數(shù)據(jù)采集相對容易,只需通過普通攝像頭即可獲取行人的行走視頻,無需昂貴的專業(yè)設(shè)備,降低了應(yīng)用成本。步態(tài)識別技術(shù)在多個(gè)領(lǐng)域展現(xiàn)出了巨大的應(yīng)用價(jià)值。在安防領(lǐng)域,它可用于公共場所的監(jiān)控與預(yù)警。在機(jī)場、火車站、大型商場等人流量密集的場所,部署步態(tài)識別系統(tǒng)能夠?qū)崟r(shí)監(jiān)測人員的出入情況,快速識別出潛在的危險(xiǎn)人員,如通緝犯、可疑人員等,為安保人員提供及時(shí)的預(yù)警信息,有效提升公共場所的安全性。同時(shí),步態(tài)識別還可與其他安防技術(shù),如人臉識別、視頻監(jiān)控等相結(jié)合,形成多模態(tài)的安防體系,進(jìn)一步提高身份識別的準(zhǔn)確性和可靠性。在智能家居領(lǐng)域,步態(tài)識別技術(shù)能夠?qū)崿F(xiàn)更加智能化的家居控制。通過在家中安裝攝像頭或傳感器,采集家庭成員的步態(tài)信息,智能家居系統(tǒng)可以自動識別用戶身份,根據(jù)用戶的習(xí)慣和偏好來調(diào)整家居設(shè)備的設(shè)置,提供個(gè)性化的服務(wù)。在醫(yī)療領(lǐng)域,步態(tài)識別技術(shù)為疾病診斷和康復(fù)治療提供了新的手段。許多疾病,如帕金森病、中風(fēng)、關(guān)節(jié)炎等,會導(dǎo)致患者步態(tài)發(fā)生明顯變化。通過對患者步態(tài)特征的分析,醫(yī)生可以獲取有關(guān)疾病的信息,輔助疾病的早期診斷和病情評估。在康復(fù)治療過程中,步態(tài)識別技術(shù)可用于監(jiān)測患者的康復(fù)進(jìn)展,評估治療效果,為康復(fù)方案的調(diào)整提供數(shù)據(jù)支持。盡管步態(tài)識別技術(shù)具有諸多優(yōu)勢和廣闊的應(yīng)用前景,但目前仍面臨著一些挑戰(zhàn)和問題。例如,步態(tài)特征的提取和表達(dá)還不夠準(zhǔn)確和穩(wěn)定,容易受到個(gè)體外觀變化(如著裝、攜帶物品等)、拍攝視角、光照條件等因素的影響;步態(tài)識別算法的計(jì)算復(fù)雜度較高,實(shí)時(shí)性較差,難以滿足一些對實(shí)時(shí)性要求較高的應(yīng)用場景;不同數(shù)據(jù)集之間的差異較大,缺乏統(tǒng)一的標(biāo)準(zhǔn)數(shù)據(jù)集和評估指標(biāo),導(dǎo)致不同算法之間的性能比較存在困難。因此,深入研究基于角度及輪廓特征的步態(tài)識別方法,對于提高步態(tài)識別的準(zhǔn)確率和魯棒性,推動步態(tài)識別技術(shù)的發(fā)展和應(yīng)用具有重要的意義。通過對角度及輪廓特征的深入分析和挖掘,可以更準(zhǔn)確地描述個(gè)體的步態(tài)特征,提高步態(tài)識別系統(tǒng)對各種干擾因素的抵抗能力。同時(shí),研究高效的特征提取和匹配算法,能夠降低算法的計(jì)算復(fù)雜度,提高識別效率,使其更好地滿足實(shí)際應(yīng)用的需求。1.2國內(nèi)外研究現(xiàn)狀步態(tài)識別技術(shù)的研究最早可追溯到20世紀(jì)70年代,當(dāng)時(shí)的研究主要聚焦于步態(tài)特征的理論探索,嘗試從人體運(yùn)動學(xué)和生物力學(xué)的角度分析步態(tài)特征與個(gè)體身份之間的潛在聯(lián)系。然而,受限于當(dāng)時(shí)的計(jì)算機(jī)技術(shù)和圖像處理能力,相關(guān)研究進(jìn)展緩慢,僅停留在初步的理論分析階段,未能實(shí)現(xiàn)實(shí)際應(yīng)用。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展和數(shù)字圖像處理技術(shù)的不斷進(jìn)步,步態(tài)識別技術(shù)在20世紀(jì)90年代迎來了重要的發(fā)展契機(jī)。美國國防部高級研究計(jì)劃局(DARPA)率先開展了關(guān)于步態(tài)識別技術(shù)的研究項(xiàng)目,旨在開發(fā)一種能夠在遠(yuǎn)距離和復(fù)雜環(huán)境下進(jìn)行人員身份識別的技術(shù),以滿足軍事安防領(lǐng)域的需求。此后,英國、日本、以色列等國家也紛紛加入到步態(tài)識別技術(shù)的研究行列,推動了該技術(shù)在理論和算法方面的快速發(fā)展。在這一時(shí)期,基于輪廓的步態(tài)識別方法成為研究的熱點(diǎn),研究者們通過提取行人的輪廓信息來分析步態(tài)特征,如步態(tài)能量圖(GEI)等經(jīng)典算法被相繼提出,為步態(tài)識別技術(shù)的發(fā)展奠定了重要基礎(chǔ)。進(jìn)入21世紀(jì),隨著深度學(xué)習(xí)技術(shù)的興起,步態(tài)識別技術(shù)迎來了新的突破。深度學(xué)習(xí)強(qiáng)大的特征學(xué)習(xí)能力和對復(fù)雜數(shù)據(jù)的處理能力,為步態(tài)識別算法的性能提升提供了新的思路和方法。研究人員開始將深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等深度學(xué)習(xí)模型應(yīng)用于步態(tài)識別領(lǐng)域,通過大量的數(shù)據(jù)訓(xùn)練,讓模型自動學(xué)習(xí)步態(tài)特征,有效提高了識別準(zhǔn)確率和魯棒性。同時(shí),多模態(tài)數(shù)據(jù)融合技術(shù)也被引入到步態(tài)識別研究中,將步態(tài)信息與其他生物特征(如人臉識別、聲音識別等)或環(huán)境信息進(jìn)行融合,進(jìn)一步提升了識別系統(tǒng)的性能。在國內(nèi),步態(tài)識別技術(shù)的研究起步相對較晚,但發(fā)展迅速。中國科學(xué)院自動化研究所是國內(nèi)最早開展步態(tài)識別技術(shù)研究的機(jī)構(gòu)之一,在該領(lǐng)域取得了一系列具有國際影響力的研究成果。其研發(fā)的遠(yuǎn)距離步態(tài)識別系統(tǒng),在復(fù)雜背景、多樣姿態(tài)、不同尺度變化以及不同衣著等情況下,都能夠快速準(zhǔn)確地分割出人像并進(jìn)行身份識別,相關(guān)技術(shù)已在多個(gè)實(shí)際場景中得到應(yīng)用,為安防領(lǐng)域提供了強(qiáng)有力的支持。此外,清華大學(xué)、北京大學(xué)、上海交通大學(xué)等高校也在步態(tài)識別技術(shù)方面開展了深入研究,在特征提取、模型優(yōu)化、多模態(tài)融合等方面取得了顯著進(jìn)展。在基于角度及輪廓特征的研究方面,國內(nèi)外學(xué)者都進(jìn)行了大量的探索。在角度特征提取方面,研究人員通過對人體關(guān)節(jié)角度變化的分析,來挖掘個(gè)體獨(dú)特的步態(tài)信息。一些研究利用計(jì)算機(jī)視覺技術(shù)和運(yùn)動捕捉設(shè)備,精確測量人體在行走過程中髖關(guān)節(jié)、膝關(guān)節(jié)、踝關(guān)節(jié)等關(guān)鍵關(guān)節(jié)的角度變化,并將這些角度序列作為步態(tài)特征進(jìn)行識別。實(shí)驗(yàn)結(jié)果表明,基于角度特征的步態(tài)識別方法在一定程度上能夠有效區(qū)分不同個(gè)體,但該方法對設(shè)備要求較高,且易受人體遮擋和運(yùn)動噪聲的影響。在輪廓特征提取方面,基于輪廓的步態(tài)識別算法取得了豐富的成果。早期的研究主要采用傳統(tǒng)的圖像處理方法,如背景減除法、閾值分割法等,從行人的背景圖像中提取行人的輪廓。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的輪廓提取方法逐漸成為主流,如MaskR-CNN、Yolo等算法,能夠更加準(zhǔn)確地提取行人輪廓,并且對復(fù)雜背景和遮擋情況具有更好的魯棒性。在特征提取階段,常用的輪廓特征有時(shí)域特征、頻域特征、時(shí)頻域特征以及基于深度學(xué)習(xí)的高級語義特征等。例如,通過對輪廓圖像進(jìn)行傅里葉變換,提取頻域特征,或者利用卷積神經(jīng)網(wǎng)絡(luò)從輪廓圖像中學(xué)習(xí)具有區(qū)分性的語義特征,這些方法都在不同程度上提高了步態(tài)識別的準(zhǔn)確率。為了進(jìn)一步提高步態(tài)識別的性能,許多研究嘗試將角度特征和輪廓特征進(jìn)行融合。通過將兩種特征在特征層、匹配層或決策層進(jìn)行融合,可以充分發(fā)揮它們的互補(bǔ)性,提高識別系統(tǒng)對各種干擾因素的抵抗能力。一些研究在匹配層上融合下肢角度及人體輪廓特征,通過合理賦予權(quán)重,使兩種步態(tài)特征按較優(yōu)的比例進(jìn)行組合,實(shí)驗(yàn)結(jié)果表明,這種融合方法能夠顯著提高步態(tài)識別的準(zhǔn)確率。然而,特征融合也面臨著一些挑戰(zhàn),如如何選擇合適的融合策略、如何確定不同特征的權(quán)重等,這些問題仍有待進(jìn)一步研究解決。1.3研究目標(biāo)與創(chuàng)新點(diǎn)本研究旨在深入探究基于角度及輪廓特征的步態(tài)識別方法,以提升步態(tài)識別系統(tǒng)的準(zhǔn)確率和穩(wěn)定性,使其能夠更好地適應(yīng)復(fù)雜多變的實(shí)際應(yīng)用場景。具體而言,主要目標(biāo)包括:精確提取和有效表達(dá)角度及輪廓特征,提高特征的穩(wěn)定性和區(qū)分性;研究高效的特征融合算法,充分發(fā)揮角度特征和輪廓特征的互補(bǔ)優(yōu)勢,增強(qiáng)識別系統(tǒng)對個(gè)體外觀變化、拍攝視角、光照條件等干擾因素的抵抗能力;設(shè)計(jì)并實(shí)現(xiàn)一種高性能的步態(tài)識別模型,在保證識別準(zhǔn)確率的前提下,降低算法的計(jì)算復(fù)雜度,提高識別效率,滿足實(shí)時(shí)性要求;通過在公開數(shù)據(jù)集和實(shí)際場景中的實(shí)驗(yàn)驗(yàn)證,評估所提出方法的性能,并與現(xiàn)有方法進(jìn)行對比分析,證明其優(yōu)越性和有效性。在研究過程中,本研究將力求在以下幾個(gè)方面實(shí)現(xiàn)創(chuàng)新:提出新的特征提取方法:針對現(xiàn)有角度特征提取方法對設(shè)備要求高、易受遮擋和噪聲影響的問題,提出一種基于深度學(xué)習(xí)的多模態(tài)融合角度特征提取方法。該方法將結(jié)合視頻圖像信息和慣性傳感器數(shù)據(jù),利用深度學(xué)習(xí)模型自動學(xué)習(xí)人體關(guān)節(jié)角度在不同模態(tài)下的特征表示,從而更準(zhǔn)確地提取角度特征,提高特征的魯棒性。在輪廓特征提取方面,引入注意力機(jī)制和多尺度特征融合技術(shù),提出一種基于注意力多尺度卷積神經(jīng)網(wǎng)絡(luò)的輪廓特征提取方法。該方法能夠使模型更加關(guān)注輪廓圖像中的關(guān)鍵區(qū)域和細(xì)節(jié)信息,同時(shí)融合不同尺度的特征,增強(qiáng)特征的表達(dá)能力,有效提升對復(fù)雜背景和遮擋情況下輪廓特征的提取精度。創(chuàng)新特征融合策略:不同于傳統(tǒng)的簡單加權(quán)融合方式,提出一種基于自適應(yīng)加權(quán)和深度學(xué)習(xí)網(wǎng)絡(luò)的特征融合策略。該策略將根據(jù)不同特征在不同樣本和場景下的重要性,動態(tài)地調(diào)整角度特征和輪廓特征的融合權(quán)重。通過構(gòu)建一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)來學(xué)習(xí)融合權(quán)重,使其能夠自動適應(yīng)各種復(fù)雜情況,充分發(fā)揮兩種特征的互補(bǔ)性,提高步態(tài)識別的準(zhǔn)確率。設(shè)計(jì)新型步態(tài)識別模型:綜合考慮角度特征和輪廓特征的特點(diǎn),設(shè)計(jì)一種基于雙流卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的新型步態(tài)識別模型。其中,雙流卷積神經(jīng)網(wǎng)絡(luò)分別對角度特征和輪廓特征進(jìn)行處理,提取空間特征;循環(huán)神經(jīng)網(wǎng)絡(luò)則用于捕捉步態(tài)的時(shí)間序列特征,充分利用步態(tài)的動態(tài)信息。通過將兩種網(wǎng)絡(luò)結(jié)構(gòu)有機(jī)結(jié)合,能夠?qū)崿F(xiàn)對步態(tài)特征的全面、深入學(xué)習(xí),提高模型的識別性能。此外,在模型訓(xùn)練過程中,采用遷移學(xué)習(xí)和半監(jiān)督學(xué)習(xí)技術(shù),利用少量的標(biāo)注數(shù)據(jù)和大量的未標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,有效解決標(biāo)注數(shù)據(jù)不足的問題,同時(shí)加快模型的收斂速度,提高模型的泛化能力。二、步態(tài)識別基礎(chǔ)理論2.1步態(tài)識別系統(tǒng)架構(gòu)步態(tài)識別系統(tǒng)旨在通過分析個(gè)體行走時(shí)的動態(tài)特征來實(shí)現(xiàn)身份識別,其架構(gòu)主要涵蓋數(shù)據(jù)采集、預(yù)處理、特征提取以及分類識別這幾個(gè)關(guān)鍵環(huán)節(jié)。每個(gè)環(huán)節(jié)都緊密相連,前一個(gè)環(huán)節(jié)的輸出是后一個(gè)環(huán)節(jié)的輸入,任何一個(gè)環(huán)節(jié)出現(xiàn)問題都可能影響整個(gè)系統(tǒng)的性能。2.1.1數(shù)據(jù)采集數(shù)據(jù)采集是步態(tài)識別系統(tǒng)的首要環(huán)節(jié),其質(zhì)量直接影響后續(xù)處理和分析的準(zhǔn)確性。常見的數(shù)據(jù)采集設(shè)備包括攝像頭和傳感器,它們各自具有獨(dú)特的特點(diǎn)和適用場景。攝像頭是最常用的步態(tài)數(shù)據(jù)采集設(shè)備之一,其優(yōu)勢在于能夠直觀地記錄行人的行走過程,獲取包含豐富視覺信息的視頻數(shù)據(jù)。根據(jù)不同的功能和應(yīng)用場景,攝像頭可分為普通攝像頭、高清攝像頭、紅外攝像頭等。普通攝像頭成本較低,安裝簡便,適用于對圖像質(zhì)量要求不高的一般性監(jiān)控場景,如小區(qū)、學(xué)校等場所的安防監(jiān)控,可初步采集行人的步態(tài)信息。高清攝像頭則能夠提供更高分辨率的圖像,捕捉到更細(xì)微的細(xì)節(jié),對于準(zhǔn)確提取步態(tài)特征至關(guān)重要,常用于對識別精度要求較高的場合,如機(jī)場、銀行等重要區(qū)域的安全監(jiān)控。紅外攝像頭則具有獨(dú)特的優(yōu)勢,它可以在低光照或夜間環(huán)境下正常工作,通過感應(yīng)物體發(fā)出的紅外線來捕捉圖像,不受光線條件的限制,適用于24小時(shí)不間斷監(jiān)控的場景,如邊境監(jiān)控、停車場監(jiān)控等。在實(shí)際應(yīng)用中,多攝像頭系統(tǒng)還可通過不同角度的拍攝,獲取行人更全面的步態(tài)信息,提高識別的準(zhǔn)確性。例如,在智能安防監(jiān)控系統(tǒng)中,可在不同位置安裝多個(gè)攝像頭,從多個(gè)角度對行人進(jìn)行拍攝,然后將這些視頻數(shù)據(jù)進(jìn)行融合處理,從而更準(zhǔn)確地分析行人的步態(tài)特征。傳感器也是常用的步態(tài)數(shù)據(jù)采集設(shè)備,主要包括加速度傳感器、陀螺儀、慣性測量單元(IMU)等。加速度傳感器能夠測量物體在各個(gè)方向上的加速度變化,在步態(tài)識別中,可通過佩戴在人體上的加速度傳感器來采集行走時(shí)身體各部位的加速度信息,從而分析出步長、步頻等步態(tài)特征。陀螺儀則用于測量物體的角速度,可獲取人體在行走過程中的旋轉(zhuǎn)信息,為步態(tài)分析提供更多維度的數(shù)據(jù)支持。慣性測量單元?jiǎng)t集成了加速度傳感器和陀螺儀等多種傳感器,能夠同時(shí)測量加速度、角速度和磁場等多個(gè)物理量,提供更全面的運(yùn)動數(shù)據(jù),常用于可穿戴設(shè)備中,如智能手環(huán)、智能鞋墊等。這些可穿戴設(shè)備可以方便地佩戴在人體的關(guān)鍵部位,如腳踝、腰部、手腕等,實(shí)時(shí)采集步態(tài)數(shù)據(jù),且不受環(huán)境光線和遮擋的影響,適用于室內(nèi)外各種場景,如運(yùn)動監(jiān)測、康復(fù)訓(xùn)練等領(lǐng)域。例如,在醫(yī)療康復(fù)領(lǐng)域,患者在進(jìn)行康復(fù)訓(xùn)練時(shí),可以佩戴裝有傳感器的智能設(shè)備,醫(yī)生通過分析這些設(shè)備采集到的步態(tài)數(shù)據(jù),了解患者的康復(fù)進(jìn)展,調(diào)整康復(fù)方案。不同的數(shù)據(jù)采集設(shè)備在采集步態(tài)數(shù)據(jù)時(shí)也面臨著各自的挑戰(zhàn)。攝像頭采集的視頻數(shù)據(jù)容易受到光照條件、拍攝角度、遮擋等因素的影響。在光照不足的情況下,圖像會變得模糊,細(xì)節(jié)丟失,導(dǎo)致步態(tài)特征難以準(zhǔn)確提??;拍攝角度的變化會使行人的步態(tài)呈現(xiàn)出不同的形態(tài),增加了特征提取和識別的難度;當(dāng)行人被其他物體遮擋時(shí),部分步態(tài)信息會缺失,影響識別效果。傳感器雖然能夠獲取較為準(zhǔn)確的運(yùn)動數(shù)據(jù),但傳感器的佩戴位置和方式對數(shù)據(jù)質(zhì)量有較大影響,如果佩戴不牢固或位置不準(zhǔn)確,采集到的數(shù)據(jù)可能會出現(xiàn)偏差,從而影響步態(tài)分析的準(zhǔn)確性。此外,傳感器的精度和穩(wěn)定性也需要進(jìn)一步提高,以滿足高精度步態(tài)識別的需求。2.1.2預(yù)處理預(yù)處理是對采集到的原始數(shù)據(jù)進(jìn)行初步處理,以提高數(shù)據(jù)質(zhì)量,為后續(xù)的特征提取和分析提供可靠的數(shù)據(jù)基礎(chǔ)。常見的預(yù)處理操作包括降噪、歸一化等,這些操作對于去除數(shù)據(jù)中的噪聲干擾、使數(shù)據(jù)具有統(tǒng)一的尺度和分布具有重要意義,進(jìn)而顯著影響后續(xù)特征提取的效果。噪聲是數(shù)據(jù)采集過程中不可避免的問題,它會干擾步態(tài)特征的提取,降低識別準(zhǔn)確率。常見的噪聲來源包括環(huán)境噪聲、設(shè)備噪聲等。降噪的目的就是去除這些噪聲,使數(shù)據(jù)更加清晰、準(zhǔn)確。常用的降噪方法有均值濾波、中值濾波、高斯濾波等。均值濾波是一種簡單的線性濾波方法,它通過計(jì)算鄰域內(nèi)像素的平均值來替換當(dāng)前像素的值,從而達(dá)到平滑圖像、去除噪聲的目的。例如,對于一個(gè)3x3的均值濾波器,它會將中心像素周圍8個(gè)像素的灰度值與中心像素的灰度值相加,然后除以9,得到的結(jié)果作為中心像素的新灰度值。中值濾波則是一種非線性濾波方法,它將鄰域內(nèi)的像素值按照大小進(jìn)行排序,然后取中間值作為當(dāng)前像素的值,這種方法對于去除椒鹽噪聲等脈沖噪聲效果較好。高斯濾波是一種基于高斯函數(shù)的線性平滑濾波方法,它根據(jù)像素點(diǎn)與中心像素點(diǎn)的距離,賦予不同的權(quán)重,距離越近權(quán)重越大,通過對鄰域內(nèi)像素進(jìn)行加權(quán)平均來實(shí)現(xiàn)濾波,能夠有效地保留圖像的邊緣信息,在圖像降噪中應(yīng)用廣泛。在實(shí)際應(yīng)用中,需要根據(jù)噪聲的特點(diǎn)和數(shù)據(jù)的特性選擇合適的降噪方法。例如,對于圖像數(shù)據(jù)中存在的高斯噪聲,高斯濾波通常能夠取得較好的降噪效果;而對于椒鹽噪聲,中值濾波可能更為有效。歸一化是將數(shù)據(jù)映射到一個(gè)特定的范圍,使其具有統(tǒng)一的尺度和分布,便于后續(xù)的處理和分析。在步態(tài)識別中,常用的歸一化方法有最小-最大歸一化、Z-分?jǐn)?shù)歸一化等。最小-最大歸一化是將數(shù)據(jù)映射到[0,1]區(qū)間,其計(jì)算公式為:x_{norm}=\frac{x-x_{min}}{x_{max}-x_{min}},其中x為原始數(shù)據(jù),x_{min}和x_{max}分別為數(shù)據(jù)的最小值和最大值,x_{norm}為歸一化后的數(shù)據(jù)。這種方法簡單直觀,能夠保持?jǐn)?shù)據(jù)的相對大小關(guān)系,但對異常值比較敏感。Z-分?jǐn)?shù)歸一化則是將數(shù)據(jù)映射到均值為0、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布,其計(jì)算公式為:z=\frac{x-\mu}{\sigma},其中\(zhòng)mu為數(shù)據(jù)的均值,\sigma為數(shù)據(jù)的標(biāo)準(zhǔn)差。這種方法能夠消除數(shù)據(jù)的量綱影響,對異常值具有一定的魯棒性。在特征提取階段,歸一化后的數(shù)據(jù)能夠使不同特征具有相同的重要性,避免某些特征因?yàn)閿?shù)值較大而對模型訓(xùn)練產(chǎn)生過大的影響,從而提高模型的性能和穩(wěn)定性。例如,在使用支持向量機(jī)(SVM)進(jìn)行步態(tài)識別時(shí),如果特征數(shù)據(jù)沒有進(jìn)行歸一化,那么數(shù)值較大的特征可能會主導(dǎo)分類結(jié)果,而數(shù)值較小的特征則可能被忽略,通過歸一化可以使所有特征在分類過程中都能發(fā)揮應(yīng)有的作用。如果預(yù)處理操作不當(dāng),可能會導(dǎo)致數(shù)據(jù)信息的丟失或失真,從而影響后續(xù)特征提取的準(zhǔn)確性。過度降噪可能會平滑掉一些重要的步態(tài)細(xì)節(jié)特征,使提取到的特征無法準(zhǔn)確反映個(gè)體的真實(shí)步態(tài);歸一化參數(shù)選擇不合理,可能會使數(shù)據(jù)分布發(fā)生改變,導(dǎo)致特征之間的相關(guān)性被破壞,影響識別效果。因此,在進(jìn)行預(yù)處理時(shí),需要根據(jù)數(shù)據(jù)的特點(diǎn)和后續(xù)處理的要求,謹(jǐn)慎選擇預(yù)處理方法和參數(shù),確保數(shù)據(jù)的質(zhì)量和信息的完整性。2.1.3特征提取特征提取是步態(tài)識別系統(tǒng)的核心環(huán)節(jié)之一,其目的是從預(yù)處理后的數(shù)據(jù)中提取出能夠有效表征個(gè)體步態(tài)特征的信息。在基于角度及輪廓特征的步態(tài)識別方法中,角度特征和輪廓特征的提取各有其獨(dú)特的原理和常用技術(shù),不同技術(shù)在準(zhǔn)確性、魯棒性等方面存在差異。角度特征提取主要關(guān)注人體關(guān)節(jié)在行走過程中的角度變化,這些角度變化蘊(yùn)含著豐富的個(gè)體身份信息。其基本原理是基于人體運(yùn)動學(xué)和生物力學(xué)知識,通過分析人體關(guān)節(jié)的運(yùn)動軌跡來計(jì)算關(guān)節(jié)角度。常用的技術(shù)包括基于計(jì)算機(jī)視覺的方法和基于傳感器的方法。基于計(jì)算機(jī)視覺的方法利用攝像頭拍攝的視頻圖像,通過目標(biāo)檢測、關(guān)節(jié)點(diǎn)定位等技術(shù)來獲取人體關(guān)節(jié)的位置信息,進(jìn)而計(jì)算關(guān)節(jié)角度。例如,采用基于深度學(xué)習(xí)的人體姿態(tài)估計(jì)算法,如OpenPose等,能夠準(zhǔn)確地識別出人體的各個(gè)關(guān)節(jié)點(diǎn),并計(jì)算出關(guān)節(jié)之間的角度。這種方法的優(yōu)點(diǎn)是能夠直觀地從視覺圖像中獲取角度信息,無需額外的傳感器設(shè)備,但對圖像質(zhì)量和拍攝角度要求較高,容易受到遮擋和噪聲的影響?;趥鞲衅鞯姆椒▌t通過佩戴在人體關(guān)節(jié)部位的傳感器,如慣性測量單元(IMU),直接測量關(guān)節(jié)的角度變化。這種方法的優(yōu)點(diǎn)是測量精度高,不受光照和遮擋的影響,但傳感器的佩戴可能會給用戶帶來不便,且數(shù)據(jù)傳輸和處理需要一定的硬件支持。不同的角度特征提取技術(shù)在準(zhǔn)確性和魯棒性方面存在差異?;谟?jì)算機(jī)視覺的方法在圖像質(zhì)量較好、拍攝角度合適的情況下,能夠準(zhǔn)確地提取角度特征,但當(dāng)圖像出現(xiàn)模糊、遮擋或視角變化較大時(shí),其準(zhǔn)確性會受到明顯影響;基于傳感器的方法雖然精度較高,但由于傳感器的漂移和誤差等問題,長期使用時(shí)可能會出現(xiàn)累積誤差,影響魯棒性。輪廓特征提取則側(cè)重于從行人的輪廓圖像中提取能夠表征步態(tài)的特征信息。其基本原理是通過對行人輪廓的形狀、大小、運(yùn)動軌跡等進(jìn)行分析,提取出具有區(qū)分性的特征。常用的技術(shù)包括基于傳統(tǒng)圖像處理的方法和基于深度學(xué)習(xí)的方法?;趥鹘y(tǒng)圖像處理的方法主要利用邊緣檢測、形態(tài)學(xué)處理等技術(shù)來提取輪廓,然后通過傅里葉描述子、Hu矩等方法對輪廓進(jìn)行特征描述。例如,使用Canny邊緣檢測算法提取行人輪廓的邊緣,再利用傅里葉描述子將輪廓的形狀信息轉(zhuǎn)化為頻域特征,這些特征能夠反映輪廓的形狀和變化規(guī)律。基于深度學(xué)習(xí)的方法則通過構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)(CNN)等模型,讓模型自動學(xué)習(xí)輪廓圖像中的特征表示。例如,采用MaskR-CNN模型可以準(zhǔn)確地分割出行人的輪廓,并通過后續(xù)的卷積層和全連接層提取出高級語義特征?;趥鹘y(tǒng)圖像處理的方法原理簡單,計(jì)算效率較高,但對復(fù)雜背景和遮擋情況的適應(yīng)性較差,提取的特征往往缺乏足夠的區(qū)分性;基于深度學(xué)習(xí)的方法能夠自動學(xué)習(xí)到更具代表性的特征,對復(fù)雜背景和遮擋具有較好的魯棒性,但模型訓(xùn)練需要大量的數(shù)據(jù)和計(jì)算資源,且模型的可解釋性相對較差。2.1.4分類識別分類識別是步態(tài)識別系統(tǒng)的最后一個(gè)環(huán)節(jié),其任務(wù)是根據(jù)提取到的步態(tài)特征,將待識別的個(gè)體與已有的樣本進(jìn)行匹配,從而判斷其身份。常用的分類識別算法包括最近鄰分類器、支持向量機(jī)(SVM)等,它們在步態(tài)識別中有著不同的應(yīng)用方式和效果。最近鄰分類器是一種簡單直觀的分類算法,其基本思想是在特征空間中找到與待識別樣本距離最近的已知樣本,將待識別樣本歸類為該最近樣本所屬的類別。在步態(tài)識別中,通常使用歐氏距離、馬氏距離等作為距離度量方式。例如,對于兩個(gè)步態(tài)特征向量X=(x_1,x_2,\cdots,x_n)和Y=(y_1,y_2,\cdots,y_n),它們的歐氏距離計(jì)算公式為:d(X,Y)=\sqrt{\sum_{i=1}^{n}(x_i-y_i)^2}。在實(shí)際應(yīng)用中,首先計(jì)算待識別樣本與訓(xùn)練集中所有樣本的距離,然后選擇距離最小的樣本的類別作為待識別樣本的類別。最近鄰分類器的優(yōu)點(diǎn)是算法簡單,易于實(shí)現(xiàn),不需要進(jìn)行復(fù)雜的模型訓(xùn)練;但其缺點(diǎn)也很明顯,計(jì)算量較大,當(dāng)訓(xùn)練樣本數(shù)量較多時(shí),計(jì)算距離的時(shí)間開銷會很大,而且對樣本的分布比較敏感,如果訓(xùn)練樣本分布不均勻,容易出現(xiàn)分類錯(cuò)誤。支持向量機(jī)(SVM)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的分類算法,它通過尋找一個(gè)最優(yōu)分類超平面,將不同類別的樣本盡可能地分開。在步態(tài)識別中,SVM通常用于二分類問題,如果要處理多分類問題,可以采用“一對多”或“一對一”等策略將其轉(zhuǎn)化為多個(gè)二分類問題。SVM的核心思想是將低維的輸入空間通過核函數(shù)映射到高維的特征空間,使得在低維空間中線性不可分的樣本在高維特征空間中變得線性可分。常用的核函數(shù)有線性核、多項(xiàng)式核、徑向基核(RBF)等。例如,對于一個(gè)二分類問題,假設(shè)訓(xùn)練樣本集為\{(x_i,y_i)\}_{i=1}^{n},其中x_i為特征向量,y_i\in\{-1,1\}為類別標(biāo)簽,SVM的目標(biāo)是找到一個(gè)超平面w^Tx+b=0,使得兩類樣本到超平面的間隔最大。通過求解優(yōu)化問題,可以得到超平面的參數(shù)w和b,從而實(shí)現(xiàn)對新樣本的分類。SVM在步態(tài)識別中具有較好的性能,能夠處理非線性分類問題,對小樣本數(shù)據(jù)也有較好的泛化能力;但它對核函數(shù)的選擇和參數(shù)調(diào)整比較敏感,需要通過大量的實(shí)驗(yàn)來確定最優(yōu)的參數(shù)組合。2.2角度及輪廓特征相關(guān)原理2.2.1角度特征原理在人體行走過程中,各個(gè)關(guān)節(jié)的角度變化呈現(xiàn)出特定的規(guī)律,這些規(guī)律蘊(yùn)含著豐富的個(gè)體身份信息。從運(yùn)動學(xué)角度來看,行走是一個(gè)復(fù)雜的周期性運(yùn)動,涉及多個(gè)關(guān)節(jié)的協(xié)同運(yùn)動。以髖關(guān)節(jié)為例,在一個(gè)完整的步態(tài)周期中,髖關(guān)節(jié)的角度變化經(jīng)歷了多個(gè)階段。在擺動初期,髖關(guān)節(jié)屈曲,角度逐漸增大,使腿部向前擺動;在擺動中期,髖關(guān)節(jié)繼續(xù)保持一定的屈曲角度,以維持腿部的運(yùn)動速度和穩(wěn)定性;在擺動末期,髖關(guān)節(jié)開始伸展,角度逐漸減小,為落地做準(zhǔn)備。在支撐期,髖關(guān)節(jié)承受著身體的重量,角度會根據(jù)身體的平衡和運(yùn)動需求進(jìn)行相應(yīng)的調(diào)整。同樣,膝關(guān)節(jié)和踝關(guān)節(jié)在行走過程中也有著類似的周期性角度變化。膝關(guān)節(jié)在擺動期先屈曲再伸展,踝關(guān)節(jié)則在背屈和跖屈之間交替變化。這些關(guān)節(jié)角度的變化相互協(xié)調(diào),共同完成行走動作,并且每個(gè)人的關(guān)節(jié)角度變化模式都具有獨(dú)特性,受到骨骼結(jié)構(gòu)、肌肉力量、神經(jīng)系統(tǒng)控制等多種因素的影響?;谏鲜鲈?,我們可以通過提取這些關(guān)節(jié)角度變化特征來實(shí)現(xiàn)個(gè)體身份的區(qū)分。在實(shí)際操作中,首先需要確定用于分析的關(guān)鍵關(guān)節(jié),如髖關(guān)節(jié)、膝關(guān)節(jié)、踝關(guān)節(jié)等,這些關(guān)節(jié)在行走過程中角度變化明顯,對步態(tài)特征的貢獻(xiàn)較大。然后,利用合適的技術(shù)手段獲取這些關(guān)節(jié)在行走過程中的角度數(shù)據(jù)。基于計(jì)算機(jī)視覺的方法,通過攝像頭拍攝行人的行走視頻,利用人體姿態(tài)估計(jì)算法,如OpenPose算法,能夠準(zhǔn)確地識別出人體的關(guān)節(jié)點(diǎn)位置,進(jìn)而根據(jù)關(guān)節(jié)點(diǎn)之間的相對位置關(guān)系計(jì)算出關(guān)節(jié)角度?;趥鞲衅鞯姆椒?,則是通過在人體關(guān)節(jié)部位佩戴慣性測量單元(IMU)等傳感器,直接測量關(guān)節(jié)的角度變化。獲取關(guān)節(jié)角度數(shù)據(jù)后,將其表示為時(shí)間序列,例如,以一定的時(shí)間間隔(如0.01秒)記錄每個(gè)關(guān)節(jié)在每個(gè)時(shí)刻的角度值,形成一個(gè)時(shí)間-角度序列。這個(gè)序列能夠直觀地反映出關(guān)節(jié)角度隨時(shí)間的變化情況,包含了豐富的步態(tài)信息。為了進(jìn)一步提高特征的區(qū)分性,可以對時(shí)間序列進(jìn)行一些處理,如計(jì)算角度變化率、角度加速度等衍生特征。角度變化率能夠反映關(guān)節(jié)角度變化的快慢,而角度加速度則能體現(xiàn)角度變化的加速度情況,這些衍生特征可以從不同角度描述步態(tài)特征,增強(qiáng)特征的表達(dá)能力。2.2.2輪廓特征原理從圖像中提取人體輪廓是基于輪廓特征的步態(tài)識別的基礎(chǔ)。常見的人體輪廓提取方法主要包括基于傳統(tǒng)圖像處理的方法和基于深度學(xué)習(xí)的方法?;趥鹘y(tǒng)圖像處理的方法,通常首先利用背景減除法從視頻圖像中分離出前景的人體目標(biāo)。背景減除法的原理是通過建立背景模型,將當(dāng)前幀圖像與背景模型進(jìn)行差分運(yùn)算,從而得到前景運(yùn)動目標(biāo)。常用的背景建模方法有高斯混合模型(GMM),它通過多個(gè)高斯分布的加權(quán)和來擬合背景像素的分布,能夠較好地適應(yīng)背景的動態(tài)變化。在得到前景人體目標(biāo)后,利用邊緣檢測算法,如Canny邊緣檢測算法,提取人體的邊緣信息。Canny邊緣檢測算法通過計(jì)算圖像的梯度幅值和方向,采用非極大值抑制和雙閾值檢測等步驟,能夠準(zhǔn)確地檢測出圖像中的邊緣。接著,通過形態(tài)學(xué)處理,如膨脹、腐蝕等操作,對邊緣圖像進(jìn)行優(yōu)化,填補(bǔ)邊緣的空洞,去除噪聲干擾,得到更完整、準(zhǔn)確的人體輪廓。膨脹操作可以使邊緣向外擴(kuò)張,填補(bǔ)小的空洞;腐蝕操作則可以去除邊緣的噪聲點(diǎn),使邊緣更加平滑。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的人體輪廓提取方法逐漸成為主流。其中,MaskR-CNN是一種非常有效的實(shí)例分割算法,它在FasterR-CNN的基礎(chǔ)上增加了一個(gè)分支,用于預(yù)測目標(biāo)的掩模(mask),從而能夠準(zhǔn)確地分割出人體輪廓。MaskR-CNN首先通過卷積神經(jīng)網(wǎng)絡(luò)(CNN)對輸入圖像進(jìn)行特征提取,然后利用區(qū)域提議網(wǎng)絡(luò)(RPN)生成可能包含人體目標(biāo)的候選區(qū)域。接著,對這些候選區(qū)域進(jìn)行分類和回歸,同時(shí)預(yù)測出每個(gè)候選區(qū)域內(nèi)人體的掩模。在特征提取階段,CNN可以學(xué)習(xí)到圖像中豐富的語義信息,使得提取的人體輪廓更加準(zhǔn)確,對復(fù)雜背景和遮擋情況具有更好的魯棒性。提取到人體輪廓后,可利用輪廓的形狀、大小、變化等特征進(jìn)行身份識別。從形狀特征來看,人體輪廓的形狀在行走過程中會發(fā)生周期性的變化,不同個(gè)體的這種變化模式具有一定的差異性。可以通過計(jì)算輪廓的周長、面積、長寬比等幾何參數(shù)來描述輪廓的形狀特征。在一個(gè)步態(tài)周期內(nèi),人體輪廓的周長和面積會隨著腿部的擺動、身體的起伏而發(fā)生變化,通過分析這些參數(shù)的變化規(guī)律,可以提取出具有區(qū)分性的特征。輪廓的變化特征也是重要的識別依據(jù)。在行走過程中,人體輪廓的動態(tài)變化反映了個(gè)體的行走習(xí)慣和方式??梢酝ㄟ^分析輪廓的時(shí)間序列變化,如輪廓的位移、旋轉(zhuǎn)、變形等,來提取動態(tài)特征。通過計(jì)算相鄰幀之間輪廓的位移向量,能夠反映出人體在行走過程中的移動方向和速度變化;分析輪廓的旋轉(zhuǎn)角度變化,可以了解人體在行走時(shí)身體的扭轉(zhuǎn)情況。三、基于角度特征的步態(tài)識別方法3.1角度特征提取方法3.1.1基于關(guān)節(jié)點(diǎn)定位的角度提取在人體行走過程中,關(guān)節(jié)角度的變化蘊(yùn)含著豐富的個(gè)體身份信息,基于關(guān)節(jié)點(diǎn)定位的角度提取方法是實(shí)現(xiàn)步態(tài)識別的關(guān)鍵步驟之一。該方法以人體解剖學(xué)知識為依據(jù),通過特定算法定位關(guān)節(jié)點(diǎn),進(jìn)而計(jì)算關(guān)節(jié)角度。人體解剖學(xué)知識為關(guān)節(jié)點(diǎn)定位提供了重要的理論基礎(chǔ)。人體的骨骼結(jié)構(gòu)和關(guān)節(jié)連接方式?jīng)Q定了關(guān)節(jié)點(diǎn)的位置和運(yùn)動范圍。在下肢,髖關(guān)節(jié)是連接軀干和下肢的重要關(guān)節(jié),它由髖臼和股骨頭組成,能夠進(jìn)行屈伸、內(nèi)收外展、旋轉(zhuǎn)等多種運(yùn)動;膝關(guān)節(jié)則是人體最大、最復(fù)雜的關(guān)節(jié)之一,由股骨、脛骨和髕骨組成,主要進(jìn)行屈伸運(yùn)動,在行走過程中起著承上啟下的作用;踝關(guān)節(jié)由脛骨、腓骨和距骨組成,負(fù)責(zé)足的背屈、跖屈以及內(nèi)翻、外翻等運(yùn)動。這些關(guān)節(jié)在行走過程中的協(xié)同運(yùn)動,形成了獨(dú)特的步態(tài)模式。利用圖像特征匹配技術(shù)定位關(guān)節(jié)點(diǎn)是一種常用的方法。該方法首先需要建立關(guān)節(jié)點(diǎn)的模板庫,模板庫中的模板可以通過對大量人體樣本的關(guān)節(jié)點(diǎn)進(jìn)行標(biāo)注和統(tǒng)計(jì)得到。在實(shí)際應(yīng)用中,對于輸入的行人圖像,通過計(jì)算圖像中的特征與模板庫中關(guān)節(jié)點(diǎn)模板的相似度,來確定關(guān)節(jié)點(diǎn)的位置。例如,使用尺度不變特征變換(SIFT)算法提取圖像中的特征點(diǎn),SIFT特征具有尺度不變性、旋轉(zhuǎn)不變性和光照不變性等優(yōu)點(diǎn),能夠在不同尺度、旋轉(zhuǎn)和光照條件下準(zhǔn)確地描述圖像特征。將提取到的特征點(diǎn)與關(guān)節(jié)點(diǎn)模板進(jìn)行匹配,通過匹配的特征點(diǎn)來定位關(guān)節(jié)點(diǎn)的位置。這種方法在圖像質(zhì)量較好、背景相對簡單的情況下,能夠取得較好的定位效果,但對于復(fù)雜背景和遮擋情況,匹配的準(zhǔn)確性會受到影響。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的關(guān)節(jié)點(diǎn)定位方法逐漸成為主流。以O(shè)penPose算法為例,它是一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的人體姿態(tài)估計(jì)模型。該模型首先通過一系列卷積層對輸入圖像進(jìn)行特征提取,得到圖像的特征表示。這些卷積層能夠自動學(xué)習(xí)圖像中的各種特征,包括人體的輪廓、紋理等信息。接著,利用部分親和場(PAFs)來表示人體關(guān)節(jié)之間的連接關(guān)系。PAFs是一種二維向量場,通過對圖像特征的分析,能夠準(zhǔn)確地描述人體各個(gè)關(guān)節(jié)之間的相對位置和方向關(guān)系。在訓(xùn)練過程中,OpenPose模型通過大量的標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí),不斷調(diào)整模型的參數(shù),使得模型能夠準(zhǔn)確地預(yù)測人體關(guān)節(jié)點(diǎn)的位置。在測試階段,將待檢測的行人圖像輸入到訓(xùn)練好的OpenPose模型中,模型即可輸出人體關(guān)節(jié)點(diǎn)的坐標(biāo)。這種基于深度學(xué)習(xí)的方法對復(fù)雜背景和遮擋情況具有較好的魯棒性,能夠在各種場景下準(zhǔn)確地定位關(guān)節(jié)點(diǎn)。在確定關(guān)節(jié)點(diǎn)位置后,即可計(jì)算關(guān)節(jié)角度。以髖關(guān)節(jié)、膝關(guān)節(jié)和踝關(guān)節(jié)為例,假設(shè)已經(jīng)通過上述方法獲取了這三個(gè)關(guān)節(jié)在某一時(shí)刻的坐標(biāo)分別為H(x_{H},y_{H})、K(x_{K},y_{K})和A(x_{A},y_{A})。則可以利用向量運(yùn)算來計(jì)算關(guān)節(jié)角度,首先計(jì)算向量\overrightarrow{HK}=(x_{K}-x_{H},y_{K}-y_{H})和\overrightarrow{KA}=(x_{A}-x_{K},y_{A}-y_{K}),然后根據(jù)向量的點(diǎn)積公式\overrightarrow{a}\cdot\overrightarrow=|\overrightarrow{a}|\times|\overrightarrow|\times\cos\theta,其中\(zhòng)theta為兩向量的夾角,可得到膝關(guān)節(jié)角度\theta_{K}的計(jì)算公式為\cos\theta_{K}=\frac{\overrightarrow{HK}\cdot\overrightarrow{KA}}{|\overrightarrow{HK}|\times|\overrightarrow{KA}|},進(jìn)而通過反余弦函數(shù)\theta_{K}=\arccos(\frac{\overrightarrow{HK}\cdot\overrightarrow{KA}}{|\overrightarrow{HK}|\times|\overrightarrow{KA}|})計(jì)算出膝關(guān)節(jié)角度。同理,可以計(jì)算出髖關(guān)節(jié)角度\theta_{H}和踝關(guān)節(jié)角度\theta_{A}。通過對這些關(guān)節(jié)角度在時(shí)間序列上的變化進(jìn)行分析,可以提取出豐富的步態(tài)特征,為后續(xù)的步態(tài)識別提供數(shù)據(jù)支持。3.1.2基于運(yùn)動軌跡分析的角度提取人體運(yùn)動軌跡分析是步態(tài)識別領(lǐng)域中的重要研究方向,通過對人體在行走過程中各部位的運(yùn)動軌跡進(jìn)行深入剖析,可以獲取到蘊(yùn)含個(gè)體獨(dú)特信息的角度特征。在行走過程中,腿部和手臂的運(yùn)動軌跡呈現(xiàn)出特定的模式,這些模式與個(gè)體的身體結(jié)構(gòu)、運(yùn)動習(xí)慣等因素密切相關(guān),因此可以作為身份識別的重要依據(jù)。在分析腿部運(yùn)動軌跡時(shí),通常會關(guān)注其在水平和垂直方向上的位移變化。以腿部的擺動為例,在一個(gè)完整的步態(tài)周期中,腿部從后向前擺動,再從前往后擺動回到初始位置。在水平方向上,腿部的位移隨著時(shí)間的變化呈現(xiàn)出一定的周期性??梢酝ㄟ^對連續(xù)視頻幀中腿部關(guān)鍵點(diǎn)(如膝關(guān)節(jié)、踝關(guān)節(jié)等)的位置進(jìn)行跟蹤,獲取這些關(guān)鍵點(diǎn)在水平方向上的坐標(biāo)序列。通過對這些坐標(biāo)序列進(jìn)行分析,計(jì)算相鄰幀之間的位移差,從而得到腿部在水平方向上的運(yùn)動速度。在垂直方向上,腿部的高度也會隨著行走而發(fā)生變化,在擺動階段,腿部會抬高,然后在落地階段下降。通過分析垂直方向上的位移變化,可以得到腿部在垂直方向上的運(yùn)動幅度和速度變化情況。這些水平和垂直方向上的位移變化信息,能夠反映出個(gè)體行走時(shí)腿部的運(yùn)動模式,不同個(gè)體之間的這些模式往往存在差異。在獲取腿部運(yùn)動軌跡信息后,即可從中提取相關(guān)角度特征。一種常用的方法是計(jì)算腿部在不同時(shí)刻與垂直方向或水平方向的夾角。假設(shè)在某一時(shí)刻,通過跟蹤得到膝關(guān)節(jié)的位置坐標(biāo)為(x_{k},y_{k}),踝關(guān)節(jié)的位置坐標(biāo)為(x_{a},y_{a}),以垂直方向?yàn)榛鶞?zhǔn),計(jì)算腿部與垂直方向的夾角\theta。首先計(jì)算向量\overrightarrow{ka}=(x_{a}-x_{k},y_{a}-y_{k}),然后根據(jù)向量與垂直方向的夾角公式\tan\theta=\frac{x_{a}-x_{k}}{y_{a}-y_{k}},得到\theta=\arctan(\frac{x_{a}-x_{k}}{y_{a}-y_{k}})。通過計(jì)算不同時(shí)刻的夾角\theta,可以得到一個(gè)角度隨時(shí)間變化的序列,這個(gè)序列包含了腿部運(yùn)動的角度信息,不同個(gè)體的這個(gè)序列具有獨(dú)特性,可作為步態(tài)識別的角度特征。除了計(jì)算與垂直方向的夾角,還可以計(jì)算腿部在擺動過程中的彎曲角度,如膝關(guān)節(jié)的彎曲角度。通過計(jì)算膝關(guān)節(jié)在不同時(shí)刻的角度變化,能夠反映出個(gè)體行走時(shí)腿部的彎曲程度和變化規(guī)律,進(jìn)一步豐富了角度特征信息。手臂在行走過程中也會有規(guī)律地?cái)[動,其運(yùn)動軌跡同樣蘊(yùn)含著個(gè)體的步態(tài)信息。手臂的擺動與腿部的運(yùn)動相互協(xié)調(diào),共同維持身體的平衡和行走的穩(wěn)定性。手臂的擺動幅度、頻率以及擺動的軌跡形狀等,都因人而異。在分析手臂運(yùn)動軌跡時(shí),可以選擇手臂上的關(guān)鍵部位,如肩部、肘部和手腕作為跟蹤點(diǎn)。通過對這些跟蹤點(diǎn)在視頻幀中的位置進(jìn)行跟蹤,獲取它們在三維空間中的運(yùn)動軌跡。在實(shí)際應(yīng)用中,可以使用基于計(jì)算機(jī)視覺的目標(biāo)跟蹤算法,如卡爾曼濾波算法、粒子濾波算法等,對這些關(guān)鍵點(diǎn)進(jìn)行實(shí)時(shí)跟蹤??柭鼮V波算法是一種常用的線性濾波算法,它通過預(yù)測和更新兩個(gè)步驟,能夠根據(jù)前一時(shí)刻的狀態(tài)和當(dāng)前的觀測數(shù)據(jù),對目標(biāo)的位置、速度等狀態(tài)進(jìn)行最優(yōu)估計(jì),在手臂關(guān)鍵點(diǎn)跟蹤中能夠有效地減少噪聲的影響,提高跟蹤的準(zhǔn)確性。粒子濾波算法則是一種基于蒙特卡羅方法的非線性濾波算法,它通過大量的粒子來表示目標(biāo)的狀態(tài)分布,能夠處理復(fù)雜的非線性和非高斯問題,在手臂運(yùn)動軌跡分析中,對于手臂姿態(tài)變化較大的情況具有較好的適應(yīng)性。通過對這些跟蹤點(diǎn)的運(yùn)動軌跡進(jìn)行分析,可以提取出手臂的擺動角度等特征。以肩部和肘部為例,假設(shè)在某一時(shí)刻,肩部的坐標(biāo)為(x_{s},y_{s},z_{s}),肘部的坐標(biāo)為(x_{e},y_{e},z_{e}),計(jì)算手臂與身體中軸線的夾角\alpha。首先構(gòu)建向量\overrightarrow{se}=(x_{e}-x_{s},y_{e}-y_{s},z_{e}-z_{s}),然后根據(jù)向量與身體中軸線的夾角計(jì)算公式,通過向量運(yùn)算得到夾角\alpha的值。通過分析不同時(shí)刻手臂的擺動角度變化,可以得到手臂擺動的角度特征序列,這些特征序列反映了個(gè)體行走時(shí)手臂的運(yùn)動習(xí)慣和特點(diǎn),對于步態(tài)識別具有重要的參考價(jià)值。例如,有些人在行走時(shí)手臂擺動幅度較大,而有些人則擺動幅度較小,通過分析手臂擺動角度特征,可以有效地識別出這些個(gè)體差異。3.2基于角度特征的識別算法3.2.1動態(tài)時(shí)間規(guī)整(DTW)算法在角度特征中的應(yīng)用動態(tài)時(shí)間規(guī)整(DTW)算法是一種用于計(jì)算兩個(gè)時(shí)間序列相似度的經(jīng)典算法,在步態(tài)識別中,尤其是基于角度特征的識別中,具有重要的應(yīng)用價(jià)值。其核心思想是通過動態(tài)規(guī)劃的方法,尋找兩條長度可能不同的時(shí)間序列之間的最優(yōu)匹配路徑,從而計(jì)算它們的相似度。在基于角度特征的步態(tài)識別中,我們通常將人體關(guān)節(jié)的角度變化表示為時(shí)間序列。假設(shè)有兩個(gè)不同個(gè)體的步態(tài)序列,分別記為序列A和序列B,序列A的角度特征序列為a_1,a_2,\cdots,a_m,序列B的角度特征序列為b_1,b_2,\cdots,b_n,其中m和n分別為兩個(gè)序列的長度,且m不一定等于n。由于不同個(gè)體的行走速度、節(jié)奏等可能存在差異,直接對這兩個(gè)序列進(jìn)行逐點(diǎn)比較是不合理的。DTW算法的優(yōu)勢就在于它能夠解決這種時(shí)間序列長度不一致的問題,通過動態(tài)規(guī)劃的方式,在不同長度的時(shí)間序列之間找到最佳的匹配關(guān)系。DTW算法的實(shí)現(xiàn)過程主要包括以下幾個(gè)步驟。首先,構(gòu)建一個(gè)m\timesn的距離矩陣D,矩陣中的每個(gè)元素D(i,j)表示序列A中第i個(gè)角度值a_i與序列B中第j個(gè)角度值b_j之間的距離,通??梢允褂脷W氏距離來計(jì)算,即D(i,j)=\sqrt{(a_i-b_j)^2}。接著,利用動態(tài)規(guī)劃的方法計(jì)算累積距離矩陣C。C(i,j)表示從序列A的起始點(diǎn)到第i個(gè)點(diǎn),以及從序列B的起始點(diǎn)到第j個(gè)點(diǎn)之間的最優(yōu)匹配路徑的累積距離。其遞推公式為:C(i,j)=D(i,j)+\min\{C(i-1,j),C(i,j-1),C(i-1,j-1)\},其中C(1,1)=D(1,1),C(i,0)=\infty,C(0,j)=\infty。通過這個(gè)遞推公式,從矩陣的左上角開始,逐步計(jì)算每個(gè)元素的值,直到計(jì)算出右下角的C(m,n)。最后,從累積距離矩陣C的右下角開始,通過回溯的方式找到最優(yōu)匹配路徑?;厮莸囊?guī)則是根據(jù)C(i,j)的最小值來源來確定,例如,如果C(i,j)的最小值是由C(i-1,j)得到的,那么回溯到(i-1,j);如果是由C(i,j-1)得到的,回溯到(i,j-1);如果是由C(i-1,j-1)得到的,回溯到(i-1,j-1)。沿著回溯的路徑,可以得到兩個(gè)序列之間的最優(yōu)匹配關(guān)系,而C(m,n)的值則表示這兩個(gè)序列的相似度,值越小,說明兩個(gè)序列越相似。在實(shí)際應(yīng)用中,DTW算法在基于角度特征的步態(tài)識別中展現(xiàn)出了一定的優(yōu)勢。它能夠有效地處理不同個(gè)體行走速度和節(jié)奏差異導(dǎo)致的時(shí)間序列長度不一致問題,通過動態(tài)規(guī)劃找到最優(yōu)匹配路徑,使得即使兩個(gè)步態(tài)序列的長度不同,也能準(zhǔn)確地計(jì)算它們之間的相似度。在某些情況下,一個(gè)人可能走得快一些,另一個(gè)人走得慢一些,但他們的步態(tài)特征本質(zhì)上是相似的,DTW算法能夠忽略速度差異,準(zhǔn)確地匹配他們的角度特征序列,從而實(shí)現(xiàn)準(zhǔn)確的身份識別。DTW算法的計(jì)算過程相對簡單,不需要復(fù)雜的數(shù)學(xué)模型和大量的訓(xùn)練數(shù)據(jù),易于實(shí)現(xiàn)和應(yīng)用。然而,DTW算法也存在一些局限性。該算法對噪聲較為敏感,如果角度特征序列中存在噪聲干擾,例如由于傳感器誤差或圖像噪聲導(dǎo)致的角度測量偏差,DTW算法可能會將噪聲點(diǎn)誤判為有效特征點(diǎn),從而影響匹配結(jié)果的準(zhǔn)確性。DTW算法的計(jì)算復(fù)雜度較高,其時(shí)間復(fù)雜度為O(m\timesn),當(dāng)序列長度m和n較大時(shí),計(jì)算量會顯著增加,導(dǎo)致識別效率降低,難以滿足實(shí)時(shí)性要求較高的應(yīng)用場景。DTW算法在處理復(fù)雜步態(tài)模式時(shí),可能無法準(zhǔn)確捕捉到一些細(xì)微的特征差異,因?yàn)樗饕P(guān)注的是整體的時(shí)間序列匹配,對于局部的特征變化不夠敏感,這在一定程度上限制了其在復(fù)雜場景下的應(yīng)用效果。3.2.2機(jī)器學(xué)習(xí)算法結(jié)合角度特征的識別機(jī)器學(xué)習(xí)算法在步態(tài)識別領(lǐng)域得到了廣泛應(yīng)用,通過將角度特征作為輸入,結(jié)合不同的機(jī)器學(xué)習(xí)算法進(jìn)行模型訓(xùn)練和分類識別,可以實(shí)現(xiàn)高效準(zhǔn)確的身份識別。以下將以支持向量機(jī)(SVM)和神經(jīng)網(wǎng)絡(luò)為例,詳細(xì)介紹其在基于角度特征的步態(tài)識別中的應(yīng)用及性能表現(xiàn)。支持向量機(jī)(SVM)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的分類算法,在步態(tài)識別中具有獨(dú)特的優(yōu)勢。其基本原理是通過尋找一個(gè)最優(yōu)分類超平面,將不同類別的樣本盡可能地分開。在基于角度特征的步態(tài)識別中,首先將提取到的角度特征作為SVM的輸入特征向量。假設(shè)我們有N個(gè)訓(xùn)練樣本,每個(gè)樣本的角度特征向量可以表示為x_i=(x_{i1},x_{i2},\cdots,x_{id}),其中i=1,2,\cdots,N,d為特征向量的維度,即角度特征的數(shù)量。每個(gè)樣本都對應(yīng)一個(gè)類別標(biāo)簽y_i\in\{-1,1\},表示該樣本所屬的類別(例如,-1表示非目標(biāo)個(gè)體,1表示目標(biāo)個(gè)體)。SVM的目標(biāo)是找到一個(gè)超平面w^Tx+b=0,使得兩類樣本到超平面的間隔最大。這里的w是超平面的法向量,b是偏置項(xiàng)。為了找到最優(yōu)的w和b,SVM通過求解一個(gè)二次規(guī)劃問題來實(shí)現(xiàn),即最大化間隔\frac{2}{\|w\|},同時(shí)滿足約束條件y_i(w^Tx_i+b)\geq1,i=1,2,\cdots,N。在實(shí)際應(yīng)用中,由于步態(tài)特征往往是非線性可分的,因此通常會引入核函數(shù),將低維的輸入空間映射到高維的特征空間,使得在低維空間中線性不可分的樣本在高維特征空間中變得線性可分。常用的核函數(shù)有線性核、多項(xiàng)式核、徑向基核(RBF)等。線性核函數(shù)直接計(jì)算兩個(gè)特征向量的內(nèi)積,即K(x_i,x_j)=x_i^Tx_j,適用于特征向量本身線性可分的情況;多項(xiàng)式核函數(shù)K(x_i,x_j)=(x_i^Tx_j+1)^p,其中p為多項(xiàng)式的次數(shù),能夠處理一定程度的非線性問題;徑向基核函數(shù)K(x_i,x_j)=\exp(-\gamma\|x_i-x_j\|^2),其中\(zhòng)gamma為核函數(shù)的參數(shù),對非線性問題具有很強(qiáng)的處理能力,在步態(tài)識別中應(yīng)用較為廣泛。通過選擇合適的核函數(shù)和調(diào)整參數(shù),SVM能夠有效地對基于角度特征的步態(tài)樣本進(jìn)行分類識別。神經(jīng)網(wǎng)絡(luò)是一類模擬生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能的計(jì)算模型,在步態(tài)識別中也展現(xiàn)出了強(qiáng)大的性能。以多層感知機(jī)(MLP)為例,它是一種最簡單的前饋神經(jīng)網(wǎng)絡(luò),由輸入層、隱藏層和輸出層組成。在基于角度特征的步態(tài)識別中,輸入層接收提取到的角度特征向量,隱藏層通過一系列神經(jīng)元對輸入特征進(jìn)行非線性變換,學(xué)習(xí)特征之間的復(fù)雜關(guān)系,輸出層則根據(jù)隱藏層的輸出進(jìn)行分類決策,輸出識別結(jié)果。在訓(xùn)練過程中,通過大量的訓(xùn)練樣本對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,利用反向傳播算法不斷調(diào)整神經(jīng)元之間的連接權(quán)重,使得網(wǎng)絡(luò)的輸出與真實(shí)標(biāo)簽之間的誤差最小化。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等更復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)也被廣泛應(yīng)用于步態(tài)識別。CNN能夠自動提取圖像或序列數(shù)據(jù)中的局部特征,通過卷積層、池化層和全連接層等組件,對角度特征進(jìn)行深層次的學(xué)習(xí)和抽象,從而提高識別準(zhǔn)確率。在處理角度特征序列時(shí),可以將角度序列看作是一種時(shí)間序列數(shù)據(jù),利用CNN的卷積操作對時(shí)間序列進(jìn)行特征提取,捕捉角度變化的局部模式。RNN則特別適合處理具有時(shí)間序列特性的數(shù)據(jù),如步態(tài)角度特征序列。它通過引入循環(huán)連接,使得神經(jīng)元能夠記住之前的狀態(tài)信息,從而更好地捕捉時(shí)間序列中的長期依賴關(guān)系。長短期記憶網(wǎng)絡(luò)(LSTM)是RNN的一種變體,它通過引入門控機(jī)制,有效地解決了RNN在處理長序列時(shí)的梯度消失和梯度爆炸問題,能夠更好地學(xué)習(xí)和記憶步態(tài)角度特征序列中的長期依賴信息。不同機(jī)器學(xué)習(xí)算法在基于角度特征的步態(tài)識別中性能表現(xiàn)各有優(yōu)劣。SVM在小樣本情況下具有較好的泛化能力,對特征空間的劃分較為準(zhǔn)確,能夠有效地處理非線性分類問題,但它對核函數(shù)的選擇和參數(shù)調(diào)整比較敏感,需要通過大量的實(shí)驗(yàn)來確定最優(yōu)的參數(shù)組合。神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的學(xué)習(xí)能力和對復(fù)雜模式的識別能力,能夠自動學(xué)習(xí)到高度抽象的特征表示,在大規(guī)模數(shù)據(jù)集上表現(xiàn)出色,但它的訓(xùn)練過程需要大量的計(jì)算資源和時(shí)間,模型的可解釋性相對較差。在實(shí)際應(yīng)用中,需要根據(jù)具體的需求和數(shù)據(jù)特點(diǎn),選擇合適的機(jī)器學(xué)習(xí)算法,并對其進(jìn)行優(yōu)化和改進(jìn),以提高基于角度特征的步態(tài)識別性能。3.3案例分析3.3.1實(shí)驗(yàn)數(shù)據(jù)集介紹為了全面評估基于角度特征的步態(tài)識別方法的性能,本研究選用了公開的CASIA-B步態(tài)數(shù)據(jù)集。該數(shù)據(jù)集由中國科學(xué)院自動化研究所采集并公開,是目前步態(tài)識別領(lǐng)域應(yīng)用最為廣泛的數(shù)據(jù)集之一,具有較高的權(quán)威性和代表性。CASIA-B數(shù)據(jù)集包含了124個(gè)不同個(gè)體的步態(tài)數(shù)據(jù),每個(gè)個(gè)體在11個(gè)不同的視角下進(jìn)行了采集,視角范圍從0度到180度,涵蓋了正面、側(cè)面和背面等多個(gè)角度,能夠充分模擬實(shí)際應(yīng)用中可能出現(xiàn)的不同拍攝視角情況。數(shù)據(jù)采集環(huán)境為室內(nèi),光線條件相對穩(wěn)定,背景較為簡單,減少了環(huán)境因素對步態(tài)數(shù)據(jù)的干擾。在數(shù)據(jù)采集過程中,每個(gè)個(gè)體進(jìn)行了三種不同條件下的行走,分別為正常行走、背著包行走和穿著大衣行走,這三種條件模擬了個(gè)體外觀變化的情況,如攜帶物品和穿著不同衣物等,有助于研究基于角度特征的步態(tài)識別方法在面對這些干擾因素時(shí)的性能表現(xiàn)。對于每個(gè)個(gè)體在每個(gè)視角和每種行走條件下,都采集了多段行走視頻,每段視頻包含了多個(gè)步態(tài)周期。視頻分辨率為320×240像素,幀率為25幀/秒,能夠清晰地記錄行人的行走過程。數(shù)據(jù)集中的視頻經(jīng)過了初步的預(yù)處理,包括背景減除、人體輪廓提取等,得到了較為純凈的人體輪廓序列,為后續(xù)的角度特征提取和分析提供了良好的數(shù)據(jù)基礎(chǔ)。CASIA-B數(shù)據(jù)集的規(guī)模較大,包含了豐富的個(gè)體信息和多樣的行走條件,能夠?yàn)榛诮嵌忍卣鞯牟綉B(tài)識別方法提供全面的測試和驗(yàn)證。通過在該數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),可以準(zhǔn)確地評估所提出方法在不同視角、不同個(gè)體外觀變化等復(fù)雜情況下的識別性能,為方法的改進(jìn)和優(yōu)化提供有力的依據(jù)。同時(shí),由于該數(shù)據(jù)集的廣泛應(yīng)用,使用該數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)也便于與其他已有的步態(tài)識別方法進(jìn)行對比分析,從而更好地展示本研究方法的優(yōu)勢和不足。3.3.2實(shí)驗(yàn)設(shè)置與結(jié)果分析在實(shí)驗(yàn)中,首先對CASIA-B數(shù)據(jù)集中的視頻進(jìn)行角度特征提取。對于基于關(guān)節(jié)點(diǎn)定位的角度提取方法,采用OpenPose算法定位人體關(guān)節(jié)點(diǎn),設(shè)置其置信度閾值為0.5,以確保關(guān)節(jié)點(diǎn)定位的準(zhǔn)確性。在計(jì)算關(guān)節(jié)角度時(shí),根據(jù)人體解剖學(xué)知識和向量運(yùn)算原理,準(zhǔn)確計(jì)算髖關(guān)節(jié)、膝關(guān)節(jié)和踝關(guān)節(jié)等關(guān)鍵關(guān)節(jié)在每個(gè)視頻幀中的角度。對于基于運(yùn)動軌跡分析的角度提取方法,利用卡爾曼濾波算法對腿部和手臂的關(guān)鍵點(diǎn)進(jìn)行跟蹤,設(shè)置卡爾曼濾波的過程噪聲協(xié)方差矩陣和觀測噪聲協(xié)方差矩陣,以優(yōu)化跟蹤效果。在提取角度特征時(shí),計(jì)算腿部與垂直方向或水平方向的夾角,以及手臂與身體中軸線的夾角等,每個(gè)角度特征均以時(shí)間序列的形式表示。在識別算法方面,采用動態(tài)時(shí)間規(guī)整(DTW)算法結(jié)合支持向量機(jī)(SVM)進(jìn)行步態(tài)識別。對于DTW算法,設(shè)置距離度量為歐氏距離,通過動態(tài)規(guī)劃計(jì)算累積距離矩陣,找到最優(yōu)匹配路徑,從而計(jì)算出不同步態(tài)序列之間的相似度。對于SVM算法,選擇徑向基核函數(shù)(RBF)作為核函數(shù),通過交叉驗(yàn)證的方式確定懲罰參數(shù)C和核函數(shù)參數(shù)γ,以優(yōu)化SVM的分類性能。在訓(xùn)練過程中,將數(shù)據(jù)集按照70%作為訓(xùn)練集,30%作為測試集進(jìn)行劃分,使用訓(xùn)練集對SVM模型進(jìn)行訓(xùn)練,然后用測試集評估模型的性能。實(shí)驗(yàn)結(jié)果表明,基于角度特征的步態(tài)識別方法在不同場景下展現(xiàn)出了一定的性能表現(xiàn)。在正常行走條件下,該方法的識別準(zhǔn)確率達(dá)到了85%,召回率為83%。這表明在個(gè)體外觀無明顯變化的情況下,基于角度特征的方法能夠較好地識別個(gè)體身份。然而,當(dāng)個(gè)體背著包行走時(shí),識別準(zhǔn)確率下降到78%,召回率為75%;穿著大衣行走時(shí),識別準(zhǔn)確率進(jìn)一步下降到72%,召回率為70%。這說明個(gè)體外觀的變化,如攜帶物品和穿著不同衣物,會對基于角度特征的步態(tài)識別方法產(chǎn)生一定的干擾,導(dǎo)致識別性能下降。這是因?yàn)檫@些外觀變化可能會改變?nèi)梭w的重心分布和運(yùn)動模式,從而影響關(guān)節(jié)角度的變化規(guī)律,使得角度特征的區(qū)分性降低。在不同視角下,基于角度特征的步態(tài)識別方法的性能也有所不同。在正面和背面視角下,識別準(zhǔn)確率相對較高,分別達(dá)到了82%和80%,召回率分別為80%和78%。這是因?yàn)樵谶@些視角下,人體關(guān)節(jié)的運(yùn)動相對較為明顯,角度特征更容易提取和區(qū)分。而在側(cè)面視角下,由于部分關(guān)節(jié)被遮擋或運(yùn)動幅度較小,識別準(zhǔn)確率下降到75%,召回率為73%。此外,隨著視角的變化,人體的投影形狀和關(guān)節(jié)角度的視覺表現(xiàn)也會發(fā)生變化,這增加了角度特征提取和匹配的難度,從而影響了識別性能。通過對實(shí)驗(yàn)結(jié)果的分析,可以看出基于角度特征的步態(tài)識別方法在一定程度上能夠有效識別個(gè)體身份,但在面對個(gè)體外觀變化和不同視角等復(fù)雜情況時(shí),仍存在一定的局限性,需要進(jìn)一步改進(jìn)和優(yōu)化。四、基于輪廓特征的步態(tài)識別方法4.1輪廓特征提取方法4.1.1傳統(tǒng)圖像處理方法提取輪廓在步態(tài)識別中,傳統(tǒng)圖像處理方法在提取人體輪廓時(shí)發(fā)揮了重要作用,其主要涵蓋閾值分割、邊緣檢測、形態(tài)學(xué)處理等技術(shù),這些技術(shù)在不同圖像質(zhì)量和背景條件下展現(xiàn)出各異的效果。閾值分割是一種簡單且常用的圖像分割方法,其核心原理是根據(jù)圖像的灰度值,選取一個(gè)合適的閾值,將圖像中的像素點(diǎn)劃分為前景和背景兩類。對于步態(tài)圖像,若圖像背景較為簡單且與人體灰度差異明顯,閾值分割能夠快速有效地提取出人體輪廓。當(dāng)背景為單一顏色,且人體與背景的灰度值分布相對獨(dú)立時(shí),通過設(shè)定合適的閾值,可將人體從背景中分離出來。常用的閾值選取方法有全局閾值法和自適應(yīng)閾值法。全局閾值法適用于整幅圖像中前景和背景的灰度分布較為穩(wěn)定的情況,通過計(jì)算圖像的灰度直方圖,選擇一個(gè)固定的閾值對整幅圖像進(jìn)行分割。自適應(yīng)閾值法則根據(jù)圖像局部區(qū)域的灰度特性來動態(tài)調(diào)整閾值,對于光照不均勻或背景復(fù)雜的圖像具有更好的適應(yīng)性。然而,閾值分割方法也存在一定的局限性。當(dāng)圖像中存在噪聲干擾時(shí),噪聲點(diǎn)的灰度值可能會影響閾值的選擇,導(dǎo)致分割結(jié)果出現(xiàn)錯(cuò)誤,如將噪聲點(diǎn)誤判為前景或背景;若人體與背景的灰度差異較小,或者人體內(nèi)部存在灰度變化較大的區(qū)域,閾值分割可能無法準(zhǔn)確地提取出完整的人體輪廓,出現(xiàn)輪廓不連續(xù)或丟失部分輪廓的情況。邊緣檢測是另一種重要的傳統(tǒng)圖像處理方法,它通過檢測圖像中灰度值變化劇烈的位置來提取物體的邊緣,從而得到人體輪廓。Canny邊緣檢測算法是一種經(jīng)典的邊緣檢測算法,它通過計(jì)算圖像的梯度幅值和方向,采用非極大值抑制和雙閾值檢測等步驟,能夠準(zhǔn)確地檢測出圖像中的邊緣。在步態(tài)圖像中,Canny算法能夠有效地檢測出人體輪廓的邊緣,即使在圖像存在一定噪聲的情況下,也能保持較好的檢測效果。在實(shí)際應(yīng)用中,首先對步態(tài)圖像進(jìn)行高斯濾波,以平滑圖像并減少噪聲干擾;接著計(jì)算圖像的梯度幅值和方向,通過非極大值抑制去除非邊緣的像素點(diǎn),保留真正的邊緣;最后采用雙閾值檢測,將邊緣分為強(qiáng)邊緣和弱邊緣,通過對弱邊緣的連接,得到完整的邊緣輪廓。但是,邊緣檢測算法對圖像的噪聲和光照變化較為敏感。在光照不均勻的情況下,圖像的灰度值會發(fā)生變化,導(dǎo)致邊緣檢測結(jié)果出現(xiàn)誤判,產(chǎn)生虛假邊緣或丟失真實(shí)邊緣;當(dāng)圖像噪聲較大時(shí),噪聲點(diǎn)的灰度變化也會被檢測為邊緣,使得邊緣檢測結(jié)果中包含大量噪聲,影響輪廓提取的準(zhǔn)確性。形態(tài)學(xué)處理是對圖像進(jìn)行腐蝕、膨脹、開運(yùn)算、閉運(yùn)算等操作,以優(yōu)化輪廓提取的結(jié)果。腐蝕操作可以去除圖像中的噪聲點(diǎn)和小的突出部分,使物體的輪廓向內(nèi)收縮;膨脹操作則可以填補(bǔ)物體輪廓中的空洞和縫隙,使輪廓向外擴(kuò)張。開運(yùn)算先進(jìn)行腐蝕操作再進(jìn)行膨脹操作,能夠去除噪聲和小的干擾物,平滑物體的輪廓;閉運(yùn)算先進(jìn)行膨脹操作再進(jìn)行腐蝕操作,能夠填補(bǔ)物體內(nèi)部的空洞和連接斷開的輪廓。在步態(tài)識別中,形態(tài)學(xué)處理通常與閾值分割或邊緣檢測結(jié)合使用。在通過閾值分割得到初步的人體輪廓后,可能存在一些噪聲點(diǎn)和小的空洞,通過形態(tài)學(xué)處理中的腐蝕和膨脹操作,可以去除噪聲點(diǎn),填補(bǔ)空洞,得到更清晰、完整的人體輪廓。但是,形態(tài)學(xué)處理的效果依賴于結(jié)構(gòu)元素的選擇,不同的結(jié)構(gòu)元素會對處理結(jié)果產(chǎn)生不同的影響。如果結(jié)構(gòu)元素選擇不當(dāng),可能會過度腐蝕或膨脹輪廓,導(dǎo)致輪廓信息丟失或變形。4.1.2基于深度學(xué)習(xí)的輪廓提取以MaskR-CNN、Yolo等模型為代表的深度學(xué)習(xí)模型在人體輪廓提取中展現(xiàn)出強(qiáng)大的能力,它們通過對大量圖像數(shù)據(jù)的學(xué)習(xí),能夠自動提取圖像中的特征,實(shí)現(xiàn)準(zhǔn)確的人體輪廓提取,然而,這些模型在實(shí)際應(yīng)用中也對硬件資源有著較高的要求。MaskR-CNN是一種基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò),它在FasterR-CNN的基礎(chǔ)上增加了一個(gè)用于預(yù)測目標(biāo)掩模的分支,從而能夠?qū)崿F(xiàn)對目標(biāo)物體的實(shí)例分割,準(zhǔn)確地提取出人體輪廓。該模型的工作流程主要包括以下幾個(gè)步驟:首先,通過骨干網(wǎng)絡(luò)(如ResNet、VGG等)對輸入圖像進(jìn)行特征提取,得到圖像的特征圖。骨干網(wǎng)絡(luò)中的卷積層能夠自動學(xué)習(xí)圖像中的各種特征,包括紋理、形狀等信息。接著,利用區(qū)域提議網(wǎng)絡(luò)(RPN)生成可能包含人體目標(biāo)的候選區(qū)域。RPN通過滑動窗口的方式在特征圖上生成一系列的錨框,并對這些錨框進(jìn)行分類和回歸,判斷每個(gè)錨框是否包含人體目標(biāo)以及調(diào)整錨框的位置和大小,從而得到一系列的候選區(qū)域。然后,對這些候選區(qū)域進(jìn)行ROIAlign操作,將不同大小的候選區(qū)域映射到固定大小的特征圖上,以便后續(xù)的處理。ROIAlign操作能夠避免傳統(tǒng)ROIPooling操作中由于量化誤差導(dǎo)致的特征丟失問題,提高特征的準(zhǔn)確性。最后,通過分類器對候選區(qū)域進(jìn)行分類,判斷其是否為人體目標(biāo),并通過掩模預(yù)測分支生成人體的掩模,從而得到準(zhǔn)確的人體輪廓。在訓(xùn)練過程中,MaskR-CNN通過大量的標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí),不斷調(diào)整模型的參數(shù),使得模型能夠準(zhǔn)確地識別和分割人體目標(biāo)。MaskR-CNN對復(fù)雜背景和遮擋情況具有較好的魯棒性,能夠在各種場景下準(zhǔn)確地提取人體輪廓。在人群密集的場景中,即使人體之間存在部分遮擋,MaskR-CNN也能夠通過對上下文信息的學(xué)習(xí),準(zhǔn)確地分割出每個(gè)人的輪廓。然而,MaskR-CNN模型的訓(xùn)練和推理過程需要消耗大量的計(jì)算資源,對硬件設(shè)備的要求較高,需要配備高性能的GPU才能實(shí)現(xiàn)實(shí)時(shí)的輪廓提取。Yolo(YouOnlyLookOnce)系列模型是另一類基于深度學(xué)習(xí)的目標(biāo)檢測模型,它將目標(biāo)檢測任務(wù)轉(zhuǎn)化為一個(gè)回歸問題,通過一次前向傳播即可預(yù)測出目標(biāo)物體的類別和位置,具有速度快、實(shí)時(shí)性強(qiáng)的優(yōu)點(diǎn)。以YoloV5為例,它采用了CSPNet(CrossStagePartialNetwork)結(jié)構(gòu)作為骨干網(wǎng)絡(luò),通過對特征圖的跨階段融合,提高了模型的特征提取能力和計(jì)算效率。在頸部結(jié)構(gòu)中,YoloV5采用了SPP(SpatialPyramidPooling)模塊和PAN(PathAggregationNetwork)模塊,SPP模塊通過不同尺度的池化操作,能夠提取到不同尺度的特征,增強(qiáng)模型對多尺度目標(biāo)的檢測能力;PAN模塊則通過自上而下的路徑聚合,將不同層次的特征進(jìn)行融合,使得模型能夠更好地利用上下文信息。在頭部結(jié)構(gòu)中,YoloV5采用了多尺度預(yù)測的方式,通過在不同尺度的特征圖上進(jìn)行預(yù)測,能夠檢測出不同大小的目標(biāo)物體。在人體輪廓提取中,YoloV5能夠快速地檢測出圖像中的人體目標(biāo),并通過后處理操作得到人體的輪廓。由于YoloV5模型結(jié)構(gòu)相對簡單,計(jì)算量較小,因此在一些對實(shí)時(shí)性要求較高的場景中具有優(yōu)勢,如實(shí)時(shí)監(jiān)控系統(tǒng)中,能夠快速地檢測和提取人體輪廓。但是,Yolo系列模型在檢測小目標(biāo)和復(fù)雜場景下的準(zhǔn)確性相對較低,對于一些細(xì)節(jié)豐富的人體輪廓,可能無法準(zhǔn)確地提取?;谏疃葘W(xué)習(xí)的輪廓提取模型在硬件資源要求方面,通常需要高性能的圖形處理器(GPU)來加速模型的訓(xùn)練和推理過程。這些模型的訓(xùn)練過程涉及大量的矩陣運(yùn)算和復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),對計(jì)算資源的需求巨大。在使用MaskR-CNN模型進(jìn)行訓(xùn)練時(shí),若硬件設(shè)備的GPU性能不足,訓(xùn)練時(shí)間可能會大幅延長,甚至無法完成訓(xùn)練;在推理過程中,若硬件設(shè)備無法滿足模型的計(jì)算需求,可能會導(dǎo)致實(shí)時(shí)性下降,無法滿足實(shí)際應(yīng)用的要求。深度學(xué)習(xí)模型的存儲需求也較高,需要存儲大量的模型參數(shù)和訓(xùn)練數(shù)據(jù)。為了降低硬件資源的需求,一些研究提出了模型壓縮和量化等技術(shù),通過減少模型參數(shù)的數(shù)量和降低參數(shù)的精度,來減小模型的大小和計(jì)算量,從而提高模型在低配置硬件設(shè)備上的運(yùn)行效率。4.2基于輪廓特征的識別算法4.2.1基于模板匹配的輪廓識別在基于輪廓特征的步態(tài)識別中,構(gòu)建有效的步態(tài)輪廓模板是實(shí)現(xiàn)準(zhǔn)確識別的關(guān)鍵一步,而步態(tài)能量圖(GEI)是一種廣泛應(yīng)用且效果顯著的模板構(gòu)建方法。其構(gòu)建過程基于對人體輪廓在多個(gè)步態(tài)周期內(nèi)的像素級分析。首先,通過背景減除、邊緣檢測等圖像處理技術(shù),從視頻序列中準(zhǔn)確提取出每個(gè)步態(tài)周期內(nèi)的人體輪廓圖像。這些輪廓圖像反映了人體在不同時(shí)刻的姿態(tài)和形狀信息。然后,對提取到的輪廓圖像進(jìn)行時(shí)間對齊,確保每個(gè)輪廓圖像在時(shí)間軸上的對應(yīng)位置具有相同的物理意義,以便后續(xù)進(jìn)行融合處理。在時(shí)間對齊的基礎(chǔ)上,將所有輪廓圖像進(jìn)行疊加平均。具體來說,對于每個(gè)像素位置,計(jì)算在所有輪廓圖像中該像素位置的灰度值總和,并除以輪廓圖像的數(shù)量,得到該像素位置在GEI中的灰度值。通過這種方式,將多個(gè)步態(tài)周期內(nèi)的輪廓信息融合到一張圖像中,形成步態(tài)能量圖。GEI能夠有效地保留步態(tài)的主要特征,如人體的整體形狀、腿部和手臂的擺動幅度和頻率等,同時(shí)對一些噪聲和微小的姿態(tài)變化具有一定的平滑作用,使得特征更加穩(wěn)定。模板匹配是基于模板的輪廓識別中的關(guān)鍵環(huán)節(jié),其核心在于通過計(jì)算相似度來判斷待識別輪廓與模板之間的匹配程度。常用的相似度計(jì)算方法有歐氏距離、余弦相似度等。歐氏距離是一種直觀的距離度量方法,它通過計(jì)算兩個(gè)向量在空間中的直線距離來衡量它們的相似度。在基于輪廓特征的模板匹配中,將GEI等模板圖像和待識別輪廓圖像轉(zhuǎn)化為向量形式,然后計(jì)算它們之間的歐氏距離。假設(shè)模板圖像向量為T=(t_1,t_2,\cdots,t_n),待識別輪廓圖像向量為S=(s_1,s_2,\cdots,s_n),則它們之間的歐氏距離d的計(jì)算公式為:d=\sqrt{\sum_{i=1}^{n}(t_i-s_i)^2}。歐氏距離越小,說明兩個(gè)圖像的相似度越高,即待識別輪廓與模板越匹配。余弦相似度則是從向量夾角的角度來衡量兩個(gè)向量的相似度,它計(jì)算兩個(gè)向量的夾角余弦值,取值范圍在[-1,1]之間,值越接近1,表示兩個(gè)向量的方向越相似,即圖像的相似度越高。對于上述模板圖像向量T和待識別輪廓圖像向量S,它們的余弦相似度cosine的計(jì)算公式為:cosine=\frac{\sum_{i=1}^{n}t_i\timess_i}{\sqrt{\sum_{i=1}^{n}t_i^2}\times\sqrt{\sum_{i=1}^{n}s_i^2}}。然而,模板匹配方法在實(shí)際應(yīng)用中存在一定的局限性。當(dāng)個(gè)體外觀發(fā)生變化時(shí),如穿著不同的衣物、攜帶物品等,會導(dǎo)致人體輪廓的形狀和大小發(fā)生改變,從而使得基于固定模板的匹配效果受到影響。穿著寬松的衣物可能會使人體輪廓看起來更加寬大,攜帶背包則會改變?nèi)梭w的重心和輪廓形狀,這些變化會增加模板與待識別輪廓之間的差異,降低相似度計(jì)算的準(zhǔn)確性,導(dǎo)致識別錯(cuò)誤。拍攝視角的變化也是一個(gè)重要的影響因素。不同的拍攝視角會使人體輪廓在圖像中的投影發(fā)生變化,導(dǎo)致輪廓的形狀和比例與模板不一致。從側(cè)面拍攝的人體輪廓與從正面拍攝的輪廓在形狀和特征上有很大差異,如果使用正面拍攝的模板去匹配側(cè)面拍攝的輪廓,很難得到準(zhǔn)確的匹配結(jié)果。此外,模板匹配方法對于噪聲和遮擋的魯棒性較差。圖像中的噪聲會干擾輪廓的提取和特征的表達(dá),使得模板與待識別輪廓之間的相似度計(jì)算出現(xiàn)偏差;當(dāng)人體部分被遮擋時(shí),缺失的輪廓信息會導(dǎo)致模板匹配失敗,影響識別的準(zhǔn)確性。4.2.2深度學(xué)習(xí)模型在輪廓識別中的應(yīng)用深度學(xué)習(xí)模型在輪廓特征的學(xué)習(xí)和分類中展現(xiàn)出了強(qiáng)大的能力,以卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)為代表的模型,通過獨(dú)特的結(jié)構(gòu)和學(xué)習(xí)機(jī)制,能夠自動提取輪廓圖像中的關(guān)鍵特征,實(shí)現(xiàn)準(zhǔn)確的身份識別。卷積神經(jīng)網(wǎng)絡(luò)(CNN)在處理輪廓圖像時(shí),其獨(dú)特的卷積層結(jié)構(gòu)發(fā)揮了關(guān)鍵作用。卷積層通過卷積核在圖像上滑動,對圖像的局部區(qū)域進(jìn)行卷積操作,從而提取出圖像的局部特征。這些卷積核可以看作是一系列濾波器,它們能夠捕捉圖像中的邊緣、紋理、形狀等不同類型的特征。在處理人體輪廓圖像時(shí),卷積核可以學(xué)習(xí)到人體輪廓的邊緣特征、關(guān)節(jié)部位的形狀特征等。不同大小和參數(shù)的卷積核可以提取不同尺度和類型的特征,小的卷積核能夠捕捉圖像的細(xì)節(jié)特征,大的卷積核則可以提取圖像的整體結(jié)構(gòu)特征。池化層也是CNN中的重要組成部分,它通過對卷積層輸出的特征圖進(jìn)行下采樣,降低特征圖的尺寸,減少計(jì)算量,同時(shí)保留圖像的主要特征。最大池化是一種常用的池化方法,它在一個(gè)局部區(qū)域內(nèi)選擇最大值作為池化后的輸出,能夠有效地保留圖像中的重要特征。通過多個(gè)卷積層和池化層的交替堆疊,CNN可以逐漸提取出圖像的高層次語義特征,這些特征對于區(qū)分不同個(gè)體的輪廓具有重要意義。在一個(gè)包含多個(gè)卷積層和池化層的CNN模型中,淺層的卷積層主要提取圖像的邊緣、線條等低級特征,隨著網(wǎng)絡(luò)層數(shù)的加深,卷積層逐漸學(xué)習(xí)到人體輪廓的整體形狀、姿態(tài)等高級語義特征。在分類階段,全連接層將提取到的特征映射到類別空間,通過softmax函數(shù)計(jì)算每個(gè)類別的概率,從而實(shí)現(xiàn)對輪廓圖像的分類識別。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)則特別適合處理具有時(shí)間序列特性的輪廓數(shù)據(jù),因?yàn)樗軌虿蹲綍r(shí)間序列中的長期依賴關(guān)系。在步態(tài)識別中,輪廓圖像是按時(shí)間順序采集的,形成了一個(gè)時(shí)間序列,RNN通過引入循環(huán)連接,使得神經(jīng)元能夠記住之前的狀態(tài)信息,從而對整個(gè)時(shí)間序列進(jìn)行建模。在處理輪廓圖像序列時(shí),RNN的每個(gè)時(shí)間步接收當(dāng)前時(shí)刻的輪廓圖像特征作為輸入,并結(jié)合上一時(shí)刻的隱藏狀態(tài),通過非線性變換計(jì)算出當(dāng)前時(shí)刻的隱藏狀態(tài)。這個(gè)隱藏狀態(tài)不僅包含了當(dāng)前輪廓圖像的信息,還融合了之前時(shí)刻的信息,能夠反映出步態(tài)的動態(tài)變化過程。長短期記憶網(wǎng)絡(luò)(LSTM)作為RNN的一種變體,通過引入門控機(jī)制,有效地解決了RNN在處理長序列時(shí)的梯度消失和梯度爆炸問題,能夠更好地學(xué)習(xí)和記憶時(shí)間序列中的長期依賴信息。LSTM中的門控單元包括輸入門、遺忘門和輸出門,輸入門控制當(dāng)前輸入信息的進(jìn)入,遺忘門決定保留或丟棄上一時(shí)刻的記憶,輸出門確定輸出的信息。通過這些門控單元的協(xié)同作用,LSTM能夠選擇性地記憶和更新時(shí)間序列中的重要信息,在步態(tài)輪廓識別中表現(xiàn)出更好的性能。在一個(gè)基于LSTM的步態(tài)識別模型中,LSTM網(wǎng)絡(luò)可以學(xué)習(xí)到人體輪廓在不同時(shí)間步的變化模式,從而準(zhǔn)確地識別出不同個(gè)體的步態(tài)。不同深度學(xué)習(xí)模型在輪廓識別中的性能表現(xiàn)各有優(yōu)劣。CNN在提取靜態(tài)圖像特征方面具有強(qiáng)大的能力,能夠快速準(zhǔn)確地提取出輪廓圖像中的關(guān)鍵特征,對于單幀輪廓圖像的分類具有較高的準(zhǔn)確率。但它在處理時(shí)間序列信息時(shí),由于缺乏對時(shí)間依賴關(guān)系的有效建模,可能無法充分利用步態(tài)的動態(tài)特征。RNN及其變體LSTM則在處理時(shí)間序列數(shù)據(jù)方面表現(xiàn)出色,能夠捕捉步態(tài)輪廓隨時(shí)間的變化規(guī)律,對于基于時(shí)間序列的步態(tài)識別具有較好的效果。然而,RNN和LSTM的計(jì)算復(fù)雜度較高,訓(xùn)練和推理速度相對較慢,在處理大規(guī)模數(shù)據(jù)時(shí)可能面臨計(jì)算資源的限制。在實(shí)際應(yīng)用中,需要根據(jù)具體的需求和數(shù)據(jù)特點(diǎn),選擇合適的深度學(xué)習(xí)模型,并對其進(jìn)行優(yōu)化和改進(jìn),以提高基于輪廓特征的步態(tài)識別性能。4.3案例分析4.3.1實(shí)驗(yàn)數(shù)據(jù)集及實(shí)驗(yàn)設(shè)置本次實(shí)驗(yàn)同樣選用CASIA-B步態(tài)數(shù)據(jù)集,該數(shù)據(jù)集在前述基于角度特征的步態(tài)識別實(shí)驗(yàn)中已被采用,其豐富的個(gè)體樣本、多樣的行走條件以及多視角采集的特性,為全面評估基于輪廓特征的步態(tài)識別方法提供了有力的數(shù)據(jù)支持。與基于角度特征實(shí)驗(yàn)數(shù)據(jù)集的聯(lián)系在于,二者使用的是同一數(shù)據(jù)集,這使得在對比分析基于角度特征和輪廓特征的步態(tài)識別性能時(shí),具有更強(qiáng)的可比性,能夠更直觀地反映出兩種特征在相同實(shí)驗(yàn)條件下的表現(xiàn)差異。在實(shí)驗(yàn)設(shè)置方面,對于輪廓特征提取,若采用傳統(tǒng)圖像處理方法,首先利用高斯混合模型(GMM)進(jìn)行背景建模,設(shè)置混合高斯模型的個(gè)數(shù)為5,以適應(yīng)背景的動態(tài)變化,準(zhǔn)確地從視頻圖像中分離出前景人體目標(biāo)。接著使用Canny邊緣檢測算法提取人體邊緣,設(shè)置低閾值為50,高閾值為150,以平衡邊緣檢測的準(zhǔn)確性和噪聲抑制效果。最后通過形態(tài)學(xué)處理中的膨脹和腐蝕操作優(yōu)化輪廓,選擇結(jié)構(gòu)元素為3×3的矩形結(jié)構(gòu)元素,對邊緣圖像進(jìn)行膨脹操作以填補(bǔ)空洞,再進(jìn)行腐蝕操作去除噪聲點(diǎn),得到完整準(zhǔn)確的人體輪廓。若采用基于深度學(xué)習(xí)的MaskR-CNN模型提取輪廓,使用預(yù)訓(xùn)練的ResNet50作為骨干網(wǎng)絡(luò),在訓(xùn)練過程中,設(shè)置初始學(xué)習(xí)率為0.001,采用隨機(jī)梯度下降(SGD)優(yōu)化器,動量參數(shù)為0.9,權(quán)重衰減系數(shù)為0.0001,訓(xùn)練100個(gè)epoch,以確保模型能夠充分學(xué)習(xí)到人體輪廓的特征。在識別算法方面,采用基于模板匹配的方法時(shí),構(gòu)建步態(tài)能量圖(GEI)作為步態(tài)模板。在構(gòu)建GEI時(shí),對每個(gè)個(gè)體的輪廓圖像進(jìn)行時(shí)間對齊,確保輪廓在時(shí)間軸上的一致性,然后將所有輪廓圖像進(jìn)行疊加平均,生成GEI。在模板匹配階段,使用歐氏距離作為相似度度量,通過計(jì)算待識別輪廓與GEI模板之間的歐氏距離,判斷待識別輪廓與模板的匹配程度,距離越小則匹配度越高。采用深度學(xué)習(xí)模型進(jìn)行
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026數(shù)字寧夏建設(shè)運(yùn)營公司招聘面試題及答案
- 2025年鄭州健康學(xué)院輔導(dǎo)員考試參考題庫附答案
- 2024年江西衛(wèi)生職業(yè)學(xué)院馬克思主義基本原理概論期末考試題帶答案
- 2026年演出經(jīng)紀(jì)人考試題庫及答案(網(wǎng)校專用)
- 醫(yī)療健康行業(yè)ESG專員面試題集
- 2026年縣直事業(yè)單位招聘職業(yè)能力測試題庫附答案(a卷)
- 2025中遠(yuǎn)海運(yùn)財(cái)產(chǎn)保險(xiǎn)自保有限公司高級管理人員招聘備考題庫附答案
- 2026年國家電網(wǎng)招聘之電網(wǎng)計(jì)算機(jī)考試題庫500道及完整答案(歷年真題)
- 2026青海創(chuàng)安公司招聘面試題及答案
- 2026年初級經(jīng)濟(jì)師之初級經(jīng)濟(jì)師人力資源管理考試題庫500道及答案(奪冠系列)
- 球團(tuán)化驗(yàn)知識培訓(xùn)課件
- 施工項(xiàng)目質(zhì)量管理提升方案
- 養(yǎng)殖蛋雞的技術(shù)知識培訓(xùn)課件
- 校車駕駛員考試題及答案
- GB/T 4995-2025平托盤性能要求和試驗(yàn)選擇
- 2025年國家開放大學(xué)行管??啤侗O(jiān)督學(xué)》期末考試試題及答案
- 現(xiàn)場管理提升PP丅培訓(xùn)課件
- 口腔科手衛(wèi)生PDCA改進(jìn)案例
- 后組顱神經(jīng)損傷的護(hù)理措施
- GB/T 27612.2-2025農(nóng)業(yè)灌溉設(shè)備噴頭第2部分:結(jié)構(gòu)和運(yùn)行要求
- 2024年淄博市中級人民法院招聘聘用制書記員筆試真題
評論
0/150
提交評論