基于Kinect步態(tài)信息的情緒識別研究:技術、算法與應用_第1頁
基于Kinect步態(tài)信息的情緒識別研究:技術、算法與應用_第2頁
基于Kinect步態(tài)信息的情緒識別研究:技術、算法與應用_第3頁
基于Kinect步態(tài)信息的情緒識別研究:技術、算法與應用_第4頁
基于Kinect步態(tài)信息的情緒識別研究:技術、算法與應用_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于Kinect步態(tài)信息的情緒識別研究:技術、算法與應用一、引言1.1研究背景與意義情緒作為人類心理狀態(tài)的重要體現(xiàn),在日常生活、人際交往以及各類工作場景中都扮演著關鍵角色。它不僅反映了個體內心的感受,還對人們的認知、決策和行為產生深遠影響。準確識別情緒對于理解人類行為、促進有效溝通以及提升生活質量等方面具有重要意義。在過去的幾十年中,情緒識別領域取得了顯著進展,研究人員不斷探索各種方法和技術來實現(xiàn)更準確、高效的情緒識別。其中,基于生理信號、面部表情和語音等模態(tài)的情緒識別研究已經相對成熟,并在多個領域得到了廣泛應用。然而,這些傳統(tǒng)的情緒識別方法存在一定的局限性。例如,生理信號的采集通常需要專業(yè)設備和復雜的操作,且容易受到個體生理差異和環(huán)境因素的影響;面部表情和語音的識別則在一些情況下可能受到遮擋、噪音等干擾,導致識別準確率下降。步態(tài)作為人類日常生活中最基本的行為之一,蘊含著豐富的情緒信息。不同的情緒狀態(tài)往往會導致人們在行走時的步態(tài)特征發(fā)生變化,例如速度、步幅、節(jié)奏以及身體姿態(tài)等方面。與傳統(tǒng)的情緒識別模態(tài)相比,步態(tài)具有非侵入性、易于采集和長期監(jiān)測等優(yōu)點。通過分析步態(tài)信息來識別情緒,可以為情緒識別領域提供一種新的視角和方法,彌補傳統(tǒng)方法的不足。Kinect作為一款由微軟公司推出的體感設備,集成了深度攝像頭、彩色攝像頭和麥克風等多種傳感器,能夠實時獲取人體的三維骨骼信息、彩色圖像和音頻數(shù)據。憑借其高精度的骨骼跟蹤能力和豐富的傳感器數(shù)據,Kinect在人體行為分析、動作識別和姿態(tài)估計等領域得到了廣泛應用。利用Kinect采集步態(tài)信息,不僅可以獲取到傳統(tǒng)傳感器難以捕捉的人體三維空間運動數(shù)據,還能夠實現(xiàn)對步態(tài)的全方位、多角度分析,為基于步態(tài)的情緒識別研究提供了有力的技術支持。在人機交互領域,準確識別用戶的情緒狀態(tài)能夠使計算機更好地理解用戶意圖,從而提供更加個性化、智能化的交互服務。例如,在智能客服系統(tǒng)中,通過識別用戶的情緒,系統(tǒng)可以調整回答策略,提供更貼心的服務;在虛擬現(xiàn)實和增強現(xiàn)實應用中,根據用戶的情緒變化實時調整場景和交互方式,能夠增強用戶的沉浸感和體驗感。在安防監(jiān)控領域,基于Kinect步態(tài)信息的情緒識別技術可以用于檢測人員的異常情緒,如憤怒、恐懼等,及時發(fā)現(xiàn)潛在的安全威脅,為公共場所的安全保障提供有力支持。在醫(yī)療康復領域,情緒識別對于評估患者的心理狀態(tài)和康復進程具有重要意義。通過分析患者的步態(tài)情緒,醫(yī)生可以更全面地了解患者的病情,制定更加個性化的治療方案。此外,對于一些神經系統(tǒng)疾病患者,如帕金森病患者,步態(tài)情緒的變化還可以作為疾病進展和治療效果評估的重要指標。綜上所述,基于Kinect步態(tài)信息的情緒識別研究具有重要的理論意義和實際應用價值。通過深入挖掘步態(tài)信息中蘊含的情緒特征,結合先進的機器學習和模式識別技術,有望實現(xiàn)更加準確、可靠的情緒識別,為多個領域的發(fā)展提供新的技術手段和解決方案。1.2國內外研究現(xiàn)狀在利用Kinect進行步態(tài)信息采集方面,國內外學者已開展了豐富的研究。2010年微軟公司推出Kinectv1,其能夠利用深度數(shù)據計算出人體20個關節(jié)的相對三維位置,無需額外安裝傳感器或標記物,這為步態(tài)信息采集帶來了極大的便利,使得基于Kinect的步態(tài)分析研究逐漸興起。此后,2014年推出的Kinectv2增加了紅外圖像、時間飛行測量(ToF)等新技術,可視檢測范圍更廣,并優(yōu)化關節(jié)提取技術,可根據深度信息提供人體25個關節(jié)三維位置,進一步推動了該領域的發(fā)展。眾多研究圍繞Kinect在不同場景下的步態(tài)捕獲范圍、精度等展開探討。傳統(tǒng)觀點認為將Kinectv2放至受試者前1.2-1.5m、距地面高0.8-1.2m處可較為完整地獲取人體全身深度圖像,但CLARK等基于Kinectv2對30名卒中患者進行步態(tài)分析,認為最佳步態(tài)捕獲范圍為距Kinectv21.5-3.5m,且研究所得步態(tài)參數(shù)具有較高的可靠性(組內相關系數(shù),intraclasscorrelationcoefficient,ICC≥0.80)。在基于步態(tài)的情緒識別領域,國外研究起步相對較早。美國查佩爾希爾大學和馬里蘭大學的研究人員研發(fā)了一種機器學習方法,從多個步行視頻語料庫中提取人們的步態(tài),并使用3D姿態(tài)估計技術來識別提取的步態(tài)和步態(tài)表現(xiàn)的情緒特征,將這些3D姿態(tài)傳輸?shù)介L短期記憶模型(LSTM)網絡中獲取特征,再結合隨機森林分類器,針對快樂、悲傷、憤怒和中性這四種情緒進行識別,在初步實驗中的準確率達到80.07%。他們獲取的步態(tài)特征包含肩膀姿勢、連續(xù)步伐之間的距離,以及手和脖子之間的區(qū)域等,頭部傾斜角度被用來區(qū)分快樂和悲傷的情緒,更緊湊的姿勢和“身體擴張”分別識別人們的積極和消極情緒,還考慮了步行速度、加速度以及手、腳和頭部關節(jié)“運動抖動”的大小等因素來判斷情緒的平靜或充滿活力狀態(tài)。國內在基于Kinect步態(tài)信息的情緒識別方面也取得了一定進展。有研究針對Kinect3D骨骼的步態(tài)識別研究在數(shù)據歸一化和特征提取方面存在的問題,提出了基于關節(jié)點坐標圖像的單幀人物識別方法和基于步態(tài)時空特征矩陣的步態(tài)人物識別方法,雖然不是直接針對情緒識別,但為基于Kinect的步態(tài)分析提供了新的思路和方法,也為后續(xù)的情緒識別研究奠定了一定基礎。還有研究使用微軟Kinect攝像頭收集用戶的步態(tài)行為數(shù)據,利用高斯濾波進行去噪、以脊柱為原點對其他關節(jié)坐標進行平移等預處理后,提取快速傅立葉變換(FFT)的振幅作為特征,運行Z函數(shù)進行特征歸一化,降維后選擇與睡眠質量相關性高的特征訓練機器學習模型來預測睡眠質量,這體現(xiàn)了Kinect在獲取步態(tài)信息以及利用步態(tài)信息進行相關研究的可行性,也從側面反映出步態(tài)信息與人體生理、心理狀態(tài)的緊密聯(lián)系,為情緒識別研究提供了有益參考。然而,現(xiàn)有研究仍存在一些不足之處。在Kinect步態(tài)信息采集方面,雖然對采集范圍和精度有了一定的研究成果,但不同個體的身體特征、行走習慣以及環(huán)境因素等仍會對采集數(shù)據的準確性和穩(wěn)定性產生較大影響,目前還缺乏一種能夠有效消除這些干擾因素的通用方法。在基于步態(tài)的情緒識別研究中,所涉及的情緒種類相對較少,大多集中在幾種常見情緒,對于一些復雜情緒或混合情緒的識別研究還較為匱乏。而且,不同研究采用的數(shù)據集、特征提取方法和分類算法各不相同,導致研究結果之間缺乏可比性,難以建立統(tǒng)一的評估標準。此外,現(xiàn)有的情緒識別模型在實際應用中的實時性和魯棒性還有待提高,如何將實驗室研究成果轉化為實際可用的產品或系統(tǒng),仍面臨諸多挑戰(zhàn)。1.3研究內容與方法本文圍繞基于Kinect步態(tài)信息的情緒識別展開研究,具體研究內容涵蓋Kinect步態(tài)信息采集原理剖析、關鍵特征提取以及高效識別算法的探索等方面。在Kinect步態(tài)信息采集原理研究中,深入剖析Kinect設備內部集成的深度攝像頭、彩色攝像頭和麥克風等多種傳感器的協(xié)同工作機制。探究深度攝像頭如何利用紅外技術獲取人體的深度圖像,進而精確計算出人體關節(jié)的三維位置信息;分析彩色攝像頭所提供的彩色圖像在輔助識別關節(jié)細節(jié)以及人體輪廓方面的作用;研究麥克風所采集的音頻數(shù)據是否能與步態(tài)信息相結合,為情緒識別提供更多維度的信息。此外,還需考慮不同型號Kinect設備在采集性能上的差異,以及如何根據實際應用場景選擇最合適的設備和設置最優(yōu)的采集參數(shù),以確保采集到的步態(tài)信息準確、完整且穩(wěn)定。步態(tài)特征提取是情緒識別的關鍵環(huán)節(jié)。本文將全面提取步態(tài)的時空特征,時間特征方面,重點分析步行周期、步頻等參數(shù)。步行周期反映了行走過程中一個完整步伐的時間跨度,不同情緒狀態(tài)下,步行周期可能會發(fā)生顯著變化,例如在憤怒情緒下,人們可能會加快步伐,導致步行周期縮短;步頻則體現(xiàn)了單位時間內的步數(shù),它與情緒的興奮程度密切相關,興奮情緒往往伴隨著較高的步頻。空間特征上,著重研究步幅、關節(jié)角度等信息。步幅即一步的長度,情緒會影響人的行走姿態(tài),進而改變步幅大小,如悲傷情緒下,可能會出現(xiàn)步幅變小的情況;關節(jié)角度能夠反映人體各部位的運動狀態(tài),不同關節(jié)角度的組合可以揭示出特定的情緒模式,比如髖關節(jié)和膝關節(jié)的彎曲程度在不同情緒下會有所不同。同時,挖掘身體姿態(tài)特征,包括身體的傾斜度、重心的分布與轉移等,這些特征在情緒表達中同樣具有重要作用,身體過度前傾可能暗示著焦慮情緒,而重心的不穩(wěn)定轉移則可能與緊張情緒相關。在識別算法方面,采用支持向量機(SVM)、隨機森林等傳統(tǒng)機器學習算法進行情緒識別實驗。對于SVM算法,深入研究其核函數(shù)的選擇和參數(shù)調整對識別性能的影響。不同的核函數(shù),如線性核、多項式核、徑向基核等,適用于不同類型的數(shù)據分布和特征空間,通過實驗對比,確定最適合Kinect步態(tài)信息的核函數(shù),并優(yōu)化相應的參數(shù),以提高分類準確率。對于隨機森林算法,分析決策樹的數(shù)量、特征選擇方式等參數(shù)對結果的影響,通過交叉驗證等方法,找到最優(yōu)的參數(shù)組合,使隨機森林在處理步態(tài)數(shù)據時能夠充分發(fā)揮其優(yōu)勢,準確地識別出不同的情緒類別。同時,探索深度學習算法,如卷積神經網絡(CNN)和循環(huán)神經網絡(RNN)在該領域的應用。CNN擅長提取圖像的局部特征,將Kinect采集到的步態(tài)圖像數(shù)據輸入CNN網絡,通過卷積層、池化層和全連接層等結構,自動學習步態(tài)圖像中的特征表示,從而實現(xiàn)情緒識別;RNN則特別適合處理具有時間序列特征的數(shù)據,對于步態(tài)信息中的時間序列數(shù)據,如關節(jié)位置隨時間的變化,RNN能夠捕捉到其中的長期依賴關系,通過隱藏層的循環(huán)結構,對時間序列進行建模,進而識別出不同情緒狀態(tài)下的步態(tài)模式。在研究過程中,主要采用實驗法和對比分析法。實驗法方面,搭建專門的實驗平臺,選取不同年齡段、性別和文化背景的受試者,讓他們在Kinect設備前進行多種情緒狀態(tài)下的行走實驗。為了激發(fā)受試者的真實情緒,采用多種刺激方式,如播放不同情緒的音樂、展示相應情緒的圖片或視頻片段,或者設置特定的情境任務,使受試者產生快樂、悲傷、憤怒、恐懼等不同情緒。在實驗過程中,嚴格控制實驗環(huán)境,確保光照、溫度、地面條件等因素保持一致,以減少環(huán)境因素對采集數(shù)據的干擾。同時,多次重復實驗,對每個受試者在每種情緒狀態(tài)下采集多組步態(tài)數(shù)據,以提高數(shù)據的可靠性和代表性。對比分析法主要用于對不同特征提取方法和識別算法的性能評估。將提取到的不同類型的步態(tài)特征,如時空特征、身體姿態(tài)特征等,分別與不同的識別算法相結合,通過對比它們在相同測試數(shù)據集上的識別準確率、召回率、F1值等指標,分析各種特征與算法組合的優(yōu)缺點。例如,對比僅使用時空特征的識別結果和同時使用時空特征與身體姿態(tài)特征的識別結果,評估身體姿態(tài)特征對識別性能的提升作用;對比SVM、隨機森林、CNN和RNN等算法在處理相同步態(tài)數(shù)據時的表現(xiàn),找出最適合基于Kinect步態(tài)信息的情緒識別算法。此外,還將本文所采用的方法與其他相關研究中的方法進行對比,進一步驗證本文方法的有效性和優(yōu)越性。二、Kinect步態(tài)信息采集原理2.1Kinect設備概述Kinect是微軟公司推出的一款具有創(chuàng)新性的體感設備,自問世以來,在多個領域引發(fā)了廣泛關注與應用。其發(fā)展歷程可追溯至2009年E3大展,當時以代號“ProjectNatal”首次亮相,旨在為Xbox360游戲主機提供全新的人機交互方式。2010年11月,正式命名為Kinect并發(fā)布,迅速在市場上掀起熱潮,上市60天內銷量便達到800萬臺,榮獲“最暢銷消費電子設備”吉尼斯世界紀錄。初代Kinect基于以色列公司PrimeSense的技術,集成了深度攝像頭、彩色攝像頭以及麥克風等多種關鍵組件,能夠實現(xiàn)實時手勢識別、身體骨骼檢測和語音識別等功能,徹底顛覆了傳統(tǒng)游戲的操作模式,將人機互動提升到了新的高度。隨著技術的不斷進步與用戶需求的日益增長,2013年5月,微軟推出了XboxOne及與之配套的Kinect2.0版本。相較于初代,Kinectv2在諸多方面實現(xiàn)了顯著升級。在硬件方面,增加了紅外圖像和時間飛行測量(ToF)等新技術,可視檢測范圍得到了極大拓展。其彩色攝像頭分辨率提升至1920×1080,幀率為30fps,能夠捕捉到更清晰、細膩的彩色圖像;深度攝像頭分辨率為512×424,幀率同樣為30fps,配合優(yōu)化后的關節(jié)提取技術,可根據深度信息精確提供人體25個關節(jié)的三維位置,為人體動作分析和步態(tài)信息采集提供了更為豐富和準確的數(shù)據基礎。在軟件算法上,Kinectv2也進行了優(yōu)化,提高了骨骼跟蹤的準確性和穩(wěn)定性,使其在復雜場景和多人運動情況下的表現(xiàn)更為出色。從硬件組成來看,Kinect設備猶如一個精密的傳感器集合體。它擁有三只“眼睛”,自左向右分別是紅外投影機、彩色攝像頭、紅外深度投影頭,以及四只“耳朵”—L形布局的麥克風陣列。紅外投影機主動投射近紅外光譜,當光譜照射到粗糙物體或穿透毛玻璃后,會形成隨機的反射斑點,即散斑,這些散斑能夠被紅外深度投影頭讀取。紅外深度投影頭通過分析紅外光譜,創(chuàng)建可視范圍內人體、物體的深度圖像,從而獲取物體與設備之間的距離信息,為后續(xù)的骨骼跟蹤和動作分析提供關鍵數(shù)據支持。彩色攝像頭則負責拍攝視角范圍內的彩色視頻圖像,為識別關節(jié)細節(jié)以及人體輪廓提供了豐富的視覺信息,例如通過彩色圖像可以更清晰地分辨人體的肢體動作和姿態(tài)變化,輔助精確確定關節(jié)位置。麥克風陣列能夠從4個方向采集聲音,并內置數(shù)字信號處理(DSP)等組件,可同時過濾背景噪聲,實現(xiàn)聲源定位,這一功能在語音識別和交互控制方面發(fā)揮著重要作用,在基于Kinect的智能家居控制系統(tǒng)中,用戶可以通過語音命令控制家電設備,麥克風陣列能夠準確捕捉用戶的聲音并進行處理。Kinect設備在步態(tài)信息采集中具有顯著優(yōu)勢。傳統(tǒng)的步態(tài)分析方法,如基于可穿戴慣性傳感器測試、足底壓力測試、肌電測試、二維圖像測試、三維標記點測試等,存在諸多局限性??纱┐鲬T性傳感器測試需將陀螺儀和加速度器同時使用才能捕捉人體運動過程,確定人體世界坐標系中的運動軌跡時算法復雜且精度低,穿戴過程復雜,實驗重復性差,難以實現(xiàn)關節(jié)解剖位置的監(jiān)測;足底壓力測試僅能檢測足底壓力隨時間的變換情況,無法記錄步態(tài)運動的整個周期,因為步態(tài)運動中的擺動階段與地面無接觸,無法捕捉完整的周期,且足底力捕捉信息單一,步態(tài)捕捉時間短;肌電測試是針對下肢運動肌肉的檢測,從隱含信息對步態(tài)進行測試,缺乏直觀性,信息類型少;二維圖像測試方法識別精度較低,只能記錄人體運動的二維信息,丟失信息較多;三維紅外標記點測試系統(tǒng)雖然可以刻畫出人體的三維運動,測試精度較高,但設備造價高昂,捕捉空間有限,操作時需要在人體上粘貼多個標記點,不僅需要專業(yè)的解剖學知識,還容易產生隨機粘貼位置誤差。相比之下,Kinect設備無需受試者穿戴或粘貼任何傳感器,僅通過其內置的傳感器即可實現(xiàn)非侵入式的步態(tài)信息采集,大大提高了受試者的舒適度和實驗的便捷性。它能夠實時獲取人體的三維骨骼信息,涵蓋了人體多個關節(jié)的位置和運動數(shù)據,實現(xiàn)對步態(tài)的全方位、多角度分析,有效避免了二維圖像測試方法中信息丟失的問題。而且,Kinect設備價格相對低廉,對場地要求低,易于搭建實驗環(huán)境,使其在步態(tài)分析研究和實際應用中具有廣泛的適用性,無論是在實驗室研究還是臨床診斷、康復訓練等場景中,都能發(fā)揮重要作用。2.2步態(tài)信息采集過程2.2.1數(shù)據采集環(huán)境搭建為了確保Kinect能夠準確、穩(wěn)定地采集步態(tài)信息,搭建合適的實驗環(huán)境至關重要。實驗場地應選擇在室內空曠、光線均勻且安靜的空間,以避免外界干擾對數(shù)據采集造成影響。場地面積需滿足受試者能夠進行自然、不受限制的行走,一般建議場地長度不小于5米,寬度不小于3米,這樣可以保證受試者有足夠的空間完成多個完整的步行周期,同時也便于Kinect全方位捕捉其步態(tài)信息。在設備擺放位置方面,以Kinectv2為例,傳統(tǒng)觀點認為將其放置在受試者前方1.2-1.5米、距地面高0.8-1.2米處,可較為完整地獲取人體全身深度圖像。但CLARK等學者基于Kinectv2對30名卒中患者進行步態(tài)分析后,認為最佳步態(tài)捕獲范圍為距Kinectv21.5-3.5米。綜合考慮,在本次研究中,將Kinectv2固定在三腳架上,放置于受試者行走路線的正前方,距離受試者約2米,高度調整至1米,使其光軸與受試者的髖關節(jié)高度平齊。這樣的位置設置能夠保證Kinect的可視范圍覆蓋受試者的全身,有效捕捉到從頭部到腳部的關節(jié)運動信息,同時避免因距離過近或過遠導致的信息丟失或畸變。為了確保Kinect在采集過程中保持穩(wěn)定,三腳架應放置在平穩(wěn)的地面上,并使用水平儀進行校準,防止設備傾斜影響數(shù)據采集的準確性。場景布置上,地面應保持平整、干燥且摩擦力適中,以模擬日常生活中的正常行走環(huán)境,避免因地面狀況不佳導致受試者行走姿態(tài)異常,從而影響步態(tài)數(shù)據的真實性。在地面上用醒目的標記劃分出受試者的行走路線,例如使用彩色膠帶或地貼標記出一條寬度約為1米的直線,引導受試者沿直線行走,保證每次行走的路徑一致性,便于后續(xù)的數(shù)據對比和分析。同時,在場地周圍設置明顯的邊界標識,提醒受試者注意行走范圍,避免走出Kinect的有效采集區(qū)域。為了控制光線條件,實驗室內應采用均勻、柔和的照明,避免強光直射或陰影遮擋??墒褂米匀还馀c人工照明相結合的方式,在白天進行實驗時,拉上窗簾避免陽光直射,同時開啟室內的LED平板燈補充光線,確保光照強度在200-500勒克斯之間,這樣的光線條件既能保證Kinect彩色攝像頭獲取清晰的圖像,又不會對受試者的視覺產生干擾,影響其正常行走。此外,為了消除環(huán)境噪音對音頻采集的影響,實驗室門窗應保持關閉,必要時可使用隔音材料對實驗室進行簡單的隔音處理,確保采集到的音頻數(shù)據純凈,不包含過多的背景雜音,以便后續(xù)分析音頻數(shù)據與步態(tài)信息之間的潛在關聯(lián)。2.2.2采集參數(shù)設置在使用Kinect進行步態(tài)信息采集時,合理設置采集參數(shù)對于獲取高質量的數(shù)據至關重要。Kinectv2可獲取RGB圖像和深度信息,其中RGB圖像分辨率為1920×1080,幀率為30fps;深度信息分辨率為512×424,幀率同樣為30fps。這些參數(shù)的設置直接影響著采集數(shù)據的精度和細節(jié)。分辨率方面,RGB圖像的高分辨率(1920×1080)能夠捕捉到豐富的色彩和紋理信息,對于識別受試者的身體輪廓、服裝細節(jié)以及關節(jié)部位的細微動作具有重要作用。在分析步態(tài)時,通過高分辨率的RGB圖像,可以更清晰地觀察到受試者手臂的擺動幅度、腿部的彎曲程度以及身體的扭轉姿態(tài)等,這些視覺信息有助于輔助判斷步態(tài)的準確性和完整性。例如,在判斷髖關節(jié)的運動狀態(tài)時,高分辨率圖像能夠清晰顯示髖關節(jié)周圍的肌肉和皮膚的變化,為準確測量髖關節(jié)角度提供更可靠的依據。然而,高分辨率也意味著更大的數(shù)據量和更高的計算資源需求,如果計算機性能不足,可能會導致數(shù)據采集過程中的卡頓或丟幀現(xiàn)象,影響數(shù)據的連續(xù)性和穩(wěn)定性。深度信息分辨率為512×424,雖然相對RGB圖像分辨率較低,但對于獲取人體的三維空間位置信息已經足夠。深度圖像能夠精確測量人體各部位與Kinect之間的距離,從而構建出人體的三維骨骼模型。較高的深度分辨率可以更準確地確定關節(jié)的三維坐標,提高骨骼跟蹤的精度,對于計算步幅、步頻以及關節(jié)角度等步態(tài)參數(shù)具有關鍵作用。在計算步幅時,精確的深度信息能夠準確測量雙腳在不同時刻的空間位置,從而得出準確的步幅長度。但同樣,深度分辨率的提高也會增加數(shù)據處理的難度和時間,需要在保證數(shù)據精度的前提下,綜合考慮計算資源和采集效率。幀率設置為30fps,即每秒采集30幀圖像。幀率的高低決定了數(shù)據的時間分辨率,較高的幀率能夠更細致地捕捉到步態(tài)的動態(tài)變化,對于分析快速動作和微小的時間差異非常重要。在快速行走或情緒激動導致步態(tài)變化較為劇烈的情況下,30fps的幀率能夠及時捕捉到這些瞬間的變化,保證數(shù)據的完整性和準確性。如果幀率過低,可能會遺漏一些關鍵的動作細節(jié),導致步態(tài)參數(shù)計算出現(xiàn)偏差。例如,在計算步頻時,如果幀率過低,可能會將一些快速的步伐合并或遺漏,從而得出錯誤的步頻數(shù)據。然而,過高的幀率也會帶來數(shù)據量的大幅增加,對存儲和傳輸設備提出更高的要求,同時可能會增加系統(tǒng)的負擔,影響采集的穩(wěn)定性。在實際采集過程中,還需要根據具體的實驗需求和設備性能對這些參數(shù)進行適當調整。如果計算機性能較強,且對數(shù)據精度要求極高,可以嘗試適當提高分辨率或幀率,以獲取更詳細的步態(tài)信息;反之,如果設備性能有限,為了保證采集過程的穩(wěn)定性和流暢性,可能需要降低分辨率或幀率,在數(shù)據精度和采集效率之間尋求平衡。還可以通過多次實驗,對比不同參數(shù)設置下采集到的數(shù)據質量和分析結果,確定最適合本次研究的參數(shù)組合,從而為后續(xù)的步態(tài)特征提取和情緒識別提供高質量的數(shù)據基礎。2.3采集案例分析為了更深入地探究Kinect步態(tài)信息采集方法的可行性與有效性,以某高校實驗室開展的一項基于Kinectv2的情緒相關步態(tài)研究為例進行詳細分析。在該研究中,招募了50名年齡在18-25歲之間的健康大學生作為受試者,其中男性25名,女性25名,旨在通過Kinectv2采集不同情緒狀態(tài)下的步態(tài)信息,進而探索步態(tài)與情緒之間的關聯(lián)。在數(shù)據采集過程中,研究人員嚴格按照前文所述的采集環(huán)境搭建和參數(shù)設置方法進行操作。將Kinectv2固定在三腳架上,放置于受試者行走路線正前方2米處,高度為1米,確保設備穩(wěn)定且光軸與受試者髖關節(jié)高度平齊。實驗場地為室內平整的走廊,長度約為8米,寬度為2米,地面用彩色膠帶標記出1米寬的直線行走區(qū)域。室內采用自然光與LED平板燈混合照明,光照強度控制在300勒克斯左右,同時關閉門窗以減少環(huán)境噪音干擾。在采集過程中,研究人員也遇到了一些問題。部分受試者在行走過程中由于緊張或對實驗環(huán)境不熟悉,出現(xiàn)了行走姿態(tài)不自然的情況,導致采集到的步態(tài)數(shù)據存在異常。針對這一問題,研究人員在正式采集前增加了適應環(huán)節(jié),讓受試者在實驗場地進行多次預行走,熟悉環(huán)境和行走要求,同時與受試者進行充分溝通,緩解其緊張情緒,有效減少了因緊張導致的步態(tài)異常情況。由于實驗在白天進行,盡管采取了控制措施,但自然光的微弱變化仍對Kinect的彩色攝像頭采集圖像產生了一定影響,導致部分圖像色彩飽和度不穩(wěn)定。研究人員通過實時監(jiān)測圖像質量,一旦發(fā)現(xiàn)色彩異常,立即暫停采集,調整窗簾遮擋角度或微調燈光亮度,確保采集到的彩色圖像質量穩(wěn)定。經過一系列的數(shù)據采集和處理,研究人員成功獲取了大量的步態(tài)數(shù)據。通過對這些數(shù)據的分析,發(fā)現(xiàn)不同情緒狀態(tài)下受試者的步態(tài)特征確實存在明顯差異。在快樂情緒狀態(tài)下,受試者的步幅明顯增大,步頻加快,行走過程中身體擺動幅度也相對較大,表現(xiàn)出較為輕松、愉悅的行走姿態(tài);而在悲傷情緒下,步幅減小,步頻降低,身體重心相對較低,行走時顯得較為沉重、遲緩。這些結果與前人研究中關于情緒與步態(tài)關系的理論相符合,進一步驗證了基于Kinect步態(tài)信息進行情緒識別的可行性。通過對采集過程中遇到問題的有效解決,保證了數(shù)據的質量和可靠性,為后續(xù)的情緒識別研究提供了堅實的數(shù)據基礎,也證明了本文所采用的Kinect步態(tài)信息采集方法在實際應用中的有效性和可操作性。三、基于Kinect的步態(tài)特征提取3.1步態(tài)特征分類步態(tài)特征作為反映人體行走模式的關鍵信息,其分類多樣且復雜,不同類型的特征從不同角度揭示了步態(tài)的本質和特點。常見的步態(tài)特征主要分為時空特征、運動學特征和動力學特征三大類,每一類特征都蘊含著豐富的信息,對于基于Kinect步態(tài)信息的情緒識別研究具有重要意義。時空特征是描述步態(tài)在時間和空間維度上的基本屬性,它直觀地反映了人體行走的節(jié)奏和空間軌跡,是步態(tài)分析中最基礎、最常用的特征類型之一。在時間特征方面,步行周期是一個重要參數(shù),它指的是從一側足跟著地到同側足跟再次著地的時間間隔,完整地涵蓋了一次行走的全過程。步行周期的長短直接反映了行走的快慢節(jié)奏,不同情緒狀態(tài)下,人體的生理和心理變化會導致步行周期發(fā)生顯著改變。憤怒情緒往往會使人產生緊張、激動的生理反應,促使身體加快運動節(jié)奏,進而導致步行周期縮短;而悲傷情緒則可能引發(fā)身體的疲勞感和低落的精神狀態(tài),使得步行周期延長。步頻也是一個關鍵的時間特征,它表示單位時間內行走的步數(shù),是衡量行走速度和節(jié)奏的重要指標。步頻與情緒的興奮程度密切相關,當人處于興奮、愉悅的情緒狀態(tài)時,步頻通常會加快,以表達內心的積極情感;相反,在沮喪、消沉的情緒狀態(tài)下,步頻會明顯降低,體現(xiàn)出行動的遲緩與無力??臻g特征同樣豐富多樣,步幅是其中一個重要的空間參數(shù),它是指行走時左右足跟之間的水平距離,反映了人體在行走過程中每一步跨越的空間范圍。步幅的大小受到多種因素的影響,包括身體的生理結構、運動習慣以及情緒狀態(tài)等。情緒對步幅的影響較為顯著,快樂情緒會使人的身體處于放松、舒展的狀態(tài),進而導致步幅增大,行走時顯得更加輕快、自信;而焦慮情緒則可能使人的身體處于緊張、收縮的狀態(tài),使得步幅減小,行走時表現(xiàn)出小心翼翼、猶豫不決的姿態(tài)。關節(jié)角度也是空間特征中的重要組成部分,它反映了人體各關節(jié)在行走過程中的運動狀態(tài)和相對位置關系。不同關節(jié)角度的組合能夠揭示出特定的情緒模式,髖關節(jié)和膝關節(jié)的彎曲程度在不同情緒下會有所不同。在憤怒情緒下,髖關節(jié)和膝關節(jié)的彎曲角度可能會相對減小,使身體呈現(xiàn)出一種挺直、僵硬的姿態(tài),以表達內心的不滿和攻擊性;而在恐懼情緒下,髖關節(jié)和膝關節(jié)的彎曲角度可能會增大,身體呈現(xiàn)出蜷縮、下蹲的姿態(tài),以尋求自我保護。運動學特征主要描述人體在行走過程中的運動狀態(tài)和變化規(guī)律,它通過對關節(jié)的運動軌跡、速度、加速度等參數(shù)的分析,深入揭示了步態(tài)的動態(tài)特性。關節(jié)的運動軌跡是運動學特征中的一個重要方面,它記錄了關節(jié)在三維空間中的運動路徑,反映了人體在行走過程中各部位的運動方式和協(xié)調關系。不同情緒狀態(tài)下,關節(jié)的運動軌跡會發(fā)生明顯變化,這些變化可以作為情緒識別的重要依據。在高興時,手臂的擺動軌跡可能會更加流暢、自然,幅度較大,且擺動頻率與步頻相協(xié)調,呈現(xiàn)出一種歡快、輕松的節(jié)奏;而在悲傷時,手臂的擺動軌跡可能會變得僵硬、遲緩,幅度較小,且擺動頻率不穩(wěn)定,表現(xiàn)出一種沉重、壓抑的情緒。速度和加速度是運動學特征中的另外兩個關鍵參數(shù),它們反映了人體在行走過程中的運動快慢和變化趨勢。速度是指單位時間內人體移動的距離,加速度則是速度隨時間的變化率。不同情緒狀態(tài)下,人體的速度和加速度會發(fā)生相應的改變,這些改變能夠直觀地反映出情緒的強度和性質。在憤怒情緒下,人體的速度可能會突然加快,加速度增大,表現(xiàn)出一種強烈的攻擊性和沖動性;而在恐懼情緒下,人體的速度可能會先減慢,然后在某些情況下突然加快,加速度變化不穩(wěn)定,反映出內心的驚恐和不安。動力學特征主要研究人體在行走過程中與地面之間的相互作用力,以及這些力對人體運動產生的影響,它從力學的角度揭示了步態(tài)的本質和內在機制。地面反作用力是動力學特征中的核心參數(shù)之一,它是指人體在行走時,地面給予人體的反作用力,其大小、方向和作用時間能夠反映出人體的體重分布、重心轉移以及行走的穩(wěn)定性等信息。在不同情緒狀態(tài)下,地面反作用力會發(fā)生顯著變化,這些變化與情緒之間存在著密切的關聯(lián)。在自信的情緒狀態(tài)下,人體的重心相對穩(wěn)定,地面反作用力分布均勻,且作用力較大,表現(xiàn)出一種堅定、有力的行走姿態(tài);而在緊張情緒下,人體的重心可能會出現(xiàn)不穩(wěn)定的波動,地面反作用力分布不均勻,且作用力較小,行走時顯得較為慌亂、缺乏自信。力矩也是動力學特征中的一個重要參數(shù),它是力與力臂的乘積,反映了力對物體轉動的作用效果。在行走過程中,力矩的變化能夠反映出人體關節(jié)的運動狀態(tài)和肌肉的發(fā)力情況。不同情緒狀態(tài)下,人體的肌肉緊張程度和關節(jié)運動方式會發(fā)生改變,從而導致力矩發(fā)生相應的變化。在憤怒情緒下,肌肉緊張度增加,關節(jié)的力矩增大,使得行走時的動作更加有力、急促;而在放松情緒下,肌肉松弛,關節(jié)的力矩減小,行走時的動作則更加柔和、舒緩。3.2特征提取方法3.2.1傳統(tǒng)特征提取算法傳統(tǒng)的步態(tài)特征提取算法種類繁多,其中基于幾何模型的方法和基于統(tǒng)計分析的方法在早期的步態(tài)分析研究中占據重要地位,它們各自具有獨特的原理和應用場景,同時也存在一定的優(yōu)缺點。基于幾何模型的方法主要通過建立人體的幾何模型,利用模型的參數(shù)來描述步態(tài)特征。這種方法通常將人體簡化為一系列的關節(jié)和連桿,通過測量關節(jié)的位置、角度以及連桿的長度等參數(shù),來構建步態(tài)的幾何表示。在常見的基于幾何模型的方法中,有學者將人體視為由多個剛性連桿連接而成的多剛體系統(tǒng),通過測量髖關節(jié)、膝關節(jié)和踝關節(jié)等主要關節(jié)的角度變化,來描述下肢的運動狀態(tài)。在行走過程中,髖關節(jié)的屈伸角度、膝關節(jié)的彎曲程度以及踝關節(jié)的背屈和跖屈角度等參數(shù),能夠反映出人體下肢的運動模式和步態(tài)特征。通過分析這些關節(jié)角度在一個步行周期內的變化曲線,可以提取出諸如步幅、步頻、支撐相和擺動相的時間比例等關鍵步態(tài)參數(shù)。基于幾何模型的方法具有一定的優(yōu)勢。由于它直接基于人體的生理結構和運動學原理,所提取的特征具有明確的物理意義,易于理解和解釋。在醫(yī)學領域,醫(yī)生可以根據這些具有明確物理意義的特征,直觀地判斷患者的步態(tài)是否正常,以及可能存在的運動障礙問題。該方法對不同個體的適應性較強,因為人體的基本生理結構和運動模式具有一定的共性,只要能夠準確測量關節(jié)參數(shù),就可以應用于不同的個體。然而,這種方法也存在明顯的局限性。在實際應用中,準確測量關節(jié)的位置和角度是一項具有挑戰(zhàn)性的任務,尤其是在復雜的運動場景下,受到遮擋、噪聲等因素的影響,測量精度難以保證。而且,該方法通常只能描述人體的整體運動特征,對于一些細微的運動變化和局部特征的捕捉能力較弱,無法全面反映步態(tài)的復雜性和多樣性。基于統(tǒng)計分析的方法則是通過對步態(tài)數(shù)據進行統(tǒng)計分析,提取出能夠表征步態(tài)特征的統(tǒng)計量。這種方法通常先對采集到的步態(tài)數(shù)據進行預處理,去除噪聲和異常值,然后計算數(shù)據的均值、方差、協(xié)方差等統(tǒng)計量,以及一些基于概率分布的特征,如概率密度函數(shù)、自相關函數(shù)等。有研究通過計算步態(tài)數(shù)據中各個關節(jié)位置的均值和方差,來描述關節(jié)運動的穩(wěn)定性和變化范圍。均值可以反映關節(jié)在一段時間內的平均位置,方差則可以衡量關節(jié)位置的波動程度,通過這些統(tǒng)計量,可以對不同個體或不同情緒狀態(tài)下的步態(tài)特征進行比較和分析?;诮y(tǒng)計分析的方法的優(yōu)點在于它能夠充分利用數(shù)據的統(tǒng)計特性,對數(shù)據中的噪聲和干擾具有一定的魯棒性。在實際采集的步態(tài)數(shù)據中,往往會包含各種噪聲和干擾因素,基于統(tǒng)計分析的方法可以通過對大量數(shù)據的統(tǒng)計計算,提取出數(shù)據的總體特征,從而減少噪聲對特征提取的影響。該方法還可以通過統(tǒng)計檢驗等方法,對不同組別的步態(tài)數(shù)據進行顯著性差異分析,有助于發(fā)現(xiàn)潛在的步態(tài)模式和規(guī)律。然而,這種方法也存在一些缺點。它所提取的特征往往缺乏明確的物理意義,更多地是從數(shù)據的統(tǒng)計層面來描述步態(tài)特征,對于非專業(yè)人員來說,理解和解釋這些特征可能存在一定的困難。而且,基于統(tǒng)計分析的方法通常需要大量的數(shù)據來保證統(tǒng)計結果的可靠性,如果數(shù)據量不足,可能會導致提取的特征不準確,影響后續(xù)的分析和應用。3.2.2基于深度學習的特征提取隨著深度學習技術的迅猛發(fā)展,基于深度學習的步態(tài)特征提取方法在步態(tài)分析領域逐漸嶄露頭角,展現(xiàn)出了獨特的優(yōu)勢和巨大的潛力。卷積神經網絡(CNN)、循環(huán)神經網絡(RNN)及其變體在步態(tài)特征提取中得到了廣泛的應用,為解決傳統(tǒng)特征提取方法的局限性提供了新的思路和解決方案。卷積神經網絡(CNN)是一種專門為處理具有網格結構數(shù)據(如圖像、音頻等)而設計的深度學習模型,其核心特點是通過卷積層中的卷積核在數(shù)據上滑動進行卷積操作,自動提取數(shù)據的局部特征。在基于Kinect的步態(tài)特征提取中,CNN可以直接對Kinect采集到的包含人體步態(tài)信息的深度圖像或RGB圖像進行處理。CNN中的卷積層能夠通過卷積核的滑動,自動提取圖像中人體關節(jié)的位置、姿態(tài)以及動作變化等局部特征,池化層則可以對提取到的特征進行降維,減少計算量的同時保留重要的特征信息。在處理步態(tài)深度圖像時,卷積層可以學習到不同關節(jié)之間的空間關系和運動模式,通過多層卷積和池化操作,逐步提取出高層次的步態(tài)特征表示。與傳統(tǒng)的基于手工設計特征的方法相比,CNN具有顯著的優(yōu)勢。它能夠自動學習到數(shù)據中的復雜特征,避免了人工設計特征的主觀性和局限性。傳統(tǒng)方法需要專家根據經驗和領域知識設計特征提取算法,而CNN通過大量的數(shù)據訓練,可以發(fā)現(xiàn)那些難以通過手工設計捕捉到的細微特征和模式,從而提高特征提取的準確性和有效性。CNN對不同場景和個體的適應性更強,由于其強大的學習能力,能夠在不同的光照條件、拍攝角度以及個體差異等情況下,準確地提取步態(tài)特征,具有較高的魯棒性。循環(huán)神經網絡(RNN)則特別適合處理具有時間序列特征的數(shù)據,它通過隱藏層的循環(huán)結構,能夠捕捉到時間序列數(shù)據中的長期依賴關系。在步態(tài)分析中,人體的行走過程是一個連續(xù)的時間序列,關節(jié)的位置和運動狀態(tài)隨時間不斷變化,RNN能夠很好地處理這種時間序列數(shù)據。RNN可以將每個時間步的步態(tài)數(shù)據作為輸入,通過隱藏層的循環(huán)計算,將之前時間步的信息傳遞到當前時間步,從而捕捉到步態(tài)數(shù)據中的時間依賴關系。在分析步行周期時,RNN可以根據之前時間步的關節(jié)位置和運動信息,準確地預測當前時間步的步態(tài)狀態(tài),進而提取出與步行周期相關的特征。RNN的變體長短期記憶網絡(LSTM)和門控循環(huán)單元(GRU)在步態(tài)特征提取中也表現(xiàn)出了卓越的性能。LSTM通過引入輸入門、遺忘門和輸出門,有效地解決了RNN在處理長期依賴關系時的梯度消失和梯度爆炸問題,能夠更好地捕捉長時間序列中的關鍵信息。在步態(tài)分析中,LSTM可以記住較長時間內的步態(tài)變化,對于識別那些需要依賴歷史信息的步態(tài)特征,如情緒對步態(tài)的長期影響,具有重要的作用。GRU則在LSTM的基礎上進行了簡化,減少了參數(shù)數(shù)量,提高了計算效率,同時仍然保留了對時間序列數(shù)據的處理能力,在一些對計算資源有限的應用場景中具有優(yōu)勢?;谏疃葘W習的特征提取方法為步態(tài)分析帶來了新的突破和發(fā)展。CNN和RNN及其變體通過自動學習和捕捉數(shù)據中的時空特征,克服了傳統(tǒng)特征提取方法的諸多不足,為基于Kinect步態(tài)信息的情緒識別提供了更加準確、高效的特征表示,推動了該領域的研究不斷向前發(fā)展。3.3特征選擇與優(yōu)化在基于Kinect步態(tài)信息的情緒識別研究中,特征選擇是至關重要的環(huán)節(jié)。從Kinect采集到的原始步態(tài)數(shù)據中提取的特征數(shù)量眾多,其中包含一些冗余或與情緒識別相關性較低的特征。這些冗余特征不僅會增加計算負擔,延長模型訓練時間,還可能引入噪聲,干擾模型的學習過程,導致模型的泛化能力下降,影響情緒識別的準確率。通過合理的特征選擇,可以去除這些冗余和無關特征,保留與情緒識別最相關的關鍵特征,從而降低數(shù)據維度,提高模型的訓練效率和識別性能。常用的特征選擇方法包括過濾法、包裹法和嵌入法。過濾法是基于特征的統(tǒng)計特性進行選擇,在模型訓練之前完成,計算速度快,適用于高維數(shù)據集。常見的過濾法有方差選擇法、卡方檢驗、皮爾遜相關系數(shù)等。方差選擇法通過計算每個特征的方差,剔除方差低于某個閾值的特征,因為方差過低意味著特征的變動不大,攜帶的信息量少,對模型的貢獻有限。在處理步態(tài)數(shù)據時,如果某個關節(jié)角度特征的方差極小,說明該角度在不同情緒狀態(tài)下變化不明顯,可考慮將其剔除??ǚ綑z驗主要用于衡量特征與目標變量(情緒類別)之間的相關性,適用于分類問題,通過計算特征和標簽之間的獨立性來判斷特征的重要性。皮爾遜相關系數(shù)則用于衡量特征與目標變量之間的線性關系,值越接近1或-1,說明相關性越強,若某步態(tài)特征與情緒變量的皮爾遜相關系數(shù)接近0,則該特征可能與情緒識別無關,可被篩選掉。包裹法以模型性能為評價標準,通過訓練模型來選擇特征子集。遞歸特征消除(RFE)是常見的包裹法之一,它遞歸地訓練模型并去除性能最差的特征,直到找到最優(yōu)的特征子集。在基于Kinect步態(tài)信息的情緒識別中,可將支持向量機(SVM)作為基模型,利用RFE方法對提取的步態(tài)特征進行篩選。從所有特征開始,每次去除一個對SVM模型性能影響最小的特征,不斷重復這個過程,直到模型性能不再提升或達到預設的特征數(shù)量,從而得到最優(yōu)的特征組合。這種方法能找到較優(yōu)的特征子集,但需要多次訓練模型,計算開銷較大。嵌入法在模型訓練過程中進行特征選擇,利用某些機器學習算法自身的特性來評估特征的重要性。決策樹算法可以根據特征在樹的分裂中貢獻的信息增益來選擇特征,信息增益越大,說明該特征對分類的貢獻越大,越重要。在使用決策樹進行情緒識別時,算法會自動選擇那些對區(qū)分不同情緒類別貢獻較大的步態(tài)特征,如步幅、步頻等,而忽略那些不重要的特征。L1正則化(Lasso)也是一種嵌入法,它通過在損失函數(shù)中添加L1正則化項,使模型在訓練過程中自動將一些不重要特征的權重壓縮為零,從而達到特征選擇的目的。在對提取的特征進行優(yōu)化時,可以采用特征融合的方法。將不同類型的步態(tài)特征,如時空特征、運動學特征和動力學特征進行融合,能夠綜合利用多種特征的優(yōu)勢,為情緒識別提供更全面、豐富的信息。時空特征反映了步態(tài)的基本節(jié)奏和空間軌跡,運動學特征描述了關節(jié)的運動狀態(tài),動力學特征揭示了人體與地面的相互作用力,將這三類特征融合,可以從多個角度刻畫不同情緒狀態(tài)下的步態(tài)模式,提高識別準確率??梢圆捎弥鞒煞址治觯≒CA)對融合后的特征進行降維處理,PCA能夠將高維數(shù)據轉換為低維數(shù)據,在保留主要信息的同時去除噪聲和冗余,進一步提高模型的效率和性能。通過特征選擇與優(yōu)化,可以為基于Kinect步態(tài)信息的情緒識別模型提供更優(yōu)質的特征,提升模型的整體性能,使其在實際應用中更加準確、可靠。四、基于步態(tài)信息的情緒識別算法4.1機器學習算法在情緒識別中的應用4.1.1支持向量機(SVM)支持向量機(SupportVectorMachine,SVM)是一類按監(jiān)督學習方式對數(shù)據進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面。SVM的基本思想源于在高維空間中尋找一個最優(yōu)超平面,將不同類別的樣本盡可能清晰地分開。在二維空間或三維空間中,當存在兩個點集,若能找到一條直線或者平面將它們完全分開,則稱這兩個點集線性可分。對于線性可分的情況,SVM旨在找到這樣一個超平面,使得離超平面最近的點(即支持向量)到超平面的距離最大化,這個距離被稱為間隔。間隔越大,分類器的泛化能力越強,魯棒性越好。在實際應用中,數(shù)據往往并非線性可分,此時SVM通過引入松弛變量進行分析,并使用非線性映射將低維輸入空間映射到高維特征空間,在高維空間中尋找線性可分的超平面。為了避免高維空間中復雜的計算,SVM采用核函數(shù)技巧,通過核函數(shù)直接計算高維空間中向量的內積,而無需顯式地計算映射后的向量。常見的核函數(shù)有線性核、多項式核、徑向基核(RBF)等,不同的核函數(shù)適用于不同的數(shù)據分布和特征空間。線性核函數(shù)簡單直接,計算效率高,適用于線性可分的數(shù)據;多項式核函數(shù)可以處理具有一定非線性關系的數(shù)據;徑向基核函數(shù)則具有較強的非線性映射能力,能夠處理復雜的非線性數(shù)據分布,在基于Kinect步態(tài)信息的情緒識別中應用較為廣泛。在基于Kinect步態(tài)信息的情緒識別中,SVM展現(xiàn)出獨特的優(yōu)勢。由于步態(tài)數(shù)據具有高維度和復雜的非線性特征,SVM的非線性映射能力和核函數(shù)技巧能夠有效地處理這些數(shù)據,挖掘數(shù)據中的潛在模式和特征,從而實現(xiàn)準確的情緒分類。將提取到的步態(tài)時空特征、運動學特征和動力學特征等作為SVM的輸入,通過選擇合適的核函數(shù)和參數(shù)調整,SVM能夠學習到不同情緒狀態(tài)下步態(tài)特征的差異,進而對未知情緒的步態(tài)數(shù)據進行分類預測。然而,SVM也存在一些局限性。它對大規(guī)模數(shù)據集的處理效率較低,訓練時間較長,這是因為SVM在訓練過程中需要求解一個二次規(guī)劃問題,計算復雜度較高。當樣本數(shù)量較大時,計算量會顯著增加,導致訓練時間大幅延長。SVM的性能對參數(shù)選擇非常敏感,不同的核函數(shù)和參數(shù)設置會對分類結果產生較大影響。在實際應用中,需要通過大量的實驗和調參來確定最優(yōu)的參數(shù)組合,這增加了模型訓練的難度和工作量。而且,SVM主要用于二元分類問題,對于多分類問題,需要采用一些擴展方法,如“一對多”或“一對一”策略將多分類問題轉化為多個二分類問題進行處理,這在一定程度上增加了算法的復雜性和計算量。4.1.2隨機森林(RandomForest)隨機森林(RandomForest)是一種基于決策樹的集成學習算法,由LeoBreiman在2001年提出。它通過構建多個決策樹,并綜合這些決策樹的預測結果來提高分類或回歸的準確性。隨機森林的核心思想在于“隨機”和“集成”。隨機性體現(xiàn)在兩個方面:一是數(shù)據的隨機采樣,從原始數(shù)據集中通過有放回的抽樣方式生成多個子數(shù)據集,每個子數(shù)據集用于訓練一棵獨立的決策樹;二是特征的隨機選擇,在構建每棵決策樹時,每個節(jié)點的分裂過程只考慮一部分隨機選擇的特征,而不是所有特征。這種雙重隨機機制使得隨機森林中的每棵樹都具有較高的多樣性,從而降低了模型的過擬合風險,提高了模型的泛化能力。在基于Kinect步態(tài)信息的情緒識別中,隨機森林算法具有顯著的優(yōu)勢。它對數(shù)據的適應性強,能夠處理不同類型的特征,包括數(shù)值型、分類型等,對于步態(tài)數(shù)據中包含的時空特征、運動學特征和動力學特征等多種類型的特征都能有效處理。隨機森林在訓練過程中可以自動處理特征之間的相關性,無需進行復雜的特征工程和特征選擇,減少了人為干預的工作量。隨機森林的訓練過程可以并行處理,大大提高了訓練效率,適用于大規(guī)模數(shù)據集的訓練。在面對大量的Kinect步態(tài)數(shù)據時,能夠快速完成模型訓練,節(jié)省時間成本。而且,隨機森林可以輸出特征的重要性,幫助研究人員了解哪些步態(tài)特征對情緒識別的貢獻較大,從而有針對性地進行特征選擇和優(yōu)化,進一步提高模型的性能。與其他算法相比,隨機森林在處理高維數(shù)據和避免過擬合方面表現(xiàn)出色。支持向量機在處理大規(guī)模高維數(shù)據時計算復雜度較高,容易出現(xiàn)過擬合現(xiàn)象,而隨機森林通過隨機采樣和特征選擇,能夠有效降低過擬合風險,在高維的步態(tài)數(shù)據上具有更好的泛化能力。神經網絡算法雖然具有強大的學習能力,但訓練過程復雜,容易陷入局部最優(yōu)解,且對數(shù)據量和計算資源要求較高。隨機森林相對來說結構簡單,易于理解和實現(xiàn),對數(shù)據量和計算資源的要求相對較低,在實際應用中更加靈活方便。然而,隨機森林也并非完美無缺,它的計算復雜度較高,構建多棵決策樹需要消耗較多的計算資源和時間。而且,隨機森林由多棵決策樹組成,其解釋性相對較差,難以直觀地理解模型的決策過程和依據。4.1.3樸素貝葉斯(NaiveBayes)樸素貝葉斯(NaiveBayes)是一種基于貝葉斯定理和特征條件獨立假設的分類方法。其核心原理是通過已知的先驗概率和條件概率來計算后驗概率,從而對新數(shù)據進行分類。貝葉斯定理描述了兩個條件概率之間的關系,對于一個分類問題,給定樣本特征x,樣本屬于類別y的概率可以通過貝葉斯公式計算:P(y|x)=\frac{P(x|y)P(y)}{P(x)},其中P(y)是類別y的先驗概率,P(x|y)是在類別y下特征x出現(xiàn)的條件概率,P(x)是特征x的概率。樸素貝葉斯算法假設在分類確定的情況下,x的各特征相互獨立,這個假設簡化了計算過程,使得算法在處理大規(guī)模數(shù)據集時效率更高。在基于Kinect步態(tài)信息的情緒識別中,樸素貝葉斯算法首先根據訓練集中不同情緒狀態(tài)下的步態(tài)特征,計算出各類別(情緒)的先驗概率以及每個特征在不同類別下的條件概率。當有新的步態(tài)數(shù)據輸入時,利用貝葉斯定理計算該數(shù)據屬于各個情緒類別的后驗概率,將其分類到后驗概率最大的類別中。樸素貝葉斯算法具有計算簡單、效率高的優(yōu)點,在處理大規(guī)模數(shù)據時能夠快速完成訓練和分類任務。它對缺失數(shù)據不太敏感,在數(shù)據存在部分缺失的情況下仍能保持較好的性能。而且,由于其基于概率模型,具有一定的可解釋性,能夠直觀地展示每個特征對分類結果的影響程度。然而,樸素貝葉斯算法的性能高度依賴于其特征條件獨立假設,在實際的步態(tài)數(shù)據中,特征之間往往存在一定的相關性,這可能導致該假設不成立,從而影響分類的準確性。樸素貝葉斯算法在處理復雜的非線性關系時能力有限,對于具有復雜分布的步態(tài)數(shù)據,其分類效果可能不如一些非線性分類算法,如支持向量機和隨機森林等。在基于Kinect步態(tài)信息的情緒識別應用中,需要根據數(shù)據的特點和實際需求,綜合考慮樸素貝葉斯算法的優(yōu)缺點,謹慎選擇使用。4.2深度學習算法在情緒識別中的應用4.2.1長短期記憶網絡(LSTM)長短期記憶網絡(LongShort-TermMemory,LSTM)是一種特殊的循環(huán)神經網絡(RNN),由SeppHochreiter和JürgenSchmidhuber于1997年提出,旨在解決傳統(tǒng)RNN在處理長序列數(shù)據時面臨的梯度消失和梯度爆炸問題,以及對長期依賴關系建模能力不足的缺陷。LSTM的核心結構是記憶單元(MemoryCell),它類似于一個傳送帶,能夠在序列處理過程中長時間保存和傳遞信息。記憶單元通過三個門控機制來控制信息的流入、流出和遺忘,這三個門分別是遺忘門(ForgetGate)、輸入門(InputGate)和輸出門(OutputGate)。遺忘門決定從上一個時間步長的記憶單元狀態(tài)中丟棄哪些信息,它通過一個sigmoid層實現(xiàn),該層以當前的輸入x_t和上一時刻的隱藏狀態(tài)h_{t-1}為輸入,輸出一個在0到1之間的值f_t,這個值表示要遺忘信息的比例,越接近0意味著越應該丟棄,越接近1意味著越應該保留。輸入門決定將哪些新信息添加到記憶單元C_t中,以此來更新細胞狀態(tài),它由一個sigmoid層和一個tanh層組成,sigmoid層輸出i_t,決定要更新的信息的比例,tanh層生成可能需要添加到細胞狀態(tài)的新信息\tilde{C}_t,最后將i_t與\tilde{C}_t相乘,得到需要添加到記憶單元的信息,與上一時刻的記憶單元狀態(tài)C_{t-1}進行融合,更新記憶單元狀態(tài)C_t=f_t*C_{t-1}+i_t*\tilde{C}_t。輸出門決定細胞狀態(tài)的哪些部分將作為當前時刻的輸出,它同樣由一個sigmoid層和一個tanh層組成,sigmoid層輸出o_t,確定輸出的比例,tanh層對細胞狀態(tài)進行處理得到\tanh(C_t),然后與o_t相乘,得到最終的輸出h_t=o_t*\tanh(C_t),h_t既作為當前時刻的輸出,也會傳遞到下一個時間步,參與下一個時間步的計算。在基于Kinect步態(tài)信息的情緒識別中,LSTM具有顯著的優(yōu)勢。步態(tài)數(shù)據是典型的時間序列數(shù)據,人體行走過程中關節(jié)的位置、角度等信息隨時間不斷變化,不同情緒狀態(tài)下這些變化呈現(xiàn)出不同的模式和規(guī)律。LSTM能夠有效捕捉這些時間序列數(shù)據中的長期依賴關系,通過記憶單元對歷史信息的保存和門控機制對信息的篩選,它可以記住較長時間內的步態(tài)變化,從而準確識別出那些需要依賴歷史信息的步態(tài)特征與情緒之間的關聯(lián)。在識別憤怒情緒時,LSTM可以根據之前多個時間步的步態(tài)特征,如步頻加快、步幅增大、身體擺動幅度增加等信息的持續(xù)變化模式,準確判斷出當前的情緒狀態(tài)。與傳統(tǒng)的RNN相比,LSTM在處理步態(tài)序列數(shù)據進行情緒識別時表現(xiàn)更為出色。傳統(tǒng)RNN由于梯度消失和梯度爆炸問題,在處理長序列數(shù)據時難以捕捉到較遠時間步的相關信息,導致對長期依賴關系的建模能力較弱。而LSTM通過門控機制,有效地解決了這些問題,使得誤差在反向傳播過程中能夠更穩(wěn)定地在時間序列中傳播,從而更好地學習長期依賴關系,提高了情緒識別的準確率和穩(wěn)定性。一些研究將LSTM應用于基于Kinect步態(tài)信息的情緒識別實驗中,實驗結果表明,LSTM能夠準確地學習到不同情緒狀態(tài)下步態(tài)的時間序列特征,與其他傳統(tǒng)分類算法相比,在識別準確率上有顯著提升,驗證了LSTM在該領域的有效性和優(yōu)越性。4.2.2卷積神經網絡(CNN)與LSTM結合卷積神經網絡(ConvolutionalNeuralNetwork,CNN)與長短期記憶網絡(LSTM)的結合,為基于Kinect步態(tài)信息的情緒識別提供了一種強大的模型架構,充分融合了兩者在特征提取和時間序列處理方面的優(yōu)勢。CNN主要擅長提取數(shù)據的局部特征,其獨特的卷積層和池化層結構使其在處理圖像、音頻等具有網格結構的數(shù)據時表現(xiàn)出色。在基于Kinect的步態(tài)信息處理中,CNN可以直接對Kinect采集到的包含人體步態(tài)信息的深度圖像或RGB圖像進行處理。卷積層中的卷積核通過在圖像上滑動進行卷積操作,自動提取圖像中人體關節(jié)的位置、姿態(tài)以及動作變化等局部特征,不同大小和參數(shù)的卷積核可以捕捉到不同尺度的特征信息。池化層則對提取到的特征進行降維,通過最大池化或平均池化等操作,在保留重要特征的同時減少計算量,提高模型的訓練效率和泛化能力。通過多層卷積和池化操作,CNN能夠逐步提取出高層次的步態(tài)特征表示,這些特征能夠反映出人體在空間維度上的運動模式和結構信息。LSTM則專注于處理時間序列數(shù)據,能夠捕捉數(shù)據中的長期依賴關系。在步態(tài)分析中,人體的行走過程是一個連續(xù)的時間序列,關節(jié)的運動狀態(tài)隨時間不斷變化,LSTM通過其記憶單元和門控機制,可以有效地記住不同時間步的步態(tài)信息,并根據歷史信息對當前的步態(tài)狀態(tài)進行準確判斷和預測。將CNN與LSTM結合,可以充分利用兩者的優(yōu)勢。CNN首先對Kinect采集到的步態(tài)圖像數(shù)據進行特征提取,將圖像中的空間特征轉化為抽象的特征向量,這些特征向量包含了豐富的人體運動結構和局部特征信息。然后,將這些特征向量作為LSTM的輸入,LSTM再對這些特征向量進行時間序列分析,捕捉特征在時間維度上的變化規(guī)律和依賴關系,從而進一步挖掘出與情緒相關的時間序列特征。在實際應用中,這種結合模型在基于Kinect步態(tài)信息的情緒識別中展現(xiàn)出了卓越的性能。有研究設計了一種基于CNN-LSTM的情緒識別模型,首先利用CNN對Kinect采集的步態(tài)深度圖像進行特征提取,得到一系列的特征圖,然后將這些特征圖按照時間順序輸入到LSTM中進行處理。實驗結果表明,該模型在識別準確率上明顯優(yōu)于單獨使用CNN或LSTM的模型,能夠更準確地識別出不同的情緒狀態(tài)。這是因為CNN提取的空間特征為LSTM提供了豐富的信息基礎,使LSTM能夠更好地捕捉到時間序列中的關鍵信息,同時LSTM對時間序列的處理能力又彌補了CNN在處理時間依賴關系方面的不足,兩者相互協(xié)作,共同提高了情緒識別的性能。CNN-LSTM結合模型在處理復雜的步態(tài)數(shù)據和識別多種情緒類別時具有更強的適應性和魯棒性,能夠在不同的實驗條件和數(shù)據集上保持較高的識別準確率,為基于Kinect步態(tài)信息的情緒識別研究提供了新的有效方法和思路。4.3算法對比與評估為了全面評估不同算法在基于Kinect步態(tài)信息的情緒識別中的性能,設計并開展了一系列實驗。實驗選取了支持向量機(SVM)、隨機森林、樸素貝葉斯、長短期記憶網絡(LSTM)以及卷積神經網絡(CNN)與LSTM結合的模型(CNN-LSTM)這幾種具有代表性的算法進行對比分析。實驗數(shù)據集來源于多個渠道,包括公開的步態(tài)數(shù)據庫以及自行采集的實驗數(shù)據。其中,自行采集的數(shù)據是通過前文所述的Kinect步態(tài)信息采集方法,招募了50名不同年齡、性別和職業(yè)的志愿者,在實驗室環(huán)境下采集了他們在快樂、悲傷、憤怒、恐懼和中性這五種情緒狀態(tài)下的步態(tài)數(shù)據。每個志愿者在每種情緒狀態(tài)下進行多次行走,每次行走采集30秒的步態(tài)數(shù)據,最終共獲得了750組有效數(shù)據。公開數(shù)據庫數(shù)據則補充了不同場景和人群的步態(tài)信息,豐富了數(shù)據的多樣性,確保實驗結果的可靠性和泛化性。在實驗過程中,將數(shù)據集按照70%用于訓練、15%用于驗證、15%用于測試的比例進行劃分。訓練集用于訓練各個算法模型,驗證集用于調整模型參數(shù),測試集用于評估模型的最終性能。在訓練過程中,對每個算法都進行了細致的參數(shù)調優(yōu),以確保其性能達到最佳狀態(tài)。對于SVM算法,通過交叉驗證的方式,嘗試了線性核、多項式核、徑向基核(RBF)等不同的核函數(shù),并對核函數(shù)的參數(shù)進行了調整,最終確定在使用徑向基核函數(shù)且參數(shù)為特定值時性能最佳;隨機森林算法則通過調整決策樹的數(shù)量、最大深度、特征選擇方式等參數(shù),找到最優(yōu)的模型配置。實驗結果以準確率、召回率和F1值作為評估指標。準確率是指正確分類的樣本數(shù)占總樣本數(shù)的比例,反映了模型分類的正確性;召回率是指正確分類的某類樣本數(shù)占該類實際樣本數(shù)的比例,體現(xiàn)了模型對某類樣本的覆蓋程度;F1值則是綜合考慮準確率和召回率的指標,能夠更全面地評估模型的性能,其計算公式為F1=\frac{2\times準確率\times召回率}{準確率+召回率}。實驗結果表明,在準確率方面,CNN-LSTM模型表現(xiàn)最為出色,達到了85.3%,這得益于其能夠充分利用CNN提取空間特征和LSTM處理時間序列特征的優(yōu)勢,對步態(tài)數(shù)據中的情緒信息進行了全面、深入的挖掘;LSTM模型的準確率為80.1%,它對時間序列數(shù)據的處理能力使其在捕捉步態(tài)與情緒之間的時間依賴關系上具有一定優(yōu)勢,但由于缺乏對空間特征的有效提取,導致準確率略低于CNN-LSTM模型;隨機森林的準確率為75.6%,雖然它能夠處理不同類型的特征,且對數(shù)據的適應性強,但在挖掘步態(tài)數(shù)據中的復雜模式和特征關系方面相對較弱;SVM的準確率為72.4%,其在處理高維度和復雜的非線性特征時存在一定局限性,且對參數(shù)選擇較為敏感,影響了分類的準確性;樸素貝葉斯的準確率最低,僅為65.2%,這主要是因為其基于特征條件獨立假設,而實際的步態(tài)數(shù)據中特征之間往往存在相關性,導致該假設不成立,從而影響了分類效果。在召回率方面,CNN-LSTM模型同樣表現(xiàn)優(yōu)異,在不同情緒類別上的召回率均較高,平均召回率達到了83.5%;LSTM模型的平均召回率為78.6%,在一些情緒類別上,如快樂和悲傷情緒,能夠較好地召回樣本,但在憤怒和恐懼等情緒類別上,召回率相對較低;隨機森林的平均召回率為73.8%,在各類情緒上的表現(xiàn)相對較為均衡,但整體召回能力不如前兩者;SVM的平均召回率為70.2%,在處理多分類問題時,其“一對多”或“一對一”策略可能導致部分樣本的召回出現(xiàn)偏差;樸素貝葉斯的平均召回率僅為63.7%,由于其假設的局限性,對各類情緒樣本的召回效果均不理想。綜合F1值來看,CNN-LSTM模型以84.2%的F1值位居榜首,展現(xiàn)出了最佳的綜合性能;LSTM模型的F1值為79.3%,表現(xiàn)次之;隨機森林的F1值為74.7%,處于中等水平;SVM的F1值為71.3%,表現(xiàn)相對一般;樸素貝葉斯的F1值最低,為64.4%。通過本次實驗對比可以看出,基于深度學習的CNN-LSTM模型在基于Kinect步態(tài)信息的情緒識別中具有明顯的優(yōu)勢,能夠更準確地識別不同的情緒狀態(tài)。LSTM模型也有較好的表現(xiàn),適用于對時間序列特征要求較高的場景。而傳統(tǒng)機器學習算法如隨機森林和SVM在處理此類復雜問題時,性能相對較弱,但在一些對計算資源和模型復雜度要求較低的場景下,仍具有一定的應用價值。樸素貝葉斯由于其假設的局限性,在該領域的應用效果較差。五、實驗與結果分析5.1實驗設計5.1.1實驗目的本次實驗旨在全面驗證基于Kinect步態(tài)信息的情緒識別方法的有效性和準確性。通過深入分析Kinect采集的步態(tài)數(shù)據,提取關鍵的步態(tài)特征,并運用多種先進的機器學習和深度學習算法進行模型訓練與測試,探究不同算法在識別不同情緒狀態(tài)下的性能表現(xiàn)。具體而言,本實驗期望達到以下目標:一是評估基于Kinect采集的步態(tài)信息能否有效反映人體的情緒狀態(tài),通過對不同情緒狀態(tài)下步態(tài)特征的分析,判斷這些特征是否具有顯著的區(qū)分性,為情緒識別提供可靠的數(shù)據基礎;二是對比不同機器學習和深度學習算法在基于Kinect步態(tài)信息的情緒識別任務中的性能,包括準確率、召回率、F1值等指標,找出最適合該任務的算法模型,為后續(xù)的實際應用提供算法支持;三是分析不同特征提取方法和特征組合對情緒識別結果的影響,優(yōu)化特征提取和選擇策略,提高情緒識別的精度和穩(wěn)定性;四是探索基于Kinect步態(tài)信息的情緒識別方法在實際場景中的應用潛力,為其在人機交互、安防監(jiān)控、醫(yī)療康復等領域的應用提供實驗依據和技術參考。5.1.2實驗對象與數(shù)據采集為確保實驗結果具有廣泛的代表性和可靠性,實驗對象的選擇遵循嚴格的標準。本次實驗共招募了80名志愿者,年齡范圍在18-45歲之間,涵蓋了不同性別、職業(yè)和文化背景的人群,其中男性40名,女性40名。志愿者均身體健康,無明顯的神經系統(tǒng)疾病和運動障礙,以保證采集到的步態(tài)數(shù)據能夠真實反映正常人群在不同情緒狀態(tài)下的特征。在數(shù)據采集階段,使用Kinectv2設備采集志愿者的步態(tài)信息。為了激發(fā)志愿者的真實情緒,采用多種刺激方式,包括播放不同情緒的音樂、展示相應情緒的圖片或視頻片段,以及設置特定的情境任務。播放歡快的音樂和展示搞笑的視頻片段來激發(fā)快樂情緒;播放悲傷的音樂和展示令人傷感的圖片來引發(fā)悲傷情緒;展示憤怒場景的視頻片段并設置一些具有挑戰(zhàn)性和刺激性的任務來誘導憤怒情緒;播放恐怖音效和展示恐怖圖片來營造恐懼情緒;在沒有任何情緒誘導的情況下,讓志愿者進行正常行走,采集其中性情緒狀態(tài)下的步態(tài)數(shù)據。每位志愿者在每種情緒狀態(tài)下進行5次行走,每次行走持續(xù)30秒,以獲取足夠的數(shù)據量。在采集過程中,將Kinectv2固定在三腳架上,放置于志愿者行走路線的正前方,距離約2米,高度為1米,確保設備能夠完整、準確地捕捉到志愿者的全身步態(tài)信息。同時,嚴格控制實驗環(huán)境,保持室內光線均勻、地面平整,避免外界干擾對采集數(shù)據的影響。最終,共采集到80名志愿者在5種情緒狀態(tài)下的2000組步態(tài)數(shù)據,這些數(shù)據構成了本次實驗的原始數(shù)據集。為了保證數(shù)據的質量和一致性,對采集到的原始數(shù)據進行了嚴格的預處理,包括去除異常值、填補缺失值、數(shù)據歸一化等操作,為后續(xù)的特征提取和模型訓練提供了高質量的數(shù)據基礎。5.1.3實驗流程實驗流程主要包括數(shù)據預處理、特征提取、模型訓練和測試等關鍵步驟。在數(shù)據預處理階段,針對采集到的原始步態(tài)數(shù)據進行一系列處理操作。由于采集過程中可能受到環(huán)境噪聲、設備誤差等因素的影響,部分數(shù)據可能存在異常值,使用基于統(tǒng)計學的方法,如3σ準則,識別并去除這些異常值,避免其對后續(xù)分析造成干擾。對于可能出現(xiàn)的缺失值,采用線性插值或基于機器學習的方法進行填補,以保證數(shù)據的完整性。為了消除不同特征之間的量綱差異,使數(shù)據具有可比性,對所有數(shù)據進行歸一化處理,將數(shù)據映射到[0,1]或[-1,1]的區(qū)間內,常見的歸一化方法有最小-最大歸一化和Z-score歸一化等。完成數(shù)據預處理后,進行特征提取。運用前文所述的特征提取方法,從步態(tài)數(shù)據中提取時空特征、運動學特征和動力學特征等多種類型的特征。對于時空特征,計算步行周期、步頻、步幅等參數(shù);在運動學特征提取中,分析關節(jié)的運動軌跡、速度、加速度等信息;動力學特征方面,提取地面反作用力、力矩等特征。為了提高特征的有效性和針對性,采用特征選擇方法對提取到的特征進行篩選,去除冗余和無關特征,保留與情緒識別相關性較高的關鍵特征。使用過濾法中的皮爾遜相關系數(shù)法,計算每個特征與情緒標簽之間的相關性,剔除相關性較低的特征,從而降低數(shù)據維度,提高模型訓練效率。在模型訓練階段,選擇支持向量機(SVM)、隨機森林、樸素貝葉斯、長短期記憶網絡(LSTM)以及卷積神經網絡(CNN)與LSTM結合的模型(CNN-LSTM)等多種算法進行訓練。對于SVM,分別嘗試線性核、多項式核、徑向基核(RBF)等不同的核函數(shù),并通過交叉驗證的方式調整核函數(shù)的參數(shù),如懲罰參數(shù)C和徑向基核函數(shù)的參數(shù)γ等,以找到最優(yōu)的模型配置;隨機森林則通過調整決策樹的數(shù)量、最大深度、特征選擇方式等參數(shù),優(yōu)化模型性能;LSTM和CNN-LSTM模型在訓練過程中,設置合適的學習率、迭代次數(shù)、隱藏層節(jié)點數(shù)等超參數(shù),采用Adam等優(yōu)化算法進行訓練,使模型能夠充分學習步態(tài)數(shù)據中的情緒特征。在訓練過程中,將數(shù)據集按照70%用于訓練、15%用于驗證、15%用于測試的比例進行劃分。訓練集用于模型的訓練,使模型學習到不同情緒狀態(tài)下步態(tài)特征的模式和規(guī)律;驗證集用于調整模型參數(shù),防止模型過擬合;測試集用于評估模型的最終性能,檢驗模型在未知數(shù)據上的泛化能力。在模型訓練完成后,使用測試集對各個模型進行測試,根據測試結果計算準確率、召回率和F1值等評估指標,對比不同模型在基于Kinect步態(tài)信息的情緒識別任務中的性能表現(xiàn),分析各模型的優(yōu)勢和不足,從而確定最優(yōu)的情緒識別模型。5.2實驗結果分析5.2.1識別結果展示經過對不同算法在基于Kinect步態(tài)信息的情緒識別實驗中的運行和測試,得到了一系列的識別結果。為了更直觀、清晰地展示各算法的性能表現(xiàn),以圖表的形式對實驗結果進行呈現(xiàn)。算法準確率召回率F1值SVM72.4%70.2%71.3%隨機森林75.6%73.8%74.7%樸素貝葉斯65.2%63.7%64.4%LSTM80.1%78.6%79.3%CNN-LSTM85.3%83.5%84.2%圖1展示了不同算法的準確率對比情況。從圖中可以明顯看出,CNN-LSTM模型的準確率最高,達到了85.3%,在所有算法中表現(xiàn)最為突出。LSTM模型的準確率為80.1%,位居第二,這表明LSTM模型在處理步態(tài)時間序列數(shù)據進行情緒識別方面具有較強的能力,但與CNN-LSTM模型相比,仍有一定的差距。隨機森林的準確率為75.6%,處于中等水平,其在處理不同類型特征和應對數(shù)據多樣性方面具有一定優(yōu)勢,但在挖掘復雜特征關系上相對較弱。SVM的準確率為72.4%,雖然它在處理高維數(shù)據和非線性問題上有一定能力,但由于對參數(shù)敏感以及在多分類問題上的局限性,導致其準確率相對較低。樸素貝葉斯的準確率最低,僅為65.2%,這主要是由于其基于特征條件獨立假設與實際步態(tài)數(shù)據特征相關性不符,影響了分類效果。不同算法的召回率情況如圖2所示。CNN-LSTM模型同樣表現(xiàn)出色,平均召回率達到了83.5%,在各類情緒樣本的召回上都有較好的表現(xiàn)。LSTM模型的平均召回率為78.6%,在部分情緒類別上能夠較好地召回樣本,但在某些復雜情緒類別上召回率相對較低。隨機森林的平均召回率為73.8%,其在各類情緒上的召回表現(xiàn)較為均衡,但整體召回能力不如CNN-LSTM和LSTM模型。SVM的平均召回率為70.2%,在多分類任務中,其策略可能導致部分樣本召回偏差。樸素貝葉斯的平均召回率僅為63.7%,在各類情緒樣本的召回上均表現(xiàn)不佳。綜合考慮準確率和召回率的F1值對比情況如圖3所示。CNN-LSTM模型以84.2%的F1值領先,再次證明了其在基于Kinect步態(tài)信息的情緒識別任務中的綜合優(yōu)勢。LSTM模型的F1值為79.3%,表現(xiàn)良好。隨機森林的F1值為74.7%,處于中等水平。SVM的F1值為71.3%,表現(xiàn)一般。樸素貝葉斯的F1值最低,為64.4%。通過這些圖表,能夠直觀地對比不同算法在情緒識別任務中的性能差異,為后續(xù)的結果討論和分析提供了清晰的數(shù)據支持。5.2.2結果討論從實驗結果可以看出,不同算法在基于Kinect步態(tài)信息的情緒識別任務中表現(xiàn)出明顯的差異,而這些差異主要受到步態(tài)特征選擇和算法性能等多方面因素的影響。步態(tài)特征的選擇對情緒識別準確率起著至關重要的作用。時空特征、運動學特征和動力學特征等不同類型的特征從不同角度反映了步態(tài)與情緒之間的關系。時空特征中的步幅、步頻等參數(shù)能夠直觀地體現(xiàn)出情緒對行走節(jié)奏和空間跨度的影響。快樂情緒下,步幅通常增大,步頻加快,而悲傷情緒時則相反。如果在特征選擇過程中,未能準確提取這些關鍵的時空特征,或者錯誤地將一些與情緒關聯(lián)度低的時空特征納入模型,都可能導致模型無法準確捕捉到情緒與步態(tài)之間的聯(lián)系,從而降低識別準確率。運動學特征中的關節(jié)運動軌跡、速度和加速度等信息,能夠深入揭示情緒對人體運動狀態(tài)的細微影響。憤怒情緒下,關節(jié)運動可能更加急促,速度和加速度變化更為劇烈。若在特征提取和選擇時,忽略了這些運動學特征的變化規(guī)律

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論