版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
(19)國家知識產(chǎn)權(quán)局道北站社區(qū)龍華區(qū)數(shù)字創(chuàng)新中心(民申請人西藏芯格通信技術(shù)有限公司(72)發(fā)明人張勁黃德成韋重羽劉志國理事務(wù)所44287基于三維混合注意力模型的人體動作感知本申請公開了一種基于三維混合注意力模獲取無線信號頻譜數(shù)據(jù)根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征,其中,所述三維混合注意力模型首先對無線信號頻譜數(shù)據(jù)進行特征壓縮,然后基于非局部注意力機制,從時間、頻率和子載波三個維度分別計算注意力權(quán)重,生成三維注意力特征圖,最終通過交叉注意力對三維注意力特征圖進行融合,維度調(diào)整后輸出人體動作感知特征根據(jù)所述人體動作感知特征,確定人體動作感知識別結(jié)果21.一種基于三維混合注意力模型的人體動作感知方法,其特征在于,所述的方法包括:獲取無線信號頻譜數(shù)據(jù);根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征,其中,所述三維混合注意力模型首先對無線信號頻譜數(shù)據(jù)進行特征壓縮,然后基于非局部注意力機制,從時間、頻率和子載波三個維度分別計算注意力權(quán)重,生成三維注意力特征圖,最終通過交叉注意力對三維注意力特征圖進行融合,維度調(diào)整后輸出人體動作感知特征;根據(jù)所述人體動作感知特征,確定人體動作感知識別結(jié)果。2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征的步驟包括:通過預(yù)設(shè)的第一可分離卷積模型對所述無線信號頻譜數(shù)據(jù)進行特征壓縮,生成初始壓縮特征圖;將所述初始壓縮特征圖輸入預(yù)設(shè)的非局部注意力模型,分別沿時間維度、頻率維度和子載波維度進行嵌入空間映射,并基于嵌入特征間的相似性計算,生成時間注意力權(quán)重、頻率注意力權(quán)重和子載波注意力權(quán)重,將所述時間注意力權(quán)重、所述頻率注意力權(quán)重和所述子載波注意力權(quán)重分別與所述初始壓縮特征圖進行加權(quán)融合,生成三維注意力特征圖;通過預(yù)設(shè)的交叉注意力模型對所述三維注意力特征圖進行多維度聯(lián)合特征融合,生成深層聯(lián)合特征;利用預(yù)設(shè)的第二可分離卷積模型對所述深層聯(lián)合特征進行維度調(diào)整,恢復(fù)至目標(biāo)特征維度,輸出所述人體動作感知特征。3.如權(quán)利要求2所述的方法,其特征在于,所述通過預(yù)設(shè)的第一可分離卷積模型對所述無線信號頻譜數(shù)據(jù)進行特征壓縮,生成初始壓縮特征圖的步驟包括:通過深度卷積對輸入頻譜數(shù)據(jù)的空間維度進行局部特征提取,得到局部特征圖;通過點卷積對所述局部特征圖進行通道維度壓縮,減少冗余特征通道數(shù)量,得到壓縮特征圖;通過非線性激活函數(shù)對所述壓縮特征圖進行特征增強,確定初始壓縮特征圖。4.如權(quán)利要求2所述的方法,其特征在于,所述將所述初始壓縮特征圖輸入預(yù)設(shè)的非局部注意力模型,分別沿時間維度、頻率維度和子載波維度進行嵌入空間映射,并基于嵌入特征間的相似性計算,生成時間注意力權(quán)重、頻率注意力權(quán)重和子載波注意力權(quán)重,將所述時間注意力權(quán)重、所述頻率注意力權(quán)重和所述子載波注意力權(quán)重分別與所述初始壓縮特征圖進行加權(quán)融合,生成三維注意力特征圖的步驟包括:通過對所述初始壓縮特征圖分別沿時間維度、頻率維度及子載波維度進行線性投影,生成各維度嵌入特征,基于嵌入式高斯函數(shù)計算所述各維度嵌入特征間的相似度矩陣,生成各維度注意力權(quán)將所述各維度注意力權(quán)重與所述初始壓縮特征圖進行加權(quán)求和,再通過殘差連接與可學(xué)習(xí)增益參數(shù)進行融合,得到三維注意力特征圖。5.如權(quán)利要求2所述的方法,其特征在于,所述通過預(yù)設(shè)的交叉注意力模型對所述三維注意力特征圖進行多維度聯(lián)合特征融合,生成深層聯(lián)合特征的步驟包括:3將所述三維注意力特征圖進行空間對齊拼接,生成聯(lián)合特征矩陣,對所述聯(lián)合特征矩陣進行二次非局部注意力操作,計算跨維度的全局關(guān)聯(lián)權(quán)重;通過所述全局關(guān)聯(lián)權(quán)重對所述聯(lián)合特征矩陣進行動態(tài)加權(quán),經(jīng)過非線性變換后確定所述深層聯(lián)合特征。6.如權(quán)利要求2所述的方法,其特征在于,所述通過預(yù)設(shè)的第一可分離卷積模型對所述無線信號頻譜數(shù)據(jù)進行特征壓縮,生成初始壓縮特征圖的步驟之前包括:在非局部注意力模型中采用通道縮減技術(shù),將嵌入空間的通道數(shù)量壓縮至原始特征的預(yù)設(shè)比例以減少計算量;在交叉注意力模型中引入子采樣操作,通過最大池化或平均池化降低特征圖的分辨率以縮減矩陣運算規(guī)模;在模型訓(xùn)練過程中采用增量式監(jiān)督數(shù)據(jù)增強損失函數(shù),結(jié)合動態(tài)權(quán)重調(diào)整策略優(yōu)化模型參數(shù)更新,以抑制過擬合并提升泛化能力;通過瓶頸結(jié)構(gòu)設(shè)計限制可分離卷積層的中間通道數(shù),降低模型參數(shù)量及內(nèi)存占用。7.一種基于三維混合注意力模型的人體動作感知裝置,其特征在于,所述裝置包括:獲取模塊,用于獲取無線信號頻譜數(shù)據(jù);處理模塊,用于根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征,其中,所述三維混合注意力模型首先對無線信號頻譜數(shù)據(jù)進行特征壓縮,然后基于非局部注意力機制,從時間、頻率和子載波三個維度分別計算注意力權(quán)重,生成三維注意力特征圖,最終通過交叉注意力對三維注意力特征圖進行融合,維度調(diào)整后輸出人體動作感知特征;確定模塊,用于根據(jù)所述人體動作感知特征,確定人體動作感知識別結(jié)果。8.一種基于三維混合注意力模型的人體動作感知設(shè)備,其特征在于,所述設(shè)備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序配置為實現(xiàn)如權(quán)利要求1至6中任一項所述的基于三維混合注意力模型的人體動作感知方法的步驟。9.一種存儲介質(zhì),其特征在于,所述存儲介質(zhì)為計算機可讀存儲介質(zhì),所述存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至6中任一項所述的基于三維混合注意力模型的人體動作感知方法的步驟。10.一種計算機程序產(chǎn)品,其特征在于,所述計算機程序產(chǎn)品包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至6中任一項所述的基于三維混合注意力模型的人體動作感知方法的步驟。4技術(shù)領(lǐng)域[0001]本申請涉及人體動作感知技術(shù)領(lǐng)域,尤其涉及基于三維混合注意力模型的人體動作感知方法及相關(guān)設(shè)備。背景技術(shù)[0002]在智能感知領(lǐng)域,WiFi或毫米波雷達(dá)無線信號因其高通道數(shù)據(jù)量大等特點,為精準(zhǔn)人體動作感知提供了豐富的數(shù)據(jù)支持。然而,這一優(yōu)勢同時也帶來了巨大的挑戰(zhàn):傳統(tǒng)的深度學(xué)習(xí)模型在處理這類復(fù)雜數(shù)據(jù)時,需要大量的參數(shù)來解析特征,這導(dǎo)致了在資源有限的硬件設(shè)備上難以實現(xiàn)有效的部署。傳統(tǒng)模型對高維數(shù)據(jù)的處理方式,雖然能夠提取出關(guān)鍵特征,但在具體應(yīng)用時卻因為龐大的參數(shù)量而導(dǎo)致內(nèi)存和算力資源的極大消耗,尤其是在移動設(shè)備和小型傳感器節(jié)點等資源受限的硬件上。[0003]為了解決這一問題,過去的許多研究依賴于高度參數(shù)化的深度學(xué)習(xí)模型來從高維無線信號中提取特征,但這在模型的大小和推理時間上造成了嚴(yán)重的低效。因此,提高人體動作感知識別的效率,使之能夠支持資源有限的物聯(lián)網(wǎng)設(shè)備進行實時感知,成為了一個重要的挑戰(zhàn)。發(fā)明內(nèi)容[0004]本申請的主要目的在于提供一種基于三維混合注意力模型的人體動作感知方法及相關(guān)設(shè)備,旨在解決資源有限的物聯(lián)網(wǎng)設(shè)備中的人體動作感知識別效率低的技術(shù)問題。[0005]為實現(xiàn)上述目的,本申請?zhí)岢鲆环N基于三維混合注意力模型的人體動作感知方獲取無線信號頻譜數(shù)據(jù);根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征,其中,所述三維混合注意力模型首先對無線信號頻譜數(shù)據(jù)進行特征壓縮,然后基于非局部注意力機制,從時間、頻率和子載波三個維度分別計算注意力權(quán)重,生成三維注意力特征圖,最終通過交叉注意力對三維注意力特征圖進行融合,維度調(diào)整后輸出人體動作感知特征;根據(jù)所述人體動作感知特征,確定人體動作感知識別結(jié)果。[0006]在一實施例中,所述根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征的步驟包括:通過預(yù)設(shè)的第一可分離卷積模型對所述無線信號頻譜數(shù)據(jù)進行特征壓縮,生成初始壓縮特征圖;將所述初始壓縮特征圖輸入預(yù)設(shè)的非局部注意力模型,分別沿時間維度、頻率維度和子載波維度進行嵌入空間映射,并基于嵌入特征間的相似性計算,生成時間注意力權(quán)重、頻率注意力權(quán)重和子載波注意力權(quán)重,將所述時間注意力權(quán)重、所述頻率注意力權(quán)重和所述子載波注意力權(quán)重分別與所述初始壓縮特征圖進行加權(quán)融合,生成三維注意力特征5通過預(yù)設(shè)的交叉注意力模型對所述三維注意力特征圖進行多維度聯(lián)合特征融合,生成深層聯(lián)合特征;利用預(yù)設(shè)的第二可分離卷積模型對所述深層聯(lián)合特征進行維度調(diào)整,恢復(fù)至目標(biāo)特征維度,輸出所述人體動作感知特征。[0007]在一實施例中,所述通過預(yù)設(shè)的第一可分離卷積模型對所述無線信號頻譜數(shù)據(jù)進行特征壓縮,生成初始壓縮特征圖的步驟包括:通過深度卷積對輸入頻譜數(shù)據(jù)的空間維度進行局部特征提取,得到局部特征圖;通過點卷積對所述局部特征圖進行通道維度壓縮,減少冗余特征通道數(shù)量,得到壓縮特征圖;通過非線性激活函數(shù)對所述壓縮特征圖進行特征增強,確定初始壓縮特征圖。[0008]在一實施例中,所述將所述初始壓縮特征圖輸入預(yù)設(shè)的非局部注意力模型,分別沿時間維度、頻率維度和子載波維度進行嵌入空間映射,并基于嵌入特征間的相似性計算,生成時間注意力權(quán)重、頻率注意力權(quán)重和子載波注意力權(quán)重,將所述時間注意力權(quán)重、所述頻率注意力權(quán)重和所述子載波注意力權(quán)重分別與所述初始壓縮特征圖進行加權(quán)融合,生成三維注意力特征圖的步驟包括:通過對所述初始壓縮特征圖分別沿時間維度、頻率維度及子載波維度進行線性投基于嵌入式高斯函數(shù)計算所述各維度嵌入特征間的相似度矩陣,生成各維度注意將所述各維度注意力權(quán)重與所述初始壓縮特征圖進行加權(quán)求和,再通過殘差連接與可學(xué)習(xí)增益參數(shù)進行融合,得到三維注意力特征圖。在一實施例中,所述通過預(yù)設(shè)的交叉注意力模型對所述三維注意力特征圖進行多維度聯(lián)合特征融合,生成深層聯(lián)合特征的步驟將所述三維注意力特征圖進行空間對齊拼接,生成聯(lián)合特征矩陣,對所述聯(lián)合特征矩陣進行二次非局部注意力操作,計算跨維度的全局關(guān)聯(lián)權(quán)重;通過所述全局關(guān)聯(lián)權(quán)重對所述聯(lián)合特征矩陣進行動態(tài)加權(quán),經(jīng)過非線性變換后確定所述深層聯(lián)合特征。[0009]在一實施例中,所述通過預(yù)設(shè)的第一可分離卷積模型對所述無線信號頻譜數(shù)據(jù)進行特征壓縮,生成初始壓縮特征圖的步驟之前包括:在非局部注意力模型中采用通道縮減技術(shù),將嵌入空間的通道數(shù)量壓縮至原始特征的預(yù)設(shè)比例以減少計算量;在交叉注意力模型中引入子采樣操作,通過最大池化或平均池化降低特征圖的分辨率以縮減矩陣運算規(guī)模;在模型訓(xùn)練過程中采用增量式監(jiān)督數(shù)據(jù)增強損失函數(shù),結(jié)合動態(tài)權(quán)重調(diào)整策略優(yōu)化模型參數(shù)更新,以抑制過擬合并提升泛化能力;通過瓶頸結(jié)構(gòu)設(shè)計限制可分離卷積層的中間通道數(shù),降低模型參數(shù)量及內(nèi)存占[0010]此外,為實現(xiàn)上述目的,本申請還提出一種基于三維混合注意力模型的人體動作6感知裝置,所述基于三維混合注意力模型的人體動作感知裝置包括:獲取模塊,用于獲取無線信號頻譜數(shù)據(jù);處理模塊,用于根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征,其中,所述三維混合注意力模型首先對無線信號頻譜數(shù)據(jù)進行特征壓縮,然后基于非局部注意力機制,從時間、頻率和子載波三個維度分別計算注意力權(quán)重,生成三維注意力特征圖,最終通過交叉注意力對三維注意力特征圖進行融合,維度調(diào)整后輸出人體動作感知特征;確定模塊,用于根據(jù)所述人體動作感知特征,確定人體動作感知識別結(jié)果。[0011]此外,為實現(xiàn)上述目的,本申請還提出一種基于三維混合注意力模型的人體動作感知設(shè)備,所述設(shè)備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序配置為實現(xiàn)如上文所述的基于三維混合注意力模型的人體動作感知方法的步驟。[0012]此外,為實現(xiàn)上述目的,本申請還提出一種存儲介質(zhì),所述存儲介質(zhì)為計算機可讀存儲介質(zhì),所述存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上文所述的基于三維混合注意力模型的人體動作感知方法的步驟。[0013]此外,為實現(xiàn)上述目的,本申請還提供一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上文所述的基于三維混合注意力模型的人體動作感知方法的步驟。[0014]本申請?zhí)岢龅囊粋€或多個技術(shù)方案,至少具有以下技術(shù)效果:與相關(guān)技術(shù)中,依賴于高度參數(shù)化的深度學(xué)習(xí)模型來從高維無線信號中提取特征,導(dǎo)致在模型的大小和推理時間上造成了嚴(yán)重的低效相比,本申請通過獲取無線信號頻譜數(shù)據(jù);根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征,其中,所述三維混合注意力模型首先對無線信號頻譜數(shù)據(jù)進行特征壓縮,然后基于非局部注意力機制,從時間、頻率和子載波三個維度分別計算注意力權(quán)重,生成三維注意力特征圖,最終通過交叉注意力對三維注意力特征圖進行融合,維度調(diào)整后輸出人體動作感知特征;根據(jù)所述人體動作感知特征,確定人體動作感知識別結(jié)果??衫斫獾氖牵旧暾埐捎昧巳S混合注意力機制,包括非局部注意力模塊和交叉注意力模塊。非局部注意力模塊利用時間、頻率和子載波三個維度計算注意力權(quán)重,從而能夠更好地捕捉無線信號的多維特征。交叉注意力模塊則進一步融合了這些三維注意力圖,以增強模型的特征提取能力。在硬件資源有限的情況下,該模型通過減少參數(shù)量,大幅提高了識別效率,使得基于無線信號的人體動作感知技術(shù)可以在如智能家居和智能醫(yī)療等場景中的小型設(shè)備上實現(xiàn)有效部署。附圖說明[0015]此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本申請的實施例,并與說明書一起用于解釋本申請的原理。[0016]為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,對于本領(lǐng)域普通技術(shù)人員而言,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。7[0017]圖1為本申請基于三維混合注意力模型的人體動作感知方法實施例一提供的流程示意圖;圖2為本申請基于三維混合注意力模型的人體動作感知方法實施例二提供的流程示意圖;圖3為本申請實施例二提供的基于三維混合注意力模型的人體動作感知方法的簡要流程示意圖;圖4為本申請實施例基于三維混合注意力模型的人體動作感知裝置的模塊結(jié)構(gòu)示圖5為本申請實施例中基于三維混合注意力模型的人體動作感知方法涉及的硬件運行環(huán)境的設(shè)備結(jié)構(gòu)示意圖。[0018]本申請目的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進一步說明。具體實施方式[0019]應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本申請的技術(shù)方案,并不用于限定本申請。[0020]為了更好的理解本申請的技術(shù)方案,下面將結(jié)合說明書附圖以及具體的實施方式進行詳細(xì)的說明。[0021]本申請實施例的主要解決方案是:獲取無線信號頻譜數(shù)據(jù);根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征,其中,所述三維混合注意力模型首先對無線信號頻譜數(shù)據(jù)進行特征壓縮,然后基于非局部注意力機制,從時間、頻率和子載波三個維度分別計算注意力權(quán)重,生成三維注意力特征圖,最終通過交叉注意力對三維注意力特征圖進行融合,維度調(diào)整后輸出人體動作感知特征;根據(jù)所述人體動作感知特征,確定人體動作感知識別結(jié)果。[0022]在本實施例中,本申請以基于三維混合注意力模型的人體動作感知裝置為執(zhí)行主[0023]由于現(xiàn)有技術(shù)在處理這類復(fù)雜數(shù)據(jù)時,需要大量的參數(shù)來解析特征,這導(dǎo)致了在資源有限的硬件設(shè)備上難以實現(xiàn)有效的部署。傳統(tǒng)模型對高維數(shù)據(jù)的處理方式,雖然能夠提取出關(guān)鍵特征,但在具體應(yīng)用時卻因為龐大的參數(shù)量而導(dǎo)致內(nèi)存和算力資源的極大消耗,尤其是在移動設(shè)備和小型傳感器節(jié)點等資源受限的硬件上。[0024]本申請?zhí)峁┮环N解決方案,通過設(shè)計了一種3D混合注意力輕量化模型,旨在應(yīng)對有限硬件資源下高效處理高維無線信號數(shù)據(jù)的挑戰(zhàn)。具體而言,該模型的三維混合注意力機制包括非局部注意力模塊和交叉注意力模塊。非局部注意力模塊利用時間、頻率和子載波三個維度計算注意力權(quán)重,從而能夠更好地捕捉無線信號的多維特征。交叉注意力模塊則進一步融合了這些三維注意力圖,以增強模型的特征提取能力。在硬件資源有限的情況下,該模型通過減少參數(shù)量,大幅提高了識別效率,使得基于無線信號的人體動作感知技術(shù)可以在如智能家居和智能醫(yī)療等場景中的小型設(shè)備上實現(xiàn)有效部署。[0025]該模型首先通過短時傅里葉變換(STFT)獲取無線信號的頻譜數(shù)據(jù),識別出由時8間、頻率和子載波三個維度組成的特征,然后利用非局部注意力模塊計算各維度的權(quán)重,并通過交叉注意力模塊將這些權(quán)重融合,最終輸出關(guān)鍵特征,實現(xiàn)對復(fù)雜數(shù)據(jù)的高效解析與實時感知。[0026]基于此,本申請實施例提供了一種基于三維混合注意力模型的人體動作感知方法,參照圖1,圖1為本申請基于三維混合注意力模型的人體動作感知方法第一實施例的流程示意圖。[0027]本實施例中,所述基于三維混合注意力模型的人體動作感知方法包括步驟S10~步驟S10,獲取無線信號頻譜數(shù)據(jù);需要說明的是,無線信號頻譜數(shù)據(jù)是無線信號在傳輸過程中,其幅度、相位等信息會隨時間、頻率等因素變化,通過特定的技術(shù)手段(如短時傅里葉變換等)對無線信號進行處理后,可以將其表示為頻譜圖形式的數(shù)據(jù),其中包含了無線信號在不同時間點、不同頻率以及不同子載波上的能量分布等信息,這些信息能夠反映人體運動等狀態(tài),可用于人體動作感知相關(guān)的分析與識別。[0028]可以理解的是,在智能家居場景中,利用家中的WiFi路由器發(fā)射無線信號,室內(nèi)人員的活動(如行走、揮手等)會使無線信號產(chǎn)生變化。通過部署在室內(nèi)的信號接收設(shè)備獲取無線信號的信道狀態(tài)信息(CSI),然后對該CSI數(shù)據(jù)進行短時傅里葉變換處理,將其轉(zhuǎn)換為無線信號頻譜數(shù)據(jù)。將這些頻譜數(shù)據(jù)輸入到已訓(xùn)練好的三維混合注意力模型中,經(jīng)過模型處理后得到人體動作感知特征,最終根據(jù)這些特征識別出室內(nèi)人員的具體動作,如判斷某人在客廳中從一個位置走到另一個位置。[0029]可以理解的是,通過獲取無線信號頻譜數(shù)據(jù),為后續(xù)利用三維混合注意力模型進行人體動作感知提供了基礎(chǔ)數(shù)據(jù)支持,使得人體動作感知技術(shù)不再依賴于傳統(tǒng)的可穿戴設(shè)備或攝像頭等侵入式手段,拓展了人體動作感知的應(yīng)用場景,降低了部署成本和難度,并且無線信號能夠穿透障礙物,對復(fù)雜環(huán)境下的室內(nèi)人體活動感知具有更好的適應(yīng)性和普適性,提高了人體動作感知的便捷性和實用性。[0030]步驟S20,根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征,其中,所述三維混合注意力模型首先對無線信號頻譜數(shù)據(jù)進行特征壓縮,然后基于非局部注意力機制,從時間、頻率和子載波三個維度分別計算注意力權(quán)重,生成三維注意力特征圖,最終通過交叉注意力對三維注意力特征圖進行融合,維度調(diào)整后輸出人體動作感知特征;需要說明的是,特征處理是指對獲取的無線信號頻譜數(shù)據(jù)進行一系列操作,以提取其中對人體動作感知有價值的特征信息,去除無關(guān)或冗余信息,使數(shù)據(jù)更適合后續(xù)的分[0031]特征壓縮是通過特定的算法或模型結(jié)構(gòu)(如可分離卷積等),減少無線信號頻譜數(shù)據(jù)的維度和數(shù)據(jù)量,去除冗余特征,保留數(shù)據(jù)中的關(guān)鍵信息,以降低計算復(fù)雜度,提高模型運行效率,同時突出數(shù)據(jù)中的主要特征。[0032]非局部注意力機制是一種捕捉數(shù)據(jù)中長程依賴關(guān)系的機制,通過計算特征圖中不同位置之間的相似性或相關(guān)性,生成注意力權(quán)重,根據(jù)權(quán)重對特征進行加權(quán),使模型能夠關(guān)注到數(shù)據(jù)中與當(dāng)前任務(wù)相關(guān)的關(guān)鍵區(qū)域,而不僅僅局限于局部鄰域,有助于提取更具判別9性的特征。[0033]三維注意力特征圖是從時間、頻率和子載波三個維度分別計算得到注意力權(quán)重后,將這些權(quán)重與初始壓縮特征圖進行加權(quán)融合所生成的特征圖,它包含了無線信號頻譜數(shù)據(jù)在三個維度上的關(guān)鍵特征信息,每個維度的特征都得到了突出和強調(diào),為后續(xù)的特征融合提供了基礎(chǔ)。[0034]交叉注意力是用于對三維注意力特征圖進行融合的一種機制,通過重新權(quán)衡不同維度特征的重要性,綜合考慮時間、頻率和子載波三個維度的信息,使模型能夠更全面、準(zhǔn)確地理解無線信號頻譜數(shù)據(jù)所蘊含的人體動作感知信息,實現(xiàn)多維度特征的協(xié)同作用,提高人體動作感知特征的表達(dá)能力。[0035]維度調(diào)整是在特征處理的最后階段,將經(jīng)過交叉注意力融合后的深層聯(lián)合特征的維度進行調(diào)整,恢復(fù)至目標(biāo)特征維度,使其符合后續(xù)處理(如分類、識別等)的要求,同時也有助于進一步降低模型的復(fù)雜度和計算量,提高模型的效率和適應(yīng)性。[0036]可以理解的是,通過對無線信號頻譜數(shù)據(jù)的特征壓縮,減少了數(shù)據(jù)量和計算復(fù)雜度,提高了模型的運行效率,使其能夠在資源有限的設(shè)備上(如小型無線信號收發(fā)設(shè)備等)實時運行,降低成本和能耗。非局部注意力機制能夠關(guān)注到數(shù)據(jù)中關(guān)鍵的特征區(qū)域,三維注意力特征圖和交叉注意力的結(jié)合充分挖掘了無線信號頻譜數(shù)據(jù)中與人體動作感知相關(guān)的多維度信息,提高了人體動作感知特征的準(zhǔn)確性和豐富度,從而提升了人體動作感知識別結(jié)果的可靠性和精度,為智能家居、智能醫(yī)療等領(lǐng)域的精準(zhǔn)人體動作感知提供了有力的技術(shù)支持。[0037]在一種可行的實施方式中,所述根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征的步驟包括:通過預(yù)設(shè)的第一可分離卷積模型對所述無線信號頻譜數(shù)據(jù)進行特征壓縮,生成初始壓縮特征圖;將所述初始壓縮特征圖輸入預(yù)設(shè)的非局部注意力模型,分別沿時間維度、頻率維度和子載波維度進行嵌入空間映射,并基于嵌入特征間的相似性計算,生成時間注意力權(quán)重、頻率注意力權(quán)重和子載波注意力權(quán)重,將所述時間注意力權(quán)重、所述頻率注意力權(quán)重和所述子載波注意力權(quán)重分別與所述初始壓縮特征圖進行加權(quán)融合,生成三維注意力特征通過預(yù)設(shè)的交叉注意力模型對所述三維注意力特征圖進行多維度聯(lián)合特征融合,生成深層聯(lián)合特征;利用預(yù)設(shè)的第二可分離卷積模型對所述深層聯(lián)合特征進行維度調(diào)整,恢復(fù)至目標(biāo)特征維度,輸出所述人體動作感知特征。[0038]需要說明的是,第一可分離卷積模型是一種由深度卷積和點卷積組成的卷積模型,用于對無線信號頻譜數(shù)據(jù)進行特征壓縮。深度卷積對輸入數(shù)據(jù)的空間維度進行局部特征提取,點卷積則對局部特征圖進行通道維度壓縮,減少冗余特征通道數(shù)量,兩者結(jié)合在降低計算成本的同時保留關(guān)鍵特征信息。[0039]初始壓縮特征圖是經(jīng)過第一可分離卷積模型處理后得到的特征圖,相較于原始無線信號頻譜數(shù)據(jù),其維度降低,冗余信息減少,突出了數(shù)據(jù)中的主要特征,為進一步的特征處理和分析提供了基礎(chǔ)。[0040]非局部注意力模型是基于非局部機制的模型,通過計算特征圖中不同位置之間的相似性或相關(guān)性,生成時間、頻率和子載波三個維度的注意力權(quán)重。該模型能夠捕捉數(shù)據(jù)中的長程依賴關(guān)系,使模型關(guān)注到與人體感知相關(guān)的關(guān)鍵區(qū)域。[0041]嵌入空間映射是將初始壓縮特征圖中的特征向量映射到一個新的嵌入空間中,以便在該空間中計算特征之間的相似性或相關(guān)性。在無線信號處理中,嵌入空間映射能夠更好地捕捉到不同時間和頻率等維度特征之間的內(nèi)在聯(lián)系,有助于突出關(guān)鍵特征信息。[0042]相似性計算是計算嵌入空間中不同特征向量之間的相似程度,通常使用嵌入式高斯函數(shù)等方法。通過相似性計算,可以確定特征之間的關(guān)聯(lián)程度,為生成注意力權(quán)重提供依據(jù),使模型能夠關(guān)注到更重要或更具代表性的特征。[0043]加權(quán)融合是將生成的時間、頻率和子載波三個維度的注意力權(quán)重分別與初始壓縮特征圖進行加權(quán)運算,將不同維度的特征信息進行融合,生成三維注意力特征圖。加權(quán)融合過程能夠根據(jù)注意力權(quán)重突出顯示數(shù)據(jù)中關(guān)鍵特征區(qū)域,增強特征的表達(dá)能力,同時抑制不重要的特征信息。[0044]三維注意力特征圖是包含了無線信號頻譜數(shù)據(jù)在時間、頻率和子載波三個維度上的關(guān)鍵特征信息的特征圖。每個維度的特征都得到了突出和強調(diào),為后續(xù)的交叉注意力融合提供了基礎(chǔ),有助于模型更全面、準(zhǔn)確地理解無線信號中蘊含的人體感知信息。[0045]交叉注意力模型是用于對三維注意力特征圖進行多維度聯(lián)合特征融合的模型。它通過重新權(quán)衡不同維度特征的重要性,綜合考慮時間、頻率和子載波三個維度的信息,使模型能夠更全面地理解無線信號頻譜數(shù)據(jù)所蘊含的人體感知信息,實現(xiàn)多維度特征的協(xié)同作用,提高人體感知特征的表達(dá)能力和識別精度。[0046]深層聯(lián)合特征是經(jīng)過交叉注意力模型融合后的特征,融合了時間、頻率和子載波三個維度的關(guān)鍵特征信息,形成了更深層次、更綜合的特征表示。深層聯(lián)合特征能夠更準(zhǔn)確地反映人體動作等感知信息,為進一步的維度調(diào)整和人體動作識別提供了更有力的支持。[0047]第二可分離卷積模型是類似于第一可分離卷積模型,用于對深層聯(lián)合特征進行維度調(diào)整。通過深度卷積和點卷積的操作,將深層聯(lián)合特征的維度恢復(fù)至目標(biāo)特征維度,使其符合后續(xù)人體動作識別等處理的要求,同時也有助于進一步降低模型的復(fù)雜度和計算量,提高模型的效率和適應(yīng)性。[0048]人體動作感知特征是最終輸出的特征,包含了經(jīng)過特征壓縮、注意力機制處理、特征融合和維度調(diào)整后的無線信號頻譜數(shù)據(jù)的關(guān)鍵信息。人體動作感知特征能夠準(zhǔn)確地反映人體動作等感知信息,可用于人體動作識別、行為分析等任務(wù),在智能家居、智能醫(yī)療等領(lǐng)域具有廣泛的應(yīng)用前景。[0049]可以理解的是,在智能運動監(jiān)測場景中,用戶佩戴一個集成有無線信號收發(fā)功能的智能手環(huán)。智能手環(huán)實時獲取用戶周圍的無線信號頻譜數(shù)據(jù),這些數(shù)據(jù)首先被輸入到預(yù)設(shè)的第一可分離卷積模型中進行特征壓縮,生成初始壓縮特征圖。接著,將初始壓縮特征圖輸入預(yù)設(shè)的非局部注意力模型,分別沿時間維度、頻率維度和子載波維度進行嵌入空間映射,并基于嵌入特征間的相似性計算,生成時間注意力權(quán)重、頻率注意力權(quán)重和子載波注意力權(quán)重。然后,將這些注意力權(quán)重分別與初始壓縮特征圖進行加權(quán)融合,生成三維注意力特征圖。之后,通過預(yù)設(shè)的交叉注意力模型對三維注意力特征圖進行多維度聯(lián)合特征融合,生成深層聯(lián)合特征。最后,利用預(yù)設(shè)的第二可分離卷積模型對深層聯(lián)合特征進行維度調(diào)整,恢11復(fù)至目標(biāo)特征維度,輸出人體動作感知特征。這些特征可用于識別用戶的各種運動動作,如跑步、跳躍、揮手等,實現(xiàn)對用戶運動狀態(tài)的實時監(jiān)測和分析,為用戶提供更精準(zhǔn)的運動數(shù)據(jù)反饋和健康建議。[0050]可以理解的是,通過第一可分離卷積模型對無線信號頻譜數(shù)據(jù)進行特征壓縮,有效降低了數(shù)據(jù)量和計算復(fù)雜度,提高了模型的運行效率,使其能夠在資源受限的智能手環(huán)等設(shè)備上實時運行。非局部注意力模型能夠關(guān)注到數(shù)據(jù)中關(guān)鍵的特征區(qū)域,三維注意力特征圖和交叉注意力模型的結(jié)合充分挖掘了無線信號頻譜數(shù)據(jù)中與人體動作感知相關(guān)的多維度信息,提高了人體動作感知特征的準(zhǔn)確性和豐富度。第二可分離卷積模型的維度調(diào)整操作確保了輸出特征符合后續(xù)處理的要求,同時進一步降低了模型的復(fù)雜度。整體而言,該技術(shù)流程能夠提高人體動作感知的精度和效率,為智能運動監(jiān)測等應(yīng)用提供了有力的技術(shù)支持,提升了用戶體驗和應(yīng)用的實用性。[0051]在一種可行的實施方式中,所述通過預(yù)設(shè)的第一可分離卷積模型對所述無線信號頻譜數(shù)據(jù)進行特征壓縮,生成初始壓縮特征圖的步驟包括:通過深度卷積對輸入頻譜數(shù)據(jù)的空間維度進行局部特征提取,得到局部特征圖;通過點卷積對所述局部特征圖進行通道維度壓縮,減少冗余特征通道數(shù)量,得到壓縮特征圖;通過非線性激活函數(shù)對所述壓縮特征圖進行特征增強,確定初始壓縮特征圖。[0052]需要說明的是,深度卷積是一種卷積神經(jīng)網(wǎng)絡(luò)中的卷積操作,主要針對輸入數(shù)據(jù)的空間維度進行局部特征提取。它對輸入數(shù)據(jù)的每個通道分別進行卷積運算,能夠捕捉到數(shù)據(jù)在空間上的局部相關(guān)性,比如在無線信號頻譜數(shù)據(jù)中,可以提取出不同時間點和頻率下的局部特征模式。[0053]局部特征提取是從輸入頻譜數(shù)據(jù)中識別并提取具有代表性的局部特征的過程。局部特征通常反映了數(shù)據(jù)在小范圍內(nèi)的特性,如無線信號在短時間內(nèi)的變化趨勢、特定頻率附近的能量分布等,這些特征對于理解信號的局部行為和變化規(guī)律具有重要意義。[0054]局部特征圖是深度卷積操作后得到的結(jié)果,以矩陣或張量的形式表示。它包含了輸入頻譜數(shù)據(jù)在空間維度上的局部特征信息,每個元素或通道代表了特定位置或特征的局部特征值,為后續(xù)的特征處理和分析提供了基礎(chǔ)。[0055]點卷積是一種在通道維度上進行的卷積操作,主要用于對局部特征圖進行通道維度的壓縮。點卷積通過線性組合的方式對不同通道的特征進行融合,從而減少冗余的特征通道數(shù)量,在降低計算成本的同時保留關(guān)鍵的特征信息。[0056]通道維度壓縮是減少特征圖中通道數(shù)量的過程,旨在去除冗余的特征通道,突出重要的特征信息。通道維度壓縮可以降低模型的復(fù)雜度和計算量,同時使模型更加聚焦于對任務(wù)有重要意義的特征。[0057]壓縮特征圖是經(jīng)過點卷積對局部特征圖進行通道維度壓縮后得到的特征圖。它在保留原始特征圖主要特征的基礎(chǔ)上,具有更少的通道數(shù)量,數(shù)據(jù)量更小,更有利于后續(xù)的特征處理和模型計算。[0058]非線性激活函數(shù)是一種引入非線性因素的數(shù)學(xué)函數(shù),常用于神經(jīng)網(wǎng)絡(luò)中。它對輸入的特征數(shù)據(jù)進行非線性變換,使模型能夠?qū)W習(xí)到數(shù)據(jù)中的復(fù)雜模式和非線性關(guān)系,常見出特征中的重要信息,抑制不重要的信息,提高特征的表達(dá)能力和區(qū)分度。[0059]特征增強是通過非線性激活函數(shù)等方法對壓縮特征圖進行處理,以增強特征的表達(dá)能力和可分性。特征增強可以使模型更加關(guān)注關(guān)鍵的特征信息,提高模型對不同特征的敏感度,從而提升模型的性能和泛化能力。[0060]示例性地,參照圖2,由深度卷積和點卷積構(gòu)成的可分離卷積網(wǎng)絡(luò)是眾所周知的傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)(CNN)的有效替代方案。無線信號頻譜圖的縮減維度為NF×NT×Ns,但如果Ns較大,計算成本仍會很高。本申請為了更好地概括不同的數(shù)據(jù)集,使用了可分離卷積網(wǎng)絡(luò)將數(shù)據(jù)維度從Ns減少到Nss。Nss決定了評估模型的總體計算成本。[0061]可以理解的是,深度卷積能夠有效地從無線信號頻譜數(shù)據(jù)中提取局部特征,捕捉到數(shù)據(jù)在空間維度上的細(xì)微變化和模式,為后續(xù)的特征處理奠定了基礎(chǔ)。點卷積的通道維度壓縮操作減少了特征圖的數(shù)據(jù)量和復(fù)雜度,降低了模型的計算資源消耗,使模型能夠在資源受限的設(shè)備上更高效地運行。非線性激活函數(shù)的特征增強作用則提升了特征的表達(dá)能力和可分性,使模型能夠更準(zhǔn)確地識別和區(qū)分不同的特征模式,從而提高了人體感知的精度和可靠性。通過這一系列操作,整體技術(shù)流程能夠?qū)崿F(xiàn)對無線信號頻譜數(shù)據(jù)的高效處理和特征提取,為人體感知任務(wù)提供高質(zhì)量的特征輸入,增強了模型在實際應(yīng)用中的性能和適應(yīng)性,拓展了其應(yīng)用場景,如智能家居中的人體活動監(jiān)測、智能醫(yī)療中的患者行為分析[0062]在一種可行的實施方式中,所述將所述初始壓縮特征圖輸入預(yù)設(shè)的非局部注意力模型,分別沿時間維度、頻率維度和子載波維度進行嵌入空間映射,并基于嵌入特征間的相似性計算,生成時間注意力權(quán)重、頻率注意力權(quán)重和子載波注意力權(quán)重,將所述時間注意力權(quán)重、所述頻率注意力權(quán)重和所述子載波注意力權(quán)重分別與所述初始壓縮特征圖進行加權(quán)融合,生成三維注意力特征圖的步驟包括:通過對所述初始壓縮特征圖分別沿時間維度、頻率維度及子載波維度進行線性投基于嵌入式高斯函數(shù)計算所述各維度嵌入特征間的相似度矩陣,生成各維度注意力權(quán)重;將所述各維度注意力權(quán)重與所述初始壓縮特征圖進行加權(quán)求和,再通過殘差連接與可學(xué)習(xí)增益參數(shù)進行融合,得到三維注意力特征圖。[0063]需要說明的是,線性投影是一種線性變換技術(shù),通過對初始壓縮特征圖分別沿時間維度、頻率維度及子載波維度進行線性投影,將特征圖映射到新的嵌入空間中。線性投影能夠改變特征的表示形式,使其更適合后續(xù)的相似度計算和注意力權(quán)重生成過程,同時保留特征的主要信息。[0064]嵌入特征是經(jīng)過線性投影后得到的特征向量,位于新的嵌入空間中。嵌入特征能夠更好地捕捉到初始壓縮特征圖在不同維度上的關(guān)鍵特征信息,為進一步的相似度計算和注意力機制處理提供了基礎(chǔ)。[0065]嵌入式高斯函數(shù)是一種用于計算相似度的函數(shù),基于高斯函數(shù)的形式,計算各維度嵌入特征之間的相似度矩陣。嵌入式高斯函數(shù)能夠衡量特征之間的相似性程度,生成的相似度矩陣反映了不同特征在嵌入空間中的相關(guān)性,為生成注意力權(quán)重提供了依據(jù)。[0066]相似度矩陣是由嵌入式高斯函數(shù)計算得到的矩陣,表示嵌入特征之間的相似度關(guān)的三維混合注意力是專為無線信號頻譜數(shù)據(jù)集設(shè)計的。其原理是通過3個非局部運算分別間中的重要性。本申請?zhí)岢鲈撃P湍芡瑫r關(guān)注無線信號數(shù)據(jù)的三個[0072]示例性地,給定一個從頻率維度提取的特征圖ZF,非局部模塊首先利用嵌入式高數(shù)據(jù)特點自適應(yīng)地融合非局部信息和原始特征。[0077]與此類似,在旋轉(zhuǎn)特征圖的同時,同樣分別從時間維度和子載波維度生成加權(quán)特征ZT,?s,并作為第一階段形成三維注意力機制。[0078]可以理解的是,通過對初始壓縮特征圖分別沿三個維度進行線性投影,能夠?qū)⑻卣饔成涞礁m合相似度計算和注意力權(quán)重生成的嵌入空間中,更好地捕捉特征之間的關(guān)系和相似性。嵌入式高斯函數(shù)計算出的相似度矩陣為生成精確的各維度注意力權(quán)重提供了可靠依據(jù),使得注意力權(quán)重能夠準(zhǔn)確地反映不同維度特征的重要性。加權(quán)求和操作結(jié)合殘差連接與可學(xué)習(xí)增益參數(shù),不僅能夠融合多維度特征信息,突出關(guān)鍵特征,還能保留原始特征信息,提高模型的穩(wěn)定性和收斂速度。最終得到的三維注意力特征圖,融合了時間、頻率和子載波三個維度的關(guān)鍵特征信息,能夠更全面、準(zhǔn)確地反映無線信號頻譜數(shù)據(jù)所蘊含的人體感知信息,提高了人體感知的精度和可靠性,提升了模型在人體感知任務(wù)中的性能和適應(yīng)性,為智能家居、智能醫(yī)療等領(lǐng)域的應(yīng)用提供了更高質(zhì)量的特征表示和更準(zhǔn)確的識別結(jié)[0079]在一種可行的實施方式中,所述通過預(yù)設(shè)的交叉注意力模型對所述三維注意力特征圖進行多維度聯(lián)合特征融合,生成深層聯(lián)合特征的步驟包括:將所述三維注意力特征圖進行空間對齊拼接,生成聯(lián)合特征矩陣,對所述聯(lián)合特征矩陣進行二次非局部注意力操作,計算跨維度的全局關(guān)聯(lián)權(quán)重;通過所述全局關(guān)聯(lián)權(quán)重對所述聯(lián)合特征矩陣進行動態(tài)加權(quán),經(jīng)過非線性變換后確定所述深層聯(lián)合特征。[0080]需要說明的是,空間對齊拼接是一種將不同來源或不同維度的特征圖在空間維度上進行對齊和拼接的技術(shù)。通過對三維注意力特征圖進行空間對齊拼接,將多個特征圖整合成一個聯(lián)合特征矩陣,使得不同特征圖中的特征能夠在同一空間框架下進行融合和處理,為后續(xù)的特征分析和特征融合提供了統(tǒng)一的特征表示形式。[0081]聯(lián)合特征矩陣是由空間對齊拼接后的特征圖組成的矩陣或張量。它整合了來自不同維度或來源的特征信息,包含了更全面的特征描述,能夠更完整地反映數(shù)據(jù)的內(nèi)在特性,為后續(xù)的特征處理和分析提供了更豐富的信息基礎(chǔ)。[0082]二次非局部注意力操作是在非局部注意力機制的基礎(chǔ)上,對聯(lián)合特征矩陣進行的二次注意力計算和特征融合過程。通過二次非局部注意力操作,能夠進一步捕捉聯(lián)合特征矩陣中不同位置之間的長程依賴關(guān)系,挖掘特征之間的深層次關(guān)聯(lián),增強特征的表達(dá)能力和區(qū)分度。[0083]跨維度的全局關(guān)聯(lián)權(quán)重是通過二次非局部注意力操作計算得到的,反映聯(lián)合特征矩陣中不同維度特征之間全局關(guān)聯(lián)程度的權(quán)重。跨維度的全局關(guān)聯(lián)權(quán)重能夠衡量不同維度特征在整體特征空間中的重要性和相互作用,為后續(xù)的動態(tài)加權(quán)提供了依據(jù),使得模型能夠根據(jù)特征之間的全局關(guān)聯(lián)性進行特征融合和權(quán)重調(diào)整。[0084]動態(tài)加權(quán)是根據(jù)跨維度的全局關(guān)聯(lián)權(quán)重,對聯(lián)合特征矩陣中的特征進行加權(quán)的過程。動態(tài)加權(quán)能夠根據(jù)特征之間的關(guān)聯(lián)程度和重要性,自動調(diào)整特征的權(quán)重,突出關(guān)鍵特征,抑制不重要的特征,使模型能夠更加關(guān)注與任務(wù)相關(guān)的特征信息,提高模型的性能和泛化能力。[0085]非線性變換是一種對特征進行非線性處理的過程,通常通過非線性激活函數(shù)實現(xiàn)。非線性變換能夠引入非線性因素,使模型能夠?qū)W習(xí)到數(shù)據(jù)中的復(fù)雜模式和非線性關(guān)系,增強特征的表達(dá)能力和模型的擬合能力。在確定深層聯(lián)合特征的過程中,非線性變換有助于將經(jīng)過動態(tài)加權(quán)后的特征映射到一個新的特征空間,進一步提升特征的表示能力和區(qū)分[0086]深層聯(lián)合特征是經(jīng)過動態(tài)加權(quán)和非線性變換后得到的特征。深層聯(lián)合特征融合了不同維度的特征信息,并且在特征空間中進行了深層次的特征挖掘和融合,能夠更全面、準(zhǔn)確地反映數(shù)據(jù)的本質(zhì)特征和內(nèi)在規(guī)律,為后續(xù)的人體感知等任務(wù)提供了更高質(zhì)量的特征表[0087]示例性地,無線信號頻譜圖的3個維度所承載的運動模式可能不盡相同。作為第二階段的交叉關(guān)注是重新權(quán)衡深度特征空間中每個維度的重要性。后,非局部操作將對先前的3個加權(quán)特征圖進行如下權(quán)重計算:[0089]之后,使用第二次可分離卷積來合并zFTS,并將維度從3Nss恢復(fù)到Nss。這兩個階段的關(guān)注結(jié)構(gòu)可集中在3個維度(即時間、頻率和子載波)的特定區(qū)域,以實現(xiàn)準(zhǔn)確分類。[0090]可以理解的是,空間對齊拼接操作將三維注意力特征圖整合成聯(lián)合特征矩陣,為后續(xù)特征融合提供了統(tǒng)一的特征表示形式,使得不同維度的特征能夠在同一空間框架下進行分析和處理。二次非局部注意力操作能夠進一步挖掘特征之間的深層次關(guān)聯(lián),計算出跨維度的全局關(guān)聯(lián)權(quán)重,為動態(tài)加權(quán)提供了精準(zhǔn)的依據(jù)。動態(tài)加權(quán)結(jié)合非線性變換,能夠突出關(guān)鍵特征,抑制不重要特征,增強特征的表達(dá)能力和模型的擬合能力。最終得到的深層聯(lián)合特征融合了多維度特征信息,并且在特征空間中進行了深層次的挖掘和融合,能夠更全面、準(zhǔn)確地反映無線信號頻譜數(shù)據(jù)所蘊含的人體感知信息,提高了人體感知識別的精度和可靠性,提升了模型在人體感知任務(wù)中的性能和適應(yīng)性,為智能家居、智能醫(yī)療等領(lǐng)域的應(yīng)用提供了更高質(zhì)量的特征表示和更準(zhǔn)確的識別結(jié)果。[0091]在一種可行的實施方式中,所述通過預(yù)設(shè)的第一可分離卷積模型對所述無線信號頻譜數(shù)據(jù)進行特征壓縮,生成初始壓縮特征圖的步驟之前包括:在非局部注意力模型中采用通道縮減技術(shù),將嵌入空間的通道數(shù)量壓縮至原始特征的預(yù)設(shè)比例以減少計算量;在交叉注意力模型中引入子采樣操作,通過最大池化或平均池化降低特征圖的分辨率以縮減矩陣運算規(guī)模;在模型訓(xùn)練過程中采用增量式監(jiān)督數(shù)據(jù)增強損失函數(shù),結(jié)合動態(tài)權(quán)重調(diào)整策略優(yōu)化模型參數(shù)更新,以抑制過擬合并提升泛化能力;通過瓶頸結(jié)構(gòu)設(shè)計限制可分離卷積層的中間通道數(shù),降低模型參數(shù)量及內(nèi)存占[0092]需要說明的是,通道縮減技術(shù)是一種用于降低模型計算量的技術(shù)。在非局部注意力模型中,通道縮減技術(shù)將嵌入空間的通道數(shù)量壓縮至原始特征的預(yù)設(shè)比例,減少計算量的同時保留關(guān)鍵特征信息。[0093]子采樣操作是一種降低特征圖分辨率的技術(shù)。在交叉注意力模型中引入子采樣操作,通過最大池化或平均池化降低特征圖的分辨率以縮減矩陣運算規(guī)模,減少計算資源消[0094]最大池化是一種池化操作。對特征圖進行劃分,取每個劃分區(qū)域內(nèi)的最大值作為[0095]平均池化是一種池化操作。對特征圖進行劃分,取每個劃分區(qū)域內(nèi)的平均值作為[0096]增量式監(jiān)督數(shù)據(jù)增強損失函數(shù)是一種結(jié)合數(shù)據(jù)增強與監(jiān)督學(xué)習(xí)的損失函數(shù)。在模型訓(xùn)練過程中,通過逐步增加數(shù)據(jù)增強的強度和多樣性,使模型在學(xué)習(xí)過程中能夠適應(yīng)更多的數(shù)據(jù)變化,提高模型的泛化能力。[0097]動態(tài)權(quán)重調(diào)整策略是一種優(yōu)化模型參數(shù)更新的策略。動態(tài)權(quán)重調(diào)整策略在模型訓(xùn)練過程中根據(jù)模型的表現(xiàn)和數(shù)據(jù)的變化,自動調(diào)整權(quán)重更新的幅度和方向,抑制過擬合,提升模型的泛化能力。[0098]瓶頸結(jié)構(gòu)設(shè)計是一種模型結(jié)構(gòu)優(yōu)化技術(shù)。通過限制可分離卷積層的中間通道數(shù),降低模型參數(shù)量及內(nèi)存占用,減少計算成本,提高模型的運行效率。[0099]示例性地,本申請利用瓶頸(bottleneck)和子采樣技術(shù)來進一步減少4個注意力操作的計算量。瓶頸法是將W,W中和W9所代表的通道數(shù)設(shè)為ZF,ZT或Zs中通道數(shù)的1/8。采樣法是利用最大池化來縮小ZF,ZT或Zs的大小,并在一次注意力操作中將矩陣乘法計算量減少1/4。[0100]可以理解的是,通道縮減技術(shù)和子采樣操作分別從通道維度和空間維度減少了特征圖的數(shù)據(jù)量和計算復(fù)雜度。通道縮減技術(shù)將嵌入空間的通道數(shù)量壓縮至原始特征的預(yù)設(shè)比例,子采樣操作通過最大池化或平均池化降低特征圖的分辨率,有效減少了非局部注意力模型和交叉注意力模型的計算量,減輕了模型的計算負(fù)擔(dān),提高了模型的運行效率。增量式監(jiān)督數(shù)據(jù)增強損失函數(shù)與動態(tài)權(quán)重調(diào)整策略相結(jié)合,在模型訓(xùn)練過程中逐步增加數(shù)據(jù)增強的強度和多樣性,使模型能夠適應(yīng)更多的數(shù)據(jù)變化,同時動態(tài)調(diào)整權(quán)重更新的幅度和方向,抑制過擬合現(xiàn)象,提升模型的泛化能力,使模型在不同場景和數(shù)據(jù)分布下表現(xiàn)出更穩(wěn)定的性能。瓶頸結(jié)構(gòu)設(shè)計通過限制可分離卷積層的中間通道數(shù),降低了模型的參數(shù)量和內(nèi)存占用。這使得模型能夠在資源有限的設(shè)備上更高效地運行,減少了對硬件資源的依賴,拓展了模型的應(yīng)用場景,如在移動設(shè)備、小型傳感器節(jié)點等資源受限的硬件上部署人體感知技術(shù)。[0101]步驟S30,根據(jù)所述人體動作感知特征,確定人體動作感知識別結(jié)果。[0102]需要說明的是,人體動作感知特征是從無線信號頻譜數(shù)據(jù)中提取的,能夠反映人體動作關(guān)鍵信息的特征。這些特征經(jīng)過模型的多層處理和特征提取,保留了與人體動作相[0103]人體動作感知識別結(jié)果是根據(jù)人體動作感知特征,通過分類、識別算法等確定的動作的監(jiān)測和分析。[0104]示例性地,在智能養(yǎng)老院場景中,房間內(nèi)安裝的無線信號監(jiān)測設(shè)備實時獲取老人周圍的無線信號頻譜數(shù)據(jù)。這些數(shù)據(jù)經(jīng)過三維混合注意力模型的處理,提取出人體動作感知特征。根據(jù)這些特征,利用預(yù)設(shè)的分類模型確定人體動作感知識別結(jié)果,如判斷老人是處于正常行走狀態(tài)還是跌倒?fàn)顟B(tài)。一旦識別出老人跌倒,系統(tǒng)立即觸發(fā)報警機制,通知護理人員及時前往處理,從而實現(xiàn)對老人的實時安全監(jiān)護。[0105]本實施例提供了一種基于三維混合注意力模型的人體動作感知方法,采用了三維混合注意力機制,包括非局部注意力模塊和交叉注意力模塊。非局部注意力模塊利用時間、頻率和子載波三個維度計算注意力權(quán)重,從而能夠更好地捕捉無線信號的多維特征。交叉注意力模塊則進一步融合了這些三維注意力圖,以增強模型的特征提取能力。在硬件資源有限的情況下,該模型通過減少參數(shù)量,大幅提高了識別效率,使得基于無線信號的人體動作感知技術(shù)可以在如智能家居和智能醫(yī)療等場景中的小型設(shè)備上實現(xiàn)有效部署。[0106]示例性地,為了助于理解本實施例結(jié)合上述實施例一后所得到的基于三維混合注意力模型的人體動作感知方法的實現(xiàn)流程,請參照圖3,圖3提供了一種基于三維混合注意力模型的人體動作感知方法的簡要流程示意圖,具體地:通過相應(yīng)的傳感器設(shè)備(如WiFi設(shè)備、毫米波雷達(dá)等)收集無線信號頻譜數(shù)據(jù)。這些數(shù)據(jù)包含了隨時間變化的信號強度、頻率等信息,反映了人體動作對無線信號的影響。[0107]將收集到的無線信號頻譜數(shù)據(jù)輸入預(yù)設(shè)的第一可分離卷積模型。先利用深度卷積對數(shù)據(jù)的空間維度進行局部特征提取,得到局部特征圖。然后通過點卷積對局部特征圖進行通道維度壓縮,減少冗余的特征通道數(shù)量。接著運用非線性激活函數(shù)對壓縮后的特征圖進行特征增強,從而得到初始壓縮特征圖,此時數(shù)據(jù)的特征維度已有所降低,保留了關(guān)鍵的特征信息。[0108]把初始壓縮特征圖送入預(yù)設(shè)的非局部注意力模型。分別沿時間維度、頻率維度和子載波維度進行嵌入空間映射,即對特征圖在各維度進行線性投影,生成各維度的嵌入特征?;谇度胧礁咚购瘮?shù)計算各維度嵌入特征間的相似度矩陣,進而生成時間注意力權(quán)重、頻率注意力權(quán)重和子載波注意力權(quán)重。將這些權(quán)重分別與初始壓縮特征圖進行加權(quán)求和操作,并通過殘差連接與可學(xué)習(xí)增益參數(shù)進行融合,最終得到三維注意力特征圖,從三個維度突出了對動作感知有重要作用的特征。[0109]將三維注意力特征圖輸入預(yù)設(shè)的交叉注意力模型。先對特征圖進行空間對齊拼接,形成聯(lián)合特征矩陣。然后對該聯(lián)合特征矩陣進行二次非局部注意力操作,計算出跨維度的全局關(guān)聯(lián)權(quán)重。利用這些全局關(guān)聯(lián)權(quán)重對聯(lián)合特征矩陣進行動態(tài)加權(quán),并經(jīng)過非線性變換,得到深層聯(lián)合特征,實現(xiàn)了多維度特征的深度融合,進一步增強了特征的[0110]采用預(yù)設(shè)的第二可分離卷積模型對深層聯(lián)合特征進行維度調(diào)整。通過相應(yīng)的卷積操作,將特征恢復(fù)至目標(biāo)特征維度,使其符合后續(xù)人體動作識別模型的輸入要求,從而輸出人體動作感知特征,這些特征能夠有效表征人體的不同動作狀態(tài)。[0111]將人體動作感知特征輸入預(yù)先訓(xùn)練好的識別模型(可以是分類器等),由該模型根據(jù)感知到的特征來確定人體動作感知識別結(jié)果,例如判斷出是行走、奔跑、揮手等具體的動作類型,最終完成人體動作感知的全過程。[0112]需要說明的是,上述示例僅用于理解本申請,并不構(gòu)成對本申請基于三維混合注意力模型的人體動作感知方法的限定,基于此技術(shù)構(gòu)思進行更多形式的簡單變換,均在本申請的保護范圍內(nèi)。[0113]本申請還提供一種基于三維混合注意力模型的人體動作感知裝置,請參照圖4,所述基于三維混合注意力模型的人體動作感知裝置包括:獲取模塊10,用于獲取無線信號頻譜數(shù)據(jù);處理模塊20,用于根據(jù)預(yù)設(shè)的三維混合注意力模型對所述無線信號頻譜數(shù)據(jù)進行特征處理,確定人體動作感知特征,其中,所述三維混合注意力模型首先對無線信號頻譜數(shù)據(jù)進行特征壓縮,然后基于非局部注意力機制,從時間、頻率和子載波三個維度分別計算注意力權(quán)重,生成三維注意力特征圖,最終通過交叉注意力對三維注意力特征圖進行融合,維度調(diào)整后輸出人體動作感知特征;確定模塊30,用于根據(jù)所述人體動作感知特征,確定人體動作感知識別結(jié)果。第一壓縮模塊,用于通過預(yù)設(shè)的第一可分離卷積模型對所述無線信號頻譜數(shù)據(jù)進第一映射模塊,用于將所述初始壓縮特征圖輸入預(yù)設(shè)的非局部注意力模型,分別沿時間維度、頻率維度和子載波維度進行嵌入空間映射,并基于嵌入特征間的相似性計算,生成時間注意力權(quán)重、頻率注意力權(quán)重和子載波注意力權(quán)重,將所述時間注意力權(quán)重、所述頻率注意力權(quán)重和所述子載波注意力權(quán)重分別與所述初始壓縮特征圖進行加權(quán)融合,生成三維注意力特征圖;第一融合模塊,用于通過預(yù)設(shè)的交叉注意力模型對所述三維注意力特征圖進行多維度聯(lián)合特征融合,生成深層聯(lián)合特征;第一調(diào)整模塊,用于利用預(yù)設(shè)的第二可分離卷積模型對所述深層聯(lián)合特征進行維度調(diào)整,恢復(fù)至目標(biāo)特征維度,輸出所述人體動作感知特征。第一提取模塊,用于通過深度卷積對輸入頻譜數(shù)據(jù)的空間維度進行局部特征提第二壓縮模塊,用于通過點卷積對所述局部特征圖進行通道維度壓縮,減少冗余第一增強模塊,用于通過非線性激活函數(shù)對所述壓縮特征圖進行特征增強,確定初始壓縮特征圖。第一投影模塊,用于通過對所述初始壓縮特征圖分別沿時間維度、頻率維度及子載波維度進行線性投影,生成各維度嵌入特征,第一嵌入模塊,用于基于嵌入式高斯函數(shù)計算所述各維度嵌入特征間的相似度矩第二融合模塊,用于將所述各維度注意力權(quán)重與所述初始壓縮特征圖進行加權(quán)求和,再通過殘差連接與可學(xué)習(xí)增益參數(shù)進行融合,得到三維注意力特征圖。第一拼接模塊,用于將所述三維注意力特征圖進行空間對齊拼接,生成聯(lián)合特征第一計算模塊,用于對所述聯(lián)合特征矩陣進行二次非局部注意力操作,計算跨維度的全局關(guān)聯(lián)權(quán)重;第一變換模塊,用于通過所述全局關(guān)聯(lián)權(quán)重對所述聯(lián)合特征矩陣進行動態(tài)加權(quán),經(jīng)過非線性變換后確定所述深層聯(lián)合特征。[0118]和/或,所述基于三維混合注意力模型的人體動作感知裝置包括:第三壓縮模塊,用于在非局部注意力模型中采用通道縮減技術(shù),將嵌入空間的通道數(shù)量壓縮至原始特征的預(yù)設(shè)比例以減少計算量;第一降低模塊,用于在交叉注意力模型中引入子采樣操作,通過最大池化或平均池化降低特征圖的分辨率以縮減矩陣運算規(guī)模;第一更新模塊,用于在模型訓(xùn)練過程中采用增量式監(jiān)督數(shù)據(jù)增強損失函數(shù),結(jié)合動態(tài)權(quán)重調(diào)整策略優(yōu)化模型參數(shù)更新,以抑制過擬合并提升泛化能力;第二降低模塊,用于通過瓶頸結(jié)構(gòu)設(shè)計限制可分離卷積層的中間通道數(shù),降低模型參數(shù)量及內(nèi)存占用。[0119]本申請?zhí)峁┑幕谌S混合注意力模型的人體動作感知裝置,采用上述實施例中的基于三維混合注意力模型的人體動作感知方法,能夠解決資源有限的物聯(lián)網(wǎng)設(shè)備中的人體動作感知識別效率低的技術(shù)問題。與現(xiàn)有技術(shù)相比,本申請?zhí)峁┑幕谌S混合注意力模型的人體動作感知裝置的有益效果與上述實施例提供的基于三維混合注意力模型的人體動作感知方法的有益效果相同,且所述基于三維混合注意力模型的人體動作感知裝置中的其他技術(shù)特征與上述實施例方法公開的特征相同,在此不做贅述。[0120]本申請?zhí)峁┮环N基于三維混合注意力模型的人體動作感知設(shè)備,基于三維混合注意力模型的人體動作感知設(shè)備包括:至少一個處理器;以及,與至少一個處理器通信連接的存儲器;其中,存儲器存儲有可被至少一個處理器執(zhí)行的指令,指令被至少一個處理器執(zhí)行,以使至少一個處理器能夠執(zhí)行上述實施例一中的基于三維混合注意力模型的人體動作感知方法。[0121]下面參考圖5,其示出了適于用來實現(xiàn)本申請實施例的基于三維混合注意力模型的人體動作感知設(shè)備的結(jié)構(gòu)示意圖。本申請實施例中的基于三維混合注意力模型的人體動(PersonalDigitalAssistant:個人數(shù)字助理)、PMP(PortableMediaPlayer:便攜式多媒體播放器)、車載終端(例如車載導(dǎo)航終端)等等的移動終端以及諸如數(shù)字電視、臺式計算機等等的固定終端。圖5示出的基于三維混合注意力模型的人體動作感知設(shè)備僅僅是一個示例,不應(yīng)對本申請實施例的功能和使用范圍帶來任何限制。[0122]如圖5所示,基于三維混合注意力模型的人體動作感知設(shè)備可以包括處理裝置1001(例如中央處理器、圖形處理器等),其可以根據(jù)存儲在只讀存儲器(ROM:ReadOnlyMemory)1002中的程序或者從存儲裝置1003加載到隨機訪問存儲器(RAM:RandomAccessMemory)1004中的程序而執(zhí)行各種適當(dāng)?shù)膭幼骱吞幚?。在RAM1004中,還存儲有基于三維混及RAM1004通過總線1005彼此相連。輸入/輸出(I/O)接口1006也連接至總線。通常,以下系速度計、陀螺儀等的輸入裝置1007;包括例如液晶顯示器(LCD:LiquidCrystalDisplay)、揚聲器、振動器等的輸出裝置1008;包括例如磁帶、硬盤等的存儲裝置1003;以及通信裝置1009。通信裝置1009可以允許基于三維混合注意力模型的人體動作感知設(shè)備與其他設(shè)備進行無線或有線通信以交換數(shù)據(jù)。雖然圖中示出了具有各種系統(tǒng)的基于三維混合注意力模型的人體動作感知設(shè)備,但是應(yīng)理解的是,并不要求實施或具備所有示出的系統(tǒng)??梢蕴娲貙嵤┗蚓邆涓嗷蚋俚南到y(tǒng)。[0123]特別地,根據(jù)本申請公開的實施例,上文參考流程圖描述的過程可以被實現(xiàn)為計算機軟件程序。例如,本申請公開的實施例包括一種計算機程序產(chǎn)品,其包括承載在計算機可讀介質(zhì)上的計算機程序,該計算機程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實施例中,該計算機程序可以通過通信裝置從網(wǎng)絡(luò)上被下載和安裝,或者從存儲裝置1003被安裝,或者從ROM1002被安裝。在該計算機程序被處理裝置1001執(zhí)行時,執(zhí)行本申請公開實施例的方法中限定的上述功能。[0124]本申請?zhí)峁┑幕谌S混合注意力模型的人體動作感知設(shè)備,采用上述實施例中的基于三維混合注意力模型的人體動作感知方法,能解決資源有限的物聯(lián)網(wǎng)設(shè)備中的人體動作感知識別效率低的技術(shù)問題。與現(xiàn)有技術(shù)相比,本申請?zhí)峁┑幕谌S混合注意力模型的人體動作感知設(shè)備的有益效果與上述實施例提供的基于三維混合注意力模型的人體動作感知方法的有益效果相同,且該基于三維混合注意力模型的人體動作感知設(shè)備中的其他技術(shù)特征與上一實施例方法公開的特征相同,在此不做贅述。[0125]應(yīng)當(dāng)理解,本申請公開的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述實施方式的描述中,具體特征、結(jié)構(gòu)、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結(jié)合。[0126]以上所述,僅為本申請的具體實施方式,但本申請的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本申請揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本申請的保護范圍之內(nèi)。因此,本申請的保護范圍應(yīng)以所述
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《GB-T 39003.1-2020工業(yè)自動化系統(tǒng)工程用工程數(shù)據(jù)交換格式 自動化標(biāo)識語言 第1部分:架構(gòu)和通 用要求》專題研究報告
- 《GB-T 11322.1-2013射頻電纜 第0部分:詳細(xì)規(guī)范設(shè)計指南 第1篇 同軸電纜》專題研究報告
- 《GB-T 31181-2014假肢 踝足裝置和足部組件 要求和試驗方法》專題研究報告
- 《GB-T 38842-2020實 用超導(dǎo)線的分類和檢測方法 一般特性和指南》專題研究報告
- 《GBT 34475-2017 尿素級奧氏體不銹鋼棒》專題研究報告
- 《GB-T 7268-2015電力系統(tǒng)保護及其自動化裝置用插箱及插件面板基本尺寸系列》專題研究報告
- Tiamo-basical-method-1參考資料說明
- 《幼兒文學(xué)》課件-6.2幼兒圖畫故事特點
- 種子行業(yè)種子銷售經(jīng)理崗位招聘考試試卷及答案
- 2026年消防安全工作計劃(2篇)
- 贛南師范大學(xué)《中國地理》2022-2023學(xué)年第一學(xué)期期末試卷
- 興業(yè)銀行還款合同模板
- 基于機器學(xué)習(xí)的房性心動過速射頻消融預(yù)測模型
- GB/T 44239-2024增材制造用鋁合金粉
- 溫泉洗浴中心管理手冊樣本
- 內(nèi)分泌科醫(yī)生進修匯報
- 工業(yè)固廢運輸處置投標(biāo)方案(技術(shù)標(biāo))
- 泰文租房合同
- 《機械制圖》期末考試題庫388題(含答案)
- 培訓(xùn)費收款收據(jù)模板
- 鋼結(jié)構(gòu)施工技術(shù)指導(dǎo)手冊
評論
0/150
提交評論