下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
人體的目標檢測和姿態(tài)識別的相關理論基礎綜述關于人體的目標檢測和姿態(tài)識別,相關的理論研究越來越多,層出不窮,在計算機視覺領域的重要地位也讓人體檢測在我們的日常生活也開始扮演起越來越重要的地位,我們對此都是有目共睹。1.1骨骼關鍵點姿態(tài)估計中,人體關鍵點檢測很大程度上取決于對人體骨骼關鍵點位的預先判斷和估計,總的來說可以分為兩個大類,分別是基于單人和基于多人的骨骼關鍵點檢測這兩種。其中,基于多人的骨骼關鍵點檢測分為自上而下和自下而上兩種形式。自上而下的多人骨骼關鍵點檢測算法主要包括:多人人體檢測算法和單人關鍵點提取算法。先檢測出人,再對檢測到的每個人進行單人姿態(tài)的估計,即通過檢測算法將視野范圍內(nèi)的每個人檢測出來,然后根據(jù)檢測到的人數(shù),對單人進行人體骨骼關鍵點檢測[5]。自下而上的多人骨骼關鍵點檢測算法主要包括:關鍵點檢測和關鍵點聚類。先檢測出關節(jié)點,再判斷每一個關節(jié)點屬于哪一個人,即先將圖像中所有的關鍵點都檢測出來,再將所有的關鍵點聚類成不同的個體。1.2AlphaPose算法AlphaPose是一種自上而下的檢測算法,這種算法的構(gòu)筑框架是很多人在一定范圍內(nèi)姿態(tài)判斷,這種算法的優(yōu)點在于即使是圖像中的目標比較模糊,對于目標的形體大小不是很容易判斷的情況,這種算法依然可以保持較高的判斷準確率,基本上不會出現(xiàn)識別不出來的問題,這也是近幾年新興且比較好用的算法,好評頗多。該算法由三部分組成:對稱空間變換網(wǎng)絡、參數(shù)化姿態(tài)非最大抑制和姿態(tài)引導區(qū)域框生成器[6]。其中,在以前常用的對單一目標進行姿態(tài)研究時,由于目標只有一個,算法有時會對目標檢測得不夠全面,而對稱空間變換網(wǎng)絡對這方面有著相當不錯的改善,參數(shù)化姿態(tài)非最大抑制則是有效避免了在某些情況下對圖片會出現(xiàn)反復多次的檢測,有效節(jié)約了時間和成本,而姿態(tài)引導區(qū)域框生成器則是將平時測試訓練時所用的樣本池進行了進一步的擴大,通過數(shù)量的增加可以將誤差進一步的降低,這三個部分從三個不同的角度,以獨具自己風格的方式極大地提高了AlphaPose算法對于目標姿態(tài)識別的正確率。1.3尺度不變特征SIFT是一種計算機視覺領域的特征檢測算法,它的主要功能是用來判斷圖像中的非完整特性,提取圖像局部的位置、角度大小和在旋轉(zhuǎn)時不會改變的量等特征。SIFT算法的本質(zhì)是查找不同角度大小空間上的重要點位,并計算這些重要點位的方向,它在檢測有一部分被擋住的物體時的檢測成功率較高,能夠輕易判斷目標的狀態(tài)性質(zhì),并且發(fā)生錯誤判斷的概率也比較低。1.4加速魯棒特征SURF是一種計算機視覺領域的特征檢測算法,它的主要機制是積分圖像的Haar求導,通過計算兩個特征點之間的歐氏距離來確定它們的對應程度,即判斷該點是否是關鍵點。SURF算法有特征穩(wěn)定,在旋轉(zhuǎn)、角度變換時保持亮度不變,視角可以變換、噪聲具有穩(wěn)定性等優(yōu)點[8]。SURF特征是SIFT特征的改進版,SURF特征提取與SIFT特征提取步驟類似,只是在建立尺度空間之前構(gòu)建—個Hessian矩陣。1.5基于CPN的姿態(tài)估計方法基于CPN的姿態(tài)估計方法是一種金字塔型的串接模型(cascadedpyramidnetwork,CPN)并于2017年取得了COCOKeypointsChallenge競賽的第一名[7]。該方法主要用于辨別很多人在戶外的姿態(tài)估計問題。該方法設計了一個新模型,對不可見點和擁擠的背景中只通過表層特征不能識別的關鍵點進行了改進。CPN網(wǎng)絡分為兩個部分:GlobalNet和RefineNet。GlobalNet網(wǎng)絡是一個特征金字塔網(wǎng)絡,該網(wǎng)絡用于定位簡單的關鍵點,如眼睛和手等,但是對于遮擋點和不可見的點可能缺乏精確的定位;RefineNet網(wǎng)絡通過集合來自GlobalNet網(wǎng)絡的多級別特征來解決復雜條件下的關鍵點檢測問題。該方法首先使用FPN和MaskRCNN網(wǎng)絡,得到每個人的檢測框(Bounding-boxes),然后使用Bounding-boxes對原圖進行裁剪,并將裁剪后的結(jié)果作為CPN網(wǎng)絡輸入進行關鍵點檢測。當人體目標檢測數(shù)據(jù)經(jīng)過CPN網(wǎng)絡時,首先進入GlobalNet網(wǎng)絡。以resnet50為例,該網(wǎng)絡使用imagenet上預先訓練的resnet50網(wǎng)絡提取特征,其中分別使用1/4,1/8,1/16,1/32四個級別的網(wǎng)路特征,然后,在網(wǎng)絡中分別將四層特征的通道轉(zhuǎn)換為相同的通道數(shù),得到了四層通道數(shù)相同的特征圖。接著對該四層網(wǎng)絡特征做如下操作:低層特征進行上采樣,與上一層特征進行相加,即不同尺度特征進行融合,得到融合了低層特征的四層特征。最后,對該四層特征分別進行通道轉(zhuǎn)換(轉(zhuǎn)換為與關鍵點數(shù)目相同的通道數(shù))并都上采樣到1/4大小,用于計算該階段的L2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 活動項目管理培訓
- 津南崗位培訓介紹
- 2024-2025學年山東省部分學校高二下學期5月聯(lián)考歷史試題(A卷)(解析版)
- 2026年城市垃圾處理與資源化利用試題庫
- 2026年電子商務師專業(yè)能力測試題目
- 2026年外語學習試題英語口語高級測試題庫及答案
- 2026年職場溝通技巧與禮儀認證題庫
- 2026年農(nóng)業(yè)科技試題現(xiàn)代農(nóng)業(yè)技術(shù)與種植管理試題
- 2026年證券投資顧問資格認證考試題庫
- 2026年計算機系統(tǒng)維護系統(tǒng)管理與故障排除題集
- 專業(yè)律師服務合同書樣本
- 反詐宣傳講座課件
- GB/T 6003.2-2024試驗篩技術(shù)要求和檢驗第2部分:金屬穿孔板試驗篩
- DB32T 4398-2022《建筑物掏土糾偏技術(shù)標準》
- (精確版)消防工程施工進度表
- 保險公司資產(chǎn)負債表、利潤表、現(xiàn)金流量表和所有者權(quán)益變動表格式
- 電磁流量說明書
- XX少兒棋院加盟協(xié)議
- 五年級數(shù)學應用題專題訓練50題
- 2021年四川省資陽市中考數(shù)學試卷
- 高處作業(yè)安全培訓課件
評論
0/150
提交評論