計算機視覺應用開發(fā)課件:人臉檢測_第1頁
計算機視覺應用開發(fā)課件:人臉檢測_第2頁
計算機視覺應用開發(fā)課件:人臉檢測_第3頁
計算機視覺應用開發(fā)課件:人臉檢測_第4頁
計算機視覺應用開發(fā)課件:人臉檢測_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

人臉檢測人臉檢測概述01任務人臉檢測方法02任務人臉檢測評價指標03任務學習目標掌握人臉檢測的基本概念掌握人臉檢測的方法掌握人臉檢測的評價指標1人臉檢測概述1人臉檢測概述從問題的領域來看,人臉檢測屬于目標檢測領域,目標檢測通常有兩大類:通用目標檢測:檢測圖像中多個類別的目標,比如ILSVRC2017的VID任務檢測200類目標,VOC2012檢測20類目標,通用目標檢測核心是n(目標)+1(背景)=n+1分類問題。這類檢測通常模型比較大,速度較慢。特定類別目標檢測:僅檢測圖像中某一類特定目標,如人臉檢測,行人檢測,車輛檢測等等,特定類別目標檢測核心是1(目標)+1(背景)=2分類問題。這類檢測通常模型比較小,速度要求非常高。從發(fā)展歷史來看,深度學習在其中的作用非常明顯:非深度學習階段:此階段的人臉檢測主要有兩個應用于人臉的特征,Haar特征和Hog特征,提取特征后在由分類器分類。深度學習階段:和目標檢測相同,應用于目標檢測的算法也適用于人臉檢測。2人臉檢測方法人臉檢測方法機器學習中基于Haar特征和Hog特征實現(xiàn)人臉檢測任務2Haar特征:也稱Haar-like特征,分為四類:邊緣特征、線性特征、中心特征和對角線特征,組合為特征模板。特征模板內有白色和黑色兩種矩形,并定義該模板的特征值為白色矩形像素和減去黑色矩形像素和。但矩形特征只對一些簡單的圖形結構,如邊緣、線段較敏感,所以只能描述特定走向(水平、垂直、對角)的結構。通過改變特征模板的大小和位置,可在圖像子窗口中窮舉出大量的特征。矩形特征可位于圖像任意位置,大小也可以任意改變,所以矩形特征值是受矩形模版類別、矩形位置和矩形大小這三個因素的影響。故類別、大小和位置的變化,使得很小的檢測窗口含有非常多的矩形特征。人臉檢測方法2但矩形特征只對一些簡單的圖形結構,如邊緣、線段較敏感,所以只能描述特定走向(水平、垂直、對角)的結構。對于圖中的A,B和D這類特征,特征數(shù)值計算公式為:

。而對于C來說,計算公式如下:

,之所以將黑色區(qū)域像素和乘以2,是為了使兩種矩形區(qū)域中像素數(shù)目一致。通常希望矩形放到人臉區(qū)域計算出來的特征值和放到非人臉區(qū)域計算出來的特征值差別越大越好,這樣就可以用來區(qū)分人臉和非人臉。人臉檢測方法2通過改變特征模板的大小和位置,可在圖像子窗口中窮舉出大量的特征。上圖的特征模板稱為“特征原型”,特征原型在圖像子窗口中擴展(平移伸縮)得到的特征稱為“矩形特征”,矩形特征的值稱為“特征值”。圖中即使用兩個Haar矩形特征,表示出人臉的某些特征。比如中間一幅表示眼睛區(qū)域的顏色比臉頰區(qū)域的顏色深,右邊一幅表示鼻梁兩側比鼻梁的顏色要深。同樣,其他目標,如眼睛等,也可以用一些矩形特征來表示。使用特征比單純地使用像素點具有很大的優(yōu)越性,并且速度更快。人臉檢測方法2Hog特征:Hog特征又叫方向梯度直方圖特征(HistogramofOrientedGradient,HOG)。Hog特征是一種在計算機視覺和圖像處理中用來進行物體檢測的特征描述子。它通過計算和統(tǒng)計圖像局部區(qū)域的梯度方向直方圖來構成特征。優(yōu)點:(1)由于HOG是在圖像的局部方格單元上操作,所以它對圖像幾何和光學的形變都能保持很好的不變性,這兩種形變只會出現(xiàn)在更大的空間領域上。(2)在粗的空域抽樣、精細的方向抽樣以及較強的局部光學歸一化等條件下,只要行人大體上能夠保持直立的姿勢,可以容許行人有一些細微的肢體動作,這些細微的動作可以被忽略而不影響檢測效果。因此HOG特征是特別適合于做圖像中的人體檢測的。人臉檢測方法2HOG特征提取方法就是將一個image(你要檢測的目標或者掃描窗口):(1)灰度化(將圖像看作一個x,y,z(灰度)的三維圖像);(2)采用Gamma校正法對輸入圖像進行顏色空間的標準化(歸一化),目的是調節(jié)圖像的對比度,降低圖像局部的陰影和光照變化所造成的影響,同時可以抑制噪音的干擾;(3)計算圖像每個像素的梯度(包括大小和方向),主要是為了捕獲輪廓信息,同時進一步弱化光照的干擾;(4)將圖像劃分成小cells(例如6×6像素/cell);(5)統(tǒng)計每個cell的梯度直方圖(不同梯度的個數(shù)),即可形成每個cell的descriptor;(6)將每幾個cell組成一個block(例如3×3個cell/block),一個block內所有cell的特征descriptor串聯(lián)起來便得到該block的HOG特征descriptor;(7)將圖像image內的所有block的HOG特征descriptor串聯(lián)起來就可以得到該image(要檢測的目標)的HOG特征descriptor了。這個就是最終的可供分類使用的特征向量了。3人臉檢測的評價指標人臉檢測的評價指標3評價人臉檢測效果的好壞,常用三個指標:召回率,誤檢數(shù)和檢測速度。召回率(recall):檢測器能檢測出來的人臉數(shù)量的比例就是召回率recall。檢測器檢測出來的矩形框越接近人工標注的矩形框,說明檢測結果越好,通常交并比IoU大于0.5就認為是檢測出來了,所以recall=檢測出來的人臉數(shù)量/圖像中總人臉數(shù)量,其中交并比IoU=框與框的交集區(qū)域/框與框的并集區(qū)域。誤檢數(shù)(falsepositives):通常用檢測錯誤的絕對數(shù)量作為誤檢數(shù)falsepositives指標。與recall相對,檢測器檢測出來的矩形框與任何人工標注框的IoU都小于0.5,則認為這個檢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論