版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
目標(biāo)檢測魯鵬北京郵電大學(xué)我們將要學(xué)習(xí)什么?目標(biāo)檢測簡介人臉檢測行人檢測我們將要學(xué)習(xí)什么?目標(biāo)檢測簡介人臉檢測行人檢測目標(biāo)類別檢測專注于目標(biāo)搜索:“它在哪里?”構(gòu)建可快速區(qū)分對象區(qū)塊與背景區(qū)塊的模板目標(biāo)還是非目標(biāo)?……來源:JamesHays目標(biāo)類別檢測的挑戰(zhàn)光照目標(biāo)姿態(tài)背景雜波類內(nèi)差異遮擋
視點(diǎn)來源:K.Grauman非目標(biāo)類別檢測的挑戰(zhàn)錯(cuò)誤的定位與相似物體混淆難以分辨不同的物體背景雜波正確檢測來源:JamesHays目標(biāo)檢測算法設(shè)計(jì)挑戰(zhàn)如何有效地搜索可能的目標(biāo)即使是簡單的模型也需要搜索數(shù)十萬個(gè)位置和尺度。特征設(shè)計(jì)和評分外觀特征應(yīng)該如何建模?哪些特征對應(yīng)于該目標(biāo)?如何應(yīng)對不同視點(diǎn)?通常針對不同視點(diǎn)訓(xùn)練不同的模型我們將要學(xué)習(xí)什么?物體檢測簡介人臉檢測行人檢測看一看最先進(jìn)的人臉檢測器?。˙orisBabenko提供)人臉檢測來源:Svetlana
Lazebnik應(yīng)用程序:AppleiPhotoiPhoto認(rèn)為是人臉的目標(biāo)來源:Svetlana
Lazebnik“尼康S60最多可檢測12張面孔?!眮碓矗篠vetlana
Lazebnik人臉檢測與識別檢測識別“Sally”來源:Svetlana
Lazebnik人臉檢測的挑戰(zhàn)滑動(dòng)窗口=數(shù)以萬計(jì)的位置評估一張百萬像素圖像有約106個(gè)像素,包含大量的可選面部位置面孔很少:每張圖像0–10個(gè)為了提高計(jì)算效率,在非人臉窗口上花費(fèi)盡可能少的時(shí)間。對于1Mpix的圖像,為了避免誤檢測,每張圖像的假正率必須小于10-6來源:JamesHays使用Viola-Jones進(jìn)行滑動(dòng)窗口人臉檢測來源:Svetlana
LazebnikP.ViolaandM.Jones.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures.CVPR2001.P.ViolaandM.Jones.Robustreal-timefacedetection.IJCV57(2),2004.一種簡單的魯棒學(xué)習(xí)算法Freund&Shapire,1995Friedman,Hastie,Tibshhirani,
1998提供了有效的視覺特征Tieu&Viola,
2000Viola&Jones,2003易于實(shí)施,不需要外部優(yōu)化工具。為什么使用boosting?
每個(gè)數(shù)據(jù)點(diǎn)都有一個(gè)類標(biāo)簽:和一個(gè)權(quán)重:
wt
=1
它是一個(gè)連續(xù)的過程:
Boosting-
數(shù)學(xué)Y.FreundandR.Schapire,
Ashortintroductiontoboosting,JournalofJapaneseSocietyforArtificialIntelligence,14(5):771-780,September,
1999.小例子弱學(xué)習(xí)器采用線性模型隨機(jī)模型h=>p(error)=0.5
每個(gè)數(shù)據(jù)點(diǎn)都有一個(gè)類標(biāo)簽:和一個(gè)權(quán)重:
wt=1
小例子這個(gè)似乎是最好的這是一個(gè)“弱分類器”:它的性能略好于隨機(jī)。
每個(gè)數(shù)據(jù)點(diǎn)都有一個(gè)類標(biāo)簽:和一個(gè)權(quán)重:
wt=1
小例子
每個(gè)數(shù)據(jù)點(diǎn)都有一個(gè)類標(biāo)簽:我們更新權(quán)重:
小例子
每個(gè)數(shù)據(jù)點(diǎn)都有一個(gè)類標(biāo)簽:我們更新權(quán)重:
小例子
每個(gè)數(shù)據(jù)點(diǎn)都有一個(gè)類標(biāo)簽:我們更新權(quán)重:
小例子
每個(gè)數(shù)據(jù)點(diǎn)都有一個(gè)類標(biāo)簽:我們更新權(quán)重:
小例子強(qiáng)(非線性)分類器是由所有弱(線性)分類器組合而成的分類器。f1f2f3f4我們需要定義一個(gè)弱分類器族強(qiáng)分類器弱分類器形成一個(gè)弱分類器族使用加法模型定義分類器:
權(quán)重特征向量
Boosting-數(shù)學(xué)弱學(xué)習(xí)器Boosting-數(shù)學(xué)最終的強(qiáng)分類器特征值臨界點(diǎn)
實(shí)時(shí)目標(biāo)檢測訓(xùn)練很慢,但是檢測很快關(guān)鍵想法積分圖可實(shí)現(xiàn)快速特征評估Boosting可實(shí)現(xiàn)特征選擇級聯(lián)用于快速過濾非面部窗口Viola&Jones算法P.ViolaandM.Jones.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures.CVPR
2001.實(shí)時(shí)目標(biāo)檢測訓(xùn)練很慢,但是檢測很快關(guān)鍵想法積分圖可實(shí)現(xiàn)快速特征評估Boosting可實(shí)現(xiàn)特征選擇級聯(lián)用于快速過濾非面部窗口Viola&Jones算法P.ViolaandM.Jones.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures.CVPR
2001.弱分類器?4種矩形過濾器Value
=
Σ(白色區(qū)域的像素)
–
Σ(黑色區(qū)域的像素)來源:Svetlana
Lazebnik來源結(jié)果弱分類器來源:Svetlana
Lazebnik用于快速特征評估的積分圖積分圖計(jì)算每個(gè)像素(x,y)處的值,該值是(x,y)上方和左側(cè)的所有像素值的總和,包括x,y。這可以通過遍歷一遍圖像快速計(jì)算得到。來源:Svetlana
Lazebniki(x,y)設(shè)A、B、C、D為矩形各角處的積分圖像的值矩形內(nèi)原始圖像值的總和可以計(jì)算為:
總和=A–B–C+D計(jì)算矩形內(nèi)的和DBCA任意大小的矩形只需要做3次加法即可!來源:Svetlana
Lazebnik對于24x24的檢測區(qū)域,可能的矩形特征數(shù)量約為160,000個(gè)!Viola&Jones算法來源:Svetlana
Lazebnik實(shí)時(shí)目標(biāo)檢測訓(xùn)練很慢,但是檢測很快關(guān)鍵想法積分圖可實(shí)現(xiàn)快速特征評估Boosting可實(shí)現(xiàn)特征選擇級聯(lián)用于快速過濾非面部窗口Viola&Jones算法P.ViolaandM.Jones.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures.CVPR
2001.弱分類器1.評估每個(gè)示例中的每個(gè)矩形過濾器Viola&Jones算法特征值閾值
P.ViolaandM.Jones.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures.CVPR
2001.(x1,1)(x2
,1)(x3,
0)(x4
,
0)n n…..(x,y
)
1(x5,
0)(x6
,
0)0.80.70.20.30.80.1
2.選擇最佳過濾器/閾值組合a.權(quán)值標(biāo)準(zhǔn)化
3.重新調(diào)整權(quán)重Viola&Jones算法
P.ViolaandM.Jones.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures.CVPR
2001.4.最終的強(qiáng)分類器是最后一個(gè)假設(shè)是T個(gè)假設(shè)的加權(quán)線性組合,其中權(quán)重與訓(xùn)練誤差成反比Viola&Jones算法
P.ViolaandM.Jones.Rapidobject
detectionusingaboostedcascadeofsimplefeatures.CVPR
2001.實(shí)時(shí)目標(biāo)檢測訓(xùn)練很慢,但是檢測很快關(guān)鍵想法積分圖可實(shí)現(xiàn)快速特征評估Boosting可實(shí)現(xiàn)特征選擇級聯(lián)用于快速過濾非面部窗口Viola&Jones算法P.ViolaandM.Jones.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures.CVPR
2001.人臉檢測的Boosting一個(gè)包含200個(gè)特征的分類器在二分類測試數(shù)據(jù)集上檢測率達(dá)到了95%,誤檢率為1:14084還不夠好!受試者工作特征(ROC)曲線來源:Svetlana
Lazebnik起始階段的分類器過濾大部分負(fù)樣本,但檢測幾乎所有的正樣本。后面的分類器計(jì)算包含更多的特征,但大多數(shù)樣本都到達(dá)不了??焖偌壜?lián)檢測ExamplesStage1h1(x)>t1?RejectNoYesStage2h2(x)>t2?StageNhn(x)>tn?Yes…PassRejectNoRejectNo注意力級聯(lián)級聯(lián)分類器逐漸變得更加復(fù)雜并且誤檢率更低:ROC曲線人臉圖像子窗口分類器1T分類器3TF非人臉分類器2TF非人臉F非人臉來源:Svetlana
Lazebnikvsfalsenegdeterminedby%FalsePos%Detection0
500100級聯(lián)的檢測率和誤檢率通過乘以各個(gè)階段的相應(yīng)比率得出如果每級的檢測率為0.99(0.9910≈0.9)且誤檢率約為0.30(0.310≈6×10-6),則通過10級級聯(lián)可以實(shí)現(xiàn)0.9的檢測率和10-6量級的誤檢率注意力級聯(lián)來源:Svetlana
Lazebnik人臉圖像子窗口分類器1T分類器3TF非人臉分類器2TF非人臉F非人臉訓(xùn)練級聯(lián)分類器設(shè)置每個(gè)階段的檢測率和誤檢率目標(biāo)不斷向當(dāng)前階段添加特征,直到達(dá)到目標(biāo)要降低boosting閾值以實(shí)現(xiàn)最大化檢測
(而不是最小化總分類誤差)在驗(yàn)證集上進(jìn)行測試如果總體誤檢率不夠低,則添加另一個(gè)階段使用當(dāng)前階段的負(fù)正樣本作為下一階段訓(xùn)練的負(fù)樣本已部署的系統(tǒng)訓(xùn)練數(shù)據(jù)5000張面孔都是正面,重新縮放至24x24像素3億張非面孔9500張非人臉圖像面孔是標(biāo)準(zhǔn)化的縮放,平移許多變化多人光照姿態(tài)P.ViolaandM.Jones.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures.CVPR
2001.系統(tǒng)性能訓(xùn)練時(shí)間:在466MHz的Sun工作站上需要數(shù)“周”38層,共6061層特征在測試集中每個(gè)窗口計(jì)算10個(gè)特征的平均值
在700MhzPentiumIII處理器上,面部檢測器可以在大約0.067秒的時(shí)間內(nèi)處理384x288像素的圖像15
Hz比之前同等精度的檢測器快15倍(Rowleyetal.,
1998)通過boosting選擇的前兩個(gè)特征:該特征組合可產(chǎn)生100%的檢測率和50%的誤檢率P.ViolaandM.Jones.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures.CVPR
2001.測試圖片中人臉檢測器的輸出P.ViolaandM.Jones.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures.CVPR
2001.其他檢測任務(wù)面部特征定位性別識別輪廓檢測來源:Svetlana
Lazebnik輪廓檢測來源:Svetlana
Lazebnik輪廓特征來源:Svetlana
Lazebnik人臉圖像數(shù)據(jù)庫將用于人臉識別的數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集每張圖片都由一個(gè)人組成,背景均勻整潔人臉檢測測試集MIT,CMU(正面、輪廓),
Kodak我們將要學(xué)習(xí)什么
?物體檢測簡介人臉檢測行人檢測HoG特征可用代碼:http://pascal.inrialpes.fr/soft/olt/來源:KristenGrauman檢測窗口:64x128Block尺寸:16x16步長:8x8單元尺寸:8x8格子數(shù):9HOG
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 手外傷護(hù)理中的溝通技巧
- 個(gè)案護(hù)理中的傷口護(hù)理與造口護(hù)理
- 2025年辦公吊頂改造合同協(xié)議
- 城市微氣候調(diào)控研究
- 2025年人臉識別智能門鎖行業(yè)媒體宣傳方案
- 城鎮(zhèn)化與生態(tài)環(huán)境耦合機(jī)制
- 一輪復(fù)習(xí):第2課 諸侯紛爭與變法運(yùn)動(dòng) 課件
- 基于模型的重建
- 藥學(xué)專業(yè)知識試題及答案
- 2026 年中職酒店管理(酒店禮儀)試題及答案
- 2025云南省人民檢察院招聘22人筆試考試備考題庫及答案解析
- 銀行行業(yè)公司銀行客戶經(jīng)理崗位招聘考試試卷及答案
- 2026年安全生產(chǎn)管理培訓(xùn)課件與事故預(yù)防與應(yīng)急處理方案
- 2026天津市靜海區(qū)北師大實(shí)驗(yàn)學(xué)校合同制教師招聘81人(僅限應(yīng)屆畢業(yè)生)考試筆試備考題庫及答案解析
- 2025陜西陜煤澄合礦業(yè)有限公司招聘570人參考筆試題庫及答案解析
- 2025年倉儲(chǔ)服務(wù)外包合同協(xié)議
- 2025遼寧沈陽金融商貿(mào)經(jīng)濟(jì)技術(shù)開發(fā)區(qū)管理委員會(huì)運(yùn)營公司招聘60人考試歷年真題匯編帶答案解析
- 2025年刑法學(xué)考試試題及答案
- 廣東省汕頭市金平區(qū)2024-2025學(xué)年七年級上學(xué)期期末地理試題
- 2025年二手車交易市場發(fā)展可行性研究報(bào)告及總結(jié)分析
- 北京市交通運(yùn)輸綜合執(zhí)法總隊(duì)軌道交通運(yùn)營安全專職督查員招聘10人考試參考題庫附答案解析
評論
0/150
提交評論