付費下載
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
一種快速魯棒的人臉定位及跟蹤方法
人臉跟蹤的誤檢率較高檢測和跟蹤面部特征是基于視覺交互技術(shù)的最重要任務(wù)之一。例如,面部特征的識別、眼睛可視化、嘴唇掃描和其他虛擬機技術(shù)需要正確識別面部特征和面部特征。人臉作為自然界中一種特定的模式,它受顏色、光照、姿態(tài)、面部飾物及表情的影響太大,現(xiàn)有的人臉檢測方法及人臉跟蹤方法或者計算復(fù)雜度太高,或者魯棒性較差,適應(yīng)面很窄。近幾年來,基于顏色的人臉檢測與跟蹤受到了普遍的重視,但是由于顏色的不惟一性,使得基于顏色的人臉檢測與跟蹤的方法存在誤檢率較高的問題。筆者提出一種新的人臉檢測與跟蹤方法,在實驗室環(huán)境中快速地檢測出灰度攝像機前的人的臉部區(qū)域,并魯棒地對所檢測人臉區(qū)域進行跟蹤。1幀差閾值選擇一般地,運動檢測包括兩種方法,一種基于光流場,另一種基于運動能量。其中基于光流場的方法計算量較大,適用于運動范圍較小且計算精度要求較高的場合,而基于運動能量的方法則由于算法簡單,計算速度快,比較適合于實時處理。通常,基于運動能量的運動檢測可以通過對兩幀圖像進行時空濾波來得到,而最簡單的方法是利用幀差計算出兩幀圖像中每一點的灰度差值,然后通過設(shè)定一個閾值來判定哪些像素點是運動點。由于幀差閾值的設(shè)定沒有統(tǒng)一的標準,只能依賴于經(jīng)驗,因此只適用于某些特定的場合。為了提高運動檢測的魯棒性,筆者提出一種自適應(yīng)的的閾值選擇方法。一般情況下,運動區(qū)域內(nèi)像素的灰度變化要大于整個圖像灰度變化的平均值,考慮到噪聲等因素的影響,選擇整個圖像灰度變化的均方差作為運動區(qū)域像素灰度變化的附加值,即Tm=m+σ.(1)式中,m,σ分別表示幀差圖像的均值和均方差。設(shè)d(i,j)表示幀差圖像中點(i,j)處的灰度值,N和M分別表示圖像的寬度和高度,則有m=1ΝΜΝ-1∑i=0Μ-1∑j=0d(i,j),(2)σ=√Ν-1∑i=0Μ-1∑j=0(d(i,j)-m)2ΝΜ.(3)如果d(i,j)大于Tm則該點被標記為運動點。圖1示出了當一個人進入攝像機的視區(qū)內(nèi),不同光照條件下的運動檢測的結(jié)果。圖1表明,采用式(1)作為閾值進行運動檢測的效果要好于采用固定閾值進行判別的結(jié)果,它不僅適應(yīng)性好,而且抗噪性強。2染色法檢測人臉區(qū)域的建立當運動區(qū)域確定后,人臉區(qū)域可以通過分析檢測到的運動區(qū)域的上半部分,根據(jù)人的頭部知識得到。一般情況下,人的頭發(fā)受光照的影響要比面部區(qū)域小。因此首先從檢測到的運動區(qū)域中根據(jù)灰度的變化情況確定頭發(fā)區(qū)域,再根據(jù)人的頭部知識確定人臉的位置。而人的頭部整體可以用一橢圓型近似描述,因此頭發(fā)部分及面部區(qū)域的寬度和高度都可以通過橢圓近似來計算。具體地,頭發(fā)部分的檢測過程如下:①對運動區(qū)域的上半部分像素進行聚類分析,如果某一點灰度值低于設(shè)定的閾值,則認為該點為頭發(fā)像素點,否則為非頭發(fā)像素點。閾值通過實驗選取,在實驗室環(huán)境下取80較合適;②計算頭發(fā)區(qū)域的寬度和高度。頭發(fā)部分的檢測結(jié)果如圖2所示。頭發(fā)區(qū)域檢測出以后,人臉部分可根據(jù)人的頭部知識和面部知識確定。從頭發(fā)區(qū)域的中心點以下取寬度稍小于頭發(fā)區(qū)域的寬度,而長度為頭發(fā)區(qū)域?qū)挾鹊?.1倍的這樣一個區(qū)域作為人臉區(qū)域的初始區(qū)域,然后在這個區(qū)域內(nèi)再利用像素的灰度信息去掉頭發(fā)和可能的背景信息,最后得到人臉區(qū)域。人臉區(qū)域的定位結(jié)果如圖3所示。3跟蹤算法的不足當人臉位置在第一幀圖像中確定后,人臉跟蹤則是指在后面的每一幀圖像序列中尋找相應(yīng)的人臉區(qū)域。前面的定位算法雖然速度較快,但當背景發(fā)生變化或有人為的干擾存在時,將無法準確定位人臉,因此不適合跟蹤??柭鼮V波器對運動估計和預(yù)測具有較好的效果,但當一個人隨機移動時,它無法及時收斂,從而不能正確跟蹤。實際上,人臉跟蹤也是一個優(yōu)化過程,而遺傳算法在優(yōu)化過程中已得到了廣泛的應(yīng)用,并取得了不錯的效果。3.1初始群體選擇方法人臉跟蹤一般需要兩個參數(shù),即相對于前一幀中人臉位置中心的x和y方向上的位移。因此,對人臉跟蹤而言,其解空間是一個二維子圖像區(qū)域,該區(qū)域內(nèi)的每一個像素位置,代表一個可能的解。假設(shè)在跟蹤過程中,人臉的大小保持不變,人臉的原始中心位置位于(xc,yc)。則解群體中的第i個染色體Ci可定義為Ci=[mini]=[ai,k-1ai,k-2?ai,1ai,0bi,k-1bi,k-2?bi,1bi,0],(4)其中,i=0,1,…,N-1;(mi,ni)是人臉相對于前一幀圖像中人臉位置中心的位移,ai,j和bi,j為其二進制基因編碼;k是其編碼的長度,其大小依賴于搜索區(qū)域的大小;N為群體規(guī)模。假設(shè)基因碼中ai,k-1,bi,k-1為符號位,其他為數(shù)值位,則染色體i所代表的人臉相對位移(mi,ni)可由相應(yīng)的基因碼確定,即mi=(-1)ai,k-1k-2∑j=0ai,j2j,(5)ni=(-1)bi,k-1k-2∑j=0bi,j2j;(6)而每個染色體所代表的絕對坐標(xi,yi),也就是用人臉模板進行匹配時,人臉模板中心所在的位置可由下式計算:(xi,yi)=(xc+mi,yc+ni).(7)通常,遺傳算法的初始群體的產(chǎn)生是通過隨機地對每一位基因碼賦‘0’或賦‘1’。這樣,有時會出現(xiàn)初始群體質(zhì)量太差,在規(guī)定的進化代數(shù)內(nèi)達不到預(yù)期的跟蹤精度。為了減少遺傳算法的迭代次數(shù),采用如圖4所示的初始群體的選擇方法。在該群體中,每一個染色體被編碼成mi和ni兩部分。給定每一個(mi,ni),其對應(yīng)的染色體上每一個基因位可由下式確定:ai,j=[|mi|2j]f=mod2,j=0,1,…,k-2,(8)bi,j=[|ni|2j]f=mod2,j=0,1,…,k-2.(9)式中,f表示一低門限函數(shù)。為了確保跟蹤速度和跟蹤精度,目前設(shè)定搜索匹配區(qū)域的寬度和高度為128個像素點,也就是說染色體碼的每一部分長度k為7。3.2人臉模板適應(yīng)值對每一個個體,通過對染色體解碼,可以得到一個新的圖像區(qū)域。通過計算人臉模板與這個圖像區(qū)域的相關(guān)系數(shù),可以確定哪一個個體所編碼的位置最有可能代表人臉在當前圖像中出現(xiàn)的位置,而人臉模板則由從第一幀圖像中檢測出的人臉區(qū)域生成。因此,每一個個體的適應(yīng)值可由兩個子圖像塊的關(guān)聯(lián)來計算,即Fit=Μ-1∑i=0Ν-1∑j=0[Τ(i,j)-μΤ][F(i,j)-μF]ΜΝσΤσF.(10)式中,0≤Fit≤1;T(i,j),μT和σT分別表示人臉模板的灰度矩陣、均值和標準差;F(i,j),μF和σF,分別表示對染色體解碼后的圖像區(qū)域的灰度矩陣、均值和標準差。M和N分別表示人臉的寬度和高度。3.3細胞的交叉操作要想盡快地通過遺傳算法獲得最優(yōu)解,遺傳算子的設(shè)計是非常重要的。在基于遺傳算法的人臉跟蹤中,個體的選擇策略依賴于個體的適應(yīng)值占所有個體總的適應(yīng)值的比例。具體地,設(shè)群體大小為Np,個體i的適應(yīng)值為fi,則個體i被選擇到下一代的概率為Ρi=fi/Νp∑i=1fi.(11)性能比較好的染色體被選擇的概率比較大。但這種選擇不一定能保證算法收斂到全局最優(yōu)解。為此,一般在每一代群體中,總是將上一代中最好的個體保留下來。交叉操作能保證個體的多樣性,使算法有機會收斂到最優(yōu)解。通常交叉算子作用于染色體的某一隨機位置上。在人臉跟蹤中,由于每個染色體包括兩個部分,分別對應(yīng)于解空間中某一點相對于原始人臉區(qū)域中心的x方向和y方向上的位移。因此,需要對兩部分染色體串分別進行交叉,而不是在一點上進行交叉,這樣能保證兩個參數(shù)結(jié)構(gòu)同步變化。染色體的交叉策略如圖5所示。變異是以較小的概率隨機地改變?nèi)旧w串上的某些位。對二進制串有:0→1,1→0。在人臉跟蹤算法中,變異操作發(fā)生在交叉操作后的新一代群體中。對每一個染色體上每一位基因由小概率控制它的變異行為。4基于遺傳算法的人臉跟蹤算法實驗結(jié)果在一臺CPU為PentiumⅢ450的計算機上對算法進行了測試。在遺傳算法中,選20個群體,染色體長度為14,交叉概率為0.6,變異概率為0.0625,進化代數(shù)為5。對588×332圖像序列的跟蹤速度大約為4幀/s,部分人驗跟蹤結(jié)果如圖6所示。上述基于遺傳算法的人臉跟蹤方法具有以下特點:(1)效率較高。相對于基于識別的跟蹤方法和基于光流場的跟蹤方法,基于遺傳算法的人臉跟蹤速度與視頻圖像的分辨率無關(guān),而只與人臉圖像的大小及遺傳算法的參數(shù)有關(guān)。盡管實驗中所用的視頻圖像大小為588×332,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030沼氣產(chǎn)業(yè)發(fā)展前景資源整合研究深度調(diào)研分析報告
- 物流倉儲安全檢查專項方案
- 超市會員促銷活動策劃方案
- 線上線下教學(xué)銜接工作實施方案
- 光電纜工程施工方案設(shè)計及案例
- 燈光師實操能力考核方案試題及真題
- 高校學(xué)生宿舍管理及安全保障方案
- 2026四川成都錦江投資發(fā)展集團有限責任公司招聘18人備考題庫及答案詳解(新)
- 垃圾分類回收處理流程及宣傳方案
- 2026江西南昌東站、南昌西站隨車保潔招聘50人備考題庫【退休返聘】完整答案詳解
- 儲能集裝箱知識培訓(xùn)總結(jié)課件
- 幼兒園中班語言《雪房子》課件
- 房地產(chǎn)項目開發(fā)管理方案
- 堆垛車安全培訓(xùn)課件
- 貝林妥單抗護理要點
- 衛(wèi)生院關(guān)于成立消除艾滋病、梅毒、乙肝母嬰傳播領(lǐng)導(dǎo)小組及職責分工的通知
- 廣東省執(zhí)信中學(xué)、廣州二中、廣州六中、廣雅中學(xué)四校2025年高三物理第一學(xué)期期末學(xué)業(yè)水平測試試題
- 民事答辯狀(信用卡糾紛)樣式
- 小學(xué)語文教學(xué)能力提升策略
- 浙江中醫(yī)藥大學(xué)《高等數(shù)學(xué)Ⅱ》2025-2026學(xué)年期末試卷(A卷)
- 北京地鐵保護區(qū)管理辦法
評論
0/150
提交評論