(信號(hào)與信息處理專(zhuān)業(yè)論文)基于agent的多目視覺(jué)人臉特征提取.pdf_第1頁(yè)
(信號(hào)與信息處理專(zhuān)業(yè)論文)基于agent的多目視覺(jué)人臉特征提取.pdf_第2頁(yè)
(信號(hào)與信息處理專(zhuān)業(yè)論文)基于agent的多目視覺(jué)人臉特征提取.pdf_第3頁(yè)
(信號(hào)與信息處理專(zhuān)業(yè)論文)基于agent的多目視覺(jué)人臉特征提取.pdf_第4頁(yè)
(信號(hào)與信息處理專(zhuān)業(yè)論文)基于agent的多目視覺(jué)人臉特征提取.pdf_第5頁(yè)
已閱讀5頁(yè),還剩58頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

(信號(hào)與信息處理專(zhuān)業(yè)論文)基于agent的多目視覺(jué)人臉特征提取.pdf.pdf 免費(fèi)下載

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

北京交通大學(xué)碩士學(xué)位論文中文摘要 中文摘要 摘要:人臉識(shí)別技術(shù)是當(dāng)前模式識(shí)別和人工智能領(lǐng)域一個(gè)重要的研究課題,它的研 究跨越了圖像處理,模式識(shí)別,計(jì)算機(jī)視覺(jué)和人工神經(jīng)網(wǎng)絡(luò)等等學(xué)科。隨著計(jì)算機(jī)技術(shù) 的快速發(fā)展與商業(yè)和軍事等應(yīng)用領(lǐng)域的需求,關(guān)于人臉識(shí)別技術(shù)的研究將會(huì)不斷的深入 和完善,在未來(lái)將會(huì)應(yīng)用到日常生產(chǎn)生活的各個(gè)方面。 人臉特征提取是人臉識(shí)別中復(fù)雜且極具挑戰(zhàn)性的環(huán)節(jié),對(duì)人臉的識(shí)別率起著至關(guān)重 要的作用。傳統(tǒng)的人臉特征提取方法由于受到光照,姿態(tài)等復(fù)雜環(huán)境的干擾,識(shí)別率會(huì) 產(chǎn)生一定的影響。在最近的研究發(fā)展中,提出了許多具有較強(qiáng)魯棒性的人臉特征提取方 法,但大部分都是從矩陣算法角度去改善特征提取的效果來(lái)提高識(shí)別率。本文研究的重 點(diǎn)是利用多目視覺(jué)在感知階段最大程度地獲取人臉的信息,并通過(guò)構(gòu)建一個(gè)a g e n t 框架 對(duì)多目視覺(jué)進(jìn)行調(diào)度和控制來(lái)實(shí)現(xiàn)提取出比較好的人臉特征。本文做的工作主要有: ( 1 ) 對(duì)傳統(tǒng)的人臉特征提取方法進(jìn)行深入地探討,主要研究了基于a s m 的特征提取方 法,并對(duì)其經(jīng)典算法進(jìn)行實(shí)現(xiàn),通過(guò)實(shí)驗(yàn)總結(jié)這種算法的優(yōu)點(diǎn)和弊端。 ( 2 ) 提出了一種利用多目視覺(jué)解決因?yàn)榻嵌群妥藨B(tài)等原因引起的人臉信息匱乏的方 法,利用多個(gè)攝像機(jī)從不同的角度去感知人臉的環(huán)境,極大豐富了所得到的人臉 信息,為下一步人臉特征提取奠定基礎(chǔ)。 ( 3 ) 提出了一種基于a g e n t 的多目視覺(jué)人臉特征提取框架。利用a g e n t 的協(xié)作性和智 能性對(duì)每個(gè)攝像頭進(jìn)行代理,每個(gè)a g e n t 通過(guò)感知環(huán)境得到要代理的人臉姿態(tài)的 參數(shù),并對(duì)環(huán)境進(jìn)行反應(yīng),通過(guò)一定的規(guī)則計(jì)算出人臉姿態(tài)參數(shù),而多個(gè)a g e n t 之間通過(guò)競(jìng)爭(zhēng)機(jī)制去成為最優(yōu)的人臉姿態(tài)目標(biāo),由最優(yōu)的人臉姿態(tài)圖像得到最終 的人臉特征,從而滿(mǎn)足整個(gè)a g e n t 系統(tǒng)對(duì)人臉特征較好提取的要求。 ( 4 ) 用多目視覺(jué)系統(tǒng)采集多組人臉圖片,利用o r l 人臉庫(kù)進(jìn)行識(shí)別率對(duì)比試驗(yàn)表明 本文方法能較好地從每組圖片中提取出較好人臉姿態(tài)的圖片,并從中提取人臉特 征,解決了由于角度問(wèn)題帶來(lái)的誤識(shí)別問(wèn)題,由于a g e n t 平臺(tái)的并行性,在處理 時(shí)間上也有很大的優(yōu)勢(shì)。 關(guān)鍵詞:人臉特征提取;a g e n t 理論;a s m 算法;多目視覺(jué);人臉姿態(tài)參數(shù);a g e n t 交 互機(jī)制;并行處理 分類(lèi)號(hào):t p 3 9 1 4 a b s t r a c t a b s t r a c t :f a c er e c o g n i t i o nt e c h n o l o g yh a sa l w a y sb e e na ni m p o r t a n tr e s e a r c ht o p i c i nt h ef i e l do fc u r r e n tp a t t e mr e c o g n i t i o na n da r t i f i c i a l i n t e l l i g e n c e ,i t sr e s e a l c ha c r o s st 1 1 e 1 m a g ep r o c e s s i n g ,p a t t e r nr e c o g n i t i o n ,c o m p u t e rv i s i o na n da r t i f i c i a ln e u r a ln e t w o r ka 1 1 do t l l e r s u b j e c t s w i t ht h er a p i dd e v e l o p m e n to fc o m p u t e rt e c h n o l o g y ,t h ei n c r e a s i n g n e e d so f c o m m e r c i a la n dm i l i t a r ya p p l i c a t i o n s ,t h er e s e a r c ho ft h ef a c er e c o g n i t i o nw i l lb em o r ea i l d m o r ed e p t h ,i t sm o r el i k e l yt ob e a p p l i e dt oa l la s p e c t so fd a i l yp r o d u c t i o na i l dl i f e fa c ef e a t u r ee x t r a c t i o ni sac o m p l e xa n dc h a l l e n g i n gi s s u ei nf a c er e c o g n i t i o n i th a s 1 m p o r t a n ta f f e c to nr e c o g n i t i o nr a t e b e c a u s et r a d i t i o n a lm e t h o d so ff a c ef e a t l l r e e x t r a c t i o n u s u a l l ya f f e c t e db yl i g h t ,g a z eo ft h ef a c ea n do t h e rc o m p l e x e n v i r o n m e n t ,t h er e c o 星皿i t i o nr a t e m a yn o ta c c u r a t e i nr e c e n tr e s e a r c h ,m a n yr o b u s tf a c ef e a t u r ee x t r a c t i o nm e t h o d s h a v eb e e l l p r o p o s e d ,w h i l em o s to ft h e ma r ei m p r o v e df r o mm a t r i xa l g o r i t h ma s p e c tt o i m p r o v et h e r e c o g n i t i o nr a t e t h er e s e a r c hp u r p o s eo ft h ep a p e ri st os o l v et h ep e r c e p t i o np r o b l 鋤b y m u l t lc a m e r as y s t e m ,a n de x t r a c tf a c ef e a t u r ew i t ha s y s t e mo fm u l t ic a m e r am a n a g e db ya n a g e n tf r a m e w o r k t h ew o r ko ft h ep a p e ri n c l u d e s : f i r s t l y , w eh a v ead e e ps t u d yo ft h et r a d i t i o n a lf a c ef e a t u r ee x t r a c t i o nm e t h o d ,e s p e c i a l l y t h ea s m m e t h o d ,a n dr e a l i z et h ec l a s s i c a la s m a l g o r i t h m ,t h r o u g ht h ee x p e f i e i l c eo ft w o t a c ef e a t u r ee x t r a c t i o n ,w es u m m a r yt h ev i r t u e sa n d d e f e c t so ft h i sa l g o r i t h m s e c o n d l y , p r o p o s eam e t h o do fm u l t ic a m e r as y s t e mw h i c hc a ns o l v et h ep r o b l e mo fl a c k o ff a c ei n f o r m a t i o nc a u s e db ya n g l e sa n dg a z e w eu s es e v e r a lc a m e r a st op e r c e i v eh u m a l l f a c ee n v i r o n m e n tf r o md i f f e r e n t a n g l e s ,w h i c hc a ne n r i c ht h ef a c ei n f o r m a t i o n ,a n d1 a va f o u n d a t i o no ff a c ef e a t u r ee x t r a c t i o n in i r d l y , an o v e la p p r o a c hw a sp r o p o s e dt oe x t r a c t f a c ef e a t u r eb a s eo na g e n t sw i t h m u l t i c a m e r as y s t e m a c c o r d i n gt ot h ea b i l i t yo f c o o p e r a t i o na n di n t e l l i g e n c eo ft h ea g e n t , w ec a ng i v ee a c hc a m e r aa na g e n t ,e a c ha g e n t g e tt h efeaturetries t o p o s ep a r a m e t e r so ff a c e t i o mt h ee n v i r o n m e n t ,a l s ot h ea g e n t w i l lr e a c tt oe n v i r o n m e n t ,w h i c hw i l lc o m p u t et h ef a c i a l p o s ep a r a m e t e r s t h o s ea g e n t sa l s oc o m p e t ew i t he a c ho t h e r ,i no r d e rt ob e c o m et h eb e s t f a c i a lo b j e c t i nt h i sw a yt h ef a c ef e a t u r ec a nb eb e t t e re x t r a c t e dw i t ht h ea g e n t s v s t e m f i n a l l y , w ec o l l e c tac o u p l eo ff a c ep i c t u r e sf r o mt h em u l t ic a n l e r as y s t e m 。a i l dh a v ea f a c er e c o g n i t i o nt e s tw i t ht h eo r lf a c ed a t a b a s ew h i c hr e c o g n i t i o nr a t ee x p e r i m e n ts h o w s t h a tt h em e t h o dc a nb e r e re x t r a c tt h ef a c ef e a t u r e f r o mt h ee x p e r i e n c ew e a l s os o l v et h ee n _ 0 r i d e n t i f i c a t i o np r o b l e mc a u s e db yf a c ea n g l e s ,d u et ot h ep a r a l l e l i s mo ft h ea g e n t p l a t f o 鋤, 北京交通大學(xué)碩士學(xué)位論文 a b 孓【r a c t t h ep r o c e s s i n gt i m ea l s oh a v eab i ga d v a n t a g e k e y w o r d s :f a c ef e a t u r ee x t r a c t i o n ;a g e n tt h e o r y ;a s ma l g o r i t h m ;m u l t ic a m e r as y s t e m ; f a c ep o s ep a r a m e t e r s ;a g e n ti n t e r a c t i o nm e c h a n i s m ;p a r a l l e lp r o c e s s i n g c l a s s n o :t p 3 9 1 4 致謝 這篇論文是在我的導(dǎo)師阮秋琦教授的認(rèn)真指導(dǎo)下完成的,阮秋琦教授對(duì)科研工作的 嚴(yán)謹(jǐn)態(tài)度和在學(xué)習(xí)方法上的耐心引導(dǎo)在學(xué)術(shù)上給了我很大的影響。開(kāi)始進(jìn)入實(shí)驗(yàn)室的時(shí) 候?qū)D像方面知識(shí)都不太懂,阮教授不僅在科研環(huán)境給我創(chuàng)造了條件,更在學(xué)習(xí)上對(duì)我 有很大的幫助,在暑期期間,阮教授還給我們科研實(shí)踐的機(jī)會(huì),參與了實(shí)驗(yàn)室的科研項(xiàng) 目,在學(xué)習(xí)生活上都給了我很大的幫助,在這里對(duì)阮秋琦老師這兩年來(lái)的教誨和關(guān)心表 示衷心的謝意。 在實(shí)驗(yàn)室工作的這兩年,實(shí)驗(yàn)室的師兄師姐們也給了我很大的幫助,他們熱情的關(guān) 懷和耐心地指導(dǎo)在心靈和學(xué)習(xí)上都給了我很大的動(dòng)力。在這個(gè)課題的研究以及這篇論文 的撰寫(xiě)中,阮成雄、李小利等學(xué)長(zhǎng)對(duì)我實(shí)驗(yàn)設(shè)計(jì)和研究方向的把握給了很大的幫助,在 這里也向他們表示真心的感謝。 最后我要感謝我的家人,是你們一直以來(lái)對(duì)我的鼓勵(lì)支持和關(guān)心才讓我在學(xué)業(yè)上能 走到今天,是你們對(duì)我的教誨讓我樹(shù)立了自己的目標(biāo),感謝你們。 北京交通大學(xué)碩士學(xué)位論文 序 序 隨著計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展和信息化進(jìn)程的日益加快,公共安全和信息安全越來(lái)越 顯示出其前所未有的重要性。人臉識(shí)別技術(shù)是當(dāng)前模式識(shí)別和人工智能領(lǐng)域一個(gè)重要的 研究課題,它的研究跨越了圖像處理,模式識(shí)別,計(jì)算機(jī)視覺(jué)和人工神經(jīng)網(wǎng)絡(luò)等等學(xué)科。 在安全應(yīng)用上它廣泛應(yīng)用于國(guó)家安全、公安系統(tǒng)和城市的公共安全等各個(gè)方面。雖然經(jīng) 過(guò)了許多年的發(fā)展,但是由于人臉是一個(gè)非剛性物體,并容易受到光照、自身姿態(tài)和表 情等因索的影響,因此要實(shí)現(xiàn)一個(gè)高識(shí)別率、高魯棒性的全自動(dòng)的人臉識(shí)別系統(tǒng)仍然是 一個(gè)極具挑戰(zhàn)性的課題。 特征提取是人臉識(shí)別研究中的最基本問(wèn)題之一,是人臉識(shí)別中復(fù)雜且極具挑戰(zhàn)性的 環(huán)節(jié),對(duì)人臉的識(shí)別率起著至關(guān)重要的作用。在這一領(lǐng)域的研究中,提出了許多經(jīng)典的 算法,如線性鑒別分析方法,基于子空間的主分量分析方法,獨(dú)立成分分析方法以及在 基于核技巧的非線性特征提取方法等。對(duì)于特征提取問(wèn)題的深入研究在很大程度上促進(jìn) 了人臉識(shí)別領(lǐng)域的發(fā)展。 現(xiàn)有的很多人臉特征提取算法都具有較強(qiáng)魯棒性,但是他們大部分都是從數(shù)學(xué)方法 上改善了特征提取的質(zhì)量來(lái)提高識(shí)別率。本文研究的重點(diǎn)是利用多目視覺(jué)在感知階段最 大程度地獲取人臉的信息,并通過(guò)構(gòu)建一個(gè)a g e n t 框架對(duì)多目視覺(jué)系統(tǒng)進(jìn)行調(diào)度和控制。 在各個(gè)a g e n t 的交互和相互合作中通過(guò)一系列的行為屬性提取出比較好的人臉特征。 本課題受到國(guó)家自然科學(xué)基金項(xiàng)目( n o 6 0 9 7 3 0 6 0 ) 的資助。 北京交通大學(xué)碩士學(xué)位論文 緒論 1 緒論 1 1 課題來(lái)源和研究意義 本課題是國(guó)家自然科學(xué)基金項(xiàng)目基于多目視覺(jué)的形體語(yǔ)言感知與識(shí)別研究中的 一個(gè)重要研究?jī)?nèi)容。著重研究在智能代理( a g e n t ) 的基礎(chǔ)上實(shí)現(xiàn)多目視覺(jué)的協(xié)同工作, 建立基于智能代理的多目感知框架,在理論和技術(shù)上解決形體語(yǔ)言感知中的遮擋和方位 帶來(lái)的誤識(shí)別問(wèn)題。 人臉識(shí)別技術(shù)【l 】是當(dāng)前模式識(shí)別和人工智能領(lǐng)域一個(gè)重要的研究課題,它的研究跨 越了圖像處理,模式識(shí)別,計(jì)算機(jī)視覺(jué),人工神經(jīng)網(wǎng)絡(luò)和生物醫(yī)學(xué)等等學(xué)科。隨著計(jì)算 機(jī)技術(shù)的快速發(fā)展與商業(yè)和軍事等應(yīng)用領(lǐng)域的需求,人臉識(shí)別技術(shù)研究得到了愈來(lái)愈廣 泛的關(guān)注和參與。人臉識(shí)別雖然有許多其它識(shí)別方法無(wú)法比擬的優(yōu)點(diǎn),但是直到現(xiàn)在還 沒(méi)有一種很完美的人臉識(shí)別系統(tǒng),人臉識(shí)別的準(zhǔn)確率目前為止還很難達(dá)到我們的要求, 對(duì)許多場(chǎng)合的應(yīng)用還不能滿(mǎn)足【2 】。雖然對(duì)于人類(lèi)而言可以很容易的從復(fù)雜的環(huán)境中識(shí)別 出人臉,但是對(duì)于計(jì)算機(jī)識(shí)別系統(tǒng)來(lái)說(shuō),這是一個(gè)巨大的挑戰(zhàn)。歸根結(jié)底是由下面幾個(gè) 因素造成的。 1 人臉結(jié)構(gòu)的相似性,不同人臉之間的區(qū)別并不是很大,所有的人臉都是由幾個(gè) 相同的部分組成,外形結(jié)構(gòu)相似。這是計(jì)算機(jī)能夠自動(dòng)識(shí)別人臉的主要原因,但是這種 相似性對(duì)于區(qū)分不同的個(gè)體來(lái)實(shí)現(xiàn)人臉識(shí)別是不利的。 2 人臉具有極強(qiáng)的不穩(wěn)定性,首先人臉具有豐富的表情,不同表情下采集的人臉 圖像會(huì)有變化,其次觀察人臉的角度不同,得到的人臉的覺(jué)圖像差距也會(huì)很大。另外, 光照強(qiáng)度的影響,角度的變化、遮擋等多方面因素都會(huì)人臉識(shí)別產(chǎn)生影響。 3 人臉識(shí)別屬于一個(gè)大類(lèi)別的識(shí)別問(wèn)題,全球人口數(shù)量是非常龐大的,而且還在不 斷的增長(zhǎng)中,因此識(shí)別的類(lèi)別數(shù)很多,因此識(shí)別的難度也會(huì)相應(yīng)的增大。 人臉識(shí)別的研究具有很高的理論和應(yīng)用價(jià)值,但是同時(shí)又是一項(xiàng)非常具有挑戰(zhàn)性的 工作,在大類(lèi)別,復(fù)雜的背景,有局部遮擋,人臉角度變化等復(fù)雜條件下的人臉識(shí)別的 正確率,可靠性和穩(wěn)定性方面還需要很大的改進(jìn)和深入的研究。人臉識(shí)別的一般過(guò)程由 三部分組成,分別為人臉檢測(cè)【3 1 ,特征提取,分類(lèi)識(shí)別,如圖1 1 所示。人臉特征提取 是指抽取表示可分離性而言最有效的特征,即從人臉中提取出用于區(qū)分不同個(gè)體的判別 特征。提取要求對(duì)于同樣的個(gè)體具有穩(wěn)定性,對(duì)于不同的個(gè)體具有差異性。特征提取是 人臉識(shí)別中最為重要的一個(gè)部分,它的效率直接決定最終的識(shí)別性能。到目前為止,人 們己經(jīng)給出了許多種特征提取方法,如主分量分析,線分析以及非線性投影方法等,這 北京交通大學(xué)碩士學(xué)位論文 緒論 些方法都在人臉識(shí)別中被廣泛使用并取好的特征提取效果。特征提取是模式識(shí)別中的一 個(gè)關(guān)鍵問(wèn)題,在模式識(shí)別等領(lǐng)域有著廣泛的應(yīng)用。本文主要針對(duì)人臉特征提取進(jìn)行研究, 以此來(lái)解決因?yàn)榻嵌鹊葐?wèn)題對(duì)人臉識(shí)別帶來(lái)的問(wèn)題。 1 2 研究現(xiàn)狀 圖1 - 1 人臉識(shí)別流程圖 f i g 1 - 1t h ef l o wo ft h ef a c er e c o g n i t i o n 到目前為止,國(guó)內(nèi)外各個(gè)研究機(jī)構(gòu)和人員對(duì)人臉識(shí)別的研究正在如火如荼地展開(kāi), 美國(guó)等西方國(guó)家成立專(zhuān)門(mén)從事人臉識(shí)別研究的小組,軍方,大的國(guó)際公司和高校對(duì)人臉 識(shí)別技術(shù)的研究使得近些年來(lái)人臉識(shí)別技術(shù)取得了重大的發(fā)展。國(guó)外比較有名的有: m i t c m u ,u c l a ,u n i v e r s i t yo f m a n c h e s t e r , u m d 等。國(guó)內(nèi)的中國(guó)科學(xué)院計(jì)算的所,自 動(dòng)化所,清華大學(xué),南京理工大學(xué),北京交通大學(xué)等單位都在人臉識(shí)別研究方面取得了 不少的成果。人臉特征提取在人臉識(shí)別中起著不可或缺的作用,特征提取又稱(chēng)人臉描述, 是在基于人臉檢測(cè)定位的基礎(chǔ)上進(jìn)行的人臉各特征提取的過(guò)程,也是對(duì)人臉進(jìn)行特征建 模的過(guò)程。特征提取是人臉識(shí)別中最為重要的一個(gè)部分,它的效率直接決定最終的識(shí)別 性能。 在過(guò)去的幾十年內(nèi),研究者們提出了很多用于人臉識(shí)別的方法,大致可以分為兩類(lèi): 一類(lèi)是基于統(tǒng)計(jì)學(xué)習(xí)的特征提取方法,一類(lèi)是基于知識(shí)的特征提取方法【4 1 。其中通過(guò)基 于統(tǒng)計(jì)學(xué)習(xí)提取的特征稱(chēng)為代數(shù)特征,基于知識(shí)的特征提取方法提取的特征為幾何特 征?;诖鷶?shù)特征提取的方法又可以分為兩類(lèi),分別是線性和非線性特征提取方法,線 性方法有主成分分析( p c a ) ,獨(dú)立成分分析( i c a ) ,線性鑒別分析( l d a ) 等,非線性方法 有核方法,流形學(xué)習(xí)方法,張量方法等。 1 基于代數(shù)方法 主成分分析( p c a ) 的基本思想是利用一組包含了較多信息量的特征去盡可能精確地 北京交通大學(xué)碩士學(xué)位論文緒論 表示原始樣本的分布情況。f u k u n a g a 和y o u n g 等人對(duì)p c a 方法做了深入的研剄引,討 論了p c a 作為線性特征提取方法的穩(wěn)定性。k i r b y 等人【6 】討論了利用p c a 進(jìn)行人臉圖像 的最優(yōu)表示問(wèn)題,然后t u r k 和p e n t l a n d 7 】討論了這種表示的物理意義。p c a 有兩個(gè)方面 的優(yōu)勢(shì),首先它從2 階上消除了模式和樣本間的相關(guān)性,第二它實(shí)現(xiàn)了對(duì)原始樣本的維 數(shù)的降低。p c a 只是在最小平方誤差意義下給出的模式樣本的最優(yōu)表示,但是不能從高 階上消除特征之間的相關(guān)性。獨(dú)立成分分析( i c a ) 【8 】方法是根據(jù)最小化相互信息準(zhǔn)則或 者最大化非高斯線性準(zhǔn)則提出的從線性混合的信號(hào)中恢復(fù)出獨(dú)立信號(hào)源的算法,b a r t l e t t 等人【9 】采用i n f o m a x 算法來(lái)實(shí)旋i c a ,提出了利用獨(dú)立分量分析進(jìn)行圖像表示的兩種架 構(gòu),這兩種架構(gòu)被眾多的研究人員應(yīng)于人臉識(shí)別問(wèn)題。線性鑒別分析( l d a ) t l o j 的基本思 想是基于一個(gè)與分類(lèi)相關(guān)的特征提取準(zhǔn)則,即f i s h e r 準(zhǔn)則【l ,目的是為了選定一組最優(yōu) 的鑒別矢量,并且使得原始數(shù)據(jù)在該鑒別矢量上的投影達(dá)到最佳的分類(lèi)效果。近來(lái) z h u a n g 等人【1 2 】提出了逆f i s h e r 鑒別分析,并且成功地應(yīng)用于人臉識(shí)別的應(yīng)用。逆f i s h e r 鑒別分析有以下優(yōu)勢(shì):1 原始數(shù)據(jù)總體散布的矩陣的小的特征值對(duì)應(yīng)的特征向量參與了 選擇。2 考慮了類(lèi)內(nèi)散布矩陣的零空間信息。 基于核方法【1 3 】特征提取的主要思想是通過(guò)適當(dāng)?shù)姆蔷€性映射將非線性可分的原始 樣本變換到某一個(gè)線性可分的高維的特征空間,核技術(shù)最早是由v v a p n i k t l 4 】提出并應(yīng)用 于向量機(jī)中。m i k a 等人【1 5 1 6 】利用核方法將f i s h e r 線性鑒別分析進(jìn)一步推廣到了非線性 情況,提出了一種核f i s h e r 鑒別方法,這種方法解決了兩類(lèi)模式的分類(lèi)問(wèn)題。y a n g 1 7 1 等人提出了完備的核鑒別分析應(yīng)用框架。徐勇等人【l8 】從所有訓(xùn)練樣本中選取少量顯著的 樣本,使得核投影方法的特征提取效率有了很大的提高。與基于核技術(shù)的非線性特征提 取方法不同,流形學(xué)習(xí)【1 9 】的目的是期望找出產(chǎn)生數(shù)據(jù)集的內(nèi)在規(guī)律性,即從觀察數(shù)據(jù)中 找出本質(zhì),在高維的輸入空間中找出其內(nèi)嵌的低維流形,在低維空間中恢復(fù)數(shù)據(jù)集內(nèi)的 集合特征。s e u n g 2 0 】提出了感知是以流形方式存在的,并且通過(guò)實(shí)驗(yàn)證明了人腦中的確 存在穩(wěn)定的流形。當(dāng)前比較流行的流形學(xué)習(xí)方法有i s o m a p 2 q , l l e 2 2 , l a p l a c i a ne i g e m a p 等。這些學(xué)習(xí)方法僅定義在樣本上,但是不知道如何去評(píng)價(jià)樣本,所以無(wú)法應(yīng)用于模式 識(shí)別領(lǐng)域。近來(lái),x h e 等人【2 3 2 4 】提出了一種局部保持性的投影方法( l o c a l i t yp r e s e r v i n g p r o j e c t i o n ,l p p ) 并成功地將其應(yīng)用于人臉識(shí)別。與l a p l a c i a ne i g e m a p 方法不同,l p p 是 一個(gè)線性投影算法,但是它在某些方面保留了樣本點(diǎn)在觀察空間內(nèi)的局部的領(lǐng)域信息。 基于l p p 方法又相繼提出了m f a ,l d e 等相關(guān)的學(xué)習(xí)方法。二維主成分分析,二維鑒別 分析和二維l p p 等方法是近些年來(lái)提出的針對(duì)圖像模式的特征提取方法,該類(lèi)方法直接 在圖像矩陣上計(jì)算散布矩陣,矩陣的維數(shù)等于圖像的行數(shù)或者列數(shù),使得計(jì)算起來(lái)很方 便。z h e n g 等人【2 5 】在分析了基于向量和基于矩陣的線性鑒別方法,指出根據(jù)偏置估計(jì)觀 念,2 d l d a 可能會(huì)好于1 d l d a 方法。 2 基于幾何方法 北京交通大學(xué)碩士學(xué)位論文 緒論 我們的人臉由幾個(gè)特征器官構(gòu)成,比如眉毛,眼睛,鼻子,嘴巴等,并且他們?cè)谌?臉上的位置相對(duì)來(lái)說(shuō)是比較確定的,但是同時(shí)又不都是完全一樣,因此我們每一個(gè)人的 臉才會(huì)不一樣?;趲缀蔚姆椒ā? 6 】要求我們由人臉的特征器官點(diǎn)建立一個(gè)相似的并且可 以用參數(shù)去改變它的模型,在檢測(cè)的時(shí)候,可以規(guī)定一條準(zhǔn)則來(lái)判定這個(gè)模型和實(shí)際人 臉的相似度,只有當(dāng)滿(mǎn)足這個(gè)判定條件的時(shí)候才會(huì)認(rèn)為這個(gè)模型和檢測(cè)的人臉匹配。雖 然幾何方法相對(duì)會(huì)簡(jiǎn)單一些,但也有它的弊端,它對(duì)環(huán)境的要求會(huì)比較高,比較復(fù)雜的 環(huán)境下這種方法的效果不是很好。s n a k e s 方法【2 7 2 8 】同樣使用一個(gè)準(zhǔn)則去判定是否和實(shí)際 的檢測(cè)人臉相似,它使用一條閉合的曲線去檢測(cè),這條曲線不斷去逼近人臉的形狀,并 且在逼近的過(guò)程中由這個(gè)準(zhǔn)則來(lái)監(jiān)督,當(dāng)滿(mǎn)足準(zhǔn)則條件的時(shí)候,表示曲線的形狀已經(jīng)和 人臉特征相似。b l e d s o e t 2 9 】利用特征器官之間的關(guān)系,比如他們之間的距離等建立了 一個(gè)人臉識(shí)別系統(tǒng)。文獻(xiàn)【3 0 】使用了一個(gè)3 5 維的人臉矢量,這個(gè)矢量可以用積分投影法 得到,矢量包含眼睛和眉毛之間的距離,眉毛的彎曲程度,厚度,嘴巴的彎曲程度和厚 度和鼻子到嘴巴和眼睛的距離,下巴的形狀等等。c o o t e s 等人【3 l 】提出了a s m ( a c t i v e s h a p em o d e l ) 的方法,a s m 的思想是首先對(duì)比較有特點(diǎn)的一類(lèi)目標(biāo)進(jìn)行統(tǒng)計(jì),然后進(jìn)行 建立一個(gè)能反應(yīng)目標(biāo)的形狀在二維空間上的變化規(guī)律的模型和一個(gè)能反應(yīng)目標(biāo)的特征 點(diǎn)的灰度分布規(guī)律的灰度模型。由這兩個(gè)模型相互呼應(yīng)和相互間的調(diào)整來(lái)進(jìn)行特征點(diǎn)定 位。y u i l l e 等人【3 2 】提出了參數(shù)化的可變形模板法,這種方法對(duì)于人臉特定位有很好的效 果。對(duì)于人臉中眼睛的檢測(cè),該方法根據(jù)眼睛形狀的先驗(yàn)知識(shí),定義1 1 個(gè)參數(shù)的模型, 通過(guò)搜索能量參數(shù)極小化來(lái)確定參數(shù)。h a l l i n a i l t 【3 3 】提出了一種基于統(tǒng)計(jì)學(xué)檢測(cè)正面姿態(tài) 下人的眼睛的算法。該算法采用了一個(gè)模板,它擁有不同亮度的兩塊區(qū)域,一塊是虹膜 區(qū)域,另一塊是眼睛的白色區(qū)域,算法根據(jù)分布的不同來(lái)構(gòu)造模型。p e n t l a n d 等畔j 擴(kuò)展 了其“特征臉”的概念,提出了“特征臉”、“特征鼻”等算法來(lái)檢測(cè)人臉特征。r e i s f e l d 等【3 5 】提出了一種采用一般對(duì)稱(chēng)性算子尋找眼睛和嘴巴的算法。該算法首先利用先驗(yàn)知識(shí) 假設(shè)人的整個(gè)臉部相對(duì)于鼻子的垂線是對(duì)稱(chēng)的,并且相應(yīng)的五官也是這樣,在這個(gè)前提 下,對(duì)稱(chēng)算子可以去定位對(duì)稱(chēng)性最高的點(diǎn),并根據(jù)這個(gè)條件去檢測(cè)眼睛和嘴巴。 1 3 本文主要研究?jī)?nèi)容 本文主要討論了人臉識(shí)別中特征提取的方法,首先我們對(duì)傳統(tǒng)的人臉特征提取方法 進(jìn)行深入地探討,我們主要研究了基于a s m 的特征提取方法,并進(jìn)行算法的實(shí)現(xiàn),然 后總結(jié)其優(yōu)點(diǎn)和弊端,利用多目視覺(jué)在感知階段最大程度地獲取人臉的信息,根據(jù)一定 的規(guī)則計(jì)算估計(jì)出每個(gè)人臉的姿態(tài),并通過(guò)a g e n t 框架對(duì)多目視覺(jué)進(jìn)行調(diào)度和控制以此 來(lái)實(shí)現(xiàn)提取出比較好的人臉特征。這就是我們提出的一種基于a g e n t 的多目視覺(jué)人臉特 征提取方法。 4 北京交通大學(xué)碩士學(xué)位論文緒論 傳統(tǒng)的單目和雙目視覺(jué)感知在計(jì)算機(jī)視覺(jué)中已有多年的研究,主要集中在中心投影 攝像機(jī)模型指導(dǎo)下的感知研究,在該模型下解決形體語(yǔ)言感知的問(wèn)題尚有諸多難以解決 的限制。因此我們準(zhǔn)備從多攝像機(jī)系統(tǒng)解決感知問(wèn)題,從感知階段最大限度的解決由于 遮擋、姿態(tài)等復(fù)雜環(huán)境帶來(lái)的難點(diǎn),進(jìn)而提高感知的精確性,為后續(xù)的識(shí)別與分析打下 良好的基礎(chǔ)。在多目視覺(jué)的基礎(chǔ)上,感知的能力有了很大的提高,如何從更多的信息量 中篩選出對(duì)我們有用的信息,對(duì)信息進(jìn)行決策,從而得到比較好的,有利于識(shí)別的人臉 特征,以此滿(mǎn)足我們對(duì)人臉特征提取方法的優(yōu)化。本文采用了a g e n t 方法,在智能代理 ( a g e n t ) 的基礎(chǔ)上實(shí)現(xiàn)多目視覺(jué)的協(xié)同工作,建立基于智能代理的多目感知框架,在 理論和技術(shù)上解決形體語(yǔ)言感知中的遮擋和方位帶來(lái)的誤識(shí)別問(wèn)題。智能代理研究方案 如圖1 2 所示。 圖1 - 2 基于智能代理多目視覺(jué)協(xié)l 司工作原理框圖 f i g 1 - 2t h ef r a m e w o r ko fm u l t ic a m e r as y s t e mb a s e do na g e n t 本文主要研究了在基于a g e n t 的框架中如何協(xié)調(diào)多目視覺(jué)的協(xié)同工作,建立一種可 行的a g e n t 合作通信機(jī)制,以及a g e n t2 _ l 自j 的交互規(guī)則。結(jié)合a s m 人臉特征提取和人 臉姿態(tài)估計(jì)等算法,使得多目視覺(jué)在經(jīng)過(guò)a g e n t 系統(tǒng)后,提取的人臉特征的準(zhǔn)確性得到 很大的改善,并通過(guò)識(shí)別率體現(xiàn)出來(lái),同時(shí)a g e n t 系統(tǒng)的并行特性使得處理的速度得到 好的提高。 1 4 論文的章節(jié)安排 本文一共分為5 章,各章的主要內(nèi)容如下: 第一章緒論。本章主要介紹了人臉特征提取的研究背景、本文研究的主要內(nèi)容和意 義。詳細(xì)介紹了在人臉特征提取領(lǐng)域各種算法的發(fā)展。 第二章a s m 特征提取方法。本章主要介紹了基于a s m 的特征提取方法,對(duì)a s m 北京交通大學(xué)碩士學(xué)位論文 緒論 理論進(jìn)行了詳細(xì)的描述,并對(duì)經(jīng)典的a s m 算法進(jìn)行實(shí)現(xiàn),通過(guò)實(shí)驗(yàn)分析總結(jié)其優(yōu)點(diǎn)和 弊端。 第三章a g e n t 系統(tǒng)理論。本章主要介紹了a g e n t 體系的基本理論和多a g e n t 體系的 結(jié)構(gòu)。對(duì)a g e n t 的特性和體系結(jié)構(gòu)進(jìn)行了總結(jié),并分析了不同體系結(jié)構(gòu)的優(yōu)缺點(diǎn)。然后 分析了在多a g e n t 系統(tǒng)中的幾個(gè)核心的問(wèn)題,如a g e n t 之間的通信語(yǔ)言的制定,a g e n t 之問(wèn)傳遞消息的機(jī)制和多個(gè)a g e n t 之間如何協(xié)調(diào)合作來(lái)達(dá)到共同的系統(tǒng)目標(biāo)。 第四章基于a g e n t 多目視覺(jué)人臉特征提取系統(tǒng)。本章主要介紹了如何實(shí)現(xiàn)基于a g e n t 的多目視覺(jué)人臉特征提取系統(tǒng)。首先詳細(xì)介紹了丌發(fā)a g e n t 的平臺(tái)j a d e 。然后介紹了 整個(gè)系統(tǒng)的大致流程圖,各個(gè)不同功能的a g e n t 如何構(gòu)造,他們之間如何交互,交互的 規(guī)則等關(guān)鍵問(wèn)題。本章還介紹了a g e n t 系統(tǒng)下的關(guān)鍵代碼并展示了系統(tǒng)的實(shí)驗(yàn)界面。 第五章實(shí)驗(yàn)結(jié)果與分析。本章主要用多目視覺(jué)采集了多組圖片進(jìn)行實(shí)驗(yàn)。利用o r l 人臉庫(kù)進(jìn)行識(shí)別率計(jì)算,通過(guò)和單目視覺(jué)的識(shí)別率進(jìn)行對(duì)比得到結(jié)論,在準(zhǔn)確率和速度 上進(jìn)行分析。 第六章總結(jié)與展望。針對(duì)本文的研究?jī)?nèi)容進(jìn)行總結(jié),并且針對(duì)以后的研究方向和內(nèi) 容予以展望。 6 北京交通大學(xué)碩士學(xué)位論文 asm 特征提取 2a s m 特征提取 2 1 引言 人臉面部的特征點(diǎn),比如眉毛,鼻子和嘴巴的定位是人臉識(shí)別,模式識(shí)別中的一個(gè) 重要研究課題,是后續(xù)的姿態(tài)估計(jì),人臉識(shí)別,人臉跟蹤和三維重建等課題研究的基礎(chǔ)。 近年來(lái)對(duì)人臉特征點(diǎn)提取的研究正在如火如荼地展開(kāi)。人臉特征提取是指利用計(jì)算機(jī)技 術(shù)在人臉中自動(dòng)定位出人的眼睛,嘴巴,鼻子,耳朵等精確的位置并且能描述出其形狀 的特征,以此來(lái)確定輸入的人臉模式。在目前的研究中,研究人員重點(diǎn)的研究方向是對(duì) 特征點(diǎn)定位的準(zhǔn)確性和定位的魯棒性的提高。目前的人臉特征定位技術(shù)還很薄弱,在復(fù) 雜的環(huán)境下,例如人臉表情的變化,周?chē)h(huán)境的影響,人臉姿態(tài)的變化等都會(huì)使人臉特 征定位邊的很困難。 經(jīng)典的主動(dòng)形狀模型f 3 糾( a c t i v es h a p em o d e l ,a s m ) 最早是由c o o t e s 和t a y l o r 提出的 一種基于統(tǒng)計(jì)學(xué)的并且灰度和形狀可分離的模型。簡(jiǎn)單來(lái)說(shuō),經(jīng)典的a s m 模型的特點(diǎn) 主要表現(xiàn)在它對(duì)一維輪廓上每一個(gè)特征標(biāo)記點(diǎn)運(yùn)用了馬哈拉諾比斯距離,并且提出了一 個(gè)線性點(diǎn)分布模型。在經(jīng)典a s m 模型方法中,訓(xùn)練決定了輪廓特征點(diǎn)的分布模型。a s m 最初主要用于對(duì)醫(yī)學(xué)圖像的結(jié)構(gòu)定位。由于a s m 的一般性,它可以為各種不同的模式 建立形狀模型。 a s m ( a c t i v es h a p em o d e l ) 方法是通過(guò)對(duì)訓(xùn)練集中所要進(jìn)行描述的各種目標(biāo)形狀進(jìn) 行統(tǒng)計(jì),以此來(lái)建立一個(gè)能夠反映這個(gè)目標(biāo)的形狀變化情況和灰度分布情況變化規(guī)律的 模型。在進(jìn)行目標(biāo)搜索的時(shí)候,首先用訓(xùn)練中的局部灰度模型進(jìn)行搜索,然后利用形狀 模型對(duì)之前灰度模型搜索到的區(qū)域進(jìn)行相似性比對(duì),利用一定的規(guī)則對(duì)比對(duì)的結(jié)果進(jìn)行 判定,當(dāng)其滿(mǎn)足判定的條件時(shí),即這時(shí)是理想的匹配,當(dāng)不滿(mǎn)足時(shí),表明匹配不理想, 此時(shí)對(duì)不合理的形狀進(jìn)行調(diào)整,在調(diào)整的時(shí)候注意保證形狀在統(tǒng)計(jì)意義上的合理性,通 過(guò)多次的迭代循環(huán),可以得到理想的匹配。利用a s m 我們可以得到目標(biāo)圖像的輪廓, 即使在目標(biāo)圖像由于各種原因會(huì)有一定變化的時(shí)候,只要保證所遇到的變化的目標(biāo)模式 包含于我們的訓(xùn)練庫(kù)中,此時(shí)a s m 也可以保證能對(duì)目標(biāo)進(jìn)行準(zhǔn)確地定位。 a s m 的優(yōu)點(diǎn)在于它能夠?qū)ξ覀兯斎氲母鞣N各樣的模式進(jìn)行模式的建立,這是由 于我們所需要的關(guān)于模式的知識(shí)都可以在訓(xùn)練的過(guò)程中得到。在訓(xùn)練的過(guò)程中,我們需 要對(duì)模式進(jìn)行手工的標(biāo)定,這雖然會(huì)使我們的工作變得復(fù)雜一些,但是這種方法能夠?qū)?各種不同的模式來(lái)進(jìn)行建模,尤其是臉部的眼睛,眉毛,鼻子等不是很規(guī)則的形狀。和 變形模板相比,主動(dòng)統(tǒng)計(jì)對(duì)象模型的優(yōu)勢(shì)在于主動(dòng)統(tǒng)計(jì)對(duì)象模型中的所有參數(shù)均是從訓(xùn) 7 北京交通大學(xué)碩士學(xué)位論文 asm 特征提取 練的過(guò)程中得到的,是統(tǒng)計(jì)參數(shù),各個(gè)參數(shù)之間的相互關(guān)系十分明確,而變形模板中的 參數(shù)都是人為自己設(shè)計(jì)的,并且主動(dòng)統(tǒng)計(jì)對(duì)象模型的匹配也是通過(guò)訓(xùn)練學(xué)習(xí)得到的。主 動(dòng)統(tǒng)計(jì)對(duì)象模型的方法屬于基于統(tǒng)計(jì)學(xué)方法,并且得到了廣泛的應(yīng)用。 在對(duì)主動(dòng)統(tǒng)計(jì)對(duì)象模型的研究中,研究人員主要致力于對(duì)主動(dòng)統(tǒng)計(jì)對(duì)象模型方法兩 個(gè)方面的改進(jìn),即對(duì)主動(dòng)統(tǒng)計(jì)對(duì)象模型方法中的特征的擴(kuò)展,還有就是對(duì)收斂效率的提 高。t f c o o t e s 3 7 】等在a s m 的基礎(chǔ)上進(jìn)行了改進(jìn)和擴(kuò)展提出了一種a a m ( 主動(dòng)外觀模型) 來(lái)改進(jìn)a s m 在定位方面的準(zhǔn)確性。a a m 在繼承了a s m 特性的同時(shí)還增加了一種灰度 紋理模型,這兩種模型相結(jié)合組成了一個(gè)組合的模型。在進(jìn)行特征點(diǎn)定位的時(shí)候,我們 通過(guò)改變這個(gè)組合的參數(shù)就可以來(lái)獲得形狀和紋理模型,圖像的紋理可以從形狀模型提 取,最優(yōu)匹配的條件可以設(shè)定為模型紋理和圖像紋理之間差值的最小值。由于在a a m 中加入了圖像的紋理信息,因此a a m 的效果會(huì)比a s m 好,但是同時(shí)由于更容易受到 光照的影響,速度上會(huì)有劣勢(shì)。在提高a s m 方法的精確性和速度方面,t e c o o t e s 掣3 8 j 提出了m r a s ( m u l t i r e s o l u t i o na c t i v es h a p em o d e l s ) 的方法。m r a s m 方法首先會(huì)在 比較粗糙的圖像中尋找目標(biāo),并且在尋找的過(guò)程中會(huì)有很大的跨度,即對(duì)圖像先有一個(gè) 大致的掃描,在尋找的過(guò)程中逐步地減小搜尋的范圍,使得越到后來(lái),搜索的圖像范圍 愈發(fā)清晰,因此定位的準(zhǔn)確性也會(huì)提高,在多次迭代后會(huì)逐漸將制定的模型定位到圖像 中的目標(biāo)位置。這種方法的另一個(gè)好處就是即使開(kāi)始的形狀和要搜尋的目標(biāo)形狀相距比 較遠(yuǎn),由于在搜尋過(guò)程中式跨度式搜尋,因此即使初始形狀位置距離目標(biāo)較遠(yuǎn),m r a s m 也會(huì)很快速地定位。 g h a m a r n e h 等【”】將s n a k e 模型加入到a s m 方法中,由于s n a k e 模型能產(chǎn)生光滑、 不間斷邊界的優(yōu)點(diǎn),在分割人的左心室圖像的時(shí)候,利用a s m 的能產(chǎn)生于和訓(xùn)練集相 似的目標(biāo)形狀的優(yōu)點(diǎn),使得分割的效果得到很大改善,s n a k e 模型對(duì)約束的光滑性使得 這種方法的準(zhǔn)確性相對(duì)傳統(tǒng)a s m 方法而言得到了很大的提高,但是在處理速度上會(huì)有 一定的損失。 z u o 4 0 】等用h a a r 特征去檢測(cè)是否滿(mǎn)足紋理的相似,用梯度變換初始化模型,這兩種 方法的結(jié)合提高了在搜索的過(guò)程中匹配的精度。t a f a r u q u i e 等利用主動(dòng)統(tǒng)計(jì)對(duì)象模型 方法檢測(cè)嘴唇的輪廓,并且將彩色信息加入進(jìn)去,在嘴唇輪廓描述方法它使用了五條曲 線,這使得參數(shù)的維數(shù)額達(dá)到了降低,匹配的效果得到了改善。將彩色信息加入a s m , 并用五條曲線代表嘴唇的輪廓,大大降低參數(shù)的個(gè)數(shù),獲得了更好的匹配效果。y a n l 4 l j 等提出了t c a s m ( t e x t u r e c o n s t r a i n e da c t i v es h a p em o d e l ) ,在這種方法中,由于使用了 全局的紋理信息,因此在對(duì)形狀模型進(jìn)行約束的時(shí)候,不會(huì)使得模型產(chǎn)生不合理的形變。 t u 4 2 】等使用f i s h e r 特征代替p c a 分析得到的統(tǒng)計(jì)特征,這種替換使得當(dāng)樣本數(shù)量很小 的時(shí)候,分類(lèi)器也會(huì)有比較良好的性能,并且在搜索的準(zhǔn)確性和速度方面也有很好的性 能。j i a o 4 3 】和z h a n 刪等在紋理建模時(shí)分別使用g a b o r 小波特征和h a a r 特征,由于小波 北京交通大學(xué)碩士學(xué)位論文 asm 特征提取 變換包含的豐富的紋理信息,因此建模的效果得到很大的改善。z h a o 等在進(jìn)行目標(biāo)搜 索的過(guò)程中引入了局部紋理信息的加權(quán)值,在此引導(dǎo)下,這種方法對(duì)邊緣形狀的定位比 傳統(tǒng)的a s m 方法要好。 2 2 建立a s m 模型 為了定位到一個(gè)我們感興趣的結(jié)構(gòu),我們首先必須為這個(gè)結(jié)構(gòu)建立一個(gè)模型。為了 建立一個(gè)統(tǒng)計(jì)模型的外觀,我們需要一系列典型實(shí)例的注解圖像。我們必須首先決定一 系列合適的標(biāo)記點(diǎn),這些標(biāo)記點(diǎn)描述了我們所要搜尋的目標(biāo)圖像的形狀并且這些標(biāo)記的 特征點(diǎn)在每個(gè)訓(xùn)練的圖像中都能找到。 2 2 1 特征點(diǎn)標(biāo)記 對(duì)于特征點(diǎn)標(biāo)記來(lái)說(shuō)比較好的選擇就是指向目標(biāo)邊界清晰的角落,比如在邊界連接 處的t 形交叉點(diǎn)和很容易找到的生物特征點(diǎn)。然而,這些比較好的特征點(diǎn)遠(yuǎn)遠(yuǎn)達(dá)不到我 們需要的數(shù)量來(lái)達(dá)到我們對(duì)目標(biāo)形狀的一個(gè)大致的描述。因此,我們?cè)黾恿艘恍┰谖覀?定義的比較好的特征點(diǎn)之間沿著邊緣等間距排列的點(diǎn)( 如圖2 1 所示) 。 圖2 1 定義的比較好的特征點(diǎn) f i g 2 - 1t h ed e f i n i t i o no fg o o dl a n d m a r k s 為了描繪出目標(biāo)的輪廓,我們必須還要記錄那些標(biāo)記點(diǎn)如何在圖像中形成邊緣的連 接定義。這就允許我們通過(guò)一個(gè)給定的點(diǎn)來(lái)決定邊界的方向。假設(shè)某條曲線上的標(biāo)記點(diǎn) 標(biāo)志為 ( ,y 。) ,( x 2 ,y :) ,( _ ,y 。) ) 。對(duì)于一個(gè)二維圖像來(lái)說(shuō),我們可以將這n 個(gè)標(biāo)記點(diǎn) 表示為( x ,j o ) ,舉一個(gè)簡(jiǎn)單的例子,對(duì)n 個(gè)標(biāo)記點(diǎn)需要2 n 個(gè)元素的向量x ,其中 x = ( x ix 29 - - ,x n 饑yy 2 ,y 。) ( 2 - 1 ) 如果我們有s 個(gè)訓(xùn)練樣本,我們用類(lèi)似上面的向量x ,來(lái)生成樣本s 。在我們對(duì)這些 9 北京交通大學(xué)碩士學(xué)位論文 asm 特征提取 向量進(jìn)行統(tǒng)計(jì)分析之前,保證所要描述的模型在同一個(gè)坐標(biāo)框架內(nèi)是十分重要的。目標(biāo) 的形狀一般相對(duì)于它的位置,方向和大小來(lái)說(shuō)是獨(dú)立的。就好比一個(gè)正方形,無(wú)論將它 翻轉(zhuǎn),改變大小還是移動(dòng)它,它依舊是一個(gè)正方形。 d r y d e n 等介紹了如何將一系列訓(xùn)練的樣本形狀在同一坐標(biāo)框架內(nèi)排列,將每一個(gè)樣 本形狀翻轉(zhuǎn),平移和改變大小使得樣本形狀距離和均值距離之間差的平方的和 ( d = k x l ) 最小。 2 2 2 形狀模型 假設(shè)我們現(xiàn)在有在同一坐標(biāo)框架內(nèi)排列的s 個(gè)由點(diǎn)t 組成的集合,這些向量在他們 所在的二維空間中形成某個(gè)分布。如果我們可以對(duì)這種分布進(jìn)行建模,我們就可以生成 新的類(lèi)似于原始訓(xùn)練樣本的例子,并且我們可以來(lái)檢查新的形狀是否是合理的例子。 為了使問(wèn)題簡(jiǎn)單化,我們首先需要將二維數(shù)據(jù)的維數(shù)降低到某個(gè)我們比較容易處理 的層次,一種比較有效的方法就是在數(shù)據(jù)分析中引入主成分分析方法( p c a ) 。數(shù)據(jù)在2 n 維空間中形成云狀點(diǎn),盡管需要在一個(gè)( 2 n - 4 ) 維的復(fù)制空間中排列這些點(diǎn)所在的位置。 p c a 計(jì)算這些云狀點(diǎn)的主軸心,并且允許我們使用一個(gè)少于2 n 個(gè)參數(shù)的模型來(lái)近似任 何一個(gè)原始的點(diǎn)。p c a 算法如下: 1 計(jì)算訓(xùn)練集中的平均形狀和協(xié)方差: 1l x :y x ( 2 - 2 ) n 葛一 1n s = i 之( 工一x ) ( x 1 一x ) 。 ( 2 3 ) r1 厶一、l 7、 jv li = l 其中,n 表示訓(xùn)練集中圖像的個(gè)數(shù),x 是第i 個(gè)訓(xùn)練圖像的形狀向量。 2 計(jì)算特征值和特征向量 計(jì)算得到s 的特征值和特征向量,然后將特征向量按照對(duì)應(yīng)的特征值的大小進(jìn)行排 列:辦,政,么,他們的特征值為:a ,五,以,其中以丑+ 。,我們只要前t 個(gè)的特 征值,保證丑- 9 8 。 i = l ,= i 根據(jù)p c a 的相關(guān)算法,可以計(jì)算得到一個(gè)矩陣c i ) = 辦,攻,諺 。因?yàn)檩^大的特征 向量諺已經(jīng)體現(xiàn)了一些重要的形狀,因此和它相對(duì)應(yīng)的前面的t 個(gè)特征向量完全可以表 示大多數(shù)形狀向量x 。 如果我們?cè)跀?shù)據(jù)中引入了p c a ,那么我們可以對(duì)任何一個(gè)樣本集x 進(jìn)行近似, x x + p b ( 2 4 ) 其中,p = ( p 1p 2 | - 1r ) ,它包含了協(xié)方差矩陣的t 個(gè)特征向量,b 是一個(gè)t 維的 1 0 北京交通大學(xué)碩士學(xué)位論文 asm 特征提取 矢量,定義為: b = p 7 ( x x )( 2 - 5 ) 矢量b 定義了一個(gè)可變形模型中的一些參數(shù),通過(guò)改變b 中的元素,通過(guò)公式( 2 4 ) 我們就可以來(lái)改變形狀,b 中第i 個(gè)變化的參數(shù)包在訓(xùn)練集中由元表示。我們規(guī)定生成 的模型如果和變化的參數(shù)龜相差在3 五以?xún)?nèi),則就可以認(rèn)為它和訓(xùn)練樣本集中的例子 相近似。 如果是某個(gè)模型的變化正好相對(duì)于第i 個(gè)參數(shù)包,那么我們就稱(chēng)它為第i 個(gè)模型。 特征向量p 定義了

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論