已閱讀5頁(yè),還剩112頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)字圖像處理學(xué)第10章模式識(shí)別的理論和方法(第七講),10.5模式識(shí)別的幾種應(yīng)用,模式識(shí)別的應(yīng)用較廣,大致可有如下幾個(gè)方面:字符識(shí)別;醫(yī)學(xué)診斷;遙感圖像解譯;人臉和指紋鑒別;污染監(jiān)測(cè);自動(dòng)檢查和自動(dòng)化;可靠性;社會(huì)經(jīng)濟(jì);語(yǔ)音識(shí)別和理解;考古等。下面介紹一些實(shí)例。,1051生物特征識(shí)別,生物特征是人的內(nèi)在屬性,具有很強(qiáng)的自身穩(wěn)定性和個(gè)體差異性,因此是身份驗(yàn)證的最理想依據(jù)。生物特征包括人臉、指紋、虹膜、掌紋、DNA等。人臉包含豐富的人類思想和情感信息,利用人臉特征進(jìn)行身份驗(yàn)證由于具有直接、方便、友好、使用者無(wú)任何心理障礙等優(yōu)點(diǎn),因而有著極其廣泛的應(yīng)用前景。,41指紋識(shí)別,指紋具有兩大特性:1)沒(méi)有兩個(gè)人的指紋是相同的;2)當(dāng)指紋不受損傷時(shí)終生不變。所以它是識(shí)別人最有力的手段之一。,指紋本身是一個(gè)無(wú)窮類問(wèn)題,在應(yīng)用中有不同的情況。一種情況是對(duì)指紋進(jìn)行核對(duì)查找,這是一個(gè)匹配問(wèn)題。當(dāng)然不是匹配每根隆線,而是匹配特征。如果檔案數(shù)目很大,就要進(jìn)行分類,把無(wú)窮類問(wèn)題變成有限類問(wèn)題,以減輕匹配負(fù)擔(dān)。指紋分析是標(biāo)準(zhǔn)的結(jié)構(gòu)分析,分成小塊后只需測(cè)量隆線的斜率,通常采用0到7,八個(gè)方向。,首先,指紋分為七類(平斗、左箕、右箕、平弓、帳弓、左雙箕、右雙箕)。第一類再分為十八個(gè)小類,然后測(cè)量斜率??偟倪^(guò)程是分類、分層、分窗口,在這個(gè)過(guò)程中包括細(xì)化,連接斷線等處理;爾后整個(gè)窗口用一個(gè)樹(shù)代表,樹(shù)的每一個(gè)分支是窗口中的一根隆線,然后找出文法;最后做一樹(shù)狀自動(dòng)機(jī)。,據(jù)有關(guān)專家說(shuō),實(shí)驗(yàn)中大約有10的指紋由于噪聲大而難以識(shí)別。識(shí)別一個(gè)指紋大約要50s鐘,40s用于前后處理,10s鐘用于結(jié)構(gòu)分析。美國(guó)在1965年開(kāi)始進(jìn)行指紋識(shí)別自動(dòng)化研究,在1972年完成了叫做FINGER的系統(tǒng)。北京大學(xué)模式識(shí)別國(guó)家實(shí)驗(yàn)室的指紋識(shí)別研究歷經(jīng)十幾年的研究,已在公安部門(mén)及銀行中得到了實(shí)際應(yīng)用。,2人臉識(shí)別,人臉識(shí)別技術(shù)(FaceRecognition)就是利用計(jì)算機(jī)分析人臉圖像,從中提取有效的識(shí)別信息,用來(lái)辨認(rèn)身份的一門(mén)技術(shù),它是典型的模式識(shí)別問(wèn)題。完整的人臉識(shí)別問(wèn)題不僅涉及圖像處理、計(jì)算機(jī)視覺(jué)、人工智能、優(yōu)化理論等諸多學(xué)科的知識(shí),同時(shí)與認(rèn)知學(xué)、神經(jīng)科學(xué)、生理心理學(xué)的研究領(lǐng)域都有密切聯(lián)系。如同人的指紋一樣,人臉也具有唯一性。人臉識(shí)別有廣泛的應(yīng)用前景,如:,在國(guó)家安全、公共安全領(lǐng)域有廣泛用途,如:身份認(rèn)證、智能門(mén)禁、智能視頻監(jiān)控、海關(guān)身份驗(yàn)證、司機(jī)駕照驗(yàn)證等都是典型的應(yīng)用;在刑事偵察領(lǐng)域,參照臉像庫(kù)對(duì)特定人進(jìn)行跟蹤識(shí)別;在民事和經(jīng)濟(jì)領(lǐng)域中,各類銀行卡、金融卡、信用卡、儲(chǔ)蓄卡的持卡人的身份驗(yàn)證,社會(huì)保險(xiǎn)的身份驗(yàn)證等都具有重要的應(yīng)用價(jià)值。,網(wǎng)絡(luò)信息安全領(lǐng)域:網(wǎng)絡(luò)信息安全是隨著網(wǎng)絡(luò)技術(shù)發(fā)展出現(xiàn)的一個(gè)需要解決的迫切問(wèn)題。而利用人臉識(shí)別技術(shù)可以進(jìn)行網(wǎng)絡(luò)安全登錄控制,應(yīng)用于程序安全使用、數(shù)據(jù)庫(kù)安全訪問(wèn)、文件加密、局域網(wǎng)和電子商務(wù)安全控制等。,家庭娛樂(lè)領(lǐng)域:人臉識(shí)別也具有一些有趣的應(yīng)用,比如能夠識(shí)別主人身份的智能玩具、家政機(jī)器人,具有真實(shí)面像的虛擬游戲玩家等等。人機(jī)交互領(lǐng)域:人臉識(shí)別技術(shù)是當(dāng)前“多模態(tài)”人機(jī)交互研究的主要內(nèi)容之一,其目的是使人與計(jì)算機(jī)交互如同人與人之間交互一樣輕松,自然。,虛擬現(xiàn)實(shí)領(lǐng)域:虛擬環(huán)境中,有效的人臉識(shí)別與跟蹤研究成果可以借助人像庫(kù)和三維人臉重建技術(shù),構(gòu)造更加逼真的人臉。虛擬主持人便是其應(yīng)用之一。人臉的識(shí)別、跟蹤與重建也是MPEG-4標(biāo)準(zhǔn)中的重要內(nèi)容,是先進(jìn)的人機(jī)界面、可視電話/會(huì)議電視、計(jì)算機(jī)動(dòng)畫(huà)領(lǐng)域的關(guān)鍵技術(shù)。,人臉識(shí)別系統(tǒng)取樣方便,可以不接觸目標(biāo)就進(jìn)行識(shí)別,具有方便性和直觀性,從而開(kāi)發(fā)研究的實(shí)際意義更大。與指紋圖像不同的是,人臉圖像受到很多因素的干擾,如:人臉表情的多樣性;在成像過(guò)程中的光照、圖像尺寸、旋轉(zhuǎn)、姿勢(shì)變化等,使得同一個(gè)人,在不同環(huán)境下拍攝所得到的人臉圖像不同,給識(shí)別帶來(lái)很大難度。因此人臉識(shí)別是一項(xiàng)具有挑戰(zhàn)性的模式識(shí)別課題。,人臉識(shí)別技術(shù)(FaceRecognitionTechnology,簡(jiǎn)稱FRT)的研究可以追溯到19世紀(jì)末。英國(guó)的高爾頓爵士發(fā)明的一套機(jī)械裝置,利用人的側(cè)臉輪廓上的五個(gè)代表點(diǎn)及其導(dǎo)出的一組特征進(jìn)行人臉的匹配和識(shí)別。,此后,一直到20世紀(jì)60年代中后期,W.Bledsoe最先建立了半自動(dòng)的人臉識(shí)別系統(tǒng)。該系統(tǒng)使用手工方式確定一些點(diǎn),然后利用這些點(diǎn)建立參數(shù)進(jìn)行分類器的設(shè)計(jì)。進(jìn)入20世紀(jì)70年代,人臉識(shí)別的研究形成了第一次高潮。這些方法基本上采用人臉的一些幾何特征點(diǎn),進(jìn)行人臉識(shí)別。這些方法對(duì)圖像的約束條件較多,提取的特征數(shù)目較少,自動(dòng)提取特征的準(zhǔn)確度較低。,從20世紀(jì)70年代到80年代末,人臉識(shí)別陷入低谷。進(jìn)入20世紀(jì)90年代以來(lái),人臉識(shí)別研究受到了前所未有的重視。其原因是多方面的:首先是來(lái)自于信息安全和商貿(mào)系統(tǒng)的需要,如證件核實(shí)、保安監(jiān)視、身份鑒別等的需求帶動(dòng)了人臉識(shí)別技術(shù)研究的興起;其次是計(jì)算機(jī)運(yùn)算速度的提高,為人臉識(shí)別系統(tǒng)實(shí)用化提供了條件;另外,計(jì)算機(jī)網(wǎng)絡(luò)的廣泛應(yīng)用,神經(jīng)網(wǎng)絡(luò)分類器的一些研究成果也推動(dòng)了這一領(lǐng)域的發(fā)展。,20世紀(jì)90年代前期,研究的重點(diǎn)在人臉?lè)指?,特征提取,基于統(tǒng)計(jì)或神經(jīng)網(wǎng)絡(luò)的分類器設(shè)計(jì)方面。該時(shí)期的人臉識(shí)別數(shù)據(jù)庫(kù)比較小,且研究多集中在靜態(tài)人臉圖像上。存在的主要問(wèn)題是:靜態(tài)圖像識(shí)別存在局限性,識(shí)別復(fù)雜場(chǎng)景中人臉圖像比較困難,相比之下,動(dòng)態(tài)視頻圖像序列下的識(shí)別相對(duì)容易解決。,后來(lái)一些學(xué)者把注意力從靜態(tài)圖像轉(zhuǎn)為動(dòng)態(tài)的視頻圖像序列來(lái)識(shí)別人臉。但是,在將理論諸實(shí)用的過(guò)程中,人們發(fā)現(xiàn)單樣本進(jìn)行識(shí)別的重要性和困難性,單單一張照片很難反映出人臉豐富的三維信息,所以,一些研究小組把注意力放在通過(guò)多張照片構(gòu)造出三維人臉圖像上來(lái)。主要方法有基于代數(shù)特征的方法(AlgebraicFeaturesBased)和基于神經(jīng)網(wǎng)絡(luò)的方法(NeuralNetworkBased)等。,(1)人臉識(shí)別系統(tǒng)的基本組成,(2).人臉識(shí)別基本算法,1)基于幾何特征的方法基于幾何特征的方法(GeometricalFeaturesBased)是早期的人臉識(shí)別算法。該方法要求選取的特征矢量有一定的獨(dú)特性,既要反映不同人臉的差異,還要具有一定的彈性,以減少或者消除光照差異等影響。幾何特征向量是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征向量,其分量通常包括人臉指定兩點(diǎn)間的歐式距離、曲率、角度等。,該方法的主要優(yōu)點(diǎn)是:該算法提出較早,由于現(xiàn)在各種優(yōu)秀特征提取算法(如動(dòng)態(tài)模板、活動(dòng)輪廓等)的提出,使得人臉的幾何特征描述越來(lái)越充分,在表情分析方面,人臉的幾何特征仍然是最有力的判據(jù);,基于幾何特征的人臉識(shí)別算法符合人類識(shí)別的機(jī)理,易于理解;對(duì)每幅圖像只需要存儲(chǔ)一個(gè)特征矢量,存儲(chǔ)量??;對(duì)光照變化不太敏感,算法的不足是:對(duì)圖像的約束條件較多,提取的特征數(shù)目較少,自動(dòng)提取特征的準(zhǔn)確度較低;從圖像中抽取穩(wěn)定的特征比較困難,特別是特征受到遮擋時(shí)更是如此;,對(duì)強(qiáng)烈的表情變化和姿態(tài)變化的魯棒性較差;一般幾何特征只描述了部件的基本形狀與結(jié)構(gòu)關(guān)系,忽略了局部細(xì)微特征,造成部分信息丟失,因此,該方法較適合于粗分類。,2)基于神經(jīng)網(wǎng)絡(luò)的方法神經(jīng)網(wǎng)絡(luò)用于(NeuralNetworkBased)人臉識(shí)別較早。早期用于人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)主要是Kohonen自聯(lián)想映射神經(jīng)網(wǎng)絡(luò),當(dāng)人臉圖像受噪聲污染嚴(yán)重或部分缺損時(shí),用Kohonen網(wǎng)絡(luò)恢復(fù)完整的人臉的效果較好。Cottrell等人使用級(jí)聯(lián)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識(shí)別,對(duì)部分受損的、光照有所變化的人臉圖像識(shí)別能力也較好。,基于神經(jīng)網(wǎng)絡(luò)的方法將人臉直接用灰度圖(二維矩陣)表征,通過(guò)訓(xùn)練把模式的特性隱含在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)之中,即設(shè)計(jì)特定結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)作為決策分類器。所選用的神經(jīng)網(wǎng)絡(luò)有:反向傳播神經(jīng)網(wǎng)絡(luò)(BackPropagationNN),卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionNN),支持向量機(jī)(SVM)等。,該算法的主要優(yōu)點(diǎn)是:神經(jīng)網(wǎng)絡(luò)作為分類器具有很好的適應(yīng)性和擴(kuò)展性;可以通過(guò)學(xué)習(xí)的過(guò)程獲得其它方法難以實(shí)現(xiàn)的關(guān)于人臉識(shí)別的規(guī)律和規(guī)則的隱性表達(dá)。對(duì)于復(fù)雜的、難以顯式描述的模式具有一定的優(yōu)勢(shì);,神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)上更類似于人腦,編碼存儲(chǔ)方式是分布式,信息處理方式是并行的,能顯著提高速度。其缺點(diǎn)是:構(gòu)造模型太大,參數(shù)繁多。由于原始圖像數(shù)據(jù)量十分龐大,因此神經(jīng)元數(shù)目通常很多,訓(xùn)練時(shí)間很長(zhǎng)。當(dāng)網(wǎng)絡(luò)結(jié)構(gòu)比較復(fù)雜,網(wǎng)絡(luò)有許多參數(shù)(網(wǎng)絡(luò)的層數(shù)、節(jié)點(diǎn)個(gè)數(shù)、學(xué)習(xí)速度等)需要調(diào)整時(shí)可能導(dǎo)致過(guò)訓(xùn)練(Overfitting)問(wèn)題。,3)基于代數(shù)特征的方法這類算法是采用代數(shù)特征向量,即人臉圖像在由“特征臉”張成的降維子空間上的投影。基于代數(shù)特征識(shí)別的主要原理是利用統(tǒng)計(jì)方法提取特征,從而形成子空間進(jìn)行識(shí)別。,基于代數(shù)特征的方法的基本處理過(guò)程為:將圖像看作一個(gè)數(shù)值矩陣,對(duì)其進(jìn)行SVD分解,得到的奇異值作為人臉圖像的描述。由于奇異值向量與圖像有一一對(duì)應(yīng)關(guān)系而且具有較好的穩(wěn)定性和各種變換的不變性,代數(shù)特征反映了圖像的本質(zhì),可以用做人臉特征的描述。,該方法將K-L變換用于人臉圖像的最優(yōu)表示;Turk和Pentland進(jìn)一步提出了“特征臉”方法,該方法以訓(xùn)練樣本集的總體散布矩陣為產(chǎn)生矩陣,經(jīng)K-L變換后得到相應(yīng)的一組特征向量,稱作“特征臉”,這樣,就產(chǎn)生了一個(gè)向量張成的子空間,每一幅人臉圖像通過(guò)投影都可以獲得一組坐標(biāo)系數(shù),這組坐標(biāo)系數(shù)表明了人臉在子空間中的位置。實(shí)驗(yàn)表明其具有較強(qiáng)的穩(wěn)定性,可以作為人臉識(shí)別的依據(jù)。,由于代數(shù)特征向量具有一定的穩(wěn)定性,識(shí)別系統(tǒng)對(duì)不同的傾斜角度,甚至不同的表情均有一定的魯棒性。其主要不足是對(duì)表情的描述不夠充分,難以用于表情分析。,(3)當(dāng)前主流算法,1)特征臉(eigenface)算法特征臉?lè)椒ǖ膬?yōu)點(diǎn):圖像的原始灰度數(shù)據(jù)直接用來(lái)學(xué)習(xí)和識(shí)別,不需要任何低級(jí)或中級(jí)處理;不需要人臉的幾何和反射知識(shí);通過(guò)低維可以有效的對(duì)高維數(shù)據(jù)進(jìn)行壓縮;與其它匹配方法相比,識(shí)別簡(jiǎn)單有效。,特征臉?lè)椒ù嬖诘牟蛔悖簣D像中所有的像素被賦予了同等的地位,可是角度、光照、尺寸及表情等干擾會(huì)導(dǎo)致識(shí)別率下降,因此,須先進(jìn)行尺度歸一化處理;在姿態(tài)和光照變化時(shí)識(shí)別率明顯下降;要求背景單一,;學(xué)習(xí)時(shí)間長(zhǎng),只能離線計(jì)算。,2)基于Fisher線性判別分析算法Fisher線性判別準(zhǔn)則是模式識(shí)別里的經(jīng)典算法,F(xiàn)isher準(zhǔn)則假設(shè)了不同類別在模式空間是線性可分的,而引起它們可分的主要原因是不同人臉之間的差異。,Fisher臉?lè)椒ㄊ菍?duì)特征臉?lè)椒ǖ囊环N很好的改進(jìn),特征臉很大程度上反映了光照等的差異,而Fisher臉壓制了圖像中與識(shí)別信息無(wú)關(guān)的差異。根據(jù)P.N.Beelhumeur的實(shí)驗(yàn)結(jié)果,采用K-L變換的識(shí)別率是81%,采用Fisher方法的識(shí)別率為97.4%。很顯然的,采用Fisher臉有了很大的改進(jìn)。,3)彈性圖匹配方法彈性圖匹配方法(ElasticGraphMatching)是一種基于動(dòng)態(tài)鏈接結(jié)構(gòu)(DynamicLinkArchitecture,DLA)的方法。它將人臉用格狀的稀疏圖(即拓?fù)鋱D)表示,圖中的節(jié)點(diǎn)用圖像位置的Gabor小波分解得到的特征向量標(biāo)記,圖的邊用連接節(jié)點(diǎn)的距離向量標(biāo)記。,匹配時(shí),首先尋找與輸入圖像的最相似的模型圖,再對(duì)圖中的每個(gè)節(jié)點(diǎn)位置進(jìn)行最佳匹配,這樣產(chǎn)生一個(gè)變形圖,其節(jié)點(diǎn)逼近模型圖的對(duì)應(yīng)點(diǎn)的位置。Wiscott等人使用彈性圖匹配方法,以FERET圖像庫(kù)做實(shí)驗(yàn),準(zhǔn)確率達(dá)到97.3%。,其優(yōu)點(diǎn)是:人臉稀疏圖(即拓樸圖)的頂點(diǎn)采用了小波變換特征,對(duì)光照、位移、旋轉(zhuǎn)及尺度變化都不敏感。彈性圖匹配法能保留二維圖像的空間相關(guān)信息。而特征臉?lè)椒ㄔ趯D像排成一維向量后,丟失了很多空間相關(guān)信息。,4)局部特征分析算法局部特征分析算法(LFA:LocalFeatureAnalysis)是利用人臉的先驗(yàn)結(jié)構(gòu)知識(shí)和人臉圖像的灰度分布知識(shí),先粗略找出人臉的特征點(diǎn),然后利用人臉彈性圖來(lái)對(duì)其進(jìn)行調(diào)整,最后在各個(gè)特征點(diǎn)處計(jì)算Gabor變換系數(shù)集合,并以此來(lái)表示人臉的特征。,Penev和Atick提出基于局部特征分析的方法,用于克服主成分分析法PCA不能提取物體局部結(jié)構(gòu)性特征。由于主成分分析(PCA)本質(zhì)上是一個(gè)非拓?fù)涞木€性濾波器,降維后損失的結(jié)構(gòu)信息無(wú)法在后續(xù)過(guò)程中彌補(bǔ)。,而局部信息和拓?fù)湫再|(zhì)在模式識(shí)別分類中非常重要,同時(shí)這些特征更符合生物神經(jīng)系統(tǒng)的識(shí)別機(jī)制。此方法對(duì)基于全局PCA模型提出一種局部特征的拓?fù)浔硎?。相?duì)于傳統(tǒng)的彈性圖匹配方法,特征點(diǎn)預(yù)先被估算出來(lái),而不是在整個(gè)圖中檢索,因此大大的降低了計(jì)算量。,5)非線性子空間算法非線性子空間分析法(Non-LinearSubSpace)它代表了一種主流發(fā)展趨勢(shì)。主要有基于內(nèi)核機(jī)方法(如:K-SVM,K-PCA、K-LDA)、局部線性嵌入方法(LLE)、拉普拉斯特征臉?lè)椒ǎ↙E)等。其主要思路:用較少數(shù)量的特征對(duì)樣本進(jìn)行描述,采用非線性映射實(shí)現(xiàn)降維,構(gòu)造人臉特征子空間,進(jìn)而通過(guò)分類器,實(shí)現(xiàn)人臉識(shí)別與跟蹤。,非線性子空間算法的最大特點(diǎn):能夠用非線性映射表示高階人臉特征所含的有效信息,除具有線性子空間方法基于事例、特征學(xué)習(xí)與降維的特點(diǎn)以外,還具有更有效建模(Leadmoresensiblemodeling)和固有特征維發(fā)現(xiàn)(Discoverintrinsicdimension)的優(yōu)點(diǎn)。,但是在高階帶來(lái)的計(jì)算量增加和尋找有效映射上仍需要改進(jìn)。以核主分量分析(KPCA)為例,KPCA是基于數(shù)據(jù)的高階統(tǒng)計(jì)的低維表示基礎(chǔ)上,引入了更高階統(tǒng)計(jì)獨(dú)立分量(相關(guān)性)分析,具有比主分量分析(PCA)更有效的識(shí)別效果。,(4)人臉識(shí)別中的相似度比較方法,將待識(shí)別圖像映射到特征空間后,需要確定訓(xùn)練集中的哪幅圖像與之最相似。一般有兩種方法確定圖像間的相似程度。一種方法是比較兩幅圖像N維像素向量間的距離;第二種方法是估算兩幅圖像的相似度。,計(jì)算向量間距離和相似度的五種方法。1)準(zhǔn)則準(zhǔn)則又稱城市阻塞準(zhǔn)則或和準(zhǔn)則,實(shí)際上它來(lái)自明氏距離(Minkowskidistance)。明氏距離的定義如下:當(dāng)時(shí),就是絕對(duì)距離。,2)準(zhǔn)則準(zhǔn)則又稱歐式準(zhǔn)則,它同樣來(lái)自明氏距離。當(dāng)時(shí),即得到準(zhǔn)則,它的平方根又稱歐式距離。圖像A和圖像B的準(zhǔn)則為:,3)協(xié)方差協(xié)方差方法也被稱作角度方法,它計(jì)算兩個(gè)歸一化向量間的角度。通過(guò)兩個(gè)歸一化向量的點(diǎn)積來(lái)計(jì)算。圖像A和圖像B之間的協(xié)方差為:,4)馬氏距離當(dāng)特征向量之間具有相關(guān)性,而且各個(gè)特征向量對(duì)距離測(cè)度的貢獻(xiàn)不一樣的時(shí)候,可以采用馬氏距離(Mahalanobisdistance)。其定義為:,其中,代表特征向量的協(xié)方差矩陣。,5)相關(guān)性相關(guān)性表示了兩幅圖像像素間的變化速度。它計(jì)算出來(lái)的結(jié)果在-1到1之間,-1表示兩幅圖像互不相關(guān),1表示兩幅圖像完全一樣。圖像A和圖像B之間的相關(guān)性可表示為:,其中,表示A的平均數(shù),表示A的標(biāo)準(zhǔn)差。,(5).非線性子空間算法實(shí)現(xiàn)人臉識(shí)別,人臉識(shí)別中特征的維數(shù)通常都是非常高的,實(shí)際上在這樣高維空間中的分布很不緊湊,因而不利于分類,計(jì)算上的復(fù)雜度也非常大。為了得到人臉圖像的較緊湊分布,Kirby和Turk等人首次把主分量分析的子空間思想引入到人臉識(shí)別中,并獲取了較大的成功。,子空間分析的思想就是根據(jù)一定的性能目標(biāo)來(lái)尋找一線性或非線性的空間變換,把原始數(shù)據(jù)壓縮到一個(gè)低維子空間,使數(shù)據(jù)在子空間中的分布更加緊湊,為數(shù)據(jù)的更好描述提供了手段。從而,使計(jì)算的復(fù)雜度也得到了大大降低。,目前在人臉識(shí)別中較為成功應(yīng)用的線性子空間方法有:主分量分析(principalcomponentanalysis,PCA)線性判決分析(lineardiscriminantanalysis,LDA)、,矢量量化(vectorquantization,VQ)、獨(dú)立元分析(independentcomponentanalysis,ICA)非負(fù)矩陣因子(non-negativematrixfactorization,NMF),,基于核技術(shù)的非線性子空間分析方法有:核主分量分析(kernelprincipalcomponentanalysis,KPCA)核Fisher判決分析(kernelfisherdiscriminantanalysis,KFDA)等。,1)主分量分析法(PCA)主分量分析法的主要思想是選擇樣本點(diǎn)分布方差大的坐標(biāo)軸進(jìn)行投影,來(lái)降低維數(shù)而使信息量損失最少,這樣就把問(wèn)題轉(zhuǎn)化為求樣本數(shù)據(jù)協(xié)方差矩陣的特征值問(wèn)題。,PCA方法將包含人臉圖像區(qū)域看作一種隨機(jī)變量,因此,可以采用K-L變換得到正交變換基,對(duì)應(yīng)其中較大的特征值的基底具有與人臉相似的形狀。,PCA利用這些基底的線性組合可以描述和逼近人臉,因此可以進(jìn)行人臉的識(shí)別和重建。識(shí)別過(guò)程就是把待識(shí)別人臉映射到由特征臉張成的子空間中,與庫(kù)中人臉的子空間位置進(jìn)行比較或匹配。,計(jì)算特征臉特征臉是通過(guò)計(jì)算一系列訓(xùn)練集圖像的像素點(diǎn)的協(xié)方差矩陣的特征向量確定的。假設(shè)訓(xùn)練集中有P幅人臉圖像,每幅圖像的像素值構(gòu)成一個(gè)N維列向量中,,這P幅圖像的平均值向量為:,每個(gè)人臉圖像與平均值向量m的差值向量為:,將所有圖像的向量結(jié)合在一起,形成了一個(gè)大小的矩陣,,將矩陣的轉(zhuǎn)置矩陣與相乘得到其協(xié)方差矩陣:,假設(shè)PN,求解協(xié)方差矩陣的非零特征值及其對(duì)應(yīng)的特征向量。將計(jì)算出來(lái)的特征值由大到小排列,對(duì)應(yīng)的特征向量也按順序排列。最大特征值對(duì)應(yīng)的特征向量反映了圖像間的最大差異,第二個(gè)最大特征值對(duì)應(yīng)的特征向量反映了圖像間的第二大差異,以此類推,最小的特征值對(duì)應(yīng)的特征向量反映了圖像間的最小差異。,通過(guò)特征空間映射標(biāo)識(shí)人臉有三個(gè)基本步驟。首先,通過(guò)對(duì)訓(xùn)練集圖像進(jìn)行訓(xùn)練創(chuàng)建特征空間;其次,訓(xùn)練集圖像被映射到特征空間;最后,將待測(cè)圖像映射到特征空間,通過(guò)與映射到特征空間的訓(xùn)練集圖像進(jìn)行比較,實(shí)現(xiàn)人臉識(shí)別。,4.1.2.1創(chuàng)建特征空間,計(jì)算每幅圖像像素矩陣與均值矩陣的差值:每一幅訓(xùn)練集中的圖像都必須進(jìn)行這項(xiàng)操作,因?yàn)橹鞣至糠治龅那疤崾?。所以,?jì)算訓(xùn)練集中圖像的均值矩陣和計(jì)算圖像像素矩陣與均值矩陣的差值,即為所得。,創(chuàng)建數(shù)據(jù)矩陣:訓(xùn)練集圖像完成了步驟1的計(jì)算后,就把它們結(jié)合在一個(gè)的數(shù)據(jù)矩陣中,其中:P為訓(xùn)練集中圖像的個(gè)數(shù),矩陣中的每一列代表一幅圖像的所有像素,如式(10186)計(jì)算所得。,計(jì)算協(xié)方差矩陣:數(shù)據(jù)矩陣乘以其轉(zhuǎn)置矩陣就得到了數(shù)據(jù)矩陣的協(xié)方差矩陣,如式(10187)所示。,計(jì)算協(xié)方差矩陣的特征值和特征向量:協(xié)方差矩陣的特征值和特征向量滿足下式,,這里,V為特征值所對(duì)應(yīng)的特征向量的集合。,對(duì)特征向量進(jìn)行排序:將協(xié)方差矩陣的特征值按由大到小的順序進(jìn)行排序,特征值所對(duì)應(yīng)的特征向量也按同樣的順序排列。,排序只針對(duì)非零特征值所對(duì)應(yīng)的特征向量。這個(gè)排序后的特征向量集就是特征空間V,V中的每一列代表一個(gè)列向量。,4.1.2.2映射訓(xùn)練集圖像,每一個(gè)減去均值矩陣之后的訓(xùn)練集圖像向量()都要映射到特征空間。通過(guò)計(jì)算特征空間矩陣的轉(zhuǎn)置矩陣與每一幅圖像的像素向量()的乘積,將訓(xùn)練集圖像向量()映射到特征空間。,4.1.2.3識(shí)別待測(cè)圖像,每一幅待測(cè)圖像首先都要通過(guò)減去均值向量得到一列向量,然后被投影到由V定義的特征空間中。即:,其中,且,將待測(cè)圖像的投影與每一個(gè)訓(xùn)練集的投影進(jìn)行比較,與待測(cè)圖像投影最接近的訓(xùn)練集圖像就是我們要識(shí)別的訓(xùn)練集中的圖像??梢杂妙愃频姆椒▽?duì)圖像進(jìn)行比較;最普通的是使用標(biāo)準(zhǔn)。,(6).人臉識(shí)別的統(tǒng)計(jì)結(jié)果,根據(jù)圖5.1和圖5.2所示的訓(xùn)練和識(shí)別的流程圖在MicrosoftVisualC+6.0環(huán)境下編程測(cè)試KPCA人臉識(shí)別效果,采用美國(guó)的Yale人臉庫(kù),,圖像庫(kù)中共15人,每人11張照片,人臉數(shù)目共計(jì)為165。每人10幅圖像作訓(xùn)練,一幅做測(cè)試,識(shí)別率定義如下:,其中,n為正確識(shí)別出的人臉個(gè)數(shù),N為訓(xùn)練集中的人數(shù)。利用PCA進(jìn)行人臉識(shí)別的實(shí)驗(yàn)結(jié)果為:87.5,42模式識(shí)別在醫(yī)學(xué)上的應(yīng)用,模式識(shí)別在醫(yī)學(xué)圖像方面的應(yīng)用還不多,主要是醫(yī)學(xué)圖片在預(yù)處理和分割等方面的問(wèn)題還沒(méi)有解決,大部分工作尚在解決此類問(wèn)題。,染色體分類是句法方法的一個(gè)例子,目前只用于形狀分類,其實(shí)真正染色體的分類還要用到染色體本身灰度的變化。一般作法是先找到染色體,然后掃描、分開(kāi)、找到染色體的方向,找到中心,測(cè)量臂長(zhǎng)、灰度等參數(shù),然后加以識(shí)別。染色體分類系統(tǒng)的框圖如圖1034所示。目前有資料談到染色體的正確識(shí)別率為93.7。,除染色體分類,在醫(yī)學(xué)中的應(yīng)用還有血球分類。目前有的醫(yī)院使用5類分類器,可以做到95的正確分類。分類方法與染色體分類大致相同。此外,還有細(xì)胞分類,光透視照片分析等等。,43模式識(shí)別在自動(dòng)檢測(cè)中的應(yīng)用,模式識(shí)別的一個(gè)較為廣泛的應(yīng)用領(lǐng)域是自動(dòng)檢測(cè),它包括自動(dòng)視覺(jué)檢查及工業(yè)零件的自動(dòng)識(shí)別等等。在生產(chǎn)過(guò)程中,為了排除次品和查出與故障有關(guān)的零件隱患等,要在生產(chǎn)過(guò)程中用目測(cè)方法對(duì)產(chǎn)品進(jìn)行外觀檢查,但目測(cè)法有因人而異和漏檢的問(wèn)題。,為此,有必要研制能在一定的標(biāo)準(zhǔn)條件下定量的一個(gè)不漏地進(jìn)行檢查的裝置,這就是利用模式識(shí)別技術(shù)的自動(dòng)外觀檢查裝置。,目前已實(shí)用的自動(dòng)外觀檢查裝置有很多:漆包線自動(dòng)外觀檢查裝置彩色顯像管陰罩的自動(dòng)外觀檢查裝置二極管基片檢查電話交換機(jī)繼電器接點(diǎn)檢查印刷電路板自動(dòng)外觀檢查等等都已付諸實(shí)用。下面簡(jiǎn)略介紹其中幾種檢測(cè)原理。,431印刷電路板自動(dòng)外觀檢查裝置,在電子技術(shù)高度發(fā)展的今天,幾乎所有的電氣裝置中都要用到印刷電路板,特別是電子計(jì)算機(jī)中的印刷電路板,已達(dá)到高密度多層化。因此,用目測(cè)法檢查缺陷相當(dāng)困難甚至已不可能。,大部分印刷電路板的缺陷都是由一些細(xì)微的疵點(diǎn)造成的,只要從圖案中檢查出細(xì)微的圖案差錯(cuò),就能防止大部分缺陷。,在識(shí)別微細(xì)傷痕時(shí),要從可能含有傷痕的輸入圖像中先做出不包含任何傷痕的圖像作為模板,這種模板稱為準(zhǔn)正常圖像。然后將準(zhǔn)正常圖像與輸入圖像進(jìn)行比較,識(shí)別出與準(zhǔn)正常圖像有差別的部分,判定其為疵點(diǎn)或傷痕。,準(zhǔn)正常圖像的制作方法如圖1035所示。圖(a)是輸入圖像,其中有微小的斑疵。為消除圖像中的疵點(diǎn),首先把圖像放大,如圖(b),(c)把黑色部分放大,緊接著再把黑色部分等量縮小,則圖中的白色疵點(diǎn)去掉了。然后均勻放大白色部分,再等量縮小,如圖(d),(e)所示,此時(shí)黑色疵斑也去掉了。最后得到圖(e)所示的準(zhǔn)正常圖像。,印刷電路板外觀檢查裝置的方框圖如圖1036所示。這種裝置用攝像機(jī)來(lái)檢查,首先把圖像轉(zhuǎn)換成240320個(gè)點(diǎn)陣像素,然后作二值處理,提取細(xì)微部分,從而判定傷痕。這種方法處理一張圖像約需。,432彩色顯像管陰罩底板的自動(dòng)外觀檢查,彩色顯像管陰罩的作用是要確保每種顏色的所有熒光點(diǎn)僅受其相應(yīng)的電子束的轟擊,所以陰罩的制造精度直接關(guān)系到顯像管色彩的準(zhǔn)確度與圖像的鮮明度。陰罩板上精確地開(kāi)有幾十萬(wàn)個(gè)寬0.3mm,長(zhǎng)0.6mm的帶式圖案。,在陰罩的制作過(guò)程中,采用光刻法。首先在鋼板上涂上光致抗蝕劑,將要使用的玻璃底板緊貼于陰罩的原板上曝光,以便使玻璃底板上的圖案轉(zhuǎn)印到陰罩原板上,所以要求玻璃底板圖案尺寸精度高,而且無(wú)缺陷。,圖1037示出了玻璃底板和帶式圖案的缺陷。圖(a)的玻璃底板上有兩張底板圖案。帶式圖案中的缺陷示于圖(b)。由于10m以上的缺損,邊緣突起,內(nèi)部缺陷,多余部分以及帶式圖案的尺寸誤差等均與陰罩質(zhì)量的低劣有關(guān),,所以要對(duì)上述各項(xiàng)進(jìn)行全面檢查,然后予以修正。過(guò)去,上述檢查都是在顯微鏡下用目測(cè)法進(jìn)行,現(xiàn)在可用圖像識(shí)別技術(shù)自動(dòng)檢出缺陷。,檢測(cè)原理如圖1038所示。從玻璃底板背面照明,用物鏡放大底板圖案,然后用光敏陣列器件檢測(cè)。該陣列器件是在縱向排列有128個(gè)大小為25m25m的光敏元件。,玻璃底板在方向上往復(fù)運(yùn)動(dòng),這時(shí),電光源、照明透鏡、物鏡及光電陣列器件組成一個(gè)整體,在y方向上間歇地以一定節(jié)距作進(jìn)給運(yùn)動(dòng),這樣就可全面檢測(cè)底板圖案。,檢查內(nèi)容如下:()測(cè)量圖案寬度、長(zhǎng)度及中心線的偏
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 消防應(yīng)急疏散演練及消防培訓(xùn)方案
- 裝企電銷培訓(xùn)
- 2025國(guó)家電投山西公司招聘1人筆試參考題庫(kù)附帶答案詳解
- 2025南昌市西湖城市建設(shè)投資發(fā)展集團(tuán)有限公司及下屬子公司人才招聘筆試歷年常考點(diǎn)試題專練附帶答案詳解
- 2025云南楚雄市產(chǎn)業(yè)發(fā)展投資集團(tuán)有限公司市場(chǎng)化選聘職業(yè)經(jīng)理人5人筆試參考題庫(kù)附帶答案詳解
- 2025年職業(yè)技能鑒定考試(煙草物流師-二級(jí))歷年參考題庫(kù)含答案詳解
- 2020年11月21日下午中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)》(缺2題)答案及解析 - 詳解版(105題)
- 2026年及未來(lái)5年中國(guó)奶山羊養(yǎng)殖行業(yè)市場(chǎng)全景評(píng)估及投資策略咨詢報(bào)告
- 2026春統(tǒng)編版二年級(jí)下冊(cè)道德與法治第一單元教學(xué)設(shè)計(jì)
- 行車(chē)電工基礎(chǔ)知識(shí)培訓(xùn)
- 湖南省新高考教學(xué)教研聯(lián)盟2026屆高三年級(jí)12月聯(lián)考(長(zhǎng)郡二十校聯(lián)盟)數(shù)學(xué)試卷(含答案)
- 淺析國(guó)有參股企業(yè)股權(quán)管理優(yōu)化方案構(gòu)建與實(shí)施
- 住院患者非計(jì)劃性拔管循證預(yù)防與安全管理體系構(gòu)建
- 后勤工作會(huì)議講話稿
- DB11∕T 1831-2021 裝配式建筑評(píng)價(jià)標(biāo)準(zhǔn)
- 2024-2025學(xué)年度陜西能源職業(yè)技術(shù)學(xué)院?jiǎn)握小堵殬I(yè)適應(yīng)性測(cè)試》考試歷年機(jī)考真題集(易錯(cuò)題)附答案詳解
- 2025-2026學(xué)年度武漢市部分學(xué)校高三年級(jí)九月調(diào)研考試 數(shù)學(xué)試卷(含答案解析)
- 2025年護(hù)士長(zhǎng)競(jìng)聘上崗理論測(cè)試題(附答案)
- 小區(qū)樓道物業(yè)清理方案(3篇)
- 保安機(jī)具管理辦法
- 籃球協(xié)會(huì)各項(xiàng)管理制度
評(píng)論
0/150
提交評(píng)論