版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 參賽隊(duì)號(hào) # 2573第十屆“認(rèn)證杯”數(shù)學(xué)中國數(shù)學(xué)建模網(wǎng)絡(luò)挑戰(zhàn)賽承諾書我們仔細(xì)閱讀了第十屆“認(rèn)證杯”數(shù)學(xué)中國數(shù)學(xué)建模網(wǎng)絡(luò)挑戰(zhàn)賽的競賽規(guī)則。我們完全明白,在競賽開始后參賽隊(duì)員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊(duì)外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問題。我們知道,別人的成果是違反競賽規(guī)則的, 如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。我們鄭重承諾,嚴(yán)格遵守競賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽規(guī)則的行為,我們接受相應(yīng)處理結(jié)果。我們允許數(shù)學(xué)中國網(wǎng)站()公
2、布論文,以供網(wǎng)友之間學(xué)習(xí)交流,數(shù)學(xué)中國網(wǎng)站以非商業(yè)目的的論文交流不需要提前取得我們的同意。 我們的參賽隊(duì)號(hào)為:2573參賽隊(duì)員(簽名) :丁力、劉靜、張峰 隊(duì)員 1:丁力 隊(duì)員 2:劉靜隊(duì)員 3:張峰參賽隊(duì)教練員 (簽名): 姚莉參賽隊(duì)伍組別:本科組 參賽隊(duì)號(hào) # 2573第十屆“認(rèn)證杯”數(shù)學(xué)中國數(shù)學(xué)建模網(wǎng)絡(luò)挑戰(zhàn)賽編 號(hào) 專 用 頁參賽隊(duì)伍的參賽隊(duì)號(hào):(請各個(gè)參賽隊(duì)提前填寫好):2573競賽統(tǒng)一編號(hào)(由競賽組委會(huì)送至評(píng)委團(tuán)前編號(hào)):競賽評(píng)閱編號(hào)(由競賽評(píng)委團(tuán)評(píng)閱前進(jìn)行編號(hào)): 參賽隊(duì)號(hào) # 25732017 年第十屆“認(rèn)證杯”數(shù)學(xué)中國數(shù)學(xué)建模網(wǎng)絡(luò)挑戰(zhàn)賽第一階段論文基于 Daubechies 小
3、波變換和 BP 神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別題目關(guān) 鍵 詞 圖像預(yù)處理; Daubechies 小波變換; K-L 變換; BP 神經(jīng)網(wǎng)絡(luò) 摘要:本文針對同一人在不同年齡段的人臉識(shí)別問題設(shè)計(jì)了行之有效的綜合創(chuàng)新算法模型。它改進(jìn)了傳統(tǒng)的基于幾何特征的人臉識(shí)別方法,結(jié)合人臉的輪廓模型使得人臉檢測的算法得以簡化,并使用 K-L 變換法,在更低的維度提取了人臉圖像的主要特征信息。此算法融合了基于 K-L 變換模型和基于 BP 神經(jīng)網(wǎng)絡(luò)人臉識(shí)別模型,集成了二者的優(yōu)點(diǎn), 提高了人臉識(shí)別算法的準(zhǔn)確率。 針對問題一,對于每個(gè)人在不同年齡段的人臉圖像,由于圖像的背景和人臉的形狀大小等特征差異很大,所以需要先對圖片進(jìn)行預(yù)處
4、理,從而準(zhǔn)確獲得完整清晰的人臉圖像。其中圖像預(yù)處理包含二值化,人臉邊緣檢測,圖像規(guī)范化和濾波去噪過程。經(jīng)過實(shí)驗(yàn)發(fā)現(xiàn),中值濾波在去除椒鹽噪聲方面更加有效,而且能比較好地保留圖像邊緣的銳度和圖像細(xì)節(jié)特征。 針對問題二,由于因年齡變化帶來的變化,特別是人的臉部皺紋將增多,骨骼的尺寸、肌肉的大小等,我們必須要提取在年齡的變化中相對變化較小的特征值,如人的耳朵、嘴巴、鼻子和眼睛間距離比例等不變因素。所以在進(jìn)行識(shí)別前,我們使用 Daubechies 小波變換舍去因年齡變化帶來的噪聲,提取有效的特征值。 針對問題三,對于問題二獲得的圖像,我們采用特征向量變換(K-L 變換),進(jìn)行降維處理,舍去不必要的噪聲,
5、減少數(shù)據(jù)量。對基于 FG-NET 人臉數(shù)據(jù)庫中不同年齡段的人臉圖像進(jìn)行訓(xùn)練獲取平均臉。 針對問題四,通過 BP 神經(jīng)網(wǎng)絡(luò)算法的學(xué)習(xí)訓(xùn)練可智能地調(diào)整算法的全局參數(shù)從而提高人臉識(shí)別的準(zhǔn)確率。另外,BP 神經(jīng)網(wǎng)絡(luò)算法還具有結(jié)構(gòu)簡單、可操作性強(qiáng)、魯棒性和能模擬任意非線性輸入輸出的優(yōu)點(diǎn)。 綜上所述,本文主要采用 Daubechies 小波變換和 BP 神經(jīng)網(wǎng)絡(luò)模型,能夠有效地對不同年齡段的人臉進(jìn)行識(shí)別,算法具有一定的參考價(jià)值,并在其他的圖像識(shí)別上有推廣價(jià)值。 參賽隊(duì)號(hào):2573參賽(由組委會(huì)填寫)所選題目:B題 參賽隊(duì)號(hào) # 2573英要so that the algorithm of the faci
6、al detection is simplified. We use the Karhunen-LoveWe combine the model which is based on Karhunen-Love Transform and Back Propagationthe algorithm.of facial recognition.For the first question, as for the face image of each person in different ages,because ofsize and so on.We need to pre-process th
7、e picture, then we can obtain a complete and clearfacial edge, image normalization and filtering denoising. Experiments show that the medianthe images sharpness and images detail features.For the second question, because the changes caused by the change of age, especially inextract the eigenvalues w
8、hich are relatively small in age changes such as ears,mouth,nosedetermine the eigenvalues before we perform the recognition.For the third question, For the image which is obtained by question 2, we use eigenvectorand reduce the amount of data. The facial images of different age groups in the FG-NET
9、face database are trained to obtain the average face.For the forth question, through the Back Propagation Neural Network algorithm learningaccuracy of face recognition. In addition, Back Propagation Neural Network algorithm alsoany nonlinear input and output。 To sum up, by using Daubechies Wavelet T
10、ransform and Back Propagation Neuralalgorithm has the reference value, and it is worthy to spread on other image recognition.Key words:Image Preprocessing,Daubechies Wavelet Transform,K-L transform,Back-Propagation Artificial Neural NetworkNetwork model, we can effectively operate face recognition o
11、f different ages. And the classichas the advantages of simple structure, strong operability, strong robustness and can simulateand training,we can intelligently adjust the global parameters of the algorithm to improve thetransform (Karhunen-Love Transform) to reduce dimension,discard unimportant com
12、ponentseyes and other invariant factors. So we should use the Daubechies Wavelet Transform tohuman facial wrinkles, the size of bones,the size of the muscles and so on.Then we mustfilter is more effective in removing salt and pepper noise. And it can better retain the edge offacial image. The image
13、preprocessing includes the value of the two images, the detection ofthe great differences between the image background and facial features such as the shape,theNeural Network. This model integrates the advantages of both, and improves the accuracy ofTransform to extract the main feature information
14、of the facial image in the lower dimension.Abstract :This article designs an effective,comprehensive and innovative algorithm forthe recognition of the same persons face in different ages. It improves the traditional methodof facial recognition based on geometric features. It combines the contour mo
15、del of the face 參賽隊(duì)號(hào) # 25731 問題的提出1.1 背景知識(shí) 人臉識(shí)別,是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測和跟蹤人臉,進(jìn)而對檢測到的人臉進(jìn)行臉部的一系列相關(guān)技術(shù),通常也叫做人像識(shí)別、面部識(shí)別。 人臉識(shí)別系統(tǒng)的研究始于 20 世紀(jì) 60 年代,80 年代后隨著計(jì)算機(jī)技術(shù)和光學(xué)成像技術(shù)的發(fā)展得到提高,而真正進(jìn)入初級(jí)的應(yīng)用階段則在 90 年后期,并且以美國、德國和日本的技術(shù)實(shí)現(xiàn)為主;人臉識(shí)別系統(tǒng)成功的關(guān)鍵在于是否擁有尖端的核心算法,并使識(shí)別結(jié)果具有實(shí)用化的識(shí)別率和識(shí)別速度;“人臉識(shí)別系統(tǒng)”集成了
16、人工智能、機(jī)器識(shí)別、機(jī)器學(xué)習(xí)、模型理論、專家系統(tǒng)、視頻圖像處理等多種專業(yè)技術(shù),同時(shí)需結(jié)合中間值處理的理論與實(shí)現(xiàn),是生物特征識(shí)別的最新應(yīng)用,其核心技術(shù)的實(shí)現(xiàn),展現(xiàn)了弱人工智能向強(qiáng)人工智能的轉(zhuǎn)化。1 1.2 問題重述 人的總會(huì)伴隨人的一生,但是對于不同年齡段的同一個(gè)人來說,人臉并不是一成不變的。雖然年輕和年老的面容總有很大的相似性,但年齡跨度對人臉識(shí)別的確有較大的影響。在人工智能時(shí)代我們希望電腦能完成這項(xiàng)判別、分類工作,所以接下來我們需要建立合適的模型來自動(dòng)識(shí)別兩張不同年齡段的照片是不是同一個(gè)人。 如今人臉識(shí)別技術(shù)已經(jīng)發(fā)展了很多優(yōu)化方法,人臉識(shí)別的結(jié)果也令人滿意。然而, 對與不同年齡的人來說,特別
17、是幼兒時(shí)期與成年時(shí)期,對人臉識(shí)別的結(jié)果影響相對較大。我們現(xiàn)在需要設(shè)計(jì)一個(gè)基于識(shí)別不同年齡的人臉識(shí)別模型。 1.3 具體問題 問題 1:設(shè)計(jì)算法對圖片中的人臉進(jìn)行預(yù)處理問題 2:確定并提取人臉的特征值 問題 3:降維并處理數(shù)據(jù)問題 4:確定識(shí)別模型 2 問題分析2.1 對問題的總體分析 針對不同年齡段同一個(gè)人的人臉識(shí)別不能單純的只進(jìn)行空間匹配,這樣得到的效果一定是不準(zhǔn)確的。我們首先對問題進(jìn)行梳理,該問題應(yīng)該劃分為兩大部分:提取人不同年齡面部的共同特征和最佳人臉識(shí)別算法的實(shí)現(xiàn)。而人臉識(shí)別算法的實(shí)現(xiàn)已經(jīng)有很多科學(xué)家進(jìn)行研究了很多年,技術(shù)相對成熟。但是對于不同年齡的人臉識(shí)別研究成果較少, 所以應(yīng)著重思
18、考如何提取人不同年齡面部的共同特征。 2.2 具體問題的分析 2.2.1 對問題 1 的分析 問題 1 的解決需要對給定的照片進(jìn)行預(yù)處理。我們在對問題分析的時(shí)候還需要考慮到背景的變化,其背景的顏色變換對后續(xù)問題中的處理都有很大的影響。所以人臉識(shí)別的第一步就是人臉的檢測及預(yù)處理,其目的就是在輸入圖像中鎖定人臉,并對圖像進(jìn)行有效去噪。 參賽隊(duì)號(hào) # 25732.2.2 對問題 2 的分析 問題 2 是本模型需要重點(diǎn)解決的地方。隨著人年齡的變化,人的臉部皺紋將增多, 骨骼的尺寸、肌肉的大小、人臉的結(jié)構(gòu)將會(huì)發(fā)生顯著改變。所以,我們不能僅僅是采用簡單的兩張人臉進(jìn)行對比。我們必須要提取在年齡的變化中相對變
19、化較小的特征值,如人的耳朵、嘴巴、鼻子和眼睛等不變因素。因此我們需要建立一個(gè)合適的模型,提取出承載衰老皮膚紋理特征的高頻子圖與低通濾波后的低頻子圖,有效的去除了圖像因年齡變化而帶來的噪聲。 2.2.3 對問題 3 的分析 問題 3 主要是針對于問題 2 獲得的圖像,我們需要選擇一種算法對處理后的圖片進(jìn)行降維處理,舍去不必要的噪聲,減少數(shù)據(jù)量。同時(shí),需要得出用于問題 4 中分析處理的輸入值,是對整個(gè)模型兩大部分承上啟下的步驟。 2.2.4 對問題 4 的分析 問題 4 主要是在經(jīng)過以上 3 個(gè)問題的處理后,我們應(yīng)該得到了用于人臉識(shí)別的特征值集合。需要選擇分類器對特征向量進(jìn)行處理得出結(jié)果,因?yàn)槊鎸?/p>
20、的特殊問題,所以選擇的算法必須要具有很好的自適應(yīng)學(xué)習(xí)能力、良好的魯棒性和容錯(cuò)性。 3 模型基本假設(shè)1. 對同一個(gè)人不同年齡照片進(jìn)行比較時(shí),沒有過改變面容的疾病、面部外傷或外科手術(shù)等經(jīng)歷。 2. 用于識(shí)別的兩張照片都是標(biāo)準(zhǔn)位置和標(biāo)準(zhǔn)光線下拍攝的。 3. 用于識(shí)別的圖片中只包含一張人臉。 4. 用于識(shí)別的圖片中露出的人臉占人臉的全面積 70%以上,并且五官?zèng)]有不透明的實(shí)體物體遮擋。 4符號(hào)說明符號(hào) 說明 符號(hào) 說明 (Wf)(j,k) 離散小波變換 H 神經(jīng)網(wǎng)絡(luò)中間層向量 X 神經(jīng)網(wǎng)絡(luò)輸入向量 y 神經(jīng)3 網(wǎng)絡(luò)實(shí)際輸出向量Y 神經(jīng)網(wǎng)絡(luò)輸出量 L 神經(jīng)網(wǎng)絡(luò)中間層單元數(shù) u 正交變換矩陣 e 神經(jīng)網(wǎng)絡(luò)
21、給定精度 S 散布矩陣 E 神經(jīng)網(wǎng)絡(luò)誤差 u i散布矩陣的特征向量 r 圖像的相似系數(shù) 參賽隊(duì)號(hào) # 25735 模型的建立與求解5.1 對問題 1 的分析與求解 5.1.1 對問題 1 的分析 問題 1 要求我們對所給圖像進(jìn)行初步的處理,設(shè)計(jì)算法對圖片中的人臉進(jìn)行識(shí)別。雖然題目中為我們假設(shè)了用于識(shí)別的兩張照片都是標(biāo)準(zhǔn)位置和標(biāo)準(zhǔn)光線下拍攝的條件, 但是我們在對問題分析的時(shí)候還需要考慮到背景的變化,無論是題目中舉例的證件照還是普通的標(biāo)準(zhǔn)照片,其背景的顏色變換對后續(xù)問題中的處理都有很大的影響。所以人臉識(shí)別的第一步就是人臉的檢測及預(yù)處理,其目的就是在輸入圖像中鎖定人臉,并進(jìn)行有效去噪。 5.1.2
22、對問題 1 的求解 首先對圖片進(jìn)行預(yù)處理,本文圖片預(yù)處理主要是基于人臉檢測與人臉特征相結(jié)合的方法,其主要步驟如下: Step1:二值化。由于每個(gè)人的臉部膚色基本一致,且與背景色相差很大。為了將人臉區(qū)域與背景區(qū)域分別開來,便于識(shí)別人臉區(qū)域,要將這些多值圖像轉(zhuǎn)換成只具有黑白兩個(gè)灰度級(jí)的二值圖像。 Step2:人臉邊緣檢測。經(jīng)二值化后的人臉圖像中,數(shù)值為 0 的部分表示背景,數(shù)值為 1 的部分表示人臉。運(yùn)用 Matlab 中的 regionprops 函數(shù)求像素?cái)?shù)值 1 的 8 連通區(qū)域, 構(gòu)建包含像素?cái)?shù)值 0 的最小矩陣,得到人臉的邊緣區(qū)域。 Step3:圖像規(guī)范化。在 Step2 中已求得人臉邊
23、緣矩陣,運(yùn)用 Matlab 函數(shù)求得其中心坐標(biāo),查閱資料得到人臉寬度比例即矩陣大小,將人臉圖像規(guī)范化,如圖 1 所示。相 應(yīng)的MATLAB 程序編寫見附程序 1。(0_1)(0_2)原始圖像 參賽隊(duì)號(hào) # 2573(1_1)(1_2)圖像規(guī)范(2_1)(2_2)規(guī)范結(jié)果 圖 1 圖像規(guī)范化示意圖Step4:中值濾波。中值濾波算法不僅能有效去除圖像噪聲,尤其是對去除椒鹽噪聲更加有效,而且能比較好地保留圖像邊緣的銳度和圖像細(xì)節(jié)特征。中值濾波和其他濾波的對比效果圖如下。相應(yīng)的 MATLAB 程序編寫見附程序 2。 參賽隊(duì)號(hào)#2573圖 2 濾波效果對比圖5.2 對問題 2 的分析與求解 5.2.1
24、對問題 2 的分析 問題 2 中,我們需要利用問題 1 對圖像的處理結(jié)果來提取并確定特征值。眾所周知, 隨著人年齡的變化,人的臉部皺紋將增多,骨骼的尺寸、肌肉的大小、人臉的結(jié)構(gòu)將會(huì)發(fā)生顯著改變。所以,我們不能僅僅是采用簡單的兩張人臉進(jìn)行對比。我們必須要提取在年齡的變化中相對變化較小的特征值,如人的耳朵、嘴巴、鼻子和眼睛等不變因素。因此我們需要建立一個(gè)合適的模型,提取出承載衰老皮膚紋理特征的高頻子圖與低通濾波后的低頻子圖,有效的去除了圖像因年齡變化而帶來的噪聲。 我們針對的是基于不同年齡段的人臉識(shí)別,同一個(gè)人在不同的年齡段中都有很大的變化,比如人的皮膚、發(fā)型和臉的大小等。在對現(xiàn)有的圖像處理方法進(jìn)
25、行綜合比較之后, 我們認(rèn)為 Daubechies 小波變換能很好地符合我們的要求。Daubechies 小波變換可以很好地保持圖像細(xì)節(jié)以及各頻帶的邊緣信息,具有多分辨率的特性,變換后的圖像對提高人臉識(shí)別正確率有很好的貢獻(xiàn)。 5.2.2 對問題 2 的求解 小波變換的基本思想2是用一組小波函數(shù)或者基函數(shù)表示一個(gè)函數(shù)或者信號(hào)。信號(hào)分析一般是為了獲得時(shí)間域和頻率域之間的相互關(guān)系,傅里葉變換提供了有關(guān)頻率域的信息,但時(shí)間方面的局部化信息卻基本丟失。離散小波變換(DWT)的本質(zhì)是信號(hào)的時(shí)間尺度分析方法,相比于其他積分變換如快速傅里葉變換(FFT)等,具有多分辨率分析的特點(diǎn),而且在時(shí)、頻域都具有表征信號(hào)局
26、部特征的能力。圖像經(jīng)過小波變換,其低頻部分保留了絕大部分信息和能量。同時(shí),在圖像的敏感位置(如人臉輪廓線、眼睛 參賽隊(duì)號(hào) # 2573等),經(jīng)小波換變換后生成的特征矢量的模會(huì)相對較大,將這些優(yōu)點(diǎn)應(yīng)用于人臉圖像, 有利于人臉的識(shí)別。 Daubechies 小波是由世界著名的小波分析學(xué)者Inrid Daubechies 構(gòu)造的小波函數(shù)。一般寫成 dbN,N 是小波的階數(shù)。小波(t)和尺度函數(shù)(t)中的支撐區(qū)為 2N-1,(t) 的消失矩為 N。除 N=1 外,dbN 不具有對稱性(即非線性位移)。dbN 沒有明確的表達(dá)式 (除了 N=1 外),但轉(zhuǎn)換函數(shù) h 的平方模是很明確的。3 ,(1)令 P
27、(y)=其 中 ,為 二 項(xiàng) 式 系 數(shù) , 則 有 : 2=(cos2()N)P(sin2() 式 中 ,。(w)=Step1:Daubechies 小波變換階數(shù)對比。每進(jìn)行一次離散小波變換,圖像便被壓縮至原來的四分之一,相比原圖丟失的信息也越多。而進(jìn)行人臉識(shí)別的過程中,必須要一定數(shù)量以上的圖像信息,才能保證對比結(jié)果的正確率。也就是說,離散小波變換的階數(shù)過高,反而會(huì)導(dǎo)致人臉識(shí)別的正確率降低,因?yàn)榇罅康男畔⒛:蚴侨笔沟萌四樖テ淇梢杂脕砗推渌四樳M(jìn)行區(qū)分的特征信息。為此,我們要找到一個(gè)合適的離散小波變換的階數(shù),使變換得到的低頻分量圖既去除了會(huì)對比對結(jié)果產(chǎn)生不利影響的圖像細(xì)節(jié), 又不至于剔除
28、的細(xì)節(jié)過多使剩余的圖像信息不足以支撐臉部識(shí)別。 圖 3 各階小波變換低頻分量圖通過對圖像各階低頻分量圖(圖 3)的比較,我們發(fā)現(xiàn)在進(jìn)行二階離散小波變換后, 圖像在保留原圖人物基本輪廓的同時(shí),能夠通過低通濾波濾掉一些不必要的細(xì)節(jié),用來做人臉識(shí)別效果最好。 參賽隊(duì)號(hào) # 2573Step2:Daubechies 小波變換。我們選擇一張圖像,利用 matlab 軟件對其進(jìn)行 Daubechies 小波變換。對圖像進(jìn)行一階離散 Daubechies小波變換的結(jié)果如圖 4 所示。相應(yīng)的MATLAB 程序編寫見附程序 3。圖 4 對小女孩的圖像進(jìn)行二階 Daubechies小波變換圖 4 中左上角為從原圖
29、中分離出的低頻分量,極大程度地保留了原圖中的基本信息 (低頻輪廓信息),及重要的細(xì)節(jié)信息。右上、右下、左下三幅圖則是從原圖中分離出的高頻分量,分別來自原圖在水平方向、對角線方向、豎直方向上的高頻分量。利用灰度分布圖(圖 5、圖 6)可以更直觀地看出,二階 Daubechies 小波變換后,原圖里頻率相接近的像素點(diǎn)被保留到了同一張分量圖內(nèi)。 參賽隊(duì)號(hào)#2573圖5一階小波變換后低頻分量灰度分布圖 參賽隊(duì)號(hào) # 2573圖 6 二階小波變換后高頻分量灰度分布圖通過對比二階小波變換后高頻分量灰度分布圖可知,高頻水平分量灰度三維分布圖所包含的有效信息最全面,而高頻垂直分量灰度三維分布圖所包含的細(xì)節(jié)量最
30、豐富。我們可以通過高頻水平分量灰度三維分布圖明顯發(fā)現(xiàn)人的眼睛、耳朵、鼻子和嘴所在的位置。我們將這些受年齡影響小的特征值提取出來用于對不同年齡段同一個(gè)人的圖像匹配比較。 Step3:驗(yàn)證效果。為了檢驗(yàn)離散小波變換對原圖所包含有效信息的提取效果,我們對離散小波變換之后的圖像進(jìn)行了反變換(IDWT),得到的復(fù)原圖如圖 7 所示。 圖 6 小女孩人物圖像原圖圖 7 小波反變換復(fù)原圖人工將復(fù)原圖(圖 7)與原圖(圖 6)進(jìn)行比較,我們認(rèn)為進(jìn)行離散小波變換后的圖像很好地提取保留了原圖的信息。通過這一系列的變換與復(fù)原圖像反向比較,我們從 參賽隊(duì)號(hào) # 2573實(shí)證的角度證實(shí)了離散小波變換在圖片處理方面有很好
31、的表現(xiàn)??s小了圖片的大小,但是又很大程度上保留了原圖像的有效信息(體現(xiàn)在終可以對圖像進(jìn)行反變換得到極其近似原圖的復(fù)原圖)。剔除高頻分量后的圖像保留了原圖的特征,且其輪廓清晰程度令人滿意。 Step4:確定特征值關(guān)系。我們在 Step2 中有效的去除了圖像因年齡變化而帶來的噪聲,并得到連一系列的特征值。我們現(xiàn)在確定特征值間的關(guān)系,對于耳朵到眼睛的距離占雙耳間的距離的比值與雙眼之間的距離占雙耳間的距離的比值,隨著年齡的增長其變化較小,可以用做圖像匹配的比較依據(jù)。 經(jīng)過二階小波變換后,人眼部基本成灰黑色,相對面部其他輪廓灰度明顯較小,因此我們可以通過對人臉圖像進(jìn)行逐行掃描,檢測出來兩個(gè)靠的非常近的負(fù)
32、脈沖信號(hào)即為人眼所在處。首先要檢測輪廓邊界,我們發(fā)現(xiàn)閾值 L p 超過 400 即可當(dāng)做人臉,而在這中間小于 400 就可以當(dāng)做眼睛。為此我們設(shè)計(jì)了針對眼睛定位的濾波器,這個(gè)濾波器可以檢測出在一個(gè)超過 L p 的信號(hào)中間,突然出現(xiàn)兩個(gè)靠近的小于 L p 的負(fù)脈沖的波形。檢測眼睛的時(shí)候,我們發(fā)現(xiàn)眼部灰度突變較大,因此也采用了對于高頻分量的檢 p 小于 25時(shí)便可看成眼部的突變,它的檢測方法。使用高頻分量時(shí),我們確定閾值 H 測原理和基于低頻分量原理基本一樣。 圖 8 人眼所在行信號(hào)波形圖5.3 對問題 3 的分析與求解 5.3.1 對問題 3 的分析 問題 3 是在問題 2 的基礎(chǔ)上,為了解決問
33、題 2 所得結(jié)果圖片仍然太大,不便于計(jì)算處理,因此我們先對圖像進(jìn)行降維的處理。問題 3 也是承上啟下的重要一環(huán),承接處理 對圖片的特征值的處理,開啟神經(jīng)網(wǎng)絡(luò)的輸入。為此我們采用特征向量變換(K-L 變換),進(jìn)行降維處理,舍去不重要的分量。 參賽隊(duì)號(hào) # 25735.3.2 對問題 3 的求解 K-L 變換理論知識(shí)45。K-L 變換能夠考慮到不同的分類信息,實(shí)現(xiàn)有監(jiān)督的特征提取。 根據(jù)隨機(jī)過程中的 KL 展開理論,將隨機(jī)過程描述為無數(shù)個(gè)正交函數(shù)的線性組合,而在模式識(shí)別問題中,通??梢詫⒁粋€(gè)樣本看成是隨機(jī)向量的某一次實(shí)現(xiàn)結(jié)果,所以假設(shè)有一 d 維隨機(jī)向量 x,可以寫成一組正交基 的線性組合,且它們
34、的模為 1:(2)對上式變形得到:(3)而現(xiàn)在,假設(shè)有用信息就集中在其中的 q 維上,那么現(xiàn)在我們來嘗試用著 q 維去近似 x (經(jīng)過問題 3 的討論可以得出有用信息的維度): 近似前后樣本向量的差向量為:考查上述差向量的均方誤差(MSE)為:(4)經(jīng)過求導(dǎo)最小化可得結(jié)果 參賽隊(duì)號(hào) # 2573(5)是原樣本向量 x 的二階矩陣(注意,這里還可以是其他矩陣,其中,變換矩陣如協(xié)方差矩陣)。 Step1:選定基于年齡的人臉數(shù)據(jù)庫。由于我們需要識(shí)別的是不同年齡人臉識(shí)別,所以我們選取基于年齡段的 FG-NET 數(shù)據(jù)庫, Step2:整合數(shù)據(jù)。根據(jù)基于年齡段的 FG-NET 數(shù)據(jù)庫,輸入用于訓(xùn)練集合人臉
35、照片,如圖 9 所示。 圖 9 部分訓(xùn)練集合人臉照片Step3:設(shè)計(jì)模型算法。根據(jù) KL 變換的相關(guān)理論 ,我們設(shè)計(jì)的相關(guān)的降維算法。首先我們根據(jù)數(shù)據(jù)庫中所有的人臉圖像向量,建立了平均臉向量。 (6)我們將平均臉向量還原成圖像進(jìn)行觀察,發(fā)現(xiàn)它具有人臉的一般性基本特征(如圖10 所示),例如臉的輪廓、嘴巴、鼻子和眼睛,這也充分符合了我們在問題 2 中對圖像的處理結(jié)果,既去除了隨著人年齡的變化,人的臉部皺紋將增多,骨骼的尺寸、肌肉的大小等帶來的噪聲,為接下來計(jì)算協(xié)方差的總體散布矩陣奠定了基礎(chǔ)。 參賽隊(duì)號(hào) # 2573圖 10 平均臉向量還原圖像使用 matlab 中 eig 函數(shù)計(jì)算出每一個(gè)特征值
36、和特征向量。將其中最大的四十個(gè)特征值對應(yīng)的特征向量取出來作為主要的比較指標(biāo),把這四十個(gè)特征向量構(gòu)成的矩陣 u , 作為正交變換矩陣,即 BP 神經(jīng)網(wǎng)絡(luò)的輸入。5.4 對問題 4 的分析與求解 5.4.1 對問題 4 的分析 在經(jīng)過以上 3 個(gè)問題的處理后,我們得到了四十個(gè)特征向量構(gòu)成的矩陣?,F(xiàn)在需要選擇分類器對特征向量進(jìn)行處理得出結(jié)果,我們選擇 BP 神經(jīng)網(wǎng)絡(luò)作為分類器,BP 神經(jīng)網(wǎng)絡(luò)具有很好的自適應(yīng)學(xué)習(xí)能力,優(yōu)越的分類特性,以及良好的魯棒性和容錯(cuò)性。 將小波變換系數(shù)作為特征向量輸入 BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識(shí)別。 5.4.2 對問題 4 的求解 BP 神經(jīng)網(wǎng)絡(luò)理論知識(shí)67。BP 神經(jīng)網(wǎng)絡(luò)算法的
37、基本思想是,學(xué)習(xí)過程由信號(hào)的正向傳播與誤差的反向傳播兩個(gè)過程組成。正向傳播時(shí),輸入樣本從輸入層傳入,經(jīng)各隱含層逐層處理后,傳向輸出層。若輸出層的實(shí)際輸出與期望的輸出不符,則傳入誤差的反向傳播階段。誤差反傳是將輸出誤差以某種形式通過隱層向輸入層逐層反傳、并將誤差分?jǐn)偨o各層的所有單元,從而獲得各層單元的誤差信號(hào),此誤差信號(hào)即作為修正各單元權(quán)值的依據(jù)。這種信號(hào)正向傳播與誤差反向傳播的各層權(quán)值調(diào)整過程,是周而復(fù)始地進(jìn)行的。 權(quán)值不斷調(diào)整的過程,也就是網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練過程。此過程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差減少到可接受的程度,或進(jìn)行到預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止。結(jié)構(gòu)如圖 11 所示。 參賽隊(duì)號(hào) # 2573圖 1
38、1 三層 BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)標(biāo)準(zhǔn) BP 神經(jīng)網(wǎng)絡(luò)分 3 層,即輸入層 ,隱含層和輸出層。本算法采用的 BP 網(wǎng)絡(luò)輸出層節(jié)點(diǎn)數(shù)為 40。網(wǎng)絡(luò)的輸入層節(jié)點(diǎn)數(shù)和隱含層節(jié)點(diǎn)數(shù)將由離散小波變換和具體分析決定。實(shí)驗(yàn)中隱含層與輸出層的激勵(lì)函數(shù)分別選擇為 Sigmoid 對數(shù)函數(shù): (7)和線性函數(shù):(8)在結(jié)合本實(shí)驗(yàn)中前三個(gè)問題處理得到的數(shù)據(jù)后,我們采用的 BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法來訓(xùn)練,程序主要的流程圖如下圖 12 所示。 參賽隊(duì)號(hào)#2573圖 12 BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法流程圖在每次實(shí)驗(yàn)中,基于 FG-NE 人臉庫中的圖片處理結(jié)果得到數(shù)據(jù)集,訓(xùn)練時(shí)的輸入為樣本 / 目標(biāo)輸出組合 X i ,Y i ,i=1
39、,N, N 為訓(xùn)練樣本數(shù)。對于每個(gè)訓(xùn)練樣本, 目標(biāo)輸出對應(yīng)為 1 ,其余為 0。識(shí)別時(shí),輸出的最大值對應(yīng)目標(biāo)被認(rèn)為是網(wǎng)絡(luò)識(shí)別出的目標(biāo)。相應(yīng)的 MATLAB 程序編寫見附程序 5。 在算法模型建立后,經(jīng)過 FG-NE 人臉庫中的圖片簡單訓(xùn)練后的 BP 神經(jīng)網(wǎng)絡(luò)已經(jīng)具備來初步的基于跨年齡段的人臉識(shí)別,我們在最后采用了輸入一張隨機(jī)的 FG-NE 人臉庫中的圖片,經(jīng)過前三步的處理來進(jìn)行人臉匹配識(shí)別。運(yùn)行過程如下圖 13 所示。 參賽隊(duì)號(hào)#2573圖 13 輸入待檢測圖像首先采用此種自動(dòng)匹配識(shí)別,用于檢驗(yàn)整體模型的完備性。通過輸入一張隨機(jī)的FG-NE 人臉庫中的圖片經(jīng)過完整的模型處理,在 FG-NE 人
40、臉庫中匹配三張相似率最高的圖片并輸出。輸出結(jié)果如下圖 14 所示。 圖 14 匹配結(jié)果 參賽隊(duì)號(hào)#2573圖 15 匹配結(jié)果識(shí)別率通過觀察結(jié)果發(fā)現(xiàn),該算法不僅成功匹配到該男子成年的圖片,同時(shí)還匹配到了年幼時(shí)期的圖片。該實(shí)驗(yàn)結(jié)果說明了本模型整體具備完備性,初步完成了不同年齡段的人臉識(shí)別。 6 模型的分析與改進(jìn)6.1 模型分析 通過反復(fù)實(shí)驗(yàn),模型搜索的正確率大概在 70%左右,而出現(xiàn)誤差時(shí),也可以把相似的一類人臉識(shí)別出來,但在這些相似的人臉中,基本都有要檢索的人。這是由于網(wǎng)絡(luò)的訓(xùn)練度不夠和某些人只有一張圖的結(jié)果。例如識(shí)別伊麗莎白的圖像時(shí),由于她長期戴著黑色帽子,便把她識(shí)別為了一個(gè)黑人。進(jìn)行檢驗(yàn)的時(shí)
41、候,我們發(fā)現(xiàn)亞洲人和歐美人有著顯著的差異,因此我們的模型不僅可以用于人物的檢索,還可以用于人種的鑒定。 通過對 FG-NE 人臉庫的實(shí)驗(yàn)證明,該算法具有計(jì)算量小、運(yùn)算速度快、較好的識(shí)別性能和較高的識(shí)別率的優(yōu)點(diǎn)。 6.2 模型改進(jìn) 由于 BP 神經(jīng)網(wǎng)絡(luò)存在收斂速度慢,局部極小和平臺(tái)問題,泛化能力差,初值選取缺乏指導(dǎo)等缺點(diǎn),因此模型改進(jìn)的方向是訓(xùn)練出能夠?qū)崿F(xiàn)自適應(yīng)特征值閾值調(diào)整的數(shù)學(xué)模型和設(shè)計(jì)年齡容錯(cuò)率更高的 BP 神經(jīng)網(wǎng)絡(luò)分類模型。 我們可以通過對其修正學(xué)習(xí)率、添加動(dòng)量項(xiàng)、改進(jìn)激勵(lì)函數(shù)、修正權(quán)值、改進(jìn)誤差函數(shù)等方法,對學(xué)習(xí)算法進(jìn)行改進(jìn)。也可以通過改變其神經(jīng)元節(jié)點(diǎn)互聯(lián)方式、隱含層層數(shù)選擇、改變各層
42、節(jié)點(diǎn)數(shù)、設(shè)置初始參數(shù)等方法,對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化。為克服遺忘現(xiàn) 參賽隊(duì)號(hào) # 2573象,運(yùn)用成批法、跳躍學(xué)習(xí)法和再學(xué)習(xí)策略來調(diào)整其連接權(quán)值、避免重復(fù)學(xué)習(xí)和解決局部最小問題。最終達(dá)到對 BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式進(jìn)行優(yōu)化。 7 模型的評(píng)價(jià)7.1 模型評(píng)價(jià) 7.1.1 模型的優(yōu)點(diǎn) (1) 利用二階離散小波變換,將圖像縮小、去除干擾細(xì)節(jié)、保留有效信息。 (2) 使用 BP 神經(jīng)網(wǎng)絡(luò),對人臉圖像樣本進(jìn)行機(jī)器學(xué)習(xí)。BP 神經(jīng)網(wǎng)絡(luò)對誤差的處理有很好的效果,在利用神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)領(lǐng)域當(dāng)中已經(jīng)是目前最優(yōu)。 (3) 采用 KL 變換對圖像進(jìn)行降維,使之更適應(yīng)后續(xù)學(xué)習(xí)時(shí)要求,不至于因數(shù)據(jù)量太大而讓程序運(yùn)行的時(shí)間變得
43、難以忍耐。 (4) 建立人臉數(shù)據(jù)庫,對圖像進(jìn)行有結(jié)構(gòu)的安放,縮短了圖像處理、樣本學(xué)習(xí)需要的時(shí)間。 7.1.2 模型的缺點(diǎn) (1) 本模型的人臉識(shí)別正確率依賴于人臉圖像的樣本量,當(dāng)樣本量過小時(shí)學(xué)習(xí)模型的效果會(huì)非常差,甚至使人臉識(shí)別正確率低于未進(jìn)行學(xué)習(xí)直接對變換后的圖像進(jìn)行對比的識(shí)別正確率。 (2) 對特征值閾值的選取沒有提出有效的判據(jù)準(zhǔn)則。對于不同的訓(xùn)練集樣本的數(shù)目使用該閾值最終進(jìn)行人臉圖像識(shí)別效果不總是很理想,說明閾值需要根據(jù)不同的情況來進(jìn)行調(diào)整使得人臉圖像識(shí)別總是能達(dá)到盡可能好的效果。 (3) 本模型在 matlab 軟件上進(jìn)行編譯,由于 matlab 的性能限制及模型自身的復(fù)雜度,每一次進(jìn)
44、行人臉識(shí)別時(shí)的耗時(shí)都較長。 參考文獻(xiàn)1 StanZ.LiHandbook of face recognition: LibraryofCongressCataloging-in-PublicationData,2004052453 2 COHEN Leon .Time-frequency analysis: theory and application M. S .l.:Prentice Hall , 1995. 3 HUANG.N.E , SHEN.Z, LONG.S.R. The empirical mode decomposition and Hilbert spectrum for n
45、on-linear and non-stationary time series analysis J .Proc .Roy .Soc ., 1998,454(17):903-905 4 徐奔,基于 DWT 和 BP 神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法,電腦知識(shí)與技術(shù),2009, 23:6520-6522,2009. 5 Abhijit S Pandya, Robert B Macy 著,徐勇,荊濤等譯. 神經(jīng)網(wǎng)絡(luò)模式識(shí)別及其實(shí)現(xiàn). 北京:電子工業(yè). 1999. 6 Taigman Y, Yang M, Ranzato M A, et al. Deepface: Closing the gap to hu
46、man-levelperformance in face verificationC/Proceedings of the IEEE Conference on Computer Visionand Pattern Recognition. 2013: 1701-1708. 7 Fan H, Cao Z, Jiang Y, et al. Learning deep face representationJ. arXiv preprintarXiv:1403.2802, 2014. 參賽隊(duì)號(hào) # 2573附程序附程序 1 clc;close all;clear all; %B=imread(D:
47、003.jpg); B=imread(D:004.jpg); if ndims(B)= 2 %如果不是二值圖像IM=rgb2gray(B); else IM = B; end bw = im2bw(IM, graythresh(IM); % 二值化m, rown = size(bw); = floor(m/10); % 分成 10 大塊,行wide = floor(n/10); % 分成 10 大塊,列a1 = 1; a2 = row; % 對應(yīng)行初始化 row*wide; % 塊面積s = forfor j = 1:10 if (b2=9*wide) | (a1=1 | a2=row*10)
48、 loc = find(bw(a1:a2, b1:b2)=0); p, q = size(loc); pr = p/s*100; % pr fa & 1.5(Ar(z, 3)/Ar(z, 4)1.9 參賽隊(duì)號(hào) # 2573fa = area;h = z;end end h2=axes(Position,0.7 0.50 0.19 0.45); %subplot(2,3,3); imshow(B); rectangle(Position, Ar(h,1),Ar(h,2),Ar(h,3),Ar(h,4), EdgeColor, y, LineWidth, 1); 附程序 2 clc; clear
49、all; img=rgb2gray(imread(D:004.jpg); figure; imshow(img);title( 原 圖 ); img_noise=double(imnoise(img,salt & pepper,0.06); %figure,imshow(img_noise,);title(加椒鹽噪聲圖); img_mean=imfilter(img_noise,fspecial(average,5); %figure;imshow(img_mean,);title(算數(shù)均值濾波結(jié)果); %img_mean1=exp(imfilter(log(img_noise),fspeci
50、al(average,5); %figure;imshow(img_mean1,);title(幾何均值濾波結(jié)果); %Q=-1.5; %img_mean2=imfilter(img_noise.(Q+1),fspecial(average,5)./imfilter(im g_noise.Q,fspecial(average,5); %figure;imshow(img_mean2,);title(逆諧波濾波結(jié)果); img_median=medfilt2(img_noise); %figure;imshow(img_median,);title(中值濾波結(jié)果); img_mean3=wien
51、er2(img_noise,5,5); %figure;imshow(img_mean3,);title(維納濾波結(jié)果); figure; subplot(2,2,1),imshow(img_noise,),title(含椒鹽噪聲圖); subplot(2,2,2),imshow(img_mean,),title(均值濾波結(jié)果); subplot(2,2,3),imshow(img_median,),title(中值濾波結(jié)果); subplot(2,2,4),imshow(img_mean3,),title(維納濾波結(jié)果); 附程序 3 %load woman; X=imread(D:003.
52、jpg); X=rgb2gray(X); figure(1); imshow(X);title(原圖); nbcol = size(map,1);%返回矩陣的行數(shù)和列數(shù)cA1,cH1,cV1,cD1 = dwt2(X,db1); 參賽隊(duì)號(hào) # 2573cod_x=wcodemat(X,nbcol);%返回矩陣 X 的編碼矩陣,nbcol 為編碼的最大值cod_cA1=wcodemat(cA1,nbcol); cod_cH1=wcodemat(cH1,nbcol); cod_cV1=wcodemat(cV1,nbcol); cod_cD1=wcodemat(cD1,nbcol); dec2d=c
53、od_cA1,cod_cH1;cod_cV1,cod_cD1; X0=idwt2(cA1,cH1,cV1,cD1,db1,size(X); figure(2); subplot(1,2,1),imshow(cod_x,); title(量化后的圖像); subplot(1,2,2), imshow(dec2d,); title(二維離散小波分解后的圖像); figure(3); imshow(X0,);title(二維離散小波分解重構(gòu)的圖像); 附程序 4 function meigenface() clear all; clc; close all; imset=; M=200;%訓(xùn)練集合中
54、人臉照片的數(shù)目figure(1); for i=1:M %filename=D:rawdatayale新建文件夾s num2str(i)%im=imread(filename,BMP); filename=D:rawdatayalefgs num2str(i) .JPG; im=imread(filename,jpg); .bmp;%im=im(:,:,2); % im=im(:,:,3); imheight imwidth=size(im); %將圖像矩陣按列拉伸為列向量 imv=reshape(im,imheight*imwidth,1); %將 im 中數(shù)據(jù)轉(zhuǎn)化為 imheight*imwidth高的列向量 imset=imset imv; % 將每個(gè)圖像的像素占據(jù)一列位置,共 20 列向量if i=4 title(訓(xùn)練集合人臉照片,fontsize,18) end subplot(5,4,i);
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 賈科梅蒂課件
- 2026年房地產(chǎn)法律風(fēng)險(xiǎn)的行業(yè)標(biāo)準(zhǔn)與監(jiān)測機(jī)制
- 2026春招:行政主管面試題及答案
- 2026年直流配電系統(tǒng)在建筑中的應(yīng)用
- 2026春招:五糧液試題及答案
- 貨運(yùn)安全培訓(xùn)計(jì)劃大綱課件
- 互聯(lián)網(wǎng)醫(yī)療支付解決方案
- 醫(yī)療衛(wèi)生事業(yè)發(fā)展與展望
- 2026年海南體育職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試備考題庫有答案解析
- 2026年漢中職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試參考題庫有答案解析
- 2024-2025學(xué)年云南省玉溪市八年級(jí)(上)期末英語試卷(含答案無聽力原文及音頻)
- 《贏在責(zé)任心,勝在執(zhí)行力》心得體會(huì)
- 涼山州 2024 年教師綜合業(yè)務(wù)素質(zhì)測試試卷初中物理
- 他汀不耐受的臨床診斷與處理中國專家共識(shí)(2024)解讀課件
- 學(xué)校石材工程投標(biāo)書
- 宿舍樓建筑工程施工組織設(shè)計(jì)方案
- 低壓電工證題庫低壓電工證考試題
- GB 5009.11-2024食品安全國家標(biāo)準(zhǔn)食品中總砷及無機(jī)砷的測定
- 全面風(fēng)險(xiǎn)清單-采購與業(yè)務(wù)外包管理風(fēng)險(xiǎn)(2023年11月-雷澤佳編制)
- copepe低熔點(diǎn)皮芯型復(fù)合短纖維生產(chǎn)工藝的開發(fā)
- 管理學(xué)-李彥斌
評(píng)論
0/150
提交評(píng)論