【《基于深度學習網(wǎng)絡的人臉識別算法實驗分析案例》3500字】_第1頁
【《基于深度學習網(wǎng)絡的人臉識別算法實驗分析案例》3500字】_第2頁
【《基于深度學習網(wǎng)絡的人臉識別算法實驗分析案例》3500字】_第3頁
【《基于深度學習網(wǎng)絡的人臉識別算法實驗分析案例》3500字】_第4頁
【《基于深度學習網(wǎng)絡的人臉識別算法實驗分析案例》3500字】_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于深度學習網(wǎng)絡的人臉識別算法實驗分析案例目錄TOC\o"1-3"\h\u27038基于深度學習網(wǎng)絡的人臉識別算法實驗分析案例 188901基于深度殘差網(wǎng)絡的人臉識別 1171961.1問題描述與分析 1318591.2基于深度殘差網(wǎng)絡的人臉識別算法 2181701.2.1Resnet50網(wǎng)絡結構 2291201.2.2殘差結構 3189581.2.3mini-batch梯度下降法 541431.3本章小結 514992實驗與結果分析 6279362.1實驗設計 6156572.1.1實驗環(huán)境 6244352.1.2實驗內容 655212.2實驗結果 7245052.3分析與結論 101基于深度殘差網(wǎng)絡的人臉識別1.1問題描述與分析目前基于深度學習的人臉識別算法研究中,使用的卷積神經(jīng)網(wǎng)絡絕大多數(shù)都是應用于圖像分類問題的通用網(wǎng)絡。比如牛津大學視覺幾何小組提出的VGGFace[26],就是在VGGNet網(wǎng)絡模型的基礎上進行了改進。深度殘差網(wǎng)絡(Deepresidualnetwork,ResNet)[27]的提出是CNN圖像史上的一個里程碑式的事件,刷新了CNN在ImageNet上的歷史,ResNet的作者何凱明也因此摘得了CVPR2016最佳論文獎。ResNet網(wǎng)絡是在VGG19的基礎上進行修改,通過引入殘差單元來解決了網(wǎng)絡退化的問題。對比傳統(tǒng)的VGG網(wǎng)絡,Resnet網(wǎng)絡模型的復雜度得到了降低,所需要的參數(shù)量也得到減少,在網(wǎng)絡加深的情況下避免了梯度消失現(xiàn)象的出現(xiàn)。由于使用了更深的網(wǎng)絡,從而使圖像分類的準確度得到了較大提高。在本章中主要介紹了基于深度殘差網(wǎng)絡Resnet50的人臉識別算法及其相關知識。1.2基于深度殘差網(wǎng)絡的人臉識別算法1.2.1Resnet50網(wǎng)絡結構圖3-1深度殘差網(wǎng)絡Resnet50的網(wǎng)絡結構 Resnet50的網(wǎng)絡結構如圖3-1所示。整個網(wǎng)絡首先對輸入做了一個卷積操作,在這里由一個7*7的卷積核來負責進行特征的提取,卷積核的步長為2,使得圖像的長寬降低為原先的1/2。隨后,再經(jīng)過一個最大池化層,進一步降低了圖像的分辨率。之后包含4個殘差塊(ResidualBlock),最后進行全連接操作以便于進行分類任務。在使用重復的殘差塊提取特征時,每個輸入的特征圖的長和寬都變?yōu)橐话?,通道?shù)變?yōu)閮杀?。每個殘差塊包括一個下采樣塊和兩個殘差結構,下采樣的步長設為2。而在殘差塊中,通過對卷積相關參數(shù)的設置,可以控制使得殘差塊的輸入和輸出的特征圖尺寸一致,從而進行相加處理,避免了深層網(wǎng)絡的梯度消失和退化問題。 圖3-2為一個簡要的resnet50模型。圖3-2Resnet50模型1.2.2殘差結構 殘差結構,是將前面某一層數(shù)據(jù)的輸出直接跳過多層,引入到后面數(shù)據(jù)層的輸入部分,這意味著后面的特征層的內容會有一部分由其前面的某一層線性貢獻,即做了一次恒等映射,實際上類似于電路問題中的短路,其結構如下圖3-3所示。圖3-3一個簡單的殘差模塊對于殘差模塊,當輸入和輸出的維度相同時,可以直接將其加到輸出上構成一個恒等映射,如圖3-4所示。但會有輸入輸出維度不等的情況,此時需要通過卷積操作來讓二者維度變得相同,如圖3-5所示。圖3-4輸入輸出維度一致的殘差單元圖3-5輸入輸出維度不一致的殘差單元通常情況下采用1x1的卷積來調整通道數(shù),但也會因此增加網(wǎng)絡參數(shù)的數(shù)量從而增加計算量,或者填充padding增加維度,將剩余部分補為0。有了這條短路的跳躍連接線時,就可以無損的傳播梯度,當網(wǎng)絡層次很深,導致梯度消失時,f(x)=0,那么y=g(x)=relu(x)=x。可以看到我們在網(wǎng)絡上堆疊這樣的殘差結構,就算發(fā)生梯度消失,至少也做了一個恒等映射,相當于在淺層網(wǎng)絡上去堆疊“復制層”,這樣至少不會產生更差的結果。傳統(tǒng)的神經(jīng)網(wǎng)絡某一層的輸出只能作為下一層輸入,而使用這種“短路”結構的殘差網(wǎng)絡,使得當前層的輸出可以直接作為后面某一層或某幾層的輸入,因此網(wǎng)絡變得更加復雜,模型也能夠學習到更多的特征。1.2.3mini-batch梯度下降法梯度下降解決的是無約束條件下的最優(yōu)化問題,與之相對應的是有約束條件下的最優(yōu)化問題。無約束最優(yōu)化問題的一般形式為:min(f(x))。其中f:Rn→R1。這一問題是指在Rn中尋找一點x?,使得對于?x∈Rn,都與f(x?)≤f(x)。此點x?就是全局最優(yōu)解。梯度下降法是多元函數(shù)求極值最早的方法。梯度下降法簡單直觀,但采用的是全部樣本的梯度平均值來更新梯度,所以收斂速度比較緩慢。之所以收斂速度慢是由于梯度下降會出現(xiàn)鋸齒現(xiàn)象,同時梯度下降法會陷入鞍點,從而只得到一個局部最優(yōu)解。隨機梯度下降法(stochasticgradientdescent,SGD),是指對梯度進行更新時,每次只在數(shù)據(jù)分布中隨機抽取1個樣本。雖然每次迭代后得到的損失函數(shù)并不全是向著全局最優(yōu)方向的,但整體方向上是一致的,最終得到的結果也在全局最優(yōu)解的附近,使用這樣的方法可以使網(wǎng)絡更快的收斂。隨機梯度下降法有非常多的優(yōu)良性質.它能夠自動逃離鞍點,自動逃離比較差的局部最優(yōu)點,而且最后找到的點具有很強的一般性。一個折中的方法是在每次更新時用m個樣本,通過計算他們梯度的平均值來更新梯度,即通過每次取一個batch_size大小的樣本來更新梯度,也就是mini-batch梯度下降法。1.3本章小結 本章主要介紹了實驗中所使用的深度殘差網(wǎng)絡Resnet50,對網(wǎng)絡的結構進行了分析,介紹了殘差結構在網(wǎng)絡中起到的作用,同時簡要介紹了所使用的mini-batch梯度下降法。

2實驗與結果分析2.1實驗設計2.1.1實驗環(huán)境 實驗內容在MATLAB環(huán)境下完成,主要軟硬件環(huán)境如下表4-1所示。表4-1實驗的軟硬件環(huán)境配置名稱配置說明CPUInter(R)Core(TM)i7-7500CPU@2.70Hz2.90HzGPUNVIDIAGeForce940MX操作系統(tǒng)Windows1064位實驗環(huán)境MATLABR2019b2.1.2實驗內容在本章的實驗中,我們使用了MATLAB自帶的深度學習工具箱,將預訓練好的Resnet50網(wǎng)絡模型加載進來。將原始的人臉數(shù)據(jù)集按7:3劃分為訓練數(shù)據(jù)集與測試數(shù)據(jù)集,加載預訓練好的Resnet50網(wǎng)絡模型,通過將網(wǎng)絡前十層的學習率設置為0以達到凍結網(wǎng)絡的初始權重的目的,對網(wǎng)絡最后的全連接層進行修改使之符合需要,重新連接網(wǎng)絡并進行網(wǎng)絡訓練。通過對數(shù)據(jù)集中圖像在水平方向翻轉,平移和縮放等處理來進行數(shù)據(jù)增強,減少在訓練過程中出現(xiàn)過擬合的概率。在訓練過程中根據(jù)訓練效果調整參數(shù),以期達到一個較好的學習效果。最后在測試集驗證圖像及預測的標簽的識別準確率。實驗通過將前期獲取的人臉數(shù)據(jù)集輸入到網(wǎng)絡模型中進行訓練,實現(xiàn)了簡單的人臉識別,驗證了實驗的有效性。通過對實驗結果進行分析比對,模型在自采集的人臉數(shù)據(jù)庫上有較為良好的人臉識別表現(xiàn),其準確率達到了99.37%,在其他幾個人臉數(shù)據(jù)集上,如ORL人臉數(shù)據(jù)集和CASIA-Webface人臉數(shù)據(jù)集等進行訓練,也分別取得了95.00%和86.44%識別準確率。2.2實驗結果 首先在自己創(chuàng)建的自采集人臉數(shù)據(jù)集上進行測試,其中包含5個人臉,500張左右的人臉圖像樣本,構建了一個小的數(shù)據(jù)集。獲取訓練數(shù)據(jù)后,調用網(wǎng)絡進行訓練,輸入為500張帶標簽的圖片集,按7:3隨機劃分為訓練集以及測試集,指定訓練輪數(shù)和小批量大小,每輪計算一次驗證其準確度,最終結果可以達到一個較高的識別準確率,達到了99.37%,如圖4-1和圖4-2所示。圖4-1在自采集人臉數(shù)據(jù)集上的識別準確度曲線圖4-2在自采集人臉數(shù)據(jù)集上的損失函數(shù)曲線 考慮到用攝像頭自采集的人臉數(shù)據(jù)集存在著諸多不足之處,不能完全反應出網(wǎng)絡模型識別準確率的普遍性,實驗后續(xù)采用了幾個公開人臉數(shù)據(jù)集進行測試。LFW人臉數(shù)據(jù)集是人臉識別領域中較為常用的一個數(shù)據(jù)集,它是由美國馬薩諸塞州立大學阿默斯特分校計算機視覺實驗室整理完成的一個人臉數(shù)據(jù)庫,主要用于研究非受限情況下的人臉識別問題。由于其中的人臉圖片均來源于生活當中的自然場景,由于光照、表情、多姿態(tài)等因素影響,識別難度會增大[28]。LFW數(shù)據(jù)集共有13233張人臉圖像,每張圖像均給出對應的人名,一共5749人,絕大部分人只有一張圖片。將數(shù)據(jù)集替換為LFW人臉數(shù)據(jù)集,重新對網(wǎng)絡進行訓練。在訓練完成后,得到的效果并不是很理想,只有46.59%的準確率,如圖4-3和圖4-4所示。分析原因是因為LFW人臉數(shù)據(jù)集中大部分人臉只有一個樣本,因而識別的準確率不高。為提高識別準確率,需要對該數(shù)據(jù)集進行處理,剔除樣本過少的人臉圖像,保留具有較多樣本的人臉圖像,才能作為數(shù)據(jù)集使用,為此我們選擇使用人臉圖像樣本分布更均勻的數(shù)據(jù)集。圖4-3在LFW數(shù)據(jù)集上的識別準確度曲線圖4-4在LFW數(shù)據(jù)集上的損失函數(shù)曲線ORL人臉數(shù)據(jù)集中有40個不同主體的共計400張人臉圖像,其中每個人臉主體有十個人臉樣本,樣本分布較為均勻,是比較理想的數(shù)據(jù)集。將數(shù)據(jù)集替換為ORL人臉數(shù)據(jù)集,然后重新訓練網(wǎng)絡。訓練完成后,識別準確率達到了95.00%,如圖4-5和圖4-6所示。圖4-5在ORL人臉數(shù)據(jù)集上的識別準確度曲線圖4-6在ORL人臉數(shù)據(jù)集上的損失函數(shù)曲線CASIA-WebFace數(shù)據(jù)集包含了共計10575個人的494414張圖像,是國內人臉識別屆頗具盛名的人臉訓練集之一。實驗中從CASIA-WebFace人臉數(shù)據(jù)集中選取15個人的人臉圖像組成了一個小數(shù)據(jù)集進行測試。將數(shù)據(jù)集進行替換,然后重新訓練網(wǎng)絡。訓練完成后,識別準確率為87.10%,分析原因是因為數(shù)據(jù)集中的人臉樣本多為姿態(tài)不好的人臉圖像,因而識別準確率有所下降,如圖4-7和圖4-8所示。圖4-7在CASIA-WebFace人臉數(shù)據(jù)集上的識別準確度曲線圖4-8在CASIA-WebFace人臉數(shù)據(jù)集上的損失函數(shù)曲線2.3分析與結論由本章實驗結果可知,實驗中網(wǎng)絡在小數(shù)據(jù)集上表現(xiàn)較為良好,但在較大的數(shù)據(jù)集上表現(xiàn)一般,且要求數(shù)據(jù)集中各人臉

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論