版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第PAGE人臉識別技術綜述目錄TOC\o"1-3"\h\u7234人臉識別技術綜述 136771.1人臉識別技術的思路 1190321.1.1特征提取法 226711.1.2分類器 3115921.2常用數(shù)據(jù)庫 41.1人臉識別技術的思路首先使用高清攝像頭來自動采集人臉的圖像數(shù)據(jù),然后在收集的圖像中檢測所有有效人臉,進而提取其特征,進行識別。因此人臉識別技術的思路大致如圖2-1所示。圖2-1人臉識別流程圖(1)圖像采集:利用攝像頭進行采集。但是受到一些影響因素,這一步驟不是很容易完成,因此,對攝像機有很高的要求,要做到抓拍各種形態(tài)圖像,來建立全面的人臉圖片數(shù)據(jù)庫來進行實驗。(2)人臉檢測:即從各類豐富的人臉特征信息中篩選出有價值的信息,從而利用這些信息來實現(xiàn)對不同人臉的識別。但是,最初獲取的圖像會受到各種因素的干擾,不能直接使用,要對其圖像進行預處理。圖像預處理的方式主要包括中值濾波、灰度拉伸、歸一化處理以及銳化等[6]。(3)特征性的提取:即從圖像中提取最容易識別和分類的特征。其本質是保留最有效的屬性,同時減少一定維數(shù)。(4)分類識別:用得到的數(shù)據(jù)與庫數(shù)據(jù)做對比,當與規(guī)定偏差值相差超過某個數(shù)值時將數(shù)據(jù)送入。人臉識別技術是將采集的人臉數(shù)據(jù)與庫數(shù)據(jù)里面的其他個體人臉識別特點信息進行相對比較。這一類的圖像識別確認操作過程一般被人為地分為以下兩類:一類是將多個圖像進行一一精確對比;另一類是將一個圖像自動匹配到多個圖像并進行精確對比。1.2主流的人臉識別方法1.1.1特征提取法目前人臉特征提取的算法可大致分為以下幾類[7]:(1)基于人臉輪廓的幾何學特征算法[8]:通過數(shù)據(jù)提取出一個在人臉上的某些面部特征例如嘴巴、眼睛、鼻子等器官在面部的所處位置及其相對比例,同時結合了提取對象臉部輪廓的信息。但是這種算法容易受到如表情變化、噪聲、光線角度等不可控因素的影響,導致它不具有較強的穩(wěn)定性,所以并不廣泛適用。(2)子線性空間提取算法:它們目前是特征提取子線性空間的兩種主流常用算法,大體上它們可以大致分為反向線性空間算法和非線性空間算法兩種。它將一個高維空間中均勻密度分布的高維人臉人形圖像,以一種線性或非線性的密度變換映射形式通過投影映射到一個低維的子拓撲空間[9]中去并除去,使得高維人臉人形圖像的均勻密度分布在一個低維的子拓撲空間中更緊湊,變?yōu)榱说途S圖的計算,計算困難度的程度因此大大降低,,同時,也使得分類變得十分有利。線性子空間算法有主成分分析[10]、線性鑒別分析[11]、獨立主元分析和奇異值分解等。PCA算法分析是一種以函數(shù)k-l正交變換(karhunen-loevetransform)方程為理論基礎的計算方法。它主要功能是對最初的人臉降維圖像中主要材料組成的零部件進行提取并加以整理,繼而參加后續(xù)分析計算,實現(xiàn)人臉降維。pca法首先出現(xiàn)是由英文sirovitch和sikirbyi所介紹的并引入了關于人臉識別法的研究。上世紀末,turk和pcpentland逐步把提取pcad的算法加以完善并發(fā)展成為特征提取的通用方法,進而使其發(fā)展成為當時國際上最廣泛且具有國際代表性的國際主流的提取方法之一。(3)基于神經(jīng)網(wǎng)絡[12]:ANN是由大量簡單的處理單元相互連接而構成的網(wǎng)絡系統(tǒng),它有較強的自學能力,而且在學習過程中有自動提取特征的能力。(4)基于現(xiàn)代統(tǒng)計學的計算方法:此類統(tǒng)計算法的主要綜合代表性統(tǒng)計算法主要包括有奇異的數(shù)值不可分解形式算法(singularvaluedecomposition)、隱馬爾可夫式算法(hiddenmarkovmodel,HMM)等。由risamaria[13]1990年首次成功提出的第一隱馬爾可夫樣本模型主要指的是通過對多個樣本進行各種圖像識別訓練而組合產(chǎn)生的一個模型,它的每一個特征參數(shù)也都可以是其中的一個特征參數(shù)值,并且被成功地廣泛應用于生物識別分析領域。它不僅能夠同時允許你的人臉圖像具有豐富的面部表情和身體形態(tài)上的變化,較大的圓形眼睛和小型頭部可以旋轉,并且它還具有圖像辨認準確度比較高,擴容性比較好等幾大優(yōu)勢。1.1.2分類器(1)最近鄰分類器(NearestNeighbor,NN)近鄰方法是目前最基礎的一種劃分算法,發(fā)展至今已有四十多年的歷史。NN算法主要是將所有訓練樣品均視為一個測量點來進行分類,并將所有被檢測到的樣品與其他訓練樣品之間的歐氏距離加以計算。與被檢測樣品距離最近的培養(yǎng)訓練樣品便是這個被檢測樣品的類別。NN算法因其直觀、易于實現(xiàn)爾被認為是最簡單的一種分類算法,幾乎完全可以應用于所有數(shù)據(jù)架構類型。很多人把其視為人臉識別技術中的基礎分類儀器。但NN算法也有著當數(shù)據(jù)庫中的樣品較多時,需要計算的歐氏距離就非常之多這一明顯缺陷。(2)支持向量機分類(SupportVectorMachine,SVM)支持向量機分類的算法[14]在上世紀末首先進行提出的,因其能快速解決小樣本問題這一優(yōu)點,被許多領域所接受。此方法就是把低維信息轉換到高維空間中,大大減少因計算帶來的錯誤。(3)神經(jīng)網(wǎng)絡分類(ArtificialNeuralNetwork,ANN)人工神經(jīng)網(wǎng)絡具有獨特的信息處理系統(tǒng)[16],而且處理結果十分準確。所以此系統(tǒng)被人們接受和運用。人工神經(jīng)網(wǎng)絡發(fā)展至今已經(jīng)發(fā)展有了非常多的基礎模型,其中逆向式和反饋式人工神經(jīng)網(wǎng)絡(backpropagation,bp)就是比較典型的一種。它既是采用一種基于一個誤差反向在線傳播的訓練算法用來進行在線訓練的一種多層次誤差感知器訓練網(wǎng)絡,又被廣泛統(tǒng)稱它作為一種誤差反向在線傳播訓練算法。BP聯(lián)絡網(wǎng)絡由三層部分組成[17-18],其網(wǎng)絡基礎架構設計如下圖列表中的圖2-2所示。BP圖2神經(jīng)網(wǎng)絡學習算法的設計基礎過程設計基本思想主要如下:機器學習的基本過程主要包括了由一個誤差信號正向信息傳遞和反向信號信息傳遞。正向輸入的壓縮樣本從一個正向輸入隱藏層末端開始反向傳入,經(jīng)過輸出隱藏層的壓縮處理后,再反向傳遞樣本至一個輸出隱藏層。這個正向反遞傳播和這個誤差逆向反遞傳播兩個迭代過程在其中都可以不得不再進行任何大的重復,直到這個誤差很小,或者可以達到預先預計設置的迭代持續(xù)時間和一個替換迭代次數(shù)。圖2-2三層BP神經(jīng)網(wǎng)絡結構圖(4)稀疏編碼分類對稀疏編碼概念的理解源于神經(jīng)生物學。生物學家已經(jīng)提出,哺乳類動物在長期的演變過程中,生成了一種能夠迅速,準確,無花錢地表達人類對自然影像的視覺和神經(jīng)功能等各個方面的特征。但是我們每次看到一副影片都要保持上億個像素,我們的頭部和大腦也很難真正像計算機那樣直接被存儲。研究結果表明,我們每一副圖像都被提取為輸入,只有少量的信息被用于儲存。我們稱其為稀疏程序編碼,即sparsecoding。把稀疏編碼的方法充分運用到分類算法中的一種機器學習分類方法,稱為稀疏編碼分類算法。相比SRC算法采用的1-范數(shù),CRC[19]和LRC[20]的計算復雜度大大減小。1.2常用數(shù)據(jù)庫(1)ORL全球人臉識別數(shù)據(jù)庫是由來自英國劍橋大學olivetti研究所2009年自主研發(fā)建立的一個人臉識別技術應用數(shù)據(jù)庫。ORL人臉視角圖像的一個整體視角人臉圖像視角不是均勻地把人看成一個正臉,而是隨著左右20%以內的視角幅值變化發(fā)生了巨大變化。這些面部影像主要應用是在不同的工作環(huán)境中,時間、不同角度光照、不同的整個身體或者其他面部詳細表情(例如眼睛必須睜/需要閉眼,微笑/不需要露出)和不同身體上的其他面部詳細(需要佩戴隱形眼鏡/不需要穿帽子外套)的不同環(huán)境下用來進行影像采集。所有全景圖像都可以是在比較暗的均勻曝光背景下通過拍攝而得到。圖2-3ORL人臉庫部分人臉圖像圖示(2)Yale人臉數(shù)據(jù)庫主要是采集不同的表情、姿勢和光照下的年輕人臉特征圖像,圖片的占存很小。這樣整個數(shù)據(jù)集很小,而且圖片上的信息也比較簡單。圖2-4Yale人臉庫人臉圖像圖示(3)AR彩色人臉影像數(shù)據(jù)庫在一個計算機網(wǎng)絡視覺影像中心(CVC)創(chuàng)立,包含了4000多張以上的彩色人臉影像,對應126個人的不同面部(70個人的男性和56個人的女性)。該圖像主要以不同的面部形象、光照條件及其所掩蓋(如太陽眼鏡或圍巾)正面影像為其特征。這些圖片都是在cvc嚴格管理的條件下進行了拍攝。參與人員不被所涉及的著裝(包括衣物、眼鏡等),化妝、頭發(fā)等所限制。每個人至少要參加兩個大會,間隔兩周(14天)的時間。兩組實驗都拍攝了同樣的照片。圖2-5AR人臉庫人臉圖像圖示(4)FERET人臉庫是美國國防部研究開發(fā)的人
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于大數(shù)據(jù)分析的城市交通管理
- 中班安全消防課件
- 呼吸內科慢性阻塞性肺疾病急性加重期護理指南
- 幼兒科普知識演講
- 重癥患者營養(yǎng)規(guī)范
- 感染科醫(yī)院感染控制措施
- 雙膝骨性關節(jié)炎健康宣教
- 支氣管炎預防保健指南
- 企業(yè)內控制度建設及實施效果評估
- 2025版甲狀腺腫瘤常見癥狀及護理康復方案
- 8m深基坑土方開挖施工方案
- 2025中央廣播電視總臺招聘144人筆試歷年題庫附答案解析
- 2026年瓦工職業(yè)技能鑒定考試題庫及答案
- 2025年云南省人民檢察院聘用制書記員招聘(22人)筆試考試參考題庫及答案解析
- 胃腸外科圍手術期護理要點
- 竣工資料歸檔與管理流程
- 購車合伙協(xié)議書模板
- 二手摩托車買賣合同范本
- 2026年山西省財政稅務??茖W校單招職業(yè)傾向性測試題庫附答案
- 2025年阿里輔警協(xié)警招聘考試備考題庫及答案1套
- 黃寶康藥用植物學課件
評論
0/150
提交評論