數(shù)字圖像-驗證碼識別_第1頁
數(shù)字圖像-驗證碼識別_第2頁
數(shù)字圖像-驗證碼識別_第3頁
數(shù)字圖像-驗證碼識別_第4頁
數(shù)字圖像-驗證碼識別_第5頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

一、數(shù)字圖像處理基礎(chǔ)一幅圖像可以定義為一個二維數(shù)組f(x,y),這里x,y是空間坐標,而在任何一對空間坐標(x,y)上的幅值f稱為該點圖像的強度或灰度。當x,y和幅值f為有限的、離散的數(shù)值時,稱該圖像為數(shù)字圖像。自然界呈現(xiàn)在人眼中的圖像是連續(xù)的模擬信號,在計算機處理前,必須用圖像傳感器把光信號轉(zhuǎn)換為表示亮度的電信號,再通過取樣和量化得到一副數(shù)字圖像。取樣是對圖像在坐標上進行離散化的過程,每一個取樣點稱為一個像素。量化是對圖像灰度上的離散化過程。取樣后將得到M*N個像素,每個像素量化得到一個灰度值L,以L表示灰度值的允許取值范圍,則數(shù)字圖像存儲需要的比特數(shù)b可以表示為:圖像的灰度值取值范圍被稱為圖像的動態(tài)范圍。把占有灰度級全部有效段的圖像稱為高動態(tài)范圍圖像,高動態(tài)范圍圖像有較高的對比度。相反,地動態(tài)范圍的圖像看上去是沖淡了的灰暗格調(diào)。

二、圖像的預處理:主要是對圖像進行灰度化、二值化、抑噪(濾波)等技術(shù)。1、圖像的灰度化RGB系統(tǒng)中一個顏色值由3個分量組成,這樣的圖像稱為彩色圖像,RGB系統(tǒng)稱為顏色空間模型。常見的顏色空間模型還有HSI、CMYK等。如果一幅圖像的顏色空間是一維的(一個顏色值只有一個顏色分量),則這幅圖像就是一副灰度圖。在位圖圖像中,一般以R=G=B來顯示灰度圖像。圖1原始圖片常用的灰度化方法有以下三種:

(2.1)

(2.2)

(2.3)其中,公式(2.1)的方法來源于I色彩空間中I分量的計算公式,公式(2.2)來源于NTSC色彩空間中Y分量的計算公式。公式(2.3)是基于采用保留最小亮度(黑色)的方法。圖2用公式2.2灰度化后的圖片RGB彩色圖像可以看成是由3副單色的灰度圖像構(gòu)成的,可以直接取RGB通道中的任一個通道得到灰度化圖像,如,前提是圖像中目標像素的亮度信息主要分布在B通道上,否則灰度化結(jié)果將是亮度信息的大量丟失?;叶葓D像又叫亮度圖像,由歸一化的取值表示亮度,最大取值表示白色,最小取值表示黑色。以P(x,y)表示圖像中一個點,x、y分別是圖像的橫坐標和縱坐標,R(x,y)表示R通道的顏色分量,G(x,y)表示G通道的顏色分量,B(x,y)表示B通道的顏色分量。點P(x,y)的亮度值用L(x,y)表示。彩色圖像的亮度沒有嚴格的定義和計算公式,一般用公式(2.1)來計算,我們記作L1(x,y)。同樣的用公式(2.2)計算的亮度值記作L2(x,y),用公式(2.3)計算的亮度值記作L3(x,y)??梢宰C明:

(2.4)

(2.5)公式(2.1)取RGB通道的平均值,得到的圖像相對比較柔和,同時也縮小了目標和背景的平均亮度差,不利于后續(xù)的閥值處理。公式(2.2)考慮了人眼對綠色的適應度最強,藍色次之,紅色最差。在處理綠色調(diào)和藍色調(diào)的驗證碼圖像時,公式(2.2)的效果令人滿意,但在處理紅色調(diào)的圖像時,因為公式中紅色的權(quán)值很小,灰度化后目標像素和背景像素的亮度差值被嚴重縮小,效果還不如公式(2.1)。公式(2.3)基于一個前提,那就是有限保留目標像素的亮度信息,利于后續(xù)的閥值分割。需要說明的是,要根據(jù)圖像灰度化的目的不同,原圖色彩特征的不同,選擇合適的灰度化方法。2、圖像的二值化一般24位RGB圖像的灰度圖是8位256個灰度級的,如果把這個灰度級減少到1位2個灰度級,就得到一副二值圖,二值圖像中的數(shù)據(jù)全部是0或1。圖3二值化后圖像

三、字符分割:字符分割包括從驗證碼圖像中分割出字符區(qū)域和把字符區(qū)域劃分成單個字符兩個部分。如果采用統(tǒng)計特征匹配以及神經(jīng)網(wǎng)絡(luò)法識別,必須要先分割出單個的字符。簡單的分割方法包括等距分割、積分投影分割、交叉點分割、求連通區(qū)等。其中,粘連字符的分割是一個難點,復雜的粘連情況下分割比較困難,是一個硬人工智能問題。

四、字符識別字符識別就是把處理后的圖片還原回字符文本的過程。可以分成基于字符分割的識別(包括采用神經(jīng)網(wǎng)絡(luò)、SVM、各種統(tǒng)計距離的識別法)和模板匹配法識別。字符識別的常用做法是:先獲取該字符的特征碼,然后使用各種分類算法將對該特征碼進行分類,將其打上相應的類標簽。分類模型的訓練,是對字符庫中的每個字符進行特征化處理,得到每個字符的特征碼,該字符的標簽就是該字符本身,利用特征碼加上字符的標簽對字符庫中的所有數(shù)據(jù)進行訓練,得到相應的分類模型。當然,得到了待識別字符的特征碼后,也可以使用相似性度量和字符庫中的字符的特征碼進行比較,將該字符識別為與其特征碼相似性最高的字符?,F(xiàn)在的問題就集中在如何獲取字符的特征碼。文章[2]中介紹了一種簡單的獲取特征碼的方法:對于二值化后的圖像進行分割,分割出來的圖像是一個個的字符,如下圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論