【《基于CNN的改進驗證碼識別算法分析案例》1200字】_第1頁
【《基于CNN的改進驗證碼識別算法分析案例》1200字】_第2頁
【《基于CNN的改進驗證碼識別算法分析案例》1200字】_第3頁
【《基于CNN的改進驗證碼識別算法分析案例》1200字】_第4頁
【《基于CNN的改進驗證碼識別算法分析案例》1200字】_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

基于CNN的改進驗證碼識別算法分析案例目錄TOC\o"1-3"\h\u29789基于CNN的改進驗證碼識別算法分析案例 1139361.1端到端驗證碼識別算法簡介 1260841.1.1Inception模組 2198901.1.2Xception架構 2282121.2主要代碼實現(xiàn) 355301.3模型訓練結果分析 4端到端驗證碼識別算法簡介 之前識別的驗證碼是易分割的驗證碼,如果驗證碼變得很復雜的話就沒辦法很好的分開。所以就之前的方法進行改進。之前的CNN卷積神經(jīng)網(wǎng)絡識別驗證碼是先把字符串分割成若干字符,常用的分割方法例如有平均分割法,投影分割法,顏色填充分割法等,采用化整為零的方法,分別識別再統(tǒng)一,但是如果字符之間有粘連的話分割難度就會非常大且容易造成驗證碼信息的缺失,影響了識別的精度,所以本章就端到端不分割的算法進行研究,輸入整張圖片然后直接導出標記結果,省略中間復雜的預處理和特征提取等過程,直接用原始數(shù)據(jù)得到結果。區(qū)別如下圖:圖4.1端到端思想示例基于CNN去識別驗證碼換句話說就是一個多標簽值的學習問題。如果是一個4位數(shù)字組成的驗證碼那么它每張圖就有四個標簽。端到端的識別就是連接了四個全連接層,它們分別對應不同位置的四個標簽。最后將它們聯(lián)系到一起同時學習這四個標簽。但是這個有個問題即要求識別的驗證碼固定,不固定的話就沒有針對固定位置的標簽進行識別。圖4.2端到端驗證碼識別流程識別數(shù)據(jù)集如下圖所示,比之前的難度上升一個檔次,加了噪聲,由數(shù)字、大小寫字母組成并且各個字母之間距離不盡相同,不易分割,如下圖所示:圖4.2訓練驗證碼圖片示例Inception模組在之前,szegedy等人提出了第一代網(wǎng)絡架構即inception,InceptionV1又叫GoogleNet,,之后隨著時代的發(fā)展,InceptionV1不斷升級,V2V3Inception-resNet相繼出現(xiàn)。非常經(jīng)典的Inception模塊處理跨通道相關的時候,第一步就是現(xiàn)實用1*1的卷積核去遍歷將數(shù)據(jù)的維度降下來,使現(xiàn)在的特征空間小于之前的特征空間。之后再通過3*3卷積核學習空間相關性。Xception架構 Inception網(wǎng)絡是簡單來說是一種中間狀態(tài)位于深度可分卷積和普通卷積之間,之后研究人員由Inception思想開發(fā)出了另外一種新的CNN卷積神經(jīng)網(wǎng)絡架構:XCeption,它的思想主要是去掉Inception模塊,用深度可分卷積來替代,最后在Xception中建立更多、更細的路徑。Inception網(wǎng)絡有兩個想法:開始1×1卷積負責處理通道間混合,最后3×3卷積負責操縱圖像的空間結構。3x3卷積也將在通道之間混合,但是XCeption的想法是引入更多路徑,甚至允許每個通道具有獨立的路徑,此時每個3x3卷積核都在各個通道中獨立運行,不再負責通道之間的混合。這樣可以節(jié)省很多參數(shù)并加快計算速度。主要代碼實現(xiàn)數(shù)據(jù)集生成代碼如下圖:卷積網(wǎng)絡結構如下圖:模型訓練結果分析因為數(shù)據(jù)比較復雜迭代次數(shù)相比較之前也較長,大概的6000次左右才能達到百分之九十以上的準確率,使用tensorboard對accuracy進行監(jiān)控如下圖:圖4.1模型訓練準確率結果展示代碼之前采用的激活函數(shù)是softmax方式,收斂效果不是很好。最后采用的是sigmoid方式。亞當優(yōu)化器學習率為0.001.經(jīng)過多次訓練發(fā)現(xiàn)模型迭代次數(shù)在兩千以內(nèi)準確率都特別低,后面將迭代

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論