付費下載
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于opencv的票據(jù)識別算法研究
0火車票字符識別算法目前,全國各地的車站對車票進行了真實性和發(fā)票的真實性驗證,并在抵達列車前對其進行機器檢查。然而,機器檢查票的合法性只能確定用戶是否與證詞和票完全一致,因此必須通過手動認證。這不僅需要大量的人力物力,還隨著員工的精神疲勞而降低身份認同的比例。現(xiàn)在的人臉識別和光學(xué)識別技術(shù)。火車票上已有持票人的身份信息,火車票字符識別技術(shù)是這種裝置所要解決的關(guān)鍵技術(shù)問題之一.本文使用OpenCV的開源視覺庫軟件提出一種火車票字符識別算法,能夠在Liunx,Windows和MacOs等操作系統(tǒng)上運行,實現(xiàn)了火車票識別過程中的車票定位、字符篩選算法、模板匹配等關(guān)鍵技術(shù),在CPU為Inter-CORE-i5,主頻2.2MHz的條件下,每張車票的平均識別速度為300ms,針對火車站人流大的客觀事實,該算法具有很高的實時性.1車票識別的流程鑒于不同版本的火車票有不同的字符排列規(guī)則,實驗中使用的火車票為鐵路局在2015年8月1號正式發(fā)布的全國最新版火車票,圖2給出了火車票的圖片樣張.假設(shè)攝像頭距離車票的位置固定不變,且車票存放在如圖1所示的一個凹槽中.車票識別的的主要步驟包括:圖片預(yù)處理、字符提取、字符篩選、模板匹配等,圖片預(yù)處理是一個重要過程,它包括:車票二維碼定位、角點提取、傾斜校正2圖像預(yù)處理車票識別算法的預(yù)處理過程包括:火車票定位、火車票傾斜校正和字符分割.2.1維碼圖形解析火車票字符定位是字符識別的前提條件,根據(jù)車票的圖像特征,利用二維碼的位置可以精確定位車票.當車票正面放置時,在車票的右下角區(qū)域會有二維碼圖形,該二維碼經(jīng)過了鐵路部門的強加密技術(shù),無法解析其內(nèi)容,但可以利用它的圖形特征即3個方形角點位置進行車票定位和傾斜校正.2.1.1局部自適應(yīng)閾值分割法二值化是把數(shù)字灰度圖像轉(zhuǎn)換灰度值為0和255的二值圖像的過程.二值化的作用是把圖像分成目標和背景2個部分,消除處理過程中不需要的灰度信息,加快處理速度.在實際環(huán)境中,不能保證每張圖片在拍攝時的亮度都保持一致,不能簡單設(shè)置一個全局閾值來達到二值化的目的,因此采用局部自適應(yīng)閾值分割方法.其算法原理是根據(jù)每個像素的鄰域塊的像素值分布來確定該像素位置上的二值化閾值,這樣做的好處在于每個像素位置處的二值化閾值不是固定不變的,而是由其周圍鄰域像素的分布決定.亮度較高的圖像區(qū)域的二值化閾值通常會較高,而亮度較低的圖像區(qū)域的二值化閾值則會相適應(yīng)地變小.不同亮度的局部圖像區(qū)域?qū)碛邢鄬?yīng)的局部二值化閾值2.1.2輪廓獲取與生成在圖片正放的情況下,從左下角開始按順時針順序依次標記二維碼的3個方形角點的中心點坐標為{C1)C2)3個正方形角點的邊長相等,設(shè)置其邊長為(20+3)pixs.利用OpenCV的尋找輪廓函數(shù)cvFindContours()可以找到圖形中的全部封閉輪廓.根據(jù)上述2個特征篩選出符合條件的所有輪廓,輪廓處理結(jié)果如圖5所示.2.1.3根據(jù)c.n極坐標系的旋轉(zhuǎn)在實際識別過程中,由于火車票擺放的任意性,所獲得的火車票字符圖像通常存在一定角度的傾斜,火車票在傾斜狀態(tài)下的識別率大幅降低.為了得到更高的識別率,需要對火車票進行傾斜校正.在提取的3個角點中,根據(jù)C假設(shè)圖像中的某點p繞坐標原點(0,0)旋轉(zhuǎn)θ后坐標變成(x′,y′),根據(jù)式(3),在(x′,y′)極坐標系下的轉(zhuǎn)換公式為:根據(jù)式(4)計算每個點旋轉(zhuǎn)θ后的坐標位置,再利用線性插值算法就可得到旋轉(zhuǎn)后的像素值3識別身份驗證號碼身份證號碼識別過程可描述為號碼區(qū)域定位、號碼字符提取、字符篩選、模板匹配等步驟.3.1區(qū)域位置.為了在字符分割時可以減少計算量,提高系統(tǒng)運行速度,需要準確定位身份證號碼所在的區(qū)域位置.在校正好的圖片中,利用3個角點可以準確定位到身份證號碼的區(qū)域位置.身份證號碼所在的區(qū)域用矩形在實驗中,相關(guān)參數(shù)具體取值為:在不同的實驗條件下,參數(shù)值可靈活改變,利用局部自適應(yīng)閾值分割法對矩形區(qū)域進行處理,處理結(jié)果如圖6所示.3.2數(shù)字輪廓的篩選根據(jù)圖6的分割結(jié)果,所有身份證字符輪廓都可以清晰顯示出來,因此可以采用提取輪廓的方法提取字符,使用OpenCV提供的cvFindContours()尋找所有的封閉外輪廓.由圖6可知,對數(shù)字輪廓的高、寬和有效像素添加限制條件,可以排除掉一些干擾輪廓,設(shè)置目標輪廓的高大于20pixs,寬大于16pixs,有效像素介于80pixs和150pixs之間.利用這些特征可以從眾多輪廓中篩選出數(shù)字輪廓,結(jié)果如圖7所示.3.3帶“型”的字符由于打印火車票的機器存在機械誤差,導(dǎo)致有些字符之間的間隔很小,甚至是粘連在一起,影響字符分割,無法使車票上的14個身份證數(shù)字全部獨立地分割出來,也無法判斷分割后的第1個字符是否為身份證號碼的第1個數(shù)字.例如圖7就只提取出13個目標,其身份證第1個數(shù)字和第2個數(shù)字存在粘連.解決該問題的方法如下:根據(jù)車票的版面特征,發(fā)現(xiàn)在身份證數(shù)字的中間位置有4個帶‘*’號的字符,鐵路部門這樣設(shè)計的目的是屏蔽身份證號碼中的4個數(shù)字,保護乘客隱私,利用這個‘*’字符特征,可以解決字符分割不全以及字符排序的問題.步驟如下:Step1將分割得到的所有目標圖像按X軸坐標大小排序,從X軸最小的目標開始依次匹配,該目標有可能不是身份證的第1個數(shù)字;Step2當前一個目標匹配結(jié)束時,下一個目標根據(jù)與前一個目標的間隔關(guān)系,在向右偏移n個像素單位的位置開始匹配,n的大小取字符模板的寬度;Step3重復(fù)Step2,直到匹配到的目標為‘*’;Step4計算‘*’前面識別到的目標數(shù)量,如果沒有達到10個,則以識別到的第一個目標為基準,繼續(xù)從往左偏移n個像素單位的位置開始匹配,至識別目標數(shù)量為10個為止,n的大小取字符模板的寬度;Step5根據(jù)‘*’位置,偏移到后面4個字符的首個位置,依照Step2的方法,依次識別后面4個數(shù)字目標.通過試驗發(fā)現(xiàn),在‘*’兩側(cè)的任意2個相鄰身份證號碼的間隔可以等同于模板寬度;因此,在Step2和Step4中,n的取值為模板寬度,n過大或者過小都會使目標的預(yù)測位置偏離實際位置較大,導(dǎo)致模板匹配過程中尋找鄰近區(qū)域的擴大,降低算法的實時性.最終識別出的數(shù)字目標如圖8所示.3.4圖像特征匹配模板匹配是數(shù)字圖像處理的重要組成部分.把不同傳感器或同一傳感器在不同時間、不同成像條件下對同一景物獲取的兩幅或多幅圖像在空間上對準,或根據(jù)已知模式到另一幅圖中尋找相應(yīng)模式的處理方法叫做模板匹配為了提高系統(tǒng)的實時性,采用線性匹配方法.原理是遍歷目標圖像的每個像素,根據(jù)式(6)和式(7)計算匹配相似度.其中,m為模板標號,SW和H分別為模板的寬和高.由于采用小模板進行匹配,對圖像的位置變化較敏感,為了提高算法的魯棒性,利用目標圖像的鄰近區(qū)域進行模板匹配,選取相似度最高的模板作為識別結(jié)果.假設(shè)目標圖像原點位置為Ou和v的大小根據(jù)實際情況進行調(diào)整,在滿足實時性的前提下,可取大一些.默認選取u和v都為2pixs.4日期排序規(guī)則根據(jù)實驗觀察,日期字符排列具有如下特征:1)日期字符的版面格式為“..年..月..日..:..開”,因此左邊第一個字符可以固定為數(shù)字‘2’.Step4根據(jù)日期的排序規(guī)則,先識別年份模塊再依次識別月、日、時各個模塊.4.1種子點pstep2檢測所謂漫水填充,就是自動選取和種子點相連的區(qū)域,將該區(qū)域替換成指定的顏色,用來標記或者分離圖像的一部分進行處理Step1遍歷圖像,檢測每個像素點的顏色,根據(jù)二值圖像的特征,若檢測到該點為白色(像素值為255),則將其標記為種子點pStep2用自定義填充色(一般取像素值128)替換種子點像素,并記下該點坐標;Step3檢測該點坐標的相鄰位置,可以選擇四連通或八連通鄰域,記錄鄰域內(nèi)存在的所有白色像素點為新的種子點,繼續(xù)Step2;這個過程延續(xù)到已經(jīng)檢測區(qū)域邊界范圍內(nèi)的所有像素為止4.2日期模塊排列特征根據(jù)漫水填充法找到的字符還包括‘年’、‘月’、‘日’等字符的干擾,解決該問題的方法是利用年、月、日模塊間隔大小不變的特點過濾掉干擾字符.例如車票日期是2015年09月26日08:35開,年份識別后的最后一個字符‘5’與月份的第一個字符‘0’之間的距離會在N±d(pixs)范圍,利用這個特征可以跳過干擾字符‘年’,對于后面的月份檢測同樣可以采取相同的辦法.識別結(jié)果如圖10所示.5實驗4不同數(shù)據(jù)分析實驗對200張不同車票進行處理,車票在槽內(nèi)隨機擺放.整個識別算法在Vc++6.0和OpenCV1.0的環(huán)境下編程實現(xiàn),CPU為Intel-CORE-i5,主頻2.2MHz,采用CMOS攝像頭,圖片分辨率為648×480,在光源充足的環(huán)境下拍攝.實驗結(jié)果如表1所示.根據(jù)實驗結(jié)果,車票的平均識別率達到97.5%,平均識別時間為300ms,證明該算法可以有效識別火車票上的身份證和日期字符.6評價培育效果本文提出了一種基于模板匹配和漫水填充的火車票字符識別算法.該算法根據(jù)火車票特殊的版面關(guān)系,對身份證和日期字符采取不同的識別算法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026廣西河池市巴馬同賀物業(yè)投資開發(fā)有限公司招聘1人備考題庫帶答案詳解ab卷
- 2026廣東職業(yè)技術(shù)學(xué)院第一批非事業(yè)編制教師招聘4人備考題庫含答案詳解(培優(yōu)a卷)
- 2026年安徽省合肥市肥西縣上派鎮(zhèn)樂平路小學(xué)臨聘教師招聘備考題庫及1套完整答案詳解
- 2026上海分子細胞卓越中心陳玲玲組招聘實驗技術(shù)員2人備考題庫及答案詳解(名師系列)
- 2026廣東江門職業(yè)技術(shù)學(xué)院管理教輔人員招聘4人備考題庫含答案詳解(鞏固)
- 2026四川雅安市雨城區(qū)公益性崗位招聘4人備考題庫及參考答案詳解(新)
- 2026中國雄安集團有限公司社會招聘備考題庫含答案詳解(培優(yōu)b卷)
- 化工園區(qū)安全生產(chǎn)事情預(yù)案
- 2026山東中醫(yī)藥大學(xué)附屬醫(yī)院招聘高級崗位工作人員2人備考題庫(含答案詳解)
- 2026四川綿陽市三臺縣潼川第四幼兒園教師招聘備考題庫含答案詳解(預(yù)熱題)
- 2026年山東水利職業(yè)學(xué)院單招綜合素質(zhì)筆試參考題庫含詳細答案解析
- 箱涵預(yù)制、安裝、現(xiàn)澆施工方案
- 2026屆杭州高級中學(xué)高二上數(shù)學(xué)期末聯(lián)考試題含解析
- 2026年陜西氫能產(chǎn)業(yè)發(fā)展有限公司所屬單位社會公開招聘備考題庫及1套參考答案詳解
- 2026年及未來5年中國無取向硅鋼片行業(yè)市場深度分析及發(fā)展趨勢預(yù)測報告
- 棄土場規(guī)范規(guī)章制度
- 2026年水下機器人勘探報告及未來五至十年深海資源報告
- 2025年3月29日事業(yè)單位聯(lián)考(職測+綜應(yīng))ABCDE類筆試真題及答案解析
- 雙重預(yù)防體系建設(shè)自評報告模板
- 高血壓教學(xué)查房復(fù)習過程教案(2025-2026學(xué)年)
- 建設(shè)工程消防施工質(zhì)量通病及整改示例
評論
0/150
提交評論