基于圖像的OMR技術(shù)的實(shí)現(xiàn)_第1頁(yè)
基于圖像的OMR技術(shù)的實(shí)現(xiàn)_第2頁(yè)
基于圖像的OMR技術(shù)的實(shí)現(xiàn)_第3頁(yè)
基于圖像的OMR技術(shù)的實(shí)現(xiàn)_第4頁(yè)
基于圖像的OMR技術(shù)的實(shí)現(xiàn)_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于圖像的OMR技術(shù)的實(shí)現(xiàn)

摘要:在分析OMR與OCR的應(yīng)用特點(diǎn)后,提出了基于圖像的OMR方式。詳細(xì)討論了該方法的硬件設(shè)計(jì)和工作原理,并在軟件處理方面著重介紹了傾斜校正和圖像分割。它具有對(duì)紙張質(zhì)量要求低和識(shí)別準(zhǔn)確度高等特點(diǎn)。

關(guān)鍵詞:OMROCR信號(hào)處理傾斜校正圖像分割

目前,許多文檔是以紙質(zhì)文檔的形式存在,例如銀行票據(jù)、稅務(wù)報(bào)表、標(biāo)準(zhǔn)化考試中的機(jī)讀卡、人口普查表、彩標(biāo)投注單、選票、定貨單等。而紙質(zhì)文檔不便于保存、檢索、統(tǒng)計(jì)和修改。將這些信息錄入計(jì)算機(jī)是一件非常繁瑣的事情。長(zhǎng)期以來(lái)人們通過(guò)鍵盤(pán)手工輸入,不但費(fèi)時(shí)費(fèi)力且容易出錯(cuò)。在實(shí)時(shí)性要求較高的場(chǎng)合自動(dòng)、快速、準(zhǔn)確地處理文檔顯得尤為重要。因此,對(duì)這些文檔進(jìn)行計(jì)算機(jī)自動(dòng)錄入具有重要的實(shí)現(xiàn)意義。

計(jì)算機(jī)自動(dòng)錄入是解決這個(gè)同瓶頸的關(guān)鍵所在。其中,光學(xué)字符識(shí)別OCR和光學(xué)標(biāo)記識(shí)別OMR是解決信號(hào)自動(dòng)錄入的有效方法。它們利用光學(xué)方法將信息錄入到計(jì)算機(jī)并進(jìn)行識(shí)別處理,能極大地提高數(shù)據(jù)信息的采集速度,便于計(jì)算機(jī)存儲(chǔ)、管理與檢索。

1OCR與OMR

OCR的工作原理

OCR首先將要識(shí)別的文字和圖像掃描進(jìn)計(jì)算機(jī),然后進(jìn)行圖像的預(yù)處理,再抽取字符特片進(jìn)行識(shí)別,轉(zhuǎn)變?yōu)橛?jì)算機(jī)能夠識(shí)別的字符信息。圖像預(yù)處理包括去除噪聲、歪斜校畫(huà)龍點(diǎn)睛、圖像分割、平滑及規(guī)范化等。其中圖像分割是一個(gè)重要的步驟,它的作用是將要識(shí)別的單個(gè)字符的圖像找到并分割出來(lái)。OCR技術(shù)主要應(yīng)用于文字圖像識(shí)別及處理,例如用于印刷體和限制手寫(xiě)體字符的識(shí)別。OCR技術(shù)已成為大規(guī)模數(shù)據(jù)錄入的首選方案,它將隨著計(jì)算機(jī)技術(shù)的發(fā)展而更加成熟。

OMR的工作原理

OMR識(shí)別“涂點(diǎn)”上有無(wú)標(biāo)記兩種狀態(tài)?!巴奎c(diǎn)”就是信息卡上可以涂寫(xiě)標(biāo)記的地址?!巴奎c(diǎn)”所代表的含義可以事先定義,可以代表一個(gè)阿拉伯?dāng)?shù)字,也可以表示一個(gè)英文字母或符號(hào)。OMR技術(shù)快速簡(jiǎn)單,識(shí)別率高且成本低,廣泛應(yīng)用于標(biāo)準(zhǔn)化考慮自動(dòng)閱卷、各類調(diào)查問(wèn)卷的統(tǒng)計(jì)、選舉結(jié)果的統(tǒng)計(jì)等,是自動(dòng)識(shí)別領(lǐng)域中應(yīng)用較多的一種方法。

2基于圖像的OMR技術(shù)

目前OMR一般采用光電對(duì)管閱讀技術(shù)。識(shí)別用的器件是半導(dǎo)體發(fā)光管及光敏管。發(fā)光管是光源器件,由它發(fā)出的光照射到“涂點(diǎn)”上。光敏管是接收器件,接收來(lái)自“涂點(diǎn)”位置的反射光。因?yàn)橥坑袠?biāo)記的地方反光弱,未涂標(biāo)記的地方反光強(qiáng),所以光敏管接收到的光信號(hào)強(qiáng)度不同。不同強(qiáng)度的光信號(hào)可以代表有無(wú)標(biāo)記兩種狀態(tài)。將“涂點(diǎn)”位置處的發(fā)光管和光敏這組成一只電眼,可識(shí)別一個(gè)涂點(diǎn)。若干個(gè)電眼排列起來(lái)組成光電頭可完成對(duì)一排涂點(diǎn)的識(shí)別。

該方法實(shí)現(xiàn)應(yīng)用中有如下限制:信息卡上的“涂點(diǎn)”要與電眼完全對(duì)齊,即信息卡在錄入時(shí)不能傾斜;信息卡不能折皺;紙張質(zhì)量、印刷技術(shù)要求高;填寫(xiě)標(biāo)記要規(guī)范,否則就要影響識(shí)別結(jié)果。實(shí)際應(yīng)用中,信息卡在錄入時(shí)由于走紙機(jī)構(gòu)機(jī)械誤差而略有傾斜,會(huì)造成識(shí)別出錯(cuò)。

OCR由于采用了圖像處理技術(shù),信息卡在錄入時(shí)的傾斜能自動(dòng)校正,保證錄入的高精度,也能處理略有折皺的信息卡。因此,OCR對(duì)所用紙張的質(zhì)量、印刷技術(shù)要求不高,降低了運(yùn)行成本。同時(shí)可以保留填寫(xiě)的原始圖像備查,進(jìn)行復(fù)核或重新識(shí)別。

在借鑒OCR優(yōu)點(diǎn)的基礎(chǔ)上,筆者在課題《彩標(biāo)閱讀及識(shí)別系統(tǒng)》中采用了基于圖像的OMR技術(shù)。所謂基于圖像的OMR技術(shù),就是將信息卡經(jīng)光電變換,形成二值化圖像;再經(jīng)歪斜校正、圖像分割,對(duì)分割出的小塊圖像中的黑點(diǎn)數(shù)進(jìn)行計(jì)數(shù)。若大于某個(gè)閾值,就認(rèn)為有標(biāo)記,否則就沒(méi)有標(biāo)記,從而完成了標(biāo)記識(shí)別。相對(duì)OCR而言,它省去了最耗時(shí)的字符特征抽取步驟。

3硬件組成

本系統(tǒng)框圖如圖1所示。

圖像傳感器

采用國(guó)產(chǎn)的CIS圖像傳感器,其光學(xué)分辨率比CCD略低,但是其驅(qū)動(dòng)電路、光學(xué)系統(tǒng)和機(jī)械結(jié)構(gòu)卻比CCD簡(jiǎn)單。光學(xué)系統(tǒng)中采用特殊光源實(shí)現(xiàn)光學(xué)濾波,消除或減輕了信息卡背景信息對(duì)分割、識(shí)別的影響。工作時(shí),由CPLD產(chǎn)生一個(gè)周期性的同步脈沖SYN引導(dǎo)每次掃描,時(shí)鐘信號(hào)CLK在移動(dòng)寄存器的作用下,對(duì)CIS內(nèi)的像元依次進(jìn)行掃描,像元上的光電信號(hào)串行輸出。

走紙控制

輸入的信息卡通過(guò)光學(xué)系統(tǒng)成像在圖像傳感器的光敏面上,在CPLD器件產(chǎn)生的掃描信號(hào)的驅(qū)動(dòng)下,圖像傳感器對(duì)信息卡進(jìn)行橫向自掃描;步進(jìn)電機(jī)驅(qū)動(dòng)輸紙機(jī)構(gòu)使信息卡縱向運(yùn)行,從而實(shí)現(xiàn)了信息卡的二維掃描。

模擬信號(hào)處理

模擬信號(hào)處理要考慮信息卡顏色的深淺、字跡的輕重和光強(qiáng)均勻度的變化等引起的脈沖幅度的變化。在光電變換中,對(duì)信號(hào)幅值影響較大的是:光束照射在光敏面上,光強(qiáng)的不均勻性及波動(dòng)影響表現(xiàn)為白電平浮動(dòng)對(duì)比度的變化也會(huì)引起信號(hào)幅值的較大起伏。處理的好壞直接影響到采集圖像的質(zhì)量。其過(guò)程為:CIS圖像傳感器攝取的原始圖像信號(hào),經(jīng)放大、采樣保持及濾波、對(duì)消、浮動(dòng)閾值及二值化等一系列處理,消除或減輕了信息卡背景明暗變化、光源變化、開(kāi)關(guān)噪聲、高低頻干擾等對(duì)系統(tǒng)的影響,獲得高質(zhì)量的二值化信號(hào)。

數(shù)字信號(hào)處理

采用A、B兩塊大容量的SRAM輪流工作在讀或?qū)憼顟B(tài)。合并二值化的信號(hào),同時(shí)為了加快數(shù)據(jù)采集的速度,每次將16位的串行信號(hào)轉(zhuǎn)換為2個(gè)字節(jié)的并行數(shù)據(jù)。在標(biāo)志寄存器的控制下,將信號(hào)暫時(shí)寫(xiě)入A中,同時(shí)計(jì)算機(jī)通過(guò)16位ISA總線從B中取數(shù)據(jù)。在下一周期,二值化信號(hào)寫(xiě)入B中,計(jì)算機(jī)通過(guò)16位ISA總線從A中取數(shù)據(jù)。這樣就保證數(shù)據(jù)傳輸?shù)母咝浴?/p>

邏輯控制

整個(gè)系統(tǒng)的邏輯控制采用La

ttice公司的CPLD——L1032,它負(fù)責(zé)控制輪紙機(jī)構(gòu)、圖像傳感器、兩塊SRAM的輪換;并隨時(shí)檢測(cè)系統(tǒng)的工作狀態(tài),協(xié)調(diào)各部分的工作;并將檢測(cè)到的狀態(tài)即時(shí)送給計(jì)算機(jī),便于計(jì)算機(jī)對(duì)整個(gè)系統(tǒng)的管理。

4軟件處理

在大數(shù)據(jù)量的文檔處理中,為了滿足快速高效地處理,文檔必須針對(duì)OCR技術(shù)或OMR技術(shù)進(jìn)行專門(mén)設(shè)計(jì)。這樣才適合光電閱讀。在信息卡上設(shè)計(jì)定位標(biāo)記塊是一種有效手段。它分為水平定位標(biāo)記塊和垂直定位標(biāo)記塊,并且按照與填寫(xiě)的字符相同的顏色來(lái)印刷。一個(gè)水平定位標(biāo)記塊表示一個(gè)字符行,垂直定位標(biāo)記表示一個(gè)字符列。標(biāo)記填寫(xiě)在以字符行列交叉點(diǎn)為中心的矩形區(qū)域。定位標(biāo)記塊主要用于字符定位和信息卡圖像的傾斜校正,如圖2所示。

另一種有效手段就是常常對(duì)信息卡學(xué)習(xí),獲得相應(yīng)的先驗(yàn)知識(shí),如信息卡的行數(shù)、列數(shù)、標(biāo)記出現(xiàn)的主要區(qū)域、表格類型、每個(gè)黑色定位標(biāo)記塊的大致位置等。由于對(duì)同一批表格而言這些參數(shù)都是相同的,在對(duì)后續(xù)表格的處理中就可利用這些參數(shù)指導(dǎo)圖像的分割和識(shí)別,從而提高了整批表格的處理效率。

硬件系統(tǒng)對(duì)信息卡進(jìn)行掃描信號(hào)處理后,得到二值化的圖像信號(hào),但是二值化的圖像信號(hào)中標(biāo)記所代表的數(shù)字信息才是最終結(jié)果。為此,還要對(duì)二值化的圖像信號(hào)在PC機(jī)上利用軟件進(jìn)行噪聲處理、傾斜校正、分割及識(shí)別處理,得到感興趣的識(shí)別結(jié)果。最后再將識(shí)別結(jié)果進(jìn)行輸出顯示。在基于圖像的OMR技術(shù)中,傾斜校正和圖像分割是最關(guān)鍵的。

傾斜校正

由于輸紙機(jī)構(gòu)有走紙不均勻的情況,信息卡圖像不可避免地會(huì)產(chǎn)生一定的傾斜。因此必須對(duì)傾斜的圖像進(jìn)行旋轉(zhuǎn),旋轉(zhuǎn)到正常位置,才便于圖像分割。

對(duì)信息卡學(xué)習(xí),獲得正常圖像的定位標(biāo)記塊的位置。將傾斜圖像沿X,Y軸方向投影,所有的水平定位標(biāo)記塊和垂直定位標(biāo)記塊會(huì)分別在投影圖上產(chǎn)生對(duì)應(yīng)的峰,從而可以確定水平定位標(biāo)記塊和垂直定位標(biāo)記塊的位置。根據(jù)正常圖像和傾斜圖像的定位標(biāo)記塊的位置,就可以計(jì)算出旋轉(zhuǎn)角δ。

將傾斜圖像f(x,y)繞坐標(biāo)原點(diǎn)O旋轉(zhuǎn)一個(gè)角度-δ,圖像的原始坐標(biāo)為,旋轉(zhuǎn)后的坐標(biāo)為,按式旋轉(zhuǎn)變換,旋轉(zhuǎn)后的圖像為。

圖像分割

根據(jù)上述投影法,可以獲得水平定位標(biāo)記塊和垂直定位標(biāo)記塊的位置,并得到交叉點(diǎn)的位置。由于標(biāo)記填寫(xiě)在以字符行列交叉點(diǎn)為中心的矩形區(qū)域,并且設(shè)矩形區(qū)域長(zhǎng)為X列,寬為Y行,以此交叉點(diǎn)向左向右各擴(kuò)展/2列,向上向下各擴(kuò)展/2行形成一分割框,即矩形區(qū)域完全包含在該分割框內(nèi)。逐行以分割框?yàn)閱挝粚?duì)整個(gè)圖像進(jìn)行分割,并統(tǒng)計(jì)各分割框內(nèi)的黑點(diǎn)數(shù)。若大于某個(gè)閾值,就認(rèn)為有標(biāo)記;否則就沒(méi)有標(biāo)記。再結(jié)合各標(biāo)記事先定義的含義,得到識(shí)別結(jié)果。

基于圖像的OMR技術(shù)采用圖像傳感器作為掃描部件,將信息卡的完整圖像讀入微機(jī),并進(jìn)行圖像識(shí)別。它克服了采

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論