第七章 文字識(shí)別與合成_第1頁
第七章 文字識(shí)別與合成_第2頁
第七章 文字識(shí)別與合成_第3頁
第七章 文字識(shí)別與合成_第4頁
第七章 文字識(shí)別與合成_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第第7章章 文字識(shí)別與合成文字識(shí)別與合成u模式識(shí)別:模式識(shí)別:用計(jì)算機(jī)實(shí)現(xiàn)人的模式識(shí)別能力。用計(jì)算機(jī)實(shí)現(xiàn)人的模式識(shí)別能力。u模式:模式:存在于時(shí)間和空間中可觀察的事物,存在于時(shí)間和空間中可觀察的事物,如果我們可以區(qū)別他們是否相同或是否相似,如果我們可以區(qū)別他們是否相同或是否相似,都可以稱之為模式。模式是我們從事物獲得都可以稱之為模式。模式是我們從事物獲得的信息。的信息。7.1 7.1 模式識(shí)別模式識(shí)別模式識(shí)別系統(tǒng)的基本組成u把輸入模式轉(zhuǎn)換成適合于機(jī)器處理的形式,就是把輸入模式轉(zhuǎn)換成適合于機(jī)器處理的形式,就是數(shù)數(shù)據(jù)獲取據(jù)獲取的過程。的過程。u預(yù)處理預(yù)處理的目的是去除噪聲,加強(qiáng)有用的信息,并對的目

2、的是去除噪聲,加強(qiáng)有用的信息,并對由輸入設(shè)備或其他因素造成的退化現(xiàn)象進(jìn)行復(fù)原,由輸入設(shè)備或其他因素造成的退化現(xiàn)象進(jìn)行復(fù)原,以利于特征提取的進(jìn)行。以利于特征提取的進(jìn)行。u把原始數(shù)據(jù)組成的空間叫做測量空間,把分類識(shí)別把原始數(shù)據(jù)組成的空間叫做測量空間,把分類識(shí)別賴以進(jìn)行的空間叫做特征空間。通過變換可以把在賴以進(jìn)行的空間叫做特征空間。通過變換可以把在維數(shù)較高的測量空間中表示的模式變?yōu)樵诰S數(shù)較低維數(shù)較高的測量空間中表示的模式變?yōu)樵诰S數(shù)較低的特征空間中表示的模式,這就是的特征空間中表示的模式,這就是特征的提取和選特征的提取和選擇擇。u分類決策分類決策是在特征空間中用所設(shè)計(jì)的是在特征空間中用所設(shè)計(jì)的分類器分

3、類器把被識(shí)把被識(shí)別對象歸為某一類別。別對象歸為某一類別。u利用計(jì)算機(jī)自動(dòng)識(shí)別字符的技術(shù),是模式識(shí)別應(yīng)利用計(jì)算機(jī)自動(dòng)識(shí)別字符的技術(shù),是模式識(shí)別應(yīng)用的一個(gè)重要領(lǐng)域。用的一個(gè)重要領(lǐng)域。u50年代,光學(xué)字符識(shí)別器。年代,光學(xué)字符識(shí)別器。u60年代,采用磁性墨水和特殊字體的實(shí)用機(jī)器。年代,采用磁性墨水和特殊字體的實(shí)用機(jī)器。u60年代后期,多種字體和手寫體文字識(shí)別機(jī)。年代后期,多種字體和手寫體文字識(shí)別機(jī)。u70年代,高性能的文字識(shí)別機(jī),著重于漢字識(shí)別的年代,高性能的文字識(shí)別機(jī),著重于漢字識(shí)別的研究。研究。7.2 7.2 文字識(shí)別與文字識(shí)別與OCROCR文字識(shí)別的分類u根據(jù)根據(jù)識(shí)別對象識(shí)別對象的不同,文字識(shí)

4、別可分為西文識(shí)的不同,文字識(shí)別可分為西文識(shí)別、數(shù)字識(shí)別和漢字識(shí)別等。別、數(shù)字識(shí)別和漢字識(shí)別等。u字符可以是手寫體和印刷體,因此文字識(shí)別又字符可以是手寫體和印刷體,因此文字識(shí)別又可分為手寫體文字識(shí)別和印刷體文字識(shí)別??煞譃槭謱戵w文字識(shí)別和印刷體文字識(shí)別。u從對書寫者的要求來分,手寫體字符識(shí)別又分從對書寫者的要求來分,手寫體字符識(shí)別又分為限制性(為限制性(Constrainted)和非限制性()和非限制性(Unconstrained)手寫體字符識(shí)別(或稱自由手)手寫體字符識(shí)別(或稱自由手寫體字符識(shí)別)。寫體字符識(shí)別)。限制性識(shí)別限制性識(shí)別、非限制性識(shí)別非限制性識(shí)別目前,人類所使用的各種文字,絕大多

5、數(shù)都只目前,人類所使用的各種文字,絕大多數(shù)都只包含很包含很小的字符集小的字符集,如阿拉伯?dāng)?shù)字,手寫體識(shí)如阿拉伯?dāng)?shù)字,手寫體識(shí)別已經(jīng)可以做到對書寫者別已經(jīng)可以做到對書寫者不加任何限制不加任何限制。但對于但對于大類別數(shù)的字符集大類別數(shù)的字符集,如漢字,還必須對,如漢字,還必須對書寫者書寫者施加某些限制施加某些限制,以保證較高的識(shí)別率。,以保證較高的識(shí)別率。u根據(jù)采用的根據(jù)采用的輸入設(shè)備輸入設(shè)備不同,文字識(shí)別可分不同,文字識(shí)別可分為為聯(lián)機(jī)識(shí)別和脫機(jī)識(shí)別聯(lián)機(jī)識(shí)別和脫機(jī)識(shí)別。l聯(lián)機(jī)識(shí)別是指將字符書寫在與計(jì)算機(jī)相連的聯(lián)機(jī)識(shí)別是指將字符書寫在與計(jì)算機(jī)相連的書寫板上,由計(jì)算機(jī)根據(jù)字符的書寫軌跡進(jìn)書寫板上,由計(jì)

6、算機(jī)根據(jù)字符的書寫軌跡進(jìn)行實(shí)時(shí)識(shí)別,因此聯(lián)機(jī)識(shí)別主要是針對手寫行實(shí)時(shí)識(shí)別,因此聯(lián)機(jī)識(shí)別主要是針對手寫體而言的;體而言的;l脫機(jī)識(shí)別是指將字符書寫或打印在紙張上,脫機(jī)識(shí)別是指將字符書寫或打印在紙張上,用掃描儀或其他光電轉(zhuǎn)換裝置將其轉(zhuǎn)換成電用掃描儀或其他光電轉(zhuǎn)換裝置將其轉(zhuǎn)換成電信號輸入到計(jì)算機(jī)中,再由機(jī)器進(jìn)行識(shí)別。信號輸入到計(jì)算機(jī)中,再由機(jī)器進(jìn)行識(shí)別。因此,脫機(jī)識(shí)別又稱為光學(xué)文字識(shí)別,即因此,脫機(jī)識(shí)別又稱為光學(xué)文字識(shí)別,即OCR(Optical Character Recognition)。)。l光學(xué)字符識(shí)別(光學(xué)字符識(shí)別(Optical Character Recognition)簡稱)簡稱OC

7、R,是通過掃描儀將數(shù)字、符號和文,是通過掃描儀將數(shù)字、符號和文字以圖形信息的形式輸入計(jì)算機(jī),再由相應(yīng)的字以圖形信息的形式輸入計(jì)算機(jī),再由相應(yīng)的軟件進(jìn)行識(shí)別處理,將原稿上的每一個(gè)字符變軟件進(jìn)行識(shí)別處理,將原稿上的每一個(gè)字符變?yōu)檎_的標(biāo)準(zhǔn)代碼,讓計(jì)算機(jī)自動(dòng)完成字符的為正確的標(biāo)準(zhǔn)代碼,讓計(jì)算機(jī)自動(dòng)完成字符的錄入工作。錄入工作。文字識(shí)別的應(yīng)用文字識(shí)別可應(yīng)用于許多領(lǐng)域,如閱讀、翻譯、文文字識(shí)別可應(yīng)用于許多領(lǐng)域,如閱讀、翻譯、文獻(xiàn)資料的檢索、信件和包裹的分揀、稿件的編輯獻(xiàn)資料的檢索、信件和包裹的分揀、稿件的編輯和校對、大量統(tǒng)計(jì)報(bào)表和卡片的匯總與分析、銀和校對、大量統(tǒng)計(jì)報(bào)表和卡片的匯總與分析、銀行支票的處理

8、、商品發(fā)票的統(tǒng)計(jì)匯總、商品編碼行支票的處理、商品發(fā)票的統(tǒng)計(jì)匯總、商品編碼的識(shí)別、商品倉庫的管理,以及水、電、煤氣、的識(shí)別、商品倉庫的管理,以及水、電、煤氣、房租、人身保險(xiǎn)等費(fèi)用的征收業(yè)務(wù)中的大量信用房租、人身保險(xiǎn)等費(fèi)用的征收業(yè)務(wù)中的大量信用卡片的自動(dòng)處理和辦公室打字員工作的局部自動(dòng)卡片的自動(dòng)處理和辦公室打字員工作的局部自動(dòng)化等?;?。nOCR的基本原理:紙面上照射光以后,將的基本原理:紙面上照射光以后,將反射光由光傳感器以圖像的形式檢出,然反射光由光傳感器以圖像的形式檢出,然后以一個(gè)文字為單位區(qū)分,將各文字的特后以一個(gè)文字為單位區(qū)分,將各文字的特征取出,再識(shí)別是什么文字。征取出,再識(shí)別是什么文

9、字。u正讀正讀u非正讀:誤認(rèn)為其他文字非正讀:誤認(rèn)為其他文字 不能識(shí)別不能識(shí)別7.3 OCR的基本知識(shí)的基本知識(shí)大型OCR的基本結(jié)構(gòu)OCROCR技術(shù)的工作原理技術(shù)的工作原理1.1.圖像處理模塊圖像處理模塊 具有文稿掃描、圖像縮放、具有文稿掃描、圖像縮放、圖像旋轉(zhuǎn)等功能。圖像旋轉(zhuǎn)等功能。2.2.版面劃分模塊版面劃分模塊 包括版面劃分、更改劃分,即包括版面劃分、更改劃分,即對版面的理解、字切分、歸一化等,可選擇自動(dòng)對版面的理解、字切分、歸一化等,可選擇自動(dòng)或手動(dòng)兩種版面劃分方式?;蚴謩?dòng)兩種版面劃分方式。3.3.文字識(shí)別模塊文字識(shí)別模塊 OCROCR軟件的核心部分,主要軟件的核心部分,主要對輸入的漢

10、字進(jìn)行對輸入的漢字進(jìn)行“閱讀閱讀”,但不能一目多行,但不能一目多行,必須逐行切割,對于漢字通常也是一個(gè)字一個(gè)字必須逐行切割,對于漢字通常也是一個(gè)字一個(gè)字地辨認(rèn),即單字識(shí)別,再進(jìn)行歸一化。地辨認(rèn),即單字識(shí)別,再進(jìn)行歸一化。4.4.文字編輯模塊文字編輯模塊 對對OCROCR識(shí)別后的文字進(jìn)行修識(shí)別后的文字進(jìn)行修改、編輯。改、編輯。7.4 7.4 印刷體漢字識(shí)別印刷體漢字識(shí)別7.4.1 7.4.1 印刷體與手寫體印刷體與手寫體n漢字識(shí)別技術(shù)涉及到模式識(shí)別、圖像處理、組漢字識(shí)別技術(shù)涉及到模式識(shí)別、圖像處理、組合論、信息論、計(jì)算機(jī)等多個(gè)學(xué)科,也涉及到合論、信息論、計(jì)算機(jī)等多個(gè)學(xué)科,也涉及到語言文字學(xué)、心理

11、學(xué)等學(xué)科,是一門綜合性的語言文字學(xué)、心理學(xué)等學(xué)科,是一門綜合性的技術(shù)。技術(shù)。漢字字形識(shí)別過程漢字字形識(shí)別過程u漢字識(shí)別前處理漢字識(shí)別前處理u漢字分類和判別漢字分類和判別u漢字識(shí)別后處理漢字識(shí)別后處理漢字識(shí)別技術(shù)是利用計(jì)算機(jī)技術(shù)對漢字靜態(tài)圖形和動(dòng)漢字識(shí)別技術(shù)是利用計(jì)算機(jī)技術(shù)對漢字靜態(tài)圖形和動(dòng)態(tài)漢字信息進(jìn)行態(tài)漢字信息進(jìn)行特征提取特征提取,與預(yù)先存儲(chǔ)在計(jì)算機(jī)內(nèi)的,與預(yù)先存儲(chǔ)在計(jì)算機(jī)內(nèi)的標(biāo)準(zhǔn)漢字特征信息進(jìn)行標(biāo)準(zhǔn)漢字特征信息進(jìn)行匹配匹配,并選擇,并選擇符合特征符合特征的漢字的漢字作為所需識(shí)別的漢字內(nèi)碼。作為所需識(shí)別的漢字內(nèi)碼。u印刷體漢字識(shí)別:印刷體漢字識(shí)別:將紙上文字輸入到計(jì)算機(jī)中,作將紙上文字輸入到

12、計(jì)算機(jī)中,作為一幅圖像存儲(chǔ)在計(jì)算機(jī)的存儲(chǔ)器中,然后根據(jù)需為一幅圖像存儲(chǔ)在計(jì)算機(jī)的存儲(chǔ)器中,然后根據(jù)需要對這些圖像做圖像處理,從中提取出用于識(shí)別的要對這些圖像做圖像處理,從中提取出用于識(shí)別的特征。特征。u手寫體漢字識(shí)別:手寫體漢字識(shí)別:u聯(lián)機(jī)識(shí)別:人在特殊的文字盤上用筆寫字時(shí),計(jì)算機(jī)對聯(lián)機(jī)識(shí)別:人在特殊的文字盤上用筆寫字時(shí),計(jì)算機(jī)對筆的軌跡進(jìn)行跟蹤檢出,并按時(shí)間順序讀取筆的軌跡進(jìn)行跟蹤檢出,并按時(shí)間順序讀取x x、y y的坐標(biāo)的坐標(biāo)然后調(diào)查軌跡,再判斷是什么文字。然后調(diào)查軌跡,再判斷是什么文字。u脫機(jī)識(shí)別:將紙上所寫的文字用光學(xué)方法讀取進(jìn)行文字脫機(jī)識(shí)別:將紙上所寫的文字用光學(xué)方法讀取進(jìn)行文字識(shí)別

13、,識(shí)別,OCROCR就是脫機(jī)文字識(shí)別的機(jī)器。就是脫機(jī)文字識(shí)別的機(jī)器。漢字識(shí)別難度印刷體識(shí)別印刷體識(shí)別最容易最容易已經(jīng)有了大量實(shí)際應(yīng)用,圖書館數(shù)字化已經(jīng)有了大量實(shí)際應(yīng)用,圖書館數(shù)字化脫機(jī)手寫體識(shí)別脫機(jī)手寫體識(shí)別最難最難脫機(jī)手寫體數(shù)字的識(shí)別已有實(shí)際應(yīng)用外,比如郵脫機(jī)手寫體數(shù)字的識(shí)別已有實(shí)際應(yīng)用外,比如郵政編碼的自動(dòng)識(shí)別政編碼的自動(dòng)識(shí)別漢字等文字的脫機(jī)手寫體識(shí)別還處在實(shí)驗(yàn)室階段漢字等文字的脫機(jī)手寫體識(shí)別還處在實(shí)驗(yàn)室階段 聯(lián)機(jī)手寫體識(shí)別聯(lián)機(jī)手寫體識(shí)別相對容易,相對容易,PDAPDA等的推廣,大量應(yīng)用等的推廣,大量應(yīng)用u分類:分類:u識(shí)別字體識(shí)別字體u單體(宋體)印刷漢字識(shí)別單體(宋體)印刷漢字識(shí)別u多

14、體印刷漢字識(shí)別多體印刷漢字識(shí)別u識(shí)別文字品質(zhì)識(shí)別文字品質(zhì)u高品質(zhì)印刷漢字識(shí)別高品質(zhì)印刷漢字識(shí)別u低品質(zhì)印刷漢字識(shí)別低品質(zhì)印刷漢字識(shí)別u應(yīng)用范圍應(yīng)用范圍u專用印刷漢字識(shí)別專用印刷漢字識(shí)別u通用印刷漢字識(shí)別通用印刷漢字識(shí)別7.4.2 印刷體漢字識(shí)別印刷體漢字識(shí)別(1)單體與多體u字形差別體現(xiàn)在:字形差別體現(xiàn)在:u筆劃裝飾及方向角度不同;筆劃裝飾及方向角度不同;u筆劃長短、位置有變化;筆劃長短、位置有變化;u筆劃形態(tài)變化,如黑體筆劃粗而平直,寬度一致;宋筆劃形態(tài)變化,如黑體筆劃粗而平直,寬度一致;宋體橫細(xì)豎粗,有裝飾角;楷體筆劃有較大曲率,其中體橫細(xì)豎粗,有裝飾角;楷體筆劃有較大曲率,其中撇、捺彎曲

15、程度更大,各個(gè)文字大小相差較大;仿宋撇、捺彎曲程度更大,各個(gè)文字大小相差較大;仿宋體橫筆劃略向上傾斜;體橫筆劃略向上傾斜;u筆劃關(guān)系變化:如左偏旁口,黑體為正方形,其他體筆劃關(guān)系變化:如左偏旁口,黑體為正方形,其他體左豎筆較長;左豎筆較長;u偏旁部首占方塊字的比例、位置、形態(tài)方面,不同字偏旁部首占方塊字的比例、位置、形態(tài)方面,不同字體也有差異。體也有差異。(2)高品質(zhì)與低品質(zhì)影響印刷漢字品質(zhì)的主要因素有:影響印刷漢字品質(zhì)的主要因素有:文字:筆劃存在斷開、粘連、油墨深淺不均等;文字:筆劃存在斷開、粘連、油墨深淺不均等;紙張:潔白度、光潔度、薄紙反透等。紙張:潔白度、光潔度、薄紙反透等。版面:污點(diǎn)

16、、行高低不齊、文字旋轉(zhuǎn)等。版面:污點(diǎn)、行高低不齊、文字旋轉(zhuǎn)等。(3)專用與通用專用:文件、某種打印體。專用:文件、某種打印體。通用:書、報(bào)、文件、照排、不同版面、通用:書、報(bào)、文件、照排、不同版面、不同字體、字號。不同字體、字號。n識(shí)別字符集識(shí)別字符集n中文:常用中文:常用40004000字,字,GB2313-80 GB2313-80 一級字一級字37553755個(gè)個(gè),使用頻率,使用頻率99.7%99.7%, ,二級字二級字30083008個(gè),兩級總使用個(gè),兩級總使用頻率頻率99.99%99.99%。n英文,數(shù)字,標(biāo)點(diǎn)符號。英文,數(shù)字,標(biāo)點(diǎn)符號。n識(shí)別字體:宋、仿宋、黑、楷、圓、隸書、魏識(shí)別字

17、體:宋、仿宋、黑、楷、圓、隸書、魏碑等。碑等。n識(shí)別字號識(shí)別字號:2-62-6號。號。n漢字結(jié)構(gòu)復(fù)雜,相似字不易區(qū)分也是識(shí)別的難漢字結(jié)構(gòu)復(fù)雜,相似字不易區(qū)分也是識(shí)別的難點(diǎn)。點(diǎn)。n掃描質(zhì)量影響。掃描質(zhì)量影響。7.4.3 7.4.3 印刷體漢字識(shí)別的難點(diǎn)印刷體漢字識(shí)別的難點(diǎn)文字識(shí)別系統(tǒng)構(gòu)成OCR技術(shù)一般流程流程簡介1)1)圖像獲取圖像獲取將文本轉(zhuǎn)換為圖象點(diǎn)陣將文本轉(zhuǎn)換為圖象點(diǎn)陣掃描儀掃描儀 (Scanner)(Scanner)其它光電掃描設(shè)備其它光電掃描設(shè)備如傳真機(jī),攝像機(jī)如傳真機(jī),攝像機(jī)不同獲取設(shè)備的差異不同獲取設(shè)備的差異掃描儀:最優(yōu)掃描儀:最優(yōu)攝像機(jī):識(shí)別難度大攝像機(jī):識(shí)別難度大流程簡介2 2

18、)圖像預(yù)處理)圖像預(yù)處理濾除干擾噪聲濾除干擾噪聲傾斜校正傾斜校正各種濾波處理各種濾波處理3 3)版面分析)版面分析完成對于文本圖象的總體分析完成對于文本圖象的總體分析區(qū)分出文本段落及排版順序,圖象、表格的區(qū)域區(qū)分出文本段落及排版順序,圖象、表格的區(qū)域?qū)τ谖谋緟^(qū)域?qū)⑦M(jìn)行識(shí)別處理對于文本區(qū)域?qū)⑦M(jìn)行識(shí)別處理對于表格區(qū)域進(jìn)行專用的表格分析及識(shí)別處理對于表格區(qū)域進(jìn)行專用的表格分析及識(shí)別處理對于圖象區(qū)域進(jìn)行壓縮或簡單存儲(chǔ)。對于圖象區(qū)域進(jìn)行壓縮或簡單存儲(chǔ)。流程簡介4 4)行字切分)行字切分將大幅的圖象先切割為行將大幅的圖象先切割為行從圖象行中分離出單個(gè)字符從圖象行中分離出單個(gè)字符5 5)特征提取)特征提取模

19、式表示問題模式表示問題整個(gè)環(huán)節(jié)中最重要的一環(huán),提取的特征的穩(wěn)定性及整個(gè)環(huán)節(jié)中最重要的一環(huán),提取的特征的穩(wěn)定性及有效性,直接決定了識(shí)別的性能有效性,直接決定了識(shí)別的性能從單個(gè)字符圖象上提取統(tǒng)計(jì)特征或結(jié)構(gòu)特征從單個(gè)字符圖象上提取統(tǒng)計(jì)特征或結(jié)構(gòu)特征包括細(xì)化包括細(xì)化(Thinning)(Thinning),歸一化,歸一化( (大小等大小等) )等步驟等步驟流程簡介6 6)文字識(shí)別)文字識(shí)別模式識(shí)別研究范疇模式識(shí)別研究范疇從學(xué)習(xí)得到的特征庫中找到與待識(shí)字符相似度最從學(xué)習(xí)得到的特征庫中找到與待識(shí)字符相似度最高的字符類高的字符類7 7)后處理)后處理利用詞義、詞頻、語法規(guī)則或語料庫等語言先驗(yàn)利用詞義、詞頻、

20、語法規(guī)則或語料庫等語言先驗(yàn)知識(shí)對識(shí)別結(jié)果進(jìn)行校正的過程知識(shí)對識(shí)別結(jié)果進(jìn)行校正的過程歸一化 對不同大小的文字做變換,使之成為同一尺寸大小對不同大小的文字做變換,使之成為同一尺寸大小的文字,這個(gè)過程稱做的文字,這個(gè)過程稱做大小歸一化大小歸一化。 常用的大小歸一化常用的大小歸一化方法有兩種方法有兩種。一種一種是將文字的外邊框按比例線性放大或縮小成為規(guī)定是將文字的外邊框按比例線性放大或縮小成為規(guī)定尺寸的文字。尺寸的文字。一種一種是根據(jù)水平和垂直兩個(gè)方向文字黑像素的分布進(jìn)行是根據(jù)水平和垂直兩個(gè)方向文字黑像素的分布進(jìn)行大小歸一化。大小歸一化。對于后一種歸一化方法,先計(jì)算文字的對于后一種歸一化方法,先計(jì)算文

21、字的: :c c( (i,j i,j ) ) 意義如下:意義如下:c c( (i,j i,j ) = 1 ) = 1 表示該像素點(diǎn)為文字黑像素;表示該像素點(diǎn)為文字黑像素;c c( (i,j i,j ) = 0 ) = 0 表示該像素點(diǎn)為背景。表示該像素點(diǎn)為背景。A A, , B B, , L L, , R R分別分別文字的上下左右邊界。文字的上下左右邊界。,BRIi A j LGik i j,BRJi A j LGjk i j則質(zhì)心則質(zhì)心G GI I和和G GJ J為為( , )( , ),BRk i jc i jc i ji A j L,BRIi A j LGik i j,BRJi A j

22、LGjk i j下面計(jì)算水平和垂直方向的下面計(jì)算水平和垂直方向的散度散度I I 和和 J J :2( , )2IRBIj Li Ak i j i G( , )( , ),BRk i jc i jc i ji A j L2( , )J2RBJj Li Ak i jj G1 1)復(fù)雜指數(shù))復(fù)雜指數(shù)2 2)四邊碼)四邊碼3 3)粗外圍特征)粗外圍特征4 4)粗網(wǎng)格特征)粗網(wǎng)格特征5 5)筆劃密度特征)筆劃密度特征6 6)漢字特征點(diǎn))漢字特征點(diǎn) 7.4.4 7.4.4 印刷體漢字的特征描述印刷體漢字的特征描述1) 復(fù)雜指數(shù)文字文字x x方向和方向和y y方向的復(fù)雜指數(shù)被定義為:方向的復(fù)雜指數(shù)被定義為:

23、式中,式中,c cx x和和c cy y分別為分別為x x方向和方向和y y方向的復(fù)雜指數(shù)。方向的復(fù)雜指數(shù)。L Lx x和和L Ly y分分別為別為x x方向和方向和y y方向黑像素的總數(shù)。而方向黑像素的總數(shù)。而x x和和y y分別為分別為x x方方向和向和y y方向質(zhì)心二次矩的平方根:方向質(zhì)心二次矩的平方根:式中,式中,G GI I和和G GJ J分別為文字質(zhì)心位置的分別為文字質(zhì)心位置的i i和和j j坐標(biāo)值,坐標(biāo)值,N N和和M M是是文字點(diǎn)陣的長和寬。文字點(diǎn)陣的長和寬。,LLyxccxyxy( , )11( , ),k i jN Mijc i jc i j 2112,INMxijk i

24、ji G2112,JNMyijk i jj G從文字四周邊框開始,向內(nèi)取適當(dāng)寬度,以此寬度分割從文字四周邊框開始,向內(nèi)取適當(dāng)寬度,以此寬度分割出文字四周的四個(gè)部分。根據(jù)每一個(gè)部分中含有文字黑出文字四周的四個(gè)部分。根據(jù)每一個(gè)部分中含有文字黑像素的多少分為四級編碼(像素的多少分為四級編碼(0 0,1 1,2 2,3 3)。)。2) 四邊碼一次粗外圍特征反映了一次粗外圍特征反映了文字輪廓文字輪廓特征,二次粗外圍特征在特征,二次粗外圍特征在某種程度上反映了某種程度上反映了文字內(nèi)部結(jié)構(gòu)文字內(nèi)部結(jié)構(gòu)。3)粗外圍特征粗外圍特征抽取的過程為:首先求出文字的外邊框,再把粗外圍特征抽取的過程為:首先求出文字的外邊

25、框,再把p pq q點(diǎn)陣文字分割成點(diǎn)陣文字分割成n nn n份,份,n n通常取通常取8 8。再將第二次與文字線相碰的非文字部分再將第二次與文字線相碰的非文字部分面積和全部文字面積之比作為二次粗外面積和全部文字面積之比作為二次粗外圍特征圍特征P P2 i 2 i ( ( i i =1,4=1,4n n2 2 ) ,) ,形成形成8 8n n2 2維的特征維的特征向量向量p p。從文字四邊框各向?qū)厭呙瑁?jì)算最初與文字筆劃相碰的非從文字四邊框各向?qū)厭呙?,?jì)算最初與文字筆劃相碰的非文字部分的面積和全部面積之比作為一次粗外圍特征文字部分的面積和全部面積之比作為一次粗外圍特征P P1 i 1 i (

26、 (i i=1,4=1,4n n 2 2 ),),4)粗網(wǎng)格特征把加框把加框p pq q點(diǎn)陣文字分割成點(diǎn)陣文字分割成n nn n份,份,n n通常取通常取8 8,取,取每份中黑像素?cái)?shù)對整個(gè)文字黑像素?cái)?shù)的比例,將所每份中黑像素?cái)?shù)對整個(gè)文字黑像素?cái)?shù)的比例,將所有有n nn n值排成一列而形成值排成一列而形成n n2 2維特征向量。維特征向量。粗網(wǎng)格特征體現(xiàn)了文字整體形狀的分布,但該特征粗網(wǎng)格特征體現(xiàn)了文字整體形狀的分布,但該特征抗筆劃位置干擾的能力差??构P劃位置干擾的能力差。5)筆劃密度特征u在加框的在加框的p pq q點(diǎn)陣中,向不同的方向投影,點(diǎn)陣中,向不同的方向投影,對文字黑像素的個(gè)數(shù)做累加計(jì)

27、算,形成筆劃密對文字黑像素的個(gè)數(shù)做累加計(jì)算,形成筆劃密度直方圖。度直方圖。u投影能表現(xiàn)圖像的某種特征信息。投影能表現(xiàn)圖像的某種特征信息。u給定一條直線,用垂直該直線的一簇等間距給定一條直線,用垂直該直線的一簇等間距直線將一幅二值圖像分割成若干條,每一條內(nèi)直線將一幅二值圖像分割成若干條,每一條內(nèi)像素值為像素值為1 1的像素個(gè)數(shù)為該條二值圖像在給定的像素個(gè)數(shù)為該條二值圖像在給定直線上的投影。直線上的投影。 對角線投影對角線投影 設(shè)行和列的標(biāo)號分別用設(shè)行和列的標(biāo)號分別用i和和j表示。若圖像矩表示。若圖像矩陣為陣為n行行m列,則列,則i和和j的范圍分別為的范圍分別為0 0到到n-1和和0 0到到m-1

28、。假設(shè)對角線的標(biāo)號。假設(shè)對角線的標(biāo)號d用行和列的仿射變換用行和列的仿射變換(線性組合加上常數(shù))計(jì)算,即:(線性組合加上常數(shù))計(jì)算,即: d = ai+ bj + c 對角線投影共對應(yīng)對角線投影共對應(yīng)n+m-1n+m-1個(gè)條,其中仿射個(gè)條,其中仿射變換把右上角像素映射成對角線投影的第一個(gè)變換把右上角像素映射成對角線投影的第一個(gè)位置,把左下角像素映射成最后一個(gè)位置,如位置,把左下角像素映射成最后一個(gè)位置,如圖所示,則當(dāng)前行列對應(yīng)的標(biāo)號圖所示,則當(dāng)前行列對應(yīng)的標(biāo)號d d的公式為:的公式為: d = i - j + m - 1 二值圖像及其對二值圖像及其對角線上的投影圖角線上的投影圖數(shù)字字符的垂直投影

29、和上下邊緣投影對比數(shù)字字符的垂直投影和上下邊緣投影對比 通常取水平、垂直、通常取水平、垂直、450、和、和1350四個(gè)掃描方四個(gè)掃描方向,每個(gè)方向取向,每個(gè)方向取n(通常取通常取n=16)個(gè)值作為特征,個(gè)值作為特征,形成形成4n維特征向量。維特征向量。這種從文字四個(gè)方向抽取的筆劃密度特征叫做這種從文字四個(gè)方向抽取的筆劃密度特征叫做四方向筆劃密度特征。它不但對印刷體漢字分四方向筆劃密度特征。它不但對印刷體漢字分類有較好的效果,對手寫印刷體漢字分類也具類有較好的效果,對手寫印刷體漢字分類也具有價(jià)值。有價(jià)值。6)漢字特征點(diǎn) 一個(gè)漢字的筆劃上和背景中的關(guān)鍵點(diǎn)是漢字結(jié)構(gòu)的一一個(gè)漢字的筆劃上和背景中的關(guān)鍵

30、點(diǎn)是漢字結(jié)構(gòu)的一種本質(zhì)字形特征。種本質(zhì)字形特征。 在一幅二值化圖像中,漢字信在一幅二值化圖像中,漢字信息絕大部分集中在漢字骨架上,而息絕大部分集中在漢字骨架上,而漢字骨架信息又大多數(shù)集中在若干漢字骨架信息又大多數(shù)集中在若干特征點(diǎn)(稱為特征點(diǎn)(稱為筆劃特征點(diǎn)筆劃特征點(diǎn))上。)上。端點(diǎn)端點(diǎn)是筆劃的起(或終)點(diǎn)且不與別的筆劃相接;是筆劃的起(或終)點(diǎn)且不與別的筆劃相接;折點(diǎn)折點(diǎn)是筆劃方向出現(xiàn)顯著變化的點(diǎn);是筆劃方向出現(xiàn)顯著變化的點(diǎn);歧點(diǎn)歧點(diǎn)是三叉點(diǎn),要求其中兩個(gè)筆段分支方向相同;是三叉點(diǎn),要求其中兩個(gè)筆段分支方向相同;交點(diǎn)交點(diǎn)是四叉點(diǎn)且有兩對相等的對頂角。是四叉點(diǎn)且有兩對相等的對頂角。端、折點(diǎn)端、折

31、點(diǎn)決定了一個(gè)漢字的筆劃位置和形狀;決定了一個(gè)漢字的筆劃位置和形狀;歧點(diǎn)、交點(diǎn)歧點(diǎn)、交點(diǎn)決定了不同筆劃間的相互連接關(guān)系。決定了不同筆劃間的相互連接關(guān)系。 同一漢字的特征點(diǎn)很少變動(dòng)。其中折點(diǎn)、同一漢字的特征點(diǎn)很少變動(dòng)。其中折點(diǎn)、交點(diǎn)更穩(wěn)定。交點(diǎn)更穩(wěn)定。 使用漢字特征點(diǎn),原理上就能很好識(shí)別多使用漢字特征點(diǎn),原理上就能很好識(shí)別多體印刷漢字,甚至可以識(shí)別手寫體漢字,把印體印刷漢字,甚至可以識(shí)別手寫體漢字,把印刷體漢字和手寫規(guī)整的漢字識(shí)別的方法統(tǒng)于一刷體漢字和手寫規(guī)整的漢字識(shí)別的方法統(tǒng)于一個(gè)系統(tǒng)中。個(gè)系統(tǒng)中。 漢字特征點(diǎn)反映了漢字結(jié)構(gòu)特征。漢字特征點(diǎn)反映了漢字結(jié)構(gòu)特征。 用特征點(diǎn)來識(shí)別漢字,可以增加抗噪聲

32、能用特征點(diǎn)來識(shí)別漢字,可以增加抗噪聲能力,提高實(shí)用性。力,提高實(shí)用性。 通常情況下,要提取筆劃的特征點(diǎn),首先通常情況下,要提取筆劃的特征點(diǎn),首先要對文字圖像處理,將文字的筆劃變細(xì),這個(gè)過要對文字圖像處理,將文字的筆劃變細(xì),這個(gè)過程叫做程叫做細(xì)化細(xì)化。細(xì)化細(xì)化 細(xì)化是把區(qū)域縮成線條、逼近中心線(骨細(xì)化是把區(qū)域縮成線條、逼近中心線(骨架或核線)的一種圖像處理。架或核線)的一種圖像處理。 要求:要求: 1 1)連通圖像區(qū)域必須細(xì)化成連通線結(jié)構(gòu);連通圖像區(qū)域必須細(xì)化成連通線結(jié)構(gòu); 2)細(xì)化結(jié)果最少應(yīng)該是細(xì)化結(jié)果最少應(yīng)該是8連通;連通; 3)保留近似終止線的位置;保留近似終止線的位置; 4)細(xì)化結(jié)果應(yīng)該

33、近似于中軸線;細(xì)化結(jié)果應(yīng)該近似于中軸線; 5)由細(xì)化引起的附加突刺由細(xì)化引起的附加突刺(短分支短分支)應(yīng)該是最小應(yīng)該是最小的。的。鄰近細(xì)化迭代算法鄰近細(xì)化迭代算法 1、對于每一個(gè)像素,如果、對于每一個(gè)像素,如果)沒有上近鄰(下近鄰左近鄰右)沒有上近鄰(下近鄰左近鄰右近鄰);近鄰); )不是孤立點(diǎn)或終止線;)不是孤立點(diǎn)或終止線;)去除該像素點(diǎn)不會(huì)斷開區(qū)域,則去)去除該像素點(diǎn)不會(huì)斷開區(qū)域,則去除該像素點(diǎn)。除該像素點(diǎn)。 2、重復(fù)這一步驟直到?jīng)]有像素點(diǎn)可以去除、重復(fù)這一步驟直到?jīng)]有像素點(diǎn)可以去除為止。為止。1 1)相似性度量方法)相似性度量方法2 2)句法模式識(shí)別方法)句法模式識(shí)別方法3 3)統(tǒng)計(jì)模式

34、識(shí)別方法)統(tǒng)計(jì)模式識(shí)別方法4 4)分類策略)分類策略7.4.5 7.4.5 漢字識(shí)別方法漢字識(shí)別方法1)相似性度量方法在選取了特征之后,需要選擇或?qū)ふ疫m當(dāng)?shù)呐袆e準(zhǔn)則,從在選取了特征之后,需要選擇或?qū)ふ疫m當(dāng)?shù)呐袆e準(zhǔn)則,從而判斷出待識(shí)別的文字的特征與哪一個(gè)類別的特征最近。而判斷出待識(shí)別的文字的特征與哪一個(gè)類別的特征最近。,1mD x Gxgiii,1,1 222().()11mx gi ix GiR x Gx Gmmxgiiii1 21,TD x Gx Gx G設(shè)設(shè)x,Gx,G表示待識(shí)別文字的特征向量和標(biāo)準(zhǔn)類別特征矢量。表示待識(shí)別文字的特征向量和標(biāo)準(zhǔn)類別特征矢量。常用的距離度量準(zhǔn)則如下:常用的距離

35、度量準(zhǔn)則如下:(4 4)復(fù)合相似度)復(fù)合相似度22 1/2*0( , ) ( . ) | |jjR x Gxx 其中:其中:2200122 1,2122212GGGGGGxyGG22 1/20( . ) | |jjxx12120001()|/ |,2(1)GGGGGG(5 5)混合相似度)混合相似度2.1222.0,xxjjRxGx 式中:式中:是常數(shù),是常數(shù),2,01222,0GGggjjjGGggjjG Gg g是和是和x x極相似的標(biāo)準(zhǔn)文字特征向量(平均值)極相似的標(biāo)準(zhǔn)文字特征向量(平均值)2 ) 句法模式識(shí)別方法早期漢字識(shí)別研究的主要方法特點(diǎn):注意漢字的組成結(jié)構(gòu)早期漢字識(shí)別研究的主要方

36、法特點(diǎn):注意漢字的組成結(jié)構(gòu)漢字圖形結(jié)構(gòu)復(fù)雜,但規(guī)律性強(qiáng),含豐富的結(jié)構(gòu)信息漢字圖形結(jié)構(gòu)復(fù)雜,但規(guī)律性強(qiáng),含豐富的結(jié)構(gòu)信息從漢字的構(gòu)成上分析。從漢字的構(gòu)成上分析。筆劃筆劃( (橫豎撇點(diǎn)折橫豎撇點(diǎn)折) )偏旁部首偏旁部首字。字。由這些基元及其相互關(guān)系完全可以精確地對漢字加以由這些基元及其相互關(guān)系完全可以精確地對漢字加以描述。描述。類比類比類比文章結(jié)構(gòu)類比文章結(jié)構(gòu)單字單字詞詞短語短語句子句子篇章,篇章,按語法規(guī)律組成。按語法規(guī)律組成。識(shí)別過程:編譯理論中的句法分析。識(shí)別過程:編譯理論中的句法分析。訓(xùn)練過程訓(xùn)練過程建立所有漢字的解析圖描述建立所有漢字的解析圖描述基本單元基本單元基本單元之間的拓?fù)浣Y(jié)構(gòu)基本

37、單元之間的拓?fù)浣Y(jié)構(gòu)漢字的解析圖表示示例識(shí)別過程識(shí)別過程圖像獲取,預(yù)處理,二值化,圖像獲取,預(yù)處理,二值化,基元提取基元提取基本筆畫提取基本筆畫提取偏旁部首提取偏旁部首提取解析圖表示解析圖表示句法分析過程句法分析過程Top-downTop-down相似度計(jì)算方法相似度計(jì)算方法拓?fù)湎嗨菩酝負(fù)湎嗨菩怨?jié)點(diǎn)相似性節(jié)點(diǎn)相似性句法模式識(shí)別方法優(yōu)點(diǎn)優(yōu)點(diǎn)理論上是比較恰當(dāng)?shù)?,對字體變化的適應(yīng)性理論上是比較恰當(dāng)?shù)?,對字體變化的適應(yīng)性強(qiáng),區(qū)分相似字能力強(qiáng)。強(qiáng),區(qū)分相似字能力強(qiáng)。缺點(diǎn)缺點(diǎn)描述復(fù)雜,匹配過程復(fù)雜度也高。描述復(fù)雜,匹配過程復(fù)雜度也高??垢蓴_能力差,結(jié)構(gòu)基元提取困難,導(dǎo)致推抗干擾能力差,結(jié)構(gòu)基元提取困難,導(dǎo)致

38、推理過程難以進(jìn)行。理過程難以進(jìn)行。實(shí)用中文本圖象中存在著各種干擾,如傾實(shí)用中文本圖象中存在著各種干擾,如傾斜,扭曲,斷裂,粘連,紙張上的污點(diǎn),斜,扭曲,斷裂,粘連,紙張上的污點(diǎn),對比度差等等對比度差等等純結(jié)構(gòu)模式識(shí)別方法已經(jīng)逐漸衰落。純結(jié)構(gòu)模式識(shí)別方法已經(jīng)逐漸衰落。3)統(tǒng)計(jì)模式識(shí)別方法基本思路基本思路將字符點(diǎn)陣看作一個(gè)整體,其所用的特征是從這將字符點(diǎn)陣看作一個(gè)整體,其所用的特征是從這個(gè)整體上經(jīng)過大量的統(tǒng)計(jì)而得到的。個(gè)整體上經(jīng)過大量的統(tǒng)計(jì)而得到的。缺點(diǎn)缺點(diǎn)細(xì)分能力較弱,區(qū)分相似字的能力差一些。細(xì)分能力較弱,區(qū)分相似字的能力差一些。優(yōu)點(diǎn)優(yōu)點(diǎn)抗干擾性強(qiáng),尤其適用于有污染的數(shù)據(jù)。抗干擾性強(qiáng),尤其適用于

39、有污染的數(shù)據(jù)。匹配與分類的算法簡單,易于實(shí)現(xiàn)。匹配與分類的算法簡單,易于實(shí)現(xiàn)。3)統(tǒng)計(jì)模式識(shí)別方法n直接圖像特征直接圖像特征n變換特征變換特征 投影直方圖投影直方圖矩特征矩特征 幾何描繪子幾何描繪子 筆劃密度特征筆劃密度特征 外圍特征外圍特征 直接圖像特征字符的圖像直接作為特征與字典中的模板相比,相字符的圖像直接作為特征與字典中的模板相比,相似度最高的模板類即為識(shí)別結(jié)果。似度最高的模板類即為識(shí)別結(jié)果。優(yōu)點(diǎn)優(yōu)點(diǎn)簡單易行,可以并行處理簡單易行,可以并行處理缺點(diǎn)缺點(diǎn)不同大小、不同字體需要大量模板不同大小、不同字體需要大量模板對于傾斜、筆劃變粗變細(xì)均無良好的適應(yīng)能力對于傾斜、筆劃變粗變細(xì)均無良好的適應(yīng)

40、能力變換特征字符圖像進(jìn)行某種數(shù)學(xué)變換字符圖像進(jìn)行某種數(shù)學(xué)變換二值類變換,如二值類變換,如Walsh, Hardama變換變換更復(fù)雜的變換,如更復(fù)雜的變換,如KL, Fourier變換變換, 余弦變換余弦變換(DCT)優(yōu)點(diǎn)優(yōu)點(diǎn)變換后的特征的維數(shù)通常會(huì)降低,更緊湊,利于分類變換后的特征的維數(shù)通常會(huì)降低,更緊湊,利于分類缺點(diǎn)缺點(diǎn)多數(shù)變換不是旋轉(zhuǎn)不變的,因此對于傾斜變形字符的多數(shù)變換不是旋轉(zhuǎn)不變的,因此對于傾斜變形字符的識(shí)別會(huì)有較大的偏差識(shí)別會(huì)有較大的偏差有些最優(yōu)變換特征的運(yùn)算復(fù)雜度較高,如:有些最優(yōu)變換特征的運(yùn)算復(fù)雜度較高,如:K-L變換,變換,在最小均方誤差意義下是最優(yōu)的變換,但是運(yùn)算量大在最小均

41、方誤差意義下是最優(yōu)的變換,但是運(yùn)算量大變換特征:矩特征在線性變換下保持不變的矩:不變矩在線性變換下保持不變的矩:不變矩但往往很難保證線性變換這一前提條件但往往很難保證線性變換這一前提條件( , )( , ),p i jc i jc i ji j記記注:灰度概率分布注:灰度概率分布,( )(1),kIIi jB kiAp i j,( )(1),kJJi jB kjAp i j中心矩中心矩,( ),kIi jA ki p i j則質(zhì)心坐標(biāo)為則質(zhì)心坐標(biāo)為,( ),kJi jA kj p i j原點(diǎn)矩原點(diǎn)矩(1),(1)IjAA變換特征: 投影直方圖利用字符圖象在特定方向的投影作為特征利用字符圖象在特

42、定方向的投影作為特征通常使用水平及垂直方向通常使用水平及垂直方向垂直垂直方向投影方向投影水平水平方向投影方向投影好好jio( ),Ijp ip i j第第i條線上黑像素的個(gè)數(shù)條線上黑像素的個(gè)數(shù)占總筆畫點(diǎn)數(shù)的百分比占總筆畫點(diǎn)數(shù)的百分比( ),Jipjp i j第第j條線上黑像素的個(gè)數(shù)條線上黑像素的個(gè)數(shù)占總筆畫點(diǎn)數(shù)的百分比占總筆畫點(diǎn)數(shù)的百分比,01c i jor字符黑白圖像字符黑白圖像變換特征: 投影直方圖變換特征:幾何描繪子幾何描繪子幾何描繪子樣條曲線近似樣條曲線近似在輪廓上找到曲率大的折點(diǎn),利用在輪廓上找到曲率大的折點(diǎn),利用SplineSpline曲線來近曲線來近似相鄰折點(diǎn)之間的輪廓線,并用似

43、相鄰折點(diǎn)之間的輪廓線,并用SplineSpline曲線參數(shù)作曲線參數(shù)作為特征。為特征。傅立葉描繪子傅立葉描繪子 利用傅立葉函數(shù)模擬封閉的輪廓線,將傅立葉函數(shù)利用傅立葉函數(shù)模擬封閉的輪廓線,將傅立葉函數(shù)的各個(gè)系數(shù)作為特征。的各個(gè)系數(shù)作為特征。對于輪廓線不封閉的字符圖象不適用,難用于筆劃對于輪廓線不封閉的字符圖象不適用,難用于筆劃斷裂的字?jǐn)嗔训淖?漢字識(shí)別通常都采用漢字識(shí)別通常都采用層次化的分類層次化的分類結(jié)構(gòu),即結(jié)構(gòu),即對漢字字庫做多級分類,然后再細(xì)分判別,從而對漢字字庫做多級分類,然后再細(xì)分判別,從而大大提高識(shí)別效率。大大提高識(shí)別效率。 一般把最后一級分類稱為一般把最后一級分類稱為細(xì)分類細(xì)分類

44、,而前面的,而前面的分類稱為分類稱為粗分類粗分類。4)分類策略:多級分類對漢字的粗分類的要求。對漢字的粗分類的要求。(1 1)粗分類的正確分類率和分類穩(wěn)定性要高。)粗分類的正確分類率和分類穩(wěn)定性要高。(2 2)粗分類的速度要快。)粗分類的速度要快。(3 3)粗分類的特征要簡單,分類字典小,節(jié)約存儲(chǔ)空間。)粗分類的特征要簡單,分類字典小,節(jié)約存儲(chǔ)空間。(4 4)粗分類方法要和細(xì)分類方法相協(xié)調(diào)。)粗分類方法要和細(xì)分類方法相協(xié)調(diào)。樹分類:效率高、分類樹結(jié)構(gòu)龐大,錯(cuò)分率累加,分類樹分類:效率高、分類樹結(jié)構(gòu)龐大,錯(cuò)分率累加,分類不夠穩(wěn)定。不夠穩(wěn)定。圖中圖中“3”3”所代表的文字不僅在類別所代表的文字不僅

45、在類別 A A 中,在噪聲情況中,在噪聲情況下,也可能出現(xiàn)在下,也可能出現(xiàn)在 C C 中。因此這是一種考慮了噪聲干中。因此這是一種考慮了噪聲干擾等因素的特殊的分類方法。擾等因素的特殊的分類方法。所以要求細(xì)分判別所以要求細(xì)分判別 C C 類中的文字時(shí)考慮到類中的文字時(shí)考慮到“3”3”所代表所代表的文字的存在。的文字的存在。粗分類方法:包含配選法 分類用的摸板是漢字偏旁部首的骨架圖形。分類時(shí),分類用的摸板是漢字偏旁部首的骨架圖形。分類時(shí),將輸入文字和各標(biāo)準(zhǔn)模板做將輸入文字和各標(biāo)準(zhǔn)模板做“與與”運(yùn)算運(yùn)算。 部首相同的標(biāo)準(zhǔn)模板相部首相同的標(biāo)準(zhǔn)模板相“與與”的結(jié)果和標(biāo)準(zhǔn)模板本身的結(jié)果和標(biāo)準(zhǔn)模板本身的圖形

46、一致。所以,根據(jù)未知輸入文字圖像和分類用標(biāo)準(zhǔn)的圖形一致。所以,根據(jù)未知輸入文字圖像和分類用標(biāo)準(zhǔn)模板圖像模板圖像“與與”的結(jié)果是否相同于該標(biāo)準(zhǔn)圖像,可以判別的結(jié)果是否相同于該標(biāo)準(zhǔn)圖像,可以判別出未知文字屬于哪一類。出未知文字屬于哪一類。 在沒有和標(biāo)準(zhǔn)圖像相在沒有和標(biāo)準(zhǔn)圖像相“與與”匹配前,先把未知文字圖匹配前,先把未知文字圖像橫線加粗成大于等于像橫線加粗成大于等于3 3個(gè)像素寬,以利于包含相匹配的個(gè)像素寬,以利于包含相匹配的模板。模板。 為避免文字筆劃絕對位置移動(dòng)帶來的干擾,需要把圖為避免文字筆劃絕對位置移動(dòng)帶來的干擾,需要把圖像沿上下左右四個(gè)方向平移一個(gè)像素,然后分別與標(biāo)準(zhǔn)模像沿上下左右四個(gè)方

47、向平移一個(gè)像素,然后分別與標(biāo)準(zhǔn)模板相匹配。只要有一次匹配成功,就判斷該文字屬于標(biāo)準(zhǔn)板相匹配。只要有一次匹配成功,就判斷該文字屬于標(biāo)準(zhǔn)模板圖像的類別。由此可見,包含匹配法實(shí)際上就是模板圖像的類別。由此可見,包含匹配法實(shí)際上就是模板模板匹配法匹配法。 當(dāng)識(shí)別字?jǐn)?shù)增多時(shí),由于偏旁部首的標(biāo)準(zhǔn)模板增加很當(dāng)識(shí)別字?jǐn)?shù)增多時(shí),由于偏旁部首的標(biāo)準(zhǔn)模板增加很少,其分類速度比粗外圍和粗網(wǎng)絡(luò)法容易提高,而存儲(chǔ)量少,其分類速度比粗外圍和粗網(wǎng)絡(luò)法容易提高,而存儲(chǔ)量要求較少。要求較少。細(xì)分類方法:基于小筆段特征的層次結(jié)構(gòu)若干小筆段首尾相連構(gòu)成了若干小筆段首尾相連構(gòu)成了漢字筆劃,如右圖所示。用漢字筆劃,如右圖所示。用小筆段作

48、為基元一方面易于小筆段作為基元一方面易于提取;另一方面它又保留了提??;另一方面它又保留了漢字基本的筆劃結(jié)構(gòu)信息,漢字基本的筆劃結(jié)構(gòu)信息,且在字體變化或噪聲干擾條且在字體變化或噪聲干擾條件下,仍能保持筆劃結(jié)構(gòu)的件下,仍能保持筆劃結(jié)構(gòu)的絕大部分信息。絕大部分信息。 漢字字體改變和干擾影響會(huì)使得小筆段特征向量有漢字字體改變和干擾影響會(huì)使得小筆段特征向量有變化。因此,用層次結(jié)構(gòu)法對未知漢字匹配判別時(shí),采變化。因此,用層次結(jié)構(gòu)法對未知漢字匹配判別時(shí),采用用精確匹配方法往往不能奏效精確匹配方法往往不能奏效。 較好的辦法是采用由漢字小筆段相關(guān)系數(shù)(相關(guān)系較好的辦法是采用由漢字小筆段相關(guān)系數(shù)(相關(guān)系數(shù)反映了相

49、互約束關(guān)系)約束的數(shù)反映了相互約束關(guān)系)約束的松弛匹配算法松弛匹配算法。這種算。這種算法能有效地吸收同一漢字不同字體的變化,而所能容許法能有效地吸收同一漢字不同字體的變化,而所能容許的變化范圍由小筆段間的相關(guān)系數(shù)所制約。的變化范圍由小筆段間的相關(guān)系數(shù)所制約。細(xì)分類方法:差筆劃粗分類后,通常每類中含有許多形狀相似的文字,采用差粗分類后,通常每類中含有許多形狀相似的文字,采用差筆劃方法,可以較好地區(qū)分這些形狀相似的文字。差筆劃筆劃方法,可以較好地區(qū)分這些形狀相似的文字。差筆劃細(xì)分的算法如下:設(shè)粗分類后,細(xì)分的算法如下:設(shè)粗分類后,類中只有兩個(gè)文字類中只有兩個(gè)文字A A和和B B。(1 1)預(yù)先根據(jù)文字)預(yù)先根據(jù)文字A A、B B特征點(diǎn)特征點(diǎn)(如端點(diǎn)、折點(diǎn)等)坐標(biāo)作成(如端點(diǎn)、折點(diǎn)等)坐標(biāo)作成A A、B B的骨架圖形的骨架圖形S SA A,S SB B,如下圖。,如下圖。(3 3)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論