下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
手寫字體的識別問題研究國內(nèi)外文獻綜述1.1國外現(xiàn)狀國外學(xué)者對手寫字體識別的研究最早可追溯到1929年,在這一年里,德國學(xué)者Tausheck首次給光學(xué)字符識別(OCR)做了明確定義,并首次申請OCR專利權(quán),若干年后,美國學(xué)者Handel提出將OCR技術(shù)和文字識別結(jié)合運用的新思路REF_Ref29831\r\h[10]。1958年,Crimsalde等人首次采用計算機進行OCR技術(shù)實現(xiàn),運用固定模式掃描目標(biāo)字符的方法,獲得識別結(jié)果REF_Ref29880\r\h[11]。60年代初,由商業(yè)公司研發(fā)的第一代OCR產(chǎn)品面世,該產(chǎn)品能識別印刷體數(shù)字及少量符號等REF_Ref29915\r\h[12]。80年代,西方國家紛紛成立OCR技術(shù)研究所REF_Ref29955\r\h[13],一些研究者開始產(chǎn)生將快速發(fā)展的神經(jīng)網(wǎng)絡(luò)運用到手寫字體識別的想法,并為此展開一系列實踐操作。1989年,YannLeCun與其團隊首次提出用卷積神經(jīng)網(wǎng)絡(luò)來識別分類圖像數(shù)據(jù),但早期的卷積神經(jīng)網(wǎng)絡(luò)在文字識別上效果不如當(dāng)時SVM等算法,無法得到廣泛應(yīng)用REF_Ref29991\r\h[14]。直到2012年,Hinton及其團隊在圖像識別大賽中采用了全新的深層模型和Dropout技術(shù),搭建AlexNet卷積神經(jīng)網(wǎng)絡(luò)奪得桂冠,大幅降低了利用卷積神經(jīng)網(wǎng)絡(luò)進行圖像識別的錯識率REF_Ref30046\r\h[15]。自此,人們對基于深度學(xué)習(xí)的圖像識別研究達到了前所未有的熱度。2014年,SzegedyC等學(xué)者在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上引入了Inception結(jié)構(gòu),同時加深網(wǎng)絡(luò)結(jié)構(gòu),搭建了GoogLeNet網(wǎng)絡(luò)模型,進一步提高識別率REF_Ref30102\r\h[16]。經(jīng)過近十年的不斷深入研究,神經(jīng)網(wǎng)絡(luò)應(yīng)用于人們生活的方方面面,并憑借其強大的識別優(yōu)勢,成為OCR技術(shù)的主流方法之一。1.2國內(nèi)現(xiàn)狀相比于美國、日本等國家,由于早期技術(shù)落后和硬件性能限制等原因,我國研究OCR技術(shù)的條件較為不足,到20世紀(jì)70年代初才開始研究數(shù)字等通用性字符識別,在經(jīng)過接近10年的研究階段后,才開始進軍漢字識別的領(lǐng)域REF_Ref29253\r\h[2]。到1986年,我國在漢字相關(guān)識別技術(shù)有所創(chuàng)新,推動了中文OCR技術(shù)的發(fā)展,對應(yīng)OCR產(chǎn)品逐漸進入人們視野。此前,許多國內(nèi)研究者就手寫字體識別技術(shù)的實現(xiàn)及提高手寫體識別率等相關(guān)內(nèi)容進行了深入探討。2017年,吉林大學(xué)的劉威在《基于動態(tài)隨機卷積神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別》REF_Ref29354\r\h[3]一文中,指出常見卷積神經(jīng)網(wǎng)絡(luò)模型存在兩個缺點,即最大池化層忽略了圖像背景信息和網(wǎng)絡(luò)輸入數(shù)據(jù)大小存在限制性,并為此提出了隨機池化和動態(tài)池化的方法,使手寫數(shù)字識別結(jié)果能夠反映圖像的綜合特征,為卷積神經(jīng)網(wǎng)絡(luò)的進一步優(yōu)化和手寫體識別技術(shù)貢獻了研究成果。2018年,夏少杰和項鯤發(fā)表在《智能物聯(lián)技術(shù)》上的《基于BP神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別及優(yōu)化方法》REF_Ref29462\r\h[4]一文中,通過實驗仿真測試不同的激活函數(shù)、優(yōu)化器和權(quán)重初始化等方法來優(yōu)化搭建的BP神經(jīng)網(wǎng)絡(luò)模型,從影響識別效果的各個超參數(shù)出發(fā),介紹對應(yīng)內(nèi)容,并分析實驗結(jié)果,提出改良方案,對BP神經(jīng)網(wǎng)絡(luò)處理識別問題提出了新見解。2019年,西安電子科技大學(xué)的吳翔宇在《基于殘差網(wǎng)絡(luò)的快速手寫體數(shù)字鐘識別算法》REF_Ref29520\r\h[5]一文中,借鑒了Inception-ResNet-v2中的多通道思想,提出了多通道的殘差網(wǎng)絡(luò)模型,同時采用歸一化技術(shù)和Adam優(yōu)化器,提高網(wǎng)絡(luò)識別效率,在提高網(wǎng)絡(luò)收斂速度上,為手寫字體識別的識別效率研究做出貢獻。2019年,南京郵電大學(xué)的黃佳凱在《基于ARM平臺和TensorFlow的手寫數(shù)字識別》REF_Ref29582\r\h[6]一文中,對設(shè)計搭建的卷積神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)圖像進行多技術(shù)預(yù)處理,提高了網(wǎng)絡(luò)模型對各種字符圖像的識別兼容性,具有極高的實用價值,最后將設(shè)計搭建的卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用移植到ARM平臺上,取得較高的識別效果,給后續(xù)手寫體圖像特征提取和跨平臺實現(xiàn)網(wǎng)絡(luò)模型的研究做了準(zhǔn)備。2020年,涂樸和黃晨發(fā)表在《自動化技術(shù)與應(yīng)用》上的《基于TensorFlow深度學(xué)習(xí)框架的手寫體數(shù)字識別模型優(yōu)化與應(yīng)用》REF_Ref29638\r\h[7]一文中,用TensorFlow框架設(shè)計搭建全連接神經(jīng)網(wǎng)絡(luò)模型,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和選擇合適超參數(shù),將手寫數(shù)字識別率提升到98.3%,為設(shè)計搭建并優(yōu)化神經(jīng)網(wǎng)絡(luò)提供了思路,文中最后將優(yōu)化后的網(wǎng)絡(luò)模型移植到ROS操作系統(tǒng)中應(yīng)用,實現(xiàn)了網(wǎng)絡(luò)模型的跨平臺使用,在研究神經(jīng)網(wǎng)絡(luò)兼容性方法中具有參考意義。2020年,北京郵電大學(xué)的鄭繼燕在《基于CNN的手寫數(shù)字識別與試卷管理系統(tǒng)設(shè)計》REF_Ref29703\r\h[8]一文中,設(shè)計實現(xiàn)了一個能實際應(yīng)用到試卷分?jǐn)?shù)管理的系統(tǒng),采用一系列操作對試卷進行預(yù)處理,然后搭建卷積神經(jīng)網(wǎng)絡(luò)將試卷上的手寫批改分?jǐn)?shù)進行識別保存,結(jié)合Python語言和各種機器學(xué)習(xí)框架,用QtCreator圖形界面工具對網(wǎng)絡(luò)實際功能進行可視化處理,提供了將基于神經(jīng)網(wǎng)絡(luò)的手寫字體識別技術(shù)應(yīng)用到實際問題處理的方案,具有重要應(yīng)用價值。2021年,內(nèi)蒙古大學(xué)的付利偉在《基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)的設(shè)計與實現(xiàn)》REF_Ref29752\r\h[9]一文中,指出具有較好識別性能的卷積神經(jīng)網(wǎng)絡(luò)常常在學(xué)習(xí)訓(xùn)練過程中存在效率低下且耗能大的缺點,針對這個問題,從硬件層面的角度上對網(wǎng)絡(luò)進行優(yōu)化,在FPGA平臺上實現(xiàn)輕量化手寫數(shù)字識別,減小網(wǎng)絡(luò)訓(xùn)練時間,提高模型收斂速度。綜上所述,目前國內(nèi)采用神經(jīng)網(wǎng)絡(luò)進行手寫字體識別的研究正處于“火熱”階段,研究者們有嘗試搭建不同架構(gòu)的神經(jīng)網(wǎng)絡(luò)來進行手寫體識別,但大多都是從卷積神經(jīng)網(wǎng)絡(luò)模型架構(gòu)的各個方面出發(fā)進行網(wǎng)絡(luò)優(yōu)化,如采用輸入圖像預(yù)處理、超參數(shù)選擇、結(jié)構(gòu)設(shè)計和池化層等技術(shù),根據(jù)實際應(yīng)用問題,有側(cè)重點地提高網(wǎng)絡(luò)的識別效率和識別準(zhǔn)確率,不斷為基于神經(jīng)網(wǎng)絡(luò)的OCR技術(shù)提供創(chuàng)新思路,但相比于國外,國內(nèi)自行設(shè)計提出的網(wǎng)絡(luò)模型在手寫字體識別中表現(xiàn)仍不夠出眾,即缺乏在網(wǎng)絡(luò)收斂速度、字體識別精度和泛化能力上均有較好性能的網(wǎng)絡(luò)模型,進一步研究設(shè)計和優(yōu)化網(wǎng)絡(luò)性能是國內(nèi)研究者必須認(rèn)真解決和對待的難題。參考文獻劉宗凡.圖像魔術(shù)師——光學(xué)字符識別(OCR)[J].中國信息技術(shù)教育,2021(13):76-79.張慧宇.廣電視頻文字檢測與識別的研究[D].鄭州大學(xué),2020.DOI:10.27466/ki.gzzdu.2020.004287.劉威.基于動態(tài)隨機卷積神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別方法[D].吉林大學(xué),2017.夏少杰,項鯤.基于BP神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別及優(yōu)化方法[J].智能物聯(lián)技術(shù),2018,1(01):19-22.吳翔宇.基于殘差網(wǎng)絡(luò)的快速手寫體數(shù)字識別算法[D].西安電子科技大學(xué),2019.DOI:10.27389/ki.gxadu.2019.000338.黃佳凱.基于ARM平臺和TensorFlow的手寫數(shù)字識別[D].南京郵電大學(xué),2019.DOI:10.27251/ki.gnjdc.2019.001166.涂樸,黃晨.基于Tensorflow深度學(xué)習(xí)框架的手寫體數(shù)字識別模型優(yōu)化及應(yīng)用[J].自動化技術(shù)與應(yīng)用,2020,39(12):110-114.鄭繼燕.基于CNN的手寫數(shù)字識別與試卷管理系統(tǒng)設(shè)計[D].北京郵電大學(xué),2020.DOI:10.26969/ki.gbydu.2020.001672.付利偉.基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)的設(shè)計與實現(xiàn)[D].內(nèi)蒙古大學(xué),2021.DOI:10.27224/ki.gnmdu.2021.000798.王風(fēng)盼.基于深度學(xué)習(xí)的手寫數(shù)字識別方法研究[D].重慶大學(xué),2018.郭春宇.基于機器視覺的發(fā)動機主軸承蓋檢測系統(tǒng)研究[D].長春工業(yè)大學(xué),2021.DOI:10.27805/ki.gccgy.2021.000587.孫午凡.基于OCR的過敏檢查單識別[D].西安電子科技大學(xué),2020.DOI:10.27389/ki.gxadu.2020.003462.陳科峻.票據(jù)字符識別平臺研究與實現(xiàn)[D].中國科學(xué)院大學(xué)(中國科學(xué)院長春光學(xué)精密機械與物理研究所),2020.DOI:10.27522/ki.gkcgs.2020.000112.付云澤.基于深度學(xué)習(xí)的手寫數(shù)字識別方法研究[D].寧夏大學(xué),2020.DOI:10.27257/ki.gnxhc.2020.001123.KrizhevskyA,SutskeverI,HintonGE.ImagenetClassificationwithDeepConvolutionalNeuralNetworks[J].AdvancesinNeuralInformationProcessingSystems,2012,25:1097-1105.SzegedyC,LiuW,JiaY,etal.GoingDeeperWithConvolutions[C]//ProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition.2015:1-9.劉金利,張培玲.改進LeNet-5網(wǎng)絡(luò)在圖像分類中的應(yīng)用[J].計算機工程與應(yīng)用,2019,55(15):32-37+95.劉蕾.基于Tensorflow的循環(huán)神
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025廣東茂名市住房和城鄉(xiāng)建設(shè)局選調(diào)公務(wù)員4人備考題庫附答案
- 2025山東菏澤工貿(mào)科技學(xué)校教師儲備招聘65人筆試參考題庫及答案解析
- 2026剛才河池市天峨縣人力資源和社會保障局招聘公益性崗位工作人員筆試參考題庫及答案解析
- 2026新疆阿合奇縣公益性崗位(鄉(xiāng)村振興專干)招聘44人筆試備考試題及答案解析
- 2026南平市城鄉(xiāng)規(guī)劃設(shè)計研究院有限責(zé)任公司招聘勞務(wù)派遣人員4人筆試備考題庫及答案解析
- (拓展拔高)2025-2026學(xué)年下學(xué)期人教統(tǒng)編版小學(xué)語文五年級第四單元練習(xí)卷
- 2026年安徽煤礦礦用安全產(chǎn)品檢驗中心有限公司招聘勞務(wù)派遣駕駛員1名筆試參考題庫及答案解析
- 2026年甘肅省隴南市兩當(dāng)縣招聘城鎮(zhèn)公益性崗位人員11人筆試備考題庫及答案解析
- 2026年東營職業(yè)學(xué)院單招綜合素質(zhì)考試備考試題帶答案解析
- 2026廣東佛山市禪城區(qū)祖廟街道公有企業(yè)招聘2人筆試備考試題及答案解析
- 光伏板清洗施工方案
- 閱讀理解體裁與命題方向(復(fù)習(xí)講義)-2026年春季高考英語(上海高考專用)
- 俱樂部轉(zhuǎn)讓合同模板(3篇)
- 光伏系統(tǒng)的安裝工程監(jiān)理實施細(xì)則
- 教練員勞務(wù)合同范本
- 2025巴彥淖爾市農(nóng)墾(集團)有限公司招聘37人備考題庫含答案解析(奪冠)
- 貴港市利恒投資集團有限公司關(guān)于公開招聘工作人員參考題庫附答案
- 腰椎OLIF手術(shù)課件
- 北京海淀中關(guān)村中學(xué)2026屆高二上數(shù)學(xué)期末調(diào)研試題含解析
- 2025西藏林芝市消防救援支隊政府專職消防員招錄8人備考題庫附答案解析
- 2025年農(nóng)業(yè)投資入股協(xié)議(生態(tài))
評論
0/150
提交評論