畢業(yè)設(shè)計中期報告_第1頁
畢業(yè)設(shè)計中期報告_第2頁
畢業(yè)設(shè)計中期報告_第3頁
畢業(yè)設(shè)計中期報告_第4頁
畢業(yè)設(shè)計中期報告_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、畢業(yè)設(shè)計(論文)中期報告題目:病例識別系統(tǒng)實現(xiàn)院(系) 計算機科學(xué)與技術(shù)學(xué)院專 業(yè)計算機科學(xué)與技術(shù)學(xué) 生 林陶然學(xué) 號 J班 號 1203106指導(dǎo)教師張英濤中期報告日期 2016年4月25日哈爾濱工業(yè)大學(xué)教務(wù)處制2016年4月目錄 TOC o 1-5 h z 一工作完成情況1二已完成的研究工作及結(jié)果1三目前存在的問題及解決方法5四后期擬完成的研究工作及進度安排5五參考文獻61.1 中值濾波、工作完成情況經(jīng)過為期一個多月的學(xué)習(xí)研究以及不斷的尋求解決問題的辦法,我很好地處理了通過手機拍攝的醫(yī)療表單圖像,完成了對于圖像的灰度處理,二值化處理,傾斜校正,去除雜質(zhì)處理之后,終于將其中的關(guān)鍵數(shù)據(jù)分行分列

2、的從圖片中分割出來,最后將分好的每一個小塊部分進行處理,獲得了單個的字符,以便我以后將要進行的字符識別工作。二、 已完成的研究工作及結(jié)果1. 對圖像的預(yù)處理過程對圖像的預(yù)處理過程包括圖像增強,灰度化,和二值化過程,中值濾波,傾斜校正等等。在圖像進行灰度化處理之前,由于光線環(huán)境等等問題,首先對圖片進行一次自動增強操作。調(diào)用了 autoenhance() 函數(shù),根據(jù)預(yù)先設(shè)定的效果范圍來調(diào)整圖像的亮度,顏色和對比度。對圖像的灰度化處理則直接使用matlab 中現(xiàn)有的灰度圖轉(zhuǎn)化函數(shù)rgb2gray() 即可。關(guān)于這個函數(shù)的具體內(nèi)容在此就不再贅述??梢栽趍atlab 中查看。而二值化方法的選擇就顯得尤為

3、要,很大程度上影響了后續(xù)的分行分列的字符提取效果。這里我一開始采用的迭代二值化的處理方法,并發(fā)現(xiàn)了一些問題。由于拍照的光線不均,決定以后將采用自適應(yīng)閾值法。Matlab 中有現(xiàn)成的medfilt2() 中值濾波函數(shù)可供調(diào)用。在此簡述一下他的實現(xiàn)過程和作用。中值濾波的基本原理就是把一點的值用規(guī)定的該點對應(yīng)的一個鄰域中各點值的中值來代替。本人所采用的是3*3 的窗口大小。( 1)將模板中心與像素點重合;( 2)讀取模板中各對應(yīng)像素的值;( 3)將這些灰度值由小至大排列;( 4)取中值代替該像素點的值。中值濾波對孤立的噪聲像素即椒鹽噪聲、脈沖噪聲具有良好的濾波效果。對于本系統(tǒng)來說,它消除雜點有很好的

4、效果。(1) 選擇一個初始的閾值T, T 的取值方法很簡單,整張圖片的最高灰度值和最低灰度值之和的一半;(2)將新的閾值TT賦值為0,并設(shè)置一個范圍為allow , d=|T-TT| ;(3)遍歷整張圖片,將灰度值大于 T的點的灰度值作和并除以個數(shù)得到平均值 T0, 同理,將灰度值小于T的點作處理得到T1;將T0與T1作平均得到TT, d=|T-TT|。將 TT的值賦給T(4) 如果 d 的值大于等于預(yù)先設(shè)置的范圍allow ,就重復(fù)進行(3)的過程直至最后得到一個新的迭代閾值To根據(jù)這個T將圖片二值化。(1) 處理結(jié)果:可以看到這種二值化的整體效果很好,但是部分文字有筆畫丟失的現(xiàn)象,而且對

5、于光照不均的圖像將會產(chǎn)生很多的誤差點。如下圖(2) 產(chǎn)生誤差的原因:迭代化的二值化方法是對整張圖像的所有像素點的像素值都基于設(shè)定的范圍作了平均化操作,然而對于光照不均的圖像,每一個區(qū)域的閾值的allow 值都應(yīng)該有所不同,而迭代化二值化方法無法做到所以產(chǎn)生了誤差。而且對于不同的圖片要自己選取合適的allow 值,不夠智能。1.3 對圖像的傾斜校正通過對圖像的傾斜校正可以使二值化之后的圖像極方便地就能獲得后續(xù)的水平和垂直投影,進而使對整個圖像的分塊和每塊中單個字符的分割變得準(zhǔn)確而又簡單。(1 ) 設(shè)定參數(shù),并以此參數(shù)對二值化后的圖像進行膨脹過程對膨脹后的圖像進行數(shù)學(xué)形態(tài)學(xué)運算bwmorph(BW

6、,thin,Inf) ,其中 thin表示操作為細(xì)化,Inf 則表示將一直對圖像作同樣的形態(tài)學(xué)處理直至不再發(fā)生變化。通過這步操作可以將圖像縮成連通線。通過霍夫函數(shù)擬合出細(xì)化圖片中的直線,并計算這條直線的斜率,轉(zhuǎn)化為旋轉(zhuǎn)角,對圖片進行旋轉(zhuǎn)。即得到了傾斜校正之后的圖像。1.3.2 傾斜校正的結(jié)果與分析可以看到通過傾斜校正,圖片變成了我們熟悉的文檔格式,有著水平的行和垂直的列,下面將通過水平和垂直的投影,來將每一行每一列的信息分割出來。1.4 開運算排除干擾點傾斜校正之后的圖像我們可以看到還有很多的干擾點,通過開運算函數(shù)bwareaopen() 可以排除圖像中的干擾點使分割處理更加準(zhǔn)確。下圖為開運算

7、的處理效2. 對圖像的分割處理由于醫(yī)療表單數(shù)據(jù)通常都是行列分明而且有著統(tǒng)一的格式,字與字之間都是對齊而且有間距的,通過行分割與列分割,將圖像分為對應(yīng)的小塊,再將每一塊中的字符進行識別,就可以直接將行與列的信息與以后要輸出的excel 表格關(guān)聯(lián)起來,很便捷。對圖像的行分割與列分割在進行行分割與列分割,先要對圖片的水平和垂直分量進行投影操作,通過觀察投影的波形圖,我們可以清楚地看到每行每列的位置與投影的波谷的對應(yīng)關(guān)系。水平與垂直投影過程與效果水平(垂直)投影的獲取過程很簡單,先獲取圖像的縱(橫)坐標(biāo)范圍,在這個大小范圍內(nèi),對每一行(列)的像素值進行累加。13 個零點,是互相對應(yīng)的??梢钥吹?,上圖有

8、13 行,而水平投影曲線中有2.2對每塊圖像的字符分割% 特 00 - 5。8。 f S3 90 - W 10 M 27 fl - 33 察I 網(wǎng) 0 355 0 fl 的仍外父 % LL 50 - 15 990大魚小股比事(PLCR)2300血小板分布意度ATMII如WC/RBCXfi與稅器分折相符下面將以行分割為例,介紹圖像分塊的過程。數(shù)組H, J分別用于保存一行的起點與結(jié)束點。對于x坐標(biāo)由i到圖像的高度M遍歷,如果有水平投影值由0變?yōu)榉?,則將i的 值賦給一個起始點H (j ),如果有水平投影值由非0變?yōu)?,則將i的值賦給一個結(jié) 束點J (j ),并且執(zhí)行j+1 ,表示一對起點終點已經(jīng)成

9、功記錄。(即 j表示第j個起 始點與第j個結(jié)束點)于是就可以得到行切割矩陣recti=0,H(i),N,J(i)-H(i);即寬度不變,將每個行起點到行終點的部分截取下來,獲得逐行的圖像。切割的結(jié)果如下:可以看到結(jié)果是非常成功的。同理,對于分割出來的每一行和之前得到的垂直投影,可以將每一行中的每一列分割出來,這樣就得到了一塊一塊的圖像。結(jié)果如下:只要對之前的代碼稍作修改,從對整張圖變作對每一塊進行一次垂直投影,并進行列分割,重復(fù)這個過程,直到全部的塊都分割完畢,我們就得到了一個一個字符的圖片。在這個過程中,還可以對分好的小塊進行篩選,通過設(shè)置一個閾值limit 來篩掉沒有字符的塊。下圖是對上圖

10、例子中第九塊分塊的處理結(jié)果,可以看到一個一個的字符已經(jīng)被分割出來。目前存在的問題及解決方法( 1 ) 首先是我采用的迭代二值化的方法還不足以應(yīng)付所有條件下拍攝的照片。在面對部分效果不好的照片時,會有很多的干擾和誤差。解決方法 :學(xué)習(xí)自適應(yīng)閾值的二值化方法來對圖像進行二值化,代替目前所有的二值化方法。在開運算去除雜點之后,有些數(shù)據(jù)的小數(shù)點也被過濾掉了。解決方法 :在后面識別數(shù)據(jù)并進行導(dǎo)出時,如果同一塊內(nèi)兩個數(shù)字之間的留空太大,則說明此處原有小數(shù)點,應(yīng)該補上。分割出來的每個字符在水平上還有很多的空間沒有切割。解決方法 : 對每一塊使用之前的行分割過程去掉多余的部分來讓字符匹配更加快速且準(zhǔn)確。由于醫(yī)

11、療數(shù)據(jù)格式的不規(guī)律性,分割出來的塊中有很多是沒有信息的無效塊。 解決方法 : 加入一個篩選過程,篩掉有效像素點百分比在h 以下的點。就可以留下只有信息的點。四、后期擬完成的研究工作及進度安排工作內(nèi)容學(xué)習(xí)字符識別算法,將分割出來的字符分割圖片最終轉(zhuǎn)化為文檔中的文字。預(yù)計的方法是先對每個字符的圖片進行細(xì)化還原,再統(tǒng)一化為與模板統(tǒng)一的格式,與模板進行匹配對比,得到正確的文字。數(shù)字和字母以及字符的識別部分準(zhǔn)備在中期答辯之后自己獨立完成,研究已有的算法加以改進并實現(xiàn)。漢字的部分過于復(fù)雜,也會進行一定的嘗試,如果時間不夠的話可能會采用現(xiàn)已有的優(yōu)秀方法進行識別。在成功識別出字符之后,會根據(jù)之前對圖片中蘊含的

12、數(shù)據(jù)所進行的分行分列操作,將這些文字輸出到excel 表格中的對應(yīng)的位置。根據(jù)對大量的醫(yī)療圖片進行試驗所得到的結(jié)果進行準(zhǔn)確性與效率的調(diào)整,優(yōu)化代碼,使整個系統(tǒng)的實用性提高,同時保證提取出來的數(shù)據(jù)的準(zhǔn)確性和有效性。附加工作:因為這個系統(tǒng)最后是要應(yīng)用于手機之上的,撰寫完畢業(yè)論文之后的時間會用來改進代碼,并將之轉(zhuǎn)化為 C語音程序,用于手機上JAVA語言的調(diào)用。安排中期-2016-05-15 :兩周多一點的時間用來完成字符的匹配與識別;2016-05-15- 2016-05-31 :做更多的實驗,遇到問題及時糾正,算法及代碼的優(yōu)化和改進;同時開始畢業(yè)論文的撰寫。2012-06-01- 結(jié)題: 完成畢業(yè)

13、論文的撰寫,總結(jié)項目中的經(jīng)驗和教訓(xùn)??沼鄷r間嘗試代碼的移植。參考文獻 車牌識別系統(tǒng)中字符分割的研究與實現(xiàn),馬婉婕,復(fù)旦大學(xué),計算機系統(tǒng)結(jié)構(gòu),2009,碩士利用Hough變換和先驗知識的車牌字符分割算法,張云剛;張長水;計算機 學(xué)報,Chinese Journal of Computers, 2004 年 01 期幾種文本圖像二值化方法的對比分析,童立靖;張艷;舒??;占國亮;錢在;北方工業(yè)大學(xué)學(xué)報,Journal of North China University of Technology, 2011年01期不均勻光照文本圖像的二值化,賀志明;上海工程技術(shù)大學(xué)學(xué)報,Journalof Shanghai University of Engineering Science, 2011年 02 期。車牌識別系統(tǒng)中的牌照定位及傾斜校正技術(shù)研究,貢麗霞,中北大學(xué),應(yīng)用數(shù)學(xué),2010,碩士基于Hough變換的列車客運票圖像傾斜校正,梁添才;皮佑國;彭晶;朱朝華華,南理工大學(xué)學(xué)報(自然科學(xué)版),Journal of South

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論