圖像文本定位_第1頁
圖像文本定位_第2頁
圖像文本定位_第3頁
圖像文本定位_第4頁
圖像文本定位_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、圖像文本檢測(cè)參考文章:圖像文本定位技術(shù)研究-黃治虎圖像與視頻中的文本定位技術(shù)研究綜述-廖佳,王紅梅,牛曉東圖像中的文本定位技術(shù)研究綜述-晉瑾 ,平西建, 張濤, 陳明貴自然場景中文本檢測(cè)技術(shù)研究綜述-戴津圖像和視頻中的文本包含豐富、明確的信息。 如果這些文本能被自動(dòng)地提取出來,則對(duì)圖像高層語義的自動(dòng)理解、索引和檢索是非常有價(jià)值的 圖像中的文本提取可概括為兩個(gè)步驟:文本定位。 即找出圖像中文本所在的位置或剛好包圍文本的矩形區(qū)域。 文本識(shí)別 對(duì)定位出的文本區(qū)域進(jìn)行二值化、增強(qiáng)處理, 再送入光學(xué)字符識(shí)別系統(tǒng) (OCR)中進(jìn)行字符識(shí)別。文本定位是文本識(shí)別的前提, 是文本提取的關(guān)鍵文本類型性能評(píng)價(jià)文本定

2、位應(yīng)用文本特征文本定位的方法文本類型:1、人工添加文本人工文本通常出現(xiàn)在視頻幀圖像中,如在新聞視頻中由人工加入的新聞標(biāo)題、時(shí)間等,體育賽事中人工加入的分?jǐn)?shù)記錄等,訪談節(jié)目中對(duì)話的腳本字幕等,通常有重要的提示作用2、自然場景文本場景文本是指拍攝場景中所包含的文字,如人們使用數(shù)碼相機(jī)、數(shù)碼攝像機(jī)、掃描儀等拍攝的自然場景的文本圖像。因自然文本所處的圖像或視頻背景復(fù)雜,受光照、拍攝角度、拍攝場景等因素影響,自然場景文本定位是一個(gè)具有較大難度性和挑戰(zhàn)性的研究課題性能評(píng)價(jià):1、文本定位矩形框的精確度由標(biāo)定的矩形與Ground-truth 矩形的重合度來衡量,兩者的重合度越高,文本定位精度越高2、統(tǒng)一的樣本

3、圖像庫現(xiàn)在大多用ICDAR推出的樣本圖像庫來評(píng)定。該圖像庫主要是通過數(shù)碼相機(jī)拍攝得到的場景圖像,以門牌、廣告、指示標(biāo)識(shí)為主查準(zhǔn)率:文本區(qū)域數(shù) / 所有區(qū)域總數(shù)查全率: 正確定位的文本區(qū)域數(shù) / 圖像中所有文本區(qū)域總數(shù)文本定位應(yīng)用:1、圖像、視頻檢索2、網(wǎng)絡(luò)圖像過濾3、智能交通4、郵件分揀等文本的特征1.顏色特征大多數(shù)情況下,同一區(qū)域中同一行文字,其顏色、色調(diào)、亮度等屬性相同或相似,與圖片背景有較大的對(duì)比度。人工文本尤其如此。但也有特殊情況(藝術(shù))。2.字符的大小同一行文字,字符大小基本一致。但同一圖像中的文字大小,可能差別很大,大的可能占到圖像面積的80%以上,而小的則只有幾個(gè)像素。由于太小的

4、字符,識(shí)別率不高,像素低于10 的字符通常被刪除。3.字符的邊緣由于字符與圖像背景間具有一定的對(duì)比度,因而字符與背景間都有較突出的邊緣,這為通過邊緣檢測(cè)進(jìn)行文本定位提供了依據(jù)。邊緣包含邊緣強(qiáng)度和邊緣方向兩個(gè)要素。不同的文字,邊緣的方向不同,如英文和漢字的邊緣方向集中在水平、垂直和45方向,而拉丁文的邊緣方向集中在垂直方向。4.文字的結(jié)構(gòu)典型文檔圖像的布局都是經(jīng)過精心設(shè)計(jì),相對(duì)固定以便于讀者閱讀。這就降低了文本區(qū)域的分割的難度。但是對(duì)于自然場景當(dāng)中的文本,它可能出現(xiàn)在圖像的任意位置,并且往往字符稀疏,字符對(duì)齊方式?jīng)]有嚴(yán)格要求。但是對(duì)于同一文本塊內(nèi),文字的字體和字號(hào)往往保持一致,漢字在同一字體和字號(hào)下,其高度和寬度以及粗細(xì)一致,線條平直。5.紋理特征紋理是一種反映圖像中同質(zhì)現(xiàn)象的視覺特征,它體現(xiàn)了物體表面的具有緩慢變化或者周期性變化的表面結(jié)構(gòu)組織排列屬性。紋理具有三大標(biāo)志:某種局部序列性不斷重復(fù)、非隨機(jī)排列、紋理區(qū)域內(nèi)大致為均勻的統(tǒng)一體。紋理不同于灰度、顏色等圖像特征,它通過像素及其周圍空間鄰域的灰度分布來表現(xiàn),即:局部紋理信息。局部紋理信息不同程度的重復(fù)性,即全局紋理信息。文本定位

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論