第十一章圖像識別初步_第1頁
第十一章圖像識別初步_第2頁
第十一章圖像識別初步_第3頁
第十一章圖像識別初步_第4頁
第十一章圖像識別初步_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第十一章:初步圖像識別,本章主要內(nèi)容,1。模式識別概述,2。模式識別方法的分類。最小距離分類器和模板匹配,11.1模式識別概述。模式識別是指處理和分析代表事物或現(xiàn)象的各種形式的信息(數(shù)字、文字和邏輯)的過程,以描述、識別、分類和解釋事物或現(xiàn)象。模式識別通常也被稱為模式分類。從處理問題的性質(zhì)和解決問題的方法來看,模式識別可以分為監(jiān)督分類和非監(jiān)督分類。它們之間的主要區(qū)別在于每個實驗樣本的類別是否事先已知。一般來說,監(jiān)督分類通常需要提供大量已知類別的樣本,而非監(jiān)督分類是根據(jù)樣本的特征將具有相同特征的樣本分類到同一類別。模式識別是人類的一項基本智能。人們在日常生活中經(jīng)常進(jìn)行“模式識別”。隨著20世紀(jì)4

2、0年代計算機(jī)的出現(xiàn)和20世紀(jì)50年代人工智能的興起,人們當(dāng)然希望用計算機(jī)來代替或擴(kuò)大部分人類勞動。因此,計算機(jī)模式識別在20世紀(jì)60年代發(fā)展迅速,成為一門新興學(xué)科。11.1.1模式和模式識別,模式是由確定和隨機(jī)成分組成的對象、過程和事件。在模式識別問題中,它是我們識別的對象。模式識別是指對有代表性的事物或現(xiàn)象進(jìn)行描述、識別、分類和解釋的過程,它只是利用計算機(jī)對一組事件或過程進(jìn)行識別和分類。模式識別是指對測量對象的特定模式的分類和識別,如聲音波形、地震波、心電圖、腦電圖、圖片、照片、字符、符號和生物傳感器。11.1.2圖像識別,將模式識別的方法和技術(shù)應(yīng)用于圖像領(lǐng)域,即當(dāng)被識別的對象是圖像時,稱為

3、圖像識別。雖然對我們?nèi)祟悂碚f,理解和識別我們所看到的似乎很平常,但是讓計算機(jī)擁有相似的智能是一項具有挑戰(zhàn)性的任務(wù),但是它們在許多方面是相似的。圖像識別與模式識別的關(guān)系。1.模式識別包括各種信息輸入形式,如波形、聲音、圖形和圖像,圖像識別是模式識別的一部分;2.模式識別的許多方法,如決策理論、貝葉斯分類器、神經(jīng)網(wǎng)絡(luò)分類器和支持向量機(jī),都可以用于圖像識別。3.圖像識別有其獨特的方法。11.1.3關(guān)鍵概念,模式類,特征,噪聲,分類識別,分類器,訓(xùn)練樣本,訓(xùn)練學(xué)習(xí),訓(xùn)練集,測試樣本,測試集,識別率,泛化精度,模式識別的一般過程,原始信息的輸入,特征提取,分類器,識別結(jié)果,識別的關(guān)鍵點是分類器將特征空間

4、劃分為標(biāo)記為類別的決策區(qū)域。對于唯一的分類結(jié)果,這些區(qū)域必須覆蓋整個特征空間并且不相交,并且每個區(qū)域的邊緣被稱為決策邊界。從這個意義上說,分類器是一組劃分決策區(qū)域的決策邊界函數(shù),一些經(jīng)典的決策區(qū)域和決策邊界如圖11.2所示。特征向量的分類是確定其屬于哪個決策區(qū)域的過程。11.1.5過度。在上圖,即圖11.2中,我們可以注意到?jīng)Q策邊界可以像a和b中的線性或二次型那樣簡單,也可以像c中那樣復(fù)雜和不規(guī)則。所以對于一個特定的問題,我們應(yīng)該選擇簡單的模型還是更復(fù)雜的模型?一般來說,簡單模型具有計算簡單的優(yōu)點,訓(xùn)練它們所需的樣本數(shù)量通常較少,但是它們的空間劃分往往不夠準(zhǔn)確,這導(dǎo)致了識別精度的一定限制;然而

5、,復(fù)雜模型可以更好地擬合訓(xùn)練樣本,并產(chǎn)生非常適合于訓(xùn)練數(shù)據(jù)的復(fù)雜決策邊界,因此期望它們在測試集上表現(xiàn)良好是合理的。那么,這個美好的愿望不可能總是實現(xiàn)。僅僅因為,過于復(fù)雜的決策邊界常常導(dǎo)致所謂的“過度擬合”現(xiàn)象。11.1.7訓(xùn)練學(xué)習(xí)方法分類,一般訓(xùn)練和學(xué)習(xí)過程是指在給定一般模型或分類器形式的情況下,利用訓(xùn)練樣本來學(xué)習(xí)和估計模型的未知參數(shù),特別是利用某種算法來減少分類器的參數(shù)誤差。例如,在第12章中,通過調(diào)整分類器的參數(shù),在人工神經(jīng)網(wǎng)絡(luò)中學(xué)習(xí)的梯度下降算法被訓(xùn)練為減少誤差的方向。還有許多其他形式的學(xué)習(xí)算法,通??梢苑譃橐韵聨追N形式:教師指導(dǎo)學(xué)習(xí),而不是教師指導(dǎo)學(xué)習(xí),以加強學(xué)習(xí);11.2模式識別方法

6、的分類,有兩種基本的模式識別方法,即統(tǒng)計模式識別方法和句法模式識別方法。統(tǒng)計模式識別是一種模式的統(tǒng)計分類方法,即模式識別技術(shù)與統(tǒng)計概率論中的貝葉斯決策系統(tǒng)相結(jié)合,也稱為決策理論識別方法;利用模式和子模式的層次結(jié)構(gòu)樹信息完成的模式識別工作就是句法識別模式。11.2.1統(tǒng)計模式識別,模式識別的統(tǒng)計方法,一種模式的統(tǒng)計分類方法,將模式類別視為由隨機(jī)向量實現(xiàn)的集合。也稱為決策理論識別方法。11.2.1統(tǒng)計模式識別,模式識別的統(tǒng)計方法,一種模式的統(tǒng)計分類方法,將模式類別視為由隨機(jī)向量實現(xiàn)的集合。也稱為決策理論識別方法。11.2.2句法模式識別,也稱為結(jié)構(gòu)方法或語言學(xué)方法。基本思想是將一個模式描述為更簡單

7、的子模式的組合,而子模式可以描述為更簡單的子模式的組合,最后得到樹狀結(jié)構(gòu)描述。底部最簡單的子模式稱為模式單元。11.2.3總結(jié),模式識別方法的選擇取決于問題的性質(zhì)。如果被識別的對象極其復(fù)雜并且包含豐富的結(jié)構(gòu)信息,通常使用句法方法;被識別的對象并不復(fù)雜或者不包含明顯的結(jié)構(gòu)信息,因此通常使用統(tǒng)計方法。然而,這兩種方法不能完全分開。在句法方法中,通過統(tǒng)計方法提取原語。在應(yīng)用中,將這兩種方法結(jié)合起來,應(yīng)用到不同的層次,往往會得到更好的效果。11.3最小距離分類器和模板匹配,11.3.1基于最小距離分類器的圖像識別,決策理論的基本思想:從圖像中提取特征,構(gòu)造特征向量x=x1,x2,xn,并設(shè)計w決策函數(shù)

8、D1 (x),D2(對于w模式分類1,2,w)滿足以下條件:(1) x歸屬于i類,最小距離分類器用其平均向量表示每個模式分類。讓x作為要分類的模式向量,找出模式向量和每個平均向量之間的距離,并將x歸屬于距離最小的類。由決策函數(shù)表示:其中mj是平均向量,其計算如下:找到Dj(x)最小值等于找到最大值。因此,我們可以選擇決策函數(shù),因為:將其分類為i類。不難看出,i和j之間的邊界是11.3.2?;诳臻g模板匹配的圖像識別。模板匹配是圖像識別方法中最具代表性的基本方法之一。它將從待識別的圖像或圖像區(qū)域S(i,j)中提取的幾個特征量逐一進(jìn)行比較,并計算它們之間的歸一化相關(guān)系數(shù)。最大的相關(guān)系數(shù)表示最高的相

9、似性。模板匹配的基本概念:模板是具有標(biāo)準(zhǔn)大小和標(biāo)準(zhǔn)內(nèi)容的已知圖像。模板匹配是根據(jù)一定的算法在圖像中搜索目標(biāo),并將目標(biāo)的特征與已知模板進(jìn)行比較,從而確定目標(biāo)是否存在以及目標(biāo)所在的坐標(biāo)位置。以8位灰度圖像(一個像素由一個字節(jié)描述)為例,模板T(m*n個像素)被疊加并平移到搜索到的圖像S(M *N個像素)上,并且模板覆蓋搜索到的圖像的區(qū)域被稱為子圖像Sij。I和j是搜索到的圖s上的子圖左上角的坐標(biāo),如圖所示。搜索范圍是MXN。通過比較模板T和Sij的相似度,完成模板匹配過程。(1)常用的模板匹配算法、M、N、M、N、模板及其搜索圖、子圖、搜索圖、模板、一般來說,下列度量可以用來度量t和S ij之間的相似性:擴(kuò)展是、它隨搜索位

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論