模式識別入門.ppt_第1頁
模式識別入門.ppt_第2頁
模式識別入門.ppt_第3頁
模式識別入門.ppt_第4頁
模式識別入門.ppt_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、模式識別(Pattern Recognition),信息與通信工程學(xué)院 信息工程技術(shù)研究所 陳濤 E-mail: Tel辦公地點:21號樓207房間,課程性質(zhì),任意選修課 授課對象:電子信息,通信工程,信息對抗, 微電子 學(xué)時:32(其中8學(xué)時實驗) 考查方式:閉卷或開卷考試,教材及參考文獻(xiàn),教材 邊肇祺,張學(xué)工. 模式識別(第二版).清華大學(xué)出版社,2000.1 參考文獻(xiàn) 1 R.Duda,P.Hart,D.Stork,Pattern Classification, second edition,2000(有中譯本) 2 蔡云龍,模式識別,西北電訊工程學(xué)院出版社,1

2、986. 3 李宏東,姚天翔譯,Richard O. Duda著. 模式分類(第二版). 機(jī)械工業(yè)出版社,2003.9,教材及參考文獻(xiàn),參考文獻(xiàn) 4李晶皎譯,Sergios Theodoridis(希臘)著. 模式識別(第三版).電子工業(yè)出版社,2006.12 5黃鳳崗,宋克歐. 模式識別. 哈爾濱工程大學(xué)出版社,1997 6楊淑瑩. 圖像模式識別-VC+技術(shù)實現(xiàn). 清華大學(xué)出版社,2005.7 7楊淑瑩. 模式識別與智能計算-MATLAB技術(shù)實現(xiàn). 電子工業(yè)出版社,2008.1,機(jī)構(gòu)、會議、刊物,1973年,IEEE發(fā)起了第一次關(guān)于模式識別的國際會議“ICPR” (此后兩年一次) ,成立了國

3、際模式識別協(xié)會-IAPR” 1977年IEEE成立PAMI委員會,創(chuàng)立IEEE Trans. On PAMI,并支持ICCV,CVPR兩個會議 -Pattern Recognition(PR) -Pattern Recognition Letters(PRL) -Pattern Analysis and Application (PAA) -International Joural of Pattern Recognition and Artificial Intelligence(IJPRAI),先修課程,概率論 本課程研究的主要內(nèi)容:統(tǒng)計P. R. 線性代數(shù) 利用特征向量表示模式 矩陣計算

4、 圖像處理、語音信號處理、人工智能、計算機(jī)視覺 ,教學(xué)目標(biāo),掌握模式識別的基本概念和基本方法 有效運用所學(xué)的知識和方法解決實際問題 為研究新的模式識別理論和方法打下基礎(chǔ),教學(xué)方法,著重講述模式識別的基本概念,基本方法和算法原理 注重理論與實踐緊密結(jié)合 實例教學(xué):通過實例講述如何將所學(xué)的知識運用到實際應(yīng)用中 避免引用過多的、繁瑣的數(shù)學(xué)推導(dǎo),第1章 緒論,1.1 P. R. 基本概念 1.2 P. R. 發(fā)展簡史 1.3 P. R. 應(yīng)用 1.4 P. R. 分類 1.5 P. R. 系統(tǒng),1.1 P. R. 基本概念,什么是模式?,什么是模式?,什么是模式?模式類?模式識別? 廣義定義:存在于時

5、間和空間中可觀察的物體,如果我們可以區(qū)別它們是否相同或是否相似,都可以稱之為模式。 模式所指的不是事物本身,而是從事物獲得的信息,因此模式往往表現(xiàn)為具有時間和空間的分布信息,什么是模式?,本課研究內(nèi)容 用計算機(jī)模擬人的識別能力,提出識別具體客體的基本理論與實用技術(shù)。根據(jù)這一研究內(nèi)容,可作狹義定義。 狹義定義:對感興趣的客體的定量的或結(jié)構(gòu)的描述。 模式:語音、圖像、信號 模式的直觀特性 可觀察性 可區(qū)分性 相似性,什么是模式?,模式類? 具有某些共同特性的模式的集合。 模式識別? 利用計算機(jī)自動地(或者人進(jìn)行少量干涉)把待識模式分到各自的模式類中去的技術(shù)。,模式識別研究的目的,利用計算機(jī)對物理對

6、象進(jìn)行分類,在錯誤概率最小的條件下,使識別的結(jié)果盡量與客觀物體相符合 Y=F(X) X定義域取自特征集 Y值域為類別的標(biāo)號集 F是模式識別的判別方法,1.2 P. R. 簡史,20世紀(jì)20年代出現(xiàn),60年代發(fā)展為學(xué)科 1929年G.Tauschek發(fā)明閱讀機(jī),能夠閱讀0-9的數(shù)字. 30年代Fisher提出統(tǒng)計分類理論,奠定了統(tǒng)計模式識別的基礎(chǔ). 50年代Noam Chemsky提出形式語言理論,傅京蓀提出了句法模式識別,1.2 P. R.簡史,60年代L.A.Zadeh提出了模糊集理論,模糊模式識別方法得以發(fā)展和應(yīng)用 80年代以Hopfield網(wǎng)、BP網(wǎng)為代表的神經(jīng)網(wǎng)絡(luò)模型導(dǎo)致人工神經(jīng)元網(wǎng)絡(luò)

7、復(fù)活,并在模式識別得到較廣泛的應(yīng)用。 90年代小樣本理論,支持向量機(jī)也受到了很大的重視。,1.2 P. R.簡史,21世紀(jì)以來,模式識別研究呈現(xiàn)一些新的特點 (1)貝葉斯學(xué)習(xí)理論越來越多的用來解決模式識別和模型選擇問題,產(chǎn)生了良好的分類性能。 (2)傳統(tǒng)的問題,如概率密度估計、特征選擇、聚類等方法不斷受到新的關(guān)注。新的方法或改進(jìn)混合的方法 不斷提出 (3)模式識別和機(jī)器學(xué)習(xí)相互滲透、特征提取和選擇、分類、聚類、半監(jiān)督學(xué)習(xí)的問題日益成為二者共同關(guān)注的熱點。 (4)模式識別系統(tǒng)開始越來越多地用于現(xiàn)實生活,如車牌識別、手寫字符識別、生物特征識別。,1.3 P. R.應(yīng)用,生物學(xué) 自動細(xì)胞學(xué)、染色體特

8、性研究、遺傳研究。 天文學(xué) 天文望遠(yuǎn)鏡圖像分析、自動光譜學(xué) 經(jīng)濟(jì)學(xué) 股票交易預(yù)測、企業(yè)行為分析 醫(yī)學(xué) 心電圖分析、腦電圖分析、醫(yī)學(xué)圖像分析、癌細(xì)胞分類、X光片分析、CT片分析,P. R.應(yīng)用,工程 產(chǎn)品缺陷檢測、特征識別、語音識別、自動導(dǎo)航系統(tǒng)、污染分析 軍事 航空攝像分析、雷達(dá)和聲納信號檢測和分類、自動目標(biāo)識別 安全 人臉、掌紋、虹膜、手形、語音、簽字、監(jiān)視和報警系統(tǒng),P. R.的應(yīng)用領(lǐng)域,一、文字識別 始于1929年,較早 OCR(Optical Character Recognition),字符識別之牌照識別,字符識別之牌照識別,1.5 P. R.的應(yīng)用領(lǐng)域,二、條碼識別,P. R.的應(yīng)

9、用領(lǐng)域,三、語音識別 語義識別 孤立詞識別(較為成熟)、連續(xù)語音識別 身份識別 話者識別,語音識別應(yīng)用之自動廣告監(jiān)播,P. R.的應(yīng)用領(lǐng)域,四、遙感圖像地物分類,原始影像 神經(jīng)網(wǎng)絡(luò)分類結(jié)果,P. R.的應(yīng)用領(lǐng)域,五、身份識別之人臉識別,在不同環(huán)境條件下,人臉膚色分布始終近似服從高斯分布,P. R.的應(yīng)用領(lǐng)域,五、身份識別之指紋識別,P. R.的應(yīng)用領(lǐng)域,六、公共安全應(yīng)用,檢測流動高熱人群,P. R.的應(yīng)用領(lǐng)域,七、軍事應(yīng)用,圖像制導(dǎo),國產(chǎn)空地電視制導(dǎo)導(dǎo)引頭,前蘇聯(lián)Kh-59M空地導(dǎo)彈導(dǎo)引頭,圖像制導(dǎo)AGM-130,美國AGM-130空對地導(dǎo)彈,AGM-130空地導(dǎo)彈 AGM-130是美國198

10、4年研制的空對地導(dǎo)彈,是GBU-15光電制導(dǎo)炸彈的裝有動力裝置的變型,具有遠(yuǎn)距離投放能力和強(qiáng)殺傷力。彈徑460毫米(A),520毫米(B);彈重1323千克(A),1316千克(B),采用電視或紅外成像+雙數(shù)據(jù)傳輸裝置制導(dǎo)方式??裳b備F-111、F-4、F-15、F-16和F-10等飛機(jī)。在美英對伊拉克的空襲中,美國空軍第一次在實戰(zhàn)中使用AGM-130導(dǎo)彈。 AGM-130可由空勤人員保持其飛向目標(biāo)的航向,也可利用電視或紅外導(dǎo)引頭自動導(dǎo)航。AGM-130同高速反輻射導(dǎo)彈(HARM)一樣,也可用來摧毀雷達(dá),使導(dǎo)彈發(fā)射器致盲,但是HARM的彈頭很小,不能保證摧毀發(fā)射器,而AGM-130的彈頭要大得

11、多,重約900公斤。它能完全一舉摧毀防空雷達(dá)和導(dǎo)彈發(fā)射架。,圖像制導(dǎo)AGM-130,AGM-130炸大橋,AGM-130機(jī)載發(fā)射,P. R.的應(yīng)用領(lǐng)域,鐵路油罐車罐口視覺定位系統(tǒng),1.5 P. R.的應(yīng)用領(lǐng)域,鐵路油罐車罐口視覺定位系統(tǒng),P. R.的應(yīng)用領(lǐng)域,機(jī)器人拆垛系統(tǒng),1.4 P.R.分類,要在特征空間和解釋空間找到一種映射關(guān)系,這種映射稱之為假說 特征空間-從模式得到的對分類有用的度量、屬性或基元構(gòu)成的空間. 解釋空間-將 個類別表示為: 其中 為所屬類別的集合,稱為解釋空間。,1.4 P.R.分類,假說的兩種獲得方法: (1)監(jiān)督學(xué)習(xí) (2)非監(jiān)督學(xué)習(xí),P.R.分類,監(jiān)督學(xué)習(xí)、概念驅(qū)

12、動或歸納假說:在特征空間中找到一個與解釋空間的結(jié)構(gòu)相對應(yīng)的假說。在給定模式下假定一個解決方案,任何在訓(xùn)練集中接近目標(biāo)的假說,也都必須在“未知”的樣本上得到近似的結(jié)果。 (1)依靠已知所屬類別的訓(xùn)練樣本集,按他們的特征向量分布來確定假說(通常為一判別函數(shù)),在判別函數(shù)確定之后能用他對未知的模式進(jìn)行分類; (2)對分類的模式要有足夠的先驗知識,通常需要采集足夠數(shù)量的具有典型性的樣本進(jìn)行訓(xùn)練。,1.4 P.R.分類,非監(jiān)督學(xué)習(xí)、數(shù)據(jù)驅(qū)動或演繹假說:在解釋空間中找到一個與特征空間的結(jié)構(gòu)相對應(yīng)的假說。這種方法試圖找到一種只以特征空間中的相似關(guān)系為基礎(chǔ)的假說。 (1)在沒有先驗知識的前提下,通常采用聚類分

13、析方法,基于“物以類聚”的觀點,用數(shù)學(xué)方法分析各特征向量之間距離及分散情況。 (2)如果特征向量聚集若干個群,可按群間距離遠(yuǎn)近把他們劃分成類。 (3)這種按各類之間親疏程度的劃分,若事先能知道應(yīng)劃分幾類,則可獲得更好的分類效果。,P.R.分類的主要方法,(1)數(shù)據(jù)聚類。 (2)統(tǒng)計分類。 (3)結(jié)構(gòu)模式識別。 (4)神經(jīng)網(wǎng)絡(luò)。,P.R.分類的主要方法,(1)數(shù)據(jù)聚類。 目標(biāo):用某種相似性度量的方法將原始數(shù)據(jù)組織成有意義 的和有用的各種數(shù)據(jù)集。 是一種非監(jiān)督學(xué)習(xí)方法,解決的方案是數(shù)據(jù)驅(qū)動。,P.R.分類的主要方法,(2)統(tǒng)計分類。又稱為決策理論識別方法。 基于概率統(tǒng)計模型得到各類別的特征向量的分

14、布,以取得 分類的方法。 特征向量分布的獲得是基于一個類別已知的訓(xùn)練樣本集。 是一種監(jiān)督分類方法,分類器是概念驅(qū)動的。,P.R.分類的主要方法,(3)結(jié)構(gòu)模式識別。 通過考慮識別對象各部分之間的聯(lián)系來達(dá)到識別分類的目的。 識別采用結(jié)構(gòu)匹配的方式,通過計算一個匹配程度值(matching score)來評估一個未知的對象或未知的對象的某些部分與某種典型形式的關(guān)系如何。 當(dāng)成功地制定出了一組可以描述對象部分之間關(guān)系的規(guī)則后,可以應(yīng)用一種特殊的結(jié)構(gòu)模式識別方法句法模式識別,來檢查一個模式基元的序列是否遵守某種規(guī)則,即句法規(guī)則或語法。 創(chuàng)始人:傅京孫,1930-1985,美籍華人,傅京孫獎,符號串(樹

15、):abcb,P.R.分類的主要方法,(4)神經(jīng)網(wǎng)絡(luò) 神經(jīng)網(wǎng)絡(luò)是受人腦組織的生理學(xué)啟發(fā)而創(chuàng)立的。 是由一系列互相聯(lián)系的、相同的單元(神經(jīng)元)組成,相互間的聯(lián)系可以在不同神經(jīng)元之間傳遞增強(qiáng)或抑制信號。 增強(qiáng)或抑制是通過調(diào)整神經(jīng)元相互間聯(lián)系的權(quán)重系數(shù)(weight)實現(xiàn). 神經(jīng)網(wǎng)絡(luò)可以實現(xiàn)監(jiān)督和非監(jiān)督學(xué)習(xí)條件下的分類。,模式的特征向量表示,樣本:模式識別中,被觀測的每個對象稱為樣本。如 手寫字符識別中的每個手寫字符。 特征:對于一個樣本,每一個與識別有關(guān)的因素稱為一個特征。模式是樣本所具有的特征描述。 特征向量:模式的特征集由處于同一個特征空間中的特征向量表示,特征向量的每一個元素為一個特征。,模

16、式的特征向量表示,選擇2個特征,選擇3個特征,模式識別研究的問題即是在特征空間中如何將樣本點分類,訓(xùn)練樣本,監(jiān)督模式識別,非監(jiān)督模式識別,客體,1.5 模式識別系統(tǒng),信息獲取,預(yù)處理,特征提取和選擇,分類器設(shè)計,分類決策,待識樣本,通過各種傳感器,訓(xùn)練過程,1、信息獲取,為使計算機(jī)能夠?qū)腕w進(jìn)行分類識別,必須使用計算機(jī)能夠接受的方式來表示客體。 (1)二維圖像,如文字、指紋、照片等 CCD (Charge Coupled Device)、CMOS,徠卡M8,M8的柯達(dá)1030萬像素CCD,CMOS圖像傳感器,1、信息獲取,(2)一維波形:語音、機(jī)械振動波、心電圖等,語音信號,利用MSP430設(shè)

17、計的12位心電放大器采集的心電圖,(3)物理參量和邏輯值 體溫、化驗數(shù)據(jù)、各種實驗數(shù)據(jù)、參量正常與否等。 通過測量、采樣和量化,可以用矩陣表示2D圖像,用向量表示1D波形,這就是信息的獲取過程。 物理量 電信號,模擬信號 數(shù)字信號,1、信息獲取,2、預(yù)處理,預(yù)處理的目的是去除噪聲,加強(qiáng)有用的信息并對種種因素造成的退化現(xiàn)象進(jìn)行復(fù)原。 圖像預(yù)處理:直方圖修正、平滑濾波、邊緣檢測、圖像復(fù)原(已知退化模型),3、特征提取和選擇,通過傳感器獲取的信息原始數(shù)據(jù)量一般比較大。 高速相機(jī)+IO Industries高速記錄系統(tǒng),采集速度:850MByte/s 1K*1K*1Byte,500f/s=500MBy

18、te/s,高速記錄11280*1023,高速記錄2508*508,高速記錄31536*1024,高速記錄41536*1024,3、特征提取和選擇,為有效地實現(xiàn)分類識別,要對原始數(shù)據(jù)進(jìn)行選擇或者變換,得到最能反映分類本質(zhì)的特征,構(gòu)成特征向量。 特征形成 特征提取 特征選擇,3、特征提取和選擇,特征形成 根據(jù)被識別的對象產(chǎn)生出一組基本特征,它可以是計算出來的,也可以是儀表或者傳感器測量出來的,這樣產(chǎn)生出來的特征叫原始特征。一般將原始數(shù)據(jù)組成的空間叫測量空間。 信息獲取階段,如數(shù)字圖像中的灰度值即可以看成是一種原始特征。,3、特征提取和選擇,特征提取 原始特征數(shù)量可能很大,樣本處于一個高維空間里。通

19、過映射或者變換的方法可以用低維空間來表示樣本,這個過程叫特征提取。 如1K*1K的灰度圖像相當(dāng)于1K*1K維測量空間中的一個點。在高維空間中進(jìn)行分類較為困難,且這種描述不能直接反映對象的本質(zhì)(灰度會隨著攝像機(jī)位置及照度等的變化而變化) 變換 測量空間 特征空間,通常為線性變換,如Fisher變換。,3、特征提取和選擇,特征選擇 從一組特征中挑選出一些最有效的特征以達(dá)到降低特征空間維數(shù)的目的,這個過程叫特征選擇。 降維兩大方法: 1、通過映射和變換把原始特征變?yōu)檩^少的新特征。 2、從原始特征中挑選出一些最有代表性的特征來。 特征提取與選擇的原則 盡量減小特征間的相關(guān)性 一個極端的例子:圓識別,R

20、2R是兩個極度相關(guān)的特征,4、分類器設(shè)計,為把待識別模式分配到各自的模式類中去,必須設(shè)計出一套分類判別規(guī)則?;咀龇ㄊ牵河靡欢〝?shù)量的樣本(稱為訓(xùn)練樣本集),確定出一套分類判別規(guī)則,使得按這套分類判別規(guī)則對待識模式進(jìn)行分類所造成的錯誤識別率最小或引起的損失最小。 如數(shù)字識別,首先要用0-9的訓(xùn)練樣本訓(xùn)練分類器。,5、分類決策,分類器按已確定的分類判別規(guī)則對待識模式進(jìn)行分類判別,輸出分類結(jié)果。 監(jiān)督模式識別與非監(jiān)督模式識別 對于監(jiān)督模式識別,判別規(guī)則設(shè)計完成后轉(zhuǎn)入分類決策。 對于非監(jiān)督模式識別,沒有訓(xùn)練樣本,分類器設(shè)計只能依靠待識別樣本集進(jìn)行,分類器設(shè)計與決策一起完成,即設(shè)計完成后分類結(jié)果亦產(chǎn)生。 模式識別課程主要研究3、4、5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論