圖像識(shí)別技術(shù)綜述_第1頁(yè)
圖像識(shí)別技術(shù)綜述_第2頁(yè)
圖像識(shí)別技術(shù)綜述_第3頁(yè)
圖像識(shí)別技術(shù)綜述_第4頁(yè)
圖像識(shí)別技術(shù)綜述_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、圖像處理與識(shí)別技術(shù)綜述簡(jiǎn)要介紹了圖像處理和識(shí)別技術(shù)的相關(guān)知識(shí),介紹了圖像識(shí)別過程中的判別函數(shù)和判別規(guī)則,以及特征提取和選擇的方法。本文設(shè)計(jì)了一個(gè)基于16位處理器MC9S12XS128的圖像識(shí)別系統(tǒng)的硬件實(shí)現(xiàn)。關(guān)鍵詞:圖像識(shí)別特征提取MC9S12XS128數(shù)碼相機(jī)圖像識(shí)別與識(shí)別技術(shù)綜述文摘:介紹了圖像識(shí)別和識(shí)別技術(shù)的一些知識(shí),介紹了圖像識(shí)別過程中的判別函數(shù)判別規(guī)則、特征提取和選擇方法。設(shè)計(jì)了一個(gè)基于16位控制器MC9S12XS128的圖像識(shí)別系統(tǒng),并在實(shí)際中有具體的硬件實(shí)現(xiàn)。關(guān)鍵詞:圖像識(shí)別識(shí)別規(guī)則MC9S12XS128數(shù)碼相機(jī)1導(dǎo)言圖像是與視覺相關(guān)的最接近生命的信息。它是客觀世界中的物體直接或

2、間接作用于人的眼睛并產(chǎn)生視覺感知的實(shí)體。傳統(tǒng)的圖像處理技術(shù)是保存、處理、壓縮、傳輸和再現(xiàn)圖像。隨著信息時(shí)代的到來,對(duì)計(jì)算機(jī)處理的各種信息的需求越來越多,多媒體信息處理技術(shù)已經(jīng)成為日常生活各個(gè)領(lǐng)域的迫切需求。人們更喜歡用計(jì)算機(jī)技術(shù)來處理人類的視覺問題,如:用人臉和指紋識(shí)別技術(shù)來處理與個(gè)人有關(guān)的一切,用自動(dòng)視覺監(jiān)控系統(tǒng)來監(jiān)控環(huán)境中的異常事件,用字符識(shí)別技術(shù)來自動(dòng)輸入和處理文檔圖像。因此,將傳統(tǒng)圖像處理技術(shù)與模式識(shí)別處理技術(shù)相結(jié)合是圖像處理的新趨勢(shì)。2傳統(tǒng)圖像處理技術(shù)圖像處理技術(shù)始于20世紀(jì)50年代。1964年,噴氣推進(jìn)實(shí)驗(yàn)室(JPL)用計(jì)算機(jī)處理了大量由航天器發(fā)回的月球照片,這是這項(xiàng)技術(shù)發(fā)展的一個(gè)

3、里程碑。從那以后,這項(xiàng)技術(shù)得到了廣泛的發(fā)展。傳統(tǒng)的圖像處理技術(shù)包括圖像采集、變換、增強(qiáng)、編碼、分割等。2.1圖像采集圖像可以根據(jù)其形式或制作方法進(jìn)行分類。圖1圖像分類圖像采集4是指將其轉(zhuǎn)化為計(jì)算機(jī)可讀的信息。一般來說,這是一個(gè)數(shù)字化的過程,包括掃描、采樣和量化三個(gè)步驟。在數(shù)字化過程之后,獲得圖片的數(shù)字表示,即數(shù)字圖像。一般來說,這個(gè)過程是由攝像機(jī)和其他設(shè)備完成的。反過來,可以顯示數(shù)字圖像。2.2圖像轉(zhuǎn)換圖像變換6廣泛應(yīng)用于圖像濾波2、統(tǒng)計(jì)濾波5、圖像數(shù)據(jù)壓縮和圖像描述。圖像變換是將神經(jīng)網(wǎng)絡(luò)空間圖像數(shù)據(jù)變換成另一組基向量(通常是正交向量空間)的坐標(biāo)參數(shù)。我們希望這些離散圖像信號(hào)的坐標(biāo)參數(shù)更集中地

4、表示圖像中的有效信息,或者更方便地達(dá)到一定的處理目的。常用的方法有傅里葉變換、相關(guān)分析、小波變換、離散余弦變換、正弦變換、沃爾什-哈達(dá)瑪變換、K-L變換等。著重介紹了SIMCA變換在實(shí)踐中的應(yīng)用算法。Simca是一種有監(jiān)督的模式識(shí)別方法。該方法對(duì)訓(xùn)練集中每類樣本的測(cè)量數(shù)據(jù)矩陣進(jìn)行主成分分析,建立每類樣本主成分分析的數(shù)學(xué)模型,然后在此基礎(chǔ)上對(duì)未知樣本進(jìn)行分類,即將未知樣本分別與各種樣本的數(shù)學(xué)模型進(jìn)行擬合,以確定它們屬于哪一類?;镜腟IMCA方法有兩個(gè)主要步驟。第一步是建立每一類的主成分分析模型,第二步是用未知樣本逐一擬合每一類的主成分模型,從而對(duì)它們進(jìn)行判別和分類。主成分提取的原理是降低高維原

5、始變量空間的維數(shù),從而消除許多化學(xué)信息中的重疊信息部分,使少量主成分(新變量)成為原始變量的線性組合,新變量應(yīng)最大限度地表征原始變量的數(shù)據(jù)結(jié)構(gòu)特征而不丟失信息。該方法是在最大均方誤差方向投影光譜數(shù)據(jù)。通過合理選擇主成分的個(gè)數(shù),去除了代表干擾成分和干擾因素的主成分,新的變量最大限度地反映了被測(cè)樣品的成分和結(jié)構(gòu)信息,同時(shí)最小限度地包含了噪聲。此外,主成分相互正交,可以克服原始變量多重相關(guān)性造成的信息重疊。這有助于最大限度地從樣品的測(cè)量光譜中提取有用的化學(xué)信息,并建立良好的數(shù)學(xué)模型。主成分分析法將譜矩陣分解成兩個(gè)較小維數(shù)矩陣的乘積:其中是譜矩陣、分?jǐn)?shù)矩陣和負(fù)載矩陣,e是譜殘差,維數(shù)與。m是樣本的數(shù)量

6、,p是波長(zhǎng)的數(shù)量,f是主成分分析的數(shù)量。主成分和原始變量之間的相關(guān)系數(shù)稱為負(fù)荷。負(fù)載表示原始變量和新變量之間的相關(guān)性。新變量下樣本的坐標(biāo)值稱為得分。在主成分分析之后,聚類分析8通常用于分析圖像。2.3圖像增強(qiáng)圖像增強(qiáng)9是增強(qiáng)圖像中的有用信息,它有兩個(gè)主要目的:一是改善圖像的視覺效果,提高圖像成分的清晰度;第二是使圖像更有利于計(jì)算機(jī)處理。圖像增強(qiáng)方法一般分為兩類:空間域和變換域。空間域方法直接處理圖像像素的灰度級(jí)。變換域方法在圖像的某個(gè)變換域中處理變換系數(shù),然后通過逆變換得到增強(qiáng)圖像。常用的圖像增強(qiáng)方法包括空間域單點(diǎn)增強(qiáng)(灰度校正)、圖像平滑、圖像銳化、圖像濾波和顏色增強(qiáng)。2.4圖像編碼圖像信息

7、已經(jīng)成為通信和計(jì)算機(jī)系統(tǒng)中重要的處理對(duì)象。與文本信息不同,圖像信息占用了大量的存儲(chǔ)容量,并且使用了很寬的傳輸通道。因此,圖像數(shù)據(jù)的壓縮已經(jīng)成為迫切需要。由于圖像的固有冗余和相關(guān)性,可以將大的圖像數(shù)據(jù)文件轉(zhuǎn)換成小的圖像數(shù)據(jù)文件。圖像壓縮17不能丟失原始圖像的重要信息,壓縮性能的指標(biāo)是客觀逼真度和主觀逼真度。公共目標(biāo)保真度可以用均方根誤差ems、信噪比SNR和峰值信噪比PSNR來表示。在相同壓縮比下,均方誤差ems越小,性能越好。在相同的均方根誤差ems下,壓縮比越大,性能越好。常用的數(shù)據(jù)編碼方法包括統(tǒng)計(jì)編碼、預(yù)測(cè)編碼、變換編碼、輪廓編碼等。2.5圖像分割16在圖像的研究和應(yīng)用中,人們往往只對(duì)圖像

8、的某些部分感興趣。這些部分通常被稱為目標(biāo)或前景(其他部分被稱為背景),并且它們通常對(duì)應(yīng)于圖像中特定且獨(dú)特的區(qū)域。為了識(shí)別和分析目標(biāo),有必要分離或提取這些相關(guān)區(qū)域,然后有可能進(jìn)一步利用目標(biāo),如特征提取和測(cè)量。圖像分割是指將圖像分割成具有不同特征的區(qū)域并提取感興趣對(duì)象的技術(shù)和過程。這些特征可以是灰色、顏色、紋理或幾何屬性,并且目標(biāo)可以對(duì)應(yīng)于單個(gè)區(qū)域或多個(gè)區(qū)域。劃分的區(qū)域應(yīng)同時(shí)滿足以下要求:(1)分割圖像區(qū)域的均勻性和連通性。均勻性意味著區(qū)域中的所有像素都滿足基于灰度、紋理、顏色和其他特征的相似性標(biāo)準(zhǔn),而連通性意味著存在連接區(qū)域中任意兩點(diǎn)的路徑。(2)相鄰分割區(qū)域之間的某些差異對(duì)于選擇的重要性。(3

9、)分割區(qū)域的邊界應(yīng)規(guī)則,邊緣的空間定位應(yīng)準(zhǔn)確。在基本的分割算法中,首先,灰度圖像的分割可以基于像素灰度值的兩個(gè)性質(zhì):不連續(xù)性和相似性。區(qū)域中的像素通常具有灰度相似性,而區(qū)域之間的邊界通常具有灰度不連續(xù)性。因此,分割算法可以分為使用區(qū)域間灰度不連續(xù)性的基于邊界的算法和使用區(qū)域內(nèi)灰度相似性的基于區(qū)域的算法。其次,根據(jù)分割過程中不同的處理策略,分割算法可以分為并行算法和串行算法。在并行算法中,所有的判斷和決策都可以獨(dú)立地同時(shí)進(jìn)行,而在串行算法中,早期處理的結(jié)果可以用于后續(xù)處理。一般來說,串行算法的計(jì)算時(shí)間往往比并行算法長(zhǎng),但其抗噪聲能力也較強(qiáng)。這兩個(gè)標(biāo)準(zhǔn)互不重合,互為補(bǔ)充,因此分割算法可以根據(jù)這兩個(gè)

10、標(biāo)準(zhǔn)分為四類:(1)平行邊界類;(2)序列邊界類;(3)平行區(qū)域類;(4)串行區(qū)域類。3圖像識(shí)別圖像識(shí)別可分為圖像模式識(shí)別,是模式識(shí)別技術(shù)在圖像領(lǐng)域的具體應(yīng)用。傳統(tǒng)的圖像處理是對(duì)輸入圖像的有效改進(jìn),它的輸出仍然是一幅完整的圖像,而識(shí)別可以看作是認(rèn)識(shí)它并把它從一堆物體中區(qū)別出來。3.1判別函數(shù)和判定規(guī)則模式識(shí)別系統(tǒng)的基本功能是識(shí)別每個(gè)模式的類型。實(shí)現(xiàn)這一功能的重要方法之一是使用判別函數(shù)。判別式函數(shù)18可分為線性和非線性。3.1.1線性判別函數(shù)線性判別函數(shù)是一種廣泛使用的判別函數(shù)。所謂的線性鑒別函數(shù)是指鑒別函數(shù)是圖像的所有N個(gè)特征量的線性組合。如果它的組合系數(shù)是0,那么對(duì)于M問題,任何I類的線性識(shí)

11、別函數(shù)都是(1)式中:它表示ith鑒別函數(shù),它是一個(gè)系數(shù)或權(quán)重,一個(gè)常數(shù)或一個(gè)閾值。在和之間有一個(gè)判斷邊界,所以邊界方程是(2)該方程是二維空間中的一條直線,三維空間中的一個(gè)平面和n維空間中的一個(gè)超平面。它可以寫成如下:(3)相應(yīng)的判斷規(guī)則是:如果,那么;如果,那么。由線性決策函數(shù)構(gòu)造的分類器是線性分類器。任何M類問題都可以分解為(m-1)兩類識(shí)別問題。方法是將模式空間劃分為某一類和其他類的組合,即成對(duì)比較,從而實(shí)現(xiàn)最終的分類。因此,兩種線性分類器是最簡(jiǎn)單和最基本的。圖2兩種線性分類器為了在線性分類器中找到合適的權(quán)重,分類可以盡可能的無誤差,而有效的方法是實(shí)驗(yàn)方法。3.1.2最小距離判別函數(shù)在

12、圖像識(shí)別中,線性分類器的一個(gè)非常重要的方法是將未知圖像與特征空間中的模板點(diǎn)(標(biāo)準(zhǔn)樣本點(diǎn)的中心)之間的距離作為分類標(biāo)準(zhǔn)。對(duì)于M-cl3.1.3非線性判別函數(shù)線性判別函數(shù)簡(jiǎn)單,但也有缺點(diǎn),它往往不能勝任更復(fù)雜的分類。在復(fù)雜的分類問題中,經(jīng)常需要增加判別函數(shù)的數(shù)量,這導(dǎo)致了非線性判別函數(shù)。非線性判別函數(shù)可以寫成以下形式:(4)等式(4)是二次判別函數(shù),并且通常二次判別函數(shù)的判定邊界是超二次曲面。3.2特征提取和選擇在圖像識(shí)別中,直接對(duì)獲得的圖像進(jìn)行分類是不現(xiàn)實(shí)的。首先,圖像數(shù)據(jù)占用大量存儲(chǔ)空間,所以直接識(shí)別需要時(shí)間和精力,其計(jì)算是不可接受的;其次,圖像中包含了大量與識(shí)別無關(guān)的信息,如圖像的背景,因此

13、有必要提取和選擇特征,這樣可以壓縮大量的識(shí)別圖像數(shù)據(jù),有利于圖像識(shí)別。第三,由于測(cè)量可實(shí)現(xiàn)性或經(jīng)濟(jì)考慮的限制,獲得的測(cè)量值很少。圖像識(shí)別中的好特征應(yīng)該有四個(gè)特征:(1)可區(qū)分性。對(duì)于屬于不同類別的圖像,它們的特征值應(yīng)該有明顯的差異。(2)可靠性。對(duì)于相似的圖像,它們的特征值應(yīng)該相似。(3)獨(dú)立性。所用的特征值應(yīng)該相互獨(dú)立。(4)數(shù)量少。特征選擇和提取的一般原則是最小化整個(gè)識(shí)別系統(tǒng)的處理時(shí)間和錯(cuò)誤識(shí)別概率。當(dāng)你不能同時(shí)擁有兩者時(shí),人們需要做出相應(yīng)的平衡?;蛘邷p少誤認(rèn)的可能性。提高識(shí)別的準(zhǔn)確性,但會(huì)增加系統(tǒng)的運(yùn)行時(shí)間;要么提高整個(gè)系統(tǒng)的速度,以滿足實(shí)時(shí)性的需要,但它會(huì)增加錯(cuò)誤識(shí)別的概率。應(yīng)根據(jù)系統(tǒng)

14、使用的場(chǎng)合合理選擇,以達(dá)到最佳平衡效果。隨著科學(xué)技術(shù)理論的發(fā)展,識(shí)別方法包括模糊識(shí)別方法和人工神經(jīng)網(wǎng)絡(luò)識(shí)別方法19。4圖像識(shí)別系統(tǒng)示例4.1硬件平臺(tái)控制器:飛思卡爾16位單片機(jī)MC9S12XS128相機(jī):數(shù)字互補(bǔ)金屬氧化物半導(dǎo)體相機(jī)OV76204.2總體設(shè)計(jì)框圖圖3圖像識(shí)別系統(tǒng)總體框圖4.3圖像識(shí)別算法該系統(tǒng)利用物體的形狀特征來區(qū)分物體。本系統(tǒng)的微處理器選用飛思卡爾的16位單片機(jī)MC9s12xs128,最高總線頻率為40MHz,這決定了圖像處理算法應(yīng)盡可能避免浮點(diǎn)乘加運(yùn)算。該系統(tǒng)的圖像處理通過兩種算法實(shí)現(xiàn)。一個(gè)是“輪廓”算法1,另一個(gè)是“面積”算法3。在本設(shè)計(jì)中,數(shù)碼相機(jī)OV7620作為圖像傳

15、感器,可以輸出兩種信號(hào),即彩色信號(hào)和灰度信號(hào)。由于彩色信號(hào)數(shù)據(jù)量大,本設(shè)計(jì)只采集其輸出的8位灰度信號(hào)?!拜喞彼惴ú杉€路中斷時(shí)攝像機(jī)輸出的灰度信號(hào),并將數(shù)據(jù)發(fā)送到單片機(jī)的存儲(chǔ)單元。然后,每條線在當(dāng)前線的第一灰度信號(hào)值和下一亮度信號(hào)值之間產(chǎn)生差值,并取該差值的絕對(duì)值。當(dāng)差值在一定范圍內(nèi)時(shí),認(rèn)為沒有灰度差,即看不到物體。然后用下一個(gè)灰度數(shù)據(jù)做出改變。當(dāng)差值超過給定范圍時(shí),做一個(gè)標(biāo)記,然后進(jìn)行軟件過濾,消除瞬間采集數(shù)據(jù)出錯(cuò)的可能性,找出待識(shí)別物體的起始位置。用這種方法再次找到終點(diǎn)。軟件中設(shè)置的差值是60。找到每一行的起點(diǎn)和終點(diǎn)后,從整體上判斷物體的輪廓。我使用的是在每行開始時(shí)記錄的位置點(diǎn)(即每行中的標(biāo)記點(diǎn))和最后一行開始時(shí)記錄的點(diǎn)(即標(biāo)記點(diǎn))之間進(jìn)行區(qū)分。如果絕對(duì)值大于某個(gè)值,則認(rèn)為它有斜率;如果在軟件中設(shè)置,如果大于10,則認(rèn)為它具有斜率。軟件流程圖如圖4所示。圖4“輪廓”算法的軟件流程圖“區(qū)域”算法是對(duì)“輪廓”算法的簡(jiǎn)化改進(jìn),它主要不同于“輪廓”算法,因?yàn)樗鼘?duì)灰度信號(hào)沒有影響,而是將其與固定閾值進(jìn)行比較。如果小于該閾值,面積變量將增加1,并且將一直掃描所有收集的灰度數(shù)據(jù)。然后,根據(jù)測(cè)量數(shù)據(jù),計(jì)算待識(shí)別物體的近似面積,并確定近似面積范圍。在軟件中,在計(jì)算區(qū)域的大小后,將其與之前計(jì)算的近似區(qū)域范圍進(jìn)行比較,計(jì)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論