版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第1章緒論1.1課題研究目的和意義數(shù)字圖像識別處理是指使用計(jì)算機(jī)對輸入進(jìn)電腦的將信息轉(zhuǎn)化為數(shù)字信息儲存的圖像進(jìn)行降噪、增強(qiáng)、復(fù)原、分割、提取特征等處理圖片并進(jìn)行識別的方法和技術(shù)。數(shù)字圖像的組成是一個(gè)個(gè)分成最基本單位的像素,每一個(gè)像素都有自己獨(dú)特的信息,它攜帶著自己的位置信息和色彩信息,一個(gè)個(gè)像素用自己獨(dú)特的信息拼接一起,拼接成一幅幅數(shù)字圖像。剛開始圖像識別能夠產(chǎn)生的目的主要是為了改善圖像的質(zhì)量,以使得圖像更方便人類觀察各種事物。它是人們?yōu)榱烁玫纳疃l(fā)明出來的技術(shù),可以過濾掉好多人肉眼無法分辨處理的干擾項(xiàng)。在MATLAB中,輸入進(jìn)來的圖片經(jīng)常被用增強(qiáng)、二值轉(zhuǎn)換、切割加工等等功能進(jìn)行增強(qiáng)檢測的效果,然后改善后的圖像被傳輸出去,方便人們對它進(jìn)行識別等其它操作。1970年前后開始到現(xiàn)在,該技術(shù)隨著機(jī)器人的發(fā)展和發(fā)展人工思維科學(xué)等理論研究的發(fā)展從提出到不斷的完善和發(fā)展,數(shù)字圖像識別逐漸應(yīng)用于機(jī)器感知領(lǐng)域,被用來當(dāng)作計(jì)算機(jī)或機(jī)器人的視覺。但是該領(lǐng)域是新興起的技術(shù),幾乎所有跟計(jì)算機(jī)視覺有關(guān)的理論都剛剛萌芽、不太完善,所以相關(guān)的技術(shù)仍然有很大的空間來發(fā)展。一個(gè)技術(shù)想要發(fā)展,離不開人們的日常需求和數(shù)學(xué)理論的完善,而數(shù)字圖像識別除了這兩個(gè)原因,還離不開計(jì)算機(jī)技術(shù)科學(xué)的發(fā)展和進(jìn)步。這就使得在它的發(fā)展歷程中,圖像識別技術(shù)能夠產(chǎn)生質(zhì)變性的發(fā)展。不僅如此,醫(yī)學(xué)圖像研究、地質(zhì)學(xué)地圖分析和地質(zhì)分析和天文學(xué)對星體的形狀大小研究等需求也使得數(shù)字圖像處理技術(shù)直到今天還在不斷發(fā)展。數(shù)字圖像識別技術(shù)的確在人們生活中的方方面面都得以應(yīng)用,因此學(xué)習(xí)和掌握數(shù)字圖像識別技術(shù)也是從事許多研究工作所需要的。恰當(dāng)?shù)剡\(yùn)用這項(xiàng)技術(shù)能夠有力地推動(dòng)許多研究工作的發(fā)展,為人類造福。1.2數(shù)字圖像識別背景綜述數(shù)字圖像處理,就是計(jì)算機(jī)處理圖像信息,通過計(jì)算機(jī)將事物的圖像信號轉(zhuǎn)換成含有大量信息的數(shù)字信號然后把信息進(jìn)行各種運(yùn)算的過程。數(shù)字圖像處理技術(shù)被提出于1950年,在當(dāng)時(shí)計(jì)算機(jī)和相關(guān)的計(jì)算機(jī)科學(xué)技術(shù)已經(jīng)發(fā)展了一定的時(shí)間,有了一定的進(jìn)步,并且人們也愿意用計(jì)算機(jī)來處理事情以減輕自己的負(fù)擔(dān),所以人們選擇把圖像的數(shù)字信息傳輸?shù)接?jì)算機(jī)中去處理問題。由于希望更多的人能簡潔快速的處理圖像、改善質(zhì)量,也為了擴(kuò)大這種技術(shù)的影響力,大約于1960年人們把這種技術(shù)設(shè)成學(xué)校的一門學(xué)科。從1975年開始,人工思維科學(xué)不斷發(fā)展,為其它技術(shù)的發(fā)展壯大奠定了基礎(chǔ),數(shù)字圖像處理逐漸向深層次發(fā)展,人們開始研究如何將計(jì)算機(jī)系統(tǒng)設(shè)計(jì)成一條通路把系統(tǒng)當(dāng)成計(jì)算機(jī)的讀取外界信息的渠道然后解釋、分析和理解圖像,讓計(jì)算機(jī)系統(tǒng)能夠通過這個(gè)過程理解外部世界,這其中的過程被稱為計(jì)算機(jī)視覺。1970年末,Marr提出了視覺計(jì)算理論,而且該理論成為計(jì)算機(jī)視覺領(lǐng)域的支柱,但它是一個(gè)從來沒有被人開發(fā)過的全新的研究領(lǐng)域,人們想要對該領(lǐng)域研究的十分透徹其過程需要大量的人力物力以及時(shí)間的積累,所以計(jì)算機(jī)視覺還有更大的潛力待人們?nèi)ラ_發(fā)。人們在日常生活中因?yàn)楦鞣N各樣的需求需要無時(shí)無刻的對物體進(jìn)行識別和挑選,隨著1946年計(jì)算機(jī)的出現(xiàn)以及1956年人工智能的興起,人們想要通過使用,計(jì)算機(jī)來代替人類的部分腦力勞動(dòng)。模式識別是利用計(jì)算機(jī)和以數(shù)學(xué)公式處理數(shù)字信息的數(shù)據(jù)推理方法對數(shù)字圖像的形狀輪廓、曲線粗細(xì)、數(shù)字符號和圖形大小分別進(jìn)行識別的過程。模式識別含有學(xué)習(xí)階段和實(shí)現(xiàn)階段,學(xué)習(xí)階段是對樣本的相似點(diǎn)、類同點(diǎn)進(jìn)行提取,總結(jié)和得出特征的規(guī)律,實(shí)現(xiàn)階段則是從得出的分類規(guī)律分類并歸納未知的樣本集合里的各個(gè)元素。模式識別屬于計(jì)算機(jī)科學(xué)的智能模擬范疇,內(nèi)容包括語言識別、文字識別、指紋識別、聲音信號識別和瞳孔識別、臉部識別等等,多種多樣應(yīng)用廣泛。近幾十年來,模式識別技術(shù)發(fā)展很快。模式識別問題一般可由統(tǒng)計(jì)模式識別、結(jié)構(gòu)模式識別、模糊集理論識別、神經(jīng)網(wǎng)絡(luò)識別等方法進(jìn)行處理。其中發(fā)展較成熟、應(yīng)用較廣泛的主要是統(tǒng)計(jì)模式識別技術(shù)。隨著數(shù)字圖像處理技術(shù)的發(fā)展和實(shí)際應(yīng)用的需要,人們現(xiàn)在不單單要求其結(jié)果只是單單分析圖片上明面的信息和特征,而是將經(jīng)過上述處理后的圖像,再進(jìn)行二次分割和提取有效的特征,進(jìn)而對比其中的規(guī)律加以判斷和分類。例如要從遙感圖像中分割出各種地形和地貌、森林資源、礦產(chǎn)資源等,還有分析動(dòng)物是否進(jìn)行了大規(guī)模遷徙,確認(rèn)動(dòng)物的遷徙方向和前夕地點(diǎn);根據(jù)天氣云量分析天氣是否有雨;根據(jù)醫(yī)學(xué)影像斷層得出各種骨折或者腫瘤的信息;臉部識別統(tǒng)計(jì)上下班打卡等等,這些都是圖像識別的研究內(nèi)容。圖像識別可以認(rèn)為就是以圖片為處理對象模式然后進(jìn)行上面介紹的模式識別,它是模式識別技術(shù)在圖像領(lǐng)域中的具體應(yīng)用。模式識別的研究對象基本上可以說是生活中的與我們息息相關(guān)的任何東西,既是有形體的東西如符號、相片、圖案、文字等,也可以是沒有實(shí)體只能傳遞信息和波動(dòng)的信號如語聲、心電脈沖、地震波等。對模式識別來說,分析各種無論是有實(shí)體的還是沒有實(shí)體的物體,都能在它們各種各樣的特性里去尋找共性去歸類,也都能在多樣的共性里識別出獨(dú)特的特性。模式識別研究的目的是研制出能夠自動(dòng)處理信息的機(jī)器系統(tǒng),方便人類、代替人類、解放人類。
第2章數(shù)字圖像預(yù)處理2.1圖像的基本操作由于在拍攝時(shí)的光照條件不理想,拍照鏡頭的整潔程度不高,攝像機(jī)的焦距調(diào)整不到位以及攝像機(jī)鏡頭的光學(xué)畸變等所產(chǎn)生的噪聲都會(huì)不同程度地造成照片事物的邊界模糊、細(xì)節(jié)不清、粗細(xì)不均,影響數(shù)字圖片識別的準(zhǔn)確性。因此,需要在數(shù)字圖像識別之前對照片進(jìn)行一次針對性的圖像處理;采集到的照片是彩色圖像,而彩色圖像包含著大量的顏色信息,不但在存儲上開銷很大,而且在處理上也會(huì)降低系統(tǒng)的執(zhí)行速度,此在對圖像進(jìn)行處理是經(jīng)常將彩色圖像轉(zhuǎn)變?yōu)榛叶葓D像,以加快處理速度。把圖片變灰操作之后,像素的最大不失真電平和噪聲電平的差增加,圖像更有層次感,圖像的明暗區(qū)域的最亮和最暗之間不同的亮度層級擴(kuò)展,可以說圖像處理后更加清晰、易識別。圖像的預(yù)處理是指對采集到的圖像進(jìn)行灰度化和去噪聲處理,以使圖像的質(zhì)量得到改善,同時(shí)保留和增強(qiáng)照片中紋理和顏色的信息,去除噪點(diǎn),為特征區(qū)域定位提供方便。2.1.1圖像的讀取在處理圖像前,需要將圖像讀取到MATLAB中,所以需要用imread()函數(shù)來讀取一幅圖像,文件名需要用單引號括起來,在語句的末尾還需要加分號在來取消輸出:I=imread('cat1.jpg');有的時(shí)候本程序在只打文件名的時(shí)候,MATLAB找不到該文件,所以可以在文件名前面打上該文件的路徑信息,imread()函數(shù)會(huì)根據(jù)語句里的路徑信息去讀入圖像文件,這里路徑既可以給的很完整,也可以只給上一級或者最高級,比如︰I=imread('C:\cat1.jpg');2.1.2圖像的寫入函數(shù)imwrite()是用來寫入圖像文件的,比如該程序需要把經(jīng)過處理后的圖像存儲在電腦中,就可以用到該函數(shù),如:imwrite(I,'filename');I在里面表示的是一個(gè)二維圖像數(shù)組,可以由通過imread()函數(shù)得到,filename必須是一種可識別的文件格式。例如,下面的命令可以將圖像以cat1為文件名存儲為PNG格式的文件:imwrite(I,'cat1.png');如果filename中不包含路徑信息,那么imwrite()就會(huì)把文件保存至MATLAB當(dāng)前運(yùn)行路徑的工作文件夾中。此外imwrite()函數(shù)還有一種適用于JPEG圖像的語法形式,如下:imwrite(I,'filename.jpg','quality',q);系統(tǒng)給定q的取值范圍是0~100之間的整數(shù),是說明圖像的畫質(zhì)會(huì)被壓縮的標(biāo)準(zhǔn),q值大就表示圖像越接近本來的質(zhì)量,q值小就表示圖像的畫質(zhì)受損比較嚴(yán)重。2.1.3圖像的顯示imshow()函數(shù)在本論文里用來顯示圖像文件,尤其是在經(jīng)過一系列程序的處理想要看原圖像處理后的效果時(shí),就用到了該函數(shù)。如果想要同時(shí)輸出多個(gè)圖像,就可以搭配著figure()函數(shù)使用,可以得到多個(gè)圖像窗口,避免前面的圖像被后面的新的要展示的圖像覆蓋,里面分別展示了每個(gè)步驟所獲得的圖像,不同窗口疊放在一起進(jìn)行對比,能更明顯的展示出經(jīng)過程序運(yùn)行后的圖片的不同。imshow()函數(shù)的基本語法形式如下:imshow(I);%figureimshow(IMG1);figure(5);imshow(IMG2);2.2圖像的增強(qiáng)處理圖像增強(qiáng)是通過一些處理將對最終目的有益處的一些信息有選擇地突出出來,將一些無用的信息識別出來并進(jìn)行抑制或削弱。圖象增強(qiáng)有兩種方法,分別是空域增強(qiáng)和頻域增強(qiáng)兩種方法??沼蛟鰪?qiáng)∶在圖像的第二維度直接對每一個(gè)像素進(jìn)行處理,而處理的對象是每一個(gè)像素的灰度值。空域增強(qiáng)可分為灰度變換和空間濾波。灰度變換是基于點(diǎn)操作,將每一個(gè)基礎(chǔ)組成部分的灰度數(shù)值都進(jìn)行置換,以數(shù)學(xué)原理為基礎(chǔ),并得到新的數(shù)值;空間濾波是基于領(lǐng)域處理,應(yīng)用某種數(shù)學(xué)變換運(yùn)算對每個(gè)像素及其周圍領(lǐng)域的所有像素進(jìn)行運(yùn)算并得到新的灰度值,再賦值回給像素,比如圖像平滑和圖像銳化。頻域增強(qiáng)要運(yùn)用數(shù)學(xué)原理傅里葉變換處理圖像的空域,使之轉(zhuǎn)換到頻率域中,然后在頻率域中更改頻譜的各種指標(biāo),再將其反變換到空域,就能得到需要的圖像了。2.2.1圖像的灰度處理灰度圖只有亮度間的對比,沒有顏色的差和對比,平時(shí)看到的亮度連續(xù)變化的黑白照片就是一幅灰度圖?;叶然幚砭褪菍⒁环噬珗D像轉(zhuǎn)化為灰度圖像。彩色圖像有R、G、B三個(gè)分量,分別合成各種彩色圖像,灰度化就是使彩色的R、G、B分量相等的過程?;叶戎荡蟮南袼攸c(diǎn)比較亮為自色,反之比較暗是黑色。當(dāng)3個(gè)分量的值相等時(shí),像素的顏色就是介于黑和白之間的一個(gè)灰度等級。所以分別提取R、G、B分量中的一個(gè)分量來作為結(jié)果圖像的灰度,其他兩個(gè)分量再置為與選定分量同等大小的值,這就類似于讀者現(xiàn)在看到的黑白印刷結(jié)果。但是經(jīng)過這種方式處理的圖像,其顯示效果并不十分理想,畢竟有兩個(gè)分量被忽略掉了,而它們對于最終,其顯示效果顯然也有貢獻(xiàn)。圖像灰度化的算法[2主要有以下3種:(1)平均值法:使轉(zhuǎn)化后R、G、B的值為轉(zhuǎn)化前R、G、B的平均值G=B=R=(R+G+B)/3這種方法產(chǎn)生的灰度圖像比較柔和。(2)最大值法:使轉(zhuǎn)化后R、G、B的值等于轉(zhuǎn)化前3個(gè)值中最大的一個(gè),即:G=B=R=max(R,G,B)這種方法轉(zhuǎn)換的灰度圖亮度很高。(3)加權(quán)平均值法:根據(jù)重要性或其他指標(biāo)給R、G、R\GB賦予不同的權(quán)值,并使R,G.B的值加權(quán)平均,R=G=B=WR+VG+UB,W、V、U分別表示權(quán)重,研究表明,人對綠色的敏感度最高,對紅色次之,對藍(lán)色的敏感度最低,因此W>V>U,實(shí)驗(yàn)和理論證明當(dāng)W=0.30,V=0.59,U=0.11時(shí),能得到最合理的灰度圖像。我在做實(shí)驗(yàn)的時(shí)候,將我的實(shí)驗(yàn)圖片通過程序按照R、G、B三通道進(jìn)行了采樣,更加直觀感受出對圖片各種顏色的敏感度:rgb2gray灰度處理原理是以R、G、B為軸建立空間直角坐標(biāo)系,則RCB圖的每個(gè)象素的顏色可以用該三維空間的一個(gè)點(diǎn)來表示,而Gray圖的每個(gè)象素的顏色可以用直線R=G=B上的一個(gè)點(diǎn)來表示。于是rgb轉(zhuǎn)gray圖的本質(zhì)就是尋找一個(gè)三維空間到一維空間的映射,最容易想到的就是過rgb空間的一個(gè)點(diǎn)向直線R=G=B做垂線,像射影一樣,并且有Gray=0.29900*R+0.58700*G+0.11400*B?;叶瓤梢哉f是亮度的量化值,而RGB的定義是客觀的三個(gè)波長值,轉(zhuǎn)換時(shí)需要考慮人眼對不同波長的靈敏度曲線,所以系數(shù)不相等。所以經(jīng)過rgb2gray處理后的照片與原照片對比非常明顯,我經(jīng)過實(shí)驗(yàn)調(diào)試后得到對比圖:這樣就算灰度處理完了,灰色的圖像是得到的灰度處理的結(jié)果,可以看到灰色的圖像對比原圖確實(shí)少了有關(guān)顏色的信息,但是輪廓更加清晰、明暗對比也更加明顯。2.2.2圖像的二值處理二值處理需要用到MATLAB的工具箱函數(shù)im2bw把灰度圖像轉(zhuǎn)換成二值圖像。所謂二值圖像,是指當(dāng)灰度圖像的灰度只有兩個(gè)等級時(shí),這種圖像就叫二值圖像,可以只用"全黑"與"全白"來對圖像進(jìn)行描述。一般意義上是指只有0、255兩種色度的圖像。不過也可以換做其他任意兩種顏色的組合。圖像二值化是將灰度圖像轉(zhuǎn)化為只有黑白兩類像素的圖像,最主要采用閾值化算法處理,閾值的選取決定著圖像特征信息的保留程度也決定著往后圖像識別的準(zhǔn)確度,所以要想保留好圖像的關(guān)鍵信息,一定要注意圖像二值化時(shí)如何選取閾值。灰度圖像,顧名思義是沒有色彩信息的圖像,它只能通過灰色的亮暗反映原圖片的亮暗,所以它只能反映圖片的亮度信息。該技術(shù)就是將圖像上的點(diǎn)的不是黑或者白的灰色置為黑色或者白色,也就是讓灰色圖像變成只有黑白的圖像。將灰度圖像通過設(shè)置合適的閥值而獲得仍然可以反映圖像只有暗亮對比的顏色數(shù)值只有兩個(gè)的圖像。閥值分割選取算法有:典型的全局閥值算法的Otsu算法、局部閥值方法中的Bersen算法、灰度拉伸法、直方圖方法等等。1.Otsu算法的設(shè)計(jì)思想:設(shè)置一個(gè)合適的閥值把圖像分割開來,一半灰度與目標(biāo)平齊,另一半灰度與背景呼應(yīng),則這兩組灰度值的背景和目標(biāo)之間的方差最小,兩組間的錯(cuò)分概率最大。2.Bersen算法的設(shè)計(jì)思想:該函數(shù)不是固定的,它會(huì)把灰度閾值的選值隨像素位置變化而變化,它是一種動(dòng)態(tài)選擇閾值的自適應(yīng)方法。3.灰度拉伸算法設(shè)計(jì)思想:灰度拉伸就是把圖像中最亮的和最暗的區(qū)域的值作比并拉伸,它使用的是數(shù)學(xué)函數(shù)里的分段函數(shù),該函數(shù)是線性的變換的,所以可以擴(kuò)大圖像的像素灰度的動(dòng)態(tài)范圍。4.直方圖算法的設(shè)計(jì)思想:如果說原圖像分析直方圖時(shí)將灰度分布到直方圖的坐標(biāo)上可以發(fā)現(xiàn)很不均勻,尤其是會(huì)集中在一個(gè)區(qū)域上,該算法運(yùn)算后灰度會(huì)在每個(gè)坐標(biāo)上比較均勻的分布。為了更好的比對四種閥值分割選取算法,我每一個(gè)算法都通過MATLAB進(jìn)行探索過,并把得到的結(jié)果進(jìn)行對比,得到以下四種結(jié)果:Otsu算法:Berse算法程序太過復(fù)雜,運(yùn)行時(shí)間非常長,而且得出的結(jié)果照片特別的不清晰,直接跳過。后兩種方法也運(yùn)行了程序得到了二值化結(jié)果。通過對比發(fā)現(xiàn)用OTSU算法二值化后的人物比較清晰,背景和前景分割比較明顯,改進(jìn)的Bersen算法分開人物和背景的效率明顯提高,而Bersen算法人物與背景老是混雜在一起,分界太不明顯了。這個(gè)結(jié)果使我對圖像處理有了更深一步的了解。Otsu算法可以切割的更加完美,切割的程序處理速度也很快,可以很快的得到處理后的圖像,算出來的閾值更合適,保證了分割后的準(zhǔn)確度,該算法快速且準(zhǔn)確;Bersen算法處理不好需要處理重點(diǎn)的與背景的去留,用這種算法不能正確地區(qū)分重點(diǎn)與干擾的界線,改進(jìn)過后的Bernsen算法分割效果要更加明顯且清晰,在直方圖上分散的效果不錯(cuò)。2.2.3圖像的平滑與銳化圖像的低頻部分主要存儲著能量,圖像的高頻段主要存在著噪音,尤其是圖形的邊緣突出的地方也在圖像的高頻區(qū)域。所以原始圖像在平滑處理之后,平滑是去除噪聲,也就導(dǎo)致不僅僅高頻段的噪音被去除了,而且在高頻段的圖像的邊緣也被去除了,圖像的外圍和形狀邊緣會(huì)出現(xiàn)模糊不清的情況。為了避免這種情況在程序處理中發(fā)生,需要將圖像邊緣增強(qiáng)而且要細(xì)化突出,使圖像的輪廓變得明了易于分辨。經(jīng)過平滑的圖像變得模糊的圖像需要對其進(jìn)行微分運(yùn)算等逆運(yùn)算,運(yùn)算完后會(huì)發(fā)現(xiàn)圖像變得非常清楚。微分運(yùn)算求算了信號的變化,考慮了傅里葉級數(shù)和拉普拉斯變換,所以頻率很高分量較強(qiáng)。頻率域也是圖像考慮為什么會(huì)模糊的一個(gè)重要比較環(huán)境,圖像的高頻分量衰減也會(huì)導(dǎo)致圖像不清晰、發(fā)花,使用濾波器不失為讓圖像清晰的好方法,這里我們?yōu)榱饲宄?,可以選擇高通濾波器。但能夠進(jìn)行濾波處理的圖像需要有很高的性噪比,要不然性噪比會(huì)越來越低,也就是說噪音會(huì)越來越多,圖像會(huì)越來越模糊不清,所以進(jìn)行濾波前要先除噪再進(jìn)行銳化處理。濾波之后要注意很多問題,也用到很多工具,比如賦予了像素灰度值的模板。模板應(yīng)該按照以下步驟處理數(shù)據(jù):1.將模板在圖中擺放,將模板與像素重合;2.將模板里的系數(shù)與基礎(chǔ)組成部分的灰度值乘起來;3.將上面得到的數(shù)值相加,再除以模板的系數(shù);4.將上面的輸出響應(yīng)結(jié)果賦給圖中對應(yīng)模板中心位置的像素??沼?yàn)V波增強(qiáng)的目的主要是對圖像進(jìn)行平滑或者銳化,所以空域?yàn)V波器對應(yīng)兩種目的分別設(shè)計(jì)了一種濾波器:1.平滑濾波器:可以模糊、消除噪聲,前面提到原理是把圖片里的高頻率的信號減弱或消除,低頻率的信號原封不動(dòng)的保存。平滑濾波器將變得太快跨度較大的灰度值部分分量濾去可減少局部灰度的起伏,使圖像平滑。2.銳化濾波器:使模糊的地方更加模糊,把低頻率的信號增強(qiáng),高頻率的信號沒有影響和變化。銳化濾波器將變得太慢基本沒有跨度的灰度值部分分量濾去,可使圖像反差以及輪廓更加明顯。平滑與銳化可以說是完全相反的兩種處理方式。平滑又稱為低通濾波,把高頻率的像素其中包含的信息消除、削弱,從而達(dá)到減少數(shù)字圖像里的噪聲,使圖像變得模糊。使用均值濾波和中值濾波來驗(yàn)證線型的和非線性不同模板大小的濾波效果均值濾波和和中值濾波的對比,均值濾波和和中值濾波都可以起到平滑圖像,濾去噪聲的功能。均值濾波采用線性的方法,就是把所有的像素的數(shù)值平均化了,但是如果太過平均,沒有突出或者低矮的數(shù)值,就表明數(shù)字圖像的細(xì)節(jié)全部被掩蓋了,雖然這樣圖像里的噪聲會(huì)被去除大部分,但是細(xì)節(jié)也會(huì)被破壞絕大部分,圖像也會(huì)因此變得模糊,不能很好地進(jìn)行接下來的有關(guān)圖像的很細(xì)致的處理。均值濾波高斯噪聲表現(xiàn)較好,對椒鹽噪聲表現(xiàn)較差。中值濾波是采用的非線性方法,它在平滑脈沖噪聲方面非常有效,同時(shí)它可以保護(hù)圖像尖銳的邊緣,選擇適當(dāng)?shù)狞c(diǎn)來替代污染點(diǎn)的值,所以處理效果好,對椒鹽噪聲表現(xiàn)較好,對高斯噪聲表現(xiàn)較差。這是我用彩色圖片通過調(diào)試程序得出來的結(jié)果,分別加入了不同系數(shù)的高斯噪聲以及分別進(jìn)行高斯濾波,都在figure1圖表中顯示了出來。同理灰色圖像也可以加入不同系數(shù)的高斯噪聲以及分別進(jìn)行高斯濾波的圖片結(jié)果并進(jìn)行操作以下時(shí)灰色圖像加入不同系數(shù)的高斯噪聲的幾種結(jié)果:銳化又稱為高通濾波,把低頻率的像素其中包含的信息消除、削弱,從而達(dá)到增加數(shù)字圖像里的噪聲,減少圖像的模糊模糊程度,從而讓圖像變得清晰。以下是拉普拉斯算子的程序進(jìn)行的銳化結(jié)果:以下是普瑞斯特算子的程序進(jìn)行的銳化結(jié)果:以下是Sobel算子的程序進(jìn)行的銳化結(jié)果:
第3章數(shù)字圖像的識別3.1圖像的邊緣檢測圖像邊緣,它的凸起和凹陷以及每一個(gè)拐點(diǎn)往往表明了一幅圖像的大部分信息,是圖像最基本的特征之一。邊緣的不規(guī)則結(jié)構(gòu)和不平穩(wěn)發(fā)展標(biāo)明了圖像輪廓的位置,這些輪廓攜帶著圖像的絕大部分信息,所以我們要想知道一個(gè)圖像的特點(diǎn)就要檢測完并把它的輪廓形狀從圖像整體里剜出來。邊緣是指一個(gè)物體最外圍用線條和拐點(diǎn)組成的一個(gè)封閉形狀,這個(gè)形狀既可以規(guī)則也可以充斥著拐點(diǎn)與轉(zhuǎn)折,可以代表一個(gè)特征的結(jié)束,也可以代表另一個(gè)特征的開始,利用該特征可以分割圖像。在觀察一個(gè)物體時(shí),首先關(guān)注到的便是圖形的邊緣,是否圓潤又或者是否方正。圖像的邊緣有方向和幅度這兩個(gè)衡量的基準(zhǔn),平行于邊緣切線方向的像素變化平穩(wěn)緩慢,垂直于邊緣切線方向的像素變化要更加急切和劇烈。邊緣上的這種變化可以用一階導(dǎo)數(shù)或二階導(dǎo)數(shù)等微分算子計(jì)算出來:但是一階導(dǎo)數(shù)的最大值對應(yīng)其邊緣位置,而二階導(dǎo)數(shù)以過零點(diǎn)的值對應(yīng)其邊緣位置,這兩種微分算子對于圖像中的任意邊緣都可以進(jìn)行微分算子分析。圖像邊緣檢測的一階導(dǎo)數(shù)可以利用梯度的幅度變化來獲得,二階導(dǎo)數(shù)可以通過拉普拉斯算子得到。圖像邊緣檢測和分析是一種獲取、校正、增強(qiáng)變換、檢測有形體圖像的技術(shù)。其目的是提高信息的質(zhì)量,能夠更方便的將有用信息提取出來。圖像邊緣檢測中的變換屬于圖像輸入到圖像輸出轉(zhuǎn)換的模式,圖像邊緣檢測是一種為了人們解決數(shù)字圖像的特殊問題而開發(fā)的圖像處理的新技術(shù)。圖像邊緣檢測的主要研究內(nèi)容包括:(1)圖像獲得和抽樣,圖像獲得的方式多種多樣,不僅僅是相機(jī),包括現(xiàn)在的手機(jī)、電視機(jī)都可以獲取到圖像,且能把所獲得數(shù)字圖像里面所包含的信息分別進(jìn)行歸納分類,圖像數(shù)字化是把圖像中全部彩色內(nèi)容拆解變成能被計(jì)算機(jī)接受的數(shù)字化的內(nèi)容;電荷耦合裝置,用作圖像傳感器,對景物掃描然后輸入到計(jì)算機(jī)中間。一幅圖像實(shí)質(zhì)上是把三維空間的景色壓縮在只有二維的一個(gè)平面之中,所以圖像邊緣檢測的處理對象也是數(shù)字化的信息。(2)圖像分割,目的是把一個(gè)圖像分解成它的一個(gè)個(gè)小的易于檢測的組成的小分子,然后進(jìn)行測量統(tǒng)計(jì)得出最后的總量。圖像分割的過程十分的復(fù)雜,需要細(xì)致的操作,其測量結(jié)果的正確與否很依賴于圖像分割的精準(zhǔn)性。進(jìn)行圖像分割的方法有兩類:一種方法是假設(shè)圖像各成分的強(qiáng)度值是均勻的并利用這種均勻性;另一種方法尋找圖像成分之間的邊界,因而是利用圖像的不均勻性。運(yùn)用到圖像分割的技術(shù)主要有直方圖分割、區(qū)域生長、梯度法等。(3)邊界查索,分割圖像的整體輪廓成一個(gè)個(gè)小的輪廓碎片,然后對其中的碎片進(jìn)行線性檢測和匹配。大多數(shù)圖像邊緣檢測技術(shù)應(yīng)用像向量的梯度算子,分別對水平方向、垂直方向進(jìn)行計(jì)算,然后用向量法計(jì)算它們的復(fù)合結(jié)果然后確認(rèn)邊界的方向。(4)圖像增強(qiáng)和復(fù)原,用于改進(jìn)圖像的質(zhì)量。不同的增強(qiáng)技術(shù)可以用于不同的目的,這取決于應(yīng)用的類型。如果打算直接觀察圖像,可以增強(qiáng)對比度。如果是為了進(jìn)一步對圖像作數(shù)字處理,可以選擇分割,就是一種突出各圖像成分之間的邊界和線狀結(jié)構(gòu)的運(yùn)算。該技術(shù)可以是整體的或局部的,也可以在某個(gè)頻域或者空間域中進(jìn)行。圖像增強(qiáng)如果不考慮圖像的質(zhì)量下降等原因,可以把圖像中所有特色的部分突出出來。(5)圖像分類,圖像分類就是把很多種圖片集合在一起,統(tǒng)一進(jìn)行輸入轉(zhuǎn)換成數(shù)字化的信息,然后進(jìn)行梳理規(guī)律并且分類圖像分割和特征提取后的照片,從而得到分類結(jié)果。圖像分類常采用經(jīng)典的模式識別方法,有統(tǒng)計(jì)模式分類和句法結(jié)構(gòu)模式分類。(6)圖像變換:現(xiàn)在的圖像信息量大、清晰度高,不對原圖像進(jìn)行數(shù)字量上的轉(zhuǎn)換以及減負(fù)的話,涉及到的運(yùn)算的計(jì)算量很大。所以想要解決計(jì)算量的問題就需要采用各種圖像變換的方法,如傅立葉變換、拉普拉斯變換等數(shù)學(xué)技術(shù),將三元函數(shù)的處理轉(zhuǎn)換為二元函數(shù)處理,不僅大大減少計(jì)算步驟,還使處理更加有效率,比如傅立葉變換可在頻域中進(jìn)行數(shù)字濾波處理。目前新發(fā)現(xiàn)的小波變換都具有良好的把整體化局部的特性,它在圖像邊緣檢測中也有著廣泛而有效的應(yīng)用。以下介紹兩種常用的邊緣檢測算子:3.1.1Sobel檢測算子是圖像處理中的算子之一,主要用作邊緣檢測。在技術(shù)上,它是一離散性差分算子,用來運(yùn)算圖像亮度函數(shù)的梯度之近似值。在圖像的任何一點(diǎn)使用此算子,將會(huì)產(chǎn)生對應(yīng)的梯度矢量或是其法矢量。該算子包含兩組3x3的矩陣,分別為橫向及縱向,將之與圖像作平面卷積,即可分別得出橫向及縱向的亮度差分近似值。Sobel算子有兩個(gè),一個(gè)是檢測水平邊沿的,另一個(gè)是檢測垂直平邊沿的。Sobel算子另一種形式是各向同性Sobel算子,也有兩個(gè),一個(gè)是檢測水平邊沿的﹐另一個(gè)是檢測垂直平邊沿的。各向同性Sobel算子比普通Sobel算子的位置加權(quán)系數(shù)更為準(zhǔn)確,在檢測不同方向的邊沿時(shí)梯度的幅度一致。由于Sobel算子是濾波算子的形式,用于提取邊緣,可以利用快速卷積函數(shù),簡單有效,因此應(yīng)用廣泛。美中不足的是,Sobel算子并沒有將圖像的主體與背景嚴(yán)格地區(qū)分開來,換言之就是Sobel算子沒有基于圖像灰度進(jìn)行處理,由于Sobel算子沒有嚴(yán)格地模擬人的視覺生理特征,所以提取的圖像輪廓有時(shí)并不能令人滿意。在觀測一幅圖像的時(shí)候,我們往往首先注意的是圖像與背景不同的部分,正是這個(gè)部分將主體突出顯示,基于該理論,我們給出了下面閾值化輪廓提取算法,該算法已在數(shù)學(xué)上證明當(dāng)像素點(diǎn)滿足正態(tài)分布時(shí)所求解是最優(yōu)的。Sobel算子認(rèn)為鄰域的像素對當(dāng)前像素產(chǎn)生的影響不是等價(jià)的,所以距離不同的像素具有不同的權(quán)值,對算子結(jié)果產(chǎn)生的影響也不同。一般來說,距離越大,產(chǎn)生的影響越小。3.1.2Canny檢測算子檢測階躍邊緣的基本思想是在圖像中找出具有局部最大梯度幅值的像素點(diǎn)。圖像邊緣檢測必須滿足兩個(gè)條件:一是必須能有效地抑制噪聲;二是必須盡量精確確定邊緣的位置。既要提高邊緣檢測算子對邊緣的敏感性,同時(shí)也提高了對噪聲的敏感。Canny邊緣檢測基本原理:(1)具有既能濾去噪聲又保持邊緣特性的邊緣檢測最優(yōu)濾波器,其采用一階微分濾波器。采用二維高斯函數(shù)的任意方向上的一階方向?qū)?shù)為噪聲濾波器,通過與圖像卷積進(jìn)行濾波;然后對濾波后的圖像尋找圖像梯度的局部最大值,以此來確定圖像邊緣。根據(jù)對信噪比與定位乘積進(jìn)行測度,得到最優(yōu)化逼近算子。這就是Canny邊緣檢測算子。類似與Marr(LOG)邊緣檢測方法,也屬于先平滑后求導(dǎo)數(shù)的方法。(2)Canny邊緣檢測算法:step1:用高斯濾波器平滑圖像;step2:用一階偏導(dǎo)的有限差分來計(jì)算梯度的幅值和方向;step3:對梯度幅值進(jìn)行非極大值抑制;step4:用雙闕值算法檢測和連接邊緣。(3)Canny算子檢測方法的優(yōu)點(diǎn):①低誤碼率,很少把邊緣點(diǎn)誤認(rèn)為非邊緣點(diǎn);②高定位精度,即精確地把邊緣點(diǎn)定位在灰度變化最大的像素上;③抑制虛假邊緣。在這幾種算法中除Roberts算子外都使用了圖像模板,模板運(yùn)算是圖像的一種處理手段——鄰域處理,有許多圖像增強(qiáng)效果都可以采用模板運(yùn)算實(shí)現(xiàn),如平滑效果,中值濾波,油畫效果,圖像的凹凸效果等等。3.2圖像的圖像分割圖像分割就是將圖像整體割分成若干小的組成區(qū)域的過程,各區(qū)域彼此相互連接、相互呼應(yīng)。圖像分割就是指把圖像里獨(dú)立分開的各個(gè)組成區(qū)域分辨并切割分離出自己的操作處理目標(biāo)的技術(shù)過程。這個(gè)操作目標(biāo)可以是獨(dú)特的物體、也可以是背景中的一塊區(qū)域,目標(biāo)可以是一塊單獨(dú)的區(qū)域,也可以是多塊區(qū)域彼此鏈接。圖像分割是將圖像間的數(shù)字化信息分類切割的過程,分類可以根據(jù)信息間的相同規(guī)律,也可以根據(jù)數(shù)字之間的相似性。其中有很多檢測方法和分割方法,主要有:雙峰法、區(qū)域分裂與合并和自適應(yīng)閾值分割等;對于灰度不連續(xù)性檢測方法,即基于邊緣的分割方法,主要有:邊緣檢測、邊緣跟蹤和霍夫變換等。此外,還有綜合特定理論工具的分割方法,這些方法包括基于形態(tài)學(xué)分水嶺的分割、基于統(tǒng)計(jì)模式識別的分割、基于神經(jīng)網(wǎng)絡(luò)的分割、基于小波變換的分割。以下是圖像分割的幾種類型:(1)閾值分割灰度閾值分割法是一種最好用的對區(qū)域進(jìn)行歸類的方法,它在圖像分割中最常見也最實(shí)用。閾值分割方法實(shí)際上是輸入圖像f到輸出圖像g的如下變換:可以看出T是閾值的數(shù)值,對于物體的圖像元素g(ij)=1,對于圖像背景的圖像信息區(qū)域g(ij)=0??梢灾篱撝捣指钏惴ㄗ铌P(guān)鍵的是閾值的數(shù)值,如果能找出一個(gè)最適合的數(shù)值帶入式子便可以將圖像按理想分割開來。數(shù)值一旦確定,將閾值的數(shù)值與基礎(chǔ)區(qū)域的灰度值逐個(gè)比較,并且能夠?qū)φ麄€(gè)圖片全部完成該操作,那么分割的結(jié)果直接就是需要分割出來操作的圖像區(qū)域。閾值分割只要找到合適的數(shù)值,它的計(jì)算過程便會(huì)飛速的進(jìn)行,處理數(shù)字圖像并進(jìn)行切割會(huì)有很高的效率,并且可以應(yīng)用于各種場合。(2)區(qū)域分割區(qū)域生長和分裂合并都是屬于區(qū)域分割的技術(shù),這兩種技術(shù)都需要一步一步的打好基礎(chǔ),然后一環(huán)扣一環(huán)的發(fā)展下去。區(qū)域生長先將一個(gè)個(gè)分割開的小的組成區(qū)域整理、分割好,然后找一個(gè)自己想要尋找分割的區(qū)域,把該區(qū)域的像素信息作為分割的起點(diǎn),然后把周圍緊鄰的區(qū)域像素信息進(jìn)行梳理整合,尋找有沒有相似規(guī)律的區(qū)域,然后篩選出相似的區(qū)域,相連整合,再往周圍繼續(xù)輻射發(fā)展,不斷篩選、不斷整合,等輻射完了整幅數(shù)字圖像,整合出的一個(gè)新的區(qū)域就長成了。區(qū)域生長要提前選出一個(gè)模范像素來當(dāng)作區(qū)域選擇過程的規(guī)律準(zhǔn)則,如果被測試的像素周圍的其它像素區(qū)域的數(shù)值和信息都不符合該準(zhǔn)則,便可以停止生長,直接輸出到停止前的像素圖像。該準(zhǔn)則可以以任何特性作為標(biāo)準(zhǔn),選取的種子也可以是單個(gè)像素或者多個(gè)像素鏈接起來的區(qū)域。大部分有關(guān)該技術(shù)的準(zhǔn)則都會(huì)根據(jù)局部或者整體、特性或者共性在需要切割的圖像的不同的目的而改變,并且生長準(zhǔn)則的改變會(huì)影響分割的過程。從該技術(shù)的過程和原理可以發(fā)現(xiàn)該技術(shù)計(jì)算量小,對于緊密挨在一起能夠聯(lián)通的圖像會(huì)切割的更加方便。但是它需要人為確定發(fā)芽的起點(diǎn),一旦斷開,可能會(huì)導(dǎo)致切割完的區(qū)域不完整、有空缺。它是一種一步一步往下走的算法,當(dāng)圖像的數(shù)字信息量較大時(shí),分割區(qū)域的速度會(huì)很慢。(3)邊緣分割圖像邊緣處像素的灰度值的不連續(xù)性可以通過求導(dǎo)數(shù)來檢測到,其位置對應(yīng)一階導(dǎo)數(shù)的極值點(diǎn),對應(yīng)二階導(dǎo)數(shù)的零交叉點(diǎn)。因此常用微分算子進(jìn)行邊緣檢測。常用的一階微分算子有Roberts算子、Prewitt算子和Sobel算子,二階微分算子有Laplace算子和Kirsh算子等。因?yàn)檫吘壓驮肼暥际且粋€(gè)個(gè)不連續(xù)的沒有顏色的點(diǎn)組成,而且均屬于高頻像素范疇,所以在進(jìn)行微分算子檢測邊緣前要對圖像做平滑濾波處理。就像在前面提到的Log算子和Canny算子是具有平滑功能的二階和一階微分算子,都有著很好的檢測能力,能抑制噪聲之后把邊緣近乎完好的檢測出來。(4)直方圖法基于直方圖的方法,比其他三個(gè)方法要更加直觀、更加有效,它只需要一個(gè)像素,用該像素定位好坐標(biāo)軸,直接通過坐標(biāo)軸將圖片的數(shù)字信息體現(xiàn)出來,并在直方圖的波峰和波谷是用于定位圖像中的簇,顏色和強(qiáng)度可以作為坐標(biāo)軸的衡量單位。基于直方圖的方法也能適用于多個(gè)像素,使像素間的單向互通效率不斷提高。直方圖可以在多個(gè)像素同時(shí)考慮的時(shí)候采取不同的方式,比如把設(shè)計(jì)好的一個(gè)框架可以應(yīng)用到多個(gè)情形,并和其它方式的結(jié)果合并,將得到的信息去確定的所求的像素點(diǎn)的區(qū)域的位置以及最基本的數(shù)字信息。
第4章支持向量機(jī)SVM機(jī)器學(xué)習(xí)是一門涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科交雜的學(xué)科,該學(xué)科專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為用來獲取新的知識、技能,重新構(gòu)建已有的知識結(jié)構(gòu)并使之不斷改善自身的性能,是一門有著強(qiáng)大學(xué)習(xí)能力的學(xué)科。它是人工智能發(fā)展的核心,是使計(jì)算機(jī)具有自主處理東西的根本途徑。而支持向量機(jī)是十大機(jī)器學(xué)習(xí)方法其中的一種。支持向量機(jī)英文名為SupportVectorMachine,簡稱為SVM,是一類按監(jiān)督學(xué)習(xí)方式對數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器,其決策邊界是對學(xué)習(xí)樣本求解的最大邊距超平面。SVM使用函數(shù)計(jì)算經(jīng)驗(yàn)風(fēng)險(xiǎn)并在求解系統(tǒng)中加入了可以優(yōu)化結(jié)構(gòu)風(fēng)險(xiǎn)的項(xiàng)目,本身是一個(gè)分類器,但是特性要更加穩(wěn)健。首先在1964年提出了SVM這一算法,后來于1990年后有了快速發(fā)展的機(jī)會(huì)并被人們研究并創(chuàng)造出一系列改進(jìn)的更加方便的算法,在對人像和文本進(jìn)行識別或者分類等模式問題中有得到應(yīng)用,在有關(guān)識別的領(lǐng)域大放異彩。4.1線性分類4.1.1線性可分性在二維空間上,兩類點(diǎn)被一條直線完全分開叫做線性可分,如下圖藍(lán)點(diǎn)與紅點(diǎn)被分隔開來:在分類問題中需要有著輸入的數(shù)據(jù)和輸出的學(xué)習(xí)目標(biāo):X={X1,...,XN},y={y1,...,yN},其中輸入數(shù)據(jù)的每個(gè)包含多個(gè)特征的樣本負(fù)責(zé)構(gòu)成特征空間:Xi=[x1,...,xn]∈x,而學(xué)習(xí)目標(biāo)為二元變量y∈{-1,1}表示負(fù)類和正類。若輸入數(shù)據(jù)所在的特征空間存在作為決策邊界的超平面將學(xué)習(xí)目標(biāo)按正類和負(fù)類分開,并使任意樣本的點(diǎn)到平面距離大于等于1:decisionboundary:wTX+b=0pointtoplanedistance:yi(wTXi+b)≥1那就可以稱該分類問題具有線性可分性,而且參數(shù)w是超平面的法向量,參數(shù)b為超平面的截距。滿足該條件的決策邊界其實(shí)構(gòu)造了兩個(gè)平行的超平面以判別樣本的分類,而且這兩個(gè)超平面需要作為間隔邊界:wTX+b≥+1,→Ji=+1wTX+b≤-1,→Ji=—1所有在上間隔邊界的上方的樣本屬于正類,在下間隔邊界的下方的樣本屬于負(fù)類。兩個(gè)間隔邊界的距離d被定義為邊距,位于間隔邊界上的正類和負(fù)類樣本為支持向量。4.1.2損失函數(shù)在一個(gè)分類問題不具有線性可分性時(shí),使用超平面作為決策邊界會(huì)導(dǎo)致部分支持向量不再位于間隔邊界上,而是進(jìn)入了間隔邊界內(nèi)部,或落入決策邊界的錯(cuò)誤一側(cè),并且造成損失。這就需要使用損失函數(shù)量化分類損失到底損失了多少,并且可以得到的形式是0-1損失函數(shù):當(dāng)p<0時(shí),L(p)=0;當(dāng)p≥0時(shí),L(p)=1。0-1損失函數(shù)不是連續(xù)函數(shù),不利于優(yōu)化問題的求解,因此更會(huì)去選擇是連續(xù)函數(shù)且利于優(yōu)化問題的構(gòu)造代理損失。SVM使用的是餃鏈損失函數(shù):L(p)=max(0,1-p);由結(jié)果可知,當(dāng)結(jié)果是連續(xù)凸函數(shù)時(shí),并在任意取值下都是該損失函數(shù)的上界,然后求出來的代理損失最小化的解也是0-1損失最小化的值。4.2標(biāo)準(zhǔn)算法4.2.1線性SVM硬邊距給定輸入數(shù)據(jù)X={X1,,XN},y={y1yN},硬邊界SVM是求解最大邊距超平面的算法,約束條件是樣本點(diǎn)到?jīng)Q策邊界的距離大于且等于一。硬邊距SVM可以轉(zhuǎn)化為一個(gè)等價(jià)的二次凸優(yōu)化問題進(jìn)行求解。軟邊距在線性可分問題軟邊距SVM是求解最小邊距超平面的算法,但在線性不可分問題中使用硬邊距SVM將產(chǎn)生分類誤差,因此可在最大化邊距的基礎(chǔ)上引入軟邊距損失函數(shù)來優(yōu)化問題。SVM使用餃鏈損失函數(shù),所以軟邊距SVM的優(yōu)化問題有如下表示:可知,軟邊距SVM是一個(gè)L2正則化分類器,式中Li表示較鏈損失函數(shù)。該公式表明決策邊界的確定與支持向量關(guān),且使用餃鏈損失函數(shù)使得SVM具有稀疏性。4.2.2非線性SVM非線性函數(shù)把輸入數(shù)據(jù)輸出至高維空間后應(yīng)用于線性SVM可以得到非線性SVM。而非線性SVM有以下對偶問題:4.2.3數(shù)值求解SVM的求解可以使用二次凸優(yōu)化問題的數(shù)值方法,其求解算法都擁有充足學(xué)習(xí)樣本,也可使用隨機(jī)梯度下降。在SVM里主要有以下3種數(shù)值求解方法:內(nèi)點(diǎn)法;序列最小優(yōu)化;隨機(jī)梯度下降。
第5章程序調(diào)試及分析首先本程序建庫的時(shí)候先前期預(yù)處理,將圖像讀取并輸入到MATLAB里并進(jìn)行灰度處理,簡單去噪之后再轉(zhuǎn)換成二值圖像。讀取的圖片已經(jīng)全部變成全黑和全白組成的二值圖像,能夠更加方便MATLAB系統(tǒng)程序的運(yùn)行,也更加方便后面檢測程序的識別。傳統(tǒng)的機(jī)器學(xué)習(xí)在進(jìn)行圖片分類時(shí)輸入的不是原始圖片而是先進(jìn)行一個(gè)特征提取的步驟,所以我在這里用的是方向梯度直方圖HOG以及灰度共生矩陣GLCM。MATLAB中灰度共生矩陣的提取我調(diào)用了graycomatrix()函數(shù),不過這里為了取不同方向(0、45、90、135度)的灰度共生矩陣,通過循環(huán)計(jì)算各個(gè)方向的灰度共生計(jì)算然后取平均值和方差作為最終提取的特一化處理,就是和計(jì)算對比度、逆差距、嫡、自相關(guān),然后取平均值和方差作為最終提取的特征。另外新建getGLCMFeatures文件里的函數(shù),該函數(shù)輸入為彩色圖像轉(zhuǎn)換后的灰度圖像矩陣,把輸出設(shè)置為提取后的灰度共生矩陣特征。另外我還創(chuàng)建了一個(gè)extractFeature函數(shù),這個(gè)函數(shù)輸入為整理過的訓(xùn)練集和測試集,輸出為訓(xùn)練集的特征、標(biāo)簽和測試集的特征、標(biāo)簽。這個(gè)函數(shù)的功能是將HOG特征和前面提取的GLCM特征合并。代碼第2到13行是為了
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高職第一學(xué)年(園林工程技術(shù))植物造景設(shè)計(jì)試題及答案
- 2026年計(jì)算機(jī)應(yīng)用(辦公自動(dòng)化)試題及答案
- 2025年中職(烹飪工藝與營養(yǎng))中式熱菜制作試題及答案
- 道路圍墻大門施工組織設(shè)計(jì)
- 貴州省貴陽市南明區(qū)2025年八年級上學(xué)期期末測試物理試題附答案
- 2026年部分大??蓤?bào)不限專業(yè)武漢大學(xué)人民醫(yī)院招聘7人備考題庫參考答案詳解
- 軟件框架開發(fā)技術(shù)(SSM)期末考試試卷(6)及答案
- 2025 小學(xué)四年級思想品德下冊傳統(tǒng)節(jié)日習(xí)俗優(yōu)化調(diào)查課件
- 養(yǎng)老院老人生活照顧人員行為規(guī)范制度
- 養(yǎng)老院老人健康飲食營養(yǎng)師職業(yè)發(fā)展規(guī)劃制度
- 2026屆四川省瀘州高級中學(xué)高一生物第一學(xué)期期末經(jīng)典試題含解析
- 2026標(biāo)準(zhǔn)版離婚協(xié)議書-無子女無共同財(cái)產(chǎn)債務(wù)版
- 【期末必刷選擇題100題】(新教材)統(tǒng)編版八年級道德與法治上學(xué)期專項(xiàng)練習(xí)選擇題100題(含答案與解析)
- 建筑公司工資薪酬管理制度(3篇)
- 2025至2030中國疝氣修補(bǔ)術(shù)行業(yè)調(diào)研及市場前景預(yù)測評估報(bào)告
- 建設(shè)工程測繪驗(yàn)線標(biāo)準(zhǔn)報(bào)告模板
- 2024-2025學(xué)年福建省廈門市雙十中七年級(上)期末英語試卷
- 漢語言本科畢業(yè)論文范文模板
- 2025年協(xié)警輔警招聘考試題庫(新)及答案
- 鋼結(jié)構(gòu)施工優(yōu)化策略研究
- 車間輪崗工作總結(jié)
評論
0/150
提交評論