版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
緒論Introduction課題研究的背景和目的(Thebackgroundandpurposeoftheresearch)銅鏡是古代人們梳洗打扮的日常生活用品,歷史悠久,也是中國古代青銅文化遺產(chǎn)中的瑰寶。漢代是我國銅鏡發(fā)展的重要時期,漢代出土的銅鏡數(shù)量最多,使用最普遍。以漢代銅鏡花紋為研究對象,根據(jù)漢代銅鏡的幾種典型紋飾分類,對于多數(shù)未分類的銅鏡花紋可以進行識別并顯示所屬類別名稱。對于博物館藏分類展示、文物勘探和大眾百姓對漢代銅鏡花紋的認(rèn)識了解有一定的作用,在讀入待分類或是不了解的銅鏡圖像時,若能通過銅鏡花紋的圖像直接快速準(zhǔn)確識別出該紋飾的所屬類別,其在各種展示環(huán)境中的便利性等方面的應(yīng)用,將會給未來文物展示與科普帶來更大的便利,也讓普通大眾對古代銅鏡文化有更直觀的認(rèn)識。國內(nèi)外研究現(xiàn)狀(Researchstatusathomeandabroad)國外對圖像檢測識別和研究開始較早,其早期物質(zhì)基礎(chǔ)也較為雄厚,經(jīng)過這么多年的發(fā)展,很多理論和關(guān)鍵性技術(shù)已然更為成熟,但已經(jīng)取得的成果沒有未來要解決的問題多。PerficientDigital的研究團隊發(fā)布的報告顯示,谷歌在圖像識別方面取得了81.7%的準(zhǔn)確率;IBM在圖像識別方面取得了55.6%的準(zhǔn)確率。Google圖片識別AI通過學(xué)習(xí)大量的圖片、調(diào)整算法來提高識別的精度,Google圖片識別AI具備30層神經(jīng)網(wǎng)絡(luò),每一層對應(yīng)著不同的抽象程度,具有尤其高的準(zhǔn)確率,是國外圖像識別技術(shù)成果最具代表的公司。我國對圖像識別相較國外來說開始較晚,但近些年來,隨著國家經(jīng)濟不斷發(fā)展,對人工智能計算機產(chǎn)業(yè)投資不斷加大,越來越多的人才涌入人工智能的大潮,越來越多的人開始關(guān)注計算機產(chǎn)業(yè)發(fā)展,因此圖像識別技術(shù)得以不斷發(fā)展不斷強大。例如以語音起家的科大訊飛早在計算機視覺上發(fā)力,接連獲得自動駕駛領(lǐng)域權(quán)威評測集Cityscapes第一名和醫(yī)學(xué)影像權(quán)威評測LUNA冠軍兩項突破,在視覺上展示出強大實力。就目前來看,我國在圖像識別技術(shù)上本身就具有一定的優(yōu)勢,表現(xiàn)在精度高、靈活性高等各個方面,圖像識別技術(shù)用于文物識別豐富了國家文物數(shù)據(jù)庫整理技術(shù),以圖像處理和模式識別的青銅器圖案紋理檢測技術(shù)的檢測和研究正在逐步興起,而很多機構(gòu)和廠商已經(jīng)研制出了一些自主產(chǎn)品投入市場。但在實際發(fā)展過程中,在個別技術(shù)方面還是存在一些問題,例如在圖像識別技術(shù)過程中,處理的大部分信息往往都是二維的信息,處理量較大,對計算機存儲容量、運行速度等方面是非常大的挑戰(zhàn),這也就意味著要完善加強圖像識別技術(shù),勢必要投入大量成本,技術(shù)難度也隨之上升。雖然我們的產(chǎn)品有一定缺陷,但一些關(guān)鍵性技術(shù)、核心技術(shù)已經(jīng)位于世界前列,甚至領(lǐng)先全球,我們相信在不久將來,我們的科研人員一定能夠取得更大的成功。研究的重點和難點(Theemphasesanddifficultiesoftheresearch)對于不同紋飾的銅鏡,如何挑選最具代表的,范圍廣的典型紋飾進行劃分得到目標(biāo)對應(yīng)的區(qū)域,根據(jù)目標(biāo)和背景的先驗知識,對銅鏡中的典型圖案在背景中進行標(biāo)識、定位,將其從背景中分離出來;對于分離出來的銅鏡紋飾特征將如何提取,根據(jù)紋飾的局部細(xì)節(jié)進行處理所得到的結(jié)構(gòu)特征定位到所屬分類;對于質(zhì)量較差的圖片和不規(guī)則圖片如何有效的提取可靠的結(jié)構(gòu)特征;在數(shù)據(jù)集處理階段,進行數(shù)據(jù)增強的工作,旨在將樣本量擴大并提高模型的泛化能力以更好地模擬現(xiàn)實多變環(huán)境下可能產(chǎn)生的輸入,建立訓(xùn)練集和測試集;在網(wǎng)絡(luò)搭建階段,選擇合適的預(yù)訓(xùn)練模型;研究內(nèi)容及結(jié)構(gòu)安排(Researchcontentandstructurearrangement)對于以漢代銅鏡為代表的古代銅鏡花紋的圖像識別并進行分類,對于給定未知的典型花紋進行歸類,顯示。圖像處理Theimageprocessing圖像處理的主要內(nèi)容(Themaincontentofimageprocessing)數(shù)字圖像處理主要包括圖像變換、圖像增強與復(fù)原、圖像分割、圖像識別等。圖像變換主要是由于圖像陣列過大,為了減少計算量而采取一些間接處理技術(shù)從而獲得更有效的圖像數(shù)據(jù)信息,完成更高效的處理操作。圖像增強與復(fù)原主要是為了提高圖像的質(zhì)量,比如去噪處理,提高清晰度等方法。圖像分割則是最為關(guān)鍵的技術(shù)之一在數(shù)字圖像處理技術(shù)中,圖像分割是將目標(biāo)圖像的感興趣的那個區(qū)域部分通過一定的算法提取出來,主要是根據(jù)該區(qū)域的邊緣信息進行分割。圖像識別是屬于模式識別的范疇,主要指的是在目標(biāo)圖像經(jīng)歷過圖像增強與復(fù)原、壓縮等操作后,進行圖像分割和特征提取,從而進行分類的一種典型的模式識別方法。圖像預(yù)處理(Imagepreprocessing)圖像的預(yù)處理是所有與圖像相關(guān)研究的第一步,同時也是最重要的一步,它是在圖像進行深度處理之前的一些準(zhǔn)備操作、基礎(chǔ)性操作,目的是減少圖像由于種種問題對后續(xù)操作帶來的誤差,從而提高處理結(jié)果的準(zhǔn)確度。在研究過程中,獲取圖像時通常會由于光線、角度和待處理對象本身的磨損等問題,而對之后的分割操作和識別操作產(chǎn)生重大影響。通過預(yù)處理操作降低總體信息量,最大程度降低各種外界因素對圖像的影響,這是對處理采集到的銅鏡圖像必不可少的步驟。比如對圖像進行分割時,將三通道的彩色圖像進行灰度化處理就可以減少圖像本身的信息量,去除掉了大量和處理目標(biāo)無關(guān)的信息。預(yù)處理操作有很多,比如對圖像類型進行轉(zhuǎn)換(彩色圖像轉(zhuǎn)換為灰度圖像等),對圖像對應(yīng)的數(shù)據(jù)類型進行轉(zhuǎn)換(uint8轉(zhuǎn)換為double等),對圖像進行操作(切割,縮放等),調(diào)整圖像對比度,去除噪聲,對圖像進行腐蝕、膨脹操作等。本章主要介紹銅鏡圖像分割前的預(yù)處理步驟,即對想要感興趣的銅鏡的位置的獲取,其中包括噪聲去除、灰度化、對需要的位置進行定位。灰度化本文研究用的圖像多為雜志和網(wǎng)頁展示圖像,都是彩色圖像,三通道的彩色圖像除了有大量的顏色信息外還有亮度信息,在處理時需要占用很大的空間,并且增加運算量,在處理這么龐大的信息量時處理圖像的速度會明顯降低,而達(dá)不到系統(tǒng)實時性的要求,因此必須要在對圖像進行各種處理之前將彩色圖像轉(zhuǎn)換為灰度圖像,不僅不會影響處理結(jié)果還可以去除很多無用信息,從而加快后續(xù)的處理速度。假設(shè)灰度后的圖像為GrayIm,在點(i,j)處的灰度值為GrayIm(i,j),則有一下幾個算法將指定圖像每個像素點的RGB三個分量計算出該像素點的灰度值,使該圖像只含亮度而不含彩色信息。最大值法將彩色圖像中顏色信息R,G,B中的亮度最大值作為對應(yīng)灰度圖像的灰度值,即:GrayIm(i,j)=max(R,G,B)平均值法將彩色圖像中顏色信息R,G,B中的亮度值求平均得到的平均值作為對應(yīng)灰度圖像的灰度值,即:GrayIm(i,j)=(R+G+B)/3加權(quán)平均值法根據(jù)一定的指標(biāo)將彩色圖像的顏色信息R,G,B進行加權(quán)平均,根據(jù)人眼對各種顏色的敏感度賦予R,G,B不同的權(quán)值,利用三者的加權(quán)平均值來選擇作為灰度值。rgb2gray通過計算R,G,B分量的加權(quán)和,將RGB值轉(zhuǎn)換為灰度值,即:0.2989*R+0.5870*G+0.1140*B本設(shè)計采用rgb2gray是將真彩色圖像RGB轉(zhuǎn)換為灰度圖像Gray。rgb2gray函數(shù)通過消除色調(diào)和飽和度信息,同時保留亮度,來將RGB圖像轉(zhuǎn)換為灰度圖。噪聲去除在圖像采集時,由于光線、角度等環(huán)境影響,采集到的圖像多伴有各種不必要的噪聲,如果不去除這些噪聲就會加重后續(xù)處理的工作量,產(chǎn)生的誤差將會嚴(yán)重影響處理結(jié)果的精確度,因此噪聲去除特別重要。常用的噪聲去除方法有均值濾波,中值濾波,高斯濾波等。均值濾波均值濾波指的是取待處理圖像上的每個像素點相鄰區(qū)域上所有像素的平均灰度值作為此處的灰度值,可以實現(xiàn)平滑處理。但是均值濾波會造成圖像中邊緣的模糊,取平均值的鄰域越大,造成的模糊程度越嚴(yán)重。將收集到的像素點的灰度值換為其鄰域的平均值的這個方法主要是減少了圖像色彩的濃度,進一步消除了細(xì)小的噪音,但造成的問題是同時也把邊緣信息和噪音一起減少了,在消除噪音的同時也消除了部分圖像的邊緣信息。中值濾波中值濾波指的是取待處理圖像上的每個像素點相鄰區(qū)域上所有像素的平均灰度值,對各個灰度值的大小進行排序(升序或者降序),然后取中間位置的值作為中值,將這個中值作為該像素的灰度值的代替值。若相鄰區(qū)域像素個數(shù)為奇數(shù),則區(qū)中間值作為中值;若相鄰區(qū)域像素個數(shù)為偶數(shù),則取中間兩個值求平均作為中值。將收集到的像素點灰度值換為其鄰域的灰度值的中值這個方法可以在去除噪音的同時最大程度保存下來完整的邊緣信息。在本設(shè)計中采用中值濾波的方式去除噪聲的效果很明顯,噪聲去除顯著并且絕大多數(shù)邊緣信息被完整地保存下來。高斯濾波高斯濾波指的是根據(jù)高斯函數(shù)的特點來選擇權(quán)值的線性平滑濾波,高斯濾波可以有效地消除服從正態(tài)分布的噪音。當(dāng)利用高斯卷積核對圖像進行卷積時,加權(quán)系數(shù)與中心像素點及其相鄰區(qū)域像素點的灰度值進行相乘和求和的運算,即可得到相鄰區(qū)域中的中心像素點的一個新的值。如果相鄰區(qū)域中所有的像素點的值都相同,則其新值就等同于原值。如果相鄰區(qū)域中各個像素點間灰度值變化較大,在與高斯卷積核進行卷積運算后就會與相鄰區(qū)域中的其他像素取平均值,這樣就達(dá)到了消除噪音的目的。從理論上來說,高斯濾波的平滑效果會更好相較于均值濾波來說,其保留的邊緣信息更完整。分別用均值濾波、中值濾波以及高斯濾波來對銅鏡進行處理如下:圖2-1去噪后的灰度圖像Figure2-1Grayimageafterdenoising由圖1可觀察到經(jīng)過的均值濾波進行去噪操作后,邊緣信息保存的并不完整,邊緣模糊比較嚴(yán)重;高斯濾波進行去噪操作后也有一定的邊緣信息模糊。中值濾波操作后相對于均值濾波和高斯濾波保存了較為完整清晰的邊緣信息。為了更加精確的提取目標(biāo)圖像,對以上三種濾波操作后的圖像進行使用Roberts算子的邊緣提取方法,經(jīng)過調(diào)整將敏感度閾值設(shè)置在0.01:圖2中先后展示了未經(jīng)過去噪處理的,即原圖灰度化后的的邊緣圖像,以及使用均值濾波、中值濾波、高斯濾波后的邊緣圖像。對比各個濾波操作后的邊緣圖像,可以更加清晰地發(fā)現(xiàn)和原圖的邊緣信息圖像進行對照,均值濾波中的邊緣信息保存得不完整,并且還有很多噪音無法去除。而高斯濾波和中值濾波的去噪效果很明顯,可以清晰看到各個特殊部分以及圖像本身的邊緣信息,而中值濾波后的邊緣圖像更是保存了更多的邊緣信息。因為所選取的目標(biāo)圖像是古代銅鏡花紋,存在花紋表面有大量磨損,且花紋樣式復(fù)雜,銅鏡表面也存在大量細(xì)小花紋信息,故邊緣信息較為復(fù)雜。邊緣信息是圖像分割預(yù)處理中的重要信息,更完整的邊緣信息意味著分割的精度更高,因此本設(shè)計選取中值濾波作為古代銅鏡花紋圖像的去噪方法。圖2-2邊緣提取圖像Figure2-2Edgeextractionimage邊緣提取圖像邊緣是圖像最基本特征,邊緣就是指圖像局部特性的不連續(xù)性?;叶然蚪Y(jié)構(gòu)等信息的突變處稱之為邊緣。正是由于邊緣的這種特征可以通過邊緣信息來分割圖像。圖像的邊緣有方向和幅度兩種屬性。邊緣通常可以通過一階導(dǎo)數(shù)或二階導(dǎo)數(shù)計算得到,求得一階導(dǎo)數(shù)的最大值即為邊緣的位置,而求得二階導(dǎo)數(shù)的零點作為邊緣的位置。由于銅鏡多呈現(xiàn)在展覽位置,存在大量光照導(dǎo)致背景板顏色過重從而與銅鏡顏色相近,致使顏色信息不足,難以提取準(zhǔn)確的銅鏡花紋信息。而各種銅鏡的邊緣的灰度值都存在極為明顯的變化,因此可以通過邊緣的檢測來提取整個銅鏡的位置。邊緣檢測方法最常用的微分算子是一階微分算子。所謂一階微分算子就是一種基于梯度的計算方法,通過模板作為核與圖像的每個像素點做卷積和運算,然后選取合適的閾值來提取圖像的邊緣。常用的一階微分算子的邊緣檢測方法有Roberts算子、Prewitt算子和Sobel算子。常用的二階微分算子的邊緣檢測方法有Laplacian算子,其他的微分算子還有Canny算子,它是基于其在滿足一定約束條件下推導(dǎo)出來的邊緣檢測最優(yōu)算子。Roberts算子Roberts算子又稱為交叉微分算法,是利用局部差分算子尋找邊緣的算子,指在像素點的對角線的方向上求得周圍相鄰的像素點灰度值的差值來作為梯度幅值的近似替代值。Roberts算子的特點是提取的邊緣線條較粗。其模板分為水平和垂直方向,如以下公式所示,其中表示水平方向,表示垂直方向。觀察其模板可以看出,Roberts算子能夠較好的增強主副對角線上的邊緣信息。Prewitt算子Prewitt算子的邊緣檢測原理是,利用像素點上下、左右鄰點的灰度值的差值,在邊緣處達(dá)到極值從而進行邊緣檢測。Prewitt算子有兩個有向算子,這兩個方向模板一個沿著水平方向進行邊緣檢測,一個沿著垂直方向進行邊緣檢測。由于Prewitt算子采用3×3模板對上下左右區(qū)域內(nèi)的像素值進行計算,而Robert算子的模板為2×2,所以Prewitt算子在水平方向和垂直方向的邊緣檢測結(jié)果都比Robert算子所檢測到的邊緣結(jié)果更加明顯。Prewitt算子適合用來識別噪聲較多、灰度漸變的圖像,其計算公式如下所示,其中表示水平方向,表示垂直方向:Sobel算子Sobel算子是一種用于邊緣檢測的離散型微分算子,它將高斯平滑和微分求導(dǎo)有效的結(jié)合起來。Sobel算子用于計算圖像的明暗程度的近似值,將目標(biāo)圖像邊緣處的明暗程度信息設(shè)定一個邊界值,超過這個值就意為邊緣。所以這就牽扯到了一個權(quán)值的概念,即在Prewitt算子的基礎(chǔ)上將加上權(quán)值,認(rèn)為相鄰點的距離長度對當(dāng)前目標(biāo)像素點的影響是有所不同的,對于距離近的像素點來說,其對當(dāng)前目標(biāo)像素點的影響肯定是最大的,從而實現(xiàn)了圖像的銳化,便于突出邊緣輪廓的信息。Sobel算子邊緣檢測原理是,取像素點上下左右鄰域四個鄰域內(nèi)各個像素點的灰度值的加權(quán)差,在邊緣處達(dá)到極值從而進行邊緣檢測。Sobel算子有兩個,一個是檢測水平邊緣的,一個是檢測垂直邊緣的,與Prewitt算子相比,Sobel算子對像素的位置的影響做了加權(quán),可以降低邊緣模糊程度。因為Sobel算子結(jié)合了高斯平滑和微分求導(dǎo),所以得到的邊緣檢測處理結(jié)果會具有更好的抗噪性,它對邊緣的定位也更準(zhǔn)確,多用于噪聲多、灰度漸變的邊緣圖像處理。其模板如下所示,其中表示水平方向,表示垂直方向:Laplacian算子Laplacian算子是一種常用的二階微分算子,常用于圖像增強鄰域和邊緣提取。其邊緣信息提取方法是通過灰度差分計算相鄰區(qū)域內(nèi)的像素。Laplacian算法的基本步驟有分為以下幾點:判斷圖像的中心像素點的灰度值及其相鄰區(qū)域中各個像素點的灰度值,如果目標(biāo)像素點的灰度值更高就將目標(biāo)像素點的灰度進行提升;若目標(biāo)像素點的灰度值較低,則降低其灰度,從而實現(xiàn)圖像的銳化處理;在實現(xiàn)的過程中,Laplacian算子通過對八領(lǐng)域內(nèi)的像素求梯度值,將所求得的梯度值相加得到的和用來判斷目標(biāo)像素灰度與相鄰區(qū)域內(nèi)其他像素點灰度的關(guān)系;最后通過梯度運算實現(xiàn)對目標(biāo)像素灰度的調(diào)整。Laplacian算子的八領(lǐng)域模板如下所示,通過模板說展示的可以看到,當(dāng)相鄰區(qū)域內(nèi)的像素點灰度相同時,模板的卷積結(jié)果為0;當(dāng)中心的像素點的灰度值比其相鄰區(qū)域內(nèi)的像素點的灰度值高時,模板的卷積結(jié)果為正數(shù);當(dāng)中心的像素點的灰度值比其相鄰區(qū)域內(nèi)的像素點的灰度值低時,模板的卷積結(jié)果為負(fù)數(shù)。Canny算子Canny算子是一種多級邊緣檢測算法,它是由圖像的梯度運算和高斯函數(shù)平滑結(jié)合計算得到的算子,計算時取高斯函數(shù)的一階導(dǎo)數(shù)。根據(jù)Canny算子具有的沿梯度方向存在反對稱性和在邊緣方向具有對稱性的特點,使得Canny算子在邊緣的精確檢測定位達(dá)到理想效果,抗噪聲方面也較為理想。Canny算法的基本步驟有分為以下幾點:降噪,選擇高斯模板進行平滑處理;梯度計算,求偏導(dǎo)數(shù)得到梯度的方向和幅值;非極大值抑制,由偏導(dǎo)數(shù)計算所得到的在梯度方向上的像素點梯度值與其前后兩個像素點的梯度值進行對比,將局部梯度極大值和在此點處梯度最大的像素點保留下來,其他像素點的梯度值置為O;雙閾值檢測并連接邊緣,獲取邊緣圖像。分別采用用Roberts算子、Sobel算子、Prewitt算子、Laplacian算子和Canny算子對古代銅鏡花紋圖像進行邊緣提取,提取效果如圖3所示:圖2-3邊緣提取圖像Figure2-3Edgeextractionimage由圖3可以看到當(dāng)選取同一閾值時,Roberts算子在該設(shè)計中展現(xiàn)的效果最好,所以該階段性采取的是Roberts算子,Roberts算子是一種斜向偏差分的梯度計算方法,梯度的大小即為邊緣的強度,梯度的方向與邊緣的走向垂直。Roberts算子對具有陡峭的低噪聲的圖像處理效果較好。邊緣檢測在MATLAB中提供了edge()函數(shù)來完成邊緣檢測,本設(shè)計中采用的格式為:edge(I,'roberts',thresh,direction)根據(jù)所自定義的敏感度閾值thresh,用Roberts算子進行邊緣檢測,它忽略了所有小于閾值的邊緣。當(dāng)thresh為空值時,自動選擇閾值。腐蝕、膨脹、開運算和閉運算腐蝕、膨脹、開運算和閉運算都屬于數(shù)學(xué)形態(tài)學(xué)的范疇。數(shù)學(xué)形態(tài)學(xué)是以格論和拓?fù)鋵W(xué)為基礎(chǔ)建立的一門圖像分析學(xué)科,是數(shù)學(xué)形態(tài)學(xué)圖像處理的基本理論,它是具有完整理論、方法以及算法體系的學(xué)科。其基本運算包括腐蝕和膨脹、開運算和閉運算、形態(tài)學(xué)梯度等。數(shù)學(xué)形態(tài)學(xué)旨在通過具有一定形態(tài)的結(jié)構(gòu)元素去度量和提取圖像中對應(yīng)的形狀以此可以進行圖像是識別與分析,形態(tài)學(xué)就是一種非線性圖像的處理及分析方式。腐蝕和膨脹腐蝕和膨脹是形態(tài)學(xué)的兩個基本操作。通常在二進制圖像是進行,通過將像素添加到所處理圖像中銅鏡對象的感知邊界,放大或縮小明亮白色區(qū)域。以白色前景,黑色背景的圖像為例。腐蝕和膨脹實際上是類似于輪廓檢測的技術(shù),即刪除或增加銅鏡目標(biāo)邊緣的一些像素,使得銅鏡目標(biāo)總體被縮小或者放大。腐蝕操作主要是去除比自定義的結(jié)構(gòu)元素小的像素點,是一種消除邊界點,使邊界內(nèi)部收縮的過程,通過刪除這些小的像素點可以達(dá)到將細(xì)小連接的區(qū)域分離開;而膨脹操作主要是將與圖像中的目標(biāo)有接觸的所有背景點合并到目標(biāo)中,使邊界向外部擴張的過程,即有細(xì)小間隔的區(qū)域連接起來,使其連成一個整體,從而達(dá)到填充的目的。開運算和閉運算腐蝕和操作二者合并,不同的次序會產(chǎn)生不同的結(jié)果。先腐蝕后膨脹的過程稱為開運算,用來消除細(xì)小物體,在纖細(xì)處分離物體,平滑物體邊緣;先膨脹后腐蝕的過程稱為閉運算,用來填充物體內(nèi)的細(xì)小空缺,連接鄰近物體,也能平滑物體邊緣。在MATLAB圖像處理中有imopen()函數(shù),其格式為J=imopen(I,SE)對灰度圖像或二值圖像I進行形態(tài)開放的開運算,即先腐蝕后膨脹,返回打開的圖像,SE是由strel或offsetstrel函數(shù)返回的單個結(jié)構(gòu)化元素對象。se=[1;1;1];imO=imopen(edgeim,se);在MATLAB圖像處理中有imclose()函數(shù),其格式為J=imclose(Im,SE)對灰度圖像或二值圖像Im進行形態(tài)閉合的閉運算,即先膨脹后腐蝕,SE是由strel或offsetstrel函數(shù)返回的單個結(jié)構(gòu)化元素對象。在圖像處理中還有自定義的結(jié)構(gòu)元素稱為strel對象。在MATLAB中,strel函數(shù)用于新建strel對象,創(chuàng)建自定義形狀對應(yīng)的結(jié)構(gòu)元素。se=strel('rectangle',[25,25]);%矩形結(jié)構(gòu)元素tianchongim=imclose(imO,se);%圖像聚類、填充圖像連通區(qū)域在MATLAB圖像處理中有刪除小面積對象的bwareaopen()函數(shù),本設(shè)計中采用的格式是:bwareaopen(BW,P,conn),用于移除經(jīng)過處理的目標(biāo)圖像中所有小于P的連通圖像,即刪除面積小于P的對象,conn對應(yīng)鄰域情況,默認(rèn)情況下使用八鄰域。origlvboim=bwareaopen(tianchongim,2000);本章小結(jié)(Thesummaryofthischapter) 本章主要首先介紹了圖像處理的主要操作,介紹了預(yù)處理的大致情況和所涉及的操作步驟。之后詳細(xì)介紹了古代銅鏡花紋識別過程中圖像分割前的預(yù)處理操作。首先將圖像進行灰度化,將三通道圖像轉(zhuǎn)變?yōu)閱瓮ǖ缊D像,減少圖像自身攜帶的信息量,可以加快后續(xù)操作的處理時間。使用中值濾波去除噪聲的方式對灰度圖像進行處理,中值濾波的好處在于能夠較好的保存下來圖像的邊緣信息,可以使后續(xù)的邊緣提取操作更加精確。邊緣檢測算法通過和多個邊緣檢測算子提取邊緣效果對比之后,選擇Roberts算子對已進行過中值濾波的灰度圖像進行邊緣檢測。通過腐蝕與膨脹、開閉運算實現(xiàn)對圖像的填充和精細(xì)化,根據(jù)開閉運算之后的圖像可以得到一個清晰的像素點分部的圖像。這對之后觀察像素點的分布很有幫助,可以通過對像素點數(shù)量的一個處理從而達(dá)到可以裁剪得到目標(biāo)銅鏡所在精確區(qū)域。目標(biāo)圖案的提取Extractionofthetargetpattern中心圖像的分割算法(Centerimagesegmentationalgorithm)該階段采用從行列角度搜索圖像的大致位置,將通過開閉運算的二值圖像通過掃描行方向上和列方向上的最大的白色像素值得到應(yīng)該切割的銅鏡粗位置。本設(shè)計在行方向上設(shè)定一個x行1列的全零數(shù)組X1,通過循環(huán)該二值圖像的所有像素點,將每行的白色像素點個數(shù)存放在X1中,即此時X1中的(i,1)均為每行白色像素點的總和。fori=1:xforj=1:yif(CDW(i,j)==1)%白色像素點X1(i,1)=X1(i,1)+1;endendEnd則此時X1中該列的最大值及其所對應(yīng)的行號就是白色像素點最多的一行,從該行出發(fā)向上和向下掃描,白色像素點的個數(shù)都一定小于該行像素點的個數(shù)。故只要滿足該行像素點存在(即像素點數(shù)量大于一定值)且行號存在于(1,x)則向上和向下掃描。此時得到的圖像為切割完上方和下方,每行都充滿目標(biāo)像素點。IX=f(PX1:PX2,:,:);同理,在列方向上設(shè)定一個1行y列的全零數(shù)組Y1,通過循環(huán)第一次切割完行的二值圖像范圍內(nèi)的所有像素點,將每列的白色像素點個數(shù)存放在Y1中,即此時Y1中的(1,j)均為每列白色像素點的總和。forj=1:yfori=PX1:PX2%在確定行的范圍內(nèi)再確定列if(CDW(i,j)==1)%白色像素點Y1(1,j)=Y1(1,j)+1;endendEnd則此時Y1中該行的最大值及其所對應(yīng)的列號就是白色像素點最多的一列,從該圖像的最左邊出發(fā)向右掃描和最右邊出發(fā)向左掃描,一定會遇到白色像素點最多的一列,即從兩邊出發(fā)向中間掃描得到的白色像素點的個數(shù)都一定小于最多那一列白色像素點的個數(shù)。故只要滿足該列像素點存在(即像素點數(shù)量小于一定值)且列號存在于(1,y)則兩邊向中間掃描。此時得到的圖像為切割完左方和右方,每列都充滿目標(biāo)像素點。DW=f(PX1:PX2,PY3:PY4,:);最終得到的粗定位的圖像即為切割完上下左右無用區(qū)域以后的圖像。特征圖像的截取算法(Featureimagecapturealgorithm)由于本設(shè)計涉及的銅鏡花紋樣式繁多,角度各異,且各個銅鏡圖像中銅鏡目標(biāo)的磨損程度不一,特征提取較為復(fù)雜,采用更加快捷的直接裁剪的方式。ginput()函數(shù)提供了一個很好的可視化的十字光標(biāo),可以通過鼠標(biāo)精確選擇我們需要的位置,設(shè)計中采用從圖像坐標(biāo)系中讀取兩個點,可以直接通過選取對角線來得到想要裁剪的圖像位置。[x,y]=ginput(2);再通過imcrop()裁剪函數(shù),imcrop()函數(shù)的格式是:J=imcrop(I,[x,y,width,height]),其中(x,y)表示裁剪后左上角像素點在原圖像中的位置,width表示裁剪后圖像的寬度,height表示裁剪后圖像的高度。設(shè)計中采用(x(1),y(1))表示左上角像素在原圖中的位置,(x(2),y(2))表示右下角像素在原圖中的位置,寬度通過取x(2)與x(1)差的絕對值結(jié)果來記錄,高度通過取y(1)和y(2)差的絕對值結(jié)果來記錄。IM=imcrop(DW2,[x(1),y(1),abs(x(1)-x(2)),abs(y(1)-y(2))]);最后對直接切割出來的特征圖像進行命名,并通過imwrite()函數(shù)保存。本章小結(jié)(Thesummaryofthischapter)本章介紹了各個目標(biāo)圖像的截取提取。首先介紹了中心目標(biāo)圖案的截取方法,通過對垂直方向和水平方向的投影得到各個方向上像素點最多的一行,根據(jù)像素點的分布情況從而進一步確定了目標(biāo)圖像的邊界長寬,進行裁剪即可得到中心目標(biāo)圖案的精確位置。之后介紹了特征圖像的截取方法,通過選擇對角線實現(xiàn)自由直接裁剪,相對簡單直接的解決了特征圖案復(fù)雜且由于圖像本身各種磨損或是環(huán)境明暗等因素所帶來的特征圖案不易識別的問題,這個方法過于直接,但也是目前學(xué)習(xí)階段后可以較好獲得特征圖像的辦法了。特征花紋識別算法Featurepatternrecognitionalgorithm基于卷積神經(jīng)網(wǎng)絡(luò)識別(Recognitionbasedonconvolutionalneuralnetwork)卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)是屬于前饋型神經(jīng)網(wǎng)絡(luò)的一種,它在許多大型圖像處理識別中起到關(guān)鍵性作用,被廣泛應(yīng)用于圖像分類、定位等領(lǐng)域。作為一個多層神經(jīng)網(wǎng)絡(luò)模型,卷積神經(jīng)網(wǎng)絡(luò)是由多個二維的平面所組成的,與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,卷積神經(jīng)網(wǎng)絡(luò)增加了具有平移不變性的池化層和方便特征提取的卷積層。卷積神經(jīng)網(wǎng)絡(luò)中有三個基本概念:局部感受野、共享權(quán)值和池化。添加局部感受野和權(quán)值共享的方法的實際是為了降低參數(shù)數(shù)目,因為傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),層與層之間通常都使用全連接的方法,而這對卷積神經(jīng)網(wǎng)絡(luò)來說會使得要處理的數(shù)據(jù)異常強大,故引入這兩個方法降低。局部感受野局部感受野是指在對圖像進行處理操作時,由于圖像間的聯(lián)系較為緊密,而距離稍遠(yuǎn)的像素點的關(guān)聯(lián)性實際上是較為弱化的,因此采取對局部信息的處理,同時也避免了完全不必要的對全局圖像的感知,并且在之后將感知到的信息能夠綜合起來從而得到全局信息。對于一個通常意義上的深度神經(jīng)網(wǎng)絡(luò)來說,即在一個標(biāo)準(zhǔn)的前饋神經(jīng)網(wǎng)絡(luò)中,往往會把圖像的一個或者更多的像素點進行連接并連接到每一個神經(jīng)元中,而對于卷積神經(jīng)網(wǎng)絡(luò)來說,則是將每一個隱藏的結(jié)點只連接到圖像的某些區(qū)域上,從而使得訓(xùn)練參數(shù)的減少。而這個某些區(qū)域就是局部感受野。在使用局部感受野后,參數(shù)降低得仍然不完全,這時就需要使用到共享權(quán)值的方法來降低參數(shù)數(shù)量。圖4-1CNN結(jié)構(gòu)圖Figure4-1CNNstructurediagram從結(jié)構(gòu)圖中可以看到,卷積神經(jīng)網(wǎng)絡(luò)的輸入圖像這一層是與卷積層相連的,將圖像輸入網(wǎng)絡(luò)進行訓(xùn)練和識別,卷積網(wǎng)絡(luò)中間部分是由卷積層和池化層連接組成。每一個神經(jīng)元的作用都是為了提取目標(biāo)圖像的局部特征,每一個神經(jīng)元都和上一層的局部感受野相連結(jié),按照卷積層、池化層、卷積層、池化層的順序交替進行操作,最后將目標(biāo)圖像數(shù)據(jù)送入全連接層得到輸出。從結(jié)構(gòu)圖可以清晰認(rèn)識到卷積神經(jīng)網(wǎng)絡(luò)是一個非全連接的網(wǎng)絡(luò),卷積層和池化層的交替操作可以保證在出現(xiàn)平移、縮放甚至其他特殊變形時仍然能保持高度的不變性。卷積層卷積神經(jīng)網(wǎng)絡(luò)的卷積層作為特征的提取器,作用是學(xué)習(xí)輸入圖像的特征表示,卷積層中的神經(jīng)元排列成特征圖的形式,特征圖里的每個神經(jīng)元都有局部感受野。在計算新的特征圖的過程中,將輸入與訓(xùn)練得到的權(quán)重進行卷積操作,使得神經(jīng)元對應(yīng)的權(quán)值都是相同,而由于權(quán)值相同,故也可以減少訓(xùn)練參數(shù)。池化層池化層也稱為下采樣層,由于需要處理的圖像往往都比較大,使用池化層的目的是為了降低特征圖的空間分辨率,從而實現(xiàn)對輸入的扭曲和平移的空間不變性,并且可以緩解過擬合現(xiàn)象。輸入的數(shù)據(jù)經(jīng)過卷積計算之后都可以將所得到的數(shù)據(jù)映射到高維空間,如果只進行卷積計算,維數(shù)會越來越高,導(dǎo)致出現(xiàn)錯誤,池化層利用局部性原理,對圖像進行抽樣,從而降低了特征圖的空間分辨率,在降低空間分辨率就減少了需要處理的數(shù)據(jù)量,還可以保留有效信息。故卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,卷積層通常與池化層相連結(jié)。卷積層和池化層的交替操作的運算方式,即將卷積層和池化層看作成對出現(xiàn),這樣既可以實現(xiàn)特征提取又可以避免維數(shù)過高帶來的出錯。設(shè)置訓(xùn)練集訓(xùn)練集是用于模型擬合的數(shù)據(jù)樣本。測試集是用于評估最終模型在各種不同情況下的識別能力,即訓(xùn)練模型的泛化程度。將需要識別的草葉紋圖案的一定量圖像存放在w文件夾,將非草葉紋圖案的一定量圖像存放在y文件夾。將存放的兩類三通道圖像通過灰度化和統(tǒng)一大小的函數(shù)生成相同大小的二值圖存放在w1文件夾和y1文件夾。forj=1:img_numimage_name=img_path_list(j).name;image=imread(strcat(file_path,image_name));image=rgb2gray(image);crop_image=imresize(image,[400,400]);imwrite(crop_image,strcat('w1/',image_name));%保存文件Endforj=1:img_numimage_name=img_path_list(j).name;image=imread(strcat(file_path,image_name));image=rgb2gray(image);crop_image=imresize(image,[400,400]);imwrite(crop_image,strcat('y1/',image_name));%保存文件End分類問題代碼的前邊是讀取自定義的數(shù)據(jù)集,把它保存成imageDatastore格式,這種格式只需要提供圖片的路徑信息而不用把圖片全部讀入內(nèi)存中,因此非常適合大規(guī)模的數(shù)據(jù)集。ds=imageDatastore('image/','LabelSource','foldernames','IncludeSubfolders',true);[trainDigitData,valDigitData,testData]=ds.splitEachLabel(0.5,0.3,0.2,'Randomize');%Preparedata按比例拆分CNN之所以能引起廣泛關(guān)注,就是在于它最初在圖像分類方面取得很大的成功,后來人們發(fā)現(xiàn)對于其他的分類問題,CNN也有很好的性能。這里要解決的分類問題,就是訓(xùn)練自己的分類網(wǎng)絡(luò)。所謂訓(xùn)練就是為每層網(wǎng)絡(luò)之間尋找使得costfunction最小的權(quán)值,這些權(quán)值剛開始是按照某種分布隨機初始化的,我們用數(shù)值的方法求costfunction的最小值。一般來說,我們用神經(jīng)網(wǎng)絡(luò)建立的是一個非常復(fù)雜的模型,我們往往能難找到這個模型的最小值,但可以找到它的極小值(局部最小值),這些極小值已經(jīng)很接近我們要找到最小值。要訓(xùn)練自己的網(wǎng)絡(luò),要先建立自己的網(wǎng)絡(luò),并設(shè)置一定的訓(xùn)練參數(shù)。在matlab中用來建立網(wǎng)絡(luò)的語句如下:%Definenetworklayerslayers=[...imageInputLayer([400,400,1]);batchNormalizationLayer();convolution2dLayer(5,20);batchNormalizationLayer();reluLayer()maxPooling2dLayer(2,'Stride',2);%最大池化fullyConnectedLayer(2);softmaxLayer();classificationLayer(),...];直接用和數(shù)據(jù)集同等圖像大小的值為數(shù)組建立網(wǎng)絡(luò),本設(shè)計是建立一個9層的分類網(wǎng)絡(luò),包括輸入層,標(biāo)準(zhǔn)化層,卷積層,標(biāo)準(zhǔn)化層,激活函數(shù)層,全連接層,去最大值層,分類層。用來設(shè)定修改參數(shù)的語句如下:options=trainingOptions('sgdm',...'ValidationData',valDigitData,...'Plots','training-progress',...'ExecutionEnvironment','cpu');這些參數(shù)是CNN網(wǎng)絡(luò)的基本參數(shù),sgdm是隨機梯度下降與動量優(yōu)化器,可以使用“動量”名值對參數(shù)來指定動量值。ValidationData是在訓(xùn)練期間用于驗證的數(shù)據(jù),指定為圖像數(shù)據(jù)存儲,該數(shù)據(jù)存儲返回兩列表或兩列單元格數(shù)組、表或單元格數(shù)組中的數(shù)據(jù)。驗證數(shù)據(jù)的格式取決于任務(wù)的類型,并與trainNetwork函數(shù)的有效輸入相對應(yīng),只支持單一輸入的網(wǎng)絡(luò)。Plots指的是要在網(wǎng)絡(luò)訓(xùn)練期間顯示的情節(jié),指定為由“情節(jié)”和以下兩個情節(jié)之一組成的逗號分隔對:“none”-訓(xùn)練時不要顯示情節(jié),“training-progress”-訓(xùn)練進度計劃。圖中顯示了小批量損失和準(zhǔn)確性、驗證損失和準(zhǔn)確性,以及關(guān)于訓(xùn)練進展的附加信息。Plots在右上角有一個停止按鈕。點擊按鈕停止訓(xùn)練,返回網(wǎng)絡(luò)當(dāng)前狀態(tài)。ExcutionEnviroment是訓(xùn)練網(wǎng)絡(luò)的環(huán)境,可以在CPU(‘cpu’)上做,也可在GPU(‘gpu’)上做,可以并行(‘paralle’),默認(rèn)的情況是先測試cpu,如果不可用再測試gpu。設(shè)定好網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練參數(shù)后,可以用:net=trainNetwork(trainDigitData,layers,options);來訓(xùn)練自己的網(wǎng)絡(luò),用trainDigitData做訓(xùn)練數(shù)據(jù),訓(xùn)練layers網(wǎng)絡(luò),在訓(xùn)練過程中選擇option中的訓(xùn)練參數(shù)。testLabel=classify(net,testData);precision=sum(testLabel==testData.Labels)/numel(testLabel)輸出識別內(nèi)容圖4-2識別分類結(jié)果Figure4-2Recognitionandclassificationresults從
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年安徽衛(wèi)生健康職業(yè)學(xué)院單招職業(yè)傾向性考試題庫附答案解析
- 石橫特鋼集團招聘筆試題及答案
- 2025年宜春幼兒師范高等??茖W(xué)校單招職業(yè)技能考試模擬測試卷附答案解析
- 2025年重慶移通學(xué)院單招職業(yè)技能測試模擬測試卷附答案解析
- 2024年浙江舟山群島新區(qū)旅游與健康職業(yè)學(xué)院單招職業(yè)適應(yīng)性測試模擬測試卷附答案解析
- 2023年湖南幼兒師范高等專科學(xué)校單招職業(yè)技能考試題庫附答案解析
- 2025年云南城市建設(shè)職業(yè)學(xué)院單招職業(yè)技能測試題庫附答案解析
- 2026年上海電力大學(xué)單招(計算機)測試備考題庫必考題
- 2024年新疆職業(yè)大學(xué)單招職業(yè)傾向性測試模擬測試卷附答案解析
- 2024年河南省南陽市單招職業(yè)傾向性測試題庫附答案解析
- 貴州興義電力發(fā)展有限公司2026年校園招聘備考題庫及一套參考答案詳解
- 2025年天津大學(xué)管理崗位集中招聘15人備考題庫完整答案詳解
- 2025內(nèi)蒙古鄂爾多斯市鄂托克旗招聘專職社區(qū)人員30人考試筆試備考試題及答案解析
- 三方協(xié)議模板合同
- 2026年元旦校長寄語:向光而行馬到新程
- 玉米質(zhì)押合同范本
- 鋼結(jié)構(gòu)報廢回收合同2025年版本
- 2025西部機場集團航空物流有限公司招聘筆試考試參考題庫及答案解析
- 2025年紀(jì)檢部個人工作總結(jié)(2篇)
- 大學(xué)生創(chuàng)業(yè)計劃書word文檔(三篇)
- 材料科學(xué)基礎(chǔ)輔導(dǎo)與習(xí)題-上交課件 材料科學(xué)基礎(chǔ)教程及習(xí)題 上海交通大學(xué)
評論
0/150
提交評論