【《圖像識別分類相關(guān)技術(shù)研究綜述》5600字】_第1頁
【《圖像識別分類相關(guān)技術(shù)研究綜述》5600字】_第2頁
【《圖像識別分類相關(guān)技術(shù)研究綜述》5600字】_第3頁
【《圖像識別分類相關(guān)技術(shù)研究綜述》5600字】_第4頁
【《圖像識別分類相關(guān)技術(shù)研究綜述》5600字】_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

圖像識別分類相關(guān)技術(shù)研究綜述目錄TOC\o"1-2"\h\u26639圖像識別分類相關(guān)技術(shù)研究綜述 1189211.1目標檢測 167671.2圖像識別 1131381.3圖像分類處理 3172081.4垃圾分類模型 81.1目標檢測目標提?。ㄒ卜Q為目標提?。腔谀繕说膸缀魏徒y(tǒng)計特性的一種圖像分割技術(shù)。目標提取實際上是目標的分割和識別的組合。整個系統(tǒng)最為主要的性能是其具有精確度和實時性。特別是在復(fù)雜的場景中,當需要實時處理多個目標時,自動目標提取和識別就顯得尤為重要,它能夠在復(fù)雜的場景中準確地提取出最為重要的信息。目標檢測的一種方法是使窗口從左右上下滑動以通過分類識別目標。為了在不同的視野距離中找到不同的目標類型,可以使用不同大小和寬高比的窗口。為了大量計算,提出了一種替代滑動窗口多次檢測圖像的選擇性搜索方法。通過組合像素組,可以找到感興趣的區(qū)域。R-CNN使用候選領(lǐng)域方法制作約2000個ROI。將這些區(qū)域轉(zhuǎn)換成固定尺寸圖像,并提供給卷積神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)架構(gòu)隨后通過幾個完整的連接層來完成目標分類并改進邊界盒。為了解決R-CNN太慢的問題,便提出了一種FastR-CNN算法。使用特征提取器提取整個圖像的特征,并將直接生成候選區(qū)域的方法應(yīng)用于提取的特征圖,重復(fù)特征提取來解決問題,并且有效地減少處理時間長的問題。1.2圖像識別圖像主要分為灰度圖像和彩色圖像,灰度圖像是由數(shù)字表示其明暗程度,而彩色圖像則是由一個三維張量表示,實質(zhì)上是一個由整數(shù)組成的長方體。機器中的圖像相當于是一個M×N×3的矩陣。其中,M,N為圖像長寬像素點的個數(shù)[2]。圖像識別技術(shù)是通過使用計算機技術(shù),處理、分析和理解圖像,可以通過計算機識別技術(shù)識別各種不同模式的目標和對像的不同模式。根據(jù)觀察到的可以識別出圖像的對象,對識別結(jié)果做出有意義的判斷。也就是說是利用現(xiàn)代的信息處理和計算技術(shù),模擬并完成人類認知和理解的過程。通常情況下,圖像識別系統(tǒng)包括以下幾個部分:圖像預(yù)處理、圖像分割、特征提取、判斷匹配和輸出結(jié)果。圖2-1圖像識別系統(tǒng)圖圖像分割的本質(zhì)是將圖像劃分成多個有意義的區(qū)域,對每個區(qū)域的圖像進行特征化提取,將提取到的結(jié)果,根據(jù)分類器提取的圖像特征對圖像進行相對應(yīng)的分類。在實際應(yīng)用的過程中,并沒有嚴格的限制圖像識別和分割的過程。從某種意義上來說,分割圖像的過程就是圖像識別的過程。圖像分割主要研究對象與背景之間的關(guān)系,研究的是特定背景所代表的整體屬性,而圖像識別研究的內(nèi)容更傾向于對象本身的屬性。特征提取是圖像處理的主要操作,事實上作為初級運算,對一幅圖像進行第一次計算處理。檢查每個像素以確定像素是否代表其所屬特征。如果是較大算法的一部分,則該算法通常只檢查圖像的特征區(qū)域。作為特征提取的前提條件,輸入圖像通常在尺度空間中進行高斯模糊平滑。然后通過局部微分計算得到圖像的一個或多個特征。圖2-2信息獲取過程1.3圖像分類處理1.3.1分類標準圖像分類處理的關(guān)鍵問題就是按概率統(tǒng)計規(guī)律,選擇適當?shù)呐袆e函數(shù)、建立合理的判別模型,把這些離散的“集群”分離開來,并作出判決和歸類。通常的做法是,將多維波譜空間劃分為若干區(qū)域(子空間),位于同一區(qū)域內(nèi)的點歸于同一類。子空間劃分的標準可以概括為兩類:第一種是根據(jù)點群的統(tǒng)計特征,確定待占用區(qū)域的范圍。例如,定義每個類別的平均向量,以便將標準偏差范圍內(nèi)的點分組為單個類別。第二種是確定類別之間的邊界,建立邊界函數(shù)或判別函數(shù)。不論采取哪種標準,關(guān)鍵在于確定同一類別在多維波譜空間中的位置(類的均值向量)、范圍(協(xié)方差矩陣)及類與類邊界(判別函數(shù))的確切數(shù)值。按確定這些數(shù)據(jù)是否有已知訓(xùn)練樣本(樣區(qū))為準,通常把分類技術(shù)分為監(jiān)督和非監(jiān)督兩類。非監(jiān)督分類方法是基于圖像數(shù)據(jù)的統(tǒng)計特征和點群分布,從純統(tǒng)計的角度對圖像數(shù)據(jù)進行分類的一種分類方法。監(jiān)督分類是基于已知類別或訓(xùn)練樣本的模式特征選擇特征參數(shù),建立判別函數(shù),并將圖像中的各個像差點分類為給定類別的方法。1.3.2分類方法1.基于概率統(tǒng)計的Bayes分類器在實際的分類中,由于不可能用同一決策最小風險的Bayes決策來解決所有事件的分類問題,因此需要用不同的擬經(jīng)典函數(shù)來選擇不同的分類決策。在Bayes分類器中,將不同的權(quán)值劃分為錯誤率和風險,最后通過選擇得到它們的理想分類。(1)驗證概率P(w)此步驟是針對M事件出現(xiàn)可能性來進行分析,不考慮其他任何條件就直接進行事件的分類,所以所提供的信息較少。如:藥品公司生產(chǎn)的藥,顯然一般情況下合格的藥品要比不合格的藥品的數(shù)量所占比例大,所以就容易直接將所有藥品都歸類為合格的藥品,這樣并不能很好的將合格和不合格的藥品進行分類。(2)類概率密度函數(shù)P(X|w)對已知某類別的特征空間中出現(xiàn)特征X的概率密度,實質(zhì)上是判斷第w類樣品中它的屬性X是如何分布的。一般情況下,類條件概率密度函數(shù)可以采用多維變量的正太概率密度函數(shù)來進行模擬。(3)驗證概率P(w|X)即可能出現(xiàn)多類別事件出現(xiàn)同一特征的情況,這時就需要判斷在條件X出現(xiàn)的條件下,樣品為w的概率是多少,而這個后驗概率就是使用Bayes公式計算獲得的。公式如下:PBi其中P(Bi)和P(Bj)是指事件Bi和Bj的先驗概率,即P(Bi)=Bi利用該分類器,需要知道樣本的整體分布情況,并且設(shè)計出相應(yīng)的判別函數(shù)和決策平面,作為生成包含各種先驗概率、條件條件密度函數(shù)和后驗概率的判別函數(shù)的基礎(chǔ)。這種方法稱為參數(shù)判別法。通過這種方式,當樣本的測試向量值x在等待測試時已知時,針對各種后驗概率來確定x,并且根據(jù)相應(yīng)的準則來計算和分類。因此,只有在有統(tǒng)計知識或可以利用訓(xùn)練樣本估計參數(shù)的情況下,才使用這種分類方法。2.聚類這是一種無監(jiān)督的分類方法,通常被稱為聚類或集群,是根據(jù)提取并分析n維空間中的數(shù)據(jù)的特征,將具有相似類型的數(shù)據(jù)聚合成一類。(1)用處聚類可以根據(jù)提出的初始假設(shè)數(shù)據(jù)進行分析,分類出新的數(shù)據(jù),并對同類型的數(shù)進行測試,以及壓縮數(shù)據(jù)。如通過聚類將一個圖像進行分割,就是把圖像分割成若干有意義的區(qū)域的處理技術(shù),這些區(qū)域互不交疊,每個區(qū)域內(nèi)部的某種特性或相同或相近,而不同區(qū)域間有明顯差異。(2)聚類準則一般有兩種方法來最為聚類優(yōu)劣的準則,一是經(jīng)驗,比如以距離函數(shù)作為相似度的度量,用不斷修改的閾值,來探究聚類效果的滿意程度;二是準則函數(shù),準則函數(shù)包含到函數(shù)值與數(shù)據(jù)的劃分,將取得極小值時的狀態(tài)認定為最佳劃分。(3)模糊聚類

在所有的事物中并不是所有的都是精確的,都可以分個是非曲折或者將某些數(shù)據(jù)精確的劃分為不同的分類,既然存在確定的那必然也存在不確定的,即模糊的。在實際生活中,我們?nèi)送鶎δ切┠:氖挛镆膊荒苓M行很好的判斷,大多通過分析、理解、推理、總結(jié)對那些模棱兩可的進行經(jīng)驗性的分類。即使這樣,對于不同的人看待的不同的事物仍然是不能進行統(tǒng)一的,如人的高矮,胖瘦以及哪個年齡屬于中年階段等等,但是對于這些又大概可以劃分出一個多數(shù)人比較認可的范圍,我們可以把這個范圍視為模糊集。在模糊聚類中正是通過對這些模糊集進行運算、分析來對模糊數(shù)據(jù)進行分類的(比較常用的是模糊矩陣)[3]。3.幾何分類器集合分類器可以將其理解為通過幾何的方法,不依賴于條件概率的知識,把特征空間分解為對應(yīng)于不同類別的子空間。幾何分類方法按照分界函數(shù)的形式可以分為線性判別函數(shù)和非線性判別函數(shù)倆類。而在幾何分類方法中比較常見的算法有感知器算法、增量校正算法、LMSE分類算法以及Fisher分類算法,這里重點說一下Fisher分類算法。(1)Fisher分類算法的理論基礎(chǔ)在針對應(yīng)用統(tǒng)計方法解決模型識分類別問題時,經(jīng)常會出現(xiàn)“維數(shù)災(zāi)難”的問題,這是因為在低維空間里適用的方法換到高維空間進行就算就不合適了。因此壓縮特征空間的維數(shù)就顯得非常重要,感覺有點像PCA但二者又有很大的區(qū)別,只是降維的思想一致而已。Fisher的核心目的是使原本線性不可分的數(shù)據(jù)變得線性可分,因此可以將原始數(shù)據(jù)投影到一維空間中。Fisher的關(guān)鍵在于最大化一個準則函數(shù)J,準則函數(shù)J是由類間散度比上類內(nèi)散度得到的。最大化準則函數(shù)J是要求類內(nèi)散度足夠小而類間散度足夠大。小的類內(nèi)散度保證了當前類中的數(shù)據(jù)足夠緊密。大的類間散度保證了這兩個類有足夠的可分性。類間散度定義為投影后兩類樣本均值差的平方。類內(nèi)散度定義為兩類樣本投影后與各自均值差的和的平方和。

圖2-3Fisher分類算法散點圖從圖中可以看出在將空間中的數(shù)據(jù)進行一維投影時很有可能造成數(shù)據(jù)重疊,這樣會直接影響到實際的分類效果,所以在投影前需要找到最佳的投影向量(這也就是為什么Fisher的準則函數(shù)要求數(shù)據(jù)的類內(nèi)聚,類與類間松散的原因),而投影后還需要找到類與類之間的劃分邊界點,只有完美的找到這兩個量才能很好的對數(shù)據(jù)進行分類。(2)二分類問題的實現(xiàn)步驟求取倆類的均值向量求取倆類的內(nèi)離散度矩陣Si、SjSj求取總類間離散度矩陣SwSω定義Fisher準則函數(shù)w*(增大類內(nèi)聚和類間松散)W?=對于倆類已知數(shù)據(jù),求出它們在w*上的投影點DD=w求取各類數(shù)據(jù)在投影空間上的均值A(chǔ)A=1選取閾值y0(在投影空間中的分割閾值)y0計算未知樣品X在w*上的投影點并根據(jù)決策進行分類4.神經(jīng)網(wǎng)絡(luò)分類器(1)定義人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetworks,ANN)是由大量神經(jīng)元組成的非線性動力系統(tǒng),它是一種基于連接學(xué)說構(gòu)造的智能仿生模型。(2)分類它可以根據(jù)神經(jīng)元之間連接的拓撲結(jié)構(gòu)的不同分為分層網(wǎng)絡(luò)和互連網(wǎng)絡(luò)。分層網(wǎng)絡(luò)是根據(jù)其函數(shù)將網(wǎng)絡(luò)中的所有神經(jīng)元分成若干層。通常,存在輸入層、中間層和輸出層,每個層按順序連接,代表有BP網(wǎng)絡(luò)?;ミB網(wǎng)絡(luò)意味著網(wǎng)絡(luò)的任何兩個單位都可以相互連接。(3)學(xué)習方式在神經(jīng)網(wǎng)絡(luò)中有三種模仿人的學(xué)習方式,分別是:有導(dǎo)師學(xué)習網(wǎng)絡(luò)、無導(dǎo)師學(xué)習網(wǎng)絡(luò)以及強化學(xué)習網(wǎng)絡(luò)。其中有導(dǎo)師學(xué)習網(wǎng)絡(luò)也叫有監(jiān)督型學(xué)習模式,而無導(dǎo)師學(xué)習網(wǎng)絡(luò)也叫無監(jiān)督學(xué)習模式。(4)基本原理其工作原理可以看作從輸入空間到輸出空間的非線性映射。通過調(diào)整權(quán)重和閾值,它可以學(xué)習和發(fā)現(xiàn)變量之間的關(guān)系,實現(xiàn)事物的識別和分類。(5)特點①容錯性神經(jīng)網(wǎng)絡(luò)具有很強的容錯性,它可以從不完全的數(shù)據(jù)和圖形中學(xué)習并做出決定。由于知識不是存儲裝置而是存儲在網(wǎng)絡(luò)系統(tǒng)整體中,所以節(jié)點的規(guī)定比例不參加動作,因此不會對整個系統(tǒng)的性能造成很大的影響。它可以處理噪聲和不完全數(shù)據(jù),并且具有泛化功能和強容錯性能。②自適應(yīng)性目的是為了得到了一個最優(yōu)的解決方案,所以不斷的調(diào)整結(jié)果,以通過學(xué)習和訓(xùn)練找到輸入和輸出之間的內(nèi)部關(guān)系。③固有的并行結(jié)構(gòu)和并行處理神經(jīng)網(wǎng)絡(luò)擁有并行結(jié)構(gòu),其計算功能分布在多個處理單元上,意味著在同一層內(nèi)的處理單元可以進行同時操作。④知識的分布存儲知識不存儲在特定的存儲裝置中,而是采用分散在整個系統(tǒng)中的存儲模式,因此需要多種連接。在計算機中,可以僅提供一個地址來獲得一個或一組數(shù)據(jù)。為了獲得神經(jīng)網(wǎng)絡(luò)的存儲知識,使用聯(lián)想方法。⑤模式識別能力神經(jīng)網(wǎng)絡(luò)具有較強的識別能力,對于處理復(fù)雜的非線性關(guān)系具有天生的優(yōu)勢。1.4垃圾分類模型當前使用的識別模型基本都為神經(jīng)網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)是一種模仿人腦的機器學(xué)習算法。神經(jīng)網(wǎng)絡(luò)分為輸入單元,隱藏單元和輸出單元。每個單元由大量的節(jié)點非線性組成,其數(shù)據(jù)信息輸入輸出及表示處理的過程如神經(jīng)元間的信息傳遞一樣。每個節(jié)點之間都有一個權(quán)重,每個節(jié)點都有一個激勵函數(shù)。使機器可以通過神經(jīng)網(wǎng)絡(luò)及一定的算法進行自主學(xué)習。[4]1.4.1基于深度神經(jīng)網(wǎng)絡(luò)的垃圾分類模型深度神經(jīng)網(wǎng)絡(luò)(DeepNeuralNetwork,DNN)是一種前向結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),分為一個輸入層,多個隱藏層,一個輸出層。每一層全連接到下一層。對于分類器,是將輸入的x映射到一個類別y,并且機器通過學(xué)習的方法更新參數(shù)的值,得到構(gòu)成x到y(tǒng)的最佳函數(shù)。反向傳播算法是多層前向神經(jīng)網(wǎng)絡(luò)訓(xùn)練常采用的算法,用于計算梯度Δw。分為正向傳播和反向傳播兩種?;谏疃壬窠?jīng)網(wǎng)絡(luò)的垃圾分類模型:分為一個輸入層,三個隱藏層,一個輸出層。輸入層用來輸入32×32×3的圖片,將其轉(zhuǎn)化成3072的向量x輸入神經(jīng)網(wǎng)絡(luò)中。隱藏層分成隱藏層1,2,3,4它們的節(jié)點分別為218,126,32,8。每個隱藏層都有Relu激活函數(shù)。x從輸入層輸出后依次經(jīng)過這三個隱藏層,將向量乘上權(quán)重矩陣,加上偏置值,再用激活函數(shù)得到一個輸出的值。輸出層節(jié)點為10個,將從隱藏層輸出的得到輸出向量y,y為模型的實際輸出。用softmax函數(shù)作為激活函數(shù),將從10個神經(jīng)元輸出的y映射到區(qū)間[0,1]中,給圖像進行十分類。在垃圾分類這一分類問題中,目標函數(shù)為交叉熵,交叉熵公式如下:Hp,q=?其中概率p,q為期望輸出和實際輸出。運用反向傳播算法和梯度下降法優(yōu)化權(quán)重,使目標函數(shù)交叉熵的值達到最小。再向深度神經(jīng)網(wǎng)絡(luò)輸入新的圖像,機器根據(jù)所學(xué)對新的數(shù)據(jù)進行預(yù)測,預(yù)測對,目標函數(shù)值小,預(yù)測錯,目標函數(shù)值大。1.4.2基于卷積神經(jīng)網(wǎng)絡(luò)的垃圾分類模型卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetworks,CNN)也是神經(jīng)網(wǎng)絡(luò)的一種,卷積神經(jīng)網(wǎng)絡(luò)含有輸入層,卷積運算層,激勵層,池化層,全連接層,輸出層等。卷積層用來提取圖片各個部分所具有的特征。池化層的目的是為了減少訓(xùn)練參數(shù)的數(shù)量,降低卷積層輸出的特征向量的維度。全連接層用來生成一個等于我們需要的類的數(shù)量的分類器。卷積神經(jīng)網(wǎng)絡(luò)垃圾分類模型如下:將輸入圖片裁減成32×32×3的RGB三維張量并經(jīng)過歸一化,輸入卷積神經(jīng)網(wǎng)絡(luò)。其中一部分圖片用來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論