圖像分類算法與應(yīng)_第1頁
圖像分類算法與應(yīng)_第2頁
圖像分類算法與應(yīng)_第3頁
圖像分類算法與應(yīng)_第4頁
圖像分類算法與應(yīng)_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、圖像分類算法與應(yīng)用研究,目錄,研究背景 相關(guān)研究工作 已有工作基礎(chǔ) 論文主要研究內(nèi)容,實際意義,按照語義內(nèi)容進行圖像管理/圖像瀏覽 減少人工標注時間(Flickr, Picasa) 輔助圖像檢索(Google, Baidu, Picsearch),圖像分類的語義層次,James Wang: 1.語義類別(例如照片或者剪貼畫,室外) 2.物體的羅列(人,籃球架,樓) 3.抽象的語義(運動,打籃球) 4.具體的語義(具體的描述一個圖像),場景分類,物體分類,Caltech 101,圖像分類,海灘,恐龍,非洲,圖像分類的挑戰(zhàn),尺度變化,光照變化,圖像分類的挑戰(zhàn),類內(nèi)差異,類間差異,研究現(xiàn)狀,圖像表示

2、 底層視覺特征表示 語義圖像表示 詞包模型表示 機器學(xué)習(xí)算法 多示例學(xué)習(xí)算法,底層視覺特征表示,Vailaya 6類假日圖片 層次分類 貝葉斯分類器 Chang 全局特征,SVM分類器 付巖 3類圖片 3種顏色特征對比 SVM分類器 Torralba 收集了8000萬張32*32的圖片,用最近鄰方法進行分類,Szummer和Picard 分類“室內(nèi)”/“室外” 顏色和紋理特征 K-NN 投票 Serrano SVM分類 SVM輸出結(jié)果相加 Paek和Chang 圖像分割 使用貝葉斯網(wǎng)絡(luò),語義圖像表示(全局),Spatial Envelope -Oliva和Torralba提出,Naturaln

3、ess Openness Roughness Expansion Ruggedness,語義圖像表示(局部),Vogel和Schiele提出,詞包模型,Dense Harris-Laplace Hessian-Laplace Harris Hessian Edge-Laplace Haar-Hessian DoG( Difference of Gaussian),Patch SIFT gradient location and orientation histogram (GLOH) shape context steerable filters moment invariants SURF,

4、感興趣區(qū)域檢測器,描述子,State of Art方法,詞匯表的構(gòu)造(K-Means,GMM,VQ,pLSA) 圖像相似性的度量(Distance Metric Learning, Kernel Methods(PMK,EMD) ) 多特征融合(Random Forest/Ferns,SVM) 圖像空間信息的利用(Spatial Pyramid, ABS-pLSA,TSI-pLSA,LDA(Fei-Fei) ) 感興趣區(qū)域選取(Anna Bosch),多示例學(xué)習(xí),多示例訓(xùn)練集由包(bag)組成,每個包里面包含多個實例(instance)。如果一個包為正例,則包中至少有一個實例為正例;如果一個包

5、為反例,則包中所有的實例均為反例。 方法: MaronDiverse Density Andrew Mi-SVM以及MI-SVM Chen DD-SVM以及MILES Qi DD-SVM變種 周志華MIML框架(Multi-Instance Multi-Label),SVM進行圖像分類,常用核函數(shù),高斯核(Gaussian RBF):,拉普拉斯核(Laplacian RBF):,多項式核(polynomial):,無限多項式核(infinite polynomials):,Svetlana Lazebnik-Spatial Pyramid Matching Kernel(空間金字塔匹配核),S

6、patial Pyramid RBF Gaussian Kernel,Spatial Pyramid 2 Kernel,Evaluation,Corel圖像庫中的10類,Libsvm,5折交叉驗證 C= 2-3, 2-1, , 215 =2-15,2-13,25,Spatial Pyramid RBF Gaussian Kernel,Spatial Pyramid 2 Kernel,以上兩種核的結(jié)果都有所提高 1+4的形式最好 自動學(xué)習(xí)出權(quán)重,多分類器融合的圖像分類,多分類器融合框架,模糊積分,函數(shù)g : 2T 0,1叫做g模糊測度,如果它滿足如下性質(zhì): (I) g()=0; (II) g(T

7、)=1; (III) g(A)g(B), if AB 并且 A, BT (IV) 對于所有的A, BT并且 AB = g(AB) = g(A) + g(B) +g(A)g(B) 對于某一個 -1,模糊積分,訓(xùn)練 傳統(tǒng)的Reward-Punishment算法 設(shè)置初始gi 對訓(xùn)練樣本的分類進行Reward和Punishment 對初始gi依賴,陷入局部最優(yōu)解 改進 設(shè)置多組初始gi 本文選取gi=t/N,結(jié)果,Corel圖像庫中的10類,Libsvm,線性核 C=2-5,2-4,210 5折交叉驗證,結(jié)果比較,“海灘”被誤分為“山川”,“山川”被誤分為“海灘”,經(jīng)常被誤分的圖片,融合方法與子分類器的精度對照,不同訓(xùn)練樣本下的精度對照,改進: 自動拋棄性能較差的分類器,主要研究內(nèi)容,實施方案與可行性論證,組合多分類器框架的研究 最優(yōu)詞匯表構(gòu)造的研究 最優(yōu)空間信息進行圖像分類的研究 Internet圖像挖掘研究,組合多分類器框架的研究,組合分類器框架選擇 分類器權(quán)重計算 分類器選擇,最優(yōu)詞匯表構(gòu)造的研究,Filter方法 預(yù)計方法: 生成一個較大的詞匯表(5000-10000) 根據(jù)每個詞匯的對類別的判別能力控制聚類,最優(yōu)空間信息進行圖像分類的研究,Kernel Methods Gaussian, 2 ,Histogram Intersection 根據(jù)訓(xùn)練圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論