版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
圖像分割1圖像分割經(jīng)典算法目錄圖像分割簡(jiǎn)介2訓(xùn)練圖像分割網(wǎng)絡(luò)3圖像分割算法的分類基礎(chǔ)不統(tǒng)一。在選擇分割算法時(shí),很大程度上取決于待分割圖像的形狀、像素分布特征和是否含有特定區(qū)域或其他影響分割的因素(如噪聲和紋理)。國(guó)內(nèi)外廣泛使用的圖像分割方法主要分為閾值分割、聚類分割、深度學(xué)習(xí)分割等,閾值分割如Otsu大津法,聚類分割如Meanshift聚類法,深度學(xué)習(xí)分割如Deeplabv3、U-Net、MaskR-CNN等方法。深度學(xué)習(xí)分割法可以細(xì)分為:語義分割:指將分屬不同物體類別的像素區(qū)域分開,并分類出每一塊區(qū)域的語義實(shí)例分割:指在語義分割的基礎(chǔ)上,對(duì)每個(gè)物體編號(hào)圖像分割簡(jiǎn)介語義分割是對(duì)一幅圖像中同一個(gè)類別的像素進(jìn)行分割,如下圖(b)所示,而實(shí)例分割是對(duì)一幅圖像中同類像素的不同實(shí)例對(duì)象進(jìn)行分割,如下圖(c)所示,原圖如下圖(a)所示。圖像分割簡(jiǎn)介基于深度學(xué)習(xí)圖像語義分割的卷積神經(jīng)網(wǎng)絡(luò)可以簡(jiǎn)化為編碼器-解碼器的網(wǎng)絡(luò)結(jié)構(gòu)。編碼器是一個(gè)分類網(wǎng)絡(luò),通常用來進(jìn)行訓(xùn)練;解碼器在編碼器之后,將編碼器訓(xùn)練學(xué)習(xí)到的特征進(jìn)行映射,以便得到相對(duì)應(yīng)的分類。實(shí)例分割則是在語義分割和目標(biāo)檢測(cè)的基礎(chǔ)上對(duì)每個(gè)物體進(jìn)行具體的分割。圖像分割簡(jiǎn)介常用的語義分割包括:基于區(qū)域的語義分割全卷積神經(jīng)網(wǎng)絡(luò)語義分割弱監(jiān)督語義分割實(shí)例分割包括:基于語義分割的方法基于目標(biāo)檢測(cè)的方法圖像分割簡(jiǎn)介對(duì)從圖像中提取的區(qū)域進(jìn)行描述和分類。首先通過選擇性搜索提取目標(biāo)區(qū)域。然后用分類器對(duì)每個(gè)區(qū)域的特征進(jìn)行劃分,達(dá)到對(duì)每個(gè)區(qū)域進(jìn)行分類的目的。與傳統(tǒng)圖像分割相比,基于區(qū)域的語義分割方法把全區(qū)域特征和前景特征連接在一起,因此能夠應(yīng)對(duì)更復(fù)雜的分割任務(wù),獲得更好的性能。但是由于基于區(qū)域的語義分割算法提取的特征包含的空間信息不足,導(dǎo)致分割邊界精度受到極大影響,同時(shí)算法耗時(shí)較長(zhǎng),降低了語義分割的效率。圖像分割簡(jiǎn)介1.基于區(qū)域的語義分割全卷積神經(jīng)網(wǎng)絡(luò)語義分割與基于區(qū)域的語義分割的區(qū)別:它沒有對(duì)區(qū)域特征進(jìn)行提取和分類,而是創(chuàng)建像素到像素的映射。卷積神經(jīng)網(wǎng)絡(luò)的全連接層決定網(wǎng)絡(luò)只能接收固定尺寸的輸入,以及輸出固定尺寸的預(yù)測(cè)結(jié)果。而全卷積神經(jīng)網(wǎng)絡(luò)是經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)的延伸和擴(kuò)展,用卷積層替換全連接層,使網(wǎng)絡(luò)可以接收任意尺寸的輸入并實(shí)現(xiàn)像素級(jí)預(yù)測(cè)。全卷積神經(jīng)網(wǎng)絡(luò)的連續(xù)卷積和池化使得輸出特征分辨率較低,同時(shí)像素與像素之間聯(lián)系不夠緊密,導(dǎo)致空間一致性弱??臻g一致性是指圖像中的某個(gè)點(diǎn)有較大的概率與周圍鄰域中的點(diǎn)具有相同類別屬性。圖像分割簡(jiǎn)介2.全卷積神經(jīng)網(wǎng)絡(luò)語義分割語義分割通常需要大量的數(shù)據(jù),包括原始圖像和相對(duì)應(yīng)的像素級(jí)標(biāo)簽。手動(dòng)對(duì)圖像進(jìn)行標(biāo)注耗時(shí)長(zhǎng)、成本高,導(dǎo)致某些場(chǎng)景的語義分割難以實(shí)現(xiàn)。弱監(jiān)督語義分割同樣通過使用帶標(biāo)注的邊界框進(jìn)行訓(xùn)練,但是這種標(biāo)注無須達(dá)到像素級(jí),因此比對(duì)原始圖像進(jìn)行像素級(jí)標(biāo)注更容易。弱監(jiān)督語義分割的應(yīng)用場(chǎng)景更廣闊,但是由于弱監(jiān)督語義分割的理論還不夠完善,和通常所說的語義分割還具有一定的差距。圖像分割簡(jiǎn)介3.弱監(jiān)督語義分割實(shí)例分割兼具語義分割和目標(biāo)檢測(cè)的特點(diǎn),按照解決思路分為:基于語義分割的Bottom-Up基于目標(biāo)檢測(cè)的Top-Down方法基于語義分割的Bottom-Up方法是通過階段語義分割實(shí)現(xiàn)分割對(duì)象的實(shí)例化。DeepMask實(shí)例分割算法如下圖所示,總共有3個(gè)階段,第1個(gè)階段實(shí)現(xiàn)圖像前景和背景的分割,第2個(gè)階段實(shí)現(xiàn)前景的語義分割,第3個(gè)階段實(shí)現(xiàn)前景的實(shí)例分割和目標(biāo)識(shí)別。圖像分割簡(jiǎn)介4.實(shí)例分割基于目標(biāo)檢測(cè)的Top-Down方法則是先通過目標(biāo)檢測(cè)找出具體的實(shí)例對(duì)象,然后將具體的對(duì)象區(qū)域進(jìn)行圖像分割,從而實(shí)現(xiàn)圖像分割,如MaskR-CNN、SOLO等方法。目前比較主流的實(shí)例分割算法為基于目標(biāo)檢測(cè)的Top-Down方法。相比較而言,不論是精度還是速度,基于目標(biāo)檢測(cè)的Top-Down方法普遍比基于語義分割的Bottom-Up方法表現(xiàn)更好。圖像分割簡(jiǎn)介1圖像分割經(jīng)典算法目錄圖像分割簡(jiǎn)介2訓(xùn)練圖像分割網(wǎng)絡(luò)3圖像分割算法發(fā)展至今已有許多經(jīng)典方法,語義分割領(lǐng)域有FCN、U-Net、Deeplabv3等方法,實(shí)例分割有DeepMask、MaskR-CNN、SOLO等方法。本節(jié)選取其中比較有代表性的Deeplabv3+和MaskR-CNN進(jìn)行深入講解。卷積神經(jīng)網(wǎng)絡(luò)通過卷積不斷降采樣,對(duì)圖像進(jìn)行特征編碼,然后通過轉(zhuǎn)置卷積對(duì)卷積生成的特征圖進(jìn)行上采樣,對(duì)特征圖實(shí)現(xiàn)特征解碼,再經(jīng)過編碼-解碼的過程后,得到一幅新的分割圖像,如下圖所示。圖像分割經(jīng)典算法其中轉(zhuǎn)置卷積也稱為反卷積,是使用較多的一種特征圖尺寸恢復(fù)技術(shù),其前向運(yùn)算過程也是卷積操作的反向運(yùn)算過程。需要注意的是,轉(zhuǎn)置卷積并不是卷積的完全逆運(yùn)算。反卷積技術(shù)能夠像卷積運(yùn)算一樣自主學(xué)習(xí)網(wǎng)絡(luò)模型的參數(shù)值,訓(xùn)練過程中也會(huì)消除一些冗余信息,能夠彌補(bǔ)上采樣或插值算法無法自主學(xué)習(xí)的缺點(diǎn)。正常卷積過程如下圖(a)所示,轉(zhuǎn)置卷積過程如下圖(b)所示。圖像分割經(jīng)典算法在語義分割的領(lǐng)域,網(wǎng)絡(luò)結(jié)構(gòu)的模式都是大同小異的,基本遵循編碼-解碼的思路。首先通過卷積操作獲取語義特征信息,圖像分辨率越來越??;然后使用反卷積操作將圖像分辨率放大到原圖大小。Deeplabv3+主要的創(chuàng)新點(diǎn):編碼過程中實(shí)現(xiàn)圖像下采樣時(shí)為了提高卷積核的感受野采用了空洞卷積的方式。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)針對(duì)的任務(wù)是圖像分類,而應(yīng)用到語義分割這種密集預(yù)測(cè)問題,效果并沒有顯著提高。因?yàn)樵诜指钊蝿?wù)中,需要具體分析出圖像中每一個(gè)像素點(diǎn)所屬類別,往往需要考慮圖像局部區(qū)域的上下文信息,而單純?cè)龃缶矸e核會(huì)使整個(gè)網(wǎng)絡(luò)運(yùn)算量大增。圖像分割經(jīng)典算法1.語義分割DeepLabv3+費(fèi)希爾(Fisher)等人在2016年提出了空洞卷積的方法,空洞卷積的結(jié)構(gòu)如下圖所示,下圖(a)對(duì)應(yīng)3×3的1階空洞卷積,和普通的卷積操作一樣;下圖(b)對(duì)應(yīng)3×3的2階空洞卷積,其感受野相當(dāng)于7×7的普通卷積,但是卷積核參數(shù)依然是3×3;下圖(c)對(duì)應(yīng)3×3的4階空洞卷積,其感受野相當(dāng)于15×15的普通卷積。圖像分割經(jīng)典算法為了解決圖像目標(biāo)中的多尺度問題,Deeplabv3+使用空洞空間金字塔池化(AtrousSpatialPyramidPooling,ASPP)。ASPP首先應(yīng)用帶有不同擴(kuò)張率的空洞卷積和圖像特征得到不同尺度的豐富的語義信息。然后將ASPP模塊的輸出與編碼器輸出進(jìn)行特征融合,二者能夠發(fā)揮不同的作用,ASPP模塊的輸出主要用于獲取多尺度的上下文信息,編碼器輸出則基于重構(gòu)空間信息的方式來捕捉物體邊緣。圖像分割經(jīng)典算法DeepLabv3+的網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示。圖像分割經(jīng)典算法對(duì)于DeepLabv3+解碼模塊,首先需要將編碼特征進(jìn)行雙線性上采樣,然后與主干網(wǎng)絡(luò)輸出的淺層特征進(jìn)行連接。由于對(duì)應(yīng)的淺層特征往往通道數(shù)較多,如256、512,可能會(huì)超過輸出編碼特征而導(dǎo)致訓(xùn)練困難,因此在連接操作前,采用1×1卷積,對(duì)淺層特征進(jìn)行通道降維操作以減少通道數(shù)。特征融合后需要進(jìn)行進(jìn)一步處理,處理時(shí)選用的是3×3的4階空洞卷積實(shí)現(xiàn)上采樣,得到最終的分割圖像。相較于DeepLabv3,DeepLabv3+改善了圖像分割的效果,提升了圖像邊緣處理的能力。這與DeepLabv3+中加入的解碼模塊直接相關(guān)。另外通過編碼-解碼結(jié)構(gòu)能夠?qū)崿F(xiàn)對(duì)空洞卷積的靈活控制,從而有效地獲得編碼特征分辨率,使得DeepLabv3+在精度和效率之間達(dá)到了平衡。圖像分割經(jīng)典算法MaskR-CNN是一種實(shí)例分割算法。該算法對(duì)FasterR-CNN進(jìn)行擴(kuò)展,在圖像中每個(gè)感興趣區(qū)域(RegionofInterest,ROI)上添加一個(gè)用于預(yù)測(cè)分割掩碼的分支,與FasterR-CNN原有的分類和回歸分支并行。MaskR-CNN的基本結(jié)構(gòu)如下圖所示。與FasterR-CNN不同的是,MaskR-CNN算法對(duì)ROI使用ROIAlign矯正。ROIAlign是為了修正偏差而提出的一個(gè)簡(jiǎn)單、量化的自由層,以保留精確的空間位置。圖像分割經(jīng)典算法2.實(shí)例分割MaskR-CNNFasterR-CNN使用ROIPooling實(shí)現(xiàn)了ROI從原圖區(qū)域到卷積區(qū)域的映射,并將特征池化到固定大小,最終將輸入?yún)^(qū)域的尺寸歸一化成卷積網(wǎng)絡(luò)的輸入尺寸。在歸一化的過程中,會(huì)出現(xiàn)ROI和提取特征不重合的現(xiàn)象,從而導(dǎo)致特征丟失。為了解決這一問題,在MaskR-CNN中提出了ROIAlign的概念,使用ROIAlign層對(duì)提取的特征和輸入的感興趣區(qū)域進(jìn)行校準(zhǔn)。采用雙線性內(nèi)插法計(jì)算在ROI中固定的4個(gè)采樣位置得到的輸入特征值;并對(duì)結(jié)果進(jìn)行融合得到矯正后的ROI;然后對(duì)每一個(gè)ROI通過全卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)不同實(shí)例所屬的分類;最終得到興趣目標(biāo)實(shí)例分割的結(jié)果。圖像分割經(jīng)典算法MaskR-CNN的網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示,可以分為2個(gè)分支。第1個(gè)分支是原始FasterR-CNN,第2個(gè)分支是FCN。FCN作為第2分支,作用是將FasterR-CNN檢測(cè)到的候選區(qū)域先進(jìn)行像素矯正,然后添加掩模并對(duì)其進(jìn)行分割。FCN的輸入為經(jīng)過像素矯正后的ROI特征圖,輸出目標(biāo)的掩模矩陣。圖像分割經(jīng)典算法1圖像分割經(jīng)典算法目錄圖像分割簡(jiǎn)介2訓(xùn)練圖像分割網(wǎng)絡(luò)3本節(jié)使用COCO2017數(shù)據(jù)集訓(xùn)練Deeplabv3+和MaskR-CNN。MSCOCO(MicrosoftCommonObjectsinContext)由微軟在2014年出資標(biāo)注而成,COCO競(jìng)賽與ImageNet國(guó)際計(jì)算機(jī)視覺挑戰(zhàn)賽一同被視為計(jì)算機(jī)視覺領(lǐng)域比較受關(guān)注和權(quán)威的比賽。COCO2017數(shù)據(jù)集是一個(gè)評(píng)估計(jì)算機(jī)視覺模型性能的數(shù)據(jù)集。數(shù)據(jù)集以場(chǎng)景理解為目標(biāo),主要從復(fù)雜的日常場(chǎng)景中截取,圖像中的目標(biāo)通過精確的分割進(jìn)行位置的標(biāo)定。圖像包括328000影像和2500000個(gè)標(biāo)注。目前為止,COCO2017數(shù)據(jù)集是語義分割的最大數(shù)據(jù)集,提供的類別有80類,有超過33萬張圖片,其中20萬張有標(biāo)注,整個(gè)數(shù)據(jù)集中個(gè)體的數(shù)目超過150萬個(gè)。訓(xùn)練圖像分割網(wǎng)絡(luò)COCO2017數(shù)據(jù)集的圖像分類、目標(biāo)檢測(cè)、語義分割、實(shí)例分割標(biāo)注結(jié)果如下圖所示。訓(xùn)練圖像分割網(wǎng)絡(luò)相較ImageNet數(shù)據(jù)集而言,COCO2017數(shù)據(jù)集分類較少,但是每個(gè)分類的實(shí)例對(duì)象比ImageNet數(shù)據(jù)集多。COCO2017數(shù)據(jù)集有91個(gè)分類,其中82個(gè)分類都有超過5000個(gè)實(shí)例對(duì)象,有助于更好地學(xué)習(xí)每個(gè)對(duì)象的位置信息,在每個(gè)類別的對(duì)象數(shù)目上也是遠(yuǎn)遠(yuǎn)超過PASCALVOC數(shù)據(jù)集。與其他數(shù)據(jù)集相比,COCO2017數(shù)據(jù)集有更多的對(duì)象場(chǎng)景圖像,有助于顯著提升模型學(xué)習(xí)細(xì)節(jié)的能力。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025乳房再造加速康復(fù)外科中國(guó)專家共識(shí)(2022版)解讀課件
- 返鄉(xiāng)學(xué)生網(wǎng)絡(luò)安全培訓(xùn)課件
- 施工沖刺階段保通方案
- 車險(xiǎn)培訓(xùn)課件制作
- 車隊(duì)安全駕駛培訓(xùn)記錄課件
- 某醫(yī)藥靜脈輸液知識(shí)試題含答案
- 車間領(lǐng)班安全培訓(xùn)課件
- 酒店客房用品更換與補(bǔ)給制度
- 酒店消防安全巡查制度
- 2025年八級(jí)班主任工作總結(jié)(2篇)
- 1輸變電工程施工質(zhì)量驗(yàn)收統(tǒng)一表式(線路工程)-2024年版
- 陜西省建筑場(chǎng)地墓坑探查與處理技術(shù)規(guī)程
- 2022-2023學(xué)年四川省樂山市市中區(qū)外研版(三起)六年級(jí)上冊(cè)期末測(cè)試英語試卷(含聽力音頻)
- 滕州菜煎餅創(chuàng)新創(chuàng)業(yè)計(jì)劃書
- 2024北京朝陽區(qū)初一(上)期末道法試卷及答案
- 假體隆胸后查房課件
- 送貨單格式模板
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、異丙醇和正丁醇檢驗(yàn)
- 關(guān)于地方儲(chǔ)備糧輪換業(yè)務(wù)會(huì)計(jì)核算處理辦法的探討
- 上海農(nóng)貿(mào)場(chǎng)病媒生物防制工作標(biāo)準(zhǔn)
- YY 0334-2002硅橡膠外科植入物通用要求
評(píng)論
0/150
提交評(píng)論