下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基于FasterRCNN的車(chē)輛目標(biāo)檢測(cè)算法設(shè)計(jì)案例目錄TOC\o"1-3"\h\u16182基于FasterRCNN的車(chē)輛目標(biāo)檢測(cè)算法設(shè)計(jì)案例 1277251.2FasterRCNN算法原理 1131421.2.1特征提取網(wǎng)絡(luò) 23841.2.2區(qū)域產(chǎn)生網(wǎng)絡(luò) 2170541.2.3目標(biāo)檢測(cè)網(wǎng)絡(luò) 41.1兩級(jí)目標(biāo)檢測(cè)算法原理基于兩級(jí)目標(biāo)檢測(cè)的車(chē)輛檢測(cè)方法分兩步,第一步通過(guò)專(zhuān)用模塊去生成候選框,尋找物體以及調(diào)整候選框。第二步再基于滑動(dòng)窗口思想將多個(gè)候選區(qū)域圖像按照相同尺寸輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分類(lèi)以及回歸操作。其特點(diǎn)是檢測(cè)剛準(zhǔn)確,但也相對(duì)耗時(shí)間。1.2FasterRCNN算法原理FasterRCNN網(wǎng)絡(luò)架構(gòu)由3個(gè)網(wǎng)絡(luò)組成,分別是特征提取(FeatureExtraction)網(wǎng)絡(luò)、區(qū)域產(chǎn)生(RegionProducedNetwork,RPN)網(wǎng)絡(luò)和目標(biāo)檢測(cè)分類(lèi)和識(shí)別(ROIHead)網(wǎng)絡(luò),如圖3-1所示。特征提取模塊也就是我們深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò),用來(lái)提取圖像特征。區(qū)域產(chǎn)生網(wǎng)絡(luò)是該算法的創(chuàng)新部分,與前兩代網(wǎng)絡(luò)采用SelectiveSearch算法滑動(dòng)窗口不同,這里采用了對(duì)特征圖中的每個(gè)點(diǎn)作為中心點(diǎn)生成多個(gè)大小比例不同的錨框的方式。RoiHead模塊和FastRCNN一致是用來(lái)對(duì)所生成的候選區(qū)進(jìn)行目標(biāo)分類(lèi)以及位置的修正回歸??偟腇asterR-CNN算法流程可分為3個(gè)步驟:(1)將圖像輸入網(wǎng)絡(luò)得到相應(yīng)的特征圖(2)使用RPN結(jié)構(gòu)生成候選框,將RPN生成的候選框投影到特征圖上獲得相應(yīng)的特征矩陣(3)將每個(gè)特征矩陣通過(guò)ROIpooling層縮放到7x7大小的特征圖,接著將特征圖展平通過(guò)一系列全連接層得到預(yù)測(cè)結(jié)果。圖3-1FasterRCNN網(wǎng)絡(luò)1.2.1特征提取網(wǎng)絡(luò)特征提取網(wǎng)絡(luò)即卷積神經(jīng)網(wǎng)絡(luò),一般選擇被廣泛使用的網(wǎng)絡(luò)架構(gòu)來(lái)實(shí)現(xiàn)圖像特征的提取,在目標(biāo)檢測(cè)中特征提取網(wǎng)絡(luò)又稱(chēng)為backbone。在FasterRCNN中采用了VGG16網(wǎng)絡(luò)。VGG16網(wǎng)絡(luò)具有良好的適配性,可以針對(duì)許多數(shù)據(jù)集。這一網(wǎng)絡(luò)含有13個(gè)卷基層,13個(gè)激活函數(shù)層和4個(gè)池化層。ADDINEN.CITE<EndNote><Cite><Author>Simonyan</Author><Year>2014</Year><RecNum>29</RecNum><DisplayText><styleface="superscript">[13]</style></DisplayText><record><rec-number>29</rec-number><foreign-keys><keyapp="EN"db-id="5t9pfd9xkppsfyep0zsx9etkdzzrtvvx2vtt"timestamp="1621258674">29</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Simonyan,K.</author><author>Zisserman,A.%JComputerScience</author></authors></contributors><titles><title>VeryDeepConvolutionalNetworksforLarge-ScaleImageRecognition</title><secondary-title>ComputerScience</secondary-title></titles><periodical><full-title>ComputerScience</full-title></periodical><dates><year>2014</year></dates><urls></urls></record></Cite></EndNote>[13]如圖3-2所示。特征提取網(wǎng)絡(luò)提取出的特征可以說(shuō)是整個(gè)網(wǎng)絡(luò)最基礎(chǔ)的一步,由于特征將被傳輸?shù)絉PN生成目標(biāo)候選區(qū)與ROIHead網(wǎng)絡(luò)進(jìn)行圖像中的目標(biāo)分類(lèi)與位置回歸,可以說(shuō)特征質(zhì)量的好壞決定了一個(gè)算法實(shí)際落地時(shí)能否達(dá)到我們要求的標(biāo)準(zhǔn)。當(dāng)然,與VGG16特征提取網(wǎng)絡(luò)不同,當(dāng)下的學(xué)界也提出了眾多種類(lèi)的特征提取網(wǎng)絡(luò),相比VGG16有了更大的進(jìn)步。這將在第五章進(jìn)行講解。圖3-2VGG16結(jié)構(gòu)圖1.2.2區(qū)域產(chǎn)生網(wǎng)絡(luò)區(qū)域生成網(wǎng)絡(luò)分為兩部分。首先是錨框生成部分,通過(guò)將特征圖像的每個(gè)像素點(diǎn)作為中心點(diǎn),生成若干個(gè)大小比例不同的邊界框(anchor)。在該算法中,特征圖每個(gè)位置生成若干個(gè)個(gè)錨框,一般為9個(gè)。見(jiàn)圖3-3所示。圖中紅色、藍(lán)色和綠色代表三種anchor,它們的大小不同。每種anchor又分成了長(zhǎng)寬比為1:2、1:1.2:1的三個(gè)Anchor。原文的anchor對(duì)于車(chē)輛目標(biāo)檢測(cè)不具備針對(duì)性,將在第五章對(duì)anchor進(jìn)行重新聚類(lèi),改進(jìn)。圖3-3錨框生成示意圖上述得到的錨框?qū)⑴c真實(shí)框進(jìn)行對(duì)比,通過(guò)取定IoU的閾值來(lái)標(biāo)定這些anchorbox的正負(fù)。這里的正負(fù)樣本表示anchor是否含有物體。一般來(lái)說(shuō),正樣本為與某一真實(shí)框IoU最大的anchor(避免anchor與真實(shí)框的IoU都小于0.7情況)或是與任意真實(shí)框IoU〉0.7的anchor。而負(fù)樣本是與所有真實(shí)框的IoU〈0.3的anchor。于是,傳入RPN網(wǎng)絡(luò)的樣本數(shù)據(jù)被整理為anchorbox(坐標(biāo))給回歸分支和每個(gè)anchorbox是否有物體(二分類(lèi)標(biāo)簽,這里將正樣本幅值為1,表示為物體,負(fù)樣本賦值為0,表示為背景)給分類(lèi)分支。在回歸分支中,得到的是anchor到真實(shí)框的偏移量。具體為:RPN網(wǎng)絡(luò)將每個(gè)樣本映射為一個(gè)概率值和四個(gè)坐標(biāo)值,概率值反應(yīng)這個(gè)anchorbox有物體的概率,四個(gè)坐標(biāo)值定義物體的位置用于回歸分支。最后將二分類(lèi)和坐標(biāo)回歸的損失統(tǒng)一起來(lái),作為RPN網(wǎng)絡(luò)的目標(biāo)訓(xùn)練。通過(guò)RPN得到的損失函數(shù)來(lái)調(diào)整建議框,獲取最后的預(yù)測(cè)框。損失函數(shù)為:其中:表示第i個(gè)anchor預(yù)測(cè)為真實(shí)標(biāo)簽的概率當(dāng)為正樣本時(shí)為1,當(dāng)為負(fù)樣本時(shí)為0表示預(yù)測(cè)第i個(gè)anchor的邊界框回歸參數(shù)表示第i個(gè)anchor對(duì)應(yīng)的GTBox的邊界框回歸參數(shù)表示一個(gè)mini-batch中的所有樣本數(shù)量256表示anchor位置的個(gè)數(shù)(不是anchor個(gè)數(shù))約2400為平衡參數(shù),具體為10(這里的256與2400是以ZF網(wǎng)絡(luò)生成的固定大小為256d的特征圖)由RPN得到預(yù)測(cè)框在根據(jù)概率值篩選后經(jīng)過(guò)類(lèi)似的標(biāo)記過(guò)程,將被傳入目標(biāo)檢測(cè)網(wǎng)絡(luò)??偟膮^(qū)域生成網(wǎng)絡(luò)見(jiàn)圖3-4圖3-4區(qū)域產(chǎn)生網(wǎng)絡(luò)結(jié)構(gòu)1.2.3目標(biāo)檢測(cè)網(wǎng)絡(luò)目標(biāo)檢測(cè)網(wǎng)絡(luò)主要實(shí)現(xiàn)對(duì)RPN網(wǎng)絡(luò)產(chǎn)生的區(qū)域進(jìn)行目標(biāo)分類(lèi)以及位置修正。主要分為感興趣區(qū)域(RolPooling)與檢測(cè)頭(BBoxHead,含有Denselayer以及上面兩個(gè)分支)。其中,感興趣區(qū)域核心思想便是候選框共享特征圖特征,并保持輸出大小一致。具體為候選框分為若干子區(qū)域,將每個(gè)區(qū)域?qū)?yīng)到輸入特征圖上,取每個(gè)區(qū)域內(nèi)的最大值作為該區(qū)域地輸出。在訓(xùn)練階段,檢測(cè)頭通
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同審批與歸檔標(biāo)準(zhǔn)化操作手冊(cè)
- 草原上的牧羊犬寫(xiě)物作文12篇范文
- 奇妙的自然之寫(xiě)物(7篇)
- 企業(yè)安全生產(chǎn)檢查及隱患處理模板
- 2026年圖市某單位數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)維工程師公開(kāi)招聘?jìng)淇碱}庫(kù)及參考答案詳解一套
- 2026年北京生命科學(xué)研究所NIBS王偉實(shí)驗(yàn)室招聘魚(yú)房管理員備考題庫(kù)含答案詳解
- 2026年成都市新都現(xiàn)代交通產(chǎn)業(yè)功能區(qū)管理委員會(huì)公開(kāi)招聘6名編外(聘用)人員的備考題庫(kù)及一套參考答案詳解
- 2026年惠州市博羅縣麻陂鎮(zhèn)衛(wèi)生院公開(kāi)招聘?jìng)淇碱}庫(kù)中醫(yī)科醫(yī)生備考題庫(kù)有答案詳解
- 2026年國(guó)投健康產(chǎn)業(yè)投資有限公司招聘?jìng)淇碱}庫(kù)及參考答案詳解1套
- 2025年江蘇宜公投藍(lán)藻資源開(kāi)發(fā)有限公司公開(kāi)招聘勞務(wù)派遣人員備考題庫(kù)及一套參考答案詳解
- 《人工智能基礎(chǔ)》課程標(biāo)準(zhǔn)
- 青少年無(wú)人機(jī)培訓(xùn)課件
- 2025成人高考全國(guó)統(tǒng)一考試專(zhuān)升本英語(yǔ)試題及答案
- 教師課程開(kāi)發(fā)能力提升專(zhuān)題培訓(xùn)心得體會(huì)
- 2025年山西省中考英語(yǔ)試卷真題(含答案詳解)
- TD/T 1036-2013土地復(fù)墾質(zhì)量控制標(biāo)準(zhǔn)
- 車(chē)位包銷(xiāo)合同協(xié)議模板
- 《FPC材料介紹》課件
- 員工轉(zhuǎn)崗協(xié)議書(shū)范本
- 四川省遂寧市射洪縣九年級(jí)2024-2025學(xué)年(上)期末化學(xué)試卷(含答案)
- 2025-2030中國(guó)器官芯片行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
評(píng)論
0/150
提交評(píng)論