YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程_第1頁
YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程_第2頁
YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程_第3頁
YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程目錄前言:解決問題:添加方法:結(jié)果:總結(jié)

前言:

作為當(dāng)前先進(jìn)的深度學(xué)習(xí)目標(biāo)檢測算法YOLOv5,已經(jīng)集合了大量的trick,但是在處理一些復(fù)雜背景問題的時(shí)候,還是容易出現(xiàn)錯漏檢的問題。此后的系列文章,將重點(diǎn)對YOLOv5的如何改進(jìn)進(jìn)行詳細(xì)的介紹,目的是為了給那些搞科研的同學(xué)需要創(chuàng)新點(diǎn)或者搞工程項(xiàng)目的朋友需要達(dá)到更好的效果提供自己的微薄幫助和參考。

解決問題:

加入SE通道注意力機(jī)制,可以讓網(wǎng)絡(luò)更加關(guān)注待檢測目標(biāo),提高檢測效果

SE模塊的原理和結(jié)構(gòu)

添加方法:

第一步:確定添加的位置,作為即插即用的注意力模塊,可以添加到Y(jié)OLOv5網(wǎng)絡(luò)中的任何地方。本文以添加進(jìn)C3模塊中為例。

第二步:common.py構(gòu)建融入se模塊的C3,與原C3模塊不同的是,該模塊中的bottleneck中融入se模塊。這樣添加主要為了更好的做實(shí)驗(yàn)。

classseC3(nn.Module):

#CSPBottleneckwith3convolutions

def__init__(self,c1,c2,n=1,shortcut=True,g=1,e=0.5):#ch_in,ch_out,number,shortcut,groups,expansion

super(seC3,self).__init__()

c_=int(c2*e)#hiddenchannels

self.cv1=Conv(c1,c_,1,1)

self.cv2=Conv(c1,c_,1,1)

self.cv3=Conv(2*c_,c2,1)#act=FReLU(c2)

self.m=nn.Sequential(*[seBottleneck(c_,c_,shortcut,g,e=1.0)for_inrange(n)])

#self.m=nn.Sequential(*[CrossConv(c_,c_,3,1,g,1.0,shortcut)for_inrange(n)])

defforward(self,x):

returnself.cv3(torch.cat((self.m(self.cv1(x)),self.cv2(x)),dim=1))

classseBottleneck(nn.Module):

#Standardbottleneck

def__init__(self,c1,c2,shortcut=True,g=1,e=0.5):#ch_in,ch_out,shortcut,groups,expansion

super(seBottleneck,self).__init__()

c_=int(c2*e)#hiddenchannels

self.cv1=Conv(c1,c_,1,1)

self.cv2=Conv(c_,c2,3,1,g=g)

self.add=shortcutandc1==c2

self.avgpool=nn.AdaptiveAvgPool2d(1)

self.l1=nn.Linear(c1,c1//4,bias=False)

self.relu=nn.ReLU(inplace=True)

self.l2=nn.Linear(c1//4,c1,bias=False)

self.sig=nn.Sigmoid()

defforward(self,x):

x=self.cv1(x)

b,c,_,_=x.size()

y=self.avgpool(x).view(b,c)

y=self.l1(y)

y=self.relu(y)

y=self.l2(y)

y=self.sig(y)

y=y.view(b,c,1,1)

x=x*y.expand_as(x)

returnx+self.cv2(x)ifself.addelseself.cv2(self.cv1(x))

第三步:yolo.py中注冊我們進(jìn)行修改的seC3

ifmin[Conv,GhostConv,Bottleneck,Bottleneck_cot,TransformerC3,GhostBottleneck,SPP,DWConv,MixConv2d,Focus,CrossConv,BottleneckCSP,

C3,seC3]:

c1,c2=ch[f],args[0]

ifc2!=no:#ifnotoutput

c2=make_divisible(c2*gw,8)

args=[c1,c2,*args[1:]]

ifmin[BottleneckCSP,seC3]:

args.insert(2,n)#numberofrepeats

n=1

第四步:修改yaml文件,本文以修改主干特征提取網(wǎng)絡(luò)為例,將原C3模塊改為seC3即可。

第五步:將train.py中改為本文的yaml文件即可,開始訓(xùn)練。

結(jié)果:

本人在多個數(shù)據(jù)集上做了大量實(shí)驗(yàn),針對不同的數(shù)據(jù)集效果不同,同一個數(shù)據(jù)集的不同添加位置方法也是有差異,需要大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論