YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程

上傳人：搞*** IP屬地：四川上傳時(shí)間：2025-05-16 格式：DOCX 頁數(shù)：4 大?。?6.93KB 積分：15 舉報(bào) 版權(quán)申訴

YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程_第2頁

YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程_第3頁

YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程_第4頁

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程目錄前言：解決問題：添加方法：結(jié)果：總結(jié)

前言：

作為當(dāng)前先進(jìn)的深度學(xué)習(xí)目標(biāo)檢測算法YOLOv5，已經(jīng)集合了大量的trick，但是在處理一些復(fù)雜背景問題的時(shí)候，還是容易出現(xiàn)錯漏檢的問題。此后的系列文章，將重點(diǎn)對YOLOv5的如何改進(jìn)進(jìn)行詳細(xì)的介紹，目的是為了給那些搞科研的同學(xué)需要創(chuàng)新點(diǎn)或者搞工程項(xiàng)目的朋友需要達(dá)到更好的效果提供自己的微薄幫助和參考。

解決問題：

加入SE通道注意力機(jī)制，可以讓網(wǎng)絡(luò)更加關(guān)注待檢測目標(biāo)，提高檢測效果

SE模塊的原理和結(jié)構(gòu)

添加方法：

第一步：確定添加的位置，作為即插即用的注意力模塊，可以添加到Y(jié)OLOv5網(wǎng)絡(luò)中的任何地方。本文以添加進(jìn)C3模塊中為例。

第二步：common.py構(gòu)建融入se模塊的C3,與原C3模塊不同的是，該模塊中的bottleneck中融入se模塊。這樣添加主要為了更好的做實(shí)驗(yàn)。

classseC3(nn.Module):

#CSPBottleneckwith3convolutions

def__init__(self,c1,c2,n=1,shortcut=True,g=1,e=0.5):#ch_in,ch_out,number,shortcut,groups,expansion

super(seC3,self).__init__()

c_=int(c2*e)#hiddenchannels

self.cv1=Conv(c1,c_,1,1)

self.cv2=Conv(c1,c_,1,1)

self.cv3=Conv(2*c_,c2,1)#act=FReLU(c2)

self.m=nn.Sequential(*[seBottleneck(c_,c_,shortcut,g,e=1.0)for_inrange(n)])

#self.m=nn.Sequential(*[CrossConv(c_,c_,3,1,g,1.0,shortcut)for_inrange(n)])

defforward(self,x):

returnself.cv3(torch.cat((self.m(self.cv1(x)),self.cv2(x)),dim=1))

classseBottleneck(nn.Module):

#Standardbottleneck

def__init__(self,c1,c2,shortcut=True,g=1,e=0.5):#ch_in,ch_out,shortcut,groups,expansion

super(seBottleneck,self).__init__()

c_=int(c2*e)#hiddenchannels

self.cv1=Conv(c1,c_,1,1)

self.cv2=Conv(c_,c2,3,1,g=g)

self.add=shortcutandc1==c2

self.avgpool=nn.AdaptiveAvgPool2d(1)

self.l1=nn.Linear(c1,c1//4,bias=False)

self.relu=nn.ReLU(inplace=True)

self.l2=nn.Linear(c1//4,c1,bias=False)

self.sig=nn.Sigmoid()

defforward(self,x):

x=self.cv1(x)

b,c,_,_=x.size()

y=self.avgpool(x).view(b,c)

y=self.l1(y)

y=self.relu(y)

y=self.l2(y)

y=self.sig(y)

y=y.view(b,c,1,1)

x=x*y.expand_as(x)

returnx+self.cv2(x)ifself.addelseself.cv2(self.cv1(x))

第三步：yolo.py中注冊我們進(jìn)行修改的seC3

ifmin[Conv,GhostConv,Bottleneck,Bottleneck_cot,TransformerC3,GhostBottleneck,SPP,DWConv,MixConv2d,Focus,CrossConv,BottleneckCSP,

C3,seC3]:

c1,c2=ch[f],args[0]

ifc2!=no:#ifnotoutput

c2=make_divisible(c2*gw,8)

args=[c1,c2,*args[1:]]

ifmin[BottleneckCSP,seC3]:

args.insert(2,n)#numberofrepeats

n=1

第四步：修改yaml文件，本文以修改主干特征提取網(wǎng)絡(luò)為例，將原C3模塊改為seC3即可。

第五步：將train.py中改為本文的yaml文件即可，開始訓(xùn)練。

結(jié)果：

本人在多個數(shù)據(jù)集上做了大量實(shí)驗(yàn)，針對不同的數(shù)據(jù)集效果不同，同一個數(shù)據(jù)集的不同添加位置方法也是有差異，需要大

人人文庫> 全部分類> 辦公材料 > 辦公文檔

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程

文檔簡介

溫馨提示

最新文檔

評論

YOLOv5改進(jìn)之添加SE注意力機(jī)制的詳細(xì)過程

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔