版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
面向玉米果穗表面缺陷檢測(cè)的YOLOv5s算法改進(jìn)策略摘要:針對(duì)現(xiàn)有的玉米果穗缺陷檢測(cè)人工肉眼識(shí)別效率低和工業(yè)相機(jī)自動(dòng)檢測(cè)目標(biāo)識(shí)別效果欠佳等目標(biāo)檢測(cè)問(wèn)題,提出了一種基于YOLOv5s算法改進(jìn)策略。首先,通過(guò)第三方庫(kù)Imgaug對(duì)圖像進(jìn)行處理和增強(qiáng),并采用數(shù)據(jù)擴(kuò)充方法得到自建的玉米果穗數(shù)據(jù)集3600幅;其次,采用MBConv模塊替換原網(wǎng)絡(luò)中的部分CBS模塊并加入ASPP結(jié)構(gòu),在保持網(wǎng)絡(luò)特征提取能力的前提下降低模型的參數(shù)量和計(jì)算量;再次,為了提高淺層信息利用率,基于BiFPN結(jié)構(gòu)設(shè)計(jì)了一種ZQ-BiFPN特征融合結(jié)構(gòu),將其引入Neck頸部網(wǎng)絡(luò),并在每個(gè)綜合卷積模塊(C3)后添加CBAM來(lái)提高模型對(duì)于小目標(biāo)特征的關(guān)注度,提高算法的精準(zhǔn)識(shí)別能力;最后,引入DecoupledHead解耦頭結(jié)構(gòu)明確分類和回歸任務(wù),提高檢測(cè)速度。相較于YOLOv5s以及其他如SSD、YOLO其他系列等常用目標(biāo)檢測(cè)模型以查準(zhǔn)率P、召回率R、均值平均精度mAP和檢測(cè)速度FPS為評(píng)價(jià)指標(biāo)進(jìn)行消融和對(duì)比實(shí)驗(yàn)。結(jié)果表明:本文所提的YOLOv5s_YM算法在自制玉米數(shù)據(jù)集上做目標(biāo)檢測(cè),P、R、mAP等分別相比于原算法分別提高9.32、6.57、13個(gè)百分點(diǎn),F(xiàn)PS略有降低。因此,YOLOv5s_YM算法在滿足檢測(cè)精度的同時(shí),具備優(yōu)良的實(shí)時(shí)性檢測(cè)要求,為后期智能化玉米果穗加工生產(chǎn)線提供技術(shù)支持。0引言“民以食為天,食以安為先,安以質(zhì)為本,質(zhì)以誠(chéng)為根”,這句民謠想必早已深深刻在老百姓的觀念里,我國(guó)作為全球人口最多的國(guó)家,糧食安全問(wèn)題事關(guān)國(guó)運(yùn)民生。在我國(guó),南方水流多,氣候濕潤(rùn),主要農(nóng)作物以耐旱性不強(qiáng)的水稻為主;北方氣候較為干旱,以玉米、大豆、小麥等耐旱性強(qiáng)、產(chǎn)量較高的農(nóng)作物為主。根據(jù)國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù)顯示,2022年全國(guó)全年糧食總產(chǎn)量68653萬(wàn)噸,其中玉米產(chǎn)量占27720萬(wàn)噸,同比增長(zhǎng)1.7%,全國(guó)全年糧食種植總面積11833萬(wàn)公頃,其中玉米種植面積占比4307萬(wàn)公頃[1];大量種植的玉米在收獲過(guò)程需要?jiǎng)兤?、分揀、貯藏等工序,傳統(tǒng)的工作方式完全依靠種植者手工完成,效率極低,容易錯(cuò)過(guò)收獲窗口期;在工業(yè)和科技的驅(qū)動(dòng)下,隨著農(nóng)業(yè)機(jī)械化的普及,華北地區(qū)和東北地區(qū)的玉米種植在效率和產(chǎn)量上都實(shí)現(xiàn)了很大的提升[2]。玉米作物在收獲時(shí)有一個(gè)分揀的過(guò)程,去除劣質(zhì)作物,保留優(yōu)良玉米的過(guò)程,傳統(tǒng)主要以人工分揀為主,但是,工作量大、效率低、主觀性強(qiáng),因此,玉米等農(nóng)作物在線品質(zhì)檢測(cè)方法成為當(dāng)下的研究熱點(diǎn)。玉米表面缺陷是影響其品質(zhì)的重要因素之一,玉米的缺陷區(qū)域與正常玉米通常存在顏色差異。王銀敏等[3]提出一種基于圖像語(yǔ)義分割與亮度對(duì)比的蘋果表面缺陷識(shí)別方法,將RGB圖像轉(zhuǎn)換成HSV彩色圖像,對(duì)飽和度S分量作閾值分割及形態(tài)學(xué)處理,獲得蘋果圖像的特征與背景殘差模板,根據(jù)分離后的模板與R分量的背景分離圖,經(jīng)過(guò)H通道校正后,采用閾值分割法提取缺陷區(qū)域,結(jié)果表明這種方法可以在不再增加額外拍攝裝置的情況下取得較好的蘋果表面缺陷,但是基于閾值分割的缺陷區(qū)域識(shí)別自適應(yīng)能力不強(qiáng)。杜永忠等[4]根據(jù)被檢測(cè)物的缺陷邊緣較為明顯的特征,提出了一種基于Sobel與分?jǐn)?shù)階微分的邊緣檢測(cè)方法,適用于圣女果的細(xì)小缺陷的清晰識(shí)別。玉米果穗表面顆粒之間的縫隙顏色較為明顯,上述算法不適用于玉米果穗表面缺陷檢測(cè),國(guó)內(nèi)外目前對(duì)玉米果穗品質(zhì)檢驗(yàn)的研究屈指可數(shù),對(duì)玉米表面缺陷識(shí)別的研究近乎為零。近年來(lái),深度學(xué)習(xí)技術(shù)逐步滲透各個(gè)領(lǐng)域,如機(jī)械、醫(yī)療、金融、農(nóng)業(yè)等,圖像識(shí)別更是不甘落后,復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)模型不僅縮小了工作量,而且提高了檢測(cè)速度和準(zhǔn)確率[5]。卷積神經(jīng)網(wǎng)絡(luò)(CNN)[6]在農(nóng)作物檢測(cè)中已逐步興起,xie等[7]首先訓(xùn)練第1個(gè)ND(normal-defective)-CNN模型進(jìn)行二分類(正常圖像和所有其他缺陷圖像),緩解了數(shù)據(jù)不平衡的問(wèn)題。在訓(xùn)練好ND-CNN模型后,將輸出向量更改為6維向量來(lái)訓(xùn)練ID(interdefect)-CNN模型,使其適合于多類缺陷標(biāo)簽問(wèn)題。該模型在ND-CNN權(quán)重的基礎(chǔ)上使用缺陷圖像進(jìn)行微調(diào),從而減少了樣本量需求并節(jié)省了訓(xùn)練時(shí)間。王夢(mèng)妮等[8]為了提高茶葉嫩芽的檢測(cè)精度,提出了一種改進(jìn)的YOLOv5s網(wǎng)絡(luò)模型,該模型在優(yōu)化Backbone特征提取網(wǎng)絡(luò)中的空間金字塔池化結(jié)構(gòu)(SPPF)的基礎(chǔ)上,在Neck網(wǎng)絡(luò)中引入可加權(quán)重的雙向特征金字塔網(wǎng)絡(luò)(BiFPN);實(shí)驗(yàn)結(jié)果表明檢測(cè)P、R、mAP均有提升。龔惟新等[9]為實(shí)現(xiàn)對(duì)獼猴桃花朵的快速準(zhǔn)確檢測(cè),在YOLOv5s模型基礎(chǔ)上引入C3HB模塊和交叉注意力(CCA)模塊增強(qiáng)特征提取能力,結(jié)合類似自對(duì)抗訓(xùn)練的方法,在多種試驗(yàn)條件下作消融和對(duì)比實(shí)驗(yàn),結(jié)果表明改進(jìn)后的算法在保持輕量化的同時(shí)相比之前的算法從檢測(cè)速度(FPS,幀/s)、mAP0.5等方面均有提升。范天浩等[10]為改善金銀花采摘機(jī)器人的采摘檢測(cè)精度,在Neck層中用CARAFE上采樣模塊替換原始模型中的上采樣模塊,提高模型識(shí)別的精確度和平均精度,為了部署移動(dòng)端,用EfficientNet的主干網(wǎng)絡(luò)替換YOLOv5s的Backbone層,并加入SPPF特征融合模塊,降低模型的參數(shù)量和權(quán)重的大小,結(jié)果顯示與原始模型對(duì)比,計(jì)算量、參數(shù)量和權(quán)重均有降低,與當(dāng)前主流檢測(cè)模型對(duì)比,改進(jìn)算法的精確度和mAP均有提升。趙明巖等[11]為解決黑皮雞縱菌在土壤背景下辨識(shí)率低、相互遮擋等問(wèn)題,在YOLOv5s的主干網(wǎng)絡(luò)中融合RFBSE模塊,在頸部網(wǎng)絡(luò)中采用RFP結(jié)構(gòu),增強(qiáng)特征表達(dá)能力和加強(qiáng)局部信息與全局信息的融合的同時(shí)降低計(jì)算量和內(nèi)存開銷,實(shí)驗(yàn)表明改進(jìn)后對(duì)比原模型的mAP、P、R分別有2.7、3.8、3.9個(gè)百分點(diǎn)的提升。CONG等[12]在YOLOv3基礎(chǔ)上提出了一種輕量級(jí)的香菇檢測(cè)方法,采用GhostNet16作為主干網(wǎng)絡(luò)的輕量化策略,在Neck頸部網(wǎng)絡(luò)中設(shè)計(jì)了一種自適應(yīng)空間特征金字塔網(wǎng)絡(luò)(ASA-FPN)結(jié)構(gòu)提高檢測(cè)精度,訓(xùn)練mAP值達(dá)到97.03%。WANG等[13]提出一種DES-YOLO(detailsemanticsenhancement)網(wǎng)絡(luò)檢測(cè)草莓,利用點(diǎn)向卷積和擴(kuò)展卷積提取水平和垂直維度上的各種細(xì)節(jié)和語(yǔ)義特征來(lái)提高檢測(cè)性能,結(jié)果顯示mAP達(dá)到86.58%。李天華等[14]在YOLOv4的基礎(chǔ)上進(jìn)行算法優(yōu)化,實(shí)現(xiàn)了對(duì)復(fù)雜環(huán)境下對(duì)番茄的識(shí)別與定位,有效的解決了光照影響下的番茄目標(biāo)識(shí)別效率低等問(wèn)題,但是參數(shù)量和計(jì)算量過(guò)大,訓(xùn)練成本較高。薛月菊等[15]針對(duì)果園場(chǎng)景下光照的多樣性、芒果與樹葉顏色的高度相似性等問(wèn)題,提出了改進(jìn)YOLOv2檢測(cè)方法,但由于YOLOv2模型過(guò)大,訓(xùn)練過(guò)程和檢測(cè)速度不夠理想。本研究是在YOLOv5架構(gòu)基礎(chǔ)上,通過(guò)分析網(wǎng)絡(luò)模型,在此基礎(chǔ)上做出算法的改進(jìn)與優(yōu)化,提高網(wǎng)絡(luò)模型的缺陷檢測(cè)性能。通過(guò)該研究,能在自建玉米果穗缺陷數(shù)據(jù)集下提高玉米果穗缺陷檢測(cè)的精準(zhǔn)度和效率,為后續(xù)智能化玉米果穗加工生產(chǎn)線提供技術(shù)支持。1材料和數(shù)據(jù)1.1硬件設(shè)施a.圖像采集支架b.海康威視工業(yè)相機(jī)a.Imagecapturebracketb.Hikvisionindustrialcamera圖1采集裝置硬件設(shè)施Fig.1Acquisitiondevicehardwarefacilities圖像數(shù)據(jù)來(lái)源于網(wǎng)絡(luò)和自建數(shù)據(jù)集兩部分,兩部分的比例約為2:8。自建數(shù)據(jù)集的玉米果穗來(lái)源于河北省石家莊市某農(nóng)作物種植基地。采樣設(shè)備為??低昅V-CE100-10GC型工業(yè)相機(jī)(千兆網(wǎng)GigE接口、CMOS感光芯片)、16mm工業(yè)變焦鏡頭、模擬條形光源和計(jì)算機(jī)設(shè)備,采集裝置如圖1所示。圖像采集計(jì)算機(jī)參數(shù)為windows1064位系統(tǒng),計(jì)算機(jī)內(nèi)存為64GB,搭載Inter(R)Core(TM)i9-11900F@2.5GHz處理器,NVIDIAGeForceRTX3080顯卡,CUDA11.3。IDE為PyCharm2022,配置Python3.9.17,PyTorch深度學(xué)習(xí)框架,版本為1.11.0。1.2數(shù)據(jù)集制作玉米果穗樣本分為正常、缺粒、禿尖和病蟲害4種,如圖2所示。a.正常b.缺粒c.禿尖d.病蟲害a.normalb.lackgrainsc.baldtipd.disease圖2不同類別的玉米果穗圖像Fig.2Imagesofdifferenttypesofcornears利用已有硬件設(shè)施獲取150幅正常玉米果穗圖像樣本,由于病蟲害等3類玉米缺陷樣本較少,試驗(yàn)拍攝和網(wǎng)絡(luò)爬取僅采集了缺粒、禿尖、病蟲害的玉米圖像各75幅。每一種玉米樣本數(shù)量不均衡和數(shù)量較少均會(huì)影響整個(gè)訓(xùn)練過(guò)程的效果,可能會(huì)出現(xiàn)模型過(guò)擬合和泛化能力差等問(wèn)題,降低了模型魯棒性。為了在有限的數(shù)據(jù)下得到更好的模型訓(xùn)練效果,一般采用數(shù)據(jù)擴(kuò)充的方式對(duì)現(xiàn)有的圖像進(jìn)行增強(qiáng)操作。本次研究采用Python的第三方數(shù)據(jù)增強(qiáng)庫(kù)Imgaug并且結(jié)合OpenCV圖像算法完成對(duì)現(xiàn)有玉米數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)[16]。Imgaug數(shù)據(jù)增強(qiáng)庫(kù)包含Otsu、鏡像翻轉(zhuǎn)、增加噪聲等幾十種圖像變換函數(shù),本次研究采用了隨機(jī)翻轉(zhuǎn)、HSV對(duì)比度隨機(jī)變換、裁剪和隨機(jī)增加噪聲等10余種變換方式,如圖3所示。最終得到正常、禿尖、缺粒和病蟲害圖像各900幅;其中正常玉米數(shù)據(jù)集中每張圖像變換5張圖像,均為下列十余種變換中的隨機(jī)選擇,非正常玉米果穗數(shù)據(jù)集中的每張圖像均經(jīng)過(guò)下列11種變換,所有圖像擴(kuò)充完畢后調(diào)整圖像像素為1080×1080pixel。圖3數(shù)據(jù)增強(qiáng)的變換方法Fig.3Transformationmethodofdataenhancement將增強(qiáng)后的圖像進(jìn)行標(biāo)注標(biāo)簽,本次試驗(yàn)采用的是Python第三方標(biāo)注工具LabelImg對(duì)數(shù)據(jù)圖片進(jìn)行標(biāo)注,標(biāo)注的標(biāo)簽文件格式為YOLO系列專用txt格式。將采集到的圖像以8:1:1的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。2玉米果穗表面缺陷檢測(cè)方法2.1YOLOv5算法結(jié)構(gòu)YOLOv5是目標(biāo)檢測(cè)算法中的單階段(one-stage)方法,圖像數(shù)據(jù)在網(wǎng)絡(luò)上經(jīng)過(guò)一次前向傳播就能檢測(cè)出目標(biāo)所在位置和目標(biāo)類型,檢測(cè)速度較以往的兩階段算法快,適用于計(jì)算資源受限和輕裝設(shè)備應(yīng)用場(chǎng)景。YOLOv5算法一共有5個(gè)版本,根據(jù)模型所占空間大小排列,分別是YOLOv5n、YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,本研究根據(jù)現(xiàn)實(shí)需求,考慮到實(shí)時(shí)檢測(cè)和便捷部署方案,采用網(wǎng)絡(luò)架構(gòu)深度較淺和特征圖像寬度較小的YOLOv5s網(wǎng)絡(luò)結(jié)構(gòu)作為基礎(chǔ)研究結(jié)構(gòu)。YOLOv5s網(wǎng)絡(luò)結(jié)構(gòu)由輸入端Input、主干網(wǎng)絡(luò)Backbone、頸部特征融合網(wǎng)絡(luò)Neck和檢測(cè)頭Head四個(gè)部分組成。輸入端包含Mosaic數(shù)據(jù)增強(qiáng)、自適應(yīng)錨框計(jì)算以及自適應(yīng)圖片縮放;主干網(wǎng)絡(luò)包括Focus結(jié)構(gòu)和CSP結(jié)構(gòu);頸部網(wǎng)絡(luò)由特征金字塔網(wǎng)絡(luò)(FPN)和路徑聚合網(wǎng)絡(luò)(PAN)結(jié)構(gòu)組成;檢測(cè)頭部分采用CIou_Loss做Boundingbox的損失函數(shù)搭配加權(quán)非極大值抑制(NMS)函數(shù)[17]。YOLOv5算法是在YOLOv4的基礎(chǔ)上添加改進(jìn)思路,使其檢測(cè)速度和精確度都得到了極大的改進(jìn)與提升,YOLOv5s網(wǎng)絡(luò)的輸入端內(nèi)含有圖像預(yù)處理和圖像增強(qiáng)功能以及錨框生成機(jī)制優(yōu)化策略;其中,圖像增強(qiáng)和預(yù)處理功能是汲取ResNet-50、Mixup和CutMix等算法的優(yōu)勢(shì)而創(chuàng)新出的Mosaic數(shù)據(jù)增強(qiáng)方法;而自適應(yīng)錨框機(jī)制是在初始錨框的基礎(chǔ)上通過(guò)K-means聚類算法和遺傳算法優(yōu)化迭代后進(jìn)行舍取并反向迭代更新,返回最優(yōu)的anchors和類別中心。網(wǎng)絡(luò)的Backbone結(jié)構(gòu)則是在延續(xù)YOLOv4的CSP思想基礎(chǔ)上添加Focus結(jié)構(gòu),對(duì)輸入的原始圖像做先切片再卷積的二倍間隔下采樣,將圖像的寬度和高度信息轉(zhuǎn)移到通道上,完整保留信息,在極度降低對(duì)mAP值影響的同時(shí)減少網(wǎng)絡(luò)層數(shù)、參數(shù)量、運(yùn)算量和CUDA內(nèi)存,提高了前向傳播和反向傳播的速度;主干網(wǎng)絡(luò)中的SPPF結(jié)構(gòu)是YOLOv5s作者基于特征金字塔池化(SPP)提出的,相關(guān)資料顯示SPPF相較于SPP速度提高約2.5倍[18]。在Neck部分使用了FPN和PAN模塊[19],F(xiàn)PN旨在高維度語(yǔ)義信息向低維度傳遞,從而明確大目標(biāo),而PAN旨在低維度向高維度傳遞語(yǔ)義特征信息,從而明確小目標(biāo)特征;在PAN模塊進(jìn)行融合后,將YOLOv4中使用的常規(guī)CBL模塊替換成借鑒CSPnet設(shè)計(jì)的CSP_v5結(jié)構(gòu),加強(qiáng)網(wǎng)絡(luò)特征融合的能力。至于檢測(cè)頭部分與以往的目標(biāo)檢測(cè)算法相似,依舊采用分類損失、置信度損失和定位損失加權(quán)平衡的方式,并未發(fā)生較大的變化??傊琘OLOv5相比原YOLO系列采用了多尺度訓(xùn)練、EMA更新權(quán)重、amp混合精度訓(xùn)練和cosine學(xué)習(xí)率下降的優(yōu)化策略。本研究針對(duì)特定數(shù)據(jù)集對(duì)YOLOv5s算法做進(jìn)一步改進(jìn)研究。2.2Backbone網(wǎng)絡(luò)架構(gòu)優(yōu)化為了平衡后續(xù)研究中為了提高網(wǎng)絡(luò)模型提取圖像特征的檢測(cè)能力而增加的參數(shù)量和計(jì)算量問(wèn)題,本研究采用EfficientViT網(wǎng)絡(luò)架構(gòu)中的局部結(jié)構(gòu)替換YOLOv5s模型主干網(wǎng)絡(luò)中的Conv模塊,該網(wǎng)絡(luò)使用部分輕量化卷積操作提取圖像細(xì)節(jié)特征。EfficientViT結(jié)構(gòu)的邏輯原理如圖4所示,輸入640×640×3的三通道彩色圖,通過(guò)InputItem輸入模塊后,從左往右,特征圖順次通過(guò)4個(gè)階段提取特征,最后經(jīng)過(guò)SPPF結(jié)構(gòu)后輸出。在特征提取階段采用的是MBConv(MobileNetV3blockconvolution)模塊來(lái)提取每個(gè)數(shù)據(jù)集圖像的主要特征,MBConv采用深度可分離卷積(DWConv)和擴(kuò)張卷積旨在減少參數(shù)量和計(jì)算量,促使模型輕量化,并且MBConv結(jié)合了有利于捕捉數(shù)據(jù)通道間相關(guān)性的SENet(sequeeze-and-excitationnetworks)結(jié)構(gòu),提高了圖像對(duì)特征的表達(dá)能力,進(jìn)而提高網(wǎng)絡(luò)模型的訓(xùn)練效率,MBConv還具有通過(guò)調(diào)整超參數(shù)來(lái)實(shí)現(xiàn)不同模型設(shè)計(jì)的功能,可以根據(jù)具體任務(wù)選擇相應(yīng)的合適結(jié)構(gòu),MBConv結(jié)構(gòu)相比Conv結(jié)構(gòu)更加靈活、輕量。為應(yīng)對(duì)玉米果穗部分缺陷與果穗之間顏色紋理相近的問(wèn)題,在主干網(wǎng)絡(luò)架構(gòu)中尾部加入一種改進(jìn)的多支路特征融合結(jié)構(gòu)(MDC),在第三、四階段的MBConv后添加MDC結(jié)構(gòu)模塊,加強(qiáng)圖像與背景的分割力度,有利于提取圖像特征并進(jìn)行特征融合。MBConv模塊結(jié)構(gòu)如圖5所示,圖像數(shù)據(jù)先經(jīng)過(guò)1×1的卷積操作,降低輸入特征數(shù)據(jù)的通道數(shù),隨后,依次經(jīng)過(guò)DWConv層處理,最后通過(guò)SENet結(jié)構(gòu)層,提高網(wǎng)絡(luò)對(duì)檢測(cè)圖像目標(biāo)的注意力,之后,采用1×1卷積核將處理后的圖像恢復(fù)到處理之前的相同維數(shù)。將經(jīng)過(guò)上述一系列處理后的圖像和之前的DWConv圖像進(jìn)行數(shù)值相加,避免梯度消失的情況發(fā)生。DWConv卷積是一種特殊的輕量級(jí)卷積方法,它可以有效降低模型的計(jì)算量和參數(shù)量,提高模型的運(yùn)算速率。DWConv的主要思路是從深度卷積和逐點(diǎn)卷積兩個(gè)方面出發(fā),在深度卷積方面,輸入圖像的各個(gè)通道都與卷積核進(jìn)行卷積操作,生成相應(yīng)輸出通道,有助于捕捉特征數(shù)據(jù)中的空間信息;在逐點(diǎn)卷積方向中,采用1×1卷積核對(duì)深度卷積的輸出進(jìn)行操作,此步驟旨在將深度卷積結(jié)果進(jìn)行線性組合,從原理上減少計(jì)算量。在輸入端圖像的每個(gè)通道上分別應(yīng)用空間卷積核,改善了以往的共享卷積核策略,以較小程度降低準(zhǔn)確性為代價(jià)的同時(shí)提高效率。將上述單獨(dú)應(yīng)用空間卷積核的獨(dú)立卷積和逐點(diǎn)卷積聯(lián)合使用,有利于更好地提取圖像特征。圖4EfficientViT網(wǎng)絡(luò)架構(gòu)示意圖Fig.4EfficientViTnetworkarchitecturediagram圖5MBConv模塊示意圖Fig.5MBConvmodulediagramSE模塊在本質(zhì)上是一種可通過(guò)學(xué)習(xí)改變的注意力機(jī)制,可以提高網(wǎng)絡(luò)模型對(duì)輸入圖像的感興趣區(qū)域(ROI)的關(guān)注度。SE模塊的原理是首先將輸入圖像的特征壓縮成較小的一維張量,隨后,將此張量通過(guò)兩個(gè)全連接層生成權(quán)重向量,此權(quán)重向量就是輸入特征圖的加權(quán)平均向量,最后將這些權(quán)重參數(shù)與輸入特征相乘,構(gòu)建新的特征圖;這個(gè)權(quán)重實(shí)質(zhì)上是關(guān)鍵特征在圖像中的分布規(guī)律,使得算法更加關(guān)注重要的特征。SE模塊被應(yīng)用在MBConv模塊結(jié)構(gòu)的擴(kuò)張卷積之后,以至于進(jìn)一步提升模型的訓(xùn)練性能。假設(shè)SE模塊的特征圖像為,輸出為:(1)式中表示基于元素的乘法,兩個(gè)全連接層的激活函數(shù)分別是ReLU函數(shù)和Sigmoid函數(shù)。SE模塊在對(duì)特征圖像池化降維過(guò)程中保留了各通道的重要信息,通過(guò)自適應(yīng)調(diào)整算法,突出關(guān)鍵特征,從而提高網(wǎng)絡(luò)的特征提取能力。圖6MDC結(jié)構(gòu)示意圖Fig.6MDCstructurediagram由于玉米各缺陷與正常玉米的顏色紋理相近,YOLOv5s主干網(wǎng)絡(luò)和EfficientViT網(wǎng)絡(luò)都不能提取有效的特征信息。為了增強(qiáng)改進(jìn)YOLOv5s主干網(wǎng)絡(luò)對(duì)玉米果穗缺陷的特征提取能力,本研究根據(jù)膨脹卷積模塊的感受野優(yōu)勢(shì)[20],在此基礎(chǔ)上提出了一種改進(jìn)的MDC結(jié)構(gòu),如圖6所示。圖14YOLOv5s改進(jìn)前后檢測(cè)效果對(duì)比Fig.14ComparisonofdetectioneffectbeforeandafterYOLOv5simprovement3.3不同網(wǎng)絡(luò)對(duì)比試驗(yàn)結(jié)果分析在自建玉米果穗缺陷數(shù)據(jù)集上,將本文算法模型與當(dāng)前主流算法模型在相同條件下進(jìn)行對(duì)比試驗(yàn),分析不同算法的缺陷檢測(cè)性能,探究本次研究面向玉米果穗表面缺陷檢測(cè)的YOLOv5s改進(jìn)策略的優(yōu)勢(shì),選擇SSD,YOLOv4,YOLOv5(s,m,l,x),YOLOv7等7種主流目標(biāo)檢測(cè)網(wǎng)絡(luò)模型進(jìn)行對(duì)比試驗(yàn),試驗(yàn)對(duì)比指標(biāo)為模型參數(shù)量、計(jì)算量、FPS、mAP和權(quán)重大小5項(xiàng)。試驗(yàn)結(jié)果如表2所示。根據(jù)表2的試驗(yàn)結(jié)果可知,本次改進(jìn)算法相較于其他主流目標(biāo)檢測(cè)算法模型,在檢測(cè)精度和檢測(cè)速度上均有很大優(yōu)勢(shì),參數(shù)量降低為6.99×106個(gè),計(jì)算量為16GFLOPs,權(quán)重文件大小為14.04MB,平均精度值達(dá)到81.76%,檢測(cè)速度達(dá)到80幀/s,相較于原網(wǎng)絡(luò)、YOLOv5m、YOLOv5l、YOLOv5x、SSD、YOLOv4、YOLOv7,參數(shù)量降低0.02、13.89、39.16、79.2、4.14、-5.23、30.21兆個(gè),計(jì)算量降低-0.02、32.3、92.3
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年注冊(cè)安全工程師題庫(kù)300道帶答案(典型題)
- 2024年浙江傳媒學(xué)院馬克思主義基本原理概論期末考試題帶答案
- 2025恒豐銀行南京分行社會(huì)招聘29人參考題庫(kù)附答案
- 2026年縣鄉(xiāng)教師選調(diào)進(jìn)城考試《教育心理學(xué)》題庫(kù)(突破訓(xùn)練)
- 2026江西省江銅宏源銅業(yè)有限公司第二批次社會(huì)招聘2人考試備考題庫(kù)附答案
- 2026年企業(yè)人力資源管理師考試備考題庫(kù)【奪分金卷】
- 2025福建廈門清大海峽私募基金管理有限公司招聘1人參考題庫(kù)附答案
- 2026年二級(jí)建造師之二建水利水電實(shí)務(wù)考試題庫(kù)300道(綜合題)
- 2026年試驗(yàn)檢測(cè)師之交通工程考試題庫(kù)300道含答案(基礎(chǔ)題)
- 2025年合肥安徽潛晟城市運(yùn)營(yíng)管理有限公司公開招聘工作人員參考題庫(kù)附答案
- 知道智慧樹西方文論經(jīng)典導(dǎo)讀滿分測(cè)試答案
- 醫(yī)藥行業(yè)合規(guī)培訓(xùn)課件
- 水域事故緊急救援與處置預(yù)案
- 新能源汽車工程技術(shù)專業(yè)教學(xué)標(biāo)準(zhǔn)(高等職業(yè)教育本科)2025修訂
- 四川省成都市2023級(jí)高中畢業(yè)班摸底測(cè)試英語(yǔ)試題(含答案和音頻)
- 以歌為翼:中文歌曲在泰國(guó)小學(xué)漢語(yǔ)課堂的教學(xué)效能探究
- 2025-2030中國(guó)除濕干燥機(jī)行業(yè)應(yīng)用趨勢(shì)與需求規(guī)模預(yù)測(cè)報(bào)告
- 2025廣東高考物理試題(大題部分)+評(píng)析
- 2025年中國(guó)國(guó)際貨運(yùn)代理行業(yè)市場(chǎng)情況研究及競(jìng)爭(zhēng)格局分析報(bào)告
- 家庭教育概論 課件 第5章 親子關(guān)系:家庭教育的起點(diǎn)與結(jié)果
- 500千伏輸電線路工程項(xiàng)目管理實(shí)施規(guī)劃
評(píng)論
0/150
提交評(píng)論