版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第1章前言1.1研究背景及意義植物病蟲(chóng)害是威脅全球糧食安全以及農(nóng)業(yè)可持續(xù)發(fā)展的關(guān)鍵因素之一。根據(jù)聯(lián)合國(guó)糧農(nóng)組織(FAO)公布的數(shù)據(jù),在全球范圍內(nèi),每年因?yàn)椴∠x(chóng)害造成的農(nóng)作物產(chǎn)量損失高達(dá)20%至40%,對(duì)農(nóng)業(yè)生產(chǎn)造成了難以忽視的影響。而且病蟲(chóng)害的傳播具有隱蔽性和突發(fā)性的特點(diǎn),若未能及時(shí)發(fā)現(xiàn),并采取措施干預(yù),極易造成減產(chǎn)和絕收。因此,提升植物病蟲(chóng)害的識(shí)別準(zhǔn)確率和效率,已成為農(nóng)業(yè)研究以及智慧農(nóng)業(yè)發(fā)展的重要研究方向。在傳統(tǒng)的病蟲(chóng)害識(shí)別方法中,農(nóng)業(yè)工作者主要依靠肉眼觀察植物葉片、果實(shí)、莖稈等受害部位,根據(jù)癥狀進(jìn)行判斷,但是這些方法極其依靠從業(yè)者的經(jīng)驗(yàn)。而且面對(duì)大規(guī)模病蟲(chóng)害時(shí),識(shí)別效率低的問(wèn)題突出,難以大規(guī)模開(kāi)展工作。近年來(lái),隨著計(jì)算機(jī)視覺(jué)以及人工智能技術(shù)的發(fā)展,基于圖像的自動(dòng)化目標(biāo)檢測(cè)技術(shù)出現(xiàn),成為農(nóng)業(yè)智能化研究的熱點(diǎn)。借助無(wú)人機(jī)或智能攝像頭,農(nóng)作物圖像可以被實(shí)時(shí)采集,再由深度學(xué)習(xí)檢測(cè)模型進(jìn)行快速的病蟲(chóng)害的檢測(cè)與分類,顯著提高了檢測(cè)的效率和準(zhǔn)確率。目前,許多智能檢測(cè)系統(tǒng)已經(jīng)在智慧農(nóng)業(yè)領(lǐng)域得到了初步運(yùn)用。例如,在露天作物種植場(chǎng)地,配備識(shí)別系統(tǒng)的無(wú)人機(jī)可以快速掃描大面積農(nóng)田,及時(shí)發(fā)現(xiàn)潛在病害源;在溫室環(huán)境中,部署智能傳感器與智能識(shí)別系統(tǒng)的農(nóng)業(yè)機(jī)器人,可以動(dòng)態(tài)追蹤農(nóng)作物健康狀態(tài),幫助農(nóng)戶及時(shí)采取預(yù)防并控制措施。此外,病蟲(chóng)害識(shí)別系統(tǒng)還可與精準(zhǔn)噴灑農(nóng)藥系統(tǒng)相結(jié)合,可以實(shí)現(xiàn)農(nóng)藥的靶向施用,從而大幅度地減少農(nóng)藥浪費(fèi)和環(huán)境污染。隨著研究的不斷深入,病蟲(chóng)害識(shí)別技術(shù)正從傳統(tǒng)的人工觀察向智能化、自動(dòng)化方向邁進(jìn)。目前的研究重點(diǎn)主要有三個(gè)方面:一是提升識(shí)別準(zhǔn)確率;二是增強(qiáng)模型的泛化能力;三是優(yōu)化部署策略。當(dāng)前仍然存在一些難點(diǎn)亟待解決,例如,在復(fù)雜環(huán)境中如何保持高識(shí)別率,如何降低光照對(duì)識(shí)別結(jié)果的影響,以及如何開(kāi)發(fā)適用于嵌入式設(shè)備部署的輕量化模型。YOLO(YouOnlyLookOnce)是一種廣泛應(yīng)用于目標(biāo)檢測(cè)的深度學(xué)習(xí)算法,它采用端到端、一階段的檢測(cè)框架,具備較高的精度和推理速度。與傳統(tǒng)的目標(biāo)檢測(cè)方法,如基于滑動(dòng)窗口的R-CNN系列算法相比較,YOLO采用的端到端的檢測(cè)框架,通過(guò)單次前向傳播,完成對(duì)目標(biāo)的分類與定位,正因如此,YOLO在實(shí)際應(yīng)用中具有顯著優(yōu)勢(shì)。YOLO算法自提出以來(lái),版本持續(xù)更新,目前已迭代至YOLOv11版本,在檢測(cè)性能和泛化能力方面進(jìn)行了優(yōu)化。隨著智慧農(nóng)業(yè)的發(fā)展,YOLO在植物病蟲(chóng)害識(shí)別中的應(yīng)用逐漸增多,并取得了較好的效果。因此本次畢業(yè)設(shè)計(jì)選擇以YOLOv8為方法,對(duì)植物病蟲(chóng)害進(jìn)行檢測(cè),有利于提高植物病蟲(chóng)害檢測(cè)精度,從而為提高農(nóng)業(yè)生產(chǎn)服務(wù)。1.2國(guó)內(nèi)外研究現(xiàn)狀目前,植物病蟲(chóng)害識(shí)別技術(shù)主要可以分為以下三類:傳統(tǒng)檢測(cè)方法、基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法。1.2.1傳統(tǒng)植物病蟲(chóng)害檢測(cè)方法研究傳統(tǒng)病蟲(chóng)害檢測(cè)方法存在明顯局限,主要包括人工識(shí)別和實(shí)驗(yàn)室儀器分析兩類。人工識(shí)別需依賴經(jīng)驗(yàn)豐富的農(nóng)業(yè)專家實(shí)地觀察病斑形態(tài)、顏色變化、蟲(chóng)害特征等進(jìn)行判斷。該方法受限于個(gè)體經(jīng)驗(yàn),難以應(yīng)對(duì)新型或復(fù)雜病害,識(shí)別準(zhǔn)確性波動(dòng)較大。大規(guī)模數(shù)據(jù)下,人工方式耗時(shí)費(fèi)力,效率低,容易出錯(cuò),不適合快速響應(yīng)和推廣。實(shí)驗(yàn)室分析方法依靠顯微鏡、光譜儀等設(shè)備檢測(cè)病原或生理指標(biāo),精度更高,但儀器昂貴,部署復(fù)雜,不適合田間環(huán)境中的實(shí)時(shí)應(yīng)用。1.2.2基于機(jī)器學(xué)習(xí)算法的研究現(xiàn)狀隨著計(jì)算機(jī)技術(shù)的發(fā)展,研究者開(kāi)始使用計(jì)算機(jī)視覺(jué)技術(shù)來(lái)分析植物病蟲(chóng)害圖像,機(jī)器學(xué)習(xí)方法也逐漸引入,常見(jiàn)的機(jī)器學(xué)習(xí)方法如支持向量機(jī)(SVM)、K近鄰(KNN)、隨機(jī)森林(RF)等。這些方法依賴于人工設(shè)計(jì)的特征提取方式,如顏色特征、形態(tài)特征和紋理特征等。在數(shù)據(jù)量較小的情況下,通常能夠表現(xiàn)出較好的性能,不需要大量的數(shù)據(jù)支撐,對(duì)計(jì)算資源的需求也相對(duì)較低,可以在較為簡(jiǎn)單的硬件條件下實(shí)現(xiàn)。雖然傳統(tǒng)機(jī)器學(xué)習(xí)方法已在植物病蟲(chóng)害領(lǐng)域取得不錯(cuò)進(jìn)展,但是由于手工特征的表達(dá)能力有限,在復(fù)雜環(huán)境下識(shí)別精度仍然較低,當(dāng)面對(duì)大規(guī)模高維數(shù)據(jù)時(shí),傳統(tǒng)機(jī)器學(xué)習(xí)方法的訓(xùn)練和預(yù)測(cè)效率可能會(huì)受到限制,不能很好的應(yīng)用到實(shí)際場(chǎng)景中。1.2.3基于深度學(xué)習(xí)算法的研究現(xiàn)狀基于深度學(xué)習(xí)的檢測(cè)技術(shù)的快速發(fā)展為植物病蟲(chóng)害識(shí)別帶來(lái)了突破性的進(jìn)展。根據(jù)檢測(cè)階段的數(shù)量不同,目標(biāo)檢測(cè)模型主要有兩類,一類是以R-CNN、FastR-CNN和FasterR-CNN為代表的two-stage檢測(cè)算法,該類型算法首先需要生成候選區(qū)域,再對(duì)候選區(qū)域進(jìn)行識(shí)別。另一類是以SSD和YOLO系列為代表的one-stage目標(biāo)檢測(cè)算法,不需要生成候選幀,通過(guò)將邊界問(wèn)題轉(zhuǎn)換為回歸問(wèn)題,利用從網(wǎng)絡(luò)中提取特征來(lái)預(yù)測(cè)病變位置和類別,具有準(zhǔn)確率高、速度快、訓(xùn)練時(shí)間短、計(jì)算量小等特點(diǎn)。在國(guó)外,Mohantyetal.(2016)基于AlexNet和GoogleNet網(wǎng)絡(luò)架構(gòu),使用公開(kāi)的植物病害圖像數(shù)據(jù)集PlantVillage,成功實(shí)現(xiàn)了多種作物病害的分類識(shí)別,驗(yàn)證了深度學(xué)習(xí)方法在植物病害識(shí)別中的可行性。Argüesoetal.(2020)則進(jìn)一步基于元學(xué)習(xí)的遷移學(xué)習(xí)技術(shù),提高了小樣本數(shù)據(jù)集上的檢測(cè)精度。此外,一些研究者探索了多模態(tài)數(shù)據(jù)融合方法,如結(jié)合RGB圖像與近紅外圖像,以提升模型的識(shí)別能力和魯棒性(Emmi,L.etal.2021)。在國(guó)內(nèi),相關(guān)研究同樣取得了積極進(jìn)展。部分學(xué)者基于ResNet、DenseNet等深度網(wǎng)絡(luò),開(kāi)發(fā)了適用于本地作物(如水稻、小麥、蘋(píng)果等)病蟲(chóng)害檢測(cè)的模型;也有研究者引入了注意力機(jī)制、輕量化網(wǎng)絡(luò)設(shè)計(jì)等優(yōu)化策略(徐誠(chéng)極等,2019;鞠默然等,2020),以降低模型的計(jì)算復(fù)雜度,便于模型在邊緣設(shè)備上的部署。如馬超偉等(2024)提出了一種基于改進(jìn)YOLOv8的輕量化檢測(cè)方法。該方法以PP-LCNet替代YOLOv8原有骨干網(wǎng)絡(luò),并引入DepthwiseSeparableConvolution結(jié)構(gòu)以降低參數(shù)量。楊國(guó)鋒等(2022)提出了利用無(wú)人機(jī)遙感監(jiān)測(cè)作物病蟲(chóng)害。同時(shí),針對(duì)不同作物病害特點(diǎn),自建病害圖像數(shù)據(jù)集、提高數(shù)據(jù)多樣性和數(shù)據(jù)標(biāo)注質(zhì)量,也成為國(guó)內(nèi)研究的重要方向。如李小芹(2024)在基于改進(jìn)YOLOv8的櫻桃病菌孢子檢測(cè)系統(tǒng)研究中拍攝病菌的顯微鏡像,并根據(jù)不同病菌的復(fù)雜情況分類,自建數(shù)據(jù)集進(jìn)行創(chuàng)新性實(shí)驗(yàn)。在這些方法中,YOLO系列的目標(biāo)檢測(cè)算法,在保持高精度的同時(shí),實(shí)現(xiàn)實(shí)時(shí)檢測(cè),成為農(nóng)業(yè)領(lǐng)域目標(biāo)識(shí)別的研究熱點(diǎn)。從應(yīng)用效益維度分析,基于深度學(xué)習(xí)的檢測(cè)系統(tǒng)展現(xiàn)出顯著優(yōu)勢(shì):部署于移動(dòng)終端的輕量化模型使田間實(shí)時(shí)診斷成為可能,通過(guò)自動(dòng)化的識(shí)別植物病蟲(chóng)害系統(tǒng),快速有針對(duì)性地找到解決方案并采取有效措施,做到精準(zhǔn)施藥,減少農(nóng)藥使用范圍,降低環(huán)境污染,從源頭上減少病蟲(chóng)害對(duì)植被地危害。綜上所述,基于深度學(xué)習(xí)模型的植物病蟲(chóng)害檢測(cè)在提高農(nóng)業(yè)生產(chǎn)效率、保障糧食安全、減少環(huán)境污染等方面具有重要意義,是農(nóng)業(yè)現(xiàn)代化發(fā)展的重要支撐。1.3研究?jī)?nèi)容與研究路線1.3.1主要研究?jī)?nèi)容本研究的主要目標(biāo)是設(shè)計(jì)并實(shí)現(xiàn)一個(gè)基于YOLOv8的植物病蟲(chóng)害檢測(cè)算法,旨在通過(guò)YOLOv8模型的目標(biāo)檢測(cè)能力,自動(dòng)化識(shí)別和分類植物病蟲(chóng)害。本研究將植物病蟲(chóng)害分為兩大類:葉片病害和害蟲(chóng)蟲(chóng)害,并分別進(jìn)行研究。具體的研究?jī)?nèi)容如下:相關(guān)理論和技術(shù)基礎(chǔ)簡(jiǎn)單介紹研究中使用的相關(guān)理論與技術(shù),包括數(shù)據(jù)集的分析和增強(qiáng)技術(shù)、目標(biāo)檢測(cè)算法的核心CNN的原理、深度學(xué)習(xí)的目標(biāo)檢測(cè)算法的更新迭代歷程及各個(gè)版本的優(yōu)勢(shì)和缺點(diǎn)等方面?;赮OLOv8的植物病蟲(chóng)害檢測(cè)算法設(shè)計(jì)介紹YOLov8網(wǎng)絡(luò)結(jié)構(gòu)和原理,根據(jù)植物葉片病害和害蟲(chóng)蟲(chóng)害數(shù)據(jù)集的不同特點(diǎn)選擇合適的數(shù)據(jù)增強(qiáng)方法,建立檢測(cè)的算法模型。針對(duì)葉片病害的細(xì)節(jié)特征,將引入注意力機(jī)制,以增強(qiáng)模型對(duì)病斑細(xì)節(jié)的識(shí)別能力;而對(duì)于害蟲(chóng)蟲(chóng)害,考慮到害蟲(chóng)與植物背景的復(fù)雜性,模型將進(jìn)行特定的參數(shù)調(diào)整,以提升對(duì)小物體的檢測(cè)能力。對(duì)模型進(jìn)行多次調(diào)整優(yōu)化和訓(xùn)練,獲得最佳精度。實(shí)驗(yàn)設(shè)計(jì)與分析驗(yàn)證YOLOv8模型在植物病蟲(chóng)害檢測(cè)中的優(yōu)勢(shì),通過(guò)對(duì)比實(shí)驗(yàn)分析YOLOv8與其他主流目標(biāo)檢測(cè)模型在葉片病害和害蟲(chóng)蟲(chóng)害檢測(cè)中的表現(xiàn),并嘗試引入多個(gè)注意力機(jī)制模塊增強(qiáng)對(duì)小目標(biāo)的識(shí)別能力。對(duì)比指標(biāo)包括檢測(cè)精度、速度、模型大小等,以評(píng)估其在實(shí)際應(yīng)用中的效果。設(shè)計(jì)植物病蟲(chóng)害檢測(cè)系統(tǒng)基于上述模型設(shè)計(jì)一個(gè)簡(jiǎn)潔易操作的可視化系統(tǒng),可通過(guò)界面對(duì)病害葉片或害蟲(chóng)圖像進(jìn)行導(dǎo)入來(lái)檢測(cè)并顯示各目標(biāo)數(shù)量,并在系統(tǒng)接入了AI助手,實(shí)現(xiàn)智能診療。1.3.2研究方案本研究采用理論聯(lián)系與實(shí)踐相結(jié)合的研究方法,研究路線分為以下幾個(gè)主要階段: 第一,通過(guò)對(duì)植物病蟲(chóng)害檢測(cè)領(lǐng)域的研究進(jìn)行詳細(xì)閱讀,分析當(dāng)前傳統(tǒng)檢測(cè)方法與基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù)的優(yōu)缺點(diǎn),為后續(xù)的研究提供理論基礎(chǔ)和參考。第二,選擇合適的公開(kāi)數(shù)據(jù)集,并針對(duì)其中數(shù)量少的類別進(jìn)行數(shù)據(jù)爬取來(lái)適當(dāng)擴(kuò)充數(shù)據(jù)集,以針對(duì)性解決樣本數(shù)量差異大的問(wèn)題。同時(shí)應(yīng)用數(shù)據(jù)增強(qiáng)技術(shù)提高數(shù)據(jù)集的多樣性和訓(xùn)練效果。第三,在YOLOv8的基礎(chǔ)上,本研究將設(shè)計(jì)針對(duì)葉片病害和害蟲(chóng)蟲(chóng)害的檢測(cè)算法。先實(shí)現(xiàn)基礎(chǔ)版YOLOv8,評(píng)估精度,分析問(wèn)題。再利用YOLOv8的優(yōu)化模塊,如引入注意力機(jī)制、調(diào)整訓(xùn)練參數(shù)等,提升模型的識(shí)別能力。并通過(guò)與其他目標(biāo)檢測(cè)模型的對(duì)比實(shí)驗(yàn),評(píng)估在不同模型的性能表現(xiàn)。分析常見(jiàn)的評(píng)估指標(biāo),如精度、召回率、F1分?jǐn)?shù)等,全面分析YOLOv8在不同檢測(cè)任務(wù)中的優(yōu)勢(shì)和不足。最后,在訓(xùn)練好的模型的基礎(chǔ)上,實(shí)現(xiàn)一個(gè)基于YOLOv8的智能植物病蟲(chóng)害檢測(cè)系統(tǒng),助力智慧農(nóng)業(yè)。技術(shù)路線見(jiàn)圖1-1所示。圖1-1研究路線圖第2章相關(guān)理論和技術(shù)基礎(chǔ)簡(jiǎn)介2.1數(shù)據(jù)增強(qiáng)技術(shù)在科研領(lǐng)域,獲取的圖像通常需采用通用圖像處理算法進(jìn)行預(yù)處理。數(shù)據(jù)增強(qiáng)是一項(xiàng)計(jì)算機(jī)視覺(jué)與目標(biāo)檢測(cè)中的關(guān)鍵技術(shù),它在醫(yī)學(xué)影像分析、安防監(jiān)控、無(wú)人機(jī)圖像分析以及智能導(dǎo)航等多個(gè)領(lǐng)域都發(fā)揮著重要作用。圖像增強(qiáng)是數(shù)據(jù)增強(qiáng)中的一種具體技術(shù),主要是通過(guò)算法和技術(shù)手段來(lái)提升圖像的視覺(jué)質(zhì)量和突出特定特征。它可以通過(guò)突出圖像中的細(xì)節(jié),或者調(diào)整圖像的亮度、對(duì)比度、色彩平衡等參數(shù),來(lái)提高圖像的可讀性和信息提取效率,讓圖像更適合人眼觀察,或者滿足后續(xù)圖像分析與處理的需求。在實(shí)際應(yīng)用中,不少研究者都采用了這種方法,例如劉麗(2024)對(duì)蘋(píng)果病害數(shù)據(jù)進(jìn)行7倍增強(qiáng),這樣做能夠減少模型對(duì)特定特征的依賴,從而有效防止模型出現(xiàn)過(guò)擬合的情況,楊堃(2024)為了便于檢測(cè)實(shí)驗(yàn)樣本中的小目標(biāo),采用Mosaic9數(shù)據(jù)增強(qiáng)方法。常見(jiàn)數(shù)據(jù)增強(qiáng)技術(shù)包含:幾何變換:鏡像翻轉(zhuǎn)、多角度旋轉(zhuǎn)、區(qū)域裁剪、像素位移復(fù)合生成:隨機(jī)拼接(Mosaic)、圖像混合(Mixup)色彩空間調(diào)整:色相偏移、飽和度調(diào)節(jié)、明度修正、通道分離重組。通過(guò)系統(tǒng)性的數(shù)據(jù)增強(qiáng),模型可學(xué)習(xí)多維視角與形變特征,顯著提升泛化能力與魯棒性。該技術(shù)還能有效擴(kuò)充數(shù)據(jù)樣本量,降低原始數(shù)據(jù)采集成本。2.2目標(biāo)檢測(cè)概述目標(biāo)檢測(cè)是目前的核心技術(shù),它屬于計(jì)算機(jī)視覺(jué)領(lǐng)域,主要解決物體定位問(wèn)題,還要識(shí)別圖像中的物體,和普通圖像分類不同,目標(biāo)檢測(cè)需要判斷物體種類,還要用矩形框標(biāo)出位置,比如一張農(nóng)田照片,圖像分類只能告訴結(jié)果,會(huì)說(shuō)“圖里有病蟲(chóng)害”,目標(biāo)檢測(cè)更精確,它能找到病蟲(chóng)害葉片,標(biāo)注“這片葉子感染銹病”,還能指出“那片區(qū)域有蚜蟲(chóng)”。早期目標(biāo)檢測(cè)依賴人工設(shè)計(jì)特征,比如使用顏色特征,或紋理特征,或形狀模板,再配合滑動(dòng)窗口,遍歷整張圖像,這類方法速度慢,容易受環(huán)境干擾,換個(gè)角度可能失效,光照變化也會(huì)影響,2012年后深度學(xué)習(xí)成為主流,目標(biāo)檢測(cè)進(jìn)入兩階段時(shí)代(邵延華等,2022),典型算法是R-CNN系列,它將目標(biāo)檢測(cè)分為多個(gè)階段,首先生成候選框,候選框可能包含目標(biāo),然后回歸精確坐標(biāo),再進(jìn)行目標(biāo)分類。由于two-stage算法中各個(gè)階段所使用的模塊需要分別訓(xùn)練,尤其是在候選框生成階段,需要進(jìn)行大量的區(qū)域搜索與篩選,這種方法雖然精度高,但是步驟繁瑣,計(jì)算代價(jià)較高,導(dǎo)致整體檢測(cè)速度較慢,難以實(shí)時(shí)處理。隨著技術(shù)發(fā)展,單階段檢測(cè)算法興起。YOLO系列是典型代表,它將目標(biāo)檢測(cè)轉(zhuǎn)化為回歸問(wèn)題,它采用端到端的設(shè)計(jì)思路,將候選框預(yù)測(cè)與目標(biāo)分類融合為一個(gè)統(tǒng)一的過(guò)程,直接在圖像網(wǎng)格中預(yù)測(cè)物體位置和類別,省去候選區(qū)域提取步驟,檢測(cè)速度和實(shí)時(shí)性能大幅提升,但是可能會(huì)損失精度。YOLOv1到Y(jié)OLOv8,算法不斷優(yōu)化,改進(jìn)了網(wǎng)絡(luò)結(jié)構(gòu),調(diào)整了損失函數(shù),完善了多尺度預(yù)測(cè)機(jī)制,平衡了速度和精度,YOLOv8有改進(jìn),引入了自適應(yīng)錨框計(jì)算,使用了高效特征融合模塊,更適應(yīng)復(fù)雜農(nóng)業(yè)場(chǎng)景,能應(yīng)對(duì)病蟲(chóng)害目標(biāo)多樣性。目標(biāo)檢測(cè)有很多核心技術(shù),包括錨框設(shè)計(jì),還有非極大值抑制(NMS),以及損失函數(shù)優(yōu)化。錨框是預(yù)設(shè)參考框,它幫助模型定位目標(biāo),非極大值抑制過(guò)濾冗余框,確保每個(gè)物體只留一個(gè)預(yù)測(cè)框,損失函數(shù)指導(dǎo)模型訓(xùn)練,調(diào)整參數(shù),讓預(yù)測(cè)框接近真實(shí)值,植物病蟲(chóng)害圖像有目標(biāo)小、分布密集等特點(diǎn),算法需融合多尺度特征,增強(qiáng)對(duì)小目標(biāo)的敏感度。YOLOv8損失函數(shù)的詳解見(jiàn)章節(jié)3.3。農(nóng)業(yè)場(chǎng)景中,目標(biāo)檢測(cè)技術(shù)很有用,它能精準(zhǔn)識(shí)別病蟲(chóng)害,例如,模型可以分析葉片圖像,它能標(biāo)記多個(gè)病斑區(qū)域,還能區(qū)分不同病害類型,這種強(qiáng)大的檢測(cè)能力,對(duì)于農(nóng)業(yè)生產(chǎn)有重要價(jià)值,它一方面能實(shí)現(xiàn)早期預(yù)警,另一方面還能幫助精準(zhǔn)施藥,而且田間環(huán)境很復(fù)雜,算法要克服光照變化,還要處理枝葉遮擋問(wèn)題,這樣才能保證檢測(cè)結(jié)果的穩(wěn)定可靠。2.3卷積神經(jīng)網(wǎng)絡(luò)圖2-1RNN架構(gòu)示意圖(引用自CSDN)卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為一種強(qiáng)大的深度學(xué)習(xí)模型,以其出色的圖像處理能力而聞名,其靈感來(lái)源于生物學(xué)家提出的視覺(jué)皮層感受野機(jī)制。本研究中使用的YOLO是一種卷積神經(jīng)網(wǎng)絡(luò)。相較于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)能夠更好的提取特征,同時(shí)還能減少模型參數(shù)。卷積神經(jīng)網(wǎng)絡(luò)通常由輸入層、卷積層、激活函數(shù)、池化層、全連接層和輸出層構(gòu)成,如圖2-1所示。2.3.1卷積層卷積神經(jīng)網(wǎng)絡(luò)(CNN)的核心結(jié)構(gòu)是卷積層,該層負(fù)責(zé)通過(guò)卷積運(yùn)算精確地提取輸入數(shù)據(jù)的顯著特征。卷積操作就是使用一個(gè)滑動(dòng)窗口以一定步長(zhǎng)在圖像上滑動(dòng),并對(duì)窗口內(nèi)的特征進(jìn)行加權(quán)求和操作,從而得到一個(gè)新的輸出,如圖2-2所示。這一步驟的目的是為了生成特征圖,從而提取局部特征,揭示輸入數(shù)據(jù)的內(nèi)在模式或結(jié)構(gòu)。圖2-2卷積操作過(guò)程圖神經(jīng)網(wǎng)絡(luò)中使用了卷積層的優(yōu)點(diǎn)主要有兩個(gè)方面。一是減少網(wǎng)絡(luò)參數(shù),卷積核在對(duì)一個(gè)輸入的不同區(qū)域進(jìn)行卷積運(yùn)算的時(shí)候,卷積核內(nèi)參數(shù)是固定的。因此可以看作是共享了權(quán)重和偏置,從而減少了網(wǎng)絡(luò)的參數(shù)量。二是更強(qiáng)的抽象能力。相較于人工設(shè)計(jì)的卷積濾波器,基于深度學(xué)習(xí)的卷積濾波器可以在訓(xùn)練中自己學(xué)習(xí)權(quán)重,能夠提取到更抽象的特征。YOLO中常用的卷積核有1×1和3×3兩種,1×1卷積核主要用于通道變換,減少模型參數(shù)和計(jì)算量,如C2f、C3、CSP模塊,3×3卷積核是最常用的基礎(chǔ)卷積,用于提取空間特征,有較好的感受野和卷積效果,如Conv、SPPF、GSConv等模塊。2.3.2激活函數(shù)因?yàn)榫矸e層、池化層和全連接層都進(jìn)行線性運(yùn)算,這樣無(wú)論網(wǎng)絡(luò)設(shè)計(jì)得有多深,都與單層線性組合沒(méi)有區(qū)別,因此需要加入激活函數(shù),使網(wǎng)絡(luò)具備學(xué)習(xí)復(fù)雜映射關(guān)系的能力。目前常見(jiàn)的激活函數(shù)有Sigmoid、ReLU、Mish等。SiLU是YOLOv5與YOLOv8中的主要激活函數(shù),其表達(dá)式如式2-1所示:(2-1)SiLU的有點(diǎn)在于它相比ReLU更平滑,能保留負(fù)值,梯度更連續(xù),有助于模型收斂。YOLOv5和YOLOv8中的大多數(shù)卷積層(Conv、C2f等)默認(rèn)使用SiLU。2.3.3池化層池化層又名下采樣層,通常被插入在連續(xù)的卷積層之間,起著關(guān)鍵的作用。其主要功能是降維來(lái)減少整體的計(jì)算復(fù)雜度,同時(shí)這一過(guò)程也有助于防止模型在訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合現(xiàn)象。因?yàn)榫矸e輸出的特征圖中相鄰像素是幾乎一樣的,只有在目標(biāo)的邊緣部分像素變化明顯,如果可以去除這些冗余部分,就可以明顯的減少網(wǎng)絡(luò)參數(shù)量。池化層的作用就是降低輸出特征圖的維度從而達(dá)到減少網(wǎng)絡(luò)參數(shù),同時(shí)還能夠保留特征圖中最重要的信息。常見(jiàn)的池化操作包括最大池化和平均池化,它們分別選取局部區(qū)域的最大值或平均值作為該區(qū)域的代表,進(jìn)而生成新的、尺寸更小的特征圖。以最大池化為例,池化層會(huì)使用一個(gè)滑動(dòng)窗口以一定步長(zhǎng)在特征圖上滑動(dòng),并對(duì)每個(gè)窗口中的像素求最大值作為輸出。與卷積不同的是,池化層不包含任何參數(shù),因此不會(huì)影響模型大小。2.3.4全連接層在卷積神經(jīng)網(wǎng)絡(luò)的終端,全連接層擔(dān)任著至關(guān)重要的角色,它負(fù)責(zé)將之前所有層提取的特征信息整合并轉(zhuǎn)化為一維的特征向量。這一步驟之后,通常通過(guò)分類器對(duì)特征向量進(jìn)行處理,以實(shí)現(xiàn)分類任務(wù)或進(jìn)行其他預(yù)測(cè)工作。這種結(jié)構(gòu)確保了CNN能夠有效地將輸入數(shù)據(jù)映射到其對(duì)應(yīng)的輸出類別或預(yù)測(cè)值上。如圖2-3,在圖像分類任務(wù)中,全連接層的最后一層節(jié)點(diǎn)數(shù)量通常等于分類的類別數(shù)。圖2-3全連接層示意圖(引用自CSDN)2.4YOLO網(wǎng)絡(luò)概述YOLO主打速度快、部署簡(jiǎn)單。它的核心原理是把整張圖輸入網(wǎng)絡(luò)提取特征后劃分成網(wǎng)格,每個(gè)網(wǎng)格負(fù)責(zé)預(yù)測(cè)自己區(qū)域內(nèi)有沒(méi)有目標(biāo)。如果有,直接算出目標(biāo)的坐標(biāo)框和類別。這種“看一遍就全搞定”的方式,省掉傳統(tǒng)方法里反復(fù)找候選區(qū)域的步驟,檢測(cè)速度比兩階段算法快幾倍甚至幾十倍。YOLO天生適合需要實(shí)時(shí)處理的場(chǎng)景,包括目標(biāo)檢測(cè)、姿態(tài)估計(jì)、目標(biāo)追蹤等任務(wù)。比如監(jiān)控視頻里追蹤行人、自動(dòng)駕駛中識(shí)別車輛,或者農(nóng)業(yè)無(wú)人機(jī)邊飛邊掃描病蟲(chóng)害,它能在毫秒級(jí)時(shí)間內(nèi)處理一幀圖像,連拍設(shè)備也能流暢運(yùn)行。對(duì)硬件要求低,手機(jī)、樹(shù)莓派這類小型設(shè)備都能部署,在田間地頭用起來(lái)方便。算法原理上,YOLO把目標(biāo)檢測(cè)拆解成兩個(gè)任務(wù):找位置和認(rèn)類別。輸入一張圖,先通過(guò)卷積神經(jīng)網(wǎng)絡(luò)提取特征,然后在特征圖上畫(huà)網(wǎng)格。每個(gè)網(wǎng)格預(yù)測(cè)幾個(gè)邊界框(比如YOLOv3每個(gè)格點(diǎn)預(yù)測(cè)3個(gè)anchor框),框的位置用中心點(diǎn)坐標(biāo)、寬度高度表示,同時(shí)給出框內(nèi)物體的類別概率。最后用非極大值抑制(NMS)去掉重復(fù)的框,剩下最準(zhǔn)的結(jié)果。YOLO在植物病蟲(chóng)害場(chǎng)景中優(yōu)勢(shì)明顯,病斑和害蟲(chóng)體積通常很小,一片葉子上可能有幾十個(gè)目標(biāo),YOLO有多尺度預(yù)測(cè)機(jī)制,兼顧大小目標(biāo),淺層網(wǎng)絡(luò)抓取小病斑細(xì)節(jié),深層網(wǎng)絡(luò)識(shí)別整片葉子病變區(qū)域,模型能自適應(yīng)不同的光照條件,陰天葉片圖像能穩(wěn)定檢測(cè),強(qiáng)光下圖像也能穩(wěn)定檢測(cè),實(shí)際應(yīng)用中農(nóng)戶用手機(jī)拍照,算法立刻框出疑似病斑,標(biāo)出病害類型,直接指導(dǎo)打藥或剪枝。YOLO有局限性,它需要平衡精度和速度,新版模型通常更大,檢測(cè)速度會(huì)略微下降,但YOLOv8做了改進(jìn),它采用輕量化設(shè)計(jì),還優(yōu)化了參數(shù),精度依然保持,甚至在低算力設(shè)備上,也能達(dá)到每秒上百幀,這對(duì)田間監(jiān)測(cè)很重要,能實(shí)時(shí)發(fā)現(xiàn)病蟲(chóng)害。2.5評(píng)價(jià)指標(biāo)在目標(biāo)檢測(cè)算法中,通常使用以下指標(biāo):(1)交并集(IoU)。預(yù)測(cè)邊界框和實(shí)際邊界框之間的交集面積和并集面積之比,是衡量預(yù)測(cè)框和標(biāo)簽框重合程度的指標(biāo),其值越接近1代表預(yù)測(cè)結(jié)果越好,損失函數(shù)IOU_Loss的值就是1與IoU的差。(2)混淆矩陣。對(duì)于N個(gè)類別,混淆矩陣是一個(gè)N×N的矩陣,對(duì)角線上的數(shù)字代表被正確分類的樣本數(shù)量,非對(duì)角線上的數(shù)字代表被誤分類的數(shù)量,即混淆的情況。如表2-1所示。表2-1神經(jīng)網(wǎng)絡(luò)混淆矩陣預(yù)測(cè)類別1預(yù)測(cè)類別2預(yù)測(cè)類別N真實(shí)類別1TPFPFP真實(shí)類別2FNTPFP真實(shí)類別NFNFNTP目標(biāo)檢測(cè)任務(wù)中,每一個(gè)預(yù)測(cè)的目標(biāo)框在被歸類后,都可以落入混淆矩陣中一個(gè)位置。例如,如果模型將“蘋(píng)果葉病”識(shí)別為“葡萄白粉病”,則在(真實(shí)=蘋(píng)果葉病,預(yù)測(cè)=葡萄白粉病)的位置上加1,如果正確識(shí)別,就在對(duì)應(yīng)對(duì)角線位置加1。精確率(Precision)。用于衡量被模型識(shí)別為正樣本的預(yù)測(cè)中有多少是正確的,公式見(jiàn)式(2-2),TP為正確檢測(cè)到的目標(biāo)數(shù),F(xiàn)P為錯(cuò)誤檢測(cè)出的非目標(biāo)數(shù)量,高精確率表示誤報(bào)較少。(2-2)召回率(Recall)。召回率用于衡量所有真實(shí)目標(biāo)中被正確檢測(cè)出來(lái)的比例。FN表示漏檢的目標(biāo)數(shù),公式見(jiàn)式(2-3),高召回率說(shuō)明模型漏檢較少。(2-3)平均精確度(AP)。AP是Precision和Recall的綜合度量,常通過(guò)Precision-Recall曲線下的面積計(jì)算得到,反映了模型對(duì)某一類別的檢測(cè)性能。不同的IOU(交并比)閾值下可計(jì)算不同的AP,例如AP@0.5、AP@0.75。均值精確度(MAP)。MAP是對(duì)所有類別AP的平均值,是評(píng)價(jià)多類別目標(biāo)檢測(cè)模型整體性能的核心指標(biāo),例如MAP@0.5、MAP@0.75。F1分?jǐn)?shù)是精確率和召回率的調(diào)和平均值,它綜合了兩者之間的折衷關(guān)系,用于衡量模型的整體性能。F1分?jǐn)?shù)越高,表示模型的精確率和召回率都比較高,即模型的分類性能比較好。F1分?jǐn)?shù)的計(jì)算式如式(2-4)。(2-4)推理時(shí)間與檢測(cè)速度。通過(guò)衡量模型每張圖像的推理時(shí)間(InferenceTime)和幀率(FPS)來(lái)評(píng)價(jià)模型的速度性能。檢測(cè)速度快是YOLO系列模型的重要優(yōu)勢(shì)。模型大小和參數(shù)量。在模型實(shí)際部署場(chǎng)景中,模型的體積和參數(shù)量,會(huì)影響模型在邊緣設(shè)備或嵌入式設(shè)備上的運(yùn)行效率第3章基于YOLOv8的植物病蟲(chóng)害檢測(cè)算法設(shè)計(jì)3.1YOLOv8網(wǎng)絡(luò)結(jié)構(gòu)YOLOv8作為YOLO系列的第八代模型,由Ultralytics于2023年發(fā)布。YOLOv8在繼承YOLO系列端到端檢測(cè)優(yōu)勢(shì)的基礎(chǔ)上,進(jìn)一步優(yōu)化了模型結(jié)構(gòu)與推理流程,采用了新的特征提取模塊和更高效的解碼方式,提升了檢測(cè)精度與速度。圖3-1為YOLOv8模型網(wǎng)絡(luò)結(jié)構(gòu)體,模型總體上由三個(gè)部分構(gòu)成,分別是Backbone(骨干網(wǎng)絡(luò))、Neck(頸部結(jié)構(gòu))和Head(輸出檢測(cè)頭)。圖中左上角的紅綠藍(lán)三色方塊,代表輸入圖像,輸入圖像經(jīng)過(guò)Backbone提取特征,再經(jīng)過(guò)Neck進(jìn)行多尺度特征融合,最后Head完成目標(biāo)的分類與定位。圖3-1YOLOv8網(wǎng)絡(luò)結(jié)構(gòu)示意圖(引用自參考文獻(xiàn),馬超偉等,2024.)3.1.1Backbone在YOLOv8中圖像的默認(rèn)輸入大小為固定的640×640×3即640×640的RGB彩色圖像。左側(cè)第一列為YOLOv8的Backbone部分,主要由CBS模塊、C2f模塊以及下采樣操作構(gòu)成,它的主要作用是逐層提取圖像空間和語(yǔ)義特征。。CBS模塊包括Conv、BatchNorm和SiLU激活函數(shù),是YOLOv8中的基礎(chǔ)計(jì)算單元,也是YOLOv8與YOLOv5的主要不同之處之一,它采用了更加輕量化的卷積模塊,和新的激活函數(shù)。SiLU激活函數(shù)具有較好的平滑性和非線性表達(dá)能力,能更好地?cái)M合復(fù)雜模式,與YOLOv5所用的LeakyReLU或ReLU相比,SiLU在訓(xùn)練深度網(wǎng)絡(luò)中的表現(xiàn)也更加穩(wěn)定。C2f模塊是YOLOv8中的新模塊,替代了YOLOv5中的C3模塊,增加信息流通路,提高了梯度流動(dòng)性和特征表達(dá)能力。下采樣操作通常通過(guò)設(shè)置步長(zhǎng)(stride=2)的卷積實(shí)現(xiàn),用于將輸入特征圖的空間尺寸逐步減半,來(lái)提取更高級(jí)的語(yǔ)義信息,并降低計(jì)算負(fù)擔(dān)。SPPF位于骨干網(wǎng)絡(luò)的末尾,它改編自YOLOv5的SPP結(jié)構(gòu),主要由多個(gè)池化操作組成,能夠在不增加計(jì)算量的前提下,擴(kuò)展感受野、融合多尺度信息。3.1.2Neck如圖3-1,模型中間的兩列是YOLOv8的Neck部分,主要作用是對(duì)不同尺度的特征圖進(jìn)行融合,以便更好地檢測(cè)不同尺寸的目標(biāo)。YOLOv8中沿用了PAN結(jié)構(gòu),PAN的核心思想是通過(guò)自底向上和自頂向下的雙向路徑,將淺層特征的細(xì)節(jié)信息,與深層特征語(yǔ)義信息高效融合,提升模型對(duì)不同尺度目標(biāo)的檢測(cè)能力。它將特征從Backbone提取后進(jìn)行路徑聚合,通過(guò)Concat(特征拼接)、Upsample(上采樣)、C2f等模塊實(shí)現(xiàn)多尺度特征的融合,增強(qiáng)網(wǎng)絡(luò)對(duì)小目標(biāo)和大目標(biāo)的檢測(cè)能力。Concat的作用是將來(lái)自不同尺度的特征圖,在通道維度進(jìn)行拼接,從而融合高低層的信息;Upsample通過(guò)最近鄰插值等方法將小尺度的深層語(yǔ)義特征圖,還原到較大的空間尺寸,使其能夠與淺層特征結(jié)合。C2f則是進(jìn)一步提高多尺度檢測(cè)性能。3.1.3HeadHead部分為YOLO輸出層,共有三個(gè)尺度的輸出檢測(cè)頭(Detect),每個(gè)檢測(cè)頭輸出包含物體的類別概率、邊界框的中心坐標(biāo)和寬高的回歸偏移量,實(shí)現(xiàn)了對(duì)圖像中所有目標(biāo)的同時(shí)檢測(cè)與分類。Anchor-free在YOLOv8中,在檢測(cè)頭摒棄了傳統(tǒng)的Anchor-based方法。Anchor-based方法是對(duì)訓(xùn)練集中所有真實(shí)標(biāo)注框的寬高進(jìn)行聚類,提取數(shù)據(jù)集中最常見(jiàn)的目標(biāo)尺寸作為錨框模板,這使得其在特定數(shù)據(jù)集上表現(xiàn)較好,但面對(duì)極端尺度的數(shù)據(jù),就網(wǎng)絡(luò)就不易學(xué)習(xí)到,而且需要大量預(yù)設(shè)的錨框,匹配預(yù)測(cè)時(shí)計(jì)算量大。圖3-2Anchor-based與Anchor-free算法原理對(duì)比圖(引用自CSDN)因此轉(zhuǎn)而使用Anchor-free方法,如圖3-2所示,Anchor-free放棄了錨框的使用,而是在訓(xùn)練時(shí)直接學(xué)習(xí)框的形狀,根據(jù)學(xué)習(xí)到的目標(biāo)中心點(diǎn)到邊框距離,進(jìn)行邊界框直接回歸,本質(zhì)上是將目標(biāo)檢測(cè)轉(zhuǎn)換成了密集回歸問(wèn)題和二分類問(wèn)題,使得網(wǎng)絡(luò)對(duì)于目標(biāo)形狀有更好的表達(dá)能力,檢測(cè)更加靈活。Anchor-based模型中,每個(gè)位置預(yù)設(shè)多個(gè)尺寸和長(zhǎng)寬比的錨框,它需要一種確定性規(guī)則來(lái)決定哪些錨框與標(biāo)簽相匹配,因此就提出了靜態(tài)標(biāo)簽分配策略,靜態(tài)標(biāo)簽分配策略也慢慢改進(jìn)為動(dòng)態(tài)標(biāo)簽分配策略。動(dòng)態(tài)標(biāo)簽分配策略靜態(tài)的標(biāo)簽分配策略,通過(guò)固定規(guī)則,如IoU閾值,確定分配真實(shí)標(biāo)簽和預(yù)測(cè)框之間的匹配關(guān)系,當(dāng)預(yù)測(cè)框與真實(shí)框的IoU大于某個(gè)閾值時(shí),才認(rèn)為它們是匹配的,并且會(huì)為該預(yù)測(cè)框分配一個(gè)標(biāo)簽。靜態(tài)標(biāo)簽分配策略幾乎都是與Anchor-based方法綁定使用的。然而,這種靜態(tài)的標(biāo)簽分配方式在某些情況下會(huì)導(dǎo)致模型學(xué)習(xí)不充分,無(wú)法有效區(qū)分不同的目標(biāo)。為了解決這些問(wèn)題,動(dòng)態(tài)標(biāo)簽分配策略應(yīng)運(yùn)而生,它根據(jù)不同的訓(xùn)練情況,以及數(shù)據(jù)特征靈活調(diào)整標(biāo)簽分配方式,通過(guò)計(jì)算每個(gè)候選預(yù)測(cè)框與真實(shí)框之間的匹配成本,如IoU、類別損失、定位損失等數(shù)據(jù),構(gòu)建成本矩陣,并采用如SimOTA等優(yōu)化算法,從中選取匹配質(zhì)量最高的若干候選框作為正樣本。這種方法能充分利用好優(yōu)質(zhì)樣本,減少誤差提升精度,適用于anchor-free結(jié)構(gòu)。3.2模型版本的差異與選擇依據(jù)YOLOv8模型有五個(gè)版本,根據(jù)模型大小和計(jì)算的復(fù)雜程度劃分,分別是YOLOv8n、YOLOv8s、YOLOv8m、YOLOv8l還有YOLOv8x,其中,“n”表示nano(極?。ⅰ皊”表示small(小型)、“m”表示medium(中型)、“l(fā)”表示large(大型)、“x”表示x-large(超大型)。版本間有主要區(qū)別,區(qū)別在于模型深度,還有寬度不同,參數(shù)數(shù)量也不同,計(jì)算量也不同。簡(jiǎn)單來(lái)說(shuō),模型越大,參數(shù)越多,學(xué)習(xí)能力越強(qiáng),檢測(cè)精度可能更高,但更占用顯存,推理速度更慢,相反,模型越小,運(yùn)行更快,占用資源更少,但檢測(cè)精度會(huì)稍低一些。表3-1展示了各個(gè)模型版本的主要參數(shù)差異:表3-1YOLOv8各版本差異對(duì)比表模型版本參數(shù)量(M)FLOPs推理速度檢測(cè)精度YOLOv8n較少較低非??燧^低YOLOv8s適中適中較快中等YOLOv8m中等偏高中等偏高一般較高YOLOv8l較多偏高較慢高YOLOv8x非常多很高慢非常高在本文研究中,考慮到植物病蟲(chóng)害檢測(cè)需求,需要兼顧檢測(cè)速度和精度,同時(shí)要考慮到后續(xù)的算法部署,最終選擇了YOLOv8s訓(xùn)練,該版本推理速度快,也有較好的檢測(cè)效果,適合部署在生產(chǎn)現(xiàn)場(chǎng),適用于嵌入式設(shè)備,適合邊緣計(jì)算終端,資源有限環(huán)境也適用??傊?,模型的選擇需要在速度、精度和資源消耗之間做出平衡,YOLOv8s作為一種輕量化模型,能較好地滿足植物病蟲(chóng)害檢測(cè)任務(wù)的實(shí)際需求。3.3損失函數(shù)設(shè)計(jì)在YOLOv8中,損失函數(shù)主要由三部分組成,分別是分類損失(cls_loss)、定位損失(box_loss)和分布式回歸損失(dfl_loss)。分類損失是用來(lái)判斷模型有沒(méi)有把物體的類別分對(duì)??虻奈恢脫p失是用來(lái)看預(yù)測(cè)的框和真實(shí)框位置差得多不多。dfl損失則是讓框的回歸更加精細(xì),預(yù)測(cè)得更準(zhǔn)確。與之前版本不同,YOLOv8取消了單獨(dú)的“置信度損失”,也就是不再專門(mén)判斷“有沒(méi)有物體”,而是把這個(gè)信息合并到分類里面了,這樣整體模型結(jié)構(gòu)更簡(jiǎn)單,速度和效果也有所提升。定位損失是用于計(jì)算預(yù)測(cè)框和真實(shí)框之間的偏差,如IoU_Loss、GIoU_Loss或DIoU_Loss等損失函數(shù),這類損失函數(shù)不僅考慮預(yù)測(cè)框和真實(shí)框之間的重疊程度,還嘗試從幾何結(jié)構(gòu)出發(fā)進(jìn)一步優(yōu)化模型的回歸效果。在YOLOv8中使用的是CIoU,它不只是計(jì)算兩個(gè)框重疊多少,還考慮了中心點(diǎn)距離和長(zhǎng)寬比例差異,能讓預(yù)測(cè)框更快更準(zhǔn)地貼合目標(biāo)。是比GIoU、DIoU更先進(jìn)的版本。CIoU損失函數(shù)的定義見(jiàn)公式(3-1)。IoU為預(yù)測(cè)框何真實(shí)框的交并比,為預(yù)測(cè)框中心點(diǎn)
b
與真實(shí)框中心點(diǎn)之間的歐氏距離的平方。C為預(yù)測(cè)框和真實(shí)框的最小外包矩形的對(duì)角線長(zhǎng)度。為權(quán)重系數(shù),用于平衡寬高比的影響,見(jiàn)公式(3-2)。為衡量寬高比一致性的參數(shù)。W和h是預(yù)測(cè)框的寬度和高度,和是真實(shí)框的寬度和高度,見(jiàn)公式(3-3)。 (3-1)(3-2)(3-3)分類損失用于計(jì)算每個(gè)預(yù)測(cè)框的類別與真實(shí)類別之間的差異,通常使用交叉熵?fù)p失。在YOLOv8中使用的是對(duì)數(shù)二元交叉熵?fù)p失(BCE),見(jiàn)公式(3-4),其中y取值0或1,1代表屬于該類別,0表示不屬于,p為模型預(yù)測(cè)的概率。但是在YOLOv8中,與傳統(tǒng)的BCE損失函數(shù)不同的是,它引入了標(biāo)簽平滑策略,將y值的范圍擴(kuò)展為[0,1],提高了模型的泛化能力。它的原理是懲罰分類錯(cuò)誤的結(jié)果,正確的越準(zhǔn)分?jǐn)?shù)越高,錯(cuò)的越離譜懲罰越重,BCE本質(zhì)上是計(jì)算這個(gè)類別概率的預(yù)測(cè)和真實(shí)情況有多接近。BCE比普通的交叉熵更適合植物病害這類“多個(gè)類別獨(dú)立判斷”的情況,它能對(duì)每個(gè)類別都單獨(dú)評(píng)估,更靈活,結(jié)果更精細(xì)。(3-4)分布式回歸損失,這是YOLOv8特有的,引入的是一種叫做“分布式回歸”的機(jī)制,專門(mén)用來(lái)更精細(xì)地預(yù)測(cè)邊界框的位置。YOLOv8中使用DistributionFocalLoss,它比傳統(tǒng)的框回歸方式更精細(xì),不是直接預(yù)測(cè)一個(gè)具體數(shù)值,而是預(yù)測(cè)一個(gè)值的概率分布,從中取出最可能的位置,能提高對(duì)小目標(biāo)的檢測(cè)能力。3.4基于YOLOv8的植物病蟲(chóng)害檢測(cè)算法過(guò)程圖3-3算法流程圖算法流程圖如圖3-3所示,首先收集數(shù)據(jù),本文研究考慮到植物病害和蟲(chóng)害的不同特點(diǎn),故對(duì)數(shù)據(jù)集分開(kāi)收集,分別進(jìn)行訓(xùn)練。在構(gòu)建模型方面,搭建好訓(xùn)練環(huán)境,確定訓(xùn)練使用的框架版本。然后設(shè)置訓(xùn)練參數(shù)分,同時(shí)設(shè)置預(yù)處理圖像的基本參數(shù),并對(duì)載入的數(shù)據(jù)集圖片進(jìn)行馬賽克數(shù)據(jù)增強(qiáng)處理,以完成迭代訓(xùn)練前的基本準(zhǔn)備。并設(shè)置迭代訓(xùn)練的次數(shù)和早停機(jī)制。采用循環(huán)結(jié)構(gòu)進(jìn)行迭代訓(xùn)練,每一次訓(xùn)練包含向前計(jì)算、反向傳輸、更新權(quán)重信息等一系列操作;同時(shí),每完成一個(gè)epoch的訓(xùn)練,在驗(yàn)證集上測(cè)試本次的訓(xùn)練效果,并且保存所有類別的精度均值map、最優(yōu)權(quán)重信息等。若滿足早停條件(連續(xù)n個(gè)Epoch驗(yàn)證指標(biāo)未提升),則停止訓(xùn)練,進(jìn)行模型測(cè)試;若不滿足,則繼續(xù)訓(xùn)練。模型測(cè)試是在測(cè)試集上對(duì)訓(xùn)練好的模型進(jìn)行性能評(píng)估,并可視化測(cè)試結(jié)果。完成整個(gè)迭代訓(xùn)練后,以輸出的最優(yōu)模型權(quán)重文件作為最終權(quán)重。模型導(dǎo)出將PyTorch格式的最優(yōu)權(quán)重轉(zhuǎn)換為其他格式(如ONNX、TensorRT),以適應(yīng)不同部署環(huán)境。第4章算法實(shí)現(xiàn)與分析4.1實(shí)驗(yàn)環(huán)境本文選用AutoDL云服務(wù)器平臺(tái)對(duì)模型進(jìn)行訓(xùn)練,所租用云服務(wù)器的相關(guān)配置名稱及配置量如表4-1所示:表4-1實(shí)驗(yàn)環(huán)境配置表配置名稱配置量CPU14vCPUIntel(R)Xeon(R)Platinum8362@2.80GHzGPUNVIDIARTX3090(24GB)×1CUDA版本CUDA11.8內(nèi)存45GB操作系統(tǒng)Ubuntu20.04LTS(64位)編程語(yǔ)言Python3.8鏡像PyTorch2.0.04.2數(shù)據(jù)集4.2.1數(shù)據(jù)集介紹植物病蟲(chóng)害檢測(cè)數(shù)據(jù)集,是本文研究的工作基礎(chǔ),通常包括植物葉片、莖稈、害蟲(chóng)的圖像。與PASCALVOC和COCO這種大型的計(jì)算機(jī)視覺(jué)任務(wù)的數(shù)據(jù)集不同,目前植物病蟲(chóng)害領(lǐng)域還沒(méi)有如此龐大成體系的數(shù)據(jù)集,目前數(shù)據(jù)集主要來(lái)源于科研所和自行采集。目前植物病蟲(chóng)害檢測(cè)的論文中常用的數(shù)據(jù)集有Plant-Village、AIChallenge2018、PlantDoc、IP102等,這些數(shù)據(jù)集提供高質(zhì)量的圖像,但是部分并沒(méi)有包含詳細(xì)的標(biāo)注信息。本研究綜合考慮了數(shù)據(jù)的標(biāo)注質(zhì)量以及類別范圍,以及訓(xùn)練效果,決定分為病害和蟲(chóng)害數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。對(duì)于病害數(shù)據(jù)集,選擇PlantDoc數(shù)據(jù)集作為主要訓(xùn)練數(shù)據(jù)來(lái)源,因?yàn)镻lantDoc則更貼近真實(shí)環(huán)境,圖像包含自然背景和復(fù)雜光照,能更好地模擬實(shí)際農(nóng)田場(chǎng)景,而且有全面的標(biāo)注信息。并且對(duì)于PlantDoc數(shù)據(jù)集中數(shù)據(jù)量過(guò)少的類別,則從PlantVillage數(shù)據(jù)集中篩選出與PlantDoc中相同類別圖像數(shù)據(jù),進(jìn)行標(biāo)注,來(lái)對(duì)個(gè)別類別進(jìn)行數(shù)量擴(kuò)充與融合。最終整合后的數(shù)據(jù)集,包含了24個(gè)類別,涵蓋了葉斑病、白粉病、銹病等多種常見(jiàn)植物問(wèn)題,共9352張圖片。部分樣本如圖4-1所示。對(duì)于蟲(chóng)害數(shù)據(jù)集,則選擇IP102數(shù)據(jù)集,共18975張圖片,部分樣本如圖4-2所示。圖4-1病害數(shù)據(jù)集部分樣本圖4-2蟲(chóng)害數(shù)據(jù)集部分樣本4.2.2數(shù)據(jù)集格式本研究采用YOLO系列通用的數(shù)據(jù)標(biāo)注格式,即YOLO格式。其標(biāo)注文件為.txt文本文件,與圖像文件同名,內(nèi)容格式:<class_id><x_center><y_center><width><height>。坐標(biāo)信息均為歸一化后的相對(duì)坐標(biāo),其中class_id為整數(shù)類別索引,x_center、y_center為目標(biāo)框中心坐標(biāo),width、height為目標(biāo)框?qū)捀摺?.2.3數(shù)據(jù)增強(qiáng)觀察合并后的數(shù)據(jù)集各類別數(shù)量,依然存在不平衡的問(wèn)題,因此提出了一種基于定向數(shù)據(jù)增強(qiáng)的小樣本優(yōu)化方法。該方法通過(guò)Albumentations框架,通過(guò)水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)、隨機(jī)旋轉(zhuǎn)、亮度對(duì)比度調(diào)整、裁剪、仿射變換等方式,對(duì)原圖像進(jìn)行多種組合的增強(qiáng),變換后的效果如圖4-3所示。這些幾何變換會(huì)導(dǎo)致目標(biāo)在圖像中的位置發(fā)生改變,目標(biāo)框的位置也會(huì)隨之改變,為了保證模型訓(xùn)練時(shí)仍能正確學(xué)習(xí)目標(biāo)的位置,標(biāo)簽內(nèi)容也需要按照相同的變換規(guī)則進(jìn)行調(diào)整。增強(qiáng)前后的類別數(shù)量對(duì)比圖如圖4-4所示。將增強(qiáng)后的數(shù)據(jù)集按照7:2:1的比例,分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。圖4-3原圖5倍變換效果圖圖4-4幾何增強(qiáng)前后的類別數(shù)量對(duì)比圖Mosaic是一種圖像增強(qiáng)技術(shù),最早在YOLOv4算法里亮相。它的原理就像拼拼圖,把好幾張圖片拼合成一張全新的訓(xùn)練圖像。這樣一來(lái),計(jì)算機(jī)模型在訓(xùn)練時(shí),就能接觸到更復(fù)雜的畫(huà)面,不管是很小的物體、重疊的目標(biāo),還是靠近圖片邊緣的內(nèi)容,都能看得一清二楚。新圖像里豐富的細(xì)節(jié),能讓計(jì)算機(jī)更好地“學(xué)習(xí)”圖像特征。如圖4-5所示,Mosaic4是從訓(xùn)練圖片庫(kù)里隨機(jī)挑出四張,拼成一個(gè)2x2的網(wǎng)格圖,相當(dāng)于創(chuàng)造了一個(gè)全新的訓(xùn)練素材。這個(gè)方法確實(shí)能讓訓(xùn)練數(shù)據(jù)更豐富多樣,但因?yàn)橹挥昧怂膹垐D,生成的場(chǎng)景相對(duì)簡(jiǎn)單。而Mosaic9它一口氣拼接九張圖片,組成3x3的大圖像。這樣操作后,數(shù)據(jù)的復(fù)雜度和多樣性大大提升,計(jì)算機(jī)在訓(xùn)練時(shí),能更好地分辨復(fù)雜場(chǎng)景里的目標(biāo)和背景,訓(xùn)練出來(lái)的模型適應(yīng)性更強(qiáng),遇到不同情況都能穩(wěn)定發(fā)揮。但是因?yàn)樗鼒D像拼接量大,所以訓(xùn)練速度相比會(huì)更慢。在YOLOv8版本中,Mosaic作為默認(rèn)啟用的數(shù)據(jù)增強(qiáng)方式,在訓(xùn)練框架中保留了Mosaic4和Mosaic9,默認(rèn)開(kāi)啟Mosaic4,并采用動(dòng)態(tài)開(kāi)啟與關(guān)閉策略,即在訓(xùn)練前期,增強(qiáng)強(qiáng)度較大,Mosaic能有效提升模型對(duì)復(fù)雜目標(biāo)的識(shí)別能力,而在訓(xùn)練后期,為避免過(guò)擬合噪聲樣本,Mosaic將被自動(dòng)關(guān)閉,以保證模型能夠更貼近真實(shí)分布。圖4-5Mosaic4與Mosaic9效果圖(左圖為Mosaic4增強(qiáng),右圖為Mosaic9增強(qiáng))4.2.4數(shù)據(jù)集分析圖4-6展示了病害訓(xùn)練集中目標(biāo)框標(biāo)簽在位置與尺寸維度上的統(tǒng)計(jì)關(guān)系。從x和y的聯(lián)合分布圖可以看出,目標(biāo)大多集中在圖像的中心區(qū)域??磜idth和height的分布可以發(fā)現(xiàn),目標(biāo)框大多比較窄小,特別是寬度偏小的特別多,而高度相對(duì)略微分散一些,整體來(lái)看,目標(biāo)尺寸偏小,而且目標(biāo)形狀更加多樣。對(duì)角線上的直方圖顯示的是各變量單獨(dú)的分布情況,可以看出寬度高度大多較小,框中心點(diǎn)大多在畫(huà)面中部。總體來(lái)看,數(shù)據(jù)集中有大量的小目標(biāo),發(fā)布集中但是形狀差異較大。圖4-7展示了植物病害數(shù)據(jù)集中,所有目標(biāo)框在位置和尺寸上的統(tǒng)計(jì)分布情況。圖中每一列、每一行對(duì)應(yīng)一個(gè)變量,包括中心點(diǎn)的位置、以及框的寬度和高度。從圖中可以看出,大多數(shù)目標(biāo)的中心點(diǎn)(x,y)都集中在圖像的中間區(qū)域。在框的尺寸方面,width和height的分布表現(xiàn)出明顯的正相關(guān)關(guān)系,也就是說(shuō)目標(biāo)越寬的同時(shí)也越高,大多數(shù)目標(biāo)形狀接近正方形。寬度和高度的數(shù)值都集中在一個(gè)較小的范圍內(nèi),說(shuō)明目標(biāo)尺寸適中,很小或很大的目標(biāo)都比較少見(jiàn)。圖中的對(duì)角線部分是每個(gè)變量的直方圖,分別展示了中心位置和尺寸在整個(gè)數(shù)據(jù)集中的邊際分布情況,可以看出不管是位置還是大小,分布都比較集中,沒(méi)有特別偏離。圖4-6病害標(biāo)簽參數(shù)聯(lián)合分布可視化圖圖4-7蟲(chóng)害標(biāo)簽參數(shù)聯(lián)合分布可視化圖4.3模型訓(xùn)練和參數(shù)設(shè)置訓(xùn)練的參數(shù)包括以下幾個(gè)部分:Epoch指一個(gè)完整的訓(xùn)練循環(huán)涉及在整個(gè)數(shù)據(jù)集完整的執(zhí)行一次。選擇合適的epoch數(shù)量是平衡模型性能和計(jì)算成本的關(guān)鍵,本設(shè)計(jì)將其設(shè)置為200。batch_size指每一epoch中同時(shí)處理的樣本數(shù)量,增大batch_size能提升訓(xùn)練效率,GPU處理大量數(shù)據(jù)更有效,內(nèi)存利用率提高,梯度計(jì)算更快,參數(shù)更新加速,大batch_size還能降低方差,這是梯度計(jì)算的方差,本文選擇batch_size為16。imgsz指輸入到神經(jīng)網(wǎng)絡(luò)中的圖像尺寸。輸入圖像的大小會(huì)對(duì)模型的訓(xùn)練速度和檢測(cè)精度造成影響。要是把imgsz設(shè)得小一些,能加快模型的訓(xùn)練速度,這是因?yàn)樘幚硇D像所需的計(jì)算量更少,而且還能減少內(nèi)存消耗,讓網(wǎng)絡(luò)可以處理更多的圖像數(shù)據(jù)。不過(guò),較小的imgsz也會(huì)使檢測(cè)精度降低,原因在于處理小圖像時(shí),網(wǎng)絡(luò)可能會(huì)丟失一些重要特征,要是把imgsz設(shè)得大一些,雖然能夠提高檢測(cè)精度,畢竟處理大圖像可以保留更多的細(xì)節(jié)和特征,但這會(huì)導(dǎo)致訓(xùn)練速度變慢,內(nèi)存消耗也會(huì)增加。所以,在綜合考量訓(xùn)練速度、檢測(cè)精度以及內(nèi)存消耗等多方面因素后,本次實(shí)驗(yàn)把imgsz設(shè)為640。workers:通常是指在數(shù)據(jù)加載過(guò)程中,用于并行加載數(shù)據(jù)的線程數(shù)量。在深度學(xué)習(xí)中,數(shù)據(jù)集通常非常龐大,加載數(shù)據(jù)需要大量的時(shí)間和計(jì)算資源。為了提高數(shù)據(jù)加載的速度和效率,我們可以采用多線程并行加載數(shù)據(jù)的方式,通常情況下,增加workers的數(shù)量能夠加快數(shù)據(jù)加載的速度,但是也需要注意,如果設(shè)置的線程數(shù)過(guò)多,會(huì)消耗過(guò)多的計(jì)算機(jī)資源,進(jìn)而影響整個(gè)系統(tǒng)的性能。因此,在綜合考慮計(jì)算機(jī)資源、數(shù)據(jù)集大小還有計(jì)算性能等因素的情況之后,本次實(shí)驗(yàn)將workers為8。lr是學(xué)習(xí)率,在優(yōu)化算法中,用于控制模型參數(shù)的更新幅度。如果學(xué)習(xí)率的設(shè)得太高,參數(shù)更新時(shí)就容易出現(xiàn)過(guò)度變動(dòng),如果學(xué)習(xí)率設(shè)得太小,雖說(shuō)能讓模型慢慢逼近最優(yōu)點(diǎn),但訓(xùn)練過(guò)程會(huì)變得很緩慢,甚至可能被困在局部最小值里。在YOLOv8中,有兩個(gè)和學(xué)習(xí)率相關(guān)的重要參數(shù),分別是最初學(xué)習(xí)率lr0和最終學(xué)習(xí)率比例lrf,借助這兩個(gè)參數(shù),模型的學(xué)習(xí)率會(huì)在訓(xùn)練過(guò)程中逐漸降低,便于實(shí)現(xiàn)更精細(xì)的調(diào)整和優(yōu)化。例如當(dāng)把lr0設(shè)為0.01,lrf設(shè)為0.01時(shí),初始學(xué)習(xí)率就是0.01,經(jīng)過(guò)一段時(shí)間的訓(xùn)練后,學(xué)習(xí)率會(huì)慢慢降低到原來(lái)的1%,也就是0.0001。這種學(xué)習(xí)率衰減機(jī)制能讓模型在不同的訓(xùn)練階段采用合適的學(xué)習(xí)速度,有助于提升訓(xùn)練效果和模型性能。patience是用于早停機(jī)制的參數(shù),主要用于控制在驗(yàn)證集效果長(zhǎng)時(shí)間沒(méi)有提升的情況下,是否提前終止訓(xùn)練,避免浪費(fèi)時(shí)間。在本次實(shí)驗(yàn)中,設(shè)置的等待次數(shù)為30,也就是說(shuō),如果連續(xù)30輪訓(xùn)練后,模型指標(biāo)都沒(méi)有變得更好,就停止訓(xùn)練。這種方法既節(jié)省了計(jì)算資源,又能有效避免模型過(guò)擬合。具體參數(shù)設(shè)置見(jiàn)表4-2。表4-2模型參數(shù)參數(shù)名參數(shù)設(shè)置迭代次數(shù)(epochs)200輸入圖片大小(imgsz)640批次大小(batch_size)16初始學(xué)習(xí)率(lr0)0.01Workers8patience304.4植物病害實(shí)驗(yàn)結(jié)果及分析4.4.1對(duì)比試驗(yàn)為了驗(yàn)證YOLOv8模型的有效性,本實(shí)驗(yàn)選擇YOLOv3s、YOLOv5s、Yolov8s和YOLOv8s+Mosaic9模型在相同配置的實(shí)驗(yàn)環(huán)境下,利用相同數(shù)據(jù)集進(jìn)行對(duì)比試驗(yàn)。需要需要說(shuō)明的是,Mosaic4數(shù)據(jù)增強(qiáng)在YOLOv5s和YOLOv8s版本中默認(rèn)開(kāi)啟,YOLOv8s+Mosaic9則是將Mosaic4算法修改為Mosaic9進(jìn)行實(shí)驗(yàn)。并選擇上文2.4節(jié)中提到的評(píng)價(jià)指標(biāo)進(jìn)行實(shí)驗(yàn)結(jié)果的分析。如表4-3所示,從表中可以看出,YOLOv8s+Mosaic9在精度和召回率之間取得了較好的平衡,其F1分?jǐn)?shù)最高,為0.666,這表明了它在正確識(shí)別和漏檢率方面表現(xiàn)最優(yōu)。相比之下,YOLOv3s盡管召回率為0.68,但精度較低,導(dǎo)致其F1分?jǐn)?shù)僅為0.595,說(shuō)明該模型存在較高的誤檢率。YOLOv5s和YOLOv8s相比YOLOv3s在精度方面均有明顯提升,分別為0.62和0.67。而YOLOv8s+Mosaic9在mAP50和mAP50-95指標(biāo)上也取得了最佳表現(xiàn),進(jìn)一步說(shuō)明其整體檢測(cè)能力更強(qiáng)。可見(jiàn),引入Mosaic9數(shù)據(jù)增強(qiáng)策略對(duì)模型性能提升具有明顯作用。而且在參數(shù)量方面,YOLOv8s參數(shù)量小于YOLOv5s和YOLOv3s,YOLOv8系列的整體性能更優(yōu),說(shuō)明其網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)更為高效。相比基礎(chǔ)模型YOLOv8s,引入Mosaic9數(shù)據(jù)增強(qiáng)后的模型在召回率上提高了10%,mAP50提高了3%,F(xiàn)1分?jǐn)?shù)也從0.644提升至0.666,驗(yàn)證了Mosaic9策略對(duì)小目標(biāo)或復(fù)雜背景下目標(biāo)檢測(cè)的有效性。YOLOv8s+Mosaic9相比與YOLOv5模型在召回率上提升了8%,在mAP50上提升了6%,在mAP50-95上提升了8%,說(shuō)明模型有較高的定位精度和泛化能力。表4-3不同模型檢測(cè)能力對(duì)比(病害數(shù)據(jù)集)ModelprecisionrecallmAP50mAP50-95F1ScoreYOLOv3s0.530.680.640.470.595YOLOv5s0.620.640.650.460.629YOLOv8s0.670.620.680.480.644YOLOv8s+Mosaic90.620.720.710.540.6664.4.2定量指標(biāo)分析(1)PR曲線圖4-8YOLOv8s+Mosaic9模型PR曲線PR_curve(Precision-Recallcurve,精確率和召回率的關(guān)系圖)又稱為P-R曲線,它反映了在不同閾值下,模型的精確率和召回率之間的關(guān)系。閾值的變化會(huì)影響到模型檢測(cè)到的目標(biāo)數(shù)量和模型對(duì)這些目標(biāo)的正確率,PR_curve能夠幫助我們?cè)谄胶饩_率和召回率之間進(jìn)行取舍,從而找到最佳的模型性能表現(xiàn)。如圖4-8所示,圖中橫軸召回率,表示模型檢測(cè)出所有真實(shí)目標(biāo)中,正確識(shí)別出來(lái)的比例,縱軸精確率,表示模型識(shí)別出的目標(biāo)中有多少是正確的。圖中的藍(lán)色粗線表示模型對(duì)所有類別的平均表現(xiàn),曲線下的面積越大,說(shuō)明模型在不同閾值下的整體表現(xiàn)越穩(wěn)定優(yōu)秀?;疑€條表示每條線代表一個(gè)具體類別的P-R曲線,線條越“方”、面積越大,說(shuō)明該類別檢測(cè)性能越好。最終在mAP@0.5指標(biāo)上達(dá)到了0.716,表明模型對(duì)目標(biāo)的定位與分類精確率較高,具有較好的泛化能力。(2)損失函數(shù)分析圖4-9訓(xùn)練集和驗(yàn)證集的損失變化曲線圖圖4-9展示了訓(xùn)練集和驗(yàn)證集的損失變化曲線,box_loss用于衡量預(yù)測(cè)框位置與真實(shí)框的偏差,訓(xùn)練集和驗(yàn)證集的box_loss都在持續(xù)下降,最終趨于平穩(wěn),說(shuō)明模型在定位目標(biāo)方面逐步優(yōu)化,定位精度不斷提升,而且訓(xùn)練集與驗(yàn)證集偏差不大,無(wú)過(guò)擬合現(xiàn)象。cls_loss用于衡量類別預(yù)測(cè)是否準(zhǔn)確,訓(xùn)練集和驗(yàn)證集的下降曲線平滑,其值從大于2下降到0.75以下,說(shuō)明模型對(duì)目標(biāo)種類的區(qū)分能力在增強(qiáng),分類性能顯著改善。dfl_loss用于提升邊界框回歸的精度,是YOLOv8的關(guān)鍵改進(jìn),從1.6降至約0.9~1.1,平穩(wěn)下降,說(shuō)明DFL有效幫助模型更加準(zhǔn)確地預(yù)測(cè)邊界框細(xì)節(jié)。4.4.3數(shù)據(jù)檢測(cè)表現(xiàn)YOLOv8+Mosaic9模型在數(shù)據(jù)上的檢測(cè)表現(xiàn)見(jiàn)圖4-10。圖4-10中,圖片來(lái)源于測(cè)試集,每排圖片左圖標(biāo)注的是真實(shí)框和真實(shí)類別,右圖則展示了模型在相同圖像上的預(yù)測(cè)結(jié)果,包括預(yù)測(cè)的目標(biāo)位置與分類標(biāo)簽。由圖中可見(jiàn)模型可以準(zhǔn)確檢測(cè)到尺度不同、形狀各異的各類病蟲(chóng)害區(qū)域。通過(guò)對(duì)比兩圖,可以直觀評(píng)估模型在目標(biāo)檢測(cè)任務(wù)中的準(zhǔn)確性與魯棒性,為后續(xù)的性能分析和模型優(yōu)化提供參考。圖4-10數(shù)據(jù)驗(yàn)證效果圖(病害)4.5蟲(chóng)害實(shí)驗(yàn)結(jié)果及分析4.5.1對(duì)比試驗(yàn)本實(shí)驗(yàn)選擇YOLOv3s、YOLOv5s、Yolov8s和YOLOv8s+Mosaic9模型在相同配置的實(shí)驗(yàn)環(huán)境下,利用蟲(chóng)害數(shù)據(jù)集進(jìn)行對(duì)比試驗(yàn),驗(yàn)證YOLOv8模型的有效性。下面對(duì)表4-3進(jìn)行分析:在精度方面,YOLOv3s精度最低,說(shuō)明存在一定的誤報(bào)。YOLOv5s有所提升,YOLOv8s和YOLOv8s+Mosaic9達(dá)到0.62,說(shuō)明隨著模型的演進(jìn),對(duì)目標(biāo)的識(shí)別準(zhǔn)確性持續(xù)改善,這都說(shuō)明了YOLOv8系列在減少誤檢方面表現(xiàn)更優(yōu)。在召回率方面,YOLOv8s的召回率最高,說(shuō)明能檢測(cè)出更多的目標(biāo),Mosaic9雖然保持高精度,但召回率反而略有下降。在mAP上,YOLOv8s的mAP50值最高,說(shuō)明對(duì)目標(biāo)檢測(cè)的整體能力最強(qiáng),這說(shuō)明Mosaic9數(shù)據(jù)增強(qiáng)可能對(duì)某些類別有幫助,但并不一定適用于所有場(chǎng)景。YOLOv8s結(jié)合Mosaic9數(shù)據(jù)增強(qiáng)后,盡管在精度上保持優(yōu)勢(shì),但召回率有所下降,說(shuō)明該增強(qiáng)策略在本數(shù)據(jù)集上存在一定的過(guò)擬合風(fēng)險(xiǎn)。而且其F1略低于YOLOv8s,說(shuō)明Mosaic9在本任務(wù)中的增強(qiáng)效果有限,甚至可能略有削弱召回率。因此,YOLOv8s模型在植物蟲(chóng)害任務(wù)中表現(xiàn)最優(yōu)。表4-3不同模型檢測(cè)能力對(duì)比(蟲(chóng)害數(shù)據(jù)集)ModelprecisionrecallmAP50mAP50-95F1ScoreYOLOv3s0.550.630.6470.410.59YOLOv5s0.590.620.650.400.60YOLOv8s0.620.660.680.440.64YOLOv8s+Mosaic90.620.610.650.410.62與YOLOv5s相比,YOLOv8s在蟲(chóng)害數(shù)據(jù)集上的檢測(cè)性能有明顯提升,其精準(zhǔn)率從0.59提升至0.62,召回率從0.62提升至0.66,F(xiàn)1分?jǐn)?shù)由0.605提升至0.640,mAP@0.5從0.65增加至0.68,說(shuō)明YOLOv8s在模型結(jié)構(gòu)和特征提取方面對(duì)小圖像大目標(biāo)的適應(yīng)性更強(qiáng)。然而,在YOLOv8s基礎(chǔ)上引入Mosaic9數(shù)據(jù)增強(qiáng)策略后,雖然精準(zhǔn)率保持不變,但召回率下降至0.61,F(xiàn)1分?jǐn)?shù)下降至0.615,mAP@0.5也回落到與YOLOv5s相當(dāng)?shù)乃?。這表明Mosaic9策略在本蟲(chóng)害數(shù)據(jù)集中并未帶來(lái)預(yù)期提升,可能因?yàn)椴『?shù)據(jù)集與蟲(chóng)害數(shù)據(jù)集在相同模型上的性能表現(xiàn)有一定差異,可能與數(shù)據(jù)集的圖片尺寸、真實(shí)框大小有關(guān)。蟲(chóng)害數(shù)據(jù)集中圖像尺寸普遍較?。ù蟛糠謭D像尺寸都小于500×500),這限制了模型輸入的信息量,尤其是淺層特征。雖然蟲(chóng)害數(shù)據(jù)集的目標(biāo)框相對(duì)較大,約占圖像大小的2/3,但由于原始圖像分辨率小,模型提取的空間信息有限,所以可能影響了精度。而葉片病害數(shù)據(jù)集中圖像更大、紋理細(xì)節(jié)豐富,有利于模型學(xué)習(xí)更多區(qū)分特征,故整體性能更優(yōu)。而且蟲(chóng)害數(shù)據(jù)集中,每一個(gè)類別的害蟲(chóng)圖像包含了幼蟲(chóng)、成蟲(chóng)、雄性、雌性等差異大的形態(tài),可能影響了模型的學(xué)習(xí)效果。4.5.2定量指標(biāo)分析對(duì)模型訓(xùn)練得到的result.csv文件進(jìn)行可視化分析,如圖4-11所示。從圖中可以看出,隨著訓(xùn)練輪數(shù)(Epoch)的增加,各個(gè)模型的性能都有所提升。其中綠色線代表的YOLOv8s模型在四個(gè)指標(biāo)中表現(xiàn)都是最好的。無(wú)論是準(zhǔn)確率、召回率,還是mAP@50和mAP@50-95,YOLOv8s的數(shù)值始終高于其他模型,說(shuō)明它在識(shí)別目標(biāo)時(shí)更準(zhǔn)確、漏檢更少、綜合性能更強(qiáng)。而紅色線代表的YOLOv8s+Mosaic9雖然訓(xùn)練的輪數(shù)最多,但它的整體表現(xiàn)反而比YOLOv8s略差,尤其是在精確率和mAP@50-95上都不如YOLOv8s。這說(shuō)明雖然加了Mosaic9數(shù)據(jù)增強(qiáng)方法訓(xùn)練得更久,但在這個(gè)任務(wù)上并沒(méi)有帶來(lái)預(yù)期的效果,甚至可能引入了不穩(wěn)定因素。YOLOv5s和YOLOv3s的表現(xiàn)相比之下要弱一些,但它們也都隨著訓(xùn)練時(shí)間的增長(zhǎng)逐漸趨于穩(wěn)定,只是在最終的精度和召回上不如YOLOv8s。綜上來(lái)看,YOLOv8s是檢測(cè)植物蟲(chóng)害效果最優(yōu)的模型。圖4-11可視化圖4.5.3數(shù)據(jù)檢測(cè)定性分析YOLOv8s模型在蟲(chóng)害數(shù)據(jù)上的檢測(cè)表現(xiàn)見(jiàn)圖4-12,預(yù)測(cè)效果達(dá)到較好的精確率。本次實(shí)驗(yàn)訓(xùn)練中得出的最優(yōu)權(quán)重文件在圖片測(cè)試中表現(xiàn)優(yōu)異,在每個(gè)類別多形態(tài)的情況下依然保證了較高的置信度。圖4-12數(shù)據(jù)驗(yàn)證效果圖(蟲(chóng)害)第5章基于YOLOv8的植物病蟲(chóng)害檢測(cè)平臺(tái)搭建5.1模型部署環(huán)境及系統(tǒng)架構(gòu)5.1.1系統(tǒng)架構(gòu)設(shè)計(jì)在植物病蟲(chóng)害檢測(cè)中,檢測(cè)模型要有效,更重要的是應(yīng)用模型,要應(yīng)用到實(shí)際任務(wù)中,當(dāng)前重點(diǎn)是為用戶提供一個(gè)檢測(cè)系統(tǒng),檢測(cè)系統(tǒng)要交互性好,操作要便捷,運(yùn)行要高效,適應(yīng)能力要強(qiáng),這樣才能提升應(yīng)用價(jià)值。本章設(shè)計(jì)了植物病蟲(chóng)害檢測(cè)圖形界面,該界面有以下功能:(1)用戶登錄。運(yùn)行程序,首先彈出系統(tǒng)登錄界面,用戶可輸入用戶名,用戶可輸入密碼,初次登錄需注冊(cè),注冊(cè)成功后,可進(jìn)入主界面。(2)檢測(cè)界面。選擇圖片或視頻進(jìn)行檢測(cè),顯示檢測(cè)后的結(jié)果圖和檢測(cè)類別,還有置信度等信息。(3)數(shù)據(jù)統(tǒng)計(jì)。系統(tǒng)可自動(dòng)計(jì)算檢測(cè)出的目標(biāo)類別,還能統(tǒng)計(jì)數(shù)量,在結(jié)果圖下方用表格顯示。(4)AI助手輔助診療。在系統(tǒng)中接入DeepSeek的AI接口,用戶可以根據(jù)檢測(cè)結(jié)果與AI助手聊天,得到針對(duì)性的防治方案。5.1.2部署環(huán)境本章開(kāi)發(fā)的檢測(cè)系統(tǒng),基于PyQt5框架進(jìn)行開(kāi)發(fā),具體配置如下表所示:表5-1開(kāi)發(fā)環(huán)境配置表參數(shù)名稱配置處理器AMD操作系統(tǒng)Windows11編程語(yǔ)言Python3.8鏡像PyTorch2.0.0開(kāi)發(fā)工具Pycharm2023.2.1PyQt6Pyside65.1.3PyQt和PySide介紹本系統(tǒng)圖形界面的開(kāi)發(fā)綜合使用了PyQt5和PySide6兩個(gè)工具,它們都是Qt框架的Python接口,功能相近,都可以用來(lái)編寫(xiě)窗口程序。Qt是一個(gè)跨平臺(tái)的界面開(kāi)發(fā)庫(kù),由C++編寫(xiě),PyQt和PySide是它的Python版本,用Python更方便做界面設(shè)計(jì),可以設(shè)計(jì)按鈕,可以設(shè)計(jì)文字輸入框,可以設(shè)計(jì)圖像展示區(qū)域,這些都是常見(jiàn)控件。本研究使用QtDesigner,它用于設(shè)計(jì)可視化界面,設(shè)計(jì)好的文件為.ui文件,然后用PySide6的uic工具,將.ui文件轉(zhuǎn)換為.py文件,便于添加程序邏輯,便于整合功能,PyQt5負(fù)責(zé)構(gòu)建整體界面,它處理事件響應(yīng),兩者配合使用,可以提升開(kāi)發(fā)效率。5.2平臺(tái)工作界面設(shè)計(jì)5.2.1功能設(shè)計(jì)本系統(tǒng)的界面設(shè)計(jì)下圖所示,主要分為首頁(yè)、檢測(cè)程序、個(gè)人中心、退出系統(tǒng)等四個(gè)主要模塊。圖5-1主界面如圖5-1、5-2所示。在個(gè)人中心部分可以進(jìn)行用戶信息修改,并連接了MySQL數(shù)據(jù)庫(kù)進(jìn)行用戶信息管理。在檢測(cè)程序模塊,用戶選擇圖片或視頻,然后點(diǎn)擊“開(kāi)始檢測(cè)”按鈕,就會(huì)顯示檢測(cè)結(jié)果,還可以將本系統(tǒng)部署于帶攝像頭的移動(dòng)設(shè)備上,進(jìn)行實(shí)時(shí)檢測(cè)。如圖5-3所示,將鼠標(biāo)移動(dòng)到用戶名上,就會(huì)顯示AI助手的接口,點(diǎn)擊即可與AI助手聊天進(jìn)行智能診療。AI助手的實(shí)現(xiàn),利用PySide6提供的多線程機(jī)制,系統(tǒng)將用戶輸入作為提示信息發(fā)送至DeepSeek的對(duì)話模型"deepseek-chat",并以流式方式獲取模型生成的回復(fù)內(nèi)容。在傳輸過(guò)程中,服務(wù)器返回的數(shù)據(jù)被逐行解析,提取出模型實(shí)時(shí)生成的文本片段,并通過(guò)信號(hào)機(jī)制將這些內(nèi)容展示在圖形用戶界面中。該方法為植物病蟲(chóng)害檢測(cè)系統(tǒng)提供了人機(jī)交互支持。圖5-2檢測(cè)界面圖5-3AI助手5.2.2功能測(cè)試效果展示系統(tǒng)部署完成,集成兩大核心功能,一是植物病蟲(chóng)害目標(biāo)檢測(cè),二是智能診療助手。用戶在系統(tǒng)上傳圖片后,點(diǎn)擊開(kāi)始檢測(cè)按鈕,系統(tǒng)會(huì)自動(dòng)調(diào)用訓(xùn)練好的模型,進(jìn)行病蟲(chóng)害檢測(cè),并輸出檢測(cè)結(jié)果,包括具體病蟲(chóng)害類別,置信度
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年廣西國(guó)際壯醫(yī)醫(yī)院公開(kāi)招聘工作人員16人參考考試試題及答案解析
- 2025浙江溫州市平陽(yáng)縣興陽(yáng)控股集團(tuán)有限公司下屬房開(kāi)公司招聘項(xiàng)目制員工15人模擬筆試試題及答案解析
- 2025浙江嘉興市海寧市海昌街道社區(qū)衛(wèi)生服務(wù)中心招聘1人備考筆試題庫(kù)及答案解析
- 2025四川雅安市雨城區(qū)公益性崗位招聘8人備考筆試試題及答案解析
- 25江西南昌動(dòng)物園招聘1人備考筆試題庫(kù)及答案解析
- 2026河北滄州市直衛(wèi)健系統(tǒng)公立醫(yī)院高層次人才選聘67人參考考試試題及答案解析
- 網(wǎng)推廣協(xié)議書(shū)范本
- 耕地開(kāi)墾合同范本
- 職工領(lǐng)工資協(xié)議書(shū)
- 聯(lián)營(yíng)合作n協(xié)議書(shū)
- 愚安科技筆試題庫(kù)及答案
- T-CALC 007-2025 重癥監(jiān)護(hù)病房成人患者人文關(guān)懷規(guī)范
- 旅游地理學(xué) 國(guó)家公園建設(shè)與管理
- JJF(石化)036-2020漆膜附著力測(cè)定儀(劃圈法)校準(zhǔn)規(guī)范
- 診所醫(yī)生聘用合同(3篇)
- JJG 693-2011可燃?xì)怏w檢測(cè)報(bào)警器
- 美拉德反應(yīng)課件
- 可再生能源領(lǐng)域:陽(yáng)光電源企業(yè)組織結(jié)構(gòu)及部門(mén)職責(zé)
- 電腦節(jié)能環(huán)保證書(shū)
- 科萬(wàn)物業(yè)公司電梯應(yīng)急救援工作流程
- 急性呼吸窘迫綜合征課件
評(píng)論
0/150
提交評(píng)論