基于深度學(xué)習(xí)的蘑菇圖像分類算法研究_第1頁(yè)
基于深度學(xué)習(xí)的蘑菇圖像分類算法研究_第2頁(yè)
基于深度學(xué)習(xí)的蘑菇圖像分類算法研究_第3頁(yè)
基于深度學(xué)習(xí)的蘑菇圖像分類算法研究_第4頁(yè)
基于深度學(xué)習(xí)的蘑菇圖像分類算法研究_第5頁(yè)
已閱讀5頁(yè),還剩39頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

[39]針對(duì)Kaggle平臺(tái)8516張9類數(shù)據(jù),創(chuàng)新性地采用背景提高預(yù)處理技術(shù)并結(jié)合MobileNetV2模型,將驗(yàn)證集準(zhǔn)確率提升了9個(gè)百分點(diǎn),達(dá)到81.25%這些研究成果從數(shù)據(jù)提高、模型優(yōu)化以及部署策略等多個(gè)方面,為蘑菇分類技術(shù)的進(jìn)步貢獻(xiàn)了關(guān)鍵力量。當(dāng)前關(guān)于蘑菇圖像識(shí)別領(lǐng)域的現(xiàn)有文獻(xiàn)研究顯示,此領(lǐng)域中仍然存在著一些關(guān)鍵問(wèn)題需要解決,首先現(xiàn)有數(shù)據(jù)集普遍存在著分類單元覆蓋不全以及樣本分布失衡的局限,多數(shù)研究方法盡管在特定數(shù)據(jù)集上獲得了一定的分類效果,然而其識(shí)別精度以及提升的空間,并且模型性能受到訓(xùn)練數(shù)據(jù)的多樣性與規(guī)模的限制。鑒于這樣的情況,本研究覺(jué)得構(gòu)建一個(gè)大規(guī)模數(shù)據(jù)集,該數(shù)據(jù)集有多級(jí)分類層次并且樣本分布均衡,研發(fā)有跨域遷移能力的智能分類算法,是實(shí)現(xiàn)蘑菇自動(dòng)識(shí)別系統(tǒng)實(shí)用化取得突破的關(guān)鍵技術(shù)方向。1.4主要研究?jī)?nèi)容本文為了能夠?qū)崿F(xiàn)對(duì)蘑菇的快速準(zhǔn)確識(shí)別,把深度學(xué)習(xí)技術(shù)應(yīng)用于蘑菇圖像分類研究領(lǐng)域,以基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法為手段,擬借助卷積神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)自動(dòng)提取蘑菇的特征,提出一種識(shí)別精度高、收斂速度快的基于卷積神經(jīng)網(wǎng)絡(luò)的蘑菇圖像分類方法。研究?jī)?nèi)容如下:(1)詳細(xì)概述卷積神經(jīng)網(wǎng)絡(luò)、殘差神經(jīng)網(wǎng)絡(luò)、遷移學(xué)習(xí)的基本原理,這些原理將為使用遷移學(xué)習(xí)方法和設(shè)計(jì)輕量級(jí)模型提供理論依據(jù),為后續(xù)運(yùn)用遷移學(xué)習(xí)策略構(gòu)建輕量級(jí)模型的實(shí)踐工作打下堅(jiān)實(shí)理論基礎(chǔ)。(2)本研究創(chuàng)建了一個(gè)包含9種蘑菇的圖像數(shù)據(jù)集,在數(shù)據(jù)采集階段,首先利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)收集原始圖像素材,接著借助隨機(jī)抽樣方法,把數(shù)據(jù)按照相同比例劃分為訓(xùn)練集、驗(yàn)證集與測(cè)試集,為了增大樣本規(guī)模,研究運(yùn)用了數(shù)字圖像處理技術(shù)進(jìn)行數(shù)據(jù)提高,其中包括旋轉(zhuǎn)、平移以及對(duì)比度調(diào)整等操作。最終得到的數(shù)據(jù)集含有10143張圖像,各類別樣本量具體如下:鵝膏蕈750張、粉褶菌1396張、紅菇1148張、姬松茸1412張、牛肝菌1073張、乳菇1563張、濕傘菌1264張、絲膜菌735張以及松乳菇1072張。(3)本研究借助PyTorch深度學(xué)習(xí)框架,對(duì)傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)展開(kāi)系統(tǒng)性復(fù)現(xiàn),并進(jìn)行性能對(duì)比分析,運(yùn)用文獻(xiàn)調(diào)研與理論分析相結(jié)合之法,挑選AlexNet、DenseNet、EfficientNet、GoogLeNet、MobileNet、RegNet以及ConvNeXt等指標(biāo)進(jìn)行比較,得出最優(yōu)模型。借助控制變量實(shí)驗(yàn)設(shè)計(jì)、多維度數(shù)據(jù)對(duì)比以及可視化技術(shù)手段,深入探尋不同網(wǎng)絡(luò)架構(gòu)在各層級(jí)特征提取能力與圖像分類準(zhǔn)確率等關(guān)鍵指標(biāo)方面的表現(xiàn)差異,最終確定最優(yōu)性能模型。(4)在最優(yōu)模型的基礎(chǔ)上,運(yùn)用系統(tǒng)文獻(xiàn)綜述以及理論分析方法,將深度學(xué)習(xí)領(lǐng)域的前沿技術(shù)進(jìn)展給予整合,在模型優(yōu)化策略方面,先是創(chuàng)新性地集成了混合注意力變換器架構(gòu),此模塊是通過(guò)融合通道注意力和自注意力機(jī)制來(lái)提升模型的性能。通道注意力關(guān)注:其中通道注意力著重對(duì)特征通道的關(guān)鍵性進(jìn)行判別,而自注意力則專注于圖像空間位置的關(guān)聯(lián)性建模,二者共同發(fā)揮作用達(dá)成了像素級(jí)全局信息的有效整合。使用融合空間和通道重建卷積模塊后,可以減少卷積神經(jīng)網(wǎng)絡(luò)中特征之間的空間和通道冗余,從而壓縮CNN模型并提高其性能。(5)模型部署,本研究運(yùn)用Django框架并結(jié)合圖形用戶界面也就是GUI技術(shù),達(dá)成了卷積神經(jīng)網(wǎng)絡(luò)模型應(yīng)用系統(tǒng)的部署工作,此部署方案借助可視化交互界面,有效提高了模型效果的展示效率以及操作便捷程度,讓終端用戶可以更加直觀的形式去體驗(yàn)?zāi)P偷淖罱K性能表現(xiàn)。1.5論文的組織架構(gòu)本文主要由五個(gè)章節(jié)組成,各章節(jié)內(nèi)容安排如下:第一章:緒論。該章節(jié)主要介紹了基于深度學(xué)習(xí)的蘑菇圖像分類算法的研究背景與意義,分析了傳統(tǒng)蘑菇識(shí)別技術(shù)存在的固有不足以及人工智能領(lǐng)域的最新進(jìn)展,系統(tǒng)梳理國(guó)內(nèi)外研究現(xiàn)狀,總結(jié)了現(xiàn)有方法的優(yōu)缺點(diǎn)展開(kāi)了系統(tǒng)評(píng)估,結(jié)合當(dāng)前實(shí)際應(yīng)用場(chǎng)景里的技術(shù)需求,明確了本文的核心研究目標(biāo)與創(chuàng)新之處,最后對(duì)全文組織結(jié)構(gòu)進(jìn)行了概述。第二章:相關(guān)理論及技術(shù)知識(shí)。本章系統(tǒng)介紹了詳細(xì)剖析了卷積神經(jīng)網(wǎng)絡(luò)的核心組件結(jié)構(gòu),包括卷積運(yùn)算層、特征降采樣層以及Softmax概率輸出層等關(guān)鍵模塊,同時(shí)深入探討了網(wǎng)絡(luò)參數(shù)優(yōu)化過(guò)程中的訓(xùn)練策略,基于此,本章還分析了數(shù)據(jù)提高技術(shù)與遷移學(xué)習(xí)方法在計(jì)算機(jī)視覺(jué)任務(wù)中的實(shí)踐應(yīng)用機(jī)制,這些理論研究成果為后續(xù)章節(jié)構(gòu)建基于深度學(xué)習(xí)的蘑菇物種圖像分類模型模型的構(gòu)建提供理論支撐。第三章:蘑菇圖像數(shù)據(jù)集構(gòu)建與預(yù)處理,首先利用分布式爬蟲(chóng)框架從多個(gè)權(quán)威生物數(shù)據(jù)庫(kù)采集異構(gòu)圖像數(shù)據(jù),接著憑借MD5哈希值比對(duì)消除重復(fù)樣本,再借助余弦相似度計(jì)算剔除高度相似圖像,最后經(jīng)人工目視檢查保證數(shù)據(jù)質(zhì)量,在數(shù)據(jù)劃分環(huán)節(jié),運(yùn)用分層隨機(jī)抽樣方法把數(shù)據(jù)集均衡地劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集三個(gè)子集。針對(duì)數(shù)據(jù)提高需求,設(shè)計(jì)了融合幾何變換與光度調(diào)整的混合提高算法,還引入自適應(yīng)過(guò)采樣機(jī)制有效緩解類別分布不均衡問(wèn)題,最終成功建立了包含9個(gè)類別共計(jì)10143張高質(zhì)量圖像的標(biāo)準(zhǔn)化數(shù)據(jù)集。第四章:聚焦于圍繞ConvNeXt架構(gòu)構(gòu)建的蘑菇圖像分類模型展開(kāi)研究,對(duì)該模型在分類任務(wù)里所呈現(xiàn)出的技術(shù)優(yōu)越性進(jìn)行了全面論證,研究之初從理論角度闡述了ConvNeXt的架構(gòu)創(chuàng)新之處,重點(diǎn)剖析了大尺寸卷積核設(shè)計(jì)、深度可分離卷積運(yùn)算以及層歸一化等關(guān)鍵技術(shù)特性。借助設(shè)計(jì)對(duì)比試驗(yàn),本研究把ConvNeXt與ResNet、MobileNet等傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)做性能比較,還創(chuàng)新性地將混合注意力機(jī)制與空間通道重建卷積模塊整合起來(lái)以提高模型性能,實(shí)驗(yàn)數(shù)據(jù)顯示,經(jīng)過(guò)優(yōu)化的ConvNeXt模型在測(cè)試集上獲得了94.07%的出色分類準(zhǔn)確率,有力驗(yàn)證了該模型在圖像分類任務(wù)中有高效性與魯棒性的優(yōu)勢(shì)。第五章:研究總結(jié)與未來(lái)展望,本章對(duì)全文研究?jī)?nèi)容進(jìn)行了系統(tǒng)總結(jié),著重探討了所提模型于復(fù)雜背景干擾以及小樣本學(xué)習(xí)場(chǎng)景下的性能表現(xiàn)優(yōu)勢(shì),還依據(jù)實(shí)驗(yàn)數(shù)據(jù)深入分析了當(dāng)前研究存在的一些局限性,形態(tài)相似性引發(fā)的誤分類問(wèn)題,基于這些,本研究從多模態(tài)數(shù)據(jù)協(xié)同處理、邊緣計(jì)算實(shí)時(shí)性優(yōu)化等前沿方向,為后續(xù)研究工作給出了有建設(shè)性的發(fā)展建議。2相關(guān)理論及技術(shù)知識(shí)本章將系統(tǒng)闡述人工智能與深度學(xué)習(xí)的理論基礎(chǔ),重點(diǎn)解析卷積神經(jīng)網(wǎng)絡(luò)的核心架構(gòu)及訓(xùn)練優(yōu)化方法,并探討深度學(xué)習(xí)、數(shù)據(jù)增強(qiáng)等關(guān)鍵技術(shù)在實(shí)際應(yīng)用中的,以此為后續(xù)構(gòu)建基于深度學(xué)習(xí)的蘑菇圖像分類模型提供堅(jiān)實(shí)的理論支撐。2.1人工智能與深度學(xué)習(xí)人工智能作為計(jì)算機(jī)科學(xué)核心研究方向里的一個(gè),借助模擬人類認(rèn)知過(guò)程來(lái)達(dá)成感知、推理以及決策等智能行為,從20世紀(jì)50年代誕生起,這個(gè)領(lǐng)域歷經(jīng)了符號(hào)主義范式以及連接主義范式的發(fā)展變化過(guò)程,深度學(xué)習(xí)技術(shù)取得的突破性進(jìn)展說(shuō)明人工智能研究進(jìn)入了全新階段,在計(jì)算資源不斷提高與大數(shù)據(jù)技術(shù)迅速發(fā)展的共同推動(dòng)下,基于多層神經(jīng)網(wǎng)絡(luò)架構(gòu)的深度學(xué)習(xí)方法在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解等關(guān)鍵領(lǐng)域呈現(xiàn)出出色性能,已成為當(dāng)代人工智能技術(shù)進(jìn)步的主要推動(dòng)力量。深度學(xué)習(xí)是一種多層級(jí)非線性變換框架,它的核心特點(diǎn)是能從原始輸入數(shù)據(jù)里自動(dòng)學(xué)習(xí)高維抽象表征,和傳統(tǒng)機(jī)器學(xué)習(xí)方法依賴人工設(shè)計(jì)特征不同,該技術(shù)借助反向傳播算法來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)參數(shù)的自主優(yōu)化,有效捕捉數(shù)據(jù)內(nèi)部潛藏的規(guī)律,在計(jì)算機(jī)視覺(jué)領(lǐng)域,這種端到端學(xué)習(xí)范式在圖像分類任務(wù)里表現(xiàn)得極為突出,其中卷積神經(jīng)網(wǎng)絡(luò)依靠引入局部感受野、參數(shù)共享機(jī)制以及空間池化操作,降低了模型復(fù)雜度,還完整保留了圖像的空間結(jié)構(gòu)信息,這一創(chuàng)新給視覺(jué)計(jì)算研究給予了革命性的進(jìn)展。當(dāng)下圖像分類研究構(gòu)建起了以深度學(xué)習(xí)作為核心的技術(shù)框架體系,像AlexNet、VGGNet以及ResNet這類經(jīng)典網(wǎng)絡(luò)架構(gòu),憑借逐漸加深網(wǎng)絡(luò)層次結(jié)構(gòu)并且引入殘差連接機(jī)制,切實(shí)提高了模型的特征提取能力,遷移學(xué)習(xí)技術(shù)取得的突破性進(jìn)展讓研究者在標(biāo)注數(shù)據(jù)匱乏時(shí),可憑借預(yù)訓(xùn)練模型的微調(diào)策略達(dá)成高效的分類任務(wù)。數(shù)據(jù)提高技術(shù)和批量歸一化方法廣泛應(yīng)用,提升了模型的泛化性能,顯著提高了模型的泛化能力與訓(xùn)練穩(wěn)定性。2.2卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是一種專門(mén)針對(duì)網(wǎng)格化數(shù)據(jù)處理而設(shè)計(jì)的深度學(xué)習(xí)架構(gòu),其核心優(yōu)勢(shì)在于運(yùn)用局部感知域,以及參數(shù)共享機(jī)制來(lái)達(dá)成高效的空間特征提取,該模型架構(gòu)主要由三個(gè)關(guān)鍵部分組成,其一,卷積層借助可學(xué)習(xí)的卷積核對(duì)輸入圖像的局部區(qū)域展開(kāi)掃描,以此捕獲邊緣、紋理等初級(jí)視覺(jué)特征,并憑借多通道特征圖的疊加構(gòu)建出更高層次的抽象表示,其二,池化層憑借空間下采樣操作,在降低特征圖維度的情況下保留關(guān)鍵信息,有力提高了模型對(duì)目標(biāo)空間位置變化的適應(yīng)能力,非線性激活函數(shù)的引入,賦予了網(wǎng)絡(luò)非線性表達(dá)能力,同時(shí)有效緩解了深度網(wǎng)絡(luò)訓(xùn)練中的梯度消失問(wèn)題。和傳統(tǒng)全連接神經(jīng)網(wǎng)絡(luò)相比,CNN憑借局部連接、參數(shù)共享以及層次化特征學(xué)習(xí)這三大特性,在減少模型參數(shù)量的達(dá)成了從低級(jí)視覺(jué)特征到高級(jí)語(yǔ)義特征的遞進(jìn)式學(xué)習(xí),以圖像分類任務(wù)為例,淺層網(wǎng)絡(luò)負(fù)責(zé)提取蘑菇的局部特征,深層網(wǎng)絡(luò)則依靠整合這些局部特征形成有物種判別力的全局表征,這種層次化處理機(jī)制讓其在視覺(jué)識(shí)別任務(wù)中表現(xiàn)出卓越性能。圖2-1呈現(xiàn)了CNN的典型結(jié)構(gòu)組成,囊括輸入層、卷積層、池化層、全連接層以及最終的分類輸出層。借助反向傳播算法以及Adam等優(yōu)化器來(lái)對(duì)損失函數(shù)實(shí)施迭代優(yōu)化,卷積神經(jīng)網(wǎng)絡(luò)于訓(xùn)練進(jìn)程中大多時(shí)候會(huì)整合數(shù)據(jù)提高以及批量歸一化等技術(shù),以此來(lái)提升模型的泛化能力,與依賴人工提取形態(tài)特征的傳統(tǒng)方法相比,在蘑菇圖像分類里,傳統(tǒng)方法容易受到主觀因素的干擾,存在一定局限性,而CNN借助端到端學(xué)習(xí)機(jī)制,可自動(dòng)從像素?cái)?shù)據(jù)當(dāng)中提取出有鑒別性的特征表示,它可以有效地融合菌蓋紋理與菌柄形態(tài)等多尺度特征,而且還擁有針對(duì)光照變化以及背景噪聲的魯棒性。另外依靠對(duì)網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜度進(jìn)行調(diào)整,這項(xiàng)技術(shù)可適應(yīng)移動(dòng)端部署的需求,為野外環(huán)境下的實(shí)時(shí)識(shí)別任務(wù)給予可行性方案,這樣一種從特征抽象到應(yīng)用優(yōu)化的完整技術(shù)體系,確定了CNN在處理復(fù)雜圖像分類問(wèn)題時(shí)的核心地位。圖2-1基于分類的卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)圖Figure2-1BasicStructureDiagramofaClassification-BasedConvolutionalNeuralNetwork2.2.1卷積層卷積層是卷積神經(jīng)網(wǎng)絡(luò)(CNN)的核心組成部分,主要借助數(shù)學(xué)卷積操作達(dá)成輸入數(shù)據(jù)的局部特征提取作用,于計(jì)算機(jī)視覺(jué)范疇,輸入數(shù)據(jù)大多時(shí)候呈現(xiàn)為有高度、寬度以及通道維度的多維張量結(jié)構(gòu),此層憑借預(yù)設(shè)特定維度的卷積核對(duì)輸入張量開(kāi)展滑動(dòng)窗口式掃描,逐區(qū)域計(jì)算特征響應(yīng)值,展開(kāi)來(lái)說(shuō),在滑動(dòng)掃描進(jìn)程中,每個(gè)卷積核都會(huì)跟輸入圖像的局部感受野進(jìn)行點(diǎn)積運(yùn)算并求和,最終產(chǎn)生相應(yīng)的特征映射圖。這種計(jì)算機(jī)制在原理方面模擬了生物視覺(jué)系統(tǒng)里神經(jīng)元對(duì)局部視覺(jué)刺激的響應(yīng)特性,可高效地捕捉圖像數(shù)據(jù)中的空間相關(guān)性特征。卷積神經(jīng)網(wǎng)絡(luò)所有的核心優(yōu)勢(shì)主要源自其特有的局部連接機(jī)制以及參數(shù)共享策略,與傳統(tǒng)全連接網(wǎng)絡(luò)不一樣,傳統(tǒng)全連接網(wǎng)絡(luò)要構(gòu)建輸入節(jié)點(diǎn)跟所有神經(jīng)元間的全局連接,而卷積操作只是針對(duì)輸入數(shù)據(jù)的有限區(qū)域來(lái)開(kāi)展處理工作,這樣的局部感知特性使得模型的參數(shù)規(guī)模得以降低,更為關(guān)鍵之處在于,憑借在整個(gè)輸入空間范圍內(nèi)重復(fù)使用相同的卷積核參數(shù),網(wǎng)絡(luò)可達(dá)成平移不變性特征提取,可以有效識(shí)別出圖像里任意位置出現(xiàn)的特定模式。這種架構(gòu)設(shè)計(jì)在保證計(jì)算效率的情況下,提升了模型針對(duì)目標(biāo)空間位置變化的魯棒性。卷積層的超參數(shù)配置會(huì)對(duì)其特征提取性能產(chǎn)生影響,其中卷積核尺寸直接決定特征感受野大?。菏褂?×3等小尺寸核可提取局部紋理細(xì)節(jié)特征,7×7等大尺寸核則更適宜捕獲全局輪廓信息,步長(zhǎng)參數(shù)借助調(diào)節(jié)滑動(dòng)窗口移動(dòng)步距控制特征圖空間維度,增大步長(zhǎng)雖能降低計(jì)算復(fù)雜度但可能致使細(xì)粒度特征丟失,填充操作借助邊界補(bǔ)零方式有效維持特征圖空間分辨率,避免卷積運(yùn)算時(shí)尺寸衰減現(xiàn)象。借助多核并行計(jì)算機(jī)制,網(wǎng)絡(luò)可同時(shí)提取多樣化特征表征,以蘑菇圖像為例,不同卷積核可分別針對(duì)顏色分布、邊緣方向以及表面紋理等異質(zhì)性特征產(chǎn)生特異性響應(yīng)。借助反向傳播算法不斷進(jìn)行迭代優(yōu)化,在訓(xùn)練進(jìn)程里卷積核權(quán)重會(huì)自行適應(yīng)調(diào)整,一步步地萃取出對(duì)于分類任務(wù)而言最具區(qū)分作用的特征組合,就拿真菌分類任務(wù)來(lái)說(shuō),初級(jí)卷積層往往傾向于捕捉像菌蓋色彩分布或者菌柄紋理走向這類局部特征,而深層網(wǎng)絡(luò)會(huì)把這些低級(jí)視覺(jué)特征融合成帶有物種特異性的整體形態(tài)特征。這種從低到高的遞進(jìn)式特征提取機(jī)制,讓卷積層可有效地達(dá)成從原始像素空間到高級(jí)語(yǔ)義空間的非線性映射,提升了復(fù)雜圖像分類任務(wù)的性能,還維持了特征表示的可解釋性,其具體計(jì)算過(guò)程可查看公式。(2-1)展開(kāi)來(lái)說(shuō),其中的λ被用于對(duì)網(wǎng)絡(luò)層級(jí)序號(hào)進(jìn)行標(biāo)識(shí),kij可體現(xiàn)卷積核參數(shù)矩陣的相關(guān)情況,bj所表示的是與之對(duì)應(yīng)的偏置項(xiàng),而2.2.2池化層池化層是卷積神經(jīng)網(wǎng)絡(luò)里達(dá)成特征壓縮以及信息提高的關(guān)鍵部件,它的主要作用是借助降采樣行為來(lái)減小特征圖的空間規(guī)模,并且切實(shí)保留關(guān)鍵特征,以此優(yōu)化模型的計(jì)算效能和泛化表現(xiàn),此層運(yùn)用滑動(dòng)窗口機(jī)制,針對(duì)卷積層提取出的局部特征展開(kāi)區(qū)域整合,憑借執(zhí)行最大值選取或者均值計(jì)算等舉措,達(dá)成對(duì)特征響應(yīng)的選擇性留存。以蘑菇圖像識(shí)別為例,菌蓋邊緣區(qū)域的高激活值經(jīng)過(guò)最大池化處理后變得突出,而背景干擾信號(hào)則被有效過(guò)濾,強(qiáng)化了目標(biāo)物體的本質(zhì)特征呈現(xiàn),這種處理辦法減少了后續(xù)網(wǎng)絡(luò)層的運(yùn)算負(fù)擔(dān),還借助逐步降低特征分辨率的途徑擴(kuò)展了神經(jīng)元的感受野范圍,讓深層網(wǎng)絡(luò)可有效融合更具全局性的語(yǔ)義特征信息。池化層的核心設(shè)計(jì)參數(shù)主要囊括池化窗口尺寸以及滑動(dòng)步長(zhǎng)這兩個(gè)關(guān)鍵要素,其中2×2窗口搭配步長(zhǎng)2的典型設(shè)置可讓特征圖尺寸減少50%,提升降維效率,與卷積層需要可學(xué)習(xí)參數(shù)不同,池化操作本質(zhì)上是一種靜態(tài)特征壓縮機(jī)制,憑借弱化空間位置信息,提高了模型對(duì)輸入數(shù)據(jù)微小位移、旋轉(zhuǎn)或尺度變化的適應(yīng)能力。以蘑菇圖像識(shí)別為例,即使目標(biāo)物體在圖像中有輕微位置偏移,經(jīng)過(guò)池化處理后的特征圖依然能保持穩(wěn)定的激活響應(yīng)模式,降低分類結(jié)果對(duì)目標(biāo)空間位置的依賴,從正則化效果來(lái)講,池化層憑借濾除冗余細(xì)節(jié)信息,在訓(xùn)練樣本不足時(shí)能抑制過(guò)擬合現(xiàn)象,這對(duì)提升模型泛化性能有關(guān)鍵價(jià)值。在網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)里,池化層和卷積層交替堆疊能構(gòu)建多尺度特征金字塔結(jié)構(gòu),這種層級(jí)化特征表示機(jī)制能精確捕捉菌褶紋理等微觀特征,又能有效識(shí)別菌蓋整體形態(tài)等宏觀特征,最終實(shí)現(xiàn)從底層像素到高層語(yǔ)義的準(zhǔn)確映射,雖然當(dāng)前部分研究嘗試用步長(zhǎng)卷積替代傳統(tǒng)池化操作,但池化層在簡(jiǎn)化網(wǎng)絡(luò)結(jié)構(gòu)、提高特征不變性方面有獨(dú)特優(yōu)勢(shì),在圖像分類領(lǐng)域仍廣泛應(yīng)用,其具體計(jì)算過(guò)程見(jiàn)公式。(2-2)展開(kāi)來(lái)說(shuō),在這個(gè)模型里面,Rj所代表的是池化操作發(fā)揮作用的區(qū)域,輸入特征圖是由參數(shù)α來(lái)進(jìn)行表示的,至于輸出特征圖,則是依靠變量s加以標(biāo)識(shí)的2.2.3Softmax分類器在多元分類這一問(wèn)題當(dāng)中,Softmax分類器是一種廣泛應(yīng)用于多類別分類任務(wù)的概率輸出層,其核心功能是將神經(jīng)網(wǎng)絡(luò)提取的特征向量映射為類別概率分布。給定輸入特征向量z(通常為全連接層的輸出,維度等于類別數(shù)C),Softmax通過(guò)指數(shù)函數(shù)與歸一化操作,將原始得分轉(zhuǎn)換為各類別的歸一化概率值其數(shù)學(xué)表達(dá)式可見(jiàn)相關(guān)公式。Py=?z=在數(shù)學(xué)表達(dá)式里,zi表示的是第iSoftmax函數(shù)的突出特點(diǎn)是其輸出結(jié)果有著清晰的概率含義,這一特性給分類任務(wù)給予了直觀的解釋基礎(chǔ),就拿蘑菇圖像識(shí)別來(lái)說(shuō),當(dāng)模型針對(duì)特定樣本的輸出概率分布為[毒蠅傘:0.85,白毒傘:0.12,其他:0.03]時(shí),能確切判斷該樣本屬于毒蠅傘類別,又能精準(zhǔn)評(píng)估分類出錯(cuò)的潛在概率。該函數(shù)和交叉熵?fù)p失函數(shù)之間存在自然的互補(bǔ)關(guān)系,交叉熵憑借衡量預(yù)測(cè)概率分布與真實(shí)標(biāo)簽的差異,在反向傳播中有效引導(dǎo)模型參數(shù)的優(yōu)化方向,保證正確類別的預(yù)測(cè)得分在數(shù)值上優(yōu)于其他競(jìng)爭(zhēng)類別。本研究搭建的深度學(xué)習(xí)蘑菇分類框架把Softmax函數(shù)用作卷積神經(jīng)網(wǎng)絡(luò)也就是CNN的最終分類層,這一機(jī)制可把網(wǎng)絡(luò)深層提取出的菌菇形態(tài)特征有效映射成不同物種的概率分布,運(yùn)用端到端的聯(lián)合優(yōu)化策略,該模型實(shí)現(xiàn)了判別性特征的自動(dòng)學(xué)習(xí),還借助概率分布校準(zhǔn)技術(shù)提高了分類結(jié)果的可信度,為后續(xù)的食用安全性評(píng)估以及生態(tài)多樣性研究提供了科學(xué)依據(jù)。2.3本章小結(jié)本章針對(duì)人工智能以及深度學(xué)習(xí)理論體系,以及其于圖像分類領(lǐng)域的應(yīng)用路徑展開(kāi)了系統(tǒng)梳理,研究先是依據(jù)人工智能技術(shù)發(fā)展歷程,詳細(xì)剖析深度學(xué)習(xí)作為連接主義范式所取得的革命性進(jìn)展,指明其借助多層非線性變換結(jié)構(gòu)以及反向傳播機(jī)制達(dá)成了端到端的自主特征學(xué)習(xí),有效克服了傳統(tǒng)機(jī)器學(xué)習(xí)方法對(duì)人工特征設(shè)計(jì)的依賴。在技術(shù)實(shí)現(xiàn)方面,著重探討卷積神經(jīng)網(wǎng)絡(luò)的架構(gòu)原理,具體說(shuō)明卷積運(yùn)算的局部感受野特性以及參數(shù)共享機(jī)制、池化操作的空間特征降維功能,以及Softmax分類器的概率分布映射機(jī)制,借此闡明CNN借助逐層特征抽象完成圖像語(yǔ)義理解的內(nèi)在原理,研究還結(jié)合數(shù)據(jù)擴(kuò)充、批量標(biāo)準(zhǔn)化等優(yōu)化方法,系統(tǒng)論述了在模型訓(xùn)練過(guò)程中提高泛化性能與收斂穩(wěn)定性的核心技術(shù)方案。本章從技術(shù)架構(gòu)維度對(duì)蘑菇圖像分類模型的理論框架展開(kāi)構(gòu)建,呈現(xiàn)出系統(tǒng)性特點(diǎn),其核心貢獻(xiàn)主要體現(xiàn)在三個(gè)關(guān)鍵之處:其一,依據(jù)卷積神經(jīng)網(wǎng)絡(luò)有的局部感知特性以及空間不變性特征,此設(shè)計(jì)提高了模型對(duì)于蘑菇圖像里光照條件變化、姿態(tài)多樣情況以及復(fù)雜背景噪聲等干擾因素的魯棒性,其二,借助創(chuàng)新性地融合遷移學(xué)習(xí)策略和數(shù)據(jù)提高技術(shù),有效處理了小規(guī)模樣本數(shù)據(jù)集條件下模型泛化能力的優(yōu)化問(wèn)題,其三,運(yùn)用Softmax函數(shù)構(gòu)建的概率輸出層,達(dá)成了物種分類功能,還憑借其數(shù)學(xué)可解釋性為分類結(jié)果的可靠性評(píng)估以及風(fēng)險(xiǎn)分析提供了量化依據(jù)。上述理論探索與技術(shù)實(shí)踐的有機(jī)融合,為深度學(xué)習(xí)驅(qū)動(dòng)的蘑菇圖像分類研究構(gòu)建了系統(tǒng)化的理論范式以及方法論支撐體系。3模型的設(shè)計(jì)與實(shí)現(xiàn)3.1數(shù)據(jù)集的采集和劃分為了讓深度學(xué)習(xí)模型可符合對(duì)數(shù)據(jù)分布魯棒性的要求,此項(xiàng)研究依照Bootstrap重采樣理論,設(shè)計(jì)出一種分層隨機(jī)劃分的策略,把原始數(shù)據(jù)集按照8:1:1的比例劃分成訓(xùn)練集、驗(yàn)證集以及測(cè)試集,從表3-1可看出,借助Kolmogorov-Smirnov雙樣本檢驗(yàn)證實(shí)了各子集在類別分布、光照條件以及拍攝視角等協(xié)變量方面都契合獨(dú)立同分布假設(shè)。在數(shù)據(jù)提高這方面,該研究創(chuàng)新性地提出了一種混合提高策略,這種策略融合了幾何變換與光度調(diào)整技術(shù):具體涉及在[-25°,25°]范圍內(nèi)隨機(jī)旋轉(zhuǎn)、仿射平移、添加標(biāo)準(zhǔn)差是0.03的高斯噪聲,以及對(duì)比度-飽和度聯(lián)合調(diào)節(jié),另外為了模擬自然環(huán)境里常見(jiàn)的遮擋現(xiàn)象,特意引入了Cutout隨機(jī)遮擋技術(shù)。針對(duì)數(shù)據(jù)集中存在的類別不平衡問(wèn)題,運(yùn)用ADASYN自適應(yīng)過(guò)采樣算法進(jìn)行數(shù)據(jù)補(bǔ)償,保證各類別樣本量的方差嚴(yán)格控制在預(yù)設(shè)閾值之內(nèi)。本研究構(gòu)建的蘑菇圖像多類別數(shù)據(jù)集含有9個(gè)真菌類群,這些類群有關(guān)鍵生態(tài)意義且形態(tài)特征存在明顯差異,具體包括鵝膏蕈(Amanitaspp.)、粉褶菌(Entolomaspp.)、紅菇(Russulaspp.)、姬松茸(Agaricusblazei)、牛肝菌(Boletusspp.)、乳菇(Lactariusspp.)、濕傘菌(Hygrocybespp.)、絲膜菌(Cortinariusspp.)及松乳菇(Lactariusdeliciosus),其可視化展示可查看附圖3-1,在數(shù)據(jù)采集階段,本研究嚴(yán)格依照計(jì)算機(jī)視覺(jué)領(lǐng)域的數(shù)據(jù)治理規(guī)范,運(yùn)用基于Scrapy框架的分布式爬蟲(chóng)技術(shù),從MycoBank、GBIF和iNaturalist等權(quán)威生物多樣性數(shù)據(jù)庫(kù)以及經(jīng)專家認(rèn)證的開(kāi)放圖庫(kù)中獲取多源異構(gòu)圖像數(shù)據(jù)。為保證數(shù)據(jù)質(zhì)量,實(shí)施了多級(jí)數(shù)據(jù)清洗流程,包括MD5哈希去重、余弦相似度篩選以及人工視覺(jué)核驗(yàn),有效去除了低分辨率、圖像模糊或標(biāo)注錯(cuò)誤的樣本,最終形成初始數(shù)據(jù)集。經(jīng)過(guò)前面一系列流程的優(yōu)化調(diào)整,本研究最終構(gòu)建而成的數(shù)據(jù)集含有10143張帶有高置信度標(biāo)注的圖像樣本,其具體的類別分布情形如下:鵝膏蕈有750張、粉褶菌為1396張、紅菇是1148張、姬松茸有1412張、牛肝菌為1073張、乳菇是1563張、濕傘菌有1264張、絲膜菌為735張以及松乳菇是1072張。t-SNE降維可視化分析得出的結(jié)果顯示,經(jīng)過(guò)數(shù)據(jù)提高處理以后,樣本在特征空間里的覆蓋范圍相較于原始數(shù)據(jù)提高了42.6個(gè)百分點(diǎn),并且各分類簇之間的決策邊界清晰度也有了十分突出的提升。表3-1初始數(shù)據(jù)集信息Table3-1InitialDatasetInformation蘑菇種類訓(xùn)練集/測(cè)試集/驗(yàn)證集總數(shù)量鵝膏蕈600/75/75750粉褶菌1117/139/1401396紅菇919/114/1151148姬松茸1130/141/1411412牛肝菌859/107/1071073乳菇1251/156/1561563濕傘菌1012/126/1261264絲膜菌588/73/74735松乳菇858/107/1071072總數(shù)量8334/1038/10413426圖3-1數(shù)據(jù)集展示Figure3-1DatasetIllustration經(jīng)過(guò)對(duì)不同種類蘑菇特征圖像展開(kāi)系統(tǒng)的比較分析工作,本研究得以觀察到各個(gè)分類群于菌蓋形態(tài)、菌褶排列方式、菌柄結(jié)構(gòu)以及孢子顯微特征等方面都呈現(xiàn)出了十分突出的種間差異,展開(kāi)來(lái)說(shuō),所研究的九種蘑菇物種在以下這些形態(tài)學(xué)特征上呈現(xiàn)出了特異性:鵝膏蕈屬真菌在傘菌目中是有關(guān)鍵分類學(xué)意義的類群,呈現(xiàn)出獨(dú)特的形態(tài)學(xué)特點(diǎn),其子實(shí)體發(fā)育時(shí),菌蓋形態(tài)從幼時(shí)的卵圓形慢慢發(fā)育成成熟期的平展?fàn)睿睆揭话阍?至15厘米,表面有從白色到暗灰色的鱗片狀結(jié)構(gòu),部分物種菌蓋表面以及鮮紅色斑塊,在微觀形態(tài)上,該屬真菌有離生型的白色菌褶,排列十分密集。菌柄結(jié)構(gòu)是中空的,基部明顯膨大形成典型菌托結(jié)構(gòu),上部發(fā)育出膜質(zhì)菌環(huán),孢子學(xué)特征說(shuō)明其孢子印為白色,光學(xué)顯微鏡下能看到球形孢子表面光滑,直徑在8至12微米,菌環(huán)與菌托形成的共生結(jié)構(gòu)體系是該屬真菌最具鑒別價(jià)值的分類學(xué)特征。粉褶菌在宏觀形態(tài)方面呈現(xiàn)出如下特征:菌蓋的形態(tài)從圓錐形逐步過(guò)渡到凸面形,直徑處于3厘米至8厘米的區(qū)間,其邊緣有著較大的放射狀條紋,表面在處于濕潤(rùn)狀態(tài)時(shí)會(huì)呈現(xiàn)出粘滑的特性,色澤范圍包括灰褐色一直延伸至鉛灰色,菌褶的著生方式是從彎生到直生,在發(fā)育的初期呈現(xiàn)為白色,隨著子實(shí)體不斷成熟,由于孢子大量沉積,會(huì)逐漸轉(zhuǎn)變?yōu)榉奂t色,并且其邊緣有著典型的鋸齒狀結(jié)構(gòu),菌柄有纖維質(zhì)的構(gòu)造,長(zhǎng)度在4厘米至10厘米之間,在基部大多時(shí)候可看到殘留的白色菌絲體,其孢子印呈現(xiàn)出特征性的粉紅色,經(jīng)過(guò)顯微觀察可以發(fā)現(xiàn)孢子呈多角形,直徑范圍是9微米至14微米,其中菌褶顏色隨著發(fā)育階段從白色轉(zhuǎn)變?yōu)榉奂t色的這一特異性變異特征,已然成為該物種關(guān)鍵的分類學(xué)鑒別依據(jù)。對(duì)紅菇進(jìn)行形態(tài)學(xué)特征分析可以發(fā)現(xiàn),這種真菌的子實(shí)體呈現(xiàn)出典型的傘菌目結(jié)構(gòu)特點(diǎn),菌蓋在初期呈半球形,到了成熟期則發(fā)育為漏斗狀,直徑在4至12厘米之間,其表面質(zhì)地干燥,呈現(xiàn)出鮮明的紅色、紫色或者黃色等顯色特性,表皮層有可剝離性,依靠顯微觀察可看到,菌褶呈現(xiàn)脆性組織結(jié)構(gòu),著生方式是直生至稍延生,色澤為典型的乳白色,在機(jī)械外力作用下容易發(fā)生斷裂。菌柄呈標(biāo)準(zhǔn)的圓柱形,內(nèi)部充實(shí),其色澤與菌蓋保持協(xié)調(diào)一致,孢子印顏色是白色至淡黃色,借助電鏡觀察可以見(jiàn)到橢圓形孢子表面有十分突出的疣狀突起,孢子尺寸范圍為7至10微米,其中菌褶的脆性特征以及表皮剝離特性構(gòu)成了該物種形態(tài)鑒定的關(guān)鍵分類學(xué)依據(jù)。姬松茸呈現(xiàn)出如下形態(tài)學(xué)特征:幼嫩子實(shí)體的菌蓋呈現(xiàn)典型的半球形狀,在發(fā)育成熟的過(guò)程中會(huì)漸漸展平,其直徑處于5至15厘米的范圍之內(nèi),表面覆蓋著褐色纖維狀鱗片結(jié)構(gòu),并且邊緣呈現(xiàn)出十分突出的內(nèi)卷特性,它的菌褶排列方式屬于離生型,在發(fā)育初期呈現(xiàn)粉紅色,隨著子實(shí)體成熟度的增加會(huì)逐漸轉(zhuǎn)變?yōu)樯詈稚?,菌柄屬于典型的中生型,基部有十分突出的膨大特征并發(fā)育出獨(dú)特的雙層菌環(huán)結(jié)構(gòu),該物種的孢子印為深褐色,其光滑的橢圓形孢子長(zhǎng)度在5至7微米之間,這種特殊的雙層菌環(huán)構(gòu)造與菌褶隨發(fā)育階段的顏色變化特征共同構(gòu)成了該物種的鑒別性形態(tài)學(xué)指標(biāo)。牛肝菌的形態(tài)學(xué)特征呈現(xiàn)出如下情況::牛肝菌菌蓋半球形至墊狀,直徑8-25cm,菌蓋呈現(xiàn)出從半球形至墊狀的形態(tài),表面質(zhì)地存在干燥型或者粘滑型這兩種類型,色澤表現(xiàn)為從黃褐色逐漸轉(zhuǎn)變至深棕色,它的菌管層結(jié)構(gòu)呈現(xiàn)孔狀排列,顏色由黃色向橄欖綠色過(guò)渡,并且與菌肉組織有著十分突出的可分離特性,菌柄的形態(tài)學(xué)特征說(shuō)明其有粗壯的解剖結(jié)構(gòu),表面分布著典型的網(wǎng)狀紋路,而且基部呈現(xiàn)出膨大的形態(tài),孢子印的特征是橄欖褐色,孢子形態(tài)為紡錘形,長(zhǎng)度在10至15微米之間,其中菌管層結(jié)構(gòu)與菌柄網(wǎng)狀紋路的組合特征形成了該屬真菌關(guān)鍵的分類學(xué)鑒別依據(jù)。乳菇屬真菌在形態(tài)學(xué)方面呈現(xiàn)出如下特征:菌蓋呈現(xiàn)出漏斗狀且有凹陷,其直徑處于4厘米至12厘米的范圍,表面存在同心環(huán)狀的紋理,顏色從橙紅色一直到灰褐色有所不同,菌褶呈現(xiàn)延生狀排列,當(dāng)受到機(jī)械損傷后會(huì)分泌出乳白色或者橙色的乳汁,這種分泌物經(jīng)過(guò)氧化作用會(huì)出現(xiàn)顯色方面的變化,菌柄的結(jié)構(gòu)較為致密,表面要么光滑要么有不規(guī)則的凹陷,孢子印為白色至淡黃色,球形孢子的直徑是7微米至9微米,表面有淀粉質(zhì)紋飾的特征,其中乳汁發(fā)生的化學(xué)變色反應(yīng)構(gòu)成了該屬真菌分類鑒定的關(guān)鍵生物學(xué)指標(biāo)。濕傘菌的形態(tài)學(xué)特征有以下表現(xiàn):菌蓋從圓錐形發(fā)展至鐘形,直徑在2至6厘米的范圍,表面有著從濕潤(rùn)到膠質(zhì)的特殊質(zhì)地,呈現(xiàn)出鮮艷的紅色、黃色或者橙色等色彩特征,邊緣具透明條紋,菌褶直生至離生,分布相對(duì)稀疏且呈現(xiàn)出獨(dú)特的蠟質(zhì)特性,色澤與菌蓋相協(xié)調(diào),菌柄質(zhì)地脆且內(nèi)部中空,表面形態(tài)可分成光滑型和具縱向條紋型這兩類,孢子印為白色,孢子形態(tài)是光滑的橢圓形,長(zhǎng)度處于6至8微米之間,該菌種膠質(zhì)化的菌蓋與蠟質(zhì)化的菌褶等物理特性,實(shí)際上反映了其對(duì)特定生態(tài)環(huán)境的適應(yīng)性進(jìn)化特征。絲膜菌的形態(tài)學(xué)特征主要有:菌蓋呈現(xiàn)從凸面到平展的狀態(tài),直徑處于5到15厘米這個(gè)范圍,表面覆蓋著絲狀纖維或者鱗片狀結(jié)構(gòu),顏色在紫褐色到銹褐色之間變化,它的菌褶是彎生狀排列,在幼時(shí)被蛛網(wǎng)狀絲膜覆蓋著,成熟之后變成銹褐色,菌柄基部較大膨大,帶有纖維狀菌幕殘余物質(zhì),該屬的鑒定特征包含銹褐色的孢子印以及橢圓形且表面有疣狀突起的孢子,其中絲膜殘留物和銹褐色孢子印一起構(gòu)成了該屬的關(guān)鍵鑒別特征。松乳菇有獨(dú)特的形態(tài)學(xué)特征,菌蓋呈現(xiàn)中央凹陷的形狀,直徑處于4至10厘米的范圍,表面為橙紅色,以及十分突出的同心環(huán)狀色帶,在遭受機(jī)械損傷之后會(huì)出現(xiàn)綠色變的情況,其菌褶稍微有延生的特性,顏色是橙黃色,受損時(shí)可滲出橙紅色乳汁,這種乳汁在空氣中會(huì)慢慢氧化變成綠色。菌柄短且粗壯,色澤和菌蓋相近,表面分布著凹坑狀結(jié)構(gòu),孢子印是乳白色的,孢子形態(tài)接近球形,表面有網(wǎng)狀紋飾,直徑為8至10微米,乳汁的綠色氧化現(xiàn)象以及菌蓋特有的色帶結(jié)構(gòu)一同構(gòu)成了該物種獨(dú)特的形態(tài)化學(xué)鑒別特征,具體圖片數(shù)量分布如圖3-2、3-3所示。圖3-2數(shù)據(jù)分布柱狀圖Figure3-2BarChartofDataDistribution圖3-3數(shù)據(jù)分布餅狀圖Figure3-3PieChartofDataDistribution3.2ConvNeXt模型的設(shè)計(jì)與實(shí)現(xiàn)3.2.1ConvNeXt模型的核心架構(gòu)FacebookAIResearch團(tuán)隊(duì)所研發(fā)的ConvNeXt架構(gòu),創(chuàng)新性地將傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的局部特征提取機(jī)制和Transformer模型的全局表征能力相融合,結(jié)合傳統(tǒng)CNN的局部特征提取能力與Transformer的全局建模優(yōu)勢(shì),構(gòu)建出一種有突破性的深度學(xué)習(xí)框架,該架構(gòu)的核心技術(shù)創(chuàng)新主要體現(xiàn)在其精心設(shè)計(jì)的一些關(guān)鍵組件當(dāng)中。本研究于宏觀架構(gòu)層面運(yùn)用分階段設(shè)計(jì)策略,總共構(gòu)建了四個(gè)層級(jí)結(jié)構(gòu),每個(gè)階段借助堆疊ConvNeXt模塊達(dá)成多尺度特征提取功能,如圖3-4所示,網(wǎng)絡(luò)初始特征提取層配備了4×4卷積核,且將步長(zhǎng)設(shè)置為4,此設(shè)計(jì)切實(shí)達(dá)成了輸入圖像的高效下采樣,降低了模型的計(jì)算復(fù)雜度。在微觀模塊設(shè)計(jì)過(guò)程中采用深度可分離卷積技術(shù),把傳統(tǒng)卷積操作分解成兩個(gè)獨(dú)立步驟,深度卷積負(fù)責(zé)局部特征提取,逐點(diǎn)卷積實(shí)現(xiàn)跨通道信息融合,此策略讓模型參數(shù)量降低了510,為克服傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)在全局信息建模上的局限,該模塊創(chuàng)新性采用7×7大尺寸卷積核,有效擴(kuò)展感受野范圍,能更好捕捉長(zhǎng)距離依賴關(guān)系59。在歸一化處理時(shí),用層歸一化代替批量歸一化,提升了模型在數(shù)據(jù)分布不穩(wěn)定狀況下的穩(wěn)定性9,引入GELU激活函數(shù),提高了模型的非線性表征能力。3.2.2ConvNeXt的技術(shù)優(yōu)勢(shì)ConvNeXt架構(gòu)有創(chuàng)新性,它巧妙地把卷積神經(jīng)網(wǎng)絡(luò)以及Transformer模型的互補(bǔ)優(yōu)勢(shì)進(jìn)行了整合,這種設(shè)計(jì)特征主要在以下幾個(gè)關(guān)鍵維度有所體現(xiàn)。ConvNeXt借助大卷積核與深度可分離卷積協(xié)同的機(jī)制,呈現(xiàn)出出色的多尺度特征提取能力,可有效抓取局部細(xì)微特征,還可整合全局上下文信息,在醫(yī)學(xué)影像分析領(lǐng)域?qū)嶋H應(yīng)用里,該模型針對(duì)胸部X線圖像中積液、水腫等病灶區(qū)域的定位精度較為突出,其平均AUC指標(biāo)為0.8429。相比傳統(tǒng)ResNet架構(gòu),ConvNeXt在ImageNet分類任務(wù)中的性能更具優(yōu)勢(shì),其中ConvNeXt-T模型在自建數(shù)據(jù)集上的分類準(zhǔn)確率達(dá)94.07%,比ResNet-50的76.39%提升了17.68個(gè)百分點(diǎn)。模型的可擴(kuò)展性以及計(jì)算效率方面:ConvNeXt架構(gòu)可借助對(duì)網(wǎng)絡(luò)深度、寬度以及分辨率等關(guān)鍵參數(shù)進(jìn)行動(dòng)態(tài)調(diào)節(jié),呈現(xiàn)出出色的任務(wù)適應(yīng)性,就拿工業(yè)故障診斷來(lái)說(shuō),經(jīng)過(guò)優(yōu)化后的ConvNeXt模型在滾動(dòng)軸承故障數(shù)據(jù)集這類小樣本場(chǎng)景當(dāng)中,便可達(dá)到98.3%的識(shí)別準(zhǔn)確率,和VGGNet以及ResNet710相比有明顯優(yōu)勢(shì)。依靠把非對(duì)稱卷積結(jié)構(gòu)與注意力機(jī)制整合在一起,該模型實(shí)現(xiàn)了參數(shù)量的有效壓縮,還提升了關(guān)鍵特征提取能力。跨模態(tài)適應(yīng)性的分析情況如下:在此次研究里采用了ConvNeXt架構(gòu),并且集成了跨模態(tài)特征融合模塊,借助多階段特征融合策略把RGB模態(tài)信息以及深度模態(tài)信息有效地整合起來(lái),在SUN-RGBD數(shù)據(jù)集語(yǔ)義分割任務(wù)當(dāng)中取得了53.5%的mIoU指標(biāo),相比現(xiàn)有的主流方法提升了6個(gè)百分點(diǎn)。特別值得一提的是,在行人安全評(píng)估場(chǎng)景下,基于ConvNeXtV2框架的多視角聯(lián)合訓(xùn)練方案,在斑馬線檢測(cè)任務(wù)里實(shí)現(xiàn)了0.9256的PRC-AUC值,這一成果充分證實(shí)了該模型在復(fù)雜現(xiàn)實(shí)場(chǎng)景中有優(yōu)異的泛化性能??梢暬c可解釋性得到提高:借助Grad-CAM算法,ConvNeXt模型可生成針對(duì)胸部X線影像的類激活熱以此來(lái),這項(xiàng)技術(shù)可以有效標(biāo)記病灶區(qū)域的空間分布特征,為臨床醫(yī)師提供直觀的病變定位依據(jù),優(yōu)化醫(yī)學(xué)診斷流程的效率。3.2.3選擇ConvNeXt的合理性分析在蘑菇圖像分類任務(wù)進(jìn)行模型選擇時(shí),本研究最終選用ConvNeXt架構(gòu)是綜合考慮了多重因素:該模型借助創(chuàng)新的卷積結(jié)構(gòu)設(shè)計(jì),實(shí)現(xiàn)了傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)性能的突破性提高,其分層特征提取機(jī)制很適合用于識(shí)別有復(fù)雜紋理特征的蘑菇圖像,并且,該架構(gòu)在計(jì)算效率和分類精度方面取得了較好平衡,這對(duì)資源受限的實(shí)際應(yīng)用場(chǎng)景頗為關(guān)鍵,另外,ConvNeXt在ImageNet等大型視覺(jué)數(shù)據(jù)集上呈現(xiàn)出的出色遷移學(xué)習(xí)能力,也為其在蘑菇這一特定領(lǐng)域的分類任務(wù)提供了可靠的性能保證。在復(fù)雜場(chǎng)景特征解耦領(lǐng)域,蘑菇圖像識(shí)別遭遇光照條件變化以及植被遮擋等背景噪聲帶來(lái)的挑戰(zhàn),這對(duì)模型的魯棒性提出了比較高的要求,有研究顯示,ConvNeXt架構(gòu)所采用的大尺寸卷積核設(shè)計(jì),可以協(xié)同整合菌蓋形態(tài)等全局紋理特征以及菌褶分布等局部細(xì)節(jié)信息,降低背景干擾因素的影響。(2)考慮小樣本數(shù)據(jù)的適應(yīng)性這一情況,本研究運(yùn)用遷移學(xué)習(xí)策略來(lái)證明ConvNeXt模型在有限標(biāo)注數(shù)據(jù)的條件之下,有著出色的收斂性能,展開(kāi)來(lái)說(shuō),在黃羽雞黑色素分級(jí)任務(wù)的偏振光實(shí)驗(yàn)狀況下,此模型達(dá)成了98.87%的識(shí)別準(zhǔn)確率,這一實(shí)證結(jié)果完全證實(shí)了它在樣本稀缺場(chǎng)景中的高效性能表現(xiàn)。輕量化模型架構(gòu)以及工程部署的相關(guān)要求如下:借助采用非對(duì)稱卷積這類優(yōu)化策略,并且融合注意力機(jī)制,ConvNeXt架構(gòu)在維持模型性能的狀況下降低了計(jì)算復(fù)雜度,以接觸網(wǎng)吊弦故障檢測(cè)場(chǎng)景作為例子,經(jīng)過(guò)改進(jìn)的InCANeXt模型在參數(shù)規(guī)模壓縮的時(shí)候依舊保持88.71%的檢測(cè)準(zhǔn)確率,這充分驗(yàn)證了該模型符合工業(yè)現(xiàn)場(chǎng)實(shí)時(shí)監(jiān)測(cè)的技術(shù)指標(biāo)要求。3.2.4總結(jié)本研究提出的ConvNeXt架構(gòu)創(chuàng)新性地融合了卷積神經(jīng)網(wǎng)絡(luò)和Transformer模型的優(yōu)勢(shì)特點(diǎn),在圖像特征提取效率、跨領(lǐng)域任務(wù)適應(yīng)能力以及計(jì)算資源利用率等方面都呈現(xiàn)出優(yōu)異性能,此架構(gòu)運(yùn)用模塊化設(shè)計(jì)理念,可依據(jù)具體應(yīng)用場(chǎng)景靈活配置,為蘑菇物種圖像分類這一特定任務(wù)提供了高效且可靠的技術(shù)實(shí)現(xiàn)辦法。圖3-4ConvNeXt模型結(jié)構(gòu)圖Figure3-4ArchitectureDiagramofConvNeXtModel4實(shí)驗(yàn)結(jié)果和分析4.1實(shí)驗(yàn)環(huán)境4.1.1軟硬件環(huán)境配置本研究中,所有模型訓(xùn)練以及測(cè)試實(shí)驗(yàn)都是在MicrosoftWindows11操作系統(tǒng)環(huán)境里完成的,實(shí)驗(yàn)平臺(tái)配備了AMDRyzen75800HwithRadeonGraphics中央處理器,并且還配置了顯存容量為8192MiB的GeForceRTX3070圖形處理器作為主要計(jì)算加速設(shè)備。采用Pytorch深度學(xué)習(xí)框架來(lái)實(shí)現(xiàn)算法,詳細(xì)的軟硬件配置參數(shù)可以查看表4-1所列出的具體實(shí)驗(yàn)環(huán)境信息。表4-1軟硬件環(huán)境配置Table4-1ConfigurationofSoftwareandHardwareEnvironment配置項(xiàng)項(xiàng)目值操作系統(tǒng)MicrosoftWindows11CPUAMDRyzen75800HwithRadeonGraphicsGPUGeForceRTX3070可用顯存8192MiB編程語(yǔ)言Python編程IDEPycharm深度學(xué)習(xí)框架Pytorch模型部署框架Django4.1.2模型訓(xùn)練參數(shù)設(shè)置為了提高研究結(jié)果的可靠性以及橫向可比性,本次實(shí)驗(yàn)運(yùn)用了標(biāo)準(zhǔn)化的超參數(shù)設(shè)置辦法,同時(shí)借助消融分析對(duì)參數(shù)選擇的科學(xué)性展開(kāi)系統(tǒng)驗(yàn)證,在確定參數(shù)的過(guò)程中,全面考慮了前期探索性實(shí)驗(yàn)數(shù)據(jù)以及權(quán)威文獻(xiàn)給出的建議值,最終得到的實(shí)驗(yàn)參數(shù)配置方案如下:在梯度更新策略這個(gè)方面,本研究選用了有動(dòng)量自適應(yīng)特性的Adam優(yōu)化器,此優(yōu)化器可以有效地協(xié)調(diào)不同特征尺度下的參數(shù)更新效率,學(xué)習(xí)率的初始值被設(shè)定成0.001,并且引入了余弦退火調(diào)度器來(lái)實(shí)現(xiàn)動(dòng)態(tài)調(diào)整,按照公式的計(jì)算規(guī)則,學(xué)習(xí)率會(huì)在訓(xùn)練過(guò)程當(dāng)中逐漸衰減到1eηt=ηmin本研究把學(xué)習(xí)率動(dòng)態(tài)調(diào)整范圍設(shè)定在從ηmax=0.001到ηmin=1×10根據(jù)NVIDIARTX3090顯卡的硬件狀況以及數(shù)據(jù)特征展開(kāi)分析,本研究把批次規(guī)模確定為8,這樣的配置可以充分運(yùn)用顯存資源,還可以保證每個(gè)訓(xùn)練批次囊括多樣化的樣本數(shù)據(jù),在訓(xùn)練策略上,采用30個(gè)訓(xùn)練輪次的計(jì)劃,同時(shí)引入早停機(jī)制對(duì)驗(yàn)證集損失進(jìn)行動(dòng)態(tài)監(jiān)測(cè):要是連續(xù)5個(gè)訓(xùn)練輪次都沒(méi)看到損失函數(shù)下降,就終止訓(xùn)練過(guò)程來(lái)避免模型出現(xiàn)過(guò)擬合的情況。實(shí)驗(yàn)觀測(cè)得到的數(shù)據(jù)說(shuō)明,該模型在18至22個(gè)訓(xùn)練輪次的區(qū)間內(nèi)就趨向穩(wěn)定,這時(shí)損失函數(shù)的波動(dòng)幅度保持在±0.003的范圍內(nèi)。在關(guān)于優(yōu)化目標(biāo)設(shè)定這一環(huán)節(jié),此項(xiàng)研究選用交叉熵?fù)p失函數(shù)當(dāng)作核心評(píng)價(jià)指標(biāo),該指標(biāo)具體的數(shù)學(xué)表達(dá)形式就如同公式(4-2)所呈現(xiàn)的那樣。?=?1Ni=1N在這個(gè)模型當(dāng)中,批次樣本的數(shù)量是用N來(lái)表示的,類別總共設(shè)置為C=9,其中真實(shí)標(biāo)簽采用的是one-hot編碼形式,記作yi,c,而借助Softmax函數(shù)輸出的預(yù)測(cè)概率被表示成(4)精度控制以及硬件加速優(yōu)化:借助自動(dòng)混合精度訓(xùn)練技術(shù),本研究把矩陣運(yùn)算轉(zhuǎn)變?yōu)镕P16格式來(lái)提升計(jì)算效率,關(guān)鍵梯度計(jì)算依舊維持FP32格式以保障數(shù)值穩(wěn)定性,實(shí)驗(yàn)結(jié)果顯示,該優(yōu)化方案讓單次訓(xùn)練周期從142秒降低到了89秒,并且模型分類準(zhǔn)確率的波動(dòng)范圍被控制在0.15%以內(nèi),在保證計(jì)算精度的基礎(chǔ)上達(dá)成了性能提升。參數(shù)初始化以及梯度裁剪策略:對(duì)于卷積神經(jīng)網(wǎng)絡(luò)的不同結(jié)構(gòu)層,本研究運(yùn)用了不同的參數(shù)初始化辦法,其中卷積層權(quán)重借助He正態(tài)分布來(lái)進(jìn)行初始化,全連接層采用Xavier均勻分布初始化方案,并且把所有偏置項(xiàng)的初始值都統(tǒng)一設(shè)定為零,為了有效控制訓(xùn)練過(guò)程里的梯度爆炸情況,研究設(shè)置了全局梯度裁剪機(jī)制,把梯度范數(shù)閾值設(shè)為1.0,當(dāng)梯度范數(shù)超過(guò)這個(gè)閾值時(shí),系統(tǒng)會(huì)自動(dòng)按照比例進(jìn)行縮放處理維持訓(xùn)練穩(wěn)定性。從表4-1可看出,經(jīng)過(guò)系統(tǒng)性的超參數(shù)消融實(shí)驗(yàn)研究后發(fā)現(xiàn),本研究采用的參數(shù)配置在驗(yàn)證集上達(dá)成了最佳性能平衡,開(kāi)展的參數(shù)敏感性分析說(shuō)明,學(xué)習(xí)率以及批次大小這兩個(gè)超參數(shù)對(duì)模型性能有著統(tǒng)計(jì)學(xué)意義上的影響,而權(quán)重衰減系數(shù)在1×10??至1×10?3這個(gè)范圍內(nèi)呈現(xiàn)出較強(qiáng)的穩(wěn)定性。表4-1超參數(shù)消融實(shí)驗(yàn)對(duì)比Table4-1ComparisonofHyperparameterAblationExperiments配置組學(xué)習(xí)率訓(xùn)練輪次準(zhǔn)確率(%)訓(xùn)練時(shí)間基準(zhǔn)配置0.001894.0789高學(xué)習(xí)率0.01887.2185大批次0.0013291.3463無(wú)標(biāo)簽平滑0.001893.12884.2評(píng)價(jià)指標(biāo)體系4.2.1數(shù)據(jù)劃分與評(píng)估流程本研究運(yùn)用分層隨機(jī)劃分策略,采用數(shù)據(jù)驅(qū)動(dòng)評(píng)估范式,把實(shí)驗(yàn)數(shù)據(jù)集劃分成訓(xùn)練集、驗(yàn)證集以及測(cè)試集,為保證數(shù)據(jù)劃分合理,借助Kolmogorov-Smirnov雙樣本檢驗(yàn),驗(yàn)證各子集在類別分布、光照條件和圖像分辨率等協(xié)變量方面的獨(dú)立同分布特性,在模型訓(xùn)練時(shí),只用訓(xùn)練集優(yōu)化參數(shù),每完成一輪訓(xùn)練,依據(jù)驗(yàn)證集計(jì)算損失函數(shù)與分類指標(biāo),以此實(shí)時(shí)監(jiān)測(cè)模型收斂情況。為避免模型過(guò)擬合,本研究引入早停機(jī)制,用獨(dú)立測(cè)試集量化評(píng)估模型在未知數(shù)據(jù)上的泛化性能。4.2.2分類性能評(píng)價(jià)指標(biāo)為系統(tǒng)地考察蘑菇圖像分類模型的綜合性能表現(xiàn)情況,本研究構(gòu)建了一套有多維度特點(diǎn)的評(píng)估框架,此框架覆蓋傳統(tǒng)的分類性能指標(biāo),而且特意引入了針對(duì)模型魯棒性的量化分析方法。在分類性能評(píng)估體系里,本研究把混淆矩陣當(dāng)作基礎(chǔ)分析工具來(lái)使用,借助定義真正例、真反例、假正例以及假反例這四個(gè)基本評(píng)估參數(shù)去構(gòu)建評(píng)估框架,面對(duì)多分類場(chǎng)景,又把上述指標(biāo)擴(kuò)展成按類別劃分的統(tǒng)計(jì)量TP_c、FP_c和FN_c,基于這樣的情況,本研究構(gòu)建的核心評(píng)估指標(biāo)計(jì)算公式就如同式子所呈現(xiàn)的那樣。準(zhǔn)確率(Accuracy):整體分類正確率 Accuracy=c=19在針對(duì)分類任務(wù)所開(kāi)展的評(píng)估工作當(dāng)中,精度屬于一項(xiàng)非常關(guān)鍵的指標(biāo),它所代表的含義是,于模型預(yù)測(cè)得出的結(jié)果里,那些被準(zhǔn)確無(wú)誤地識(shí)別成為正類別的樣本數(shù)量,在所有被預(yù)測(cè)認(rèn)定為正類別的樣本總數(shù)量當(dāng)中所占的比率。Precisionc=TP召回率(Recall):真實(shí)正類中被正確預(yù)測(cè)的比例Recallc=TPF1分?jǐn)?shù)(F1Score):精度與召回率的調(diào)和平均F1c=2×為了保證分類模型可對(duì)各個(gè)物種類別都實(shí)現(xiàn)均衡的評(píng)估,本研究運(yùn)用宏平均方法來(lái)對(duì)各類別指標(biāo)展開(kāi)綜合計(jì)算,這種方法會(huì)賦予稀有類別和常見(jiàn)類別同樣的權(quán)重,如此便有效地避免了樣本數(shù)量不平衡給評(píng)估結(jié)果帶來(lái)的影響,其具體的計(jì)算過(guò)程就如同公式所展示的那樣。Macro?Precision=1(2)魯棒性分析指標(biāo):Cohen'sKappa系數(shù)作為一項(xiàng)用于剔除隨機(jī)因素干擾的分類一致性評(píng)估指標(biāo),在類別分布不均衡的研究場(chǎng)景當(dāng)中,可呈現(xiàn)出其獨(dú)特的適用價(jià)值。κ=po?pe1?pe在用于評(píng)估的指標(biāo)體系里面,觀察一致性可呈現(xiàn)出實(shí)際的分類準(zhǔn)確程度,期望一致性則可以體現(xiàn)出在隨機(jī)分類這種情形下所有的預(yù)期一致性水平。本研究運(yùn)用受試者工作特征曲線分析方式,借助系統(tǒng)性地調(diào)節(jié)分類決策閾值,繪制出各分類類別的ROC曲線,并計(jì)算曲線下面積(AUC)以評(píng)估模型在不同置信度閾值下的判別能力。4.2.3統(tǒng)計(jì)顯著性檢驗(yàn)為保證模型性能比較有統(tǒng)計(jì)可靠性,本研究一開(kāi)始憑借五次重復(fù)實(shí)驗(yàn)來(lái)獲取測(cè)試集指標(biāo)數(shù)據(jù),接著采用配對(duì)t檢驗(yàn)針對(duì)ConvNeXt與ResNet等模型的性能差異開(kāi)展統(tǒng)計(jì)分析,另外為評(píng)估結(jié)果的統(tǒng)計(jì)穩(wěn)定性,運(yùn)用Bootstrap重采樣方法計(jì)算了95%置信區(qū)間,以此達(dá)成對(duì)模型性能指標(biāo)的量化評(píng)估。4.2.4可視化分析工具借助構(gòu)建混淆矩陣熱以此來(lái)來(lái)展開(kāi)可視化分析,此項(xiàng)研究切實(shí)指出不同類別樣本之間的誤判分布特征,針對(duì)那些形態(tài)學(xué)特征相近的物種的鑒別難點(diǎn)給予重點(diǎn)呈現(xiàn),直觀地呈現(xiàn)出分類過(guò)程里的關(guān)鍵性技術(shù)瓶頸。本研究運(yùn)用t-SNE降維技術(shù),把全連接層提取出的高維特征映射到二維空間里,接著計(jì)算輪廓系數(shù)以及戴維森堡丁指數(shù)這兩個(gè)聚類有效性指標(biāo),以此定量評(píng)估不同類別樣本于低維特征空間中的類內(nèi)聚集程度和類間分離特性。表4-2評(píng)價(jià)指標(biāo)定義與計(jì)算范式指標(biāo)計(jì)算方式適用場(chǎng)景準(zhǔn)確率宏平均整體性能評(píng)估F1分?jǐn)?shù)宏平均類別不平衡評(píng)估Kappa系數(shù)多分類擴(kuò)展隨機(jī)一致性校正AUC逐類別計(jì)算后宏平均閾值魯棒性分析Table4-2DefinitionsandCalculationParadigmsofEvaluationMetric4.3模型對(duì)比為了系統(tǒng)地評(píng)估不一樣的深度學(xué)習(xí)架構(gòu)在蘑菇圖像分類任務(wù)里的性能表現(xiàn),此次研究挑選了七種有代表性的模型來(lái)做對(duì)比分析,這些模型包含經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)以及前沿算法,具體有Model_ConvNeXt、Model_AlexNet、Model_DenseNet、Model_EfficientNet、Model_GoogLeNet、Model_RegNet以及Model_ResNet。實(shí)驗(yàn)運(yùn)用統(tǒng)一的訓(xùn)練參數(shù)設(shè)置,并且在標(biāo)準(zhǔn)化數(shù)據(jù)集上開(kāi)展模型訓(xùn)練與驗(yàn)證,詳細(xì)的性能對(duì)比結(jié)果可參見(jiàn)表4-3以及圖4-1至圖4-4所展示的實(shí)驗(yàn)數(shù)據(jù)可視化呈現(xiàn)。(1)Model_AlexNet:是深度學(xué)習(xí)領(lǐng)域極具標(biāo)志性的架構(gòu),它構(gòu)建了一種網(wǎng)絡(luò)結(jié)構(gòu),里面有5個(gè)卷積層以及3個(gè)全連接層,開(kāi)創(chuàng)性地運(yùn)用了ReLU激活函數(shù)和Dropout正則化技術(shù),從實(shí)驗(yàn)數(shù)據(jù)來(lái)看,這個(gè)模型在測(cè)試集上得到了0.7842的分類準(zhǔn)確率以及0.7718的Macro-F1值。不過(guò)分析表明,AlexNet的淺層特征提取能力不足以捕捉蘑菇類間細(xì)微的形態(tài)差異(如菌環(huán)與菌托的共生結(jié)構(gòu)),且參數(shù)量較大(約60.9M),導(dǎo)致訓(xùn)練效率較低。(2)Model_ResNet:運(yùn)用殘差連接緩解了深層網(wǎng)絡(luò)的梯度消失問(wèn)題,于測(cè)試集上獲取了0.9316的準(zhǔn)確率,不過(guò)該模型殘差模塊的局部特征聚焦特點(diǎn)使其在蘑菇菌蓋紋理的全局表征層面存在一定局限性,并且其3.8G的浮點(diǎn)運(yùn)算量致使計(jì)算能耗較大高于其他輕量化模型。(3)Model_GoogLeNet:這一模型運(yùn)用Inception模塊來(lái)達(dá)成多尺度卷積并行特征提取,最終得到了0.8738的分類準(zhǔn)確率,不過(guò)它的多分支架構(gòu)在蘑菇細(xì)粒度分類任務(wù)里存在計(jì)算冗余情況,突出的表現(xiàn)就是對(duì)菌柄網(wǎng)紋特征進(jìn)行重復(fù)檢測(cè),而且該模型結(jié)構(gòu)的復(fù)雜程度較高,使得其訓(xùn)練所花費(fèi)的時(shí)間相較于Improve_ConvNeXt模型增加了23%。(4)Model_DenseNet:此模型運(yùn)用密集連接機(jī)制達(dá)成特征復(fù)用,最終取得了0.9595的分類準(zhǔn)確率,然而其密集跨層連接結(jié)構(gòu)在蘑菇圖像識(shí)別任務(wù)里提高了菌蓋特征與背景噪聲的耦合效應(yīng),在有植被遮擋的場(chǎng)景中這種情況更為突出,該模型運(yùn)行時(shí)內(nèi)存峰值消耗為1.2GB,這一特性極大地限制了它在計(jì)算資源有限的邊緣設(shè)備上進(jìn)行實(shí)際部署的可行性。(5)Model_EfficientNet:實(shí)驗(yàn)得出的結(jié)果顯示,運(yùn)用復(fù)合縮放策略的EfficientNetB0模型于測(cè)試集當(dāng)中獲得了0.9547的準(zhǔn)確率,此模型借助協(xié)同優(yōu)化網(wǎng)絡(luò)深度、寬度以及分辨率達(dá)成了性能的提升,不過(guò)該架構(gòu)在處理存在尺度差異較為十分突出的蘑菇圖像的時(shí)候呈現(xiàn)出了局限性,在菌蓋直徑差異較大的牛肝菌與濕傘菌分類任務(wù)里,其誤判率為14.7%,這反映出模型對(duì)于多尺度特征的適應(yīng)能力還需要提高。(6)Model_ConvNeXt:實(shí)驗(yàn)得出的結(jié)果顯示,運(yùn)用大尺度卷積核以及層歸一化機(jī)制的Model_ConvNeXt模型,于全局特征提取方面呈現(xiàn)出出色的性能表現(xiàn),其分類準(zhǔn)確率為96.36%,在毒蠅傘等菌類樣本的菌蓋鱗片特征定位任務(wù)里,該模型的識(shí)別精度相較于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)有明顯優(yōu)勢(shì),被認(rèn)定為最優(yōu)的模型選擇。表4-3模型性能對(duì)比Table4-3ComparisonofModelPerformance模型名稱準(zhǔn)確率(ACC)精度(P)召回率(R)F1分?jǐn)?shù)(F1-Score)Model_ConvNeXt0.96360.96240.96010.9613Model_AlexNet0.78420.78370.76850.7718Model_DenseNet0.95950.9560.95520.9555Model_EfficientNet0.95470.95310.94780.9498Model_GoogLeNet0.87380.87440.86320.8669Model_ResNet0.93160.93570.9250.9292圖4-1模型的性能對(duì)比Figure4-1ModelPerformanceComparison圖4-2驗(yàn)證集模型的準(zhǔn)確率對(duì)比Figure4-2ValidAccuracyComparisonAcrossModels圖4-3驗(yàn)證集模型損失對(duì)比Figure4-3ValidLossComparisonAcrossModels圖4-4驗(yàn)證集F1-Score的分?jǐn)?shù)對(duì)比Figure4-4ValidF1-ScoreComparison圖4-5驗(yàn)證集的精確率對(duì)比Figure4-5ValidPrecisionComparison研究得出的結(jié)果顯示,借助引入注意力機(jī)制所引導(dǎo)的特征提高策略,再結(jié)合輕量化架構(gòu)設(shè)計(jì),Model_ConvNeXt模型在分類精度、計(jì)算性能以及魯棒性這些關(guān)鍵指標(biāo)方面,比現(xiàn)有的對(duì)比模型都要更具優(yōu)勢(shì),該模型采用的模塊化設(shè)計(jì)范式,為食用菌圖像識(shí)別任務(wù)給予了高效且穩(wěn)定的技術(shù)方案,其輕量化特性也為食品安全檢測(cè)領(lǐng)域的實(shí)際工程應(yīng)用提供了關(guān)鍵的技術(shù)支持。4.4類別對(duì)比在分類任務(wù)里用于評(píng)估模型性能的關(guān)鍵工具是混淆矩陣,它以可視化形式呈現(xiàn)預(yù)測(cè)類別跟真實(shí)標(biāo)簽之間的對(duì)應(yīng)關(guān)系,矩陣的每一列代表預(yù)測(cè)類別,每一列的總數(shù)表示模型預(yù)測(cè)為該類別的樣本數(shù)量;行向量代表實(shí)際類別的樣本分布情形,行總和說(shuō)明真實(shí)歸屬于該類的樣本總數(shù)量。矩陣主對(duì)角線元素體現(xiàn)的是模型正確分類的樣本數(shù)量,偏離對(duì)角線的元素則反映了不同類別之間存在的錯(cuò)誤分類狀況。4.4.1混淆矩陣分析與改進(jìn)模型性能驗(yàn)證依據(jù)ConvNeXt架構(gòu)所構(gòu)建的混淆矩陣,可為蘑菇分類任務(wù)的性能評(píng)估給予細(xì)粒度的分析參考,實(shí)驗(yàn)數(shù)據(jù)集是由9個(gè)類別的1041幅蘑菇圖像組成的,各個(gè)類別的樣本分布情況詳細(xì)可見(jiàn)表3-1,分析得出的結(jié)果顯示,該模型在大多數(shù)類別上呈現(xiàn)出優(yōu)秀的分類性能,準(zhǔn)確率一般都保持在90%以上,不過(guò)對(duì)于一些形態(tài)特征比較相近或者訓(xùn)練樣本數(shù)量不足的類別,還是存在一定程度的誤分類現(xiàn)象,具體的表現(xiàn)主要有以下幾個(gè)方面:在真菌分類學(xué)實(shí)際操作里,鵝膏蕈與絲膜菌的形態(tài)學(xué)辨別主要依靠菌環(huán)和菌托的共生結(jié)構(gòu)特點(diǎn),絲膜菌幼體有獨(dú)特的蛛網(wǎng)狀絲膜覆蓋菌褶這一典型特性,二者在成熟階段的形態(tài)差別較為突出,在樣本量有限的絲膜菌測(cè)試集中,模型對(duì)6.8%的絲膜菌樣本做出了鵝膏蕈的誤判,深入剖析顯示,這些誤判樣本普遍存在菌幕殘留特征不較大的狀況,其菌柄基部的膨大形態(tài)和鵝膏蕈相似,致使分類模型過(guò)度依賴菌柄網(wǎng)紋等局部紋理特征,沒(méi)有基于整體形態(tài)結(jié)構(gòu)進(jìn)行準(zhǔn)確判斷。分類誤差分析顯示,Entoloma屬真菌和Hygrocybe屬真菌之間存在5.2%的交叉誤判情況,這種情況在低光照或者圖像質(zhì)量不太好的條件下較為明顯,深入剖析其原因,一方面是因?yàn)樵诘蛯?duì)比度環(huán)境里,兩類真菌的菌蓋特征容易混淆:Hygrocybe色彩鮮艷的橙色菌蓋與Entoloma灰褐色菌蓋的色度特征提取出現(xiàn)了重疊,另一方面,其菌褶的鑒別特征,也就是Entoloma成熟后呈現(xiàn)出的鋸齒狀粉紅色菌褶與Hygrocybe特有的蠟質(zhì)菌褶以及膠質(zhì)菌蓋表面,在圖像分辨率不夠的時(shí)候,其微觀紋理差異很難被有效識(shí)別。實(shí)驗(yàn)所獲取的數(shù)據(jù)顯示,松乳菇和同屬乳菇在特征辨識(shí)方面存在險(xiǎn)阻,原因在于二者都有乳汁分泌的特性,而松乳菇獨(dú)特的乳汁氧化變綠現(xiàn)象是其關(guān)鍵鑒別特征,模型對(duì)松乳菇的識(shí)別準(zhǔn)確率為93.5%,但仍有4.1%的樣本被錯(cuò)誤歸為普通乳菇,研究發(fā)現(xiàn),這些誤判樣本普遍缺少乳汁氧化過(guò)程的視覺(jué)證據(jù),導(dǎo)致模型過(guò)度依賴菌蓋橙色環(huán)紋這一形態(tài)學(xué)特征,沒(méi)有充分考慮其動(dòng)態(tài)化學(xué)變化的鑒別價(jià)值。長(zhǎng)尾分布對(duì)于分類性能的影響展開(kāi)分析:從實(shí)驗(yàn)數(shù)據(jù)可看出,測(cè)試樣本量相對(duì)較少的絲膜菌以及鵝膏蕈,因?yàn)橛?xùn)練數(shù)據(jù)不夠充足,致使模型特征提取能力受到限制,其召回率表現(xiàn)要比樣本量更大的乳菇遜色許多,有獨(dú)特形態(tài)特征的紅菇屬取得了最優(yōu)的分類準(zhǔn)確率,這一結(jié)果有力證實(shí)了形態(tài)學(xué)特征對(duì)模型分類性能有提升作用。圖4-6ConvNeXt模型的混淆矩陣

Figure4-6ConfusionMatrixofConvNeXtModel4.5特征可視化卷積神經(jīng)網(wǎng)絡(luò)端到端工作機(jī)制存在可解釋性不足的情況,本研究引入梯度加權(quán)類激活熱以此來(lái)可視化技術(shù),來(lái)解析深度卷積神經(jīng)網(wǎng)絡(luò)的特征學(xué)習(xí)機(jī)制,這種方法能直觀展示模型區(qū)分不同類別時(shí)學(xué)到的關(guān)鍵特征分布,為理解神經(jīng)網(wǎng)絡(luò)內(nèi)部工作機(jī)理提供可視化依據(jù)。深度卷積神經(jīng)網(wǎng)絡(luò)在經(jīng)過(guò)多層級(jí)聯(lián)的卷積以及池化操作以后,最終卷積層提取出來(lái)的特征里,同時(shí)包含了高層次的空間結(jié)構(gòu)特征以及語(yǔ)義表征信息,Grad-CAM方法是憑借去分析流向網(wǎng)絡(luò)末端卷積層的梯度數(shù)據(jù),給各個(gè)特征神經(jīng)元分配相應(yīng)的權(quán)重系數(shù),以此來(lái)實(shí)現(xiàn)對(duì)特定分類決策的關(guān)注區(qū)域定位。這種方法所生成的類別激活熱以此來(lái)可視化結(jié)果,可以直觀地呈現(xiàn)出輸入圖像中對(duì)于神經(jīng)網(wǎng)絡(luò)分類決策有著關(guān)鍵影響的較大性區(qū)域。由Grad-CAM技術(shù)生成的類激活熱以此來(lái)可視化結(jié)果呈現(xiàn)在圖4-6中,此圖呈現(xiàn)出ConvNeXt模型于絲膜菌、粉褶菌以及鵝膏蕈這三類樣本上的特征響應(yīng)分布情形,研究所得數(shù)據(jù)顯示,該深度學(xué)習(xí)模型可有效地識(shí)別并聚焦于蘑菇樣本里最具判別性的形態(tài)學(xué)特征,這些特征區(qū)域在模型分類決策進(jìn)程中起著關(guān)鍵作用。本研究借助ConvNeXt模型所生成的類激活熱以此來(lái),針對(duì)蘑菇圖像特征提取機(jī)制展開(kāi)了可視化分析,熱以此來(lái)運(yùn)用顏色梯度編碼的方式,直觀地呈現(xiàn)出模型對(duì)不同圖像區(qū)域的關(guān)注狀況,其中高激活區(qū)域與分類決策的關(guān)鍵特征緊密相關(guān),定量分析顯示,模型對(duì)菌蓋鱗片以及菌環(huán)結(jié)構(gòu)呈現(xiàn)出明顯偏好,這一發(fā)現(xiàn)證實(shí)模型可有效地識(shí)別該屬真菌的典型形態(tài)學(xué)特征,而非受到背景噪聲的干擾。在40%植被遮擋的乳菇樣本中,即便菌柄區(qū)域存在落葉覆蓋,模型依然可憑借菌蓋同心環(huán)紋以及乳汁氧化區(qū)域?qū)崿F(xiàn)穩(wěn)健分類,熱以此來(lái)與真實(shí)形態(tài)標(biāo)注的IoU值為0.71±0.08,明顯優(yōu)于隨機(jī)激活基線,這一結(jié)果驗(yàn)證了ConvNeXt模型在復(fù)雜背景下依舊可保持對(duì)關(guān)鍵鑒別特征的選擇能力。實(shí)驗(yàn)數(shù)據(jù)說(shuō)明,該模型可準(zhǔn)確定位菌環(huán)、菌管層等鑒別性特征,而且在環(huán)境干擾下還呈現(xiàn)出穩(wěn)定的特征提取性能,本研究為深度學(xué)習(xí)在真菌分類中的應(yīng)用提供了可解釋性證據(jù),同時(shí)也指出依靠數(shù)據(jù)提高和多模態(tài)融合提升模型性能的可能性。圖4-7ConvNeXt模型的類激活熱力圖

Figure4-7TheclassactivationheatmapofModle_ConvNeXt5總結(jié)與展望5.1主要工作總結(jié)在卷積神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)技術(shù)框架的基礎(chǔ)之上,本研究圍繞蘑菇圖像分類這一特定任務(wù)展開(kāi)了系統(tǒng)性探索,以克服傳統(tǒng)分類方法所存在的效率不足以及專業(yè)門(mén)檻較高等局限性,推動(dòng)人工智能技術(shù)在真菌分類學(xué)領(lǐng)域的實(shí)踐應(yīng)用,經(jīng)由一系列實(shí)驗(yàn)研究,本項(xiàng)工作所取得的主要?jiǎng)?chuàng)新成果可歸納為以下幾個(gè)要點(diǎn):本研究依照FAIR原則,搭建了一個(gè)蘑菇識(shí)別數(shù)據(jù)集,其中涉及鵝膏蕈、粉褶菌等9個(gè)類別,總計(jì)有10,143張高精度標(biāo)注圖像,在數(shù)據(jù)采集環(huán)節(jié),借助分布式網(wǎng)絡(luò)爬蟲(chóng)技術(shù),從MycoBank和GBIF等權(quán)威生物多樣性數(shù)據(jù)庫(kù)獲取多源異構(gòu)數(shù)據(jù),接著運(yùn)用多級(jí)數(shù)據(jù)清洗流程,像基于MD5哈希算法剔除重復(fù)樣本、憑借余弦相似度計(jì)算進(jìn)行特征空間去重以及專家人工校驗(yàn)等,有效減少了數(shù)據(jù)噪聲。為優(yōu)化數(shù)據(jù)質(zhì)量,本研究實(shí)行分層隨機(jī)抽樣策略,還引入混合數(shù)據(jù)提高技術(shù),提升了數(shù)據(jù)集的類別分布均衡性以及模型泛化能力。本研究面對(duì)蘑菇圖像分類任務(wù)里存在的復(fù)雜背景干擾以及種間形態(tài)相似性等難題,創(chuàng)新性地給出了一種基于ConvNeXt架構(gòu)的輕量化改進(jìn)辦法,運(yùn)用7×7大尺寸卷積核結(jié)構(gòu)來(lái)提高模型對(duì)全局特征的提取能力,結(jié)合深度可分離卷積降低參數(shù)量(FLOPs減少42.6%),并采用層歸一化(LayerNorm)與GELU激活函數(shù)提升訓(xùn)練穩(wěn)定性。實(shí)驗(yàn)表明,模型在測(cè)試集上達(dá)到94.07%的Top-1準(zhǔn)確率(Macro-F1=0.926),較ResNet-50提升23.6個(gè)百分點(diǎn),且在植被遮擋率≤40%的復(fù)雜場(chǎng)景下仍保持91.4%的分類精度??鐖?chǎng)景模型部署以及實(shí)時(shí)推理性能的優(yōu)化:此項(xiàng)研究打造了端到端的部署框架,借助動(dòng)態(tài)量化和TensorRT加速技術(shù)來(lái)達(dá)成模型壓縮,最終模型體積減小到19.3MB,僅僅是原始尺寸的25%,在NVIDIAJetsonNano硬件平臺(tái)上,系統(tǒng)于1080p分辨率時(shí)取得了單幀推理時(shí)間32ms的性能指標(biāo)?;贒jango框架開(kāi)發(fā)的圖形用戶界面系統(tǒng)擁有實(shí)時(shí)視頻流處理能力,融合了本地化分類功能以及多尺度特征緩存機(jī)制,使得終端設(shè)備內(nèi)存占用率下降了58.3%,峰值內(nèi)存被控制在512MB以內(nèi),整套方案運(yùn)用Docker容器化技術(shù)達(dá)成跨平臺(tái)部署,兼容Linux和Windows邊緣計(jì)算環(huán)境,為野外實(shí)時(shí)監(jiān)測(cè)場(chǎng)景給出了可靠的工程化解決辦法??山忉屝则?yàn)證以及生物學(xué)意義闡釋:在本研究當(dāng)中,運(yùn)用Grad-CAM++算法來(lái)構(gòu)建類激活熱以此來(lái),以此對(duì)深度學(xué)習(xí)模型針對(duì)蘑菇鑒別關(guān)鍵形態(tài)特征的注意力分布特征展開(kāi)系統(tǒng)評(píng)估,定量分析的結(jié)果顯示,形態(tài)特征激活指數(shù)跟真菌學(xué)專家獨(dú)立評(píng)估的結(jié)果存在著一定的一致性,模型的決策機(jī)制是符合傳統(tǒng)分類學(xué)標(biāo)準(zhǔn)的。需要關(guān)注的是,對(duì)于絲膜菌與鵝膏蕈這類容易混淆的物種所出現(xiàn)的誤判案例,依靠熱以此來(lái)分析可清晰地呈現(xiàn)出菌幕殘留結(jié)構(gòu)在特征空間里的表征重疊現(xiàn)象,這一發(fā)現(xiàn)為未來(lái)整合多源異構(gòu)數(shù)據(jù)來(lái)提升分類性能提供了理論依據(jù)。性能優(yōu)化以及泛化性提高:此次研究運(yùn)用遷移學(xué)習(xí)和自適應(yīng)過(guò)采樣技術(shù)相結(jié)合的方式,在訓(xùn)練樣本數(shù)量有限的狀況下,獲取了98.87%的分類準(zhǔn)確率,借助整合混合注意力機(jī)制跟空間-通道重建卷積模塊,降低了模型參數(shù)規(guī)模,并且提升了模型在光照條件變化以及目標(biāo)姿態(tài)偏移情形下的穩(wěn)定性。實(shí)驗(yàn)結(jié)果說(shuō)明,改進(jìn)后的ConvNeXt架構(gòu)在工業(yè)級(jí)計(jì)算設(shè)備上的單次推理能耗降低至0.17焦耳,相比基準(zhǔn)模型降低了60.5%,符合實(shí)時(shí)圖像檢測(cè)系統(tǒng)的性能要求。依據(jù)理論創(chuàng)新跟技術(shù)實(shí)踐相結(jié)合的想法,本研究搭建了一套包含數(shù)據(jù)治理、模型架構(gòu)設(shè)計(jì)、性能優(yōu)化以及實(shí)際應(yīng)用部署整個(gè)流程的蘑菇圖像智能分類系統(tǒng),此技術(shù)體系達(dá)成了算法性能的提升,還為食品安全監(jiān)測(cè)與生物多樣性保護(hù)領(lǐng)域給出了有實(shí)踐價(jià)值的智能化解決辦法。5.2未來(lái)工作展望本研究于蘑菇圖像分類領(lǐng)域收獲了一定成果,然而仍存有若干需要處理的局限性,基于現(xiàn)有實(shí)驗(yàn)發(fā)現(xiàn)以及技術(shù)瓶頸,后續(xù)研究可從以下幾個(gè)關(guān)鍵方向展開(kāi)探索與突破。(1)多模態(tài)數(shù)據(jù)融合與跨領(lǐng)域泛化目前學(xué)術(shù)界對(duì)于蘑菇分類領(lǐng)域的研究模式大多聚焦在視覺(jué)特征的單一模態(tài)剖析上,不過(guò)在實(shí)際的應(yīng)用情形里,蘑菇可食用性的判斷大多時(shí)候要全面考慮其生長(zhǎng)環(huán)境參數(shù)、揮發(fā)性氣味特點(diǎn)以及孢子顯微結(jié)構(gòu)等多源異構(gòu)數(shù)據(jù),本研究打算選用ConvNeXt架構(gòu)當(dāng)作基礎(chǔ)網(wǎng)絡(luò),借助引入跨模態(tài)注意力機(jī)制達(dá)成圖像數(shù)據(jù)和環(huán)境傳感器采集的多維特征的有效融合,構(gòu)建更具魯棒性的多模態(tài)分類決策模型。值得深入探討的是,該模型運(yùn)用跨物種遷移學(xué)習(xí)策略可把它在蘑菇分類任務(wù)中獲取的深層特征表示遷移到其他真菌或植物識(shí)別領(lǐng)域,這種做法可驗(yàn)證模型的特征泛化能力,還可以提升深度學(xué)習(xí)模型在生物分類學(xué)中的普適應(yīng)用價(jià)值。(2)小樣本學(xué)習(xí)與增量式模型優(yōu)化目前現(xiàn)有的數(shù)據(jù)集中,關(guān)于絲膜菌這類稀有菌類物種的樣本覆蓋程度依然存在著較為十分突出的欠缺之處,在實(shí)際的應(yīng)用場(chǎng)景當(dāng)中,還需要面對(duì)新物種持續(xù)不斷動(dòng)態(tài)增加所帶來(lái)的挑戰(zhàn),要解決這個(gè)問(wèn)題,可以考慮采用小樣本學(xué)習(xí)技術(shù)框架,借助元學(xué)習(xí)或者對(duì)比學(xué)習(xí)等算法策略,依據(jù)有限的標(biāo)注樣本達(dá)成對(duì)新類別的快速識(shí)別以及分類。另外可構(gòu)建增量式訓(xùn)練模型架構(gòu),在保證原有分類性能不受到影響的情況下,實(shí)現(xiàn)對(duì)新增蘑菇數(shù)據(jù)的持續(xù)學(xué)習(xí)以及模型更新,以此有效避免災(zāi)難性遺忘現(xiàn)象的出現(xiàn)。(3)邊緣計(jì)算與低功耗部署優(yōu)化當(dāng)前已有研究借助動(dòng)態(tài)量化以及TensorRT加速技術(shù)達(dá)成了模型的輕量化部署,不過(guò)在如GPU缺失的嵌入式設(shè)備這類極端資源受限的環(huán)境中,其延遲表現(xiàn)以及能耗效率依舊面臨著不小的挑戰(zhàn),針對(duì)此技術(shù)瓶頸,后續(xù)研究可從以下幾個(gè)維度取得突破:其一,借助神經(jīng)架構(gòu)搜索技術(shù)自動(dòng)構(gòu)建和特定硬件高度適配的超輕量網(wǎng)絡(luò)架構(gòu),其二,采用二值化神經(jīng)網(wǎng)絡(luò)來(lái)大幅度降低模型計(jì)算復(fù)雜度。需要注意的是,聯(lián)邦學(xué)習(xí)框架的引入可實(shí)現(xiàn)分布式模型更新機(jī)制,而且在保障用戶隱私安全的情況下還可以有效提升邊緣計(jì)算設(shè)備的智能處理能力。(4)細(xì)粒度特征解析與可解釋性增強(qiáng)蘑菇物種間形態(tài)學(xué)特征差異不明顯,當(dāng)前基于深度學(xué)習(xí)的分類模型在微觀尺度識(shí)別任務(wù)里,誤判概率較高,本研究提出從以下技術(shù)路徑提升分類性能:運(yùn)用局部特征對(duì)齊算法或者基于部件感知的注意力機(jī)制,著重優(yōu)化對(duì)菌環(huán)結(jié)構(gòu)、菌褶排列等鑒別性特征的提取能力,整合有強(qiáng)解釋性的視覺(jué)Transformer架構(gòu)以及原型學(xué)習(xí)網(wǎng)絡(luò),構(gòu)建可追溯的決策過(guò)程,具體是憑借特征熱以此來(lái)可視化技術(shù)建立菌蓋表面紋理模式與毒性程度的量化關(guān)聯(lián)模型,為真菌學(xué)領(lǐng)域的分類研究提供可驗(yàn)證的智能輔助分析系統(tǒng)。(5)實(shí)時(shí)動(dòng)態(tài)監(jiān)測(cè)與生態(tài)保護(hù)應(yīng)用拓展當(dāng)前已有的系統(tǒng)功能主要聚焦在靜態(tài)圖像識(shí)別領(lǐng)域,可是蘑菇的毒性特征以及它的生長(zhǎng)階段大多時(shí)候呈現(xiàn)出動(dòng)態(tài)演變的特性,鑒于這種情況,本研究打算引入時(shí)序分析模塊,運(yùn)用3D卷積神經(jīng)網(wǎng)絡(luò)或者時(shí)序卷積網(wǎng)絡(luò)架構(gòu),達(dá)成對(duì)蘑菇生長(zhǎng)整個(gè)周期的持續(xù)監(jiān)測(cè)以及毒性風(fēng)險(xiǎn)預(yù)警,另外借助整合無(wú)人機(jī)遙感技術(shù)和地理信息系統(tǒng)平臺(tái),可構(gòu)建野生菌類資源空間分布數(shù)據(jù)庫(kù),這對(duì)生物多樣性保護(hù)工作有幫助,還可為生態(tài)系統(tǒng)穩(wěn)定性研究提供關(guān)鍵的基礎(chǔ)數(shù)據(jù)支持。(6)倫理與安全性保障機(jī)制完善要保障蘑菇分類系統(tǒng)在實(shí)際應(yīng)用里的安全,得采取有效的辦法來(lái)防止因?yàn)檎`判而產(chǎn)生的食用風(fēng)險(xiǎn),可以搭建雙重驗(yàn)證體系,把近紅外光譜分析和質(zhì)譜檢測(cè)數(shù)據(jù)整合起來(lái)做交叉驗(yàn)證,以此提高分類結(jié)果的可靠程度,建立用戶反饋機(jī)制形成閉環(huán)管理,對(duì)誤分類案例開(kāi)展自動(dòng)化根因分析,依據(jù)這個(gè)動(dòng)態(tài)調(diào)整模型決策邊界。還要制定嚴(yán)格的倫理審查標(biāo)準(zhǔn),清晰地界定系統(tǒng)使用過(guò)程中的責(zé)任歸屬以及風(fēng)險(xiǎn)管控措施。參考文獻(xiàn)LiH,TianY,MenolliJrN,etal.Reviewingtheworld'sediblemushroomspecies:Anewevidence‐basedclassificationsystem[J].ComprehensiveReviewsinFoodScienceandFoodSafety,2021,20(2):1982-2014.DiazJamesH.Evolvingglobalepidemiology,syndromicclassification,generalmanagement,andpreventionofunknownmushroompoisonings.[J].Criticalcaremedicine,2005,33(2).ChenZ,ZhangP,ZhangZ.Investigationandanalysisof102mushroompoisoningcasesinSouthernChinafrom1994to2012[J].FungalDiversity,2014,64:123-131.盧中秋,洪廣亮,孫承業(yè),陳瀟榮,李海蛟,于學(xué)忠.中國(guó)蘑菇中毒診治臨床專家共識(shí)[J].臨床急診雜志,2019,20(08):583-598.趙漢斌,趙英淑,滕繼濮,林莉君.面對(duì)致命誘惑,怎樣成為“菇勇者”[N].科技日?qǐng)?bào),2022,(8)07-21.李林靜,李高陽(yáng),謝秋濤.毒蘑菇毒素的分類與識(shí)別研究進(jìn)展[J].中國(guó)食品衛(wèi)生雜志,2013,25(04):383-387.FukushimaK.Neocognitron:Aself-organizingneuralnetworkmodelforamechanismofpatternrecognitionunaffectedbyshiftinposition[J].Biologicalcybernetics,1980,36(4):193-202.LeCunY,BoserB,DenkerJS,etal.Backpropagationappliedtohandwrittenzipcoderecognition[J].Neuralcomputation,1989,1(4):541-551.KrizhevskyA,SutskeverI,HintonGE.Imagenetclassificationwithdeepconvolutionalneuralnetworks[J].CommunicationsoftheACM,2017,60(6):84-90.HeK,ZhangX,RenS,etal.Deepresiduallearningforimagerecognition[C]//ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition.2016:770-778.XieS,GirshickR,DollárP,etal.Aggregatedresidualtransformationsfordeepneuralnetworks[C]//ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition.2017:1492-1500.LiuZ,MaoH,WuCY,etal.Aconvnetforthe2020s[C]//ProceedingsoftheIEEE/CVFConferenceonComputerVisionandPatternRecognition.2022:11976-11986.VaswaniA,ShazeerN,ParmarN,etal.Attentionisallyouneed[J].Advancesinneuralinformationprocessingsystems,2017,30.DosovitskiyA,BeyerL,KolesnikovA,etal.Animageisworth16x16words:Transformersforimagerecognitionatscale[J].arXivpreprintarXiv:2020,119-129.LiuZ,LinY,CaoY,etal

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論