CN120213831A 一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法和系統(tǒng)_第1頁
CN120213831A 一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法和系統(tǒng)_第2頁
CN120213831A 一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法和系統(tǒng)_第3頁
CN120213831A 一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法和系統(tǒng)_第4頁
CN120213831A 一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法和系統(tǒng)_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

(19)國家知識產(chǎn)權局(22)申請日2025.05.28地址311300浙江省杭州市臨安區(qū)武肅街GO6N3/0464(2023.01)王張婷戴宇佳(74)專利代理機構北京高沃律師事務所11569專利代理師李領帥G01N一種金線蓮植株葉片真?zhèn)舞b別與品系分類本申請公開了一種金線蓮植株葉片真?zhèn)舞b視角光譜數(shù)據(jù);對多視角光譜數(shù)據(jù)進行預處理;用于金線蓮植株葉片真?zhèn)舞b別與品系分類的場景中,可以有效提高金線蓮植株葉片真?zhèn)舞b別與型中,輸出真?zhèn)舞b別結果21.一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法,其特征在于,包括:獲取待測植株樣品的多視角光譜數(shù)據(jù);所述多視角光譜數(shù)據(jù)包括所述待測植株樣品的每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù);對所述多視角光譜數(shù)據(jù)進行預處理,得到預處理后的多視角光譜數(shù)據(jù);將所述預處理后的多視角光譜數(shù)據(jù)輸入至預訓練SVM模型中,輸出真?zhèn)舞b別結果;所述預訓練SVM模型指的是基于金線蓮樣品以及偽品樣品的預處理后的多視角光譜數(shù)據(jù),對SVM模型與預處理模型進行共同調參,尋找到最優(yōu)參數(shù)后進行訓練后得到的模型,所述預處理模型指的是濾波算法對應的模型;當所述真?zhèn)舞b別結果為所述待測植株樣品是金線蓮樣品時,將所述待測植株樣品的預處理后的多視角光譜數(shù)據(jù)輸入至預訓練CNN模型中,輸出品系分類結果;所述預訓練CNN模型指的是基于金線蓮樣品的預處理后的多視角光譜數(shù)據(jù),對CNN模型與所述預處理模型進行共同調參,尋找到最優(yōu)參數(shù)后進行訓練后得到的模型。2.根據(jù)權利要求1所述的金線蓮植株葉片真?zhèn)舞b別與品系分類方法,其特征在于,獲取待測植株樣品的多視角光譜數(shù)據(jù),具體包括:對所述待測植株樣品進行清洗處理,得到清洗后的待測植株樣品;對所述清洗后的待測植株樣品進行風干處理,得到風干后的待測植株樣品;采集所述風干后的待測植株樣品的每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù),得到多視角光譜數(shù)據(jù)。3.根據(jù)權利要求2所述的金線蓮植株葉片真?zhèn)舞b別與品系分類方法,其特征在于,采集所述風干后的待測植株樣品的每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù),得到多視角光譜采用GaiaField-N17E型號的高光譜成像系統(tǒng),分別掃描所述風干后的待測植株樣品的每片葉片的正面和背面,以采集每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù),得到多視角光4.根據(jù)權利要求1所述的金線蓮植株葉片真?zhèn)舞b別與品系分類方法,其特征在于,對所述多視角光譜數(shù)據(jù)進行預處理,得到預處理后的多視角光譜數(shù)據(jù),具體包括:對所述多視角光譜數(shù)據(jù)進行黑白校正,得到黑白校正后的多視角光譜數(shù)據(jù);對所述黑白校正后的多視角光譜數(shù)據(jù)進行感興趣區(qū)域提取,得到預處理后的多視角光5.根據(jù)權利要求1所述的金線蓮植株葉片真?zhèn)舞b別與品系分類方法,其特征在于,在對所述預訓練SVM模型進行訓練前,采用StandardScaler對所述預處理后的多視角光譜數(shù)據(jù)進行標準化處理;在對所述預訓練SVM模型進行訓練時,采用網(wǎng)格搜索和五倍交叉驗證的方F1分數(shù)和混淆矩陣作為評估指標進行模型性能評估。6.根據(jù)權利要求1所述的金線蓮植株葉片真?zhèn)舞b別與品系分類方法,其特征在于,所述濾波算法為中值濾波算法、平均濾波算法、高斯濾波算法、Savitzky-Golay濾波算法和主成分分析法其中至少一種。7.根據(jù)權利要求1所述的金線蓮植株葉片真?zhèn)舞b別與品系分類方法,其特征在于,所述38.一種金線蓮植株葉片真?zhèn)舞b別與品系分類系統(tǒng),其特征在于,包括存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)權利要求1-7任一項所述的金線蓮植株葉片真?zhèn)舞b別與品系分類方法。4一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法和系統(tǒng)技術領域[0001]本申請涉及植物葉片鑒別分類技術領域,特別是涉及一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法和系統(tǒng)。背景技術[0002]目前,金線蓮的品質鑒定通常依賴于化學分析方法,主要包括目視檢查、顯微鑒定法、高效液相色譜法、DNA分子鑒定法和近紅外光譜檢測技術等,然而這些方法普遍主觀性較強,準確性較低。因此,如何提高金線蓮植株葉片真?zhèn)舞b別與品系分類的準確性,成為了本領域亟待解決的一個技術問題。發(fā)明內容[0003]本申請的目的是提供一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法和系統(tǒng),可以有效提高金線蓮植株葉片真?zhèn)舞b別與品系分類的準確性。[0004]為實現(xiàn)上述目的,本申請?zhí)峁┝巳缦路桨?。[0005]第一方面,本申請?zhí)峁┝艘环N金線蓮植株葉片真?zhèn)舞b別與品系分類方法,具體包括以下步驟。[0006]獲取待測植株樣品的多視角光譜數(shù)據(jù);所述多視角光譜數(shù)據(jù)包括所述待測植株樣品的每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù)。[0007]對所述多視角光譜數(shù)據(jù)進行預處理,得到預處理后的多視角光譜數(shù)據(jù)。[0008]將所述預處理后的多視角光譜數(shù)據(jù)輸入至預訓練SVM模型中,輸出真?zhèn)舞b別結果;所述預訓練SVM模型指的是基于金線蓮樣品以及偽品樣品的預處理后的多視角光譜數(shù)據(jù),對SVM模型與預處理模型進行共同調參,尋找到最優(yōu)參數(shù)后進行訓練后得到的模型,所述預處理模型指的是濾波算法對應的模型。[0009]當所述真?zhèn)舞b別結果為所述待測植株樣品是金線蓮樣品時,將所述待測植株樣品的預處理后的多視角光譜數(shù)據(jù)輸入至預訓練CNN模型中,輸出品系分類結果;所述預訓練CNN模型指的是基于金線蓮樣品的預處理后的多視角光譜數(shù)據(jù),對CNN模型與所述預處理模型進行共同調參,尋找到最優(yōu)參數(shù)后進行訓練后得到的模型。[0011]對所述待測植株樣品進行清洗處理,得到清洗后的待測植株樣品。[0012]對所述清洗后的待測植株樣品進行風干處理,得到風干后的待測植株樣品。[0013]采集所述風干后的待測植株樣品的每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù),得到多視角光譜數(shù)據(jù)。[0014]可選地,采集所述風干后的待測植株樣品的每片葉片的正面光譜數(shù)據(jù)和背面光譜[0015]采用GaiaField-N17E型號的高光譜成像系統(tǒng),分別掃描所述風干后的待測植株樣品的每片葉片的正面和背面,以采集每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù),得到多視5角光譜數(shù)據(jù)。[0016]可選地,對所述多視角光譜數(shù)據(jù)進行預處理,得到預處理后的多視角光譜數(shù)據(jù),具體包括以下步驟。[0017]對所述多視角光譜數(shù)據(jù)進行黑白校正,得到黑白校正后的多視角光譜數(shù)據(jù)。[0018]對所述黑白校正后的多視角光譜數(shù)據(jù)進行感興趣區(qū)域提取,得到預處理后的多視角光譜數(shù)據(jù)。[0019]可選地,在對所述預訓練SVM模型進行訓練前,采用StandardScaler對所述預處理后的多視角光譜數(shù)據(jù)進行標準化處理;在對所述預訓練SVM模型進行訓練時,采用網(wǎng)格搜索和五倍交叉驗證的方法優(yōu)化超參數(shù),包括懲罰參數(shù)、核類型、伽馬和多項式次數(shù);并采用Golay濾波算法和主成分分析法其中至少一種。[0022]第二方面,本申請?zhí)峁┝艘环N金線蓮植株葉片真?zhèn)舞b別與品系分類系統(tǒng),包括存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)上述所述的金線蓮植株葉片真?zhèn)舞b別與品系分類方法。[0023]根據(jù)本申請?zhí)峁┑木唧w實施例,本申請具有了以下技術效果:本申請?zhí)峁┝艘环N金線蓮植株葉片真?zhèn)舞b別與品系分類方法和系統(tǒng),將多視角光譜數(shù)據(jù)、SVM模型和CNN模型進行結合,并應用于金線蓮植株葉片真?zhèn)舞b別與品系分類的場景中,實現(xiàn)了高光譜成像技術和機器學習技術的有效結合。其中,通過獲取待測植株樣品每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù),形成多視角光譜數(shù)據(jù),以此為基礎,在金線蓮和偽品品種的真?zhèn)舞b別方面,通過使用預訓練SVM模型,利用正反兩面葉片的光譜數(shù)據(jù),可以精準區(qū)分金線蓮和偽品品種,實現(xiàn)金線蓮植株葉片真?zhèn)蔚木珳疏b別。在不同品種的金線蓮的分類方面,通過引入預訓練CNN模型,結合正反兩面葉片的光譜數(shù)據(jù),可以有效提高了模型模型進行結合,可以有效提高金線蓮植株葉片真?zhèn)舞b別與品系分類的準確性。附圖說明[0024]為了更清楚地說明本申請實施例或現(xiàn)有技術中的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。[0025]圖1為本申請一實施例提供的一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法的流程示意圖。[0026]圖2為本申請一實施例提供的高光譜成像系統(tǒng)的結構示意圖。[0027]圖3為本申請一實施例提供的1D-CNN模型的結構示意圖。[0028]圖4為本申請一實施例提供的訓練過程中損失函數(shù)損失值隨訓練次數(shù)變化的曲線[0029]圖5為本申請一實施例提供的訓練過程中準確率隨訓練次數(shù)變化的曲線圖。6[0030]圖6為本申請一實施例提供的訓練后的1D-CNN模型在測試集上的混淆矩陣示意具體實施方式[0031]下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他性植物的方法需要在專業(yè)人士的指導下進行,并且存在主觀性強,過程耗時且精度低,操作過程復雜且費用昂貴等缺陷,不僅勞動強度大,而且會破壞樣品,最重要的是往往無法區(qū)分細微的種間變異。[0033]近年來,光譜技術的進步有望解決上述問題。例如,相關技術中利用近紅外光譜技術結合化學計量學,建立偏最小二乘判別分析(PLS-DA)模型,實現(xiàn)了對真品金線蓮粉及其兩種偽品的準確區(qū)分。相關技術中還有利用近紅外光譜技術獲取金線蓮及其摻假品的光譜數(shù)據(jù),并設計了改進的一維卷積神經(jīng)網(wǎng)絡(1D-CNN)模型來處理近紅外光譜數(shù)據(jù),區(qū)分真假金線蓮。此外,相關技術中還有一種基于手持式近紅外光譜儀和AdaBoost(AdaptiveBoosting,自適應提升)集成學習的金線蓮品種快速精準分類模型,分類的正確率高達95.6%。這些研究表明,近紅外光譜法在檢測金線蓮方面具有很高的準確度,但其應用通常僅限于植物的粉末形式,需要研磨、壓縮或其他樣品制備方法。[0034]高光譜成像(HyperSpectralImaging,HSI)可以捕獲數(shù)百個連續(xù)波段的空間和光譜信息,并保持樣品的完整性,捕獲電磁波譜中的廣泛光譜帶,提供詳細的光譜信息,可用于精確的材料識別和質量評估。相關技術中有一種高光譜模型,利用光譜數(shù)據(jù)分析技術檢測金線蓮中的黃酮類化合物和多糖含量。然而,其在真實性識別和多品種分類方面的潛力仍未得到探索。此外,現(xiàn)有研究通常依賴于單視圖光譜數(shù)據(jù)(例如,葉片正面),而忽略了多視圖視角中嵌入的互補信息(例如,葉片的正面和背面)。[0035]機器學習(MachineLearning,ML)和深度學習(DeepLearning,DL)徹底改變了高維數(shù)據(jù)集中的模式識別,使其成為分析高光譜數(shù)據(jù)的理想選擇。雖然傳統(tǒng)的機器學習模型被廣泛使用,但它們的性能在很大程度上取決于手動特征選擇和預處理。相比之下,像卷積神經(jīng)網(wǎng)絡(CNN)這樣的深度學習架構可以自主提取判別特征,從而實現(xiàn)端到端分類。然而,目前現(xiàn)有技術中并沒有將多視圖高光譜成像與混合機器學習/深度學習框架相結合的先例,來解決金線蓮的真實性驗證和物種內分類的雙重挑戰(zhàn)。[0036]本實施例旨在提出一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法和系統(tǒng),將高光譜成像與機器學習進行結合,以非破壞性、高精度的方式識別金線蓮及其假冒品種,從而彌補上述現(xiàn)有方法的缺陷,不僅推動高光譜在藥用植物認證中的應用,而且還為草藥市場的質量保證提供了可擴展的非破壞性解決方案,有助于保障消費者健康,并促進傳統(tǒng)醫(yī)藥行業(yè)的可持續(xù)實踐。[0037]使本申請的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結合附圖和具體實施方式對本申請作進一步詳細的說明。7[0038]如圖1所示,本實施例提供了一種金線蓮植株葉片真?zhèn)舞b別與品系分類方法,具體包括以下步驟。[0039]步驟S1、獲取待測植株樣品的多視角光譜數(shù)據(jù)。其中,多視角光譜數(shù)據(jù)包括待測植株樣品的每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù)。[0040]本實施例中,步驟S1獲取待測植株樣品的多視角光譜數(shù)據(jù),具體包括以下步驟。[0041]步驟S11、對所述待測植株樣品進行清洗處理,得到清洗后的待測植株樣品。[0042]步驟S12、對所述清洗后的待測植株樣品進行風干處理,得到風干后的待測植株樣[0043]步驟S13、采集所述風干后的待測植株樣品的每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù),得到多視角光譜數(shù)據(jù)。[0044]本實施例中,步驟S13采集所述風干后的待測植株樣品的每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù),得到多視角光譜數(shù)據(jù),具體包括以下步驟。[0045]采用GaiaField-N17E型號的高光譜成像系統(tǒng),分別掃描所述風干后的待測植株樣品的每片葉片的正面和背面,以采集每片葉片的正面光譜數(shù)據(jù)和背面光譜數(shù)據(jù),得到多視角光譜數(shù)據(jù)。[0046]步驟S2、對多視角光譜數(shù)據(jù)進行預處理,得到預處理后的多視角光譜數(shù)據(jù)。[0047]本實施例中,步驟S2對所述多視角光譜數(shù)據(jù)進行預處理,得到預處理后的多視角[0048]步驟S21、對所述多視角光譜數(shù)據(jù)進行黑白校正,得到黑白校正后的多視角光譜數(shù)[0049]步驟S22、對所述黑白校正后的多視角光譜數(shù)據(jù)進行感興趣區(qū)域(RegionOfInterest,ROI)提取,得到預處理后的多視角光譜數(shù)據(jù)。[0050]步驟S3、將預處理后的多視角光譜數(shù)據(jù)輸入至預訓練SVM(支持向量機)模型中,輸出真?zhèn)舞b別結果。其中,預訓練SVM模型指的是基于金線蓮樣品以及偽品樣品的預處理后的多視角光譜數(shù)據(jù),對SVM模型與預處理模型進行共同調參,尋找到最優(yōu)參數(shù)后進行訓練后得[0051]本實施例中,在對所述預訓練SVM模型進行訓練前,采用StandardScaler(標準化工具)對所述預處理后的多視角光譜數(shù)據(jù)進行標準化處理;在對所述預訓練SVM模型進行訓練時,采用網(wǎng)格搜索和五倍交叉驗證的方法優(yōu)化超參數(shù),包括懲罰參數(shù)、核類型、伽馬(gamma)和多項式次數(shù);并采用準確率(Accuracy)、精確率(Precision)、召回率(Recall)和F1-score(F1分數(shù))和混淆矩陣作為評估指標進行模型性能評估。[0052]本實施例中,預處理模型指的是預處理方法對應的模型,具體為各種濾波算法對應的模型。其中,濾波算法為中值濾波(MF)算法、平均濾波(AF)算法、高斯濾波(GF)算法、Savitzky-Golay(SG)濾波算法和主成分分析法(PCA)其中至少一種。[0053]步驟S4、當真?zhèn)舞b別結果為待測植株樣品是金線蓮樣品時,將待測植株樣品的預型指的是基于金線蓮樣品的預處理后的多視角光譜數(shù)據(jù),對CNN模型與預處理模型進行共同調參,尋找到最優(yōu)參數(shù)后進行訓練后得到的模型。因此,預訓練CNN模型實質是已經(jīng)訓練8[0057]本實施例在采集多視角光譜數(shù)據(jù)之前,使用蒸餾水清并在25℃和60%濕度的實驗室條件下進行風干,然后再開始步驟二中的多視角光譜數(shù)據(jù)的統(tǒng)的光譜范圍覆蓋900nm至1700nm,光譜分辨率為5nm,空間分辨率為512個波段的640像素。9表示黑板標定圖像。[0065]本實施例在光譜數(shù)據(jù)提取過程中,首先去除校正后高光譜圖像中的黑色背景,以便準確地提取出每個樣品的感興趣區(qū)域,這一步驟通過選擇一個特定波長的灰度圖像,并運用最大類間方差法(OTSU)確定一個最佳閾值來實現(xiàn)。其中,超過閾值的區(qū)域被標識為將其應用于整個高光譜圖像立方體,有效地去除了黑色背景。為了提高預測的準確性和再現(xiàn)性,將每幅高光譜圖像中稻谷/精米像元的反射率值取平均,提取每個樣品的平均光譜。然后,對于同一樣品掃描的兩張高光譜圖像提取出的平均光譜再次進行平均處理,最終獲得的結果作為該樣品對應的光譜數(shù)據(jù),為后續(xù)分析提供基礎。隨后,利用軟件ENVI(遙感圖像處理軟件)對每個樣品的感興趣區(qū)域進行光譜提取。在軟件ENVI中,用矩形框將每個樣品等分成四份,隨機選擇每個樣品的四分之一作為感興趣區(qū)域,感興趣區(qū)域內的每個像素包含一組不同的光譜信息,通過對該區(qū)域內所有像素的光譜反射率取平均值,即可得到樣品的最終光譜值。[0066]本實施例可以采用中值濾波濾波算法、主成分分析法等多種濾波技術對高光譜數(shù)據(jù)進行預處理,以降低噪聲并提高數(shù)據(jù)質量,確保后續(xù)分析的準確性和穩(wěn)健性。[0067]中值濾波算法是一種非線性濾波技術,用鄰域的中值替換每個像素值。此方法在去除椒鹽噪聲方面特別有效。濾波過程包括指定窗口大小以確定每個像素的鄰域,然后計算該鄰域內的中值并替換原始像素值。中值濾波保留邊緣細節(jié),特別適用于去除脈沖噪聲而不會使圖像過于模糊。中值濾波的核心參數(shù)是kernel_size(內核大小),kernel_size決定了濾波時使用的鄰域范圍。kernel_size加入了超參數(shù)搜不同的kernel_size,結合分類器的其他超參數(shù),通過交叉驗證選擇最佳的參數(shù)組合。[0068]平均濾波算法的工作原理是將每個像素值替換為其相鄰像素的平均值。它可以有效地減少隨機噪聲,但可能會模糊邊緣,使其在保留精細細節(jié)方面效果較差。這種方法計算簡單、高效,是高光譜數(shù)據(jù)初始降噪的熱門選擇。在模型中,平均濾波被封裝為一個自定義器學習庫)提供的一個工具,用于將多個數(shù)據(jù)預處理和模型訓練步驟整合到一個統(tǒng)一的流程中,確保數(shù)據(jù)按照預設的順序依次經(jīng)過各個步驟,并且可以與GridSearchCV(網(wǎng)格搜索交叉驗證)結合,實現(xiàn)超參數(shù)的自動調優(yōu)??烧{參數(shù)具體包括window_size(窗口大小),用于控制每個數(shù)據(jù)點計算均值時的鄰域范圍。自動調參的范圍在GridSearchCV中window_size被設定為{2,3,4,5},即網(wǎng)格搜索會測試這些不同的窗口大小,并選擇最優(yōu)值。在整個流程中,GridSearchCV通過交叉驗證不同的window_size組合,并結合分類器的其他超參數(shù)尋找最優(yōu)參數(shù)配置。最終訓練出的最佳模型會采用最優(yōu)的window_size,確保濾波后的光譜數(shù)據(jù)能夠更好地適配分類任務,提高分類精度。[0069]高斯濾波算法是一種常見的平滑技術,它使用高斯函數(shù)對相鄰像素值進行加權,賦予靠近中心的像素更高的權重。與平均濾波算法相比,高斯濾波算法可平滑圖像,同時保留中心區(qū)域的更多細節(jié)。高斯濾波算法廣泛應用于高光譜數(shù)據(jù)預處理,因為它可以有效降低噪聲,同時最大限度地減少模糊效果。本實施例定義了一個自定義的高斯濾波變換器,利用scipy.ndimage模塊中的gaussian_filter函數(shù)對光譜數(shù)據(jù)進行平滑處理。該高斯濾波變換器的sigma參數(shù)控制濾波的平滑程度,較小的sigma值保留更多細節(jié),而較大的sigma值則會產(chǎn)生更強的平滑效果。為了優(yōu)化高斯濾波參數(shù)對分類任務的影響,本實施例在Pipeline中集成了高斯濾波變換器作為數(shù)據(jù)預處理步驟,并使用GridSearchCV進行超參數(shù)搜索。行網(wǎng)格搜索,以找到最佳的參數(shù)組合。最終,本實施例通過在測試集上的分類結果評估高斯[0070]Savitzky-Golay濾波算法是一種常用于信號處理的平滑方法,它在滑動窗口內應用多項式擬合來平滑數(shù)據(jù),從而降低高頻噪聲。在高光譜算法有助于平滑小的隨機波動,同時保留主要信號特征。Savitzky-Golay濾波算法的關鍵參數(shù)包括窗口長度(window_length)和多項式階數(shù)(polyorder),其中,窗口長度用于定義滑動窗口的大小,必須為奇數(shù),決定了濾波過程中所考慮的光譜點數(shù)量。較小的窗口長度能夠更好地保留細節(jié),但抗噪能力較弱,而較大的窗口長度能夠提高平滑效果,但可能會導致細節(jié)損失。本實施例選取5、7、9三種窗口大小進行自動調參。多項用于擬合數(shù)據(jù)的多項式階數(shù)。階數(shù)較低時,濾波效果更平滑,但可能會損失部分光譜信息;階數(shù)較高時,可以更準確地保留光譜曲線的局部變化特征。本實施例選取2、3、4三種階數(shù)進行實驗比較。通過GridSearchCV進行自動調參,結合分類模型,對不同參數(shù)組合下的分類性能進行評估,以確定最佳的SG濾波參數(shù)。最終選定的參數(shù)能夠在降噪的同時,保持光譜數(shù)據(jù)的關鍵特征,從而提高分類模型的準確性。[0071]PCA算法是一種用于數(shù)據(jù)降維的無監(jiān)督統(tǒng)計方法,它通過最大化數(shù)據(jù)的方差來提取最重要的特征,稱為主成分。在光譜分析中,PCA算法可以幫助識別樣品之間的差異和潛在的化學變化。在本實施例中,PCA算法用于降維,以減少光譜數(shù)據(jù)的維度,提高效率,并降低數(shù)據(jù)的冗余性和噪聲干擾。PCA變換器的參數(shù)包括n_components(主成分數(shù))、pca.fit(X)和pca.transform(X),其中,n_components默認為10,用于表示降維后的數(shù)據(jù)維度。該參數(shù)決定保留的主成分個數(shù),通常根據(jù)累計方差貢獻率(如95%以上)來選擇合適的數(shù)據(jù)投影到主成分空間,實現(xiàn)降維。在GridSearchCV過程中,PCA算法先對光譜數(shù)據(jù)進行降維,然后結合StandardScaler處理數(shù)據(jù),結合分類器的其他超參數(shù),通過交叉驗證選擇最佳的參數(shù)組合,這樣不僅能減少數(shù)據(jù)的復雜度,還能提高模型的泛化能力。間進行鑒別。SVM模型可確定最大化不同類別之間邊距的最佳超平面,具有強大的泛化能力。選擇徑向基函數(shù)(rbf)核,是因為它在處理非線性數(shù)據(jù)模式方面非常有效。在訓練之前,使用StandardScaler對光譜數(shù)據(jù)進行標準化,以確保特征尺度的一致性。使用網(wǎng)格搜索和精確度、召回率、F1分數(shù)和混淆矩陣評估模型性能,從而全面評估分類準確度和誤差。具體步驟如下。[0074]首先劃分數(shù)據(jù)集,數(shù)據(jù)來源為存儲在Excel文件中的實驗數(shù)據(jù),其中第一行為光譜波長特征;第2行至第81行為光譜數(shù)據(jù),共80個樣品,每個樣品包含440維光譜特征。對于標11簽構建,真樣品(類別0):40個樣品;偽品(類別1):40個樣品。對于標準化,由于光譜數(shù)據(jù)的數(shù)值范圍較大,本實施例使用StandardScaler進行標準化(均值為0,標準差為1),確保所有特征在同一尺度上,有助于SVM的穩(wěn)定訓練。對于訓練集/測試集的劃分,80%訓練集(64個樣品),20%測試集(16個樣品)。stratify=labels確保兩類樣品在訓練集和測試集中的比例數(shù)包括核函數(shù)(kernel)、linear(線性核)、rbf、正則化參數(shù)(C)、伽馬參數(shù)和多項式核的復雜的模式。正則化參數(shù)也叫懲罰參數(shù),控制模型對誤分類的容忍度,正則化參數(shù)越大,模型對誤分類的容忍度越低,決策邊界更嚴格。本實施例從[0.1,1,10,100]四個正則化參數(shù)值中與其他參數(shù)組合。伽馬參數(shù)僅適用于徑向基函數(shù)核,用于控制單個訓練樣品對分類邊界的影響范圍,伽馬參數(shù)越大,影響范圍越小,決策邊界更復雜。本實施例中自動選擇核函數(shù)的系數(shù)('gamma':['scale’,'auto’])。多項式核的degree,僅當kernel='poly'時生效,控制多項式核的階數(shù),影響決策邊界的復雜度,本實施例中從[3,4,5]三個多項式核數(shù)選[0076]在訓練過程中,本實施例定義SVM分類器形式為SVM=SVC),對于超參數(shù)優(yōu)化,在五折交叉驗證下測試不同的超參數(shù)組合。[0077]通過GridSearchCV遍歷所有可能的參數(shù)組合,基于交叉驗證的準確率評分選擇最佳參數(shù)。[0078]本實施例設置以下評估指標:準確率:分類正確的比例。精確率:模型預測的正類中實際正確的比例。召回率:實際正類中被模型正確識別的比例。F1-score:精確率和召回率的加權調和平均值?;煜仃嚕河糜谥庇^展示模型預測的正確與錯誤分類情況。基于上述Scaler進行標準化,提高分類效果。然后超自動選擇最優(yōu)的正則化參數(shù)、伽馬和核函數(shù),防止過擬合或欠擬合。對于核函數(shù)選擇,線性核適用于簡單分類問題,rbf核適用于更復雜的非線性分類任務。交叉驗證時使用五折交叉驗證,確保模型在不同數(shù)據(jù)子集上的穩(wěn)定性,提高泛化能力。[0080]本實施例利用SVM模型結合基于GridSearchCV的超參數(shù)優(yōu)化,有效實現(xiàn)了對真?zhèn)谓鹁€蓮葉片光譜數(shù)據(jù)的分類。采用標準化預處理提升了模型的穩(wěn)定性,并通過交叉驗證選擇最優(yōu)超參數(shù),最終獲得了100%分類準確率。[0082]本實施例完成金線蓮葉片的真?zhèn)舞b別之后,對于其中真正的金線蓮葉片進行品系分類。本實施例將CNN模型與SVM模型、KNN(K-NearestNeighbors,K最近鄰)模型、LDA(LinearDiscriminantAnalysis,線性判別分析)模型等多種模型進行金線蓮的品系分類算法等濾波算法后得到的相應衍生模型加入到品系分類性能對比實驗中,表1示出了CNN模型與其它多種模型進行品系分類性能對比結果。[0083]表1不同模型的品系分類性能對比結果模型召回率葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面葉片背面葉片正面和背[0084]根據(jù)表1可直觀看出,CNN模型在葉片正面和背面光譜合并的情況下,其準確率、精確率、召回率和F1分數(shù)的值均為1,各項指標值均達到最高,這證明了CNN模型在金線蓮葉片正反面高光譜融合的品系分類任務方面具有很大優(yōu)勢,可以精準實現(xiàn)金線蓮的品系分類。因此,本實施例采用CNN模型對九個金線蓮品種進行分類。為了實現(xiàn)高光譜數(shù)據(jù)的分類任務,本實施例構建了一個1D-CNN模型,該1D-CNN模型包含多個卷積層、池化層和全連接層,采用L1正則化以提高泛化能力。[0085]本實施例首先讀取Excel文件中的高光譜數(shù)據(jù),并對其進行步驟三中使用的多種為ReLU激活函數(shù),并采用L1正則化,正則化參數(shù)λ=0.001。第二層為最大池化層(Max[0087]本實施例優(yōu)化與訓練的過程中,損失函數(shù)采用稀疏分類交叉熵(SparseCategoricalCrossentropy)。優(yōu)化器使用Adasparse_categorical_crossentropy,度量指標為準確率。訓練策略是批量大小為32,訓練中的損失函數(shù)使用了稀疏分類交叉熵損失,該稀疏分類交叉熵損失適用于多類分類問題,5說明了訓練過程中的準確率趨勢,從圖5可以看出,隨著訓練的進行,訓練集準確率(TrainingAccuracy)和驗證集準確類別,預測標簽指的是1D-CNN模型預測出的樣品的類別。這一結果證明了多視角光譜融合模型的卓越性能,該1D-CNN模型成功地利用了葉片正面和背面的光譜數(shù)據(jù)來提高分類準確[0091]如圖6所示,100%的準確率可以歸因于互補性、數(shù)據(jù)增強以及模型結構和優(yōu)化中的特征多樣性等因素。通過使用來自葉片正面和背面的光譜數(shù)據(jù),該模型利用多視圖信息,提供更豐富的特征表示。葉片正面和背面的光譜響應可能在某些物理特性上有所不同,例如光反射和散射特性。這些差異有助于捕捉葉片的不同結構和成分,最終提高分類精度。來自正面和背面的光譜數(shù)據(jù)是互補的,增強了模型的穩(wěn)健性和準確性。此外,不同葉片種類表現(xiàn)出明顯的光譜差異,特別是在特定波長區(qū)域。正面和背面光譜提供不同角度的信息,有助于更好地捕捉這些細微的光譜差異。通過結合這一額外的特征維度(即正面光譜和背面光譜),模型獲得了更多信息,從而提高了其泛化能力。特征多樣性的引入使模型能夠在訓練期間識別更多潛在模式,從而提高分類準確性。[0092]與傳統(tǒng)的手工特征提取方法相比,像CNN模型這樣的深度學習模型可以通過端到端訓練自動學習最佳特征組合,從而實現(xiàn)更精確的分類。隨著網(wǎng)絡中層數(shù)和神經(jīng)元數(shù)量的增加,該模型可以處理更復雜的光譜數(shù)據(jù)并提取更深層次的特征。總體而言,本實施例使用的定性模型表現(xiàn)出了出色的訓練性能和泛化能力。這些結果凸顯了基于CNN模型在高光譜數(shù)據(jù)分類中的潛力,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論