版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
本科畢業(yè)設計(論文)基于生物光子輻射和SVM算法的玉米品種分類的應用研究摘要玉米作為世界的三大農作物之一,在實際生活中,會因為種植環(huán)境不同而表現(xiàn)出多樣化的生長結果,最終會導致收成的差異。然而,當前玉米品種的分類主要借助于感官判別法和化學實驗法,兩種方法其中一種會對環(huán)境和樣本本身造成一定的損壞,另一種主要依靠研究人員自身的鑒別經(jīng)驗。本研究旨在通過生物光子探測儀精確采集不同品種玉米的自發(fā)光信號,并在支持向量機(SupportVectorMachine,簡稱SVM)的基礎上,構建一套快速、無損、準確的玉米品種分類識別模型。自發(fā)發(fā)光是指由自然過程引起的生物體內部產生的光輻射現(xiàn)象,這種發(fā)光現(xiàn)象與生物體內部的生命過程密切相關。而SVM算法的基本思想是,先將在較低維空間中的原始數(shù)據(jù)映射到近似線性可分的一個高維空間中,然后在高維空間中進行基于最大間隔原則的線性學習。本研究將兩種技術進行結合促進快速、無損、準確的分類模型的構建。首先,收集不同品種的玉米樣本,確保樣本的多樣性和代表性。隨后,利用超微弱發(fā)光儀對這些樣本的自發(fā)光信號進行了精確采集。采集工作完成后,進行數(shù)據(jù)預處理工作,接著,通過特征提取技術,從預處理后的數(shù)據(jù)中提取出了對分類任務至關重要的特征數(shù)據(jù)。并利用這些數(shù)據(jù),進行SVM模型訓練,同時不斷優(yōu)化模型的參數(shù)和結構,以提高其分類性能。最后,本研究根據(jù)分類評估結果,在所搭建模型的基礎上添加或調整核函數(shù)進行進一步的模型優(yōu)化,成功構建了一套基于生物光子信號和SVM算法的玉米品種分類識別模型。本項目為農業(yè)種植領域提供了一種新的技術手段,也為日后相關領域的研究提供了有益的參考和借鑒。關鍵詞:玉米品種分類,生物光子,支持向量機,核函數(shù) 基于UML的電廠信息管理系統(tǒng)建模研究ApplicationResearchonCornVarietyClassificationBasedonBiophotonRadiationandSVMAlgorithmAbstractCorn,asoneofthethreemajorcropsintheworld,exhibitsdiversegrowthoutcomesinpracticallifeduetodifferentplantingenvironments,ultimatelyleadingtodifferencesinharvest.However,thecurrentclassificationofcornvarietiesmainlyreliesonsensorydiscriminationandchemicalexperimentalmethods.Oneofthesemethodscancausecertaindamagetotheenvironmentandthesampleitself,whiletheothermainlyreliesontheidentificationexperienceofresearchersthemselves.Theaimofthisstudyistoaccuratelycollecttheselfluminoussignalsofdifferentvarietiesofcornusingabiophotondetector.AndbasedonSupportVectorMachine(SVM),afast,non-destructive,andaccuratecornvarietyclassificationandrecognitionmodelisconstructed.Spontaneousluminescencereferstothephenomenonoflightradiationgeneratedwithinanorganismcausedbynaturalprocesses.Thisluminescencephenomenoniscloselyrelatedtotheinternallifeprocessesoforganisms.ThebasicideaoftheSVMalgorithmistofirstmaptherawdatainalowerdimensionalspacetoanapproximatelylinearlyseparablehigh-dimensionalspace,andthenperformlinearlearningbasedonthemaximumintervalprincipleinthehigh-dimensionalspace.Thisstudycombinestwotechnologiestopromotetheconstructionoffast,non-destructive,andaccurateclassificationmodels.Firstly,collectsamplesofdifferentvarietiesofcorntoensurediversityandrepresentativenessofthesamples.Subsequently,theselfluminoussignalsofthesesampleswereaccuratelycollectedusingabiophotondetector.Afterthecollectionworkiscompleted,datapreprocessingworkiscarriedout.Then,throughfeatureextractiontechnology,thecrucialfeaturedatafortheclassificationtaskisextractedfromthepreprocesseddata.AndusethisdatatotraintheSVMmodel,whilecontinuouslyoptimizingtheparametersandstructureofthemodeltoimproveitsclassificationperformance.Finally,basedontheclassificationevaluationresults,thisstudyfurtheroptimizesthemodelbyaddingoradjustingkernelfunctionsonthebasisoftheconstructedmodel.SuccessfullyconstructedacornvarietyclassificationandrecognitionmodelbasedonbiophotonsignalsandSVMalgorithm.Thisprojectprovidesanewtechnologicalmeansforthefieldofagriculturalplanting,andalsoprovidesusefulreferenceandinspirationforfutureresearchinrelatedfields.KeyWords:cornvarietyclassification,biophoton,supportvectormachine,kernelfunction目錄TOC\h\z\t"樣式1,1,樣式2,2,樣式3,3,參考文獻,1,致謝,1,附錄,1"1緒論 [23]。下面將依次對這些核函數(shù)進行介紹。(1)線性核函數(shù)在本質上是一維的,而且線形核被認為是最基本的核類型。在特征比較多的情況下,它被證明是最好的分類函數(shù)。定義式如下,其中Xi和X KXi(2)多項式核是線性核更廣義的一種表示,可以將輸入空間中的數(shù)據(jù)映射到高維特征空間,是常用的非線性核之一,后續(xù)將在在高維空間中進行線性分類。 KX,然而,由于多項式核的參數(shù)相對較多,核矩陣的元素值在其階數(shù)較高的情況下可能會趨向無窮,計算復雜度也會隨之劇增,所以不像其他核函數(shù)一樣那么受歡迎。(3)高斯核函數(shù)具有很強的局部性,能夠處理復雜的非線性關系,且通常具有較好的分類性能,在SVM和其余核函數(shù)中廣泛使用。它能夠把數(shù)據(jù)映射到無窮維的特征空間中,使得原本不可分的數(shù)據(jù)變得線性可分。 kr=exp?{?上式中r=|X1(4)均勻核函數(shù)能夠將數(shù)據(jù)映射到無限維空間中,由于其具有在給定的超立方體中返回1,否則返回0的特性。但是因為它只考慮了數(shù)據(jù)是否在特定范圍內,沒有考慮數(shù)據(jù)之間的關系,所以可能不適用于所有類型的問題。(5)Sigmoid核函數(shù)能將輸入映射到(0,1)之間的概率分布上,使得正樣本的概率更大,并且能夠引入非線性特性,提升模型的分類性能。 Sx=5.3二分類優(yōu)化5.3.1優(yōu)化過程對二分類模型的優(yōu)化,本研究主要著眼于解決上一章中除含鄭單958組外準確率較低的問題。主要環(huán)節(jié)的流程如圖5-1所示。圖5-1二分類模型優(yōu)化的主要流程首先,本次模型優(yōu)化主要是在運用遞歸特征消除(RecursiveFeatureElimination,簡稱RFE)選擇過特征后,添加線性核函數(shù)進行優(yōu)化。這個過程需要經(jīng)過多次模型訓練,不斷計算特征重要性,消除最無關緊要的特征,從所有特征數(shù)據(jù)中篩選出分類效果最好的四個特征并進行輸出,在此基礎上繼續(xù)模型優(yōu)化任務。其次,本次優(yōu)化涉及到了C參數(shù),一個用于平衡模型擬合度和泛化能力的重要超參數(shù)。該參數(shù)控制了對誤分類樣本的懲罰程度,如果允許一定數(shù)量的誤分類樣本存在就將C值設置為較小值,相反,較大的C值代表模型會更嚴格地對待誤分類樣本。本次優(yōu)化通過交叉驗證,多次調整C超參數(shù),最終設置其數(shù)值為750,增加對誤分類樣本的成本,使得模型更傾向于選擇更復雜的決策邊界。同時,為了確保實驗結果的可重復性,特別設置固定隨機數(shù)種子參數(shù)為50,這一行為能夠保證每次數(shù)據(jù)集的劃分結果都一致,從而消除隨機性導致的結果差異,使得實驗更加精確可靠。最后,本研究特別針對優(yōu)化后的模型進行了分類準確率的打印輸出。這一步驟旨在通過具體的數(shù)值來量化地展示模型性能經(jīng)過優(yōu)化后所取得的顯著提升。除了數(shù)值上的展示,為了更加直觀地呈現(xiàn)模型的分類效果,本小節(jié)還精心繪制了優(yōu)化后的散點圖、混淆矩陣和ROC曲線,通過這些綜合性的展示,我們得以全面而深入地了解優(yōu)化后模型的分類性能,為后續(xù)的研究和應用提供有力的支持。5.3.2優(yōu)化結果經(jīng)過上一小節(jié)中的不斷調試,最終二分類模型的準確率能夠達到80%,并成功選出區(qū)別比較明顯的四個特征。由于導入的數(shù)據(jù)包含所有提取到的特征,故圖5-2所示的圖中輸出的0、3、5、8分別代表玉米樣本的均值、平均差、波形率、重心頻率等特征。圖5-2優(yōu)化后的準確率和選出的特征圖5-3二分類優(yōu)化后的散點圖由圖5-3可以看出,此時散點圖中的數(shù)據(jù)點已經(jīng)有了一定的線性關系,表明經(jīng)過優(yōu)化后的二分類模型在準確率上確實有了提高。圖5-4二分類優(yōu)化后的混淆矩陣圖5-5為優(yōu)化過后二分類模型的分類結果,而真陽性率(TruePositiveRate,簡稱TPR)和假陽性率(FalsePositiveRate,簡稱FPR)是ROC曲線的兩個重要參數(shù),其中TPR和FPR分別表示被正確地分類為正例的樣本所占的比例和被錯誤地分類為正例的負例樣本所占的比例。ROC曲線的面積越接近于1,說明分類器在區(qū)分正例和負例樣本方面表現(xiàn)得越好。一個完美的分類器ROC曲線下面積將等于1,表示它能夠完美地將正例和負例樣本區(qū)分開來。然而,在實際應用中,很少有分類器能夠達到完美的預測效果,本研究對二分類模型的優(yōu)化已經(jīng)得到了相對理想的效果。圖5-5二分類優(yōu)化后的roc曲線5.4多分類優(yōu)化5.4.1優(yōu)化過程在第上一章中已經(jīng)搭建好的多分類模型的基礎上,進一步優(yōu)化,所選樣本和特征數(shù)據(jù)均保持不變。模型調整的關鍵步驟除了沒有遞歸特征消除這一步驟外,其他的基本上與二分類模型的優(yōu)化過程相同。多分類模型優(yōu)化的主要流程如下圖所示:圖5-6二分類模型主要調整流程本研究經(jīng)過交叉實驗的多次迭代與對比,最終決定在已有高斯核函數(shù)的模型中添加線性核函數(shù)。在此基礎上,分別設定了最佳的懲罰因子以及最佳的核函數(shù)參數(shù)bestgbestc為590和2。bestg參數(shù)決定了數(shù)據(jù)點在高維特征空間中的分布以及決策邊界的形狀。具體來說,該參數(shù)控制了高斯核函數(shù)的寬度。當bestg的值較小時,高斯核函數(shù)的寬度較大,這意味著它能夠將遠處的數(shù)據(jù)點也納入考慮范圍,使得決策邊界相對平滑。然而,這可能會導致模型對噪聲數(shù)據(jù)過于敏感,產生過擬合現(xiàn)象。相反,當bestg的值較大時,高斯核函數(shù)的寬度較小,模型主要關注與當前數(shù)據(jù)點較近的點,可能導致決策邊界較為復雜和不規(guī)則。通過交叉驗證等方法在不同的bestg值下進行模型訓練,并評估模型在驗證集上的性能,最終選擇性能最佳的bestg值作為最佳的核函數(shù)參數(shù)。隨后,我們構建了一個字符串,用于明確SVM模型的參數(shù)配置。在字符串中,明確指定核函數(shù)類型為線性核,并調整了懲罰因子為30,同時設置了核函數(shù)參數(shù)為48。這一系列的參數(shù)設定旨在進一步優(yōu)化模型的性能,提升分類準確率。由于已經(jīng)擁有了上一小節(jié)優(yōu)化二分類模型的經(jīng)驗,對多分類模型的優(yōu)化進行的相對順利,對于一些專業(yè)術語的解釋可以參考5.3小節(jié)中對二分類模型的優(yōu)化過程。5.4.2優(yōu)化結果經(jīng)過上一小節(jié)中的模型優(yōu)化,本研究最終實現(xiàn)了無論是對訓練集還是對測試集,多分類準確率均顯著提升至80%以上的出色表現(xiàn)。這一進步充分驗證了優(yōu)化措施的有效性。為了更直觀、更深入地展示模型優(yōu)化后的分類效果,接下來將進一步借助混淆矩陣和預測結果對比圖這兩種強大的可視化工具更加全面而深入地了解優(yōu)化后模型的分類性能,為后續(xù)的研究和應用提供有力的支持。由圖5-7可知,優(yōu)化后的多分類模型在訓練集的420條數(shù)據(jù)中,正確分類336條,只有一條華皖261數(shù)據(jù)被錯分為了MC121,準確率約為80.00%。在測試集的180條數(shù)據(jù)中,正確分類145條,只有一條華皖261數(shù)據(jù)被錯分為了CNP127,準確率約為80.56%圖5-7多分類優(yōu)化后的訓練集混淆矩陣圖5-8多分類優(yōu)化后的測試集混淆矩陣通過觀察圖5-9和5-10,我們可以直接發(fā)現(xiàn),圖中代表真實類別和預測類別的重合現(xiàn)象顯著增加。這種重合現(xiàn)象的增多,不僅反映了分類器對數(shù)據(jù)的精準捕捉能力,也進一步證明了分類效果得到了顯著的提高。重合區(qū)域的擴大,表明模型的分類準確性在確實得到了提高,預測結果也更加接近真實情況。在兩個預測結果對比圖中,也分別展示了訓練集和測試集的分類準確率為80%和80.5556%,與上方展示的混淆矩陣表示信息的計算結果相同。這也恰好說明,本研究優(yōu)化后的多分類模型在結果表示方面也具有正確性。圖5-9多分類優(yōu)化后的訓練集預測結果對比圖圖5-10多分類優(yōu)化后的測試集預測結果對比圖5.5章節(jié)小結本章節(jié)詳細而系統(tǒng)地闡述了二分類和多分類模型的優(yōu)化過程,對涉及到的關鍵參數(shù)進行了深入的調整說明。通過調整模型的各項參數(shù),成功搭建出一套幾乎達到預期的玉米品種分類識別模型,實現(xiàn)了本研究最初設定的目標。下一章將闡述基于本研究的總結與展望。
6總結與展望本研究通過對采集到的玉米樣品進行SL信號采集、特征提取、信號分析、數(shù)據(jù)處理等操作,利用相關專業(yè)知識理論搭建二分類和多分類模型,并最終做出優(yōu)化,提升模型性能,成功構建出一套效果良好的分類模型。信號采集過程中,本研究采用了科學嚴謹?shù)膶嶒灧椒?,特別是通過正交實驗技術,系統(tǒng)地探索并確定了最合適的采集參數(shù)。這一方法不僅考慮了不同參數(shù)之間的相互作用,而且篩選出了最優(yōu)的參數(shù)組合。同時,本研究還關注了樣品克重對信號采集質量的影響,通過多次實驗比對不同克重下的信號特征,找到了最佳的樣品克重,從而確保了信號采集的準確性和穩(wěn)定性。模型搭建優(yōu)化過程中,本研究注重數(shù)據(jù)預處理、特征選擇以及模型參數(shù)調整等多個方面,為模型的訓練提供了堅實的基礎。同時,通過特征選擇,我們篩選出了對分類任務最為關鍵的特征,進一步提升了模型訓練的效率。模型參數(shù)調整方面,我們采用了交叉驗證、網(wǎng)格搜索等多種技術,以找到最佳的參數(shù)組合。這些參數(shù)調整不僅涵蓋了學習率、正則化項等常見的模型參數(shù),還包括了特定于玉米品種分類任務的參數(shù),如核函數(shù)類型、懲罰因子等。這一參數(shù)調整過程,使得最終成功提升了模型的分類準確率,達到了預期的水平。本次研究結果構建出的分類識別模型無論進行是二分類還是多分類任務,該模型都展現(xiàn)出了期望達到的性能。這一研究成果不僅標志著玉米品種識別技術取得了一些進步,而且對于推動整個糧食產業(yè)的技術創(chuàng)新和發(fā)展具有深遠的意義。期望在未來的生產生活中,大多數(shù)種植戶都能夠將玉米分類模型的分類結果作為他們播種的重要參考。我國糧食產業(yè)能夠持續(xù)保持良好的發(fā)展態(tài)勢,為保障國家糧食安全、促進農業(yè)現(xiàn)代化作出更大的貢獻。
附錄時域特征提取的核心代碼:fori=1:num_rowsrow_data=data(i,1:end-1);labels=data(i,end);mean_val=mean(row_data);energy=sum(row_data.^2)/200;variance=var(row_data);mean_deviation=mean(abs(row_data-mean_val));rms=sqrt(mean(row_data.^2));wave_form_factor=variance/mean_val;skewness=sum(((row_data-mean_val).^3))/(variance^3);kurtosis=sum(((row_data-mean_val).^4))/(variance^4);features(i,:)=[mean_val,energy,variance,mean_deviation,rms,wave_form_factor,skewness,kurtosis];end時域特征提取的核心代碼:fori=1:num_samplescurrent_data=X(i,:);x1=hilbert(current_data);A0=abs(x1);L=length(current_data);fft_result=fft(A0);data_fs=abs(fft_result(1:L/2+1));data_fs(2:end-1)=2*data_fs(2:end-1);%freqs=(0:L/2)/L*(2*pi);centroid_freq=sum(data_fs.*freqs)/sum(data_fs);rms_freq=sqrt(sum((data_fs.*freqs).^2/sum(data_fs)));avg_freq=sum(data_fs.*freqs)/L;freq_variance=sum(((freqs-avg_freq).^2).*data_fs)/sum(data_fs);start_idx=(i-1)*num_features_per_class+1;end_idx=i*num_features_per_class;features(i,1:num_features_per_class)=[centroid_freq,rms_freq,avg_freq,freq_variance];end二分類模型搭建的核心代碼:[features_scaled,scaling_params]=mapminmax(features');features_scaled=features_scaled';n_total=size(features_scaled,1);n_train=round(0.8*n_total);rand_indices=randperm(n_total);train_indices=rand_indices(1:n_train);test_indices=rand_indices(n_train+1:end);train_x=features_scaled(train_indices,:);train_y=labels(train_indices);test_x=features_scaled(test_indices,:);test_y=labels(test_indices);model=svmtrain(train_y,train_x,'-t1-d3-c0.5-g0.5');[train_predict_label,train_accuracy,~]=svmpredict(train_y,train_x,model);[test_predict_label,test_accuracy,~]=svmpredict(test_y,test_x,model);二分類模型優(yōu)化的核心代碼:svm=SVC(kernel='linear',C=750,random_state=50)rfe=RFE(estimator=svm,n_features_to_select=4,step=1)rfe.fit(X_train,y_train)selected_feature_indices=rfe.support_.nonzero()[0]X_train_selected=X_train.iloc[:,selected_feature_indices]X_test_selected=X_test.iloc[:,selected_feature_indices]svm.fit(X_train_selected,y_train)y_pred=svm.predict(X_test_selected)多分類模型搭建的核心代碼:[train_xx,PS]=mapminmax(train_x');train_xx=train_xx';test_xx=mapminmax('apply',test_x',PS);test_xx=test_xx';bestc=590;bestg=1;model=svmtrain(train_y,train_xx,cmd);predict_label_1=svmpredict(train_y,train_xx,model);predict_label_2=svmpredict(test_y,test_xx,model);k2=length(find(predict_label_2==test_y))n2=length(test_y);accuracy_2=k2/n2*100;k1=length(find(predict_label_1==train_y))n1=length(train_y);accuracy_1=k1/n1*100;多分類模型優(yōu)化的核心代碼:[train_xx,PS]=mapminmax(train_x');train_xx=train_xx';test_xx=mapminmax('apply',test_x',PS);test_xx=test_xx';bestc=590;bestg=2;cmd=['-t0','-c30',num2str(bestc),'-g48',num2str(bestg)];
參考文獻杜長春.農業(yè)生產中植物保護的重要性及策略研究[J].農業(yè)開發(fā)與裝備,2023(07):78.施宇.極端天氣事件對糧食生產的影響及其緩解途徑[D].西北農林科技大學,2023.BaigMA,AmjadS.GlobalClimateChangeandFruitCropsProduction:EvidencefromPakistan[J].TheInternationalJournalofClimateChange:ImpactsandResponses,2014,6(1):21-31.AcevedoM,PixleyK,ZinyengereN,etal.Ascopingreviewofadoptionofclimate-resilientcropsbysmall-scaleproducersinlow-andmiddle-incomecountries[J].NaturePlants,2020,6:1231–1241.楊婭婭,張艷,趙堅.太赫茲技術在農作物品質檢測中的研究進展[J].應用激光,2024,44(01):109-118.王昊,祝玉華,李智慧,等.機器視覺在農作物種子檢測中的研究進展[J].計算機工程與應用,2023,59(22):69-83.馮瑞杰,陳爭光,衣淑娟.基于貝葉斯優(yōu)化的SVM玉米品種鑒別研究[J].光譜學與光譜分析,2022,42(6):1698-1703NiMTY.Automaticinspectionmachineformaizekernelsbased
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 健康系列活動策劃方案(3篇)
- 直播相伴活動策劃方案(3篇)
- 財務管理制度制定依據(jù)(3篇)
- 2026廣東廣州國家實驗室中國數(shù)字肺項目工程技術中心招聘2人備考考試題庫及答案解析
- 2026河北廊坊師范學院選聘26人參考考試題庫及答案解析
- 2026山東德州市事業(yè)單位招聘初級綜合類崗位人員備考考試題庫及答案解析
- 2026云南省人力資源和社會保障廳所屬事業(yè)單位招聘12人備考考試試題及答案解析
- 2026廣東廣州市華南理工大學醫(yī)院合同制人員招聘2人備考考試題庫及答案解析
- 2026廣東惠州市博羅縣村級經(jīng)濟聯(lián)盟有限公司招聘1人備考考試試題及答案解析
- 入校物品消毒管理制度(3篇)
- 廣東省領航高中聯(lián)盟2024-2025學年高一下學期第一次聯(lián)合考試語文試卷(含答案)
- 社區(qū)健康服務與管理課件
- QGDW1512-2014電力電纜及通道運維規(guī)程
- 投資車行合同協(xié)議書
- 國際消防安全系統(tǒng)規(guī)則
- 靜脈治療新理念
- 高中研究性學習指導課課件系列總結階段-學生如何開展研究活動
- 心內介入治療護理
- 民辦職業(yè)培訓方案模板
- 04S519小型排水構筑物(含隔油池)圖集
- 旅居養(yǎng)老可行性方案
評論
0/150
提交評論