【《近紅外光譜在大米產(chǎn)地分類中算法分析案例》10000字(論文)】_第1頁
【《近紅外光譜在大米產(chǎn)地分類中算法分析案例》10000字(論文)】_第2頁
【《近紅外光譜在大米產(chǎn)地分類中算法分析案例》10000字(論文)】_第3頁
【《近紅外光譜在大米產(chǎn)地分類中算法分析案例》10000字(論文)】_第4頁
【《近紅外光譜在大米產(chǎn)地分類中算法分析案例》10000字(論文)】_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

近紅外光譜在大米產(chǎn)地分類中算法分析案例目錄TOC\o"1-3"\h\u12051近紅外光譜在大米產(chǎn)地分類中算法分析案例 [29]:(1)C為懲罰系數(shù),控制著超過不敏感區(qū)域時的懲罰力度。其取值越大,模型對于錯誤的出現(xiàn)率就要求越低,即容錯率越高,但此時也會導致模型的泛化能力不足,即過擬合現(xiàn)象;相反,該數(shù)值越小,容錯率越低,預測精度就不會達標,即所謂欠擬合。(2)為寬度系數(shù),是徑向基核函數(shù)內(nèi)的一個重要參數(shù),控制著支持向量的相關程度。值選取過小時,最佳超平面的經(jīng)驗風險小、結(jié)構風險大,即所謂的過擬合現(xiàn)象;相反地,若值選取過大,最佳超平面的結(jié)構風險小、曲線光滑性高、經(jīng)驗風險大,即所謂欠擬合現(xiàn)象。從上述分析可知,對于支持向量的影響恰恰與C的控制規(guī)律相反,但無論是還是C,過大或過小的參數(shù)設置,都會導致模型的精度降低。上述的兩個徑向基核函數(shù)的參數(shù)從不同的角度,直接或間接地影響著支持向量機的性能,數(shù)值的過大或過小都會產(chǎn)生相應問題,因此,在支持向量機的使用中,正確地選用核函數(shù)參數(shù)的大小才能得到正確的結(jié)果,而本文中之所以使用粒子群算法的目的,就是利用這種群智能進化算法解決這一類問題。②MATLAB中的代碼設置:本章中使用的SVC算法利用的是一種MATLAB工具箱叫“LIBSVM”,它是一種經(jīng)常被用于處理分類和回歸等計算機問題的軟件工具箱,使用起來方便快速,功能強大,由于其出色的性能,MATLAB制造公司已經(jīng)將其相關算法語句囊括到了更高級別版本中的MATLAB。將LIBSVM工具箱下載到電腦上后,打開MATLAB以編譯文件,并將編譯好的文件添加到路徑中。其中,LIBSVM工具箱處理分類問題中的多分類問題,采用的方法是一/一,其中主要涉及兩個函數(shù),即libsvmtrain(train_label,Train_matrix,cmd)libsvmpredict(train_label,Train_matrix,model)其中,各變量表示的內(nèi)容如下:—train_label:訓練樣本的類標,類標是(-1,1)、(1,2,3)或者其他任意用來表示不同的類別的數(shù)字;—Train_matrix:訓練樣本的特征?!猰odel:即使用libsvmtrain返回的模型?!猚md:預設的參數(shù)詳情。其中cmd預設參數(shù)中對本章分類處理有用的參數(shù)細節(jié)如下圖所示:圖5-11工具箱LIBSVM中與本章參數(shù)設置有關細節(jié)圖上述的這些參數(shù)數(shù)據(jù)都可以和SVM的類型以及核函數(shù)需要變動的參數(shù)進行組合編寫,如果編寫的參數(shù)語句在SVM類型中不產(chǎn)生任何影響的話,程序就不會使用該參數(shù);或者是編寫的參數(shù)格式不正確,工具箱系統(tǒng)將采用默認參數(shù)進行運算。③基于PSO算法的參數(shù)最優(yōu)化具體步驟如下:(1)初始化粒子群算法,即設置好初始的粒子群,并給出其中參數(shù)的最大和最小數(shù)值范圍,最后設置最大迭代次數(shù);(2)確認好各粒子的初值、位置以及全局最佳值值;(3)根據(jù)步驟(1)-(3)進行逐步運算,同時根據(jù)公式(5-26)、(5-27)同步變化粒子的位置和速度數(shù)值;(4)計算每個粒子的適應度函數(shù)值;(5)若某些粒子的適應度優(yōu)于局部最優(yōu)值,則更新局部最優(yōu)值。否則,保留原始值;(6)若更新后的局部最優(yōu)值較全局最優(yōu)值更好,則更新全局最優(yōu)值,否則保留原始全局最優(yōu)值;(7)如果運行的結(jié)果不再改變或已經(jīng)達到了最大迭代次數(shù)時,則停止迭代運算。否則,返回步驟(3)繼續(xù)動作;(8)將得到的值帶入SVC模型中,并對大米樣本數(shù)據(jù)進行分類訓練和預測;(9)得到最終的分類結(jié)果,根據(jù)結(jié)果判斷模型是否準確可信?;赑SO的支持向量機實驗結(jié)果及分析建模數(shù)量的影響為了驗證建模用數(shù)量對模型準確率的影響,進行如下實驗,同理于偏最小二乘法,采用的前處理方式為吸光度變換,正態(tài)變量交化,驗證邏輯使用參考驗證法,經(jīng)過建模和驗證,幾次比較有代表性的結(jié)果如下:表5-16吸光度變換+SNV+參考驗證法(建模樣本總數(shù)40)種類建模用數(shù)驗證用數(shù)正確率五常104082.5%響水104032.5%越光104030.0%銀水104070.0%表5-17光度變換+SNV+參考驗證法(建模樣本總數(shù)160)種類建模用數(shù)驗證用數(shù)正確率五常4040100%響水404072.5%越光404027.5%銀水404095.0%表5-16和表5-17以及表5-1和表5-2的驗證結(jié)果說明,在樣本數(shù)量不足的情況下,正確判別率下降了。由此可以得出結(jié)論,建模數(shù)量減少會導致準確率下降,從另外一個角度來說,即建模數(shù)量增加可以提升準確率。特征波長的影響(1)光譜數(shù)據(jù)在波數(shù)5700~4300cm-1(數(shù)據(jù)點:1090~1816):表5-18特征波段5700~4300cm-1的支持向量機驗證結(jié)果種類建模用數(shù)驗證用數(shù)正確率五常404090.0%響水404057.5%越光404027.5%銀水404087.5%由表5-3可看出此波段的溯源準確率不高,相較于該波段在偏最小二乘法中與本文第四章所選取的的波段結(jié)果差距較小這一結(jié)果而言,該波段在支持向量機中表現(xiàn)效果不如本文第四章所取波段,側(cè)面說明不同的特征波段在不同的算法和環(huán)境中表現(xiàn)效果不同。(2)從波數(shù)5500~5000cm-1(數(shù)據(jù)點:1194~1453)上看:表5-19特征波段5500~5000cm-1的支持向量機驗證結(jié)果種類建模用數(shù)驗證用數(shù)正確率五常404045.0%響水404020.0%越光404020.0%銀水404082.5%(3)從波數(shù)5501~5136cm-1(數(shù)據(jù)點:1193~1383)上看:表5-20特征波段5501~5136cm-1的支持向量機驗證結(jié)果種類建模用數(shù)驗證用數(shù)正確率五常404035.0%響水404017.5%越光404017.5%銀水404070.0%觀察驗證結(jié)果可以發(fā)現(xiàn),這三個特征波段的整體準確率都低于本文選取的特征波段,且各個實驗的結(jié)果與在偏最小二乘法中的實驗結(jié)果相一致,因此,通過這兩種分類算法中對文獻中提到的三個特征波段進行驗證和實驗分析,可以得出以下結(jié)論:①對同一實驗設備所測的光譜數(shù)據(jù),其特征波段的選擇會影響產(chǎn)地溯源的準確性;②間接表示了特征波段含有與產(chǎn)地相關聯(lián)的信息;③另外還體現(xiàn)了在特定情況下表現(xiàn)良好的特征波段,在其他情況下表現(xiàn)不佳。不同前處理方式的影響由于選取的波段在SVM算法建模過程中,建模數(shù)據(jù)的驗證準確率為100%,即偏最小二乘法中的參考驗證法在SVM模型中不適用,因此后面的對比實驗無論采用何種驗證方式都對結(jié)果無影響。支持向量機中常用的預處理方法有SNV、限定范圍、平均化、歸一化以及標準化。表5-21透過率+SNV種類建模用數(shù)驗證用數(shù)正確率五常4040100%響水404072.5%越光404027.5%銀水404095.0%表5-22透過率+限定范圍種類建模用數(shù)驗證用數(shù)正確率五常4040100%響水404070.0%越光404027.5%銀水404087.5%表5-23透過率+SNV+限定范圍種類建模用數(shù)驗證用數(shù)正確率五常4040100%響水404070.0%越光404027.5%銀水404087.5%表5-24透過率+平均化種類建模用數(shù)驗證用數(shù)正確率五常404097.5%響水404065.0%越光404010.0%銀水404095.0%表5-25透過率+歸一化種類建模用數(shù)驗證用數(shù)正確率五常404010.0%響水404065.0%越光40400%銀水404055.0%表5-26透過率+標準化種類建模用數(shù)驗證用數(shù)正確率五常4040100%響水404072.5%越光404027.5%銀水404095.0%通過觀察表5-21、表5-22、表5-24、表5-25以及表5-26可知,在支持向量機中單獨使用的預處理方法效果最好的是SNV,而限定范圍無明顯效果,通過表5-21和表5-26可以得出結(jié)論,標準化處理和SNV處理在支持向量機中并無明顯區(qū)別,表5-24和表5-25表明,在支持向量機中單獨使用平均化和歸一化處理效果較差,不適用于此。通過上述結(jié)論可以知道,在支持向量機中最好的預處理手段是SNV,而在偏最小二乘法中最好的處理方式是平均化,因此,側(cè)面反映出了不同的預處理手段在不同的分類算法中表現(xiàn)效果是不一樣的。表5-27透過率+SNV+平均化種類建模用數(shù)驗證用數(shù)正確率五常4040100%響水404070.0%越光404022.5%銀水404095.0%表5-28透過率+平均化+SNV種類建模用數(shù)驗證用數(shù)正確率五常4040100%響水404072.5%越光404027.5%銀水404095.0%在支持向量機分類的方法中,單獨使用SNV,平均化或限定范圍的效果都差不多,但是將兩種預處理方法混合使用時沒有見到效果提升,其中無論如何變換處理順序都對處理結(jié)果無過多影響,該結(jié)論與在偏最小二乘法中得到的結(jié)論相一致??筛倪M空間及誤差分析消除外部因素影響在測量獲得大米樣品的近紅外光譜數(shù)據(jù)時,由于周圍環(huán)境的水分、氧氣等其他人為操作等因素的影響,獲得的結(jié)果或多或少含有一些噪聲信號。所以后續(xù)得研究分析中,應做到規(guī)范操作、糾正不合理步驟、控制環(huán)境穩(wěn)定的情況下進行。通過大量的實驗分析可以得知,大米產(chǎn)地溯源的分類結(jié)果與樣品在檢測裝置中的重量無關,而與被測時的擺放狀態(tài)有關;若是檢測樣本中研磨不到位,存在大顆粒的樣品時,檢測結(jié)果會很受影響;同時當樣本粉末沒有達到要求厚度時,信號反饋噪聲較大;當劇烈搖晃樣品杯時,樣本粉末可能在杯內(nèi)呈斜面狀,這種情況是正常測量時所不被允許的。提升硬件可靠性實驗測量過程中存在一些問題,同一數(shù)據(jù)多次測量后發(fā)現(xiàn)其光譜曲線的復現(xiàn)率有時較差,信號能量水平較低,清洗裝置困難等問題。為了解決這些問題,后續(xù)的工作可以首先優(yōu)化操作過程,避免在操作過程中被外部環(huán)境等因素影響測量數(shù)據(jù)的重復性。然后,可以通過改變樣品玻璃的形狀或增加換氣入口,在不接觸反射的球面鏡的情況下持續(xù)清潔內(nèi)部,避免了樣品落入附件里面的問題。針對低信號電平這一設備的硬件問題,可以通過改進實驗設備,通過調(diào)整球面鏡在儀器附件內(nèi)的位置來產(chǎn)生盡可能多的能量。但是,在進一步的研究中應該選擇更加可靠、易清潔和復現(xiàn)性高的測量儀器,避免因儀器的硬件不可靠等問題掩蓋大米不同產(chǎn)地間細微的差異。模型存在改進空間①理想情況下,我們希望上述研究所選取的特征波段是引起不同產(chǎn)地大米光譜數(shù)據(jù)間不同的充分必要條件。但事實是,上述選取的數(shù)據(jù)只是造成不同產(chǎn)地大米光譜數(shù)據(jù)不同的充分條件,而非必要條件。這樣說的理由是,雖然第四章所選取的近紅外光譜的特征波段對于不同產(chǎn)地間大米光譜數(shù)據(jù)的區(qū)分有一定的貢獻,但是這種貢獻針對不同的分類算法有不同的效果顯示,由于選取后的特征波段所包含的光譜數(shù)據(jù)之間仍然存在線性相關的現(xiàn)象,所以對于各不相同的具體大米產(chǎn)地溯源分類算法而言,還需要通過數(shù)據(jù)降維的方式消除數(shù)據(jù)中重疊的部分,即特征提取。而且,針對支持向量機分類算法而言,通過上述章節(jié)的實驗觀察可知,現(xiàn)階段實驗整體的驗證準確率中,即使存在部分大米種類在支持向量機算法中的驗證準確率高于偏最小二乘法,但是支持向量機算法的總體效果不如偏最小二乘法明顯,因此,可以對支持向量機算法進行改進,對提取出來的特征波段進行降維。②通過偏最小二乘和支持向量機分類實驗,證明了不同區(qū)域的水稻,近紅外光譜是不同的,但當一個沒有輸入到過模型的水稻產(chǎn)區(qū)數(shù)據(jù)用于模型的驗證時,并且該樣品的傅里葉近紅外光譜數(shù)據(jù)與五常大米在模型中的曲線最為相似時,模型還是會將該未被識別過的大米數(shù)據(jù)識別為五常大米。因此,當模型輸入的類型并不多的時候,其使用范圍基本上局限于已記錄的類型之

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論