版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
ICS67.120.30
CCSB50
54
西藏自治區(qū)地方標準
DB54/T0308—2023
西藏特有魚類智能識別技術規(guī)范
2023-12-18發(fā)布2024-01-18實施
西藏自治區(qū)市場監(jiān)督管理局??發(fā)布
DB54/T0308—2023
目次
前言..................................................................................II
1范圍................................................................................1
2規(guī)范性引用文件......................................................................1
3術語和定義..........................................................................1
4魚類智能識別技術的構成..............................................................2
4.1硬件設備........................................................................2
4.2軟件系統(tǒng)........................................................................2
5硬件配置要求........................................................................2
6軟件要求............................................................................3
7實現(xiàn)步驟............................................................................3
8圖像采集設備部署....................................................................3
9訓練數(shù)據(jù)集制作......................................................................3
10算法訓練...........................................................................4
11評價指標獲取與計算方法.............................................................4
附錄A(資料性)目標魚類標注..........................................................6
附錄B(資料性)XML標簽文件..........................................................7
附錄C(資料性)西藏區(qū)域水域里特有魚類種類識別結果....................................8
I
DB54/T0308—2023
前言
本文件按照GB/T1.1—2020《標準化工作導則第1部分:標準化文件的結構和起草規(guī)則》的規(guī)定
起草。
請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構不承擔識別專利的責任。
本文件由中國水利水電科學研究院提出。
本文件由西藏自治區(qū)農(nóng)牧業(yè)標準化技術委員會歸口。
本文件起草單位:中國水利水電科學研究院、華能雅魯藏布江水電開發(fā)投資有限公司、華電西藏能
源有限公司、華電金沙江上游水電開發(fā)有限公司、華能雅魯藏布江水電開發(fā)投資有限公司加查水電廠。
本文件主要起草人:柳春娜、楊佐斌、余凌、趙晉兵、邢偉、李銳、申劍、廖華杰、李健源、朱蒙
恩、胡江軍、焦虎、吳必朗、韓志強、劉軼、周榮攀、周艷華、王魯海、嚴子鈞、盧佳。
本文件屬首次制定。
II
DB54/T0308—2023
西藏特有魚類智能識別技術規(guī)范
1范圍
本文件規(guī)定了西藏區(qū)域水域里特有魚類數(shù)據(jù)集制作和目標檢測的方法。
本文件適用于在濁度測量值在100NTU及以下的水體中,智能識別西藏區(qū)域水域里特有魚類的稚魚
和成魚。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構成本文件必不可少的條款。其中,注日期的引用文件,
僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本
文件。
HJ1075水質(zhì)濁度的測定濁度計法
HJ710.7生物多樣性觀測技術導則內(nèi)陸水域魚類
3術語和定義
下列術語和定義適用于本文件。
3.1
智能識別
通過人工智能技術,實現(xiàn)魚類種類識別和數(shù)量自動統(tǒng)計。
3.2
圖像采集
采用成像設備獲取魚類水下圖像信號的過程。
3.3
動態(tài)圖像
魚類游動通過成像設備時的實時圖像。
3.4
數(shù)據(jù)集
深度學習目標檢測算法訓練時所用的主流數(shù)據(jù)格式。
3.5
目標檢測
識別圖片或者視頻中目標以及目標的坐標位置。
3.6
交并比
衡量預測框和真實框的重合程度指標。
3.7
準確率
真實正樣本占分類器判斷正樣本的比例。
1
DB54/T0308—2023
3.8
召回率
真實正樣本占測試集正樣本的比例。
3.9
F1分數(shù)
精確度與召回率的調(diào)和平均數(shù)。
3.10
平均精確度
以Recall作為橫軸,Precision作為縱軸,P-R曲線下的面積。
4魚類智能識別技術的構成
4.1硬件設備
魚類智能識別技術的實施的硬件設備部署包含以下要素:
——圖像采集設備:水下相機、高清視頻攝像頭、超聲成像聲吶等圖像(含聲學)采集設備,用
于捕獲魚類圖像和視頻資料。
——存儲設備:帶有大容量硬盤的計算機、硬盤錄像機、網(wǎng)絡附屬存儲服務器(NAS)等實現(xiàn)存儲
功能硬件設備。
——處理單元:具備圖像識別和目標檢測算法所需計算資源的服務器、GPU加速器等計算終端,用
于處理復雜的計算任務。
——通訊器件:構建通訊網(wǎng)絡所需的交換機、路由器、光纖轉(zhuǎn)換器、網(wǎng)線、光纖等通訊設備或元
器件,實現(xiàn)圖像采集設備、存儲設備、處理單元之間的數(shù)據(jù)通訊傳輸功能。
4.2軟件系統(tǒng)
構成智能識別技術的軟件系統(tǒng)主要包括以下幾個部分:
——圖像處理軟件:對采集到的圖像和視頻流進行預處理的軟件或軟件模塊。
——識別軟件:使用機器學習或深度學習算法,根據(jù)西藏特有魚類的形態(tài)特征,進行圖像的分析
和識別,獲得的所需目標位置和尺寸等信息的團建或軟件模塊。
——數(shù)據(jù)庫系統(tǒng):包含西藏特有魚類的形態(tài)特征數(shù)據(jù)庫、實現(xiàn)對識別所得信息分類存儲的軟件或
軟件模塊。
——用戶接口:提供簡潔明了的操作界面,使研究人員和工作人員能夠輕松地查看識別結果和進
行數(shù)據(jù)管理的軟件模塊。
5硬件配置要求
5.1應用場景水體濁度不高于50NTU時,圖像采集設備宜采用水下攝像機;濁度高于50NTU時,宜
采用水下攝像機和超聲成像聲吶同步進行圖像采集。采用水下攝像機有效像素數(shù)應不低于200萬。在需
要使用聲吶配合進行圖像采集時,宜采用空間分辨力強于5mm的多波束超聲成像聲吶。
5.2應將所有圖像采集設備的輸出轉(zhuǎn)化為統(tǒng)一格式的視頻流,幀頻不低于25fps。
5.3采用人工智能工作站作為計算平臺實施對目標圖像識別的計算。工作站配置宜滿足以下要求:
a)中央處理器(CPU)主頻高于2.8GHz,核心數(shù)量不低于8個,線程數(shù)不低于16,緩存空間不
小于16MB。
2
DB54/T0308—2023
b)顯卡CUDA核心頻率超過1300MHz,顯存空間不低于8GB,顯存位寬不低于256bit。
c)內(nèi)存不小于32GB,規(guī)格不低于DDR4。
d)配置固態(tài)硬盤,空間不小于1TB。
5.4存儲設備應自動持續(xù)存儲采集設備輸出的視頻流,存儲設備容量支持的連續(xù)存儲視頻流時間應高
于1個月。
5.5宜采用有線通訊模式組建局域網(wǎng)絡,實現(xiàn)采集設備、存儲設備、計算單元之間的穩(wěn)定連接,采用
的通訊協(xié)議應支持25fps的視頻流穩(wěn)定傳輸。在不具備架設通訊線纜的場景下,可采用無線通訊方式,
傳輸帶寬應滿足采集所得視頻流實時傳輸?shù)男枨?,網(wǎng)絡延遲不應高于100ms,丟包率不應超過1%。
5.6所有硬件設備應在-20℃~35℃環(huán)境中穩(wěn)定工作,能應對24小時內(nèi)20℃的溫度變化。
6軟件要求
6.1圖像處理軟件宜具備圖像增強功能,可對圖像或視頻流進行降噪、對比度增強、分辨率調(diào)整,應
保證處理速度滿足25fps幀率的實時性要求。
6.2用于對采集圖像進行標注的軟件應具備圖像標注功能。
6.3識別軟件應具備魚類科屬識別能力,同時識別的魚種數(shù)量應多于2種。
6.4識別軟件的整體準確率不應低于85%,各魚種準確率不應低于80%,召回率不應低于80%,F(xiàn)1分數(shù)
不應低于85%,平均精確度不應低于80%。
6.5識別軟件應具備對采集設備所得視頻流實時識別分析的能力,處理速度應高于每秒25幀圖像
7實現(xiàn)步驟
智能識別技術的實現(xiàn)過程包括以下關鍵步驟:
a)圖像采集設備部署:在適當位置部署圖像采集設備,并確保其與存儲設備和計算單元連接良
好。
b)軟件安裝與配置:在計算處理單元上安裝圖像處理程序和識別算法程序,并進行軟件環(huán)境配
置,保障可實現(xiàn)長期穩(wěn)定運行。
c)數(shù)據(jù)收集:通過圖像采集設備收集西藏特有魚類的圖像和視頻數(shù)據(jù)。
d)訓練數(shù)據(jù)集制作:對采集的數(shù)據(jù)進行種類標注,制成格式統(tǒng)一的訓練數(shù)據(jù)集。
e)算法訓練:使用標注的數(shù)據(jù)集使用識別算法進行訓練。
f)系統(tǒng)集成測試:將硬件與軟件系統(tǒng)進行集成,并進行全面的測試,包括識別精度、系統(tǒng)響應
速度和穩(wěn)定性測試。
g)運行監(jiān)測:系統(tǒng)投入使用后,持續(xù)監(jiān)測其性能,并根據(jù)反饋進行優(yōu)化。
8圖像采集設備部署
8.1參考HJ1075-2019,測定環(huán)境水體濁度不高于100NTU,盡量避免水體波動。
8.2當測量環(huán)境照度低于10lx時,宜采用補光設備,并根據(jù)西藏區(qū)域水域里特有魚類對光照的行為
習性適當調(diào)節(jié)光照強度、顏色。補光設備光源的入射角度與拍攝角度的夾角宜低于60°。
8.3選擇稚魚和成魚進行拍攝,分類標準見HJ710.7。
9訓練數(shù)據(jù)集制作
3
DB54/T0308—2023
9.1識別軟件應采用經(jīng)過標注后的圖片數(shù)據(jù)集進行模型訓練,圖片宜采用魚類識別應用場景下的采集
設備實際拍攝的照片或視頻截圖。
9.2用于訓練的圖片數(shù)據(jù)集應分魚種分別進行標注,每種魚類的數(shù)據(jù)集均應包含以下內(nèi)容:
a)不少于1000張魚類靜態(tài)整體特征圖像,參考HJ710.7術語和定義,提取全長和體長信息。
b)不少于1000張魚類扭動(游動,扭頭,轉(zhuǎn)身等)等形態(tài)下的動態(tài)圖像。
c)不少于1000張魚類局部特征圖片。
9.3在對圖像進行標注前可采用圖像增強方法對原圖像附加信息或變換數(shù)據(jù),突出圖像有效信息,消
除噪聲干擾。
9.4采用標注軟件分別標注,生成對應的類,真實框的坐標信息等。相關示例見附錄A。
9.5標注后應生成統(tǒng)一格式的XML文件,主要包括魚類圖像的長寬以及通道數(shù)量、錄標注目標魚類的
類別信息和所在圖像上的坐標信息。相關示例見附錄B。
9.6宜采用PASCALVOC2007格式來制作數(shù)據(jù)集,數(shù)據(jù)集中80%數(shù)據(jù)組成訓練集、10%數(shù)據(jù)組成驗證集,
10%數(shù)據(jù)組成測試集。
9.7當采用超聲成像聲吶進行圖像采集時,應采用所得超聲圖片標注形成獨立的數(shù)據(jù)集,與水下攝像
機所得圖片數(shù)據(jù)集分開使用。
10算法訓練
10.1將制作好的數(shù)據(jù)集輸入到目標檢測框架進行訓練,構建神經(jīng)網(wǎng)絡模型。
10.2將待識別的魚類圖像輸入到神經(jīng)網(wǎng)絡模型中,待模型檢測完畢后,能自動輸出魚類的種類,西藏
特有魚類種類識別結果示例見附錄C。
10.3應采用整體準確率、各魚種準確率、召回率、F1分數(shù)、平均精確度評估算法性能。
11評價指標獲取與計算方法
11.1為確保西藏特有魚類智能識別技術的準確性,應進行識別算法的準確率驗證。
11.2驗證數(shù)據(jù)集應包含所有需要檢測的魚種和充足的樣本數(shù)量,且每個樣本都有準確的標注。
11.3將數(shù)據(jù)集按8:2隨機劃分為訓練集和驗證集,以便獨立評估模型性能。訓練集用于識別技術模
型訓練,驗證集在訓練過程中用于測試神經(jīng)網(wǎng)絡對訓練集中未出現(xiàn)數(shù)據(jù)的分類性能,根據(jù)神經(jīng)網(wǎng)絡在驗
證集的性能情況,得到各評價指標大小。
11.4采用Positive和Negative表示預測得到的結果,若IoU值大于設定的閾值,則預測為正類
Positive,若IoU值小于設定的閾值,則預測為負類Negative。閾值宜設定為0.3。采用True和False
則表示預測的結果和真實結果是否相同,相同則是True,不同則為False。依據(jù)預測值和真實值的屬性
對目標分別歸類計算數(shù)量。分類方法見表1。
表1正負樣本劃分
預測值:Positive預測值:Negative
真實值:PositiveTruePositive,計入正確識別的魚類數(shù)量FalseNegative,計入漏檢的魚類數(shù)量
真實值:NegativeFalsePositive,計入錯誤識別的魚類數(shù)量TrueNegative,不計入數(shù)量
11.5準確率即分類器認為是正樣本并且確實是正樣本的部分占所有分類器判斷為是正樣本比例。
·······················································(1)
???
?=???+???
4
DB54/T0308—2023
式中:
P——樣本準確率(%);
NTP——樣本中正確識別的魚類數(shù)量;
NFP——樣本中錯誤識別的魚類數(shù)量。
11.6對樣本中所有魚類進行檢測,所有結果進行統(tǒng)一計算所得的準確率為整體準確率。篩選單一魚種
的識別結果進行分析計算,所得準確率為該魚種準確率。
11.7召回率即分類器認為是正樣本并且確實是正類的部分占所有測試集中正樣本的比例。
·······················································(2)
???
????
式中:?=?+?
R——樣本召回率(%);
NFN——樣本中漏檢的魚類數(shù)量。
11.8F1分數(shù)為兼顧分類模型的準確率和召回率指標。
······················································(3)
?×?
1
式中:?=2×?+?
F1——樣本的F1分數(shù)。
11.9平均精確度用來度量模型預測框類別和位置是否準確。AP(AveragePrecision)是以召回率作
為橫軸,準確率作為縱軸,把P-R曲線下的面積當做衡量模型的尺度。
····················································(4)
1
?
式中:?=