版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
(19)國(guó)家知識(shí)產(chǎn)權(quán)局(12)發(fā)明專利司地址215500江蘇省蘇州市常熟市研究院路5號(hào)(72)發(fā)明人陳興達(dá)李鵬高吳沛辰戴晶晶盧明輝謝海圣劉秋艷GO6N3/0所(普通合伙)32276本發(fā)明公開了用于檢測(cè)電機(jī)的多層特征融技術(shù)領(lǐng)域;神經(jīng)網(wǎng)絡(luò)包括第一MFCC模塊、第二譜系數(shù)數(shù)量大于第一MFCC模塊的梅爾頻率倒譜融合和獲得分類結(jié)果;多層特征融合的Transformer神經(jīng)網(wǎng)絡(luò)模型融合了不同梅爾系數(shù)第一全基層第一岳馬層第一均值層第二岳馬層第二均值層第n編碼層第三全描層第一場(chǎng)值房合分英21.一種用于檢測(cè)電機(jī)的多層特征融合Transformer神經(jīng)網(wǎng)絡(luò),其特征在于:包括特征提取模塊、轉(zhuǎn)換融合模塊和融合分類模塊,所述特征提取模塊包括第一MFCC模塊和第二MFCC模塊,第二MFCC模塊的梅爾頻率倒譜系數(shù)數(shù)量大于第一MFCC模塊的梅爾頻率倒譜系數(shù)數(shù)所述轉(zhuǎn)換融合模塊包括第一轉(zhuǎn)換融合模塊和第二轉(zhuǎn)換融合模塊,第一轉(zhuǎn)換融合模塊包括依次連接的第一歸一化模塊、第一全連接層、第一編碼器、第一均值模塊和第一拼接模塊,第一MFCC模塊與第一歸一化模塊連接;第二轉(zhuǎn)換融合模塊包括依次連接的第二歸一化模塊、第二全連接層、第二編碼器、第二均值模塊和第二拼接模塊,第二MFCC模塊與第二歸一化模塊連接;所述第一編碼器和第二編碼器均為含有多層編碼層的編碼器,所述第一均值模塊和第二均值模塊均為含有多層均值層的均值模塊,每一編碼器中編碼層的層數(shù)與均值模塊中均值層的層數(shù)相同;一個(gè)編碼器中所有編碼層按順序依次連接,編碼器中每一編碼層與相鄰均值模塊中相應(yīng)的一個(gè)均值層連接,均值模塊中所有均值層均與相鄰的拼接模塊連接;第一拼接模塊和第二拼接模塊均與融合分類模塊連接。2.根據(jù)權(quán)利要求1所述的用于檢測(cè)電機(jī)的多層特征融合Transformer神經(jīng)網(wǎng)絡(luò),其特征在于:所述編碼器中編碼層的層數(shù)和均值模塊中均值層的層數(shù)均用n表示,n層的編碼器包括第一編碼層至第n編碼層,n層的均值模塊包括第一均值層至第n均值層;所述第一全連接層、第一編碼器的第一編碼層至第n編碼層依次連接,第一編碼器的一個(gè)編碼層與第一均值模塊的一個(gè)均值層連接,第一編碼器的第一編碼層與第一均值模塊的第一均值層連接,第一編碼器的第n編碼層與第一均值模塊的第n均值層連接,第一均值模塊的所有均值層均與第一拼接模塊連接;所述第二全連接層、第二編碼器的第一編碼層至第n編碼層依次連接,第二編碼器的一個(gè)編碼層與第二均值模塊的一個(gè)均值層連接,第二編碼器的第一編碼層與第二均值模塊的第一均值層連接,第二編碼器的第n編碼層與第二均值模塊的第n均值層連接,第二均值模塊的所有均值層均與第二拼接模塊連接。3.根據(jù)權(quán)利要求2所述的用于檢測(cè)電機(jī)的多層特征融合Transformer神經(jīng)網(wǎng)絡(luò),其特征4.根據(jù)權(quán)利要求1所述的用于檢測(cè)電機(jī)的多層特征融合Transformer神經(jīng)網(wǎng)絡(luò),其特征在于:所述融合分類模塊包括依次連接的第三拼接模塊、第三全連接層、轉(zhuǎn)換模塊和二分類全連接層,第一拼接模塊和第二拼接模塊均與第三拼接模塊連接,轉(zhuǎn)換模塊包括第三編碼器和第三均值模塊,第三全連接層、第三編碼器、第三均值模塊和二分類全連接層依次連5.根據(jù)權(quán)利要求4所述的用于檢測(cè)電機(jī)的多層特征融合Transformer神經(jīng)網(wǎng)絡(luò),其特征在于:所述第三編碼器包括第一編碼層和第二編碼層,第三全連接層、第三編碼器的第一編碼層、第三編碼器的第二編碼層、第三均值模塊和二分類全連接層依次連接。6.根據(jù)權(quán)利要求1所述的用于檢測(cè)電機(jī)的多層特征融合Transformer神經(jīng)網(wǎng)絡(luò),其特征在于:所述第二MFCC模塊的梅爾頻率倒譜系數(shù)數(shù)量是第一MFCC模塊量的兩倍;所述第一MFCC模塊的梅爾頻率倒譜系數(shù)數(shù)量取值范圍為32~64,第二MFCC模塊的梅爾頻率倒譜系數(shù)數(shù)量取值范圍為64~128。37.一種檢測(cè)電機(jī)的方法,基于權(quán)利要求1~6中任意一項(xiàng)所述的一種用于檢測(cè)電機(jī)的多步驟S2:將第一頻譜特征矩陣輸入至第一歸一化模塊,第一拼接模塊輸出第一拼接特步驟S3:將第一拼接特征矩陣和第二拼接特征矩陣輸入至融合分類模塊獲得二分類結(jié)將第一頻譜特征矩陣輸入至第一歸一化模塊之后還包括如下步驟將第二頻譜特征矩陣輸入至第二歸一化模塊之后還包括如下步驟征矩陣的形狀為(n_frame,n_mfcc1),第二頻譜特征矩陣的形狀為(n_frame,n_mfcc2),在所述步驟S2中,第一歸一化矩陣的形狀為(n_frame,n_mfcc1),第一全連接形狀為(n_frame,n_embedding1),第一編碼器的編碼層特征矩陣的形狀為(n_frame,n_embedding1),第一均值模塊的平均后的特征向量的形狀為(1,n_embedding1),第一拼接特征矩陣的形狀為(n,n_embedding1);第二歸一化矩陣的形狀為(n_frame,n_mfcc2),第二全連接矩陣的形狀為(n_frame,n_embedding2),第二編碼器的編碼層特征矩陣的形狀為(n_frame,n_embedding2),第二均值模塊平均后的特征向量的形狀為(1,n_embedding2),第二拼接特征矩陣的形狀為(n,n_embedding2);n_embedding1為第一全連接4將第一拼接特征矩陣和第二拼接特征矩陣輸入至第三拼接模塊,第一拼接特征矩陣和第二拼接特征矩陣經(jīng)過第三拼接模塊拼接獲得形狀為(n,n_embedding1+n_embedding2)的特征融合矩陣;將形狀為(n,n_embedding1+n_embedding為(1,n_embedding3)的融合Transformer特征;將形狀為(1,n_embedding3)的融合Transformer特征輸入到二分類全連接層獲得二分類結(jié)果;n_embedding3為第三全連接層5技術(shù)領(lǐng)域[0001]本發(fā)明涉及電機(jī)測(cè)試技術(shù)領(lǐng)域,尤其涉及一種用于檢測(cè)電機(jī)的多層特征融合Transformer神經(jīng)網(wǎng)絡(luò)及方法。背景技術(shù)[0004]由于這些優(yōu)勢(shì),Transformer已廣泛應(yīng)用于語(yǔ)音識(shí)別、聲音分類以及對(duì)話語(yǔ)言大模[0005]在Transformer進(jìn)行電機(jī)聲音分類時(shí),僅依賴最后一層的輸出可能導(dǎo)致淺層局部[0006]因此,用Transformer神經(jīng)網(wǎng)絡(luò)檢測(cè)電機(jī)聲音時(shí)域信號(hào)時(shí),Transformer神經(jīng)網(wǎng)絡(luò)的分類精度低成為亟待解決的技術(shù)問題。發(fā)明內(nèi)容[0007]本發(fā)明提供一種用于檢測(cè)電機(jī)的多層特征融合Transformer神經(jīng)網(wǎng)絡(luò)及方法,解決Transformer神經(jīng)網(wǎng)絡(luò)檢測(cè)電機(jī)聲音時(shí)域信號(hào)分類精度低的技術(shù)問題。[0008]為解決上述技術(shù)問題,本發(fā)明所采取的技術(shù)方案在于如下方面:[0009]一種用于檢測(cè)電機(jī)的多層特征融合Transformer神經(jīng)網(wǎng)絡(luò),包括特征提取模塊、轉(zhuǎn)換融合模塊和融合分類模塊,所述特征提取模塊包括第一MFCC模塊和第二MFCC模塊,第二[0010]所述轉(zhuǎn)換融合模塊包括第一轉(zhuǎn)換融合模塊和第二轉(zhuǎn)換融合模塊,第一轉(zhuǎn)換融合模塊包括依次連接的第一歸一化模塊、第一全連接層、第一編碼器、第一均值模塊和第一拼接模塊,第一MFCC模塊與第一歸一化模塊連接;第二轉(zhuǎn)換融合模塊包括依次連接的第二歸一歸一化模塊連接;所述第一編碼器和第二編碼器均為含有多層編碼層的編碼器,所述第一均值模塊和第二均值模塊均為含有多層均值層的均值模塊,每一編碼器中編碼層的層數(shù)與均值模塊中均值層的層數(shù)相同;一個(gè)編碼器中所有編碼層按順序依次連接,編碼器中每一編碼層與相鄰均值模塊中相應(yīng)的一個(gè)均值層連接,均值模塊中所有均值層均與相鄰的拼接模塊連接;[0011]第一拼接模塊和第二拼接模塊均與融合分類模塊連接。[0012]進(jìn)一步的技術(shù)方案在于:所述編碼器中編碼層的層數(shù)和均值模塊中均值層的層數(shù)均用n表示,n層的編碼器包括第一編碼層至第n編碼層,n層的均值模塊包括第一均值層至6第n均值層;[0013]所述第一全連接層、第一編碼器的第一編碼層至第n編碼層依次連接,第一編碼器的一個(gè)編碼層與第一均值模塊的一個(gè)均值層連接,第一編碼器的第一編碼層與第一均值模塊的第一均值層連接,第一編碼器的第n編碼層與第一均值模塊的第n均值層連接,第一均值模塊的所有均值層均與第一拼接模塊連接;[0014]所述第二全連接層、第二編碼器的第一編碼層至第n編碼層依次連接,第二編碼器的一個(gè)編碼層與第二均值模塊的一個(gè)均值層連接,第二編碼器的第一編碼層與第二均值模塊的第一均值層連接,第二編碼器的第n編碼層與第二均值模塊的第n均值層連接,第二均值模塊的所有均值層均與第二拼接模塊連接。[0015]進(jìn)一步的技術(shù)方案在于:所述n,取值范圍為4~6。[0016]進(jìn)一步的技術(shù)方案在于:所述融合分類模塊包括依次連接的第三拼接模塊、第三全連接層、轉(zhuǎn)換模塊和二分類全連接層,第一拼接模塊和第二拼接模塊均與第三拼接模塊連接,轉(zhuǎn)換模塊包括第三編碼器和第三均值模塊,第三全連接層、第三編碼器、第三均值模塊和二分類全連接層依次連接。[0017]進(jìn)一步的技術(shù)方案在于:所述第三編碼器包括第一編碼層和第二編碼層,第三全連接層、第三編碼器的第一編碼層、第三編碼器的第二編碼層、第三均值模塊和二分類全連接層依次連接。[0018]進(jìn)一步的技術(shù)方案在于:所述第二MFCC模塊的梅爾頻模塊的梅爾頻率倒譜系數(shù)數(shù)量的兩倍;所述第一MFCC模塊的梅爾頻率倒譜系數(shù)數(shù)量取值范圍為32~64,第二MFCC模塊的梅爾頻率倒譜系數(shù)數(shù)量取值范圍為64~128。[0019]一種檢測(cè)電機(jī)的方法,基于上述的一種用于檢測(cè)電機(jī)的多層特征融合[0020]步驟S1:獲得電機(jī)聲音的時(shí)域信號(hào),將電機(jī)聲音的時(shí)域信號(hào)經(jīng)第一MFCC模塊特征提取獲得第一頻譜特征矩陣,將電機(jī)聲音的時(shí)域信號(hào)經(jīng)第二MFCC模塊特征提取獲得第二頻譜特征矩陣;[0021]步驟S2:將第一頻譜特征矩陣輸入至第一歸一化模塊,第一拼接模塊輸出第一拼接特征矩陣;將第二頻譜特征矩陣輸入至第二歸一化模塊,第二拼接模塊輸出第二拼接特征矩陣;[0022]步驟S3:將第一拼接特征矩陣和第二拼接特征矩陣輸入至融合分類模塊獲得二分類結(jié)果,二分類結(jié)果為正?;蛘弋惓?。[0023]進(jìn)一步的技術(shù)方案在于:在所述步驟S2中,[0024]將第一頻譜特征矩陣輸入至第一歸一化模塊之后還包括如下步驟,第一頻譜特征矩陣經(jīng)過第一歸一化模塊均值歸一化獲得歸一化后的第一歸一化矩陣;將第一歸一化矩陣經(jīng)過第一全連接層獲得第一全連接矩陣;將第一全連接矩陣輸入到第一轉(zhuǎn)換融合模塊中第一編碼器的每一編碼層,一個(gè)編碼層獲得一個(gè)編碼層特征矩陣;將第一編碼器的每一個(gè)編碼層特征矩陣輸入至第一均值模塊的相應(yīng)的一個(gè)均值層,第一均值模塊的每一均值層獲得一個(gè)平均后的特征向量;將第一均值模塊的所有平均后的特征向量輸入至第一拼接模塊拼接獲得第一拼接特征矩陣;[0025]將第二頻譜特征矩陣輸入至第二歸一化模塊之后還包括如下步驟,第二頻譜特征7[0027]在所述步驟S2中,第一歸一化矩陣的形陣的形狀為(n_frame,n_embedding1),第一編碼器的編碼層特征矩陣的形狀為(n_frame,n_embedding1),第一均值模塊的平均后的特征向量的形狀為(1,n_embedding1),第一拼接特征矩陣的形狀為(n,n_embedding1);第二歸一化矩陣的形狀為(n_frame,n_mfcc2),第二全連接矩陣的形狀為(n_frame,n_embedding2),第二編碼器的編碼層特征矩陣的形狀為(n_frame,n_embedding2),第二均值模塊平均后的特征向量的形狀為(1,n_embedding2),第二拼接特征矩陣的形狀為(n,n_embedding2);n_embedding1為第一全連接陣和第二拼接特征矩陣經(jīng)過第三拼接模塊拼接獲得形狀為(n,n_embedding1+n_輸入到第三全連接層獲得形狀為(n,n_embedding3)的第三全連接矩陣;將形狀為(n,n_embedding3)的第三全連接矩陣輸入到轉(zhuǎn)換模塊的第三編碼器,然后經(jīng)過第三均值模塊取平均值獲得形狀為(1,n_embedding3)的融合Transformer特征;將形狀為(1,n_embedding3)的融合Transformer特征輸入到二分類全連接層獲得二分類結(jié)果;n_第一轉(zhuǎn)換融合模塊和第二轉(zhuǎn)換融合模塊等,多層特征融合的Transformer神經(jīng)網(wǎng)絡(luò)模型在8加了模型在不同層特征之間的表達(dá)能力,提升了檢測(cè)電機(jī)聲音時(shí)域信號(hào)的分類精度。[0032]一種檢測(cè)電機(jī)的方法,基于上述的一種用于檢測(cè)電機(jī)的多層特征融合Transformer神經(jīng)網(wǎng)絡(luò),包括如下步驟,步驟S1:獲得電機(jī)聲音的時(shí)域信號(hào),將電機(jī)聲音的時(shí)域信號(hào)經(jīng)第一MFCC模塊特征提取獲得第一頻譜特征矩陣,將電機(jī)聲音的時(shí)域信號(hào)經(jīng)第二MFCC模塊特征提取獲得第二頻譜特征矩陣;步驟S2:將第一頻譜特征矩陣輸入至第一歸一化模塊,第一拼接模塊輸出第一拼接特征矩陣;將第二頻譜特征矩陣輸入至第二歸一化模塊,第二拼接模塊輸出第二拼接特征矩陣;步驟S3:將第一拼接特征矩陣和第二拼接特征矩陣輸入至融合分類模塊獲得二分類結(jié)果,二分類結(jié)果為正常或者異常。通過步驟S1至步驟S3,提升了檢測(cè)電機(jī)聲音時(shí)域信號(hào)的分類精度。附圖說明[0033]圖1是本發(fā)明實(shí)施例1的原理框圖;[0034]圖2是本發(fā)明實(shí)施例2的數(shù)據(jù)流圖。具體實(shí)施方式[0035]下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例。以下對(duì)至少一個(gè)示例性實(shí)施例的描述實(shí)際上僅僅是說明性的,決不作為對(duì)本申請(qǐng)及其應(yīng)用或使用的任何限制?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。[0036]在下面的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本申請(qǐng),但是本申請(qǐng)還可以采用其他不同于在此描述的其它方式來實(shí)施,本領(lǐng)域技術(shù)人員可以在不違背本申請(qǐng)內(nèi)涵的情況下做類似推廣,因此本申請(qǐng)不受下面公開的具體實(shí)施例的限制。[0037]實(shí)施例1:[0038]如圖1所示,本發(fā)明公開了一種用于檢測(cè)電機(jī)的多層特征融合Transformer神經(jīng)網(wǎng)二MFCC模塊的梅爾頻率倒譜系數(shù)數(shù)量n_mfcc2取值范圍為64~128,第二MFCC模塊的梅爾頻率倒譜系數(shù)數(shù)量n_mfcc2大于第一MFCC模塊的梅爾頻率倒譜系數(shù)數(shù)量n_mfcc1。[0039]所述轉(zhuǎn)換融合模塊包括依次連接的歸一化模塊、全連接層embedding、編碼器Encoder、均值模塊和拼接模塊,所述編碼器Encoder為n層的編碼器,n層的編碼器包括第一編碼層至第n編碼層,所述均值模塊為n層的均值模塊,n層的均值模塊包括第一均值層至第n均值層,所述歸一化模塊、全連接層embedding、第一編碼層至第n編碼層依次連接,一個(gè)編碼層與一個(gè)均值層連接,第一編碼層與第一均值層連接,所有的均值層均與拼接模塊連接。[0040]n的取值范圍為4~6。[0041]所述轉(zhuǎn)換融合模塊的數(shù)量為兩個(gè),分別是第一轉(zhuǎn)換融合模塊和第二轉(zhuǎn)換融合模塊。[0042]第一轉(zhuǎn)換融合模塊包括依次連接的第一歸一化模塊、第一全連接層embedding1、第一編碼器Encoder1、第一均值模塊和第一拼接模塊,第二轉(zhuǎn)換融合模塊包括依次連接的9第二歸一化模塊、第二全連接層embedding2、第二編碼器Encoder2、第二均值模塊和第二拼接模塊,所述第一編碼器Encoder1和第二編碼器Encoder2均為n層的編碼器,n層的編碼器包括第一編碼層至第n編碼層,所述第一均值模塊和第二均值模塊均為n層的均值模塊,n層的均值模塊包括第一均值層至第n均值層。[0043]所述第一MFCC模塊、第一歸一化模塊、第一全連接層embedding1、第一編碼器Encoder1的第一編碼層至第n編碼層依次連接,第一編碼器Encoder1的一個(gè)編碼層與第一均值模塊的一個(gè)均值層連接,第一編碼器Encoder1的第一編碼層與第一均值模塊的第一均值層連接,以此類推,直至第一編碼器Encoder1的第n編碼層與第一均值模塊的第n均值層連接,第一均值模塊的所有均值層均與第一拼接模塊連接。[0044]所述第二MFCC模塊、第二歸一化模塊、第二全連接層embedding2、第二編碼器Encoder2的第一編碼層至第n編碼層依次連接,第二編碼器Encoder2的一個(gè)編碼層與第二均值模塊的一個(gè)均值層連接,第二編碼器Encoder2的第一編碼層與第二均值模塊的第一均值層連接,以此類推,直至第二編碼器Encoder2的第n編碼層與第二均值模塊的第n均值層連接,第二均值模塊的所有均值層均與第二拼接模塊連接。[0045]融合分類模塊包括依次連接的第三拼接模塊、第三全連接層embedding3、轉(zhuǎn)換模塊和二分類全連接層,第一拼接模塊和第二拼接模塊均與第三拼接模塊連接,轉(zhuǎn)換模塊包括第三編碼器和第三均值模塊,第三編碼器包括第一編碼層和第二編碼層,第三全連接層embedding3、第三編碼器的第一編碼層、第三編碼器的第二編碼層、第三均值模塊和二分類全連接層依次連接。[0046]所述特征提取模塊、轉(zhuǎn)換融合模塊和融合分類模塊Transformer模型,即多層特征融合Transformer神經(jīng)網(wǎng)絡(luò)。[0047]實(shí)施例2:[0048]本發(fā)明公開了一種基于多層特征融合Transformer神經(jīng)網(wǎng)絡(luò)檢測(cè)電機(jī)的方法,包括步驟S1特征提取,步驟S2獲取Transformer待融合的每層特征,步驟S3特征融合和獲得分[0050]步驟S1特征提?。篬0051]如圖2的上部所示,獲得電機(jī)聲音的時(shí)域信號(hào),將電機(jī)聲音的時(shí)域信號(hào)經(jīng)第一梅爾頻率倒譜系數(shù)數(shù)量n_mfcc1的MFCC特征提取獲得形狀為(n_frame,n_mfcc1)的第一頻譜特征矩陣,將電機(jī)聲音的時(shí)域信號(hào)經(jīng)第二梅爾頻率倒譜系數(shù)數(shù)量n_mfcc2的MFCC特征提取獲得形狀為(n_frame,n_mfcc2)的第二頻譜特征矩陣,n_frame為MFCC中傅里葉變換的幀個(gè)數(shù),第一梅爾頻率倒譜系數(shù)數(shù)量n_mfcc1取值范圍為32~64,第二梅爾頻率倒譜系數(shù)數(shù)量n_mfcc2取值范圍為64~128,第二梅爾頻率倒譜系數(shù)數(shù)量n_mfcc2大于第一梅爾頻率倒譜系數(shù)數(shù)量n_mfcc1,第二梅爾頻率倒譜系數(shù)數(shù)量n_mfcc2是第一梅爾頻率倒譜系數(shù)數(shù)量n_mfcc1的兩倍左右,第一頻譜特征矩陣為低維特征矩陣,第二頻譜特征矩陣為高維特征矩[0052]步驟S2獲取Transformer待融合的每層特征:[0053]如圖2的左部所示,將形狀為(n_frame,n_mfcc1)的第一頻譜特征矩陣經(jīng)過第一歸一化模塊均值歸一化獲得形狀為(n_frame,n_mfcc1)歸一化后的第一歸一化矩陣,第一歸一化矩陣即低維特征矩陣。將形狀為(n_frame,n_mfcc1)的第一歸一化矩陣經(jīng)過第一全連接層embedding1獲得形狀為(n_frame,n_embedding1)的第一全連接矩陣embeddingl。[0054]將形狀為(n_frame,n_embedding1)的第一全連接矩陣embedding1輸入到第一轉(zhuǎn)換融合模塊中第一編碼器Encoder1的每一編碼層,一個(gè)編碼層獲得一個(gè)形狀為(n_frame,n_embedding1)的編碼層特征矩陣,共計(jì)n個(gè)形狀為(n_frame,n_embedding1)的編碼層特[0055]第一轉(zhuǎn)換融合模塊的第一編碼器Encoder1中,由于Transformer的Encoder是一個(gè)序列到序列的模型,因此不會(huì)改變輸入的維度。形狀為(n_frame,n_embedding1)第一全連接矩陣embedding1,經(jīng)過n層編碼層Encoder,得出n個(gè)形狀為(n_frame,n_embedding1)編碼層特征矩陣。第一編碼器Encoder1的第一編碼層獲得第一編碼器Encoder1的第一編碼層特征矩陣,第一編碼器Encoder1的第二編碼層獲得第一編碼器Encoder1的第二編碼層特征矩陣,以此類推,第一編碼器Encoder1的第n編碼層獲得第一編碼器Encoder1的第n編碼層特征矩陣。第一編碼器Encoder1的每一編碼層特征矩陣的形狀均為(n_frame,n_[0056]將第一編碼器Encoder1的每一個(gè)形狀為(n_frame,n_embedding1)編碼層特征矩陣輸入至第一均值模塊的相應(yīng)的一個(gè)均值層,第一均值模塊的每一均值層獲得一個(gè)形狀為(1,n_embedding1)平均后的特征向量,共獲得n個(gè)形狀為(1,n_embedding1)平均后的特[0057]將n個(gè)形狀為(n_frame,n_embedding1)編碼層特征矩陣取平均,得出n個(gè)形狀為(1,n_embedding1)平均后的特征向量。第一編碼器Encoder1的第一編碼層特征矩陣輸入至第一均值模塊的第一均值層獲得形狀為(1,n_embedding1)平均后的第一特征向量,以此類推,直至第一編碼器Encoder1的第n編碼層特征矩陣輸入至第一均值模塊的第n均值層獲得形狀為(1,n_embedding1)平均后的第n特征向量。n_embedding1為第一全連接層嵌入的特征數(shù)量。[0058]將n個(gè)形狀為(1,n_embedding1)平均后的特征向量輸入至第一拼接模塊拼接獲得形狀為(n,n_embedding1)的第一拼接特征矩陣,第一拼接特征矩陣即低維特征矩陣每層[0059]如圖2的右部所示,將形狀為(n_frame,n_mfcc2)的第二頻譜特征矩陣經(jīng)過第二歸一化模塊均值歸一化獲得形狀為(n_frame,n_mfcc2)歸一化后的第二歸一化矩陣,第二歸一化矩陣即高維特征矩陣。將形狀為(n_frame,n_mfcc2)的第二歸一化矩陣經(jīng)過第二全連接層embedding2獲得形狀為(n_frame,n_embedding2)的第二全連接矩陣embedding2。[0060]將形狀為(n_frame,n_embedding2)的第二全連接矩陣embedding2輸入到第二轉(zhuǎn)換融合模塊中第二編碼器Encoder2的每一編碼層,一個(gè)編碼層獲得一個(gè)形狀為(n_frame,n_embedding2)的編碼層特征矩陣,共計(jì)n個(gè)形狀為(n_frame,n_embedding2)的編碼層特[0061]第二轉(zhuǎn)換融合模塊的第二編碼器Encoder2中,由于Transformer的Encoder是一個(gè)序列到序列的模型,因此不會(huì)改變輸入的維度。形狀為(n_frame,n_embedding2)第二全連接矩陣embedding2,經(jīng)過n層編碼層Encoder,得出n個(gè)形狀為(n_frame,n_embedding2)編碼層特征矩陣。第二編碼器Encoder2的第一編碼層獲得第二編碼器Encoder2的第一編碼層11特征矩陣,第二編碼器Encoder2的第二編碼層獲得第二編碼器Encoder2的第二編碼層特征矩陣,以此類推,第二編碼器Encoder2的第n編碼層獲得第二編碼器Encoder2的第n編碼層特征矩陣。第二編碼器Encoder2的每一編碼層特征矩陣的形狀均為(n_frame,n_embedding2)。n_embedding2為第二全連接層嵌入的特征數(shù)量。[0062]將第二編碼器Encoder2的每一個(gè)形狀為(n_frame,n_embedding2)編碼層特征矩陣輸入至第二均值模塊的相應(yīng)的一個(gè)均值層,第二均值模塊的每一均值層獲得一個(gè)形狀為(1,n_embedding2)平均后的特征向量,共獲得n個(gè)形狀為(1,n_embedding2)平均后的特[0063]將n個(gè)形狀為(n_frame,n_embedding2)編碼層特征矩陣取平均,得出n個(gè)形狀為(1,n_embedding2)平均后的特征向量。第二編碼器Encoder2的第一編碼層特征矩陣輸入至第二均值模塊的第一均值層獲得形狀為(1,n_embedding2)平均后的第一特征向量,以此類推,直至第二編碼器Encoder2的第n編碼層特征矩陣輸入至第二均值模塊的第n均值層獲得形狀為(1,n_embedding2)平均后的第n特征向量。[0064]將n個(gè)形狀為(1,n_embedding2)平均后的特征向量輸入至第二拼接模塊拼接獲得形狀為(n,n_embedding2)的第二拼接特征矩陣,第二拼接特征矩陣即高維特征矩陣每層[0065]步驟S3特征融合和獲得分類結(jié)果:[0066]如圖2的中部往下所示,將形狀為(n,n_embedding1)的第一拼接特征矩陣即低維特征矩陣每層特征和形狀為(n,n_embedding2)的第二拼接特征矩陣即高維特征矩陣每層特征輸入至第三拼接模塊拼接獲得形狀為(n,n_embedding1+n_embedding2)的特征融合矩陣。將形狀為(n,n_embedding1+n_embedding2)的特征融合矩陣輸入到第三全連接層embedding3獲得形狀為(n,n_embedding3)的第三全連接矩陣embedding3。[0067]n_embedding3為第三全連接層嵌入的特征數(shù)量。[0068]將形狀為(n,n_embedding3)的第三全連接矩陣embedding3輸入到轉(zhuǎn)換模塊的第三編碼器,第三全連接矩陣embedding3依次經(jīng)過第三編碼器的第一編碼層和第二編碼層,然后經(jīng)過第三均值模塊取平均值獲得形狀為(1,n_embedding3)的融合Transformer特征。將形狀為(1,n_embedding3)的融合Transformer特征輸入到二分類全連接層獲得二分類結(jié)[0070]本申請(qǐng)采用公開數(shù)據(jù)集MIMIIDataset來驗(yàn)證基于多層特征融合的Transformer工業(yè)電機(jī)設(shè)備異常檢測(cè)方法的優(yōu)越性。MIMIIDataset是用于故障工業(yè)機(jī)器調(diào)查和檢查的和滑軌分別公開了4個(gè)型號(hào)(id0,id2,id4,id6),每個(gè)型號(hào)公開了-6db,Odb,6db信噪比的聲音數(shù)據(jù),每個(gè)型號(hào)的數(shù)據(jù)包含正常聲音和異常聲音。[0071]本申請(qǐng)選取0db信噪比的,id0的泵電機(jī)聲音作為實(shí)驗(yàn)數(shù)據(jù),以8:2的比例切割訓(xùn)練集和測(cè)試集。[0072]特征提取中:n_frame=5,n_mfcc1=32,n_mfcc2=64。[0073]該數(shù)據(jù)實(shí)施例中,第二梅爾頻率倒譜系數(shù)數(shù)量n_mfcc2是第一梅爾頻率倒譜系數(shù)數(shù)量n_mfcc1的兩倍。[0074]獲取Transformer待融合的每層特征中:n=4,n_embedding1=32,n_embedding2=[0075]該數(shù)據(jù)實(shí)施例中,4層的編碼器包括第一編碼層、第二編碼層、第三編碼層和第四編碼層。[0078]將僅僅使用n_mfcc1=32的無多層特征融合的Transformer模型和僅僅使用nmfcc2=64的無多層特征融合的Transformer模型和基于多層特征融合的Transformer模型進(jìn)行比較。僅僅使用n_mfcc1=32的Transformer模型的精度為97.39;僅僅使用n_mfcc1=64的Transformer模型的精度為97.83;基于多層特征融合的Transformer模型精度為99.13。因此,多層特征融合的Transfo
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年?yáng)|莞理工學(xué)院第二批招聘聘用人員19人備考題庫(kù)及參考答案詳解1套
- 2026年南昌高投檢測(cè)科技有限公司派遣制試驗(yàn)檢測(cè)人員招聘?jìng)淇碱}庫(kù)含答案詳解
- 2025年廣州市荔灣區(qū)教育局公開招聘事業(yè)編制教師備考題庫(kù)含答案詳解
- 2026年大瀝實(shí)驗(yàn)中學(xué)招聘?jìng)淇碱}庫(kù)及答案詳解參考
- 2026年德清縣某事業(yè)單位招聘工作人員備考題庫(kù)及答案詳解1套
- 2026年寰宇東方國(guó)際集裝箱(青島)有限公司招聘?jìng)淇碱}庫(kù)及完整答案詳解一套
- 2026年南寧市良慶區(qū)人力資源和社會(huì)保障局公開招聘工作人員備考題庫(kù)有答案詳解
- 2026年慶陽(yáng)市揚(yáng)黃工程慶西管理所泵站運(yùn)行工招聘?jìng)淇碱}庫(kù)有答案詳解
- 2026年中國(guó)建筑第五工程局有限公司山東分公司招聘?jìng)淇碱}庫(kù)及1套完整答案詳解
- 2025年?duì)I口市中心醫(yī)院公開招聘勞務(wù)派遣人員備考題庫(kù)含答案詳解
- 2021-2022學(xué)年天津市濱海新區(qū)九年級(jí)上學(xué)期物理期末試題及答案
- 江蘇省蘇州市、南京市九校2025-2026學(xué)年高三上學(xué)期一輪復(fù)習(xí)學(xué)情聯(lián)合調(diào)研數(shù)學(xué)試題(解析版)
- 2026年中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)實(shí)驗(yàn)動(dòng)物研究所第三批公開招聘工作人員備考題庫(kù)及答案詳解一套
- 2025年幼兒園教師業(yè)務(wù)考試試題及答案
- 國(guó)家開放大學(xué)《Python語(yǔ)言基礎(chǔ)》形考任務(wù)4答案
- (自2026年1月1日起施行)《增值稅法實(shí)施條例》重點(diǎn)解讀
- 2026春小學(xué)科學(xué)教科版(2024)三年級(jí)下冊(cè)《4.幼蠶在生長(zhǎng)》教學(xué)設(shè)計(jì)
- 管道安裝協(xié)議2025年
- 2026年內(nèi)蒙古商貿(mào)職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試題庫(kù)附答案詳解
- 2025寧夏賀蘭工業(yè)園區(qū)管委會(huì)招聘40人筆試參考題庫(kù)及答案解析
- 2026年青島航空科技職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性考試題庫(kù)含答案詳解
評(píng)論
0/150
提交評(píng)論