基于EMD的語音特征信息提取 - 圖文-_第1頁
基于EMD的語音特征信息提取 - 圖文-_第2頁
基于EMD的語音特征信息提取 - 圖文-_第3頁
基于EMD的語音特征信息提取 - 圖文-_第4頁
基于EMD的語音特征信息提取 - 圖文-_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第38卷 第10A 期2011年10月計算機科學Computer Science Vol.38No.10AOct 2011王 輝(1982-,男,助教,主要研究方向為語音信號處理和數字圖像處理;李生華(1979-,男,講師,主要研究方向為語音信號處理。基于EMD 的語音特征信息提取王 輝 李生華(賀州學院物理與電子信息工程系 賀州542800摘 要 有效提取語音信號的特征信息是語音識別的關鍵。對語音信號采用經驗模態(tài)分解法可得到語音的一系列本征模函數,提取本征模函數的過程是降低語音信號冗余度的過程。在語音識別的試驗中以本征模函數為訓練模型較傳統(tǒng)的識別方法識別率更高。仿真結果表明:方法是有效的,用

2、于提取語音的特征信息是可行的。關鍵詞 語音信號,經驗模態(tài)分解,特征信息,語音識別,本征模函數中圖法分類號 T N 912 文獻標識碼 BFeature Extraction of Speech Signal Based on Empirical Mode DecompositionW A NG Hui L I Sheng -hua(School of Ph ysical and Electronic Information Engin eering,H ezh ou Un iversity,H ez hou 542800,C hinaAbstract Effectiv ely extr act

3、ing feature info rmation o f speech signal is the key of speech r eco gnition.By empirical mo de decomposit ion method,a series o f intrinsic mode functio n can be g ot.Ex tr act ion pr ocess o f int rinsic mode funct ion is to reduce its redundancy.Experimental r esults sho w that t he empirical mo

4、 de decomposition method can decrease the r ecog -nit ion err or rate.EM D is an effectiv e met ho d.It is feasible to ex tr act the feature fr om speech sig nals with EM D.Keywords Speech sig nal,EM D,Feature info rmatio n,Speech recog nitio n,Intrinsic mode functio n1 引言語音信號是一種非平穩(wěn)的隨機信號,其統(tǒng)計特征是語音信號隨

5、時間變化而變化,同時又是漸變的?;谡Z音信號在一小段時間范圍里是平穩(wěn)的,因此對語音信號的處理方法一般采用短時傅立葉變換、小波變換等方法1。但這種短時處理方法在提升語音識別性能方面存在著很多的不足。近年來H HT (H ilber t -H uang T r ansfo rm法成為非線性信號處理的一種新的有效方法2,3。經驗模態(tài)分解法是一種能很好地處理非線性、非平穩(wěn)信號的完全局部自適應時頻分析方法,這種方法主要是利用信號的局部特征時間尺度,對信號進行逐級分解,這樣得到的信號是具有不同特征時間尺度的數據序列,我們把通過逐級分解而得到的每個數據序列稱為一個本征模函數(IM F 4。得到的這一系列IM

6、 F 分量能突出地體現數據的局部特征。2 經驗模態(tài)分解法(EMD通常情況下,一個信號都可以看成是由多個本征模函數(IM F 組成的。經驗模態(tài)分解法就是從信號中提取出各個IM F 分量。一個本征模函數必須滿足下面2個條件5:(1在整個函數中極值點和過零點的數目相差不能大于1個;(2在任何時間點上,局部極大值的包絡和局部極小值的包絡的均值必須為零。同時經驗模態(tài)分解是建立在以下3個假設下來進行的:(1信號至少有2個極值點,一個最小值點和一個最大值點;(2特征時間尺度是通過2個相鄰的極值點之間的時間間隔定義的;(3如果數據缺少極值點但有變形點,則可通過數據微分一次或幾次獲得極值點,然后再通過積分來獲得

7、分解結果。經驗模態(tài)分解方法在分解的過程中其基函數是基于數據本身的,分解的本質是由數據的特征時間尺度來獲得信號本征震蕩的模式,并以此來分解數據,這一過程可以形象地稱之為 篩 的過程。具體過程如下:(1設原始數據序列用S(t表示,找出S(t的極大值點和極小值點,通過3次抽樣函數擬合得到S (t的上包絡線和下包絡線。(2求上包絡線和下包絡線的均值并用m 1來表示。用h 1表示S (t與m 1的差值即:h 1=S(t-m 1理想情況下h 1可以看成是一個IM F ,但實際情況中由于有欠調和過調現象的發(fā)生總會存在圖形不對稱的情況。因此,通常會把h 1看作是原始數據并多次重復以上操作直到最后得到的結果滿足

8、上文中提到的符合本征模函數的2個條件,并用c 1來表示c 1=h 1n 。在實現的過程中依據以下2點來判斷:(I過零點數目和局部極值總的個數(包括局部極大值和局部極小值相等;(II標準偏差SD 的取值范圍在0.2到0.3之間。SD = Tt =0(h 1(n -1(t-h 1n (t2h 1(n -1(t(3從原始數據中分離出分量r 1并記r 1=S(t-c 1,再434對信號r 1重復(1、(2的過程得到c 2,c 3, ,c n ,這樣就可以得到若干階IM F 分量和一個變化緩慢的趨勢項r n 。進行以上分解后,原始信號S(t可以表示為:S(t= nk =1c k (t+r n (t3 語

9、音信號特征信息的提取通過提取語音信號中的特征信息可以去除信息中的一些冗余量,這樣在數據處理過程中可以減少一定的計算量。本文對語音信號通過經驗模態(tài)分解的方法來獲得語音的特征信息,采用經驗模態(tài)分解法提取語音信號特征信息的示意圖如圖1所示。 圖1 特征信息提取示意圖圖2示出語音信號數字3(在普通工作環(huán)境下采用單聲道,8kH z,8Bit 量化得到的的時域波形。 圖2 語音信號的時域波形圖對圖2所示語音信號進行EM D 分解后得到的一組本征模函數(IM F 1 IM F6,如圖3所示,對應的頻譜圖如圖4所示。 圖3 語音信號采用EM D 分解得到的本征模函數波形圖(IM F1IMF6 圖4 語音信號本

10、征模函數(IM F1 IM F6的頻譜圖對圖2所示輸入的語音信號采用EM D 分解后將得到一系列的本征模函數,我們取前6個分量,如圖3所示。將得到的IM F1 IM F6這些函數恢復成語音信息后發(fā)現,第一個基信號(IM F1所得到的聲音比較高,第二個基信號(IM F2得到的聲音比較低沉,第三個比第二個更加低沉,以后的基信號還原成語音信號后將聽不到清楚的發(fā)音。通過圖4中所示頻譜圖也能清楚地看到隨著分解的進行得到的基信號的頻率會越來越低并逐漸趨向于零。根據這些性質,可以推測前面的幾個基信號中包含了比較多的原始語音信息,后面幾個基信號可能是發(fā)音者的特性。4 實驗過程與分析下面把采用經驗模態(tài)分解法得到

11、的語音本征模函數用到語音識別中去,與傳統(tǒng)的語音識別進行比較得到的實驗結果如表1所列。表1 語音識別的結果不同的訓練模型傳統(tǒng)方法IMF1IMF2IMF3IMF4IM F5IM F6識別率82.0%96.0%84.0%82.0%68.0%54.0%32.0%上述語音識別過程所采用的方法都是基于隱馬爾可夫(HM M 模型的,語音錄制是在普通工作環(huán)境下采用單聲道,8kHz,8Bit 量化得到的。語料部分是由5個人每人10個數字(1-10總共50個詞構成的。在識別的過程中采用的方法是將語料通過經驗模態(tài)分解后得到一系列的本征模函數I MF 1,I M F 2, ,I M F n ,再將各本征模函數訓練成模

12、型分別記為M 1,M 2, ,M n ,識別時將待識別的語料也經過經驗模態(tài)分解得到對應的本征模函數來進行識別。分析表1中的數據結果可以看出前3個本征模函數中含有比較多的語音特征信息,識別率也比較高。后面的基函數中包含的則可能是說話人的特性。另外對于發(fā)音比較相似的語音信號(比如數字4、10,在識別的實驗中發(fā)現以IM F2作為訓練模型其識別率是最高的。為了很好地區(qū)分相似音,我們構建以下的模型來進行訓練:0.2*I M F 1+0.8*I MF 2識別結果如表2所列。表2 相似音識別的結果不同的訓練模型傳統(tǒng)方法IMF 1IMF 20.2*IM F 1+0.8*IMF 2識別率80.0%86.0%94

13、.0%92.0%結束語 對語音信號采用基于EM D 的方法提取出來的本征模函數中含有原始語音的特征。提取本征模函數的過程是一個降低語音信號冗余度的過程,同時,在處理發(fā)音相似的語音信號時也得到了比較好的識別結果。可見,基于EM D 的語音本征模信息提取是一種有效、可行的方法。參考文獻1韓繼慶.語音信號處理M .北京:清華大學出版社,20042H uang N E,Sh en Z,Long S R.T he empirical m ode decom pos-i tion and the Hilbert s pectru m for nonlin ear and non -stationary t

14、ime s eries analysisJ.Proc R Soe Lond A,1998,454:903-9953H aw ley S D,Atlas L E,Chiz eck H J.Some properties of an em -pirical mode type signal decomposition algorithm J .Procee -435din gs of IEE E International Conference on Acoustics,S peech and Signal Proces sing,2008,8(9:3625-36284張德祥,吳小培.基于經驗模態(tài)

15、分解和T eager峭度的語音端點檢測J.儀器儀表學報,2010,3(005:101-1045李晉,王景芳,高金定.基于經驗模態(tài)分解和遞歸圖的語音端點檢測算法J.計算機工程與應用,2010,46(34:132-1356宋倩倩,于鳳芹.基于EM D和改進雙門限法的語音端點檢測J.電聲技術,2009,8(33:60-637談雪丹,顧濟華,趙鶴鳴.基于H H T瞬時能頻值的耳語音端點檢測J.計算機工程與軟件,2010,46(29:147-1508李凌,曾以成,雷雄國.EM D在說話人辨識中的應用J.湘潭大學自然科學學報,2006,3(28:108-111(上接第422頁u char i,*p;E A

16、=1;E S=1;REN=1;/*設置短信模式*/w h ile(1clearSBU F(tempSBU F,100;countSBUF=0;sendAT(AT_CM GF1;/將模式改為中文模式for(i=0;i<20;i+delay(60000;/時延等待p=strstr(tempS BUF,AT_OK;/判斷是否收到OK if(p!=NULLb reak;els efor(i=0;i<20;i+delay(60000;/延時等待temp33=*num;temp37=*(num+1;temp315=*(num+3;temp319=*(num+4;n umber_change(p

17、hone_NU M;clearS BU F(tempSBU F,100;countSBUF=0;sendA T(AT_CM GS;sendA T("52"send byte( r ;for( i=0;i<20;i+d elay(60000;sendA T(PDU0;sendA T(pdu_nu mber;sendA T(tem p1;sendA T(tem p3;sendA T(tem p2;send_b ype(0x1a;for(i=0;i<100;i+d elay(60000;/*設置短信模式*/w h ile(1clearSBUF(tem pSBUF,10

18、0;cou ntSBUF=0;s endAT(AT_CM GF;for(i=0;i<20;i+delay(60000;p=s tr str(tempS BU F,AT_OK;if(p!=NULLbr eak;elsefor(i=0;i<20;i+delay(60000;/延時等待結束語 G SM網絡覆蓋地域廣,目前移動通信網在全國的覆蓋率在95%以上,非邊遠地區(qū)的覆蓋率幾乎100%;通信距離遠,網絡可靠性高穩(wěn)定性好。短信遠程監(jiān)控系統(tǒng)利用成熟的G SM網絡,實現對家居設備電源通斷、遠程監(jiān)視與控制。利用工作在ISM(2.4GH z的無線模塊既能簡單、快捷地實現系統(tǒng)與家居設備的鏈接,還能構成更大的無線家居設備控制網絡。最后,短信費用低廉和手機的靈活方便使得利用手機短息遠程控制家居設備具有廣闊的市場前景與極高的應

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論