版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第14章語音增強(qiáng)§14.1概述§14.2語音特性、人耳感知特性及噪聲特性§14.3濾波法語音增強(qiáng)技術(shù)§14.4利用相關(guān)特性的語音增強(qiáng)技術(shù)§14.5非線性處理法語音增強(qiáng)技術(shù)§14.6減譜法語音增強(qiáng)技術(shù)§14.7利用Weiner濾波法的語音增強(qiáng)技術(shù)§14.1概述
語音增強(qiáng)是指語音質(zhì)量的改善或提高。因?yàn)閷?shí)際語音都是在有噪聲和干擾的情況下產(chǎn)生的,所以語音增強(qiáng)的目的就是去掉語音信號中的噪聲和干擾。語音增強(qiáng)技術(shù)有廣泛的應(yīng)用,如作為語音編碼和語音識別的預(yù)處理,消除語音中的混響,從錄音中恢復(fù)出高質(zhì)量的語音。應(yīng)用于研究的語音數(shù)據(jù)大都在無噪環(huán)境下采集的。?1)實(shí)際環(huán)境存在各種各樣的干擾噪聲,最常見的是背景噪聲,噪聲干擾下的語音,其特征參數(shù)發(fā)生了很大的扭曲,噪聲干擾下的語音識別率大大降低、合成語音質(zhì)量急劇惡化等。?2)語音增強(qiáng)的目的:從帶噪語音中提取盡可能純凈的原始語音,從主觀度量上講,就是改善語音質(zhì)量、消除背景噪聲,從客觀度量講,即提高語音可懂度。?3)針對不同的噪聲,采用不同的語音增強(qiáng)方法,因噪聲種類繁多,不可能有通用的語音增強(qiáng)方案。§14.1語音特性、人耳感知特性及噪聲特性?1語音特性:前已述及,這里簡單回顧A、是時變的、非平穩(wěn)、非遍歷的隨機(jī)過程,短時相對平穩(wěn);B、分濁音和清音,前者表現(xiàn)出周期性,在頻域有共振峰,能量大都集中在較低頻段內(nèi);后者類于白噪聲,無明顯的時域和頻域特性。C、可用統(tǒng)計分析特性描述。2.人耳感知特性目前,用于語音增強(qiáng)的語音感知方面的一些結(jié)論:A、幅度譜對感知起決定性影響,相位譜對不敏感;B、人耳對頻率高低的感受近似與該頻率的對數(shù)成正比;C、人耳有掩蔽效應(yīng),即強(qiáng)信號對弱信號起抑制作用。人耳有掩蔽效應(yīng):即指一個聲音的存在會影響對另一個較弱聲音的聽覺,另外,當(dāng)一個聲音突然停止時,人耳約在150ms內(nèi)對其它弱音聽不清楚,甚至聽不見。因此提高語音的SNR,就可在語音與噪聲共存時,感覺不到噪聲的存在。D、共振峰對語音感知非常重要,特別是第二共振峰比第一共振峰更為重要,因此對語音信號進(jìn)行一定的高通濾波不會對可懂度產(chǎn)生影響。E、人耳在多人的說話環(huán)境中,能分辨出所需聲音。3.噪聲特性:
(a)加性噪聲(1)沖激噪聲:例如打火、放電都會引起沖激噪聲。它的時域波形是類似于沖激函數(shù)的窄脈沖。消除沖激噪聲的方法通常有兩種:對帶噪語音信號的幅度求均值,將該均值作為閾值,超過該閾值則判斷為噪聲,在時域?yàn)V除;當(dāng)沖激脈沖不太密的時候,也可以通過內(nèi)插的方法避開或平滑掉沖激點(diǎn),從而在重建語音時去掉沖激噪聲。(2)周期噪聲:例如發(fā)動機(jī)產(chǎn)生的干擾、市電干擾都是周期性的干擾。在頻譜上表現(xiàn)為離散的窄譜,通??梢圆捎孟莶ㄆ鞣椒ㄟM(jìn)行消除。(3)寬帶噪聲:例如說話時同時伴隨著呼吸引起的噪聲,隨機(jī)噪聲源產(chǎn)生的噪聲,以及量化噪聲等。應(yīng)用中常近似為高斯噪聲或白噪聲。噪聲頻譜遍布于語音信號頻譜中,消除比較困難,一般需要采用非線性處理方法,減譜法,Weiner濾波法。(4)語音干擾:干擾語音信號和待傳語音信號同時在一個信道中傳輸所造成的干擾(如在通信中串話引起的)。區(qū)別它們的方法是利用基音差別。可以用梳狀濾波器提取基音和各次諧波,再恢復(fù)出有用的信號。(b)非加性噪聲傳輸噪聲:傳輸系統(tǒng)的電路噪聲。與背景噪聲不同,它在時域中是語音和噪聲的卷積。處理這種噪聲可以用同態(tài)處理的方法,把非加性噪聲變換為加性噪聲來處理。干擾語音背景噪聲純凈語音+信道傳輸噪聲語音增強(qiáng)增強(qiáng)語音§14.3濾波法語音增強(qiáng)技術(shù)1陷波器法對于周期噪聲采用陷波器是比較簡便和有效的方法,設(shè)計的陷波器的幅頻曲線的凹處對應(yīng)于周期噪聲的基頻和各次諧波,并使這些頻率處的限波寬度足夠窄。帶噪語音DFTIDFT頻譜整形器增強(qiáng)語音2自適應(yīng)濾波器自適應(yīng)濾波器能有效地在未知環(huán)境中跟蹤時變的輸入信號。使輸出信號達(dá)到最優(yōu),所以可以用來構(gòu)成自適應(yīng)的噪聲消除器。+自適應(yīng)濾波器r(t)-+r’(t)s’(t)y(t)=s(t)+n(t)s(t)為語音信號,n(t)為未知噪聲信號,y(t)為帶噪語音信號,r(t)為參考噪聲輸入,與語音信號無關(guān),與噪聲有關(guān)。該濾波器的實(shí)質(zhì)是實(shí)現(xiàn)帶噪信號中的噪聲估計,并用原始信號y(t)減去估計值r’(t),達(dá)到語音增強(qiáng)的目的?!?4.4利用相關(guān)特性的語音增強(qiáng)技術(shù)1自相關(guān)處理抗噪法語音增強(qiáng)技術(shù)該方法利用語音信號本身相關(guān),而語音與噪聲、噪聲與噪聲可認(rèn)為互不相關(guān)的性質(zhì),對帶噪語音信號做自相關(guān)處理,可以得到與不帶噪語音信號同樣的自相關(guān)序列。即帶噪語音的自相關(guān)函數(shù)近似等于純凈語音信號的自相關(guān)函數(shù)。將自相關(guān)系數(shù)作為識別系統(tǒng)的特征,可以達(dá)到抗噪聲的目的。開方器移動Tp自相關(guān)系數(shù)確定Tp一周期波形切除相關(guān)波形連接輸出帶噪語音信號自相關(guān)處理抗噪法的流程2利用復(fù)數(shù)幀段主分量特征的降噪方法來自環(huán)境的噪聲具有幀間相關(guān)性小,能量分布頻率范圍廣且數(shù)值較小,在語音信號主分量特征中對應(yīng)于貢獻(xiàn)率較小的分量的特點(diǎn)。因此可以利用復(fù)數(shù)幀段主分量特征提高抗噪性。復(fù)數(shù)幀段特征是采用相繼的復(fù)數(shù)幀組成的特征參數(shù)矢量作為語音識別輸入特征量,由于噪聲成分具有幀間相關(guān)性小的特征,所以利用復(fù)數(shù)幀段特征量等于相應(yīng)的減弱了噪聲的影響。為了進(jìn)一步降噪,可以求取復(fù)數(shù)幀段參數(shù)特征的主分量特征,由于噪聲對應(yīng)于較小的分量,所以貢獻(xiàn)率較大的主分量作為語音識別特征,而舍棄較小的分量,這樣既可以降低噪聲,也可以解決輸入特征矢量維數(shù)增加時,計算量增大的問題。主分量是N個D維樣本的自相關(guān)矩陣的本征向量,每一個本征向量對應(yīng)一個本征值,本征值小的重要性也小,小本征值部分往往對應(yīng)噪聲,所以可以從特征量中去除小本征值對應(yīng)的主分量,達(dá)到降低噪聲的影響?!?4.5非線性處理法語音增強(qiáng)技術(shù)1中心削波法對于噪聲頻譜遍布于語音信號頻譜中的寬帶噪聲,如果噪聲振幅比大部分的語音信號振幅低,則削去低幅度成分也就削去了寬帶噪聲。所以我們可以在頻域中采取中心限幅的方法,高幅度的頻譜可以通過而低幅成分不允許通過,從而實(shí)現(xiàn)噪聲抑制。2同態(tài)濾波法對于乘性或卷積性噪聲可以采用同態(tài)濾波的方法。帶噪語音FFTln[]IFFT音調(diào)提取FFT頻譜分析合成輸出復(fù)倒譜串脈沖同態(tài)濾波法原理框圖同態(tài)濾波可以用于識別系統(tǒng)的預(yù)處理。卷積信號經(jīng)過同態(tài)濾波器后由卷積運(yùn)算變成了相應(yīng)的復(fù)倒譜求和運(yùn)算,這樣可以分離出乘性噪聲。再由復(fù)倒譜提取音調(diào)參數(shù),經(jīng)過頻譜分析獲取降噪處理之后的共振峰,最后合成為降噪后的語音信號?!?4.6減譜法語音增強(qiáng)技術(shù)
減譜法是假定加性噪聲與短時平穩(wěn)的語音信號相互獨(dú)立的條件下,從帶噪語音的功率譜中減去噪聲功率譜,從而得到較為純凈的語音頻譜。減譜法假定語音信號短時平穩(wěn),所以需要對輸入語音加窗后處理。y(t)=s(t)+n(t)FFT|?|2
Pn(ω)
+-(?)1/2
相位恢復(fù)Ψ(ω)IFFTs(t)Py(ω)=Ps(ω)+Pn(ω)設(shè)s(t)為純凈語音信號,n(t)為噪聲信號,y(t)為帶噪信號,有y(t)=s(t)+n(t)其傅立葉變換為Y(ω)=S(ω)+N(ω)假定語音信號與加性噪聲獨(dú)立,則有|Y(ω)|2=|S(ω)|2+|N(ω)|2即功率譜的關(guān)系為:Py(ω)=Ps(ω)+Pn(ω)Ps(ω)=Py(ω)-Pn(ω)噪聲功率譜Pn(ω)可以通過發(fā)聲前的靜音段的功率譜來估計。帶噪語音功率譜和噪聲功率譜相減就可以認(rèn)為是純凈語音功率譜。由于在傅立葉變換后只考慮了功率譜,沒有考慮相位的變化,所以在傅立葉反變換時,還要考慮相位的變化,即Ψ(ω)。§14.7利用Weiner濾波法的語音增強(qiáng)技術(shù)該方法是在最小均方準(zhǔn)則下用Weiner濾波器實(shí)現(xiàn)對語音信號的估計,即對于帶噪語音信號,確定濾波器的沖激響應(yīng),使帶噪語音信號經(jīng)過該濾波器的輸出能夠滿足均方誤差最小。設(shè)s(t)為純凈語音信號,n(t)為噪聲信號,y(t)為帶噪信號,有y(t)=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職第二學(xué)年(護(hù)理)老年照護(hù)專項(xiàng)試題及答案
- 2025年大學(xué)本科(食品質(zhì)量與安全)食品分析試題及答案
- 2025年大學(xué)食品科學(xué)與工程(食品工程)試題及答案
- 2025年中職焊接技術(shù)與自動化(手工焊接)試題及答案
- 養(yǎng)老院老人心理咨詢師培訓(xùn)制度
- 養(yǎng)老院心理慰藉制度
- 公共交通從業(yè)人員培訓(xùn)考核制度
- 2026年人工智能計算機(jī)視覺基礎(chǔ)知識題庫含答案
- 2026年刮痧師中醫(yī)理論考核試題含答案
- 2026年中級公共文化服務(wù)面試題及答案
- 土壤微生物群落結(jié)構(gòu)優(yōu)化研究
- 2024外研版四年級英語上冊Unit 4知識清單
- 四川省南充市2024-2025學(xué)年部編版七年級上學(xué)期期末歷史試題
- 國有企業(yè)三位一體推進(jìn)內(nèi)控風(fēng)控合規(guī)建設(shè)的問題和分析
- 急診預(yù)檢分診課件教學(xué)
- 2025年高二數(shù)學(xué)建模試題及答案
- 儲能集裝箱知識培訓(xùn)總結(jié)課件
- 幼兒園中班語言《雪房子》課件
- 房地產(chǎn)項(xiàng)目開發(fā)管理方案
- 堆垛車安全培訓(xùn)課件
- 貝林妥單抗護(hù)理要點(diǎn)
評論
0/150
提交評論