版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第15章語音增強(qiáng)第15章語音增強(qiáng)1目錄15.1概述15.2語音特性、人耳感知特性及噪聲特性15.2.1語音特性15.2.2人耳感知特性15.2.3噪聲特性15.3濾波器法15.3.1固定濾波器15-.3.2自適應(yīng)濾波15.3.3變換技術(shù)15.4非線性處理15.4.1中心削波15.4.2同態(tài)濾波法15.5減譜法15.5.1減譜法15.5.2減譜法的改進(jìn)形式15.6自相關(guān)相減法15.7自適應(yīng)噪聲對消15.7.1自適應(yīng)濾波15.7.2具有參考信號的自適應(yīng)噪聲對消15.7.3利用延遲來建立參考信號的自適應(yīng)噪聲對消目錄15.1概述215.1概述語音增強(qiáng)是解決噪聲污染的一種有效方法,它的一個(gè)主要目標(biāo)是從帶噪語音信號中提取盡可能純凈的原始語音,即去掉語音信號中的噪聲和干擾,改善它的質(zhì)量。語音增強(qiáng)是語音信號處理系統(tǒng)的重要組成部分。各種增強(qiáng)方法各有長處并且適用于不同的應(yīng)用場合。15.1概述語音增強(qiáng)是解決噪聲污染的一種有效方法,它的315.1概述語音增強(qiáng)的目的主要有兩個(gè):一是改進(jìn)語音質(zhì)量,消除背景噪聲,使聽者樂于接受,不感覺疲勞,這是一種主觀度量;二是提高語音可懂度,這是一種客觀度量。這兩個(gè)目的往往不能兼得。15.1概述語音增強(qiáng)的目的主要有兩個(gè):4語音增強(qiáng)方法語音增強(qiáng)方法有多種,大致分為三類:①基于語音產(chǎn)生模型如:線性濾波法、梳狀濾波法、自相關(guān)法②基于語音模型和噪聲模型如:維納濾波法、卡爾曼濾波法③基于噪聲特性(短時(shí)譜估計(jì))
如:頻譜減法、自適應(yīng)噪聲抵消法語音增強(qiáng)方法語音增強(qiáng)方法有多種,大致分為三類:515.2語音特性、人耳感知特性及噪聲特性
------語音特性
語音是一時(shí)變的、非平穩(wěn)的隨機(jī)過程,但由于一段時(shí)間內(nèi)(10~30ms)人的聲帶和聲道形狀的相對穩(wěn)定性,可認(rèn)為其特征是不變的,因而語音的短時(shí)譜具有相對穩(wěn)定性。在語音增強(qiáng)中,可以利用濁音的周期性特征,采用梳狀濾波器提取語音分量或者抑制非語音信號,而清音則難以與寬帶噪聲區(qū)分。語音信號可以用統(tǒng)計(jì)分析特性來描述。語音的短時(shí)譜幅度的統(tǒng)計(jì)特性是時(shí)變的,只有當(dāng)分析幀長趨于無窮大時(shí),才能近似認(rèn)為其具有高斯分布。高斯分布模型是根據(jù)中心極限定理得到的,將高斯模型應(yīng)用于有限幀長只是一種近似的描述。在寬帶噪聲污染的語音增強(qiáng)中,可將這種假設(shè)作為分析的前提。15.2語音特性、人耳感知特性及噪聲特性
------語音特615.2語音特性、人耳感知特性及噪聲特性
------人耳感知特性語音感知問題涉及到生理學(xué)、心理學(xué)、聲學(xué)和語音學(xué)諸多領(lǐng)域,人耳對背景噪聲有很大的抑制作用,其中很多問題有待進(jìn)一步研究。目前已有一些結(jié)論可用于語音增強(qiáng):①人耳對語音的感知主要是通過其幅度譜獲得的,而對相位譜則不敏感。②人耳對頻率高低的感受近似與該頻率的對數(shù)值成正比。③人耳有掩蔽效應(yīng),即強(qiáng)信號對弱信號有抑制作用,能夠?qū)⑵溲谏w。利用人耳的生理特點(diǎn),提高語音信號的信噪比,使有用的語音信號大于噪聲一定級別,就可以在語音與噪聲共存的情況下感覺不到噪聲的存在。④共振峰對語音的感知十分重要,特別是第二共振峰比第一共振峰更為重要,因此對語音信號進(jìn)行一定程度的高通濾波不會(huì)對可懂度產(chǎn)生影響。⑤人耳在兩個(gè)人以上的說話環(huán)境中能夠分辨出他所需要的聲音。15.2語音特性、人耳感知特性及噪聲特性
------人耳感715.2語音特性、人耳感知特性及噪聲特性
------噪聲特性周期性噪聲的特點(diǎn)是有許多離散的窄譜峰,來源于發(fā)動(dòng)機(jī)等周期性運(yùn)轉(zhuǎn)的機(jī)械??梢匀菀椎赝ㄟ^檢查功率譜發(fā)現(xiàn)并通過濾波或變換技術(shù)將其去掉。沖激噪聲表現(xiàn)為時(shí)域波形中突然出現(xiàn)的窄脈沖是放電的結(jié)果。根據(jù)帶噪語音信號幅度的平均值確定閾值。當(dāng)信號幅度超出這一閾值時(shí),判別為沖激噪聲,再對其進(jìn)行衰減甚至完全消除。如果干擾脈沖之間不太靠近,還可以根據(jù)信號相鄰樣本數(shù)值簡單地通過內(nèi)插法將其從時(shí)間函數(shù)中去掉。寬帶噪聲通??梢约俣楦咚乖肼暫桶自肼?。來源:風(fēng)、呼吸噪聲和一般隨機(jī)噪聲源。量化噪聲通常作為白噪聲來處理,也可以視為寬帶噪聲。消除的最成功的方法利用了某些非線性處理。目前的一些方法雖然降低了背景噪聲,提高了信噪比,但并不提高語音的可懂度。15.2語音特性、人耳感知特性及噪聲特性
------噪聲特815.2語音特性、人耳感知特性及噪聲特性
------濾波器法有三種常用的濾波器:固定濾波器自適應(yīng)濾波器傅里葉變換濾波器。15.2語音特性、人耳感知特性及噪聲特性
------濾波器915.2語音特性、人耳感知特性及噪聲特性
------固定濾波器固定濾波器用于濾除平穩(wěn)干擾成分。最常見的是50或60Hz交流聲。濾除60Hz成分很少采用高通濾波器,因?yàn)楦蓴_是由60Hz的奇次諧波引起的,特別是3~7次諧波(交流哼聲就是60Hz交流聲,它具有豐富的諧波,這種諧波一般是由于話筒輸入插孔沒有接地而造成的)。15.2語音特性、人耳感知特性及噪聲特性
------固定濾1015.2語音特性、人耳感知特性及噪聲特性
------固定濾波器(a)中,它由一個(gè)延時(shí)器和一個(gè)加法器構(gòu)成。延遲時(shí)間為T,它等于濾波器凹口間的間隔f0的倒數(shù)。(b)反饋使極點(diǎn)離開原點(diǎn),并接近零點(diǎn)。當(dāng)極點(diǎn)靠近零點(diǎn)時(shí),除各零點(diǎn)附近以外,在單位圓各處都會(huì)引起部分對消。因此梳齒可以變得很窄,而梳齒之間的響應(yīng)又是平坦的。15.2語音特性、人耳感知特性及噪聲特性
------固定濾1115.2語音特性、人耳感知特性及噪聲特性
------自適應(yīng)濾波自適應(yīng)濾波能夠自動(dòng)辨認(rèn)應(yīng)該濾除的成分。由線性預(yù)測器構(gòu)成一個(gè)濾波器,其頻率響應(yīng)近似等于輸入信號的逆功率譜,這就可以實(shí)現(xiàn)自適應(yīng)。如果噪聲是平穩(wěn)或是緩變的,則在無語音期間便可以對噪聲進(jìn)行估計(jì),并根據(jù)估計(jì)的結(jié)果調(diào)整波濾器。采用這種方法的主要問題是,所得到的濾波器一般不是譜平衡的,這種不平衡使恢復(fù)的語音著色,并可能干擾線性預(yù)測聲碼器的工作。如果通過上述的部分使極點(diǎn)-零點(diǎn)對消而使凹口變窄,不會(huì)明顯地改善系統(tǒng)的性能。某些實(shí)驗(yàn)表明,如果使LPC預(yù)測器的階數(shù)比通常采用的階數(shù)高得多,則可以去除干擾,改善語音。15.2語音特性、人耳感知特性及噪聲特性
------自適應(yīng)1215.2語音特性、人耳感知特性及噪聲特性
------變換技術(shù)(a)所示。信號要經(jīng)過DFT變換到頻域,在頻域進(jìn)行處理,然后用IDFT來重建語音信號。(b)所示為頻譜整形器,它可以是簡單的一系列選通門。它可將噪聲成分變換到零值,則反變換后的信號周期性干擾將被濾除。15.2語音特性、人耳感知特性及噪聲特性
------變換技1315.4非線性處理去除寬帶噪聲的主要方法分為三類:非線性處理減譜法自適應(yīng)對消15.4非線性處理去除寬帶噪聲的主要方法分為三類:1415.4非線性處理--中心削波可以通過削波進(jìn)行非線性處理。原理是因?yàn)榈头日Z音被同時(shí)消去將使語音質(zhì)量變壞,如果噪聲的幅度比語音低,則消去整個(gè)低幅度成分,就會(huì)消去噪聲。時(shí)域波形經(jīng)過中心削波對可懂度是有害的,因?yàn)榈头日Z音被同時(shí)消去將使語音質(zhì)量變壞,所以中心削波必須在頻域內(nèi)進(jìn)行。這種方法可以用來降低語音中的混響。這里使用一個(gè)濾波器組,并對各濾波器的輸出進(jìn)行中心削波,然后在組合前使輸出再通過一個(gè)相同的濾波器組,濾除由削波產(chǎn)生的畸變成分。15.4非線性處理--中心削波可以通過削波進(jìn)行非線性處理。1515.4非線性處理--同態(tài)濾波法同態(tài)濾波法的關(guān)鍵部分具有非線性處理性質(zhì),它應(yīng)用于語音識別中,著眼于將語音信息(基音、頻譜)中的乘性噪聲或干擾分離,或者將已減少了噪聲、干擾的信息重新合成得到降噪時(shí)域信號再進(jìn)行識別。圖15-3非線性處理中的同態(tài)濾波法框圖15.4非線性處理--同態(tài)濾波法同態(tài)濾波法的關(guān)鍵部分具有非1615.5減譜法由于人耳對語音相位不敏感,所以對語音的可懂度及質(zhì)量起重要作用的是語音的短時(shí)幅度譜,而不是相位。因而,這里只考慮了幅度譜。因?yàn)樵肼暿蔷植科椒€(wěn)的,故可以認(rèn)為發(fā)語音前的噪聲與發(fā)語音期的噪聲功率譜相同,因而可以利用發(fā)語音前(或后)的“寂靜幀”來估計(jì)噪聲。圖中,平方根的處理是用以將功率轉(zhuǎn)換為幅度。只要噪聲假定為白噪聲,則被減去的估計(jì)譜可近似為一常數(shù)。此時(shí),減譜法的功能與中心削波法相同。圖15-4減譜法的原理框圖15.5減譜法由于人耳對語音相位不敏感,所以對語音的可懂度1715.5減譜法–改進(jìn)形式原來的缺點(diǎn):噪聲的幀功率譜隨機(jī)變化范圍很寬,在頻域中的最大、最小值之比往往達(dá)到幾個(gè)數(shù)量級,而最大值與均值之比也達(dá)6~8倍。因此,帶噪信號在減去噪聲譜后,噪聲分量很大的那些頻率點(diǎn)上就會(huì)剩余較大的部分,在頻譜上呈現(xiàn)出隨機(jī)出現(xiàn)的尖峰,使去噪語音在聽覺上形成殘留噪聲。這種噪聲具有一定的節(jié)奏性起伏感,所以稱之為“音樂噪聲”,它影響了語音的自然度甚至可懂度。另一方面,在增強(qiáng)語音的過程中,提高信噪比與提高語音的可懂度是一對矛盾。在濾除噪聲的同時(shí)或多或少地會(huì)損害語音信號。一般說來,噪聲濾除得越多,語音信號被損害的程度就越厲害,可懂度就越多。特別在低噪比情況下,這一矛盾更為突出。減譜的改進(jìn)形式可以較好地消除音樂噪聲,優(yōu)化處理語音質(zhì)量和可懂度這一對矛盾。噪聲的能量往往分布于整個(gè)頻率范圍,而語音能量則較集中于某些頻率或頻段,尤其在元音的共振峰處。15.5減譜法–改進(jìn)形式原來的缺點(diǎn):1815.5減譜法–改進(jìn)形式引入α、β兩個(gè)參數(shù)為算法提供了很大的靈活性。當(dāng)α=2、β=1時(shí)即變?yōu)榛镜臏p譜法。針對語音信號的強(qiáng)弱及噪聲的特點(diǎn),選擇恰當(dāng)?shù)膮?shù),可更好地消除音樂噪聲。實(shí)際的增強(qiáng)實(shí)驗(yàn)表明,適當(dāng)調(diào)節(jié)α、β,可以獲得比原始的減譜法更好的增強(qiáng)效果。15.5減譜法–改進(jìn)形式引入α、β兩個(gè)參數(shù)為算法提供了很大1915.5減譜法–改進(jìn)形式它增加了一步IFFT變換,變換到偽倒譜域中(實(shí)際上這并不是真正的倒譜,故稱其為“偽”倒譜)。在偽倒譜域中語音和噪聲可以更好地進(jìn)行分離。α的數(shù)值根據(jù)經(jīng)驗(yàn)選取。α為3~4時(shí),信噪比可改善6dB左右。將該方法應(yīng)用于LPC編碼前的帶噪語音上,使可懂度得到了改善。這是因?yàn)椴捎脺p譜法改善了頻譜畸變,使預(yù)測器和要求的語音頻譜匹配得更好。圖15-6偽倒譜相減法15.5減譜法–改進(jìn)形式它增加了一步IFFT變換,變換到偽2015.6自相關(guān)相減法基本出發(fā)點(diǎn)是:從含噪語音中減去寬帶噪聲的最佳估計(jì)。利用信號本身相關(guān),而信號與噪聲、噪聲與噪聲之間可看做不相關(guān)的特性,可以將帶噪信號進(jìn)行自相關(guān)處理,使其得到與不帶噪信號同樣的自相關(guān)系數(shù)幀序列。15.6自相關(guān)相減法基本出發(fā)點(diǎn)是:從含噪語音中減去寬帶噪聲2115.6自相關(guān)相減法w(t)為窗函數(shù),由于s(t)、n(t)不相關(guān),所以上式第2、3項(xiàng)的交叉乘積項(xiàng)的積分結(jié)果為0,故可寫為Ryy(τ)=Rss(τ)+Rnn(τ)式中Rss(τ)為信號的自相關(guān)。因假定噪聲為白噪聲,故其自相關(guān)函數(shù)Rnn(τ)為沖激函數(shù)語音的自相關(guān)可以從Ryy(τ)中減去噪聲功率估值的方法來估計(jì)。這種方法很有吸引力,因?yàn)樗灰筮M(jìn)行傅里葉變換。15.6自相關(guān)相減法w(t)為窗函數(shù),由于s(t)、n(t)2215.7自適應(yīng)噪聲對消--自適應(yīng)濾波帶自適應(yīng)濾波器的自適應(yīng)噪聲對消法的語音增強(qiáng)效果最好。這是因?yàn)?這種方法比其他方法多用了一個(gè)參考噪聲作為輔助輸入,從而獲得了比較全面的關(guān)于噪聲的信息。特別是輔助輸入噪聲與語音中的噪聲完全相關(guān)的情況下,自適應(yīng)噪聲對消能完全排除噪聲的隨機(jī)性,徹底抵消語音中的噪聲成分,從而無論在信噪比還是語音可懂度方面都能獲得較大的提高。這種方法的缺點(diǎn)是輔助輸入在某些情況下難以獲得,這就限制了其應(yīng)用范圍。15.7自適應(yīng)噪聲對消--自適應(yīng)濾波帶自適應(yīng)濾波器的自適2315.7自適應(yīng)噪聲對消--自適應(yīng)濾波自適應(yīng)濾波器:在輸入過程的統(tǒng)計(jì)特性未知或變化時(shí),能夠調(diào)整濾波器參數(shù)以滿足某種最佳準(zhǔn)則的要求。它根據(jù)前一時(shí)刻已獲得的濾波器參數(shù)等結(jié)果,自動(dòng)地調(diào)節(jié)當(dāng)前時(shí)刻的濾波器參數(shù)。以適應(yīng)信號或噪聲未知的或隨時(shí)間變化的統(tǒng)計(jì)特性,從而實(shí)現(xiàn)最優(yōu)濾波。15.7自適應(yīng)噪聲對消--自適應(yīng)濾波自適應(yīng)濾波器:在輸入過2415.7自適應(yīng)噪聲對消
--具有參考信號的自適應(yīng)噪聲對消采用兩個(gè)(或多個(gè))話筒的語音采集系統(tǒng),一個(gè)用來采集帶噪語音,另一個(gè)(或多個(gè))用來采集噪聲兩個(gè)話筒必須要有相當(dāng)?shù)母綦x度,但采集到的兩種信號之間不可避免地會(huì)有時(shí)間差即產(chǎn)生延遲,因此實(shí)時(shí)采集到的兩路信號中所包含的噪聲段是不同的。因而采集到的噪聲必須經(jīng)過數(shù)字濾波器,以便得到盡可能接近帶噪語音中的噪聲。通常,需要采用自適應(yīng)濾波器,使相減噪聲與帶噪語音中的噪聲基本一致。圖15-7一種雙話筒采集的自適應(yīng)噪聲對消原理15.7自適應(yīng)噪聲對消
--具有參考信號的自適應(yīng)噪2515.7自適應(yīng)噪聲對消
--利用延遲來建立參考信號的自適應(yīng)噪聲對消
利用濁音相鄰基音周期的波形高度相關(guān),而相應(yīng)的噪聲都不相關(guān)這一事實(shí),可以估計(jì)出x(n)=s(n)+n(n)中的周期性較強(qiáng)或相關(guān)性較強(qiáng)的成分,因此這種方法只能在噪聲類似白噪聲(相關(guān)及周期性較弱)的情況下增強(qiáng)周期性或自相關(guān)較強(qiáng)的語音信號。利用輸出(即誤差)對濾波器作自適應(yīng)調(diào)整,使噪聲輸出最小來求出無噪語音的最佳估計(jì)圖15-9利用延遲來建立參考信號的自適應(yīng)濾波器15.7自適應(yīng)噪聲對消
--利用延遲來建立參考信號26第15章語音增強(qiáng)第15章語音增強(qiáng)27目錄15.1概述15.2語音特性、人耳感知特性及噪聲特性15.2.1語音特性15.2.2人耳感知特性15.2.3噪聲特性15.3濾波器法15.3.1固定濾波器15-.3.2自適應(yīng)濾波15.3.3變換技術(shù)15.4非線性處理15.4.1中心削波15.4.2同態(tài)濾波法15.5減譜法15.5.1減譜法15.5.2減譜法的改進(jìn)形式15.6自相關(guān)相減法15.7自適應(yīng)噪聲對消15.7.1自適應(yīng)濾波15.7.2具有參考信號的自適應(yīng)噪聲對消15.7.3利用延遲來建立參考信號的自適應(yīng)噪聲對消目錄15.1概述2815.1概述語音增強(qiáng)是解決噪聲污染的一種有效方法,它的一個(gè)主要目標(biāo)是從帶噪語音信號中提取盡可能純凈的原始語音,即去掉語音信號中的噪聲和干擾,改善它的質(zhì)量。語音增強(qiáng)是語音信號處理系統(tǒng)的重要組成部分。各種增強(qiáng)方法各有長處并且適用于不同的應(yīng)用場合。15.1概述語音增強(qiáng)是解決噪聲污染的一種有效方法,它的2915.1概述語音增強(qiáng)的目的主要有兩個(gè):一是改進(jìn)語音質(zhì)量,消除背景噪聲,使聽者樂于接受,不感覺疲勞,這是一種主觀度量;二是提高語音可懂度,這是一種客觀度量。這兩個(gè)目的往往不能兼得。15.1概述語音增強(qiáng)的目的主要有兩個(gè):30語音增強(qiáng)方法語音增強(qiáng)方法有多種,大致分為三類:①基于語音產(chǎn)生模型如:線性濾波法、梳狀濾波法、自相關(guān)法②基于語音模型和噪聲模型如:維納濾波法、卡爾曼濾波法③基于噪聲特性(短時(shí)譜估計(jì))
如:頻譜減法、自適應(yīng)噪聲抵消法語音增強(qiáng)方法語音增強(qiáng)方法有多種,大致分為三類:3115.2語音特性、人耳感知特性及噪聲特性
------語音特性
語音是一時(shí)變的、非平穩(wěn)的隨機(jī)過程,但由于一段時(shí)間內(nèi)(10~30ms)人的聲帶和聲道形狀的相對穩(wěn)定性,可認(rèn)為其特征是不變的,因而語音的短時(shí)譜具有相對穩(wěn)定性。在語音增強(qiáng)中,可以利用濁音的周期性特征,采用梳狀濾波器提取語音分量或者抑制非語音信號,而清音則難以與寬帶噪聲區(qū)分。語音信號可以用統(tǒng)計(jì)分析特性來描述。語音的短時(shí)譜幅度的統(tǒng)計(jì)特性是時(shí)變的,只有當(dāng)分析幀長趨于無窮大時(shí),才能近似認(rèn)為其具有高斯分布。高斯分布模型是根據(jù)中心極限定理得到的,將高斯模型應(yīng)用于有限幀長只是一種近似的描述。在寬帶噪聲污染的語音增強(qiáng)中,可將這種假設(shè)作為分析的前提。15.2語音特性、人耳感知特性及噪聲特性
------語音特3215.2語音特性、人耳感知特性及噪聲特性
------人耳感知特性語音感知問題涉及到生理學(xué)、心理學(xué)、聲學(xué)和語音學(xué)諸多領(lǐng)域,人耳對背景噪聲有很大的抑制作用,其中很多問題有待進(jìn)一步研究。目前已有一些結(jié)論可用于語音增強(qiáng):①人耳對語音的感知主要是通過其幅度譜獲得的,而對相位譜則不敏感。②人耳對頻率高低的感受近似與該頻率的對數(shù)值成正比。③人耳有掩蔽效應(yīng),即強(qiáng)信號對弱信號有抑制作用,能夠?qū)⑵溲谏w。利用人耳的生理特點(diǎn),提高語音信號的信噪比,使有用的語音信號大于噪聲一定級別,就可以在語音與噪聲共存的情況下感覺不到噪聲的存在。④共振峰對語音的感知十分重要,特別是第二共振峰比第一共振峰更為重要,因此對語音信號進(jìn)行一定程度的高通濾波不會(huì)對可懂度產(chǎn)生影響。⑤人耳在兩個(gè)人以上的說話環(huán)境中能夠分辨出他所需要的聲音。15.2語音特性、人耳感知特性及噪聲特性
------人耳感3315.2語音特性、人耳感知特性及噪聲特性
------噪聲特性周期性噪聲的特點(diǎn)是有許多離散的窄譜峰,來源于發(fā)動(dòng)機(jī)等周期性運(yùn)轉(zhuǎn)的機(jī)械??梢匀菀椎赝ㄟ^檢查功率譜發(fā)現(xiàn)并通過濾波或變換技術(shù)將其去掉。沖激噪聲表現(xiàn)為時(shí)域波形中突然出現(xiàn)的窄脈沖是放電的結(jié)果。根據(jù)帶噪語音信號幅度的平均值確定閾值。當(dāng)信號幅度超出這一閾值時(shí),判別為沖激噪聲,再對其進(jìn)行衰減甚至完全消除。如果干擾脈沖之間不太靠近,還可以根據(jù)信號相鄰樣本數(shù)值簡單地通過內(nèi)插法將其從時(shí)間函數(shù)中去掉。寬帶噪聲通??梢约俣楦咚乖肼暫桶自肼暋碓?風(fēng)、呼吸噪聲和一般隨機(jī)噪聲源。量化噪聲通常作為白噪聲來處理,也可以視為寬帶噪聲。消除的最成功的方法利用了某些非線性處理。目前的一些方法雖然降低了背景噪聲,提高了信噪比,但并不提高語音的可懂度。15.2語音特性、人耳感知特性及噪聲特性
------噪聲特3415.2語音特性、人耳感知特性及噪聲特性
------濾波器法有三種常用的濾波器:固定濾波器自適應(yīng)濾波器傅里葉變換濾波器。15.2語音特性、人耳感知特性及噪聲特性
------濾波器3515.2語音特性、人耳感知特性及噪聲特性
------固定濾波器固定濾波器用于濾除平穩(wěn)干擾成分。最常見的是50或60Hz交流聲。濾除60Hz成分很少采用高通濾波器,因?yàn)楦蓴_是由60Hz的奇次諧波引起的,特別是3~7次諧波(交流哼聲就是60Hz交流聲,它具有豐富的諧波,這種諧波一般是由于話筒輸入插孔沒有接地而造成的)。15.2語音特性、人耳感知特性及噪聲特性
------固定濾3615.2語音特性、人耳感知特性及噪聲特性
------固定濾波器(a)中,它由一個(gè)延時(shí)器和一個(gè)加法器構(gòu)成。延遲時(shí)間為T,它等于濾波器凹口間的間隔f0的倒數(shù)。(b)反饋使極點(diǎn)離開原點(diǎn),并接近零點(diǎn)。當(dāng)極點(diǎn)靠近零點(diǎn)時(shí),除各零點(diǎn)附近以外,在單位圓各處都會(huì)引起部分對消。因此梳齒可以變得很窄,而梳齒之間的響應(yīng)又是平坦的。15.2語音特性、人耳感知特性及噪聲特性
------固定濾3715.2語音特性、人耳感知特性及噪聲特性
------自適應(yīng)濾波自適應(yīng)濾波能夠自動(dòng)辨認(rèn)應(yīng)該濾除的成分。由線性預(yù)測器構(gòu)成一個(gè)濾波器,其頻率響應(yīng)近似等于輸入信號的逆功率譜,這就可以實(shí)現(xiàn)自適應(yīng)。如果噪聲是平穩(wěn)或是緩變的,則在無語音期間便可以對噪聲進(jìn)行估計(jì),并根據(jù)估計(jì)的結(jié)果調(diào)整波濾器。采用這種方法的主要問題是,所得到的濾波器一般不是譜平衡的,這種不平衡使恢復(fù)的語音著色,并可能干擾線性預(yù)測聲碼器的工作。如果通過上述的部分使極點(diǎn)-零點(diǎn)對消而使凹口變窄,不會(huì)明顯地改善系統(tǒng)的性能。某些實(shí)驗(yàn)表明,如果使LPC預(yù)測器的階數(shù)比通常采用的階數(shù)高得多,則可以去除干擾,改善語音。15.2語音特性、人耳感知特性及噪聲特性
------自適應(yīng)3815.2語音特性、人耳感知特性及噪聲特性
------變換技術(shù)(a)所示。信號要經(jīng)過DFT變換到頻域,在頻域進(jìn)行處理,然后用IDFT來重建語音信號。(b)所示為頻譜整形器,它可以是簡單的一系列選通門。它可將噪聲成分變換到零值,則反變換后的信號周期性干擾將被濾除。15.2語音特性、人耳感知特性及噪聲特性
------變換技3915.4非線性處理去除寬帶噪聲的主要方法分為三類:非線性處理減譜法自適應(yīng)對消15.4非線性處理去除寬帶噪聲的主要方法分為三類:4015.4非線性處理--中心削波可以通過削波進(jìn)行非線性處理。原理是因?yàn)榈头日Z音被同時(shí)消去將使語音質(zhì)量變壞,如果噪聲的幅度比語音低,則消去整個(gè)低幅度成分,就會(huì)消去噪聲。時(shí)域波形經(jīng)過中心削波對可懂度是有害的,因?yàn)榈头日Z音被同時(shí)消去將使語音質(zhì)量變壞,所以中心削波必須在頻域內(nèi)進(jìn)行。這種方法可以用來降低語音中的混響。這里使用一個(gè)濾波器組,并對各濾波器的輸出進(jìn)行中心削波,然后在組合前使輸出再通過一個(gè)相同的濾波器組,濾除由削波產(chǎn)生的畸變成分。15.4非線性處理--中心削波可以通過削波進(jìn)行非線性處理。4115.4非線性處理--同態(tài)濾波法同態(tài)濾波法的關(guān)鍵部分具有非線性處理性質(zhì),它應(yīng)用于語音識別中,著眼于將語音信息(基音、頻譜)中的乘性噪聲或干擾分離,或者將已減少了噪聲、干擾的信息重新合成得到降噪時(shí)域信號再進(jìn)行識別。圖15-3非線性處理中的同態(tài)濾波法框圖15.4非線性處理--同態(tài)濾波法同態(tài)濾波法的關(guān)鍵部分具有非4215.5減譜法由于人耳對語音相位不敏感,所以對語音的可懂度及質(zhì)量起重要作用的是語音的短時(shí)幅度譜,而不是相位。因而,這里只考慮了幅度譜。因?yàn)樵肼暿蔷植科椒€(wěn)的,故可以認(rèn)為發(fā)語音前的噪聲與發(fā)語音期的噪聲功率譜相同,因而可以利用發(fā)語音前(或后)的“寂靜幀”來估計(jì)噪聲。圖中,平方根的處理是用以將功率轉(zhuǎn)換為幅度。只要噪聲假定為白噪聲,則被減去的估計(jì)譜可近似為一常數(shù)。此時(shí),減譜法的功能與中心削波法相同。圖15-4減譜法的原理框圖15.5減譜法由于人耳對語音相位不敏感,所以對語音的可懂度4315.5減譜法–改進(jìn)形式原來的缺點(diǎn):噪聲的幀功率譜隨機(jī)變化范圍很寬,在頻域中的最大、最小值之比往往達(dá)到幾個(gè)數(shù)量級,而最大值與均值之比也達(dá)6~8倍。因此,帶噪信號在減去噪聲譜后,噪聲分量很大的那些頻率點(diǎn)上就會(huì)剩余較大的部分,在頻譜上呈現(xiàn)出隨機(jī)出現(xiàn)的尖峰,使去噪語音在聽覺上形成殘留噪聲。這種噪聲具有一定的節(jié)奏性起伏感,所以稱之為“音樂噪聲”,它影響了語音的自然度甚至可懂度。另一方面,在增強(qiáng)語音的過程中,提高信噪比與提高語音的可懂度是一對矛盾。在濾除噪聲的同時(shí)或多或少地會(huì)損害語音信號。一般說來,噪聲濾除得越多,語音信號被損害的程度就越厲害,可懂度就越多。特別在低噪比情況下,這一矛盾更為突出。減譜的改進(jìn)形式可以較好地消除音樂噪聲,優(yōu)化處理語音質(zhì)量和可懂度這一對矛盾。噪聲的能量往往分布于整個(gè)頻率范圍,而語音能量則較集中于某些頻率或頻段,尤其在元音的共振峰處。15.5減譜法–改進(jìn)形式原來的缺點(diǎn):4415.5減譜法–改進(jìn)形式引入α、β兩個(gè)參數(shù)為算法提供了很大的靈活性。當(dāng)α=2、β=1時(shí)即變?yōu)榛镜臏p譜法。針對語音信號的強(qiáng)弱及噪聲的特點(diǎn),選擇恰當(dāng)?shù)膮?shù),可更好地消除音樂噪聲。實(shí)際的增強(qiáng)實(shí)驗(yàn)表明,適當(dāng)調(diào)節(jié)α、β,可以獲得比原始的減譜法更好的增強(qiáng)效果。15.5減譜法–改進(jìn)形式引入α、β兩個(gè)參數(shù)為算法提供了很大4515.5減譜法–改進(jìn)形式它增加了一步IFFT變換,變換到偽倒譜域中(實(shí)際上這并不是真正的倒譜,故稱其為“偽”倒譜)。在偽倒譜域中語音和噪聲可以更好地進(jìn)行分離。α的數(shù)值根據(jù)經(jīng)驗(yàn)選取。α為3~4時(shí),信噪比可改善6dB左右。將該方法應(yīng)用于LPC編碼前的帶噪語音上,使可懂度得到了改善。這是因?yàn)椴捎脺p譜法改善了頻譜畸變,使預(yù)測器和要求的語音頻譜匹配得更好。圖15-6偽倒譜相減法15.5減譜法–改進(jìn)形式它增加了一步IFFT變換,變換到偽4615.6自相關(guān)相減法基本出發(fā)點(diǎn)是:從含噪語音中減去寬帶噪聲的最佳估計(jì)。利用信號本身相關(guān),而信號與噪聲、噪聲與噪聲之間可看做不相關(guān)的特性,可以將帶噪信號進(jìn)行自相關(guān)處理,使其得到與不帶噪信號同樣的自相關(guān)系數(shù)幀序列。15.6自相關(guān)相減法基本出發(fā)點(diǎn)是:從含噪語音中減去寬帶噪聲4715.6自相關(guān)相減法w(t)為窗函數(shù),由于s(t)、n(t)不相關(guān),所以上
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026浙江衢州職業(yè)技術(shù)學(xué)院高層次緊缺人才招聘32人筆試備考試題及答案解析
- 2026河南周口市川匯區(qū)政府專職消防員招聘18人筆試參考題庫及答案解析
- 2026一季度重慶市屬事業(yè)單位公開招聘242人筆試參考題庫及答案解析
- 2026湖南懷化市溆浦縣社會(huì)保險(xiǎn)服務(wù)中心公益性崗位招聘考試備考試題及答案解析
- 2026新疆和瑞集團(tuán)博樂大巴扎項(xiàng)目招聘1人筆試備考題庫及答案解析
- 2026中國醫(yī)學(xué)科學(xué)院藥物研究所招聘23人筆試模擬試題及答案解析
- 2026年廣豐區(qū)殯葬事業(yè)服務(wù)中心勞務(wù)派遣招聘筆試模擬試題及答案解析
- 2026年數(shù)據(jù)挖掘?qū)崙?zhàn)案例培訓(xùn)
- 2026重慶市屬事業(yè)單位第一季度考核招聘高層次和緊缺人才310人筆試備考試題及答案解析
- 2026年工程地質(zhì)鉆探技術(shù)的質(zhì)量控制方法
- 項(xiàng)目二 模塊四 波音737-800飛機(jī)乘務(wù)員控制面板及娛樂系統(tǒng)的操作方法課件講解
- 2022年新疆維吾爾自治區(qū)新疆生產(chǎn)建設(shè)兵團(tuán)中考數(shù)學(xué)試題(無答案)
- 游戲你來比劃我來猜的PPT
- 福建省福州市2023-2024學(xué)年高一上學(xué)期期末考試物理試卷2
- 鋼結(jié)構(gòu)生產(chǎn)工藝流程
- 譯林版英語六年級上冊第八單元ChineseNewYear課件
- 2022-2023學(xué)年四川省宜賓市高一(下)期末數(shù)學(xué)試卷(含解析)
- 教你填《廣東省普通高中學(xué)生檔案》精編版
- 大學(xué)生兼職家教個(gè)人簡歷
- 轉(zhuǎn)動(dòng)極板技術(shù)簡介
- 《人類行為與社會(huì)環(huán)境》課件
評論
0/150
提交評論