版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第4章語(yǔ)音信號(hào)的時(shí)域分析4.2語(yǔ)音信號(hào)的數(shù)字化與預(yù)處理4.1概述4.4短時(shí)平均過(guò)零率和上升過(guò)零間隔4.3短時(shí)平均能量和短時(shí)平均幅度4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)4.6短時(shí)時(shí)域處理技術(shù)的應(yīng)用4.7中值濾波在語(yǔ)音短時(shí)時(shí)域處理中的應(yīng)用第4章語(yǔ)音信號(hào)的時(shí)域分析4.1
概述語(yǔ)音信號(hào)攜帶各種信息:男聲、女聲,喜、怒,中、英等。不同場(chǎng)合感興趣的信息不同;◆判斷信號(hào)是否為語(yǔ)音,只需人類語(yǔ)音信號(hào)的一般特征;◆區(qū)分語(yǔ)音為清、濁音,需語(yǔ)音能量譜和基頻;◆數(shù)字傳輸或數(shù)字存儲(chǔ)時(shí),目的不同,保留信息精度不同;語(yǔ)音信號(hào)處理的任務(wù):◆去除與應(yīng)用目的不相干或影響不大的語(yǔ)音信息◆需要的信息不僅應(yīng)當(dāng)提取出來(lái),有時(shí)還需要加強(qiáng)。以上涉及語(yǔ)音信號(hào)中,各種信息的表示問(wèn)題。表示方法的原則:最方便、最有效。短時(shí)分析技術(shù)貫穿于語(yǔ)音分析的全過(guò)程。第4章語(yǔ)音信號(hào)的時(shí)域分析
4.1概述同濟(jì)大學(xué)電子與信息工程學(xué)院-2-趙曉群
教授整體的語(yǔ)音信號(hào)來(lái)講,分析出的是由每一幀特征參數(shù)組成的特征參數(shù)時(shí)間序列。語(yǔ)音信號(hào)分析:時(shí)域分析、頻域分析、倒頻域分析等;語(yǔ)音信號(hào)分析:模型分析、非模型分析;模型分析法是指依據(jù)語(yǔ)音信號(hào)產(chǎn)生的數(shù)學(xué)模型,來(lái)分析和提取表征這些模型的特征參數(shù),◆模型分析:共振峰分析、無(wú)損級(jí)聯(lián)聲管分析法◆非模型分析:不進(jìn)行模型化的分析語(yǔ)音的預(yù)處理:語(yǔ)音信號(hào)的數(shù)字化、語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)、預(yù)加重、加窗、分幀等,本章重點(diǎn):語(yǔ)音信號(hào)的各種時(shí)域分析技術(shù),是語(yǔ)音處理技術(shù)的基礎(chǔ)知識(shí)。第4章語(yǔ)音信號(hào)的時(shí)域分析
4.1概述同濟(jì)大學(xué)電子與信息工程學(xué)院-3-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析4.2語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理
信號(hào)數(shù)字化:放大、增益控制、反混疊濾波、取樣、
A/D變換及編碼(PCM編碼);預(yù)處理:預(yù)加重、加窗、分幀、端點(diǎn)檢測(cè)等;圖4.1:語(yǔ)音信號(hào)數(shù)字分析或處理的系統(tǒng)框圖。第4章語(yǔ)音信號(hào)的時(shí)域分析
4.2
語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理
同濟(jì)大學(xué)電子與信息工程學(xué)院-4-趙曉群
教授圖4.1語(yǔ)音信號(hào)數(shù)字處理系統(tǒng)框圖反混疊濾波語(yǔ)音輸入語(yǔ)音輸出A/D轉(zhuǎn)換分析處理平滑濾波D/A轉(zhuǎn)換合成處理傳輸或存儲(chǔ)
4.2.1預(yù)濾波、取樣、A/D變換
預(yù)濾波:帶通濾波器(上、下截止頻率為fH、fL)◆防混疊濾波,抑制>fs/2的輸入信號(hào)分量(fs為取樣頻率)
◆抑制工頻干擾(50Hz電源)。多數(shù)語(yǔ)音編/譯碼器:
fH
=3.4kHz,
fL
=60~100Hz,fs=8kHz。語(yǔ)音識(shí)別:◆對(duì)電話用戶指標(biāo)與語(yǔ)音編/譯碼器時(shí)相同;◆要求較高或很高:
fH=4.5or8kHz,fL=60Hz,fs
=10or20kHz。A/D變換需對(duì)信號(hào)量化,編碼為二進(jìn)制,產(chǎn)生量化誤差。量化誤差(量化噪聲):量化信號(hào)值與原信號(hào)值之差;信號(hào)波形的變化足夠大或量化間隔足夠小時(shí),量化噪聲符合具有下列特征的統(tǒng)計(jì)模型:①量化噪聲是平穩(wěn)的白噪聲過(guò)程;②量化噪聲與輸入信號(hào)不相關(guān);③量化噪聲在量化間隔內(nèi)均勻分布,即具有等概率密度分布。同濟(jì)大學(xué)電子與信息工程學(xué)院-5-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析
4.2
語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理
量化信噪比SNR(信號(hào)與量化噪聲的功率比)為:式中,——輸入語(yǔ)音信號(hào)序列的方差,
——噪聲序列的方差,
——信號(hào)的峰-峰值,B——量化字長(zhǎng),設(shè)語(yǔ)音信號(hào)的幅度服從Laplace分布,則取,上式改寫為:B=7bit,SNR=35dB,能滿足一般通信系統(tǒng)的要求。語(yǔ)音波形的動(dòng)態(tài)范圍達(dá)55dB,故B應(yīng)取10bit以上。為保持35
dB的信噪比,常用12bit量化,附加的5bit用于補(bǔ)償30
dB左右的輸入動(dòng)態(tài)的變化。
同濟(jì)大學(xué)電子與信息工程學(xué)院-6-趙曉群
教授表明量化器中每bit字長(zhǎng)對(duì)SNR的貢獻(xiàn)約為6dB
第4章語(yǔ)音信號(hào)的時(shí)域分析
4.2
語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理
A/D變換器:分為線性和非線性兩類。目前采用絕大部分的線性A/D變換器是12bit。非線性A/D變換器一般是8
bit,它與12
bit線性變換器等效。有時(shí)需要將非線性的8
bit碼轉(zhuǎn)換為線性的12
bit碼。數(shù)字化的反過(guò)程是從數(shù)字化語(yǔ)音中重構(gòu)語(yǔ)音波形。必須在D/A后加平滑濾波器,對(duì)重構(gòu)的語(yǔ)音波形的高次諧波起平滑作用,以去除高次諧波失真。預(yù)濾波、取樣、A/D和D/A變換、平滑濾波等許多功能可以用一塊芯片完成,在市場(chǎng)上有多種這樣的集成芯片供選用。同濟(jì)大學(xué)電子與信息工程學(xué)院-7-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析
4.2
語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理
4.2.2預(yù)處理
預(yù)處理:預(yù)加重、加窗、分幀、端點(diǎn)檢測(cè)等;語(yǔ)音的一個(gè)特征:約8
kHz高頻端按-6dB/倍頻程跌落。預(yù)加重:提升語(yǔ)音的高頻部分,使信號(hào)的頻譜變得平坦,◆可在反混疊濾波前,可壓縮動(dòng)態(tài)范圍,提高信噪比。◆也可在數(shù)字化后、參數(shù)分析之前。預(yù)加重用6dB/倍頻程的提升高頻特性的預(yù)加重?cái)?shù)字濾波器:式中,μ為常系數(shù),值接近于1,通常取μ=0.92~0.94。恢復(fù)原信號(hào),對(duì)測(cè)量值進(jìn)行去加重處理,即加上-6dB/倍頻程的下降的頻率特性來(lái)還原成原來(lái)的特性。
同濟(jì)大學(xué)電子與信息工程學(xué)院-8-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析
4.2
語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理
4.2.3窗函數(shù)的作用
采用連續(xù)分段或交疊分段的方法分幀,33~100幀/秒。圖4.2:幀移與幀長(zhǎng)示例。幀與幀之間的信號(hào)平滑過(guò)渡,保持其連續(xù)性。幀移:前后幀的交疊部分。幀移與幀長(zhǎng)的比值一般為0~1/2。移動(dòng)窗函數(shù)加權(quán)實(shí)現(xiàn):
x(n)為語(yǔ)音信號(hào),w(n)為窗函數(shù),sw(n)為窗選語(yǔ)音信號(hào)。同濟(jì)大學(xué)電子與信息工程學(xué)院-9-趙曉群
教授圖4.2幀移與幀長(zhǎng)的示例(N為幀長(zhǎng),M為幀移)理想窗函數(shù)的頻率響應(yīng)有一個(gè)很窄的主瓣,它增加了頻率的分辨度,而沒(méi)有旁瓣。第4章語(yǔ)音信號(hào)的時(shí)域分析
4.2
語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理
討論窗函數(shù)的形狀和長(zhǎng)度的影響。
1.窗函數(shù)的形狀好的窗函數(shù)的標(biāo)準(zhǔn):◆時(shí)域:減小時(shí)間窗兩端的坡度,使窗口兩端邊緣平滑過(guò)渡到到零,減小語(yǔ)音幀的截?cái)嘈?yīng);◆頻域:較寬的3dB帶寬和較小的邊帶最大值。常用的窗函數(shù)(窗長(zhǎng)為N):(1)矩形(rectangular)窗:
(2)Hamming(漢明)窗:(3)Hanning(漢寧)窗:同濟(jì)大學(xué)電子與信息工程學(xué)院-10-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析
4.2
語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理
(4)Bartlett(巴特雷特)窗:
(5)Blackman(布累克曼)窗:(6)Kaiser(凱散)窗:式中,——零階貝塞爾函數(shù),
同濟(jì)大學(xué)電子與信息工程學(xué)院-11-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析
4.2
語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理
圖4.3、4.4:窗函數(shù)的波形◆矩形窗主瓣最窄,頻率分辨度
最高,頻率泄漏最大;◆
Blackman窗頻率分辨度最低,頻率泄漏最小?!舫S镁匦未啊amming窗。同濟(jì)大學(xué)電子與信息工程學(xué)院-12-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析
4.2
語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理
圖4.3各種窗函數(shù)的時(shí)間波形圖4.4各種窗的頻率響應(yīng)Bartlett窗
矩形窗Hamming窗
Blackman窗
Hanning窗
Kaiser窗
2.窗口的長(zhǎng)度取樣周期Ts=fs、窗口長(zhǎng)度N、頻率分辨率Δf的關(guān)系為:◆Ts一定時(shí),Δf
隨窗口N增加而減小,即Δf
提高,時(shí)間分辨率降低?!羧绻翱谌《?,頻率分辨率下降,時(shí)間分辨率提高。取樣周期和頻率分辨率矛盾,應(yīng)根據(jù)需要選擇合適的窗長(zhǎng)。時(shí)域分析:◆
N很大,語(yǔ)音高頻受阻,短時(shí)能量變化很小,不能反映幅度變化;◆N太小,濾波器通帶寬,短時(shí)能量急劇變化,不能平滑能量函數(shù)。通常一幀內(nèi)應(yīng)含有1~7個(gè)基音周期?!艋糁芷谧兓?,從女性和兒童的2ms到老年男子的14ms◆10kHz取樣時(shí),N折衷選擇為100~200點(diǎn)(10~20ms)。分析條件:(通常需標(biāo)明,以提供性能評(píng)價(jià)參考依據(jù))取樣頻率、精度、預(yù)加重方式、窗函數(shù)、幀長(zhǎng)、幀移等。
同濟(jì)大學(xué)電子與信息工程學(xué)院-13-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析
4.2
語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理
第4章語(yǔ)音信號(hào)的時(shí)域分析4.3
短時(shí)能量和短時(shí)平均幅度
4.3.1短時(shí)能量語(yǔ)音的清音能量較小,濁音能量較大。語(yǔ)音的能量分析主要短時(shí)能量和短時(shí)平均幅度。n時(shí)刻語(yǔ)音信號(hào)的短時(shí)能量En為:或式中,h(n)=w2(n),可以看做濾波器的沖激響應(yīng)函數(shù)。
En反映語(yǔ)音振幅或能量隨時(shí)間緩慢變化的規(guī)律。窗函數(shù)或?yàn)V波器的函數(shù)形式和寬度對(duì)能量序列影響很大。選擇合適的窗函數(shù)或?yàn)V波器的沖激響應(yīng)函數(shù)和它們的寬度。用得較多的是矩形窗和Hamming窗。第4章語(yǔ)音信號(hào)的時(shí)域分析
4.3
短時(shí)能量和短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院-14-趙曉群
教授窗寬的影響:窗函數(shù)很寬或沖激響應(yīng)很長(zhǎng),平滑作用顯著,使En變化不大,反映不出語(yǔ)音能量的時(shí)變特性。窗函數(shù)過(guò)窄,平滑作用有限,仍然保留瞬時(shí)快變化,使En反映語(yǔ)音振幅細(xì)節(jié),表現(xiàn)不出振幅平方包絡(luò)的變化規(guī)律。當(dāng)N小于語(yǔ)音基音周期時(shí),將按照基音周期內(nèi)語(yǔ)音振幅平方波形的細(xì)節(jié)瞬時(shí)變化;當(dāng)N比基音周期的若干倍還要大時(shí),各段語(yǔ)音的短時(shí)能量差別不大,不能跟隨語(yǔ)音能量的時(shí)變特性。這兩種情況都不能準(zhǔn)確描述語(yǔ)音能量自身的實(shí)際變化規(guī)律。必須選擇合適的窗寬,兼顧男聲和女聲,10
kHz取樣時(shí),選窗寬10~20
ms。第4章語(yǔ)音信號(hào)的時(shí)域分析
4.3
短時(shí)能量和短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院-15-趙曉群
教授圖4.5:語(yǔ)音的短時(shí)能量序列的包絡(luò)曲線。第4章語(yǔ)音信號(hào)的時(shí)域分析
4.3
短時(shí)能量和短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院-16-趙曉群
教授(a)加矩形窗時(shí)(b)加Hamming窗時(shí)圖4.5語(yǔ)音“同舟共濟(jì)”的短時(shí)能量函數(shù)(10kHz取樣)◆矩形窗比Hamming窗的平滑效果顯著;◆隨著窗寬的增加,平滑效果越顯著;◆從的包絡(luò)曲線可以清楚看出清音和濁音之間的區(qū)別和分界點(diǎn),
4.3.2短時(shí)平均幅度En的計(jì)算是平方求和,計(jì)算量大;平方運(yùn)算擴(kuò)大了樣本間差別,選窗寬擇帶來(lái)附加的困難。須選擇較寬的窗,才能較好地平滑平方幅度的起伏。為此,提出語(yǔ)音能量時(shí)變性質(zhì)的另一個(gè)重要參數(shù)。n時(shí)刻語(yǔ)音信號(hào)的短時(shí)平均幅度Mn為:或式中,h(n)=∣w(n)︳通常窗函數(shù)w(n)≥0
,所以h(n)=w(n)。
依據(jù)定義式可導(dǎo)出多種的計(jì)算方法(略)。共三種。第4章語(yǔ)音信號(hào)的時(shí)域分析
4.3
短時(shí)能量和短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院-17-趙曉群
教授圖4.6:語(yǔ)音的平均幅度序列的包絡(luò)曲線。第4章語(yǔ)音信號(hào)的時(shí)域分析
4.3
短時(shí)能量和短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院-18-趙曉群
教授(a)加矩形窗時(shí)(b)加Hamming窗時(shí)圖4.6語(yǔ)音“同舟共濟(jì)”的短時(shí)平均幅度函數(shù)(10kHz取樣)語(yǔ)音的平均幅度與短時(shí)能量具有相似的一些性質(zhì)◆矩形窗比Hamming窗的平滑效果顯著;◆隨著窗寬的增加,平滑效果越顯著;◆從的包絡(luò)曲線可以清楚看出清音和濁音之間的區(qū)別和分界點(diǎn),比較En和Mn(比較圖4.6與4.5):◆短時(shí)平均幅度的差別沒(méi)有它們的短時(shí)能量的差別那么顯著;◆清音的短時(shí)平均幅度比短時(shí)能量有所提高。En和Mn的主要用途:①區(qū)分語(yǔ)音的清音段與濁音段;②區(qū)分聲母與韻母;③無(wú)聲與有聲的分界;④作為一種超音段信息用于語(yǔ)音識(shí)別。
第4章語(yǔ)音信號(hào)的時(shí)域分析
4.3
短時(shí)能量和短時(shí)平均幅度同濟(jì)大學(xué)電子與信息工程學(xué)院-19-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析4.4短時(shí)平均過(guò)零率和上升過(guò)零間隔
4.4.1短時(shí)平均過(guò)零率離散信號(hào)相鄰樣本取不同符號(hào)時(shí),稱為出現(xiàn)了過(guò)零現(xiàn)象。過(guò)零率:?jiǎn)挝粫r(shí)間過(guò)零的次數(shù)。窄帶離散信號(hào)的過(guò)零率較準(zhǔn)確地度量了信號(hào)的頻率特性。寬帶離散信號(hào)的過(guò)零率只能粗略地反映信號(hào)的頻譜特性。語(yǔ)音信號(hào)是寬帶、緩時(shí)變信號(hào),其頻譜特性隨時(shí)間變化。語(yǔ)音信號(hào)的短時(shí)過(guò)零率粗略地表征語(yǔ)音信號(hào)的頻譜特性。語(yǔ)音信號(hào)的過(guò)零率序列能夠描述:語(yǔ)音序列的清音和濁音、無(wú)聲與有聲等特征,在語(yǔ)音分析中有重要應(yīng)用。第4章語(yǔ)音信號(hào)的時(shí)域分析4.4短時(shí)平均過(guò)零率和上升過(guò)零間隔
同濟(jì)大學(xué)電子與信息工程學(xué)院-20-趙曉群
教授n時(shí)刻語(yǔ)音信號(hào)的短時(shí)平均過(guò)零率Zn為:
式中,上式的物理意義:
◆當(dāng)相鄰兩個(gè)樣本符號(hào)相同時(shí),不產(chǎn)生過(guò)零;
◆當(dāng)相鄰兩個(gè)樣本符號(hào)相反時(shí),產(chǎn)生一次過(guò)零。第4章語(yǔ)音信號(hào)的時(shí)域分析4.4短時(shí)平均過(guò)零率和上升過(guò)零間隔
同濟(jì)大學(xué)電子與信息工程學(xué)院-21-趙曉群
教授圖4.7:語(yǔ)音的短時(shí)平均過(guò)零率的包絡(luò)曲線。濁音頻譜主要集中在3kHz以下低頻區(qū)域,超過(guò)4kHz后頻譜幅度迅速下降;而清音頻譜幅度在超過(guò)4
kHz后反而呈上升趨勢(shì),甚至超過(guò)8
kHz后頻譜幅度仍然很大。這表明清音頻譜主要集中在高頻區(qū)域。短時(shí)平均過(guò)零率粗略地描述了語(yǔ)音信號(hào)的頻譜特性,并可用于區(qū)分濁音和清音。例:圖4.7中短時(shí)平均過(guò)零率高的區(qū)段對(duì)應(yīng)清音,過(guò)零率低的區(qū)段對(duì)應(yīng)濁音。但是,僅用過(guò)零率的高低區(qū)分清音和濁音并不很準(zhǔn)確,因?yàn)槟承┣逡艉蜐嵋舻亩虝r(shí)平均過(guò)零率的數(shù)值相差不多。
同濟(jì)大學(xué)電子與信息工程學(xué)院-22-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析4.4短時(shí)平均過(guò)零率和上升過(guò)零間隔
圖4.7語(yǔ)音“同舟共濟(jì)”的短時(shí)平均過(guò)零率曲線(10kHz取樣)(a)原始語(yǔ)音波形(b)平均過(guò)零率圖4.8:清音和濁音每10
ms內(nèi)過(guò)零數(shù)的概率分布曲線?!羟逡簦?0ms過(guò)零數(shù)為49的概率最大,大體上顯正態(tài)分布?!魸嵋簦?0
ms過(guò)零數(shù)為14的概率最大,也大致呈正態(tài)分布?!魸嵋艉颓逡裘?0ms過(guò)零數(shù)為24左右的概率幾乎是相等的,因而憑著這類數(shù)值就很難區(qū)分濁音和清音。規(guī)定一個(gè)噪聲門限:◆樣本超過(guò)門限正值,認(rèn)為是正并賦值,◆樣本低于門限負(fù)值,認(rèn)為是負(fù)并賦值,◆界于門限正負(fù)值間,認(rèn)為是零并賦值。為準(zhǔn)確判定樣本的符號(hào),應(yīng)要求:①信號(hào)中不含直流偏移;②噪聲和電源干擾盡可能??;③選擇合適的正負(fù)門限值。同濟(jì)大學(xué)電子與信息工程學(xué)院-23-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析4.4短時(shí)平均過(guò)零率和上升過(guò)零間隔
圖4.8過(guò)零率概率分布圖清音47濁音01020304050607080每10ms內(nèi)的過(guò)零分布14
4.4.2短時(shí)上升過(guò)零間隔短時(shí)平均過(guò)零率:描述復(fù)雜波形“頻率”特征的一個(gè)參數(shù)。短時(shí)平均上升過(guò)零間隔:描述復(fù)雜波形“周期”特性的參數(shù)。在一定的噪聲背景下,過(guò)零間隔參數(shù)具有很好的頑健性,對(duì)不同的語(yǔ)音具有很好的差異性
上升過(guò)零點(diǎn)時(shí)間RZCT:當(dāng)前信號(hào)波形樣本大于或等于零,而其前一點(diǎn)樣本小于零。上升過(guò)零間隔RZCI:上升過(guò)零間隔次數(shù)序列:將各種語(yǔ)音得到的統(tǒng)計(jì)出各種長(zhǎng)度的間隔出現(xiàn)的次數(shù),由此可以得到上升過(guò)零間隔次數(shù)序列。第4章語(yǔ)音信號(hào)的時(shí)域分析4.4短時(shí)平均過(guò)零率和上升過(guò)零間隔
同濟(jì)大學(xué)電子與信息工程學(xué)院-24-趙曉群
教授第4章語(yǔ)音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)
4.5.1短時(shí)自相關(guān)函數(shù)自相關(guān)函數(shù)用于衡量信號(hào)自身時(shí)間波形的相似性。清音和濁音的發(fā)聲機(jī)理不同,波形上存在較大的差異?!魸嵋舻臅r(shí)間波形呈現(xiàn)準(zhǔn)周期性,波形之間相似性較好;
◆清音的時(shí)間波形呈現(xiàn)隨機(jī)噪聲的特性,樣本間相似性較差??梢杂枚虝r(shí)自相關(guān)函數(shù)來(lái)測(cè)度語(yǔ)音的相似特性。時(shí)間離散的確定信號(hào),自相關(guān)函數(shù)的定義為:隨機(jī)信號(hào)或者周期信號(hào),自相關(guān)函數(shù)的定義為:第4章語(yǔ)音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)
同濟(jì)大學(xué)電子與信息工程學(xué)院-25-趙曉群
教授自相關(guān)函數(shù)具有以下性質(zhì):
(1)周期性:周期信號(hào)的自相關(guān)函數(shù)是周期函數(shù);
(2)對(duì)稱性:R(k)=R(-k);
(3)存在最大值:對(duì)所有k,有R(0)≥︱R(k)︱;
(4)對(duì)確定信號(hào),R(0)=信號(hào)能量;對(duì)隨機(jī)信號(hào)或周期信號(hào),R(0)=平均功率。短時(shí)自相關(guān)函數(shù)為:
根據(jù)自相關(guān)函數(shù)的性質(zhì)(2),得:
令hk(n)=w(n)w(n+k)
,上式改寫為:上式表明,可用數(shù)字濾波器實(shí)現(xiàn)Rn(k)的計(jì)算。第4章語(yǔ)音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)
同濟(jì)大學(xué)電子與信息工程學(xué)院-26-趙曉群
教授實(shí)際往往不采用數(shù)字濾波器來(lái)實(shí)現(xiàn),而采用直接計(jì)算的方法令,并m用代替,且,由上式得:考慮到有限窗寬N,上式改寫為:考查Rn(k)計(jì)算量:
◆乘法:◆加法:
計(jì)算量過(guò)大,需改進(jìn)。改進(jìn)方法:DFT技術(shù),細(xì)節(jié)略。第4章語(yǔ)音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)
同濟(jì)大學(xué)電子與信息工程學(xué)院-27-趙曉群
教授
4.5.2語(yǔ)音信號(hào)的短時(shí)自相關(guān)函數(shù)圖4.9:語(yǔ)音的短時(shí)自相關(guān)函數(shù)曲線,特點(diǎn):◆明顯反映濁音信號(hào)的周期性;例:周期72點(diǎn),9ms或110Hz
◆清音沒(méi)有周期性,其性質(zhì)類似于噪聲;
◆窗函數(shù)有影響。矩形窗時(shí),濁音的自相關(guān)函數(shù)周期性明顯;◆短時(shí)自相關(guān)函數(shù)的幅度是一個(gè)逐漸衰減的曲線。第4章語(yǔ)音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)
同濟(jì)大學(xué)電子與信息工程學(xué)院-28-趙曉群
教授(a)濁音(b)清音圖4.9語(yǔ)音的短時(shí)自相關(guān)函數(shù)(10kHz取樣,窗長(zhǎng)320)窗函數(shù)長(zhǎng)度對(duì)短時(shí)自相關(guān)函數(shù)有重要影響;一般要求,窗長(zhǎng)大于兩倍的基音周期為好。圖4.10:不同矩形窗長(zhǎng)時(shí)的短時(shí)自相關(guān)函數(shù)
◆為反映語(yǔ)音的周期性,長(zhǎng)窗有利;
◆為反映語(yǔ)音的時(shí)變性,短窗有利;◆可采用修正的短時(shí)自相關(guān)函數(shù),折中處理。第4章語(yǔ)音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)
同濟(jì)大學(xué)電子與信息工程學(xué)院-29-趙曉群
教授圖4.10不同矩形窗長(zhǎng)時(shí)的短時(shí)自相關(guān)函數(shù)(10kHz取樣)
4.5.3修正的短時(shí)自相關(guān)函數(shù)修正的短時(shí)自相關(guān)函數(shù)定義為:或式中,
K——最大的延遲,保證計(jì)算任何k時(shí),執(zhí)行N次乘累加運(yùn)算矩形窗時(shí),計(jì)算式可簡(jiǎn)化為:是兩個(gè)不同有限長(zhǎng)度語(yǔ)音段和的互相關(guān)函數(shù)。
不滿足對(duì)稱性;但有周期性,幅度不下降。第4章語(yǔ)音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)
同濟(jì)大學(xué)電子與信息工程學(xué)院-30-趙曉群
教授圖4.11:修正短時(shí)自相關(guān)函數(shù)的曲線
◆基音周期最大值為Tmax,則的兩段分別只需為Tmax和2Tmax
,可正確求取基音周期;
◆N值較大時(shí),隨k增大,峰值有所下降;◆若信號(hào)為周期沖激串時(shí),則所有的峰值同幅度。第4章語(yǔ)音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)
同濟(jì)大學(xué)電子與信息工程學(xué)院-31-趙曉群
教授圖4.11不同矩形窗長(zhǎng)時(shí)的修正短時(shí)自相關(guān)函數(shù)(10kHz取樣)
4.5.4短時(shí)平均幅度差函數(shù)短時(shí)自相關(guān)函數(shù)是語(yǔ)音信號(hào)時(shí)域分析的重要參量。自相關(guān)函數(shù)的運(yùn)算量大。原因:乘法運(yùn)算時(shí)間較長(zhǎng)。避免乘法,引入短時(shí)平均幅度差函數(shù)
短時(shí)平均幅度差函數(shù)定義為:式中,w1(m)和w2(m)是窗函數(shù),當(dāng)窗的寬度選為N時(shí),上式為:
若信號(hào)有周期性,在時(shí)將出現(xiàn)極小值。
Np是周期的性質(zhì)類似于自相關(guān)函數(shù);第4章語(yǔ)音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)
同濟(jì)大學(xué)電子與信息工程學(xué)院-32-趙曉群
教授圖4.12:周期性語(yǔ)音的Rn(k)和Fn(k)
◆特點(diǎn):周期性信號(hào),F(xiàn)n(k)是在周期的整數(shù)倍點(diǎn)上有谷值,而不是峰值。
可以證明Rn(k)和Fn(k)有密切關(guān)系,其關(guān)系為:式中,。◆計(jì)算Fn(k)只需加法、減法和取絕對(duì)值的運(yùn)算;◆與Rn(k)的加法和乘法相比,其運(yùn)算量大大減少;◆用硬件實(shí)現(xiàn)語(yǔ)音信號(hào)分析時(shí)有很大好處。◆
Fn(k)已用于許多實(shí)時(shí)語(yǔ)音處理系統(tǒng)中。
第4章語(yǔ)音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)
同濟(jì)大學(xué)電子與信息工程學(xué)院-33-趙曉群
教授圖4.12周期性語(yǔ)音的Rn(k)和Fn(k)的示例(10kHz取樣,窗長(zhǎng)320)圖4.13:平均幅度差函數(shù)◆平均幅度差函數(shù)在濁音的基音周期上出現(xiàn)極小值,◆在清音時(shí)沒(méi)有明顯的極小值。
第4章語(yǔ)音信號(hào)的時(shí)域分析4.5短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)
同濟(jì)大學(xué)電子與信息工程學(xué)院-34-趙曉群
教授(a)濁音(b)清音圖4.13語(yǔ)音的平均幅度差函數(shù)(10kHz取樣,窗長(zhǎng)320)第4章語(yǔ)音信號(hào)的時(shí)域分析4.6
短時(shí)時(shí)域處理技術(shù)的應(yīng)用
4.6.1語(yǔ)音端點(diǎn)檢測(cè)某些應(yīng)用要求:找出語(yǔ)音端點(diǎn),采集真正語(yǔ)音,以減少數(shù)據(jù)量、運(yùn)算量、處理時(shí)間。語(yǔ)音端點(diǎn)檢測(cè):歸結(jié)為區(qū)別語(yǔ)音和噪聲。若SNR很高,則計(jì)算信號(hào)的短時(shí)能量可區(qū)分語(yǔ)音端點(diǎn)。實(shí)際應(yīng)用中難保證高信噪比,不能僅依靠短時(shí)能量來(lái)判別;某些語(yǔ)音端點(diǎn)判別會(huì)遇到特殊的困難:弱摩擦音、弱爆破音、鼻音時(shí),往往與背景噪聲電平相近??裳a(bǔ)充利用短時(shí)平均過(guò)零率Zn進(jìn)行判斷:因清音和以上所舉的音素的Zn比背景噪聲的Zn要高數(shù)倍。第4章語(yǔ)音信號(hào)的時(shí)域分析4.6短時(shí)時(shí)域處理技術(shù)的應(yīng)用同濟(jì)大學(xué)電子與信息工程學(xué)院-35-趙曉群
教授兩級(jí)判決法:用En作第一次判別,再用Zn作第二次判別。第一級(jí)判別:采用雙門限比較的方法(見(jiàn)圖4.14)。(1)根據(jù)En取較高門限M1(En多在M1之上),進(jìn)行粗判,語(yǔ)音起止點(diǎn)位于M1與En包絡(luò)交點(diǎn)對(duì)應(yīng)的間隔之外(即AB段之外)。(2)根據(jù)背景噪聲的平均能量選取較低門限M2,從A點(diǎn)往左、B點(diǎn)往右搜索,分別找到En包絡(luò)第一次與門限相交的兩點(diǎn)C和D,于是CD段就是根據(jù)En判定的語(yǔ)音段。第4章語(yǔ)音信號(hào)的時(shí)域分析4.6短時(shí)時(shí)域處理技術(shù)的應(yīng)用同濟(jì)大學(xué)電子與信息工程學(xué)院-36-趙曉群
教授圖4.14語(yǔ)音端點(diǎn)的兩級(jí)判決法EnM1M2
CAB
DnZnM3
EFn第二級(jí)判決:從C點(diǎn)往左、從D點(diǎn)往右搜索,找到Zn第一次低于某個(gè)門限M3的兩點(diǎn)E和F,即為語(yǔ)音起止點(diǎn)。M3由背景噪聲的平均過(guò)零率Zr確定,一般取M3
=(3~5)Zr
。M1M2M3需根據(jù)實(shí)際語(yǔ)音數(shù)據(jù)選??;可用短時(shí)平均幅度代替En。
4.6.2基音周期估計(jì)短時(shí)自相關(guān)函數(shù):區(qū)分清音和濁音、估計(jì)基音周期
◆特點(diǎn):用短時(shí)自相關(guān)函數(shù)估計(jì)基音周期時(shí),包含多余信息?!魧?duì)策:壓縮與基頻無(wú)關(guān)的信息,即進(jìn)行適當(dāng)處理?!舴椒ǎ旱屯V波、非線性濾波后,計(jì)算短時(shí)自相關(guān)函數(shù)。低通濾波:帶寬1
kHz。濾波后以2kHz取樣頻率取樣,再以2~20
ms滯后逐幀計(jì)算短時(shí)自相關(guān)函數(shù),幀長(zhǎng)10~20ms?!衾碛桑阂话慊l<500
Hz,女高音升C調(diào)<
1
kHz。非線性濾波:常采用中心削波技術(shù)。◆理由:估計(jì)基頻僅用基頻處自相關(guān)峰,其余較低峰是多余的;
注:無(wú)關(guān)的峰是聲道對(duì)激勵(lì)脈沖產(chǎn)生的響應(yīng)?;糁芷诠烙?jì):可得到基頻隨時(shí)間變化的軌跡
。第4章語(yǔ)音信號(hào)的時(shí)域分析4.6短時(shí)時(shí)域處理技術(shù)的應(yīng)用同濟(jì)大學(xué)電子與信息工程學(xué)院-37-趙曉群
教授中心削波技術(shù):常用中心削波、三電平中心削波兩種。中心削波器特性(見(jiàn)圖4.15
)◆削去聲道諧振產(chǎn)生的阻尼振蕩,留下的序列包含基音信息;◆削波電平的選取對(duì)于估計(jì)結(jié)果和計(jì)算復(fù)雜性有很大影響;◆有人提議把削波電平選為最大信號(hào)幅度的30%。
為進(jìn)一步節(jié)省計(jì)算量,可以采用三電平中心削波器,圖4.16:三電平中心削波器第4章語(yǔ)音信號(hào)的時(shí)域分析4.6短時(shí)時(shí)域處理技術(shù)的應(yīng)用同濟(jì)大學(xué)電子與信息工程學(xué)院-38-趙曉群
教授圖4.15中心削波保留基音信息(a)削波特性;(b)語(yǔ)音信號(hào);(c)削波輸出f(x)-xL
0xL
x削波輸出0語(yǔ)音信號(hào)0nn圖4.16三電平中心削波函數(shù)圖f(x)1-xL
-10xL
x第4章語(yǔ)音信號(hào)的時(shí)域分析4.7中值濾波在語(yǔ)音短時(shí)時(shí)域處理中的應(yīng)用
語(yǔ)音信號(hào)經(jīng)過(guò)短時(shí)時(shí)域處理后得到一個(gè)時(shí)間序列,例:◆能量序列
◆平均幅度序列
◆平均過(guò)零率序列
◆自
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025中國(guó)海洋大學(xué)材料科學(xué)與工程學(xué)院實(shí)驗(yàn)技術(shù)人員招聘1人備考題庫(kù)及答案詳解(奪冠系列)
- 未來(lái)五年復(fù)合鋼企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略分析研究報(bào)告
- 2026年昆明市五華區(qū)龍翔街道社區(qū)衛(wèi)生服務(wù)中心工作人員招聘?jìng)淇碱}庫(kù)(3人)及參考答案詳解1套
- 2026四川宜賓銘星中醫(yī)醫(yī)院人才招募中醫(yī)醫(yī)生、外科醫(yī)生、編碼員備考題庫(kù)及參考答案詳解
- 2026中國(guó)人民人壽保險(xiǎn)股份有限公司錫林郭勒中心支公司招聘5人備考題庫(kù)(內(nèi)蒙古)及答案詳解(新)
- 2025山東濟(jì)南市山東大學(xué)新聞傳播學(xué)院非事業(yè)編制人員招聘1人備考題庫(kù)及1套完整答案詳解
- 2025中國(guó)能建葛洲壩電力公司國(guó)內(nèi)市場(chǎng)機(jī)構(gòu)正副職崗位招聘?jìng)淇碱}庫(kù)及完整答案詳解
- 2026中國(guó)極地研究中心(中國(guó)極地研究所)招聘20人備考題庫(kù)及參考答案詳解一套
- 2025廣東佛山禪城區(qū)南莊鎮(zhèn)吉利中學(xué)招聘數(shù)學(xué)英語(yǔ)地理臨聘教師備考題庫(kù)完整參考答案詳解
- 2025中國(guó)太平洋財(cái)產(chǎn)保險(xiǎn)股份有限公司定西中心支公司招聘?jìng)淇碱}庫(kù)及答案詳解1套
- 2025年財(cái)務(wù)共享服務(wù)模式白皮書方案
- 建筑工程交通導(dǎo)改與組織方案
- 2025版新春晚會(huì)節(jié)目編排與制作合同
- 春天綠化養(yǎng)護(hù)知識(shí)培訓(xùn)
- 數(shù)據(jù)中心消防培訓(xùn)課件
- 四川評(píng)標(biāo)專家培訓(xùn)課件
- 學(xué)情分析與教學(xué)策略的講座
- JJF(蒙) 064-2024 混凝土振動(dòng)臺(tái)校準(zhǔn)規(guī)范
- 地產(chǎn)文案培訓(xùn)課件
- 中考化學(xué) 金屬與鹽溶液反應(yīng)后的成分分析
- 土石方施工交通組織方案范文
評(píng)論
0/150
提交評(píng)論