《語音信號處理》上機(jī)實(shí)驗(yàn)指導(dǎo)書_第1頁
《語音信號處理》上機(jī)實(shí)驗(yàn)指導(dǎo)書_第2頁
《語音信號處理》上機(jī)實(shí)驗(yàn)指導(dǎo)書_第3頁
《語音信號處理》上機(jī)實(shí)驗(yàn)指導(dǎo)書_第4頁
《語音信號處理》上機(jī)實(shí)驗(yàn)指導(dǎo)書_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

北京信息科技大學(xué)《語音信號處理》李紅蓮 編光電信息與通信工程學(xué)院2023年二月5目 錄TOC\o“1-2“\h\z\u\l“_TOC_250013“試驗(yàn)一語音信號的時(shí)域特征與頻域特征 3\l“_TOC_250012“一試驗(yàn)?zāi)康?3\l“_TOC_250011“二、試驗(yàn)內(nèi)容 3\l“_TOC_250010“三試驗(yàn)原理 3\l“_TOC_250009“四、試驗(yàn)方法與試驗(yàn)步驟 3\l“_TOC_250008“五、思考題 4\l“_TOC_250007“六、試驗(yàn)報(bào)告要求 4\l“_TOC_250006“試驗(yàn)二語音信號的根本參數(shù)提取與矢量量化 5\l“_TOC_250005“一試驗(yàn)?zāi)康?5\l“_TOC_250004“二、試驗(yàn)內(nèi)容 5\l“_TOC_250003“三試驗(yàn)原理 5\l“_TOC_250002“四、試驗(yàn)方法與試驗(yàn)步驟 5\l“_TOC_250001“五、思考題 6\l“_TOC_250000“六、試驗(yàn)報(bào)告要求 7試驗(yàn)一:語音信號的時(shí)域特征與頻域特征試驗(yàn)工程:語音信號的時(shí)域特征與頻域特征試驗(yàn)工程性質(zhì):驗(yàn)證性試驗(yàn)打算學(xué)時(shí):4學(xué)時(shí)一、試驗(yàn)?zāi)康氖箤W(xué)生通過本試驗(yàn)觀看語音信號在時(shí)域和頻域的根本特征〔語音波形、基音頻率、過零數(shù)、共振峰中記錄每個(gè)元音的基音周期、過零數(shù)、共振峰等環(huán)節(jié)生疏這些語音的根本特征,為今后深入學(xué)習(xí)語音信號處理奠定根底。二、試驗(yàn)內(nèi)容學(xué)習(xí)音頻編輯軟件CoolEdit的使用方法及語音文件的建立;采集語音數(shù)據(jù);觀看語音波形;記錄每個(gè)元音的基音周期〔其倒數(shù)為基音頻率、過零數(shù)、共振峰;觀看語音頻域特征;分析不同元音的共振峰模式的特點(diǎn)〔頻率、相對振幅。三、試驗(yàn)原理元音與輔音在發(fā)音方法有如下根本區(qū)分:發(fā)元音時(shí)氣流順當(dāng)通過聲腔,聲帶抖動,形成的聲波是周期性的;發(fā)輔音時(shí)氣流臨時(shí)被阻不能通過或只能牽強(qiáng)擠出去。元音具有基音與共振峰構(gòu)造,輔音則不具有這兩者?;粲陕晭д駝宇l率產(chǎn)生,打算語音的音高、音調(diào)。在語音波形中表現(xiàn)為準(zhǔn)周期峰值。共振峰是語音頻譜上的強(qiáng)頻區(qū),表現(xiàn)為頻譜上呈峰狀。共振峰由聲腔外形的變化打算,不同的聲腔外形有不同的固有頻率,產(chǎn)生不同的共振峰模式。每個(gè)元音有特定的共振峰模式。四、試驗(yàn)方法與試驗(yàn)步驟〔一〕音頻編輯軟件CoolEdit①點(diǎn)擊桌面上“cooledit”圖標(biāo),選不同項(xiàng)可激活cooledit②filnew8KHmon8bi②點(diǎn)擊“Record”錄音,將錄音存成“.wav”文件。③點(diǎn)擊菜單中“View”中的“SpectralView”可觀看語譜圖。④點(diǎn)擊菜單中“Analyze”中的“FrequenceAnalysis”可分析頻譜。⑤點(diǎn)擊菜單中“Effects”中的“Amplitude”可轉(zhuǎn)變幅度。其它菜單功能可通過點(diǎn)擊試驗(yàn)生疏?!捕秤^看語音時(shí)域特征E盤或D①iua.wae.wa“u.wa”文件,存在本人的文件夾中。②利用CoolEdit③元音波形中的準(zhǔn)周期構(gòu)造與聲帶振動頻率對應(yīng),其周期稱為“基音周期〔其倒數(shù)為基音頻率,利用CoolEdit后部的各一個(gè)基音周期。④記錄每個(gè)元音的任意一個(gè)基音周期中的過零數(shù)。⑤共振峰是語音頻譜的峰狀區(qū)域,利用CoolEdit每個(gè)元音的前三個(gè)共振峰的數(shù)值?!踩秤^看語音頻域特征對你發(fā)的【aieu】這四個(gè)元音中每一個(gè)元音,分別選取穩(wěn)定段的256個(gè)抽樣,利用Matlab的FFTsubplot出圖形。局部參考程序如下y=wavread(”e.wav”);t=1:length(y)y2=wavread(”e.wav”,[40004512]);y2F=fft(y2);subplot(3,1,1)plot(t,y,”-b”,4000,[0.2:0.005:0.4],”-r”,4512,[0.2:0.005:0.4],”-r”)subplot(3,1,2)plot(y2);gridonsubplot(3,1,3)plot(log(abs(y2F)));gridon五、思考題共振峰與語音波形有什么相關(guān)之處?基音周期與音調(diào)的凹凸有什么對應(yīng)關(guān)系?六、試驗(yàn)報(bào)告要求簡述試驗(yàn)?zāi)康摹⒃囼?yàn)原理和試驗(yàn)任務(wù);逐個(gè)說明本人所發(fā)的【aieu】這四個(gè)元音的基音頻率、穩(wěn)定段的256個(gè)抽樣的過零數(shù)及共振峰。設(shè)計(jì)適當(dāng)?shù)谋砀?,包括發(fā)音人姓名、發(fā)的哪一個(gè)元音,將記錄下來的基音頻率、過零數(shù)、共振峰以表格的形式列出。分析不同元音的共振峰模式的特點(diǎn)〔頻率、相對振幅。對你發(fā)的【aieu】這四個(gè)元音中每一個(gè)元音,分別選取穩(wěn)定段的256個(gè)抽樣,利用Matlab的FFT收獲與體會。試驗(yàn)二:語音信號的根本參數(shù)提取與矢量量化試驗(yàn)工程:語音信號的根本參數(shù)提取與矢量量化試驗(yàn)工程性質(zhì):綜合性試驗(yàn)打算學(xué)時(shí):4學(xué)時(shí)一、試驗(yàn)?zāi)康氖箤W(xué)生通過本試驗(yàn)把握提取并觀看線性推想系數(shù)lp、倒頻譜ce、反射系數(shù)k〕等幾種常用的語音參數(shù);生疏特征矢量、矢量形成、矢量空間、區(qū)域邊界、距離測度、碼本、聚類等概念,加深理解矢量量化〔VQ〕的原理;把握根本的VQ實(shí)現(xiàn)方法,為進(jìn)一步把握語音識別等實(shí)際應(yīng)用技術(shù)奠定根底。二、試驗(yàn)內(nèi)容 利用Matlab對元音提取并觀看線性推想系數(shù)lpc、倒頻譜ce、反射系數(shù)k〕種常用的語音參數(shù)。比照不同元音之間的參數(shù)。比較標(biāo)量量化與矢量量化的異同點(diǎn),生疏特征矢量、矢量形成、矢量空間、區(qū)域邊界、距離測度、碼本、聚類等概念,加深理解矢量量化〔VQ〕的原理。通過編程實(shí)現(xiàn)簡潔的VQ過程,把握根本的VQ實(shí)現(xiàn)方法。三、試驗(yàn)原理線性推想系數(shù)lp、倒頻譜ce、反射系數(shù)〕征矢量,矢量量化的碼本中的碼字就是由特征矢量構(gòu)成的;矢量量化是將假設(shè)干個(gè)標(biāo)量數(shù)據(jù)構(gòu)成一個(gè)矢量,然后在矢量空間中給以整體量化;MP個(gè)參數(shù)構(gòu)成一個(gè)特征矢量;②將語音信號的每一幀提取與碼本中的碼字一樣形式的由P個(gè)參數(shù)構(gòu)成的特征矢量;③將輸入信號的特征矢量與碼本中的每一個(gè)碼字相比較并被量化為‘距離’最小的碼字的矢量值,將該碼字的下標(biāo)〔標(biāo)號〕作為輸出。在本試驗(yàn)中碼本是給定的。矢量量化的原理框圖:碼本Y碼本Yj(j=1,2,...矢量形成XYj min=min-1d(X,Y)j碼本Yj(j=1,2,...Yjmin1矢量量化的原理框圖四、試驗(yàn)方法與試驗(yàn)步驟語音參數(shù)提取參考如下程序,利用Matlab編程對每個(gè)元音提取并觀看線性推想系數(shù)lpc、倒頻譜〔cep、反射系數(shù)〕便于觀看與比照不同元音之間參數(shù)的圖形。xa=wavread(”a.wav”,[501756]);ca=rceps(xa)提取倒頻譜〔cep〕[aa,ea,ka]=aryule(xa,8)提取反射系數(shù)〔k〕aa2=lpc(xa,8)提取線性推想系數(shù)〔lpc〕subplot(4,4,1);plot(xa)subplot(4,4,2);plot(ca)subplot(4,4,3);bar(aa)本試驗(yàn)中給定的矢量量化的碼本本試驗(yàn)中給定的矢量量化的碼本有4〔LPC參數(shù)分析階數(shù)P=8,碼字矢量維數(shù)K=9,給定碼本中的碼字如下:Y=〔a1 0

,a,a1

,a,a3

,a,a,a,a5 6 7

〕=Y(jié)a=(1,-1.77891,1.43475,-0.87491,0.51574,-0.35793,0.25688,0.22895,-0.27550)Y=〔a2 0

,a,a1

,a,a3

,a,a,a,a5 6 7

〕=Y(jié)e=(1,-1.74811,1.44779,-0.42867,-0.72046,0.43426,0.31352,-0.70315,0.50096)Y=〔a3 0

,a,a1

,a,a3

,a,a,a,a5 6 7

〕=Y(jié)i=(1,-1.88931,1.68912,-1.20478,0.72695,-0.81863,1.14223,-0.920350.33845)Y=〔a4 0

,a,a1

,a,a3

,a,a,a,a5 6 7

〕=Y(jié)u=(1,-1.97814,1.40744,-0.52973,0.10981,-0.68175,1.37006,-0.87356,0.20293)發(fā)【ia.wa“i.wae.wa“u.waYINS’中。YINS’中每個(gè)語音取一段提取8階線性推想系數(shù)LPC參數(shù)矢量。承受歐氏距離〔d=sum((a-b).^2,對文件夾‘YINSU錄每個(gè)音素與碼本中各個(gè)碼字的距離與量化結(jié)果。承受最大似然比失真測度,對文件夾‘YINSU’中每個(gè)音素進(jìn)展矢量量化。記錄每個(gè)音素與碼本中各個(gè)碼字的距離與量化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論