數(shù)字語音處理實(shí)驗(yàn)報(bào)告_第1頁
數(shù)字語音處理實(shí)驗(yàn)報(bào)告_第2頁
數(shù)字語音處理實(shí)驗(yàn)報(bào)告_第3頁
數(shù)字語音處理實(shí)驗(yàn)報(bào)告_第4頁
數(shù)字語音處理實(shí)驗(yàn)報(bào)告_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、實(shí)驗(yàn)一、用MATLAB實(shí)現(xiàn)語音信號(hào)的時(shí)域分析學(xué)院:信息與通信工程學(xué)院專業(yè):通信工程班級(jí):通信144學(xué)號(hào):2014136410姓名:劉新雨指導(dǎo)教師:崔艷秋1. 實(shí)驗(yàn)?zāi)康挠^察并驗(yàn)證語音信號(hào)的時(shí)域特性,理解并掌握典型的語音信號(hào)時(shí)域分析方法和時(shí)域特征,為深入學(xué)習(xí)語音信號(hào)處理的各種應(yīng)用奠定基礎(chǔ)。2. MATLAB程序代碼(1)由麥克風(fēng)采集語音數(shù)據(jù),將采集的數(shù)據(jù)存成WAV文件(采樣率為8000Hz),存在本人的文件夾中。所用程序代碼為:clear;close all;Fs=11025;y=wavrecord(5*Fs,Fs,'double');wavwrite(y,'D:lxy&#

2、39;);soundview(y,Fs);(2)讀取WAV文件,顯示語音信號(hào)的波形。所用程序代碼為:clear;close all;x = wavread('D:lxy.wav'); figure;plot(x);axis(0,size(x,1),-0.35,0.3);title('語音信號(hào)時(shí)域波形');xlabel('樣點(diǎn)數(shù)'); ylabel('幅度');(3)讀取WAV文件,計(jì)算并顯示語音的短時(shí)能量(窗函數(shù)為矩形窗,幀長為50,200,400,600)。所用程序代碼為:clear;close all;x = wavread(

3、'd:k.wav');x = double(x);f1= enframe(x,50, 50); energy1 = sum(abs(f1), 2); subplot(2,2,1);plot(energy1); title('語音信號(hào)的短時(shí)能量'); legend('幀長LEN =50');f2= enframe(x,200, 200); energy2 = sum(abs(f2), 2); subplot(2,2,2);plot(energy2); title('語音信號(hào)的短時(shí)能量'); legend('幀長LEN = 2

4、00');f3= enframe(x,400, 400); energy3 = sum(abs(f3), 2); subplot(2,2,3);plot(energy3); title('語音信號(hào)的短時(shí)能量'); legend('幀長LEN = 400');f4= enframe(x,600,600); energy4 = sum(abs(f4), 2); subplot(2,2,4);plot(energy4); title('語音信號(hào)的短時(shí)能量'); legend('幀長LEN = 600');(4)讀取WAV文件,計(jì)

5、算并顯示語音的短時(shí)過零率(窗函數(shù)為矩形窗,幀長為256,幀移為128),所用程序代碼為:clear;close all;x = wavread('D:lxy.wav'); x = double(x);LEN = 300;INC= 150;f = enframe(x, LEN, INC); % 計(jì)算短時(shí)過零率z = zeros(size(f,1),1); difs =0.01; for i=1:size(f,1) s=f(i,:); for j=1:(length(s)-1) if s(j)* s(j+1)<0&abs(s(j)-s(j+1)>difs; z(

6、i)= z(i)+1; end endendsubplot(2,1,1); plot(x); axis(0,size(x,1),-0.35,0.3);title('語音信號(hào)時(shí)域波形'); xlabel('樣點(diǎn)數(shù)'); ylabel('幅度');subplot(2,1,2);plot(z); title('語音信號(hào)的短時(shí)過零率');xlabel('幀數(shù)'); ylabel('短時(shí)過零率');(5)讀取WAV文件,計(jì)算濁音與清音的短時(shí)自相關(guān)函數(shù)所用的程序代碼為:clear;close all;x = w

7、avread('D:lxy.wav');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC); ff=f(15,:); N=LEN; R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1);endfor k=1:NR1(k)= R(k)/R(1); endsubplot(2,1,1);plot(ff); axis(0,N,-0.5,0.75)title('加矩形窗的語音幀'); xlabel('樣點(diǎn)數(shù)'); ylabel('幅度

8、');subplot(2,1,2); plot(R1); axis(0,N,-1,1)title('加矩形窗的短時(shí)自相關(guān)函數(shù)'); xlabel('k'); ylabel('R(k)');clear;close all;x = wavread('d:k.wav');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC); ff=f(124,:); ff=ff'.*hamming(length(ff); N=LEN; R=zeros(1,N);for k=1

9、:NR(k)= sum(ff(k:N).*ff(1:N-k+1);endfor k=1:NR1(k)= R(k)/R(1); endsubplot(2,1,1);plot(ff); axis(0,N,-0.5,0.75)title('加漢明窗的語音幀'); xlabel('樣點(diǎn)數(shù)'); ylabel('幅度');subplot(2,1,2); plot(R1); axis(0,N,-1,1)title('加漢明窗的短時(shí)自相關(guān)函數(shù)'); xlabel('k'); ylabel('R(k)');clea

10、r;close all;x = wavread('D:lxy.wav');x = double(x);LEN = 10;INC= 10;f = enframe(x, LEN, INC); ff=f(500,:); N=LEN; R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1);endfor k=1:NR1(k)= R(k)/R(1); endsubplot(2,1,1);plot(ff); axis(0,N,-0.05,0.05)title('加矩形窗的語音幀'); xlabel('樣點(diǎn)數(shù)'

11、); ylabel('幅度');subplot(2,1,2); plot(R1); axis(0,N,-0.5,0.5)title('加矩形窗的短時(shí)自相關(guān)函數(shù)'); xlabel('k'); ylabel('R(k)');clear;close all;x = wavread('D:lxy.wav');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC); ff=f(25,:); N=LEN; R=zeros(1,N);for k=1:NR(k)= su

12、m(ff(k:N).*ff(1:N-k+1);endfor k=1:NR1(k)= R(k)/R(1); endsubplot(2,1,1);plot(ff); axis(0,N,-0.05,0.05)title('加矩形窗的語音幀'); xlabel('樣點(diǎn)數(shù)'); ylabel('幅度');subplot(2,1,2); plot(R1); axis(0,N,-0.5,0.5)title('加矩形窗的短時(shí)自相關(guān)函數(shù)'); xlabel('k'); ylabel('R(k)'); 3. 實(shí)驗(yàn)結(jié)果及

13、其分析(1)本實(shí)驗(yàn)利用11025Hz的采樣頻率對(duì)輸入的語音信號(hào)進(jìn)行采樣,采樣點(diǎn)數(shù)為55125個(gè),持續(xù)時(shí)間為5秒,存儲(chǔ)格式為double。之后將數(shù)字語音數(shù)據(jù)寫入D盤的a.wav文件,并通過放音設(shè)備進(jìn)行回放?;胤诺腉UI界面如圖1所示,通過該界面可以觀察采集的語音信號(hào)。圖1 用soundview函數(shù)顯示的語音信號(hào)(2)本實(shí)驗(yàn)將D盤的lxy.wav文件讀取出來,并顯示文件中的語音信號(hào)波形,顯示的波形如圖2所示。該波形是漢語拼音“Xu”的時(shí)域波形。從圖2可以看出,X是清音,它的波形幅值較小,且沒有周期性;u是濁音,它的波形幅值較大且有明顯的周期性起伏結(jié)構(gòu)。圖2 語音“Xu”的時(shí)域波形(3)本實(shí)驗(yàn)將D盤

14、的lxy.wav文件讀取出來,當(dāng)幀長取不同值時(shí)計(jì)算語音信號(hào)的短時(shí)能量,如圖3所示。從圖3可以看出,濁音短時(shí)能量大,短時(shí)平均幅度大,短時(shí)過零率低,濁音具有較強(qiáng)的能量值,音段內(nèi)隱藏信息的能力高。輕音短時(shí)能量小,短時(shí)平均幅度小,能量值較低,音段內(nèi)隱藏信息的能力較低。圖3 不同幀長對(duì)應(yīng)的短時(shí)能量(4)本實(shí)驗(yàn)首先讀取lxy.wav中的語音數(shù)據(jù),之后計(jì)算每一幀的短時(shí)過零率,最后將原始語音信號(hào)和短時(shí)過零率顯示出來,如圖4所示。從圖4可以看出,清音的過零率較高,濁音的過零率較低。圖4 短時(shí)過零率(5)本實(shí)驗(yàn)首先讀取lxy.wav中的語音數(shù)據(jù),之后對(duì)數(shù)據(jù)進(jìn)行分幀加窗處理,幀長為256,幀移為128。選取其中的一幀濁音(第15幀)并計(jì)算這幀的短時(shí)自相關(guān)函數(shù)。當(dāng)窗函數(shù)分別為矩形窗和漢明窗時(shí),截取的語音信號(hào)和短時(shí)自相關(guān)函數(shù)如圖5和圖6所示。從圖5和圖6可以看出,矩形窗能夠比漢明窗更明顯的顯示出第一個(gè)峰值。當(dāng)窗函數(shù)為矩形窗,不同幀長(幀移=幀長)的一幀濁音對(duì)應(yīng)的短時(shí)自相關(guān)函數(shù)如圖7和圖8所示。從圖7和圖8可以看出,幀長越長,越容易區(qū)分其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論