版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
本文格式為Word版,下載可任意編輯——語音信號處理試驗報告心得(五篇)在經(jīng)濟發(fā)展迅速的今天,報告不再是罕見的東西,報告中提到的所有信息應(yīng)當(dāng)是確鑿無誤的。那么報告應(yīng)當(dāng)怎么制定才適合呢?以下是我為大家搜集的報告范文,僅供參考,一起來看看吧
語音信號處理試驗報告心得篇一
要
語音信號處理是研究數(shù)字信號處理技術(shù)和語音信號進(jìn)行處理的一門學(xué)科,是一門新型的學(xué)科,是在多門學(xué)科基礎(chǔ)上發(fā)展起來的綜合性技術(shù),它涉及到數(shù)字信號處理、模式識別、語言學(xué)。語音信號處理是研究用數(shù)字信號處理技術(shù)對語音信號處理的一門學(xué)科。處理的目的是要得到一些語音參數(shù)以便高效的傳輸或存儲;或者是通過處理的某種運算以達(dá)到某種用途的要求。語音信號處理又是一門邊緣學(xué)科。如上所訴,它是“語言語音學(xué)〞與“數(shù)字信號處理〞兩個學(xué)科相結(jié)合的產(chǎn)物。
語音信號處理屬于信息科學(xué)的一個重要分支,大規(guī)模集成技術(shù)的高度發(fā)展和計算機技術(shù)的飛速前進(jìn),推動了這一技術(shù)的發(fā)展。在數(shù)字音頻技術(shù)和多媒體技術(shù)迅速發(fā)展的今天,傳統(tǒng)的磁帶語音錄放系統(tǒng)因體積大、使用不便、放音不明了而受到了巨大挑戰(zhàn)。本次課程設(shè)計提出的體積小巧,功耗低的數(shù)字化語音存儲與回放系統(tǒng),可以有效的解決傳統(tǒng)的語音錄放系統(tǒng)在電子與信息處理的使用中受到的限制。
本文提出了語音信號處理課程建設(shè)的試驗環(huán)節(jié)中的一些考慮,作為專業(yè)課程的學(xué)習(xí),試驗內(nèi)容不能僅僅停留在驗證性試驗上,還應(yīng)增加試驗延伸的設(shè)計要求,是學(xué)生加深對理論分析認(rèn)識的同時,強調(diào)培養(yǎng)學(xué)生的實際動手能力和知識綜合運用能力。從而提高語音信號的教學(xué)和試驗的質(zhì)量。試驗內(nèi)容采用matlab編程實現(xiàn),不僅易于語音信號處理的實現(xiàn),更易引導(dǎo)學(xué)生完成試驗延伸的設(shè)計。
第一章緒論
1.1選題背景
在我們的現(xiàn)實生活中從磁帶、錄像帶到cd、vcd、dvd;從黑白電視機、彩色電視機、高明了度電視機到具有數(shù)字信號處理功能的電視機;從留聲機、錄音機到語音信箱;現(xiàn)在正出在模擬信息到數(shù)字信息的變革之中,傳統(tǒng)的磁帶語音錄放系統(tǒng)因其體積大,使用不便,在電子與信息處理的使用中受到大量限制。
雖然,目前廣播電視系統(tǒng)尚未實現(xiàn)真正的數(shù)字化,相信在不久的將來,真正的數(shù)字電視、數(shù)字收音機、數(shù)字收錄機將進(jìn)入家庭。所以,研究音頻信號的數(shù)字化存儲、處理和回放系統(tǒng)有著很重要的現(xiàn)實意義。
通過設(shè)計語音信號試驗箱可以對語音信號實現(xiàn)各種形式的變換,因此學(xué)會對語音信號的處理,也可自行研究將此語音處理技術(shù)應(yīng)用到現(xiàn)實生活中。
1.2課題意義
語音信號處理的一門比較實用的電子工程的專業(yè)課程,語音是人類獲取信息的重要來源和利用信息的重要手段,通過語言相互傳遞信息是人類最重要的基本功能之一,語音是人類特有的功能,它是創(chuàng)造和記載幾千年來人類文明史的根本手段,是人類最重要、最有效、最常用和最便利的交換信息的形式。
語音信號處理是研究用數(shù)字信號處理技術(shù)對語音信號進(jìn)行處理的一門學(xué)科,它是一門新興的學(xué)科,同時又是綜合性的多學(xué)科領(lǐng)域剛也涉及面很廣的交織學(xué)科。
其次章課程設(shè)計要求及系統(tǒng)原理
2.1課程設(shè)計基本要求
(1)學(xué)會matlab的使用,把握matlab的程序設(shè)計方法;
(2)把握在windows環(huán)境下語音信號的采集方法;
(3)把握數(shù)字信號處理的基本概念,基本理論和基本方法;
(4)把握matlab設(shè)計方法;
(5)學(xué)會用matlab對信號進(jìn)行分析和處理。
2.2系統(tǒng)基本原理
語音采集原理是,人耳能聽到的聲音是一種范圍為20hz—20khz,而一般語音頻率最高為3.4khz。語音的采集是指語音聲波信號經(jīng)麥克風(fēng)和高頻放大器轉(zhuǎn)換成有一定幅度的模擬量電信號,然后再轉(zhuǎn)換成數(shù)字量的全過程。
本次設(shè)計的基本原理是對語音的錄音和放音進(jìn)行數(shù)字化控制。其中,關(guān)鍵技術(shù)在于:為了增加語音存儲時間,提高存儲器的利用率,采用了非失真壓縮算法對語音信號進(jìn)行壓縮后再存儲,而在回放時再進(jìn)行解壓縮;同時,對輸入語音信號進(jìn)行數(shù)字濾波以抑制雜音和干擾,從而確保了語音回放的可靠質(zhì)量。
通過設(shè)計一個gui試驗箱,并添加相應(yīng)的控制控件,添加一個聲音文件,通過matlab編程,使其通過各種按鈕實現(xiàn)語音信號處理的各種功能,最終做成一個完整的語音信號處理試驗箱。
第三章設(shè)計方案論證
3.1設(shè)計理論依據(jù)
3.1.1采樣定理:
在進(jìn)行模擬/數(shù)字信號的轉(zhuǎn)換過程中,大于信號中最高頻率fmax的2倍時,則采樣之后的數(shù)字信號完整的保存了原始信號中的信號,一般實際應(yīng)用中保證采樣頻率為信號最高頻率的5—10倍;采樣定理又稱奈奎斯特定理。
3.1.2采樣頻率:
采樣頻率是指計算機每秒鐘采集多少個聲音樣本,是描述聲音文件的音質(zhì)、音調(diào)、衡量聲卡、聲音文件的質(zhì)量標(biāo)準(zhǔn)。采樣頻率越高,即采樣的間隔時間越短,則在單位時間內(nèi)計算機得到的聲音樣本數(shù)據(jù)就越多,對聲音波形的表示也就越確切,采樣頻率與聲音頻率之間有一定的關(guān)系,根據(jù)奈奎斯特理論,只有采樣頻率高于聲音信號最高頻率的2倍的時候,才能把數(shù)字信號表示的聲音還原成為原來的聲音,這就是說采樣頻率是衡量聲卡采集、記錄和還原聲音文件的質(zhì)量標(biāo)準(zhǔn)。
3.1.3采樣位數(shù)與采樣頻率
采樣位數(shù)即采樣值或取樣值,用來衡量聲音波動變化的參數(shù),是指聲卡在采集和播放聲音文件時候使用數(shù)字聲音信號的二進(jìn)制為數(shù)。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對聲音信號的采樣次數(shù),采樣頻率越高聲音的還原就越真實越自然。
采樣位數(shù)和采樣頻率對于音頻接口來說是最為重要的兩個基本指標(biāo),也是選擇音頻接口的兩個重要標(biāo)準(zhǔn)。無論采樣頻率如何,理論上來說采樣的位數(shù)決定了音頻數(shù)據(jù)最大的力度范圍。每增加一個采樣位數(shù)相當(dāng)于力度范圍增加了6db。采樣位數(shù)越多則捕獲到的信號越確切。對于采樣率來說你可以想象它類似于一個照相機。顯然采樣率越高,計算機提取的聲音越多,對于原始的還原也越加確切。
第四章圖形用戶界面設(shè)計
4.1圖形用戶界面概念
圖形用戶界面或圖形用戶接口是指采用圖形方式顯示的計算機操作環(huán)境由用戶接口。與早期計算機使用的命令行界面相比,圖形界面對于用戶來說更為簡便易用。
gui是matlab提供的圖形用戶界面開發(fā)環(huán)境,提供了一系列用于創(chuàng)立圖形用戶界面的工具,從而簡化界面布局和編程工作。
4.2用戶界面設(shè)計
4.2.1gui設(shè)計模板
在matlab主窗口中,選擇file菜單中的new菜單項,再選擇其中的gui命令,就會顯示圖形用戶界面的設(shè)計模板。
matlab為gui設(shè)計一共準(zhǔn)備了四個模板,分別是blankgui、guiwithuicontrols、guiwithaxesandmenu、modalquestiondialog。
當(dāng)用戶選擇不同的模板時,在gui設(shè)計模板界面的右邊就會顯示出與該模板對應(yīng)的gui圖形。
4.2.2gui設(shè)計窗口
在gui設(shè)計模板中選中一個模板,然后單擊ok按鈕,就會顯示gui設(shè)計窗口,選擇不同的gui設(shè)計模式時,在gui設(shè)計窗口中顯示的結(jié)果是不一樣的。
gui設(shè)計窗口由菜單欄、工具欄、空間工具欄以及圖形對象設(shè)計區(qū)等部分組成。gui設(shè)計窗口的菜單欄有file、edit、view、layout、tools和help六個菜單項,使用其中的命令可以完成圖形用戶界面的設(shè)計操作。
4.2.3gui設(shè)計窗口的基本操作
(1)前面板的設(shè)計:在gui設(shè)計窗口創(chuàng)立圖形對象后,通過雙擊該對象,就會顯示該對象的屬性編輯器。如下圖所示。例如,創(chuàng)立一個pushbutton對象,并設(shè)計該對象的屬性值。
圖4-1按鈕屬性編輯器
通過以上的按鈕屬性編輯器可以根據(jù)個人狀況對按鈕的名稱、顏色、大小等方面的屬性進(jìn)行修改,使按鈕在視覺上變的更加完美。
(2)按鈕功能的實現(xiàn):在gui設(shè)計窗口創(chuàng)立按鈕后,通過右鍵單擊按鈕,選擇viewcallbacks下的callback對相應(yīng)的按鈕進(jìn)行編程,使按鈕實現(xiàn)相應(yīng)的功能,如下圖所示對按鈕的響應(yīng)功能進(jìn)行設(shè)置。
圖4-2按鈕功能編輯器
進(jìn)入到按鈕程序編輯窗口,通過編程即可實現(xiàn)按鈕的相應(yīng)功能,如下圖:
圖4-3按鈕的編程實現(xiàn)界面
通過對各個按鈕控件的修改,和對m文件程序的添加就完成對gui窗口的設(shè)計,最終得到的圖形化操作界面如下圖所示:
圖4-4圖形化操作界面
4.2.4語音的錄入與開啟
在matlab中,[y,fa,bits]=wavread(‘blip’,[n1n2]);用于讀取語音,7
采樣值放在向y中,fs表示采樣頻率,bits表示采樣位數(shù)。[n1n2]表示讀取從n1點到n2點的值。
suond(x,fs,bits);用于對聲音的回放,向量y則就代表了一個信號也就是說可以像處理一個信號表達(dá)式一樣處理這個聲音信號。
第五章課程設(shè)計的軟件實現(xiàn)
5.1部分函數(shù)語法格式
讀wav文件:x=wavread(‘filename’)數(shù)組a及b中元素相乘:a.*b創(chuàng)立圖形窗口命令:figure繪圖函數(shù):plot(x)坐標(biāo)軸:axis([xminxmaxyminymax])坐標(biāo)軸注解:xlabel(‘?’)ylabel(‘?’)圖例注解:legend(‘?’)一階高通濾波器:y=filter([1-0.09375],1,x)分幀函數(shù):f=enframe(x,len,inc)x為輸入語音信號,len指定了幀長,inc指定幀移,函數(shù)返回為nxlen的一個矩陣,每一行都是一幀數(shù)據(jù)。
5.2語音信號處理的相關(guān)函數(shù)
5.2.1語音信號的短時譜:
周期性聲門波可表示為:
(5-1)其中,g[n]是聲門波的單周期的波形,p[n]是間隔為p的周期采樣序列。當(dāng)u[n]通過線性非時變聲道,且該聲道的單位沖擊響應(yīng)為h[n]時,聲道輸出為:
(5-2)為了觀測一段語音,需要降生到輸出乘以一個一時刻τ為中心的窗函數(shù)w[n,τ],即得到:
(5-3)
這段語音信號的頻域表達(dá)式為:
(5-4)
即語音信號的譜包絡(luò)為
語譜圖就是現(xiàn)實時變頻譜幅度特征的圖形表達(dá)式為:
(5-5)
將語音信號短時譜程序?qū)懭氲絤atlab中得到單色語譜圖的波形如下:
圖5-1語音信號單色語譜圖
5.2.2自相關(guān)方法估計語音信號的聲道參數(shù):
由均方預(yù)計誤差最小的得到正則方程:
(5-6)
其中,(5-7)
在最正確解時的誤差為
(5-8)
在自相關(guān)法中式5-6,式5-8變?yōu)?/p>
(5-9)
(5-10)由式5-9和式5-10可列出方程組式5-11
(5-11)
解方程組式5-9求出線性預(yù)計系數(shù),通過誤差式5-11可求出增益g
(5-12)
加窗后信號頻譜圖如下:
圖5-2加窗后信號頻譜圖
通過以上的方法,改變參數(shù)分別求得4極點模型頻率響應(yīng)和6極點模型頻率響應(yīng),6極點波形如下圖所示:
圖5-3六極點波形圖
最終通過以上方法用一個函數(shù)分別實現(xiàn)以上三個功能,三個波形顯示在一個界面,通過觀測圖形,查看它們之間的分別。三者比較所得到的波形如下:
圖5-4三者比較波形圖
5.2.3基音周期檢測
數(shù)據(jù)為濁音語音信號speech1_10k(10000樣點/秒)用25ms的漢明窗對語音信號speech1_10k進(jìn)行加窗處理,并畫出所得到的加窗信號的自相關(guān)函數(shù),再用根據(jù)中心消波法及三電平中心消波法原理改進(jìn)程序,最終對比中方法基音檢測的效果并分析結(jié)果。
試驗原理及方法
(1)自相關(guān)檢測原理:對于離散的數(shù)字語音信號序列x(n),假使周期n,則自相關(guān)函數(shù)也是同周期的周期函數(shù)。即:x(n)=x(n+n)。清音信號沒有周期性,他的自相關(guān)函數(shù)也沒有周期。濁音新海具有準(zhǔn)周期性。自相關(guān)基音檢測正是利用這一性質(zhì)對語音信號進(jìn)行基音檢測的。
(2)中心消波法檢測原理:中心消波處理是使用如下圖所示的中心消波函數(shù)進(jìn)行處理的:
圖5-5中心消波檢測圖
(3)三電平消波法原理:為了減少自相關(guān)計算中的乘法運算,可以把上述中心消波以后的信號y(n)的自相關(guān)用兩個信號的相互關(guān)代替,其中一個信號是y(n)另一個信號是對y(n)進(jìn)行三電平量化產(chǎn)生的結(jié)果。且這個信號有三種可能的取值,因而這里的相互關(guān)計算只需要做加減法,而這個相互關(guān)序列的周期性與y(n)的自相關(guān)序列是近似一致的。
三電平法對語音信號處理得到的波形如下:
圖5-6三電平法波形圖
中心消波法得到的波形如下圖:
圖5-7中心消波法波形圖
5.3gui試驗箱操作界面設(shè)計
通過對各個控件的編程和對參數(shù)的設(shè)計,最終得到的gui試驗箱操作界
面如下圖所示,通過界面上的各個按鈕即可實現(xiàn)相應(yīng)的功能。
圖5-8gui試驗箱操作界面
第六章心得體會
通過本次課程設(shè)計完成了對語音信號的讀取與開啟,與課題的要求十分相符;初略的完成了界面的設(shè)計,但也存在相當(dāng)?shù)牟蛔?,達(dá)到了開啟語音文件,顯示已定波形。語音信號處理時語音學(xué)與數(shù)字信號處理技術(shù)相結(jié)合的交織學(xué)科,將語音當(dāng)做一種特別的信號,即一種“繁雜
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年心理學(xué)基礎(chǔ)知識試題庫及答案詳解
- 建筑物機電安裝協(xié)調(diào)方案
- 高中生運用地理加權(quán)回歸研究清代西南地區(qū)港口物流網(wǎng)絡(luò)通達(dá)性課題報告教學(xué)研究課題報告
- 外墻老舊建筑改造方案
- 水電站安全防護(hù)欄設(shè)計方案
- 橋梁懸索施工技術(shù)方案
- AI非洲獨立運動歷史進(jìn)程情感分析在高中歷史教學(xué)中的應(yīng)用課題報告教學(xué)研究課題報告
- 2025-2026學(xué)年北京市豐臺區(qū)高三(上期)期末考試數(shù)學(xué)試卷(含答案)
- 礦山土壤污染修復(fù)技術(shù)方案
- 供水系統(tǒng)運營成本控制方案
- 外科院感課件
- 2025國家核安保技術(shù)中心招聘筆試歷年??键c試題專練附帶答案詳解試卷3套
- 12158-2024防止靜電事故要求
- 2026年重慶城市管理職業(yè)學(xué)院單招職業(yè)技能測試題庫新版
- 侗族花帶課件
- 酒吧內(nèi)保年終總結(jié)
- 兒童講解員禮儀
- 文物建筑勘查設(shè)計取費標(biāo)準(zhǔn)(2020年版)
- DB14∕T2248-2020 《煤礦安全風(fēng)險分級管控和隱患排查治理雙重預(yù)防機制實施規(guī)范》
- 辦公室三辦三服務(wù)課件
- 紹興興欣新材料股份有限公司新增3000ta焦磷酸哌嗪、4000ta聚氨酯發(fā)泡催化劑、5000taN-β-羥乙基乙二胺、500ta無水哌嗪項目及全廠資源循環(huán)利用技改提升項目(一期)環(huán)境影響報告書
評論
0/150
提交評論