版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第5章聲音信號的線性預測編碼5.1線性預測基本原理5.2線性預測的解析算法5.3線性預測分析應用案例線性預測編碼(LPC)的基本思想由于語音信號的每個樣點之間存在相關性,所以能夠使用過去的樣點值來預測和推理現(xiàn)在與將來的樣點值。換句話說,對一個語音的抽樣能夠用過去若干個語音的抽樣來逼近。通過使實際語音抽樣和線性預測下的語音抽樣之間的誤差在某個準則下達到最小值來決定最優(yōu)的一組預測系數(shù),而這組預測系數(shù)就客觀反映了語音信號的特性35.1線性預測基本原理線性預測的基本原理是用過去的樣點值來預測某個模型現(xiàn)在或者未來的樣點值
45.1線性預測基本原理
55.1線性預測基本原理可以用準周期脈沖或白噪聲激勵一個線性時不變系統(tǒng)聲道所產生的輸出作為語音的模型,用公式表達為
65.1線性預測基本原理根據(jù)的形式不同,有三種不同的信號模型:1、若H(z)同時含有極點和零點,稱作自回歸—滑動平均模型(AutoregressiveMovingAverage,ARMA),這是一種常見的模型。2、若H(z)的分子多項式為常數(shù),即b=0,此時為全極點模型,當前模型的輸出只取決于過去的信號值,這種模型稱為自回歸模型(Autoregressive,AR)。3、若H(z)的分母多項式為1,即a=0,此時成為全零點模型,稱為滑動平均模型(MovingAverage,MA)。此時模型的輸出只由模型的輸入來決定。75.1線性預測基本原理實際上語音信號處理中最常見的模型是全極點模型,這是因為如果不考慮鼻音和摩擦音,那么語音的聲道傳遞函數(shù)就是一個全極點模型;而對于鼻音和摩擦音,細致的聲學理論表明其聲道傳輸函數(shù)既有極點又有零點,但這時如果模型的階數(shù)p足夠高,可以用全極點模型來近似表示極零點模型,因為一個零點可以用許多極點來近似。85.1線性預測基本原理可以用線性預測分析的方法來估計全極點模型參數(shù)。采用全極點模型,輻射、聲道以及聲門激勵的組合譜效應的傳輸函數(shù)為:其中p為預測器階數(shù),G為聲道濾波器增益,S(z)和E(z)為語音抽樣s(n)和激勵信號e(n)的z變換。95.1線性預測基本原理語音信號s(n)和激勵信號e(n)之間的關系可以用下列的差分方程來表示:即語音樣點間有相關性,可以用過去的樣點值來預測未來的樣點值。對于濁音,e(n)是以基音周期重復的單位沖激;對于清音,e(n)時恒穩(wěn)白噪聲105.1線性預測基本原理在模型參數(shù)估計過程中,把下面的系統(tǒng)稱為線性預測器:
115.1線性預測基本原理A(z)稱作逆濾波器,其傳輸函數(shù)為:
125.1線性預測基本原理下面推導線性預測方程,把某一幀內的短時平均預測誤差定義為:
上式表明采用最佳預測系數(shù)時,預測誤差與過去的語音樣點正交。135.1線性預測基本原理
則有:
145.1線性預測基本原理考慮前式有:
155.2線性預測的解析算法
165.2線性預測的解析算法
即因此有175.2線性預測的解析算法展開為矩陣形式為:這種方程叫Yule-Walker方程,方程左邊的矩陣稱為托普利茲(Toeplitz)矩陣,它是以主對角線對稱的,而且其沿著對角線平行方向的各軸向的元素值都相等。這種Yule-Walker方程可用萊文遜-杜賓(Levinson-Durbin)遞推算法來高效地求解。Durbin快速推算法將簡寫為:Durbin快速推算法將上式分為上下兩部分運算Durbin快速推算法將上式分為上下兩部分運算Durbin快速推算法令則有Durbin快速推算法
則將左右同乘Durbin快速推算法得到帶入有Durbin快速推算法最終解得
Durbin快速推算法
則得到帶入Durbin快速推算法由式有:再代入得到=Durbin快速推算法歸納得到:285.2線性預測的解析算法完整的遞推過程如下:295.3線性預測分析應用案例
而預測誤差的傳遞函數(shù)可寫為305.3.1基音檢測估計利用線性預測倒譜法進行基音檢測315.3.1基音檢測估計首先,運行SetII和PartII將語音信號讀入并且分幀,并進行了端點檢測。其次,對一句話提取每一幀的數(shù)據(jù),加漢明窗,用lpc函數(shù)求出預測系數(shù)并計算預測誤差。最后利用求倒譜的方法對預測誤差計算倒譜,最終得到左圖結果。325.3.1基音檢測估計利用簡化逆濾波法進行基音檢測335.3.1基音檢測估計該方法的基本思想是:先對話音信號進行LPC分析和逆濾波,獲得語音信號的預測誤差,然后將預測誤差信號通過自相關器和峰值檢測,以獲得基音周期。語音信號通過線性預測逆濾波器后達到頻譜的平坦化,因為逆濾波器是一個使頻譜平坦化的濾波器,所以它提供了一個簡化的頻譜平滑器。預測誤差是自相關器的輸入,通過在自相關函數(shù)中尋找最大值,可以求出基音的周期。345.3.2共振峰估計對一段語音利用LPC內插法檢測共振峰估計355.3.1基音檢測估計首先,在程序中使用LPC函數(shù)求出了預測系數(shù),直接調用了lpcar2pf函數(shù)由預測系數(shù)計算出功率譜。lpcar2pf函數(shù)是voicebox語音工具箱中的一個函數(shù)。其次,用findpeaks函數(shù)從功率譜曲線上找出峰值和峰值的位置。最后得到如左圖的運行結果365.3.2共振峰估計讀入一段語音數(shù)據(jù)并采用Extfrmnt函數(shù)檢測共振峰軌跡375.3.1基音檢測估計左圖語音數(shù)據(jù)的波形和端點檢測的結果右圖在語音信號語譜圖上疊加共振峰的軌跡1、
概述聲音信號的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年財會領域財務主管晉級財務經理題目與解析
- 2026年網絡編程基礎與實戰(zhàn)認證試題
- 2026年社交媒體營銷策略社交平臺運營與推廣專業(yè)測試題
- 2026年緊急救援隊伍協(xié)調配合與聯(lián)動機制練習題
- 2026年宏觀經濟分析政策影響預測經濟趨勢預測題
- 2026年新能源技術與應用開發(fā)工程師認證題集
- 2026年初級人力資源管理師職業(yè)資格考試練習題
- 2026年環(huán)境科學考試環(huán)境污染控制知識題庫
- 2026年邏輯思維訓練推理分析與應用題集
- 2026年軟件編程基礎及算法應用題集
- 2025福建省閩西南水資源開發(fā)有限責任公司招聘5人筆試參考題庫附帶答案詳解
- 2026云南昆明市公共交通有限責任公司總部職能部門員工遴選48人筆試模擬試題及答案解析
- 2025至2030中國數(shù)字經濟產業(yè)發(fā)展現(xiàn)狀及未來趨勢分析報告
- 上海市松江區(qū)2025-2026學年八年級(上)期末化學試卷(含答案)
- 導管室護理新技術
- 中國信通服務:2025算力運維體系技術白皮書
- 2026年焦作大學單招試題附答案
- 電力行業(yè)五新技術知識點梳理
- 《DLT 849.1-2004電力設備專用測試儀器通 用技術條件 第1部分:電纜故障閃測儀》專題研究報告 深度
- 餐飲業(yè)店長運營效率考核表
- 超市安全生產協(xié)議書
評論
0/150
提交評論