付費下載
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
離散余弦基下語音壓縮感知重構(gòu)方法研究
0基于rip技術(shù)的信號重構(gòu)技術(shù)減少感知cs的理論[1、2、3、4、5、6、7、8、9和10]是近年來提出的一種壓縮方法??梢砸种莆粗盘柕倪吘壐兄蛪嚎s,并且采樣數(shù)據(jù)遠(yuǎn)低于naposky采樣規(guī)則要求的數(shù)據(jù)量。由于數(shù)據(jù)量減少,并且在滿足信號重構(gòu)的RIP(restrictedisometryproperty)條件時能夠精確重構(gòu)原信號,該技術(shù)已經(jīng)在傳感器網(wǎng)絡(luò)、信號的檢測、估計和分類、圖像、醫(yī)學(xué)、雷達、通信、模式識別、盲源分離和頻譜分析等領(lǐng)域成為研究熱點。本文研究了語音信號進行壓縮感知處理時重構(gòu)誤差與壓縮比的關(guān)系,針對CS重構(gòu)信號在低壓縮比下“noisy”較為明顯的特點,通過選擇合適的窗長并利用小波去噪聯(lián)合低通濾波的方法提高了重構(gòu)信噪比和MOS分。1線性規(guī)劃求解算法由于語音信號在離散余弦DCT(discretecosinetransform)域上是近似稀疏的,根據(jù)壓縮感知基本原理,如果將k-稀疏語音信號x0∈Rn隨機投影到高斯觀測矩陣Φ上,可以產(chǎn)生m個觀測值。通常觀測向量的維數(shù)要遠(yuǎn)遠(yuǎn)小于原始信號的維數(shù)(m<n),可將觀測向量y看作原始信號抽樣和壓縮后的結(jié)果。解壓縮時,根據(jù)觀測向量,應(yīng)用數(shù)學(xué)優(yōu)化方法重構(gòu)原始信號[1,2,3,4,5,6,7,8,9,10]。重構(gòu)采用BP(basispursuit)算法,通過求解l1最優(yōu)化問題得到DCT系數(shù)θ:minθ∥θ∥1minθ∥θ∥1subjecttoy=ΦΨθ=Ξθ(1)其中,θ=ΨTx0=(θ1,θ2,…,θn)T為DCT系數(shù)向量,正交基Ψ={ψi|ψi∈Rn,i=1,2,…,n}為DCT基,Ξ=ΦΨ稱為CS矩陣。由于θ為n維無約束變量,為了保證線性規(guī)劃標(biāo)準(zhǔn)形式里變量的非負(fù)性,可令θ=u-v,其中u,v均為n維非負(fù)約束變量,即u≥0,v≥0。由此,將式(1)問題轉(zhuǎn)化為如下的線性規(guī)劃問題:minxcΤxminxcTxsubjecttoAx=bx≥0(2)其中,C=(1,?,1)Τ?A=(Ξ,-Ξ)?b=y?x=(uv)?θ=u-v。針對等式線性規(guī)劃問題(見式(2)),可以通過內(nèi)點法IP(interiorpointmethod)或單純形(simplexmethod)算法求解出最優(yōu)解x*,并進一步得出θ*或原始信號x0的重構(gòu)信號x*0。本文采用單純形法求解最優(yōu)解。具體算法如下:設(shè)矩陣A的秩為m,基矩陣為B,非基矩陣為N,矩陣A表示為:A=(B,N)(3)x中基變量的全體構(gòu)成xB=(xB1,xB2,…,xBm)T,非基變量的全體構(gòu)成xN=(xN1,xN2,…,xN(n-m))T。c中與基變量對應(yīng)的分量構(gòu)成cB=(cB1,cB2,…,cBm)T,與非基變量對應(yīng)的分量構(gòu)成cN=(cN1,cN2,…,cN(n-m))T。記A=(a1,a2,…,an)(4)給定一個初始基本可行解或初始基,可通過以下算法求出最優(yōu)解。設(shè)初始基為B,然后執(zhí)行下述步驟:(1)解Bx=b,求得x=B-1b=b′,令xN=0,計算目標(biāo)函數(shù)值cTBxB。(2)解wB=cΤB,得到單純形乘子w=cTBB-1。對于所有非基變量,計算判別數(shù)zj-cj=waj-cj。令zk-ck=maxj∈R{zj-cj}(5)其中,R為非基變量下標(biāo)集。若zk-ck≤0,則對于所有非基變量zj-cj≤0,對應(yīng)的基變量的判別數(shù)總是零,因此停止計算,現(xiàn)行的基本可行解是最優(yōu)解。否則,進行下一步。(3)解Byk=ak,得到y(tǒng)k=B-1ak,若yk≤0,則停止計算,問題不存在有限最優(yōu)解。否則,進行下一步。(4)確定下標(biāo)r,使得b′ryrk=min{b′iyik|yik>0}(6)其中,xBr為離基變量,xk為進基變量。用ak替換aBr,得到新的基矩陣B,返回步驟1。這里初始基本可行解可以用兩階段法或大M法確定。2重構(gòu)語音的開發(fā)系統(tǒng)的重構(gòu)雖然利用CS可以對語音信號進行壓縮,但重構(gòu)得到的語音頻譜高頻成份提升了,重構(gòu)語音聽起來有明顯“茲啦”聲,嚴(yán)重影響了聽覺質(zhì)量。圖1顯示了某段CS重構(gòu)語音幅度譜(上邊的曲線)與原始語音幅度譜(下邊的曲線),此時壓縮比(觀測點數(shù)與原信號點數(shù)的比值)為0.25。從圖1可以看出,CS重構(gòu)信號在低頻與原始信號有相對較好的吻合,而高頻提升較大,這種高頻的提升對應(yīng)時域的不光滑,也就是“noisy”現(xiàn)象。由此本文提出后置低通濾波的方法對CS重構(gòu)信號進行后處理。低通濾波器的傳遞函數(shù)如下:Η(z)=1-μ1-μz-1(7)參數(shù)μ取小于1且大于0的數(shù)。實驗部分給出了不同μ下的重構(gòu)語音質(zhì)量。CS重構(gòu)語音進行低通濾波后,聽起來較為舒適,但由于低通濾波對語音波形的損失導(dǎo)致該聲音聽起來有點悶,并且降低了重構(gòu)信號的信噪比。低通濾波器衰減特性越好,“茲啦”聲越小,但重構(gòu)語音也越沉悶,這是高頻成份損傷導(dǎo)致的。為了避免對高頻成份的過多損傷,考慮到小波方法良好的去噪性能,采用小波聯(lián)合低通濾波的方法來改善重構(gòu)語音質(zhì)量。去噪時采用Daubechies小波,閾值通過Birge-Massart處罰算法得到。圖2、圖3和圖4分別顯示了壓縮比為0.25時某段原始語音波形、CS重構(gòu)語音波形及小波聯(lián)合低通后置處理的重構(gòu)語音波形,原信號采樣頻率為16kHz,每20ms(對應(yīng)320個原始數(shù)據(jù))進行壓縮重構(gòu)處理。小波聯(lián)合低通處理后可有效去噪,使重構(gòu)信號波形光滑,并接近原始語音。3不同低通濾波參數(shù)下的cs重構(gòu)信號對比實驗中的數(shù)據(jù)庫采用中國科學(xué)院自動化所錄制的語音庫,取6個不同說話人的語音,共200個語句,以下各表給出的是平均結(jié)果。原始語音的采樣率為16kHz。重構(gòu)語音的質(zhì)量用壓縮感知重構(gòu)信噪比或MOS分來度量,本文MOS分均采用P.862標(biāo)準(zhǔn)算出。設(shè)原始信號為x0,CS重構(gòu)信號為x*0,誤差信號e=x-x*0。用原始信號x0與誤差信號e=x-x*0的能量比值的大小來衡量重構(gòu)誤差。定義壓縮感知重構(gòu)信噪比:CSSΝR=1ΝΝ∑i=110lgEx0iEei(8)其中,Ex0i為原始信號x0第i幀的能量,Eei為誤差信號e第i幀的能量,N是總的幀數(shù)。實驗分成三部分,第一部分研究窗(以下均為矩形窗)長為20ms(對應(yīng)的樣點為320)時不同觀測點數(shù)下CS重構(gòu)信號的信噪比及MOS分;第二部分研究不同低通濾波參數(shù)μ得到的小波去噪聯(lián)合低通濾波重構(gòu)語音質(zhì)量;第三部分研究不同語音分析窗長時,小波去噪聯(lián)合低通濾波處理的CS重構(gòu)信號質(zhì)量,并與未進行小波去噪聯(lián)合低通濾波處理的CS重構(gòu)信號進行對比。表1給出重構(gòu)信噪比及重構(gòu)信號的MOS分與觀測點數(shù)m的關(guān)系,這里語音分析窗長固定為20ms(320樣點),可見觀測點數(shù)越大,重構(gòu)信噪比越大,MOS分也越高。表2給出低壓縮比下不同低通濾波參數(shù)μ對應(yīng)的小波聯(lián)合低通濾波前后信號的MOS分與觀測點數(shù)的關(guān)系(原信號樣點數(shù)為320),第二行是只進行小波去噪(對應(yīng)的μ=0)得到的MOS分??梢姰?dāng)μ小于0.9時,μ越大得到的MOS越高,而當(dāng)μ在0.9與1之間時,小觀測點數(shù)下,MOS分先升后降,大觀測點數(shù)下,MOS分逐步下降。綜合考慮,參數(shù)μ取0.9?;谡Z音信號的短時平穩(wěn)特性,以上數(shù)據(jù)都是在語音分析窗長為320樣點(即20ms)得到的。CS基本原理中要求信號在某個域上具有稀疏性,而語音信號在DCT域上只是近似稀疏,所以重構(gòu)效果并非理想,特別是壓縮比較低的情況下。如果能夠使DCT域上的語音更稀疏,那么重構(gòu)效果一定會得到提高。時域的擴張對應(yīng)著頻域的集中,如果分析窗長增大,那么語音在DCT域上更加集中,此時稀疏性可以提高??梢?語音的CS重構(gòu)效果與窗長是有一定關(guān)系的,窗長的選擇應(yīng)兼顧短時性和稀疏性,我們分析了幾種低壓縮下小波去噪聯(lián)合低通濾波后的CS重構(gòu)信號的MOS分與分析窗長的關(guān)系,這里低通濾波參數(shù)μ取0.9,結(jié)果如表3所示,帶*的數(shù)據(jù)是相應(yīng)壓縮比下MOS分的最高值。表3給出的是小波去噪聯(lián)合低通濾波后的CS重構(gòu)信號MOS分,為了進行對比,表4給出未進行小波去噪及低通濾波處理的CS重構(gòu)信號MOS分與分析窗長的關(guān)系。從表3和表4可以看出,不同壓縮比下,采用小波聯(lián)合低通的CS重構(gòu)信號取得最高MOS分的分析窗長在40ms與70ms之間,未采用小波聯(lián)合低通的CS重構(gòu)信號取得最高MOS分的分析窗長在40ms與60ms之間,并且采用小波聯(lián)合低
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河南省駐馬店市汝南縣雙語學(xué)校、清華園學(xué)校2026屆九年級上學(xué)期1月期末考試歷史試卷(含答案)
- 2025年吉安職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫帶答案解析
- 2024年磁縣幼兒園教師招教考試備考題庫附答案解析(奪冠)
- 2025年交城縣幼兒園教師招教考試備考題庫含答案解析(奪冠)
- 2024年通化鋼鐵公司職工大學(xué)馬克思主義基本原理概論期末考試題含答案解析(必刷)
- 2024年湖北財稅職業(yè)學(xué)院馬克思主義基本原理概論期末考試題及答案解析(必刷)
- 2025年隆德縣招教考試備考題庫帶答案解析
- 2025年四川西南航空職業(yè)學(xué)院馬克思主義基本原理概論期末考試模擬題帶答案解析
- 2025年慶安縣幼兒園教師招教考試備考題庫及答案解析(奪冠)
- 2025年廣州華南商貿(mào)職業(yè)學(xué)院馬克思主義基本原理概論期末考試模擬題含答案解析(必刷)
- 雷波縣糧油貿(mào)易總公司 2026年面向社會公開招聘筆試參考題庫及答案解析
- 2025年互聯(lián)網(wǎng)公司產(chǎn)品經(jīng)理面試實戰(zhàn)試題及答案
- 2026年上海市浦東新區(qū)初三上學(xué)期一模數(shù)學(xué)試卷和參考答案
- 內(nèi)蒙古包鋼1.18事故警示安全教育課件
- 公安局民警崗位培訓(xùn)制度
- (正式版)DB44∕T 2771-2025 《全域土地綜合整治技術(shù)導(dǎo)則》
- 春節(jié)前安全意識培訓(xùn)課件
- 江蘇省無錫市2025-2026學(xué)年七年級上學(xué)期期末數(shù)學(xué)模擬試卷【含答案詳解】
- 2.2 中國的氣候 第一課時 教學(xué)設(shè)計2025八年級地理上學(xué)期湘教版
- 2024冀少版八年級生物下冊全冊知識點考點清單
- 2026年江蘇省南京市五年級英語上冊期末考試試卷及答案
評論
0/150
提交評論