(通信與信息系統(tǒng)專業(yè)論文)voip系統(tǒng)中agc算法的研究與dsp實現(xiàn).pdf_第1頁
(通信與信息系統(tǒng)專業(yè)論文)voip系統(tǒng)中agc算法的研究與dsp實現(xiàn).pdf_第2頁
(通信與信息系統(tǒng)專業(yè)論文)voip系統(tǒng)中agc算法的研究與dsp實現(xiàn).pdf_第3頁
(通信與信息系統(tǒng)專業(yè)論文)voip系統(tǒng)中agc算法的研究與dsp實現(xiàn).pdf_第4頁
(通信與信息系統(tǒng)專業(yè)論文)voip系統(tǒng)中agc算法的研究與dsp實現(xiàn).pdf_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

(通信與信息系統(tǒng)專業(yè)論文)voip系統(tǒng)中agc算法的研究與dsp實現(xiàn).pdf.pdf 免費下載

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

獨創(chuàng)性聲明 獨創(chuàng)性( 或創(chuàng)新性) 聲明 本人聲明所呈交的論文是本人在導師指導下進行的研究工作及取得的研究 成果。盡我所知,除了文中特別加以標注和致謝中所羅列的內(nèi)容以外,論文中不 包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得北京郵電大學或其他 教育機構(gòu)的學位或證書而使用過的材料。與我一同工作的同志對本研究所做的任 何貢獻均已在論文中作了明確的說明并表示了謝意。 申請學位論文與資料若有不實之處,本人承擔一切相關責任。 本人簽名: 凌致甄 同期:麴坐芝:芝 關于論文使用授權(quán)的說明 學位論文作者完全了解北京郵電大學有關保留和使用學位論文的規(guī)定,即: 研究生在校攻讀學位期間論文工作的知識產(chǎn)權(quán)單位屬北京郵電大學。學校有權(quán)保 留并向國家有關部門或機構(gòu)送交論文的復印件和磁盤,允許學位論文被查閱和借 閱;學??梢怨紝W位論文的全部或部分內(nèi)容,可以允許采用影印、縮印或其它 復制手段保存、匯編學位論文。( 保密的學位論文在解密后遵守此規(guī)定) 保密論文注釋:本學位論文屬于保密在一年解密后適用本授權(quán)書。非保密論 文注釋:本學位 本人簽名: 導師簽名: 適用本授權(quán)書。 同期:,獨絲:芝照一 日期: 婦f q ! 圣。f 芝 摘要 v o l p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) 摘要 隨著互聯(lián)網(wǎng)的快速發(fā)展,互聯(lián)網(wǎng)語音通信應用日益普及,與傳統(tǒng) 電話相比,i p 電話以其網(wǎng)絡帶寬利用率高、通話費用低、承載業(yè)務多 而得到廣泛應用。與傳統(tǒng)電話網(wǎng)不同,l p 電話網(wǎng)將所有的話音打包成 i p 包通過i p 尋址的方式傳送到對端,因此就產(chǎn)生了一些問題,包括 延時、抖動、回聲等現(xiàn)象。為了消除這些影響,需要對語音信號進行 預處理,通過處理可以大大改善原系統(tǒng)在外界環(huán)境干擾條件下的性 能,提高語音通信質(zhì)量。 實用語音預處理系統(tǒng)主要包括降噪系統(tǒng)、回聲控制系統(tǒng)、語音激 活檢測模塊和自動增益控制模塊等。自動增益控制模塊能穩(wěn)定信號傳 輸電平,通過信號增益控制的處理,能根據(jù)輸入信號電平大小和指定 的輸出電平,自動調(diào)整電平變化,并且不影響傳輸信號尤其是語音的 質(zhì)量,保證經(jīng)過控制后的語音可懂度不會發(fā)生波動。 本論文的主要研究內(nèi)容是語音信號預處理系統(tǒng)中的自動增益控 制模塊。重點學習基于v a d ( v o i c ea c t i v i t yd e t e c t i o n ) 的a g c 算法 和基于能量比較的a g c 算法,主要工作是將s p e e x 語音編碼算法中 用到的自動增益控制算法在d s p 芯片上實現(xiàn),應用于v o l p 系統(tǒng)的話 機終端。 在本課題中,采用2 4 位的a r l 6 8 8 芯片,綜合實際應用的優(yōu)勢, 定點d s p 芯片功耗小,價格低,運算時間比浮點d s p 芯片短,更適 用于實時語音傳輸應用及大規(guī)模生產(chǎn),因此本課題選擇定點d s p 實 現(xiàn)。課題的實現(xiàn)過程分為兩步,首先對算法進行了定點c 語言的實 現(xiàn),然后把定點代碼轉(zhuǎn)化為d s p 匯編代碼。在a g c 算法通過調(diào)試后, 為了降低運算復雜度,適應低速處理器的要求,利用了a r l 6 8 8 芯片 自身的硬件特點和指令特點,對算法進行了優(yōu)化。最終在以a r l 6 8 8 為核心的設備上成功地實現(xiàn)了自動增益控制的要求。 關鍵詞:語音預處理自動增益控制a g c 算法a r l 6 8 8 芯片d s p 實現(xiàn) a b s t r 氏吼 r e s e a r c ha n di m p l e m e n t a t i o n o fa u t o m 喳t i cg a i nc o n t r o l a l g o r i t h mi nv b i p a b s t r a c t w i t ht h e r a p i dd e v e l o p m e n t o f i n t e r n e t ,i n t e r n e t v o i c e c o m m u n i c a t i o n sa p p l i c a t i o n sb e c o m ei n c r e a s i n g l y p o p u l a r c o m p a r i n g w i t ht r a d i t i o n a lt e l e p h o n e ,i pt e l e p h o n eh a sb e e nw i d e l yu s e db e c a u s eo f i t sa d v a n t a g e so fh i g hu t i l i z a t i o nr a t i oo fn e t w o r kb a n d w i d t h ,l o wt a l k i n g c o s ta n d m u l t i p l eb e a r i n g s e r v i c e s i pt e l e p h o n en e t w o r ki sd i f f e r e n tf r o m t h et r a d i t i o n a lo l l ef o ri t sp a c k i n gt h ev o i c ei n t oi pp a c k e t sa n ds e n d i n g t h e mt ot h ee n dt h r o u g hi pa d d r e s s t h u s ,i tc a u s e ss o m ep r o b l e m ss u c h a st i m e d e l a y ,j i t t e ra n de c h o t oe l i m i n a t et h e s ei n f l u e n c e s ,t h es p e e c h s i g n a l ss h o u l db ep r e p r o c e s s e d ,a n di tc a ng r e a t l yi m p r o v et h es y s t e m p e r f o r m a n c eu n d e rt h ec o n d i t i o no fo u t s i d ee n v i r o n m e n ti n t e r f e r e n c ea n d t h es p e e c hq u a l i t y p r a c t i c a lv o i c ep r e p r o c e s ss y s t e mm a i n l yi n c l u d e sn o i s er e d u c t i o n s y s t e m ,e c h o c o n t r o l s y s t e m ,v o i c ea c t i v i t y d e t e c t i o nm o d u l ea n d a u t o m a t i cg a i nc o n t r o lm o d u l ea n ds oo n t h ea u t o m a t i cg a i nc o n t r o l m o d u l ec a nm a k es i g n a lt r a n s m i s s i o nl e v e ls t a b l e t h r o u g ht h ep r o c e s so f s i g n a lg a i nc o n t r o l ,i tc a na d j u s tl e v e lv a r i a t i o na c c o r d i n gt oi n p u ts i g n a l l e v e la n d s p e c i f i e do u t p u tl e v e l a n d c a nm a k en oi n f l u e n c et o t r a n s m i s s i o ns i g n a l ,a n dm a k es u r et h a tt h e i n t e l l i g i b i l i t yo fc o n t r o l l e d s p e e c hw i l ln o tf l u c t u a t e t h em a i nr e s e a r c hc o n t e n to ft h i st h e s i si sa u t o m a t i cg a i nc o n t r o l m o d u l ei nt h ev o i c e p r e p r o c e s ss y s t e m t h ef o c u s e sa r ev a d b a s e da g c a l g o r i t h ma n de n e r g yc o m p a r i s o n b a s e da g ca l g o r i t h m ,a n dt h em a i n w o r ki st oi m p l e m e n tt h ea g c a l g o r i t h mu s e di ns p e e xs p e e c hc o d e a l g o r i t h mo nt h ed s pc h i p ,a n dt h e na p p l yi tt ot h et e l e p h o n et e r m i n a li n v o l p s y s t e m a b s t r a c t i nt h i st h e s i s t h e2 4 _ b i ta r l 6 8 8c h i pi su s e d t h ef i x e d p o i n td i g i t a l s i g n a lp r o c e s s o rc h i ph a st h ea d v a n t a g e so fp r a c t i c a la p p l i c a t i o nb e c a u s e o ft h el i t t l ep o w e rc o n s u m p t i o n ,i n e x p e n s i v ep r i c ea n ds h o r t e ro p e r a t i o n t i m et h a nt h ef l o a t p o i n to n e a n di ti sm o r es u i t a b l ef o rr e a l t i m ev o i c e t r a n s m i s s i o na p p l i c a t i o na n dl a r g es c a l ep r o d u c t i o n ,s ot h ef i x e d - p o i n t d s pc h i pi sa d o p t e d t h ei m p l e m e n t a t i o ni n t h i st h e s i si si nt w os t e p s , f i r s tm a k et h ef l o a t i n g p o i n tt of i x e d p o i n t c o n v e r s i o ni ncw i t h o p t i m i z a t i o n t h e nt r a n s l a t et h ec t od s pa s s e m b l yc o d e s a f t e rt h ea g c a l g o r i t h mp a s s i n gt h et e s t i n gs e q u e n c e ,t h en e x tw o r k i st h eo p t i m i z a t i o n o ft h ea g ca l g o r i t h mu s i n gt h eh a r d w a r ef e a t u r e sa n di n s t r u c t i o n c h a r a c t e r i s t i c so fa r l 6 8 8c h i p i no r d e rt or e d u c et h ec o m p l e x i t yo f a l g o r i t h ma n da d a p tt h er e q u i r e m e n t s o f p r o c e s s o r e v e n t u a l l y ,w e s u c c e s s f u l l ya c h i e v e dt h er e q u i r e m e n t so fa u t o m a t i cg a i nc o n t r o lo n e q u i p m e n to fw h i c ht h ec o r ee l e m e n ti sa r l 6 8 8c h i p k e yw o r d s :v o i c ep r e p r o c e s s a u t o m a t i c g a i n c o n t r o la g c a l g o r i t h m a r l 6 8 8c h i pd s p i m p l e m e n t a t i o n 目錄 第一章引言 目錄 1 1v o l p 提出的背景1 1 2v o l p 技術簡介2 1 2 1v o l p 系統(tǒng)的組成2 1 2 2v o i p 的基本傳輸過程3 1 2 3 v o l p 系統(tǒng)中需要解決的技術問題4 1 3 、,o i p 中的語音信號預處理一4 1 3 1 語音信號概述4 1 3 2 語音分析方法6 1 3 1 3 語音信號預處理7 1 4 工作流程與論文結(jié)構(gòu)9 第二章算法原理。1 1 2 1 自動增益控制方法的比較1 1 2 2 幾種常見的自動增益控制算法1 1 2 2 1 音頻a g c 算法1 1 2 2 2 符合g1 6 9 協(xié)議的a g c 算法1 3 2 3 本課題所采用的自動增益控制算法1 4 2 3 1 基于v a d 檢測的a g c 算法1 4 2 3 2 改進的基于能量比較的a g c 算法1 7 第三章定點理論與運算的實現(xiàn) 2 0 3 1 定點化理論概述2 0 3 1 1 定點數(shù)的q 值表示方法2 1 3 1 2 定點數(shù)的運算法則。2 2 3 1 3 定點化的原則與方法。2 3 3 2 定點化函數(shù)庫的實現(xiàn)2 4 3 2 1 擴展精度除法的實現(xiàn)2 5 3 2 2 非線性函數(shù)的實現(xiàn)方法2 6 第四章開發(fā)平臺及d s p 芯片結(jié)構(gòu)介紹。 2 9 4 1p a l 6 8 8 介紹2 9 目錄 4 1 1p a l 6 8 8 的芯片特點和硬件結(jié)構(gòu)2 9 4 1 2p a l 6 8 8 芯片控制器系統(tǒng)結(jié)構(gòu)3 0 4 1 3p a l 6 8 8d s p 子系統(tǒng)結(jié)構(gòu)及外設。3 1 4 2a r l 6 8 8 介紹3 2 4 2 1a r l 6 8 8 話機系統(tǒng)結(jié)構(gòu)3 2 4 2 2a r l 6 8 8 和p a l 6 8 8 的比較3 5 4 3a r l 6 8 8 軟件設計及實現(xiàn)3 6 4 3 1a r l 6 8 8 軟件結(jié)構(gòu)。3 6 4 3 2a r l 6 8 8 程序軟件開發(fā)應用及工具3 7 4 3 3 程序仿真調(diào)試環(huán)境3 8 第五章自動增益控制算法的d s p 實現(xiàn)及優(yōu)化 3 9 5 1a g c 算法代碼浮點c 到定點c 的實現(xiàn)一3 9 5 1 1 模塊分解3 9 5 1 2 定點化c 代碼的實現(xiàn)4 0 5 2a g c 算法定點c 代碼到d s p 匯編的實現(xiàn)_ 4 7 5 2 1 設定文件結(jié)構(gòu)4 7 5 2 2 課題編程規(guī)則4 7 5 2 3 通用子函數(shù)編寫。4 9 5 2 4 模塊設計5 0 5 2 5d s p 代碼編譯和鏈接5 4 5 3d s p 代碼調(diào)試工作5 4 5 3 1 一致化驗證方法5 4 5 3 2 一致化調(diào)試5 6 5 4 代碼的優(yōu)化5 7 5 4 1 程序組織結(jié)構(gòu)的優(yōu)化5 8 5 4 2 基于d s p 指令的優(yōu)化。5 8 5 4 3 代碼的優(yōu)化效果。6 0 5 5a g c 算法效果測試。6 1 5 5 1 基于v a d 的a g c 算法效果測試6 l 5 5 2 改進型a g c 算法效果測試6 2 5 6 實際的自動增益控制效果測評一6 3 第六章總結(jié)與展望 6 5 6 1 本文工作總結(jié)6 5 目錄 6 2 下一步的工作6 6 6 3 技術展望6 6 參考文獻 致謝 6 7 6 9 作者攻讀學位期間發(fā)表的學術論文目錄7 0 北京郵電人學碩十研究生論文v o l p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) 第一章引言 互聯(lián)網(wǎng)的出現(xiàn)給人們的工作和生活帶來了巨大的影響和改變,通過網(wǎng)絡人們 可以更方便地了解外界的信息,更快捷地完成各種業(yè)務。隨著互聯(lián)網(wǎng)與其它領域 的結(jié)合,也產(chǎn)生了各種新的應用,這將進一步影響和改變?nèi)藗兊纳罘绞健?v o l p 技術正是網(wǎng)絡技術與多媒體技術結(jié)合產(chǎn)生的,基本目標是通過分組交 換網(wǎng)絡來傳輸語音數(shù)據(jù)。由于與計算機技術的結(jié)合,v o l p 可以提供比傳統(tǒng)的電 話網(wǎng)絡更多、更好的服務,如統(tǒng)一消息、查號業(yè)務、虛擬語音傳真郵箱等。本 章將從v o i p 提出的背景、系統(tǒng)組成及原理、v o l p 系統(tǒng)中的語音預處理模塊等幾 個方面介紹v o l p 系統(tǒng),從而引出本文的研究課題。 1 1v o l p 提出的背景 1 9 9 5 年,全球第一個可以通過i n t e m e t 打長途電話的軟件產(chǎn)品“i n t e m e t p r o t o c o l ”由以色列v o c a lt e e 公司率先推出。i p 電話的出現(xiàn)不僅大幅度減少了用 戶的通訊費用,而且提供了一個全新的通訊方式,迅速成為全球熱門的新業(yè)務, 也是當今世界上發(fā)展最快、普及最快的應用服務技術之一【1 1 。 v o i p 是v o i c eo v e ri p 的縮寫,即把語音技術集成在i p 傳輸協(xié)議中,通過 i n t e r n e t 網(wǎng)絡進行語音傳輸?shù)囊环N全新的通訊方式。隨著i n t e m e t 在全球范圍內(nèi)的 興起和語音編碼技術的發(fā)展,v o l p 獲得了突破性的進展和實際的應用,而且正 在逐步占領傳統(tǒng)電話業(yè)務的市場。 i p 電話之所以迅速如此發(fā)展,是因為它比傳統(tǒng)電話具有一定的優(yōu)勢: ( 1 ) i p 網(wǎng)傳輸交換。i p 電話的傳輸媒介是i n t e m e t 網(wǎng)絡,i p 電話在傳輸過 程中,信息根據(jù)i p 協(xié)議被分成組進行傳輸,每個分組上都有目的地址與分組序 號,分組可以沿不同的路徑到達目的地,在目的地將分組重新組成原來的信號, 可以實現(xiàn)信道的統(tǒng)計復用,提高信道利用率。而傳統(tǒng)電話采用電路交換方式,信 道利用率低。 ( 2 ) 語音壓縮技術成熟。傳統(tǒng)電話一般采用6 4 k b i t s 的語音編碼速率,而 i p 電話使用的壓縮技術可以將語音信息壓縮到1 0 k b i t s 以下,占用帶寬達到傳統(tǒng) 帶寬的1 8 。 ( 3 ) i p 電話占用帶寬低,利用率高。傳統(tǒng)電話給每一個成功的呼叫都提供 6 4 k b i t s 的固定信道,只要不掛機,即使沒有人說話、沒有語音信息傳輸?shù)那闆r 下,這一信道始終不能被別的呼叫使用。i p 電話的語音信息不占用固定的信道, 第1 頁共7 0 頁 北京郵電人學碩+ 研究生論文v o l p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) 只在有信息的時候才進行傳送,而且采用語音壓縮技術,大大提高了帶寬的利用 率。 ( 4 ) 語音通信費用低廉。由于i p 電話占用的網(wǎng)絡資源比傳統(tǒng)電話低,成本 也較低,所以l p 電話資費比傳統(tǒng)電話低。 ( 5 ) 終端號碼具有可攜帶性。傳統(tǒng)電話有固定的地點、固定的號碼,而i p 電話沒有固定的地點及號碼,只要可以接入i n t c r n e t 網(wǎng)絡就可以使用號碼實現(xiàn)語 音通信。 1 2v o i p 技術簡介 v o 坤技術通過語音壓縮算法對語音信號進行壓縮編碼處理,然后把這些語 音數(shù)據(jù)按照無連接的u d p 協(xié)議( 用戶數(shù)據(jù)報協(xié)議) 標準進行打包,經(jīng)過網(wǎng)絡把 數(shù)據(jù)包發(fā)送到接收端;接收端將這些數(shù)據(jù)包經(jīng)過解碼、解壓縮處理后恢復成原來 的語音信號,從而達到由互聯(lián)網(wǎng)傳送語音的目的1 2 1 。目前,v o i p 的實現(xiàn)結(jié)構(gòu)主要 有四種形式,包括電話到電話,電話到l p 終端,口終端到電話,i p 終端到i p 終端,其中i p 終端既可以是p c 機,也可以是專門的口電話。 1 2 1v o i p 系統(tǒng)的組成 目前國內(nèi)可以支持v o i p 業(yè)務開展的主要有3 種實現(xiàn)形式,即基于h 3 2 3 協(xié) 議的i p 電話網(wǎng)絡、基于會話啟動協(xié)議( s i p 協(xié)議) 的硬電話網(wǎng)絡和基于軟交換 的網(wǎng)絡。 ( 1 ) 基于h 3 2 3 協(xié)議的i p 電話網(wǎng)絡 h 3 2 3 協(xié)議的i p 電話網(wǎng)絡由網(wǎng)守、網(wǎng)關、應用服務器和后臺管理等主要模塊 組成,其中網(wǎng)守負責用戶呼叫的地址解析和資源的管理,網(wǎng)關負責不同通信網(wǎng)絡 間媒體流的轉(zhuǎn)換和呼叫通道的建立,應用服務器負責在基本的語音業(yè)務的基礎上 擴展增值業(yè)務或進行呼叫策略的管理,后臺管理設備則負責計費、認證、網(wǎng)管等 功能。 ( 2 ) 基于s i p 協(xié)議的v o l p 網(wǎng)絡 s i p 協(xié)議最早是由i e t f 的l p t e l 工作組提出的一種v o l p 實現(xiàn)方式,其基本思 想是在互聯(lián)網(wǎng)環(huán)境中,組建一個平面結(jié)構(gòu)的、可用于點到點對話需求的系統(tǒng)。 基于s i p 協(xié)議所構(gòu)建的系統(tǒng)具有協(xié)議結(jié)構(gòu)簡單、設備易于開發(fā)等特點,也能 很好地承載語音和圖像等多種業(yè)務。該系統(tǒng)是由s i p 終端( 客戶機) 、代理服務 器和重定向服務器等功能模塊組成。s i p 終端負責發(fā)出呼叫、媒體流的編解碼; 代理服務器負責接受終端的呼叫請求信息,并根據(jù)重定向服務器給出的地址信息 將呼叫請求消息轉(zhuǎn)發(fā)給下個代理服務器,直到送至最終的用戶終端;而重定向服 第2 頁共7 0 頁 北京郵電人學碩十研究生論文 v o l p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) 務器用于給代理服務器指出轉(zhuǎn)發(fā)消息下一次應該送達的代理服務器的地址。 ( 3 ) 用軟交換設備實現(xiàn)的v o i p 網(wǎng)絡 軟交換一詞最早見于綜合交換機的研究中,是n g n 的核心設備,國內(nèi)最早 用于商用v o i p 業(yè)務的軟交換設備采用的是s i p 協(xié)議,其只負責地址解析而不管 理呼叫狀態(tài)。而隨著發(fā)展,軟交換也逐漸吸收了許多其他v o i p 技術的內(nèi)容,將 網(wǎng)關分解協(xié)議中的媒體網(wǎng)關控制器、h 3 2 3 協(xié)議中網(wǎng)守以及其他設備的功能逐步 地融合進來,形成了目前的軟交換設備。 1 2 2v o i p 的基本傳輸過程 傳統(tǒng)的電話網(wǎng)是以電路交換方式傳輸語音,所要求的傳輸帶寬為6 4 k b i t s 。 而v o i p 是以l p 分組交換網(wǎng)絡為傳輸平臺,對模擬的語音信號進行壓縮、打包等 一系列的特殊處理,使之可以采用無連接的u d p 協(xié)議進行傳輸。為了在一個i p 網(wǎng)絡上傳送語音信號,要求幾個元素和功能。最簡單形式的網(wǎng)絡由兩個或多個具 有i p 功能的設備組成,這些設備通過一個i p 網(wǎng)絡連接。v o l p 模型的基本結(jié)構(gòu) 如圖i - 1 所示。 語音代理語青代理 圖1 - 1v o i p 的模型結(jié)構(gòu) 從圖可以發(fā)現(xiàn)v o i p 設備是如何把語音信號轉(zhuǎn)換成i p 數(shù)據(jù)流,并把這些數(shù)據(jù) 流轉(zhuǎn)發(fā)到i p 目的地,l p 目的地又把它們轉(zhuǎn)換回到語音信號。兩者之間的網(wǎng)絡必 須支持i p 傳輸,且可以是口路由器和網(wǎng)絡鏈路的任意組合。 簡而言之,語音信號在l p 網(wǎng)絡上的傳送要經(jīng)過從模擬信號到數(shù)字信號的轉(zhuǎn) 換、數(shù)字語音封裝成i p 分組、i p 分組通過網(wǎng)絡的傳送、l p 分組的解包和數(shù)字語 音還原到模擬信號等過程【3 1 。整個過程如圖1 2 所示。 第3 頁共7 0 頁 北京郵電人學碩十研究生論文v o l p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) 圖1 2 v o i p 傳輸?shù)幕具^程 1 2 3v o i p 系統(tǒng)中需要解決的技術問題 多種原因促使i p 電話( 以及在其他數(shù)據(jù)網(wǎng)上傳送語音) 的產(chǎn)塵和發(fā)展,然 而大規(guī)模使用i p 電話并不是一件容易的事。主要原因是i p 協(xié)議族并不是為像語 音這樣的同步、實時的業(yè)務所設計的,因此在實現(xiàn)v o i p 系統(tǒng)時,存在一些需要 解決的問題。 ( 1 ) q o s 問題 由于分組網(wǎng)絡盡力而為的傳輸特性,則影響v o l p 系統(tǒng)服務質(zhì)量最主要的因 素是丟包和網(wǎng)絡時延抖動。由于語音通信的實時性要求,在現(xiàn)有的情況下必須保 證最低標準的通話質(zhì)量的時延應小于2 5 0 毫秒,其傳輸過程中的丟包率應小于 5 ,否則語音質(zhì)量無法接受。另外,影響v o i p 通信質(zhì)量的還有回音處理,靜噪 抑制,i p 包分割,語音數(shù)據(jù)優(yōu)先級和前向糾錯等因素。 ( 2 ) v o l p 與p s t n ,i n ( 智能網(wǎng)) 的無縫連接 i p 電話不僅要與p s t n 之間完成基本的通話服務,而且對于各種智能業(yè)務也 要求做到互通。但是由于目前i p 電話的信令標準化程度還有待進一步的完善, 卡用戶的漫游還沒有得到很好的解決。 ( 3 ) v o i p 安全問題 目前,v o l p 面臨的安全問題主要有四個方面:拒絕服務( d o s ) 攻擊、非法 接入、話費詐欺或竊聽等威脅。信息安全專家警告,如果對v o l p 部署不當,v o i p 會受到黑客和惡意代碼的攻擊,從而可能破壞網(wǎng)絡的安全措施。對于企業(yè)網(wǎng)絡而 言,v o i p 的威脅則更大,因為企業(yè)會急于部署這一技術而忽視了安全。 1 3v o l p 中的語音信號預處理 1 3 1 語音信號概述 語音是人們講話時發(fā)出的話語,它既是一種聲音,又包含人們進行交流的信 息。因此,語音是語言和聲音的組合體【4 】,目前語音信號處理的內(nèi)容主要集中在 聲音的處理上。 根據(jù)聲音所在的頻率范圍,可以將聲音分類為: 第4 頁共7 0 頁 北京郵電人學碩+ 研究生論文 v o l p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) ( 1 ) 亞音( s u b s o n i c ) :頻率低于2 0h z 的信號; ( 2 ) 音頻( a u d i o ) :頻率范圍為2 0 h z 。2 0 k h z 的信號; ( 3 ) 超音頻( u l t r a s o n i c ) :頻率高于2 0k h z 的信號。 人類能夠聽到的聲音是音頻( 強度為5 1 3 0 d b ) ,但能夠發(fā)出的聲音卻低于4 k h z 。 根據(jù)香農(nóng)采樣定理1 5 1 ,數(shù)字語音信號采樣率應該是信號最高頻率的兩倍,即8 k h z 。 我們通常所說的語音信號處理,實質(zhì)就是對每秒至少8 0 0 0 個聲音數(shù)據(jù)進行分析 與變換。 完整的語音信號的數(shù)學模型可用三個子模型:激勵模型、聲道模型和輻射模 型的串聯(lián)來表示1 6 l ,如圖1 3 所示。 出 音 圖1 3 語音信號產(chǎn)生的離散對域模型 。 其傳輸函數(shù)可以表示為: 7 日( z ) = a u ( z ) y ( z ) 。尺( z ) ( 1 1 ) 其中,u ( z ) 是激勵信號,濁音時u ( z ) 是聲門脈沖即斜三角脈沖序列的z 變換; 清音時,u ( z ) 是一個隨機噪聲的z 變換。v ( z ) 是聲道傳輸函數(shù),既可以用聲管 模型,也可以用共振峰模型來描述,但本質(zhì)就是全極點模型7 l : 1 v ( z ) 一可l _ ( 1 - 2 ) 1 一va k z 以 角 而輻射函數(shù)r ( z ) 則可以近似為: 尺( z ) = r o ( 1 一z 以) ( 1 3 ) 需要指出的是,這些模型都是“短時”的,因為一些語音信號的變化是較緩 慢的,例如元音在l o 。2 0 m s 內(nèi)其參數(shù)可以假設不變。另外,模型中用濁音和清音 第5 頁共7 0 頁 北京郵電人學碩十研究生論文v o l p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) 這樣簡單的劃分方法是有缺陷的,這對于某些摩擦音是不適用的,而且也無法用 疊加的方式得到,對于這些音可以用一些修正模型來模擬。 1 3 2 語音分析方法 語音信號分析是語音信號處理的前提和基礎,只有分析出可以表示語音信號 本質(zhì)特性的參數(shù),才有可能利用這些參數(shù)進行高效的語音通信、語音合成和語音 識別等處理。根據(jù)所分析參數(shù)不同的性質(zhì),可將語音信號分析分為時域分析、頻 域分析、同態(tài)分析、線性預測分析等方法【引。 ( 1 ) 時域分析方法 語音信號的時域分析就是分析和提取語音信號的時域參數(shù),這是一種比較直 觀的分析方法。時域分析通常用于最基本的參數(shù)分析及應用,如語音的分割、預 處理與分類等,實現(xiàn)簡單,運算量也較小。 語音信號的時域參數(shù)包括有短時能量、短時過零率、短時自相關以及短時平 均幅度差等,這是語音信號的一組最基本的短時參數(shù),在各種語音信號數(shù)字處理 中都要應用到。為了使語音信號的短時能量與幅度的變化相對平滑,在計算這些 參數(shù)時使用的一般都是矩形窗或漢明窗。 ( 2 ) 頻域分析方法 從廣義上來講,語音信號的頻域分析包括語音信號的頻譜、功率譜、倒頻譜、 頻譜包絡分析等。常用的頻域分析方法包括傅立葉變換法等等。因為語音信號是 一個非平穩(wěn)過程,因此適用于周期、非瞬變或平穩(wěn)隨機信號的標準傅立葉變換不 能用來直接進行分析,而應該用短時傅立葉變換進行頻譜的分析,相應的頻譜稱 為“短時譜 。 對第n 幀語音信號勛伽) 進行傅立葉變換,定義如下: 一l 兄p 加) = 羅渤伽弘一胴 ( 1 - 4 ) 齋歷 其中為變換點數(shù),短時傅立葉變換實際上就是窗選信號的標準傅立葉變換。 選取不同的窗函數(shù),就會得到不同的傅立葉變換結(jié)果。 如令角頻率w = 2 z r k n ,則可得到離散的短時傅立葉變換石。似) 。在語音信 號數(shù)字處理中,一般采用x n ( m ) 的離散傅立葉變換來替代x n ( e j w ) ,并且可以用高 效的快速傅立葉變換算法完成由x n 伽) 到比 ) 的轉(zhuǎn)換。為了符合入耳的聽覺特 性,提高語音信號處理系統(tǒng)的性能,還可以進一步將實際的線性頻譜轉(zhuǎn)化為臨界 帶頻譜矢量,從而可根據(jù)人耳對頻率高低的非線性心理感受反映語音短時幅度譜 的特征。 ( 3 )同態(tài)分析 第6 頁共7 0 頁 北京郵電人學碩十研究生論文v o i p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) 同態(tài)分析實現(xiàn)將卷積關系變換為求和關系的分離處理,即解卷。對語音信號 進行解卷,可將語音信號的聲門激勵信息及聲道響應信息分離開來,從而求得聲 道共振特征和基音周期,可用于語音編碼、合成與識別等。 許多語音信號并不是加性信號,而是聲門激勵和聲道沖擊響應的卷積信號, 而同態(tài)信號處理可以將這類非線性問題轉(zhuǎn)化為線性問題,在線性空間完成運算后 再逆變換為卷積信號。 對卷積信號z 0 ) = x ) * x 2 ( n ) 進行如下的運算處理: z l o ) 】= x q ) ;x t ( z ) x z q ) l a x ( z ) = l n x l ( z ) + i n x 2 ( z ) = 雪1 ( z ) + j 2 ( z ) 一譬( z ) ( 1 5 ) z 一1 萱( z ) = z - 1 膏( z ) + j :( z ) 一譬- ( ,z ) + 巖z ( 以) = 疊( 萬) 由于圣0 ) 是加性信號,所以可對其進行線性處理。例如在兩個信號互不交替的情 況下,將聲門激勵信號與聲道沖擊響應分離開來,最后只需要對分離信號進行逆 變換與指數(shù)運算即可恢復出原來的卷積信號。 ( 4 ) 線性預測分析 線性預測分析的基本思想是:利用語音樣點之間存在的相關性,可以用過去 的樣點值來預測現(xiàn)在或者未來的樣點值,即一個語音的抽樣能夠用過去若干個語 音抽樣或者它們的線性組合來進行逼近,然后通過使實際的語音抽樣和線性預測 抽樣之間的誤差在某個準則下達到最小值來決定唯一的一組預測系數(shù)。現(xiàn)代語音 編碼的聲道模型的參數(shù)估計大多都是基于線性預測分析的方法。 1 3 3 語音信號預處理 在數(shù)字語音通信中,背景噪聲的干擾、信號傳輸?shù)膿p耗以及語音信號的正反 饋所引起的信號不穩(wěn)定,使得很多語音處理系統(tǒng)的性能急劇下降。例如語音編解 碼系統(tǒng)中,信道噪聲與線路噪聲污染的影響是很大的,又例如線路電平的不匹配 造成音量大小不一等。為了消除現(xiàn)實環(huán)境中的數(shù)字語音對人們的主觀聽覺所造成 的負面影響,對語音預處理技術及其實用化的研究是非常有必要的。語音預處理 技術是數(shù)字語音信號處理的重要分支,已經(jīng)廣泛應用于無線電話、電話會議和場 景錄音等領域。通過各個方面的預處理可以大大改善原系統(tǒng)在外界環(huán)境的干擾條 件下的性能,從而提高語音通信質(zhì)量。 在電話網(wǎng)中,為了把模擬的話音轉(zhuǎn)換為數(shù)字信號進行傳輸需要采用一定的信 號轉(zhuǎn)換技術,具體過程如圖1 4 所示。話音在話機中由聲音信號轉(zhuǎn)換為電信號后, 在數(shù)字電話交換機中先是對信號進行了采樣,得到一系列的離散信號,然后對這 些離散信號進行量化,得到相應的量化值,最后把這些值進行編碼。編碼后的數(shù) 字信號就可以在數(shù)字通信網(wǎng)中傳送。在信號的接收端,數(shù)字信號被譯碼為一系列 第7 頁共7 0 頁 北京郵電人學碩十研究生論文v o l p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) 的值,進而通過類似低通濾波器的電路恢復原有的模擬話音信號,送到被叫用戶 的電話設備上。 鬯堅臥世墜些當嬰 + - 墅墮塑h 一嬰墼- i _ 幢墅啤 模擬信號數(shù)字信號 數(shù)字信號模擬信號 圖1 - 4 語音信號在數(shù)字通信系統(tǒng)上的傳輸 i p 電話與傳統(tǒng)電話網(wǎng)相比,優(yōu)勢在于話音編碼技術,通過一定的話音編碼技 術,l p 電話能在一個2 m 帶寬的信道中傳輸比傳統(tǒng)電話技術多幾倍的話音,由此 大大節(jié)約了每路電話所需的傳輸帶寬。在長途電話業(yè)務中能減少很多的長途傳輸 設備,優(yōu)勢尤其明顯。 在i p 電話網(wǎng)中,話音不像傳統(tǒng)電話網(wǎng)中占用一個固定的時隙,而是把所有的 話音打包成i p 包通過l p 尋址的方式傳送到對端,因此就產(chǎn)生了一些問題,包括延 時、抖動、回聲等現(xiàn)象。為了消除這些影響,需要對語音信號進行預處理。 語音預處理的目的是為了在保持語音可懂度和清晰度的前提下,對語音信號 進行時域或頻域的變換與處理,從而使語音在音強、音長、音質(zhì)與純凈度等方面 得到一定程度的提升。實用語音預處理系統(tǒng)主要包括降噪系統(tǒng)、回聲控制系統(tǒng)、 語音激活檢測模塊和自動增益控制模塊等,如圖1 5 所示。 圖1 5 語音預處理系統(tǒng)結(jié)構(gòu) 第8 頁共7 0 頁 北京郵電人學碩十研究生論文v o l p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) 其中,降噪模塊的作用是檢測并且抑制語音信號中的背景噪聲,提高語音的 純凈度;長話通信中回聲影響較大,因此需要配備回聲控制模塊,針對擴聲系統(tǒng) 中回聲所引起的正反饋放大現(xiàn)象,采用自適應濾波等方法進行回聲對消。發(fā)送線 路上的信號經(jīng)過降噪后再進行回聲消除處理,可減少噪聲和回聲對系統(tǒng)的干擾。 語音激活檢測的目的是檢測語音通信時是否有話音存在,在兩個用戶通話 時,從統(tǒng)計上來說,用戶發(fā)聲的時間只占總時間的一半,用戶在不說話時如果不 進行話音處理,不傳送語音包,可以大量節(jié)約網(wǎng)絡的帶寬。同時,在接收端,如 果系統(tǒng)發(fā)送給最終用戶的信號是什么也沒有,用戶會誤以為信號中斷了,所以一 般的i p 電話系統(tǒng)中如果處于靜音狀態(tài),接收端就要向用戶發(fā)送一個音量很小的噪 聲,使用戶感覺到系統(tǒng)仍然在工作,這種噪聲叫做舒適噪聲。 自動增益控制模塊能夠穩(wěn)定信號傳輸電平,使雙端或多端語音的音強與音質(zhì) 維持在一定的水平上。通過信號增益控制的處理,能夠根據(jù)輸入信號的電平大小 和指定的輸出電平來自動調(diào)整電平變化,并且不影響傳輸信號尤其是語音的質(zhì) 量,保證經(jīng)過處理后的語音可懂度不會發(fā)生波動。 1 4 工作流程與論文結(jié)構(gòu) 本論文的主要研究內(nèi)容是語音信號預處理系統(tǒng)中的自動增益控制模塊。重點 研究基于v a d ( v o i c ea c t i v i t yd e t e c t i o n ) 的a g c 算法和基于能量比較的a g c 算法,主要工作是將s p e e x 語音編碼算法中用到的自動增益控制算法在d s p 芯 片上實現(xiàn),應用于v o i p 系統(tǒng)的話機終端。這兩種a g c 算法,其制定者只給出了 基于c 語言的浮點算法參考代碼,因此在課題研究與實現(xiàn)的過程中,采用以下 兩個步驟完成工作: 1 把給出的浮點c 語言參考代碼轉(zhuǎn)化為定點c 語言代碼。一般情況下,把 浮點運算轉(zhuǎn)換為定點運算會帶來一定程度的精度的損失,因此需要采用合理的定 點化方法在保證數(shù)據(jù)動態(tài)范圍的情況下把精度損失控制在一定的范圍內(nèi)。在對 a g c 算法進行定點化的同時,需要進行一些優(yōu)化的工作,以減小算法的計算量, 主要包括以下兩個方面的優(yōu)化: ( 1 ) 算法級的優(yōu)化:用更優(yōu)的算法來取代參考代碼中的實現(xiàn)方式,從而降低算 法的時間復雜度和空間復雜度,改進算法的運算效率; ( 2 ) c 語言級的優(yōu)化:對定點化后的代碼進行優(yōu)化,提高代碼的執(zhí)行效率。 2 把相應的定點c 算法進行d s p 環(huán)境的搬移,即將c 語言代碼改寫成d s p 代碼,然后對計算量較大的模塊進行匯編語言級的優(yōu)化,盡可能地降低代碼的運 算復雜度,充分利用d s p 的特殊運算單元和運算指令以及并行計算的能力,對 匯編代碼進行優(yōu)化。 第9 頁共7 0 頁 北京郵電人學碩十研究生論文v o i p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) 圖1 - 6 是定點化過程的流程圖: 圖1 石定點化過程的流程圖 基于上面的流程,本論文接下來的各章安排如下:第二章簡要介紹幾種自動 增益控制算法原理,并對本課題中用到的兩種a g c 算法進行詳細的分析,第三 章介紹定點理論、定點運算和基本函數(shù)庫的實現(xiàn),第四章主要介紹開發(fā)平臺及 d s p 芯片的結(jié)構(gòu),第五章包含了自動增益控制算法的d s p 實現(xiàn)及優(yōu)化,并給出 了仿真的結(jié)果及調(diào)試情況,第六章則對整個論文工作進行總結(jié)。 第l o 頁共7 0 頁 北京郵電人學碩+ 研究生論文v o i p 系統(tǒng)中a g c 算法的研究與d s p 實現(xiàn) 第二章算法原理 2 1自動增益控制方法的比較 自動增益控制技術在數(shù)字通信、語音處理、測試設備等方面的應用是十分廣 泛的i 引。通信中傳輸信號的幅度經(jīng)常發(fā)生較大波動,通過a g c 可以優(yōu)化信號電 平,從而提高通信質(zhì)量。傳統(tǒng)的自動增益控制都是用模擬電路實現(xiàn)【1 0 l ,其性能很 大程度上受電路本身如響應時間、動態(tài)范圍等的限制【1 1 】。在a g c 系統(tǒng)中使用數(shù) 字信號處理方法【1 2 l 【1 3 1 ,可避免控制電路的影響,設計靈活、精度高、控制范圍 大l 圳,更有效地提高自動增益控制的性能。 自動增益控制是語音信號預處理系統(tǒng)的核心部分,下面是幾種假設。 首先,通過選取較長時間的語音為一幀來將靜音部分或噪音部分與語音部分 的能量平均,這樣可以減小每一幀與標準值的差值波動,達到穩(wěn)定效果。然而這 種做法,每幀要處理的數(shù)據(jù)太多,會有很大的延遲,不能很好地達到實時處理, 而且對語音的估計也不準確,不能達到標準值的補償效果。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論