（通信與信息系統(tǒng)專業(yè)論文）基于匹配追蹤的低碼率視頻編碼研究.pdf

上傳人：活*** IP屬地：寧夏上傳時間：2019-12-11 格式：PDF 頁數：66 大?。?.27MB 積分：0 舉報 版權申訴

（通信與信息系統(tǒng)專業(yè)論文）基于匹配追蹤的低碼率視頻編碼研究.pdf_第2頁

（通信與信息系統(tǒng)專業(yè)論文）基于匹配追蹤的低碼率視頻編碼研究.pdf_第3頁

（通信與信息系統(tǒng)專業(yè)論文）基于匹配追蹤的低碼率視頻編碼研究.pdf_第4頁

（通信與信息系統(tǒng)專業(yè)論文）基于匹配追蹤的低碼率視頻編碼研究.pdf_第5頁

已閱讀5頁，還剩61頁未讀，繼續(xù)免費閱讀

（通信與信息系統(tǒng)專業(yè)論文）基于匹配追蹤的低碼率視頻編碼研究.pdf.pdf 免費下載

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

西南交通大學碩士研究生學位論文第l 頁摘要目前幾乎所有的視頻編碼核心技術都是采用運動補償加離散余弦變換編碼的方式。然而基于離散余弦變換的視頻編碼在低碼率下將產生嚴重的塊效應，雖然后來提出的重疊塊運動補償和離散小波變換編碼算法減少了塊效應，但在低碼率時，以上算法對塊效應的有效性降低。而用匹配追蹤算法代替離散余弦變換能有效減少塊效應。相對于傳統(tǒng)的信號分解方法，稀疏分解方法表示信號更加簡潔，近幾年成為信號處理領域研究的熱點。本文首先簡要闡述視頻編碼標準和信號稀疏分解的思想及其應用；然后研究基于匹配追蹤的視頻編碼算法，在此基礎上設計本文的編碼方案并進行仿真。基于匹配追蹤的稀疏分解是一個典型的n p 問題，計算復雜度高是其應用瓶頸?，F有的基于匹配追蹤的視頻編碼算法采用編碼字典代替過完備原子庫，一定程度上提高了編碼速度，但計算量仍然很大。本文通過仿真比較選取更適合圖像信號的非對稱原子庫，同時分析其原子結構特性。比較遺傳算法和蟻群算法性能，選取速度更快的遺傳算法；然后分析殘差信號特性，設計合適的遺傳算法進化準則。在采用遺傳算法快速選取最佳原子時，結合原子能量分布集中的特性，代替編碼字典方法，有效的降低了視頻編碼的復雜度。最后分析每個系數的分布規(guī)律，設計相應的量化編碼方案。仿真結果證明在低碼率時，本文方案能有效的提高視頻編碼速度，同時保證了視頻編碼質量。關鍵字：視頻編碼；稀疏分解；匹配追蹤；遺傳算法西南交通大學碩士研究生學位論文第l f 頁 - _ - i - - - - _ - _ _ _ _ - - - - - _ _ - - - - - v _ - - _ _ - _ l _ - _ _ - _ _ _ _ i - _ _ - i l l l - l _ _ _ _ l _ _ l _ _ - _ - i _ _ - - i _ - _ _ - _ _ - _ _ - l _ l _ _ - a b s t r a c t c u r r e n t l y , t h ec o r et e c h n o l o g i e so fa l m o s ta l lv i d e oc o d i n gm e t h o d sa r eb a s e d o nah y b r i ds y s t e mo fm c ( m o t i o nc o m p e n s a t i o n ) a n dd c t ( d i s c r e t ec o s i n e t r a n s f o r m ) d c t - b a s e dv i d e oc o d i n gw i l lc a u s es e v e r eb l o c k i n ge f f e c tw h e ni nl o w b i t r a t e s a l t h o u g h t h e s u b s e q u e n t l yp r o p o s e d o v e r l a p p i n g b l o c km o t i o n c o m p e n s a t i o nt e c h n o l o g ya n d d i s c r e t ew a v e l e tt r a n s f o r mc o d i n ga l g o r i t h m i m p r o v e di t , t h ee f f e c t i v e n e s so ft h ea b o v ea l g o r i t h m st ob l o c k i n ge f f e c tr e d u c e sa t l o wb i t - r a t e s h o w e v e r , t h er e p l a c e m e n to fd c tb ym p ( m a t c h i n gp u r s u i 0 a l g o r i t h mr e d u c e sb l o c k i n ge f f e c te f f e c t i v e l y c o m p a r e d 、衍t h t r a d i t i o n a lm e t h o d so f s i g n a ld e c o m p o s i t i o n , s i g n a l e x p r e s s i o no fs p a r s ed e c o m p o s i t i o nm e t h o di sm o r ec o m p a c ta n db e c o m i n ga r e s e a r c hh o t s p o ti ns i g n a lp r o c e s s i n gf i l e di nr e c e n ty e a r s f i r s t l y , t h ee s s a ys t a t e s t h ed e v e l o p m e n to ft h ev i d e oc o d i n gs t a n d a r d sb r i e f l y , a n di n t r o d u c e st h ei d e aa n d a p p l i c a t i o no fs p a r s ed e c o m p o s i t i o n t h e nt h ee s s a yr e s e a r c h e sm p - b a s e dv i d e o c o d i n ga l g o r i t h m ，d e s i g n sc o d i n gs c h e m eo f t h i sp a p e ra n dp e r f o r m se m u l a t i o n t h en i p b a s e ds p a r s ed e c o m p o s i t i o ni sa ni d e n t i c a ln pp r o b l e m ，t h eh i g h c o m p u t a t i o n a lc o m p l e x i t yi si t sb o t t l e n e c k t h ec u r r e n tm p - b a s e dv i d e oc o d i n g a l g o r i t h mu s e se o d e b o o kt or e p l a c eo v e r - c o m p l e t ed i c t i o n a r ya n di m p r o v e sc o d i n g s p e e dt oac e r t a i ne x t e n t ，b u ti t sc o m p u t a t i o ni ss t i l lm a g n i t u d e t h ep a p e rs e l e c t s n o n - s y m m e t r i c a t o m i cd i c t i o n a r yt h a ti sm o r es u i t a b l ef o ri m a g es i g n a l b y s i m u l a t i o nc o m p a r i s o n , a n da n a l y z e st h ec h a r a c t e r i s t i c so fa t o m i cs t r u c t u r e t h e p e r f o r m a n c eo fg e n e t i ca l g o r i t h ma n da n tc o l o n ya l g o r i t h mi sc o m p a r e d ，a n dt h e f a s t e rg e n e t i ca l g o r i t h mi ss e l e c t e d t h e n ，t h ee s s a ya n a l y z e st h ec h a r a c t e r i s t i c so f r e s i d u a ls i g n a l ，a n dd e s i g n sa p p r o p r i a t eg u i d e l i n e sf o rt h ee v o l u t i o no fg e n e t i c a l g o r i t h m w h e nu s i n gg e n e t i ca l g o r i t h mt os e l e c tt h eb e s ta t o m t h ep a p e rc o m b i n ew i m t h ea t o m i ce n e r g yc o n c e n t r a t e dl a w sr e p l a c i n gc o d e b o o k ，a n de f f e c t i v e l yr e d u c e s t h ec o m p u t a t i o n a lc o m p l e x i t y f i n a l l y , t h ee s s a ya n a l y z e st h ed i s t r i b u t i o nr u l eo f d e c o m p o s i t i o nc o e 伍c i e n t s ，a n dd e s i g n sc o r r e s p o n d i n gq u a n t i z e d a n dc o d i n g s o l u t i o nb a s e do ni t 西南交通大學碩士研究生學位論文第| li 頁 t e s tr e s u l t sv e r i f i e dt h a tt h es o l u t i o no ft h ee s s a yi sa b l et oi m p r o v ec o d es p e e d e f f e c t i v e l ya sw e l l 雒e 1 1 s u r et h eq u a l i t yo fv i d e oc o d i n g k e yw o r d s ：v i d e oc o d i n g ；s p a r s ed e c o m p o s i t i o n ；m a t c h i n gp u r s u i t ；g e n e t i c a l g o r i t h m 西南交通大學學位論文版權使用授權書本學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定，同意學校保留并向國家有關部門或機構送交論文的復印件和電子版，允許論文被查閱和借閱。本人授權西南交通大學可以將本論文的全部或部分內容編入有關數據庫進行檢索，可以采用影印、縮印或掃描等復印手段保存和匯編本學位論文。本學位論文屬于 1 保密口，在年解密后適用本授權書； 2 不保密囤，使用本授權書。 ( 請在以上方框內打“ ) 囂蛩鬻，霧畔囂撇：剮日期：加。7 ，o f 口日期：。 j 弦識。f 。t 比- 西南交通大學學位論文創(chuàng)新性聲明本人鄭重聲明：所呈交的學位論文，是在導師指導下獨立進行研究工作所得的成果。除文中已經注明引用的內容外，本論文不包含任何其他個人或集體已經發(fā)表或撰寫過的研究成果。對本文的研究做出貢獻的個人和集體，均已在文中作了明確的說明。本人完全意識到本聲明的法律結果由本人承擔。本學位論文的主要創(chuàng)新點如下： 1 論文將快速選取原子的遺傳算法應用于基于匹配追蹤的低碼率視頻編碼方案中，同時結合原子能量分布集中的特性，代替原基于匹配追蹤的低碼率視頻編碼方案中的編碼字典方法；并根據殘差信號特性設計合適的遺傳算法進化準則。 2 分析本文方案的分解系數規(guī)律，其中投影分量采用排序差分脈沖編碼；縮放、位移、旋轉參數和編碼塊位置索引采用自適應算術編碼。歲旃世年加。9 o 岡西南交通大學碩士研究生學位論文第1 頁 1 1 論文選題背景第1 章緒論在數字化信息時代，多媒體通信已成為信息交流的重要手段。通過公用電話網、互聯(lián)網和無線來傳輸視頻信息是視頻通信發(fā)展的趨勢，諸如多媒體會議、可視電話、遠程監(jiān)控、視頻點播和無線視頻等業(yè)務。在實際中，大多數通信信道都是低碼率信道，如目前廣泛應用的公用電話網( p u b l i cs w i t c h e dt e l e p h o n y n e t w o r k s ，p s t n ) 和個人通信網( p e r s o n a lc o m m u n i c a t i o ns e r v i c e ，p c s ) 等網絡，在這些網絡上傳輸視頻信息，如可視電話和現場監(jiān)控等，將會帶來巨大的經濟效益。然而現有的視頻編碼標準在這些環(huán)境下傳輸的視頻質量不能令人滿意。因此，在有限帶寬和惡劣的通信環(huán)境下，對低碼率視頻編碼技術的研究變得尤為重要。近二十年來，圖像視頻編碼技術得到了迅速發(fā)展和應用，其標志就是幾個關于圖像視頻編碼的國際標準的制定，如關于靜止圖像的編碼標準j p e g 、 j p e g 2 0 0 0 和視頻編碼標準h 2 6 1 、h 2 6 3 、h 2 6 4 、m p e g 2 和m p e g - 4 等。這些標準融合了各種性能優(yōu)良的圖像視頻編碼算法，代表了目前圖像視頻編碼的發(fā)展水平，并且得到了廣泛的應用。這些視頻編碼標準的核心技術基本都是采用的運動補償加離散余弦變換編碼的方式；然而由于預測值的誤差和對變換系數粗糙的量化，解碼的視頻幀將會出現偽邊緣和方塊效應【l j ，在低碼率情況下更加明顯。雖然提出了許多改進算法，如m o h m 和z h a n gx u d o n g 提出的重疊塊運動補償( o m c ) 【2 】和離散小波變換( d w t ) 1 3 編碼算法，但在低碼率下這些算法還是難以勝任。由于匹配追蹤( m a t c h i n gp u r s u i t ，m p ) 1 4 j 優(yōu)良的特性，用m p 取代d c t 能取得較好效果。，稀疏分解【4 ，5 】是近1 0 多年才發(fā)展起來的一種信號表示理論，其基本思想就是將信號在過完備原子庫上分解。m p 算法原理簡單、易于理解、計算復雜度也是所有稀疏分解算法中最低的，因此也是目前應用最為廣泛的稀疏分解 ( s p a r s ed e c o m p o s i t i o n ) 方法。由于信號稀疏分解的優(yōu)良特性，稀疏分解已經被應用到信號處理的許多方面，如信號去噪、微弱信號檢測、陣列信號處理以及低碼率下的圖像視頻壓縮等方面。目前國內外關于基于稀疏分解的圖像壓縮西南交通大學碩士研究生學位論文第2 頁的研究己取得一定進展，而在視頻編碼方面的研究還處于起步階段。 1 2 研究現狀由于通信信道帶寬限制，低碼率下傳輸圖像視頻一直是人們研究的熱點和難點。稀疏分解思想的提出，由于其在信號分解中表現出的良好特性，引起了學者們關注。 r a l p hn e 行和a v i d e hz a k h o r 于1 9 9 7 年提出用m p 算法編碼幀間位移殘差 ( d i s p l a c e df r a m ed i f f e r e n c e ，d f d ) 信號的算法，采用編碼字典代替原子庫方法，在甚低碼率下與h 2 6 3 標準相比得到更好的峰值信噪比( p e a k s i g n a l - t o n o i s er a t i o ，p s n r ) 和視覺效果，其重建圖像的塊效應和偽邊緣明顯減少，證明m p 算法在低碼率視頻編碼的良好性能。陸俊和阮秋琦【7 j 在r a l p hn e f f 和a v i d e hz a k h o r 的算法基礎上提出一種區(qū) 域追蹤匹配算法( r e g i o nm a t c h i n gp l l r s l l i t r m p ) ，通過自學習優(yōu)化g a b o r 匹配集，與n e f f 和z a k h o r 提出的算法相比，在保證視頻編碼質量的同時一定程度上提高了編碼效率。 2 0 0 4 年a d e lr a h m o u n e 8 】等人提出的基于三維的匹配追蹤高級可分級視頻編碼方案，與m p e g 4 ( f g s ) 相比，m p 3 d ( t h r e e d i m e n s i o n a lm a t c h i n gp u r s u i t ) 提供了更加靈活的可分級編碼，這歸功于其多分辨率的原子結構，同時可得到更好的視頻質量；與基于塊的d c t 變換編碼和基于小波變換編碼相比，有更少的塊效應和偽邊緣。 2 0 0 4 年m o s c h e t t i f 和s u g i m o t o k n 等人采用非對稱原子庫取代以往g a b o r 原子庫編碼d f d 信號，同時采用編碼字典和區(qū)域匹配追蹤方法，有效提高了編碼速度。與h 2 6 4 a v c 標準相比，該方法使得編碼效率提高了1 0 2 0 。 2 0 0 6 年h a o x i a n gz h a n g 和x i a o p e n gw a n g 1 0 等人對h 2 6 4 a v c 的d f d 信號先做小波變換，然后再對小波系數進行匹配追蹤，與h 2 6 4 a v c 標準相比，同樣取得較高的編碼效率。 2 0 0 7 年j i a n l i a n gl i n 和w e n l i a n gh w a n g 1 1 等人提出用原子庫的特征函數近似表示原子，同時結合兩階段向量量化方法來選取原子，在h 2 6 3 標準中的無限制運動矢量和高級預測模式下仿真實現，有效提高了編碼速度。隨著稀疏分解思想不斷深入的研究，推動了其在低碼率下的視頻編碼的應西南交通大學碩士研究生學位論文第3 頁用，國內外也提出許多優(yōu)良的相關算法睜1 2 1 。上述這些算法雖然在低碼率情況下獲得了較好的視頻質量，但是由于稀疏分解的計算復雜度非常高，在分解速度上還有待進一步提高。稀疏分解是一種比較新的思想，還在不斷的發(fā)展中，許多快速的稀疏分解算法都未應用到低碼率視頻編碼中。所以基于匹配追蹤的低碼率視頻編碼還有待學者們的進一步研究。 1 3 本文主要工作本文針對基于m p 的視頻編碼計算量大、系數的量化編碼等問題進行深入的學習，設計了基于遺傳算法的快速m p 低碼率視頻編碼方案和相應的量化編碼方案，主要探討和分析快速計算m p 信號的稀疏分解算法和分解系數分布規(guī) 律。本文具體工作如下： 1 學習h 2 6 4 視頻標準，熟悉相關技術及其標準測試模型( j m ) ，在標準測試模型下仿真實現本文設計的方案。學習稀疏分解思想，理解m p 算法原理及其應用。 2 理解現有的基于匹配追蹤的視頻編碼算法，分析其編碼原理和優(yōu)缺點，設計本文編碼方案。比較非對稱原子庫和g a b o r 原子庫的特性，根據仿真結果選取較好的原子庫。 3 分析m p 的快速算法：理解遺傳算法( g e n e t i ca l g o r i t h m ，g a ) 、蟻群算法( a n tc o l o n y a l g o r i t h m ) ，然后通過仿真比較它們的分解速度以及信號重建的p s n r ；分析d f d 信號特性，設計合適的g a 進化準則，對d f d 信號進行仿真。分析原子能量特性，利用該特性進一步降低復雜度。 4 分析視頻信號經m p 分解后的每個系數分布規(guī)律，根據分布規(guī)律給出相應的量化編碼方案。 1 4 本文組織本論文一共分五章，各章具體內容如下：第一章緒論。介紹論文的選題背景，包括研究意義、國內外現狀分析；然后介紹本文主要工作，包括主要研究內容、采取的方法。第二章視頻編碼標準和稀疏分解簡介。首先闡述視頻編碼標準的發(fā)展史，西南交通大學碩士研究生學位論文第4 頁介紹h 2 6 4 標準框架以及所用到的核心技術。最后分析h 2 6 4 標準產生方塊效應的原因，h 2 6 4 去方塊效應的策略，以及本文采取的方案。然后介紹稀疏分解的基本概念、原理和方法。最后介紹m p 算法的應用。第三章基于匹配追蹤的低碼率視頻編碼。本章首先介紹本文低碼率下基于m p 視頻編碼的原理。接著分析m p 算法的常用的原子庫以及本文為什么選擇非對稱原子庫。第三節(jié)介紹m p 的快速分解算法，著重對遺傳算法、蟻群算法進行學習，通過實驗比較這兩種算法的優(yōu)缺點；然后根據d f d 信號特性設計相應的g a 進化準則，結合原子能量特性進行仿真。最后給出本章小結。第四章量化編碼和仿真結果。第一節(jié)通過仿真分析分解參數的分布規(guī)律，設計相應的量化編碼方案，并對量化編碼方案進行驗證。第二節(jié)對本文方案進行仿真，與h 2 6 4 a v c 和其它參考文獻做比較分析。第五章結論與展望，總結課題完成的內容，并展望進一步的工作。西南交通大學碩士研究生學位論文第5 頁第2 章視頻編碼和稀疏分解簡介 2 1 視頻編碼簡介 2 1 1 視頻編碼標準的發(fā)展人類獲取的信息中7 0 來自于視覺，在多媒體信息中視頻信息占有重要地位。隨著社會經濟的不斷發(fā)展，人們希望看到高質量低時延的視頻畫面；同時硬件的處理性能和網絡速度的提高，都推動了視頻編碼技術的發(fā)展。國際電信聯(lián)盟( i t u ) 和國際標準化組織( i s o ) 制定了一系列視頻編碼標準。其中h 2 6 1 、 h 2 6 3 、m p e g 1 、m p e g 2 屬于第一代編碼標準，壓縮能力為5 0 - - - 7 0 倍； m p e g 4 、h 2 6 4 a v c 屬于第二代編碼標準，壓縮效率提高到1 0 0 - - 1 5 0 倍。2 0 0 2 年，我國也開始制定具有自主產權的音視頻信源標準a v s ，并于2 0 0 6 年3 月1 日起正式實施。國際上視頻編碼標準主要有兩大系列：國際電信聯(lián)盟制定的h 2 6 x 系列標準；國際標準化組織和國際電工委員會第一聯(lián)合技術組( i s o i e c j t c l ) 制定的m p e g x 系列標準。 2 1 1 1h 2 6 x 系列標準 h 2 6 x 是由i t u t 制定的一系列視頻編碼標準，包括h 2 6 1 、h 2 6 3 以及 h 2 6 4 a v c 等，其中h 2 6 4 a v c 是由i t u t 的視頻編碼專家組v c e g 和 i s o i e c 的活動圖像專家組m p e g 共同成立的聯(lián)合視頻小組t 聯(lián)合制定的。 h 2 6 1t 1 3 j 是針對可視電話和視頻會議等業(yè)務的視頻編碼標準，主要是在窄帶i s d n 上實現速率p 6 4 k b p s 的雙向聲像業(yè)務。h 2 6 1 標準是視頻編碼的里程碑，得到了廣泛的應用。隨后i t u t 、i s o 和a v s 工作組等公布的一系列視頻編碼標準的編碼方法都是基于h 2 6 1 中的混合編碼方法和編碼結構。h 2 6 1 中主要采用了1 6 1 6 微塊的運動補償、8 8 的d c t 、z z 掃描、游程編碼和變長編碼等核心技術。h 2 6 1 制定的時候，硬件和軟件處理器性能有限，因此它的復雜度較低。然而，它的缺點是壓縮率低和缺乏靈活性。西南交通大學碩士研究生學位論文第6 頁 h 2 6 3 1 1 4 j 標準主要針對低比特率視頻應用，目標是為了進一步提高編碼性能。h 2 6 3 使用了半像素運動矢量和重新設計的可變長編碼( v l c ) 表。此外，更多的幀大小和可選的編碼模式給應用提供了更大的靈活性。目前，h 2 6 3 已經取代h 2 6 1 ，成為視頻會議編解碼的主宰。 h 2 6 4 a v c t ”】的目標是為了顯著增強編碼效率，為下一代視頻編碼提供解決方案。h 2 6 4 a v c 減少了h 2 6 3 中一些混亂的可選模式。h 2 6 4 a v c 的主要技術特征有：4x4 塊的整數變換、多參考幀預測、多模式高精度幀間預測、多種幀內預測模式和統(tǒng)一的熵編碼等。與以往標準相比，n 2 6 4 a v c 壓縮比更高和信道適應性更好，它將會在視頻通信領域得到廣泛的應用。但是 h 2 6 4 a v c 優(yōu)越性能是以計算復雜度大大增加來換取的。 2 1 1 2m p e g x 系列標準 m p e g 1 1 m 】是一個直接與數字電視廣播有關的高質量圖像和聲音編碼標準，視頻部分主要針對1 5 m b p s 的數字聲像信息的存儲。它通常用于能夠提供家用錄像質量( v h s ) 視頻節(jié)目的光盤存儲系統(tǒng)。m p e g 1 同樣也繼承了h 2 6 1 標準的技術結構，同時添加了自己的技術特征：雙向預測、半像素運動、片結構編碼和加權矩陣量化等。 m p e g 2 【l7 】標準為高級工業(yè)標準的圖象質量以及更高的傳輸率而制定。它解決了m p e g 1 許多技術要求上的缺陷，能在很寬范圍內對不同分辨率和不同輸出比特率的圖像信號有效地進行編碼。m p e g 2 增加的新技術特征有：支持隔行掃描視頻的編碼、對電視質量視頻的有效編碼、增加d c 量化精度、可擴展性( 空間域可擴展性、s n r 可擴展性、數據分割) 等。m p e g 2 標準廣泛應用于高清晰電視( | 玎) t v ) 和d v d ，是工業(yè)標準d v d 的核心標準。但其壓縮率不高。 m p e g - 4 1 1 8 】標準不僅是針對一定比特率下的視頻、音頻編碼，更加注重多媒體系統(tǒng)的交互性和靈活性。m p e g - 4 采用第二代編碼方法，它不同于以往的基于像素的第一代編碼方法的標準。m p e g 4 編碼的基本單元是視頻對象，主要采用形狀編碼、紋理編碼、運動信息編碼和s p r i t e 編碼方法。m p e g - 4 廣泛應用于數字電視、交互式的圖形應用和交互式多媒體領域，然而，目前大量的應用只使用了簡單對象類型，標準中的基于內容特點的編碼受到了限制。西南交通大學碩士研究生學位論文第7 頁 2 1 1 3 視頻編碼的中國標準：a v s 標準 a v s 1 9 , 2 0 標準是我們國家于2 0 0 2 年開始制定的國家標準。標準中涉及視頻編碼的有獨立的兩部分：a v s l p 2 1 1 9 1 ，主要針對高清晰數字電視廣播和高密度存儲媒體應用；a v s l - p 7 1 2 0 1 ，主要針對低碼率、低復雜度、較低圖像分辨率的移動媒體應用。視頻通信的發(fā)展是從屬于通信網的。通信網今后主要向口方向、個人通信方向、無線通信方向、智能方向以及多媒體方向發(fā)展，這也是視頻通信的發(fā) 展方向，將來的視頻通信無處不在?，F在有越來越多的運營商、制造商認識到這一點，視頻通信正逐漸成為運營商的一個戰(zhàn)略重點。 2 1 2h 2 6 4 a v c 標準概述 h 2 6 4 a v c 的提出是為了滿足各種應用( 如：視頻會議、數字存儲媒體、電視廣播、互聯(lián)網絡流動) 中日益增長的對運動圖像更高的壓縮要求的需要。 h 2 6 4 能使編碼的視頻顯示以靈活的方式應用于多樣化的網絡環(huán)境。它的運用允許運動視頻可以按計算機數據格式進行處理，能夠在各種存儲媒體上存儲，并能通過各種網絡信道進行分配、傳輸和接收。h 2 6 4 極大地降低了發(fā)送視頻圖像所需要的帶寬，并對諸如數字衛(wèi)星廣播、數字視頻存儲以及互聯(lián)網傳播等一系列改進，以提高視頻質量。本文的基本框架也是用的h 2 6 4 標準的編碼框架，因此下面先簡略介紹該標準。 2 1 2 1 編解碼器結構 h 2 6 4 a v c 沒有明確定義編解碼器，與以前的標準一樣，而是著重定義了編碼視頻位流的語法及對這種位流解碼的方法。h 2 6 4 a v c 大部分的基本功能模塊與以前標準采用技術相同，包括預測、變換和熵編碼等；其重要變化體現在每個功能模塊實現的細節(jié)上。實際上，編碼器和解碼器應能實現一些基本功能，大致包括的功能模塊如圖2 1 和圖2 2 所示【2 1 1 ，同時這些基本模塊也需要包含在兼容的編解碼器。 h 2 6 4 a v c 是目前最優(yōu)秀的視頻編碼標準，所以本文選取該標準為基本框架進行仿真，沿用了它的預測模式、運動估計和運動補償等技術。區(qū)別在于本西南交通大學碩士研究生學位論文第8 頁文將用m p 分解替代它的d c t 變換方法，由于分解后的系數不一樣，所以本文的量化編碼方案也不同。h 2 6 4 a v c 標準主要是通過量化步長來控制碼率，而本文方案需通過控制編碼原子數和預測模式來達到這一目的，所以碼率控制也不同。圖2 - 1h 2 6 4 a v c 編碼器 2 1 2 2 分層結構圖2 2h 2 6 4 a y c 解碼器 h 2 6 4 a v c 的目標應用涵蓋了目前大部分的視頻服務，不同的服務所用的網絡很可能不同。為了能夠適用于這些不同的網絡結構，h 2 6 4 a v c 標準概念上可分為兩層：視頻編碼層( v i d e oc o d i n gl a y e r ，v c l ) 和網絡提取層( n e t w o r k a b s t r a c t i o nl a y e r ，n a l ) 。 v c l 負責視頻內容核心壓縮編碼部分的描述，而n a l 負責使用下層網絡的分段特性來封裝數據，這樣網絡相關的信息和視頻壓縮信息相互獨立，使網絡對于v c l 層是透明的。這樣的結構能夠好地適應網絡數據信息的封裝和對西南交通大學碩士研究生學位論文第9 頁信息進行更好的視頻流優(yōu)先級分類控制。h 2 6 4 的分層編碼傳輸結構如圖2 3 【2 2 】所示。編碼l 存取層接口解碼 h 2 6 4 概念層 vc l 網絡提取層ii網絡提取層i nal 存取層編碼接口i 存取層解碼接口區(qū) h 3 2omp eg 2rtp i pt cp i ph 3 23 i ph 3 24 m 有線網乏膂 1 “、圖2 3h 2 6 4 a v c 分層結構 2 1 2 3 檔次與級為了適應不同網絡結構，h 2 6 4 a v c 采用了分層結構；而為了適應不同服務需求( 主要是視頻質量) ，h 2 6 4 a v c 則采用了檔次與級l 2 3 j 的方法。 h 2 6 4 a v c 標準定義了三個檔次( p r o f i l e ) 的視頻編碼，每個檔次支持特定的應用，并且每個檔次規(guī)定了對相應編碼器和解碼器的要求。其中基本檔次支持i 片和p 片編碼和基于上下文的自適應的變長編碼。主要用于可視電話、會議電視、無線通信等實時視頻通信。而主要檔次除了支持i 片和p 片，還增加了b 片編碼方式，同時支持自適應的算術編碼和隔行視頻。主要用于數字廣播電視與數字視頻存儲。擴展檔次主要應用于是流媒體服務，這是因為它增加了一些在進行比特流切換時有效的幀模式幀s i ( s w i t c h i n gi ) 和s p ( s w i t c h i n g p ) 幀，能夠有效的提高從錯誤中恢復的能力。但該檔次不支持交錯視頻和 c a b a c 。每一個檔次設置不同的參數，如取樣速率、圖像尺寸、編碼比特率等，就得到對應的編解碼器性能的不同級別。每個級別都規(guī)定了一組對標準中語法成員( s y n t a xe l e m e n t ) 所采用的各種參數值的限制。所有檔次都使用相同的一組級別定義，但是單獨的一個實現可以對不同的檔次支持不同的級別。在給定西南交通大學碩士研究生學位論文第10 頁的p r o f i l e 下，級別通常與解碼器的處理能力和內存容量相對應。 2 1 2 4 采用的新技術與以往標準相比，在相同失真率條件下h 2 6 4 a v c 的編碼效率提高了5 0 左右。之所以性能有這么大的提高，是因為h 2 6 4 a v c 繼承了h 2 6 3 、m _ p e g l 、 m p e g 2 和m p e g 4 優(yōu)點的同時采用了許多新技術。首先h 2 6 4 兒w c 采用不同大小和形狀的宏塊分割與亞分割方法。如一個宏塊的亮度值可以按照1 6 x 1 6 、1 6 x 8 、8 x 1 6 、8 x 8 ：8 x 8 的分割又可以按照8 x 8 、 8 x 4 、4 x 8 、4 x 4 進行亞分割。對不同的分割塊采用不同的預測方式，這種小尺寸、多模式預測以及多參考幀使得預測精確度更高，大大減少了圖像的時間和空間冗余，能提高圖像編碼效率和質量，又可以減小變換過程中的計算量。其次h 2 6 4 a v c 中的d c t 變換與以往的標準有所不同，它采用的變換是基于4 x 4 塊的整數操作而不是實數運算。h 2 6 4 主要采取三種方式對每一個4 x 4 塊進行整數變換，即4 x 4 塊殘差a c 變換，4 x 4 亮度d c 系數離散哈達碼( d i s c r e t e h a d m a r dt r a n s f o r i l l ，d h t ) 變換( 1 6 x 1 6 幀內模式下1 6 個4 x 4 塊的d c 系數組成的二次4 x 4 塊) ，2 x 2 色度d c 系數d h t 變換。傳統(tǒng)的d c t 變換以8 x 8 像素塊為基本單元，變換過程采用復雜的浮點運算，因取舍誤差引起像素值漂移，造成反變換失配。較大的像素塊變換時不僅計算量大，還會因為鄰塊間相關性降低、強度不連續(xù)而出現塊效應。第三，h 2 6 4 a v c 根據視頻內容的不同，使用了以下幾種熵編碼方式：基于上下文的自適應變長編碼( c o n t e x t b a s e da d a p a t i v ev a r i a b l el e n g t hc o d i n g c a v l c ) 和通用變字長編碼( u n i v e r s a lv a r i a b l el e n g t hc o d i n g u v l c ) 相結合的編碼，基于上下文的自適應二進制算術編碼( c o n t e x t b a s e da d a p a t i v e c o d i n g ，c a b a c ) 。而以往的標準的熵編碼采用變長的霍夫曼編碼，碼表統(tǒng)一，不能適應變換多端的視頻內容，影響編碼效率。這三項新技術是h 2 6 4 a v c 編碼效率大大提高的原因，但是它的代價是高度的復雜性。 2 1 3 塊效應 h 2 6 4 視頻編碼核心技術也是采用的運動補償( m o t i o nc o m p e n s a t i o n ，m c ) 西南交通大學碩士研究生學位論文第”頁加離散余弦變換( d i s c r e t ec o s i n et r a n s f o r m ，d c t ) 編碼的方式?；赿 c t 的視頻編碼在低碼率下將產生嚴重的塊效應。本文用m p 算法取代d c t 變換就是致力于解決上述問題。 2 1 3 1 塊效應產生原因 h 2 6 4 a v c 視頻編碼標準中，低碼率時圖像會出現方塊效應。其產生的原因主要有兩個。其一是對基于塊的預測殘差的整數d c t 變換，然后用大的量化步長對變換系數進行量化，因而反量化后恢復的變換系數存在誤差，會造成在圖像塊邊界上的視覺不連續(xù)。第二個原因是運動補償預測，運動補償塊是經過預測而得，它們可能是從不同幀的不同位置上的內插樣點數據復制而來。這些經過預測內插得到的數據存在一定誤差，所以就會在復制塊的邊界上產生數據不連續(xù)。同時，參考幀中存在的邊界不連續(xù)也被復制到需要補償的圖像塊內。若不進行處理，這種誤差會隨著重構幀積累下去，從而嚴重地影響圖像的質量和壓縮效率。因此，h 2 4 6 a v c 標準引入去環(huán)路濾波器來降低方塊效應。 2 1 3 2 去塊效應策略大的量化步長會造成相對較大的量化誤差，這就可能將原來相鄰塊“接壤” 處像素間灰度的連續(xù)化變成了“臺階”變化，主觀上就有“偽邊緣”的方塊效應。去方塊效應的方法就是在保持圖像總能量不變的條件下，把這些臺階狀的階躍灰度變化重新復原成臺階很小或者近似連續(xù)的灰度變化，同時還必須盡量減少對真實圖像邊緣的損傷。常用的去方塊濾波器有兩種：后置濾波器和環(huán)路濾波器。h 2 6 4 幾w c 引入了環(huán)路濾波器。相對于后置濾波器，在編碼環(huán)和解碼環(huán)中使用去塊效應濾波系統(tǒng)主要有三個優(yōu)點：一是圖像中由于運動補償、變換及量化產生的虛假邊界可以被平滑，降低了圖像的塊效應，提高了主觀視覺效果；二是濾波后的幀用于后續(xù)幀的運動補償預測，避免了虛假邊界積累誤差導致的圖像質量進一步降低；三是在解碼器端沒有必要再為濾波器準備額外幀緩存i l 】。 h 2 6 4 a v c 中整數d c t 變換是基于4 x 4 的，所以濾波器是以4 x 4 塊為單元處理的。首先判斷是偽邊緣還是圖像真實邊緣，若是偽邊緣則按照先垂直后水平的順序濾波，若是真實邊緣則不濾波。按照先橫向后縱向，先亮度后色度的順序。h 2 6 4 a v c 能在幾個等級上進行自適應的去方塊濾波；分別是片層等西南交通大學碩士研究生學位論文第12 頁級( s l i c el e v e l ) 、方塊邊緣等級( b l o c k e d g el e v e l ) 和采樣點等級( s a m p l e l e v e l ) 。環(huán)路濾波器的復雜度是很高的。即使經過優(yōu)化，去除其中的乘除法，濾波器也輕易地達到解碼器計算復雜度的三分之一1 1 ，這也是h 2 6 4 a v c 高復雜度的原因之一。 2 133 本文策略通過以上分析在低碼率時，h 2 6 4 a v c 將會產生嚴重的塊效應，標準采取了環(huán)路濾波，在一定程度上改善了視頻質量，但在低碼率時，環(huán)路濾波的效果也不理想。這也促使人們從其它角度研究降低塊效應的方法。匹配追蹤是一種稀疏分解的思想，其基本原理是用少數原子來逼近信號直到達到一定能量閾值，同時首先得到的原子是信號在原子庫上投影分量最大的，即對圖像視頻而言，重要的信息可由最先的幾個原子表示。由于匹配追蹤具備這些優(yōu)良的特性，使得它非常適合在低碼率下的視頻編碼。本文用匹配追蹤取代d c t 來分解視頻原始信號或殘差信號，實驗結果表明，在同等碼率條件下，這種方案獲得的圖像質量更好。 2 2 信號的稀疏分解在進行通信的過程中，為了有效地利用信號，往往需要對信號進行各種各樣的處理。其中信號分解( s i g n a ld e c o m p o s i t i o n ) 和信號表達( s i n g a l r e p r e s e n t a t i o n ) 是信號處理中的根本性問題，具有非常重要的意義。信號分解將復雜信號分解成一些基本信號，是信號分析中一種常用、有效的手段。傳統(tǒng) 的信號分解變換是將信號分解在一組完備的正交基上，而且這種變換必然是可逆的，如傅立葉變換，短時傅立葉變換，小波變換等。隨著現代信號處理技術的發(fā)展，近年來信號的非正交分解引起研究者越來越多的興趣。為了實現對信號更加靈活、簡潔和自適應的表示，在小波分析的基礎上，m a l l a t 、z h a n g 【4 j 和c o i f m a n 、w i c k e r h a u s e r t 5 】提出了信號在過完備庫上分解的思想，開創(chuàng)了信號分析的新方向。西南交通大學碩士研究生學位論文第13 頁 2 2 1 稀疏分解思想在信號處理的應用中，都希望找到一種稀疏的數據表示方法，更加靈活、簡潔和自適應的來表示信號。c o i l f m a n 和w i c k e r h a u s e r 等提出了稀疏分解的概念，隨后m a l l t 和z h a n g 在小波分析的基礎上提出了應用過完備冗余原子庫對信號進行匹配追蹤的思想。稀疏分解的基本思想就是：基函數用稱之為過完備的冗余函數取代。為了得到信號的稀疏表示，基的構造必須使得基在信號組成的空間中足夠的密。因此，基的正交性將不再被保證，所以此時的基也不再是真正意義上的基了，而改稱為原子。由這些原子組成的集合，是過完備的，被稱為過完備庫( o v e r c o m p l e t ed i c t i o n a r yo fa t o m s ) ，信號在過完備庫上的分解結果一定是稀疏的。信號的稀疏表示過程稱為信號的稀疏分解。由于信號稀疏表示的良好特性，信號稀疏分解引起了人們的極大關注，信號的稀疏表示也已經被應用到信號處理的許多方面。給定一個集d = g k ，k = 1 ，2 ，k ) ，其元素是在張成整個h i l b e r t 空間日= r 的單位矢量，k n ，集合d 稱為原子庫，其元素黟稱為原子。由于原子庫的冗余性( k n ) ，矢量艫不再是線性無關的。對于任意給定的長度為的實信號廠h ，對它的一個逼近廠，如果逼近誤差爿if 一廠1 1 2 ，則可以在d 中找到一個由聊個原子所組成的線性組合【2 4 】：腳- 1 f - ：c 移一廠 ( 2 1 ) 七= 0 稀疏分解的問題就在于如何從各種可能的組合中，選出最為稀疏的一個。然而對于一個隨機的原子庫來說，這是一個n p 難問題。在稀疏分解中，過完備原子庫的構建十分重要，良好的原子庫結構可以使信號表達更加簡潔，原子庫的大小也關系到計算復雜度。目前關于原予庫的研究還比較少，還有待進一步的研究，已經提出的較好的原子庫

人人文庫> 全部分類> 畢業(yè)設計 > 畢業(yè)論文

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

（通信與信息系統(tǒng)專業(yè)論文）基于匹配追蹤的低碼率視頻編碼研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

（通信與信息系統(tǒng)專業(yè)論文）基于匹配追蹤的低碼率視頻編碼研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

相關文檔