數(shù)字電視信源編碼技術(shù)課件_第1頁(yè)
數(shù)字電視信源編碼技術(shù)課件_第2頁(yè)
數(shù)字電視信源編碼技術(shù)課件_第3頁(yè)
數(shù)字電視信源編碼技術(shù)課件_第4頁(yè)
數(shù)字電視信源編碼技術(shù)課件_第5頁(yè)
已閱讀5頁(yè),還剩265頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)字電視信源編碼技術(shù)概述視頻壓縮編碼技術(shù)視頻壓縮編碼標(biāo)準(zhǔn)介紹MPEG2視頻編碼技術(shù)H.264視頻編碼技術(shù)AVS視頻編碼技術(shù)視頻壓縮損傷分析.數(shù)字電視信源編碼技術(shù)概述.概述通過(guò)壓縮編碼技術(shù)來(lái)去除視頻、音頻、數(shù)據(jù)等原始信號(hào)的冗余信息,以實(shí)現(xiàn)碼率壓縮與帶寬減小,使信號(hào)在各種傳輸信道中能夠有效傳輸。1、數(shù)字電視信源編碼的目的.概述通過(guò)壓縮編碼技術(shù)來(lái)去除視頻、音頻、數(shù)據(jù)等原始信號(hào)的冗余信2、壓縮的必要性電視信號(hào)數(shù)字化后:數(shù)碼率高,數(shù)據(jù)量大。例如:4:2:2編碼、8比特量化的SDTV信號(hào),其數(shù)碼率為216Mbps。若按每2bit構(gòu)成一個(gè)周期,則傳輸這樣一路數(shù)字電視信號(hào)需要有108MHz的通道帶寬。4:2:2編碼、8比特量化時(shí),一幀SDTV圖像的數(shù)據(jù)量約為8.6Mb,要記錄10分鐘的電視節(jié)目就需要130Gb的存儲(chǔ)器容量。綜上所述,要實(shí)現(xiàn)數(shù)字電視信號(hào)的有效存儲(chǔ)和傳輸,就需要采取措施降低其數(shù)據(jù)量和數(shù)碼率.2、壓縮的必要性電視信號(hào)數(shù)字化后:數(shù)碼率高,數(shù)據(jù)量大。.3、壓縮的可能性(以視頻信號(hào)為例)視頻壓縮過(guò)程:去除圖像中與信息無(wú)關(guān)或?qū)D像質(zhì)量影響不大的部分,即冗余部分。電視信號(hào)中存在很多這樣的冗余部分,這就為壓縮提供了可能性。視頻信號(hào)的冗余性表現(xiàn)在以下幾個(gè)方面:空間相關(guān)冗余時(shí)間相關(guān)冗余視覺(jué)冗余熵冗余.3、壓縮的可能性(以視頻信號(hào)為例)視頻壓縮過(guò)程:去除圖像中與空間相關(guān)冗余.空間相關(guān)冗余.時(shí)間相關(guān)冗余(幀間相關(guān)冗余)t=t1t=t2.時(shí)間相關(guān)冗余(幀間相關(guān)冗余)t=t1t=t2.人眼視覺(jué)冗余人眼視覺(jué)特性:對(duì)靜止或緩慢運(yùn)動(dòng)圖像的灰度等級(jí)及圖像細(xì)節(jié)的分辨力高對(duì)快速運(yùn)動(dòng)圖像的灰度等級(jí)及圖像細(xì)節(jié)的分辨力低觀察大面積圖像時(shí),對(duì)灰度等級(jí)分辨力高,對(duì)細(xì)節(jié)分辨力低觀察細(xì)節(jié)時(shí),對(duì)灰度等級(jí)分辨力低,對(duì)細(xì)節(jié)分辨力高人眼接收綜合信息的能力有限.人眼視覺(jué)冗余人眼視覺(jué)特性:人眼接收綜合信息的能力有限.利用人眼的視覺(jué)特性對(duì)靜止或緩慢運(yùn)動(dòng)圖像:減小幀率在圖像細(xì)節(jié)部分選擇較高的取樣頻率和較低的量化比特?cái)?shù)在大面積像塊區(qū)域選擇較低的取樣頻率和較高的量化比特?cái)?shù)對(duì)快速運(yùn)動(dòng)圖像:提高幀率降低取樣頻率和量化比特?cái)?shù).利用人眼的視覺(jué)特性對(duì)靜止或緩慢運(yùn)動(dòng)圖像:.自信息量定義:指某個(gè)隨機(jī)事件(或消息)發(fā)生后所提供的信息數(shù)量的多少任意隨機(jī)事件的自信息量為該事件發(fā)生概率的倒數(shù)的對(duì)數(shù)。熵冗余.自信息量任意隨機(jī)事件的自信息量為該事件發(fā)生概率的倒數(shù)的對(duì)數(shù)。信源熵(信源每個(gè)符號(hào)的平均信息量):P(xi)是符號(hào)xi出現(xiàn)的概率平均碼長(zhǎng)(每個(gè)符號(hào)的平均編碼長(zhǎng)度):熵冗余=平均碼長(zhǎng)-信息熵li是符號(hào)xi的編碼碼長(zhǎng).信源熵(信源每個(gè)符號(hào)的平均信息量):P(xi)是符號(hào)xi出現(xiàn)例如:某一圖像總共可出現(xiàn)4個(gè)灰度級(jí),對(duì)每個(gè)灰度級(jí)進(jìn)行二進(jìn)制定長(zhǎng)編碼時(shí),碼長(zhǎng)為2比特,即L=2bit/符號(hào)。當(dāng)每個(gè)灰度級(jí)出現(xiàn)的概率不相等時(shí):設(shè)灰度級(jí)1~4的概率分別為1/8、3/8、3/8、1/8,熵冗余=L–H=2-1.81=0.19bit/符號(hào).例如:當(dāng)每個(gè)灰度級(jí)出現(xiàn)的概率不相等時(shí):熵冗余=L–H=若采用變長(zhǎng)編碼方式,對(duì)概率大的符號(hào)賦予短碼,對(duì)概率小的符號(hào)賦予長(zhǎng)碼,則可降低平均碼長(zhǎng)L熵冗余=1.875-1.81=0.065bit/符號(hào)例如,灰度級(jí)13/81

灰度級(jí)23/801

灰度級(jí)31/8001

灰度級(jí)41/8000所以,采用變長(zhǎng)編碼可降低信源熵冗余return.若采用變長(zhǎng)編碼方式,對(duì)概率大的符號(hào)賦予短碼,對(duì)概率小的符號(hào)賦視頻壓縮編碼技術(shù)第一代視頻編碼技術(shù)(經(jīng)典的視頻編碼技術(shù)):以香農(nóng)信息論為基礎(chǔ)采用基于象素或象素塊的方法來(lái)表征視頻信息利用圖像信號(hào)的統(tǒng)計(jì)特性來(lái)設(shè)計(jì)編碼器未考慮事件本身的具體含義、重要程度及引起后果未充分考慮人眼視覺(jué)特性對(duì)編碼圖像的影響只能去除數(shù)據(jù)冗余-低層壓縮1、視頻壓縮編碼技術(shù)的研究進(jìn)展變換編碼:DCT+量化預(yù)測(cè)編碼:MC幀間預(yù)測(cè)熵編碼:VLC.視頻壓縮編碼技術(shù)第一代視頻編碼技術(shù)(經(jīng)典的視頻編碼技術(shù)):1第二代視頻編碼技術(shù):突破了香農(nóng)信息論的框架采用基于內(nèi)容的方法來(lái)表征視頻信息充分考慮人眼視覺(jué)特性及信源特性通過(guò)去除內(nèi)容冗余來(lái)實(shí)現(xiàn)數(shù)據(jù)壓縮基于對(duì)象的視頻壓縮-中層壓縮基于語(yǔ)義的視頻壓縮-高層壓縮分形編碼分級(jí)編碼模型基編碼.第二代視頻編碼技術(shù):分形編碼.視頻壓縮編碼用到的主要算法統(tǒng)計(jì)編碼變換編碼預(yù)測(cè)編碼分析、綜合編碼霍夫曼編碼游程編碼算術(shù)編碼字典編碼DCT變換編碼運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)編碼子帶編碼分級(jí)編碼分形編碼模型基編碼.視頻壓縮編碼用到的主要算法統(tǒng)計(jì)編碼變換編碼預(yù)測(cè)編碼分析、綜合2、視頻壓縮編碼分類按無(wú)損壓縮和有損壓縮進(jìn)行分類:無(wú)損壓縮編碼、有損壓縮編碼按信源模型進(jìn)行分類:基于波形編碼、基于內(nèi)容編碼按壓縮編碼原理進(jìn)行分類:統(tǒng)計(jì)編碼、預(yù)測(cè)編碼、變換編碼、矢量量化編碼.2、視頻壓縮編碼分類按無(wú)損壓縮和有損壓縮進(jìn)行分類:按信源模3、預(yù)測(cè)編碼3.1預(yù)測(cè)編碼的基本原理預(yù)測(cè)編碼傳送的不是實(shí)際像素值,而是實(shí)際值與其預(yù)測(cè)值之間的差值,即預(yù)測(cè)誤差。像素的預(yù)測(cè)值由其在時(shí)間和空間上相鄰的若干個(gè)像素的線性組合產(chǎn)生,它反映了在預(yù)測(cè)區(qū)域內(nèi)各像素的共性部分,因此用像素的實(shí)際值減去其預(yù)測(cè)值就可基本去除像素間的相關(guān)性。.3、預(yù)測(cè)編碼3.1預(yù)測(cè)編碼的基本原理.預(yù)測(cè)器++en’Xn’預(yù)測(cè)器+-Xnenen’量化器編碼器傳輸通道解碼器輸入輸出++en’=en+Δx=Xn-+ΔxXn’=en’+=Xn+Δx若不考慮量化器的影響,則有Xn’=Xn(無(wú)損壓縮)Δx:量化誤差.預(yù)測(cè)器++en’Xn’預(yù)測(cè)器+-Xnenen’量化器編碼器傳預(yù)測(cè)編碼的壓縮效果取決于預(yù)測(cè)器的預(yù)測(cè)精度,精度越高,預(yù)測(cè)誤差越小,量化時(shí)所需的量化比特?cái)?shù)就越少,壓縮率也就越高。一般來(lái)說(shuō),參與預(yù)測(cè)的像素?cái)?shù)越多,預(yù)測(cè)值就越精確,但同時(shí)預(yù)測(cè)器電路組成也就越復(fù)雜。利用相關(guān)像素值x1、x2

……xn-1來(lái)預(yù)測(cè)當(dāng)前像素值a1、a2······an-1稱為相關(guān)系數(shù),且滿足:.預(yù)測(cè)編碼的壓縮效果取決于預(yù)測(cè)器的預(yù)測(cè)精度,精度越高,預(yù)測(cè)誤差3.2幀內(nèi)預(yù)測(cè)編碼X1X2X3X4X5X6X7上一行相隔行當(dāng)前行當(dāng)前像素a6a4a3a2D6D4D3D2輸入由距X7最近的四個(gè)像素X6、X4

、X3、X2參與對(duì)X7的預(yù)測(cè)。相關(guān)系數(shù)為:a6=1/2、a4=a2=1/8、a3=1/4,則:=1/2X6+1/8X4+1/4X3

+1/8X2D6=TS(TS為取樣周期)D4=TH-TS(TH為行周期)D3=THD2=TH+TS.3.2幀內(nèi)預(yù)測(cè)編碼X1X2X3X4X5X6X7上一行相隔3.3幀間預(yù)測(cè)編碼幀存儲(chǔ)器+-Xnenen’量化器編碼器輸入輸出++當(dāng)圖像場(chǎng)景或攝像機(jī)靜止不動(dòng)時(shí),當(dāng)前幀象素塊的預(yù)測(cè)值就是前一時(shí)刻參考幀同一位置上的象素塊;如果圖像場(chǎng)景或攝像機(jī)是運(yùn)動(dòng)的,則需要在參考幀中找到與當(dāng)前幀象素塊最匹配的象素塊,作為當(dāng)前幀象素塊的預(yù)測(cè)值(運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè))。.3.3幀間預(yù)測(cè)編碼幀存儲(chǔ)器+-Xnenen’量化器編碼器3.4預(yù)測(cè)編碼的實(shí)質(zhì)由信息論可知,信源冗余來(lái)自信源本身的相關(guān)性以及信源概率分布的不均勻性。因此,去除信源相關(guān)性以及改變信源的概率分布模型,即可實(shí)現(xiàn)數(shù)據(jù)壓縮。預(yù)測(cè)編碼的實(shí)質(zhì)是降低了圖像在時(shí)間或空間上的相關(guān)性。預(yù)測(cè)編碼中:量化環(huán)節(jié)可造成圖像質(zhì)量下降誤碼傳遞可造成局部圖像損傷.3.4預(yù)測(cè)編碼的實(shí)質(zhì)由信息論可知,信源冗余來(lái)自信源本身的3.5運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償運(yùn)動(dòng)估計(jì):對(duì)運(yùn)動(dòng)物體的位移作出估計(jì),即求出運(yùn)動(dòng)矢量運(yùn)動(dòng)補(bǔ)償:按照運(yùn)動(dòng)矢量,對(duì)上一幀做位移,然后求出對(duì)當(dāng)前幀的預(yù)測(cè)值。運(yùn)動(dòng)矢量運(yùn)動(dòng)估計(jì)運(yùn)動(dòng)補(bǔ)償前一幀當(dāng)前幀預(yù)測(cè)的當(dāng)前幀編碼差值圖像.3.5運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償運(yùn)動(dòng)估計(jì):對(duì)運(yùn)動(dòng)物體的位移作出估運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼方框圖:+-輸入量化器反量化器幀存儲(chǔ)器運(yùn)動(dòng)補(bǔ)償運(yùn)動(dòng)估計(jì)編碼器輸出當(dāng)前幀預(yù)測(cè)幀運(yùn)動(dòng)矢量幀差信號(hào)++.運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼方框圖:+-輸入量化器反量化器幀存儲(chǔ)器運(yùn)運(yùn)動(dòng)估計(jì)塊匹配法:將圖像分成若干個(gè)大小為M×N的子像塊,假定同一子像塊內(nèi)所有像素具有相同的位移。假定幀間最大水平位移和最大垂直位移分別為Wx和Wy個(gè)像素;對(duì)于當(dāng)前幀的每一個(gè)塊在前一幀相應(yīng)位置開(kāi)辟大小為(M+2Wx)×(N+2Wy)的一塊搜索區(qū);在搜索區(qū)內(nèi)求出當(dāng)前幀對(duì)應(yīng)塊的最佳匹配塊;求出運(yùn)動(dòng)矢量。.運(yùn)動(dòng)估計(jì)塊匹配法:.前一幀搜索區(qū)當(dāng)前幀像素塊M+2WxN+2WyWxWxWyWyNM.前一幀搜索區(qū)當(dāng)前幀像素塊M+2WxN+2WyWxWxWyWyjij:垂直位移量i:水平位移量.jij:垂直位移量.塊匹配準(zhǔn)則:均方誤差(MSE)最小準(zhǔn)則

絕對(duì)誤差均值(MAD)最小準(zhǔn)則.塊匹配準(zhǔn)則:絕對(duì)誤差均值(MAD)最小準(zhǔn)則.

最大歸一化互相關(guān)函數(shù)(NCCF)準(zhǔn)則.最大歸一化互相關(guān)函數(shù)(NCCF)準(zhǔn)則.搜索方法:窮盡搜索法:對(duì)搜索區(qū)域內(nèi)的每一點(diǎn)都用匹配準(zhǔn)則進(jìn)行計(jì)算。

二維對(duì)數(shù)法

三步搜索法

分塊全搜索法:.搜索方法:二維對(duì)數(shù)法三步搜索法分塊全搜索法:.4、變換編碼4.1變換編碼的基本原理通過(guò)一種線性運(yùn)算關(guān)系將空間域的圖像信號(hào)變換到變換域或頻率域的正交矢量空間,然后進(jìn)行編碼。像素塊化傳輸通道熵解碼輸入輸出發(fā)端收端熵編碼量化器反量化器正交變換正交反變換.4、變換編碼4.1變換編碼的基本原理通過(guò)一種線性運(yùn)算關(guān)系變換編碼的根本目的是去除圖像的相關(guān)性!K-L變換:最佳正交變換,變換后系數(shù)互不相關(guān),而且能量主要集中在少數(shù)系數(shù)上。但K-L變換矩陣不是固定的,而是與圖像統(tǒng)計(jì)特性有關(guān),因此沒(méi)有快速算法,只適合進(jìn)行理論分析與實(shí)驗(yàn)。DCT變換:次最佳正交變換,變換壓縮性能接近K-L變換,具有良好的去相關(guān)性及能量壓縮特性,同時(shí)變換矩陣是固定的,與圖像內(nèi)容無(wú)關(guān),有快速算法。DCT變換在圖像壓縮領(lǐng)域得到廣泛應(yīng)用。變換編碼中對(duì)變換系數(shù)的量化是造成圖像損傷的主要原因。圖像損傷的表現(xiàn)形式主要是塊效應(yīng)。.變換編碼的根本目的是去除圖像的相關(guān)性!K-L變換:最佳正交DCT變換編碼的特點(diǎn):在變換域中描述視頻圖像要比在空間域中簡(jiǎn)單視頻圖像的相關(guān)性明顯下降,信號(hào)的能量主要集中在少數(shù)幾個(gè)變換系數(shù)上,采用量化和熵編碼可有效地壓縮其數(shù)據(jù)量可充分利用人眼的視覺(jué)特性具有較強(qiáng)的抗干擾能力,傳輸過(guò)程中的誤碼對(duì)圖像質(zhì)量的影響遠(yuǎn)小于預(yù)測(cè)編碼DCT有快速算法,能實(shí)現(xiàn)實(shí)時(shí)視頻處理.DCT變換編碼的特點(diǎn):.4.2離散余弦變換(DCT)設(shè)圖像塊的樣點(diǎn)數(shù)為N×N,其樣值方陣用f(x,y)表示,則二維離散余弦變換的公式為:.4.2離散余弦變換(DCT)設(shè)圖像塊的樣點(diǎn)數(shù)為N×N,其F(u,v)=圖像分塊及變換:通常將圖像分解成8×8的像素塊,然后進(jìn)行DCT變換。變換后得到由8×8頻域系數(shù)組成的矩陣。F00:DC系數(shù),代表該像素塊的直流分量或平均亮度值其它為AC系數(shù).F(u,v)=圖像分塊及變換:F00:DC系數(shù),代表該像素一般電視圖像的構(gòu)成都是以大、中面積內(nèi)容為主,精細(xì)內(nèi)容較少,因而可估計(jì)到,系數(shù)矩陣中左上方的系數(shù)值會(huì)大些,而越接近右下角,系數(shù)值會(huì)越小f(x,y)=F(u,v)=.一般電視圖像的構(gòu)成都是以大、中面積內(nèi)容為主,精細(xì)內(nèi)容較少,因利用人眼的視覺(jué)冗余性左上角附近的系數(shù)細(xì)量化(量化間隔小)右下角附近的系數(shù)粗量化(量化間隔大)量化后的系數(shù)取整F’(u,v)=F(u,v)/Q(u,v)Q(u,v)=F’(u,v)=4.3、DCT系數(shù)量化.利用人眼的視覺(jué)冗余性Q(u,v)=F’(u,v)=4.35、熵編碼5.1熵編碼的基本原理根據(jù)圖像的統(tǒng)計(jì)特性來(lái)去除圖像象素值的概率分布不均勻性,使編碼后的圖像數(shù)據(jù)接近于其信源熵,同時(shí)不產(chǎn)生任何失真?;趫D像概率分布特性的霍夫曼編碼、算術(shù)編碼基于圖像相關(guān)性的游程編碼.5、熵編碼5.1熵編碼的基本原理根據(jù)圖像的統(tǒng)計(jì)特性來(lái)去除5.2可變長(zhǎng)編碼(VLC)按信源符號(hào)出現(xiàn)概率的不同分配給不同長(zhǎng)度的碼字比特?cái)?shù)。即出現(xiàn)概率大的符號(hào)編碼碼字短,出現(xiàn)概率小的符號(hào)編碼碼字長(zhǎng)。也稱可變長(zhǎng)編碼(VLC)前提條件:必須知道每個(gè)符號(hào)的出現(xiàn)概率特點(diǎn):具有單義可譯性。即:任何一個(gè)長(zhǎng)碼都不會(huì)是另兩個(gè)短碼復(fù)合而成,任何一個(gè)短碼不會(huì)是另一個(gè)長(zhǎng)碼的前綴。因此,收信端可從接收到的碼字串中分?jǐn)嚅_(kāi)每個(gè)碼字,不會(huì)發(fā)生碼字混淆。.5.2可變長(zhǎng)編碼(VLC)按信源符號(hào)出現(xiàn)概率的不同分配給是一種最優(yōu)可變長(zhǎng)碼,基本原理為:將信源發(fā)出的符號(hào)按出現(xiàn)概率的大小次序排列對(duì)兩個(gè)概率最小的符號(hào)分別賦以“0”、“1”,并將這兩個(gè)概率相加之后作為一個(gè)新符號(hào)的概率對(duì)符號(hào)概率重新排隊(duì)后再取兩個(gè)概率最小的符號(hào)分別賦以“0”、“1”,并將這兩個(gè)概率相加依此類推,直到所有概率相加得到1為止由后向前沿各支路逐一寫出“0”、“1”,此碼字即為霍夫曼編碼碼字5.3霍夫曼編碼.是一種最優(yōu)可變長(zhǎng)碼,基本原理為:5.3霍夫曼編碼.例如:設(shè)信源各符號(hào)出現(xiàn)的概率為:xix1x2x3x4x5x6x7x8

Pi0.200.190.180.170.150.100.0050.005符號(hào)(xi)概率(Pi)x1x2x3x4x5x6x7x80.200.190.180.170.150.100.0050.005010.01010.11100.26010.35010.39010.61011.00碼字(wi)010011111010110011000110000碼長(zhǎng)(ni)22333455.例如:設(shè)信源各符號(hào)出現(xiàn)的概率為:xix1x2x3x4x5信源熵:采用等長(zhǎng)編碼方式時(shí),每個(gè)符號(hào)需要3bit,即平均碼長(zhǎng)為3bit/符號(hào),熵冗余為0.38bit/符號(hào)。采用可變長(zhǎng)編碼時(shí),平均碼長(zhǎng)為:熵冗余為0.11bit/符號(hào).信源熵:采用等長(zhǎng)編碼方式時(shí),每個(gè)符號(hào)需要3bit,即平均碼長(zhǎng)5.4DCT系數(shù)的熵編碼MPEG2中,像素塊矩陣經(jīng)DCT變換、量化后,要進(jìn)行Z形掃描、游程編碼和霍夫曼編碼Z形掃描:F’(u,v)=.5.4DCT系數(shù)的熵編碼MPEG2中,像素塊矩陣經(jīng)DCT游程編碼:將一維序列用二維數(shù)組(run,level)表示。run:表示連零的長(zhǎng)度level:表示連零之后出現(xiàn)的第一個(gè)非零值當(dāng)所有值都為零時(shí)用符號(hào)EOB表示Z形讀出158,0,-1,-1,-1,-1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0游程編碼:(0,158),(1,-1)(0,-1),(0,-1)(0,-1),EOB.游程編碼:Z形讀出游程編碼:.DC系數(shù):差值編碼(DPCM),霍夫曼編碼;即:DIFF=DCi-DCi-1對(duì)DIFF進(jìn)行霍夫曼編碼AC系數(shù):游程編碼,霍夫曼編碼MPEG2中AC系數(shù)游程編碼:(1,-1)(0,-1),(0,-1)(0,-1),EOB.DC系數(shù):差值編碼(DPCM),霍夫曼編碼;MPEG2中ACDC系數(shù)的DIFF熵編碼(查表法)DIFF碼字1碼字20000-1,10100,1-3,-2,2,301100,01,10,11-7...-4,4…7100000…011,100…111-15…-8,8…151010000…0111,1000…1111-31…16,16…31110…-63…-32,32…631110…-127…-64,64…12711110…-255…-128,128…255111110…-511…-256,256…5111111110…-1023…-512,512…102311111110…-2047…-1024,1024…2047111111110…編碼碼字=碼字1+碼字2若DIFF=2,則碼字為01110.DC系數(shù)的DIFF熵編碼(查表法)DIFF碼字1碼字2000AC系數(shù)熵編碼(表1)AC系數(shù)位長(zhǎng)碼字2000-1,110,1-3,-2,2,3200,01,10,11-7...-4,4…73000…011,100…111-15…-8,8…1540000…0111,1000…1111-31…16,16…315…-63…-32,32…636…-127…-64,64…1277…-255…-128,128…2558…-511…-256,256…5119…-1023…-512,512…102310….AC系數(shù)熵編碼(表1)AC系數(shù)位長(zhǎng)碼字2000-1,110,AC系數(shù)熵編碼(表2)游程/位長(zhǎng)碼字10/0(EOB)10100/1000/2010/31000/410110/5110100/611110000/7111110000/811111101100/911111111100000100/101111111110000011游程/位長(zhǎng)碼字11/111001/2110111/311110011/41111101101/5111111101101/611111111100001001/711111111100001011/811111111100001101/911111111100001111/101111111110001000…….AC系數(shù)熵編碼(表2)游程/位長(zhǎng)碼字10/0(EOB)10對(duì)于(1,-1):AC系數(shù)為-1,前面有1個(gè)零查表1可知,碼字2為0,“游程/位長(zhǎng)”是1/1查表2可知,1/1對(duì)應(yīng)的碼字1為1100對(duì)(1,-1)進(jìn)行霍夫曼編碼的碼字為11000同理可得,(0,-1)的編碼碼字為000EOB的碼字為1010AC系數(shù)游程編碼:(1,-1)(0,-1),(0,-1)(0,-1),EOB該圖像塊編碼后為:01110110000000000001010.對(duì)于(1,-1):AC系數(shù)為-1,前面有1個(gè)零AC系數(shù)游程編視頻壓縮編碼標(biāo)準(zhǔn)介紹

國(guó)際電信聯(lián)盟(ITU)開(kāi)發(fā)用于低比特率視頻電話的H.26x標(biāo)準(zhǔn),其中包括H.261、H.262、H.263與H.264;國(guó)際標(biāo)準(zhǔn)化組織(ISO)主要針對(duì)消費(fèi)類應(yīng)用,已經(jīng)針對(duì)運(yùn)動(dòng)圖像壓縮定義了MPEG標(biāo)準(zhǔn)。MPEG標(biāo)準(zhǔn)包括MPEG1、MPEG2與MPEG4;

MPEG與ISO開(kāi)展合作,成立聯(lián)合視頻小組(JVT),該小組定義了H.264編解碼技術(shù),該標(biāo)準(zhǔn)稱為H.264/AVC。.視頻壓縮編碼標(biāo)準(zhǔn)介紹國(guó)際電信聯(lián)盟(ITU)開(kāi)發(fā)用于低比特率發(fā)展歷程:.發(fā)展歷程:.視頻電話和視頻會(huì)議壓縮編碼標(biāo)準(zhǔn)CCITT1984年開(kāi)始研究,1990年正式成為標(biāo)準(zhǔn)應(yīng)用:視頻電話、視頻會(huì)議,傳輸網(wǎng)絡(luò)為ISDN(綜合業(yè)務(wù)數(shù)據(jù)網(wǎng),64kb/s~2.048Mb/s)圖像格式:CIF、QCIF,最大幀頻為30Hz,逐行掃描碼率:p×64kb/s(p=1~30)。p=1、2時(shí),只支持QCIF格式,用于視頻電話。p≥6時(shí),支持CIF格式,可用于視頻會(huì)議。壓縮方式:DCT、幀間預(yù)測(cè)編碼H.261.視頻電話和視頻會(huì)議壓縮編碼標(biāo)準(zhǔn)H.261.低碼率圖像壓縮編碼標(biāo)準(zhǔn)ITU-T1995推出草案應(yīng)用:視頻電話、多媒體通信、移動(dòng)通信、遠(yuǎn)程監(jiān)控系統(tǒng)等,傳輸網(wǎng)絡(luò)為PSTN(公用電話交換網(wǎng))圖像格式:CIF、QCIF、sub-QCIF(Y:128×96,CR/CB:64×48),最大幀頻為30Hz,逐行掃描壓縮方式:DCT、幀間預(yù)測(cè)編碼H.263.低碼率圖像壓縮編碼標(biāo)準(zhǔn)H.263.先進(jìn)的視頻編碼AVC由ITU-T和ISO/IEC的聯(lián)合專家組(JVT)于2003年3月起草完成應(yīng)用:數(shù)字電視廣播、可視電話、視頻會(huì)議、實(shí)時(shí)監(jiān)控、流式多媒體業(yè)務(wù)、低比特率下的移動(dòng)多媒體通信等特點(diǎn):在同等圖像質(zhì)量條件下,壓縮比是H.263和MPEG4的2倍對(duì)IP和無(wú)線網(wǎng)絡(luò)環(huán)境有良好的適應(yīng)性H.264(MPEG4AVC).先進(jìn)的視頻編碼AVCH.264(MPEG4AVC).MovingPictureExpertGroup(活動(dòng)圖像專家組)視頻及其伴音的壓縮標(biāo)準(zhǔn)1988年開(kāi)始研究,1992成為正式標(biāo)準(zhǔn)應(yīng)用:數(shù)字存儲(chǔ)媒體(如VCD等),交互式多媒體系統(tǒng)圖像格式:SIF(4:2:0),逐行掃描碼率:1.5Mb/s壓縮方式:DCT,幀間預(yù)測(cè)編碼MPEG-1.MovingPictureExpertGroup(活活動(dòng)圖像及其伴音信息的通用編碼1990年開(kāi)始制定,1994年成為正式標(biāo)準(zhǔn)應(yīng)用:SDTV,HDTV,DVD等圖像格式:CCIR601等多種格式(4:2:2,4:4:4,4:2:0),逐行掃描,隔行掃描壓縮方式:DCT,幀間預(yù)測(cè)編碼有多種檔次:5個(gè)型,4個(gè)級(jí)與MPEG-1兼容MPEG-2(H.262).活動(dòng)圖像及其伴音信息的通用編碼MPEG-2(H.262基于內(nèi)容的壓縮編碼標(biāo)準(zhǔn)1993年開(kāi)始制定,1999年成為正式標(biāo)準(zhǔn)應(yīng)用:交互式多媒體應(yīng)用、移動(dòng)通信、個(gè)人通信等圖像格式:多種格式,逐行掃描,隔行掃描特點(diǎn):編碼對(duì)象是圖像中的音頻和視頻對(duì)象(AV對(duì)象)形狀編碼分級(jí)編碼MPEG-4.基于內(nèi)容的壓縮編碼標(biāo)準(zhǔn)MPEG-4.信息技術(shù)先進(jìn)音視頻編碼由中國(guó)數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)(AudioVideoStandard)工作組于2003年提出應(yīng)用:高清數(shù)字電視、衛(wèi)星廣播電視、移動(dòng)音視頻通信、寬帶網(wǎng)絡(luò)流媒體、視頻會(huì)議、視頻監(jiān)控等特點(diǎn):編碼效率基本達(dá)到了H.264的水平;回避了國(guó)外的專利技術(shù)包括系統(tǒng)、視頻、音頻、數(shù)字版權(quán)管理與保護(hù)等四個(gè)主要標(biāo)準(zhǔn)技術(shù)方案簡(jiǎn)潔,芯片實(shí)現(xiàn)復(fù)雜度低AVSreturn.信息技術(shù)先進(jìn)音視頻編碼AVSreturn.MPEG2視頻編碼技術(shù)1、MPEG概況MPEG:屬于ISO/IEC下屬的聯(lián)合技術(shù)委員會(huì)任務(wù):制定活動(dòng)圖像的壓縮編碼標(biāo)準(zhǔn),壓縮碼率為1.5Mb/s10Mb/s40Mb/s-MPEG-1(1992,ISO/IEC11172)-MPEG-2(1994,ISO/IEC13818)-MPEG-3(1992,撤銷).MPEG2視頻編碼技術(shù)1、MPEG概況MPEG:屬于ISOMPEG視頻部分框圖IDCT反量化VLC解碼緩沖器(b)解碼過(guò)程DCT量化VLC緩沖器(a)編碼過(guò)程碼率控制.MPEG視頻部分框圖IDCT反量化VLC解碼緩沖器(b)2、MPEG-2的型和級(jí)

型級(jí)簡(jiǎn)單型SP4:2:0主型MP4:2:0SNR可分級(jí)型SNP4:2:0空間可分級(jí)型SSP4:2:0高級(jí)型HP4:2:04:2:2高級(jí)HL1920×1080×301920×1152×25-MP@HLI,P,B80Mb/s--HP@HLI,P,B100Mb/sH-1440L1440×1080×301440×1152×25-MP@H1440LI,P,B60Mb/s-SSP@H1440LI,P,B60Mb/sHP@H1440LI,P,B80Mb/s主級(jí)ML720×480×30720×576×25SP@MLI,P15Mb/sMP@MLI,P,B15Mb/sSNP@MLI,P,B15Mb/s-HP@MLI,P,B20Mb/s低級(jí)LL352×240×30352×288×25-MP@LLI,P,B4Mb/sSNP@LLI,P,B4Mb/s--.2、MPEG-2的型和級(jí)3、圖像編碼幀類型I幀(幀內(nèi)編碼幀)僅利用該幀圖像本身的信息進(jìn)行編碼DCT、量化、熵編碼等I幀提供了進(jìn)入壓縮圖像數(shù)據(jù)序列的隨機(jī)訪問(wèn)點(diǎn),便于對(duì)圖像進(jìn)行編輯。一般應(yīng)用中,一秒鐘出現(xiàn)兩個(gè)I幀壓縮比:(2~5):1.3、圖像編碼幀類型I幀(幀內(nèi)編碼幀)僅利用該幀圖像本身的信息P幀(前向預(yù)測(cè)幀)利用前面最靠近的I幀或P幀圖像作參考幀,經(jīng)運(yùn)動(dòng)預(yù)測(cè)編碼得到的圖像。壓縮比:(5~10):1P幀可以作為B幀和后面的P幀的參考幀P幀會(huì)使誤碼傳遞下去.P幀(前向預(yù)測(cè)幀)利用前面最靠近的I幀或P幀圖像作參考幀,經(jīng)B幀(雙向預(yù)測(cè)幀)利用過(guò)去及將來(lái)的I幀或P幀作參考幀,經(jīng)運(yùn)動(dòng)預(yù)測(cè)編碼得到的圖像。壓縮比:(20~30):1B幀不用作參考幀B幀不會(huì)使誤碼傳遞下去通常在兩個(gè)參考幀之間安排兩個(gè)B幀.B幀(雙向預(yù)測(cè)幀)利用過(guò)去及將來(lái)的I幀或P幀作參考幀,經(jīng)運(yùn)動(dòng)編碼圖像的顯示順序和傳送順序IBBPBBPBBPBBI12345678910111213IBPBBPBBPBBIB14237561089131112圖像的顯示順序圖像的傳送順序.編碼圖像的顯示順序和傳送順序IBBPBBPBBPBBI123幀重排運(yùn)動(dòng)補(bǔ)償運(yùn)動(dòng)估計(jì)幀內(nèi)/幀間模式判別DCT量化VLC幀間幀內(nèi)反量化反DCTK1K2運(yùn)動(dòng)矢量去VLCI幀存P幀存K4K3I、BPI、PB信源數(shù)據(jù)+++-A2A1緩沖器量化控制編碼器4MPEG2視頻編、解碼器框圖.幀重排運(yùn)動(dòng)補(bǔ)償運(yùn)動(dòng)估計(jì)幀內(nèi)/幀間DCT量化VLC幀間幀內(nèi)反量解碼器反量化反DCT幀重排I(P)幀存P幀存MV2MV1BI、PMC值輸入碼流圖像數(shù)據(jù)VLD量化步長(zhǎng)量化表選擇.解碼器反量化反DCT幀重排I(P)幀存P幀存MV2MV1BI5視頻基本碼流(ES流)的組成像塊宏塊宏塊條像塊像塊宏塊宏塊宏塊條宏塊條圖像圖像圖像圖像組圖像組圖像組圖像序列.5視頻基本碼流(ES流)的組成像塊宏塊宏塊條像塊像塊宏塊8×8像素陣列,DCT變換單元可以是Y像塊或CB、CR像塊像塊.8×8像素陣列,DCT變換單元像塊.宏塊由16×16像素的Y陣列和相應(yīng)畫面區(qū)域內(nèi)的CB、CR

色差信號(hào)像素陣列共同組成。是運(yùn)動(dòng)預(yù)測(cè)的基本單元,但運(yùn)動(dòng)預(yù)測(cè)只對(duì)亮度陣列進(jìn)行,色差信號(hào)的幀間預(yù)測(cè)編碼直接使用亮度陣列中得到的運(yùn)動(dòng)矢量。4:2:0宏塊結(jié)構(gòu)1234Y6CR5CB4:2:2宏塊結(jié)構(gòu)1234Y5CB76CR84:4:4宏塊結(jié)構(gòu)1234YCBCR59711610812.宏塊由16×16像素的Y陣列和相應(yīng)畫面區(qū)域內(nèi)的CB、C宏塊條由處于同一水平宏塊排內(nèi)的若干個(gè)宏塊組成是發(fā)生誤碼又不可糾正時(shí)數(shù)據(jù)獲得重新同步的單位720(704)576宏塊排(44個(gè)宏塊)1每個(gè)宏塊排內(nèi)宏塊條數(shù)多有利于誤碼后的重新正確解碼,但編碼效率變低。每排內(nèi)宏塊條數(shù)少則情況相反。.宏塊條由處于同一水平宏塊排內(nèi)的若干個(gè)宏塊組成720(704)圖像有I、P、B三種編碼圖像是圖像編碼的基本單位,也是獨(dú)立的顯示單元.圖像有I、P、B三種編碼圖像.圖像組由一個(gè)圖像序列中連續(xù)的幾個(gè)圖像組成是隨機(jī)存取的視頻基本單位圖像組中第一幀為I幀一個(gè)典型的GOP結(jié)構(gòu):IBBPBBPBBPBBI12345678910111213GOP.圖像組由一個(gè)圖像序列中連續(xù)的幾個(gè)圖像組成IBBPBBPBBP圖像序列被處理的一串連續(xù)的圖像是隨機(jī)存取節(jié)目的段落單元一個(gè)視頻序列大致對(duì)應(yīng)一個(gè)鏡頭.圖像序列被處理的一串連續(xù)的圖像.6視頻基本碼流的層次結(jié)構(gòu)系數(shù)塊宏塊宏塊條圖像圖像組視頻序列運(yùn)動(dòng)矢量條的垂直位置I、P、B時(shí)間基準(zhǔn)幀內(nèi)DC精度量化矩陣色度類型隔行/逐行級(jí)、類寬高比圖像尺寸幀頻碼率時(shí)間碼封閉/開(kāi)放VBV延時(shí)信息量化器縮放因子宏塊類型.6視頻基本碼流的層次結(jié)構(gòu)系數(shù)塊宏塊宏塊條圖像圖像組視頻序GOP1GOPSCGOP頭圖像1圖像2圖像3…圖像N圖像SC圖像頭條1條2條3…條m條SC條頭宏塊1宏塊2宏塊3…宏塊nY1宏塊編碼信息Y2Y3Y4C1C28×8系數(shù)塊序列層GOP層圖像層宏塊條層宏塊層像塊層序列SC序列擴(kuò)展序列頭GOP2…序列EC0x000001B30x000001B80x000001000x000001010x000001AF.GOP1GOPSCGOP頭圖像1圖像2圖像3…圖像N圖視頻基本碼流層次結(jié)構(gòu)表語(yǔ)法規(guī)定的層次功能序列層隨機(jī)存取段落圖像組層隨機(jī)存取視頻單位圖像層編碼基本單位宏塊條層重新同步單位宏塊層運(yùn)動(dòng)補(bǔ)償單位像塊層DCT單位return.視頻基本碼流層次結(jié)構(gòu)表語(yǔ)法規(guī)定的層次功能序列層隨機(jī)存取段落圖H.264視頻編碼技術(shù)1、H.264概況目的:實(shí)現(xiàn)高效的視頻編碼和良好的網(wǎng)絡(luò)親和性ITU-T:VCEGISO/IEC:MPEGJVTH.264MPEG4AVC.H.264視頻編碼技術(shù)1、H.264概況目的:實(shí)現(xiàn)高效的高效的視頻編碼良好的網(wǎng)絡(luò)親和性多種新技術(shù)所產(chǎn)生的細(xì)微效果積累而成。這些新技術(shù)包括:多種新的幀內(nèi)預(yù)測(cè)方法可變尺寸塊的運(yùn)動(dòng)補(bǔ)償技術(shù)多參考幀的運(yùn)動(dòng)補(bǔ)償技術(shù)

4x4整數(shù)變換技術(shù)環(huán)路濾波技術(shù)

······注重對(duì)移動(dòng)和IP網(wǎng)絡(luò)的適應(yīng),采用分層技術(shù),從形式上將編碼和信道隔離開(kāi)來(lái).高效的視頻編碼良好的網(wǎng)絡(luò)親和性多種新技術(shù)所產(chǎn)生的細(xì)微效果積累2、H.264視頻編碼器結(jié)構(gòu)控制數(shù)據(jù)視頻編碼層(VCL)數(shù)據(jù)分區(qū)網(wǎng)絡(luò)提取層(NAL)H.320H.324H.323/IPH.324/M編碼的宏塊編碼的條/分區(qū)視頻編碼層:負(fù)責(zé)高效的視頻內(nèi)容表示網(wǎng)絡(luò)提取層:負(fù)責(zé)按照網(wǎng)絡(luò)所要求的適當(dāng)方式對(duì)數(shù)據(jù)進(jìn)行打包和傳送.2、H.264視頻編碼器結(jié)構(gòu)控制數(shù)據(jù)視頻編碼層(VCL)數(shù)很多標(biāo)準(zhǔn)都有不同的配置Profiles:算法集合Levels:能力的體現(xiàn)(分辨率、解碼速度)H.264有3種profiles BaselineProfile(IPVideoPhone,simplestreaming)MainProfile(Broadcast,VOD)ExtendedProfile(StreamingMedia)H.264有16種levels,從QCIF到D-Cinema3、Profiles&Levels.很多標(biāo)準(zhǔn)都有不同的配置3、Profiles&LevelsExtendedProfileSPframesSIframesFMORedundantslicesMainProfileBframesInterlaceCABACH.264ProfilesIframesPframesCAVLCBaselineProfile編碼效率main>extended>baseline.ExtendedProfileSPframesMain1)基本類:僅支持逐行視頻,支持I幀和P幀編碼,支持基于上下文的自適應(yīng)變長(zhǎng)碼(CAVLC)。主要用于可視電話、會(huì)議電視、無(wú)線通信等實(shí)時(shí)視頻通信;2)主類:包含所有基本類的功能,同時(shí)還支持隔行視頻,支持B幀編碼,支持基于上下文的自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC)。主要用于數(shù)字廣播電視與數(shù)字視頻存儲(chǔ)(SDTV,HDTV,DVD);3)擴(kuò)展類:包含所有基本類的功能,同時(shí)還支持隔行視頻,支持B/SP/SI幀編碼。主要用于各種網(wǎng)絡(luò)的視頻流傳輸。4)高級(jí)類:在主類基礎(chǔ)上新增:8x8幀內(nèi)預(yù)測(cè)、自定義量化、無(wú)損視頻編碼、更多的yuv格式(4:4:4...)等。.1)基本類:僅支持逐行視頻,支持I幀和P幀編碼,支持基于上下..H.264Levels.H.264Levels.

.

.4、視頻編碼層包含核心壓縮引擎,塊、宏塊以及條的語(yǔ)法級(jí)別的定義設(shè)計(jì)目標(biāo):在盡可能獨(dú)立于網(wǎng)絡(luò)的情況下實(shí)現(xiàn)高效編解碼1)圖像的劃分

一個(gè)編碼圖像通常劃分成若干宏塊;一個(gè)宏塊由一個(gè)16×16亮度像素和與之對(duì)應(yīng)的一個(gè)8×8Cb和一個(gè)8×8Cr像素塊組成;每個(gè)圖象中,若干宏塊被排列成片的形式。.4、視頻編碼層包含核心壓縮引擎,塊、宏塊以及條的語(yǔ)法級(jí)別的定Slice#0Slice#1Slice#2圖像(176x144)子宏塊(8x8)宏塊(16x16)像塊.Slice#0Slice#1Slice#2圖像(176片的編碼類型:I片、P片、B片。I片只包含I宏塊,P片可包含P/I宏塊,B片可包含B/P/I宏塊。I宏塊利用從當(dāng)前片中已解碼的像素作為參考進(jìn)行幀內(nèi)預(yù)測(cè)(不能取其它片中的已解碼像素作為參考進(jìn)行幀內(nèi)預(yù)測(cè))。P宏塊利用前面已編碼圖象作為參考圖象進(jìn)行幀間預(yù)測(cè)。B宏塊則利用雙向的參考圖象(當(dāng)前和未來(lái)的已編碼圖象幀)進(jìn)行幀間預(yù)測(cè)。.片的編碼類型:I片、P片、B片。.2)宏塊編碼結(jié)構(gòu)EntropyCodingScaling&Inv.TransformMotion-CompensationControlDataQuant.

Transf.coeffsMotionDataIntra/InterCoderControlMotionEstimationTransform/

Scal./Quant.-InputVideoSignalSplitintoMacroblocks16x16pixels

Intra-frame

PredictionDe-blockingFilterOutputVideoSignal.2)宏塊編碼結(jié)構(gòu)EntropyScaling&Inv.I幀編碼的基本流程為:

(1)進(jìn)行幀內(nèi)預(yù)測(cè),決定所采用的幀內(nèi)預(yù)測(cè)模式。

(2)像素值減去預(yù)測(cè)值,得到殘差。

(3)對(duì)殘差進(jìn)行變換和量化。

(4)變長(zhǎng)編碼和算術(shù)編碼。

(5)重構(gòu)圖像并濾波,得到的圖像作為其它幀的參考幀。

P幀和B幀編碼的基本流程為:

(1)進(jìn)行運(yùn)動(dòng)估計(jì),計(jì)算采用幀間編碼模式的率失真函數(shù)值。P幀只參考前面的幀,B幀可參考后面的幀。

(2)進(jìn)行幀內(nèi)預(yù)測(cè),選取率失真函數(shù)值最小的幀內(nèi)模式與幀間模式比較,確定采用哪種編碼模式。

(3)計(jì)算實(shí)際值和預(yù)測(cè)值的差值。

(4)對(duì)殘差進(jìn)行變換和量化。

(5)熵編碼,如果是幀間編碼模式,編碼運(yùn)動(dòng)矢量.I幀編碼的基本流程為:

(1)進(jìn)行幀內(nèi)預(yù)測(cè),決定所采用的與以往的視頻編碼標(biāo)準(zhǔn)相同之處:

宏塊大小是16x16

格式:4:2:0I,P,B圖像類型基于塊的變換量化

……

運(yùn)動(dòng)補(bǔ)償幀內(nèi)預(yù)測(cè)變換編碼去塊濾波熵編碼改進(jìn)之處:3)與以往的視頻編碼標(biāo)準(zhǔn)的異同:.與以往的視頻編碼標(biāo)準(zhǔn)相同之處:宏塊大小是16x16運(yùn)4)幀內(nèi)預(yù)測(cè)亮度:intra4x49種預(yù)測(cè)模式intra16x164種預(yù)測(cè)模式色度:intra8x84種預(yù)測(cè)模式.4)幀內(nèi)預(yù)測(cè)亮度:.亮度4x4幀內(nèi)預(yù)測(cè)模式(9種)模式0:垂直預(yù)測(cè)模式1:水平預(yù)測(cè)模式2:DC預(yù)測(cè)模式3:左下角對(duì)角線預(yù)測(cè)模式4:右下角對(duì)角線預(yù)測(cè)模式5:垂直偏右預(yù)測(cè)模式6:水平偏下預(yù)測(cè)模式7:垂直偏左預(yù)測(cè)模式8:水平偏上預(yù)測(cè)05461873.亮度4x4幀內(nèi)預(yù)測(cè)模式(9種)模式0:垂直預(yù)測(cè)0546187舉例MABCDEFGHIJKLabcdefghijklmnop垂直預(yù)測(cè)a=e=i=m=A;b=f=j=n=B;c=g=k=o=C;d=h=l=p=DMABCDEFGHIJKLabcdefghijklmnop水平預(yù)測(cè)a=b=c=d=I;e=f=g=h=J;i=j=k=l=K;m=n=o=p=L.舉例MABCDEFGHIJKLabcdefghijklmno舉例MABCDEFGHIJKLabcdefghijklmnopDC預(yù)測(cè)a~p這16個(gè)像素的預(yù)測(cè)值相同,均為:(A+B+C+D+I+J+K+L)/8或(A+B+C+D)/4或(I+J+K+L)/4或128MABCDEFGHIJKLabcdefghijklmnop左下角對(duì)角線預(yù)測(cè)a=(A+2B+C+2)/4b=e=(B+2C+D+2)/4c=f=i=(C+2D+E+2)/4d=g=j=m=(D+2E+F+2)/4h=k=n=(E+2F+G+2)/4l=o=(F+2G+H+2)p=(G+3H+2)/4.舉例MABCDEFGHIJKLabcdefghijklmno亮度16x16幀內(nèi)預(yù)測(cè)模式(4種)模式0:垂直預(yù)測(cè)模式1:水平預(yù)測(cè)模式2:DC預(yù)測(cè)模式3:平面預(yù)測(cè)色度8x8幀內(nèi)預(yù)測(cè)模式(4種)模式0:DC預(yù)測(cè)模式1:水平預(yù)測(cè)模式2:垂直預(yù)測(cè)模式3:平面預(yù)測(cè).亮度16x16幀內(nèi)預(yù)測(cè)模式(4種)模式0:垂直預(yù)測(cè)色度8x85)運(yùn)動(dòng)補(bǔ)償

多參考幀可變塊大小:樹形結(jié)構(gòu)運(yùn)動(dòng)補(bǔ)償.5)運(yùn)動(dòng)補(bǔ)償多參考幀.

采用大尺寸塊時(shí)進(jìn)行運(yùn)動(dòng)補(bǔ)償時(shí),塊類型選擇所需的比特?cái)?shù)少,傳送的運(yùn)動(dòng)矢量少,但相應(yīng)的運(yùn)動(dòng)補(bǔ)償誤差較大,因而需要編碼預(yù)測(cè)誤差數(shù)據(jù)較多;采用小尺寸塊進(jìn)行運(yùn)動(dòng)補(bǔ)償時(shí),塊類型選擇所需的比特?cái)?shù)多,傳送的運(yùn)動(dòng)矢量多,但運(yùn)動(dòng)預(yù)測(cè)更加精確,運(yùn)動(dòng)補(bǔ)償后的預(yù)測(cè)誤差較小,所需的編碼比特?cái)?shù)相應(yīng)減少。運(yùn)動(dòng)補(bǔ)償塊大小的選擇對(duì)于壓縮性能有較大影響,一般來(lái)說(shuō),大尺寸塊比較適合圖像中灰度均勻區(qū)域,而小尺寸塊適合于有較多細(xì)節(jié)的區(qū)域。.采用大尺寸塊時(shí)進(jìn)行運(yùn)動(dòng)補(bǔ)償時(shí),塊類型選擇所需的比特?cái)?shù)少,運(yùn)動(dòng)矢量預(yù)測(cè)精度:

1/4sampleaccuracyforY1/8forU&V.運(yùn)動(dòng)矢量預(yù)測(cè)精度:.6)變換和量化4x4整數(shù)變換:變換矩陣只有±1、±2取值,具有較小方塊(意味著較少運(yùn)算量)、整數(shù)變換、無(wú)乘法、16位運(yùn)算位長(zhǎng)的優(yōu)點(diǎn),避免了一向困擾視頻編碼的浮點(diǎn)IDCT失配問(wèn)題;二次正交變換:改善圖像中大面積平坦區(qū)域的編碼性能:對(duì)16x16的亮度宏塊的16個(gè)4x4塊進(jìn)行DCT變換后,將每個(gè)4x4塊的DC系數(shù)(還沒(méi)有經(jīng)過(guò)量化)提取出來(lái),組成一個(gè)4x4的亮度DC系數(shù)塊,進(jìn)行4x4的Hadamard變換;對(duì)8x8的色度宏塊的4個(gè)4x4塊進(jìn)行DCT變換后,也將每個(gè)4x4塊的DC系數(shù)提取出來(lái),組成一個(gè)2x2的色度DC系數(shù)塊,對(duì)其進(jìn)行2x2的Hadamard變換。.6)變換和量化4x4整數(shù)變換:變換矩陣只有±1、±2取二次正交變換.二次正交變換...7)熵編碼Entropycodingmode=0時(shí),選擇CAVLC編碼ContextAdaptiveVariableLengthCodingEntropycodingmode=1時(shí),選擇CABAC編碼Context-basedAdaptiveBinaryArithmeticCoding

BaselineProfile只支持mode0;而MainProfile或更高的Profile支持mode0&1。.7)熵編碼Entropycodingmode=0時(shí)CAVLC與CABAC.CAVLC與CABAC.5、數(shù)據(jù)劃分?jǐn)?shù)據(jù)劃分:使一個(gè)片中的宏塊數(shù)據(jù)重新組合,把宏塊語(yǔ)義相關(guān)的數(shù)據(jù)組成一個(gè)劃分,由劃分來(lái)組裝片。 在H.264中有三種不同的數(shù)據(jù)劃分:

A劃分-頭信息劃分:包含片中宏塊的類型,量化參數(shù)和運(yùn)動(dòng)矢量,是片中最重要的信息。

B劃分-幀內(nèi)信息劃分:包含幀內(nèi)CBPs和幀內(nèi)系數(shù),幀內(nèi)信息可以阻止錯(cuò)誤的蔓延。

C劃分-幀間信息劃分:包含幀間CBPs和幀間系數(shù),通常比前兩個(gè)劃分要大得多。

.5、數(shù)據(jù)劃分?jǐn)?shù)據(jù)劃分:使一個(gè)片中的宏塊數(shù)據(jù)重新組合,把宏塊語(yǔ)

幀內(nèi)信息劃分(B劃分)結(jié)合頭信息劃分(A劃分)解出幀內(nèi)宏塊;幀間信息劃分(C劃分)結(jié)合頭信息劃分(A劃分)解出幀間宏塊。幀間信息劃分的重要性最低,對(duì)重同步?jīng)]有貢獻(xiàn)。當(dāng)使用數(shù)據(jù)劃分時(shí),片中的數(shù)據(jù)根據(jù)其類型被保存到不同的緩存,同時(shí)片的大小也要調(diào)整,使得片中最大的劃分小于MTU尺寸。解碼端若獲得所有的劃分,就可以完整重構(gòu)片;解碼端若發(fā)現(xiàn)幀內(nèi)信息或幀間信息劃分丟失,可用的頭信息仍然有很好的錯(cuò)誤恢復(fù)性能。這是因?yàn)楹陦K類型和宏塊的運(yùn)動(dòng)矢量含有宏塊的基本特征。.幀內(nèi)信息劃分(B劃分)結(jié)合頭信息劃分(A劃分)6、網(wǎng)絡(luò)提取層負(fù)責(zé)將VCL產(chǎn)生的比特字符串適配到各種各樣的網(wǎng)絡(luò)和多元環(huán)境中,它覆蓋了所有的片級(jí)以上的語(yǔ)法級(jí)別目的:良好的網(wǎng)絡(luò)親和性 H.264中的分層結(jié)構(gòu)取消了序列層和圖像層,并將原本屬于序列和圖像頭部的大部分句法元素游離出來(lái)形成序列和圖像兩級(jí)參數(shù)集,其余的部分則放入片層。.6、網(wǎng)絡(luò)提取層負(fù)責(zé)將VCL產(chǎn)生的比特字符串適配到各種各樣的網(wǎng)NALunit:NAL的基本語(yǔ)法結(jié)構(gòu),包含整數(shù)個(gè)字節(jié)。其中第一個(gè)字節(jié)是頭信息,其后是一系列原始字節(jié)序列載荷(RBSP)。NALU定義了可用于基于分組和基于比特流系統(tǒng)的基本格式1)NAL單元RBSP:在編碼的原始數(shù)據(jù)后面填加了結(jié)尾比特(一個(gè)bit“1”若干比特“0”),以便字節(jié)對(duì)齊.NALunit:NAL的基本語(yǔ)法結(jié)構(gòu),包含整數(shù)個(gè)字節(jié)。其中NALheaderNALU類型(5bit):說(shuō)明當(dāng)前NAL單元的類型;重要性指示(2bit):標(biāo)志該NAL單元用于重建時(shí)的重要性,值越大,越重要。如果當(dāng)前NAL是屬于參考幀的片,或是序列參數(shù)集,或是圖像參數(shù)集等重要信息時(shí),本句法元素必需大于0;禁止位(1bit):網(wǎng)絡(luò)發(fā)現(xiàn)NAL單元有比特錯(cuò)誤時(shí)可設(shè)置該比特為1,以便接收方丟掉該單元。.NALheaderNALU類型(5bit):說(shuō)明當(dāng)前NAL0:未規(guī)定1:非IDR圖像中不采用數(shù)據(jù)劃分的片段2:非IDR圖像中A類數(shù)據(jù)劃分片段3:非IDR圖像中B類數(shù)據(jù)劃分片段4:非IDR圖像中C類數(shù)據(jù)劃分片段5:IDR圖像的片段6:補(bǔ)充增強(qiáng)信息(SEI)7:序列參數(shù)集8:圖像參數(shù)集9:分割符10:序列結(jié)束符11:流結(jié)束符12:填充數(shù)據(jù)13–23:保留24–31:未規(guī)定.0:未規(guī)定.NAL單元分為VCL和非VCL兩種:VCLNAL單元:包含圖像編碼數(shù)據(jù);非VCLNAL單元:包含各種有關(guān)的附加信息,例如參數(shù)集、附加信息、定時(shí)信息等.NAL單元分為VCL和非VCL兩種:.NAL提供了一個(gè)編解碼器與傳輸網(wǎng)絡(luò)的通用接口,而對(duì)于不同的網(wǎng)絡(luò)環(huán)境,具體的實(shí)現(xiàn)方案是不同的。對(duì)于基于流的傳輸系統(tǒng)如H.320、MPEG等,需要按照解碼順序組織NAL單元,并為每個(gè)NAL單元前添加三個(gè)字節(jié)的起始碼ox000001。如果該NALU對(duì)應(yīng)的slice為一幀的開(kāi)始則用4位字節(jié)表示:ox00000001;對(duì)于RTP/UDP/IP系統(tǒng),則可以直接將編碼器輸出的NAL單元作為RTP的有效載荷;而對(duì)于同時(shí)提供多個(gè)邏輯信道的傳輸系統(tǒng),甚至可以根據(jù)重要性將不同類型的NAL單元在不同服務(wù)質(zhì)量的信道中傳輸.NAL提供了一個(gè)編解碼器與傳輸網(wǎng)絡(luò)的通用接口,而對(duì)于不同的網(wǎng)序列參數(shù)集(SPS):序列頭信息,用于一系列相繼的視頻圖像的解碼圖像參數(shù)集(PPS):圖像頭信息,用于視頻序列中一個(gè)或多個(gè)圖像的解碼2)參數(shù)集參數(shù)集是一個(gè)獨(dú)立的數(shù)據(jù)單位,不依賴于參數(shù)集外的其他句法元素。參數(shù)集只是在片層句法元素需要的時(shí)候被引用,而且,一個(gè)參數(shù)集并不對(duì)應(yīng)某個(gè)特定的圖像或序列,同一個(gè)序列參數(shù)集可以被多個(gè)序列中的圖像參數(shù)集引用,同理,同一個(gè)圖像參數(shù)集也可以被多個(gè)圖像引用。只在編碼器認(rèn)為需要更新參數(shù)集的內(nèi)容時(shí),才會(huì)發(fā)送出新的參數(shù)集。在這種機(jī)制下,由于參數(shù)集是獨(dú)立的,可以被多次重發(fā)或者采用特殊技術(shù)加以保護(hù)。.序列參數(shù)集(SPS):序列頭信息,用于一系列相繼的視頻圖像的SPS#1PPS#1Slice#1PPS=1SPS#2PPS#2PPS#3Slice#2PPS=1Slice#3PPS=2Slice#4PPS=3序列和圖像參數(shù)集機(jī)制,減少了重復(fù)參數(shù)的傳送每個(gè)VCLNAL單元包含一個(gè)標(biāo)識(shí),指向有關(guān)的圖像參數(shù)集每個(gè)圖像參數(shù)集包含一個(gè)標(biāo)識(shí),指向有關(guān)的序列參數(shù)集因此,只用少數(shù)的指針信息就可引用大量的參數(shù),大大減少每個(gè)VCLNAL單元重復(fù)傳送的信息。序列和圖像參數(shù)集可以在發(fā)送VCLNAL單元以前發(fā)送,并且重復(fù)傳送,大大提高糾錯(cuò)能力。序列和圖像參數(shù)集可以在“帶內(nèi)”,也可以用更為可靠的其他“帶外”通道傳送。.SPSPPSSlice#1SPSPPSPPSSlice#3)碼流結(jié)構(gòu)NAL單元流:包含一個(gè)或多個(gè)編碼的視頻序列NAL單元流—編碼的視頻序列—存取單元—NAL單元編碼的視頻序列:包含一組在NAL單元流中連續(xù)排列的且使用同一個(gè)序列參數(shù)集的存取單元。每個(gè)編碼的視頻序列可以獨(dú)立解碼。在編碼的視頻序列中,第一幀是IDR(即時(shí)解碼刷新)幀存取單元:包含一組NAL單元,對(duì)應(yīng)一幀圖像的編碼數(shù)據(jù)。在存取單元之前,通常要有分隔符以指示存取單元的起始。有時(shí)還有SEI(補(bǔ)充增強(qiáng)信息,包含圖像定時(shí)信息),.3)碼流結(jié)構(gòu)NAL單元流:包含一個(gè)或多個(gè)編碼的視頻序列NAIDR幀IDR幀一定是I幀,但I(xiàn)幀不一定是IDR幀。一個(gè)序列中只有一個(gè)IDR幀,但可以有很多I幀。I幀之后的幀可以引用I幀之間的幀做運(yùn)動(dòng)參考,但I(xiàn)DR幀之后的幀永遠(yuǎn)不會(huì)引用IDR幀之前的幀來(lái)解碼。H.264引入IDR幀是為了解碼的重同步。當(dāng)解碼器解碼到IDR幀時(shí),立即將參考幀隊(duì)列清空,將已解碼的數(shù)據(jù)全部輸出或拋棄,重新查找參數(shù)集,開(kāi)始一個(gè)新的序列。這樣,如果在前一個(gè)序列的傳輸中發(fā)生重大錯(cuò)誤,如嚴(yán)重的丟包,或其他原因引起數(shù)據(jù)錯(cuò)位,在這里可以獲得重新同步。.IDR幀IDR幀一定是I幀,但I(xiàn)幀不一定是IDR幀..AVS視頻編碼技術(shù)AVS視頻與MPEG標(biāo)準(zhǔn)都采用混合編碼框架,包括變換、量化、熵編碼、幀內(nèi)預(yù)測(cè)、幀間預(yù)測(cè)、環(huán)路濾波等技術(shù)模塊,這是當(dāng)前主流的技術(shù)路線。

AVS的主要?jiǎng)?chuàng)新在于提出了一批具體的優(yōu)化技術(shù),在較低的復(fù)雜度下實(shí)現(xiàn)了與國(guó)際標(biāo)準(zhǔn)相當(dāng)?shù)募夹g(shù)性能,但并未使用國(guó)際標(biāo)準(zhǔn)背后的大量復(fù)雜的專利。

AVS-視頻中具有特征性的核心技術(shù)包括:8x8整數(shù)變換、量化、幀內(nèi)預(yù)測(cè)、1/4精度像素插值、特殊的幀間預(yù)測(cè)運(yùn)動(dòng)補(bǔ)償、二維熵編碼、去塊效應(yīng)環(huán)路濾波等。

.AVS視頻編碼技術(shù)AVS視頻與MPEG標(biāo)準(zhǔn)都采用混合編..return.return.視頻壓縮損傷分析1、壓縮算法在圖像壓縮標(biāo)準(zhǔn)中的應(yīng)用情況基于DCT的算法主要應(yīng)用了預(yù)測(cè)編碼和DCT來(lái)去除時(shí)間和空間上的相關(guān)性,同時(shí)通過(guò)量化和可變長(zhǎng)編碼來(lái)實(shí)現(xiàn)數(shù)據(jù)壓縮應(yīng)用:JPEG、MPEG1、MPEG2、MPEG4、H.261

等基于小波變換的算法利用小波變換將圖像分解成不同頻段的子帶,根據(jù)人眼的視覺(jué)特性對(duì)不同頻段的小波系數(shù)進(jìn)行粗細(xì)不同的量化處理并進(jìn)行編碼應(yīng)用:JPEG2000、MPEG4(靜止圖像的編碼)等

.視頻壓縮損傷分析1、壓縮算法在圖像壓縮標(biāo)準(zhǔn)中的應(yīng)用情況基于D2、壓縮損傷的產(chǎn)生原因DCT量化VLC緩存器碼率控制象素塊象素塊差恒定碼率輸出壓縮損傷來(lái)自量化環(huán)節(jié)量化步長(zhǎng)的大小決定了壓縮比和壓縮損傷的大小當(dāng)量化步長(zhǎng)較大時(shí),壓縮比較大,同時(shí)圖像損傷也較大當(dāng)量化步長(zhǎng)較小時(shí),壓縮比較小,同時(shí)圖像損傷也較小為保證恒定碼率輸出,通常采用緩存器進(jìn)行輸出碼率的動(dòng)態(tài)調(diào)整.2、壓縮損傷的產(chǎn)生原因DCT量化VLC緩存器碼率控制象素塊恒DCT量化VLC緩存器碼率控制象素塊象素塊差恒定碼率輸出緩存器對(duì)輸出碼率的控制通過(guò)調(diào)整量化步長(zhǎng)來(lái)實(shí)現(xiàn)通常使用的方法是將緩沖器的占有率信息反饋到量化器,控制量化步長(zhǎng)當(dāng)占有率過(guò)大時(shí),增加量化步長(zhǎng),這時(shí)進(jìn)入到緩沖器的碼率會(huì)下降,緩沖器占有率也會(huì)相應(yīng)減小當(dāng)占有率過(guò)小時(shí),減小量化步長(zhǎng),這時(shí)進(jìn)入到緩沖器的碼率會(huì)升高,緩沖器占有率也會(huì)相應(yīng)增加。.DCT量化VLC緩存器碼率控制象素塊恒定碼率輸出緩存器對(duì)輸出3、壓縮損傷的視覺(jué)表現(xiàn)形式振鈴現(xiàn)象振鈴效應(yīng)相當(dāng)于二維的Gibbs現(xiàn)象

對(duì)時(shí)域階梯信號(hào)進(jìn)行傅氏變換后,將某個(gè)頻率之上的所有頻率分量都截去,然后用剩下的部分恢復(fù)時(shí)域信號(hào),則恢復(fù)后的信號(hào)在階梯兩則會(huì)發(fā)生過(guò)沖和振鈴,而且上升沿也不再陡峭Gibbs現(xiàn)象.3、壓縮損傷的視覺(jué)表現(xiàn)形式振鈴現(xiàn)象振鈴效應(yīng)相當(dāng)于二維的Gib對(duì)于一幅圖像而言,其DCT系數(shù)經(jīng)量化之后,高頻系數(shù)往往很小,通常被近似為零,這相當(dāng)于將圖像的高頻部分截去。用剩下的直流和低頻系數(shù)去重建圖像時(shí),重建的圖像就會(huì)出現(xiàn)振鈴現(xiàn)象。振鈴現(xiàn)象發(fā)生在圖像內(nèi)容出現(xiàn)高對(duì)比度變化的邊緣、輪廓區(qū)域,且當(dāng)邊緣、輪廓兩側(cè)為均勻亮度,不太暗也不太亮?xí)r容易覺(jué)察。在MPEG2中,壓縮比為中、低級(jí)時(shí)振鈴現(xiàn)象比較明顯。壓縮比較高時(shí),塊效應(yīng)和邊緣模糊會(huì)比較明顯,將成為主要的壓縮損傷,而振鈴現(xiàn)象則不易覺(jué)察。.對(duì)于一幅圖像而言,其DCT系數(shù)經(jīng)量化之后,高頻系數(shù)往往很小,塊效應(yīng)造成塊效應(yīng)的直接原因是DCT的分塊特性。相鄰塊的DCT系數(shù)有很大的相關(guān)性,因此同一空間頻率分量的系數(shù)值之間通常很接近。但DCT系數(shù)的量化過(guò)程可能會(huì)導(dǎo)致相鄰塊中同一空間頻率分量的系數(shù)被量化到不同的量化級(jí)上。這種量化結(jié)果在量化步長(zhǎng)較大時(shí)會(huì)產(chǎn)生嚴(yán)重的后果,即本來(lái)相鄰塊中代表同一頻率分量的系數(shù)值之間差別很小,但經(jīng)編解碼過(guò)程的量化和反量化后,這些系數(shù)值的差別變得很大。此時(shí)重建的圖像就會(huì)出現(xiàn)明顯的塊效應(yīng),即在跨越各個(gè)像素塊的邊界時(shí)像素的亮度(或顏色)和梯度發(fā)生變化。塊效應(yīng)破壞了塊與塊之間的連續(xù)性,使得各塊內(nèi)容不能很好地銜接,看上去圖像內(nèi)容發(fā)生扭曲。塊效應(yīng)主要出現(xiàn)的中、高壓縮比的情況。

.塊效應(yīng)造成塊效應(yīng)的直接原因是DCT的分塊特性。相鄰塊的DCT細(xì)節(jié)丟失對(duì)DCT系數(shù)矩陣進(jìn)行量化時(shí),不同頻率分量的系數(shù)采用不同的量化步長(zhǎng)。高頻AC系數(shù)采用粗量化,即量化步長(zhǎng)較大。當(dāng)提高壓縮比時(shí),這一量化步長(zhǎng)還會(huì)進(jìn)一步增大,由此會(huì)導(dǎo)致很多高頻AC系數(shù)為零。因此圖像中的邊緣、輪廓等細(xì)節(jié)部分會(huì)丟失。

細(xì)節(jié)丟失主要出現(xiàn)在高壓縮比的情況。

.細(xì)節(jié)丟失對(duì)DCT系數(shù)矩陣進(jìn)行量化時(shí),不同頻率分量的系數(shù)采用不4、易出現(xiàn)壓縮損傷的素材類型圖像細(xì)節(jié)豐富運(yùn)動(dòng)形式復(fù)雜序列中前后畫面相關(guān)性較差其它.4、易出現(xiàn)壓縮損傷的素材類型圖像細(xì)節(jié)豐富.return.return.....return.return.return.return.return.return.數(shù)字電視信源編碼技術(shù)概述視頻壓縮編碼技術(shù)視頻壓縮編碼標(biāo)準(zhǔn)介紹MPEG2視頻編碼技術(shù)H.264視頻編碼技術(shù)AVS視頻編碼技術(shù)視頻壓縮損傷分析.數(shù)字電視信源編碼技術(shù)概述.概述通過(guò)壓縮編碼技術(shù)來(lái)去除視頻、音頻、數(shù)據(jù)等原始信號(hào)的冗余信息,以實(shí)現(xiàn)碼率壓縮與帶寬減小,使信號(hào)在各種傳輸信道中能夠有效傳輸。1、數(shù)字電視信源編碼的目的.概述通過(guò)壓縮編碼技術(shù)來(lái)去除視頻、音頻、數(shù)據(jù)等原始信號(hào)的冗余信2、壓縮的必要性電視信號(hào)數(shù)字化后:數(shù)碼率高,數(shù)據(jù)量大。例如:4:2:2編碼、8比特量化的SDTV信號(hào),其數(shù)碼率為216Mbps。若按每2bit構(gòu)成一個(gè)周期,則傳輸這樣一路數(shù)字電視信號(hào)需要有108MHz的通道帶寬。4:2:2編碼、8比特量化時(shí),一幀SDTV圖像的數(shù)據(jù)量約為8.6Mb,要記錄10分鐘的電視節(jié)目就需要130Gb的存儲(chǔ)器容量。綜上所述,要實(shí)現(xiàn)數(shù)字電視信號(hào)的有效存儲(chǔ)和傳輸,就需要采取措施降低其數(shù)據(jù)量和數(shù)碼率.2、壓縮的必要性電視信號(hào)數(shù)字化后:數(shù)碼率高,數(shù)據(jù)量大。.3、壓縮的可能性(以視頻信號(hào)為例)視頻壓縮過(guò)程:去除圖像中與信息無(wú)關(guān)或?qū)D像質(zhì)量影響不大的部分,即冗余部分。電視信號(hào)中存在很多這樣的冗余部分,這就為壓縮提供了可能性。視頻信號(hào)的冗余性表現(xiàn)在以下幾個(gè)方面:空間相關(guān)冗余時(shí)間相關(guān)冗余視覺(jué)冗余熵冗余.3、壓縮的可能性(以視頻信號(hào)為例)視頻壓縮過(guò)程:去除圖像中與空間相關(guān)冗余.空間相關(guān)冗余.時(shí)間相關(guān)冗余(幀間相關(guān)冗余)t=t1t=t2.時(shí)間相關(guān)冗余(幀間相關(guān)冗余)t=t1t=t2.人眼視覺(jué)冗余人眼視覺(jué)特性:對(duì)靜止或緩慢運(yùn)動(dòng)圖像的灰度等級(jí)及圖像細(xì)節(jié)的分辨力高對(duì)快速運(yùn)動(dòng)圖像的灰度等級(jí)及圖像細(xì)節(jié)的分辨力低觀察大面積圖像時(shí),對(duì)灰度等級(jí)分辨力高,對(duì)細(xì)節(jié)分辨力低觀察細(xì)節(jié)時(shí),對(duì)灰度等級(jí)分辨力低,對(duì)細(xì)節(jié)分辨力高人眼接收綜合信息的能力有限.人眼視覺(jué)冗余人眼視覺(jué)特性:人眼接收綜合信息的能力有限.利用人眼的視覺(jué)特性對(duì)靜止或緩慢運(yùn)動(dòng)圖像:減小幀率在圖像細(xì)節(jié)部分選擇較高的取樣頻率和較低的量化比特?cái)?shù)在大面積像塊區(qū)域選擇較低的取樣頻率和較高的量化比特?cái)?shù)對(duì)快速運(yùn)動(dòng)圖像:提高幀率降低取樣頻率和量化比特?cái)?shù).利用人眼的視覺(jué)特性對(duì)靜止或緩慢運(yùn)動(dòng)圖像:.自信息量定義:指某個(gè)隨機(jī)事件(或消息)發(fā)生后所提供的信息數(shù)量的多少任意隨機(jī)事件的自信息量為該事件發(fā)生概率的倒數(shù)的對(duì)數(shù)。熵冗余.自信息量任意隨機(jī)事件的自信息量為該事件發(fā)生概率的倒數(shù)的對(duì)數(shù)。信源熵(信源每個(gè)符號(hào)的平均信息量):P(xi)是符號(hào)xi出現(xiàn)的概率平均碼長(zhǎng)(每個(gè)符號(hào)的平均編碼長(zhǎng)度):熵冗余=平均碼長(zhǎng)-信息熵li是符號(hào)xi的編碼碼長(zhǎng).信源熵(信源每個(gè)符號(hào)的平均信息量):P(xi)是符號(hào)xi出現(xiàn)例如:某一圖像總共可出現(xiàn)4個(gè)灰度級(jí),對(duì)每個(gè)灰度級(jí)進(jìn)行二進(jìn)制定長(zhǎng)編碼時(shí),碼長(zhǎng)為2比特,即L=2bit/符號(hào)。當(dāng)每個(gè)灰度級(jí)出現(xiàn)的概率不相等時(shí):設(shè)灰度級(jí)1~4的概率分別為1/8、3/8、3/8、1/8,熵冗余=L–H=2-1.81=0.19bit/符號(hào).例如:當(dāng)每個(gè)灰度級(jí)出現(xiàn)的概率不相等時(shí):熵冗余=L–H=若采用變長(zhǎng)編碼方式,對(duì)概率大的符號(hào)賦予短碼,對(duì)概率小的符號(hào)賦予長(zhǎng)碼,則可降低平均碼長(zhǎng)L熵冗余=1.875-1.81=0.065bit/符號(hào)例如,灰度級(jí)13/81

灰度級(jí)23/801

灰度級(jí)31/8001

灰度級(jí)41/8000所以,采用變長(zhǎng)編碼可降低信源熵冗余return.若采用變長(zhǎng)編碼方式,對(duì)概率大的符號(hào)賦予短碼,對(duì)概率小的符號(hào)賦視頻壓縮編碼技術(shù)第一代視頻編碼技術(shù)(經(jīng)典的視頻編碼技術(shù)):以香農(nóng)信息論為基礎(chǔ)采用基于象素或象素塊的方法來(lái)表征視頻信息利用圖像信號(hào)的統(tǒng)計(jì)特性來(lái)設(shè)計(jì)編碼器未考慮事件本身的具體含義、重要程度及引起后果未充分考慮人眼視覺(jué)特性對(duì)編碼圖像的影響只能去除數(shù)據(jù)冗余-低層壓縮1、視頻壓縮編碼技術(shù)的研究進(jìn)展變換編碼:DCT+量化預(yù)測(cè)編碼:MC幀間預(yù)測(cè)熵編碼:VLC.視頻壓縮編碼技術(shù)第一代視頻編碼技術(shù)(經(jīng)典的視頻編碼技術(shù)):1第二代視頻編碼技術(shù):突破了香農(nóng)信息論的框架采用基于內(nèi)容的方法來(lái)表征視頻信息充分考慮人眼視覺(jué)特性及信源特性通過(guò)去除內(nèi)容冗余來(lái)實(shí)現(xiàn)數(shù)據(jù)壓縮基于對(duì)象的視頻壓縮-中層壓縮基于語(yǔ)義的視頻壓縮-高層壓縮分形編碼分級(jí)編碼模型基編碼.第二代視頻編碼技術(shù):分形編碼.視頻壓縮編碼用到的主要算法統(tǒng)計(jì)編碼變換編碼預(yù)測(cè)編碼分析、綜合編碼霍夫曼編碼游程編碼算術(shù)編碼字典編碼DCT變換編碼運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)編碼子帶編碼分級(jí)編碼分形編碼模型基編碼.視頻壓縮編碼用到的主要算法統(tǒng)計(jì)編碼變換編碼預(yù)測(cè)編碼分析、綜合2、視頻壓縮編碼分類按無(wú)損壓縮和有損壓縮進(jìn)行分類:無(wú)損壓縮編碼、有損壓縮編碼按信源模型進(jìn)行分類:基于波形編碼、基于內(nèi)容編碼按壓縮編碼原理進(jìn)行分類:統(tǒng)計(jì)編碼、預(yù)測(cè)編碼、變換編碼、矢量量化編碼.2、視頻壓縮編碼分類按無(wú)損壓縮和有損壓縮進(jìn)行分類:按信源模3、預(yù)測(cè)編碼3.1預(yù)測(cè)編碼的基本原理預(yù)測(cè)編碼傳送的不是實(shí)際像素值,而是實(shí)際值與其預(yù)測(cè)值之間的差值,即預(yù)測(cè)誤差。像素的預(yù)測(cè)值由其在時(shí)間和空間上相鄰的若干個(gè)像素的線性組合產(chǎn)生,它反映了在預(yù)測(cè)區(qū)域內(nèi)各像素的共性部分,因此用像素的實(shí)際值減去其預(yù)測(cè)值就可基本去除像素間的相關(guān)性。.3、預(yù)測(cè)編碼3.1預(yù)測(cè)編碼的基本原理.預(yù)測(cè)器++en’Xn’預(yù)測(cè)器+-Xnenen’量化器編碼器傳輸通道解碼器輸入輸出++en’=en+Δx=Xn-+ΔxXn’=en’+=Xn+Δx若不考慮量化器的影響,則有Xn’=Xn(無(wú)損壓縮)Δx:量化誤差.預(yù)測(cè)器++en’Xn’預(yù)測(cè)器+-Xnenen’量化器編碼器傳預(yù)測(cè)編碼的壓縮效果取決于預(yù)測(cè)器的預(yù)測(cè)精度,精度越高,預(yù)測(cè)誤差越小,量化時(shí)所需的量化比特?cái)?shù)就越少,壓縮率也就越高。一般來(lái)說(shuō),參與預(yù)測(cè)的像素?cái)?shù)越多,預(yù)測(cè)值就越精確,但同時(shí)預(yù)測(cè)器電路組成也就越復(fù)雜。利用相關(guān)像素值x1、x2

……xn-1來(lái)預(yù)測(cè)當(dāng)前像素值a1、a2······an-1稱為相關(guān)系數(shù),且滿足:.預(yù)測(cè)編碼的壓縮效果取決于預(yù)測(cè)器的預(yù)測(cè)精度,精度越高,預(yù)測(cè)誤差3.2幀內(nèi)預(yù)測(cè)編碼X1X2X3X4X5X6X7上一行相隔行當(dāng)前行當(dāng)前像素a6a4a3a2D6D4D3D2輸入由距X7最近的四個(gè)像素X6、X4

、X3、X2參與對(duì)X7的預(yù)測(cè)。相關(guān)系數(shù)為:a6=1/2、a4=a2=1/8、a3=1/4,則:

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論