版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數(shù)字視頻信息
處理與傳輸1精選ppt數(shù)字視頻壓縮標準
圖像壓縮國際標準
近十年來,圖像編碼技術得到了迅速發(fā)展和廣泛應用,并且日臻成熟,其標志就是幾個圖像壓縮國際標準的制定。即關于靜止圖像的編碼標準JPEG和JPEG2000、關于電話/會議電視的視頻編碼標準H.261,H.263和關于活動圖像的編碼標準MPEG-1,MPEG-2,MPEG-4和H.264等。
JPEG(JointPhotographicExpertGroup)
MPEG(MotionPictureExpertsGroup)2精選ppt圖像壓縮國際標準標準標題起止日期目標比特率應用場合主要編碼技術JPEG連續(xù)色調靜態(tài)圖像1986.3~1992.10
壓縮比為2~30·因特網(wǎng)·數(shù)字照相·圖像/視頻編輯
·DCT·知覺量化·霍夫曼編碼·算術編碼
JPEG2000新一代靜態(tài)圖像編碼標準
1996.2~2000.12
壓縮比為2~50·因特網(wǎng)·移動通信·數(shù)字照相·遙感·傳真·數(shù)字圖書館·JPEG所有技術·小波變換·EBCOT·ROI編碼·可擴展編碼3精選ppt圖像壓縮國際標準標準標題目標比特率應用場合主要編碼技術MPEG-1運動圖像及其伴音不超過1.5Mb/s
·光盤存儲·VCD·視頻監(jiān)控
·JPEG所有技術·自適應量化·運動補償預測MPEG-2
運動圖像及其伴音1.5~35Mb/s
·數(shù)字高清晰度電視·高品質視頻·衛(wèi)星/有線電視·地面廣播·MPEG-1所有技術·基于幀/場的運動補償·擴展編碼·容錯編碼
4精選ppt圖像壓縮國際標準標準標題目標比特率應用場合主要編碼技術MPEG-4音視頻對象的通用編碼
8kb/s~35Mb/s
·因特網(wǎng)·交互式視頻·2D/3D計算機圖形·移動通信
·MPEG-2所有技術·小波變換·運動估計/補償·可擴展編碼·位圖形狀編碼·對象編碼·動態(tài)網(wǎng)絡編碼
MPEG-7多媒體描述接口·多媒體數(shù)據(jù)庫等
MPEG-21多媒體框架
5精選ppt圖像壓縮國際標準標準標題目標比特率應用場合主要編碼技術H.261
Px64kb/s的音視頻服務Px64kb/s(p:1~30)
·ISDN視頻會議·DCT·自適應量化·運動補償預測·運動估計·霍夫曼編碼H.263低比特率通信的視頻編碼8kb/s~1.5Mb/s
·POTS視頻電話·桌面視頻電話·移動視頻電話
·H.261所有技術·雙向運動補償·半像素運動估計·高級運動估計·重疊運動補償·算術編碼
6精選ppt數(shù)字視頻壓縮標準靜態(tài)圖像壓縮國際標準1、JPEG國際靜止圖像壓縮標準7精選ppt6.2
靜態(tài)圖像壓縮國際標準
JPEG是面向靜態(tài)圖像編碼的國際標準。在相同圖像質量條件下,JPEG文件擁有比其他圖像文件格式更高的壓縮比。JPEG目前被廣泛應用于多媒體和網(wǎng)絡程序中,是現(xiàn)今萬維網(wǎng)中使用最廣泛的兩種圖像文件格式之一。JPEG是一種有損壓縮,即在壓縮過程中會丟失數(shù)據(jù),每次編輯JPEG圖像后,圖像就會被重復壓縮一次,損失就會有所增加。8精選ppt6.2
靜態(tài)圖像壓縮國際標準JPEG允許四種編碼模式:(1)順序式(Sequential)DCT方式:從左到右、從上到下對圖像順序進行基于離散余弦變換(DCT)的編碼。DCT理論上是可逆的,但在計算時存在誤差,因而基于DCT的編碼模式是一種有損編碼。9精選ppt靜態(tài)圖像壓縮國際標準(2)漸進式(Progressive)DCT方式:基于DCT,對圖像分層次進行處理,從模糊到清晰地傳輸圖像(與GIF文件的交錯方式類似)。有兩種實現(xiàn)方法,一種是頻譜選擇法,即按Z形掃描的序號將DCT量化序數(shù)分成幾個頻段,每個頻段對應一次掃描,每塊均先傳送低頻掃描數(shù)據(jù),得到原圖概貌,再依次傳送高頻掃描數(shù)據(jù),使圖像逐漸清晰;另一種是逐次逼近法,即每次掃描全部DCT量化序數(shù),但每次的表示精度逐漸提高。10精選ppt靜態(tài)圖像壓縮國際標準(3)無失真(Lossless)方式:使用線性預測器,如DPCM,而不是基于DCT。(4)分層(Hierarchical)方式:在空間域將源圖像以不同的分辨率表示,每個分辨率對應一次掃描,處理時可以基于DCT或預測編碼,可以是漸進式,也可以是順序式。11精選ppt靜態(tài)圖像壓縮國際標準JPEG定義了三種系統(tǒng):基本系統(tǒng)(BaselineSystem)擴展系統(tǒng)(ExtendedSystem)失真壓縮系統(tǒng)(LosslessSystem)一個符合JPEG標準的編解碼器至少要滿足基本系統(tǒng)的技術指標?;镜腏PEG算法屬于變換類編碼,下面針對基于DCT的順序式基本系統(tǒng)編碼來說明JPEG的編碼方法。
12精選ppt靜態(tài)圖像壓縮國際標準JPEG編碼/解碼器的流程13精選ppt靜態(tài)圖像壓縮國際標準JPEG壓縮算法的實現(xiàn)步驟:離散余弦變換(DCT);量化(Quantization);Z字型編碼(ZigZagScan);使用差分脈沖編碼調制(DPCM)對直流系數(shù)(DC)進行編碼;使用游程長度編碼(RLE)對交流系數(shù)(AC)進行編碼;熵編碼(EntropyCoding)。14精選ppt靜態(tài)圖像壓縮國際標準JPEG編碼算法過程15精選ppt靜態(tài)圖像壓縮國際標準1、數(shù)據(jù)分塊
對圖像進行編碼前,將每個分量圖像分割成不重疊的8×8像素塊,每一個8×8像素塊稱為一個數(shù)據(jù)單元(DU)。在彩色圖像中,JPEG分別壓縮圖像的每個彩色分量。雖然JPEG可以壓縮通常的紅綠藍分量,但在YCbCr空間的壓縮效果會更好。這是因為人眼對色彩的變化不如對亮度的變化敏感,因而對色彩的編碼可以比對亮度的編碼粗糙些,這主要體現(xiàn)在不同的采樣頻率和量化精度上。因此,編碼前一般先將圖像從RGB空間轉換到YCbCr空間,再把各分量圖像分割成8×8數(shù)據(jù)塊。
16精選ppt
在對圖像采樣時,可以采用不同的采樣頻率,這種技術稱為二次采樣。由于亮度比色彩更重要,因而對Y分量的采樣頻率可高于對Cb、Cr的采樣頻率,這樣有利于節(jié)省存儲空間。常用的采樣方案有YUV422和YUV411。把采樣頻率最低的分量圖像中一個DU所對應的像區(qū)上覆蓋的所有各分量上的DU按順序編組為一個最小編碼單元(MCU)。對灰度圖像而言,只有一個Y分量,MCU就是一個數(shù)據(jù)單元。而對彩色圖像而言,以4:1:1的采樣方案為例,則一個MCU由4個Y分量的DU、1個Cb分量的DU和1個Cr分量的DU組成。靜態(tài)圖像壓縮國際標準17精選ppt靜態(tài)圖像壓縮國際標準2、離散余弦變換(DCT)
對每個8×8的數(shù)據(jù)塊進行DCT后,得到的64個系數(shù)代表了該圖像塊的頻率成分,其中低頻分量集中在左上角,高頻分量分布在右下角。其中F(0,0)(即第一行第一列元素)代表了直流(DC)系數(shù),即8*8子塊的平均值,要對它單獨編碼,其余63個叫交流(AC)系數(shù)。
18精選ppt靜態(tài)圖像壓縮國際標準由于兩個相鄰的8*8子塊的DC系數(shù)相差很小,所以對它們采用差分編碼DPCM,可以提高壓縮比,也就是說對相鄰的子塊DC系數(shù)的差值進行編碼。8*8的其它63個元素是交流(AC)系數(shù),采用行程編碼。19精選ppt靜態(tài)圖像壓縮國際標準
DC系數(shù)占原來數(shù)組能量的93%。
20精選ppt靜態(tài)圖像壓縮國際標準3、系數(shù)量化在DCT處理中得到的64個系數(shù)中,低頻分量包含了圖像亮度等主要信息。在從空間域到頻域的變換中,圖像中的緩慢變化比快速變化更易引起人眼的注意,所以在重建圖像時,低頻分量的重要性高于高頻分量。因而在編碼時可以忽略高頻分量,從而達到壓縮的目的,這也是量化的根據(jù)和目的。
21精選ppt靜態(tài)圖像壓縮國際標準表1亮度量化矩陣表2色度量化矩陣
161110162440516112121419265860551413162440576956141722295187806218223756681091077243555648110411924964788710312112101729295981121001099
1718244799999999182126669999999924265699999999994766999999999999999999999999999999999999999999999999999999999999999999999999999922精選ppt在JPEG標準中,用具有64個獨立元素的量化表來規(guī)定DCT域中相應的64個系數(shù)的量化精度,使得對某個系數(shù)的具體量化階取決于人眼對該頻率分量的視覺敏感程度。理論上,對不同的空間分辨率、數(shù)據(jù)精度等情況,應該有不同的量化表。不過,一般采用上述量化表,可取得較好的視覺效果。之所以用兩張量化表,是因為Y分量比Cb和Cr更重要些,因而對Y采用細量化,而對Cb和Cr采用粗量化。靜態(tài)圖像壓縮國際標準23精選ppt量化就是用DCT變換后的系數(shù)除以量化表中相對應的量化階后四舍五入取整。由于量化表中左上角的值較小,而右下角的值較大,因而起到了保持低頻分量、抑制高頻分量的作用。靜態(tài)圖像壓縮國際標準24精選ppt圖
源圖像亮度數(shù)據(jù)塊
靜態(tài)圖像壓縮國際標準25精選ppt圖
量化結果靜態(tài)圖像壓縮國際標準26精選ppt靜態(tài)圖像壓縮國際標準4、Z字型掃描
為了保證低頻分量先出現(xiàn),高頻分量后出現(xiàn),以增加行程中連續(xù)”0”的個數(shù),這63個元素采用了”Z”字型(Zig—Zag)的排列方法,可使大多出現(xiàn)在右下角的“0”值能夠連續(xù)起來。然后再對直流(DC)系數(shù)進行差分編碼DPCM,交流(AC)系數(shù)采用行程編碼。27精選ppt靜態(tài)圖像壓縮國際標準Z掃描模型015614152728247131626294238121725304143911182431404453101923323945525420223338465155602134374750565961353648495758626328精選ppt靜態(tài)圖像壓縮國際標準5、熵編碼直流系數(shù)(DC)編碼
8X8圖像塊經(jīng)過DCT變換之后得到的DC直流系數(shù)有兩個特點,一是系數(shù)的數(shù)值比較大,二是相鄰8X8圖像塊的DC系數(shù)值變化不大。根據(jù)這個特點,JPEG算法使用了差分脈沖調制編碼(DPCM)技術,即用前一數(shù)據(jù)塊的同一分量的DC系數(shù)作為當前塊的預測值,再對相鄰圖像塊之間量化DC系數(shù)的差值進行Huffman編碼。29精選ppt
若DC系數(shù)的動態(tài)范圍為-1024~+1024,則差值的動態(tài)范圍為-2047~+2047。如果為每個差值賦予一個碼字,則碼表過于龐大。因此,JPEG對碼表進行了簡化,采用“前綴碼(SSSS)+尾碼”來表示。前綴碼指明了尾碼的有效位數(shù)B,可以根據(jù)DIFF從表中查出前綴碼對應的哈夫曼編碼。尾碼的取值取決于DC系數(shù)的差值和前綴碼。如果DC系數(shù)的差值DIFF大于等于0,則尾碼的碼字為DIFF的B位原碼;否則,取DIFF的B位反碼。靜態(tài)圖像壓縮國際標準30精選ppt靜態(tài)圖像壓縮國際標準使用熵編碼還可以對DPCM編碼后的直流DC系數(shù)和RLE編碼后的交流AC系數(shù)作進一步的壓縮,在JPEG有損壓縮算法中,使用霍夫曼編碼器來減少熵。使用霍夫曼編碼器的理由是可以使用很簡單的查表(lookuptable)方法進行編碼。31精選ppt靜態(tài)圖像壓縮國際標準壓縮數(shù)據(jù)符號時,霍夫曼編碼器對出現(xiàn)頻度比較高的符號分配比較短的代碼,而對出現(xiàn)頻度較低的符號分配比較長的代碼。這種可變長度霍夫曼表可以事先進行定義。32精選ppt表
圖像分量為8位時DC系數(shù)差值的典型哈夫曼編碼表33精選ppt靜態(tài)圖像壓縮國際標準交流系數(shù)(AC)編碼
量化后AC系數(shù)的特點是1X64矢量中包含有許多“0”系數(shù),并且許多“0”是連續(xù)的,因此使用簡單和直觀的行程編碼(RLE)對它們進行編碼。JPEG使用了1個字節(jié)的高4位來表示連續(xù)“0”的個數(shù),而使用它的低4位來表示編碼下一個非“0”系數(shù)所需的位數(shù),跟在它后面的量化AC系數(shù)的數(shù)值。34精選ppt靜態(tài)圖像壓縮國際標準
經(jīng)Z形排列后的AC系數(shù),更有可能出現(xiàn)連續(xù)0組成的字符串,從而對其進行行程編碼將有利于壓縮數(shù)據(jù)。JPEG將一個非零DC系數(shù)及其前面的0行程長度(連續(xù)0的個數(shù))的組合稱為一個事件。35精選ppt靜態(tài)圖像壓縮國際標準將每個事件編碼表示為“NNNN/SSSS+尾碼”,其中,NNNN為0行程的長度,SSSS表示尾碼的有效位數(shù)B(即當前非0系數(shù)所占的比特數(shù)),如果非零AC系數(shù)大于等于0,則尾碼的碼字為該系數(shù)的B位原碼,否則,取該系數(shù)的B位反碼。36精選ppt靜態(tài)圖像壓縮國際標準由于只用4位表示0行程的長度,故在JPEG編碼中,最大0行程只能等于15。當0行程長度大于16時,需要將其分開多次編碼,即對前面的每16個0以“F/0”表示,對剩余的繼續(xù)編碼。37精選ppt表AC系數(shù)的尾碼位數(shù)表SSSSAC系數(shù)的尾碼位數(shù)表001-1,12-3,-2,2,33-7~-4,4~74-15~-8,8~155-31~-16,16~316-63~-17,17~637-127~-64,64~1278-255~-128,128~2559-511~256,256~51110-1023~-512,512~102338精選ppt表
亮度AC系數(shù)碼表39精選ppt續(xù)表40精選ppt續(xù)表41精選ppt表
色差AC系數(shù)編碼42精選ppt續(xù)表43精選ppt續(xù)表44精選ppt靜態(tài)圖像壓縮國際標準JPEG圖像數(shù)據(jù)片段
45精選ppt靜態(tài)圖像壓縮國際標準FFD8:圖像開始標記(SOI),標識壓縮數(shù)據(jù)的開
始,標記是用來標識壓縮數(shù)據(jù)格式中的不同
的結構單元的,所有的標記都是由1個FF字
節(jié)和1個不等于0或FF的字節(jié)組成的,本文所
分析的標記都是典型且必須的。FFE0:應用數(shù)據(jù)標記(APP0),標識應用數(shù)據(jù)段的開
始。0010:應用數(shù)據(jù)段長度參數(shù)(Lp),該參數(shù)本身長度為
兩個字節(jié),其值表示應用數(shù)據(jù)段包含的字
數(shù),但是不包括APP0的兩個字節(jié),這里長
度為16個字節(jié)。46精選ppt靜態(tài)圖像壓縮國際標準4A46494600:文件標識符,即JFIF+NUL的ASCII
碼。0101:文件版本號,一般為0101或0102。01:表示X和Y的密度單位,值為0,無單位,
值為1,單位為“點數(shù)/英寸”,值為2,單位為
“點數(shù)/厘米”。0060:表示X軸方向密度。0060:表示Y軸方向密度。47精選ppt靜態(tài)圖像壓縮國際標準00:表示縮略圖水平像素數(shù)目,一般為00。00:表示縮略圖垂直像素數(shù)目,一般為00。FFD8:定義量化表標記(DQT),標明量化表說
明參數(shù)的開始,可能有多個該標記,分
別用來表示量化表0.量化表1....,量化表
n,這里表示量化表0。48精選ppt靜態(tài)圖像壓縮國際標準0043:表示長度參數(shù)(Ld),該參數(shù)本身長度為
兩個字節(jié),其值表示量化表包含的字節(jié)
數(shù),但是不包括DQT的兩個字節(jié),這里
長度為67個字節(jié)。49精選ppt靜態(tài)圖像壓縮國際標準00:前4位為量化表元素精度參數(shù)(Pq),值0表示
量化表元素精度為8位,值1表示量化表元素
精度為16位;后4位為量化表目標標識符(Tq)
指定位于解碼器中的4個可能目標中的1個用
于安裝量化表,這里指定目標0。08060607060508······38323C2E33332:
以上為量化表元素(Qr}共有64個。FFDB:定義量化表標記(DQT},這里表示量化表1。50精選ppt靜態(tài)圖像壓縮國際標準2、JPEG2000國際靜止圖像壓縮標準
多媒體應用的發(fā)展,對圖像壓縮技術提出了更高的要求,傳統(tǒng)的JPEG已無法滿足人們對多媒體圖像的進一步需要,主要表現(xiàn)為以下不足:低比特率壓縮性能:目前的JPEG標準在中高速比特率的情況下,有較好的率失真性能,但是,當比特率低于0.25bpp時,方塊效應顯著,視覺失真很大。無損和有損壓縮:目前的JPEG標準不能在同一個壓縮碼流中同時提供無損和有損兩種壓縮編碼方式。51精選ppt靜態(tài)圖像壓縮國際標準單一的解碼過程:目前的JPEG有44中模式,大部分模式是針對不同的應用提出的,沒有通用性,這給交換、傳輸壓縮圖像數(shù)據(jù)帶來很大的麻煩。噪聲環(huán)境下的傳輸:在噪聲環(huán)境下,傳輸JPEG壓縮碼流產(chǎn)生誤碼時,圖像恢復質量將很差。計算機圖形:當前的標準對自然圖像的壓縮性能較好,但是處理由計算機繪制的圖形,其壓縮性能變差。復合文檔:使用JPEG對包含有文字、圖像等內容的復合文檔,如HTML等進行壓縮,效果不好。52精選ppt靜態(tài)圖像壓縮國際標準
另一方面,小波技術日益發(fā)展成熟。小波變換的一個最大特點就是能夠同時在時域和頻域上反映信號的局部特性。圖像經(jīng)過小波變換后,被分解成不同頻段的子帶,根據(jù)人類視覺特性,對不同頻段的數(shù)據(jù)進行粗細不同的量化處理,可達到較好的壓縮效果。此外,小波變換快速算法簡單、運行速度快,從而,小波技術成為當前圖像壓縮領域的研究熱點,涌現(xiàn)出許多優(yōu)秀的基于小波變換的圖像壓縮算法,不僅大大提高了壓縮性能,而且還增強了壓縮碼流的功能。53精選ppt靜態(tài)圖像壓縮國際標準綜上,隨著多媒體技術和網(wǎng)絡的發(fā)展,原有的圖像壓縮標準已不能滿足應用的需要,同時,基于小波變換的圖像壓縮算法日益成熟,為新壓縮標準的制定提供了解決方案,新一代的圖像壓縮標準——JPEG2000應運而生。
54精選ppt靜態(tài)圖像壓縮國際標準二、JPEG2000圖像編碼系統(tǒng)和解碼系統(tǒng)55精選ppt靜態(tài)圖像壓縮國際標準56精選ppt靜態(tài)圖像壓縮國際標準三、JPEG2000的關鍵技術為了實現(xiàn)上述特點,JPEG2000采用多種技術,本文對其中主要的關鍵技術,如壓縮碼流的可分級技術,ROI(RegionofInterest)區(qū)域處理,隨機存取碼流數(shù)據(jù),碼流的容錯技術等作以介紹。
57精選ppt靜態(tài)圖像壓縮國際標準1、壓縮碼流的可分級性
許多應用希望解碼器能夠解碼出具有不同質量或者分辨率的圖像,為了滿足這一要求,JPEG2000圖像編碼系統(tǒng)采用EBCOT算法思想,使得壓縮碼流同時具有質量可分級性和分辨率可分級性。圖像的可分級壓縮編碼是指通過編碼,可獲取多于一個質量級或者分辨率級的圖像。58精選ppt靜態(tài)圖像壓縮國際標準質量可分級性質量可分級性,也稱信噪比(SNR)可分級性,是指解碼系統(tǒng)對同一個壓縮碼流源進行解碼,可獲得至少兩層或兩層以上具有相同大小,不同質量的圖像。其中,較低層提供基本的圖像質量,高層,即增強層,在低層的基礎上改善圖像質量。59精選ppt靜態(tài)圖像壓縮國際標準質量可分級性
(a)0.0625bpp(b)0.25bpp圖
質量可分級示意圖60精選ppt靜態(tài)圖像壓縮國際標準分辨率可分級性
分辨率可分級性,也稱空間可分級性,是指解碼系統(tǒng)對同一個壓縮碼流源進行解碼,可獲得至少兩層或兩層以上具有不同大小的圖像。其中,較低層提供基本的圖像分辨率,高層即增強層在低層的基礎上增加圖像的分辨率。61精選ppt靜態(tài)圖像壓縮國際標準分辨率可分級性(a)分辨率級為0級(b)分辨率級為1級圖
分辨率可分級示意圖62精選ppt靜態(tài)圖像壓縮國際標準2、感興趣區(qū)域處理(ROI,RegionofInterest)在處理圖像時,通常,我們只對其中的部分區(qū)域感興趣,對這樣的區(qū)域往往有較高的質量要求,有時甚至希望是無損壓縮,稱此區(qū)域為ROI區(qū)域。為了得到較高的壓縮效率,我們可把圖像的其他部分看成是背景,分配較少的比特數(shù),而給ROI區(qū)域分配較多的比特數(shù)。在傳輸圖像的壓縮碼流時,ROI區(qū)域可先于圖像的其他部分被傳輸,如果壓縮碼流被截取,則在一定程度上可保證ROI的質量。63精選ppt靜態(tài)圖像壓縮國際標準感興趣區(qū)域處理
(a)0.0625bpp(b)0.25bpp
(c)0.5bpp(d)2.0bppROI區(qū)域編碼示意圖64精選ppt靜態(tài)圖像壓縮國際標準3、抗誤碼性能通常,無線通訊信道上有很大的噪聲干擾,往往會形成隨機的或者迸發(fā)性的比特錯誤。在互聯(lián)網(wǎng)上,由于堵塞也會產(chǎn)生丟失數(shù)據(jù)包的錯誤。因此,要求在這種環(huán)境中傳輸?shù)臄?shù)據(jù)碼流具有較強的容錯性。在JPEG2000標準中,采取了一些措施,來提高圖像壓縮碼流的抗誤碼性能。分塊編碼:對量化后的子帶系數(shù)分成若干個小的編碼單元——碼塊,對每個碼塊進行獨立的編解碼。這樣,當一個碼塊的位流發(fā)生比特錯誤時,只會把錯誤引起的影響限制在本碼塊中,不會造成誤碼的傳播。65精選ppt靜態(tài)圖像壓縮國際標準算術編碼的終止處理:在進行嵌入式碼塊編碼時,允許算術編碼器在每個編碼通道上終止,重新初始化上下文。這樣,解碼器發(fā)現(xiàn)錯誤時,可終止該編碼通道的解碼,對后面的編碼通道位流繼續(xù)執(zhí)行正確的解碼過程。壓縮碼流格式中的抗誤碼處理:在形成最終的壓縮碼流時,采用了稱為包(packet)的結構單元,用來存放壓縮位流數(shù)據(jù)。每個包的數(shù)據(jù)前面含有再同步信息標志,允許發(fā)生錯誤后重新恢復同步。66精選ppt數(shù)字視頻壓縮標準MPEG數(shù)字視頻壓縮標準視頻數(shù)據(jù)的特點鏡頭的時間冗余特性;圖像的空間冗余特性;人眼的視覺冗余特性。視頻壓縮編碼的出發(fā)點
基于塊的運動估計以消除時間冗余;基于變換的方法以是能量更加集中;針對性的量化方法視覺冗余特性;基于頻譜重排以消除統(tǒng)計冗余。67精選ppt數(shù)字視頻壓縮標準一、MPEG-1視頻壓縮標準
MPEG-1是由ISO/IEC于1991年提出的,正式名稱為“用于數(shù)字存儲媒體的1.5Mbit/s以下的活動圖像及相關音頻編碼”(ISO/IEC11172)。其中的數(shù)字存儲媒體包括光盤(CD),視頻光盤(VCD),其中分配比特的方案是在1.5Mbps的數(shù)據(jù)傳輸中1.2Mbps用于編碼視頻,256Kbps用于立體聲。68精選ppt數(shù)字視頻壓縮標準MPEG-1包括五個部分:系統(tǒng)、視頻、音頻、一致性、及軟件。在MPEG-1只采用逐行掃描方式,采用4:2:0的亞采樣格式,其源輸入格式是SIF,有352x288x25
和
352x288x30
兩種格式。69精選pptMPEG數(shù)字視頻壓縮標準1、MPEG-1編碼器原理
70精選pptMPEG數(shù)字視頻壓縮標準MPEG-1采用兩種壓縮方法:幀內壓縮算法:采用與JPEG壓縮算法大致相同的方法,即基于DCT的變換編碼技術,用以減少空間冗余信息。幀間壓縮算法:采用運動補償算法、預測編碼方法、以及差補法等編碼方法。幀間編碼技術可以減少時間冗余信息。
71精選pptMPEG數(shù)字視頻壓縮標準2、MPEG-1視頻幀的定義
72精選ppt6.3MPEG數(shù)字視頻壓縮標準
3、MPEG-1碼流結構
73精選ppt6.3MPEG數(shù)字視頻壓縮標準視頻幀的重排
74精選pptMPEG數(shù)字視頻壓縮標準例題:1、MPEG-1編碼時三種類型圖像(I幀、P幀和B幀)的關系為:IBBBPBBBPBBB,請排列出編碼器實際的編碼圖像順序。
75精選pptMPEG數(shù)字視頻壓縮標準3、MPEG-1視頻壓縮編碼算法在MPEG-1編碼中,為了支持隨機訪問與高效壓縮的要求,定義了三種編碼類型:I幀圖像編碼(幀內圖像)、P幀圖像編碼(預測圖像)、B幀圖像編碼(差補圖或雙向預測圖像)。
D幀圖像編碼(直流分量圖像)這三種類型的幀按某種方式組織在一起就構成了GOP。76精選pptMPEG數(shù)字視頻壓縮標準
77精選pptMPEG數(shù)字視頻壓縮標準I幀圖像的編碼
I幀圖像是利用圖像的空間相關性進行壓縮,其壓縮編碼采用類似JPEG壓縮算法,同時I幀圖像又是P幀圖像和B幀圖像的參考圖像,所以I幀圖像壓縮率不高,壓縮倍數(shù)在8倍左右。
78精選pptMPEG數(shù)字視頻壓縮標準
幀內圖像I不參照任何過去的或者將來的其它圖像幀,壓縮編碼采用類似JPEG壓縮算法:如果電視圖像是用RGB空間表示的,則首先把它轉換成YCrCb空間表示的圖像。每個圖像平面分成8×8的圖塊,對每個圖塊進行離散余弦變換DCT。DCT變換后經(jīng)過量化的交流分量系數(shù)后進行Z掃描,然后再使用無損壓縮技術進行編碼。79精選pptMPEG數(shù)字視頻壓縮標準
DCT變換后經(jīng)過量化的直流分量系數(shù)采用差分脈沖編碼DPCM,交流分量系數(shù)采用游程編碼RLE,然后再采用霍夫曼(Huffman)編碼或者用算術編碼。具體算法如前面介紹的JPEG時所述,它的編碼框圖下圖所示
80精選pptMPEG數(shù)字視頻壓縮標準I幀編碼81精選pptMPEG數(shù)字視頻壓縮標準P幀圖像的編碼
P幀圖像是參考過去的I幀圖像(幀內圖像)或者過去的預測得到P幀圖像用運動補償預測技術進行編碼,這些預測圖像通常作為進一步預測的參考幀,預測圖像的編碼效率較高。
82精選pptMPEG數(shù)字視頻壓縮標準
P幀圖像的編碼也是以圖像宏塊為基本編碼單元。預測編碼的基礎是運動估值,它將直接影響到整個系統(tǒng)的編碼效率和壓縮性能,因此希望找到一種預測精度高同時計算量又小的運動估值算法。
83精選pptMPEG數(shù)字視頻壓縮標準
84精選pptMPEG數(shù)字視頻壓縮標準
P幀編碼85精選pptMPEG數(shù)字視頻壓縮標準
P幀編碼時,編碼器需要對每一個宏塊作以下選擇:(1)決定是否作運動補償(MC/No-MC),即是將
運動矢量發(fā)送出去,還是設其為0。在許多
情況下,使用非零的運動矢量并不比使用零
值的運動矢量所形成的誤差少多少。而非
零運動矢量需要額外的編碼比特,因此這
時可設運動矢量為0,這樣可以提高編碼效
率。86精選pptMPEG數(shù)字視頻壓縮標準(2)決定采用幀內編碼還是幀間編碼,即是采
用幀內宏塊編碼還是利用運動矢量預測編
碼。在許多情況下,某些宏塊采用幀內編
碼方式也許會用更少的比特。這通常發(fā)生
在由于運動十分劇烈而導致運動估計失敗
的情況。87精選pptMPEG數(shù)字視頻壓縮標準(3)決定宏塊要不要編碼。有時在量化后,宏
塊中所有的DCT系數(shù)都是0,這種宏塊就不
需要被編碼。在對這種宏塊解碼時,只需
要從過去的幀中把對應的宏塊復制到這個
宏塊就行了。(4)決定量化等級是否符合要求,是否需要改
變。88精選pptMPEG數(shù)字視頻壓縮標準
B幀圖像的編碼
B幀圖像(或稱雙向圖)在預測時,既可使用前向預測方式,也可使用后向預測方式,或同時使用雙向預測后取平均方式(雙向幀間預測),取決于哪一種方式下表示該宏塊所需的信息量為最少。使用雙向預測后,可以使那些在前一幀中預測不到的內容很好地在后一幀中預測到,而且通過預測后取平均,非常有效地減少了預測噪聲的影響。它的壓縮效率最高,但雙向預測圖像不作為預測的參考圖像。89精選pptMPEG數(shù)字視頻壓縮標準
B幀編碼90精選pptMPEG數(shù)字視頻壓縮標準類似于P幀,B幀在編碼前同樣要作一系列的決定,其流程如下:(1)決定運動補償模式,即前向,后向及插值
運動補償中哪個能達到最佳。
宏塊運動補償模式的選擇是基于代價函數(shù)的最小值。代價函數(shù)是運動補償宏塊和當前宏塊的亮度差的均方誤差。解碼器通過一種簡單的方法為前向運動補償計算最佳運動補償宏塊。然后再為后向運動補償計算最佳運動補償宏塊。最后再求兩種運動補償宏塊的均值,從而產(chǎn)生宏塊的插值。然后再選擇它與當前宏塊均方誤差最小的方式。如果找不出最小值,就選取宏塊插值方式。91精選pptMPEG數(shù)字視頻壓縮標準(2)決定采用幀內/幀間編碼。即宏塊類型是幀內編碼還是使用運動矢量作運動補償編碼。計算方法和P幀的類似,解碼器計算差分宏塊和當前宏塊的變化。如果兩者的變化相同則選擇非幀內編碼(參考該節(jié)的流程序圖分析)。92精選pptMPEG數(shù)字視頻壓縮標準(3)如果宏塊類型是非幀內宏塊,則要決定這
個宏塊是否編碼,即殘差是否大得足以采
用DCT變換。解碼器根據(jù)量化的結果選擇編
碼與否,當所有量化系數(shù)都為零時,則這個
塊不用編碼.如果宏塊中沒有編碼的塊,則
這個宏塊不需編碼,否則該宏塊需要編
碼。(4)決定量化尺寸是否滿足要求,是否需要改
變尺寸。93精選pptMPEG數(shù)字視頻壓縮標準D幀編碼D幀圖像只包含有直流分量的圖像,也稱為直流圖像,它是專門為快速播放和快速檢索功能而設計的,但由于它不能作為其它幀的預測幀,一次使用不多。94精選pptMPEG數(shù)字視頻壓縮標準二、MPEG-2視頻壓縮標準
MPEG-2標準的發(fā)展始于1990年,其正式名稱為“通用活動圖像及其伴音編碼”(ISO/IEC13818)。MPEG-2是一個通用多媒體編碼標準,具有更為廣闊的應用范圍和更高的編碼質量,其應用范圍包括數(shù)字儲存,高清晰數(shù)字電視,高質量視頻通信。根據(jù)應用不同,MPEG-2的碼率范圍為1.5~100Mbit/s。一般情況下,只有碼率超過4Mbit/s的MPEG-2視頻,其質量才能明顯優(yōu)于MPEG-1。
95精選pptMPEG數(shù)字視頻壓縮標準根據(jù)其檔次與級別的不同,MPEG-2支持分辨率由高到低的多種圖像類型,支持三種采樣格式,即4:2:0、4:2:2、4:4:4??刹捎弥鹦袙呙璺绞揭部刹捎酶粜袙呙璺绞?。MPEG-2采用不同檔次與級別共20中組合,選取其中11中作為應用選擇。96精選pptMPEG數(shù)字視頻壓縮標準MPEG-297精選pptMPEG數(shù)字視頻壓縮標準在應用方面與MPEG-1的不同之處在于,MPEG-1是為一臺計算機的CD上以較低的碼率存儲和播放視頻而定制的。MPEG-2用于高于4Mbps的碼率的存儲和播放更高質量的視頻。MPEG-2標準制定初衷是為高清數(shù)字電視HDTV標準而開發(fā)的并可以用于其他方面。98精選pptMPEG數(shù)字視頻壓縮標準
從某種程度上來說,MPEG-2可視為一組MPEG-1的最高級編碼標準,但其編碼流程從本質上與MPEG-1是相同的。MPEG-2與MPEG-1編碼的相同點:I-幀編碼模式相同,都是采用8×8的DCT
變換;2)P以及B幀都是采用半象素的運動補償;3)編碼MV時所用的預測方法相同。99精選pptMPEG數(shù)字視頻壓縮標準MPEG-2與MPEG-1編碼的不同點:1、MPEG1只處理逐行掃描的序列,而MPEG2的目
標時支持高分辨率的隔行掃描的序
列(BT.601=4CIF)2、更先進的運動估計方法(幀/場預測模式)
以提高隔行掃描序列的運動估計精度3、針對隔行掃描序列開發(fā)了不同的DCT模式和
掃描方法4、MPEG2具有各種模式的可伸縮性5、MPEG2具有不同級別和層次的方法,每個方
法均可用于不同的應用。
100精選pptMPEG數(shù)字視頻壓縮標準101精選pptMPEG數(shù)字視頻壓縮標準MPEG-2編碼模式基于幀的編碼基于場的編碼102精選pptMPEG數(shù)字視頻壓縮標準DCT掃描模式Zig-Zag掃描模式交錯掃描模式:更加注重利用水平方向的
相關性。因為隔行掃描其
水平方向相關性較強。103精選pptMPEG數(shù)字視頻壓縮標準MPEG-2中可伸縮的編碼(ScalableVideoCoding)
WhyweneedSVC?MPEG-2的應用(數(shù)字廣播、HDTV、DVD)碼率不同、不同用戶、需求不同104精選pptMPEG數(shù)字視頻壓縮標準MPEG-2中可伸縮的編碼
(1)SNR可伸縮(2)空間可伸縮(3)時間可伸縮(4)混合可伸縮105精選pptMPEG數(shù)字視頻壓縮標準SNR可伸縮和空間可伸縮106精選pptMPEG數(shù)字視頻壓縮標準數(shù)據(jù)分割:一個基本層和多個增強層基本層可通過獨立編碼、傳輸和解碼獲得基本
的傳輸質量;增強層的編碼和解碼依賴于基層及其之前的增
強層107精選pptMPEG數(shù)字視頻壓縮標準108精選pptMPEG數(shù)字視頻壓縮標準三、MPEG-4視頻壓縮標準MPEG-4標準于1999年發(fā)布。它不僅針對一定比特率下的視頻、音頻編碼,更加注重多媒體系統(tǒng)的交互性和靈活性。這個標準主要應用于視像電話、視像電子郵件等,對傳輸速率要求較低,在4800-6400bit/s之間,分辨率為176×144。109精選pptMPEG數(shù)字視頻壓縮標準MPEG-4利用很窄的帶寬,通過幀重建技術、數(shù)據(jù)壓縮,以求用最少的數(shù)據(jù)獲得最佳的圖像質量。利用MPEG-4的高壓縮率和高的圖像還原質量可以把DVD里面的MPEG-2視頻文件轉換為體積更小的視頻文件。經(jīng)過這樣處理,圖像的視頻質量下降不大,但數(shù)據(jù)可縮小幾倍,可以很方便地用CD-ROM來保存DVD上的數(shù)據(jù)。
110精選pptMPEG數(shù)字視頻壓縮標準1、MPEG-4標準目標(1)專門用于64kbps以下甚低碼率的音視頻
編碼(高壓縮率)(2)適用于移動通訊、個人通訊、固定公用
通訊網(wǎng)和電視電話(質量可調性)(3)提供互動性,基于內容的編碼2、MPEG-4視頻編碼的特點(1)基于對象的編碼(音視頻對象A/VO)(2)提供互動性(3)自然視頻于計算機生成媒體的整合
111精選pptMPEG數(shù)字視頻壓縮標準112精選pptMPEG數(shù)字視頻壓縮標準
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年地下水位測量的鉆探技術
- 2026年物業(yè)管理在房地產(chǎn)市場中的重要性
- 2026年靜力學的基本概念
- 2026內蒙古烏拉特前旗招聘益性崗位人員36人筆試備考題庫及答案解析
- 2025年廣西農村投資集團的筆試及答案
- 2025年企業(yè)招聘會計筆試題庫及答案
- 2026年水資源開發(fā)中的社會經(jīng)濟影響
- 2025年徐州初中數(shù)學筆試真題及答案
- 2025年富陽區(qū)幼教合同制筆試及答案
- 2025年教師資格筆試刷題庫及答案
- 達人精準運營方案
- 四川省涼山州2025-2026學年上學期期末考試七年級數(shù)學試題(含答案)
- 管網(wǎng)安全生產(chǎn)管理制度
- DB2310-T 099-2022 牡丹江市中藥材火麻仁種植技術規(guī)程
- 婦產(chǎn)??漆t(yī)院危重孕產(chǎn)婦救治中心建設與管理指南
- 2026年建筑物智能化與電氣節(jié)能技術發(fā)展
- 2026年浙江高考英語考試真題及答案
- 垃圾填埋場排水施工方案
- 民航華東地區(qū)管理局機關服務中心2025年公開招聘工作人員考試題庫必考題
- 員工個人成長經(jīng)歷分享
- 自平衡多級泵培訓課件
評論
0/150
提交評論