版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第六章變換編碼變換編碼變換編碼(TransformCoding):將信源輸出分解/變換為其組成部分,然后根據(jù)每個(gè)成分的特性分別進(jìn)行編碼主要內(nèi)容Karhunen-Loéve變換(KLT)離散余弦變換(discretecosinetransform,DCT)變換系數(shù)的量化編碼JPEG例:動(dòng)機(jī)y=2.5x例:動(dòng)機(jī)
——旋轉(zhuǎn)考慮(可逆)變換例:動(dòng)機(jī)
——變換后的序列例:動(dòng)機(jī)
——壓縮拋棄坐標(biāo)第二維…用定長(zhǎng)碼編碼,可降低50%!例:動(dòng)機(jī)
——重構(gòu)序列原始值重構(gòu)值例:動(dòng)機(jī)
——誤差分析誤差取決于被置為0的那些n的幅值如果幅值很小,則誤差也很小即大多數(shù)信息在每個(gè)數(shù)據(jù)對(duì)的第一個(gè)元素中例:動(dòng)機(jī)
——從統(tǒng)計(jì)分析的角度上面我們從幾何的角度分析了變換我們也可以從統(tǒng)計(jì)分析角度來(lái)審視變換:當(dāng)變換對(duì)序列去相關(guān)時(shí),能得到最大壓縮主成分方法(PrincipleComponentMethod)即樣本—樣本之間的相關(guān)性為0變換編碼變換將原始序列{xn}分成大小為N的塊將每個(gè)塊映射成變換序列
{n}
可逆映射每塊的不同元素的通常有不同的統(tǒng)計(jì)特性量化,根據(jù)目標(biāo)平均碼率統(tǒng)計(jì)序列的統(tǒng)計(jì)特性可能對(duì)不同的子序列采取不同的技術(shù)失真熵編碼定長(zhǎng)碼、Huffman編碼、算術(shù)編碼、RLE+算術(shù)編碼…變換我們主要考慮線性變換:{n}每個(gè)元素的特性與其位置有關(guān)如:在上述例子中元素的位置是奇數(shù)還是偶數(shù)設(shè)計(jì)變換序列的方差決定編碼策略N
與特定領(lǐng)域有關(guān),基于實(shí)踐考慮計(jì)算代價(jià)、延遲、信源統(tǒng)計(jì)特性的穩(wěn)定性重構(gòu):變換(2)寫(xiě)成矩陣形式(1-D):2-D變換:可分解的2-D變換:變換(3)矩陣形式的可分解2-D變換:我們要討論的變換都是正交變換(Orthonormaltransforms)正交變換正交矩陣:如果一個(gè)矩陣滿(mǎn)足其中I為單位陣,則稱(chēng)A為正交矩陣。每行/列點(diǎn)積為1,不同行/列的點(diǎn)積為0正交矩陣的逆矩陣等于其轉(zhuǎn)置:正交反變換:正交變換(2)能量守恒性質(zhì):總能量守恒,但通常能量在各系數(shù)上分布并不均勻變換編碼增益為增益與系數(shù)方差的集中程度有關(guān)若每個(gè)系數(shù)的方差相等,則沒(méi)有增益幾何均值算術(shù)均值從信號(hào)分解的角度考慮變換:反變換為變換行=基向量表示x與ai之間的相似性相似性越高,變換系數(shù)越大例:第一行:低通信號(hào),x0和x1的均值第二行:高通信號(hào),x0和x1的差值A(chǔ)為正交矩陣從信號(hào)分解的角度(2)例(續(xù)):考慮兩個(gè)序列:低通:(3,1)高通:(3,-1)矩陣的角度1-D變換:變換矩陣的行展開(kāi)類(lèi)似的,2-D變換可視為變換矩陣行向量外積構(gòu)成的矩陣的展開(kāi)外積:矩陣的角度(2)例:外積為:矩陣的角度(3)例(續(xù)):逆變換為:DC系數(shù)AC系數(shù)基矩陣Karhunen-LoéveTransform(KLT)亦稱(chēng)為HotellingTransformHotelling于1933年用于離散數(shù)據(jù)去相關(guān)Karhunen、Loéve分別于1947年和1948用于連續(xù)函數(shù)分析Kramer和Mathews、Huang和Schultheiss分別于1956年、1963年用于數(shù)據(jù)壓縮(變換編碼)在統(tǒng)計(jì)分析中被稱(chēng)為主成份分析
(Principal
ComponentsAnalysis,PCA)KLT(2)目標(biāo):用一個(gè)正交變換,去除輸入之間的相關(guān)性自相關(guān)矩陣:
{n}不相關(guān)為對(duì)角陣A為正交矩陣基函數(shù)(A的行向量)為矩陣的特征向量
{n}的方差為的特征值是對(duì)稱(chēng)的可正交對(duì)角化KLT的性質(zhì)從N維中任取
系數(shù),令其他系數(shù)為0,得到的重構(gòu)誤差(均方誤差)為其中為的特征值,也是k
的方差所以KLT最小均方誤差意義下的最佳變換KLT達(dá)到最佳的能量集中KLT的性質(zhì)(2)任何正交變換的行列式的值:任何正交變換的協(xié)方差的行列式的值:KLT變換后(對(duì)角)協(xié)方差矩陣的行列式Hadamardin不等式:任何對(duì)稱(chēng)、半正定矩陣的行列式小于等于其對(duì)角線元素的乘積變換系數(shù)方差的幾何均值最小編碼增益GTC最大例:KLT對(duì)塊大小為2的平穩(wěn)過(guò)程,自相關(guān)矩陣為特征值:特征向量:須滿(mǎn)足正交約束,歸一化:所以,KLT的變換矩陣為:KLT(3)既然KLT是最佳的,為什么還會(huì)有其他的變換呢?沒(méi)有快速計(jì)算方法KLT取決于信號(hào)的統(tǒng)計(jì)性質(zhì)對(duì)平穩(wěn)過(guò)程,KLT比較合適但對(duì)大多數(shù)輸入,需重復(fù)計(jì)算/傳輸變換矩陣尋找結(jié)構(gòu)化的變換,使得其性能接近KLTDCT離散余弦變換
(DiscreteCosineTransform,DCT)變換矩陣為cosine的函數(shù)源自DFT但更適合壓縮DCT基向量變化隨行號(hào)增大而增大(頻率越來(lái)越高)DCT基矩陣DFTvs.DCTDFT:DCT:函數(shù)的不連續(xù)影響Fourier級(jí)數(shù)的收斂,從而需要更多基函數(shù),影響壓縮DCT更連續(xù)DFT在邊界不連續(xù)DFTvs.DCT(2)DCT變換后的能量更集中更適合壓縮DCT的性質(zhì)對(duì)Markov過(guò)程:當(dāng)很大時(shí),DCT的性能接近KLT的性能
實(shí)際上,很多信源都是很大的Markov過(guò)程DCT是一個(gè)最流行的變換JPEGMPEGH.261…離散正弦變換
(DiscreteSineTransform,DST)變換矩陣為sine的函數(shù):類(lèi)似DCT,有很好的性質(zhì)當(dāng)很小時(shí),DST的性能接近KLT的性能在圖像/語(yǔ)音編碼應(yīng)用中,與DCT變換互補(bǔ)離散DiscreteWalsh-Hadamard變換N階Hadamard矩陣HHT=NIN=2k的構(gòu)造規(guī)則:…DWH變換從Hadamard矩陣HN推導(dǎo)得到變換矩陣H歸一:乘以將每行以Wash序(sequencyorder)排列如:性能:計(jì)算簡(jiǎn)單:+/-,在有限硬件上容易實(shí)現(xiàn)但壓縮性能比采用DCT稍差各種變換的比較(1)各種變換的比較(2)對(duì)塊大小為1×32的典型自然圖像,各種變換的能量集中比較:i主要內(nèi)容Karhunen-Loéve變換(KLT)離散余弦變換(discretecosinetransform,DCT)變換系數(shù)的量化編碼JPEG例1:空域量化vs.變換域量化x=[100110120130140150160170]T8點(diǎn)DCT變換:y=[381.84-64.420-6.730-2.010-0.5070]
能量主要集中在前兩個(gè)系數(shù)7水平的中平量化器例1:空域量化vs.變換域量化(2)方案1:直接對(duì)原始數(shù)據(jù)進(jìn)行量化方案2:對(duì)DCT系數(shù)進(jìn)行量化△=6,量化后的DCT系數(shù):[64-110-10000]3個(gè)非0DCT系數(shù)MSE:w/oDCT:3.0w/DCT:1.5例1:空域量化vs.變換域量化(3)△=20,2個(gè)非0DCT系數(shù):[19-3000000]DCT系數(shù)重構(gòu)效果仍然很平滑直接方法開(kāi)始產(chǎn)生塊/mosaic效應(yīng)MSE:w/oDCT:50.0w/DCT:9.07例1:空域量化vs.變換域量化(4)△=100,2個(gè)非0DCT系數(shù):[4-1000000]DCT系數(shù)重構(gòu)效果仍然平滑直接方法產(chǎn)生的塊/mosaic效應(yīng)更多MSE:w/oDCT:1000w/DCT:205例2:空域量化vs.變換域量化輸入數(shù)據(jù): 8978767570828182 12295868080767481 18415312610685767175 22120518014697716867 225222217194144957882 228225227220193146110108 223224225224220197156120 2172192192242302201971512-DDCT變換系數(shù)(取整):1155259-23611730 -377-5085-101047-3 -4-158-2442-15101 -23-34-199-54-1 196-15-106-5-1 31336-920-3 8-24-13-10-2 20-32-200-1大多數(shù)能量集中在左上角例2:空域量化vs.變換域量化(2)
在變換域量化通常能得到更好的結(jié)果我們還可以做得更好對(duì)不同的子帶采取不同的量化步長(zhǎng)
DCT系數(shù)的分布變換系數(shù)的比特分配我們討論的變換為正交變換變換過(guò)程為能量守恒,所以總的誤差=量化誤差每個(gè)子帶的能量:每個(gè)子帶的量化誤差:總的量化誤差:變換系數(shù)的比特分配(2)比特分配問(wèn)題:計(jì)算,使得最小并滿(mǎn)足比特率:子帶能量:
為對(duì)角線上第k個(gè)元素變換系數(shù)的比特分配(3)用Lagrangian乘子法得到最佳的比特分配對(duì)所有的k,每個(gè)子帶的量化誤差的方差盡可能相等變換系數(shù)的比特分配(4)
方差越大,比特?cái)?shù)越多代入比特率約束最佳失真和每個(gè)系數(shù)的碼率分別為變換系數(shù)的比特分配(5)變換編碼的最佳失真為假設(shè)對(duì)原始信號(hào)的碼率失真函數(shù)為則變換編碼增益為變換系數(shù)的比特分配(6)變換編碼增益為
為Rxx對(duì)角線的元素,對(duì)平穩(wěn)過(guò)程,Rxx每個(gè)(i,i)相等增益與系數(shù)方差的集中程度有關(guān)若每個(gè)系數(shù)的方差相等,則沒(méi)有增益幾何均值算術(shù)均值變換系數(shù)的比特分配(7)上述最佳不一定為整數(shù),甚至不能保證為正數(shù)
但增大了平均碼率,還需均勻減小非0遞歸比特分配滿(mǎn)足約束:且為整數(shù)所以碼率分配算法為:1、計(jì)算每個(gè)成分的方差2、雖所以的3、對(duì)所有的方差排序,對(duì)最大的方差的成分分配1比特
若比特?cái)?shù)用盡,停止;否則轉(zhuǎn)第3步上述算法稱(chēng)為zonalsampling遞歸比特分配(2)8*8變換的比特分配閾值編碼zonalsampling基于平均值進(jìn)行比特分配局部變化可能不能很好重構(gòu)如邊緣像素閾值編碼:對(duì)所有大于閾值的系數(shù)進(jìn)行編碼,而丟棄其他較小的系數(shù)閾值編碼(2)對(duì)2-D圖像編碼可采用Zigzag方式編碼可得到很多高頻系數(shù)為0,發(fā)送EOB(EndofBlock)即可總結(jié)正交變換:對(duì)信號(hào)空間的坐標(biāo)進(jìn)行旋轉(zhuǎn)變換的目的:去相關(guān):使得在量化時(shí),對(duì)各系數(shù)單獨(dú)量化(標(biāo)量量化),而不會(huì)損傷過(guò)多效率(與矢量量化相比)變換本身并不會(huì)產(chǎn)生壓縮,但變換會(huì)使得量化更容易實(shí)現(xiàn),真正實(shí)現(xiàn)壓縮的是變換后的量化能量集中:稀疏,將原始信號(hào)的能量壓縮到盡可能少的系數(shù)對(duì)原始信號(hào)只用少數(shù)幅值較大的系數(shù)表示比特分配與方差的log成正比KLT是最佳的,但其是信號(hào)相關(guān)的,沒(méi)有快速算法
DCT性能接近KLT,有快速計(jì)算算法通常采用DCT:對(duì)圖像采用8x8的塊大小、均勻量化
、Z字掃描(JPEG,MPEG,ITU-TH.261,H.263…)下節(jié)課內(nèi)容下節(jié)課內(nèi)容:JPEG作業(yè):Sayood3rd,pp.421-4222,4變換編碼JPEGJPEG標(biāo)準(zhǔn)JPEG:JointPhotographicExpertsGroup正式名稱(chēng):ISO/IECJTC1/SC29/WG10與CCITT(現(xiàn)為ITU)學(xué)習(xí)組VIII聯(lián)合工作開(kāi)始于1986年于1992年形成國(guó)際標(biāo)準(zhǔn)ISO/IEC10918-1和CCITT建議T.81
廣泛用于圖像交換、WWW、數(shù)字圖像Motion-JPEG為數(shù)字視頻編緝的事實(shí)標(biāo)準(zhǔn)InternationalOrganizationforStandardizationInternationalElectrotechnicalCommissionJointISO/IECTechnicalCommittee(InformationTechnology)Subcommittee29
(CodingofAudio,Picture,MultimediaandHypermediaInformation)WorkingGroup10(JBIG,JPEG)JPEG:8×8的塊編碼JPEG標(biāo)準(zhǔn)JPEG規(guī)定了4種運(yùn)行模式,以滿(mǎn)足不同需要:基于DPCM的無(wú)損編碼模式:壓縮比可達(dá)2:1基于DCT的有損順序編碼模式:壓縮比可達(dá)10:1以上基于DCT的遞增編碼模式基于DCT的分層編碼模式基本(baseline)JPEG編碼器Huffman編碼:通過(guò)簡(jiǎn)單的查表就可以實(shí)現(xiàn)Huffman編碼可以用自適應(yīng)二進(jìn)制算術(shù)編碼代替(由于專(zhuān)利問(wèn)題,很少產(chǎn)品支持)
編碼效率提高10%,但算法更復(fù)雜顏色空間JPEG標(biāo)準(zhǔn)本身并沒(méi)有規(guī)定具體的顏色空間,只是對(duì)各分量分別進(jìn)行編碼實(shí)現(xiàn)中通常將高度相關(guān)RGB顏色空間轉(zhuǎn)換到相關(guān)性較小的YCbCr顏色空間RGBYCbCr(8bit/pixel)YCbCrRGB顏色空間圖像的主要信息包括在Y通道Cb、Cr更平滑容易壓縮人眼對(duì)色度分量不敏感對(duì)色度分量可以進(jìn)行下采樣:如4:2:2,4:2:0CbCr零偏置(LevelOffset)對(duì)于灰度級(jí)是2n的像素,通過(guò)減去2n-1,將無(wú)符號(hào)的整數(shù)值變成有符號(hào)數(shù)對(duì)于n=8,即將0~255的值域,通過(guò)減去128,轉(zhuǎn)換為值域在128~127]內(nèi)目的:使像素的絕對(duì)值出現(xiàn)3位10進(jìn)制的概率大大減少DCT變換對(duì)每個(gè)單獨(dú)的彩色圖像分量,把整個(gè)分量圖像分成8×8的圖像塊,如圖所示,并作為兩維離散余弦變換DCT的輸入DCT變換:其中逆變換:量化中平型均勻量化器:量化步長(zhǎng)是按照系數(shù)所在的位置顏色分量來(lái)確定因?yàn)槿搜蹖?duì)亮度信號(hào)比對(duì)色差信號(hào)更敏感,因此使用了兩種量化表:亮度量化值和色差量化值根據(jù)人眼的視覺(jué)特性(對(duì)低頻敏感,對(duì)高頻不太敏感)對(duì)低頻分量采取較細(xì)的量化,對(duì)高頻分量采取較粗的量化如果原始圖象中細(xì)節(jié)豐富,則去掉的數(shù)據(jù)較多,量化后的系數(shù)與量化前差別反之,細(xì)節(jié)少的原始圖象在壓縮時(shí)去掉的數(shù)據(jù)少些DCT系數(shù)量化步長(zhǎng)人眼的對(duì)亮度敏感性DCLowHighLowHighSensitiveforhumaneyesLesssensitiveforhumaneyes建議基本量化表基于人的生理感知閾值實(shí)驗(yàn)量化表縮放真正的量化表=縮放因子×基本量化表質(zhì)量因子≤50:縮放因子=50/質(zhì)量;質(zhì)量因子>50:縮放因子=2–質(zhì)量/50縮放因子70586不同質(zhì)量因子的圖像示例GIF:258898bytes100:326321bytes75:70586bytes
50:46295bytes
25:29360bytes10:15325byteshttp://www.cs.sfu.ca/CC/365/mark/material/cgi-bin/whichjpeg.cgi9438bytes例: 用8x8的JEPG基線標(biāo)準(zhǔn),壓縮并重構(gòu)下列子圖52 55 61 66 70 61 64 7363 59 66 90 109 85 69 7262 59 68 113 144 104 66 7363 58 71 122 154 106 70 6967 61 68 104 126 88 68 7079 65 60 70 77 68 58 7585 71 64 59 55 61 65 8387 79 69 68 65 76 78 940偏置轉(zhuǎn)換后-76 -73 -67 -62 -58 -67 -64 -55-65 -69 -62 -38 -19 -43 -59 -56-66 -69 -60 -15 16 -24 -62 -55-65 -70 -57 -6 26 -22 -58 -59-61 -67 -60 -24 -2 -40 -60 -58-49 -63 -68 -58 -51 -65 -70 -53-43 -57 -64 -69 -73 -67 -63 -45-41 -49 -59 -60 -63 -52 -50 -34正向DCT變換(n=8)后變成-415 -29 -62 25 55 -20 -1 37 -21 -62 9 11 -7 -6 6-46 8 77 -25 -30 10 7 -5-50 13 35 -15 -9 6 0 311 -8 -13 -2 -1 1 -4 1-10 1 3 -3 -1 0 2 -1-4 -1 2 -1 2 -3 1 -2-1 -1 -1 -2 -1 -1 0 -1量化變換后的數(shù)組-26 -3 -6 2 2 -1 0 01 -2 -4 1 1 0 0 0-3 1 5 -1 -1 0 0 00-4 1 2 -1 0 0 0 001 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0DC系數(shù)的差分編碼8×8圖像塊經(jīng)過(guò)DCT變換之后得到的DC直流系數(shù)有兩個(gè)特點(diǎn)系數(shù)的數(shù)值比較大相鄰8×8圖像塊的DC系數(shù)值變化不大:冗余根據(jù)這個(gè)特點(diǎn),JPEG算法使用了差分脈沖調(diào)制編碼(DPCM)技術(shù),對(duì)相鄰圖像塊之間量化DC系數(shù)的差值DIFF進(jìn)行編碼:DC系數(shù)的差分編碼對(duì)DIFF用Huffman編碼:分成類(lèi)別,類(lèi)似指數(shù)Golomb編碼類(lèi)別ID:一元碼編碼類(lèi)內(nèi)索引:采用定長(zhǎng)碼DC類(lèi)別范圍范圍大小0011-1,122-3,-2,2,343-7,
-6,
-5,
-4,4,5,6,784-15,…,-8,8,…,15165-31,…,-16,16,…,3132………15[-32767,-16384],[16384,32767]32768DC系數(shù)的差分編碼
例:DC=8,上一DC=5,則DIFF=8-5=3
類(lèi)別ID=2,類(lèi)內(nèi)索引=3,則碼流=10011AC系數(shù)的Z字掃描由于經(jīng)DCT變換后,系數(shù)大多數(shù)集中在左上角,即低頻分量區(qū),因此采用Z字形按頻率的高低順序讀出,可以出現(xiàn)很多連零的機(jī)會(huì)??梢允褂糜纬叹幋a。尤其在最后,如果都是零,給出EOB(EndofBlock)即可。Zig-zag掃描26?30?3?2?62?41?411512?11?1200000?1?1EOBAC系數(shù)的游程編碼在JPEG和MPEG編碼中規(guī)定為:(run,level)表示連續(xù)run個(gè)0,后面跟值為level的系數(shù)如:?30?3?2?62?41?411512?11?1200000?1?1EOB表示為(0,-3);(1,-3);(0,-2);(0,-6);(0,2);(0,-4);(0,1);(0,-4);(0,1)(0,1);(0,5);(0,1);
(0,2);(0,-1);(0,1);(0,-1);(0,2);(5,-1);(0,-1);EOB編碼:Run:最多15個(gè),用4位表示ZLevel:類(lèi)似DC分成16個(gè)類(lèi)別,用4位表示表示類(lèi)別號(hào)C類(lèi)內(nèi)索引對(duì)(Z,C)聯(lián)合用Huffman編碼對(duì)類(lèi)內(nèi)索引用定長(zhǎng)碼編碼AC系數(shù)的Huffman編碼Z:0的游程;C:類(lèi)別ZRL:表示16個(gè)0;當(dāng)0的個(gè)數(shù)大于15時(shí),分成多次如20個(gè)0,緊跟-1:ZRL;(4,-1)(run,level)序列:(0,-3);(1,-3);...Z/C序列:0/2,1/2,…-3是第2類(lèi)的第1個(gè)值,(0,-3):0100-3是第2類(lèi)的第1個(gè)值,(1,-3):1101100重構(gòu)與編碼相反解碼Huffman數(shù)據(jù)解碼DC差值重構(gòu)量化后的系數(shù)DCT你變換丟棄填充的行/列反0偏置對(duì)丟失的CbCr分量差值(下采樣的逆過(guò)程)YCbCrRGB重構(gòu)量化后的系數(shù)(已通過(guò)DC差重構(gòu)DC系數(shù))乘以量化表,得到IDCT:+128:重構(gòu)誤差:每個(gè)像素大約為5的平均絕對(duì)誤差誤差在左下角比較明顯原圖重構(gòu)圖示例圖像示例圖像基于DPCM的無(wú)損編碼模式采用三鄰域二維預(yù)測(cè)編碼和熵編碼無(wú)失真編碼器源圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)預(yù)測(cè)器熵編碼器表說(shuō)明DPCM預(yù)測(cè)編碼框圖基于DCT的遞增編碼模式此模式與順序模式編碼步驟基本一致不同之處在于:遞增模式每個(gè)圖像分量的編碼要經(jīng)過(guò)多次掃描才完成第一次掃描只進(jìn)行一次粗糙的壓縮,然后根據(jù)此數(shù)據(jù)先重建一幅質(zhì)量低的圖像以后的掃描再作較細(xì)的掃描,使重建圖像質(zhì)量不斷提高,直到滿(mǎn)意為止遞增模式分為兩種:按頻段累進(jìn)按位累進(jìn)基于DCT的分層編碼模式1、降低原始圖像的空間分辨率2、對(duì)已經(jīng)降低分辨率的圖像按照順序編碼模式進(jìn)行壓縮并存儲(chǔ)或傳輸3、對(duì)低分辨率圖像進(jìn)行解碼,然后用插值法提高圖像的分辨率4、將分辨率已經(jīng)升高的圖像作為原圖像的預(yù)測(cè)值,并把它與原圖像的差值進(jìn)行基于DCT的編碼5、重復(fù)步驟3、4直到圖像達(dá)到完整的分辨率總結(jié)JPEG:各種基本算法的精妙組合:DCT+DPCM+Huffman其他標(biāo)準(zhǔn)也類(lèi)似ReferencesG.K.Wallace,“TheJPEGstillpicturecompressionstandard,”IEEETrans.ConsumerElectronics,vol.38,no.1,pp.xviii-xxxiv,Feb.1992.TU-TRec.T.81
/ITU-T/studygroups/com16/jpeg1x/index.html
Wiki:/wiki/JpegJPEG2000JPEG2000概述JPEG2000編碼器編碼器結(jié)構(gòu)預(yù)處理核心處理熵編碼:EBCOTJPEG2000概述靜止圖像壓縮標(biāo)準(zhǔn):連續(xù)色調(diào)和二值1997年開(kāi)始,2000年定案主要特性:低碼率下性能更好(與JPEG相比)分辨率和質(zhì)量可伸縮隨機(jī)訪問(wèn)ROI
(RegionOfInterest)容錯(cuò):在位流中可加入同步碼支持大圖像應(yīng)用更廣:復(fù)合文檔壓縮在單一數(shù)據(jù)流中統(tǒng)一有失真編碼和無(wú)失真編碼代價(jià)(與JPEG相比):更多存儲(chǔ)更復(fù)雜JPEGat0.125bpp(放大后)192:1JPEG2000at0.125bpp(放大后)192:1JPEG2000JPEG2000概述JPEG2000編碼器編碼器結(jié)構(gòu)預(yù)處理核心處理熵編碼:EBCOT編碼器結(jié)構(gòu)DiscreteWaveletTransformQuantizationEBCOTEntropycodingTier1:BlockCodingImagedataPre-processingTier2:LayerCodingBitstreamRateControlJPEG2000JPEG2000概述JPEG2000編碼器編碼器結(jié)構(gòu)預(yù)處理核心處理熵編碼:EBCOT預(yù)處理貼片劃分(ImageTiling)顏色變換貼片劃分(1)圖像可能太大,編碼器一次不能處理圖像被分割成不重疊的貼片(tile),所有的操作都是以貼片為處理單元顏色變換、小波變換、量化和熵編碼貼片的一個(gè)主要目的是可以對(duì)圖像中感興趣的部分進(jìn)行解碼解碼器識(shí)別位流中的每個(gè)貼片,并且只對(duì)包含在貼片中的像素進(jìn)行解碼貼片劃分(2)參考網(wǎng)格:(referencegrid):Xsiz,Ysiz圖像區(qū)域偏移量:XOsiz,YOsiz圖像與參考網(wǎng)格底端對(duì)齊
每個(gè)成分的水平/豎直方向采樣周期:XRsiz,YRSiz如XRsiz=2,YRsiz=1XRsiz=2,YRsiz=2.貼片劃分(3)所有貼片大小相等,邊界處除外貼片劃分(4)貼片的大小會(huì)影響圖像的主觀質(zhì)量和客觀質(zhì)量太小的貼片會(huì)帶來(lái)更多的“貼片效應(yīng)”顏色變換支持兩種顏色變換不可逆變換(Irreversiblecolortransform,ICT):YCbCr空間同JPEG中的顏色變換用于浮點(diǎn)小波變換/有失真編碼可逆變換(Reversiblecolortransform,RCT):YUV空間用于整數(shù)小波變換,可用于有失真編碼或無(wú)失真編碼可選:對(duì)色度分量進(jìn)行下采樣同JPEG一樣,顏色分量也進(jìn)行0偏置處理:-2n-1可逆顏色變換顏色變換:逆變換:JPEG2000JPEG2000概述JPEG2000編碼器編碼器結(jié)構(gòu)預(yù)處理核心處理熵編碼:EBCOT核心處理小波變換量化離散小波變換(DWT)DWT(2)雙正交DWTh0與g0正交h1與g1正交DWT(3)不可逆:Daubechies(9,7)在低碼率下性能最好,但計(jì)算復(fù)雜度高可逆:LeGall(5,3):整數(shù)實(shí)現(xiàn)無(wú)失真編碼,計(jì)算復(fù)雜度低nh0(n)nh1(n)0+6/8-1+1±1+2/8-2,0-1/2±2-1/8nh0(n)nh1(n)0+0.602949018236-1+1.115087052456±1+0.266864118442-2,0-0.591271763114±2-0.078223266528-3,1-0.057543526228±3-0.016864118442-4,2+0.091271763114±4+0.026748757410DWT(4)支持卷積方式和提升方式實(shí)現(xiàn)離散小波變換卷積:濾波器與信號(hào)卷積提升格式:預(yù)測(cè)和更新DWTCohen-Daubechies-Feauveau(CDF)(9,7)的提升格式:其中P表示像素值,C表示小波系數(shù)
LeGall(5,3)用整數(shù)小波變換實(shí)現(xiàn)=1.586,=0.052,=0.882,=0.443,K=1.230量化JPEG2000支持兩種量化帶死區(qū)的標(biāo)量量化網(wǎng)格量化(TrellisCodedQuantization)帶死區(qū)的均勻量化死區(qū):0附近區(qū)域的大小為其他區(qū)域的2倍量化規(guī)則:對(duì)每個(gè)子帶b,用戶(hù)選擇基本量化步長(zhǎng)△b,并用該步長(zhǎng)對(duì)該子帶中的所有系數(shù)量化可根據(jù)視覺(jué)模型(如對(duì)比敏感函數(shù),contrastsensitivityfunction)選擇每個(gè)子帶的步長(zhǎng)
相同視覺(jué)質(zhì)量下能得到更高的壓縮比JPEG2000JPEG2000概述JPEG2000編碼器編碼器結(jié)構(gòu)預(yù)處理核心處理熵編碼:EBCOTEBCOTEBCOT:EmbeddedBlockCodingwithOptimizedTruncationTier1:分塊編碼(BlockCoding)將每個(gè)子帶分成獨(dú)立編碼的碼塊(32x32or64x64)Tier2:最佳截?cái)?OptimalTruncation)在所有塊被壓縮后,一個(gè)后處理過(guò)程決定每塊的截?cái)帱c(diǎn)壓縮后的率—失真(Post-compressionrate-distortion,PCRD)優(yōu)化上下文建模算術(shù)編碼碼率—失真控制cxD(Tier1)(Tier2)量化后的系數(shù)位流EmbeddedBlockCodingOptimizedTruncationTier-1第一輪(Tier-1)編碼:編碼塊的小波系數(shù)按位面算術(shù)編碼位面編碼(Bit-PlaneCoding)分?jǐn)?shù)位面(FractionalBit-Plane)掃描MQ編碼器上下文建模算術(shù)編碼碼率—失真控制cxD(Tier1)(Tier2)量化后的系數(shù)位流EmbeddedBlockCodingOptimizedTruncation分塊編碼與EZW和SPIHT的哲學(xué)思想不同由于沒(méi)有利用帶內(nèi)冗余,會(huì)輕微犧牲效率,但這會(huì)帶來(lái)其他好處分塊編碼的優(yōu)點(diǎn)提供SNR(或質(zhì)量)和分辨率可伸縮分辨率可伸縮:可解碼小圖像通過(guò)發(fā)送逐個(gè)子帶的塊碼流實(shí)現(xiàn)EZW和SPIHT只有SNR可伸縮:不同子帶的數(shù)據(jù)混合在一起可以利用局部統(tǒng)計(jì)性:對(duì)算術(shù)編碼有用提供隨機(jī)訪問(wèn)特征減少存儲(chǔ)要求允許并行實(shí)現(xiàn)編碼塊的位平面分解1SignbitMSBLSBMagnitudebitsinsignificantsignificantPixelBit-plane10011000動(dòng)態(tài)掃描和分?jǐn)?shù)位平面每塊用位平面編碼編碼動(dòng)態(tài)掃描:先編碼更可能是重要系數(shù)的系數(shù)EZW和SPIHT采用確定的掃描順序每個(gè)位平面進(jìn)一步被細(xì)分為3個(gè)步驟編碼(分?jǐn)?shù)位平面):1.重要性傳播過(guò)程(significancepass):對(duì)可能是重要的系數(shù)2.幅值細(xì)化過(guò)程(refinementpass):對(duì)已是重要的系數(shù)3.清除過(guò)程(cleanuppass):對(duì)不太可能是重要的系數(shù)每個(gè)系數(shù)值在上述3個(gè)步驟中的之一出現(xiàn)在每一個(gè)步驟中,系數(shù)以確定的順序訪問(wèn)面向條帶(Stripe)的掃描每條4行按列掃描位平面編碼原語(yǔ)4種“原語(yǔ)”編碼操作零編碼(ZeroCoding,ZC):在significanceandcleanuppasses對(duì)系數(shù)的第p個(gè)位平面,如果系數(shù)仍不是重要系數(shù)符號(hào)編碼(Sign
Coding,SC):在significancepass當(dāng)系數(shù)從不重要變成重要時(shí)幅值細(xì)化(MagnitudeRefinement,MR):在refinementpass對(duì)重要系數(shù),細(xì)化1比特游程編碼(RLC):只在cleanuppass用游程符號(hào)編碼多個(gè)連續(xù)系數(shù)的重要性EBCOT中的上下文共18種上下文10種:重要性編碼5種:符號(hào)編碼3種:細(xì)化編碼而JBIG和JBIG-2有上千種上下文對(duì)每塊,重新初始化上下文模型提高容錯(cuò)性允許并行實(shí)現(xiàn)三個(gè)編碼步驟重要性傳播步驟(對(duì)第一個(gè)位平面省略):
系數(shù)不重要,但8鄰居中至少有一個(gè)重要的系數(shù),根據(jù)當(dāng)前位平面檢查其是否變成重要的這些系數(shù)更可能是重要的系數(shù),因?yàn)槠溆兄匾泥従尤绻麡颖救允遣恢匾?,用ZC原語(yǔ)編碼如果樣本變成重要的(該位為1時(shí)),將其重要性標(biāo)志置為1,并用SC原語(yǔ)編碼其符號(hào)位幅值細(xì)化步驟(對(duì)第一個(gè)位平面省略):在前一個(gè)位平面已經(jīng)是重要的系數(shù),用MR原語(yǔ)編碼清除步驟:對(duì)其他剩下的系數(shù),用ZC和RLC原語(yǔ)編碼該過(guò)程中的系數(shù)極有可能仍是不重要的ZeroCoding亦稱(chēng)為重要性編碼(Significancecoding)的正常模式若不重要系數(shù)在當(dāng)前位平面仍是不重要的,發(fā)送0否則發(fā)送1,然后發(fā)送系數(shù)的符號(hào)位系數(shù)的重要性與其鄰居有關(guān)上下文模型:如果系數(shù)仍是不重要的,用9個(gè)上下文(索引0-8)編碼系數(shù)的第p個(gè)位平面根據(jù)8鄰居的狀態(tài)決定ZC上下文Sh:水平方向重要鄰居的數(shù)目(0-2)Sv:豎直方向重要鄰居的數(shù)目(0-2)Sd:對(duì)角線向重要鄰居的數(shù)目(0-4)利用前一個(gè)位平面的信息如果鄰居不在同一塊內(nèi),則認(rèn)為該鄰居是不重要的鄰居系數(shù)之間的相關(guān)性鄰居系數(shù)的重要性可用來(lái)預(yù)測(cè)當(dāng)前系數(shù)的重要性HL子帶捕獲豎直方向的邊緣LH子帶捕獲水平方向的邊緣不同的邊緣需要不同方向的鄰居ZeroCoding上下文Sh:水平方向重要鄰居的數(shù)目(0-2)Sv:豎直方向重要鄰居的數(shù)目(0-2)Sd:對(duì)角線向重要鄰居的數(shù)目(0-4)LL,LH,HL子帶ZC上下文
舉例水平方向鄰居的重要性預(yù)測(cè)性最好豎直方向鄰居的重要性預(yù)測(cè)性最好對(duì)角線方向鄰居的重要性預(yù)測(cè)性最好ZeroCoding上下文游程編碼
—重要性編碼的游程模式應(yīng)用于不重要概率高的區(qū)域當(dāng)滿(mǎn)足下列條件時(shí),進(jìn)入游程模式:1.在前一個(gè)位平面,列中的所有4個(gè)系數(shù)都是不重要的2.其中任何一個(gè)都沒(méi)有重要的鄰居解碼器采用相同的決策如果進(jìn)入游程模式,發(fā)送一個(gè)二進(jìn)制的RunInterruption符號(hào),采用索為9的上下文,用于標(biāo)識(shí)該4個(gè)系數(shù)中是否有系數(shù)在當(dāng)前位平面是重要的如果所有的都是不重要的(很有可能)發(fā)送0否則(不太可能):發(fā)送1,然后發(fā)送列中前面不重要系數(shù)的數(shù)目,緊跟第一個(gè)重要系數(shù)的符號(hào)。其余用正常模式編碼。不重要系數(shù)的數(shù)目在[0,3]區(qū)間內(nèi)近似均勻分布用2比特表示,用均勻分布編碼符號(hào)編碼當(dāng)系數(shù)從不重要變成重要時(shí)采用相鄰系數(shù)的符號(hào)位表現(xiàn)出強(qiáng)相關(guān)性例:LH子帶中的水平方向系數(shù)趨向于有相同的符號(hào)HL子帶中的豎直方向系數(shù)趨向于有相反的符號(hào)符號(hào)編碼的上下文呢:利用直接4鄰居的符號(hào)(2個(gè)水平、2個(gè)豎直)每個(gè)鄰居可能是:不重要、正、負(fù)3^4=81種可能的配置JPEG2000中簡(jiǎn)化為5種上下文:索引:10-14幅值細(xì)化編碼對(duì)重要系數(shù)的第p個(gè)比特編碼:上下文模型:選用3個(gè)上下文(索引15-17)上下文選擇,基于:該比特是否為該系數(shù)的第一個(gè)細(xì)化比特該系數(shù)是否有重要的鄰居(水平、豎直或?qū)蔷€)編碼舉例位平面2:重要性過(guò)程:忽略,開(kāi)始時(shí)所有都是不重要的細(xì)化過(guò)程:忽略,開(kāi)始時(shí)沒(méi)有重要的系數(shù)清除過(guò)程:0,0:前2列用RLC:都是不重要的1,
1,0,0,1,0:第3列用RLC:不是所有都是不重要的,前面有2個(gè)不重要,且下一個(gè)系數(shù)為正的重要系數(shù),最后一個(gè)系數(shù)為正的重要系數(shù)
0,0,0,0:最后1列,不能用RLC,對(duì)每個(gè)系數(shù)用ZC:所有都是不重要的編碼舉例(2)位平面1:重要性過(guò)程:逐列掃描所有有至少一個(gè)重要鄰居的不重要的系數(shù)1,0,1,1,1,1,0,0,0,1,1(這輪中有4個(gè)新的重要系數(shù))細(xì)化過(guò)程:1,1清除過(guò)程:0,1,1,0,1,0,0,1,0,0(這輪中3個(gè)新的重要系數(shù))編碼舉例(3)位平面0:重要性過(guò)程:逐列掃描所有有至少一個(gè)重要鄰居的不重要的系數(shù)1,1,1,0,1,0,1,0,0,1,0,1,1(這輪中有6個(gè)新的重要系數(shù))細(xì)化過(guò)程:1,0,0,0,1,1,0,1,0清除過(guò)程:該例中無(wú)EBCOTEBCOT:EmbeddedBlockCodingwithOptimizedTruncationTier-1:分塊編碼(BlockCoding)將每個(gè)子帶分成獨(dú)立編碼的碼塊(32x32or64x64)Tier-2:最佳截?cái)?OptimalTruncation)在所有塊被壓縮后,一個(gè)后處理過(guò)程決定每塊的截?cái)帱c(diǎn)壓縮后的率—失真(Post-compressionrate-distortion,PCRD)優(yōu)化上下文建模算術(shù)編碼碼率—失真控制cxD(Tier1)(Tier2)量化后的系數(shù)位流EmbeddedBlockCodingOptimizedTruncationTier-2:最佳截?cái)鄩K截?cái)啵好總€(gè)編碼塊產(chǎn)生的位流有不同的小塊組成每個(gè)位平面3小塊,對(duì)應(yīng)3個(gè)分?jǐn)?shù)位平面編碼過(guò)程最后的位流由不同的質(zhì)量層組成每層由不同塊的合適
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物標(biāo)志物在藥物臨床試驗(yàn)中的臨床試驗(yàn)技術(shù)研究
- 生物標(biāo)志物在臨床試驗(yàn)中的亞組分析策略-1
- 生物制劑失應(yīng)答的個(gè)體化治療方案制定
- 生物制劑TDM指導(dǎo)下的IBD聯(lián)合治療方案優(yōu)化
- 深度解析(2026)《GBT 20081.2-2021氣動(dòng) 減壓閥和過(guò)濾減壓閥 第2部分:評(píng)定商務(wù)文件中應(yīng)包含的主要特性的試驗(yàn)方法》
- 深度解析(2026)《GBT 19487-2004電子政務(wù)業(yè)務(wù)流程設(shè)計(jì)方法 通 用規(guī)范》
- 深度解析(2026)GBT 19520.17-2010電子設(shè)備機(jī)械結(jié)構(gòu) 482.6mm(19in)系列機(jī)械結(jié)構(gòu)尺寸 第3-105部分:1U高度機(jī)箱的尺寸和設(shè)計(jì)要求
- 人力資源管理師考試難點(diǎn)突破與應(yīng)試技巧含答案
- 設(shè)備維護(hù)工作考核標(biāo)準(zhǔn)及流程
- 娛樂(lè)休閑產(chǎn)品加工建設(shè)項(xiàng)目可行性分析報(bào)告(總投資3000萬(wàn)元)
- 化工和危險(xiǎn)化學(xué)品重大隱患考試試題(后附答案)
- 西方經(jīng)濟(jì)學(xué)考試題庫(kù)(含參考答案)
- 國(guó)企集團(tuán)公司各崗位廉潔風(fēng)險(xiǎn)點(diǎn)防控表格(廉政)范本
- 涉密人員考試試題庫(kù)(保密資格標(biāo)準(zhǔn))
- 個(gè)人防護(hù)用品培訓(xùn)課件
- 員工伙食提升方案
- 模擬電子技術(shù)基礎(chǔ)-華中科技大學(xué)中國(guó)大學(xué)mooc課后章節(jié)答案期末考試題庫(kù)2023年
- 輔助生殖技術(shù)及護(hù)理人工授精
- 把未來(lái)點(diǎn)亮歌詞打印版
- 華南理工大學(xué)模擬電子技術(shù)基礎(chǔ)試卷及答案
- GB/T 18369-2022玻璃纖維無(wú)捻粗紗
評(píng)論
0/150
提交評(píng)論