版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、圖像壓縮基本概念圖像壓縮模型信息論基礎(chǔ)無(wú)損壓縮有損壓縮圖像壓縮標(biāo)準(zhǔn)視頻壓縮標(biāo)準(zhǔn)8.5 有損壓縮概述犧牲圖像復(fù)原的準(zhǔn)確度以換取壓縮能力的增加如果產(chǎn)生的失真可以容忍,則壓縮能力的增加是有效的壓縮率較大壓縮率較大有損預(yù)測(cè)編碼有損預(yù)測(cè)編碼變換編碼變換編碼8.5.1 有損預(yù)測(cè)編碼有損預(yù)測(cè)編碼在各類(lèi)編碼方法中,預(yù)測(cè)編碼是比較易于實(shí)現(xiàn)的,如在各類(lèi)編碼方法中,預(yù)測(cè)編碼是比較易于實(shí)現(xiàn)的,如微分(差分)微分(差分)脈沖編碼調(diào)制(脈沖編碼調(diào)制(DPCM)方法)方法。在這種方法中。在這種方法中,每一個(gè)象素灰度值,用先前掃描過(guò)的象素灰度值去減,求,每一個(gè)象素灰度值,用先前掃描過(guò)的象素灰度值去減,求出他們的差值,此差值稱(chēng)
2、為預(yù)測(cè)誤差,出他們的差值,此差值稱(chēng)為預(yù)測(cè)誤差,。接收端再將此差值與預(yù)測(cè)值相加,重建原始圖像。接收端再將此差值與預(yù)測(cè)值相加,重建原始圖像象素信號(hào)。由于量化和傳送的僅是誤差信號(hào),根據(jù)一般掃描象素信號(hào)。由于量化和傳送的僅是誤差信號(hào),根據(jù)一般掃描圖像信號(hào)在空間及時(shí)間鄰域內(nèi)個(gè)象素的相關(guān)性,預(yù)測(cè)誤差分圖像信號(hào)在空間及時(shí)間鄰域內(nèi)個(gè)象素的相關(guān)性,預(yù)測(cè)誤差分布更加集中,即熵值比原來(lái)圖象小,可用較少的單位象素比布更加集中,即熵值比原來(lái)圖象小,可用較少的單位象素比特率進(jìn)行編碼,使得圖象數(shù)據(jù)得以壓縮。特率進(jìn)行編碼,使得圖象數(shù)據(jù)得以壓縮。有損預(yù)測(cè)編碼有損預(yù)測(cè)編碼:直接對(duì)像素在圖像空間進(jìn)行操作:直接對(duì)像素在圖像空間進(jìn)行操
3、作, ,稱(chēng)為空域方法稱(chēng)為空域方法8.5.1 有損預(yù)測(cè)編碼有損預(yù)測(cè)編碼量化器將預(yù)測(cè)誤差映射成有限范圍內(nèi)的輸出量化器將預(yù)測(cè)誤差映射成有限范圍內(nèi)的輸出 ,確定了與有損預(yù)測(cè),確定了與有損預(yù)測(cè)編碼相聯(lián)系的壓縮和失真的量。編碼相聯(lián)系的壓縮和失真的量。 ne nnneff+ -符號(hào)符號(hào)編碼編碼壓縮圖像輸入圖像enfn fn量化器量化器預(yù)測(cè)器預(yù)測(cè)器預(yù)測(cè)編碼器ne 符號(hào)符號(hào)編碼編碼壓縮圖像+ -en輸入圖像fn量化器量化器預(yù)測(cè)器預(yù)測(cè)器 fn+ +u修正后的預(yù)測(cè)編碼器修正后的預(yù)測(cè)編碼器ne nfnnnfef + +符號(hào)符號(hào)解碼解碼預(yù)測(cè)器預(yù)測(cè)器解壓縮圖像壓縮圖像 fnu預(yù)測(cè)解碼器預(yù)測(cè)解碼器ne nfniifa f
4、3.預(yù)測(cè)編碼預(yù)測(cè)編碼/解碼步驟:解碼步驟: 編碼步驟編碼步驟 第一步:壓縮頭處理第一步:壓縮頭處理 第二步:對(duì)每一個(gè)符號(hào):第二步:對(duì)每一個(gè)符號(hào):f(x,y),由前面的值,通過(guò)預(yù)測(cè)器,求,由前面的值,通過(guò)預(yù)測(cè)器,求出預(yù)測(cè)值出預(yù)測(cè)值 第三步:求出預(yù)測(cè)誤差第三步:求出預(yù)測(cè)誤差 e(x,y) = f(x,y) - 第四步:對(duì)誤差第四步:對(duì)誤差e(x,y)編碼,作為壓縮值。編碼,作為壓縮值。 重復(fù)二、三、四步重復(fù)二、三、四步 解碼步驟解碼步驟 第一步:對(duì)頭解壓縮第一步:對(duì)頭解壓縮 第二步:對(duì)每一個(gè)預(yù)測(cè)誤差的編碼解碼,得到預(yù)測(cè)誤差第二步:對(duì)每一個(gè)預(yù)測(cè)誤差的編碼解碼,得到預(yù)測(cè)誤差 e(x,y)。 第三步:由
5、前面的值,得到預(yù)測(cè)值第三步:由前面的值,得到預(yù)測(cè)值 。 第四步:誤差第四步:誤差e(x,y),與預(yù)測(cè)值,與預(yù)測(cè)值 相加,得到解碼相加,得到解碼f(x,y)。 重復(fù)二、三、四步重復(fù)二、三、四步),(yxf),(yxf),(yxf),(yxfDelta調(diào)制調(diào)制1nnff預(yù)測(cè)器預(yù)測(cè)器量化器量化器0nnee其它1,6.5這里:這里:顆粒噪聲顆粒噪聲:斜率過(guò)載斜率過(guò)載緩變區(qū)緩變區(qū)快變區(qū)快變區(qū)預(yù)測(cè)器預(yù)測(cè)器 預(yù)測(cè)器基本思想:預(yù)測(cè)器基本思想: 選擇選擇作為預(yù)測(cè)的最佳準(zhǔn)則作為預(yù)測(cè)的最佳準(zhǔn)則 miininnnnnnnnnfafffefeftsffEeE122)2)1.min最優(yōu)準(zhǔn)則是最小化均方預(yù)測(cè)誤差,設(shè)量化誤差
6、可以忽略( e n e n ),并用m個(gè)先前像素的線性組合進(jìn)行預(yù)測(cè)上述限制并不是必需的,但它們都極大地簡(jiǎn)化了分析,也減少了預(yù)測(cè)器的計(jì)算復(fù)雜性.基于上述條件的預(yù)測(cè)編碼方法稱(chēng)為(DPCM)i最優(yōu)預(yù)測(cè)器(續(xù))最優(yōu)預(yù)測(cè)器(續(xù))假設(shè)用假設(shè)用1個(gè)個(gè)4階線性預(yù)測(cè)器:階線性預(yù)測(cè)器:f x, y 1 f x, y 1 2 f x 1, y 1 3 f x 1, y 4 f x 1, y 1 來(lái)預(yù)測(cè)來(lái)預(yù)測(cè)通常,預(yù)測(cè)系數(shù)的和要小于或等于通常,預(yù)測(cè)系數(shù)的和要小于或等于1。即。即上述限制是確保預(yù)測(cè)器的輸出能夠落到灰度級(jí)的允許范上述限制是確保預(yù)測(cè)器的輸出能夠落到灰度級(jí)的允許范圍內(nèi)減少傳輸噪聲的影響圍內(nèi)減少傳輸噪聲的影響.
7、 .減小減小DPCMDPCM解碼器對(duì)輸入噪聲的敏感性是很重要的,因?yàn)閱谓獯a器對(duì)輸入噪聲的敏感性是很重要的,因?yàn)閱蝹€(gè)差錯(cuò)會(huì)傳播到所有以后的輸出。這樣,解碼器的輸出會(huì)個(gè)差錯(cuò)會(huì)傳播到所有以后的輸出。這樣,解碼器的輸出會(huì)變得不穩(wěn)定變得不穩(wěn)定im i 1 1例:預(yù)測(cè)技術(shù)的對(duì)比例:預(yù)測(cè)技術(shù)的對(duì)比0.97( ,1)( , )0.97(1, )f x yhvf x yf xy 其它(1, )(1,1)( ,1)(1,1)hf xyf xyvf x yf xy ( , )0.97( ,1)f x yf x y( , )0.5 ( ,1)0.5 (1, )f x yf x yf xy( , )0.75 ( ,1)
8、0.75 (1, )0.5 (1,1)f x yf x yf xyf xy預(yù)測(cè)器預(yù)測(cè)器1:預(yù)測(cè)器預(yù)測(cè)器3:預(yù)測(cè)器預(yù)測(cè)器4:預(yù)測(cè)器預(yù)測(cè)器2:最佳預(yù)測(cè)器:最佳預(yù)測(cè)器:選擇最小化均方預(yù)測(cè)誤差為最佳準(zhǔn)則選擇最小化均方預(yù)測(cè)誤差為最佳準(zhǔn)則水平梯度水平梯度垂直梯度垂直梯度考慮對(duì)單色圖像進(jìn)行考慮對(duì)單色圖像進(jìn)行DPCM編碼產(chǎn)生的預(yù)測(cè)誤差編碼產(chǎn)生的預(yù)測(cè)誤差 假設(shè)量化誤差為假設(shè)量化誤差為0,即,即 en en定義下列定義下列4個(gè)線性預(yù)測(cè)器,并使用其中個(gè)線性預(yù)測(cè)器,并使用其中1個(gè):個(gè):例:預(yù)測(cè)技術(shù)的對(duì)比1階3階結(jié)論:隨著預(yù)測(cè)器階數(shù)的增加誤差減少了2階4階 量化器基本思想:量化器基本思想: 減少數(shù)據(jù)量的最簡(jiǎn)單的辦法是將
9、圖像減少數(shù)據(jù)量的最簡(jiǎn)單的辦法是將圖像,通過(guò)減少圖像的灰度級(jí)來(lái)實(shí)現(xiàn)圖像的壓縮。通過(guò)減少圖像的灰度級(jí)來(lái)實(shí)現(xiàn)圖像的壓縮。 這種量化是這種量化是,因而解碼時(shí)圖像有損失。,因而解碼時(shí)圖像有損失。量化器量化器t=q(st=q(s) )是是s s的的斷點(diǎn)定義了函數(shù)的斷點(diǎn)定義了函數(shù)的不連續(xù)性,被稱(chēng)為量不連續(xù)性,被稱(chēng)為量化器的判決和重構(gòu)級(jí)化器的判決和重構(gòu)級(jí)階梯量化函數(shù)E s ti 最優(yōu)量化最優(yōu)量化量化器的設(shè)計(jì)就是要在給定優(yōu)化準(zhǔn)則和輸入概率密度函數(shù)量化器的設(shè)計(jì)就是要在給定優(yōu)化準(zhǔn)則和輸入概率密度函數(shù)p(sp(s) )的條件的條件下選擇最優(yōu)的下選擇最優(yōu)的s si i和和t ti i。 優(yōu)化準(zhǔn)則可以是統(tǒng)計(jì)的或心理視覺(jué)的
10、準(zhǔn)則優(yōu)化準(zhǔn)則可以是統(tǒng)計(jì)的或心理視覺(jué)的準(zhǔn)則如果用最小均方量化誤差如果用最小均方量化誤差2 作作為準(zhǔn)則,且為準(zhǔn)則,且p(sp(s) )是個(gè)偶函數(shù),是個(gè)偶函數(shù),那么最小誤差條件為那么最小誤差條件為s i s i 1 s t i p s ds 0其中其中對(duì)于任意的對(duì)于任意的L,滿(mǎn)足上列公式的,滿(mǎn)足上列公式的si和和ti在均方誤差意義下是最佳的;在均方誤差意義下是最佳的;相應(yīng)的量化器稱(chēng)為相應(yīng)的量化器稱(chēng)為L(zhǎng)層的層的Lloyd-Max量化器量化器 LLi 0 si ti ti 1 / 2 si si判定層在重構(gòu)層之間的一半處判定層在重構(gòu)層之間的一半處i 0i 1,2,3., 12q是一個(gè)奇函數(shù)的結(jié)果是一個(gè)奇
11、函數(shù)的結(jié)果2ti tiLloyd_Max量化器定義量化器定義1)要達(dá)到最小誤差的條件有兩個(gè):)要達(dá)到最小誤差的條件有兩個(gè):a)每個(gè)決策級(jí))每個(gè)決策級(jí)si正好落在兩個(gè)相鄰重構(gòu)級(jí)正好落在兩個(gè)相鄰重構(gòu)級(jí)ti 、ti+1的中點(diǎn)。的中點(diǎn)。 0 i = 0si = (ti + ti+1) / 2 i = 1,2,.,L/2 1 i = L/2且且si = si t-i = ti (q為奇函數(shù))為奇函數(shù))inputs1s2=6S(L/2)-1outputstt1t2=4t(L/2)-t(L/2)S-(L/2)-1t = q(s)t3 =8b b)每個(gè)重構(gòu)級(jí))每個(gè)重構(gòu)級(jí) t ti i 落在兩個(gè)相落在兩個(gè)相繼決
12、策級(jí)繼決策級(jí)s si i區(qū)間的區(qū)間的 p(sp(s) )(概率(概率密度函數(shù))的質(zhì)心上。密度函數(shù))的質(zhì)心上。2, 2 , 10)()(1Lidssptsiissi 2 2)以上兩個(gè)條件構(gòu)成一個(gè)方程組,必須通過(guò)迭代才能求解決策級(jí))以上兩個(gè)條件構(gòu)成一個(gè)方程組,必須通過(guò)迭代才能求解決策級(jí)s si i和重構(gòu)級(jí)和重構(gòu)級(jí)t ti i。3 3)對(duì)于任何滿(mǎn)足兩個(gè)最小誤差條件有的)對(duì)于任何滿(mǎn)足兩個(gè)最小誤差條件有的L L、s si i和和t ti i,在均方誤差意義,在均方誤差意義上是最優(yōu)的,相應(yīng)的量化器被稱(chēng)為:上是最優(yōu)的,相應(yīng)的量化器被稱(chēng)為:L L級(jí)級(jí) Lloyd_MaxLloyd_Max量化器量化器4 4)由
13、于對(duì)于多數(shù)由于對(duì)于多數(shù)p(sp(s) ),得到一個(gè)符合最優(yōu)量化兩個(gè)條件的解是困難,得到一個(gè)符合最優(yōu)量化兩個(gè)條件的解是困難的的,因此這些解可通過(guò)數(shù)字來(lái)產(chǎn)生。,因此這些解可通過(guò)數(shù)字來(lái)產(chǎn)生。單位方差的拉普拉斯概率密度函數(shù)的勞埃德單位方差的拉普拉斯概率密度函數(shù)的勞埃德-馬克斯量化器馬克斯量化器最優(yōu)量化總結(jié)總結(jié)實(shí)際應(yīng)用表明,實(shí)際應(yīng)用表明,2 2級(jí)量化器(例如:級(jí)量化器(例如:deltadelta調(diào)制)所產(chǎn)生的由于調(diào)制)所產(chǎn)生的由于斜率過(guò)載而造成的解碼圖中邊緣模糊的程度比斜率過(guò)載而造成的解碼圖中邊緣模糊的程度比4 4級(jí)和級(jí)和8 8級(jí)量化器的程級(jí)量化器的程度要高度要高 具有步長(zhǎng)具有步長(zhǎng)的最優(yōu)均勻量化器在具有
14、相同輸出可靠性的條件下的最優(yōu)均勻量化器在具有相同輸出可靠性的條件下能提供比固定長(zhǎng)度編碼的能提供比固定長(zhǎng)度編碼的Lloyd-MaxLloyd-Max量化器更低的碼率量化器更低的碼率Lloyd-MaxLloyd-Max量化器和最優(yōu)均勻量化器都不是自適應(yīng)的,但如果量化器和最優(yōu)均勻量化器都不是自適應(yīng)的,但如果根據(jù)圖像局部性質(zhì)調(diào)解量化值也能提供效率根據(jù)圖像局部性質(zhì)調(diào)解量化值也能提供效率可以較可以較緩慢變化區(qū)域而較緩慢變化區(qū)域而較快速變化區(qū)域。這可同快速變化區(qū)域。這可同時(shí)減少顆粒噪聲和斜率過(guò)載,且碼率增加很少。這也會(huì)增加量化器時(shí)減少顆粒噪聲和斜率過(guò)載,且碼率增加很少。這也會(huì)增加量化器的復(fù)雜性的復(fù)雜性量化和
15、復(fù)原例子:DPCM結(jié)果圖像使用3階預(yù)測(cè)器 f x, y 0.75f x, y10.75f x1, y0.5f x1, y12層Lloyd-Max量化器自適應(yīng)量化方法:在4個(gè)可能的量化器中選擇最好的一個(gè)4層Lloyd-Max量化器8層Lloyd-Max量化器 a),c),e):2級(jí),級(jí),4級(jí),級(jí),8級(jí)勞埃德量化級(jí)勞埃德量化 b),d),f):2級(jí),級(jí),4級(jí),級(jí),8級(jí)自適應(yīng)量化級(jí)自適應(yīng)量化量化和復(fù)原例子:標(biāo)定過(guò)的DPCM結(jié)果圖像量化和復(fù)原例子:標(biāo)定過(guò)的DPCM結(jié)果圖像圖a圖b圖c圖d圖e圖f圖圖a a到到f f中差異圖像的中差異圖像的rmsrms誤差誤差注明了不同的預(yù)測(cè)器和量化器注明了不同的預(yù)測(cè)器
16、和量化器2 2層自適應(yīng)量化器的均方誤差與層自適應(yīng)量化器的均方誤差與4 4層層Lloyd-MaxLloyd-Max量化器相近量化器相近4 4層自適應(yīng)量化器的均方誤差小于層自適應(yīng)量化器的均方誤差小于8 8層層Lloyd-MaxLloyd-Max量化器量化器有損有損DPCM均方根誤差均方根誤差8.5.2 變換編碼變換編碼圖像變換會(huì)使圖象信號(hào)能量在空間重新分布,其中圖像變換會(huì)使圖象信號(hào)能量在空間重新分布,其中低頻成分占據(jù)能量的絕大部分,而高頻成分所占比低頻成分占據(jù)能量的絕大部分,而高頻成分所占比重很小,根據(jù)統(tǒng)計(jì)編碼的原理,重很小,根據(jù)統(tǒng)計(jì)編碼的原理,能量分布集中,熵能量分布集中,熵值最小,可實(shí)現(xiàn)平均碼
17、長(zhǎng)最短值最小,可實(shí)現(xiàn)平均碼長(zhǎng)最短。變換編碼的基本原理是將原來(lái)在空域描述的圖像信變換編碼的基本原理是將原來(lái)在空域描述的圖像信號(hào),變換到另外一些號(hào),變換到另外一些中去,中去,并對(duì)變換系數(shù)進(jìn)行編碼。一般來(lái)說(shuō)并對(duì)變換系數(shù)進(jìn)行編碼。一般來(lái)說(shuō)在變換域里描述要比在空域簡(jiǎn)單,因?yàn)閳D像的相關(guān)在變換域里描述要比在空域簡(jiǎn)單,因?yàn)閳D像的相關(guān)性明顯下降。盡管性明顯下降。盡管變換本身并不帶來(lái)數(shù)據(jù)壓縮變換本身并不帶來(lái)數(shù)據(jù)壓縮,但,但由于變換由于變換采用量化和熵編碼則可以有效地壓縮圖像采用量化和熵編碼則可以有效地壓縮圖像的編碼比特率。的編碼比特率。 有損壓縮有損壓縮 8.5.2 變換編碼變換編碼基于基于圖像變換圖像變換的編碼
18、方法。稱(chēng)為頻域方法的編碼方法。稱(chēng)為頻域方法用可逆的線性變換(如傅里葉變換)將圖像用可逆的線性變換(如傅里葉變換)將圖像映射成映射成1組變換系數(shù),然后組變換系數(shù),然后大多數(shù)圖像變換得到的系數(shù)值都很小,這些大多數(shù)圖像變換得到的系數(shù)值都很小,這些系數(shù)可以較粗地量化,或忽略不計(jì)系數(shù)可以較粗地量化,或忽略不計(jì)雖然失真很小,信息仍然不能完全復(fù)原,所雖然失真很小,信息仍然不能完全復(fù)原,所以還是有損壓縮以還是有損壓縮子圖分解子圖分解圖像變換圖像變換量化量化編碼編碼變換編碼系統(tǒng)變換編碼系統(tǒng)對(duì)每子圖像的象素進(jìn)行對(duì)每子圖像的象素進(jìn)行解相關(guān)解相關(guān)或或用少量用少量的系數(shù)包含盡量多的信的系數(shù)包含盡量多的信息息原則:原則:
19、粗量化粗量化包含包含少量信息的系數(shù)少量信息的系數(shù)通常使用通常使用變長(zhǎng)編碼變長(zhǎng)編碼圖像變換圖像變換 將空域中的信號(hào)變換到另外一個(gè)域,即使用該域中的一組將空域中的信號(hào)變換到另外一個(gè)域,即使用該域中的一組基函數(shù)的線性組合來(lái)合成任意函數(shù)基函數(shù)的線性組合來(lái)合成任意函數(shù) 單位正交基函數(shù)(相同基函數(shù)內(nèi)積為單位正交基函數(shù)(相同基函數(shù)內(nèi)積為1,不同基函數(shù)的內(nèi),不同基函數(shù)的內(nèi)積為積為0) 使用這組基函數(shù)的線性組合得到任意函數(shù)使用這組基函數(shù)的線性組合得到任意函數(shù)f(x,y),每個(gè)基函,每個(gè)基函數(shù)的系數(shù)就是數(shù)的系數(shù)就是f(x,y)與該基函數(shù)的內(nèi)積與該基函數(shù)的內(nèi)積圖像變換圖像變換 圖像變換的圖像變換的在于:在于:1.
20、1. 使圖像處理問(wèn)題簡(jiǎn)化;使圖像處理問(wèn)題簡(jiǎn)化;2.2.有利于圖像特征提取;有利于圖像特征提??;3. 3. 有助于從概念上增強(qiáng)對(duì)圖像信息的理解有助于從概念上增強(qiáng)對(duì)圖像信息的理解 圖像變換通常是一種圖像變換通常是一種。一般。一般: 1. 1. 正交變換必須是可逆的;正交變換必須是可逆的; 2. 2. 正變換和反變換的算法不能太復(fù)雜;正變換和反變換的算法不能太復(fù)雜; 3. 3. 是在變換域中圖像能量將集中分布在低頻率成分上,是在變換域中圖像能量將集中分布在低頻率成分上,邊緣、線狀信息反映在高頻率成分上,有利于圖像處理邊緣、線狀信息反映在高頻率成分上,有利于圖像處理 因此正交變換廣泛因此正交變換廣泛在
21、圖像增強(qiáng)、圖像恢復(fù)、特征提取、在圖像增強(qiáng)、圖像恢復(fù)、特征提取、圖像壓縮編碼和形狀分析等方面圖像壓縮編碼和形狀分析等方面變換選擇變換選擇常用的變換編碼所使用的常用的變換編碼所使用的正交變換正交變換有有,在量化和編碼時(shí),在量化和編碼時(shí),結(jié)合人類(lèi)視覺(jué)心理因素等,采用結(jié)合人類(lèi)視覺(jué)心理因素等,采用“區(qū)域取樣區(qū)域取樣”或或“閾值取樣閾值取樣”等方法,等方法,進(jìn)行量化編碼,而大多數(shù)幅值小,進(jìn)行量化編碼,而大多數(shù)幅值小或某些特定區(qū)域的變換系數(shù)將全部當(dāng)作零處理?;蚰承┨囟▍^(qū)域的變換系數(shù)將全部當(dāng)作零處理。 變換選擇變換選擇考慮大小為考慮大小為NN的圖像的圖像f(x,y),該圖像的正向,該圖像的正向離散變換離散變換
22、T(u,v)表示為表示為N 1 N 1T u, v f x, y g x, y, u, v x 0 y 0u,v=0,1,2,N-1。給定。給定T(u,v),f(x,y)可用離可用離散反變換得到散反變換得到N 1 N 1f x, y T u, v h x, y, u, v u 0 v 0 x,y=0,1,2,N-1g(x,y,u,vg(x,y,u,v) )和和h(x,y,u,vh(x,y,u,v) ):正向和逆向變換核函數(shù):正向和逆向變換核函數(shù)T(u,vT(u,v):):變換系數(shù)變換系數(shù) 變換選擇變換選擇如果下列等式成立,正向核函數(shù)如果下列等式成立,正向核函數(shù)g(x,y,u,v)稱(chēng)為稱(chēng)為是可分
23、離的是可分離的g x, y, u, v g1 x, u g2 ( y, v)如果如果g1在函數(shù)上等于在函數(shù)上等于g2,則,則g x, y, u, v g1 x, u g1 ( y, v)如果上述等式對(duì)逆向核函數(shù)如果上述等式對(duì)逆向核函數(shù)h(x,y,u,v)成立,成立,則則h(x,y,u,v)也具有上述結(jié)論也具有上述結(jié)論 1 j 2 ux vy / NN bi x pi u bi y pi v 1核函數(shù):核函數(shù):DFT變換(離散傅里葉變換的簡(jiǎn)化版本(變換(離散傅里葉變換的簡(jiǎn)化版本(M=N)g x, y, u, v 2 eh x, y, u, v e j 2 ux vy / N WHT變換變換g x
24、, y, u, v h x, y, u, v 1 i 0Nm-1m-1 DCT變換變換 NvyNuxvuvuyxhvuyxg2)12(cos2)12(cos)()(),(),( 1, 2 , 1021)( NuuNNu N=4時(shí)時(shí)Walsh-Hadamard基函數(shù)基函數(shù)WHTWHT的重要意義:的重要意義:,實(shí)現(xiàn)上簡(jiǎn)單,實(shí)現(xiàn)上簡(jiǎn)單N=4N=4時(shí)的核,每個(gè)塊包括時(shí)的核,每個(gè)塊包括4 44 41616個(gè)子方塊個(gè)子方塊白色表示白色表示1 1,而黑色表示,而黑色表示1 1左上角的塊:左上角的塊:u=v=0,x,y=0,1,2,3u=v=0,x,y=0,1,2,3時(shí)時(shí)g(x,y,0,0)g(x,y,0,0
25、)的值:的值:1 1左上第二塊:左上第二塊:u=0,v=1,x,y=0,1,2,3u=0,v=1,x,y=0,1,2,3時(shí)時(shí)g(x,y,0,1)g(x,y,0,1)的值的值N=4時(shí)時(shí)DCT基函數(shù)基函數(shù)g g的值不是整數(shù)的值不是整數(shù)0 0為黑,為黑,1 1為白,較大的為白,較大的g g值,值,對(duì)應(yīng)較淺的灰度級(jí)對(duì)應(yīng)較淺的灰度級(jí)三種變換舉例 例8.19說(shuō)明:說(shuō)明:512512大小的單色圖像大小的單色圖像先將原圖分割為先將原圖分割為88大小的子圖像,然后用大小的子圖像,然后用DFT,WHT和和DCT的一種,表示每一個(gè)子圖像的一種,表示每一個(gè)子圖像將得到所有系數(shù)的將得到所有系數(shù)的50%去掉,即丟掉去掉,
26、即丟掉32個(gè)系數(shù)個(gè)系數(shù)對(duì)截取的系數(shù)陣列進(jìn)行逆變換,保留對(duì)截取的系數(shù)陣列進(jìn)行逆變換,保留32個(gè)系數(shù)個(gè)系數(shù)丟掉的丟掉的32個(gè)系數(shù),對(duì)復(fù)原圖像質(zhì)量的視覺(jué)影響很小個(gè)系數(shù),對(duì)復(fù)原圖像質(zhì)量的視覺(jué)影響很小產(chǎn)生的均方誤差產(chǎn)生的均方誤差rmsDFTrmsWHTrmsDCT三種變換舉例DFT還原圖像WHT還原圖像DCT還原圖像rmsDFT=1.28rmsWHT=0.86rmsDCT=0.68均方誤差近似等于被丟棄的變換系數(shù)的方差之和!均方誤差近似等于被丟棄的變換系數(shù)的方差之和! 三種變換舉例三種變換舉例 結(jié)論結(jié)論DCT的信息壓縮能力比的信息壓縮能力比DFT和和WHT的能力要強(qiáng)的能力要強(qiáng)WHTWHT是最容易實(shí)現(xiàn)的是
27、最容易實(shí)現(xiàn)的DCT在信息壓縮能力和計(jì)算復(fù)雜性之間提供了很好的在信息壓縮能力和計(jì)算復(fù)雜性之間提供了很好的平衡,因此,許多變換編碼系統(tǒng)都是以平衡,因此,許多變換編碼系統(tǒng)都是以DCT變換為基變換為基礎(chǔ)的礎(chǔ)的對(duì)比其它方法,對(duì)比其它方法,DCTDCT變換具有使用單一的集成電路就可變換具有使用單一的集成電路就可以實(shí)現(xiàn),可以將最多的信息包裝在最少的系數(shù)之中以實(shí)現(xiàn),可以將最多的信息包裝在最少的系數(shù)之中可使可使“分塊噪聲分塊噪聲”的塊效應(yīng)最小,這些分塊噪聲是由子圖的塊效應(yīng)最小,這些分塊噪聲是由子圖像之間的可見(jiàn)邊界造成像之間的可見(jiàn)邊界造成 三種變換舉例三種變換舉例結(jié)論(續(xù))結(jié)論(續(xù))DFTDFT的的n n點(diǎn)周期性
28、造成邊界中斷,當(dāng)點(diǎn)周期性造成邊界中斷,當(dāng)DFTDFT系數(shù)被截尾或量系數(shù)被截尾或量化時(shí),邊界值以分塊噪聲的形式出現(xiàn),即相鄰子圖像之化時(shí),邊界值以分塊噪聲的形式出現(xiàn),即相鄰子圖像之間的邊界變得可見(jiàn)。而間的邊界變得可見(jiàn)。而DCTDCT變換不會(huì)產(chǎn)生固有的邊界中斷變換不會(huì)產(chǎn)生固有的邊界中斷DFTDCT 變換編碼變換編碼子圖像尺寸選擇子圖像尺寸選擇子圖像尺寸是影響變換編碼誤差和計(jì)算復(fù)雜度子圖像尺寸是影響變換編碼誤差和計(jì)算復(fù)雜度的一個(gè)重要因素的一個(gè)重要因素一般滿(mǎn)足下列一般滿(mǎn)足下列2個(gè)條件個(gè)條件相鄰子圖像之間的相關(guān)(冗余)減少到可接受相鄰子圖像之間的相關(guān)(冗余)減少到可接受子圖像的長(zhǎng)和寬都是子圖像的長(zhǎng)和寬都是
29、2的整數(shù)次冪。這主要是為了簡(jiǎn)的整數(shù)次冪。這主要是為了簡(jiǎn)化對(duì)子圖像變換的計(jì)算化對(duì)子圖像變換的計(jì)算最常用的子圖像尺寸是最常用的子圖像尺寸是88和和1616把圖像分割為把圖像分割為n nn n的子圖像的子圖像(n=2,4,8,16(n=2,4,8,16和和32)32)計(jì)算每幅子圖像的變換,截取計(jì)算每幅子圖像的變換,截取7575的系數(shù),對(duì)截取后的陣列進(jìn)行反變換得到的系數(shù),對(duì)截取后的陣列進(jìn)行反變換得到當(dāng)圖像尺寸大于當(dāng)圖像尺寸大于8 88 8,WHTWHT和和DCTDCT曲線變得比較平緩,而曲線變得比較平緩,而DFTDFT曲線下降得較曲線下降得較快。對(duì)更大的快。對(duì)更大的n n值,值,DFTDFT將穿過(guò)將穿
30、過(guò)WHTWHT并逼近并逼近DCTDCT當(dāng)圖像尺寸為當(dāng)圖像尺寸為2 22 2時(shí),時(shí),3 3條條曲線交于同曲線交于同1 1點(diǎn)。此時(shí)各變點(diǎn)。此時(shí)各變換都只保留了換都只保留了4 4個(gè)系數(shù)中的個(gè)系數(shù)中的1 1個(gè)(個(gè)(2525),即直流分量),即直流分量子圖像尺寸選擇子圖像尺寸選擇一個(gè)試驗(yàn)例子:一個(gè)試驗(yàn)例子:(1)子圖像尺寸的選擇)子圖像尺寸的選擇a)8*8大小子圖像壓縮結(jié)果大小子圖像壓縮結(jié)果b)誤差圖像誤差圖像c)放大的局部圖像放大的局部圖像d)2*2子圖像子圖像e)4*4子圖像子圖像f)8*8子圖像子圖像(2)比特分配)比特分配截?cái)嗾`差和截?cái)嗾`差和2 2個(gè)因素有關(guān)個(gè)因素有關(guān):截除的變換系數(shù)的數(shù)量和相截
31、除的變換系數(shù)的數(shù)量和相對(duì)重要性對(duì)重要性用來(lái)表示所保留系數(shù)的精度用來(lái)表示所保留系數(shù)的精度在大多數(shù)變換編碼系統(tǒng)中,保在大多數(shù)變換編碼系統(tǒng)中,保留的系數(shù)是根據(jù)最大值方差進(jìn)留的系數(shù)是根據(jù)最大值方差進(jìn)行選擇,稱(chēng)為行選擇,稱(chēng)為區(qū)域編碼區(qū)域編碼,或根,或根據(jù)系數(shù)從大到小選擇,稱(chēng)為據(jù)系數(shù)從大到小選擇,稱(chēng)為門(mén)門(mén)限編碼限編碼。對(duì)變換后的系數(shù)進(jìn)行。對(duì)變換后的系數(shù)進(jìn)行截取、量化和編碼的整個(gè)過(guò)程截取、量化和編碼的整個(gè)過(guò)程通常稱(chēng)為通常稱(chēng)為比特分配比特分配。使用使用8*8DCT系數(shù)的系數(shù)的12.5%對(duì)源圖像對(duì)源圖像進(jìn)行近似的結(jié)果進(jìn)行近似的結(jié)果a),c),e) 門(mén)限編碼結(jié)果門(mén)限編碼結(jié)果(誤差?。ㄕ`差?。゜),d),f) 區(qū)
32、域編碼結(jié)果區(qū)域編碼結(jié)果具有最大方差的變換系數(shù)攜帶著圖像大部分信息并在編碼處理的具有最大方差的變換系數(shù)攜帶著圖像大部分信息并在編碼處理的過(guò)程中應(yīng)該保留下來(lái)。過(guò)程中應(yīng)該保留下來(lái)。區(qū)域取樣的目的是區(qū)域取樣的目的是“選擇要保留的系數(shù)選擇要保留的系數(shù)”。處理可看成每個(gè)。處理可看成每個(gè)T(u,v)與與相應(yīng)的區(qū)域模板中的元素相乘。相應(yīng)的區(qū)域模板中的元素相乘。對(duì)區(qū)域取樣過(guò)程中保留的對(duì)區(qū)域取樣過(guò)程中保留的系數(shù)必須進(jìn)行量化和編系數(shù)必須進(jìn)行量化和編碼。因此,碼。因此,。兩種分配。兩種分配方案:方案:(1) 給系數(shù)分配相同的比特給系數(shù)分配相同的比特?cái)?shù)數(shù)(2) 給系數(shù)不均勻地分配幾給系數(shù)不均勻地分配幾個(gè)固定數(shù)目的比特?cái)?shù)
33、個(gè)固定數(shù)目的比特?cái)?shù)(a)(b)區(qū)域編碼區(qū)域編碼)38.5 .8(H),(),(F1010uvnunvvuTvu 對(duì)任何子圖像對(duì)任何子圖像,最大量級(jí)的變換系數(shù)對(duì)重構(gòu)子圖像的品質(zhì)具最大量級(jí)的變換系數(shù)對(duì)重構(gòu)子圖像的品質(zhì)具有最大的影響有最大的影響.因?yàn)椴煌訄D像的最大系數(shù)的位置是變化的因?yàn)椴煌訄D像的最大系數(shù)的位置是變化的,所以通常將所以通常將 (u,v)T(u,v) 的元素重新排列成一個(gè)一維行程編碼的元素重新排列成一個(gè)一維行程編碼.門(mén)限編碼門(mén)限編碼有有3 3種基本途徑對(duì)一幅變換后的子圖像進(jìn)行門(mén)限處理種基本途徑對(duì)一幅變換后的子圖像進(jìn)行門(mén)限處理( (即生成子圖像門(mén)限模板函數(shù)即生成子圖像門(mén)限模板函數(shù)) )
34、 對(duì)所有的子圖像使用單一的全局門(mén)限對(duì)所有的子圖像使用單一的全局門(mén)限; ; 對(duì)不同圖像的壓縮等級(jí)不同對(duì)不同圖像的壓縮等級(jí)不同. . 對(duì)每幅圖像使用不同的門(mén)限對(duì)每幅圖像使用不同的門(mén)限; ; 對(duì)每幅子圖像丟棄相同數(shù)目的系數(shù)對(duì)每幅子圖像丟棄相同數(shù)目的系數(shù), ,編碼率恒定編碼率恒定. . 門(mén)限隨子圖像中每個(gè)系數(shù)的位置函數(shù)的變化而變化門(mén)限隨子圖像中每個(gè)系數(shù)的位置函數(shù)的變化而變化. . 編碼率變化編碼率變化, ,但是可以將門(mén)限處理和量化過(guò)程結(jié)但是可以將門(mén)限處理和量化過(guò)程結(jié)合起來(lái)合起來(lái). .門(mén)限編碼門(mén)限編碼)40. 5 . 8(),(),(),( vuZvuTroundvuT),(vuT),(vuT)41.
35、5 . 8()1, 1()1 , 1()0 , 1()1, 1()1 , 1()0 , 1()1, 0()1 , 0()0 , 0(Z nnZnZnZnZZZnZZZ(2)門(mén)限編碼量化)門(mén)限編碼量化對(duì)對(duì)Z(u,v)賦予某個(gè)常數(shù)賦予某個(gè)常數(shù)c (2)門(mén)限編碼量化)門(mén)限編碼量化門(mén)限編碼結(jié)果比較門(mén)限編碼結(jié)果比較a)采用采用JPEG標(biāo)準(zhǔn)模板標(biāo)準(zhǔn)模板Z(u,v) 壓縮率壓縮率34:1 rms :3.42像素像素b)標(biāo)準(zhǔn)模板標(biāo)準(zhǔn)模板Z(u,v) *4 壓縮率壓縮率67:1 rms :6.33像素像素 變換編碼變換編碼其它編碼方法其它編碼方法子帶子帶(subband)編碼編碼 小波編碼小波編碼分形(分形(f
36、ractal)編碼)編碼矢量量化矢量量化(vector quantization,VQ)編碼編碼統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼/熵編碼熵編碼 8.6 圖像壓縮標(biāo)準(zhǔn)圖像壓縮標(biāo)準(zhǔn)相關(guān)的國(guó)際組織相關(guān)的國(guó)際組織 ISO(International StandardizationOrganization,國(guó)際標(biāo)準(zhǔn)化組織)國(guó)際標(biāo)準(zhǔn)化組織)ITU(International Telecommunication Union,國(guó)國(guó)際電信聯(lián)盟),前身是際電信聯(lián)盟),前身是CCITT(國(guó)際電話電報(bào)咨詢(xún)委員(國(guó)際電話電報(bào)咨詢(xún)委員會(huì))會(huì)) 相關(guān)工作相關(guān)工作覆蓋了從二值到灰度(彩色)值的靜止和運(yùn)動(dòng)圖像覆蓋了從二值到灰度(彩色)值的靜止
37、和運(yùn)動(dòng)圖像采用的大部分基本技術(shù)前面已經(jīng)介紹,主要包括預(yù)測(cè)采用的大部分基本技術(shù)前面已經(jīng)介紹,主要包括預(yù)測(cè)和變換編碼技術(shù)和變換編碼技術(shù) 制定圖像標(biāo)準(zhǔn)的國(guó)際組織制定圖像標(biāo)準(zhǔn)的國(guó)際組織: ISO(國(guó)際標(biāo)準(zhǔn)化組織)(國(guó)際標(biāo)準(zhǔn)化組織) CCITT(國(guó)際電報(bào)電話咨詢(xún)委員會(huì))(國(guó)際電報(bào)電話咨詢(xún)委員會(huì))聯(lián)合組織下進(jìn)行制定的聯(lián)合組織下進(jìn)行制定的 標(biāo)準(zhǔn)的類(lèi)型(三類(lèi)):標(biāo)準(zhǔn)的類(lèi)型(三類(lèi)): (1) 二值圖像壓縮標(biāo)準(zhǔn):面向傳真而設(shè)計(jì)二值圖像壓縮標(biāo)準(zhǔn):面向傳真而設(shè)計(jì) 連續(xù)調(diào)圖像壓縮標(biāo)準(zhǔn):連續(xù)調(diào)圖像壓縮標(biāo)準(zhǔn):(2) 靜止幀黑白、彩色壓縮:面向靜止的單幅圖像靜止幀黑白、彩色壓縮:面向靜止的單幅圖像(3) 連續(xù)幀黑白、彩色壓縮
38、:面向連續(xù)的視頻影像連續(xù)幀黑白、彩色壓縮:面向連續(xù)的視頻影像圖像壓縮標(biāo)準(zhǔn)圖像壓縮標(biāo)準(zhǔn)壓縮標(biāo)準(zhǔn)壓縮標(biāo)準(zhǔn) G3和和G4 這兩個(gè)標(biāo)準(zhǔn)是由這兩個(gè)標(biāo)準(zhǔn)是由CCITT的兩個(gè)小組負(fù)責(zé)制定的,最初是的兩個(gè)小組負(fù)責(zé)制定的,最初是CCITT為傳真應(yīng)用而設(shè)計(jì)的。為傳真應(yīng)用而設(shè)計(jì)的。G3采用了非自適應(yīng)、采用了非自適應(yīng)、1-D,對(duì)每組,對(duì)每組N行掃描線中的后行掃描線中的后N-1行也可使用行也可使用2-D行程編碼。行程編碼。G4是是G3的一種簡(jiǎn)化版,其中只使用的一種簡(jiǎn)化版,其中只使用2-D行程編碼。行程編碼。 G3的壓縮率一般為的壓縮率一般為15:1 G4的壓縮率一般比的壓縮率一般比G3高高1倍倍 JBIG 這個(gè)標(biāo)準(zhǔn)由上
39、述這個(gè)標(biāo)準(zhǔn)由上述2合組織的二值圖聯(lián)合組合組織的二值圖聯(lián)合組(joint bilevel imaging group,JBIG)于)于1991年制定的。因?yàn)槟曛贫ǖ?。因?yàn)镚3和和G4是基于非自適應(yīng)是基于非自適應(yīng)技術(shù)的,所以對(duì)半色調(diào)灰度圖像編碼時(shí)常產(chǎn)生擴(kuò)展,技術(shù)的,所以對(duì)半色調(diào)灰度圖像編碼時(shí)常產(chǎn)生擴(kuò)展,JBIG的目標(biāo)的目標(biāo)就是采用一種自適應(yīng)技術(shù)解決這個(gè)問(wèn)題。就是采用一種自適應(yīng)技術(shù)解決這個(gè)問(wèn)題。 編碼效率提高了,對(duì)于打印字符的掃描圖像,壓縮比可提高編碼效率提高了,對(duì)于打印字符的掃描圖像,壓縮比可提高1.1-1.5倍,對(duì)計(jì)算機(jī)生成的打印字符圖像,壓縮比可提高倍,對(duì)計(jì)算機(jī)生成的打印字符圖像,壓縮比可提高
40、5倍。對(duì)抖倍。對(duì)抖動(dòng)或半色調(diào)圖像,壓縮比可提高動(dòng)或半色調(diào)圖像,壓縮比可提高2-30倍。倍。壓縮標(biāo)準(zhǔn)壓縮標(biāo)準(zhǔn) 壓縮標(biāo)準(zhǔn)壓縮標(biāo)準(zhǔn)JPEG(Joint Picture Expert Group)由由ISO和和CCITT聯(lián)合成立的專(zhuān)家組負(fù)責(zé)制定靜聯(lián)合成立的專(zhuān)家組負(fù)責(zé)制定靜態(tài)圖像(彩色與灰度圖像)的壓縮算法態(tài)圖像(彩色與灰度圖像)的壓縮算法定義了定義了3種編碼系統(tǒng)種編碼系統(tǒng)基于基于DCT的有損編碼基本系統(tǒng),可用于絕大多數(shù)的有損編碼基本系統(tǒng),可用于絕大多數(shù)壓縮應(yīng)用場(chǎng)合壓縮應(yīng)用場(chǎng)合用于高壓縮比、高精確度或漸進(jìn)重建應(yīng)用的擴(kuò)展用于高壓縮比、高精確度或漸進(jìn)重建應(yīng)用的擴(kuò)展編碼系統(tǒng)編碼系統(tǒng)用于無(wú)失真應(yīng)用場(chǎng)合的無(wú)損系統(tǒng)
41、用于無(wú)失真應(yīng)用場(chǎng)合的無(wú)損系統(tǒng)JPEG對(duì)錄像機(jī)質(zhì)量的靜止圖像的壓縮率一般可達(dá)到對(duì)錄像機(jī)質(zhì)量的靜止圖像的壓縮率一般可達(dá)到25:1 JPEG基本系統(tǒng)編碼器框圖基本系統(tǒng)編碼器框圖源圖像源圖像DCT正變換正變換量化器量化器熵編碼器熵編碼器壓縮圖像壓縮圖像表說(shuō)明表說(shuō)明表說(shuō)明表說(shuō)明 壓縮過(guò)程壓縮過(guò)程 DCT計(jì)算計(jì)算量化量化變長(zhǎng)碼賦值變長(zhǎng)碼賦值 具體壓縮過(guò)程具體壓縮過(guò)程先把整個(gè)圖像分解成多個(gè)先把整個(gè)圖像分解成多個(gè)8 88 8的圖像塊;的圖像塊;88的圖像塊經(jīng)過(guò)的圖像塊經(jīng)過(guò)DCT變換后,低頻分量都集中在左上角,高頻分變換后,低頻分量都集中在左上角,高頻分量則分布在右下角(量則分布在右下角(DCT變換類(lèi)似于低通濾
42、波器),因?yàn)榈皖l分量包變換類(lèi)似于低通濾波器),因?yàn)榈皖l分量包含了圖像的主要信息,所以可以忽略高頻分量,達(dá)到壓縮的目的;含了圖像的主要信息,所以可以忽略高頻分量,達(dá)到壓縮的目的;使用量化操作去掉高頻分量,使用量化操作去掉高頻分量,就是將某一個(gè)值除以量化就是將某一個(gè)值除以量化表中的對(duì)應(yīng)值。由于量化表中左上角的值較小,而右下角的值較大,表中的對(duì)應(yīng)值。由于量化表中左上角的值較小,而右下角的值較大,這樣達(dá)到保持低頻分量,抑制高頻分量的目的;這樣達(dá)到保持低頻分量,抑制高頻分量的目的;在左上角的低頻分量中在左上角的低頻分量中,F(0,0),F(0,0)代表了直流代表了直流(DC)(DC)系數(shù),即系數(shù),即8
43、88 8子塊子塊的平均值。由于兩個(gè)相鄰圖像塊的的平均值。由于兩個(gè)相鄰圖像塊的DCDC系數(shù)相差很小,所以采用差分系數(shù)相差很小,所以采用差分編碼編碼DPCM,DPCM,其它其它6363個(gè)元素是交流(個(gè)元素是交流(ACAC)系數(shù),采用之字型()系數(shù),采用之字型(zig-zagzig-zag)順序進(jìn)行行程編碼,使系數(shù)為順序進(jìn)行行程編碼,使系數(shù)為0 0的值更集中;的值更集中; 在得到在得到DCDC碼字和碼字和ACAC行程碼字后,為了進(jìn)一步提高壓縮比,再進(jìn)行熵編行程碼字后,為了進(jìn)一步提高壓縮比,再進(jìn)行熵編碼,采用了碼,采用了HuffmanHuffman編碼編碼 靜止圖像壓縮標(biāo)準(zhǔn)靜止圖像壓縮標(biāo)準(zhǔn) JPEG(
44、jointJPEG(joint picture expert group) picture expert group) 圖像應(yīng)用系統(tǒng)要想與圖像應(yīng)用系統(tǒng)要想與JPEGJPEG兼容,必須要支持其基本系統(tǒng)。在視覺(jué)效兼容,必須要支持其基本系統(tǒng)。在視覺(jué)效果不受到嚴(yán)重?fù)p失的前提下,對(duì)灰度圖像壓縮算法可以達(dá)到果不受到嚴(yán)重?fù)p失的前提下,對(duì)灰度圖像壓縮算法可以達(dá)到1515到到2020的壓縮比。如果在圖像質(zhì)量上稍微犧牲一點(diǎn)的話,可以達(dá)到的壓縮比。如果在圖像質(zhì)量上稍微犧牲一點(diǎn)的話,可以達(dá)到4040:1 1或或更高的壓縮比。更高的壓縮比。 如果處理的是彩色圖像,如果處理的是彩色圖像,JPEGJPEG算法首先將算法首先
45、將RGBRGB分量轉(zhuǎn)化成亮度分量和分量轉(zhuǎn)化成亮度分量和色差分量,同時(shí)丟失一半的色彩信息色差分量,同時(shí)丟失一半的色彩信息( (空間分辨率減半空間分辨率減半) )。然后,用。然后,用離散余弦變換來(lái)進(jìn)行變換編碼,舍棄高頻的系數(shù),并對(duì)余下的系數(shù)離散余弦變換來(lái)進(jìn)行變換編碼,舍棄高頻的系數(shù),并對(duì)余下的系數(shù)進(jìn)行量化,以進(jìn)一步減小數(shù)據(jù)量。最后,使用行程長(zhǎng)度編碼和進(jìn)行量化,以進(jìn)一步減小數(shù)據(jù)量。最后,使用行程長(zhǎng)度編碼和HuffmanHuffman編碼來(lái)完成壓縮任務(wù)。編碼來(lái)完成壓縮任務(wù)。JPEGJPEG解壓縮過(guò)程就是解壓縮過(guò)程就是JPEGJPEG壓縮過(guò)程的壓縮過(guò)程的逆過(guò)程,這使得算法具有對(duì)稱(chēng)性。逆過(guò)程,這使得算法具
46、有對(duì)稱(chēng)性。 JPEG2000 相對(duì)于原始相對(duì)于原始JPEG標(biāo)準(zhǔn),在對(duì)連續(xù)色調(diào)靜止圖像的壓縮標(biāo)準(zhǔn),在對(duì)連續(xù)色調(diào)靜止圖像的壓縮方面以及對(duì)壓縮數(shù)據(jù)的訪問(wèn)方面提供了更大的靈活性。方面以及對(duì)壓縮數(shù)據(jù)的訪問(wèn)方面提供了更大的靈活性。該標(biāo)準(zhǔn)是以小波編碼技術(shù)為基礎(chǔ)的。該標(biāo)準(zhǔn)是以小波編碼技術(shù)為基礎(chǔ)的。 該標(biāo)準(zhǔn)在該標(biāo)準(zhǔn)在1997年開(kāi)始征集提案,年開(kāi)始征集提案,1999年形成草案,年形成草案,2000年開(kāi)始使用。年開(kāi)始使用。靜止圖像壓縮標(biāo)準(zhǔn)靜止圖像壓縮標(biāo)準(zhǔn) 8.6.3視頻壓縮標(biāo)準(zhǔn)視頻壓縮標(biāo)準(zhǔn)視頻壓縮標(biāo)準(zhǔn)視頻壓縮標(biāo)準(zhǔn) 基本概念基本概念電視會(huì)議標(biāo)準(zhǔn)電視會(huì)議標(biāo)準(zhǔn)H.261、H.263MPEG標(biāo)準(zhǔn)標(biāo)準(zhǔn)MPEG-1、MPEG-
47、2、MPEG-4、MPEG-7和和MPEG-21 連續(xù)幀圖像的定義連續(xù)幀圖像的定義 連續(xù)幀圖像壓縮的基本思想連續(xù)幀圖像壓縮的基本思想 幀間運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)編碼技術(shù)幀間運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)編碼技術(shù) H.261標(biāo)準(zhǔn)標(biāo)準(zhǔn) MPEG1/2/4/7標(biāo)準(zhǔn)標(biāo)準(zhǔn)運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)1. 連續(xù)幀圖像的定義連續(xù)幀圖像的定義 由多幅尺寸相同的靜止圖像組成的圖像序列,被稱(chēng)為由多幅尺寸相同的靜止圖像組成的圖像序列,被稱(chēng)為連續(xù)幀圖像連續(xù)幀圖像。 與靜止幀圖像相比,與靜止幀圖像相比,連續(xù)幀圖像連續(xù)幀圖像多了一個(gè)時(shí)間軸,成多了一個(gè)時(shí)間軸,成為三維信號(hào),因此為三維信號(hào),因此也被稱(chēng)為也被稱(chēng)為運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn) 2.
48、 連續(xù)幀圖像壓縮的基本思想連續(xù)幀圖像壓縮的基本思想 基于如下基本假設(shè):基于如下基本假設(shè): 在各連續(xù)幀之間存在簡(jiǎn)單的相關(guān)性平移運(yùn)動(dòng)。在各連續(xù)幀之間存在簡(jiǎn)單的相關(guān)性平移運(yùn)動(dòng)。 一個(gè)特定畫(huà)面上的像素量值:一個(gè)特定畫(huà)面上的像素量值:1 1)可以根據(jù))可以根據(jù)同幀同幀附近像素來(lái)加以預(yù)測(cè),被稱(chēng)為:附近像素來(lái)加以預(yù)測(cè),被稱(chēng)為:幀內(nèi)幀內(nèi)編碼技術(shù)編碼技術(shù)2 2)可以根據(jù))可以根據(jù)附近幀附近幀中的像素來(lái)加以預(yù)測(cè),被稱(chēng)為:中的像素來(lái)加以預(yù)測(cè),被稱(chēng)為:幀間幀間編碼技術(shù)編碼技術(shù)運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn) 壓縮的基本思想壓縮的基本思想 通過(guò)減少通過(guò)減少幀間圖像數(shù)據(jù)冗余幀間圖像數(shù)據(jù)冗余,來(lái)達(dá)到減少數(shù)據(jù)量、壓縮連續(xù)幀圖
49、像體積的目的,來(lái)達(dá)到減少數(shù)據(jù)量、壓縮連續(xù)幀圖像體積的目的 將連續(xù)幀圖像序列,分為將連續(xù)幀圖像序列,分為參考幀參考幀和和預(yù)測(cè)幀預(yù)測(cè)幀,參考幀用靜止圖像壓縮方法進(jìn)行壓,參考幀用靜止圖像壓縮方法進(jìn)行壓縮,預(yù)測(cè)幀用于對(duì)縮,預(yù)測(cè)幀用于對(duì)幀差圖像幀差圖像進(jìn)行壓縮進(jìn)行壓縮 由于由于幀差圖像幀差圖像的數(shù)據(jù)量大大小于的數(shù)據(jù)量大大小于參考幀參考幀的數(shù)據(jù)量,從而可以達(dá)到很高的壓縮比的數(shù)據(jù)量,從而可以達(dá)到很高的壓縮比 3. 幀間運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)編碼技術(shù)幀間運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)編碼技術(shù) 幀間預(yù)測(cè)編碼幀間預(yù)測(cè)編碼壓縮圖像塊壓縮圖像塊輸入圖像塊輸入圖像塊e en nf fn n f fn n運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)幀間誤差圖像幀間誤差
50、圖像運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)圖像運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)圖像運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn) 向前預(yù)測(cè)向前預(yù)測(cè) 雙向預(yù)測(cè)雙向預(yù)測(cè)前一幀前一幀當(dāng)前幀當(dāng)前幀前一幀前一幀當(dāng)前幀當(dāng)前幀下一幀下一幀 I 幀幀(Intra-picture) : 不進(jìn)行預(yù)測(cè)、進(jìn)行幀內(nèi)編碼的編碼幀(參考不進(jìn)行預(yù)測(cè)、進(jìn)行幀內(nèi)編碼的編碼幀(參考幀)幀); P幀幀(Predicted-picture):通過(guò)向前預(yù)測(cè)得到的誤差編碼幀通過(guò)向前預(yù)測(cè)得到的誤差編碼幀; B幀幀(Bidirectional-picture):通過(guò)雙向預(yù)測(cè)得到的誤差編碼幀通過(guò)雙向預(yù)測(cè)得到的誤差編碼幀.因因圖像序列存放在存儲(chǔ)器中,可以使用下一幀圖像序列存放在存儲(chǔ)器中,可以使用下一幀.運(yùn)
51、動(dòng)圖像壓縮標(biāo)準(zhǔn)運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)編碼中的運(yùn)動(dòng)補(bǔ)償編碼中的運(yùn)動(dòng)補(bǔ)償 運(yùn)動(dòng)補(bǔ)償概念運(yùn)動(dòng)補(bǔ)償概念 以對(duì)幀間運(yùn)動(dòng)的估算為基礎(chǔ)的,若物體均在空間上有以對(duì)幀間運(yùn)動(dòng)的估算為基礎(chǔ)的,若物體均在空間上有一位移,那么一位移,那么,如,如: :對(duì)于像素的平移運(yùn)動(dòng),可用運(yùn)動(dòng)矢量來(lái)描述。對(duì)于像素的平移運(yùn)動(dòng),可用運(yùn)動(dòng)矢量來(lái)描述。 一個(gè)來(lái)自前一編碼幀的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)像素,就能給出一個(gè)當(dāng)前像一個(gè)來(lái)自前一編碼幀的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)像素,就能給出一個(gè)當(dāng)前像素的最佳預(yù)測(cè)。預(yù)測(cè)誤差和運(yùn)動(dòng)矢量一同參與編碼。素的最佳預(yù)測(cè)。預(yù)測(cè)誤差和運(yùn)動(dòng)矢量一同參與編碼。 由于一些運(yùn)動(dòng)矢量之間的空間相關(guān)性通常較高,因此,由于一些運(yùn)動(dòng)矢量之間的空間相關(guān)性通常較高,因
52、此,一個(gè)像素一個(gè)像素的運(yùn)動(dòng)矢量,可以代表一個(gè)相鄰像素塊的運(yùn)動(dòng)。的運(yùn)動(dòng)矢量,可以代表一個(gè)相鄰像素塊的運(yùn)動(dòng)。 實(shí)現(xiàn)中,畫(huà)面一般劃分成一些不連接的像素塊實(shí)現(xiàn)中,畫(huà)面一般劃分成一些不連接的像素塊( (在在MPEGlMPEGl和和MPEG2MPEG2標(biāo)準(zhǔn)中一個(gè)像素塊為標(biāo)準(zhǔn)中一個(gè)像素塊為16161616像素像素) ),對(duì)于每一個(gè)這樣的像素塊,對(duì)于每一個(gè)這樣的像素塊,只估算一個(gè)運(yùn)動(dòng)矢量。只估算一個(gè)運(yùn)動(dòng)矢量。運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)MPEG幀的分類(lèi)幀的分類(lèi)MPEG 的畫(huà)面組(GOP)MPEG幀的分類(lèi)幀的分類(lèi)由于畫(huà)面內(nèi)容有連貫由于畫(huà)面內(nèi)容有連貫性性,因此當(dāng)前畫(huà)面的內(nèi)因此當(dāng)
53、前畫(huà)面的內(nèi)容可以看作是前面畫(huà)容可以看作是前面畫(huà)面內(nèi)容的位移面內(nèi)容的位移(運(yùn)動(dòng)運(yùn)動(dòng))。運(yùn)動(dòng)矢量運(yùn)動(dòng)矢量畫(huà)面各處相應(yīng)的位移畫(huà)面各處相應(yīng)的位移量量(幅度、方向幅度、方向)各有各有不同,因此畫(huà)面應(yīng)細(xì)不同,因此畫(huà)面應(yīng)細(xì)分成塊分成塊(宏塊宏塊),以宏,以宏塊為單位,找出兩幀塊為單位,找出兩幀畫(huà)面中相應(yīng)宏塊之間畫(huà)面中相應(yīng)宏塊之間的位移量的位移量-畫(huà)面的重新排序GOP(Group of Pictures)例0B1B2I3B4B5P6B7B8P9B10I畫(huà)面的顯示順序是:畫(huà)面的編碼順序是:B B I B B P B B P B I0 1 2 3 4 5 6 7 8 9 10I B B P B B P B B I
54、 B2 0 1 5 3 4 8 6 7 10 9因此因此,每一個(gè)每一個(gè)GOP中的畫(huà)面在編碼前和解碼后都必須重排序中的畫(huà)面在編碼前和解碼后都必須重排序 電視會(huì)議標(biāo)準(zhǔn)電視會(huì)議標(biāo)準(zhǔn) H.261標(biāo)準(zhǔn)標(biāo)準(zhǔn) 應(yīng)用范圍:電視會(huì)議應(yīng)用范圍:電視會(huì)議 主要編碼技術(shù):主要編碼技術(shù): DCT變換變換向前運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)向前運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)Zig-zag排序排序霍夫曼編碼霍夫曼編碼IPPPPPPIPPP. 電視會(huì)議標(biāo)準(zhǔn)電視會(huì)議標(biāo)準(zhǔn) H.263標(biāo)準(zhǔn)標(biāo)準(zhǔn)應(yīng)用范圍:可視電話應(yīng)用范圍:可視電話主要編碼技術(shù):主要編碼技術(shù): DCT變換變換雙向運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)雙向運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)Zig-zag排序排序霍夫曼編碼霍夫曼編碼IBBPBBPBBIBB
55、P . . . . 多媒體壓縮標(biāo)準(zhǔn)多媒體壓縮標(biāo)準(zhǔn)MPEG系列標(biāo)準(zhǔn)系列標(biāo)準(zhǔn)(Moving Picture ExpertGroup)ISO/IEC/JTC1/SC29的一個(gè)工作組的一個(gè)工作組WG11, 1988年年成立成立, 目前有目前有25個(gè)國(guó)家個(gè)國(guó)家(團(tuán)體團(tuán)體)的的200多個(gè)公司多個(gè)公司300多名成員分多名成員分10個(gè)組工作個(gè)組工作JPEG的目標(biāo)是專(zhuān)門(mén)集中于靜止圖像壓縮,的目標(biāo)是專(zhuān)門(mén)集中于靜止圖像壓縮,MPEG的目標(biāo)是針對(duì)運(yùn)動(dòng)圖像的數(shù)據(jù)壓縮,但是的目標(biāo)是針對(duì)運(yùn)動(dòng)圖像的數(shù)據(jù)壓縮,但是JPEG和和MPEG有密切聯(lián)系有密切聯(lián)系MPEG專(zhuān)家小組,不僅限制于數(shù)字視頻壓縮,音專(zhuān)家小組,不僅限制于數(shù)字視頻壓
56、縮,音頻及音頻和視頻的同步問(wèn)題都不能脫離視頻壓縮頻及音頻和視頻的同步問(wèn)題都不能脫離視頻壓縮獨(dú)立進(jìn)行獨(dú)立進(jìn)行 MPEG-1標(biāo)準(zhǔn)標(biāo)準(zhǔn)MPEG-1標(biāo)準(zhǔn)標(biāo)準(zhǔn)(ISO/IEC11172). 1992年發(fā)布。年發(fā)布。用于用于1.5Mbps數(shù)據(jù)傳輸率的運(yùn)動(dòng)圖像及其伴音的數(shù)據(jù)傳輸率的運(yùn)動(dòng)圖像及其伴音的編碼。主要應(yīng)用于編碼。主要應(yīng)用于 VCD,MP3音樂(lè)等音樂(lè)等MPEG-1在在JPEG和和H.261等優(yōu)秀標(biāo)準(zhǔn)的基礎(chǔ)上等優(yōu)秀標(biāo)準(zhǔn)的基礎(chǔ)上, 對(duì)對(duì)參加競(jìng)爭(zhēng)的參加競(jìng)爭(zhēng)的14個(gè)方案?jìng)€(gè)方案,通過(guò)反復(fù)協(xié)調(diào)而得到統(tǒng)一通過(guò)反復(fù)協(xié)調(diào)而得到統(tǒng)一,從而成為先進(jìn)、合理、質(zhì)量高、成本低的優(yōu)秀從而成為先進(jìn)、合理、質(zhì)量高、成本低的優(yōu)秀標(biāo)準(zhǔn)標(biāo)準(zhǔn)MPEG-1促進(jìn)了大規(guī)模集成電路專(zhuān)用芯片的發(fā)展促進(jìn)了大規(guī)模集成電路專(zhuān)用芯片的發(fā)展,為多媒體技術(shù)和產(chǎn)品的繁榮立下了功勞為多媒體技術(shù)和產(chǎn)品的繁榮立下了功
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 技術(shù)要領(lǐng):數(shù)據(jù)庫(kù)優(yōu)化方法探討
- 2026年英語(yǔ)聽(tīng)力與口語(yǔ)表達(dá)能力進(jìn)階測(cè)試題
- 2026年工業(yè)產(chǎn)品設(shè)計(jì)及創(chuàng)新應(yīng)用測(cè)試題
- 2026年網(wǎng)絡(luò)安全工程師初級(jí)練習(xí)題
- 2026年法律常識(shí)考試題集及答案解析
- 2026年新型科技公司稅收管理及申報(bào)考核練習(xí)題
- 2026年法律行業(yè)高級(jí)職業(yè)資格測(cè)試題集及答案詳解
- 2026年能源行業(yè)專(zhuān)業(yè)知識(shí)筆試題目及答案詳解
- 2026年高精度認(rèn)證金融考前速成資料投資決策技巧試題解析
- 2026年地理常識(shí)與地理信息系統(tǒng)試題庫(kù)
- 2026貴州黔東南州公安局面向社會(huì)招聘警務(wù)輔助人員37人考試備考題庫(kù)及答案解析
- 2026年數(shù)字化管理專(zhuān)家認(rèn)證題庫(kù)200道及完整答案(全優(yōu))
- 鐵路除草作業(yè)方案范本
- 2026屆江蘇省常州市生物高一第一學(xué)期期末檢測(cè)試題含解析
- 2026年及未來(lái)5年市場(chǎng)數(shù)據(jù)中國(guó)高溫工業(yè)熱泵行業(yè)市場(chǎng)運(yùn)行態(tài)勢(shì)與投資戰(zhàn)略咨詢(xún)報(bào)告
- 教培機(jī)構(gòu)排課制度規(guī)范
- 2026年檢視問(wèn)題清單與整改措施(2篇)
- 國(guó)家開(kāi)放大學(xué)《基礎(chǔ)教育課程改革專(zhuān)題》形考任務(wù)(1-3)試題及答案解析
- 2025年郵政社招筆試題庫(kù)及答案
- 個(gè)稅掛靠協(xié)議書(shū)
- 車(chē)載HUD產(chǎn)業(yè)發(fā)展趨勢(shì)報(bào)告(2025)-CAICV智能車(chē)載光顯示任務(wù)組
評(píng)論
0/150
提交評(píng)論