版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、,第6章變換編碼,6.1變換編碼的基本概念和原理 6.2KLT編碼 6.3DCT編碼 6.4時-頻局部化對變換的要求 6.5小波變換 6.6DCT與小波變換的性能比較 習題與思考題,6.1變換編碼的基本概念和原理6.1.1變換編碼的概念與歷史20世紀70年代后,科學家們開始探索比預測編碼效率更高的編碼方法,這就是變換編碼。變換編碼是指先對信號進行某種函數(shù)變換(一般采用正交變換),從一種信號空間變換到另一種信號空間,然后再對變換后的信號進行編碼。如將時域信號變換到頻域,因為聲音、圖像大部分信號都是低頻信號,在頻域中信號的能量較集中,再進行采樣、編碼,那么就能夠壓縮數(shù)據(jù)。以大家熟悉的傅里葉變換為例
2、,時域的單頻正弦信號經(jīng)過傅里葉變換后,成為頻域的單根譜線,在頻域描述單根譜線所需要的比特數(shù)顯然少于在時域描述正弦信號的比特數(shù),從而實現(xiàn)數(shù)據(jù)壓縮。,變換編碼的通用模型如圖6-1所示,它一般經(jīng)過映射變換、變換域系數(shù)二次量化、量化系數(shù)的統(tǒng)計編碼(熵編碼)三個步驟。映射變換的作用是把信號從一個域變換到另一個域,使信號在變換域容易進行壓縮,變換后的樣值更獨立和有序。在采用實數(shù)變換的情況下,變換編碼一般為可逆變換,即變換前和變換后的數(shù)據(jù)是一一對應(yīng)的,變換編碼的數(shù)據(jù)壓縮作用主要是依靠二次量化和統(tǒng)計編碼實現(xiàn)。廣義上說,預測編碼、游程編碼等都可以納入圖6-1所示模型,只是根據(jù)實用技術(shù)上的習慣,未將其歸入變換編碼
3、范疇。,圖6-1變換編碼通用模型,原始圖像及其幅度譜,33 percent coefficients containing 99 percent of total energy (not including DC component),10 percent coefficients containing 97 percent energy,5 percent coefficients containing 95 percent energy,2 percent coefficients containing 92 percent energy,6.1.2正交變換與正交矩陣首先,根據(jù)矩陣代數(shù)理論
4、,線性變換可以定義為Y=AX (6-1)其中, X為矢量信號,X=(x1, x2, , xN)T是由N個分量組成的列向量;A是一個NN 的矩陣,稱為此變換的核矩陣;變換結(jié)果Y=(y1, y2, , yN)T也是由N個分量組成的列向量,稱為X的像。式(6-1)反映了Y坐標系與X坐標系的基矢量之間的關(guān)系。如果線性變換能保持N維矢量信號X的模X不變,則稱此變換為正交變換,此時A為正交矩陣。A為正交矩陣的充要條件為AAT=ATA=I (6-2),其中, I為單位陣,AT為A的轉(zhuǎn)置。又AA1=I,因此正交矩陣為滿秩陣,其逆矩陣A1等于它的轉(zhuǎn)置矩陣AT,即A1=AT。由于逆矩陣的存在,保證了可用反變換得到
5、唯一確定的復原信號X,即正交變換保證了X與Y的一一對應(yīng)關(guān)系,如式(6-3)所示。這是一個能使正交變換在媒體信號壓縮編碼中得到應(yīng)用的重要性質(zhì)。X=ATY=ATAX=X (6-3)其次,根據(jù)矩陣代數(shù)理論,一個實對稱矩陣,必然存在一個正交矩陣Q及其轉(zhuǎn)置矩陣QT,使得: QQT= (6-4)式中,為對角陣,即,l1, l2, , lN為實對稱矩陣F的N個特征根,而矩陣QT=q1q2qNT的第i個列向量qi(稱為矩陣F的特征向量)和F的特征根li滿足,(6-5),(6-6),(6-7),(6-8),6.1.3正交變換的壓縮原理現(xiàn)在以一個簡單的例子說明變換編碼實現(xiàn)數(shù)據(jù)壓縮的基本原理。設(shè)對一個緩變均勻分布的
6、信號的采樣值采用3比特進行編碼,每個樣本有23=8個幅度等級,則相鄰兩個樣值x1和x2的聯(lián)合事件x1x2共有88=64種可能性,可以用圖6-2所示的二維平面坐標表示,其中x1軸和x2軸分別表示相鄰兩樣本的可能取值。由于信號緩慢變化,那么相鄰兩個樣值的幅度等級變化差異不大,那么聯(lián)合事件x1x2出現(xiàn)在圖6-2所示的陰影區(qū)內(nèi)的概率就很大?;蛘哒f,絕大多數(shù)的x1x2聯(lián)合事件位于圖6-2所示的陰影區(qū)內(nèi)。不妨將此陰影區(qū)稱為x1和x2相關(guān)區(qū),x1和x2越相關(guān),此陰影區(qū)越扁;x1和x2越不相關(guān),此相關(guān)區(qū)就越加“方圓”。如果相鄰兩個樣值幅度等級最多差1,那么x1x2聯(lián)合事件全部出現(xiàn)在此陰影區(qū)內(nèi)。,圖6-2正交變
7、換示意圖,6.2KLT編碼KLT可使變換后的各個分量之間在統(tǒng)計上互不相關(guān)。離散KLT有時也稱為霍特林(Hoteling)變換,經(jīng)霍特林變換后離散信號的各分量不再具有相關(guān)性。下面討論KLT及其性質(zhì)。對于一個離散信號序列,若每一個信號由n個樣點組成,那么就可以將該信號視作一個n維空間的點,而每個樣值代表n維信號矢量空間的一個分量,記作X=(x1,x2,xN)T。矢量X的協(xié)方差矩陣X可以表示為,(6-9),由于X為實對稱陣,由式(6-4)可知,必存在一個與協(xié)方差矩陣X相對應(yīng)的正交矩陣Q,其列向量是矢量信號X的協(xié)方差矩陣X的特征向量。我們用正交矩陣Q對信號X作正交變換,即Y=QX (6-10)這個變換
8、的基本思想是Karhunen和Loeve分別在1947年和1948年提出來的,因此被稱為KLT,Q為KLT矩陣,其主要性質(zhì)如下所述。1. 去相關(guān)性KLT使變換后的矢量信號Y的各分量互不相關(guān)。要證明矢量信號Y的各分量互不相關(guān),也就是要證明Y的協(xié)方差矩陣為對角型。根據(jù)協(xié)方差矩陣的定義,可以得到,Y =EYE(Y)YE(Y)T (6-11)將式(6-10)代入式(6-11),有由此可以得出結(jié)論, Y為對角陣,Y的各分量之間不存在統(tǒng)計相關(guān)性。這也就是說,X各分量的相關(guān)性被完全去除,這正是采用正交變換編碼所希望得到的結(jié)果。,(6-12),2. 能量集中性KL變換的能量集中性體現(xiàn)在兩個方面:一方面,變換后
9、Y矢量的協(xié)方差矩陣Y只在主對角線上值不為零;另一方面,主對角線上的元素的大小按左上角到右下角的順序依次排列,這也就是說,最大的方差將集中在前m個分量之中。3. 最佳性在最小均方誤差準則下,KLT是失真最小的變換。它是從數(shù)據(jù)壓縮角度提出的。首先,正交變換是“?!北3肿儞Q,因此變換域信號Y的能量與原始信號X的能量是相等的,變換本身一般是可逆變換,它不牽涉到數(shù)據(jù)失真,只是使信號易于壓縮編碼。其,次,為實現(xiàn)更高性能的數(shù)據(jù)壓縮,必須刪除部分能量,這就帶來了失真。設(shè)只保留前m n個分量(n為信號維數(shù)),則解碼時也只能恢復m個分量。最后,若刪除的nm個信號分量的均值為零,則理論上可以證明KLT可使恢復信號的
10、均方誤差最小,且這個最小值等于變換域被刪除的最小nm個矢量信號的方差之和,即本性質(zhì)對在一定保真度要求下,應(yīng)用KLT進行媒體信號壓縮編碼具有指導意義。該性質(zhì)指出,對于零均值信號,KLT以后,用“省略”較小的對角線分量的方法進行數(shù)據(jù)壓縮編碼,可使均方誤差最小。,(6-13),但在實踐中,使用KLT還是受到很大限制,原因在于兩方面: KLT的變換矩陣隨數(shù)據(jù)集的不同而不同,它需要知道信源的協(xié)方差矩陣并求出特征值和特征向量,而求特征值和特征向量非常困難,有時連信源的協(xié)方差矩陣都得不到。 即使借助于計算機能求解出特征值和特征向量,也很難滿足實時編碼的要求;而且還需要將這些信息傳輸給解碼端,這反過來又不利于
11、壓縮碼率。,在早期的編碼實踐中,用KLT在13.5 kb/s下得到的語音質(zhì)量與56 kb/s的PCM語音質(zhì)量接近;在2比特/像素編碼下的圖像質(zhì)量與7比特/像素的PCM質(zhì)量相當。在當代的編碼實踐中,人們更多的是尋求一些不是“最佳”,但也有較好去相關(guān)和能量集中性能,而實現(xiàn)容易得多的變換編碼算法,如離散余弦變換、小波變換、改進余弦變換等,而KLT就常常作為這些變換性能的評價標準。,6.3DCT編碼6.3.1DCT概述 圖像的正交變換編碼始于1968年。當時, H.C.Andrews等人基于大多數(shù)自然圖像的高頻分量相對幅度較低,可完全舍棄或者只用少量碼字編碼而失真不大的認識,提出不對圖像的空域樣點進行
12、編碼,而對其二維DFT系數(shù)進行編碼和傳輸。 DFT是一種復變換,運算量大,不易實時處理。 1969年,他們發(fā)現(xiàn)利用Walsh-Hadamard變換(WHT)取代DFT可使運算量大大減少。后來又提出了比WHT更快速的Haar變換(HRT)和能匹配圖像亮度線性變化的斜變換(SLT)等。更有意義的是, N.Ahmed等人于1974年提出了離散余弦變換(DCT),它,的變換矩陣的基向量近似于Toeplitz矩陣的特征向量,而Toeplitz矩陣又體現(xiàn)了信號的相關(guān)特征。因此, DCT被認為是對語音和圖像信號的準最佳變換,其性能接近KLT。自從提出DCT以后,DCT已被廣泛應(yīng)用于語音及圖像數(shù)據(jù)壓縮領(lǐng)域。D
13、CT在理論上是次最佳正交變換,但是它在去相關(guān)與能量集中性上僅次于KLT,具有快速算法且算法結(jié)構(gòu)具有很強的規(guī)律性,實現(xiàn)上非常高效,這些使得DCT在圖像編碼中占有重要的地位。,DCT的基本原理如下:它先將圖像分成NN像素塊,然后對NN像素塊逐一進行二維DCT(2D-DCT)。由于大多數(shù)圖像的高頻分量較小,相應(yīng)于圖像高頻分量的系數(shù)經(jīng)常為零,加上人眼對高頻成分的失真不太敏感,所以可用更粗的量化。因此,傳送變換系數(shù)的數(shù)碼率要大大小于傳送圖像像素所用的數(shù)碼率。到達接收端后通過反離散余弦變換(IDCT)恢復到初始樣值,雖然會有一定的失真,但人眼是可以接受的。,DCT矩陣的元素都是小數(shù),實際應(yīng)用中用浮點表示不
14、利于降低應(yīng)用成本,若改用定點表示就可能在精度損失不多的情況下采用定點器件實現(xiàn)。另外,對變換后的數(shù)據(jù)一般也會進行二次量化,而量化本身就會帶來失真,所以變換環(huán)節(jié)有一點失真也是可以接受的。所以,變換編碼一般為有失真壓縮編碼。另外,在新的視頻編碼標準H.264中,也開始直接采用整數(shù)變換(近似DCT)。,6.3.2DCT定義長度為M的一維序列x(m)|m=0,1,M1的一維離散余弦變換(1D-DCT)定義為反變換(IDCT)定義為其中, 。,(6-15),(6-14),可見,1D-DCT正反變換的變換核都是a(k, m),k =0,1,M1稱為DCT的基向量元素組,它滿足如下正交條件:,(6-16),(
15、6-17),根據(jù)式(6-14)可以得到1D-DCT的矩陣表示形式為,(6-18),數(shù)字圖像x(m,n)實際是一個MN的數(shù)據(jù)矩陣,為了減弱或去除圖像數(shù)據(jù)的空間相關(guān)性,可以用二維DCT將圖像從空間域(MN平面),轉(zhuǎn)換到DCT域(KL平面)。二維DCT(2D-DCT)定義為其中,K=0, 1, 2, , M1;L=0, 1, 2, ,N1;,(6-19),變換核為,(6-20),令上式可以分離成g(m, n, K, L)=U(m, k)V(n, L)所以可改寫成,(6-21),令則這樣, 二維DCT實際上就已分解成雙重一維DCT了。,(6-22),2D-DCT的反變換2D-IDCT的定義為由此可知,
16、二維DCT和IDCT的計算過程都可以采用先后進行兩次一維DCT和IDCT,這種方法被稱為行、列分離算法。,(6-23),【例6-1】試對協(xié)方差矩陣X作DCT,其中【解】由X可知,M=4。根據(jù)式(6-16),可知4點DCT的變換核為其中,,對FX作變換,變換后的矩陣記為FY,得可以看到,本例中FX滿足Toeplitz矩陣的條件,即沿對角線方向的元素都相同。由變換結(jié)果可知,它與KLT的結(jié)果一樣。,6.3.3快速算法按照式(6-14)計算N點1D-DCT需要N2次乘法和N(N1)次加法,而計算一個NN的圖像塊的2D-DCT在采用行列分離后需要2N3次乘法和2N2(N1)次加法。對于常用的88圖像塊,
17、這需要1024次乘法和896次加法。為大幅度降低計算量,許多學者從多方面進行研究,提出許多快速離散余弦變換FDCT算法,包括利用FFT、代數(shù)分解、矩陣分解等方法。這里將重點介紹利用代數(shù)分解的FDCT算法。下面以N=8為例,首先介紹一種比較簡單的1D-DCT算法。這類算法盡量利用DCT定義式中的對稱性,以減少運算過程中的加法和乘法次數(shù)。先作如下符號定義:,以上符號中,Ck和Sk代表DCT的系數(shù), sjk代表樣值的和,djk代表樣值的差。于是,8點1D-DCT的變換系數(shù)Y(k)|k=0,1,7可寫成如下的形式:2Y(0)=C4(s0734+s1625),其中s0734=s07+s34,s1625=
18、s16+s25;2Y(1)=C1d07+C3d16+C5d25+C7d34;2Y(2)=C2d0734+C6d1625,其中d0734=s07s34,d1625=s16s25;2Y(3)=C3d07C7d16C1d25C5d34;2Y(4)=C4(s0734s1625);2Y(5)=C5d07C1d16+C7d25+C3d34;,2Y(6)=C6d0734C2d1625;2Y(7)=C7d07C5d16+C3d25C1d34。從上面的式子可以看出,現(xiàn)在計算一個8點1D-DCT只需22次乘法和28次加法, 只是簡單地利用系數(shù)的對稱性,然后反復地在運算中使用樣值的和、差,就可以使計算量大幅度的下降
19、。Ligtenberg和Vetterli改進了上述代數(shù)分解方法,用更加復雜的快速算法進一步減少了計算量,其FDCT算法的流程圖如圖6-3所示。,圖6-3Ligtenberg和Vetterli的FDCT算法流程17,在圖6-3中,運算流從左至右,相互交于一節(jié)點的線彼此相加或相減。小方塊中的C4表示用C4乘以該信號。標注“ROT”的單元為旋轉(zhuǎn)運算單元,此運算單元輸入端子如果標注“+”,則經(jīng)此端子進入運算單元的信號極性不變;如果標注“”,則經(jīng)此端子進入運算單元的信號極性發(fā)生改變(乘以-1)。旋轉(zhuǎn)運算單元定義如下:,(6-24),從式(6-24)中可以看到,一次旋轉(zhuǎn)需要4次乘法和2次加法。此式還可以通
20、過變換表示成式(6-25)所示的3次乘法和3次加法的形式。由此可以統(tǒng)計圖6-3中的運算量為13次乘法和29次加法。需要指出的是,隨著微處理器性能的不斷提高,許多處理器都能完成單周期的乘法運算和加法運算,因此有些FDCT算法雖然具有較少的乘法和加法次數(shù),但由于其復雜的取址方式,在現(xiàn)代處理器條件下,實際計算復雜度不一定是最優(yōu)的。,(6-25),6.3.4基于DCT的圖像編碼基于DCT的圖像編解碼框圖如圖6-4所示,其關(guān)鍵模塊為:DCT、量化、熵編碼。該過程一般為有損壓縮編碼。,圖6-4基于DCT的圖像編解碼框圖,1. DCT經(jīng)過大量圖像信號在DCT域的統(tǒng)計分析發(fā)現(xiàn),圖像數(shù)據(jù)經(jīng)DCT后,頻譜系數(shù)主要
21、成分集中在比較小的范圍,且主要位于低頻部分。進行圖像的DCT時,并不是對整幅圖像進行一次DCT,而是將圖像劃分成尺寸相同的塊(例如88、1616或3232的塊),然后再對每個塊分別進行DCT,其原因在于:一方面,小塊圖像的DCT的計算更容易;另一方面,距離較遠的像素之間相關(guān)性比距離較近的像素之間相關(guān)性小。 下面舉例介紹圖6-4所示的基于DCT的圖像壓縮編碼過程?!纠?-2】表6-1所示為一個88圖像塊在空間域的亮度采樣值,試對它進行基于DCT的圖像編碼。,表6-1空間域的88圖像塊,表6-2是對表6-1數(shù)據(jù)進行二維DCT且經(jīng)過取整后得到的88變換域系數(shù)。從表6-1可以看出,在空間域相鄰像素間的
22、相關(guān)性強,采樣值比較接近。從表6-2可以看出,經(jīng)過變換和取整后,大部分系數(shù)為0,只有少數(shù)系數(shù)不為0。數(shù)值較大的系數(shù)主要集中在變換系數(shù)矩陣的左上角,數(shù)值較小的系數(shù)位于矩陣的右下角處。,表6-2DCT域取整的88圖像塊,2. 量化量化的目的是減小非0系數(shù)的幅度以及增加0值系數(shù)的數(shù)目。在DCT圖像編碼中,可以采用均勻量化或非均勻量化進行標量量化。當采用非均勻量化時,量化步長是按照系數(shù)所在的位置和性質(zhì)來確定。首先,由于人眼對亮度信號和色度信號的敏感程度不同(人眼對亮度更敏感),亮度信號和色度信號使用不同的量化表,亮度系數(shù)的量化步長一般小于色度系數(shù)的量化步長;其次,低頻系數(shù)和高頻系數(shù)的量化步長也不一樣,
23、一般低頻系數(shù)反映圖像的整體情況,高頻系數(shù)反映圖像的邊緣細節(jié),低頻系數(shù)更重要,因此低頻系數(shù)的量化步長要小于高頻系數(shù)的量化步長。,JPEG標準采用非均勻量化,其量化系數(shù)表Q(k,l)如表6-3所示。量化過程就是簡單地將變換系數(shù)除以相應(yīng)的量化步長,然后四舍五入進行取整,即反量化過程則表示為X(k, l)=c(k, l)Q(k, l) (6-27),(6-26),表6-3JPEG的標準量化表,表6-2的數(shù)據(jù)經(jīng)過量化后,得到的數(shù)據(jù)如表6-4所示。從表6-4中的數(shù)據(jù)可以看出,圖像數(shù)據(jù)經(jīng)過DCT和量化后,其絕大部分數(shù)據(jù)都已經(jīng)變?yōu)?,因而編碼傳輸DCT變換域的系數(shù)比編碼傳輸圖像空域的系數(shù)所需要的碼率要小很多。
24、,表6-4采用JPEG量化表量化后的88圖像塊,3. 熵編碼熵編碼就是要使編碼后的圖像平均比特數(shù)R盡可能接近圖像熵H,達到進一步減少圖像數(shù)據(jù)編碼碼率的目的,其基本原理在第4章已經(jīng)介紹過。圖像中常用的熵編碼是Huffman編碼,它在輸入符號概率空間已知的情況下,是最佳變長編碼,并且是可逆編碼,即熵解碼后的數(shù)據(jù)可以無失真地恢復。這就是說,在對表6-4所示數(shù)據(jù)進行熵編碼后(在第4章例4-5有詳細介紹),在解碼端可以無失真地恢復出表6-4的數(shù)據(jù),但由于DCT編碼過程中的取整和量化的影響,最后在解碼端恢復的數(shù)據(jù)是不同于原始數(shù)據(jù)的,是有失真的,如表6-5所示。,表6-5經(jīng)反量化和反變換后恢復出的空間域的數(shù)
25、據(jù),4. 基于塊的圖像DCT編碼的缺點目前采用的圖像DCT編碼都是基于塊的,即首先將圖像分成88的像素塊,然后對每塊進行DCT得到64個DCT系數(shù)。這樣雖然大大減少了運算量,但是由于對每塊進行DCT,塊與塊之間的相關(guān)性就被忽略了;另外, 在對每塊的DCT系數(shù)進行量化時,是將DCT系數(shù)除以量化步長后取整,丟棄一些對圖像影響不大的高頻分量,以達到降低碼率的目的,但是如果量化比較粗糙,就會丟失邊緣的大量高頻信息,這兩方面的原因會造成:(1) 重建圖像質(zhì)量的較大損失會使圖像變得模糊,重建圖像總體效果會呈現(xiàn)一種被平滑的感覺。,(2) 重建圖像中塊的邊界處出現(xiàn)不連續(xù)的跳變,形成“塊效應(yīng)”, 特別是在低比特
26、率時,解碼恢復出的圖像的塊邊界上會出現(xiàn)明顯可見的方塊效應(yīng),從而降低了圖像的視覺質(zhì)量。以上這兩點均在圖6-5中得到反映。,圖6-5DCT域的圖像處理,6.3.5修正離散余弦變換(MDCT)我們知道,正交變換通常分塊進行,而每塊的變換系數(shù)一般獨立編碼,相繼塊的量化誤差未必相同,因此分塊正交變換在邊界處存在著固有的不連續(xù)性。在圖像編碼中,這種不連續(xù)性可能在塊邊界處產(chǎn)生較明顯的幅度差異,從而造成人眼非常敏感的“方塊效應(yīng)”。為降低這種影響,最方便的方法就是利用各種濾波器來平滑塊邊界處的不連續(xù)性。這種方法的缺點在于會或多或少地模糊圖像的細節(jié)。另一種思路是設(shè)法重疊相鄰分塊的部分數(shù)據(jù)樣點再做變換:首先利用本塊
27、M個采樣和兩個相鄰塊各K/2個采樣構(gòu)成M+K個樣本,加窗后做M+K點DCT,得到M+K個獨立的變換系數(shù);解碼恢復后再把這K個樣本疊加,,以減少塊間數(shù)據(jù)的不連續(xù)性。這種方法由于對K個重疊點變換了兩次,因而導致了DCT編碼效率的降低。為克服這一不足,Prencen和Bradly提出一種修正離散余弦變換(Modified DCT, MDCT),利用時域混疊消除(Time Domain Aliasing Cancellation, TDAC)來減輕“邊界效應(yīng)”。MDCT的正、反變換示意圖如圖6-6所示。,圖6-6MDCT的正、反變換重疊示意圖,首先對于輸入序列x(m),用一個長為2M的窗函數(shù)h(m)截
28、取2M點,并將截取的數(shù)據(jù)段h(m)x(m)進行MDCT。MDCT定義為式中,m0=(M+1)/2,為一固定的時間偏移。然后將“窗口”移動M點,繼續(xù)上述工作,使得各塊窗口數(shù)據(jù)有50%重疊(即本塊的M個采樣和前塊的M個采樣相重疊)。通過這種MDCT算法完成從時域數(shù)據(jù)到頻域數(shù)據(jù)的變換。顯然,對每一個輸入樣本需要進行兩次變換,變換數(shù)據(jù)量擴大一倍。但由式(6-28)可知,變換系數(shù)X(k)具有如下對稱性:,(6-28),因此,2M個變換系數(shù)只有M個是獨立的,50%重疊變換的編碼性能并未降低(輸入M個新樣點,變換后輸出M個獨立系數(shù))。,(6-29),X(k)的反變換,即反修正離散余弦變換(IMDCT)定義為
29、由于式(6-30)是用M個獨立系數(shù)恢復2M個獨立數(shù)據(jù),因此必有 ,即由式(6-30)無法精確恢復原始的2M個數(shù)據(jù)。但數(shù)學上可證明,如果窗函數(shù)h(m)滿足如下的對稱性條件:h(i)h(i)+h(i+M)h(i+M)=1 (6-31),(6-30),則可按下式將變換域的混疊在時域抵消,從而精確地恢復出原始數(shù)據(jù)。 其中, 為前一個分塊樣本的反變換。由于MDCT性能優(yōu)于DCT,也有快速算法,因此被廣泛應(yīng)用于寬帶音頻編碼,比如著名的MP3、AAC音頻編碼都使用了MDCT。,(6-32),6.4時-頻局部化對變換的要求1. 傅里葉變換的不足以傳統(tǒng)傅里葉變換為例,我們分析其不能給出信號時-頻局部化特性的原因
30、。對于一個能量有限的時域信號f(t),其傅里葉變換定義為,(6-33),由式(6-33)可以看出,為了得到信號f(t)的頻譜特性,需要用其在整個定義域的全部信息。另外,如果信號f(t)僅在某個時刻的一個小鄰域發(fā)生變化,那么整個頻譜特性F(w)都會受到影響。如沖激函數(shù)d(tt0)的定義為,(6-34),2. Gabor變換為了克服上述傅里葉變換的不足,1946年, D.Gabor提出一種加窗傅里葉變換,又稱Gabor變換。在Gabor變換中引入了一個局部化函數(shù)g(tb),稱之為窗函數(shù),用來截取一段時域信號進行傅里葉變換,然后利用參數(shù)b在時域上移動窗口。設(shè)窗函數(shù)g(tb)滿足絕對可積條件則Gabo
31、r變換定義為,(6-35),一般選擇窗函數(shù)g(tb)在|t|b時迅速趨于零的所謂“鐘形”函數(shù),如Gabor用的窗函數(shù)為高斯函數(shù)。這樣,滑動窗g(tb)在乘以信號f(t)后,便可以有效抑制t=b鄰域以外的信號,所以式(6-35)反映的是t=b時刻附近的局部信號的頻譜信息,從而達到時域局部化的目的。再分析Gabor變換在頻域局部化方面的作用。由于f(t)和F(w)、g(t)和G(w)為傅里葉變換對,根據(jù)傅里葉變換的性質(zhì),加窗后的信號f(t)g(tb)的傅里葉變換為,(6-36),3. 時-頻窗與窗函數(shù)條件設(shè)g(t)是窗函數(shù),稱為時窗中心,稱為時窗半徑。,(6-38),(6-37),在此定義下,時窗
32、函數(shù)g(t)的窗口為t*Dt, t*+Dt,窗口寬度為2Dt。依本定義,可得到窗函數(shù)g(tb)的時窗中心為t*+b,窗口寬度仍為2Dt。類似地,可定義頻窗中心和頻窗半徑。設(shè)g(t)是窗函數(shù),則其傅里葉變換G(w)為頻窗函數(shù),稱,(6-39),為頻窗中心,稱為頻窗半徑。在此定義下,頻窗函數(shù)G(w)的窗口為w*Dw, w*+ Dw,窗口寬度為2Dw。依本定義,可得到窗函數(shù)G(wh)的頻窗中心為w*+h,窗口半徑和寬度不變,分別為Dw和 2Dw。,(6-40),由以上兩個定義可知,g(t)和G(w)分別起時窗和頻窗的作用。在時間-頻率平面上,時窗和頻窗共同作用的結(jié)果就形成了時-頻窗(分辨率單元),它
33、是時-頻局部變化的幾何直觀描述,如圖6-7所示。時間-頻率平面又簡稱“相平面”,它在非平穩(wěn)信號、突變信號的分析和處理中起著非常重要的作用。,圖6-7時間-頻率平面上的時-頻窗,時窗和頻窗的條件如下:這也是說,若選用一個函數(shù)g(t)作為時窗,其傅里葉變換G(w)作為頻窗,則g(t)和G(w)應(yīng)同時具有較強的衰減特性,它們要同時滿足式(6-41)的要求。從局部化要求的角度出發(fā),為提高時間分辨率和頻率分辨率,則希望Dt和Dw越小越好。但實際上它們之間存在著相互制約的關(guān)系,必須服從信號的海森堡測不準原理,即,(6-40),(6-41),4. Gabor變換的局限從式(6-37)和式(6-38)可以看出
34、,對于給定的窗函數(shù)g(t),Gabor變換的時間窗的窗寬度是不變的;同理,其頻域窗的寬度也是不變的。對于任意時刻b和任意頻率w ,Gabor變換的時頻窗固定以(b,w)為中心,窗寬為2Dt,窗高為2Dw,如圖6-7所示。但在實際應(yīng)用中,由于信號的頻率與其持續(xù)時間成反比,因此對高頻信號檢測時,因其持續(xù)時間較短,需要較窄的時間窗,以保證一定的精度;對低頻信號檢測時,因其持續(xù)時間較長,需要較寬的時間窗,以便獲得足夠多的信息。這也就是說,需要一個靈活可變的分辨率單元,使其面對高頻成分時,時間窗口自動變窄,具有“顯細,節(jié)”的功能;而面對低頻成分時,時間窗口自動變寬,具有“顯概貌”的功能。這種理想的時-頻
35、窗如圖6-8所示。顯然,Gabor 變換不能滿足實際問題的這種要求,這就導致了下一節(jié)要討論的小波變換的提出。,圖6-8時間-頻率平面上的時-頻窗,6.5小波變換6.5.1連續(xù)小波變換1. 連續(xù)小波變換的定義連續(xù)小波變換(Continuous Wavelet Transform, CWT)的定義為其中,a為縮放因子(對應(yīng)于頻率信息),b為平移因子(對應(yīng)于時空信息),y(x)為小波函數(shù)(又叫基本小波或母小波),為y(x)的復共軛。連續(xù)小波變換的過程如圖6-9所示。,(6-43),圖6-9連續(xù)小波變換的過程,小波變換與傅里葉變換比較,它們的變換核不同:傅里葉變換的變換核為固定的虛指數(shù)函數(shù)(復三角函數(shù)
36、)ejwx,而小波變換的變換核為任意的母小波y(x)。 前者是固定的,后者是可選的。實際上可選母小波有無窮多種,只要y(x)滿足下列條件即可:(1) 絕對可積且平方可積,即yL1L2;(2) 正負部分相抵,即(3) 滿足允許條件(admissible condition),即 (廣義積分收斂),其中, 為y(x)的傅里葉變換。,連續(xù)小波變換的定義式(6-43)也可以用內(nèi)積形式表示為即函數(shù)f(x)的小波變換是其在小波基函數(shù)上的投影。,(6-44),2. 小波變換的時-頻窗可以證明,如果母小波y (x)對應(yīng)的時窗中心和半徑分別為 和Dty,則ya, b(x)對應(yīng)的時窗中心和半徑分別為類似地,ya,
37、 b(x)對應(yīng)的頻窗中心和半徑為( 和Dwy為母小波頻窗中心和半徑),(6-45),(6-46),3. 常見的小波函數(shù)(1) Haar小波(Alfred Haar,1910年),其母小波函數(shù)為Haar小波函數(shù)的時域波形和其傅里葉變換后的信號波形如圖6-10所示。,(6-47),圖6-10Haar小波函數(shù)及其傅里葉變換后的信號波形,(2) 墨西哥草帽(Mexican hat)小波,其母小波函數(shù)為后墨西哥草帽小波函數(shù)的時域波形和其傅里葉變換后的信號波形如圖6-11所示。,(6-48),圖6-11墨西哥草帽小波函數(shù)及其傅里葉變換后的信號波形,(3) Morlet小波(Jean Morlet,1984
38、年),其母小波函數(shù)為Morlet小波函數(shù)的時域波形和其傅里葉變換后的信號波形如圖6-12所示。,(6-49),圖6-12Morlet小波函數(shù)(C=5)及其傅里葉變換后的信號波形,6.5.2離散小波變換1. 二進小波變換與濾波器為了適應(yīng)數(shù)字信號處理的要求,需要將小波變換離散化??梢韵冗M行縮放因子a的離散。若小波函數(shù)y滿足:則稱y為基本二進小波。在連續(xù)小波變換中,若y為基本二進小波,則令a =2k,得到二進小波變換:,(6-51),(6-50),為了構(gòu)造基本二進小波,可設(shè)f滿足:可推出,則f 大體上相當于一個低通濾波器,因此f (2x)的通帶比f (x)的寬??稍O(shè)f 滿足如下的雙尺度方程:其傅里葉
39、變換為,(6-54),(6-53),(6-52),若設(shè)|G(w)|2=1|H(w)|2,其中,則G為高通濾波器,取其傅里葉變換為,(6-55),(6-56),2. 離散小波變換下面再將二進小波變換中的平移因子也離散化:令b = n2k,則可得離散小波變換為可將上式用前面所講的濾波器系數(shù)改寫成如下循環(huán)形式:,(6-57),(6-58),可以寫出如下正反離散小波變換的具體算法:(1) 正變換(分解)(保存和所有),(2) 逆變換(重構(gòu))(利用正變換所保存下來的和所有),3. 小波分解執(zhí)行離散小波變換的有效方法是使用濾波器。該方法是Mallat在1988年提出的,叫Mallat算法。該算法實際上是一
40、種信號的分解方法,在數(shù)字信號處理中稱為雙通道子帶編碼。用濾波器實現(xiàn)離散小波變換的框圖如圖6-13所示。,圖6-13雙通道濾波過程,圖6-13中,S表示原始的輸入信號,通過兩個互補的濾波器產(chǎn)生A和D兩個信號,A表示信號的近似值(Approximations),D表示信號的細節(jié)值(Detail);近似值對應(yīng)信號的低頻部分,細節(jié)值對應(yīng)信號的高頻部分。在許多應(yīng)用中,信號的低頻部分是最重要的,而高頻部分起一個“添加劑”的作用。猶如聲音那樣,把高頻分量去掉之后,聽起來聲音確實是變了,但還能夠聽清楚說的是什么內(nèi)容。相反,如果把低頻部分去掉,聲音聽起來就莫名其妙。在小波分析中,近似值是大的縮放因子產(chǎn)生的系數(shù),
41、表示信號的低頻分量,而細節(jié)值是小的縮放因子產(chǎn)生的系數(shù),表示信號的高頻分量。,由此可見,離散小波變換可以被表示成由低通濾波器和高通濾波器組成的一棵樹。原始信號通過這樣的一對濾波器進行的分解叫做一級分解。信號的分解過程可以迭代,也就是說可進行多級分解。如果對信號的高頻分量不再分解,而對低頻分量連續(xù)進行分解,就得到許多分辨率較低的低頻分量,形成如圖6-14所示的一棵比較大的樹。這種樹叫做小波分解樹,分解級數(shù)的多少取決于要被分析的數(shù)據(jù)和用戶的需要。另外,小波分解樹一般只對信號的低頻分量進行連續(xù)分解。,圖6-14小波分解樹,需要指出的是,在使用濾波器對真實的數(shù)字信號進行小波變換時,得到的數(shù)據(jù)將是原始數(shù)據(jù)
42、的兩倍。例如, 如果原始信號的數(shù)據(jù)樣本為1000個,通過濾波之后每一個通道的數(shù)據(jù)均為1000個,總共為2000個??筛鶕?jù)奈奎斯特(Nyquist)采樣定理提出的降采樣(Down Sampling)方法,在每個通道中每兩個樣本數(shù)據(jù)取一個,得到的離散小波變換的系數(shù)分別用cD和cA表示,如圖6-15所示(圖中的符號 表示降采樣)。只有這樣,經(jīng)過濾波器分解后的輸出系數(shù)才仍為1000個。,圖6-15降采樣過程,4. 小波重構(gòu)離散小波變換正變換過程叫做分解或者分析;把分解的系數(shù)還原成原始信號的過程叫做小波重構(gòu)(Wavelet Reconstruction)或者合成(Synthesis),數(shù)學上叫做逆離散小
43、波變換(Inverse Discrete Wavelet Transform, IDWT)。在使用濾波器做小波正變換時包含濾波和降采樣兩個過程,在小波重構(gòu)時要包含升采樣(Up Sampling)和逆濾波過程,如圖6-16所示,圖中的符號 表示升采樣。,圖6-16小波重構(gòu)方法,升采樣是在兩個樣本數(shù)據(jù)之間插入“0”,目的是把信號的分量恢復成原始長度。升采樣的過程如圖6-17所示。,圖6-17升采樣的方法,6.5.3第二代小波變換1. 提升原理小波提升是一種構(gòu)造緊支集雙正交小波的新方法。由提升構(gòu)成第二代小波變換的過程分為如下三個步驟:1) 分裂分裂(Split)是將原始信號sj = sj,k 分為兩
44、個互不相交的子集和。每個子集的長度是原子集的一半。通常是將一個數(shù)列分為偶數(shù)序列ej1和奇數(shù)序列oj1,即Split(sj)=(ej1,oj1 ) (6-59)其中,ej1=ej1,k=sj,2 k,oj1=oj1,k=sj,2 k +1。,2) 預測預測(Predict)是利用偶數(shù)序列和奇數(shù)序列之間的相關(guān)性,由其中一個序列(一般是偶序列ej1)來預測另一個序列(一般是奇序列oj1)。實際值oj1與預測值P(ej1)的差值dj1反映了兩者之間的逼近程度,稱之為細節(jié)系數(shù)或小波系數(shù),對應(yīng)于原信號sj的高頻部分。一般來說,數(shù)據(jù)的相關(guān)性越強,則小波系數(shù)的幅值就越小。若預測是合理的,則差值數(shù)據(jù)集dj1所包
45、含的信息比原始子集oj1包含的信息要少得多。預測過程如下:dj1 =oj1P(ej1) (6-60),其中,預測算子P可用預測函數(shù)Pk來表示,函數(shù)Pk可取為ej1中的對應(yīng)數(shù)據(jù)本身:Pk (ej1,k )=ej1,k=sj,2k(6-61)或ej1中的對應(yīng)數(shù)據(jù)的相鄰數(shù)據(jù)的平均值:或其他更復雜的函數(shù)。,(6-62),3) 更新經(jīng)過分裂步驟產(chǎn)生子集的某些整體特征 (如均值)可能與原始數(shù)據(jù)并不一致,為了保持原始數(shù)據(jù)的這些整體特征,需要一個更新(Update)過程。更新過程用算子U來代替,具體如下:sj1=ej1+U(dj1) (6-63)其中,sj1為sj的低頻部分;與預測函數(shù)一樣,更新算子也可以取不
46、同函數(shù),如,(6-64),或若P與U取不同的函數(shù),可構(gòu)造出不同的小波變換。,(6-65),2. 分解與重構(gòu)經(jīng)過小波提升,可將信號sj分解為低頻部分sj1和高頻部分dj1;對于低頻數(shù)據(jù)子集sj1可以再進行相同的分裂、預測和更新,把sj1進一步分解成dj2和sj2; 如此下去,經(jīng)過n次分解后,原始數(shù)據(jù)sj的小波表示為 sjn,djn,djn+1,dj1。其中,sjn代表了信號的低頻部分,而djn,djn+1,dj1則是信號的從低到高的高頻部分系列。每次分解對應(yīng)于上面的三個提升步驟,即分裂、預測和更新。Split(sj)=(ej1,oj1),dj1=oj1P(ej1),sj1=ej1+U(dj1)(
47、6-66),小波提升是一個完全可逆的過程,其反變換的步驟如下:ej1=sj1U(dj1),oj1=dj1+P(ej1),sj=Merge(ej1,oj1 ) (6-67)分解的三個步驟可以用替代的方式來計算:先將奇數(shù)序列更新 (用偶數(shù)序列預測奇數(shù)序列),然后用更新的奇數(shù)序列更新偶數(shù)序列。大致過程如下:Split(sj)=(ej1,oj1),oj1=P(ej1),ej1+=U(oj1) (6-68)其反變換過程也可以用替代的方式來計算:ej1=U(oj1),oj1+=P(ej1),sj =Merge(ej1,oj1) (6-69)用提升方法進行小波分解和重構(gòu)的示意圖如圖6-18所示。,圖6-18
48、提升方法分解和重構(gòu),3. 特點第二代小波變換是由第一代小波變換的提升實現(xiàn)的。與第一代小波相比,第二代小波變換具有以下優(yōu)點:(1) 本位操作:所有運算可做本位操作,節(jié)省內(nèi)存;(2) 效率高:利用復合賦值,減少了浮點運算量;(3) 并行性:一個上升步驟中的所有操作是并行的,而多個上升步驟之間是串行的;(4) 逆變換:逆變換只需簡單地改變代碼執(zhí)行的先后順序,具有與正向變換相同的計算復雜性;(5) 通用性:由于變換過程中不必依賴傅里葉分析,因此很容易推廣到一般性應(yīng)用領(lǐng)域;,(6) 非線性:易于構(gòu)造非線性小波變換(如整數(shù)變換);(7) 自適應(yīng):支持自適應(yīng)性小波變換。函數(shù)的分析由粗到細逐步進行,細化過程可
49、僅限于感興趣的區(qū)域。6.5.4圖像的小波變換正因為第二代小波變換具有計算速度快、占用內(nèi)存少、可以實現(xiàn)整數(shù)變換等特點,它成為JPEG 2000推薦的小波變換,是JPEG 2000中的核心算法。與傳統(tǒng)的Mallat構(gòu)造方法相比,第二代小波變換的提升格式完全是基于時(空)域的構(gòu)造方法,它不依賴于平移和伸縮,也不需要頻譜分析工具,因此適用于有限區(qū)域、曲面以及非均勻采樣等領(lǐng)域中小波的構(gòu)造。第二代小波變換的基本思想是建立在雙正交小波和完,全可恢復濾波器組的理論基礎(chǔ)上的,在保持小波雙正交特性的條件下,通過所謂的提升和對偶提升過程,來改善小波及其對偶的性能,以滿足各種應(yīng)用的需要。對于二維數(shù)字圖像信號,提升小波
50、變換可以通過在水平和垂直方向上分別應(yīng)用h、g濾波器(行變換和列變換)進行一維濾波來實現(xiàn),分解過程如圖6-19所示。,圖6-19圖像的提升小波分解,對二維圖像數(shù)據(jù)進行行方向與列方向上的一維濾波,得到相應(yīng) LL、HL、LH和 HH 子帶。行變換過程和列變換過程是對稱的,其順序可以交換。其中,LL 子帶代表原圖像水平方向和垂直方向上均為低頻的子帶,HL 代表了原圖像垂直方向上為低頻而水平方向上為高頻子帶;LH 代表了原圖像水平方向上的低頻子帶,而垂直方向上的高頻子帶;HH 代表了水平方向和垂直方向均為高頻的子帶。LL 代表了原圖像的低頻分量,是原圖像的概貌成分,對人眼是最重要的,壓縮時這部分信息不可
51、損失過多;而其他三個高頻子帶代表了原圖像的細節(jié)分量,這部分信息對人眼的顯著性較小,圖像壓縮主要是針對這部分高頻分量進行壓縮。若進行圖像的多級小波分解,則在每次分解后的 LL 子帶上重復上述過程,對其余三個高頻子帶不再進行分解。,在 JEPG 2000 的具體實現(xiàn)中用小波提升的方法來避免直接對系數(shù)進行卷積計算,其中采用了兩種小波變換,分別是用于有損壓縮的9/7浮點型小波變換和既可以無損也可以用于有損壓縮的5/3整數(shù)小波變換。x(n)表示輸入的圖像數(shù)據(jù),y(n)表示經(jīng)提升后的小波系數(shù),有如下的計算公式。(1) 5/3小波實現(xiàn)算法:,(6-70),(2) 9/7小波實現(xiàn)算法:最后,給出一個圖像小波變
52、換的實例,展示如何用小波變換進行圖像壓縮編碼。,(6-71),【例6-3】設(shè)一個空間域圖像的數(shù)據(jù)如下式所示,試對它進行非規(guī)范哈爾小波變換。,【解】一個圖像塊是一個二維的數(shù)據(jù)陣列,可以先對陣列的每一行進行一維小波變換,然后再對行變換之后的陣列的每一列進行一維小波變換,最后對經(jīng)過變換之后的圖像數(shù)據(jù)陣列進行編碼。(1) 求均值與差值。利用一維的非規(guī)范化哈爾小波變換對圖像矩陣的每一行進行變換,即求均值與差值。在圖像塊矩陣A中,第一行的像素值為 R0:642361606757步驟1:在R0行上取每一對像素的平均值,并將結(jié)果放到新一行N0的前4個位置,其余的4個數(shù)是R0行每一對像素的差值的一半(細節(jié)系數(shù))
53、:N0:3332333231292725,步驟2:對行N0的前4個數(shù)使用與第一步相同的方法,得到兩個平均值和兩個細節(jié)系數(shù),并放在新一行N1的前4個位置,其余的4個細節(jié)系數(shù)直接從行N0復制到N1的相應(yīng)位置上:N1:32.532.50.50.531292725步驟3:用與步驟1和2相同的方法,對剩余的一對平均值求平均值和差值:N2:32.500.50.531292725其中,第一個元素是該行像素值的平均值,其余的是這行的細節(jié)系數(shù)。需要指出的是,上述過程是可逆的。,(2) 計算圖像矩陣。使用上步對R0行處理的方法,對矩陣的每一行進行計算,得到行變換后的矩陣為,其中,每一行的第一個元素是該行像素值的平
54、均值,其余的是這行的細節(jié)系數(shù)。使用與行處理相同的方法,再對每一列進行計算,得到:,上式中,左上角的元素表示整個圖像塊的像素值的平均值,其余是該圖像塊的細節(jié)系數(shù)??梢钥吹剑?變換過程到此沒有丟失信息,由于整個變換過程是可逆的,因此能夠從最后得到的數(shù)據(jù)中無失真地重構(gòu)出原始數(shù)據(jù)。 對這個給定的變換,我們可以從所記錄的數(shù)據(jù)中重構(gòu)出各種分辨率的圖像。例如,在分辨率為1(此例88)的圖像基礎(chǔ)上重構(gòu)出分辨率為2(此例44)的圖像,在分辨率為2的圖像基礎(chǔ)上重構(gòu)出分辨率為4(此例22)的圖像。, 通過變換之后產(chǎn)生的細節(jié)系數(shù)的幅度值比較小,這就為圖像壓縮提供了一種途徑,例如去掉一些微不足道的細節(jié)系數(shù)而不影響對重構(gòu)
55、圖像的理解,這時是不可逆過程。一種做法是設(shè)置一個閾值,例如設(shè)置閾值為5,對細節(jié)系數(shù)小于等于5時就把它當做“0”看待,這樣有矩陣:,與ARC相比,Ad 中“0”的數(shù)目增加了18個,也就是去掉了18個細節(jié)系數(shù)。這樣做的好處是可提高圖像小波變換編碼的效率。對矩陣進行逆變換,得到了重構(gòu)的近似矩陣。,將此式的結(jié)果和原始數(shù)據(jù)相比,可看到數(shù)據(jù)有失真。利用小波變換,用戶可以按照應(yīng)用要求獲得不同分辨率的圖像。如圖6-20所示,其中,(a)表示原始的Lena圖像,(b)表示通過一級(level)小波變換可得到1/4分辨率的圖像,(c)表示通過二級小波變換可得到1/8分辨率的圖像,(d)表示通過三級小波變換可得到1
56、/16分辨率的圖像。閾值處理可用于去除圖像中的噪聲和控制編碼后圖像的數(shù)據(jù)量。在取不同閾值的情況下重構(gòu)圖像,可觀察到圖像質(zhì)量發(fā)生的變化,如圖6-21所示。其中,(a)表示原始的Lena圖像,(b)表示閾值5的重構(gòu)圖像,(c)表示閾值10的重構(gòu)圖像,(d)表示閾值20的重構(gòu)圖像。從圖中可以看到,隨著閾值的增大,圖像質(zhì)量也隨之降低。,圖6-20使用小波分解產(chǎn)生多種分辨率圖像,圖6-21不同閾值下的Lena圖像,6.6DCT與小波變換的性能比較DCT和小波變換作為在媒體信號編碼中最常用的兩種變換,它們之間的比較如下14-15:1. 變換核DCT 的變換核是固定的,它滿足絕對可積條件,因此它是可逆變換。
57、任何一個經(jīng)過DCT 后的信號都存在逆變換,且物理意義明確。小波變換的變換核是非固定的,存在著各種各樣的變換核,而且只有在所采用小波滿足“可容許條件”下,逆變換才存在。,2. 能量集中是這兩種變換共同的特點變換域編碼的作用就是將時域(或空域)中的信號變換到另外一個正交矢量空間(即變換域),并使變換域中各信號分量之間相關(guān)性很小或互不相關(guān),從而與變換前相比,其能量更加集中。DCT是先將圖像分成NN像素塊(N一般等于8),然后對NN像素塊逐一進行DCT 。由于大多數(shù)圖像的高頻分量較小,相應(yīng)于圖像高頻成分系數(shù)經(jīng)常為零,因此DCT 使實際信號的能量主要集中在低頻段,在允許一定誤差的條件下,對其進行編碼時,
58、可以忽略能量小于某值的頻率分量,使數(shù)碼率降低,但數(shù)碼率很低時要產(chǎn)生令人眼無法忍受的方塊效應(yīng)。,小波變換并不需要將圖像強制分成88的小塊。但為了降低對內(nèi)存的需求和方便壓縮域中可能的分塊處理,可以將圖像分割成若干互不重疊的矩形塊(tile)。分塊的大小任意,既可以整個圖像是一個塊,也可以一個像素是一個塊。一般分成26102610(即 641024 像素寬)的等大方塊,不過邊緣部分的塊可能小一些,而且不一定是方的。圖像分塊的大小會影響重構(gòu)圖像的質(zhì)量。一般來說,分塊大比分塊小的質(zhì)量要好一些。小波變換具有很好的時-頻局部化特性,信號經(jīng)小波變換后的能量也集中在少數(shù)變換系數(shù)上,合理利用其變換系數(shù)分布特點,可
59、克服DCT 編碼產(chǎn)生的方塊效應(yīng),獲得較好的壓縮效果。,3. 圖像壓縮后性能比較在對圖像編碼中的DCT和小波變換進行比較時,如果允許改變變換方式,則應(yīng)固定量化器和熵編碼器,這是在比較小波和DCT編碼性能時能提供客觀比較的唯一方法。Xiong等人在相同的編碼器框架下,只改變相應(yīng)的變換方法對小波編碼與DCT編碼的性能進行了比較。,1) 基于基本等級的JPEG編碼器在JPEG基本等級編碼器中,使用的是DCT。為進行性能比較,只需要DCT部分改為3層的DWT,并按照圖6-22(a)所示的父子關(guān)系構(gòu)成小波變換系數(shù)塊,然后根據(jù)小波系數(shù)頻率變化規(guī)律以圖6-22(b)掃描次序代替原來的ZigZag掃描,其余部分保持不變。通過對Lena圖像和Barbara圖像的實驗,發(fā)現(xiàn)小波變換代替DCT后峰值信噪比PSNR改進了1 dB左右,如表6-6所示。表中碼率的單位b/p指的是每像素比特數(shù)(bit per pixel)。,圖6-22在JPEG基本編碼器中用3層DWT代替DCT后的系數(shù)組塊 和掃描方式,表6-6DCT和DWT的基本JPEG編碼
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 天津2025年天津外國語大學碩士教師崗位招聘2人筆試歷年參考題庫附帶答案詳解
- 大連2025年遼寧大連交通大學招聘高層次人才90人筆試歷年參考題庫附帶答案詳解
- 吉林2025年吉林省一汽總醫(yī)院招聘筆試歷年參考題庫附帶答案詳解
- 臺州浙江臺州路橋區(qū)招聘專職網(wǎng)格員5人筆試歷年參考題庫附帶答案詳解
- 南通2025年江蘇南通海安市教體系統(tǒng)招聘教師84人筆試歷年參考題庫附帶答案詳解
- 南充2025年四川南充市人大常委會辦公室下屬事業(yè)單位考調(diào)2人筆試歷年參考題庫附帶答案詳解
- 南京2025年江蘇南京市秦淮區(qū)教育局所屬學校招聘教師121人筆試歷年參考題庫附帶答案詳解
- 涼山2025下半年四川涼山美姑縣招聘初高中教師39人筆試歷年參考題庫附帶答案詳解
- 2026年國際貿(mào)易檢驗員模擬試題及答案
- 安全員A證考試通關(guān)考試題庫附答案詳解(研優(yōu)卷)
- GB/T 18724-2024印刷技術(shù)印刷品與印刷油墨耐各種試劑性的測定
- HG+20231-2014化學工業(yè)建設(shè)項目試車規(guī)范
- 嬰幼兒托育服務(wù)與管理專業(yè)-《嬰幼兒感覺統(tǒng)合訓練》課程標準
- 老年口腔健康講座課件
- 卒中后認知障礙管理專家共識
- 南京科技職業(yè)學院單招職測參考試題庫(含答案)
- 客戶驗廠報告
- 開磷集團(電池級磷酸一銨)項目環(huán)評報告
- 電站組件清洗措施及方案
- 案例(母線PT反充電)
- 上海市歷年中考語文文言文閱讀試題45篇(含答案與翻譯)(截至2021年)
評論
0/150
提交評論