數(shù)字圖像處理_第1頁
數(shù)字圖像處理_第2頁
數(shù)字圖像處理_第3頁
數(shù)字圖像處理_第4頁
數(shù)字圖像處理_第5頁
已閱讀5頁,還剩129頁未讀 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第五章圖像編碼技術(shù)5.1數(shù)據(jù)冗余和壓縮5.2圖像保真度5.3無失真編碼定理5.4哈夫曼編碼5.5* 算術(shù)編碼5.6* 位平面編碼5.7無損預(yù)測編碼5.8有損預(yù)測編碼5.9變換編碼圖像包含大量信息表達(dá)信息的工具(載體)是數(shù)據(jù)圖像壓縮:用少的數(shù)據(jù)表達(dá)信息5.1數(shù)據(jù)冗余和壓縮編碼的目的:減少數(shù)據(jù)量(存儲量)、傳輸時間例1:一般彩色電視信號,YIQ色空間中各分量的帶寬分別為4.2MHz、1.5MHz、0.5MHz,采樣原理,采樣頻率=2倍原始信號頻率,量化為8bit,1秒鐘的數(shù)據(jù)量為(4.2+1.5+0.5)*2*8=99.2MBits,約為100Mbits/S1GB的CD-ROM存1分鐘的原始電視節(jié)

2、目HDTV數(shù)據(jù)量約為1.2GBits/S,1GB存6秒鐘HDTV彩色靜止圖像:3*1024*1024*8=3MB圖像壓縮的基本原理壓縮的根據(jù):圖像數(shù)據(jù)量信息量I=D-duI(信息量),D(數(shù)據(jù)量), du(冗余量)保留意義完全的信息,支持查詢與檢索冗余(redundancy)信息不相干(irrelevancy)的信息基本概念信源需要傳輸或存儲的原始信息稱為信源。包括語音、圖像、視頻等信息源信源編碼的主要任務(wù)是利用一定的編碼方法降低數(shù)碼率,即比特率信道信息傳輸?shù)耐沸畔⒃趥鬏斨幸黾涌煽啃浴⒖垢蓴_能力,就要進(jìn)行信道編碼,此時要進(jìn)行奇偶校驗(yàn)等檢測,需要增加比特?cái)?shù)??垢蓴_能力越強(qiáng),增加的比特?cái)?shù)就越多

3、壓縮率用n1表示一幅圖像原來的數(shù)據(jù)量,n2表示壓縮后的數(shù)據(jù)量壓縮率 Cr 定義為Cr= n1/ n2冗余量 Rd 可表示為:Rd=1-1/Cr圖像采集信源編碼信道編碼信道解碼信源解碼圖像顯示或存儲圖像通信圖像通信的一般過程圖像編碼壓縮要研究的主要內(nèi)容信源壓縮方法與信源模型有關(guān)語音,線性模型比特率采樣速率(每秒樣本數(shù))乘以樣本精度(比特/樣本) 逼真度準(zhǔn)則或失真度準(zhǔn)則平方誤差準(zhǔn)則 基于主觀感受的逼真度準(zhǔn)則數(shù)據(jù)冗余(1)像素相關(guān)冗余空間冗余幾何冗余(2)編碼冗余與概率特性有關(guān)(3)心理視覺冗余與主觀感覺有關(guān)像素間冗余像素的灰度級和顏色之間具有相關(guān)性,隨機(jī)場模型(1)空間冗余:規(guī)則物體和規(guī)則背景的表

4、面物理特性具有相關(guān)性(2)時間冗余:序列圖像空間冗余時間冗余(3)結(jié)構(gòu)冗余:紋理結(jié)構(gòu)(4)知識冗余:人臉的固定結(jié)構(gòu)空間冗余、時間冗余又稱統(tǒng)計(jì)冗余,將圖像信號作為概率信號時的統(tǒng)計(jì)特性編碼冗余(信息熵冗余)碼本是表示一組信息或一組事件的一系列符號(如字母、數(shù)字等)。其中對每個信息或事件所賦予的符號成為碼字,每個碼字含有的基本符號的個數(shù)稱為碼長設(shè)l(rk)為碼字rk的碼長,在二進(jìn)制表示時稱為比特?cái)?shù)(bits),Pr(rk)為碼字的出現(xiàn)概率。若編碼系統(tǒng)共有L種不同的碼字,則系統(tǒng)可獲得的平均比特?cái)?shù)為自然碼,如表示256個不同的灰度級,就用8bits的等長的二進(jìn)制數(shù)據(jù)來編碼每一個灰度級,這樣系統(tǒng)的平均比特

5、數(shù)就是8bits。定理:當(dāng)l(rk)根據(jù)pr(rk)降序設(shè)計(jì)成變長編碼的形式時,平均比特?cái)?shù)最小。rkpr(rk)編碼1L1(rk)編碼2L2 (rk)編碼3L3 (rk)r0=00.0200030021111016r1=1/70.250013012002r2=2/70.06010310211104r3=3/70.1601131100411004r4=4/70.0810031101411014r5=5/70.21101311104012r6=6/70.03110311110061111006r7=10.1911131111016102平均碼長33.782.8等長編碼與非等長編碼比較視覺系統(tǒng)非線性

6、、非均勻分辨率約26,圖像量化28動態(tài)圖像的視覺延遲現(xiàn)象心理視覺冗余5.2圖像保真度圖像保真度信息保存型信息損失型描述解碼圖像相對于原始圖像的偏離程度對信息損失的測度客觀保真度準(zhǔn)則用編碼輸入圖與解碼輸出圖的某個確定函數(shù)表示損失的信息量便于計(jì)算或測量主觀保真度準(zhǔn)則用主觀的方法來測量圖像的質(zhì)量應(yīng)用不方便編碼準(zhǔn)則保真度準(zhǔn)則:主觀保真度準(zhǔn)則、客觀保真度準(zhǔn)則客觀保真度準(zhǔn)則:圖像均方誤差、均方根信噪比輸入圖像f(x,y),輸出g(x,y),x,y=0,1,2,N-1(1)均方誤差(2)均方根信噪比(3)壓縮比=原圖像編碼每個象素平均所需bit數(shù) / 壓縮后象素平均所需bit數(shù)評分評價說明1優(yōu)秀圖像質(zhì)量非常

7、好2良好圖像質(zhì)量高,觀看舒服,有干擾但不影響觀看3可用圖像質(zhì)量可接受,有干擾但不太影響觀看4剛可看圖像質(zhì)量差,干擾有些影響觀看,希望改進(jìn)5差圖像質(zhì)量很差,干擾嚴(yán)重妨礙觀看6不能用圖像質(zhì)量極差,不能使用主觀保真度準(zhǔn)則編碼方法的分類由壓縮數(shù)據(jù)恢復(fù)的圖像與原始圖像的差別 可逆壓縮:編碼的數(shù)據(jù)可完恢復(fù)出原始圖像熵編碼(Entropy Coding), 無失真編碼、無誤差編碼(Error Free Coding) 、無噪聲編碼(Noiseless)、冗余度壓縮 (Redundancy Reduction)、數(shù)據(jù)緊縮( DATA Compaction Lossless Bit-Preserving)不可逆

8、壓縮: 有失真編碼(Lossy Coding),采用這類編碼方法,由編碼數(shù)據(jù)恢復(fù)的圖像與原始圖像有區(qū)別,圖像編碼產(chǎn)生的誤差與編碼的方法以及壓縮比等因素有關(guān)第一代編碼技術(shù)三大經(jīng)典編碼方法熵值編碼預(yù)測編碼變換編碼熵編碼(概率匹配編碼)主要針對無記憶信源,根據(jù)信息碼字出現(xiàn)概率的分布特征,尋找概率與碼字長度間的最優(yōu)匹配,從而進(jìn)行壓縮編碼,又稱為統(tǒng)計(jì)編碼游程編碼、Huffman編碼和算術(shù)編碼等多種熵編碼是信息編碼的基礎(chǔ),也是各種實(shí)用算法的一個基本組成部分預(yù)測編碼根據(jù)數(shù)據(jù)的統(tǒng)計(jì)特性得到預(yù)測值,然后傳輸圖像像素與其預(yù)測值的差值信號,使傳輸?shù)拇a率降低,達(dá)到壓縮的目的預(yù)測編碼方法簡單經(jīng)濟(jì),編碼效率較高,是語音的

9、基本編碼方法預(yù)測編碼分為線性預(yù)測編碼、非線性預(yù)測編碼。根據(jù)處理的信息維數(shù)不同,又可分為行內(nèi)編碼(一維)、幀內(nèi)編碼(二維)以及幀間編碼(三維)預(yù)測編碼是視頻圖像壓縮的基礎(chǔ)變換編碼進(jìn)行某種正交變換來消除像素間的相關(guān)性??煞譃樽罴炎儞Q編碼,如K-L變換,以及次優(yōu)變換編碼,如離散余弦變換(DCT)等在實(shí)施時,輔助以區(qū)域變換編碼、門限變換編碼基于離散余弦變換的靜止圖像壓縮標(biāo)準(zhǔn)JPEG和運(yùn)動圖像壓縮標(biāo)準(zhǔn)MPEG等一系列標(biāo)準(zhǔn)自適應(yīng)編碼從本質(zhì)上來說就是一種混合編碼方案,它在不同階段根據(jù)圖像的不同特征將變換編碼、預(yù)測編碼、無誤差編碼等各種方案的優(yōu)勢綜合利用起來關(guān)鍵是識別圖像的特征多種方案的復(fù)用可實(shí)現(xiàn)多級壓縮,可

10、以得到較大的壓縮比現(xiàn)有的圖像壓縮標(biāo)準(zhǔn)JPEG、MPEG等在設(shè)計(jì)中就利用了這種思路第二代編碼技術(shù)充分利用人的視覺生理、心理特征和圖像信源的各種特征,實(shí)現(xiàn)從波形編碼到模型編碼的轉(zhuǎn)變,以便獲得更高壓縮比向量量化編碼、基于分形的編碼、基于模型的編碼、基于區(qū)域分割的編碼、基于神經(jīng)網(wǎng)絡(luò)的編碼以及識別編碼和基于知識的編碼等過渡編碼技術(shù)充分利用人類視覺特性的多分辨率編碼方法,如子帶編碼、金字塔形編碼和基于小波變換的編碼這類方法原理上仍屬于線性處理,屬于波形編碼,可歸入經(jīng)典編碼方法,但它們又緊密結(jié)合人類視覺系統(tǒng)的特性,因此可以被看作是“第一代”編碼技術(shù)向“第二代”編碼技術(shù)過渡的橋梁子帶編碼技術(shù)子帶編碼是一種高質(zhì)

11、量、高壓縮比的圖像編碼方法,它早已在語音信號壓縮編碼中獲得了廣泛的應(yīng)用其基本依據(jù)是:圖像信號可以劃分為不同的頻域段,人眼對不同頻域段的敏感程度不同。例如圖像信號的主要能量集中在低頻區(qū)域,它反映圖像的平均亮度;而細(xì)節(jié)、邊緣信息則集中在高頻區(qū)域子帶編碼的基本思想是利用一濾波器組,通過重復(fù)卷積的方法,將輸入信號分解為高頻分量和低頻分量,然后分別對高頻和低頻分量進(jìn)行量化和編碼。解碼時,高頻分量和低頻分量經(jīng)過插值和共軛濾波器而合成原信號進(jìn)行子帶編碼的一個關(guān)鍵問題,是如何設(shè)計(jì)共軛濾波器組,除去混疊頻譜分量小波變換編碼技術(shù)小波變換編碼技術(shù)是目前的研究熱點(diǎn)。小波變換它不僅為多分辨分析、時-頻分析和子帶編碼建立

12、了統(tǒng)一的分析方法,而且提供了更合理的表示框架目前小波變換在圖像編碼中的應(yīng)用研究主要課題有:正交小波基的選擇(小波包法)、小波變換與各種量化方式的結(jié)合、小波變換在分形法中實(shí)現(xiàn)初級分形、小波變換用于運(yùn)動估值等方面小波變換法處于圖像編碼當(dāng)前首選方法的位置,一方面,它有快速算法,實(shí)現(xiàn)起來簡單方便、速度快,可暫時彌補(bǔ)“第二代”編碼技術(shù)的不足;另一方面,它有著先進(jìn)的分析方法,可有效提高現(xiàn)有技術(shù)的水平,實(shí)現(xiàn)突破性進(jìn)展第三代編碼技術(shù)在第三代編碼方案中主要提出了基于運(yùn)動模型(VR)的編碼概念,主要針對提高電視會議、可視電話等的圖像效果 變換編碼編碼算法PCM預(yù)測編碼付立葉變換斜變換小波變換統(tǒng)計(jì)編碼Huffman

13、編碼算術(shù)編碼游程編碼其他編碼靜態(tài)圖像編碼二值圖像編碼子帶編碼輪廓編碼常用圖像編碼算法分類固定自適應(yīng)固定自適應(yīng)離散余弦變換KL變換沃爾什哈達(dá)馬Harr變換LZW比特平面逐漸浮現(xiàn)逐層內(nèi)插方塊抖動視頻圖像內(nèi)插運(yùn)動補(bǔ)償條件補(bǔ)充運(yùn)動估計(jì)幀間預(yù)測幀內(nèi)預(yù)測幀間編碼矢量量化信源PCM信息源編碼器信道編碼器通訊線路或存儲媒體圖像通訊和編碼壓縮原理框圖壓縮編碼器信宿PCM解碼器信道解碼器壓縮解碼器編碼部分解碼部分簡單的圖像編碼模型原始圖像映射變換(信息抽?。┯成浜髷?shù)據(jù)量化器符號編碼器(碼元分配)碼字 圖像數(shù)據(jù)壓縮的一般過程(信息源)符號解碼器(原始符號表示)反映射器(信息恢復(fù))輸出圖像 圖像數(shù)據(jù)解壓縮的一般過程(

14、信息源)映射器:將輸入數(shù)據(jù)從象素域變換到另一個域中量化器:將每個映射數(shù)據(jù)舍入為數(shù)目較少的可能數(shù)值、均勻、非均勻(1)信源編碼器和信源解碼器(2)信道編碼器和信道解碼器漢明(Hamming)編碼:正確的碼字之間的最小距離要大于一個給定值碼字以二進(jìn)制形式表示,比特(bit)D(101),(110)=2說明:將3個比特位的冗余加到4比特的碼字上,任意兩個正確碼字間的距離為3,可發(fā)現(xiàn)和校正錯誤例:4bit(b3b2b1b0)7bit(h1h2h3h4h5h6h7)h1、h2、h4分別是比特區(qū)h3b2b0、b3b1b0、b2b1b0的偶校驗(yàn)位信道解碼器對已建立偶校驗(yàn)的比特區(qū)進(jìn)行檢查,由c1、c2、c4指

15、出錯誤,從校正后的h3h5h6h7得到正確值編碼器和典型的編碼方法X:信號源;A:構(gòu)成碼字的符號集,a稱為碼元;W:代碼信號源:像素灰度、行程長度、方向碼、預(yù)測誤差、變換系數(shù)、上一過程的結(jié)果,等等編碼器:給每一量化器的輸出分配一個碼字等長碼、非等長碼、唯一可譯碼、瞬時碼編碼器X=x1,xnW=w1,wnA=a1,an編碼器的描述碼字的形式二進(jìn)制碼:碼元數(shù)等于2時的代碼稱為二進(jìn)制碼等長碼:如果碼字集合W中的所有碼字都具有相同的長度,就是等長碼。如自然二進(jìn)制碼。碼長不等的就稱為非等長碼,如Huffman碼唯一可譯碼(單義碼):如果任何長度的一段代碼只能分割成唯一的一個碼字集合,則為唯一可譯碼。如

16、W=0,10,11,對代碼序列S=100111000,只能分割成10、0、11、10、0、0在編碼中形成的代碼集合必須是單義碼,否則沒有實(shí)際使用價值非續(xù)長代碼:碼字集合中的任何一個碼字都不是另一個碼字的續(xù)長。如W=0,10,100,111就不是非續(xù)長代碼,其中“100”是“10”的續(xù)長。非續(xù)長代碼一定是單義碼,但單義碼不一定是非續(xù)長代碼。如 W=0,01是單義碼,但又是續(xù)長代碼。非續(xù)長代碼可以用樹型結(jié)構(gòu)構(gòu)造構(gòu)造非續(xù)長碼設(shè)A=0,1,W=w1,w2,w3,w4設(shè)置根節(jié)點(diǎn),從根節(jié)點(diǎn)開始分枝,每條分枝代表一個碼元0或者1,取其中任意一個分枝的節(jié)點(diǎn)代表w1對沒有被選作代碼的節(jié)點(diǎn)再分枝,選擇其中任意一個

17、分枝的節(jié)點(diǎn)作為代碼w2依次類推,至所有節(jié)點(diǎn)都代表一個碼字結(jié)束按照分枝順序構(gòu)成各碼字:w1=0,w2=10,w3=110,w4=111各碼字的長度為n1=1,n2=2,n3=n4=3樹形圖說明,被選作代碼的節(jié)點(diǎn)不會再有分支,因此形成的必然是非等長的非續(xù)長代碼w40w1w2w4w3001110(a)w1w2w311001(b)非續(xù)長代碼的樹型圖無噪聲編碼定理Shannon的信息論如何構(gòu)造碼字,才能得到最短的平均碼長?對特定的信息源,平均碼長有下限嗎?隨機(jī)事件提供的信息量,與事件的出現(xiàn)概率有關(guān)設(shè)有隨機(jī)事件E,它的出現(xiàn)概率是P(E),那么它包含的信息量為稱I(E)為E的自信息如果P(E) =1(即事件

18、總是發(fā)生),那么I(E)=0結(jié)論:確定的事件沒有提供任何新的信息,而偶然發(fā)生的事件,提供的信息量比較大信息源X=xj , j=1,2,3,n提供的信息量定義為H(X)稱為信息的“熵”,它定義了信息的平均信息量(每單位字符)。熵值總是非負(fù)的,當(dāng)構(gòu)成信息源的所有事件的概率都相等時,熵值最大。如果對數(shù)的底是2,那么信息熵的度量單位就是比特(bits per symbol)某種編碼方法的編碼效率定義為其中H(x)為信號的信息為熵, 為編碼的平均長度這種編碼方法的冗余度為=1-如果某種編碼方法產(chǎn)生的平均字長等于信息源的熵,那么它就沒有任何冗余信息,達(dá)到了編碼的最優(yōu)狀態(tài)。這時要求L(xj)=-logP(x

19、j)Shannon(香農(nóng))第一定理無噪聲編碼定理(Shannon第一定理)信息的碼字長度與它的出現(xiàn)概率成反比,大概率事件的碼長較短,小概率事件的碼長較大,嚴(yán)格按照這個規(guī)律構(gòu)造非等長碼,就可以獲得概率統(tǒng)計(jì)意義上最優(yōu)的編碼平均碼長的下限是,對二進(jìn)制編碼而言,只有當(dāng)所有符號的出現(xiàn)概率等于2的負(fù)整數(shù)冪時,(如0.5,0.25等),才能達(dá)到下限信息的出現(xiàn)概率在實(shí)際應(yīng)用中很難獲得,一般是用它的頻率代替5.3無失真編碼定理信息信息可用數(shù)學(xué)定量地描述比特信息的單位信源用信源符號集和符號概率描述信源熵平均信息,信源的不確定性無失真編碼定理零記憶信源編碼可達(dá)到的最小平均碼字長度5.4哈夫曼編碼根據(jù)信息熵的理論,將

20、信息出現(xiàn)的概率模型引入編碼模型中,得到概率意義下最優(yōu)編碼基本思想 統(tǒng)計(jì)信號的概率分布模型,然后按信號出現(xiàn)的概率賦予信號不同的碼長。出現(xiàn)概率大的信號賦予較短的碼字,出現(xiàn)概率小的,賦予較長的碼字(變長編碼)算法(1)統(tǒng)計(jì)輸入信號的概率(如對一幅圖像或M幅同種類型圖像進(jìn)行灰度分布概率統(tǒng)計(jì)),得到N個不同概率的信息符號(2)將N個輸入信號按照它們的出現(xiàn)概率由大到小排列(3)合并兩個概率最小的信號,形成一個新的信號。新信號的概率是這兩個信號的概率和。這時概率減少為N-1個(4)在形成新概率集合后重新排列(5)重復(fù)第4步,至只剩兩個概率序列為止(6)以二進(jìn)制碼元(0,1)賦值,形成非續(xù)長代碼樹。注意,最好

21、按統(tǒng)一規(guī)律分配碼元,這樣解碼時更易于理解(7)霍夫曼代碼的產(chǎn)生從根節(jié)點(diǎn)開始,反向進(jìn)行例:H-CP110.42000.330110.1401000.15010100.066010110.0411000.10101001L=k=1M kP( k)=1(0.4)+2(0.3)+3(0.1)+4(0.1)+5(0.06)+5(0.04)=2.20 bitsH= - k=1MP(ak)logP(ak) = -0.4log(0.4)-0.3log(0.3)-0.1log(0.1)-0.1log(0.1)-0.06log(0.06)-0.04log(0.04)=2.14 bits霍夫曼碼

22、舉例霍夫曼碼是最佳編碼按給定的概率分布構(gòu)成的最短的代碼-與概率分布相匹配的編碼編碼效率:= H(x)/L(x)= 2.14/2.20=0.97缺點(diǎn) 1、強(qiáng)烈依賴于概率結(jié)構(gòu),工作量大2、碼字變化大,結(jié)構(gòu)復(fù)雜,實(shí)現(xiàn)困難5.5*算術(shù)編碼算術(shù)編碼是60年代初期Elias提出,由Rissanen和Pasco首次介紹了它的實(shí)用技術(shù),在信源概率分布比較均勻情況下,它的編碼效率高于哈夫曼編碼(5%),沒有變換編碼對數(shù)據(jù)輸入分塊的要求,在JPEG擴(kuò)展系統(tǒng)中用它來取代哈夫曼編碼算術(shù)編碼從整個符號序列出發(fā)采用遞推形式連續(xù)編碼只需用到加法和移位運(yùn)算即時碼唯一可解碼算術(shù)編碼原理將被編碼的信源消息表示成實(shí)數(shù)軸01之間的一

23、個間隔(Interval)(也稱子區(qū)間),消息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位數(shù)就越多。信源中連續(xù)符號根據(jù)某一模式生成概率的大小來縮小間隔算術(shù)編碼過程例 已知信源,試對1011進(jìn)行算術(shù)編碼二進(jìn)制信源符號只有兩個“0”和“1”,設(shè)置小概率Pc1/4,大概率Pe=1-Pc3/4設(shè)C為子區(qū)的左端起始位置,L為子區(qū)的長度(等效于符號概率),根據(jù): 符號“0”的子區(qū)為0,1/4);“0”的子區(qū)左端C0, 子區(qū)長L1/4 符號“1”的子區(qū)為1/4,1);“1”的子區(qū)左端C1/4, 子區(qū)長L3/4在編碼運(yùn)算過程中,隨著消息符號的出現(xiàn),子區(qū)按下列規(guī)則縮小規(guī)則A:新子區(qū)左端 前子區(qū)左端當(dāng)

24、前子區(qū)左端前子區(qū)長度規(guī)則B:新子區(qū)長度=前子區(qū)長度當(dāng)前子區(qū)的長度初始子區(qū)為0,1),即0 x1/k,才能達(dá)到壓縮效果。當(dāng)k=10時,對大多數(shù)文本文件比較合適黑塊/白塊編碼擴(kuò)展到二維,是對圖像中大片的連續(xù)的1或0的區(qū)域(黑白塊)進(jìn)行識別編碼(1)設(shè)圖像被分解為若干塊,每一塊的大小一致,為ab(2)這些塊只有三種類型:全白色、全黑色、混合區(qū)域(3)統(tǒng)計(jì)這三類區(qū)域的出現(xiàn)概率(4)碼字分配:出現(xiàn)概率最大的類型用1比特碼字“0”表示,其他的用2比特碼字“10”和“11”表示,后接對應(yīng)區(qū)域的直接編碼平均碼長為L(X)=p/ab+(1-p)(1+2/ab)若達(dá)到壓縮效果,需滿足 p2/(ab+1)逐層編碼進(jìn)

25、一步提高編碼效率的方法是使用迭代的方法將二值圖像分解為越來越小的塊,逐層進(jìn)行編碼逐層編碼算法(1)純白色的圖像塊用1比特碼字“0”表示(2)其他類型圖像用1比特碼字“1”表示,并且對圖像進(jìn)行四等份分割,得到四個子塊(3)對每一個子塊重復(fù)過程(1)、(2),一直到規(guī)定的最小子塊尺寸(4)圖像最小子塊采用原圖像信息的直接編碼行程編碼(Run Length Coding) 可用于二值圖像/灰度值/連續(xù)出現(xiàn)的長度值進(jìn)行編碼若在圖像的一行內(nèi)采用,就是一維行程編碼,即A碼;若在圖像平面內(nèi)實(shí)施,則為二維行程編碼,它們分別是傳真機(jī)中使用的兩種二值圖像壓縮標(biāo)準(zhǔn)(G3和G4)中所用技術(shù)的基礎(chǔ)游程編碼1-D游程編碼

26、將連續(xù)的游程用游程的長度來編碼用變長碼對游程的長度編碼2-D游程編碼相對地址編碼跟蹤游程的起始和終結(jié)的過渡點(diǎn)一維行程編碼(線性行程編碼, A碼)圖像行掃描, xi=x1, x2, xn, 行內(nèi)連續(xù)的相同的點(diǎn)的數(shù)目稱為行程長度。 縱坐標(biāo)為圖像灰度級gi, 編碼:Wi=(gi, li), li為灰度級gi的行程長度G864204 8 12 16 20 xL二維行程編碼(a)預(yù)測差值編碼(PDQ)將圖像陣列變換為整數(shù)對序列(i,i), i 是相鄰行同區(qū)域開始點(diǎn)列坐標(biāo)差值,I鄰行同區(qū)域行程長度差值域i+I+區(qū)域起始點(diǎn)參數(shù)+區(qū)域終點(diǎn)參數(shù)=形狀,位置ABt1t2iii=t2-t1PDQ及DDC方法說明(b

27、)雙重增量編碼(DDC)(i,i),i相鄰行同區(qū)域結(jié)束點(diǎn)列坐標(biāo)差值用法少數(shù)大區(qū)域,二維較多小區(qū)域,一維用B1碼對整數(shù)序列再編碼輪廓編碼(等值線編碼)用像素的空間坐標(biāo)及其灰度值來描述或壓縮圖像信息鏈碼(Chain Code):二值圖像的輪廓編碼二值圖像f(x,y),0:背景;1:物體算法1)確定物體邊界起始點(diǎn)IP,f(x,y)=12)根據(jù)LML(Look Most Left)規(guī)則跟蹤輪廓3)給出移動方向碼(Freeman碼,鏈碼)3201四方位碼45671023八方位碼鏈碼搜索算法假設(shè)圖像中只包括一個連續(xù)區(qū)域1、從上到下,從左到右掃描圖像,第一個滿足f(x,y)=1的點(diǎn)(物體的邊界點(diǎn))確定為鏈碼

28、的起始點(diǎn)IP,并記錄起始搜索方向?yàn)閏ode0=0,起始點(diǎn)坐標(biāo)(x0,y0)2、根據(jù)LML(Look Most Left)規(guī)則跟蹤輪廓:設(shè)當(dāng)前的方向碼為codei,下一次的搜索方向?yàn)閏odei+1(1)首先向當(dāng)前鏈碼的左方位搜索next=(codei-1)mod 8(2)如果位于該方位的像素也是物體上的點(diǎn),即滿足f(x,y)=1,那么這就是下一個輪廓點(diǎn),記錄鏈碼,修改方位codei+1 = next,進(jìn)入下一次搜索(3)如果位于該next方位的像素不是物體上的點(diǎn),即不滿足f(x,y)=1,那么它就不是下一個輪廓點(diǎn),向右依次回溯,next= next +1(4)如果next = code1,且x=

29、x0,y=y0,則已經(jīng)回到起始點(diǎn),搜索結(jié)束;否則繼續(xù)搜索3、搜索結(jié)束,從code1開始給出區(qū)域的起始位置坐標(biāo)以及移動方向碼(Freeman碼,鏈碼),它們就包括了一個區(qū)域的完整的輪廓信息八方位碼時,方位編碼只需要3bits。各方位碼的行程可用霍夫曼碼等進(jìn)一步編碼減少搜索的技巧八方位碼只需搜索5個方向例:左圖為圖像f(x,y)中的目標(biāo)區(qū)域,采用八方位碼,則區(qū)域鏈碼0422426142617161SDEDIP由鏈碼計(jì)算圖形的幾何特征(1)周長其中Ne是邊界鏈碼中偶數(shù)的數(shù)目,No是奇數(shù)的數(shù)目(2)面積area area0y(-1)7 (y + y +1)/2(-1)4y(+1)5 (y + y +1

30、)/2(+1)603 (y -1+ y)/2(+1)201 (y + y -1)/2(-1) (3)Xmax,Xmin,Ymax,Ymin,重心,矩編碼構(gòu)成編號+IP坐標(biāo)(x,y)+鏈碼特點(diǎn):圖像細(xì)節(jié)少y+1yy-113572640unitx等值線編碼圖像多等灰度級區(qū)域,邊界是等值線,用鏈碼表示。區(qū)域內(nèi)部不存儲或傳輸。等值線編碼壓縮編碼內(nèi)容:等值線號、灰度級、IP行號、IP列號、鏈碼(自然碼)(差分碼)(自然碼/行程編碼/Huffman編碼)全體象素位置標(biāo)記為I(1)T算法(等值線):鏈碼,并對跟蹤過的點(diǎn)標(biāo)記A、D、R、I。若二次通過看分配表(2)IP算法(起始點(diǎn)):圖像左上角,左右,掃描圖像

31、,檢查標(biāo)志符。算法:比較點(diǎn)表5.7無損預(yù)測編碼預(yù)測編碼消除像素間的冗余像素間的相關(guān)性使預(yù)測成為可能預(yù)測誤差:解壓序列:預(yù)測編碼減少了動態(tài)范圍線性預(yù)測:1-D線性預(yù)測:一階1-D線性預(yù)測5.8有損預(yù)測編碼圖像像素之間的相關(guān)性很高,可以將圖像映射到另一個表示域,減少數(shù)據(jù)的變換范圍在編碼時通常還對造成較小誤差的數(shù)據(jù)忽略,以獲得更高的編碼率,因此屬于“有誤差編碼技術(shù)”預(yù)測編碼變換編碼有損預(yù)測編碼德爾塔調(diào)制方法最優(yōu)預(yù)測差值脈沖碼調(diào)制法最優(yōu)量化最小均方量化誤差預(yù)測編碼(DPCM)(微分/差分脈沖調(diào)制) -+XNeNXNeNeN輸出XN輸出XN量化器編碼器預(yù)測器解碼器預(yù)測器預(yù)測編碼原理根據(jù)信號規(guī)律,設(shè)計(jì)預(yù)測

32、公式,對預(yù)測的誤差進(jìn)行編碼線性預(yù)測編碼(差分脈沖調(diào)制)、非線性預(yù)測編碼當(dāng)前xn,之前的信號xn-1, xn-2, xn-m,則預(yù)測值為 ,預(yù)測誤差為 ,en是用于傳輸?shù)牧?,遠(yuǎn)小于原值令E(en2)0,則可獲得最佳估值預(yù)測誤差令與誤差en最小值條件一致 令得到也就是說,xn的最佳估值是已知條件xn-1 ,xn-2 , xn-m下xn的數(shù)學(xué)期望。設(shè)與序列的前值無關(guān),那么預(yù)測編碼利用預(yù)測誤差傳送信號,差分脈沖編碼調(diào)制(DPCM)xn表示時刻n的輸入信號, 表示預(yù)測信號,它是由xn之前的m個信號估計(jì)的,en為預(yù)測誤差信號。因此,在實(shí)際系統(tǒng)中,信號前m個值是不能預(yù)測的,輸入的是實(shí)際信號的幅度,它們要用單

33、獨(dú)的方式編碼。若框圖中缺少“量化器”,則傳送的信號無損失,整個系統(tǒng)無誤差,為“無損預(yù)測編碼”。在有“量化器”時,誤差被重整為很少的數(shù)目en,為“有損預(yù)測編碼”,但編碼比特?cái)?shù)減少,可以獲得更大的壓縮比線性預(yù)測假設(shè)二維靜止圖像信號是一個均值為0,方差為2 的平穩(wěn)隨機(jī)過程,x1 , x2 , xn-1為在時刻t1 , t2 , tn-1的采樣值,那么時刻tn的采樣值可以由它之前的n-1已知的采樣值估計(jì)Prisch研究并修正了這個結(jié)論為了防止DPCM系統(tǒng)中出現(xiàn)“極限環(huán)”(Limit Circle)振蕩和減少傳輸誤碼的擴(kuò)散效應(yīng),應(yīng)滿足下列兩個條件(1)預(yù)測誤差e=0應(yīng)該是一個量化輸出電平,也就是說量化分

34、層的總數(shù)K應(yīng)該是奇數(shù)(2)所有預(yù)測系數(shù)應(yīng)當(dāng)滿足 DPCM中利用已知信息的方法掃描方向前一行X6X3X2X4X7當(dāng)前行X5X1XP3當(dāng)前象素預(yù)測當(dāng)前象素時采用的以前像素的位置,數(shù)字表示優(yōu)先關(guān)系掃描方向(1)前值預(yù)測:對XN的估計(jì)只取前一個值XN-1(2)一維預(yù)測(行內(nèi)預(yù)測):取同行中前面若干個(3)二維預(yù)測:本行前幾個與上行相鄰幾個(4)三維預(yù)測:相鄰兩幀圖像的相關(guān)性,動態(tài)圖像(視頻)隔行掃描的電視圖像,經(jīng)驗(yàn)公式人頭像的典型預(yù)測公式為非線性預(yù)測編碼ai變化,與圖像的局部特性相匹配典型方案:按象素差值大小進(jìn)行預(yù)測注:si不是時間序列,而是由s0與si之間距離來決定的序列,距離越近, si 越小令d

35、1=s0-s1,d11=a(s3-s2),d2=s0-s2,d22=a(s1-s7),d3=s0-s3,d33=a(s1-s2),a=0.5由于si狀態(tài)不一樣,非線性預(yù)測進(jìn)一步修改為S11S9S7S8S10S12S2S6S3S4S5S0S1dd無損預(yù)測系統(tǒng)預(yù)測器整數(shù)舍入+輸入圖像fn符號編碼器+-en預(yù)測器+解壓圖像符號解碼器+en壓縮圖像有損預(yù)測系統(tǒng)壓縮圖像預(yù)測器+解壓圖像符號解碼器+en壓縮圖像預(yù)測器+輸入圖像fn符號編碼器+en量化器+-+en預(yù)測誤差的量化拉普拉斯分布均勻量化,只要量化級數(shù)少于8bits就可望達(dá)到壓縮的效果。也可以根據(jù)最佳量化器的設(shè)計(jì)方法,設(shè)計(jì)最佳的非線性量化器,當(dāng)每像

36、素平均2bits時就可以得到較好的圖像質(zhì)量。若采用自適應(yīng)量化或矢量量化,圖像質(zhì)量可進(jìn)一步提高5.9變換編碼變換編碼(頻域方法)構(gòu)造子圖像子圖像尺寸影響實(shí)際圖像的空間域信息正交變換頻率/列率編碼特點(diǎn)1)正交變換,相關(guān)性下降2)頻譜信息來自整個圖像,頻譜能量集中低頻3)受噪聲干擾小4)變換系數(shù)存在量化過程,不可逆編碼典型的變換編碼系統(tǒng)框圖輸入圖像構(gòu)造子圖像正變換量化符號編碼壓縮數(shù)據(jù)壓縮數(shù)據(jù)符號解碼反變換合并子圖像解壓圖像編碼中需考慮的重要因素變換方法的選擇信息集中能力強(qiáng)弱:KLT,DCT,DFT,WHT計(jì)算量大?。篕LT,DCT,DFT,WHT子圖像尺寸的選擇2的冪次,圖像的相關(guān)性與圖像尺寸有關(guān),

37、8*8,16*16比特的分配對變換子圖像的系數(shù)截留、量化和編碼的全過程系數(shù)截留方式: 區(qū)域編碼和域值編碼1)區(qū)域編碼:對能量集中區(qū)域進(jìn)行抽樣,并對區(qū)域內(nèi)變換系數(shù)編碼。壓縮率高2)域值編碼:對變換系數(shù)的幅度進(jìn)行編碼。效果好7654328165432170543210604321005032100040210000301000002000000010壓縮步驟1、確定矩陣階數(shù)2. 分別按圖像矩陣的行或列,求得圖像數(shù)據(jù)的協(xié)方差矩陣3. 確定變換矩陣4. 計(jì)算變換域的協(xié)方差矩陣5. 保留較大的系數(shù),把小于等于域值的系數(shù)以0代替6. 按新矩陣傳輸非零系數(shù),并在接收端用反變換核求原始圖像的值特點(diǎn)(1)變換系

38、數(shù)的相關(guān)性遠(yuǎn)遠(yuǎn)小于圖象象素間的相關(guān)性(2)變換矩陣固定DFT, DCT, Walsh_Hadamard, Slant, Haar(3)快速算法混合編碼較好的復(fù)原圖像 f(x,y)1D行變換核行間預(yù)測編碼波形編碼圖像壓縮要點(diǎn)1、以上的編碼方法均以信號和信息理論為指導(dǎo),屬波形編碼2、圖像壓縮降低了數(shù)字圖像的存儲量,縮短了圖像傳送所需求的時間,但是這是以壓縮和解壓縮的時間為代價的3、有損壓縮比無損壓縮可以達(dá)到更高的壓縮比,但是后者保持了數(shù)據(jù)的完整性4、K-L變換對于靜態(tài)圖像的編碼是最佳的方法,但是它需要對特征矩陣作繁重的計(jì)算5、對于那些可以用一階馬爾科夫( Markov)過程來模擬的圖像來說,DCT

39、是K-L變換很好的近似,尤其是當(dāng)P接近1時6、基于方波變換的圖像壓縮方法在計(jì)算量上效率比較高,但是一般來說,比起 DCT編碼的效率要低7、最佳編碼方法生成的誤差圖像只包含高斯白噪聲8、現(xiàn)代圖像和視頻壓縮標(biāo)準(zhǔn)綜合各種數(shù)據(jù)壓縮技術(shù),以達(dá)到更高的效率和更好的結(jié)果9、由于有損壓縮方法得到的圖像的質(zhì)量,依賴于壓縮率和圖像的內(nèi)容。評價是,應(yīng)該在高質(zhì)量的現(xiàn)實(shí)設(shè)備上,用具有代表性的待壓縮圖像進(jìn)行對照性的比較本章要點(diǎn)5.1數(shù)據(jù)冗余的概念和圖像壓縮的原理5.2圖像保真度的概念和主客觀保真度準(zhǔn)則5.3信息量和熵的概念及無失真編碼定理5.4哈夫曼編碼的方法步驟和其簡化方式5.5算術(shù)編解碼的原理方法5.6位平面的概念和

40、基于位平面的編碼方法5.7預(yù)測編碼的原理和無損預(yù)測方法5.8有損預(yù)測編碼的方法和會產(chǎn)生的問題5.9變換編碼的原理和方法圖像編碼標(biāo)準(zhǔn)國際標(biāo)準(zhǔn)化組織(international standardization organization,ISO) 國際電信聯(lián)盟(international telecommunication union , ITU) 國際電話電報(bào)咨詢委員會(consultative committee of the international telephone and telegraph,CCITT)標(biāo)準(zhǔn)號俗稱適用信源典型應(yīng)用ITU-T T.82 | ISO/IEC 11544JB

41、IG-1二值圖像、圖形G4傳真機(jī)、計(jì)算機(jī)圖形ISO/IEC 14492JBIG-2二值圖像、圖形傳真機(jī)、WWW圖形庫、PDA等ITU-T T.81 | ISO/IEC 10918JPEG連續(xù)色調(diào)靜止圖像圖像庫、傳真、彩色印刷、數(shù)碼相機(jī)等ITU-T T.87 | ISO/IEC 14495JPEG-LS連續(xù)色調(diào)靜止圖像醫(yī)學(xué)、遙感圖像資料的無損/近似壓縮ISO/IEC 11544JPEG2000連續(xù)色調(diào)靜止圖像各種圖形、圖像(含計(jì)算機(jī)生成的)ITU-T G.723,G.728,G.729語音數(shù)字通信和電話錄音ITU-T-T H.261P64活動圖像ISDN上的會議電視/可視電話ITU-T-T H.

42、263活動圖像PSTN上的會議電視/可視電話ISO/IEC 11172MPEG-1活動圖像及伴音VCD、DBA、多媒體、VOD等ITU-T-T H.262 | ISO/IEC 13818-2MPEG-2視頻高質(zhì)量活動圖像SVCD/DVD、VOD/MOD、多媒體視頻游戲、DVB DTV/HDTV等ISO/IEC 14496MPEG-4多媒體音像數(shù)據(jù)WWW 上的視頻、音頻擴(kuò)展主要的數(shù)據(jù)壓縮標(biāo)準(zhǔn)及其典型應(yīng)用二值圖像壓縮編碼靜態(tài)圖像壓縮編碼動態(tài)圖像壓縮編碼二值圖像壓縮編碼G3和G4CCITT的T.0建議書公共電話網(wǎng)文件傳輸傳真設(shè)備分類中定義了G1、G2、G3和G4四種傳真機(jī)。規(guī)定G3傳真機(jī)可采用MH(

43、Modified Huffman)和MR(Modified READ)編碼方式,G4傳真機(jī)采用MMR(Modified Modified READ)編碼方式G3非自適應(yīng)編碼,1-D游程編碼技術(shù)、位平面分解、常數(shù)塊編碼。對每組N行(N2或N=4)掃描線中的后N-1行也可以用2-D方式編碼1組共8幅 “試驗(yàn)”圖用來評判各種壓縮方法,包括打印的文字、用幾種語言手寫的文字、少量的線繪圖G3對它們的壓縮率約為15:1G4G3的1種簡化版本,其中只使用2-D編碼G4的壓縮率一般比G3高1倍JBIG(Joint Bi-level Image Coding Experts group)一種高清晰度的二值圖像編

44、碼標(biāo)準(zhǔn),1991年制定 自適應(yīng)技術(shù),對半調(diào)灰度(halftone)圖有改進(jìn)軟拷貝通信用于傳真機(jī):圖像按位平面進(jìn)行分解,分層傳送用于圖像檢索:漸進(jìn)(累進(jìn))的傳輸與重建策略。原圖像縮小,水平/垂直各1/2求概略圖,最低分辨率,依次傳送,滿意可中止JBIG標(biāo)準(zhǔn)圖像縮小(reduction method, 分辨率變換)采用PRES形式(progressive reduction scheme累進(jìn)壓縮方案),使圖像和圖形部分保持良好的縮小特性DP(deterministic prediction唯一性預(yù)測),根據(jù)圖像縮小的方式,從已編過碼的像素唯一地確定所要編碼的像素值模板模型(template mod

45、el)是編碼時所用的參考像素的模型,在分辨率最低圖像中采用的是高階馬爾科夫模型熵編碼(entropy coder)中采用的是QM碼,屬于自適應(yīng)算術(shù)編碼方式圖像縮小DP模板模型熵編碼抖動或非抖動圖像JBIG標(biāo)準(zhǔn)的方框圖靜止彩色圖像壓縮標(biāo)準(zhǔn)1、JPEG 2、JPEG 2000JPEG(Joint Picture Experts Group)“聯(lián)合” 是指,國際電報(bào)電話咨詢委員會(CCIT)和國際標(biāo)準(zhǔn)化協(xié)會(ISO)聯(lián)合組成的一個圖像專家小組。聯(lián)合圖像專家小組1986年成立,任務(wù)是開發(fā)研制出連續(xù)色調(diào)、多級灰度、靜止圖像的數(shù)字圖像壓縮編碼標(biāo)準(zhǔn),使之滿足以下的要求 (1)達(dá)到或接近當(dāng)前壓縮比與圖像保真度

46、技術(shù)水平,能覆蓋一個較寬的圖像質(zhì)量等級,能達(dá)到“很好”到“極好”的評估,即編碼圖像與原始圖像相比較,人的視覺難以區(qū)分差別(2)能適用于任何種類的連續(xù)色調(diào)的圖像,且長寬比都不受限制,同時也不受限于景物內(nèi)容、圖像的復(fù)雜度和統(tǒng)計(jì)特性等(3)計(jì)算的復(fù)雜性是可控制的,其軟件可在各種CPU上完成,算法也可用硬件實(shí)現(xiàn)(4)JPEG算法具有下面四種操作方式順序編碼:每個圖像按從左到右、從上到下掃描,一次掃描完成編碼累進(jìn)編碼:圖像編碼在多次掃描中完成。累進(jìn)編碼傳輸時間長,接受端收到的圖像是多次掃描由粗糙到清晰的累進(jìn)過程。無失真編碼:可保證解碼后完全精確地恢復(fù)源圖像,其壓縮比低于有失真編碼分層編碼:圖像在多個空間

47、分辨率進(jìn)行編碼。當(dāng)信道傳輸速率慢,接收端顯示器分辯率也不高的情況下,只需做低分辨率解碼,不必進(jìn)行高分辨率解碼JPEG BASELINE 系統(tǒng)結(jié)構(gòu)圖DCT88量化器輸入圖像量化表DC系數(shù)AC系數(shù)塊間DPCMZ字型掃描DC霍夫曼表霍夫曼編碼霍夫曼編碼AC霍夫曼表字節(jié)填充復(fù)用輸出數(shù)據(jù)標(biāo)識碼控制信號離散余弦變化后得到64個變換系數(shù),對應(yīng)于頻率為0的系數(shù)稱為“直流分量”(DC系數(shù)),其它63個系數(shù)稱為“交流分量”(AC系數(shù))。這兩種系數(shù)量化和編碼的方式都不同1量化量化器由包含64個分量的量化表組成,量化表的內(nèi)容由用戶指定,每一個分量是從1到255的任意整數(shù)。因此量化就是每一個DCT系數(shù)被與它相對應(yīng)的量化

48、器的步長(quantizer step size)除,再取整CQ(u,v)=取整( C(u,v)/Q(u,v)) 其中,C(u,v)圖像DCT之后的系數(shù),Q(u,v)量化參數(shù), CQ(u,v)量化后的DCT系數(shù)由于存在取整,量化過程不可逆,造成信息的丟失,因此會使圖像失真。如果這種失真足夠小,不影響視覺感受,就是可以接受的。 1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399亮度量化表17182447999999991821266699999999242666999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999色度量化表2編碼直流系數(shù)采用差值編碼交流系數(shù),需要先將交流系數(shù)從AC01開始,按照“Z”字形路線掃描,至AC63,這樣可以將低頻系數(shù)置于高頻系數(shù)之前,獲得大量連續(xù)的“0”。非零的系數(shù)采用霍夫曼碼編碼,而“0”采用行程編碼,多種技術(shù)綜合使用可以得到很高的壓縮比 7654

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論