版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
多媒體計算機(jī)技術(shù)魯宏偉luhw@第三章數(shù)字圖像處理技術(shù)信號處理的基本術(shù)語圖像數(shù)據(jù)壓縮基礎(chǔ)
圖像數(shù)據(jù)壓縮算法
常用圖形、圖像文件的格式靜態(tài)圖像壓縮標(biāo)準(zhǔn)動態(tài)圖像壓縮標(biāo)準(zhǔn)H.261和H.263標(biāo)準(zhǔn)思考題信號處理的基本術(shù)語采樣與量化DFT和IDFT小波變換采樣和量化
信號的數(shù)字化處理包括兩個步驟,一個是信號在時間上的離散化,即采樣;另一個是幅度上的離散化,即量化。采樣也稱抽樣,是信號在時間上的離散化,即按照一定時間間隔△t在模擬信號x(t)上逐點采取其瞬時值。它是通過采樣脈沖和模擬信號相乘來實現(xiàn)的t=采樣點之間的距離采樣和量化量化是對幅值進(jìn)行離散化,即將振動幅值用二進(jìn)制量化電平來表示。量化電平按級數(shù)變化,實際的幅度值是連續(xù)的物理量。具體幅度值用舍入法歸到靠近的量化電平上。
對模擬信號采樣首先要確定采樣間隔。如何合理選擇△t涉及到許多需要考慮的技術(shù)因素。
過采樣信號低采樣產(chǎn)生的偏差信號DFT和IDFT傅立葉分析是將原始信號分解成不同頻率成分的正弦波,將時域信號轉(zhuǎn)變?yōu)轭l域信號的一種數(shù)學(xué)方法,在信號的分析和處理中有著十分重要的作用對數(shù)字信號,需要采用相關(guān)的離散化方法,這就是由傅立葉分析得到的離散傅立葉變換DFT,其逆變換表示為IDFT。
DFT和IDFT設(shè)是連續(xù)函數(shù)h(t)的N個采樣值,則這N個點的寬度為N的DFT定義為IDFT定義為稱為N點DFT的變換核函數(shù)稱為N點IDFT的變換核函數(shù)小波變換
一個小波是一個在有限周期內(nèi)的波形,它的平均值為零。比較正弦波形和小波,正弦信號正是Fourier分析的基礎(chǔ),它沒有限定的周期,它可以從負(fù)無窮擴(kuò)展到正無窮,正弦信號是平滑并且是可預(yù)知的,小波信號是不規(guī)則的并且不對稱。
圖3.3正弦信號和小波信號正弦波小波小波變換傅立葉分析是將信號分解為各種頻率的正弦信號,類似地,小波分析是將信號分解為滑動的、與母系小波成比例的各種子波。
信號傅立葉變換不同頻率的連續(xù)正弦子波信號小波變換不同尺度與位置的連續(xù)小波小波變換小波變換可以使得信號的低頻長時特性和高頻短時特性同時得到處理,具有良好的局部化性質(zhì),能有效地克服傅氏變換在處理非平穩(wěn)復(fù)雜信號時存在的局限性,具有極強(qiáng)的自適應(yīng)性。由于小波變換能夠有效地解決方塊效應(yīng)和基本上解決蚊式噪聲,所以小波變換已經(jīng)成為當(dāng)今圖像壓縮編碼的主要研究方向。
圖像數(shù)據(jù)壓縮基礎(chǔ)色彩的基本概念視覺系統(tǒng)對顏色的感知彩色空間及其變換RGB顏色模式
Lab顏色模式
HSB顏色模式CMYK顏色模式顏色模型的色域彩色空間的線性變換標(biāo)準(zhǔn)圖像的種類圖像數(shù)據(jù)壓縮的可能性統(tǒng)計冗余信息熵冗余結(jié)構(gòu)冗余知識冗余視覺冗余
色彩的基本概念
從人的視覺系統(tǒng)看,色彩可用色調(diào)、飽和度和亮度來描述。人眼看到的任一彩色光都是這三個特性的綜合效果,這三個特性可以說是色彩的三要素,其中色調(diào)與光波的波長有直接關(guān)系,亮度和飽和度與光波的幅度有關(guān)。圖像深度與色彩類型
圖像深度與顯示深度圖像深度與色彩類型圖像深度是指位圖中記錄每個像素點所占的位數(shù),它決定了彩色圖像中可出現(xiàn)的最多顏色數(shù),或者灰度圖像中的最大灰度等級數(shù)。
每個像素點的圖像深度的分配還與圖像所用的色彩空間有關(guān)。以最常用的RGB色彩空間為例,圖像深度與色彩的映射關(guān)系主要有真彩色、偽彩色和調(diào)配色。真彩色真彩色(true-color)是指圖像中的每個像素值都分成R、G、B三個基色分量,每個基色分量直接決定其基色的強(qiáng)度,這樣產(chǎn)生的色彩稱為真彩色。例如圖像深度為24,用R:G:B=8:8:8來表示色彩,則R、G、B各占用8位來表示各自基色分量的強(qiáng)度,每個基色分量的強(qiáng)度等級為28=256種。圖像可容納224=16M種色彩。這樣得到的色彩可以反映原圖的真實色彩,故稱真彩色偽彩色偽彩色(pseudo-color)圖像的每個像素值實際上是一個索引值或代碼,該代碼值作為色彩查找表CLUT(ColorLook-UpTable)中某一項的入口地址,根據(jù)該地址可查找出包含實際R、G、B的強(qiáng)度值。用這種方式產(chǎn)生的色彩本身是真的,不過它不一定反映原圖的色彩。在VGA顯示系統(tǒng)中,調(diào)色板就相當(dāng)于色彩查找表。從16色標(biāo)準(zhǔn)VGA調(diào)色板的定義可以看出這種偽彩色的工作方式偽彩色一般用于65K色以下的顯示方式中。標(biāo)準(zhǔn)的調(diào)色板是在256K色譜中按色調(diào)均勻地選取16種或256種色彩。一般應(yīng)用中,有的圖像往往偏向于某一種或幾種色調(diào),此時如果采用標(biāo)準(zhǔn)調(diào)色板,則色彩失真較多。因此,同一幅圖像,采用不同的調(diào)色板顯示可能會出現(xiàn)不同的色彩效果。16色標(biāo)準(zhǔn)VGA調(diào)色板采用不同的調(diào)色板顯示同一幅圖像的效果實例調(diào)配色調(diào)配色(direct-color)的獲取是通過每個像素點的R、G、B分量分別作為單獨的索引值進(jìn)行變換,經(jīng)相應(yīng)的色彩變換表找出各自的基色強(qiáng)度,用變換后的R、G、B強(qiáng)度值產(chǎn)生的色彩。調(diào)配色與偽彩色相比,相同之處是都采用查找表,不同之處是前者對R、G、B分量分別進(jìn)行查找變換,后者是把整個像素當(dāng)作查找的索引進(jìn)行查找變換。因此,調(diào)配色的效果一般比偽彩色好。調(diào)配色與真彩色比,相同之處是都采用R、G、B分量來決定基色強(qiáng)度,不同之處是前者的基色強(qiáng)度是由R、G、B經(jīng)變換后得到的,而后者是直接用R、G、B決定。在VGA顯示系統(tǒng)中,用調(diào)配色可以得到相當(dāng)逼真的彩色圖像,雖然其色彩數(shù)受調(diào)色板的限制而只有256色圖像深度與顯示深度顯示深度表示顯示緩存中記錄屏幕上一個點的位數(shù)(bit),也即顯示器可以顯示的色彩數(shù)。因此,顯示一幅圖像時,屏幕上呈現(xiàn)的色彩效果與圖像文件所提供的色彩信息有關(guān),也即與圖像深度有關(guān);同時也與顯示器當(dāng)前可容納的色彩容量有關(guān),也即與顯示深度有關(guān)。顯示深度大于圖像深度顯示深度等于圖像深度顯示深度小于圖像深度顯示深度大于圖像深度在這種情況下屏幕上的色彩能較真實地反映圖像文件的色彩效果。如當(dāng)顯示深度為24位,圖像深度為8位時,屏幕上可以顯示按該圖像的調(diào)色板選取的256種顏色;圖像深度為4位時可顯示16色。這種情況下,顯示的色彩完全取決于圖像的色彩定義顯示深度等于圖像深度在這種情況下,如果用真彩色顯示模式來顯示真彩色圖像,或者顯示調(diào)色板與圖像調(diào)色板一致時,屏幕上的色彩能較真實地反映圖像文件的色彩效果。反之,如果顯示調(diào)色板與圖像調(diào)色板不一致,則顯示色彩會出現(xiàn)失真
顯示深度小于圖像深度此時顯示的色彩會出現(xiàn)失真。例如,若顯示深度為8位,需要顯示一幅真彩色的圖像時顯然達(dá)不到應(yīng)有的色彩效果。在這種情況下不同的圖像軟件有不同的處理方法
色調(diào)與色相繪畫中要求有固定的色彩感覺,有統(tǒng)一的色調(diào),否則難以表現(xiàn)畫面的情調(diào)和主題。例如我們說一幅畫具紅色調(diào),是指它在色彩上總體偏紅。計算機(jī)在圖像處理上采用數(shù)字化,可以非常精確地表現(xiàn)色彩的變化,色調(diào)是相對連續(xù)變化的。用一個園環(huán)來表現(xiàn)色譜的變化,就構(gòu)成了一個色彩連續(xù)變化的色環(huán)。
色彩連續(xù)變化的色環(huán)太陽光帶中的六標(biāo)準(zhǔn)色與六個中間色,即紅橙,黃橙,黃綠,藍(lán)綠(青),藍(lán)紫,紅紫(品紅),合稱十二色相或色調(diào)。把不同的色調(diào)按紅橙黃綠藍(lán)紫的順序銜接起來,就形成了一個色調(diào)連續(xù)變化過渡的圓環(huán),稱作為色環(huán)。亮度與明度同一物體因受光不同會產(chǎn)生明度上的變化不同顏色的光,強(qiáng)度相同時照射同一物體也會產(chǎn)生不同的亮度感覺。
明度也可以說是指各種純正的色彩相互比較所產(chǎn)生的明暗差別。在純正光譜中,黃色的明度最高,顯得最亮;其次是橙、綠;再其次是紅、藍(lán);紫色明度最低,顯得最暗。同一物體因受光不同會產(chǎn)生明度上的變化照射的光越強(qiáng),反射光也越強(qiáng),看起來越亮。顯然,如果彩色光的強(qiáng)度降到使人看不到了,在亮度標(biāo)尺上它應(yīng)與黑色對應(yīng)。同樣,如果其強(qiáng)度變得很大,那么亮度等級應(yīng)與白色對應(yīng)。亮度是非彩色屬性,彩色圖像中的亮度對應(yīng)于黑白圖像中的灰度飽和度與純度淡色的飽和度比濃色要低一些。飽和度還和亮度有關(guān),同一色調(diào)越亮或越暗越不純。飽和度越高,色彩越艷麗、越鮮明突出,越能發(fā)揮其色彩的固有特性。但飽和度高的色彩容易讓人感到單調(diào)刺眼。飽和度低,色感比較柔和協(xié)調(diào),可混色太雜則容易讓人感覺渾濁,色調(diào)顯得灰暗。
飽和度與純度對于同一色調(diào)的彩色光,飽和度越深,顏色越鮮明或說越純,相反則越淡飽和度和亮度在飽和的彩色光中增加白光的成分,相當(dāng)于增加了光能,因而變得更亮了,但是它的飽和度卻降低了。若增加黑色光的成分,相當(dāng)于降低了光能,因而變得更暗,其飽和度也降低了視覺系統(tǒng)對顏色的感知視覺系統(tǒng)對顏色和亮度的響應(yīng)特性視覺系統(tǒng)對顏色的感知產(chǎn)生波長不同的光所需要的三基色值人眼對圖像的亮度信息敏感、對顏色分辨率弱由于人眼對色彩細(xì)節(jié)的分辨能力遠(yuǎn)比對亮度細(xì)節(jié)的分辨能力低,若把人眼剛能分辨的黑白相間的條紋換成不同顏色的彩色條紋,那么眼睛就不再能分辨出條紋來。如圖所示,等寬的藍(lán)紅相間的彩條,藍(lán)綠相間的彩條和黑白相間的條紋比較。使眼睛逐漸遠(yuǎn)離屏幕,當(dāng)你分辨不出彩條時,黑白條還能分辨出來RGB顏色模式
自然界中所有的顏色都可以用紅、綠、藍(lán)(RGB)這三種波長顏色的不同的強(qiáng)度組合而得,這就是人們常說的三基色原理。因為RGB顏色合成產(chǎn)生白色,它們也叫作加色把三種基色交互重疊,就產(chǎn)生了次混合色:青(cyan)、洋紅(magenta)、黃(yellow)在數(shù)字視頻中,對RGB三基色各進(jìn)行8位編碼就構(gòu)成了大約16.7萬種顏色,這就是我們常說的真彩色。
電視機(jī)和計算機(jī)的監(jiān)視器都是基于RGB顏色模式來創(chuàng)建其顏色的。
RGB色彩空間RGB相加混色模型RGB相加色示例RGB強(qiáng)度顏色色彩效果000
黑(Black)001
藍(lán)(Blue)010
綠(Green)011
青(Cyan)100
紅(Red)101
品紅(Magenta)110
黃(Yellow)111
白(White)Lab顏色模式該顏色模式由一個發(fā)光率(luminance)和兩個顏色(a,b)軸組成。它由顏色軸所構(gòu)成的平面上的環(huán)形線來表示顏色的變化,其中徑向表示色飽和度的變化,自內(nèi)向外,飽和度逐漸增高;圓周方向表示色調(diào)的變化,每個圓周形成—個色環(huán);而不同的發(fā)光率表示不同的亮度并對應(yīng)不同環(huán)形顏色變化線。A.光度=100(白)B.綠到紅分量C.藍(lán)到黃分量D.光度=0(黑)到紅分量Lab顏色模式
Lab顏色是由RGB三基色轉(zhuǎn)換而來的
它是一種具有“獨立于設(shè)備”的顏色模式,既不論使用任何一種監(jiān)視器或者打印機(jī),Lab的顏色不變。
HSB顏色模式
從心理學(xué)的角度來看,顏色有三個要素:色相、飽和度和亮度。HSB顏色模式便是基于人對顏色的心里感受的顏色模式。
HSB色彩空間可以用一個圓錐空間模型來描述。圓錐空間模型(A)HSI圓錐空間模型(B)線條示意圖:圓錐上亮度、色度和飽和度的關(guān)系。(C)縱軸表示亮度(D)圓錐縱切面:描述了同一色調(diào)的不同亮度和飽和度關(guān)系。(E)圓錐橫切面:色調(diào)H為繞著圓錐截面度量的色環(huán),圓周上的顏色為完全飽和的純色,色飽和度為穿過中心的半徑橫軸。彩色空間的線性變換標(biāo)準(zhǔn)
為了使用人的視角特性以降低數(shù)據(jù)量,通常把RGB空間表示的彩色圖像變換到其他彩色空間。彩色空間變換有三種:YIQ,YUV和YCrCbYIQ適用于NTSC彩色電視制式Y(jié)UV適用于PAL和SECAM彩色電視制式而YCrCb適用于計算機(jī)用的顯示器彩色空間的線性變換標(biāo)準(zhǔn)YUV與YIQ模型
在彩色電視制式中,使用YUV和YIQ模型來表示彩色圖像。在PAL彩色電視制式中使用YUV模型,Y表示亮度,UV用來表示色差,U、V是構(gòu)成彩色的兩個分量;在NTSC彩色電視制式中使用YIQ模型,其中的Y表示亮度,I、Q是兩個彩色分量。YUV/YIQ特點
亮度信號(Y)和色度信號(U、V)是相互獨立的可以利用人眼的特性來降低數(shù)字彩色圖像所需要的存儲容量。人眼對彩色細(xì)節(jié)的分辨能力遠(yuǎn)比對亮度細(xì)節(jié)的分辨能力低。例如,要存儲RGB8:8:8的彩色圖像,即R、G和B分量都用8位二進(jìn)制數(shù)表示,圖像的大小為640×480像素,那末所需要的存儲容量為921600字節(jié)。如果用YUV來表示同一幅彩色圖像,Y分量仍然為640×480,并且Y分量仍然用8位表示,而對每四個相鄰像素(2×2)的U、V值分別用相同的一個值表示,那末存儲同樣的一幅圖像所需的存儲空間就減少到460800字節(jié)。這實際上也是圖像壓縮技術(shù)的一種方法。與YUV顏色模式類似的一種稱為YCrCb模式,主要適用于計算機(jī)用的顯示器。彩色空間的線性變換標(biāo)準(zhǔn)YUV與RGB彩色空間變換Y=0.299R+0.587G+0.114BU=-0.147R-0.289G+0.436BV=0.615R-0.515G-0.100B寫成矩陣的形式:彩色空間RGB-YUVYIQ與RGB彩色空間變換Y=0.299R+0.587G+0.114BI=0.596R-0.275G-0.321BQ=0.212R-0.523G+0.311B寫成矩陣的形式:彩色空間RGB-YIQ彩色空間RGB-YCrCbYCrCb與RGB彩色空間變換
數(shù)字域中的彩色空間變換與模擬域的彩色空間變換不同。它們的分量使用Y、Cr和Cb來表示,與RGB空間的轉(zhuǎn)換關(guān)系如下:Y=0.299R+0.578G+0.114BCr=(0.500R-0.4187G-0.0813B)+128Cb=(-0.1687R-0.3313G+0.500B)+128寫成矩陣的形式:CMYK顏色模式
這是彩色印刷使用的—種顏色模式。它由青(cyan)、洋紅(magenta)、黃(yellow)和黑(black)四種顏色組成。
這種模式的創(chuàng)建基礎(chǔ)和RGB不同,它不是靠增加光線,而是靠減去光線。這是因為與監(jiān)視器或者電視機(jī)不同,打印紙不能創(chuàng)建光源,即它不會發(fā)射光線,而只能吸收和反射光線,即它只能夠吸收特定波長而反射其它波長。
通過對上述四種顏色的組合,可以產(chǎn)生可見光譜中的絕大部分顏色。
CMYK顏色模式CMYK相減混色模型
CMYK模型以打印在紙張上油墨的光線吸收特性為基礎(chǔ),白光照射到半透明油墨上時,部分光譜被吸收,部分被反射回眼睛。理論上,青色(C)、洋紅(M)和黃色(Y)色素能合成吸收所有顏色并產(chǎn)生黑色。由于這個原因,這些顏色叫作減色。
因為所有打印油墨都會包含一些雜質(zhì),這三種油墨實際上產(chǎn)生一種土灰色,必須與黑色(K)油墨混合才能產(chǎn)生真正的黑色。將這些油墨混合產(chǎn)生顏色叫作四色印刷。顏色模型的色域
色域是一個色系能夠顯示或打印的顏色范圍。人眼看到的色譜比任何顏色模型中的色域都寬。在顏色模型中,Lab具有最寬的色域,它包括RGB和CMYK色域中的所有顏色。通常RGB色域包含能在計算機(jī)顯示器或電視屏幕(發(fā)出紅、綠和藍(lán)光)上所有能顯示的顏色。因而一些諸如純青或純黃等顏色不能在顯示器上精確顯示。
CMYK色域較窄,僅包含使用印刷色油墨能夠打印的顏色。當(dāng)不能被打印的顏色在屏幕上顯示時,它們稱為溢色──即超出CMYK色域之外。圖像的種類標(biāo)準(zhǔn)單色圖標(biāo)準(zhǔn)灰度圖圖像的種類256色標(biāo)準(zhǔn)圖像24位標(biāo)準(zhǔn)圖像圖像的種類256色標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖24位標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖統(tǒng)計冗余圖像數(shù)據(jù)存在大量的統(tǒng)計特征的重復(fù),這種重復(fù)包括靜態(tài)單幀圖像數(shù)據(jù)在空間上的冗余和音頻、視頻數(shù)據(jù)在時間上的冗余。
在動態(tài)圖像序列中,前后兩幀圖像之間具有較大的相關(guān)性,表現(xiàn)出幀與幀之間的重復(fù),因而存在時間冗余。
信息熵冗余
信息熵定義為一組數(shù)據(jù)所表示的信息量,即
式中,E為信息熵,N為數(shù)據(jù)的種類(或稱碼元)個數(shù),為第i個碼元出現(xiàn)的概率。一組數(shù)據(jù)的數(shù)據(jù)量顯然等于各記錄碼元的二進(jìn)制位數(shù)(即編碼長度)與該碼元出現(xiàn)的概率乘積之和,即
式中,D為數(shù)據(jù)量,為第i個碼元的二進(jìn)制位數(shù)。一般取(如ASCII編碼把所有碼元都編碼為7比特),這樣得到的D必然大于E。這種因碼元編碼長度的不經(jīng)濟(jì)帶來的冗余稱為信息熵冗余或編碼冗余。
信息熵冗余圖26個英文字母相對頻率結(jié)構(gòu)冗余
有些圖像從大面積上或整體上看存在著重復(fù)出現(xiàn)的相同或詳盡的紋理結(jié)構(gòu),例如布紋圖像和草席圖像,被稱為結(jié)構(gòu)冗余。
知識冗余
有許多圖像的理解與圖像所表現(xiàn)內(nèi)容的基礎(chǔ)知識(鮮艷或背景知識)有相當(dāng)大的相關(guān)性,從這種知識出發(fā)可以歸納出圖像的某種規(guī)律性變化,這類冗余稱為知識冗余。知識冗余的一個典型例子是對人像的理解,比如,鼻子上方有眼睛,鼻子又在嘴的上方等。
視覺冗余
人類的視覺系統(tǒng)實際上只在一定程度上對圖像的變化產(chǎn)生敏感,即圖像數(shù)據(jù)中存在著大量人類視覺覺察不到的細(xì)節(jié)。事實上,人類視覺系統(tǒng)的一般分辨力為64灰度級,而一般圖像量化采用的是256灰度級,這類冗余稱為視覺冗余。
圖像數(shù)據(jù)壓縮算法評價壓縮算法的指標(biāo)
壓縮算法分類行程長度編碼
哈夫曼編碼算術(shù)編碼
詞典編碼預(yù)測編碼
變換編碼
模型法編碼
混合編碼
評價壓縮算法的指標(biāo)
壓縮比指壓縮編碼后的數(shù)據(jù)量與原始數(shù)據(jù)大小的比值;
算法的復(fù)雜性和運(yùn)算速度;
失真度。
壓縮比并不是一個絕對的指標(biāo)將16M色的真彩圖像(圖A)轉(zhuǎn)變?yōu)?56色(圖B),數(shù)據(jù)量減少了約3倍,壓縮比為1:3.當(dāng)然這時產(chǎn)生了色彩失真,但如果選擇原圖的色彩范圍定義調(diào)色板,色彩失真較小,人眼一般都還能接受.如果把圖像深度從8位再壓縮到4位,即從256色再壓到16色(圖C),雖然數(shù)據(jù)量只減少了2倍,壓縮比為1:2,但這時的人眼所看到的色彩失真比第一次大得多,效果很差圖像效果
圖像類型圖A真彩色圖像圖B256色圖像圖C16色圖像壓縮比8/24=1/34/24=1/6壓縮算法分類根據(jù)對編碼數(shù)據(jù)進(jìn)行解碼后與編碼前的數(shù)據(jù)是否一致可以把數(shù)據(jù)編碼方法分為兩類:
無損編碼。解碼后的數(shù)據(jù)與編碼前的數(shù)據(jù)完全一致,沒有任何失真。
有損編碼。解碼后的數(shù)據(jù)與原始數(shù)據(jù)有一定程度的偏差或失真,但一般不影響聽覺或視覺效果。
行程長度編碼
把一系列的重復(fù)值(例如圖像象素的灰度值)用一個單獨的值再加上一個計數(shù)值來取代。
比如有這樣一個字母序列aabbbccccccccdddddd它的行程長度編碼就是2a3b8c6d。
很多位圖文件格式都用行程長度編碼,例如TIFF,PCX。行程長度編碼例有一線狀圖像,其灰度隨長度坐標(biāo)的關(guān)系如圖3.1所示。描述這個一維圖像可以用順序的七個3bit的二進(jìn)制數(shù)表示:011,011,011,011,101,101,101,共21比特。
如果用行程編碼方法對其編碼,其編碼就變成了100,011;011,101,共用了12比特,比前一種編碼節(jié)約了9個比特。
香農(nóng)-范諾算法編碼器信源(消息集)編碼輸出集X={x1,…,xn}Z={z1,…,zn}符號集Am={a1,…,am}熵(Entropy)的概念熵是信息量的度量方法,它表示某一事件出現(xiàn)的消息越多,事件發(fā)生的可能性就越小,數(shù)學(xué)上就是概率越小。某個事件的信息量用表示,其中Pi為第i個事件的概率,0<Pi1。哈夫曼編碼編碼步驟如下:統(tǒng)計信源符號出現(xiàn)的概率;將信源符號按概率遞減順序排列;
把兩個最小的概率值加起來,作為一個新組合符號的概率;重復(fù)步驟(2)、(3),直到概率和達(dá)到1為止;在每次合并信源時,將合并的信源分別標(biāo)記“1”和“0”(例如,概率小的標(biāo)記為“1”,概率大的標(biāo)記為“0”);尋找從每一信源符號到概率為1的路徑,記錄下路徑上的“1”和“0”;對每一符號寫出“1”和“0”序列;
哈夫曼編碼的例子考慮信源進(jìn)行哈夫曼編碼的過程如下:
哈夫曼編碼的不足
它必須精確地統(tǒng)計出原始文件中每個值的出現(xiàn)頻率,如果沒有這個精確統(tǒng)計,壓縮的效果就會大打折扣,甚至根本達(dá)不到壓縮的效果。因此哈夫曼編碼通常要經(jīng)過兩遍操作,第一遍進(jìn)行統(tǒng)計,第二遍產(chǎn)生編碼,所以編碼的過程是比較慢的。另外由于各種長度的編碼的譯碼過程也比較復(fù)雜,因此解壓縮的過程也比較慢。它對于位的增刪比較敏感。
算術(shù)編碼算術(shù)編碼在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG,JBIG)中扮演了重要的角色。在算術(shù)編碼中,消息用0到1之間的實數(shù)進(jìn)行編碼,算術(shù)編碼用到兩個基本的參數(shù):符號的概率和它的編碼間隔。信源符號的概率決定壓縮編碼的效率,也決定編碼過程中信源符號的間隔,而這些間隔包含在0到1之間。編碼過程中的間隔決定了符號壓縮后的輸出。算法舉例假設(shè)信源符號為{00,01,10,11},這些符號的概率分別為{0.1,0.4,0.2,0.3},根據(jù)這些概率可把間隔[0,1)分成4個子間隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),二進(jìn)制消息序列的輸入為:10001100101101算術(shù)編碼算術(shù)編碼需要注意的幾個問題1.由于實際計算機(jī)精度不可能無限長,運(yùn)算中溢出是明顯的問題,但多數(shù)機(jī)器都有16位、32位或者64位的精度,因此可使用比例縮放法解決。2.算術(shù)編碼器對消息只產(chǎn)生一個碼字,這個碼字是在[0,1)中的一個實數(shù),因此譯碼器在接受到表示這個實數(shù)的所有位之前不能進(jìn)行譯碼。3.算術(shù)編碼也是一種對錯誤很敏感的編碼方法,如果有一位發(fā)生錯誤就會導(dǎo)致整個消息譯錯。算術(shù)編碼可以是靜態(tài)的或者自適應(yīng)的。在靜態(tài)算術(shù)編碼中,信源符號的概率是固定的。在自適應(yīng)算術(shù)編碼中,信源符號的概率根據(jù)編碼時符號出現(xiàn)的頻繁程度動態(tài)地進(jìn)行修改,在編碼期間估算信源符號概率的過程叫做建模。需要開發(fā)動態(tài)算術(shù)編碼的原因是因為事先知道精確的信源概率是很難的,而且是不切實際的。當(dāng)壓縮消息時,我們不能期待一個算術(shù)編碼器獲得最大的效率,所能做的最有效方法是在編碼過程中估算概率。因此動態(tài)建模成為確定編碼器壓縮效率的關(guān)鍵。詞典編碼詞典編碼的思想第一類詞典法的想法是企圖查找正在壓縮的字符序列是否在以前輸入的數(shù)據(jù)中出現(xiàn)過,然后用已經(jīng)出現(xiàn)過的字符串替代重復(fù)的部分,它的輸出僅僅是指向早期出現(xiàn)過的字符串的“指針”。詞典編碼LZ77算法算法中用到的幾個術(shù)語:1.輸入數(shù)據(jù)流(inputstream):要被壓縮的字符序列。2.字符(character):輸入數(shù)據(jù)流中的基本單元。3.編碼位置(codingposition):輸入數(shù)據(jù)流中當(dāng)前要編碼的字符位置,指前向緩沖存儲器中的開始字符。4.前向緩沖存儲器(Lookaheadbuffer):存放從編碼位置到輸入數(shù)據(jù)流結(jié)束的字符序列的存儲器。5.窗口(window):指包含W個字符的窗口,字符是從編碼位置開始向后數(shù)也就是最后處理的字符數(shù)。6.指針(pointer):指向窗口中的匹配串且含長度的指針。詞典編碼LZ77編碼算法的核心是查找從前向緩沖存儲器開始的最長的匹配串。編碼算法的具體執(zhí)行步驟如下:1.把編碼位置設(shè)置到輸入數(shù)據(jù)流的開始位置。2.查找窗口中最長的匹配串。3.以“(Pointer,Length)Characters”的格式輸出,其中Pointer是指向窗口中匹配串的指針,Length表示匹配字符的長度,Characters是前向緩沖存儲器中的不匹配的第1個字符。4.如果前向緩沖存儲器不是空的,則把編碼位置和窗口向前移(Length+1)個字符,然后返回到步驟2。詞典編碼-LZ77算法詞典編碼-LZSS算法LZ77通過輸出真實字符解決了在窗口中出現(xiàn)沒有匹配串的問題,但這個解決方案包含有冗余信息。冗余信息表現(xiàn)在兩個方面,一是空指針,二是編碼器可能輸出額外的字符,這種字符是指可能包含在下一個匹配串中的字符。
LZSS算法以比較有效的方法解決這個問題,它的思想是如果匹配串的長度比指針本身的長度長就輸出指針,否則就輸出真實字符。詞典編碼-LZSS算法編碼算法的具體執(zhí)行步驟如下:1.把編碼位置置于輸入數(shù)據(jù)流的開始位置。2.在前向緩沖存儲器中查找與窗口中最長的匹配串①Pointer:=匹配串指針。②Length:=匹配串長度。3.判斷匹配串長度是否大于等于最小匹配串長度(LengthMIN_LENGTH),
如果“是”:輸出指針,然后把編碼位置向前移動Length個字符。如果“否”:輸出前向緩沖存儲器中的第1個字符,然后把編碼位置向前移動一個字符。4.如果前向緩沖存儲器不是空的,就返回到步驟2。詞典編碼-LZSS算法詞典編碼-LZSS算法在相同的計算機(jī)環(huán)境下,LZSS算法比LZ77可獲得比較高的壓縮比,而譯碼同樣簡單。這也就是為什么這種算法成為開發(fā)新算法的基礎(chǔ),許多后來開發(fā)的文檔壓縮程序都使用了LZSS的思想。例如,PKZip,ARJ,LHArc和ZOO等等,其差別僅僅是指針的長短和窗口的大小等有所不同。LZSS同樣可以和熵編碼聯(lián)合使用,例如ARJ就與霍夫曼編碼聯(lián)用,而PKZip則與Shannon-Fano聯(lián)用,它的后續(xù)版本也采用霍夫曼編碼。第二類詞典編碼第二類算法的想法是企圖從輸入的數(shù)據(jù)中創(chuàng)建一個“短語詞典(dictionaryofthephrases)”,這種短語可以是任意字符的組合。編碼數(shù)據(jù)過程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的“短語”時,編碼器就輸出這個詞典中的短語的“索引號”,而不是短語本身。LZ78算法LZ78的編碼思想是不斷地從字符流中提取新的綴-符串(String),通俗地理解為新“詞條”,然后用“代號”也就是碼字(Codeword)表示這個“詞條”。這樣一來,對字符流的編碼就變成了用碼字(Codeword)去替換字符流(Charstream),生成碼字流(Codestream),從而達(dá)到壓縮數(shù)據(jù)的目的。LZ78編碼器的輸出是碼字-字符(W,C)對,每次輸出一對到碼字流中,與碼字W相對應(yīng)的綴-符串(String)用字符C進(jìn)行擴(kuò)展生成新的綴-符串(String),然后添加到詞典中。LZ78算法與LZ77相比,LZ78的最大優(yōu)點是在每個編碼步驟中減少了綴-符串(String)比較的數(shù)目,而壓縮率與LZ77類似。預(yù)測編碼一般在圖像中局部區(qū)域的象素是高度相關(guān)的,因此可以用先前象素的有關(guān)灰度知識來對當(dāng)前象素的灰度進(jìn)行預(yù)計,這就是預(yù)測。預(yù)測編碼可分為線性預(yù)測編碼和非線性預(yù)測編碼。前者常被稱為差分脈沖編碼調(diào)制,即DPCM(DifferentialPulseCodeModulation)。DPCM的原理框圖
DPCM編碼示例DPCM系統(tǒng)如圖所示,預(yù)測器的預(yù)測值為前一個樣值(圖中D表示單位延遲)。假設(shè)輸入信號已經(jīng)量化,差值不再進(jìn)行量化。若DPCM系統(tǒng)的輸入為{0,1,2,1,1,2,3,3,4,4,…},則編碼過程如下:變換編碼
變換編碼就是將時域信號(如圖像光強(qiáng)矩陣)變換到頻域信號(系數(shù)空間)上進(jìn)行處理的方法。在空間上具有強(qiáng)相關(guān)的信號,反映在頻域上是某些特定的區(qū)域內(nèi)能量常常被集中在一起,或者是系數(shù)矩陣的分布具有某些規(guī)律。我們可以利用這些規(guī)律在頻域上減少量化比特數(shù),達(dá)到壓縮的目的。典型的變換編碼和解碼過程
圖中的變換一般采用正交變換,這是由于正交變換的變換矩陣是可逆的且逆矩陣與轉(zhuǎn)置矩陣相等,這就使解碼運(yùn)算是有解的且運(yùn)算方便,因此運(yùn)算矩陣總是選用正交變換來做。模型法編碼
模型編碼則是利用計算機(jī)視覺和計算機(jī)圖形學(xué)的知識對圖像信號的分析與合成。模型編碼的關(guān)鍵是對特定的圖像建立模型,并根據(jù)這個模型確定圖像中景物的特征參數(shù),如運(yùn)動參數(shù)、形狀參數(shù)等。解碼時則根據(jù)參數(shù)和已知模型用圖像合成技術(shù)重建圖像。模型編碼引入的誤差主要是人眼視覺不太敏感的幾何失真,因此重建圖像非常自然和逼真?;旌暇幋a
以兩種或兩種以上的方法對圖像進(jìn)行編碼稱為混合編碼,本章后面介紹的JPEG和MPEG都屬于混合編碼。常用圖形、圖像文件的格式矢量圖和位映像圖圖像文件的一般結(jié)構(gòu)BMP文件格式GIF文件格式TIF文件格式PNG文件格式
圖像文件的一般結(jié)構(gòu)矢量圖和位映像圖矢量圖是用數(shù)學(xué)方法描述的一系列點、線、弧和其它幾何形狀,因此存放這種圖使用的格式稱為矢量圖格式,存儲的數(shù)據(jù)主要是繪制圖形的數(shù)學(xué)描述;
位映像圖(bitmappedgraphics)也稱光柵圖(rastergraphics),這種圖就像電視圖像一樣,由像點組成的,因此存放這種圖使用的格式稱為位映像圖格式,經(jīng)常簡稱為位圖格式,存儲的數(shù)據(jù)是描述像素的數(shù)值。
矢量圖矢量圖是用一系列計算機(jī)指令來表示一幅圖,如畫點、畫線、畫曲線、畫圓、畫矩形等。這種方法實際上是數(shù)學(xué)方法來描述一幅圖,然后變成許多的數(shù)學(xué)表達(dá)式,再編程,用計算機(jī)語言來表達(dá)。在計算顯示圖時,也往往能看到畫圖的過程。繪制和顯示這種圖的軟件通常稱為繪圖程序(drawprograms)。
位圖位圖法與矢量圖法很不相同。它是把一幅彩色圖分成許多的像素,每個像素用若干個二進(jìn)制位來指定該像素的顏色、亮度和屬性。因此一幅圖由許多描述每個像素的數(shù)據(jù)組成,這些數(shù)據(jù)通常稱為圖像數(shù)據(jù),而這些數(shù)據(jù)作為一個文件來存儲,這種文件又稱為圖像文件。如要畫點位圖,或者編輯點位圖,則用類似于繪制矢量圖的軟件工具,這種軟件稱為畫圖程序(paintprograms)。
位圖和矢量圖的區(qū)別
BMP文件格式
圖文件(Bitmap-File,BMP)格式是Windows采用的圖像文件存儲格式,在Windows環(huán)境下運(yùn)行的所有圖像處理軟件都支持這種格式。
BMP圖像文件由以下三部分組成:位圖文件頭(BITMAPHEADER)數(shù)據(jù)結(jié)構(gòu)、位圖信息(BITMAPINFO)數(shù)據(jù)結(jié)構(gòu)和位圖陣列。位圖文件頭
位圖文件頭數(shù)據(jù)結(jié)構(gòu)包含BMP圖像文件的類型、顯示內(nèi)容等信息。它的數(shù)據(jù)結(jié)構(gòu)如下:typedefstruct{intbfType;/*always"BM"*/longbfSize;/*filesize*/intbfReserved1;intbfReserved2;longbfOffBits;/*imagedataoffset*/}BITMAPFILEHEADER;典型的BMP圖像文件
在Windows環(huán)境中,它的名字是SEAWATER.BMP。GIF文件格式GIF(GraphicsInterchangeFormat)是CompuServe公司開發(fā)的圖像文件存儲格式,稱為圖形交換格式。
1987年開發(fā)的GIF文件格式版本號是GIF87a,1989年進(jìn)行了擴(kuò)充,擴(kuò)充后的版本號定義為GIF89a。
一個GIF文件由表示圖形/圖像的數(shù)據(jù)塊、數(shù)據(jù)子塊以及顯示圖形/圖像的控制信息塊組成。GIF文件格式采用了LZW(Lempel-ZivWalch)壓縮算法來存儲圖像數(shù)據(jù)。GIF文件格式可在一個文件中存放多幅彩色圖形/圖像。
GIF文件的典型結(jié)構(gòu)
TIF文件格式TIF是TIFF(TaggedImageFormatFile)文件的擴(kuò)展名,該格式由美國AldusDeveloper’sDesk和MicrosoftWindowsMarketingGroup制訂。TIFF支持任意大小的圖像,從單色的二值圖像到24位的真彩色圖像;支持灰度圖像,也支持EGA/VGA上最常見的調(diào)色板式圖像。TIF格式的優(yōu)點主要是適合于廣泛的應(yīng)用程序,它與計算機(jī)體系結(jié)構(gòu)、操作系統(tǒng)和圖形處理的硬件無關(guān)。TIFF文件組成文件頭(8字節(jié))參數(shù)指針表參數(shù)數(shù)據(jù)表PNG文件格式
PNG是20世紀(jì)90年代中期開始開發(fā)的圖像文件存儲格式,其目的是企圖替代GIF和TIFF文件格式,同時增加一些GIF文件格式所不具備的特性。PNG使用從LZ77派生的無損數(shù)據(jù)壓縮算法。PNG的優(yōu)點
兼有GIF和JPEG的色彩模式PNG能把圖像文件壓縮到極限以利于網(wǎng)絡(luò)傳輸,但又能保留所有與圖像品質(zhì)有關(guān)的信息的解決方案更優(yōu)化的傳輸顯示透明圖像在制作網(wǎng)頁圖像的時候很有用PNG可以讓你在Macintosh上制作的圖像與在Windows上所顯示的圖像完全相同PNG圖像的缺點
PNG不支持動畫的應(yīng)用因為PNG采用的是無損壓縮方式,盡管相同圖像質(zhì)量的PNG圖像文件比JPEG圖像文件小,但是JPEG可以適當(dāng)?shù)貭奚嬅嫫焚|(zhì)而取得比PNG更小的文件尺寸PNG不支持CMYK的模式靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG
JPEG2000
JPEGJPEG是國際標(biāo)準(zhǔn)化組織(ISO)和國際電報電話咨詢委員會(CCITT)關(guān)于靜止圖像編碼的聯(lián)合專家組(JointPhotographicExpertsGroup)名稱的縮寫。該標(biāo)準(zhǔn)可用于自然景象或任何連續(xù)色調(diào)圖像的數(shù)字?jǐn)?shù)據(jù)的壓縮編碼和解碼。對于數(shù)字化精度為每種彩色分量每個樣點4至16比特的數(shù)字圖像有良好的壓縮效果,但不適用于二值圖像。JPEG標(biāo)準(zhǔn)綜合了多年來圖像壓縮編碼的研究成果,是一種集大成的算法。該標(biāo)準(zhǔn)規(guī)定了兩種工作方式,即順序方式和漸進(jìn)方式;還規(guī)定了三種級別的編碼算法,即基本系統(tǒng)(Baselinesystem)、擴(kuò)展系統(tǒng)(Extendedsystem)和無失真系統(tǒng)(Losslesscoding)。JPEG能達(dá)到的壓縮效果
采用JPEG算法所能達(dá)到的壓縮效果,與被壓縮圖像的特性有關(guān)。對于在開發(fā)和測試本算法標(biāo)準(zhǔn)時所用的那些內(nèi)容是彩色自然景物和人像的測試圖片,壓縮到0.15比特/像素時,圖像可識別;0.25比特/像素時,解碼后的圖像可評價為“有用(usefulimage)”;約0.75比特/像素時,被認(rèn)為是“極佳(verygood)”;大約1.5比特/像素時基本上與原圖像無法區(qū)別。用無失真算法對這些測試圖片進(jìn)行壓縮編碼,大致可以得到2:1的壓縮比。JPEG算法的不同壓縮比及其壓縮效果實例順序方式圖像被分割為成行成列的四方小塊,編碼時由左而右,由上而下地逐行逐列對每個小塊進(jìn)行運(yùn)算,直到所有小塊都被編碼為止。每個小塊的編碼都是一次完成。解碼時按編碼順序逐塊解碼,也是一次完成。漸進(jìn)方式整個圖像首先以一種低于最終質(zhì)量要求的質(zhì)量標(biāo)準(zhǔn)(如分辨率或數(shù)據(jù)精度)進(jìn)行編碼,完成后再以較上次高一級的質(zhì)量要求再進(jìn)行一次編碼,但僅傳送為改善質(zhì)量所需增加的那部分信息。這種過程可以重復(fù)若干次直至達(dá)到所需的最終質(zhì)量要求。每個子過程中的編碼則還是順序方式的。實現(xiàn)方式
譜選擇法逐次逼近階梯方式基本系統(tǒng)以離散余弦變換為核心,采用順序工作方式,適用于一般精度(每種分量每個樣點8比特)的圖像,有良好的壓縮效果,壓縮比可調(diào)。標(biāo)準(zhǔn)規(guī)定,每個JPEG靜止圖像壓縮編解碼器都必須具有實現(xiàn)基本系統(tǒng)的功能?;鞠到y(tǒng)算法
通過離散余弦變換減少圖像數(shù)據(jù)的相關(guān)性;利用人眼視覺特性對系數(shù)進(jìn)行自適應(yīng)量化;對每個子塊量化后的系數(shù)矩陣進(jìn)行Z形掃描,將系數(shù)矩陣變換成符號序列;用哈夫曼變長碼對符號進(jìn)行熵編碼?;鞠到y(tǒng)流程
Z形掃描擴(kuò)展系統(tǒng)將基本系統(tǒng)在若干方面增強(qiáng)并減少一些限制條件后就稱為擴(kuò)展系統(tǒng)。擴(kuò)展系統(tǒng)可對精度范圍4~12bit的圖像進(jìn)行處理,可采用漸進(jìn)方式,可選用哈夫曼碼或算術(shù)碼對離散余弦變換產(chǎn)生的統(tǒng)計事件進(jìn)行壓縮編碼。無失真系統(tǒng)無失真系統(tǒng)采用二維DPCM技術(shù),實現(xiàn)無失真壓縮,當(dāng)然壓縮比不可能很高。無失真編碼器源圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)預(yù)測器熵編碼器表說明DPCM預(yù)測編碼框圖JPEG2000JPEG2000的核心JPEG2000的優(yōu)勢JPEG2000的應(yīng)用
JPEG2000的核心放棄了JPEG所采用的以離散余弦變換算法(DCT)為主的區(qū)塊編碼方式,而改用以離散小波變換算法(DWT)為主的多解析編碼方式。JPEG2000還將彩色靜態(tài)畫面采用的JPEG編碼方式、2值圖像采用的JBIG(JointBinaryImageGroup)編碼方式及低壓縮率采用JPEGLS統(tǒng)一起來,成為對應(yīng)各種圖像的通用編碼方式。DCT和DWT變換圖(a)采用DCT變換得到的圖像圖(b)采用DWT變換得到的圖像JPEG2000的優(yōu)勢高壓縮率無損壓縮漸進(jìn)傳輸感興趣區(qū)域壓縮JPEG2000的應(yīng)用目前,支持JPEG2000的軟件已經(jīng)出現(xiàn),如LuraWaveSmartCompressFreewareforWindows為ACDSee3.0提供JPEG2000LWF格式的外掛插件,這樣只要安置了這個插件就可以觀看和制作采用JPEG2000編碼的LWF格式文件。在不久的將來,JPEG2000無論是在傳統(tǒng)的JPEG市場(如數(shù)碼相機(jī)、掃描儀等)還是在新興應(yīng)用領(lǐng)域(如網(wǎng)路傳輸、無線通訊、醫(yī)療影像等)都將大有用武之地。動態(tài)圖像壓縮標(biāo)準(zhǔn)動態(tài)圖像的分類動態(tài)圖像的特點運(yùn)動圖象壓縮技術(shù)的發(fā)展MPEG標(biāo)準(zhǔn)概述MPEG-1標(biāo)準(zhǔn)MPEG-2標(biāo)準(zhǔn)動態(tài)圖像的分類動態(tài)圖像一般可分為:視頻和動畫。視頻:每一幀圖像是實時獲取的自然景物的真實圖像。和音頻一樣,在多媒體計算機(jī)中使用的是數(shù)字視頻。數(shù)字視頻的應(yīng)用于VCD/DVD、數(shù)字電視、遠(yuǎn)程教學(xué)及視頻會議等。動畫:每一幀圖像是由計算機(jī)或人工制作的具有真實感的圖像。若畫面僅為二維透視效果時,則為二維動畫;若畫面具有空間效果時,則為三維動畫;若加上真實的光照效果和質(zhì)感,則為三維真實感動畫。動態(tài)圖像的特點連續(xù)性在時間軸上以幀為運(yùn)動單位,屬于離散型媒體類。動態(tài)圖像比靜態(tài)圖像表示的范圍廣、表現(xiàn)力強(qiáng)。時延性動態(tài)圖像數(shù)據(jù)量大,必須被壓縮后才能在計算機(jī)中應(yīng)用。計算機(jī)的容量和速度直接影響圖像質(zhì)量。相關(guān)性幀之間的關(guān)聯(lián)是動態(tài)圖像連續(xù)動作形成的基礎(chǔ),也是進(jìn)行壓縮和其他處理的條件。但對錯誤的敏感性較低。
運(yùn)動圖象壓縮技術(shù)的發(fā)展第一代:被稱為“運(yùn)動JPEG技術(shù)”。它是利用連續(xù)保存獨立的JPEG圖象來實現(xiàn)的運(yùn)動圖象技術(shù),JPEG的壓縮率為2.5位/像素到0.6位/像素之間。目前大量應(yīng)用于廣播級的攝像機(jī)中。第二代:MPEG技術(shù)。有MPEG-1、MPEG-2和新的MPEG-4及MPEG-7等。壓縮率為0.8位/像素到0.4位/像素之間,典型的VCD應(yīng)用是0.6位/像素,所以其位率為:0.6位/像素*(352*240像素)*30幀/s=1520640位/s=1.5Mb/s。第三代:目前國內(nèi)有人開發(fā)出了新的圖像壓縮技術(shù),其壓縮率為0.15位/像素到0.01位/像素之間,已經(jīng)突破MPEG的極限。MPEG標(biāo)準(zhǔn)概述MPEG是運(yùn)動圖像專家組(MotionPictureExpertsGroup)的縮寫,是國際標(biāo)準(zhǔn)化組織中IEC/JTC1/SC2/WG11的一個小組。MPEG下分三個小組:視頻組(MPEG-Video)的任務(wù)是研究壓縮傳輸速度上限為1.5Mbps的視頻信號;音頻組(MPEG-Audio)的任務(wù)是研究壓縮每信道64、128和192Kbps的數(shù)字音頻信號;系統(tǒng)組(MPEG-System)則解決多道壓縮視頻、音頻位流的同步及合成問題。
MPEG委員會的工作始于1988年,1990年制訂出標(biāo)準(zhǔn)草案。兩年中MPEG工作參加單位由15家發(fā)展到150家。MPEG工作一開始就兼顧JPEG標(biāo)準(zhǔn),CCITT的H.261標(biāo)準(zhǔn),支持這兩個標(biāo)準(zhǔn)的優(yōu)秀成果。
MPEG-1標(biāo)準(zhǔn)
MPEG-1標(biāo)準(zhǔn)叫作“運(yùn)動圖像和伴隨聲音的編碼—用于速率約在1.5Mb/s以下的數(shù)字存儲媒體”,主要用于多媒體存儲與再現(xiàn),如VCD等。
MPEG-1采用CIF視頻格式(分辨率為352×288),幀速率為25幀/秒或30幀/秒,碼率為1.5Mb/s(其中視頻約1.2Mb/s,音頻約0.3Mb/s)。
MPEG-1將視頻圖像序列劃分為I幀、P幀和B幀
標(biāo)準(zhǔn)草案于1991年11月完成,1992年11月正式通過。
MPEG-1由五個部分組成:MPEG-1Systems,規(guī)定電視圖像數(shù)據(jù)、聲音數(shù)據(jù)及其它相關(guān)數(shù)據(jù)的同步
MPEG-1Video,規(guī)定視頻數(shù)據(jù)的編碼和解碼,
MPEG-1Audio,規(guī)定音頻數(shù)據(jù)的編碼和解碼
MPEG-1Conformancetesting,詳細(xì)說明如何測試比特數(shù)據(jù)流(bitstreams)和解碼器是否滿足MPEG-1前3個部分(Part1,2和3)中所規(guī)定的要求
MPEG-1Softwaresimulation
MPEG視頻壓縮算法
MPEG數(shù)據(jù)流采用分層結(jié)構(gòu)(如下圖所示)
圖MPEG數(shù)據(jù)流的分層結(jié)構(gòu)為滿足高壓縮比和隨機(jī)訪問兩方面要求,MPEG采取了預(yù)測和插值兩種幀間編碼技術(shù)。
MPEG視頻壓縮算法的兩個基礎(chǔ)是:
基于16×16塊的運(yùn)動補(bǔ)償?shù)目s減時間冗余
基于變換域(DCT)的縮減空間冗余技術(shù)
縮減時間冗余度
MPEG考慮了三種畫面:內(nèi)幀(I)、預(yù)測幀(P)和內(nèi)插幀(B)。這樣做的原因一是考慮隨機(jī)訪問視頻存儲的重要性,二是運(yùn)動補(bǔ)償插值可顯著降低位速率。MPEG視頻幀編碼及關(guān)系運(yùn)動補(bǔ)償預(yù)測是應(yīng)用最廣泛的降低時間冗余度的方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年天津機(jī)電職業(yè)技術(shù)學(xué)院單招綜合素質(zhì)筆試備考試題含詳細(xì)答案解析
- 2026年常州信息職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試模擬試題及答案詳細(xì)解析
- 2026年湖北輕工職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試模擬試題含詳細(xì)答案解析
- 2026年池州職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試備考試題及答案詳細(xì)解析
- 2026年云南新興職業(yè)學(xué)院單招綜合素質(zhì)考試備考試題含詳細(xì)答案解析
- 2026年第一批黃山市屯溪區(qū)國有投資集團(tuán)及權(quán)屬子公司公開招聘工作人員考試重點試題及答案解析
- 2026年湖北三峽職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試備考題庫及答案詳細(xì)解析
- 2026年遼寧醫(yī)藥職業(yè)學(xué)院單招綜合素質(zhì)考試模擬試題含詳細(xì)答案解析
- 2026年邯鄲科技職業(yè)學(xué)院單招綜合素質(zhì)考試模擬試題含詳細(xì)答案解析
- 2026年濟(jì)寧職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試備考題庫及答案詳細(xì)解析
- 四川能投綜合能源有限責(zé)任公司員工公開招聘筆試備考試題及答案解析
- 2025福建省安全員C證考試(專職安全員)題庫附答案
- 中國話語體系中的國際傳播話語創(chuàng)新策略分析課題申報書
- 高標(biāo)準(zhǔn)基本農(nóng)田建設(shè)項目監(jiān)理工作總結(jié)報告
- 消防知識培訓(xùn)宣傳課件
- 病理科醫(yī)療安全風(fēng)險培訓(xùn)課件
- 2025-2026學(xué)年通-用版英語 高一上學(xué)期期末試題(含聽力音頻答案)
- 高考英語3500詞分類整合記憶手冊(含完整中文釋義)
- 2025年新疆公務(wù)員《行政職業(yè)能力測驗》試題及答案
- 中醫(yī)護(hù)理案例分享
- 骨密度檢測的臨床意義
評論
0/150
提交評論