多媒體通信之編碼_第1頁
多媒體通信之編碼_第2頁
多媒體通信之編碼_第3頁
多媒體通信之編碼_第4頁
多媒體通信之編碼_第5頁
已閱讀5頁,還剩86頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多媒體通信之編碼第一頁,共九十一頁,2022年,8月28日2第2章

數(shù)據(jù)編碼

數(shù)據(jù)壓縮概述

有損編碼無損編碼赫夫曼編碼

算術(shù)編碼

行程長度編碼詞典編碼

變換編碼

基于模型編碼

分形編碼

其他壓縮編碼

差錯(cuò)檢測和校正編碼

第二頁,共九十一頁,2022年,8月28日3數(shù)據(jù)編碼數(shù)據(jù)編碼包括:信源編碼信道編碼信源編碼:為了表示和/或壓縮從信號(hào)源產(chǎn)生出來的信號(hào)而進(jìn)行的編碼,主要解決有效性問題。信道編碼:為了使處理過的信號(hào)在傳輸過程中不出錯(cuò)或少出錯(cuò),以及即使出了錯(cuò)也能自動(dòng)檢錯(cuò)或盡量糾錯(cuò)而進(jìn)行的編碼,主要解決可靠性問題。第三頁,共九十一頁,2022年,8月28日42.1數(shù)據(jù)壓縮概述

多媒體數(shù)據(jù)的壓縮主要是對(duì)視頻數(shù)據(jù)和音頻數(shù)據(jù)的壓縮,二者使用的基本技術(shù)是相同的。

為什么要壓縮

數(shù)據(jù)的冗余性

壓縮和解壓縮過程壓縮評(píng)價(jià)和分類數(shù)據(jù)壓縮常常又稱為數(shù)據(jù)信源編碼,或簡稱為數(shù)據(jù)編碼。數(shù)據(jù)壓縮的逆過程稱為數(shù)據(jù)解壓縮,也稱為數(shù)據(jù)信源解碼,或簡稱為數(shù)據(jù)解碼。第四頁,共九十一頁,2022年,8月28日5為什么要壓縮

多媒體數(shù)據(jù)壓縮的目的:為了最有效地利用有限資源(例如存儲(chǔ)和傳輸資源)。一般來說,壓縮是信源信號(hào)(采樣和量化后數(shù)字信號(hào)),如語音、靜止圖像、音樂或電視等的有效的數(shù)字化表示。壓縮的任務(wù):保持信源信號(hào)在一個(gè)可以接受的狀況的前提下把需要的比特?cái)?shù)減到最少程度,以減少存儲(chǔ)、處理和傳輸?shù)某杀尽?/p>

第五頁,共九十一頁,2022年,8月28日6信源存儲(chǔ)量電話(200Hz至3.4kHz)8000樣本/秒×12比特/樣本=96kbps寬帶語音(50Hz至7kHz)16000樣本/秒×14比特/樣本=224kbps寬帶音頻(20Hz至20kHz)44100樣本/秒×2通道×16比特/樣本=1.412Mbps圖像512×512像素彩色圖像×24比特/像素≈6.3兆比特/圖像視頻640×480像素彩色圖像×24比特/像素×30圖像/秒≈221Mbps高清晰度電視1280×720像素彩色圖像×60圖像/秒×24比特/像素≈1.3Gbps未壓縮信源的大致比特率第六頁,共九十一頁,2022年,8月28日7數(shù)據(jù)的冗余性

數(shù)據(jù)壓縮的前提:基本原始信源的數(shù)據(jù)存在著很大的冗余度(Redundant)??臻g冗余時(shí)間冗余信息熵冗余結(jié)構(gòu)冗余知識(shí)冗余認(rèn)知(視覺聽覺)冗余其他冗余數(shù)據(jù)壓縮就是去掉信號(hào)數(shù)據(jù)的冗余性。第七頁,共九十一頁,2022年,8月28日8數(shù)據(jù)的冗余性

空間冗余在同一幅圖像中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面顏色分布是有序的而不是完全雜亂無章的)的表面物理特征具有相關(guān)性,這些相關(guān)性在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。

第八頁,共九十一頁,2022年,8月28日9數(shù)據(jù)的冗余性時(shí)間冗余

圖像序列中的兩幅相鄰的圖像,后一幅圖像與前一幅圖像之間有較大的相關(guān)性,這反映為時(shí)間冗余。同理,在言語中,由于人在說話時(shí)發(fā)音的音頻是一連續(xù)的漸變過程,而不是一個(gè)完全在時(shí)間上獨(dú)立的過程,因而存在時(shí)間冗余。

第九頁,共九十一頁,2022年,8月28日10數(shù)據(jù)的冗余性信息熵冗余(編碼冗余)信息量I(xi)的概率平均值叫做信息熵,或簡稱熵。

熵是信息量的度量方法,定義了觀察到單個(gè)信源符號(hào)輸出時(shí)獲得的平均信息量。第十頁,共九十一頁,2022年,8月28日信息熵冗余信息熵冗余:信源編碼時(shí),當(dāng)分配給第i個(gè)碼元類的比特?cái)?shù)b(yi)=-logpi,才能使編碼后單位數(shù)據(jù)量等于其信源熵,即達(dá)到其壓縮極限。但實(shí)際中各碼元類的先驗(yàn)概率很難預(yù)知,比特分配不能達(dá)到最佳。實(shí)際單位數(shù)據(jù)量d>H(S),即存在信息冗余熵。信息論認(rèn)為:若信源編碼的熵大于信源的實(shí)際熵,該信源中一定存在冗余度。11第十一頁,共九十一頁,2022年,8月28日12數(shù)據(jù)的冗余性結(jié)構(gòu)冗余

有些圖像從大的區(qū)域上看存在著非常強(qiáng)的紋理結(jié)構(gòu),例如布紋圖像和草席圖像,我們說它們?cè)诮Y(jié)構(gòu)上存在冗余。

知識(shí)冗余有許多圖像的理解與某些基礎(chǔ)知識(shí)有相當(dāng)大的相關(guān)性。這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到,我們稱此類冗余為知識(shí)冗余。

第十二頁,共九十一頁,2022年,8月28日13數(shù)據(jù)的冗余性認(rèn)知(視覺聽覺)冗余人類視覺系統(tǒng)對(duì)于圖像場的任何變化,并不是都能感知的。事實(shí)上人類視覺系統(tǒng)一般的分辨能力約為26灰度等級(jí),而一般圖像量化采用28灰度等級(jí),這類冗余我們稱為視覺冗余。對(duì)于聽覺,也存在類似的冗余。

其他冗余例如由圖像的空間非定常特性所帶來的冗余。

第十三頁,共九十一頁,2022年,8月28日14壓縮和解壓縮過程

數(shù)據(jù)壓縮就是去掉信號(hào)數(shù)據(jù)的冗余性。數(shù)據(jù)壓縮常常又稱為數(shù)據(jù)信源編碼,或簡稱為數(shù)據(jù)編碼。與此對(duì)應(yīng),數(shù)據(jù)壓縮的逆過程稱為數(shù)據(jù)解壓縮,也稱為數(shù)據(jù)信源解碼,或簡稱為數(shù)據(jù)解碼。

第十四頁,共九十一頁,2022年,8月28日15壓縮和解壓縮過程數(shù)據(jù)壓縮的典型操作包括預(yù)準(zhǔn)備、處理、量化和編碼等過程。第十五頁,共九十一頁,2022年,8月28日16壓縮和解壓縮過程解壓縮是壓縮的逆過程具體的編碼器和解碼器以不同的方法構(gòu)成在對(duì)稱應(yīng)用中(如對(duì)話應(yīng)用),編碼和解碼代價(jià)應(yīng)基本相同在非對(duì)稱應(yīng)用中,解碼過程比編碼過程耗費(fèi)的代價(jià)要小,這種技術(shù)用于以下情形:壓縮的過程僅一次,采樣的時(shí)間不限;解壓縮經(jīng)常用到并需要迅速完成。

第十六頁,共九十一頁,2022年,8月28日17壓縮評(píng)價(jià)和分類衡量數(shù)據(jù)壓縮技術(shù)的三個(gè)重要指標(biāo):壓縮比:要大。

恢復(fù)效果:要好,要盡可能地恢復(fù)原始數(shù)據(jù)。

壓縮算法:要簡單,壓縮、解壓速度快,盡可能地做到實(shí)時(shí)壓縮、解壓。第十七頁,共九十一頁,2022年,8月28日18壓縮評(píng)價(jià)和分類影響多媒體數(shù)據(jù)壓縮技術(shù)發(fā)展的因素:技術(shù)的使用目的面向存儲(chǔ)的技術(shù):要求實(shí)時(shí),非常看重壓縮能力面向傳輸?shù)募夹g(shù):編解碼算法實(shí)現(xiàn)的實(shí)時(shí)性和成本卻是非常敏感的問題。壓縮算法的壓縮能力、實(shí)現(xiàn)復(fù)雜性與成本等方面進(jìn)行平衡與折中數(shù)據(jù)模型數(shù)據(jù)模型的選擇和參數(shù)優(yōu)化對(duì)于壓縮算法的進(jìn)步也十分關(guān)鍵第十八頁,共九十一頁,2022年,8月28日19壓縮分類(1)根據(jù)壓縮過程中是否減少了熵,目前常用的壓縮編碼方法可以分為兩大類:無損壓縮編碼(Losslesscompressioncoding)壓縮是可逆的,也稱為無失真壓縮、冗余壓縮或熵編碼一般用于文本、數(shù)據(jù)以及應(yīng)用軟件的壓縮壓縮比較低,如LZ編碼、行程長度編碼、赫夫曼編碼的壓縮比一般在2:1至5:1之間

有損壓縮編碼(Losscompressioncoding)壓縮是不可逆的,也稱為熵壓縮法允許一定程度的失真,壓縮比高第十九頁,共九十一頁,2022年,8月28日20常用壓縮編碼方法分類

第二十頁,共九十一頁,2022年,8月28日有損壓縮與無損壓縮21冗余壓縮法:熵壓縮法:第二十一頁,共九十一頁,2022年,8月28日22壓縮分類(2)根據(jù)碼詞長度是否相等分類定長碼(fixed-lengthcode)采用相同的位數(shù)(bit)對(duì)數(shù)據(jù)進(jìn)行編碼大多數(shù)存儲(chǔ)數(shù)字信息的編碼系統(tǒng)都采用定長碼變長碼(variable-lengthcode)采用不相同的位數(shù)(bit)對(duì)數(shù)據(jù)進(jìn)行編碼,以節(jié)省存儲(chǔ)空間示例:赫夫曼編碼第二十二頁,共九十一頁,2022年,8月28日232.2赫夫曼編碼

赫夫曼(Huffman)在1952年提出的一種編碼方法從下到上的編碼方法,屬于變長碼類。赫夫曼編碼可區(qū)別的不同碼字的生成是基于不同符號(hào)出現(xiàn)的不同概率。自含同步碼,在編碼之后的碼串中都不需要另外添加標(biāo)記符號(hào),即在譯碼時(shí)切分符號(hào)的特殊代碼?;谝环N稱為“編碼樹”(codingtree)的技術(shù)。得到廣泛應(yīng)用第二十三頁,共九十一頁,2022年,8月28日24赫夫曼編碼算法步驟(1)初始化,根據(jù)符號(hào)概率的大小按由大到小順序?qū)Ψ?hào)進(jìn)行排序。(2)把概率最小的兩個(gè)符號(hào)組成一個(gè)新符號(hào)(節(jié)點(diǎn)),即新符號(hào)的概率等于這兩個(gè)符號(hào)概率之和。(3)重復(fù)第2步,直到形成一個(gè)符號(hào)為止(樹),其概率最后等于1。(4)從編碼樹的根開始回溯到原始的符號(hào),并將每一下分枝賦值為1,上分枝賦值為0。

第二十四頁,共九十一頁,2022年,8月28日25赫夫曼編碼例

編碼結(jié)果:w(A)=100,w(B)=0,w(C)=111,w(D)=101,w(E)=110

p(C)=0.09p(E)=0.11p(D)=0.13p(A)=0.16p(B)=0.51p(CE)=0.20p(AD)=0.29p(ADCE)=0.49p(ADCEB)=1.0010010101第二十五頁,共九十一頁,2022年,8月28日26改進(jìn)的赫夫曼編碼算法自適應(yīng)赫夫曼編碼(AdaptiveHuffmancode)根據(jù)符號(hào)概率的變化動(dòng)態(tài)地改變碼字,產(chǎn)生的代碼比原始赫夫曼編碼更有效擴(kuò)展的赫夫曼編碼(ExtendedHuffmancode)允許編碼符號(hào)組而不是單個(gè)符號(hào)第二十六頁,共九十一頁,2022年,8月28日27采用赫夫曼編碼時(shí)的問題采用赫夫曼編碼時(shí)有兩個(gè)問題值得注意:差錯(cuò)傳播(errorpropagation):赫夫曼碼沒有錯(cuò)誤保護(hù)功能,在譯碼時(shí),如果碼串中沒有錯(cuò)誤,那么就能一個(gè)接一個(gè)地正確譯出代碼。但如果碼串中有錯(cuò)誤,那怕僅僅是1位出現(xiàn)錯(cuò)誤,也會(huì)引起一連串的錯(cuò)誤。赫夫曼碼是可變長度碼,因此很難隨意查找或調(diào)用壓縮文件中間的內(nèi)容,然后再譯碼,這就需要在存儲(chǔ)代碼之前加以考慮。

第二十七頁,共九十一頁,2022年,8月28日282.3算術(shù)編碼

基本原理:將編碼的消息表示成實(shí)數(shù)0和1之間的一個(gè)間隔(Interval),消息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位就越多。

兩個(gè)基本的參數(shù):符號(hào)的概率和它的編碼間隔。

第二十八頁,共九十一頁,2022年,8月28日算術(shù)編碼過程舉例

符號(hào)ABCD

概率0.10.40.20.3

初始編碼間隔[0,0.1)[0.1,0.5)[0.5,0.7)[0.7,1)信源符號(hào)、概率和初始編碼間隔

第二十九頁,共九十一頁,2022年,8月28日30編碼過程步驟輸入符號(hào)編碼間隔編碼判決1C[0.5,0.7)符號(hào)的間隔范圍[0.5,0.7)2A[0.5,0.52)[0.5,0.7)間隔的第一個(gè)1/103D[0.514,0.52)[0.5,0.52)間隔的最后3個(gè)1/104A[0.514,0.5146)[0.514,0.52)間隔的第一個(gè)1/105C[0.5143,0.51442)[0.514,0.5146)間隔的第五個(gè)1/10開始,二個(gè)1/106D[0.514384,0.51442)[0.5143,0.51442)間隔的最后3個(gè)1/107B[0.5143836,0.514402)[0.514384,0.51442)間隔的4個(gè)1/10,從第1個(gè)1/10開始8從[0.5143876,0.514402]中選擇一個(gè)數(shù)作為輸出:0.5143876第三十頁,共九十一頁,2022年,8月28日31譯碼過程步驟間隔譯碼符號(hào)譯碼判決1[0.5,0.7)C0.51439在間隔[0.5,0.7)2[0.5,0.52)A0.51439在間隔[0.5,0.7)的第1個(gè)1/103[0.514,0.52)D0.51439在間隔[0.5,0.52)的第7個(gè)1/104[0.514,0.5146)A0.51439在間隔[0.514,0.52)的第1個(gè)1/105[0.5143,0.51442)C0.51439在間隔[0.514,0.5146)的第5個(gè)1/106[0.514384,0.51442)D0.51439在間隔[0.5143,0.51442)的第7個(gè)1/107[0.51439,0.5143948)B0.51439在間隔[0.51439,0.5143948)的第1個(gè)1/108譯碼出來的消息:CADACDB第三十一頁,共九十一頁,2022年,8月28日32算術(shù)編碼需要注意的問題需要注意的問題:

溢出:由于實(shí)際的計(jì)算機(jī)的精度不可能無限長,運(yùn)算中容易出現(xiàn)溢出。但多數(shù)機(jī)器都有16、32或者64位的精度,因此這個(gè)問題可使用比例縮放方法解決。

算術(shù)編碼器對(duì)整個(gè)消息只產(chǎn)生一個(gè)碼字,這個(gè)碼字是在間隔[0,1)中的一個(gè)實(shí)數(shù),因此譯碼器在接受到表示這個(gè)實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。

對(duì)錯(cuò)誤很敏感:如果有一位發(fā)生錯(cuò)誤就會(huì)導(dǎo)致整個(gè)消息譯錯(cuò)。第三十二頁,共九十一頁,2022年,8月28日332.4行程長度編碼行程長度編碼(RLE,Run-lengthencoding):非常簡單基于簡單的編碼數(shù)據(jù)原則:重復(fù)的數(shù)據(jù)值序列(或稱為“流”)用一個(gè)重復(fù)次數(shù)和單個(gè)數(shù)據(jù)值來代替。這里,重復(fù)的值稱為一個(gè)“順串”或“連續(xù)”(run)。

控制符重復(fù)次數(shù)

被重復(fù)字符

三字節(jié)碼字格式示例:RTAAAASDEEEEE經(jīng)RLE壓縮后為:RT*4ASD*5E第三十三頁,共九十一頁,2022年,8月28日34RLE算法應(yīng)用RLE算法是BMP、PCX、TIFF等圖像壓縮技術(shù)的一部分,在PDF文件格式中也得到應(yīng)用。存在著不同的實(shí)現(xiàn)技術(shù)和文件格式。零抑制:文本里的空白(space)字符壓縮CompuServe格式:1比特圖像的壓縮MSWindows的格式:用于4比特和8比特彩色圖像PDF和TIFF等第三十四頁,共九十一頁,2022年,8月28日352.5詞典編碼

詞典編碼分類

LZ77算法

LZSS算法

LZ78算法

LZW算法

第三十五頁,共九十一頁,2022年,8月28日36詞典編碼分類

詞典編碼的根據(jù):數(shù)據(jù)本身包含有重復(fù)代碼序列。屬于通用編碼技術(shù)和無損壓縮技術(shù)詞典編碼法分類

第一類詞典法:查找正在壓縮的字符序列是否在前面的輸入數(shù)據(jù)中出現(xiàn)過,如果是,則用指向早期出現(xiàn)過的字符串的“指針”替代重復(fù)的字符串。

第二類算法:從輸入的數(shù)據(jù)中創(chuàng)建一個(gè)“短語詞典(dictionaryofthephrases)”。編碼數(shù)據(jù)過程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的“短語”時(shí),編碼器就輸出這個(gè)詞典中的短語的“索引號(hào)”,而不是短語本身。

第三十六頁,共九十一頁,2022年,8月28日37第一類詞典法編碼概念

基本思想:查找正在壓縮的字符序列是否在前面的輸入數(shù)據(jù)中出現(xiàn)過,如果是,則用指向早期出現(xiàn)過的字符串的“指針”替代重復(fù)的字符串?!霸~典”是隱含的,指用以前處理過的數(shù)據(jù)。以AbrahamLempel和JakobZiv在1977年開發(fā)和發(fā)表的算法(稱為LZ77算法)為基礎(chǔ)。改進(jìn)算法是由Storer和Szymanski在1982年開發(fā)的,稱為LZSS算法。第三十七頁,共九十一頁,2022年,8月28日38第二類詞典法編碼概念

基本思想:從輸入的數(shù)據(jù)中創(chuàng)建一個(gè)“短語詞典(dictionaryofthephrases)”。編碼數(shù)據(jù)過程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的“短語”時(shí),編碼器就輸出這個(gè)詞典中的短語的“索引號(hào)”,而不是短語本身。A.Lempel和J.Ziv在1978年首次發(fā)表了介紹這種編碼方法的文章,稱為LZ78。TerryA.Welch在1984年改進(jìn)了這種算法。稱為LZW(Lempel-ZivWalch)壓縮編碼。

第三十八頁,共九十一頁,2022年,8月28日392.5.2LZ77算法

起源:1977年,JacobZiv和AbrahamLempel描述了一種基于滑動(dòng)窗口緩存的技術(shù),該緩存用于保存最近剛處理的文本(J.ZivandA.Lempel,“AUniversalAlgorithmforSequentialDataCompression”,IEEETransactiononInformationTheory,May1977)。這個(gè)算法一般稱為IZ77。基本思想:在正文流中詞匯和短語(GIF中的圖像模式)很可能會(huì)出現(xiàn)重復(fù)。當(dāng)出現(xiàn)一個(gè)重復(fù)時(shí),重復(fù)的序列可以用一個(gè)短的編碼來代替。壓縮程序掃描這樣的重復(fù),同時(shí)生成編碼來代替重復(fù)序列。隨著時(shí)間的過去,編碼可以重用來捕獲新的序列。算法必須設(shè)計(jì)成解壓程序能夠在編碼和原始數(shù)據(jù)序列推導(dǎo)出當(dāng)前的映射。

第三十九頁,共九十一頁,2022年,8月28日LZ77算法40LZ77是一種普遍的無損壓縮方法。ZIP就是運(yùn)用這種方法。舉例,比如要傳輸一串字符,如果使用定長二元碼AABCDBCDABCD000001101101101100011011這種編碼效率低下,因?yàn)?-忽略了字符的模式--忽略了字符的頻率第四十頁,共九十一頁,2022年,8月28日LZ77算法思想41如果我們可以嘗試用一段較短的代碼來代替重復(fù)的模式(字符串)代碼告訴解碼器應(yīng)該從歷史數(shù)據(jù)中的何處開始讀取多少位數(shù)據(jù),編碼者使用一個(gè)緩沖器來保存數(shù)據(jù),并嘗試在歷史信息中匹配信息。如果沒有匹配的,則輸出該字符如果有匹配,則按照(位置,長度)的形式輸出。第四十一頁,共九十一頁,2022年,8月28日LZ77算法思想42需要注意的問題

--每一次輸入的數(shù)據(jù)都要在歷史緩沖器搜索。

--使用最長的匹配。則剛才的字符串AABCDBCDABCD就變成AABCD(3,3)(2,4)第四十二頁,共九十一頁,2022年,8月28日LZ77算法思想43如果使用定長二元碼編碼需要12*2=24bit如果使用LZ77來進(jìn)行編碼,對(duì)字符仍然需要2bit,對(duì)3bit表示數(shù)字則需要5*2+4*3=22bit使用LZ77編碼效率略高于使用定長二元碼思考LZ77是否對(duì)于所有的多媒體信號(hào)都適用?第四十三頁,共九十一頁,2022年,8月28日442.6變換編碼

變換的基本原理

離散傅立葉變換

離散余弦變換

小波變換

第四十四頁,共九十一頁,2022年,8月28日45變換的基本原理

變換編碼:先對(duì)信號(hào)進(jìn)行某種函數(shù)變換,從一種信號(hào)(空間)變換到另一種(空間),然后再對(duì)信號(hào)進(jìn)行編碼。變換編碼系統(tǒng)中壓縮數(shù)據(jù)有變換、變換域采樣和量化三個(gè)步驟。

變換本身并不進(jìn)行數(shù)據(jù)壓縮,它只把信號(hào)映射到另一個(gè)域,使信號(hào)在變換域里容易進(jìn)行壓縮,變換后的樣值更獨(dú)立和有序。量化操作通過比特分配可以有效地壓縮數(shù)據(jù)。第四十五頁,共九十一頁,2022年,8月28日46變換編碼、解碼原理框圖

第四十六頁,共九十一頁,2022年,8月28日47變換的基本原理當(dāng)經(jīng)過正交變換后的協(xié)方差矩陣為一對(duì)角矩陣,且具有最小均方誤差時(shí),該變換稱為最佳變換,也稱Karhunen-Loeve變換(K-L變換)。K-L變換的突出優(yōu)點(diǎn)是相關(guān)性好,是均方誤差(MSE,MeanSquareError)意義下的最佳變換,它在數(shù)據(jù)壓縮技術(shù)中占有重要地位。如果變換后的協(xié)方差矩陣接近對(duì)角矩陣,該類變換稱為準(zhǔn)最佳變換,典型的有DCT(離散余弦變換)、DFT(離散傅立葉變換)、DWT(離散小波變換)等。

第四十七頁,共九十一頁,2022年,8月28日48離散傅立葉變換

一個(gè)變量的周期函數(shù)g(x)能夠通過傅立葉級(jí)數(shù)表示出來:系數(shù)(A0、An和Bn)的值按照下面的公式計(jì)算:

第四十八頁,共九十一頁,2022年,8月28日49傅立葉變換傅立葉變換(FourierTransform)的物理意義:將信號(hào)從時(shí)間域(timedomain)變換到頻率域(frequencydomain)。第四十九頁,共九十一頁,2022年,8月28日50一維離散傅立葉變換(DFT)正變換:給定由N個(gè)信號(hào)樣本(均勻間隔){x(0),x(1),…,x(N-1)}組成的信號(hào)序列,離散傅立葉變換(DFT,DiscreteFourierTransform):

ω=0,1,2,…,N-1逆變換:

k=0,1,2,…,N-1

第五十頁,共九十一頁,2022年,8月28日51二維離散傅立葉變換(DFT)正變換:給定一個(gè)二維信號(hào)的樣本序列{x(k,l),k=0,1,…,N-1,l=0,1,…,N-1},二維離散傅立葉變換(2D-DFT):

u,v=0,1,2,…,N-1逆變換:

k,l=0,1,2,…,N-1

第五十一頁,共九十一頁,2022年,8月28日52離散傅立葉變換傅立葉分析法是一個(gè)強(qiáng)有力的工具,它使許多非常困難的問題變得簡單和易于處理,傅立葉系數(shù)能夠被變換、存儲(chǔ)、傳送,并且還能夠被用做重建信號(hào)或者信號(hào)的函數(shù)。

已經(jīng)發(fā)展了一套快速傅立葉變換(FFT,F(xiàn)astFourierTransform)的計(jì)算機(jī)算法,促進(jìn)了它在信號(hào)處理中的應(yīng)用,特別是在語音處理中的應(yīng)用。

第五十二頁,共九十一頁,2022年,8月28日53離散余弦變換

一維離散余弦變換

二維離散余弦變換

修改的離散余弦變換

第五十三頁,共九十一頁,2022年,8月28日54一維離散余弦變換

p(x)的正離散余弦變換(DCT)逆離散余弦變換(IDCT)

第五十四頁,共九十一頁,2022年,8月28日55二維離散余弦變換

(二維逆DCT)像素的二維排列能夠通過水平和垂直方向的頻率項(xiàng)乘積表示出來:p(x,y)的二維DCT

第五十五頁,共九十一頁,2022年,8月28日562D-DCT第五十六頁,共九十一頁,2022年,8月28日57DCT和IDCT例

第五十七頁,共九十一頁,2022年,8月28日58修改的離散余弦變換

實(shí)際常常使用修改的離散余弦變換(MDCT,ModifiedDCT),使用一種稱為時(shí)域混疊消除(TDAC,timedomainaliasingcancellation)技術(shù),抗混疊(anti-aliasing)效果好。

第五十八頁,共九十一頁,2022年,8月28日2.6.3.4小波變換編碼小波變換是一個(gè)線性變換,能夠?qū)⒁粋€(gè)信號(hào)分解成對(duì)空間和時(shí)間、頻率的獨(dú)立貢獻(xiàn),同時(shí)又不失原信號(hào)所包含的信息。經(jīng)過小波變換后的圖像能量很集中,便于對(duì)不同的分量作不同的處理,達(dá)到較高的壓縮比。

小波變換的具體內(nèi)容在圖像編碼中詳細(xì)講解。第五十九頁,共九十一頁,2022年,8月28日602.7基于模型編碼

基于模型的編碼就是第二代編碼技術(shù)?;谀P头椒ǖ幕舅枷胧牵涸诎l(fā)送端,利用圖像分析模塊對(duì)輸入圖像提取緊湊和必要的描述信息,得到一些數(shù)據(jù)量不大的模型參數(shù);在接收端,利用圖像綜合模塊重建原圖像,是對(duì)圖像信息的合成過程。

第六十頁,共九十一頁,2022年,8月28日61基于模型的圖像編碼基本原理框圖

圖像輸入圖像分析編碼器提取的模型參數(shù)圖像傳輸或存儲(chǔ)解碼器圖像綜合模型已量化的模型參數(shù)圖像輸出第六十一頁,共九十一頁,2022年,8月28日622.8其他壓縮編碼

子帶編碼

向量量化編碼

感知編碼

第六十二頁,共九十一頁,2022年,8月28日632.8.1子帶編碼

子帶編碼(SBC,SunbandCoding)是一種在頻率域中進(jìn)行數(shù)據(jù)壓縮的方法,它主要利用一些頻帶比另一些在感知上作用更大。在子帶編碼中,若各個(gè)子帶的帶寬ΔWk是相同的,則稱為等帶寬子帶編碼,否則,稱為變帶寬子帶編碼。

第六十三頁,共九十一頁,2022年,8月28日64子帶的概念

第六十四頁,共九十一頁,2022年,8月28日65子帶編碼器

第六十五頁,共九十一頁,2022年,8月28日66子帶解碼器

第六十六頁,共九十一頁,2022年,8月28日672.8.1子帶編碼對(duì)每個(gè)子帶分別編碼的好處是:

可以利用人耳(或人眼)對(duì)不同頻率信號(hào)感知靈敏度不同的特性,在人的聽覺(或視覺)不敏感的頻段采用較粗糙的量化,從而達(dá)到數(shù)據(jù)壓縮的目的。

各個(gè)子帶的量化噪聲都束縛在本子帶內(nèi),這就可以避免能量較小的頻帶內(nèi)的信號(hào)被其他頻帶中量化噪聲所掩蓋。

通過頻帶分裂,各個(gè)子帶的取樣頻率可以成倍下降。

第六十七頁,共九十一頁,2022年,8月28日682.8.1子帶編碼經(jīng)過分帶編碼、譯碼后合成的輸出音頻信號(hào)會(huì)有混迭效應(yīng)。采用正交鏡像濾波器(QMF,quandraturemirrorfilter)來劃分頻帶,混迭效應(yīng)在最后合成時(shí)可以抵消。

第六十八頁,共九十一頁,2022年,8月28日69向量量化編碼

在向量量化編碼中,則是把輸入數(shù)據(jù)幾個(gè)一組地分成許多組,成組地量化編碼,即將這些數(shù)看成一個(gè)k維向量,然后以向量為單位逐個(gè)向量進(jìn)行量化。向量量化是一種限失真編碼,其原理仍可用信息論中的率失真函數(shù)理論來分析。

第六十九頁,共九十一頁,2022年,8月28日向量量化編碼向量量化編碼是一種量化與壓縮相結(jié)合的方法。向量量化編碼由兩部分組成,1向量訓(xùn)練,2向量劃分。向量訓(xùn)練:在離線狀態(tài)下,通過訓(xùn)練達(dá)到最佳的量化空間劃分,盡量減少平均失真。已被量化的不重疊的空間稱為CodeBook(CB)代碼本向量劃分:將需要編碼的代碼看做向量,根據(jù)已有的CB進(jìn)行劃分到某一個(gè)空間中去。70第七十頁,共九十一頁,2022年,8月28日VQtraining第七十一頁,共九十一頁,2022年,8月28日VQexample?GiventhefollowingCB(whichhasbeencalculatedviatrainingpreviously,findtheCBvector(andindex)thatminimimisesthedistortionfortheinputvectorx=[528]第七十二頁,共九十一頁,2022年,8月28日VQexample?Thedistortionforeachvectoris:?TheindexthatminimisesDisindex2andthequantisedvectoristhusy(2)=[238].第七十三頁,共九十一頁,2022年,8月28日74向量量化編碼原理框圖

第七十四頁,共九十一頁,2022年,8月28日75向量量化編碼衡量兩個(gè)向量之間接近程度的度量標(biāo)準(zhǔn)可以用均方誤差準(zhǔn)則:也可以用其他準(zhǔn)則。第七十五頁,共九十一頁,2022年,8月28日76向量量化編碼在向量量化編碼中,關(guān)鍵是碼本的建立和碼字搜索算法。

碼本的生成算法有兩種類型,一種是已知信源分布特性的設(shè)計(jì)算法;另一種是未知信源分布,但已知信源的一列具有代表性且足夠長的樣點(diǎn)集合(即訓(xùn)練序列)的設(shè)計(jì)算法。碼字搜索是向量量化中的一個(gè)最基本問題,向量量化過程本身實(shí)際上就是一個(gè)搜索過程,即搜索出與輸入最為匹配的碼字。

第七十六頁,共九十一頁,2022年,8月28日77感知編碼

感知編碼將感知知識(shí)應(yīng)用于編碼中。

感知編碼的主要步驟是:首先將輸入信號(hào)分解為各頻譜元素,再根據(jù)某個(gè)心理聽覺閾值和掩蔽門限進(jìn)行量化編碼,最后生成比特流。聽覺閾值和掩蔽門限的計(jì)算需要對(duì)輸入信號(hào)進(jìn)行頻域分解。

第七十七頁,共九十一頁,2022年,8月28日78感知編碼基本結(jié)構(gòu)框圖

第七十八頁,共九十一頁,2022年,8月28日2.9差錯(cuò)檢測和校正編碼

放入附錄中,請(qǐng)同學(xué)們自行學(xué)習(xí)

79第七十九頁,共九十一頁,2022年,8月28日2.10音頻的壓縮音頻頻率范圍

低頻聲音(Infra-sound):0Hz-20Hz人類聽覺頻率范圍的聲音:20Hz-20kHz

高頻(Ultrasound):20kHz-1GHz超聲波(Hypersound):1GHz-10THz不同音頻的帶寬

電話語音:

200Hz-3.4kHz調(diào)幅廣播:50Hz-7kHz

調(diào)頻廣播:20Hz-15kHz

寬帶音響:20Hz-20kHz第八十頁,共九十一頁,2022年,8月28日2.10.1音頻壓縮編碼的基本方法無失真壓縮音頻壓縮方法有失真壓縮Huffman編碼行程編碼波形編碼參數(shù)編碼混合編碼全頻帶編碼PCMDPCMADPCM子帶編碼自適應(yīng)變換編碼ATC

心理學(xué)模型矢量量化線性預(yù)測LPC矢量和激勵(lì)線性預(yù)測VSELP多脈沖線性預(yù)測MP-LPC碼本激勵(lì)線性預(yù)測CELP第八十一頁,共九十一頁,2022年,8月28日2.10.2電話質(zhì)量的語音壓縮標(biāo)準(zhǔn)ITU—TS建議的語音壓縮的標(biāo)準(zhǔn)G.711:采用PCM編碼,采樣速率為8kHz,量化位數(shù)為8bit,對(duì)應(yīng)的比特流速率為64kbit/s。

G.721:ITU建議的G.721將64Kbps的比特流轉(zhuǎn)換為32Kbps的流,它是基于ADPCM技術(shù)。每個(gè)數(shù)值差分用4位編碼,其采樣率為8kHz。第八十二頁,共九十一頁,2022年,8月28日2.10.2電話質(zhì)量的語音壓縮標(biāo)準(zhǔn)

G.723:G.723是一種以24Kbps運(yùn)行的基于ADPCM的有損耗壓縮標(biāo)準(zhǔn)。其音質(zhì)不如非壓縮的G.711PCM標(biāo)準(zhǔn)以及基于SB—ADPCM的G.722標(biāo)準(zhǔn)。和用于H.324標(biāo)準(zhǔn)。

G.728:它的比特率為16Kbps,帶寬限于3.4kHz。其音質(zhì)比G.711或G.722差得多。它基于一種稱為低延遲代碼激勵(lì)線性預(yù)測(LD—CELP)的向量量化技術(shù)。第八十三頁,共九十一頁,2022年,8月28日2.10.2電話質(zhì)量的語音壓縮標(biāo)準(zhǔn)

CELP是一種常用的語音壓縮技術(shù)。它用于美國聯(lián)邦標(biāo)準(zhǔn)1016,可將語音壓縮至4.8Kbps。美國聯(lián)邦標(biāo)準(zhǔn)1015使用CELP的一個(gè)簡本,稱為線性預(yù)測編碼(LPC)。LPC一10E標(biāo)準(zhǔn)可以運(yùn)行于2.4Kbps。采用了一種向量量化方法。聲音聽起來有點(diǎn)象機(jī)器在說話,但4.8Kbps與電話差不多。第八十四頁,共九十一頁,2022年,8月28日2.10.3調(diào)幅廣播質(zhì)量的音頻壓縮標(biāo)準(zhǔn)

調(diào)幅廣播質(zhì)量:50Hz-7kHz,稱“7kHz音頻信號(hào)”。

G.722:G.722基于子帶ADPCM技術(shù)(SB—ADPCM),它是將現(xiàn)有的帶寬分成兩個(gè)獨(dú)立的子帶信道分別采用差分脈碼調(diào)制算法。G.722壓縮信號(hào)的帶寬范圍為50Hz到7kHz,而G.711僅限于3.4kHz。其比特率為48、56、64Kbps,在標(biāo)準(zhǔn)模式下,采樣速率是16KHz,幅度深度為14

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論