多媒體基礎(chǔ)知識(shí)_第1頁
多媒體基礎(chǔ)知識(shí)_第2頁
多媒體基礎(chǔ)知識(shí)_第3頁
多媒體基礎(chǔ)知識(shí)_第4頁
多媒體基礎(chǔ)知識(shí)_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第1章多媒體基礎(chǔ)1.1多媒體的基本概念1.2多媒體數(shù)據(jù)壓縮技術(shù)上一頁第一頁,共四十九頁。1.1多媒體的基本概念1.1.1多媒體的定義“多媒體”一詞譯自英文“Multimedia”即“Multiple”和”Media”的合成其核心詞是媒體何謂多媒體呢?第二頁,共四十九頁。媒質(zhì):存儲(chǔ)信息的實(shí)體,如磁盤、光盤、磁帶、半導(dǎo)體存儲(chǔ)器等。媒體(medium)在計(jì)算機(jī)領(lǐng)域有兩種含義:即媒質(zhì)和媒介。媒介:傳遞信息的載體,如數(shù)字、文字、聲音、圖形和圖像等。第三頁,共四十九頁。 通常概念的“媒體”,可分為以下五種類型:感覺媒體表示媒體顯示媒體存儲(chǔ)媒體傳輸媒體第四頁,共四十九頁。

感覺媒體:能直接作用于人們的感覺器官,從而能使人產(chǎn)生直接感覺的媒體。如語音、音樂、各種圖像、動(dòng)畫、文本等。

表示媒體:為了傳送感覺媒體而人為研究出來的媒體。借助于此種媒體,便能更有效的存儲(chǔ)或傳送感覺媒體。如語言編碼、電報(bào)碼等。第五頁,共四十九頁。

顯示媒體:用于通信中使電信號(hào)和感覺媒體之間產(chǎn)生轉(zhuǎn)換用的媒體。如輸入、輸出設(shè)施,鍵盤、鼠標(biāo)器、顯示器、打印機(jī)等。

存儲(chǔ)媒體:用于存放某種媒體的媒體如紙張、磁帶、磁盤、光盤等。

傳輸媒體:用于傳輸某些媒體的媒體,如電話線、電纜光纖等。第六頁,共四十九頁。 多媒體計(jì)算機(jī)技術(shù)的定義: 計(jì)算機(jī)綜合處理多種媒體信息,文本圖形、圖像、音頻和視頻,使多種信息建立邏輯連接,集成為一個(gè)系統(tǒng)并具有交互性。1.1.2計(jì)算機(jī)技術(shù)及其特性多媒體計(jì)算機(jī)技術(shù)的三個(gè)主要特性信息載體的多樣性交互性集成性第七頁,共四十九頁。

信息載體的多樣性是相對(duì)于計(jì)算機(jī)而言的,即指信息媒體的多樣性。 信息載體的多樣性多媒體就是要把計(jì)算機(jī)處理的信息多樣化或多維化,從而改變計(jì)算機(jī)信息處理的單一模式,使人們能交互的處理多種信息。第八頁,共四十九頁。交互性 多媒體的交互性是指用戶可以與計(jì)算機(jī)的多種信息媒體進(jìn)行交互操作從而為用戶提供了更加有效地控制和使用信息的手段。第九頁,共四十九頁。集成性

集成性是指以計(jì)算機(jī)為中心綜合處理多種信息媒體,它包括信息媒體的集成和處理這些媒體的設(shè)備的集成。 多媒體設(shè)備的集成包括硬件和軟件兩個(gè)方面。信息媒體的集成包括信息的多通道統(tǒng)一獲取、多媒體信息的統(tǒng)一組織和存儲(chǔ)、多媒體信息表現(xiàn)合成等方面。第十頁,共四十九頁。 多媒體媒體元素是指多媒體應(yīng)用中可顯示給用戶的媒體組成。1.1.3多媒體中的媒體元素及特征音頻動(dòng)畫視頻文本圖形圖像第十一頁,共四十九頁。文本 文本分為非格式化文本文件和格式化文本文件。 格式化文本文件:帶有各種文本排版信息等格式信息的文本文件。如“.DOC”文件。非格式化文本文件:只有文本信息沒有其他任何有關(guān)格式信息的文件,又稱為純文本文件。如“.TXT”文件。 第十二頁,共四十九頁。圖形 圖形(Graphic)一般指用計(jì)算機(jī)繪制的畫面,如直線、圓、圓弧、矩形、任意曲線和圖表等。 在圖形文件中只記錄生成圖的算法和圖上的某些特征點(diǎn),因此也稱矢量。圖形的格式是一組描述點(diǎn)、線、面等幾何圖形的大小、形狀及其位置、維數(shù)的指令集合。第十三頁,共四十九頁。 用于產(chǎn)生和編輯矢量圖形的程序通常稱為“draw”程序。 由于圖形只保存算法和特征點(diǎn),因此占用的存儲(chǔ)空間很小。但顯示時(shí)需經(jīng)過重新計(jì)算,因而顯示速度相對(duì)慢些。微機(jī)上常用的矢量圖形文件有:“.3DS”(用于3D造型)、“.DXF”(用于CAD)、“.WMF”(用于桌面出版)等等。第十四頁,共四十九頁。圖像圖像(Image)是指由輸入設(shè)備捕捉的實(shí)際場景畫面,或以數(shù)字化形式存儲(chǔ)的任意畫面。 靜止的圖像是一個(gè)矩陣,陣列中的各項(xiàng)數(shù)字用來描述構(gòu)成圖像的各個(gè)點(diǎn)(稱為像素點(diǎn)pixel)的強(qiáng)度與顏色等信息。這種圖像也稱為位圖。第十五頁,共四十九頁。 用于生成和編輯位圖圖像的軟件通常稱為“paint”程序。 圖像處理時(shí)要考慮三個(gè)因素:分辨率圖像深度與顯示深度圖像文件大小圖像文件在計(jì)算機(jī)中的存儲(chǔ)格式有多種,如BMP、PCX、TIF、TGA、GIF、JPG等,一般數(shù)據(jù)量都較大。第十六頁,共四十九頁。分辨率屏幕分辨率:顯示器屏幕上的最大顯示 區(qū)域,即水平與垂直方向 的像素個(gè)數(shù)。圖像分辨率:數(shù)字化圖像的大小,即該 圖像的水平與垂直方向的 像素個(gè)數(shù)。像素分辨率:像素的寬和高之比一般為 1:1。第十七頁,共四十九頁。圖像深度和顯示深度

圖像深度(也稱圖像灰度、顏色深度)表示數(shù)字位圖圖像中每個(gè)像素上用于表示顏色的二進(jìn)制數(shù)字位數(shù)。 顯示深度:表示顯示器上每個(gè)點(diǎn)用于顯示顏色的2進(jìn)制數(shù)字位數(shù)。 若顯示器的顯示深度小于數(shù)字圖像的深度,就會(huì)使數(shù)字圖像顏色的顯示失真。第十八頁,共四十九頁。顏色深度顏色總數(shù)圖像名稱12單色圖像416索引16色圖像8256索引256色圖像1665536HI—Color圖像2416672216TrueColor圖像顏色深度與顯示的顏色數(shù)目第十九頁,共四十九頁。圖像文件大小 用字節(jié)表示圖像文件大小時(shí),一幅未經(jīng)壓縮的數(shù)字圖像的數(shù)據(jù)量大小計(jì)算如下:圖像數(shù)據(jù)量大小=像素總數(shù)×圖像深度÷8例如:一幅800×600的256色圖像為 800×600×8/8=480000字節(jié)第二十頁,共四十九頁。 波形聲音實(shí)際上已經(jīng)包含了所有的聲音形式,它可以將任何聲音都進(jìn)行采樣量化,相應(yīng)的文件格式是WAV文件或VOC文件。 數(shù)字音頻(Audio)可分為波形聲音、語音和音樂。音頻語音也是一種波形,所以和波形聲音的文件格式相同。音樂是符號(hào)化了的聲音,樂譜可轉(zhuǎn)變?yōu)榉?hào)媒體形式。對(duì)應(yīng)的文件格式是MID或CMF文件。第二十一頁,共四十九頁。 計(jì)算機(jī)音頻技術(shù)主要包括聲音的采集、數(shù)字化、壓縮/解壓縮以及聲音的播放。 采樣頻率是將模擬聲音波形轉(zhuǎn)換為數(shù)字時(shí),每秒鐘所抽取聲波幅度樣本的次數(shù),單位是Hz(赫茲)。數(shù)字化主要包括采樣和量化這兩個(gè)方面。第二十二頁,共四十九頁。

量化數(shù)據(jù)位數(shù)(也稱量化級(jí))是每個(gè)采樣點(diǎn)能夠表示的數(shù)據(jù)范圍,經(jīng)常采用的有8位、12位和16位。

例如,8位量化級(jí)表示每個(gè)采樣點(diǎn)可以表示256個(gè)不同量化值,而16位量化級(jí)則可以表示65536個(gè)不同的量化值 記錄聲音時(shí),如果每次生成一個(gè)聲道數(shù)據(jù),稱為單聲道;每次生成兩個(gè)聲波數(shù)據(jù),稱為立體聲(雙聲道)。第二十三頁,共四十九頁。

數(shù)字音頻的存儲(chǔ)量: 可用以下公式估算聲音數(shù)字化后每秒所需的存儲(chǔ)量(未經(jīng)壓縮的)存儲(chǔ)量=采樣頻率×量化位數(shù)÷8

例如,數(shù)字激光唱盤(CD-DA)的標(biāo)準(zhǔn)采樣頻率為44.1kHz,量化位數(shù)為16位,立體聲。一分鐘CD-DA音樂所需的存儲(chǔ)量為44.1K×16×2×60÷8=10584KB若使用雙聲道,存儲(chǔ)量再增加一倍第二十四頁,共四十九頁。 動(dòng)畫是活動(dòng)的畫面,實(shí)質(zhì)是一幅幅靜態(tài)圖像的連續(xù)播放。動(dòng)畫的連續(xù)播放既指時(shí)間上的連續(xù),也指圖像內(nèi)容上的連續(xù)。 動(dòng)畫計(jì)算機(jī)設(shè)計(jì)動(dòng)畫有兩種:一種是幀動(dòng)畫,一種是造型動(dòng)畫。第二十五頁,共四十九頁。

幀動(dòng)畫是由一幅幅位圖組成的連續(xù)的畫面,就如電影膠片或視頻畫面一樣要分別設(shè)計(jì)每屏幕顯示的畫面。 造型動(dòng)畫是對(duì)每一個(gè)運(yùn)動(dòng)的物體分別進(jìn)行設(shè)計(jì),賦予每個(gè)動(dòng)元一些特征,然后用這些動(dòng)元構(gòu)成完整的幀畫面。動(dòng)元的表演和行為是由制作表組成的腳本來控制。 存儲(chǔ)動(dòng)畫的文件格式有FLC、MMM等第二十六頁,共四十九頁。視頻 視頻是由一幅幅單獨(dú)的畫面序列(幀frame)組成,這些畫面以一定的速率(fps)連續(xù)地投射在屏幕上,使觀察者具有圖像連續(xù)運(yùn)動(dòng)的感覺。 視頻文件的存儲(chǔ)格式有AVI、MPG、MOV等。第二十七頁,共四十九頁。 視頻標(biāo)準(zhǔn)主要有NTSC制和PAL制兩種。 視頻的技術(shù)參數(shù)有: 幀速 數(shù)據(jù)量 圖像質(zhì)量NTSC標(biāo)準(zhǔn)為30fps,每幀525行。 PAL標(biāo)準(zhǔn)為25fps,每幀625行。第二十八頁,共四十九頁。1.2.1多媒體數(shù)據(jù)的冗余類型 圖像數(shù)據(jù)表示中存在著大量的冗余,圖像數(shù)據(jù)壓縮技術(shù)就是利用圖像數(shù)據(jù)的冗余性來減少圖像數(shù)據(jù)量的方法。常見圖像數(shù)據(jù)冗余類型如下:1.空間冗余2.時(shí)間冗余3.視覺冗余1.2多媒體數(shù)據(jù)壓縮技術(shù)第二十九頁,共四十九頁??臻g冗余 一幅圖像表面上各采樣點(diǎn)的顏色之間往往存在著空間連貫性,基于離散像素采樣來表示物體表面顏色的像素存儲(chǔ)方式可利用空間連貫性,達(dá)到減少數(shù)據(jù)量的目的。 例如,在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,在此區(qū)域中所有點(diǎn)的光強(qiáng)和色彩以及飽和度都是相同的,因此數(shù)據(jù)有很大的空間冗余。第三十頁,共四十九頁。時(shí)間冗余 運(yùn)動(dòng)圖像一般為位于一時(shí)間軸區(qū)間的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動(dòng)物體,只不過移動(dòng)物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于相鄰幀記錄了相鄰時(shí)刻的同一場景畫面,所以稱為時(shí)間冗余。 同理,語音數(shù)據(jù)中也存在著時(shí)間冗余。第三十一頁,共四十九頁。視覺冗余 人類的視覺系統(tǒng)對(duì)圖像場的敏感度是非均勻的。但是,在記錄原始的圖像數(shù)據(jù)時(shí),通常假定視覺系統(tǒng)近似線性的和均勻的,對(duì)視覺敏感和不敏感的部分同等對(duì)待,從而產(chǎn)生比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來的編碼)更多的數(shù)據(jù),這就是視覺冗余。第三十二頁,共四十九頁。1.2.2數(shù)據(jù)壓縮方法 壓縮處理一般是由兩個(gè)過程組成:一是編碼過程,即將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮,以便存儲(chǔ)與傳輸;二是解碼過程,此過程對(duì)編碼數(shù)據(jù)進(jìn)行解碼,還原為可以使用的數(shù)據(jù)。 數(shù)據(jù)壓縮可分為兩種類型:一種叫做無損壓縮,另一種叫做有損壓縮。無損壓縮混合壓縮有損壓縮第三十三頁,共四十九頁。無損壓縮 無損壓縮常用在原始數(shù)據(jù)的存檔,如文本數(shù)據(jù)、程序以及珍貴的圖片和圖像等。 其原理是統(tǒng)計(jì)壓縮數(shù)據(jù)中的冗余(重復(fù)的數(shù)據(jù))部分。常用的有:RLE(runlengthencoding)行程編碼Huffman編碼算術(shù)編碼LZW(lempel-ziv-welch)編碼第三十四頁,共四十九頁。(1)行程編碼(RLE) RLE編碼是將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一記號(hào)表示。 例如,字符串AAABCDDDDDDDDBBBBB可以壓縮為3ABC8D5B。 RLE編碼簡單直觀,編碼/解碼速度快,因此許多圖形和視頻文件,如.BMP.TIFF及AVI等格式文件的壓縮均采用此方法.第三十五頁,共四十九頁。(2)Huffman編碼 它是一種對(duì)統(tǒng)計(jì)獨(dú)立信源能達(dá)到最小平均碼長的編碼方法。 其原理是,先統(tǒng)計(jì)數(shù)據(jù)中各字符出現(xiàn)的概率后,再按字符出現(xiàn)頻率高低的順序分別賦以由短到長的代碼,從而保證了文件的整體的大部分字符是由較短的編碼構(gòu)成的。第三十六頁,共四十九頁。(3)算術(shù)編碼 其方法是將被編碼的信源消息表示成實(shí)數(shù)軸0-1之間的一個(gè)間隔,消息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位數(shù)就越多。 該方法實(shí)現(xiàn)較為復(fù)雜,常與其它有損壓縮結(jié)合使用,并在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG)中扮演重要角色。第三十七頁,共四十九頁。(4)LZW編碼 LZW(Lempel-Ziv-Welch)壓縮使用字典庫查找方案。它讀入待壓縮的數(shù)據(jù)并與一個(gè)字典庫(庫開始是空的)中的字符串對(duì)比,如有匹配的字符串,則輸出該字符串?dāng)?shù)據(jù)在字典庫中的位置索引,否則將該字符串插入字典中。 許多商品壓縮軟件如ARJ、PKZIR、ZOO、LHA等都采用了設(shè)方法。 另外,.GIF和.TIF格式的圖形文件也是按這一文件存儲(chǔ)的。第三十八頁,共四十九頁。有損壓縮 圖像或聲音的頻帶寬、信息豐富,人類視覺和聽覺器官對(duì)頻帶中某些頻率成分不大敏感,有損壓縮以犧牲這部分信息為代價(jià),換取了較高的壓縮比。 常用的有損壓縮方法有:PCM(脈沖編碼調(diào)制)、預(yù)測編碼、變換編碼、插值與外推等。 新一代的數(shù)據(jù)壓縮方法有:矢量量化和子帶編碼、基于模型的壓縮、分形壓縮及小波變換等。第三十九頁,共四十九頁?;旌蠅嚎s 混合壓縮是利用了各種單一壓縮的長處,以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。 該方法在許多情況下被應(yīng)用,如JPEG和MPEG標(biāo)準(zhǔn)就采用了混合編碼的壓縮方法。第四十頁,共四十九頁。1.2.3編碼的國際標(biāo)準(zhǔn)1、音頻編碼2、靜止圖像壓縮標(biāo)準(zhǔn)3.運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)第四十一頁,共四十九頁。1.音頻編碼音頻的編碼方式可分為波形編碼、參數(shù)編碼和混合編碼三種。(l)波形編碼對(duì)于音頻信號(hào),通常采用波形編碼方法。波形編碼的算法簡單,易于實(shí)現(xiàn),可獲得高質(zhì)量的語音。常見的三種波形編碼方法為:第四十二頁,共四十九頁。脈沖編碼調(diào)制(PCM),實(shí)際為直接對(duì)聲音信號(hào)作A/D轉(zhuǎn)換。只要采樣頻率足夠高,量化位數(shù)足夠多,就能使解碼后恢復(fù)的聲音信號(hào)有很高的質(zhì)量。差分脈沖編碼調(diào)制(DPCM),即只傳輸聲音預(yù)測值和樣本值的差值以此降低音頻數(shù)據(jù)的編碼率。自適應(yīng)差分編碼調(diào)制(ADPCM),是DPCM方法的進(jìn)一步改進(jìn),通過調(diào)整量化步長,對(duì)不同頻段設(shè)置不同的量化字長,使數(shù)據(jù)得到進(jìn)一步的壓縮。第四十三頁,共四十九頁。(2)參數(shù)編碼

參數(shù)編碼方法通過建立起聲音信號(hào)的產(chǎn)生模型,將聲音信號(hào)用模型參數(shù)來表示,再對(duì)參數(shù)進(jìn)行編碼,在聲音播放時(shí)根據(jù)參數(shù)重建聲音信號(hào)。參數(shù)編碼法算法復(fù)雜,計(jì)算量大,壓縮率高,但還原聲音的質(zhì)量不高。(3)混合編碼

混合編碼是把波形編碼的高質(zhì)量和參數(shù)編碼的低數(shù)據(jù)率結(jié)合在一起,取得了較好效果。第四十四頁,共四十九頁。2.靜止圖像壓縮標(biāo)準(zhǔn) 國際標(biāo)準(zhǔn)化組織(ISO)和國際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合成立的“聯(lián)合照片專家組“JPEG

(jointphotographicexpertsgroup)于1991年提出的“多灰度靜止圖像的數(shù)字壓縮編碼”(簡稱JPEG標(biāo)準(zhǔn))。 這是一個(gè)適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。第四十五頁,共四十九頁。

JPEG標(biāo)準(zhǔn)支持很高的圖像分辨率和量化精度。它包含兩部分: 第二部分是有損壓縮,基于離散余弦變換(DCT)和Huffman編碼,通常壓縮20-40倍。第一部分是無損壓縮,基于差分脈沖編碼調(diào)制(DPCM)的預(yù)測編碼。第四十六頁,共四十九頁。3.運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn) 視頻圖像壓縮的一個(gè)重要標(biāo)準(zhǔn)是MPEG(MovingPictureExpertsGroup)于1990年形成的一個(gè)標(biāo)準(zhǔn)草案(簡稱MPEG標(biāo)準(zhǔn))。 它兼顧了JPEG標(biāo)準(zhǔn)和CCITT專家組的H.261標(biāo)準(zhǔn)。第四十七頁,共四十九頁。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論