第4章 多媒體技術(shù)基礎(chǔ)_第1頁
第4章 多媒體技術(shù)基礎(chǔ)_第2頁
第4章 多媒體技術(shù)基礎(chǔ)_第3頁
第4章 多媒體技術(shù)基礎(chǔ)_第4頁
第4章 多媒體技術(shù)基礎(chǔ)_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

PAGEPAGE13第4章多媒體技術(shù)基礎(chǔ)多媒體技術(shù)是指利用計算機綜合處理文字、圖形、影像、動畫、聲音及視頻等信息的技術(shù)。本章介紹多媒體技術(shù)相關(guān)的概念,常用媒體類型和基本應(yīng)用,通過學習windows自帶的多媒體工具的使用幫助讀者掌握多媒體技術(shù)的內(nèi)涵。4.1多媒體技術(shù)概述隨著信息技術(shù)的發(fā)展,計算機已成為人類觀察世界、表現(xiàn)世界的好幫手?,F(xiàn)代藝術(shù)實現(xiàn)借助于“機械眼”,即人們通過操縱使用創(chuàng)意機械(計算機)和實施機械(數(shù)碼照相機、數(shù)碼攝像機、掃描儀、激光打印機等機械設(shè)備),再經(jīng)過人們的藝術(shù)加工,豐富了攝取信息的途徑與表現(xiàn)信息的能力,“機械眼”的使用,比用“生物眼”所觀察的世界更為豐富、更為具體且更為生動。因此學習多媒體技術(shù)的有關(guān)原理知識,掌握流行的多媒體的工具,是享用信息技術(shù)成果、在信息社會中發(fā)展提供必備的基礎(chǔ)。4.1.1多媒體技術(shù)的概念1)媒體媒體(Media)是指承載或傳遞信息的載體。如報紙、書本、雜志、廣播、電影、電視均是媒體,有的以文字作為媒體,有的以聲音作為媒體,有的以圖像作為媒體,還有的(如電視)將文、圖、聲、像綜合起來作為媒體。同樣的信息內(nèi)容,在不同領(lǐng)域中采用的媒體形式是不同的,書刊領(lǐng)域采用的媒體形式為文字、表格和圖片;繪畫領(lǐng)域采用的媒體形式是圖形、文字或色彩;攝影領(lǐng)域采用的媒體形式是靜止圖像、色彩;電影、電視領(lǐng)域采用的是圖像或運動圖像、聲音和色彩。2)多媒體多媒體一詞譯自英文“Multimedia”,是多種媒體信息的載體,信息借助載體得以交流傳播。在信息領(lǐng)域中,多媒體是指文本、圖形、圖像、聲音、影像等這些“單”媒體和計算機程序融合在一起形成的信息媒體,是指運用存儲與再現(xiàn)技術(shù)得到的計算機中的數(shù)字信息。圖、文、聲、像構(gòu)成多媒體,采用如下幾種媒體形式傳遞信息并呈現(xiàn)知識內(nèi)容:圖:包括圖形(Graphics)和靜止圖像(Images);文:文本(Text);聲:聲音(Audio);像:包括動畫(Animiation)和運動圖像(MotionVideo)。這里所說的“多媒體”,常常不是指多種媒體本身,而主要是指處理和應(yīng)用它的一整套技術(shù)?!岸嗝襟w技術(shù)”不是各種信息媒體的簡單復合,它是一種把文本、圖形、圖像、動畫、視頻和聲音等形式的信息結(jié)合在一起,并通過計算機進行綜合處理和控制,使多種媒體信息之間建立邏輯連接,能支持完成一系列交互式操作的信息技術(shù)。多媒體技術(shù)融合了計算機硬件技術(shù)、計算機軟件技術(shù)以及計算機美術(shù)、音樂等多種計算機應(yīng)用技術(shù)。多種媒體的集合體將信息的存儲、傳輸和輸出有機地結(jié)合起來,引領(lǐng)人們走進了一個多姿多彩的數(shù)字世界。聲聲像圖文其它混合圖4-1圖、文、聲、像綜合動態(tài)表現(xiàn)的多媒體示意圖圖4-1給出了圖、文、聲、像綜合動態(tài)表現(xiàn)的多媒體示例,從中可以感受到多媒體技術(shù)的藝術(shù)感染力。如果將其中的圖像和動畫合并為一類,則多媒體可看成圖、文、聲三大類型的媒體語言,前兩者屬于視覺語言,而聲屬于聽覺語言,它們均屬于感覺媒體的范疇。4.1.2多媒體系統(tǒng)中常見的媒體元素有文本、圖形、圖像、聲音、動畫和視頻圖像等。⑴文本(Text)文本是由字符、符號組成的一個符號串,如語句、文章等,通常通過編輯軟件生成。文本中如果只有文本信息,沒有其它任何有關(guān)格式的信息,則稱為非格式化文本文件或純文本文件;而帶有各種文本排版信息等格式信息的文本,稱為格式化文本文件。Word文檔就是典型的格式化文本文件。⑵圖形(Graphic)圖形一般指計算機生成的各種有規(guī)則的圖,如直線、圓、圓弧、矩形、任意曲線等幾何圖和統(tǒng)計圖等。圖形的最大優(yōu)點在于可以分別控制處理圖中的各個部分,如在屏幕上移動、旋轉(zhuǎn)、放大、縮小、扭曲而不失真,不同的物體還可在屏幕上重疊并保持各自的特性,必要時仍可分開,如圖4-2就是一個圖形生成的白菜圖案。圖4-2圖形生成的白菜圖4-3圖像放大后的結(jié)果⑶圖像(Image)圖像是指由輸入設(shè)備捕捉的實際場景畫面或以數(shù)字化形式存儲的任意畫面。計算機可以處理各種不規(guī)則靜態(tài)圖片,如掃描儀、數(shù)字照相機或攝像機輸入的彩色、黑白圖片或照片等都是圖像。圖像記錄著每個坐標位置上顏色像素點的值。所以圖形的數(shù)據(jù)信息處理起來更靈活,而圖像數(shù)據(jù)則與實際更加接近,但是它不能隨意放大,圖4-3就是圖像放大的結(jié)果。⑷音頻(Audio)音頻是聲音采集設(shè)備捕捉或生成的聲波以數(shù)字化形式存儲,并能夠重現(xiàn)的聲音信息。音頻信息增強了對其它類型媒體所表達的信息的理解?!耙纛l”常常作為“音頻信號”或“聲音”的同義詞。計算機音頻技術(shù)主要包括聲音的采集、數(shù)字化、壓縮/解壓縮以及聲音的播放。⑸動畫(Animation)動畫是運動的圖畫,實質(zhì)是一幅幅靜態(tài)圖像或圖形的快速連續(xù)播放。動畫的連續(xù)播放既指時間上的連續(xù),也指圖像內(nèi)容上的連續(xù),即播放的相鄰兩幅圖像之間內(nèi)容相差很小。⑹視頻(Video)若干有聯(lián)系的圖像數(shù)據(jù)連續(xù)播放便形成了視頻。視頻圖像可來自錄像帶、攝像機等視頻信號源的影像,如錄像帶、影碟上的電影/電視節(jié)目、電視、攝像等。4.1.31)多媒體數(shù)據(jù)的特點多媒體信息處理是指對文字、聲音、圖形、靜態(tài)影像、活動影像等多媒體信息在計算機運算下的綜合處理。在傳統(tǒng)媒體中,聲、圖、像等媒體幾乎都以模擬信號的方式進行存儲和傳播,而在計算機多媒體系統(tǒng)中這些信息都將以數(shù)字的形式對其進行存儲、處理和傳播。多媒體數(shù)據(jù)具有以下的特點:⑴數(shù)據(jù)量巨大計算機要完成將多媒體信息數(shù)字化的過程,需要采用一定的頻率對模擬信號進行采樣,并將每次采樣得到的信號采用數(shù)字方式進行存儲,較高質(zhì)量的采樣通常會產(chǎn)生巨大的數(shù)據(jù)量。構(gòu)成一幅分辨率為640ⅹ480的256色的彩色照片的數(shù)據(jù)量是0.3MB;CD質(zhì)量雙聲道的聲音的數(shù)據(jù)量要每秒1.4MB。⑵數(shù)據(jù)類型多多媒體數(shù)據(jù)包括文字、圖形、圖像、聲音、文本、動畫等多種形式,數(shù)據(jù)類型豐富多彩。⑶數(shù)據(jù)類型間差異大多媒體數(shù)據(jù)在內(nèi)容和格式上的不同,使其處理方法、組織方式、管理形式上存在很大差別。⑷多媒體數(shù)據(jù)的輸入和輸出復雜多媒體信息輸入與輸出要與多種設(shè)備相連,對輸入輸出數(shù)據(jù)的處理方式和格式都存在很大差別。2)多媒體系統(tǒng)的特點⑴信息媒體的多樣性:計算機不僅能夠獲取(輸入)多媒體信息,而且還能處理并表現(xiàn)(輸出)多媒體信息。⑵處理過程的交互性:不僅可以顯示多媒體信息,而且還可以向用戶提供交互式使用、加工和控制信息的手段,使得人們更加具有主動性和操縱性。⑶多種技術(shù)的集成性:多媒體技術(shù)可以把多種媒體信息和多種媒體設(shè)備集成到為一體,以計算機為中心綜合處理。如電視會議系統(tǒng)。⑷表現(xiàn)信息的實時性:指在人的感覺系統(tǒng)允許的情況下進行多媒體處理和交互。圖像和聲音既是同步的也是連續(xù)的。⑸信息存在的協(xié)同性:多媒體中的每一種媒體都有其自身的特性,各種媒體之間必須有機配合、協(xié)調(diào)一致。4.1.4多媒體系統(tǒng)的構(gòu)成多媒體計算機系統(tǒng)是可以綜合處理文本、圖形、圖像、聲音等多種媒體信息(包括對多種媒體信息進行采集、存儲、加工處理、表現(xiàn)、輸出等)的交互式計算機系統(tǒng),通常又稱為多媒體計算機。與普通的計算機系統(tǒng)一樣,多媒體計算機系統(tǒng)由硬件系統(tǒng)和軟件系統(tǒng)組成。其中硬件系統(tǒng)主要包括計算機主要配置和各種外部設(shè)備,以及與各種外部設(shè)備連接的控制接口卡(其中包括多媒體實時壓縮和解壓縮電路)如視頻卡、聲卡等。軟件系統(tǒng)構(gòu)建于多媒體硬件系統(tǒng)之上,包括多媒體操作系統(tǒng)、多媒體數(shù)據(jù)處理軟件、多媒體創(chuàng)作工具軟件和多媒體應(yīng)用軟件等。1)多媒體計算機的硬件系統(tǒng)多媒體硬件系統(tǒng)是由計算機傳統(tǒng)硬件設(shè)備光盤存儲器(CD/DVD-ROM)、音頻輸入/輸出和處理設(shè)備、視頻輸入/輸出和處理設(shè)備等選擇性組合而成,其基本框圖如圖4-4所示。圖4-4多媒體硬件系統(tǒng)構(gòu)成聲卡是多媒體計算機的主要部件之一,它包含記錄和播放聲音所需的硬件。聲卡用來處理和播放多媒體聲音的關(guān)鍵部件。它通過插入主板擴展槽中與主機相連,并通過卡上的輸入/輸出接口與相應(yīng)的輸入/輸出設(shè)備相連(常見的輸入設(shè)備包括麥克風、收錄機和電子樂器等,常見的輸出設(shè)備包括揚聲器和音響設(shè)備等)。聲卡可以從聲源獲取聲音,并進行模擬/數(shù)字轉(zhuǎn)換或壓縮,也可以把經(jīng)過計算機處理的數(shù)字化聲音通過解壓縮、數(shù)字/模擬轉(zhuǎn)換后,送到輸出設(shè)備進行播放或錄制,圖4-5是聲卡的實物。目前,聲卡已得到了廣泛的應(yīng)用,計算機游戲、多媒體教育軟件、播放CD音樂或VCD影片、語音識別、網(wǎng)上電話、電視會議等,都離不開聲卡。大多數(shù)主板都已經(jīng)集成了聲卡,可以不需要另外購買。圖4-5聲卡實物視頻卡通過插入主板擴展槽中與主機相連。視頻卡上的輸入/輸出接口可以與攝像機、影碟機、錄像機和電視機等設(shè)備相連。視頻卡采集來自輸入設(shè)備的視頻信號,并完成由模擬量到數(shù)字量的轉(zhuǎn)換、壓縮,并將視頻信號以數(shù)字化形式存入計算機中。數(shù)字視頻可在計算機中進行播放。視頻卡的實物原形如圖4-6所示。圖4-6視頻卡實物圖4-7激光頭示意光盤存儲器由CD-ROM/DVD-ROM驅(qū)動器和光盤片組成。光盤片是一種大容量的存儲設(shè)備,可存儲任何多媒體信息。CD/DVD-ROM驅(qū)動器用來讀取光盤上的信息。圖4-7中是激光頭從CD/VCD或者DVD中讀取數(shù)據(jù)的模擬示意。通過光頭的聚焦讀取光盤中的信息,傳送壓縮數(shù)據(jù)到計算機中處理。2)多媒體計算機軟件系統(tǒng)多媒體計算機軟件系統(tǒng)一般包括:多媒體操作系統(tǒng)、多媒體創(chuàng)作軟件、多媒體應(yīng)用軟件等。⑴多媒體操作系統(tǒng)多媒體操作系統(tǒng)除了一般操作系統(tǒng)具有的功能外,應(yīng)具有多媒體設(shè)備驅(qū)動能力、多媒體信息(圖片、音頻、視頻、動畫等)播放能力、簡單多媒體處理能力。目前流行的桌面操作系統(tǒng)(如WindowsXP、WindowsVista、Windows7、Linux系列等)都具有多媒體設(shè)備驅(qū)動、多媒體播放、多媒體簡單處理的能力。⑵多媒體創(chuàng)作軟件多媒體創(chuàng)作軟件指的是根據(jù)用戶腳本要求能將各種媒體集成到一起,創(chuàng)作出能使用戶通過交互方式將某主題的知識作品以多種方式展現(xiàn)出來,使作品生動活潑、興趣無窮。這類的軟件有許多,常見的有網(wǎng)頁設(shè)計軟件FrontPage、Dreamvawer等;作品創(chuàng)作軟件Authorware、Director、ZineMaker等;動畫制作軟件Flash、3Dmax等。⑶多媒體應(yīng)用軟件多媒體應(yīng)用軟件常見的有:圖片播放、處理(縮放、旋轉(zhuǎn)、格式轉(zhuǎn)換等);音頻播放、視頻動畫播放等軟件。如Windows操作系統(tǒng)的圖片播放器、WMP(WindowsMediaPlayer)音頻、視頻播放器等。3)常用信息獲取設(shè)備多媒體計算機必須配置必要的外部設(shè)備來完成多媒體信息獲取,常見的有數(shù)字化圖像獲取設(shè)備,掃描儀、數(shù)碼照相機等靜態(tài)圖像獲取設(shè)備和攝像機等視頻圖像獲取設(shè)備。⑴數(shù)碼相機數(shù)碼相機是一種與計算機配套使用的照相機,與普通光學照相機之間最大的區(qū)別在于數(shù)碼相機用存儲器保存圖像數(shù)據(jù),而不通過膠片曝光來保存圖像。①數(shù)碼相機的工作原理數(shù)碼相機的心臟是電荷耦合器件(CCD:ChargeCoupledDevice)。使用數(shù)碼照相機拍攝時,來自景物的光線通過成像鏡頭被分成紅、綠、藍三種光線投影在電耦合器件上,CCD把光信號轉(zhuǎn)換成電信號,其強度與被攝景像反射的光線強度有關(guān),模/數(shù)轉(zhuǎn)換器將連續(xù)的電信號轉(zhuǎn)換為離散的數(shù)字信號,經(jīng)DSP數(shù)字信號處理器運算處理把數(shù)字信號轉(zhuǎn)化為圖像,再經(jīng)編碼將圖像轉(zhuǎn)換成JPEG等壓縮圖片格式文件。圖像儲存到存儲到介質(zhì)中。在軟件支持下,可在屏幕上顯示照片。照片可用彩色噴墨打印機或彩色激光打印機輸出。②數(shù)碼相機的性能指標分辨率分辨率是數(shù)碼相機最重要的性能指標。數(shù)碼相機的分辨率標準與顯示器類似,使用圖像的絕對像素數(shù)來衡量。分辨率越高,所拍圖像的質(zhì)量也就越高,在同樣的輸出質(zhì)量下可打印的照片尺寸越大。顏色深度這一指標描述數(shù)碼相機對色彩的分辨能力。目前幾乎所有的數(shù)碼相機的顏色深度都達到了24位,可以生成真彩色的圖像。存儲介質(zhì)數(shù)碼相機所用的存儲媒體是閃存記憶體,主要有SmartMedia卡(SM卡)、CompactFlash卡(CF卡)。數(shù)據(jù)輸出方式數(shù)碼相機輸出接口為串行口、USB接口或IEEE-1394接口。通過這些接口和電纜,就可將數(shù)碼相機中的影像數(shù)據(jù)傳遞到計算機中保存或處理。若相機提供視頻接口,可在沒有計算機的情況下在電視機上觀看照片。對于數(shù)碼相機來說,拍完一張照片之后,要將數(shù)據(jù)記錄到內(nèi)存,不能立即拍攝下一幅照片。因此兩張照片之間等待的時間間隔就成為了數(shù)碼相機的另一個重要指標。越是高級的相機,間隔越短,也就是說連續(xù)拍攝的能力越強。③數(shù)碼相片輸入計算機先用連接線將數(shù)碼相機與計算機連結(jié)起來。例如,有USB接口的相機,將隨機配帶的電纜一端接入相機的輸出接口,另一端插入計算機的USB接口。數(shù)碼相機的驅(qū)動程序(需要事先安裝到計算機上)就會將相機的存儲卡視為計算機的一個可移動磁盤,存儲卡中的圖像會以略圖方式顯示,如圖4-8所示。圖4-8數(shù)碼相機連接到計算機如果想把存儲卡上的照片完全移入到計算機而存儲卡上不再保存,就可以使用剪切與粘貼命令;假如還要在存儲卡上保留照片,則可以用復制與粘貼命令,也可以采用拖放的方法,將照片文件直接從相機的存儲卡拖入到計算機中的任一文件夾中。⑵數(shù)碼攝像機數(shù)碼攝像機的優(yōu)點是動態(tài)拍攝效果好,電池容量大,DV帶也可以支持長時間拍攝,拍、采、編、播自成一體,相應(yīng)的軟、硬件支持也十分成熟。目前數(shù)碼攝像機普遍都帶有存儲卡,一機兩用切換起來也顯得很方便。由于數(shù)碼攝像機使用的小尺寸電荷耦合器件CCD與其鏡頭的不匹配,在拍攝靜止圖像時的效果不如數(shù)碼相機。如圖4-9所示:圖4-9數(shù)碼攝像機4.2多媒體信息處理概述4.2.1聲音是通過空氣的震動發(fā)出,通常用模擬波的方式表示它。振幅反映聲音的音量,頻率反映了音調(diào)。音頻是連續(xù)變化的模擬信號,而計算機只能處理數(shù)字信號,要使計算機能處理音頻信號,必須把模擬音頻信號轉(zhuǎn)換成用“0”、“1”表示的數(shù)字信號,這就是音頻的數(shù)字化,將模擬的(連續(xù)的)聲音波形的模擬信號通過音頻設(shè)備(如聲卡)將其數(shù)字化(離散化),其中會涉及到采樣、量化及編碼等多種技術(shù)。常用的數(shù)字化聲音文件類型有:WAV、MIDI、MP3、WMA、CD、RA、AU、MD和VOC等。WAV:被稱為“無損的音樂”,是微軟公司開發(fā)的一種聲音文件格式,用于保存WINDOWS平臺的音頻信息資源,被WINDOWS平臺及其應(yīng)用程序所支持。WAV格式支持MSADPCM、CCITTALAW等多種壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,標準格式的WAV文件和CD格式一樣,也是44.1K的采樣頻率,速率88K/秒,16位量化位數(shù),可以看出,WAV格式的聲音文件質(zhì)量和CD相差無幾,是目前PC機上廣為流行的聲音文件格式,幾乎所有的音頻編輯軟件都能夠讀取WAV格式。MIDI:MIDI是MusicalInstrumentDigitalInterface的簡稱,被稱為“作曲家的最愛”,MIDI允許數(shù)字合成器和其他設(shè)備交換數(shù)據(jù)。MID文件格式由MIDI繼承而來。MID文件并不是一段錄制好的聲音,而是記錄聲音的信息,然后告訴聲卡如何再現(xiàn)音樂的一組指令。這樣一個MIDI文件每存1分鐘的音樂只用大約5~10KB。今天,MID文件主要用于原始樂器作品,流行歌曲的業(yè)余表演,游戲音軌以及電子賀卡等。mid文件重放的效果完全依賴聲卡的檔次。它的最大用處是在電腦作曲領(lǐng)域。mid文件可以用作曲軟件寫出,也可以通過聲卡的MIDI接口把外接音序器演奏的樂曲輸入計算機里,制成mid文件。MP3:當前使用最廣泛的數(shù)字化聲音格式。MP3是指MPEG標準中的音頻部分,也就是MPEG音頻層。根據(jù)壓縮質(zhì)量和編碼處理的不同分為3層,分別對應(yīng)*.mp1、*.mp2和*.mp3這3種聲音文件。MPEG音頻文件的壓縮是一種有損壓縮,MPEG3音頻編碼則具有10:1~12:1的高壓縮率,它基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質(zhì)量來換取文件尺寸的優(yōu)勢。相同長度的音樂文件,用mp3格式來儲存,一般只有WAV文件的1/10,而音質(zhì)要次于WAV格式的聲音文件。由于其文件尺寸小,音質(zhì)好;所以mp3是當前主流的數(shù)字化聲音保存格式。WMA是微軟在互聯(lián)網(wǎng)音頻、視頻領(lǐng)域的力作。WMA格式是以減少數(shù)據(jù)流量但保持音質(zhì)的方法來達到更高的壓縮率目的,其壓縮率一般可以達到1:18。此外,WMA還可以通過DRM(數(shù)字版權(quán)管理)方案加入防止拷貝,或者加入限制播放時間和播放次數(shù),甚至是對播放機器的限制,可有力地防止盜版。目前幾乎所有的MP3播放器都支持該格式。CD是大家熟悉的音樂格式,CD光碟是使用最廣泛的音樂、歌曲存儲方式,擴展名為CDA。由于CD存儲音頻采取了音軌方式,不能直接復制出來,需通過相應(yīng)軟件進行格式轉(zhuǎn)換。如WindowsMediaPlayer播放器就可將CD音軌轉(zhuǎn)換成WMA格式的文件。RA是由RealNetworks公司推出的一種文件格式。其最大特點是可以實時傳輸音頻信息,尤其是在網(wǎng)速較慢的情況下,仍然可以較為流暢地傳送數(shù)據(jù)。因此RA主要適用于網(wǎng)絡(luò)上的在線播放?,F(xiàn)在的RA文件格式主要有RA(RealAudio)、RM(RealMedia,RealAudioG2)、RMX(RealAudioSecured)等三種,這些文件的共同性在于隨著網(wǎng)絡(luò)帶寬的不同而改變聲音的質(zhì)量,在保證大多數(shù)人聽到流暢聲音的前提下,令帶寬較寬敞的聽眾獲得較好的音質(zhì)。AU是Internet上多媒體聲音主要使用的一種文件格式。AU文件是Unix操作系統(tǒng)下的數(shù)字聲音文件,由于早期Internet上的Web服務(wù)器主要是基于Unix的,所以這種文件成為WWW上最早使用的標準聲音文件。DVDAudio是新一代數(shù)字音頻格式,與DVDVideo尺寸及容量相同,為音樂格式的DVD光碟。其采樣頻率為“48kHz/96kHz/192kHz”和“44.1kHz/88.2kHz/176.4kHz”可選擇,量化位數(shù)可以為16、20或24比特,它們之間可自由地進行組合。VOC其格式文件常出現(xiàn)在DOS程序和游戲中,它是隨聲卡一起產(chǎn)生的數(shù)字聲音文件,與WAV文件的結(jié)構(gòu)相似,可以通過一些工具軟件方便地互相轉(zhuǎn)換。4.2.傳統(tǒng)的繪畫復制成照片、錄像帶或印制成印刷品,這樣的轉(zhuǎn)化結(jié)果稱為模擬圖像(Image)。它們不能直接用電腦進行處理,還需要進一步轉(zhuǎn)化成用一系列的數(shù)據(jù)所表示的數(shù)字圖像。這個進一步轉(zhuǎn)化的過程也就是模擬圖像的數(shù)字化,通常采用采樣的方法來解決。采樣就是計算機按照一定的規(guī)律,對模擬圖像(Image)的每點所呈現(xiàn)出的表象特性,用數(shù)據(jù)的方式記錄下來的過程。這個過程有兩個核心要點:一個是采樣要決定在一定的面積內(nèi)取多少個點,或者叫多少個像素,稱為圖像的“分辨率(dpi)”。另一個核心要點是記錄每個點的特征的數(shù)據(jù)位數(shù),也就是所謂數(shù)據(jù)深度。比如記錄某個點的亮度用一個字節(jié)(8Bit)來表示,那么這個亮度可以有256個灰度級差。這256個灰度級差分別均勻地分布在由全黑(0)到全白(255)的整個明暗帶中。當然每個一定的灰度級將由一定的數(shù)值(0~255)來表示。亮度因素是這樣記錄,色相及其彩度等因素也是如此。顯然,無論從平面的取點還是記錄數(shù)據(jù)的深度來講,采樣形成的圖像(Image)與模擬圖像必然有一定的差距,必然丟掉了一些數(shù)據(jù)。但這個差距通??刂频孟喈?shù)男。灾寥说娜庋垭y以分辨,人們可以將數(shù)字化圖像等同于模擬圖像。常用的數(shù)字化圖像保存格式包括常見的圖形圖像文件格式有:BMP、JPEG、GIF、TIFF、WMF等。BMP格式:BMP(Bitmap)是Windows操作系統(tǒng)中的標準圖像文件格式,能夠被多種Windows應(yīng)用程序所支持。這種格式的特點是包含的圖像信息較豐富,幾乎不進行壓縮,但文件占用了較大的存儲空間。BMP格式支持RGB、索引顏色、灰度和位圖顏色模式、但不支持Alpha通道?;旧辖^大多數(shù)圖像處理軟件都支持此格式。JPEG格式:JPEG是由聯(lián)合照片專家組(JointPhotographicExpertsGroup)開發(fā)的。既是一種文件格式,又是一種壓縮技術(shù)。JPEG作為一種很靈活的格式,具有調(diào)節(jié)圖像質(zhì)量的功能,允許用不同的壓縮比例對這種文件壓縮。作為先進的壓縮技術(shù),它用有損壓縮方式去除冗余的圖像和彩色數(shù)據(jù),在獲取極高的壓縮率的同時能展現(xiàn)十分豐富生動的圖像。JPEG應(yīng)用非常廣泛,大多數(shù)圖像處理軟件均支持此格式。GIF文件格式:GIF(GraphicsInterchangeFormat)是CompuServe公司開發(fā)的圖像文件格式。采用了壓縮存儲技術(shù)。GIF格式同時支持線圖、灰度和索引圖像,但最多支持256種色彩的圖像。GIF格式的特點是壓縮比高,磁盤空間占用較少、下載速度快、可以存儲簡單的動畫。由于GIF圖像格式采用了漸顯方式,即在圖像傳輸過程中,用戶先看到圖像的大致輪廓,然后隨著傳輸過程的繼續(xù)而逐步看清圖像中的細節(jié)。TIFF(taggedimagefileformat)文件體積龐大,但存儲信息量亦巨大,細微層次的信息較多,有利于原稿階調(diào)與色彩的復制。該格式有壓縮和非壓縮兩種形式,最高支持的色彩數(shù)224=16M色。常用于掃描儀的圖形輸出。WMF(Windowsmetafileformat)MicrosoftWindows剪貼畫矢量圖形格式,具有文件短小、圖案造型化的特點??梢栽贛icrosoftOffice中調(diào)用編輯。4.2.3模擬視頻的數(shù)字化過程首先需要通過采樣將模擬視頻的內(nèi)容進行分解,得到每個像素點的色彩組成,然后采用固定采樣率進行采樣,并將色彩描述轉(zhuǎn)換成RGB顏色模式,生成數(shù)字化視頻。數(shù)字化視頻和傳統(tǒng)視頻相同,由幀(Frame)的連續(xù)播放產(chǎn)生視頻連續(xù)的效果,在大多數(shù)數(shù)字化視頻格式中,播放速度為每秒鐘24幀(24fps)。數(shù)字化視頻的數(shù)據(jù)量巨大,通常采用特定的壓縮算法對數(shù)據(jù)進行壓縮,根據(jù)壓縮算法的不同,保存數(shù)字化視頻的常用格式包括:AVI、MPEG/MPG/DAT、RM、WMV等。AVI(AudioVideoInterleave)是由微軟公司開發(fā)的一種數(shù)字音頻與視頻文件格式。最早僅僅用于微軟的Windows視頻操作環(huán)境(VFW,MicrosoftVideoforWindows),現(xiàn)在已被大多數(shù)操作系統(tǒng)直接支持。AVI格式允許視頻和音頻交錯在一起同步播放,但AVI文件沒有限定壓縮標準,由此就造成了同是AVI類型名的視頻文件不具有兼容性,須使用相應(yīng)的解壓縮算法才能將其播放出來。MPEG/MPG/DATVCD光盤壓縮就是采用MPEG這種文件格式。就是MovingPicturesExpertsGroup(動態(tài)圖像專家組)的縮寫,由國際標準化組織ISO(InternationalStandardsOrganization)與IEC(InternationalElectronicCommittee)于1988年聯(lián)合成立,專門致力于運動圖像(MPEG視頻)及其伴音編碼(MPEG音頻)標準化工作。MPEG是運動圖像壓縮算法的國際標準,現(xiàn)已被幾乎所有的計算機平臺共同支持。與前面某些視頻格式不同的是,MPEG采用有損壓縮方法減少運動圖像中的冗余信息從而達到高壓縮比的目的,當然這些是在保證影像質(zhì)量的基礎(chǔ)上進行的。MPEG壓縮標準是針對運動圖像而設(shè)計的,其基本方法是:在單位時間內(nèi)采集并保存第一幀信息,然后只存儲其余幀相對第一幀發(fā)生變化的部分,從而達到壓縮的目的。MPEG的平均壓縮比為50∶1,最高可達200∶1,同時圖像和音響的質(zhì)量也非常好,并且在微機上有統(tǒng)一的標準格式。RM(RealMedia)格式RM格式是RealNetworks公司開發(fā)的一種新型流式視頻文件格式,其下有三種流格式:RA(RealAudio)、RM(RealVideo)和RF(RealFlash)。RA格式用來傳輸接近CD音質(zhì)的音頻數(shù)據(jù),RM格式用來傳輸連續(xù)視頻數(shù)據(jù),而RF格式則是RealNetworks公司與Macromedia公司新近合作推出的一種高壓縮比的動畫格式。RealMedia可以根據(jù)網(wǎng)絡(luò)數(shù)據(jù)傳輸速率的不同制定了不同的壓縮比率,由RM演變而來的RMVB格式為適應(yīng)網(wǎng)絡(luò)傳輸?shù)淖兯俾矢袷?,從而實現(xiàn)在低速率的Internet上進行影像數(shù)據(jù)的實時傳送和實時播放。ASF(AdvancedStreamingFormat)格式Microsoft公司推出的AdvancedStreamingFormat(ASF,高級流格式),也是一個在Internet上實時傳播多媒體的技術(shù)標準,Microsoft公司試圖用ASF取代QuickTime之類的技術(shù)標準。ASF的主要優(yōu)點包括:本地或網(wǎng)絡(luò)回放、可擴充的媒體類型、部件下載、以及擴展性等。WMV(WindowsMediaVidoe)格式WMV格式是在Microsoft公司W(wǎng)indowsMedia核心的ASF格式上升級延伸而來的。它是一種數(shù)據(jù)格式,音頻、視頻、圖像以及控制命令腳本等多媒體信息通過這種格式以網(wǎng)絡(luò)數(shù)據(jù)包的形式傳輸,實現(xiàn)流式多媒體內(nèi)容發(fā)布。WMV最大優(yōu)點就是體積小,具有播放認證控制,因此適合網(wǎng)絡(luò)傳輸。4.3數(shù)據(jù)編碼及壓縮從前幾節(jié)多媒體數(shù)據(jù)的表示中可看到,數(shù)據(jù)量大是多媒體的一個基本特性。例如,一幅具有中等分辨率(640×480)的24位真彩色數(shù)字視頻圖像的數(shù)據(jù)量大約在1MB(兆字節(jié))/幀,如果每秒播放25幀圖像,將需要25MB的硬盤空間。對于音頻信號,若取樣頻率采用44.1kHz(千赫茲),每個采樣點量化為16位二進制數(shù),1分鐘的錄音產(chǎn)生的文件將占用l0MB的硬盤空間。由此可見,若不進行壓縮處理,計算機系統(tǒng)幾乎無法對它們進行存儲和交換處理。另一方面,圖像、聲音的壓縮潛力很大。例如在視頻圖像中,各幀圖像之間有著相同的部分,因此數(shù)據(jù)的冗余度很大,壓縮時原則上可以只存儲相鄰幀之間的差異部分。數(shù)據(jù)壓縮是通過編碼的技術(shù)來降低數(shù)據(jù)存儲時所需的空間,當需要使用時,再進行解壓縮。根據(jù)對壓縮后的數(shù)據(jù)經(jīng)解壓縮后是否能準確地恢復壓縮前的數(shù)據(jù)來分類,可將其分成無損壓縮和有損壓縮兩類。衡量數(shù)據(jù)壓縮技術(shù)的好壞有四個重要的指標:壓縮比:即壓縮前后所需的信息存儲之比要大?;謴托Ч杭匆M可能恢復到原始數(shù)據(jù)。速度:即壓縮、解壓縮的速度,尤其解壓縮速度更為重要,因為解壓縮是實時的。開銷:實現(xiàn)壓縮的軟、硬件開銷要小。4.3.無損壓縮的方法原理是統(tǒng)計被壓縮數(shù)據(jù)中重復數(shù)據(jù)的出現(xiàn)次數(shù)來進行編碼。無損壓縮由于能確保解壓后的數(shù)據(jù)不失真,一般用于文本數(shù)據(jù)、程序以及重要圖片和圖像的壓縮。無損壓縮比一般為2:l到5:l,因此不適合實時處理圖像、視頻和音頻數(shù)據(jù)。典型的無損壓縮軟件有WinZip、WinRAR軟件等。典型的無損壓縮編碼有行程編碼(Run-LengthEncoding,RLE)、哈夫曼編碼(Huffman)、算術(shù)編碼等。4.3.有損壓縮方法是以犧牲某些信息(這部分信息基本不影響對原始數(shù)據(jù)的理解)為代價,換取了較高的壓縮比。有損壓縮具有不可恢復性,也就是還原后的數(shù)據(jù)與原始數(shù)據(jù)存在差異。一般用于圖像、視頻和音頻數(shù)據(jù)的壓縮,壓縮比高達幾十到幾百倍。例如,在位圖圖像存儲形式的數(shù)據(jù)中,像素與像素之間無論是列方向或行方向都具有很大的相關(guān)性,因此數(shù)據(jù)的冗余度很大,在允許一定限度的失真下,能夠?qū)D像進行大量的壓縮。這里所說的失真,是指在人的視覺、聽覺允許的誤差范圍內(nèi)。有損壓縮編碼種類很多,典型的編碼有:預(yù)測編碼、PCM編碼、變換編碼、矢量編碼等。由于多媒體信息的廣泛應(yīng)用,為了便于信息的交流、共享,對于視頻和音頻數(shù)據(jù)的壓縮有專門的組織制定壓縮編碼的國際標準和規(guī)范,主要有JPEG和MPEG兩種類型的標準。4.320世紀80年代,國際標準化組織(ISO)和國際電信聯(lián)盟(ITU)聯(lián)合成立了兩個專家組:聯(lián)合圖像專家組(JointPhotographicExpettsGroup,JPEG)和運動圖像專家組(MovingPictureExpertsGroup,MPEG),分別制定了靜態(tài)和動態(tài)圖像壓縮的工業(yè)標準,從20世紀90年代初陸續(xù)公布實施,使得圖像編碼壓縮技術(shù)得到了飛快發(fā)展。1)JPEG標準該標準適用于連續(xù)色調(diào)和多級灰度的靜態(tài)圖像。一般對單色和彩色圖像的壓縮比通常分別為10:1和15:1。常用于CD.ROM、彩色圖像傳真和圖文管理。許多Web瀏覽器都將JPEG圖像作為一種標準文件格式以供欣賞。比如用Windows的“畫圖”程序以bmp格式保存控制面板的界面,文件大小為747KB,若以JPEG方式壓縮成擴展名為.jpg文件,則文件大小為59KB,壓縮比為12:l。2)MPEG標準該標準不僅適用于運動圖像,也適用于音頻信息,它包括了三部分:MPEG視頻、MPEG音頻、MPEG系統(tǒng)(視頻和音頻的同步),MPEG視頻是MPEG標準的核心。MPEG已指定了MPEG-l、MPEG-2、MPEG-4、MPEG-7和MPEG-21等多種標準。MPEG-l是為有限帶寬傳輸設(shè)計的,數(shù)據(jù)傳輸率為1-1.5Mb/s,平均壓縮比50:1??蛇_到一般錄象機所要求的質(zhì)量,常用于VCD壓縮,一部120分鐘長的電影可壓縮到1.2GB左右。MPEG-2是為高帶寬傳輸設(shè)計的,數(shù)據(jù)傳輸率為4~10Mb/s,壓縮比高達200:1??芍С植シ鸥哔|(zhì)量的數(shù)字式電視,常用于DVD壓縮。MPEG-4是“甚低速率視聽編碼”標準,數(shù)據(jù)傳輸率小于64kb/s。應(yīng)用在移動多媒體通信、互聯(lián)網(wǎng)、實時多媒體監(jiān)控以及其他低數(shù)據(jù)傳輸速率的場合。早期對于MPEG格式的文件需要特殊的硬件(如MPEG視頻卡)進行壓縮和解壓縮?,F(xiàn)在由于計算機速度的加快,已經(jīng)不需要特殊的硬件進行壓縮和解壓縮就可以直接播放了。4.4多媒體應(yīng)用系統(tǒng)多媒體應(yīng)用系統(tǒng)根據(jù)應(yīng)用領(lǐng)域不同有許許多多的產(chǎn)品誕生。常見的有IP電話、多媒體視頻會議系統(tǒng)、網(wǎng)絡(luò)視頻點播系統(tǒng)等。4.4.Windows操作系統(tǒng)的多媒體工具有:錄音機、畫圖板、媒體播放器(WindowsMediaPlayer,簡稱WMP)、影片編輯器(WindowsMovieMaker,簡稱WMM)等。錄音機簡單的音頻錄音機,只能錄制不超過60秒的音頻。該錄音機錄的是通過麥克風、線路輸入、CD播放或電腦能播放出來的聲音,如動畫、電影的聲音、網(wǎng)絡(luò)音視、頻聊天聲音等。畫圖(MSPaint)Windows附件中集成的畫圖板,可以進行簡單的單層、真彩色(24位)圖像編輯軟件。有簡單的繪圖工具(各種線條、圖形、取色、著色、RGB調(diào)色板、橡皮檫、文字等),能勝任簡單的圖像繪制。媒體播放器(WMP)Windows媒體播放中心,可以進行常見格式的音頻、視頻文件播放。也可以聯(lián)網(wǎng)播放MS的流媒體文件(asf、wmv等)。影片編輯器(WMM)WindowsMovieMaker,是微軟的一款小型影片編輯器軟件,需要先到官方網(wǎng)站下載安裝后才能使用。該軟件能將自己錄制的視頻素材,經(jīng)過剪輯、配音等編輯加工,制作成富有藝術(shù)魅力的個人電影;它也可以將大量的照片進行巧妙的編排,配上背景音樂,還可以加上自己錄制的解說詞和一些精巧特技,加工制作成電影式的電子相冊。4.41)音樂制作除了Windows的“錄音機”可以錄制聲音、抓取音樂外,還可以利用美國CakeWalk軟件公司的CakeWalkPro軟件進行音樂處理。其主要功能有:音樂的播放、錄音及相關(guān)控制;以五線譜形式創(chuàng)作或復制音樂,生成wrk或MIDI音樂文件;使用模擬鋼琴進行演奏并自動記錄、生成MIDI文件。2)圖形圖像制作①圖像編輯圖像編輯主要用于創(chuàng)建和修改位圖文件。位圖文件中,圖像由成千上萬個像素點組成,就像計算機屏幕顯示的圖像一樣。目前較流行的軟件有AdobePhotoshop、CorelPhoto等。②繪圖程序繪圖程序主要用于修改矢量圖形、圖像。應(yīng)用在創(chuàng)作雜志、書籍等出版物上的藝術(shù)線圖以及工程和三維模型。常用的有AdobeIllustrator、CorelDRAW等。3)動畫制作在中國市場,二維動畫當數(shù)AdobeFlash,三維動畫軟件中,簡單的有LightWave和3dsmax,具有專業(yè)水平的有Maya、Softimage和Hunidi。由于3dsmax是最早面市的基于個人計算機的三維動畫軟件,在中國擁有大量固定用戶,也有很多人為其開發(fā)插件,并且該軟件對系統(tǒng)要求不高,所以很多人用它進行游戲開發(fā)和各種設(shè)計。4)視頻影像處理AdobePremiere是眾多影視處理軟件中最具代表性的軟件,它不僅能錄制視頻信號,還能對影

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論