計算機硬件技術(shù)計算機多媒體技術(shù)_第1頁
計算機硬件技術(shù)計算機多媒體技術(shù)_第2頁
計算機硬件技術(shù)計算機多媒體技術(shù)_第3頁
計算機硬件技術(shù)計算機多媒體技術(shù)_第4頁
計算機硬件技術(shù)計算機多媒體技術(shù)_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第8章多媒體技術(shù)

本章要點

?8.1多媒體技術(shù)概述

?8.2音頻技術(shù)

?8.3數(shù)字視頻技術(shù)

?8.4虛擬現(xiàn)實

?8.5視頻制作實例

?習題

首頁■上一頁I下一頁■尾頁■結(jié)束I返回?調(diào)音

本章邏輯結(jié)構(gòu)

18.1多媒體技術(shù)概述

8.1.1多媒體及有關(guān)名詞地定義

8.1.2多媒體計算機

8.1.3多媒體數(shù)據(jù)壓縮與編碼技術(shù)

8.1.4多媒體系統(tǒng)地數(shù)據(jù)與文件格式

首頁■上一頁I下一頁■尾頁■結(jié)束I返回?調(diào)音

本章邏輯結(jié)構(gòu)

?8.2音頻技術(shù)

8.2.1數(shù)字音頻地基本概念

T22音頻數(shù)據(jù)采樣與處理

8.2.3語音識別技術(shù)

8.2.4音頻處理硬件與軟件

?8.3數(shù)字視頻技術(shù)

8.3.1視頻地基本概念

8.3.2視頻采集卡

8.3.3視頻數(shù)據(jù)地采集與處理

8.3.4流媒體

8,3.2視頻處理軟件

首頁■上一頁I下一頁■尾頁■結(jié)束I返回?調(diào)音

本章邏輯結(jié)構(gòu)

?8.4虛擬現(xiàn)實

8.4.1虛擬現(xiàn)實設備

8.4.2虛擬現(xiàn)實技術(shù)地分類

8.4.33D環(huán)境地建立

?8.5視頻制作實例

?習題

首頁■上一頁I下一頁■尾頁■結(jié)束I返回?調(diào)音

8.1多媒體技術(shù)概述

8.1.1多媒體及有關(guān)名詞地定義

1.媒體地定義

我們通常所說地“媒體“(Media)包括兩層意義。一是指信息地

物理載體(即存儲與傳遞信息地實體),如書本,掛圖,磁盤,光盤,

磁帶以及有關(guān)地播放設備等;另一層意義是指信息地表現(xiàn)形式(或

者說傳播形式),如文字,聲音,圖像,動畫等。

?2.多媒體地定義

?多媒體地英文單詞是Multimedia,它由multi與media兩部分

組成??梢岳斫鉃槎喾N媒體地綜合。但是,多媒體并不是簡單

地將多種媒體組合,而是有機地結(jié)合在一起,以達到與用戶進行

互動與交流地系統(tǒng);如電視節(jié)目包含圖像,聲音等信息,但人們

并不把電視稱為多媒體。

8.1多媒體技術(shù)概述

F.多媒體技術(shù)地定義

?多媒體技術(shù)不是各種信息媒體地簡單復合,它是一種把文本(Text),圖形

(Graphics),圖像(Images),動畫(Animation)與聲音(Sound)等形式

信息結(jié)合在一起,并通過計算機進行綜合處理與控制,能支持完成一系列交互式

操作地信息技術(shù)。多媒體技術(shù)地發(fā)展改變了計算機地使用領(lǐng)域,使計算機由辦

公室,實驗室中地專用品變成了信息社會地普通工具,廣泛應用于工業(yè)生產(chǎn)管理,

學校教育,公共信息咨詢,商業(yè)廣告,軍事指揮與訓練,甚至家庭生活與娛樂等領(lǐng)

域。

?4.多媒體技術(shù)地特點。

?(1)數(shù)字化

?(2)集成性

?(3)交互性

?(4)實時性

8.1多媒體技術(shù)概述

一.多媒體技術(shù)地應用

?目前,多媒體技術(shù)地應用領(lǐng)域已經(jīng)十分廣泛,它不僅覆蓋了絕大部分地計算機

應用領(lǐng)域,而且還拓展了新地應用領(lǐng)域。借助日益普及地高速信息網(wǎng),被廣泛

應用在咨詢服務,圖書,教育,通信,軍事,金融,醫(yī)療等諸多行業(yè),

并正潛移默化地改變著我們生活地面貌。

(1)多媒體視頻會議系統(tǒng)

多媒體視頻會議系統(tǒng)是以會議地形式實現(xiàn)在不同地理位置上地人們地交流,

包括語言,圖像,動畫,視頻,數(shù)據(jù)等地傳遞與交流??梢源蟠筇岣吖ぷ餍省?/p>

?(2)多媒體遠程教育

?多媒體遠程教育實現(xiàn)了學員在家中進行學習地愿望,為人們提供了更多,更好

地學習機會。而且還可以利用多媒體地多種表現(xiàn)形式及網(wǎng)絡地即時特點,讓學

員打破傳統(tǒng)地教學模式,增加師生互動,自己調(diào)整學習地進度,無疑增

加了學習地時間,延伸了學習地空間

(3)多媒體遠程醫(yī)療系統(tǒng)

多媒體遠程醫(yī)療系統(tǒng)可以為偏遠地區(qū)地人們提供醫(yī)療服務;如請醫(yī)學專家進行遠程

會診,指導當?shù)氐蒯t(yī)生進行復雜手術(shù)等。

8.1多媒體技術(shù)概述

(4)多媒體數(shù)據(jù)庫系統(tǒng)

多媒體數(shù)據(jù)庫是數(shù)據(jù)庫技術(shù)與多媒體技術(shù)相結(jié)合地產(chǎn)物。它可以將文

本,數(shù)據(jù),圖形,圖像,聲音,視頻等多種媒體地信息集成管理與表示,而

且可以對多媒體數(shù)據(jù)庫信息進行檢索與查詢,使之應用到更為廣泛地

領(lǐng)域中。

(5)多媒體圖書館與電子出版物

近年來,電子出版物以其信息容量大,易于檢索,成本低等優(yōu)點得到

了迅速地發(fā)展。并且取代了一些傳統(tǒng)地出版物。利用CD—ROM大容

量地存儲空間與多媒體聲像功能地結(jié)合還可以提供百科全書,旅游指

南系統(tǒng),地圖系統(tǒng)等電子工具與電子辭典,技術(shù)手冊與電子書刊等電子

出版物。

8.1多媒體技術(shù)概述

8.1.2多媒體計算機

1.多媒體計算機地定義

多媒體計算機地英文全稱為MultimediaPersonalputer,簡稱MPC。相對于一般地

PC(個人計算機),多媒體計算機增加了一些多媒體部件(包括硬件與軟件),使得

計算機具有多媒體處理能力。

2.多媒體計算機系統(tǒng)

多媒體系統(tǒng)是一個能處理多媒體信息地計算機系統(tǒng)。它是在現(xiàn)有PC計算機基礎上加上

硬件板卡與相應地軟件,使其能對多媒體信息進行獲取,編輯,加工,處理,存取與輸出。

多媒體計算機系統(tǒng)與普通計算機一樣,也是由多媒體硬件與多媒體軟件兩部分組成。其

核心是一臺計算機,外圍主要是視聽等多種媒體設備。因此,簡單地說,多媒體系統(tǒng)地硬

件是計算機主機及可以接收與播放多媒體信息地各種輸入/輸出設備,其軟件是音頻/視頻

處理核心程序,多媒體操作系統(tǒng)及各種多媒體工具軟件與應用軟件。

8.1多媒體技術(shù)概述

8.1.3多媒體數(shù)據(jù)壓縮與編碼技術(shù)

在多媒體計算機系統(tǒng)中,為了達到令人滿意地圖像,視頻畫面質(zhì)量與聽覺效果,需

要解決視頻,圖像,音頻信號數(shù)據(jù)地大容量存儲與實時傳輸問題。

解決地方法,除了提高計算機本身地性能及通信信道地帶寬外,更重要地是對多媒

體進行有效地壓縮。圖形,視頻動畫與音頻等多媒體數(shù)據(jù)一般都存在大量地冗余,

比如常用地位圖格式地圖像數(shù)據(jù)中,像素與像素之間無論在行方向還是在列方向

都具有很大地有關(guān)性,因而整體上數(shù)據(jù)地冗余度很大,使用數(shù)學方法來表示這些重

復數(shù)據(jù)就可以減少數(shù)據(jù)量。這種采用去掉冗余地壓縮方法叫做無損壓縮。還可以

利用人地視覺對于邊緣急劇變化不敏感與對圖像地亮度信息敏感,對顏色分辨率

弱地特點,舍棄一些非主要地細節(jié),在允許一定限度失真地前提下,對圖像數(shù)據(jù)進

行壓縮。這種壓縮方法叫做有損壓縮。

8.1多媒體技術(shù)概述

1.文本文件地壓縮

文本文件地壓縮是因為文本文件中有大量地空格與重復地詞組,采用自適應模

式替換與指針壓縮等方法就可以大幅度減少文本地大小。

自適應地模式替換掃描整個文本并且尋找相同模式,用一個符號代替這種模式。

比如用來替代"the「the”占用了三個字節(jié),但“#"只有一個字節(jié)。

每次替代會節(jié)省兩個字節(jié)。采用自適應模式替換技術(shù)時,當文檔中含有大量重

復信息時,壓縮地效果越好。文件越長,更有可能包含重復信息,壓縮效果也越

好。

2.圖形文件壓縮

原始位圖圖像文件很大,但是它們通常包含有可以壓縮地重復地數(shù)據(jù),如一大塊

同一種顏色地區(qū)域等,這就可以采用游程編碼地技術(shù)進行壓縮。

游程編碼又稱“運行長度編碼”或“行程編碼”,是一種統(tǒng)計編碼,該編碼屬于

無損壓縮編碼,是柵格數(shù)據(jù)壓縮地重要編碼方法。

游程編碼地基本原理是:用一個符號值或串長代替具有相同值地連續(xù)符號,使符

號長度少于原始數(shù)據(jù)地長度。只在各行或者各列數(shù)據(jù)地代碼發(fā)生變化時,一次

記錄該代碼及相同代碼重復地個數(shù),從而實現(xiàn)數(shù)據(jù)地壓縮。

8.1多媒體技術(shù)概述

頻文件壓縮

視頻壓縮技術(shù)是將某個視頻格式地文件轉(zhuǎn)換成另一種視頻格式文件地方式。目前視

頻流傳輸中最為重要地編解碼標準有國際電聯(lián)地H.261,H.263,運動靜止圖像專家

組地M-JPEG與國際標準化組織運動圖像專家組地MPEG系列標準,此外在互聯(lián)網(wǎng)

上被廣泛應用地還有Real-works地RealVideo,微軟公司地WMV以及Apple公司地

QuickTime等。

8.1.4多媒體系統(tǒng)地數(shù)據(jù)與文件格式

1.圖形圖像與視頻表示

(1)位圖

(2)矢量圖

(3)灰度圖與彩色圖

(4)數(shù)字視頻

8.1多媒體技術(shù)概述

2.常見地圖形圖像與視頻文件格式

(1)BMP文件(靜態(tài)圖像文件)

(2)PCX文件(靜態(tài)圖像文件)

(3)GIF文件(靜,動態(tài)圖像文件)

(4)JPEG文件(靜態(tài)圖像文件)

(5)PNG文件(靜態(tài)圖像文件)

(6)TIEF文件(靜態(tài)圖像文件)

(7)WMF文件(靜態(tài)圖像文件)

(8)RIFF文件(資源交換文件格式)

(9)AVI文件(動態(tài)影像文件)

(10)Indeo文件(動態(tài)影像文件)

(11)MPEG文件(動態(tài)影像文件)

(12)MOV文件(動態(tài)影像文件)

(13)MIDI文件(音樂文件)

8.2音頻技術(shù)

聲音是由振動產(chǎn)生地。所謂地聲音頻率,就是發(fā)聲源地振動頻率。頻率地單位

是赫茲(HERZ,以證實電磁波存在地德國物理學家赫茲地名字命名),也就是1

秒內(nèi)振動地次數(shù)。大自然及人類可能制造出地聲音,從1赫茲,到幾十萬赫茲,范

圍跨度極大,但并不是所有地聲波振動人耳都能聽到。音頻是指人類能夠聽到地

所有聲音,正常人耳地音頻范圍一般約為20Hz?20kHz。聲音被錄制下來以后,無

論是說話聲,歌聲,樂器都可以通過數(shù)字音樂軟件處理,或是把它制作成CD,這時

候所有地聲音沒有改變,因為CD本來就是音頻文件地一種類型。而音頻只是儲存

在計算機里地聲音。如果有計算機再加上相應地音頻卡——就是我們經(jīng)常說地聲

卡,我們可以把所有地聲音錄制下來,聲音地聲學特性如音地高低等都可以用計算

機硬盤文件地方式儲存下來。反過來,我們也可以把儲存下來地音頻文件用一定

地音頻程序播放,還原以前錄下地聲音。

8.2音頻技術(shù)

8.2.1數(shù)字音頻地基本概念

1.聲音地定義

用物理學地方法分析,聲音是一種波。描述聲音特征地物理量有聲波地振幅(

Amplitude),周期(Period)與頻率(Frequency)0因為頻率與周期互為倒數(shù)

,因此,一般只用振幅與頻率兩個參數(shù)來描述聲音。其中,頻率反映聲音地高低,

振幅反映聲音地大小。聲音中含有高頻成分越多,音調(diào)就越高,也就是越尖,反

之則越低;聲音地振幅越大,聲音則越大,反之則越小。需要指出地是,現(xiàn)實世界

地聲音不是由某個頻率或某幾個頻率組成,而是由許多不同頻率不同振幅地正

弦波疊加而成。

2.聲音地分類

(1)亞音頻(Infrasound)0Hz-20Hz

(2)音頻(Audio)20Hz?20KHz

(3)超音頻(Ultrasound)20KHz?1GHz

(4)過音頻(Hypersound)1GHz-ITHz

8.2音頻技術(shù)

3.音頻

音頻(Audio)是用聲音地頻率界定地,指頻率在20Hz~20KHz范圍內(nèi)地聲波。音頻所

覆蓋地聲音頻率是人地耳朵所能聽到地聲音。

4.模擬音頻

人們從自然界中獲得地聲音信號與通過傳聲器得到地聲音電信號等在時間與幅度上都

是連續(xù)變化地,這樣地信號稱為模擬信號。模擬音頻是指隨時間連續(xù)變動地聲音波形

地模擬記錄形式,通常采用電磁信號對聲音波形進行模擬記錄。

5.數(shù)字音頻

數(shù)字音頻是模擬聲音進入計算機后地一種記錄與存儲形式。模擬聲音在時間與幅度上

是連續(xù)地,聲音地數(shù)字化是通過采樣,量化與編碼,把模擬量表示地音頻信號轉(zhuǎn)換成由

許多二進制數(shù)1與。組成地數(shù)字音頻信號。數(shù)字音頻是一個數(shù)據(jù)序列,在時間與幅度

上是斷續(xù)地。計算機內(nèi)地基本數(shù)制是二進制,在處理聲音時需要進行數(shù)字化。為此要

把聲音數(shù)據(jù)寫成計算機地數(shù)據(jù)格式。將連續(xù)地模擬音頻信號轉(zhuǎn)換成有限個數(shù)字表示地

離散序列(即實現(xiàn)音頻數(shù)字化),使時間上連續(xù)變化地波形聲音變?yōu)橐淮?,1構(gòu)成地

數(shù)字序列,這種數(shù)字序列就是數(shù)字音頻。在這一處理技術(shù)中,涉及到音頻地采樣,量化

與編碼。光盤,硬盤都可以作為數(shù)字音頻地記錄媒體。

8.2音頻技術(shù)

8.2.2音頻數(shù)據(jù)采樣與處理

]采樣

星樣(sampling)是在某個特定地時刻對模擬信號進行測量。一般是每隔一

定時間對模擬信號地幅值進行測量,得到離散地幅值,用它代表兩次采樣之

間地模擬值。每一次采樣都記錄下了原始模擬聲波在某一時刻地狀態(tài),稱

之為樣本。

2.量化

采樣把模擬信號變成了時間上離散地樣值序列,但每個樣值地幅度仍然是一個

連續(xù)地模擬量,因此還需要對其進行離散化處理,將其轉(zhuǎn)換為有限個離散值,

才能最終與數(shù)碼來表示其幅值。也就是還需要用某種數(shù)字化地方法來反映

某一瞬間聲波幅度地電壓值地大小,該值地大小影響音量地高低。我們把聲

波波形幅度地數(shù)字化表示稱為量化。量化過程是將采樣值在幅度上再進行

離散化處理地過程。先將采樣后地信號按整個聲波地幅度劃分為有限個區(qū)

段地量化階集合,把落入某個量化階內(nèi)地采樣值都賦予相同地值,即量化

值。

8.2音頻技術(shù)

8.2.2音頻數(shù)據(jù)采樣與處理

3.編碼

音頻編碼方法有三種類型:波形編碼,參數(shù)編碼,混合編碼。波形編碼是盡量保

持輸入波形不變,即重建地語音信號基本上與原始語音信號波形相同,壓縮

比較低;參數(shù)編碼是要求重建地信號聽起來與輸入語音一樣,但其波形可以

不同,它是以語音信號所產(chǎn)生地數(shù)學模型為基礎地一種編碼方法,壓縮比較

高;混合編碼是綜合了波形編碼地高質(zhì)量潛力與參數(shù)編碼地高壓縮效率地混

合編碼地方法,這類方法也是目前低碼率編碼地方向。

4.模/數(shù)轉(zhuǎn)換質(zhì)量地技術(shù)指標

(1)采樣頻率。

(2)采樣精度。

(3)pa]首卷勺

5.數(shù)字音頻加存儲空間

存儲容量(字節(jié))二采樣頻率x(采樣精度/8)x聲道數(shù)x時間

8.2音頻技術(shù)

8.2.3語音識別技術(shù)

語音識別技術(shù)(AutomaticSpeechRecognition,ASR),又稱為自動語音識別,其

目的是將人類地語音中地詞匯內(nèi)容轉(zhuǎn)換為計算機可讀地輸入。也就是讓機

器聽懂人類地語音。它是語音信號處理地一個重要研究方向,是模式識別

地一個分支,涉及到生理學,心理學,語言學,計算機科學以及信號處理等諸

多領(lǐng)域,甚至還涉及到人地體態(tài)語言(如人在說話時地表情,手勢等行為動

作可幫助對方理解),其最終目的是實現(xiàn)人與機器進行自然語言通信。

1.語音識別系統(tǒng)地分類

2.語音識別系統(tǒng)地工作原理

(1)語音識別單元地選取

(2)特征參數(shù)提取

(3)模式匹配及模型訓練技術(shù)

8.2音頻技術(shù)

3.=語音識別技術(shù)地應用領(lǐng)域

語音識別技術(shù)應用于需要以語音作為人機交互手段地場合,主要是實現(xiàn)聽寫與命令

控制功能。語音識別技術(shù)地應用主要有以下兩個方面。一是用于人機交流。使用

鍵盤,鼠標與電子計算機進行交流地這種方式,使許多非專業(yè)人員,特別是不懂英

語或不熟悉漢語拼音地人被拒之于門外,影響到電子計算機地進一步普及。語音

識別技術(shù)地采用,改變了人與計算機地互動模式,人們只需動動口,就能打開或關(guān)

閉程序,改變工作界面。這種使電腦人性化地結(jié)果是使人地雙手得到解放,使每個

人都能操作與應用計算機。另外,電話仍是目前使用最為普遍地通信工具,通過電

話與語音識別系統(tǒng)地協(xié)同工作,可以實現(xiàn)語音撥號,電話購物以及通過電話辦理銀

行業(yè)務,炒股,上網(wǎng)檢索信息或處理電子件等。不久,能根據(jù)主人口令接通電話,打

開收音機,以及通過聲紋識別來者身份地安全系統(tǒng)也將獲得應用?,F(xiàn)在越來越多

地功能處理器與先進地軟件已經(jīng)實現(xiàn)把聲音與語音功能集成到微機系統(tǒng)中,借助

于具有命令識別能力地多媒體操作系統(tǒng)與具有語音識別能力地數(shù)據(jù)庫系統(tǒng),語音

可以命令與控制計算機像代理一樣為用戶處理各種事務,從而極大地提高用戶地

工作效率。

8.2音頻技術(shù)

8.2.4音頻處理硬件與軟件

1.聲音處理硬件——音頻卡(聲卡)

聲卡(SoundCard)也叫音頻卡,是多媒體技術(shù)中最基本地組成部分,它是實現(xiàn)

聲波/數(shù)字信號相互轉(zhuǎn)換地一種硬件。

(1)聲卡地工作原理

①通過聲卡及相應地驅(qū)動程序地控制,采集來自話筒,收錄機等音源地信號,

壓縮錄制成數(shù)字聲音文件后被存放在計算機系統(tǒng)地內(nèi)存或硬盤中;

②將硬盤或激光盤壓縮地數(shù)字化聲音文件還原成高質(zhì)量地聲音信號,放大后通

過揚聲器放出;

③對數(shù)字化地聲音文件進行加工,以達到某一特定地音頻效果;

④控制音源地音量,對各種音源進行組合,實現(xiàn)混響器地功能;

⑤利用語言合成技術(shù),通過聲卡朗讀文本信息;

⑥具有初步地音頻識別功能,讓操作者用口令指揮計算機工作;

⑦提供MIDI功能,使計算機可以控制多臺具有MIDI接口地電子樂器。

8.2音頻技術(shù)

8.2.4音頻處理硬件與軟件

(2)聲卡地類型

目前市場地聲卡主要分為式,集成式與外置式三種接口類型。

(3)聲卡地結(jié)構(gòu)

(4)聲卡地性能指標

①采樣位數(shù)

②采樣頻率

③MIDI(MusicalInstrumentDigitalInterface,音樂設備數(shù)字接口)功能

④信噪比(SignaltoNoiseRatio,SNR)

⑤支持地聲道數(shù)

⑥數(shù)字信號處理

8.2音頻技術(shù)

(5)聲卡地選購

①選擇集成聲卡還是獨立聲卡

②注意聲卡地做工

③兼容性

④試聽

2.聲音處理軟件

(1)錄音,混音與音頻編輯軟件

①Windows自帶地錄音機

②多聲道錄放與特效處理軟件

(2)音樂創(chuàng)作,編曲,音源合成軟件

(3)效果器軟件

(4)音頻文件格式轉(zhuǎn)換軟件

?尊黑字視頻^

視頻(Video)泛指將一系列地靜態(tài)影像以電信號方式加以捕捉,紀錄,

處理,儲存,傳送與重現(xiàn)地各種技術(shù)。視頻是多媒體應用地基本元

視頻其實是由許多幅單一地畫面構(gòu)成地,每一幅畫面稱為幀。當

快速播放幀時,由于人眼地滯留效應而產(chǎn)生連續(xù)運動地效果,所以幀

是視頻信息構(gòu)成地最基本單位。

8.3.1視頻地基本概念

1.視頻地制式

(1)PAL制式

(2)NTSC制式

2.視頻數(shù)字化

標準地NTSC與PAL等制式視頻信號都是模擬信號,而計算機采用二

進制數(shù)據(jù)表示,所以要讓計算機處理視頻信息,需要先對視頻信號進

行數(shù)字化處理。視頻信號地數(shù)字化與音頻信號數(shù)字化相同,也是對

視頻信號進行采樣捕獲,將采樣數(shù)值加以保存。視頻數(shù)字化其實是

在一定時間以一定地速度對視頻信號進行捕獲并加以采樣后形成數(shù)

字化數(shù)據(jù)。

8.3數(shù)字視頻技術(shù)

3.視頻編輯

視頻信號采樣后,就可以進行加工與編輯,比如刪除,改變視頻格式等,常用

地視頻編輯軟件有Adobe公司地Premiere與Microsoft公司地VideoForWindows

VFW)oPremiere軟件功能比較強,可以編輯與組接各種視頻片段,添加過渡效

果,字幕,圖標與配音等。常用地視頻格式有.avi,.mov,.mpg,.rm等。

832視頻采集卡

加器采集卡又稱視頻捕捉卡,是安裝在計算機擴展槽上地硬卡,可以從電視,硬

碟,攝像機等視頻源捕捉采集視頻信號并進行數(shù)字化,存儲,輸出與其它處理

操作。

1.視頻是集卡地工作原理

多通道地視頻輸入用來接收視頻輸入信號,視頻源信號首先經(jīng)A/D(模/數(shù))轉(zhuǎn)換

器將模擬信號轉(zhuǎn)換成數(shù)字信號,然后由視頻采集控制器對其進行剪裁,改變比

例后壓縮存入幀存儲器。輸出模擬視頻時,幀存儲器地內(nèi)容經(jīng)D/A(數(shù)/模)

轉(zhuǎn)換器把數(shù)字信號轉(zhuǎn)換成模擬信號輸出到電視機或錄像機中。

8.3數(shù)字視頻技術(shù)

2.視頻采集卡地分類

按照視頻采集地圖像指標與用途不同,視頻采集卡可分為廣播級視頻采集卡,

專業(yè)級視頻采集卡與民用級視頻采集卡。

3.視頻采集卡地性能指標

(1)總線接口

(2)實時壓縮功能

(3)采集分辨率與幀頻

8.3.3視頻數(shù)據(jù)地采集與處理

1.視頻采集

模擬視頻信號從模擬視頻輸出源輸出,比如錄像機,電視機,攝像機等,視頻采集

卡對這些模擬信號進行采集,量化與編碼,轉(zhuǎn)換為二進制數(shù)字信息。

2.視頻編輯

模擬視頻數(shù)字化以后,可以直接使用與播放,但通常還需要利用一些編輯軟件

進行編輯,比如加入字幕,老電影效果,刪除等操作。視頻編輯一般分為線性

編輯與非線性編輯兩種。

8.3數(shù)字視頻技術(shù)

3.視頻輸出

有時候需要把數(shù)字視頻文件轉(zhuǎn)換成模擬視頻信號輸出到電視機上進行顯示,或

輸出到錄像機記錄到磁帶上。數(shù)字視頻輸出是數(shù)字視頻采集地逆向過程,需

要專門設備來完成數(shù)字信號到模擬信號地轉(zhuǎn)換。有地視頻采集卡帶有視頻

輸入與輸出接口,可以直接實現(xiàn)視頻輸出。

8.3.4流媒體

流媒體(StreamingMedia)是一種可以使音頻,視頻與其它多媒體能在網(wǎng)絡上

以實時地,無需下載等待地方式進行播放地技術(shù)。流媒體文件格式是指采

用流式傳輸?shù)胤绞皆诰W(wǎng)絡上播放地媒體格式。

1.流媒體系統(tǒng)地組成

一個流媒體系統(tǒng)一般由三部分組成:流媒體開發(fā)工具,用來生成流媒體格式地

媒體文件;流媒體服務器組件,用來通過網(wǎng)絡服務器發(fā)布流媒體文件;流媒體

播放器,用于客戶端對流媒體文件地解壓與播放。

8.3數(shù)字視頻技術(shù)

2.流媒體常見地文件格式

(1)ASF格式

(2)FLV格式

(3)RA/RM/RMVB格式

(4)MOV格式

(5)SWF格式

(6)WMA格式

(7)MP3格式

(8)3Gp格式

8.3.5視頻處理軟件

1.視頻編輯軟件

(1)AdobePremiere

(2)景]

2.視頻文件源式轉(zhuǎn)換軟件

8.4虛擬現(xiàn)實

虛擬現(xiàn)實(VirtualReality)一詞源于1989年,由美國地JaronLanier

提出。虛擬現(xiàn)實簡稱VR,也稱為“人工現(xiàn)實“,“臨境”等,是多

媒體發(fā)展地更高境界,就是用計算機技術(shù)生成一個逼真地,集視,

聽,觸,嗅覺等為一體地感覺世界(或稱實體),用戶通過其感觀與這

一生成地虛擬實體進行交互溝通,如同處理真實物體一樣對待由計

算機生成地虛擬實體。概括地說,虛擬現(xiàn)實是人們通過計算機對復

雜數(shù)據(jù)進行可視化操作與交互地一種全新方式,與傳統(tǒng)地人機界面

以及流行地視窗操作相比,虛擬現(xiàn)實在技術(shù)思想上有了質(zhì)地飛躍。

虛擬現(xiàn)實中地“現(xiàn)實”是泛指在物理意義上或功能意義上存在于世

界上地任何事物或環(huán)境,它可以是實際上可實現(xiàn)地,也可以是實際

上難以實現(xiàn)地或根本無法實現(xiàn)地。而“虛擬”是指用計算機生成地

意思。因此,虛擬現(xiàn)實是指用計算機生成地一種特殊環(huán)境,人可以

通過使用各種特殊裝置將自己“投射”到這個環(huán)境中,并操作,控

制環(huán)境,實現(xiàn)特殊地目地,即人是這種環(huán)境地主宰。

8.4虛擬現(xiàn)實

從本質(zhì)上來說,虛擬現(xiàn)實就是一種先進地計算機用戶接口,它通過給

用戶同時提供諸如視覺,聽覺,觸覺等各種直觀而又自然地實時感知

交互手段,最大限度地方便用戶地操作。根據(jù)虛擬現(xiàn)實技術(shù)所應用

地對象不同,其作用可表現(xiàn)為不同地形式,例如將某種概念設計或構(gòu)

思可視化與可操作化,實現(xiàn)逼真地遙控現(xiàn)場效果,達到任意復雜環(huán)境

下地廉價模擬訓練目地等。該技術(shù)地主要特征有以下幾方面:

1.多感知性(Multi-Sensory)

2.浸沒感(Immersion)

3.交互性(Interactivity)

4.構(gòu)想性(Imagination)

8.4虛擬現(xiàn)實

8.4.1虛擬現(xiàn)實設備

在VR系統(tǒng)中,有許多有趣地,功能不同地專用設備,如圖8.15所示。

下面選一些代表性地設備加以介紹。

BOOM可移動式顯示器:它是一種半投入式視覺顯示設備。使用時,

用戶可以把顯示器方便地置于眼前,不用時可以很快移開。BOOM使

用小型地陰極射線管,產(chǎn)生地像素數(shù)遠遠小于液晶顯示屏,圖像比較柔

與,分辨率為1280x1024像素,彩色圖像。

數(shù)據(jù)手套:數(shù)據(jù)手套是一種輸入裝置,它可以把人手地動作轉(zhuǎn)化為計

算機地輸入信號。它由很輕地彈性材料構(gòu)成。該彈性材料緊貼在手上,

同時附著許多位置,方向傳感器與光纖導線,以檢測手地運動。光纖

可以測量每個手指地彎曲與伸展,而通過光電轉(zhuǎn)換,手指地動作信息

可以被計算機識別。

TELETACT手套:它是一種用于觸覺與力覺反饋地裝置,利用小氣袋

向手提供觸覺與力覺地刺激。這些小氣袋能被迅速地加壓與減壓。當

虛擬手接觸一件虛擬物體時,存儲在計算機里地該物體地力模式被調(diào)

用,壓縮機迅速對氣袋充氣或放氣,使手部有一種非常精確地觸覺。

8.4虛擬現(xiàn)實

8.4.2虛擬現(xiàn)實技術(shù)地分類

根據(jù)用戶參與VR地不同形式以及沉浸地程度不同,可以把各種類型地

虛擬現(xiàn)實技術(shù)劃分四類:

1.桌面虛擬現(xiàn)實

桌面虛擬現(xiàn)實利用個人計算機與低級工作站進行仿真,將計算機地屏

幕作為用戶觀察虛擬境界地一個窗口。通過各種輸入設備實現(xiàn)與虛擬

現(xiàn)實世界地充分交互,這些外部設備包括鼠標,追蹤球,力矩球等。它

要求參與者使用輸入設備,通過計算機屏幕觀察360度范圍內(nèi)地虛擬

境界,并操縱其中地物體,但這時參與者缺少完全地沉浸,因為它仍然

會受到周圍現(xiàn)實環(huán)境地干擾。桌面虛擬現(xiàn)實最大特點是缺乏真實地現(xiàn)

實體驗,但是成本也相對較低,因而,應用比較廣泛。常見桌面虛擬現(xiàn)

實技術(shù)有:基于靜態(tài)圖像地虛擬現(xiàn)實QuickTimeVR,虛擬現(xiàn)實造型語

言VRML,桌面三維虛擬現(xiàn)實,MUD等。

8.4虛擬現(xiàn)實

2.沉浸地虛擬現(xiàn)實

高級虛擬現(xiàn)實系統(tǒng)提供完全沉浸地體驗,使用戶有一種置身于虛擬境

界之中地感覺。它利用頭盔式顯示器或其它設備,把參與者地視覺,聽

覺與其它感覺封閉起來,并提供一個新地,虛擬地感覺空間,并利用位

置跟蹤器,數(shù)據(jù)手套,其它手控輸入設備,聲音等使得參與者產(chǎn)生一種

身臨其境,全心投入與沉浸其中地感覺。常見地沉浸式系統(tǒng)有:基于頭

盔式顯示器地系統(tǒng),投影式虛擬現(xiàn)實系統(tǒng),遠程存在系統(tǒng)。

3.增強現(xiàn)實性地虛擬現(xiàn)實

增強現(xiàn)實性地虛擬現(xiàn)實不僅是利用虛擬現(xiàn)實技術(shù)來模擬現(xiàn)實世界,仿

真現(xiàn)實世界,而且要利用它來增強參與者對真實環(huán)境地感受,也就是

增強現(xiàn)實中無法感知或不方便地感受。典型地實例是戰(zhàn)機飛行員地

平視顯示器,它可以將儀表讀數(shù)與武器瞄準數(shù)據(jù)投射到安裝在飛行員

面前地穿透式屏幕上,它可以使飛行員不必低頭讀座艙中儀表地數(shù)據(jù),

從而可集中精力盯著敵人地飛機或?qū)Ш狡睢?/p>

8.4虛擬現(xiàn)實

4.分布式虛擬現(xiàn)實

如果多個用戶通過計算機網(wǎng)絡連接在一起,同時參加一個虛擬空間,共

同體驗虛擬經(jīng)歷,那虛擬現(xiàn)實則提升到了一個更高地境界,這就是分布

式虛擬現(xiàn)實系統(tǒng)。在分布式虛擬現(xiàn)實系統(tǒng)中,多個用戶可通過網(wǎng)絡對

同一虛擬世界進行觀察與操作,以達到協(xié)同工作地目地。目前最典型

地分布式虛擬現(xiàn)實系統(tǒng)是SIM,SIM由坦克仿真器通過網(wǎng)絡連接而成,

用于部隊地聯(lián)合訓練。通過SIM,位于德國地仿真器可以與位于美國

地仿真器一樣運行在同一個虛擬世界,參與同一場作戰(zhàn)演習。

8.4虛擬現(xiàn)實

8.4.33D環(huán)境地建立

總地來說,實物虛化,虛物實化與高性能地計算處理技術(shù)是VR技術(shù)地

3個主要方面。實物虛化是現(xiàn)實世界空間向多維信息化空間地一種映

射,主要包括基本模型構(gòu)建,空間跟蹤,聲音定位,視覺跟蹤與視點感應

等關(guān)鍵技術(shù),這些技術(shù)使得真實感虛擬世界地生成,虛擬環(huán)境對用戶操

作地檢測與操作數(shù)據(jù)地獲取成為可能。它具體基于以下幾種技術(shù):

(1)基本模型構(gòu)建技術(shù)。它是應用計算機技術(shù)生成虛擬世界地基礎,

它將真實世界地對象物體在相應地3D虛擬世界中重構(gòu),并根據(jù)系統(tǒng)

需求保存部分物理屬性。例如車輛在柏油地,草地,沙地與泥地上行駛

時情況會有所不同,或?qū)庀髷?shù)據(jù)進行建模生成虛擬環(huán)境地氣象情況

(陰天,晴天,雨,霧)等等。(2)空間跟蹤技術(shù)。主要是通過頭盔顯

示器,數(shù)據(jù)手套,數(shù)據(jù)衣等常用地交互設備上地空間傳感器,確定用戶

地頭,手,軀體或其它操作物在3D虛擬環(huán)境中地位置與方向。

8.4虛擬現(xiàn)實

(3)聲音跟蹤技術(shù):利用不同聲源地聲音到達某一特定地點地時間差,

相位差,聲壓差等進行虛擬環(huán)境地聲音跟蹤。(4)視覺跟蹤與視點感

應技術(shù)。使用從視頻攝像機到X-Y平面陣列,周圍光或者跟蹤光在圖

像投影平面不同時刻與不同位置上地投影,計算被跟蹤對象地位置與

方向。

8.5視頻制作實例

以同三維地T10001394采集卡為例,介紹DV轉(zhuǎn)換為VCD地操作過程。

第一步:安裝采集卡。安裝分以下步驟完成:

①首先關(guān)閉計算機電源,打開機箱,將視頻采集卡安裝在一個空地PCI插槽上。

②從視頻采集卡包裝盒中取出螺絲,將視頻采集卡固定在機箱上。

③將攝像頭地信號線連接到視頻采集卡上。

第二步:采集。采集是把攝像機DV帶上地圖象全部采集到硬盤上。最好要有大點

地硬盤空間(一個小時地錄像需要大約15G空間)。如果已正確安裝了1394卡,

則會聲會影軟件功能列表會顯示出“捕獲”菜單項,否則它會是灰色不可用地。

第三步:編輯。按照自己需求對視頻文件進行編輯,比如場景切換,添加字幕,背景音

樂,錄制旁白等,會聲會影軟件自身帶了很多素材,可以直接利用。

第四步:壓縮。壓縮成需要地格式,比如DVD,VCD等。可將編輯好地視頻文件輸

出為AVI,MPEG,RM等格式,還可以根據(jù)會聲會影提供地摸板方便地生成符合

VCD,DVD,SVCD格式地視頻文件。

最后一步:刻盤。根據(jù)需要刻錄成DVD或VCD。會聲會影提供地刻錄功能,無需

再安裝其它刻錄軟件。

]名詞解釋

多媒體計算機位圖矢量圖有損壓縮無損壓縮模擬信號數(shù)字信號采樣量化

語音識別技術(shù)音頻卡視頻采集卡流媒體虛擬現(xiàn)實

2.填空題

(1)聲音定義是:聲音是振動波,具有_____,_______與______。

(2)數(shù)字音頻采樣與量化過程所用地主要硬件是______o

(3)我們制作地動畫與電影正是利用人眼地視覺暫留特性,如果動畫或電影地畫

面刷新率為每秒_____幅左右,則人眼看到地就是連續(xù)地畫面。

(4)通常,聲音用與中模擬地連續(xù)波形表示。波形描述了空氣地振動,波形最高點

(或最低點)與基線間地距離為_____,表示聲音地強度。波形中兩個連續(xù)波峰

間地距離稱為______o波形______由1S內(nèi)出現(xiàn)地周期數(shù)決定。

(5)YK模式是針對印刷而設計地模式。C代表_____,M代表_______,Y代表

______,K代表______,是構(gòu)成印刷上地各種油墨地原色。

(6)媒體中地_____指地是能直接作用于人們地感覺器官,從而能使人產(chǎn)生直接

感受地媒體。

(7)RGB顏色空間中地R,G,B分別是______,______,______。

(8)若采樣頻率為44100Hz,16bit(2Byte),立體聲(2聲道),則1分鐘地總數(shù)據(jù)量

為______o

(9)RGB模式主要用于_____,YK模式主要用于______o

(10)聲音是振動波,具有______,______與______o

(11)聲卡也叫音頻卡,是多媒體技術(shù)中最基本地組成部分,它是實現(xiàn)_____地一

種硬件。

(12)語音識別技術(shù)目的是將______轉(zhuǎn)換為計算機可讀地輸入。

(13)常見地電視信號制式有______與______兩種。

(14)按照視頻采集地圖像指標與用途不同,視頻采集卡可分為_____,_______與

(15)二個流媒體系統(tǒng)一般由三部分組成:_____,用來生成流媒體格式地媒體文

件;_____,用來通過網(wǎng)絡服務器發(fā)布流媒體文件;______,用于客戶端對流媒體

文件地解壓與播放。

(16)數(shù)字音頻主要包括兩類:______與______。

3.選擇題

(1)數(shù)字音頻采樣與量化過程所用地主要硬件是()。

數(shù)字編碼器B)數(shù)字解碼器

C)模/數(shù)轉(zhuǎn)換器(A/D轉(zhuǎn)換器)D)數(shù)/模轉(zhuǎn)換器(D/A轉(zhuǎn)換器)

(2)下列采集地波形聲音,()質(zhì)量最好。A)單聲道,8位量

化,22.05khz采樣頻率B)雙聲道,8位量化,44.1khz采樣頻率C)

單聲道,16強量化,22.05khz采樣頻率D)雙聲道,16位量

化,44.1khz采樣頻率

(3)對于同一幅圖像,()格式占存儲空間較少。

A)TIFFB)BMPC)JPGD)PSD

(4)下列文件格式中,()是常用地動畫文件格式。

A)swfB)gifC)aviD)vcd

(5)將電視臺播放地模擬信號節(jié)目存入計算機,使用地設備是()。

A)顯卡B)聲卡C)視頻采集卡D)光驅(qū)

(6)下列文件地擴展名中,表示聲音文件地是()。

A).docB).wavC).xlsD).psd

(7)下列文件地擴展名中,含有視頻信息地是()。

A).midB).wavC).mp3D).avi

習題

.8)5分鐘雙聲道,16位采樣位數(shù),44.1kHz采樣頻率地聲音,不壓縮文件地數(shù)據(jù)

量是()。

A)50.47MBB)52.92MBC)201.87MBD)25.23MB(9)一

般說來,要求圖像地質(zhì)量越高,則()。

A)采樣頻率越低與量化等級越低B)采樣頻率越高與量化等級越高

C)采樣頻率越高與量化等級越低D)采樣頻率越低與量化等級越高

(10)由許多點組成地點陣圖稱為位圖,構(gòu)成位圖地點稱為像素。位圖多用于表達

真實地景物與創(chuàng)作富于層次,色彩與光感地作品。它突出地缺點之一是數(shù)據(jù)量大,另

一個缺點是()。

A)縮放時會產(chǎn)生失真B)放大時會產(chǎn)生失真C)

縮小時會產(chǎn)生失真D)縮放時不會產(chǎn)生失真

(11)體現(xiàn)音頻數(shù)字化質(zhì)量地參數(shù)有三個,它們分別是:聲道數(shù),采樣頻率與

()O

A)采樣等級B)聲道等級C)量化等級D)音量等級

(12)()隨意改變其大小不會產(chǎn)生失真,所占存儲空間小,一般多用于計算機輔

助設計。

A)機械制圖B)矢量圖C)模擬圖D)掃描圖

(13)動畫地基本原理與電影,電視一樣,都是利用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論