多媒體應(yīng)用技術(shù)基礎(chǔ)_第1頁
多媒體應(yīng)用技術(shù)基礎(chǔ)_第2頁
多媒體應(yīng)用技術(shù)基礎(chǔ)_第3頁
多媒體應(yīng)用技術(shù)基礎(chǔ)_第4頁
多媒體應(yīng)用技術(shù)基礎(chǔ)_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多媒體應(yīng)用技術(shù)基礎(chǔ)第1頁,課件共35頁,創(chuàng)作于2023年2月2023/8/41遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.1概述第2頁,課件共35頁,創(chuàng)作于2023年2月2023/8/42遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.1.1媒體媒體是一種信息發(fā)布和表現(xiàn)的方法,如文本、圖形、語音、音樂等。媒體可分為感知媒體、表示媒體、表現(xiàn)媒體、存儲媒體、傳輸媒體。感知媒體指能直接作用于人的感官,使人直接產(chǎn)生感覺的媒體。在通過視覺來感知信息時(shí),可視媒體是文本、圖像和視頻;在通過聽覺來感知信息時(shí),可聽媒體有音樂、噪聲和語音等;另外,觸覺作為一種感知方式也慢慢引入到計(jì)算機(jī)系統(tǒng)中。表示媒體是為加工、處理和傳輸感知媒體而人為研究構(gòu)造出來的一種蝶體,其目的是更有效地加工、處理、傳輸感知媒體。表示媒體包括各種編碼方式,如文本編碼、語音編碼、圖像編碼等。表現(xiàn)媒體指信息輸入、輸出的工具和設(shè)備。輸出媒體的例子有紙、顯示器和喇叭,而輸入媒體的例子有鍵盤、鼠標(biāo)、攝像機(jī)和麥克風(fēng)等。存儲媒體是指能支持信息存儲的數(shù)據(jù)載體,數(shù)據(jù)存儲并不局限于計(jì)算機(jī)的部件,因此,紙也是一種存儲媒體。存儲媒體的例子還有:計(jì)算機(jī)的硬盤、軟盤、USB盤和CD-ROM等。傳輸媒體用于傳輸數(shù)據(jù)信息。目前主要使用網(wǎng)絡(luò)來進(jìn)行信息傳輸,網(wǎng)絡(luò)介質(zhì)有同軸電纜、光纖等,也可以用無線方式傳輸。第3頁,課件共35頁,創(chuàng)作于2023年2月2023/8/43遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.1.2多媒體與多媒體系統(tǒng)從廣義的角度來說,所謂多媒體就是多種媒體,任何支持一種以上媒體的系統(tǒng)都可以稱為多媒體系統(tǒng)。如果只考慮量的因素,一個(gè)系統(tǒng)只要同時(shí)處理了文本和圖形,就可以將其看成多媒體系統(tǒng)。如果從質(zhì)的角度來判斷一個(gè)系統(tǒng)是否是多媒體系統(tǒng),就會更看重系統(tǒng)所支持的媒體類型而并非數(shù)量。第4頁,課件共35頁,創(chuàng)作于2023年2月2023/8/44遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸多媒體系統(tǒng)的最重要特征1.媒體的組合性并不是任意的媒體組合都能滿足術(shù)語“多媒體”的要求,所以“多種媒體”與“多媒體”含義并不相同。從嚴(yán)格意義上的多媒體系統(tǒng)必須對連續(xù)和離散兩種媒體都進(jìn)行了處理,所以從這個(gè)角度上看有圖像編輯功能的文本處理程序不應(yīng)被看成多媒體應(yīng)用。2.媒體的獨(dú)立性媒體的一個(gè)重要性質(zhì)是它們之間的獨(dú)立性。一般的應(yīng)用也需要各種媒體具有一定的獨(dú)立性,但多媒體系統(tǒng)需要的是多個(gè)層次上的獨(dú)立性。一方面,計(jì)算機(jī)控制的視頻記錄儀存儲的視頻和音頻信息是緊密耦合在共同的存儲介質(zhì)上的。但另一方面,又可能要將聲音信號取出并與文本等其他媒體組合起來以滿足一定的表示需要。3.媒體的集成性計(jì)算機(jī)是進(jìn)行媒體組合的理想工具。媒體組合系統(tǒng)必須具有媒體處理能力,但一個(gè)系統(tǒng)對不同媒體的簡單的輸入、輸出(如攝像機(jī))并不是真正的媒體集成,而真正的媒體集成是將獨(dú)立的媒體數(shù)據(jù)集成起來完成一定的任務(wù),也就是說媒體之間必須建立一定的同步關(guān)系。4.多媒體系統(tǒng)還必須具備通信能力因?yàn)槟壳按蠖鄶?shù)的計(jì)算機(jī)都是網(wǎng)絡(luò)互聯(lián)的,如果只從本地處理的角度看待多媒體系統(tǒng)將有很大的局限性。另一個(gè)原因是很多有趣的多媒體應(yīng)用是專為分布式環(huán)境設(shè)計(jì)的,單個(gè)的計(jì)算機(jī)不足以產(chǎn)生、處理、表示和存儲這些媒體信息。第5頁,課件共35頁,創(chuàng)作于2023年2月2023/8/45遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸多媒體的定義用計(jì)算機(jī)對一些獨(dú)立的信息進(jìn)行一體化的制作、處理、表現(xiàn)、存儲和通信,這些信息必須至少通過一種連續(xù)媒體和一種離散媒體進(jìn)行編碼。這個(gè)定義非常嚴(yán)格,在很多情況下,使用廣義的多媒體定義,即只要系統(tǒng)中同時(shí)處理了多種媒體,就可以使用多媒體的提法。第6頁,課件共35頁,創(chuàng)作于2023年2月2023/8/46遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.1.3多媒體個(gè)人計(jì)算機(jī)一般而言,如果一臺計(jì)算機(jī)具備了處理多媒體信息的硬件條件和適當(dāng)?shù)能浖到y(tǒng),那么,這臺計(jì)算機(jī)就具備了多媒體功能。具有多媒體功能的計(jì)算機(jī)有大、中、小型計(jì)算機(jī)系統(tǒng)和微型計(jì)算機(jī)系統(tǒng),其中使用最廣泛的是微型計(jì)算機(jī)系統(tǒng)。具有多媒體功能的微型計(jì)算機(jī)系統(tǒng)習(xí)慣上被人們稱為“多媒體個(gè)人計(jì)算機(jī)(MultimediaPersonalComputer,簡稱PC機(jī))”。在多媒體個(gè)人計(jì)算機(jī)出現(xiàn)之初,由許多計(jì)算機(jī)公司共同組建的“多媒體個(gè)人計(jì)算機(jī)工作組(MultimediaPCWorkgroup,簡稱MPWG)”,曾經(jīng)制定了多個(gè)標(biāo)準(zhǔn),對個(gè)人計(jì)算機(jī)上的多媒體技術(shù)進(jìn)行規(guī)范化的管理,這些標(biāo)準(zhǔn)包括MPC1,MPC2,MPC3。這些標(biāo)準(zhǔn)大大推動了多媒體個(gè)人計(jì)算機(jī)的發(fā)展。目前,多媒體計(jì)算機(jī)的配置已經(jīng)遠(yuǎn)遠(yuǎn)高于MPC3標(biāo)準(zhǔn),硬件的種類大大增加,軟件的發(fā)展更為迅速,功能更為強(qiáng)大,多媒體功能已經(jīng)成為個(gè)人計(jì)算機(jī)的基本功能,MPC標(biāo)準(zhǔn)已不再重要了。多媒體個(gè)人計(jì)算機(jī)是具有多媒體處理功能的個(gè)人計(jì)算機(jī),它包括硬件和軟件兩個(gè)方面。硬件方面從處理流程來看包括計(jì)算機(jī)主機(jī)、輸人設(shè)備、存儲設(shè)備和輸出設(shè)備。第7頁,課件共35頁,創(chuàng)作于2023年2月2023/8/47遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸多媒體的關(guān)鍵設(shè)備①音頻設(shè)備負(fù)責(zé)采集、加工、處理波表、樂器數(shù)字接口(MusicInstrumentDigitalInterface,簡稱MIDI)等多種形式的音頻素材。需要的硬件有錄放音設(shè)備、MIDI合成器、高性能的聲卡、音箱、話筒、耳機(jī)等。②圖像設(shè)備負(fù)責(zé)采集、加工、處理各種形式的圖像素材。需要的硬件有掃描儀、數(shù)碼相機(jī)、數(shù)字化儀、打印機(jī)。③視頻設(shè)備負(fù)責(zé)采集、編輯計(jì)算機(jī)動畫、視頻素材。需要的硬件設(shè)備有視頻播放機(jī)、視頻采集卡、視頻編輯卡、動態(tài)壓縮卡、數(shù)字錄像機(jī)、數(shù)字?jǐn)z像機(jī)、投影儀等。④存儲部分多媒體信息及其應(yīng)用系統(tǒng)數(shù)據(jù)量很大,將它們長期保存在硬盤中是不現(xiàn)實(shí)的,而且多媒體軟件的發(fā)行也需要一種高容量、移動方便的存儲介質(zhì),那就是光盤。讀取光盤中的信息需要用光盤驅(qū)動器,在光盤上記錄信息需要光盤刻錄機(jī)。第8頁,課件共35頁,創(chuàng)作于2023年2月2023/8/48遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸多媒體計(jì)算機(jī)軟件系統(tǒng)的分類和組成多媒體計(jì)算機(jī)軟件系統(tǒng)按功能主要分為系統(tǒng)軟件和應(yīng)用軟件。系統(tǒng)軟件包括多媒體操作系統(tǒng)、多媒體設(shè)備驅(qū)動程序、多媒體素材制作軟件、多媒體編輯與創(chuàng)作工具等。而應(yīng)用軟件是指最終的多媒體應(yīng)用,如多媒體課件、多媒體演示系統(tǒng)、多媒體模擬系統(tǒng)、多媒體導(dǎo)游系統(tǒng)等。軟件要運(yùn)行于操作系統(tǒng)平臺上,所以具有多媒體設(shè)備,信息和軟件管理能力的操作系統(tǒng)是多媒體系統(tǒng)的核心。它能實(shí)現(xiàn)多媒體環(huán)境下的多任務(wù)調(diào)度,保證音頻、視頻同步及信息處理的實(shí)時(shí)性,提供多媒體信息的各種基本操作和管理,具有對設(shè)備的相對獨(dú)立性和可操作性。設(shè)備驅(qū)動程序是操作系統(tǒng)與設(shè)備之間的接口,驅(qū)動程序告訴操作系統(tǒng)如何使用該設(shè)備,而其他軟件和用戶可以通過操作系統(tǒng)的統(tǒng)一界面和接口來方便地使用該設(shè)備,而用戶并不需要知道該設(shè)備的操作規(guī)范?,F(xiàn)在的操作系統(tǒng)內(nèi)嵌了很多設(shè)備的驅(qū)動程序,基本可以做到即插即用。對有些新型號的設(shè)備,操作系統(tǒng)的即插即用功能可以發(fā)現(xiàn)該設(shè)備,但可能仍然需要用戶安裝驅(qū)動程序。媒體制作平臺和媒體制作工具軟件支持開發(fā)人員創(chuàng)作、采集、制作媒體數(shù)據(jù)。按媒體類型來分,這一類軟件可以進(jìn)一步細(xì)分為音頻編輯軟件、圖像處理和動畫制作軟件、視頻處理軟件等。多媒體編輯與創(chuàng)作系統(tǒng)提供多媒體應(yīng)用系統(tǒng)編輯制作的環(huán)境。在多媒體應(yīng)用系統(tǒng)中,多種媒體是有機(jī)集成在一起的。根據(jù)媒體集成的方式不同,有基于腳本語言的編輯系統(tǒng),有基于圖標(biāo)導(dǎo)向的編輯系統(tǒng),還有基于時(shí)間導(dǎo)向的編輯系統(tǒng),也包括使用高級程序設(shè)計(jì)語言進(jìn)行多媒體應(yīng)用軟件的開發(fā)。除了編輯功能外,創(chuàng)作軟件還應(yīng)該具有控制外設(shè)播放多媒體的功能。第9頁,課件共35頁,創(chuàng)作于2023年2月2023/8/49遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.2多媒體技術(shù)基礎(chǔ)第10頁,課件共35頁,創(chuàng)作于2023年2月2023/8/410遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.2.1數(shù)據(jù)壓縮技術(shù)采用數(shù)字技術(shù)具有許多優(yōu)越性,但也使多媒體信息的數(shù)據(jù)量大增。對模擬帶寬為22kHz的高保真音頻信號,采樣頻率為44.lkHz,每一個(gè)量化值用16比特表示,每秒的數(shù)據(jù)量為(44.1×16)=705.6kb我國和歐洲的PAL(PhaseAlternationbyLine)制式規(guī)定,電視視頻信號每秒25幀圖像,亮度信號以13.5MHz的頻率采樣,兩個(gè)色差信號分別以6.75MHz的頻率采樣,如果每個(gè)采樣點(diǎn)以8位來編碼,則帶寬需求為(13.5+6.75+6.75)×8=216MB/s。由此可見,信息時(shí)代帶來了“信息爆炸”,所以對表示多媒體信息的數(shù)據(jù)進(jìn)行壓縮的技術(shù),也就是數(shù)據(jù)壓縮技術(shù),成為了多媒體技術(shù)中的關(guān)鍵技術(shù)。數(shù)據(jù)壓縮的對象是數(shù)據(jù)。數(shù)據(jù)是信息的載體,用來記錄和傳送信息。真正有用的不是數(shù)據(jù)本身,而是數(shù)據(jù)所攜帶的信息。第11頁,課件共35頁,創(chuàng)作于2023年2月2023/8/411遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸1.信息和熵信息論奠基人之一仙農(nóng)應(yīng)用概率來描述不確定性。事件出現(xiàn)的概率越小,不確定性越多,信息量就越大,反之越小。一個(gè)事件所攜帶的信息量I用它出現(xiàn)的概率p按如下關(guān)系來定義:(71)如果將信息源中所有可能事件的信息量進(jìn)行平均,即可得到信息源的“熵”。設(shè)信息源x的事件集xi(i=1,2,…,N),出現(xiàn)的概率為p(xi),則信息源x的熵為:

(72)在事件出現(xiàn)之前,熵表示信息源中事件出現(xiàn)的平均不確定性;在事件出現(xiàn)之后,熵代表接受事件所獲得的平均信息量。因此,熵是在平均意義上表征信息源總體特征的一個(gè)物理量。從信息論的相關(guān)理論中可以知道:信息源中含有冗余度,這些冗余度既來自于信息源本身的相關(guān)性,又來自于信息源概率分布的不均勻性,只要找到去除相關(guān)性或改變概率分布不均勻性的手段和方法,也就找到了信息熵編碼的方法。信息源所含有的平均信息量(熵)是進(jìn)行無失真編碼的理論極限,只要不低于此極限,就總能找到某種適宜的編碼方法,去逼近信息熵,實(shí)現(xiàn)數(shù)據(jù)壓縮。第12頁,課件共35頁,創(chuàng)作于2023年2月2023/8/412遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸2.信息冗余多媒體數(shù)據(jù)中大的數(shù)據(jù)量并不完全等于它們所攜帶的信息量。在信息論中,稱為冗余。冗余是指數(shù)據(jù)中存在的多種性質(zhì)的多余度。例如,180個(gè)漢字,每個(gè)漢字兩個(gè)字節(jié),其文本數(shù)據(jù)量為2880比特,如果閱讀這些漢字需要一分鐘時(shí)間,語音數(shù)據(jù)量將達(dá)到64kb/s×60s=3840kb(通常語音的數(shù)據(jù)量是每秒64kb/s)相對來說,傳遞同樣的信息,語音數(shù)據(jù)存在著1300多倍文本數(shù)據(jù)的冗余。減少數(shù)據(jù)冗余可以節(jié)省存儲空間,有效利用網(wǎng)絡(luò)帶寬。第13頁,課件共35頁,創(chuàng)作于2023年2月2023/8/413遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸數(shù)據(jù)冗余的主要類型(1)空間冗余在同一幅圖像中,規(guī)則物體和規(guī)則背景表面的物理特性具有相關(guān)性,這些相關(guān)性在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。時(shí)間冗余時(shí)間冗余反政在視頻圖像序列中,相臨幀圖像之間有較大的相關(guān)性。一幀圖像中的某物體或場景可由其他幀圖像中的物體和場景重構(gòu)出來。信息熵冗余信息熵冗余是指數(shù)據(jù)所攜帶的信息量少于數(shù)據(jù)本身而反映出來的數(shù)據(jù)冗余。信息熵編碼時(shí),當(dāng)分配給每個(gè)符號的比特?cái)?shù)等于該符號的信息量時(shí),才能使編碼后的比特率等于其信息熵,即達(dá)到其壓縮極限。而實(shí)際中很難準(zhǔn)確獲知每個(gè)符號的概率,所以編碼的比特分配不能達(dá)到最佳,因此存在信息熵冗余。第14頁,課件共35頁,創(chuàng)作于2023年2月2023/8/414遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸數(shù)據(jù)冗余的主要類型(2)視覺冗余人類的視覺系統(tǒng)受生理特性的限制,對于圖像的注意是非均勻的,人眼并不能察覺圖像中的所有變化。人類視覺的一般分辨能力為26灰度等級,而一般圖像的量化采用的是28灰度等級,即存在視覺冗余。聽覺冗余人耳對不同頻率聲音的敏感性是不同的,不能察覺所有的頻率變化,對某些頻率也不是特別關(guān)注,因此存在聽覺冗余。由于聲音的掩蔽效應(yīng),被掩蔽信號實(shí)際上也是沒有必要存儲或傳輸?shù)?。所謂的聲音掩蔽效應(yīng)是有些低頻的聲音可能被高頻的聲音掩蓋了,使人的聽覺感覺不到它們存在。知識冗余數(shù)據(jù)的理解與先驗(yàn)知識有相當(dāng)大的關(guān)系。例如,當(dāng)接收到一個(gè)成語的前三個(gè)字“大驚小”時(shí),立刻就會知道下一個(gè)字肯定是“怪”。這時(shí)最后一個(gè)字就不攜帶任何信息量了,這就是一種先驗(yàn)知識冗余。在圖像和聲音中都存在這種冗余。第15頁,課件共35頁,創(chuàng)作于2023年2月2023/8/415遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸3.壓縮算法的分類從壓縮后信息量有無損失劃分:(1)可逆編碼可逆編碼也叫無失真編碼、冗余度編碼、熵編碼等。其原理是減少數(shù)據(jù)中的冗余度,而不損失任何信息。解壓時(shí)可以完全恢復(fù)出原來的數(shù)據(jù),也稱無損壓縮。典型的無損壓縮有霍夫曼編碼,算術(shù)編碼和行程編碼等??赡婢幋a由于不會導(dǎo)致失真,因此在多媒體技術(shù)中常用于文本、數(shù)據(jù)的壓縮,它能保證完全地恢復(fù)原始數(shù)據(jù)。但這種方法的壓縮效率較低,一般在2:1~5:l之間。(2)不可逆編碼不可逆編碼是有失真編碼,信息論中叫熵壓縮。由于壓縮了熵,信息量會減少,原始信息將不能完全恢復(fù),因此這種壓縮又稱有損壓縮。在語音和圖像中由于存在視覺冗余和聽覺冗余,信息量的適當(dāng)減少并不影響人們的聽覺和視覺效果,所以經(jīng)常采用這種方法。根據(jù)壓縮原理劃分:(1)預(yù)測編碼這是一種針對統(tǒng)計(jì)冗余性的壓縮方法。對于語音可以通過預(yù)測,去除語音信號時(shí)間上的相關(guān)性。而對于圖像,幀內(nèi)預(yù)測去除了空間上的冗余,幀間預(yù)測則去除了時(shí)間上的冗余。(2)變換編碼這也是針對統(tǒng)計(jì)冗余性進(jìn)行壓縮的編碼方法。不同的是變換編碼首先把要壓縮的數(shù)據(jù)變換到某個(gè)變換域中,然后再進(jìn)行編碼。變換域中表現(xiàn)為能量集中在某些區(qū)域,就可以利用這一特點(diǎn)在不同區(qū)域內(nèi)有效地分配量化比特?cái)?shù),或者去掉那些能量較小的區(qū)域.從而達(dá)到數(shù)據(jù)壓縮的目的。(3)子帶編碼子帶編碼首先讓原始數(shù)據(jù)分別通過若干個(gè)具有不同頻帶的濾波器,將信號分成多個(gè)子帶信號輸出,然后分別對各個(gè)濾波器的輸出進(jìn)行編碼。當(dāng)濾波器選取得適當(dāng)時(shí),它們的輸出將具有備不相同的分布特性,對各頻段進(jìn)行不同的量化處理,可以有效地進(jìn)行數(shù)據(jù)壓縮。(4)熵編碼根據(jù)信息熵的原理,用短碼表示出現(xiàn)概率大的數(shù)據(jù),用長碼表示出現(xiàn)概率小的數(shù)據(jù)。這是一種無損數(shù)據(jù)壓縮技術(shù),在語音和圖像編碼中常常和其他有損壓縮編碼方法結(jié)合使用。第16頁,課件共35頁,創(chuàng)作于2023年2月2023/8/416遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.2.2光存儲技術(shù)目前,多媒體存儲技術(shù)主要是指光存儲技術(shù)。光存儲技術(shù)發(fā)展很快,特別是近十年來,近代光學(xué)、微電子技術(shù)、光電子技術(shù)及材料科學(xué)的發(fā)展,為光學(xué)存儲技術(shù)的成熟及工業(yè)化生產(chǎn)創(chuàng)造了條件。光存儲以其存儲容量大、工作穩(wěn)定、密度高、壽命長、介質(zhì)可更換、便于攜帶、價(jià)格低廉等優(yōu)點(diǎn),成為多媒體系統(tǒng)普遍使用的設(shè)備。第17頁,課件共35頁,創(chuàng)作于2023年2月2023/8/417遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸1.光學(xué)存儲的基本原理光存儲系統(tǒng)由光盤驅(qū)動器和光盤片組成。光盤驅(qū)動器產(chǎn)生一束激光照射到光盤上,反射光由一個(gè)光檢波來接收,并且被解碼成數(shù)據(jù)。光盤上的介質(zhì)有兩種狀態(tài),分別產(chǎn)生不同的反射光,從而代表不同的數(shù)據(jù)。反射光的不同可以是光波的相位不同,也可以是光強(qiáng)的變化。例如,反射面上的洞使反射光發(fā)生衍射,光強(qiáng)會變?nèi)酢7瓷鋮^(qū)的高光強(qiáng)和洞區(qū)的低光強(qiáng)可被轉(zhuǎn)化成不同的點(diǎn)信號以讀取數(shù)據(jù)。由于光盤驅(qū)動器使用一束激光進(jìn)行數(shù)據(jù)的寫入與讀出,光盤可以達(dá)到很高的信息密度,而光盤的軌間距、凹坑的最小尺寸和其他一些參數(shù)取決于激光的光波長。較短的波長會產(chǎn)生更高的存儲密度。第18頁,課件共35頁,創(chuàng)作于2023年2月2023/8/418遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸2.光學(xué)存儲的類型(1)只讀光盤只讀光盤(CD-ROM)是最常用的光盤,直徑約12cm,容量約650MB。其工作特點(diǎn)是,采用激光調(diào)制方式記錄信息,將信息以凹坑和凸區(qū)的形式記錄在螺旋形光道上。光盤是由母盤壓模制成的,一旦復(fù)制成形,永久不變,用戶只能讀出信息。(2)一次寫多次讀光盤一次寫多次讀光盤(WriteOnceReadMany,簡稱WORM)使用戶能夠自己將數(shù)據(jù)、程序或節(jié)目記錄到光盤上,其特點(diǎn)是只能寫一次,但可多次讀,信息一旦寫入就不能再更改。WORM光盤可用多種不同的方法實(shí)現(xiàn)。一種方法是采用有機(jī)染料作為記錄層,該層被激光加熱時(shí)會融化,并形成一個(gè)凹坑,未被加熱的點(diǎn)仍然是平面,這就形成了代表0和1的兩種狀態(tài)。也可以使用一層薄的金屬記錄層,當(dāng)該金屬被寫激光加熱到一定溫度時(shí),其物理特性將由晶態(tài)(高反射性)轉(zhuǎn)換到非晶態(tài)(低反射性),從而也在光盤軌道上產(chǎn)生了光反射系數(shù)高與低兩種不同的狀態(tài)。(3)可重寫光盤在可擦寫光盤系統(tǒng)中,用戶自己可以進(jìn)行數(shù)據(jù)的寫、讀以及擦除后再次寫入。有多種不同方式的可擦寫光盤,包括磁光系統(tǒng)、相變系統(tǒng)和染料化合物系統(tǒng)等。其中相變技術(shù)使用最為廣泛,目前已經(jīng)應(yīng)用在CD-RW,DVD-RW和DVD-RAM中。在使用相變技術(shù)的可擦寫光盤中采用的是一種具有晶體/非晶體狀態(tài)可逆轉(zhuǎn)換特性的材料。從晶體(高反射)到非晶體(低反射)的變化一般用于記錄數(shù)據(jù),而逆變過程用于擦除記錄信息。用激光加熱記錄層,使聚焦點(diǎn)的溫度略高于它的熔點(diǎn)而冷卻凝固時(shí),記錄層的狀態(tài)就由晶體轉(zhuǎn)換成非晶體。由于非晶體狀態(tài)不穩(wěn)定,材料易于反變,因此,當(dāng)該點(diǎn)加熱到稍低于熔點(diǎn)的溫度再冷卻時(shí),就返回晶態(tài),數(shù)據(jù)則被擦除。現(xiàn)在120mm可擦寫光盤可存儲4.7GB,它的容量還會增加10倍,數(shù)據(jù)讀取速率可達(dá)10MB/s。使用更高的旋轉(zhuǎn)速度和置于平行軌道的多光頭,可使速度達(dá)到500MB/s甚至更高。在光盤存儲中,因?yàn)閿?shù)據(jù)的讀寫是通過光來完成的,在介質(zhì)和傳感器之間沒有物理接觸,這使得介質(zhì)和傳感器(讀出裝置)有更長的壽命。另外,由于無需數(shù)據(jù)面與讀出頭之間的物理接觸,數(shù)據(jù)可以置于保護(hù)層阿,減少表面污染的影響。第19頁,課件共35頁,創(chuàng)作于2023年2月2023/8/419遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.2.3數(shù)字音頻技術(shù)聲音是人們用來傳遞信息、交流感情最方便、最熟悉的方式之一。從本質(zhì)上來說聲音是一種機(jī)械振動波,當(dāng)這種振動通過聲音傳送媒介(此如空氣)傳送到人的聽覺器官后,人就聽到了聲音。聲音信息的主要表現(xiàn)形式是語音和音樂。語音不僅是一種波形音,更重要的是它還包臺有豐富的語言內(nèi)涵,人類可以通過抽象思維,提取其特定成分,達(dá)到對其意義的理解,所以常把它作為一種人類特有的媒體。音樂與語音相比,其形式相對規(guī)范一些。它可以被理解為能用樂譜或數(shù)字語言等形式,進(jìn)行規(guī)范表達(dá)的符號化了的聲音。聲音是一種與時(shí)間相關(guān)的時(shí)基類媒體。測量和描述一個(gè)隨時(shí)間連續(xù)變化的模擬音頻信號的指標(biāo)主要有振幅、周期(頻率)和相位等物理量。從人耳的聽覺特性來看,聲音信號的基本特征主要表現(xiàn)在音強(qiáng)、音調(diào)和音色等幾個(gè)方面,而正常人的聽覺頻率范圍在20~20000Hz之間。不同聲源發(fā)出的聲音都有一定的頻率范圍。不同的使用條件和聽音環(huán)境對重放聲音信號的頻率寬度要求也不一樣,即聲音的質(zhì)量與其頻率范圍有密切關(guān)系。一般來說,對聲音質(zhì)量要求越高,其頻帶寬度要求也越大。由于音頻是一種連續(xù)變化的模擬信號,而計(jì)算機(jī)只能處理和記錄二進(jìn)制的數(shù)字信號,因此,音頻信號必須數(shù)字化(即數(shù)字音頻信號)后才能送到計(jì)算機(jī)進(jìn)行編輯和存儲。從信息處理的角度來看,數(shù)字音頻信號的特點(diǎn)是攜帶的信息量大、實(shí)時(shí)性要求高,因此對其的壓縮處理是多媒體技術(shù)中必不可少的部分。此外,數(shù)字音頻信號的處理還包括對聲音的編輯和加工,即剪輯、合成、靜音、增加混響、調(diào)整頻率等。第20頁,課件共35頁,創(chuàng)作于2023年2月2023/8/420遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸1.音頻信號的數(shù)字化音頻信號的數(shù)字化過程就是將模擬音頻信號轉(zhuǎn)換為用數(shù)字表示的離散序列,即數(shù)字音頻序列。在這個(gè)處理過程中涉及到對模擬信號的抽樣、量化和編碼。不同的抽樣,量化和編碼方式會形成不同形式的數(shù)字化音頻信號。(1)抽樣由奈奎斯特定律可知:為了從取樣得到的離散序列中不失真地恢復(fù)出原始的信號,抽樣頻率至少要大于信號帶寬的兩倍。同時(shí)為了防止帶寬很寬的噪聲信號混入到取樣后的離散序列中去,通常在對音頻信號進(jìn)行取樣之前,要用一個(gè)低通濾波器對輸入的音頻信號進(jìn)行限帶處理,濾除帶外的噪聲。在電話通信系統(tǒng)中通常采用的抽樣頻率是8kHz,而在CD中取樣頻率通常為44.1kHz或48kHz。(2)量化量化過程將每個(gè)取樣值在幅度上進(jìn)行離散處理。它將所有取樣值可能出現(xiàn)的范圍劃分為有限個(gè)區(qū)間,凡是落人某個(gè)量化區(qū)間內(nèi)的取樣值都賦予相同的值,即量化值,由于在量化過程中把略有不同的所有落人同一量化區(qū)間內(nèi)的取樣值都用同一個(gè)量化值來表示,這必然要引人失真即量化失真。(3)編碼編碼過程就是用二進(jìn)制數(shù)來表示每個(gè)取樣的量化值。如果在量化過程中采用的是均勻量化,在編碼過程中又采用二進(jìn)制數(shù)來表示,那么這種編碼方法就被稱為脈沖編碼調(diào)制(PulseCodeModulation,簡稱PCM)。經(jīng)過編碼的數(shù)字信號就是數(shù)字音頻信號。在數(shù)字音頻信號的處理中,由于PCM信號是一種未經(jīng)過任何壓縮或其他處理的數(shù)字音頻信號,所以常常將ECM信號作為一種參考信號,用于衡量其他處理(包括壓縮編碼)的性能。衡量PCM編碼性能的主要指標(biāo)是碼速率和量化信噪比。第21頁,課件共35頁,創(chuàng)作于2023年2月2023/8/421遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸2.電子合成音樂數(shù)字音頻實(shí)際上是一種數(shù)字式錄音/重放的過程。在多媒體系統(tǒng)中,除了用數(shù)字音頻的方式外,還可以用合成的方式產(chǎn)生音樂。音樂合成的方式根據(jù)一定的協(xié)議標(biāo)準(zhǔn),使用音樂符號來記錄和解釋樂譜,并組合成相應(yīng)的音樂符號,這就是MIDI(MusicInstrumentDigitalInterface)。MIDI不是把音樂的波形進(jìn)行數(shù)字化采樣、量化和編碼,而是將數(shù)字式電子樂器的彈奏過程以命令符號的形式記錄下來,如按了哪一個(gè)鍵、力度多大、時(shí)間多長等。當(dāng)需要播放這首樂曲時(shí),根據(jù)記錄的樂譜指令,通過音樂合成器生成音樂聲波,經(jīng)放大后由揚(yáng)聲器播出。MIDI并不產(chǎn)生和傳送聲音,而是傳送產(chǎn)生聲音的控制符號,比如音符的開始和結(jié)束時(shí)間、音量、制式、音調(diào)、樂器聲音的改變時(shí)間、歌曲的起始點(diǎn)和結(jié)束點(diǎn)、音素等。MIDI電子樂器通過MIDI接口與計(jì)算機(jī)相連。計(jì)算機(jī)可通過音序器軟件來采集MIDI電子樂器發(fā)出的一系列指令。這一系列指令將記錄到以“.MID”為擴(kuò)展名的MIDI文件中。在計(jì)算機(jī)上音序器可對MIDI文件進(jìn)行編輯和修改。最后,將MIDI指令送往音樂合成器,由合成器對MIDI指令符號進(jìn)行解釋并產(chǎn)生波形,然后通過聲音發(fā)生器送往揚(yáng)聲器播放出來。播放樂曲時(shí),根據(jù)記錄的樂譜指令,通過音樂合成器生成音樂聲波,經(jīng)放大后由揚(yáng)聲器播出。MIDI并不產(chǎn)生和傳送聲音,而是傳送產(chǎn)生聲音的控制符號,比如音符的開始和結(jié)束時(shí)間、音量、制式、音調(diào)、樂器聲音的改變時(shí)間、歌曲的起始點(diǎn)和結(jié)束點(diǎn)、音素等。第22頁,課件共35頁,創(chuàng)作于2023年2月2023/8/422遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸MIDI音樂的產(chǎn)生過程第23頁,課件共35頁,創(chuàng)作于2023年2月2023/8/423遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸3.數(shù)字音頻的壓縮語音信號是一種常見并且應(yīng)用范圍非常廣泛的一種音頻信號,是人們在日常生活中進(jìn)行交流的主要手段之一。語音信號的帶寬通常在300~3400Hz之間,是目前常見的音頻信號中頻帶最窄的一種。語音的壓縮編碼方法主要有3類:第一類是基于語音波形預(yù)測的編碼方法,比如A/u率壓擴(kuò)、差分脈沖編碼調(diào)制(DifferentialPulseCodeModulation,簡稱DPCM)、自適應(yīng)差分脈沖編碼調(diào)制(AdaptiveDifferentialPulseCodeModulation,簡稱ADPCM)等方法這類方法的特點(diǎn)是算法簡單,易于實(shí)現(xiàn),同時(shí)可以獲得較高的語音質(zhì)量,缺點(diǎn)是壓縮的效率不太高。第二類方法是基于參數(shù)的編碼方法,比如線性預(yù)測編碼、共振峰編碼等。這類方法的特點(diǎn)是壓縮效率高,但聲音質(zhì)量比較低。第三類方法是近年來常用的混合方法。這類方法將波形編碼方法的高質(zhì)量和參數(shù)編碼的低速率結(jié)合在一起取得了較好的效果。其中效果較好的混合編碼方法有:多脈沖線性預(yù)測編碼(Multi-PulseLinearPredictiveCode,簡稱MPLPC)、碼激勵(lì)線性預(yù)測編碼(CodeExcitedLinearPredictionCode,簡稱CELP)、規(guī)則脈沖激勵(lì)長時(shí)預(yù)測編碼(RegularPulseExcitation-Long-TermPredictive,簡稱RPE-LTP)、低時(shí)延CELP(LowDelay-CELP,簡稱LD-CELP)編碼等。除了普通的語音信號外,還有一些質(zhì)量高,帶寬更寬的音頻信號,比如調(diào)幅、調(diào)頻廣播之類的音頻信號,對這類寬帶的音頻信號顯然需要用有別于普通語音處理的方法來進(jìn)行處理以便能提供高質(zhì)量的音頻效果。目前的音頻壓縮編碼大多為有損壓縮,但都力求獲得聲音在主觀感知上相同,即達(dá)到通常所說的透明的聲音質(zhì)量。當(dāng)然在追求低碼率的前提下,還需要兼顧考慮算法的復(fù)雜度和延遲。音頻壓縮的方法主要有兩大類:變換編碼和子帶編碼。第24頁,課件共35頁,創(chuàng)作于2023年2月2023/8/424遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.2.4圖形圖像技術(shù)圖像可以表現(xiàn)一個(gè)物體、一個(gè)二維或三維場景等,它的內(nèi)容可以是真實(shí)的也可以是虛構(gòu)的。人們可以將圖像抽象地看作一個(gè)矩形區(qū)域上的函數(shù),例如,由光學(xué)傳感器獲得的圖像就與傳感器接收到的電磁波的輻射強(qiáng)度成正比,這樣的圖像叫強(qiáng)度圖像;對于深度傳感器來說,圖像就是從傳感器到三維物體的視線距離的函數(shù),這樣的圖像叫深度圖像;而對于觸覺傳感器,圖像與物理表面引起的傳感器形變成正比。記錄的圖像可以是模擬的也可以是數(shù)字的。第25頁,課件共35頁,創(chuàng)作于2023年2月2023/8/425遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸1.數(shù)字圖像表示可以把圖像看作平面區(qū)域上各個(gè)點(diǎn)光強(qiáng)值的函數(shù)。為了能在計(jì)算機(jī)中用數(shù)字方式表示圖像,要在離散的點(diǎn)上對這個(gè)函數(shù)進(jìn)行采樣,采樣得到的光強(qiáng)值經(jīng)過量化就形成了離散的亮度級。一幅數(shù)字圖像就是一個(gè)由量化后的光強(qiáng)值組成的矩陣。圖像上的采樣點(diǎn)叫做圖像元素,一般簡稱為像素,像素的光強(qiáng)值叫灰度級(對顏色進(jìn)行了編碼),像素的光強(qiáng)值用整數(shù)表示。如果光強(qiáng)值只有兩個(gè),比如黑和白,那么就可以用0和1表示,這種圖像叫二值圖像。如果每個(gè)像索的值用一個(gè)字節(jié)表示,灰度值級數(shù)就等于256級,每個(gè)像素可以是0~255之間的一個(gè)值。彩色圖像可以按照顏色的數(shù)目來劃分,如256色表示該圖像中的顏色數(shù)目可以達(dá)到256種。通常使用縱向和橫向都均勻分布的網(wǎng)格進(jìn)行采樣。很明顯,網(wǎng)格之間的距離影響圖像表示的精細(xì)程度,決定了可以表現(xiàn)的細(xì)節(jié)層次。但顯示出來的分辨率也與成像系統(tǒng)有關(guān)。第26頁,課件共35頁,創(chuàng)作于2023年2月2023/8/426遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸2.圖像格式圖像捕獲格式主要有兩個(gè)參數(shù):空間分辨率和顏色編碼方式??臻g分辨率是指圖像是由多少像素乘多少像素的,顏色編碼方式是每個(gè)像素用多少比特來表示。這兩個(gè)參數(shù)都與圖像輸入/輸出的軟硬件設(shè)備有關(guān)。存儲圖像時(shí)都需要存儲一些識別信息。因?yàn)槿绻淮鎯D像數(shù)據(jù),程序則難以解讀出正確的圖像數(shù)據(jù)。識別信息通常包括文件識別信息(如圖像文件的識別碼和版本代號識別碼,用于判斷這個(gè)文件應(yīng)為哪種文件格式)和圖像識別信息(如圖像的寬度和高度、顏色種類、調(diào)色板數(shù)據(jù)等)。圖像數(shù)據(jù)實(shí)際上存儲的是一個(gè)二維數(shù)組,數(shù)組中的值就是圖像中對應(yīng)點(diǎn)的數(shù)據(jù),對于二值圖像,這個(gè)值只要一個(gè)二進(jìn)制比特,對于彩色圖像這個(gè)值可以有如下幾種組合:表示像素顏色中紅、綠、藍(lán)顏色分量的三個(gè)數(shù)值;表示在紅、綠、藍(lán)顏色表中索引值的三個(gè)數(shù)值;一個(gè)三元組顏色表的索引值;其他能表示顏色的數(shù)據(jù)結(jié)構(gòu)的索引號。圖像數(shù)據(jù)通常過于龐大,若不經(jīng)過壓縮處理就直接存儲,會占用很大的存儲空間,所以圖像存儲時(shí)多半會運(yùn)用某種壓縮原理,減少存儲圖像所需的數(shù)據(jù)量,以達(dá)到節(jié)省存儲空間的效果。目前圖像存儲之所以會有種種不同的格式,主要是在存儲編碼過程中,使用了不同的識別信息和壓縮方法?,F(xiàn)在最常用的圖像存儲格式有BMP(BITMAP,位圖格式)、GIF(GraphicsInterchangeFormat,圖形交換格式)、JPEG(JointPhotographicExpertGroup,聯(lián)合圖像專家組)、TIFF(TaggedImageFileFormat,標(biāo)記圖像格式)等。第27頁,課件共35頁,創(chuàng)作于2023年2月2023/8/427遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸3.圖形格式圖形格式是用圖形元素及其屬性來描述的。圖形元素包括直線、矩形、圓、橢圓及用文本描述的二維或三維物體,如多邊形等。支持哪些圖形元素取決于具體的圖形軟件包,而圖形的外觀還受到諸如線型、線寬及顏色這樣的圖形元素屬性的影響。圖形元素及其屬性表現(xiàn)的是圖像的高層信息,因?yàn)閳D形不是用像素矩陣表示的。在圖像處理的過程中有時(shí)需要將這種高層表現(xiàn)形式還原成低層表現(xiàn)形式即位圖。使用高層圖形元素的好處是圖像的數(shù)據(jù)量大為減少,對圖形的編輯修改也更為容易,缺點(diǎn)在于顯示時(shí)有一個(gè)從圖形元素到點(diǎn)陣的轉(zhuǎn)換過程。第28頁,課件共35頁,創(chuàng)作于2023年2月2023/8/428遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸4.計(jì)算機(jī)圖像處理(1)圖像合成圖像合成是計(jì)算機(jī)用戶界面的一個(gè)組成部分,在二維、三維及更高維物體的可視化中是必不可少的。在教育、科技、工程、醫(yī)藥、廣告、娛樂等不同領(lǐng)域中都要使用圖形和圖像,從攝影和電視的誕生到現(xiàn)在,交互式計(jì)算機(jī)圖形已成為制作圖片最重要的方法。使用計(jì)算機(jī)的好處是不僅可以得到反映真實(shí)世界的圖片,而且可以表現(xiàn)抽象合成的物體,比如四維數(shù)學(xué)曲面等。計(jì)算機(jī)圖形并不僅限于表示靜止的圖片,圖片可以動態(tài)變化,例如,用戶可以通過調(diào)整運(yùn)動速度、顯示的部分及顯示的細(xì)節(jié)數(shù)量來控制圖片的運(yùn)動。許多交互式圖形技術(shù)使用專門的軟硬件支持用戶對圖形對象的運(yùn)動進(jìn)行控制。(2)圖像分析圖像分析就是從圖像中抽取可用于高層場景分析的描述信息。就圖像本身而言,知道一個(gè)點(diǎn)的位置和顏色對于形狀、位置、方向、距離、是否損壞等識別應(yīng)用幾乎沒什么幫助。因此圖像分析必須包含亮度和顏色的計(jì)算、場景中三維數(shù)據(jù)的部分或全部恢復(fù)、不連續(xù)處的定位及圖像中均勻區(qū)域的特征捕述。圖像分析在許多領(lǐng)域有重要的應(yīng)用,如航拍照片分析、空間探測傳回的慢速掃描電視圖像分析、工業(yè)機(jī)器人的視覺傳感器所獲得的電視圖像分析等。圖像處理的子領(lǐng)域包括圖像增強(qiáng)、模式檢測與識別、計(jì)算機(jī)視覺。第29頁,課件共35頁,創(chuàng)作于2023年2月2023/8/429遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.3多媒體技術(shù)應(yīng)用多媒體計(jì)算機(jī)是多媒體技術(shù)最直接、最簡單的表現(xiàn)形式,因其本身具有存儲、運(yùn)算、處理和顯示的能力,具有獨(dú)立的功能,如動畫顯示、播放VCD節(jié)目等。因此,多媒體計(jì)算機(jī)一出現(xiàn)便立即在家庭教育和娛樂等方面得到了廣泛的應(yīng)用。但是,多媒體技術(shù)真正的意義在于與網(wǎng)絡(luò)的結(jié)合,在于通過網(wǎng)絡(luò)(局域網(wǎng)和廣域網(wǎng))為用戶以多媒體的方式提供信息服務(wù)。多媒體技術(shù)的幾種典型業(yè)務(wù)包括:多媒體信息檢索與查詢多媒體會議與協(xié)同工作視頻點(diǎn)播和網(wǎng)絡(luò)流媒體多媒體信件等

第30頁,課件共35頁,創(chuàng)作于2023年2月2023/8/430遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.3.1多媒體信息檢索與查詢多媒體信息檢索與查詢(MultimediaInformationService,簡稱MIS)系統(tǒng)和業(yè)務(wù),最典型的應(yīng)用是在商品購物、娛樂和旅游等方面。如果僅僅根據(jù)類別、書名、關(guān)鍵字等對文本資料進(jìn)行查詢還只是普通的計(jì)算機(jī)查詢業(yè)務(wù),不屬于多媒體技術(shù)。從技術(shù)發(fā)展上來看,逐步改造原來查詢文本資料的系統(tǒng),使之同時(shí)具有活動圖像和聲音的查詢能力,是這類檢索查詢業(yè)務(wù)發(fā)展的必然趨勢。MIS所涉及的兩個(gè)重要的技術(shù)問題是:①如何向用戶提供豐富的信息和如何讓用戶快速、有效地查詢與瀏覽這些信息;②如何合理、有效地組織存儲多媒體數(shù)據(jù)。信息檢索與查詢業(yè)務(wù)的發(fā)展引發(fā)了網(wǎng)上交易的商機(jī),網(wǎng)上交易的順利完成需要電子商務(wù)技術(shù)的幫助。雖然電子商務(wù)所涉及的主要技術(shù),如身份認(rèn)證、安全保障、網(wǎng)上貨幣交易等,并不屬于多媒體技術(shù)。但是電子商務(wù)的發(fā)展無疑是推動MIS系統(tǒng)和業(yè)務(wù)發(fā)展的強(qiáng)大動力。第31頁,課件共35頁,創(chuàng)作于2023年2月2023/8/431遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.3.2多媒體會議與協(xié)同工作多媒體會議可視電話和會議電視是早在多媒體出現(xiàn)之前就已經(jīng)存在的人與人之間進(jìn)行通信的手段。計(jì)算機(jī)支持的協(xié)同工作(ComputerSupportedCo-operativeWork,簡稱CSCW)也是早在20世紀(jì)80年代初在計(jì)算機(jī)領(lǐng)域內(nèi)提出的概念。它是指用于支持多個(gè)用戶共同參與一項(xiàng)工作(如共同編輯文件、修改設(shè)計(jì)圖等)的計(jì)算機(jī)系統(tǒng)及其相關(guān)的技術(shù),但合作者之間不能見面與交談。多媒體的出現(xiàn)為這兩種交流形式提供了結(jié)合的基礎(chǔ),其結(jié)合的結(jié)晶就是多媒體會議電視系統(tǒng)。如果說一個(gè)系統(tǒng)已經(jīng)超出了會議電視的范圍,那么就進(jìn)入了多媒體會議(或者遠(yuǎn)程診斷、遠(yuǎn)程教育)系統(tǒng)的范疇。該系統(tǒng)應(yīng)該在比較高的水平上具備下述功能:①具有比較復(fù)雜的協(xié)同工作功能,使得身處異地的人們可以同時(shí)使用同一種軟件工作;②能夠以交互的操作方式從對方或某一方調(diào)取文件、圖像等資料;③能自動地記錄和存儲會議或者講課等有關(guān)內(nèi)容,會后可以隨時(shí)調(diào)取。從原理上講,多媒體會議電視、多媒體遠(yuǎn)程醫(yī)療診斷和多媒體遠(yuǎn)程教育所使用的是同類系統(tǒng),只不過由于業(yè)務(wù)性質(zhì)的不同,3種系統(tǒng)在一些非主要的技術(shù)方面,如工作界面、圖像清晰度的要求、數(shù)據(jù)庫的設(shè)計(jì)等有所不同而已。因此,在這里把它們當(dāng)作同一類系統(tǒng)介紹。判斷這類系統(tǒng)水平高低的主要標(biāo)志是其協(xié)同工作功能的復(fù)雜程度。這也是此類系統(tǒng)在未來發(fā)展中,吸引著人們對其進(jìn)行研究的最主要方面。多媒體協(xié)同工作多媒體協(xié)同工作(MultimediaCollaboration,簡稱MMC)的最終目標(biāo)是希望使身處異地的人們,能夠像處在同一房間內(nèi)一樣進(jìn)行而對面的交談和協(xié)商工作。為了實(shí)現(xiàn)這一目標(biāo),要走的路途還相當(dāng)遙遠(yuǎn),下面從技術(shù)的角度闡述一下其中可能遇到的問題。從通信的角度看,MMC系統(tǒng)是對通信系統(tǒng)要求最高的應(yīng)用,它要求一點(diǎn)對多點(diǎn),或者多點(diǎn)對多點(diǎn)的實(shí)時(shí)的不間斷的信息傳輸。在復(fù)雜的協(xié)同工作系統(tǒng)中,還要實(shí)現(xiàn)“開小會”、“說悄悄話”、“傳條子”等,并且要能夠隨時(shí)建立、撤銷某些私有信道。顯示器的屏幕是平面的,無論屏幕上顯示的景象是多么有立體感,人們?nèi)匀皇巧硖幤渫?,而不是身處其中。如何將虛擬顯示與協(xié)同工作結(jié)合起來,使人們在虛擬的三維環(huán)境之中協(xié)同工作是目前多媒體領(lǐng)域中正在研究的課題之一。人們會面時(shí)的第一個(gè)動作往往是一邊握手、一邊說“你好”。如果MMC終端可以用語言(不是鍵盤)輸入并配有機(jī)器手,就可能使你感受到遠(yuǎn)方合作者向你握手問好的真實(shí)感覺。除了聽覺和視覺外,將其他的感覺,如觸覺、嗅覺等結(jié)合到協(xié)同工作環(huán)境;或者將多媒體協(xié)同工作與機(jī)器人技術(shù)結(jié)合起來,使合作者能夠共同進(jìn)行除了屏幕上的工作以外的事情,這些都是研究者正在探索的問題。另外,當(dāng)涉及視、聽之外的其他形式的傳感器時(shí),通信機(jī)制的復(fù)雜程度會更高。第32頁,課件共35頁,創(chuàng)作于2023年2月2023/8/432遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院劉旸7.3.3視頻點(diǎn)播和網(wǎng)絡(luò)流媒體多媒體計(jì)算機(jī)出現(xiàn)以后,由于它具有以交互操作的方式調(diào)取包括伴音在內(nèi)的活動圖像的功能,立即導(dǎo)致了這樣的構(gòu)想:在電視節(jié)目中心(例如電視臺),將節(jié)目以壓縮后的數(shù)據(jù)形式存入圖像數(shù)據(jù)庫;用戶在家里可以按照菜單調(diào)取任何一套節(jié)目,或者一套節(jié)目中的任何一段并能實(shí)現(xiàn)錄像機(jī)的功能,即快進(jìn)、快退、重放、慢動作以及播放靜止畫面等,這種系統(tǒng)與業(yè)務(wù)就是點(diǎn)播電視(VideoOnDemand,簡稱VOD)。VOD是最容易為人們從概念上理解和愿意接受的多媒體通信系統(tǒng),在有的書籍中也把點(diǎn)播電視稱為交互電視以突出它的交互特征。從技術(shù)原理和使用功能上來說,VOD與多媒體信息檢索與查詢系統(tǒng)類似,但二者的業(yè)務(wù)特點(diǎn)卻有很大不同。在多媒體信息檢索與查詢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論