版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第3章多媒體通信系統(tǒng)
3.1多媒體概述3.2多媒體系統(tǒng)3.3超媒體與流媒體3.4聲音媒體3.5圖像與圖形媒體3.6多媒體通信技術
3.1多媒體概述3.1.1媒體的概念
1.媒體的分類
1)按媒體與時間的關系來劃分(1)離散媒體。離散媒體是與時間無關或與時間有關但無周期性變化的媒體,如文字、圖形等。不過要注意的是,“離散”這個概念有時候是模糊的,因為一個媒體可以在表示值上是離散的但在時間上是連續(xù)的。離散媒體的處理要盡可能快,但是這種處理卻是與時間無關的,因為數據的有效性和正確性并不依賴于任何時間因素。
(2)連續(xù)媒體。連續(xù)媒體不但與時間有關而且是周期性變化的。其數據的有效性和正確性依賴于時間的控制,因此媒體的處理是和時間有關的。比如傳送音頻樣本時傳輸太慢將會產生時間的延遲,較大的時間延遲使聽到的聲音斷斷續(xù)續(xù),很不自然。
2)按計算機處理數據的形式來劃分
按計算機處理數據的形式的不同,媒體可分為文字(text)、聲音(audio)、圖形(graphic)、圖像(image)
、動畫(animation)、視頻(video)等幾類。在實際應用中,一般人通常接受的就是這種簡單的劃分方法。雖然這種劃分方式是片面的,但是便于理解,這是由目前計算機所能處理和應用媒體的現(xiàn)狀決定的。
3)按承載信息的方式來劃分
國際電話電報咨詢委員會(CCITT,ConsultativeCommitteeonInternationalTelephoneandTelegraph——國際電信聯(lián)盟ITU的一個分會)把媒體分成五類。
(1)感覺媒體(PerceptionMedium)。指直接作用于人的感覺器官,使人產生直接感覺的媒體。如引起聽覺反應的聲音,引起視覺反應的圖像等。
(2)表示媒體(RepresentationMedium)。指傳輸感覺媒體的中介媒體,即用于數據交換的編碼。如圖像編碼(JPEG、MPEG等)、文本編碼(ASCII碼、GB2312等)和聲音編碼等。
(3)表現(xiàn)媒體(PresentationMedium)。指進行信息輸入和輸出的媒體。如鍵盤、鼠標、掃描儀、話筒、攝像機等為輸入媒體;顯示器、打印機、喇叭等為輸出媒體。
(4)存儲媒體(StorageMedium)。指用于存儲表示媒體的物理介質。如硬盤、軟盤、光盤、ROM及RAM等。
(5)傳輸媒體(TransmissionMedium)。指傳輸表示媒體的物理介質。如電纜、光纜等。
4)從人機交換的角度來劃分
從人機交換的角度,媒體可分為視覺類媒體、聽覺類媒體、觸覺類媒體、活動媒體、抽象事實媒體等。這一劃分便于計算機向“人性化”的方向發(fā)展與應用。
據研究,在人類通過感官收集到的各種信息中,視覺收集到的信息約占65%,聽覺收集到的信息約占20%,觸覺收集到的信息約占10%,味覺、嗅覺等其他感覺收集到的信息約占5%。目前,計算機所能處理和應用的媒體,主要是視覺、聽覺類媒體,如文字、聲音、圖形、圖像、動畫、視頻等,在機器人、虛擬現(xiàn)實(VR,VirtualReality)等系統(tǒng)的應用開發(fā)中,用到了觸覺類媒體,如壓力、運動等,但其他感覺媒體的應用還在研究之中。
2.媒體的性質
從信息表達的角度考慮,媒體具有以下四個方面的性質:
(1)表示值和表示空間。表示空間是能正確描述媒體的環(huán)境范圍;表示值確定不同媒體的信息表示。表示值有完備和不完備的區(qū)分。例如文字就是不完備的,因為需要大家約定后,才會知道文字的具體含義。而另一些媒體的表示值無須約定就可以被理解,因此是完備的,比如氣味等。有格式的數據才能表達信息的含義,這種格式不僅僅是數據結構意義上的,而主要是指媒體類型的識別和解釋。也就是說,由于媒體的種類不同,它們所具有的格式也應該不同,只有能夠理解和解釋的格式,才能對其內容即承載的信息進行表達。
(2)不同的媒體所表達信息的程度不同。一般說來,愈是接近人類原始表達的信息,其信息含量愈豐富,愈是抽象化(即遠離原始信息表達)的信息,信息量愈少,但是愈精確。如圖像、聲音包含的信息量大,適合于定性描述信息,而文字與符號適合于較精確的定量描述。
(3)媒體之間的關系也代表著信息,甚至更多的信息。媒體的多樣化關鍵不在于能否接收多種媒體的信息,而在于媒體之間的信息表示的合成效果。比如,在電影中,畫面、對白及背景音樂的合成效果,就比單獨看一次畫面、聽一次對白、再聽一次音樂效果好得多,即所謂“感覺相乘”效應。
(4)媒體可以進行相互轉換。所謂媒體轉換,是指媒體的形式從一種轉換為另外一種。但并非所有媒體之間都可以轉換,如圖像目前還不可轉換為聲音。一般說來,媒體的轉換總是引起信息失真,要么損失原有信息,要么增加偽信息。但信息失真對接收者來說是否重要,取決于具體的應用領域及應用要求。
3.多媒體與多媒體技術
多媒體(Multimedia)是相對單媒體形成的概念。多媒體是指一種把多種不同的媒體(如文字、聲音、圖形、圖像、動畫、視頻等)綜合集成在一起而產生的一種存儲、傳播和表現(xiàn)信息的全新載體。一般說來,多媒體的“多”是其多種媒體表現(xiàn)、多種感官作用、多種設備、多學科交匯、多領域應用;“媒”是指人與客觀事物之中介;“體”是指多種信息和碼流一體化、設備控制一體化和具有實時交互控制環(huán)境,也就是綜合、集成一體化。目前,多媒體大多只是利用了人的視覺、聽覺,“虛擬現(xiàn)實”中也只用到了觸覺,而味覺、嗅覺尚未集成進來。對于視覺的應用也主要在可見光部分。隨著技術的進步,多媒體的涵義和范圍還將擴展。
當前多媒體中重點討論的是感覺媒體和表示媒體,即聲音、圖形、圖像、文字、視頻和動畫等信息載體及其各種編碼形式。聲音、圖形、圖像、文字、視頻和動畫等信息載體是信息的存在方式和表現(xiàn)形式,使用多種媒體表示和處理信息是現(xiàn)代文明和技術進步的重要標志。然而,多媒體不只是指媒體的多樣性,更包含著集成地交互處理多種媒體信息的手段和方法,也就是多媒體技術。在實用中,我們對多媒體的概念給出非嚴格的概括:多媒體是指綜合地處理文本、圖形、圖像、動畫、聲音、視頻等兩種以上的媒體信息,并且能在多種媒體之間建立某種邏輯連接,集成為具有交互能力的系統(tǒng)。從更廣義的角度,就一種發(fā)展趨勢而言,多媒體是趨于人性化的多維信息處理系統(tǒng)。在這個意義上,多媒體可以理解為一個領域,一個與信息處理相關聯(lián)的技術和方法進一步發(fā)展的領域。可以說,多媒體是一個前所未有的新概念、新技術、新領域。
3.1.2多媒體的主要特性
1.集成性
多媒體的集成性主要表現(xiàn)在多種信息媒體的集成和處理兩個方面。多媒體將計算機技術、家用電器技術、網絡通信技術等多種技術進行了集成和發(fā)展,全面地綜合各種媒體信息的特點,集電視、音響和通信與計算機技術于一體。
1)多種信息媒體的集成
多種信息媒體的集成包括多種媒體信息的多通道統(tǒng)一獲取、多媒體信息的統(tǒng)一組織與存儲、多媒體信息表現(xiàn)的合成等各個方面。多種媒體信息有機地綜合在-起,具有自身獨有的集成特性。由于多媒體中的每種媒體都會對其他媒體信號的多重解釋產生某種限制作用,所以多種媒體的同時使用可以減少信息理解上的多義性,更加著重媒體之間的關系及其蘊含的信息等。由于多媒體系統(tǒng)中與時間相關的媒體已經占據了統(tǒng)治地位,因此在處理信息時有著很高的處理速度和嚴格的時序要求。在多媒體信息集成方面,處理好多種媒體信息的時、空同步是一項必須著力解決的關鍵技術。通常信息集成包括單媒體、多媒體、超媒體的數據信息(如文本、圖形與圖像、音頻與視頻)與結構化信息和腳本信息等特殊信息的有機組合。
2)多媒體設備的集成
多媒體設備的集成包括硬件集成和軟件集成兩個方面。多媒體系統(tǒng)的各種設備應該集成為一個整體。硬件集成包括高速并行處理多媒體信息的CPU、海量存儲器、多通道I/O接口和外設、寬帶通信網絡接口等的集成,應該具有能夠處理各種媒體信息的高速并行處理系統(tǒng)、大容量的存儲器、適合多媒體的多通道輸入/輸出能力以及適合多媒體信息傳輸的多媒體通信網絡。就軟件集成而言,應該有集成一體化的多媒體操作系統(tǒng)、各系統(tǒng)之間的媒體交換格式、適合于多媒體信息管理的多媒體數據庫系統(tǒng)、編輯創(chuàng)作工具、各類高效應用軟件等。
2.交互性
交互性指的是人與信息系統(tǒng)之間相互控制和交換信息的能力,包括看什么、何時看、對媒體的選擇與查詢、命令與請求的轉換等因素。多媒體系統(tǒng)向用戶提供人機交互的操作界面,用戶通過操作界面具有使用、加工和控制信息的手段,極大地促進了用戶對信息的獲取與控制,促進了系統(tǒng)性能的提高,為應用開辟更加廣闊的領域。
借助于多媒體的交互性能,人們可以獲得更多更有用的信息。交互性改善了信息系統(tǒng)的人/機界面環(huán)境,增強了人們對信息的注意力和理解力;交互使用戶可以人為地改變信息的組織過程,延長信息的保留時間,提高信息的表現(xiàn)形式和人的邏輯思維與創(chuàng)造能力相結合的程度,人們可以研究他們感興趣的某些“活動”,從而有益于人們對信息的主動探索,發(fā)揮其想象力和創(chuàng)造能力,從而獲得新的感受和新的信息。
交互性是多媒體的顯著特點,常規(guī)電視即使是高清晰的,盡管可以表現(xiàn)聲、圖、文等內容豐富、形式多樣的信息,但由于不具備交互性,故不能稱為多媒體系統(tǒng)。而電視視頻點播(VOD,VideoonDemand)就是多媒體系統(tǒng)。
多媒體的交互應用可以分為三個層次。
(1)初級的交互應用。這是對數據的交互應用,是一種有限的交互。
(2)中級的交互應用。這是一種對信息的交互應用。
(3)高級的交互應用。這是一種高層次的對信息空間的交互應用。用戶完全地進入到一個與信息環(huán)境一體化的虛擬信息空間中,充分利用了各種感覺器官和控制能力來對空間進行控制。這種交互性不僅僅局限于視覺與聽覺,還需要引入觸覺、運動跟蹤和反饋,使用戶的每一個動作都對他所感受到的信息(包括視覺、聽覺和觸覺信息)產生相應的影響。這種全方位的交互使得用戶能體驗到逼真的感覺,這也就是虛擬現(xiàn)實所提供的交互性。
3.同步性
多媒體系統(tǒng)中的多種媒體相互之間是有關聯(lián)的,是以時空的同步方式存在的。同步性指的是在多媒體通信終端上顯現(xiàn)的圖像、聲音和文字是以同步方式工作的。
同步性是多媒體通信系統(tǒng)中最主要的特征之一??梢赃@樣說,信息的同步與否,決定了系統(tǒng)是多媒體系統(tǒng)還是多種媒體系統(tǒng)。
對多媒體系統(tǒng)來說,集成性、交互性和同步性三個特征必須是并存的,是缺一不可的。缺少其中之一,就不能稱其為多媒體系統(tǒng)。除此以外,多媒體系統(tǒng)還具有其他特性。
實時性:當用戶給出操作命令時,相應的多媒體信息都能夠得到實時控制。
獨立性:媒體的獨立性主要是針對多媒體系統(tǒng)的編輯而言的。盡管在多媒體系統(tǒng)中,媒體是多樣的,但在具體編輯的時候,各種媒體均具有獨立的可編輯性,能夠從整個系統(tǒng)中分離出來。
非線性:多媒體技術的非線性特點將改變人們傳統(tǒng)循序性的讀寫模式。以往人們讀寫方式大都采用章、節(jié)、頁的框架,循序漸進地獲取知識,而多媒體技術將借助超文本鏈接(HyperTextLink)的方法,把內容以一種更靈活、更具變化的方式呈現(xiàn)給讀者。
方便性:用戶可以按照自己的需要、興趣、任務要求、偏愛和認知特點來使用信息,任意采取圖、文、聲等信息的某一表現(xiàn)形式或多種形式。
動態(tài)性:“多媒體是一部永遠讀不完的書”,用戶可以按照自己的目的和認識特征重新組織信息,增加、刪除或修改節(jié)點,重新建立鏈。
3.1.3多媒體信息數據的特點
(1)數據量大。視頻、音頻、圖像等媒體數字化之后,其編碼數據量巨大。以數字圖像為例,按VGA標準的屏幕分辨率(640×480)計算,每幀畫面由307200個像素點組成。如果用真彩色表示,每個像素點的色彩使用24位二進制數字表示,采用每秒25幀畫面的逐行倒相正交平衡調幅(PAL,PhaseAlternationLineByLine)制式播放,則每秒鐘需傳輸的數據量為184.32Mb。相應地,要求多媒體傳輸系統(tǒng)的數據傳輸率也要達到184.32Mb/s才能實現(xiàn)實時播放,這在目前的技術條件下是難以做到的。對于聲音媒體,如CD質量的雙聲道聲音,每秒鐘需傳輸的數據量也達到1.4Mb。
(2)數據種類繁多。多媒體除了傳統(tǒng)的數字、文本形式之外,還有圖像、圖形、動畫、視頻、聲音、音樂等眾多媒體形式。其中許多種媒體又可以細分為很多小類別,例如,圖像可以細分為黑白圖像和彩色圖像、低分辨率圖像和高分辨率圖像等多種格式。聲音系統(tǒng)有單聲道、雙聲道之分,并且有不同的采樣頻率和分辨率以及不同的文本格式,導致不同的數據存儲量。
(3)不同類型的媒體數據差別很大。不同類別的媒體數據之間的差別反映在存儲容量、處理方法和時空表現(xiàn)上各不相同。首先,在存儲容量的要求上差別懸殊,傳統(tǒng)的媒體如數字、文字的數據存儲量很小,而圖像、視頻類的媒體數據存儲量巨大;其次,不同格式和內容的媒體數據在類型管理、內容解釋和處理方法上差別也很大,難以用某種方法進行統(tǒng)一處理;另外,視頻、聲音等時基類媒體數據,除了具有空間特性外,還有時間要求。
(4)各類媒體數據之間存在著多種約束關系。多媒體的不同媒體對象之間一定存在著某種約束關系,不可能是相互獨立的。媒體對象的約束關系大致可以分為時域約束、空域約束和基于內容的約束關系等。媒體對象之間的約束關系必然會反映到媒體數據存儲、傳輸和管理之中。
3.2多媒體系統(tǒng)
3.2.1多媒體系統(tǒng)的概念所謂多媒體系統(tǒng)(MultimediaSystem),是指多媒體終端設備、多媒體網絡設備、多媒體服務系統(tǒng)、多媒體軟件及有關的媒體數據組成的有機整體。從系統(tǒng)構成來看,多媒體系統(tǒng)包括計算機設備、數據庫系統(tǒng)、多媒體通信網、用戶接口等幾個組成部分。概括起來,可以將多媒體系統(tǒng)分成多媒體計算機系統(tǒng)和多媒體通信系統(tǒng)兩個部分。其中,有關計算機的信息處理部分被稱為計算機系統(tǒng),而將多媒體通信部分看做是支持信息系統(tǒng)的信息傳輸通道,即通信系統(tǒng)部分。
當多媒體系統(tǒng)只是單機系統(tǒng)時,可以只包含多媒體終端系統(tǒng)和相應的軟件及數據,如多媒體個人計算機MPC(MultimediaPC)系統(tǒng)。
但是,現(xiàn)在意義下的多媒體系統(tǒng)不僅僅是局限于單機的、獨立的系統(tǒng)。在大多數情況下,多媒體系統(tǒng)是以網絡形式出現(xiàn)的,至少在概念上應是與網絡互連的,通過網絡獲取服務,與外界進行聯(lián)系。工作在網絡環(huán)境下的多媒體系統(tǒng),其多媒體應用是以不同層次的分布方式進行工作的,稱為分布式多媒體系統(tǒng)(DMS,DistributedMultimediaSystem),往往簡稱為多媒體系統(tǒng)。
在多媒體系統(tǒng)發(fā)展初期,多媒體系統(tǒng)往往是單機的、獨立的系統(tǒng),以多媒體計算機系統(tǒng)為主體,幾乎沒有包括多媒體通信系統(tǒng),所以功能比較單一,應用范圍也往往局限在某一具體領域。隨著多媒體技術的發(fā)展和應用,特別是多媒體計算機系統(tǒng)與多媒體通信系統(tǒng)相互融合,出現(xiàn)了在網絡環(huán)境下多媒體系統(tǒng)應用的新形式。如多媒體會議系統(tǒng)、交互電視、視頻點播系統(tǒng)等,這些通過網絡進行連接,以不同層次分布方式工作的多媒體系統(tǒng),統(tǒng)稱為分布式多媒體系統(tǒng)。分布式多媒體系統(tǒng)是多媒體系統(tǒng)的發(fā)展方向。
現(xiàn)代信息系統(tǒng)是從引入計算機后開始的。幾十年來,計算機一直充當著信息系統(tǒng)中的主角?,F(xiàn)代信息系統(tǒng)的應用極為廣泛,管理信息系統(tǒng)、銀行信息系統(tǒng)、民航訂票系統(tǒng)、辦公信息系統(tǒng)、地球信息系統(tǒng)、情報檢索信息系統(tǒng)、指揮自動化系統(tǒng)等都屬于信息系統(tǒng)的范疇。但目前的信息系統(tǒng)大多數是作為計算機應用的一部分而出現(xiàn)的,常常將它與別的信息來源(如報紙、電話、廣播和電視等)加以區(qū)別,但這并不是信息系統(tǒng)的本來目的。究其原因主要是由于傳統(tǒng)的計算機不能接收和處理多媒體信息。信息系統(tǒng)的多媒體化就是技術發(fā)展極為重要的方向之一,最終的結果,將產生新一代高度集成的、功能強大的、智能化的多媒體信息系統(tǒng)。
與多媒體技術不同的是,多媒體系統(tǒng)將不再把一些基本的數據處理方法,如多媒體壓縮技術、視頻音頻采集技術、光盤存儲技術、基本接口技術等作為重點,而是把重心放在系統(tǒng)以及對系統(tǒng)影響較大的技術上面。多媒體系統(tǒng)研究的問題主要集中在系統(tǒng)的體系結構,系統(tǒng)的相互連接、系統(tǒng)的設計與組成、系統(tǒng)應用等各方面技術上。
多媒體系統(tǒng)的基本特性主要表現(xiàn)在四個方面:多媒體系統(tǒng)的集成性、多媒體系統(tǒng)的交互性、多媒體系統(tǒng)的實時性、多媒體系統(tǒng)的人機合作等。實際上,這些特性是多媒體基本特性在多媒體系統(tǒng)中的表現(xiàn)。
3.2.2多媒體系統(tǒng)的分類
從系統(tǒng)的角度出發(fā),多媒體系統(tǒng)大致分為個人系統(tǒng)、局部系統(tǒng)和公共服務系統(tǒng)等。
1.個人系統(tǒng)
個人系統(tǒng)由單獨的多媒體終端執(zhí)行獨立的操作,如便攜式筆記本電腦、個人數字助理PDA、液晶閱讀器、個人計算機、專用娛樂設備等。數據來源可以是發(fā)行的光盤數據,也可以通過網絡與服務系統(tǒng)相接。
2.局部系統(tǒng)
局部系統(tǒng)是專門為某一部門、單位或地區(qū)建立的多媒體系統(tǒng),如企業(yè)、單位的管理信息系統(tǒng),基于計算機的部門專用視頻會議系統(tǒng),賓館交互電視服務系統(tǒng),地區(qū)電視點播系統(tǒng)等。這一類系統(tǒng)一般都建立在計算機局部網絡或遠程通信網絡上,由部門本身提供應用服務。目前大多數系統(tǒng)都屬于這一類。
3.公共服務系統(tǒng)
公共服務系統(tǒng)是建立在公共網絡之上、服務于所有可能用戶的多媒體系統(tǒng),包括兩個方面:通信服務系統(tǒng)和信息服務系統(tǒng),如公共信息檢索查詢系統(tǒng)、全球數字化圖書館系統(tǒng)等。通過對局部系統(tǒng)的擴展,促進公共服務系統(tǒng)的建設。
3.2.3多媒體系統(tǒng)的體系結構
多媒體計算機系統(tǒng)包括計算機硬件系統(tǒng)、多媒體實時壓縮和解壓縮系統(tǒng)、多媒體輸入/輸出控制及接口、多媒體核心系統(tǒng)、創(chuàng)作與開發(fā)系統(tǒng)、應用系統(tǒng)。計算機硬件系統(tǒng)是多媒體計算機系統(tǒng)的物質基礎,是多媒體計算機系統(tǒng)的關鍵部分;多媒體實時壓縮和解壓縮系統(tǒng)是解決數據量大的關鍵技術,直接影響多媒體計算機系統(tǒng)的應用;多媒體輸入/輸出控制及接口是計算機硬件和軟件的連接部件,為多媒體軟件開發(fā)提供了與設備無關的硬件接口技術;多媒體核心系統(tǒng)即多媒體軟件,它是多媒體應用軟件的平臺,管理著多媒體所有軟硬件資源;創(chuàng)作與開發(fā)系統(tǒng)是多媒體應用系統(tǒng)的開發(fā)工具軟件,以提高軟件開發(fā)的效率。以上幾個方面的關系按照分層結構可以粗略地分為如圖3-1所示的幾個層次。
圖3-1多媒體系統(tǒng)的分層結構
目前多媒體計算機的應用與計算機網絡是緊密相連的,從應用系統(tǒng)來看,多媒體計算機系統(tǒng)是多媒體網絡系統(tǒng)。不僅需要高性能的多媒體計算機,還需要快速、寬帶的網絡。多媒體網絡系統(tǒng)的結構如圖3-2所示。
圖3-2多媒體網絡系統(tǒng)的結構圖
3.2.4多媒體系統(tǒng)的基本組成
1.多媒體計算機硬件系統(tǒng)
構成多媒體計算機硬件系統(tǒng)除了需要較高配置的計算機主機硬件之外,通常還需要音頻、視頻處理設備、光盤驅動器、各種媒體輸入/輸出設備等。由于多媒體計算機系統(tǒng)需要計算機交互式地綜合處理聲、文、圖信息,不僅處理量大,處理速度要求也很高,因此對多媒體計算機系統(tǒng)的要求比通用計算機系統(tǒng)更高。所以,對多媒體計算機基本硬件結構要求有功能強、速度高的主機,有足夠大的存儲空間(主存和輔存),有高分辨率的顯示接口和設備。除了計算機主機系統(tǒng)外,多媒體硬件系統(tǒng)還應有下列幾方面硬件。
(1)板卡類:音頻卡、視頻卡、文/語轉換卡、視頻壓縮/解碼卡、圖形顯示/加速卡等。
(2)外設類:攝像頭/機、數碼相機、打印機、頭盔顯示器、液晶顯示器、光驅、掃描儀等。
(3)IC類:DSP芯片、圖形圖像控制芯片、AD/DA芯片、視頻壓縮/解壓芯片、音頻處理芯片等。
(4)網絡設備:路由器、交換機、HUB、網卡、調制解調器等。
2.多媒體計算機軟件系統(tǒng)
多媒體計算機軟件系統(tǒng)按功能可分為系統(tǒng)軟件和應用軟件。
1)多媒體系統(tǒng)軟件
系統(tǒng)軟件是多媒體系統(tǒng)的核心,它不僅具有綜合使用各種媒體、靈活調度多媒體數據進行媒體的傳輸和處理的能力,而且要控制各種媒體的硬件設備和諧地工作。多媒體的各種軟件要運行于多媒體操作系統(tǒng)平臺(如Windows)上,故操作系統(tǒng)平臺是軟件的核心。多媒體系統(tǒng)軟件除具有一般系統(tǒng)軟件的特點外,還要反映多媒體技術的特點,如數據壓縮、媒體硬件接口的驅動與集成,新型的交互方式等。多媒體計算機系統(tǒng)主要的系統(tǒng)軟件有:
(1)多媒體驅動軟件;
(2)驅動器接口程序;
(3)多媒體操作系統(tǒng);
(4)媒體素材制作軟件及多媒體函數庫;
(5)多媒體創(chuàng)作工具、開發(fā)環(huán)境。
2)多媒體應用軟件
多媒體應用軟件是在多媒體創(chuàng)作平臺上設計開發(fā)的面向應用領域的軟件系統(tǒng),通常由應用領域的專家和多媒體開發(fā)人員共同協(xié)作、配合完成。開發(fā)人員利用開發(fā)平臺、創(chuàng)作工具制作組裝各種多媒體素材,生成最終的多媒體應用程序,并在應用中測試、完善,最終成為多媒體產品。
3.3超媒體與流媒體
3.3.1超文本與超媒體的概念
隨著信息與數據呈爆炸式的不斷增長,傳統(tǒng)的信息存儲與檢索機制越來越不足以使信息得到全面、完整而有效的利用,尤其不能像人類思維那樣以通過“聯(lián)想”來明確信息內部的關聯(lián)性,而這種關聯(lián)卻可以使人們了解分散存儲在不同位置信息間的連接關系及相似性。因此,迫切需要一種技術或工具,它可以建立起存儲于計算機網絡中信息之間的鏈接結構,形成可供訪問的信息空間,使得各種信息能夠得到更廣泛的應用。
1.超文本(hypertext)
超文本結構類似于人類的聯(lián)想記憶結構。它采用一種非線性的網狀結構來組織塊狀信息,沒有固定的順序,也不要求讀者必須按某個順序來閱讀。采用這種網狀結構,各信息塊很容易按照人們的“聯(lián)想”關系加以組織。傳統(tǒng)印刷文本的腳注和有許多交叉參考的百科全書,同超文本的結構很相似。對于有腳注的文本,當讀者遇到一個腳注時,可以做出不同的選擇,或者繼續(xù)閱讀正文,或者追蹤腳注。百科全書就更加典型了,讀者可以根據自己的理解程度和興趣追蹤條目中所含的條目,在條目或詞中常會遇到“參見”,讀者循此指示便可找到適當的卷和適當的條目,而在這些參見的條目中又可能出現(xiàn)“參見”,因此,閱讀的邏輯路徑就構成了一個網絡。然而,盡管腳注文本或百科全書與超文本結構非常相似,但是超文本與它們還是有著本質區(qū)別的,這就是超本文充分利用了計算機和網絡的特點,使信息之間的關聯(lián)特性從一本書或幾本書擴展到了世界范圍內的眾多媒體?,F(xiàn)代大百科全書中,相互參照往往要在幾十卷大部頭書之間來回查閱,速度很慢,十分費時。而超文本文獻可以在極短時間內就轉移到下一個節(jié)點。文本和超文本的結構如圖3-3所示。
圖3-3文本和超文本的結構
從圖3-3中可以看到,超文本是一種新型的信息管理技術。它的結構是非順序的,且是非線性的網狀結構。超文本由若干內部互聯(lián)的文本塊(或其他信息)組成,這些信息塊可以是計算機的若干屏上的信息,也可以是若干窗口、文件或更小的塊信息,這樣的信息單元就稱為節(jié)點。不管節(jié)點有多大,每個節(jié)點都有若干指向其他節(jié)點或從其他節(jié)點指向該節(jié)點的指針,這些指針稱為鏈。鏈有多種,它連接著兩個節(jié)點,通常是有向的,從一個節(jié)點(稱之為原節(jié)點)指向另一個節(jié)點(稱之為目的節(jié)點)。鏈的數量通常不是事先固定的,它依賴于每個節(jié)點的內容。有些節(jié)點與其他節(jié)點有許多關聯(lián),因此它就有許多鏈,有些節(jié)點沒有啟程鏈,它就只能作為目的節(jié)點。超文本的鏈通常連接的是節(jié)點中有關聯(lián)的一部分,而不是整個節(jié)點。
圖3-4所表示的超文本結構實際上就是由節(jié)點和鏈組成的一個有向網絡。讀者可以在這個作為瀏覽和導航用的網絡中主動航行。這里要強調的不僅僅是“閱讀”,而更重要的是用戶可以主動地決定閱讀節(jié)點的順序。假如讀者是從標記為A的文本塊開始閱讀,與單一路徑的文本不同,該超文本結構有三個閱讀路徑,即可到達B、D或E,若讀者選擇B,則可以繼續(xù)選擇到C或E,從E又可以到D,當然讀者也可以從A選擇直接到D。
圖3-4超文本結構示意圖
一般典型的超文本系統(tǒng)還具有一個用于瀏覽節(jié)點、防止迷路的交互式工具,即瀏覽器,或稱導航圖,它是一個超文本網絡的結構圖,與數據中的節(jié)點和鏈一一對應。導航圖可以幫助用戶在網絡中定向和觀察信息是如何連接的。在一個由千百個節(jié)點組成的超文本網絡中,迷路是很常見的事情。這時瀏覽工具就顯得十分重要了,它可以幫助用戶在網絡中尋路、定位。這種良好的交互特性,只有計算機才可能實現(xiàn),傳統(tǒng)印刷文本是無能為力的。
超文本是一種信息管理技術,它以節(jié)點作為基本單位,這種節(jié)點要比字符高出一個層次。抽象地說,它可以是一個信息塊,具體地說,它可以是某一字符文本集合,也可以是屏幕中某一大小的顯示區(qū)。節(jié)點的大小由實際條件決定。在信息組織方面,則是用鏈把節(jié)點連成網狀結構,即非線性文本結構。其順序、層次則是一種特殊的簡單的網狀結構。計算機技術的發(fā)展,使得節(jié)點中的數據不僅僅可以是文字,而且可以是圖形、圖像、聲音、動畫、動態(tài)視頻,甚至是計算機程序或它們的組合。這樣又形成了超媒體的概念。
2.超媒體(hypermedia)
雖然超文本技術在信息存儲、查詢、瀏覽以及知識表達方面相當靈活,而且更適應人的思維和習慣,縮小了計算機和人腦的距離,為智能化技術的發(fā)展起了推動作用,但是,由于超文本技術只能處理文本信息,在多媒體信息越來越豐富的今天就顯示出它的局限性。隨著多媒體技術的發(fā)展,各種各樣多媒體接口的引入,使表達信息的形式擴展到用視覺和聽覺甚至觸覺來表現(xiàn)。多媒體的表現(xiàn)是具有特定含義的,它是一組與時間、形式和媒體有關的動作定義。先進的多媒體表現(xiàn)的交互式特性可提供用戶控制表現(xiàn)過程和存取所需信息的能力。多媒體表現(xiàn)的組織將有助于信息的表達和交互。多媒體和超文本的結合大大改善了信息的交互程度和表達思想的準確性,多媒體的表現(xiàn)又可使超文本的交互式界面更為豐富。
把多媒體信息引入超文本,就產生了多媒體超文本,也即超媒體。而創(chuàng)作和關聯(lián)超媒體的系統(tǒng),被稱為超媒體系統(tǒng)。超媒體與超文本之間的不同之處是:超文本主要是以文字的形式表示信息,建立的鏈接關系主要是文句之間的鏈接關系;超媒體除了使用文本外,還使用圖形、圖像、聲音、動畫或影視片斷等多種媒體來表示信息,建立的鏈接關系是文本、圖形、圖像、聲音、動畫和影視片斷等媒體之間的鏈接關系。
人們將超文本、多媒體、數據庫這三個十分重要的技術互相融合形成了超媒體技術,以用于多媒體信息的存儲、管理、檢索及交換。通過利用超文本技術管理多媒體信息構成了超媒體系統(tǒng);采用數據庫技術管理多媒體信息構成了多媒體數據庫;應用超文本結構構成的數據庫成為超文本數據庫;而超媒體數據庫則是超文本、多媒體和數據庫三種技術的有機融合。
超媒體系統(tǒng)要負責協(xié)助創(chuàng)作和使用超媒體文獻。一般的文獻組織和相互參照結構在印刷時就已經定型,而超媒體的鏈和節(jié)點則可以動態(tài)地改變。各個節(jié)點中的信息可以更新,可將新節(jié)點加入到超媒體結構中,也可以加入新鏈路中來反映新的關系,形成新的組織結構,或從老的文獻中產生出新文獻。瀏覽器是超媒體系統(tǒng)的典型工具,它通過導航圖幫助用戶在網絡中定位和使用信息。在一個由千百個節(jié)點組成、分散在多臺計算機中的超媒體信息網絡中,瀏覽工具就顯得十分重要,它可以幫助用戶在網絡中尋路和定位。所以最終超媒體系統(tǒng)實現(xiàn)的是一個超媒體化的信息空間,這個空間可以由各種信息工具來構筑,用戶可以通過專門的瀏覽器進行訪問。
3.智能超媒體系統(tǒng)
智能超媒體或專家多媒體的概念,最早是在1989年被提出的。提出這個概念的科學家們認為超媒體文獻內部及文獻之間鏈的定義過于嚴格,讀者只能按照作者規(guī)定的(雖然是由用戶選定的)路徑瀏覽文獻,不能由系統(tǒng)根據用戶當時的結果動態(tài)地確定目標,也就是說這種鏈不具有“智能”,因此他們甚至使用了專家這個新術語來表示具有智能的超媒體系統(tǒng)。
傳統(tǒng)超媒體與智能超媒體的差別在于能否提供智能計算。智能超媒體將專家系統(tǒng)的特征引入到傳統(tǒng)的超媒體中,可以說是一個理想的結合。一方面,超媒體的節(jié)點雖具有豐富的表現(xiàn)能力,但鏈的動態(tài)跟蹤能力還很弱,容易令使用者“迷航”,專家系統(tǒng)特征的引入,不僅使鏈具有計算與推理等動態(tài)跟蹤與定位能力,而且使節(jié)點中的多媒體信息能夠智能化地表現(xiàn)給用戶;另一方面,超媒體中的專家系統(tǒng)特征又比普通的專家系統(tǒng)高一個層次,因為它能夠利用豐富的多媒體信息增強推理解釋,具有更易于用戶理解的知識交互界面,智能化使得超媒體的節(jié)點和鏈都更加豐富與完善。
4.超媒體系統(tǒng)特征
迄今為止,對于超媒體還沒有一個公認的標準定義,但是一般認為一個超媒體系統(tǒng)應具備以下幾個特征:
(1)節(jié)點多媒體化,有提供文本、圖形、圖像、聲音等各種媒體的能力,并能用多窗口的形式加以表現(xiàn)。
(2)具有網狀的復雜信息鏈接結構,用戶可以用不同的方法查詢使用各個節(jié)點的內容。
(3)具有良好的導航工具和航行能力,能指引用戶在信息網絡中漫游,具有防止迷路的手段,使用戶可以通過定位圖確定自己的位置。
(4)具有窗口化的管理功能,包括修改、增加、刪除節(jié)點和鏈的能力。對節(jié)點的內容有良好的編輯功能。
(5)可通過網絡共享數據庫,并可以多用戶使用庫內信息。
(6)具有交互式的操作和程序員接口。
3.3.2超媒體的組成元素
超媒體是由節(jié)點和鏈構成的信息網絡,每個節(jié)點都有若干指向其他節(jié)點或從其他節(jié)點指向該節(jié)點的指針,這些指針稱為鏈。鏈有多種,它連接著兩個節(jié)點,通常是有向的,從源節(jié)點指向目的節(jié)點。鏈的數量通常不是事先固定的,它依賴于每個節(jié)點的內容。有些節(jié)點與其他節(jié)點有許多關聯(lián),因此它就有許多鏈;有些節(jié)點沒有啟程鏈,它就只有作為目的節(jié)點。超媒體的鏈起點通常是節(jié)點中有關聯(lián)的一部分而不是整個節(jié)點。在超媒體結構中任意兩節(jié)點之間可以有若干條不同的路徑,讀者可以自由選擇最終沿哪條路徑閱讀。這同時要求超媒體結構的制作者事先必須為讀者建立一系列可供選擇的路徑,而不是單一的線性路徑。
1.節(jié)點(node)
節(jié)點是圍繞一個特殊主題組織起來的數據集合,這個集合可以是有形的,也可以是無形的,是信息空間中的一個部分。我們可以把一篇文章分解成若干塊,這些塊就是有形的節(jié)點。若對文章不進行分解,而只是根據需要對相應的內容進行定位,則這個定位周圍的信息就是一個無形的節(jié)點。節(jié)點中可以嵌入鏈,使它能與其他節(jié)點相鏈接。
節(jié)點有許多種,而且分類方法也不盡相同。在早期超文本中節(jié)點的內容一般是有形的節(jié)點,內容主要是文本、符號或數字?,F(xiàn)在根據媒體的種類、內容和功能的不同,節(jié)點可以是媒體節(jié)點(其中可以包含各種媒體,也可以包含數據庫、文獻等),也可以是動作與操作節(jié)點、組織節(jié)點、推理型節(jié)點等。
1)媒體節(jié)點
媒體節(jié)點中存放各種媒體信息,包括文本、圖像、圖形、視頻、動畫等各種媒體,也包括數據庫、文獻,存放這些媒體信息的來源、屬性和表現(xiàn)方法等。在一些情況下,每一個節(jié)點中確實包含媒體數據本身,但也有一些情況,特別是在網絡環(huán)境下,許多媒體數據需要臨時從網絡或機器中得到,所以節(jié)點中只有路徑、屬性等信息,而沒有數據本身。
節(jié)點中對媒體數據的描述直接關系到多媒體數據的表現(xiàn),不同的媒體會有不同的屬性和表現(xiàn)方法。例如,對文本要能夠表現(xiàn)出文本的字體、排版和大小;對圖像來說要能夠指明位置和大??;對視頻要能夠定義諸如快進、暫停之類的操作;對數據庫這種結構化的數據要能具有符合數據庫操作的手段。對混合媒體來說,媒體之間的同步、配合和效果,就要有更復雜的描述形式。
媒體節(jié)點中又分為文本節(jié)點、圖像節(jié)點、圖形節(jié)點、音樂節(jié)點、數字化語音節(jié)點、動畫節(jié)點和視頻節(jié)點、混合媒體節(jié)點等。
2)動作與操作節(jié)點
動作與操作也是一類媒體,因此可以當作一種動態(tài)節(jié)點,它通過超媒體的按鈕來訪問,所以有人也稱之為按鈕節(jié)點。在這種節(jié)點中常常定義了一些操作,通過這種節(jié)點為用戶提供動作和操作的可能。實際上這類節(jié)點是通過按鈕做一些超媒體表現(xiàn)以外的工作,賦以人的操作或動作。
3)組織節(jié)點
組織節(jié)點是用來組織其他節(jié)點的節(jié)點。加索引是描述節(jié)點的一種方法,同時也是數據庫管理的需要。組織節(jié)點可以實現(xiàn)數據庫的部分查詢工作,如結構查詢。組織型節(jié)點包括各種媒體節(jié)點的目錄節(jié)點和索引節(jié)點;目錄節(jié)點包含各個媒體節(jié)點的索引指針,指向索引節(jié)點;索引節(jié)點由索引項組成,索引項用指針指向目的節(jié)點,或指向相關的索引項,或指向相關表中相對應的一行,或指向原媒體的目錄節(jié)點。
4)推理型節(jié)點
推理型節(jié)點用于輔助鏈的推理與計算,它包括對象節(jié)點和規(guī)則節(jié)點。推理型節(jié)點的產生是超媒體智能化發(fā)展的產物。
2.鏈(1ink)
鏈是節(jié)點間的信息聯(lián)系,它以某種形式將一個節(jié)點與其他節(jié)點連接起來。鏈是有向的,一般結構可分為三個部分:鏈源、鏈宿及鏈的屬性。鏈源是導致瀏覽過程中節(jié)點遷移的原因,可以是熱標、媒體對象或節(jié)點等。鏈宿是鏈的目的所在,可以是節(jié)點,也可以是其他任何媒體內容。鏈的屬性決定了鏈的類型。
1)基本結構鏈
基本結構鏈是構成超媒體的主要鏈形式,它具有固定明確的特點,必須在建立一個超媒體文獻時事先由作者指明,是一種實鏈?;窘Y構鏈又包括基本鏈、交叉索引鏈和節(jié)點內注釋鏈。
基本鏈:它是建立節(jié)點之間基本順序的鏈,這有些類似于一本書中具有的章、節(jié)、小節(jié)、段落等結構。它使信息在總體上呈現(xiàn)出層次結構。基本鏈的鏈源和鏈宿都是節(jié)點。在表現(xiàn)時常用“上一節(jié)點”、“下一節(jié)點”等來表現(xiàn)節(jié)點的先后順序,也即鏈的方向。
交叉索引鏈:它將節(jié)點連接成交叉的網狀結構。交叉索引鏈的鏈源可以是各種熱標、單媒體對象及按鈕,鏈宿為節(jié)點或任何內容。在表現(xiàn)時常常用熱標激活轉移、“回退”、“返回”等表示先后順序。要注意的是,這些操作基本鏈與交叉索引鏈是不同的,基本鏈的動作決定節(jié)點間的固定順序,而交叉索引鏈的動作決定的是訪問順序。
節(jié)點內注釋鏈:它是一種指向節(jié)點內部附加注釋信息的鏈,注釋源主要通過熱標確定,注釋體則為一單媒體對象。之所以稱其為節(jié)點內注釋鏈,是因為鏈源和鏈宿均在同一節(jié)點內,一般這種節(jié)點都是混合媒體節(jié)點。采用節(jié)點內注釋鏈的好處是不用另設節(jié)點,在需要時注釋才出現(xiàn)。在表現(xiàn)形式上,注釋需要對熱標進行激活才能動作。
執(zhí)行鏈:執(zhí)行鏈將一種執(zhí)行活動與按鈕節(jié)點相連。執(zhí)行鏈使應用程序不再是孤立的,可以激發(fā)一個動作或操作。一般的操作系統(tǒng)無法記錄程序的功能、目的等,但超媒體的按鈕節(jié)點與執(zhí)行鏈可以通過建立節(jié)點方便地解釋應用程序的功能和目的,使超媒體成為高層程序的界面。
3.熱標(hotspot)
1)熱字
熱字是文本中被指定具有特殊含義或需進一步解釋的字、詞或詞組。
對熱字處理的關鍵是熱字的識別和按要求進行轉移。一個字或詞究竟是不是熱字,熱字如何轉移,都由設計者定義。有的系統(tǒng)用特殊的符號標識熱字,凡是熱字一律用保留字括起,并指明轉移的方向或處理的方式。在實際顯示時,各個保留字及轉移目的地等均不顯示,熱字被賦予特別的顏色,所以仍然可以保持原有媒體的顯示風格,并且很容易與一般的文本編輯器相兼容。轉移的目的地與轉移的處理方法,與超媒體系統(tǒng)本身的設計有關。
2)熱區(qū)
熱區(qū)是在所顯示的圖像或類似于圖像的顯示區(qū)上指明的一個敏感區(qū)域,作為觸發(fā)轉移的源點。在一幅圖像上的不同區(qū)域可以有不同的信息表現(xiàn)。熱區(qū)的設定不同于熱字,由于圖像十分直觀但不便于用語言或文字描述,所以一般都采用所見即所得的方式在圖中直接指定熱區(qū)。熱區(qū)在觸發(fā)后所引起的轉移與文本中的熱字相同,所不同的是文本熱字必須在文中描述轉移的目的地,而熱區(qū)則需要在生成時指明并存儲在節(jié)點的鏈中。
3)熱元
在圖形媒體中,圖元是其最基本的單位。為了使這些相對獨立的圖形單位能夠作為信息轉移的鏈源,就引入了熱元的概念。這種方式非常適合于在不影響圖形本身的移位、放大或縮小等變換的同時,又可以由該圖元引發(fā)相應的進一步關聯(lián)信息的表現(xiàn)。
4)熱點
熱點是另一種熱標概念,主要用于動態(tài)視頻、聲音等時基類媒體在時間軸上的觸發(fā)轉移。視頻對象可以采用長序列,要由起始幀和結尾幀確定所選定的視頻段,從而可以從一個視頻段直接跳往另外一個視頻段,也就可以實現(xiàn)自我解釋。
時基類媒體是動態(tài)的,在使用時不能僅將熱點定為時間上的某一時刻,因為用戶很難準確地確定這一時間點。熱點應是一個由用戶設定的時間區(qū)間。熱點如果定于a,則在識別時應給出一個[b,a,c]的敏感區(qū)間,在此區(qū)間內的觸發(fā)都應算作有效。由于時基類媒體有“表現(xiàn)—理解”的滯后效應,往往在理解了某一段內容后才可能有了解其他信息的愿望,而此時該時刻已過。為了正確地對應,熱點區(qū)間亦往后對應,一般區(qū)間[b,a]要遠小于區(qū)間[a,c],以適應該滯后效應。
5)熱屬性
熱屬性是把關系數據庫中的屬性作為熱源來使用。由于關系框架下的各元組可以根據操作產生許多不同的結果,比如不同的排序順序、選擇不同元組子集等,但總的來說,數據媒體是一種特定的格式化符號數據,所以大多數情況下可以采用類似于熱字的熱標方法。熱標源單位一般為一個屬性,用特定的保留屬性字的方法指明熱標觸發(fā)表現(xiàn)的內容,如用IMAGE屬性表示以下各元組中該屬性中字符為圖像對象名。屬性中的元組有多個,每個元組又都對應不同的內容,所以在把屬性當作熱源時,就要對每一個元組都指明不同的鏈。元組改變,方向也就改變。
4.宏節(jié)點
宏節(jié)點是指鏈接在一起的節(jié)點群,是超媒體網絡的一個有某種共同特征的子網(Webs)。當超媒體信息網絡十分巨大,或者該信息網絡分散在各個物理地點上時,僅通過一個層次的超媒體信息網絡管理會很復雜,因此分層是簡化網絡拓撲結構最有效的方法。
3.3.3超媒體系統(tǒng)的應用
超媒體系統(tǒng)是用來創(chuàng)作和使用超媒體應用的系統(tǒng)。超媒體系統(tǒng)一般由作者子系統(tǒng)(或稱創(chuàng)作子系統(tǒng))、讀者子系統(tǒng)(或稱瀏覽器)及支持子系統(tǒng)組成。作者子系統(tǒng)將向用戶提供超媒體的手段,包括編輯器、超媒體語言、媒體編輯工具等;讀者子系統(tǒng)向用戶提供使用超媒體應用的手段,主要是瀏覽器或導航工具;支持子系統(tǒng)是實現(xiàn)超媒體服務的關鍵,對應用來說,它是系統(tǒng)應用的內核層,它能識別超鏈的成分,并引導轉向相應的目標節(jié)點。超媒體與其說是一種新技術,不如說是信息管理的一種新思想的體現(xiàn)。這種思想的應用十分廣泛,反映到許多的應用領域。超媒體的應用主要有以下幾個方面。
1.多媒體信息管理
對多媒體信息來說,超媒體的組織方式反映了媒體之間的聯(lián)系和關系。在多媒體信息應用領域,超媒體技術可以應用于百科全書、詞典等工具書中,也可以應用于各種專業(yè)的參考書、科技期刊中。利用超媒體技術,可以很容易地把浩如煙海的、分散在各處的各種書籍、各種圖片、各種概念等進行有效的組織,使得用戶使用起來更加方便。超媒體用于多媒體信息管理還可以以超媒體型多媒體數據庫的形式出現(xiàn)。超媒體型多媒體數據庫不同于傳統(tǒng)的數據庫,也不同于一般的多媒體數據庫,它利用超鏈連接了各種信息,使得多媒體的信息檢索可以用超媒體瀏覽的方式進行,可以更好地反映出媒體之間的內容聯(lián)系。
2.個人學習與教育應用
超媒體技術在教育和輔助個人學習方面非常有效。如果將學習的資料編成固定的形式,雖然可以協(xié)助個人的學習,但不能夠適應每個人的特點和想法。超媒體化的學習資料可以給用戶一個過程的選擇,隨著學習的過程,用戶可以隨時地要求解釋和選擇更恰當的學習路徑。特別是對復雜的學習內容,超媒體系統(tǒng)不僅可以提供豐富的多媒體化的資料,以聯(lián)機求助的方式得到幫助,而且還可以用探索、參與的方式進行學習,大大提高學習的效率。
3.輔助工作
超媒體化的維修手冊、技術文檔、方針政策手冊、年度報告等可以大大地提高工作的效率。使用超媒體維修手冊可以針對具體問題得到具體的答案,而不用逐頁查找有關的數據和信息?,F(xiàn)在幾乎每一種計算機軟件都配有超媒體方式的“求助”系統(tǒng),特別是那些編程語言、工具等,這種求助系統(tǒng)發(fā)揮了巨大的作用。
4.商業(yè)展示和指南
超媒體化的產品目錄和廣告、企業(yè)的形象介紹、展覽會的展示、旅游和飯店的指南、機場和車站的查詢機等都為用戶提供了一種很好的展示方式。這些隨處可見的、用戶可以任意操作的超媒體工具,不僅有利于商業(yè)的效益提高,也大大方便了用戶。
5.娛樂和休閑
超媒體的神話故事、偵探小說、報紙刊物、家庭菜譜、電子游戲等,為家庭休閑和娛樂開辟了新的途徑。
3.3.4流媒體
1.流媒體的誕生
隨著現(xiàn)代網絡技術的發(fā)展,人們對信息的需求日益膨脹,已經從原來單純地獲取文本信息發(fā)展到現(xiàn)在的多媒體信息的獲取,Internet網絡則給人們帶來了更多形式的信息獲取方式。從最初在網絡上傳播文本和圖片到現(xiàn)在傳播的各種形式的網絡音樂和視頻、三維動畫,人們的視聽感官在網絡上得到了極大的滿足。然而,需求的不斷提高、上網人數的不斷增加以及網絡硬件設備的局限性使文件的大小成為網絡傳輸中必須要考慮的因素,人們不得不面臨這樣的問題:一方面,希望能在網絡上看到生動、清晰的多媒體演示和影視;另一方面,緩慢的網絡速度又使文件下載需要很長的時間。為了解決這個矛盾,“流媒體技術”應運而生。
2.流媒體的概念
音/視頻(A/V)等多媒體信息是在時間上展開的數據流,具有數據量大和實時性等特點。要在多媒體終端(如PC)上再現(xiàn)或回放多媒體信息,很重要的一點就是要獲得平滑的多媒體數據流。當多媒體數據保存在終端的DSM(數字存儲媒質,如計算機硬盤或VCD)中時,通過數據總線在DSM和內存之間進行傳輸不難實現(xiàn)。所以用戶可以通過下載方式將網絡中服務器的數據保存至本地硬盤。但采用下載方式,用戶必須考慮兩個因素:對客戶端的存儲需求和播放啟動延時。因為A/V文件一般都較大,所以需要的存儲容量也較大;同時由于網絡帶寬的限制,下載常常要花數分鐘甚至數小時。
如果人們能夠直接從網絡上得到平滑的數據流,則無須首先把多媒體數據下載到本地終端,流媒體技術正是試圖解決這個問題而提出的。通常,將直接從網絡上獲得平滑數據流的傳輸方式稱為流式傳輸。所謂流式傳輸就是把聲音、影像或動畫等信息由網絡中音/視頻服務器向用戶終端(如PC、PDA等)連續(xù)、實時地傳送。在采用流式傳輸的系統(tǒng)中,用戶不必像采用下載方式那樣等到整個文件全部下載完畢,而只需經過幾秒或十幾秒的啟動延時(緩沖)即可在用戶的計算機上利用解壓設備(硬件或軟件)對壓縮的多媒體數據解壓后進行回放。當音頻、視頻等媒體數據在客戶終端上播放時,數據的剩余部分將在后臺從服務器繼續(xù)下載。這種對多媒體數據邊下載邊回放的方式不僅使啟動延時大大縮短,而且不需要本地終端有太大的存儲容量。
一般來說,“流媒體”包含兩種含義:廣義上的流媒體是讓音頻和視頻形成穩(wěn)定、連續(xù)的傳輸流和回放流的一系列技術、方法和協(xié)議的總稱,也稱為流媒體系統(tǒng)或流媒體技術。媒體的本質是信息的載體,狹義上講流媒體則是相對于傳統(tǒng)的下載—回放(download-playback)方式而言的一種媒體格式,即流媒體是網絡環(huán)境中的一種新的媒體形式。它能從網絡上獲取音頻和視頻等連續(xù)的多媒體流,讓用戶可以邊接收邊播放,大大減小了時延。
流媒體指的是在計算機網絡中使用流式傳輸技術傳輸的,能夠在本地終端實時回放的,具有實時特征的媒體內容編碼數據流。因此,流媒體技術有三大特點:
(1)能夠實時播放音視頻和多媒體內容,也可對其進行點播,具有交互性。
(2)邊下載,邊播放。
(3)客戶端接收、處理和回放一個流媒體文件,但該文件不在客戶端駐流,不占用客戶端的存儲空間,流媒體處理和播放完即被清除。
3.流式傳輸
1)流式傳輸基礎
流式傳輸定義很廣泛,現(xiàn)在主要指通過網絡傳送媒體(如視頻、音頻)的技術總稱。其特定含義為通過Internet將影視節(jié)目傳送到PC機。實現(xiàn)流式傳輸有兩種方法:實時流式傳輸(RealtimeStreaming)和順序流式傳輸(ProgressiveStreaming)。一般說來,如視頻為實時廣播,或使用流式傳輸媒體服務器,或應用如RTSP的實時協(xié)議,即為實時流式傳輸;如使用HTTP服務器,文件即通過順序流發(fā)送。流式文件也支持在播放前完全下載到硬盤。
2)順序流式傳輸
順序流式傳輸是順序下載,在下載文件的同時用戶可觀看在線媒體,在給定時刻,用戶只能觀看已下載的那部分,而不能跳到還未下載的部分。順序流式傳輸不像實時流式傳輸在傳輸期間根據用戶連接的速度做調整。由于標準的HTTP服務器可發(fā)送這種形式的文件,也不需要其他特殊協(xié)議,它經常被稱做HTTP流式傳輸。順序流式傳輸比較適合高質量的短片段,如片頭、片尾和廣告等,由于該文件在播放前觀看的部分是無損下載的,這種方法保證電影播放的最終質量。但這也意味著用戶在觀看前,必須經歷延遲,對較慢的連接尤其如此。對通過調制解調器發(fā)布短片段,順序流式傳輸顯得很實用,它允許用比調制解調器更高的數據速率創(chuàng)建視頻片段。盡管有延遲,但畢竟可以發(fā)布較高質量的視頻片段。
順序流式文件放在標準HTTP或FTP服務器上,易于管理,基本上與防火墻無關。順序流式傳輸不適合長片段和有隨機訪問要求的視頻,如講座、演說與演示等,它也不支持現(xiàn)場廣播。嚴格說來,它是一種點播技術。
3)實時流式傳輸
實時流式傳輸保證媒體信號帶寬與網絡連接匹配,使媒體可被實時觀看到。實時流式傳輸與HTTP流式傳輸不同,需要專用的流媒體服務器與傳輸協(xié)議。
實時流式傳輸總是實時傳送,特別適合現(xiàn)場事件,也支持隨機訪問,用戶可快進或后退以觀看前面或后面的內容。理論上,實時流一經播放就可不停止,但實際上,可能發(fā)生周期暫停。實時流式傳輸必須匹配連接帶寬,這意味著在以調制解調器速度連接時圖像質量較差。而且,由于出錯丟失的信息被忽略掉,網絡擁擠或出現(xiàn)問題時,視頻質量很差。如欲保證視頻質量,選擇順序流式傳輸也許更好。實時流式傳輸需要特定服務器,如QuickTimeStreamingServer、RealServer與WindowsMediaServer。這些服務器允許對媒體發(fā)送進行更多級別的控制,因而系統(tǒng)設置、管理比標準HTTP服務器更復雜。實時流式傳輸還需要特殊網絡協(xié)議,如RTSP(RealtimeStreamingProtocol)或MMS(MicrosoftMediaServer)。這些協(xié)議在有防火墻時有時會出現(xiàn)問題,導致用戶不能看到一些實時內容。
4.智能流技術
由于用戶接入互聯(lián)網的速率千差萬別,流媒體若以固定速率進行流式傳輸,速率低會限制發(fā)布媒體質量,速率高又會限制連接人數。解決問題的思路有兩種,一是“視頻流瘦化”,即以單一數據速率創(chuàng)建流媒體文件,低速連接時通過抽取內部幀來降低文件碼率,但這樣做會使圖像質量損失很大;二是根據不同連接速率創(chuàng)建多個文件,針對不同的用戶連接發(fā)送相應文件,但由于用戶連接是動態(tài)變化的,這種情況下服務器無法實時處理。
智能流技術(SureStream)則通過兩種途徑解決帶寬協(xié)調和流瘦化。首先,確立一個編碼框架,允許不同速率的多個流同時編碼,合并到同一個文件中創(chuàng)建可擴展流式文件,稱為智能流文件。第二,采用一種客戶/服務器機制探測帶寬變化。當客戶端發(fā)出請求,其帶寬容量將傳給服務器,媒體服務器根據客戶帶寬將智能流文件的相應部分傳送給用戶。用戶因此可以獲得當前連接條件下最優(yōu)質的媒體質量。智能流通過描述Internet上變化的帶寬特點來發(fā)送高質量媒體,對混合連接環(huán)境的內容授權提供了解決方法。
5.流媒體技術原理
流式傳輸的實現(xiàn)需要緩存。因為Internet以包傳輸為基礎進行斷續(xù)的異步傳輸,對一個實時A/V源或存儲的A/V文件,在傳輸中它們要被分解為許多包,由于網絡是動態(tài)變化的,各個包選擇的路由可能不盡相同,故到達客戶端的時間延遲也就不等,甚至先發(fā)的數據包還有可能后到。為此,使用緩存系統(tǒng)來彌補延遲和抖動的影響,并保證數據包的順序正確,從而使媒體數據能連續(xù)輸出,而不會因為網絡暫時擁塞使播放出現(xiàn)停頓。通常高速緩存所需容量并不大,因為高速緩存使用環(huán)形鏈表結構來存儲數據:通過丟棄已經播放的內容,流可以重新利用空出的高速緩存空間來緩存后續(xù)尚未播放的內容。
流式傳輸的實現(xiàn)需要合適的傳輸協(xié)議。由于TCP協(xié)議需要較多的開銷,故不太適合傳輸實時數據。在流式傳輸的實現(xiàn)方案中,一般采用HTTP/TCP協(xié)議來傳輸控制信息,而用RTP/UDP協(xié)議來傳輸實時聲音數據。
流式傳輸的過程一般是這樣的:用戶選擇某一流媒體服務后,Web瀏覽器與Web服務器之間使用HTTP/TCP交換控制信息,以便把需要傳輸的實時數據從原始信息中檢索出來;然后客戶機上的Web瀏覽器啟動A/VHelper程序,使用HTTP從Web服務器檢索相關參數對Helper程序初始化。這些參數可能包括目錄信息、A/V數據的編碼類型或與A/V檢索相關的服務器地址。
A/VHelper程序及A/V服務器運行實時流控制協(xié)議(RTSP),以交換A/V傳輸所需的控制信息。與CD播放機所提供的功能相似,RTSP提供了操縱播放、快進、快倒、暫停及錄制等命令的方法。A/V服務器使用RTP/UDP協(xié)議將A/V數據傳輸給A/V客戶程序(一般可認為客戶程序等同于Helper程序),一旦A/V數據抵達客戶端,A/V客戶程序即可播放輸出。
需要說明的是,在流式傳輸中,使用RTP/UDP和RTSP/TCP兩種不同的通信協(xié)議與A/V服務器建立聯(lián)系,是為了能夠把服務器的輸出重定向到一個不同于運行A/VHelper程序所在客戶機的目的地址。實現(xiàn)流式傳輸一般都需要專用服務器和播放器,其基本原理如圖3-5所示。
圖3-5流式傳輸基本原理
流媒體的具體傳輸流程如下:
(1)Web瀏覽器與Web服務之間使用HTTP/TCP交換控制信息,以便把需要傳輸的實時數據從原始信息中檢索出來。
(2)用HTTP從Web服務器檢索相關數據,A/V播放器進行初始化。
(3)從Web服務器檢索出來的相關服務器的地址定位A/V服務器。
(4)A/V播放器和A/V服務器之間交換A/V傳輸所需要的實時控制協(xié)議。
(5)一旦A/V數據抵達客戶端,A/V播發(fā)器就可以播放了。
3.3.5流媒體傳輸的網絡協(xié)議
流媒體采用流式傳輸方式在網絡服務器與客戶端之間進行傳輸。流式傳輸的實現(xiàn)需要合適的傳輸協(xié)議。因特網工程任務組(IETF,InternetEngineeringTaskForce)制定的很多協(xié)議都可用于實現(xiàn)流媒體技術。其他的標準化組織也在這方面做了很大的努力,如MPEG-4
的多媒體遞送集成框架(DMIF)。這里簡要介紹幾種IETF制定的協(xié)議。
1.RTP/RTCP
實時傳輸協(xié)議(RTP,Real
timeTransportProtocol)為交互式音頻、視頻等具有實時特征的數據提供端到端的傳送服務。如果底層網絡支持多播,RTP還可使用多播向多個目的端點發(fā)送數據。RTP協(xié)議包含兩個密切相關的部分,即負責傳送具有實時特征多媒體數據的RTP和負責反饋控制、監(jiān)測QoS和傳遞相關信息的RTCP(Real
timeTransportControlProtocol)。在RTP數據包的頭部中包含了一些重要的字段,使接收端能夠對收到的數據包恢復發(fā)送時的定時關系,進行正確的排序以及統(tǒng)計包丟失率等。RTCP是RTP的控制協(xié)議,它周期性地與所有會話的參與者進行通信,并采用和傳送數據包相同的機制來發(fā)送控制包。
值得注意的是,RTP協(xié)議本身并不提供任何QoS,QoS必須由下層網絡來保證。但是通過RTCP控制包可以為應用程序動態(tài)提供網絡的當前信息,據此可對RTP的數據收發(fā)作相應調整,使之最大限度地利用網絡資源。
2.RSVP
IETF的資源預留協(xié)議(RSVP,ResourceReservationProtocol)是網絡中預留所需資源的傳送通道建立和控制的信令協(xié)議,它能根據業(yè)務數據的QoS要求和帶寬資源管理策略進行帶寬資源分配,在IP網上提供一條完整的路徑。通過預留網絡資源建立從發(fā)送端到接收端的路徑,使得IP網絡能提供接近于電路交換質量的業(yè)務。即在面向無連接的網絡上,增加了面向連接,既利用了面向無連接網絡的多種業(yè)務承載能力,又提供了接近面向連接網絡的質量保證。但是RSVP沒有提供多媒體數據的傳輸能力,它必須配合其他實時傳輸協(xié)議來完成多媒體通信服務。
3.RTSP
實時流協(xié)議(RTSP,Real
timeStreamingProtocol)是用于控制具有實時特征數據傳輸的應用層協(xié)議。它提供了一個可擴展的框架以控制、按需傳送實時數據,如音頻、視頻等。數據源既可以是實況數據產生裝置,也可以是預先保存的媒體文件。該協(xié)議致力于控制多個數據傳送會話,提供了一種在UDP、組播UDP和TCP等傳輸通道之間進行選擇的方法,也為選擇基于RTP的傳輸機制提供了方法。
RTSP可建立和控制一個或多個音頻和視頻連續(xù)媒體的時間同步流。雖然在可能的情況下,它會將控制流插入連續(xù)媒體流,但它本身并不發(fā)送連續(xù)媒體流。因此,RTSP用于通過網絡對媒體服務器進行遠程控制。盡管RTSP和HTTP有很多類似之處,但不同于HTTP,RTSP服務器維護會話的狀態(tài)信息,從而通過RTSP的狀態(tài)參數可對連續(xù)媒體流的回放進行控制(如暫停等)。
4.MIME
通用因特網郵件擴展(MIME,MultipurposeInternetMailExtensions)是SMTP的擴展,不僅僅用于電子郵件。通過它,Web服務器和Web瀏覽器才可以識別流媒體并進行相應的處理。Web服務器和Web瀏覽器都是基于HTTP協(xié)議的,而HTTP內建有MIME。HTTP正是通過MIME來標記Web上繁多的多媒體文件格式。為了能處理一種特定文件格式,需對Web服務器和Web瀏覽器都進行MIME類型設置。對于標準的MIME類型,如文本和JPEG圖像,Web服務器瀏覽器提供內建支持;但對Real等非標準的流媒體文件格式,則需設置audio/x
pn
realaudio等MIME類型。瀏覽器通過MIME來識別流媒體的類型,并調用相應的程序或插件(Plug
in)來處理。在IE瀏覽器中,提供了很多的內建流媒體支持。
3.3.6流媒體系統(tǒng)的組成和應用
一般而言,流媒體系統(tǒng)大致包括幾個原件:轉檔/轉碼工具(Encoder),用于壓縮轉檔;服務器(Server),管理并傳送大量多媒體內容;編碼器(Scripter),可整合多媒體,并以互動方式呈現(xiàn);播放器(Player),在用戶端的PC上呈現(xiàn)串流的內容;另外還有許多不同的多媒體制作工具(Content
creationtool)。
當一個網站提供視頻點播(VOD,VideoonDemand)的串流內容時,需要使用轉檔/轉碼工具,將一般的多媒體檔案進行高品質的適合網絡上串流的壓縮,再將轉好的檔案傳送到服務器端放送出去;若網站要提供的是轉播的服務,則需要將音頻及視頻內容截取后,直接傳到服務器端并由服務器放送出去,而直播式的傳送可以透過單播(Unicast)或多播(Multicast)來實現(xiàn)。
一個完整的流媒體平臺包括流服務應用軟件、集中分布式視頻系統(tǒng)、視頻業(yè)務管理媒體發(fā)布系統(tǒng)、視頻采集制作系統(tǒng)、媒體內容自動索引檢索系統(tǒng)、媒體數字版權加密系統(tǒng)(DRM)、媒體存儲系統(tǒng)、客戶端系統(tǒng)等重要組成部分。
1.流服務應用軟件
應用流軟件是系統(tǒng)中最重要的成分,要求在最廣的范圍、多種連接速度基礎上提供性能最好的多媒體效果,并具有強有力的系統(tǒng)管理和可伸縮性能力,以及具有開放的、標準的、跨平臺的架構。軟件系統(tǒng)必須具有極高的壓縮比和很好的傳輸能力,適合網絡發(fā)布。服務器端軟件應該具有強大的網絡管理功能,支持廣泛的媒體格式,支持最大量的互聯(lián)網用戶群與流媒體商業(yè)模式。
2.集中分布式視頻系統(tǒng)
面對越來越巨大的流應用需求,系統(tǒng)必須擁有良好的可伸縮性。隨著業(yè)務的增加和用戶的增多,系統(tǒng)可以靈活地增加現(xiàn)場直播流的數量,并通過增加帶寬集群和接近最終用戶端的邊緣流媒體服務器的數量,增加并發(fā)用戶的數量,不斷滿足用戶對系統(tǒng)的擴展要求。
3.視頻業(yè)務管理媒體發(fā)布系統(tǒng)
視頻業(yè)務管理媒體發(fā)布系統(tǒng)包括廣播和點播的管理,節(jié)目管理,創(chuàng)建、發(fā)布及計費認證服務,提供定時按需錄制、直播、傳送節(jié)目的解決方案,管理用戶訪問及多服務器系統(tǒng)負載均衡調度服務。
4.視頻采集制作系統(tǒng)
視頻采集制作系統(tǒng)利用媒體采集設備進行Stream的制作與生成。它包括一系列的工具,從獨立的視頻、聲音、圖片、文字組合到制作豐富的流媒體,這些工具產生的Stream文件可以存儲為固定的格式,供發(fā)布服務器使用。視頻采集制作系統(tǒng)可以實時向發(fā)布服務器提供各種視頻流,提供實時的多媒體信息發(fā)布服務。
5.媒體內容自動索引檢索系統(tǒng)
媒體內容自動索引檢索系統(tǒng)能對媒體源進行標記,捕捉音頻和視頻文件并建立索引,建立高分辨率媒體的低分辨率代理文件,從而可以用于檢索、視頻節(jié)目的審查、基于媒體片段的自動發(fā)布,形成一套強大的數字媒體管理發(fā)布應用系統(tǒng)。
索引和編碼:允許同時索引和編碼,使用先進的技術實時處理視頻信號,而且可以根據內容自動地建立一個視頻數據庫(或索引)。
媒體分析軟件可以實時地根據屏幕的文本來識別。實時語音識別可以用來鑒別口述單詞、說話者的名字和聲音類型,而且還可以感知出屏幕圖像的變化,并把收到的信息歸類成一個視頻數據庫。媒體分析軟件還可以感知到視覺內容的變化,可以智能化地把這些視頻分解成片段并產生一系列可以瀏覽的關鍵幀圖像,也可以從視頻信號中識別出標題文字或是語音文本,同時可以識別出視頻中的人像,就像識別屏幕上的文字、數字一樣。通過聲音識別,該軟件可以將聲音信號中的話語、說話者的姓名、聲音類型轉換成可編輯的文本。用戶用這些信息索引還可以搜索想要的視頻片段。使用一個標準的Web瀏覽器,用戶可以像檢索互聯(lián)網其他信息一樣來檢索視頻片段。
6.媒體數字版權加密系統(tǒng)(DRM)
DRM是在互聯(lián)網上以一種安全方式進行媒體內容加密的端到端的解決方案,它允許內容提供商在其發(fā)布的媒體或節(jié)目中指定的時間段、觀看次數及其內容進行加密和保護。服務器鑒別和保護需要保護的內容,DRM認證服務器支持媒體靈活的訪問權限(時間限制、區(qū)間限制、播放次數和各種組合),支持其他具有完整商業(yè)模型的DRM系統(tǒng)集成,包括訂金、VOD、出租、所有權、B2B的多級內容分發(fā)版權管理領域等,是運營商保護內容和依靠內容贏利的關鍵技術保障。
7.媒體存儲系統(tǒng)
由于要存儲大容量的影視資料,因此媒體存儲系統(tǒng)必須配備大容量的磁盤陣列,具有高性能的數據讀寫能力,可以訪問共享數據,高速傳輸外界請求數據,并具有高度的可擴展性、兼容性,支持標準的接口。這種系統(tǒng)配置應能滿足上千小時的視頻數據的存儲,實現(xiàn)大量片源的海量存儲。
8.客戶端系統(tǒng)
客戶端系統(tǒng)支持實時音頻和視頻直播和點播,可以嵌入到流行的瀏覽器中,可播放多種流行的媒體格式,支持流媒體中的多種媒體形式,如文本、圖片、Web頁面、音頻和視頻等集成表現(xiàn)形式。在帶寬充裕時,流式媒體播放器可以自動偵測視頻服務器的連接狀態(tài),選用更適合的視頻,以獲得更好的效果。目前應用最多的播放器有美國RealNetworks公司的RealPlayer、美國微軟公司的MediaPlayer和美國蘋果公司的QuickTime三種產品。
3.4聲音媒體
3.4.1聲音媒體的種類
凡是以聲音形式傳遞信息的媒體統(tǒng)稱為聲音媒體。聲音媒體攜帶的信息量大、準確、精細,是人們用來傳遞信息最方便、最熟悉的方式,它在多媒體應用中有著十分重要的作用。但是,就其使用范圍而言,聲音媒體比視覺類媒體小得多。聲音媒體主要可以分為以下幾種類別。
1.波形聲音
波形聲音是自然界一切聲音的固有的物理特征,講話時聲帶的振動,演奏時樂器的振動,雷擊、刮風、下雨時空氣分子的振動等都以振動波的形式通過聽覺給我們傳遞聲音信息,而機械振動或者氣流擾動都會引起其周圍的彈性媒體發(fā)出波形聲音。波形聲音具有反射、折射、衍射和干涉等一般波動現(xiàn)象所共有的特性。波形聲音是數字化聲音的基礎。
2.語音
語音是人類特有的一種聲音形式。語音信號除了具備振動波的特征,是聲音的載體以外,同時還攜帶了感情的色彩,因此它具有語言學、語音學內涵,要用特殊的方法進行抽象研究。所以常把語音劃分為一種特殊類別的聲音媒體,主要用于信息解釋、語音識別、語音合成等。
3.音樂
音樂是是由各種樂器產生的符號化了的聲音。這種符號就是樂曲,樂曲是轉化為符號媒體的聲音。MIDI是十分規(guī)范的一種形式。樂譜是視覺化的聲音媒體,能表達比單個符號更復雜的聲音信息。音樂既可供欣賞,也可以用作烘托氣氛。
3.4.2聲音數據壓縮方法
在多媒體技術中,聲音信息所占比重僅次于圖像信息。聲音數據的壓縮方法也分無損壓縮和有損壓縮兩大類別,其編碼技術同視頻數據編碼技術沒有本質上的區(qū)別。無損壓縮(熵編碼)主要采用哈夫曼編碼和行程編碼等;有損壓縮則分別有波形編碼、參數編碼以及綜合運用這兩種編碼技術的混合編碼方法等三個類別。波形編碼依據人耳的聽覺特性以及聲音的掩蔽特性,通過對聲音波形進行采樣和量化處理所獲得的數字化聲音信號進行壓縮編碼,以達到壓縮聲音數據的目的,并且盡可能地使編碼后的音頻信號與原始聲音的波形匹配。波形編碼具有算法簡單、容易實現(xiàn)、聲音恢復后能保持原有聲音的特點,在較高碼率下可以獲得高質量的音頻信號,適合于高保真語音和音樂信號及高質量的音頻信號。
它的缺點在于容易受量化噪聲的干擾,進一步降低編碼比特數比較困難。常用的三種波形編碼有脈沖編碼調制(PCM)、差分脈沖編碼調制(DPCM)和自適應差分脈沖編碼調制(ADPCM)。三種方法的主要差別是,在同樣采樣頻率和量化精度的情況下,數字化音頻的數據量差別較大。PCM是直接對聲音信號作A/D轉換,在采樣頻率足夠高、量化位數足夠多的情況下,解碼恢復的聲音信號可以有很好的質量,但這種編碼方法數據量很大,需要很高的傳輸速率;DPCM只傳輸對聲音樣本值同預測值的差值編碼,因而所需比特數比樣本值所需比特數低;ADPCM通過對不同頻段自適應地設置不同的量化步長,使編碼數據得到了進一步的壓縮。參數編碼是一種模型參數編碼方法,它通過建立起聲音信號的產生模型把音頻信號表示成某種模型的輸出,通過特征提取法抽取必要的模型參數及激勵信號的信息,再對參數和激勵信息進行編碼,最后輸出合成的復原信號。
參數編碼的優(yōu)點是壓縮率很大,但是存在計算量大、保真度不高等缺點。因為這種編碼信號解碼后與原來
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 黔西南2025年貴州興義市事業(yè)單位招聘教師189人筆試歷年參考題庫附帶答案詳解
- 青島2025年山東青島幼兒師范高等專科學校遴選4人筆試歷年參考題庫附帶答案詳解
- 錫林郭勒2025年內蒙古西烏珠穆沁旗招聘中小學教師筆試歷年參考題庫附帶答案詳解
- 郴州2025年湖南郴州市汝城縣招聘醫(yī)療衛(wèi)生專業(yè)技術人員32人筆試歷年參考題庫附帶答案詳解
- 玉林2025年廣西玉林市幼兒園招聘14人筆試歷年參考題庫附帶答案詳解
- 文山2025年云南文山州統(tǒng)計局招聘編外工作人員筆試歷年參考題庫附帶答案詳解
- 張家口2025年河北張家口經開區(qū)招聘警務輔助人員66人筆試歷年參考題庫附帶答案詳解
- 呂梁2025年山西孝義市中心醫(yī)院招聘82人筆試歷年參考題庫附帶答案詳解
- 廈門2025年福建廈門市臺灣藝術研究院招聘筆試歷年參考題庫附帶答案詳解
- 佛山2025年廣東佛山市檢察機關招聘勞動合同制司法輔助人員50人筆試歷年參考題庫附帶答案詳解
- 鄉(xiāng)鎮(zhèn)醫(yī)院器械管理辦法
- 關節(jié)脫位院前急救
- 2024年山東省濟南市中考化學試卷( 含答案)
- 建筑結構改造設計和加固技術綜合分析的開題報告
- 管理會計學 第10版 課件 第1、2章 管理會計概論、成本性態(tài)與變動成本法
- 喪葬費用補助申請的社保授權委托書
- 2024年度初會《經濟法基礎》高頻真題匯編(含答案)
- 課例研究報告
- 啤酒營銷促銷實戰(zhàn)技巧之經銷商管理技巧知識培訓
- 建筑工程各部門職能及各崗位職責201702
- 機柜端口對應表
評論
0/150
提交評論