多媒體音頻信息處理_第1頁
多媒體音頻信息處理_第2頁
多媒體音頻信息處理_第3頁
多媒體音頻信息處理_第4頁
多媒體音頻信息處理_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章多媒體音頻信息處理多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第1頁! 聲音是攜帶信息的極其重要的媒體,是多媒體技術(shù)研究中的一個(gè)重要內(nèi)容。聲音的種類繁多,如人的話音、樂器聲、動(dòng)物發(fā)出的聲音、機(jī)器產(chǎn)生的聲音以及自然界的聲音等。這些聲音有許多共同的特性,也有它們各自的特性。在用計(jì)算機(jī)處理這些聲音時(shí),既要考慮它們的共性,又要利用它們的各自的特性。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第2頁!一、音頻信號(hào)的分類音頻信號(hào)可分為兩類:

語音信號(hào):語音是語言的物質(zhì)載體,它包含了豐富的語言內(nèi)涵,是人類進(jìn)行信息交流所特有的形式。

非語音信號(hào):主要包括音樂和自然界存在的其他聲音形式。非語音信號(hào)的特點(diǎn)是不含復(fù)雜的語義和語法信息,其信息量低,識(shí)別簡單。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第3頁!一個(gè)聲源每秒鐘可產(chǎn)生成百上千個(gè)波峰,把每秒鐘波峰所發(fā)生的數(shù)目稱之為信號(hào)的頻率。

信號(hào)周期是指兩個(gè)峰點(diǎn)或谷底之間的相對(duì)時(shí)間。

信號(hào)的基線提供了一個(gè)測(cè)量聲音的起點(diǎn)。信號(hào)的幅度是從信號(hào)的基線到當(dāng)前波峰的距離。幅度決定了信號(hào)音量的強(qiáng)弱程度。信號(hào)帶寬是聲音信號(hào)的一個(gè)重要參數(shù),它用來描述組成復(fù)合信號(hào)的頻率范圍。振幅周期基線多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第4頁!三、聲音質(zhì)量的評(píng)價(jià)客觀質(zhì)量度量:用信噪比來衡量。主觀質(zhì)量度量現(xiàn)在公認(rèn)的聲音質(zhì)量分為4級(jí)數(shù)字激光唱盤質(zhì)量調(diào)頻無線電廣播調(diào)幅無線電廣播電話質(zhì)量多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第5頁!四、模擬音頻的數(shù)字化過程話音信號(hào)是典型的連續(xù)信號(hào),不僅在時(shí)間上是連續(xù)的,而且在幅度上也是連續(xù)的。在時(shí)間上“連續(xù)”是指在一個(gè)指定的時(shí)間范圍里聲音信號(hào)的幅值有無窮多個(gè),在幅度上“連續(xù)”是指幅度的數(shù)值有無窮多個(gè)。我們把在時(shí)間和幅度上都是連續(xù)的信號(hào)稱為模擬信號(hào)。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第6頁!計(jì)算機(jī)對(duì)聲音的表示主要是通過規(guī)則的時(shí)間間隔測(cè)出音波振動(dòng)的幅度從而產(chǎn)生的一系列聲音數(shù)據(jù)。這種測(cè)出數(shù)據(jù)的方法就稱為采樣,一秒內(nèi)采樣的次數(shù)稱為采樣率(samplingrate),單位為Hz。例如:采樣頻率通常采用種:11.025KHz(語音效果)、22.05KHz(音樂效果)44.1KHz(高保真效果)。常見的CD唱盤的采樣頻率即為44.1KHz。采樣多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第7頁!采樣的離散音頻數(shù)據(jù)要轉(zhuǎn)換成計(jì)算機(jī)能夠表示的數(shù)據(jù)范圍的過程,我們把對(duì)聲波波形幅度的數(shù)字化表示稱之為“量化”量化的過程首先將采樣后的信號(hào)按整個(gè)聲波的幅度劃分成有限個(gè)區(qū)段的集合,把落入某個(gè)區(qū)段內(nèi)的樣值歸為一類,并賦予相同的量化值.

量化多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第8頁!

量化位數(shù)量化位數(shù)也稱“量化精度”,是描述每個(gè)采樣點(diǎn)樣值的二進(jìn)制位數(shù)。例如,8位量化位數(shù)表示每個(gè)采樣值可以用28即256個(gè)不同的量化值之一來表示,而16位量化位數(shù)表示每個(gè)采樣值可以用216即65536個(gè)不同的量化值之一來表示。這個(gè)參數(shù)就是通常所說的聲卡的位數(shù).常用的量化位數(shù)為8位、16位、32位,專業(yè)級(jí)的高檔聲卡有64位的。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第9頁!所謂編碼,就是按照一定的格式把離散的數(shù)字記錄下來,并在有用的數(shù)據(jù)中加入一些用于糾錯(cuò)、同步和控制的數(shù)據(jù).在數(shù)據(jù)回放時(shí),可以根據(jù)所記錄的糾錯(cuò)數(shù)據(jù)判別讀出的聲音數(shù)據(jù)是否有錯(cuò),如在一定范圍內(nèi)有錯(cuò),可加以糾正.多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第10頁!音頻信號(hào)能夠被壓縮編碼的依據(jù)有兩個(gè),一是聲音信號(hào)存在著數(shù)據(jù)冗余;二是利用人的聽覺特性來降低編碼率,人的聽覺具有一個(gè)強(qiáng)音能抑制一個(gè)同時(shí)存在的弱音現(xiàn)象,這樣就可以抑制與信號(hào)同時(shí)存在的量化噪聲;另外人耳對(duì)低頻端比較敏感,而對(duì)高頻端不太敏感,由此引出了“子帶編碼技術(shù)”。音頻信號(hào)的編碼方式可分為波形編碼參數(shù)編碼和混合編碼三種。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第11頁!2).參數(shù)編碼 參數(shù)編碼方法通過建立起聲音信號(hào)的產(chǎn)生模型,將聲音信號(hào)用模型參數(shù)來表示,再對(duì)參數(shù)進(jìn)行編碼,在聲音播放時(shí)根據(jù)參數(shù)重建聲音信號(hào)。參數(shù)編碼法算法復(fù)雜,計(jì)算量大,壓縮率高,但還原聲音的質(zhì)量不高。3).混合編碼 混合編碼是把波形編碼的高質(zhì)量和參數(shù)編碼的低數(shù)據(jù)率結(jié)合在一起,取得了較好效果。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第12頁!PCM編碼是對(duì)連續(xù)語音信號(hào)進(jìn)行空間采樣,幅度值量化及用適當(dāng)碼字將其編碼的總稱.PCM方法可以按量化方式的不同,分為均勻量化PCM,非均勻量化PCM和自適應(yīng)量化PCM等三種.多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第13頁!差分脈沖編碼調(diào)制(DPCM)他編碼的不是聲音采樣樣本值,而是樣本值及其預(yù)測(cè)值的差分。根據(jù)過去的樣本去估算(estimate)下一個(gè)樣本信號(hào)的幅度大小,這個(gè)值稱為預(yù)測(cè)值,然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼,從而就減少了表示每個(gè)樣本信號(hào)的位數(shù)。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第14頁!自適應(yīng)差分脈沖編碼(ADPCM)自適應(yīng)就是使量化間隔大小的變化自動(dòng)的去適應(yīng)輸入信號(hào)大小的變化.他根據(jù)信號(hào)分布不均勻的特點(diǎn),是系統(tǒng)具有隨輸入信號(hào)的變化而改變量化區(qū)間的大小,以保證輸入量化器的信號(hào)基本均勻的能力.多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第15頁!標(biāo)準(zhǔn)比特速度編碼技術(shù)應(yīng)用制定日期G.723

5.3kb/s或6.3kb/sMP-MLQ視頻電話及IP電話等1996.3G.72264kb/sSBC+ADPCM視聽多媒體和會(huì)議電話1988.11G.71164kb/sPCM公共電話網(wǎng)1972G.72816kb/sLD-CELP公共電話網(wǎng)1992.9G.7298kb/sCS-ACELP無線移動(dòng)網(wǎng)、1996.3計(jì)算機(jī)通信系統(tǒng)等ITU-TG系列音頻壓縮編碼標(biāo)準(zhǔn)多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第16頁!六、數(shù)字音頻的文件格式

WAV文件WAV文件又稱為波形文件,是Micorsoft公司的文件格式.WAV文件來源于對(duì)聲音模擬波形的采樣,并以不同的量化位數(shù)把這些采樣點(diǎn)的值轉(zhuǎn)換成二進(jìn)制數(shù).WAVE聲音文件是使用RIFF(資源交換文件)的格式描述的多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第17頁!

VOC文件VOC文件是Creative公司所使用的標(biāo)準(zhǔn)音頻文件格式。與WAVE格式類似,VOC文件有文件頭塊和音頻數(shù)據(jù)塊組成。文件頭包含一個(gè)標(biāo)識(shí)、版本號(hào)和一個(gè)指向數(shù)據(jù)塊起始地址的指針。數(shù)據(jù)塊分成各種類型的子塊,如聲音數(shù)據(jù)、靜音、標(biāo)記、重復(fù)、重復(fù)的結(jié)束及終止標(biāo)記等。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第18頁!RealPlayer公司推出的適合于網(wǎng)絡(luò)播放的媒體格式。①高壓縮比,存儲(chǔ)空間小。②適合網(wǎng)絡(luò)播放。③音質(zhì)不是很好。④專用播放器Realplayer、

超級(jí)解霸2001以上的版本等

RA格式文件多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第19頁!七、聲卡雖然PC聲卡是在20世紀(jì)90年代才得以普及,但它的問世卻是在1984年。英國的ADLIB公司是目前公認(rèn)的“聲卡之父”,雖然他們最初開發(fā)的產(chǎn)品只能提供簡單的聲音效果,并且無法處理音頻信號(hào),但在當(dāng)時(shí)無疑已經(jīng)是一個(gè)很大的突破。由于技術(shù)不夠成熟,成本又非常昂貴,因此這類帶有試驗(yàn)品性質(zhì)的早期ADLIB音樂卡,因在當(dāng)時(shí)計(jì)算機(jī)的運(yùn)算速度還不足以應(yīng)付大規(guī)模的多媒體處理,所以未能普及。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第20頁!(二)聲卡的技能指標(biāo)音頻技術(shù)指標(biāo)聲卡的錄音、放音效果應(yīng)該具有CD唱片的音質(zhì)。所謂CD音質(zhì)是指錄音采樣速度達(dá)到44.1kHz,用16位量化指標(biāo)來記錄聲音。SoundBlaster16(即16位聲霸卡)系列的聲卡都是CD音質(zhì)的聲卡。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第21頁!(二)聲卡的技能指標(biāo)聲道數(shù)聲卡所支持的聲道數(shù)也是重要指標(biāo)。

單聲道是比較原始的聲音復(fù)制形式,缺乏對(duì)聲音的位置定位。

立體聲聲音在錄制過程中被分配到兩個(gè)獨(dú)立的聲道,從而達(dá)到了很好的聲音定位效果。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第22頁!(二)聲卡的技能指標(biāo)

5.1聲道已廣泛運(yùn)用于各類傳統(tǒng)影院和家庭影院中,該聲音系統(tǒng)來源于4.1環(huán)繞,不同之處在于它增加了一個(gè)中置單元,這個(gè)中置單元負(fù)責(zé)傳送低于80Hz的聲音信號(hào),在欣賞影片時(shí)有利于加強(qiáng)人聲,把對(duì)話集中在整個(gè)聲場(chǎng)的中部,以增強(qiáng)整體效果。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第23頁!(二)聲卡的技能指標(biāo)

I/O設(shè)備接口一般的聲卡都設(shè)有線性輸入、線性輸出、音箱輸出、MIDI和游戲桿接口等。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第24頁!(二)聲卡的技能指標(biāo)聲卡軟件聲卡軟件很重要,一塊聲卡的技術(shù)指標(biāo)再高,但缺乏應(yīng)用軟件的支持,都很難發(fā)揮其特長。聲卡一般都帶有應(yīng)用程序,這些應(yīng)用程序包括錄音軟件、WAV、CD及MIDI播放軟件、混音器、WAV文件編輯器等。高檔的聲卡還提供特殊效果播放器、文字閱讀軟件及語音識(shí)別軟件等。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第25頁!(三)聲卡的插孔與連接多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第26頁!LINEINLINEOUTSPKOUTMIDI錄音機(jī)、CD唱機(jī)等線性輸入話筒揚(yáng)聲器線性輸出立體聲放大器MIDI設(shè)備MICIN多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第27頁!八、電子樂器數(shù)字接口——MIDI使用計(jì)算機(jī)利用聲音合成技術(shù)生成音樂的技術(shù)稱為電子音樂合成。MIDI是MusicalInstrumentDigitalInterface的首寫字母組合詞,可譯成“電子樂器數(shù)字接口”。用于在音樂合成器(musicsynthesizers)、樂器(musicalinstruments)和計(jì)算機(jī)之間交換音樂信息的一種標(biāo)準(zhǔn)協(xié)議。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第28頁!(二)MIDI工作過程MIDI電子樂器通過MIDI接口與計(jì)算機(jī)相連,MIDI靠這個(gè)接口來傳遞信息而進(jìn)行彼此間的通信。MIDI樂器MIDI接口合成器音序器MIDI文件揚(yáng)聲器PC機(jī)音頻卡MIDI指令模擬音頻信號(hào)多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第29頁!多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第30頁!合成器

MIDI文件的播放是通過MIDI合成器,合成器解釋MIDI文件中的指令符號(hào),生成所需要的聲音波形,經(jīng)放大后由揚(yáng)聲器輸出,聲音的效果比較豐富。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第31頁!(三)MIDI合成器合成器是利用數(shù)字信號(hào)處理器DSP或其他芯片來產(chǎn)生音樂或聲音的電子裝置。利用合成器產(chǎn)生MIDI樂音的主要方法是FM合成法和波表合成法。

FM合成法是20世紀(jì)80年代初由美國斯坦福大學(xué)的研究生發(fā)明的,稱為“數(shù)字式頻率調(diào)制合成法”,其基本原理是:用數(shù)字信號(hào)來表示不同樂音的波形,然后把它們組合起來,在通過數(shù)模轉(zhuǎn)換器生成樂音播放。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第32頁!波表合成法即樂音樣本合成法。與FM合成不同,波表合成是采用真實(shí)的聲音樣本進(jìn)行回放,聲音樣本記錄了各種真實(shí)樂器的采樣波形,并保存在ROM或RAM中。

硬波表:音色庫存放在聲卡的ROM或RAM中。

軟波表:音色庫以文件的形式存放在硬盤里,需要時(shí)再通過CPU進(jìn)行調(diào)用。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第33頁!(四)GM——MIDI樂器排序表以前各生產(chǎn)商在設(shè)計(jì)MIDI發(fā)聲工具時(shí)并沒有一個(gè)統(tǒng)一的樂器排序標(biāo)準(zhǔn)。基于這種情況,各生產(chǎn)商達(dá)成了共識(shí),共同編制了一份“標(biāo)準(zhǔn)MIDI樂器排序表”,他共收錄了16種不同的樂器,每類各選8件,全部總共有128件樂器。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第34頁!CakeWalk編輯不同的聲音通道多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第35頁!目前語音識(shí)別的主要應(yīng)用是通過TTS(文本——語音轉(zhuǎn)換器)和SR(語音識(shí)別器)實(shí)現(xiàn)的。(一)文本——語音轉(zhuǎn)換器TTS綜合就是通過分析單詞,由計(jì)算機(jī)確認(rèn)單詞的發(fā)音,然后這些音素就被輸入到一個(gè)復(fù)雜的模擬人聲音并發(fā)聲的算法中進(jìn)行處理。通過這種方式就能讀出任何單詞。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第36頁!(二)語音識(shí)別器

每個(gè)語音識(shí)別器都必須解決下列一些問題。連續(xù)性與不連續(xù)性詞匯量口音識(shí)別規(guī)則句式和自由句式識(shí)別速度的快慢與準(zhǔn)確率的高低多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第37頁!非特定人語音識(shí)別系統(tǒng)非特定人識(shí)別系統(tǒng)可識(shí)別任何用戶的語音,他不需要任何來自用戶的訓(xùn)練。孤立詞語音識(shí)別系統(tǒng)孤立詞語音識(shí)別系統(tǒng),一次只提供一個(gè)單一詞的識(shí)別,用戶必須把輸入的每個(gè)詞用暫停分開。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第38頁!二、音頻信號(hào)的形式聲音可用一條連續(xù)的曲線來表示。這條連續(xù)的曲線無論多么復(fù)雜,都可分解成一系列正炫波的線性疊加,稱為聲波。因聲波是在時(shí)間上和幅度上都連續(xù)變化的量,因此稱之為模擬量。模擬信號(hào)有兩個(gè)重要參數(shù):頻率和幅度。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第39頁!1GHz~10GHz超高聲波20kHz~1GHz超聲波20Hz~20kHz人類聽力所能接受0~20Hz亞聲波頻率范圍聲音分類 多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第40頁!CD-DAFM廣播AM廣播電話1020502003.4K7K15K22K多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第41頁!如果要用計(jì)算機(jī)對(duì)音頻信息進(jìn)行處理,則首先將模擬音頻信號(hào)(如語音、音樂等)轉(zhuǎn)換成數(shù)字信號(hào).對(duì)模擬音頻數(shù)字化的過程涉及到音頻的采樣、量化和編碼.模擬音頻信號(hào)采樣量化編碼數(shù)字音頻信號(hào)多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第42頁!

奈奎斯特理論:采樣頻率與聲音頻率之間有一定的關(guān)系,只有采樣頻率高于聲音信號(hào)最高頻率的兩倍時(shí),才能把數(shù)字信號(hào)表示的聲音還原成為原來的聲音.例如:CD唱片,要想獲得CD音質(zhì)的效果,則要保證采樣頻率為44.1KHz.多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第43頁!(c)采樣信號(hào)的量化(a)模擬音頻信號(hào)(b)音頻信號(hào)的采樣數(shù)字化音頻的過程如下圖所示。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第44頁!編碼為什么要對(duì)音頻編碼?A、獲取更好的數(shù)學(xué)描述方法?B、讓聲音不失真?C、不編碼就不是比特流?D、為了使比特流更加簡練?E、為了便于計(jì)算機(jī)存儲(chǔ)?F、為了便于在網(wǎng)絡(luò)上傳輸音頻?以上哪個(gè)是最根本的出發(fā)點(diǎn)?多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第45頁!五、音頻信號(hào)的壓縮編碼與標(biāo)準(zhǔn) 數(shù)字波形文件數(shù)據(jù)量大,數(shù)字音頻的編碼必須采用高效的數(shù)據(jù)壓縮編碼技術(shù)。對(duì)數(shù)字化后的聲音信號(hào)進(jìn)行壓縮編碼,使其成為具有一定字長的二進(jìn)制數(shù)字序列,并以這種形式在計(jì)算機(jī)內(nèi)傳輸和存儲(chǔ).在播放時(shí)經(jīng)解碼器恢復(fù)成原來的聲音信號(hào).輸入信號(hào)編碼器傳輸/存儲(chǔ)解碼器輸出信號(hào)多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第46頁!波形編碼的算法簡單,易于實(shí)現(xiàn),可獲得高質(zhì)量的語音。常見的三種波形編碼方法為:脈沖編碼調(diào)制(PCM),實(shí)際為直接對(duì)聲音信號(hào)作A/D轉(zhuǎn)換。只要采樣頻率足夠高,量化位數(shù)足夠多,就能使解碼后恢復(fù)的聲音信號(hào)有很高的質(zhì)量。差分脈沖編碼調(diào)制(DPCM),即只傳輸聲音預(yù)測(cè)值和樣本值的差值以此降低音頻數(shù)據(jù)的編碼率。自適應(yīng)差分編碼調(diào)制(ADPCM),是DPCM方法的進(jìn)一步改進(jìn),通過調(diào)整量化步長,對(duì)不同頻段設(shè)置不同的量化字長,使數(shù)據(jù)得到進(jìn)一步的壓縮。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第47頁!脈沖編碼調(diào)制(PCM)多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第48頁!均勻量化非均勻量化多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第49頁!多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第50頁!多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第51頁!音頻編碼標(biāo)準(zhǔn)和算法編碼類型算法名稱數(shù)據(jù)率標(biāo)準(zhǔn)應(yīng)用質(zhì)量波形編碼PCM均勻量化公共網(wǎng)ISDN配音4.0-4.5μ(A)μ(A)64kbit/sG.711APCM自適應(yīng)量化DPCM差值量化ADPCM自適應(yīng)差值量化32kbit/sG.721SB-ADPCM子帶一自適應(yīng)差值量化64kbit/sG.722參數(shù)編碼LPC線性預(yù)測(cè)編碼2.4kbit/s保密電話2.5-3.5混合編碼CELPC碼激勵(lì)LPC4.8kbit/s移動(dòng)通信3.7-4.0VSELP矢量和激勵(lì)LPC8kbit/s語音郵件RPE-CELP長時(shí)預(yù)測(cè)規(guī)則碼激勵(lì)13.2kbit/sISDNLD-CELP低延時(shí)碼激勵(lì)LPC16kbit/G.728MPEG多子帶感知編碼128kbit/sCD5.0多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第52頁!對(duì)于PCM采樣得到的波形文件,其聲音文件的大小與采樣頻率、量化位數(shù)和聲道數(shù)有關(guān).

文件大小=采樣頻率*(量化位數(shù)/8)*聲道數(shù)*錄音時(shí)間如:對(duì)于立體聲,如果采樣頻率為44.1Kz,分辨率為16bit,聲道數(shù)為2,語音時(shí)間為10秒,求錄音文件的大???多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第53頁!

mp3文件是用一種屬于按MPEG標(biāo)準(zhǔn)的聲音壓縮技術(shù)制作的數(shù)字音頻文件。①存儲(chǔ)空間小,同樣長度的音樂文件,用MP3

存儲(chǔ)相當(dāng)于WAV的1/10。③比較好的播放器:winamp、超級(jí)解霸、

realplayer等,一般都支持。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第54頁!AIF是音頻交換文件格式(AudioInterchangeFileFormat)的英文縮寫,是蘋果計(jì)算機(jī)公司開發(fā)的一種聲音文件格式。

AIFF格式文件多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第55頁!七、聲卡(一)功能錄制、編輯和回放數(shù)字聲音文件控制各聲源的音量并混合在一起對(duì)聲波文件進(jìn)行壓縮和解壓縮語音合成技術(shù)

MIDI接口(樂器數(shù)字接口)多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第56頁!(二)聲卡的技能指標(biāo)

MIDI聲頻MIDI是計(jì)算機(jī)產(chǎn)生聲音的另一種方法,它是一種電子音樂。計(jì)算機(jī)播放MIDI文件時(shí),有兩種方法合成聲音:FM合成和波表合成。我們?cè)诳紤]聲卡的技能指標(biāo)時(shí)要考慮采用的哪種合成方法。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第57頁!(二)聲卡的技能指標(biāo)隨著波表合成技術(shù)的出現(xiàn),由雙聲道立體聲向多聲道環(huán)繞聲的發(fā)展顯得格外迫切。

四聲道環(huán)繞規(guī)定了4個(gè)發(fā)音點(diǎn):前左、前右、后左、后右,聽眾則被包圍在這中間,同時(shí)還建議增加一個(gè)低音音箱,以加強(qiáng)對(duì)低頻信號(hào)的回放處理(這也是如今4.1聲道音箱系統(tǒng)廣泛流行的原因)。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第58頁!(二)聲卡的技能指標(biāo)多音頻流輸出多音頻流輸出是指聲卡可以在同一時(shí)間內(nèi)支持多個(gè)wav、mp3、midi類音頻文件的播放。目前大部分中高檔的PCI聲卡是普遍支持多音頻流輸出的,多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第59頁!(二)聲卡的技能指標(biāo)系統(tǒng)參數(shù)的可調(diào)性為避免I/O地址、DMA、IRQ對(duì)系統(tǒng)的沖突,聲卡參數(shù)必須是能過設(shè)置的。當(dāng)前是利用軟件進(jìn)行設(shè)置才最為方便,早期的聲卡有可能需要調(diào)整跳線。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第60頁!(二)聲卡的技能指標(biāo)總線結(jié)構(gòu)由于計(jì)算機(jī)技術(shù)突飛猛進(jìn)的發(fā)展,ISA總線已經(jīng)不能滿足音頻信號(hào)的高吞吐量的需要,于是產(chǎn)生了PCI聲卡。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第61頁!(四)聲卡的安裝(1).硬件安裝步驟1關(guān)閉計(jì)算機(jī)電源,拔下供電電源和所有 外接線插頭。步驟2打開機(jī)箱外殼,選擇一個(gè)空閑的16位擴(kuò) 展槽并將聲卡插入擴(kuò)展槽。步驟3連接來自CD-ROM驅(qū)動(dòng)器的音頻輸出線到 聲卡的CDIN針形輸入線上;步驟4蓋上機(jī)箱外殼,并將電源插頭插回。步驟5聲卡與其它外設(shè)的連接,按下頁圖進(jìn)行。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第62頁!(2).軟件安裝 對(duì)不同的聲卡,軟件的安裝方法不完全相同,需要按照說明書安裝。1).安裝驅(qū)動(dòng)程序 聲卡的驅(qū)動(dòng)程序是控制聲卡工作的必要程序,不同的聲卡驅(qū)動(dòng)程序是不同的。2).安裝應(yīng)用程序 安裝聲卡的應(yīng)用程序,例如混音器、錄音師和MIDI編輯軟件等。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第63頁!(一)有關(guān)的MIDI術(shù)語

MIDI合成器:能產(chǎn)生特定聲音的電子裝置,其數(shù)據(jù)傳輸符合MIDI通信約定。

MIDI信息或指令:樂譜的一種記錄格式,相當(dāng)于樂譜語言。

MIDI接口:MIDI硬件通信協(xié)議。

MIDI通道:提供了16個(gè)通道,每種通道對(duì)應(yīng)一種邏輯的合成器。

MIDI文件:是存放MIDI信息的標(biāo)準(zhǔn)文件格式。

音序器:用來記錄、編輯和播放MIDI文件的軟件。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第64頁!

MIDI鍵盤

MIDI鍵盤是用于MIDI樂曲演奏的,MIDI鍵盤本身并不發(fā)出聲音,當(dāng)作曲人員觸動(dòng)鍵盤上的按鍵時(shí),就發(fā)出按鍵信息,所產(chǎn)生的僅僅是MIDI音樂消息,從而由音序器錄制生成MIDI文件。多媒體音頻信息處理共74頁,您現(xiàn)在瀏覽的是第65頁!音序器(Sequencer) 用于記錄、編輯、播放MIDI的聲音文件,音序器有以硬件形式提供的,目前大多為軟件音序器。音序器可捕捉MIDI

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論