版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
音頻的基礎(chǔ)知識21世紀(jì)緊缺型人才培訓(xùn)規(guī)劃教材
—多媒體應(yīng)用技術(shù)專業(yè)
韓雪濤編著中國水利水電出版社信息產(chǎn)業(yè)部職業(yè)鑒定指導(dǎo)中心推薦教材課程基本內(nèi)容第2頁,共77頁,2024年2月25日,星期天Premierepro與AECoolEditpro第3頁,共77頁,2024年2月25日,星期天推薦學(xué)習(xí)網(wǎng)址1第4頁,共77頁,2024年2月25日,星期天第1章音頻的基礎(chǔ)知識二、音頻信號的數(shù)字處理四、數(shù)字音頻的壓縮標(biāo)準(zhǔn)一、聲音信號的基本特點三、音頻文件的常見格式五、音頻接口及聲卡第5頁,共77頁,2024年2月25日,星期天一、聲音信號的基本概念、特點聲音是通過一定介質(zhì)傳播的一種連續(xù)波--正弦波振幅:音量的大小周期:重復(fù)出現(xiàn)的時間間隔(s)頻率:指信號每秒鐘變化的次數(shù)(Hz)t振幅周期A聲波重要指標(biāo)第1章音頻的基礎(chǔ)知識圖1-1聲波傳播狀態(tài)的信號波形1第6頁,共77頁,2024年2月25日,星期天聲音按頻率分類:
次聲波可聽聲波超聲波20Hz20kHzf(Hz)人類說話聲音頻率范圍:300Hz-3kHz聲音質(zhì)量的頻率范圍:1020502003.4k7k15k20kCD-DAFM廣播AM廣播電話f(Hz)頻帶0~120dB
telephoneAmplitudemodulation調(diào)幅Frequencymodulation調(diào)頻CD光盤、DAT數(shù)字錄音帶第1章音頻的基礎(chǔ)知識2第7頁,共77頁,2024年2月25日,星期天聲音質(zhì)量和數(shù)據(jù)率:
這4個等級中,使用的采樣頻率、樣本精度、通道數(shù)和數(shù)據(jù)率如下表示:質(zhì)量采樣頻率(kHz)樣本精度(bit/s)單道聲/立體聲數(shù)據(jù)率(kB/s)(未壓縮)頻率范圍電話*88單道聲8200~3400HzAM11.0258單道聲11.020~15000HzFM22.05016立體聲88.250~7000HzCD44.116立體聲176.420~20000HzDAT4816立體聲192.020~20000Hz第1章音頻的基礎(chǔ)知識3第8頁,共77頁,2024年2月25日,星期天聲音信號的基本特點t振幅周期A聲波聲音:一般由空氣的振動傳到人的耳朵形成,即是靠空氣的疏密波動傳播的。第1章音頻的基礎(chǔ)知識4第9頁,共77頁,2024年2月25日,星期天聲音信號的基本特點聲音的種類(9種):純音(PureSound):輕敲音叉所發(fā)出的一種單一頻率的正弦波聲音復(fù)合音(ComplexSound):包含兩個以上純音的聲音
基本音(FundamentalTone):周期性的復(fù)合音與周期相同的聲音或非周期性的復(fù)合音中最低頻率的聲音
諧波(Harmonic):又稱倍音,具有周期性的復(fù)合音中,除基本音以外,與基本音成整數(shù)倍的聲音
單音(Singletone):一個基本音與其整數(shù)倍的諧波組成的聲音第1章音頻的基礎(chǔ)知識5第10頁,共77頁,2024年2月25日,星期天第1章音頻的基礎(chǔ)知識諧和音(Consnance):在單音的混合聲中,其倍頻音相等的聲音噪音(Noise):無規(guī)律(非周期性)的聲音白噪音(WhiteNoise):在寬廣的頻率范圍內(nèi)能量分布均勻的聲音黑噪音(BackGroudNoise):在對信號的處理時,以某些聲音為對象時,該聲音以外的聲音聲音信號的基本特點第11頁,共77頁,2024年2月25日,星期天聲音信號的基本特點聲音的三要素:聲調(diào)(Pitch音調(diào))響度(Loundness)音色(Timbre)表示聲音性質(zhì)的基本因素第1章音頻的基礎(chǔ)知識聲強是以正常聽覺的人所能聽到的最小聲壓(0.00002Pa)為基準(zhǔn),此時的聲強作為0dB,0dBSPL=這是1kHz的最小可聽值聲強與聲壓的關(guān)系--P36等感度曲線第12頁,共77頁,2024年2月25日,星期天二、音頻信號的數(shù)字處理
波形聲音實際上已經(jīng)包含了所有的聲音形式,它可以把任何聲音都進行采樣量化,并恰當(dāng)?shù)鼗謴?fù)出來。1).聲音信號的類型模擬信號(自然界、物理)數(shù)字信號(計算機)第1章音頻的基礎(chǔ)知識圖1-6模擬信號的數(shù)字處理及還代替過程示意7第13頁,共77頁,2024年2月25日,星期天二、音頻信號的數(shù)字處理
模擬音頻信號的特點:第1章音頻的基礎(chǔ)知識模擬信號具有直觀、形象的特點是在時間軸上連續(xù)的信號,可以用它的某些參數(shù)去模擬其數(shù)值的大小模擬信號精度低,表示的范圍小,且容易受到干擾圖1-7受至干擾的模擬信號示意圖8第14頁,共77頁,2024年2月25日,星期天數(shù)字信號的特點數(shù)字信號具有較強的抗干擾能力,數(shù)字信號的波形簡單,物理上容易實現(xiàn),便于存儲、延遲和變換。代表信息的物理量以一系列數(shù)據(jù)組的形式來表示,它在時間軸上是不連續(xù)的數(shù)字信號只有兩種狀態(tài),即0或1,這樣單個信號本身的可靠性大為改善,而多個信號的組合數(shù)又幾乎不受限制
取樣—量化—編碼數(shù)字信號受干擾易修復(fù),并且經(jīng)過處理、變換或傳輸后干擾雜波不會積累二、音頻信號的數(shù)字處理
第1章音頻的基礎(chǔ)知識圖1-8模擬信號與數(shù)字信號的關(guān)系圖1-9受到干擾的數(shù)字脈沖信號處理9第15頁,共77頁,2024年2月25日,星期天2).聲音數(shù)字化過程采樣量化編碼模擬信號數(shù)字信號模擬信號數(shù)字信號A/DADCD/ADAC音頻信號的A/D和D/A變換:A/D變換模擬信號變換成數(shù)字信號D/A變換數(shù)字信號轉(zhuǎn)換為模擬信號第1章音頻的基礎(chǔ)知識圖1-10模擬信號的數(shù)字處理過程10聲音是如何數(shù)字化的呢?第16頁,共77頁,2024年2月25日,星期天數(shù)字音頻可分為波形聲音、語音和音樂。
連續(xù)的模擬聲音信號聲音信號的采樣離散的音頻信號順序3).聲音數(shù)字化過程圖示第1章音頻的基礎(chǔ)知識11第17頁,共77頁,2024年2月25日,星期天第1章音頻的基礎(chǔ)知識(1)取樣:以恒定的頻率在時間軸上對模擬信號離散的進行取樣
音頻信號的數(shù)字處理
直觀、形象模擬信號精度低,表示的范圍小,且容易受到干擾(2)量化和編碼量化:把取樣保持處理后的信號變?yōu)橛邢迋€在幅度上離散的二進制信號的過程
編碼:對量化的每個值點的數(shù)值進行二進制編碼的過程12第18頁,共77頁,2024年2月25日,星期天第1章音頻的基礎(chǔ)知識(3)量化噪音:在量化時忽略的信號實際值與量化值之間存在偏差,是由量化編碼的位數(shù)決定,它也決定了量化的精度音頻信號的數(shù)字處理
13量化級差越小,就越能對信號進行精確的還原、轉(zhuǎn)換16位量化(2的16次方=65536級寬度)一般可以達(dá)到消除量化噪聲的要求第19頁,共77頁,2024年2月25日,星期天第1章音頻的基礎(chǔ)知識(4)動態(tài)范圍:指噪聲電平(最小信號電平)和最大不失真信號電平之間的范圍音頻信號在動態(tài)范圍內(nèi)可得到不失真的正常傳輸
動態(tài)范圍越寬越好音頻信號的數(shù)字處理
14動態(tài)范圍=6×N+1.8(dB)N-量化位數(shù)16位量化時動態(tài)范圍可達(dá)98dB第20頁,共77頁,2024年2月25日,星期天4).聲音數(shù)字化三要素采樣頻率量化位數(shù)聲道數(shù)每秒鐘抽取聲波幅度樣本的次數(shù)每個采樣點用多少二進制位表示數(shù)據(jù)范圍使用聲音通道的個數(shù)采樣頻率越高聲音質(zhì)量越好數(shù)據(jù)量也越大量化位數(shù)越多音質(zhì)越好數(shù)據(jù)量也越大立體聲比單聲道的表現(xiàn)力豐富,但數(shù)據(jù)量翻倍11.025kHz22.05kHz44.1kHz8位=256個值16位=65536個值單聲道立體聲聲音的數(shù)字化
第1章音頻的基礎(chǔ)知識15第21頁,共77頁,2024年2月25日,星期天數(shù)據(jù)量=采樣頻率×量化位數(shù)×聲道數(shù)/8(字節(jié)/秒)5).聲音數(shù)字化計算公式采樣頻率(kHz)量化位數(shù)(bit)數(shù)據(jù)量(KB/s)單聲道立體聲11.025810.7721.531621.5343.0722.05821.5343.071643.0786.1344.1843.0786.131686.13172.27第1章音頻的基礎(chǔ)知識16理解壓縮第22頁,共77頁,2024年2月25日,星期天(1)WAV文件WAV是Microsoft/IBM共同開發(fā)的PC波形文件。因未經(jīng)壓縮,文件數(shù)據(jù)量很大。特點:聲音層次豐富,還原音質(zhì)好。(2)MP3文件MP3(MPEGAudiolayer3)是一種按MPEG標(biāo)準(zhǔn)的音頻壓縮技術(shù)制作的音頻文件。特點:高壓縮比(11:1),優(yōu)美音質(zhì)。音質(zhì)還原較好。三、音頻文件的常見格式
第1章音頻的基礎(chǔ)知識17第23頁,共77頁,2024年2月25日,星期天WMA(WindowsMediaAudio)是WindowsMedia格式中的一個子集(音頻格式)。特點:壓縮到MP3一半,相同的音質(zhì),與其兼容。(3)WMA文件(4)MIDI文件MIDI(MusicalInstrumentDigitalInterface樂器數(shù)字接口的國際標(biāo)準(zhǔn))是由一組聲音或樂器符號的集合。(非數(shù)字化聲音非波形文件)特點:數(shù)據(jù)量很小,缺乏重現(xiàn)自然音。(依賴硬件)第1章音頻的基礎(chǔ)知識18第24頁,共77頁,2024年2月25日,星期天音頻素材的格式轉(zhuǎn)換及工具《豪杰超級音樂工作室》軟件支持的文件格式有:CDFile:*.CDAMIDIFile:*.MID;*.RMIMovieFile:*.MPG;*.DAT;*.MPA;*.MOVAudioFile:*.Mp3;*.Mp2;*.Mp1;*.MPA;*.ABSAC3File:*.AC3DVDFile:*.VOBWAVEFile:*.WAVTextFile:*.TXT2.2聽覺媒體技術(shù)第25頁,共77頁,2024年2月25日,星期天音頻素材的格式轉(zhuǎn)換及工具由于采集設(shè)備的不同,所選用音頻編輯軟件的不同以及最終用途的差異,數(shù)字音頻文件的存儲格式有很多種,對于它們之間的相互轉(zhuǎn)換有專門的工具應(yīng)用軟件。常用的轉(zhuǎn)換工具:《豪杰超級音樂工作室》Hero3000.Hero.Retail--豪杰超級解霸3000英雄完全版CoolEditPro2.0AudioMaestro常用的音頻文件格式:2.2聽覺媒體技術(shù)第26頁,共77頁,2024年2月25日,星期天第1章音頻的基礎(chǔ)知識*.RA、*.RM、*.RAM這些文件格式是Real文件的主要格式,可以隨網(wǎng)絡(luò)帶寬的不同而改變聲音的質(zhì)量,在保證大多數(shù)人聽到流暢聲音的前提下,另帶寬較充裕的聽眾獲得較好的音質(zhì)
*.AIF、*.AIFF、*.AU
常見的幾種音頻文件格式,其中AIF、AIFF是Apple公司開發(fā),被Macintosh平臺及其應(yīng)用程序所支持;AU是由SunMicrosystems公司與Apple公司為UNIX系統(tǒng)共同開發(fā)的一種經(jīng)過壓縮的數(shù)字聲音文件格式,這種也是Internet上最古老的聲音文件格式之一
19第27頁,共77頁,2024年2月25日,星期天第1章音頻的基礎(chǔ)知識*.ASF、*.ASX、*.WMA、*.WAX
ASF和WMA是Microsoft公司針對Real公司開發(fā)的新一代網(wǎng)上流式數(shù)字音頻壓縮技術(shù)。這種壓縮技術(shù)同時兼顧了保真度和網(wǎng)絡(luò)傳輸?shù)男枨螅哂幸欢ǖ南冗M性*.VQF它是YAMAHA公司的專用音頻格式。采用減少數(shù)據(jù)流量但保持音質(zhì)的方法來達(dá)到更高的壓縮比,該文件格式我們并不常見20第28頁,共77頁,2024年2月25日,星期天第1章音頻的基礎(chǔ)知識CD-DA
CD-DA是數(shù)字音頻光盤CompactDiscDitigalAudio的英文縮寫,這種音樂格式在我們的日常生活中十分常見,它的數(shù)字化音頻效果完全能夠再現(xiàn)原始的聲效且文件小MD
MD是MiniDisc的簡稱,是SONY公司推出的一種便攜式音樂格式。具有很強的編輯功能。用戶可以快速完成選曲、編曲等基本編輯操作,極具個性化。目前流行的MD汽車音響、MD隨身聽等都是采用這種音樂格式21第29頁,共77頁,2024年2月25日,星期天第1章音頻的基礎(chǔ)知識音頻文件格式簡介*.MID、*.RMI、*.CMF、*.RCP這些文件格式屬于MIDI文件范疇,這類文件主要應(yīng)用于計算機音樂創(chuàng)作,用戶可以通過專業(yè)的音頻創(chuàng)作軟件實現(xiàn)譜曲,或直接通過聲卡MIDI接口將外部音序器演奏的樂曲輸入到計算機中完成音樂創(chuàng)作MOD
MOD的結(jié)構(gòu)類似于MIDI,是一種類似于波表的音樂格式,常用于游戲的背景音樂
22第30頁,共77頁,2024年2月25日,星期天由于采集設(shè)備的不同,所選用音頻編輯軟件的不同以及最終用途的差異,數(shù)字音頻文件的存儲格式有很多,了解這些文件格式的特點和基本原理對進行音頻的編輯是非常必要的。1.*.WAV2.*.MP39.*.MID、*.RMI、*.CMF、*.RCP第1章音頻的基礎(chǔ)知識233.*.RA、*.RM、*.RAM5.*.ASF、*.ASX、*.WMA、*.WAX4.*.AIF、*.AIFF、*.AU6.*.VQF7.CD-DA8.MD10.MOD第31頁,共77頁,2024年2月25日,星期天由于采集設(shè)備的不同,所選用音頻編輯軟件的不同以及最終用途的差異,數(shù)字音頻文件的存儲格式有很多,了解這些文件格式的特點和基本原理對進行音頻的編輯是非常必要的。1.*.WAV2.*.MP3第1章音頻的基礎(chǔ)知識24CD盤里的文件格式直接轉(zhuǎn)換為下面的兩種常用文件格式:比較文件大?。?cda豪杰工具.cda:1k.wav:49M.mp3:4.45M第32頁,共77頁,2024年2月25日,星期天對聲音的抽象化(即符號化)表示包括兩種類型:一種是音樂一種是語音MIDI消息就是樂譜的數(shù)字描述。
與波形聲音相比,MIDI數(shù)據(jù)不是聲音而是指令,所以它的數(shù)據(jù)量要比波形聲音少得多。半小時的立體聲16位高品質(zhì)音樂,如果用.WAV波形文件無壓縮錄制,約需300MB的存儲空間。而同樣時間的MIDI數(shù)據(jù)大約只需200KB,兩者相差1500倍之多。
由于音樂完全可用符號來表示,所以音樂可看作是符號化的聲音媒體。MIDI與音樂合成第1章音頻的基礎(chǔ)知識25第33頁,共77頁,2024年2月25日,星期天MIDI技術(shù)利用數(shù)字信號處理技術(shù)合成的音效有:①模仿鋼琴、小提琴、吉他等音色②超越時空的太空音樂。MIDI是一種利用合成器產(chǎn)生的音樂技術(shù)。MusicalInstrumentDigitalInterface譯為樂器數(shù)字接口。MIDI是各種電子音樂設(shè)備之間以及與計算機交換信息的國際標(biāo)準(zhǔn)。(Yamaha,Roland)第1章音頻的基礎(chǔ)知識26第34頁,共77頁,2024年2月25日,星期天MIDI標(biāo)準(zhǔn)MIDI硬件規(guī)范:硬件接口標(biāo)準(zhǔn)和信號傳輸機制(I/O通道類型、連接電纜和插座形式)。MIDI軟件規(guī)范:音樂信息數(shù)字化編碼方式(音符、音符長短、音調(diào)和音量等)。原聲鋼琴8分音符的C3音:000060音色Piano編號音符C3編號8分音符編號當(dāng)一組MIDI信息通過音樂合成器演奏時,合成器將解釋這些符號并產(chǎn)生音樂。第1章音頻的基礎(chǔ)知識27第35頁,共77頁,2024年2月25日,星期天MIDI合成方式調(diào)頻合成法FM
原理:利用傅立葉級數(shù)進行分解。
特點:①系統(tǒng)開銷小,聲音較清脆;②聲音音色少,音質(zhì)差。波形表合成法WT
原理:預(yù)先存放實際樂器的聲音樣本。
特點:①音樂真實感強,音色自然。②硬波形表,軟波形表。第1章音頻的基礎(chǔ)知識28第36頁,共77頁,2024年2月25日,星期天MIDI的工作過程音序器是MIDI音樂創(chuàng)作的核心控制部件。第1章音頻的基礎(chǔ)知識29第37頁,共77頁,2024年2月25日,星期天簡單的MIDI系統(tǒng)它由一個MIDI鍵盤控制器和一個MIDI聲音模塊組成。許多MIDI鍵盤樂器在其內(nèi)部既包含鍵盤控制器,又包含MIDI聲音模塊功能。在這些單元中,鍵盤控制器和聲音模塊之間已經(jīng)有內(nèi)部鏈接,這個鏈接可以通過該設(shè)備中的控制功能(localcontrol)對鏈接打開(ON)或者關(guān)閉(OFF)。第1章音頻的基礎(chǔ)知識30第38頁,共77頁,2024年2月25日,星期天單個物理MIDI通道(MIDIchannel)分成16個邏輯通道,每個邏輯通道可指定一種樂器。在MIDI信息(MIDImessages)中,用4個二進制位來表示這16個邏輯通道。音樂鍵盤可設(shè)置在這16個通道之中的任何一個,而MIDI聲源或者聲音模塊可被設(shè)置在指定的MIDI通道上接收。第1章音頻的基礎(chǔ)知識31第39頁,共77頁,2024年2月25日,星期天復(fù)雜的MIDI系統(tǒng)在一個MIDI設(shè)備上的MIDIIN連接器接收到的信息可通過MIDITHRU連接器輸出到另一個MIDI設(shè)備,并以菊花鏈的方式連接多個MIDI設(shè)備。這些模塊也可以做在一起構(gòu)成一個叫做多音色(multitimbral)的聲音模塊,它同樣可以起到同時接收和播放多種聲音的作用。第1章音頻的基礎(chǔ)知識32第40頁,共77頁,2024年2月25日,星期天音樂制作系統(tǒng)需3種基本設(shè)備1.音源:聲卡(模擬樂器發(fā)聲的設(shè)備)
2.音序器:硬件音序器、軟件音序器,即編曲機
3.輸入設(shè)備:電子琴(MIDIIn,MIDIOut)MIDI鍵盤Cakewalk中的虛擬鍵盤MIDI連接線第1章音頻的基礎(chǔ)知識33第41頁,共77頁,2024年2月25日,星期天音樂制作技術(shù)提取原音軟件:ExactAudioCopy(EAC)
MP3數(shù)字CD抓軌把CD音軌轉(zhuǎn)換成WAV格式(無失真)。音頻處理軟件:CoolEdit2000
原音伴唱消除:Effect/Amplitude/
ChannelMixer→VocalCutVCD(卡拉OK):左聲道、右聲道
人聲伴音第1章音頻的基礎(chǔ)知識34第42頁,共77頁,2024年2月25日,星期天四、數(shù)字音頻的壓縮標(biāo)準(zhǔn)
音頻信號是多媒體系統(tǒng)的重要組成部分。電話質(zhì)量的語音調(diào)幅廣播質(zhì)量的音頻信號調(diào)頻廣播質(zhì)量的音頻信號高保真立體聲信號頻率范圍:300HZ~3.4kHz頻率范圍:50HZ~7KHz頻率范圍:10HZ~20KHz頻率范圍:20HZ~15KHz第1章音頻的基礎(chǔ)知識針對不同的音頻信號,已制定了相應(yīng)的壓縮標(biāo)準(zhǔn)。35第43頁,共77頁,2024年2月25日,星期天針對不同的音頻信號,已制定了相應(yīng)的壓縮標(biāo)準(zhǔn)。
在多媒體音頻處理中,一般需要對數(shù)字化后的音頻信號進行壓縮編碼,使其成為具有一定字長的二進制數(shù)字序列,并以這種形式在計算機內(nèi)傳輸和存儲,最后由解碼器將二進制編碼恢復(fù)成原來的音頻信號播放。第1章音頻的基礎(chǔ)知識36第44頁,共77頁,2024年2月25日,星期天音頻壓縮處理流程所謂壓縮編碼技術(shù),就是指用某種方法使數(shù)字化信息的編碼率降低的技術(shù)。音頻信號能進行壓縮編碼的基本依據(jù)有兩個:聲音信號中存在很大的冗余度,通過識別和去除這些冗余度,便能達(dá)到壓縮編碼率的目的。人的聽覺具有一個強音能抑制一個同時存在的弱音的現(xiàn)象,這樣就可以抑制與信號同時存在的量化噪聲。第1章音頻的基礎(chǔ)知識37第45頁,共77頁,2024年2月25日,星期天無損壓縮法包括不引入任何數(shù)據(jù)失真的各種熵編碼。有損壓縮法分為波形編碼、模型(參數(shù))編碼和同時利用這兩種技術(shù)的混合編碼方法。
第1章音頻的基礎(chǔ)知識音頻壓縮編碼的基本方法38第46頁,共77頁,2024年2月25日,星期天熵編碼這是以信息論變長編碼定理為理論基礎(chǔ)的編碼方法,如霍夫曼編碼、算術(shù)編碼和行程編碼等。波形編碼
編碼是利用采樣和量化過程來表示音頻信號的波形,使編碼后的音頻信號與原始信號的波形盡可能匹配。根據(jù)人耳的聽覺特性進行量化。特點:是適應(yīng)性強,音頻質(zhì)量好,在較高碼率的條件下可以獲得高質(zhì)量的音頻信號。方法:全頻帶編碼(PCM、DPCM、ADPCM)、子帶編碼(ATC、心理學(xué)模型)和矢量量化編碼等。第1章音頻的基礎(chǔ)知識39第47頁,共77頁,2024年2月25日,星期天參數(shù)編碼目的是重建音頻,保持原始音頻的特性。參數(shù)編碼的壓縮率很大,但計算量大,保真度不高,適合于語音信號的編碼。參數(shù)編碼是將音頻信號以某種模型來表示,利用特征提取的方法抽取必要的模型參數(shù)和激勵信號的信息,并對這些信息編碼,最后在輸出端合成原始信號。有線性預(yù)測(LPC)聲碼器、通道聲碼器、共振峰聲碼器等。第1章音頻的基礎(chǔ)知識40第48頁,共77頁,2024年2月25日,星期天混合編碼混合編碼是在參數(shù)編碼方法的基礎(chǔ)上,引用波形編碼準(zhǔn)則優(yōu)化激勵源信號的一種方案??梢栽谳^低的碼率上得到較高的音質(zhì)。多脈沖線性預(yù)測編碼(MP_LPC)碼本激勵線性預(yù)測編碼(CELP)短延時碼本激勵線性預(yù)測編碼(LD-CELP)長延時線性預(yù)測規(guī)則碼激勵(RPE-LTP)等。方法:第1章音頻的基礎(chǔ)知識41第49頁,共77頁,2024年2月25日,星期天音頻壓縮技術(shù)標(biāo)準(zhǔn)
1.電話質(zhì)量的音頻壓縮標(biāo)準(zhǔn)語音壓縮編碼的標(biāo)準(zhǔn)。
電話質(zhì)量語音信號的頻率范圍是200~3400Hz,采用標(biāo)準(zhǔn)的脈沖編碼調(diào)制(PCM),當(dāng)采樣頻率為8kHz,量化位數(shù)為8位時,對應(yīng)的數(shù)據(jù)速率為64Kb/s。標(biāo)準(zhǔn)說明G.711采用PCM編碼,采樣頻率為8kHz,量化位數(shù)為8位,因此速率為64Kb/sG.721將64Kb/s的比特流轉(zhuǎn)換成32Kb/s,基于ADPCMG.723一種以24Kb/s運行的基于ADPCM的有損壓縮標(biāo)準(zhǔn)G.728采用LD-CELP壓縮技術(shù),比特率為16Kb/s,帶寬限于3.4kHz第1章音頻的基礎(chǔ)知識42第50頁,共77頁,2024年2月25日,星期天隨著數(shù)字移動通信的發(fā)展,人們對于低速語音編碼有了更迫切的要求。為了適應(yīng)保密通信的要求,美國國家安全局NSA分別于1982年和1989年制定了基于LPC,速率為2.4Kb/s和基于CELP,速率為4.8Kb/s的編碼方案。1989年美國公布的數(shù)字移動通信標(biāo)準(zhǔn)CTIA,采用矢量和激勵線性預(yù)測技術(shù)(VSELP),速率為8Kb/s。1983年歐洲數(shù)字移動特別組(GSM)制定了采用長時線預(yù)測規(guī)則碼激勵(RPE-LTP)壓縮技術(shù)的GSM編碼標(biāo)準(zhǔn),作為移動電話的壓縮標(biāo)準(zhǔn)。第1章音頻的基礎(chǔ)知識43第51頁,共77頁,2024年2月25日,星期天2.調(diào)幅廣播質(zhì)量的音頻壓縮標(biāo)準(zhǔn)1988年ITU制定了G.722標(biāo)準(zhǔn),它可把信號速率壓縮成64Kb/s。調(diào)幅廣播質(zhì)量音頻信號的頻率范圍是50~7000Hz,當(dāng)使用16kHz的采樣頻率和14位的量化位數(shù)時,信號速率為224Kb/s。G.722標(biāo)準(zhǔn)采用基于子帶的ADPCM技術(shù),將現(xiàn)有的帶寬分成兩個獨立的子帶信道,使輸入信號進入濾波器組分成高子帶信號和低子帶信號,然后分別進行ADPCM編碼,最后進入混合器形成輸出碼流。適合于需要存儲大量高質(zhì)量音頻信號的多媒體系統(tǒng)使用。
第1章音頻的基礎(chǔ)知識44第52頁,共77頁,2024年2月25日,星期天3.高保真立體聲音頻壓縮標(biāo)準(zhǔn)
世界上第一個高保真立體聲音頻壓縮標(biāo)準(zhǔn)為“MPEG音頻”壓縮算法。
高保真立體聲音頻信號的頻率范圍是50~20kHz,在44.1kHz采樣頻率下用16位量化,信號速率為每聲道705Kb/s。MPEG音頻標(biāo)準(zhǔn)提供了3個獨立的壓縮層次:第一層的編碼器最為簡單,編碼器的輸出數(shù)據(jù)率為384Kb/s,主要用于小型數(shù)字合式磁帶(DigitalCompactCassette,DCC)。壓縮層第二層的編碼器的復(fù)雜程度屬于中等,編碼器的輸出數(shù)據(jù)率為192~256Kb/s,其應(yīng)用包括數(shù)字廣播音頻、數(shù)字音樂、CD-I和VCD等第三層的編碼器最為復(fù)雜,編碼器的輸出數(shù)據(jù)率為64Kb/s,主要應(yīng)用于ISDN上的聲音傳輸。第1章音頻的基礎(chǔ)知識45第53頁,共77頁,2024年2月25日,星期天編碼器的原理編碼器處理數(shù)字音頻信號,并生成存儲所需要的數(shù)據(jù)流。例如:音頻掩蔽閥值估計的編碼、量化和縮放,只要編碼器輸出的數(shù)據(jù)能符合標(biāo)準(zhǔn)即可。時域頻域兩個聲音心理學(xué)模型都通過計算信號的掩蔽比來為編碼服務(wù)。編碼的結(jié)果將封裝成幀,如果需要的話,再加上其他信息,例如校正信息等。第1章音頻的基礎(chǔ)知識46第54頁,共77頁,2024年2月25日,星期天編碼的過程
輸入的音頻采樣值讀人編碼器,映像器首先對音頻數(shù)據(jù)流進行濾波,然后建立輸入音頻數(shù)據(jù)流的子帶采樣表示。
第1層和第2層的解碼過程:MPEG音頻的解碼首先要作的事情是使解碼器與位流同步,通過搜索同步字,便可獲得同步。識別和處理編碼數(shù)據(jù)的公共數(shù)據(jù)之后,開始對各層進行編碼。首先讀取位分配信息以及第一個子帶的縮放因子,進行位分配解碼??s放因子選擇信息解碼,對子帶樣點進行逆量化,通過合成于帶濾波器后,輸出PCM采樣值。第3層的解碼最復(fù)雜:主要包括找同步、附加信息、主數(shù)據(jù)開始、縮放因子、霍夫曼編碼、逆量化器、逆量化和全縮政公式、重排序、立體聲處理、合成濾波器組等。
第1章音頻的基礎(chǔ)知識47第55頁,共77頁,2024年2月25日,星期天音頻壓縮工具MP3、WMA、RA格式都是比較流行的音頻壓縮文件格式,可以把需要壓縮的各種音頻文件(wav、mid、mpg、dat、ra、rm等)添加到左側(cè)的列表框中。豪杰公司出品的MP3壓縮工具,即豪杰超級解霸3000中的一個實用工具。
MP3格式轉(zhuǎn)換器第1章音頻的基礎(chǔ)知識48第56頁,共77頁,2024年2月25日,星期天五、音頻接口及聲卡多媒體技術(shù)的特點是計算機交互式綜合處理聲文圖信息。聲音是攜帶信息的重要媒體。音頻卡的原理及其應(yīng)用、語音合成和音樂合成以及語音識別技術(shù)。音頻卡的工作原理
處理音頻信號的PC插卡是音頻卡(AudioCard),又稱聲音卡,聲音卡處理的音頻媒體有數(shù)字化聲音(Wave)、合成音樂(MIDI)、CD音頻。49第1章音頻的基礎(chǔ)知識第57頁,共77頁,2024年2月25日,星期天1.音頻卡的功能和分類聲音卡的主要功能:是音頻的錄制與播放、編輯與合成、MIDI接口、文-語轉(zhuǎn)換、CD-ROM接口及游戲接口等。2.音頻卡的體系結(jié)構(gòu)音頻卡由下列部件組成:MIDI輸入/輸出電路,MIDI合成器芯片,用來把CD音頻輸入與線輸入相混合電路,帶有脈沖編碼調(diào)制電路的模數(shù)轉(zhuǎn)換器,(1)用于把模擬信號轉(zhuǎn)換為數(shù)字信號以生成波形文件;(2)用來壓縮和解壓音頻文件的壓縮芯片;(3)用來合成語音輸出的語音合成器;(4)用來識別語音輸入的語音識別電路,以及輸出立體聲的音頻輸出或線輸出的輸出電路等。
50第1章音頻的基礎(chǔ)知識第58頁,共77頁,2024年2月25日,星期天聲卡的工作原理核心器件聲卡外部接口51第1章音頻的基礎(chǔ)知識第59頁,共77頁,2024年2月25日,星期天數(shù)字化聲音處理聲音卡用數(shù)字信號處理器DSP芯片管理所有聲音輸入輸出和MIDI操作,整個數(shù)字音頻信息獲取技術(shù)的工作原理、流程與主要組成部分:52第1章音頻的基礎(chǔ)知識第60頁,共77頁,2024年2月25日,星期天混音器音頻卡上的混音器(Mixer)芯片可以對以下音頻源進行混合:數(shù)字化聲音(DAC)。調(diào)頻FM合成音樂(FM)、CD-Audio音頻(CD-ROM)、線路輸入(AUX)、話筒輸入(MIC)、PC揚聲輸出(SPK)。多聲源混音:
53第1章音頻的基礎(chǔ)知識第61頁,共77頁,2024年2月25日,星期天合成器
標(biāo)準(zhǔn)的多媒體PC機平臺通過內(nèi)部合成器(Synthesize)或通過外接到計算機MIDI端口的外部合成器播放MIDI文件。MIDI合成器的類型目前有兩種:①頻率調(diào)制FM合成(中級僅要求掌握該種合成器原理);②波形表(WaveTable)合成。
通過改變調(diào)制單元的頻率和振幅,就可以改變FM合成器產(chǎn)生的聲音音質(zhì)。54第1章音頻的基礎(chǔ)知識第62頁,共77頁,2024年2月25日,星期天音樂合成和MIDI接口規(guī)范音樂合成與MIDI
MIDI(MusicalInstrumentDigitalInterface)是指樂器數(shù)字接口,是數(shù)字音樂的國際標(biāo)準(zhǔn)。任何電子樂器,只要有處理MIDI消息的微處理器,并有合適的硬件接口,都可以成為一個MIDI設(shè)備。MIDI消息,實際上就是樂譜的數(shù)字描述。當(dāng)一組MIDI消息通過音樂合成器芯片演奏時,合成器就會解釋這些符號并產(chǎn)生音樂。
55第1章音頻的基礎(chǔ)知識第63頁,共77頁,2024年2月25日,星期天音樂合成和MIDI接口規(guī)范電子琴的MIDI接口。音量控制器的使用?56第1章音頻的基礎(chǔ)知識第64頁,共77頁,2024年2月25日,星期天音樂合成和MIDI接口規(guī)范MIDI規(guī)范允許MIDI裝置以預(yù)先說明的方式通信。為了提供單電纜連接和通信端口標(biāo)準(zhǔn),關(guān)鍵之一是物理連接的標(biāo)準(zhǔn)化。MIDI標(biāo)準(zhǔn)中規(guī)定MPC包括一個內(nèi)部合成器和標(biāo)準(zhǔn)MIDI端口。MIDI裝置應(yīng)有一個或多個下列端口:MIDIIn,MIDIOut和MIDIThru。每種端口有特定的用處,如發(fā)送、接收或在MIDI裝置間轉(zhuǎn)發(fā)MIDI消息。這種設(shè)計允許你同時控制所連接的多個MIDI裝置。各端口的功能簡述如下:①MIDIIn(輸入口):接收從其他MIDI裝置傳來的消息。②MIDIOut(輸出口):發(fā)送某裝置生成的原始MIDI消息。向其他設(shè)備發(fā)送MIDI消息。③MIDIThru(轉(zhuǎn)發(fā)口):傳送從輸人口接收的消息到其他MIDI裝置。57第1章音頻的基礎(chǔ)知識第65頁,共77頁,2024年2月25日,星期天音樂合成和MIDI接口規(guī)范音箱音箱是一種電聲轉(zhuǎn)換的發(fā)音設(shè)備,它由箱體、揚聲器、電源和信號放大器等組成。分類:2.0→雙聲道立體聲
2.1/4.1/5.1/7.15.1→五聲道+超重低音聲道58第1章音頻的基礎(chǔ)知識第66頁,共77頁,2024年2月25日,星期天聲卡與音箱杜比環(huán)繞立體聲技術(shù)59第1章音頻的基礎(chǔ)知識第67頁,共77頁,2024年2月25日,星期天語音合成一般來講,實現(xiàn)計算機語音輸出有兩種方法:一是錄音/重放,二是文一語轉(zhuǎn)換。第二種方法是基于聲音合成技術(shù)的一種聲音產(chǎn)生技術(shù)。它可用于語音合成和音樂合成。語音識別
語音識別是將人發(fā)出的聲音、字或短語轉(zhuǎn)換成文字、符號,或給出響應(yīng),如執(zhí)行控制、作出回答。語音識別將可能取代鍵盤和鼠標(biāo)成為計算機的主要輸入手段,使用戶界面產(chǎn)生一次質(zhì)的飛躍。
60第1章音頻的基礎(chǔ)知識第68頁,共77頁,2024年2月25日,星期天2.5語音識別技術(shù)1952:Bell實驗室研制可識別10個英文數(shù)字的語音識別器-Audry系統(tǒng)。60-80:動態(tài)規(guī)劃(DP)、線性預(yù)測(LP)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新崗位培訓(xùn)制度及流程
- 英語培訓(xùn)內(nèi)部管理制度
- 體育教育培訓(xùn)管理制度
- 幼兒園教師培訓(xùn)實施制度
- 酒店保安培訓(xùn)管理制度
- 執(zhí)行從業(yè)人員培訓(xùn)制度
- 高級培訓(xùn)場所管理制度
- 賓館員工定期開會學(xué)習(xí)培訓(xùn)制度
- 引進航空公司培訓(xùn)制度
- 4s店新進員工培訓(xùn)制度
- 面板堆石壩面板滑模結(jié)構(gòu)設(shè)計
- 初中語文新課程標(biāo)準(zhǔn)與解讀課件
- 無人機裝調(diào)檢修工培訓(xùn)計劃及大綱
- 中建通風(fēng)與空調(diào)施工方案
- 高考語言運用題型之長短句變換 學(xué)案(含答案)
- 春よ、來い(春天來了)高木綾子演奏長笛曲譜鋼琴伴奏
- ARJ21機型理論知識考試題庫(匯總版)
- 2023年婁底市建設(shè)系統(tǒng)事業(yè)單位招聘考試筆試模擬試題及答案解析
- GB/T 4623-2014環(huán)形混凝土電桿
- GB/T 32065.4-2015海洋儀器環(huán)境試驗方法第4部分:高溫試驗
- GB/T 16823.3-2010緊固件扭矩-夾緊力試驗
評論
0/150
提交評論