《多媒體音頻系統(tǒng)》_第1頁
《多媒體音頻系統(tǒng)》_第2頁
《多媒體音頻系統(tǒng)》_第3頁
《多媒體音頻系統(tǒng)》_第4頁
《多媒體音頻系統(tǒng)》_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多媒體音頻系統(tǒng)精選ppt聲音信息的處理聲音的輸出:波形聲音數(shù)模轉(zhuǎn)換頻譜合成樣本合成(語音合成)聲音的表示與存儲聲音的采集:波形聲音數(shù)字化樂器聲(MIDI)話音(語音識別)聲音的處理:壓縮和編碼精選ppt音頻處理技術(shù)音頻采集文語轉(zhuǎn)換聲音編碼/解碼語音識別音樂合成精選ppt聲音聲音:攜帶信息的極其重要的媒體,是多媒體技術(shù)研究中的一個(gè)重要內(nèi)容。2.種類:人的話音、樂器聲、動(dòng)物發(fā)出的聲音、機(jī)器產(chǎn)生的聲音以及自然界的雷聲、風(fēng)聲、雨聲和閃電聲等。頻率范圍:聲音信號是由許多頻率不同的信號組成,這類信號稱為復(fù)合信號,而對單一頻率的信號稱為分量信號。聲音信號的一個(gè)重要參數(shù)就是帶寬,它用來描述組成復(fù)合信號的頻率范圍。如高保真聲音的頻率范圍為10~20000Hz,而視頻信號的帶寬是6MHz?;緟?shù):聲音信號的兩個(gè)基本參數(shù)是頻率和幅度。人的聽覺器官能感知的聲音頻率大約在20~20000Hz之間,在這種頻率范圍里感知的聲音幅度大約在0~120dB之間。

多媒體音頻系統(tǒng)精選ppt聲音的分類聲音采集波形聲音語音80-3400Hz音樂聲音的聽覺特性音調(diào)、音強(qiáng)、音色為聲音的三要素。音強(qiáng)(響度)取決于聲音的幅度。音調(diào)取決于聲音的頻率。音色是由混入基音的泛音所決定的。聲音的方向感精選ppt聲音的基本特征 聲音是由空氣中分子的振動(dòng)而產(chǎn)生的。自然界的聲音是一個(gè)隨時(shí)間而變化的連續(xù)信號,可近似地看成是一種周期性的函數(shù)。通常用模擬的連續(xù)波形描述聲波的形狀,單一頻率的聲波可用一條正弦波表示,如下圖所示。振幅周期基線精選ppt 基線是測量模擬信號的基準(zhǔn)點(diǎn)。聲波的振幅表示聲音信號的強(qiáng)弱程度。聲波的頻率反映出聲音的音調(diào),聲音細(xì)尖表示頻率高,聲音粗低表示頻率低。 振幅和頻率不變的聲音信號,稱為單音。單音一般只能由專用電子設(shè)備產(chǎn)生。在日常生活中,我們聽到的自然界的聲音一般都屬于復(fù)音,其聲音信號由不同的振幅與頻率合成而得到。復(fù)音中的最低頻率稱為復(fù)音的基頻(基音),是決定聲調(diào)的基本要素,它通常是個(gè)常數(shù)。復(fù)音中還存在一些其它頻率,是復(fù)音中的次要成分,通常稱為諧音?;l和諧音合成復(fù)音,決定了特定的聲音音質(zhì)和音色。精選ppt聲音信號數(shù)字化采樣:奈奎斯特理論(Nyquisttheory):采樣頻率不應(yīng)低于聲音信號的最高頻率的兩倍,這樣就能把以數(shù)字表達(dá)的聲音還原成原來的聲音,叫做無損數(shù)字化。量化精度和信噪比:量化精度:采樣精度的一種表示方法,每個(gè)聲音樣本的位數(shù)(bitpersample,bps)應(yīng)該是多少。

信噪比:采樣精度的一種表示方法,叫做信號噪聲比,簡稱信噪比。

(signal-to-noise-ration,SNR),并用下式計(jì)算:

SNR=10lg[(Vsignal)/(Vnoise)]=20lg

(Vsignal/Vnoise)

其中,Vsignal表示信號電壓,Vnoise表示噪聲電壓;SNR的單位為分貝(dB)。

多媒體音頻系統(tǒng)22精選ppt聲音的采樣和量化01010100001100100001000010011010101111001101精選ppt影響數(shù)字音頻質(zhì)量的技術(shù)參數(shù) 對模擬音頻信號進(jìn)行采樣量化編碼后,得到數(shù)字音頻。數(shù)字音頻的質(zhì)量取決于采樣頻率、量化位數(shù)和聲道數(shù)三個(gè)因素。1).采樣頻率 采樣頻率是指一秒鐘時(shí)間內(nèi)采樣的次數(shù)。在計(jì)算機(jī)多媒體音頻處理中,采樣頻率通常采用三種:11.025KHz(語音效果)、22.05KHz(音樂效果)、44.1KHz(高保真效果)。常見的CD唱盤的采樣頻率即為44.1KHz。精選ppt2).量化位數(shù) 量化位數(shù)也稱“量化精度”,是描述每個(gè)采樣點(diǎn)樣值的二進(jìn)制位數(shù)。例如,8位量化位數(shù)表示每個(gè)采樣值可以用28即256個(gè)不同的量化值之一來表示,而16位量化位數(shù)表示每個(gè)采樣值可以用216即65536個(gè)不同的量化值之一來表示。常用的量化位數(shù)為8位、12位、16位。3).聲道數(shù) 聲音通道的個(gè)數(shù)稱為聲道數(shù),是指一次采樣所記錄產(chǎn)生的聲音波形個(gè)數(shù)。記錄聲音時(shí),如果每次生成一個(gè)聲波數(shù)據(jù),稱為單聲道;每次生成兩個(gè)聲波數(shù)據(jù),稱為雙聲道(立體聲)。隨著聲道數(shù)的增加,所占用的存儲容量也成倍增加。精選ppt數(shù)字音頻文件的存儲量 以字節(jié)為單位,模擬波形聲音被數(shù)字化后音頻文件的存儲量(假定未經(jīng)壓縮)為:存儲量=采樣頻率×量化位數(shù)/8×聲道數(shù)×?xí)r間

例如,用44.1KHz的采樣頻率進(jìn)行采樣,量化位數(shù)選用16位,則錄制1秒的立體聲節(jié)目,其波形文件所需的存儲量為: 44100×16/8×2×1=176400(字節(jié))精選ppt聲音質(zhì)量和數(shù)據(jù)率質(zhì)量采樣頻率/kHz樣本精度/b/s單道聲/立體聲數(shù)據(jù)率(未壓縮)/kb/s頻率范圍/Hz電話*AMFMCDDAT811.02522.05044道聲單道聲立體聲立體聲立體聲64.088.2705.61411.21536.0200~340050~700020~1500020~2000020~20000說明:*電話使用μ律編碼,動(dòng)態(tài)范圍為13位,而不是8位。多媒體音頻系統(tǒng)精選ppt聲音文件的基本格式1.WAV文件3.VOC文件2.MIDI4.MOD文件精選ppt聲音的存儲格式格式標(biāo)準(zhǔn):數(shù)據(jù)規(guī)范1.0(MultimediaProgrammingInterfaceandDataSpecification1.0)。該標(biāo)準(zhǔn)是由IBM和微軟公司于1991年8月聯(lián)合開發(fā)的資源交換文件格式(resourceinterchangefileformat,RIFF)。groupID=‘RIFF’RiffType=‘WAVE’

FormatatChunkckID=‘fmt’SoundDataChunkckID=‘data’左圖為WAVE文件結(jié)構(gòu)精選pptWAV文件 Windows所用的標(biāo)準(zhǔn)數(shù)字音頻稱為波形文件,文件的擴(kuò)展名是“.WAV”,它記錄了對實(shí)際聲音進(jìn)行采樣的數(shù)據(jù)。它可以重現(xiàn)各種聲音,但產(chǎn)生的文件很大。 采用的軟件壓縮方法主要有ACM和PCM等。人的講話聲使用8位量化級11.025KHz采樣率就能較好的還原。CD音質(zhì)需要16位量化級、44.1KHz的采樣率。精選pptMIDI MIDI文件的擴(kuò)展名為“.MID”,它與波形文件不同,記錄的不是聲音本身,而是將每個(gè)音符記錄為一個(gè)數(shù)字,因此比較節(jié)省空間,可以滿足長時(shí)間音樂的需要。 MIDI的主要限制是缺乏重現(xiàn)真實(shí)自然的能力。采用波表法進(jìn)行音樂合成的聲音卡可以使MIDI音樂的質(zhì)量大大提高。精選ppt VOC文件:VOC文件也是一種數(shù)字聲音文件,主要用于DOS程序。與波形文件相似,可以方便地互相轉(zhuǎn)換。 MOD文件:MOD文件是移植過來的MODULE音樂。它主要由一些業(yè)余音樂愛好者通過網(wǎng)絡(luò)和BBS支持。精選ppt常見的聲音文件擴(kuò)展名文件的擴(kuò)展名說明auSun和NeXT公司的聲音文件存儲格式(8位μ律編碼或者16位線性編碼)aif(AudioInterchange)Apple計(jì)算機(jī)上的聲音文件存儲格式cmf(CreativeMusicFormat)聲霸(SB)卡帶的MIDI文件存儲格式mctMIDI文件存儲格式mff(MIDIFileFormat)MIDI文件存儲格式1/2mid(MIDI)Windows的MIDI文件存儲格式mp2MPEGLayerⅠ,Ⅱmp3MPEGLayerⅢmod(Module)MIDI文件的存儲格式rm(RealMedia)RealNetworks公司的流放式聲音文件格式ra(RealAudio)RealNetworks公司的流放式聲音文件格式精選ppt續(xù):常見的聲音文件擴(kuò)展名rolAdlib聲音卡文件存儲格式snd(sound)Apple計(jì)算機(jī)上的聲音文件存儲格式seqMIDI文件存儲格式sngMIDI文件存儲格式voc(CreativeVoice)聲霸卡存儲的聲音文件存儲格式wav(Waveform)*Windows采用的波形聲音文件存儲格式wrkCakewalkPro軟件采用的MIDI文件存儲格式說明:*支持PCM,ADPCM,μ率和A率波形多媒體音頻系統(tǒng)精選ppt聲音處理軟件聲音處理軟件:即聲音工具,是用來錄放、編輯俄分析聲音文件的。常見的聲音工具有:

1、Window95/98本身帶的“SoundRecorder”

當(dāng)你在英文版的Windows95/98的界面上點(diǎn)擊:

StartProgramsAccessoriesMultimedia/Entertainment單擊SoundRecorder

2、買聲卡時(shí)帶的工具

3、網(wǎng)絡(luò)上下載的工具多媒體音頻系統(tǒng)精選ppt聲音質(zhì)量評價(jià)聲音質(zhì)量的方法:平均判分法(meanopinionscore,MOS),召集若干實(shí)驗(yàn)者,由他們對聲音質(zhì)量的好壞進(jìn)行評分,求出平均值作為對聲音質(zhì)量的評價(jià)。所得分?jǐn)?shù)為MOS。

聲音質(zhì)量的評分標(biāo)準(zhǔn)分?jǐn)?shù)質(zhì)量級別失真級別5優(yōu)無察覺4良(剛)察覺但不討厭3中(察覺)有點(diǎn)討厭2差討厭但不反感1劣極討厭(令人反感)多媒體音頻系統(tǒng)精選ppt音樂音樂起初是與巫術(shù)和宗教活動(dòng)聯(lián)系在一起的,舜作“韶”、禹作“大夏”、武王作“大武”,“樂”被孔夫子列為“六藝”之一。后來,音樂從宗教中漸漸脫離出來,成為一種獨(dú)立的藝術(shù)。以小提琴為例,當(dāng)它的A弦振動(dòng)時(shí),并不僅僅是整根弦在振動(dòng),這根弦的二分之一、三分之一、四分之一、五分之一……處都在振動(dòng)著。于是,整根弦的振動(dòng)產(chǎn)生了最主要的頻率,我們稱之為基音,而弦長的二分之一、三分之一、四分之一等處的振動(dòng)則產(chǎn)生了一些次要的頻率,我們稱之為泛音。

如果一個(gè)物體振動(dòng)所發(fā)出的泛音為基音的整數(shù)倍,這個(gè)音就會具有清晰可辨的音高,我們稱之為樂音,如鋼琴,小提琴等發(fā)出的都是樂音;如果泛音是基音的非整數(shù)倍,這個(gè)音就不具備清晰可辨的音高,我們稱之為噪音,如汽車發(fā)動(dòng)機(jī)、計(jì)算機(jī)風(fēng)扇等發(fā)出的都是噪音。

精選ppt音樂的四要素音高:由基音的頻率決定。即“哆”“唻”“咪”等音符。響度:由聲波的振幅決定。音色:由基音與泛音的比例、泛音的分布、泛音隨時(shí)間的衰減變化決定。不同發(fā)音源(樂器)的材質(zhì)、形狀不同,其泛音的排列組合也不同,也就構(gòu)成了這一物體特殊的音色。時(shí)值:樂音振動(dòng)的持續(xù)時(shí)間,即節(jié)奏。精選ppt電子音樂合成使用電子元器件(計(jì)算機(jī))生成音樂的技術(shù)稱為電子音樂合成。電子音樂合成器又稱為“魔音琴”。電子音樂合成方法分為兩大類:模擬合成法:減法合成加法合成數(shù)字合成法:

FM頻率調(diào)制合成音樂樣本合成精選ppt頻率調(diào)制(FM)合成法數(shù)字式頻率調(diào)制合成法,簡稱為FM合成法。FM電子合成器先由震蕩器產(chǎn)生一個(gè)載波作為基音,然后再產(chǎn)生若干個(gè)調(diào)制波帶著許多泛音加在載波之上,您可以對這個(gè)組合加以任意調(diào)整,然后加上典型的聲音包絡(luò)線(ADSR),再通過數(shù)控濾波器和數(shù)控放大器送往數(shù)字/模擬轉(zhuǎn)換器,從而形成最后的音響。由于一個(gè)物體不可能總是一成不變的振動(dòng),所以它的頻率和振幅都會隨著時(shí)間的改變而改變,并最終趨于靜止。我們把一聲音的發(fā)展過程分為四個(gè)階段,分別是觸發(fā)、衰減、保持和消失。這四個(gè)階段我們統(tǒng)稱為“包絡(luò)”。包絡(luò)的發(fā)生時(shí)間,也決定了一個(gè)樂音的時(shí)值。

精選ppt由以下五部分組成:數(shù)字載波器調(diào)制器聲音包絡(luò)發(fā)生器數(shù)字運(yùn)算器模數(shù)轉(zhuǎn)換器頻率調(diào)制(FM)合成法FM聲音合成器的工作原理從理論上講,F(xiàn)M合成方法可以產(chǎn)生任何樂音,但是,這種“物理課式”的合成方法合成出來的聲音不夠真實(shí)。精選ppt樂音樣本合成法樂音樣本合成法是把真實(shí)樂器發(fā)出的聲音以數(shù)字的形式記錄下來,播放時(shí)再加以調(diào)整、修飾和放大,生成各種音階的音符。樂音樣本通常放在ROM芯片上,播放時(shí)以查表的方式給出,所以這種合成器又叫做波表(wavetable)合成器。精選pptWavetable合成器的工作原理Wavetable合成器所需要的輸入控制參數(shù)比較少,可控的數(shù)字音效也不多,大多數(shù)采用這種合成方法的聲音設(shè)備都可以控制聲音包絡(luò)的ADSR參數(shù),產(chǎn)生的聲音質(zhì)量比FM合成方法產(chǎn)生的聲音質(zhì)量要高。樂音樣本合成法精選ppt

波表庫容量音調(diào)數(shù)(復(fù)音數(shù))音色數(shù)特殊效果Wavetable合成器的衡量標(biāo)準(zhǔn)精選ppt軟件波表與DLS軟件波表,故名思義就是用軟件來模擬硬件波表合成器,它的原理跟硬件波表完全一樣,只不過硬波表是把樂器的波形存放到ROM里,在需要的時(shí)候直接調(diào)用;而軟波表是把樂器的波形存到硬盤上的某一個(gè)文件里,在需要的時(shí)候通過CPU運(yùn)算調(diào)用。所以,軟波表會占用比較多的CPU資源。著名的軟波表有YAMAHA公司的S-YXG系列和ROLAND公司的VSC系列,還有韓國COWON公司的JET-MIDI。由于硬波表價(jià)格難以令大眾接受并且不易升級,于是就有了價(jià)格便宜的DLS(DownloadableSoundModules)波表合成技術(shù),這是個(gè)介于硬波表和軟波表之間的東西。雖然它能把波表存儲在硬盤上,使用時(shí)再調(diào)入內(nèi)存然后通過聲卡上的專用音效芯片來處理。精選ppt電子樂器數(shù)字接口(MIDI)電子樂器數(shù)字接口(musicalinstrumentdigitalinterface,MIDI)是用于在音樂合成器、電子樂器、音序器和計(jì)算機(jī)之間交換音樂信息的一種標(biāo)準(zhǔn)協(xié)議。從80年代初問世至今,MIDI經(jīng)歷了長時(shí)間的發(fā)展,現(xiàn)已成為電腦音樂的代名詞。精選pptMIDI系統(tǒng)定義:電子樂器數(shù)字接口(musicalinstrumentdigitalinterface,MIDI)是用于在音樂合成器(musicsynthesizers)、樂器(musicalinstrument)和計(jì)算機(jī)之間交換音樂信息的一種標(biāo)準(zhǔn)協(xié)議。計(jì)算機(jī)音樂:如何產(chǎn)生連續(xù)協(xié)調(diào)的音樂而不是單音 錄音/重放、音樂合成

產(chǎn)生MIDI音樂的方法:

一、頻率調(diào)制(frequencymodulation,F(xiàn)M)合成法;

二、樂音樣本合成法,也稱波形表(wavetable)合成法。多媒體音頻系統(tǒng)作曲軟件MIDI消息電子琴鍵盤MIDI消息MIDI文件MIDI文件管理MIDI編輯播放軟件聲音合成器立體聲功率精選ppt MIDI系統(tǒng)將電子樂器鍵盤上的彈奏信息記錄下來,包括鍵名、力度、時(shí)值長短等,是樂譜的一種數(shù)字式描述。當(dāng)需要播放時(shí),只需從相應(yīng)的MIDI文件中讀出MIDI消息,生成所需要的聲音波形,經(jīng)放大后由揚(yáng)聲器輸出。如下圖所示。合成器揚(yáng)聲器MIDI鍵盤MIDI接口音序器精選ppt MIDI設(shè)備就是處理MIDI信息所需的硬件設(shè)備,其基本組成包括:MIDI設(shè)備配置(1).MIDI端口(2).MIDI鍵盤(3).音序器(Sequencer)(4).合成器精選ppt(1).MIDI端口 一臺MID設(shè)備可以有一至三個(gè)MIDI端口,分別稱為MIDIIn、MIDIOut、MIDIThru。它們的作用是:

MIDIIn:接收來自其它MIDI設(shè)備的MIDI信息。

MIDIOut:發(fā)送本設(shè)備生成的MIDI信息到其它設(shè)備。

MIDIThru:將從MIDIIn端口傳來的信息轉(zhuǎn)發(fā)到相連的另一臺MIDI設(shè)備上。精選ppt(2).MIDI鍵盤 MIDI鍵盤是用于MIDI樂曲演奏的,MIDI鍵盤本身并不發(fā)出聲音,當(dāng)作曲人員觸動(dòng)鍵盤上的按鍵時(shí),就發(fā)出按鍵信息,所產(chǎn)生的僅僅是MIDI音樂消息,從而由音序器錄制生成MIDI文件。(3).音序器(Sequencer) 用于記錄、編輯、播放MIDI的聲音文件,音序器有以硬件形式提供的,目前大多為軟件音序器。音序器可捕捉MIDI消息,將其存入MIDI文件,MIDI文件擴(kuò)展名為.MID。音序器還可編輯MIDI文件。精選ppt(4).合成器 MIDI文件的播放是通過MIDI合成器,合成器解釋MIDI文件中的指令符號,生成所需要的聲音波形,經(jīng)放大后由揚(yáng)聲器輸出,聲音的效果比較豐富。MIDI合成方式 MIDI合成方式主要有調(diào)頻合成(FM)和波形表合成(WaveTable)兩種方式。精選pptMIDI與音樂合成樂音四要素:音高(頻率)、音色(樂器)、響度(強(qiáng)度)、時(shí)值(旋律)MIDI文件:

MIDI文件中包含音符、定時(shí)和多達(dá)16個(gè)通道的演奏定義、128個(gè)鍵位演奏音符信息:鍵號、通道號、音長、音量和力度精選pptMIDI系統(tǒng)(MIDI)協(xié)議國際MIDI協(xié)會(InternationalMIDIAssociation)的MIDI1.0規(guī)范:

MIDI數(shù)據(jù)流是單向異步的數(shù)據(jù)位流(bitstream),其速率為31.25kbps,每個(gè)字節(jié)為10位(1位開始位、8位數(shù)據(jù)位和1位停止位)。

MIDI樂器上的MIDI接口通常包含3種不同的MIDI連接器:IN(輸入)、OUT(輸出)和THRU(穿越)。單個(gè)物理MIDI通道(MIDIchannel)分成16個(gè)邏輯通道,每個(gè)通道可指定一種樂器。MIDI消息:MIDI設(shè)備使用的一系列MIDI音符,可被認(rèn)為是告訴音樂合成器如何播放一小段音樂的指令。MIDI數(shù)據(jù)是一套音樂符號的定義,而不是世紀(jì)的音樂聲音,所以MIDI文件的內(nèi)容被稱為MIDI消息。MIDI消息組成:一個(gè)MIDI消息由1個(gè)8位的狀態(tài)字節(jié)并通常跟著2個(gè)數(shù)據(jù)字節(jié)組成。在狀態(tài)字節(jié)中,最高有效位設(shè)置成“1”,低4位用來表示這個(gè)MIDI消息時(shí)屬于哪個(gè)通道(4位可表示16個(gè)可能的通道),其余3位的設(shè)置表示這個(gè)MIDI消息是什么類型的消息。精選pptMIDI的通道概念單個(gè)物理MIDI通道分為16個(gè)邏輯通道,每個(gè)邏輯通道可指定一種樂器。MIDI鍵盤可設(shè)置在這16個(gè)通道中的任何一個(gè),MIDI合成器可以被設(shè)置在指定的通道上接受。

精選pptMIDI文件的特點(diǎn)(1).由于MIDI文件只是一系列指令的集合,因 此它比數(shù)字波形文件小得多,大大節(jié)省了 存儲空間。(2).使用MIDI文件,其聲音卡上必需含有硬件 音序器或者配置有軟件音序器。(3).MIDI聲音適于重現(xiàn)打擊樂或一些電子樂器 的聲音,利用MIDI聲音方式可用計(jì)算機(jī)來 進(jìn)行作曲。(4).對MIDI的編輯很靈活,在音序器的幫助下, 用戶可自由地改變音調(diào)、音色以及樂曲速 度等,以達(dá)到需要的效果。精選ppt電子樂器數(shù)字接口(MIDI)MIDI實(shí)質(zhì)上是由MIDI控制器(或MIDI文件)產(chǎn)生的指示電子音樂合成器要做什么、怎么做(如演奏某個(gè)音符、加大音量、生成音響效果)的一套標(biāo)準(zhǔn)指令。MIDI不是聲音信號,在MIDI電纜上傳送的不是聲音,而是動(dòng)作指令。精選ppt電子樂器數(shù)字接口(MIDI)由于MIDI只是記錄音樂信息的數(shù)字代碼,所以生成的文件比較小,便于傳播,也便于編輯修改。MIDI音樂常作為背景音樂。與Mp3、Wav等音頻格式不同的是MIDI的播放質(zhì)量很大程度上取決于硬件或軟件的音源環(huán)境,也就是說同樣的MIDI文件在不同的電腦上可能有非常明顯的效果差別,究其原因是因?yàn)樗鼈冋{(diào)用的波表音色庫不一樣。精選ppt

各個(gè)MIDI設(shè)備通過專用的串行電纜(MIDI線)連接,并以31.25kbps(每字節(jié)10位)的速度傳送著數(shù)字音樂信息。MIDIThruOutInMIDI的物理接口標(biāo)準(zhǔn)精選pptMIDI設(shè)備的連接不妨把MIDI理解成一種局域網(wǎng),網(wǎng)絡(luò)的各個(gè)部分通過專用的串行電纜(MIDI線)連接,

并以31.25kbps的速度傳送著數(shù)字音樂信息。

精選pptMIDI軟件產(chǎn)品中文名稱:音效合成工具

英文名稱:PROPELLERHEADS.REASON.V3.0.ISO-RiSE精選ppt話音的形成原理

肺中的空氣受到擠壓形成氣流,氣流通過聲門(聲帶)沿著聲道(由咽、喉、口腔等組成)釋放出去,就形成了話音。氣流、聲門可以等效為一個(gè)激勵(lì)源,聲道可以等效為一個(gè)時(shí)變?yōu)V波器(共振峰)。話音信號具有很強(qiáng)的相關(guān)性(長期相關(guān)、短期相關(guān))。精選ppt話音的分類濁音(voicedsounds):聲道打開,聲帶在先打開后關(guān)閉,在此期間聲帶要發(fā)生振動(dòng)。濁音的激勵(lì)源被等效為準(zhǔn)周期的脈沖信號。清音(unvoicedsounds):聲門打開,聲帶不振動(dòng),聲音靠空氣在聲道里高速收縮產(chǎn)生。清音的激勵(lì)源被等效為一種白噪聲信號。爆破音(plosivesounds):聲道關(guān)閉之后產(chǎn)生壓縮空氣然后突然打開聲道所發(fā)出的聲音?;旌弦艟xppt話音技術(shù)話音識別(SpeechRecognition)文本話音轉(zhuǎn)換(TextToSpeech)話音壓縮編碼(SpeechCoding)精選ppt語音識別和文語轉(zhuǎn)換話音本身就是一種編碼,如何分辨相同編碼的相近語音,即該詞的特征語音話音識別要求:識別字詞句,語義和語境IBMViaVoice文語轉(zhuǎn)換和語音合成電腦播音軟件精選ppt數(shù)字音頻信號的編碼 一般情況下,聲音的制作是使用麥克風(fēng)或錄音機(jī)來產(chǎn)生,再由聲卡上的WAVE合成器的(模/數(shù)轉(zhuǎn)換器)對模擬音頻采樣后,量化編碼為一定字長的二進(jìn)制序列,并在計(jì)算機(jī)內(nèi)傳輸和存儲。在數(shù)字音頻回放時(shí),再由數(shù)字到模擬的轉(zhuǎn)化器(數(shù)/模轉(zhuǎn)換器)解碼可將二進(jìn)制編碼恢復(fù)成原始的聲音信號,通過音響設(shè)備輸出。如下圖所示。模擬音頻信號輸入采樣/量化編碼傳輸/存儲解碼播放精選ppt 數(shù)字波形文件數(shù)據(jù)量大,數(shù)字音頻的編碼必須采用高效的數(shù)據(jù)壓縮編碼技術(shù)。音頻信號能夠被壓縮編碼的依據(jù)有兩個(gè),一是聲音信號存在著數(shù)據(jù)冗余;二是利用人的聽覺特性來降低編碼率,人的聽覺具有一個(gè)強(qiáng)音能抑制一個(gè)同時(shí)存在的弱音現(xiàn)象,這樣就可以抑制與信號同時(shí)存在的量化噪聲;另外人耳對低頻端比較敏感,而對高頻端不太敏感,由此引出了“子帶編碼技術(shù)”。 音頻信號的壓縮編碼方式可分為波形編碼音源(參數(shù))編碼和混合編碼三種。精選ppt語音信號的冗余度幅度非均勻分布樣本之間的相關(guān)性周期之間的相關(guān)性基音之間的相關(guān)性靜止系數(shù)(話音間隙)長期相關(guān)性(longtermcorrelation)精選ppt話音編譯碼器的分類波形編譯碼器(waveformcoder):不利用生成話音的信號的任何知識,將話音視為一種普通的聲音,直接對波形信號進(jìn)行采樣和量化。例如PCM、DPCM、ADPCM等。音源編譯碼器(Sourcecoder):也叫參數(shù)編譯碼器、聲碼器(vocoder)。它從話音波形信號中提取生成話音的參數(shù),使用這些參數(shù)通過話音生成模型重構(gòu)出話音?;旌暇幾g碼器(Hybridcoder):綜合使用上述兩種技術(shù)。使用的激勵(lì)信號波形盡可能接近于原始話音信號的波形。例如CELP。精選ppt1).波形編碼 波形編碼的算法簡單,易于實(shí)現(xiàn),可獲得高質(zhì)量的語音。常見的三種波形編碼方法為:脈沖編碼調(diào)制(PCM),實(shí)際為直接對聲音信號作A/D轉(zhuǎn)換。只要采樣頻率足夠高,量化位數(shù)足夠多,就能使解碼后恢復(fù)的聲音信號有很高的質(zhì)量。差分脈沖編碼調(diào)制(DPCM),即只傳輸聲音預(yù)測值和樣本值的差值以此降低音頻數(shù)據(jù)的編碼率。自適應(yīng)差分編碼調(diào)制(ADPCM),是DPCM方法的進(jìn)一步改進(jìn),通過調(diào)整量化步長,對不同頻段設(shè)置不同的量化字長,使數(shù)據(jù)得到進(jìn)一步的壓縮。精選ppt2).參數(shù)編碼 參數(shù)編碼方法通過建立起聲音信號的產(chǎn)生模型,將聲音信號用模型參數(shù)來表示,再對參數(shù)進(jìn)行編碼,在聲音播放時(shí)根據(jù)參數(shù)重建聲音信號。參數(shù)編碼法算法復(fù)雜,計(jì)算量大,壓縮率高,但還原聲音的質(zhì)量不高。3).混合編碼 混合編碼是把波形編碼的高質(zhì)量和參數(shù)編碼的低數(shù)據(jù)率結(jié)合在一起,取得了較好效果。精選ppt衡量話音編碼器的參數(shù)數(shù)據(jù)輸出速率延遲時(shí)間話音質(zhì)量價(jià)格精選ppt三種話音編譯碼器的對比精選ppt話音處理話音處理要求:通信帶寬和通信質(zhì)量需要對話音編碼和壓縮提供標(biāo)準(zhǔn):因特網(wǎng)上話音數(shù)據(jù)流——單聲道8位8KHZ=64kb/sG.711使用μ律和A律——3.4KHZ=64kb/sG.721使用ADPCM——3.4KHZ=32kb/sG.722使用ADPCM——7KHZ=64kb/s等精選ppt脈沖編碼調(diào)制(PCM)PulseCodeModulation精選pptPCM的量化方式均勻量化與非均勻量化精選ppt非均勻量化對小信號采用小的量化間隔,對大信號采用大的量化間隔,這樣可以用較少的位數(shù)編碼。對大信號來說,雖然絕對量化誤差較大,但是因?yàn)椋海?)大信號出現(xiàn)的機(jī)會不多,(2)信噪比(相對誤差)與小信號是一致的,所以對總的話音質(zhì)量影響不大。非均勻量化也是一種壓縮。精選pptμ律壓擴(kuò)與A律壓擴(kuò)m律(m-Law)壓擴(kuò)(G.711)主要用在北美和日本等地區(qū)的數(shù)字電話通信中。x為x為輸入信號,規(guī)格化為-1<=x<=1m為確定壓縮量的參數(shù),它反映最大量化間隔和最小量化間隔之比,取100<=

m

<=500。精選pptμ律壓擴(kuò)與A律壓擴(kuò)0<=|x|<=1/A1/A<=|x|<=1A律(A-Law)壓擴(kuò)(G.711)主要用在歐洲和中國大陸等地區(qū)的數(shù)字電話通信中對于采樣頻率為8kHz,樣本精度為13位、14位或者16位的輸入信號,使用m律壓擴(kuò)編碼或者使用A律壓擴(kuò)編碼,經(jīng)過PCM編碼器之后每個(gè)樣本的精度為8位,輸出的數(shù)據(jù)率為64kb/s。這個(gè)數(shù)據(jù)就是CCITT推薦的G.711標(biāo)準(zhǔn)。精選pptPCM與時(shí)分多路復(fù)用(TDM)精選ppt差分脈沖編碼調(diào)制(DPCM)關(guān)鍵在于預(yù)測器與量化器的設(shè)計(jì)量化器預(yù)測器xkeke’kx’kx’’k-自適應(yīng)預(yù)測逆量化器自適應(yīng)量化階e’’k產(chǎn)生誤差精選ppt差分脈沖編碼調(diào)制(DPCM)逆量化器預(yù)測器e’ke’’kx’kx’’k譯碼過程精選ppt預(yù)測方程式線性預(yù)測:如果ai是常數(shù),則為時(shí)不變線性預(yù)測,否則為自適應(yīng)線性預(yù)測最簡單的預(yù)測方程:精選ppt最簡單的DPCMx0121123344x’’0012112334選ppt增量調(diào)制(△M)增量調(diào)制(delta

modulation,DM)是一種預(yù)測編碼技術(shù),是對實(shí)際的采樣信號與預(yù)測的采樣信號之差的極性進(jìn)行編碼,將極性變成“0”和“1”這兩種可能的取值之一。如果實(shí)際的采樣信號與預(yù)測的采樣信號之差的極性為“正”,則用“1”表示;相反則用“0”表示。DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。精選ppt自適應(yīng)增量調(diào)制(ADM)CVSD(連續(xù)可變斜率增量調(diào)制):如果編碼器的輸出連續(xù)出現(xiàn)三個(gè)相同的值,量化階就加上一個(gè)大的增量;反之,就加一個(gè)小的增量。精選ppt自適應(yīng)脈沖編碼調(diào)制(APCM)APCM是一種根據(jù)輸入信號幅度大小自動(dòng)改變量化階大小的一種波形編碼技術(shù)。精選ppt自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性精選ppt自適應(yīng)差分脈沖編碼調(diào)制ADPCM是利用樣本與樣本之間的高度相關(guān)性和量化階自適應(yīng)來壓縮數(shù)據(jù)的一種波形編碼技術(shù),CCITT為此制定了G.721推薦標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)叫做32kb/sADPCM。在此基礎(chǔ)上還制定了G.721的擴(kuò)充推薦標(biāo)準(zhǔn)G.723,使用該標(biāo)準(zhǔn)的編碼器的數(shù)據(jù)率可降低到40kb/s和24kb/s。G.721的輸入信號是G.711PCM代碼,它的數(shù)據(jù)率為64kb/s。而G.721ADPCM的輸出是用4位表示的差分信號,它的采樣率仍然是8kHz,它的數(shù)據(jù)率為32kb/s,這樣就獲得了2∶1的數(shù)據(jù)壓縮。精選ppt子帶-自適應(yīng)差分脈沖編碼調(diào)制

精選pptG.722編碼標(biāo)準(zhǔn)G.722是CCITT推薦的音頻信號編碼譯碼標(biāo)準(zhǔn)。G.722標(biāo)準(zhǔn)的數(shù)據(jù)率為64kb/s,采樣頻率由8kHz提高到16kHz,是G.711PCM采樣率的2倍,因而要被編碼的信號頻率由原來的3.4kHz擴(kuò)展到7kHz。這就使音頻信號的質(zhì)量有很大改善,由數(shù)字電話的話音質(zhì)量提高到調(diào)幅(AM)無線電廣播的質(zhì)量。精選ppt編碼類型算法名稱數(shù)據(jù)率標(biāo)準(zhǔn)應(yīng)用質(zhì)量波形編碼PCM均勻量化公共網(wǎng)ISDN配音4.0-4.5μ(A)μ(A)64kbit/sG.711APCM自適應(yīng)量化DPCM差值量化ADPCM自適應(yīng)差值量化32kbit/sG.721SB-ADPCM子帶一自適應(yīng)差值量化64kbit/s

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論