音頻信號(hào)的處理_第1頁
音頻信號(hào)的處理_第2頁
音頻信號(hào)的處理_第3頁
音頻信號(hào)的處理_第4頁
音頻信號(hào)的處理_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

音頻信號(hào)的處理.ppt 免費(fèi)下載

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、多媒體計(jì)算機(jī)中產(chǎn)生聲音的方式: 外部聲音源錄制和重放(wave波形音頻) midi音樂(midi音頻) cd-audio (cd音頻),3.2 音頻信號(hào)的處理,3.2 音頻信號(hào)的處理,本節(jié)重點(diǎn): 波形聲音與midi聲音的特征 如何使用windows中的工具錄制和編輯波形聲音 聲音壓縮的基本原理 各種聲音文件格式 聲音合成與識(shí)別技術(shù),3.2.1 波形音頻的數(shù)字化原理,波形音頻的特征 波形音頻是獲得聲音最直接、最簡單的方式。 以麥克風(fēng)、立體聲錄音機(jī)或cd激光唱盤作為聲音信號(hào)的輸入源,聲卡以一定的采樣頻率和量化級(jí)別對輸入的聲音進(jìn)行數(shù)字化采樣,將其從模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào)(a/d轉(zhuǎn)換)后存盤 重放時(shí),

2、聲卡將數(shù)字信號(hào)還原成模擬信號(hào)(d/a轉(zhuǎn)換) ,經(jīng)混音器混合后由揚(yáng)聲器輸出,模擬音頻和數(shù)字音頻 (1)模擬音頻:聲音是由物體的震動(dòng)產(chǎn)生的。物體的震動(dòng)引起空氣的相應(yīng)震動(dòng),并向四周傳播,當(dāng)傳到人耳時(shí)又引起耳膜的震動(dòng),通過聽覺神經(jīng)傳到大腦,即可使人感到聲音。這種聲音的震動(dòng)經(jīng)過話筒的轉(zhuǎn)換,可以形成聲音波形的電信號(hào),這就是模擬音頻信號(hào)。 (2)數(shù)字音頻:數(shù)字音頻是由許多 0 和 1 組成的二進(jìn)制數(shù),可以以聲音文件(wav或midi格式)的形式存儲(chǔ)在磁盤中。例如:使用音頻卡(即聲卡)的a/d轉(zhuǎn)換器(模擬到數(shù)字轉(zhuǎn)換器),將模擬音頻信號(hào)進(jìn)行采樣和量化處理,即可獲得相應(yīng)的數(shù)字音頻信號(hào)。,3.2.1 波形音頻的數(shù)字

3、化原理,采樣和量化 模擬音頻信號(hào)在時(shí)間上是連續(xù)的,而數(shù)字音頻是一個(gè)數(shù)據(jù)序列,在時(shí)間上只能是斷續(xù)的。當(dāng)把模擬信號(hào)變成數(shù)字信號(hào)時(shí),需要每隔一個(gè)固定的時(shí)間間隔(虛線表示)對波形曲線的振幅進(jìn)行一次取值,這被稱為采樣。 曲線在振幅方向是連續(xù)的,即便振幅在某一個(gè)范圍內(nèi),仍然有無限個(gè)可能的取值,而用數(shù)字表示振幅時(shí),只能把無限多個(gè)振幅用有限個(gè)數(shù)字表示,這被稱為量化。,3.2.1 波形音頻的數(shù)字化原理,數(shù)字音頻的要素 數(shù)字音頻的質(zhì)量與它的三個(gè)要素有關(guān)。 (1)采樣頻率: 采樣就是在將模擬音頻轉(zhuǎn)換為數(shù)字音頻時(shí),在時(shí)間軸上每隔一個(gè)固定的時(shí)間間隔對聲音波形曲線的振幅進(jìn)行一次取值。 采樣頻率就是每秒鐘抽取聲音波形振幅值

4、的次數(shù),單位為hz。顯然,采樣頻率越高,轉(zhuǎn)換后的數(shù)字音頻的音質(zhì)和保真度越好,但生成的聲音文件的字節(jié)數(shù)越大。目前常采用的標(biāo)準(zhǔn)采樣頻率有11.025khz、22.05 khz和44.1khz。,3.2.1 波形音頻的數(shù)字化原理,(2)量化位數(shù): 量化位數(shù)就是在將模擬音頻轉(zhuǎn)換為數(shù)字音頻時(shí),采樣獲得的數(shù)值所使用的二進(jìn)制位數(shù)。 例如:量化位數(shù)為16時(shí),采樣的數(shù)值可以使用216=65536個(gè)不同的二進(jìn)制數(shù)之一來表示。量化位數(shù)越高,轉(zhuǎn)換后的數(shù)字音頻的音質(zhì)越好,聲音的動(dòng)態(tài)范圍越大,但生成的聲音文件的字節(jié)數(shù)越大。所謂聲音的動(dòng)態(tài)范圍就是重放后聲音的最高值與最低值的差值。目前常采用的量化位數(shù)有8位、16位和32位等

5、。,3.2.1 波形音頻的數(shù)字化原理,(3)聲道數(shù): 聲道數(shù)就是指所使用的聲音通道的個(gè)數(shù)。聲道數(shù)可以是 1 或 2 。當(dāng)聲道數(shù)為 1 時(shí),表示是單聲道,即聲音有一路波形;當(dāng)聲道數(shù)為 2 時(shí),表示是雙聲道,即聲音有兩路波形。雙聲道比單聲道的聲音更豐滿優(yōu)美,有立體感,但生成的聲音文件的字節(jié)數(shù)要大。,3.2.1 波形音頻的數(shù)字化原理,三個(gè)要素不但影響了數(shù)字音頻的質(zhì)量,而且決定了生成的數(shù)字音頻文件的數(shù)據(jù)量。計(jì)算生成的數(shù)字音頻文件數(shù)據(jù)量大小的公式為: 數(shù)據(jù)量(字節(jié)/秒)=采樣頻率量化位數(shù)聲道數(shù)/8 其中,采樣頻率的單位為hz,量化位數(shù)的單位為位。除以8是一個(gè)字節(jié)為8位。 例如:用44.1khz的采樣頻率

6、對模擬音頻信號(hào)進(jìn)行采樣,采樣點(diǎn)的量化位數(shù)為32,錄制了4秒鐘的雙聲道聲音,獲得的wav格式的聲音文件的字節(jié)數(shù)為(441003224)/8=1411200。,3.2.1 波形音頻的數(shù)字化原理,音頻卡 (1)音頻卡的功能和分類 音頻卡(聲卡)是計(jì)算機(jī)錄制聲音、處理聲音和輸出聲音的專用功能卡。它的主要功能如下。 錄制聲音 外部聲源發(fā)出的聲音可以通過話筒或線路送到聲音卡中。聲音卡可以將它們進(jìn)行采樣、a/d轉(zhuǎn)換、壓縮處理,得到壓縮的數(shù)字音頻信號(hào),再通過計(jì)算機(jī)將數(shù)字音頻信號(hào)以文件的形式存儲(chǔ)到磁盤中。 播放聲音文件 播放聲音文件時(shí),調(diào)出聲音文件,將它進(jìn)行解壓縮,再經(jīng)過d/a轉(zhuǎn)換器(數(shù)字到模擬的轉(zhuǎn)換器)進(jìn)行轉(zhuǎn)

7、換,獲得模擬聲音信號(hào)。然后,經(jīng)過放大由音頻卡輸出,再經(jīng)過外接的功率放大器放大,推動(dòng)喇叭發(fā)出聲音。 播放cd光盤 音頻卡可與cd-rom光盤驅(qū)動(dòng)器相連, 可像cd機(jī)那播放cd光盤歌曲,3.2.1 波形音頻的數(shù)字化原理,(2)音頻卡(聲卡)與外部設(shè)備的連接 音頻卡與外部設(shè)備的連接如下圖所示。,入,3.2.1 波形音頻的數(shù)字化原理,cd-rom接口 用來連接cd-rom光盤驅(qū)動(dòng)器。 線路輸入插孔 用來連接具有線路輸出的音頻設(shè)備。如:cd機(jī)、錄音機(jī)和合成器等。 話筒輸入插孔 用來連接話筒。 線路輸出插孔 用來連接具有線路輸入的音頻設(shè)備。例如:cd機(jī)和錄音機(jī)等。 喇叭輸出插孔 用來連接耳機(jī)或具有功率放大

8、電路的音箱。 游戲桿/midi接口 用來連接游戲桿或midi電子音樂設(shè)備。,3.2.1 波形音頻的數(shù)字化原理,3.2.1 波形音頻的數(shù)字化原理,2. wave音頻文件 windows所使用的標(biāo)準(zhǔn)數(shù)字音頻是wave波形文件,擴(kuò)展名是.wav 多數(shù)聲卡以16位、44.1khz錄制和播放立體聲聲音 主要缺點(diǎn)是產(chǎn)生的文件太大,不適合長時(shí)間記錄聲音 壓縮方法:采用軟件或硬件的方法對原始聲音數(shù)據(jù)進(jìn)行壓縮。常用的軟件壓縮方法是pcm (均勻量化)和acm,3.2.1 波形音頻的數(shù)字化原理,3. wave音頻文件的制作 工具:錄音機(jī) 打開 “開始/程序/附件/娛樂”,選定“錄音機(jī)” 。,打開波形文件,可定位編

9、輯位置,將滑塊移到要編 輯信息的位置,3.2.1 波形音頻的數(shù)字化原理,3.2.1 波形音頻的數(shù)字化原理,“文件/ 屬性”命令打開“聲音屬性”對話框可以了解wave文件數(shù)字聲音指標(biāo)、設(shè)定錄音時(shí)的采樣頻率和量化位數(shù)。,3.2.1 波形音頻的數(shù)字化原理,錄音時(shí):在 “音量控制”對話框中選擇“選項(xiàng)”菜單的“屬性”命令,將調(diào)節(jié)音量設(shè)置為“錄音”方式。,3.2.1 波形音頻的數(shù)字化原理,從“編輯”菜單可插入聲音文件、混音、刪除一部分聲音文件等 處理。,3.2.1 波形音頻的數(shù)字化原理,從“效果”菜單可進(jìn)行加快、放慢聲音速度,加入回聲等特殊效果,反向播放,將聲音重新組合等 處理。,3.2.2 midi合成

10、音樂,midi是(musical instrument digital interface)樂器數(shù)字接口的縮寫,泛指數(shù)字音樂的國際標(biāo)準(zhǔn),始建于1982年,文件擴(kuò)展名是 .mid 。 midi文件的內(nèi)容是能使合成音樂芯片演奏樂曲的代碼。標(biāo)準(zhǔn)的多媒體pc平臺(tái)能夠通過內(nèi)部合成器或連接到計(jì)算機(jī)midi端口的外部合成器播放midi文件。,3.2.2 midi合成音樂,合成器 合成器存在于聲卡中,是利用dsp或其他芯片來產(chǎn)生音樂或聲音的電子裝置。目前被廣泛采用的midi合成方式主要有: 調(diào)頻合成(fm) 采用頻率調(diào)制的原理產(chǎn)生聲音 fm合成器能發(fā)出128種樂器的聲音 波表合成 (wave table) 對

11、真實(shí)樂器聲采樣,制波表保存,由dsp查表調(diào)用處理 聲音效果與真實(shí)的樂器聲幾乎無差別 聲卡帶有波形表rom的接口 或 本身帶有波形表rom rom的容量越大,可存儲(chǔ)的樂器音就越多,3.2.2 midi合成音樂,調(diào)頻合成(fm)和波表合成的主要區(qū)別在于: 調(diào)頻合成通過對簡單正弦波的線性控制來模擬音樂樂器、鼓和特殊效果,而波表采用真實(shí)的聲音樣本進(jìn)行回放,因此采用波表合成的midi音樂聽上去更接近自然、更具真實(shí)感,而fm合成的midi音樂則多帶有人工合成的色彩。,3.2.2 midi合成音樂,2. midi音樂產(chǎn)生原理 midi標(biāo)準(zhǔn)規(guī)定了不同廠家的電子樂器與計(jì)算機(jī)連接的電纜和硬件,還指定從一個(gè)裝置傳送

12、數(shù)據(jù)到另一個(gè)裝置的通信協(xié)議。 midi文件是存放midi信息(樂譜的數(shù)字描述)的標(biāo)準(zhǔn)文件格式,其中包含音符、定時(shí)和多達(dá)16個(gè)通道的演奏定義,每個(gè)通道的演奏音符由鍵號(hào)、通道號(hào)、音長、音量和力度組成。 將電子樂器演奏時(shí)的指令信息通過聲卡上midi控制器輸入計(jì)算機(jī)中,或利用一些midi樂曲處理軟件編輯產(chǎn)生的音樂指令集合,以midi文件格式存儲(chǔ)在存儲(chǔ)器中,便是midi音頻。重放時(shí),必須經(jīng)過合成器將midi 指令翻譯成響應(yīng)的聲音信號(hào),再由聲卡上的混音器混音后生成聲波,最后由音響輸出聲音。,3.2.2 midi合成音樂,midi合成音樂適合于: 需要播放長時(shí)間高質(zhì)量的音樂 需要以音樂作為背景音響效果,同時(shí)

13、cd-rom中裝載其他數(shù)據(jù) 需要以音樂作為背景音響效果,同時(shí)播放波形音頻 midi文件的特點(diǎn):是指令不是波形,文件小 端口 :midi in、midi out、 midi thru windows的媒體播放器可直接播放,3.2.3 音頻文件的格式,根據(jù)獲取的途徑和存儲(chǔ)的方式不同,聲音文件有多種文件格式,3.2.3 音頻文件的格式,1. wav格式 它是windows中使用的標(biāo)準(zhǔn)數(shù)字音頻文件,其擴(kuò)展名為“.wav”。該數(shù)字音頻文件保存的是模擬音頻經(jīng)聲卡采樣和數(shù)字化后的數(shù)字音頻數(shù)據(jù)。wav波形數(shù)字音頻文件較大,實(shí)際使用中,常常需要將它進(jìn)行壓縮使用。,3.2.3 音頻文件的格式,wav是micros

14、oft windows本身提供的音頻格式,由于windows本身的影響力,這個(gè)格式已經(jīng)成為了事實(shí)上的通用音頻格式。通常我們使用wav格式都是用來保存一些沒有壓縮的音頻,但實(shí)際上wav格式的設(shè)計(jì)是非常靈活(非常復(fù)雜)的,該格式本身與任何媒體數(shù)據(jù)都不沖突,換句話說,只要有軟件支持,你甚至可以在wav格式里面存放圖像。之所以能這樣,是因?yàn)閣av文件里面存放的每一塊數(shù)據(jù)都有自己獨(dú)立的標(biāo)識(shí),通過這些標(biāo)識(shí)可以告訴用戶究竟這是什么數(shù)據(jù)。,3.2.3 音頻文件的格式,2. mp3格式 mp3是第一個(gè)實(shí)用的有損音頻壓縮編碼。在mp3出現(xiàn)之前,一般的音頻編碼即使以有損方式進(jìn)行壓縮能達(dá)到4:1的壓縮比例已經(jīng)非常不錯(cuò)

15、了。但是,mp3可以實(shí)現(xiàn)12:1的壓縮比例,這使得mp3迅速地流行起來。 mp3之所以能夠達(dá)到如此高的壓縮比例同時(shí)又能保持相當(dāng)不錯(cuò)的音質(zhì)是因?yàn)槔昧巳硕奶匦?,削減音樂中人耳聽不到的成分,同時(shí)嘗試盡可能地維持原來的聲音質(zhì)量。,3.2.3 音頻文件的格式,3. midi格式 midi由世界主要樂器制造廠商建立起來的一個(gè)數(shù)字音樂國際標(biāo)準(zhǔn),用來規(guī)定計(jì)算機(jī)音樂程序、電子合成器和其他電子設(shè)備之間的交換信息和控制信號(hào)的方法。它可以使不同廠家生產(chǎn)的電子音樂合成器互相發(fā)送和接受彼此的音樂數(shù)據(jù)。 midi技術(shù)本來不是為了電腦發(fā)明的。該技術(shù)最初應(yīng)用在電子樂器上用來記錄樂手的彈奏,以便以后重播。不過隨著在電腦里面引

16、入了支持midi合成的聲音卡之后,midi才正式地成為了一種音頻格式。,midi格式的聲音文件記錄的不是數(shù)字化后的聲音波形數(shù)據(jù),而是一系列描述樂曲的符號(hào)指令。因此,相同音樂的情況下,midi格式文件比wav格式文件要小得多。 生成midi文件有兩種方法:一種是用作曲軟件寫出,另一種是通過聲卡的midi接口把外接音序器演奏的樂曲輸入電腦里。 midi文件的重放效果完全依賴于聲卡的檔次。,3.2.3 音頻文件的格式,3.2.3 音頻文件的格式,4. cd格式 cd格式是當(dāng)今世界上音質(zhì)最好的數(shù)碼音頻格式,在windows中看到的“*.cda”是cd唱片的索引格式,并不是真正的音樂文件,需要cd唱機(jī)或

17、電腦中的各種播放軟件來播放。因此無法直接將cd唱片中的聲音復(fù)制到硬盤中進(jìn)行播放(需要使用音頻轉(zhuǎn)換軟件轉(zhuǎn)換成wav或其他格式后才能播放)。,3.2.3 音頻文件的格式,5. realaudio格式 realaudio格式主要使用于網(wǎng)絡(luò)上的在線音樂欣賞。 real文件的格式主要有:ra( realaudio ) 、rm( realmedia , realaudio g2)、rmx( realaudio secured) ,其特點(diǎn)是可以隨網(wǎng)絡(luò)帶寬的不同而改變聲音的質(zhì)量。,3.2.3 音頻文件的格式,6. wma格式 wma( windows media audio)由微軟開發(fā),壓縮率達(dá)到18:1,音

18、質(zhì)強(qiáng)于mp3格式,音質(zhì)好的可與cd媲美。wma支持音樂流技術(shù),適合于網(wǎng)上在線播放。 在windows xp中wma是默認(rèn)的音頻編碼格式。,基本壓縮原理 由于音頻信號(hào)中存在冗余,因此計(jì)算機(jī)系統(tǒng)在音頻數(shù)據(jù)的存儲(chǔ)和傳輸中采用了數(shù)據(jù)壓縮。在數(shù)據(jù)壓縮時(shí),要綜合考慮三個(gè)方面: 是否造成聲音質(zhì)量下降 是否增加數(shù)據(jù)率 是否增加計(jì)算量,補(bǔ)充: 音頻數(shù)據(jù)壓縮,補(bǔ)充: 音頻數(shù)據(jù)壓縮,音頻壓縮,無損壓縮(huffman編碼、游程長度編碼),有損壓縮(波形編碼、參數(shù)編碼、混合編碼),音頻信號(hào)的編碼方法: 基于音頻數(shù)據(jù)統(tǒng)計(jì)特性的編碼,目標(biāo)是使重建語音波形保持原波形的形狀。 (波形編碼) 基于音頻的聲學(xué)參數(shù)進(jìn)行編碼,提高壓縮比,目標(biāo)是使重建音頻保持原音頻的特性。 (參數(shù)編碼) 將上述兩種編碼結(jié)合起來。(混合編碼) 基于人的聽覺特性進(jìn)行編碼,目標(biāo)實(shí)現(xiàn)高效率壓縮。 (mpeg標(biāo)準(zhǔn)),最常用的方法是pcm方法(wave文件所使用),補(bǔ)充: 音頻數(shù)據(jù)壓縮,2. mp3音樂 mp3是mpeg layer 3的縮寫,用來處理高壓縮率的聲音信息,音質(zhì)接近c(diǎn)d,大小只有其十二分之一。 mp3的音質(zhì)取

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論