版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)字音頻技術(shù)主要內(nèi)容聲音及其屬性數(shù)字化音頻音頻壓縮技術(shù)音頻文件類型編輯制作數(shù)字音頻素材GoldWave錄音機一、聲音及其屬性聲音是由空氣中分子的振動而產(chǎn)生的。它是通過空氣傳播的一種連續(xù)的波,叫聲波。自然界的聲音是一個隨時間而變化的連續(xù)信號,可近似地看成是一種周期性的函數(shù)。通常用模擬的連續(xù)波形描述聲波的形狀,單一頻率的聲波可用一條正弦波表示。聲音的分類語音:人的說話聲不僅是一種波形,而且還通過語氣、語速、語調(diào)攜帶著比文本更加豐富的信息。這些信息往往可以通過特殊的軟件進行抽取。音樂:音樂是一種符號化了的聲音,這種符號就是樂譜,音樂則是轉(zhuǎn)變?yōu)榉柮襟w形式的聲音。音效:為增進場面之真實感、氣氛或戲劇信息,而加于聲帶上的雜音或聲音。簡單地說,音效就是指由聲音所制造的效果。
聲音的三要素音調(diào):聲音的高低(物理學(xué)定義);與聲音的頻率正相關(guān)。高音和低音音強:聲音的響亮程度,與振幅相關(guān),取決于聲波信號的強弱,與聲音信號的幅度成正比。分貝dB。常說的“音量”指的是音強。音色:音的感覺特性,與波形相關(guān),取決于聲波的頻譜,由混入基音的泛音所決定。若中、高泛音豐富,音色就明亮;若低頻泛音豐富,音色就低沉。二、數(shù)字化音頻音頻定義:人類聽覺所感知范圍內(nèi)的頻率,也稱聲頻按照人們聽覺的頻率范圍,對聲音的分類:次聲波:頻率低于20Hz的信號,也稱為亞音頻音頻:頻率范圍在20~20kHz的聲音信號,人耳能夠聽到的聲音信號。屬于多媒體音頻信息范疇。超聲波:頻率高于20kHz的聲音信號,也稱為超音頻次聲波超聲波音頻信號語音信號f/Hz20300300020000圖:按頻率分類的聲音聲音數(shù)字化音頻信號(Audio)是指帶有語音、音樂和音效的有規(guī)律的聲波的頻率、幅度變化的信息載體。它分為模擬音頻信號和數(shù)字音頻信號兩種。其中,模擬音頻用模擬電壓的幅度表示聲音強弱,模擬聲音在時間上是連續(xù)的。而數(shù)字音頻是一個數(shù)據(jù)序列,在時間上是離散的,是由許多二進制數(shù)1和0組成的。聲音數(shù)字化(續(xù)1)模擬音頻數(shù)字化:采樣、量化、編碼采樣--每隔一定時間間隔在模擬波形上取一個幅度值。量化--將每個采樣點得到的幅度值以數(shù)字存儲。編碼--將采樣和量化后的數(shù)字?jǐn)?shù)據(jù)以一定的格式記錄下來。模擬信號采樣量化編碼數(shù)字信號
振幅
頻率1/T
采樣點
T
振幅1/TT聲音數(shù)字化(續(xù)2)數(shù)字音頻的技術(shù)指標(biāo):采樣頻率:每秒鐘的采樣次數(shù)奎斯特采樣理論:采樣頻率f(1/T)高于輸入信號最高頻率的兩倍,則經(jīng)過采樣后的采樣信號能夠包含原模擬信號的全部信息,且經(jīng)過反變換和低通濾波后可不失真地恢復(fù)原模擬信號。CD激光唱盤采樣的三個標(biāo)準(zhǔn)頻率分別為44.1kHz,22.05kHz和11.025kHz量化位數(shù)(采樣精度、量化精度):存放采樣點振幅值的二進制位數(shù)。通常量化位數(shù)有8位、16位,分別表示有28、216個等級。聲道數(shù):聲音通道的個數(shù),即一次同時產(chǎn)生的聲波組數(shù)。單聲道比較原始的聲音復(fù)制形式,缺乏位置感。立體聲聲音在錄制過程中被分配到兩個獨立的聲道,很好的聲音定位效果。準(zhǔn)立體聲在錄制聲音的時候采用單聲道,而放音有時是立體聲,有時是單聲道。四聲道環(huán)繞規(guī)定了4個發(fā)音點:前左、前右,后左、后右,可以提供多個不同方向的聲音環(huán)繞。5.1聲道來源于4.1環(huán)繞,不同之處在于它增加了一個中置單元。這個中置單元負責(zé)傳送低于80Hz的聲音信號,在欣賞影片時有利于加強人聲。美國杜比AC-3(DolbyDigital)、歐洲D(zhuǎn)TS等。7.1聲道在5.1的基礎(chǔ)上又增加了中左和中右兩個發(fā)音點數(shù)字化聲音的質(zhì)量和存儲量數(shù)據(jù)量(Byte)=(采樣頻率×量化精度×聲道數(shù)×聲音持續(xù)時間)/8例如,CD音樂,用44.10kHz的采樣頻率,16位的精度存儲,一般是立體聲(兩個聲道),則錄制1秒鐘的立體聲節(jié)目,其WAV文件所需的存儲量為:
44100×16×2/8=176400(字節(jié))=0.176MBps一個小時的CD音樂需要約635MB的存儲空間如果使用5.1聲道,則存儲量為:
44100×16×5.1/8=0.45MBps一個小時的CD音樂需要約1.62G的存儲空間不同類型信號的采樣頻率和量化精度信號類型頻率范圍(Hz)采樣頻率(kHz)量化精度(bit)單聲道/立體聲數(shù)據(jù)率(未壓縮)(kB/s)電話話音200~340088單聲道8調(diào)頻廣播(AM)20~1500011.0258單聲道11.0寬帶音頻(FM)50~700022.05016立體聲88.2CD20~2200044.116立體聲176.4DAT20~220004816立體聲192.0三、音頻壓縮技術(shù)對原始數(shù)字音頻信號流(PCM)編碼運用恰當(dāng)?shù)臄?shù)字信號處理技術(shù),在不損失有用信息量,或引入損失可忽略的條件下,降低(壓縮)其碼率,也稱為壓縮編碼。音頻數(shù)據(jù)壓縮比=壓縮后的音頻數(shù)據(jù)/壓縮前的音頻數(shù)據(jù)音頻壓縮算法的主要分類無損壓縮利用信息相關(guān)性進行的數(shù)據(jù)壓縮并不損失原信息的內(nèi)容。是一種可逆壓縮,即經(jīng)過文件壓縮后可以將原有的信息完整保留的一種數(shù)據(jù)壓縮方式,如wav、flac、ape等格式。有損壓縮經(jīng)壓縮后不能將原來的文件信息完全保留的壓縮,是不可逆壓縮。如JEPG、MPEG壓縮,常見格式如mp3、wma。音頻壓縮技術(shù)標(biāo)準(zhǔn)國際電報電話咨詢委員會CCITT(現(xiàn)國際電信聯(lián)盟ITU-T)標(biāo)準(zhǔn)16KbpsCCITT標(biāo)準(zhǔn)化方案G.728:面向帶寬為64Kbps的ISDN線路的可視電話上32KbpsCCITT標(biāo)準(zhǔn)化方案G.721:應(yīng)用于電視會議系統(tǒng)的語音編碼和數(shù)字電話的語音合成64KbpsCCITT標(biāo)準(zhǔn)化方案G.722:面向7kHz帶寬以語音和音樂為對象的標(biāo)準(zhǔn)化音響編碼方案MPEG-1:規(guī)定了音頻壓縮三種模式層I、層II(MP2)、層III(MP3)DolbyAC-3:多聲道音頻信號壓縮MPEG-2BC:多聲道音頻信號壓縮四、音頻文件格式聲音文件格式MIDI文件格式聲音文件格式波形文件,Windows本身存放數(shù)字聲音的標(biāo)準(zhǔn)格式,擴展名.wav,是一種未經(jīng)壓縮處理的音頻數(shù)據(jù)。體積大(1分鐘的波形文件需要10MB)。CDAudio,亦稱CD音樂,擴展名.cda。記錄的是波形流,無法編輯,文件大。RealAudio,擴展名.ra、.ram,Real公司開發(fā)的主要適用于網(wǎng)上實時數(shù)字音頻流技術(shù)的文件格式。高保真方面不及mp3。需要使用RealPlayer。MPEG-3,擴展名.mp3。壓縮率大。音質(zhì)不及波形文件。MIDI,擴展名.mid,目前最成熟的音樂格式,實際上已經(jīng)成為一種產(chǎn)業(yè)標(biāo)準(zhǔn)。優(yōu)點是短小,缺點是播放效果因軟、硬件而異。RMI文件,Microsoft公司的MIDI文件格式,可以包括圖片標(biāo)識和文本。聲音文件格式(續(xù)1)CreativeMusicalFormat,擴展名.cmf,Creative公司的專用音樂格式,和MIDI差不多,在音色和效果上有些特色,專用于FM音頻卡,兼容性差VOC文件,Creative公司的波形文件格式,也是聲霸卡使用的音頻文件格式。每個VOC文件由文件頭塊HeaderBlock和音頻數(shù)據(jù)塊DataBlock組成。文件頭包含一個標(biāo)識版本號和一個指向數(shù)據(jù)塊起始的指針。數(shù)據(jù)塊分成各種類型的子塊,如聲音數(shù)據(jù)靜音標(biāo)識ASCII碼文件重復(fù)的結(jié)果及終止標(biāo)志、擴展塊等PCM文件,模擬音頻信號經(jīng)A/D轉(zhuǎn)換直接形成的二進制序列,該文件沒有附加的文件頭和文件結(jié)束的標(biāo)志。MIDI什么是MIDIMIDI(MusicalInstrumentDigitalInterface)是樂器數(shù)字接口的英文縮寫,它是指數(shù)字樂器與計算機連接的接口,即在數(shù)字樂器與計算機相連接時所使用的可以直接插入在計算機串口上的一個小部件,通過它可以使數(shù)字樂器與計算機相互“溝通”信息。MIDI的特點是其文件內(nèi)部記錄的是演奏數(shù)字音樂的全部動作過程。比如,音色、音符、延時、音量、力度等信息,所以其數(shù)據(jù)量很小。MIDI端口:一臺MIDI設(shè)備可以有一至三個MIDI端口,MIDIIn、MIDIOut、MIDIThru。MIDIIn接收來自其它MIDI設(shè)備的MIDI信息;MIDIOut發(fā)送本設(shè)備上生成的MIDI信息到其它設(shè)備;MIDIThru將從MIDIIn端口傳來的信息轉(zhuǎn)發(fā)到相連的另一臺MIDI設(shè)備上。MIDI鍵盤:用于MIDI樂曲演奏,本身不發(fā)出聲音,當(dāng)作曲人員觸動鍵盤上的按鍵時,就發(fā)出按鍵信息,所產(chǎn)生的僅僅是MIDI音樂消息,再由音序器錄制生成MIDI文件。音序器:用于記錄、編輯、播放MIDI的聲音文件。合成器:解釋MIDI文件中的指令符號,生成所需要的聲音波形,經(jīng)放大后由揚聲器輸出。MIDI文件格式MIDI擴展名為.mid,目前最成熟的音樂格式。RMI文件Microsoft公司的MIDI文件格式。五、編輯制作數(shù)字音頻素材常見數(shù)字音頻處理軟件VegasSONY公司推出的一款整合視頻與音效編輯的軟件。將剪輯、特效、專長、燒錄等功能正合為一體。適用與專業(yè)人士或個人用戶。CoolEdit/AdobeAudition以前是數(shù)字音頻軟件制作公司SyntrilliumSoftware的產(chǎn)品,Syntrillium的旗艦軟體就是--CoolEditPro?,F(xiàn)在被Adobe公司收購了,并升級為AdobeAuditionSoundForgeSonicFoundry公司開發(fā)的產(chǎn)品。SoundForge處理的是相對比較龐大的音頻和視頻文件,對磁盤空間和碎片等指標(biāo)都有一定的要求。GoldWave可對音頻編輯、播放、錄制、轉(zhuǎn)換,體積小巧??纱蜷_的音頻文件包括WAV,OGG,VOC,IFF,AIF,AFC,AU,SND,MP3,MAT,DWD,SMP,VOX,SDS,AVI,MOV,APE等格式??蓮腃D或VCD或DVD或其它視頻文件中提取音頻。菜單欄工具欄左聲道右聲道狀態(tài)欄如何從CD中獲取音頻把CD放入光驅(qū)在GoldWave中,選擇工具菜單/CD讀取器選擇相應(yīng)的曲目選取“保存”,修改保存路徑后,單擊“確定”。錄音前的準(zhǔn)備錄音之前,一定要調(diào)整聲音控制面板參數(shù)在GoldWave中錄音新建文檔:“文件”菜單/新建,設(shè)置采樣頻率、持續(xù)時間單擊控制器上的紅色錄音按鈕,開始錄音(如錄制一首詩)保存文件選擇要處理的音頻如何選擇一段音樂在播放過程中,設(shè)置開始和結(jié)束標(biāo)志,可以選出你需要的部分。特點是邊聽邊選,比較精確。編輯/標(biāo)記/放置開始標(biāo)記或放置結(jié)束標(biāo)記在非播放狀態(tài),首先選擇選示按鈕,然后利用鼠標(biāo)拖動畫框,就可以選擇相應(yīng)的部分。如何選擇一個聲道編輯/聲道/左聲道shift+ctrl+L編輯/聲道/右聲道shift+ctrl+R簡單聲音編輯刪除聲音片斷不選擇聲道的時候,刪除片斷選擇某聲道的時候,刪除片斷剪貼片斷靜音處理選擇編輯區(qū)域,編輯/靜音與刪除聲音片斷不同的是,變成靜音的編輯區(qū)域仍然存在,其時間長度不變聲音的淡入淡出效果選擇需要設(shè)置淡入或淡出效果的區(qū)域,可以是單聲道,也可以是雙聲道單擊淡入或淡出效果按鈕,設(shè)置淡入或者淡出效果混響設(shè)置選擇區(qū)域設(shè)置混響特殊音效機器人聲音:把原始聲音加工成類似機器發(fā)出的聲音。倒序聲音:將聲音數(shù)據(jù)反相排列。時間調(diào)整改變聲音的長度(縮短或者加長)整個聲音文件,或者局部編輯區(qū)域去噪先選擇波形,然后點擊【效果】菜單中的“濾波器”中的“降噪”在預(yù)置中選擇“減少嗡嗡聲”,點擊確定制作實例:語音和背景音樂的合成如何實現(xiàn)聲音合成:背景音樂和人的聲音打開背景音樂,并復(fù)制新建一個文件,把背景音樂粘貼過來打開人聲文件,并復(fù)制在剛才新建的文件中,編輯/混音如何去掉不想要的部分,比如開頭部分在最開始的地方,單擊右鍵,設(shè)置開始標(biāo)志播放音樂,在需要的地方暫停單擊右鍵,設(shè)置結(jié)束標(biāo)志刪除即可音樂淡出-朗讀聲-音樂淡出首先在英語朗讀文件的前面添加10秒鐘的靜音效果,同時把朗讀文件后部不必要的部分刪除。在背景音樂的前部和后部設(shè)置淡出和淡入效果,中間部分設(shè)置音量變化(把聲音變小)把英語朗讀文件與背景音樂文件進行混音合成如何調(diào)整背景音樂的音量?打開背景音樂選擇需要調(diào)整音量的部分效果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026中糧期貨社會招聘備考題庫有答案詳解
- 2026河北承德市承德縣人力資源和社會保障局招聘公益性崗位人員9人備考題庫完整答案詳解
- 2026上海市姚連生中學(xué)招聘教師備考題庫(含答案詳解)
- 多病原體整合監(jiān)測工作方案(2025版)
- 2025年統(tǒng)計工作自查報告
- 人力資源管理師薪酬管理三級計算試題及答案
- 2026年備考注冊測繪師之測繪綜合能力題庫練習(xí)試題(備用卷)附答案
- 2025年配電箱絕緣電阻檢測員實操考核模擬試卷及答案
- 2026 年中職包裝工程技術(shù)(包裝印刷技術(shù))試題及答案
- 襄陽2025年襄陽市專項引進50名緊缺人才筆試歷年參考題庫附帶答案詳解
- 駕校教練員安全知識培訓(xùn)課件
- 《危險化學(xué)品安全法》解讀與要點
- 電力網(wǎng)絡(luò)安全培訓(xùn)教學(xué)課件
- 2025年宜昌市“招才興業(yè)”市直事業(yè)單位人才引進47人·重慶大學(xué)站筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 上海市徐匯區(qū)上海中學(xué)2025-2026學(xué)年高三上學(xué)期期中考試英語試題(含答案)
- 2025秋滬科版(五四制)(新教材)初中科學(xué)六年級第一學(xué)期知識點及期末測試卷及答案
- 孕婦貧血教學(xué)課件
- 5年(2021-2025)山東高考生物真題分類匯編:專題17 基因工程(解析版)
- 新華資產(chǎn)招聘筆試題庫2025
- 智能化項目驗收流程指南
- 搶劫案件偵查課件
評論
0/150
提交評論