版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
音頻信息及處理第一頁,共三十五頁,編輯于2023年,星期四聲音也許是世界上中最動人心弦的元素。任何的語言都離不開聲音;尤其是那些悅耳的音樂,能深深觸動人們內(nèi)心的情感,帶來美妙的感受。能否利用好聲音,是一件多媒體作品成敗與否的重要因素,本章中我們就來學(xué)習(xí)一下數(shù)字化的聲音。春江花月夜第二頁,共三十五頁,編輯于2023年,星期四一、數(shù)字音頻基礎(chǔ) 什么是聲音、聲音信號的特征 聲音信號的數(shù)字化、音頻文件的格式二、電子合成音樂(MIDI) MIDI和WAVE的比較、MIDI演奏、WAVE轉(zhuǎn)MIDI三、數(shù)字音頻的編輯和處理 如何壓縮和轉(zhuǎn)換聲音格式 如何在電腦上錄音、如何編輯聲音四、語言合成和語音識別技術(shù)第七章數(shù)字音頻和合成音樂第三頁,共三十五頁,編輯于2023年,星期四7.1.1什么是聲音?聲音:當(dāng)空氣中某物體通過前后位移產(chǎn)生振動,它將引起壓力波,當(dāng)它到達人耳時,我們會感受達到這種壓力的變化(振動),這就是聲音。一、數(shù)字音頻基礎(chǔ)第四頁,共三十五頁,編輯于2023年,星期四音頻是一種連續(xù)變化的模擬信號,可用一條連續(xù)的曲線來表示,稱為聲波。因聲波是在時間和幅度上都連續(xù)變化的量,我們稱之為模擬量。下面用聲音錄制軟件記錄的英文單詞“Hello”的語音波形一、數(shù)字音頻基礎(chǔ)第五頁,共三十五頁,編輯于2023年,星期四模擬音頻信號有兩個重要參數(shù):頻率和幅度。聲音的頻率體現(xiàn)音調(diào)的高低,聲波幅度的大小體現(xiàn)聲音的強弱。
一個聲源每秒鐘可產(chǎn)生成百上千個波,我們把每秒鐘波峰所發(fā)生的數(shù)目稱之為信號的頻率,單位用赫茲(Hz)或千赫茲(kHz)表示。信號的幅度是從信號的基線到當(dāng)前波峰的距離。幅度決定了信號音量的強弱程度。幅度越大,聲音越強。對音頻信號,聲音的強度用分貝(dB)表示,分貝的幅度就是音量。幅度限周期基線模擬音頻信號的兩個重要參數(shù)一、數(shù)字音頻基礎(chǔ)第六頁,共三十五頁,編輯于2023年,星期四7.1.2聲音的頻率和幅度多媒體技術(shù)處理的聲音主要是人耳可聽到的20~20kHz的音頻信號。言語(speech)/語音:人說話的聲音,其頻率范圍約為300~3400Hz全頻帶聲音:音樂聲、風(fēng)雨聲、汽車聲等其他聲音,其帶寬可達到20~20kHzdB例子20聲音工作室40夜晚的居民區(qū)60大型百貨公司100高速公路上的汽車13075人管弦樂隊最強音一、數(shù)字音頻基礎(chǔ)第七頁,共三十五頁,編輯于2023年,星期四聲音信號的數(shù)字化:將模擬聲音信號轉(zhuǎn)換成數(shù)字編碼形式以便于計算機進行處理的過程聲音信號數(shù)字化的過程:取樣量化編碼7.1.3聲音信號的數(shù)字化一、數(shù)字音頻基礎(chǔ)聲音信號的數(shù)字化(動畫)第八頁,共三十五頁,編輯于2023年,星期四模擬聲音信號取樣量化編碼數(shù)字聲音011010011101……聲音信號的數(shù)字化一、數(shù)字音頻基礎(chǔ)第九頁,共三十五頁,編輯于2023年,星期四取樣頻率:44.1kHz量化位數(shù):16Bit聲道數(shù)目:Stereo或Mono數(shù)碼率(bitrate):指的是每秒鐘的數(shù)據(jù)量,也稱比特率、碼率波形聲音的主要參數(shù)一、數(shù)字音頻基礎(chǔ)碼率=采樣頻率×量化位數(shù)×聲道數(shù)單位:bit(位)/秒1Byte=8bit第十頁,共三十五頁,編輯于2023年,星期四課堂習(xí)題:例:已知數(shù)字激光唱盤(CDAudio)的標準采樣頻率為44.1kHz,量化位數(shù)為16位,立體聲。請問一分鐘CD-DA音樂所需的存儲空間為多少?碼率=采樣頻率×量化位數(shù)×聲道數(shù)×?xí)r間(單位)=44.1kHz×16b×2×60s=84672kb=10584kB=10.3MB一、數(shù)字音頻基礎(chǔ)第十一頁,共三十五頁,編輯于2023年,星期四做一做,想一想一個256M的MP3播放器能夠儲存采樣頻率為44.1KHz、16位、立體聲的WAV音樂多長時間?一張650M的CD光盤一般有幾首歌?一個512M的MP3可以儲存幾首MP3音樂?一、數(shù)字音頻基礎(chǔ)第十二頁,共三十五頁,編輯于2023年,星期四幾種常見數(shù)字聲音的主要參數(shù)一、數(shù)字音頻基礎(chǔ)采樣率(kHz)量化位(bit)聲道編碼算法容量(MB/min)等效音質(zhì)11.0258單PCM0.66語音22.0516雙PCM5.292FM廣播44.116雙PCM10.584CD唱盤第十三頁,共三十五頁,編輯于2023年,星期四7.1.4音頻格式介紹-1CDA是CDAudio的縮寫。音樂光碟片里面的音樂格式,是音樂CD片最常用的檔案格式WAV波形聲音文件,是最早的數(shù)字音頻格式,可以精確記錄各種聲音但WAV格式對存儲空間需求太大,不便于交流和傳播一、數(shù)字音頻基礎(chǔ)第十四頁,共三十五頁,編輯于2023年,星期四7.1.4音頻格式介紹-2MP3由WAV文件經(jīng)壓縮而來,音質(zhì)略低于CD和WAV格式,但這種差異用耳朵難以分辨。壓縮比1:10WMA音質(zhì)可以與MP3相比,而大小只有MP3格式的一半,也適用于網(wǎng)絡(luò),音質(zhì)要好于RA格式。RA適用于網(wǎng)絡(luò)的“流式文件”,可一邊下載一邊播放,壓縮比達1:96,文件比MP3格式小,只是音質(zhì)較差。一、數(shù)字音頻基礎(chǔ)第十五頁,共三十五頁,編輯于2023年,星期四7.1.4音頻格式介紹-3MIDI存儲的不是聲音信號,而是各種樂器的發(fā)音命令,播放時系統(tǒng)根據(jù)這些命令合成樂曲,midi文件的優(yōu)點是非常小。一、數(shù)字音頻基礎(chǔ)走進MIDI的世界第十六頁,共三十五頁,編輯于2023年,星期四7.2電子合成音樂-MIDIMIDI和WAVE的比較電子合成音樂(MIDI)的原理MIDI與WAVE的相互轉(zhuǎn)換第十七頁,共三十五頁,編輯于2023年,星期四7.2.1MIDI和WAVE的比較MIDIWAVE(MP3)文件內(nèi)容音樂伴奏歌曲和演唱音源MIDI樂器Mic,磁帶,CD唱盤,音響容量小與音質(zhì)成正比音質(zhì)與聲卡質(zhì)量有關(guān)與編碼指標有關(guān)適用性易編輯,聲源受限,數(shù)據(jù)量很小不易編輯,聲源不限,數(shù)據(jù)量大長度:3分30秒長度:3分30秒二、電子合成音樂-MIDI實例第十八頁,共三十五頁,編輯于2023年,星期四7.2.2電子合成音樂(MIDI)的原理二、電子合成音樂-MIDI
MIDI(MusicalInstrumentDigitalInterface)采用音樂符號記錄和解釋樂譜,并合成相應(yīng)的音樂。
MIDI不是把音樂的波形進行數(shù)字化采樣和編碼,而是將數(shù)字式電子樂器的彈奏過程記錄下來,如按鍵、力度、時間多度等等。當(dāng)需要播放這首樂曲時,根據(jù)記錄的樂譜指令,通過音樂合成器生成音樂聲波,經(jīng)放大后由揚聲器播出。第十九頁,共三十五頁,編輯于2023年,星期四7.2.2電子合成音樂(MIDI)的原理二、電子合成音樂-MIDIFM(FrequencyModulation)合成
通過硬件產(chǎn)生正弦信號,再經(jīng)處理合成音樂。一般聲卡采用的方式,音色與硬件有關(guān),音色較單薄波形表(Wavetable)合成專業(yè)聲卡采用的方式。在聲卡的ROM中預(yù)存各種實際樂器的聲音采樣,通過調(diào)用相應(yīng)的實際聲音數(shù)據(jù)合成樂音。ROM存儲器的容量越大,合成的效果越好。
第二十頁,共三十五頁,編輯于2023年,星期四7.3數(shù)字音頻的編輯和處理如何轉(zhuǎn)換音頻文件的格式StreamBoxRipperMP3工具包(toolkit)如何在電腦上錄音電腦Mic的使用Windows錄音機專業(yè)音頻處理軟件Cooledit第二十一頁,共三十五頁,編輯于2023年,星期四5.7.1.如何使用StreamBoxRipper轉(zhuǎn)換文件格式三、數(shù)字音頻的編輯和處理第二十二頁,共三十五頁,編輯于2023年,星期四5.7.2如何使用Mic錄音三、數(shù)字音頻的編輯和處理第二十三頁,共三十五頁,編輯于2023年,星期四5.7.3專業(yè)音頻處理軟件GoldWaveCoolEditAdobeAudition三、數(shù)字音頻的編輯和處理第二十四頁,共三十五頁,編輯于2023年,星期四基本編輯操作聲音的剪輯(刪除、移動或復(fù)制一段聲音,插入空白等)聲音音量調(diào)節(jié)(提高或降低音量,淡入、淡出處理等)聲音的反轉(zhuǎn)、消除噪音聲音的效果處理包括混響、回聲、和聲效果、動態(tài)效果、升降調(diào)、顫音等格式轉(zhuǎn)換功能聲音編輯軟件的功能三、數(shù)字音頻的編輯和處理第二十五頁,共三十五頁,編輯于2023年,星期四Cooledit軟件功能及界面簡介
多軌音頻編輯軟件,最多可支持128個音軌,能高質(zhì)量地完成錄音、編輯、合成等多種任務(wù)三、數(shù)字音頻的編輯和處理第二十六頁,共三十五頁,編輯于2023年,星期四CoolEdit音頻處理實驗1、安裝CoolEdit2.0Pro2、從網(wǎng)上下載一首歌曲和配樂(MP3格式)。3、將歌曲和配樂插入的音軌14、在音軌2中錄下自己的聲音5、單獨編輯音軌2,去除噪音(效果-噪音消除-降噪器)。6、通過“效果-變調(diào)/變速-變速器”試聽自已的聲音升高和降低音調(diào)以后的效果。7、返回多軌界面,校正音軌2使其與音軌1同步。8、對前后進行剪切后,將前2軌混縮到第3軌,將第3軌另存為碼率為64kbps的MP3,改文件名后提交。三、數(shù)字音頻的編輯和處理作業(yè)范例第二十七頁,共三十五頁,編輯于2023年,星期四5.4.1語音合成語音合成(Speechsynthesis):根據(jù)語言學(xué)和自然語言理解的知識,使計算機模仿人的發(fā)聲,自動生成語音的過程。目前主要是按照文本(書面語言)進行語音合成,這個過程稱為文語轉(zhuǎn)換(Text-To-Speech,簡稱TTS)。文語轉(zhuǎn)換過程文本分析韻律分析語音生成第二十八頁,共三十五頁,編輯于2023年,星期四語音合成文語轉(zhuǎn)換過程文本文本分析韻律處理語音合成合成語音詞典,發(fā)音規(guī)則韻律規(guī)則庫語音庫第二十九頁,共三十五頁,編輯于2023年,星期四對計算機合成的語音希望能達到的要求:發(fā)音清晰可懂語氣語調(diào)自然說話人可選擇語速可變化等語音合成第三十頁,共三十五頁,編輯于2023年,星期四計算機合成語音的應(yīng)用:股票交易、航班動態(tài)查詢、電話報稅等業(yè)務(wù)有聲E-mail服務(wù)CAI課件或游戲解說詞的自動配音文稿校對、語言學(xué)習(xí)、語音秘書、自動報警、殘疾人服務(wù)等語音合成第三十一頁,共三十五頁,編輯于2023年,星期四5.4.2語音合成技術(shù)演示中文(科大訊飛)/speech%20shows.asp英文/demos//demo/demo_text.php/demos//realspeak/demo/第三十二頁,共三十五頁,編輯于2023年,星期四語音輸入技術(shù)演示IBMViaVoice(中文)ScansoftDrangonNaturallySpeaking第三十三頁,共三十五頁,編輯于2023年,星期四音效庫(推薦)http://www6./sound.shtml(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年河北體育學(xué)院競爭性選調(diào)科研處處長1名考試參考題庫及答案解析
- 2026年湖北中煙工業(yè)有限責(zé)任公司招聘169人考試備考試題及答案解析
- 2026年宿州蕭縣實驗高級中學(xué)教師招聘26名考試備考題庫及答案解析
- 2026年井岡山墾殖場農(nóng)技服務(wù)有限公司面向社會公開招聘工作人員考試參考題庫及答案解析
- 2026廣東深圳市福田區(qū)總工會招聘工會社會工作者6人考試參考題庫及答案解析
- 2026年大理州云龍縣公安局招聘警務(wù)輔助人員(13人)筆試備考題庫及答案解析
- 2026西安市第二十三中學(xué)招聘考試備考題庫及答案解析
- 2026年成都文理學(xué)院單招職業(yè)技能考試備考試題帶答案解析
- 2026西北工業(yè)大學(xué)動力與能源學(xué)院爆震燃燒團隊非事業(yè)編人員招聘1人(陜西)考試參考題庫及答案解析
- 2026浙江臺州市溫嶺市農(nóng)業(yè)農(nóng)村和水利局招聘編外工作人員1人考試備考題庫及答案解析
- 2025福建德化閩投抽水蓄能有限公司社會招聘4人歷年真題匯編附答案解析
- 2026年江蘇省普通高中學(xué)業(yè)水平合格性考試化學(xué)模擬卷(一)(含答案)
- 口腔會員協(xié)議書
- 部們凝聚力培訓(xùn)
- 燃油導(dǎo)熱油鍋爐施工方案
- 【地理 】人口分布課件2025-2026學(xué)年高中地理人教版必修二
- 2026四川農(nóng)商銀行校園招聘1065人考試筆試備考試題及答案解析
- 2026春人教版英語八下單詞表(先鳥版)
- 檳榔分銷商合同范本
- 2025廣東深圳證券交易所及其下屬單位信息技術(shù)專業(yè)人員招聘筆試歷年難易錯考點試卷帶答案解析試卷3套
- 2026國網(wǎng)吉林省電力公司高校畢業(yè)生提前批招聘筆試參考題庫附答案
評論
0/150
提交評論