版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第七章 音頻壓縮算法,音頻的概述(特點(diǎn)、分類) 數(shù)字音頻的采樣和量化 音頻格式的介紹 :聲音文件 MIDI文件 語音壓縮編碼基礎(chǔ) : 語音壓縮編碼中的數(shù)據(jù)量:數(shù)據(jù)量=(采樣頻率量化位數(shù))/8(字節(jié)數(shù)) 聲道數(shù)目。 壓縮編碼的目的:通過對資料的壓縮,達(dá)到高效率存儲和轉(zhuǎn)換資料的結(jié)果,即在保證一定聲音質(zhì)量的條件下,以最小的資料率來表達(dá)和傳送聲音信息。 壓縮編碼的必要性:實(shí)際應(yīng)用中,未經(jīng)壓縮編碼的音頻資料量很大,進(jìn)行傳輸或存儲是不現(xiàn)實(shí)的。 所以要通過對信號趨勢的預(yù)測和冗余信息處理,進(jìn)行資料的壓縮,這樣就可以使我們用較少的資源建立更多的信息 見的幾種音頻壓縮編碼: 1) 波形編碼 2) 參數(shù)編碼 3)
2、混合編碼 從文本到語音轉(zhuǎn)換過程示意,語音辨識技術(shù)有三大研究范圍:口音獨(dú)立、連續(xù)語音及可辨認(rèn)字詞數(shù)量 口音獨(dú)立: 1)早期只能辨認(rèn)特定的使用者即特定語者(Speaker Dependent,SD)模式2)非特定語者模式(Speaker Independent,SI) 連續(xù)語音: 1)單字音辨認(rèn) 2)整個句子辨識 語音識別原理簡圖,壓縮分類 壓縮分無損壓縮和有損壓縮。 無損壓縮一般指:磁盤文件,壓縮比低:2:14:1。 而有損壓縮則是指:音視頻文件,壓縮比可高達(dá)100:1。 凌陽音頻壓縮算法根據(jù)不同的壓縮比分為以下幾種 SACM-A2000:壓縮比為8:,8:1.25,8:1.5 SACM-S48
3、0: 壓縮比為80:3,80:4.5 SACM-S240: 壓縮比為80:1.5 按音質(zhì)排序:A2000S480S240 常用的音頻形式和壓縮算法 1) 波形編碼:sub-band即SACM-A2000 特點(diǎn):高質(zhì)量、高碼率,適于高保真語音音樂。 2) 參數(shù)編碼:聲碼器(vocoder)模型表達(dá),抽取參數(shù)與激勵信號進(jìn)行編碼。如:SACM-S240。 特點(diǎn):壓縮比大,計算量大,音質(zhì)不高,廉價! 3) 混合編碼:CELP即SACM-S480 特點(diǎn):綜合參數(shù)和波形編碼之優(yōu)點(diǎn)。 除此之外,還具有FM音樂合成方式即SACM-MS01,語音識別電路基本結(jié)構(gòu)如圖所示:,單片機(jī)對語音處理過程,SACM_A20
4、00 該壓縮算法壓縮比較小(8:1)所以具有高質(zhì)量、高碼率的特點(diǎn)適用于高保真音樂和語音。 其相關(guān)API函數(shù)如下所示: void SACM_A2000_Initial(int Init_Index) /初始化 void SACM_A2000_ServiceLoop(void) /獲取語音資料,填入譯碼隊列 void SACM_A2000_Play(int Speech_Index, int Channel, int Ramp_Set) /播放 void SACM_A2000_Stop(void) /停止播放 void SACM_A2000_Pause (void) /暫停播放 void SACM
5、_A2000_Resume(void) /暫停后恢復(fù) void SACM_A2000_Volume(Volume_Index) /音量控制 unsigned int SACM_A2000_Status(void) /獲取模塊狀態(tài) void SACM_A2000_InitDecode(int Channel) /譯碼初始化 void SACM_A2000_Decode(void) /譯碼 void SACM_A2000_FillQueue(unsigned int encoded-data)/填充隊列 unsigned int SACM_A2000_TestQueue(void) /測試隊列 C
6、all F_FIQ_Service_ SACM_A2000 /中斷服務(wù)函數(shù),SACM_S480 該壓縮算法壓縮比較大80:3, 存儲容量大,音質(zhì)介于A2000和S240之間,適用于語音播放, 如“文曲星”詞庫 其相關(guān)API函數(shù)如下所示: int SACM_S480_Initial(int Init_Index) /初始化 void SACM_ S480_ServiceLoop(void) /獲取語音資料,填入譯碼隊列 void SACM_ S480_Play(int Speech_Index, int Channel, int Ramp_Set) void SACM_ S480_Stop(vo
7、id) /停止播放 void SACM_S480_Pause (void) /暫停播放 void SACM_S480_Resume(void) /暫停后恢復(fù) void SACM_S480_Volume(Volume_Index) /音量的控制 unsigned int SACM_S480_Status(void) /獲取模塊的狀態(tài) Call F_FIQ_Service_ SACM_S480 /中斷服務(wù)函數(shù),SACM_S240 該壓縮算法的壓縮比較大80:1.5,價格低,適用于對保真度要求不高的場合, 如玩具類產(chǎn)品的批量生產(chǎn),編碼率僅為2.4 Kbps。 其相關(guān)API函數(shù)如下所示: int SA
8、CM_S240_Initial(int Init_Index) /初始化 void SACM_ S240_ServiceLoop(void) /獲取語音資料,填入譯碼隊列 void SACM_ S240_Play(int Speech_Index, int Channel, int Ramp_Set) /播放 void SACM_ S240_Stop(void) /停止播放 void SACM_S240_Pause (void) /暫停播放 void SACM_S240_Resume(void) /暫停后恢復(fù) void SACM_S240_Volume(Volume_Index) /音量控制
9、unsigned int SACM_S240_Status(void) /獲取模塊狀態(tài) Call F_FIQ_Service_ SACM_S240 /中斷服務(wù)函數(shù),SACM_MS01 該算法較繁瑣,但只要具備音樂理論、配器法和聲學(xué)知識了解SPCE編曲格式者均可嘗試。遵照SPCE編曲格式 用DTMMIDI(音源MIDI鍵盤作曲軟件)的方法演奏自動生成*.mid文件,再用凌陽MIDI2POP.EXE轉(zhuǎn)成*.pop文件。但需要專業(yè)設(shè)備與軟件,具備鍵盤樂演藝技能,了解SPCE編曲格式。對于初學(xué)者或非專業(yè)用途一般了解放音或錄放音即可。 其相關(guān)API函數(shù)如下所示: void SACM_MS01_Initi
10、al(int Init_Index) /初始化 void SACM_ MS01_ServiceLoop(void) /獲取語音資料,填入譯碼隊列 void SACM_ MS01_Play(int Speech_Index, int Channel, int Ramp_Set) /播放 void SACM_ MS01_Stop(void) /停止播放 void SACM_ MS01_Pause (void) /暫停播放 void SACM_ MS01_Resume(void) /暫停后恢復(fù) void SACM_ MS01_Volume(Volume_Index) /音量控制 unsigned i
11、nt SACM_ MS01_Status(void) /獲取模塊狀態(tài) void SACM_ MS01_ChannelOn(int Channel) /接通通道 void SACM_ MS01_ChannelOff(int Channel) /關(guān)閉通道 void SACM_ MS01_Setlnstrument(Channel,Instrument,Mode) /設(shè)置樂曲配器類型 中斷服務(wù)函數(shù): ASM: F_FIQ_Service_ SACM_MS01 ASM: F_IRQ2_Service_ SACM_MS01 ASM: F_IRQ4_Service_ SACM_MS01,SACM_DVR
12、SACM-DVR具有錄音和放音功能,并采用SACM_A2000的算法,錄音時采用16K資料率及8K采樣率獲取語音資源,經(jīng)過SACM_A2000壓縮后存儲在擴(kuò)展的SRAM 628128A里,錄滿音后自動開始放音。 其相關(guān)API函數(shù)如下所示: int SACM_DVR_Initial(int Init_Index) /初始化 void SACM_DVR_ServiceLoop(void) /獲取資料,填入譯碼隊列 void SACM_DVR_Encode(void) /錄音 SACM_DVR_StopEncoder(); /停止編碼 SACM_DVR_InitEncoder(RceMonitorO
13、n) /初始化編碼器 void SACM_DVR_Stop(void) /停止錄音 void SACM_DVR_Play(void) /開始播放 unsigned int SACM_DVR _Status(void) /獲取SACM_DVR模塊的狀態(tài) void SACM_DVR _InitDecoder(int Channel) /開始譯碼 void SACM_DVR _Decode(void) /獲取語音資料并譯碼,中斷播放 SACM_DVR_StopDecoder(); /停止解碼 unsigned int SACM_DVR _ TestQueue(void) /獲取語音隊列狀態(tài) int SACM_DVR _Fetchqueue(void) /獲取錄音編碼數(shù)據(jù) void SACM_DVR_FillQueue(unsigned int encoded-data) /填充資料到語音隊列,等待播放 int GetResource(long Address) (Manual)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年寧波北侖區(qū)戚家山街道編外工作人員招聘1人考試備考題庫及答案解析
- 2026銀川市金鳳區(qū)天匯里幼兒園教育集團(tuán)招聘7人考試備考題庫及答案解析
- 2026湖南常德市桃源縣公安局警務(wù)輔助人員招聘20人筆試模擬試題及答案解析
- 2026福建投資集團(tuán)第一批集中招聘考試備考試題及答案解析
- 2026年安徽省能源集團(tuán)有限公司所屬子公司社會招聘考試備考試題及答案解析
- 2026年甘肅省武威市古浪縣黑松驛鎮(zhèn)選聘大學(xué)生村文書筆試備考試題及答案解析
- 2026年昭通市鹽津縣公安局警務(wù)輔助人員招聘(21人)考試參考題庫及答案解析
- 2026備戰(zhàn)中考【語文考點(diǎn)專練:“非連續(xù)性文本閱讀”專題】精練(含答案)
- 2026浙江紹興市強(qiáng)制醫(yī)療所招聘編外人員2人考試參考題庫及答案解析
- 2026江西省贛勤發(fā)展集團(tuán)有限公司社會招聘6人考試備考題庫及答案解析
- TD/T 1012-2016 土地整治項目規(guī)劃設(shè)計規(guī)范(正式版)
- 2024年江西省公安機(jī)關(guān)警務(wù)輔助人員條例訓(xùn)練題庫321題及答案
- 個體戶入股合作協(xié)議書范本
- 質(zhì)量管理五大工具之一SPC
- (正式版)JBT 14587-2024 膠體鉛酸蓄電池 技術(shù)規(guī)范
- JC∕T 482-2022 聚氨酯建筑密封膠
- 《繼電保護(hù)智能運(yùn)維檢修 第5部分:在線監(jiān)測站端信息描述》
- 中國憲法 中英對照
- 動物園市場競爭中的差異化策略
- 單井壓裂應(yīng)急預(yù)案
- 深圳市南山區(qū)雨污分流施工報價表
評論
0/150
提交評論