第6章音頻壓縮編碼技術(shù)及其國(guó)際_第1頁
第6章音頻壓縮編碼技術(shù)及其國(guó)際_第2頁
第6章音頻壓縮編碼技術(shù)及其國(guó)際_第3頁
第6章音頻壓縮編碼技術(shù)及其國(guó)際_第4頁
第6章音頻壓縮編碼技術(shù)及其國(guó)際_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章

音頻壓縮編碼技術(shù)及其國(guó)際標(biāo)準(zhǔn)6.1概述6.2MPEG音頻壓縮編碼6.3DolbyAC-3數(shù)字音頻壓縮編碼技術(shù)6.1.1人的聽覺生理——心理特性6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型6.1.3音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)介紹6.1概述聲音(Audio)的傳送是通信中不可或缺的內(nèi)容電視及圖像通信中除了傳送圖像外,傳送聲音也是極為重要的。

如在會(huì)議電視中,由于通信線路帶寬的限制,圖像是可以跳幀的,每秒鐘能傳10幀已經(jīng)很不錯(cuò)了,但語音的傳送卻不可以是斷續(xù)的,而且要有較高的音質(zhì)。6.1概述數(shù)字聲音信號(hào)的數(shù)據(jù)量相比數(shù)字視頻要小很多,但是如果不壓縮的話,對(duì)傳輸和存儲(chǔ)的壓力還是很大。

數(shù)字聲音信號(hào)與圖像信號(hào)一樣,通過取樣、量化、編碼后的數(shù)據(jù)也非常大。如CD機(jī),采用44.1kHz取樣,16bit量化,即使單聲道,其編碼數(shù)據(jù)也達(dá)到:44.1X16=705.6kbit/s傳輸與存儲(chǔ)均有很大困難。6.1概述

聲音編碼(AudioCoding)是一類高保真的音頻編碼,它的帶寬應(yīng)為20Hz至20KHz。

但在許多場(chǎng)合,主要是傳送語音,而不是主要傳送音樂,故音頻帶寬在50Hz至7KHz就夠了。在電話通信中,其帶寬只有300Hz至3.4KHz,在聲音編碼中,主要是傳送語音的一類編碼稱之為語音編碼(SpeechCoding)。在電視電話及會(huì)議電視中主要是語音編碼,而數(shù)字電視、高清晰度電視中的伴音卻是屬于高保真度的音頻編碼。

6.1概述聲音簡(jiǎn)介聲音是聽覺器官對(duì)聲波的感知聲波是通過空氣或其他介質(zhì)傳播的連續(xù)振動(dòng)6.1概述聲波具有普通波所具有的特性反射reflection折射refraction衍射diffraction干涉interference共振resonance聲強(qiáng)、響度:聲波的壓強(qiáng),或能量,或振幅音高、音調(diào):聲波的頻率音色、音品:聲波的諧波頻譜和包絡(luò)決定6.1概述6.1概述

聲音信息能夠壓縮的基本依據(jù)是(1)聲音信息的冗余度(2)人類的聽覺特性

6.1概述(1)聲音信息的冗余度從信息保持的角度講,只有當(dāng)信源本身具有冗余度,才能對(duì)其壓縮。

語音和音樂信號(hào)中正是存在著時(shí)域信息冗余及頻域信息冗余,所以可以進(jìn)行壓縮。這是對(duì)音頻信號(hào)進(jìn)行壓縮的一個(gè)理論基礎(chǔ)。6.1概述(2)人類的聽覺特性

語音和音樂信號(hào)最終是傳送給人聽的,人的聽覺生理—心理特性在整個(gè)音頻傳輸過程中起著重要的作用。

由于人們的聽覺系統(tǒng)存在著某些不敏感效應(yīng),對(duì)于某些情況下的音頻不能被感知,因此從感知效果來看,這些不敏感的音頻分量可認(rèn)為是知覺冗余。

如果將這部分冗余壓縮掉,可提高編碼效率。這是音頻壓縮的另一個(gè)理論基礎(chǔ)。6.1概述音頻數(shù)據(jù)壓縮一般有兩種方法:

(1)利用信號(hào)本身的統(tǒng)計(jì)特性,在完全不丟失信息的情況下,進(jìn)行高效的熵編碼(平均信息量編碼);

(2)利用人們對(duì)音頻信號(hào)的感知特性,通過省略人們所不能分辨或不敏感的信息來壓縮信息量,這就是知覺編碼。

6.1概述音頻數(shù)據(jù)壓縮一般有兩個(gè)途徑

利用信號(hào)本身的統(tǒng)計(jì)特性,在完全不丟失信息的情況下,進(jìn)行高效的熵編碼

(平均信息量編碼);利用人們對(duì)音頻信號(hào)的感知特性,通過省略人們所不能分辨或不敏感的信息來壓縮信息量,這就是知覺編碼。針對(duì)音頻中存在的冗余,目前實(shí)用的有熵編碼和知覺編碼兩種方法。6.1概述聲音質(zhì)量評(píng)價(jià)的兩種方法客觀質(zhì)量度量用信噪比(SNR)主觀質(zhì)量度量專家打分有時(shí)同時(shí)采取兩種方法評(píng)估,有時(shí)以主觀質(zhì)量度量為主6.1概述信噪比SNR(signal-to-noiseratio)SNR表示信號(hào)能量和噪聲能量的比,單位為分貝(db)

6.1概述主觀平均分(meanopinionscore,MOS)

分?jǐn)?shù)質(zhì)量等級(jí)失真級(jí)別5優(yōu)(Excellent)無察覺4良(Good)(剛)察覺但不討厭3中(Fair)(察覺)有點(diǎn)討厭2差(Poor)討厭但不反感1劣(Bad)極討厭(令人反感)表:

聲音質(zhì)量MOS評(píng)分標(biāo)準(zhǔn)6.1概述對(duì)響度的感知聲音的響度就是聲音的強(qiáng)弱在物理上,用聲強(qiáng)W/cm2或聲壓dyn/cm2度量在心理上,用phon(方)或sone(宋)度量人耳的聽覺范圍聽閾:人耳朵剛可聽見的聲音強(qiáng)度痛域:使人耳感到疼痛的聲音強(qiáng)度聽覺范圍:聽閾和痛域之間6.1.1

人的聽覺生理——心理特性“聽閾—頻率”曲線和“痛閾—頻率”曲線6.1.1

人的聽覺生理——心理特性

人耳能夠感知的頻率范圍約20-20000Hz高保真聲音(high-fidelityaudio):10~20000Hz聲音(audio/sound):20~20000Hz話音(speech/voice):300~3400Hz亞音/次音(subsonic):<20Hz超聲(ultrasonic):>20000Hz6.1.1

人的聽覺生理——心理特性

對(duì)頻率的感知表現(xiàn)為音高客觀上用頻率表示聲音的音高,單位是Hz主觀感覺的音高單位則是“美(Mel)”主觀音高與客觀音高是對(duì)數(shù)關(guān)系6.1.1

人的聽覺生理——心理特性“音高—頻率”曲線6.1.1

人的聽覺生理——心理特性

臨界頻帶人耳剛剛可以感知兩種頻率的聲音有差別的頻率范圍臨界頻帶的單位叫做Bark(巴克),1Bark等于一個(gè)臨界頻帶的寬度。通常認(rèn)為音頻有25個(gè)臨界頻帶,見表。臨界頻帶的寬度隨頻率的變化而變化6.1.1

人的聽覺生理——心理特性6.1.1

人的聽覺生理——心理特性

掩蔽效應(yīng)一個(gè)聲音阻礙聽覺系統(tǒng)感受另一個(gè)聲音的現(xiàn)象前者稱為掩蔽聲音(maskingtone)后者稱為被掩蔽聲音(maskedtone)在音頻信號(hào)的知覺編碼中,利用了人們聽覺的生理—心理特性對(duì)感知的影響,例如人耳的掩蔽效應(yīng)、頻域靈敏度以及相位的不敏感特性等。聽覺的掩蔽效應(yīng)是聲音編碼的基礎(chǔ),掩蔽效應(yīng)既和頻率域有關(guān),亦和時(shí)間域有關(guān)。6.1.1

人的聽覺生理——心理特性人的聽覺生理--心理特性1)頻譜掩蔽效應(yīng)2)時(shí)間掩蔽效應(yīng)3)方向掩蔽效應(yīng)6.1.1

人的聽覺生理——心理特性

1)頻譜掩蔽效應(yīng)一個(gè)強(qiáng)純音掩蔽了其附近同時(shí)發(fā)聲的弱純音的特性,也稱同時(shí)掩蔽(simultaneousmasking)

圖6.1中示出若有一個(gè)聲壓強(qiáng)度達(dá)70dB頻率1KHz的純音出現(xiàn)時(shí),處于1KHz鄰近某一頻帶內(nèi)強(qiáng)度較小的聲音信號(hào)人耳是聽不見的,即被1KHz純音掩蔽掉了。圖中示出了1KHz純音的掩蔽閾曲線,一般一個(gè)純音的聲壓強(qiáng)度越大,對(duì)周圍頻率的掩蔽作用越強(qiáng)。由于處于掩蔽閾曲線下的聲音聽不見,故這些信息是多余的,無需參與編碼輸出。6.1.1

人的聽覺生理——心理特性圖6.1人耳聽覺的頻率特性曲線頻域掩蔽特性頻率越接近,掩蔽效果越明顯高頻方向的掩蔽效果強(qiáng)于低頻方向不同純音的掩蔽效應(yīng)曲線6.1.1

人的聽覺生理——心理特性信掩比SMR(signal-to-maskratio)子帶的信號(hào)能量除以子帶的最小掩蔽閾值SMR小于等于1的子帶信號(hào)是聽不到的噪掩比NMR(noise-to-maskratio)噪聲除以最小掩蔽閾值噪聲是量化帶來的,通過控制量化步長(zhǎng)可以控制量化噪聲,使噪聲能夠被掩蔽掉這里所說的掩蔽閾值是全局掩蔽閾值,全局掩蔽需要根據(jù)實(shí)際情況計(jì)算得到。6.1.1

人的聽覺生理——心理特性2)時(shí)間掩蔽效應(yīng)(TemporalMaskingEffect)

除了在強(qiáng)的聲音信號(hào)出現(xiàn)的同時(shí)弱信號(hào)會(huì)被掩蔽掉(稱為同時(shí)掩蔽)外,在強(qiáng)的聲音信號(hào)出現(xiàn)之前或之后的短暫時(shí)間內(nèi)已存在的弱音信號(hào)也會(huì)被強(qiáng)信號(hào)掩蔽掉,分別稱為前掩蔽和后掩蔽。如圖6.2所示。這種現(xiàn)象稱時(shí)間掩蔽效應(yīng)

在聲音編碼時(shí),將時(shí)間上相繼的一些取樣值合并為組塊以降低碼率,就是利用上述人類聽覺的時(shí)間掩蔽特性而確定的。6.1.1

人的聽覺生理——心理特性圖6.2時(shí)間掩蔽效應(yīng)6.1.1

人的聽覺生理——心理特性前掩蔽通常有3ms—20ms,

后掩蔽可以持續(xù)50ms—100ms

產(chǎn)生時(shí)域掩蔽的主要原因人的大腦處理信息需要花費(fèi)一定的時(shí)間6.1.1

人的聽覺生理——心理特性3)方向掩蔽效應(yīng)

人耳除具有聽覺掩蔽效應(yīng)外,還不能分別判斷頻率接近的高頻聲音信號(hào)的方向,在聲音編碼中可利用此特性,把多個(gè)聲道的高頻部分耦合到一個(gè)公共聲道,以達(dá)到壓縮編碼的目的。6.1.1

人的聽覺生理——心理特性

6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型3)參數(shù)編碼1)熵編碼2)波形編碼4)混合編碼典型的聲音采樣參數(shù)質(zhì)量采樣頻率(kHz)采樣深度(bit)單道聲/立體聲(未壓縮的)數(shù)據(jù)率(kb/s)頻率范圍(Hz)電話*88單道聲64.0200~3400AM11.0258單道聲88.220~15000FM22.05016立體聲705.650~7000CD44.116立體聲1411.220~20000DAT4816立體聲1536.020~20000*電話使用μ律編碼,動(dòng)態(tài)范圍為13位,壓縮后的樣本精度為8位6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型

數(shù)字音頻信號(hào)的壓縮編碼主要分為熵編碼、波形編碼、參數(shù)編碼、混合編碼四種類型。1)熵編碼

音頻信息與視頻信息的熵編碼基本原理相同,主要包括霍夫曼編碼、算術(shù)編碼與游程編碼。

6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型2)波形編碼

當(dāng)音頻信號(hào)數(shù)字化后,考慮人類的聽覺特性,使編碼信號(hào)盡可能既與原始輸入信號(hào)相匹配,又能適應(yīng)人們的應(yīng)用要求。波形編碼主要包括全頻帶編碼、子帶編碼和矢量量化編碼,主要有:PCM(脈沖編碼調(diào)制)、DPCM(差分脈沖編碼調(diào)制)、ADPCM(自適應(yīng)差分脈沖編碼調(diào)制)、SBC(子帶編碼)。波形編碼能夠在高碼率的條件下獲得高質(zhì)量的音頻信號(hào),因而適于高保真語音及音樂信號(hào)的壓縮編碼。6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型DPCM(differentialpulsecodemodulation)基本思想:根據(jù)過去的樣本去估算下一個(gè)樣本信號(hào)的幅度大小,這個(gè)值稱為預(yù)測(cè)值,然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼DPCM與PCM的不同可適應(yīng)大范圍變化的輸入信號(hào)

6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型ADPCM(adaptivedifferencepulsecodemodulation)核心思想利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階去編碼小的差值,使用大的量化階去編碼大的差值使用過去的樣本值估算下一個(gè)輸入樣本的預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小接收端的譯碼器使用與發(fā)送端相同的算法,利用傳送來的信號(hào)來確定量化階和預(yù)測(cè)值6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型SBC(sub-bandcoding)用一組帶通濾波器把輸入聲音信號(hào)的頻帶分成若干個(gè)連續(xù)的頻段,每個(gè)頻段稱為子帶。對(duì)每個(gè)子帶中的聲音信號(hào)采用單獨(dú)的編碼方案去編碼在信道上傳送時(shí),將每個(gè)子帶的代碼復(fù)合在一起;在接收端譯碼時(shí),將每個(gè)子帶的代碼單獨(dú)譯碼,然后把它們組合起來,還原成原來的聲音信號(hào)6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型好處有兩個(gè)根據(jù)每個(gè)子帶信號(hào)的特點(diǎn)進(jìn)行自適應(yīng)控制量化階根據(jù)每個(gè)子帶信號(hào)在感覺上的重要性進(jìn)行自適應(yīng)控制6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型LPC(linearpredictivecoding)話音壓縮技術(shù)將話音生成機(jī)理模型化為若干參數(shù)使用線性預(yù)測(cè)分析話音參數(shù)話音合成器根據(jù)參數(shù)合成話音可以達(dá)到極低的碼率,但是質(zhì)量也比較低,而且無法提高6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型3)參數(shù)編碼

參數(shù)編碼是指使用合適的模型參數(shù)與參考激勵(lì)信號(hào)來模擬音頻信號(hào)進(jìn)行編碼,當(dāng)聲音重放時(shí),根據(jù)這些參數(shù)重建音頻信號(hào),這就是通常所說的聲碼器(Vocoder)。參數(shù)編碼壓縮比很高,但計(jì)算量也很大,因而不適合高保真度要求的應(yīng)用場(chǎng)合。6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型4)混合編碼

混合編碼充分吸收了波形編碼與參數(shù)編碼的優(yōu)點(diǎn),并將二者相結(jié)合,它包括多脈沖線性預(yù)測(cè)編碼(MP-LPC)、矢量和激勵(lì)線性預(yù)測(cè)編碼(VSELP)、碼本激勵(lì)線性預(yù)測(cè)編碼(CELP)、短時(shí)延碼本激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)、長(zhǎng)時(shí)延線性預(yù)測(cè)規(guī)則碼激勵(lì)(RPE-LTP)等。表6.1列出了音頻信號(hào)數(shù)字壓縮編碼算法及其特性6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型表6.1音頻信號(hào)數(shù)字壓縮編碼算法及其特性

算法

稱數(shù)據(jù)率(kb/s)

標(biāo)準(zhǔn)

應(yīng)用質(zhì)量

波形編碼PCM

均勻量化

公共網(wǎng)

ISDN

配音4.0~4.5

μ(A)

μ(A)64G.711APCM

自適應(yīng)量化DPCM

差值量化ADPCM

自適應(yīng)差值量化32G.721SB-ADPCM

子帶一自適應(yīng)差值量化64G.7225.3,6.3G.723參數(shù)編碼LPC

線性預(yù)測(cè)編碼2.4保密話聲2.5~3.5

混合編碼CELPC

碼激勵(lì)LPC4.6移動(dòng)通信VSELP

矢量和激勵(lì)LPC8語音郵件4.0~3.7RPE-LTP長(zhǎng)時(shí)預(yù)測(cè)規(guī)則碼激勵(lì)13.2G.728ISDNLD-CELP

短延時(shí)碼激勵(lì)LPC16G.729MPEG

多子帶感知編碼128MPEGCD5.0杜比AC-3

感知編碼AC-3

音響5.0部分音頻編碼技術(shù)質(zhì)量比較編碼器MOS分64kb/s脈沖編碼調(diào)制(PCM)4.332kb/s自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)4.116kb/s低時(shí)延碼激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)4.08kb/s碼激勵(lì)線性預(yù)測(cè)編碼(CELP)3.73.8kb/碼激勵(lì)線性預(yù)測(cè)編碼(CELP)3.02.4kb/s線性預(yù)測(cè)編碼(LPC)2.5表:部分編碼器的MOS分

6.1.2數(shù)字音頻信號(hào)壓縮編碼的主要類型

1)電話質(zhì)量的音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)

電話質(zhì)量語音信號(hào)的頻率范圍為300Hz~3400Hz,采用標(biāo)準(zhǔn)的脈沖編碼調(diào)制(PCM),采樣頻率為8kHz、8bit量化時(shí),碼率為64kb/s。

1972年CCITT(現(xiàn)為ITU-T)制定的PCM標(biāo)準(zhǔn)G.711正是針對(duì)電話質(zhì)量語音信號(hào)的壓縮編碼標(biāo)準(zhǔn),其碼率為64kb/s,采用非線性量化,質(zhì)量相當(dāng)于12bit線性量化。6.1.3音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)介紹

1)電話質(zhì)量的音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)

1984年,CCITT公布了自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)標(biāo)準(zhǔn)G.721,碼率為32kb/s,ADPCM能夠?qū)χ械入娫捹|(zhì)量要求的信號(hào)進(jìn)行高效編碼。

6.1.3音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)介紹

1992年,CCITT制定了短時(shí)延碼本激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)標(biāo)準(zhǔn)G.728,碼率為16kb/s,其質(zhì)量與32kb/s的G.721標(biāo)準(zhǔn)大致相當(dāng)。

碼本激勵(lì)線性預(yù)測(cè)編碼(CELP)實(shí)際上是一個(gè)閉環(huán)LPC系統(tǒng),由輸入語音信號(hào)確定最佳參數(shù),再根據(jù)最小誤差準(zhǔn)則從碼本中找出最佳激勵(lì)碼本矢量。CELP具有較強(qiáng)的抗干擾能力,它在4~16kb/s的傳輸速率下可獲得較高質(zhì)量的語音信號(hào)。6.1.3音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)介紹1988年,歐洲數(shù)字移動(dòng)特別工作組制定了采用長(zhǎng)時(shí)延線性預(yù)測(cè)規(guī)則碼本激勵(lì)(RPE-LTP)技術(shù)的GSM標(biāo)準(zhǔn),碼率為13kb/s。1989年,美國(guó)制定了采用矢量和激勵(lì)線性預(yù)測(cè)技術(shù)(VSELP)的用于數(shù)字移動(dòng)通信的語音標(biāo)準(zhǔn)CTIA,碼率為8kb/s。6.1.3音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)介紹2)調(diào)幅廣播質(zhì)量的音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)

調(diào)幅廣播質(zhì)量音頻信號(hào)的頻率范圍為50Hz~7kHz,CCITT于1988年制定了G.722標(biāo)準(zhǔn),它采用16kHz采樣、14bit量化,信號(hào)數(shù)據(jù)速率為224kb/s,通過采用子帶編碼方法將輸入音頻信號(hào)經(jīng)濾波器分為高、低子帶,再分別進(jìn)行ADPCM編碼,隨后混合形成輸出碼流,ADPCM可將224kb/s的碼率壓縮為64kb/s,最后進(jìn)行數(shù)據(jù)插入(最高插入速率可達(dá)16kb/s)。6.1.3音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)介紹

3)高保真立體聲音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)

高保真度聲音信號(hào)如CD音質(zhì)的數(shù)字音頻信號(hào),取樣頻率取為44.1KHz,量化級(jí)數(shù)取為16bit時(shí),雙聲道的數(shù)碼率即為1.4Mb/s。對(duì)于高保真度的聲音信號(hào)進(jìn)行壓縮編碼的標(biāo)準(zhǔn)主要有以下幾種:6.1.3音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)介紹

(1)應(yīng)用在DAB(DigitalAudioBroadcasting)中的碼率壓縮技術(shù)—MUSICAM及ASPEC

MUSICAM(Masking—PatternAdaptedUniversalSubbandIntegratedCodingAndMultiplexingencoding,掩蔽型自適應(yīng)通用子帶綜合編碼和復(fù)用)是歐洲尤里卡147計(jì)劃開發(fā)成功的。該編碼方式利用人耳的聽覺特性,把聲音信號(hào)分割為4至64個(gè)子帶,以不同的量化特性對(duì)各子帶加以量化。利用人耳的掩蔽效應(yīng),對(duì)在掩蔽閾以上的聲音信號(hào)進(jìn)行編碼傳輸,略去對(duì)掩蔽閾以下的聲音信號(hào)進(jìn)行編碼,使碼率大大減小。6.1.3音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)介紹

ASPEC(AudioSpectralPercepturalEntropyCoding,音頻頻譜聽覺熵編碼),對(duì)于16bit輸入信號(hào)先以TDAC(TimeDomainAliasingCancellation,時(shí)域混疊消除)進(jìn)行處理,然后通過MDCT(ModifiedDCT,改進(jìn)的離散余弦變換)變換到頻域中去,另一方面從經(jīng)過了FFT的信號(hào)來確定各臨界帶寬的掩蔽閾,再把兩者結(jié)合起來進(jìn)行量化,編成熵碼(霍夫曼碼)。

上述兩種編碼的碼率都能從1.4Mb/s降到128Kb/s、96Kb/s或64Kb/s。6.1.3音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)介紹(2)MPEG聲音編碼算法

1989年ISO/IEC/MPEG征求了14種方案,按算法分類保留了ASPEC、ATAC(AdaptiveTransformAudioCoding)、MUSICAM及SB(Subband)/ADPCM等4種方案,經(jīng)過在多種碼率下的一系列測(cè)試,結(jié)果ASPEC和MUSICAM在每聲道96kb/s-128kb/s碼率下具有優(yōu)越性能,因此便以這兩種算法為基礎(chǔ)確定了3層算法(La

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論