多媒體技術(shù)基礎(chǔ)03數(shù)字聲音編碼ppt課件

上傳人：闖*** IP屬地：廣東上傳時(shí)間：2020-05-12 格式：PPT 頁(yè)數(shù)：37 大?。?89.50KB 積分：25 舉報(bào) 版權(quán)申訴

多媒體技術(shù)基礎(chǔ)03數(shù)字聲音編碼ppt課件_第2頁(yè)

多媒體技術(shù)基礎(chǔ)03數(shù)字聲音編碼ppt課件_第3頁(yè)

多媒體技術(shù)基礎(chǔ)03數(shù)字聲音編碼ppt課件_第4頁(yè)

多媒體技術(shù)基礎(chǔ)03數(shù)字聲音編碼ppt課件_第5頁(yè)

已閱讀5頁(yè)，還剩32頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第3章數(shù)字聲音編碼,3章數(shù)字聲音編碼,2,第3章數(shù)字聲音編碼目錄,3.1聲音簡(jiǎn)介3.1.1聲音是什么3.1.2聲音的頻率范圍3.2聲音信號(hào)數(shù)字化3.2.1從模擬過(guò)渡到數(shù)字3.2.2模擬信號(hào)與數(shù)字信號(hào)3.2.3聲音信號(hào)數(shù)字化3.2.4聲音質(zhì)量與數(shù)據(jù)率3.3聲音質(zhì)量的MOS評(píng)分標(biāo)準(zhǔn)3.4脈沖編碼調(diào)制(PCM)3.4.1PCM的概念3.4.2均勻量化3.4.3非均勻量化3.5PCM在通信中的應(yīng)用3.5.1頻分多路復(fù)用3.5.2時(shí)分多路復(fù)用3.5.3數(shù)字通信線路的數(shù)據(jù)傳輸率,3.6增量調(diào)制與自適應(yīng)增量調(diào)制3.6.1增量調(diào)制(DM)3.6.2自適應(yīng)增量調(diào)制(ADM)3.7自適應(yīng)差分脈沖編碼調(diào)制3.7.1自適應(yīng)脈沖編碼調(diào)制(APCM)的概念3.7.2差分脈沖編碼調(diào)制(DPCM)的概念3.7.3自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)3.7.4G.726ADPCM編譯碼器3.8G.722SB-ADPCM編譯碼器3.8.1子帶編碼(SBC)3.8.2子帶-自適應(yīng)差分脈沖編碼調(diào)制(SB-ADPCM)3.9線性預(yù)測(cè)編碼(LPC)的概念3.10GSM聲音簡(jiǎn)介3.11話音編碼標(biāo)準(zhǔn)摘要3.11.1編碼算法的性能3.11.2話音編碼標(biāo)準(zhǔn),3章數(shù)字聲音編碼,3,3.1聲音簡(jiǎn)介,聲音是什么聲音是聽覺器官對(duì)聲波的感知，而聲波是通過(guò)空氣或其他媒體傳播的連續(xù)振動(dòng)聲音的強(qiáng)弱體現(xiàn)在聲波壓力的大小上，音調(diào)的高低體現(xiàn)在聲音的頻率上聲音用電壓信號(hào)表示時(shí)，聲音信號(hào)在時(shí)間和幅度上都是連續(xù)的模擬信號(hào)，如圖3-1所示聲波具有普通波所具有的特性，例如反射(reflection)、折射(refraction)和衍射(diffraction)等,圖3-1聲音是一種連續(xù)的波,3章數(shù)字聲音編碼,4,3.1聲音簡(jiǎn)介(續(xù)1),聲音的頻率高保真聲音(high-fidelityaudio):1020000Hz聲音(audio):2020000Hz話音(speech):3003000/3400Hz亞音/次音(subsonic):20000Hz,3章數(shù)字聲音編碼,5,3.2聲音信號(hào)數(shù)字化,數(shù)字化的概念采樣和量化連續(xù)時(shí)間的離散化通過(guò)采樣來(lái)實(shí)現(xiàn)，就是每隔相等的一段時(shí)間采樣一次，這種采樣稱為均勻采樣(uniformsampling)連續(xù)幅度的離散化通過(guò)量化(quantization)來(lái)實(shí)現(xiàn)，就是把信號(hào)的強(qiáng)度劃分成一小段一小段，如果幅度的劃分是等間隔的，就稱為線性量化，否則就稱為非線性量化。圖3-2表示了聲音數(shù)字化的概念,圖3-2聲音的采樣和量化,采樣,3章數(shù)字聲音編碼,6,3.2聲音信號(hào)數(shù)字化(續(xù)1),采樣頻率采樣頻率由根據(jù)奈奎斯特理論(Nyquisttheory)確定奈奎斯特理論指出，采樣頻率不應(yīng)低于聲音信號(hào)最高頻率的兩倍，這樣就能把以數(shù)字表達(dá)的聲音還原成原來(lái)的聲音，這叫做無(wú)損數(shù)字化(losslessdigitization)假設(shè)被采樣信號(hào)的最高頻率為fmax，則采樣定律可用公式表示為,3章數(shù)字聲音編碼,7,3.2聲音信號(hào)數(shù)字化(續(xù)2),采樣精度度量聲音波形幅度的精確程度，用每個(gè)聲音樣本的位數(shù)(即bps)表示例如每個(gè)聲音樣本用16位表示，測(cè)得的聲音樣本值是在065535范圍里的數(shù)，它的精度是1/65536精度是在模擬信號(hào)數(shù)字化過(guò)程中度量模擬信號(hào)的最小單位，因此也稱量化階(quantizationstepsize)01V的電壓用256個(gè)數(shù)表示時(shí)，量化階等于1/256V樣本位數(shù)的大小影響到聲音的質(zhì)量，位數(shù)越多，聲音質(zhì)量越高，所需存儲(chǔ)空間也越多；位數(shù)越少，聲音質(zhì)量就越低，所需存儲(chǔ)空間也越少,3章數(shù)字聲音編碼,8,3.2聲音信號(hào)數(shù)字化(續(xù)3),采樣精度的另一種表示方法是信號(hào)噪聲比，簡(jiǎn)稱為信噪比(signal-to-noiseratio，SNR)，并用下式計(jì)算,其中，Vsignal表示信號(hào)電壓，Vnoise表示量化噪聲電壓(模擬信號(hào)的采樣值和與它最接近的數(shù)字?jǐn)?shù)值之間的差值)，SNR的單位為分貝(db),3章數(shù)字聲音編碼,9,3.2聲音信號(hào)數(shù)字化(續(xù)4),聲音質(zhì)量和數(shù)據(jù)率質(zhì)量度量,*AM:amplitudemodulationCD:compactdiscaudioFM:frequencymodulationDAT:digitalaudiotape,3章數(shù)字聲音編碼,10,3.3聲音質(zhì)量的MOS評(píng)分標(biāo)準(zhǔn),聲音質(zhì)量的衡量方法聲音帶寬法等級(jí)由高到低依次是DAT、CD、FM、AM和數(shù)字電話主觀質(zhì)量度量度量方法類似于電視節(jié)目中的歌手比賽，由評(píng)委對(duì)每個(gè)歌手的表現(xiàn)進(jìn)行評(píng)分，然后求出平均值有時(shí)同時(shí)采取兩種方法評(píng)估，有時(shí)以主觀質(zhì)量度量為主,3章數(shù)字聲音編碼,11,3.3聲音質(zhì)量的MOS評(píng)分標(biāo)準(zhǔn)(續(xù)),主觀平均分(meanopinionscore，MOS)對(duì)聲音主觀質(zhì)量度量比較通用的標(biāo)準(zhǔn)是5分制，各檔次的評(píng)分標(biāo)準(zhǔn)見表3-2,表3-2聲音質(zhì)量MOS評(píng)分標(biāo)準(zhǔn),3章數(shù)字聲音編碼,12,3.4脈沖編碼調(diào)制(PCM),脈沖編碼調(diào)制(PCM)的概念PCM是pulsecodemodulation的縮寫概念上最簡(jiǎn)單、理論上最完善、最早研制成功、使用最為廣泛、數(shù)據(jù)量最大的編碼系統(tǒng),圖3-3PCM編碼原理框圖,輸入是模擬信號(hào)，輸出是PCM樣本。防失真濾波器：低通濾波器，用來(lái)濾除聲音頻帶以外的信號(hào)波形編碼器：可理解為采樣器量化器：可理解為“量化階大小(step-size)”生成器或者稱為“量化間隔”生成器,3章數(shù)字聲音編碼,13,3.4脈沖編碼調(diào)制(續(xù)1),PCM實(shí)際上是模擬信號(hào)數(shù)字化模擬聲音數(shù)字化的兩個(gè)步驟：第一步是采樣，就是每隔一段時(shí)間間隔讀一次聲音的幅度第二步是量化，就是把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換成數(shù)字值量化的方法主要有均勻量化和非均勻量化,3章數(shù)字聲音編碼,14,圖3-4均勻量化,3.4脈沖編碼調(diào)制(續(xù)2),均勻量化采用相等的量化間隔對(duì)采樣得到的信號(hào)作量化。量化誤差(量化噪聲)：量化后的樣本值Y和原始值X的差e=y-x。,3章數(shù)字聲音編碼,15,3.4脈沖編碼調(diào)制(續(xù)3),非均勻量化大的輸入信號(hào)采用大的量化間隔，小的輸入信號(hào)采用小的量化間隔可在滿足精度要求的情況下用較少的位數(shù)來(lái)表示聲音數(shù)據(jù)還原時(shí)，采用相同的規(guī)則,圖3-5非均勻量化,3章數(shù)字聲音編碼,16,3.5PCM在通信中的應(yīng)用,3章數(shù)字聲音編碼,17,3.6增量調(diào)制與自適應(yīng)增量調(diào)制,增量調(diào)制也稱調(diào)制(deltamodulation，DM)，是一種預(yù)測(cè)編碼技術(shù)對(duì)實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性進(jìn)行編碼。如果實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性為“正”，則用“1”表示；相反則用“0”表示，或者相反由于DM編碼只須用1位對(duì)話音信號(hào)進(jìn)行編碼，所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”比較：PCM是對(duì)每個(gè)采樣信號(hào)的整個(gè)幅度進(jìn)行量化編碼,圖3-8DM波形編碼示意圖,3章數(shù)字聲音編碼,18,3.6增量調(diào)制與自適應(yīng)增量調(diào)制(續(xù)),自適應(yīng)增量調(diào)制(ADM)根據(jù)輸入信號(hào)斜率的變化自動(dòng)調(diào)整量化階的大小，以使斜率過(guò)載和粒狀噪聲都減到最小。在檢測(cè)到斜率過(guò)載時(shí)開始增大量化階，而在輸入信號(hào)的斜率減小時(shí)降低量化階例如，宋(Song)在1971描述的ADM技術(shù)中提出：每當(dāng)輸出不變時(shí)量化階增大50%；每當(dāng)輸出值改變時(shí)，量化階減小50%又如，由格林弗基斯(Greefkes)在1970年提出的連續(xù)可變斜率增量調(diào)制(CVSD)的基本方法是：如果連續(xù)可變斜率增量調(diào)制器的輸出連續(xù)出現(xiàn)三個(gè)相同值時(shí)，量化階加一個(gè)大的增量，反之，就加一個(gè)小的增量。,3章數(shù)字聲音編碼,19,3.7自適應(yīng)差分脈沖編碼調(diào)制,APCM的概念A(yù)PCM是什么adaptivepulsecodemodulation的縮寫，自適應(yīng)脈沖編碼調(diào)制根據(jù)輸入信號(hào)幅度大小來(lái)改變量化階大小的一種波形編碼技術(shù)自適應(yīng)瞬時(shí)自適應(yīng)，即量化階的大小每隔幾個(gè)樣本就改變音節(jié)自適應(yīng)，即量化階的大小在較長(zhǎng)時(shí)間里發(fā)生變化,3章數(shù)字聲音編碼,20,3.7自適應(yīng)差分脈沖編碼調(diào)制(續(xù)3),DPCM的概念DPCM是什么DPCM中文術(shù)語(yǔ)為差分脈沖編碼調(diào)制differentialpulsecodemodulation的縮寫利用樣本與樣本之間存在的信息冗余來(lái)進(jìn)行編碼的一種數(shù)據(jù)壓縮技術(shù)基本思想：根據(jù)過(guò)去的樣本去估算下一個(gè)樣本信號(hào)的幅度大小，這個(gè)值稱為預(yù)測(cè)值，然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼，從而就減少了表示每個(gè)樣本信號(hào)的位數(shù)它與脈沖編碼調(diào)制(PCM)不同的是，PCM是直接對(duì)采樣信號(hào)進(jìn)行量化編碼，而DPCM是對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼，存儲(chǔ)或者傳送的是差值而不是幅度絕對(duì)值，這就降低了傳送或存儲(chǔ)的數(shù)據(jù)量?？蛇m應(yīng)大范圍變化的輸入信號(hào),3章數(shù)字聲音編碼,21,3.7自適應(yīng)差分脈沖編碼調(diào)制(續(xù)4),DPCM原理差分信號(hào)d(k)：離散輸入信號(hào)s(k)和預(yù)測(cè)器輸出的估算值se(k-1)之差對(duì)d(k)進(jìn)行量化編碼，得到,圖3-10DPCM方塊圖,3章數(shù)字聲音編碼,22,3.7自適應(yīng)差分脈沖編碼調(diào)制(續(xù)5),ADPCM的概念A(yù)DPCM的中文術(shù)語(yǔ)為自適應(yīng)差分脈沖編碼調(diào)制adaptivedifferencepulsecodemodulation的縮寫綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性，是一種性能比較好的波形編碼技術(shù)它的核心想法是：利用自適應(yīng)的思想改變量化階的大小，即使用小的量化階(step-size)去編碼小的差值，使用大的量化階去編碼大的差值使用過(guò)去的樣本值估算下一個(gè)輸入樣本的預(yù)測(cè)值，使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小,3章數(shù)字聲音編碼,23,3.7自適應(yīng)差分脈沖編碼調(diào)制(續(xù)6),ADPCM編碼框圖如圖3-11所示接收端的譯碼器使用與發(fā)送端相同的算法，利用傳送來(lái)的信號(hào)來(lái)確定量化器和逆量化器中的量化階大小，并且用它來(lái)預(yù)測(cè)下一個(gè)接收信號(hào)的預(yù)測(cè)值,圖3-11ADPCM方塊圖,3章數(shù)字聲音編碼,24,3.8G.722SB-ADPCM編譯碼器,子帶編碼(sub-bandcoding，SBC)用一組帶通濾波器(band-passfilter，BPF)把輸入聲音信號(hào)的頻帶分成若干個(gè)連續(xù)的頻段，每個(gè)頻段稱為子帶。對(duì)每個(gè)子帶中的聲音信號(hào)采用單獨(dú)的編碼方案去編碼在信道上傳送時(shí)，將每個(gè)子帶的代碼復(fù)合在一起；在接收端譯碼時(shí)，將每個(gè)子帶的代碼單獨(dú)譯碼，然后把它們組合起來(lái)，還原成原來(lái)的聲音信號(hào)好處有兩個(gè)可對(duì)每個(gè)子帶信號(hào)分別進(jìn)行自適應(yīng)控制，量化階的大小可按照每個(gè)子帶的能量電平加以調(diào)節(jié)。具有較高能量電平的子帶用大的量化階去量化，以減少總的量化噪聲可根據(jù)每個(gè)子帶信號(hào)在感覺上的重要性，對(duì)每個(gè)子帶分配不同的位數(shù)，用來(lái)表示每個(gè)樣本值。,3章數(shù)字聲音編碼,25,3.8G.722SB-ADPCM編譯碼器(續(xù)1),例如，在低頻子帶中，為了保護(hù)音調(diào)就要求用較小的量化階、較多的量化級(jí)數(shù)，即分配較多的位數(shù)來(lái)表示樣本值。而話音中的摩擦音和類似噪聲的聲音，通常出現(xiàn)在高頻子帶中，對(duì)它分配較少的位數(shù)SBC的方塊圖如圖3-13所示，圖中的編碼/譯碼器可以采用ADPCM，APCM或PCM,圖3-13子帶編碼方塊圖,3章數(shù)字聲音編碼,26,3.8G.722SB-ADPCM編譯碼器(續(xù)2),聲音頻帶的分割可用樹型結(jié)構(gòu)的式樣進(jìn)行劃分首先把整個(gè)聲音信號(hào)帶寬分成兩個(gè)相等帶寬的子帶：高頻子帶和低頻子帶然后對(duì)這兩個(gè)子帶用同樣的方法劃分，形成4個(gè)子帶這個(gè)過(guò)程可按需要重復(fù)下去，以產(chǎn)生2k個(gè)子帶，K為分割的次數(shù)用這種辦法可以產(chǎn)生等帶寬的子帶，也可以生成不等帶寬的子帶例如，對(duì)帶寬為4000Hz的聲音信號(hào)，當(dāng)K=3時(shí)，可分為8個(gè)相等帶寬的子帶，每個(gè)子帶的帶寬為500Hz；也可生成5個(gè)不等帶寬的子帶，分別為0,500),500,1000)，1000,2000),2000,3000)和3000，4000采用正交鏡像濾波器(quadraturemirrorfilter，QMF)來(lái)劃分頻帶,3章數(shù)字聲音編碼,27,3.9線性預(yù)測(cè)編碼(LPC)的概念,線性預(yù)測(cè)編碼(linearpredictivecoding，LPC)話音壓縮技術(shù)。將話音生成機(jī)理模型化為一個(gè)離散的、時(shí)變的、線性的遞歸濾波器編碼時(shí)使用線性預(yù)測(cè)分析話音波形產(chǎn)生聲道激勵(lì)和轉(zhuǎn)移函數(shù)的參數(shù)，對(duì)聲音波形的編碼實(shí)際就轉(zhuǎn)化為對(duì)這些參數(shù)的編碼，這就可減少聲音的數(shù)據(jù)量譯碼時(shí)使用線性預(yù)測(cè)分析得到的參數(shù)，通過(guò)話音合成器重構(gòu)話音。合成器實(shí)際上是一個(gè)離散的隨時(shí)間變化的時(shí)變線性濾波器，它代表人的話音生成系統(tǒng)模型時(shí)變線性濾波器分析話音波形時(shí)，當(dāng)作預(yù)測(cè)器使用合成話音波形時(shí)，當(dāng)作生成模型使用,3章數(shù)字聲音編碼,28,3.9線性預(yù)測(cè)編碼(LPC)的概念(續(xù)1),線性預(yù)測(cè)器使用過(guò)去的P個(gè)樣本值來(lái)預(yù)測(cè)現(xiàn)時(shí)刻的采樣值x(n)，如圖3-18所示,圖3-18預(yù)測(cè)概念,3章數(shù)字聲音編碼,29,3.9線性預(yù)測(cè)編碼(LPC)的概念(續(xù)2),預(yù)測(cè)值用過(guò)去P個(gè)樣本值的線性組合表示為,為方便起見，式中采用了負(fù)號(hào)殘差誤差即線性預(yù)測(cè)誤差為一個(gè)線性差分方程，,在給定的時(shí)間范圍里，如n0,n1,使e(n)的平方和即,為最小，這樣可使預(yù)測(cè)得到的樣本值更精確。,3章數(shù)字聲音編碼,30,3.9線性預(yù)測(cè)編碼(LPC)的概念(續(xù)3),預(yù)測(cè)系數(shù)通過(guò)求解偏微分方程，可

人人文庫(kù)> 全部分類> 應(yīng)用文書 > 事務(wù)文書

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

多媒體技術(shù)基礎(chǔ)03數(shù)字聲音編碼ppt課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

多媒體技術(shù)基礎(chǔ)03數(shù)字聲音編碼ppt課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔