已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第3章數(shù)字聲音編碼,3章數(shù)字聲音編碼,2,第3章數(shù)字聲音編碼目錄,3.1聲音簡(jiǎn)介3.1.1聲音是什么3.1.2聲音的頻率范圍3.2聲音信號(hào)數(shù)字化3.2.1從模擬過(guò)渡到數(shù)字3.2.2模擬信號(hào)與數(shù)字信號(hào)3.2.3聲音信號(hào)數(shù)字化3.2.4聲音質(zhì)量與數(shù)據(jù)率3.3聲音質(zhì)量的MOS評(píng)分標(biāo)準(zhǔn)3.4脈沖編碼調(diào)制(PCM)3.4.1PCM的概念3.4.2均勻量化3.4.3非均勻量化3.5PCM在通信中的應(yīng)用3.5.1頻分多路復(fù)用3.5.2時(shí)分多路復(fù)用3.5.3數(shù)字通信線路的數(shù)據(jù)傳輸率,3.6增量調(diào)制與自適應(yīng)增量調(diào)制3.6.1增量調(diào)制(DM)3.6.2自適應(yīng)增量調(diào)制(ADM)3.7自適應(yīng)差分脈沖編碼調(diào)制3.7.1自適應(yīng)脈沖編碼調(diào)制(APCM)的概念3.7.2差分脈沖編碼調(diào)制(DPCM)的概念3.7.3自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)3.7.4G.726ADPCM編譯碼器3.8G.722SB-ADPCM編譯碼器3.8.1子帶編碼(SBC)3.8.2子帶-自適應(yīng)差分脈沖編碼調(diào)制(SB-ADPCM)3.9線性預(yù)測(cè)編碼(LPC)的概念3.10GSM聲音簡(jiǎn)介3.11話音編碼標(biāo)準(zhǔn)摘要3.11.1編碼算法的性能3.11.2話音編碼標(biāo)準(zhǔn),3章數(shù)字聲音編碼,3,3.1聲音簡(jiǎn)介,聲音是什么聲音是聽覺器官對(duì)聲波的感知,而聲波是通過(guò)空氣或其他媒體傳播的連續(xù)振動(dòng)聲音的強(qiáng)弱體現(xiàn)在聲波壓力的大小上,音調(diào)的高低體現(xiàn)在聲音的頻率上聲音用電壓信號(hào)表示時(shí),聲音信號(hào)在時(shí)間和幅度上都是連續(xù)的模擬信號(hào),如圖3-1所示聲波具有普通波所具有的特性,例如反射(reflection)、折射(refraction)和衍射(diffraction)等,圖3-1聲音是一種連續(xù)的波,3章數(shù)字聲音編碼,4,3.1聲音簡(jiǎn)介(續(xù)1),聲音的頻率高保真聲音(high-fidelityaudio):1020000Hz聲音(audio):2020000Hz話音(speech):3003000/3400Hz亞音/次音(subsonic):20000Hz,3章數(shù)字聲音編碼,5,3.2聲音信號(hào)數(shù)字化,數(shù)字化的概念采樣和量化連續(xù)時(shí)間的離散化通過(guò)采樣來(lái)實(shí)現(xiàn),就是每隔相等的一段時(shí)間采樣一次,這種采樣稱為均勻采樣(uniformsampling)連續(xù)幅度的離散化通過(guò)量化(quantization)來(lái)實(shí)現(xiàn),就是把信號(hào)的強(qiáng)度劃分成一小段一小段,如果幅度的劃分是等間隔的,就稱為線性量化,否則就稱為非線性量化。圖3-2表示了聲音數(shù)字化的概念,圖3-2聲音的采樣和量化,采樣,3章數(shù)字聲音編碼,6,3.2聲音信號(hào)數(shù)字化(續(xù)1),采樣頻率采樣頻率由根據(jù)奈奎斯特理論(Nyquisttheory)確定奈奎斯特理論指出,采樣頻率不應(yīng)低于聲音信號(hào)最高頻率的兩倍,這樣就能把以數(shù)字表達(dá)的聲音還原成原來(lái)的聲音,這叫做無(wú)損數(shù)字化(losslessdigitization)假設(shè)被采樣信號(hào)的最高頻率為fmax,則采樣定律可用公式表示為,3章數(shù)字聲音編碼,7,3.2聲音信號(hào)數(shù)字化(續(xù)2),采樣精度度量聲音波形幅度的精確程度,用每個(gè)聲音樣本的位數(shù)(即bps)表示例如每個(gè)聲音樣本用16位表示,測(cè)得的聲音樣本值是在065535范圍里的數(shù),它的精度是1/65536精度是在模擬信號(hào)數(shù)字化過(guò)程中度量模擬信號(hào)的最小單位,因此也稱量化階(quantizationstepsize)01V的電壓用256個(gè)數(shù)表示時(shí),量化階等于1/256V樣本位數(shù)的大小影響到聲音的質(zhì)量,位數(shù)越多,聲音質(zhì)量越高,所需存儲(chǔ)空間也越多;位數(shù)越少,聲音質(zhì)量就越低,所需存儲(chǔ)空間也越少,3章數(shù)字聲音編碼,8,3.2聲音信號(hào)數(shù)字化(續(xù)3),采樣精度的另一種表示方法是信號(hào)噪聲比,簡(jiǎn)稱為信噪比(signal-to-noiseratio,SNR),并用下式計(jì)算,其中,Vsignal表示信號(hào)電壓,Vnoise表示量化噪聲電壓(模擬信號(hào)的采樣值和與它最接近的數(shù)字?jǐn)?shù)值之間的差值),SNR的單位為分貝(db),3章數(shù)字聲音編碼,9,3.2聲音信號(hào)數(shù)字化(續(xù)4),聲音質(zhì)量和數(shù)據(jù)率質(zhì)量度量,*AM:amplitudemodulationCD:compactdiscaudioFM:frequencymodulationDAT:digitalaudiotape,3章數(shù)字聲音編碼,10,3.3聲音質(zhì)量的MOS評(píng)分標(biāo)準(zhǔn),聲音質(zhì)量的衡量方法聲音帶寬法等級(jí)由高到低依次是DAT、CD、FM、AM和數(shù)字電話主觀質(zhì)量度量度量方法類似于電視節(jié)目中的歌手比賽,由評(píng)委對(duì)每個(gè)歌手的表現(xiàn)進(jìn)行評(píng)分,然后求出平均值有時(shí)同時(shí)采取兩種方法評(píng)估,有時(shí)以主觀質(zhì)量度量為主,3章數(shù)字聲音編碼,11,3.3聲音質(zhì)量的MOS評(píng)分標(biāo)準(zhǔn)(續(xù)),主觀平均分(meanopinionscore,MOS)對(duì)聲音主觀質(zhì)量度量比較通用的標(biāo)準(zhǔn)是5分制,各檔次的評(píng)分標(biāo)準(zhǔn)見表3-2,表3-2聲音質(zhì)量MOS評(píng)分標(biāo)準(zhǔn),3章數(shù)字聲音編碼,12,3.4脈沖編碼調(diào)制(PCM),脈沖編碼調(diào)制(PCM)的概念PCM是pulsecodemodulation的縮寫概念上最簡(jiǎn)單、理論上最完善、最早研制成功、使用最為廣泛、數(shù)據(jù)量最大的編碼系統(tǒng),圖3-3PCM編碼原理框圖,輸入是模擬信號(hào),輸出是PCM樣本。防失真濾波器:低通濾波器,用來(lái)濾除聲音頻帶以外的信號(hào)波形編碼器:可理解為采樣器量化器:可理解為“量化階大小(step-size)”生成器或者稱為“量化間隔”生成器,3章數(shù)字聲音編碼,13,3.4脈沖編碼調(diào)制(續(xù)1),PCM實(shí)際上是模擬信號(hào)數(shù)字化模擬聲音數(shù)字化的兩個(gè)步驟:第一步是采樣,就是每隔一段時(shí)間間隔讀一次聲音的幅度第二步是量化,就是把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換成數(shù)字值量化的方法主要有均勻量化和非均勻量化,3章數(shù)字聲音編碼,14,圖3-4均勻量化,3.4脈沖編碼調(diào)制(續(xù)2),均勻量化采用相等的量化間隔對(duì)采樣得到的信號(hào)作量化。量化誤差(量化噪聲):量化后的樣本值Y和原始值X的差e=y-x。,3章數(shù)字聲音編碼,15,3.4脈沖編碼調(diào)制(續(xù)3),非均勻量化大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔可在滿足精度要求的情況下用較少的位數(shù)來(lái)表示聲音數(shù)據(jù)還原時(shí),采用相同的規(guī)則,圖3-5非均勻量化,3章數(shù)字聲音編碼,16,3.5PCM在通信中的應(yīng)用,3章數(shù)字聲音編碼,17,3.6增量調(diào)制與自適應(yīng)增量調(diào)制,增量調(diào)制也稱調(diào)制(deltamodulation,DM),是一種預(yù)測(cè)編碼技術(shù)對(duì)實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性進(jìn)行編碼。如果實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性為“正”,則用“1”表示;相反則用“0”表示,或者相反由于DM編碼只須用1位對(duì)話音信號(hào)進(jìn)行編碼,所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”比較:PCM是對(duì)每個(gè)采樣信號(hào)的整個(gè)幅度進(jìn)行量化編碼,圖3-8DM波形編碼示意圖,3章數(shù)字聲音編碼,18,3.6增量調(diào)制與自適應(yīng)增量調(diào)制(續(xù)),自適應(yīng)增量調(diào)制(ADM)根據(jù)輸入信號(hào)斜率的變化自動(dòng)調(diào)整量化階的大小,以使斜率過(guò)載和粒狀噪聲都減到最小。在檢測(cè)到斜率過(guò)載時(shí)開始增大量化階,而在輸入信號(hào)的斜率減小時(shí)降低量化階例如,宋(Song)在1971描述的ADM技術(shù)中提出:每當(dāng)輸出不變時(shí)量化階增大50%;每當(dāng)輸出值改變時(shí),量化階減小50%又如,由格林弗基斯(Greefkes)在1970年提出的連續(xù)可變斜率增量調(diào)制(CVSD)的基本方法是:如果連續(xù)可變斜率增量調(diào)制器的輸出連續(xù)出現(xiàn)三個(gè)相同值時(shí),量化階加一個(gè)大的增量,反之,就加一個(gè)小的增量。,3章數(shù)字聲音編碼,19,3.7自適應(yīng)差分脈沖編碼調(diào)制,APCM的概念A(yù)PCM是什么adaptivepulsecodemodulation的縮寫,自適應(yīng)脈沖編碼調(diào)制根據(jù)輸入信號(hào)幅度大小來(lái)改變量化階大小的一種波形編碼技術(shù)自適應(yīng)瞬時(shí)自適應(yīng),即量化階的大小每隔幾個(gè)樣本就改變音節(jié)自適應(yīng),即量化階的大小在較長(zhǎng)時(shí)間里發(fā)生變化,3章數(shù)字聲音編碼,20,3.7自適應(yīng)差分脈沖編碼調(diào)制(續(xù)3),DPCM的概念DPCM是什么DPCM中文術(shù)語(yǔ)為差分脈沖編碼調(diào)制differentialpulsecodemodulation的縮寫利用樣本與樣本之間存在的信息冗余來(lái)進(jìn)行編碼的一種數(shù)據(jù)壓縮技術(shù)基本思想:根據(jù)過(guò)去的樣本去估算下一個(gè)樣本信號(hào)的幅度大小,這個(gè)值稱為預(yù)測(cè)值,然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼,從而就減少了表示每個(gè)樣本信號(hào)的位數(shù)它與脈沖編碼調(diào)制(PCM)不同的是,PCM是直接對(duì)采樣信號(hào)進(jìn)行量化編碼,而DPCM是對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼,存儲(chǔ)或者傳送的是差值而不是幅度絕對(duì)值,這就降低了傳送或存儲(chǔ)的數(shù)據(jù)量??蛇m應(yīng)大范圍變化的輸入信號(hào),3章數(shù)字聲音編碼,21,3.7自適應(yīng)差分脈沖編碼調(diào)制(續(xù)4),DPCM原理差分信號(hào)d(k):離散輸入信號(hào)s(k)和預(yù)測(cè)器輸出的估算值se(k-1)之差對(duì)d(k)進(jìn)行量化編碼,得到,圖3-10DPCM方塊圖,3章數(shù)字聲音編碼,22,3.7自適應(yīng)差分脈沖編碼調(diào)制(續(xù)5),ADPCM的概念A(yù)DPCM的中文術(shù)語(yǔ)為自適應(yīng)差分脈沖編碼調(diào)制adaptivedifferencepulsecodemodulation的縮寫綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性,是一種性能比較好的波形編碼技術(shù)它的核心想法是:利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值使用過(guò)去的樣本值估算下一個(gè)輸入樣本的預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小,3章數(shù)字聲音編碼,23,3.7自適應(yīng)差分脈沖編碼調(diào)制(續(xù)6),ADPCM編碼框圖如圖3-11所示接收端的譯碼器使用與發(fā)送端相同的算法,利用傳送來(lái)的信號(hào)來(lái)確定量化器和逆量化器中的量化階大小,并且用它來(lái)預(yù)測(cè)下一個(gè)接收信號(hào)的預(yù)測(cè)值,圖3-11ADPCM方塊圖,3章數(shù)字聲音編碼,24,3.8G.722SB-ADPCM編譯碼器,子帶編碼(sub-bandcoding,SBC)用一組帶通濾波器(band-passfilter,BPF)把輸入聲音信號(hào)的頻帶分成若干個(gè)連續(xù)的頻段,每個(gè)頻段稱為子帶。對(duì)每個(gè)子帶中的聲音信號(hào)采用單獨(dú)的編碼方案去編碼在信道上傳送時(shí),將每個(gè)子帶的代碼復(fù)合在一起;在接收端譯碼時(shí),將每個(gè)子帶的代碼單獨(dú)譯碼,然后把它們組合起來(lái),還原成原來(lái)的聲音信號(hào)好處有兩個(gè)可對(duì)每個(gè)子帶信號(hào)分別進(jìn)行自適應(yīng)控制,量化階的大小可按照每個(gè)子帶的能量電平加以調(diào)節(jié)。具有較高能量電平的子帶用大的量化階去量化,以減少總的量化噪聲可根據(jù)每個(gè)子帶信號(hào)在感覺上的重要性,對(duì)每個(gè)子帶分配不同的位數(shù),用來(lái)表示每個(gè)樣本值。,3章數(shù)字聲音編碼,25,3.8G.722SB-ADPCM編譯碼器(續(xù)1),例如,在低頻子帶中,為了保護(hù)音調(diào)就要求用較小的量化階、較多的量化級(jí)數(shù),即分配較多的位數(shù)來(lái)表示樣本值。而話音中的摩擦音和類似噪聲的聲音,通常出現(xiàn)在高頻子帶中,對(duì)它分配較少的位數(shù)SBC的方塊圖如圖3-13所示,圖中的編碼/譯碼器可以采用ADPCM,APCM或PCM,圖3-13子帶編碼方塊圖,3章數(shù)字聲音編碼,26,3.8G.722SB-ADPCM編譯碼器(續(xù)2),聲音頻帶的分割可用樹型結(jié)構(gòu)的式樣進(jìn)行劃分首先把整個(gè)聲音信號(hào)帶寬分成兩個(gè)相等帶寬的子帶:高頻子帶和低頻子帶然后對(duì)這兩個(gè)子帶用同樣的方法劃分,形成4個(gè)子帶這個(gè)過(guò)程可按需要重復(fù)下去,以產(chǎn)生2k個(gè)子帶,K為分割的次數(shù)用這種辦法可以產(chǎn)生等帶寬的子帶,也可以生成不等帶寬的子帶例如,對(duì)帶寬為4000Hz的聲音信號(hào),當(dāng)K=3時(shí),可分為8個(gè)相等帶寬的子帶,每個(gè)子帶的帶寬為500Hz;也可生成5個(gè)不等帶寬的子帶,分別為0,500),500,1000),1000,2000),2000,3000)和3000,4000采用正交鏡像濾波器(quadraturemirrorfilter,QMF)來(lái)劃分頻帶,3章數(shù)字聲音編碼,27,3.9線性預(yù)測(cè)編碼(LPC)的概念,線性預(yù)測(cè)編碼(linearpredictivecoding,LPC)話音壓縮技術(shù)。將話音生成機(jī)理模型化為一個(gè)離散的、時(shí)變的、線性的遞歸濾波器編碼時(shí)使用線性預(yù)測(cè)分析話音波形產(chǎn)生聲道激勵(lì)和轉(zhuǎn)移函數(shù)的參數(shù),對(duì)聲音波形的編碼實(shí)際就轉(zhuǎn)化為對(duì)這些參數(shù)的編碼,這就可減少聲音的數(shù)據(jù)量譯碼時(shí)使用線性預(yù)測(cè)分析得到的參數(shù),通過(guò)話音合成器重構(gòu)話音。合成器實(shí)際上是一個(gè)離散的隨時(shí)間變化的時(shí)變線性濾波器,它代表人的話音生成系統(tǒng)模型時(shí)變線性濾波器分析話音波形時(shí),當(dāng)作預(yù)測(cè)器使用合成話音波形時(shí),當(dāng)作生成模型使用,3章數(shù)字聲音編碼,28,3.9線性預(yù)測(cè)編碼(LPC)的概念(續(xù)1),線性預(yù)測(cè)器使用過(guò)去的P個(gè)樣本值來(lái)預(yù)測(cè)現(xiàn)時(shí)刻的采樣值x(n),如圖3-18所示,圖3-18預(yù)測(cè)概念,3章數(shù)字聲音編碼,29,3.9線性預(yù)測(cè)編碼(LPC)的概念(續(xù)2),預(yù)測(cè)值用過(guò)去P個(gè)樣本值的線性組合表示為,為方便起見,式中采用了負(fù)號(hào)殘差誤差即線性預(yù)測(cè)誤差為一個(gè)線性差分方程,,在給定的時(shí)間范圍里,如n0,n1,使e(n)的平方和即,為最小,這樣可使預(yù)測(cè)得到的樣本值更精確。,3章數(shù)字聲音編碼,30,3.9線性預(yù)測(cè)編碼(LPC)的概念(續(xù)3),預(yù)測(cè)系數(shù)通過(guò)求解偏微分方程,可
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年安慶職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試備考試題含詳細(xì)答案解析
- 2026北京工業(yè)大學(xué)招聘115人筆試參考題庫(kù)及答案解析
- 2026中國(guó)水利水電第九工程局有限公司秋季招聘148人筆試備考題庫(kù)及答案解析
- 2026廣西柳州市柳江區(qū)投資集團(tuán)有限公司下屬子公司柳州市江通供應(yīng)鏈有限公司招聘1人筆試模擬試題及答案解析
- 2026中國(guó)科大地球和空間科學(xué)學(xué)院勞務(wù)派遣崗位招聘1人筆試備考題庫(kù)及答案解析
- 2026年福建莆田中山中學(xué)綬溪校區(qū)招聘代課教師4人筆試模擬試題及答案解析
- 2026河南鄭州市滎陽(yáng)市招錄消防救援隊(duì)員60人筆試模擬試題及答案解析
- 2026吉林長(zhǎng)春市得一物業(yè)服務(wù)有限公司勞務(wù)派遣項(xiàng)目招聘筆試模擬試題及答案解析
- 2026北京豐臺(tái)區(qū)新村街道辦事處招聘城市協(xié)管員的5人筆試備考題庫(kù)及答案解析
- 飼草料種植技術(shù)
- 發(fā)熱待查診治專家共識(shí)(2026 版)
- 家具制造工藝流程與標(biāo)準(zhǔn)操作規(guī)程
- 2026北京西城初二上學(xué)期期末數(shù)學(xué)試卷和答案
- 馬年猜猜樂(馬的成語(yǔ))打印版
- 2026年及未來(lái)5年市場(chǎng)數(shù)據(jù)中國(guó)磷化銦行業(yè)市場(chǎng)調(diào)研分析及投資戰(zhàn)略咨詢報(bào)告
- 北京市東城區(qū)2024-2025學(xué)年高一上學(xué)期期末統(tǒng)一檢測(cè)地理試卷
- 2025年鄭州鐵路職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試題庫(kù)含答案
- 物業(yè)人員管理及培訓(xùn)方案
- 2.1地形導(dǎo)學(xué)案-八年級(jí)地理上學(xué)期人教版
- GB/T 37507-2025項(xiàng)目、項(xiàng)目群和項(xiàng)目組合管理項(xiàng)目管理指南
- 2024年江蘇省南京市中考數(shù)學(xué)試卷真題(含答案逐題解析)
評(píng)論
0/150
提交評(píng)論