PCM編碼詳解課件_第1頁
PCM編碼詳解課件_第2頁
PCM編碼詳解課件_第3頁
PCM編碼詳解課件_第4頁
PCM編碼詳解課件_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

PCM與音頻編碼第3章話音編碼重點:脈沖編碼調(diào)制(PCM)增量調(diào)制與自適應(yīng)增量調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)難點:非均勻量化增量調(diào)制子帶編碼波形聲音的數(shù)據(jù)壓縮波形聲音的碼率=取樣頻率

×

量化位數(shù)

×

聲道數(shù)

全頻帶聲音的壓縮編碼:第1代壓縮編碼:PCM編碼第2代壓縮編碼:感知聲音編碼數(shù)字語音的壓縮編碼:波形編碼參數(shù)編碼(模型編碼)混合編碼語音壓縮編碼的3類方法波形編碼

(Perceptionmodel-basedcompression)benefits:genericdrawbacks:highestcompressionratesaredifficulttoachieve>16kb/sExamples:PCM,ADPCM,Subband參數(shù)編碼,源編碼

(Productionmodel-basedcompression)benefits:highestpossiblecompression2.4Kb/sdrawbacks:signalsource(s)mustbeknowExamples:vocoder混合編碼(Hybridcompression)Examples:CELP4.8kb/s——16kb/s極低低中碼率(kb/s)1248163264優(yōu)良中差壞語音質(zhì)量模型編碼(源編碼)混合編碼波形編碼脈沖編碼調(diào)制(PCM)“防失真濾波器”是一個低通濾波器,用來濾除聲音頻帶以外的信號;“波形編碼器”可暫時理解為“采樣器”;“量化器”可理解為“量化階大小(step-size)”生成器或者稱為“量化間隔”生成器。PCM編碼框圖聲音數(shù)字化有兩個步驟:第一步是采樣,就是每隔一段時間間隔讀一次聲音的幅度;第二步是量化,就是把采樣得到的聲音信號幅度轉(zhuǎn)換成數(shù)字值。但那時并沒有涉及如何進行量化。量化有好幾種方法,但可歸納成兩類:一類稱為均勻量化,另一類稱為非均勻量化。采用的量化方法不同,量化后的數(shù)據(jù)量也就不同。因此,可以說量化也是一種壓縮數(shù)據(jù)的方法。均勻量化采用相等的量化間隔對采樣得到的信號作量化,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度,也稱為線性量化量化后的樣本值Y和原始值X的差E=Y-X稱為量化誤差或量化噪聲非均勻量化非線性量化:對輸入信號進行量化時,大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔。這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示。聲音數(shù)據(jù)還原時,采用相同的規(guī)則。在非線性量化中,采樣輸入信號幅度和量化輸出數(shù)據(jù)之間定義了兩種對應(yīng)關(guān)系,一種稱為m律壓擴(companding)算法,另一種稱為A律壓擴算法。采樣頻率為8kHz,樣本精度為13位、14位或者16位的輸入信號,使用m律壓擴編碼或者使用A律壓擴編碼,經(jīng)過PCM編碼器之后每個樣本的精度為8位,輸出的數(shù)據(jù)率為64kb/s。這就是CCITT推薦的G.711標(biāo)準。m律壓擴和A律壓擴m律壓擴:北美和日本等地區(qū)13位PCM編碼轉(zhuǎn)換城8位。A律壓擴歐洲和中國大陸等地區(qū),14位PCM編碼轉(zhuǎn)換城8位輸出信號均為64Kb/sPCM在通信中的應(yīng)用提高線路利用率通常用下面兩種方法頻分多路復(fù)用:把傳輸信道的頻帶分成好幾個窄帶,每個窄帶傳送一路信號。例如,一個信道的頻帶為1400Hz,把這個信道分成4個子信道(subchannels):820~990Hz,1230~1400Hz,1640~1810Hz和2050~2220Hz,相鄰子信道間相距240Hz,用于確保子信道之間不相互干擾。每對用戶僅占用其中的一個子信道。這是模擬載波通信的主要手段。時分多路復(fù)用:把傳輸信道按時間來分割,為每個用戶指定一個時間間隔,每個間隔里傳輸信號的一部分,這樣就可以使許多用戶同時使用一條傳輸線路。這是數(shù)字通信的主要手段。例如,話音信號的采樣頻率f=8000Hz,它的采樣周期=125ms,這個時間稱為1幀(frame)。在這個時間里可容納的話路數(shù)有兩種規(guī)格:24路制和30路制。PCM在通信中的應(yīng)用PCM在通信中的應(yīng)用24路制的重要參數(shù)如下:每秒鐘傳送8000幀,每幀125ms。12幀組成1復(fù)幀(用于同步)。每幀由24個時間片(信道)和1位同步位組成。每個信道每次傳送8位代碼,1幀有24×8+1=193位(位)。數(shù)據(jù)傳輸率R=8000×193=1544kb/s。每一個話路的數(shù)據(jù)傳輸率=8000×8=64kb/s。30路制的重要參數(shù)如下:每秒鐘傳送8000幀,每幀125ms。16幀組成1復(fù)幀(用于同步)。每幀由32個時間片(信道)組成。每個信道每次傳送8位代碼。數(shù)據(jù)傳輸率:R=8000×32×8=2048kb/s。每一個話路的數(shù)據(jù)傳輸率=8000×8=64kb/s。PCM在通信中的應(yīng)用PCM信號復(fù)用的復(fù)雜程度,通常用“群(group)”表示一次群(基群)的30路(或24路),北美叫做T1遠距離數(shù)字通信線,在歐洲叫做E1遠距離數(shù)字通信線和E1等級。二次群的120路(或96路)三次群的480路(或384路)數(shù)字網(wǎng)絡(luò)等級T1/E1T2/E2T3/E3T4/E4T5/E5美國64kb/s話路數(shù)24966724.32總傳輸率(Mb/s)1.5446.51244.736274.176數(shù)字網(wǎng)絡(luò)等級12345歐洲64kb/s話路數(shù)3012048019207680總傳輸率(Mb/s)2.0488.44834.368139.2645600日本64kb/s話路數(shù)24964801440總傳輸率(Mb/s)1.5446.31232.06497.728表3-02多次復(fù)用的數(shù)據(jù)傳輸率預(yù)測編碼預(yù)測編碼(PredictionCoding):是指利用前面的一個或多個信號對下一個信號進行預(yù)測,然后對實際值和預(yù)測值的差進行編碼。兩種典型的預(yù)測編碼:差分脈碼調(diào)制(DPCM)自適應(yīng)差分脈碼調(diào)制(ADPCM)DPCMDPCM編碼,簡稱差值編碼,是對模擬信號幅度抽樣的差值進行量化編碼的調(diào)制方式(抽樣差值的含義請參見“增量調(diào)制”)。原始的模擬信號經(jīng)過時間采樣,然后對每一樣值進行量化,作為數(shù)字信號傳輸。這種方式是用已經(jīng)過去的抽樣值來預(yù)測當(dāng)前的抽樣值,對它們的差值進行編碼。差值編碼可以提高編碼頻率,這種技術(shù)已應(yīng)用于模擬信號的數(shù)字通信之中。

差分脈碼調(diào)制(DPCM)DPCM不對每一樣值都進行量化,而是預(yù)測下一樣值,并量化實際值和預(yù)測值之間的差。DPCM是基本的編碼方法之一,在大量的壓縮算法中被采用,比如JPEG的DC分量就是采用DPCM編碼的。舉例說明DPCM編碼原理:設(shè)DPCM系統(tǒng)預(yù)測器的預(yù)測值為前一個樣值,假設(shè)輸入信號已經(jīng)量化,差值不再進行量化。若系統(tǒng)的輸入為{0121123344…},則預(yù)測值為{0012112334…},差值為{011–1011010…},差值的范圍比輸入樣值的范圍有所減小,可以用較少的位數(shù)進行編碼。DPCM對于有些信號(例如圖像信號)由于信號的瞬時斜率比較大,很容易引起過載,因此,不能用簡單增量調(diào)制進行編碼,除此之外,這類信號也沒有像話音信號那種音節(jié)特性,因而也不能采用像音節(jié)壓擴那樣的方法,只能采用瞬時壓擴的方法。但瞬時壓擴實現(xiàn)起來比較困難,因此,對于這類瞬時斜率比較大的信號,通常采用一種綜合了增量調(diào)制和脈沖編碼調(diào)制兩者特點的調(diào)制方法進行編碼,這種編碼方式被簡稱為脈碼增量調(diào)制,或稱差值脈碼調(diào)制,用DPCM表示。DPCM這種調(diào)制方式的主要特點是把增量值分為個等級,然后把個不同等級的增量值編為位二進制代碼()再送到信道傳輸,因此,它兼有增量調(diào)制和PCM的各自特點。設(shè)這個誤差電壓經(jīng)過量化后變?yōu)閭€電平中的一個,電平間隔可以相等,也可以不等,這里認為它是間隔相等的均勻量化。量化了的誤差電壓經(jīng)過脈沖調(diào)制器變?yōu)镻AM脈沖序列,這個PAM信號一方面經(jīng)過PAM編碼器編碼后得到DPCM信號發(fā)送出去。另一方面把它經(jīng)過積分器后變?yōu)榕c輸入信號x(t)進行比較,通過相減器得到誤差電壓e(t)。

DPCM實驗表明,經(jīng)過DPCM調(diào)制后的信號,其傳輸?shù)谋忍芈室萈CM的低,相應(yīng)要求的系統(tǒng)傳輸帶寬也大大地減小了。此外,在相同比特速率條件下,DPCM比PCM信噪比也有很大的改善。與ΔM相比,由于它增多了量化級,因此,在改善量化噪聲方面優(yōu)于ΔM系統(tǒng)。DPCM的缺點是易受到傳輸線路上噪聲的干擾,在抑制信道噪聲方面不如ΔM。ADPCMAdpcm是自適應(yīng)差分脈沖編碼調(diào)制的簡稱,最早使用于數(shù)字通信系統(tǒng)中。該算法利用了語音信號樣點間的相關(guān)性,并針對語音信號的非平穩(wěn)特點,使用了自適應(yīng)預(yù)測和自適應(yīng)量化,在32kbps◎8khz速率上能夠給出網(wǎng)絡(luò)等級話音質(zhì)量。ADPCM為了進一步改善量化性能或壓縮數(shù)據(jù)率,可采用自適應(yīng)量化或自適應(yīng)預(yù)測的方法。只要采用了其中的任一種自適應(yīng)方法,均稱為ADPCM。自適應(yīng)預(yù)測:預(yù)測參數(shù)的最佳化依賴于信源的統(tǒng)計特性,要得到最佳的預(yù)測參數(shù)是一件繁瑣的工作。而采用固定的預(yù)測參數(shù)往往又得不到好的性能。為了既能使性能較佳,又不致于有太大的工作量,可以將上述兩種方法折衷考慮,采用自適應(yīng)預(yù)測ADPCM現(xiàn)在我們使用的是IMAADPCM算法,該算法中對量化步長的調(diào)整使用了簡單的查表方法,對于一個輸入的PCM值X(n),將其與前一時刻的X(n-1)預(yù)測值做差值得到d(n),然后根據(jù)當(dāng)前的量化步長對d(n)進行編碼,再用此sample點的編碼值調(diào)整量化步長,同時還要得到當(dāng)前sample點的預(yù)測值供下一sample點編碼使用。通過此算法可將樣點編碼成4bit的碼流,一個符號位和三個幅度位。ADPCM該算法較簡單,通過查表簡化了運算。對于編碼后的數(shù)據(jù)我們采用了wav文件格式,該格式對編碼后的數(shù)據(jù)流進行了包裝,由文件頭和數(shù)據(jù)碼流組成,文件頭中指出了音頻數(shù)據(jù)所采用格式、采樣率、比特率、塊長度、比特數(shù)及聲道數(shù)等信息。數(shù)據(jù)碼流以塊為單位,塊頭指出了該塊起始的預(yù)測值和index值,碼流中每byte的高四位和低四位分別對應(yīng)一個PCM。當(dāng)前該算法以其簡單實用的特點廣泛應(yīng)用到數(shù)字音樂盒和數(shù)字錄音筆中。自適應(yīng)差分脈碼調(diào)制(ADPCM)具體方法是:預(yù)測參數(shù)仍采用固定的;但此時有多組預(yù)測參數(shù)可供選擇。這些預(yù)測參數(shù)根據(jù)常見的信源特征求得。編碼時具體采用哪組預(yù)測參數(shù)根據(jù)信源的特征來自適應(yīng)的確定。為了自適應(yīng)地選擇最佳參數(shù),通常將信源數(shù)據(jù)分區(qū)間編碼,編碼時自動地選擇一組預(yù)測參數(shù),使該區(qū)間實際值與預(yù)測值的均方誤差最小。隨著編碼區(qū)間的不同,預(yù)測參數(shù)自適應(yīng)的變化,以達到準最佳預(yù)測。自適應(yīng)量化:根據(jù)信號分布不均勻的特點,系統(tǒng)具有隨輸入信號的變化而改變量化區(qū)間大小,以保持輸入給量化器的信號基本均勻的能力,這種能力稱為自適應(yīng)量化。

例如,Microsoft的ADPCM采用二預(yù)測參數(shù),提供7組預(yù)測系數(shù),如右表所示。編碼時,根據(jù)選定的準則(如最小均方誤差準則),每個編碼區(qū)間自動地選取一組最佳的參數(shù)。系數(shù)集系數(shù)1系數(shù)2025601512-256200319264424005460-2086392-232

增量調(diào)制與自適應(yīng)增量調(diào)制增量調(diào)制(DM)增量調(diào)制也稱△調(diào)制(deltamodulation,DM),它是一種預(yù)測編碼技術(shù),是PCM編碼的一種變形。PCM是對每個采樣信號的整個幅度進行量化編碼,因此它具有對任意波形進行編碼的能力;DM是對實際的采樣信號與預(yù)測的采樣信號之差的極性進行編碼,將極性變成“0”和“1”這兩種可能的取值之一。如果實際的采樣信號與預(yù)測的采樣信號之差的極性為“正”,則用“1”表示;相反則用“0”表示,或者相反。由于DM編碼只須用1位對話音信號進行編碼,所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。增量調(diào)制(DM)在輸入信號變化快的區(qū)域,斜率過載是關(guān)心的焦點,而在輸入信號變化慢的區(qū)域,關(guān)心的焦點是粒狀噪聲。為了盡可能避免出現(xiàn)斜率過載,就要加大量化階Δ,但這樣做又會加大粒狀噪聲;相反,如果要減小粒狀噪聲,就要減小量化階Δ,這又會使斜率過載更加嚴重。這就促進了對自適應(yīng)增量調(diào)制(adaptivedeltamodulation,ADM)的研究自適應(yīng)增量調(diào)制(ADM)基本方法:在檢測到斜率過載時開始增大量化階Δ,而在輸入信號的斜率減小時降低量化階Δ。例如,宋(Song)在1971描述的自適應(yīng)增量調(diào)制技術(shù)中提出:假定增量調(diào)制器的輸出為1和0,每當(dāng)輸出不變時量化階增大50%,使預(yù)測器的輸出跟上輸入信號;每當(dāng)輸出值改變時,量化階減小50%,使粒狀噪聲減到最小,這種自適應(yīng)方法使斜率過載和粒狀噪聲同時減到最小。又如,使用較多的另一種自適應(yīng)增量調(diào)制器是由格林弗基斯(Greefkes)1970提出的,稱為連續(xù)可變斜率增量調(diào)制(continuouslyvariableslopedeltamodulation,CVSD)。它的基本方法是:如果連續(xù)可變斜率增量調(diào)制器(continuouslyvariableslopedeltamodulator,CVSD)的輸出連續(xù)出現(xiàn)三個相同的值,量化階就加上一個大的增量,反之,就加一個小的增量。自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)脈沖編碼調(diào)制(adaptivepulsecode

modulation,APCM)是根據(jù)輸入信號幅度大小來改變量化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬時自適應(yīng),即量化階的大小每隔幾個樣本就改變,也可以是音節(jié)自適應(yīng),即量化階的大小在較長時間周期里發(fā)生變化。改變量化階大小的方法有兩種:一種稱為前向自適應(yīng)(forwardadaptation),另一種稱為后向自適應(yīng)(backwardadaptation)。前向自適應(yīng):根據(jù)未量化的樣本值的均方根值來估算輸入信號的電平,以此來確定量化階的大小,并對其電平進行編碼作為邊信息(sideinformation)傳送到接收端。后向自適應(yīng):從量化器剛輸出的過去樣本中來提取量化階信息。由于后向自適應(yīng)能在發(fā)收兩端自動生成量化階,所以它不需要傳送邊信息。自適應(yīng)差分脈沖編碼調(diào)制差分脈沖編碼調(diào)制的思想:根據(jù)過去的樣本去估算(estimate)下一個樣本信號的幅度大小,這個值稱為預(yù)測值,然后對實際信號值與預(yù)測值之差進行量化編碼,從而就減少了表示每個樣本信號的位數(shù)。它與脈沖編碼調(diào)制(PCM)不同的是,PCM是直接對采樣信號進行量化編碼,而DPCM是對實際信號值與預(yù)測值之差進行量化編碼,存儲或者傳送的是差值而不是幅度絕對值,這就降低了傳送或存儲的數(shù)據(jù)量。此外,它還能適應(yīng)大范圍變化的輸入信號。自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM(adaptivedifferencepulsecodemodulation)綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性,是一種性能比較好的波形編碼。它的核心想法是:①利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值,②使用過去的樣本值估算下一個輸入樣本的預(yù)測值,使實際樣本值和預(yù)測值之間的差值總是最小。它的編碼簡化框圖如下圖所示。ADPCM編譯碼器G.721推薦標(biāo)準,這個標(biāo)準叫做32kb/s自適應(yīng)差分脈沖編碼調(diào)制。在此基礎(chǔ)上還制定了G.721的擴充推薦標(biāo)準,即G.723,使用該標(biāo)準的編碼器的數(shù)據(jù)率可降低到40kb/s和24kb/s。G.722SB-ADPCM編譯碼器G.722推薦標(biāo)準,叫做“數(shù)據(jù)率為64kb/s的7kHz聲音信號編碼——這個標(biāo)準把話音信號的質(zhì)量由電話質(zhì)量提高到AM無線電廣播質(zhì)量,而其數(shù)據(jù)傳輸率仍保持為64kb/s。子帶編碼(subbandcoding,SBC)的基本思想是:使用一組帶通濾波器(band-passfilter,BPF)把輸入音頻信號的頻帶分成若干個連續(xù)的頻段,每個頻段稱為子帶。對每個子帶中的音頻信號采用單獨的編碼方案去編碼。在信道上傳送時,將每個子帶的代碼復(fù)合起來。在接收端譯碼時,將每個子帶的代碼單獨譯碼,然后把它們組合起來,還原成原來的音頻信號。子帶編碼的編碼/譯碼器,可以采用ADPCM,APCM,PCM等。等帶寬的子帶不等帶寬的子帶G.722SB-ADPCM編譯碼器窄帶和寬帶音頻信道頻率特性

全頻帶聲音的第1代編碼技術(shù)全頻帶聲音指的是10Hz~20,000Hz范圍里的所有可聽聲音.也叫做寬帶聲音或高保真(high-fidelity)聲音;第1代全頻帶數(shù)字聲音(CD,DAT)的編碼采用PCM編碼:采樣頻率:44.1kHz或48kHz量化精度:16位聲道數(shù)目:1或2碼率:705.6/768(kb/s)或1.41/1.54(Mb/s)全頻帶聲音的第2代編碼技術(shù)目標(biāo):在保持高保真聲音質(zhì)量(transparentcompression)的前提下,降低碼率,減輕網(wǎng)絡(luò)帶寬的壓力;不但充分使用聲音信息的統(tǒng)計冗余,而且利用人耳的聽覺特性,即使用“心理聲學(xué)模型(psycho-acousticmodel)”,來達到壓縮數(shù)據(jù)的目的,稱為感知聲音編碼(perceptualaudiocoding)。全頻帶數(shù)字音頻的編碼標(biāo)準MP3音樂是什么?DolbyAC-3是什么?RealAudio是什么?數(shù)字語音編碼標(biāo)準標(biāo)準 方法 比特率 質(zhì)量 時間 應(yīng)用G.711

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論