PCM編碼詳解課件

上傳人：1*** IP屬地：河南上傳時間：2024-04-16 格式：PPT 頁數(shù)：40 大?。?66.50KB 積分：6 舉報 版權(quán)申訴

已閱讀5頁，還剩35頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

PCM與音頻編碼第3章話音編碼重點：脈沖編碼調(diào)制(PCM)增量調(diào)制與自適應(yīng)增量調(diào)制自適應(yīng)差分脈沖編碼調(diào)制（ADPCM）難點：非均勻量化增量調(diào)制子帶編碼波形聲音的數(shù)據(jù)壓縮波形聲音的碼率=取樣頻率

量化位數(shù)

聲道數(shù)

全頻帶聲音的壓縮編碼：第1代壓縮編碼：PCM編碼第2代壓縮編碼：感知聲音編碼數(shù)字語音的壓縮編碼：波形編碼參數(shù)編碼（模型編碼）混合編碼語音壓縮編碼的3類方法波形編碼

(Perceptionmodel-basedcompression)benefits:genericdrawbacks:highestcompressionratesaredifficulttoachieve>16kb/sExamples:PCM,ADPCM,Subband參數(shù)編碼,源編碼

(Productionmodel-basedcompression)benefits:highestpossiblecompression2.4Kb/sdrawbacks:signalsource(s)mustbeknowExamples:vocoder混合編碼(Hybridcompression)Examples:CELP4.8kb/s——16kb/s極低低中碼率(kb/s)1248163264優(yōu)良中差壞語音質(zhì)量模型編碼（源編碼）混合編碼波形編碼脈沖編碼調(diào)制(PCM)“防失真濾波器”是一個低通濾波器，用來濾除聲音頻帶以外的信號；“波形編碼器”可暫時理解為“采樣器”；“量化器”可理解為“量化階大小(step-size)”生成器或者稱為“量化間隔”生成器。PCM編碼框圖聲音數(shù)字化有兩個步驟：第一步是采樣，就是每隔一段時間間隔讀一次聲音的幅度；第二步是量化，就是把采樣得到的聲音信號幅度轉(zhuǎn)換成數(shù)字值。但那時并沒有涉及如何進行量化。量化有好幾種方法，但可歸納成兩類：一類稱為均勻量化，另一類稱為非均勻量化。采用的量化方法不同，量化后的數(shù)據(jù)量也就不同。因此，可以說量化也是一種壓縮數(shù)據(jù)的方法。均勻量化采用相等的量化間隔對采樣得到的信號作量化，那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度，也稱為線性量化量化后的樣本值Y和原始值X的差E=Y-X稱為量化誤差或量化噪聲非均勻量化非線性量化：對輸入信號進行量化時，大的輸入信號采用大的量化間隔，小的輸入信號采用小的量化間隔。這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示。聲音數(shù)據(jù)還原時，采用相同的規(guī)則。在非線性量化中，采樣輸入信號幅度和量化輸出數(shù)據(jù)之間定義了兩種對應(yīng)關(guān)系，一種稱為m律壓擴(companding)算法，另一種稱為A律壓擴算法。采樣頻率為8kHz，樣本精度為13位、14位或者16位的輸入信號，使用m律壓擴編碼或者使用A律壓擴編碼，經(jīng)過PCM編碼器之后每個樣本的精度為8位，輸出的數(shù)據(jù)率為64kb/s。這就是CCITT推薦的G.711標(biāo)準。m律壓擴和A律壓擴m律壓擴：北美和日本等地區(qū)13位PCM編碼轉(zhuǎn)換城8位。A律壓擴歐洲和中國大陸等地區(qū)，14位PCM編碼轉(zhuǎn)換城8位輸出信號均為64Kb/sPCM在通信中的應(yīng)用提高線路利用率通常用下面兩種方法頻分多路復(fù)用:把傳輸信道的頻帶分成好幾個窄帶，每個窄帶傳送一路信號。例如，一個信道的頻帶為1400Hz，把這個信道分成4個子信道(subchannels)：820～990Hz,1230～1400Hz,1640～1810Hz和2050～2220Hz，相鄰子信道間相距240Hz，用于確保子信道之間不相互干擾。每對用戶僅占用其中的一個子信道。這是模擬載波通信的主要手段。時分多路復(fù)用:把傳輸信道按時間來分割，為每個用戶指定一個時間間隔，每個間隔里傳輸信號的一部分，這樣就可以使許多用戶同時使用一條傳輸線路。這是數(shù)字通信的主要手段。例如，話音信號的采樣頻率f＝8000Hz，它的采樣周期＝125ms，這個時間稱為1幀(frame)。在這個時間里可容納的話路數(shù)有兩種規(guī)格：24路制和30路制。PCM在通信中的應(yīng)用PCM在通信中的應(yīng)用24路制的重要參數(shù)如下：每秒鐘傳送8000幀，每幀125ms。12幀組成1復(fù)幀(用于同步)。每幀由24個時間片(信道)和1位同步位組成。每個信道每次傳送8位代碼，1幀有24×8＋1＝193位(位)。數(shù)據(jù)傳輸率R＝8000×193＝1544kb/s。每一個話路的數(shù)據(jù)傳輸率＝8000×8=64kb/s。30路制的重要參數(shù)如下：每秒鐘傳送8000幀，每幀125ms。16幀組成1復(fù)幀(用于同步)。每幀由32個時間片(信道)組成。每個信道每次傳送8位代碼。數(shù)據(jù)傳輸率：R＝8000×32×8＝2048kb/s。每一個話路的數(shù)據(jù)傳輸率＝8000×8=64kb/s。PCM在通信中的應(yīng)用PCM信號復(fù)用的復(fù)雜程度，通常用“群(group)”表示一次群(基群)的30路(或24路),北美叫做T1遠距離數(shù)字通信線，在歐洲叫做E1遠距離數(shù)字通信線和E1等級。二次群的120路(或96路)三次群的480路(或384路)數(shù)字網(wǎng)絡(luò)等級T1/E1T2/E2T3/E3T4/E4T5/E5美國64kb/s話路數(shù)24966724.32總傳輸率(Mb/s)1.5446.51244.736274.176數(shù)字網(wǎng)絡(luò)等級12345歐洲64kb/s話路數(shù)3012048019207680總傳輸率(Mb/s)2.0488.44834.368139.2645600日本64kb/s話路數(shù)24964801440總傳輸率(Mb/s)1.5446.31232.06497.728表3-02多次復(fù)用的數(shù)據(jù)傳輸率預(yù)測編碼預(yù)測編碼(PredictionCoding)：是指利用前面的一個或多個信號對下一個信號進行預(yù)測，然后對實際值和預(yù)測值的差進行編碼。兩種典型的預(yù)測編碼：差分脈碼調(diào)制（DPCM）自適應(yīng)差分脈碼調(diào)制（ADPCM）DPCMDPCM編碼,簡稱差值編碼，是對模擬信號幅度抽樣的差值進行量化編碼的調(diào)制方式(抽樣差值的含義請參見“增量調(diào)制”)。原始的模擬信號經(jīng)過時間采樣，然后對每一樣值進行量化，作為數(shù)字信號傳輸。這種方式是用已經(jīng)過去的抽樣值來預(yù)測當(dāng)前的抽樣值，對它們的差值進行編碼。差值編碼可以提高編碼頻率，這種技術(shù)已應(yīng)用于模擬信號的數(shù)字通信之中。

差分脈碼調(diào)制(DPCM)DPCM不對每一樣值都進行量化，而是預(yù)測下一樣值，并量化實際值和預(yù)測值之間的差。DPCM是基本的編碼方法之一，在大量的壓縮算法中被采用，比如JPEG的DC分量就是采用DPCM編碼的。舉例說明DPCM編碼原理：設(shè)DPCM系統(tǒng)預(yù)測器的預(yù)測值為前一個樣值，假設(shè)輸入信號已經(jīng)量化，差值不再進行量化。若系統(tǒng)的輸入為{0121123344…}，則預(yù)測值為{0012112334…}，差值為{011–1011010…}，差值的范圍比輸入樣值的范圍有所減小，可以用較少的位數(shù)進行編碼。DPCM對于有些信號(例如圖像信號)由于信號的瞬時斜率比較大，很容易引起過載，因此，不能用簡單增量調(diào)制進行編碼，除此之外，這類信號也沒有像話音信號那種音節(jié)特性，因而也不能采用像音節(jié)壓擴那樣的方法，只能采用瞬時壓擴的方法。但瞬時壓擴實現(xiàn)起來比較困難，因此，對于這類瞬時斜率比較大的信號，通常采用一種綜合了增量調(diào)制和脈沖編碼調(diào)制兩者特點的調(diào)制方法進行編碼，這種編碼方式被簡稱為脈碼增量調(diào)制，或稱差值脈碼調(diào)制，用DPCM表示。DPCM這種調(diào)制方式的主要特點是把增量值分為個等級，然后把個不同等級的增量值編為位二進制代碼()再送到信道傳輸，因此，它兼有增量調(diào)制和PCM的各自特點。設(shè)這個誤差電壓經(jīng)過量化后變?yōu)閭€電平中的一個，電平間隔可以相等，也可以不等，這里認為它是間隔相等的均勻量化。量化了的誤差電壓經(jīng)過脈沖調(diào)制器變?yōu)镻AM脈沖序列，這個PAM信號一方面經(jīng)過PAM編碼器編碼后得到DPCM信號發(fā)送出去。另一方面把它經(jīng)過積分器后變?yōu)榕c輸入信號x(t)進行比較，通過相減器得到誤差電壓e(t)。

DPCM實驗表明，經(jīng)過DPCM調(diào)制后的信號，其傳輸?shù)谋忍芈室萈CM的低，相應(yīng)要求的系統(tǒng)傳輸帶寬也大大地減小了。此外，在相同比特速率條件下，DPCM比PCM信噪比也有很大的改善。與ΔM相比，由于它增多了量化級，因此，在改善量化噪聲方面優(yōu)于ΔM系統(tǒng)。DPCM的缺點是易受到傳輸線路上噪聲的干擾，在抑制信道噪聲方面不如ΔM。ADPCMAdpcm是自適應(yīng)差分脈沖編碼調(diào)制的簡稱，最早使用于數(shù)字通信系統(tǒng)中。該算法利用了語音信號樣點間的相關(guān)性，并針對語音信號的非平穩(wěn)特點，使用了自適應(yīng)預(yù)測和自適應(yīng)量化，在32kbps◎8khz速率上能夠給出網(wǎng)絡(luò)等級話音質(zhì)量。ADPCM為了進一步改善量化性能或壓縮數(shù)據(jù)率，可采用自適應(yīng)量化或自適應(yīng)預(yù)測的方法。只要采用了其中的任一種自適應(yīng)方法，均稱為ADPCM。自適應(yīng)預(yù)測：預(yù)測參數(shù)的最佳化依賴于信源的統(tǒng)計特性，要得到最佳的預(yù)測參數(shù)是一件繁瑣的工作。而采用固定的預(yù)測參數(shù)往往又得不到好的性能。為了既能使性能較佳，又不致于有太大的工作量，可以將上述兩種方法折衷考慮，采用自適應(yīng)預(yù)測ADPCM現(xiàn)在我們使用的是IMAADPCM算法，該算法中對量化步長的調(diào)整使用了簡單的查表方法，對于一個輸入的PCM值X(n)，將其與前一時刻的X(n-1)預(yù)測值做差值得到d(n)，然后根據(jù)當(dāng)前的量化步長對d(n)進行編碼，再用此sample點的編碼值調(diào)整量化步長，同時還要得到當(dāng)前sample點的預(yù)測值供下一sample點編碼使用。通過此算法可將樣點編碼成4bit的碼流，一個符號位和三個幅度位。ADPCM該算法較簡單，通過查表簡化了運算。對于編碼后的數(shù)據(jù)我們采用了wav文件格式，該格式對編碼后的數(shù)據(jù)流進行了包裝，由文件頭和數(shù)據(jù)碼流組成，文件頭中指出了音頻數(shù)據(jù)所采用格式、采樣率、比特率、塊長度、比特數(shù)及聲道數(shù)等信息。數(shù)據(jù)碼流以塊為單位，塊頭指出了該塊起始的預(yù)測值和index值，碼流中每byte的高四位和低四位分別對應(yīng)一個PCM。當(dāng)前該算法以其簡單實用的特點廣泛應(yīng)用到數(shù)字音樂盒和數(shù)字錄音筆中。自適應(yīng)差分脈碼調(diào)制(ADPCM)具體方法是：預(yù)測參數(shù)仍采用固定的；但此時有多組預(yù)測參數(shù)可供選擇。這些預(yù)測參數(shù)根據(jù)常見的信源特征求得。編碼時具體采用哪組預(yù)測參數(shù)根據(jù)信源的特征來自適應(yīng)的確定。為了自適應(yīng)地選擇最佳參數(shù)，通常將信源數(shù)據(jù)分區(qū)間編碼，編碼時自動地選擇一組預(yù)測參數(shù)，使該區(qū)間實際值與預(yù)測值的均方誤差最小。隨著編碼區(qū)間的不同，預(yù)測參數(shù)自適應(yīng)的變化，以達到準最佳預(yù)測。自適應(yīng)量化：根據(jù)信號分布不均勻的特點，系統(tǒng)具有隨輸入信號的變化而改變量化區(qū)間大小,以保持輸入給量化器的信號基本均勻的能力，這種能力稱為自適應(yīng)量化。

例如，Microsoft的ADPCM采用二預(yù)測參數(shù)，提供7組預(yù)測系數(shù)，如右表所示。編碼時，根據(jù)選定的準則(如最小均方誤差準則)，每個編碼區(qū)間自動地選取一組最佳的參數(shù)。系數(shù)集系數(shù)1系數(shù)2025601512-256200319264424005460-2086392-232

增量調(diào)制與自適應(yīng)增量調(diào)制增量調(diào)制(DM)增量調(diào)制也稱△調(diào)制(deltamodulation，DM)，它是一種預(yù)測編碼技術(shù)，是PCM編碼的一種變形。PCM是對每個采樣信號的整個幅度進行量化編碼，因此它具有對任意波形進行編碼的能力；DM是對實際的采樣信號與預(yù)測的采樣信號之差的極性進行編碼，將極性變成“0”和“1”這兩種可能的取值之一。如果實際的采樣信號與預(yù)測的采樣信號之差的極性為“正”，則用“1”表示；相反則用“0”表示，或者相反。由于DM編碼只須用1位對話音信號進行編碼，所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。增量調(diào)制(DM)在輸入信號變化快的區(qū)域，斜率過載是關(guān)心的焦點，而在輸入信號變化慢的區(qū)域，關(guān)心的焦點是粒狀噪聲。為了盡可能避免出現(xiàn)斜率過載，就要加大量化階Δ，但這樣做又會加大粒狀噪聲；相反，如果要減小粒狀噪聲，就要減小量化階Δ，這又會使斜率過載更加嚴重。這就促進了對自適應(yīng)增量調(diào)制(adaptivedeltamodulation，ADM)的研究自適應(yīng)增量調(diào)制(ADM)基本方法：在檢測到斜率過載時開始增大量化階Δ，而在輸入信號的斜率減小時降低量化階Δ。例如，宋(Song)在1971描述的自適應(yīng)增量調(diào)制技術(shù)中提出：假定增量調(diào)制器的輸出為1和0，每當(dāng)輸出不變時量化階增大50%，使預(yù)測器的輸出跟上輸入信號；每當(dāng)輸出值改變時，量化階減小50%，使粒狀噪聲減到最小，這種自適應(yīng)方法使斜率過載和粒狀噪聲同時減到最小。又如，使用較多的另一種自適應(yīng)增量調(diào)制器是由格林弗基斯(Greefkes)1970提出的，稱為連續(xù)可變斜率增量調(diào)制(continuouslyvariableslopedeltamodulation，CVSD)。它的基本方法是：如果連續(xù)可變斜率增量調(diào)制器(continuouslyvariableslopedeltamodulator，CVSD)的輸出連續(xù)出現(xiàn)三個相同的值，量化階就加上一個大的增量，反之，就加一個小的增量。自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)脈沖編碼調(diào)制(adaptivepulsecode

modulation，APCM)是根據(jù)輸入信號幅度大小來改變量化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬時自適應(yīng)，即量化階的大小每隔幾個樣本就改變，也可以是音節(jié)自適應(yīng)，即量化階的大小在較長時間周期里發(fā)生變化。改變量化階大小的方法有兩種：一種稱為前向自適應(yīng)(forwardadaptation)，另一種稱為后向自適應(yīng)(backwardadaptation)。前向自適應(yīng)：根據(jù)未量化的樣本值的均方根值來估算輸入信號的電平，以此來確定量化階的大小，并對其電平進行編碼作為邊信息(sideinformation)傳送到接收端。后向自適應(yīng)：從量化器剛輸出的過去樣本中來提取量化階信息。由于后向自適應(yīng)能在發(fā)收兩端自動生成量化階，所以它不需要傳送邊信息。自適應(yīng)差分脈沖編碼調(diào)制差分脈沖編碼調(diào)制的思想：根據(jù)過去的樣本去估算(estimate)下一個樣本信號的幅度大小，這個值稱為預(yù)測值，然后對實際信號值與預(yù)測值之差進行量化編碼，從而就減少了表示每個樣本信號的位數(shù)。它與脈沖編碼調(diào)制(PCM)不同的是，PCM是直接對采樣信號進行量化編碼，而DPCM是對實際信號值與預(yù)測值之差進行量化編碼，存儲或者傳送的是差值而不是幅度絕對值，這就降低了傳送或存儲的數(shù)據(jù)量。此外，它還能適應(yīng)大范圍變化的輸入信號。自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM(adaptivedifferencepulsecodemodulation)綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性，是一種性能比較好的波形編碼。它的核心想法是：①利用自適應(yīng)的思想改變量化階的大小，即使用小的量化階(step-size)去編碼小的差值，使用大的量化階去編碼大的差值,②使用過去的樣本值估算下一個輸入樣本的預(yù)測值，使實際樣本值和預(yù)測值之間的差值總是最小。它的編碼簡化框圖如下圖所示。ADPCM編譯碼器G.721推薦標(biāo)準，這個標(biāo)準叫做32kb/s自適應(yīng)差分脈沖編碼調(diào)制。在此基礎(chǔ)上還制定了G.721的擴充推薦標(biāo)準，即G.723，使用該標(biāo)準的編碼器的數(shù)據(jù)率可降低到40kb/s和24kb/s。G.722SB-ADPCM編譯碼器G.722推薦標(biāo)準，叫做“數(shù)據(jù)率為64kb/s的7kHz聲音信號編碼——這個標(biāo)準把話音信號的質(zhì)量由電話質(zhì)量提高到AM無線電廣播質(zhì)量，而其數(shù)據(jù)傳輸率仍保持為64kb/s。子帶編碼(subbandcoding，SBC)的基本思想是：使用一組帶通濾波器(band-passfilter，BPF)把輸入音頻信號的頻帶分成若干個連續(xù)的頻段，每個頻段稱為子帶。對每個子帶中的音頻信號采用單獨的編碼方案去編碼。在信道上傳送時，將每個子帶的代碼復(fù)合起來。在接收端譯碼時，將每個子帶的代碼單獨譯碼，然后把它們組合起來，還原成原來的音頻信號。子帶編碼的編碼/譯碼器，可以采用ADPCM，APCM，PCM等。等帶寬的子帶不等帶寬的子帶G.722SB-ADPCM編譯碼器窄帶和寬帶音頻信道頻率特性

全頻帶聲音的第1代編碼技術(shù)全頻帶聲音指的是10Hz～20,000Hz范圍里的所有可聽聲音.也叫做寬帶聲音或高保真(high-fidelity)聲音;第1代全頻帶數(shù)字聲音（CD，DAT）的編碼采用PCM編碼：采樣頻率：44.1kHz或48kHz量化精度：16位聲道數(shù)目：1或2碼率：705.6/768(kb/s)或1.41/1.54(Mb/s)全頻帶聲音的第2代編碼技術(shù)目標(biāo)：在保持高保真聲音質(zhì)量（transparentcompression）的前提下，降低碼率，減輕網(wǎng)絡(luò)帶寬的壓力；不但充分使用聲音信息的統(tǒng)計冗余，而且利用人耳的聽覺特性，即使用“心理聲學(xué)模型(psycho-acousticmodel)”，來達到壓縮數(shù)據(jù)的目的,稱為感知聲音編碼(perceptualaudiocoding)。全頻帶數(shù)字音頻的編碼標(biāo)準MP3音樂是什么？DolbyAC-3是什么？RealAudio是什么？數(shù)字語音編碼標(biāo)準標(biāo)準方法比特率質(zhì)量時間應(yīng)用G.711

人人文庫> 全部分類> 應(yīng)用文書 > 作業(yè)報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

PCM編碼詳解課件

文檔簡介

溫馨提示

最新文檔

評論

PCM編碼詳解課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔