版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
回聲的產(chǎn)生在實(shí)時(shí)通信中,回聲是不行避開的,A端發(fā)送的聲音在B端放出后,會隨著B的聲音再傳送到A端,形成回聲。當(dāng)A-B間延時(shí)很小,則A的回聲與A語音近似重疊,人耳無法辨別。在PSTN網(wǎng)中,對于一般的市話呼叫,就屬于這種狀況。假如A-B延時(shí)較大,則回聲和語音就能被人耳所辨別,形成干擾。衛(wèi)星電話和IP電話就屬于這種狀況ABEchoofAVoutVin回聲的分類分為聲回聲(AcousticEcho)和線回聲(LineEcho)聲回聲:Vout播放出來,經(jīng)空氣傳播,通過直射、反射等各種方式,形成Vin。聲回聲形成困難,回聲路徑多樣化,回聲延時(shí)較大。線回聲:在公用電話網(wǎng)中,干線傳輸接受4線方式(收、發(fā)各兩線),而到交換局和電話終端之間,則接受2線方式(收發(fā)語音合并)。在2-4線轉(zhuǎn)換過程中,由于阻抗匹配的問題,總會有些語音干脆回傳到發(fā)端,形成回聲。這種回聲路徑比較固定(就是2-4線轉(zhuǎn)換器),回聲延時(shí)也比較小。線回聲抵消技術(shù)對于LineEcho,由于回聲路徑固定,回聲延時(shí)較小,一般接受自適應(yīng)濾波技術(shù),用一個(gè)濾波器來模擬回聲路徑,并將濾波器輸出與實(shí)際的采樣語音相減,從而抵消掉回聲。2-42-4EchoCancellerFilter-128階濾波器,可抵消16ms的回聲。一般接受LMS算法估計(jì)濾波器系數(shù)。聲回聲抵消技術(shù)與LineEcho相比,AcousticEcho的回聲路徑更加困難,而且路徑的時(shí)變性更大,因此LMS算法已無法剛好跟蹤。而且由于回聲延時(shí)很大,假如接著接受線性濾波器,則運(yùn)算量將大幅增加。首先要選擇更好的自適應(yīng)濾波算法,有更快的收斂速度。其次要接受一些特殊的濾波器結(jié)構(gòu),以減小運(yùn)算量。還可以接受多點(diǎn)語音輸入輸出方式,利用他們的空間相對位置進(jìn)行計(jì)算。在多媒體通信中的應(yīng)用和公用電話網(wǎng)相比,基于Internet的語音通信有巨大的延時(shí)。編解碼延時(shí)(10-30ms)網(wǎng)絡(luò)延時(shí)(幾十至幾百ms)處理延時(shí)(取決于處理器,一般幾ms)因此收發(fā)兩端延時(shí)往往能達(dá)到上百ms,必需接受回聲抵消技術(shù)。在端對端通信中,一般接受線回聲抵消,在會議通信中,一般接受聲回聲抵消。語音降噪在一些惡劣的通信環(huán)境下,往往通話中含有極大的噪聲(如坦克之間的通信),對通信造成很大的影響。噪聲和語音在特性上有很大的不同??梢岳眠@些特征,將噪聲和語音分別,再單獨(dú)對語音作編碼。語音的例子,噪音的例子。語音編輯處理軟件CoolEdit2000噪音和語音的特征過零率:噪音的過零率高,而語音的過零率低?;蛑芷冢涸肼暃]有周期性,而語音有比較明顯的周期特征。短時(shí)能量:噪聲的短時(shí)能量穩(wěn)定,語音的短時(shí)能量變更較大。增益限制在企業(yè)的會議通信中,兩個(gè)Group之間的會議是很典型的應(yīng)用。此時(shí)一個(gè)Group中的每個(gè)成員,距離通信終端的距離都不同。自動增益限制(AGC)通過檢測輸入信號的能量,并進(jìn)行調(diào)整,使得發(fā)送到對端的語音信號能量基本相同,讓對端有一個(gè)較好的聽覺效果。增益限制(二)增益限制的基本技術(shù)是讓語音的短時(shí)能量靠近其長時(shí)能量。長時(shí)能量的更新較慢,比較穩(wěn)定。短時(shí)能量變更雖然快,但對于每個(gè)音節(jié)來說,相差不大。因此由于距離調(diào)整所引起的短時(shí)能量變更,假如向長時(shí)能量靠近,則可以保持語音能量的平穩(wěn)性。對于更困難的增益限制算法,應(yīng)考慮對噪聲放大所產(chǎn)生的問題。語音壓縮聲音的分類語音編碼的性能評價(jià)指標(biāo)和國際標(biāo)準(zhǔn)語音的特點(diǎn)和模型幾種基本的語音編碼技術(shù)CELP編碼模型的分析聲音的分類語音(TelephoneSpeech),200~3400Hz,8KHz采樣,主要應(yīng)用于數(shù)字電話波形編碼參數(shù)編碼混合編碼寬帶語音(WidebandSpeech),50~7000HZ16KHz采樣,主要應(yīng)用于會議電視,相當(dāng)于調(diào)幅廣播質(zhì)量音頻(Audio),10-20000Hz,主要應(yīng)用在消遣與欣賞對于重建信號的音質(zhì)有很高的要求,目前接受比特率較高的波形編碼技術(shù)進(jìn)行壓縮。語音編碼性能指標(biāo)
1.編碼速率(KBPS、KB/S)信號帶寬:200~3400Hz、50~7000Hz、10~20000Hz采樣頻率:8K、16K、32K、44.1/48K(Hz)壓縮碼流速率(kb/s)2.編解碼延時(shí) 公用電話網(wǎng)5~10ms,移動蜂窩網(wǎng)不超過100ms3.算法困難度和可擴(kuò)展性 用MIPS衡量,現(xiàn)在的DSP運(yùn)算實(shí)力達(dá)到幾百上千MIPS。G729和G729A,可擴(kuò)展性的例子。4.抗誤碼,抗丟包的實(shí)力5.魯棒性 對不同音源,不同環(huán)境下有同樣的質(zhì)量。系統(tǒng)級聯(lián)后多次編碼解碼后語音的質(zhì)量。語音編碼性能評價(jià)
1.編碼速率(KBPS、KB/S)信號帶寬:200~3400Hz、50~7000Hz、10~20000Hz采樣頻率:8K、16K、32K、44.1/48K(Hz)壓縮碼流速率(kb/s)2.重建語音質(zhì)量 客觀評價(jià):信噪比 主觀評價(jià):MOS分(1-5分)3.編解碼延時(shí)(ms)4.算法困難度5.抗誤碼,抗丟包的實(shí)力,多次編碼解碼后語音的質(zhì)量語音編碼質(zhì)量評價(jià)(一)
可懂度評價(jià):推斷韻字測試,改進(jìn)韻字測試音質(zhì)評價(jià):MOS(MeanOpinionScore),DMOS(DegradationMOS)得分MOSDMOS5優(yōu)不察覺4良剛察覺3中有察覺,稍覺可厭2差明顯察覺,勉強(qiáng)忍受1劣不可忍受語音編碼的速率、困難度和語音質(zhì)量有著相互制約的關(guān)系。速率和困難度都有客觀的評價(jià)標(biāo)準(zhǔn),而語音質(zhì)量更多的是主觀感受。主觀評價(jià)方法:可懂度評價(jià)和音質(zhì)評價(jià)。可懂度反映對語音內(nèi)容的識別程度,音質(zhì)包括語音的自然度和講話人的可識別性。音質(zhì)高-〉可懂度高;反之不確定成立。語音編碼質(zhì)量評價(jià)(二)
時(shí)域測度 信噪比(SNR),分段信噪比。越大越好。頻域測度 對數(shù)譜距離,倒譜距離,Mel譜。越小越好主觀評價(jià)方法的執(zhí)行受人員的很大制約,受到測試者的內(nèi)在的不行重復(fù)性的影響,而且無法干脆反映出系統(tǒng)參數(shù)的一些影響。為此須要客觀標(biāo)準(zhǔn)。一般接受下圖進(jìn)行客觀質(zhì)量評價(jià),其關(guān)鍵點(diǎn)是同步。待測語音系統(tǒng)同步客觀評價(jià)標(biāo)準(zhǔn)評價(jià)結(jié)果輸出語音輸入語音一些語音編碼標(biāo)準(zhǔn)名稱采樣率KHz編碼速率Kb/s編碼制式年代MOSDRT備注G.711864PCM19724.395G.726816~40ADPCM1984~884.19432kb/sG.728816LD-CELP19924.194G.729(A/D/E)88/6.4/11.4CS-ACELP19954.1G.723.185.3ACELP19953.8G.723.186.3MP-MLQ19954.0G.7221648~64SUB-ADPCM19883.7~4.1發(fā)聲特點(diǎn)時(shí)變性,短時(shí)不變性發(fā)聲器官:喉(激勵(lì)),聲道(濾波器),嘴清音與濁音,聲母與韻母發(fā)聲模型周期脈沖發(fā)生器聲門脈沖模型G(z)聲道模型V(z)輻射模型R(z)隨機(jī)噪聲發(fā)生器XX基音頻率F0聲道參數(shù)AvAv語音語音編碼技術(shù)的分類有損壓縮波形編碼:主要基于語音波形預(yù)料,目標(biāo)是使重建語音波形保持不變。語音質(zhì)量好,簡潔易實(shí)現(xiàn),但編碼速率較高。參數(shù)編碼:通過語音信號的數(shù)學(xué)模型提取語音的參數(shù)并編碼,目標(biāo)是使重建信號盡可能保持原信號的語意。一般我們稱之為聲碼器。一般用于4.8kb/s以下的低速信道?;旌暇幋a:結(jié)合波形編碼的高質(zhì)量和參數(shù)編碼的低碼率,被廣泛接受。波形編碼PCM:對每個(gè)樣點(diǎn)獨(dú)立編碼,利用非勻整量化,將每個(gè)樣點(diǎn)編碼為8比特。DPCM:利用相鄰兩個(gè)樣點(diǎn)的相關(guān)性,對相鄰樣點(diǎn)的差值進(jìn)行編碼,這樣減小了編碼數(shù)據(jù)的動態(tài)范圍,用較少的比特就可以得到同樣的量化誤差?!鱉:類似DPCM,但只用一個(gè)比特對差值進(jìn)行編碼,因此須要較高的采樣率。以上編碼方法都屬于波形編碼,其特點(diǎn)是對采樣點(diǎn)逐點(diǎn)處理。參數(shù)編碼(一)由于人的發(fā)聲器官的特點(diǎn),發(fā)聲過程可以被抽象為確定的模型。參數(shù)編碼就是將實(shí)際語音信號作為模型輸出,去求模型輸入與模型參數(shù),并將其作為編碼結(jié)果。語音存在周期性,為了提取該周期,須要的語音數(shù)據(jù)長度至少要大于一個(gè)周期。一般選10ms的倍數(shù),最低為10ms。參數(shù)編碼(二)重要的語音參數(shù):基因頻率:語音時(shí)域波形周期性信號的頻率。男性一般是60-200Hz,女性和兒童是200-450Hz。共振峰:頻譜中的凸起點(diǎn)。與聲道的諧振頻率相對應(yīng)。短時(shí)過零率:單位時(shí)間內(nèi),語音信號過零點(diǎn)的次數(shù)。短時(shí)能量:短時(shí)自相關(guān)函數(shù):混合編碼參數(shù)編碼得到的解碼語音,和原始語音相比,有較多的損傷,緣由是模型的參數(shù)無法限制語音的全部特性。因此,為了得到較高質(zhì)量的解碼語音,必需引入波形編碼的一些技術(shù)。事實(shí)上,語音的激勵(lì)信號中的固定碼本,就是利用大量實(shí)際語音統(tǒng)計(jì)得到的。預(yù)料編碼(一)由于語音信號存在關(guān)聯(lián)性,可利用前面的一個(gè)或多個(gè)信號對下一個(gè)信號進(jìn)行預(yù)料,得到預(yù)料值,然后將實(shí)際值和預(yù)料值求差,并對差值信號進(jìn)行編碼傳送。由于差值信號的動態(tài)范圍很小,用較少的比特就可以精確的量化,從而壓縮數(shù)據(jù)。線形預(yù)料編碼(LPC,LinearPredictiveCoding) 采樣值為f(n),預(yù)料值為f’(n)。 差值為e(n)=f(n)-f’(n).線形預(yù)測器—f(n)e(n)f’(n)預(yù)料編碼(二)△調(diào)制與DPCM△調(diào)制是PCM的變形,是對實(shí)際采樣信號與預(yù)料信號差值的極性進(jìn)行編碼。若差值大于量化階△,輸出為1,否則輸出0,每個(gè)樣點(diǎn)編碼為1個(gè)比特。當(dāng)輸入信號變更過快,就會出現(xiàn)斜率過載。DPCM,用上一個(gè)樣點(diǎn)值作為本次樣點(diǎn)的預(yù)料值,對差值進(jìn)行編碼。CELP編碼接受分幀技術(shù),幀長20-30ms?;诤铣煞治?A-B-S)的搜尋過程,感覺加權(quán)矢量量化和線性預(yù)料技術(shù)。CELP一般將每一幀語音分為2-5個(gè)子幀,在每個(gè)子幀內(nèi)搜尋最佳的碼矢量。CELP編碼模型……固定碼本自適應(yīng)碼本+線性預(yù)料濾波器1/A(z)感覺加權(quán)濾波器W(z)+最小感覺加權(quán)誤差gsga碼本的獲得固定碼本:經(jīng)過大量語音的統(tǒng)計(jì)獲
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 員工培訓(xùn)課件定制制度
- 培訓(xùn)學(xué)籍管理制度
- 依法執(zhí)業(yè)教育培訓(xùn)制度
- 培訓(xùn)機(jī)構(gòu)勞動人事制度
- 養(yǎng)老護(hù)理培訓(xùn)管理制度
- 培訓(xùn)班學(xué)校安全制度
- 培訓(xùn)晨檢制度及流程
- 業(yè)務(wù)培訓(xùn)測試制度
- 醫(yī)院儀器培訓(xùn)制度
- 浙江教師培訓(xùn)制度
- 2026年江蘇經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試參考題庫含答案解析
- 2026湖南師大附中雨花學(xué)校春季合同制教師招聘考試備考題庫及答案解析
- 2026年云南省影視協(xié)會招聘工作人員(2人)筆試參考題庫及答案解析
- 2026天津市津南創(chuàng)騰經(jīng)濟(jì)開發(fā)有限公司招聘8人筆試備考試題及答案解析
- 防寒防凍防滑安全培訓(xùn)課件
- 《危險(xiǎn)化學(xué)品安全法》解讀與要點(diǎn)
- 2025秋滬科版(五四制)(新教材)初中科學(xué)六年級第一學(xué)期知識點(diǎn)及期末測試卷及答案
- 九年級英語全冊 各單元話題及語法要點(diǎn) 魯教版
- 讓財(cái)務(wù)助推業(yè)務(wù)-業(yè)財(cái)融合課件
- 第4章 農(nóng)業(yè)水土工程123(學(xué)生版) 農(nóng)業(yè)水土工程與節(jié)水農(nóng)業(yè) 農(nóng)業(yè)工程概論 教學(xué)課件
- 土地利用現(xiàn)狀調(diào)查技術(shù)規(guī)程1984
評論
0/150
提交評論