版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
[15]。端點檢測的某些數(shù)據(jù)能夠讓倒譜距離來表示,原因是語音的性質(zhì)能通過倒譜來表現(xiàn)的很好。當環(huán)境中的噪聲很強的時候,倒譜的距離可以由倒譜系數(shù)來求出。2.6語音信號的端點檢測2.6.1兩級判決法 采用雙門限比較法的兩級判決法,具體如下 第一級判決: 1.先根據(jù)語音短時能量的輪廓選取一個較高的門限T1,進行一次粗判:語音起止點位于該門限與短時能量包絡交點所對應的時間間隔之外(即AB段之外)。 2.根據(jù)背景噪聲的平均能量確定一個較低的門限T2,并從A點往左、從B點往右搜索,分別找到短時能量包絡與門限T2相交的兩個點C和D,于是CD段就是用雙門限方法根據(jù)短時能量所判定的語音段。 第二級判決: 以短時平均過零率為標準,從C點往左和從D點往右搜索,找到短時平均過零率低于某個門限T3的兩點E和F,這便是語音段的起止點。門限T3是由背景噪聲的平均過零率所確定的。 注意:門限T2,T3都是由背景噪聲特性確定的,因此,在進行起止點判決前,T1,T2,T3,三個門限值的確定還應當通過多次實驗。圖2-4兩級判決法示意圖2.6.2雙門限檢測信號經(jīng)過分幀操作后,求出每幀所具有的能量及過零率,并且計算得到能量和過零率的比值(能零比);對語音預處理之后,設(shè)定參數(shù)的默認值,例如最大靜音長度。判別語音是否處于靜音段還是在過渡段的條件就是判斷它所具有的能量以及過零率是否在最初設(shè)定的低門限以上或者以下。若是在以上則處于語音段;若在以下就處于過渡期;若都沒有,信號依然處于靜音段;判別語音是否依舊在語音段的條件就是看它所具有的能量或者過零率是否高于最初設(shè)定的門限值。若是高于它,就表示依舊為語音段;若設(shè)定的初始長度比此時的大,則表示依舊在語音段,還沒有終止;若噪聲長度的最低值大于此時信號的長度,則可以判定是語音不夠長,這時的信號是噪聲,此時還能夠判定語音信號是在靜音段,如果不是那么就說明語音段已經(jīng)進入了結(jié)束段。2.7譜減法語音降噪 譜減法算法是最早的語音去噪算法之一。它基于一個簡單的原理:假設(shè)語音中的噪聲只有加性噪聲,只要從混噪語音頻譜中減去噪聲頻譜,就可以得到純粹的語音幅度,其前提是噪聲信號穩(wěn)定或緩慢變化。 在獲得純信號的幅度譜之后,可以組合噪聲語音相位(大致替換純語音相位)以獲得近似純語音。之所以能做到這一點是因為語音信號的相位不會影響語音清晰度。按上述所示,如果我們設(shè)y(n)為受噪聲污染的信號,則由純凈語音信號和加性噪聲組成,即:(2.16)其傅里葉變換后表示為:(2.17)或?qū)憺椋?2.18)如果用功率譜表示可以寫為: (2.19)這里被稱為交叉項,我們假定d(n)具有0均值,并且與x(n)不相關(guān),則交叉項為0,上述公式簡化為: (2.20)或?qū)憺椋?2.21)基于MATLAB的語音分析平臺的實現(xiàn) 本語音分析平臺由語音信號的時域和頻域分析、端點檢測、語音降噪三大模塊組成,使用圖形界面集成為一個平臺。3.1圖形用戶界面設(shè)計 圖形用戶界面(GUI)是指以圖形方式顯示的計算機操作環(huán)境的用戶界面。與較早時期計算機使用的命令行界面相比,圖形界面更加便于用戶使用。 GUI的廣泛應用是當今計算機開發(fā)的重要成就之一,它非常大地方便了許多非專業(yè)用戶的使用。有了GUI以后,人們可以不再記憶大量的命令。相反,他們可以通過窗口,菜單,按鈕等操作。GUIDE是由MATLAB提供的圖形用戶界面開發(fā)環(huán)境。它提供了一系列用于創(chuàng)建圖形用戶界面的工具,以簡化界面布局和編程。3.2播放語音文件3.2.1選擇已有語音文件 在主界面(圖3-1)中的左上面板可以選擇本地已有音頻文件,點擊“在文件夾中選擇語音文件”將會彈出窗口“請選擇語音文件”(圖3-2)或快速選擇“測試音頻1”,選擇文件后將會出現(xiàn)語音信號時域圖,此時也可以點擊“播放語音”來試聽。 圖3-1語音信號時域圖預覽圖3-2選擇語音文件3.2.2錄制語音文件 在錄制語音的面板輸入錄音時間,再點擊“錄制語音”按鈕即可開始錄制語音文件,在錄音結(jié)束后會自動播放當前錄制語音,再彈出保存文件的窗口,可自行選擇是否保存本次錄制的語音(圖3-3)。圖3-3語音信號錄制界面3.3播放語音文件 點擊“播放語音”按鈕即可播放當前選中的語音文件。3.4語音信號的時域和頻域分析 實現(xiàn)已讀入語音信號的時域和頻域分析,具體包括時域圖,短時譜,語譜圖,短時能量分析,短時平均過零率。 原始信號時域圖時間軸為橫軸,幅值軸為縱軸,其含義為所有頻率疊加幅值的總大小隨時間的變化規(guī)律。 語音信號的頻譜是隨時間變化的,但語音信號的變化較為緩慢,所以在一幀內(nèi)(如)可以當作頻譜是穩(wěn)定的,這樣的頻譜我們叫做短時譜,短時譜表現(xiàn)的是語音信號頻譜的靜態(tài)特性。 語譜圖是一種三維頻譜,其含義為語音頻譜跟隨時間一起變化的圖形,頻率軸為縱軸,橫軸是時間,給定時刻的頻率的強弱用相應點的灰度圖或顏色的深淺表示,色彩越深語音能量越強。由圖3-4可以看到在頻率高時,語譜圖顏色更深,能量越強。圖3-4短時譜、語譜圖 在圖3-5中可以看到,語音信號的過零率與頻率的高低成正比,在信號頻率較高時,過零率也隨之變高。圖3-5短時平均過零率 在采用短時能量反映語音信號的幅度變化時,不同的窗函數(shù)和窗長都會影響結(jié)果。漢明窗的效果比矩形窗略好。但是,窗長的影響占主要,窗長(N)過大,等效于很窄的低通濾波器,不能反映幅度En的變化;窗長過小,短時能量隨時間急劇變化,不能得到平滑的能量函數(shù)。在11.025kHz左右的采樣頻率下,N值為100~200合適。圖3-6短時能量 短時能量較低,過零率高的是清音,濁音正好相反。高頻率與高過零率對應,低頻率與低過零率相對應,過零率與語音的清濁音就存在著對應關(guān)系。清音的過零率為0.6左右,濁音的過零率為0.2左右,兩者分布有相互重的區(qū)域,不能單一憑借平均過零率來正確地判斷清濁音,在實際應用中往往是采用語音的多個特征參數(shù)進行綜合判決3.5語音信號的端點檢測 能量是區(qū)別語音和噪聲的主要途徑,語音的能量較之噪聲的大,雙門限檢測算法是利用短時過零率和短時能量相結(jié)合,清音使用短時過零率檢測,濁音則用短時能量檢測,利用這兩個配合可以實現(xiàn)在SNR(信噪比)較大情況下的端點檢測。在MATLAB仿真實驗環(huán)境下得到了較好的結(jié)果,但在信噪比降低時,準確率也會降低,所以在信噪比較高時可以采用本方法。圖3-7語音信號端點檢測3.6語音信號的增強降噪 基于譜減法的語音信號的增強降噪,在本模塊中有原始信號,加噪信號和降噪信號,可以直觀地看到各種信號的波形圖和語譜圖并播放聲音,在實際使用過程中,在噪聲電平小于等于0.05時,效果較好,達到預期效果。通過原始信號與加噪信號的波形圖的對比可以看到加噪信號中相對于原始信號加入了噪聲,通過處理后降噪信號的波形較為接近原始信號,但相較于原始信號還存在一些噪聲,通過語音的播放也能明顯的聽到。圖3-8語音信號降噪界面3.7MATLAB文件封裝為EXE可執(zhí)行程序 在MTALAB命令窗口中輸入“mbuild–setup”選擇編譯器,本此設(shè)計使用的編譯器為MicrosoftVisualC++2010Express,選擇編譯器之后再輸入deploytool,MTATLAB彈出的Deploymenttool窗口中添加m文件,點擊build按鈕完成編譯。在有裝有MCR(MATLABCompilerRuntime)的計算機上可以直接打開該EXE可執(zhí)行程序,而不用再打開MATLAB軟件,在沒有MCR的計算機上則需要安裝MCR才能打開。圖3-9MATLAB文件封裝為exe4總結(jié)與展望4.1全文總結(jié) 本設(shè)計是基于MATLAB的語音分析平臺設(shè)計,語音是我們?nèi)粘I铍x不開的東西,即使現(xiàn)代通信中語音,視頻,圖片,文字等多種信息媒體并存,但語音通信仍然處于主流通信方式,而對語音信號進行分析處理對提升通信的質(zhì)量至關(guān)重要,近幾年人工智能也飛速的發(fā)展,語音識別技術(shù)也被應用到各種智能終端,對語音信號進行分析和處理也是語音識別的基礎(chǔ)條件,所以本設(shè)計對于研究語音信號有非凡的意義。在本設(shè)計中,完成語音信號的時域和頻域分析,并在此基礎(chǔ)上進一步使用雙門限檢測法實現(xiàn)端點檢測和譜減法實現(xiàn)語音降噪,取得了較好的效果,但因時間較為倉促,所以未使用多種方法對照,此外,使用sound函數(shù)播放語音不能手動停止,即使在關(guān)閉GUI界面后也不會停止播放,必須要等語音播放完,在查閱資料后發(fā)現(xiàn)audioplayer函數(shù)可以手動停止,但由于本計算機的2010b版本MATLAB不支持audioplayer函數(shù),所以本次設(shè)計中存在這么一個缺陷。4.2進一步工作 在完成語音信號最基本的分析和處理后,使我對語音信號的有了進一步的認
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026遼寧沈陽理工大學招聘高層次人才94人備考題庫(第一批)及答案詳解(考點梳理)
- 2026年農(nóng)村污水生態(tài)處理模式解析
- 2026浙江溫州市洞頭人才發(fā)展有限公司招聘1人備考題庫(食堂工作人員)及參考答案詳解一套
- 2026福建海峽人才網(wǎng)絡資訊有限公司前端開發(fā)人員招聘1人備考題庫(含答案詳解)
- 2026福建漳州市詔安縣機關(guān)事業(yè)單位社會保險中心招募見習人員2人備考題庫有完整答案詳解
- 礦業(yè)開發(fā)經(jīng)理年終總結(jié)(3篇)
- 空調(diào)維修年終總結(jié)范文(3篇)
- 職業(yè)健康促進的經(jīng)濟學評價
- 職業(yè)健康與心理健康的協(xié)同管理路徑
- 遂寧四川遂寧射洪市部分衛(wèi)生事業(yè)單位招聘農(nóng)村訂單定向醫(yī)學畢業(yè)生4人筆試歷年參考題庫附帶答案詳解
- 2026福建廈門市高崎出入境邊防檢查站招聘警務輔助人員30人備考題庫及完整答案詳解
- 2026西藏自治區(qū)教育考試院招聘非編工作人員11人筆試備考試題及答案解析
- 2026年度黑龍江省生態(tài)環(huán)境廳所屬事業(yè)單位公開招聘工作人員57人備考題庫及一套答案詳解
- 炎癥因子風暴與神經(jīng)遞質(zhì)紊亂的干細胞干預策略
- 2026年1月浙江省高考(首考)英語試題(含答案)+聽力音頻+聽力材料
- 中國大型SUV市場數(shù)據(jù)洞察報告-
- 太陽能路燈施工組織設(shè)計
- 2025年農(nóng)村會計考試試題題庫及答案
- 檢驗科電解質(zhì)教學課件
- 浙江省杭州市西湖區(qū)杭州學軍中學2025-2026學年物理高二上期末質(zhì)量跟蹤監(jiān)視試題含解析
- 房建工程施工工藝流程
評論
0/150
提交評論