【畢業(yè)設(shè)計(jì)】語音信號(hào)的采集與分析_第1頁
【畢業(yè)設(shè)計(jì)】語音信號(hào)的采集與分析_第2頁
【畢業(yè)設(shè)計(jì)】語音信號(hào)的采集與分析_第3頁
【畢業(yè)設(shè)計(jì)】語音信號(hào)的采集與分析_第4頁
【畢業(yè)設(shè)計(jì)】語音信號(hào)的采集與分析_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

河南農(nóng)業(yè)大學(xué)本科生畢業(yè)論文(設(shè)計(jì))任務(wù)書論文(設(shè)計(jì))題目語音信號(hào)的采集與分析學(xué)院專業(yè)班級(jí)學(xué)號(hào)姓名2009年月日論文(設(shè)計(jì))選題的來源、目的與意義通過語音傳遞倍息是人類最重要、最有效、最常用和最方便的交換信息的形式。讓計(jì)算機(jī)能聽懂人類的語言,是人類自計(jì)算機(jī)誕生以來夢(mèng)寐以求的想法,用現(xiàn)代手段研究語音信號(hào),使人們能更加有效地產(chǎn)生、傳輸、存儲(chǔ)、獲取和應(yīng)用語音信息,這對(duì)于促進(jìn)社會(huì)的發(fā)展具有十分重要的意義。論文(設(shè)計(jì))的主要內(nèi)容本文簡(jiǎn)要介紹了語音信號(hào)采集與分析的發(fā)展史以及語音信號(hào)的特征、采集與分析方法,并通過PC機(jī)錄制自己的一段聲音,運(yùn)用MATLAB進(jìn)行仿真分析,最后加入噪聲進(jìn)行濾波處理,比較濾波前后的變化。進(jìn)度計(jì)劃(進(jìn)度時(shí)間、主要工作內(nèi)容)220301熟悉選題,查找閱讀相關(guān)資料。302410根據(jù)選題的要求提取各種用信息加以綜合利用,完成論文總體框架411425精心修改論文,在老師的指導(dǎo)下調(diào)試程序,完成論文總體設(shè)計(jì)。423510在指導(dǎo)老師的幫助下進(jìn)行最后一次精心修改,完成了終稿。主要參考文獻(xiàn)1胡航語音信號(hào)處理【M】哈爾濱哈爾濱工業(yè)大學(xué)出版社,20022丁玉美高西全數(shù)字信號(hào)處理【M】西安電子科技大學(xué)出版社,20063樊昌信通信原理【M】北京國(guó)防工業(yè)出版社,20054張威MATLAB基礎(chǔ)與編程入門【M】西安電子科技大學(xué)出版社,20065何強(qiáng),何英MATLAB擴(kuò)展編程【M】北京清華大學(xué)出版社,2002293296論文(設(shè)計(jì))工作起訖日期2009年02月20日至2009年05月10日指導(dǎo)教師(簽名)院長(zhǎng)(簽名)語音信號(hào)的采集與分析作者123指導(dǎo)老師456摘要語音信號(hào)的采集與分析技術(shù)是一門涉及面很廣的交叉科學(xué),它的應(yīng)用和發(fā)展與語音學(xué)、聲音測(cè)量學(xué)、電子測(cè)量技術(shù)以及數(shù)字信號(hào)處理等學(xué)科緊密聯(lián)系。其中語音采集和分析儀器的小型化、智能化、數(shù)字化以及多功能化的發(fā)展越來越快,分析速度較以往也有了大幅度的高。本文簡(jiǎn)要介紹了語音信號(hào)采集與分析的發(fā)展史以及語音信號(hào)的特征、采集與分析方法,并通過PC機(jī)錄制自己的一段聲音,運(yùn)用MATLAB進(jìn)行仿真分析,最后加入噪聲進(jìn)行濾波處理,比較濾波前后的變化。關(guān)鍵詞語音信號(hào),采集與分析,MATLABAUDIOSIGNALACQUISITIONANDANALYSISAUTHORZHUYOUSONGTEACHERGUIDANCELIFUQIANGABSTRACTSPEECHSIGNALACQUISITIONANDANALYSISTECHNIQUESAREAWIDERANGEOFCROSSSCIENTIFIC,ITSAPPLICATIONANDDEVELOPMENTOFVOICESTUDY,SOUNDMEASUREMENTSTUDY,ELECTRONICMEASURINGTECHNOLOGY,ANDDIGITALSIGNALPROCESSINGDISCIPLINES,SUCHASCLOSECONTACT。COLLECTIONANDANALYSISOFVOICEONEOFTHESMALLSCALEEQUIPMENT,INTELLIGENCE,DIGITALANDMULTIFUNCTIONALDEVELOPMENTOFMOREANDMOREQUICKLY,FASTERTHANTHEPREVIOUSANALYSISHASBEENSUBSTANTIALLYHIGH。THISPAPERINTRODUCESTHEVOICESIGNALACQUISITIONANDANALYSISOFTHEHISTORYOFTHEDEVELOPMENT,ASWELLASTHECHARACTERISTICSOFSPEECHSIGNAL,COLLECTIONANDANALYSISMETHODS,RECORDINGMACHINETHROUGHTHEPCSECTIONOFMYOWNVOICES,THEUSEOFMATLABFORSIMULATIONANALYSIS,F(xiàn)INALLYADDTHENOISEFILTERTODEALWITH,COMPARISONOFFILTERBEFOREANDAFTERCHANGE。KEYWORDSAUDIOSIGNAL,ACQUISITIONANDANALYSIS,MATLAB目錄摘要3ABSTRACT4目錄5第1章緒論611課題的背景與意義612國(guó)內(nèi)外研究現(xiàn)狀613本文主要工作814本文的仿真軟件MATLAB8第2章語音信號(hào)的特點(diǎn)與采集921語音信號(hào)的特點(diǎn)922語音信號(hào)的采集9第3章語音信號(hào)的分析1231語音信號(hào)分析技術(shù)1232語音信號(hào)的時(shí)域分析12321短時(shí)能量及短時(shí)平均幅度分析13322短時(shí)過零率分析1333語音信號(hào)的頻域分析15331利用短時(shí)博里葉變換求語音的短時(shí)譜1534語音信號(hào)的語譜圖17第4章語音信號(hào)的綜合仿真分析20總結(jié)22致謝23參考文獻(xiàn)24附錄一25附錄二25附錄三26附錄四26附錄五27第1章緒論11課題的背景與意義通過語音傳遞倍息是人類最重要、最有效、最常用和最方便的交換信息的形式。語言是人類持有的功能聲音是人類常用的工具,是相互傳遞信息的最主要的手段。因此,語音信號(hào)是人們構(gòu)成思想疏通和感情交流的最主要的途徑。并且,由于語言和語音與人的智力活動(dòng)密切相關(guān),與社會(huì)文化和進(jìn)步緊密相連,所以它具有最大的信息容量和最高的智能水平。現(xiàn)在,人類已開始進(jìn)入了信息化時(shí)代,用現(xiàn)代手段研究語音信號(hào),使人們能更加有效地產(chǎn)生、傳輸、存儲(chǔ)、獲取和應(yīng)用語音信息,這對(duì)于促進(jìn)社會(huì)的發(fā)展具有十分重要的意義。讓計(jì)算機(jī)能聽懂人類的語言,是人類自計(jì)算機(jī)誕生以來夢(mèng)寐以求的想法。隨著計(jì)算機(jī)越來越向便攜化方向發(fā)展,隨著計(jì)算環(huán)境的日趨復(fù)雜化,人們?cè)絹碓狡惹幸髷[脫鍵盤的束縛而代之以語音輸人這樣便于使用的、自然的、人性化的輸人方式。作為高科鼓應(yīng)用領(lǐng)域的研究熱點(diǎn),語音信號(hào)采集與分析從理論的研究到產(chǎn)品的開發(fā)已經(jīng)走過了幾十個(gè)春秋并且取得了長(zhǎng)足的進(jìn)步。它正在直接與辦公、交通、金融、公安、商業(yè)、旅游等行業(yè)的語音咨詢與管理工業(yè)生產(chǎn)部門的語聲控制,電話、電信系統(tǒng)的自動(dòng)撥號(hào)、輔助控制與查詢以及醫(yī)療衛(wèi)生和福利事業(yè)的生活支援系統(tǒng)等各種實(shí)際應(yīng)用領(lǐng)域相接軌,并且有望成為下一代操作系統(tǒng)和應(yīng)用程序的用戶界面??梢?,語音信號(hào)采集與分析的研究將是一項(xiàng)極具市場(chǎng)價(jià)值和挑戰(zhàn)性的工作。我們今天進(jìn)行這一領(lǐng)域的研究與開拓就是要讓語音信號(hào)處理技術(shù)走人人們的日常生活當(dāng)中,并不斷朝更高目標(biāo)而努力。語音信號(hào)采集與分析之所以能夠那樣長(zhǎng)期地、深深地吸引廣大科學(xué)工作者去不斷地對(duì)其進(jìn)行研究和探討,除了它的實(shí)用性之外,另一個(gè)重要原因是,它始終與當(dāng)時(shí)信息科學(xué)中最活躍的前沿學(xué)科保持密切的聯(lián)系并且一起發(fā)展。語音信號(hào)采集與分析是以語音語言學(xué)和數(shù)字信號(hào)處理為基礎(chǔ)而形成的一門涉及面很廣的綜合性學(xué)科,與心理、生理學(xué)、計(jì)算機(jī)科學(xué)、通信與信息科學(xué)以及模式識(shí)別和人工智能等學(xué)科都有著非常密切的關(guān)系。對(duì)語音信號(hào)采集與分析的研究一直是數(shù)字信號(hào)處理技術(shù)發(fā)展的重要推動(dòng)力量。因?yàn)樵S多處理的新方法的提出,首先是在語音信號(hào)處理中獲得成功,然后再推廣到其他領(lǐng)域。12國(guó)內(nèi)外研究現(xiàn)狀語音信號(hào)的采集與分析作為一個(gè)重要的研究領(lǐng)域,已經(jīng)有很長(zhǎng)的研究歷史1。但是它的快速發(fā)展可以說是從1940年前后DUDLEY的聲碼器VOCODER和POTTER等人的可見語音VISIBLESPEECH開始的。1952年貝爾BELL實(shí)驗(yàn)室的DAVIS等人首次研制成功能識(shí)別十個(gè)英語數(shù)字的實(shí)驗(yàn)裝置。1956年OLSON和BELAR等人采用8個(gè)帶通濾波器組提取頻譜參數(shù)作為語音的特征,研制成功一臺(tái)簡(jiǎn)單的語音打字機(jī)。20世紀(jì)60年代初由于FAUT和STEVEN的努力,奠定了語音生成理論的基礎(chǔ),在此基礎(chǔ)上語音合成的研究得到了扎實(shí)的進(jìn)展。20世紀(jì)60年代中期形成的一系列數(shù)字信號(hào)處理方法和技術(shù),如數(shù)字濾波器、快速博里葉變換FFT等成為語音信號(hào)數(shù)字處理的理論和技術(shù)基礎(chǔ)。在方法上,隨著電子計(jì)算機(jī)的發(fā)展,以往的以硬件為中心的研究逐漸轉(zhuǎn)化為以軟件為主的處理研究。然而,在語音識(shí)別領(lǐng)域內(nèi),初期有幾種語音打字機(jī)的研究也很活躍,但后來已全部停了下來,這說明了當(dāng)時(shí)人們對(duì)話音識(shí)別難度的認(rèn)識(shí)得到了加深。所以1969年美國(guó)貝爾研究所的PIERCE感嘆地說“語音識(shí)別向何處去”。到了1970年,好似反駁PIERCE的批評(píng),單詞識(shí)別裝置開始了實(shí)用化階段,其后實(shí)用化的進(jìn)程進(jìn)一步高漲,實(shí)用機(jī)的生產(chǎn)銷售也上了軌道。此外社會(huì)上所宣傳的聲紋VOICEPRINT識(shí)別,即說話人識(shí)別的研究也扎扎實(shí)實(shí)地開展起來,并很快達(dá)到了實(shí)用化的階段。到了1971年,以美國(guó)ARPAAMERICANRESEARCHPROJECTSAGENCY為主導(dǎo)的“語音理解系統(tǒng)”的研究計(jì)劃也開始起步。這個(gè)研究計(jì)劃不僅在美國(guó)園內(nèi),而且對(duì)世界各國(guó)都產(chǎn)生了很大的影響,它促進(jìn)了連續(xù)語音識(shí)別研究的興起。歷時(shí)五年的龐大的ARPA研究計(jì)劃,雖然在語音理解、語言統(tǒng)計(jì)模型等方面的研究積累了一些經(jīng)驗(yàn),取得了許多成果,但沒能達(dá)到巨大投資應(yīng)得的成果,在1976年停了下來,進(jìn)入了深刻的反省階段。但是,在整個(gè)20世紀(jì)70年代還是有幾項(xiàng)研究成果對(duì)語音信號(hào)處理技術(shù)的進(jìn)步和發(fā)展產(chǎn)生了重大的影響。這就是20世紀(jì)70年代初由板倉(cāng)ITAKURA提出的動(dòng)態(tài)時(shí)間規(guī)整DTW技術(shù),使語音識(shí)別研究在匹配算法方面開辟了新思路;20世紀(jì)70年代中期線性預(yù)測(cè)技術(shù)LPC被用于語音信號(hào)處理,此后隱馬爾可夫模型法HNMM也獲得初步成功,該技術(shù)后來在語音信號(hào)處理的多個(gè)方面獲得巨大成功;20世紀(jì)70年代未,LINDA、BUZO、GRAY和MARKEL等人首次解決了矢量量化VQ碼書生成的方法,并首先將矢量量化技術(shù)用于語音編碼獲得成功。從此矢量量化技術(shù)不僅在語音識(shí)別、語音編碼和說話人識(shí)別等方面發(fā)揮了重要作用,而且很快推廣到其他許多領(lǐng)域。因此,20世紀(jì)80年代開始出現(xiàn)的語音信號(hào)處理技術(shù)產(chǎn)品化的熱溯,與上述語音信號(hào)處理新技術(shù)的推動(dòng)作用是分不開的。20世紀(jì)80年代,由于矢量量化、隱馬爾可夫模型和人工神經(jīng)網(wǎng)絡(luò)ANN等相繼被應(yīng)用于語音信號(hào)處理,并經(jīng)過不斷改進(jìn)與完善,使得語音信號(hào)處理技術(shù)產(chǎn)生了突破性的進(jìn)展。其中,隱馬爾可夫模型作為語音信號(hào)的一種統(tǒng)計(jì)模型,在語音信號(hào)處理的各個(gè)領(lǐng)域中獲得了廣泛的應(yīng)用。其理論基礎(chǔ)是1970年前后,由BAUM等人建立起來的,隨后,由美國(guó)卡內(nèi)基梅隆大學(xué)CMU的BAKER和美國(guó)IBM公司的JELINEK等人將其應(yīng)用到語音識(shí)別中。由于美國(guó)貝爾實(shí)驗(yàn)室的BABINER等人在20世紀(jì)80年代中期,對(duì)隱馬爾可夫模型深人淺出的介紹,才使世界各國(guó)從事語音信號(hào)處理的研究人員了解和熟悉,進(jìn)而成為一個(gè)公認(rèn)的研究熱點(diǎn),也是目前語音識(shí)別等的主流研究途徑。進(jìn)入20世紀(jì)90年代以來,語音信號(hào)采集與分析在實(shí)用化方面取得了許多實(shí)質(zhì)性的研究進(jìn)展。其中,語音識(shí)別逐漸由實(shí)驗(yàn)室走向?qū)嵱没?。一方面,?duì)聲學(xué)語音學(xué)統(tǒng)計(jì)模型的研究逐漸深入,魯棒的語音識(shí)別、基于語音段的建模方法及隱馬爾可夫模型與人工種經(jīng)網(wǎng)絡(luò)的結(jié)合成為研究的熱點(diǎn)。另一方面,為了語音識(shí)別實(shí)用化的需要,講者自適應(yīng)、聽覺模型、快速搜索識(shí)別算法以及進(jìn)一步的語言模型的研究等課題倍受關(guān)注。13本文主要工作本文簡(jiǎn)要介紹了語音信號(hào)采集與分析的發(fā)展史以及語音信號(hào)的特征、采集與分析方法,并通過PC機(jī)錄制自己的一段聲音,運(yùn)用MATLAB進(jìn)行仿真分析,最后加入噪聲進(jìn)行濾波處理,比較濾波前后的變化。第2章主要介紹語音信號(hào)的特點(diǎn)與采集,仿真主要是驗(yàn)證奈奎斯特定理。第3章主要是對(duì)語音信號(hào)進(jìn)行時(shí)域、頻域上的分析,如短時(shí)功率譜,短時(shí)能量,短時(shí)平均過零率,語譜圖分析等等。第4章是對(duì)語音信號(hào)的綜合和分析,包括語音信號(hào)的調(diào)制,疊加,和濾波。14本文的仿真軟件MATLABMATLAB是美國(guó)MATHWORKS公司出品的商業(yè)數(shù)學(xué)軟件,用于算法開發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析以及數(shù)值計(jì)算的高級(jí)技術(shù)計(jì)算語言和交互式環(huán)境,主要包括MATLAB和SIMULINK兩大部分4。MATLAB是矩陣實(shí)驗(yàn)室(MATRIXLABORATORY)的簡(jiǎn)稱,和MATHEMATICA、MAPLE并稱為三大數(shù)學(xué)軟件。它在數(shù)學(xué)類科技應(yīng)用軟件中在數(shù)值計(jì)算方面首屈一指。MATLAB可以進(jìn)行矩陣運(yùn)算、繪制函數(shù)和數(shù)據(jù)、實(shí)現(xiàn)算法、創(chuàng)建用戶界面、連接其他編程語言的程序等,主要應(yīng)用于工程計(jì)算、控制設(shè)計(jì)、信號(hào)處理與通訊、圖像處理、信號(hào)檢測(cè)、金融建模設(shè)計(jì)與分析等領(lǐng)域。MATLAB的基本數(shù)據(jù)單位是矩陣,它的指令表達(dá)式與數(shù)學(xué)、工程中常用的形式十分相似,故用MATLAB來解算問題要比用C,F(xiàn)ORTRAN等語言完相同的事情簡(jiǎn)捷得多,并且MATHWORK也吸收了像MAPLE等軟件的優(yōu)點(diǎn),使MATLAB成為一個(gè)強(qiáng)大的數(shù)學(xué)軟件。在新的版本中也加入了對(duì)C,F(xiàn)ORTRAN,C,JAVA的支持??梢灾苯诱{(diào)用,用戶也可以將自己編寫的實(shí)用程序?qū)氲組ATLAB函數(shù)庫(kù)中方便自己以后調(diào)用,此外許多的MATLAB愛好者都編寫了一些經(jīng)典的程序,用戶可以直接進(jìn)行下載就可以用。第2章語音信號(hào)的特點(diǎn)與采集21語音信號(hào)的特點(diǎn)通過對(duì)大量語音信號(hào)的觀察和分析發(fā)現(xiàn),語音信號(hào)主要有下面兩個(gè)特點(diǎn)在頻域內(nèi),語音信號(hào)的頻譜分量主要集中在3003400HZ的范圍內(nèi)。利用這個(gè)特點(diǎn),可以用一個(gè)防混迭的帶通濾波器將此范圍內(nèi)的語音信號(hào)頻率分量取出,然后按8KHZ的采樣率對(duì)語音信號(hào)進(jìn)行采樣,就可以得到離散的語音信號(hào)。在時(shí)域內(nèi),語音信號(hào)具有“短時(shí)性”的特點(diǎn),即在總體上,語音信號(hào)的特征是隨著時(shí)間而變化的,但在一段較短的時(shí)間間隔內(nèi),語音信號(hào)保持平穩(wěn)。在濁音段表現(xiàn)出周期信號(hào)的特征,在清音段表現(xiàn)出隨機(jī)噪聲的特征。下面是一段語音信號(hào)的時(shí)域波形圖圖21和頻域圖圖22,由這兩個(gè)圖可以看出語音信號(hào)的兩個(gè)特點(diǎn)。0051152253354455080604020020406TIMES005115225X104000501015020250303504045FREQUENCYHZ圖21語音信號(hào)時(shí)域波形圖圖22語音信號(hào)頻域波形圖FIGURE21SPEECHSIGNALTIMEDOMAINWAVEFORMFIGURE22FREQUENCYDOMAINSPEECHSIGNALWAVEFORM22語音信號(hào)的采集在將語音信號(hào)進(jìn)行數(shù)字化前,必須先進(jìn)行防混疊預(yù)濾波,預(yù)濾波的目的有兩個(gè)抑制輸入信導(dǎo)各領(lǐng)域分量中頻率超出FS/2的所有分量FS為采樣頻率,以防止混疊干擾。抑制50HZ的電源工頻干擾。這樣,預(yù)濾波器必須是一個(gè)帶通濾波器,設(shè)其上、下截止顏率分別是FH和FL,則對(duì)于絕人多數(shù)語音編譯碼器,F(xiàn)H3400HZ、FL60100HZ、采樣率為FS8KHZ;而對(duì)丁語音識(shí)別而言,當(dāng)用于電話用戶時(shí),指標(biāo)與語音編譯碼器相同。當(dāng)使用要求較高或很高的場(chǎng)合時(shí)FH4500HZ或8000HZ、FL60HZ、FS10KHZ或20KHZ。為了將原始模擬語音信號(hào)變?yōu)閿?shù)字信號(hào),必須經(jīng)過采樣和量化兩個(gè)步驟,從而得到時(shí)間和幅度上均為離散的數(shù)字語音信號(hào)。采樣也稱抽樣,是信號(hào)在時(shí)間上的離散化,即按照一定時(shí)間間隔T在模擬信號(hào)XT上逐點(diǎn)采取其瞬時(shí)值。采樣時(shí)必須要注意滿足奈奎斯特定理,即采樣頻率FS必須以高于受測(cè)信號(hào)的最高頻率兩倍以上的速度進(jìn)行取樣,才能正確地重建波它是通過采樣脈沖和模擬信號(hào)相乘來實(shí)現(xiàn)的。下圖時(shí)一段語音信號(hào)在采樣頻率441KHZ情況下的頻譜圖。0123456X104040200204業(yè)業(yè)業(yè)業(yè)005115225X104050100150200由圖可知,這段語音信號(hào)的頻率主要集中在1KHZ左右,當(dāng)采樣頻率為441KHZ時(shí),由于采樣頻率比較大,所以采樣點(diǎn)數(shù)就越密,所得離散信號(hào)就越逼近于原信號(hào),頻譜也沒有發(fā)生混疊。0123456X104020020406業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)0500010000150001152253對(duì)上述信號(hào)進(jìn)行1/80采樣頻率抽取,即采樣頻率變?yōu)閷⒔?00HZ時(shí),由于采樣頻率比較小,所以采樣點(diǎn)數(shù)就稀疏,所得離散信號(hào)就越偏離于原信號(hào),頻譜也發(fā)生了混疊。在采樣的過程中應(yīng)注意采樣間隔的選擇和信號(hào)混淆對(duì)模擬信號(hào)采樣首先要確定采樣間隔。如何合理選擇T涉及到許多需要考慮的技術(shù)因素。一般而言,采樣頻率越高,采樣點(diǎn)數(shù)就越密,所得離散信號(hào)就越逼近于原信號(hào)。但過高的采樣頻率并不可取,對(duì)固定長(zhǎng)度(T)的信號(hào),采集到過大的數(shù)據(jù)量(NT/T),給計(jì)算機(jī)增加不必要的計(jì)算工作量和存儲(chǔ)空間;若數(shù)據(jù)量(N)限定,則采樣時(shí)間過短,會(huì)導(dǎo)致一些數(shù)據(jù)信息被排斥在外。采樣頻率過低,采樣點(diǎn)間隔過遠(yuǎn),則離散信號(hào)不足以反映原有信號(hào)波形特征,無法使信號(hào)復(fù)原,造成信號(hào)混淆。根據(jù)采樣定理,當(dāng)采樣頻率大于信號(hào)的兩倍帶寬時(shí),采樣過程不會(huì)丟失信息,利用理想濾波器可從采樣信號(hào)中不失真地重構(gòu)原始信號(hào)波形。量化是對(duì)幅值進(jìn)行離散化,即將振動(dòng)幅值用二進(jìn)制量化電平來表示。量化電平按級(jí)數(shù)變化,實(shí)際的振動(dòng)值是連續(xù)的物理量。具體振值用舍入法歸到靠近的量化電平上。語音信號(hào)經(jīng)過預(yù)濾波和采樣后,由AD變換器變換為二址制數(shù)字碼。這種防混疊濾波通常與模數(shù)轉(zhuǎn)換器做在一個(gè)集成塊內(nèi),因此目前來說,語音信號(hào)的數(shù)字化的質(zhì)量還是有保證的。市面上購(gòu)買到的普通聲卡在這方面做的都很好,語音聲波通過話筒輸入到聲卡后直接獲得的是經(jīng)過防混疊濾波、A/D變換、量化處理的離散的數(shù)字信號(hào)。在實(shí)際工作中,我們可以利用WINDOWS自帶的錄音機(jī)錄制語音文件,圖23是基于PC機(jī)的語音信號(hào)采集過程,聲卡可以完成語音波形的A/D轉(zhuǎn)換,獲得WAVE文件,為后續(xù)的處理儲(chǔ)備原材料。調(diào)節(jié)錄音機(jī)保存界面的“更改”選項(xiàng),可以存儲(chǔ)各種格式的WAVE文件。WINDOWS自帶的錄音機(jī)聲音麥克風(fēng)聲卡濾波采樣A/D轉(zhuǎn)換WAV圖23基于PC機(jī)的語音信號(hào)采集過程FIGURE23VOICEPCBASEDSIGNALACQUISITIONPROCESS采集到語音信號(hào)之后,需要對(duì)語音信號(hào)進(jìn)行分析,如語音信號(hào)的時(shí)域分析、頻譜分析、語譜圖分析以及加噪濾波等處理。第3章語音信號(hào)的分析31語音信號(hào)分析技術(shù)語音信號(hào)分析是語音信號(hào)處理的前提和基礎(chǔ),只有分析出可表示語音信號(hào)本質(zhì)特征的參數(shù),才有可能利用這些參數(shù)進(jìn)行高效的語音通信、語音合成和語音識(shí)別等處理8。而且,語音合成的音質(zhì)好壞,語音識(shí)別率的高低,也都取決于對(duì)語音信號(hào)分橋的準(zhǔn)確性和精確性。因此語音信號(hào)分析在語音信號(hào)處理應(yīng)用中具有舉足輕重的地位。貫穿于語音分析全過程的是“短時(shí)分析技術(shù)”。因?yàn)椋Z音信號(hào)從整體來看其特性及表征其本質(zhì)特征的參數(shù)均是隨時(shí)間而變化的,所以它是一個(gè)非乎穩(wěn)態(tài)過程,不能用處理乎穩(wěn)信號(hào)的數(shù)字信號(hào)處理技術(shù)對(duì)其進(jìn)行分析處理。但是,由于不同的語音是由人的口腔肌肉運(yùn)動(dòng)構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng),而這種口腔肌肉運(yùn)動(dòng)相對(duì)于語音頻率來說是非常緩慢的,所以從另一方面看,雖然語音倍號(hào)具有時(shí)變特性,但是在一個(gè)短時(shí)間范圍內(nèi)一般認(rèn)為在1030MS的短時(shí)間內(nèi),其特性基本保持不變即相對(duì)穩(wěn)定,因面可以將其看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過程,即語音信號(hào)具有短時(shí)平穩(wěn)性。所以任何語音信號(hào)的分析和處理必須建立在“短時(shí)”的基礎(chǔ)上即進(jìn)行“短時(shí)分析”,將語音信號(hào)分為一段一段來分析其特征參數(shù),其中每一段稱為一“幀”,幀長(zhǎng)一般取為1030MS。這樣,對(duì)于整體的語音信號(hào)來講,分析出的是由每一幀特征參數(shù)組成的特征參數(shù)時(shí)間序列。根據(jù)所分析出的參數(shù)的性質(zhì)的不同,可將語音信號(hào)分析分為時(shí)域分析、頻域分析、倒領(lǐng)域分析等;時(shí)域分析方法具有簡(jiǎn)單、計(jì)算量小、物理意義明確等優(yōu)點(diǎn),但由于語音信號(hào)最重要的感知特性反映在功率譜中,而相位變化只起著很小的作用,所以相對(duì)于時(shí)域分析來說頻域分析更為重要。本文將簡(jiǎn)要介紹時(shí)域分析、頻域分析以及語譜圖分析。32語音信號(hào)的時(shí)域分析語音信號(hào)的時(shí)域分析就是分析和提取語音信號(hào)的時(shí)域參數(shù)。進(jìn)行語音分析時(shí),最先接觸到并且也是最直觀的是它的時(shí)域波形。語音信號(hào)本身就是時(shí)域信號(hào),因而時(shí)域分析是最早使用,也是應(yīng)用最廣泛的一種分析方法,這種方法直接利用語音信號(hào)的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析及應(yīng)用,如語音的分割、預(yù)處理、大分類等。這種分析方法的特點(diǎn)是表示語音信號(hào)比較直觀、物理意義明確。實(shí)現(xiàn)起來比較簡(jiǎn)單、運(yùn)算且少??梢缘玫秸Z音的一些重要的參數(shù)。只使用示波器等通用設(shè)備,使用較為簡(jiǎn)單等。語音信號(hào)的時(shí)域參數(shù)有短時(shí)能量、短時(shí)過零率、短時(shí)白相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)等,這是語音信號(hào)的一組最基本的短時(shí)參數(shù),在各種語音信號(hào)數(shù)字處理技術(shù)中都要應(yīng)用6。在計(jì)算這些參數(shù)時(shí)使用的一般是方窗或漢明窗。321短時(shí)能量及短時(shí)平均幅度分析設(shè)語音波形時(shí)域信號(hào)為XL、加密分幀處理后得到的第N幀語音信號(hào)為XNM,則XNM滿足下式31NXMWXNM01N32101N,其他值其中,N0,1T,2T,并且N為幀長(zhǎng),T為幀移長(zhǎng)度。設(shè)第N幀語音信號(hào)XNM的短時(shí)能量用EN表示,則其計(jì)算公式如下33120NNMEXEN是一個(gè)度量語音信號(hào)幅度值變化的函數(shù),但它有一個(gè)缺陷,即它對(duì)高電平非常敏感因?yàn)樗?jì)算時(shí)用的是信號(hào)的平方。為此可采用另一個(gè)度量語音信號(hào)幅度值變化的函數(shù)即短時(shí)平均幅度函數(shù)MN,它定義為3410NMNNMXMN也是一帕語音信號(hào)能量大小的表征,它與EN的區(qū)別在于計(jì)算時(shí)小取樣值和大取樣值不會(huì)因取平方而造成較大差異,在某些應(yīng)用領(lǐng)域呻會(huì)帶來一些好處。短時(shí)能量和短時(shí)平均幅度函數(shù)的主要用途有可以區(qū)分濁音段與清音段,因?yàn)闈嵋魰r(shí)EN值比清音時(shí)大的多??梢杂脕韰^(qū)分聲母與韻母的分界,無聲與有盧的分界,連字指字之間無間隙的分界等。作為一種超音段信息,用于語音識(shí)別中。322短時(shí)過零率分析短時(shí)過零率表示一幀語音中語音信號(hào)波形穿過橫軸(零電平)的次數(shù)。過零分析是語音時(shí)域分析中最簡(jiǎn)單的一種。對(duì)于連續(xù)語音信號(hào),過零即意味著時(shí)域波形通過時(shí)間軸;而對(duì)于離散信號(hào),如果相鄰的取樣值改變符號(hào)則稱為過零。過零率就是樣本改變符號(hào)的次數(shù)。定義語音信號(hào)XN(M)的短時(shí)過零率ZN為(35)10SGNSGN12NNZXXM式中,SGN是符號(hào)函數(shù),即(36)1,0SX在實(shí)際中求過零率參數(shù)時(shí),需要十分注意的一個(gè)問題是如果輸入信號(hào)中包含有50HZ的工頻干擾或者A/D變換器的工作點(diǎn)有偏移這等效于輸入信號(hào)有直流偏移,往往會(huì)使計(jì)算的過零率參數(shù)很不準(zhǔn)確。為了解決前一個(gè)問題,A/D變換器前的防混疊帶通濾波器的低端截頻應(yīng)高于50HZ,以有效地抑制電源干擾。對(duì)于后一個(gè)問題除了可以采用低直流漂移器件外,也可以在軟件上加以解決,這就是算出每一幀的直流分量并予以濾除。對(duì)語音信號(hào)進(jìn)行分析,發(fā)現(xiàn)發(fā)濁音時(shí),盡管聲道有若干個(gè)共振峰,但由于聲門波引起譜的高頻跌落,所以其話音能量約集中在3KHZ以下。而發(fā)清音時(shí),多數(shù)能量出現(xiàn)在較高頻率上。高頻就意味著高的平均過零率,低頻意味著低的平均過零率,所以可以認(rèn)為濁音時(shí)具有較低的過零率,而清音時(shí)具有較高的過零率。當(dāng)然,這種高低僅是相對(duì)而言,并沒方精確的數(shù)值關(guān)系。利用短時(shí)平均過零率還可以從背景噪聲中找出語音信號(hào),可用于判斷寂靜無聲段和有聲段的起點(diǎn)和終點(diǎn)位置。在孤立詞的語音識(shí)別中,必須要在一連串連續(xù)的語音信號(hào)中進(jìn)行適當(dāng)分割,用以確定一個(gè)一個(gè)單詞的語音信號(hào),即找出每一個(gè)單詞的開始和終止位置,這在語音處理中是一個(gè)基本問題。此時(shí),在背景噪聲較小時(shí)用平均能量識(shí)別較為有效,而在背景噪聲較大時(shí)用平均過零率識(shí)別較為有效。但是研究表明,在以某些音為開始或結(jié)尾時(shí)如當(dāng)弱摩擦音如F、H等音素、弱燃破音如P、T、K等音素為語音的開頭或結(jié)尾;以鼻音如N、M等音素為語音的結(jié)尾時(shí)只用其中一個(gè)參量來判別語音的起點(diǎn)和終點(diǎn)是有困難的,必須同時(shí)使用這兩個(gè)參數(shù)。圖31是用MTALAB仿真一段語音信號(hào)時(shí)域波形的短時(shí)能量和短時(shí)平均過零率。501001502002503003504001050051SPECH51015202530354045010203040ENERGY510152025303540450102030ZCR圖31語音信號(hào)的短時(shí)能量和短時(shí)平均過零率FIGURE31SHORTTERMSPEECHSIGNALENERGYANDZEROCROSSINGRATEOFTHEAVERAGESHORTTERM33語音信號(hào)的頻域分析語音信號(hào)的頻域分析就是分析語音信號(hào)的頻域持征。從廣義上講,語音信號(hào)的頻域分析包括語音信號(hào)的頻譜、功率譜、倒頻譜、頻譜包絡(luò)分析等,而常用的頻域分析方法有帶通濾波器組法、傅里葉變換法、線件預(yù)測(cè)法等幾種。本文介紹的是語音信號(hào)的傅里葉分析法。因?yàn)檎Z音波是一個(gè)非平穩(wěn)過程,因此適用于周期、瞬變或平穩(wěn)隨機(jī)信號(hào)的標(biāo)準(zhǔn)傅里葉變換不能用來直接表示語音信號(hào),而應(yīng)該用短時(shí)傅里葉變換對(duì)語音信號(hào)的頻譜進(jìn)行分析,相應(yīng)的頻譜稱為“短時(shí)譜”331利用短時(shí)博里葉變換求語音的短時(shí)譜對(duì)第N幀語音信號(hào)XNM進(jìn)行傅里葉變換離散時(shí)域傅里葉變換,DTFT,可得到短時(shí)傅里葉變換,其定義如下3710NJWJWNNNMXEXE由定義可知,短時(shí)傅里葉變換實(shí)際就是窗選語音信號(hào)的標(biāo)準(zhǔn)傅里葉變換。這里,窗WNM是一個(gè)“滑動(dòng)的”窗口,它隨N的變化而沿著序列XN滑動(dòng)。由于窗口是有限長(zhǎng)度的,滿足絕對(duì)可和條件,所以這個(gè)變換是存在的。當(dāng)然窗口函數(shù)不同,博里葉變換的結(jié)果也將不同。我們還可以將式327寫成另一種形式。設(shè)語音信號(hào)序列和窗口序列的標(biāo)準(zhǔn)傅早葉變換均存在。當(dāng)N取固定值時(shí),WNM的傅里葉變換為38JWNJJWMEWE根據(jù)卷積定理,有39JWJJWNJNX因?yàn)樯鲜接疫厓蓚€(gè)卷積項(xiàng)均為關(guān)于角頻率W的以2為周期的連續(xù)函數(shù),所以也可將其寫成以下的卷積積分形式(310)12JWJNJNXEWEXED即,假設(shè)XM的DTFT是,且的DTFT是,那么是JWMJWWEJWNXE和的的周期卷積。JWEJ根據(jù)信號(hào)的時(shí)寬帶寬積為一常數(shù)這一基本性質(zhì),可知主瓣寬度與窗口寬度成JWE反比,N越大,的主瓣越窄。由式330可知,為了使忠實(shí)再現(xiàn)的JWWEJNXJWXE特性相對(duì)于來說必須是個(gè)沖激函數(shù)。所以為了使,JJXJJ需;但是N值太大時(shí),倍號(hào)的分幀又失去了意義。尤其是N大于語音的音素長(zhǎng)度時(shí),已不能反映該語音音素的頻譜了。因此應(yīng)折衷選擇窗的寬度N。另外,窗JWNXE的形狀也對(duì)短時(shí)博氏頻譜有影響,如矩形窗,雖然頻率分辨率很高即主辯狹窄尖銳,但由于第一旁瓣的衰減很小,有較大的上下沖,采用矩形窗時(shí)求得的與的偏JWNXEJ差較大,這就是GIBBS效應(yīng),所以不適合用于頻譜成分很寬的語音分析中。而漢明窗在頻率范圍中的分辨率較高,而且旁辯的衰減大,具有頻譜泄漏少的優(yōu)點(diǎn)所以在求短時(shí)頻譜時(shí)一船采用具有較小上下沖的漢明窗2。與離散傅里葉變換和連續(xù)博里葉變換的關(guān)系一樣,如令角頻率W2KN,則得離散的短時(shí)博里葉變換DFT它實(shí)際上是在頻域的取樣,如下所示JWNXE311221001KKMNJJNNNNNMXEX在語音信號(hào)數(shù)字處理中,都是采用的離散博里葉變換DFT來替代NNXK并且可以用高效的快速傅里葉變換FFT算法完成由至的轉(zhuǎn)換。當(dāng)然,JWNENX這時(shí)窗長(zhǎng)N必須是2的倍數(shù)L是整數(shù)。根據(jù)傅里葉變換的性質(zhì),實(shí)數(shù)序列的傅里葉變L換的頻譜具有對(duì)稱性,因此,全部頻譜信息包含在長(zhǎng)度為N/21個(gè)里。另外,為了NXK使具有較高的頻率分辨率,所取的DFT以及相應(yīng)的FFT點(diǎn)數(shù)應(yīng)該足夠多,但有NXK1N時(shí)的長(zhǎng)度N要受到采樣率和短時(shí)性的限制,例如,在通常采樣率為8KHZ且?guī)L(zhǎng)為XM20MS時(shí),N160。而一般取256、512或1024,為了將的點(diǎn)數(shù)從N擴(kuò)大力,1NXM1可以采用補(bǔ)0的辦法,在擴(kuò)大的部分添若干個(gè)0取樣值,然后再對(duì)添0后的序列進(jìn)行FFT。例如、在10KHZ的范圍內(nèi)采樣求頻譜,并要求頻率分辨率在30HZ以下。由10K/ZH30,得333,所以要取比333大的值,這時(shí)可取512點(diǎn),不足111N2L192的部分采用補(bǔ)0的辦法解決,此時(shí)頻率分辨率即頻率間隔為10HZ5121953HZ,采樣后的該幀信號(hào)頻率處在02X1953HZ之間,因此,原連續(xù)信號(hào)頻率就處在0之間即,所以我們要在0頻率范圍內(nèi)求其頻譜。12953LHZMAX5FKHZ5KHZFFT的計(jì)算可以在通用計(jì)算機(jī)上由相應(yīng)的算法軟件來完成,這種方式一般只能實(shí)現(xiàn)非實(shí)時(shí)運(yùn)算。為了完成實(shí)時(shí)運(yùn)算可以采用先進(jìn)的數(shù)字信號(hào)處理芯片、陣列處理芯片或?qū)S肍FT芯片。為了完成1024點(diǎn)的萬FFT,這些專用芯片所需的運(yùn)算時(shí)間是幾十毫秒至兒毫秒,甚至可以降至1MS以下。在語音信號(hào)數(shù)字處理中,功率譜具有重要意義,在一些語音應(yīng)用系統(tǒng)中往往都是利用語音信號(hào)的功率譜。根據(jù)功率譜定義,可以寫出短時(shí)功率譜與短時(shí)傅里葉變換之間的關(guān)系3122JWJJWJWNNNNSEXEX或者313KK式中表示復(fù)共軛運(yùn)算。并且功率譜是短時(shí)自相關(guān)函數(shù)的傅里葉變換。JWNSENRK31412NJWJWJKNNNKSEXR圖32是用MATLAB中的PSDPLOT命令繪得的同一人兩次說同一詞的功率譜比較窗函數(shù)取窗長(zhǎng)度為256的HAMMING窗。圖32同一人兩次說同一詞的功率譜比較FIGURE32THATTHESAMEPERSONTWICETHEPOWERSPECTRUMOFTHESAMEWORDCOMPARISON可以看出功率譜圖比較好地反映出聲音的個(gè)人特征在低頻部分(頻率低于6000HZ),同一人說同一詞,其功率譜圖中的各個(gè)波峰所對(duì)應(yīng)的頻率基本相同;不同人說同一詞,其功率譜圖的出現(xiàn)波峰的頻率比較接近;同一人說不同詞時(shí)功率譜的形狀差別較大。在高頻部分,波峰比較密集,特征不明顯。34語音信號(hào)的語譜圖語音的時(shí)域分析和頻域分析是語音分析的兩種重要方法。顯然這兩種單獨(dú)分析的方法均有局限性時(shí)域分析對(duì)語音信號(hào)的頻率特性沒有直觀的了解;而頻域分析出的特征中又沒有語音信號(hào)隨時(shí)間的變化關(guān)系語音信號(hào)是時(shí)變信號(hào),所以其頻譜也是隨時(shí)間變化的。但是由于語音信號(hào)隨時(shí)間變化是很緩慢的,因而在一段短時(shí)間內(nèi)如1030MS之間,即所謂的一幀之內(nèi)可以認(rèn)為其頻譜是固定不變的,這種頻譜又稱為短時(shí)譜。短時(shí)譜只能反映語音信號(hào)的靜態(tài)頻率特性,不能反映語音信號(hào)的動(dòng)態(tài)頻率特性。因此,人們致力于研究語音的時(shí)頻分析特性。把和時(shí)序相關(guān)的傅里葉分析的顯示圖形稱為語譜圖SONOGRAM,或者SPECTROGRAM。語諾圖是一種三維頻譜,它是表示語音頻譜隨時(shí)間變化的圖形,其縱軸為頻率,橫軸為時(shí)間,任一給定頻率成分在給定時(shí)刻的強(qiáng)弱用相應(yīng)點(diǎn)的灰度或色調(diào)的濃談來表示。用語譜圖分析語音又稱為語譜分析。語譜圖中顯示了大量的與語音的語句特性有關(guān)的信息,它綜合了頻譜圖和時(shí)域波形的特點(diǎn),明顯地顯示出語音頻譜隨時(shí)間的變化情況,或者說是一種動(dòng)態(tài)的頻譜;記錄這種頻譜的儀器就是語譜儀。語譜儀實(shí)際上是一個(gè)帶通濾波器組的輸出隨時(shí)間發(fā)生連續(xù)變化,連續(xù)重復(fù)進(jìn)行語音信號(hào)頻率分析的儀器。帶通濾波器有兩種帶寬可供選擇窄帶為45HZ,寬帶為300HZ。窄帶語譜圖有良好的頻率分辨率,有利于顯示基音頻率及其各次諧波,但它的時(shí)間分辨率較差,不利于觀察共振峰盧道諧振的變化;而寬帶語譜圖正相反,具有良好的時(shí)間分辨率及較差的頻率分辨率。寬帶語譜圖能給出語音的共振峰頻率及清輔音的能量匯集區(qū),在話譜圖里共振峰呈現(xiàn)為黑色的條紋。可以利用語譜儀測(cè)量語譜圖的方法來確定語音參數(shù),例如共振峰頻率及基音頻率。語語圖的實(shí)際應(yīng)用是用于確定出講話人的本性。語譜圖上因其不同的黑白程度,形成了個(gè)同的紋路,稱之為“聲紋”,它因人而異,即不同講話者語譜圖的聲紋是不同的。因而可以利用聲紋鑒別不問的講話人。這與不向的人有不同的指紋,根據(jù)指紋可以區(qū)別不同的人是一個(gè)道理。雖然對(duì)采用語譜圖的講活人識(shí)別技術(shù)的可靠性過存在相當(dāng)人的懷疑,但目前這一技術(shù)已在司法法庭小得到某些認(rèn)可及采用11。圖33是用MTALAB繪制的一個(gè)寬帶語譜圖,其中橫抽坐標(biāo)為時(shí)間,縱軸坐標(biāo)為頻率,語句內(nèi)容為“河南農(nóng)業(yè)大學(xué)理學(xué)院”,它的發(fā)音在圖下方以音標(biāo)表示。同時(shí)給出了相應(yīng)的語音的時(shí)域波形。語譜圖中的花紋有橫扛BAR、亂紋和豎直條等。橫杠是與時(shí)間軸平行的幾條深黑色帶紋,它們相應(yīng)于短時(shí)譜中的幾個(gè)凸出點(diǎn),也就是共振峰。從橫扛對(duì)應(yīng)的頻率和寬度可以確定相應(yīng)的共振峰頻率和帶寬。在一個(gè)語音段的語譜圖中,有沒有橫扛出現(xiàn)是判斷它是否是濁音的重要標(biāo)志。豎直條又叫沖直條是語譜圖中出現(xiàn)與時(shí)間軸垂直的一條窄黑條。每個(gè)豎直條相當(dāng)于一個(gè)基音,條紋的起點(diǎn)相當(dāng)于聲門脈沖的起點(diǎn),條紋之間的距離表示基音周期。條紋越密表示越音頻率越高。222426283323436X1040050005業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)05010015020025030035040050100150200250圖33“河南農(nóng)業(yè)大學(xué)理學(xué)院”語譜圖FIGURE33,“COLLEGEOFHENANAGRICULTURALUNIVERSITY“LANGUAGESPECTRA第4章語音信號(hào)的綜合仿真分析錄制一段自己的語音信號(hào),并對(duì)錄制的信號(hào)進(jìn)行采樣;畫出采樣后語音信號(hào)的時(shí)域波形和頻譜圖;005115225X105050051業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)0051152253354X1040100200300400500業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)圖41原始語音信號(hào)FIGURE41THEORIGINALSPEECHSIGNAL由圖可知這段語音信號(hào)頻率主要集中在1000HZ左右。對(duì)語音信號(hào)進(jìn)行調(diào)制,為了減少在傳輸時(shí)的耗損,人們一般是先對(duì)傳輸信號(hào)進(jìn)行特殊處理,然后再傳遞。把原始的待傳信號(hào)托附到高頻振蕩的過程稱為調(diào)制。我們知道音頻信號(hào)的頻率在我們的聽覺范圍內(nèi),音頻信號(hào)在無線傳輸?shù)倪^程中會(huì)受到各種聲音的干擾而產(chǎn)生能量消耗因此限制了傳輸?shù)木嚯x所以在現(xiàn)實(shí)的傳送過程中要現(xiàn)對(duì)語音信號(hào)進(jìn)行調(diào)制再發(fā)送出去下面是對(duì)一段語音信號(hào)的調(diào)制仿真圖,載波頻率為FC20000。005115225X1051050051業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)0051152253354X10401000200030004000業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)圖42調(diào)制后的語音信號(hào)FIGURE42AFTERTHESPEECHSIGNALMODULATION由圖可知,經(jīng)過調(diào)制后的語音信號(hào)頻譜都搬移到FC20000的頻段。用經(jīng)過調(diào)制的信號(hào)與原信號(hào)疊加。005115225X10521012業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)0051152253354X10401000200030004000業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)圖43調(diào)制后的語音信號(hào)原始語音信號(hào)FIGURE43VOICEMODULATEDSIGNALTHEORIGINALSPEECHSIGNAL由圖可知低頻部分是原始信號(hào),高頻部分是經(jīng)過調(diào)制后的信號(hào)。設(shè)計(jì)數(shù)字濾波器和畫出頻率響應(yīng)根據(jù)語音信號(hào)的特點(diǎn)給出有關(guān)濾波器的性能指標(biāo)低通濾波器性能指標(biāo),F(xiàn)P1000HZ,F(xiàn)C1200HZ,AS100DB,AP1DB;用雙線性變換法設(shè)計(jì)的低通濾波器的程序如下FP1000FC1200AS100AP1FS22050WC2FC/FSWP2FP/FSN,WNELLIPORDWP,WC,AP,ASB,AELLIPN,AP,AS,WNFREQZB,A,512,FS濾波器的頻率響應(yīng)020004000600080001000010008006004002000FREQUENCYHZPHASEDEGREES020004000600080001000015010050050FREQUENCYHZMAGNITUDEDB圖44濾波器的頻率響應(yīng)FIGURE44FREQUENCYRESPONSEOFTHEFILTER進(jìn)行低通濾波,比較濾波前后語音信號(hào)的波形及頻譜。005115225X10505005業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)0051152253354X1040100200300400業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)業(yè)總結(jié)通過這次課程設(shè)計(jì),使我對(duì)語音信號(hào)有了全面的認(rèn)識(shí),對(duì)數(shù)字信號(hào)處理的知識(shí)又有了深刻的理解,在之前數(shù)字信號(hào)與處理的學(xué)習(xí)以及完成課后的作業(yè)的過程中,已經(jīng)使用過MATLAB,對(duì)其有了一些基礎(chǔ)的了解和認(rèn)識(shí)。通過這次練習(xí)是我進(jìn)一步了解了信號(hào)的產(chǎn)生、采樣及頻譜分析的方法。以及其中產(chǎn)生信號(hào)和繪制信號(hào)的基本命令和一些基礎(chǔ)編程語言。讓我感受到只有在了解課本知識(shí)的前提下,才能更好的應(yīng)用這個(gè)工具;并且熟練的應(yīng)用MATLAB也可以很好的加深我對(duì)課程的理解,方便我的思維。這次設(shè)計(jì)使我了解了MATLAB的使用方法,學(xué)會(huì)分析濾波器的優(yōu)劣和性能,提高了分析和動(dòng)手實(shí)踐能力。同時(shí)我相信,進(jìn)一步加強(qiáng)對(duì)MATLAB的學(xué)習(xí)與研究對(duì)我今后的學(xué)習(xí)將會(huì)起到很大的幫助。致謝非常感謝我的導(dǎo)師李富強(qiáng)老師在李老師無微不至的教導(dǎo)下,我才能夠順順利利的完成了畢業(yè)課程的設(shè)計(jì)。從課程設(shè)計(jì)材料的搜集到根據(jù)選題對(duì)素材的提取與整理,從MATLAB的簡(jiǎn)易入手到程序的分析與設(shè)計(jì),從理論與算法到程序的編寫與仿真,每一步都有李老師的細(xì)心知道與耐心講解。在平易近人學(xué)識(shí)淵博的李老師的熏陶下,使我感覺到自己知識(shí)的淺薄,在浩瀚的知識(shí)海洋面前,使我感覺到自己要不斷進(jìn)取。非常感謝我的同學(xué)們,感謝他們給我的幫助與支持,使我在畢業(yè)設(shè)計(jì)的過程中少走了不少?gòu)澛贰7浅8兄x我的家人和朋友們,感謝他們從畢業(yè)設(shè)計(jì)以來對(duì)我的關(guān)心與支持最后,再次感謝理學(xué)院所有的老師,感謝他們四年以來對(duì)我的栽培與教養(yǎng)參考文獻(xiàn)1胡航語音信號(hào)處理【M】哈爾濱哈爾濱工業(yè)大學(xué)出版社,20022丁玉美高西全數(shù)字信號(hào)處理【M】西安電子科技大學(xué)出版社,20063樊昌信通信原理【M】北京國(guó)防工業(yè)出版社,20054張威MATLAB基礎(chǔ)與編程入門【M】西安電子科技大學(xué)出版社,20065林福宗多媒體技術(shù)基礎(chǔ)【M】北京清華大學(xué)出版社,20006周淵,王炳和,劉斌勝基于MATLAB的噪聲信號(hào)采集和分析系統(tǒng)的設(shè)計(jì)【J】噪聲控制2004752547何強(qiáng),何英MATLAB擴(kuò)展編程【M】北京清華大學(xué)出版社,20022932968朱學(xué)芳,徐建平計(jì)算機(jī)語音信號(hào)處理與語音識(shí)別系統(tǒng)J南京郵電學(xué)院學(xué)報(bào),1998,1856113119楊崇林,李雪耀,孫羽強(qiáng)噪聲背景下漢語語音端點(diǎn)檢測(cè)和音節(jié)分割J哈爾濱工程大學(xué)學(xué)報(bào),1997185283210張雄偉,陳量,楊吉斌現(xiàn)代語音處理技術(shù)及應(yīng)用M北京機(jī)械工業(yè)出版社200311韋曉東,等應(yīng)用倒譜特征的帶噪語音端點(diǎn)檢測(cè)方法J上海交通大學(xué)學(xué)報(bào),2000,34218518812胡光銳,韋曉東基于倒譜特征的帶噪語音端點(diǎn)檢測(cè)J電子學(xué)報(bào)。2000。28109597附錄一語音信號(hào)時(shí)域頻域分析Y,FS,BITSW

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論