基音周期檢測(cè)算法比較_第1頁
基音周期檢測(cè)算法比較_第2頁
基音周期檢測(cè)算法比較_第3頁
基音周期檢測(cè)算法比較_第4頁
基音周期檢測(cè)算法比較_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、本科畢業(yè)論文題 目 語音基音周期檢測(cè)算法比較 學(xué) 院 管理科學(xué)與工程學(xué)院 專 業(yè) 電子信息工程 班 級(jí) 081信工(1)班 學(xué) 號(hào) 姓 名 周剛 指導(dǎo)老師 段凱宇 講師 二一二 年 六 月語音基音周期檢測(cè)算法比較摘要基音周期作為語音信號(hào)處理中描述激勵(lì)源的重要參數(shù)之一,廣泛的應(yīng)用于語音合成、語音編碼和語音識(shí)別等語音信號(hào)處理等技術(shù)領(lǐng)域。準(zhǔn)確可靠的對(duì)基音周期進(jìn)行檢測(cè)將直接影響整個(gè)語音處理系統(tǒng)的性能。常用的基音檢測(cè)算法對(duì)于純凈語音信號(hào)都能達(dá)到較好的檢測(cè)效果。然而,實(shí)際當(dāng)中的語音信號(hào)不可避免的會(huì)受到外界背景噪音的影響,使得這些檢測(cè)算法的檢測(cè)效果都不是很理想,為此本文用兩種基本算法對(duì)語音信號(hào)濾波前后進(jìn)行基

2、音周期檢測(cè),在進(jìn)行比較。論文首先介紹了語音基音檢測(cè)算法的研究背景極其重要意義。其次對(duì)現(xiàn)有的基音檢測(cè)算法進(jìn)行了歸納和總結(jié),并詳細(xì)的介紹本文將用的兩種基本基音檢測(cè)算法的基本原理及實(shí)現(xiàn)。最后在Matlab上對(duì)語音信號(hào)進(jìn)行基音周期檢測(cè)。論文還完成了算法的程序設(shè)計(jì),在Matlab7.0仿真環(huán)境下,對(duì)上訴算法進(jìn)行仿真驗(yàn)證,并且在濾波前后做了對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,經(jīng)過濾波的語音信號(hào)基音周期檢測(cè)的更加準(zhǔn)確。關(guān)鍵詞:基音檢測(cè);自相關(guān)函數(shù)法;平均幅度差函數(shù)法;基音軌跡AbstractPitch as in speech signal processing is one of the important para

3、meters to describe the excitation source, widely used in speech synthesis, speech coding and speech recognition speech signal processing technology. Accurate pitch period detection will directly affect the performance of the speech processing system.Commonly used algorithm for pitch detection for cl

4、ean speech signal to achieve good detection effect. However, the actual speech signal will be inevitably influenced by external effects of background noise, so the detection algorithm to detect the effect is not very ideal, the paper use two basic algorithms before and after filtering the speech sig

5、nal pitch detection, in comparison.The thesis first introduces the research background of speech pitch detection algorithm is very important. Next to the existing algorithm for pitch detection are summarized, and a detailed introduction to this article will use the two kinds of basic pitch detection

6、 algorithm is the basic principle and realization. Finally in Matlab on speech signal pitch period detection.The paper also finished programming algorithm, in the Matlab7.0 simulation environment, the algorithm is validated by simulation, and the contrast experiments were done before and after filte

7、ring. The experimental results show that, after the filtering of the speech signal pitch period detection is more accurate.Keywords: pitch detection; autocorrelation function; the average magnitude difference function method; pitch contrail目 錄第1章 緒論 1 1.1 引言 1 1.2 基音檢測(cè)的定義和意義 1 1.3 基音檢測(cè)的研究現(xiàn)狀 2 1.4 論文

8、的結(jié)構(gòu)安排 3第2章 基音檢測(cè)的常用算法 4 2.1 引言 4 2.1常用的基音檢測(cè)算法及原理 4 2.2.1 自相關(guān)函數(shù)法 4 2.2.2 平均幅度差函數(shù)法 6 2.3本章小結(jié) 7第3章 基于Matlab基因周期的檢測(cè) 9 3.1 語音文件的錄制與讀入 9 3.2 語音信號(hào)的采樣與分幀 9 3.3 語音信號(hào)基音周期的檢測(cè) 11 3.3.1 短時(shí)自相關(guān)函數(shù)法檢測(cè)基音周期 11 3.3.2 短時(shí)平均幅度差函數(shù)法檢測(cè)基音周期 12 3.4 基音周期檢測(cè)的后處理 14 3.5 濾波后的基音周期檢測(cè) 15 3.6 本章小結(jié) 18第4章 總結(jié)與展望 19參考文獻(xiàn) 20致謝 21附錄 22第1章 緒論1.

9、1引言語音是語言的聲學(xué)表現(xiàn)是人類相互之間進(jìn)行信息交流時(shí)所用的重要載體和基本手段,隨著現(xiàn)代信息科學(xué)技術(shù)的飛速發(fā)展,尤其是計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的日益普及和完善,是的語音信號(hào)處理技術(shù)發(fā)揮著越來越重要的作用。目前,語音信號(hào)處理的一系列技術(shù)及其應(yīng)用已經(jīng)成為信息社會(huì)中不可或缺的重要組成部分,對(duì)促進(jìn)信息社會(huì)的發(fā)轉(zhuǎn)具有重要意義。語音信號(hào)處理是語音學(xué)的數(shù)字信號(hào)處理相結(jié)合而形成的一門綜合性學(xué)科,包括語音合成、語音識(shí)別、語音編碼和說話人識(shí)別等四大分支1。語音信號(hào)處理和認(rèn)知科學(xué)、心理學(xué)、語言學(xué)、計(jì)算機(jī)科學(xué)、模式識(shí)別和人工智能等學(xué)科聯(lián)系緊密。語音信號(hào)處理技術(shù)的發(fā)展依賴于這些學(xué)科的發(fā)展,而語音信號(hào)處理技術(shù)的進(jìn)步也會(huì)促進(jìn)這些學(xué)科

10、的發(fā)展2。在語音信號(hào)處理中,語音信號(hào)參數(shù)提取的準(zhǔn)確性非常重要。只有獲得準(zhǔn)確的可表征語音信號(hào)本質(zhì)特征的參數(shù),才有可能利用這些參數(shù)進(jìn)行高效的語音合成,語音識(shí)別以及語音壓縮編碼解碼處理,其中基音周期的提取在語音信號(hào)眾多參數(shù)提取中尤為重要,其提取的準(zhǔn)確與否直接影響到合成語音是否真實(shí)再現(xiàn)原始語音信號(hào)的頻譜3。1.2 基音檢測(cè)的定義和意義人在發(fā)音時(shí),根據(jù)聲帶是否震動(dòng)可以將語音信號(hào)分為清音跟濁音兩種。濁音又稱有聲語言,攜帶者語言中大部分的能量,濁音在時(shí)域上呈現(xiàn)出明顯的周期性;而清音類似于白噪聲,沒有明顯的周期性。發(fā)濁音時(shí),氣流通過聲門使聲帶產(chǎn)生張弛震蕩式振動(dòng),產(chǎn)生準(zhǔn)周期的激勵(lì)脈沖串。這種聲帶振動(dòng)的頻率稱為基

11、音頻率,相應(yīng)的周期就成為基音周期4。通常,基音頻率與個(gè)人聲帶的長(zhǎng)短、薄厚、韌性、勁度和發(fā)音習(xí)慣等有關(guān)系,在很大程度上反應(yīng)了個(gè)人的特征。此外,基音頻率還跟隨著人的性別、年齡不同而有所不同。一般來說,男性說話者的基音頻率較低,大部分在70200Hz的范圍內(nèi),而女性說話者和小孩的基音頻率相對(duì)較高,在200450Hz之間?;糁芷诘墓烙?jì)稱謂基音檢測(cè),基音檢測(cè)的最終目的是為了找出和聲帶振動(dòng)頻率完全一致或盡可能相吻合的軌跡曲線。基因周期作為語音信號(hào)處理中描述激勵(lì)源的重要參數(shù)之一,在語音合成、語音壓縮編碼、語音識(shí)別和說話人確認(rèn)等領(lǐng)域都有著廣泛而重要的問題,尤其對(duì)漢語更是如此。漢語是一種有調(diào)語言,而基因周期的

12、變化稱為聲調(diào),聲調(diào)對(duì)于漢語語音的理解極為重要。因?yàn)樵跐h語的相互交談中,不但要憑借不同的元音、輔音來辨別這些字詞的意義,還需要從不同的聲調(diào)來區(qū)別它,也就是說聲調(diào)具有辨義作用;另外,漢語中存在著多音字現(xiàn)象,同一個(gè)字的不同的語氣或不同的詞義下具有不同的聲調(diào)。因此準(zhǔn)確可靠地進(jìn)行基音檢測(cè)對(duì)漢語語音信號(hào)的處理顯得尤為重要。1.3 基音檢測(cè)的研究現(xiàn)狀自進(jìn)行語音信號(hào)分析研究以來,基音檢測(cè)一直是一個(gè)重點(diǎn)研究的課題。盡管目前基音檢測(cè)的方法有很多種,然而這些方法都有其局限性。迄今為止仍然沒有一種檢測(cè)方法能夠適用不同的說話人、不同的要求和環(huán)境、究其原因,可歸納為如下幾個(gè)方面5。1語音信號(hào)變化十分復(fù)雜,聲門激勵(lì)的波形并

13、不是完全的周期脈沖串,在語音的頭、尾部并不具有聲帶振動(dòng)那樣的周期性,對(duì)于有些清濁音的過度幀很難判定其應(yīng)屬于周期性或非周期性,從而也就無法估計(jì)出基音周期。2聲道共振峰有時(shí)會(huì)嚴(yán)重影響激勵(lì)信號(hào)的諧波結(jié)構(gòu),使得想要從語音信號(hào)中去除聲道影響,直接取出僅和聲帶振動(dòng)有關(guān)的聲源信息并不容易。3在濁音語音段很難對(duì)每個(gè)基因周期的開始和結(jié)束位置進(jìn)行精確的判斷,一方面因?yàn)檎Z音信號(hào)本身是準(zhǔn)周期的。另一方面因?yàn)檎Z音信號(hào)的波形受共振峰、噪音等因素的影響。4在實(shí)際應(yīng)用中,語音信號(hào)常?;煊性肼?,而噪聲的存在對(duì)于基音檢測(cè)算法的性能產(chǎn)生強(qiáng)烈影響。5基音頻率變化范圍大,從低音男聲的70Hz到兒童女性的450Hz,接近3個(gè)倍頻程,給基

14、因檢測(cè)帶來了一定的困難。盡管語音檢測(cè)面臨著很多困難,然而由于基因周期在語音信號(hào)處理領(lǐng)域的重要性,使得語音基因周期檢測(cè)一直是不斷研究改進(jìn)的重要課題之一。數(shù)十年來,國(guó)內(nèi)外眾多學(xué)者對(duì)如何準(zhǔn)確地從語音波形中提取出基因周期作出了不懈的努力,提出了多種有效的基音周期檢測(cè)方法。我國(guó)基因檢測(cè)方面的研究起步要比國(guó)外發(fā)達(dá)國(guó)家晚一點(diǎn),但是進(jìn)步很大,特別是對(duì)漢語的基音檢測(cè)取得成果尤為突出。目前的基因檢測(cè)算法大致可分為兩大類:非基于事件檢測(cè)方法和基于事件檢測(cè)方法6,這里的事件是指聲門閉合。非基于事件的檢測(cè)方法主要有:自相關(guān)函數(shù)法7-10、平均幅度查函數(shù)法11,倒譜法1213,以及在以上算法基礎(chǔ)上的一些改進(jìn)算法14-17

15、。語音信號(hào)是一種典型的時(shí)變、非平穩(wěn)信號(hào),但是,由于語音的形成過程是發(fā)音器官的運(yùn)動(dòng)密切相關(guān)的,而這種物理運(yùn)動(dòng)比起聲音振動(dòng)速度來講要緩慢得多,因此語音信號(hào)常??杉俣槎虝r(shí)平穩(wěn)的,即在短時(shí)間內(nèi),其頻譜特性和某些物理特征參量可近似地看作是不變的,非基于事件的檢測(cè)方法正是利用語音信號(hào)短時(shí)平穩(wěn)性這一特點(diǎn),先將語音信號(hào)分為長(zhǎng)度一定的語音幀,然而對(duì)每一幀語音求基音周期。相比基于事件的基音周期檢測(cè)方法來說,它的優(yōu)點(diǎn)是算法簡(jiǎn)單,運(yùn)算量小,然而從本質(zhì)上說這些方法無法檢測(cè)幀內(nèi)基因周期的非平穩(wěn)變化,檢測(cè)精度不高?;谑录臋z測(cè)方法是通過定位聲門閉合時(shí)刻來對(duì)基因周期進(jìn)行估計(jì),而不需要對(duì)語音信號(hào)進(jìn)行短時(shí)平穩(wěn)假設(shè),主要有小波

16、變換方法和Hilbert-Huang變換方法兩種。在時(shí)域和頻域上這兩種方法又具有良好的局部特性,能夠跟蹤基因周期的變化,并可以將微小的基因周期變化檢測(cè)出來,因此檢測(cè)精度較高,但是計(jì)算量較大。1.4 論文的結(jié)構(gòu)安排與論文的主要內(nèi)容相對(duì)應(yīng),全文具體章節(jié)安排如下:第1章:首先簡(jiǎn)述語音信號(hào)處理以及基因周期檢測(cè)的相關(guān)概念,其次對(duì)基音檢測(cè)的背景研究意義、意義以及現(xiàn)狀進(jìn)行了說明,最后敘述了論文的結(jié)構(gòu)安排。第2章:對(duì)對(duì)現(xiàn)有的基音檢測(cè)算法進(jìn)行歸納和總結(jié),針對(duì)常用的兩種檢測(cè)算法,詳細(xì)介紹其檢測(cè)原理以及事先,并進(jìn)行了優(yōu)缺點(diǎn)分析。第3章:在matlab上對(duì)自相關(guān)函數(shù)法和平均幅度差函數(shù)法進(jìn)行了實(shí)現(xiàn),對(duì)語音信號(hào)濾波前后的

17、基音周期軌跡圖進(jìn)行了比較。第4章:對(duì)論文的主要內(nèi)容進(jìn)行了總結(jié),對(duì)語音基因周期的檢測(cè)算法進(jìn)行了很好的展望。最后是參考文獻(xiàn)、致謝、附錄。第2章 基音檢測(cè)的常用算法2.1 引言基音周期是語音信號(hào)的重要參數(shù)之一,準(zhǔn)確而快速基音周期檢測(cè)對(duì)語音信號(hào)的合成、編碼、識(shí)別等具有重要意義。目前,基音檢測(cè)的算法有很多種,常用的檢測(cè)算法要有自相關(guān)函數(shù)法、平均幅度差函數(shù)法等。本章將詳細(xì)的介紹這兩種常用基音檢測(cè)算法的基本原理。2.2 常用的基音檢測(cè)算法及原理2.2.1 自相關(guān)函數(shù)法能量有限的語音信號(hào)的短時(shí)自相關(guān)函數(shù)定義為: (2.1)其中,為移位距離,是偶對(duì)稱的窗函數(shù)。短時(shí)自相關(guān)函數(shù)有以下重要性質(zhì):如果是周期信號(hào),周期是

18、,則也是周期信號(hào),且周期相同,即。當(dāng)=0時(shí),自相關(guān)函數(shù)具有最大值;當(dāng)處周期信號(hào)的自相關(guān)函數(shù)達(dá)到極大值。自相關(guān)函數(shù)是偶函數(shù),即。短時(shí)自相關(guān)函數(shù)法基音檢測(cè)的主要原理是利用短時(shí)自相關(guān)函數(shù)的第二條性質(zhì),通過比較原始信號(hào)和它移位后的信號(hào)之間的類似性來確定基音周期,如果移位距離等于基音周期,那么,兩個(gè)信號(hào)具有最大類似性。在實(shí)際采用短時(shí)自相關(guān)函數(shù)法進(jìn)行基音檢測(cè)時(shí),使用一個(gè)窗函數(shù),窗不動(dòng),語音信號(hào)移動(dòng),這是經(jīng)典的短時(shí)自相關(guān)函數(shù)法。窗口長(zhǎng)度的選擇至少要大于基音周期的兩倍,越大,短時(shí)自相關(guān)函數(shù)波形的細(xì)節(jié)就越清楚,更有利于基音檢測(cè),但計(jì)算量較大,近年來由于高速數(shù)字信號(hào)處理器(DSP)的使用,從而使得這一算法簡(jiǎn)單有效

19、,而不再采用結(jié)構(gòu)復(fù)雜的快速傅里葉變換法、遞歸計(jì)算法等;越小,誤差越大,但計(jì)算量較小。圖2-1 (a)原信號(hào)(b)自相關(guān)函數(shù)圖2-2 (a)原信號(hào)(b)自相關(guān)函數(shù)基于自相關(guān)函數(shù)的算法是基音周期估計(jì)的常用方法,特別適用于噪聲環(huán)境下的基音提取。自相關(guān)函數(shù)在基音周期處表現(xiàn)為峰值,相鄰兩個(gè)峰值之間的間隔即為一個(gè)基音周期。但通常情況下,基波分量往往不是最強(qiáng)的分量,豐富的諧波成分使語音信號(hào)的波形變得非常復(fù)雜,給基音檢測(cè)帶來了困難,經(jīng)常發(fā)生基頻估計(jì)結(jié)果為其實(shí)際基音頻率的二次倍頻或二次分頻的情況。加之還有清濁混雜等情況,使基音檢測(cè)成為一大難題。如圖2-1(a)是一幀語音信號(hào),2-1(b)是這幀語音信號(hào)的自相關(guān)函

20、數(shù),可以看出自相關(guān)函數(shù)在基音周期處表現(xiàn)為峰值,這些峰值點(diǎn)之間的間隔的平均值就是基音周期,如圖2-2(b)所示可以看出自相關(guān)函數(shù)檢測(cè)出的基音周期是原始信號(hào)基音周期的一半,這是由于諧波峰值點(diǎn)(箭頭所示)的影響,這就是上述缺點(diǎn)中所說的倍頻現(xiàn)象。2.2.2 平均幅度差函數(shù)法語音信號(hào)的短時(shí)平均幅度差函數(shù)定義為: (2.2)其中,是窗函數(shù),是一幀語音信號(hào)的長(zhǎng)度,因?yàn)檎Z音信號(hào)的濁音段具有周期性,我們假設(shè)基音周期為,則在濁音段,在處將出現(xiàn)谷點(diǎn),谷點(diǎn)間的距離即為基音周期。實(shí)際應(yīng)用中,窗函數(shù)和取矩形窗,這樣可使短時(shí)平均幅度差函數(shù)的定義更簡(jiǎn)單。短時(shí)平均幅度差函數(shù)可以寫成: (2.3)由于只需加法、減法和取絕對(duì)值等計(jì)

21、算,故算法簡(jiǎn)單,很易于硬件實(shí)現(xiàn),從而使得短時(shí)平均幅度差函數(shù)法在基音檢測(cè)中使用得相當(dāng)普遍,著名的10階線性預(yù)測(cè)聲碼器LPC-10聲碼器就采用AMDF法來進(jìn)行基音周期的提取。研究表明:當(dāng)在靜音環(huán)境下或當(dāng)噪聲較小時(shí),AMDF法可以取的較好的檢測(cè)結(jié)果,但在語音環(huán)境較惡劣、信噪比較低時(shí),檢測(cè)的效果很差,難以讓人滿意。如圖2-3(a)是一幀語音信號(hào),2-3(b)是這幀語音信號(hào)的平均幅度差函數(shù),可以看出平均幅度差函數(shù)在基音周期處表現(xiàn)為谷值,這些谷值之間的間隔的平均值就是所要求得基音周期。如圖2-4(a)是在這幀語音信號(hào)中加入信噪比是2dB噪聲后的波形,由圖2-4(b)可以看出它的平均幅度差函數(shù)中出現(xiàn)了很多諧

22、波分量,基音峰值點(diǎn)基本淹沒在這些諧波分量中,影響了基音周期的判斷。圖2-3 (a) 原信號(hào)(b) 平均幅度差函數(shù)圖2-4 (a)加噪信號(hào)(b) 平均幅度差函數(shù)2.3 本章小結(jié)本章對(duì)常用基于ACF、AMDF的基音檢測(cè)算法的基本原理進(jìn)行了詳細(xì)介紹,并進(jìn)行了分析。兩種算法對(duì)純凈的語音信號(hào)都能取得較好的檢測(cè)精度但是由于語音信號(hào)的復(fù)雜多變,以及噪聲等因素的影響,這些方法都有一定的局限性?;谡Z音信號(hào)短時(shí)平穩(wěn)性,它們的優(yōu)點(diǎn)是比較簡(jiǎn)單,主要應(yīng)用于只需要平均基音周期作為參數(shù)的語音編解碼,語音識(shí)別等。自相關(guān)函數(shù)法具有很好的抗噪性,但易受半頻、倍頻錯(cuò)誤影響。平均幅度差函數(shù)法只需加法、減法和取絕對(duì)值等計(jì)算,算法簡(jiǎn)單

23、,運(yùn)算量相比自相關(guān)函數(shù)法大為減少,易于硬件實(shí)現(xiàn)。 第3章 基于Matlab基因周期的檢測(cè)3.1 語音文件的錄制與讀入1 利用windows附件中的錄音機(jī)功能錄制2-3秒的.wav語音文件,并以a為文件名保存到Matlab/work的文件夾中。a.打開 開始/程序/附件/娛樂/錄音機(jī);b.自已說話a的四個(gè)音調(diào)錄音(按鍵),到2-3秒時(shí)停止(按鍵);c.將錄制的文件加存為C:/Matlab/work中,文件名為a1.wav,a2.wav,a3.wav,a4.wav,采樣頻率選11.025KHz,16位,單聲道; 2 打開Matlab并新建一.m文件;3 在.m文件中用y=wavread(a1.wa

24、v)命令讀入語音文件。3.2 語音信號(hào)的采樣和分幀這里的“采樣”是指從語音信號(hào)中選取一段樣本,一般取樣點(diǎn)數(shù)為幀長(zhǎng)的整數(shù)倍。短時(shí)分析將語音分為一段一段來處理,每一段就稱為一“幀”。分幀時(shí)需要對(duì)語音信號(hào)進(jìn)行加窗操作,窗口長(zhǎng)度的選擇非常重要,窗口長(zhǎng)度過短會(huì)使得分析窗內(nèi)沒有包含足夠的數(shù)據(jù)點(diǎn)來進(jìn)行周期判斷,且短時(shí)能量變化劇烈;窗口長(zhǎng)度過長(zhǎng),短時(shí)能量是一段長(zhǎng)時(shí)間的平均,不但不能反映語音信號(hào)基頻的細(xì)節(jié)變化部分,而且使得計(jì)算量增大。窗口長(zhǎng)度至少要大于基音周期的兩倍。一般窗長(zhǎng)選為120-240點(diǎn),分幀模塊主要完成將取樣模塊中獲得的語音樣值點(diǎn)分為若干個(gè)語音幀。以a1.wav語音為例,在Matlab上進(jìn)行語音的采樣

25、與分幀。打開Matlab并新建一.m文件,運(yùn)行:x=wavread(a1.wav);%讀取聲音文件figure(1);stem(x,.); %顯示聲音信號(hào)的波形得到的波形如下:圖3-1 a1原始語音波形對(duì)語音信號(hào)采樣,通過matlab對(duì)語音文件“a1.wav”計(jì)算得知其語音長(zhǎng)度為2.5秒,若采樣頻率為11KHz,共計(jì)27500個(gè)采樣點(diǎn)。采樣模塊從采樣頻率為11KHz的語音信號(hào)中截取1秒到2秒這一時(shí)間段,取了11000個(gè)樣點(diǎn)進(jìn)行分析,取幀長(zhǎng)為20ms,即每幀為220個(gè)樣點(diǎn)值,共分為50幀。打開Matlab,運(yùn)行:x=wavread(a1.wav);%讀取聲音文件x=x(11001:22000);

26、figure(1);stem(x,.); %顯示聲音信號(hào)的波形得到波形如下:圖3-2 a1采樣信號(hào)波形3.3 語音信號(hào)基音周期的檢測(cè)3.3.1 短時(shí)自相關(guān)函數(shù)法檢測(cè)基音周期對(duì)每一幀信號(hào)進(jìn)行自相關(guān)運(yùn)算程序如下:n=220; %取20ms的聲音片段,即220個(gè)樣點(diǎn)for m=1:length(x)/n; %對(duì)每一幀求短時(shí)自相關(guān)函數(shù) for k=1:n; Rm(k)=0; for i=(k+1):n; Rm(k)=Rm(k)+x(i+(m-1)*n)*x(i-k+(m-1)*n); end end p=Rm(10:n); %防止誤判,去掉前邊10個(gè)數(shù)值較大的點(diǎn) Rmax,N(m)=max(p); %

27、讀取第一個(gè)自相關(guān)函數(shù)的最大點(diǎn)end %補(bǔ)回前邊去掉的10個(gè)點(diǎn)N=N+10;T=N/8; %算出對(duì)應(yīng)的周期 figure(2);stem(T,.);axis(0 length(T) 0 10);xlabel(幀數(shù)(n);ylabel(周期(ms);title(各幀基音周期);得到結(jié)果如下:圖3-3 a1基音軌跡圖3.3.2 短時(shí)平均幅度差函數(shù)法檢測(cè)基音周期對(duì)每一幀信號(hào)進(jìn)行平均幅度差運(yùn)算程序如下:x=wavread(a1.wav);%讀取聲音文件 b1=x(11001:22000);figure(1);stem(b1,.); %顯示聲音信號(hào)的波形N=200;%窗長(zhǎng)A=;for k=1:200%延遲

28、長(zhǎng)度 sum=0; for m=1:N sum=sum+abs(b1(m)-b1(m+k-1); end A(k)=sum;ends=x(11001:22000);figure(2)subplot(211);plot(s);subplot(212);plot(A);得到結(jié)果如下:圖3-4 a1平均幅度差運(yùn)算3.4 基音周期檢測(cè)的后處理無論采用哪一種基音周期檢測(cè)算法都可能產(chǎn)生基音檢測(cè)的錯(cuò)誤,使求得的基音周期軌跡中一個(gè)或幾個(gè)基音周期估計(jì)值偏離了正常的估計(jì)(通常是偏離到正常值的兩倍或1/2),并稱這種偏離點(diǎn)為基音軌跡的“野點(diǎn)”。此時(shí)為了去除這些野點(diǎn),可以采用各種平滑算法,其中最常用的是中值平滑算法和

29、線性平滑算法。這里采用中值平滑處理,中值平滑處理的基本原理是:設(shè)x(n)為輸入信號(hào),y(n)為中值濾波器的輸出,采用一個(gè)滑動(dòng)窗,輸出值就是將窗外的中心移到n處時(shí)窗口輸入樣點(diǎn)的中值,及n點(diǎn)的左右各取L個(gè)樣點(diǎn)。連同被平滑點(diǎn)中心共同構(gòu)成一組信號(hào)采樣點(diǎn)(共2L+1個(gè)樣值),然后將這(2L+1)個(gè)樣點(diǎn)按大小序列排成一排,此序列中中間著作為平滑器的輸出。L值一般為1或2,即中值平滑起的“窗口”一般套住3個(gè)火5個(gè)樣點(diǎn)。中值平滑的有點(diǎn)是既可以有效的除去少量的野點(diǎn),又不會(huì)破壞基因周期軌跡中兩個(gè)平滑段之間的階躍性變化。得到基音軌跡圖后,在matlab中運(yùn)行:T1= medfilt1(T,5); %去除野點(diǎn),中值平

30、滑figure(3);stem(T1,.);axis(0 length(T1) 0 10); xlabel(幀數(shù)(n);ylabel(周期(ms);title(各幀基音周期);得到結(jié)果如下:圖3-6 處理后的a1基音軌跡圖3.5 濾波后的基音周期檢測(cè)對(duì)采樣信號(hào)進(jìn)行濾波處理,這里用截至頻率為500Hz的低通濾波器,阻帶衰減20dB,過度帶寬0.1。打開matlab,運(yùn)行如下程序:x,fs,bits=wavread(a1.wav);x1=x(11001:22000);figure(1);plot(x1);%做原始語音信號(hào)的時(shí)域圖形title(原始語音信號(hào));fc1=500;N1=2*pi*0.9/

31、(0.1*pi)wc1=2*pi*fc1/fs;if rem(N1,2)=0 N1=N1+1;endWindow= boxcar (N1+1); %長(zhǎng)度為N1的矩形窗Windowb1=fir1(N1,wc1/pi,Window);figure(2);freqz(b1,1,512);title(低通濾波器的頻率響應(yīng));y= filter(b1,1,x1);%對(duì)信號(hào)進(jìn)行低通濾波figure(3);plot(y);title(信號(hào)經(jīng)過低通濾波器(時(shí)域);得到結(jié)果如下:圖3-7 低通濾波器的頻率響應(yīng)圖3-8 a1經(jīng)過低通濾波器的波形再對(duì)濾波后的的語音信號(hào)y檢測(cè)基因周期,用上面講述的自相關(guān)函數(shù)法和平均幅

32、度差法進(jìn)行基音周期的檢測(cè),再進(jìn)行中值平滑處理,最后進(jìn)行比較。下圖是自相關(guān)函數(shù)法檢測(cè)濾波后的a1的基音軌跡圖。圖3-9 a1濾波后的基音軌跡圖圖3-9跟圖3-6比較發(fā)現(xiàn),檢測(cè)精度有明顯的提高。3.6 本章小結(jié)本章在Matlab上對(duì)自相關(guān)函數(shù)法和平均幅度差法進(jìn)行了實(shí)現(xiàn),并且進(jìn)行了比較,隨后又把采樣語音信號(hào)進(jìn)行濾波處理再進(jìn)行基音周期的檢測(cè),跟之前的進(jìn)行比較,可以看出,檢測(cè)精度有明顯的提高。Matlab上對(duì)a2.wav,a3.wav,a4.wav基音檢測(cè)的程序跟結(jié)果圖片全放在附錄。 第4章 總結(jié)與展望語音信號(hào)的基音周期是描述激勵(lì)源的重要特征參數(shù)之一,準(zhǔn)確的檢測(cè)語音信號(hào)的基音周期對(duì)高質(zhì)量的語音分析與合成

33、、語音壓縮編碼、語音識(shí)別等都具有重要意義。本論文討論了幾種常用的基音周期檢測(cè)方法自相關(guān)函數(shù)法和平均幅度差函數(shù)法以及在matlab上的實(shí)現(xiàn)。論文中首先介紹了幾種常見的語音基音周期檢測(cè)方法如自相關(guān)函數(shù)法(ACF)、平均幅度差法(AMDF)。自相關(guān)函數(shù)方法適合于噪聲環(huán)境下,但單獨(dú)使用經(jīng)常發(fā)生基頻估計(jì)結(jié)果為其實(shí)際基音頻率的二次倍頻或二次分頻的情況;平均幅度差法在靜音環(huán)境下或噪聲較小時(shí)可以取得較好的檢測(cè)結(jié)果,但在語音環(huán)境較惡劣、信噪比較低時(shí),檢測(cè)的結(jié)果下降較快,難以讓人滿意?;魴z測(cè)是語音處理中的一個(gè)非常重要的問題,但由于影響基音檢測(cè)的因素眾多。使得基音周期的準(zhǔn)確估計(jì)非常困難。盡管基音周期檢測(cè)有許多困難

34、,但因?yàn)樗闹匾?,基音周期檢測(cè)一直是一個(gè)研究的重要課題。為了從語音波形中準(zhǔn)確地提取基音的工作,使全世界的科學(xué)家忙了幾十年,從20世紀(jì)60年代以來出現(xiàn)了很多種基音周期檢測(cè)方法,特別是在有噪環(huán)境下的語音信號(hào)的基音周期檢測(cè)方面更是提出了許多有效的方法。進(jìn)行基音檢測(cè)方面早期研究工作的國(guó)家主要有美國(guó)等歐美國(guó)家,之后,我國(guó)在基音檢測(cè)方面,尤其是對(duì)漢語的基音檢測(cè)工作也取得了很大進(jìn)展。 為了提高基音檢測(cè)的準(zhǔn)確性,降低計(jì)算復(fù)雜度,人們已經(jīng)從基于事件的檢測(cè)方法和非基于事件的檢測(cè)方法出發(fā) ,開發(fā)了許多基音檢測(cè)算法 。我相信以后在基音周期方向,人們會(huì)取得重大的突破。參考文獻(xiàn)1 易克初,田斌,付強(qiáng)語音信號(hào)處理M北京:

35、國(guó)防工業(yè)出版社,2000:1-10頁。2 胡航語音信號(hào)處理M哈爾濱:哈爾濱工業(yè)出版社,2000。3 付青青,吳愛平基于IATLAR的語音信號(hào)自相關(guān)基音檢測(cè)長(zhǎng)江大學(xué)學(xué)報(bào)2006O34:9910l。 4 張雄偉,陳亮,楊吉斌現(xiàn)代語音處理技術(shù)及應(yīng)用M北京:機(jī)械工業(yè)出版社,2003:9-11頁。5 馮康,時(shí)慧坤語音先好基音檢測(cè)的現(xiàn)狀及發(fā)展J微機(jī)發(fā)展,2004,14(3):95-98頁。6 李娟基音周期檢測(cè)算法研究及在語音合成中的應(yīng)用D太原理工大學(xué),2008:3-5頁。7 韓紀(jì)慶,張磊,鄭鐵然語音信號(hào)處理M北京:清華大學(xué)出版社,2004:1、75、85-89頁。8 楊樹功小波分析在語音信號(hào)基音檢測(cè)中應(yīng)用

36、研究D西安:西北工業(yè)大學(xué),2005:1-2頁。9 馬祥杰,孟相如,張百生一種自相關(guān)基音檢測(cè)算法J通信技術(shù),2003(5):9-11頁。10 鮑長(zhǎng)春,樊昌信基于歸一化互相關(guān)函數(shù)的基音檢測(cè)算法J通信學(xué)報(bào),1998,19(10):27-31頁。11 王小亞倒譜在語音的基音和共振峰提取中的應(yīng)用J工程應(yīng)用,2004,44(1):57-61頁。12 趙建偉,樓宏偉,徐大為,劉重慶噪音環(huán)境下的基音檢測(cè)方法J紅外與激光工程,2002,21(1):5-8頁。13 徐剛,黃冰基于小波變換和歸一化自相關(guān)的基音檢測(cè)算法J桂林電子工業(yè)學(xué)院學(xué)報(bào),2003,23(6):2-5頁。14 陳小利,徐金普利用小波變換加權(quán)自相關(guān)的

37、基音檢測(cè)算法J數(shù)據(jù)采集與處理,2007,22(4):463-467頁。15 李香春,杜利明一種基于多尺度邊緣特征提取的基音檢測(cè)算法J中電子學(xué)報(bào),2003,31(10):1500-1502頁。致 謝首先衷心感謝我的導(dǎo)師段凱宇段博士。段老師在通信、信號(hào)處理等領(lǐng)域都具有很高的理論造詣和豐富的工程經(jīng)驗(yàn)。他嚴(yán)禁的治學(xué)態(tài)度,勤奮的工作精神、對(duì)事業(yè)孜孜不倦的專研精神以及積極的人生態(tài)度都給我留下了深刻的印象,讓我受益匪淺。在完成論文期間,段老師對(duì)我的論文的研究工作進(jìn)行了悉心的指導(dǎo),并提出了大量的寶貴意見,使本人的論文工作得以順利完成。在此,向我培養(yǎng)我而付出辛勤勞動(dòng)的段老師表示我最崇高的的敬意和誠(chéng)摯的感謝!其次,我要感謝13#307寢室全體同學(xué),感謝他們?yōu)槲覄?chuàng)造安靜的學(xué)習(xí)環(huán)境,以及對(duì)我完成論文所作出的支持和幫助。由于本人水平有限,本論文在很多方面存在不足,請(qǐng)各位老師、專家批評(píng)指正。謝謝!附 錄語音信號(hào)讀入、采樣、自相關(guān)運(yùn)算的源程序:function a1x=wavread(a1.wav);%讀取聲音文件 x=x(11

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論