【畢業(yè)學(xué)位論文】復(fù)雜環(huán)境下特定說(shuō)話人的語(yǔ)音識(shí)別研究_第1頁(yè)
【畢業(yè)學(xué)位論文】復(fù)雜環(huán)境下特定說(shuō)話人的語(yǔ)音識(shí)別研究_第2頁(yè)
【畢業(yè)學(xué)位論文】復(fù)雜環(huán)境下特定說(shuō)話人的語(yǔ)音識(shí)別研究_第3頁(yè)
【畢業(yè)學(xué)位論文】復(fù)雜環(huán)境下特定說(shuō)話人的語(yǔ)音識(shí)別研究_第4頁(yè)
【畢業(yè)學(xué)位論文】復(fù)雜環(huán)境下特定說(shuō)話人的語(yǔ)音識(shí)別研究_第5頁(yè)
已閱讀5頁(yè),還剩86頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

【畢業(yè)學(xué)位論文】復(fù)雜環(huán)境下特定說(shuō)話人的語(yǔ)音識(shí)別研究.pdf 免費(fèi)下載

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

分類號(hào) 學(xué)校代碼 10495 學(xué) 號(hào) 0915123025 武漢 紡織大學(xué) 碩 士 學(xué) 位 論 文 復(fù)雜環(huán)境下特定說(shuō)話人的語(yǔ)音識(shí)別研究 作者姓名: 張 琪 指導(dǎo)教師: 程建政 教授 學(xué)科門類: 工 學(xué) 專 業(yè): 物理電子學(xué) 研究方向: 計(jì)算機(jī) 語(yǔ)音信號(hào)處理 完成日期 : 二零一二年三月 . E. y i 012 獨(dú)創(chuàng)性聲明 本人鄭重聲明:所呈交的學(xué) 位論文,是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫過(guò)的作品成果。對(duì)本文的研究作出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識(shí)到本聲明的法律結(jié)果由本人承擔(dān)。 學(xué)位論文版權(quán)使用授權(quán)書 本學(xué)位論文作者完全了解 武漢紡織大學(xué) 有關(guān)保留、使用學(xué)位論文的規(guī)定。特授權(quán) 武漢紡織大學(xué) 可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,并采用影印、縮印或掃描等復(fù)制手段保存、匯編以供查閱和借閱。同意學(xué)校向國(guó)家有 關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和磁盤。 (保密的學(xué)位論文在解密后適用本授權(quán)說(shuō)明) 論文題目:復(fù)雜環(huán)境下特定說(shuō)話人的語(yǔ)音識(shí)別研究 專業(yè):物理電子學(xué) 碩士生:張琪 指導(dǎo)教師:程建政 摘要 利用某一特定說(shuō)話人的語(yǔ)音來(lái)對(duì)這個(gè)人的身份進(jìn)行識(shí)別的技術(shù)叫做說(shuō)話人識(shí)別技術(shù)。我們所研究的是說(shuō)話人識(shí)別中的與文本無(wú)關(guān) 的 說(shuō)話人確認(rèn)系統(tǒng)。在信息技術(shù)高速發(fā)展的今天,說(shuō)話人確認(rèn)已經(jīng)得到了很全面的研究和成功的應(yīng)用。 文中介紹了說(shuō)話人識(shí)別所需要用到的語(yǔ)音信號(hào)的特征參數(shù)并對(duì)他們進(jìn)行了仿真實(shí)現(xiàn)。 雖然在實(shí)驗(yàn)環(huán)境中說(shuō)話人研究已經(jīng)能取得了很好的研 究和成果,但是在運(yùn)用到現(xiàn)實(shí)生活中的時(shí)候,因?yàn)閺?fù)雜的環(huán)境噪聲的影響會(huì)造成系統(tǒng)識(shí)別性能的急劇下降。本文針對(duì)這個(gè)問(wèn)題,分為兩個(gè)方向研究了如何提高說(shuō)話人識(shí)別系統(tǒng)在環(huán)境噪聲下的魯棒性的方法: 首先介紹 了 基于特征參數(shù)的噪聲魯棒性算法,在這類算法里面著重研究分析了 譜減 法、 波等在說(shuō)話人識(shí)別中常用的消除噪聲影響的技術(shù) 。用具箱分別對(duì)語(yǔ)音信號(hào)提取 數(shù)和它的 數(shù)、 數(shù),用來(lái)對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別,發(fā)現(xiàn) 數(shù)可以提高系統(tǒng)的識(shí)別性能。在介紹譜減法時(shí) 使用譜減法對(duì)語(yǔ)音進(jìn)行了增強(qiáng),由于譜減法對(duì)語(yǔ)音加強(qiáng)之后會(huì)出現(xiàn)“音樂(lè)噪聲”,引入了改進(jìn)的譜減算法。 以對(duì)參數(shù)進(jìn)行降維和去除一部分噪聲 ,本文對(duì) 軸和數(shù)據(jù)方向的一致性、 換對(duì)數(shù)據(jù)的擴(kuò)展性能和數(shù)據(jù) 降維有益于 型分類等方面進(jìn)行了驗(yàn)證。在對(duì) 研究過(guò)程中,將其用于 數(shù)的濾波,在實(shí)驗(yàn)中,對(duì)干凈和帶噪語(yǔ)音信號(hào)分別進(jìn)行 征參數(shù)的提取,發(fā)現(xiàn)干凈語(yǔ)音和帶噪語(yǔ)音所產(chǎn)生 數(shù)的譜圖要比兩者的 數(shù)譜圖相近,證實(shí)了數(shù)的魯棒性。 并基于特征參數(shù)的融合提出了一個(gè)新的抗噪特征參數(shù),并用實(shí)驗(yàn)數(shù)據(jù)證實(shí)了它的有效性。 然后介紹了基于模型的對(duì)噪聲進(jìn)行補(bǔ)償?shù)募夹g(shù),也就是在 型的基礎(chǔ)上引入 型。并對(duì) 型進(jìn)行了研究,雖然 很優(yōu)秀的分類模型,但是由于聲道參數(shù)不適于直接用于 分類,所以論文中最后將 引入了 技術(shù),很好的提高了系統(tǒng)的識(shí)別性能。 本文 用 音庫(kù)中的純凈語(yǔ)音和 中的噪聲作為訓(xùn)練和識(shí)別的語(yǔ)音數(shù)據(jù) 對(duì)上述算法 在 進(jìn)行了仿真 ,用大量的實(shí)驗(yàn)結(jié)果數(shù)據(jù)畫出了各個(gè)系統(tǒng)的 便于對(duì)系統(tǒng)的性能進(jìn)行分析和比較 。從實(shí)驗(yàn)結(jié)果可以看出,這些方法 使系統(tǒng)的噪聲魯棒性得到了很大的提高。 關(guān)鍵詞: 說(shuō)話人確認(rèn); 究類型: 應(yīng)用研究 i is of a to a a In to on a is to a s In of in or In of of on on on of of on In of on of of to on is on in of CA of CA to MM s CA In it is LP,LP by we of LP A is on in to on as a in VM is is a to of VM MM of of of on It is of of on 錄 I 目 錄 1 緒論 1 景 1 話人識(shí)別 2 話人識(shí)別的分類 3 2 說(shuō)話人識(shí)別的模型的分類 5 話人識(shí)別的系統(tǒng)性能評(píng)價(jià)標(biāo)準(zhǔn) 7 線 7 線和等誤識(shí)率 7 查代價(jià)函數(shù) 9 線 10 雜環(huán)境下的說(shuō)話人識(shí)別 11 于信號(hào)特征的噪音魯棒算法 12 于模型的噪音魯棒算法 12 文使用到的語(yǔ)料庫(kù) 13 音庫(kù) 13 據(jù)庫(kù) 13 文的安排 14 2 說(shuō)話人特征參數(shù)提取 15 音信號(hào)的預(yù)處理 15 加重( 15 窗處理( 16 音信號(hào)的特征參數(shù)的分類 17 域特征。 18 性預(yù)測(cè)編碼參數(shù)。 20 域及倒譜特征。 21 于聽覺(jué)特征的參數(shù)。 24 征 25 數(shù)的具體計(jì)算過(guò)程 26 界帶寬 28 數(shù) 28 目錄 征提取的過(guò)程 28 結(jié) 30 3 說(shuō)話人識(shí)別中特征提取的魯棒性 31 數(shù) 31 32 機(jī)向量的 開 34 維的實(shí)現(xiàn) 35 減法與非線性譜減法 37 聲譜的估計(jì) 39 譜均值相減法 ( 39 譜均值與方差歸一化法 ( 39 40 征提取的 術(shù) 40 征彎折 ( 42 章小 結(jié) 43 4 基于 話人識(shí)別模型 44 型 44 參數(shù)估計(jì) 46 種新的抗噪特征參數(shù)用于 型的說(shuō)話人識(shí)別 49 數(shù)的提取 49 驗(yàn)結(jié)果 51 于高斯混合模型 說(shuō)話人確認(rèn) 52 于 話人確認(rèn)的的訓(xùn)練過(guò)程 52 于 話人確認(rèn)的確認(rèn)過(guò) 程 55 性能比較 56 章小結(jié) 56 5 混合模型 58 型 58 究意義 58 于風(fēng)險(xiǎn)最小的機(jī)器學(xué)習(xí)方法 59 類間隔最大 61 性判決邊界 63 線性判決邊界 63 目錄 說(shuō)話人確認(rèn)中的應(yīng)用 68 統(tǒng) 69 概率輸出 71 于 性核函數(shù)的 于說(shuō)話人確認(rèn)系統(tǒng) 73 章總結(jié) 75 6 總結(jié)與展望 76 作總 結(jié) 76 作展望 76 致謝 78 參考文獻(xiàn) 78 附錄 82 1 緒論 1 1 緒論 景 作為人類交流和交換信息的工具,語(yǔ)言無(wú)疑是其中最重要、最方便、最直接的工具。也是人類特有的特征,而語(yǔ)音是 語(yǔ)言的表現(xiàn)形式。實(shí)現(xiàn)計(jì)算機(jī)和人類能直接通過(guò)語(yǔ)音進(jìn)行交流是人類自計(jì)算機(jī)誕生以來(lái)不懈追求的一個(gè)夢(mèng)想。隨著信息技術(shù)的發(fā)展,語(yǔ)音信號(hào)處理得到了得到了廣泛的應(yīng)用和發(fā)展,應(yīng)用方向也越來(lái)越多,語(yǔ)音信號(hào)處理的若干研究方向如圖 5。 語(yǔ) 音 信 號(hào) 處 理分 析 / 合 成 識(shí) 別 編 碼語(yǔ) 音 識(shí) 別 說(shuō) 話 人 識(shí) 別 語(yǔ) 種 辨 識(shí)說(shuō) 話 人 檢 測(cè) 和 跟 蹤說(shuō) 話 人 辨 認(rèn) 說(shuō) 話 人 確 認(rèn) 與 文 本無(wú) 關(guān) 開 集 與 文 本有 關(guān) 閉 集 與 文 本無(wú) 關(guān) 開 集 與 文 本有 關(guān) 閉 集圖 音信號(hào)處理 語(yǔ)音識(shí)別是指計(jì)算機(jī)對(duì)人類語(yǔ)言進(jìn)行正確響應(yīng)的技術(shù) 6語(yǔ)音識(shí)別的目的是從語(yǔ)音信號(hào)中利用相應(yīng)算法從語(yǔ)音信號(hào)中自動(dòng)的提取出人們感興趣的信息,語(yǔ)音識(shí)別有語(yǔ)義識(shí)別、語(yǔ)種辨識(shí)以及說(shuō)話 人識(shí)別等研究方向。語(yǔ)義識(shí)別就是一般所說(shuō)的語(yǔ)音識(shí)別( 就是識(shí)別出語(yǔ)音的內(nèi)容,從而根據(jù)其信息,執(zhí)行人的各種意圖;語(yǔ)種辨識(shí)或稱語(yǔ)言辨識(shí)( 通過(guò)分析處理一個(gè)語(yǔ)言片段以判別其所屬語(yǔ)言的語(yǔ)種;說(shuō)話人識(shí)別( 不注重語(yǔ)音信號(hào)中的語(yǔ)義內(nèi)容,而是對(duì)語(yǔ)音信號(hào)進(jìn)行處理,根據(jù)語(yǔ)音里包含的說(shuō)話人的個(gè)人特征信息從而對(duì)對(duì)說(shuō)話人進(jìn)行1 緒論 2 身份鑒別與認(rèn)證的一種技術(shù)。 說(shuō)話人識(shí)別和語(yǔ)音識(shí)別一樣,都是對(duì)采集到語(yǔ)音信號(hào)信號(hào)經(jīng)行處理 ,提取語(yǔ)音信號(hào)的特征參數(shù),建立相應(yīng)的識(shí)別模型,以此為標(biāo)準(zhǔn)來(lái)進(jìn)行識(shí)別。兩者的區(qū)別在于語(yǔ)音識(shí)別是只關(guān)心語(yǔ)音中所包含的語(yǔ)義內(nèi)容,力圖消除不同說(shuō)話人的區(qū)別,在不同人的語(yǔ)音信號(hào)之間尋找共通之處,而說(shuō)話人識(shí)別卻是需要從語(yǔ)音信號(hào)中提取出能代表說(shuō)話人個(gè)性特征的參數(shù),強(qiáng)調(diào)不同人之間的語(yǔ)音信號(hào)的差別,并不很關(guān)心語(yǔ)音包含的語(yǔ)義內(nèi)容。 話人識(shí)別 時(shí)間 / . 5 1 1 . 5 2 2 . 5 3 3 . 5x 1 0段語(yǔ)音的語(yǔ)譜圖 當(dāng)今社會(huì)信息技術(shù)的發(fā)展使得生物識(shí)別技術(shù)日漸成熟并在人們的生活中具有重要的作用。所謂生物識(shí)別技術(shù),就是提取人體的固有生理特征和行為特征,利用計(jì)算機(jī)等高科技方法進(jìn)行識(shí)別?,F(xiàn)在主要的生物識(shí)別技術(shù)有:指紋識(shí)別、人臉識(shí)別、虹膜識(shí)別、還有本文要介紹的語(yǔ)音識(shí)別中的說(shuō)話人識(shí)別,也叫做聲紋( 別。 1945年,驗(yàn)室的 . 過(guò)研究用語(yǔ)圖儀 ( 繪出的語(yǔ)譜圖 ( ,他們發(fā)現(xiàn)了同一個(gè)人發(fā)同一個(gè)音的譜圖,總是比其他人發(fā)這個(gè)音得到的語(yǔ)譜圖更加地接近。譜圖直觀明了,十分類似于指紋。由此提出了聲紋的概念。生物識(shí)別技術(shù)比起傳統(tǒng)的身份識(shí)別方法更加方便,它不容易丟失、遺忘或 者被盜。目前這些技術(shù)廣泛應(yīng)用于許多領(lǐng)域中,如財(cái)經(jīng)領(lǐng)域、安全保衛(wèi)領(lǐng)域、公安司法領(lǐng)域、軍事領(lǐng)域、信1 緒論 3 息服務(wù)領(lǐng)域等。 語(yǔ)音是人的自然屬性之一,由于說(shuō)話人發(fā)音器官的生理差異和后天形成的行為不同,事實(shí)上,每個(gè)人的牙齒、舌頭的尺寸,口腔和鼻腔的長(zhǎng)度,聲帶的形狀和韌性,聲道的大小和形態(tài)等方面都存在著很大的差異。這些因素使得每個(gè)人的發(fā)音特征和習(xí)慣都有所不同,具體就反應(yīng)在聲音信號(hào)中。所以通過(guò)對(duì)語(yǔ)音信號(hào)進(jìn)行分析處理 , 就能夠找出其特征,分辨出說(shuō)話人。說(shuō)話人識(shí)別與指紋識(shí)別、虹膜識(shí)別等生物特征識(shí)別相比,它的優(yōu)勢(shì)在于輸入、識(shí)別所用設(shè)備簡(jiǎn) 單,一般只需麥克風(fēng)和普通計(jì)算機(jī)等,識(shí)別也只需要說(shuō)幾句話,系統(tǒng)成本低且采集方便。另外利用電話網(wǎng)絡(luò)實(shí)現(xiàn)遠(yuǎn)程客戶服務(wù)。這項(xiàng)技術(shù)使得可以通過(guò)說(shuō)話人的聲音來(lái)對(duì)說(shuō)話人的身份進(jìn)行確認(rèn)或辨認(rèn)進(jìn)行服務(wù)如語(yǔ)音撥號(hào)、電話銀行、電話購(gòu)物、數(shù)據(jù)庫(kù)訪問(wèn)服務(wù)、語(yǔ)音郵件、機(jī)密信息的安全控制和遠(yuǎn)程訪問(wèn)計(jì)算機(jī)等成為可能。 預(yù) 處 理模 式 匹 配判 決 識(shí) 別 結(jié) 果參 考模 板語(yǔ) 音 輸 入特 征 提 取訓(xùn) 練識(shí) 別圖 話人識(shí)別系統(tǒng)框圖 一個(gè)說(shuō)話人識(shí)別系統(tǒng)如圖 的建立有兩個(gè)重要的階段:訓(xùn)練階段和識(shí)別階段。訓(xùn)練階段需要使用者的若干訓(xùn)練語(yǔ)音片段。提取這些語(yǔ)音片段 的特征參數(shù)以作為標(biāo)準(zhǔn)對(duì)系統(tǒng)進(jìn)行訓(xùn)練學(xué)習(xí),建立模板或模型參數(shù)參考集。在訓(xùn)練階段時(shí),截取待識(shí)別者的語(yǔ)音片段,對(duì)其進(jìn)行特征參數(shù)的提取,然后參照建立的模板或模型參數(shù)參考集進(jìn)行比較,根據(jù)一定的相似準(zhǔn)則進(jìn)行判定。 話人識(shí)別的分類 按不同的角度,說(shuō)話人識(shí)別有多種不同的分類方法。自動(dòng)說(shuō)話人識(shí)別( 一種自動(dòng)識(shí)別說(shuō)話人的過(guò)程。按其最終目標(biāo)可分為四類: ( 1) 說(shuō)話人確認(rèn)( 判斷一段未知語(yǔ)音是否來(lái)自于一個(gè)特定人的語(yǔ) 音片段,只需要輸出 “ 是 ” 或者 “ 否 ” ,是一個(gè)二元問(wèn)題。 ( 2) 說(shuō)話人辨認(rèn)( 判斷一段未知語(yǔ)音是來(lái)自于 選一問(wèn)題。 ( 3) 說(shuō)話人檢測(cè)( 指對(duì)一段包含多個(gè)人說(shuō)話的語(yǔ)音,判斷語(yǔ)音中是否含有特定說(shuō)話人的語(yǔ)音。與說(shuō)話人確認(rèn)相似,也屬于二元檢測(cè),只需要1 緒論 4 輸出是或者否。區(qū)別只在于給定的語(yǔ)音是屬于多個(gè)人的。 ( 4) 說(shuō)話人跟蹤( 在說(shuō)話人檢測(cè)的 基礎(chǔ)上,如果該多人語(yǔ)音中包含了某個(gè)特定說(shuō)話人的語(yǔ)音,則標(biāo)出此特定說(shuō)話人語(yǔ)音部分在多人語(yǔ)音中的位置。 也有文獻(xiàn)上把 ( 3) 和 ( 4) 歸為一類,稱為說(shuō)話人探測(cè)跟蹤 ( 3。 當(dāng)說(shuō)到說(shuō)話人識(shí)別時(shí)傳統(tǒng)的主要的目標(biāo)是指前面兩種,即說(shuō)話人確認(rèn)和說(shuō)話人辨認(rèn)。兩者的雖然在可選決策數(shù)目上不同,但說(shuō)話人確認(rèn)和說(shuō)話人辨認(rèn),在本質(zhì)上沒(méi)有很大的區(qū)別,都是根據(jù)說(shuō)話人所說(shuō)的測(cè)試語(yǔ)句或者關(guān)鍵詞語(yǔ),從中提取說(shuō)話人本人特征相關(guān)的信息,與訓(xùn)練好的參考模型比較之后做出判斷。說(shuō)話人 辨識(shí)是需要將待識(shí)別的語(yǔ)音判別為已注冊(cè)人之中的哪一個(gè)人所說(shuō)的,這個(gè)是多選一的問(wèn)題。如果已知待識(shí)別的說(shuō)話人是在已注冊(cè)的說(shuō)話人集合內(nèi),這就是閉集測(cè)試 ( ,也就是識(shí)別系統(tǒng)已經(jīng)先驗(yàn)得說(shuō)話人屬于某參考說(shuō)話人集合;反之,如果不知道該說(shuō)話人有沒(méi)有注冊(cè),就是開集測(cè)試 ( 。對(duì)于開集測(cè)試,增加一個(gè)確認(rèn)過(guò)程,辨識(shí)系統(tǒng)需要首先對(duì)語(yǔ)音進(jìn)行確認(rèn),判斷該說(shuō)話人是否已經(jīng)注冊(cè),并據(jù)此接受或拒絕辨認(rèn)結(jié)果。顯然,多了這個(gè)確認(rèn)過(guò)程就會(huì)導(dǎo)致整個(gè)說(shuō)話人辨識(shí)的效率及性能下降,開集識(shí)別的難度要比閉級(jí)大很多。說(shuō)話人確認(rèn)是判別 待識(shí)別的語(yǔ)音是否與他所申明的已注冊(cè)模型相符,系統(tǒng)只做出 “ 是 ” 或 “ 不是 ”的二元判斷。兩種系統(tǒng)的基本原理如圖 實(shí)上,兩種系統(tǒng)的主要區(qū)別是判斷的數(shù)目不同,說(shuō)話人辨認(rèn)是在全部注冊(cè)說(shuō)話人的范圍內(nèi)進(jìn)行的,需要進(jìn)行多次判斷,因此辨認(rèn)性能與注冊(cè)的人數(shù)有關(guān)。隨著注冊(cè)人數(shù)的增加,不僅訓(xùn)練時(shí)間變長(zhǎng),各個(gè)用戶之間就變得更難得區(qū)分,辨認(rèn)性能力會(huì)有所下降;而說(shuō)話人確認(rèn)與注冊(cè)的人數(shù)關(guān)系較小,隨著注冊(cè)人數(shù)的增大,確認(rèn)性能不隨用戶的增加而變化,接近穩(wěn)定的常數(shù)。 在進(jìn)行說(shuō)話人識(shí)別時(shí),根據(jù)限定的語(yǔ)音內(nèi)容,還可以將其分為三類:與文本無(wú) 關(guān)( 與文本有關(guān)( 文本指定型( ( 1) 文本相關(guān)是指系統(tǒng)訓(xùn)練時(shí)精確的建立了說(shuō)話人的模型,識(shí)別時(shí)要求訓(xùn)練語(yǔ)音和測(cè)試語(yǔ)音所對(duì)應(yīng)的文本一致,要求說(shuō)話人按規(guī)定的內(nèi)容發(fā)音。這種識(shí)別模式的建模方法比較簡(jiǎn)單,所需要的訓(xùn)練語(yǔ)音與測(cè)試語(yǔ)音的長(zhǎng)度較短,但由于對(duì)文本內(nèi)容的限制 , 通常只在出入境管理、安全認(rèn)證等及身份認(rèn)證相關(guān)方面使用。 ( 2) 文本無(wú)關(guān)是指不測(cè)試結(jié)果與訓(xùn)練語(yǔ)音和測(cè)試語(yǔ)音所對(duì)應(yīng)的文本是否一致文本無(wú)關(guān),對(duì)測(cè)試的內(nèi)容不做限定,說(shuō)話人 可以不用確定說(shuō)話內(nèi)容。模型的建立相對(duì)與文本相關(guān)的建立要困難一些,由于對(duì)文本內(nèi)容限制較低,使用方法要更加靈活,用戶使用方便,應(yīng)用區(qū)域較多,特別適合在國(guó)防偵聽、刑事偵查等與語(yǔ)音偵聽相關(guān)方面使用。通常來(lái)講,文本相關(guān)的說(shuō)話人識(shí)別精度要比文本無(wú)關(guān)的說(shuō)話人識(shí)別要高,但是文本無(wú)關(guān)使用的靈活性相對(duì)于前者要好得多。如果是從安全性上來(lái)說(shuō),顯然只有前兩種情況是不完全1 緒論 5 的,如果事先把使用者語(yǔ)音錄下來(lái)的話,就會(huì)有裝置誤接受的危險(xiǎn)。所以有了下面的第三種類別。 ( 3) 指定文本是要求測(cè)試語(yǔ)音所對(duì)應(yīng)的文本為系統(tǒng)所設(shè)定文本 (不一定與訓(xùn)練語(yǔ)音的 文本相同 )的說(shuō)話人識(shí)別。指定文本的說(shuō)話人識(shí)別可以分成兩種方式:一種是在進(jìn)行識(shí)別時(shí),系統(tǒng)將隨機(jī)地指定要求說(shuō)話人說(shuō)出的文本,當(dāng)說(shuō)話人所說(shuō)的文本與指定的文本相同,并且說(shuō)話人所說(shuō)的被認(rèn)可時(shí),系統(tǒng)才接受該說(shuō)話人;另一種是在進(jìn)行識(shí)別時(shí),系統(tǒng)隨機(jī)的對(duì)說(shuō)話人提問(wèn),這些問(wèn)題是預(yù)先設(shè)置的一個(gè)或幾個(gè)問(wèn)題,當(dāng)說(shuō)話人回答的文本與預(yù)先指定的答案的文本相同,同時(shí)說(shuō)話人所說(shuō)的被認(rèn)可時(shí),系統(tǒng)才接受該說(shuō)話人。一般情況下,指定文本的說(shuō)話人識(shí)別與語(yǔ)音識(shí)別技術(shù)結(jié)合使用。通常來(lái)說(shuō),與文本相關(guān)的說(shuō)話人識(shí)別需要的訓(xùn)練語(yǔ)音時(shí)間較短,由于系統(tǒng)性能高從而很容易 建立模型。但是識(shí)別與文本無(wú)關(guān)的說(shuō)話人,需要很長(zhǎng)時(shí)間的語(yǔ)音訓(xùn)練,并且在測(cè)試時(shí),需要的語(yǔ)音時(shí)間較長(zhǎng)。本文主要研究與文本無(wú)關(guān)的說(shuō)話人確認(rèn)。 2 說(shuō)話人識(shí)別的模型的分類 ( 1) 模式匹配法:模板匹配法的要點(diǎn)是,在訓(xùn)練過(guò)程中從說(shuō)話人發(fā)出的訓(xùn)練語(yǔ)句中提取相應(yīng)的特征矢量,這些特征矢量能夠充分描寫各個(gè)說(shuō)話人的個(gè)性特征。這些特征矢量稱為各個(gè)說(shuō)話人的模板。在測(cè)試階段,按同樣的方法在說(shuō)話人的測(cè)試語(yǔ)音里面提取測(cè)試模板,根據(jù)與相應(yīng)的參考模板相比較得到匹配程度也就是模板之間的距離來(lái)做出判斷。 動(dòng)態(tài)時(shí)間規(guī)整方法( 。 50 100 150 200556065向量155606550100150200250300350向量 250 100 150 20050100150200250300350D T W 總距離 = 5 6 . 8 4 8 3 0 1 0 5 0 0 0 1 8向量 1向量2圖 態(tài)時(shí)間規(guī)整算法 1 緒論 6 這是在 80年代的與文本相關(guān)的語(yǔ)音識(shí)別和說(shuō)話人識(shí)別中提出的一種算法,在固定短語(yǔ)的應(yīng)用中效果較好,主要是利用動(dòng)態(tài)時(shí)問(wèn)規(guī)整以對(duì)準(zhǔn)訓(xùn)練和測(cè)試特征序列來(lái)進(jìn)行判別,這個(gè)方法的實(shí)現(xiàn)很簡(jiǎn)單,圖 于直接在時(shí)間序列上進(jìn)行,受噪聲,信道的干擾很大,應(yīng)用范圍受到限制,在概率統(tǒng)計(jì)模型算法成熟之后,目前已經(jīng)很少有研究機(jī)構(gòu)采用這種方法了。 矢量量化 (法:矢量量化技術(shù)是最早是用于聚類分析的數(shù)據(jù)壓縮編碼技術(shù)。不直接在時(shí)域上進(jìn)于預(yù)處理,對(duì)倒譜參數(shù)進(jìn)行聚類,把每個(gè)人的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論