版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 基于語音控制的智能車設(shè)計年 級: 學(xué) 號: 姓 名: 專 業(yè): 指導(dǎo)老師: 年 月 第 II 頁 共 40 頁摘 要讓機器能夠聽懂人的語音,按照人類的命令去執(zhí)行,是未來發(fā)展的一個重要方向,而語音識別是實現(xiàn)語音控制的關(guān)鍵性技術(shù)。語音識別的核心思想,就是模式匹配。通過語音訓(xùn)練建立一個語音庫,把輸入的語音與語音庫中的模板相匹配,并對每一個匹配的模板進行打分,把分數(shù)最高的模板,作為識別結(jié)果輸出。本文著重闡述了語音識別的原理,并介紹了語音識別專用芯片-LD3320。對此芯片的識別原理、典型應(yīng)用電路圖、軟件驅(qū)動都有所涉及。本設(shè)計利用STC12LE5A60S2 為主控芯片,結(jié)合 ICRoute 公司高性能
2、語音識別芯片 LD3320,設(shè)計了基于非特定人的語音識別與控制的智能小車。該智能車由語音識別模塊、主控模塊、電源模塊、電機驅(qū)動模塊等幾大部分組成。語音識別模塊由語音芯片LD3320、語音采集單元即咪頭等組成。主控模塊由 STC12LE5A60S2 型號的單片機組成。電源模塊由 7.2V 鎳氫動力電池、7805 穩(wěn)壓芯片、ASM1117-3.3V 穩(wěn)壓芯片組成。電機驅(qū)動模塊由直流電機、L298N 驅(qū)動芯片組成。該智能小車實現(xiàn)了語音命令的“前進” 、 “后退” 、 “左轉(zhuǎn)” 、 “右轉(zhuǎn)” 、 “提速” 、 “降速”等功能。在環(huán)境較為安靜的情況下,正確識別率較高。關(guān)鍵詞:語音識別; LD3320;
3、STC12LE5A60S2; 7805 穩(wěn)壓芯片; L298N 驅(qū)動芯片 第 III 頁 共 40 頁AbstractLet the machine to understand human speech, perform the humans order , is an important direction for future development, and speech recognition is the key technology to realize voice control.The core idea of speech recognition, is pattern ma
4、tching. The establishment of a speech database through voice training, the input speech and speech database template matching and scoring for each matching template, the template with the highest scores, output as the recognition results.This paper focuses on the principle of speech recognition, and
5、 introduces the speech recognition chip -LD3320. This chip identification principle and typical application circuit diagram, software drivers are involved. This design uses STC12LE5A60S2 as the main chip, chip with high performance speech recognition company ICRoute LD3320, the design of intelligent
6、 car speech recognition and control based on speaker independent. Composed of several modules such as the smart car driven by a speech recognition module, main control module, power supply module, motor.The speech recognition module is composed of LD3320 voice chip, voice acquisition unit is Amy etc
7、. The main control module is composed of MCU models STC12LE5A60S2. The power supply module is composed of 7.2V Ni MH battery, 7805 voltage stabilizing chip, ASM1117-3.3V regulator chip. The motor drive module by DC motor, L298N driver chip.The smart car to achieve the voice command forward and backw
8、ard and left and right and speed and speed and other functions. The environment is quiet, higher correct recognition rate.Keywords: speech recognition; LD3320; STC12LE5A60S2; 7805 voltage regulator chip L298N driver chip 第 IV 頁 共 40 頁目 錄摘 要.IIAbstract .III第 1 章 緒論.11.1 語音識別概述.11.2 研究目的.11.3 語音識別的發(fā)展過
9、程與現(xiàn)狀.11.4 課題研究手段.21.5 論文主要工作.21.6 本章總結(jié).3第 2 章 系統(tǒng)整體方案設(shè)計.42.1 系統(tǒng)方案介紹.42.2 語音識別原理.42.3 LD3320 語音芯片識別原理.52.4 小車電機驅(qū)動方式.62.4.1 脈沖寬度調(diào)制調(diào)速的原理.62.4.2 PWM 調(diào)速的單片機實現(xiàn)方法 .62.5 本章總結(jié).6第 3 章 系統(tǒng)硬件設(shè)計.73.1 系統(tǒng)電源部分設(shè)計.73.2 小車電機驅(qū)動模塊.73.3 LD3320 語音識別芯片 .83.3.1 LD3320 語音芯片介紹.83.3.3 LD3320 硬件電路圖及本設(shè)計電路圖.93.5 LD3320 語音芯片語音采集部分.1
10、03.6 本章總結(jié).10第 4 章 系統(tǒng)軟件部分設(shè)計.114.1 小車電機轉(zhuǎn)速控制軟件.114.1.1 PWM 的軟件實現(xiàn) .114.1.2 小車功能實現(xiàn).114.2 語音芯片 LD3320 軟件編程實現(xiàn).124.2.1 LD3320 寄存器操作方式.12 第 V 頁 共 40 頁4.2.2 LD3320 的驅(qū)動部分.134.3 小車整體軟件實現(xiàn).154.4 本章總結(jié).15第 5 章 系統(tǒng)整體調(diào)試.165.1 系統(tǒng)硬件調(diào)試.165.2 系統(tǒng)軟件調(diào)試.165.3 本章總結(jié).16第六章 總結(jié)與展望.176.1 總結(jié).176.2 展望.17致 謝.18參考文獻.19附 錄 1 流程圖、電路圖及實物圖
11、、仿真圖.20附 錄 2 本設(shè)計的主要程序.22 第 1 頁第 1 頁 共 40 頁第 1 章 緒論1.1 語音識別概述語言和聲音是人類相互傳遞信息的重要手段1。人類自從能夠制造出可以代替自身勞動的機器以來,就有個夢想,就是讓機器能夠聽懂人類的命令,并按照人類的語音去行動2,從而實現(xiàn)機器與人的人性化溝通與交流,而不是依賴傳統(tǒng)的鼠標、鍵盤的交互方式。語音識別技術(shù)的出現(xiàn)讓人類的這個理想得以實現(xiàn)。我們通常意義上的語音識別,就是計算機或處理器把語音信號“翻譯”成相對應(yīng)的語言序列3。所謂的“翻譯” ,是指在有限的區(qū)間里選擇出待識別的目標,即是:所有可能結(jié)果已經(jīng)存在,是一種模式匹配的思想,目前,語音識別的
12、主要方式就是基于這種模式匹配思想的??傮w而言,語音識別的過程即是一個模式匹配的過程4,首先,根據(jù)人多次語音輸入,建立一個語音模型,即是語音庫,當(dāng)開始識別時,需要對輸入語音信號進行分析,然后,進行提取出此語音信號的特征,最后,將已經(jīng)提取的語音信號的特征與已經(jīng)存在的語音模型進行比較,將每一個模板的比較結(jié)果得分統(tǒng)計,找出分數(shù)最高的最優(yōu)的匹配模板,進行輸出5。圖 1-1 為其基本語音識別的結(jié)構(gòu)。圖 1-1 語音識別系統(tǒng)的基本結(jié)構(gòu)1.2 研究目的通過對該課題的研究,一方面理解語音識別技術(shù)的原理,了解當(dāng)前的發(fā)展水平,分析國內(nèi)外語音識別技術(shù)水平之間的差距。另一方面,根據(jù)自己當(dāng)前對語音控制系統(tǒng)的研究,為語音控
13、制無人駕駛汽車的應(yīng)用,奠定良好的基礎(chǔ)。1.3 語音識別的發(fā)展過程與現(xiàn)狀語音識別的設(shè)想很早就有人提出,甚至,計算機還沒有被發(fā)明出來的時候,語音識別的想法已經(jīng)初現(xiàn)雛形,在 1920 年的時候,一種玩具狗叫做“Radio Rex”被 第 2 頁 共 40 頁 生產(chǎn)出來,當(dāng)人們叫出它的名字的時候,這只小狗可以聽懂,并從座上彈出來。這也許是最早的語音識別機器了7。語音識別的研究工作大約開始于 20 實際的 50 年代8,貝爾實驗室開發(fā)的Audrey 語音識別系統(tǒng)是最早的基于計算機的識別系統(tǒng),1960 年代,語音識別引入了人工神經(jīng)網(wǎng)絡(luò)。線性預(yù)測編碼 Linear Predictive Coding (LP
14、C), 及動態(tài)時間彎折 Dynamic Time Warp 技術(shù)是這一時代的突破性技術(shù)。語音信號產(chǎn)生模型的問題被動態(tài)時間彎折技術(shù)很好的解決了,大大的推動了對語音識別的發(fā)展。70 年代,對語音識別的研究,有了一個很大的突破9-10。LP 技術(shù)在理論上得到了很大的發(fā)展,并且,動態(tài)時間歸正技術(shù)(DTW)也漸漸趨于完善,矢量量化(VQ)和隱馬爾可夫模型(HMM)理論也被提了出來。80 年代,進一步發(fā)展了語音識別技術(shù),MFCC 的參數(shù)提取技術(shù)和 HMM 模型都得到了的深入的發(fā)展,在理論體系上,比較完整和準確的描述了語音識別的問題逐,同時在實踐上,效率較高的解決算法又逐步被研發(fā)出來。我國語音識別研究工作起
15、步于 50 年代11-12,雖然我國起步很晚,但是,語音識別的研究工作發(fā)展迅猛。也漸漸從實驗室變?yōu)閷嶋H產(chǎn)品。國內(nèi)最初期的語音識別技術(shù)研究是從中科院聲學(xué)所開始的。國外也非常重視中國未來的龐大市場,美國、新加坡等很多公司,對漢語語音的研究都投入了巨大的物力、財力。并已達到世界先進水平。因此,一方面,要不斷加強對語音識別理論的研究,另一方面,還要加快從理論轉(zhuǎn)化為產(chǎn)品的進程。1.4 課題研究手段1.4.1 研究手段首先查找和語音控制小車相關(guān)文獻和資料從而全面地、客觀地了解語音控制小車的發(fā)展現(xiàn)狀,并且按照本設(shè)計功能的實現(xiàn)可以劃分為:語音處理模塊、主控模塊STC12LE5A60S2、電機驅(qū)動模塊和電源模塊
16、等部分。然后按照各個模塊分別調(diào)試,之后,各個模塊綜合調(diào)試,以完成本次設(shè)計。1.5 論文主要工作(1) 介紹了語音識別的原理,以及語音識別芯片 LD3320 的識別原理。(2) 對語音芯片 LD3320 的硬件電路進行了介紹,并介紹了其軟件驅(qū)動。(3) 對 LD3320 進行軟件編程,并對小車的控制進行了編程。(4) 整體系統(tǒng)進行了軟硬件的調(diào)試,通過語音控制實現(xiàn)了智能小車的前進、后 第 3 頁 共 40 頁 退、左拐、右拐、提速、降速等功能。1.6 本章總結(jié)本章是緒論部分。對語音識別原理進行一個基本的概述,并介紹了本次設(shè)計的研究目的。然后介紹了語音識別的發(fā)展過程與現(xiàn)狀,并且,提出了對本設(shè)計的研究
17、手段,最后介紹了論文所做的主要工作。 第 4 頁 共 40 頁 第 2 章 系統(tǒng)整體方案設(shè)計2.1 系統(tǒng)方案介紹本設(shè)計以 STC12LE 系列低電壓單片機為核心,并采用 ICRoute 公司生產(chǎn)的LD3320 語音識別芯片和相關(guān)電路,實現(xiàn)了語音控制小車的設(shè)計任務(wù)。使其可根據(jù)語音提示,做出前進、后退、左拐、右拐、提速、降速等相應(yīng)動作。圖 2-1 語音控制小車整體框圖 2.2 語音識別原理語音識別本質(zhì)上屬于模式識別的范疇。語音輸入后,對語音進行預(yù)處理和特征提取,并產(chǎn)生一個訓(xùn)練模板,多次語音學(xué)習(xí)和訓(xùn)練后,就會生成一個模板庫,當(dāng)有命令再次輸入時,就會與模板庫中的參考模板進行比對,得分最高的一項,作為識
18、別結(jié)果輸出。 圖 2-2 語音識別原理下面詳細介紹語音識別原理的幾個關(guān)鍵部分1. 預(yù)處理 包括對語音信號進行采樣、反混疊帶通濾波、去除個體發(fā)音差異、 第 5 頁 共 40 頁 去除環(huán)境噪聲引起的干擾等,基元的選取和端點檢測問題也是語音識別會涉及到的。2. 特征提取 特征提取,主要是把能夠反映出語音本質(zhì)的一些參數(shù),提取出來,如平均能量、平均跨零率、共振峰等。提取語音特征在語音識別中也非常重要。3. 訓(xùn)練 訓(xùn)練,就是要求是在識別之前,需要很多次的重復(fù)待識別的命令,每次都能提取出關(guān)鍵字,去除無效的信息,按照不同命令,寫入不同的規(guī)則庫中,就能夠形成需要識別的模板庫。4. 模式匹配 語音識別系統(tǒng)的核心內(nèi)
19、容便是,模式匹配。它是通過某些定義好的規(guī)則,來計算出輸入語音提取的特征參數(shù)與模板庫中的參數(shù)之間的相似程度,來得到匹配分數(shù)的。這個規(guī)則,可能是某種語法規(guī)則或者專家經(jīng)驗來組成的。2.3 LD3320 語音芯片識別原理LD3320 語音芯片的識別原理: 圖 2-3 LD3320 語音芯片識別原理LD3320 提供的語音識別技術(shù),是基于“關(guān)鍵詞語列表”的識別技術(shù)(Auto speech recognition)工作過程:語音通過麥克風(fēng)接口 MIC 輸入到芯片中,然后,對輸入的聲音執(zhí)行頻譜分析,并且,提取出輸入語音的一些能夠代表語音特征的參數(shù),把提取出來的參數(shù),與寫入程序中的關(guān)鍵詞語進行比對,每個模板關(guān)
20、鍵詞都會有個匹配分數(shù),找出得分最高的關(guān)鍵詞作為識別輸出。但是,語音輸入是隨時的,隨時開始,隨時結(jié)束,所以說,語音是否結(jié)束,識別算法并不能準確的判斷出來,所以,并不能判斷出此識別結(jié)果是否正確。比如,識別列表中有兩個關(guān)鍵詞語分別是“李曉”和“李曉明” ,當(dāng)用戶說到“曉”這個音節(jié)時,在識別芯片內(nèi)部是“李曉”得分最高,但此時,芯片是無法給出識別結(jié)果。隨著用戶說出“明”音節(jié)后, “李曉明”則成為得分最高。此時,用戶停止說話,或者是定時錄音已到,使得識別芯片可以判斷出用戶已經(jīng)停止說話了, 第 6 頁 共 40 頁 才能給出識別結(jié)果是“李曉明” 。2.4 小車電機驅(qū)動方式 本設(shè)計采用 DC3V-6V 直流減
21、速電機作為小車的驅(qū)動電機,減速比為 1:48,這樣可以大大提高電機轉(zhuǎn)矩,在路況不平時也能有較大的轉(zhuǎn)速。2.4.1 脈沖寬度調(diào)制調(diào)速的原理該直流電機選用 PWM 方式進行調(diào)速。PWM 即是脈沖寬度調(diào)節(jié)(Pulse Width Modulation-簡稱 PWM)。PWM 的占空比即是高電平時間與整個周期的時間之比,是一種控制平均電壓的調(diào)速方式。t1 是高電平時間,t2 是低電平時間,T 是一個周期的時間,所以占空比 D=t1/T,如圖 2-4 所示圖 2-4 PWM 信號的占空比2.4.2 PWM 調(diào)速的單片機實現(xiàn)方法不同的單片機實現(xiàn) PWM 的方式有很大不同,一是可以利用單片機自身的資源來實現(xiàn)
22、,比如,某些型號的單片機,可以通過配置一些固定的管腳來輸出 PWM 波,例如,STM32 類的單片機。二是通過單片機利用定時器來模擬出 PWM 波形,如常用的 51 單片機,本文所用的即是方法二。實現(xiàn)方式為利用單片機的定時器功能來模擬出 PWM 波形,進而通過改變計數(shù)器的計數(shù)值來改變占空比。2.5 本章總結(jié) 本章是整體方案設(shè)計,對系統(tǒng)的整體方案進行了介紹,詳細介紹了語音識別的原理,并且,介紹了語音識別芯片 LD3320 的識別原理。接著介紹了小車電機的驅(qū)動方式,即采用 PWM 進行調(diào)速。然后介紹了 PWM 的調(diào)速原理,以及軟件實現(xiàn)PWM 的思路。 第 7 頁 共 40 頁 第 3 章 系統(tǒng)硬件
23、設(shè)計3.1 系統(tǒng)電源部分設(shè)計系統(tǒng)供電電源采用 5000 毫安 7.2V 鎳氫動力電池,給電機驅(qū)動供電,經(jīng)過 7805穩(wěn)壓芯片輸出 5V,一方面可以給電機驅(qū)動芯片 L298N 邏輯端芯片供電,另一方面,7805 輸出的 5V,經(jīng)過 AMS1117-3.3V 電壓轉(zhuǎn)換芯片,轉(zhuǎn)換為 3.3V 給單片機和LD3320 語音芯片供電。圖 3-1 7805 芯片電路圖圖 3-2 ASM1117 電路圖3.2 小車電機驅(qū)動模塊L298N 此芯片的時序信號利用 L298 來提供的,而不是使用單片機的輸入輸出端口模擬,這樣做可以節(jié)省單片機輸入輸出接口。連接方式:L298N 的 Pin1 和 Pin15 可通過連
24、接電阻來控制負載電路。兩個電機連接到輸出的四個端口上,即:OUTl、OUT2 、OUT3、OUT4 ,電機的正反轉(zhuǎn)通過輸入 input1input4 引腳來控制。電機停轉(zhuǎn)則有 Enable 使能位控制。 第 8 頁 共 40 頁 圖 3-3 L298N 芯片電路圖3.3 LD3320 語音識別芯片 3.3.1 LD3320 語音芯片介紹LD3320 語音識別芯片是由 ICRoute 公司設(shè)計并生產(chǎn)的。是一款專用于語音識別的芯片,該芯片集成了語音識別處理器和一些像 AD、DA 轉(zhuǎn)換、麥克風(fēng)、聲音輸出電路等外部電路,該芯片待識別命令是可以動態(tài)編輯的,并且,不需要外接數(shù)據(jù)輔助芯片,如 RAM、Fla
25、sh 等,直接用在現(xiàn)有的產(chǎn)品中,就可以實現(xiàn)語音識別、人機對話等功能。 第 9 頁 共 40 頁 3.3.3 LD3320 硬件電路圖及本設(shè)計電路圖圖 3-4 LD3320 引腳圖 第 10 頁 共 40 頁 圖 3-5 LD3320 電路圖3.5 LD3320 語音芯片語音采集部分本設(shè)計將利用 LD3320 芯片上的 MIC 連接到咪頭上直接對語音信號進行采集。咪頭是將聲音信號轉(zhuǎn)換為電信號的轉(zhuǎn)換器件,通過正負管腳與 LD3320 芯片相連接,完成語音信號的輸入工作。由于本設(shè)計選取的 LD3320 芯片自帶特征提取算法,并且內(nèi)部自帶 2 個 FIFO 緩存器,可以直接保存數(shù)據(jù)而不需要外接任何輔助
26、芯片如 Flash、RAM 等。3.6 本章總結(jié) 本章是本次設(shè)計的硬件電路部分。首先介紹了該系統(tǒng)的電源部分的設(shè)計,接著,對電機驅(qū)動部分進行了介紹,即 L298N 的工作原理。然后介紹了 LD3320 的引腳圖以及典型的應(yīng)用電路,并介紹了該芯片的語音采集部分。 第 11 頁 共 40 頁 第 4 章 系統(tǒng)軟件部分設(shè)計4.1 小車電機轉(zhuǎn)速控制軟件4.1.1 PWM 的軟件實現(xiàn)初始化時,先把控制電機的四個信號線的電平拉低,,打開定時器 0,并且進入計數(shù)模式,定時器每隔 0.25 毫秒進入一次中斷,在中斷函數(shù)中開始計數(shù),如果計數(shù)達到了一個指定的值,便開始把電平拉低,如此往復(fù)循環(huán)。產(chǎn)生 PWM 的部分程
27、序如下:void Timer0(void) interrupt 1 TH0=(65536-250)/256; TL0=(65536-250)%256;/定時 0.25mS Cnt+;if(Cnt = dianji)Zuo1 = 1;you1 = 1;4.1.2 小車功能實現(xiàn)小車要想實現(xiàn)前進、后退等的功能,只要完成對 PWM 波的控制即可。前進、左轉(zhuǎn)、右轉(zhuǎn),只要控制電機的使能端即可,例如,前進時,左右兩端的使能端 ENA、ENB 都要使能,左轉(zhuǎn)時,只控制左邊電機使能,即 ENA 使能,相反的,右轉(zhuǎn)時,只控制右邊電機使能,即 ENB 使能即可。后退時,需要著重說明,因為后退也是兩個電機同時轉(zhuǎn)動,單
28、獨控制使能端就無法控制電機達到后退的功能,這時候,就要控制 PWM 的產(chǎn)生引腳,產(chǎn)生與前進時的 PWM 相反的兩路反 PWM 波形。具體實現(xiàn)如下,可以設(shè)置一個標志位 flag,在初始化時,flag 為高,等到后退時,把 flag 拉低,進入反 PWM 程序段即可。加速、減速時,可以改變高電平時間即可。如,加速時,讓高電平時間每次加10,減速時,讓高電平時間每次減 10。便實現(xiàn)了加速、減速的功能。 第 12 頁 共 40 頁 4.2 語音芯片 LD3320 軟件編程實現(xiàn)4.2.1 LD3320 寄存器操作方式通過操作各個寄存器才能夠完成對 LD3320 的操作,例如,設(shè)置相關(guān)標志位,讀取某些寄存
29、器狀態(tài),向 FIFO 中寫入數(shù)據(jù)等。有兩種方式可以進行對寄存器的讀操作與寫操作,一種為串行 SPI 形式,另一種為并行方式。本設(shè)計采用串行軟件模擬 SPI 讀寫方式,與 LD3320 進行寄存器讀寫。LD3320 的第 46 腳(MD)接高電平,且第 42 腳(SPIS*)接地時按照此串行 SPI 方式工作。1. 串行 SPI 寫模式 寫的時候,在寫狀態(tài)期間,需要保持 SCS* 引腳為有效電平,即低電平狀態(tài),首先,向 SDI 引腳發(fā)送一個寫的指令,然后,再向其引腳寫入8 位寄存器的地址, 再給 SDI 引腳發(fā)送 8 位數(shù)據(jù)。圖 4-2 SPI 方式寫時序2. 串行 SPI 讀模式 讀的時候,S
30、CS*保持在有效電平,即低電平狀態(tài)。首先,向 SDI 引腳發(fā)送一個讀取的指令,然后,再向其引腳寫入 8 位寄存器的地址,最后,就可以從 SDO 引腳接收到 8 位數(shù)據(jù)。圖 4-2 SPI 方式寫時序 第 13 頁 共 40 頁 4.2.2 LD3320 的驅(qū)動部分1. 芯片復(fù)位 芯片復(fù)位就是對芯片的第 47 腳(RSTB* )發(fā)送低電平。 void LD_reset() RSTB = 1; delay(1); RSTB = 0; delay(1); RSTB = 1; 芯片初始化一般在程序的開始進行,如果有時芯片的反應(yīng)不太正常,也可以用這個方法恢復(fù)芯片的初始狀態(tài)。2. 語音識別的驅(qū)動部分 語音
31、識別的操作順序是:各個寄存器的通用初始化;語音識別過程初始化;寫入識別列表;開始識別,同時,準備中斷服務(wù)程序,并置位中斷允許位。(1) 通用初始化 按照以下程序設(shè)置寄存器。void LD_Init_Common() LD_ReadReg(0 x06); LD_WriteReg(0 x17, 0 x35); delay(10); LD_ReadReg(0 x06); LD_WriteReg(0 x89, 0 x03); delay(5); LD_WriteReg(0 xCF, 0 x43); delay(5); LD_WriteReg(0 xCB, 0 x02); /*PLL setting*/
32、 LD_WriteReg(0 x11, LD_PLL_11); LD_WriteReg(0 x1E,0 x00); LD_WriteReg(0 x19, LD_PLL_ASR_19); LD_WriteReg(0 x1B, LD_PLL_ASR_1B); LD_WriteReg(0 x1D, LD_PLL_ASR_1D); delay(10);LD_WriteReg(0 xCD, 0 x04);LD_WriteReg(0 x17, 0 x4C); delay(5);LD_WriteReg(0 xB9, 0 x00);LD_WriteReg(0 xCF, 0 x4F); LD_WriteReg(
33、0 x6F, 0 xFF); 第 14 頁 共 40 頁 (2) 語音識別通用初始化 按照以下序列設(shè)置寄存器。 void LD_Init_ASR() nLD_Mode=LD_MODE_ASR_RUN; LD_Init_Common(); LD_WriteReg(0 xBD, 0 x00); LD_WriteReg(0 x17, 0 x48); delay( 10 ); LD_WriteReg(0 x3C, 0 x80); LD_WriteReg(0 x3E, 0 x07); LD_WriteReg(0 x38, 0 xff); LD_WriteReg(0 x3A, 0 x07); LD_Wri
34、teReg(0 x40, 0); LD_WriteReg(0 x42, 8); LD_WriteReg(0 x44, 0); LD_WriteReg(0 x46, 8); delay( 1 ); (3) 寫入識別列表 識別列表的規(guī)則就是,每個特定編號,對應(yīng)于一個待識別的命令,而同一個編號可以與幾個不同的待識別命令相對應(yīng)。該 LD3320 語音識別芯片可以最多支持 50 個待識別命令,每一個待識別命令,是一個普通話的漢語拼音,中間間隔一個空格。 (4) 開始識別 按照本節(jié)的說明,通過設(shè)置幾個相關(guān)的寄存器,LD3320 語音識別芯片就能夠開始語音識別。(5) 相應(yīng)中斷 不管正確的結(jié)果能否被識別出,
35、一旦麥克風(fēng)采集到了聲音,都能夠產(chǎn)生一個中斷信號。在中斷程序中讀取寄存器中的值并分析識別結(jié)果,BA 寄存器里的值是候選答案的數(shù)量,而 C5 寄存器中,存儲的是可能性最高,得分最高的答案。例如,發(fā)音為“南京” ,并被成功識別(無其他候選項),那么,BA 寄存器里的數(shù)值就是 1,而 C5 寄存器里面的值是對應(yīng)的編碼是 3。4.3 小車整體軟件實現(xiàn)語音芯片 LD3320 語音識別芯片每次語音識別之后,跳轉(zhuǎn)到識別結(jié)果的函數(shù)中去,在對應(yīng)的識別結(jié)果中,調(diào)用小車的運動函數(shù),例如,當(dāng)識別出“前進”的命令時,程序便跳轉(zhuǎn)到“前進”的函數(shù)中去,然后,小車開始動作,即, “前進” ,而對于“后退” 、 “左拐” 、 “
36、右拐” 、 “降速” 、 “提速也依次進行。 第 15 頁 共 40 頁 4.4 本章總結(jié) 本章是軟件部分的介紹,先介紹了小車調(diào)速的軟件實現(xiàn),即利用單片機模擬出PWM 波,進行調(diào)速。并介紹了語音識別芯片 LD3320 的軟件編程,對該芯片進行操作的方式,即采用軟件模擬 SPI 進行串行的讀寫操作。并且介紹了 LD3320 的驅(qū)動軟件,并介紹了該芯片的識別流程。 第 16 頁 共 40 頁 第 5 章 系統(tǒng)整體調(diào)試5.1 系統(tǒng)硬件調(diào)試 剛接觸語音芯片 LD3320 時,單片機選型上,先用 STC89C52,這種 5V 單片機,然后,通過電平轉(zhuǎn)換芯片-ASM1117,轉(zhuǎn)換為 3.3V,芯片無法正常
37、工作,后來選擇STC12LE 系列的低電壓單片機,芯片正常工作。當(dāng)電池給各個部分供電時,需要注意各個部分的“共地” 。因為不同的 GND 會影響系統(tǒng)正常工作,需要把各個部分的 GND 連接在一起,才能達到電平統(tǒng)一的效果。5.2 系統(tǒng)軟件調(diào)試在程序調(diào)試時,可以把程序一段一段的調(diào)試,可以暫時屏蔽掉那些不相關(guān)的程序,而只調(diào)試某一段程序。這樣,確保每一段程序的執(zhí)行正確,最后,再把各個模塊一塊一塊地連接到一起調(diào)試,如,當(dāng)調(diào)試語音模塊時,可以用一個 LED 燈來代替小車,如果語音輸入的命令與寫入模板命令匹配,可以使單片機輸出一個引腳,連接到 LED 上,使此引腳電平發(fā)生變化,LED 燈變亮,便說明語音匹配
38、成功。5.3 本章總結(jié) 本章主要介紹了在本次設(shè)計工作中對系統(tǒng)軟硬件進行調(diào)試時所遇到的問題,如在硬件調(diào)試時,單片機的選型問題,只有使用低電壓 3.3V 單片機,才能與語音芯片的信號進行操作,在軟件調(diào)試時,對語音芯片的識別軟件進行調(diào)試,用 LED 燈來顯示調(diào)試的結(jié)果。 第 17 頁 共 40 頁 第六章 總結(jié)與展望6.1 總結(jié)本文著重闡述了語音識別的原理,并介紹了語音識別專用芯片 LD3320 的硬件知識以及軟件驅(qū)動程序。通過調(diào)試,正確識別率達到 90%左右,達到了較好的預(yù)期效果。當(dāng)然,本設(shè)計還存在很多能夠改進的地方,例如,語音芯片識別時對環(huán)境有所要求,在嘈雜的環(huán)境中,識別的準確率大大降低,容易不
39、識別或者誤識別。存儲能力較低,最多只能識別 50 條命令,而且,對每條命令也有限制,即:每條命令所包含的內(nèi)容,不允許超過 10 個漢字,等同于 79 個字節(jié)的拼音串。畢業(yè)設(shè)計工作從開始到現(xiàn)在已有幾個月的時間,從構(gòu)思,到定題、開題、購買元件、硬件電路搭建以及軟件的編寫,論文定稿,這期間收獲很大,自己的能力也有了很大的提升。6.2 展望語音技術(shù)發(fā)展到現(xiàn)在,其應(yīng)用已非常廣泛。未來的一個很重要的發(fā)展方向就是應(yīng)用在語音接口上,即是,利用語音識別技術(shù)來代替鼠標、鍵盤等傳統(tǒng)的人機交流方式,通過人類的語音命令與機器進行交流,勢必將給傳統(tǒng)的交互方式帶來一個革新。如果能夠打破環(huán)境的限制因素,對環(huán)境的要求不是特別的
40、苛刻,即在相對噪雜的環(huán)境中,如高噪聲的工業(yè)環(huán)境,語音正確識別率能夠大幅度的提高,語音識別的應(yīng)用將更加的廣泛。還有,如果機器能夠正確識別大詞匯量、連續(xù)語音和不同語言,那么,語音識別技術(shù)將會進入一個全新的時代。 第 18 頁 共 40 頁 致 謝經(jīng)過很多次的修改,設(shè)計的論文工作總算告一段落,但是,由于認識的不足,理解能力的限制,一定會有很多的不足。在此期間,如果沒有指導(dǎo)老師的辛勤指導(dǎo),還有同學(xué)們的大力支持,獨自完成論文的困難是難以想象的。在這里首先要感謝我的導(dǎo)師楊老師,對我的諄諄教誨。 還要感謝我的好朋友陳同學(xué),在技術(shù)上給與我很多的幫助,并且,從他身上,我學(xué)會了很多東西。還要感謝我的好搭檔王同學(xué),
41、在那些奮斗的夜晚,我兩個多次合作參加比賽,不管比賽的結(jié)果是成功還是失敗,但是,從每次比賽中,都能讓我學(xué)到書本上學(xué)不到的東西。正是這些結(jié)晶,讓我一步步走向浩瀚的電子世界。還要感謝我的舍友,張同學(xué),對我的支持和鼓舞,沒有我舍友們的支持,就沒有自信的我。還有自動化三班的同學(xué),給與我的幫助和支持,真心的感謝你們,我的導(dǎo)師,我的同學(xué)們。另外,我還要感謝電氣院曾給我授課的每一位老師,是你們教會我專業(yè)知識,把我領(lǐng)進了自動化的大門,沒有那些讓我愛戴的老師們,就沒有現(xiàn)在的我,在未來的日子里,我的每一個進步,都離不開帶我入門的老師們,感謝你們,我人生的導(dǎo)師。 第 19 頁 共 40 頁 參考文獻1 劉幺和, 宋庭
42、新. 語音識別與控制應(yīng)用技術(shù)M. 科學(xué)出版社, 2008.2 趙力. 語音信號處理 (第 2 版)M. 北京:機械工業(yè)出版社, 2009.3 金鑫, 田犇, 闕大順. 基于 LD3320 的語音控制系統(tǒng)設(shè)計實現(xiàn)J. 電腦與信息技術(shù), 2011,06:22-25.4 王富中, 黃文浩. 基于語音識別技術(shù)的智能控制系統(tǒng)設(shè)計J. 自動化與儀表, 2006,04:8-10.5 語音識別 LD332XICRouteDB/OL. 2010-07-01http:/ LD332X_DebugProcess.html.6 芯片 LD3320 簡明調(diào)步驟試 DB/OL. 2010-07-01http:/ LD33
43、2X_DebugProcess.html.7 馬俊. 語音識別技術(shù)研究D. 哈爾濱工程大學(xué). 2004.8 雷靜. 語音識別技術(shù)的研究及基本實現(xiàn) D. 武漢理工大學(xué). 2002.9 高新濤, 陳乖麗. 語音識別技術(shù)的發(fā)展現(xiàn)狀及應(yīng)用前景J. 甘肅科技縱橫, 2007, 36(4): 13-13.10 羅冬梅,黃賢立. 語音識別技術(shù)在專題學(xué)習(xí)網(wǎng)站中的應(yīng)用研究J. 中國教育信息化:高教職教, 2009 (11): 72-74.11 張珍. 智能機器人語音識別技術(shù)J. 現(xiàn)代電子技術(shù), 2011, 34(12): 57-60.12 胡賓. 嵌入式語音識別技術(shù)的研究D. 武漢理工大學(xué). 2006.13 朱
44、淑琴. 語音識別系統(tǒng)關(guān)鍵技術(shù)研究D. 西安電子科技大學(xué). 2004.14 顧亞強. 非特定人語音識別關(guān)鍵技術(shù)研究D.國防科學(xué)技術(shù)大學(xué). 2009.15 黃文龍. 語音識別關(guān)鍵技術(shù)研究及系統(tǒng)實現(xiàn)D. 重慶大學(xué). 2010.16 Schroeder M R. Linear predictive coding of speech: Review and current directionsJ. Communications Magazine, IEEE, 1985, 23(8): 54-61.17 Hung S L, Adeli H. A parallel genetic/neural networ
45、k learning algorithm for MIMD shared memory machinesJ. Neural Networks, IEEE Transactions on, 1994, 5(6): 900-909.18 Maniezzo V. Genetic evolution of the topology and weight distribution of neural 第 20 頁 共 40 頁 networksJ. Neural Networks, IEEE Transactions on, 1994, 5(1): 39-53.19 Savoji M H. A robu
46、st algorithm for accurate endpointing of speech signalsJ. Speech communication, 1989, 8(1): 45-60.20 Jiang H. Discriminative training of HMMs for automatic speech recognition: A surveyJ. Computer Speech & Language, 2010, 24(4): 589-608. 附 錄 1 流程圖、電路圖及仿真圖、實物圖開始初始化程序起點檢測預(yù)處理特征提取終點檢測語音模板識別識別結(jié)果輸出結(jié)束NYNY 圖
47、 1 語音識別流程圖 第 21 頁 共 40 頁 開始初始化程序語音輸入產(chǎn)生中斷識別出命令識別結(jié)果小車根據(jù)命令運行YN 圖 2 小車整體程序框圖 第 22 頁 共 40 頁 圖 3 智能小車的整體電路圖 第 23 頁 共 40 頁 圖 4 智能小車的實物圖附 錄 2 本設(shè)計的主要程序/* 接線說明: (信號管腳需要接上拉電阻 1K 到 3.3V)sbit SDCK =P00; /SPI 時鐘信號sbit SDI =P01; /SPI 數(shù)據(jù)輸入sbit SCS =P02; /芯片片選信號,sbit RSTB =P03; /芯片復(fù)位信號sbit LD_MODE=P04; /芯片模式選擇信號,sbi
48、t SPIS =P05; /SPI 模式設(shè)置:低有效,sbit SDO =P06; /SPI 數(shù)據(jù)輸出 sbit IRQ=P32; /接單片機的中斷管腳 電機控制引腳 第 24 頁 共 40 頁 sbit zuo1=P10;sbit zuo2=P11;sbit you1=P12;sbit you2=P13; sbit ena=P14sbit enb=P15;*/ #include STC12LE5A60S2.H /頭文件兼容 STC12#include LDchip.h#include IO_DEF.H #include AsrItem.h /*/nAsrStatus 用來在 main 主程序
49、中表示程序運行的狀態(tài),不是 LD3320 芯片內(nèi)部的狀態(tài)寄存器/LD_ASR_NONE:表示沒有在作 ASR 識別/LD_ASR_RUNING:表示 LD3320 正在作 ASR 識別中/LD_ASR_FOUNDOK:表示一次識別流程結(jié)束后,有一個識別結(jié)果/LD_ASR_FOUNDZERO:表示一次識別流程結(jié)束后,沒有識別結(jié)果/LD_ASR_ERROR:表示一次識別流程中 LD3320 芯片內(nèi)部出現(xiàn)不正確的狀態(tài)/*/uint8 idata nAsrStatus=0;unsigned char Cnt=0;unsigned char CYCLE=80; /周期變量 20msint dianji=
50、45; /數(shù)值越小,速度越快int flag=0;sbit zuo1=P10;sbit zuo2=P11;sbit you1=P12;sbit you2=P13;sbit ena=P14;sbit enb=P15;void delayms(unsigned int m)/10ms int a, b; for(a=0;a3000;a+) for(b=0;bm;b+); 第 25 頁 共 40 頁 /LD3320 送出中斷信號,ASR 中斷,需要在中斷處理函數(shù)中處理void ExtInt0Handler(void) interrupt 0 ProcessInt0();void MCU_init()
51、 /單片機初始化程序P1M0 |= 1;P3M0 |= 8;P4SW = 0 xFF;P0 = 0 xff;P1 = 0 xff;P2 = 0 xff;P3 = 0 xf3;P4 = 0 x3f; / 接口方式 SPILD_MODE = 1;/設(shè)置 MD 管腳為高,SPI 模式 IP=0;IPH=0;PX0=1; PT0=1;PS=1;IPH |= 1;EX0=0;EX1=0;EA=1;TMOD =0 x01;/定時器設(shè)置 1ms in 12M crystalTH0=(65536-250)/256; TL0=(65536-250)%256;/定時 1mS EA=1;/打開中斷ET0=1; TR
52、0=1; ena=0;enb=0;zuo1=0;zuo2=0;you1=0;you2=0; 第 26 頁 共 40 頁 /* 以下是小車的控制程序,前進,后退、左拐、右拐、提速、降速/*/ void qianjin()ena=1; / 使能電機左右兩個電機的使能端enb=1;flag=0; /PWM 取反時的標志位void houtui()/PWM 值 給反的就能倒退了 ena=1;enb=1;/ 使能電機左右兩個電機的使能端flag=1;/PWM 取反時的標志位void zuoguai() ena=0;/ 使能電機左右兩個電機的使能端enb=1;flag=0;void youguai() e
53、na=1;/ 使能電機左右兩個電機的使能端enb=0;flag=0;void stop() ena=0;enb=0;flag=0;void jiasu() dianji-=10;if(dianji=70) dianji=25;void main()uint8 idata nAsrRes;MCU_init();LD_reset();nAsrStatus = LD_ASR_NONE;/初始狀態(tài):沒有在作 ASR while(1)switch(nAsrStatus)case LD_ASR_RUNING:/表示 LD3320 正在作 ASR 識別中case LD_ASR_ERROR:/表示一次識別流程
54、中 LD3320 芯片內(nèi)部出現(xiàn)不正確的狀態(tài)break;case LD_ASR_NONE: / 表示沒有在作 ASR 識別/FlashLED(1);nAsrStatus=LD_ASR_RUNING;if (RunASR()=0) /啟動一次 ASR 識別流程:ASR 初始化,ASR 添加關(guān)鍵詞語,啟動 ASR 運算nAsrStatus = LD_ASR_ERROR;break;case LD_ASR_FOUNDOK: /表示一次識別流程結(jié)束后,有一個識別結(jié)果nAsrRes = LD_GetResult(); /一次 ASR 識別流程結(jié)束,去取 ASR 識別結(jié)果if(nAsrResITEM_COU
55、NT)switch(nAsrRes) case 0: qianjin(); / 對應(yīng)AsrItem.h中的 STR_00“qian jin” , break; case 1: houtui(); /LED1 對應(yīng)AsrItem.h中的 STR_01hou tui” , 第 28 頁 共 40 頁 break; case 2: zuoguai(); /對應(yīng)AsrItem.h中的 STR_02“you guai” , break; case 3: youguai(); /對應(yīng)AsrItem.h中的 STR_03“zuo guai” , break; case 4: stop(); /對應(yīng)AsrIt
56、em.h中的 STR_04“ting zhi” , break; case 5: jiasu(); /對應(yīng)AsrItem.h中的 STR_05“jia su” , break; case 6: jiansu(); /對應(yīng)AsrItem.h中的 STR_06“jian su” , break; default: break; nAsrStatus = LD_ASR_NONE;break;case LD_ASR_FOUNDZERO: /表示一次識別流程結(jié)束后,沒有識別結(jié)果default:nAsrStatus = LD_ASR_NONE;break; /*/* 定時器 0 中斷服務(wù)函數(shù) */*/vo
57、id Timer0(void) interrupt 1 TH0=(65536-250)/256; TL0=(65536-250)%256;/定時 0.25mS Cnt+; 第 29 頁 共 40 頁 if(Cnt=dianji)&(!flag)zuo1=1;you1=1;if(Cnt=dianji)&(flag) /反 PWM 波/zuo1=0;zuo2=1;/you1=0;you2=1; if(Cnt = CYCLE)&(!flag)/低電平時間到zuo1=0;you1=0;Cnt=0;if(Cnt = CYCLE)&(flag)/低電平時間到反 PWM 波zuo2=0;you2=0;Cnt
58、=0; 開題報告:開題報告:基于語音控制的智能車設(shè)計基于語音控制的智能車設(shè)計 第 30 頁 共 40 頁 1選題的目的、意義及國內(nèi)外對本課題涉及問題的研究現(xiàn)狀選題的目的、意義及國內(nèi)外對本課題涉及問題的研究現(xiàn)狀:選題的目的、意義(理論意義、現(xiàn)實意義):(1)選題目的 通過對該課題的研究,一方面理解語音識別技術(shù)的原理,了解當(dāng)前的發(fā)展水平,分析國內(nèi)外語音識別技術(shù)水平之間的差距。另一方面,根據(jù)自己當(dāng)前對語音控制系統(tǒng)的研究,為語音控制無人駕駛汽車的應(yīng)用,奠定良好的基礎(chǔ)。(2)選題意義現(xiàn)實意義:目前現(xiàn)代生活水平不斷提高,人們對智能化產(chǎn)品有著前所未有的巨大需求。語音識別技術(shù),是世界上最熱門和最具發(fā)展前景的新
59、型技術(shù)之一1-2。語音智能控制簡便、快捷的交互方式以及穩(wěn)定、精準的控制效果得到越來越多人的認可。語音控制的出現(xiàn)和發(fā)展也給殘障人士帶來了巨大福音,讓其自主出行和生活自理成為可能。語音控制輪椅將很好的解決傳統(tǒng)器械需要按鍵、需要旁人輔助等問題,為殘障人士的出行提供方便。未來交通工具的駕駛將不再局限于手工操控,語音控制必會為其提供更方便,更準確,更安全的駕駛方案。隨著語音識別技術(shù)和電子行業(yè)的發(fā)展,語音控制將取代現(xiàn)有的鼠標、鍵盤、觸摸屏等,成為新一代人機交互方式3-4。 理論意義:本設(shè)計以 STC89C52 單片機為核心,并采用 ICRoute 公司高性能 LD3320 語音識別芯片和相關(guān)電路,實現(xiàn)了語
60、音控制小車的設(shè)計任務(wù)。使其可根據(jù)語音提示,做出前進、停止、后退、左轉(zhuǎn)、右轉(zhuǎn)和加速、減速等相應(yīng)動作。LD3320 集成了語音識別處理器和外部電路,包括 AD 轉(zhuǎn)換器、麥克風(fēng)、聲音輸出等接口,不需要外接任何 Flash、RAM 等5-6。直接集成便可實現(xiàn)語音識別、聲控、人機對話等功能。識別關(guān)鍵詞語是可以任意動態(tài)編輯的,因而滿足了小體積、低功耗的要求7-8。選題的研究現(xiàn)狀(理論淵源及演化、國外相關(guān)研究綜述、國內(nèi)相關(guān)研究綜述):(1)理論淵源及演化自從人類可以制造和使用各種機器以來,人們就有一個理想,那就是讓各種機器能聽懂人類 第 31 頁 共 40 頁 的語言并能按照人的口頭命令來行動,從而實現(xiàn)人機
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 近期天津叉車考試題目及答案
- 養(yǎng)老院老人意外傷害處理制度
- 養(yǎng)老院老人健康飲食營養(yǎng)師激勵制度
- 辦公室員工培訓(xùn)效果評估表制度
- 銷售公司提成制度
- 敏感期考試題目及答案
- 通過建立健全生態(tài)文明建設(shè)情況報告制度
- 護士三基面試題目及答案
- 近現(xiàn)代日本的教員養(yǎng)成和資格證書制度
- 車間物資需求制度
- 安徽離任村干部管理辦法
- 2025年四川省宜賓市中考招生考試數(shù)學(xué)真題試卷(真題+答案)
- 人大預(yù)算監(jiān)督培訓(xùn)課件
- 公安交警隊和車輛管理所標識制作及設(shè)置規(guī)范
- 高中數(shù)學(xué)北師大版講義(必修二)第02講1.2任意角3種常見考法歸類(學(xué)生版+解析)
- 醫(yī)療器械網(wǎng)絡(luò)銷售質(zhì)量管理規(guī)范宣貫培訓(xùn)課件2025年
- 2024法院書記員招聘筆試必考題含答案
- 地溝清理合同協(xié)議
- 2025年湖南省郴州市中考模擬英語試題(含答案含聽力原文無音頻)
- 無損檢測考試題及答案
- 河南省2025屆高三下學(xué)期2月質(zhì)量檢測語文試卷(含答案)
評論
0/150
提交評論