下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
基于嵌入式系統(tǒng)的語音識別ap7003設計
1ap653簡介ap7003是一種新型、低成本語音識別芯片,包括a.d處理器、語音處理器和i-o檢測器。預處理后,可以識別12組不同的單詞,每組可連接單詞或單詞。AP7003包括AP7003-01(由CPU串行控制)和AP7003-02(由按鍵直接控制)兩種型號,且具有高度的I/O可編程性,使用簡單方便,可廣泛應用于玩具、識別轉(zhuǎn)控、自動答錄等領域。AP7003的功能框圖如圖1所示。其主要特性如下:·內(nèi)置麥克風放大器;·內(nèi)置A/D轉(zhuǎn)換器;·DIP40雙列直插式封裝;·識別12組1.5秒時長字詞;·I/O口具有2個普通輸入、4個觸發(fā)輸入、2個輸出口(分別有4個和12個輸出)、2個LED驅(qū)動;·指令優(yōu)化以方便用戶使用;·2.4V~4.5V工作電壓,且具備低功耗模式。2工作時芯片的讀取AP7003具有兩種工作模式,即錄音模式和識別模式。在使用識別模式之前,應先將目標詞錄入芯片內(nèi)。AP7003內(nèi)有12個存儲體用于存儲12組不同的字句,每個存儲體可存儲1.5秒時長的字詞,可通過鍵盤或按程序編制的順序選擇存儲體錄入及存放目標詞。語音可通過外部麥克風或其它媒體錄入芯片內(nèi),經(jīng)內(nèi)部處理后以不同的數(shù)字特征信號保存于存儲體中。目標詞錄入芯片內(nèi)后即可將工作模式轉(zhuǎn)換到識別模式,工作時芯片將當前語音與事先已錄入存儲體的目標詞語音相比較,如果有語音特征相匹配,則在芯片的相應輸出端口輸出高電平或低電平。需要時可以將芯片編程為省電模式以節(jié)省電能,當有按鍵信號時芯片將被喚醒。AP7003采用DIP40封裝,引腳功能如表1所示,其典型應用電路如圖2所示。3u3000語音匹配再成本低、效果好AP7003-01可通過串行口與微控制器連接,應用圖如圖3所示。AP7003-01共有22個輸入指令和15個輸出指令,如表2所示。AP7003-01工作時序及時間定義如圖4所示。系統(tǒng)上電后必須先給AP7003-01發(fā)清除指令ClearWord以清除12個存儲體內(nèi)的內(nèi)容,然后發(fā)出一個存儲指令(StoreWord1~StoreWord12之一)將目標詞錄入芯片相應的存儲體內(nèi)。當LED1有效時,表示芯片準備好錄入目標詞。通過指令SetR_Mode1或SetR_Mode2可選擇兩種識別模式:SeR_Mode1為單詞識別模式,該模式下識別操作完成后,芯片進入省電狀態(tài)以等待新的指令;SetR_Mode2為連詞識別模式,該模式下識別操作完成后芯片返回語音錄入狀態(tài)。進入語音識別狀態(tài)前必須通過指令SetR_Level1~SetR_Level4設置識別時要求的匹配度,SetR_Level4要求匹配程度最高,而SetR_Level1最低,可以根據(jù)經(jīng)驗設定為中間某一個值。跟在一個StoreWord1~12指令之后的StoreFlag指令將前面錄入的語音存入指定的存儲體以作為目標詞。ClearOutputs指令用于清除A端口輸出狀態(tài)(POA1~POA12)。ShutDown指令將芯片轉(zhuǎn)入關閉模式以節(jié)省電能。當數(shù)據(jù)格式或時序出現(xiàn)在串行數(shù)據(jù)(SERIALDATA)輸入口PIT3、PIT2、PIT1時,芯片將發(fā)送錯誤代碼到串行數(shù)據(jù)輸出口POB4,同時將數(shù)據(jù)、時鐘發(fā)送到串行數(shù)據(jù)輸出口POB2、POB3。指令StoreWord1~12、StoreFlag、ClearWord、SetR_Level1~4和ClearOutputs執(zhí)行完成后,芯片將輸出一個Done代碼。芯片每次執(zhí)行完語音識別后,輸出一個匹配指示代碼(MatchWord1~MatchWord12或NOMatch)。當有一個語音匹配時,LED2有效,如果PIM2被拉高(端口A使能),則A端口相應的引腳變?yōu)橛行?。如果PIM1引腳被拉低,芯片的語音識別功能被禁止。4明號系統(tǒng)掃描信號的生成AP7003-02可以單獨使用,無需控制器,適合于用鍵盤直接控制。芯片有8鍵控制和12鍵控制兩種鍵盤操作模式,如圖5所示。各鍵及其功能見表3(a)、(b)。上電后POB1~POB4均被置成低電平。當有鍵按下時,芯片按POB1→POB2→POB3→POB4的順序依次發(fā)出鍵盤掃描信號,掃描信號為16ms低脈沖加64ms間隔,且循環(huán)進行,按鍵信號從PIT1~PIT4輸入芯片。鍵盤陣列如表3(c)所示。上電后12個存儲體在錄入目標詞之前必須首先清空。開始錄入目標詞時LED1及POA1~POA12之一(與所選擇的存儲體相對應的一個)有效,目標詞錄入到存儲體后芯片進入識別模式。在識別模式初始狀態(tài),只有LED1是有效的。識別完成后,如果沒有詞相匹配,LED1閃爍3秒鐘后回到識別模式初始狀態(tài);如果有詞相匹配,LED2有效,與匹配詞所在存儲體相對應的POA輸出端口也有效。如果芯片被設置成自動模式(PIM2=0),則LED2及POA的輸出將在3分鐘后被清除,之后回到識別模式初始狀態(tài)。當PIM2=0時,如果連續(xù)8分鐘沒有語音輸入芯片,將自動進入省電模式。5實驗匹配度的確定(1)語音識別電路對外部麥克風(MIC)的分貝值有一定的要求。使用經(jīng)驗表明,本語音識別電路中選用56dB的麥克風可達到最佳效果。(2)語音識別前設置的匹配度是一個影響識別率高低的重要因素,在實驗過程中需要根據(jù)使用環(huán)境、使用要求等情況多次實驗才能確定最佳值。(3)AP7003的工作電壓為2.4V~4.5V。對于3V的應用系統(tǒng),可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年哈爾濱電機廠有限責任公司招聘備考題庫及1套完整答案詳解
- 2026年吉安水務集團有限公司招聘備考題庫及1套完整答案詳解
- 2026年山城區(qū)鹿樓中心衛(wèi)生院招聘備考題庫帶答案詳解
- 2026年宜賓川流天下供應鏈管理有限公司招聘備考題庫及參考答案詳解1套
- 2026年延安市青少年宮臨聘人員招聘備考題庫及完整答案詳解一套
- 2026年江西司法警官職業(yè)學院單招職業(yè)適應性測試模擬測試卷新版
- 2026年眉山職業(yè)技術學院單招職業(yè)技能測試題庫新版
- 2026年吉林大學白求恩第一醫(yī)院呼吸與危重癥醫(yī)學科技術員招聘備考題庫及參考答案詳解
- 2026年甘肅省平?jīng)龅貐^(qū)單招職業(yè)適應性測試模擬測試卷及答案1套
- 2026年中國冶金地質(zhì)總局中南局(公司)專業(yè)技術人才社會招聘備考題庫含答案詳解
- 土地續(xù)租賃合同(標準版)
- 語文五上:期末總復習(按單元復習)【課件】
- 養(yǎng)殖場安全培訓課件
- 房地產(chǎn)機電設計注意事項匯編
- 移風易俗文明殯葬課件
- 2025年高考語文二卷詩歌鑒賞解析
- 《現(xiàn)代物流設施與規(guī)劃》課件(共十四章)
- 醫(yī)院主任年終工作總結(jié)與計劃
- GB/T 18344-2025汽車維護、檢測、診斷技術規(guī)范
- DGTJ08-2134-2013 建筑裝飾工程石材應用技術規(guī)范
- 2025院感爆發(fā)考試試題及答案
評論
0/150
提交評論