下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
基于樹莓派的智能音箱的總體方案設(shè)計案例目錄TOC\o"1-2"\h\u12431基于樹莓派的智能音箱的總體方案設(shè)計案例 1156831.1智能音箱系統(tǒng)概述 1275931.2硬件模型 317961.3系統(tǒng)的開發(fā)平臺 41.1智能音箱系統(tǒng)概述本文設(shè)計的智能音箱系統(tǒng),由樹莓派外設(shè)(TC/藍(lán)牙接入音箱、USB麥克風(fēng)語音模塊AI識別功能)實現(xiàn)語音數(shù)據(jù)的采集硬件連接設(shè)計、語音播放硬件連接設(shè)計。找到了適合中文語音互譯的引擎,及其支持其引擎的框架開源項目“wukong-robot”。應(yīng)用了Python的語言,以及離線喚醒技能,采用靜音檢測,再通過語音識別ASR引擎、語音合成TTS引擎實現(xiàn)[20]。靜音檢測目的是檢測并消除語音中長時間的靜默,以節(jié)省語音信道資源而不影響服務(wù)質(zhì)量。靜音抑制有助于節(jié)省寶貴的帶寬資源并減少用戶感知的端到端延遲[20]。語音識別的原理更是復(fù)雜的多,方法主要是模式的匹配[21]。在訓(xùn)練階段,用戶將詞匯表中的詞依次說一遍,并且將其特征作為模板存入庫里[22]。另一方面,在識別階段,將輸入詞的屬性與庫中的每個模板進行比較,并以最大的相似度進行識別。在單詞識別方面,集成了百度、科大訊飛、阿里、騰訊等眾多中文單詞識別和語音合成技術(shù),并可以不斷擴展[23]。添加對話機器人,如連接圖靈、Emotibot等在線對話機器人,實現(xiàn)語音輸出。人機交互全過程大致可分為以下幾個步驟,如圖2-1中所示:首先要用麥克風(fēng)采集聲音,聲音采集后,經(jīng)過降噪處理,提取聲音中的信息要素,從而進行語音喚醒,喚醒后把采集到的聲音轉(zhuǎn)到文字,再進行語義理解。語義理解更是一門很深的學(xué)問,要求機器人能夠?qū)φf話環(huán)境進行深度學(xué)習(xí),才能準(zhǔn)確判斷[24]。理解后則要回復(fù)文字和指令,再通過文字轉(zhuǎn)聲音,最后播放出聲音,做到人機交互的全過程。圖2-1人機交互過程框圖激活本文使用的wukong-robot后,如圖2-2所示,用戶語音命令首先通過ASR被ASR引擎識別為文本。在已知文本中進行語義理解(NLU)并獲得分析結(jié)果。搜索可用的插件,執(zhí)行相關(guān)的技能匹配,匹配后傳遞給適合處理指令的技能插件。在處理插件時,還可以根據(jù)需要使用TTS引擎合成成語音,播放給用戶。并且其中一個交互可能包含多個網(wǎng)絡(luò)請求,但優(yōu)點是每個連接都可以更改和調(diào)整。圖2-2語音技能匹配過程框圖對于過程中找到合適的插件處理,就是所謂輪詢插件。輪詢每個可用插件,比較相關(guān)技能,交給合適的插件去處理。如圖2-3的流程圖,就是人機交互與語音技能匹配的過程結(jié)合后,加入靜音檢測、降噪,語音喚醒等等步驟后,對于wukong-robot的過程流程圖的解析。對于wukong-robot來說,運行更像是一個循環(huán)的系統(tǒng),不停的檢測是否有被喚醒,如果未檢測到就繼續(xù)檢測等待喚醒。若喚醒成功,則進行語音文字的轉(zhuǎn)換、語義分析理解、播放語音進行對話聊天,若失敗則繼續(xù)離線等待喚醒,如果無操作,則一直離線等待。離線等待喚醒也可以在一定程度上保護使用者的隱私安全。圖2-3系統(tǒng)過程流程圖1.2硬件模型智能音箱三個組成部分組成,即:大腦、耳朵、嘴巴。大腦是計算的主機,音響是聽話的耳朵,麥克風(fēng)是說話的嘴巴。耳朵的低效對智能音箱的體驗質(zhì)量有很大影響。由于麥克風(fēng)是智能音箱接收用戶語音輸入的唯一通道,這意味著聲音信息會被錯誤或錯誤地接收,都會對結(jié)果有天差地別的影響。從麥克風(fēng)來說,有樹莓派專用的USB免驅(qū)麥克風(fēng),有ReSpeaker2MicsPiHAT是專為樹莓派打造的陣列麥克風(fēng),帶2Mic陣列,有聲卡,支持外接3.5mm音頻輸出。效果會更好,但其缺點是會占用樹莓派的GPIO。同時,這個HAT配置的缺點在于需要自己安裝驅(qū)動。作為嘴巴的音箱選擇還是相對于麥克風(fēng)來說,要求可以稍微低一些,甚至也可以使用藍(lán)牙音箱。用樹莓派DIY智能音箱,更對于體積有一些要求,才便于攜帶控制,故能控制在一個比較小的尺寸內(nèi)。圖2-3智能音箱系統(tǒng)硬件平臺1.3系統(tǒng)的開發(fā)平臺本文利用樹莓派的體積小、成本低、便攜性好、可編程、可聯(lián)網(wǎng)等特點,采用樹莓派進行開發(fā)嘗試。在樹莓派上搭載Raspbianjessie系統(tǒng)安裝好鏡像,配置Raspbian系統(tǒng),安裝Python3.4.2軟件和wukong-robot項目,安裝docker使用容器開發(fā)、部署和運行應(yīng)用程序更方便。其中免不了對于克隆本倉庫的安裝,及還需要下載CMUCLMTK等等源碼。1.3.1Raspbian系統(tǒng)簡介Raspbian的基礎(chǔ)是Debian操作系統(tǒng)。麥克·湯姆森和彼得·格林兩位志愿者研發(fā),針對樹莓派硬件進行了專門的優(yōu)化和移植。而Raspbian不僅僅是一個OS,它附帶著35000個軟件包以及預(yù)編譯的軟件[25]。Raspbian項目開發(fā)得益于麥克·湯姆森。他是Atomz的聯(lián)合創(chuàng)始人兼CTO,Atomz于2005年被WebSideStory收購。RaspberryPi看起來是一個很好的開發(fā)平臺,它非常便宜,也很容易嵌入。但是RaspberryPi沒有為其浮點單元提供完全優(yōu)化的操作系統(tǒng),浮點單元是必不可少的[26]。用于RaspberryPi的Fedora系統(tǒng)仍在開發(fā)中,但官方RaspberryPi下載站點僅推薦Raspbian、ArchLinuxARM和RISCOS。1.3.2Python語言概述Python語言由荷蘭人GuidovanRossum于1989年發(fā)明。由于Python極其容易學(xué)習(xí),即使你之前從未學(xué)過其他編程語言,也能很快掌握。Python也如C語言和JAVA語言,是一種非常強大且簡單的面向?qū)ο笳Z言??梢灾С之惓L幚?,降低了處理錯誤的麻煩,也加快了開發(fā)代碼的速度[27]。Pytho
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 深度解析(2026)《GBT 25635.2-2010電解去毛刺機床 第2部分:參數(shù)》(2026年)深度解析
- 2026中國農(nóng)業(yè)科學(xué)院第一批招聘7人(農(nóng)業(yè)環(huán)境與可持續(xù)發(fā)展研究所)參考考試試題及答案解析
- 2025廣東佛山市南海區(qū)獅山鎮(zhèn)英才學(xué)校招聘3人考試參考試題及答案解析
- 2025廣東深圳市規(guī)劃和自然資源局光明管理局勞務(wù)派遣人員招聘1人備考考試試題及答案解析
- 2025年銅陵市義安經(jīng)開區(qū)管委會公開招聘編外聘用人員1名備考考試題庫及答案解析
- 2025年甘肅省天水市清水縣白沙中心衛(wèi)生院招聘元坪村鄉(xiāng)村醫(yī)生考試參考試題及答案解析
- 2025年寧波市北侖區(qū)小港街道辦事處招聘編外人員1人參考考試試題及答案解析
- 2025河北雄安人才服務(wù)有限公司招聘2人備考筆試試題及答案解析
- 2025廣東廣州景泰第三幼兒園教師招聘1人參考筆試題庫附答案解析
- 2025廣東河源市連平縣退役軍人事務(wù)局招聘編外人員3人模擬筆試試題及答案解析
- 句法成分課件(共18張)統(tǒng)編版語文八年級上冊
- GB/T 70.3-2023降低承載能力內(nèi)六角沉頭螺釘
- 2023版中國近現(xiàn)代史綱要課件:07第七專題 星星之火可以燎原
- 通知書產(chǎn)品升級通知怎么寫
- 氣管插管術(shù) 氣管插管術(shù)
- 大學(xué)《實驗診斷學(xué)》實驗八:病例分析培訓(xùn)課件
- GB/T 28400-2012釹鎂合金
- 多維閱讀第8級Moon Mouse 明星老鼠的秘密
- 骨髓增生異常綜合癥課件整理
- 心肌梗死院前急救課件
- 雙升基本知識-信號
評論
0/150
提交評論