版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
語(yǔ)音識(shí)別與Python編程實(shí)踐人工智能開(kāi)源硬件與python編程實(shí)踐情境導(dǎo)入語(yǔ)音識(shí)別發(fā)展到現(xiàn)在,從語(yǔ)音打字機(jī)、數(shù)據(jù)庫(kù)檢索到特定的環(huán)境所需的語(yǔ)音命令,給人們的生活帶來(lái)了很多方便。語(yǔ)音識(shí)別人機(jī)交互技術(shù)是典型的人工智能方法,在智能家居、智能駕駛、智能手機(jī)中都有成熟的應(yīng)用。智能玩具開(kāi)始大量應(yīng)用人工智能技術(shù),市場(chǎng)上出現(xiàn)了大批可以講故事、唱歌曲、說(shuō)英語(yǔ)的益智玩具,通過(guò)語(yǔ)音識(shí)別人機(jī)交互技術(shù),大幅提升了玩具的互動(dòng)性、教育性、智能性和娛樂(lè)性,滿(mǎn)足了知識(shí)學(xué)習(xí)、娛樂(lè)、科學(xué)探究、智力開(kāi)發(fā)等多重需求。任務(wù)與目標(biāo)了解語(yǔ)音識(shí)別的基本原理、相關(guān)算法和應(yīng)用框架;了解運(yùn)用人工智能開(kāi)源硬件設(shè)計(jì)語(yǔ)音識(shí)別應(yīng)用系統(tǒng)的方法;運(yùn)用人工智能開(kāi)源硬件和Python編程庫(kù),編寫(xiě)和調(diào)試初步的語(yǔ)音識(shí)別應(yīng)用Python程序;掌握利用OpenAIEIDE編程工具編寫(xiě)、上傳、運(yùn)行、完善Python語(yǔ)音識(shí)別程序的方法。知識(shí)拓展:語(yǔ)音識(shí)別的概念語(yǔ)音識(shí)別技術(shù)可以比做為“機(jī)器的聽(tīng)覺(jué)系統(tǒng)”,就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的方法。語(yǔ)音識(shí)別技術(shù)主要包括語(yǔ)音特征提取、模式識(shí)別及聲學(xué)模型訓(xùn)練技術(shù)三個(gè)方面。知識(shí)拓展:語(yǔ)音識(shí)別技術(shù)的發(fā)展歷史50年代,AT&TBell實(shí)驗(yàn)室實(shí)現(xiàn)了第一個(gè)可識(shí)別十個(gè)英文數(shù)字的語(yǔ)音識(shí)別系統(tǒng)-Audry系統(tǒng)。60年代,動(dòng)態(tài)規(guī)劃(DP)和線(xiàn)性預(yù)測(cè)分析技術(shù)(LP)等技術(shù)的提出和運(yùn)用,對(duì)語(yǔ)音識(shí)別的發(fā)展產(chǎn)生了深遠(yuǎn)影響。70年代,動(dòng)態(tài)時(shí)間歸整正技術(shù)(DTW)開(kāi)始成熟,特別是矢量量化(VQ)和隱馬爾可夫模型(HMM)得到運(yùn)用,實(shí)現(xiàn)了基于線(xiàn)性預(yù)測(cè)倒譜和DTW技術(shù)的特定人孤立語(yǔ)音識(shí)別系統(tǒng)。20世紀(jì)80年代,隨著HMM模型和人工神經(jīng)元網(wǎng)絡(luò)(ANN)等技術(shù)在語(yǔ)音識(shí)別中的成功應(yīng)用,人們突破了大詞匯量、連續(xù)語(yǔ)音和非特定人這三大語(yǔ)音識(shí)別障礙。知識(shí)拓展:隱馬爾科夫模型的應(yīng)用CMU的李開(kāi)復(fù)實(shí)現(xiàn)了第一個(gè)基于隱馬爾科夫模型的大詞匯量語(yǔ)音識(shí)別系統(tǒng)Sphinx,它是第一個(gè)高性能的非特定人、大詞匯量連續(xù)語(yǔ)音識(shí)別系統(tǒng);在聲學(xué)識(shí)別層面,以多個(gè)說(shuō)話(huà)人發(fā)音的大規(guī)模語(yǔ)音數(shù)據(jù)為基礎(chǔ),通過(guò)對(duì)連續(xù)語(yǔ)音中上下文發(fā)音變體的HMM建模,語(yǔ)音音素識(shí)別率有了長(zhǎng)足的進(jìn)步。知識(shí)拓展:語(yǔ)音信號(hào)的短時(shí)特性語(yǔ)音信號(hào)的特征是隨時(shí)間變化的,具有短時(shí)性,在5-50ms的一段時(shí)間間隔中,保持相對(duì)穩(wěn)定一致的特性。語(yǔ)音信號(hào)的分析和處理都是建立在“短時(shí)”的基礎(chǔ)上,按5-50ms分成語(yǔ)音幀進(jìn)行處理,重要的計(jì)算參數(shù)有短時(shí)能量、短時(shí)過(guò)零率、短時(shí)自相關(guān)函數(shù)、短時(shí)頻譜等。設(shè)計(jì)與實(shí)踐人工智能開(kāi)源硬件語(yǔ)音識(shí)別處理模塊OpenAIEIDE的使用編寫(xiě)第一個(gè)嵌入式Python程序調(diào)試、驗(yàn)證及完善人工智能開(kāi)源硬件語(yǔ)音識(shí)別處理模塊
AIE控制板上固化除了有計(jì)算機(jī)視覺(jué)CV庫(kù)、板上器件及接口pyb庫(kù)外,還有連續(xù)非特定人語(yǔ)音識(shí)別ASR庫(kù)。該ASR庫(kù)基于板上集成的語(yǔ)音識(shí)別處理器的特性進(jìn)行設(shè)計(jì),提供一個(gè)與語(yǔ)音識(shí)別相關(guān)的asr對(duì)象給外部Python程序調(diào)用。拾音器ASR處理器按鍵語(yǔ)音識(shí)別處理器
語(yǔ)音識(shí)別處理器基于ASR技術(shù),具有降噪、端點(diǎn)檢測(cè)、語(yǔ)音識(shí)別等功能。語(yǔ)音識(shí)別處理器內(nèi)置有高精度的A/D和D/A通道,設(shè)計(jì)時(shí)直接把拾音器連接在處理器芯片的AD引腳上,不需要外接AD芯片,不需要外接輔助的Flash和RAM,就能完成說(shuō)話(huà)語(yǔ)音的實(shí)時(shí)采集。語(yǔ)音識(shí)別處理器內(nèi)含有事先訓(xùn)練好的聲學(xué)模型參數(shù)庫(kù),由大批量非特定人普通話(huà)連續(xù)語(yǔ)音語(yǔ)料訓(xùn)練而成,支持ASR連續(xù)語(yǔ)音識(shí)別,應(yīng)用時(shí)不需要再進(jìn)行任何錄音訓(xùn)練。定義語(yǔ)音識(shí)別工作場(chǎng)景語(yǔ)音識(shí)別處理器允許用戶(hù)定義一張識(shí)別關(guān)鍵詞語(yǔ)列表,應(yīng)用中還可以動(dòng)態(tài)編輯和維護(hù)這張識(shí)別關(guān)鍵詞語(yǔ)列表。只需要把關(guān)鍵詞語(yǔ)以字符串的形式傳送給芯片,即可以在下次識(shí)別過(guò)程中生效。每個(gè)關(guān)鍵詞語(yǔ)可以是單字、詞組、短句或者任何的中文發(fā)音的組合。板上語(yǔ)音識(shí)別處理器目前支持用戶(hù)自由編輯50條關(guān)鍵詞詞條,即在同一時(shí)刻,最多在50條關(guān)鍵詞語(yǔ)中進(jìn)行識(shí)別。編程設(shè)計(jì)時(shí)可以根據(jù)工作場(chǎng)景的需要,動(dòng)態(tài)編輯和更新這50條關(guān)鍵詞語(yǔ)的內(nèi)容。語(yǔ)音識(shí)別Python類(lèi)的設(shè)計(jì)語(yǔ)音識(shí)別ASRPython庫(kù)基于板上集成的語(yǔ)音識(shí)別處理器的特性進(jìn)行設(shè)計(jì),采用Python語(yǔ)言進(jìn)行編寫(xiě),主要設(shè)計(jì)和封裝了一個(gè)asr類(lèi)給外部Python程序引用。該asr類(lèi)主要提供設(shè)置工作場(chǎng)景命令詞add_cmd()、啟動(dòng)識(shí)別過(guò)程run()、獲取識(shí)別結(jié)果get_res()等方法供應(yīng)用程序使用。ASR語(yǔ)音識(shí)別類(lèi)的Python調(diào)用方法導(dǎo)入asr類(lèi)模塊創(chuàng)建語(yǔ)音識(shí)別對(duì)象實(shí)例初始化語(yǔ)音識(shí)別對(duì)象設(shè)置工作場(chǎng)景,添加關(guān)鍵詞識(shí)別列表啟動(dòng)語(yǔ)音識(shí)別等待語(yǔ)音識(shí)別結(jié)果提取語(yǔ)音識(shí)別結(jié)果ASR語(yǔ)音識(shí)別類(lèi)初始化編程
fromopenaieimportasr #創(chuàng)建語(yǔ)音識(shí)別實(shí)例ASR=asr() #導(dǎo)入語(yǔ)音識(shí)別類(lèi)模塊ASR.asr_init() #初始化語(yǔ)音識(shí)別對(duì)象time.sleep(50) #延時(shí)等待50ms;設(shè)置工作場(chǎng)景添加關(guān)鍵詞識(shí)別列表:asr.add_cmd("hong",1) #添加關(guān)鍵詞“紅”,編號(hào)為“1”。asr.add_cmd("lv",2) #添加關(guān)鍵詞“綠”,編號(hào)為“2”。asr.add_cmd("lan",3) #添加關(guān)鍵詞“藍(lán)”,編號(hào)為“3”。asr.add_cmd("kaideng",4)#添加關(guān)鍵詞“開(kāi)燈”,編號(hào)為“4”。asr.add_cmd("guandeng",5)#添加關(guān)鍵詞“關(guān)燈”,編號(hào)為“5”。調(diào)測(cè)與驗(yàn)證調(diào)式程序時(shí),同樣可以將識(shí)別結(jié)果輸出到串口監(jiān)視器中,觀察輸出的值是否與說(shuō)出的語(yǔ)音關(guān)鍵詞的編碼一致。調(diào)試語(yǔ)音識(shí)別模塊過(guò)程中,也要注意工作環(huán)境中是否存在比較大的噪聲。噪聲的存在會(huì)影響識(shí)別結(jié)果的準(zhǔn)確性,嚴(yán)重時(shí)會(huì)導(dǎo)致沒(méi)有識(shí)別結(jié)果出現(xiàn)。調(diào)試過(guò)程方在安靜的環(huán)境中進(jìn)行,以排除干擾。分析與思考結(jié)合本次編程實(shí)踐,重點(diǎn)體會(huì)自定義函數(shù)在Python應(yīng)用系統(tǒng)中的作用,進(jìn)一步了解和體驗(yàn)Python語(yǔ)言中函數(shù)定義程序模塊的結(jié)構(gòu)設(shè)計(jì)方法。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物標(biāo)志物在藥物臨床試驗(yàn)中的藥物研發(fā)技術(shù)研究
- 生物材料支架在皮膚再生中的臨床應(yīng)用推廣策略
- 生物材料臨床應(yīng)用中的衛(wèi)生技術(shù)評(píng)估與醫(yī)保準(zhǔn)入策略
- 生物制品穩(wěn)定性指示分析方法開(kāi)發(fā)與驗(yàn)證
- 生物制劑失應(yīng)答后IBD的特殊人群用藥策略-1
- 食品檢驗(yàn)員面試題及質(zhì)量標(biāo)準(zhǔn)解析
- 副總經(jīng)理面試題集及答案
- 甜味劑在兒童糖尿病飲食中的安全性
- 保險(xiǎn)代理人職位面試問(wèn)題集
- 助航燈光設(shè)備維修技能考試題庫(kù)
- 2025房屋買(mǎi)賣(mài)合同公證書(shū)范文
- 氣管切開(kāi)患者的管理與康復(fù)治療
- 《中國(guó)急性腎損傷臨床實(shí)踐指南(2023版)》解讀
- 2025高考化學(xué)專(zhuān)項(xiàng)復(fù)習(xí):60個(gè)高中化學(xué)??紝?shí)驗(yàn)
- 江蘇自考現(xiàn)代企業(yè)經(jīng)營(yíng)管理-練習(xí)題(附答案)27875
- 場(chǎng)地空地出租合同范本
- 大學(xué)體育與科學(xué)健身智慧樹(shù)知到期末考試答案2024年
- 月子中心員工禮儀培訓(xùn)方案
- 電鍍制造成本預(yù)估表
- 2023大型新能源集控中心建設(shè)項(xiàng)目技術(shù)方案
- 2023年研究生類(lèi)社會(huì)工作碩士(MSW)考試題庫(kù)
評(píng)論
0/150
提交評(píng)論