版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《智能傳感器技術(shù)》教材配套課件國(guó)防科技大學(xué)機(jī)器人語(yǔ)音識(shí)別15.1機(jī)器人聲音定位15.2聲音定位在機(jī)器人中的應(yīng)用15.3語(yǔ)音識(shí)別是人工智能機(jī)器人領(lǐng)域中的一個(gè)重要分支,它使機(jī)器人能夠智能理解和處理人類(lèi)的語(yǔ)音指令,實(shí)現(xiàn)人機(jī)交互,廣泛應(yīng)用于智能客服、智能家居、智能車(chē)載等多個(gè)領(lǐng)域早期階段隱馬爾可夫模型興起階段深度神經(jīng)網(wǎng)絡(luò)應(yīng)用階段貝爾實(shí)驗(yàn)室的Audrey系統(tǒng)IBM發(fā)明了ShoeBox系統(tǒng)卡耐基梅隆大學(xué)的Reddy系統(tǒng)小詞匯量、孤立詞的語(yǔ)音識(shí)別大詞匯量、連續(xù)語(yǔ)音識(shí)別動(dòng)態(tài)規(guī)劃思想統(tǒng)計(jì)方法GMM-HMM框架DBN-HMMDNN-HMM高識(shí)別率、魯棒性、效率語(yǔ)音識(shí)別系統(tǒng)組成語(yǔ)音信號(hào)是一種非平穩(wěn)的一維復(fù)雜時(shí)變信號(hào),在進(jìn)行語(yǔ)音識(shí)別的時(shí)候,不能直接將原始語(yǔ)音信號(hào)當(dāng)作輸入,而需要先對(duì)語(yǔ)音信號(hào)采取一系列預(yù)處理操作。濾波預(yù)加重分幀加窗語(yǔ)音信號(hào)預(yù)處理?語(yǔ)音信號(hào)預(yù)處理—濾波?補(bǔ)償在錄音和傳輸過(guò)程中高頻聲音的自然衰減,減少噪聲的影響,并改善語(yǔ)音特征的穩(wěn)定性語(yǔ)音信號(hào)預(yù)處理—預(yù)加重?語(yǔ)音信號(hào)分幀的目的在于將連續(xù)的語(yǔ)音信號(hào)切割成短時(shí)間內(nèi)的小段,即幀,以便對(duì)每一幀進(jìn)行獨(dú)立的分析和處理語(yǔ)音信號(hào)預(yù)處理—分幀?聲學(xué)特征提取是從預(yù)處理后的語(yǔ)音信號(hào)中提取代表語(yǔ)音特性的參數(shù),這些參數(shù)能夠捕捉到語(yǔ)音信號(hào)的重要信息,如音調(diào)、音色等,以便于后續(xù)的語(yǔ)音處理和識(shí)別任務(wù)MFCC特征提取流程聲學(xué)特征提取?馬爾可夫模型聲學(xué)模型?GMM-HMM聲學(xué)模型聲學(xué)模型?DNN-HMM聲學(xué)模型聲學(xué)模型?語(yǔ)言模型的核心目的是評(píng)估一個(gè)給定的詞序列在自然語(yǔ)言中出現(xiàn)的可能性,即預(yù)測(cè)句子中下一個(gè)詞的概率語(yǔ)言模型N-gram困惑度(Perplexity,PPL)PPL越小表示在給定歷史上出現(xiàn)下一個(gè)預(yù)測(cè)詞的概率越高,該模型的效果越好語(yǔ)音模型?家庭助理機(jī)器人交互式教學(xué)和娛樂(lè)醫(yī)療輔助機(jī)器人語(yǔ)音識(shí)別15.1機(jī)器人聲音定位15.2聲音定位在機(jī)器人中的應(yīng)用15.3送餐機(jī)器人如何實(shí)現(xiàn)定位基于麥克風(fēng)陣列的聲源定位是指用麥克風(fēng)拾取聲音信號(hào),通過(guò)對(duì)麥克風(fēng)陣列的各路輸出信號(hào)進(jìn)行分析和處理,得到一個(gè)或者多個(gè)聲源的位置信息。目前基于麥克風(fēng)陣列的聲源定位方法主要有三種:基于最大輸出功率的可控波束成形的定位方法基于高分辨譜估計(jì)的定位方法基于到達(dá)時(shí)延差估計(jì)的定位方法(TimeDifferenceofArrival,TDOA)基于最大輸出功率的可控波束成形的定位方法?到達(dá)時(shí)間差(TDOA)定位技術(shù)?第i個(gè)麥克風(fēng)與聲源的距離為第一、二個(gè)麥克風(fēng)與y軸的夾角為:聲源的坐標(biāo)為到達(dá)時(shí)間差(TDOA)定位技術(shù)——近場(chǎng)模型?機(jī)器人語(yǔ)音識(shí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 未來(lái)五年在線大班企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略分析研究報(bào)告
- 未來(lái)五年農(nóng)產(chǎn)品初加工服務(wù)企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略分析研究報(bào)告
- 沖擊鉆成孔施工質(zhì)量保證措施
- 新溪安全生產(chǎn)管理規(guī)范講解
- 消防安全課教案集錦
- 公司職場(chǎng)禮儀培訓(xùn)課件
- 2025-2030現(xiàn)代農(nóng)業(yè)種植參保模式推廣與產(chǎn)量提升技術(shù)方案分析研究報(bào)告
- 2025-2030物聯(lián)網(wǎng)智能控制市場(chǎng)潛力分析與發(fā)展策略報(bào)告
- 2025-2030物流配送行業(yè)市場(chǎng)現(xiàn)狀競(jìng)爭(zhēng)分析發(fā)展前景調(diào)研投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030物流運(yùn)輸供需平衡現(xiàn)狀競(jìng)爭(zhēng)結(jié)構(gòu)投資風(fēng)險(xiǎn)規(guī)劃深度研究考察
- 2025年全國(guó)職業(yè)院校技能大賽中職組(母嬰照護(hù)賽項(xiàng))考試題庫(kù)(含答案)
- 2026江蘇鹽城市阜寧縣科技成果轉(zhuǎn)化服務(wù)中心選調(diào)10人考試參考題庫(kù)及答案解析
- 托管機(jī)構(gòu)客戶(hù)投訴處理流程規(guī)范
- 2026年及未來(lái)5年中國(guó)建筑用腳手架行業(yè)發(fā)展?jié)摿Ψ治黾巴顿Y方向研究報(bào)告
- 銀行客戶(hù)信息安全課件
- 2026年四川單招單招考前沖刺測(cè)試題卷及答案
- 2026年全國(guó)公務(wù)員考試行測(cè)真題解析及答案
- 2025新疆華夏航空招聘筆試歷年難易錯(cuò)考點(diǎn)試卷帶答案解析
- (2025)70周歲以上老年人換長(zhǎng)久駕照三力測(cè)試題庫(kù)(附答案)
- 金太陽(yáng)山西省名校三晉聯(lián)盟2025-2026學(xué)年高三上學(xué)期12月聯(lián)合考試語(yǔ)文(26-177C)(含答案)
- 2026年泌尿護(hù)理知識(shí)培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論