下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
淺談智能語音技術(shù)在家庭數(shù)字娛樂系統(tǒng)的設(shè)計與實現(xiàn)獲獎科研報告摘要:隨著家庭智能產(chǎn)品逐漸實現(xiàn)互聯(lián)互通,傳統(tǒng)的單一產(chǎn)品設(shè)計思路已經(jīng)不能應(yīng)對這樣一個完善的系統(tǒng)和新興的用戶需求。物聯(lián)網(wǎng)、語音識別、云計算等技術(shù)的發(fā)展為家庭數(shù)字娛樂系統(tǒng)帶來新的發(fā)展機會和感官體驗。本文對一種以智能語音技術(shù)的個性化的家庭智能語音數(shù)字娛樂系統(tǒng)進(jìn)行相關(guān)的理論和設(shè)計研究。
關(guān)鍵詞:家庭數(shù)字娛樂系統(tǒng);語音交互;服務(wù)設(shè)計;物聯(lián)網(wǎng)
一、智能語音技術(shù)在家庭數(shù)字娛樂系統(tǒng)的設(shè)計原則
1.1以目標(biāo)用戶的需求為中心的原則
在進(jìn)行服務(wù)系統(tǒng)設(shè)計時始終以目標(biāo)用戶的需求為導(dǎo)向,滿足用戶的不同需求,除了滿足用戶的基本需求外,還要強調(diào)目標(biāo)用戶的多層次需求,注重實現(xiàn)人的價值,將情感、心理等人性化的概念融入到設(shè)計中去。在智能語音系統(tǒng)的服務(wù)設(shè)計研究中,主要從滿足不同家庭角色需求各異的角度去探討多需求共存的問題。在家庭數(shù)字娛樂系統(tǒng)的智能語音服務(wù)設(shè)計研宂中,運用以目標(biāo)用戶的需求為中心的原則意在通過前期目標(biāo)用戶研究,將用戶需求轉(zhuǎn)化為產(chǎn)品和服務(wù)的功能要素。在智能語音服務(wù)中,將用戶在語音輸入、語音修正、等待處理以及語音輸出階段的服務(wù)觸點進(jìn)行細(xì)化,優(yōu)化每個服務(wù)觸點的質(zhì)量,滿足用戶多層次的需求。
1.2聚散重構(gòu)式系統(tǒng)性原則
在進(jìn)行服務(wù)設(shè)計時,從整體全局視角出發(fā),綜合考慮人、服務(wù)和環(huán)境等要素以及各要素之間的相互關(guān)系,進(jìn)而合理地規(guī)劃系統(tǒng)內(nèi)各要素之間的組合順序、配合程度,最終能夠最大限度地發(fā)揮整體服務(wù)系統(tǒng)性能。聚散重構(gòu)式系統(tǒng)創(chuàng)新是指在系統(tǒng)創(chuàng)新基礎(chǔ)上對智能語音服務(wù)中散落的問題點,以及服務(wù)系統(tǒng)中可能涉及到的諸多利益相關(guān)者進(jìn)行分析,并重新建立任務(wù)關(guān)系模型。
1.3多方協(xié)作式原則
在設(shè)計研究階段,通過對目標(biāo)用戶的研究分析,將用戶對智能語音服務(wù)的使用行為、體驗痛點以及期待傳達(dá)給設(shè)計團(tuán)隊、技術(shù)人員或客服。在設(shè)計完成階段,邀請用戶進(jìn)行體驗,對體驗較差的觸點進(jìn)行優(yōu)化后再上線,避免造成損失。在產(chǎn)品和服務(wù)上線后,用戶可以通過產(chǎn)品內(nèi)部的反饋功能將使用體驗及時反饋給工作人員。多方協(xié)作的創(chuàng)新方式將用戶與設(shè)計團(tuán)隊連接一起,設(shè)計團(tuán)隊能夠挖掘用戶真實的需求,并為用戶提供更好的服務(wù),實現(xiàn)服務(wù)價值最大化。
二、家庭數(shù)字娛樂系統(tǒng)中智能語音相關(guān)技術(shù)介紹
智能語音技術(shù)涉及到多個學(xué)科的知識,如聲學(xué)、認(rèn)知、模式識別、人工智能技術(shù)等。智能語音的系統(tǒng)框架包含5個模塊,如圖1所示。語音識別模塊負(fù)責(zé)接受用戶的語音輸入并且將其轉(zhuǎn)成文字交給自然語言理解模塊。自然語言理解模塊在理解了用戶輸入的語義之后將特定的表達(dá)輸入對話管理模塊中。對話管理模塊負(fù)責(zé)協(xié)調(diào)各個模塊的調(diào)用以及維護(hù)當(dāng)前對話狀態(tài),并將特定的回復(fù)方式交由自然語言生成模塊進(jìn)行處理。自然語言生成模塊生成特定回復(fù)文本輸入語音合成模塊。語音合成模塊負(fù)責(zé)將文字以語音的方式輸出給用戶。
三、家庭數(shù)字娛樂智能語音應(yīng)用的系統(tǒng)設(shè)計
3.1語音為主、視覺為輔的多模態(tài)設(shè)計
目前,界面交互設(shè)計覆蓋大多數(shù)人機交互場景,視覺信息輔助用戶完成系列任務(wù)。在語音識別、語音合成技術(shù)尚未成熟階段,完全依賴于語音交互卻可能給用戶帶來困擾。語音交互設(shè)計剝離了界面設(shè)計,摒棄傳統(tǒng)的界面信息指示、引導(dǎo),對用戶和設(shè)計師都是巨大的挑戰(zhàn)。用戶和產(chǎn)品的語音交互行為主要基于語音進(jìn)行信息的輸入輸出,語音信息具有瞬態(tài)即時性,復(fù)雜的語音信息輸出會增加用戶心理認(rèn)知負(fù)荷。例如,通過智能音箱購買電影票時,用戶需要對電影院地理位置、影院音效、商場環(huán)境、電影放映時間、座位位置等因素進(jìn)行綜合考慮,語音助手完成任務(wù)的鏈路較長,用戶瞬時記憶能力很難完成訂票服務(wù)。3.2基于用戶使用場景的設(shè)計
隨著物聯(lián)網(wǎng)技術(shù)以及智能硬件的不斷發(fā)展,智慧家居已經(jīng)逐漸走入人們的視野,家電從冷冰冰的個體演變成了智慧的系統(tǒng)。語音交互為智能家居系統(tǒng)帶來更方便、更生動的交互方式。從空間屬性上可將智慧家居可分為私密空間(臥室場景)、開放空間(客廳場景)和協(xié)作空間(廚房場景)三類場景。用戶在不同的細(xì)分場景下對產(chǎn)品需求各不相同,產(chǎn)品需要提供不同的業(yè)務(wù)邏輯匹配用戶的場景需求。在開放空間,家庭數(shù)字娛樂產(chǎn)品承載著公共互娛的功能屬性,如播放音樂、控制智能家居。產(chǎn)品可根據(jù)周圍環(huán)境的嘈雜程度自適應(yīng)調(diào)整語音輸出的響度,以確保用戶能夠接收到語音信息。開放空間無關(guān)的語音信息較多,產(chǎn)品要能夠屏蔽過濾掉雜音,給予用戶正確的反饋。
3.2合理進(jìn)行界面交互設(shè)計
在界面交互設(shè)計中,設(shè)計師通過視覺設(shè)計確保圖形、色彩、字體等元素保持一致性,準(zhǔn)確地將產(chǎn)品概念傳達(dá)給用戶。相比于有形的界面設(shè)計元素,語音交互設(shè)計元素趨向于無形。響度、音色、音調(diào)、節(jié)奏等元素成為語音交互設(shè)計的材料。每個人說話的語氣、咬字、節(jié)奏都是獨特的,甚至成為個性標(biāo)簽。語速快、音色脆給人年輕活潑的印象,語速慢、響度低給人沉穩(wěn)可靠的感覺。家庭數(shù)字娛樂產(chǎn)品給人有趣、輕松、智能的印象,產(chǎn)品語音交互設(shè)計需傳達(dá)一致的聽覺形象。在語音形象設(shè)計中,需要刻畫產(chǎn)品的擬人畫像,其聽覺形象需要與產(chǎn)品功能屬性保持一致,將語音信息人性化地傳達(dá)給用戶。
3.3
多輪對話的互動性設(shè)計
語音交互因其與人類會話方式類似而被認(rèn)為是自然交互,因此語音交互也遵循著人類合作式會話的原則。哲學(xué)家保羅?格里斯認(rèn)為,輪流表達(dá)、上下文和串聯(lián)是合作式會話的組成部分,即合作原則。語音交互應(yīng)當(dāng)預(yù)判和推測用戶下一步的語音指令和上下語境關(guān)系,以保證用戶和產(chǎn)品輪流表達(dá),傳遞信息。在家居環(huán)境中,遠(yuǎn)場語音交互容易分散用戶注意力,對話應(yīng)該通過關(guān)鍵的語料元素給用戶精準(zhǔn)的語音提示或設(shè)備響應(yīng)。這種串聯(lián)式表達(dá)能夠推進(jìn)會話進(jìn)程,將上下語境內(nèi)容融合在一起。在人類日常對話中,經(jīng)常略去前文的主語或者賓語,智能硬件在多輪互動中聯(lián)系上下語境、讀取用戶的歷史行為記錄以便更好的理解用戶。
四、結(jié)束語
隨著物聯(lián)網(wǎng)、云計算等計算機技術(shù)的發(fā)展,家庭數(shù)字娛樂產(chǎn)品之
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- JJF 2380-2026檢驗醫(yī)學(xué)定量檢測項目基于患者數(shù)據(jù)的質(zhì)量控制算法溯源方法
- 怎么用口訣背填空題目及答案
- 國際法律面試題目及答案
- 物理中液體單位換算題目及答案
- 養(yǎng)老院醫(yī)療設(shè)施管理制度
- 2.4傳感與控制 同步練習(xí) 高中信息技術(shù)浙教版(2019)必修2(含答案)
- 養(yǎng)老院老人生活照顧服務(wù)質(zhì)量管理制度
- 岳陽樓記題目及答案簡單
- 養(yǎng)老院老人家庭關(guān)懷制度
- 養(yǎng)老院工作人員交接班制度
- 人教部編五年級語文下冊古詩三首《四時田園雜興(其三十一)》示范公開課教學(xué)課件
- AI領(lǐng)域求職者必看美的工廠AI面試實戰(zhàn)經(jīng)驗分享
- 4.2《揚州慢》課件2025-2026學(xué)年統(tǒng)編版高中語文選擇性必修下冊
- 制定應(yīng)急培訓(xùn)計劃
- 鄉(xiāng)鎮(zhèn)應(yīng)急管理培訓(xùn)
- DB63∕T 2215-2023 干法直投改性劑瀝青路面施工技術(shù)規(guī)范
- 捻線工三級安全教育(公司級)考核試卷及答案
- 學(xué)校智慧校園建設(shè)協(xié)議
- 上海市中考物理基礎(chǔ)選擇百題練習(xí)
- 發(fā)電廠非計劃停機應(yīng)急預(yù)案
- 2025年國家能源局公務(wù)員面試模擬題詳解與備考策略
評論
0/150
提交評論