CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品

上傳人：x*** IP屬地：重慶上傳時(shí)間：2025-09-03 格式：DOCX 頁(yè)數(shù)：39 大?。?68.63KB 積分：10.8 舉報(bào) 版權(quán)申訴

CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品_第2頁(yè)

CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品_第3頁(yè)

CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品_第4頁(yè)

CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品_第5頁(yè)

已閱讀5頁(yè)，還剩34頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(10)申請(qǐng)公布號(hào)CN120220720A(71)申請(qǐng)人科大訊飛股份有限公司地址230088安徽省合肥市高新開(kāi)發(fā)區(qū)望江西路666號(hào)(72)發(fā)明人孫嘉琪趙立鴿(74)專利代理機(jī)構(gòu)北京布瑞知識(shí)產(chǎn)權(quán)代理有限公司11505專利代理師李強(qiáng)G1OL21/10(20G1OL25/63(20GO6N3/08(20及產(chǎn)品本申請(qǐng)?zhí)峁┮环N語(yǔ)音輸入的處理方法、裝入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)；基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系，確定與用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果，該目標(biāo)視覺(jué)展示效果用于可視化地展示用戶的情緒狀態(tài)；在語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中，呈現(xiàn)目標(biāo)視覺(jué)識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系，確定與用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果在語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中，呈現(xiàn)目標(biāo)視覺(jué)展示效果2識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)；基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系，確定與所述用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果，所述目標(biāo)視覺(jué)展示效果用于可視化地展示所述用戶的情緒狀態(tài)；在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中，呈現(xiàn)所述目標(biāo)視覺(jué)展示效果。2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述視覺(jué)展示效果包括HSL顏色空間的色彩參數(shù)、所述語(yǔ)音信號(hào)的波形中包含的粒子的速度、所述語(yǔ)音輸入界面的形變參數(shù)和動(dòng)態(tài)紋理參數(shù)中至少一項(xiàng)。3.根據(jù)權(quán)利要求2所述的方法，其特征在于，在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中，調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至所述目標(biāo)視覺(jué)展示效果。4.根據(jù)權(quán)利要求3所述的方法，其特征在于，在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)色彩參數(shù)和/或所述語(yǔ)音輸入界面的目標(biāo)形變參數(shù)的情況下；其中，所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至所述目標(biāo)視覺(jué)展調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù)；調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參確定所述色彩參數(shù)的調(diào)整步長(zhǎng)值；基于所述色彩參數(shù)的調(diào)整步長(zhǎng)值，調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù)。6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述色彩參數(shù)包括色相參數(shù)和/或飽和度基于所述語(yǔ)音輸入界面的當(dāng)前色相參數(shù)與目標(biāo)色相參數(shù)之間的色相參數(shù)差值，以及預(yù)設(shè)調(diào)整比例的乘積，確定所述色相參數(shù)的調(diào)整步長(zhǎng)值；基于預(yù)設(shè)的飽和度調(diào)整值，確定所述飽和度參數(shù)的調(diào)整步長(zhǎng)值。7.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參基于所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)各自對(duì)應(yīng)的權(quán)重，對(duì)所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)進(jìn)行加權(quán)求和，并將加權(quán)求和結(jié)果確定為所述形變參數(shù)的調(diào)整步長(zhǎng)值；基于所述形變參數(shù)的調(diào)整步長(zhǎng)值，調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。8.根據(jù)權(quán)利要求4所述的方法，其特征在于，在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)粒子速度時(shí)，所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至所述目標(biāo)視覺(jué)展示效3基于顯示設(shè)備的性能參數(shù)，確定預(yù)加載的粒子的目標(biāo)數(shù)量；染所述目標(biāo)視覺(jué)展示效果。9.根據(jù)權(quán)利要求1-8中任一項(xiàng)所述的方法，其特征在于，所述識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)獲取各個(gè)模態(tài)下的輸入數(shù)據(jù)，所述各個(gè)模態(tài)下的輸入數(shù)據(jù)包括所述語(yǔ)音信號(hào)、所述語(yǔ)音信號(hào)對(duì)應(yīng)的文本數(shù)據(jù)、所述用戶輸入所述語(yǔ)音信號(hào)時(shí)的視頻數(shù)據(jù)和心率數(shù)據(jù)中至少一針對(duì)所述各個(gè)模態(tài)中每個(gè)模態(tài)，對(duì)該模態(tài)下的輸入數(shù)據(jù)進(jìn)行特征提取，得到該模態(tài)下的特征表示；基于所述各個(gè)模態(tài)下的特征表示，得到綜合特征；根據(jù)所述綜合特征，識(shí)別所述用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)。10.根據(jù)權(quán)利要求1-8中任一項(xiàng)所述的方法，其特征在于，所述方法還包括：獲取所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的反饋數(shù)據(jù)；基于所述反饋數(shù)據(jù)，對(duì)所述映射關(guān)系進(jìn)行更新。11.根據(jù)權(quán)利要求10所述的方法，其特征在于，所述反饋數(shù)據(jù)中包括所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù)；基于所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù)，更新所述映射關(guān)系，以使所述映射關(guān)系符合所述用戶的偏好。所述存儲(chǔ)器與所述處理器連接，用于存儲(chǔ)程序；所述處理器用于通過(guò)運(yùn)行所述存儲(chǔ)器中的程序，實(shí)現(xiàn)如權(quán)利要求1至11中任意一項(xiàng)所述的方法。13.一種存儲(chǔ)介質(zhì)，其特征在于，所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器運(yùn)行時(shí)，實(shí)現(xiàn)如權(quán)利要求1至11中任意一項(xiàng)所述的方法。14.一種計(jì)算機(jī)程序產(chǎn)品，其特征在于，包括計(jì)算機(jī)程序指令，所述計(jì)算機(jī)程序指令在被處理器運(yùn)行時(shí)使得所述處理器實(shí)現(xiàn)如權(quán)利要求1至11中任意一項(xiàng)所述的方法。4技術(shù)領(lǐng)域[0001]本申請(qǐng)涉及語(yǔ)音處理領(lǐng)域，尤其涉及一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品。背景技術(shù)[0002]語(yǔ)音輸入作為一種重要的人機(jī)交互方式，被廣泛應(yīng)用于各類智能設(shè)備和軟件系統(tǒng)中。為了增強(qiáng)語(yǔ)音輸入過(guò)程中的互動(dòng)性和趣味性，許多系統(tǒng)會(huì)在用戶進(jìn)行語(yǔ)音輸入時(shí)展示動(dòng)態(tài)的動(dòng)畫效果，例如動(dòng)態(tài)波形或圖標(biāo)動(dòng)畫，以直觀地反饋用戶語(yǔ)音信號(hào)的強(qiáng)度與變化趨[0003]然而，目前這些視覺(jué)反饋機(jī)制大多依賴于固定的視覺(jué)模板或預(yù)設(shè)的簡(jiǎn)單動(dòng)畫效發(fā)明內(nèi)容[0004]基于上述技術(shù)現(xiàn)狀，本申請(qǐng)?zhí)峁┮环N語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品，能夠提高語(yǔ)音輸入過(guò)程中視覺(jué)反饋效果的多樣性和靈活度。[0005]為了達(dá)到上述技術(shù)目的，本申請(qǐng)具體提出如下技術(shù)方案：根據(jù)本申請(qǐng)實(shí)施例的第一方面，提供了一種語(yǔ)音輸入的處理方法，包括：識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)；基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系，確定與所述用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果，所述目標(biāo)視覺(jué)展示效果用于可視化地展示所述用戶的情緒狀態(tài)；在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中，呈現(xiàn)所述目標(biāo)視覺(jué)展示在一些實(shí)現(xiàn)方式中，所述視覺(jué)展示效果包括HSL顏色空間的色彩參數(shù)、所述語(yǔ)音信號(hào)的波形中包含的粒子的速度、所述語(yǔ)音輸入界面的形變參數(shù)和動(dòng)態(tài)紋理參數(shù)中至少一[0006]在一些實(shí)現(xiàn)方式中，在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中，呈現(xiàn)所述目標(biāo)視覺(jué)展示效果，包括：調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至所述目標(biāo)視覺(jué)展示效果。[0007]在一些實(shí)現(xiàn)方式中，在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)色彩參數(shù)和/或所述語(yǔ)音輸入界面的目標(biāo)形變參數(shù)的情況下；其中，所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至所述目標(biāo)視覺(jué)展示效果，包括：調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù)；和/或，調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。[0008]在一些實(shí)現(xiàn)方式中，所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù)，包括：確定所述色彩參數(shù)的調(diào)整步長(zhǎng)值；基于所述色彩參數(shù)的調(diào)整步長(zhǎng)值，調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù)。[0009]在一些實(shí)現(xiàn)方式中，所述色彩參數(shù)包括色相參數(shù)和/或飽和度參數(shù)；其中，所述確5定所述色彩參數(shù)的調(diào)整步長(zhǎng)值，包括：基于所述語(yǔ)音輸入界面的當(dāng)前色相參數(shù)與目標(biāo)色相參數(shù)之間的色相參數(shù)差值，以及預(yù)設(shè)調(diào)整比例的乘積，確定所述色相參數(shù)的調(diào)整步長(zhǎng)值；和/或，基于預(yù)設(shè)的飽和度調(diào)整值，確定所述飽和度參數(shù)的調(diào)整步長(zhǎng)值。[0010]在一些實(shí)現(xiàn)方式中，所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)，包括：基于所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)各自對(duì)應(yīng)的權(quán)重，對(duì)所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)進(jìn)行加權(quán)求和，并將加權(quán)求和結(jié)果確定為所述形變參數(shù)的調(diào)整步長(zhǎng)值；基于所述形變參數(shù)的調(diào)整步長(zhǎng)值，調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。[0011]在一些實(shí)現(xiàn)方式中，在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)粒子速度時(shí)，所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至所述目標(biāo)視覺(jué)展示效果，還包括：基于顯目標(biāo)數(shù)量的粒子，并基于所述目標(biāo)粒子速度，渲染所述目標(biāo)視覺(jué)展示效果。[0012]在一些實(shí)現(xiàn)方式中，所述識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)，包括：獲取各個(gè)模態(tài)下的輸入數(shù)據(jù)，所述各個(gè)模態(tài)下的輸入數(shù)據(jù)包括所述語(yǔ)音信號(hào)、所述語(yǔ)音信號(hào)對(duì)應(yīng)的文本數(shù)據(jù)、所述用戶輸入所述語(yǔ)音信號(hào)時(shí)的視頻數(shù)據(jù)和心率數(shù)據(jù)中至少一項(xiàng)；針對(duì)所述各個(gè)模態(tài)中每個(gè)模態(tài)，對(duì)該模態(tài)下的輸入數(shù)據(jù)進(jìn)行特征提取，得到該模態(tài)下的特征表示；基于所述各個(gè)模態(tài)下的特征表示，得到綜合特征；根據(jù)所述綜合特征，識(shí)別所述用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)。[0013]在一些實(shí)現(xiàn)方式中，所述方法還包括：獲取所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的反饋數(shù)據(jù)；基于所述反饋數(shù)據(jù)，對(duì)所述映射關(guān)[0014]在一些實(shí)現(xiàn)方式中，所述反饋數(shù)據(jù)中包括所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的交對(duì)所述目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù)，更新所述映射關(guān)系，以使所述映射關(guān)系符合所述用戶的偏好。[0015]根據(jù)本申請(qǐng)實(shí)施例的第二方面，提供了一種電子設(shè)備，包括存儲(chǔ)器和處理器；所述存儲(chǔ)器與所述處理器連接，用于存儲(chǔ)程序；所述處理器用于通過(guò)運(yùn)行所述存儲(chǔ)器中的程序，實(shí)現(xiàn)如第一方面所述的語(yǔ)音輸入的處理方法。[0016]根據(jù)本申請(qǐng)實(shí)施例的第三方面，提供了一種存儲(chǔ)介質(zhì)，所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器運(yùn)行時(shí)，實(shí)現(xiàn)如第一方面所述的語(yǔ)音輸入的處理方法。[0017]根據(jù)本申請(qǐng)實(shí)施例的第四方面，提供了一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序指令，所述計(jì)算機(jī)程序指令在被處理器運(yùn)行時(shí)使得所述處理器執(zhí)行：如第一方面所述的語(yǔ)音輸入的處理方法。[0018]本申請(qǐng)實(shí)施例提供的一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品，通過(guò)識(shí)別用戶在語(yǔ)音輸入期間的情緒狀態(tài)，并根據(jù)預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系，確定出與用戶當(dāng)前情緒狀態(tài)相符的目標(biāo)視覺(jué)展示效果，進(jìn)而將其展現(xiàn)在語(yǔ)音輸入界面中。由于目標(biāo)視覺(jué)展示效果是基于用戶的情緒狀態(tài)確定的，因此可以可視化地表達(dá)用戶當(dāng)前的情緒狀態(tài)，為語(yǔ)音輸入過(guò)程中的視覺(jué)反饋機(jī)制提供多樣化的視覺(jué)效果。該些視覺(jué)展示效果還可以隨著用戶情緒的變化而實(shí)時(shí)調(diào)整，因此還可以提升視覺(jué)展示的靈活度，增強(qiáng)用戶的交互體驗(yàn)。6附圖說(shuō)明[0019]為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹，顯而易見(jiàn)地，下面描述中的附圖僅僅是本申請(qǐng)的實(shí)施例，對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)提供的附圖獲得其他的附圖。[0020]圖1為本申請(qǐng)實(shí)施例提供的一種語(yǔ)音輸入的處理方法的流程圖。[0021]圖2為本申請(qǐng)實(shí)施例提供的識(shí)別用戶情緒狀態(tài)的流程圖。[0022]圖3為本申請(qǐng)實(shí)施例提供的基于多模態(tài)數(shù)據(jù)識(shí)別用戶情緒狀態(tài)的原理圖。[0023]圖4為本申請(qǐng)實(shí)施例提供的色相參數(shù)漸變調(diào)整過(guò)程的示意圖。[0024]圖5為本申請(qǐng)實(shí)施例提供的界面形變參數(shù)漸變調(diào)整過(guò)程的示意圖。[0025]圖6為本申請(qǐng)實(shí)施例提供的一種語(yǔ)音輸入的處理裝置的結(jié)構(gòu)示意圖。[0026]圖7為本申請(qǐng)實(shí)施例提供的一種電子設(shè)備的結(jié)構(gòu)示意圖。具體實(shí)施方式[0027]本申請(qǐng)實(shí)施例提供的技術(shù)方案可示例性地應(yīng)用于處理器、電子設(shè)備、服務(wù)器(包括云服務(wù)器)等硬件設(shè)備，或包裝成軟件程序被運(yùn)行，當(dāng)硬件設(shè)備執(zhí)行本申請(qǐng)實(shí)施例技術(shù)方案的處理過(guò)程，或上述軟件程序被運(yùn)行時(shí)，可以實(shí)現(xiàn)目標(biāo)任務(wù)的自動(dòng)拆分和自動(dòng)調(diào)用任務(wù)所需的應(yīng)用程序接口，完成目標(biāo)任務(wù)的目的。本申請(qǐng)實(shí)施例只對(duì)本申請(qǐng)技術(shù)方案的具體處理過(guò)程進(jìn)行示例性介紹，并不對(duì)本申請(qǐng)技術(shù)方案的具體實(shí)現(xiàn)形式進(jìn)行限定，任意的可以執(zhí)行本申請(qǐng)技術(shù)方案處理過(guò)程的技術(shù)實(shí)現(xiàn)形式，都可以被本申請(qǐng)實(shí)施例所采用。[0028]下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖，對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例，而不是全部的實(shí)施例?；诒旧暾?qǐng)中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他[0029]在介紹本申請(qǐng)方案之前，首先對(duì)相關(guān)技術(shù)進(jìn)行介紹：當(dāng)前的語(yǔ)音輸入系統(tǒng)主要聚焦于語(yǔ)音識(shí)別及文本轉(zhuǎn)換功能，其用戶界面大多基于預(yù)設(shè)的靜態(tài)皮膚或模板構(gòu)建。例如，一些主流的手機(jī)輸入法在進(jìn)行語(yǔ)音輸入時(shí)，會(huì)通過(guò)動(dòng)態(tài)波形或圖標(biāo)動(dòng)畫等方式展現(xiàn)用戶的語(yǔ)音信號(hào)強(qiáng)度與變化情況。然而，該些視覺(jué)反饋機(jī)制通常依賴于固定的視覺(jué)模板或簡(jiǎn)單的實(shí)時(shí)數(shù)據(jù)驅(qū)動(dòng)實(shí)現(xiàn)。其雖然能夠有效地反映聲音的基本物理特性，例如通過(guò)實(shí)時(shí)顯示音頻波形或頻譜圖，但在捕捉與反饋用戶情緒狀態(tài)方面仍存在明顯不足。具體表現(xiàn)為：傳統(tǒng)系統(tǒng)多采用固定視覺(jué)模板或基礎(chǔ)動(dòng)畫效果呈現(xiàn)語(yǔ)音輸入過(guò)程，而未能充分考慮用戶的個(gè)性化和情境化需求，例如，依據(jù)用戶的情緒波動(dòng)做出相應(yīng)的界面調(diào)整。[0030]此外，部分解決方案中的情緒識(shí)別模塊準(zhǔn)確率較低，難以實(shí)時(shí)且準(zhǔn)確地解析語(yǔ)音中蘊(yùn)含的情感信息，導(dǎo)致動(dòng)態(tài)可視化效果與用戶實(shí)際情緒狀態(tài)之間的脫節(jié)現(xiàn)象。[0031]同時(shí)，由于缺乏高效的數(shù)據(jù)采集、處理與可視化協(xié)同機(jī)制，該類系統(tǒng)往往面臨較高的延遲問(wèn)題，無(wú)法滿足用戶對(duì)即時(shí)互動(dòng)的需求。[0032]值得注意的是，用戶的情緒對(duì)語(yǔ)音輸入效率和體驗(yàn)具有顯著影響，但傳統(tǒng)的語(yǔ)音輸入系統(tǒng)并未充分重視這一因素，缺乏有效的情緒識(shí)別與響應(yīng)能力。隨著情感計(jì)算和深度7學(xué)習(xí)技術(shù)的發(fā)展，如何利用該些先進(jìn)的技術(shù)捕捉用戶語(yǔ)音中的情緒線索，并據(jù)此實(shí)現(xiàn)界面的動(dòng)態(tài)調(diào)整，進(jìn)而提升用戶體驗(yàn)，提供更加豐富的[0033]有鑒于此，本申請(qǐng)實(shí)施例致力于提供一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品，通過(guò)實(shí)時(shí)地捕捉用戶在語(yǔ)音輸入過(guò)程中的情緒狀態(tài)，并根據(jù)預(yù)先設(shè)定的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系，確定與用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)相適應(yīng)的目標(biāo)視覺(jué)展示效果。隨后，在語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中，動(dòng)態(tài)呈現(xiàn)該目標(biāo)視覺(jué)展示效果，以實(shí)現(xiàn)對(duì)用戶情緒狀態(tài)的可視化表達(dá)。不僅能夠提升語(yǔ)音輸入界面的多樣性和靈活度，還可以增強(qiáng)用戶的交互體驗(yàn)。在以下實(shí)施例中逐一進(jìn)行詳細(xì)說(shuō)明。[0034]示例性方法圖1為本申請(qǐng)實(shí)施例提供的一種語(yǔ)音輸入的處理方法的流程圖。如圖1所示，本實(shí)施例提供的語(yǔ)音輸入的處理方法包括步驟S101-S103:S101、識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)。[0035]識(shí)別用戶在語(yǔ)音輸入過(guò)程中所蘊(yùn)含的情緒狀態(tài)，是實(shí)現(xiàn)情感化交互的關(guān)鍵環(huán)節(jié)之一。為了提升用戶情緒狀態(tài)的識(shí)別準(zhǔn)確度，在一些實(shí)施例中，可以基于用戶的各個(gè)模態(tài)下的輸入數(shù)據(jù)來(lái)識(shí)別用戶當(dāng)前的情緒狀態(tài)。如圖2所示，具體包括如下步驟S201至步驟S204:S201、獲取各個(gè)模態(tài)下的輸入數(shù)據(jù)，各個(gè)模態(tài)下的輸入數(shù)據(jù)包括語(yǔ)音信號(hào)、語(yǔ)音信號(hào)對(duì)應(yīng)的文本數(shù)據(jù)、用戶輸入語(yǔ)音信號(hào)時(shí)的視頻數(shù)據(jù)和心率數(shù)據(jù)中至少一項(xiàng)。[0036]本實(shí)施例中，可以通過(guò)各種模態(tài)數(shù)據(jù)捕捉用戶的情緒狀態(tài)。各個(gè)模態(tài)包括語(yǔ)音模態(tài)、文本模態(tài)、視頻模態(tài)和心率模態(tài)中至少一項(xiàng)。下面將詳細(xì)闡述每種模態(tài)的數(shù)據(jù)獲取過(guò)其中，語(yǔ)音模態(tài)下的輸入數(shù)據(jù)，可以在用戶激活語(yǔ)音輸入功能時(shí)，通過(guò)語(yǔ)音采集模塊(例如麥克風(fēng))實(shí)時(shí)捕捉用戶的語(yǔ)音信號(hào)獲得。例如，在聊天軟件、搜索引擎等多種應(yīng)用程序的語(yǔ)音輸入界面中，用戶通過(guò)點(diǎn)擊麥克風(fēng)按鈕即可啟動(dòng)語(yǔ)音輸入功能。[0037]在一些示例中，為了提升語(yǔ)音質(zhì)量，可以采用雙麥克風(fēng)陣列結(jié)合波束形成技術(shù)來(lái)抑制環(huán)境噪聲，以確保語(yǔ)音信號(hào)的清晰度。其中，采樣率可以設(shè)定為16kHz,以充分覆蓋人聲的基本頻率范圍(80-255Hz),從而保證語(yǔ)音輸入的基礎(chǔ)音質(zhì)。例如，當(dāng)用戶發(fā)出贊嘆如“這個(gè)功能太棒了!”時(shí)，雙麥克風(fēng)陣列不僅能夠記錄話語(yǔ)中的基本頻率成分，還能夠識(shí)別并強(qiáng)調(diào)其中高頻能量顯著增加的部分(約2000-4000Hz)。[0038]由于語(yǔ)句中的某些情感表達(dá)往往伴隨著特定頻率段的能量突增。因此通過(guò)上述采樣率的配置，雙麥克風(fēng)陣列不僅能精確地轉(zhuǎn)錄用戶的語(yǔ)音內(nèi)容，還能反映說(shuō)話者的情感狀態(tài)，從而有助于捕捉語(yǔ)音信號(hào)中的情感信息。[0039]文本數(shù)據(jù)也可以在一定程度上反映用戶的情緒狀態(tài)。因此，在獲得語(yǔ)音信號(hào)之后，還可以將語(yǔ)音信號(hào)轉(zhuǎn)錄為文本數(shù)據(jù)，從而獲得文本模態(tài)下的輸入數(shù)據(jù)，為識(shí)別用戶情緒狀態(tài)提供多維度的支持。[0040]另外，由于面部表情也是情緒表達(dá)的重要組成部分，因此還可以通過(guò)攝像頭實(shí)時(shí)地采集用戶的面部視頻數(shù)據(jù)，以獲取視頻模態(tài)下的輸入數(shù)據(jù)。[0041]除此之外，心率作為生理指標(biāo)之一，對(duì)情緒變化反應(yīng)敏感，能夠在一定程度上反映用戶的內(nèi)在情緒狀態(tài)。因此，還可以通過(guò)心率監(jiān)測(cè)設(shè)備(如智能手環(huán)或手表)采集用戶的心率數(shù)據(jù)，從而獲得心率模態(tài)下的輸入數(shù)據(jù)。8[0042]通過(guò)上述各個(gè)模態(tài)的輸入數(shù)據(jù)，可以為識(shí)別用戶情緒狀態(tài)提供多個(gè)維度的數(shù)據(jù)來(lái)源，以提升用戶情緒狀態(tài)的識(shí)別精度。[0043]在一些實(shí)施例中，為了增強(qiáng)用戶的個(gè)性化體驗(yàn)，還可以提供面部視頻數(shù)據(jù)采集的授權(quán)選項(xiàng)。用戶可以根據(jù)個(gè)人偏好選擇是否開(kāi)啟攝像頭權(quán)限。當(dāng)用戶選擇開(kāi)啟攝像頭的授權(quán)選項(xiàng)時(shí)，便可以采集用戶的面部視頻數(shù)據(jù)。[0044]由于麥克風(fēng)、攝像頭和心率監(jiān)測(cè)設(shè)備可能不會(huì)同時(shí)啟動(dòng)，會(huì)導(dǎo)致多源數(shù)據(jù)之間出現(xiàn)不同步問(wèn)題。因此，在獲得多源數(shù)據(jù)之后，可以采用時(shí)間戳對(duì)齊算法來(lái)實(shí)現(xiàn)多源數(shù)據(jù)的同步處理，以使得多源數(shù)據(jù)在時(shí)間上同步。[0045]具體地，可以通過(guò)在數(shù)據(jù)采集的源頭為每一條記錄添加精確的時(shí)間戳標(biāo)記，從而將來(lái)自不同設(shè)備的數(shù)據(jù)進(jìn)行對(duì)齊和同步。如此，便可以確保語(yǔ)音、視頻及心率等多模態(tài)數(shù)據(jù)在時(shí)間軸上準(zhǔn)確匹配，為后續(xù)的情緒狀態(tài)識(shí)別提供基礎(chǔ)。[0046]S202、針對(duì)各個(gè)模態(tài)中每個(gè)模態(tài)，對(duì)該模態(tài)下的輸入數(shù)據(jù)進(jìn)行特征提取，得到該模態(tài)下的特征表示。[0047]不同模態(tài)對(duì)應(yīng)有特征提取方法。針對(duì)不同模態(tài)下的輸入數(shù)據(jù)，可以采用與之相應(yīng)在一些情緒狀態(tài)中，某些聲學(xué)特征的表現(xiàn)會(huì)比較突出。例如，在憤怒情緒表達(dá)中，基頻的標(biāo)準(zhǔn)差會(huì)顯著增大(超過(guò)40Hz)。因此，針對(duì)語(yǔ)音信號(hào)，可以提取多維MFCC(梅爾頻率倒譜系數(shù))、基頻(FO)以及語(yǔ)速(音節(jié)/秒),作為聲學(xué)特征，以獲得語(yǔ)音模態(tài)下的特征表示。為了同時(shí)兼顧特征表達(dá)的準(zhǔn)確度和特征提取效率，可以選取13維MFCC。[0048]針對(duì)文本數(shù)據(jù)，可以通過(guò)預(yù)訓(xùn)練的自然語(yǔ)言處理模型，如RoBERTa模型提取文本的情感傾向，并基于NRC情感詞典構(gòu)建情感詞匯密度圖，以獲得文本模態(tài)下的特征表示。例如，該些詞匯將被識(shí)別并計(jì)入負(fù)面情感詞匯的統(tǒng)計(jì)當(dāng)中。針對(duì)面部視頻數(shù)據(jù)，可以通過(guò)輕量化的面部檢測(cè)模型(FaceMesh模型)實(shí)時(shí)檢測(cè)多表明存在顯著的積極表情特征。[0049]針對(duì)心率數(shù)據(jù)，可以從中提取平均心率、心率變異性(HRV)等關(guān)鍵指標(biāo)，作為反映用戶生理狀態(tài)的心率特征。該些特征能夠體現(xiàn)用戶的情緒波動(dòng)。例如，當(dāng)檢測(cè)到用戶平均心率升高且心率變異性降低時(shí)，可能表明其正處于緊張或焦慮的情緒狀態(tài)。通過(guò)該種方式，可以獲得生理模態(tài)下的情緒相關(guān)特征，從而增強(qiáng)情緒識(shí)別的全面性與準(zhǔn)確性。[0051]繼續(xù)參閱圖3,在獲取了各個(gè)模態(tài)的特征表示之后，可以通過(guò)注意力機(jī)制對(duì)其融合，生成一綜合性的特征表示。具體而言，通過(guò)將各個(gè)模態(tài)的特征表示輸入各自對(duì)應(yīng)的線性層進(jìn)行初步處理，從而將不同模態(tài)的特征表示轉(zhuǎn)換到一個(gè)共同的隱藏維度空間，以便后續(xù)[0052]接下來(lái)，將初步處理后的各模態(tài)特征表示拼接在一起，得到一新的組合特征。該組合特征進(jìn)一步會(huì)被輸入融合層，以利用激活函數(shù)增強(qiáng)其表達(dá)能力，生成融合后的特征表示。[0053]為了進(jìn)一步優(yōu)化上述融合過(guò)程，可以通過(guò)注意力機(jī)制計(jì)算各個(gè)模態(tài)下的特征表示的權(quán)重。具體可以通過(guò)注意力層來(lái)實(shí)現(xiàn)，該注意力層能夠根據(jù)當(dāng)前輸入動(dòng)態(tài)地評(píng)估各個(gè)特9征表示的貢獻(xiàn)程度。[0054]最后，基于計(jì)算出的權(quán)重，對(duì)各個(gè)模態(tài)下的特征表示進(jìn)行加權(quán)求和，得到最終的綜合特征，確保對(duì)于理解用戶情緒狀態(tài)最為關(guān)鍵的特征表示能夠在最終結(jié)果中占據(jù)更重要的位置。[0055]S204、根據(jù)綜合特征，識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)。[0056]繼續(xù)參閱圖3,在一些實(shí)施例中，可以通過(guò)情緒識(shí)別模型基于前述得到的綜合特征，對(duì)用戶在語(yǔ)音輸入過(guò)程中所表達(dá)的情緒狀態(tài)進(jìn)行識(shí)別。該模型能夠結(jié)合語(yǔ)音、文本、面部表情和生理信號(hào)等多模態(tài)信息，進(jìn)行精準(zhǔn)地情緒分析。[0057]情緒識(shí)別模型可以采用混合神經(jīng)網(wǎng)絡(luò)模型，例如將卷積神經(jīng)網(wǎng)絡(luò)(CNN)與循環(huán)神理。[0058]在情緒分類方面，該模型不僅支持7種基礎(chǔ)情緒的識(shí)別，包括：快樂(lè)、悲傷、憤怒、恐懼、驚訝、厭惡和中性，還擴(kuò)展了20種復(fù)合情緒類別，如失望、焦慮、沮喪、興奮、期待、諷刺等，從而實(shí)現(xiàn)更加細(xì)粒度和貼近真實(shí)情緒表達(dá)的分類效果。[0059]模型最終輸出的為帶有置信度的情緒狀態(tài)標(biāo)簽，表示當(dāng)前語(yǔ)音輸入最可能對(duì)應(yīng)的情緒類型及其強(qiáng)度分布。例如，當(dāng)用戶輸入語(yǔ)音：“我簡(jiǎn)直無(wú)法忍受這種設(shè)計(jì)了!”,模型會(huì)綜合分析語(yǔ)音中的語(yǔ)調(diào)變化、關(guān)鍵詞語(yǔ)義、面部微表情以及心率波動(dòng)等信息，輸出如下情緒識(shí)別結(jié)果：憤怒(主情緒，置信度72%);厭惡(次情緒，置信度25%);失望(次情緒，置信度3%)。[0060]這表明，用戶當(dāng)前的情緒主要表現(xiàn)為憤怒，同時(shí)伴隨一定程度的厭惡感和輕微的失望情緒。通過(guò)這種細(xì)粒度的情緒識(shí)別機(jī)制，可以更準(zhǔn)確地理解用戶的實(shí)際心理狀態(tài)，為后續(xù)的人機(jī)交互提供更具個(gè)性化的反饋與響應(yīng)策略。例如，根據(jù)識(shí)別到的情緒動(dòng)態(tài)調(diào)整語(yǔ)音輸入界面的顏色、動(dòng)畫風(fēng)格或提示語(yǔ)內(nèi)容，從而提升用戶體驗(yàn)的情感共鳴。[0061]情緒識(shí)別模型在訓(xùn)練時(shí)，可以采用兩階段訓(xùn)練策略來(lái)提高其準(zhǔn)確性和泛化能力。首先，在廣泛使用的情緒識(shí)別數(shù)據(jù)集IEMOCAP上進(jìn)行預(yù)訓(xùn)練，幫助模型學(xué)習(xí)到基礎(chǔ)的情緒特征和模式。接著，在特定應(yīng)用場(chǎng)景下的自有數(shù)據(jù)集上進(jìn)行微調(diào)，使其更好地適應(yīng)實(shí)際應(yīng)用中的具體需求和特點(diǎn)。[0062]為了進(jìn)一步提升訓(xùn)練效果和模型的魯棒性，還可以對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)處理。[0063]在實(shí)時(shí)推理優(yōu)化方面，可以采用靜態(tài)量化技術(shù)將模型權(quán)重轉(zhuǎn)換為INT8精度，以減少計(jì)算延遲。這樣，不僅能夠保持高識(shí)別精度，還能確保系統(tǒng)響應(yīng)時(shí)間低于30毫秒(ms),從而提升用戶體驗(yàn)，尤其是在需要快速反饋的應(yīng)用場(chǎng)景中。另外，還能夠使得該模型在資源受限的設(shè)備上也能流暢運(yùn)行，拓展其應(yīng)用范圍。[0064]繼續(xù)參閱圖1,本實(shí)施例的語(yǔ)音輸入的處理方法在步驟S101之后，還可以包括步驟[0065]S102、基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系，確定與用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果。[0066]其中，目標(biāo)視覺(jué)展示效果用于以可視化方式直觀呈現(xiàn)用戶的情緒狀態(tài)，從而增強(qiáng)語(yǔ)音輸入過(guò)程中的情感表達(dá)與交互體驗(yàn)。[0067]每種視覺(jué)展示效果對(duì)應(yīng)一組可調(diào)節(jié)的可視化參數(shù)。該些參數(shù)包括HSL顏色空間的色彩參數(shù)、語(yǔ)音波形中粒子運(yùn)動(dòng)的速度、語(yǔ)音輸入界面的形變程度和動(dòng)態(tài)紋理的表現(xiàn)形式中至少一項(xiàng)。通過(guò)組合并動(dòng)態(tài)地調(diào)整該些視覺(jué)元素，可以實(shí)現(xiàn)豐富且多樣化的情緒反饋效果。其中，HSL為一種將顏色表示為色相、飽和度和亮度的模型。色相(H)為顏色的基本屬性，表示顏色的種類，如紅色、綠色、藍(lán)色等；飽和度(S)表示顏色的純度，飽和度越高，顏色越鮮艷；亮度(L)則控制顏色的明暗程度。通過(guò)調(diào)整色相、飽和度和亮度可以改變視覺(jué)元素的色彩氛圍。[0068]為了實(shí)現(xiàn)視覺(jué)展示效果與用戶情緒狀態(tài)之間的智能匹配，可以預(yù)先構(gòu)建情緒狀態(tài)與視覺(jué)參數(shù)之間的映射規(guī)則表。該映射規(guī)則表當(dāng)中包括多種情緒狀態(tài)及其對(duì)應(yīng)的可視化配置參數(shù)，使得可以根據(jù)識(shí)別出的情緒狀態(tài)自動(dòng)調(diào)用相應(yīng)的視覺(jué)風(fēng)格進(jìn)行實(shí)時(shí)反饋。以下為部分情緒狀態(tài)的示例配置，如表1所示：表1映射規(guī)則表情緒類型粒子速度界面形變喜悅快(8Hz)星光閃爍憤怒劇烈(12Hz)火焰波紋悲傷慢(2Hz)收縮-15%雨滴下落當(dāng)識(shí)別到用戶處于“喜悅”情緒時(shí)，語(yǔ)音輸入界面可以采用明亮的黃綠色調(diào)(HSL值為(60,90%,80%)),語(yǔ)音波形中的粒子快速跳動(dòng)、界面適度放大，并配合星光閃爍的動(dòng)態(tài)紋理，營(yíng)造出輕松愉快的氛圍。[0069]若檢測(cè)到“憤怒”情緒，則界面會(huì)切換為紅色調(diào)(HSL值為(0,85%,50%)),語(yǔ)音波形中的粒子高頻抖動(dòng)，界面邊緣銳化處理，并疊加火焰波紋特效，強(qiáng)化激烈情緒的視覺(jué)傳達(dá)。例如，在憤怒情緒狀態(tài)下，目標(biāo)視覺(jué)展示效果可以設(shè)置為：紅色占比80%,界面邊緣的鋸齒度為5Px,粒子速度為12Hz。[0070]對(duì)于“悲傷”情緒，則可以采用冷色調(diào)藍(lán)色(HSL值為(240,40%,30%)),語(yǔ)音波形中的粒子緩慢跳動(dòng)，界面收縮顯示，輔以雨滴下落的動(dòng)畫紋理，傳遞出低落、沉靜的情緒感受。[0071]當(dāng)用戶情緒為“激動(dòng)/興奮”時(shí)，語(yǔ)音波形將快速跳動(dòng)且顏色鮮艷，以表達(dá)用戶的高漲情緒。波形的頻率加快，并采用明亮而飽和的色彩(如HSL值中的高亮度和飽和度設(shè)置),營(yíng)造出充滿活力與激情的視覺(jué)效果。[0072]當(dāng)檢測(cè)到用戶存在持續(xù)3秒的焦慮情緒時(shí)，則界面背景漸變?yōu)樯钏{(lán)色波紋、語(yǔ)音輸入框的邊緣出現(xiàn)呼吸燈效果、以及自動(dòng)彈出冥想引導(dǎo)動(dòng)畫。[0073]相反，當(dāng)用戶情緒為“平靜”時(shí)，語(yǔ)音波形則表現(xiàn)為平穩(wěn)流暢、色調(diào)柔和的特點(diǎn)。此時(shí)，可以選擇較為溫和的色彩配置(如較低的飽和度和中等亮度的HSL值),并減少波形的動(dòng)態(tài)變化，呈現(xiàn)出一種寧?kù)o和諧的視覺(jué)感受，以反映用戶的平和心境。例如，在“平靜”等中性11情緒狀態(tài)下，目標(biāo)視覺(jué)展示效果可以設(shè)置為：藍(lán)色占比50%,界面[0074]通過(guò)基于情緒識(shí)別的動(dòng)態(tài)視覺(jué)反饋機(jī)制，能夠?qū)崿F(xiàn)根據(jù)用戶的不同情緒狀態(tài)，靈活調(diào)整語(yǔ)音輸入界面的視覺(jué)展示效果，從而提供更加貼合用戶情感體驗(yàn)的交互環(huán)境。[0075]在識(shí)別出用戶的情緒狀態(tài)之后，可以根據(jù)上述預(yù)先構(gòu)建的映射規(guī)則表進(jìn)行查表，從而獲得能夠可視化反映用戶當(dāng)前情緒狀態(tài)的界面效果。[0076]需要說(shuō)明的是，每種情緒狀態(tài)可以對(duì)應(yīng)至少一種動(dòng)態(tài)紋理效果，用戶可以挑選其中一種作為該種情緒狀態(tài)下將展示的動(dòng)態(tài)紋理效果。[0077]S103、在語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中，呈現(xiàn)目標(biāo)視覺(jué)展示效果。[0078]在獲取與用戶當(dāng)前情緒狀態(tài)相匹配的各項(xiàng)視覺(jué)元素之后，便可以基于該些視覺(jué)元素進(jìn)行界面渲染，以在語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中呈現(xiàn)出目標(biāo)視覺(jué)展示效果。[0079]本實(shí)施例通過(guò)在識(shí)別出用戶在語(yǔ)音輸入過(guò)程中的情緒狀態(tài)之后，基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系，確定與用戶當(dāng)前情緒狀態(tài)相匹配的目標(biāo)視覺(jué)展示效果，并將其呈現(xiàn)在用戶的語(yǔ)音輸入界面中，以直觀地反映用戶當(dāng)前的情緒狀態(tài)，為語(yǔ)音輸入的視覺(jué)反饋機(jī)制提供豐富多樣的表現(xiàn)形式。由于視覺(jué)展示效果可以隨著用戶情緒狀態(tài)的變化而動(dòng)態(tài)調(diào)整，因此，可以提升視覺(jué)展示的靈活度，確保用戶體驗(yàn)的多樣[0080]為了確保視覺(jué)變化能夠平滑過(guò)渡，避免因突然變化給用戶帶來(lái)的不適感，本實(shí)施例中還可以采用動(dòng)態(tài)過(guò)渡方案。[0081]具體而言，在步驟S103中，當(dāng)需要從當(dāng)前視覺(jué)展示效果切換至新的視覺(jué)展示效果時(shí)，可以采用漸變技術(shù)實(shí)現(xiàn)平滑過(guò)渡。即步驟S103具體包括：調(diào)整語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至目標(biāo)視覺(jué)展示效果。飽和度和亮度，加快波形中粒子的速度，并逐步增強(qiáng)界面的動(dòng)態(tài)效果，直至完全達(dá)到與“激動(dòng)/興奮”情緒相對(duì)應(yīng)的目標(biāo)視覺(jué)展示效果。在一些實(shí)現(xiàn)方式中，在目標(biāo)視覺(jué)展示效果包括目標(biāo)色彩參數(shù)的情況下，則調(diào)整語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至目標(biāo)視覺(jué)展示效果，包括：調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至目標(biāo)色彩參數(shù)。[0084]在一些實(shí)現(xiàn)方式中，在目標(biāo)視覺(jué)展示效果包括語(yǔ)音輸入界面的目標(biāo)形變參數(shù)的情況下，則調(diào)整語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至目標(biāo)視覺(jué)展示效果，包括：調(diào)整語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至目標(biāo)形變參數(shù)。[0085]在一些實(shí)現(xiàn)方式中，在目標(biāo)視覺(jué)展示效果包括目標(biāo)色彩參數(shù)和語(yǔ)音輸入界面的目標(biāo)形變參數(shù)的情況下，則調(diào)整語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至目標(biāo)視覺(jué)展示效果，包括：調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至目標(biāo)色彩參數(shù)，并調(diào)整語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至目標(biāo)形變參數(shù)。[0086]在色彩參數(shù)的調(diào)整過(guò)程中，通過(guò)調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)，使其逐漸過(guò)渡到目標(biāo)色彩參數(shù)，可以確保顏色變換過(guò)程平滑自然。[0087]在界面形變參數(shù)的調(diào)整過(guò)程中，通過(guò)根據(jù)預(yù)定義的目標(biāo)形變參數(shù)來(lái)調(diào)整當(dāng)前的界面布局或元素形狀，例如，通過(guò)精確控制每個(gè)界面元素的位置、大小和角度等屬性的變化速率與路徑，以確保整個(gè)過(guò)渡過(guò)程流暢且自然，從而實(shí)現(xiàn)視覺(jué)上的動(dòng)態(tài)變化。其中，形變可以包括縮放、旋轉(zhuǎn)以及變形動(dòng)畫。變形動(dòng)畫包括將矩形按鈕變?yōu)閳A形圖標(biāo)。[0088]在一些復(fù)雜場(chǎng)景中，還可以同時(shí)對(duì)色彩和形變進(jìn)行調(diào)整。這需要同時(shí)處理顏色平滑過(guò)渡，以及同步處理界面形狀的變化。例如，在一個(gè)語(yǔ)音輸入界面從方形變?yōu)閳A形的同時(shí)，背景顏色也由淺藍(lán)轉(zhuǎn)變?yōu)樯钏{(lán)。下面將詳細(xì)介紹色彩參數(shù)和形變參數(shù)各自的漸變調(diào)整在一些實(shí)現(xiàn)方式中，調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至目標(biāo)色彩參數(shù)時(shí)，可以確定一系列中間色彩值，并按照設(shè)定的速度逐步應(yīng)用該些色彩值，直至達(dá)到最終的目標(biāo)色彩，以實(shí)現(xiàn)自然過(guò)渡效果。具體包括如下步驟a1和步驟a2:步驟a1、確定色彩參數(shù)的調(diào)整步長(zhǎng)值。[0089]其中，色彩參數(shù)包括色相參數(shù)和/或飽和度參數(shù)；則步驟a1確定色彩參數(shù)的調(diào)整步長(zhǎng)值，包括：基于語(yǔ)音輸入界面的當(dāng)前色相參數(shù)與目標(biāo)色相參數(shù)之間的色相參數(shù)差值，以及預(yù)設(shè)調(diào)整比例的乘積，確定色相參數(shù)的調(diào)整步長(zhǎng)值；和/或，基于預(yù)設(shè)的飽和度調(diào)整值，確定飽和度參數(shù)的調(diào)整步長(zhǎng)值。[0090]其中，色相參數(shù)的調(diào)整步長(zhǎng)值為實(shí)現(xiàn)色彩漸變過(guò)程的關(guān)鍵。通過(guò)合理設(shè)置每一步的調(diào)整幅度，即調(diào)整步長(zhǎng)，可以控制色相參數(shù)從當(dāng)前狀態(tài)像目標(biāo)狀態(tài)變化的速度和流暢度。[0091]假設(shè)當(dāng)前色相參數(shù)為Hcurrent,目標(biāo)色相參數(shù)為Harge,預(yù)設(shè)調(diào)整比例為RH,取值為0到1之間，例如0.15。則首先計(jì)算色相參數(shù)差值△H=I。接下來(lái)計(jì)算調(diào)整步長(zhǎng)值[0092]針對(duì)飽和度參數(shù)，可以對(duì)其設(shè)置固定的調(diào)整值，取值范圍為[0.1,0.5],例如0.1、[0093]步驟a2、基于色彩參數(shù)的調(diào)整步長(zhǎng)值，調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至目標(biāo)色彩參數(shù)。[0094]通過(guò)色彩參數(shù)的調(diào)整步長(zhǎng)值，逐步調(diào)整語(yǔ)音輸入界面當(dāng)前的色彩參數(shù)，使其平滑過(guò)渡至目標(biāo)色彩參數(shù)。例如，如果目標(biāo)是從較暗的藍(lán)色(HSL值為(240、40%、30%))漸變至明亮的天藍(lán)色(HSL值為(180、80%、90%)),則通過(guò)分別計(jì)算出色相參數(shù)、飽和度和亮度各自的調(diào)整步長(zhǎng)值，并按照該調(diào)整步長(zhǎng)值逐步調(diào)整，從而確保色彩轉(zhuǎn)換過(guò)程中的視覺(jué)平滑性。[0095]如圖4所示，針對(duì)色相參數(shù)，則是在當(dāng)前已調(diào)整色相參數(shù)的基礎(chǔ)上，每次增加△H*R,直至達(dá)到目標(biāo)色相參數(shù)。[0096]在一些實(shí)現(xiàn)方式中，調(diào)整語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至目標(biāo)形變參數(shù)，包括如下步驟b1和步驟b2:步驟b1、基于當(dāng)前形變參數(shù)與目標(biāo)形變參數(shù)各自對(duì)應(yīng)的權(quán)重，對(duì)當(dāng)前形變參數(shù)與目標(biāo)形變參數(shù)進(jìn)行加權(quán)求和，并將加權(quán)求和結(jié)果確定為形變參數(shù)的調(diào)整步長(zhǎng)值。[0097]在界面形態(tài)隨用戶情緒動(dòng)態(tài)變化的過(guò)程中，為了實(shí)現(xiàn)從當(dāng)前形變狀態(tài)平滑過(guò)渡到目標(biāo)形變狀態(tài)，可以根據(jù)當(dāng)前形變參數(shù)(如界面縮放比例、控件變形程度等)與目標(biāo)形變參數(shù)之間的差異，并結(jié)合各自設(shè)定的權(quán)重比例，計(jì)算用于控制漸變節(jié)奏的步長(zhǎng)值。其中，當(dāng)前形變參數(shù)與目標(biāo)形變參數(shù)各自對(duì)應(yīng)的權(quán)重，可以根據(jù)用戶需求進(jìn)行設(shè)置，具體如下：在一些示例中，可以根據(jù)即時(shí)反饋需求設(shè)置權(quán)重。例如，如果用戶希望在檢測(cè)到情緒發(fā)生變化時(shí)迅速調(diào)整界面形態(tài)以得到即時(shí)反饋。則目標(biāo)形變參數(shù)的權(quán)重應(yīng)設(shè)置較高(例如0.8),而當(dāng)前形變參數(shù)的權(quán)重相對(duì)較低(如0.2)。如此，可以使新的界面形態(tài)盡快呈現(xiàn)出[0098]在另一些示例中，還可以根據(jù)用戶對(duì)過(guò)渡效果的需求設(shè)置權(quán)重。例如，如果用戶希望在情緒變化時(shí)感受到平滑自然的界面轉(zhuǎn)換，則可以采用更均衡的權(quán)重分配。例如，初始階段為當(dāng)前形變參數(shù)設(shè)置較高的權(quán)重(如0.7),而目標(biāo)形變參數(shù)的權(quán)重稍低(如0.3),之后隨著過(guò)渡過(guò)程逐漸降低前者并增加后者，直到完全過(guò)渡為目標(biāo)形變參數(shù)，給予用戶更多時(shí)間適應(yīng)新?tīng)顟B(tài)。[0099]在又一些示例中，還可以根據(jù)用戶對(duì)情感表現(xiàn)力的需求來(lái)設(shè)置權(quán)重。例如，如果用的權(quán)重設(shè)為最大值(如1),忽略當(dāng)前形變參數(shù)的影響，從而實(shí)現(xiàn)快速且強(qiáng)烈的變化。相反，對(duì)于一些較為細(xì)膩的情緒(如“平靜”),則可以適當(dāng)降低目標(biāo)形變參數(shù)的權(quán)重，使得過(guò)渡更加緩慢和諧。[0100]在又一些示例中，還可以根據(jù)用戶的個(gè)性化需求來(lái)設(shè)置權(quán)重。具體地，可以根據(jù)不同用戶的偏好或歷史數(shù)據(jù)來(lái)自定義權(quán)重。例如，某些用戶可能偏好快速直接的情感反饋，此時(shí)可以為該類用戶配置更高的目標(biāo)形變參數(shù)權(quán)重；而對(duì)于喜歡溫和變化的用戶，則采用更[0101]步驟b2、基于形變參數(shù)的調(diào)整步長(zhǎng)值，調(diào)整語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至目標(biāo)形變參數(shù)。[0102]基于在步驟b1中計(jì)算得到的形變參數(shù)調(diào)整步長(zhǎng)值，逐步對(duì)語(yǔ)音輸入界面當(dāng)前的形變參數(shù)進(jìn)行迭代更新，使其從當(dāng)前狀態(tài)平滑過(guò)渡至目標(biāo)形變參數(shù)。具體而言，在每一次更新周期中，根據(jù)設(shè)定的步長(zhǎng)值對(duì)當(dāng)前形變參數(shù)進(jìn)行微調(diào)，例如增加或減少一定的縮放比例、彎[0103]如圖5所示，以界面縮放為例，若當(dāng)前界面處于正常大小(縮放比例為1.0),而目標(biāo)是根據(jù)用戶情緒識(shí)別結(jié)果放大至1.2倍，則在每一幀或固定時(shí)間間隔中，按照計(jì)算出的步長(zhǎng)[0104]此外，還可以結(jié)合緩動(dòng)函數(shù)(如線性插值、緩入緩出函數(shù))來(lái)進(jìn)一步優(yōu)化過(guò)渡曲線，使界面變化更加自然流暢。[0105]本實(shí)施例通過(guò)調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至目標(biāo)色彩參數(shù)，和/或調(diào)整語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至目標(biāo)形變參數(shù)，不僅可以提升界面響應(yīng)情緒識(shí)別結(jié)果的準(zhǔn)確性，也可以增強(qiáng)用戶交互時(shí)的沉浸感和情感共鳴體驗(yàn)。相較于直接切換到新的視覺(jué)設(shè)置而言，通過(guò)逐步調(diào)整當(dāng)前界面的視覺(jué)參數(shù)(如色彩、粒子速度、界面形變和動(dòng)態(tài)紋理等),使其逐漸接近目標(biāo)視覺(jué)效果。不僅能夠保證視覺(jué)轉(zhuǎn)換過(guò)程中的連貫性和流暢性，還可以提升用戶體驗(yàn)的整體舒適度和沉浸感。即使是在情緒快速變化的情況下，也能讓用戶感受到自然和諧的視覺(jué)體驗(yàn)，增強(qiáng)了人機(jī)交互的情感共鳴。無(wú)論是情緒的微妙變化還是顯著波動(dòng)，都能在界面設(shè)計(jì)上得到細(xì)膩且恰當(dāng)?shù)谋憩F(xiàn)。[0106]為了確保提供低延遲的可視化渲染效果，從而在短時(shí)間內(nèi)完成從語(yǔ)音輸入到可視化反饋的全過(guò)程，在目標(biāo)視覺(jué)展示效果包括目標(biāo)粒子速度時(shí)，則調(diào)整語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至目標(biāo)視覺(jué)展示效果，還包括：基于顯示設(shè)備的性能參數(shù)，確定預(yù)加載的粒子的目標(biāo)數(shù)量；通過(guò)WebGPU并行計(jì)算框架，預(yù)加載目標(biāo)數(shù)量的粒子，并基于目標(biāo)粒子速度，渲染目標(biāo)視覺(jué)展示效果。[0108]其中，基于顯示設(shè)備的性能參數(shù)，確定預(yù)加載的粒子的目標(biāo)數(shù)量，包括：基于顯示設(shè)備的性能參數(shù)與預(yù)加載的粒子數(shù)量之間的映射關(guān)系，確定與顯示設(shè)備相匹配的預(yù)加載粒子數(shù)量。[0109]在一些示例中，顯示設(shè)備的性能參數(shù)與預(yù)加載的粒子數(shù)量之間的映射關(guān)系，可以是一對(duì)一的關(guān)系。例如，不同的性能參數(shù)對(duì)應(yīng)不同的預(yù)加載粒子數(shù)量，并且每個(gè)性能參數(shù)對(duì)應(yīng)的預(yù)加載粒子數(shù)量不同。[0110]在一些示例中，顯示設(shè)備的性能參數(shù)與預(yù)加載的粒子數(shù)量之間的映射關(guān)系，也可以是多對(duì)一的關(guān)系。例如，可以將性能參數(shù)劃分為多個(gè)區(qū)間范圍，并對(duì)每個(gè)區(qū)間范圍設(shè)置相應(yīng)的預(yù)加載粒子數(shù)量。[0111]例如，可以將性能參數(shù)劃分為第一性能參數(shù)區(qū)間范圍、第二性能參數(shù)區(qū)間范圍和第三性能參數(shù)區(qū)間范圍；并且第一性能參數(shù)區(qū)間范圍對(duì)應(yīng)高端設(shè)備，第二性能參數(shù)區(qū)間范圍對(duì)應(yīng)中端設(shè)備，第三性能參數(shù)區(qū)間范圍對(duì)應(yīng)低端設(shè)備；高端設(shè)備、中端設(shè)備、低端設(shè)備對(duì)[0112]本實(shí)施例通過(guò)根據(jù)顯示設(shè)備的實(shí)際性能自動(dòng)調(diào)整粒子的數(shù)量，確保在各種硬件條件下都能實(shí)現(xiàn)最佳的可視化渲染效果，同時(shí)保持低延遲和高響應(yīng)速度。[0113]為了使視覺(jué)展示效果更加貼近用戶的實(shí)際偏好，在一些實(shí)施例中，可以收集用戶對(duì)目標(biāo)視覺(jué)展示效果的反饋數(shù)據(jù)，并基于該反饋數(shù)據(jù)對(duì)上述映射關(guān)系進(jìn)行更新。[0114]其中，反饋數(shù)據(jù)中包括用戶對(duì)目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù)；基于反饋數(shù)據(jù)，對(duì)映射關(guān)系進(jìn)行更新，包括：基于用戶對(duì)目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù)，更新映射關(guān)[0115]其中，交互行為數(shù)據(jù)包括手動(dòng)調(diào)整語(yǔ)音輸入界面的尺寸(如縮小、放大等)、頻繁切換動(dòng)態(tài)紋理效果、目標(biāo)視覺(jué)展示效果的使用時(shí)長(zhǎng)等。[0116]在將目標(biāo)視覺(jué)展示效果呈現(xiàn)給用戶之后，如果用戶對(duì)某一情緒狀態(tài)下的視覺(jué)展示效果不滿意，可以手動(dòng)調(diào)整該情緒狀態(tài)下的視覺(jué)展示效果。通過(guò)記錄用戶的該些交互行為數(shù)據(jù)，可以進(jìn)一步優(yōu)化上述映射關(guān)系，使其更加符合用戶的個(gè)人偏好。[0117]本申請(qǐng)的實(shí)施例中，在特征提取部分耗時(shí)25ms,情緒分類推理部分耗時(shí)35ms,可視化渲染部分耗時(shí)40ms,整體耗時(shí)小于或等于100ms。如此，能夠確保為用戶提供即時(shí)響應(yīng)，提供流暢無(wú)縫的交互體驗(yàn)。無(wú)論是在實(shí)時(shí)語(yǔ)音情感分析的應(yīng)用場(chǎng)景下，還是在需要迅速反饋的互動(dòng)式媒體環(huán)境中，對(duì)于提升用戶體驗(yàn)至關(guān)重要。[0118]示例性裝置與上述的語(yǔ)音輸入的處理方法對(duì)應(yīng)的，本申請(qǐng)實(shí)施例還提供了一種語(yǔ)音輸入的處理裝置。圖6是本申請(qǐng)實(shí)施例提供的一種語(yǔ)音輸入的處理裝置的結(jié)構(gòu)示意圖。如圖6所示，本申請(qǐng)實(shí)施例提供的語(yǔ)音輸入的處理裝置包括：識(shí)別單元601、確定單元602和呈現(xiàn)單元603;其中，識(shí)別單元601,識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)；確定單元602,用于基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系，確定與所述用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果，所述目標(biāo)視覺(jué)展示效果用于可視化地展示所述用戶的情緒狀態(tài)；呈現(xiàn)單元603,用于在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中，呈現(xiàn)所述目標(biāo)視覺(jué)展示效果。[0119]在一些實(shí)施例中，所述視覺(jué)展示效果包括HSL顏色空間的色彩參數(shù)、所述語(yǔ)音信號(hào)的波形中包含的粒子的速度、所述語(yǔ)音輸入界面的形變參數(shù)和動(dòng)態(tài)紋理參數(shù)中至少一項(xiàng)。[0120]在一些實(shí)施例中，呈現(xiàn)單元603在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中，呈現(xiàn)所述目標(biāo)視覺(jué)展示效果，包括：調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至所述目標(biāo)視覺(jué)展示效果。[0121]在一些實(shí)施例中，在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)色彩參數(shù)和/或所述語(yǔ)音輸入界面的目標(biāo)形變參數(shù)的情況下；其中，所述呈現(xiàn)單元603調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至所述目標(biāo)視覺(jué)展示效果，包括：調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù)；和/或，調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。[0122]在一些實(shí)施例中，所述呈現(xiàn)單元603調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù)，包括：確定所述色彩參數(shù)的調(diào)整步長(zhǎng)值；基于所述色彩參數(shù)的調(diào)整步長(zhǎng)值，調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù)。[0123]在一些實(shí)施例中，所述色彩參數(shù)包括色相參數(shù)和/或飽和度參數(shù)；其中，所述呈現(xiàn)單元603確定所述色彩參數(shù)的調(diào)整步長(zhǎng)值，包括：基于所述語(yǔ)音輸入界面的當(dāng)前色相參數(shù)與目標(biāo)色相參數(shù)之間的色相參數(shù)差值，以及預(yù)設(shè)調(diào)整比例的乘積，確定所述色相參數(shù)的調(diào)整[0124]在一些實(shí)施例中，所述呈現(xiàn)單元603調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)，包括：基于所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)各自對(duì)應(yīng)的權(quán)重，對(duì)所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)進(jìn)行加權(quán)求和，并將加權(quán)求和結(jié)果確定為所述形變參數(shù)的調(diào)整步長(zhǎng)值；基于所述形變參數(shù)的調(diào)整步長(zhǎng)值，調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。[0125]在一些實(shí)施例中，在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)粒子速度時(shí)，所述呈現(xiàn)單元603調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果，使其漸變至所述目標(biāo)視覺(jué)展示效果，還包括：基于顯示設(shè)備的性能參數(shù)，確定預(yù)加載的粒子的目標(biāo)數(shù)量；通過(guò)We預(yù)加載所述目標(biāo)數(shù)量的粒子，并基于所述目標(biāo)粒子速度，渲染所述目標(biāo)視覺(jué)展示效果。[0126]在一些實(shí)施例中，所述識(shí)別單元601識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)，包括：獲取各個(gè)模態(tài)下的輸入數(shù)據(jù)，所述各個(gè)模態(tài)下的輸入數(shù)據(jù)包括所述語(yǔ)音信號(hào)、所述語(yǔ)音信號(hào)對(duì)應(yīng)的文本數(shù)據(jù)、所述用戶輸入所述語(yǔ)音信號(hào)時(shí)的視頻數(shù)據(jù)和心率數(shù)據(jù)中至少一項(xiàng)；針對(duì)所述各個(gè)模態(tài)中每個(gè)模態(tài)，對(duì)該模態(tài)下的輸入數(shù)據(jù)進(jìn)行特征提取，得到該模態(tài)下的特征表示；基于所述各個(gè)模態(tài)下的特征表示，得到綜合特征；根據(jù)所述綜合特征，識(shí)別所述用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)。[0127]在一些實(shí)施例中，所述裝置還包括：更新單元604,用于獲取所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的反饋數(shù)據(jù)；基于所述反饋數(shù)據(jù)，對(duì)所述映射關(guān)系進(jìn)行更新。[0128]在一些實(shí)施例中，所述反饋數(shù)據(jù)中包括所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù)；其中，所述更新單元604基于所述反饋數(shù)據(jù)，對(duì)所于所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù)，更新所述映射關(guān)系，以使所述映射關(guān)系符合所述用戶的偏好。[0129]本實(shí)施例提供的語(yǔ)音輸入的處理裝置，與本申請(qǐng)上述實(shí)施例所提供的語(yǔ)音輸入的處理方法屬于同一申請(qǐng)構(gòu)思，可執(zhí)行本申請(qǐng)上述任意實(shí)施例所提供的語(yǔ)音輸入的處理方法，具備執(zhí)行語(yǔ)音輸入的處理方法相應(yīng)的功能模塊和有益效果。未在本實(shí)施例中詳盡描述的技術(shù)細(xì)節(jié)，可參見(jiàn)本申請(qǐng)上述實(shí)施例提供的語(yǔ)音輸入的處理方法的具體處理內(nèi)容，此處不再加以贅述。[0130]以上的識(shí)別單元601、確定單元602、呈現(xiàn)單元603和更新單元604所實(shí)現(xiàn)的功能可以分別由相同或不同的處理器實(shí)現(xiàn)，本申請(qǐng)實(shí)施例不作限定。[0131]應(yīng)理解以上裝置中的單元可以以處理器調(diào)用軟件的形式實(shí)現(xiàn)。例如該裝置包括處理器，處理器與存儲(chǔ)器連接，存儲(chǔ)器中存儲(chǔ)有指令，處理器調(diào)用存儲(chǔ)器中存儲(chǔ)的指令，以實(shí)現(xiàn)以上任一種方法或?qū)崿F(xiàn)該裝置各單元的功能，其中處理器可以為通用處理器，例如CPU或微處理器等，存儲(chǔ)器可以為裝置內(nèi)的存儲(chǔ)器或裝置外的存儲(chǔ)器?；蛘撸b置中的單元可以以硬件電路的形式實(shí)現(xiàn)，可以通過(guò)對(duì)硬件電路的設(shè)計(jì)，實(shí)現(xiàn)部分或全部單元的功能，該硬件電路可以理解為一個(gè)或多個(gè)處理器；例如，在一種實(shí)現(xiàn)中，該硬件電路為ASIC,通過(guò)對(duì)電路內(nèi)元件邏輯關(guān)系的設(shè)計(jì)，實(shí)現(xiàn)以上部分或全部單元的功能；再如，在另一種實(shí)現(xiàn)中，該硬件電路可以通過(guò)PLD實(shí)現(xiàn)，以FPGA為例，其可以包括大量邏輯門電路，通過(guò)配置文件門電路之間的連接關(guān)系，從而實(shí)現(xiàn)以上部分或全部單元的功能。以上裝置的所有單元可以全部通過(guò)處理器調(diào)用軟件的形式實(shí)現(xiàn)，或全部通過(guò)硬件電路的形式實(shí)現(xiàn)，或部分通過(guò)處理器調(diào)用軟件的形式實(shí)現(xiàn)，剩余部分通過(guò)硬件電路的形式實(shí)現(xiàn)。[0132]在本申請(qǐng)實(shí)施例中，處理器是一種具有信號(hào)的處理能力的電路，在一種實(shí)現(xiàn)中，處實(shí)現(xiàn)中，處理器可以通過(guò)硬件電路的邏輯關(guān)系實(shí)現(xiàn)一定功能，該硬件電路的邏輯關(guān)系是固定的或可以重構(gòu)的，例如處理器為ASIC或PLD實(shí)現(xiàn)的硬件電路，例如FPGA等。在可重構(gòu)的硬件電路中，處理器加載配置文檔，實(shí)現(xiàn)硬件電路配置的過(guò)程，可以理解為處理器加載指令，以實(shí)現(xiàn)以上部分或全部單元的功能的過(guò)程。此外，還可以是針對(duì)人工智能設(shè)計(jì)的硬件電路，[0133]可見(jiàn)，以上裝置中的各單元可以是被配置成實(shí)施以上方法的一個(gè)或多個(gè)處理器中至少兩種的組合。[0134]此外，以上裝置中的各單元可以全部或部分可以集成在一起，或者可以獨(dú)立實(shí)現(xiàn)。在一種實(shí)現(xiàn)中，這些單元集成在一起，以SOC的形式實(shí)現(xiàn)。該SOC中可以包括至少一個(gè)處理器，用于實(shí)現(xiàn)以上任一種方法或?qū)崿F(xiàn)該裝置各單元的功能，該至少一個(gè)處理器的種類可以不同，例如包括CPU和FPGA,CPU和人工智能處理器，CPU和GPU等。[0135]示例性電子設(shè)備本申請(qǐng)實(shí)施例提出一種電子設(shè)備，參見(jiàn)圖7所示，該電子設(shè)備包括：存儲(chǔ)器200和處理器210;其中，所述存儲(chǔ)器200與所述處理器210連接，用所述處理器210,用于通過(guò)運(yùn)行所述存儲(chǔ)器200中存儲(chǔ)的程序，實(shí)現(xiàn)上述任一實(shí)施例公開(kāi)的語(yǔ)音輸入的處理方法。[0136]具體的，上述電子設(shè)備還可以包括：總線、通信接口220、輸入設(shè)備230和輸出設(shè)備[0137]處理器210、存儲(chǔ)器200、通信接口220、輸入設(shè)備230和輸出設(shè)備240通過(guò)總線相互總線可包括一通路，在計(jì)算機(jī)系統(tǒng)各個(gè)部件之間傳送信息。[0138]處理器210可以是通用處理器，例如通用中央處理器(CPU)、微處理器等，也可以是特定應(yīng)用集成電路(application-specificintegratedcircuit,ASIC),或一個(gè)或多個(gè)用于控制本發(fā)明方案程序執(zhí)行的集成電路。還可以是數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)成可編程門陣列(FPGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件。[0139]處理器210可包括主處理器，還可包括基帶芯片、調(diào)制解調(diào)器等。[0140]存儲(chǔ)器200中保存有執(zhí)行本發(fā)明技術(shù)方案的程序，還可以保存有操作系統(tǒng)和其他器200可以包括只讀存儲(chǔ)器(read-onlymemory,ROM)、可存儲(chǔ)靜態(tài)信息和指令的其他類型的靜態(tài)存儲(chǔ)設(shè)備、隨機(jī)存取存儲(chǔ)器(randomaccessmemory,RAM)、可存儲(chǔ)信息和指令的其[0141]輸入設(shè)備230可包括接收用戶輸入的數(shù)據(jù)和信息的裝置，例如鍵盤、鼠標(biāo)[0143]通信接口220可包括使用任何收發(fā)器一類的裝置，以便與其他設(shè)備或通信網(wǎng)絡(luò)通[0144]處理器210執(zhí)行存儲(chǔ)器200中所存放的程序，以及調(diào)用其他設(shè)備，可用于實(shí)現(xiàn)本申請(qǐng)上述實(shí)施例所提供的任意一種語(yǔ)音輸入的處理方法的各個(gè)步驟。[0145]本申請(qǐng)實(shí)施例還提出一種芯片，該芯片包括處理器和數(shù)據(jù)接口，所述處理器通過(guò)所述數(shù)據(jù)接口讀取并運(yùn)行存儲(chǔ)器上存儲(chǔ)的程序，以執(zhí)行上述任意實(shí)施例所介紹的語(yǔ)音輸入的處理方法，具體處理過(guò)程及其有益效果可參見(jiàn)上述的語(yǔ)音輸入的處理方法的實(shí)施例介[0146]示例性計(jì)算機(jī)程序產(chǎn)品和存儲(chǔ)介質(zhì)除了上述方法和設(shè)備以外，本申請(qǐng)的實(shí)施例還可以是計(jì)算機(jī)程序產(chǎn)品，其包括計(jì)算機(jī)程序指令，所述計(jì)算機(jī)程序指令在被處理器運(yùn)行時(shí)使得所述處理器執(zhí)行本說(shuō)明書上述任意實(shí)施例中描述的根據(jù)本申請(qǐng)各種實(shí)施例的語(yǔ)音輸入的處理方法中的步驟。[0147]所述計(jì)算機(jī)程序產(chǎn)品可以以一種或多種程序設(shè)計(jì)語(yǔ)言的任意組合來(lái)編寫用于執(zhí)行本申請(qǐng)實(shí)施例操作的程序代碼，所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言，諸如Java、C++等，還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言，諸如“C”語(yǔ)言或類似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶計(jì)算設(shè)備上執(zhí)行、部分地在用戶設(shè)備上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算設(shè)備上部分在遠(yuǎn)程計(jì)算設(shè)備上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算設(shè)備或服務(wù)器上執(zhí)行。[0148]此外，本申請(qǐng)的實(shí)施例還可以是存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，計(jì)算機(jī)程序被處理器執(zhí)行本說(shuō)明書上述任意實(shí)施例中描述的根據(jù)本申請(qǐng)各種實(shí)施例的語(yǔ)音輸入的處理方法中的步驟，具體可以實(shí)現(xiàn)以上方法的步驟。[0149]對(duì)于前述的各方法實(shí)施例，為了簡(jiǎn)單描述，故將其都表述為一系列的動(dòng)作組合，但是本領(lǐng)域技術(shù)人員應(yīng)該知悉，本申請(qǐng)并不受所描述的動(dòng)作順序的限制，因?yàn)橐罁?jù)本申請(qǐng)，某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次，本領(lǐng)域技術(shù)人員也應(yīng)該知悉，說(shuō)

人人文庫(kù)> 全部分類> 行業(yè)資料 > 各類標(biāo)準(zhǔn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品