CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品_第1頁(yè)
CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品_第2頁(yè)
CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品_第3頁(yè)
CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品_第4頁(yè)
CN120220720A 一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(10)申請(qǐng)公布號(hào)CN120220720A(71)申請(qǐng)人科大訊飛股份有限公司地址230088安徽省合肥市高新開(kāi)發(fā)區(qū)望江西路666號(hào)(72)發(fā)明人孫嘉琪趙立鴿(74)專利代理機(jī)構(gòu)北京布瑞知識(shí)產(chǎn)權(quán)代理有限公司11505專利代理師李強(qiáng)G1OL21/10(20G1OL25/63(20GO6N3/08(20及產(chǎn)品本申請(qǐng)?zhí)峁┮环N語(yǔ)音輸入的處理方法、裝入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài);基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系,確定與用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果,該目標(biāo)視覺(jué)展示效果用于可視化地展示用戶的情緒狀態(tài);在語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中,呈現(xiàn)目標(biāo)視覺(jué)識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系,確定與用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果在語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中,呈現(xiàn)目標(biāo)視覺(jué)展示效果2識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài);基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系,確定與所述用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果,所述目標(biāo)視覺(jué)展示效果用于可視化地展示所述用戶的情緒狀態(tài);在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中,呈現(xiàn)所述目標(biāo)視覺(jué)展示效果。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述視覺(jué)展示效果包括HSL顏色空間的色彩參數(shù)、所述語(yǔ)音信號(hào)的波形中包含的粒子的速度、所述語(yǔ)音輸入界面的形變參數(shù)和動(dòng)態(tài)紋理參數(shù)中至少一項(xiàng)。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中,調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至所述目標(biāo)視覺(jué)展示效果。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)色彩參數(shù)和/或所述語(yǔ)音輸入界面的目標(biāo)形變參數(shù)的情況下;其中,所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至所述目標(biāo)視覺(jué)展調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù);調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參確定所述色彩參數(shù)的調(diào)整步長(zhǎng)值;基于所述色彩參數(shù)的調(diào)整步長(zhǎng)值,調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù)。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述色彩參數(shù)包括色相參數(shù)和/或飽和度基于所述語(yǔ)音輸入界面的當(dāng)前色相參數(shù)與目標(biāo)色相參數(shù)之間的色相參數(shù)差值,以及預(yù)設(shè)調(diào)整比例的乘積,確定所述色相參數(shù)的調(diào)整步長(zhǎng)值;基于預(yù)設(shè)的飽和度調(diào)整值,確定所述飽和度參數(shù)的調(diào)整步長(zhǎng)值。7.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參基于所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)各自對(duì)應(yīng)的權(quán)重,對(duì)所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)進(jìn)行加權(quán)求和,并將加權(quán)求和結(jié)果確定為所述形變參數(shù)的調(diào)整步長(zhǎng)值;基于所述形變參數(shù)的調(diào)整步長(zhǎng)值,調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。8.根據(jù)權(quán)利要求4所述的方法,其特征在于,在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)粒子速度時(shí),所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至所述目標(biāo)視覺(jué)展示效3基于顯示設(shè)備的性能參數(shù),確定預(yù)加載的粒子的目標(biāo)數(shù)量;染所述目標(biāo)視覺(jué)展示效果。9.根據(jù)權(quán)利要求1-8中任一項(xiàng)所述的方法,其特征在于,所述識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)獲取各個(gè)模態(tài)下的輸入數(shù)據(jù),所述各個(gè)模態(tài)下的輸入數(shù)據(jù)包括所述語(yǔ)音信號(hào)、所述語(yǔ)音信號(hào)對(duì)應(yīng)的文本數(shù)據(jù)、所述用戶輸入所述語(yǔ)音信號(hào)時(shí)的視頻數(shù)據(jù)和心率數(shù)據(jù)中至少一針對(duì)所述各個(gè)模態(tài)中每個(gè)模態(tài),對(duì)該模態(tài)下的輸入數(shù)據(jù)進(jìn)行特征提取,得到該模態(tài)下的特征表示;基于所述各個(gè)模態(tài)下的特征表示,得到綜合特征;根據(jù)所述綜合特征,識(shí)別所述用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)。10.根據(jù)權(quán)利要求1-8中任一項(xiàng)所述的方法,其特征在于,所述方法還包括:獲取所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的反饋數(shù)據(jù);基于所述反饋數(shù)據(jù),對(duì)所述映射關(guān)系進(jìn)行更新。11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述反饋數(shù)據(jù)中包括所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù);基于所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù),更新所述映射關(guān)系,以使所述映射關(guān)系符合所述用戶的偏好。所述存儲(chǔ)器與所述處理器連接,用于存儲(chǔ)程序;所述處理器用于通過(guò)運(yùn)行所述存儲(chǔ)器中的程序,實(shí)現(xiàn)如權(quán)利要求1至11中任意一項(xiàng)所述的方法。13.一種存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器運(yùn)行時(shí),實(shí)現(xiàn)如權(quán)利要求1至11中任意一項(xiàng)所述的方法。14.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括計(jì)算機(jī)程序指令,所述計(jì)算機(jī)程序指令在被處理器運(yùn)行時(shí)使得所述處理器實(shí)現(xiàn)如權(quán)利要求1至11中任意一項(xiàng)所述的方法。4技術(shù)領(lǐng)域[0001]本申請(qǐng)涉及語(yǔ)音處理領(lǐng)域,尤其涉及一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品。背景技術(shù)[0002]語(yǔ)音輸入作為一種重要的人機(jī)交互方式,被廣泛應(yīng)用于各類智能設(shè)備和軟件系統(tǒng)中。為了增強(qiáng)語(yǔ)音輸入過(guò)程中的互動(dòng)性和趣味性,許多系統(tǒng)會(huì)在用戶進(jìn)行語(yǔ)音輸入時(shí)展示動(dòng)態(tài)的動(dòng)畫效果,例如動(dòng)態(tài)波形或圖標(biāo)動(dòng)畫,以直觀地反饋用戶語(yǔ)音信號(hào)的強(qiáng)度與變化趨[0003]然而,目前這些視覺(jué)反饋機(jī)制大多依賴于固定的視覺(jué)模板或預(yù)設(shè)的簡(jiǎn)單動(dòng)畫效發(fā)明內(nèi)容[0004]基于上述技術(shù)現(xiàn)狀,本申請(qǐng)?zhí)峁┮环N語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品,能夠提高語(yǔ)音輸入過(guò)程中視覺(jué)反饋效果的多樣性和靈活度。[0005]為了達(dá)到上述技術(shù)目的,本申請(qǐng)具體提出如下技術(shù)方案:根據(jù)本申請(qǐng)實(shí)施例的第一方面,提供了一種語(yǔ)音輸入的處理方法,包括:識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài);基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系,確定與所述用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果,所述目標(biāo)視覺(jué)展示效果用于可視化地展示所述用戶的情緒狀態(tài);在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中,呈現(xiàn)所述目標(biāo)視覺(jué)展示在一些實(shí)現(xiàn)方式中,所述視覺(jué)展示效果包括HSL顏色空間的色彩參數(shù)、所述語(yǔ)音信號(hào)的波形中包含的粒子的速度、所述語(yǔ)音輸入界面的形變參數(shù)和動(dòng)態(tài)紋理參數(shù)中至少一[0006]在一些實(shí)現(xiàn)方式中,在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中,呈現(xiàn)所述目標(biāo)視覺(jué)展示效果,包括:調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至所述目標(biāo)視覺(jué)展示效果。[0007]在一些實(shí)現(xiàn)方式中,在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)色彩參數(shù)和/或所述語(yǔ)音輸入界面的目標(biāo)形變參數(shù)的情況下;其中,所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至所述目標(biāo)視覺(jué)展示效果,包括:調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù);和/或,調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。[0008]在一些實(shí)現(xiàn)方式中,所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù),包括:確定所述色彩參數(shù)的調(diào)整步長(zhǎng)值;基于所述色彩參數(shù)的調(diào)整步長(zhǎng)值,調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù)。[0009]在一些實(shí)現(xiàn)方式中,所述色彩參數(shù)包括色相參數(shù)和/或飽和度參數(shù);其中,所述確5定所述色彩參數(shù)的調(diào)整步長(zhǎng)值,包括:基于所述語(yǔ)音輸入界面的當(dāng)前色相參數(shù)與目標(biāo)色相參數(shù)之間的色相參數(shù)差值,以及預(yù)設(shè)調(diào)整比例的乘積,確定所述色相參數(shù)的調(diào)整步長(zhǎng)值;和/或,基于預(yù)設(shè)的飽和度調(diào)整值,確定所述飽和度參數(shù)的調(diào)整步長(zhǎng)值。[0010]在一些實(shí)現(xiàn)方式中,所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù),包括:基于所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)各自對(duì)應(yīng)的權(quán)重,對(duì)所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)進(jìn)行加權(quán)求和,并將加權(quán)求和結(jié)果確定為所述形變參數(shù)的調(diào)整步長(zhǎng)值;基于所述形變參數(shù)的調(diào)整步長(zhǎng)值,調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。[0011]在一些實(shí)現(xiàn)方式中,在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)粒子速度時(shí),所述調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至所述目標(biāo)視覺(jué)展示效果,還包括:基于顯目標(biāo)數(shù)量的粒子,并基于所述目標(biāo)粒子速度,渲染所述目標(biāo)視覺(jué)展示效果。[0012]在一些實(shí)現(xiàn)方式中,所述識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài),包括:獲取各個(gè)模態(tài)下的輸入數(shù)據(jù),所述各個(gè)模態(tài)下的輸入數(shù)據(jù)包括所述語(yǔ)音信號(hào)、所述語(yǔ)音信號(hào)對(duì)應(yīng)的文本數(shù)據(jù)、所述用戶輸入所述語(yǔ)音信號(hào)時(shí)的視頻數(shù)據(jù)和心率數(shù)據(jù)中至少一項(xiàng);針對(duì)所述各個(gè)模態(tài)中每個(gè)模態(tài),對(duì)該模態(tài)下的輸入數(shù)據(jù)進(jìn)行特征提取,得到該模態(tài)下的特征表示;基于所述各個(gè)模態(tài)下的特征表示,得到綜合特征;根據(jù)所述綜合特征,識(shí)別所述用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)。[0013]在一些實(shí)現(xiàn)方式中,所述方法還包括:獲取所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的反饋數(shù)據(jù);基于所述反饋數(shù)據(jù),對(duì)所述映射關(guān)[0014]在一些實(shí)現(xiàn)方式中,所述反饋數(shù)據(jù)中包括所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的交對(duì)所述目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù),更新所述映射關(guān)系,以使所述映射關(guān)系符合所述用戶的偏好。[0015]根據(jù)本申請(qǐng)實(shí)施例的第二方面,提供了一種電子設(shè)備,包括存儲(chǔ)器和處理器;所述存儲(chǔ)器與所述處理器連接,用于存儲(chǔ)程序;所述處理器用于通過(guò)運(yùn)行所述存儲(chǔ)器中的程序,實(shí)現(xiàn)如第一方面所述的語(yǔ)音輸入的處理方法。[0016]根據(jù)本申請(qǐng)實(shí)施例的第三方面,提供了一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器運(yùn)行時(shí),實(shí)現(xiàn)如第一方面所述的語(yǔ)音輸入的處理方法。[0017]根據(jù)本申請(qǐng)實(shí)施例的第四方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序指令,所述計(jì)算機(jī)程序指令在被處理器運(yùn)行時(shí)使得所述處理器執(zhí)行:如第一方面所述的語(yǔ)音輸入的處理方法。[0018]本申請(qǐng)實(shí)施例提供的一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品,通過(guò)識(shí)別用戶在語(yǔ)音輸入期間的情緒狀態(tài),并根據(jù)預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系,確定出與用戶當(dāng)前情緒狀態(tài)相符的目標(biāo)視覺(jué)展示效果,進(jìn)而將其展現(xiàn)在語(yǔ)音輸入界面中。由于目標(biāo)視覺(jué)展示效果是基于用戶的情緒狀態(tài)確定的,因此可以可視化地表達(dá)用戶當(dāng)前的情緒狀態(tài),為語(yǔ)音輸入過(guò)程中的視覺(jué)反饋機(jī)制提供多樣化的視覺(jué)效果。該些視覺(jué)展示效果還可以隨著用戶情緒的變化而實(shí)時(shí)調(diào)整,因此還可以提升視覺(jué)展示的靈活度,增強(qiáng)用戶的交互體驗(yàn)。6附圖說(shuō)明[0019]為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本申請(qǐng)的實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。[0020]圖1為本申請(qǐng)實(shí)施例提供的一種語(yǔ)音輸入的處理方法的流程圖。[0021]圖2為本申請(qǐng)實(shí)施例提供的識(shí)別用戶情緒狀態(tài)的流程圖。[0022]圖3為本申請(qǐng)實(shí)施例提供的基于多模態(tài)數(shù)據(jù)識(shí)別用戶情緒狀態(tài)的原理圖。[0023]圖4為本申請(qǐng)實(shí)施例提供的色相參數(shù)漸變調(diào)整過(guò)程的示意圖。[0024]圖5為本申請(qǐng)實(shí)施例提供的界面形變參數(shù)漸變調(diào)整過(guò)程的示意圖。[0025]圖6為本申請(qǐng)實(shí)施例提供的一種語(yǔ)音輸入的處理裝置的結(jié)構(gòu)示意圖。[0026]圖7為本申請(qǐng)實(shí)施例提供的一種電子設(shè)備的結(jié)構(gòu)示意圖。具體實(shí)施方式[0027]本申請(qǐng)實(shí)施例提供的技術(shù)方案可示例性地應(yīng)用于處理器、電子設(shè)備、服務(wù)器(包括云服務(wù)器)等硬件設(shè)備,或包裝成軟件程序被運(yùn)行,當(dāng)硬件設(shè)備執(zhí)行本申請(qǐng)實(shí)施例技術(shù)方案的處理過(guò)程,或上述軟件程序被運(yùn)行時(shí),可以實(shí)現(xiàn)目標(biāo)任務(wù)的自動(dòng)拆分和自動(dòng)調(diào)用任務(wù)所需的應(yīng)用程序接口,完成目標(biāo)任務(wù)的目的。本申請(qǐng)實(shí)施例只對(duì)本申請(qǐng)技術(shù)方案的具體處理過(guò)程進(jìn)行示例性介紹,并不對(duì)本申請(qǐng)技術(shù)方案的具體實(shí)現(xiàn)形式進(jìn)行限定,任意的可以執(zhí)行本申請(qǐng)技術(shù)方案處理過(guò)程的技術(shù)實(shí)現(xiàn)形式,都可以被本申請(qǐng)實(shí)施例所采用。[0028]下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他[0029]在介紹本申請(qǐng)方案之前,首先對(duì)相關(guān)技術(shù)進(jìn)行介紹:當(dāng)前的語(yǔ)音輸入系統(tǒng)主要聚焦于語(yǔ)音識(shí)別及文本轉(zhuǎn)換功能,其用戶界面大多基于預(yù)設(shè)的靜態(tài)皮膚或模板構(gòu)建。例如,一些主流的手機(jī)輸入法在進(jìn)行語(yǔ)音輸入時(shí),會(huì)通過(guò)動(dòng)態(tài)波形或圖標(biāo)動(dòng)畫等方式展現(xiàn)用戶的語(yǔ)音信號(hào)強(qiáng)度與變化情況。然而,該些視覺(jué)反饋機(jī)制通常依賴于固定的視覺(jué)模板或簡(jiǎn)單的實(shí)時(shí)數(shù)據(jù)驅(qū)動(dòng)實(shí)現(xiàn)。其雖然能夠有效地反映聲音的基本物理特性,例如通過(guò)實(shí)時(shí)顯示音頻波形或頻譜圖,但在捕捉與反饋用戶情緒狀態(tài)方面仍存在明顯不足。具體表現(xiàn)為:傳統(tǒng)系統(tǒng)多采用固定視覺(jué)模板或基礎(chǔ)動(dòng)畫效果呈現(xiàn)語(yǔ)音輸入過(guò)程,而未能充分考慮用戶的個(gè)性化和情境化需求,例如,依據(jù)用戶的情緒波動(dòng)做出相應(yīng)的界面調(diào)整。[0030]此外,部分解決方案中的情緒識(shí)別模塊準(zhǔn)確率較低,難以實(shí)時(shí)且準(zhǔn)確地解析語(yǔ)音中蘊(yùn)含的情感信息,導(dǎo)致動(dòng)態(tài)可視化效果與用戶實(shí)際情緒狀態(tài)之間的脫節(jié)現(xiàn)象。[0031]同時(shí),由于缺乏高效的數(shù)據(jù)采集、處理與可視化協(xié)同機(jī)制,該類系統(tǒng)往往面臨較高的延遲問(wèn)題,無(wú)法滿足用戶對(duì)即時(shí)互動(dòng)的需求。[0032]值得注意的是,用戶的情緒對(duì)語(yǔ)音輸入效率和體驗(yàn)具有顯著影響,但傳統(tǒng)的語(yǔ)音輸入系統(tǒng)并未充分重視這一因素,缺乏有效的情緒識(shí)別與響應(yīng)能力。隨著情感計(jì)算和深度7學(xué)習(xí)技術(shù)的發(fā)展,如何利用該些先進(jìn)的技術(shù)捕捉用戶語(yǔ)音中的情緒線索,并據(jù)此實(shí)現(xiàn)界面的動(dòng)態(tài)調(diào)整,進(jìn)而提升用戶體驗(yàn),提供更加豐富的[0033]有鑒于此,本申請(qǐng)實(shí)施例致力于提供一種語(yǔ)音輸入的處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品,通過(guò)實(shí)時(shí)地捕捉用戶在語(yǔ)音輸入過(guò)程中的情緒狀態(tài),并根據(jù)預(yù)先設(shè)定的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系,確定與用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)相適應(yīng)的目標(biāo)視覺(jué)展示效果。隨后,在語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中,動(dòng)態(tài)呈現(xiàn)該目標(biāo)視覺(jué)展示效果,以實(shí)現(xiàn)對(duì)用戶情緒狀態(tài)的可視化表達(dá)。不僅能夠提升語(yǔ)音輸入界面的多樣性和靈活度,還可以增強(qiáng)用戶的交互體驗(yàn)。在以下實(shí)施例中逐一進(jìn)行詳細(xì)說(shuō)明。[0034]示例性方法圖1為本申請(qǐng)實(shí)施例提供的一種語(yǔ)音輸入的處理方法的流程圖。如圖1所示,本實(shí)施例提供的語(yǔ)音輸入的處理方法包括步驟S101-S103:S101、識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)。[0035]識(shí)別用戶在語(yǔ)音輸入過(guò)程中所蘊(yùn)含的情緒狀態(tài),是實(shí)現(xiàn)情感化交互的關(guān)鍵環(huán)節(jié)之一。為了提升用戶情緒狀態(tài)的識(shí)別準(zhǔn)確度,在一些實(shí)施例中,可以基于用戶的各個(gè)模態(tài)下的輸入數(shù)據(jù)來(lái)識(shí)別用戶當(dāng)前的情緒狀態(tài)。如圖2所示,具體包括如下步驟S201至步驟S204:S201、獲取各個(gè)模態(tài)下的輸入數(shù)據(jù),各個(gè)模態(tài)下的輸入數(shù)據(jù)包括語(yǔ)音信號(hào)、語(yǔ)音信號(hào)對(duì)應(yīng)的文本數(shù)據(jù)、用戶輸入語(yǔ)音信號(hào)時(shí)的視頻數(shù)據(jù)和心率數(shù)據(jù)中至少一項(xiàng)。[0036]本實(shí)施例中,可以通過(guò)各種模態(tài)數(shù)據(jù)捕捉用戶的情緒狀態(tài)。各個(gè)模態(tài)包括語(yǔ)音模態(tài)、文本模態(tài)、視頻模態(tài)和心率模態(tài)中至少一項(xiàng)。下面將詳細(xì)闡述每種模態(tài)的數(shù)據(jù)獲取過(guò)其中,語(yǔ)音模態(tài)下的輸入數(shù)據(jù),可以在用戶激活語(yǔ)音輸入功能時(shí),通過(guò)語(yǔ)音采集模塊(例如麥克風(fēng))實(shí)時(shí)捕捉用戶的語(yǔ)音信號(hào)獲得。例如,在聊天軟件、搜索引擎等多種應(yīng)用程序的語(yǔ)音輸入界面中,用戶通過(guò)點(diǎn)擊麥克風(fēng)按鈕即可啟動(dòng)語(yǔ)音輸入功能。[0037]在一些示例中,為了提升語(yǔ)音質(zhì)量,可以采用雙麥克風(fēng)陣列結(jié)合波束形成技術(shù)來(lái)抑制環(huán)境噪聲,以確保語(yǔ)音信號(hào)的清晰度。其中,采樣率可以設(shè)定為16kHz,以充分覆蓋人聲的基本頻率范圍(80-255Hz),從而保證語(yǔ)音輸入的基礎(chǔ)音質(zhì)。例如,當(dāng)用戶發(fā)出贊嘆如“這個(gè)功能太棒了!”時(shí),雙麥克風(fēng)陣列不僅能夠記錄話語(yǔ)中的基本頻率成分,還能夠識(shí)別并強(qiáng)調(diào)其中高頻能量顯著增加的部分(約2000-4000Hz)。[0038]由于語(yǔ)句中的某些情感表達(dá)往往伴隨著特定頻率段的能量突增。因此通過(guò)上述采樣率的配置,雙麥克風(fēng)陣列不僅能精確地轉(zhuǎn)錄用戶的語(yǔ)音內(nèi)容,還能反映說(shuō)話者的情感狀態(tài),從而有助于捕捉語(yǔ)音信號(hào)中的情感信息。[0039]文本數(shù)據(jù)也可以在一定程度上反映用戶的情緒狀態(tài)。因此,在獲得語(yǔ)音信號(hào)之后,還可以將語(yǔ)音信號(hào)轉(zhuǎn)錄為文本數(shù)據(jù),從而獲得文本模態(tài)下的輸入數(shù)據(jù),為識(shí)別用戶情緒狀態(tài)提供多維度的支持。[0040]另外,由于面部表情也是情緒表達(dá)的重要組成部分,因此還可以通過(guò)攝像頭實(shí)時(shí)地采集用戶的面部視頻數(shù)據(jù),以獲取視頻模態(tài)下的輸入數(shù)據(jù)。[0041]除此之外,心率作為生理指標(biāo)之一,對(duì)情緒變化反應(yīng)敏感,能夠在一定程度上反映用戶的內(nèi)在情緒狀態(tài)。因此,還可以通過(guò)心率監(jiān)測(cè)設(shè)備(如智能手環(huán)或手表)采集用戶的心率數(shù)據(jù),從而獲得心率模態(tài)下的輸入數(shù)據(jù)。8[0042]通過(guò)上述各個(gè)模態(tài)的輸入數(shù)據(jù),可以為識(shí)別用戶情緒狀態(tài)提供多個(gè)維度的數(shù)據(jù)來(lái)源,以提升用戶情緒狀態(tài)的識(shí)別精度。[0043]在一些實(shí)施例中,為了增強(qiáng)用戶的個(gè)性化體驗(yàn),還可以提供面部視頻數(shù)據(jù)采集的授權(quán)選項(xiàng)。用戶可以根據(jù)個(gè)人偏好選擇是否開(kāi)啟攝像頭權(quán)限。當(dāng)用戶選擇開(kāi)啟攝像頭的授權(quán)選項(xiàng)時(shí),便可以采集用戶的面部視頻數(shù)據(jù)。[0044]由于麥克風(fēng)、攝像頭和心率監(jiān)測(cè)設(shè)備可能不會(huì)同時(shí)啟動(dòng),會(huì)導(dǎo)致多源數(shù)據(jù)之間出現(xiàn)不同步問(wèn)題。因此,在獲得多源數(shù)據(jù)之后,可以采用時(shí)間戳對(duì)齊算法來(lái)實(shí)現(xiàn)多源數(shù)據(jù)的同步處理,以使得多源數(shù)據(jù)在時(shí)間上同步。[0045]具體地,可以通過(guò)在數(shù)據(jù)采集的源頭為每一條記錄添加精確的時(shí)間戳標(biāo)記,從而將來(lái)自不同設(shè)備的數(shù)據(jù)進(jìn)行對(duì)齊和同步。如此,便可以確保語(yǔ)音、視頻及心率等多模態(tài)數(shù)據(jù)在時(shí)間軸上準(zhǔn)確匹配,為后續(xù)的情緒狀態(tài)識(shí)別提供基礎(chǔ)。[0046]S202、針對(duì)各個(gè)模態(tài)中每個(gè)模態(tài),對(duì)該模態(tài)下的輸入數(shù)據(jù)進(jìn)行特征提取,得到該模態(tài)下的特征表示。[0047]不同模態(tài)對(duì)應(yīng)有特征提取方法。針對(duì)不同模態(tài)下的輸入數(shù)據(jù),可以采用與之相應(yīng)在一些情緒狀態(tài)中,某些聲學(xué)特征的表現(xiàn)會(huì)比較突出。例如,在憤怒情緒表達(dá)中,基頻的標(biāo)準(zhǔn)差會(huì)顯著增大(超過(guò)40Hz)。因此,針對(duì)語(yǔ)音信號(hào),可以提取多維MFCC(梅爾頻率倒譜系數(shù))、基頻(FO)以及語(yǔ)速(音節(jié)/秒),作為聲學(xué)特征,以獲得語(yǔ)音模態(tài)下的特征表示。為了同時(shí)兼顧特征表達(dá)的準(zhǔn)確度和特征提取效率,可以選取13維MFCC。[0048]針對(duì)文本數(shù)據(jù),可以通過(guò)預(yù)訓(xùn)練的自然語(yǔ)言處理模型,如RoBERTa模型提取文本的情感傾向,并基于NRC情感詞典構(gòu)建情感詞匯密度圖,以獲得文本模態(tài)下的特征表示。例如,該些詞匯將被識(shí)別并計(jì)入負(fù)面情感詞匯的統(tǒng)計(jì)當(dāng)中。針對(duì)面部視頻數(shù)據(jù),可以通過(guò)輕量化的面部檢測(cè)模型(FaceMesh模型)實(shí)時(shí)檢測(cè)多表明存在顯著的積極表情特征。[0049]針對(duì)心率數(shù)據(jù),可以從中提取平均心率、心率變異性(HRV)等關(guān)鍵指標(biāo),作為反映用戶生理狀態(tài)的心率特征。該些特征能夠體現(xiàn)用戶的情緒波動(dòng)。例如,當(dāng)檢測(cè)到用戶平均心率升高且心率變異性降低時(shí),可能表明其正處于緊張或焦慮的情緒狀態(tài)。通過(guò)該種方式,可以獲得生理模態(tài)下的情緒相關(guān)特征,從而增強(qiáng)情緒識(shí)別的全面性與準(zhǔn)確性。[0051]繼續(xù)參閱圖3,在獲取了各個(gè)模態(tài)的特征表示之后,可以通過(guò)注意力機(jī)制對(duì)其融合,生成一綜合性的特征表示。具體而言,通過(guò)將各個(gè)模態(tài)的特征表示輸入各自對(duì)應(yīng)的線性層進(jìn)行初步處理,從而將不同模態(tài)的特征表示轉(zhuǎn)換到一個(gè)共同的隱藏維度空間,以便后續(xù)[0052]接下來(lái),將初步處理后的各模態(tài)特征表示拼接在一起,得到一新的組合特征。該組合特征進(jìn)一步會(huì)被輸入融合層,以利用激活函數(shù)增強(qiáng)其表達(dá)能力,生成融合后的特征表示。[0053]為了進(jìn)一步優(yōu)化上述融合過(guò)程,可以通過(guò)注意力機(jī)制計(jì)算各個(gè)模態(tài)下的特征表示的權(quán)重。具體可以通過(guò)注意力層來(lái)實(shí)現(xiàn),該注意力層能夠根據(jù)當(dāng)前輸入動(dòng)態(tài)地評(píng)估各個(gè)特9征表示的貢獻(xiàn)程度。[0054]最后,基于計(jì)算出的權(quán)重,對(duì)各個(gè)模態(tài)下的特征表示進(jìn)行加權(quán)求和,得到最終的綜合特征,確保對(duì)于理解用戶情緒狀態(tài)最為關(guān)鍵的特征表示能夠在最終結(jié)果中占據(jù)更重要的位置。[0055]S204、根據(jù)綜合特征,識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)。[0056]繼續(xù)參閱圖3,在一些實(shí)施例中,可以通過(guò)情緒識(shí)別模型基于前述得到的綜合特征,對(duì)用戶在語(yǔ)音輸入過(guò)程中所表達(dá)的情緒狀態(tài)進(jìn)行識(shí)別。該模型能夠結(jié)合語(yǔ)音、文本、面部表情和生理信號(hào)等多模態(tài)信息,進(jìn)行精準(zhǔn)地情緒分析。[0057]情緒識(shí)別模型可以采用混合神經(jīng)網(wǎng)絡(luò)模型,例如將卷積神經(jīng)網(wǎng)絡(luò)(CNN)與循環(huán)神理。[0058]在情緒分類方面,該模型不僅支持7種基礎(chǔ)情緒的識(shí)別,包括:快樂(lè)、悲傷、憤怒、恐懼、驚訝、厭惡和中性,還擴(kuò)展了20種復(fù)合情緒類別,如失望、焦慮、沮喪、興奮、期待、諷刺等,從而實(shí)現(xiàn)更加細(xì)粒度和貼近真實(shí)情緒表達(dá)的分類效果。[0059]模型最終輸出的為帶有置信度的情緒狀態(tài)標(biāo)簽,表示當(dāng)前語(yǔ)音輸入最可能對(duì)應(yīng)的情緒類型及其強(qiáng)度分布。例如,當(dāng)用戶輸入語(yǔ)音:“我簡(jiǎn)直無(wú)法忍受這種設(shè)計(jì)了!”,模型會(huì)綜合分析語(yǔ)音中的語(yǔ)調(diào)變化、關(guān)鍵詞語(yǔ)義、面部微表情以及心率波動(dòng)等信息,輸出如下情緒識(shí)別結(jié)果:憤怒(主情緒,置信度72%);厭惡(次情緒,置信度25%);失望(次情緒,置信度3%)。[0060]這表明,用戶當(dāng)前的情緒主要表現(xiàn)為憤怒,同時(shí)伴隨一定程度的厭惡感和輕微的失望情緒。通過(guò)這種細(xì)粒度的情緒識(shí)別機(jī)制,可以更準(zhǔn)確地理解用戶的實(shí)際心理狀態(tài),為后續(xù)的人機(jī)交互提供更具個(gè)性化的反饋與響應(yīng)策略。例如,根據(jù)識(shí)別到的情緒動(dòng)態(tài)調(diào)整語(yǔ)音輸入界面的顏色、動(dòng)畫風(fēng)格或提示語(yǔ)內(nèi)容,從而提升用戶體驗(yàn)的情感共鳴。[0061]情緒識(shí)別模型在訓(xùn)練時(shí),可以采用兩階段訓(xùn)練策略來(lái)提高其準(zhǔn)確性和泛化能力。首先,在廣泛使用的情緒識(shí)別數(shù)據(jù)集IEMOCAP上進(jìn)行預(yù)訓(xùn)練,幫助模型學(xué)習(xí)到基礎(chǔ)的情緒特征和模式。接著,在特定應(yīng)用場(chǎng)景下的自有數(shù)據(jù)集上進(jìn)行微調(diào),使其更好地適應(yīng)實(shí)際應(yīng)用中的具體需求和特點(diǎn)。[0062]為了進(jìn)一步提升訓(xùn)練效果和模型的魯棒性,還可以對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)處理。[0063]在實(shí)時(shí)推理優(yōu)化方面,可以采用靜態(tài)量化技術(shù)將模型權(quán)重轉(zhuǎn)換為INT8精度,以減少計(jì)算延遲。這樣,不僅能夠保持高識(shí)別精度,還能確保系統(tǒng)響應(yīng)時(shí)間低于30毫秒(ms),從而提升用戶體驗(yàn),尤其是在需要快速反饋的應(yīng)用場(chǎng)景中。另外,還能夠使得該模型在資源受限的設(shè)備上也能流暢運(yùn)行,拓展其應(yīng)用范圍。[0064]繼續(xù)參閱圖1,本實(shí)施例的語(yǔ)音輸入的處理方法在步驟S101之后,還可以包括步驟[0065]S102、基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系,確定與用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果。[0066]其中,目標(biāo)視覺(jué)展示效果用于以可視化方式直觀呈現(xiàn)用戶的情緒狀態(tài),從而增強(qiáng)語(yǔ)音輸入過(guò)程中的情感表達(dá)與交互體驗(yàn)。[0067]每種視覺(jué)展示效果對(duì)應(yīng)一組可調(diào)節(jié)的可視化參數(shù)。該些參數(shù)包括HSL顏色空間的色彩參數(shù)、語(yǔ)音波形中粒子運(yùn)動(dòng)的速度、語(yǔ)音輸入界面的形變程度和動(dòng)態(tài)紋理的表現(xiàn)形式中至少一項(xiàng)。通過(guò)組合并動(dòng)態(tài)地調(diào)整該些視覺(jué)元素,可以實(shí)現(xiàn)豐富且多樣化的情緒反饋效果。其中,HSL為一種將顏色表示為色相、飽和度和亮度的模型。色相(H)為顏色的基本屬性,表示顏色的種類,如紅色、綠色、藍(lán)色等;飽和度(S)表示顏色的純度,飽和度越高,顏色越鮮艷;亮度(L)則控制顏色的明暗程度。通過(guò)調(diào)整色相、飽和度和亮度可以改變視覺(jué)元素的色彩氛圍。[0068]為了實(shí)現(xiàn)視覺(jué)展示效果與用戶情緒狀態(tài)之間的智能匹配,可以預(yù)先構(gòu)建情緒狀態(tài)與視覺(jué)參數(shù)之間的映射規(guī)則表。該映射規(guī)則表當(dāng)中包括多種情緒狀態(tài)及其對(duì)應(yīng)的可視化配置參數(shù),使得可以根據(jù)識(shí)別出的情緒狀態(tài)自動(dòng)調(diào)用相應(yīng)的視覺(jué)風(fēng)格進(jìn)行實(shí)時(shí)反饋。以下為部分情緒狀態(tài)的示例配置,如表1所示:表1映射規(guī)則表情緒類型粒子速度界面形變喜悅快(8Hz)星光閃爍憤怒劇烈(12Hz)火焰波紋悲傷慢(2Hz)收縮-15%雨滴下落當(dāng)識(shí)別到用戶處于“喜悅”情緒時(shí),語(yǔ)音輸入界面可以采用明亮的黃綠色調(diào)(HSL值為(60,90%,80%)),語(yǔ)音波形中的粒子快速跳動(dòng)、界面適度放大,并配合星光閃爍的動(dòng)態(tài)紋理,營(yíng)造出輕松愉快的氛圍。[0069]若檢測(cè)到“憤怒”情緒,則界面會(huì)切換為紅色調(diào)(HSL值為(0,85%,50%)),語(yǔ)音波形中的粒子高頻抖動(dòng),界面邊緣銳化處理,并疊加火焰波紋特效,強(qiáng)化激烈情緒的視覺(jué)傳達(dá)。例如,在憤怒情緒狀態(tài)下,目標(biāo)視覺(jué)展示效果可以設(shè)置為:紅色占比80%,界面邊緣的鋸齒度為5Px,粒子速度為12Hz。[0070]對(duì)于“悲傷”情緒,則可以采用冷色調(diào)藍(lán)色(HSL值為(240,40%,30%)),語(yǔ)音波形中的粒子緩慢跳動(dòng),界面收縮顯示,輔以雨滴下落的動(dòng)畫紋理,傳遞出低落、沉靜的情緒感受。[0071]當(dāng)用戶情緒為“激動(dòng)/興奮”時(shí),語(yǔ)音波形將快速跳動(dòng)且顏色鮮艷,以表達(dá)用戶的高漲情緒。波形的頻率加快,并采用明亮而飽和的色彩(如HSL值中的高亮度和飽和度設(shè)置),營(yíng)造出充滿活力與激情的視覺(jué)效果。[0072]當(dāng)檢測(cè)到用戶存在持續(xù)3秒的焦慮情緒時(shí),則界面背景漸變?yōu)樯钏{(lán)色波紋、語(yǔ)音輸入框的邊緣出現(xiàn)呼吸燈效果、以及自動(dòng)彈出冥想引導(dǎo)動(dòng)畫。[0073]相反,當(dāng)用戶情緒為“平靜”時(shí),語(yǔ)音波形則表現(xiàn)為平穩(wěn)流暢、色調(diào)柔和的特點(diǎn)。此時(shí),可以選擇較為溫和的色彩配置(如較低的飽和度和中等亮度的HSL值),并減少波形的動(dòng)態(tài)變化,呈現(xiàn)出一種寧?kù)o和諧的視覺(jué)感受,以反映用戶的平和心境。例如,在“平靜”等中性11情緒狀態(tài)下,目標(biāo)視覺(jué)展示效果可以設(shè)置為:藍(lán)色占比50%,界面[0074]通過(guò)基于情緒識(shí)別的動(dòng)態(tài)視覺(jué)反饋機(jī)制,能夠?qū)崿F(xiàn)根據(jù)用戶的不同情緒狀態(tài),靈活調(diào)整語(yǔ)音輸入界面的視覺(jué)展示效果,從而提供更加貼合用戶情感體驗(yàn)的交互環(huán)境。[0075]在識(shí)別出用戶的情緒狀態(tài)之后,可以根據(jù)上述預(yù)先構(gòu)建的映射規(guī)則表進(jìn)行查表,從而獲得能夠可視化反映用戶當(dāng)前情緒狀態(tài)的界面效果。[0076]需要說(shuō)明的是,每種情緒狀態(tài)可以對(duì)應(yīng)至少一種動(dòng)態(tài)紋理效果,用戶可以挑選其中一種作為該種情緒狀態(tài)下將展示的動(dòng)態(tài)紋理效果。[0077]S103、在語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中,呈現(xiàn)目標(biāo)視覺(jué)展示效果。[0078]在獲取與用戶當(dāng)前情緒狀態(tài)相匹配的各項(xiàng)視覺(jué)元素之后,便可以基于該些視覺(jué)元素進(jìn)行界面渲染,以在語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中呈現(xiàn)出目標(biāo)視覺(jué)展示效果。[0079]本實(shí)施例通過(guò)在識(shí)別出用戶在語(yǔ)音輸入過(guò)程中的情緒狀態(tài)之后,基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系,確定與用戶當(dāng)前情緒狀態(tài)相匹配的目標(biāo)視覺(jué)展示效果,并將其呈現(xiàn)在用戶的語(yǔ)音輸入界面中,以直觀地反映用戶當(dāng)前的情緒狀態(tài),為語(yǔ)音輸入的視覺(jué)反饋機(jī)制提供豐富多樣的表現(xiàn)形式。由于視覺(jué)展示效果可以隨著用戶情緒狀態(tài)的變化而動(dòng)態(tài)調(diào)整,因此,可以提升視覺(jué)展示的靈活度,確保用戶體驗(yàn)的多樣[0080]為了確保視覺(jué)變化能夠平滑過(guò)渡,避免因突然變化給用戶帶來(lái)的不適感,本實(shí)施例中還可以采用動(dòng)態(tài)過(guò)渡方案。[0081]具體而言,在步驟S103中,當(dāng)需要從當(dāng)前視覺(jué)展示效果切換至新的視覺(jué)展示效果時(shí),可以采用漸變技術(shù)實(shí)現(xiàn)平滑過(guò)渡。即步驟S103具體包括:調(diào)整語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至目標(biāo)視覺(jué)展示效果。飽和度和亮度,加快波形中粒子的速度,并逐步增強(qiáng)界面的動(dòng)態(tài)效果,直至完全達(dá)到與“激動(dòng)/興奮”情緒相對(duì)應(yīng)的目標(biāo)視覺(jué)展示效果。在一些實(shí)現(xiàn)方式中,在目標(biāo)視覺(jué)展示效果包括目標(biāo)色彩參數(shù)的情況下,則調(diào)整語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至目標(biāo)視覺(jué)展示效果,包括:調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至目標(biāo)色彩參數(shù)。[0084]在一些實(shí)現(xiàn)方式中,在目標(biāo)視覺(jué)展示效果包括語(yǔ)音輸入界面的目標(biāo)形變參數(shù)的情況下,則調(diào)整語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至目標(biāo)視覺(jué)展示效果,包括:調(diào)整語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至目標(biāo)形變參數(shù)。[0085]在一些實(shí)現(xiàn)方式中,在目標(biāo)視覺(jué)展示效果包括目標(biāo)色彩參數(shù)和語(yǔ)音輸入界面的目標(biāo)形變參數(shù)的情況下,則調(diào)整語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至目標(biāo)視覺(jué)展示效果,包括:調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至目標(biāo)色彩參數(shù),并調(diào)整語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至目標(biāo)形變參數(shù)。[0086]在色彩參數(shù)的調(diào)整過(guò)程中,通過(guò)調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù),使其逐漸過(guò)渡到目標(biāo)色彩參數(shù),可以確保顏色變換過(guò)程平滑自然。[0087]在界面形變參數(shù)的調(diào)整過(guò)程中,通過(guò)根據(jù)預(yù)定義的目標(biāo)形變參數(shù)來(lái)調(diào)整當(dāng)前的界面布局或元素形狀,例如,通過(guò)精確控制每個(gè)界面元素的位置、大小和角度等屬性的變化速率與路徑,以確保整個(gè)過(guò)渡過(guò)程流暢且自然,從而實(shí)現(xiàn)視覺(jué)上的動(dòng)態(tài)變化。其中,形變可以包括縮放、旋轉(zhuǎn)以及變形動(dòng)畫。變形動(dòng)畫包括將矩形按鈕變?yōu)閳A形圖標(biāo)。[0088]在一些復(fù)雜場(chǎng)景中,還可以同時(shí)對(duì)色彩和形變進(jìn)行調(diào)整。這需要同時(shí)處理顏色平滑過(guò)渡,以及同步處理界面形狀的變化。例如,在一個(gè)語(yǔ)音輸入界面從方形變?yōu)閳A形的同時(shí),背景顏色也由淺藍(lán)轉(zhuǎn)變?yōu)樯钏{(lán)。下面將詳細(xì)介紹色彩參數(shù)和形變參數(shù)各自的漸變調(diào)整在一些實(shí)現(xiàn)方式中,調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至目標(biāo)色彩參數(shù)時(shí),可以確定一系列中間色彩值,并按照設(shè)定的速度逐步應(yīng)用該些色彩值,直至達(dá)到最終的目標(biāo)色彩,以實(shí)現(xiàn)自然過(guò)渡效果。具體包括如下步驟a1和步驟a2:步驟a1、確定色彩參數(shù)的調(diào)整步長(zhǎng)值。[0089]其中,色彩參數(shù)包括色相參數(shù)和/或飽和度參數(shù);則步驟a1確定色彩參數(shù)的調(diào)整步長(zhǎng)值,包括:基于語(yǔ)音輸入界面的當(dāng)前色相參數(shù)與目標(biāo)色相參數(shù)之間的色相參數(shù)差值,以及預(yù)設(shè)調(diào)整比例的乘積,確定色相參數(shù)的調(diào)整步長(zhǎng)值;和/或,基于預(yù)設(shè)的飽和度調(diào)整值,確定飽和度參數(shù)的調(diào)整步長(zhǎng)值。[0090]其中,色相參數(shù)的調(diào)整步長(zhǎng)值為實(shí)現(xiàn)色彩漸變過(guò)程的關(guān)鍵。通過(guò)合理設(shè)置每一步的調(diào)整幅度,即調(diào)整步長(zhǎng),可以控制色相參數(shù)從當(dāng)前狀態(tài)像目標(biāo)狀態(tài)變化的速度和流暢度。[0091]假設(shè)當(dāng)前色相參數(shù)為Hcurrent,目標(biāo)色相參數(shù)為Harge,預(yù)設(shè)調(diào)整比例為RH,取值為0到1之間,例如0.15。則首先計(jì)算色相參數(shù)差值△H=I。接下來(lái)計(jì)算調(diào)整步長(zhǎng)值[0092]針對(duì)飽和度參數(shù),可以對(duì)其設(shè)置固定的調(diào)整值,取值范圍為[0.1,0.5],例如0.1、[0093]步驟a2、基于色彩參數(shù)的調(diào)整步長(zhǎng)值,調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至目標(biāo)色彩參數(shù)。[0094]通過(guò)色彩參數(shù)的調(diào)整步長(zhǎng)值,逐步調(diào)整語(yǔ)音輸入界面當(dāng)前的色彩參數(shù),使其平滑過(guò)渡至目標(biāo)色彩參數(shù)。例如,如果目標(biāo)是從較暗的藍(lán)色(HSL值為(240、40%、30%))漸變至明亮的天藍(lán)色(HSL值為(180、80%、90%)),則通過(guò)分別計(jì)算出色相參數(shù)、飽和度和亮度各自的調(diào)整步長(zhǎng)值,并按照該調(diào)整步長(zhǎng)值逐步調(diào)整,從而確保色彩轉(zhuǎn)換過(guò)程中的視覺(jué)平滑性。[0095]如圖4所示,針對(duì)色相參數(shù),則是在當(dāng)前已調(diào)整色相參數(shù)的基礎(chǔ)上,每次增加△H*R,直至達(dá)到目標(biāo)色相參數(shù)。[0096]在一些實(shí)現(xiàn)方式中,調(diào)整語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至目標(biāo)形變參數(shù),包括如下步驟b1和步驟b2:步驟b1、基于當(dāng)前形變參數(shù)與目標(biāo)形變參數(shù)各自對(duì)應(yīng)的權(quán)重,對(duì)當(dāng)前形變參數(shù)與目標(biāo)形變參數(shù)進(jìn)行加權(quán)求和,并將加權(quán)求和結(jié)果確定為形變參數(shù)的調(diào)整步長(zhǎng)值。[0097]在界面形態(tài)隨用戶情緒動(dòng)態(tài)變化的過(guò)程中,為了實(shí)現(xiàn)從當(dāng)前形變狀態(tài)平滑過(guò)渡到目標(biāo)形變狀態(tài),可以根據(jù)當(dāng)前形變參數(shù)(如界面縮放比例、控件變形程度等)與目標(biāo)形變參數(shù)之間的差異,并結(jié)合各自設(shè)定的權(quán)重比例,計(jì)算用于控制漸變節(jié)奏的步長(zhǎng)值。其中,當(dāng)前形變參數(shù)與目標(biāo)形變參數(shù)各自對(duì)應(yīng)的權(quán)重,可以根據(jù)用戶需求進(jìn)行設(shè)置,具體如下:在一些示例中,可以根據(jù)即時(shí)反饋需求設(shè)置權(quán)重。例如,如果用戶希望在檢測(cè)到情緒發(fā)生變化時(shí)迅速調(diào)整界面形態(tài)以得到即時(shí)反饋。則目標(biāo)形變參數(shù)的權(quán)重應(yīng)設(shè)置較高(例如0.8),而當(dāng)前形變參數(shù)的權(quán)重相對(duì)較低(如0.2)。如此,可以使新的界面形態(tài)盡快呈現(xiàn)出[0098]在另一些示例中,還可以根據(jù)用戶對(duì)過(guò)渡效果的需求設(shè)置權(quán)重。例如,如果用戶希望在情緒變化時(shí)感受到平滑自然的界面轉(zhuǎn)換,則可以采用更均衡的權(quán)重分配。例如,初始階段為當(dāng)前形變參數(shù)設(shè)置較高的權(quán)重(如0.7),而目標(biāo)形變參數(shù)的權(quán)重稍低(如0.3),之后隨著過(guò)渡過(guò)程逐漸降低前者并增加后者,直到完全過(guò)渡為目標(biāo)形變參數(shù),給予用戶更多時(shí)間適應(yīng)新?tīng)顟B(tài)。[0099]在又一些示例中,還可以根據(jù)用戶對(duì)情感表現(xiàn)力的需求來(lái)設(shè)置權(quán)重。例如,如果用的權(quán)重設(shè)為最大值(如1),忽略當(dāng)前形變參數(shù)的影響,從而實(shí)現(xiàn)快速且強(qiáng)烈的變化。相反,對(duì)于一些較為細(xì)膩的情緒(如“平靜”),則可以適當(dāng)降低目標(biāo)形變參數(shù)的權(quán)重,使得過(guò)渡更加緩慢和諧。[0100]在又一些示例中,還可以根據(jù)用戶的個(gè)性化需求來(lái)設(shè)置權(quán)重。具體地,可以根據(jù)不同用戶的偏好或歷史數(shù)據(jù)來(lái)自定義權(quán)重。例如,某些用戶可能偏好快速直接的情感反饋,此時(shí)可以為該類用戶配置更高的目標(biāo)形變參數(shù)權(quán)重;而對(duì)于喜歡溫和變化的用戶,則采用更[0101]步驟b2、基于形變參數(shù)的調(diào)整步長(zhǎng)值,調(diào)整語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至目標(biāo)形變參數(shù)。[0102]基于在步驟b1中計(jì)算得到的形變參數(shù)調(diào)整步長(zhǎng)值,逐步對(duì)語(yǔ)音輸入界面當(dāng)前的形變參數(shù)進(jìn)行迭代更新,使其從當(dāng)前狀態(tài)平滑過(guò)渡至目標(biāo)形變參數(shù)。具體而言,在每一次更新周期中,根據(jù)設(shè)定的步長(zhǎng)值對(duì)當(dāng)前形變參數(shù)進(jìn)行微調(diào),例如增加或減少一定的縮放比例、彎[0103]如圖5所示,以界面縮放為例,若當(dāng)前界面處于正常大小(縮放比例為1.0),而目標(biāo)是根據(jù)用戶情緒識(shí)別結(jié)果放大至1.2倍,則在每一幀或固定時(shí)間間隔中,按照計(jì)算出的步長(zhǎng)[0104]此外,還可以結(jié)合緩動(dòng)函數(shù)(如線性插值、緩入緩出函數(shù))來(lái)進(jìn)一步優(yōu)化過(guò)渡曲線,使界面變化更加自然流暢。[0105]本實(shí)施例通過(guò)調(diào)整語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至目標(biāo)色彩參數(shù),和/或調(diào)整語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至目標(biāo)形變參數(shù),不僅可以提升界面響應(yīng)情緒識(shí)別結(jié)果的準(zhǔn)確性,也可以增強(qiáng)用戶交互時(shí)的沉浸感和情感共鳴體驗(yàn)。相較于直接切換到新的視覺(jué)設(shè)置而言,通過(guò)逐步調(diào)整當(dāng)前界面的視覺(jué)參數(shù)(如色彩、粒子速度、界面形變和動(dòng)態(tài)紋理等),使其逐漸接近目標(biāo)視覺(jué)效果。不僅能夠保證視覺(jué)轉(zhuǎn)換過(guò)程中的連貫性和流暢性,還可以提升用戶體驗(yàn)的整體舒適度和沉浸感。即使是在情緒快速變化的情況下,也能讓用戶感受到自然和諧的視覺(jué)體驗(yàn),增強(qiáng)了人機(jī)交互的情感共鳴。無(wú)論是情緒的微妙變化還是顯著波動(dòng),都能在界面設(shè)計(jì)上得到細(xì)膩且恰當(dāng)?shù)谋憩F(xiàn)。[0106]為了確保提供低延遲的可視化渲染效果,從而在短時(shí)間內(nèi)完成從語(yǔ)音輸入到可視化反饋的全過(guò)程,在目標(biāo)視覺(jué)展示效果包括目標(biāo)粒子速度時(shí),則調(diào)整語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至目標(biāo)視覺(jué)展示效果,還包括:基于顯示設(shè)備的性能參數(shù),確定預(yù)加載的粒子的目標(biāo)數(shù)量;通過(guò)WebGPU并行計(jì)算框架,預(yù)加載目標(biāo)數(shù)量的粒子,并基于目標(biāo)粒子速度,渲染目標(biāo)視覺(jué)展示效果。[0108]其中,基于顯示設(shè)備的性能參數(shù),確定預(yù)加載的粒子的目標(biāo)數(shù)量,包括:基于顯示設(shè)備的性能參數(shù)與預(yù)加載的粒子數(shù)量之間的映射關(guān)系,確定與顯示設(shè)備相匹配的預(yù)加載粒子數(shù)量。[0109]在一些示例中,顯示設(shè)備的性能參數(shù)與預(yù)加載的粒子數(shù)量之間的映射關(guān)系,可以是一對(duì)一的關(guān)系。例如,不同的性能參數(shù)對(duì)應(yīng)不同的預(yù)加載粒子數(shù)量,并且每個(gè)性能參數(shù)對(duì)應(yīng)的預(yù)加載粒子數(shù)量不同。[0110]在一些示例中,顯示設(shè)備的性能參數(shù)與預(yù)加載的粒子數(shù)量之間的映射關(guān)系,也可以是多對(duì)一的關(guān)系。例如,可以將性能參數(shù)劃分為多個(gè)區(qū)間范圍,并對(duì)每個(gè)區(qū)間范圍設(shè)置相應(yīng)的預(yù)加載粒子數(shù)量。[0111]例如,可以將性能參數(shù)劃分為第一性能參數(shù)區(qū)間范圍、第二性能參數(shù)區(qū)間范圍和第三性能參數(shù)區(qū)間范圍;并且第一性能參數(shù)區(qū)間范圍對(duì)應(yīng)高端設(shè)備,第二性能參數(shù)區(qū)間范圍對(duì)應(yīng)中端設(shè)備,第三性能參數(shù)區(qū)間范圍對(duì)應(yīng)低端設(shè)備;高端設(shè)備、中端設(shè)備、低端設(shè)備對(duì)[0112]本實(shí)施例通過(guò)根據(jù)顯示設(shè)備的實(shí)際性能自動(dòng)調(diào)整粒子的數(shù)量,確保在各種硬件條件下都能實(shí)現(xiàn)最佳的可視化渲染效果,同時(shí)保持低延遲和高響應(yīng)速度。[0113]為了使視覺(jué)展示效果更加貼近用戶的實(shí)際偏好,在一些實(shí)施例中,可以收集用戶對(duì)目標(biāo)視覺(jué)展示效果的反饋數(shù)據(jù),并基于該反饋數(shù)據(jù)對(duì)上述映射關(guān)系進(jìn)行更新。[0114]其中,反饋數(shù)據(jù)中包括用戶對(duì)目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù);基于反饋數(shù)據(jù),對(duì)映射關(guān)系進(jìn)行更新,包括:基于用戶對(duì)目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù),更新映射關(guān)[0115]其中,交互行為數(shù)據(jù)包括手動(dòng)調(diào)整語(yǔ)音輸入界面的尺寸(如縮小、放大等)、頻繁切換動(dòng)態(tài)紋理效果、目標(biāo)視覺(jué)展示效果的使用時(shí)長(zhǎng)等。[0116]在將目標(biāo)視覺(jué)展示效果呈現(xiàn)給用戶之后,如果用戶對(duì)某一情緒狀態(tài)下的視覺(jué)展示效果不滿意,可以手動(dòng)調(diào)整該情緒狀態(tài)下的視覺(jué)展示效果。通過(guò)記錄用戶的該些交互行為數(shù)據(jù),可以進(jìn)一步優(yōu)化上述映射關(guān)系,使其更加符合用戶的個(gè)人偏好。[0117]本申請(qǐng)的實(shí)施例中,在特征提取部分耗時(shí)25ms,情緒分類推理部分耗時(shí)35ms,可視化渲染部分耗時(shí)40ms,整體耗時(shí)小于或等于100ms。如此,能夠確保為用戶提供即時(shí)響應(yīng),提供流暢無(wú)縫的交互體驗(yàn)。無(wú)論是在實(shí)時(shí)語(yǔ)音情感分析的應(yīng)用場(chǎng)景下,還是在需要迅速反饋的互動(dòng)式媒體環(huán)境中,對(duì)于提升用戶體驗(yàn)至關(guān)重要。[0118]示例性裝置與上述的語(yǔ)音輸入的處理方法對(duì)應(yīng)的,本申請(qǐng)實(shí)施例還提供了一種語(yǔ)音輸入的處理裝置。圖6是本申請(qǐng)實(shí)施例提供的一種語(yǔ)音輸入的處理裝置的結(jié)構(gòu)示意圖。如圖6所示,本申請(qǐng)實(shí)施例提供的語(yǔ)音輸入的處理裝置包括:識(shí)別單元601、確定單元602和呈現(xiàn)單元603;其中,識(shí)別單元601,識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài);確定單元602,用于基于預(yù)設(shè)的情緒狀態(tài)與視覺(jué)展示效果之間的映射關(guān)系,確定與所述用戶的情緒狀態(tài)匹配的目標(biāo)視覺(jué)展示效果,所述目標(biāo)視覺(jué)展示效果用于可視化地展示所述用戶的情緒狀態(tài);呈現(xiàn)單元603,用于在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中,呈現(xiàn)所述目標(biāo)視覺(jué)展示效果。[0119]在一些實(shí)施例中,所述視覺(jué)展示效果包括HSL顏色空間的色彩參數(shù)、所述語(yǔ)音信號(hào)的波形中包含的粒子的速度、所述語(yǔ)音輸入界面的形變參數(shù)和動(dòng)態(tài)紋理參數(shù)中至少一項(xiàng)。[0120]在一些實(shí)施例中,呈現(xiàn)單元603在所述語(yǔ)音信號(hào)對(duì)應(yīng)的語(yǔ)音輸入界面中,呈現(xiàn)所述目標(biāo)視覺(jué)展示效果,包括:調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至所述目標(biāo)視覺(jué)展示效果。[0121]在一些實(shí)施例中,在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)色彩參數(shù)和/或所述語(yǔ)音輸入界面的目標(biāo)形變參數(shù)的情況下;其中,所述呈現(xiàn)單元603調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至所述目標(biāo)視覺(jué)展示效果,包括:調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù);和/或,調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。[0122]在一些實(shí)施例中,所述呈現(xiàn)單元603調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù),包括:確定所述色彩參數(shù)的調(diào)整步長(zhǎng)值;基于所述色彩參數(shù)的調(diào)整步長(zhǎng)值,調(diào)整所述語(yǔ)音輸入界面的當(dāng)前色彩參數(shù)漸變至所述目標(biāo)色彩參數(shù)。[0123]在一些實(shí)施例中,所述色彩參數(shù)包括色相參數(shù)和/或飽和度參數(shù);其中,所述呈現(xiàn)單元603確定所述色彩參數(shù)的調(diào)整步長(zhǎng)值,包括:基于所述語(yǔ)音輸入界面的當(dāng)前色相參數(shù)與目標(biāo)色相參數(shù)之間的色相參數(shù)差值,以及預(yù)設(shè)調(diào)整比例的乘積,確定所述色相參數(shù)的調(diào)整[0124]在一些實(shí)施例中,所述呈現(xiàn)單元603調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù),包括:基于所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)各自對(duì)應(yīng)的權(quán)重,對(duì)所述當(dāng)前形變參數(shù)與所述目標(biāo)形變參數(shù)進(jìn)行加權(quán)求和,并將加權(quán)求和結(jié)果確定為所述形變參數(shù)的調(diào)整步長(zhǎng)值;基于所述形變參數(shù)的調(diào)整步長(zhǎng)值,調(diào)整所述語(yǔ)音輸入界面的當(dāng)前形變參數(shù)漸變至所述目標(biāo)形變參數(shù)。[0125]在一些實(shí)施例中,在所述目標(biāo)視覺(jué)展示效果包括目標(biāo)粒子速度時(shí),所述呈現(xiàn)單元603調(diào)整所述語(yǔ)音輸入界面的當(dāng)前視覺(jué)展示效果,使其漸變至所述目標(biāo)視覺(jué)展示效果,還包括:基于顯示設(shè)備的性能參數(shù),確定預(yù)加載的粒子的目標(biāo)數(shù)量;通過(guò)We預(yù)加載所述目標(biāo)數(shù)量的粒子,并基于所述目標(biāo)粒子速度,渲染所述目標(biāo)視覺(jué)展示效果。[0126]在一些實(shí)施例中,所述識(shí)別單元601識(shí)別用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài),包括:獲取各個(gè)模態(tài)下的輸入數(shù)據(jù),所述各個(gè)模態(tài)下的輸入數(shù)據(jù)包括所述語(yǔ)音信號(hào)、所述語(yǔ)音信號(hào)對(duì)應(yīng)的文本數(shù)據(jù)、所述用戶輸入所述語(yǔ)音信號(hào)時(shí)的視頻數(shù)據(jù)和心率數(shù)據(jù)中至少一項(xiàng);針對(duì)所述各個(gè)模態(tài)中每個(gè)模態(tài),對(duì)該模態(tài)下的輸入數(shù)據(jù)進(jìn)行特征提取,得到該模態(tài)下的特征表示;基于所述各個(gè)模態(tài)下的特征表示,得到綜合特征;根據(jù)所述綜合特征,識(shí)別所述用戶輸入語(yǔ)音信號(hào)時(shí)的情緒狀態(tài)。[0127]在一些實(shí)施例中,所述裝置還包括:更新單元604,用于獲取所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的反饋數(shù)據(jù);基于所述反饋數(shù)據(jù),對(duì)所述映射關(guān)系進(jìn)行更新。[0128]在一些實(shí)施例中,所述反饋數(shù)據(jù)中包括所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù);其中,所述更新單元604基于所述反饋數(shù)據(jù),對(duì)所于所述用戶對(duì)所述目標(biāo)視覺(jué)展示效果的交互行為數(shù)據(jù),更新所述映射關(guān)系,以使所述映射關(guān)系符合所述用戶的偏好。[0129]本實(shí)施例提供的語(yǔ)音輸入的處理裝置,與本申請(qǐng)上述實(shí)施例所提供的語(yǔ)音輸入的處理方法屬于同一申請(qǐng)構(gòu)思,可執(zhí)行本申請(qǐng)上述任意實(shí)施例所提供的語(yǔ)音輸入的處理方法,具備執(zhí)行語(yǔ)音輸入的處理方法相應(yīng)的功能模塊和有益效果。未在本實(shí)施例中詳盡描述的技術(shù)細(xì)節(jié),可參見(jiàn)本申請(qǐng)上述實(shí)施例提供的語(yǔ)音輸入的處理方法的具體處理內(nèi)容,此處不再加以贅述。[0130]以上的識(shí)別單元601、確定單元602、呈現(xiàn)單元603和更新單元604所實(shí)現(xiàn)的功能可以分別由相同或不同的處理器實(shí)現(xiàn),本申請(qǐng)實(shí)施例不作限定。[0131]應(yīng)理解以上裝置中的單元可以以處理器調(diào)用軟件的形式實(shí)現(xiàn)。例如該裝置包括處理器,處理器與存儲(chǔ)器連接,存儲(chǔ)器中存儲(chǔ)有指令,處理器調(diào)用存儲(chǔ)器中存儲(chǔ)的指令,以實(shí)現(xiàn)以上任一種方法或?qū)崿F(xiàn)該裝置各單元的功能,其中處理器可以為通用處理器,例如CPU或微處理器等,存儲(chǔ)器可以為裝置內(nèi)的存儲(chǔ)器或裝置外的存儲(chǔ)器?;蛘撸b置中的單元可以以硬件電路的形式實(shí)現(xiàn),可以通過(guò)對(duì)硬件電路的設(shè)計(jì),實(shí)現(xiàn)部分或全部單元的功能,該硬件電路可以理解為一個(gè)或多個(gè)處理器;例如,在一種實(shí)現(xiàn)中,該硬件電路為ASIC,通過(guò)對(duì)電路內(nèi)元件邏輯關(guān)系的設(shè)計(jì),實(shí)現(xiàn)以上部分或全部單元的功能;再如,在另一種實(shí)現(xiàn)中,該硬件電路可以通過(guò)PLD實(shí)現(xiàn),以FPGA為例,其可以包括大量邏輯門電路,通過(guò)配置文件門電路之間的連接關(guān)系,從而實(shí)現(xiàn)以上部分或全部單元的功能。以上裝置的所有單元可以全部通過(guò)處理器調(diào)用軟件的形式實(shí)現(xiàn),或全部通過(guò)硬件電路的形式實(shí)現(xiàn),或部分通過(guò)處理器調(diào)用軟件的形式實(shí)現(xiàn),剩余部分通過(guò)硬件電路的形式實(shí)現(xiàn)。[0132]在本申請(qǐng)實(shí)施例中,處理器是一種具有信號(hào)的處理能力的電路,在一種實(shí)現(xiàn)中,處實(shí)現(xiàn)中,處理器可以通過(guò)硬件電路的邏輯關(guān)系實(shí)現(xiàn)一定功能,該硬件電路的邏輯關(guān)系是固定的或可以重構(gòu)的,例如處理器為ASIC或PLD實(shí)現(xiàn)的硬件電路,例如FPGA等。在可重構(gòu)的硬件電路中,處理器加載配置文檔,實(shí)現(xiàn)硬件電路配置的過(guò)程,可以理解為處理器加載指令,以實(shí)現(xiàn)以上部分或全部單元的功能的過(guò)程。此外,還可以是針對(duì)人工智能設(shè)計(jì)的硬件電路,[0133]可見(jiàn),以上裝置中的各單元可以是被配置成實(shí)施以上方法的一個(gè)或多個(gè)處理器中至少兩種的組合。[0134]此外,以上裝置中的各單元可以全部或部分可以集成在一起,或者可以獨(dú)立實(shí)現(xiàn)。在一種實(shí)現(xiàn)中,這些單元集成在一起,以SOC的形式實(shí)現(xiàn)。該SOC中可以包括至少一個(gè)處理器,用于實(shí)現(xiàn)以上任一種方法或?qū)崿F(xiàn)該裝置各單元的功能,該至少一個(gè)處理器的種類可以不同,例如包括CPU和FPGA,CPU和人工智能處理器,CPU和GPU等。[0135]示例性電子設(shè)備本申請(qǐng)實(shí)施例提出一種電子設(shè)備,參見(jiàn)圖7所示,該電子設(shè)備包括:存儲(chǔ)器200和處理器210;其中,所述存儲(chǔ)器200與所述處理器210連接,用所述處理器210,用于通過(guò)運(yùn)行所述存儲(chǔ)器200中存儲(chǔ)的程序,實(shí)現(xiàn)上述任一實(shí)施例公開(kāi)的語(yǔ)音輸入的處理方法。[0136]具體的,上述電子設(shè)備還可以包括:總線、通信接口220、輸入設(shè)備230和輸出設(shè)備[0137]處理器210、存儲(chǔ)器200、通信接口220、輸入設(shè)備230和輸出設(shè)備240通過(guò)總線相互總線可包括一通路,在計(jì)算機(jī)系統(tǒng)各個(gè)部件之間傳送信息。[0138]處理器210可以是通用處理器,例如通用中央處理器(CPU)、微處理器等,也可以是特定應(yīng)用集成電路(application-specificintegratedcircuit,ASIC),或一個(gè)或多個(gè)用于控制本發(fā)明方案程序執(zhí)行的集成電路。還可以是數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)成可編程門陣列(FPGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件。[0139]處理器210可包括主處理器,還可包括基帶芯片、調(diào)制解調(diào)器等。[0140]存儲(chǔ)器200中保存有執(zhí)行本發(fā)明技術(shù)方案的程序,還可以保存有操作系統(tǒng)和其他器200可以包括只讀存儲(chǔ)器(read-onlymemory,ROM)、可存儲(chǔ)靜態(tài)信息和指令的其他類型的靜態(tài)存儲(chǔ)設(shè)備、隨機(jī)存取存儲(chǔ)器(randomaccessmemory,RAM)、可存儲(chǔ)信息和指令的其[0141]輸入設(shè)備230可包括接收用戶輸入的數(shù)據(jù)和信息的裝置,例如鍵盤、鼠標(biāo)[0143]通信接口220可包括使用任何收發(fā)器一類的裝置,以便與其他設(shè)備或通信網(wǎng)絡(luò)通[0144]處理器210執(zhí)行存儲(chǔ)器200中所存放的程序,以及調(diào)用其他設(shè)備,可用于實(shí)現(xiàn)本申請(qǐng)上述實(shí)施例所提供的任意一種語(yǔ)音輸入的處理方法的各個(gè)步驟。[0145]本申請(qǐng)實(shí)施例還提出一種芯片,該芯片包括處理器和數(shù)據(jù)接口,所述處理器通過(guò)所述數(shù)據(jù)接口讀取并運(yùn)行存儲(chǔ)器上存儲(chǔ)的程序,以執(zhí)行上述任意實(shí)施例所介紹的語(yǔ)音輸入的處理方法,具體處理過(guò)程及其有益效果可參見(jiàn)上述的語(yǔ)音輸入的處理方法的實(shí)施例介[0146]示例性計(jì)算機(jī)程序產(chǎn)品和存儲(chǔ)介質(zhì)除了上述方法和設(shè)備以外,本申請(qǐng)的實(shí)施例還可以是計(jì)算機(jī)程序產(chǎn)品,其包括計(jì)算機(jī)程序指令,所述計(jì)算機(jī)程序指令在被處理器運(yùn)行時(shí)使得所述處理器執(zhí)行本說(shuō)明書上述任意實(shí)施例中描述的根據(jù)本申請(qǐng)各種實(shí)施例的語(yǔ)音輸入的處理方法中的步驟。[0147]所述計(jì)算機(jī)程序產(chǎn)品可以以一種或多種程序設(shè)計(jì)語(yǔ)言的任意組合來(lái)編寫用于執(zhí)行本申請(qǐng)實(shí)施例操作的程序代碼,所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言,諸如Java、C++等,還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言,諸如“C”語(yǔ)言或類似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶計(jì)算設(shè)備上執(zhí)行、部分地在用戶設(shè)備上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算設(shè)備上部分在遠(yuǎn)程計(jì)算設(shè)備上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算設(shè)備或服務(wù)器上執(zhí)行。[0148]此外,本申請(qǐng)的實(shí)施例還可以是存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行本說(shuō)明書上述任意實(shí)施例中描述的根據(jù)本申請(qǐng)各種實(shí)施例的語(yǔ)音輸入的處理方法中的步驟,具體可以實(shí)現(xiàn)以上方法的步驟。[0149]對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請(qǐng)并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本申請(qǐng),某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論