CN119889276A 一種車載發(fā)音人合成系統(tǒng)、方法、電子設(shè)備及存儲(chǔ)介質(zhì) (奇瑞汽車股份有限公司)_第1頁(yè)
CN119889276A 一種車載發(fā)音人合成系統(tǒng)、方法、電子設(shè)備及存儲(chǔ)介質(zhì) (奇瑞汽車股份有限公司)_第2頁(yè)
CN119889276A 一種車載發(fā)音人合成系統(tǒng)、方法、電子設(shè)備及存儲(chǔ)介質(zhì) (奇瑞汽車股份有限公司)_第3頁(yè)
CN119889276A 一種車載發(fā)音人合成系統(tǒng)、方法、電子設(shè)備及存儲(chǔ)介質(zhì) (奇瑞汽車股份有限公司)_第4頁(yè)
CN119889276A 一種車載發(fā)音人合成系統(tǒng)、方法、電子設(shè)備及存儲(chǔ)介質(zhì) (奇瑞汽車股份有限公司)_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(72)發(fā)明人崔利軍胡瑞雪詹茂鑫蔣克宇有限公司11594及存儲(chǔ)介質(zhì)本發(fā)明涉及/屬于屬于車載語(yǔ)音技術(shù)領(lǐng)域,用戶的聲音樣本生成的聲源數(shù)據(jù)包;云端服務(wù)人5、發(fā)音2移動(dòng)聯(lián)網(wǎng)設(shè)備,用于獲取通過(guò)錄制用戶的聲音樣本生成的聲源數(shù)據(jù)包;云端服務(wù)器,與所述移動(dòng)聯(lián)網(wǎng)設(shè)備通信,用于接收所述移動(dòng)聯(lián)網(wǎng)設(shè)備上傳的所述聲源數(shù)據(jù)包,將所述聲源數(shù)據(jù)包輸入語(yǔ)音合成模型進(jìn)行語(yǔ)音合成處理,得到語(yǔ)音合成數(shù)據(jù)包;車載多媒體主機(jī),用于接收所述語(yǔ)音合成數(shù)據(jù)包,將所述語(yǔ)音合成數(shù)據(jù)包導(dǎo)入所述車載多媒體主機(jī)的語(yǔ)音模塊,得到自定義發(fā)音人。2.根據(jù)權(quán)利要求1所述的一種車載發(fā)音人合成系統(tǒng),其特征在于,包括:所述移動(dòng)聯(lián)網(wǎng)設(shè)備,還用于通過(guò)自身的錄音設(shè)備錄制用戶的聲音樣本,得到所述聲源數(shù)據(jù)包。3.根據(jù)權(quán)利要求1所述的一種車載發(fā)音人合成系統(tǒng),其特征在于,還包括:所述移動(dòng)聯(lián)網(wǎng)設(shè)備,還用于從所述云端服務(wù)器下載所述語(yǔ)音合成數(shù)據(jù)包,并上傳至移動(dòng)存儲(chǔ)設(shè)備;所述移動(dòng)存儲(chǔ)設(shè)備,還用于將所述語(yǔ)音合成數(shù)據(jù)包上傳至所述車載多媒體主機(jī)。4.根據(jù)權(quán)利要求3所述的一種車載發(fā)音人合成系統(tǒng),其特征在于,包括:所述移動(dòng)存儲(chǔ)設(shè)備,與所述移動(dòng)聯(lián)網(wǎng)設(shè)備連接,還用于將預(yù)存的所述聲源數(shù)據(jù)包上傳至所述移動(dòng)聯(lián)網(wǎng)設(shè)備。5.根據(jù)權(quán)利要求4所述的一種車載發(fā)音人合成系統(tǒng),其特征在于,包括:車載多媒體主機(jī),還用于通過(guò)自身的錄音設(shè)備錄制用戶的聲音樣本,得到所述聲源數(shù)所述移動(dòng)存儲(chǔ)設(shè)備,用于從所述車載多媒體主機(jī)下載所述聲源數(shù)據(jù)包。6.根據(jù)權(quán)利要求1所述的一種車載發(fā)音人合成系統(tǒng),其特征在于,所述聲源數(shù)據(jù)包的音頻為用戶的單人音頻,聲音內(nèi)容為預(yù)設(shè)的一段話術(shù)。7.根據(jù)權(quán)利要求1所述的一種車載發(fā)音人合成系統(tǒng),其特征在于,所述云端服務(wù)器包音頻處理模塊,用于對(duì)所述聲源數(shù)據(jù)包進(jìn)行預(yù)處理,并進(jìn)行特征提取,得到特征提取數(shù)音頻分析模塊,用于將所述特征提取數(shù)據(jù)與預(yù)設(shè)的語(yǔ)音數(shù)據(jù)庫(kù)進(jìn)行對(duì)比,得到比對(duì)結(jié)果,基于所述比對(duì)結(jié)果進(jìn)行音頻特征個(gè)性化調(diào)整,得到個(gè)性化音頻數(shù)據(jù);語(yǔ)音合成模塊,用于將所述個(gè)性化音頻數(shù)據(jù)輸入語(yǔ)音合成模型,進(jìn)行語(yǔ)音合成處理,得到語(yǔ)音合成數(shù)據(jù)包。獲取通過(guò)錄制用戶的聲音樣本生成的聲源數(shù)據(jù)包;將所述聲源數(shù)據(jù)包輸入語(yǔ)音合成模型進(jìn)行語(yǔ)音合成處理,得到語(yǔ)音合成數(shù)據(jù)包;將所述語(yǔ)音合成數(shù)據(jù)包導(dǎo)入車載多媒體主機(jī),在所述車載多媒體主機(jī)的主界面對(duì)所述語(yǔ)音合成數(shù)據(jù)包進(jìn)行配置,得到自定義發(fā)音人。9.一種電子設(shè)備,其特征在于,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求8所述的方法。10.一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求8所述的方法。3技術(shù)領(lǐng)域[0001]本發(fā)明屬于車載語(yǔ)音技術(shù)領(lǐng)域,尤其涉及一種車載發(fā)音人合成系統(tǒng)、方法、電子設(shè)備及存儲(chǔ)介質(zhì)。背景技術(shù)[0002]隨著汽車產(chǎn)業(yè)的快速發(fā)展,汽車越來(lái)越智能化,人機(jī)交互能力得到很大提升。車載多媒體主機(jī)是人機(jī)交互的重要組成部分,車載多媒體主機(jī)內(nèi)部設(shè)置有語(yǔ)音交互系統(tǒng),駕駛員或乘客可以通過(guò)語(yǔ)音命令與語(yǔ)音交互系統(tǒng)進(jìn)行互動(dòng),語(yǔ)音交互系統(tǒng)可以處理用戶的語(yǔ)音命令,并執(zhí)行相應(yīng)的操作,包括但不限于導(dǎo)航設(shè)置、音樂(lè)播放控制、電[0003]現(xiàn)有技術(shù)中,語(yǔ)音交互系統(tǒng)包括在線語(yǔ)音功能和離線語(yǔ)音功能,在線語(yǔ)音功能需要互聯(lián)網(wǎng)連接來(lái)處理復(fù)雜的語(yǔ)音指令,通常能提供更準(zhǔn)確的響應(yīng)和服務(wù)。離線語(yǔ)音功能無(wú)需網(wǎng)絡(luò)連接即可工作,適用于基本的功能操作,但可能在復(fù)雜任務(wù)上表現(xiàn)不佳。[0004]現(xiàn)有技術(shù)存在以下技術(shù)問(wèn)題:[0005]現(xiàn)有的語(yǔ)音交互系統(tǒng)中,發(fā)音人只能根據(jù)車輛出廠時(shí)提供的幾種定制發(fā)音人進(jìn)行有限的選擇,不支持用戶自定義,無(wú)法滿足用戶的個(gè)性化需求。發(fā)明內(nèi)容[0006]本發(fā)明提供了一種車載發(fā)音人合成系統(tǒng)、方法、電子設(shè)備及存儲(chǔ)介質(zhì),旨在解決上述現(xiàn)有技術(shù)中存在的現(xiàn)有的語(yǔ)音交互系統(tǒng)中,發(fā)音人只能根據(jù)車輛出廠時(shí)提供的幾種定制發(fā)音人進(jìn)行有限的選擇,不支持用戶自定義,無(wú)法滿足用戶的個(gè)性化需求的技術(shù)問(wèn)題。[0008]移動(dòng)聯(lián)網(wǎng)設(shè)備,用于獲取通過(guò)錄制用戶的聲音樣本生成的聲源數(shù)據(jù)包;[0009]云端服務(wù)器,與所述移動(dòng)聯(lián)網(wǎng)設(shè)備通信,用于接收所述移動(dòng)聯(lián)網(wǎng)設(shè)備上傳的所述聲源數(shù)據(jù)包,將所述聲源數(shù)據(jù)包輸入語(yǔ)音合成模型進(jìn)行語(yǔ)音合成處理,得到語(yǔ)音合成數(shù)據(jù)[0010]車載多媒體主機(jī),用于接收所述語(yǔ)音合成數(shù)據(jù)包,將所述語(yǔ)音合成數(shù)據(jù)包導(dǎo)入所述車載多媒體主機(jī)的語(yǔ)音模塊,得到自定義發(fā)音人。[0011]采用上述技術(shù)方案,本發(fā)明的有益效果為:本發(fā)明用戶可以通過(guò)錄制自己的聲音樣本,生成自定義的發(fā)音人,大大增加了語(yǔ)音交互系統(tǒng)的個(gè)性化選擇,滿足不同用戶的需[0013]所述移動(dòng)聯(lián)網(wǎng)設(shè)備,還用于通過(guò)自身的錄音設(shè)備錄制用戶的聲音樣本,得到所述聲源數(shù)據(jù)包。[0015]所述移動(dòng)聯(lián)網(wǎng)設(shè)備,還用于從所述云端服務(wù)器下載所述語(yǔ)音合成數(shù)據(jù)包,并上傳4至移動(dòng)存儲(chǔ)設(shè)備;[0016]所述移動(dòng)存儲(chǔ)設(shè)備,還用于將所述語(yǔ)音合成數(shù)據(jù)包上傳至所述車載多媒體主機(jī)。[0018]所述移動(dòng)存儲(chǔ)設(shè)備,與所述移動(dòng)聯(lián)網(wǎng)設(shè)備連接,還用于將預(yù)存的所述聲源數(shù)據(jù)包上傳至所述移動(dòng)聯(lián)網(wǎng)設(shè)備。[0019]進(jìn)一步,上述包括:[0020]車載多媒體主機(jī),還用于通過(guò)自身的錄音設(shè)備錄制用戶的聲音樣本,得到所述聲源數(shù)據(jù)包;[0021]所述移動(dòng)存儲(chǔ)設(shè)備,用于從所述車載多媒體主機(jī)下載所述聲源數(shù)據(jù)包。[0022]進(jìn)一步,上述所述聲源數(shù)據(jù)包的音頻為用戶的單人音頻,聲音內(nèi)容為預(yù)設(shè)的一段話術(shù)。[0023]進(jìn)一步,上述所述云端服務(wù)器包括:[0024]音頻處理模塊,用于對(duì)所述聲源數(shù)據(jù)包進(jìn)行預(yù)處理,并進(jìn)行特征提取,得到特征提取數(shù)據(jù);[0025]音頻分析模塊,用于將所述特征提取數(shù)據(jù)與預(yù)設(shè)的語(yǔ)音數(shù)據(jù)庫(kù)進(jìn)行對(duì)比,得到比對(duì)結(jié)果,基于所述比對(duì)結(jié)果進(jìn)行音頻特征個(gè)性化調(diào)整,得到個(gè)性化音頻數(shù)據(jù);[0026]語(yǔ)音合成模塊,用于將所述個(gè)性化音頻數(shù)據(jù)輸入語(yǔ)音合成模型,進(jìn)行語(yǔ)音合成處理,得到語(yǔ)音合成數(shù)據(jù)包。[0027]第二方面,本發(fā)明為了解決上述技術(shù)問(wèn)題還提供了一種車載發(fā)音人合成方法,包[0028]獲取通過(guò)錄制用戶的聲音樣本生成的聲源數(shù)據(jù)包;[0029]將所述聲源數(shù)據(jù)包輸入語(yǔ)音合成模型進(jìn)行語(yǔ)音合成處理,得到語(yǔ)音合成數(shù)據(jù)包;[0030]將所述語(yǔ)音合成數(shù)據(jù)包導(dǎo)入車載多媒體主機(jī),在所述車載多媒體主機(jī)的主界面對(duì)所述語(yǔ)音合成數(shù)據(jù)包進(jìn)行配置,得到自定義發(fā)音人。[0031]第三方面,本發(fā)明為了解決上述技術(shù)問(wèn)題還提供了一種電子設(shè)備,該電子設(shè)備包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,處理器執(zhí)行該計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)本申請(qǐng)的車載發(fā)音人合成方法。[0032]第四方面,本發(fā)明為了解決上述技術(shù)問(wèn)題還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本申請(qǐng)的車載發(fā)音人合成方法。[0033]與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點(diǎn):[0034]1.用戶可以通過(guò)錄制自己的聲音樣本,生成自定義的發(fā)音人,大大增加了語(yǔ)音交互系統(tǒng)的個(gè)性化選擇,滿足不同用戶的需求。[0035]2.本發(fā)明系統(tǒng)支持多種設(shè)備(移動(dòng)聯(lián)網(wǎng)設(shè)備、車載多媒體主機(jī))錄制聲音樣本,提高了系統(tǒng)的靈活性和便利性。[0036]3.本發(fā)明云端服務(wù)器通過(guò)先進(jìn)的音頻處理和語(yǔ)音合成技術(shù),確保生成的自定義發(fā)音人具有高質(zhì)量的語(yǔ)音合成效果。[0037]4.本發(fā)明用戶只需簡(jiǎn)單操作即可完成聲音樣本的錄制和自定義發(fā)音人的生成,操作簡(jiǎn)便。5[0038]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書(shū)中闡述,并且,部分地從說(shuō)明書(shū)中變得顯而易見(jiàn),或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在說(shuō)明書(shū)、權(quán)利要求書(shū)以及附圖中所指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。附圖說(shuō)明[0039]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。[0040]圖1示出了根據(jù)本發(fā)明實(shí)施例1的一種車載發(fā)音人合成系統(tǒng)的流程示意圖;[0041]圖2示出了根據(jù)本發(fā)明實(shí)施例2的一種車載發(fā)音人合成系統(tǒng)的流程示意圖;[0042]圖3示出了根據(jù)本發(fā)明實(shí)施例3的一種車載發(fā)音人合成系統(tǒng)的流程示意圖;[0043]圖4示出了根據(jù)本發(fā)明實(shí)施例的一種車載發(fā)音人合成方法的流程示意圖;[0044]圖5示出了根據(jù)本發(fā)明實(shí)施例的一種電子設(shè)備結(jié)構(gòu)示意圖。具體實(shí)施方式[0045]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地說(shuō)明,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。[0047]圖1示出了根據(jù)本發(fā)明實(shí)施例1的一種車載發(fā)音人合成系統(tǒng)的流程示意圖,如圖1[0048]移動(dòng)聯(lián)網(wǎng)設(shè)備,用于獲取通過(guò)錄制用戶的聲音樣本生成的聲源數(shù)據(jù)包;[0049]云端服務(wù)器,與所述移動(dòng)聯(lián)網(wǎng)設(shè)備通信,用于接收所述移動(dòng)聯(lián)網(wǎng)設(shè)備上傳的所述聲源數(shù)據(jù)包,將所述聲源數(shù)據(jù)包輸入語(yǔ)音合成模型進(jìn)行語(yǔ)音合成處理,得到語(yǔ)音合成數(shù)據(jù)[0050]車載多媒體主機(jī),用于接收所述語(yǔ)音合成數(shù)據(jù)包,將所述語(yǔ)音合成數(shù)據(jù)包導(dǎo)入所述車載多媒體主機(jī)的語(yǔ)音模塊,得到自定義發(fā)音人。[0052]音頻處理模塊,用于對(duì)所述聲源數(shù)據(jù)包進(jìn)行預(yù)處理,并進(jìn)行特征提取,得到特征提取數(shù)據(jù);[0053]音頻分析模塊,用于將所述特征提取數(shù)據(jù)與預(yù)設(shè)的語(yǔ)音數(shù)據(jù)庫(kù)進(jìn)行對(duì)比,得到比對(duì)結(jié)果,基于所述比對(duì)結(jié)果進(jìn)行音頻特征個(gè)性化調(diào)整,得到個(gè)性化音頻數(shù)據(jù);[0054]語(yǔ)音合成模塊,用于將所述個(gè)性化音頻數(shù)據(jù)輸入語(yǔ)音合成模型,進(jìn)行語(yǔ)音合成處[0055]可選的,所述移動(dòng)聯(lián)網(wǎng)設(shè)備,還用于通過(guò)自身的錄音設(shè)備錄制用戶的聲音樣本,得到所述聲源數(shù)據(jù)包。[0056]綜上所述,本實(shí)施例1中,首先需要準(zhǔn)備高質(zhì)量的音頻材料。這些音頻材料應(yīng)該是6單個(gè)人的、無(wú)噪音和無(wú)背景音的,需要在安靜的環(huán)境中進(jìn)行錄制。因此本實(shí)施例1中使用移動(dòng)聯(lián)網(wǎng)設(shè)備錄制,比如手機(jī)。用戶使用移動(dòng)聯(lián)網(wǎng)設(shè)備錄制一段聲音,要求使用特定的一段話術(shù),以確保能準(zhǔn)確識(shí)別到聲音的各項(xiàng)參數(shù)。最終得到聲源數(shù)據(jù)包。[0057]本實(shí)施例1中,車載多媒體主機(jī)直接通過(guò)網(wǎng)絡(luò)從云端服務(wù)器將語(yǔ)音合成數(shù)據(jù)包下載下來(lái)。然后在主界面上選擇使用自定義發(fā)音人,即可完成設(shè)置。[0058]實(shí)施例2[0059]圖2示出了根據(jù)本發(fā)明實(shí)施例2的一種車載發(fā)音人合成系統(tǒng)的流程示意圖,如圖2[0060]移動(dòng)聯(lián)網(wǎng)設(shè)備,用于獲取通過(guò)錄制用戶的聲音樣本生成的聲源數(shù)據(jù)包;[0061]云端服務(wù)器,與所述移動(dòng)聯(lián)網(wǎng)設(shè)備通信,用于接收所述移動(dòng)聯(lián)網(wǎng)設(shè)備上傳的所述聲源數(shù)據(jù)包,將所述聲源數(shù)據(jù)包輸入語(yǔ)音合成模型進(jìn)行語(yǔ)音合成處理,得到語(yǔ)音合成數(shù)據(jù)[0062]車載多媒體主機(jī),用于接收所述語(yǔ)音合成數(shù)據(jù)包,將所述語(yǔ)音合成數(shù)據(jù)包導(dǎo)出為自定義發(fā)音人供用戶選擇。[0064]音頻處理模塊,用于對(duì)所述聲源數(shù)據(jù)包進(jìn)行預(yù)處理,并進(jìn)行特征提取,得到特征提取數(shù)據(jù);[0065]音頻分析模塊,用于將所述特征提取數(shù)據(jù)與預(yù)設(shè)的語(yǔ)音數(shù)據(jù)庫(kù)進(jìn)行對(duì)比,得到比對(duì)結(jié)果,基于所述比對(duì)結(jié)果進(jìn)行音頻特征個(gè)性化調(diào)整,得到個(gè)性化音頻數(shù)據(jù);[0066]語(yǔ)音合成模塊,用于將所述個(gè)性化音頻數(shù)據(jù)輸入語(yǔ)音合成模型,進(jìn)行語(yǔ)音合成處[0067]可選的,所述移動(dòng)聯(lián)網(wǎng)設(shè)備,還用于從所述云端服務(wù)器下載所述語(yǔ)音合成數(shù)據(jù)包,并上傳至移動(dòng)存儲(chǔ)設(shè)備;[0068]所述移動(dòng)存儲(chǔ)設(shè)備,還用于將所述語(yǔ)音合成數(shù)據(jù)包上傳至所述車載多媒體主機(jī)。[0069]綜上所述,本實(shí)施例2中,首先需要準(zhǔn)備高質(zhì)量的音頻材料。這些音頻材料應(yīng)該是單個(gè)人的、無(wú)噪音和無(wú)背景音的,需要在安靜的環(huán)境中進(jìn)行錄制。因此本實(shí)施例2中使用移動(dòng)聯(lián)網(wǎng)設(shè)備錄制,比如手機(jī)。用戶使用移動(dòng)聯(lián)網(wǎng)設(shè)備錄制一段聲音,要求使用特定的一段話術(shù),以確保能準(zhǔn)確識(shí)別到聲音的各項(xiàng)參數(shù)。最終得到聲源數(shù)據(jù)包。[0070]本實(shí)施例2中,云端服務(wù)器生成語(yǔ)音合成數(shù)據(jù)包后,移動(dòng)聯(lián)網(wǎng)設(shè)備通過(guò)網(wǎng)絡(luò)從云端服務(wù)器將語(yǔ)音合成數(shù)據(jù)包下載下來(lái)。然后移動(dòng)聯(lián)網(wǎng)設(shè)備連接移動(dòng)存儲(chǔ)設(shè)備,將語(yǔ)音合成數(shù)據(jù)包導(dǎo)入移動(dòng)存儲(chǔ)設(shè)備;將移動(dòng)存儲(chǔ)設(shè)備連接車載多媒體主機(jī),在車載多媒體主機(jī)上選擇發(fā)音人導(dǎo)入,將語(yǔ)音合成數(shù)據(jù)包導(dǎo)入車載多媒體主機(jī)。然后在主界面上選擇使用自定義發(fā)[0071]實(shí)施例3[0072]圖3示出了根據(jù)本發(fā)明實(shí)施例3的一種車載發(fā)音人合成系統(tǒng)的流程示意圖,如圖3[0073]移動(dòng)聯(lián)網(wǎng)設(shè)備,用于獲取通過(guò)錄制用戶的聲音樣本生成的聲源數(shù)據(jù)包;[0074]云端服務(wù)器,與所述移動(dòng)聯(lián)網(wǎng)設(shè)備通信,用于接收所述移動(dòng)聯(lián)網(wǎng)設(shè)備上傳的所述聲源數(shù)據(jù)包,將所述聲源數(shù)據(jù)包輸入語(yǔ)音合成模型進(jìn)行語(yǔ)音合成處理,得到語(yǔ)音合成數(shù)據(jù)7[0075]車載多媒體主機(jī),用于接收所述語(yǔ)音合成數(shù)據(jù)包,將所述語(yǔ)音合成數(shù)據(jù)包導(dǎo)出為自定義發(fā)音人供用戶選擇。[0076]其中,車載多媒體主機(jī)和云端服務(wù)器均可增加發(fā)音人參數(shù)調(diào)節(jié)設(shè)置(如音量、語(yǔ)調(diào)、語(yǔ)速等參數(shù)設(shè)置),如用戶對(duì)云端服務(wù)器自動(dòng)合成的發(fā)音人效果不滿意,則可以自定義調(diào)節(jié)聲音參數(shù)并保存,從而達(dá)到自己需要的理想發(fā)音人的狀態(tài)。[0078]音頻處理模塊,用于對(duì)所述聲源數(shù)據(jù)包進(jìn)行預(yù)處理,并進(jìn)行特征提取,得到特征提取數(shù)據(jù);[0079]音頻分析模塊,用于將所述特征提取數(shù)據(jù)與預(yù)設(shè)的語(yǔ)音數(shù)據(jù)庫(kù)進(jìn)行對(duì)比,得到比對(duì)結(jié)果,基于所述比對(duì)結(jié)果進(jìn)行音頻特征個(gè)性化調(diào)整,得到個(gè)性化音頻數(shù)據(jù);[0080]語(yǔ)音合成模塊,用于將所述個(gè)性化音頻數(shù)據(jù)輸入語(yǔ)音合成模型,進(jìn)行語(yǔ)音合成處[0081]其中,若無(wú)法使用云端服務(wù)器,也可使用本地計(jì)算機(jī)設(shè)備搭建合成平臺(tái)進(jìn)行處理。[0082]可選的,所述移動(dòng)聯(lián)網(wǎng)設(shè)備,還用于從所述云端服務(wù)器下載所述語(yǔ)音合成數(shù)據(jù)包,并上傳至移動(dòng)存儲(chǔ)設(shè)備;[0083]所述移動(dòng)存儲(chǔ)設(shè)備,還用于將所述語(yǔ)音合成數(shù)據(jù)包上傳至所述車載多媒體主機(jī)。[0084]可選的,所述移動(dòng)存儲(chǔ)設(shè)備,與所述移動(dòng)聯(lián)網(wǎng)設(shè)備連接,還用于將預(yù)存的所述聲源數(shù)據(jù)包上傳至所述移動(dòng)聯(lián)網(wǎng)設(shè)備。[0085]可選的,所述車載多媒體主機(jī),還用于通過(guò)自身的錄音設(shè)備錄制用戶的聲音樣本,得到所述聲源數(shù)據(jù)包;[0086]所述移動(dòng)存儲(chǔ)設(shè)備,用于從所述車載多媒體主機(jī)下載所述聲源數(shù)據(jù)包。[0087]其中,上傳聲源數(shù)據(jù)包時(shí)也可以一次上傳多個(gè)聲源數(shù)據(jù)包,云端服務(wù)器可以同時(shí)并行制作多個(gè)語(yǔ)音合成數(shù)據(jù)包,減少重復(fù)工作節(jié)省時(shí)間。車載多媒體主機(jī)上的用戶界面可以預(yù)留多個(gè)自定義發(fā)音人選項(xiàng),并增加自定義名稱,更便于用戶選擇。[0088]綜上所述,本實(shí)施例3中,首先需要準(zhǔn)備高質(zhì)量的音頻材料。這些音頻材料應(yīng)該是單個(gè)人的、無(wú)噪音和無(wú)背景音的,需要在安靜的環(huán)境中進(jìn)行錄制。本實(shí)施例3中使用車載多媒體主機(jī)錄制,準(zhǔn)備音頻材料時(shí),還可以采用錄音筆、錄音棚等設(shè)備進(jìn)行錄制,只要最終能滿足音頻要求,要求使用特定的一段話術(shù),以確保能準(zhǔn)確識(shí)別到聲音的各項(xiàng)參數(shù)。最終得到聲源數(shù)據(jù)包,然后通過(guò)移動(dòng)存儲(chǔ)設(shè)備將聲源數(shù)據(jù)包轉(zhuǎn)移至移動(dòng)聯(lián)網(wǎng)設(shè)備,并通過(guò)移動(dòng)聯(lián)網(wǎng)設(shè)備將所述聲源數(shù)據(jù)包上傳至云端服務(wù)器,進(jìn)行語(yǔ)音合成處理。[0089]本實(shí)施例3中,云端服務(wù)器生成語(yǔ)音合成數(shù)據(jù)包后,移動(dòng)聯(lián)網(wǎng)設(shè)備通過(guò)網(wǎng)絡(luò)從云端服務(wù)器將語(yǔ)音合成數(shù)據(jù)包下載下來(lái)。然后移動(dòng)聯(lián)網(wǎng)設(shè)備連接移動(dòng)存儲(chǔ)設(shè)備,將語(yǔ)音合成數(shù)據(jù)包導(dǎo)入移動(dòng)存儲(chǔ)設(shè)備;將移動(dòng)存儲(chǔ)設(shè)備連接車載多媒體主機(jī),在車載多媒體主機(jī)上選擇發(fā)音人導(dǎo)入,將語(yǔ)音合成數(shù)據(jù)包導(dǎo)入車載多媒體主機(jī)。然后在主界面上選擇使用自定義發(fā)[0090]基于與上述系統(tǒng)相同的原理,本發(fā)明實(shí)施例還提供了一種車載發(fā)音人合成方法,[0091]獲取通過(guò)錄制用戶的聲音樣本生成的聲源數(shù)據(jù)包;8[0092]將所述聲源數(shù)據(jù)包輸入語(yǔ)音合成模型進(jìn)行語(yǔ)音合成處理,得到語(yǔ)音合成數(shù)據(jù)包;[0093]將所述語(yǔ)音合成數(shù)據(jù)包導(dǎo)入車載多媒體主機(jī),在所述車載多媒體主機(jī)的主界面對(duì)所述語(yǔ)音合成數(shù)據(jù)包進(jìn)行配置,得到自定義發(fā)音人。[0094]本發(fā)明實(shí)施例的車載發(fā)音人合成方法可執(zhí)行本發(fā)明實(shí)施例所提供的車載發(fā)音人合成系統(tǒng),其實(shí)現(xiàn)原理相類似,本發(fā)明各實(shí)施例中的車載發(fā)音人合成方法中的各模塊、單元所執(zhí)行的動(dòng)作是與本發(fā)明各實(shí)施例中的車載發(fā)音人合成系統(tǒng)中的步驟相對(duì)應(yīng)的,對(duì)于車載發(fā)音人合成方法的各模塊的詳細(xì)功能描述具體可以參見(jiàn)前文中所示的對(duì)應(yīng)的車載發(fā)音人[0095]基于與本發(fā)明的實(shí)施例中所示的方法相同的原理,本發(fā)明的實(shí)施例中還提供了一種電子設(shè)備,該電子設(shè)備可以包括但不限于:處理器和存儲(chǔ)器;存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)程序;處理器,用于通過(guò)調(diào)用計(jì)算機(jī)程序執(zhí)行本發(fā)明任一實(shí)施例所示的方法。[0096]在一個(gè)可選實(shí)施例中提供了一種電子設(shè)備,如圖5所示,圖5所示的電子設(shè)備包括:括收發(fā)器,收發(fā)器可以用于該電子設(shè)備與其他電子設(shè)備之間的數(shù)據(jù)交互,如數(shù)據(jù)的發(fā)送和/或數(shù)據(jù)的接收等。需要說(shuō)明的是,實(shí)際應(yīng)用中收發(fā)器不限于一個(gè),該電子設(shè)備的結(jié)構(gòu)并不構(gòu)成對(duì)本發(fā)明實(shí)施例的限定。[0097]存儲(chǔ)器用于存儲(chǔ)執(zhí)行本發(fā)明方案的應(yīng)用程序代碼(計(jì)算機(jī)程序),并由處理器來(lái)控制執(zhí)行。處理器用于執(zhí)行存儲(chǔ)器中存儲(chǔ)的應(yīng)用程序代碼,以實(shí)現(xiàn)前述方法實(shí)施例所示的內(nèi)[0098]本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)其在計(jì)算機(jī)上運(yùn)行時(shí),使得計(jì)算機(jī)可以執(zhí)行前述方法實(shí)施例中相應(yīng)內(nèi)容。[0099]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序,該計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序包括計(jì)算機(jī)指令,該計(jì)算機(jī)指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中。計(jì)算機(jī)設(shè)備的處理器從計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取該計(jì)算機(jī)指令,處理器執(zhí)行該計(jì)算機(jī)指令,使得該計(jì)算機(jī)設(shè)備執(zhí)行上述各種實(shí)施例實(shí)現(xiàn)方式中提供的方法。[0100]應(yīng)該理解的是,附圖中的流程圖和框圖,圖示了按照本發(fā)明各種實(shí)施例的方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論