版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ICS33.050
M30
團(tuán)體標(biāo)準(zhǔn)
T/TAF041-2019
智能產(chǎn)品語(yǔ)音識(shí)別測(cè)評(píng)方法——第一部分
車載語(yǔ)音交互系統(tǒng)
TestingMethodsforSpeechRecognitionofIntelligentProducts
——TheFirstPartSpeechInteractionSysteminVehicle
2019–06-17發(fā)布2019-06-17實(shí)施
電信終端產(chǎn)業(yè)協(xié)會(huì)發(fā)布
T/TAF041-2019
智能產(chǎn)品語(yǔ)音識(shí)別測(cè)評(píng)方法——第一部分車載語(yǔ)音交互系統(tǒng)
1范圍
本標(biāo)準(zhǔn)從影響車載交互系統(tǒng)的語(yǔ)音識(shí)別性能的各技術(shù)角度出發(fā),制定相應(yīng)的測(cè)試方法和技術(shù)要求。
本標(biāo)準(zhǔn)適用于車載終端設(shè)備配置的中文語(yǔ)音識(shí)別系統(tǒng)。本標(biāo)準(zhǔn)的制定和實(shí)施主要用于指導(dǎo)前裝的車
載語(yǔ)音交互系統(tǒng)。后裝的車載語(yǔ)音交互系統(tǒng)可參考本標(biāo)準(zhǔn)。
2規(guī)范性引用文件
下列文件中的條款通過本標(biāo)準(zhǔn)的引用而成為本標(biāo)準(zhǔn)的條款。凡是注明日期的引用文件,其隨后所有
的修改版(不包括勘誤的內(nèi)容)或修訂版均不適用于本標(biāo)準(zhǔn),然而,鼓勵(lì)根據(jù)本標(biāo)準(zhǔn)達(dá)成協(xié)議的各方研
究是否可使用這些文件的最新版本。凡是不注日期的引用文件,其最新版本適用于本標(biāo)準(zhǔn)。
[GB/T21023](2007)中文語(yǔ)音識(shí)別系統(tǒng)通用技術(shù)規(guī)范
[ITU-TP.56](12/2011)激活語(yǔ)音電平的客觀測(cè)量(Objectivemeasurementofactivespeech
level)
[ITU-TP.581](2000)HATS在免提終端測(cè)試中的使用(Useofheadandtorsosimulator(HATS)
forhands-freeterminaltesting)
[ITU-TP.851]基于口語(yǔ)對(duì)話系統(tǒng)的電話服務(wù)的主觀質(zhì)量評(píng)價(jià)(Subjectivequality
evaluationoftelephoneservicesbasedonspokendialoguesystems)
3術(shù)語(yǔ)、定義和縮略語(yǔ)
3.1術(shù)語(yǔ)和定義
下列術(shù)語(yǔ)和定義適用于本標(biāo)準(zhǔn)。
3.1.1語(yǔ)音識(shí)別speechrecognition
將人類的聲音信號(hào)轉(zhuǎn)化為文字或者指令的過程。
3.1.2語(yǔ)音識(shí)別系統(tǒng)speechrecognitionsystem
具有語(yǔ)音識(shí)別功能的開發(fā)工具、軟件、裝置或應(yīng)用。
3.1.3車載系統(tǒng)in-vehiclesystem
能產(chǎn)生人類智能行為的車載計(jì)算機(jī)系統(tǒng),可為用戶提供車輛控制、安全、信息、娛樂等方面的功能
或服務(wù)。
3.1.4車載語(yǔ)音交互系統(tǒng)in-vehiclespeechinteractionsystem
1
T/TAF041-2019
實(shí)現(xiàn)人類與車載系統(tǒng)間語(yǔ)音交互的系統(tǒng),以將人類的語(yǔ)音輸入轉(zhuǎn)化為車載系統(tǒng)可識(shí)別的控制指令,
同時(shí)將車載系統(tǒng)的反饋信息通過語(yǔ)音或文字輸出為主要目的。
3.1.5識(shí)別決策recognitionstrategies
根據(jù)客觀的可能性,以已知的信息和知識(shí)為基礎(chǔ),借助一定的方法對(duì)識(shí)別目標(biāo)的諸多可能情況進(jìn)行
分析、計(jì)算和選優(yōu)后,做出的行動(dòng)決定。
3.1.6語(yǔ)音喚醒speechwakeup
車載語(yǔ)音識(shí)別系統(tǒng)在睡眠模式下自動(dòng)檢測(cè)背景語(yǔ)音中的喚醒詞,在成功匹配的情況下轉(zhuǎn)入正常工作
模式。
3.1.7響應(yīng)時(shí)間
對(duì)于特定的語(yǔ)音識(shí)別任務(wù),若語(yǔ)音輸入的結(jié)束時(shí)刻為te;車載語(yǔ)音識(shí)別系統(tǒng)的開始響應(yīng)時(shí)刻為tr。
則:響應(yīng)時(shí)間=tr-te
3.2縮略語(yǔ)
下列縮略語(yǔ)適用于本標(biāo)準(zhǔn)。
HATSHATSHeadAndTorsoSimulator頭和軀干模擬器
4車載語(yǔ)音交互系統(tǒng)分類及表述
4.1概述
車載語(yǔ)音交互系統(tǒng)根據(jù)基本屬性如應(yīng)用場(chǎng)景、詞匯量、應(yīng)用人群、工作模式、應(yīng)用環(huán)境等進(jìn)行分類。
從用戶感受的角度觸發(fā),把車載語(yǔ)音交互系統(tǒng)當(dāng)作黑匣子,車載語(yǔ)音交互系統(tǒng)的性能指標(biāo)僅基于系統(tǒng)的
應(yīng)用場(chǎng)景屬性提出。
4.2基于應(yīng)用場(chǎng)景的分類
車載語(yǔ)音交互系統(tǒng)基于應(yīng)用場(chǎng)景可以分為:文字輸入類、聲音檢測(cè)識(shí)別類和對(duì)話類三類系統(tǒng),或兼
容三種應(yīng)用場(chǎng)景。
4.2.1文字輸入類
以文字錄入為主要目的,要求把語(yǔ)音轉(zhuǎn)化成文字的系統(tǒng),如短消息功能。
4.2.2聲音檢測(cè)識(shí)別類
是指根據(jù)用戶語(yǔ)音中發(fā)出的特定命令或者關(guān)鍵詞,完成特定操作和業(yè)務(wù)的應(yīng)用場(chǎng)景。如撥打電話、
音樂命令控制等。
4.2.3口語(yǔ)對(duì)話類
是指接受用戶以對(duì)話形式發(fā)出的自然的口頭語(yǔ)言,明白及理解用戶意圖及想要獲取的信息,并將以
各種形式與用戶進(jìn)行反饋,以將對(duì)話繼續(xù)進(jìn)行的應(yīng)用。如地圖查詢,天氣查詢等。
2
T/TAF041-2019
4.3車載語(yǔ)音交互系統(tǒng)的結(jié)構(gòu)表述
語(yǔ)音交互系統(tǒng)可分為前端語(yǔ)音預(yù)處理模塊、語(yǔ)音識(shí)別模塊、語(yǔ)義理解模塊、交互決策模塊和語(yǔ)音合
成模塊。前端語(yǔ)音預(yù)處理模塊負(fù)責(zé)將語(yǔ)音輸入轉(zhuǎn)化為語(yǔ)音流,作為語(yǔ)音識(shí)別模塊的輸入。語(yǔ)音識(shí)別模塊
負(fù)責(zé)將語(yǔ)音流轉(zhuǎn)換為人類可識(shí)別的文本信息直接輸出到相關(guān)的應(yīng)用模塊,或轉(zhuǎn)換為計(jì)算機(jī)可識(shí)別的字符
串輸出到語(yǔ)義理解模塊。語(yǔ)義理解模塊負(fù)責(zé)對(duì)語(yǔ)音識(shí)別模塊的識(shí)別結(jié)果做語(yǔ)義解析。識(shí)別決策模塊負(fù)責(zé)
根據(jù)語(yǔ)義理解模塊“理解的”的結(jié)果制定識(shí)別決策,并依此向相關(guān)應(yīng)用模塊下達(dá)控制指令及獲取反饋信
息。語(yǔ)音合成模塊負(fù)責(zé)將識(shí)別決策模塊或應(yīng)用模塊提供的計(jì)算機(jī)可識(shí)別的文本信息轉(zhuǎn)換為語(yǔ)音信號(hào)輸
出。某些子模塊可選擇在本地、云端或融合實(shí)現(xiàn)。
語(yǔ)音預(yù)處語(yǔ)音識(shí)別應(yīng)用模塊
理模塊模塊
語(yǔ)意理解交互決策語(yǔ)音合成
模塊模塊模塊
圖1車載語(yǔ)音交互系統(tǒng)結(jié)構(gòu)圖
5車載語(yǔ)音交互系統(tǒng)的性能指標(biāo)要求
5.1概述
車載語(yǔ)音交互系統(tǒng)的性能需滿足以下指標(biāo)要求,其中喚醒率和誤喚醒率僅針對(duì)支持語(yǔ)音喚醒功能的
車載語(yǔ)音交互系統(tǒng)。這些要求與系統(tǒng)的用途有關(guān),多用途的需求分別滿足多指標(biāo)的要求。系統(tǒng)給出的具
體指標(biāo)應(yīng)明確在何種條件下成立。
5.2字準(zhǔn)確率
字準(zhǔn)確率的性能指標(biāo)定義詳見GB/T21023中5.2.1的內(nèi)容。
該指標(biāo)用于評(píng)價(jià)車載語(yǔ)音交互系統(tǒng)輸出的人類可識(shí)別的文本信息的正確率。對(duì)于中文普通話車載語(yǔ)
音交互系統(tǒng),該項(xiàng)指標(biāo)的評(píng)價(jià)分類如表1所示。
表1中文普通話感受效果分類
識(shí)別率評(píng)價(jià)效果
≥90%優(yōu)秀
3
T/TAF041-2019
<90%且>70%可接受
≤70%不可接受
5.3識(shí)別成功率
若車載語(yǔ)音交互系統(tǒng)在既定的識(shí)別輪數(shù)內(nèi)完成了語(yǔ)音識(shí)別任務(wù),則此次語(yǔ)音識(shí)別成功。語(yǔ)音識(shí)別成
功與否應(yīng)兼顧車載系統(tǒng)動(dòng)作的可靠性問題。若車載語(yǔ)音識(shí)別系統(tǒng)共進(jìn)行了R次特定的語(yǔ)音識(shí)別任務(wù),其
中SR次識(shí)別成功,F(xiàn)R次識(shí)別出現(xiàn)誤操作(包括未在既定的識(shí)別輪數(shù)內(nèi)完成的識(shí)別、未完成識(shí)別前退出、
識(shí)別無響應(yīng)和錯(cuò)誤識(shí)別)。則:
識(shí)別成功率=SR/R×100%;
誤操作率=FR/R×100%;
識(shí)別成功率+誤操作率=1。
該指標(biāo)用于評(píng)價(jià)車載語(yǔ)音交互系統(tǒng)對(duì)語(yǔ)音識(shí)別任務(wù)的正確響應(yīng)情況。對(duì)于中文普通話車載語(yǔ)音交互
系統(tǒng),該項(xiàng)指標(biāo)的評(píng)價(jià)分類如表1所示。
在如表2所述的測(cè)試環(huán)境下,具體要求如下:場(chǎng)景1的識(shí)別成功率應(yīng)≥80%;場(chǎng)景2的識(shí)別成功率
應(yīng)≥75%;場(chǎng)景3的識(shí)別成功率應(yīng)≥70%。
5.4平均響應(yīng)時(shí)間
該指標(biāo)用于評(píng)價(jià)車載語(yǔ)音交互系統(tǒng)對(duì)語(yǔ)音識(shí)別任務(wù)的響應(yīng)速度。離線車載語(yǔ)音交互系統(tǒng)的平均響應(yīng)
時(shí)間應(yīng)≤2s;在線車載語(yǔ)音交互系統(tǒng)的平均響應(yīng)時(shí)間應(yīng)≤3s。
5.5喚醒率
若車載語(yǔ)音交互系統(tǒng)共進(jìn)行了W次喚醒,其中SW次成功喚醒。則:
喚醒率=SW/W×100%。
該指標(biāo)用于評(píng)價(jià)車載語(yǔ)音識(shí)別系統(tǒng)在疊加背景音樂的情況下,對(duì)語(yǔ)音喚醒操作的正確響應(yīng)情況。在
表2所述的測(cè)試環(huán)境下疊加低檔背景音樂,場(chǎng)景1的喚醒率應(yīng)≥95%;場(chǎng)景2的喚醒率應(yīng)≥88%。
5.6誤喚醒率
若車載語(yǔ)音交互系統(tǒng)在T小時(shí)內(nèi)出現(xiàn)FW次誤喚醒。則:
誤喚醒率=FW/T次/小時(shí)。
該指標(biāo)用于評(píng)價(jià)車載語(yǔ)音交互系統(tǒng)在疊加背景語(yǔ)音的情況下,對(duì)語(yǔ)音喚醒操作的錯(cuò)誤響應(yīng)情況。在
表2所述的測(cè)試環(huán)境下疊加低檔背景音樂,誤喚醒率應(yīng)≤0.5次/小時(shí)。
6車載語(yǔ)音交互系統(tǒng)測(cè)試方法
6.1概述
為保證車載語(yǔ)音交互系統(tǒng)測(cè)試的可重復(fù)性和性,應(yīng)采用基于車載語(yǔ)音識(shí)別系統(tǒng)測(cè)試標(biāo)準(zhǔn)庫(kù)的測(cè)試方
法。語(yǔ)音識(shí)別標(biāo)準(zhǔn)庫(kù)的建立應(yīng)按照GB/T21023中的要求進(jìn)行。車載語(yǔ)音識(shí)別系統(tǒng)測(cè)試標(biāo)準(zhǔn)庫(kù)應(yīng)同其開
發(fā)庫(kù)獨(dú)立同分布。測(cè)試語(yǔ)料的設(shè)計(jì)與測(cè)試語(yǔ)音/環(huán)境噪聲的錄制應(yīng)保證與實(shí)際應(yīng)用場(chǎng)景的一致性。
影響車載語(yǔ)音識(shí)別性能的因素包括不同用戶、語(yǔ)言種類、口音、發(fā)音、語(yǔ)速、詞匯量、語(yǔ)境、噪聲
環(huán)境。測(cè)試時(shí)應(yīng)充分考慮車載語(yǔ)音交互系統(tǒng)的設(shè)計(jì)目標(biāo)和各因素下對(duì)性能指標(biāo)影響。
6.2測(cè)試語(yǔ)料設(shè)計(jì)
4
T/TAF041-2019
車載語(yǔ)音交互系統(tǒng)測(cè)試語(yǔ)料設(shè)計(jì)原則應(yīng)符合語(yǔ)音識(shí)別系統(tǒng)輸入準(zhǔn)則:
a)中文車載語(yǔ)音交互系統(tǒng)應(yīng)支持漢語(yǔ)通用語(yǔ),從信息社會(huì)發(fā)展角度支持推廣普通話。
b)語(yǔ)音輸入標(biāo)準(zhǔn)語(yǔ)速為180-300字/min,時(shí)長(zhǎng)一般不超過30s,特殊情況下不超過60s。
c)發(fā)音單元的持續(xù)時(shí)間不應(yīng)小于0.2s,發(fā)音單元間的間隔不超過2s;停頓時(shí)間超過2s,則認(rèn)為
一次語(yǔ)音輸入結(jié)束。
d)對(duì)于文本中的分漢字字符,包括數(shù)字、電話號(hào)碼、標(biāo)點(diǎn)符號(hào),其可參照GB/T21023-2007附錄
A所定義的方法朗讀。
測(cè)試語(yǔ)料應(yīng)從詞匯量覆蓋、開放業(yè)務(wù)覆蓋、音節(jié)覆蓋,以及常用性角度加以設(shè)計(jì),設(shè)計(jì)要求如下:
e)對(duì)于命令詞識(shí)別車載語(yǔ)音識(shí)別系統(tǒng),測(cè)試語(yǔ)料應(yīng)覆蓋被測(cè)系統(tǒng)的所有詞匯。建議測(cè)試語(yǔ)料的規(guī)
模不小于200句。
f)對(duì)于連續(xù)語(yǔ)音識(shí)別車載語(yǔ)音識(shí)別系統(tǒng),測(cè)試語(yǔ)料應(yīng)盡量覆蓋被測(cè)系統(tǒng)的詞匯,對(duì)于每種開放業(yè)
務(wù)從音節(jié)覆蓋和常用性角度挑選典型語(yǔ)料。建議每種開放業(yè)務(wù)測(cè)試語(yǔ)料的規(guī)模為500句。
6.3測(cè)試語(yǔ)音/環(huán)境噪聲錄制
測(cè)試語(yǔ)音/環(huán)境噪聲錄制要求如下:
g)對(duì)于非特定人群車載語(yǔ)音識(shí)別系統(tǒng),特別強(qiáng)調(diào)對(duì)含有一定口音的漢語(yǔ)語(yǔ)音適應(yīng)能力和漢語(yǔ)聲調(diào)
問題。
h)測(cè)試語(yǔ)音至少應(yīng)由男女各30名以上的發(fā)音人錄制,用于語(yǔ)音喚醒功能的測(cè)試語(yǔ)音需要50-100
名以上的發(fā)音人錄制。應(yīng)在符合系統(tǒng)對(duì)識(shí)別人群限制的條件下,盡量選擇具有代表性和統(tǒng)計(jì)分
布規(guī)律的發(fā)音人,特別是應(yīng)考慮不同口音、不同的普通話等級(jí)、不同年齡、不同語(yǔ)速、不同教
育背景、不同說話韻律等因素。對(duì)于命令詞識(shí)別車載語(yǔ)音識(shí)別系統(tǒng),應(yīng)盡量保證由各發(fā)音人分
別錄制全部測(cè)試語(yǔ)料。對(duì)于連續(xù)語(yǔ)音識(shí)別車載語(yǔ)音識(shí)別系統(tǒng),每組測(cè)試語(yǔ)料不應(yīng)超過100句,
盡量保證由不同的發(fā)音人錄制。
i)測(cè)試語(yǔ)音可以是發(fā)音人的語(yǔ)音或通過高保真設(shè)備回放的測(cè)試語(yǔ)音。測(cè)試語(yǔ)音文件的錄制格式
為.wav,純凈測(cè)試語(yǔ)音的錄制應(yīng)保證44.1kHz的采樣頻率和16bit的量化間隔,發(fā)音人和麥克
風(fēng)間應(yīng)保持一定距離(如15cm,避免風(fēng)噪的影響),并確保波形采樣范圍為±5000—±
10000smpl;錄制過程至少應(yīng)包括錄音、標(biāo)注和確認(rèn)三個(gè)步驟,以保證測(cè)試標(biāo)準(zhǔn)庫(kù)的正確性。
錄制完成后需按測(cè)試語(yǔ)料完成測(cè)試語(yǔ)音文件的切分,進(jìn)入測(cè)試系統(tǒng)前需進(jìn)行語(yǔ)音處理,保證電
平符合要求。
j)背景噪聲的錄制在真車內(nèi)進(jìn)行,使用一個(gè)放置在靠近車載免提麥克風(fēng)處的測(cè)量傳聲器來錄制背
景噪聲,如果條件允許,也可以使用車載免提麥克風(fēng)來直接錄制。一般由測(cè)試實(shí)驗(yàn)室(與生產(chǎn)
廠家)來共同決定使用背景噪聲的類型。環(huán)境噪聲文件的錄制格式為.wav,應(yīng)保證44.1kHz
的采樣頻率和16bit的量化間隔,并記錄噪聲幅值,以便重放。環(huán)境噪聲應(yīng)考慮行車環(huán)境、車
速、前車窗和空調(diào)的使用情況。典型的環(huán)境噪聲的錄制場(chǎng)景如表2所示。
表2典型的環(huán)境噪聲的場(chǎng)景
5
T/TAF041-2019
場(chǎng)景編號(hào)行車環(huán)境車速車窗空調(diào)麥克風(fēng)處的環(huán)境噪聲聲壓級(jí)備注
(僅供參考,以實(shí)際錄制結(jié)果為
準(zhǔn))
1安靜0km/h關(guān)關(guān)45-50dB(A)必選
2鬧市40-60km/h關(guān)低檔50-65dB(A)必選
3高速60-120km/h關(guān)中檔65-75dB(A)必選
4鬧市40-60km/h半開關(guān)65-75dB(A)可選
5高速60-120km/h半開關(guān)70-85dB(A)可選
6.4基于語(yǔ)音標(biāo)準(zhǔn)庫(kù)的測(cè)試方法
6.4.1概況
測(cè)試需要在可重復(fù)的、模擬真實(shí)場(chǎng)景下進(jìn)行。測(cè)試聲場(chǎng)景應(yīng)模擬行車使用環(huán)境,在真實(shí)汽車車殼或
真實(shí)車輛內(nèi)進(jìn)行測(cè)試。推薦使用符合ITU-TP.581規(guī)定的HATS進(jìn)行聲音信號(hào)的重現(xiàn)與采集,使用前對(duì)HATS
進(jìn)行校準(zhǔn)和均衡。
將語(yǔ)音標(biāo)準(zhǔn)庫(kù)中預(yù)先錄制好的語(yǔ)音輸入待測(cè)系統(tǒng),并統(tǒng)計(jì)系統(tǒng)輸出結(jié)果。車載系統(tǒng)的響應(yīng)可以錄像
的方式記錄下來,作為測(cè)試結(jié)果之一。
6.4.2背景噪聲重放
使用四個(gè)中音揚(yáng)聲器和一個(gè)低音揚(yáng)聲器組成的陣列來模擬行車噪聲場(chǎng)景,如圖2所示。使用揚(yáng)聲器
陣列來重放放背景噪聲時(shí),應(yīng)首先經(jīng)過均衡和校準(zhǔn),使得免提麥克風(fēng)位置處的聲功率譜密度和錄音信號(hào)
一致。均衡既可以使用測(cè)量麥克風(fēng),也可以使用錄制背景噪聲時(shí)用過的車載免提麥克風(fēng)。比較錄音信號(hào)
和模擬背景噪聲信號(hào),兩者的最大A計(jì)權(quán)聲壓級(jí)偏差應(yīng)不超過±1dB,在100Hz~10kHz頻率范圍內(nèi)的1/3
倍頻程功率譜密度偏差應(yīng)不超過±3dB。
為了使得揚(yáng)聲器、免提麥克風(fēng)和HATS的聲傳輸路徑間的干擾最小,應(yīng)仔細(xì)選擇揚(yáng)聲器的放置位置。
低音揚(yáng)聲器放置在座位后面正中后備箱上面,后排兩個(gè)揚(yáng)聲器分別放置在后座靠枕與后窗玻璃之間靠近
車殼的支架處,前面兩個(gè)揚(yáng)聲器分別放在儀表面板的上部?jī)蛇叀?/p>
6
T/TAF041-2019
圖2語(yǔ)音識(shí)別測(cè)量及背景噪聲重放設(shè)置
6.4.3車內(nèi)測(cè)試配置
6.4.3.1HATS的放置
一般由廠家來指定HATS的放置位置(包括仿真嘴和仿真耳分別相對(duì)于麥克風(fēng)和揚(yáng)聲器的距離)。如
沒有特別指定,測(cè)試時(shí)HATS應(yīng)放置在駕駛員的座位上,該具體位置應(yīng)和多數(shù)人的駕駛習(xí)慣位置一致,并
且定義仿真嘴到麥克風(fēng)的距離。測(cè)試報(bào)告應(yīng)包含位置信息。
為了保證每次車內(nèi)測(cè)試時(shí)HATS的位置相對(duì)固定,可以通過在車內(nèi)進(jìn)行標(biāo)注的方法來幫助定位(比如
在車內(nèi)中標(biāo)出HATS相對(duì)于某一位置的距離,如左、右車門和車頂?shù)裙潭ㄎ矬w。
注1:如有特殊測(cè)試要求,也可以放置在副駕駛位和乘客位。
6.4.3.2仿真嘴
仿真嘴應(yīng)符合ITU-TP.58的規(guī)定,并依據(jù)ITU-TP.340在MRP處進(jìn)行均衡。
在MRP校準(zhǔn)的聲壓級(jí)為-4.7dBPa。
對(duì)于揚(yáng)聲式車載免提終端,應(yīng)在HATS-HFRP(HATS免提參考點(diǎn))處進(jìn)行聲壓校準(zhǔn),使得HATS-HFRP
處的平均聲壓級(jí)為-25.7dBPa,此時(shí)MRP處的聲壓為發(fā)送方向源信號(hào)大小。以上過程的具體操作步驟見
ITU-TP.581的相關(guān)部分。
測(cè)試行車噪聲環(huán)境下時(shí),由于“倫巴效應(yīng)”,仿真嘴的輸出電平會(huì)增大。
7
T/TAF041-2019
0forN50
IN0.3N50for50N77
8.0forN77
其中I=仿真嘴輸出電平增大值
N=靠近駕駛員頭部位置的長(zhǎng)時(shí)A記權(quán)噪聲大小
ITU-TP.340中規(guī)定,在免提裝置的發(fā)送測(cè)試中,0.3倍的語(yǔ)音電平增長(zhǎng)應(yīng)單獨(dú)計(jì)算。
6.4.3.3仿真耳
對(duì)于揚(yáng)聲免提終端,HATS左右耳的聲信號(hào)均被使用。HATS應(yīng)進(jìn)行自由場(chǎng)或擴(kuò)散場(chǎng)均衡,具體可參考
ITU-TP.581。
對(duì)于頭戴免提終端,使用的耳型和佩戴位置見ITU-TP.380。
6.4.3.4測(cè)試信號(hào)和電平
測(cè)試可以使用提前錄制的真人語(yǔ)音信號(hào)。
所有的測(cè)試信號(hào)電平都是指測(cè)試信號(hào)的激活語(yǔ)音電平(詳見ITU-TP.56)。語(yǔ)音識(shí)別測(cè)試在發(fā)送方
向使用的是非限帶信號(hào)。
測(cè)試信號(hào)的平均大小規(guī)定如下:
——發(fā)送方向(MRP):-4.7dBPa(典型的講話平均聲壓級(jí),相當(dāng)于HATS-HFRP處聲壓級(jí)大小為-28.7
dBPa),這一水平適用于耳機(jī)的免提終端;
——發(fā)送方向(MRP):-1.7dBPa免提揚(yáng)聲器終端(典型的平均說話聲壓級(jí))(相當(dāng)于HATS-HFRP
處聲壓級(jí)大小為-25.7dBPa)。
注:背景噪聲測(cè)試中要考慮“倫巴效應(yīng)”(由于高背景噪聲而增加說話者的說話聲壓級(jí))。
6.5測(cè)試步驟
6.5.1字準(zhǔn)確率
1)人工頭按照6.4.3.1配置,背景噪聲系統(tǒng)按照6.4.2配置并均衡。
2)測(cè)試信號(hào)為根據(jù)6.2、6.3錄制的語(yǔ)音信號(hào)。由人工嘴產(chǎn)生測(cè)試信號(hào)的頻譜在嘴參考點(diǎn)(MRP)
處在自由聲場(chǎng)的條件下進(jìn)行校準(zhǔn)。測(cè)試信號(hào)幅值見6.4.3.4。
3)同步播放測(cè)試信號(hào)和相應(yīng)背景噪聲場(chǎng)景。
4)記錄字準(zhǔn)確率。
注2:安靜情況下,不需播放背景噪聲。
6.5.2識(shí)別成功率
1)人工頭按照6.4.3.1配置,背景噪聲系統(tǒng)按照6.4.2配置并均衡。
2)測(cè)試信號(hào)為根據(jù)6.2、6.3錄制的語(yǔ)音信號(hào),即相應(yīng)命令詞語(yǔ)。由人工嘴產(chǎn)生測(cè)試信號(hào)的
頻譜在嘴參考點(diǎn)(MRP)處在自由聲場(chǎng)的條件下進(jìn)行校準(zhǔn)。測(cè)試信號(hào)幅值見6.4.3.4。
3)同步播放測(cè)試信號(hào)和相應(yīng)背景噪聲場(chǎng)景。
4)記錄識(shí)別結(jié)果。
8
T/TAF041-2019
5)完成所有命令詞測(cè)試后,統(tǒng)計(jì)不同場(chǎng)景下語(yǔ)音識(shí)別率。
6.5.3平均響應(yīng)時(shí)間
1)人工頭按照6.4.3.1配置。
2)測(cè)試信號(hào)為根據(jù)6.2、6.3錄制的語(yǔ)音信號(hào),即相應(yīng)命令詞語(yǔ)。由人工嘴產(chǎn)生測(cè)試信號(hào)的
頻譜在嘴參考點(diǎn)(MRP)處在自由聲場(chǎng)的條件下進(jìn)行校準(zhǔn)。測(cè)試信號(hào)幅值見6.4.3.4。
tt
3)播放測(cè)試信號(hào),記錄語(yǔ)音輸入的結(jié)束時(shí)刻為e;車載語(yǔ)音識(shí)別系統(tǒng)的開始響應(yīng)時(shí)刻為r。
4)計(jì)算響應(yīng)時(shí)間=tr-te。
注3:從標(biāo)準(zhǔn)庫(kù)中選擇5段語(yǔ)音,分別進(jìn)行本地語(yǔ)音識(shí)別和在線語(yǔ)音識(shí)別。如是在線語(yǔ)音識(shí)別,請(qǐng)保持網(wǎng)絡(luò)良好。
6.5.4喚醒率
1)人工頭按照6.4.3.1配置,背景噪聲系統(tǒng)按照6.4.2配置并均衡。
2)測(cè)試信號(hào)為根據(jù)6.2、6.3錄制的語(yǔ)音信號(hào),即相應(yīng)喚醒詞。由人工嘴產(chǎn)生測(cè)試信號(hào)的頻
譜在嘴參考點(diǎn)(MRP)處在自由聲場(chǎng)的條件下進(jìn)行校準(zhǔn)。測(cè)試信號(hào)幅值見6.4.3.4。
3)同步播放測(cè)試信號(hào)和相應(yīng)背景噪聲場(chǎng)景。
4)記錄喚醒測(cè)試結(jié)果。
5)重復(fù)喚醒測(cè)試,統(tǒng)計(jì)不同場(chǎng)景下喚醒率。
6.5.5誤喚醒率
1)人工頭按照6.4.3.1配置,背景噪聲系統(tǒng)按照6.4.2配置并均衡。
2)測(cè)試信號(hào)為根據(jù)6.2、6.3錄制的語(yǔ)音信號(hào),測(cè)試信號(hào)不能是喚醒詞。由人工嘴產(chǎn)生測(cè)試
信號(hào)的頻譜在嘴參考點(diǎn)(MRP)處在自由聲場(chǎng)的條件下進(jìn)行校準(zhǔn)。測(cè)試信號(hào)幅值見
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年梅州市工業(yè)和備考題庫(kù)化局公開招聘勞務(wù)派遣人員備考題庫(kù)及1套參考答案詳解
- 2026年際華三五一三實(shí)業(yè)有限公司招聘?jìng)淇碱}庫(kù)及答案詳解1套
- 2026年輝南縣消防救援大隊(duì)招聘消防文員的備考題庫(kù)參考答案詳解
- 云南省昆明市晉寧區(qū)人民法院2025年公開招聘合同制人員備考題庫(kù)及1套參考答案詳解
- 合肥市六安路小學(xué)榮城花園分校2026年春季學(xué)期招聘編外聘用教師備考題庫(kù)及一套參考答案詳解
- 中學(xué)學(xué)生社團(tuán)指導(dǎo)教師選拔制度
- 2026年黃岡市興黃投資引導(dǎo)基金有限公司面向社會(huì)公開招聘?jìng)淇碱}庫(kù)及參考答案詳解一套
- 養(yǎng)老院投訴處理制度
- 2026年郫都區(qū)中信大道幼兒園招聘教師備考題庫(kù)參考答案詳解
- 企業(yè)員工培訓(xùn)與職業(yè)發(fā)展策略制度
- 核電行業(yè)防造假管理制度
- 要素式強(qiáng)制執(zhí)行申請(qǐng)書(申請(qǐng)執(zhí)行用)
- 2025年4月自考00609高級(jí)日語(yǔ)(一)試題
- 新疆阿合奇托什干河國(guó)家濕地公園建設(shè)項(xiàng)目環(huán)境影響報(bào)告書
- 維修工作計(jì)劃模板范文
- DB13(J)-T 8401-2021 鋼絲網(wǎng)片復(fù)合保溫板應(yīng)用技術(shù)標(biāo)準(zhǔn)
- 設(shè)計(jì)公司部門領(lǐng)導(dǎo)發(fā)言稿
- 深圳科技館新館展教工程常設(shè)展區(qū)整體展教方案
- 《重慶市北碚區(qū)高標(biāo)準(zhǔn)農(nóng)田建設(shè)規(guī)劃2021-2030年》
- T-CI 451-2024 構(gòu)網(wǎng)型光伏變換器并網(wǎng)技術(shù)規(guī)范
- 《公路工程預(yù)算定額》(JTGT3832-2018)
評(píng)論
0/150
提交評(píng)論