TTAF 041-2019 智能產(chǎn)品語(yǔ)音識(shí)別測(cè)評(píng)方法 第一部分車載語(yǔ)音交互系統(tǒng)_第1頁(yè)
TTAF 041-2019 智能產(chǎn)品語(yǔ)音識(shí)別測(cè)評(píng)方法 第一部分車載語(yǔ)音交互系統(tǒng)_第2頁(yè)
TTAF 041-2019 智能產(chǎn)品語(yǔ)音識(shí)別測(cè)評(píng)方法 第一部分車載語(yǔ)音交互系統(tǒng)_第3頁(yè)
TTAF 041-2019 智能產(chǎn)品語(yǔ)音識(shí)別測(cè)評(píng)方法 第一部分車載語(yǔ)音交互系統(tǒng)_第4頁(yè)
TTAF 041-2019 智能產(chǎn)品語(yǔ)音識(shí)別測(cè)評(píng)方法 第一部分車載語(yǔ)音交互系統(tǒng)_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

ICS33.050

M30

團(tuán)體標(biāo)準(zhǔn)

T/TAF041-2019

智能產(chǎn)品語(yǔ)音識(shí)別測(cè)評(píng)方法——第一部分

車載語(yǔ)音交互系統(tǒng)

TestingMethodsforSpeechRecognitionofIntelligentProducts

——TheFirstPartSpeechInteractionSysteminVehicle

2019–06-17發(fā)布2019-06-17實(shí)施

電信終端產(chǎn)業(yè)協(xié)會(huì)發(fā)布

T/TAF041-2019

智能產(chǎn)品語(yǔ)音識(shí)別測(cè)評(píng)方法——第一部分車載語(yǔ)音交互系統(tǒng)

1范圍

本標(biāo)準(zhǔn)從影響車載交互系統(tǒng)的語(yǔ)音識(shí)別性能的各技術(shù)角度出發(fā),制定相應(yīng)的測(cè)試方法和技術(shù)要求。

本標(biāo)準(zhǔn)適用于車載終端設(shè)備配置的中文語(yǔ)音識(shí)別系統(tǒng)。本標(biāo)準(zhǔn)的制定和實(shí)施主要用于指導(dǎo)前裝的車

載語(yǔ)音交互系統(tǒng)。后裝的車載語(yǔ)音交互系統(tǒng)可參考本標(biāo)準(zhǔn)。

2規(guī)范性引用文件

下列文件中的條款通過本標(biāo)準(zhǔn)的引用而成為本標(biāo)準(zhǔn)的條款。凡是注明日期的引用文件,其隨后所有

的修改版(不包括勘誤的內(nèi)容)或修訂版均不適用于本標(biāo)準(zhǔn),然而,鼓勵(lì)根據(jù)本標(biāo)準(zhǔn)達(dá)成協(xié)議的各方研

究是否可使用這些文件的最新版本。凡是不注日期的引用文件,其最新版本適用于本標(biāo)準(zhǔn)。

[GB/T21023](2007)中文語(yǔ)音識(shí)別系統(tǒng)通用技術(shù)規(guī)范

[ITU-TP.56](12/2011)激活語(yǔ)音電平的客觀測(cè)量(Objectivemeasurementofactivespeech

level)

[ITU-TP.581](2000)HATS在免提終端測(cè)試中的使用(Useofheadandtorsosimulator(HATS)

forhands-freeterminaltesting)

[ITU-TP.851]基于口語(yǔ)對(duì)話系統(tǒng)的電話服務(wù)的主觀質(zhì)量評(píng)價(jià)(Subjectivequality

evaluationoftelephoneservicesbasedonspokendialoguesystems)

3術(shù)語(yǔ)、定義和縮略語(yǔ)

3.1術(shù)語(yǔ)和定義

下列術(shù)語(yǔ)和定義適用于本標(biāo)準(zhǔn)。

3.1.1語(yǔ)音識(shí)別speechrecognition

將人類的聲音信號(hào)轉(zhuǎn)化為文字或者指令的過程。

3.1.2語(yǔ)音識(shí)別系統(tǒng)speechrecognitionsystem

具有語(yǔ)音識(shí)別功能的開發(fā)工具、軟件、裝置或應(yīng)用。

3.1.3車載系統(tǒng)in-vehiclesystem

能產(chǎn)生人類智能行為的車載計(jì)算機(jī)系統(tǒng),可為用戶提供車輛控制、安全、信息、娛樂等方面的功能

或服務(wù)。

3.1.4車載語(yǔ)音交互系統(tǒng)in-vehiclespeechinteractionsystem

1

T/TAF041-2019

實(shí)現(xiàn)人類與車載系統(tǒng)間語(yǔ)音交互的系統(tǒng),以將人類的語(yǔ)音輸入轉(zhuǎn)化為車載系統(tǒng)可識(shí)別的控制指令,

同時(shí)將車載系統(tǒng)的反饋信息通過語(yǔ)音或文字輸出為主要目的。

3.1.5識(shí)別決策recognitionstrategies

根據(jù)客觀的可能性,以已知的信息和知識(shí)為基礎(chǔ),借助一定的方法對(duì)識(shí)別目標(biāo)的諸多可能情況進(jìn)行

分析、計(jì)算和選優(yōu)后,做出的行動(dòng)決定。

3.1.6語(yǔ)音喚醒speechwakeup

車載語(yǔ)音識(shí)別系統(tǒng)在睡眠模式下自動(dòng)檢測(cè)背景語(yǔ)音中的喚醒詞,在成功匹配的情況下轉(zhuǎn)入正常工作

模式。

3.1.7響應(yīng)時(shí)間

對(duì)于特定的語(yǔ)音識(shí)別任務(wù),若語(yǔ)音輸入的結(jié)束時(shí)刻為te;車載語(yǔ)音識(shí)別系統(tǒng)的開始響應(yīng)時(shí)刻為tr。

則:響應(yīng)時(shí)間=tr-te

3.2縮略語(yǔ)

下列縮略語(yǔ)適用于本標(biāo)準(zhǔn)。

HATSHATSHeadAndTorsoSimulator頭和軀干模擬器

4車載語(yǔ)音交互系統(tǒng)分類及表述

4.1概述

車載語(yǔ)音交互系統(tǒng)根據(jù)基本屬性如應(yīng)用場(chǎng)景、詞匯量、應(yīng)用人群、工作模式、應(yīng)用環(huán)境等進(jìn)行分類。

從用戶感受的角度觸發(fā),把車載語(yǔ)音交互系統(tǒng)當(dāng)作黑匣子,車載語(yǔ)音交互系統(tǒng)的性能指標(biāo)僅基于系統(tǒng)的

應(yīng)用場(chǎng)景屬性提出。

4.2基于應(yīng)用場(chǎng)景的分類

車載語(yǔ)音交互系統(tǒng)基于應(yīng)用場(chǎng)景可以分為:文字輸入類、聲音檢測(cè)識(shí)別類和對(duì)話類三類系統(tǒng),或兼

容三種應(yīng)用場(chǎng)景。

4.2.1文字輸入類

以文字錄入為主要目的,要求把語(yǔ)音轉(zhuǎn)化成文字的系統(tǒng),如短消息功能。

4.2.2聲音檢測(cè)識(shí)別類

是指根據(jù)用戶語(yǔ)音中發(fā)出的特定命令或者關(guān)鍵詞,完成特定操作和業(yè)務(wù)的應(yīng)用場(chǎng)景。如撥打電話、

音樂命令控制等。

4.2.3口語(yǔ)對(duì)話類

是指接受用戶以對(duì)話形式發(fā)出的自然的口頭語(yǔ)言,明白及理解用戶意圖及想要獲取的信息,并將以

各種形式與用戶進(jìn)行反饋,以將對(duì)話繼續(xù)進(jìn)行的應(yīng)用。如地圖查詢,天氣查詢等。

2

T/TAF041-2019

4.3車載語(yǔ)音交互系統(tǒng)的結(jié)構(gòu)表述

語(yǔ)音交互系統(tǒng)可分為前端語(yǔ)音預(yù)處理模塊、語(yǔ)音識(shí)別模塊、語(yǔ)義理解模塊、交互決策模塊和語(yǔ)音合

成模塊。前端語(yǔ)音預(yù)處理模塊負(fù)責(zé)將語(yǔ)音輸入轉(zhuǎn)化為語(yǔ)音流,作為語(yǔ)音識(shí)別模塊的輸入。語(yǔ)音識(shí)別模塊

負(fù)責(zé)將語(yǔ)音流轉(zhuǎn)換為人類可識(shí)別的文本信息直接輸出到相關(guān)的應(yīng)用模塊,或轉(zhuǎn)換為計(jì)算機(jī)可識(shí)別的字符

串輸出到語(yǔ)義理解模塊。語(yǔ)義理解模塊負(fù)責(zé)對(duì)語(yǔ)音識(shí)別模塊的識(shí)別結(jié)果做語(yǔ)義解析。識(shí)別決策模塊負(fù)責(zé)

根據(jù)語(yǔ)義理解模塊“理解的”的結(jié)果制定識(shí)別決策,并依此向相關(guān)應(yīng)用模塊下達(dá)控制指令及獲取反饋信

息。語(yǔ)音合成模塊負(fù)責(zé)將識(shí)別決策模塊或應(yīng)用模塊提供的計(jì)算機(jī)可識(shí)別的文本信息轉(zhuǎn)換為語(yǔ)音信號(hào)輸

出。某些子模塊可選擇在本地、云端或融合實(shí)現(xiàn)。

語(yǔ)音預(yù)處語(yǔ)音識(shí)別應(yīng)用模塊

理模塊模塊

語(yǔ)意理解交互決策語(yǔ)音合成

模塊模塊模塊

圖1車載語(yǔ)音交互系統(tǒng)結(jié)構(gòu)圖

5車載語(yǔ)音交互系統(tǒng)的性能指標(biāo)要求

5.1概述

車載語(yǔ)音交互系統(tǒng)的性能需滿足以下指標(biāo)要求,其中喚醒率和誤喚醒率僅針對(duì)支持語(yǔ)音喚醒功能的

車載語(yǔ)音交互系統(tǒng)。這些要求與系統(tǒng)的用途有關(guān),多用途的需求分別滿足多指標(biāo)的要求。系統(tǒng)給出的具

體指標(biāo)應(yīng)明確在何種條件下成立。

5.2字準(zhǔn)確率

字準(zhǔn)確率的性能指標(biāo)定義詳見GB/T21023中5.2.1的內(nèi)容。

該指標(biāo)用于評(píng)價(jià)車載語(yǔ)音交互系統(tǒng)輸出的人類可識(shí)別的文本信息的正確率。對(duì)于中文普通話車載語(yǔ)

音交互系統(tǒng),該項(xiàng)指標(biāo)的評(píng)價(jià)分類如表1所示。

表1中文普通話感受效果分類

識(shí)別率評(píng)價(jià)效果

≥90%優(yōu)秀

3

T/TAF041-2019

<90%且>70%可接受

≤70%不可接受

5.3識(shí)別成功率

若車載語(yǔ)音交互系統(tǒng)在既定的識(shí)別輪數(shù)內(nèi)完成了語(yǔ)音識(shí)別任務(wù),則此次語(yǔ)音識(shí)別成功。語(yǔ)音識(shí)別成

功與否應(yīng)兼顧車載系統(tǒng)動(dòng)作的可靠性問題。若車載語(yǔ)音識(shí)別系統(tǒng)共進(jìn)行了R次特定的語(yǔ)音識(shí)別任務(wù),其

中SR次識(shí)別成功,F(xiàn)R次識(shí)別出現(xiàn)誤操作(包括未在既定的識(shí)別輪數(shù)內(nèi)完成的識(shí)別、未完成識(shí)別前退出、

識(shí)別無響應(yīng)和錯(cuò)誤識(shí)別)。則:

識(shí)別成功率=SR/R×100%;

誤操作率=FR/R×100%;

識(shí)別成功率+誤操作率=1。

該指標(biāo)用于評(píng)價(jià)車載語(yǔ)音交互系統(tǒng)對(duì)語(yǔ)音識(shí)別任務(wù)的正確響應(yīng)情況。對(duì)于中文普通話車載語(yǔ)音交互

系統(tǒng),該項(xiàng)指標(biāo)的評(píng)價(jià)分類如表1所示。

在如表2所述的測(cè)試環(huán)境下,具體要求如下:場(chǎng)景1的識(shí)別成功率應(yīng)≥80%;場(chǎng)景2的識(shí)別成功率

應(yīng)≥75%;場(chǎng)景3的識(shí)別成功率應(yīng)≥70%。

5.4平均響應(yīng)時(shí)間

該指標(biāo)用于評(píng)價(jià)車載語(yǔ)音交互系統(tǒng)對(duì)語(yǔ)音識(shí)別任務(wù)的響應(yīng)速度。離線車載語(yǔ)音交互系統(tǒng)的平均響應(yīng)

時(shí)間應(yīng)≤2s;在線車載語(yǔ)音交互系統(tǒng)的平均響應(yīng)時(shí)間應(yīng)≤3s。

5.5喚醒率

若車載語(yǔ)音交互系統(tǒng)共進(jìn)行了W次喚醒,其中SW次成功喚醒。則:

喚醒率=SW/W×100%。

該指標(biāo)用于評(píng)價(jià)車載語(yǔ)音識(shí)別系統(tǒng)在疊加背景音樂的情況下,對(duì)語(yǔ)音喚醒操作的正確響應(yīng)情況。在

表2所述的測(cè)試環(huán)境下疊加低檔背景音樂,場(chǎng)景1的喚醒率應(yīng)≥95%;場(chǎng)景2的喚醒率應(yīng)≥88%。

5.6誤喚醒率

若車載語(yǔ)音交互系統(tǒng)在T小時(shí)內(nèi)出現(xiàn)FW次誤喚醒。則:

誤喚醒率=FW/T次/小時(shí)。

該指標(biāo)用于評(píng)價(jià)車載語(yǔ)音交互系統(tǒng)在疊加背景語(yǔ)音的情況下,對(duì)語(yǔ)音喚醒操作的錯(cuò)誤響應(yīng)情況。在

表2所述的測(cè)試環(huán)境下疊加低檔背景音樂,誤喚醒率應(yīng)≤0.5次/小時(shí)。

6車載語(yǔ)音交互系統(tǒng)測(cè)試方法

6.1概述

為保證車載語(yǔ)音交互系統(tǒng)測(cè)試的可重復(fù)性和性,應(yīng)采用基于車載語(yǔ)音識(shí)別系統(tǒng)測(cè)試標(biāo)準(zhǔn)庫(kù)的測(cè)試方

法。語(yǔ)音識(shí)別標(biāo)準(zhǔn)庫(kù)的建立應(yīng)按照GB/T21023中的要求進(jìn)行。車載語(yǔ)音識(shí)別系統(tǒng)測(cè)試標(biāo)準(zhǔn)庫(kù)應(yīng)同其開

發(fā)庫(kù)獨(dú)立同分布。測(cè)試語(yǔ)料的設(shè)計(jì)與測(cè)試語(yǔ)音/環(huán)境噪聲的錄制應(yīng)保證與實(shí)際應(yīng)用場(chǎng)景的一致性。

影響車載語(yǔ)音識(shí)別性能的因素包括不同用戶、語(yǔ)言種類、口音、發(fā)音、語(yǔ)速、詞匯量、語(yǔ)境、噪聲

環(huán)境。測(cè)試時(shí)應(yīng)充分考慮車載語(yǔ)音交互系統(tǒng)的設(shè)計(jì)目標(biāo)和各因素下對(duì)性能指標(biāo)影響。

6.2測(cè)試語(yǔ)料設(shè)計(jì)

4

T/TAF041-2019

車載語(yǔ)音交互系統(tǒng)測(cè)試語(yǔ)料設(shè)計(jì)原則應(yīng)符合語(yǔ)音識(shí)別系統(tǒng)輸入準(zhǔn)則:

a)中文車載語(yǔ)音交互系統(tǒng)應(yīng)支持漢語(yǔ)通用語(yǔ),從信息社會(huì)發(fā)展角度支持推廣普通話。

b)語(yǔ)音輸入標(biāo)準(zhǔn)語(yǔ)速為180-300字/min,時(shí)長(zhǎng)一般不超過30s,特殊情況下不超過60s。

c)發(fā)音單元的持續(xù)時(shí)間不應(yīng)小于0.2s,發(fā)音單元間的間隔不超過2s;停頓時(shí)間超過2s,則認(rèn)為

一次語(yǔ)音輸入結(jié)束。

d)對(duì)于文本中的分漢字字符,包括數(shù)字、電話號(hào)碼、標(biāo)點(diǎn)符號(hào),其可參照GB/T21023-2007附錄

A所定義的方法朗讀。

測(cè)試語(yǔ)料應(yīng)從詞匯量覆蓋、開放業(yè)務(wù)覆蓋、音節(jié)覆蓋,以及常用性角度加以設(shè)計(jì),設(shè)計(jì)要求如下:

e)對(duì)于命令詞識(shí)別車載語(yǔ)音識(shí)別系統(tǒng),測(cè)試語(yǔ)料應(yīng)覆蓋被測(cè)系統(tǒng)的所有詞匯。建議測(cè)試語(yǔ)料的規(guī)

模不小于200句。

f)對(duì)于連續(xù)語(yǔ)音識(shí)別車載語(yǔ)音識(shí)別系統(tǒng),測(cè)試語(yǔ)料應(yīng)盡量覆蓋被測(cè)系統(tǒng)的詞匯,對(duì)于每種開放業(yè)

務(wù)從音節(jié)覆蓋和常用性角度挑選典型語(yǔ)料。建議每種開放業(yè)務(wù)測(cè)試語(yǔ)料的規(guī)模為500句。

6.3測(cè)試語(yǔ)音/環(huán)境噪聲錄制

測(cè)試語(yǔ)音/環(huán)境噪聲錄制要求如下:

g)對(duì)于非特定人群車載語(yǔ)音識(shí)別系統(tǒng),特別強(qiáng)調(diào)對(duì)含有一定口音的漢語(yǔ)語(yǔ)音適應(yīng)能力和漢語(yǔ)聲調(diào)

問題。

h)測(cè)試語(yǔ)音至少應(yīng)由男女各30名以上的發(fā)音人錄制,用于語(yǔ)音喚醒功能的測(cè)試語(yǔ)音需要50-100

名以上的發(fā)音人錄制。應(yīng)在符合系統(tǒng)對(duì)識(shí)別人群限制的條件下,盡量選擇具有代表性和統(tǒng)計(jì)分

布規(guī)律的發(fā)音人,特別是應(yīng)考慮不同口音、不同的普通話等級(jí)、不同年齡、不同語(yǔ)速、不同教

育背景、不同說話韻律等因素。對(duì)于命令詞識(shí)別車載語(yǔ)音識(shí)別系統(tǒng),應(yīng)盡量保證由各發(fā)音人分

別錄制全部測(cè)試語(yǔ)料。對(duì)于連續(xù)語(yǔ)音識(shí)別車載語(yǔ)音識(shí)別系統(tǒng),每組測(cè)試語(yǔ)料不應(yīng)超過100句,

盡量保證由不同的發(fā)音人錄制。

i)測(cè)試語(yǔ)音可以是發(fā)音人的語(yǔ)音或通過高保真設(shè)備回放的測(cè)試語(yǔ)音。測(cè)試語(yǔ)音文件的錄制格式

為.wav,純凈測(cè)試語(yǔ)音的錄制應(yīng)保證44.1kHz的采樣頻率和16bit的量化間隔,發(fā)音人和麥克

風(fēng)間應(yīng)保持一定距離(如15cm,避免風(fēng)噪的影響),并確保波形采樣范圍為±5000—±

10000smpl;錄制過程至少應(yīng)包括錄音、標(biāo)注和確認(rèn)三個(gè)步驟,以保證測(cè)試標(biāo)準(zhǔn)庫(kù)的正確性。

錄制完成后需按測(cè)試語(yǔ)料完成測(cè)試語(yǔ)音文件的切分,進(jìn)入測(cè)試系統(tǒng)前需進(jìn)行語(yǔ)音處理,保證電

平符合要求。

j)背景噪聲的錄制在真車內(nèi)進(jìn)行,使用一個(gè)放置在靠近車載免提麥克風(fēng)處的測(cè)量傳聲器來錄制背

景噪聲,如果條件允許,也可以使用車載免提麥克風(fēng)來直接錄制。一般由測(cè)試實(shí)驗(yàn)室(與生產(chǎn)

廠家)來共同決定使用背景噪聲的類型。環(huán)境噪聲文件的錄制格式為.wav,應(yīng)保證44.1kHz

的采樣頻率和16bit的量化間隔,并記錄噪聲幅值,以便重放。環(huán)境噪聲應(yīng)考慮行車環(huán)境、車

速、前車窗和空調(diào)的使用情況。典型的環(huán)境噪聲的錄制場(chǎng)景如表2所示。

表2典型的環(huán)境噪聲的場(chǎng)景

5

T/TAF041-2019

場(chǎng)景編號(hào)行車環(huán)境車速車窗空調(diào)麥克風(fēng)處的環(huán)境噪聲聲壓級(jí)備注

(僅供參考,以實(shí)際錄制結(jié)果為

準(zhǔn))

1安靜0km/h關(guān)關(guān)45-50dB(A)必選

2鬧市40-60km/h關(guān)低檔50-65dB(A)必選

3高速60-120km/h關(guān)中檔65-75dB(A)必選

4鬧市40-60km/h半開關(guān)65-75dB(A)可選

5高速60-120km/h半開關(guān)70-85dB(A)可選

6.4基于語(yǔ)音標(biāo)準(zhǔn)庫(kù)的測(cè)試方法

6.4.1概況

測(cè)試需要在可重復(fù)的、模擬真實(shí)場(chǎng)景下進(jìn)行。測(cè)試聲場(chǎng)景應(yīng)模擬行車使用環(huán)境,在真實(shí)汽車車殼或

真實(shí)車輛內(nèi)進(jìn)行測(cè)試。推薦使用符合ITU-TP.581規(guī)定的HATS進(jìn)行聲音信號(hào)的重現(xiàn)與采集,使用前對(duì)HATS

進(jìn)行校準(zhǔn)和均衡。

將語(yǔ)音標(biāo)準(zhǔn)庫(kù)中預(yù)先錄制好的語(yǔ)音輸入待測(cè)系統(tǒng),并統(tǒng)計(jì)系統(tǒng)輸出結(jié)果。車載系統(tǒng)的響應(yīng)可以錄像

的方式記錄下來,作為測(cè)試結(jié)果之一。

6.4.2背景噪聲重放

使用四個(gè)中音揚(yáng)聲器和一個(gè)低音揚(yáng)聲器組成的陣列來模擬行車噪聲場(chǎng)景,如圖2所示。使用揚(yáng)聲器

陣列來重放放背景噪聲時(shí),應(yīng)首先經(jīng)過均衡和校準(zhǔn),使得免提麥克風(fēng)位置處的聲功率譜密度和錄音信號(hào)

一致。均衡既可以使用測(cè)量麥克風(fēng),也可以使用錄制背景噪聲時(shí)用過的車載免提麥克風(fēng)。比較錄音信號(hào)

和模擬背景噪聲信號(hào),兩者的最大A計(jì)權(quán)聲壓級(jí)偏差應(yīng)不超過±1dB,在100Hz~10kHz頻率范圍內(nèi)的1/3

倍頻程功率譜密度偏差應(yīng)不超過±3dB。

為了使得揚(yáng)聲器、免提麥克風(fēng)和HATS的聲傳輸路徑間的干擾最小,應(yīng)仔細(xì)選擇揚(yáng)聲器的放置位置。

低音揚(yáng)聲器放置在座位后面正中后備箱上面,后排兩個(gè)揚(yáng)聲器分別放置在后座靠枕與后窗玻璃之間靠近

車殼的支架處,前面兩個(gè)揚(yáng)聲器分別放在儀表面板的上部?jī)蛇叀?/p>

6

T/TAF041-2019

圖2語(yǔ)音識(shí)別測(cè)量及背景噪聲重放設(shè)置

6.4.3車內(nèi)測(cè)試配置

6.4.3.1HATS的放置

一般由廠家來指定HATS的放置位置(包括仿真嘴和仿真耳分別相對(duì)于麥克風(fēng)和揚(yáng)聲器的距離)。如

沒有特別指定,測(cè)試時(shí)HATS應(yīng)放置在駕駛員的座位上,該具體位置應(yīng)和多數(shù)人的駕駛習(xí)慣位置一致,并

且定義仿真嘴到麥克風(fēng)的距離。測(cè)試報(bào)告應(yīng)包含位置信息。

為了保證每次車內(nèi)測(cè)試時(shí)HATS的位置相對(duì)固定,可以通過在車內(nèi)進(jìn)行標(biāo)注的方法來幫助定位(比如

在車內(nèi)中標(biāo)出HATS相對(duì)于某一位置的距離,如左、右車門和車頂?shù)裙潭ㄎ矬w。

注1:如有特殊測(cè)試要求,也可以放置在副駕駛位和乘客位。

6.4.3.2仿真嘴

仿真嘴應(yīng)符合ITU-TP.58的規(guī)定,并依據(jù)ITU-TP.340在MRP處進(jìn)行均衡。

在MRP校準(zhǔn)的聲壓級(jí)為-4.7dBPa。

對(duì)于揚(yáng)聲式車載免提終端,應(yīng)在HATS-HFRP(HATS免提參考點(diǎn))處進(jìn)行聲壓校準(zhǔn),使得HATS-HFRP

處的平均聲壓級(jí)為-25.7dBPa,此時(shí)MRP處的聲壓為發(fā)送方向源信號(hào)大小。以上過程的具體操作步驟見

ITU-TP.581的相關(guān)部分。

測(cè)試行車噪聲環(huán)境下時(shí),由于“倫巴效應(yīng)”,仿真嘴的輸出電平會(huì)增大。

7

T/TAF041-2019

0forN50

IN0.3N50for50N77

8.0forN77

其中I=仿真嘴輸出電平增大值

N=靠近駕駛員頭部位置的長(zhǎng)時(shí)A記權(quán)噪聲大小

ITU-TP.340中規(guī)定,在免提裝置的發(fā)送測(cè)試中,0.3倍的語(yǔ)音電平增長(zhǎng)應(yīng)單獨(dú)計(jì)算。

6.4.3.3仿真耳

對(duì)于揚(yáng)聲免提終端,HATS左右耳的聲信號(hào)均被使用。HATS應(yīng)進(jìn)行自由場(chǎng)或擴(kuò)散場(chǎng)均衡,具體可參考

ITU-TP.581。

對(duì)于頭戴免提終端,使用的耳型和佩戴位置見ITU-TP.380。

6.4.3.4測(cè)試信號(hào)和電平

測(cè)試可以使用提前錄制的真人語(yǔ)音信號(hào)。

所有的測(cè)試信號(hào)電平都是指測(cè)試信號(hào)的激活語(yǔ)音電平(詳見ITU-TP.56)。語(yǔ)音識(shí)別測(cè)試在發(fā)送方

向使用的是非限帶信號(hào)。

測(cè)試信號(hào)的平均大小規(guī)定如下:

——發(fā)送方向(MRP):-4.7dBPa(典型的講話平均聲壓級(jí),相當(dāng)于HATS-HFRP處聲壓級(jí)大小為-28.7

dBPa),這一水平適用于耳機(jī)的免提終端;

——發(fā)送方向(MRP):-1.7dBPa免提揚(yáng)聲器終端(典型的平均說話聲壓級(jí))(相當(dāng)于HATS-HFRP

處聲壓級(jí)大小為-25.7dBPa)。

注:背景噪聲測(cè)試中要考慮“倫巴效應(yīng)”(由于高背景噪聲而增加說話者的說話聲壓級(jí))。

6.5測(cè)試步驟

6.5.1字準(zhǔn)確率

1)人工頭按照6.4.3.1配置,背景噪聲系統(tǒng)按照6.4.2配置并均衡。

2)測(cè)試信號(hào)為根據(jù)6.2、6.3錄制的語(yǔ)音信號(hào)。由人工嘴產(chǎn)生測(cè)試信號(hào)的頻譜在嘴參考點(diǎn)(MRP)

處在自由聲場(chǎng)的條件下進(jìn)行校準(zhǔn)。測(cè)試信號(hào)幅值見6.4.3.4。

3)同步播放測(cè)試信號(hào)和相應(yīng)背景噪聲場(chǎng)景。

4)記錄字準(zhǔn)確率。

注2:安靜情況下,不需播放背景噪聲。

6.5.2識(shí)別成功率

1)人工頭按照6.4.3.1配置,背景噪聲系統(tǒng)按照6.4.2配置并均衡。

2)測(cè)試信號(hào)為根據(jù)6.2、6.3錄制的語(yǔ)音信號(hào),即相應(yīng)命令詞語(yǔ)。由人工嘴產(chǎn)生測(cè)試信號(hào)的

頻譜在嘴參考點(diǎn)(MRP)處在自由聲場(chǎng)的條件下進(jìn)行校準(zhǔn)。測(cè)試信號(hào)幅值見6.4.3.4。

3)同步播放測(cè)試信號(hào)和相應(yīng)背景噪聲場(chǎng)景。

4)記錄識(shí)別結(jié)果。

8

T/TAF041-2019

5)完成所有命令詞測(cè)試后,統(tǒng)計(jì)不同場(chǎng)景下語(yǔ)音識(shí)別率。

6.5.3平均響應(yīng)時(shí)間

1)人工頭按照6.4.3.1配置。

2)測(cè)試信號(hào)為根據(jù)6.2、6.3錄制的語(yǔ)音信號(hào),即相應(yīng)命令詞語(yǔ)。由人工嘴產(chǎn)生測(cè)試信號(hào)的

頻譜在嘴參考點(diǎn)(MRP)處在自由聲場(chǎng)的條件下進(jìn)行校準(zhǔn)。測(cè)試信號(hào)幅值見6.4.3.4。

tt

3)播放測(cè)試信號(hào),記錄語(yǔ)音輸入的結(jié)束時(shí)刻為e;車載語(yǔ)音識(shí)別系統(tǒng)的開始響應(yīng)時(shí)刻為r。

4)計(jì)算響應(yīng)時(shí)間=tr-te。

注3:從標(biāo)準(zhǔn)庫(kù)中選擇5段語(yǔ)音,分別進(jìn)行本地語(yǔ)音識(shí)別和在線語(yǔ)音識(shí)別。如是在線語(yǔ)音識(shí)別,請(qǐng)保持網(wǎng)絡(luò)良好。

6.5.4喚醒率

1)人工頭按照6.4.3.1配置,背景噪聲系統(tǒng)按照6.4.2配置并均衡。

2)測(cè)試信號(hào)為根據(jù)6.2、6.3錄制的語(yǔ)音信號(hào),即相應(yīng)喚醒詞。由人工嘴產(chǎn)生測(cè)試信號(hào)的頻

譜在嘴參考點(diǎn)(MRP)處在自由聲場(chǎng)的條件下進(jìn)行校準(zhǔn)。測(cè)試信號(hào)幅值見6.4.3.4。

3)同步播放測(cè)試信號(hào)和相應(yīng)背景噪聲場(chǎng)景。

4)記錄喚醒測(cè)試結(jié)果。

5)重復(fù)喚醒測(cè)試,統(tǒng)計(jì)不同場(chǎng)景下喚醒率。

6.5.5誤喚醒率

1)人工頭按照6.4.3.1配置,背景噪聲系統(tǒng)按照6.4.2配置并均衡。

2)測(cè)試信號(hào)為根據(jù)6.2、6.3錄制的語(yǔ)音信號(hào),測(cè)試信號(hào)不能是喚醒詞。由人工嘴產(chǎn)生測(cè)試

信號(hào)的頻譜在嘴參考點(diǎn)(MRP)處在自由聲場(chǎng)的條件下進(jìn)行校準(zhǔn)。測(cè)試信號(hào)幅值見

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論