DB43∕T 2562-2023 人工智能手語播報軟件系統(tǒng) 技術(shù)要求_第1頁
DB43∕T 2562-2023 人工智能手語播報軟件系統(tǒng) 技術(shù)要求_第2頁
DB43∕T 2562-2023 人工智能手語播報軟件系統(tǒng) 技術(shù)要求_第3頁
DB43∕T 2562-2023 人工智能手語播報軟件系統(tǒng) 技術(shù)要求_第4頁
DB43∕T 2562-2023 人工智能手語播報軟件系統(tǒng) 技術(shù)要求_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

ICS33.160.01

CCSM60

43

湖南省地方標準

DB43/T2562—2023

人工智能手語播報軟件系統(tǒng)技術(shù)要求

Technicalrequirementsforsoftwaresystemofsignedlanguage

broadcastingbasedonartificialintelligence

2023-02-17發(fā)布2023-05-17實施

湖南省市場監(jiān)督管理局發(fā)布

DB43/T2562—2023

目次

前言...............................................................................III

1范圍..............................................................................1

2規(guī)范性引用文件....................................................................1

3術(shù)語和定義........................................................................1

4系統(tǒng)結(jié)構(gòu)..........................................................................2

5摘要要求..........................................................................3

6摘要稿翻譯要求....................................................................3

7手語計算要求......................................................................4

8虛擬主播要求......................................................................4

9手語播出要求......................................................................6

附錄A(資料性)摘要稿示例.........................................................12

參考文獻............................................................................13

I

DB43/T2562—2023

前言

本文件按照GB/T1.1—2020《標準化工作導(dǎo)則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定

起草。

請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構(gòu)不承擔識別專利的責任。

本文件由湖南省廣播電視局提出并歸口。

本文件起草單位:長沙廣播電視集團、湖南長廣千博科技有限公司、國家廣播電視總局廣播電視科

學(xué)研究院、5G高新視頻多場景應(yīng)用國家廣播電視總局重點實驗室、長沙千博信息技術(shù)有限公司、希而思

(長沙)科技研究院有限公司、長沙市無障礙環(huán)境建設(shè)促進會、長沙廣電數(shù)字移動傳媒有限公司、長沙

市標準化協(xié)會。

本文件主要起草人:周國強、余江、鄧佳樂、歐陽霽、譚麗、張定京、魏娜、脫羚、鄭偉峰、李超、

李斌、彭鈺潔、鄧成、高春鳴、龍麗萍、郭松睿、李蓉、陳昌健、田亞、陳玲、陳惺惺、秦志發(fā)、謝倩

玉。

III

DB43/T2562—2023

人工智能手語播報軟件系統(tǒng)技術(shù)要求

1范圍

本文件規(guī)定了人工智能手語播報軟件系統(tǒng)的結(jié)構(gòu)、摘要要求、摘要稿翻譯要求、手語計算要求、虛

擬主播要求以及手語播出要求。

本文件適用于人工智能手語播報軟件系統(tǒng)的設(shè)計、開發(fā)與應(yīng)用。

2規(guī)范性引用文件

下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,

僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本

文件。

GB/T5271.28—2001信息技術(shù)詞匯第28部分:人工智能基本概念與專家系統(tǒng)

GB/T24435—2009中國手語基本手勢

GF0020—2018國家通用手語常用詞表

3術(shù)語和定義

GB/T5271.28—2001和GB/T24435—2009界定的以及下列術(shù)語和定義適用于本文件。

人工智能artificialintelligence

一門交叉學(xué)科,通常視為計算機科學(xué)的分支,研究表現(xiàn)出與人類智能(如推理和學(xué)習(xí))相關(guān)的各種

功能的模型和系統(tǒng)。

[來源:GB/T5271.28—2001,28.01.01]

手語signedlanguages

以手的動作為主,配以身體姿勢、表情及口形進行交流的語言表達形式。

[來源:GB/T24435—2009,2.1.1]

人工智能手語播報軟件系統(tǒng)softwaresystemofsignedlanguagebroadcastingbasedon

artificialintelligence

采用人工智能技術(shù),將稿件內(nèi)容準確翻譯成手語信息,通過手語計算,驅(qū)動虛擬主播的手勢,進而

生成手語視頻并播出的應(yīng)用系統(tǒng)。

稿件manuscript

與節(jié)目內(nèi)容相關(guān)的文稿。

手勢sign

用手做的表達意思的姿勢,也是對手勢語每個動作和手指語每個指示的簡稱。

[來源:GB/T24435—2009,2.1.5]

1

DB43/T2562—2023

手語模塊signlanguagemodule

包含手語信號、背景信號以及相關(guān)聯(lián)的信號,能夠在屏幕終端顯示手語播出的所有要素。

合成模塊compoundmodule

將手語模塊和視頻模塊進行合成,能夠在生活場景屏幕顯示的視頻的所有要素。

摘要makeasummaryofsignlanguage

基于電視、影視劇等已設(shè)定好視頻或播出時長、有文字稿件等的視頻應(yīng)用場景要求,結(jié)合手語播報

特性,為確保手語信號內(nèi)容與原視頻或節(jié)目時長基本一致,通過提煉、概括等方法,對文字稿件進行壓

縮并確保核心事實沒有改變的過程。

手語稿signlanguagemanuscript

根據(jù)摘要稿的內(nèi)容通過手語翻譯轉(zhuǎn)換成由手語詞匯構(gòu)成的稿件。

4系統(tǒng)結(jié)構(gòu)

概述

人工智能手語播報軟件系統(tǒng)的結(jié)構(gòu)如圖1所示。

圖1人工智能手語播報軟件系統(tǒng)基本結(jié)構(gòu)

人工智能子系統(tǒng)

2

DB43/T2562—2023

人工智能子系統(tǒng)由摘要模塊和手語翻譯模塊組成,完成對文字信息的提取并將其翻譯為手語表達

所需的詞匯及語序。其中,摘要模塊實現(xiàn)對文字的核心詞匯和句子的提取,形成摘要稿;手語翻譯模塊

通過查詢系統(tǒng)內(nèi)建的手語庫,進行對比調(diào)整,翻譯形成手語稿。

可視化子系統(tǒng)

可視化子系統(tǒng)由手語計算模塊和虛擬主播模塊組成,完成對虛擬主播手語手勢的驅(qū)動,并將手語可

視化展示。其中,手語計算模塊根據(jù)手語稿查詢出對應(yīng)的手語動作數(shù)據(jù),并對動作數(shù)據(jù)進行融合,驅(qū)動

虛擬主播打出連續(xù)且正確的手勢;虛擬主播模塊通過圖像引擎將手語計算后的信息進行可視化展現(xiàn)。

手語播出子系統(tǒng)

手語播出子系統(tǒng)用來協(xié)調(diào)手語視頻信號和源視頻信號的比例關(guān)系,并實現(xiàn)手語節(jié)目在各種顯示終

端的播出。

5摘要要求

基本要求

5.1.1摘要應(yīng)源于完整的稿件。

5.1.2摘要后形成的摘要稿應(yīng)比稿件簡短。

5.1.3一些新詞語,在社會層面已經(jīng)廣泛流行的情況下,如:“非典”“甲流”“博客”等,應(yīng)予以

保留。

內(nèi)容要求

5.2.1應(yīng)確保核心事實和信息的準確,不應(yīng)有虛假成分。

5.2.2應(yīng)運用白描手法,不加渲染,并去掉形容詞、修辭手法、成語、俗語等。

5.2.3應(yīng)將書面語言轉(zhuǎn)換為大眾化的語言,并刪掉或調(diào)整專業(yè)性、技術(shù)型或議論性的敘述。

比例要求

按照手語每分鐘100個動作的速度,摘要稿與稿件的比例約為1:3。摘要稿示例見附錄A。

6摘要稿翻譯要求

語義要求

6.1.1語序要求

對語句中的動賓結(jié)構(gòu),系統(tǒng)應(yīng)調(diào)整摘要稿中短語的語序。

示例1:“滅火”:“火滅”。

示例2:“捉魚”:“魚捉”。

示例3:“開門”:“門開”。

6.1.2詞匯省略和轉(zhuǎn)換要求

6.1.2.1對摘要稿中的感嘆詞,系統(tǒng)應(yīng)進行省略;形容詞以及副詞,應(yīng)酌情省略。

6.1.2.2如果省略詞匯導(dǎo)致語句的含義發(fā)生變化,則應(yīng)通過虛擬主播的表情和口型表達。

3

DB43/T2562—2023

6.1.3阿拉伯數(shù)字轉(zhuǎn)換要求

系統(tǒng)應(yīng)將摘要稿中的阿拉伯數(shù)字轉(zhuǎn)換成中文數(shù)字。

示例1:“1千8百”:“一千八百”。

示例2:“2022年”:“二零二二年”。

示例3::“一三一一一一一八八八八”。

示例4:“125個”:“一百二十五個”。

6.1.4帶有否定的詞匯轉(zhuǎn)換要求

6.1.4.1系統(tǒng)應(yīng)對摘要稿中帶有否定含義的詞匯進行轉(zhuǎn)換,轉(zhuǎn)換方式為否定詞+肯定語氣詞。

6.1.4.2雙重否定句應(yīng)直接翻譯成肯定句。

手語庫要求

6.2.1詞匯要求

手語庫中的手語詞匯應(yīng)至少覆蓋2019年出版的《國家通用手語詞典》的8214個詞匯。

6.2.2新詞要求

對于《國家通用手語詞典》中沒有規(guī)定的手語新詞,應(yīng)在基本詞的基礎(chǔ)上,按照以下規(guī)則創(chuàng)造:

a)補充;

示例1:“民生”——手語:“人民+生活”。

b)簡化;

示例2:“神采奕奕”——手語:“精神+樣子+好”。

c)近義詞替代。

示例3:“靦腆”——手語:“害羞”。

7手語計算要求

手語動作融合

虛擬主播的手語動作應(yīng)連貫。每個手語動作根據(jù)動作的位置和時間關(guān)系分成頭部,中部和尾部。相

鄰手語詞匯在虛擬主播表達時,系統(tǒng)應(yīng)對前一個手語詞匯的尾部和后一個手語詞匯頭部進行融合,以保

證手語動作整體連貫一致。

手語動作時序

虛擬主播的手語動作時序應(yīng)合理。為表達句子中核心思想或主題,調(diào)整手語動作的時序關(guān)系,延長

和縮短手語動作的時長,調(diào)整后手語動作的總時長應(yīng)不變。

手勢規(guī)范

7.3.1虛擬主播打出的手勢應(yīng)符合GB/T24435—2009、GF0020—2018以及《國家通用手語詞典》的

規(guī)定。

7.3.2虛擬主播手部動作的空間位置誤差應(yīng)在可接受的范圍內(nèi)。

8虛擬主播要求

4

DB43/T2562—2023

模型靜態(tài)要求

8.1.1模型比例

8.1.1.1虛擬主播的三維模型與真實人物的比例應(yīng)為1:1。

8.1.1.2參照的真實人物應(yīng)五官端正,不應(yīng)有身體缺陷。

8.1.2模型精度與配合

8.1.2.1虛擬主播的面部模型應(yīng)具有獨立的網(wǎng)格,且網(wǎng)格應(yīng)由至少1萬個頂點組成。

8.1.2.2虛擬主播的五官應(yīng)有孤立口腔網(wǎng)格、上下牙網(wǎng)格、舌頭網(wǎng)格、獨立左右眼球網(wǎng)格、眼瞼網(wǎng)格

以及淚腺網(wǎng)格。

8.1.2.3虛擬主播的頭部模型與身體模型合并后,彼此不應(yīng)有沖突,且應(yīng)與實際相符。

8.1.3模型服飾

8.1.3.1虛擬主播的服飾應(yīng)得體、大方,且應(yīng)符合電視節(jié)目的要求,不應(yīng)出現(xiàn)奇裝異服和暴露的衣服。

8.1.3.2服裝的款式應(yīng)采用西裝長褲套裝,服裝顏色應(yīng)適合上屏。

模型動態(tài)要求

8.2.1運動原理

虛擬主播的各種動作應(yīng)運用骨骼驅(qū)動原理,各種面部表情的表達應(yīng)運用壓扁和拉長原理。

8.2.2臉部

8.2.2.1口型

8.2.2.1.1虛擬主播的口唇動畫應(yīng)包括以下6種基本口型:

a)閉合口型;

b)微張口型;

c)張開口型;

d)寬張口型;

e)圓形口型;

f)收窄口型。

8.2.2.1.2虛擬主播的口唇動畫應(yīng)與人的口唇運動相符合,6種口型應(yīng)相互融合和切換。

8.2.2.2表情

虛擬主播的基本表情分為5種,對應(yīng)的表情特征應(yīng)符合表1的規(guī)定。

表1虛擬主播基本表情

序號基本表情特征

1中性無

2生氣外側(cè)眼皮抬起,眼皮下垂,鼻子皺起,上嘴唇抬起,下嘴唇下?lián)P

3高興內(nèi)側(cè)眼皮上翹,眉毛上揚,嘴巴微張,嘴角上揚

4傷心內(nèi)側(cè)眼皮抬起,眉毛下壓,嘴角緊繃

5驚訝眼皮、眉毛上揚,面部表情拉伸,嘴巴打開

8.2.3身體

5

DB43/T2562—2023

虛擬主播的身體應(yīng)能完成簡單的運動來配合表達手語稿的手語含義,身體動作如:向前、后、左、

右運動。

8.2.4手部

虛擬主播的手部應(yīng)能夠靈活地打開和收攏,完成手語的表達。

9手語播出要求

總體要求

9.1.1由手語稿生成的手語視頻時長不應(yīng)長于原視頻時長。

9.1.2針對不同的終端應(yīng)用場景,系統(tǒng)應(yīng)調(diào)整不同的手語模塊參數(shù),使視頻圖像合適地展現(xiàn)。終端應(yīng)

用場景分為以下兩類:

a)電視節(jié)目。按照節(jié)目內(nèi)容,分為:

1)新聞、訪談類節(jié)目;

2)生活、教育類節(jié)目;

3)影視劇類節(jié)目。

b)互聯(lián)網(wǎng)節(jié)目。按照終端類型,分為:

1)網(wǎng)站;

2)APP客戶端。

電視節(jié)目參數(shù)要求

9.2.1新聞、訪談類節(jié)目

9.2.1.1新聞、訪談類節(jié)目中手語模塊尺寸不應(yīng)過大,應(yīng)根據(jù)現(xiàn)有節(jié)目包裝來確定手語模塊在合成模

塊中的位置和尺寸參數(shù)。手語模塊在合成模塊(高清)中的參數(shù)應(yīng)符合表2的要求。

表2手語模塊在合成模塊(高清)中的參數(shù)

項目參數(shù)

手語模塊尺寸(像素)(300±10)×(350±10)

手語模塊應(yīng)用區(qū)域畫面下2/3區(qū)域

合成模塊的尺寸(像素)1920×1080

虛擬主播和手語模塊比例2:3

虛擬主播的朝向正向

9.2.1.2新聞、訪談類節(jié)目中手語模塊在合成模塊(高清)中的位置示意參見圖2。

6

DB43/T2562—2023

標引序列說明:

1——手語模塊顯示區(qū)域;

2——合成模塊范圍;

3——手語模塊顯示區(qū)域可移動的范圍。

圖2新聞、訪談類節(jié)目手語模塊在合成模塊(高清)中的位置示意圖

9.2.2生活、教育類節(jié)目

9.2.2.1生活、教育類節(jié)目中手語模塊尺寸應(yīng)比新聞、訪談類節(jié)目中大,應(yīng)根據(jù)現(xiàn)有節(jié)目包裝來確定

手語模塊在合成模塊的位置和尺寸參數(shù)。手語模塊在合成模塊(高清)中的參數(shù)應(yīng)符合表3的要求。

表3手語模塊在合成模塊(高清)中的參數(shù)

項目參數(shù)

手語模塊尺寸(像素)(960±20)×1080

手語模塊應(yīng)用區(qū)域畫面右1/2區(qū)域

合成模塊的尺寸(像素)1920×1080

虛擬主播和手語模塊比例4:7

虛擬主播的朝向正向

9.2.2.2生活、教育類節(jié)目中手語圖像在合成模塊(高清)中的位置示意參見圖3。

7

DB43/T2562—2023

標引序列說明:

1——合成模塊范圍;

2——手語模塊顯示區(qū)域。

圖3生活、教育類節(jié)目手語模塊在合成模塊(高清)中的位置示意圖

9.2.3影視劇類節(jié)目

9.2.3.1影視劇類節(jié)目中手語模塊尺寸不應(yīng)過大,應(yīng)根據(jù)所在終端屏幕的大小來確定手語模塊在合成

模塊中的位置和尺寸參數(shù)。手語模塊在合成模塊(高清)中的參數(shù)應(yīng)符合表4的要求。

表4手語模塊在合成模塊中的參數(shù)

項目參數(shù)

手語模塊尺寸(像素)(450±10)×(500±10)

手語模塊應(yīng)用區(qū)域畫面下2/3區(qū)域

合成模塊的尺寸(像素)1920×1080

虛擬主播和手語模塊比例4:5

虛擬主播的朝向正向

9.2.3.2影視劇類節(jié)目中手語模塊在合成模塊(高清)中的位置示意參見圖2。

互聯(lián)網(wǎng)節(jié)目參數(shù)要求

9.3.1網(wǎng)站

9.3.1.1網(wǎng)站內(nèi)容應(yīng)允許用戶自主選擇是否進行翻譯。用戶點擊翻譯按鈕并用鼠標選擇需要翻譯的內(nèi)

容后,虛擬主播應(yīng)進行對應(yīng)的翻譯。

9.3.1.2網(wǎng)頁內(nèi)手語模塊顯示的長寬比例應(yīng)為9:16,大小和位置參數(shù)參見圖4。

8

DB43/T2562—2023

標引序列說明:

1——手語模塊顯示區(qū)域;

2——合成模塊范圍;

3——手語模塊顯示區(qū)域可移動的范圍。

圖4網(wǎng)站中手語模塊在合成模塊的位置示意圖

9.3.2APP客戶端

9.3.2.1分類

在APP客戶端中,手語模塊分為兩種顯示模式:浮窗式和嵌入式。

9.3.2.2浮窗式

9.3.2.2.1浮窗式應(yīng)能允許用戶調(diào)整手語模塊的顯示位置,且屏幕右上角應(yīng)提供由用戶選擇關(guān)閉以及

切換為嵌入式觀看的按鈕。

9.3.2.2.2浮窗式的顯示長寬比例應(yīng)為3:4,顯示大小不應(yīng)大于客戶端屏幕的40%,不應(yīng)影響用戶主要

閱讀瀏覽,且應(yīng)顯示虛擬主播的上半身。

9.3.2.2.3浮窗式手語模塊在合成模塊中的位置參見圖5。

9

DB43/T2562—2023

標引序列說明:

1——合成模塊范圍;

2——手語模塊顯示區(qū)域可移動的范圍;

3——手語模塊顯示區(qū)域。

圖5浮窗式手語模塊在合成模塊中的位置示意圖

9.3.2.3嵌入式

9.3.2.3.1嵌入式手語模塊的顯示大小應(yīng)占據(jù)移動端屏幕的40%,顯示長寬比例應(yīng)為3:2。

9.3.2.3.2嵌入式手語模塊的右上角應(yīng)提供由用戶選擇關(guān)閉以及切換為浮窗式觀看的按鈕。

9.3.2.3.3嵌入式手語模塊在合成模塊中的位置參見圖6。

10

DB43/T2562—2023

標引序列說明:

1——合成模塊范圍;

2——手語模塊顯示區(qū)域。

圖6嵌入式手語模塊在合成模塊中的位置示意圖

11

DB43/T2562—2023

A

A

附錄A

(資料性)

摘要稿示例

【標題】

首屆湖南旅游發(fā)展大會將于11月19日在張家界開幕

【導(dǎo)語】

辦一次會,興一座城。記者今天從首屆湖南旅游發(fā)展大會組委會獲悉,大會將于11月19

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論