TCTSA 0015-2023 虛擬數(shù)字人能力技術(shù)要求第1部分：通用技術(shù)要求

上傳人：優(yōu)*** IP屬地：廣西上傳時間：2023-07-09 格式：DOCX 頁數(shù)：14 大小：78.44KB 積分：12 舉報 版權(quán)申訴

TCTSA 0015-2023 虛擬數(shù)字人能力技術(shù)要求第1部分：通用技術(shù)要求_第2頁

TCTSA 0015-2023 虛擬數(shù)字人能力技術(shù)要求第1部分：通用技術(shù)要求_第3頁

TCTSA 0015-2023 虛擬數(shù)字人能力技術(shù)要求第1部分：通用技術(shù)要求_第4頁

TCTSA 0015-2023 虛擬數(shù)字人能力技術(shù)要求第1部分：通用技術(shù)要求_第5頁

已閱讀5頁，還剩9頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

ICS03.080.01A10團體標準T/CTSA 0015-2023虛擬數(shù)字人能力技術(shù)要第1部分: 通用技術(shù)要TechnicalRequirementsforDigitalHumanCapabilitiesPart1:GeneralTechnicalRequirements2023-03-31發(fā)布 2023-03-31實施中關(guān)村中恒文化科技創(chuàng)新服務聯(lián)盟發(fā)布T/CTSA0015-2023T/CTSA0015-2023目次前言 II范圍 1規(guī)范性引用文件 1術(shù)語和定義 1通用術(shù)語 1技術(shù)術(shù)語 2應用術(shù)語 4縮略語 4虛擬數(shù)字人分類 4概述 5按照圖像資產(chǎn)分類 5按照互動形式分類 5按照應用模式分類 6虛擬數(shù)字人系統(tǒng) 6虛擬數(shù)字人資產(chǎn) 7概述 7圖形圖像資產(chǎn) 7動態(tài)數(shù)據(jù)資產(chǎn) 8系統(tǒng)技術(shù)資產(chǎn) 8虛擬數(shù)字人角色的能力 108.1 概述 10形象呈現(xiàn)能力 10語音生成能力 10動作驅(qū)動能力 10交互表達能力 10內(nèi)容供給能力 11整體表現(xiàn)能力 11I前言本文件按照GB/T1.1—2020《標準化工作導則第1部分：標準化文件的結(jié)構(gòu)和起草規(guī)則》和GB/T13016《標準體系構(gòu)建原則和要求》的規(guī)定起草。T/CPRA31043個部分：——第1部分：通用技術(shù)要求；——第2部分：非實時交互虛擬數(shù)字人的能力分級與評測；——第3部分：實時交互虛擬數(shù)字人的能力分級與評測；本文件是T/CPRA3104的第1部分。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構(gòu)不承擔識別專利的責任。本文件由中關(guān)村中恒文化科技創(chuàng)新服務聯(lián)盟和中國公共關(guān)系協(xié)會文化大數(shù)據(jù)產(chǎn)業(yè)委員會共同提出并歸口。本文件起草單位：中央戲劇學院、快手科技有限公司、北京理工大學、中科院自動化所、北京藍色光標數(shù)據(jù)科技股份有限公司、海信視像科技股份有限公司、北京素鱗科技產(chǎn)業(yè)有限公司、廣州玖的數(shù)碼科技有限公司、廣州龍聯(lián)科技文化發(fā)展有限公司、伏羲云（北京）文化科技有限公司、北京玖揚博文文化發(fā)展有限公司、北京郵電大學、華郵數(shù)字文化技術(shù)研究院(廈門)有限公司、海南大學、中關(guān)村中恒文化科技融合創(chuàng)新中心、清研千訊（北京）科技有限公司、廈門理工學院影視與傳播學院、廈門理工學院設(shè)計藝術(shù)學院、福建網(wǎng)龍計算機網(wǎng)絡信息技術(shù)有限公司、上海東方怡動數(shù)字科技有限公司、數(shù)字栩生（北京）科技有限公司。本文件主要起草人：宋震、徐夢露、鄭屹、劉文超、翁冬冬、包儀華、劉杰、劉復昌、潘志庚、郭曉喆、楊善松、劉德建、吳立素、高楠、蔣耀琳、付愛國、葛巖、許經(jīng)捷、龐博、閆喆、樸經(jīng)緯、蘇彥聰、李建勛、張勇、謝生文、黃夢醒、劉兵、高凱、亓峰、何雪萍、王競?cè)?、薛曉鵬、尹暉、陳磊、崔義娜、代旭、高歌、陳洪、周萍、何樂、陳皓月。II1范圍本文件規(guī)定了虛擬數(shù)字人基礎(chǔ)術(shù)語、虛擬數(shù)字人分類、虛擬數(shù)字人系統(tǒng)、虛擬數(shù)字人資產(chǎn)和虛擬數(shù)字人角色的能力等通用技術(shù)要求。本文件適用于虛擬數(shù)字人系統(tǒng)建設(shè)、虛擬數(shù)字人資產(chǎn)生產(chǎn)，以及虛擬數(shù)字人運營。規(guī)范性引用文件下列文件中內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中，注日期的引用文件，僅該日期對應的版本適用于本文件；不注日期的引用文件，其最新版本（包含所有的修改單）適用于本文件。ITU-TF.748.14Requirementsandevaluationmethodsofnon-interactive2Dreal-persondigitalhumanapplicationsystemITU-TF.748.15Frameworkandmetricsfordigitalhumanapplicationsystem術(shù)語和定義下列術(shù)語和定義適用于本文件。通用術(shù)語虛擬數(shù)字人 digitalhuman是指集成了計算機圖形學、計算機視覺、智能語音、自然語言處理技術(shù)的計算機應用程序，可用于數(shù)字內(nèi)容生成和人機交互，幫助提高內(nèi)容制作效率和用戶體驗。[來源：ITU-TF.748.15,3.2.1]虛擬數(shù)字人一般由虛擬數(shù)字人系統(tǒng)、虛擬數(shù)字人資產(chǎn)、虛擬數(shù)字人角色構(gòu)成。虛擬數(shù)字人系統(tǒng) digitalhumansystem是指利用人機界面、通信設(shè)施和數(shù)據(jù)管理系統(tǒng)等資源提供的服務來實現(xiàn)虛擬數(shù)字人能力的應用程序。虛擬數(shù)字人資產(chǎn) digitalhumanassets是指虛擬數(shù)字人開發(fā)過程中所涉及到的數(shù)字資源，通常以可存儲的數(shù)據(jù)、文本等信息為載體和表現(xiàn)形式，能夠持續(xù)用于支持虛擬數(shù)字人應用系統(tǒng)運行并能夠帶來一定的經(jīng)濟效益，主要包括但不限于圖形圖像資產(chǎn)、動態(tài)數(shù)據(jù)資產(chǎn)、系統(tǒng)技術(shù)資產(chǎn)。1虛擬數(shù)字人角色 digitalhumancharacter是指基于虛擬數(shù)字人系統(tǒng)，以虛擬數(shù)字人資產(chǎn)為支撐、以人形外貌為表征、以人機交互為主要方式、具有多重人類特征的數(shù)字孿生產(chǎn)物，其對外可呈現(xiàn)出相應的服務能力，主要表現(xiàn)為形象呈現(xiàn)、語音生成、動作驅(qū)動、交互表達、內(nèi)容表現(xiàn)、整體表現(xiàn)等維度的能力。通常虛擬數(shù)字人角色狹義地被稱之為虛擬數(shù)字人。技術(shù)術(shù)語紋理 texture是指經(jīng)過正射糾正和統(tǒng)一勻光處理，用于表示物體色調(diào)、飽和度、明度等特征來反應模型表面紋理和色澤特征的貼圖影像。[來源：CH/T9015-2012,3.10]材質(zhì) material是指賦予模型表面色彩、紋理、光滑度、透明度、反射率、折射率、發(fā)光度等可視屬性的過程，主要用來表現(xiàn)物體對光的反射、折射等交互性質(zhì)。[來源：DB22/T2019,2.6]渲染 rendering是指對一個虛擬場景進行處理，得到符合人類知覺（視覺、聽覺、觸覺等）輸出的過程。本文件中特指經(jīng)由虛擬數(shù)字人模型數(shù)據(jù)生成一張或多張二維圖像的技術(shù)，可具體分為實時渲染技術(shù)和離線渲染技術(shù)。[來源：GB/T38247-2019,2.2.41]骨骼節(jié)點 bonenodes是指為了實現(xiàn)虛擬數(shù)字人表情、動作變化所創(chuàng)建的一系列與虛擬數(shù)字人模型相互關(guān)聯(lián)的可控節(jié)點。蒙皮 skinning是指把虛擬數(shù)字人模型上的三維頂點關(guān)聯(lián)到骨骼節(jié)點上的技術(shù)，使虛擬數(shù)字人模型可以通過骨骼運動帶動整體模型的形變與運動。綁定 rigging是指通過給模版參數(shù)提供參數(shù)值，從模版產(chǎn)生模型元素的過程。本文件中特指為模型添加骨骼和控制器的制作過程，使模型物體有層次地被相關(guān)聯(lián)的骨骼控制，最終應用于虛擬數(shù)字人動畫環(huán)節(jié)的制作。[來源：SJ/T11290-2003,2.21]模型 model2是指對客觀現(xiàn)實某些方面的抽象。本文件中特指利用三維建模和重建技術(shù)，仿照實際人體外形或設(shè)計圖樣（不局限于平面與立體）生成的三維數(shù)據(jù)集合，通常應用于虛擬數(shù)字人呈現(xiàn)。[來源：GB/T17694-2009,B.314]模型數(shù)據(jù) modeldata3DMaxAutoCAD本文件中特指針對虛擬數(shù)字人的模型數(shù)據(jù)。[來源：DB42/T1506-2019,3.2]三維建模和重建 3Dmodelingandreconstruction是指基于傳感器對真實場景進行測量并構(gòu)建其三維模型。[來源：GB/T41864-2022,3.7.15]圖像分辨率imageresolution是指圖像單位尺寸中包含的像素點數(shù)，用于描述圖像精細程度。注1：對于數(shù)字圖像的分辨率，通常由垂直方向和水平方向單位距離的像素個數(shù)確定。[來源：GB/T41864-2022,3.1.11]交互 interaction是指一種行為，它由一些特定背景下為實現(xiàn)特定目的的對象之間交換的消息組成。本文件中特指用戶與虛擬數(shù)字人進行交流互動的行為。[來源：GB/T41864-2022,2.69]文本驅(qū)動 textdriven是指以文本作為輸入，通過處理生成虛擬數(shù)字人表情、動作、語音或視頻的驅(qū)動方式。音頻驅(qū)動 audiodriven是指以聲音作為輸入，通過處理生成虛擬數(shù)字人表情、動作或視頻的驅(qū)動方式。視頻驅(qū)動 videodriven是指以圖像或視頻作為輸入，通過處理生成虛擬數(shù)字人表情、動作、語音或視頻的驅(qū)動方式。動作捕捉驅(qū)動 motioncapturedriven是指通過動作捕捉設(shè)備對真人的動作捕捉，實現(xiàn)對虛擬數(shù)字人表情及動作控制的驅(qū)動方式。完備度 completenessdegree描述虛擬數(shù)字人的模型組件、紋理貼圖等構(gòu)成要素是否能夠充分支撐渲染需求，是否用分離的子模型完整表達了模型的重要組成部分。3精細度 finenessdegree描述虛擬數(shù)字人模型中各視覺要素的粒度或精度是否能夠充分滿足渲染需求。風格貼合度 artisticstylematchingdegree描述虛擬數(shù)字人實際表現(xiàn)的現(xiàn)實狀態(tài)與其前期設(shè)定的預期狀態(tài)相似程度。應用術(shù)語數(shù)字人美術(shù)風格 digitalhumanartstyle是指虛擬數(shù)字人渲染的美術(shù)風格，可根據(jù)與真人的相似程度可分為卡通、半寫實、寫實等3個類別。形象呈現(xiàn)能力 imagepresentationability是指能夠提供虛擬數(shù)字人視覺外觀載體的能力。語音生成能力 speechsynthesisability是指能夠提供虛擬數(shù)字人語言表達載體的能力。動作驅(qū)動能力 motiondrivenability是指能夠?qū)崿F(xiàn)虛擬數(shù)字人從靜態(tài)呈現(xiàn)轉(zhuǎn)換為動態(tài)呈現(xiàn)的能力。交互表達能力 interactiveexpressionability是指能夠基于信息獲取、識別、處理、傳達等行為與用戶進行互動的能力。內(nèi)容供給能力 contentsupplyability是指虛擬數(shù)字人能夠?qū)崿F(xiàn)知識表達的服務技能，具有用語言、面部表情和肢體動作等多模態(tài)信息進行表達溝通的能力。整體表現(xiàn)能力 overallrepresentationability是指虛擬數(shù)字人形象、語音、驅(qū)動、同步、表達、感知互動等方面的綜合能力?？s略語下列縮略語適用于本文。2D：二維(Two-Dimensional)3D：三維(ThreeDimension)AI：人工智能(ArtificialIntelligence)虛擬數(shù)字人分類4概述虛擬數(shù)字人的分類方法包括但不限于從圖像資產(chǎn)、互動形式、應用場景等3個維度進行劃分。按照圖像資產(chǎn)分類圖像資產(chǎn)可以按照空間渲染層次、美術(shù)風格進行分類。2D3D虛擬數(shù)字人。——2D虛擬數(shù)字人是指所構(gòu)建的虛擬數(shù)字人僅具有高度和寬度兩個層次信息的平面形態(tài)，不包含深度信息；——3D虛擬數(shù)字人是指所構(gòu)建的虛擬數(shù)字人兼具高度、寬度和深度三個層次信息的立體形態(tài)。擬數(shù)字人。——卡通虛擬數(shù)字人是指以夸張變形為主要特點，依據(jù)生產(chǎn)者的創(chuàng)造力和想象力，通過造型手段使虛擬數(shù)字人視覺特征更加鮮明，有意識地將虛擬數(shù)字人的臉型、五官形狀與位置、軀干造型及比例等參數(shù)擺脫真人生理解剖結(jié)構(gòu)的束縛；——半寫實虛擬數(shù)字人是指虛擬數(shù)字人的臉型、五官形狀與位置、軀干造型及比例等參數(shù)參照真人的生理解剖結(jié)構(gòu)，但是會在一定程度上運用恰當?shù)母爬?、提煉等手法對現(xiàn)實中的人進行再創(chuàng)作，使之既貼近生活和自然，又有一定的差異，例如皮膚細節(jié)異于真人等。按照互動形式分類互動形式可以按照響應時間、驅(qū)動方法進行分類。按照互動形式的響應時間，虛擬數(shù)字人分為實時交互和非實時交互虛擬數(shù)字人?！獙崟r交互虛擬數(shù)字人是指以三維實時引擎為技術(shù)途徑進行構(gòu)建，可利用不同的驅(qū)動方式與其進行實時互動，對于AI的生成速度和質(zhì)量有所要求；——非實時交互虛擬數(shù)字人是指以傳統(tǒng)影視技術(shù)為基礎(chǔ)進行構(gòu)建，其運作流程主要依據(jù)目標文本對應生成虛擬數(shù)字人語音和動畫，并合成呈現(xiàn)給用戶，但無法進行實時驅(qū)動，主要驅(qū)動方式包括但不限于通過文本驅(qū)動、音頻驅(qū)動、視頻驅(qū)動等。注1:同一個虛擬數(shù)字人可支持一種或多種驅(qū)動方式，可根據(jù)主要驅(qū)動方式進行歸類。注2:與實時交互虛擬數(shù)字人相比，非實時交互虛擬數(shù)字人更加關(guān)注資產(chǎn)質(zhì)量的維度，如生成的圖像質(zhì)量、資產(chǎn)的質(zhì)量、模型面數(shù)、拓撲合理性、是否有法線貼圖等。——智能驅(qū)動虛擬數(shù)字人是指通過前置性對聲音、動作等內(nèi)容數(shù)據(jù)進行標樣、整理和學習，使虛擬數(shù)字人智能系統(tǒng)對外界輸入的多模態(tài)信息能夠進行自動讀取、解析及識別，實現(xiàn)虛擬數(shù)字人智能化信息處理與傳輸，從而決策后續(xù)的輸出文本、驅(qū)動模型生成相應的語音與動作，完成與用戶的互動；5——真人驅(qū)動虛擬數(shù)字人是指在實現(xiàn)虛擬數(shù)字人從靜態(tài)到動態(tài)的轉(zhuǎn)變過程中，需要通過視頻監(jiān)控、動作捕捉等系統(tǒng)提取真人的關(guān)鍵數(shù)據(jù)信息，將真人的表情、動作實時呈現(xiàn)在虛擬數(shù)字人形象上，完成與用戶的互動。按照應用模式分類應用模式可以按照所提供的服務方式、所具有的身份特征進行分類。按照應用模式中所提供的服務方式，虛擬數(shù)字人分為替身類和智能助手類虛擬數(shù)字人?！嫔眍愄摂M數(shù)字人是指可代替真人從事一種或多種服務型工作，以提供標準化服務的數(shù)字孿生產(chǎn)物；按照應用模式中所具有的身份特征，虛擬數(shù)字人分為分身型和偶像型虛擬數(shù)字人?！稚硇吞摂M數(shù)字人是指其在真實世界中有客觀實在的對應用戶，是基于真實用戶數(shù)據(jù)信息在虛擬空間中映射出的數(shù)字孿生產(chǎn)物；——偶像型虛擬數(shù)字人是指其在真實世界中沒有客觀實在的對應用戶，是基于創(chuàng)作者對現(xiàn)代人物性格和大眾心理的把握，從而在虛擬世界中主觀創(chuàng)造出來的數(shù)字化產(chǎn)物。虛擬數(shù)字人系統(tǒng)6個模塊。前42個模塊用以支撐虛擬數(shù)字人驅(qū)動與合成顯示，如圖1所示。圖1虛擬數(shù)字人系統(tǒng)框架——圖像模塊：提供虛擬數(shù)字人的圖像資產(chǎn)。6——語音模塊：可生成與文本相對應的虛擬數(shù)字人角色聲音的模塊?！獎赢嬆K：可根據(jù)文本生成虛擬數(shù)字人角色動畫的模塊，包括面部表情和肢體動作?！换ツK：可使虛擬數(shù)字人能夠感知、識別、理解和決策的模塊，即基于智能感知與識別、智能分析與決策等技術(shù)識別用戶輸入的信息，同時通過理解其意圖做出后續(xù)決策，以驅(qū)動虛擬數(shù)字人進行語音和動畫播放，從而帶動虛擬數(shù)字人開始新一輪的交互。注1：該模塊為擴展項，可根據(jù)實際需求決定其有無?！嗄B(tài)輸入模塊：用于接收用戶輸入信息的模塊?！嗄B(tài)輸出模塊：用于向用戶呈現(xiàn)輸出信息的模塊。虛擬數(shù)字人資產(chǎn)概述3個類別，支撐虛擬數(shù)字人系統(tǒng)實現(xiàn)虛擬數(shù)字人角色的能力。圖形圖像資產(chǎn)圖形圖像資產(chǎn)用于支撐虛擬數(shù)字人模型的視覺化呈現(xiàn)，可按照空間維度分為二維圖形圖像資產(chǎn)、三維圖形圖像資產(chǎn)等2個類別。二維圖形圖像資產(chǎn)二維圖形圖像資產(chǎn)用于支撐2D虛擬數(shù)字人視覺化呈現(xiàn)，包括但不限于位圖圖像、矢量圖形、動態(tài)圖像等內(nèi)容，應具備但不限于如下信息：a）用于決定二維圖形圖像資產(chǎn)特征的圖像分辨率、顏色模型或參數(shù)化方程等信息。b）用于表示提供或開發(fā)二維圖形圖像資產(chǎn)的人員、時間、地點等信息。用于表示二維圖形圖像資產(chǎn)存儲的大小、格式及路徑等信息。用于明確二維圖形圖像資產(chǎn)使用目標及環(huán)境等信息。注1:位圖圖像以數(shù)字化的形式描述和存儲圖像上每一點的顏色、亮度等相關(guān)視覺信息，一般指代由數(shù)碼相機、掃描儀、攝像機等設(shè)備捕捉實際場景畫面或以數(shù)字化形式存儲的任意畫面。注2:矢量圖形以指令集合的形式對圖形的內(nèi)容進行描述和存儲，如直線、矩形或圖表等抽象靜態(tài)圖形。三維圖形圖像資產(chǎn)三維圖形圖像資產(chǎn)用于支撐3D虛擬數(shù)字人視覺化呈現(xiàn)，應具備但不限于如下信息：a）用于決定三維圖形圖像資產(chǎn)屬性的材質(zhì)、紋理、模型數(shù)據(jù)、著色器等信息。b）用于表示提供或開發(fā)三維圖形圖像資產(chǎn)的人員、時間、地點等信息。c）用于表示三維圖形圖像資產(chǎn)存儲的大小、格式及路徑等信息。d）用于明確三維圖形圖像資產(chǎn)使用目標及環(huán)境等信息。注1:紋理和圖像能夠在虛擬數(shù)字人交互和應用中提供顏色和可視化細節(jié)。紋理連同形狀的表示形式（通常是三維模型）來呈現(xiàn)整個對象或場景，而圖像通常是對象或場景的獨立表示形式。常見的紋理包括紋理圖、法線7圖、高度圖、立方體圖等。注2:三維模型能夠在虛擬數(shù)字人創(chuàng)建和應用中提供空間、形狀等信息，一般將三維空間中點的位置（稱為頂點）和索引數(shù)據(jù)一起編碼，以定義表示模型形狀的線或三角形。注3:著色器用以確定虛擬數(shù)字人三維模型轉(zhuǎn)換為屏幕形狀的方式，以及這些形狀中每個像素的著色方式。動態(tài)數(shù)據(jù)資產(chǎn)動態(tài)數(shù)據(jù)資產(chǎn)用于支撐虛擬數(shù)字人肢體動作、面部神情等動態(tài)效果呈現(xiàn)，可按照數(shù)據(jù)模態(tài)的不同進行劃分，包括但不限于動作數(shù)據(jù)資產(chǎn)、語音數(shù)據(jù)資產(chǎn)等2個類別。動作數(shù)據(jù)資產(chǎn)動作數(shù)據(jù)資產(chǎn)用于驅(qū)動虛擬數(shù)字人肢體動作和面部表情，包括但不限于面部表情數(shù)據(jù)、肢體動作數(shù)據(jù)等內(nèi)容，應具備但不限于如下信息：用于決定動作數(shù)據(jù)資產(chǎn)時間、空間、位置關(guān)系等特征的信息，包括但不限于原始、樣本、修復等類別的信息。用于表示動作數(shù)據(jù)資產(chǎn)提供或開發(fā)的人員、時間、地點等信息。d）用于表示動作數(shù)據(jù)資產(chǎn)存儲的大小、格式及路徑等信息。e）用于明確動作數(shù)據(jù)資產(chǎn)適配目標、方式及使用環(huán)境等信息。注1:面部表情數(shù)據(jù)用于驅(qū)動虛擬數(shù)字人面部表情，包括但不限于面部表情采集和捕捉數(shù)據(jù)、面部圖像處理和驅(qū)動數(shù)據(jù)等數(shù)據(jù)類型。注2:肢體動作數(shù)據(jù)用于驅(qū)動虛擬數(shù)字人的肢體動作，包括但不限于動作采集和捕捉數(shù)據(jù)、動作處理和驅(qū)動數(shù)據(jù)等數(shù)據(jù)類型。語音數(shù)據(jù)資產(chǎn)語音數(shù)據(jù)資產(chǎn)用于合成虛擬數(shù)字人的語音，以支撐實現(xiàn)語音播放、交互等聽覺效果，包括但不限于提前錄制好的真人音頻數(shù)據(jù)、以AI文本生成的實時語音數(shù)據(jù)。用于表示提供或開發(fā)語音數(shù)據(jù)資產(chǎn)的人員、時間、地點等信息。d）用于表示語音數(shù)據(jù)資產(chǎn)存儲的大小、格式及路徑等信息。e）用于明確語音數(shù)據(jù)資產(chǎn)適配目標、方式及使用環(huán)境等信息。系統(tǒng)技術(shù)資產(chǎn)系統(tǒng)技術(shù)資產(chǎn)用于支持虛擬數(shù)字人底層功能的開發(fā)實現(xiàn)。通常以整合的技術(shù)路徑及方法為內(nèi)容，通過一定的技術(shù)載體進行表現(xiàn)，不具有獨立實體，可按照技術(shù)路徑的整合性形式進行拆分，包括但不限于形象技術(shù)資產(chǎn)、語音技術(shù)資產(chǎn)、動畫生成技術(shù)資產(chǎn)、音視頻合成技術(shù)資產(chǎn)、交互技術(shù)資產(chǎn)等形式。8形象技術(shù)資產(chǎn)形象技術(shù)資產(chǎn)用于支持虛擬數(shù)字人角色的性格、外觀等視覺特征的生成、裝扮等功能，應具備但不限于如下內(nèi)容：用于表示虛擬數(shù)字人視覺特征重建過程中所涉及到的專利、團隊、專有技術(shù)等信息。d）用于明確該資產(chǎn)以上信息的文件大小、數(shù)據(jù)格式、存儲路徑等信息。語音技術(shù)資產(chǎn)語音技術(shù)資產(chǎn)用于支持虛擬數(shù)字人語音合成、編輯、轉(zhuǎn)換、定制等功能，應具備但不限于如下信息：用于明確該資產(chǎn)以上信息的文件大小、數(shù)據(jù)格式、存儲路徑等信息。動畫生成技術(shù)資產(chǎn)動畫生成技術(shù)資產(chǎn)用于支持虛擬數(shù)字人在圖形圖像數(shù)據(jù)等信息文本的基礎(chǔ)上實現(xiàn)動畫呈現(xiàn)功能，應具備但不限于如下信息：用于明確該資產(chǎn)以上信息的文件大小、數(shù)據(jù)格式、存儲路徑等信息。音視頻合成技術(shù)資產(chǎn)用于表示虛擬數(shù)字人音視頻合成顯示、定制播放等功能的過程中所涉及到的專利、團隊、專有技術(shù)等信息。用于明確該資產(chǎn)以上信息的文件大小、數(shù)據(jù)格式、存儲路徑等信息。9交互技術(shù)資產(chǎn)交互技術(shù)資產(chǎn)用于支持虛擬數(shù)字人通過即時傳遞反饋信息實現(xiàn)與用戶互動等

人人文庫> 全部分類> 行業(yè)資料 > 各類標準

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

TCTSA 0015-2023 虛擬數(shù)字人能力技術(shù)要求第1部分：通用技術(shù)要求

文檔簡介

溫馨提示

最新文檔

評論

TCTSA 0015-2023 虛擬數(shù)字人能力技術(shù)要求 第1部分：通用技術(shù)要求

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

TCTSA 0015-2023 虛擬數(shù)字人能力技術(shù)要求第1部分：通用技術(shù)要求