《人工智能 計(jì)算設(shè)備調(diào)度與協(xié)同 第2部分:分布式計(jì)算框架編制說(shuō)明》_第1頁(yè)
《人工智能 計(jì)算設(shè)備調(diào)度與協(xié)同 第2部分:分布式計(jì)算框架編制說(shuō)明》_第2頁(yè)
《人工智能 計(jì)算設(shè)備調(diào)度與協(xié)同 第2部分:分布式計(jì)算框架編制說(shuō)明》_第3頁(yè)
《人工智能 計(jì)算設(shè)備調(diào)度與協(xié)同 第2部分:分布式計(jì)算框架編制說(shuō)明》_第4頁(yè)
《人工智能 計(jì)算設(shè)備調(diào)度與協(xié)同 第2部分:分布式計(jì)算框架編制說(shuō)明》_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

國(guó)家標(biāo)準(zhǔn)《人工智能計(jì)算設(shè)備調(diào)度與協(xié)同

第2部分:分布式計(jì)算框架》

(征求意見(jiàn)稿)編制說(shuō)明

一、工作簡(jiǎn)況

1.任務(wù)來(lái)源與起草單位

根據(jù)國(guó)家標(biāo)準(zhǔn)委關(guān)于下達(dá)2022年第四批推薦性國(guó)家標(biāo)準(zhǔn)計(jì)劃的通知,

國(guó)家標(biāo)準(zhǔn)《人工智能計(jì)算設(shè)備調(diào)度與協(xié)同第2部分:分布式計(jì)算框架》

制定計(jì)劃下達(dá),項(xiàng)目計(jì)劃號(hào)為20221792-T-469,由全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技

術(shù)委員會(huì)提出并歸口。

本標(biāo)準(zhǔn)由中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院提出,主要參編單位包括華為技

術(shù)有限公司、中國(guó)科學(xué)院軟件研究所、中國(guó)科學(xué)院計(jì)算技術(shù)研究所、北京

航空航天大學(xué)、阿里云計(jì)算有限公司、百度云計(jì)算技術(shù)(北京)有限公司、

騰訊云計(jì)算(北京)有限責(zé)任公司、浪潮電子信息產(chǎn)業(yè)股份有限公司、上

海商湯智能科技有限公司、上海燧原科技有限公司、上海壁仞科技股份有

限公司、上海天數(shù)智芯半導(dǎo)體有限公司、中國(guó)移動(dòng)通信集團(tuán)有限公司研究

院等單位。具體參與單位將根據(jù)實(shí)際參與情況進(jìn)行調(diào)整。

2.編制背景及意義

隨著人工智能計(jì)算形態(tài)的不斷發(fā)展,承載AI應(yīng)用的計(jì)算設(shè)備的部署和

使用呈現(xiàn)分布式、全場(chǎng)景的趨勢(shì)。一個(gè)AI計(jì)算任務(wù),往往需要多種形態(tài)的

計(jì)算設(shè)備協(xié)作完成,對(duì)不同地域、類型的社群提供服務(wù)。不同的計(jì)形態(tài)的

AI設(shè)備,需要統(tǒng)一的計(jì)算及管理框架,明確必要的技術(shù)要求、功能要求以

及安全要求,為產(chǎn)品提供參考框架以及評(píng)價(jià)體系,緩解不同形態(tài)AI計(jì)算設(shè)

備橫向協(xié)同割裂的現(xiàn)狀。

本標(biāo)準(zhǔn)擬解決以下問(wèn)題:

1)因任務(wù)的數(shù)據(jù)分布廣泛(端、云、邊緣側(cè)),導(dǎo)致人工智能計(jì)算任

1

務(wù)存在割裂,協(xié)同困難的狀況。傳統(tǒng)的CS架構(gòu)難以滿足要求;

2)用戶常用計(jì)算協(xié)同模式(云云協(xié)同、云邊端協(xié)同、多端協(xié)同等)無(wú)

標(biāo)準(zhǔn)化支撐,各平臺(tái)、機(jī)構(gòu)實(shí)現(xiàn)系統(tǒng)的架構(gòu)、功能、接口不同,導(dǎo)致無(wú)法

實(shí)施橫向互聯(lián)互通(相對(duì)于芯片與深度學(xué)習(xí)框架的縱向互聯(lián)互通)。

3.工作過(guò)程

2022年6月-9月,《人工智能計(jì)算設(shè)備調(diào)度與協(xié)同第2部分:分布

式計(jì)算框架》標(biāo)準(zhǔn)編制組成立,對(duì)該標(biāo)準(zhǔn)的立項(xiàng)達(dá)成共識(shí),共同收集相關(guān)

資料,多次組織專家進(jìn)行討論,形成標(biāo)準(zhǔn)草案大綱。

2022年12月13日,該標(biāo)準(zhǔn)研制計(jì)劃正式下達(dá)(國(guó)標(biāo)委發(fā)【2022】39

號(hào)),計(jì)劃號(hào)20221792-T-469。

2023年1月,《人工智能計(jì)算設(shè)備調(diào)度與協(xié)同第2部分:分布式計(jì)

算框架》標(biāo)準(zhǔn)編制工作組成立。召開首次標(biāo)準(zhǔn)研討會(huì),進(jìn)一步明確標(biāo)準(zhǔn)范

圍、目的、標(biāo)準(zhǔn)化對(duì)象、章節(jié)目錄,及各章節(jié)的初步內(nèi)容范圍。

2023年1月-2023年3月,中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院組織標(biāo)準(zhǔn)起草工

作組多次召開標(biāo)準(zhǔn)研討會(huì),針對(duì)產(chǎn)學(xué)研單位對(duì)標(biāo)準(zhǔn)文本提出的意見(jiàn)建議,

持續(xù)對(duì)標(biāo)準(zhǔn)草案進(jìn)行討論、迭代。

2023年3月22日-2023年3月24日,召開信標(biāo)委人工智能分委會(huì)全會(huì),

分委會(huì)成員單位就《人工智能計(jì)算設(shè)備調(diào)度與協(xié)同第2部分:分布式計(jì)

算框架》的范圍和關(guān)鍵問(wèn)題,進(jìn)行廣泛討論,標(biāo)準(zhǔn)起草工作組聽(tīng)取意見(jiàn),

并做修改。

2023年4月-2024年5月,共計(jì)召開10余次標(biāo)準(zhǔn)研討會(huì),2次專家論

證會(huì),形成征求意見(jiàn)稿。

二、標(biāo)準(zhǔn)編制原則和確定主要內(nèi)容的論據(jù)及解決的主要問(wèn)題

1.標(biāo)準(zhǔn)的主要內(nèi)容

本文件確立了人工智能計(jì)算設(shè)備分布式計(jì)算的架構(gòu),規(guī)定了功能和性

2

能技術(shù)要求,定義了分布式計(jì)算協(xié)同接口。

適用于用于分布式人工智能計(jì)算系統(tǒng)設(shè)計(jì)、開發(fā)和測(cè)試。

標(biāo)準(zhǔn)主要技術(shù)內(nèi)容包括:

1)計(jì)算設(shè)備技術(shù)要求,提出云側(cè)設(shè)備、邊緣設(shè)備、終端設(shè)備為實(shí)現(xiàn)協(xié)

同計(jì)算而必須的基礎(chǔ)能力;

2)關(guān)鍵組件技術(shù)要求,面向計(jì)算協(xié)同,對(duì)機(jī)器學(xué)習(xí)框架、虛擬化與調(diào)

度組件、集合通信庫(kù)和安全組件提出能力要求;

3)協(xié)同系統(tǒng)要求,包含云云協(xié)同、云邊端協(xié)同、多端協(xié)同;

4)分布式計(jì)算協(xié)同接口,面向主流場(chǎng)景(云邊端協(xié)同計(jì)算)提出必要

的基礎(chǔ)接口,為計(jì)算設(shè)備協(xié)同(橫向互聯(lián)互通)奠定基礎(chǔ)。

2.標(biāo)準(zhǔn)編制依據(jù)

《人工智能計(jì)算設(shè)備調(diào)度與協(xié)同第2部分分布式計(jì)算框架》在《國(guó)

家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》(2023修訂版征求意見(jiàn)稿)中,屬

于BD類(計(jì)算設(shè)備)。

本標(biāo)準(zhǔn)與參考的相關(guān)國(guó)內(nèi)外標(biāo)準(zhǔn)的比較如下:

1)國(guó)際上,沒(méi)有專門針對(duì)人工智能(典型任務(wù),如訓(xùn)練、推理)的分

布式計(jì)算標(biāo)準(zhǔn);

2)IEEEP3652.1聯(lián)邦學(xué)習(xí)體系架構(gòu)和應(yīng)用指引:定義聯(lián)邦學(xué)習(xí)概念,

給出了聯(lián)邦學(xué)習(xí)的架構(gòu)以及應(yīng)用規(guī)范,標(biāo)準(zhǔn)的對(duì)象是算法和應(yīng)用?!斗植?/p>

式計(jì)算框架》旨在提供分布式人工智能計(jì)算設(shè)備的計(jì)算框架,聯(lián)邦學(xué)習(xí)是

其支撐的一項(xiàng)任務(wù),該可作為《分布式計(jì)算框架》的依據(jù)與參考。

3)ISO/IECTR23188:2020信息技術(shù)云計(jì)算邊緣計(jì)算概覽:定義通

用邊緣計(jì)算的概念、架構(gòu)、應(yīng)用及其安全、實(shí)時(shí)性等要求?!斗植际接?jì)算

框架》中包含邊緣側(cè)的AI計(jì)算設(shè)備,針對(duì)AI任務(wù)提出參考框架以及明確AI

3

任務(wù)中的技術(shù)需求,通用方法上與23188一致,但著力標(biāo)準(zhǔn)化中心、邊緣側(cè)

AI計(jì)算設(shè)備在為執(zhí)行分布式AI任務(wù)的計(jì)算模式。

4)ISO/IECTR17903:2024信息技術(shù)人工智能機(jī)器學(xué)習(xí)計(jì)算設(shè)備概

述:定義了人工智能計(jì)算設(shè)備、機(jī)器學(xué)習(xí)計(jì)算設(shè)備的概念、范圍,并針對(duì)

提升機(jī)器學(xué)習(xí)計(jì)算效率,提出標(biāo)準(zhǔn)化的優(yōu)化方法。

3.標(biāo)準(zhǔn)編制原則

(1)以各事實(shí)上發(fā)生的計(jì)算協(xié)同場(chǎng)景作為基礎(chǔ)研究共同需求,并對(duì)使

用人工智能計(jì)算設(shè)備執(zhí)行機(jī)器學(xué)習(xí)計(jì)算任務(wù)(模型訓(xùn)練、模型推理)的必

要協(xié)同過(guò)程和接口實(shí)施分析,明確標(biāo)準(zhǔn)內(nèi)容范圍,確認(rèn)標(biāo)準(zhǔn)化對(duì)象;

(2)以常見(jiàn)的、用戶反應(yīng)標(biāo)準(zhǔn)化問(wèn)題最多的云邊端、多端及云云協(xié)同

切入,面向當(dāng)前和未來(lái)技術(shù)趨勢(shì)(如大規(guī)模深度學(xué)習(xí)模型的分布式訓(xùn)練、

推理),研擬標(biāo)準(zhǔn)的內(nèi)容。

在研制過(guò)程中,本標(biāo)準(zhǔn)優(yōu)先考慮與其他公共或類似的人工智能計(jì)算設(shè)

備在分布式協(xié)同方面的兼容性,最大程度地降低人工智能計(jì)算設(shè)備協(xié)同、

管理的成本和復(fù)雜度,以完成基礎(chǔ)訓(xùn)練、推理功能為優(yōu)先。

三、主要試驗(yàn)[或驗(yàn)證]情況分析

本標(biāo)準(zhǔn)的研制參考了國(guó)內(nèi)外主流的人工智能計(jì)算設(shè)備協(xié)同(多端、云

邊端、云云)系統(tǒng)的設(shè)計(jì)和功能。標(biāo)準(zhǔn)的參與企業(yè)包含基本全部國(guó)內(nèi)外人

工智能計(jì)算設(shè)備、云計(jì)算設(shè)施、邊緣和終端計(jì)算設(shè)備研制企業(yè)。

四、知識(shí)產(chǎn)權(quán)情況說(shuō)明

該標(biāo)準(zhǔn)未涉及到知識(shí)產(chǎn)權(quán)。

五、產(chǎn)業(yè)化情況、推廣應(yīng)用論證和預(yù)期達(dá)到的經(jīng)濟(jì)效果

本標(biāo)準(zhǔn)預(yù)計(jì)達(dá)成以下產(chǎn)業(yè)預(yù)期:

(1)技術(shù)生態(tài):為各類計(jì)算設(shè)備,在不同部署環(huán)境的計(jì)算設(shè)備提供協(xié)

同方案和能力指標(biāo)。為建立云、邊、端側(cè)計(jì)算設(shè)備協(xié)同(橫向互聯(lián)互通)

4

技術(shù)生態(tài)奠定基礎(chǔ)。

(2)用戶使用:提供核心接口,作為不同供應(yīng)商的云、邊、端側(cè)計(jì)算

設(shè)備協(xié)同的基礎(chǔ)。

(3)經(jīng)濟(jì)效益:為端、邊設(shè)備(如因損壞或老化)替換時(shí),提供統(tǒng)一

協(xié)同方式和接口,降低計(jì)算系統(tǒng)更新迭代成本。

六、采用國(guó)際標(biāo)準(zhǔn)和國(guó)外先進(jìn)標(biāo)準(zhǔn)情況

國(guó)際、國(guó)外尚未發(fā)布針對(duì)人工智能計(jì)算設(shè)備協(xié)同和分布式計(jì)算的基礎(chǔ)

通用標(biāo)準(zhǔn)。

七、與現(xiàn)行相關(guān)法律、法規(guī)、規(guī)章及相關(guān)標(biāo)準(zhǔn)的協(xié)調(diào)性

《人工智能計(jì)算設(shè)備調(diào)度與協(xié)同第2部分分布式計(jì)算框架》與現(xiàn)行

法律、法規(guī)、強(qiáng)制性國(guó)家標(biāo)準(zhǔn)及相關(guān)標(biāo)準(zhǔn)協(xié)調(diào)一致。

標(biāo)準(zhǔn)與國(guó)內(nèi)相關(guān)標(biāo)準(zhǔn)的比較如下:

GB/T41867—2022《信息技術(shù)人工智能術(shù)語(yǔ)》定義了人工智能領(lǐng)域

的術(shù)語(yǔ),本標(biāo)準(zhǔn)使用GB/T41867—2022定義的術(shù)語(yǔ);

GB/T42018—2022《信息技術(shù)人工智能平臺(tái)計(jì)算資源技術(shù)要求》,

側(cè)重定義AI應(yīng)用所需的物理計(jì)算資源的類型和基礎(chǔ)屬性,不涉及分布式計(jì)

算中的具體功能要求、技術(shù)要求以及人工智能生命周期形式的解決方案。

本標(biāo)準(zhǔn)使用GB/T42018—2022定義的術(shù)語(yǔ),并引用其對(duì)人工智能訓(xùn)練服務(wù)

器和推理服務(wù)器的某些要求,作為分布式協(xié)同計(jì)算設(shè)備的基礎(chǔ)要求。本標(biāo)

準(zhǔn)在GB/T42018—2022基礎(chǔ)上做了強(qiáng)化補(bǔ)充;

20203869-T-469《人工智能面向機(jī)器學(xué)習(xí)的系統(tǒng)規(guī)范》規(guī)定了面向機(jī)

器學(xué)習(xí)的系統(tǒng)的技術(shù)要求(包括功能、可靠性、兼容性、安全性、可擴(kuò)展

性、維護(hù)性、易用性等)和測(cè)試方法。該標(biāo)準(zhǔn)并不針對(duì)計(jì)算系統(tǒng)協(xié)同指定,

標(biāo)準(zhǔn)內(nèi)容限于單體人工智能系統(tǒng)本身。

5

20221794-T-469《人工智能服務(wù)器系統(tǒng)性能測(cè)試規(guī)范》,規(guī)定了人工

智能服務(wù)器系統(tǒng)(含AI服務(wù)器、AI服務(wù)器集群、AIHPC計(jì)算設(shè)施等)的性

能測(cè)試方法,側(cè)重于人工智能服務(wù)器系統(tǒng)的性能測(cè)試。不專門面向分布式人

工智能任務(wù)提出計(jì)算模型,也無(wú)配套方法。

20221790-T-469《人工智能異構(gòu)人工智能加速器統(tǒng)一接口》定義人工

智能加速器的統(tǒng)一接口及其語(yǔ)義和使用方法,提出各加速器為實(shí)現(xiàn)此接口

所需的接入方法,以及接口符合性試驗(yàn)方法。該標(biāo)準(zhǔn)是人工智能縱向互聯(lián)

互通(計(jì)算設(shè)備與深度學(xué)習(xí)框架之間)的重要技術(shù)指導(dǎo)文件。該標(biāo)準(zhǔn)與本

文件擬解決的產(chǎn)業(yè)問(wèn)題不同。本文件定位于橫向互聯(lián)互通(如云、邊、端)。

20221793-T-469《人工智能計(jì)算設(shè)備調(diào)度與協(xié)同第1部分:虛擬化與

調(diào)度》本文件確立了人工智能計(jì)算設(shè)備虛擬化與調(diào)度系統(tǒng)的架構(gòu),規(guī)定了

技術(shù)要求,描述了對(duì)應(yīng)的測(cè)試方法,是本標(biāo)準(zhǔn)從屬的系列標(biāo)準(zhǔn)的第1部分。

該標(biāo)準(zhǔn)解決計(jì)算設(shè)備虛擬化的問(wèn)題,提出各類AI加速設(shè)備的虛擬化方法和

功能要求,并不針對(duì)分布式計(jì)算場(chǎng)景。本標(biāo)準(zhǔn)與《第1部分:虛擬化與調(diào)度》

實(shí)現(xiàn)互補(bǔ):虛擬化與調(diào)度解決微觀問(wèn)題,分布式計(jì)算定義宏觀協(xié)作框架和

要求。

標(biāo)準(zhǔn)與國(guó)內(nèi)政策法規(guī)的匹配情況如下表:

文件相關(guān)內(nèi)容分析、討論

國(guó)家信息“智能計(jì)算中心是基于最新人工1)人工智能計(jì)算中心為人工智能應(yīng)

中心:《智智能理論,采用領(lǐng)先的人工智能用提供基礎(chǔ)算力,并在此基礎(chǔ)上要

能計(jì)算中計(jì)算架構(gòu),提供人工智能應(yīng)用所求對(duì)計(jì)算資源的虛擬化與調(diào)度能

心規(guī)劃建需算力服務(wù)、數(shù)據(jù)服務(wù)和算法服力;

設(shè)指南》務(wù)的公共算力新型基礎(chǔ)設(shè)施,通2)統(tǒng)一的接口、調(diào)度生態(tài)為可為人

過(guò)算力的生產(chǎn)、聚合、調(diào)度和釋工計(jì)算中心統(tǒng)一的異構(gòu)計(jì)算生態(tài);

放,高效支撐數(shù)據(jù)開放共享、智3)人工智能計(jì)算中心對(duì)計(jì)算資源聚

能生態(tài)建設(shè)、產(chǎn)業(yè)創(chuàng)新聚集,有合、調(diào)度能力的測(cè)試標(biāo)準(zhǔn),符合文

力促進(jìn)AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化及政件精神。

府治理智能化?!?/p>

6

科技部:“(三)基礎(chǔ)設(shè)施健全。數(shù)據(jù)資源1)人工智能計(jì)算設(shè)備是人工智能應(yīng)

《國(guó)家新豐富,擁有相關(guān)的數(shù)據(jù)平臺(tái)、大用與算法發(fā)展的基礎(chǔ)設(shè)施;

一代人工數(shù)據(jù)中心和云計(jì)算中心,移動(dòng)通2)對(duì)于計(jì)算設(shè)備的調(diào)度、協(xié)同是基

智能創(chuàng)新信、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)等網(wǎng)絡(luò)礎(chǔ)設(shè)施用于實(shí)踐的重要保障,提高

發(fā)展試驗(yàn)基礎(chǔ)設(shè)施較為完善。優(yōu)先支持已經(jīng)濟(jì)效益。

區(qū)建設(shè)工布局國(guó)家新一代人工智能開放創(chuàng)

作指引(修新平臺(tái)的城市?!?/p>

訂版)》

國(guó)科

發(fā)規(guī)

〔2020〕

254號(hào)

國(guó)務(wù)院:“加快構(gòu)建全國(guó)一體化大數(shù)據(jù)中1)在未來(lái),計(jì)算中心、數(shù)據(jù)中心

《“十四心體系,強(qiáng)27化算力統(tǒng)籌智能的服務(wù)對(duì)象不可避免的與AI相關(guān),

五”規(guī)劃》調(diào)度,建設(shè)若干國(guó)家樞紐節(jié)點(diǎn)和對(duì)AI任務(wù)的計(jì)算、協(xié)同將會(huì)是主要

大數(shù)據(jù)中心集群,建設(shè)E級(jí)和任務(wù)之一;

10E級(jí)超級(jí)計(jì)算中心。”2)當(dāng)前的AI計(jì)算芯片,形態(tài)割裂,

多樣化程度高,計(jì)算中心的算力與

端側(cè)、邊緣側(cè)算力協(xié)同完成計(jì)算任

務(wù)也將是趨勢(shì);

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論