2025人工智能計算中心發(fā)展白皮書2.0_第1頁
2025人工智能計算中心發(fā)展白皮書2.0_第2頁
2025人工智能計算中心發(fā)展白皮書2.0_第3頁
2025人工智能計算中心發(fā)展白皮書2.0_第4頁
2025人工智能計算中心發(fā)展白皮書2.0_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

發(fā)展白皮書丘,

從人工智能計算中心走向人工智能算力網(wǎng)絡(luò)人工智能是數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的引擎,也是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量。習(xí)近平總書記明確指出,要在事關(guān)發(fā)展全局和國家安全的基礎(chǔ)核心領(lǐng)域,

瞄準(zhǔn)人工智能、量子信息等前沿領(lǐng)域,前瞻部署一批戰(zhàn)略性、儲備性技術(shù)研發(fā)項目,

瞄準(zhǔn)未來科技和產(chǎn)業(yè)發(fā)展的制高點?!吨腥A人民共和國國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》也做出了相關(guān)部署。人工智能計算中心作為人工智能算力基礎(chǔ)設(shè)施,受到全球廣泛重視。中國、美國、歐洲、日本等國家和地區(qū)都在積極推動人工智能計算中心的建設(shè)。《人工智能計算中心發(fā)展白皮書》自

2020年10月發(fā)布以來,其“一中心四平臺”的理念廣為接受和傳

播,為各地加快推動人工智能計算中心建設(shè)提供了建議和參考。一年來,多地政府統(tǒng)

籌規(guī)劃人工智能計算中心建設(shè),著力構(gòu)建市場化運營機制,積極撬動產(chǎn)學(xué)研用形成合力,

充分帶動當(dāng)?shù)禺a(chǎn)業(yè)集群轉(zhuǎn)型升級。當(dāng)前,人工智能計算中心的發(fā)展面臨新的形勢。一方面,人工智能的發(fā)展對算力的需求持續(xù)攀升,以鵬程

.盤古為代表的超大規(guī)模預(yù)訓(xùn)練模型,開始賦能各行各業(yè);另

一方面,在國家“雙碳”戰(zhàn)略下,需要計算中心加強統(tǒng)籌建設(shè)和提升利用率,進(jìn)一步

減排降耗。人工智能計算中心的網(wǎng)絡(luò)化、集約化發(fā)展,將實現(xiàn)算力、大模型、數(shù)據(jù)集、行業(yè)應(yīng)用等人工智能要素流動共享,成為應(yīng)對新需求的重要途徑。人工智能計算中心不再作為獨立的系統(tǒng),逐步走向相互聯(lián)接的算力網(wǎng)絡(luò),將深化人工智能計算中心的高質(zhì)量建設(shè),是人工智能計算中心下一步發(fā)展的新形態(tài)和新范式。

新型網(wǎng)絡(luò)技術(shù)將各地分布的人工智能計算中心節(jié)點聯(lián)接起來,構(gòu)成感知、分配、調(diào)度

人工智能算力的網(wǎng)絡(luò),可以更好地匯聚和共享算力、數(shù)據(jù)、算法資源,更好地滿足我國經(jīng)濟(jì)社會高質(zhì)量發(fā)展的新形勢和新需求?!度斯ぶ悄苡嬎阒行陌l(fā)展白皮書2.0》試圖為讀者詮釋人工智能算力網(wǎng)絡(luò)的全貌,并建議在國家和地區(qū)層面加強統(tǒng)籌,進(jìn)行系統(tǒng)的組織機制創(chuàng)新,加大關(guān)鍵技術(shù)攻關(guān)和政策支持力度,更好地推進(jìn)產(chǎn)學(xué)研用協(xié)同和開放共享。摘

要ABSTRACT人工智能計算中心發(fā)展白皮書2.0

1

摘要第一章

全球人工智能計算中心的發(fā)展現(xiàn)狀

........................................................31

.

1

全球人工智能基礎(chǔ)設(shè)施戰(zhàn)略與政策......................................................................................41.2全球人工智能計算中心的建設(shè)現(xiàn)狀......................................................................................6第二章

我國人工智能計算中心的建設(shè)特點

........................................................92.1

政府主導(dǎo),堅持自主技術(shù)路線統(tǒng)籌規(guī)劃建設(shè).........................................................................102.2

企業(yè)主體,構(gòu)建市場化管理運營機制

...................................................................................122.3

應(yīng)用導(dǎo)向,打造集聚創(chuàng)新資源、賦能產(chǎn)業(yè)發(fā)展的公共平臺........................................................14第三章

人工智能計算中心面臨的新形勢和新需求..............................................163.1

人工智能計算中心需要適應(yīng)人工智能“大模型

+

大數(shù)據(jù)

+

大算力”發(fā)展的新形勢

........................173.2

人工智能計算中心需要滿足人工智能賦能區(qū)域經(jīng)濟(jì)社會發(fā)展的新需求

.....................................193.3

人工智能計算中心需要符合國家“雙碳”目標(biāo)的新要求

...........................................................20第四章

人工智能算力網(wǎng)絡(luò)的建設(shè)

................................................................

224.1

人工智能算力網(wǎng)絡(luò)的概念.................................................................................................234.2

人工智能算力網(wǎng)絡(luò)的架構(gòu).................................................................................................244.3

人工智能算力網(wǎng)絡(luò)的作用.................................................................................................274.4從人工智能算力網(wǎng)絡(luò)走向多樣性算力網(wǎng)絡(luò)

...........................................................................30第五章

加快推進(jìn)人工智能計算中心高質(zhì)量網(wǎng)絡(luò)化發(fā)展的建議

................................335.1統(tǒng)籌推進(jìn)計算中心高質(zhì)量建設(shè)

...........................................................................................345.2有序推進(jìn)人工智能算力網(wǎng)絡(luò)建設(shè).......................................................................................355.3探索建立人工智能算力網(wǎng)絡(luò)的運營機制.............................................................................365.4加強人工智能算力網(wǎng)絡(luò)的核心技術(shù)攻關(guān)..............................................................................375.5推動人工智能算力網(wǎng)絡(luò)的標(biāo)準(zhǔn)化建設(shè)

.................................................................................38

目錄目錄CONTENTS人工智能計算中心發(fā)展白皮書2.02第一章全球人工智能計算中心的發(fā)展現(xiàn)狀在全球數(shù)字經(jīng)濟(jì)高速發(fā)展的趨勢下,推進(jìn)新型基礎(chǔ)設(shè)施建設(shè),是培育數(shù)字經(jīng)濟(jì)技術(shù)優(yōu)勢、拉動數(shù)字經(jīng)濟(jì)新增長點的關(guān)鍵舉措。作為新型基礎(chǔ)設(shè)施的重要組成部分,以人工智能新型計算能力為代表的人工智能計算中心已成為數(shù)字經(jīng)濟(jì)發(fā)展的智能基座,將加速推動智能技術(shù)與傳統(tǒng)產(chǎn)業(yè)深度融合,打造具有競爭力的數(shù)字產(chǎn)業(yè)集群,對產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)型意義重大。人工智能計算中心是涵蓋基建基礎(chǔ)設(shè)施、硬件基礎(chǔ)設(shè)施、軟件基礎(chǔ)設(shè)施的復(fù)雜系統(tǒng)工程,提供從底層芯片算力釋放到頂層應(yīng)用使能的人工智能全棧能力,可用于各行業(yè)人工智能深度學(xué)習(xí)模型開發(fā)、訓(xùn)練和推理等應(yīng)用場景。具備復(fù)雜模型訓(xùn)練和海量數(shù)據(jù)處理能力的人工智能計算中心,屬于投資較大的重大信息基礎(chǔ)設(shè)施,具備算力服務(wù)、技術(shù)創(chuàng)新、產(chǎn)業(yè)帶動、人才和生態(tài)匯聚等重大戰(zhàn)略價值。

人工智能計算中心發(fā)展白皮書2.03數(shù)量翻3倍,從當(dāng)前的15個增長到45個。美國依托能源部、國防部、自然科學(xué)基金會等機構(gòu),投資專注于更先進(jìn)和更高效的計算系統(tǒng),2025年前完成超過30個人工智能計算平臺和技術(shù)中心建設(shè)。歐盟在數(shù)字化轉(zhuǎn)型、人工智能等領(lǐng)域進(jìn)行了頂層戰(zhàn)略布局。歐盟成立相關(guān)基金和專門機構(gòu)統(tǒng)籌推進(jìn)戰(zhàn)略實施,開展重大科技研發(fā)項目以引領(lǐng)數(shù)字技術(shù)創(chuàng)新,從自發(fā)分散的科研探索模式,逐步發(fā)展成戰(zhàn)略推動和牽引、以產(chǎn)業(yè)化及應(yīng)用為主題的創(chuàng)新模式。在研究和創(chuàng)新方面,歐盟加速推進(jìn)“地平線歐洲”(Horizon

Europe,

第九框架計劃)的科研與發(fā)展計劃,整體研究經(jīng)費達(dá)到近千億歐元,其中投資24億歐元進(jìn)行人工智能和高性能計算基礎(chǔ)設(shè)施項目建設(shè)。此外歐洲各國不斷加大在人工智能領(lǐng)域的布局和投入。如近兩年,德國政府對其已發(fā)布的《人工智能戰(zhàn)略》進(jìn)行修訂,計劃到2025年,通過經(jīng)濟(jì)刺激和未來一攬子計劃,對人工智能的投資增加到50億歐元,包括資助高校建設(shè)人工智能計算中心和能力中心,以使德國成為歐洲未來人工智能技術(shù)的主要創(chuàng)新驅(qū)動力,確保歐盟能夠在激烈的國際競爭中保持自己的地位,并引領(lǐng)全球標(biāo)準(zhǔn)。全球主要國家和地區(qū)將人工智能的發(fā)展和布局作為重大戰(zhàn)略,尤其經(jīng)濟(jì)和科技強國高度重視人工智能基礎(chǔ)設(shè)施建設(shè),出臺相關(guān)規(guī)劃和政策,圍繞強化核心技術(shù)發(fā)展、標(biāo)準(zhǔn)規(guī)范建設(shè)和頂尖人才發(fā)展等部署建設(shè)人工智能基礎(chǔ)設(shè)施,力圖在新一輪國際科技競爭中掌握主導(dǎo)權(quán)。近年來,美國多措并舉持續(xù)強化人工智能國家戰(zhàn)略。美國白宮先后發(fā)布《美國人工智能倡議》和《美國人工智能研發(fā)戰(zhàn)略計劃》,新建政府組織機構(gòu),增加人工智能研發(fā)投資,推動基礎(chǔ)設(shè)施建設(shè),將“保護(hù)美國在人工智能及其相關(guān)關(guān)鍵技術(shù)的優(yōu)勢,嚴(yán)防戰(zhàn)略競爭對手以及敵對國家的竊取”列入國家人工智能戰(zhàn)略。2021年5月以來,又提出《2021年美國創(chuàng)新與競爭法案》,作為美國重塑國際秩序、重振美國領(lǐng)導(dǎo)力的提案,其中關(guān)于科技競爭的《無盡前沿法案》,將人工智能作為美國十個最關(guān)鍵的新興科技領(lǐng)域之一。美國政府正在加強人工智能基礎(chǔ)設(shè)施、數(shù)據(jù)、人才等維度的建設(shè)和發(fā)展,實現(xiàn)國家整體的“AIReady”。未來五年,美國計劃投資約690億美元用于人工智能、量子計算等基礎(chǔ)科研和關(guān)鍵技術(shù)研發(fā),370億美元投資技術(shù)中心和數(shù)字基礎(chǔ)設(shè)施建設(shè)。到2025年實現(xiàn)人工智能科研機構(gòu) 1.1全球人工智能基礎(chǔ)設(shè)施戰(zhàn)略與政策

第一章全球人工智能計算中心的發(fā)展現(xiàn)狀人工智能計算中心發(fā)展白皮書2.04日本以“超智能社會(Society5.0)

”為目標(biāo)愿景,持續(xù)強化人工智能頂層設(shè)計和戰(zhàn)略部署。日本政府設(shè)立人工智能技術(shù)戰(zhàn)略委員會作為國家層面的綜合管理機構(gòu),協(xié)同總務(wù)省、文部科學(xué)省和經(jīng)濟(jì)產(chǎn)業(yè)省等政府部門,共同制訂人工智能發(fā)展戰(zhàn)略及人工智能產(chǎn)業(yè)化路線,推進(jìn)人工智能的技術(shù)研發(fā)及應(yīng)用。日本近年來出臺的人工智能相關(guān)戰(zhàn)略,圍繞人才建設(shè)、研究開發(fā)、成果轉(zhuǎn)化應(yīng)用、數(shù)據(jù)基礎(chǔ)建設(shè)、數(shù)字治理以及倫理規(guī)范等方面做出周密部署,其中特別強調(diào)了智能基礎(chǔ)設(shè)施建設(shè)對解決重大社會問題的作用,以及人工智能與其他相關(guān)技術(shù)的融合發(fā)展,以最終實現(xiàn)人類與人工智能和諧共生。我國高度重視人工智能發(fā)展。自

2017年開始,國務(wù)院及科技部、發(fā)展改革委、工業(yè)和信息化部、教育部等國家部委,以及各地方政府,都發(fā)布了人工智能相關(guān)政策和規(guī)劃,將人工智能計算中心等新型基礎(chǔ)設(shè)施規(guī)劃和建設(shè)提升到新的高度。2017年國務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》提出“構(gòu)建泛在安全高效的智能化基礎(chǔ)設(shè)施體系”,對包括網(wǎng)絡(luò)、大數(shù)據(jù)、高效能計算等基礎(chǔ)設(shè)施在內(nèi)的智能化基礎(chǔ)設(shè)施進(jìn)行了全面部署和發(fā)展方向指引。2020年科技部印發(fā)的《國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)建設(shè)工作指引(修訂版)》中,將“推進(jìn)人工智能基礎(chǔ)設(shè)施建設(shè),強化人工智能創(chuàng)新發(fā)展的條件支撐”作為我國人工智能創(chuàng)新發(fā)展的四大任務(wù)之一,指引全國十余個國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)的建設(shè)。《中華人民共和國國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》中指出,要加快建設(shè)新型基礎(chǔ)設(shè)施,“圍繞強化數(shù)字轉(zhuǎn)型、智能升級、融合創(chuàng)新支撐,布局建設(shè)信息基礎(chǔ)設(shè)施、融合基礎(chǔ)設(shè)施、創(chuàng)新基礎(chǔ)設(shè)施等新型基礎(chǔ)設(shè)施”。隨著我國多個政策規(guī)劃陸續(xù)出臺,我國人工智能技術(shù)與產(chǎn)業(yè)已進(jìn)入活躍期,發(fā)展前景極為廣闊。

人工智能計算中心發(fā)展白皮書2.05歐洲以戰(zhàn)略引領(lǐng)數(shù)字技術(shù)創(chuàng)新,

在使用NVIDIA、Intel等當(dāng)前成熟的美國技術(shù)和生態(tài)的同時,積極布局歐洲處理器計劃(EPI)強化本土芯片研制,多路線并進(jìn)推動人工智能計算中心

設(shè)。2020年10月,

利CINECA研究中心上線了Leonardo超大規(guī)模人工智能計算系統(tǒng),該系統(tǒng)基于NVIDIA

GPU加速技術(shù),可提供10

EFLOPS的半精度浮點(FP16)人工智能算力,為人工智能在廣泛應(yīng)用領(lǐng)域中加速科學(xué)探索提供了強大支撐。瑞士國家超級計算中心(CSCS)將于2023年建成新型

AI超級計算機——Alps,同樣采用

NVIDIAGPU

加速技術(shù),算力規(guī)模達(dá)到20

EFLOPS,有望成為全球性能最強的AI超級計算機之一。Alps系統(tǒng)建成后將利用深度學(xué)習(xí)技術(shù),推動從氣候和天氣到材料科學(xué)、生命科學(xué)、分子動力學(xué)、量子化學(xué),以及經(jīng)濟(jì)學(xué)和社會科學(xué)等多個領(lǐng)域的突破性研究。日本超大規(guī)模人工智能算力基礎(chǔ)設(shè)施多采用富士通等日本本土

IT企業(yè)路線建設(shè)。由日本理化學(xué)研究所與富士通共同打造的“富岳”(Fugaku)系統(tǒng),在高性能計算、人工智能、大數(shù)據(jù)分析等方向整體表現(xiàn)出色?!案辉馈辈捎肁rm架構(gòu),人工智能算力峰值性能超過了1

EFLOPS,可以通過建模及仿真加速解決社會問題,同時促進(jìn)人工智能技術(shù)以及與信息分發(fā)和處理相關(guān)技術(shù)的發(fā)展,充分滿足建設(shè)創(chuàng)造新價值的智能社會的需求。在全球主要國家的戰(zhàn)略布局下,人工智能基礎(chǔ)設(shè)施作為推動各國社會和經(jīng)濟(jì)智能化發(fā)展的新動能,正在全球范圍內(nèi)蓬勃發(fā)展。美國、歐洲、日本、中國等國家,都在新一代人工智能基礎(chǔ)設(shè)施發(fā)展上有所布局,通過統(tǒng)一戰(zhàn)略指引,加速基礎(chǔ)研究、新型計算架構(gòu)、芯片技術(shù)、系統(tǒng)軟件、應(yīng)用軟件等創(chuàng)新研發(fā),以保持國家科技及經(jīng)濟(jì)發(fā)展的全球競爭力。美國在人工智能基礎(chǔ)研究和關(guān)鍵核心技術(shù)方面全球領(lǐng)先,依托NVIDIA、Intel、AMD

等美國本土高端芯片巨頭企業(yè)優(yōu)勢,基于已成熟的X86通用處理器技術(shù)和GPU加速器技術(shù)路線,加快超大規(guī)模人工智能計算中心建設(shè)。早在2018年,美國能源部的橡樹嶺國家實驗室就建成浮點算力峰值3.4

EFLOPS(以FP16精度計,1

EFLOPS即每秒百億億次浮點運算)的Summit智能超級計算機,相繼規(guī)劃的E

級(E,exa,即百億億次)智能超級計算機Frontier也將于2021年上線,對人工智能技術(shù)在超大規(guī)??茖W(xué)計算領(lǐng)域的應(yīng)用具有重要促進(jìn)作用。美國能源部的阿貢國家實驗室也在加快人工智能計算系統(tǒng)的規(guī)劃和建設(shè),將于近兩年陸續(xù)上線兩臺超大規(guī)模的人工智能計算系統(tǒng),分別是1.4EAI算力的Polaris系統(tǒng)和近10E

AI算力的Aurora系統(tǒng),建成后將為人工智能在醫(yī)學(xué)、工程學(xué)和物理學(xué)等眾多領(lǐng)域創(chuàng)造出變革性增長空間。

1.2

全球人工智能計算中心的建設(shè)現(xiàn)狀

第一章全球人工智能計算中心的發(fā)展現(xiàn)狀人工智能計算中心發(fā)展白皮書2.06在我國,經(jīng)過近兩年的快速發(fā)展,人工智能計算中心已納入全國各大城市的重點布局和規(guī)劃中,深圳、武漢、珠海、西安等城市均已建成人工智能計算中心并投入運營,成都、南京、許昌(中原)等城市正在建設(shè)中,北京、上海、杭州、廣州、大連、青島、太原、南寧等地的人工智能計算中心建設(shè)也在陸續(xù)規(guī)劃中。我國政府統(tǒng)籌建設(shè)的人工智能計算中心,多采用國產(chǎn)通用處理器和AI加速器技術(shù),以華為昇騰、寒武紀(jì)思元等國內(nèi)AI芯片為主。鵬城云腦Ⅱ是由深圳市牽頭,利用鵬城實驗室的科研優(yōu)勢與華為的企業(yè)優(yōu)勢,共同打造的具有廣泛影響力的人工智能開源開放重大科學(xué)裝置,支撐國家重大科學(xué)研究、賦能產(chǎn)業(yè)應(yīng)用、實現(xiàn)自主AI可持續(xù)創(chuàng)新。在建設(shè)方面,深圳市給予全方位的大力支持,各部門通力合作,僅9個月完成從啟動論證到最后裝機上線?;跁N騰AI基礎(chǔ)軟硬件平臺構(gòu)筑的鵬城云腦Ⅱ,16位浮點數(shù)(FP16)下的性能高達(dá)1EFLOPS。鵬城實驗室是國家戰(zhàn)略科技力量的重要組成部分,鵬城云腦Ⅱ作為自主先進(jìn)的科研平臺對核心技術(shù)突破起到重要支撐作用,除了對傳統(tǒng)基礎(chǔ)科學(xué)領(lǐng)域的科研模式帶來創(chuàng)新變革,還發(fā)布全球首個兩千億級中文NLP(自然語言處理)AI大模型——鵬程.盤古,打造面向生物醫(yī)學(xué)領(lǐng)域的AI大模型——鵬程.神農(nóng)生物信息研究平臺,鵬城云腦Ⅱ已在人工智能領(lǐng)域取得眾多嶄新成果。武漢人工智能計算中心位于武漢光谷,作為科技部批復(fù)的15個國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)之一,武漢率先建設(shè)人工智能計算中心,2020年12月28

日開工建設(shè),于2021年5月31

日建成并投入運營,核心建設(shè)周期僅5個月,上線即飽和運營。其一期建設(shè)規(guī)模為100PFLOPS

(以FP16精度計,1PFLOPS即每秒千萬億次)AI算力,并已完成擴(kuò)容100PFLOPS,以滿足當(dāng)?shù)谹I算力需求。武漢人工智能計算中心算力集群提供的普惠算力,對本地產(chǎn)業(yè)集群的算力賦能已開始顯現(xiàn)。目前,中科院自動化所、武漢大學(xué)遙感信息工程學(xué)院等多家高校院所和40+企業(yè)與武漢人工智能計算中心的項目合作已經(jīng)展開,是國內(nèi)首個具有公共服務(wù)性質(zhì)的人工智能算力基礎(chǔ)設(shè)施。

人工智能計算中心發(fā)展白皮書2.07西安未來人工智能計算中心,是西北地區(qū)首個規(guī)劃建成的人工智能算力集群,是西安市硬科技發(fā)展的新高地,旨在為建設(shè)“一帶一路”科技

創(chuàng)新中心、國家中心城市提供強有力的科技支撐。計算中心一期規(guī)劃300

PFLOPS

計算能力,

基于昇騰AI基礎(chǔ)軟硬件平臺建設(shè),于2021年

5月13

日進(jìn)場施工,同年9月9

日建成上線,將應(yīng)用于自動駕駛、智慧醫(yī)療、智慧城市、智慧交通、智慧礦山等多種應(yīng)用場景,進(jìn)一步推動制度創(chuàng)新、政策創(chuàng)新,有助于加快實現(xiàn)人工智能對經(jīng)濟(jì)社會發(fā)展的帶動和支撐作用,加快形成國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)的西安方案。成都智算中心由華為公司與成都高新區(qū)共同建設(shè),項目包含“一中心、三平臺”,“一中心”即“國家一體化大數(shù)據(jù)中心成渝I類節(jié)點”,將

結(jié)合成都在西部的經(jīng)濟(jì)、科技中心地位,承接國家重要需求、科研創(chuàng)新和戰(zhàn)略落地;“三平臺”包括城市智腦平臺、全球領(lǐng)先(E級)人工智能

計算平臺、全球智能數(shù)據(jù)存儲與機器視覺科研創(chuàng)新平臺。2021年6月9

日,成都智算算中心奠

基開工,基于昇騰AI基礎(chǔ)軟硬件平臺建設(shè),一期預(yù)計2022年1月底完成上線運營,開工同時

首批15個生態(tài)伙伴簽約入駐,及15個電子信息產(chǎn)業(yè)生態(tài)圈項目完成簽約。中心建成后將在智能空管、智慧醫(yī)療、智慧金融等場景形成應(yīng)用示范,端到端打通全產(chǎn)業(yè)鏈,支撐成都人工智能戰(zhàn)略落地。珠海市橫琴先進(jìn)智能計算平臺,由中科院、廣東省、珠海市、橫琴新區(qū)共同打造,是中科院戰(zhàn)略性先導(dǎo)專項“國產(chǎn)安全可控先進(jìn)計算機系統(tǒng)”的重要研究成果,硬件部分主要基于寒武紀(jì)AI加速卡構(gòu)建,目前已建成1.16

EOPS(以整型

精度計,百億億次/秒)算力。該平臺圍繞國家戰(zhàn)略目標(biāo)和廣東經(jīng)濟(jì)高質(zhì)量發(fā)展的重大需求,通過創(chuàng)新合作模式和機制,機構(gòu)化、系統(tǒng)化、成建制引進(jìn)中科院的優(yōu)勢創(chuàng)新資源建立高水平科技創(chuàng)新研究院等,將有力提升廣東基礎(chǔ)研究、應(yīng)用基礎(chǔ)研究和技術(shù)開發(fā)實力和水平,是珠海市提升城市科技活力、賦能行業(yè)應(yīng)用場景的重大科技基礎(chǔ)設(shè)施。南京江北新區(qū)與華為公司簽訂戰(zhàn)略合作協(xié)議,于2021年5月28

日發(fā)布建設(shè)南京人工智

能計算中心和江蘇昇騰人工智能生態(tài)創(chuàng)新中心

(

南京

)。圍繞南京市重點產(chǎn)業(yè),孵化創(chuàng)新應(yīng)用場景,在城市治理智能化、集成電路、軌道交通、

智能電網(wǎng)等場景形成有競爭力的應(yīng)用方案,目

前在江蘇與20多家合作伙伴推出超過30個人

工智能解決方案。同期,南京智能計算中心于2021

7

月在南京市麒麟科技創(chuàng)新園建成投運,該中心采用寒武紀(jì)人工智能芯片和算力機組構(gòu)

建,并與多家科研院所、人工智能生態(tài)企業(yè)簽署了云平臺服務(wù)協(xié)議,初步形成生態(tài)聚集效應(yīng)。

第一章全球人工智能計算中心的發(fā)展現(xiàn)狀人工智能計算中心發(fā)展白皮書2.08《人工智能計算中心發(fā)展白皮書》1.0版本提出“一中心四平臺”建設(shè)理念,在人工智能計算中心高質(zhì)量建設(shè)的基礎(chǔ)上,提供普惠算力的公共算力服務(wù)平臺、匹配本地產(chǎn)業(yè)特色的應(yīng)用創(chuàng)新孵化平臺、聚合產(chǎn)業(yè)生態(tài)的產(chǎn)業(yè)聚合發(fā)展平臺、支撐當(dāng)?shù)乜蒲袆?chuàng)新和人才培養(yǎng)的科研創(chuàng)新和人才培養(yǎng)平臺,為各地人工智能計算中心的健康發(fā)展提供了建議和參考。在建設(shè)過程中,各地政府著力推動市場化運營機制和生態(tài)融合賦能,實現(xiàn)“政產(chǎn)學(xué)研用”全鏈條打通,各人工智能計算中心算力使用飽滿且高效有序發(fā)展,呈現(xiàn)出政府統(tǒng)籌規(guī)劃、全棧自主創(chuàng)新、企業(yè)主體運營、產(chǎn)學(xué)研用聯(lián)動等建設(shè)特點。第二章我國人工智能計算中心的建設(shè)特點

人工智能計算中心發(fā)展白皮書2.09我國國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)和國家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)建設(shè)均把人工智能新型基礎(chǔ)設(shè)施建設(shè)作為重要支撐。各地政府在統(tǒng)籌規(guī)劃和投資推動人工智能計算中心高質(zhì)量建設(shè)的過程中,均立足自主技術(shù)路線創(chuàng)新發(fā)展,以加快人工智能和實體經(jīng)濟(jì)的深度融合。人工智能基礎(chǔ)設(shè)施建設(shè)是人工智能產(chǎn)業(yè)發(fā)展的保障。多地政府都將人工智能基礎(chǔ)設(shè)施建設(shè)作為城市人工智能產(chǎn)業(yè)發(fā)展的重要抓手,為人工智能共性技術(shù)突破、中小企業(yè)良好有序發(fā)展提供基礎(chǔ)保障。武漢市為深入推進(jìn)國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)建設(shè),制訂了《武漢國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)建設(shè)若干政策》,指導(dǎo)以地方投資建設(shè)武漢人工智能計算中心,成為國內(nèi)首個具有公共服務(wù)性質(zhì)的人工智能算力基礎(chǔ)設(shè)施,具備良好的算力基礎(chǔ)和標(biāo)桿示范效應(yīng)。成都市發(fā)布《成都建設(shè)國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)實施方案》中也明確提出,建設(shè)人工智能算力/數(shù)據(jù)中心和開放創(chuàng)新平臺等基礎(chǔ)設(shè)施,強化人工智能發(fā)展基礎(chǔ)設(shè)施支撐。人工智能計算中心作為新型城市基礎(chǔ)設(shè)施,是人工智能產(chǎn)業(yè)的基礎(chǔ)底座,其中的人工智能芯片、AI框架更是人工智能產(chǎn)業(yè)的核心根技術(shù)。習(xí)近平總書記深刻指出,“自力更生是中華民族自立于世界民族之林的奮斗基點,自主創(chuàng)新是我們攀登世界科技高峰的必由之路”。自美國出臺實體清單以來,中國高精尖科技均在不同程度受到影響。各地政府深刻領(lǐng)會科技自立自強重大意義,均十分重視建設(shè)全棧自主創(chuàng)新、國際技術(shù)先進(jìn)的人工智能計算中心,以積極應(yīng)對底層基礎(chǔ)設(shè)施受卡控風(fēng)險,支撐人工智能產(chǎn)業(yè)健康發(fā)展。 2.1

政府主導(dǎo),堅持自主技術(shù)路線統(tǒng)籌規(guī)劃建設(shè)人工智能計算中心發(fā)展白皮書2.0

10第二章我國人工智能計算中心的建設(shè)特點位于深圳的鵬城云腦Ⅱ,作為支撐鵬城實驗室的大科學(xué)裝置,為人工智能產(chǎn)業(yè)發(fā)展提供了堅實、先進(jìn)的基礎(chǔ)底座。鵬城云腦Ⅱ主設(shè)備Atlas900AI集群,由4096顆昇騰910AI處理器構(gòu)成,算力達(dá)E級,榮獲AIPerf(大規(guī)模人工智能基準(zhǔn)評測程序)榜單第一名,并保持IO500(高性能計算存儲系統(tǒng)性能排行榜-全系統(tǒng)輸入輸出和10節(jié)點系統(tǒng))兩項世界記錄,其中在全系統(tǒng)輸入輸出性能得分是排名第二得分的近20倍。依托鵬城云腦Ⅱ系統(tǒng)充沛、普惠的算力資源,聚合了一部分高校院所的科研力量進(jìn)行基礎(chǔ)理論研究、前沿技術(shù)探索等,已形成一批科研創(chuàng)新成果。其中,鵬程

.盤古——2000億參數(shù)中文自然語言處理(NLP)的預(yù)訓(xùn)練大模型,基于國產(chǎn)AI框架昇思MindSpore、使用40TB的中文文本數(shù)據(jù)訓(xùn)練而成,其訓(xùn)練速度遠(yuǎn)超GPT-3。鵬程.神農(nóng)平臺,包含了蛋白質(zhì)結(jié)構(gòu)預(yù)測、小分子生成、靶點與小分子相互作用預(yù)測以及新抗菌多肽設(shè)計與效果評價等模塊,是人工智能面向醫(yī)藥領(lǐng)域的一個重要創(chuàng)新成果。

人工智能計算中心發(fā)展白皮書2.0圖

1鵬城云腦Ⅱ11圍繞人工智能計算中心的持續(xù)運營活動。在本地政府指導(dǎo)和協(xié)助下,該運營公司多渠道調(diào)研訪談全市人工智能企業(yè)、高校、科研機構(gòu)等的算力需求,以及目前在智能化轉(zhuǎn)型中遇到的挑戰(zhàn)和使用公共算力服務(wù)的意愿,兩個月時間內(nèi)訪談超500+家,識別出有效算力100

PFLOPS+?;趯^(qū)域內(nèi)人工智能產(chǎn)業(yè)的洞察和未來產(chǎn)業(yè)的規(guī)劃,武漢市政府制定并發(fā)布《武漢國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)建設(shè)若干政策》,為推進(jìn)武漢國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)建設(shè),搶抓人工智能發(fā)展機遇,提供了明確的政策支持。在政策支持和算力調(diào)研的有效識別下,運營公司聯(lián)合算力需求伙伴進(jìn)行方案創(chuàng)新和應(yīng)用遷移適配,打造了人工智能發(fā)展的“武漢速度”,實現(xiàn)了武漢人工智能計算中心2021年5月31日上線即飽和運營。人工智能計算中心作為智能時代的新型公共基礎(chǔ)設(shè)施,是發(fā)展人工智能產(chǎn)業(yè)的基礎(chǔ)資源保障。為發(fā)揮其公共基礎(chǔ)設(shè)施作用,就要不僅建得好還要用得好,必須要構(gòu)建形成能夠支撐人工智能產(chǎn)業(yè)持續(xù)發(fā)展的管理運營機制。各地人工智能計算中心啟動建設(shè)同期,政府即開始充分考慮如何有效運營,通過指定的運營公司成立人工智能生態(tài)創(chuàng)新中心,開展計算中心的算力和生態(tài)運營,提供公共算力服務(wù)、應(yīng)用創(chuàng)新孵化服務(wù)、產(chǎn)業(yè)聚合發(fā)展服務(wù)、科研創(chuàng)新和人才培養(yǎng)服務(wù),切實做到建設(shè)運營兩手抓,充分釋放算力價值,實現(xiàn)商業(yè)的小循環(huán)和產(chǎn)業(yè)的大循環(huán)。武漢人工智能計算中心在2020年啟動建設(shè)時,其昇騰人工智能生態(tài)創(chuàng)新中心運營公司——武漢光谷愛計算有限公司即組建完成,有序開展

2.2

企業(yè)主體,構(gòu)建市場化管理運營機制

人工智能計算中心發(fā)展白皮書2.0

12第二章我國人工智能計算中心的建設(shè)特點2021年5月,南京人工智能計算中心與昇騰人工智能生態(tài)創(chuàng)新中心同步發(fā)布,算力運營工作也同步啟動。在1個月時間內(nèi)調(diào)研訪談40+企業(yè)、高校和科研機構(gòu),其中17家有意愿使用人工智能計算中心算力,有效算力需求100PFLOPS+,結(jié)合這些需求孵化出

25+創(chuàng)新方案,其中孵化的云化能源無感加油解決方案,加油效率提升

2.4

倍(加油時間由6

分鐘縮短到

2.5分鐘)

,提升油品類收入40%,并在江蘇省各地市中石化加油站落地。為了推動產(chǎn)業(yè)聚集,創(chuàng)新中心舉辦4場產(chǎn)業(yè)活動,吸引

300+伙伴,其中舉辦的昇思MindSpore企業(yè)行暨企業(yè)走進(jìn)昇騰生態(tài)創(chuàng)新中心活動吸引399人報名,公司高管、研發(fā)總監(jiān)、產(chǎn)品經(jīng)理等行業(yè)專家報名數(shù)占比

81%,有效識別伙伴對算法應(yīng)用、行業(yè)政策、數(shù)據(jù)治理、物聯(lián)網(wǎng)AI場景需求。2021年9月,西安未來人工智能計算中心發(fā)布,其運營公司西安昇騰智能科技有限公司也同時成立,昇騰智能科技作為運營主體,籌建陜西昇騰人工智能生態(tài)創(chuàng)新中心,負(fù)責(zé)西安未來人工智能計算中心的持續(xù)運營。運營團(tuán)隊結(jié)合西安區(qū)域產(chǎn)業(yè)特點以及其高校人才優(yōu)勢,邀請焦李成院士團(tuán)隊入駐西安未來人工智能計算中心,開展西安電子科技大學(xué)遙感項目,同時簽約西北工業(yè)大學(xué)語音大模型、陜西師范大學(xué)“MindSpore研究室”等一系列項目。此外,深圳、許昌、大連、廣州等城市均在人工智能計算中心啟動時同步啟動運營工作,以確保實現(xiàn)“建起來,用起來,用得好”的目標(biāo),以算力集群賦能產(chǎn)業(yè)集群。

人工智能計算中心發(fā)展白皮書2.013以人工智能為代表的新興科技快速發(fā)展,改變了人們?nèi)粘9ぷ?、學(xué)習(xí)、生活方式,同時也在加速與實體經(jīng)濟(jì)融合,實現(xiàn)產(chǎn)業(yè)智能化升級。人工智能計算中心可為區(qū)域產(chǎn)業(yè)發(fā)展提供充沛的算力。例如,昇騰人工智能生態(tài)創(chuàng)新中心通過整合集聚創(chuàng)新資源,形成跨領(lǐng)域、大協(xié)作、高強度的創(chuàng)新公共服務(wù)平臺,打通政產(chǎn)學(xué)研用,實現(xiàn)科技成果轉(zhuǎn)化及產(chǎn)業(yè)化、科技資源共享服務(wù),逐步形成大算力使能大模型,大模型賦能新應(yīng)用的發(fā)展格局。武漢大學(xué)遙感專業(yè)在全球處于領(lǐng)先地位,正在探索結(jié)合人工智能技術(shù),解決現(xiàn)階段遙感測圖任務(wù)大多依賴人工解譯的難題。遙感影像處理的深度學(xué)習(xí)技術(shù),亟需大規(guī)模的遙感影像樣本庫,以及具有遙感特性的深度學(xué)習(xí)框架和模型來進(jìn)行支持。要滿足這些需求和挑戰(zhàn)需要有充沛的算力支撐其進(jìn)行模型開發(fā)和驗證,武漢政府承建的人工智能計算中心為其提供了資源保障。企業(yè)與科研院所一起進(jìn)行投入,發(fā)揮各自優(yōu)勢,更好地使能遙感應(yīng)用,賦能遙感科研及行業(yè)生態(tài),催熟遙感產(chǎn)業(yè)。國內(nèi)人工智能技術(shù)領(lǐng)軍企業(yè)華為結(jié)合遙感應(yīng)用需求進(jìn)行了包含CANN算子庫和昇思MindSpore高效并行開發(fā)框架在內(nèi)的深度底層優(yōu)化。在多方共同努力下,于2021世界人工智能大會(WAIC

2021)發(fā)布了全球首個遙感影像專用AI框架——武漢.LuojiaNet,可處理大幅面圖像(30k

x

30k)

和256通道波譜,

同時構(gòu)建了全球最大遙感數(shù)據(jù)集武漢

.LuojiaSet,包含了500萬+從區(qū)域到全球的樣本,填補了遙感領(lǐng)域自主專用深度學(xué)習(xí)框架的空白。

2.3應(yīng)用導(dǎo)向,打造集聚創(chuàng)新資源、賦能產(chǎn)業(yè)發(fā)展的公共平臺

人工智能計算中心發(fā)展白皮書2.0

14第二章我國人工智能計算中心的建設(shè)特點基于武漢人工智能計算中心,大算力使能大模型,大模型賦能新產(chǎn)業(yè),充分發(fā)揮其產(chǎn)業(yè)應(yīng)用價值。以武漢大學(xué)、中科院自動化所、華為公司等方面的合作為代表,共同匯聚了科研、產(chǎn)業(yè)、應(yīng)用、人才等多股力量,基于公共算力為人工智能技術(shù)與多領(lǐng)域融合創(chuàng)新提供了科研和應(yīng)用支撐,同時為智能化應(yīng)用能力提升和產(chǎn)業(yè)化落地創(chuàng)造了環(huán)境。在科研成果聯(lián)創(chuàng)的環(huán)境下,聚合眾多中小企業(yè)的產(chǎn)業(yè)落地需求,構(gòu)建“共建、共創(chuàng)、共享”的產(chǎn)業(yè)生態(tài),形成了以測繪遙感、智能音視頻等為核心的一系列智能化產(chǎn)業(yè)落地。武漢人工智能計算中心是切實推動武漢產(chǎn)學(xué)研深度融合的關(guān)鍵措施,是打造新興產(chǎn)業(yè)、未來產(chǎn)業(yè)研發(fā)創(chuàng)新高地的基礎(chǔ)設(shè)施。武漢作為國家中心城市、長江經(jīng)濟(jì)帶核心城市,戰(zhàn)略性新興產(chǎn)業(yè)快速發(fā)展,產(chǎn)業(yè)活力充分涌現(xiàn),產(chǎn)業(yè)鏈與科研院所的深度融合使得人工智能算力的支撐作用顯著提升。結(jié)合武漢豐富的科技研發(fā)和科教人才資源,人工智能計算中心將推動武漢人工智能產(chǎn)業(yè)集群成型和高質(zhì)量發(fā)展,推動有地方產(chǎn)業(yè)特色的數(shù)字經(jīng)濟(jì)邁向更廣闊的未來。中科院自動化所將“跨模態(tài)預(yù)訓(xùn)練模型”作為其未來五年重點工作之一。跨模態(tài)預(yù)訓(xùn)練模型需要在60P以上算力的持續(xù)保障下迭代訓(xùn)練和開發(fā)。2021年3月中科院自動化所與武漢人工智能計算中心進(jìn)行合作探討,達(dá)成在武漢建立自動化所武漢分院的共識,聯(lián)合產(chǎn)業(yè)界共同打造業(yè)界跨模態(tài)模型,結(jié)合武漢特色產(chǎn)業(yè)和政策扶持,加速科研成果落地。2021年7月,中科院自動化所在2021世界人工智能大會(WAIC2021)發(fā)布了基于武漢人工智能計算中心研發(fā)的多模態(tài)預(yù)訓(xùn)練大模型——紫東.太初,全球首個圖文音(視覺-文本-語音)三模態(tài)預(yù)訓(xùn)練模型(OPT-Omni-Perceptionpre-Trainer),以多模態(tài)大模型為核心,同時具備跨模態(tài)理解與跨模態(tài)生成能力,開拓了AI在視頻配音、語音播報、標(biāo)題摘要、文學(xué)創(chuàng)作等更多元場景的應(yīng)用,逐步構(gòu)建智能化音視頻產(chǎn)業(yè)。

人工智能計算中心發(fā)展白皮書2.0圖

2

武漢人工智能計算中心15型性能水平提供了可能,在本地便捷部署異地人工智能計算中心的超大規(guī)模預(yù)訓(xùn)練模型,促進(jìn)行業(yè)應(yīng)用的流動,并實現(xiàn)基于網(wǎng)絡(luò)的快速迭代,對人工智能計算中心提出新的需求。在國家碳達(dá)峰、碳中和的大戰(zhàn)略背景下,人工智能計算中心作為最高能效的人工智能計算基礎(chǔ)設(shè)施,通過統(tǒng)籌建設(shè)和先進(jìn)制冷技術(shù)等手段有效降低了PUE(Power

Usage

Effectiveness,能耗利用率,越低代表能耗越充分被利用)

。但在人工智能自身發(fā)展和各地發(fā)展人工智能產(chǎn)業(yè)的帶

動下,人工智能計算中心規(guī)??偭亢湍芎目偭坎粩嘣鲩L,且計算業(yè)務(wù)天然存在波動,存在部分能耗閑置現(xiàn)象。需要人工智能計算中心進(jìn)一步提升能耗利用率,并在不同計算中心間算力協(xié)同調(diào)度,降低能耗閑置。以上新形勢迫切需要在加強人工智能計算中心建設(shè)的過程中,不僅僅將計算中心作為獨立的系統(tǒng)發(fā)揮作用,而是逐步形成相互聯(lián)接的算力網(wǎng)絡(luò),以滿足網(wǎng)絡(luò)化算力聯(lián)通調(diào)度,大模型通過網(wǎng)絡(luò)部署并結(jié)合不同區(qū)域產(chǎn)業(yè)優(yōu)勢應(yīng)用落地,數(shù)據(jù)集、行業(yè)應(yīng)用等人工智能要素能夠借助網(wǎng)絡(luò)平臺便捷流動共享的需求。第三章人工智能計算中心面臨的新形勢和新需求當(dāng)前人工智能領(lǐng)域,超大規(guī)模預(yù)訓(xùn)練模型得到長足發(fā)展和廣泛關(guān)注,以大數(shù)據(jù)和大算力優(yōu)勢取代了一些小的算法模型,“大模型+大數(shù)據(jù)+大算力”成為邁向通用人工智能的一條可行路徑。在此背景下,我國超大規(guī)模預(yù)訓(xùn)練模型的發(fā)展如火如荼,算力需求持續(xù)攀升,人工智能計算中心的建設(shè)保持快速增長。高質(zhì)量的大規(guī)模數(shù)據(jù)集是超大規(guī)模預(yù)訓(xùn)練模型研究的基礎(chǔ)。我國人工智能數(shù)據(jù)集這一重要生產(chǎn)要素建設(shè)分散,

尚缺乏統(tǒng)一標(biāo)準(zhǔn)和流動聯(lián)通機制,難以形成高質(zhì)量大規(guī)模的數(shù)據(jù)集。其需要與人工智能計算中心等算力基礎(chǔ)設(shè)施進(jìn)一步結(jié)合,并通過計算中心網(wǎng)絡(luò)化匯聚,發(fā)揮最大價值。人工智能科技和產(chǎn)業(yè)開始步入全面融合發(fā)展的新階段。由于資源稟賦和社會發(fā)展情況不同,各區(qū)域形成了具有本地特色的產(chǎn)業(yè)集群,開發(fā)本地有優(yōu)勢的行業(yè)應(yīng)用,成為人工智能融合賦能實體經(jīng)濟(jì)的新需求。超大規(guī)模預(yù)訓(xùn)練模型技術(shù)的發(fā)展,為基于基礎(chǔ)模型便捷開發(fā)行業(yè)應(yīng)用,提升場景化模人工智能計算中心發(fā)展白皮書2.0

16以GPT-3

為代表的超大規(guī)模預(yù)訓(xùn)練模型,以數(shù)據(jù)和算力優(yōu)勢取代了一些小的算法模型,展示了一條通向通用人工智能的可能路徑。Percy

Liang、李飛飛等斯坦福大學(xué)的人工智能研究者在論文《On

the

Opportunities

and

Risks

ofFoundation

Models》中系統(tǒng)闡述了大規(guī)模預(yù)訓(xùn)練模型并將其命名為基礎(chǔ)模型(foundationmodel)

,如圖

3所示,基礎(chǔ)模型將多模態(tài)的數(shù)據(jù)信息進(jìn)行集中訓(xùn)練,之后可被應(yīng)用到廣泛的下游應(yīng)用任務(wù)。在此背景下,我國超大規(guī)模預(yù)訓(xùn)練模型的發(fā)展如火如荼。2021年以來,國內(nèi)相繼發(fā)布了

一系列國產(chǎn)大模型,華為與鵬城實驗室聯(lián)合發(fā)布了“鵬程.盤古”系列超大規(guī)模預(yù)訓(xùn)練稠密模型,中科院自動化所發(fā)布了跨模態(tài)通用人工智能模型“紫東.太初”,北京智源人工智能研究院發(fā)布了“悟道2.0”稀疏模型。其中鵬程

.盤古大模型獲得了10多個業(yè)界挑戰(zhàn)賽冠軍,達(dá)到國際先進(jìn)水平。

3.1

人工智能計算中心需要適應(yīng)人工智能“大模型+大數(shù)據(jù)+大算力”發(fā)展的新形勢

人工智能計算中心發(fā)展白皮書2.0圖

3

大模型(基礎(chǔ)模型)技術(shù)原理17與此同時,高質(zhì)量的大規(guī)模數(shù)據(jù)集是超大規(guī)模預(yù)訓(xùn)練模型研究的基礎(chǔ)。我國重視人工智能相關(guān)數(shù)據(jù)集的建設(shè),已經(jīng)有若干布局,但建設(shè)相對分散,尚缺乏統(tǒng)一標(biāo)準(zhǔn)和流動機制,數(shù)據(jù)訪問安全和隱私存在顧慮。以遙感數(shù)據(jù)集為例,遙感數(shù)據(jù)及大模型在國土資源調(diào)查、基礎(chǔ)測繪、城市規(guī)劃、重大災(zāi)害與環(huán)境事件評估等方面可以廣泛應(yīng)用,并在政府科學(xué)決策與管理等方面發(fā)揮重要作用。武漢大學(xué)發(fā)布了從區(qū)域到全球的遙感數(shù)據(jù)樣本集,并與武漢人工智能計算中心合作,基于該數(shù)據(jù)集開發(fā)了武漢.LuojiaNet遙感大模型。而其他地區(qū)中小地理信息公司缺乏相關(guān)數(shù)據(jù),需要重新建設(shè)遙感數(shù)據(jù)集或者高價購買使用,遙感數(shù)據(jù)集沒有得到充分流動和利用。高質(zhì)量大規(guī)模人工智能數(shù)據(jù)集的建設(shè),需要標(biāo)準(zhǔn)化的數(shù)據(jù)共享網(wǎng)絡(luò)平臺,打通各地數(shù)據(jù)集格式,形成廣域共享的更大規(guī)模和更高質(zhì)量的數(shù)據(jù)集,便于不同地區(qū)計算中心接入和使用。人工智能超大規(guī)模預(yù)訓(xùn)練模型的不斷涌現(xiàn),持續(xù)引發(fā)巨大的算力需求。大模型需要大規(guī)模高質(zhì)量的人工智能數(shù)據(jù)集,這要求人工智能數(shù)據(jù)集等AI要素進(jìn)一步流動和共享。人工智能“大模型+大數(shù)據(jù)+大算力”的新發(fā)展,一方面需要加強人工智能計算中心的建設(shè),有效解決前沿人工智能共性研究和超大模型發(fā)展的算力供需矛盾;另一方面需要在各地計算中心間建設(shè)技術(shù)統(tǒng)一、方便流動的網(wǎng)絡(luò)平臺和機制。通過網(wǎng)絡(luò)平臺上統(tǒng)一的人工智能數(shù)據(jù)集標(biāo)準(zhǔn)、應(yīng)用接口標(biāo)準(zhǔn)等,方便地將各地分散的數(shù)據(jù)集和應(yīng)用算法等接入網(wǎng)絡(luò)平臺。大規(guī)模、大參數(shù)量預(yù)訓(xùn)練模型的出現(xiàn)不斷提升人工智能模型的認(rèn)知能力,需要的算力也從PFLOPS級別增加到EFLOPS級別,

開始進(jìn)入10

EFLOPS級別,對計算中心的算力需求持續(xù)攀升。如GPT-3達(dá)到了1750億參數(shù),使用EFLOPS的算力也需要3天以上才能完整訓(xùn)練一次。而根據(jù)NVIDIA的預(yù)計,在2023年人工智能模型將突破

100

萬億個參數(shù)。同時,超大規(guī)模的批處理、自動模型結(jié)構(gòu)搜索等新方法的涌現(xiàn),也導(dǎo)致計算需求持續(xù)增加。根據(jù)華為《智能世界2030》白皮書預(yù)測,2030年,AI計算(FP16)

總量將達(dá)105ZFLOPS,同比2020年增長500倍。第三章人工智能計算中心面臨的新形勢和新需求人工智能計算中心發(fā)展白皮書2.0

18括能源、零售、金融、工業(yè)、醫(yī)療、環(huán)境、物流等等。其中,在能源領(lǐng)域,盤古預(yù)訓(xùn)練大模型幫助行業(yè)客戶實現(xiàn)設(shè)備能耗的智能控制,可以節(jié)約電力成本50%;在金融行業(yè)中的異常財務(wù)檢測,讓模型精度提升20%以上;在塵肺檢測中,病例識別準(zhǔn)確率提升22%等等。我國區(qū)域資源稟賦和產(chǎn)業(yè)特色各不相同,如廣東聚焦半導(dǎo)體與集成電路等重大創(chuàng)新領(lǐng)域,上海推進(jìn)自動駕駛等融合測試場景建設(shè),布局工業(yè)互聯(lián)網(wǎng)平臺,山東大力推進(jìn)制造業(yè)、服務(wù)業(yè)、農(nóng)業(yè)數(shù)字化轉(zhuǎn)型試點示范,湖北聚焦“光芯屏端網(wǎng)”等領(lǐng)域。不同區(qū)域各自具備不同的產(chǎn)業(yè)基礎(chǔ)和優(yōu)勢,基于大模型結(jié)合本地優(yōu)勢產(chǎn)業(yè),跨領(lǐng)域合作可以打造符合當(dāng)?shù)靥厣漠a(chǎn)業(yè)應(yīng)用。行業(yè)應(yīng)用和算法高效流通可以幫助人工智能應(yīng)用和場景的快速復(fù)制?;A(chǔ)模型借助大型人工智能計算中心的算力進(jìn)行訓(xùn)練,成型后結(jié)合各地特色產(chǎn)業(yè)生成下游應(yīng)用,需要能夠通過網(wǎng)絡(luò)聯(lián)通,便捷地在異地人工智能計算中心部署,使用當(dāng)?shù)氐臄?shù)據(jù)進(jìn)行微調(diào)和增量學(xué)習(xí),對計算中心的發(fā)展我國各行業(yè)智能化需求旺盛,但整體智能化水平較低,迫切需要降低人工智能應(yīng)用門檻。據(jù)統(tǒng)計,我國企業(yè)的人工智能接受度為

85%,遠(yuǎn)高于美國的51%。各行各業(yè)數(shù)字化、智能化的需求旺盛,但我國人工智能應(yīng)用落地領(lǐng)域分布不均衡。據(jù)統(tǒng)計,我國

85%以上人工智能算力集中在互聯(lián)網(wǎng)、公安行業(yè),在教育、醫(yī)療、養(yǎng)老、環(huán)境保護(hù)、城市運行、司法服務(wù)、交通、能源、制造等領(lǐng)域還沒有得到深度應(yīng)用,對公共服務(wù)、生產(chǎn)、分配交換等社會治理、經(jīng)濟(jì)活動各環(huán)節(jié)的智能化水平提升作用還不足。主要原因在于,人工智能需與各行業(yè)的業(yè)務(wù)流程、IT系統(tǒng)、生產(chǎn)系統(tǒng)等深度結(jié)合才能產(chǎn)生價值。除相應(yīng)的硬件、軟件、算法外,還需同時具備行業(yè)知識、人工智能知識、IT系統(tǒng)知識的人才進(jìn)行開發(fā)和部署。單個人工智能大模型可以實現(xiàn)在眾多場景通用、泛化和規(guī)模化復(fù)制,

減少對數(shù)據(jù)標(biāo)注的依賴。隨著超大規(guī)模預(yù)訓(xùn)練模型系統(tǒng)的開放,預(yù)訓(xùn)練基線智能水平大幅提升,行業(yè)人工智能應(yīng)用不必從零開始開發(fā),只需結(jié)合某個行業(yè)的領(lǐng)域數(shù)據(jù)進(jìn)行調(diào)整,即可生成某個領(lǐng)域的相關(guān)模型,且得到良提出了新的需求。好的精度和性能。華為云發(fā)布的盤古預(yù)訓(xùn)練大模型已經(jīng)在多個行業(yè)、100多個場景成功驗證,包

3.2人工智能計算中心需要滿足人工智能賦能區(qū)域經(jīng)濟(jì)社會發(fā)展的新需求

人工智能計算中心發(fā)展白皮書2.019預(yù)處理和其他任務(wù),從而能夠以較低的能耗提供高效的人工智能計算能力。NVIDIA曾測算,在完成相同的人工智能計算任務(wù)條件下,人工智能計算中心的計算效率是傳統(tǒng)計算中心的10倍,而功耗僅為十分之一。近年來,計算中心不斷降低PUE,能耗效率顯著提升。原因主要有二點:一是得益于統(tǒng)籌規(guī)劃,集中建設(shè)。在全球各地區(qū)政策的引導(dǎo)下,數(shù)據(jù)中心從較小的傳統(tǒng)數(shù)據(jù)中心向超大規(guī)模數(shù)據(jù)中心轉(zhuǎn)變。二是得益于制冷和供配電等基礎(chǔ)設(shè)施技術(shù)的不斷改進(jìn)。這兩個措施有效降低了計算中心的PUE值。2013年以前,全國對外服務(wù)型數(shù)據(jù)中心平均

PUE

2.5

左右,而到2019年底,全國對外服務(wù)型數(shù)據(jù)中心平均PUE近1.6,實現(xiàn)質(zhì)的飛躍。其中,基于華為Atlas

900AI集群(如圖4)

的人工智能計算中心,采用創(chuàng)新的混合液冷設(shè)計,其柜級密閉絕熱技術(shù),支撐超過95%的液冷占比,單機柜能夠支持高達(dá)50kW的超高散熱功耗,實現(xiàn)PUE低于1.1的能耗效率。雖然計算中心有效降低了

PUE,但計算業(yè)務(wù)天然存在波動,仍存在能耗閑置現(xiàn)象。計算中心的業(yè)務(wù)波動會造成算力利用的波峰和波谷,在波谷時部分計算集群沒有任務(wù)運行,會發(fā)生能耗的閑置。如超大規(guī)模預(yù)訓(xùn)練模型在人工智能計算中心訓(xùn)練時,將占據(jù)計算中心大部分算力,在持續(xù)數(shù)周或數(shù)月形成時間周期性的算力波動,在算力波峰時,算力滿負(fù)荷運行,其他計算任務(wù)排隊,算力波谷時則造成功耗閑置。在國家碳達(dá)峰、碳中和的目標(biāo)下,2021年10月21

日,國家發(fā)展改革委等部門發(fā)布了關(guān)于嚴(yán)格能效約束推動重點領(lǐng)域節(jié)能降碳的若干意見,將“加強數(shù)據(jù)中心綠色高質(zhì)量發(fā)展”作為重點任務(wù),鼓勵重點行業(yè)利用綠色數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施實現(xiàn)節(jié)能降耗。新建大型、超大型數(shù)據(jù)中心電能利用效率不超過1.3。到2025年,數(shù)據(jù)中心電能利用效率普遍不超過1.5。這些均對人工智能計算中心提出了進(jìn)一步提升能耗利用率,在不同計算中心間算力協(xié)同調(diào)度、削峰填谷、精細(xì)化能耗控制的要求。人工智能計算中心能耗總量較大,且保持不斷增長。2019年,馬薩諸塞大學(xué)阿默斯特校區(qū)的研究人員發(fā)現(xiàn),訓(xùn)練一個AI模型的過程中可排放超過626,000

磅二氧化碳,相當(dāng)于普通汽車壽命周期排放量的五倍(其中包括汽車本身的制造過程)

。統(tǒng)計表明,2018年中國所有數(shù)據(jù)中心的總用電量達(dá)1600億千瓦時,需消耗

5300

萬噸標(biāo)準(zhǔn)煤,占中國社會總用電量的

2.5%。工業(yè)和信息化部2021年7月印發(fā)的《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023年)》提出,到2023年底,全國數(shù)據(jù)中心機架規(guī)模年均增速將保持在

20%

左右。按照目前的增長速度推算,

2023年中國所有數(shù)據(jù)中心用電量將達(dá)2600億千瓦時,相當(dāng)于2.6個三峽大壩的年發(fā)電量。人工智能計算中心提供人工智能計算范式所需的專用算力,配合少量的通用算力以進(jìn)行數(shù)據(jù)

3.3人工智能計算中心需要符合國家“雙碳”目標(biāo)的新要求

第三章人工智能計算中心面臨的新形勢和新需求人工智能計算中心發(fā)展白皮書2.0

20總之,算力網(wǎng)絡(luò)將成為人工智能計算中心下一步發(fā)展的新形態(tài)和新范式。人工智能超大規(guī)模預(yù)訓(xùn)練模型的不斷涌現(xiàn),基于大模型開發(fā)行業(yè)應(yīng)用賦能區(qū)域經(jīng)濟(jì)社會發(fā)展的需求激增,人工智能數(shù)據(jù)集等AI要素進(jìn)一步流動和共享,以及社會對計算中心不斷提升能耗控制水平的要求,促使人工智能計算中心之間開始聯(lián)接。人工智能計算中心不再是獨立的系統(tǒng),而是形成相互聯(lián)接的算力網(wǎng)絡(luò)。地理分布的多個算力中心將聯(lián)接在一起,

為基于基礎(chǔ)模型開發(fā)新型分布式融合應(yīng)用提供支撐。算力網(wǎng)絡(luò)可以感知應(yīng)用所需算力與存儲資源,通過任務(wù)調(diào)度滿足業(yè)務(wù)需求,多個組織用戶在多個計算中心共享算力和數(shù)據(jù),完成復(fù)雜應(yīng)用對計算和數(shù)據(jù)處理的需求。因此,人工智能計算中心需要采用算力調(diào)度進(jìn)一步降低業(yè)務(wù)波峰波谷造成的能耗閑置。多人工智能計算中心協(xié)同調(diào)度,在A中心算力波峰時,可以將排隊任務(wù)轉(zhuǎn)移到算力波谷的

B中心計算,削峰填谷,多計算中心都可以保持算力高利用率,將計算中心的能耗充分利用起來,從全局和長遠(yuǎn)角度看,是進(jìn)一步提升能耗利用率,降低碳排放的有效路徑。國家“雙碳”目標(biāo)對計算中心能耗控制提出了更高的要求,多計算中心間聯(lián)網(wǎng)感知計算應(yīng)用所需算力資源,通過任務(wù)調(diào)度,在能效比的約束下作出算力調(diào)配的最優(yōu)決策,從全局視角看,可以獲得計算效率與能耗效率的最優(yōu)。

人工智能計算中心發(fā)展白皮書2.0圖4華為Atlas

900集群21第四章人工智能算力網(wǎng)絡(luò)的建設(shè)算力跨計算中心調(diào)度、大模型研究與產(chǎn)業(yè)跨區(qū)域創(chuàng)新協(xié)同、人工智能生產(chǎn)要素流動共享等新需求促生了人工智能算力網(wǎng)絡(luò)的產(chǎn)生。人工智能算力網(wǎng)絡(luò)將各地分布的人工智能計算中心節(jié)點聯(lián)接起來,構(gòu)成多個計算中心間感知、分配、調(diào)度人工智能算力的網(wǎng)絡(luò),

在此基礎(chǔ)上匯聚和共享算力、數(shù)據(jù)、大模型等算法資源,是人工智能計算中心進(jìn)一步發(fā)展的重要方向,將有助于推動構(gòu)建區(qū)域范圍乃至全國范圍的人工智能產(chǎn)業(yè)生態(tài)網(wǎng)絡(luò)。隨著5G、人工智能、云計算、大數(shù)據(jù)等新一代信息技術(shù)在各行各業(yè)廣泛應(yīng)用,行業(yè)應(yīng)用的多樣性帶來數(shù)據(jù)和算力的多樣性。未來,人工智能算力網(wǎng)絡(luò)將進(jìn)一步連接高性能計算中心和一體化大數(shù)據(jù)中心,演進(jìn)為多樣性算力網(wǎng)絡(luò),滿足數(shù)字化技術(shù)交叉應(yīng)用的廣泛需求。人工智能計算中心發(fā)展白皮書2.022科研機構(gòu)等分散建設(shè),分散使用,正如私家車一樣由每個人自行購買,自行維護(hù)和使用,全局視角來看,車輛使用率低,使用成本高。統(tǒng)籌建設(shè)人工智能等計算中心,資源統(tǒng)一分配,計算任務(wù)排隊管理,就像出租車一樣,車輛由出租車公司集中購買,車輛統(tǒng)一分配,用戶排隊打車,這樣出租車車輛使用率較高,成本降低,但用戶需排隊使用車輛,用車高峰時需要等候,且無法將空閑的社會車輛利用起來。人工智能算力網(wǎng)絡(luò)將全部計算中心的算力需求統(tǒng)一管理,并將數(shù)據(jù)、算法、應(yīng)用資源等開放共享出來,進(jìn)行統(tǒng)一分配,實現(xiàn)了整網(wǎng)最大效率,并拓展了應(yīng)用和創(chuàng)新的空間。正如當(dāng)前的互聯(lián)網(wǎng)用車平臺,將加入平臺的車輛資源進(jìn)行統(tǒng)一的按需分配,用戶向用車平臺申請用車,可以利用全網(wǎng)的車輛資源,用車更快,時間和費用的綜合成本進(jìn)一步降低,全局資源利用率最優(yōu),實現(xiàn)可調(diào)度、可協(xié)同、可匯聚、可共享,達(dá)到了網(wǎng)絡(luò)價值的最大化。人工智能算力網(wǎng)絡(luò)是以新型網(wǎng)絡(luò)技術(shù)連接各地人工智能計算中心,匯聚算力、算法、生態(tài)等創(chuàng)新資源,釋放人工智能產(chǎn)業(yè)賦能能力的新范式。通過算力網(wǎng)絡(luò)建設(shè),打造中國信息基礎(chǔ)設(shè)施數(shù)字基座,實現(xiàn)“共建算力、共享資源、共同發(fā)展”的愿景。人工智能算力網(wǎng)絡(luò)的核心思想是通過新型網(wǎng)絡(luò)技術(shù)將各地分布的人工智能計算中心節(jié)點聯(lián)接起來,動態(tài)實時感知算力和網(wǎng)絡(luò)資源狀態(tài),進(jìn)而統(tǒng)籌分配和調(diào)度計算任務(wù),構(gòu)成感知、決策、分配、調(diào)度算力的網(wǎng)絡(luò),在此基礎(chǔ)上匯聚和共享算力、應(yīng)用、數(shù)據(jù)、算法資源,是一種多資源、多樣性異構(gòu)算力深度融合,釋放人工智能賦能能力的新范式。人工智能算力網(wǎng)絡(luò)使算力資源從單計算中心統(tǒng)一分配轉(zhuǎn)變到所有計算中心間任務(wù)和資源統(tǒng)一調(diào)度。過去,人工智能算力中心在各地由企業(yè)和

4.1

人工智能算力網(wǎng)絡(luò)的概念

人工智能計算中心發(fā)展白皮書2.023智能

IP網(wǎng)絡(luò)互聯(lián)網(wǎng)絡(luò)人工智能計算中心算網(wǎng)一體基礎(chǔ)設(shè)施數(shù)據(jù)流通算法流通大模型跨地域異步訓(xùn)練模型流通大規(guī)模分布式多方協(xié)同計算算力網(wǎng)絡(luò)調(diào)度平臺算力調(diào)度能耗感知

電價感知

負(fù)載感知統(tǒng)一運營多維調(diào)度管理人工智能計算中心互聯(lián)網(wǎng)絡(luò)新的網(wǎng)絡(luò)技術(shù)發(fā)展和架構(gòu)演進(jìn),可使計算中心間的網(wǎng)絡(luò)更加穩(wěn)定、成本更低、延遲更低、帶寬更大,能夠?qū)崿F(xiàn)人工智能計算中心間的快速高效互聯(lián),打造算力高速公路。以新型網(wǎng)絡(luò)技術(shù)為基礎(chǔ),人工智能算力網(wǎng)絡(luò)的整體架構(gòu)如圖5所示:算力網(wǎng)絡(luò)運營平臺人工智能算力網(wǎng)絡(luò)的實現(xiàn)架構(gòu)包含算網(wǎng)一體基礎(chǔ)設(shè)施、統(tǒng)一運營多維調(diào)度管理、大規(guī)模分布式多方協(xié)同計算三個平面。

4.2

人工智能算力網(wǎng)絡(luò)的架構(gòu)

應(yīng)用市場模型市場數(shù)據(jù)市場全局算力視圖人工智能計算中心發(fā)展白皮書2.0

24統(tǒng)一計量計費統(tǒng)一賬戶認(rèn)證和授權(quán)統(tǒng)一運維分析應(yīng)用感知

質(zhì)量感知

智能選路圖

5

人工智能算力網(wǎng)絡(luò)架構(gòu)第四章人工智能算力網(wǎng)絡(luò)的建設(shè)多方協(xié)同計算服務(wù)流通算力流通聯(lián)邦學(xué)習(xí)網(wǎng)絡(luò)調(diào)度全光網(wǎng)絡(luò)1.

算網(wǎng)一體基礎(chǔ)設(shè)施:在基礎(chǔ)設(shè)施平面,計算和網(wǎng)絡(luò)融合協(xié)同,構(gòu)筑人工智能計算的一體化基礎(chǔ)底座。計算設(shè)施基于新型計算架構(gòu)、芯片技術(shù)、系統(tǒng)軟件、應(yīng)用軟件等全棧整體建設(shè),在低能耗的基礎(chǔ)上輸出高性能有效算力;網(wǎng)絡(luò)互聯(lián)設(shè)施基于新型網(wǎng)絡(luò)技術(shù)實現(xiàn)區(qū)域內(nèi)多計算中心互聯(lián)以及跨區(qū)域長距離互聯(lián),具備以下特點:·

網(wǎng)絡(luò)訪問智能接入:算力網(wǎng)絡(luò)的用戶能夠快速自動化開通賬戶,每個賬戶的業(yè)務(wù)被單獨隔離,有效保障申請的資源獨占?!?/p>

網(wǎng)絡(luò)流量智能優(yōu)化:通過網(wǎng)絡(luò)智能化技術(shù),按照網(wǎng)絡(luò)流量需求,自動規(guī)劃最短網(wǎng)絡(luò)路徑,降低時延,同時提供網(wǎng)絡(luò)流量通路調(diào)優(yōu)和網(wǎng)絡(luò)帶寬動態(tài)分配等功能,充分利用網(wǎng)絡(luò)帶寬?!ぞW(wǎng)絡(luò)健康智能監(jiān)測:通過人工智能技術(shù),以及算力網(wǎng)絡(luò)流量可視化和網(wǎng)絡(luò)質(zhì)量監(jiān)測技術(shù),實現(xiàn)網(wǎng)絡(luò)健康度檢測、網(wǎng)絡(luò)故障提前告警和故障快速定位并自動修復(fù)?!?/p>

網(wǎng)絡(luò)安全智能防護(hù):支持智能防御網(wǎng)絡(luò)攻擊、網(wǎng)絡(luò)日志關(guān)聯(lián)分析和網(wǎng)絡(luò)攻擊感知能力,支持網(wǎng)絡(luò)安全監(jiān)控、攻擊風(fēng)險報警,網(wǎng)絡(luò)攻擊源頭追蹤。2.

統(tǒng)一運營多維調(diào)度管理:人工智能算力網(wǎng)絡(luò)管理平面由調(diào)度平臺和運營平臺組成。算力網(wǎng)絡(luò)調(diào)度平臺是整個算力網(wǎng)絡(luò)的核心,基于對算力、網(wǎng)絡(luò)的感知信息進(jìn)行人工智能計算作業(yè)的調(diào)度。在算力網(wǎng)絡(luò)的運行過程中可以根據(jù)需要選擇一種或多種調(diào)度策略:·能耗感知:感知不

同計

的PUE、算力效率、能耗指標(biāo)、能源結(jié)構(gòu)、碳排放等信息,將用戶作業(yè)調(diào)度到能耗最優(yōu)的計算中心最優(yōu)的計算設(shè)備上?!る妰r感知:感知不同地區(qū)的電價,評估人工智能計算作業(yè)的運行成本,進(jìn)而選擇成本最優(yōu)的計算中心。·負(fù)載感知:感知計算中心作業(yè)的排隊量、設(shè)備的利用率,最大化縮短作業(yè)的排隊和計算時間?!?yīng)用感知:感知網(wǎng)絡(luò)上流動的各類應(yīng)用和作業(yè),針對人工智能作業(yè)對網(wǎng)絡(luò)的需求進(jìn)行調(diào)度,使網(wǎng)絡(luò)可以動態(tài)響應(yīng)作業(yè)的優(yōu)先級、服務(wù)級別等需求?!?/p>

質(zhì)量感知:感知不同人工智能計算中心的網(wǎng)絡(luò)質(zhì)量并將作業(yè)調(diào)度到網(wǎng)絡(luò)質(zhì)量最優(yōu)的計算中心?!ぶ悄苓x路:基于算網(wǎng)融合技術(shù),算力網(wǎng)絡(luò)調(diào)度平臺與網(wǎng)絡(luò)控制器聯(lián)動,基于網(wǎng)絡(luò)多鏈路的開銷和路由策略,根據(jù)實際的作業(yè)需求選擇最適合的鏈路或者多鏈路的組合通信。

人工智能計算中心發(fā)展白皮書2.0253.大規(guī)模分布式多方協(xié)同計算:在協(xié)同計算平面,通過人工智能算力網(wǎng)絡(luò)使能算法、數(shù)據(jù)、算力、模型和服務(wù),在市場上安全、合規(guī)、自由的流通共享,進(jìn)而實現(xiàn)全新計算范式和業(yè)務(wù)場景:·

大規(guī)??绲赜虍惒接?xùn)練:人工智能在機器學(xué)習(xí)過程中通過多輪迭代更新模型參數(shù)最終獲得準(zhǔn)確率相對高的模型。異步訓(xùn)練指多個人工智能計算中心各自在自己的數(shù)據(jù)上迭代并更新主模型參數(shù)的方式。與同步訓(xùn)練每次參與迭代的計算節(jié)點需要同時讀取、更新參數(shù)不同,異步訓(xùn)練使大規(guī)??绲赜虻挠?xùn)練具有可行性。·聯(lián)邦學(xué)習(xí):聯(lián)邦學(xué)習(xí)指通過將模型進(jìn)行拆分并分發(fā)到多個人工智能計算中心進(jìn)行分別訓(xùn)練、多個參與方將得到的梯度參數(shù)進(jìn)行交換合并以組成完整模型的方式,這使得多個人工智能計算中心無需遷移數(shù)據(jù)即可完成聯(lián)合建模。·多方協(xié)同計算:一個大的人工智能計算項目往往需要多個擁有不同資源的參與方協(xié)同完成,在此過程中模型、數(shù)據(jù)、算法通過算力網(wǎng)絡(luò)在多方之間有序的流轉(zhuǎn)、組裝、加工,最終輸出結(jié)果。算力網(wǎng)絡(luò)運營平臺實現(xiàn)多個人工智能計算中心的統(tǒng)一運營?!?yīng)用市場、模型市場、數(shù)據(jù)市場:三大市場實現(xiàn)數(shù)據(jù)、模型、應(yīng)用的流通和共享,根據(jù)不同的數(shù)據(jù)和信息保護(hù)等級使用安全沙箱、可信計算、聯(lián)邦學(xué)習(xí)等技術(shù)保護(hù)流通過程的安全?!と炙懔σ晥D:以豐富、直觀的圖表展示接入算力網(wǎng)絡(luò)的計算中心的計算資源、當(dāng)前計算負(fù)載,是管理者進(jìn)行運行狀況監(jiān)測、算力分配決策、運行業(yè)務(wù)監(jiān)管的重要工具。·

統(tǒng)一賬戶認(rèn)證和授權(quán):實現(xiàn)用戶本地一次登錄,賬戶在整體算力網(wǎng)絡(luò)通行?!そy(tǒng)一計量計費:基于計算任務(wù)執(zhí)行所使用的資源數(shù)量,以及不同人工智能計算中心的定價,對用戶呈現(xiàn)一張賬單,后臺自動結(jié)算?!そy(tǒng)一運維分析:能夠為基礎(chǔ)運營和運維過程提供全面、具體、實時的監(jiān)控數(shù)據(jù)和分析工具。人工智能計算中心發(fā)展白皮書2.026第四章人工智能算力網(wǎng)絡(luò)的建設(shè)算力匯聚:不同人工智能計算中心之間高速網(wǎng)絡(luò)互聯(lián),實現(xiàn)算力合理調(diào)度,資源彈性分配,提升各個人工智能計算中心的利用率,為大模型訓(xùn)練提供超級算力,還可實現(xiàn)整體能耗的節(jié)省。人工智能計算任務(wù)所需算力根據(jù)算法的不同以及訓(xùn)練數(shù)據(jù)的類型和大小而各有不同。人工智能前沿應(yīng)用的算力需求每年增長10倍,當(dāng)前通用大模型訓(xùn)練對算力的需求可達(dá)到數(shù)E級,且持續(xù)訓(xùn)練數(shù)周甚至數(shù)月。而一般AI

訓(xùn)練類應(yīng)用,其所需的算力從數(shù)百TFLOPS級到數(shù)百PFLOPS級不等,持續(xù)數(shù)天到數(shù)周不等;AI推理類業(yè)務(wù)對算力的需求稍弱,根據(jù)業(yè)務(wù)場景的不同,其所需算力一般在從數(shù)百GFLOPS到TFLOPS不等。一張算力網(wǎng)絡(luò):將不同人工智能計算中心節(jié)點連成一張人工智能算力網(wǎng)絡(luò),算力網(wǎng)絡(luò)吸納和調(diào)度全國人工智能計算中心算力,以統(tǒng)一服務(wù)的方式,輸送高可靠、可度量、通用化的算力、算法、算據(jù)資源,使能人工智能應(yīng)用。人工智能算力網(wǎng)絡(luò)的作用與價值可以概括為“一網(wǎng)絡(luò)三匯聚”,即一張算力網(wǎng)絡(luò),匯聚算力、數(shù)據(jù)和生態(tài),打造人工智能產(chǎn)業(yè)聚集效應(yīng),奠定中國實現(xiàn)人工智能產(chǎn)業(yè)全球領(lǐng)先的基座。

4.3

人工智能算力網(wǎng)絡(luò)的作用

算力匯聚打造算力基礎(chǔ)設(shè)施數(shù)據(jù)匯聚聚合公共數(shù)據(jù)資源生態(tài)匯聚構(gòu)建生態(tài)聚合平臺

人工智能計算中心發(fā)展白皮書2.0圖

6

人工智能算力網(wǎng)絡(luò)的作用與價值人工智能算力網(wǎng)絡(luò)27▲人工智能數(shù)據(jù)集建設(shè)相對分散,分布于各人工智能計算中心節(jié)點所在區(qū)域。算力網(wǎng)絡(luò)通過建設(shè)數(shù)據(jù)共享平臺,基于各計算中心的數(shù)據(jù)集,形成數(shù)據(jù)集標(biāo)準(zhǔn)規(guī)范,統(tǒng)一各節(jié)點數(shù)據(jù)集格式與接口,使得各區(qū)域數(shù)據(jù)集可以互聯(lián)互通。通過建設(shè)統(tǒng)一的算力網(wǎng)絡(luò)數(shù)據(jù)管理系統(tǒng),將各區(qū)域的數(shù)據(jù)共享平臺打通,盤活孤島數(shù)據(jù),一方面可以充分?jǐn)U充數(shù)據(jù)集的規(guī)模,提升數(shù)據(jù)質(zhì)量,形成在行業(yè)、場景下可用的數(shù)據(jù)集,極大提升某些行業(yè)、企業(yè)人工智能算法和應(yīng)用的精度,一方面便于進(jìn)行集中管理,提高數(shù)據(jù)建設(shè)水平,進(jìn)而推動人工智能在行業(yè)的應(yīng)用,促進(jìn)產(chǎn)業(yè)發(fā)展。在算力網(wǎng)絡(luò)的數(shù)據(jù)服務(wù)平臺上,實現(xiàn)數(shù)據(jù)集“可用不可得”。通過多方聯(lián)合建模、聯(lián)邦學(xué)習(xí)

技術(shù),及端到端數(shù)據(jù)隱私保護(hù),使得數(shù)據(jù)可被使用但不可訪問,保障數(shù)據(jù)集提供者權(quán)益,保障不便公開的數(shù)據(jù)集的安全。依托算力網(wǎng)絡(luò)的數(shù)據(jù)服務(wù),還可以提供數(shù)據(jù)標(biāo)注服務(wù),通過AI輔助標(biāo)注,提高標(biāo)注效率和質(zhì)量,節(jié)約勞動力成本;提供模型生成服務(wù)、模型訓(xùn)練和模型推理服務(wù)。用戶可在數(shù)據(jù)集中選擇合適的數(shù)據(jù),使用算力網(wǎng)絡(luò)中開放的預(yù)訓(xùn)練模型學(xué)習(xí),再上傳自有數(shù)據(jù)做遷移學(xué)習(xí)更新模型。為促進(jìn)數(shù)據(jù)貢獻(xiàn),數(shù)據(jù)集提供者,除了享受平臺上的數(shù)據(jù)集使用權(quán)限,還可以享受收益分成。人工智能算力網(wǎng)絡(luò)充分聚合數(shù)據(jù),利用“大”數(shù)據(jù)構(gòu)建“大”模型,探索數(shù)據(jù)在各領(lǐng)域、各行業(yè)的競爭力應(yīng)用,促進(jìn)行業(yè)發(fā)展。通過算力匯聚,進(jìn)行算力一體化調(diào)度,根據(jù)不同計算任務(wù)對算力的不同需求,結(jié)合多個計算中心節(jié)點的算力資源和利用情況,實時調(diào)度分配,既最大化滿足計算任務(wù)的算力需求,又提升算力和能耗利用率。通過在人工智能算力網(wǎng)絡(luò)覆蓋范圍內(nèi)統(tǒng)籌規(guī)劃建設(shè)E級節(jié)點,滿足大模型訓(xùn)練需求,避免重復(fù)建設(shè)。如某中型人工智能計算中心節(jié)點所在區(qū)域有E級算力的大型訓(xùn)練模型需求,但本區(qū)域節(jié)點算力難以支撐,即可申請調(diào)度到異地EFLOPS級大型節(jié)點訓(xùn)練。同時,對算力網(wǎng)絡(luò)內(nèi)現(xiàn)有多個節(jié)點,實時感知算力波峰波谷,進(jìn)行實時任務(wù)調(diào)度,削峰填谷,有效降低閑置功耗和散熱功耗,提升能耗利用率。因大型節(jié)點算力波峰而排隊的中小型訓(xùn)練任務(wù)可以適當(dāng)調(diào)度到處于算力波谷的節(jié)點或電費和能耗較低的其他區(qū)域節(jié)點運行,實現(xiàn)算力的最大化配置效率。算力匯聚,算力調(diào)度,提高算力資源的利用效率,不具備大算力的區(qū)域也可以進(jìn)行大模型訓(xùn)練,算力需求集中長期排隊的任務(wù)也可以分流到算力需求一般的節(jié)點運行。數(shù)據(jù)匯聚:

多方合作,推進(jìn)AI領(lǐng)域的公共數(shù)據(jù)開放,基于人工智能計算中心匯聚高質(zhì)量的開源開放的AI數(shù)據(jù)集,促進(jìn)AI算法開發(fā)和行業(yè)落地。匯聚算力網(wǎng)絡(luò)范圍內(nèi)的人工智能計算中心所在區(qū)域的公共數(shù)據(jù)和行業(yè)數(shù)據(jù)資源,實現(xiàn)不同節(jié)點間數(shù)據(jù)資源安全開放,可信流動,并可通過聯(lián)邦學(xué)習(xí)等技術(shù)利用分散在各節(jié)點的數(shù)據(jù),共同訓(xùn)練生成高通用人工智能模型,充分挖掘數(shù)據(jù)價值。人工智能計算中心發(fā)展白皮書2.028第四章人工智能算力網(wǎng)絡(luò)的建設(shè)1)科研創(chuàng)新的協(xié)同:不同節(jié)點間大模型能力統(tǒng)一開放,各節(jié)點結(jié)合區(qū)域產(chǎn)業(yè)優(yōu)勢形成行業(yè)應(yīng)用;科研資源集中和算力集中的節(jié)點有條件開發(fā)超大規(guī)模預(yù)訓(xùn)練通用大模型,并在算力網(wǎng)絡(luò)上開放,其他節(jié)點可結(jié)合自己區(qū)域的優(yōu)勢產(chǎn)業(yè)和數(shù)據(jù)進(jìn)行微調(diào)訓(xùn)練,使大模型的成果為己所用,生成特色場景模型。2)應(yīng)用供需的平衡:在算力網(wǎng)絡(luò)上架構(gòu)跨地區(qū)的管理系統(tǒng),對資源準(zhǔn)入形成規(guī)范,統(tǒng)籌管理跨區(qū)域算力和生態(tài)資源,形成企業(yè)和應(yīng)用合作名單,在算力網(wǎng)絡(luò)范圍內(nèi)發(fā)布,促進(jìn)算力網(wǎng)絡(luò)各節(jié)點的創(chuàng)新資源流動和匯聚;圍繞地區(qū)實體經(jīng)濟(jì)轉(zhuǎn)型升級,在制造、交通、醫(yī)療等領(lǐng)域打造重大應(yīng)用示范,在算力網(wǎng)絡(luò)范圍內(nèi)企業(yè)推廣,降低行業(yè)門檻,促進(jìn)重點行業(yè)的智能化改造升級,從而聚集產(chǎn)業(yè)鏈上下游的企業(yè)和機構(gòu),打通供需兩端。3)產(chǎn)業(yè)標(biāo)準(zhǔn)的發(fā)展:統(tǒng)籌和制定人工智能公共服務(wù)平臺建設(shè)的技術(shù)解決方案,如算力池、網(wǎng)絡(luò)控制和轉(zhuǎn)發(fā)、網(wǎng)絡(luò)調(diào)度,應(yīng)用生命周期管理、安全管理、算力分級、計費記賬、數(shù)據(jù)接口與標(biāo)注等方面的統(tǒng)一技術(shù)規(guī)范和指南,在人工智能算力網(wǎng)絡(luò)形成有效實踐,可以為全國人工智能相關(guān)標(biāo)準(zhǔn)提供前沿經(jīng)驗,推動產(chǎn)業(yè)快速發(fā)展。堅持自主技術(shù)路線的人工智能算力網(wǎng)絡(luò)建設(shè),將促進(jìn)我國人工智能領(lǐng)域進(jìn)行清晰的頂層規(guī)劃,形成區(qū)域互補的優(yōu)勢,帶動一張安全領(lǐng)先的基礎(chǔ)設(shè)施網(wǎng)絡(luò)建設(shè),促進(jìn)人工智能在全國范圍內(nèi)與實體經(jīng)濟(jì)融合,加速數(shù)字經(jīng)濟(jì)發(fā)展。在算力網(wǎng)絡(luò)發(fā)展成熟后,將成為中國實現(xiàn)人工智能產(chǎn)業(yè)全球領(lǐng)先的基座。生態(tài)匯聚:采用互聯(lián)、應(yīng)用接

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論