智算中心暨電力大模型創(chuàng)新平臺(tái)解決方案_第1頁
智算中心暨電力大模型創(chuàng)新平臺(tái)解決方案_第2頁
智算中心暨電力大模型創(chuàng)新平臺(tái)解決方案_第3頁
智算中心暨電力大模型創(chuàng)新平臺(tái)解決方案_第4頁
智算中心暨電力大模型創(chuàng)新平臺(tái)解決方案_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

智算中心暨電力大模型創(chuàng)新平臺(tái)解決方案智算?超算1行業(yè)發(fā)展分析4主流智算平臺(tái)介紹2

方案架構(gòu)設(shè)計(jì)3

典型案例CONTENTS智算中心是以GPU、

AI加速卡[1]

等智能算力為核心、

集約化建設(shè)的新型算力基礎(chǔ)設(shè)施,提供軟硬件全棧環(huán)境,主要承載模型訓(xùn)練以及適合中心推理、多媒體渲染等業(yè)務(wù),支撐各行業(yè)數(shù)智化轉(zhuǎn)型升級具有較強(qiáng)的普適性,可服務(wù)于toB/toC適合有智能化轉(zhuǎn)型需求行業(yè),如自動(dòng)駕駛、智慧城市,toB為主專用性強(qiáng),主要面向地球物理、分子力學(xué)等基礎(chǔ)學(xué)科以及軍工研究注[1]:行業(yè)中GPU是一個(gè)較為泛化的概念,從功能角度劃分,GPU特指具備圖形渲染能力的硬件,AI加速卡特指用于AI推理或訓(xùn)練的硬件。本材料主要針對AI加速卡進(jìn)行分析

TaaS是指TensorFlow

asa

Service,深度學(xué)習(xí)平臺(tái)及行業(yè)大數(shù)據(jù)解決方案智算中心定義建設(shè)目的應(yīng)用領(lǐng)域主要特征?

專用ASIC芯片為主?

為大規(guī)??茖W(xué)計(jì)算任務(wù)提供支撐服務(wù)帶動(dòng)政府治理及各行各業(yè)數(shù)智化轉(zhuǎn)型升

級,促進(jìn)產(chǎn)業(yè)AI化、AI產(chǎn)業(yè)化促進(jìn)信息服務(wù)業(yè)云化轉(zhuǎn)型,通過資源共享及彈性發(fā)放,供用戶按需使用資源?CPU通用算力為主?

提供IaaS、PaaS、SaaS級服務(wù)3.算力、數(shù)據(jù)、算法的融合平臺(tái)4.以產(chǎn)業(yè)創(chuàng)新升級為目標(biāo)?GPU智能算力為主?

提供TaaS任務(wù)式服務(wù)1.算力公共基礎(chǔ)設(shè)施2.計(jì)算架構(gòu)技術(shù)領(lǐng)先算力的幾種形態(tài)

超算中心

智算中心

云計(jì)算中心

提升國家及地方科研創(chuàng)新能力第

3

頁美國:以保持國家競爭力為目的,最先發(fā)展智能超算中心,具備單體算力大、科研實(shí)驗(yàn)室居多國內(nèi):近兩年已有30+城市建成或在建設(shè)智算中心,總體投資規(guī)模超千億,旨在帶動(dòng)當(dāng)?shù)禺a(chǎn)業(yè)智能化升級參AI領(lǐng)域的競爭是未來世界領(lǐng)導(dǎo)權(quán)的競爭NSF基礎(chǔ)科研520億美元?jiǎng)?chuàng)新與技術(shù)局290億美元關(guān)鍵技術(shù)研發(fā)169億美元應(yīng)對AI的機(jī)遇和挑戰(zhàn),爭取主動(dòng)權(quán)數(shù)字領(lǐng)域

人工智能領(lǐng)域計(jì)算基礎(chǔ)設(shè)施1500億歐元200億歐元

96億歐元 推動(dòng)智能計(jì)算中心有序發(fā)展,打造智能算力、通用算法和開發(fā)平臺(tái)一體化的新型智能基礎(chǔ)設(shè)施國家新一代人工智能

創(chuàng)新發(fā)展試驗(yàn)區(qū)建設(shè)試驗(yàn)區(qū)國家人工智能

創(chuàng)新應(yīng)用先導(dǎo)區(qū)夯實(shí)技術(shù)人工智能基礎(chǔ)設(shè)施示范工程投資補(bǔ)貼全球:數(shù)據(jù)的高速增長帶來AI算力需求激增,到2030年,AI算力需求增長約390倍來源:羅蘭貝格國內(nèi):我國智算增長迅速,智算占比從2021年的51%躍升為2023年的70%來源:中國信通院《中國算力發(fā)展指數(shù)白皮書(2022)》政策加持國內(nèi)外提前布局,智能算力需求激增各國政府布局AI領(lǐng)域全棧能力,并出資引導(dǎo)智能算力基礎(chǔ)設(shè)施建設(shè),

AI智能算力增速遠(yuǎn)超摩爾定律智算中心主要由國家政府總體牽頭建設(shè),同時(shí)基礎(chǔ)設(shè)施提供商積極參與l

2022年11月30日,OpenAI的對話式AI大模型ChatGPT橫空出世,月活破億僅用時(shí)兩月,成為史上增長最快的消費(fèi)類應(yīng)用

,展現(xiàn)出解放人類生產(chǎn)力的驚人潛質(zhì)l

微軟作為OpenAI第一批投資者,通過優(yōu)先使用該技術(shù)贏得先機(jī),并將ChagGPT與旗下所有產(chǎn)品(Bing、Office、Azure)進(jìn)行整合

,加速了ChatGPT商業(yè)化路徑智算增長趨勢智算中心布局政策驅(qū)動(dòng)行業(yè)發(fā)展情況第

4

頁結(jié)合行業(yè)發(fā)展報(bào)告

,

12個(gè)重點(diǎn)場景有較大AI算力需求及發(fā)展空間,工業(yè)仿真

AR/VR高清視頻/影視渲染數(shù)智人形象渲染市場成熟度

★★★★整體空間

★★★★根技術(shù):渲染數(shù)字孿生3D交互/自然交互3D立體視頻

數(shù)字虛擬人物理世界三維建模圖像渲染市場成熟度★整體空間

★★★★★根技術(shù):CV+NLP+語音+多模態(tài)+渲染...智能語音問答

智能網(wǎng)聯(lián)汽車視覺感知決策分析

車路協(xié)同L4-L5級自動(dòng)駕駛預(yù)測預(yù)警市場成熟度

★★整體空間

★★

★★

★根技術(shù):CV+NLP+語音+決策智慧制造智慧安防

智慧交通智慧農(nóng)林

智慧物流

智慧政務(wù)

自然災(zāi)害應(yīng)急管理

資源環(huán)境治理市場成熟度

★★

★整體空間

★★

★根技術(shù):CV+NLP+語音+決策藥物研發(fā)氣候預(yù)測石油勘探市場成熟度

整體空間分子動(dòng)力學(xué)天氣預(yù)報(bào)材料科學(xué)★

★★

★根技術(shù):HPC+AI跨模態(tài)大模型藥物模型自動(dòng)駕駛大模型

金融模型網(wǎng)絡(luò)智能化模型市場成熟度整體空間★

★★★★★★根技術(shù):CV+NLP+語音+多模態(tài)...CT/MRI影像分析疾病輔助診斷與早期篩查蛋白質(zhì)結(jié)構(gòu)預(yù)測新藥研發(fā)市場成熟度

★★整體空間

★★★★根技術(shù):CV+NLP網(wǎng)絡(luò)故障診斷及預(yù)測智能決策智慧業(yè)務(wù)辦理市場成熟度

★★★★整體空間

★★★★根技術(shù):NLP+語音+決策智算中心典型需求場景智慧電網(wǎng)智慧油田遙感測繪新聞、視頻、購物

App內(nèi)容推薦金融、通信、物流

客服風(fēng)險(xiǎn)分析精準(zhǔn)營銷AI主要應(yīng)用場景多媒體渲染模型訓(xùn)練智慧醫(yī)療自動(dòng)駕駛智慧運(yùn)營科研應(yīng)用AI+視頻元宇宙智能客服推薦智慧金融智慧能源第

5

頁l

場景:

利用無人機(jī)搭載高清攝像

頭采集輸電線路影像,

通過視覺大模型識(shí)別線路缺陷。l

應(yīng)用價(jià)值:

實(shí)現(xiàn)缺陷自動(dòng)識(shí)別

,準(zhǔn)確率≥99%

,減少人工巡檢工作

量,

提升巡檢效率和安全性

。

產(chǎn)

騰GPU+MindSpore

視覺框架

,

適配國產(chǎn)硬件和深度學(xué)習(xí)平臺(tái)。l

場景:

基于歷史負(fù)荷數(shù)據(jù)

、氣象

數(shù)據(jù)和電網(wǎng)拓?fù)浣Y(jié)構(gòu)

,預(yù)測未來短期和中長期電力負(fù)荷。l

應(yīng)用價(jià)值:

短期負(fù)荷預(yù)測誤差<

3%,

中長期<

5%,

助力電網(wǎng)調(diào)

度優(yōu)化,

降低運(yùn)營成本

。

國產(chǎn)化

適配:

使用華為云盤古電力預(yù)訓(xùn)

練模型

,基于MindSpore框架開

發(fā)

,適配國產(chǎn)云服務(wù)。l

場景:通過自然語言處理技術(shù)理解用戶咨詢和報(bào)修工單

,實(shí)現(xiàn)自動(dòng)回復(fù)和工單分類。l

應(yīng)用價(jià)值:

自然語言理解工單,

響應(yīng)效率提升50%

,改善用戶體驗(yàn)

,

提高客服工作效率。

國產(chǎn)化適配:

采用寒武紀(jì)NPU推理+中文預(yù)訓(xùn)練

模型

,適配國產(chǎn)推理芯片和語言模型。

主流場景及需求

智能客服與工單處理電力負(fù)荷預(yù)測輸電線路智能巡檢電力行業(yè)核心場景與價(jià)值第

6

頁數(shù)據(jù)孤島問題模型泛化差問題新能源并網(wǎng)優(yōu)化?

問題描述:電網(wǎng)

PMS

、GIS、

SCADA等系統(tǒng)數(shù)據(jù)

分散

,難以整合利用。?

解決方案:大模型整合多源數(shù)據(jù)

,打破數(shù)據(jù)孤島,實(shí)現(xiàn)數(shù)據(jù)共享和協(xié)同分析。?

國產(chǎn)化適配:使用國產(chǎn)數(shù)

據(jù)接口和數(shù)據(jù)治理平臺(tái)

,

如南瑞繼保IEC61850協(xié)

議適配器。?

問題描述:光伏、風(fēng)電出

力預(yù)測不準(zhǔn)確,導(dǎo)致棄電

率高,影響新能源消納。?解決方案:科學(xué)計(jì)算大模

型聯(lián)合仿真,光伏/風(fēng)電出

力預(yù)測精度提升,棄電率

降低8%。?

國產(chǎn)化適配:采用國產(chǎn)CAE軟件與大模型聯(lián)合仿

真,適配新能源并網(wǎng)優(yōu)化

需求。?

問題描述:通用大模型在電力領(lǐng)域適配性差

,難以滿足特定場景需求。?

解決方案:電力領(lǐng)域預(yù)訓(xùn)練模型(如華能“

電盤古

”)提升場景適配性

,優(yōu)化模型性能。?國產(chǎn)化適配:基于國產(chǎn)深度學(xué)

習(xí)框架和預(yù)訓(xùn)練模型

,適配電力行業(yè)應(yīng)用場景。電力行業(yè)核心場景與價(jià)值第

7

頁超算中心融合管理子系統(tǒng)(包含統(tǒng)一門戶)高速網(wǎng)絡(luò)交換子系統(tǒng)通用CPU算力子系統(tǒng)GPU智算子系統(tǒng)

HPC超算子系統(tǒng)全閃存存儲(chǔ)子系統(tǒng)高性能文件存儲(chǔ)子系統(tǒng)

超算智算中心系統(tǒng)組成

8頁

典型超算智算中心核心系統(tǒng)單元包含通用計(jì)算子系統(tǒng)、智能計(jì)算(AI)

子系統(tǒng)和高性能計(jì)算(HPC)

子系統(tǒng)。l

超算計(jì)算節(jié)點(diǎn)和智能計(jì)算節(jié)點(diǎn)分別通過IB/RoCE網(wǎng)絡(luò)等高速網(wǎng)絡(luò)交換子系統(tǒng)進(jìn)行高速互連;l

集成多層次、

多協(xié)議、

多種數(shù)據(jù)保護(hù)模式的全閃存存儲(chǔ)系統(tǒng)和高性能并行文件存儲(chǔ)系統(tǒng)

,

以及配套的信

息安全子系統(tǒng)和超算中心融合管理子系統(tǒng)。典型超算數(shù)據(jù)中心架構(gòu)信息安全子系統(tǒng)

1.

對外連接網(wǎng)絡(luò)(網(wǎng)絡(luò)出口層)分為CMNeT、云專網(wǎng)、

IP專網(wǎng)1.CMNeT:用于公眾用戶訪問智算中心2.云專網(wǎng):用于智算中心間互聯(lián)、訓(xùn)推互聯(lián)3.

IP專網(wǎng):用于遠(yuǎn)程管理2.

內(nèi)部互聯(lián)網(wǎng)絡(luò)分為業(yè)務(wù)/存儲(chǔ)網(wǎng)絡(luò)、管理網(wǎng)絡(luò)、參數(shù)面網(wǎng)絡(luò)、數(shù)據(jù)面網(wǎng)絡(luò)1.業(yè)務(wù)/存儲(chǔ)網(wǎng)絡(luò):業(yè)務(wù)網(wǎng)絡(luò)用于互聯(lián)網(wǎng)用戶訪問智算/通算等資源,存儲(chǔ)網(wǎng)絡(luò)用于調(diào)用共享存儲(chǔ)資源2.管理網(wǎng)絡(luò):主要包括業(yè)務(wù)管理(K8S平臺(tái)、安全管理系統(tǒng)

等)和

IPMI3.參數(shù)面網(wǎng)絡(luò):采用RoCE/IB實(shí)現(xiàn)集群內(nèi)所有AI加速卡的高速互聯(lián)4.數(shù)據(jù)面網(wǎng)絡(luò):采用RoCE實(shí)現(xiàn)智算集群與高性能文件存儲(chǔ)

的高速互聯(lián)智算中心組網(wǎng)分業(yè)務(wù)/存儲(chǔ)、管理、參數(shù)面、數(shù)據(jù)面四個(gè)網(wǎng)絡(luò)平面,與通算相比,智算組網(wǎng)新增參數(shù)面網(wǎng)絡(luò)及數(shù)據(jù)面網(wǎng)絡(luò),采用RoCE全連接無損組網(wǎng),充分發(fā)揮智算并行計(jì)算優(yōu)勢,同時(shí)組網(wǎng)整體無容災(zāi)設(shè)計(jì),對運(yùn)維工作帶來新的挑戰(zhàn)。

智算中心架構(gòu)與通算有較大區(qū)別

l第

9

頁2方案架構(gòu)設(shè)計(jì)3典型案例4主流智算平臺(tái)介紹5

項(xiàng)目優(yōu)勢1行業(yè)發(fā)展分析CONTENTS強(qiáng)電系統(tǒng)弱電系統(tǒng)不間斷電源系統(tǒng)

制冷系統(tǒng)監(jiān)控系統(tǒng)消防系統(tǒng)機(jī)房工程管理節(jié)點(diǎn)AI計(jì)算集群HPC計(jì)算集群通用云計(jì)算集群高速存儲(chǔ)集群(并行文件存儲(chǔ))高速RDMA網(wǎng)絡(luò)統(tǒng)一運(yùn)營管理平臺(tái)服務(wù)目錄項(xiàng)目管理用戶管理配額管理計(jì)費(fèi)管理總覽視圖權(quán)限管理規(guī)格定價(jià)操作日志

總體方案架構(gòu)

l人工智能平臺(tái)數(shù)據(jù)處理

模型開發(fā)

模型訓(xùn)練

自動(dòng)建模模型部署

模型推理

模型管理模型監(jiān)控主要包括AI智算集群、超算集群、高速網(wǎng)絡(luò)、通用計(jì)算集群、高性能存儲(chǔ)集群、安全中心、云管平臺(tái)、運(yùn)維平臺(tái)等。平臺(tái)安全運(yùn)

維監(jiān)控

臺(tái)云主機(jī)

裸金屬鏡像服務(wù)

對象存儲(chǔ)硬件基

礎(chǔ)設(shè)施基建基礎(chǔ)設(shè)施應(yīng)用中心自動(dòng)化部署預(yù)置算法框架:PyTorch、Tensorflow、PaddlePaddle...集成開發(fā)環(huán)境:Jupyter

Lab、

VSCode作業(yè)管理編譯器調(diào)度策略數(shù)據(jù)管理資源監(jiān)控并行環(huán)境軟件基礎(chǔ)設(shè)施云硬盤VPC高性能計(jì)算平臺(tái)方案架構(gòu)通用算力平臺(tái)第

11

頁云技術(shù)底座基礎(chǔ)模型:

華為云盤古電力大模型

(行業(yè)定制版)

,

基于MindSpore框架開發(fā)。模型類型:時(shí)

序Transformer+圖

神經(jīng)網(wǎng)絡(luò)(GNN)

融合架構(gòu)

,適配

電網(wǎng)拓?fù)浣Y(jié)構(gòu)。國產(chǎn)化適配:支持昇騰910B算子優(yōu)

,

提升模型在國產(chǎn)硬件上的運(yùn)行

效率。參數(shù)量:

130億參數(shù)(含電力領(lǐng)域

知識(shí)注入)

,通過昇騰CANN工具

壓縮至80億參數(shù)(壓縮率38%)

。優(yōu)化策略:采用量化技術(shù)(FP32→

INT8)

結(jié)合知識(shí)蒸餾

,推

理延遲降低50%

,精度損失<

2%。

國產(chǎn)化適配:使用昇騰CANN工具

進(jìn)行模型壓縮

,適配國產(chǎn)硬件和開

發(fā)平臺(tái)。輸入特征:歷史負(fù)荷數(shù)據(jù)(1440維

時(shí)序)

+氣象數(shù)據(jù)(溫度/濕度等20

維)

+電網(wǎng)拓?fù)涮卣鳎ㄠ徑泳仃嚕?/p>

。

輸出結(jié)果:未來15分鐘-7天負(fù)荷

預(yù)測值

,分時(shí)段精度要求:短期<

3%

,

中期<

5%。國產(chǎn)化適配:數(shù)據(jù)預(yù)處理組件采用

飛槳PaddlePaddle

,適配國產(chǎn)數(shù)

據(jù)處理框架。數(shù)據(jù)清洗與增強(qiáng)清洗規(guī)則:剔除異常值(3σ原則)

、填補(bǔ)

缺失值(線性插值)

、

歸一化(Min-

Max縮放至[-

1,1])

。增強(qiáng)策略:時(shí)序數(shù)據(jù)采用時(shí)間窗口滑動(dòng)

(窗口大小24*60分鐘)

;影像數(shù)據(jù)采用

旋轉(zhuǎn)/翻轉(zhuǎn)/噪聲注入。工具/平臺(tái):昇騰AI開發(fā)平臺(tái)(ModelArts)

數(shù)據(jù)增強(qiáng)模塊

,提升數(shù)據(jù)質(zhì)量。數(shù)據(jù)采集與接口數(shù)據(jù)采集:從SCADA系統(tǒng)抽取分鐘級負(fù)荷

數(shù)據(jù)

,分辨率1分鐘;無人機(jī)影像分辨率

≥4K。技術(shù)細(xì)節(jié):采用國產(chǎn)化數(shù)據(jù)接口(南瑞繼

保IEC61850協(xié)議適配器)

,確保數(shù)據(jù)采集

的穩(wěn)定性和兼容性。工具/平臺(tái):使用華為云DataArts數(shù)據(jù)治理

平臺(tái)

,進(jìn)行數(shù)據(jù)的清洗和預(yù)處理。基礎(chǔ)模型與架構(gòu)參數(shù)量與優(yōu)化輸入輸出設(shè)計(jì)模型架構(gòu)參數(shù)數(shù)據(jù)集劃分劃分比例:訓(xùn)練集:驗(yàn)證集:測試集

=7:2:1

,

按時(shí)間順序劃分

,避免未來信息泄露。技術(shù)細(xì)節(jié):自主研發(fā)電力數(shù)據(jù)劃分工具(Python實(shí)現(xiàn)),確保數(shù)據(jù)劃分的合理性

和科學(xué)性。工具/平臺(tái):使用Python編程語言實(shí)現(xiàn)數(shù)

據(jù)集劃分

,適配電力行業(yè)數(shù)據(jù)特點(diǎn)。數(shù)據(jù)預(yù)處理參數(shù)

基座模型選型及預(yù)訓(xùn)練參數(shù)

l第

12

頁1.數(shù)據(jù)預(yù)處理?數(shù)據(jù)清洗、標(biāo)準(zhǔn)化及特征工程2.模型訓(xùn)練?輸入:標(biāo)準(zhǔn)化后的數(shù)據(jù)集?昇騰集群分布式計(jì)算:?多節(jié)點(diǎn)并行計(jì)算梯度?參數(shù)服務(wù)器架構(gòu)更新模型參數(shù)?節(jié)點(diǎn)間同步最新參數(shù)?驗(yàn)證評估:?定期計(jì)算預(yù)測誤差?反饋調(diào)優(yōu)信號(hào)指導(dǎo)模型優(yōu)化3.模型壓縮?將FP32轉(zhuǎn)換為INT8量化推理模型?優(yōu)化模型體積和計(jì)算效率4.邊緣部署?推送INT8模型至變電站NPU節(jié)點(diǎn)?完成邊緣側(cè)模型部署學(xué)習(xí)率策略:初始學(xué)習(xí)率1e-4,余弦退火衰減(周期200epoch),動(dòng)態(tài)調(diào)整學(xué)習(xí)率。訓(xùn)練時(shí)長:單卡訓(xùn)練約120小時(shí),集群訓(xùn)練約15小時(shí),線性加速比

8.5倍,顯著提升訓(xùn)練效率。技術(shù)細(xì)節(jié):采用梯度累積(累積4批次更新一次參數(shù))

,優(yōu)化訓(xùn)練

過程。硬件配置:昇騰910B

×8/節(jié)點(diǎn),RoCE

v2網(wǎng)絡(luò)(帶寬200Gbps),構(gòu)建高效分布式訓(xùn)練環(huán)境??蚣軆?yōu)化:自動(dòng)并行策略(數(shù)據(jù)并行+模型并行混合),

提升分布

式訓(xùn)練性能。優(yōu)化器選擇:分布式優(yōu)化器(Horovod+昇騰通信庫),

優(yōu)化梯度

同步和參數(shù)更新。硬件配置:昇騰910B

×

1(640TOPS

,

32GB

HBM),

適配單機(jī)訓(xùn)練需求??蚣苓x擇:

MindSpore

2.2(靜態(tài)圖模式),

優(yōu)化訓(xùn)練效率。批次大?。簳r(shí)序數(shù)據(jù)2048樣本/批,

影像數(shù)據(jù)32樣本/批,適配不同

數(shù)據(jù)類型。技術(shù)細(xì)節(jié):

NPU

(寒武紀(jì)MLU370)專用于電力行業(yè)

AI推理,如設(shè)備缺陷識(shí)別、實(shí)時(shí)告警。架構(gòu)描述:

構(gòu)建異構(gòu)計(jì)算架構(gòu),涵蓋國產(chǎn)CPU、

GPU、

NPU及國際GPU

,滿足不同計(jì)算需求。國產(chǎn)化適配:

優(yōu)先采用國產(chǎn)計(jì)算設(shè)備,提升整體架構(gòu)

的自主可控性。

預(yù)訓(xùn)練配置與訓(xùn)練流程

l典型訓(xùn)練流程時(shí)序圖單機(jī)訓(xùn)練配置分布式訓(xùn)練配置訓(xùn)練效率提升訓(xùn)練配置參數(shù)模型部署數(shù)據(jù)收集

清洗標(biāo)注模型訓(xùn)練模型壓縮第

13

頁監(jiān)控

調(diào)

優(yōu)

數(shù)Q網(wǎng)絡(luò)時(shí)延監(jiān)控監(jiān)控指標(biāo):參數(shù)同步時(shí)延<

10ms

(分布式訓(xùn)練)。閾值范圍:確保分布式訓(xùn)練的

高效同步。調(diào)優(yōu)策略:檢查RoCE網(wǎng)絡(luò)擁

塞,調(diào)整交換機(jī)流控策略,優(yōu)

化網(wǎng)絡(luò)性能。訓(xùn)練監(jiān)控指標(biāo)監(jiān)控指標(biāo):訓(xùn)練loss(負(fù)荷預(yù)

測Loss<0.05,巡檢缺陷識(shí)別

mAP≥0.95)。閾值范圍:設(shè)定明確的監(jiān)控閾

值,確保模型訓(xùn)練質(zhì)量。調(diào)優(yōu)策略:調(diào)整學(xué)習(xí)率/批次

大小,必要時(shí)重啟訓(xùn)練作業(yè),

優(yōu)化訓(xùn)練過程。算力利用率監(jiān)控監(jiān)控指標(biāo):昇騰GPU利用率>

85%

,

CPU利用率<40%。閾值范圍:避免資源瓶頸,確

保高效計(jì)算資源利用。調(diào)優(yōu)策略:優(yōu)化分布式并行策

略,增加數(shù)據(jù)預(yù)處理節(jié)點(diǎn),提

升整體性能。模型精度監(jiān)控監(jiān)控指標(biāo):驗(yàn)證集誤差連續(xù)3

個(gè)epoch無下降,觸發(fā)早停機(jī)

制。閾值范圍:確保模型精度持續(xù)

提升。調(diào)優(yōu)策略:加載歷史最優(yōu)模型,

啟動(dòng)超參數(shù)搜索(貝葉斯優(yōu)化),

優(yōu)化模型性能。技術(shù)點(diǎn):量化技術(shù)(FP32→

INT8)結(jié)合知識(shí)蒸餾,優(yōu)化模型推理性能。實(shí)現(xiàn)細(xì)節(jié):采用Teacher模型(盤古大模型)進(jìn)行知識(shí)蒸餾,確保壓縮

后精度損失<2%。性能提升:

推理延遲降低50%,提升模型在邊緣設(shè)

備上的實(shí)時(shí)性。技術(shù)點(diǎn):飛騰CPU負(fù)責(zé)邏輯控制,

昇騰GPU負(fù)責(zé)計(jì)算,寒武紀(jì)NPU負(fù)

責(zé)邊緣推理。實(shí)現(xiàn)細(xì)節(jié):構(gòu)建端-邊-云協(xié)同架構(gòu),優(yōu)化資源分配和任務(wù)調(diào)度。性能提升:協(xié)同效率提升30%,

實(shí)現(xiàn)高效計(jì)算資源利用。技術(shù)點(diǎn):液冷系統(tǒng)+昇騰智能功耗控制,

優(yōu)化數(shù)據(jù)中心能耗。實(shí)現(xiàn)細(xì)節(jié):訓(xùn)練階段功耗≤25kW/節(jié)點(diǎn),推理階段≤10kW/節(jié)點(diǎn),確保

高效節(jié)能運(yùn)行。性能提升:

PUE≤1.15

,顯著降低數(shù)據(jù)中心運(yùn)營成本。技術(shù)點(diǎn):使用昇騰CANN

6.0自定義算子開發(fā),優(yōu)化GNN卷積操作。實(shí)現(xiàn)細(xì)節(jié):針對昇騰硬件特性進(jìn)行算子優(yōu)化,提升計(jì)算效率。性能提升:算子執(zhí)行效率提升40%

,顯著提高模型訓(xùn)練和推理速度。

模型調(diào)參與國產(chǎn)技術(shù)介紹

l國產(chǎn)化優(yōu)化技術(shù)第

14

頁計(jì)算層分為訓(xùn)練與推理兩個(gè)模塊,訓(xùn)練模塊負(fù)責(zé)模型訓(xùn)練與優(yōu)化,推理模塊實(shí)現(xiàn)模型實(shí)時(shí)推理與應(yīng)用,兩者協(xié)同工作,提升平臺(tái)整體性能。存儲(chǔ)層采用全閃存、分布式與歸檔存儲(chǔ)相結(jié)合的方式,滿足不同數(shù)據(jù)類型與訪問需求,確保數(shù)據(jù)存儲(chǔ)的高效性與可靠性。網(wǎng)絡(luò)層分為參數(shù)面、數(shù)據(jù)面與管理面,參數(shù)面采用RoCEv2技術(shù),數(shù)據(jù)面基于NVMeover

Fabrics,管理面實(shí)現(xiàn)集群監(jiān)控與管理,保障網(wǎng)絡(luò)通信的高效與穩(wěn)定。提供模型訓(xùn)練、服務(wù)部署和在線推理的一站式服務(wù)提供資源管理、能力一鍵發(fā)布功能,及標(biāo)準(zhǔn)化AI接口服務(wù)

智算業(yè)務(wù)架構(gòu)

l提供數(shù)據(jù)標(biāo)注、數(shù)據(jù)集管

理等一體化服務(wù)Tensorflow/Pytorch/PaddlePaddle/MindSpore/oneflow...操作系統(tǒng)(國產(chǎn)化OS)網(wǎng)絡(luò)(RDMA)智

算平臺(tái)訓(xùn)練模塊推理模塊云原生CNP平臺(tái)視頻圖像NLP語音OCRAI框架EKI并行存儲(chǔ)數(shù)據(jù)管理CPU英偉達(dá)GPU昇騰寒武紀(jì)基

礎(chǔ)設(shè)施AutoNLP單機(jī)訓(xùn)練可視化訓(xùn)練分布式訓(xùn)練訓(xùn)練作業(yè)AutoCV鏡像管理模型封裝在線推理壓縮轉(zhuǎn)換在線推理模型管理數(shù)據(jù)集管理數(shù)據(jù)標(biāo)注智能標(biāo)注人

身語

成語

擴(kuò)

展語

識(shí)

別圖

核視

防人

識(shí)

別視

析身

識(shí)

別票

據(jù)

識(shí)

別媒

轉(zhuǎn)

碼文

析輿

情監(jiān)管文

核健康碼識(shí)別第

15

頁AI能力技術(shù)特點(diǎn):支持-25℃~55℃寬溫工作,適應(yīng)戶外變電站部署。應(yīng)用場景:確保設(shè)備在極端環(huán)境下的穩(wěn)定運(yùn)行。國產(chǎn)化適配:采用國產(chǎn)散熱技術(shù),提升設(shè)備的環(huán)

境適應(yīng)性。技術(shù)特點(diǎn):訓(xùn)練節(jié)點(diǎn)雙電源冗余,推理節(jié)點(diǎn)支持熱插拔(MTTR<30分鐘)。應(yīng)用場景:保障設(shè)備的高可靠性和快速恢復(fù)能力。國產(chǎn)化適配:基于國產(chǎn)硬件設(shè)計(jì),提升系統(tǒng)的整

體可靠性。分層算力配置

推理節(jié)點(diǎn)設(shè)備型號(hào):寒武紀(jì)MLU370-X8數(shù)量:

100臺(tái)單價(jià):4萬元算力指標(biāo):8000TOPS(INT8)應(yīng)用場景:實(shí)時(shí)巡檢推理

訓(xùn)練節(jié)點(diǎn)設(shè)備型號(hào):昇騰910B-640TOPS數(shù)量:80臺(tái)單價(jià):

12萬元算力指標(biāo):51200TOPS應(yīng)用場景:大模型訓(xùn)練(負(fù)荷預(yù)測)

參數(shù)服務(wù)器設(shè)備型號(hào):海光DCU3256數(shù)量:20臺(tái)單價(jià):6萬元算力指標(biāo):64核/節(jié)點(diǎn)應(yīng)用場景:模型參數(shù)同步

邊緣節(jié)點(diǎn)設(shè)備型號(hào):浪潮NE5260M(帶NPU)數(shù)量:30臺(tái)單價(jià):4萬元算力指標(biāo):200TOPS應(yīng)用場景:變電站數(shù)據(jù)預(yù)處理計(jì)算架構(gòu)圖:采用飛騰CPU、昇騰GPU、寒武紀(jì)NPU與NVIDIA

H100構(gòu)建異構(gòu)計(jì)算架構(gòu),充分發(fā)揮各組件優(yōu)勢,滿足訓(xùn)練與推理多樣化需求。架構(gòu)圖使用Mermaid語法繪制,清晰標(biāo)注國產(chǎn)化組件(紅色標(biāo)識(shí)),突出自主可控技術(shù)在整體架構(gòu)中的應(yīng)用與重要性。硬件選型與算力集群散熱設(shè)計(jì)可靠性設(shè)計(jì)第

16

頁性能指標(biāo):熱層2000萬IOPS,

溫層500GB/s帶寬,冷層10GB/s順序讀寫,滿足不同數(shù)據(jù)存儲(chǔ)需求。存儲(chǔ)層級:熱層采用華為Dorado

8000

NVMe

SSD,溫層采用曙光ParaStor

500K

HDD,冷層采用阿里云OSS冷存儲(chǔ)。數(shù)據(jù)類型:熱層存儲(chǔ)訓(xùn)練數(shù)據(jù)集和模型Checkpoint,溫層存儲(chǔ)歷史巡檢影像和SCADA數(shù)據(jù),冷層存儲(chǔ)歸檔模型和十年期數(shù)據(jù)。熱層存儲(chǔ)產(chǎn)品:華為Dorado

8000。配置:1PB

NVMe

SSD。數(shù)據(jù)類型:訓(xùn)練數(shù)據(jù)集/模型Checkpoint。性能指標(biāo):

2000萬IOPS。應(yīng)用場景:滿足高頻訪問和快速讀寫需求。溫層存儲(chǔ)產(chǎn)品:曙光ParaStor

500K。配置:5PB

HDD。數(shù)據(jù)類型:歷史巡檢影像/SCADA數(shù)據(jù)。性能指標(biāo):

500GB/s帶寬。應(yīng)用場景:存儲(chǔ)中等訪問頻率的數(shù)據(jù)。冷層存儲(chǔ)產(chǎn)品:阿里云OSS冷存儲(chǔ)。配置:10PB對象存儲(chǔ)。數(shù)據(jù)類型:歸檔模型/十年期數(shù)據(jù)。性能指標(biāo):

10GB/s順序讀寫。應(yīng)用場景:長期數(shù)據(jù)歸檔和備份。全閃存存儲(chǔ)華為Dorado8000全閃存存儲(chǔ),滿足高頻讀寫需求

,為模型訓(xùn)練與推理提供高效存儲(chǔ)支持。全閃存存儲(chǔ)具備高可靠性和低延遲特性,結(jié)合智能緩存技術(shù),進(jìn)一步提升數(shù)據(jù)訪問速度與存儲(chǔ)性能。分布式存儲(chǔ)曙光ParaStor500K分布式存儲(chǔ),滿足大規(guī)模數(shù)據(jù)存儲(chǔ)與并行訪問需求,保障數(shù)據(jù)存儲(chǔ)的可擴(kuò)展性與靈活性。分布式存儲(chǔ)采用多副本機(jī)制,確保數(shù)據(jù)可靠性與安全性,結(jié)合智能調(diào)度算法,優(yōu)化存儲(chǔ)資源利用率,降低存儲(chǔ)成本。存儲(chǔ)架構(gòu)存儲(chǔ)方案第

17

頁數(shù)據(jù)策略分布式統(tǒng)一存儲(chǔ)全閃池混閃池NFS全面存儲(chǔ)協(xié)議支持NFS、SMB、

POSIX、S3、iSCSI智能化數(shù)據(jù)管理冷熱數(shù)據(jù)流動(dòng)、多中心數(shù)據(jù)同步、故障自動(dòng)處理靈活配置和部署方式多協(xié)議共節(jié)點(diǎn)部署、獨(dú)立節(jié)點(diǎn)部署可靠的安全保障部件→節(jié)點(diǎn)→集群→機(jī)柜冗余保護(hù)磁盤管理系統(tǒng)(OBS)WebUI管理高性能并行文件存儲(chǔ)角色域管理協(xié)議管理應(yīng)用協(xié)議數(shù)據(jù)處理基礎(chǔ)

件數(shù)據(jù)保護(hù)緩存管理網(wǎng)絡(luò)通信數(shù)據(jù)管理HDFSiSCSIS3POSIXFTPCIFSHDFS第

18

頁對象文件對象塊文件GPU訓(xùn)練服務(wù)器GPU訓(xùn)練服務(wù)器基礎(chǔ)大模型訓(xùn)&推理…Node-1Node-12Node-n數(shù)據(jù)并行熱溫冷智能分級

跨域數(shù)據(jù)災(zāi)備

智能分級容量層全域數(shù)據(jù)管理數(shù)據(jù)安全可信1全域數(shù)據(jù)管理2多協(xié)議融合互通3動(dòng)態(tài)混合負(fù)載

向量存儲(chǔ)加速4性能層

動(dòng)態(tài)混合負(fù)載高性能全場景加速,

E2ETCO降15%

兼顧高帶寬&高I/O數(shù)據(jù)全生命周期管理性能層&容量層配合,同兼顧高性能

和大容量訴求,實(shí)現(xiàn)高性價(jià)比運(yùn)行安全穩(wěn)定可靠系統(tǒng)穩(wěn)定運(yùn)行,數(shù)據(jù)安全可靠,高價(jià)值數(shù)據(jù)持久守護(hù)…NAS協(xié)議/S3協(xié)議小文件、高IO

高性能并行文件存儲(chǔ)方案

lGPU推理服務(wù)器行業(yè)模型訓(xùn)推一體化CPU1CPU2GPU1GPU2GPU推理服務(wù)器GPU3GPU4預(yù)處理服務(wù)器l

格式標(biāo)準(zhǔn)化l

錯(cuò)誤糾正l

異常數(shù)據(jù)清理l

重復(fù)數(shù)據(jù)清除流程階段

計(jì)算處理流程

數(shù)據(jù)處理流程多協(xié)議融合互通全業(yè)務(wù)演進(jìn),生態(tài)前景無憂全流程協(xié)同,數(shù)據(jù)零拷貝模

型加

載向

量讀

取向量庫

訓(xùn)練集數(shù)據(jù)

索引數(shù)據(jù)業(yè)務(wù)數(shù)據(jù)向量庫模型訓(xùn)練原始數(shù)據(jù)+訓(xùn)練+調(diào)優(yōu)+評估-》模型三方收集、

、邊緣匯聚…網(wǎng)絡(luò)爬取數(shù)據(jù)獲取原始數(shù)據(jù)推理應(yīng)用輸入數(shù)據(jù)+模型->Vector->應(yīng)用邊緣存儲(chǔ)數(shù)據(jù)預(yù)處理原始數(shù)據(jù)->訓(xùn)練數(shù)據(jù)脫敏、合規(guī)、審批、匯聚NAS協(xié)議

HDFS協(xié)議第

19

頁邊緣存儲(chǔ)高

層大

量層圖POSIXPOSIX張

量并行l(wèi)混

儲(chǔ)

2

*

100

G

R

DMA

損網(wǎng)

聯(lián)leaf;l全閃采

2

*

100

G

R

DMA

速無

損網(wǎng)

卡上聯(lián),

2

*

25

GE

聯(lián)存儲(chǔ)交換機(jī)并接入存儲(chǔ)小核心供昇騰

910

B

使用

。l對

儲(chǔ)

負(fù)

設(shè)

4

*

10

GE

聯(lián)

業(yè)務(wù)交換機(jī)

。l并行文件存儲(chǔ)管理

網(wǎng)采用兩口千兆網(wǎng)

卡上聯(lián)至管理交換

機(jī)

。l對象存儲(chǔ)管理網(wǎng)采用千兆管理網(wǎng)

。...全閃并行文件存儲(chǔ)...混閃并行文件存儲(chǔ)SpineLeaf

...對象存儲(chǔ)四層負(fù)載均衡并行文件存儲(chǔ)及對象存儲(chǔ)組網(wǎng)架構(gòu)設(shè)計(jì)說明存儲(chǔ)接入交

換機(jī)(10GE)存儲(chǔ)接入交

換(25GE)......管理接入交換機(jī)存儲(chǔ)核心第

20

頁大模型網(wǎng)絡(luò)架構(gòu)網(wǎng)絡(luò)平面:參數(shù)面采用RoCEv2,數(shù)據(jù)面采用NVMeover

Fabrics,邊緣接入采用5G+工業(yè)WiFi。設(shè)備型號(hào):參數(shù)面使用邁絡(luò)思SN3700,數(shù)據(jù)面使用曙光RDMA網(wǎng)關(guān),邊緣接入使用華為AP7060。性能指標(biāo):參數(shù)面200G/<5μs,數(shù)據(jù)面100GB/s,邊緣接入1Gbps,確保高效數(shù)據(jù)傳輸。技術(shù):

RoCE

v2。設(shè)備型號(hào):邁絡(luò)思SN3700。性能指標(biāo):帶寬200G,延遲<

5μs。核心功能:模型并行訓(xùn)練參數(shù)同步,確保高效分布式訓(xùn)練。技術(shù):

NVMe

over

Fabrics。設(shè)備型號(hào):曙光RDMA網(wǎng)關(guān)。性能指標(biāo):帶寬100GB/s。核心功能:訓(xùn)練數(shù)據(jù)高速讀取,提升數(shù)據(jù)傳輸效率。技術(shù):

5G+工業(yè)WiFi。設(shè)備型號(hào):華為AP7060。性能指標(biāo):帶寬1Gbps。核心功能:無人機(jī)/傳感器數(shù)據(jù)回傳,滿足邊緣設(shè)備的數(shù)據(jù)傳輸需求。易擴(kuò)展2層vs

3層全盒vs框盒零丟包包

包無收斂vs逐級收斂->無收斂大帶寬vs2*25G->8*200/400G參數(shù)面優(yōu)化數(shù)據(jù)面優(yōu)化邊緣接入優(yōu)化智算中心高速網(wǎng)絡(luò)特點(diǎn)可少量丟

0丟網(wǎng)絡(luò)方案第

21

頁/

AI計(jì)算服務(wù)器

Leaf

AI參數(shù)面網(wǎng)絡(luò)AI計(jì)算區(qū)

Spine網(wǎng)絡(luò)帶寬200G400G樣本面存儲(chǔ)網(wǎng)絡(luò)存儲(chǔ)節(jié)點(diǎn)分布式存儲(chǔ)區(qū)存儲(chǔ)節(jié)點(diǎn)業(yè)務(wù)/存儲(chǔ)面網(wǎng)絡(luò)AI計(jì)算節(jié)點(diǎn)管理區(qū)通算業(yè)務(wù)面網(wǎng)絡(luò)通用服務(wù)器通用計(jì)算區(qū)Core核心區(qū)ETH/IP網(wǎng)絡(luò)架構(gòu)

主要包括AI智算集群、RDMA無損網(wǎng)絡(luò)、通用計(jì)算集群、高性能存儲(chǔ)集群等。帶內(nèi)管

理管理接入TOR管理節(jié)點(diǎn)智算數(shù)據(jù)中心—高速無損網(wǎng)絡(luò)架構(gòu)帶外管理雪雪各服務(wù)器BMC接入RoCE/IBRoCE/IB第

22

頁Fat-Tree架構(gòu)管理匯聚交換機(jī)方案設(shè)計(jì)說明:1、AI計(jì)算集群:AI計(jì)算集群間采用4*200GB

RDMA網(wǎng)

絡(luò)

,滿足高帶寬低時(shí)延通信需求;各節(jié)點(diǎn)同時(shí)通過25G網(wǎng)卡接入上聯(lián)裸金屬TOR并接入業(yè)務(wù)核心交換機(jī)。2、

HPC計(jì)算節(jié)點(diǎn):采用100GB

RDMA網(wǎng)絡(luò)搭建超算集群

,各節(jié)點(diǎn)同時(shí)通過10G網(wǎng)卡接入上聯(lián)業(yè)務(wù)TOR

,再上聯(lián)

接入存儲(chǔ)核心交換機(jī)。3、通用計(jì)算區(qū):各服務(wù)器通過25G網(wǎng)卡接入上聯(lián)計(jì)算

TOR

,為租戶提供云主機(jī)、塊存儲(chǔ)等產(chǎn)品。4、高性能存儲(chǔ):

通過100G網(wǎng)絡(luò)組成并行文件存儲(chǔ)集群,提供給超算及智算集群使用。5、SDN網(wǎng)絡(luò)區(qū):提供SDN設(shè)備

,實(shí)現(xiàn)VxLAN封裝/解封裝

,完成Overlay與Underlay切換。6、網(wǎng)絡(luò)互聯(lián)區(qū):

由管理核心、業(yè)務(wù)核心、存儲(chǔ)核心及匯聚交換機(jī)組成

,用于南北向以及東西向流量。7、管理區(qū):提供帶外和帶內(nèi)管理

,帶外通過1個(gè)GE網(wǎng)卡

接入IPMI交換機(jī)

,帶內(nèi)通過10GE接入管理TOR。8、

出口區(qū):配置公網(wǎng)出口、專線接入以及運(yùn)維專線等網(wǎng)絡(luò)

,滿足公網(wǎng)用戶、校內(nèi)用戶以及運(yùn)維人員接入需求。SDN防火墻AI計(jì)算集群

裸金屬TOR計(jì)算TORSDN管控業(yè)務(wù)TOR...高性能存儲(chǔ)節(jié)點(diǎn)

...RoCE交換機(jī)集群高速網(wǎng)絡(luò)網(wǎng)絡(luò)互聯(lián)區(qū)

業(yè)務(wù)核心交換機(jī)業(yè)務(wù)匯聚交換機(jī)高性能防火墻存儲(chǔ)核心交換機(jī)管理區(qū)帶內(nèi)管理帶外管理管理接入TOR各服務(wù)器BMC接入SDN網(wǎng)絡(luò)區(qū)SLBSDN網(wǎng)關(guān)圖

200GE——100GE40GE25GE10GE

GEironic...管理節(jié)點(diǎn)

運(yùn)維專網(wǎng)八智算網(wǎng)絡(luò)拓?fù)鋵>€接入公網(wǎng)接入通用計(jì)算節(jié)點(diǎn)第

23

頁HPC節(jié)點(diǎn)專線接入

交換機(jī)*2管理匯聚交換機(jī)接入路由器*2并行文件存儲(chǔ)Spine交換機(jī)leaf交換機(jī)leaf交換機(jī)存儲(chǔ)TOR宿主機(jī)...……整套網(wǎng)絡(luò)分為超高速計(jì)算網(wǎng)絡(luò)和業(yè)務(wù)網(wǎng)絡(luò)

、

管理網(wǎng)絡(luò)三部分

。

超算節(jié)點(diǎn)

、

智算節(jié)點(diǎn)以及并行文件存儲(chǔ)均采用超高速網(wǎng)絡(luò)

。Fat-Tree(胖樹)結(jié)構(gòu)l成熟的

Infiniband拓?fù)浣Y(jié)構(gòu)l可靈活配置為非阻塞線速或

1/N線速l容易保障網(wǎng)絡(luò)延遲和帶寬性能l規(guī)模越大,網(wǎng)絡(luò)成本增加越快管理匯聚交換機(jī)10GE管理接入交換

機(jī)/千兆IPMI交換機(jī)IB交換機(jī):40端口非阻塞管理HDR

200Gb/s

InfiniBand智能交換機(jī)100Gb匯聚交換機(jī)25Gb接入交換機(jī)智算網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)思路SpineLeaf網(wǎng)絡(luò)架構(gòu)超高速計(jì)算網(wǎng)絡(luò)管理/監(jiān)控網(wǎng)絡(luò)業(yè)務(wù)網(wǎng)絡(luò)第

24

頁……設(shè)計(jì)說明l

通用宿主機(jī)通過4

*

25GE

(含計(jì)

算、

儲(chǔ)網(wǎng)

聯(lián)

計(jì)

TOR;l

SD

N

管控節(jié)點(diǎn)2

*

25

GE

上聯(lián)至

計(jì)算TOR;l

ironic

務(wù)

和DHCP節(jié)點(diǎn)2

*

25GE上聯(lián)計(jì)算TOR

,2

*

25GE上

聯(lián)至

屬TOR;l

塊存儲(chǔ)節(jié)點(diǎn)采用4

*

25GE

上聯(lián)至

計(jì)算TOR;l塊

儲(chǔ)

網(wǎng)

,

其余

管理網(wǎng)采用兩口萬兆網(wǎng)卡上聯(lián)

至管理交換機(jī)。...

ironic&DHCP...

SDN管控

...塊存儲(chǔ)通算—組網(wǎng)架構(gòu)管理接入交換機(jī)(10GE)裸金屬TOR(25GE)計(jì)算TOR(25GE)通用宿主機(jī)計(jì)算核心第

25

頁...業(yè)務(wù)節(jié)點(diǎn)底層基于裸金屬

,

單獨(dú)配置管理節(jié)

點(diǎn)

(管理域

臺(tái)

,

另配

置超算裸金屬管理節(jié)點(diǎn)

。

每臺(tái)裸金屬均支持V

PC+

高速無損網(wǎng)絡(luò)

。

通過2

*

25

GE

上聯(lián)至裸

金屬TOR,

作為業(yè)務(wù)網(wǎng)絡(luò)。

...

圖形渲染集群...AI計(jì)算節(jié)點(diǎn)SpineLeaf裸金屬管理節(jié)點(diǎn)*2臺(tái)計(jì)算核心*2

設(shè)計(jì)說明智算—組網(wǎng)架構(gòu)裸金屬接入交換機(jī)(25GE)接入交換機(jī)(25GE)......第

26

頁...以物理機(jī)形態(tài)提供

,

上層部署超

算平臺(tái)

,由超算平臺(tái)統(tǒng)一管理集群間

單口1

00G

R

DMA

高速

無損網(wǎng)絡(luò)互聯(lián)

,

業(yè)務(wù)采用萬兆雙

網(wǎng)口上聯(lián)業(yè)務(wù)交換機(jī)

,

業(yè)務(wù)交換

機(jī)上聯(lián)存儲(chǔ)小核心。...SpineLeaf超算管理節(jié)點(diǎn)設(shè)計(jì)說明超算—組網(wǎng)架構(gòu)管理和監(jiān)控接入

交換機(jī)(10GE)......存儲(chǔ)核心*2第

27

數(shù)據(jù)安全

模型安全

物理安全

MindSpore驗(yàn)證組件:

MindSpore。認(rèn)證:模型遷移測試。測試結(jié)果:

TensorFlow模型遷移成功率95%

,適配國產(chǎn)深度學(xué)習(xí)框架。措施:國密SM4加密+數(shù)據(jù)分級(生產(chǎn)數(shù)據(jù)禁止出境)。標(biāo)準(zhǔn)符合:符合《電力監(jiān)控系統(tǒng)安全防護(hù)規(guī)定》,確保數(shù)據(jù)安全。技術(shù)細(xì)節(jié):對敏感數(shù)據(jù)進(jìn)行加密處理,嚴(yán)格控制數(shù)據(jù)訪問權(quán)限。措施:訓(xùn)練數(shù)據(jù)溯源+模型水?。ǚ来鄹模?。標(biāo)準(zhǔn)符合:滿足等保三級+電力行業(yè)信創(chuàng)要求。技術(shù)細(xì)節(jié):對模型進(jìn)行水印標(biāo)記,防止模型被篡改和非法使用。措施:訓(xùn)練中心部署于電網(wǎng)自有園區(qū)。標(biāo)準(zhǔn)符合:符合GB50174-2017A級標(biāo)準(zhǔn)。技術(shù)細(xì)節(jié):確保數(shù)據(jù)中心的物理環(huán)境安全,防止外部干擾和破壞。組件:昇騰910B。認(rèn)證:電力工業(yè)環(huán)境適應(yīng)性測試。測試結(jié)果:

-40℃~70℃穩(wěn)定運(yùn)行,滿足電力行業(yè)惡劣環(huán)境需求。組件:麒麟OS。認(rèn)證:電力業(yè)務(wù)系統(tǒng)兼容性測試。測試結(jié)果:適配SCADA/EMS系統(tǒng),確

保操作系統(tǒng)與電力業(yè)務(wù)系統(tǒng)的兼容性。國密SM4加密等保三級認(rèn)證電力監(jiān)控系統(tǒng)防護(hù)昇騰/寒武紀(jì)工業(yè)環(huán)境測試

昇騰910B驗(yàn)證

麒麟OS適配SCADA系統(tǒng)

麒麟OS驗(yàn)證

注:優(yōu)先啟動(dòng)POC測試,驗(yàn)證技術(shù)方案可行性與國產(chǎn)化適配性,為后續(xù)項(xiàng)目實(shí)施積累經(jīng)驗(yàn),降低項(xiàng)目風(fēng)險(xiǎn)。{合規(guī)性

國產(chǎn)化驗(yàn)證清單安全架構(gòu)設(shè)計(jì)安全架構(gòu)第

28

實(shí)施路徑規(guī)劃

l

29

頁三階段投資計(jì)劃一期階段目標(biāo):上線巡檢/負(fù)荷預(yù)測模型。投資:

3500萬元。國產(chǎn)化率:

75%。核心設(shè)備:昇騰910B×

50+全閃存存儲(chǔ)。周期:

6個(gè)月。POC階段目標(biāo):驗(yàn)證大模型可行性。投資:

800萬元。國產(chǎn)化率:

60%。核心設(shè)備:昇騰910B×

10+MLU370

×20。周期:

3個(gè)月。二期階段目標(biāo):全場景大模型覆蓋。投資:

6000萬元。國產(chǎn)化率:

90%。核心設(shè)備:寒武紀(jì)MLU590

×

100+液冷系

統(tǒng)。周期:

12個(gè)月。任務(wù):數(shù)據(jù)與模型準(zhǔn)備,搭建電力多源數(shù)據(jù)湖。技術(shù)細(xì)節(jié):整合電力PMS、

GIS、

SCADA等

多源數(shù)據(jù),構(gòu)建數(shù)據(jù)湖基礎(chǔ)架構(gòu)。成果:完成數(shù)據(jù)湖搭建,為后續(xù)模型訓(xùn)練提供

數(shù)據(jù)支持。任務(wù):核心應(yīng)用上線,完成等保三級測評。技術(shù)細(xì)節(jié):上線輸電線路智能巡檢和電力負(fù)荷

預(yù)測模型,確保系統(tǒng)安全合規(guī)。成果:核心應(yīng)用上線運(yùn)行,提升電網(wǎng)智能化水

平。任務(wù):全場景擴(kuò)展,實(shí)現(xiàn)國產(chǎn)算力主導(dǎo)。技術(shù)細(xì)節(jié):擴(kuò)展至智能客服、新能源并網(wǎng)優(yōu)化

等全場景應(yīng)用,提升系統(tǒng)整體性能。成果:實(shí)現(xiàn)全場景大模型覆蓋,構(gòu)建自主可控

的電力智算中心。理由:

POC測試可以快速驗(yàn)證項(xiàng)目的關(guān)鍵技術(shù)和應(yīng)用場景,為后續(xù)大規(guī)模建設(shè)提供經(jīng)驗(yàn)。建議:申請省級新基建專項(xiàng)債,優(yōu)先啟動(dòng)POC測試,驗(yàn)證項(xiàng)目可行性和技術(shù)優(yōu)勢02

03012方案架構(gòu)設(shè)計(jì)3典型案例4主流智算平臺(tái)介紹5

項(xiàng)目優(yōu)勢1行業(yè)發(fā)展分析CONTENTS收集并整理數(shù)據(jù):收集現(xiàn)有的客服對話數(shù)據(jù)、客戶行為數(shù)據(jù)等,

用于訓(xùn)練AI模型;

對數(shù)據(jù)進(jìn)行清洗、標(biāo)注等預(yù)處理工作,確保數(shù)據(jù)的

質(zhì)量和一致性;

模型構(gòu)建:基于深度學(xué)習(xí)算法和大規(guī)模數(shù)據(jù),

構(gòu)建政務(wù)大模型,

包括自然語言處理模型、數(shù)據(jù)分析模型等;訓(xùn)練AI模

型:使用預(yù)處理后的數(shù)據(jù)訓(xùn)練AI模型,不斷調(diào)整模型參數(shù)和算法,提高模型的識(shí)別率和準(zhǔn)確率;

對模型進(jìn)行多輪訓(xùn)練和驗(yàn)證,確保模

型能夠滿足企業(yè)的實(shí)際需求數(shù)據(jù)收集與預(yù)處理(數(shù)據(jù)增強(qiáng)與清

洗):①

從政務(wù)系統(tǒng)中收集相關(guān)的文本、

圖像、時(shí)間序列等數(shù)據(jù);②

使用Python(Pandas、

NumPy等庫)進(jìn)行數(shù)據(jù)清洗與增強(qiáng)(去噪、去重、

標(biāo)注、格式化、數(shù)據(jù)隨機(jī)

變換等)、預(yù)處理和特征工程。將處理后的數(shù)據(jù)存儲(chǔ)在關(guān)系型數(shù)

據(jù)庫(結(jié)構(gòu)化MySQL/Oracle)

或非關(guān)系型(

MongoDB/Redis);③

根據(jù)任務(wù)需求提取特征,如文本

的詞向量表示、圖像的像素值等。政務(wù)信息化大模型模型選擇與訓(xùn)練:①

使用TensorFlow/PyTorch等深度學(xué)習(xí)框架構(gòu)建和訓(xùn)練自然語言處理模型、數(shù)據(jù)分析模型,如BERT用于文本處理,CNN或RNN用于圖像或時(shí)間序列數(shù)據(jù)分析;②

使用預(yù)處理后的數(shù)據(jù)進(jìn)行模型訓(xùn)練,調(diào)整模型參數(shù)以優(yōu)化性能,

利用GPU加速,提高訓(xùn)練效率;③

對訓(xùn)練好的模型進(jìn)行評估,如使用準(zhǔn)確率、召回率等指標(biāo)衡量模型性能。將訓(xùn)練好的模型保存到

模型倉庫中,供后續(xù)推理使用。推理服務(wù)部署:①

優(yōu)化算法(如Adam、Adagrad等)對模型的參數(shù)進(jìn)行優(yōu)化,設(shè)計(jì)易于使用應(yīng)用程序接口(API)以調(diào)

用AIGC模型;②

將模型部署到服務(wù)器,用Web開

發(fā)框架(

Django、

Flask構(gòu)建文本生成應(yīng)用)或圖形處理框架(OpenCV、

Pillow構(gòu)建圖像生成應(yīng)用);③

對輸入的數(shù)據(jù)進(jìn)行預(yù)處理,然后

通過接口調(diào)用模型進(jìn)行推理(訓(xùn)

練好的模型加載在內(nèi)存中);④

推理結(jié)果格式化返回前端展示層前端界面開發(fā):①

根據(jù)需求使用Vue.js、

React等

前端框架構(gòu)建用戶界面,如政務(wù)

服務(wù)查詢頁面、政策解讀頁面等;②

使用前端框架構(gòu)建頁面結(jié)構(gòu),通

過Ajax或Fetch等技術(shù)調(diào)用推理

服務(wù)接口,獲取推理結(jié)果并展示

在前端頁面上;③

調(diào)用推理服務(wù)接口提供用戶交互功能獲取推理結(jié)果,并在頁面上

展示給用戶(文本/圖像)。

政務(wù)信息化大模型框架

l1.數(shù)據(jù)增強(qiáng)可以通過對現(xiàn)有數(shù)據(jù)進(jìn)行隨機(jī)變換(如文本數(shù)據(jù)的同義詞替換、圖像數(shù)據(jù)的旋轉(zhuǎn)縮放等)來增加數(shù)據(jù)的多樣性2.AIGC

主流的模型架構(gòu):Transformer

架構(gòu)(用于自然語言處理和部分圖像生成任務(wù))

通過自注意力機(jī)制處理長序列數(shù)據(jù)、生成對抗網(wǎng)絡(luò)(GAN,主要用于圖像和視頻生成)3.模型訓(xùn)練:無監(jiān)督學(xué)習(xí)算法(無標(biāo)簽)

、半監(jiān)督學(xué)習(xí)算法(輔以標(biāo)注手段)

、監(jiān)督學(xué)習(xí)(標(biāo)簽)、強(qiáng)化學(xué)習(xí)(智能體agent根據(jù)獎(jiǎng)勵(lì)信號(hào)來更新策略)數(shù)據(jù)處理層模型訓(xùn)練層推理服務(wù)層前端展示層采用Python作為主要編程語言,結(jié)合深度學(xué)習(xí)框架(如TensorFlow、

PyTorch等Python的庫)和Web開發(fā)框架(如Django、

Flask等)來實(shí)現(xiàn)數(shù)據(jù)準(zhǔn)備與模型

訓(xùn)練第

31

運(yùn)維接入

\

外網(wǎng)接入

\接入路由器*2接入路由器*2n基于云技術(shù)底座進(jìn)行建設(shè)

,為XX大學(xué)提供包含通用計(jì)算、超算節(jié)

點(diǎn)

,智算節(jié)點(diǎn)、并行文件存儲(chǔ)

,安全及運(yùn)維服務(wù);n超算配置2路通用節(jié)點(diǎn)、4路胖節(jié)點(diǎn)

,智算配置A800、昇騰910B、

曙光Z100L等;n提供超700PFLOPS算力

,高速網(wǎng)絡(luò)采用800Gbps帶寬

,高性能文

件存儲(chǔ)超過9PB。項(xiàng)目背景XX大學(xué)現(xiàn)有高性能計(jì)算集群為數(shù)十個(gè)中小型集群,各集群由科研團(tuán)隊(duì)自管,存在部分服務(wù)器裸硬件沒有集群化,算力較為分散。缺乏校級平臺(tái)統(tǒng)一管理全校資源,單項(xiàng)目無法一次性調(diào)用大批量資源,成果產(chǎn)出效率和速度低。為實(shí)現(xiàn)高效的科研及教學(xué),計(jì)劃建設(shè)一套高

效、安全、可靠的智算超算專屬云平臺(tái)。(1)實(shí)現(xiàn)算力統(tǒng)一門戶。將超算能力與智算能力結(jié)合,實(shí)現(xiàn)數(shù)據(jù)模型訓(xùn)

練到模型推理及驗(yàn)證的無縫銜接。(2)AI智算集群、超算集群、高速網(wǎng)絡(luò)

,組建高效科研環(huán)境。有效提升

XX大學(xué)科研水平

,助力雙一流建設(shè)。某高校HPC&AI數(shù)據(jù)中心項(xiàng)目方案價(jià)值建設(shè)方案第

32

超強(qiáng)算存能力:GPU浮點(diǎn)運(yùn)算能力達(dá)到每秒億億次級別

,通用算力超22000核

,百G

RoCE無損網(wǎng)絡(luò)最大化提升AI調(diào)度能力,

全閃型存儲(chǔ)NVME

SSD

,配備高階安全產(chǎn)

,滿足雙智城市更高級別計(jì)算及安全需

求;

海量數(shù)據(jù)分析:提供上層應(yīng)用所需的海量計(jì)算、存儲(chǔ)資源

,滿足車路協(xié)同場景海量數(shù)

據(jù)統(tǒng)一匯聚

,數(shù)據(jù)分析、應(yīng)用與創(chuàng)新;

等保合規(guī):

通過公安部等保三級認(rèn)證

,滿足客戶數(shù)據(jù)本地存放的安全管控需求。云主機(jī)GPU容器云存儲(chǔ)數(shù)據(jù)庫云安全彈性擴(kuò)縮容

渲染、訓(xùn)練、推理智算中心專屬云基礎(chǔ)設(shè)施(服務(wù)器、網(wǎng)絡(luò)設(shè)備、安全設(shè)備)V2X車載設(shè)備OBUCPU算力:33000

vCPUGPU算力:訓(xùn)練算力約15PFLOPS

(FP16)

,推理算力約56.7PFLOPS(INT8)

,渲染算力約703TFLOPS

(

FP32)高性能存儲(chǔ):

15PBK8S調(diào)度高性能讀寫高并發(fā)大連接

自主可控云車路協(xié)同

車城網(wǎng)

全息路口路口智能管控

數(shù)據(jù)共享交換智能運(yùn)維管理

……

某區(qū)智算中心項(xiàng)目日志管理

仿真管理存儲(chǔ)管理

……

自動(dòng)駕駛仿真評測輔助決策子系統(tǒng)車城協(xié)同精細(xì)感知上層

應(yīng)

用路

側(cè)

設(shè)

備云底

座第

33

頁1行業(yè)發(fā)展分析

2方案架構(gòu)設(shè)計(jì)

3典型案例

4主流智算平臺(tái)介紹5

項(xiàng)目優(yōu)勢CONTENTS文檔輿情文本身份票據(jù)健康碼語音語音語音人臉人臉圖像視頻媒體視頻解析監(jiān)管審核識(shí)別識(shí)別識(shí)別

識(shí)別擴(kuò)展合成識(shí)別核身審核解析轉(zhuǎn)碼安防NLP

OCR語音

圖像

視頻AI統(tǒng)一算法倉:行業(yè)匯聚、百花齊放單卡訓(xùn)練多卡訓(xùn)練數(shù)據(jù)標(biāo)注基于公有云技術(shù)底座能力

,

聯(lián)合九天共同構(gòu)建智算平臺(tái),

提供從數(shù)據(jù)處理

模型訓(xùn)練到推理應(yīng)用的

AI

發(fā)

務(wù)

,

為大模型

、

數(shù)

、

智能質(zhì)檢

、

智能客服等

AI

應(yīng)

發(fā)

環(huán)

、

工具和平臺(tái),

助力人工智能技術(shù)與應(yīng)用場景的深度融合。公有云技術(shù)底座智算軟件平臺(tái)九天智算大模型方案總體架構(gòu)自動(dòng)建模分布式訓(xùn)練數(shù)據(jù)探索硬件基礎(chǔ)設(shè)施九天大模型

架構(gòu)高速存儲(chǔ)集群(并行文件存儲(chǔ))高速RDMA網(wǎng)絡(luò)通用云計(jì)算集群模

型訓(xùn)練HPC計(jì)算集群推理平臺(tái)第

35

頁AI計(jì)算集群管理節(jié)點(diǎn)訓(xùn)練平臺(tái)核心功能提供簡單易用的多模態(tài)數(shù)據(jù)接入及

管理功能,預(yù)置多場景標(biāo)注工具模

板提供開放靈活的交互式集成開發(fā)環(huán)

境,預(yù)置數(shù)據(jù)、基礎(chǔ)模型、計(jì)算框

架及算法提供豐富多樣的訓(xùn)練資源套餐,如

CPU、

GPU等,支持多機(jī)多卡分布

式訓(xùn)練面向各個(gè)行業(yè)智能化場景,提供全

自動(dòng)建模服務(wù)??赏瓿葾I流水線的

全自動(dòng)執(zhí)行九天訓(xùn)練平臺(tái)

平臺(tái)訓(xùn)練模塊提供豐富的算力資源、訓(xùn)練數(shù)據(jù)、齊全的算法框架和研發(fā)工具,支持單機(jī)和分布式等多種訓(xùn)練模式。國產(chǎn)芯片適配實(shí)現(xiàn)對華為昇騰、寒武紀(jì)MLU等異構(gòu)計(jì)算資源的算力資源調(diào)度和模型適配,集成國產(chǎn)AI芯片和算法框架,提升生態(tài)多樣性系統(tǒng)性能優(yōu)異通過多級系統(tǒng)緩存,大幅度提升小文件讀取效率。通過GPU虛擬化,大幅度提升利用率,降低使用成本高可用架構(gòu)保障基于云原生技術(shù)架構(gòu),平臺(tái)具備容災(zāi)自愈、彈性伸縮、負(fù)載均衡、灰度發(fā)布等高可用特性多機(jī)多卡分布式訓(xùn)練針對大模型訓(xùn)練時(shí)間長、效率低的痛點(diǎn),實(shí)現(xiàn)基于數(shù)據(jù)并行的多機(jī)多卡分布式訓(xùn)練九天智算平臺(tái):訓(xùn)練平臺(tái)模型訓(xùn)練自動(dòng)建模數(shù)據(jù)處理模型開發(fā)第

36

頁平臺(tái)架構(gòu)支持AI模型云邊協(xié)同部署和更新

,

納管邊緣資源

,提供云上應(yīng)用延申

到邊緣的能力支持模型實(shí)時(shí)、

邊緣推理多場景的

服務(wù)部署

,支持通過上傳鏡像自定

義部署服務(wù)支持運(yùn)行推理服務(wù)過程中的指標(biāo)監(jiān)

控、

彈性擴(kuò)容等管理操作

,實(shí)現(xiàn)運(yùn)

行數(shù)據(jù)可視化支持多框架模型的統(tǒng)一納管

,支持

將本地已訓(xùn)練好的模型導(dǎo)入到平臺(tái)

上進(jìn)行模型納管模型部署模型推理云邊協(xié)同超高并發(fā)量彈性高可用,服務(wù)毫秒級響應(yīng);

超高并發(fā)量可達(dá)到4600次/秒超高吞吐量體系化AI標(biāo)準(zhǔn)化部署,使用TensorRT加速和動(dòng)態(tài)Batch優(yōu)化提升服務(wù)吞吐量高性能推理業(yè)界領(lǐng)先模型加速與壓縮算法,適配多種硬件、多框架的高性能模型推理九天推理模塊沉淀優(yōu)秀共性的AI能力,研發(fā)測試雙環(huán)境保障服務(wù)低成本遷移,可靈活組合形成復(fù)合AI能力,提升AI應(yīng)用的開發(fā)和部署效率。

九天智算平臺(tái):

推理模塊

l高效部署模式產(chǎn)研雙軌自由部署切換,云邊端協(xié)同部署,自有AI模型和成熟AI能力靈活組合部署核心功能模型管理第

37

頁建模中心

數(shù)據(jù)探索數(shù)據(jù)處理特征工程模型訓(xùn)練智算平臺(tái)基于大數(shù)據(jù)特征分析、業(yè)務(wù)智能算子、AutoML、AutoCV等核心能力,提供結(jié)構(gòu)化數(shù)據(jù)一站式建模服務(wù),降低AI技術(shù)門檻,實(shí)現(xiàn)模型治理和模型全生命周期管理。模型九天基礎(chǔ)設(shè)施云原生算法框架CPU/GPU

ASIC

AI

分布式存儲(chǔ)數(shù)據(jù)應(yīng)用零代碼全流程可視化面向廣泛領(lǐng)域,提供低門檻、零代碼的建模工具,實(shí)現(xiàn)流程化、可復(fù)用、可追溯高精度AI自動(dòng)化開發(fā)將業(yè)界最新模型和技術(shù)固化形成CV、NLP算法庫,沉淀行業(yè)典型場景預(yù)置模型端到端AI應(yīng)用支持一鍵發(fā)布為API在線服務(wù)、或下載成為SDK,靈活適配各種運(yùn)行環(huán)境九天智算平臺(tái):

自動(dòng)可視化建模家寬推薦結(jié)果預(yù)測…采購優(yōu)化財(cái)務(wù)稽核九天自動(dòng)建模描述性分析預(yù)測性分析決策性分析診斷分析閉環(huán)服務(wù)探索性分析

模型應(yīng)用推理部署特征編碼特征相關(guān)性模型可視化超參自動(dòng)調(diào)優(yōu)時(shí)序/地域分析特征分析本地?cái)?shù)據(jù)公有云數(shù)據(jù)空值處理數(shù)據(jù)轉(zhuǎn)換權(quán)限管理日志監(jiān)控實(shí)驗(yàn)分享特征衍生統(tǒng)計(jì)分析特征選擇算法組件聚類分析模型驗(yàn)證應(yīng)用任務(wù)調(diào)度計(jì)費(fèi)管理數(shù)據(jù)中心異常處理類型定義平臺(tái)架構(gòu)第

38

頁運(yùn)營平臺(tái)智能應(yīng)用開發(fā)通用AI訓(xùn)練平臺(tái)大模型訓(xùn)練平臺(tái)工具鏈場景大模型行業(yè)大模型星火基礎(chǔ)大模型數(shù)據(jù)處理平臺(tái) 數(shù)據(jù)預(yù)處理

數(shù)據(jù)標(biāo)注基于公有云技術(shù)底座能力,

聯(lián)合科大訊飛共同構(gòu)建超算智算平臺(tái)

本方案架構(gòu)主要包括底層算力集群

、

臺(tái)

。

運(yùn)

、

高校

、

業(yè)

體,

AI

訓(xùn)練

、

業(yè)

訓(xùn)練及推理

開發(fā)服務(wù)為一體的通用人工智能

AI

+

算力

的綜合解決方案

。智管平臺(tái) 異構(gòu)計(jì)算多租戶/資源隔離

令open

Euier

ca

NhN星火版

操作系統(tǒng)

異構(gòu)計(jì)算框架公有云技術(shù)底座軟件平臺(tái)智運(yùn)智訓(xùn)智管訊飛智算大模型方案總體架構(gòu)硬件基礎(chǔ)設(shè)施高速存儲(chǔ)集群(并行文件存儲(chǔ))推理服務(wù)運(yùn)營管理高速RDMA網(wǎng)絡(luò)AI計(jì)算集群訊飛大模型

架構(gòu)HPC計(jì)算集群通用云計(jì)算集群數(shù)據(jù)接入預(yù)制框架預(yù)制算法預(yù)制模型異構(gòu)模型轉(zhuǎn)換管理節(jié)點(diǎn)異構(gòu)訓(xùn)練框架評測第

39

頁資源調(diào)度異構(gòu)芯片

訊飛星火大模型平臺(tái):為用戶提供一站式服務(wù)

l核心效果全面領(lǐng)先源頭支持中英文多語種,在多項(xiàng)測評任務(wù)效果優(yōu)秀,標(biāo)準(zhǔn)大模型

通用性更強(qiáng),行業(yè)大模型更專業(yè)面向業(yè)務(wù)開箱即用提供豐富的基礎(chǔ)提示資源包,涵蓋20余個(gè)專業(yè)場景,即開即用多個(gè)行業(yè)大模型

覆蓋全行業(yè)多個(gè)行業(yè)大模型可選,針對不同場景使用你專屬的行業(yè)助手多平臺(tái)支持全信創(chuàng)配置支持多種平臺(tái)切換,并面向信創(chuàng)平臺(tái)做了深度優(yōu)化政務(wù)大模型公文大模型

數(shù)學(xué)能力

多模態(tài)能力

知識(shí)問答

邏輯推理

文本生成

語言理解

星火大模型代碼

大模型

代碼能力第

40

頁大模型認(rèn)知大模型通用大模型行業(yè)大模型定制大模型大模型托管

服務(wù)治理資源監(jiān)控配置管理資源調(diào)度日志管理

訊飛星火大模型平臺(tái):功能完備的開發(fā)平臺(tái) 工作流編排組件管理節(jié)點(diǎn)配置

服務(wù)調(diào)試原生組件對話流對話流編輯Prompt節(jié)點(diǎn)話術(shù)配置變量和標(biāo)簽管理對話測試畫布編輯自定義組件腳本組件接口組件知識(shí)搜索關(guān)鍵詞召回知識(shí)發(fā)布增刪改查word解析

pdf解析知識(shí)表達(dá)知識(shí)檢索知識(shí)庫管理知識(shí)采集知識(shí)問答向量召回知識(shí)樹文檔切片OCR識(shí)別

表格解析插件注冊激活定義安全定義函數(shù)定義插件庫計(jì)算插件知識(shí)插件工具插件輸出組件文件存儲(chǔ)郵件輸出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論