版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
智算中心暨電力大模型創(chuàng)新平臺(tái)解決方案智算?超算1行業(yè)發(fā)展分析4主流智算平臺(tái)介紹2
方案架構(gòu)設(shè)計(jì)3
典型案例CONTENTS智算中心是以GPU、
AI加速卡[1]
等智能算力為核心、
集約化建設(shè)的新型算力基礎(chǔ)設(shè)施,提供軟硬件全棧環(huán)境,主要承載模型訓(xùn)練以及適合中心推理、多媒體渲染等業(yè)務(wù),支撐各行業(yè)數(shù)智化轉(zhuǎn)型升級具有較強(qiáng)的普適性,可服務(wù)于toB/toC適合有智能化轉(zhuǎn)型需求行業(yè),如自動(dòng)駕駛、智慧城市,toB為主專用性強(qiáng),主要面向地球物理、分子力學(xué)等基礎(chǔ)學(xué)科以及軍工研究注[1]:行業(yè)中GPU是一個(gè)較為泛化的概念,從功能角度劃分,GPU特指具備圖形渲染能力的硬件,AI加速卡特指用于AI推理或訓(xùn)練的硬件。本材料主要針對AI加速卡進(jìn)行分析
TaaS是指TensorFlow
asa
Service,深度學(xué)習(xí)平臺(tái)及行業(yè)大數(shù)據(jù)解決方案智算中心定義建設(shè)目的應(yīng)用領(lǐng)域主要特征?
專用ASIC芯片為主?
為大規(guī)??茖W(xué)計(jì)算任務(wù)提供支撐服務(wù)帶動(dòng)政府治理及各行各業(yè)數(shù)智化轉(zhuǎn)型升
級,促進(jìn)產(chǎn)業(yè)AI化、AI產(chǎn)業(yè)化促進(jìn)信息服務(wù)業(yè)云化轉(zhuǎn)型,通過資源共享及彈性發(fā)放,供用戶按需使用資源?CPU通用算力為主?
提供IaaS、PaaS、SaaS級服務(wù)3.算力、數(shù)據(jù)、算法的融合平臺(tái)4.以產(chǎn)業(yè)創(chuàng)新升級為目標(biāo)?GPU智能算力為主?
提供TaaS任務(wù)式服務(wù)1.算力公共基礎(chǔ)設(shè)施2.計(jì)算架構(gòu)技術(shù)領(lǐng)先算力的幾種形態(tài)
超算中心
智算中心
云計(jì)算中心
提升國家及地方科研創(chuàng)新能力第
3
頁美國:以保持國家競爭力為目的,最先發(fā)展智能超算中心,具備單體算力大、科研實(shí)驗(yàn)室居多國內(nèi):近兩年已有30+城市建成或在建設(shè)智算中心,總體投資規(guī)模超千億,旨在帶動(dòng)當(dāng)?shù)禺a(chǎn)業(yè)智能化升級參AI領(lǐng)域的競爭是未來世界領(lǐng)導(dǎo)權(quán)的競爭NSF基礎(chǔ)科研520億美元?jiǎng)?chuàng)新與技術(shù)局290億美元關(guān)鍵技術(shù)研發(fā)169億美元應(yīng)對AI的機(jī)遇和挑戰(zhàn),爭取主動(dòng)權(quán)數(shù)字領(lǐng)域
人工智能領(lǐng)域計(jì)算基礎(chǔ)設(shè)施1500億歐元200億歐元
96億歐元 推動(dòng)智能計(jì)算中心有序發(fā)展,打造智能算力、通用算法和開發(fā)平臺(tái)一體化的新型智能基礎(chǔ)設(shè)施國家新一代人工智能
創(chuàng)新發(fā)展試驗(yàn)區(qū)建設(shè)試驗(yàn)區(qū)國家人工智能
創(chuàng)新應(yīng)用先導(dǎo)區(qū)夯實(shí)技術(shù)人工智能基礎(chǔ)設(shè)施示范工程投資補(bǔ)貼全球:數(shù)據(jù)的高速增長帶來AI算力需求激增,到2030年,AI算力需求增長約390倍來源:羅蘭貝格國內(nèi):我國智算增長迅速,智算占比從2021年的51%躍升為2023年的70%來源:中國信通院《中國算力發(fā)展指數(shù)白皮書(2022)》政策加持國內(nèi)外提前布局,智能算力需求激增各國政府布局AI領(lǐng)域全棧能力,并出資引導(dǎo)智能算力基礎(chǔ)設(shè)施建設(shè),
AI智能算力增速遠(yuǎn)超摩爾定律智算中心主要由國家政府總體牽頭建設(shè),同時(shí)基礎(chǔ)設(shè)施提供商積極參與l
2022年11月30日,OpenAI的對話式AI大模型ChatGPT橫空出世,月活破億僅用時(shí)兩月,成為史上增長最快的消費(fèi)類應(yīng)用
,展現(xiàn)出解放人類生產(chǎn)力的驚人潛質(zhì)l
微軟作為OpenAI第一批投資者,通過優(yōu)先使用該技術(shù)贏得先機(jī),并將ChagGPT與旗下所有產(chǎn)品(Bing、Office、Azure)進(jìn)行整合
,加速了ChatGPT商業(yè)化路徑智算增長趨勢智算中心布局政策驅(qū)動(dòng)行業(yè)發(fā)展情況第
4
頁結(jié)合行業(yè)發(fā)展報(bào)告
,
12個(gè)重點(diǎn)場景有較大AI算力需求及發(fā)展空間,工業(yè)仿真
AR/VR高清視頻/影視渲染數(shù)智人形象渲染市場成熟度
★★★★整體空間
★★★★根技術(shù):渲染數(shù)字孿生3D交互/自然交互3D立體視頻
數(shù)字虛擬人物理世界三維建模圖像渲染市場成熟度★整體空間
★★★★★根技術(shù):CV+NLP+語音+多模態(tài)+渲染...智能語音問答
智能網(wǎng)聯(lián)汽車視覺感知決策分析
車路協(xié)同L4-L5級自動(dòng)駕駛預(yù)測預(yù)警市場成熟度
★★整體空間
★★
★★
★根技術(shù):CV+NLP+語音+決策智慧制造智慧安防
智慧交通智慧農(nóng)林
智慧物流
智慧政務(wù)
自然災(zāi)害應(yīng)急管理
資源環(huán)境治理市場成熟度
★★
★
★
★整體空間
★★
★
★
★根技術(shù):CV+NLP+語音+決策藥物研發(fā)氣候預(yù)測石油勘探市場成熟度
整體空間分子動(dòng)力學(xué)天氣預(yù)報(bào)材料科學(xué)★
★★
★
★
★根技術(shù):HPC+AI跨模態(tài)大模型藥物模型自動(dòng)駕駛大模型
金融模型網(wǎng)絡(luò)智能化模型市場成熟度整體空間★
★
★
★★★★★★根技術(shù):CV+NLP+語音+多模態(tài)...CT/MRI影像分析疾病輔助診斷與早期篩查蛋白質(zhì)結(jié)構(gòu)預(yù)測新藥研發(fā)市場成熟度
★★整體空間
★★★★根技術(shù):CV+NLP網(wǎng)絡(luò)故障診斷及預(yù)測智能決策智慧業(yè)務(wù)辦理市場成熟度
★★★★整體空間
★★★★根技術(shù):NLP+語音+決策智算中心典型需求場景智慧電網(wǎng)智慧油田遙感測繪新聞、視頻、購物
App內(nèi)容推薦金融、通信、物流
客服風(fēng)險(xiǎn)分析精準(zhǔn)營銷AI主要應(yīng)用場景多媒體渲染模型訓(xùn)練智慧醫(yī)療自動(dòng)駕駛智慧運(yùn)營科研應(yīng)用AI+視頻元宇宙智能客服推薦智慧金融智慧能源第
5
頁l
場景:
利用無人機(jī)搭載高清攝像
頭采集輸電線路影像,
通過視覺大模型識(shí)別線路缺陷。l
應(yīng)用價(jià)值:
實(shí)現(xiàn)缺陷自動(dòng)識(shí)別
,準(zhǔn)確率≥99%
,減少人工巡檢工作
量,
提升巡檢效率和安全性
。
國
產(chǎn)
化
適
配
:
采
用
昇
騰GPU+MindSpore
視覺框架
,
適配國產(chǎn)硬件和深度學(xué)習(xí)平臺(tái)。l
場景:
基于歷史負(fù)荷數(shù)據(jù)
、氣象
數(shù)據(jù)和電網(wǎng)拓?fù)浣Y(jié)構(gòu)
,預(yù)測未來短期和中長期電力負(fù)荷。l
應(yīng)用價(jià)值:
短期負(fù)荷預(yù)測誤差<
3%,
中長期<
5%,
助力電網(wǎng)調(diào)
度優(yōu)化,
降低運(yùn)營成本
。
國產(chǎn)化
適配:
使用華為云盤古電力預(yù)訓(xùn)
練模型
,基于MindSpore框架開
發(fā)
,適配國產(chǎn)云服務(wù)。l
場景:通過自然語言處理技術(shù)理解用戶咨詢和報(bào)修工單
,實(shí)現(xiàn)自動(dòng)回復(fù)和工單分類。l
應(yīng)用價(jià)值:
自然語言理解工單,
響應(yīng)效率提升50%
,改善用戶體驗(yàn)
,
提高客服工作效率。
國產(chǎn)化適配:
采用寒武紀(jì)NPU推理+中文預(yù)訓(xùn)練
模型
,適配國產(chǎn)推理芯片和語言模型。
主流場景及需求
智能客服與工單處理電力負(fù)荷預(yù)測輸電線路智能巡檢電力行業(yè)核心場景與價(jià)值第
6
頁數(shù)據(jù)孤島問題模型泛化差問題新能源并網(wǎng)優(yōu)化?
問題描述:電網(wǎng)
PMS
、GIS、
SCADA等系統(tǒng)數(shù)據(jù)
分散
,難以整合利用。?
解決方案:大模型整合多源數(shù)據(jù)
,打破數(shù)據(jù)孤島,實(shí)現(xiàn)數(shù)據(jù)共享和協(xié)同分析。?
國產(chǎn)化適配:使用國產(chǎn)數(shù)
據(jù)接口和數(shù)據(jù)治理平臺(tái)
,
如南瑞繼保IEC61850協(xié)
議適配器。?
問題描述:光伏、風(fēng)電出
力預(yù)測不準(zhǔn)確,導(dǎo)致棄電
率高,影響新能源消納。?解決方案:科學(xué)計(jì)算大模
型聯(lián)合仿真,光伏/風(fēng)電出
力預(yù)測精度提升,棄電率
降低8%。?
國產(chǎn)化適配:采用國產(chǎn)CAE軟件與大模型聯(lián)合仿
真,適配新能源并網(wǎng)優(yōu)化
需求。?
問題描述:通用大模型在電力領(lǐng)域適配性差
,難以滿足特定場景需求。?
解決方案:電力領(lǐng)域預(yù)訓(xùn)練模型(如華能“
電盤古
”)提升場景適配性
,優(yōu)化模型性能。?國產(chǎn)化適配:基于國產(chǎn)深度學(xué)
習(xí)框架和預(yù)訓(xùn)練模型
,適配電力行業(yè)應(yīng)用場景。電力行業(yè)核心場景與價(jià)值第
7
頁超算中心融合管理子系統(tǒng)(包含統(tǒng)一門戶)高速網(wǎng)絡(luò)交換子系統(tǒng)通用CPU算力子系統(tǒng)GPU智算子系統(tǒng)
HPC超算子系統(tǒng)全閃存存儲(chǔ)子系統(tǒng)高性能文件存儲(chǔ)子系統(tǒng)
超算智算中心系統(tǒng)組成
第
8頁
典型超算智算中心核心系統(tǒng)單元包含通用計(jì)算子系統(tǒng)、智能計(jì)算(AI)
子系統(tǒng)和高性能計(jì)算(HPC)
子系統(tǒng)。l
超算計(jì)算節(jié)點(diǎn)和智能計(jì)算節(jié)點(diǎn)分別通過IB/RoCE網(wǎng)絡(luò)等高速網(wǎng)絡(luò)交換子系統(tǒng)進(jìn)行高速互連;l
集成多層次、
多協(xié)議、
多種數(shù)據(jù)保護(hù)模式的全閃存存儲(chǔ)系統(tǒng)和高性能并行文件存儲(chǔ)系統(tǒng)
,
以及配套的信
息安全子系統(tǒng)和超算中心融合管理子系統(tǒng)。典型超算數(shù)據(jù)中心架構(gòu)信息安全子系統(tǒng)
1.
對外連接網(wǎng)絡(luò)(網(wǎng)絡(luò)出口層)分為CMNeT、云專網(wǎng)、
IP專網(wǎng)1.CMNeT:用于公眾用戶訪問智算中心2.云專網(wǎng):用于智算中心間互聯(lián)、訓(xùn)推互聯(lián)3.
IP專網(wǎng):用于遠(yuǎn)程管理2.
內(nèi)部互聯(lián)網(wǎng)絡(luò)分為業(yè)務(wù)/存儲(chǔ)網(wǎng)絡(luò)、管理網(wǎng)絡(luò)、參數(shù)面網(wǎng)絡(luò)、數(shù)據(jù)面網(wǎng)絡(luò)1.業(yè)務(wù)/存儲(chǔ)網(wǎng)絡(luò):業(yè)務(wù)網(wǎng)絡(luò)用于互聯(lián)網(wǎng)用戶訪問智算/通算等資源,存儲(chǔ)網(wǎng)絡(luò)用于調(diào)用共享存儲(chǔ)資源2.管理網(wǎng)絡(luò):主要包括業(yè)務(wù)管理(K8S平臺(tái)、安全管理系統(tǒng)
等)和
IPMI3.參數(shù)面網(wǎng)絡(luò):采用RoCE/IB實(shí)現(xiàn)集群內(nèi)所有AI加速卡的高速互聯(lián)4.數(shù)據(jù)面網(wǎng)絡(luò):采用RoCE實(shí)現(xiàn)智算集群與高性能文件存儲(chǔ)
的高速互聯(lián)智算中心組網(wǎng)分業(yè)務(wù)/存儲(chǔ)、管理、參數(shù)面、數(shù)據(jù)面四個(gè)網(wǎng)絡(luò)平面,與通算相比,智算組網(wǎng)新增參數(shù)面網(wǎng)絡(luò)及數(shù)據(jù)面網(wǎng)絡(luò),采用RoCE全連接無損組網(wǎng),充分發(fā)揮智算并行計(jì)算優(yōu)勢,同時(shí)組網(wǎng)整體無容災(zāi)設(shè)計(jì),對運(yùn)維工作帶來新的挑戰(zhàn)。
智算中心架構(gòu)與通算有較大區(qū)別
l第
9
頁2方案架構(gòu)設(shè)計(jì)3典型案例4主流智算平臺(tái)介紹5
項(xiàng)目優(yōu)勢1行業(yè)發(fā)展分析CONTENTS強(qiáng)電系統(tǒng)弱電系統(tǒng)不間斷電源系統(tǒng)
制冷系統(tǒng)監(jiān)控系統(tǒng)消防系統(tǒng)機(jī)房工程管理節(jié)點(diǎn)AI計(jì)算集群HPC計(jì)算集群通用云計(jì)算集群高速存儲(chǔ)集群(并行文件存儲(chǔ))高速RDMA網(wǎng)絡(luò)統(tǒng)一運(yùn)營管理平臺(tái)服務(wù)目錄項(xiàng)目管理用戶管理配額管理計(jì)費(fèi)管理總覽視圖權(quán)限管理規(guī)格定價(jià)操作日志
總體方案架構(gòu)
l人工智能平臺(tái)數(shù)據(jù)處理
模型開發(fā)
模型訓(xùn)練
自動(dòng)建模模型部署
模型推理
模型管理模型監(jiān)控主要包括AI智算集群、超算集群、高速網(wǎng)絡(luò)、通用計(jì)算集群、高性能存儲(chǔ)集群、安全中心、云管平臺(tái)、運(yùn)維平臺(tái)等。平臺(tái)安全運(yùn)
維監(jiān)控
平
臺(tái)云主機(jī)
裸金屬鏡像服務(wù)
對象存儲(chǔ)硬件基
礎(chǔ)設(shè)施基建基礎(chǔ)設(shè)施應(yīng)用中心自動(dòng)化部署預(yù)置算法框架:PyTorch、Tensorflow、PaddlePaddle...集成開發(fā)環(huán)境:Jupyter
Lab、
VSCode作業(yè)管理編譯器調(diào)度策略數(shù)據(jù)管理資源監(jiān)控并行環(huán)境軟件基礎(chǔ)設(shè)施云硬盤VPC高性能計(jì)算平臺(tái)方案架構(gòu)通用算力平臺(tái)第
11
頁云技術(shù)底座基礎(chǔ)模型:
華為云盤古電力大模型
(行業(yè)定制版)
,
基于MindSpore框架開發(fā)。模型類型:時(shí)
序Transformer+圖
神經(jīng)網(wǎng)絡(luò)(GNN)
融合架構(gòu)
,適配
電網(wǎng)拓?fù)浣Y(jié)構(gòu)。國產(chǎn)化適配:支持昇騰910B算子優(yōu)
化
,
提升模型在國產(chǎn)硬件上的運(yùn)行
效率。參數(shù)量:
130億參數(shù)(含電力領(lǐng)域
知識(shí)注入)
,通過昇騰CANN工具
壓縮至80億參數(shù)(壓縮率38%)
。優(yōu)化策略:采用量化技術(shù)(FP32→
INT8)
結(jié)合知識(shí)蒸餾
,推
理延遲降低50%
,精度損失<
2%。
國產(chǎn)化適配:使用昇騰CANN工具
進(jìn)行模型壓縮
,適配國產(chǎn)硬件和開
發(fā)平臺(tái)。輸入特征:歷史負(fù)荷數(shù)據(jù)(1440維
時(shí)序)
+氣象數(shù)據(jù)(溫度/濕度等20
維)
+電網(wǎng)拓?fù)涮卣鳎ㄠ徑泳仃嚕?/p>
。
輸出結(jié)果:未來15分鐘-7天負(fù)荷
預(yù)測值
,分時(shí)段精度要求:短期<
3%
,
中期<
5%。國產(chǎn)化適配:數(shù)據(jù)預(yù)處理組件采用
飛槳PaddlePaddle
,適配國產(chǎn)數(shù)
據(jù)處理框架。數(shù)據(jù)清洗與增強(qiáng)清洗規(guī)則:剔除異常值(3σ原則)
、填補(bǔ)
缺失值(線性插值)
、
歸一化(Min-
Max縮放至[-
1,1])
。增強(qiáng)策略:時(shí)序數(shù)據(jù)采用時(shí)間窗口滑動(dòng)
(窗口大小24*60分鐘)
;影像數(shù)據(jù)采用
旋轉(zhuǎn)/翻轉(zhuǎn)/噪聲注入。工具/平臺(tái):昇騰AI開發(fā)平臺(tái)(ModelArts)
數(shù)據(jù)增強(qiáng)模塊
,提升數(shù)據(jù)質(zhì)量。數(shù)據(jù)采集與接口數(shù)據(jù)采集:從SCADA系統(tǒng)抽取分鐘級負(fù)荷
數(shù)據(jù)
,分辨率1分鐘;無人機(jī)影像分辨率
≥4K。技術(shù)細(xì)節(jié):采用國產(chǎn)化數(shù)據(jù)接口(南瑞繼
保IEC61850協(xié)議適配器)
,確保數(shù)據(jù)采集
的穩(wěn)定性和兼容性。工具/平臺(tái):使用華為云DataArts數(shù)據(jù)治理
平臺(tái)
,進(jìn)行數(shù)據(jù)的清洗和預(yù)處理。基礎(chǔ)模型與架構(gòu)參數(shù)量與優(yōu)化輸入輸出設(shè)計(jì)模型架構(gòu)參數(shù)數(shù)據(jù)集劃分劃分比例:訓(xùn)練集:驗(yàn)證集:測試集
=7:2:1
,
按時(shí)間順序劃分
,避免未來信息泄露。技術(shù)細(xì)節(jié):自主研發(fā)電力數(shù)據(jù)劃分工具(Python實(shí)現(xiàn)),確保數(shù)據(jù)劃分的合理性
和科學(xué)性。工具/平臺(tái):使用Python編程語言實(shí)現(xiàn)數(shù)
據(jù)集劃分
,適配電力行業(yè)數(shù)據(jù)特點(diǎn)。數(shù)據(jù)預(yù)處理參數(shù)
基座模型選型及預(yù)訓(xùn)練參數(shù)
l第
12
頁1.數(shù)據(jù)預(yù)處理?數(shù)據(jù)清洗、標(biāo)準(zhǔn)化及特征工程2.模型訓(xùn)練?輸入:標(biāo)準(zhǔn)化后的數(shù)據(jù)集?昇騰集群分布式計(jì)算:?多節(jié)點(diǎn)并行計(jì)算梯度?參數(shù)服務(wù)器架構(gòu)更新模型參數(shù)?節(jié)點(diǎn)間同步最新參數(shù)?驗(yàn)證評估:?定期計(jì)算預(yù)測誤差?反饋調(diào)優(yōu)信號(hào)指導(dǎo)模型優(yōu)化3.模型壓縮?將FP32轉(zhuǎn)換為INT8量化推理模型?優(yōu)化模型體積和計(jì)算效率4.邊緣部署?推送INT8模型至變電站NPU節(jié)點(diǎn)?完成邊緣側(cè)模型部署學(xué)習(xí)率策略:初始學(xué)習(xí)率1e-4,余弦退火衰減(周期200epoch),動(dòng)態(tài)調(diào)整學(xué)習(xí)率。訓(xùn)練時(shí)長:單卡訓(xùn)練約120小時(shí),集群訓(xùn)練約15小時(shí),線性加速比
8.5倍,顯著提升訓(xùn)練效率。技術(shù)細(xì)節(jié):采用梯度累積(累積4批次更新一次參數(shù))
,優(yōu)化訓(xùn)練
過程。硬件配置:昇騰910B
×8/節(jié)點(diǎn),RoCE
v2網(wǎng)絡(luò)(帶寬200Gbps),構(gòu)建高效分布式訓(xùn)練環(huán)境??蚣軆?yōu)化:自動(dòng)并行策略(數(shù)據(jù)并行+模型并行混合),
提升分布
式訓(xùn)練性能。優(yōu)化器選擇:分布式優(yōu)化器(Horovod+昇騰通信庫),
優(yōu)化梯度
同步和參數(shù)更新。硬件配置:昇騰910B
×
1(640TOPS
,
32GB
HBM),
適配單機(jī)訓(xùn)練需求??蚣苓x擇:
MindSpore
2.2(靜態(tài)圖模式),
優(yōu)化訓(xùn)練效率。批次大?。簳r(shí)序數(shù)據(jù)2048樣本/批,
影像數(shù)據(jù)32樣本/批,適配不同
數(shù)據(jù)類型。技術(shù)細(xì)節(jié):
NPU
(寒武紀(jì)MLU370)專用于電力行業(yè)
AI推理,如設(shè)備缺陷識(shí)別、實(shí)時(shí)告警。架構(gòu)描述:
構(gòu)建異構(gòu)計(jì)算架構(gòu),涵蓋國產(chǎn)CPU、
GPU、
NPU及國際GPU
,滿足不同計(jì)算需求。國產(chǎn)化適配:
優(yōu)先采用國產(chǎn)計(jì)算設(shè)備,提升整體架構(gòu)
的自主可控性。
預(yù)訓(xùn)練配置與訓(xùn)練流程
l典型訓(xùn)練流程時(shí)序圖單機(jī)訓(xùn)練配置分布式訓(xùn)練配置訓(xùn)練效率提升訓(xùn)練配置參數(shù)模型部署數(shù)據(jù)收集
清洗標(biāo)注模型訓(xùn)練模型壓縮第
13
頁監(jiān)控
與
調(diào)
優(yōu)
參
數(shù)Q網(wǎng)絡(luò)時(shí)延監(jiān)控監(jiān)控指標(biāo):參數(shù)同步時(shí)延<
10ms
(分布式訓(xùn)練)。閾值范圍:確保分布式訓(xùn)練的
高效同步。調(diào)優(yōu)策略:檢查RoCE網(wǎng)絡(luò)擁
塞,調(diào)整交換機(jī)流控策略,優(yōu)
化網(wǎng)絡(luò)性能。訓(xùn)練監(jiān)控指標(biāo)監(jiān)控指標(biāo):訓(xùn)練loss(負(fù)荷預(yù)
測Loss<0.05,巡檢缺陷識(shí)別
mAP≥0.95)。閾值范圍:設(shè)定明確的監(jiān)控閾
值,確保模型訓(xùn)練質(zhì)量。調(diào)優(yōu)策略:調(diào)整學(xué)習(xí)率/批次
大小,必要時(shí)重啟訓(xùn)練作業(yè),
優(yōu)化訓(xùn)練過程。算力利用率監(jiān)控監(jiān)控指標(biāo):昇騰GPU利用率>
85%
,
CPU利用率<40%。閾值范圍:避免資源瓶頸,確
保高效計(jì)算資源利用。調(diào)優(yōu)策略:優(yōu)化分布式并行策
略,增加數(shù)據(jù)預(yù)處理節(jié)點(diǎn),提
升整體性能。模型精度監(jiān)控監(jiān)控指標(biāo):驗(yàn)證集誤差連續(xù)3
個(gè)epoch無下降,觸發(fā)早停機(jī)
制。閾值范圍:確保模型精度持續(xù)
提升。調(diào)優(yōu)策略:加載歷史最優(yōu)模型,
啟動(dòng)超參數(shù)搜索(貝葉斯優(yōu)化),
優(yōu)化模型性能。技術(shù)點(diǎn):量化技術(shù)(FP32→
INT8)結(jié)合知識(shí)蒸餾,優(yōu)化模型推理性能。實(shí)現(xiàn)細(xì)節(jié):采用Teacher模型(盤古大模型)進(jìn)行知識(shí)蒸餾,確保壓縮
后精度損失<2%。性能提升:
推理延遲降低50%,提升模型在邊緣設(shè)
備上的實(shí)時(shí)性。技術(shù)點(diǎn):飛騰CPU負(fù)責(zé)邏輯控制,
昇騰GPU負(fù)責(zé)計(jì)算,寒武紀(jì)NPU負(fù)
責(zé)邊緣推理。實(shí)現(xiàn)細(xì)節(jié):構(gòu)建端-邊-云協(xié)同架構(gòu),優(yōu)化資源分配和任務(wù)調(diào)度。性能提升:協(xié)同效率提升30%,
實(shí)現(xiàn)高效計(jì)算資源利用。技術(shù)點(diǎn):液冷系統(tǒng)+昇騰智能功耗控制,
優(yōu)化數(shù)據(jù)中心能耗。實(shí)現(xiàn)細(xì)節(jié):訓(xùn)練階段功耗≤25kW/節(jié)點(diǎn),推理階段≤10kW/節(jié)點(diǎn),確保
高效節(jié)能運(yùn)行。性能提升:
PUE≤1.15
,顯著降低數(shù)據(jù)中心運(yùn)營成本。技術(shù)點(diǎn):使用昇騰CANN
6.0自定義算子開發(fā),優(yōu)化GNN卷積操作。實(shí)現(xiàn)細(xì)節(jié):針對昇騰硬件特性進(jìn)行算子優(yōu)化,提升計(jì)算效率。性能提升:算子執(zhí)行效率提升40%
,顯著提高模型訓(xùn)練和推理速度。
模型調(diào)參與國產(chǎn)技術(shù)介紹
l國產(chǎn)化優(yōu)化技術(shù)第
14
頁計(jì)算層分為訓(xùn)練與推理兩個(gè)模塊,訓(xùn)練模塊負(fù)責(zé)模型訓(xùn)練與優(yōu)化,推理模塊實(shí)現(xiàn)模型實(shí)時(shí)推理與應(yīng)用,兩者協(xié)同工作,提升平臺(tái)整體性能。存儲(chǔ)層采用全閃存、分布式與歸檔存儲(chǔ)相結(jié)合的方式,滿足不同數(shù)據(jù)類型與訪問需求,確保數(shù)據(jù)存儲(chǔ)的高效性與可靠性。網(wǎng)絡(luò)層分為參數(shù)面、數(shù)據(jù)面與管理面,參數(shù)面采用RoCEv2技術(shù),數(shù)據(jù)面基于NVMeover
Fabrics,管理面實(shí)現(xiàn)集群監(jiān)控與管理,保障網(wǎng)絡(luò)通信的高效與穩(wěn)定。提供模型訓(xùn)練、服務(wù)部署和在線推理的一站式服務(wù)提供資源管理、能力一鍵發(fā)布功能,及標(biāo)準(zhǔn)化AI接口服務(wù)
智算業(yè)務(wù)架構(gòu)
l提供數(shù)據(jù)標(biāo)注、數(shù)據(jù)集管
理等一體化服務(wù)Tensorflow/Pytorch/PaddlePaddle/MindSpore/oneflow...操作系統(tǒng)(國產(chǎn)化OS)網(wǎng)絡(luò)(RDMA)智
算平臺(tái)訓(xùn)練模塊推理模塊云原生CNP平臺(tái)視頻圖像NLP語音OCRAI框架EKI并行存儲(chǔ)數(shù)據(jù)管理CPU英偉達(dá)GPU昇騰寒武紀(jì)基
礎(chǔ)設(shè)施AutoNLP單機(jī)訓(xùn)練可視化訓(xùn)練分布式訓(xùn)練訓(xùn)練作業(yè)AutoCV鏡像管理模型封裝在線推理壓縮轉(zhuǎn)換在線推理模型管理數(shù)據(jù)集管理數(shù)據(jù)標(biāo)注智能標(biāo)注人
臉
核
身語
音
合
成語
音
擴(kuò)
展語
音
識(shí)
別圖
像
審
核視
頻
安
防人
臉
識(shí)
別視
頻
解
析身
份
識(shí)
別票
據(jù)
識(shí)
別媒
體
轉(zhuǎn)
碼文
檔
解
析輿
情監(jiān)管文
本
審
核健康碼識(shí)別第
15
頁AI能力技術(shù)特點(diǎn):支持-25℃~55℃寬溫工作,適應(yīng)戶外變電站部署。應(yīng)用場景:確保設(shè)備在極端環(huán)境下的穩(wěn)定運(yùn)行。國產(chǎn)化適配:采用國產(chǎn)散熱技術(shù),提升設(shè)備的環(huán)
境適應(yīng)性。技術(shù)特點(diǎn):訓(xùn)練節(jié)點(diǎn)雙電源冗余,推理節(jié)點(diǎn)支持熱插拔(MTTR<30分鐘)。應(yīng)用場景:保障設(shè)備的高可靠性和快速恢復(fù)能力。國產(chǎn)化適配:基于國產(chǎn)硬件設(shè)計(jì),提升系統(tǒng)的整
體可靠性。分層算力配置
推理節(jié)點(diǎn)設(shè)備型號(hào):寒武紀(jì)MLU370-X8數(shù)量:
100臺(tái)單價(jià):4萬元算力指標(biāo):8000TOPS(INT8)應(yīng)用場景:實(shí)時(shí)巡檢推理
訓(xùn)練節(jié)點(diǎn)設(shè)備型號(hào):昇騰910B-640TOPS數(shù)量:80臺(tái)單價(jià):
12萬元算力指標(biāo):51200TOPS應(yīng)用場景:大模型訓(xùn)練(負(fù)荷預(yù)測)
參數(shù)服務(wù)器設(shè)備型號(hào):海光DCU3256數(shù)量:20臺(tái)單價(jià):6萬元算力指標(biāo):64核/節(jié)點(diǎn)應(yīng)用場景:模型參數(shù)同步
邊緣節(jié)點(diǎn)設(shè)備型號(hào):浪潮NE5260M(帶NPU)數(shù)量:30臺(tái)單價(jià):4萬元算力指標(biāo):200TOPS應(yīng)用場景:變電站數(shù)據(jù)預(yù)處理計(jì)算架構(gòu)圖:采用飛騰CPU、昇騰GPU、寒武紀(jì)NPU與NVIDIA
H100構(gòu)建異構(gòu)計(jì)算架構(gòu),充分發(fā)揮各組件優(yōu)勢,滿足訓(xùn)練與推理多樣化需求。架構(gòu)圖使用Mermaid語法繪制,清晰標(biāo)注國產(chǎn)化組件(紅色標(biāo)識(shí)),突出自主可控技術(shù)在整體架構(gòu)中的應(yīng)用與重要性。硬件選型與算力集群散熱設(shè)計(jì)可靠性設(shè)計(jì)第
16
頁性能指標(biāo):熱層2000萬IOPS,
溫層500GB/s帶寬,冷層10GB/s順序讀寫,滿足不同數(shù)據(jù)存儲(chǔ)需求。存儲(chǔ)層級:熱層采用華為Dorado
8000
NVMe
SSD,溫層采用曙光ParaStor
500K
HDD,冷層采用阿里云OSS冷存儲(chǔ)。數(shù)據(jù)類型:熱層存儲(chǔ)訓(xùn)練數(shù)據(jù)集和模型Checkpoint,溫層存儲(chǔ)歷史巡檢影像和SCADA數(shù)據(jù),冷層存儲(chǔ)歸檔模型和十年期數(shù)據(jù)。熱層存儲(chǔ)產(chǎn)品:華為Dorado
8000。配置:1PB
NVMe
SSD。數(shù)據(jù)類型:訓(xùn)練數(shù)據(jù)集/模型Checkpoint。性能指標(biāo):
2000萬IOPS。應(yīng)用場景:滿足高頻訪問和快速讀寫需求。溫層存儲(chǔ)產(chǎn)品:曙光ParaStor
500K。配置:5PB
HDD。數(shù)據(jù)類型:歷史巡檢影像/SCADA數(shù)據(jù)。性能指標(biāo):
500GB/s帶寬。應(yīng)用場景:存儲(chǔ)中等訪問頻率的數(shù)據(jù)。冷層存儲(chǔ)產(chǎn)品:阿里云OSS冷存儲(chǔ)。配置:10PB對象存儲(chǔ)。數(shù)據(jù)類型:歸檔模型/十年期數(shù)據(jù)。性能指標(biāo):
10GB/s順序讀寫。應(yīng)用場景:長期數(shù)據(jù)歸檔和備份。全閃存存儲(chǔ)華為Dorado8000全閃存存儲(chǔ),滿足高頻讀寫需求
,為模型訓(xùn)練與推理提供高效存儲(chǔ)支持。全閃存存儲(chǔ)具備高可靠性和低延遲特性,結(jié)合智能緩存技術(shù),進(jìn)一步提升數(shù)據(jù)訪問速度與存儲(chǔ)性能。分布式存儲(chǔ)曙光ParaStor500K分布式存儲(chǔ),滿足大規(guī)模數(shù)據(jù)存儲(chǔ)與并行訪問需求,保障數(shù)據(jù)存儲(chǔ)的可擴(kuò)展性與靈活性。分布式存儲(chǔ)采用多副本機(jī)制,確保數(shù)據(jù)可靠性與安全性,結(jié)合智能調(diào)度算法,優(yōu)化存儲(chǔ)資源利用率,降低存儲(chǔ)成本。存儲(chǔ)架構(gòu)存儲(chǔ)方案第
17
頁數(shù)據(jù)策略分布式統(tǒng)一存儲(chǔ)全閃池混閃池NFS全面存儲(chǔ)協(xié)議支持NFS、SMB、
POSIX、S3、iSCSI智能化數(shù)據(jù)管理冷熱數(shù)據(jù)流動(dòng)、多中心數(shù)據(jù)同步、故障自動(dòng)處理靈活配置和部署方式多協(xié)議共節(jié)點(diǎn)部署、獨(dú)立節(jié)點(diǎn)部署可靠的安全保障部件→節(jié)點(diǎn)→集群→機(jī)柜冗余保護(hù)磁盤管理系統(tǒng)(OBS)WebUI管理高性能并行文件存儲(chǔ)角色域管理協(xié)議管理應(yīng)用協(xié)議數(shù)據(jù)處理基礎(chǔ)
硬
件數(shù)據(jù)保護(hù)緩存管理網(wǎng)絡(luò)通信數(shù)據(jù)管理HDFSiSCSIS3POSIXFTPCIFSHDFS第
18
頁對象文件對象塊文件GPU訓(xùn)練服務(wù)器GPU訓(xùn)練服務(wù)器基礎(chǔ)大模型訓(xùn)&推理…Node-1Node-12Node-n數(shù)據(jù)并行熱溫冷智能分級
跨域數(shù)據(jù)災(zāi)備
智能分級容量層全域數(shù)據(jù)管理數(shù)據(jù)安全可信1全域數(shù)據(jù)管理2多協(xié)議融合互通3動(dòng)態(tài)混合負(fù)載
向量存儲(chǔ)加速4性能層
動(dòng)態(tài)混合負(fù)載高性能全場景加速,
E2ETCO降15%
兼顧高帶寬&高I/O數(shù)據(jù)全生命周期管理性能層&容量層配合,同兼顧高性能
和大容量訴求,實(shí)現(xiàn)高性價(jià)比運(yùn)行安全穩(wěn)定可靠系統(tǒng)穩(wěn)定運(yùn)行,數(shù)據(jù)安全可靠,高價(jià)值數(shù)據(jù)持久守護(hù)…NAS協(xié)議/S3協(xié)議小文件、高IO
高性能并行文件存儲(chǔ)方案
lGPU推理服務(wù)器行業(yè)模型訓(xùn)推一體化CPU1CPU2GPU1GPU2GPU推理服務(wù)器GPU3GPU4預(yù)處理服務(wù)器l
格式標(biāo)準(zhǔn)化l
錯(cuò)誤糾正l
異常數(shù)據(jù)清理l
重復(fù)數(shù)據(jù)清除流程階段
計(jì)算處理流程
數(shù)據(jù)處理流程多協(xié)議融合互通全業(yè)務(wù)演進(jìn),生態(tài)前景無憂全流程協(xié)同,數(shù)據(jù)零拷貝模
型加
載向
量讀
取向量庫
訓(xùn)練集數(shù)據(jù)
索引數(shù)據(jù)業(yè)務(wù)數(shù)據(jù)向量庫模型訓(xùn)練原始數(shù)據(jù)+訓(xùn)練+調(diào)優(yōu)+評估-》模型三方收集、
、邊緣匯聚…網(wǎng)絡(luò)爬取數(shù)據(jù)獲取原始數(shù)據(jù)推理應(yīng)用輸入數(shù)據(jù)+模型->Vector->應(yīng)用邊緣存儲(chǔ)數(shù)據(jù)預(yù)處理原始數(shù)據(jù)->訓(xùn)練數(shù)據(jù)脫敏、合規(guī)、審批、匯聚NAS協(xié)議
HDFS協(xié)議第
19
頁邊緣存儲(chǔ)高
性
能
層大
容
量層圖POSIXPOSIX張
量并行l(wèi)混
閃
并
行
文
件
存
儲(chǔ)
采
用
2
*
100
G
R
DMA
高
速
無
損網(wǎng)
卡
上
聯(lián)leaf;l全閃采
用
2
*
100
G
R
DMA
高
速無
損網(wǎng)
卡上聯(lián),
2
*
25
GE
上
聯(lián)存儲(chǔ)交換機(jī)并接入存儲(chǔ)小核心供昇騰
910
B
使用
。l對
象
存
儲(chǔ)
及
四
層
負(fù)
載
均
衡
設(shè)
備
均
采
用
4
*
10
GE
上
聯(lián)
至
萬
兆
業(yè)務(wù)交換機(jī)
。l并行文件存儲(chǔ)管理
網(wǎng)采用兩口千兆網(wǎng)
卡上聯(lián)至管理交換
機(jī)
。l對象存儲(chǔ)管理網(wǎng)采用千兆管理網(wǎng)
。...全閃并行文件存儲(chǔ)...混閃并行文件存儲(chǔ)SpineLeaf
...對象存儲(chǔ)四層負(fù)載均衡并行文件存儲(chǔ)及對象存儲(chǔ)組網(wǎng)架構(gòu)設(shè)計(jì)說明存儲(chǔ)接入交
換機(jī)(10GE)存儲(chǔ)接入交
換(25GE)......管理接入交換機(jī)存儲(chǔ)核心第
20
頁大模型網(wǎng)絡(luò)架構(gòu)網(wǎng)絡(luò)平面:參數(shù)面采用RoCEv2,數(shù)據(jù)面采用NVMeover
Fabrics,邊緣接入采用5G+工業(yè)WiFi。設(shè)備型號(hào):參數(shù)面使用邁絡(luò)思SN3700,數(shù)據(jù)面使用曙光RDMA網(wǎng)關(guān),邊緣接入使用華為AP7060。性能指標(biāo):參數(shù)面200G/<5μs,數(shù)據(jù)面100GB/s,邊緣接入1Gbps,確保高效數(shù)據(jù)傳輸。技術(shù):
RoCE
v2。設(shè)備型號(hào):邁絡(luò)思SN3700。性能指標(biāo):帶寬200G,延遲<
5μs。核心功能:模型并行訓(xùn)練參數(shù)同步,確保高效分布式訓(xùn)練。技術(shù):
NVMe
over
Fabrics。設(shè)備型號(hào):曙光RDMA網(wǎng)關(guān)。性能指標(biāo):帶寬100GB/s。核心功能:訓(xùn)練數(shù)據(jù)高速讀取,提升數(shù)據(jù)傳輸效率。技術(shù):
5G+工業(yè)WiFi。設(shè)備型號(hào):華為AP7060。性能指標(biāo):帶寬1Gbps。核心功能:無人機(jī)/傳感器數(shù)據(jù)回傳,滿足邊緣設(shè)備的數(shù)據(jù)傳輸需求。易擴(kuò)展2層vs
3層全盒vs框盒零丟包包
包無收斂vs逐級收斂->無收斂大帶寬vs2*25G->8*200/400G參數(shù)面優(yōu)化數(shù)據(jù)面優(yōu)化邊緣接入優(yōu)化智算中心高速網(wǎng)絡(luò)特點(diǎn)可少量丟
0丟網(wǎng)絡(luò)方案第
21
頁/
AI計(jì)算服務(wù)器
Leaf
AI參數(shù)面網(wǎng)絡(luò)AI計(jì)算區(qū)
Spine網(wǎng)絡(luò)帶寬200G400G樣本面存儲(chǔ)網(wǎng)絡(luò)存儲(chǔ)節(jié)點(diǎn)分布式存儲(chǔ)區(qū)存儲(chǔ)節(jié)點(diǎn)業(yè)務(wù)/存儲(chǔ)面網(wǎng)絡(luò)AI計(jì)算節(jié)點(diǎn)管理區(qū)通算業(yè)務(wù)面網(wǎng)絡(luò)通用服務(wù)器通用計(jì)算區(qū)Core核心區(qū)ETH/IP網(wǎng)絡(luò)架構(gòu)
主要包括AI智算集群、RDMA無損網(wǎng)絡(luò)、通用計(jì)算集群、高性能存儲(chǔ)集群等。帶內(nèi)管
理管理接入TOR管理節(jié)點(diǎn)智算數(shù)據(jù)中心—高速無損網(wǎng)絡(luò)架構(gòu)帶外管理雪雪各服務(wù)器BMC接入RoCE/IBRoCE/IB第
22
頁Fat-Tree架構(gòu)管理匯聚交換機(jī)方案設(shè)計(jì)說明:1、AI計(jì)算集群:AI計(jì)算集群間采用4*200GB
RDMA網(wǎng)
絡(luò)
,滿足高帶寬低時(shí)延通信需求;各節(jié)點(diǎn)同時(shí)通過25G網(wǎng)卡接入上聯(lián)裸金屬TOR并接入業(yè)務(wù)核心交換機(jī)。2、
HPC計(jì)算節(jié)點(diǎn):采用100GB
RDMA網(wǎng)絡(luò)搭建超算集群
,各節(jié)點(diǎn)同時(shí)通過10G網(wǎng)卡接入上聯(lián)業(yè)務(wù)TOR
,再上聯(lián)
接入存儲(chǔ)核心交換機(jī)。3、通用計(jì)算區(qū):各服務(wù)器通過25G網(wǎng)卡接入上聯(lián)計(jì)算
TOR
,為租戶提供云主機(jī)、塊存儲(chǔ)等產(chǎn)品。4、高性能存儲(chǔ):
通過100G網(wǎng)絡(luò)組成并行文件存儲(chǔ)集群,提供給超算及智算集群使用。5、SDN網(wǎng)絡(luò)區(qū):提供SDN設(shè)備
,實(shí)現(xiàn)VxLAN封裝/解封裝
,完成Overlay與Underlay切換。6、網(wǎng)絡(luò)互聯(lián)區(qū):
由管理核心、業(yè)務(wù)核心、存儲(chǔ)核心及匯聚交換機(jī)組成
,用于南北向以及東西向流量。7、管理區(qū):提供帶外和帶內(nèi)管理
,帶外通過1個(gè)GE網(wǎng)卡
接入IPMI交換機(jī)
,帶內(nèi)通過10GE接入管理TOR。8、
出口區(qū):配置公網(wǎng)出口、專線接入以及運(yùn)維專線等網(wǎng)絡(luò)
,滿足公網(wǎng)用戶、校內(nèi)用戶以及運(yùn)維人員接入需求。SDN防火墻AI計(jì)算集群
裸金屬TOR計(jì)算TORSDN管控業(yè)務(wù)TOR...高性能存儲(chǔ)節(jié)點(diǎn)
...RoCE交換機(jī)集群高速網(wǎng)絡(luò)網(wǎng)絡(luò)互聯(lián)區(qū)
業(yè)務(wù)核心交換機(jī)業(yè)務(wù)匯聚交換機(jī)高性能防火墻存儲(chǔ)核心交換機(jī)管理區(qū)帶內(nèi)管理帶外管理管理接入TOR各服務(wù)器BMC接入SDN網(wǎng)絡(luò)區(qū)SLBSDN網(wǎng)關(guān)圖
例
200GE——100GE40GE25GE10GE
GEironic...管理節(jié)點(diǎn)
運(yùn)維專網(wǎng)八智算網(wǎng)絡(luò)拓?fù)鋵>€接入公網(wǎng)接入通用計(jì)算節(jié)點(diǎn)第
23
頁HPC節(jié)點(diǎn)專線接入
交換機(jī)*2管理匯聚交換機(jī)接入路由器*2并行文件存儲(chǔ)Spine交換機(jī)leaf交換機(jī)leaf交換機(jī)存儲(chǔ)TOR宿主機(jī)...……整套網(wǎng)絡(luò)分為超高速計(jì)算網(wǎng)絡(luò)和業(yè)務(wù)網(wǎng)絡(luò)
、
管理網(wǎng)絡(luò)三部分
。
超算節(jié)點(diǎn)
、
智算節(jié)點(diǎn)以及并行文件存儲(chǔ)均采用超高速網(wǎng)絡(luò)
。Fat-Tree(胖樹)結(jié)構(gòu)l成熟的
Infiniband拓?fù)浣Y(jié)構(gòu)l可靈活配置為非阻塞線速或
1/N線速l容易保障網(wǎng)絡(luò)延遲和帶寬性能l規(guī)模越大,網(wǎng)絡(luò)成本增加越快管理匯聚交換機(jī)10GE管理接入交換
機(jī)/千兆IPMI交換機(jī)IB交換機(jī):40端口非阻塞管理HDR
200Gb/s
InfiniBand智能交換機(jī)100Gb匯聚交換機(jī)25Gb接入交換機(jī)智算網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)思路SpineLeaf網(wǎng)絡(luò)架構(gòu)超高速計(jì)算網(wǎng)絡(luò)管理/監(jiān)控網(wǎng)絡(luò)業(yè)務(wù)網(wǎng)絡(luò)第
24
頁……設(shè)計(jì)說明l
通用宿主機(jī)通過4
*
25GE
(含計(jì)
算、
存
儲(chǔ)網(wǎng)
)
上
聯(lián)
至
計(jì)
算
TOR;l
SD
N
管控節(jié)點(diǎn)2
*
25
GE
上聯(lián)至
計(jì)算TOR;l
ironic
(
裸
金
屬
服
務(wù)
)
和DHCP節(jié)點(diǎn)2
*
25GE上聯(lián)計(jì)算TOR
,2
*
25GE上
聯(lián)至
裸
金
屬TOR;l
塊存儲(chǔ)節(jié)點(diǎn)采用4
*
25GE
上聯(lián)至
計(jì)算TOR;l塊
存
儲(chǔ)
采
用
千
兆
管
理
網(wǎng)
,
其余
管理網(wǎng)采用兩口萬兆網(wǎng)卡上聯(lián)
至管理交換機(jī)。...
ironic&DHCP...
SDN管控
...塊存儲(chǔ)通算—組網(wǎng)架構(gòu)管理接入交換機(jī)(10GE)裸金屬TOR(25GE)計(jì)算TOR(25GE)通用宿主機(jī)計(jì)算核心第
25
頁...業(yè)務(wù)節(jié)點(diǎn)底層基于裸金屬
,
單獨(dú)配置管理節(jié)
點(diǎn)
(管理域
)
用
于
部
署
智
算
管
理
平
臺(tái)
,
另配
置超算裸金屬管理節(jié)點(diǎn)
。
每臺(tái)裸金屬均支持V
PC+
高速無損網(wǎng)絡(luò)
。
通過2
*
25
GE
上聯(lián)至裸
金屬TOR,
作為業(yè)務(wù)網(wǎng)絡(luò)。
...
圖形渲染集群...AI計(jì)算節(jié)點(diǎn)SpineLeaf裸金屬管理節(jié)點(diǎn)*2臺(tái)計(jì)算核心*2
設(shè)計(jì)說明智算—組網(wǎng)架構(gòu)裸金屬接入交換機(jī)(25GE)接入交換機(jī)(25GE)......第
26
頁...以物理機(jī)形態(tài)提供
,
上層部署超
算平臺(tái)
,由超算平臺(tái)統(tǒng)一管理集群間
采
用
單口1
00G
R
DMA
高速
無損網(wǎng)絡(luò)互聯(lián)
,
業(yè)務(wù)采用萬兆雙
網(wǎng)口上聯(lián)業(yè)務(wù)交換機(jī)
,
業(yè)務(wù)交換
機(jī)上聯(lián)存儲(chǔ)小核心。...SpineLeaf超算管理節(jié)點(diǎn)設(shè)計(jì)說明超算—組網(wǎng)架構(gòu)管理和監(jiān)控接入
交換機(jī)(10GE)......存儲(chǔ)核心*2第
27
頁
數(shù)據(jù)安全
模型安全
物理安全
MindSpore驗(yàn)證組件:
MindSpore。認(rèn)證:模型遷移測試。測試結(jié)果:
TensorFlow模型遷移成功率95%
,適配國產(chǎn)深度學(xué)習(xí)框架。措施:國密SM4加密+數(shù)據(jù)分級(生產(chǎn)數(shù)據(jù)禁止出境)。標(biāo)準(zhǔn)符合:符合《電力監(jiān)控系統(tǒng)安全防護(hù)規(guī)定》,確保數(shù)據(jù)安全。技術(shù)細(xì)節(jié):對敏感數(shù)據(jù)進(jìn)行加密處理,嚴(yán)格控制數(shù)據(jù)訪問權(quán)限。措施:訓(xùn)練數(shù)據(jù)溯源+模型水?。ǚ来鄹模?。標(biāo)準(zhǔn)符合:滿足等保三級+電力行業(yè)信創(chuàng)要求。技術(shù)細(xì)節(jié):對模型進(jìn)行水印標(biāo)記,防止模型被篡改和非法使用。措施:訓(xùn)練中心部署于電網(wǎng)自有園區(qū)。標(biāo)準(zhǔn)符合:符合GB50174-2017A級標(biāo)準(zhǔn)。技術(shù)細(xì)節(jié):確保數(shù)據(jù)中心的物理環(huán)境安全,防止外部干擾和破壞。組件:昇騰910B。認(rèn)證:電力工業(yè)環(huán)境適應(yīng)性測試。測試結(jié)果:
-40℃~70℃穩(wěn)定運(yùn)行,滿足電力行業(yè)惡劣環(huán)境需求。組件:麒麟OS。認(rèn)證:電力業(yè)務(wù)系統(tǒng)兼容性測試。測試結(jié)果:適配SCADA/EMS系統(tǒng),確
保操作系統(tǒng)與電力業(yè)務(wù)系統(tǒng)的兼容性。國密SM4加密等保三級認(rèn)證電力監(jiān)控系統(tǒng)防護(hù)昇騰/寒武紀(jì)工業(yè)環(huán)境測試
昇騰910B驗(yàn)證
麒麟OS適配SCADA系統(tǒng)
麒麟OS驗(yàn)證
注:優(yōu)先啟動(dòng)POC測試,驗(yàn)證技術(shù)方案可行性與國產(chǎn)化適配性,為后續(xù)項(xiàng)目實(shí)施積累經(jīng)驗(yàn),降低項(xiàng)目風(fēng)險(xiǎn)。{合規(guī)性
國產(chǎn)化驗(yàn)證清單安全架構(gòu)設(shè)計(jì)安全架構(gòu)第
28
頁
實(shí)施路徑規(guī)劃
l
第
29
頁三階段投資計(jì)劃一期階段目標(biāo):上線巡檢/負(fù)荷預(yù)測模型。投資:
3500萬元。國產(chǎn)化率:
75%。核心設(shè)備:昇騰910B×
50+全閃存存儲(chǔ)。周期:
6個(gè)月。POC階段目標(biāo):驗(yàn)證大模型可行性。投資:
800萬元。國產(chǎn)化率:
60%。核心設(shè)備:昇騰910B×
10+MLU370
×20。周期:
3個(gè)月。二期階段目標(biāo):全場景大模型覆蓋。投資:
6000萬元。國產(chǎn)化率:
90%。核心設(shè)備:寒武紀(jì)MLU590
×
100+液冷系
統(tǒng)。周期:
12個(gè)月。任務(wù):數(shù)據(jù)與模型準(zhǔn)備,搭建電力多源數(shù)據(jù)湖。技術(shù)細(xì)節(jié):整合電力PMS、
GIS、
SCADA等
多源數(shù)據(jù),構(gòu)建數(shù)據(jù)湖基礎(chǔ)架構(gòu)。成果:完成數(shù)據(jù)湖搭建,為后續(xù)模型訓(xùn)練提供
數(shù)據(jù)支持。任務(wù):核心應(yīng)用上線,完成等保三級測評。技術(shù)細(xì)節(jié):上線輸電線路智能巡檢和電力負(fù)荷
預(yù)測模型,確保系統(tǒng)安全合規(guī)。成果:核心應(yīng)用上線運(yùn)行,提升電網(wǎng)智能化水
平。任務(wù):全場景擴(kuò)展,實(shí)現(xiàn)國產(chǎn)算力主導(dǎo)。技術(shù)細(xì)節(jié):擴(kuò)展至智能客服、新能源并網(wǎng)優(yōu)化
等全場景應(yīng)用,提升系統(tǒng)整體性能。成果:實(shí)現(xiàn)全場景大模型覆蓋,構(gòu)建自主可控
的電力智算中心。理由:
POC測試可以快速驗(yàn)證項(xiàng)目的關(guān)鍵技術(shù)和應(yīng)用場景,為后續(xù)大規(guī)模建設(shè)提供經(jīng)驗(yàn)。建議:申請省級新基建專項(xiàng)債,優(yōu)先啟動(dòng)POC測試,驗(yàn)證項(xiàng)目可行性和技術(shù)優(yōu)勢02
03012方案架構(gòu)設(shè)計(jì)3典型案例4主流智算平臺(tái)介紹5
項(xiàng)目優(yōu)勢1行業(yè)發(fā)展分析CONTENTS收集并整理數(shù)據(jù):收集現(xiàn)有的客服對話數(shù)據(jù)、客戶行為數(shù)據(jù)等,
用于訓(xùn)練AI模型;
對數(shù)據(jù)進(jìn)行清洗、標(biāo)注等預(yù)處理工作,確保數(shù)據(jù)的
質(zhì)量和一致性;
模型構(gòu)建:基于深度學(xué)習(xí)算法和大規(guī)模數(shù)據(jù),
構(gòu)建政務(wù)大模型,
包括自然語言處理模型、數(shù)據(jù)分析模型等;訓(xùn)練AI模
型:使用預(yù)處理后的數(shù)據(jù)訓(xùn)練AI模型,不斷調(diào)整模型參數(shù)和算法,提高模型的識(shí)別率和準(zhǔn)確率;
對模型進(jìn)行多輪訓(xùn)練和驗(yàn)證,確保模
型能夠滿足企業(yè)的實(shí)際需求數(shù)據(jù)收集與預(yù)處理(數(shù)據(jù)增強(qiáng)與清
洗):①
從政務(wù)系統(tǒng)中收集相關(guān)的文本、
圖像、時(shí)間序列等數(shù)據(jù);②
使用Python(Pandas、
NumPy等庫)進(jìn)行數(shù)據(jù)清洗與增強(qiáng)(去噪、去重、
標(biāo)注、格式化、數(shù)據(jù)隨機(jī)
變換等)、預(yù)處理和特征工程。將處理后的數(shù)據(jù)存儲(chǔ)在關(guān)系型數(shù)
據(jù)庫(結(jié)構(gòu)化MySQL/Oracle)
或非關(guān)系型(
MongoDB/Redis);③
根據(jù)任務(wù)需求提取特征,如文本
的詞向量表示、圖像的像素值等。政務(wù)信息化大模型模型選擇與訓(xùn)練:①
使用TensorFlow/PyTorch等深度學(xué)習(xí)框架構(gòu)建和訓(xùn)練自然語言處理模型、數(shù)據(jù)分析模型,如BERT用于文本處理,CNN或RNN用于圖像或時(shí)間序列數(shù)據(jù)分析;②
使用預(yù)處理后的數(shù)據(jù)進(jìn)行模型訓(xùn)練,調(diào)整模型參數(shù)以優(yōu)化性能,
利用GPU加速,提高訓(xùn)練效率;③
對訓(xùn)練好的模型進(jìn)行評估,如使用準(zhǔn)確率、召回率等指標(biāo)衡量模型性能。將訓(xùn)練好的模型保存到
模型倉庫中,供后續(xù)推理使用。推理服務(wù)部署:①
優(yōu)化算法(如Adam、Adagrad等)對模型的參數(shù)進(jìn)行優(yōu)化,設(shè)計(jì)易于使用應(yīng)用程序接口(API)以調(diào)
用AIGC模型;②
將模型部署到服務(wù)器,用Web開
發(fā)框架(
Django、
Flask構(gòu)建文本生成應(yīng)用)或圖形處理框架(OpenCV、
Pillow構(gòu)建圖像生成應(yīng)用);③
對輸入的數(shù)據(jù)進(jìn)行預(yù)處理,然后
通過接口調(diào)用模型進(jìn)行推理(訓(xùn)
練好的模型加載在內(nèi)存中);④
推理結(jié)果格式化返回前端展示層前端界面開發(fā):①
根據(jù)需求使用Vue.js、
React等
前端框架構(gòu)建用戶界面,如政務(wù)
服務(wù)查詢頁面、政策解讀頁面等;②
使用前端框架構(gòu)建頁面結(jié)構(gòu),通
過Ajax或Fetch等技術(shù)調(diào)用推理
服務(wù)接口,獲取推理結(jié)果并展示
在前端頁面上;③
調(diào)用推理服務(wù)接口提供用戶交互功能獲取推理結(jié)果,并在頁面上
展示給用戶(文本/圖像)。
政務(wù)信息化大模型框架
l1.數(shù)據(jù)增強(qiáng)可以通過對現(xiàn)有數(shù)據(jù)進(jìn)行隨機(jī)變換(如文本數(shù)據(jù)的同義詞替換、圖像數(shù)據(jù)的旋轉(zhuǎn)縮放等)來增加數(shù)據(jù)的多樣性2.AIGC
主流的模型架構(gòu):Transformer
架構(gòu)(用于自然語言處理和部分圖像生成任務(wù))
通過自注意力機(jī)制處理長序列數(shù)據(jù)、生成對抗網(wǎng)絡(luò)(GAN,主要用于圖像和視頻生成)3.模型訓(xùn)練:無監(jiān)督學(xué)習(xí)算法(無標(biāo)簽)
、半監(jiān)督學(xué)習(xí)算法(輔以標(biāo)注手段)
、監(jiān)督學(xué)習(xí)(標(biāo)簽)、強(qiáng)化學(xué)習(xí)(智能體agent根據(jù)獎(jiǎng)勵(lì)信號(hào)來更新策略)數(shù)據(jù)處理層模型訓(xùn)練層推理服務(wù)層前端展示層采用Python作為主要編程語言,結(jié)合深度學(xué)習(xí)框架(如TensorFlow、
PyTorch等Python的庫)和Web開發(fā)框架(如Django、
Flask等)來實(shí)現(xiàn)數(shù)據(jù)準(zhǔn)備與模型
訓(xùn)練第
31
頁
運(yùn)維接入
\
外網(wǎng)接入
\接入路由器*2接入路由器*2n基于云技術(shù)底座進(jìn)行建設(shè)
,為XX大學(xué)提供包含通用計(jì)算、超算節(jié)
點(diǎn)
,智算節(jié)點(diǎn)、并行文件存儲(chǔ)
,安全及運(yùn)維服務(wù);n超算配置2路通用節(jié)點(diǎn)、4路胖節(jié)點(diǎn)
,智算配置A800、昇騰910B、
曙光Z100L等;n提供超700PFLOPS算力
,高速網(wǎng)絡(luò)采用800Gbps帶寬
,高性能文
件存儲(chǔ)超過9PB。項(xiàng)目背景XX大學(xué)現(xiàn)有高性能計(jì)算集群為數(shù)十個(gè)中小型集群,各集群由科研團(tuán)隊(duì)自管,存在部分服務(wù)器裸硬件沒有集群化,算力較為分散。缺乏校級平臺(tái)統(tǒng)一管理全校資源,單項(xiàng)目無法一次性調(diào)用大批量資源,成果產(chǎn)出效率和速度低。為實(shí)現(xiàn)高效的科研及教學(xué),計(jì)劃建設(shè)一套高
效、安全、可靠的智算超算專屬云平臺(tái)。(1)實(shí)現(xiàn)算力統(tǒng)一門戶。將超算能力與智算能力結(jié)合,實(shí)現(xiàn)數(shù)據(jù)模型訓(xùn)
練到模型推理及驗(yàn)證的無縫銜接。(2)AI智算集群、超算集群、高速網(wǎng)絡(luò)
,組建高效科研環(huán)境。有效提升
XX大學(xué)科研水平
,助力雙一流建設(shè)。某高校HPC&AI數(shù)據(jù)中心項(xiàng)目方案價(jià)值建設(shè)方案第
32
頁
超強(qiáng)算存能力:GPU浮點(diǎn)運(yùn)算能力達(dá)到每秒億億次級別
,通用算力超22000核
,百G
RoCE無損網(wǎng)絡(luò)最大化提升AI調(diào)度能力,
全閃型存儲(chǔ)NVME
SSD
,配備高階安全產(chǎn)
品
,滿足雙智城市更高級別計(jì)算及安全需
求;
海量數(shù)據(jù)分析:提供上層應(yīng)用所需的海量計(jì)算、存儲(chǔ)資源
,滿足車路協(xié)同場景海量數(shù)
據(jù)統(tǒng)一匯聚
,數(shù)據(jù)分析、應(yīng)用與創(chuàng)新;
等保合規(guī):
通過公安部等保三級認(rèn)證
,滿足客戶數(shù)據(jù)本地存放的安全管控需求。云主機(jī)GPU容器云存儲(chǔ)數(shù)據(jù)庫云安全彈性擴(kuò)縮容
渲染、訓(xùn)練、推理智算中心專屬云基礎(chǔ)設(shè)施(服務(wù)器、網(wǎng)絡(luò)設(shè)備、安全設(shè)備)V2X車載設(shè)備OBUCPU算力:33000
vCPUGPU算力:訓(xùn)練算力約15PFLOPS
(FP16)
,推理算力約56.7PFLOPS(INT8)
,渲染算力約703TFLOPS
(
FP32)高性能存儲(chǔ):
15PBK8S調(diào)度高性能讀寫高并發(fā)大連接
自主可控云車路協(xié)同
車城網(wǎng)
全息路口路口智能管控
數(shù)據(jù)共享交換智能運(yùn)維管理
……
某區(qū)智算中心項(xiàng)目日志管理
仿真管理存儲(chǔ)管理
……
自動(dòng)駕駛仿真評測輔助決策子系統(tǒng)車城協(xié)同精細(xì)感知上層
應(yīng)
用路
側(cè)
設(shè)
備云底
座第
33
頁1行業(yè)發(fā)展分析
2方案架構(gòu)設(shè)計(jì)
3典型案例
4主流智算平臺(tái)介紹5
項(xiàng)目優(yōu)勢CONTENTS文檔輿情文本身份票據(jù)健康碼語音語音語音人臉人臉圖像視頻媒體視頻解析監(jiān)管審核識(shí)別識(shí)別識(shí)別
識(shí)別擴(kuò)展合成識(shí)別核身審核解析轉(zhuǎn)碼安防NLP
OCR語音
圖像
視頻AI統(tǒng)一算法倉:行業(yè)匯聚、百花齊放單卡訓(xùn)練多卡訓(xùn)練數(shù)據(jù)標(biāo)注基于公有云技術(shù)底座能力
,
聯(lián)合九天共同構(gòu)建智算平臺(tái),
提供從數(shù)據(jù)處理
、
模型訓(xùn)練到推理應(yīng)用的
一
站
式
全
流
程
AI
開
發(fā)
服
務(wù)
,
為大模型
、
數(shù)
字
人
、
智能質(zhì)檢
、
智能客服等
AI
能
力
及
應(yīng)
用
提
供
研
發(fā)
環(huán)
境
、
工具和平臺(tái),
助力人工智能技術(shù)與應(yīng)用場景的深度融合。公有云技術(shù)底座智算軟件平臺(tái)九天智算大模型方案總體架構(gòu)自動(dòng)建模分布式訓(xùn)練數(shù)據(jù)探索硬件基礎(chǔ)設(shè)施九天大模型
架構(gòu)高速存儲(chǔ)集群(并行文件存儲(chǔ))高速RDMA網(wǎng)絡(luò)通用云計(jì)算集群模
型訓(xùn)練HPC計(jì)算集群推理平臺(tái)第
35
頁AI計(jì)算集群管理節(jié)點(diǎn)訓(xùn)練平臺(tái)核心功能提供簡單易用的多模態(tài)數(shù)據(jù)接入及
管理功能,預(yù)置多場景標(biāo)注工具模
板提供開放靈活的交互式集成開發(fā)環(huán)
境,預(yù)置數(shù)據(jù)、基礎(chǔ)模型、計(jì)算框
架及算法提供豐富多樣的訓(xùn)練資源套餐,如
CPU、
GPU等,支持多機(jī)多卡分布
式訓(xùn)練面向各個(gè)行業(yè)智能化場景,提供全
自動(dòng)建模服務(wù)??赏瓿葾I流水線的
全自動(dòng)執(zhí)行九天訓(xùn)練平臺(tái)
平臺(tái)訓(xùn)練模塊提供豐富的算力資源、訓(xùn)練數(shù)據(jù)、齊全的算法框架和研發(fā)工具,支持單機(jī)和分布式等多種訓(xùn)練模式。國產(chǎn)芯片適配實(shí)現(xiàn)對華為昇騰、寒武紀(jì)MLU等異構(gòu)計(jì)算資源的算力資源調(diào)度和模型適配,集成國產(chǎn)AI芯片和算法框架,提升生態(tài)多樣性系統(tǒng)性能優(yōu)異通過多級系統(tǒng)緩存,大幅度提升小文件讀取效率。通過GPU虛擬化,大幅度提升利用率,降低使用成本高可用架構(gòu)保障基于云原生技術(shù)架構(gòu),平臺(tái)具備容災(zāi)自愈、彈性伸縮、負(fù)載均衡、灰度發(fā)布等高可用特性多機(jī)多卡分布式訓(xùn)練針對大模型訓(xùn)練時(shí)間長、效率低的痛點(diǎn),實(shí)現(xiàn)基于數(shù)據(jù)并行的多機(jī)多卡分布式訓(xùn)練九天智算平臺(tái):訓(xùn)練平臺(tái)模型訓(xùn)練自動(dòng)建模數(shù)據(jù)處理模型開發(fā)第
36
頁平臺(tái)架構(gòu)支持AI模型云邊協(xié)同部署和更新
,
納管邊緣資源
,提供云上應(yīng)用延申
到邊緣的能力支持模型實(shí)時(shí)、
邊緣推理多場景的
服務(wù)部署
,支持通過上傳鏡像自定
義部署服務(wù)支持運(yùn)行推理服務(wù)過程中的指標(biāo)監(jiān)
控、
彈性擴(kuò)容等管理操作
,實(shí)現(xiàn)運(yùn)
行數(shù)據(jù)可視化支持多框架模型的統(tǒng)一納管
,支持
將本地已訓(xùn)練好的模型導(dǎo)入到平臺(tái)
上進(jìn)行模型納管模型部署模型推理云邊協(xié)同超高并發(fā)量彈性高可用,服務(wù)毫秒級響應(yīng);
超高并發(fā)量可達(dá)到4600次/秒超高吞吐量體系化AI標(biāo)準(zhǔn)化部署,使用TensorRT加速和動(dòng)態(tài)Batch優(yōu)化提升服務(wù)吞吐量高性能推理業(yè)界領(lǐng)先模型加速與壓縮算法,適配多種硬件、多框架的高性能模型推理九天推理模塊沉淀優(yōu)秀共性的AI能力,研發(fā)測試雙環(huán)境保障服務(wù)低成本遷移,可靈活組合形成復(fù)合AI能力,提升AI應(yīng)用的開發(fā)和部署效率。
九天智算平臺(tái):
推理模塊
l高效部署模式產(chǎn)研雙軌自由部署切換,云邊端協(xié)同部署,自有AI模型和成熟AI能力靈活組合部署核心功能模型管理第
37
頁建模中心
數(shù)據(jù)探索數(shù)據(jù)處理特征工程模型訓(xùn)練智算平臺(tái)基于大數(shù)據(jù)特征分析、業(yè)務(wù)智能算子、AutoML、AutoCV等核心能力,提供結(jié)構(gòu)化數(shù)據(jù)一站式建模服務(wù),降低AI技術(shù)門檻,實(shí)現(xiàn)模型治理和模型全生命周期管理。模型九天基礎(chǔ)設(shè)施云原生算法框架CPU/GPU
ASIC
AI
分布式存儲(chǔ)數(shù)據(jù)應(yīng)用零代碼全流程可視化面向廣泛領(lǐng)域,提供低門檻、零代碼的建模工具,實(shí)現(xiàn)流程化、可復(fù)用、可追溯高精度AI自動(dòng)化開發(fā)將業(yè)界最新模型和技術(shù)固化形成CV、NLP算法庫,沉淀行業(yè)典型場景預(yù)置模型端到端AI應(yīng)用支持一鍵發(fā)布為API在線服務(wù)、或下載成為SDK,靈活適配各種運(yùn)行環(huán)境九天智算平臺(tái):
自動(dòng)可視化建模家寬推薦結(jié)果預(yù)測…采購優(yōu)化財(cái)務(wù)稽核九天自動(dòng)建模描述性分析預(yù)測性分析決策性分析診斷分析閉環(huán)服務(wù)探索性分析
模型應(yīng)用推理部署特征編碼特征相關(guān)性模型可視化超參自動(dòng)調(diào)優(yōu)時(shí)序/地域分析特征分析本地?cái)?shù)據(jù)公有云數(shù)據(jù)空值處理數(shù)據(jù)轉(zhuǎn)換權(quán)限管理日志監(jiān)控實(shí)驗(yàn)分享特征衍生統(tǒng)計(jì)分析特征選擇算法組件聚類分析模型驗(yàn)證應(yīng)用任務(wù)調(diào)度計(jì)費(fèi)管理數(shù)據(jù)中心異常處理類型定義平臺(tái)架構(gòu)第
38
頁運(yùn)營平臺(tái)智能應(yīng)用開發(fā)通用AI訓(xùn)練平臺(tái)大模型訓(xùn)練平臺(tái)工具鏈場景大模型行業(yè)大模型星火基礎(chǔ)大模型數(shù)據(jù)處理平臺(tái) 數(shù)據(jù)預(yù)處理
數(shù)據(jù)標(biāo)注基于公有云技術(shù)底座能力,
聯(lián)合科大訊飛共同構(gòu)建超算智算平臺(tái)
。
本方案架構(gòu)主要包括底層算力集群
、
星
火
智
算
平
臺(tái)
等
。
是
面
向
運(yùn)
營
商
、
高校
、
科
研
院
所
及
企
業(yè)
等
客
戶
群
體,
提
供
通
用
AI
訓(xùn)練
、
行
業(yè)
大
模
型
訓(xùn)練及推理
、
開發(fā)服務(wù)為一體的通用人工智能
“
AI
+
算力
”
的綜合解決方案
。智管平臺(tái) 異構(gòu)計(jì)算多租戶/資源隔離
令open
Euier
ca
NhN星火版
操作系統(tǒng)
異構(gòu)計(jì)算框架公有云技術(shù)底座軟件平臺(tái)智運(yùn)智訓(xùn)智管訊飛智算大模型方案總體架構(gòu)硬件基礎(chǔ)設(shè)施高速存儲(chǔ)集群(并行文件存儲(chǔ))推理服務(wù)運(yùn)營管理高速RDMA網(wǎng)絡(luò)AI計(jì)算集群訊飛大模型
架構(gòu)HPC計(jì)算集群通用云計(jì)算集群數(shù)據(jù)接入預(yù)制框架預(yù)制算法預(yù)制模型異構(gòu)模型轉(zhuǎn)換管理節(jié)點(diǎn)異構(gòu)訓(xùn)練框架評測第
39
頁資源調(diào)度異構(gòu)芯片
訊飛星火大模型平臺(tái):為用戶提供一站式服務(wù)
l核心效果全面領(lǐng)先源頭支持中英文多語種,在多項(xiàng)測評任務(wù)效果優(yōu)秀,標(biāo)準(zhǔn)大模型
通用性更強(qiáng),行業(yè)大模型更專業(yè)面向業(yè)務(wù)開箱即用提供豐富的基礎(chǔ)提示資源包,涵蓋20余個(gè)專業(yè)場景,即開即用多個(gè)行業(yè)大模型
覆蓋全行業(yè)多個(gè)行業(yè)大模型可選,針對不同場景使用你專屬的行業(yè)助手多平臺(tái)支持全信創(chuàng)配置支持多種平臺(tái)切換,并面向信創(chuàng)平臺(tái)做了深度優(yōu)化政務(wù)大模型公文大模型
數(shù)學(xué)能力
多模態(tài)能力
知識(shí)問答
邏輯推理
文本生成
語言理解
星火大模型代碼
大模型
代碼能力第
40
頁大模型認(rèn)知大模型通用大模型行業(yè)大模型定制大模型大模型托管
服務(wù)治理資源監(jiān)控配置管理資源調(diào)度日志管理
訊飛星火大模型平臺(tái):功能完備的開發(fā)平臺(tái) 工作流編排組件管理節(jié)點(diǎn)配置
服務(wù)調(diào)試原生組件對話流對話流編輯Prompt節(jié)點(diǎn)話術(shù)配置變量和標(biāo)簽管理對話測試畫布編輯自定義組件腳本組件接口組件知識(shí)搜索關(guān)鍵詞召回知識(shí)發(fā)布增刪改查word解析
pdf解析知識(shí)表達(dá)知識(shí)檢索知識(shí)庫管理知識(shí)采集知識(shí)問答向量召回知識(shí)樹文檔切片OCR識(shí)別
表格解析插件注冊激活定義安全定義函數(shù)定義插件庫計(jì)算插件知識(shí)插件工具插件輸出組件文件存儲(chǔ)郵件輸出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 流通環(huán)節(jié)培訓(xùn)材料
- 流行舞舞蹈培訓(xùn)課件
- 流程的培訓(xùn)教學(xué)課件
- 流感相關(guān)知識(shí)培訓(xùn)
- 2024-2025學(xué)年陜西省部分學(xué)校高二下學(xué)期5月月考?xì)v史試題(解析版)
- 2024-2025學(xué)年山東省日照市高一下學(xué)期期中考試歷史試題(解析版)
- 2024-2025學(xué)年江蘇省淮安市協(xié)作體高二下學(xué)期期中考試歷史試題(解析版)
- 2026年企業(yè)環(huán)保責(zé)任與ISO14001環(huán)境管理體系模擬自測題
- 2026年企業(yè)培訓(xùn)師考試企業(yè)內(nèi)訓(xùn)技能及人力資源開發(fā)利用題目訓(xùn)練
- 2026年現(xiàn)代物流管理與實(shí)務(wù)操作題庫
- 中廣核新能源(深圳)有限公司招聘筆試題庫2026
- 信息化系統(tǒng)運(yùn)維與支持手冊(標(biāo)準(zhǔn)版)
- 2026中國電信四川公用信息產(chǎn)業(yè)有限責(zé)任公司社會(huì)成熟人才招聘備考題庫帶答案詳解
- 2026屆天津市西青區(qū)數(shù)學(xué)高三第一學(xué)期期末聯(lián)考模擬試題含解析
- 學(xué)校桌椅采購項(xiàng)目質(zhì)量保障方案
- 高考英語讀后續(xù)寫片段小練習(xí)(中英對照+模板套用)
- 嘉賓邀請合同書
- 華電集團(tuán)企業(yè)介紹
- 2025年AI時(shí)代的技能伙伴報(bào)告:智能體、機(jī)器人與我們(英文版)
- 實(shí)驗(yàn):含鋅藥物的制備及含量測定教學(xué)設(shè)計(jì)-2025-2026學(xué)年中職專業(yè)課-化學(xué)實(shí)驗(yàn)技術(shù)-分析檢驗(yàn)技術(shù)-生物與化工大類
- 雨課堂學(xué)堂云在線《臨床思維與人際溝通 》單元測試考核答案
評論
0/150
提交評論