中科海光:2025年深算智能:海光DCU行業(yè)實戰(zhàn)手冊_第1頁
中科海光:2025年深算智能:海光DCU行業(yè)實戰(zhàn)手冊_第2頁
中科海光:2025年深算智能:海光DCU行業(yè)實戰(zhàn)手冊_第3頁
中科海光:2025年深算智能:海光DCU行業(yè)實戰(zhàn)手冊_第4頁
中科海光:2025年深算智能:海光DCU行業(yè)實戰(zhàn)手冊_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

深算智能海光DCU行業(yè)實戰(zhàn)手冊官方網(wǎng)站:

Www.

hygon.

cn本宣傳冊中有關(guān)產(chǎn)品、機型、配置、功能描述等內(nèi)容僅供參考

,如有變化,恕不另行通知

,具體以產(chǎn)品隨機資料(產(chǎn)品說明書或用戶使用手冊)為準,

本宣傳冊所涉及內(nèi)容更多詳情,請您垂詢海光當?shù)貥I(yè)務拓展經(jīng)理,本宣傳冊最終解釋權(quán)在海光信息技術(shù)股份有限公司。HYGON中

光掃

一掃

歡迎關(guān)注

海光官方微信掃一掃適配海光產(chǎn)品海光信息技術(shù)股份有限公司成立于2014年,于2022年在科創(chuàng)板上市(股票代碼:688041),主要

從事高端處理器、加速器等計算芯片產(chǎn)品和技術(shù)的研究、開發(fā),目標是成為世界一流的芯片企

業(yè),為數(shù)字中國提供核心計算引擎。海光信息以務實的態(tài)度、創(chuàng)新的理念、先進的技術(shù)和可靠

的產(chǎn)品,致力于促進我國信息產(chǎn)業(yè)核心競爭力的提升。作為國產(chǎn)先進微處理器產(chǎn)業(yè)的推動者,海光已獨立實現(xiàn)多代通用處理器CPU產(chǎn)品和人工智能加速器DCU產(chǎn)品的自主研發(fā)和商業(yè)化應用?;谧吭叫阅?、主流生態(tài)、安全可靠、自主迭代等優(yōu)

勢,海光芯片已搭載于多家國內(nèi)知名整機廠商的產(chǎn)品,并在云計算、大數(shù)據(jù)處理、人工智能等商

業(yè)場景中得到廣泛應用,覆蓋政府、通信、金融、醫(yī)療、教育、交通、能源等關(guān)鍵行業(yè),占據(jù)

國內(nèi)高端計算、智能計算市場頭部份額。為數(shù)字中國提供核心計算引擎成為世界一流的芯片企業(yè)海光信息技術(shù)股份有限公司使命

MISSION愿景VISION02

HYGONHYGON01公司介紹/

COMPANY

PROFILE海光DCU行業(yè)實戰(zhàn)手冊領(lǐng)先的“芯”研發(fā)體系研發(fā)與創(chuàng)新實力

一流研發(fā)支撐體系

/

FIRST-CLASS

R&D

SUPPORT

SYSTEM千萬行源代碼200+集成電路專有權(quán)150+軟著900+發(fā)明專利硬件仿真實驗室100億門仿真器5000+臺服務器投入運行配可近15萬物理CPU核80%為HYGON服務器/博士人員構(gòu)成92%研發(fā)人員經(jīng)驗資歷20年核心人員從業(yè)經(jīng)驗學歷結(jié)構(gòu)80%+碩士03擁有國內(nèi)芯片領(lǐng)域?qū)?/p>

踐經(jīng)驗最豐富的權(quán)威專家團隊02強強協(xié)作,擁有可使用、可修改的處理器

技術(shù)資源先進微處理器技術(shù)國家工程研究中心是專門面向C86架構(gòu)芯片核心關(guān)鍵技術(shù)研究與工程設(shè)計的國家級工程實驗室。全面設(shè)計能力

/

COMPREHENSIVE

DESIGN

CAPABILITY上海內(nèi)存控制器設(shè)計

芯片安全設(shè)計0104

HYGONHYGON03擁有完整芯片研發(fā)部

門的工程實驗室安全設(shè)計前端設(shè)計后端設(shè)計封裝設(shè)計架構(gòu)設(shè)計定制IP設(shè)計北京芯片前后端設(shè)計蘇州芯片封裝測試知識產(chǎn)權(quán)研發(fā)團隊研發(fā)環(huán)境實驗室三大優(yōu)勢海光DCU行業(yè)實戰(zhàn)手冊芯片驗證系統(tǒng)測試成都01

DTKDASDAP02

SOLUTIONS

&

CASES

海光DCU應用場景實戰(zhàn)場景一:AI大模型一體機13實戰(zhàn)場景二:行業(yè)智能化17實戰(zhàn)場景三:科學計算35實戰(zhàn)場景四:工程計算3903

ACHIEVEMENTS

光合開發(fā)者社區(qū)44智能計算聯(lián)合實驗室45光合組織介紹46海光DCU生態(tài)圖譜47生態(tài)成果ECOLOGICAL紹INTRODUCTION介CT品DU產(chǎn)PROPRODUCTINTRODUCTION產(chǎn)品介紹

>>>CONTENTS目錄06

HYGONHYGON05海光DCU行業(yè)實戰(zhàn)手冊091011DAS

(DCUAISoftwareStack/DCU人工智能基礎(chǔ)軟件系統(tǒng))基礎(chǔ)算子層優(yōu)化框架工具層優(yōu)化模型擴展組件層優(yōu)化DTK(DCUTool

Kit/DCU異構(gòu)計算平臺) 通用架構(gòu)采用GPGPU大規(guī)模并行計算架構(gòu)設(shè)計,通用性好,全面兼容CUDA、ROCm軟件生態(tài),遷移成本低 開源生態(tài)支持主流AI框架和工具鏈,覆蓋全部開源大模型,支持主流AI、AI

for

Science和科學計算等各類應用軟件 全面精度支FP64、FP32、TF32、BF16、FP16、INT8等多精度計算,精度完備,全面支持科學計算和AI加速計算基礎(chǔ)線性代數(shù)庫傅里葉變換庫神經(jīng)網(wǎng)絡加速庫數(shù)值線性代數(shù)求解庫稀疏基礎(chǔ)線性代數(shù)庫海光DCU行業(yè)實戰(zhàn)手冊

DCU:國內(nèi)唯一全精度通用AI加速卡CUBLASCUFFTCUDNNCUSOLVERCUSPARSEDCU

BLASDCU

FFTDCU

DNNDCUSOLVERDCUSPARSE全程護航支持大模型多元場景應用落地全棧優(yōu)化軟硬協(xié)同釋放DCU

澎湃算力性能全面兼容面向主流AI生態(tài)DCU遷移平滑無憂支持C/C++/Fortran、OpenMP/OpenACC、Python編程,支持GPU

Direct網(wǎng)絡加速,支持多種Pro?ling

方法主流HPC應用人工智能框架國內(nèi)典型Gromacs/VASPetcTensorFlow/PyTorch/paddlepaddle異構(gòu)應用DAP(DCUAI

Platform/

DCU人工智能應用平臺)云原生AI平臺大模型應用平臺光源ModelZoo

|鏡像倉庫開發(fā)者社區(qū)全面兼容的開發(fā)環(huán)境功能健全的DCU軟件棧編譯器驅(qū)動DCU加速卡SPARSE加速庫LAPACK加速庫BLAS加速庫Thrust通訊加速庫FFT加速庫OpenMP/OpenACCPRIMDNN加速庫OpenClDCU:全面兼容主流生態(tài)/

FULL

ECOSYSTEM

PROFILEDCU人工智能軟件棧

/

AI

SOFTWARE

STACK08

HYGONHYGON07提供完整的開發(fā)、遷移、編譯、調(diào)試工具原生支持多種加速庫

及各類深度學習框架主流應用函數(shù)庫開發(fā)環(huán)境類CUDA

API的開源軟件開發(fā)平臺支持Kubernetes

和Slurm調(diào)度系統(tǒng)支持容器化工具

大規(guī)模部署高速網(wǎng)絡C86

CPUDCU加速卡存儲類CUDA編程環(huán)境性能分析工具海光DCU行業(yè)實戰(zhàn)手冊DTK異構(gòu)計算平臺

DTK(DCUToolkit)集成了DCC(DCUCollectCompiler)編譯器、經(jīng)過驗證和優(yōu)化的計算庫,支持多種編程語言,同時提供運行、

編譯、調(diào)試和性能分析功能。DTK可支持主流科研工具,包括但不限于Gromacs、Lammps、PWmat、Openfoam、DeePMD-kit、DeepFlame、Quda、SD3、Alphafold、Geoeast,覆蓋人工智能、材料科學、生命科學、工業(yè)仿真、氣象環(huán)境、地質(zhì)地震等科研領(lǐng)域。DTK兼容國際主流的GPGPU開源生態(tài),可直接編譯開源的GPGPUC/C++代碼,旨在讓用戶快速移植和使用開源社區(qū)的計算工具,

降低適配周期和人力投入,致力于讓用戶只維護一套代碼。

DAS人工智能基礎(chǔ)軟件系統(tǒng)DAS(DCU

AI

Software

Stack)提供AI算子優(yōu)化庫、AI模版庫、AI編譯器、基礎(chǔ)AI框架、推理框架和三方套件,并通過OpenDAS以開源方式提供AI擴展套件服務。DAS與ModelZoo、鏡像倉庫、創(chuàng)空間、開發(fā)者社區(qū)、AI

平臺等構(gòu)成一套完整的人工智能基礎(chǔ)設(shè)施,全棧全場景賦能用戶AI應用研發(fā),助力千行百業(yè)智能化轉(zhuǎn)型,加速新質(zhì)生產(chǎn)力建設(shè)。支撐上層科學計算/AI框架與應用GPUFusion兼容CUDA/ROCm雙生態(tài)基礎(chǔ)數(shù)學庫DCC編譯器通訊庫/運行時庫NVCC兼容編譯器libnccl.so、libnvrtc.so、libcudart.so、libnvidia-ml.so等運行時系統(tǒng)異構(gòu)加速卡驅(qū)動多操作系統(tǒng)支持,更廣泛國產(chǎn)操作系統(tǒng)支持CentOS、Ubuntu、NFS、Kylin、UOS國產(chǎn)CPU

國產(chǎn)GPU加速卡CUDA核心組件功能覆蓋率除硬件外達到100%核心組件CUDA可用接口數(shù)初始函數(shù)功能覆蓋率(2024.1基線)當前函數(shù)功能覆蓋率runtime34781.7%100%driver

API48566.73%100%cublas32674.5%100%cu?t5267.3%100%cusparse49196.12%96.95%(15個半精接口

CUDA已標記為廢棄curand2783.53%100%nvrtc13100%100%nccl19100%100%場景全面覆蓋AI、Al4S、Science領(lǐng)域加速需求擁抱開源兼容主流GPU開源生態(tài),

享受開源紅利全面適配已適配260+Science應用

工具,覆蓋12大科研領(lǐng)域全棧自研針對海光DCU設(shè)計,全棧

自主研發(fā),并持續(xù)優(yōu)化全面覆蓋實現(xiàn)Al全場景覆蓋框架組件全面適配高效性能性能卓越達到行業(yè)主流水平快速迭代小步快跑發(fā)版節(jié)奏滿足快速變化需求開源開放打造開源開放社區(qū)

加速DCU生態(tài)建設(shè)DCC編譯器適配gfx928/gfx936

/支持內(nèi)嵌PTX

/持續(xù)優(yōu)化框架工具層全系列產(chǎn)品兼容/支持主流AI生態(tài)框架融合算子庫LightOP算子模板庫CUTLASSAI編譯Triton/XLAAI框架

PyTorch/TensorFlow/JAX/Paddle/

…通用推理框架ONNXRuntime/MIGraphx/

…圖優(yōu)化組件GraphRay精度檢測工具LayerCheck快速適配工具FastPT運行時系統(tǒng)API覆蓋率100%/通訊庫優(yōu)化/問題自排查擴展組件層支持并行解碼/高版本組件/性能優(yōu)化基礎(chǔ)算子層支持深度算子融合/算子優(yōu)化等操作基礎(chǔ)數(shù)學庫適配兩代產(chǎn)品/全兼容/性能優(yōu)異10

HYGONHYGON09librccl.so、libhiprtc.so、librocm_smi64.so等Cmake構(gòu)建系統(tǒng)支持工具鏈可視化

調(diào)試器和調(diào)優(yōu)器CUDA兼容數(shù)學庫CUDA頭文件CUDARuntime

API...LMDeployMMCV...DeepSpeedLMSlimKTransformersBitsandbytesPyTorchClusterDi?usersOllamaPageAttentionFlashAttentionFastMoEMegatron-LMTransformerEnginePyTorchScattervLLMFlashMLATorchvisionTorchaudioApexHIP

RuntimeAPIHIP頭文件HIPCCHIP數(shù)學庫大模型訓練組件大模型推理組件通用訓練組件...海光DCU行業(yè)實戰(zhàn)手冊DAP人工智能應用平臺

DAP人工智能應用平臺定位于企業(yè)級大模型開發(fā)平臺,致力于幫助客戶快速搭建個性化知識庫問答系統(tǒng),通過自定義的工作流,完成

用戶特定的業(yè)務應用場景,在人工智能應用領(lǐng)域獨具特色。DAP提供對話引擎、企業(yè)知識庫引擎、Agent編排引擎等能力矩陣,同時具備完善的企業(yè)級產(chǎn)品特性,包括精細化用戶管理,SSO單點

登錄、多模型納管、負載均衡等。APPLICATIONSCENARIOS海光DCU應用場景

>>>模型推理服務大模型分布式推理能力組件預定義組件MCP調(diào)用降低幻覺率支持多個知識庫的混合使用與

高效檢索確?;卮鹑鏈蚀_技術(shù)特性領(lǐng)先方便開發(fā)者快速集成各類功能

便于與其他系統(tǒng)或應用集成可視化工作流簡單拖拽即可定制復雜邏輯

常用模塊可封裝復用功能整合支持處理各個格式文件以及http調(diào)用第三方接口行業(yè)應用政務金融科教能源互聯(lián)網(wǎng)電力稅務醫(yī)療...模型微調(diào)微調(diào)算法算力基礎(chǔ)設(shè)施text2sql可視化數(shù)據(jù)表數(shù)據(jù)庫知識庫數(shù)據(jù)處理Agent12

HYGONHYGON

11模型訓練加速優(yōu)化的模型容器化部署標準API高效推理引擎大模型訓練加速大模型分布式訓練彈性計算平臺適配k8s-vdcu-plugink8s-dcu-plugin故障診斷組件dcu虛擬化組件性能監(jiān)控組件數(shù)據(jù)標注多數(shù)據(jù)源支持數(shù)據(jù)批處理海光CPU海光DCUIBRoCE分布式存儲對象/文件/塊存儲數(shù)據(jù)庫提示詞問答測試知識索引模型節(jié)點畫布編排記憶設(shè)置HTTP節(jié)點組件節(jié)點知識解析混合排序檢索增強知識切片DAP大模型平臺大模型應用創(chuàng)新平臺云原生AI平臺大模型推理加速模型微服務模型評估模型納管671B70B32B14B7B/8B1.5B桌面級AI工作站支持14B以下模型推理AI推理服務器支持70B模型推理訓推一體AI服務器支持70B模型推理

+14B模型微調(diào)柜級訓推一體服務器支持671B模型推理+70B模型微調(diào)千卡集群方案支持在兩周內(nèi)完成

671B模型預訓練隨著AI技術(shù)的快速發(fā)展,行業(yè)客戶在智能化轉(zhuǎn)型的過程中面臨

應用場景模糊、試錯成本和算力成本高昂等一系列問題。方案亮點/

HIGHLIGHTS針對這些問題,需通過算法框架優(yōu)化、加速庫升級和軟硬件

全棧調(diào)優(yōu),構(gòu)建起從模型微調(diào)、推理服務到智能體編排應用的全流程解決方案。實施效果/

IMPLEMENTATION

RESULTS海光與天翼云聯(lián)合推出基于海光DCU的智算一體機,通過整合天翼云翼政通等智能AI應用、云管平臺以及推理管理平臺,支持接入主流

大模型驅(qū)動定制化功能,結(jié)合主流大模型實現(xiàn)一站式快速交付。實戰(zhàn)場景一:AI大模型一體機基于海光DCU的大模型一體機海光信息秉承

“深算智能”

戰(zhàn)略,以C86

CPU+DCU異構(gòu)加速計算平臺為核心,發(fā)揮“全精度通用架構(gòu)、兼容主流AI生態(tài)、開放開源合作”等優(yōu)勢,傾力打造“DCU-DTK-DAS-DAP”全棧軟硬件技術(shù)生態(tài)體系,支撐各類大模型適配優(yōu)化與應用創(chuàng)新,助力千行百業(yè)智能

化轉(zhuǎn)型。全尺寸、多形態(tài)、多場景適配各種大模型,從十億推理到千億訓練靈活擴展性能卓越:海光DCU與天翼云智能AI軟件深度協(xié)同,滿足復雜業(yè)

務場景需求,帶來精準高效的AI應用體驗。靈活拓展:海光DCU全面兼容主流AI框架,推動業(yè)務快速上線,

并為客戶自主研發(fā)預留彈性算力空間。安全自主:采用海光DCU+CPU的全國產(chǎn)化方案,為私有化部署提供數(shù)據(jù)保護,具備模型推理全流程的隱私防護能力。

個人智能助手小并發(fā)推理、單一場景推理 部門/團隊應用多任務處理 中小企業(yè)服務復雜推理,小模型微調(diào)

企業(yè)級應用服務模型微調(diào),大并發(fā)推理中國電信天翼云基于海光DCU打造智算一體機海光硬件與天翼云軟件深度融合,方案性能強勁、穩(wěn)定可靠,已通過各行業(yè)客戶的現(xiàn)網(wǎng)驗證,能夠提供堅實的可靠性

保障。一體機一站式交付,簡化前期建設(shè)投入,助力客戶快速接入

大模型,擁抱AI時代。軟硬一體化交付,全流程自動化部署,真正實現(xiàn)開箱即用,大幅縮短項目落地時間。持續(xù)落地重慶市某區(qū)政府、湖南某市政務云、肇慶某三甲醫(yī)

院、南寧市某局等地。背景需求

/

BACKGROUND14

HYGONHYGON

13海光DCU行業(yè)實戰(zhàn)手冊浙江算力科技通過打造“1個中樞+2個數(shù)智產(chǎn)品”架構(gòu),在海光DCU上實現(xiàn)算力、數(shù)據(jù)、算法全要素整合,賦能杭州某重點區(qū)縣上線全國首個

深度融合浙政釘?shù)腁I政務智能體。海曦技術(shù)基于海光DCU與國產(chǎn)大模型打造心理篩查一體機,首創(chuàng)游戲化多模態(tài)無感采集技術(shù),突破傳統(tǒng)心理篩查的局限,實現(xiàn)75%的病

癥識別準確率,交付國內(nèi)首個深度融合行為分析與AI診斷的心理健康

篩查平臺。響應國家信創(chuàng)戰(zhàn)略,需在政務領(lǐng)域?qū)崿F(xiàn)從算力基礎(chǔ)設(shè)施到應用系

統(tǒng)的全棧國產(chǎn)化替代。方案亮點/

HIGHLIGHTS助力杭州建設(shè)"全國數(shù)字經(jīng)濟第一城",需形成可復用的智能城

市技術(shù)輸出能力。實施效果/

IMPLEMENTATION

RESULTS城市大腦中樞架構(gòu):整合海光DCU算力、多源城市數(shù)據(jù)與AI算

法,構(gòu)建支持實時決策的智能運算平臺。雙數(shù)智產(chǎn)品體系:開發(fā)城市運行管理智能體與政務辦公智能體,實現(xiàn)城市治理與行政服務的雙軌智能化。全棧國產(chǎn)化適配:信創(chuàng)云底座部署海光DCU,完成AI算力平臺

與浙政釘系統(tǒng)的深度集成??焖俳桓赌芰Γ豪煤9釪CU高兼容性特性,實現(xiàn)應用適配周

期縮短50%。海光DCU行業(yè)實戰(zhàn)手冊浙江算力科技攜手海光DCU團隊推出AI政務智能體傳統(tǒng)篩查手段失效:問卷/沙盤等方式易引發(fā)學生抵觸,數(shù)據(jù)真

實性存疑,且難以捕捉隱性心理問題。隱私與效率雙重挑戰(zhàn):需在保護未成年人隱私前提下,實現(xiàn)大

規(guī)??焖倬珳屎Y查。方案亮點/

HIGHLIGHTS校園心理危機預警缺位:缺乏高效工具預防抑郁、自閉、欺凌

及自殺事件,校園安全管理存在盲區(qū)。技術(shù)國產(chǎn)化需求:突破國外技術(shù)壟斷,構(gòu)建自主可控的心理健康評估技術(shù)體系。實施效果/

IMPLEMENTATION

RESULTS海曦技術(shù)聯(lián)合海光打造開箱即用、全棧交付的心理篩查一體機

數(shù)據(jù)長期跟蹤與發(fā)展性評估:建立學生心理成長檔案庫,通過隨

機截距交叉滯后模型分析學業(yè)成績與心理狀態(tài)的動態(tài)關(guān)聯(lián),識

別心理健康問題的關(guān)鍵發(fā)展節(jié)點。自動化報告生成:系統(tǒng)自動生成多維度可視化報告(如心理狀

態(tài)雷達圖、風險因子權(quán)重分析),并提供可操作建議(如推薦干

預課程、家校溝通話術(shù))。結(jié)束了傳統(tǒng)心理檢測技術(shù)(問卷、沙盤等)一統(tǒng)天下的局面,

在大模型和多模態(tài)技術(shù)的加持下,青少年心理篩查的手段變

得更加友善、更加科學。幫助醫(yī)院、學校及時發(fā)現(xiàn)和解決學生的心理問題,從而有效預防校園抑郁、自閉、欺凌、自殺等事件的發(fā)生,為平安校園

建設(shè)提供有力支持。城市智能化升級需求迫切,需通過智能中樞實現(xiàn)跨部門數(shù)據(jù)融合與決策協(xié)同,解決傳統(tǒng)城市管理響應滯后、資源調(diào)度低效問題。在杭州某重點區(qū)縣上線全國首個“AI公務員”系統(tǒng),實現(xiàn)政策咨詢、事務辦理等7類場景智能響應。現(xiàn)有電子政務系統(tǒng)難以支撐智能化服務,亟需AI驅(qū)動的工作流

重構(gòu)提升行政效能。建成浙江省首個信創(chuàng)云AI政務平臺,海光DCU算力資源利用率高效。方便學校和教育機構(gòu)隨時隨地進行數(shù)據(jù)查詢和分析,有效提

升心理健康教育的針對性和實效性。背景需求

/

BACKGROUND背景需求

/

BACKGROUND16

HYGONHYGON

15城市管理效能躍升,跨部門協(xié)同決策時效壓縮至分鐘級。海光DCU通過良好的生態(tài)合作,助力某股份制銀行建設(shè)國產(chǎn)AI虛擬化算力資源池,高效適配AI廠商產(chǎn)品,形成基于“海光DCU+先進算力池化

技術(shù)+算力管理平臺”的聯(lián)合技術(shù)方案共池部署:海光DCU與非國產(chǎn)GPU基于GPGPU架構(gòu)協(xié)同應用,模型相互遷移。資源細化:通過軟件定義的方法實現(xiàn)異構(gòu)算力池化,細粒度對

上層框架模型進行資源分配。統(tǒng)一平臺:采用容器云平臺響應應用需求,統(tǒng)一配置、集中監(jiān)控,降低AI業(yè)務的管理監(jiān)控難度。GPU虛擬化:通過GPU虛擬化技術(shù),提高了板卡利用率,充分

發(fā)揮高算力優(yōu)勢。生態(tài)賦能:海光DCU采用GPGPU架構(gòu),兼容CUDA生態(tài),與AI應實戰(zhàn)場景二:行業(yè)智能化考慮國產(chǎn)化算力資源的長期自主可控需求,率先將人臉識別、

OCR識別、智能客服、大模型、機器學習、RPA、知識圖譜、智能

營銷等全業(yè)態(tài)從國外算力切換到國產(chǎn)異構(gòu)算力。某股份制銀行:AI算力資源池建設(shè)實踐要求IT資源集約化管理,需實現(xiàn)國產(chǎn)算力和非國產(chǎn)算力統(tǒng)一調(diào)

度以及多種框架和算法的統(tǒng)一管理。某國有股份制商業(yè)銀行順應“人工智能+”的國家戰(zhàn)略,結(jié)合AI

解決方案推進數(shù)字化基礎(chǔ)設(shè)施升級?!昂9釪CU+先進算力池化技術(shù)+算力管理平臺”的聯(lián)合方案,有效提升客戶在AI基礎(chǔ)設(shè)施的自主可控水平。實現(xiàn)數(shù)據(jù)中心級的GPU資源池化管理和彈性調(diào)度,并基于熱

遷移等功能顯著增強業(yè)務可靠性與管理便利性。海光DCU支撐銀行實現(xiàn)數(shù)字化、智能化轉(zhuǎn)型,AI應用穩(wěn)定運

行。方案亮點/

HIGHLIGHTS

實施效果/

IMPLEMENTATION

RESULTS2%27%27%422%17

+

2

4

%18

HYGON+

35%3

423

2+35+2

4

%用廠商高效適配,支撐40+業(yè)務場景遷移上線。+

+2

4%2

5+35%背景需求

BACKGROUND3327%+35527%3

425

55海光DCU行業(yè)實戰(zhàn)手冊23

2HYG

ON335

+35++52

4%+

5+35%5+2

4

%5+2

4

%55+35+35+

3527%342++

35i隨著AI技術(shù)迎來重大升級,結(jié)合供應鏈安全,某財險規(guī)劃建設(shè)

具有持續(xù)發(fā)展能力的國產(chǎn)AI算力資源,為人工智能技術(shù)的發(fā)展

提供充分的算力服務保障,賦能客戶服務領(lǐng)域的AI智能應用。方案亮點/

HIGHLIGHTS某財險AI中臺底座以通用車險業(yè)務模型、地址識別模型、車牌識別模型等為“地基”,以“客服+理賠+承?!钡葮I(yè)務領(lǐng)域模型

為“框架”,在AI建立過程中需引入國產(chǎn)GPU資源池建設(shè)。實施效果/

IMPLEMENTATION

RESULTS客戶通過夯實AI中臺國產(chǎn)GPU算力底座,在營銷、理賠、風控、客服、業(yè)務運營等領(lǐng)域深挖業(yè)務價值,并科學系統(tǒng)地開展大模型相關(guān)的人工智

能應用,深化推進AI項目應用,形成規(guī)?;б?。針對全球金融市場每日產(chǎn)生的交易數(shù)據(jù)、輿情信息以及企業(yè)財報、行業(yè)研報等多模態(tài)內(nèi)容,客戶亟需海光DCU強勁算力提供的自然語言

處理和多維度關(guān)聯(lián)分析能力,以及實時推理與預測能力,實現(xiàn)對市

場、政策和風險的穿透式秒級洞察。生態(tài)優(yōu)勢強:海光DCU生態(tài)優(yōu)勢強,適配工作簡單,覆蓋Fast

T5、YOLOV8、Bert-Base、Whisper、OCR、NLP、大模型等全

量場景需求??蓪崿F(xiàn)業(yè)務遷移:憑借GPGPU架構(gòu)優(yōu)勢,海光DCU可實現(xiàn)業(yè)務遷移快速上線,算力性能平替國際主流產(chǎn)品。識別準確率高:OCR識別場景準確率要求高,主要采用FP32單

精度,基于Transformer+CNN卷積核的方式難度突破識別準

確率瓶頸。算力有優(yōu)勢:海光DCU在算法精度、算法性能、適配速度等方面

具有較大優(yōu)勢,結(jié)合OCR、NLP、大模型等合作伙伴的軟件生態(tài)優(yōu)勢,滿足各業(yè)務場景的算力使用需求。生產(chǎn)支持:選取市場成熟應用場景,率先將海光DCU引入生產(chǎn)

環(huán)境,支持數(shù)字客服、人臉識別、印章識別、手寫體識別、營業(yè)執(zhí)

照識別等工作輔助。探索測試:率先引入海光CPU+海光DCU支撐DeepSeek

671B

滿血版大模型集群及QWQ

32B

蒸餾模型,高算力、高穩(wěn)定、高

安全,并已接入智能投顧知識問答,構(gòu)建全量企業(yè)知識庫共享服務平臺。場景開拓:除已經(jīng)投入生產(chǎn)的算力資源外,客戶正在算力資源池化、風險合規(guī)等場景對海光產(chǎn)品進行驗證性測試,為后續(xù)算

力平臺大模型業(yè)務應用奠定基礎(chǔ)。某頭部券商每日需處理海量的金融數(shù)據(jù),對于精準的市場趨勢

預測、風險評估以及智能投顧服務有著極高的需求。傳統(tǒng)的數(shù)據(jù)分析工具和模型已難以滿足其對數(shù)據(jù)處理速度和

分析精度的要求,迫切需要引入先進的人工智能技術(shù)以提升核心競爭力。方案亮點/

HIGHLIGHTS經(jīng)過市場調(diào)研及實際測試,某頭部證券最終引入海光DCU,

在智能客服、智能投顧、智能交易、智能合規(guī)等場景深度優(yōu)化

與高效賦能。實施效果/

IMPLEMENTATION

RESULTS某證券公司AI技術(shù)全面賦能證券業(yè)務智能發(fā)展

某保險公司構(gòu)建國產(chǎn)AI集群算力平臺大部分框架可無需遷移或工具實現(xiàn)一鍵轉(zhuǎn)換,提升使用效

率,減少遷移成本。安全合規(guī):全棧國產(chǎn)化平臺,滿足XC要求,保證系統(tǒng)安全和供應鏈安全。海光DCU千卡算力集群應用于保險AI中臺,實現(xiàn)傳統(tǒng)模型和大模型多種應用場景國產(chǎn)遷移替代。效率提升:大幅提高工作效率,為用戶提升服務智能化、運營

精益化、風控精準化。為未來支撐車險理賠業(yè)務每年數(shù)億次的調(diào)用算力需求奠定基礎(chǔ)。背景需求

BACKGROUND背景需求

BACKGROUND2%27%27%422%19

+

2

4

%20

HYGON海量數(shù)據(jù):提升數(shù)據(jù)智能處理能力,滿足海量數(shù)據(jù)處理需求。智能先進:領(lǐng)跑行業(yè)數(shù)字技術(shù),加速行業(yè)智能化轉(zhuǎn)型。+

35%3

423

2+35+2

4

%+

+2

4%2

5+35%55423327%+35527%3

425

55海光DCU行業(yè)實戰(zhàn)手冊23

2HYG

ON335

+35++52

4%+

5+35%5+2

4

%5+2

4

%+35+35+

3527%3++

35i完整技術(shù)棧:基于“海光C86+海光DCU”打造國產(chǎn)化平臺,確保數(shù)據(jù)安全可控。過渡期零宕機:涵蓋智慧管理、遠程會診、床旁設(shè)備管理等六大

系統(tǒng),實現(xiàn)ICU全流程數(shù)字化。兼容性良好:項目運行軟件業(yè)務與海光C86+海光DCU深度適

配兼容,運行效果良好。降低改造風險:自動采集并傳輸患者數(shù)據(jù),減少人工干預,提升

效率。AI驅(qū)動數(shù)據(jù)分析,極大地促進了數(shù)據(jù)驅(qū)動下的醫(yī)療智能化時

代到來。統(tǒng)一23家醫(yī)院重癥醫(yī)學ICU應用系統(tǒng)的數(shù)據(jù)標準,實現(xiàn)信息

共享和高效協(xié)同。圖形化引擎實現(xiàn)異構(gòu)系統(tǒng)無縫對接,圖形化配置、管理和監(jiān)

測與異構(gòu)系統(tǒng)的數(shù)據(jù)交互效率提高。利用物聯(lián)網(wǎng)、5G、數(shù)字孿生等技術(shù),開展醫(yī)院重癥醫(yī)學ICU數(shù)字孿生建設(shè),著重提升重癥精準救治能力,協(xié)助打造上海市

級醫(yī)院重癥醫(yī)學的數(shù)智臨床服務新模式。上海市23家市級醫(yī)院重癥醫(yī)學ICU數(shù)字孿生項目,圍繞“海光芯”進行技術(shù)融合與模式創(chuàng)新,不僅解決了數(shù)據(jù)采集和管理較為傳統(tǒng)、缺乏統(tǒng)一

標準和共享機制、遠程探視和會診功能不足等問題,更引領(lǐng)了醫(yī)療行業(yè)

智能化、協(xié)同化、安全化的發(fā)展方向。標桿案例 高質(zhì)客戶服務應用極致兼容700+海光DCU23家頂尖三甲醫(yī)院20+應用服務3天從適配到上線海光DCU行業(yè)實戰(zhàn)手冊上海申康發(fā)展中心以“海光芯”建設(shè)重癥醫(yī)學ICU數(shù)字孿生項目傳統(tǒng)數(shù)據(jù)采集方式依賴人工,跨醫(yī)院數(shù)據(jù)標準缺失,信息共享困難。異構(gòu)系統(tǒng)協(xié)同困難,醫(yī)療資源無法高效調(diào)配,制約重癥救治能力提升。缺乏統(tǒng)一的遠程會診與探視系統(tǒng),影響救治響應效率與患者體驗。方案亮點/

HIGHLIGHTS

實施效果/

IMPLEMENTATION

RESULTS背景需求

BACKGROUND22

HYGONHYGON21雙90%準確率突破:通過將DeepSeek大模型與醫(yī)院自主研發(fā)

的“人工智能罕見病輔助決策平臺”融合,實現(xiàn)重癥肌無力、心

臟淀粉樣變等復雜病癥的預測模型雙90%準確率突破。解決醫(yī)患資源錯配問題:結(jié)合院內(nèi)醫(yī)療數(shù)據(jù)與DeepSeek大模

型,精準匹配醫(yī)療服務和運營管理場景,構(gòu)建“感知-決策-執(zhí)行”的智能閉環(huán)系統(tǒng),有效解決醫(yī)患資源錯配問題。技術(shù)自主可控:采用“海光C86+海光DCU”國產(chǎn)硬件架構(gòu),確保

技術(shù)自主可控,支撐全信創(chuàng)環(huán)境下的AI模型訓練與業(yè)務系統(tǒng)運行精益化管理:強化“ChatBI智能問數(shù)”和“IT運維監(jiān)控”功能,提

升數(shù)據(jù)分析效率與系統(tǒng)穩(wěn)定性,賦能精益化管理。通過算法優(yōu)化使罕見病篩查效能核心指標(準確率、召回率)提升近10個百分點。形成“AI+醫(yī)療”標準化解決方案,積累了從數(shù)據(jù)微調(diào)到系統(tǒng)集

成的全流程經(jīng)驗,極大提升醫(yī)生決策的效率與準確率。“海光C86+海光DCU”在性能、穩(wěn)定性等方面完全滿足醫(yī)療業(yè)務需求,為后續(xù)規(guī)?;渴鸬於ɑA(chǔ)。自動識別病歷中的術(shù)語錯誤、邏輯漏洞及格式問題,一鍵優(yōu)化

表述規(guī)范性,助力醫(yī)生高效完成高質(zhì)量病歷書寫。四川省人民醫(yī)院成功在國產(chǎn)信創(chuàng)環(huán)境下部署DeepSeek大模型,成為

省內(nèi)率先實現(xiàn)醫(yī)療全場景智能化落地的三甲醫(yī)院。這一突破不僅打造

了醫(yī)療行業(yè)自主可控技術(shù)應用的里程碑,更以“AI+醫(yī)療”創(chuàng)新模式重構(gòu)

患者服務、臨床診療與運營管理體系,為全國醫(yī)療智能化轉(zhuǎn)型提供標桿

樣本。北京航天總醫(yī)院基于海光DCU成功部署DeepSeek醫(yī)療大模型,將傳

統(tǒng)報告解讀轉(zhuǎn)化為即時、精準的數(shù)字化服務,顯著提升患者體驗與醫(yī)

療效率,并構(gòu)建起“AI報告解讀+健康干預”的全鏈條閉環(huán)管理,為臨

床診斷、患者服務及科研創(chuàng)新提供全新范式。精準定位:DeepSeek整合海量醫(yī)學知識庫,支持血常規(guī)、影像

學、病理學等數(shù)十類報告的實時解析,精準定位異常指標并標

注風險等級。模擬臨床思維:通過“數(shù)據(jù)校驗-關(guān)聯(lián)分析-循證推演”72個分析

節(jié)點,系統(tǒng)模擬臨床思維,識別如糖尿病早期信號、心血管風險等亞臨床問題。降低認知門檻:結(jié)合患者個體特征生成結(jié)構(gòu)化結(jié)論,涵蓋疾病預警、治療建議、復診規(guī)劃及飲食運動指導,同步提供“白話版”

解讀,降低認知門檻。需要在全國產(chǎn)信創(chuàng)環(huán)境下驗證AI技術(shù)與醫(yī)療應用場景的適配

性,保障兼容性、穩(wěn)定性以及數(shù)據(jù)安全。傳統(tǒng)診療手段依賴人工,存在就診精度低、效率低、患者等待時

間長、科室匹配不準確、病歷質(zhì)控效率低等問題,影響患者就診

和臨床決策速度。北京航天總醫(yī)院構(gòu)建“AI報告解讀+健康干預”全鏈條閉環(huán)

傳統(tǒng)檢查報告依賴專家解讀,耗時較長,患者常面臨等待周期

長、跨學科會診復雜等問題。常規(guī)醫(yī)療AI局限于數(shù)值比對,缺乏對潛在健康隱患(如早期疾病信號)的深度關(guān)聯(lián)分析能力。四川省人民醫(yī)院全場景智能化創(chuàng)新醫(yī)院模式

AI輔助捕捉易被忽視的潛在風險,為醫(yī)生提供多維度診斷參

考,降低漏診誤診率。智慧醫(yī)療系統(tǒng)覆蓋臨床、科研、患者服務場景,推動醫(yī)院向高質(zhì)

量、智能化發(fā)展方向邁進,樹立行業(yè)標桿。報告解讀時間從數(shù)小時縮短至5秒內(nèi),患者可即時獲取專業(yè)結(jié)

論與健康建議,減少就醫(yī)焦慮。復雜病癥的篩查與決策缺乏高效工具,亟需Al輔助提升診斷準確率與診療效率。醫(yī)學報告專業(yè)術(shù)語多,普通患者難以理解異常指標的實際意

義與健康風險。方案亮點/

HIGHLIGHTS

實施效果/

IMPLEMENTATION

RESULTS方案亮點/

HIGHLIGHTS

實施效果/

IMPLEMENTATION

RESULTS背景需求

/

BACKGROUND背景需求

/

BACKGROUND24

HYGONHYGON23海光DCU行業(yè)實戰(zhàn)手冊遷移成本低:憑借海光CPU+DCU成熟、高兼容性的生態(tài)環(huán)境,

移動云平臺的云主機、邊緣小站EIS、天池SDN等主要產(chǎn)品可快捷的完成業(yè)務遷移改造,大大降低遷移過程中的成本與風險。芯片級優(yōu)化:海光芯與移動云從底層的BC-Linux操作系統(tǒng),到

上層的業(yè)務應用均完成了深度優(yōu)化,實現(xiàn)了算力性能的全面提升,滿足其日益增長的業(yè)務需求。安全性強:海光芯深度集成安全協(xié)處理器,支持國密算法、可信執(zhí)行環(huán)境等多層防護,保障移動云平臺的多用戶數(shù)據(jù)安全。性能優(yōu)異:海光依托CPU的多核心架構(gòu)和對DDR5、PCIe

5.0

等IO特性的支持,與移動云磐石DPU服務器、云主機、云數(shù)據(jù)

庫等產(chǎn)品深度整合,滿足其高并發(fā)、低延時的業(yè)務需求,提升

云平臺的整體性能表現(xiàn)。安全可信:海光國密、可信計算及CSV技術(shù),助力移動云打造機密云主機等安全產(chǎn)品,為行業(yè)客戶數(shù)據(jù)提供全鏈路防護。全場景覆蓋:移動云在公有云、邊緣云、智能云等多種云模型

中大規(guī)模使用海光CPU+DCU,智算、通算場景全覆蓋。中國移動云能力中心以云計算、大數(shù)據(jù)和IT支撐系統(tǒng)為核心業(yè)務,致力于推動算力網(wǎng)絡建設(shè)與人工智能技術(shù)融合,助力國家數(shù)字經(jīng)濟發(fā)展。當

前,移動云平臺與海光產(chǎn)品深度融合,在多個產(chǎn)品中使用海光處理器,

共同打造“海光芯”國產(chǎn)化算力底座。5G移動云打造“海光芯”國產(chǎn)化算力底座

方案亮點/

HIGHLIGHTS

實施效果/

IMPLEMENTATION

RESULTS移動云平臺在落實國家信創(chuàng)戰(zhàn)略的基礎(chǔ)上,圍繞通算、智

算、行業(yè)云強化算力基礎(chǔ)設(shè)施升級建設(shè)。背景需求

/

BACKGROUND26

HYGONHYGON25需提升算網(wǎng)核心競爭力,保障規(guī)劃期內(nèi)收入目標的達成。海光DCU行業(yè)實戰(zhàn)手冊凸凸凸

三全自主異構(gòu)架構(gòu):海光CPU與DCU構(gòu)建100%國產(chǎn)化算力引

擎,為“星云”飛控平臺提供安全可靠的底層算力支撐;智能作業(yè)賦能:通過海光DCU驅(qū)動空域資源動態(tài)優(yōu)化、多機協(xié)同調(diào)度及AI實時決策,顯著提升低空作業(yè)的智能化水平與執(zhí)行效率;端到端安全防護:海光芯具備從硬件級安全加密到通信鏈路防護,構(gòu)建全鏈條可信執(zhí)行環(huán)境,保障飛行指令、監(jiān)管數(shù)據(jù)的傳輸

與存儲安全。低成本遷移:兼容主流生態(tài)體系,無縫對接現(xiàn)有軟件系統(tǒng),大幅降低“星云”平臺的開發(fā)成本與遷移成本;高實時決策:海光DCU異構(gòu)加速技術(shù)增強AI實時決策效能,精準滿足低空場景對數(shù)據(jù)處理的毫秒級響應需求;全場景拓展:開放生態(tài)架構(gòu)賦予平臺跨領(lǐng)域穿透力,支持應用軟件與功能模塊在物流、巡檢、安防等多領(lǐng)域快速拓展。中電信無人科技“星云”低空智能飛控平臺與海光CPU及DCU深度融合,依托“C86通用計算+DCU異構(gòu)加速”異構(gòu)算力架構(gòu),實現(xiàn)空域資源

動態(tài)優(yōu)化、多機協(xié)同調(diào)度及AI實時決策,為低空經(jīng)濟智能化發(fā)展注入新

動能。5G低空經(jīng)濟作為國家新質(zhì)生產(chǎn)力的核心組成,政策紅利持續(xù)

釋放。中電信無人科技聚焦無人機通信網(wǎng)絡、空域管理與場景應用三

大領(lǐng)域,亟需構(gòu)建全場景覆蓋、高安全性、強智能化的飛控管理

平臺。中電信無人科技依托海光芯打造低空經(jīng)濟智能飛控平臺方案亮點/

HIGHLIGHTS

實施效果/

IMPLEMENTATION

RESULTS背景需求

/

BACKGROUND28

HYGONHYGON27自主可控的算力底座成為驅(qū)動平臺落地的關(guān)鍵核心。海光DCU行業(yè)實戰(zhàn)手冊凸凸凸

三國家能源集團推動“一區(qū)域一集控”戰(zhàn)略,源于新能源規(guī)?;l(fā)展帶來

的管理挑戰(zhàn)與核心技術(shù)自主可控的雙重需求,系統(tǒng)全棧建設(shè)做到安全

可控,硬件設(shè)備采用海光DCU硬件平臺和解決方案,支撐國家能源集團

整合區(qū)域資源,實現(xiàn)大型新能源場站的遠程控制,發(fā)揮區(qū)域的統(tǒng)一調(diào)度

能力。海光DCU行業(yè)實戰(zhàn)手冊國家能源集團加速推進新能源集控系統(tǒng)國產(chǎn)化

多場景全業(yè)務適配:海光C86滿足集控系統(tǒng)建設(shè)中多種數(shù)據(jù)源全量采集、傳輸、下控、數(shù)據(jù)緩存、計算和采集管理等應用需求。落實電力安全可控:海光C86架構(gòu)確保技術(shù)自主可控,同時依

托海光C86處理器內(nèi)生安全能力,保障遠端集控和新能源場站

數(shù)據(jù)存儲和使用安全。強化供

應交付能力:“一

區(qū)域

集控

”建設(shè)覆蓋27個?。▍^(qū)

、

市),海光協(xié)同生態(tài)合作伙伴對廣闊分布的新能源客戶提供了

穩(wěn)定可靠的方案交付和及時專業(yè)的售后服務。國家推動能源行業(yè)數(shù)字化轉(zhuǎn)型與新型電力系統(tǒng)建設(shè),要求能源

企業(yè)提升集約化管控能力和智能化運營水平。2022年,國家能源集團正式啟動覆蓋27個?。▍^(qū)、市)的新能源

“一區(qū)域一集控”項目建設(shè),其核心目標是構(gòu)建“集中控制、智能

運維、無人值班、少人值守”的生產(chǎn)管控模式。新能源裝機規(guī)?;c地理分散化的矛盾,新能源場站分布極為廣泛,廣闊的分布導致傳統(tǒng)管理模式面臨多重困境。在能源安全戰(zhàn)略和關(guān)鍵技術(shù)自主可控的政策導向下,國家能源

集團通過國產(chǎn)化替換可顯著降低對國外軟硬件的依賴,保障信息安全并降低長期運營成本。國家能源集團“一

區(qū)域

集控

”項目獲得行業(yè)權(quán)威認可:

2025年5月,在第七屆數(shù)字中國峰會上榮獲“最佳成果十佳

解決方案”獎。國家能源集團在“一區(qū)域一集控”建設(shè)中取得了全方位的國產(chǎn)化技術(shù)突破,覆蓋數(shù)據(jù)庫、工控系統(tǒng)、數(shù)據(jù)平臺等關(guān)鍵領(lǐng)域,實現(xiàn)了核心技術(shù)的自主可控與性能超越。HYGON29

30

HYGON“海光C86+海光DCU”在性能、穩(wěn)定性等方面完全滿足新能

源發(fā)電業(yè)務需求,為后續(xù)規(guī)模化部署奠定基礎(chǔ)。通過“一區(qū)域一集控”模式,新能源場站實現(xiàn)站端無人化、少

人化運維,大幅降低人力成本。方案亮點/

HIGHLIGHTS

實施效果/

IMPLEMENTATION

RESULTS背景需求

/

BACKGROUND響應《政府工作報告》“智慧海關(guān)”戰(zhàn)略部署,海關(guān)總署基于海光DCU實現(xiàn)從模型訓練到推理部署的全閉環(huán)支撐,作為海關(guān)智能化轉(zhuǎn)型的核心

基礎(chǔ)設(shè)施,推動監(jiān)管服務向安全、便利、高效全面升級,為外貿(mào)高質(zhì)量發(fā)展提供自主可控的數(shù)字化底座。海光DCU行業(yè)實戰(zhàn)手冊海關(guān)總署建設(shè)全國產(chǎn)人工智能算力平臺

全國產(chǎn)AI算力閉環(huán):基于海光DCU構(gòu)建覆蓋訓練-推理全流程的算力平臺,支持機器學習模型高效開發(fā)與部署。業(yè)務深度集成架構(gòu):將AI能力嵌入核心場景,實現(xiàn)業(yè)務流程智能化再造。自主可控技術(shù)體系:突破算力分散、復用不足等發(fā)展桎梏,建成集約化國產(chǎn)AI計算中樞。傳統(tǒng)業(yè)務流程響應遲緩,亟需AI能力深度集成以優(yōu)化通關(guān)服務

時效。在強化單證審核精準度的同時,需降低監(jiān)管風險,平衡安全與便利雙重目標。大模型訓練與推理需龐大算力支撐,現(xiàn)有基礎(chǔ)設(shè)施難以滿

足智能海關(guān)實時業(yè)務需求。需實現(xiàn)“國貨國用”從建設(shè)到實用化的跨越,確保國產(chǎn)算力“建好、用好、好用”。HYGON31

32

HYGON平臺為海關(guān)通關(guān)使用群體提供一站式的便捷服務,提高企業(yè)和個人的辦事效率,并降低管理管理的人力成本;縮短關(guān)員的審核時長,并通過智能化手段,進一步降低了海關(guān)的核查風險,提高單證審核速度和精準度;方案亮點/

HIGHLIGHTS

實施效果/

IMPLEMENTATION

RESULTS背景需求

/

BACKGROUND全棧國產(chǎn)安全架構(gòu):集成國產(chǎn)冷板液冷模塊、獨立計算網(wǎng)絡及

集群管理系統(tǒng),內(nèi)嵌國密算法與芯片級安全機制。多元算力融合平臺:海光DCU提供FP16/FP32/FP64全精度算力,同步支持科學計算與千億級模型訓練。行業(yè)級液冷創(chuàng)新:自主研發(fā)液冷散熱系統(tǒng),PUE降至1.15以下,成為油氣行業(yè)首個綠色低碳AI基礎(chǔ)設(shè)施。場景深度適配能力:針對地震處理、化工研發(fā)等專業(yè)需求優(yōu)化算力調(diào)度策略,實現(xiàn)業(yè)務-算力精準匹配。業(yè)務賦能質(zhì)效升級,模擬效率指數(shù)級提升,大幅縮短產(chǎn)品研發(fā)周期。高級別安全機制與國密算法支持,實現(xiàn)數(shù)據(jù)長生命周期防護,有效抵御外部惡意攻擊與非法訪問。兼顧通用計算、大規(guī)模AI模型訓練、科學計算等多元場景,有

效推動專業(yè)模型開發(fā)。作為唯一行業(yè)案例入選發(fā)展改革委人工智能示范工程。作為國家發(fā)改委人工智能示范工程唯一行業(yè)案例,中國石化人工智能計算中心引入海光DCU構(gòu)建全棧國產(chǎn)化安全體系與多元算力平臺,實

現(xiàn)勘探開發(fā)、煉油化工、安全環(huán)保等9大類200+場景的AI深度賦能。落實"2025年AI應用國內(nèi)領(lǐng)先"戰(zhàn)略,亟需建設(shè)集約化算力

底座支撐9大類200余項智能場景落地。關(guān)鍵領(lǐng)域需構(gòu)建芯片級安全防護體系,抵御外部惡意攻擊,保障核心數(shù)據(jù)全生命周期安全。地震資料處理、油藏開發(fā)優(yōu)化等場景需大規(guī)模AI算力,傳統(tǒng)基礎(chǔ)設(shè)施難以滿足PB級數(shù)據(jù)處理需求。需統(tǒng)一平臺兼顧科學計算、AI訓練與通用計算,破解業(yè)務系統(tǒng)

算力割裂難題。中國石化建設(shè)油氣行業(yè)首個國產(chǎn)液冷人工智能中心HYGON33

34

HYGON方案亮點/

HIGHLIGHTS

實施效果/

IMPLEMENTATION

RESULTS背景需求

/

BACKGROUND海光DCU行業(yè)實戰(zhàn)手冊全棧國產(chǎn)適配:平臺采用海光C86處理器,覆蓋GATK、BWA、STAR、SPAdes等主流基因組學工具鏈,實現(xiàn)全流程生信數(shù)據(jù)處理;并為分布式存儲提供管理調(diào)度CPU,滿足高I/O需求。深度調(diào)優(yōu)性能優(yōu)異:通過替換高性能JDK、NUMA

內(nèi)存調(diào)度、線程親和性優(yōu)化、OpenMP并行重構(gòu)等方式,對關(guān)鍵應用做深度

適配,GATK提升達

14.8%,BWA提升約28%?;旌县撦d加速:結(jié)合海光DCU高密度部署和原生兼容CUDA的DTK工具鏈,支撐未來異構(gòu)場景和AI4S轉(zhuǎn)型。高并發(fā)作業(yè)支撐:配合智能調(diào)度系統(tǒng),支持每日數(shù)十萬條樣本

處理需求,穩(wěn)定支撐重點課題與研究機構(gòu)數(shù)據(jù)分析任務。支撐重點任務:平臺服務于國家重大生命科學項目,為基因

組學研究提供核心算力支撐。強化國產(chǎn)化生態(tài)示范:實現(xiàn)主流生信工具國產(chǎn)平臺高效運行,驗證了全棧國產(chǎn)架構(gòu)在生命科學領(lǐng)域的落地可行性。提升全流程效率與可控性:實現(xiàn)從數(shù)據(jù)接入、計算調(diào)度到結(jié)

果出圖的全鏈條流程優(yōu)化,顯著提升任務周轉(zhuǎn)效率與系統(tǒng)穩(wěn)定性。海光DCU算力支撐重點生物大數(shù)據(jù)平臺高效運行,配合DTK異構(gòu)計算平臺完全兼容主流生態(tài),助力未來異構(gòu)場景和AI4S轉(zhuǎn)型。實戰(zhàn)場景三:科學計算持續(xù)增長的PB級數(shù)據(jù)存儲與調(diào)度壓力。突變檢測等算法流程對計算/內(nèi)存/I/O資源高度敏感。核心任務需保障全國產(chǎn)軟硬件生態(tài)可用與安全。算法多樣性與系統(tǒng)穩(wěn)定性并重,需支持主流生信工具全流程運行。生物大數(shù)據(jù)平臺面向疾病預警、個體化醫(yī)療、藥物研發(fā)等多類場景,承擔海量測序數(shù)據(jù)分析、突變檢測、結(jié)構(gòu)建模與多模態(tài)融合等任務。平臺需滿足以下關(guān)鍵訴求:北京基因組所海光DCU算力賦能AI4S轉(zhuǎn)型背景需求

/

BACKGROUND方案亮點/

HIGHLIGHTS

案例價值/

ICASE

VALUE36

HYGONHYGON

35海光DCU行業(yè)實戰(zhàn)手冊大裝置具備對地球表面全圈層模擬以及對各類物理、化學和生物過程的精細描述能力,全球尺度地球系統(tǒng)模式水平分辨率達到10~25km,區(qū)域高精度環(huán)境模擬系統(tǒng)空間分辨率達到3km,重點區(qū)域空間分辨率達到1km,在專用于地球系統(tǒng)數(shù)值模擬的計算平臺中性能處于國際領(lǐng)先。方案亮點/

HIGHLIGHTS

案例價值/

CASE

VALUE分子動力學模擬在物理、化學與材料研究中廣泛應用,而經(jīng)典力場精度有限,難以覆蓋復雜體系行為。深勢科技的DeepMD-kit作為基于深

度學習的原子勢能函數(shù)生成框架,可大幅提升精度并支持第一性原理級別的模擬。然而,其訓練過程需處理大規(guī)模原子鄰域數(shù)據(jù)與高維張量計算,對算力平臺提出極高要求,特別是在支持高吞吐推理與訓練性能的同時,還需兼容主流CUDA架構(gòu)與深度學習框架。方案亮點/

HIGHLIGHTS

案例價值/

ICASE

VALUE深勢科技攜手海光構(gòu)建DCU異構(gòu)訓練平臺,成功實現(xiàn)DeepMD高精度

原子勢能模型的大規(guī)模并行訓練,加速推動AI在分子模擬領(lǐng)域的落地與升級。海光算力支持國家大裝置建設(shè),支撐對大氣、海洋、陸地、生物圈等自然過程的高分辨率、多圈層、長時間尺度耦合模擬,實現(xiàn)氣候預測、污染防

控、災害應對等領(lǐng)域的科學計算支撐,推動我國躋身全球地球系統(tǒng)科學

強國行列。海光DCU行業(yè)實戰(zhàn)手冊深勢科技開展高精度原子勢能模型大規(guī)模并行訓練跨尺度高精度模擬:深勢科技聯(lián)合海光平臺,基于國產(chǎn)DCU的

并行訓練方案,將分子動力學模擬規(guī)模從百萬原子拓展至十億原子量級,成功實現(xiàn)跨尺度高精度模擬。高效訓練與推理:海光平臺原生適配DeepMD-kit,支持單精度

(FP32)高效訓練與推理,其中DCU在典型訓練任務中性能對

標國際主流產(chǎn)品,訓練速度達其性能的91.7%。提

吐效

率:無需修改DeepMD源碼,配合海光提供的

DevKit+GPUFusion可實現(xiàn)MPI+OpenMP+CUDA異構(gòu)混合并

行,提升原子鄰域張量計算與數(shù)據(jù)管道吞吐效率。國家大裝置實現(xiàn)多領(lǐng)域科學計算支撐引領(lǐng)地球科學數(shù)值模擬范式轉(zhuǎn)型:從多學科并行建模到AI輔助氣候推演,為我國地學研究邁入大數(shù)據(jù)與智能計算時代奠定基礎(chǔ)。多模式高精度耦合:集成大氣環(huán)流、海洋碳循環(huán)、氣溶膠化學、植被動力學等十余個子系統(tǒng),支持大尺度耦合與微尺度預測。支持廣泛通用應用:面向地球科學、生態(tài)、農(nóng)業(yè)、海洋等多領(lǐng)域

提供計算服務能力,具備通用型算力基礎(chǔ)。軟硬件協(xié)同優(yōu)化:適配地球系統(tǒng)并行軟件框架與可視化系統(tǒng),

完成軟件工具鏈、支撐環(huán)境和調(diào)度系統(tǒng)一體化優(yōu)化。保障數(shù)據(jù)安全與戰(zhàn)略自主:突破地球數(shù)值模擬的技術(shù)壁壘,

實現(xiàn)關(guān)鍵模型與模擬能力國產(chǎn)可控。強化國家科學預測能力:支撐氣候預測、生態(tài)演化和污染控

制等重大科研任務,填補自主高端模擬平臺空白。為AI加速第一性原理分子動力學模擬提供可落地方案,推動從經(jīng)典力場向數(shù)據(jù)驅(qū)動的高精度勢能建模轉(zhuǎn)型。助力科研機構(gòu)構(gòu)建國產(chǎn)異構(gòu)

AI

模擬平臺,支撐藥物設(shè)計、新

材料發(fā)現(xiàn)等任務的模型訓練與大規(guī)模并發(fā)推理。驗證海光DCU在AI4S應用中的通用性與可靠性表現(xiàn),為分

子模擬場景提供可替代的訓練平臺。背景需求

/

BACKGROUND背景需求

/

BACKGROUND

HYGON

37HYGON38全棧國產(chǎn)化架構(gòu):海光DCU實現(xiàn)與東方晶源OPC軟件的深度適

配,覆蓋從光學模型計算到掩模優(yōu)化的全功能模塊。性能對標國際:支持混合精度計算,關(guān)鍵模塊計算效率平替國

際主流。量產(chǎn)級驗證部署:在某芯片企業(yè)成功落地,實現(xiàn)從研發(fā)環(huán)境到

量產(chǎn)產(chǎn)線的無縫遷移。在同等設(shè)計規(guī)則下持平國際方案,首次實現(xiàn)國產(chǎn)算力在高端

芯片制造核心環(huán)節(jié)的平替??s短新產(chǎn)品流片周期,直接規(guī)避國外斷供風險。形成“海光DCU+東方晶源OPC軟件”的全國產(chǎn)技術(shù)鏈,帶動

國內(nèi)EDA工具鏈覆蓋邏輯模擬、工藝仿真、掩膜優(yōu)化等8類異構(gòu)加速場景。海光DCU為東方晶源提供深度計算器,助力東方晶源成功實現(xiàn)光學鄰近效應修正(OPC)技術(shù)的全流程算力國產(chǎn)化替代,在性能比肩國際主

流產(chǎn)品的同時,于量產(chǎn)產(chǎn)線完成驗證落地,構(gòu)建從硬件到軟件的完整國

產(chǎn)化EDA技術(shù)棧。實戰(zhàn)場景四:工程計算東方晶源:海光DCU助力OPC光學鄰近效應修正光刻衍射效應導致的圖形失真修正需迭代數(shù)十次仿真優(yōu)化,占據(jù)

芯片制造周期40%以上時間,是影響良率和量產(chǎn)效率的關(guān)鍵節(jié)點。國際形勢背景下,芯片制造企業(yè)急需國產(chǎn)化替代方案保障OPC環(huán)節(jié)的連續(xù)穩(wěn)定生產(chǎn)。OPC市場長期被國外產(chǎn)品壟斷,國內(nèi)缺乏自主可控的算力底座

與軟件協(xié)同優(yōu)化能力。方案亮點/

HIGHLIGHTS

實施效果/

IMPLEMENTATION

RESULTS背景需求

BACKGROUND海光DCU行業(yè)實戰(zhàn)手冊HYG

ON40

HYGON39中國科學院過程工程研究所EMMS團隊開發(fā)的LMFD(Lattice-based-Multi-FluidsDynamics)軟件包含前處理、求解器和后處理,海光CPU+DCU架構(gòu)通過跨節(jié)點異構(gòu)耦合仿真實現(xiàn)了對該軟件的全過程支

撐,驗證了海光平臺對高分辨率多相流仿真的強大算力支持。異構(gòu)調(diào)度支撐自主求解器并行加速:LMFD核心采用自研雙層

MPI通信模型,通過CPU承擔邊界條件處理與非密集更新任

務,同時調(diào)度多張海光DCU加速卡承擔稠密核心域并行計算,

實現(xiàn)異構(gòu)分工協(xié)同。GPU段融合動態(tài)負載調(diào)度:仿真中GPU承擔85%以上浮點運

算,動態(tài)根據(jù)核心域計算密度自動分配GPU子任務;并基于

DCU提供的CUDA兼容環(huán)境實現(xiàn)原始核函數(shù)無縫運行。自主數(shù)學庫深度融合:底

解中

光自

數(shù)

(hygonblis/hgalloc),進一步優(yōu)化內(nèi)存分配與稠密矩陣算子執(zhí)行效率。中科院過程工程研究所助力LMFD多相流仿真平臺高效運行

突破多相流高分辨率仿真瓶頸:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論