通信行業(yè)深度報(bào)告:超節(jié)點(diǎn):光、液冷、供電、芯片的全面升級(jí)-_第1頁(yè)
通信行業(yè)深度報(bào)告:超節(jié)點(diǎn):光、液冷、供電、芯片的全面升級(jí)-_第2頁(yè)
通信行業(yè)深度報(bào)告:超節(jié)點(diǎn):光、液冷、供電、芯片的全面升級(jí)-_第3頁(yè)
通信行業(yè)深度報(bào)告:超節(jié)點(diǎn):光、液冷、供電、芯片的全面升級(jí)-_第4頁(yè)
通信行業(yè)深度報(bào)告:超節(jié)點(diǎn):光、液冷、供電、芯片的全面升級(jí)-_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

通信106%79%53%26%0%-26% 2025-012025-052025-09數(shù)據(jù)來源:聚源《臺(tái)積電和谷歌表現(xiàn)亮眼,重視硅光超節(jié)點(diǎn):光、液冷、供電、芯片的全面升級(jí)l超節(jié)點(diǎn):依托網(wǎng)絡(luò)互聯(lián)下的“超大型GPU/ASIC”超節(jié)點(diǎn)集群(SuperPod)最早由英偉達(dá)提出,隨著AI模型迭代對(duì)算力需求不斷展)和ScaleOut(橫向擴(kuò)展)兩個(gè)維度。我l超節(jié)點(diǎn)新增scaleup互聯(lián)需求,光、液冷、供電、芯片等環(huán)節(jié)迎升級(jí)超節(jié)點(diǎn)服務(wù)器Rack主要由計(jì)算節(jié)點(diǎn)Comp算力卡、交換芯片、交換機(jī)的需求外,也有望持續(xù)拉動(dòng)高功率電源、高壓l超節(jié)點(diǎn)助力國(guó)產(chǎn)集群性能提升,或彌補(bǔ)單卡算力差距,助力國(guó)產(chǎn)AI發(fā)展國(guó)產(chǎn)超節(jié)點(diǎn)規(guī)模的方式,有望實(shí)現(xiàn)國(guó)產(chǎn)AI基礎(chǔ)設(shè)施性能的彎道超車,助力國(guó)產(chǎn)l投資建議:重視三大主線和四大賽道伴隨AI在訓(xùn)練和推理算力需求持續(xù)增長(zhǎng),超節(jié)點(diǎn)產(chǎn)業(yè)鏈有望長(zhǎng)期受益,我們看好“網(wǎng)絡(luò)端+AIDC+計(jì)算端”三條核心方向,以及“光+液冷+供電+芯片”四大1l風(fēng)險(xiǎn)提示:AI發(fā)展不及預(yù)期、芯片供應(yīng)風(fēng)險(xiǎn)、市場(chǎng)競(jìng)爭(zhēng)加劇等1 行業(yè)深度報(bào)告21、模型發(fā)展下的必然,算力基礎(chǔ)設(shè)施邁入超節(jié)點(diǎn)時(shí)代 42、超節(jié)點(diǎn):依托網(wǎng)絡(luò)互聯(lián)下的“超大型GPU/ASIC” 82.1、Scaleup組網(wǎng)架構(gòu)包括:Fat-tree胖樹拓?fù)?、Mesh類拓?fù)?、Torus拓?fù)涞?92.2、Scaleup協(xié)議:從大廠私有逐步走向開源開放 3、超節(jié)點(diǎn)架構(gòu):新增scaleup互聯(lián)需求,光通信、液冷、供電、芯片等環(huán)節(jié)迎升級(jí) 4、國(guó)產(chǎn)超節(jié)點(diǎn)案例——從華為Atlas900A3到Atlas960,國(guó)產(chǎn)萬卡集群加速發(fā)展 5、投資建議及超節(jié)點(diǎn)板塊部分企業(yè)介紹 215.1、盛科通信:稀缺的國(guó)產(chǎn)商用交換機(jī)芯片龍頭 225.2、中興通訊:自研AI交換芯片,推出國(guó)產(chǎn)GPU超節(jié)點(diǎn)產(chǎn)品 225.3、銳捷網(wǎng)絡(luò):互聯(lián)網(wǎng)數(shù)通白盒交換機(jī)龍頭,布局超節(jié)點(diǎn)產(chǎn)品 235.4、紫光股份:國(guó)內(nèi)服務(wù)器+交換機(jī)市場(chǎng)排頭兵,超節(jié)點(diǎn)產(chǎn)品已規(guī)模部署 235.5、浪潮信息:國(guó)內(nèi)服務(wù)器龍頭,助力國(guó)產(chǎn)GPU超節(jié)點(diǎn)發(fā)展 246、風(fēng)險(xiǎn)提示 25圖1:大模型持續(xù)迭代升級(jí) 4圖2:算力集群拓展方向Scaleup+Scaleout 5圖3:算力集群Scaleup+Scaleout組網(wǎng)連接 5圖4:集群規(guī)模擴(kuò)大,Scaleup先行 5圖5:基礎(chǔ)設(shè)施scaleup加速,邁入超節(jié)點(diǎn)時(shí)代 6圖6:AI大模型采取并行策略訓(xùn)練 6圖7:稠密模型和稀疏模型通信模式的差異 7圖8:超節(jié)點(diǎn)服務(wù)器對(duì)推理架構(gòu)優(yōu)化 7圖9:傳統(tǒng)8卡采用的2種直連拓?fù)浣Y(jié)構(gòu) 8圖10:英偉達(dá)引入NVSwtich互聯(lián) 8圖11:H200配備4顆NVSwitch芯片 8圖12:NVL72超節(jié)點(diǎn)引入Switchtray一層拓?fù)?9圖13:NVL72超節(jié)點(diǎn)通過9個(gè)NVlinkSwitchtray互聯(lián) 9圖14:NVL5762層Clos拓?fù)浣M網(wǎng) 9圖15:英偉達(dá)推出NVL576 9圖16:背脊互聯(lián)的Fattree拓?fù)?圖17:AMDMI350Fullmesh互聯(lián) 圖18:華為柜內(nèi)64卡采用2Dfullmesh 圖19:GoogleTPU采用3DTorus拓?fù)浼軜?gòu) 圖20:UALink分層架構(gòu)圖 圖21:博通發(fā)布TomahawkUltra支持HPC及Scaleup 圖22:更加開放的以太網(wǎng)SUE架構(gòu) 圖23:計(jì)算單元通過UB完成全局同步 圖24:海光雙芯戰(zhàn)略 圖25:OISA三層核心架構(gòu) 圖26:多方助力OISA建設(shè) 3圖27:超節(jié)點(diǎn)機(jī)柜正面外觀示意圖 圖28:超節(jié)點(diǎn)機(jī)柜背面外購(gòu)示意圖 圖29:計(jì)算節(jié)點(diǎn)拓?fù)浣Y(jié)構(gòu) 圖30:計(jì)算節(jié)點(diǎn)布局圖 圖31:交換節(jié)點(diǎn)系統(tǒng)功能框圖 圖32:?jiǎn)涡酒軜?gòu)下交換節(jié)點(diǎn)系統(tǒng)框圖 圖33:機(jī)柜功耗持續(xù)攀升帶動(dòng)Powershelf和PSU需求 圖34:采用Busbar為各節(jié)點(diǎn)提供電源 圖35:華為CloudMatrix384超節(jié)點(diǎn)由12個(gè)計(jì)算柜組成 圖36:910C采用雙die方案 圖37:Node內(nèi)CPU和NPU通過UB互聯(lián) 圖38:CloudMatrix384節(jié)點(diǎn)UB網(wǎng)絡(luò)分為L(zhǎng)1和L2層 圖39:CloudMatrix384節(jié)點(diǎn)包含UB、RDMA、VPC平面 圖40:CloudMatrix384集群性能高于GB200NVL72 圖41:Atlas950支持8192張NPU組網(wǎng) 20圖42:Atlas960支持15488張NPU組網(wǎng) 20圖43:盛科通信產(chǎn)品覆蓋多領(lǐng)域交換芯片及網(wǎng)絡(luò)產(chǎn)品 22圖44:中興通訊發(fā)布搭配自研AI大容量凌云AI交換芯片的超節(jié)點(diǎn)系統(tǒng) 23圖45:銳捷網(wǎng)絡(luò)展示ETH128交換產(chǎn)品 23圖46:紫光股份發(fā)布H3CUniPoDS80000超節(jié)點(diǎn)產(chǎn)品 24圖47:浪潮信息發(fā)布SD200超節(jié)點(diǎn)服務(wù)器 24表1:NVLink的演進(jìn) 表2:超節(jié)點(diǎn)板塊受益標(biāo)的估值表 21 行業(yè)深度報(bào)告4輸入輸出、多模態(tài)輸入/輸出、長(zhǎng)思維等特點(diǎn),模型參數(shù)持續(xù)突破(從千億級(jí)陸續(xù)走從大語(yǔ)言到多模態(tài),模型參數(shù)量提升至萬億級(jí)。隨著基礎(chǔ)大模型參數(shù)量從千億邁向萬億,大模型預(yù)訓(xùn)練過程對(duì)底層智能算力的訴求進(jìn)一步升級(jí)。頭部基礎(chǔ)大模型的訓(xùn)練算力需求已達(dá)到十萬億兆量級(jí),且仍以每年4.1倍的速度快速增長(zhǎng),例如型參數(shù)量達(dá)2.4T。模型預(yù)訓(xùn)練對(duì)千卡、萬卡算力集程,模型不光隨著參數(shù)量提升而提高性能,還能基于強(qiáng)化學(xué)習(xí)、思維鏈等算法創(chuàng)新級(jí),發(fā)現(xiàn)了明顯的性能提升,驗(yàn)證了模型的性能會(huì)隨著思考的次數(shù)的增長(zhǎng)而不斷提Up(縱向擴(kuò)展)和ScaleOut(橫向擴(kuò)展交換機(jī)等,同時(shí)需搭配供電、制冷設(shè)備等其他設(shè)備以確保超節(jié)點(diǎn)機(jī)柜的運(yùn)行。 行業(yè)深度報(bào)告5過去算力集群擴(kuò)張主要采用Scale-Out架構(gòu)型的核心架構(gòu)方向,而大模型分布式訓(xùn)練,使得跨服務(wù)器的帶寬與時(shí)延成為根本瓶單卡GPU遠(yuǎn)不足以承載模型,高帶寬域 行業(yè)深度報(bào)告6放入單個(gè)加速卡中進(jìn)行訓(xùn)練。此時(shí)的并行策略主要是數(shù)據(jù)并行,單卡的計(jì)算能力是(3)超節(jié)點(diǎn)服務(wù)器集群階段(大模型主導(dǎo)當(dāng)模型參數(shù)達(dá)到千億乃至萬億級(jí)別,單機(jī)已無法滿足需求,必須使用大規(guī)模服務(wù)器業(yè)界通過引入序列并行、專家并行等更復(fù)雜的并行策略,進(jìn)行分布式訓(xùn)練,訓(xùn)練集行(CP)等多種并行維度的乘積。模式也從單卡單機(jī)走向多機(jī)大專家并行,隨著用戶數(shù)量持續(xù)增長(zhǎng),需同時(shí)兼顧多并發(fā)需求。語(yǔ)言模型走向多模態(tài)/多任務(wù)理解和生成,對(duì)算力及訪存需求變大,此外,模型輸入序列長(zhǎng)度不斷增長(zhǎng),對(duì)KVCache緩存提出新 行業(yè)深度報(bào)告7 行業(yè)深度報(bào)告82、超節(jié)點(diǎn):依托網(wǎng)絡(luò)互聯(lián)下的“超大型GPU/ASIC”擴(kuò)展,搭配8卡GPU服務(wù)器模組的AI服務(wù)器,多采用full進(jìn)入超節(jié)點(diǎn)機(jī)柜服務(wù)器時(shí)代,我們認(rèn)為構(gòu)造超節(jié)點(diǎn)聯(lián),硬件與軟件協(xié)議需互相適配整合,使得數(shù)個(gè)分離的算 行業(yè)深度報(bào)告9資料來源:ODCC《扁平化智算網(wǎng)絡(luò)架構(gòu)研究報(bào)告》單個(gè)框包含36個(gè)B200和L1層的N資料來源:ODCC《扁平化智算網(wǎng)絡(luò)架構(gòu)研究報(bào)告》采用RoCE方案,整機(jī)柜GPU互聯(lián)帶寬為204.8Tbps。8個(gè)SwitchTray支持409.6Tbps的帶寬,一半用于超節(jié)點(diǎn)柜內(nèi)連接GPU,另一半的帶寬用于背靠背連接旁邊機(jī)柜的超節(jié)點(diǎn)或者通過L2層HB架構(gòu)適配于物理承重與供電能力受限的機(jī)房環(huán)境。結(jié)構(gòu),即任意兩個(gè)節(jié)點(diǎn)都有一條邊互聯(lián)。以AMDMI350高維度拓?fù)鋵?shí)現(xiàn)機(jī)房級(jí)、樓層級(jí)、數(shù)據(jù)中心級(jí)互聯(lián)。 行業(yè)深度報(bào)告體(Cube)內(nèi)的TPU處理器通過銅互連(銅ICI)應(yīng)64個(gè)機(jī)架)組成,可組合出最大8×16×16(2048顆芯片)的切片;TPUv5p的片集群,該架構(gòu)將故障域縮小至單個(gè)立方體,提升系統(tǒng)可靠性。 行業(yè)深度報(bào)告條高速差分信號(hào)通道組成鏈路的方式進(jìn)行點(diǎn)對(duì)點(diǎn)通信,允許同時(shí)進(jìn)行多個(gè)數(shù)據(jù)傳輸NVLink1.0NVLink2.0NVLink3.0NVLink4.0NVLink1.0NVLink2.0NVLink3.0NVLink4.0NRZNRZNRZ46NVSwitch2.0NVSwitch3.0英特爾、博通、Meta、微軟等公司共同發(fā)起的一項(xiàng)開放式互連標(biāo)準(zhǔn),后續(xù)阿里、蘋果等廠商相繼加入,成員均可參與開發(fā)和采用,從而促進(jìn)生態(tài)系統(tǒng)的創(chuàng)新和豐富。UAlink在物理層和鏈路層同樣復(fù)用以太網(wǎng)技術(shù),UALink1.0支持每通道最高200點(diǎn)組成的整個(gè)POD上進(jìn)行Load/Store操 行業(yè)深度報(bào)告以支持大規(guī)模數(shù)據(jù)集處理、深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練及并行任務(wù)執(zhí)行。XPU與XPU之間(含交換機(jī)傳輸時(shí)間)通信延時(shí)低于400ns。SUE要求端到端往返位于2024年6月共同發(fā)布了OISA(Omni-directionalIntelligentSensingExpress具備支持原生內(nèi)存語(yǔ)義、創(chuàng)新TLP報(bào)文重構(gòu)技術(shù)、支持智能switch交換機(jī)、供電單元Powersh交換芯片、交換機(jī)的需求外,也有望持續(xù)拉內(nèi)存條、存儲(chǔ)等部件。四個(gè)GPU(OAM)適配在CarrierBoard上,單板上BMC、SSD、或額外的光端口以及管理接口等部件。此外,節(jié)點(diǎn)內(nèi)采用風(fēng)液混合方式散熱,交換芯片搭配液冷冷板套件。資料來源:ODCC《ETH-X超節(jié)點(diǎn)AI整機(jī)柜設(shè)計(jì)規(guī)范》資料來源:ODCC《ET風(fēng)液混合,液冷為主,風(fēng)冷為輔,液冷占比80%以上,未來有望最終轉(zhuǎn)變?yōu)槿豪?行業(yè)深度報(bào)告資料來源:華為《ServingLargeLanguageModelsonHua 行業(yè)深度報(bào)告鏈接到Supernode結(jié)構(gòu)中的L2層交換機(jī);RDMA平面:只有NPU參與次級(jí)RDMA資料來源:華為《ServingLargeLanguageModelsonHua(3)UB交換系統(tǒng):板載L1層UB交換芯片鏈接至4個(gè)資料來源:華為《ServingLargeLanguageModelsonHua總體來看,CloudMatrix384超節(jié)起來,使得節(jié)點(diǎn)間通信性能接近節(jié)點(diǎn)內(nèi)水平,節(jié)點(diǎn)間帶寬衰減小于3%,節(jié)點(diǎn)間延遲速傳輸,支持使用RDMA兼容框架的分布式訓(xùn)練和推理,并保持了多集群部署中資料來源:華為《ServingLargeLanguageModelsonHua超節(jié)點(diǎn)助力國(guó)產(chǎn)集群性能提升,彌補(bǔ)單卡算力差距。從單卡和集群性能對(duì)比上910C芯片BF16性能僅為GB200模組的1/3,但通過超節(jié)點(diǎn)集群的方式,單個(gè) 行業(yè)深度報(bào)告20 行業(yè)深度報(bào)告21軟件、潤(rùn)澤科技;受益標(biāo)的:萬國(guó)數(shù)據(jù)、世紀(jì)互聯(lián)、云賽智 行業(yè)深度報(bào)告22盛科通信產(chǎn)品覆蓋100Gbps~25.6Tbps交換容量及100M入市場(chǎng)推廣和逐步應(yīng)用階段,有望持續(xù)受益于網(wǎng)絡(luò)產(chǎn)品國(guó)產(chǎn)化。公司是全球領(lǐng)先的綜合通信與信息技術(shù)解決方案提供商,基于ICT全棧核心能力,商網(wǎng)絡(luò)、政企業(yè)務(wù)和消費(fèi)者業(yè)務(wù)。公司服

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論