2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告_第1頁
2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告_第2頁
2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告_第3頁
2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告_第4頁
2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告_第5頁
已閱讀5頁,還剩86頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

20252025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告單志廣張?jiān)迫螌毢陱垙V彬I著支持單位:益企研究院222025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告編寫委員會(huì)CONTENTS·目錄 2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告 CONTENTS·目錄 20252025中2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告AI計(jì)算開放架構(gòu)研究背景12CHAPTER1·AI計(jì)算開放架構(gòu)研究背景型規(guī)模進(jìn)一步擴(kuò)大,推動(dòng)人工智能從感知向認(rèn)知、從分析判斷式向生成式、從專用向根據(jù)ScalingLaw(規(guī)模定律模型性能與參數(shù)其訓(xùn)練的參數(shù)量也相應(yīng)增長至1.8萬億,需要在2.5萬張A100上訓(xùn)練90-100著國內(nèi)大模型技術(shù)的長足進(jìn)步,達(dá)到了世界領(lǐng)先水平,DeepSeek大模型的快速推廣32025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告智算需求迅猛增長,萬卡集群建設(shè)加速推進(jìn)。隨著AIGC技術(shù)發(fā)展,以DeepSeek為代表的開源大模型正逐漸滲透到諸多行業(yè),引發(fā)新一代人工智能技術(shù)發(fā)能計(jì)算能力和大規(guī)模數(shù)據(jù)處理能力,以應(yīng)對(duì)復(fù)雜的算法和模型,處理海量數(shù)據(jù),支撐同時(shí),多模態(tài)融合技術(shù)的興起,將文本、圖像、音頻等多種數(shù)據(jù)模態(tài)進(jìn)行融合處理,Sora、GPT-4o、Gemini等多模態(tài)大模型的海量數(shù)據(jù)、高清晰度的多輪去噪也將帶來算力百倍以上的增長。以文生視頻大模型Sora為例,Sora生成60秒視頻對(duì)比《2025人工智能指數(shù)報(bào)告》顯示,標(biāo)準(zhǔn)人工智能訓(xùn)練模型的計(jì)算需求約每5個(gè)月翻一番,大語言模型訓(xùn)練數(shù)據(jù)集規(guī)模約每8個(gè)月翻一番。隨著模型參數(shù)和訓(xùn)練集群規(guī)模越來越大,訓(xùn)練也從單機(jī)單卡轉(zhuǎn)變成多機(jī)多卡,甚至萬卡集群的訓(xùn)練,以支持千億級(jí)甚至萬億級(jí)參數(shù)規(guī)模的大模型訓(xùn)練,從而大幅壓縮大模型訓(xùn)練時(shí)間,以實(shí)現(xiàn)模型大模型推理成為落地應(yīng)用的關(guān)鍵環(huán)節(jié),通過硬件、軟件一體化集成,大模型技術(shù)能力提升進(jìn)一步推動(dòng)了大模型的研發(fā)與落地應(yīng)用浪潮。大模型一體機(jī)同時(shí),基礎(chǔ)大模型(千億級(jí)以上參數(shù))預(yù)訓(xùn)練及高通量推理應(yīng)用需要大規(guī)模智算集群支撐。隨著模型參數(shù)量從千億邁向萬億,模型能力更加泛化,大模型對(duì)底層智算基礎(chǔ)設(shè)施的要求進(jìn)一步升級(jí),萬卡集群成為這一輪大模型基建軍備競(jìng)賽的標(biāo)配,萬卡集群有助于壓縮大模型訓(xùn)練時(shí)間,實(shí)現(xiàn)模型能力的快速迭代。萬卡集群是指由一萬張CHAPTER1·AI計(jì)算開放架構(gòu)研究背景4能算法研發(fā)及生態(tài)服務(wù)等方面的技術(shù)創(chuàng)新。如Google推出超級(jí)計(jì)算機(jī)A3Virtual訓(xùn)練大語言模型。中科曙光為多個(gè)國家級(jí)超算中心建設(shè)萬卡集群,并接入國家超算互聯(lián)網(wǎng)(SCNet支撐大模型推理、智能體開發(fā)、AIforScience科學(xué)大模型研發(fā)訓(xùn)為國內(nèi)科技產(chǎn)業(yè)的發(fā)展貢獻(xiàn)了創(chuàng)新動(dòng)力。大型AI研發(fā)企業(yè)出于對(duì)大全球算力呈現(xiàn)出多元異構(gòu)發(fā)展、智算加速擴(kuò)張的總體態(tài)勢(shì)?;?023年全球算2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告5提升計(jì)算效率和性能。異構(gòu)算力融合成為提升算力效能用算力、智能算力和超級(jí)算力協(xié)同發(fā)展的供給體系[《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》(工信部聯(lián)通信〔2023〕180號(hào))]格局進(jìn)一步強(qiáng)化。其中,智能算力規(guī)模在據(jù)IDC測(cè)算,2023至2028年我國智能算力規(guī)模的五年年復(fù)合增長率可達(dá)到CPU、GPU、FPGA、ASIC等不同類型的處理器在執(zhí)行模型訓(xùn)練、推理等工作任務(wù)時(shí)優(yōu)勢(shì)各異,通過科學(xué)組合可以為不同計(jì)算任務(wù)匹配最合適的計(jì)算資源,從而大幅海光DCU系列、華為昇騰系列、寒武紀(jì)思元系列、壁仞科技BR100系列專為CHAPTER1·AI計(jì)算開放架構(gòu)研究背景6雖然算力變得愈加重要,但是其發(fā)展卻面臨供需矛盾問題。一方面,對(duì)算力的需求增長迅猛。無論是企業(yè)數(shù)字化轉(zhuǎn)型,還是智能終端消費(fèi)和移動(dòng)數(shù)據(jù)流量消費(fèi)規(guī)模的不斷擴(kuò)大,都在持續(xù)釋放算力需求;另一方面,傳統(tǒng)的單一計(jì)算架構(gòu)面臨性能和功耗型的指令集和體系架構(gòu)的計(jì)算單元組成的系統(tǒng)的計(jì)算方式,在云數(shù)據(jù)中心、邊緣計(jì)算異構(gòu)智算技術(shù)未來的發(fā)展趨勢(shì),將會(huì)呈現(xiàn)開放、融合、聚合的特點(diǎn)。其中,開放準(zhǔn)的;融合是指搭載多種類型的芯片,提供多元的能力;聚合則要求智算中心的建設(shè)而軟件棧能否無縫地協(xié)同、調(diào)度不同類型的算力資源,為開發(fā)者提供統(tǒng)一、高效1.3中國人工智能發(fā)展面臨算力瓶頸持續(xù)增長,并推動(dòng)計(jì)算系統(tǒng)架構(gòu)升級(jí)。大規(guī)模智能計(jì)算集群成為支撐大模型創(chuàng)新的關(guān)鍵算力底座。同時(shí),在美國持續(xù)加強(qiáng)對(duì)華科技戰(zhàn)的大背景下,全球信息技術(shù)產(chǎn)業(yè)生態(tài)2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告7在芯片、模型、基礎(chǔ)軟件等核心技術(shù)自主創(chuàng)新突破的基礎(chǔ)上,發(fā)展更大規(guī)模、更等關(guān)鍵算力指標(biāo)上與英偉達(dá)旗艦產(chǎn)品存在2-3代技術(shù)差,難以滿足大模型訓(xùn)練對(duì)高并芯片組成集群來完成任務(wù),既增加硬件成本,也帶來集群管理復(fù)雜度提升、芯片間數(shù)訓(xùn)練同樣參數(shù)規(guī)模的大模型,使用國產(chǎn)芯片的訓(xùn)練費(fèi)用和時(shí)間成本比使用國際先傳統(tǒng)的單卡計(jì)算已經(jīng)無法滿足人工智能大模型訓(xùn)練的需求,因此多卡集群的方式CHAPTER1·AI計(jì)算開放架構(gòu)研究背景8算力利用率提升至90%。而國產(chǎn)芯片的互聯(lián)帶寬僅200-400GB/s,與國際領(lǐng)先水平卡級(jí)及以上集群)總量缺口持續(xù)擴(kuò)大,發(fā)達(dá)地區(qū)的高峰時(shí)段或特定應(yīng)用場(chǎng)景下算力短水平,配套生態(tài)跟不上是其中的一個(gè)重要原因。如果不進(jìn)行配套生態(tài)的完善,那么即軟硬件適配方面,國產(chǎn)算力硬件與各類算法、軟件的適配度仍有待提升,算法優(yōu)是異構(gòu)芯片,如果不同硬件系統(tǒng)相互封閉,互聯(lián)總線標(biāo)準(zhǔn)接口不統(tǒng)一,軟件?;ゲ患嫒?,不能協(xié)調(diào)和打通,將導(dǎo)致難以實(shí)現(xiàn)有效整合利用,無法滿足大型企業(yè)和科研機(jī)構(gòu)供需匹配方面,我國智算中心在建設(shè)初期往往過于注重硬件規(guī)模,忽視了應(yīng)用生許多智算中心建成后,缺乏與之適配的行業(yè)應(yīng)用,大量算力處于空閑狀態(tài)。部分地方政府主導(dǎo)建設(shè)的智算中心,由于沒有結(jié)合當(dāng)?shù)禺a(chǎn)業(yè)特色打造應(yīng)用場(chǎng)景,實(shí)際利用2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告HAPTER2AI計(jì)算開放架構(gòu)概念與意義CHAPTER2·AI計(jì)算開放架構(gòu)概念與意義2.1計(jì)算架構(gòu)演變史:合久必分,分久必合最早的計(jì)算機(jī)是大型主機(jī)計(jì)算機(jī)——占據(jù)一個(gè)房間的大規(guī)模硬件設(shè)備。大型主機(jī)大型機(jī)時(shí)代的計(jì)算架構(gòu)是集中式的,即一臺(tái)或多臺(tái)主計(jì)算機(jī)為中心節(jié)點(diǎn),所有數(shù)據(jù)集中存儲(chǔ)并處理,終端或客戶端主要負(fù)責(zé)數(shù)據(jù)的錄入和輸出,而數(shù)據(jù)的存儲(chǔ)與控制處理則完全由中心節(jié)點(diǎn)負(fù)責(zé)。其軟件的總體架構(gòu)也是集中式的、封閉的。最典型的代在大型機(jī)時(shí)代,這些大型機(jī)使用專用的處理器指令集、操作系統(tǒng)和應(yīng)用軟件。故隨著計(jì)算機(jī)系統(tǒng)向網(wǎng)絡(luò)化和微型化方向的快速發(fā)展,傳統(tǒng)的集中式處理模型逐漸集群就是指一組(若干個(gè))相互獨(dú)立的計(jì)算機(jī),利用高速通信網(wǎng)絡(luò)組成的一個(gè)較大的計(jì)算機(jī)服務(wù)系統(tǒng),每個(gè)集群節(jié)點(diǎn)(即集群中的每臺(tái)計(jì)算機(jī))都是運(yùn)行各自服務(wù)的通常一套系統(tǒng)集群架構(gòu),只需要幾臺(tái)或數(shù)十臺(tái)服務(wù)器主機(jī)即可。與動(dòng)輒價(jià)值上百萬元的專用超級(jí)計(jì)算機(jī)相比便宜了很多。在達(dá)到同樣性能需求的條件下,采用計(jì)算機(jī)柜、超大規(guī)模集群為核心載體,通過軟硬協(xié)同、資源池化與智能調(diào)度實(shí)現(xiàn)算力效率2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告的系統(tǒng)。與傳統(tǒng)架構(gòu)不同的是,超節(jié)點(diǎn)可以通過高速互聯(lián)技術(shù),彌補(bǔ)),柜服務(wù)器中既有服務(wù)器、又有機(jī)柜,它將機(jī)柜和服務(wù)器作為一個(gè)整體來考慮,采用封閉式設(shè)計(jì),將服務(wù)器、供電、散熱等組件集成于標(biāo)準(zhǔn)機(jī)柜內(nèi)。因?yàn)樵谝?guī)模等因素驅(qū)動(dòng)下相對(duì)更具備打破次元壁的條件,所以它在互聯(lián)網(wǎng)和云計(jì)算的公司里,以及現(xiàn)在的智2.2集群組網(wǎng)方式:ScaleUp與ScaleOut開放計(jì)算的實(shí)踐始于Facebook在2009年應(yīng)對(duì)基礎(chǔ)設(shè)施挑戰(zhàn)的舉措。其設(shè)計(jì)的CHAPTER2·AI計(jì)算開放架構(gòu)概念與意義項(xiàng)目組。該工作組旨在建立一整套可兼容各類AI加速器的技術(shù)標(biāo)準(zhǔn),解決AI計(jì)算基礎(chǔ)設(shè)施建設(shè)中硬件和生態(tài)割裂的重大挑戰(zhàn)。OAI工作組推進(jìn)的開放技術(shù)規(guī)范涉及),GPU、FPGA或其他加速器之間實(shí)現(xiàn)高速高效的互聯(lián),滿足現(xiàn)今高性能異構(gòu)計(jì)算的要了原來云平臺(tái)管理服務(wù)器的辦法,通過Scale-up(縱2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告Scale-up通過增加單臺(tái)服務(wù)器(節(jié)點(diǎn))的GPU數(shù)量或性能(如使用更高算力的GPU)來提升計(jì)算能力,Scale-out通過增加服務(wù)器節(jié)點(diǎn)數(shù)量(分布式架構(gòu))來提升張GPU(或AI算力芯片)緊密耦合的集群化架構(gòu),旨在突破傳統(tǒng)分布式算力集群的是節(jié)點(diǎn)內(nèi)部連接。它的連接速率更高,時(shí)延更低,性能更強(qiáng)勁。在2014年,英偉達(dá)HSL是海光信息自主研發(fā)的高性能互聯(lián)協(xié)議,具有高帶寬、低延遲、全局地址空間一致性、全棧開放和靈活擴(kuò)展等顯著特點(diǎn)。相比傳統(tǒng)PCIe接口,HSL總線大幅降支持從單機(jī)多卡到大規(guī)模智算集群的彈性擴(kuò)展。海光信息宣布在2025年第四季度發(fā)CHAPTER2·AI計(jì)算開放架構(gòu)概念與意義2.3AI計(jì)算開放架構(gòu)的概念與定義AI計(jì)算開放架構(gòu),旨在面向大規(guī)模智能計(jì)算場(chǎng)景,聯(lián)合芯片基于開放架構(gòu)和產(chǎn)業(yè)跨層協(xié)作優(yōu)化,一方面以GPU為核心進(jìn)行一體化緊耦合設(shè)2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告?多元算力:適配多品牌GPU加速卡,滿足大模型訓(xùn)練推理、AIfor?綠色高效:通過先進(jìn)液冷等技術(shù),適配高功率高性能加速部件極致?生態(tài)繁榮:兼容主流異構(gòu)計(jì)算生態(tài),提高國產(chǎn)AI算力的適用性與易CHAPTER2·AI計(jì)算開放架構(gòu)概念與意義2.4國內(nèi)外AI計(jì)算架構(gòu)發(fā)展一覽AI計(jì)算效率的核心策略。英偉達(dá)的GPU針對(duì)大模型訓(xùn)練和推理過程中大規(guī)模并行計(jì)算的特點(diǎn),不斷優(yōu)化顯存架構(gòu)與互聯(lián)技術(shù);Arm的Lumex芯片針對(duì)移動(dòng)端設(shè)備電池隨著大模型參數(shù)規(guī)模的不斷膨脹,訓(xùn)練所需的算力呈指數(shù)級(jí)增長,傳統(tǒng)單機(jī)架構(gòu)已無法滿足需求。國際企業(yè)紛紛推出分布式AI計(jì)算架構(gòu)來應(yīng)對(duì)這一挑戰(zhàn)。英偉達(dá)的隨著AI技術(shù)對(duì)智能終端的需求日益增加,國際企業(yè)積極布局,加速推動(dòng)AI能力在移動(dòng)端與邊緣端的落地。以Arm為代表的科技公司推出的AI移動(dòng)芯片,搭載于蘋通過研發(fā)低功耗硬件,并結(jié)合輕量化模型適配技術(shù),國際企業(yè)實(shí)現(xiàn)了邊緣端AI計(jì)算能力算力提升和成本降低的雙重突破,有力地推動(dòng)了智能設(shè)備在各行業(yè)、各領(lǐng)域的廣泛2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告國內(nèi)企業(yè)注重平臺(tái)化、聯(lián)盟化模式推動(dòng)架構(gòu)開放,形成產(chǎn)業(yè)鏈合力。OpenI啟智型、1000+數(shù)據(jù)集,提供超10PFlops共享算力,支持高校、企業(yè)開發(fā)者開展聯(lián)合研20多家產(chǎn)業(yè)鏈上下游企業(yè),正式發(fā)布了國內(nèi)首個(gè)AI計(jì)算開放架構(gòu),并推出巴Hanguang800芯片支撐Qwen系列大模型在金融風(fēng)控、醫(yī)療影像診斷等場(chǎng)景的CHAPTER2·AI計(jì)算開放架構(gòu)概念與意義2.5AI計(jì)算開放架構(gòu)產(chǎn)品、方案國和世界其他地區(qū)的多元化成員企業(yè),涵蓋多個(gè)關(guān)鍵領(lǐng)域,其使命是為實(shí)現(xiàn)可擴(kuò)展的計(jì)算,提供高效的服務(wù)器,存儲(chǔ)和數(shù)據(jù)中心硬件成員通過公開分享、開放協(xié)作,向全球貢獻(xiàn)技術(shù)規(guī)范、設(shè)計(jì)方案、白皮書及最佳實(shí)踐文檔,加速包括數(shù)據(jù)中心在內(nèi)的IT基礎(chǔ)設(shè)施創(chuàng)新方案的應(yīng)用實(shí)踐。截至目前,OCP已建立了冷卻環(huán)境、服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)、硬件管理、機(jī)架和電源、AI、邊緣計(jì)算等2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告子項(xiàng)目,推動(dòng)開放式光交換技術(shù)協(xié)作,滿足人工智能等數(shù)據(jù)密集型應(yīng)用對(duì)高帶寬、低延遲和能效日益增長的連接需求。與傳統(tǒng)電交換不據(jù)傳輸,顯著降低大規(guī)模AI工作負(fù)載的功耗并提升可靠性。OCS技術(shù)為規(guī)模不斷擴(kuò)無縫集成,又能適配相同的軟件定義網(wǎng)絡(luò)API及管理框架,在優(yōu)化資源配置、提升性而提高數(shù)據(jù)中心和數(shù)字基礎(chǔ)設(shè)施供應(yīng)鏈的效率,其成員包括數(shù)據(jù)中心運(yùn)營商、私有云建立全新標(biāo)準(zhǔn)的組織,旨在為不同規(guī)模、不同種類的數(shù)據(jù)中心提供創(chuàng)新方案,解決能耗、密度、靈活性等現(xiàn)實(shí)問題。其創(chuàng)新性地引入了“基于模塊”的即開放標(biāo)準(zhǔn),以期獲得超大規(guī)模的計(jì)算效率。憑借獨(dú)特的電源架設(shè)計(jì)和機(jī)柜模塊(Brick該開源設(shè)計(jì)實(shí)現(xiàn)了顛覆性的效率提升、組件復(fù)用和成本降低,同時(shí)保持了對(duì)服務(wù)器模ODCC是在中國通信標(biāo)準(zhǔn)化協(xié)會(huì)指導(dǎo)下,以開放、造活躍、高效、有國際競(jìng)爭(zhēng)力的生態(tài)圈和開放平臺(tái),推動(dòng)形成行業(yè)統(tǒng)一、有國際影響CHAPTER2·AI計(jì)算開放架構(gòu)概念與意義ODCC源自2011年由阿里巴巴、百度、騰訊發(fā)起,英特爾擔(dān)任技術(shù)顧問的整機(jī)開放數(shù)據(jù)中心委員會(huì),將Scorpio的研究?jī)?nèi)容從服務(wù)器擴(kuò)展到涵蓋模塊化數(shù)據(jù)中心設(shè)國信通院、京東和美團(tuán)。會(huì)員單位超過200家,覆蓋數(shù)據(jù)中心行業(yè)的上下游企業(yè)。OCTC是中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)的下屬分支機(jī)構(gòu),成立于2022年,主要成員來自ICT最終用戶以及上下游生態(tài)伙伴,其工作范圍涵蓋新型數(shù)據(jù)中心全產(chǎn)業(yè)鏈2024年9月,OCTC正式發(fā)布了服務(wù)器帶內(nèi)管理軟件首個(gè)開源項(xiàng)目,旨在為服務(wù)器帶內(nèi)管理提供一套功能全面、高性能、易擴(kuò)展的標(biāo)準(zhǔn)化管理軟件,支撐海量設(shè)備動(dòng)打通帶內(nèi)帶外管理,軟件實(shí)現(xiàn)關(guān)鍵性能指標(biāo)實(shí)時(shí)收集,利用監(jiān)控告警機(jī)用低于200MiB,采用優(yōu)化的時(shí)序數(shù)據(jù)庫持久化處理性能數(shù)據(jù),具備自動(dòng)熔斷能力。國家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心于2018年組建成立,旨在圍繞國產(chǎn)芯片建立、健全機(jī)、基礎(chǔ)軟件、應(yīng)用軟件、計(jì)算服務(wù)的全棧技術(shù)生態(tài)體系。截至目前,光合組織已經(jīng)2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告2025年9月,國家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心一方面協(xié)同芯片、整機(jī)、應(yīng)用等企業(yè)推進(jìn)技術(shù)能力開放,包括海光信息的開放系統(tǒng)互聯(lián)總線HSL、曙光數(shù)設(shè)計(jì)規(guī)范、曙光DeepAI基礎(chǔ)軟件棧與OneScience科學(xué)大模型開發(fā)平臺(tái)、中科天機(jī)人工智能技術(shù)在過去幾年中迅速發(fā)展,在大數(shù)據(jù)、云計(jì)算、深度學(xué)習(xí)等領(lǐng)域的應(yīng)導(dǎo)地位,構(gòu)建起以專用硬件和開源生態(tài)協(xié)同為核心的發(fā)展模式,覆蓋云、邊、端等多NVIDIAGB200NVL72機(jī)架以及計(jì)算和交換機(jī)托盤液冷設(shè)計(jì),是英偉達(dá)向OCP貢獻(xiàn)的機(jī)架級(jí)AI算力解決方案,覆蓋機(jī)架、托盤、液冷、熱設(shè)計(jì)、NVLink互聯(lián)等多個(gè)維度,旨在通過開放標(biāo)準(zhǔn)推動(dòng)高性能AI基礎(chǔ)設(shè)施的規(guī)?;渴?。NvidiaGB200NVL72是基于Blackwell架構(gòu)的多節(jié)點(diǎn)液冷機(jī)架級(jí)擴(kuò)展系統(tǒng),其核心由72exaFLOPS的AI算力,專為萬億參數(shù)級(jí)生成式AI和高性能計(jì)算設(shè)計(jì)?;贜VIDIASpectrum-X以太網(wǎng)網(wǎng)絡(luò)平臺(tái)也增加了對(duì)OCP社區(qū)規(guī)范的支持,在CHAPTER2·AI計(jì)算開放架構(gòu)概念與意義支持,再到分解式調(diào)度結(jié)構(gòu)等,為AI硬件的標(biāo)準(zhǔn)化與高密度化奠定了基礎(chǔ)。Catalina足AI任務(wù)不斷增長的計(jì)算需求,并解決AI集群中GPU功耗不斷增加的Teton平臺(tái)是MetaAI基礎(chǔ)設(shè)施的另一重要組成部分,為大規(guī)模推薦模型等內(nèi)存帶寬夠連接NVIDIA、Broadcom、AMD等多家供應(yīng)商的加速器與網(wǎng)絡(luò)端點(diǎn),是一種開放2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告用自研的達(dá)芬奇架構(gòu),旨在優(yōu)化AI計(jì)算的效率和靈活性,適應(yīng)多種AI場(chǎng)景和算法需編程接口,實(shí)現(xiàn)對(duì)不同芯片架構(gòu)的適配,對(duì)下服務(wù)AI處理器與編程,降低開發(fā)者門檻。CANN發(fā)揮承上啟下的關(guān)鍵作用,是提升昇騰AI處理器計(jì)算效率的關(guān)鍵平臺(tái)。ProcessingUnit支持上下兩個(gè)計(jì)算節(jié)點(diǎn)共享穩(wěn)定性與能效比。在金融領(lǐng)域,招商銀行與百度智能云基于昆侖芯P800開展算力合CHAPTER2·AI計(jì)算開放架構(gòu)概念與意義雙技術(shù)路線超節(jié)點(diǎn)產(chǎn)品,可實(shí)現(xiàn)單機(jī)柜最高64卡的全互聯(lián)互通,從而大幅提升單節(jié)點(diǎn)計(jì)算效能。H3CUniPoD超節(jié)點(diǎn)產(chǎn)品以算力芯片多元化、互聯(lián)協(xié)議標(biāo)準(zhǔn)化、基礎(chǔ)設(shè)兩個(gè)子產(chǎn)品系列,基于不同協(xié)議路線,將為不同規(guī)模參數(shù)的模型訓(xùn)練、推理和精調(diào)提曙光scaleX640超節(jié)點(diǎn)2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告2.6AI計(jì)算開放架構(gòu)的意義與價(jià)值發(fā)者需針對(duì)單一硬件重構(gòu)代碼,技術(shù)壁壘嚴(yán)重制約跨層級(jí)協(xié)同與突破性研發(fā)。AI計(jì)算開放架構(gòu)通過整合芯片、整機(jī)、大模型、行業(yè)應(yīng)用等上下游資源,依托產(chǎn)業(yè)聯(lián)盟、實(shí)驗(yàn)室等協(xié)作機(jī)制,推動(dòng)形成從硬件、軟件、算法到應(yīng)用的全鏈條優(yōu)化,提升產(chǎn)業(yè)整體創(chuàng)新效能。同時(shí),通過建立統(tǒng)一技術(shù)標(biāo)準(zhǔn)體系避免重復(fù)研發(fā)與同質(zhì)化競(jìng)爭(zhēng),共享編譯活多主體創(chuàng)新活力,推動(dòng)形成多層次、多主體參與的技術(shù)創(chuàng)新格局,加速人工智能技CHAPTER2·AI計(jì)算開放架構(gòu)概念與意義件全鏈條的緊耦合技術(shù)體系,通過集群資源動(dòng)態(tài)調(diào)度、分布式存儲(chǔ)優(yōu)化、高速網(wǎng)絡(luò)協(xié)同等技術(shù)手段,取代傳統(tǒng)追求單節(jié)點(diǎn)極致性能的發(fā)展模式,以集群創(chuàng)新彌補(bǔ)單卡性能差距,提升高端算力供給。此外,采用兼容主流技術(shù)標(biāo)準(zhǔn)與自主創(chuàng)新發(fā)展并重的技術(shù)互聯(lián)網(wǎng)巨頭,中小企業(yè)與科研機(jī)構(gòu)普遍陷入用不起、用不好的困境。AI計(jì)算開放架構(gòu)通過開放核心模型架構(gòu)與訓(xùn)練框架,使中小開發(fā)者無需重復(fù)投入底層技術(shù)研發(fā),可直托集群優(yōu)化能力,實(shí)現(xiàn)算力規(guī)模越大、單位成本越低,并結(jié)合存算傳協(xié)同設(shè)計(jì)、先進(jìn)傳統(tǒng)AI計(jì)算架構(gòu)往往存在VendorLock-in(廠商鎖定)陷阱,導(dǎo)致生態(tài)資源高度集中于少數(shù)巨頭,上下游企業(yè)缺乏議價(jià)權(quán),產(chǎn)業(yè)創(chuàng)新活力被抑制。AI計(jì)算開放架構(gòu)憑借硬件兼容、端邊云協(xié)同特性,讓中小企業(yè)低成本試錯(cuò)、科研機(jī)構(gòu)聚焦前沿、千行百業(yè)加速數(shù)字化,各主體在開放體系中自由協(xié)作。此外,通過統(tǒng)一接口標(biāo)準(zhǔn),實(shí)現(xiàn)多提供底層支撐,推動(dòng)AI與制造、醫(yī)療、金融等不同領(lǐng)域深度融合,重塑生產(chǎn)與生活范20252025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告TR3AI計(jì)算開放架構(gòu)面臨的挑戰(zhàn)與應(yīng)對(duì)CHAPTER3·AI計(jì)算開放架構(gòu)面臨的挑戰(zhàn)與應(yīng)對(duì)行動(dòng)的意見》等政策陸續(xù)出臺(tái),將智能算力列為智能經(jīng)為破解當(dāng)前國內(nèi)算力產(chǎn)業(yè)發(fā)展困局,在芯片、基礎(chǔ)軟件、模型等核心技術(shù)自主創(chuàng)曙光、海光、華為、浪潮、新華三、沐曦、壁仞、曦智等眾多科技企業(yè)都在加快研制智算超節(jié)點(diǎn)、超集群等產(chǎn)品,以網(wǎng)強(qiáng)算、以存提算、以電補(bǔ)算、軟硬協(xié)同等創(chuàng)新以形成合力,導(dǎo)致異構(gòu)算力協(xié)同效率較低,用戶使用門檻及成本較高。其原因主要有?技術(shù)路線層面,當(dāng)前我國算力硬件產(chǎn)業(yè)需在架構(gòu)開放性、兼容性與應(yīng)用成本之間尋找動(dòng)態(tài)平衡,以昇騰、海光、寒武紀(jì)、燧原等為代表的主流廠商均采用獨(dú)立架2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告發(fā)展分散的現(xiàn)狀,不同架構(gòu)間尚未形成統(tǒng)一技術(shù)向下屏蔽硬件差異,跨架構(gòu)靈活調(diào)度與統(tǒng)一算力?軟件棧層面,基礎(chǔ)軟件棧處于技術(shù)和產(chǎn)業(yè)發(fā)展初期的必經(jīng)階段,模型“一次開試、Profiling、性能可視化工具數(shù)量與CUDA生態(tài)存在差距,且部分工具以封閉商業(yè)版為主,社區(qū)版功能有待完善;通信庫與算子庫豐富度有待提升,缺少對(duì)標(biāo)CHAPTER3·AI計(jì)算開放架構(gòu)面臨的挑戰(zhàn)與應(yīng)對(duì)用開發(fā)者之間缺乏高效協(xié)作,芯片能力難以通過軟件高效賦能上層應(yīng)架遷移,但對(duì)新特性的支持相對(duì)滯后,開發(fā)者需投入大量時(shí)間進(jìn)3.2AI計(jì)算開放架構(gòu)的目標(biāo)AI計(jì)算開放架構(gòu)是面向大規(guī)模智能計(jì)算場(chǎng)景,以GPU為核心進(jìn)行高效緊耦合系A(chǔ)I計(jì)算開放架構(gòu)聚焦大規(guī)模智能計(jì)算場(chǎng)景(如千億級(jí)參數(shù)大模型訓(xùn)練、超大規(guī)模協(xié)同設(shè)計(jì),精準(zhǔn)滿足用戶在大模型訓(xùn)練推理、科學(xué)計(jì)算等多元場(chǎng)景下,對(duì)多精度、混二是降低算力使用成本,通過標(biāo)準(zhǔn)化技術(shù)架構(gòu)替代專有化方案,推動(dòng)算力資源從2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告打造支持異構(gòu)算力的AI計(jì)算開放架構(gòu),提升我國算力的綜合一方面,構(gòu)建支持異構(gòu)的大規(guī)模、超大規(guī)模超算與智算集群,破解跨廠商兼容性不足、集群協(xié)同效率較低等共性問題,滿足大模型訓(xùn)練對(duì)海量算力的集中需求,避免供需錯(cuò)配。另一方面,構(gòu)建異構(gòu)協(xié)同計(jì)算體系,針對(duì)單GPU算力無法滿足的復(fù)雜場(chǎng)景需求(如多模異構(gòu)算力集成與統(tǒng)一調(diào)度,實(shí)現(xiàn)不同芯片的功能互補(bǔ),精準(zhǔn)匹配場(chǎng)一方面,構(gòu)建兼容開放的AI計(jì)算架構(gòu)生態(tài),向下屏蔽跨廠商、跨時(shí)具備自主特色的開放生態(tài)。另一方面,以開放架構(gòu)為紐帶整合全產(chǎn)業(yè)鏈資源,串聯(lián)芯片設(shè)計(jì)、系統(tǒng)集成、大模型開發(fā)、應(yīng)用落地等商無需各自開發(fā)專屬適配工具,可基于統(tǒng)一開放架構(gòu)共享技術(shù)成果,減少研發(fā)資源浪費(fèi),推動(dòng)國產(chǎn)智算產(chǎn)業(yè)鏈精細(xì)化發(fā)展,促進(jìn)全CHAPTER3·AI計(jì)算開放架構(gòu)面臨的挑戰(zhàn)與應(yīng)對(duì)3.3業(yè)界應(yīng)對(duì)舉措但生態(tài)碎片化的背景下,構(gòu)建一個(gè)開放、統(tǒng)一的軟件架構(gòu)是打破技術(shù)壁壘、降低開發(fā)程開發(fā)工具鏈、AI框架、并行加速庫,驅(qū)動(dòng)底層硬件計(jì)算編譯、執(zhí)行及調(diào)優(yōu),賦能大模型訓(xùn)練全流程加速。用戶可根據(jù)個(gè)體需求聚焦細(xì)分場(chǎng)景進(jìn)行適配與應(yīng)用落地,基于分工協(xié)作帶來了規(guī)模效應(yīng),成本得以有效降低。并且,開放繁榮的生態(tài)吸引了更多開發(fā)者參與,不斷催生新的應(yīng)用與服務(wù),產(chǎn)業(yè)創(chuàng)新活性得到極大增強(qiáng)。完全開放模式通過匯聚多方力量、整合多領(lǐng)域資源,以集群算力彌補(bǔ)單卡性能差距,通過生態(tài)協(xié)同降225算力計(jì)構(gòu)2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告AI計(jì)算開放架構(gòu)部署案例CHAPTER4·智算中心AI計(jì)算開放架構(gòu)部署案例中科曙光于2025年9月推出的AI超集群系統(tǒng),從底層硬件層、AI軟件棧層踐行開放體系架構(gòu),以大模型訓(xùn)練推理、行業(yè)大模型微調(diào)、高通量推理、多模態(tài)大模百P級(jí)AI算力,最大支持百萬卡大規(guī)模集群組網(wǎng)擴(kuò)展。該系統(tǒng)兼容主流AI計(jì)算軟件生態(tài),已全面適配優(yōu)化算子模型,可曙光AI超集群系統(tǒng)之星云系列NEBULA800圖2025中國算力發(fā)展之AI計(jì)算開放架構(gòu)研究報(bào)告訓(xùn)練推理性能達(dá)到業(yè)界主流水平2.3倍。由于當(dāng)前GPU發(fā)展速度快,存儲(chǔ)、網(wǎng)絡(luò)的帶寬和延遲成為瓶頸。該系統(tǒng)遵循讓數(shù)水平2.1倍;通過集群容災(zāi)系統(tǒng)架構(gòu)、快速Checkpoint等機(jī)集群平臺(tái)軟件,內(nèi)置管理調(diào)度大模型,實(shí)現(xiàn)百萬級(jí)部CHAPTER4·智算中心AI計(jì)算開放架構(gòu)部署案例沐曦AI計(jì)算集群部署案例沐曦AI計(jì)算集群部署在上海市松江區(qū),該智算中心為市屬唯一國資高端數(shù)據(jù)中心、上海市公共算力基礎(chǔ)設(shè)施底座及算力服務(wù)平臺(tái)。該集群底層硬件層均采用沐曦曦云C系列計(jì)算卡,AI軟件棧層具備高兼容性、高沐曦AI計(jì)算集群規(guī)模據(jù)統(tǒng)計(jì)已超萬卡,采用沐曦曦云C系列產(chǎn)品建設(shè)規(guī)模為320臺(tái)GPU算力服務(wù)器(共計(jì)2560卡)的高能效國產(chǎn)算力資源池。作為異構(gòu)計(jì)算開放平臺(tái),支持各類主流大模型基礎(chǔ)訓(xùn)練框類主流大模型分布式加速框架,如DeepSpeed、InternLM、Colossal-能分布式存儲(chǔ)系統(tǒng),可為大模型訓(xùn)練等AI應(yīng)用場(chǎng)景提供算力支持。集群卡直出光互連接口實(shí)現(xiàn)高效的Scaleup網(wǎng)絡(luò),實(shí)現(xiàn)了更高帶寬的卡間互推理等AI任務(wù),并可為各類科學(xué)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論