電子行業(yè)市場前景及投資研究報告:AI算力基建景氣度高國產(chǎn)AI芯片發(fā)展勢頭_第1頁
電子行業(yè)市場前景及投資研究報告:AI算力基建景氣度高國產(chǎn)AI芯片發(fā)展勢頭_第2頁
電子行業(yè)市場前景及投資研究報告:AI算力基建景氣度高國產(chǎn)AI芯片發(fā)展勢頭_第3頁
電子行業(yè)市場前景及投資研究報告:AI算力基建景氣度高國產(chǎn)AI芯片發(fā)展勢頭_第4頁
電子行業(yè)市場前景及投資研究報告:AI算力基建景氣度高國產(chǎn)AI芯片發(fā)展勢頭_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

證券研究報告AI系列專題報告(一)算力:算力基建景氣度高,國產(chǎn)AI芯片發(fā)展勢頭良好電子行業(yè)

強于大市(維持)2025年6月12日核心摘要

AIGC蓬勃發(fā)展,對底層智能算力產(chǎn)生強勁需求。行業(yè)前期,訓(xùn)練是算力需求的主力,大量大模型訓(xùn)練需要海量算力支撐。2024年末,DeepSeek重磅發(fā)布,其輕量化、低成本、高性能特征大幅拉低了AI應(yīng)用門檻,有望成為各類推理場景爆發(fā)的契機,推理算力市場需求潛力巨大。在此背景下,全球科技巨頭資本支出維持在高位,國內(nèi)智算中心建設(shè)如火如荼。根據(jù)中國信通院&浪潮信息報告數(shù)據(jù),截至2023年底,全球智能算力規(guī)模為335EFLOPS,同比增長136%,智能算力需求旺盛,增速遠超算力整體規(guī)模增速。

AI算力芯片:ASIC蒸蒸日上,關(guān)注AI芯片國產(chǎn)化。根據(jù)中投產(chǎn)業(yè)研究院數(shù)據(jù),2022年,全球AI芯片市場規(guī)模約422億美元,預(yù)計2025年將達到920億美元,三年CAGR達27.7%。AI算力芯片主要有通用GPU和ASIC兩大類,通用GPU是目前的主流,算力強大、生態(tài)豐富,英偉達是領(lǐng)導(dǎo)者,AMD緊隨其后,加速追趕,國內(nèi)海光信息、沐熙等也采用該路線;ASIC是專用定制芯片,面對專項任務(wù),計算能力和效率較通用GPU更強,博通和MARVELL是領(lǐng)先者,擁有大量特定任務(wù)負載的大型云服務(wù)廠商多與其合作開發(fā),典型案例是谷歌TPU系列產(chǎn)品(與博通合作研發(fā)),國內(nèi)2025年5月19日,英偉達發(fā)布NVLink

Fusion,允許第三方ASIC芯片接入英偉達計算體系,AI算力基礎(chǔ)設(shè)施異構(gòu)融合計算壁壘得到一定緩解,客觀上有望推動ASIC芯片的發(fā)展。國內(nèi)來看,AI芯片是美國對華科技制裁的重災(zāi)區(qū),其先進的AI芯片產(chǎn)品無法出口至國內(nèi),

國內(nèi)AI算力芯片實現(xiàn)從設(shè)計到昇騰、寒武紀等已取得一定突破,燧原、沐熙、天數(shù)、壁仞等公司也在快速發(fā)展,AI算力芯片自主可控已昇騰、燧原等采用AISC路線。制造的全產(chǎn)業(yè)鏈取得長足進步。,海光DCU、

AI服務(wù)器:市場景氣度高,國產(chǎn)AI芯片占比提升。根據(jù)IDC&浪潮信息報告數(shù)據(jù),2024-2028年,我國AI服務(wù)器CAGR將達到約30.6%,景氣度持續(xù)高企,同時,在美國對華半導(dǎo)體出口

進一步升級、我國AI服務(wù)器廠商積極擁抱國產(chǎn)AI芯片等多重因素影響下,國內(nèi)AI服務(wù)器市場中,國產(chǎn)AI芯片占比將持續(xù)提高。此外,隨著DeepSeek火爆出圈,僅數(shù)月時間,國內(nèi)市場已有100多家廠商推出AI(DeepSeek)一體機,供應(yīng)端呈現(xiàn)“百機大戰(zhàn)”格局,需求端已在政務(wù)、金融、醫(yī)療、教育、物流等行業(yè)多點開花,DeepSeek大模型一體機未來有望持續(xù)向好。

投資建議:DeepSeek火爆出圈,輕量化、低成本、高性能,推理場景逐漸打開,推理端算力需求將逐步超過訓(xùn)練端。當前,AI算力是美國對華科技制裁的重災(zāi)區(qū),先進的AI算力芯片無法出口至國內(nèi),反向國內(nèi)AI算力從設(shè)計到制造到整機的全面,國內(nèi)通用GPU、ASIC芯片蓬勃發(fā)展,同時服務(wù)器和一體機廠商也逐漸向國產(chǎn)AI芯片傾斜,全產(chǎn)業(yè)鏈合力,國內(nèi)AI算力自主可控已取得不菲成果。推薦海光信息、浪潮信息、龍芯中科、芯原股份、紫光股份、深信服、神州數(shù)碼,建議關(guān)注寒武紀、華勤技術(shù)、軟通動力。2

風(fēng)險提示:(1)大模型應(yīng)用落地不及預(yù)期的風(fēng)險。(2)國產(chǎn)AI芯片開發(fā)不及預(yù)期的風(fēng)險。(3)美國對華科技制裁的風(fēng)險。目錄CONTENTS一、AIGC蓬勃發(fā)展,對底層智能算力產(chǎn)生強勁需求二、AI算力芯片:ASIC蒸蒸日上,關(guān)注AI芯片國產(chǎn)化三、AI服務(wù)器:市場景氣度高,國產(chǎn)AI芯片服務(wù)器占比提高四、投資建議及風(fēng)險提示1.1

大模型發(fā)展助推智能算力需求加速釋放

大模型和生成式AI快速發(fā)展,拉動智能算力需求加速釋放。2015-2016年,大模型時代開啟,整體訓(xùn)練計算量較之前時期大2-3個數(shù)量級。2022年底,ChatGPT橫空出世,隨后,擁有千億甚至萬億級參數(shù)的各類通用大模型相繼發(fā)布,其訓(xùn)練迭代極大拉動了對智能算力的需求。根據(jù)Jaime

Sevilla等人的研究,2016-2022年,大模型訓(xùn)練所需的算力從4e+21增長到8e+23

FLOPS,意味著大模型訓(xùn)練算力每10個月即翻一倍。里程碑級機器學(xué)習(xí)系統(tǒng)的算力變化趨勢訓(xùn)練算力需求訓(xùn)(練算力需)求()4數(shù)據(jù):JaimeSevilla等《ComputeTrends

Across

Three

Eras

of

MachineLearning》,平安證券研究所1.2

訓(xùn)練端算力需求階段性旺盛,未來推理端需求可能遠超訓(xùn)練端

AIGC通常需要訓(xùn)練和推理兩個環(huán)節(jié),訓(xùn)練是通過數(shù)據(jù)開發(fā)出AI大模型,因此參數(shù)量的升級對算力需求影響較大,推理是利用訓(xùn)練好的模型進行計算,推理部署的算力主要在于應(yīng)用場景的日數(shù)據(jù)吞吐量。

隨著大模型逐漸成熟,推理成本逐漸下降,未來推理端算力需求可能遠超訓(xùn)練端。大模型訓(xùn)練很大程度上是階段性需求,訓(xùn)練數(shù)據(jù)通常是相對固定的,比如幾萬億或幾十萬億量級,在發(fā)展早期是主要的算力需求端。根據(jù)IDC&浪潮信息報告數(shù)據(jù),2023年,由于各類大模型層出不窮,當年中國AI服務(wù)器工作負載中,訓(xùn)練端算力占比為58.7%。隨著大模型逐漸成熟以及推理成本逐漸下降,大模型應(yīng)用場景將逐漸打開,對推理算力的需求將持續(xù)擴大,預(yù)計到2027年,推理端算力需求占比將大幅增長到72.6%。長期看,推理算力的需求潛力遠超訓(xùn)練端。訓(xùn)練+推理算力需求中國人工智能服務(wù)器工作負載預(yù)測,2022-2027訓(xùn)練

推理100%80%60%40%20%0%2022202320242025202620275數(shù)據(jù):甲子光年公眾號,IDC、浪潮信息《2023-2024中國人工智能計算力發(fā)展評估報告》,平安證券研究所1.3

DeepSeek高性能、低成本大模型有望成為推理場景爆發(fā)的契機

2024年12月26日,DeepSeek-V3發(fā)布,671B參數(shù),性能與GPT-4o不分伯仲。DeepSeek-V3采用MLA和MoE架構(gòu),支持使用FP8混合精度訓(xùn)練,引入了一種無輔助損失的負載平衡策略,并設(shè)置了多Token預(yù)測訓(xùn)練目標,注重輕量化的同時,性能上與GPT-4o不分伯仲。

2025年1月20日,DeepSeek-R1發(fā)布,性能對齊OpenAI-o1正式版。DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù),在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力,在數(shù)學(xué)、代碼、自然語言處理等任務(wù)上性能對標OpenAI-O1。DeepSeek-V3與其他大模型測評成績對比DeepSeek-R1與其他大模型測評成績對比6數(shù)據(jù):DeepSeek公眾號,平安證券研究所1.3

DeepSeek高性能、低成本大模型有望成為推理場景爆發(fā)的契機

DeepSeek設(shè)計輕量化,訓(xùn)練成本大幅降低。DeepSeek-V3使用2048塊H800

GPU集群訓(xùn)練,訓(xùn)練時長278.8萬小時,假設(shè)H800

GPU每小時租金2美元,總訓(xùn)練成本僅557.6萬美元。

受益于低成本訓(xùn)練優(yōu)勢,DeepSeek-V3和R1的API服務(wù)定價較GPT-4o和o1大幅下降。DeepSeek-R1

API服務(wù)價格為每百萬輸出Tokens

16元,而o1價格為438元,成本優(yōu)勢明顯,大模型推理準入門檻大幅降低。DeepSeek-V3與其他大模型性能/價格對比DeepSeek-R1與其他大模型輸入/輸出價格對比7數(shù)據(jù):DeepSeek公眾號,平安證券研究所1.3

DeepSeek高性能、低成本大模型有望成為推理場景爆發(fā)的契機

DeepSeek憑借其低成本、高性能的推理優(yōu)勢,始一推出便贏得市場青睞。根據(jù)AI產(chǎn)品榜數(shù)據(jù),DeepSeek僅用7天就完成了1億用戶的增長,且DeepSeek

APP發(fā)布20天時,全球日活DAU突破2000萬,達到ChatGPT的40%。

DeepSeek爆火反映出市場對低成本推理大模型的迫切需求,且其開源屬性將大力推動各類推理應(yīng)用場景的爆發(fā),未來推理對算力的需求權(quán)

將進一步增長。De

e

pSeek增長1億用戶僅花費7天De

e

pSeek

APP上線20日日活達到ChatGPT的40%產(chǎn)品增長1億用戶花費時間DeepSeek7天ChatGPTTiktok2個月9個月拼多多微信10個月1年2個月InstagramWhatsappSnapchatFacebookTelegramX2年6個月3年6個月3年8個月4年6個月5年1個月5年5個月萬維網(wǎng)7年備注:DeepSeek包含網(wǎng)站W(wǎng)eb/應(yīng)用APP累加不去重,Tiktok不包含國內(nèi)版抖音:AI產(chǎn)品榜公眾號,平安證券研究所8數(shù)據(jù)1.4

科技巨頭資本支出維持在高位,加速布局萬卡集群

大模型訓(xùn)練和推理帶來海量算力需求,科技巨頭資本支出維持在較高水平。根據(jù)各公司公告,2025Q1,微軟(214億美元)、Meta(137億美元)、谷歌(172億美元)、亞馬遜(243億美元)四巨頭資本開支合計高達766億美元,同比增長64.0%,國內(nèi)騰訊(275億元)、阿里巴巴(246億元)資本開支合計521億元,同比大幅增長104.2%。此外,科技巨頭持續(xù)投入算力采購,以H100的采購為例,根據(jù)Omdia

Research信息,2023年,Meta和微軟是H100最大的購買者,谷歌、亞馬遜、甲骨文、騰訊其次。美國互聯(lián)網(wǎng)大廠資本開支情況(億美元)國內(nèi)互聯(lián)網(wǎng)大廠資本開支情況(億元)H100客戶情況@2023微軟Meta谷歌亞馬遜騰訊阿里巴巴30025020015010050400300200100001Q23

2Q23

3Q23

4Q23

1Q24

2Q24

3Q24

4Q24

1Q259數(shù)據(jù):Wind,各公司公告,Omdia

Research,半導(dǎo)體產(chǎn)業(yè)縱橫公眾號,平安證券研究所1.4

科技巨頭資本支出維持在高位,加速布局萬卡集群

科技巨頭加速布局萬卡算力集群?;谌斯ぶ悄艿膹V闊前景,全球科技巨頭紛紛加大對AI基礎(chǔ)設(shè)施布局以維持行業(yè)競爭力,其高額資本支出為萬卡、十萬卡集群建設(shè)奠定了基礎(chǔ)。根據(jù)中國信通院&浪潮信息報告,國際上,Meta、微軟&OpenAI等多家AI巨頭陸續(xù)宣布或者完成10萬卡集群建設(shè),國內(nèi)通信運營商、頭部互聯(lián)網(wǎng)、大型AI研發(fā)企業(yè)等均發(fā)力超萬卡集群的布局。全球科技巨頭萬卡智算集群布局情況(部分)科技巨頭谷歌萬卡智算集群布局情況2023年5月,推出AI超級計算機A3,搭載了約26000塊H100GPU,為其在機器學(xué)習(xí)和深度學(xué)習(xí)研究中的應(yīng)用提供強大的算力支持2024年初,Meta建成了兩個各含24576塊GPU的集群Meta微軟早在2020年,微軟便構(gòu)建了一個覆蓋1萬塊GPU的超級計算機,加速其在云計算和AI服務(wù)領(lǐng)域的發(fā)展亞馬遜

AmazonEC2Ultra集群采用了2萬個H100TensorCoreGPU,為用戶在處理大規(guī)模數(shù)據(jù)分析和機器學(xué)習(xí)任務(wù)方面提供強大算力支持特斯拉

2023年8月,特斯拉上線集成1萬塊H100GPU的集群,將極大提升特斯拉在自動駕駛和車輛智能化方面的研發(fā)速度騰訊推出的星脈高性能網(wǎng)絡(luò)能夠支持高達10萬卡GPU的超大規(guī)模計算,網(wǎng)絡(luò)帶寬高達3.2T,為未來的AI和大數(shù)據(jù)應(yīng)用提供了廣闊的發(fā)展空間字節(jié)跳動

提出的MegaScale生產(chǎn)系統(tǒng),支撐12288卡Ampere架構(gòu)訓(xùn)練集群,為字節(jié)跳動在內(nèi)容推薦、圖像處理等AI應(yīng)用方面提供了強大的算力保障中國移動

計劃商用哈爾濱、呼和浩特、貴陽三個萬卡集群,總規(guī)模接近6萬張GPU卡中國聯(lián)通

計劃在上海臨際云數(shù)據(jù)中心建成中國聯(lián)通首個萬卡集群,集群建成后將為中國聯(lián)通在數(shù)據(jù)中心和云計算市場提供新的競爭優(yōu)勢10數(shù)據(jù):浪潮信息、中國信通院《人工智能算力高質(zhì)量發(fā)展評估體系報告》,平安證券研究所1.5

全球智能算力規(guī)模高速增長,國內(nèi)智算中心建設(shè)方興未艾

全球智能算力增速遠高于算力整體規(guī)模增速。根據(jù)中國信通院&浪潮信息報告數(shù)據(jù),截至2023年底,全球算力總規(guī)模約為910EFLOPS,同比增長40%,智能算力規(guī)模為335EFLOPS,同比增長136%,智能算力增速遠超算力整體規(guī)模增速。

國內(nèi)智算中心建設(shè)如火如荼。據(jù)第一新生研究院統(tǒng)計,截至2023年底,我國已投運(58家)、在建及規(guī)劃(63家)的智算中心數(shù)量已超120家,其中絕大多數(shù)由地方政府及電信運營商主導(dǎo)規(guī)劃建設(shè)。全球算力規(guī)模(EFLOPS)2023年全國智算中心建設(shè)情況(家數(shù))64636261605958575655通用算力智能算力超算算力6005004003002001000202120222023已投運智算中心數(shù)量建設(shè)及規(guī)劃智算中心數(shù)量11數(shù)據(jù):浪潮信息、中國信通院《人工智能算力高質(zhì)量發(fā)展評估體系報告》,第一新聲研究院,大信創(chuàng)圈公眾號,平安證券研究所1.6

國家統(tǒng)籌布局,各省市加快推動地方智能算力發(fā)展

國家統(tǒng)籌布局,各省市積極響應(yīng),出臺大量政策引導(dǎo)推動地方智能算力發(fā)展。智能算力發(fā)展備受關(guān)注,智算中心建設(shè)是各省市算力布局的重點。2024年,北京、廣東、河北等多地提出2025年智能算力目標。我國算力相關(guān)支持政策匯總(部分)發(fā)布時間

發(fā)布部委/省份文件名稱主要內(nèi)容要強化基礎(chǔ)設(shè)施互聯(lián)互通、算力保障和流通利用標準建設(shè),為數(shù)據(jù)資源、數(shù)據(jù)技術(shù)、數(shù)據(jù)流通、融合應(yīng)用提供支撐。2024.10國家《國家數(shù)據(jù)標準體系建設(shè)指南》聚焦算力網(wǎng)絡(luò)和可信流通,支持數(shù)據(jù)基礎(chǔ)設(shè)施企業(yè)發(fā)展。落實研發(fā)費用加計扣除、高新技術(shù)企業(yè)稅收優(yōu)惠等政策。2024.092024.03國務(wù)院辦公廳中央人民政府《國務(wù)院辦公廳關(guān)于加快公共數(shù)據(jù)資源開發(fā)利用的意見》《政府工作報告》適度超前建設(shè)數(shù)字基礎(chǔ)設(shè)施,加快形成全國一體化算力體系,培育算力產(chǎn)業(yè)生態(tài)。到2025年底,普惠易用、綠色安全的綜合算力基礎(chǔ)設(shè)施體系初步成型,東西部算力協(xié)同調(diào)度機制逐步完善,通用算力、智能算力、超級算力等多元算力加速集聚,國家樞紐節(jié)點地區(qū)各類新增算力占全國新增算力的60%以上,國家樞紐節(jié)點算力資源使用率顯著超過全國平均水平?!蛾P(guān)于深入實施“東數(shù)西算”工程加快構(gòu)建全國一體化算2023.12國家力網(wǎng)的實施意見(發(fā)改數(shù)據(jù)[2023]

1779號)》結(jié)合人工智能產(chǎn)業(yè)發(fā)展和業(yè)務(wù)需求,重點在西部算力樞紐及人工智能發(fā)展基礎(chǔ)較好地區(qū)集約化開展智算中心建設(shè),逐步合理提升智能算力占比。2023.10工信部《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》《企業(yè)技術(shù)創(chuàng)新能力提升行動方案(2022-2023年)》山東省算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動方案2022.08

科技部、財政部推動國家超算中心、智能計算中心等面向企業(yè)提供低成本算力服務(wù)。強化多元算力協(xié)同部署,引導(dǎo)通用算力、智能算力、高性能算力中心等合理梯次布局,支持重點企業(yè)建設(shè)智算中心,適度超前提高智能算力占比。2024.062024.052024.042024.03山東河北北京廣東關(guān)于進一步優(yōu)化算力布局推動人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展的意

到2025年全省算力規(guī)模達到35百億億次/秒(EFLOPS)以上,智能算力占比達到35%左右,新見增算力基礎(chǔ)軟硬件設(shè)施自主可控比例60%以上。到2025年,智算供給規(guī)模達到45EFLOPS,2025-2027年根據(jù)人工智能大模型發(fā)展需要和國家相關(guān)部署進一步優(yōu)化算力布局?!侗本┦兴懔A(chǔ)設(shè)施建設(shè)實施方案》2025年,在計算方面,算力規(guī)模達到38EFLOPS,智能算力占比達到50%,建成智能計算中心10個。廣東省算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動暨“粵算”行動計劃12數(shù)據(jù):政府官網(wǎng),平安證券研究所目錄CONTENTS一、AIGC蓬勃發(fā)展,對底層智能算力產(chǎn)生強勁需求二、AI算力芯片:ASIC蒸蒸日上,關(guān)注AI芯片國產(chǎn)化三、AI服務(wù)器:市場景氣度高,國產(chǎn)AI芯片服務(wù)器占比提高四、投資建議及風(fēng)險提示2

作為最底層的算力基座,AI算力芯片迎來發(fā)展機遇

AI方興未艾,作為底層的算力基座,AI算力芯片將迎來快速發(fā)展。全球市場,根據(jù)中投產(chǎn)業(yè)研究院數(shù)據(jù),2022年全球AI芯片市場規(guī)模約442億美元,預(yù)計2025年將達到約920億美元,期間CAGR約27.7%;國內(nèi)市場,根據(jù)184億元,預(yù)計2025年將增長到1530億元,期間CAGR約52.7%。研究院數(shù)據(jù),2020年國內(nèi)AI芯片市場規(guī)模約2022-2025年全球AI芯片市場規(guī)模預(yù)測(億美元)2020-2025年中國AI芯片市場規(guī)模預(yù)測(億元)10001800160014001200100080090080070060050040030020010006004002000202220232024E2025F202020212022202320242025F14數(shù)據(jù):中投產(chǎn)業(yè)研究院,研究院,平安證券研究所2

英偉達GPU主導(dǎo)AI算力芯片市場,ASIC芯片多元化發(fā)展勢頭迅猛

達通用GPU執(zhí)全球AI算力芯片市場之牛耳,ASIC多元化發(fā)展趨勢顯著。

AI算力芯片主要包括GPU和ASIC,GPU是通用算力卡,是目前AI算力芯片的主流選擇,英偉達是該領(lǐng)域的領(lǐng)導(dǎo)者(數(shù)據(jù)中心GPU市占率98%@2023),AMD奮力直追,國內(nèi)海光信息的DCU也屬于通用GPU;ASIC是專用定制芯片,其物理設(shè)計嚴格匹配算法邏輯,面對專項任務(wù),其計算性能和效率可能比通用GPU更強,博通、MARVELL是ASIC領(lǐng)域的領(lǐng)先者,大型云服務(wù)廠商多與其合作,比如谷歌的TPU便是與博通合作開發(fā)的,國內(nèi)昇騰也屬于ASIC路線。全球數(shù)據(jù)中心GPU市場格局@2023(%)數(shù)據(jù)中心ASIC加速芯片快速增長(億美元)50045040035030025020015010050英偉達其他020232028F15數(shù)據(jù):TechInsights,北京半導(dǎo)體行業(yè)協(xié)會,MARVELL,平安證券研究所2

NVLink

Fusion打破異構(gòu)融合計算壁壘,ASIC芯片有望受益

NVLink

Fusion支持第三方ASIC芯片接入英偉達計算體系,AI算力基礎(chǔ)設(shè)施在異構(gòu)融合計算領(lǐng)域的障礙得到一定緩解,客觀上有望推動ASIC芯片的發(fā)展與繁榮。2025年5月19日,英偉達在COMPUTEX重磅發(fā)布NVLink

Fusion,通過提供IP或接口,支持第三方ASIC加速芯片、CPU等接入英偉達計算體系。

NVLink

Fusion的發(fā)布意味著英偉達在保持自身架構(gòu)主導(dǎo)地位的基礎(chǔ)上,選擇主動擁抱第三方組件,異構(gòu)融合計算壁壘得到一定程度的緩解,客觀上對ASIC芯片的發(fā)展將起到推動作用。NVLink

Fusion支持ASIC融入英偉達計算體系NVLink

Fusion支持第三方CPU融入英偉達計算體系16數(shù)據(jù):英偉達官網(wǎng),平安證券研究所2.1

英偉達|AI算力芯片引領(lǐng)者,Blackwell架構(gòu)芯片性能大幅提升

英偉達是全球GPU引領(lǐng)者,Blackwell架構(gòu)芯片性能大幅提升。根據(jù)TechInsights數(shù)據(jù),2022年,英偉達數(shù)據(jù)中心GPU出貨量264萬塊,2023年增長42.4%至376萬塊,是GPU市場的領(lǐng)導(dǎo)者。2024年GTC大會,英偉達推出全新Blackwell架構(gòu)GPU芯片,4nm工藝,晶體管數(shù)量達2080億個,并展示了GB200超級芯片,將兩塊Blackwell

GPU與一塊Grace

CPU相連,可提供10

PFLOPS的FP16算力,性能得到大幅提升。英偉達主要GPU產(chǎn)品性能參數(shù)對比英偉達數(shù)據(jù)中心GPU出貨量(萬塊)4003002001000性能參數(shù)FP16H100SXMH200SXMGB2001979

TFLOPS

1979

TFLOPS10

PFLOPS180

TFLOPS90

TFLOPSFP3267

TFLOPS34

TFLOPS80GB

HBM33.35TB/s700W67

TFLOPS34

TFLOPSFP64GPU顯存141GB

HBM3e

384

GB

HBM3eGPU顯存帶寬最大熱設(shè)計功耗(TDP)4.8TB/s700W16

TB/s2700W20222023英偉達近財年收入情況(億美元)英偉達近財年凈利潤情況(億美元)凈利潤(億美元)YoY(%)收入(億美元)YoY(%)1400120010008006004002000140%120%100%80%60%40%20%0%8006004002000800%600%400%200%0%-200%FY2021FY2022FY2023FY2024FY2025FY2021FY2022FY2023FY2024FY2025備注:英偉達按2021-2025財年統(tǒng)計數(shù)據(jù)

:英偉達官網(wǎng),TechInsights,半導(dǎo)體產(chǎn)業(yè)縱橫公眾號,iFind,平安證券研究所172.1

英偉達|CUDA助力英偉達構(gòu)建強大的生態(tài)護城河

CUDA平臺與GPU硬件緊密結(jié)合、協(xié)同設(shè)計,助力英偉達構(gòu)建強大的生態(tài)護城河。CUDA是英偉達為其GPU提供的并行計算平臺和編程模型,開發(fā)者可利用其充分挖掘GPU的并行計算能力,并應(yīng)用至通用計算領(lǐng)域。CUDA根植于英偉達GPU架構(gòu)中,專為英偉達硬件設(shè)計,英偉達每代GPU發(fā)布時,CUDA平臺通常也會同步更新,以滿足新架構(gòu)GPU發(fā)揮頂級效率。英偉達CUDA和GPU軟硬件緊密結(jié)合,成本低、兼容性好,吸引了大量開發(fā)者參與其中,生態(tài)繁榮、用戶粘性強,助力英偉達構(gòu)建了強大的生態(tài)護城河壁壘。CUDA加速計算解決方案18數(shù)據(jù):5G創(chuàng)見公眾號,平安證券研究所2.2

AMD|對標英偉達持續(xù)追趕,下一代MI335將與英偉達正面交鋒

AMD是全球GPU市場的重要玩家,對標英偉達持續(xù)追趕。2023年,AMD數(shù)據(jù)中心收入64.96億美元,2024年增長93.64%至125.79億美元。

2024年10月,AMD發(fā)布MI325X

GPU,較MI300X主要增強了HBM,經(jīng)AMD實測,當跑Meta

Llama-2模型時,MI325X單卡在ROCm加持下訓(xùn)練效率超過了英偉達H200。同時,AMD宣布下一代MI350系列的首款產(chǎn)品“MI355X”將于2025H2推出,推理性能將有35倍提升,提供288GB的HBM3E內(nèi)存,峰值算力提升1.8倍,與英偉達B200的算力持平。AMD近年數(shù)據(jù)中心業(yè)務(wù)收入情況(億美元)AMD

MI355平臺性能1501005002022202320242025Q1AMD

AI算力芯片路線圖AMD

MI355芯片平臺與前代性能對比19數(shù)據(jù):iFind,智東西公眾號,36氪公眾號,平安證券研究所2.3

博通|大型云服務(wù)廠商定制ASIC芯片的首選合作商

博通在ASIC領(lǐng)域處于主導(dǎo)地位,特別是在數(shù)據(jù)中心和人工智能加速方面。博通擁有卓越的互聯(lián)設(shè)計、片上網(wǎng)絡(luò)以及專用設(shè)計能力,占據(jù)全球ASIC市場55%-60%的份額;在特定的AI工作負載上,博通ASIC解決方案效率較競爭解決方案高出40%,是擁有大量特定工作負載的大型云服務(wù)廠商的首選合作商,獲得了谷歌、微軟、Meta等科技巨頭的青睞。

博通AI業(yè)務(wù)收入快速增長。根據(jù)Wind數(shù)據(jù),2024財年,博通AI業(yè)務(wù)收入達到122億美元,同比大幅增長220%;2025Q1,博通AI業(yè)務(wù)收入41億美元,同比增長77%,Q2

AI業(yè)務(wù)收入44億美元,Q3

AI業(yè)務(wù)收入指引51億美元,穩(wěn)定增長。ASIC廠商市場地位分布圖博通近年AI收入情況(億美元)140120100806040200202320242025Q12025Q22025Q3指引20數(shù)據(jù):Fourester

Research,Wind,平安證券研究所2.3

博通|合作開發(fā)谷歌第七代TPU

Ironwood,對標英偉達B200

TPU(Tensor

Processing

Unit)是谷歌與博通為加速機器學(xué)習(xí)任務(wù)而聯(lián)合設(shè)計的ASIC芯片,采用低精度計算、脈動陣列和專用硬件設(shè)計等技術(shù)實現(xiàn)高效的矩陣運算加速。谷歌與博通在TPU領(lǐng)域合作已久,2016年便推出第一代TPU,至今已迭代至7代-Ironwood。TPU主要是谷歌自用,并不對外銷售,根據(jù)TechInsights數(shù)據(jù),2023年,谷歌自用TPU芯片量達到200萬顆。

2025年4月,谷歌發(fā)布第七代TPU

Ironwood,也是谷歌第一代專為推理設(shè)計的AI加速芯片,F(xiàn)P8峰值算力4614

TFLOPS,帶寬192GB,整體性能直逼英偉達B200。谷歌最新Ironwood與TPU

v4、TPU

v5p性能對比谷歌最新Ironwood

FP8算力是TPU

V2的3600倍21數(shù)據(jù):谷歌官網(wǎng),平安證券研究所2.4

美國對中國AI算力芯片圍追堵截

AI算力芯片是美國對華科技制裁的重災(zāi)區(qū)。美國通過限制高性能AI算力芯片出口、中國先進AI算力芯片晶圓代工、中國先進制程流片所需的關(guān)鍵設(shè)備等方式,對國內(nèi)AI算力芯片圍追堵截,國內(nèi)AI算力芯片從最底層的設(shè)計、制造等環(huán)節(jié)實現(xiàn),自主可控主旋律長期堅挺。美國對中國AI算力芯片的限制措施(部分)美國商務(wù)部工業(yè)和安全局對華算力芯片出口限制時間限制措施2025.04英偉達H20向中國出口需申請許可證2023.10美國商務(wù)部將壁仞科技、摩爾線程等公司列入實體名單。美國商務(wù)部將浪潮信息、龍芯中科等公司列入實體名單。2023.03BIS對中國實體超級計算機計算芯片和包含此類芯片的計算機商品的禁令,對收到許可證要求限制的外國生產(chǎn)項目的范圍擴大到實體名單上中國境內(nèi)的28家現(xiàn)有實體;針對2022.10

<=18nm的DRAM>=128層的NAND存儲芯片增加了新的許可證要求;限制美國人在沒有許可證的情況下支持中國某些半尋體制造設(shè)施的研發(fā)和集成電路的制造;將包括長江存儲、中國科學(xué)院大學(xué)等科研院校在內(nèi)的31家實體列入未經(jīng)核實名單(UVL)。2022.082022.08美國通知英偉達向中國和俄羅斯出口A100和H100芯片需新的許可證要求。BIS公告美國準備對EDA等四項技術(shù)實行出口。美國眾議院通過《芯片與科學(xué)法案》,主要內(nèi)容包括:分5年提供527億美元用于半導(dǎo)體制造激勵計劃、研發(fā)投資、稅收抵免,其中美國芯片基金共500億美元,390億美元用于鼓勵半導(dǎo)體制造企業(yè),110億美元補貼芯片研發(fā);法案要求獲得補貼的半導(dǎo)體企業(yè)未來10年內(nèi)不得在中國大陸新建或擴建先進制程的半導(dǎo)體工廠。2022.072020.10被納入實體名單,對用于<=10nm技術(shù)節(jié)點的產(chǎn)品或技術(shù),美國商務(wù)部采取“推定拒絕”的審批政策進行審核。22數(shù)據(jù):甲子光年公眾號,英偉達公告,平安證券研究所2.5

減配版H20優(yōu)勢削弱,國產(chǎn)AI算力芯片蓬勃發(fā)展

國產(chǎn)AI算力芯片奮起直追,已占據(jù)一定的市場份額。國內(nèi)AI算力芯片市場參與者主要有英偉達H20、昇騰系列、寒武紀思元系列、海光信息DCU系列等,為符合美國此前出口要求,英偉達已對其GPU產(chǎn)品多次減配,較國產(chǎn)AI算力芯片的性能優(yōu)勢逐漸削弱,國產(chǎn)AI芯片競爭力增強,已占據(jù)一定的市場份額。根據(jù)IDC數(shù)據(jù),2024H1,中國AI加速芯片市場規(guī)模超過90萬張,其中本土品牌出貨量接近20萬張,市占率約20%。國內(nèi)AI算力芯片市場產(chǎn)品對比國內(nèi)AI加速芯片市場份額@2024H1(出貨量)國內(nèi)AI加速芯片市場結(jié)構(gòu)@2024H1(出貨量)GPU加速卡非GPU加速卡海外品牌國產(chǎn)品牌廠商英偉達HGX

H20296海光信息深算一號寒武紀思元370256芯片型號昇騰910BINT8(TOPS)-BF16|

FP16(TFLOPS)FP32(TFLOPS)148441--37694-9624FP64(TFLOPS)GPU顯存-96GB

HBM3

32GB

HBM2

64GB

HBM2e48GBGPU

顯存帶寬4.0TB/s400W1024GB/s350W-614.4

GB/s最大熱設(shè)計功耗(TDP)400W250W23數(shù)據(jù):IT之家,海光信息招股說明書,極智視界公眾號,寒武紀官網(wǎng),IDC,平安證券研究所2.6

海光信息|DCU已迭代多次,可全面適配國內(nèi)主流大模型

海光DCU是國產(chǎn)AI算力芯片的重要參與者,已迭代多次,發(fā)展勢頭良好。海光DCU系列包括深算一號、二號、三號產(chǎn)品。根據(jù)公司公告,深算二號于2023Q3發(fā)布,具有全精度浮點數(shù)據(jù)和各種常見整型數(shù)據(jù)計算能力,能夠充分挖掘應(yīng)用的并行性,發(fā)揮其大規(guī)模并行計算的能力,性能相對于深算一號實現(xiàn)了翻倍增長,已在大數(shù)據(jù)處理、人工智能、商業(yè)計算等領(lǐng)域?qū)崿F(xiàn)商用。

海光DCU深算系列屬于通用GPU,兼容

“類

CUDA”生

態(tài),能夠支

持全精度

模型訓(xùn)練。

海光DCU已實現(xiàn)LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等為代表的大模型的全面應(yīng)用,與國內(nèi)包括文心一言、通義千問等大模型全面適配,性能達到國內(nèi)領(lǐng)先水平。海光信息深算系列DCU產(chǎn)品迭代節(jié)奏海光信息DCU產(chǎn)品與行業(yè)同類可比產(chǎn)品參數(shù)對比項目品牌海光NVIDIAAMDMI100深算一號7nm

FinFETAmpere

1007nm

FinFET生產(chǎn)工藝7nm

FinFET2560

CUDA

processors640

Tens

or

Core核心數(shù)量4096(64

CUs)120

CUs顯存容量顯存位寬32GBHBM24096

bit80GBHBM2e32GBHBM24096

bit5120

bit顯存頻率2.0

GHz3.2

GHz2.4

GHz顯存帶寬1024

GB/s350

W2039

GB/s400

W1228

GB/s300

WTDPCPU

to

GPU互聯(lián)PCIe

Gen4×16PCIe

Gen4×16PCIe

Gen4×16GPU

to

GPU互聯(lián)

xGMI×2,Up

to

184

GB/s

NVLink,Up

to

600

GB/s

Infinity

Fabric×3,Up

to

276

GB/s24備注:數(shù)據(jù)于中國計量科學(xué)研究院出具的《測試報告》(報告編號:CLzn2020-01190)數(shù)據(jù):海光信息招股說明書,海光信息公告,平安證券研究所2.7

昇騰|910B對標英偉達A100,原生生態(tài)持續(xù)完善

昇騰910B可對標英偉達競品,昇騰AI原生生態(tài)持續(xù)完善。昇騰910B采用達芬奇架構(gòu),性能基本可對標英偉達A100。表示,910B在訓(xùn)練大型語言模型時表現(xiàn)出色,其效率可達英偉達A100的80%,而在某些特定測試中,其性能甚至超越A100達20%。910B已可實現(xiàn)萬卡規(guī)模量級集群。根據(jù)科大訊飛公告,2023年10月,科大訊飛與

聯(lián)合發(fā)布我國首個全國產(chǎn)支持萬億參數(shù)大模型訓(xùn)練的萬卡國產(chǎn)算力平臺“飛星一號”,基于該平臺訓(xùn)練完成的“訊飛星火V3.5”于2024年1月30日正式發(fā)布,“飛星一號”即采用了

昇騰

910B。

根據(jù)

計算公眾號信息,截至2024年9月,昇騰已經(jīng)累計培養(yǎng)3萬+原生貢獻者,20+伙伴及客戶原生打造100+核心大算子、孵化了40+原生大模型,以及50+大模型應(yīng)用,昇騰生態(tài)已經(jīng)走向原生驅(qū)動。昇騰計算產(chǎn)業(yè)全景25數(shù)據(jù):昇騰社區(qū)官網(wǎng),平安證券研究所2.8

寒武紀|思元590性能大幅提升,公司迎來盈利拐點

寒武紀思元590訓(xùn)練性能大幅提升。思元370基于7nm制程工藝,采用chiplet技術(shù),集成了390億個晶體管,最大算力256TOPS(INT8),是寒武紀第二代產(chǎn)品思元270的2倍。思元590是寒武紀新一代云端智能訓(xùn)練芯片,采用MLUarch05架構(gòu),能夠提供更大的內(nèi)存容量和帶寬,IO和片間互聯(lián)接口也較上代實現(xiàn)大幅升級。

寒武紀迎來盈利拐點。根據(jù)iFind數(shù)據(jù),2024Q4,寒武紀實現(xiàn)收入9.89億元,歸母凈利潤2.72億元,實現(xiàn)單季扭虧為盈;2025Q1,公司實現(xiàn)收入11.11億元,歸母凈利潤3.55億元,盈利得以持續(xù)且凈利率進一步提升至31.98%。寒武紀思元370系列產(chǎn)品性能指標寒武紀近年業(yè)績情況(億元)性能參數(shù)制程工藝INT8MLU370-S4/S8MLU370-X4/

X8收入利潤毛利率(%)1510580%70%60%50%40%30%20%10%0%7nm192

TOPS72

TFLOPS18

TFLOPS24GB/48GB307.2GB/s256TOPS96

TFLOPS24

TFLOPS24GB/48GBFP16FP32020212022202320242025Q1內(nèi)存容量內(nèi)存帶寬系統(tǒng)接口最大熱設(shè)計功耗-5-10-15307.2GB/s,614.4

GB/sx16PCle

Gen475W250W26數(shù)據(jù):寒武紀官網(wǎng),iFind,平安證券研究所2.9

燧原、沐熙、天數(shù)、壁仞等在AI算力芯片領(lǐng)域百花競艷

燧原、沐熙、天數(shù)、壁仞等公司在國內(nèi)AI算力芯片市場中也有一定的競爭力,燧原是ASIC路線,沐熙、天數(shù)、壁仞是通用GPU路線。燧原科技,騰訊是第一大股東,基于其S60的慶陽智算中心萬卡推理集群已投入使用;沐熙,

高性能GPU產(chǎn)品研發(fā)經(jīng)驗豐富,超訊通信與中特新聯(lián)、星航智算采購合同中涉及采購其曦云C500-P

Pcie;天數(shù)智芯,聯(lián)合無問蒼穹在天垓150千卡集群上將70B

LLaMA模型訓(xùn)練性能提升至國際領(lǐng)先水平;壁仞科技,其通用GPU參與中國移動呼和浩特項目。燧原、沐熙、天數(shù)、壁仞等也是國內(nèi)AI算力芯片市場的重要參與者?

慶陽智算中心燧原S60萬卡推理集群,2025年1月開始對外提供推理算力服務(wù)。?

超訊通信與中特新聯(lián)、星航智算采購合同中涉及采購曦云C500-P

Pcie,合同金額合計約14.88億元。?

太湖億芯(無錫)智算中心S60推理算力集群。?

芯穹

聯(lián)

合天

數(shù)在

150千

卡集

上將

70BLLaMA模型訓(xùn)練性能提升至國際領(lǐng)先水平,并將一個千億級參數(shù)的MoE模型性能提升了53.5%。?

壁仞科技通用GPU參與中國移動呼和浩特智算中心項目。27數(shù)據(jù):燧原科技Enflame公眾號,超訊通信公告,上海經(jīng)信委公眾號,壁仞科技Birentech公眾號,平安證券研究所目錄CONTENTS一、AIGC蓬勃發(fā)展,對底層智能算力產(chǎn)生強勁需求二、AI算力芯片:ASIC蒸蒸日上,關(guān)注AI芯片國產(chǎn)化三、AI服務(wù)器:市場景氣度高,國產(chǎn)AI芯片服務(wù)器占比提高四、投資建議及風(fēng)險提示3.1

AI服務(wù)器|需求高漲,推理端增長潛力高于訓(xùn)練端

AI算力需求旺盛,AI服務(wù)器市場景氣度將持續(xù)高企。根據(jù)IDC&浪潮信息報告數(shù)據(jù),2024年,全球AI服務(wù)器市場規(guī)模為1251億美元,預(yù)計2025年將增長到1587億美元,同比增速26.9%,到2028年有望突破2227億美元,2024-2028年CAGR約15.5%。國內(nèi)來看,2024年,我國AI服務(wù)器市場規(guī)模約190億美元,同比增長86.9%,預(yù)計2028年將達到552億美元,2024-2028年CAGR約30.6%。

端將成為AI服務(wù)器工作負載的主力需求。根據(jù)IDC&浪潮信息報告數(shù)據(jù),2028年,預(yù)計中國AI服務(wù)器推理工作負載將占到73.0%,而訓(xùn)練工作負載僅占27.0%,推理端需求遠高于訓(xùn)練端。全球AI服務(wù)器市場規(guī)模預(yù)測(億美元)我國AI服務(wù)器市場規(guī)模預(yù)測(億美元)中國AI服務(wù)器工作負載情況預(yù)測(%)@202825002000150010005006005004003002001000訓(xùn)練端

推理端020242025F2028F20242025F2028F29數(shù)據(jù):IDC、浪潮信息《2025年中國人工智能計算力發(fā)展評估報告》,平安證券研究所3.1

AI服務(wù)器|集中度高,本土ASIC服務(wù)器蓬勃發(fā)展

我國AI服務(wù)器市場集中度較高。根據(jù)IDC數(shù)據(jù),2024年,浪潮信息、寧暢、新華三位居我國AI服務(wù)器市場Top3,合計市占率52.6%;互聯(lián)網(wǎng)是我國AI服務(wù)器市場最大的需求方,占整體市場超65%的份額,同時來自其他行業(yè)的采購需求也均有不同幅度的增長。

國內(nèi)GPU服務(wù)器仍占主導(dǎo),ASIC等其他AI服務(wù)器快速發(fā)展,且對本土化芯片更為青睞。根據(jù)IDC數(shù)據(jù),2024年,我國GPU服務(wù)器占AI服務(wù)器總市場的份額為69%,仍占據(jù)市場優(yōu)勢地位,同時ASIC和FPGA等非GPU架構(gòu)的AI服務(wù)器也在高速增長,昇騰系列、寒武紀思元系列以及阿里、百度等我國CSP廠商自研AI芯片等都是ASIC架構(gòu),2024年占比超過30%,IDC預(yù)計到2029年,非GPU服務(wù)器市占比將提升到接近50%。此外,根據(jù)TrendForce集邦咨詢“AI芯片自主化進程加速,云端巨頭競相自研ASI

C”研報,我國AI服務(wù)器市場外購英偉達、AMD等芯片的比例,預(yù)計會從2024年約63%下降至2025年約42%,而我國本土芯片供應(yīng)商在國有AI芯片政策支持下,預(yù)期2025年占比將提升至40%,幾乎與外購芯片比例平分秋色。國內(nèi)AI服務(wù)器行業(yè)格局@2024國內(nèi)加速計算服務(wù)器市場份額@2024國內(nèi)非GPU架構(gòu)AI服務(wù)器行業(yè)格局@2024浪潮信息寧暢新華三超聚變其他GPU加速卡非GPU加速卡超巨變浪潮信息新華三其他30數(shù)據(jù):IDC,AI人工智能行業(yè)動態(tài)公眾號,TrendForce《AI芯片自主化進程加速,云端巨頭競相自研ASIC》研報,平安證券研究所3.1

浪潮信息|全球AI服務(wù)器行業(yè)領(lǐng)先企業(yè),新產(chǎn)品持續(xù)迭代

浪潮信息是全球AI服務(wù)器領(lǐng)先企業(yè)。根據(jù)浪潮信息2023年半年報,截至2022年,浪潮信息人工智能服務(wù)器市場份額長期居于全球前列,連續(xù)6年保持中國第一;根據(jù)新黃河信息,2023年,浪潮信息AI服務(wù)器全球市場占有率位列第一。

浪潮信息持續(xù)迭代新產(chǎn)品,行業(yè)領(lǐng)先地位進一步鞏固。公司推動

AI

算力融入各類計算平臺之中,并將計算品牌全面升級為“元腦”。2024

年,公司發(fā)布了業(yè)界首個僅靠

4

顆CPU運行千億參數(shù)大模型的AI通用服務(wù)器NF8260G7,能夠靈活滿足基于大模型的AI應(yīng)用及云計算、數(shù)據(jù)庫等通用場景;還重磅發(fā)布了元腦服務(wù)器第八代新品,基于開放架構(gòu)設(shè)計,業(yè)界率先實現(xiàn)“一機多芯”,引領(lǐng)多元算力生態(tài)共進,具備更全面的智能能力和更高能效;推出了國內(nèi)首款42kW智算風(fēng)冷算力倉,單機柜可部署AI服務(wù)器的數(shù)量是傳統(tǒng)風(fēng)冷機柜的6倍以上,相比傳統(tǒng)風(fēng)冷數(shù)據(jù)中心整體節(jié)能25%以上。受益于我國AI服務(wù)器市場的高景氣度,公司2024年和2025年一季度營收持續(xù)高速增長。浪潮信息元腦人工智能服務(wù)NF5688G8技術(shù)規(guī)格浪潮信息2024和2025Q1營收高速增長營收(億元)同比增長率型號高度GPUNF5688-A8-A0-R0-001400120010008006004002000180%160%140%120%100%80%165.31%1147.676U1塊NVIDIAHGX-Hopper-8GPU模組2顆AMD第五代EPYCTM處理器,最大cTDP500W24條DDR5DIMMs內(nèi)存,速率最高支持6400MT/S最多支持24塊2.5英寸SSD硬盤,其中最大支持16塊NVMe處理器內(nèi)存存儲74.24%468.582025Q160%40%20%0%202431數(shù)據(jù):浪潮信息官網(wǎng),Wind,平安證券研究所3.1

昇騰服務(wù)器|協(xié)同合作伙伴拓展市場,發(fā)展勢頭良好

昇騰計算產(chǎn)業(yè)是基于昇騰系列處理器和基礎(chǔ)軟件構(gòu)建的全棧AI計算基礎(chǔ)設(shè)施、行業(yè)應(yīng)用及服務(wù),包括昇騰系列處理器、系列硬件、CANN(Compute

Architecture

for

Neural

Networks,異構(gòu)計算架構(gòu))、AI計算框架、應(yīng)用使能、開發(fā)工具鏈、管理運維工具、行業(yè)應(yīng)用及服務(wù)等全產(chǎn)業(yè)鏈。昇騰計算產(chǎn)業(yè)已形成較為完善的生態(tài)鏈,協(xié)同合作伙伴拓展市場,昇騰服務(wù)器是我國國產(chǎn)AI芯片(ASIC架構(gòu))服務(wù)器的典型代表,發(fā)展勢頭良好。如前所述,根據(jù)IDC數(shù)據(jù),2024年,我國非GPU架構(gòu)的AI服務(wù)器占比已超過30%。昇騰芯片與14家AI服務(wù)器廠商建立了生態(tài)伙伴關(guān)系32數(shù)據(jù):昇騰社區(qū)網(wǎng)站,平安證券研究所3.1

昇騰服務(wù)器|

云推出超節(jié)點,在AI基礎(chǔ)設(shè)施領(lǐng)域?qū)崿F(xiàn)突破

云推出CloudMatrix

384超節(jié)點,并已在蕪湖數(shù)據(jù)中心規(guī)模上線。根據(jù)新京報消息,4月10日-11日,云生態(tài)大會2025在蕪湖召開,公司常務(wù)董事、

云計算CEO張平安公布了AI基礎(chǔ)設(shè)施架構(gòu)突破性進展,推出CloudMatrix

384超節(jié)點,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。CloudMatrix

384是目前國內(nèi)唯一正式商用的大規(guī)模超節(jié)點集群,實現(xiàn)從服務(wù)器級到矩陣級的資源供給模式轉(zhuǎn)變。CloudMatrix384具備高密、高速、高效的特點,通過全面的架構(gòu)創(chuàng)新,在算力、互聯(lián)帶寬、內(nèi)存帶寬等方面實現(xiàn)全面領(lǐng)先。

CloudMatrix

384在多項關(guān)鍵指標上實現(xiàn)對英偉達GB200

NVL72的超越。根據(jù)人民網(wǎng)引用SemiAnalysis信息,CloudMatrix

384基于384顆昇騰芯片構(gòu)建,通過全互連拓撲架構(gòu)實現(xiàn)芯片間高效協(xié)同,可提供高達300PFLOPs的密集BF16算力,接近達到英偉達GB200

NVL72的兩倍,同時,CM384總內(nèi)存容量超出英偉達方案3.6倍,內(nèi)存帶寬也達到2.1倍,為大規(guī)模AI訓(xùn)練和推理提供了更高效的硬件支持。CloudMatrix384的發(fā)布,標志著我國在AI計算系統(tǒng)領(lǐng)域已具備與國際巨頭正面競爭的實力,我國在AI基礎(chǔ)設(shè)施領(lǐng)域?qū)崿F(xiàn)里程碑式突破。CloudMatrix

384具備高密、高速、高效的特點CloudMatrix

384具備六大技術(shù)優(yōu)勢技術(shù)優(yōu)勢MoE親和以網(wǎng)強算以存強算長穩(wěn)可靠朝推夜訓(xùn)簡介通過高速互聯(lián)總線,能夠?qū)崿F(xiàn)一卡一專家高效分布式推理,單卡的MoE計算和通信效率都大幅提升通過MatrixLink服務(wù)將單層網(wǎng)絡(luò)升級為兩層高速網(wǎng)絡(luò)首創(chuàng)了EMS彈性內(nèi)存存儲,打破傳統(tǒng)GPU算力與顯存綁定的關(guān)鍵障礙開發(fā)了昇騰云腦運維“1-3-10”標準,即

1

分鐘感知、3分鐘定界、10

分鐘內(nèi)恢復(fù)通過“訓(xùn)推共池”“靈活調(diào)度”兩大關(guān)鍵技術(shù)實現(xiàn)朝推夜訓(xùn)云已經(jīng)在全國三大樞紐數(shù)據(jù)中心——烏蘭察布、貴安和蕪湖完成了超節(jié)點規(guī)模布局,支持百TB級的帶寬互聯(lián),10毫秒時延圈覆蓋全國19個城市群即開即用33數(shù)據(jù):新京報,人民網(wǎng),SemiAnalysis,云,央廣網(wǎng),平安證券研究所3.2

AI大模型一體機|大幅拉低AI應(yīng)用門檻

據(jù)

星環(huán)科技網(wǎng)站信息,AI大模型一體機是將大型人工智能模型與專用硬件設(shè)備整合在一起的綜合性解決方案。

AI大模型一體機通常包含高性能計算硬件、預(yù)訓(xùn)練好的大型AI模型以及配套的軟件系統(tǒng),所有組件都經(jīng)過優(yōu)化設(shè)計,能夠協(xié)同工作。與傳統(tǒng)AI部署方式不同,一體機采用“開箱即用”的設(shè)計理念,用戶無需自行搭建復(fù)雜的技術(shù)棧,大大降低了AI應(yīng)用的門檻。

相比傳統(tǒng)的AI大模型部署架構(gòu),AI大模型一體機在便捷性、性能優(yōu)化、數(shù)據(jù)安全性等方面有較為明顯的優(yōu)勢。AI大模型一體機的技術(shù)架構(gòu)的核心組成部分AI大模型一體機相比傳統(tǒng)AI大模型部署架構(gòu)的優(yōu)勢優(yōu)勢簡介?

包括高性能GPU或TPU等專門為AI計算優(yōu)化的處理器計算硬件軟件系統(tǒng)傳統(tǒng)AI模型部署需要企業(yè)具備專業(yè)的技術(shù)團隊,解決從硬件選型到軟件配置的一系列復(fù)雜問題。而一體機將這些工作提前完成,用戶只需連接電源和網(wǎng)絡(luò),就能快速獲得AI能力。這種設(shè)計特別適合那些希望快速應(yīng)用AI但又缺乏專業(yè)技術(shù)團隊的中小企業(yè)和機構(gòu)。便捷性?

包含操作系統(tǒng)、驅(qū)動程序和AI框架等基礎(chǔ)軟件在性能表現(xiàn)方面,一體機通常經(jīng)過深度優(yōu)化。硬件和軟件的協(xié)同設(shè)計意味著計算資源能夠被充分利用,避免了一般部署中常見的資源浪費問題。同時,許多一體機還針對特定場景進行了優(yōu)化,比如金融領(lǐng)域的風(fēng)險模型或醫(yī)療領(lǐng)域的影像分析,這使得它們在專業(yè)任務(wù)上的表現(xiàn)往往優(yōu)于通用型AI服務(wù)。性能優(yōu)化?

預(yù)裝的大規(guī)模預(yù)訓(xùn)練模型,這些模型可能專注于自然語言處理、計算機視覺或多模態(tài)任務(wù)與將數(shù)據(jù)上傳至公有云AI服務(wù)不同,一體機可以在企業(yè)本地運行,敏感數(shù)據(jù)無需離開組織內(nèi)部網(wǎng)絡(luò)。這一特點對政府機構(gòu)、醫(yī)療機構(gòu)和金融機構(gòu)等對數(shù)據(jù)安全要求嚴格的用戶尤為重要。預(yù)裝大模型數(shù)據(jù)安全性34數(shù)據(jù):星環(huán)科技官網(wǎng),平安證券研究所3.2

AI大模型一體機|輕量化DeepSeek本地化部署之最佳選擇

DeepSeek大模型的開源、低成本和高性能將大幅降低大模型的獲得、部署和應(yīng)用成本,很好的解決了之前大模型本地部署成本高的痛點,DeepSeek浪潮將加快AI大模型一體機的發(fā)展。在DeepSeek橫空出世之前,

AI大模型一體機雖然在便捷性、性能優(yōu)化、數(shù)據(jù)安全性等方面有較為明顯的優(yōu)勢,但大模型高昂的部署成本(包括軟硬件成本以及大模型的授權(quán)使用費用等),仍然極大限制了大模型一體機在本地部署的普及和推廣。2024年12月和2025年1月,DeepSeek

V3和R1相繼正式發(fā)布,其開源、低成本、高性能特點引發(fā)了全球的廣泛關(guān)注。DeepSeek在開源DeepSeek-R1-Zero和DeepSeek-R1這兩個660B模型的同時,通過

DeepSeek-R1蒸餾了6個小模型開源給社區(qū),其中32B和70B模型性能表現(xiàn)良好,多項能力可對標OpenAI

o1-mini,蒸餾后的小模型需要的硬件部署成本更低。根據(jù)云軸科技ZStack智塔DeepSeek一體機的配置要求,部署DeepSeek

R1

671B滿血版,最小規(guī)模只需要1臺8卡H20(141G的版本)服務(wù)器或2臺8卡昇騰910B(910B_4版本)即可,大模型本地部署門檻得到大幅降低,強力推動AI大模型一體機的發(fā)展。De

e

pSeek

R1蒸餾的小模型性能表現(xiàn)良好Z

S

tack智塔AI一體機DeepSeek版4種配置機型35數(shù)據(jù):DeepSeek官網(wǎng),北京軟件和信息服務(wù)業(yè)協(xié)會,ZStack云計算,平安證券研究所3.2

DeepSeek大模型一體機|供應(yīng)端呈現(xiàn)“百機大戰(zhàn)”格局

基于DeepSeek

V3/R1大模型的特點與本地部署模式良好的契合,DeepSeek一體機成為我國AI一體機的主流發(fā)展趨勢。根據(jù)《中國AI大模型一體機市場分析與品牌推薦2025》信息,從DeepSeek

R1正式發(fā)布以來,我國市場已有100多家廠商推出AI(DeepSeek)一體機。其中,數(shù)字基礎(chǔ)設(shè)施軟硬件提供商、云服務(wù)廠商、GenAI初創(chuàng)廠商、GenAI模型/工具廠商、企業(yè)應(yīng)用開發(fā)商、IT咨詢/系統(tǒng)集成商紛紛涉足。我國DeepSeek大模型一體機在供應(yīng)端呈現(xiàn)“百機大戰(zhàn)”格局。2025年1月以來推出AI(DeepSeek)一體機的部分廠商及產(chǎn)品簡介廠商產(chǎn)品簡介2月5日,聯(lián)想集團與國產(chǎn)GPU領(lǐng)軍企業(yè)沐曦股份聯(lián)合發(fā)布基于DeepSeek大模型的首個國產(chǎn)一體機解決方案。該方案以“聯(lián)想服務(wù)器/工作站+沐曦訓(xùn)推一體國產(chǎn)GPU+自主算法”為核心架聯(lián)想集團、沐曦股份

構(gòu),配合聯(lián)想AIForce智能體開發(fā)平臺,推出智能體一體機與訓(xùn)推一體服務(wù)器雙產(chǎn)品形態(tài),率先實現(xiàn)從千億參數(shù)大模型訓(xùn)練到場景化推理落地的全鏈條覆蓋。截至3月7日,該解決方案首月累計發(fā)貨量已突破千臺,配備沐曦國產(chǎn)GPU卡近萬張,覆蓋醫(yī)療、教育、制造等十余個核心行業(yè)。2月10日,天翼云正式推出息壤智算一體機-DeepSeek版,為各行各業(yè)提供性能卓越、安全可控的智能算力解決方案,息壤智算一體機-DeepSeek版集國產(chǎn)算力(鯤鵬+昇騰)、國產(chǎn)模型和國產(chǎn)云服務(wù)于一身,深度融合了DeepSeek-R1/V3系列大模型,實現(xiàn)了從芯片、推理引擎到模型服務(wù)的全棧國產(chǎn)化天翼云深信服根據(jù)深信服網(wǎng)站2月17日信息,深信服現(xiàn)已打造「HCI+AICP新一代超融合」解決方案,只需在原集群基礎(chǔ)上增加一臺GPU節(jié)點,就能基于本地集群快速部署并承載DeepSeek在內(nèi)的企業(yè)級大模型。除了支持英偉達GPU,深信服AICP算力平臺和多家國產(chǎn)廠商開展了廣泛的軟硬件兼容測試,可適配天數(shù)智芯、昇騰、海光、沐曦、燧原等多款國產(chǎn)卡,為用戶實現(xiàn)算力異構(gòu)管理。根據(jù)深信服2025年一季報,公司2025年一季度實現(xiàn)營業(yè)收入12.62億元,同比增長21.91%,主要是因為,公司云業(yè)務(wù)訂單增速較好,帶動公司整體收入實現(xiàn)增長。根據(jù)百度智能云網(wǎng)站2月24日信息,百度智能云相繼推出了百舸、千帆、以及一見DeepSeek一體機解決方案。百舸DeepSeek一體機是一款專為DeepSeek私有化部署場景設(shè)計的具有極致效價比的大模型一體機,搭載國產(chǎn)高性能芯片昆侖芯P800,單機支持DeepSeek滿血版,充分滿足高性能推理需求。百度智能云發(fā)布四款千帆DeepSeek一體機,國產(chǎn)單機8卡即可輕松承載DeepSeek滿血版和蒸餾版模型,包含昆侖芯P800(OAM版)、昆侖芯P800(PCIe版)、以及昇騰Atlas

800兩款機型,除了滿足訓(xùn)推需求之外,千帆DeepSeek一體機還為企業(yè)提供了一站式的模型應(yīng)用解決方案,能夠滿足企業(yè)全鏈路模型開發(fā)應(yīng)用工具鏈需求。百度智能云一見DeepSeek一體機,除了滿足昆侖芯P800

DeepSeek模型推理需求之外,結(jié)合多模態(tài)大模型、視覺專家模型,可為能源、制造、連鎖等行業(yè)提供從視覺感知到智能決策的全鏈路閉環(huán)解決方案。百度根據(jù)星環(huán)科技網(wǎng)站2月28日信息,星環(huán)科技正式推出新一代高性能大模型一體機TxData-LM(LLMops

forDeepSeek一體機版本),TxData-LM以“滿血版”DeepSeek

671B大模型為核心,依托星環(huán)自研的Sophon

LLMops平臺,打通語料開發(fā)、模型訓(xùn)練、知識融合、應(yīng)用部署等全鏈路流程,支持企業(yè)高效構(gòu)建智能體與應(yīng)用。星環(huán)科技神州數(shù)碼2月28日,神州鯤泰問學(xué)一體機DeepSeek版在第三屆北京人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展大會上正式發(fā)布,神州鯤泰問學(xué)一體機DeepSeek版提供DeepSeek全系列模型選型服務(wù)及全棧部署方案,基于鯤鵬、昇騰的全棧適配服務(wù),通過深度優(yōu)化的私有化部署方案,為企業(yè)提供高效、穩(wěn)定的AI服務(wù)。根據(jù)云軸科技網(wǎng)站3月3日信息,云軸科技ZStack推出ZStack智塔AI一體機DeepSeek版,這是一款專為大模型部署與應(yīng)用設(shè)計的軟硬協(xié)同產(chǎn)品,集成多樣化硬件配置(英偉達、昇騰、海光等主流GPU機型)與AIInfra平臺ZStack

AIOS智塔軟件,支持DeepSeek全尺寸模型(1.5B參數(shù)-671B參數(shù))等多種模型,為企業(yè)提供從模型精調(diào)到推理再到應(yīng)用的全流程支持。云軸科技ZStack36數(shù)據(jù):中國日報網(wǎng),各公司官網(wǎng),平安證券研究所3.2

DeepSeek大模型一體機|需求端快速落地

DeepSeek大模型一體機在政務(wù)、金融、醫(yī)療、教育、物流等多個行業(yè)快速落地,未來發(fā)展?jié)摿^大。根據(jù)中國日報網(wǎng)信息,聯(lián)想集團與沐曦股份聯(lián)合發(fā)布的基于DeepSeek大模型的首個國產(chǎn)一體機解決方案,首月累計發(fā)貨量已突破千臺,配備沐曦國產(chǎn)GPU卡近萬張,覆蓋醫(yī)療、教育、制造等十余個核心行業(yè)。根據(jù)新浪財經(jīng)信息,5月20日,京東在京東云城市大會上表示,過去三個月,“開箱即用”的京東云大模型一體機快速發(fā)展,全國規(guī)?;涞匾淹黄?00臺。De

e

pSeek大模型一體機在政務(wù)、金融、醫(yī)療、教育、物流等多個行業(yè)的落地案例示例落地單位行業(yè)政務(wù)政務(wù)政務(wù)項目簡介根

據(jù)

廣州日報2月26日信息,廣州市中級人民法院聯(lián)合廣州數(shù)據(jù)集團正式上線“法院DeepSeek應(yīng)用體驗中心”,標志著廣州市政務(wù)領(lǐng)域首個DeepSeek一體機私有化部署項目成功落地。該一體機部署了DeepSeek-R1-Distill-Llama-70B模型推理服務(wù),有效解決司法系統(tǒng)內(nèi)網(wǎng)環(huán)境下DeepSeek模型運用的難題,確?!八痉〝?shù)據(jù)不出域”。廣州市中級人

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論