GPU行業(yè)市場分析_第1頁
GPU行業(yè)市場分析_第2頁
GPU行業(yè)市場分析_第3頁
GPU行業(yè)市場分析_第4頁
GPU行業(yè)市場分析_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

GPU行業(yè)市場分析

核心觀點:

理解GPU的核心:性能先進性+生態(tài)計算壁壘。GPU物理性能取決

于微架構(gòu)、制程、流處理器數(shù)量、核心頻率等,其中微架構(gòu)是核心點。

我們認為微架構(gòu)的快速創(chuàng)新迭代是GPU性能領(lǐng)先的前提,其圖形渲

染單元和通用計算單元設(shè)計向著“更多、更專、更智能'的方向優(yōu)化迭

代。根據(jù)應用場景來劃分,數(shù)據(jù)中心要求強算力、高并發(fā)吞吐量;游

戲業(yè)務要求浮點運算能力強、訪存速度快;圖形顯示要求圖顯專業(yè)化、

精細化等。

生態(tài):GPU生態(tài)構(gòu)筑通用計算極深壁壘,CUDA生態(tài)占據(jù)大部分市

場,類CUDA生態(tài)蓬勃發(fā)展。GPU生態(tài)由上層算法庫,中層接口、

驅(qū)動、編譯器和底層硬件架構(gòu)三大部分基本構(gòu)成。GPU研發(fā)難度在

圖形渲染硬件層面和通用計算軟件生態(tài)層面,在IP、軟件棧方面研

發(fā)門檻較高,需要較長的積累,先發(fā)優(yōu)勢明顯。CUDA生態(tài)從2006

年推出至今,經(jīng)過不斷發(fā)展完善,幾乎己在行業(yè)生態(tài)內(nèi)處于壟斷地位,

目前ROCm等兼容Cuda的類計算生態(tài)蓬勃發(fā)展并處于快速推廣階

段。

海外復盤:NVIDIA與AMD(ATI)的競爭貫穿GPU發(fā)展歷程,架

構(gòu)創(chuàng)新升級和新興AI等領(lǐng)域前瞻探索是領(lǐng)跑的關(guān)鍵。NVIDIA長期居

于GPU市場領(lǐng)導地位,近年AMD憑借RDNA架構(gòu)在游戲市場強勢

崛起。VerHiedMarketResearch數(shù)據(jù)顯示,2022年全球獨立GPL)市

場規(guī)模約448.3億美元,NVIDIA和AMD的市場份額占比約為8:2。

根據(jù)JPR數(shù)據(jù),NVIDIA憑借自身性能領(lǐng)先和CUDA生態(tài)優(yōu)勢性始

終占有GPU領(lǐng)域超50%的市場份額,數(shù)據(jù)中心業(yè)務更是全面領(lǐng)先,

在游戲顯卡領(lǐng)域,近年AMD憑借RDNA系列架構(gòu)強勢崛起。

NVIDIA先后與AMD等企一業(yè)在性能方面競爭博弈,架構(gòu)創(chuàng)新升級和

新興領(lǐng)域前瞻探索是領(lǐng)跑GPU行業(yè)的關(guān)鍵。NVIDIA憑借性能領(lǐng)先

長期占據(jù)超五成市場份額,AMD(ATI)也曾因架構(gòu)出色、性能驚艷

實現(xiàn)反超。同時NVIDIA早在2006年前瞻性布局通用計算、構(gòu)建

CUDA生態(tài),為如今AI&數(shù)據(jù)中心領(lǐng)域的全面領(lǐng)先構(gòu)筑牢固的壁壘。

NVIDIA積極布局異構(gòu)芯片、汽車、元宇宙等新市場,尋找新的強有

力業(yè)務增長點。

國內(nèi)GPU市場:各應用場景市場廣闊,國內(nèi)廠商大有可為。需求端

1—AI:數(shù)據(jù)中心和終端場景不斷落地對計算芯片提出更多更高需求。

新一輪AI對算力需求遠超以往:ChatGPT類語言大模型底層是2017

年出現(xiàn)的Transformer架構(gòu),該架構(gòu)相比傳統(tǒng)的CNN/RNN為基礎(chǔ)的

AI模型,參數(shù)量達到數(shù)千億,對算力消耗巨大,對算力硬件有大量

需求。甲子光年預測,中國AI芯片市場規(guī)模2023年達到557億元。

AI芯片可進一步細分為云端和終端,中國云端芯片市場規(guī)模較大,

甲子光年預計2023年增長至384.6億元,對應復合年增速到52.8%;

終端芯片市場規(guī)模甲子光年預計2023年增長至173億元,對應年復

合增長率達62.2%,伴隨各AI終端落地預計將保持較快增長速度。

需求端2—汽車:汽車智能化浪潮下域控制器GPU市場前景廣闊。

自動駕駛和智能座艙是智能汽車中具有廣闊前景的方向。蓋世汽車數(shù)

據(jù)預計,2025年自動駕駛域控制器出貨量將達到432萬臺,每臺自

動駕駛域控制器配備1-4片高性能計算GPU;智能座艙域控制器出

貨量達到528萬臺,絕大多數(shù)智能座艙域控制器配備1片GPU。自

動駕駛技術(shù)不斷提高和座艙進一步智能化拉動汽車GPU市場規(guī)???/p>

速擴張。需求端3—游戲:游戲玩家人數(shù)持續(xù)增長,游戲GPU市場

穩(wěn)中有升。NewzooExpert數(shù)據(jù)顯示全球游戲玩家人數(shù)在2021年已

達到30.57億人,且預計2020-2025年全球游戲玩家人數(shù)復合年增

率為4.2%;游戲市場內(nèi),游戲機和PC兩大主體出貨量再創(chuàng)新高,

游戲機三大巨頭2021年出貨量高達4008萬臺;2021年Q4全球

PCGPU出貨量(包括集成和獨立顯卡)高達11000萬片。

1、理解GPU的核心:性能+生態(tài)

1.1、GPU定位:計算機圖形處理以及并行計算的核心

GPU全稱是GraphicProcessingUnit,即圖形處理單元,是計算機顯

卡的核心。GPU是計算機的圖形處理以及并行計算內(nèi)核。它的主要

功能可以分為:1)圖形圖像渲染計算GPU;2)作為運算協(xié)作處理

器GPGPU。GPU的功能主要集中于執(zhí)行高度線程化、相對簡單的

并行任務處理。GPUvsGPGPU:GPGPU全稱通用GPU,運用CUDA

及對應開放標準的OpenCL實現(xiàn)通用計算功能運算,能夠輔助CPU

進行非圖形相關(guān)程序執(zhí)行。由GPU性能拓展至計算密集領(lǐng)域,將

GPU強大的并行運算能力運用于通用計算領(lǐng)域。多側(cè)重科學計算、

AI領(lǐng)域、大數(shù)據(jù)處理、通用計算、物理計算、加密貨幣生成等領(lǐng)域。

依據(jù)接入方式不同分為:獨立GPU和集成GPU。1)獨立GPU:大

部分封裝于獨立顯卡電路板上,使用PCIE接口和特定顯存,不受空

間和供電限制,性能相對更好、渲染畫質(zhì)更佳。主要廠商包括AMD

(Radeon系歹U)、NVIDIA(Geforce系列)。2)集成GPU:通常

未擁有獨立顯存,集成于CPU內(nèi)部,與CPU共同使用Die和系統(tǒng)

內(nèi)存,節(jié)省空間占位和制作難度,價格較低、兼容性更佳且供電量少。

主要廠商包括Intel(HD系列)、AMD(APU系列)。

依據(jù)應用端不同分為:PCGPU、服務器GPU和移動GPU。1)PC

端:集成GPU主要運用于提高輕辦公效率,對性能要求較低;獨立

GPU主要運用于圖形設(shè)計、提高圖片制作清晰度以及3A游戲繪圖渲

染能力,對性能要求較高。2)服務器端:主要進行專業(yè)可視化處理、

AI訓練、AI推斷的深度學習、提高計算運行能力以及視頻編解碼等

功能,以獨立GPU為主。3)移動端:提高游戲體驗、提升游戲處

理性能,應用場景包括AR、桌面、云計算、數(shù)據(jù)中心等。受移動端

功耗和體積限制,一般為集成GPU。

1.2、GPU性能影響因素:微架構(gòu)、制程、核心頻率

微架構(gòu):又稱為微處理器體系結(jié)構(gòu),是硬件電路結(jié)構(gòu),用以實現(xiàn)指令

執(zhí)行。制程:指GPU集成電路的密集度。在晶體管硬件數(shù)量一定的

情況下,更精細的制程能夠減少功耗和發(fā)熱。現(xiàn)階段GPU主流最先

進工藝制程為5nm,核心頻率:代表GPU顯示核心處理圖像頻率大

小/工作頻率,能夠反映顯示核心的性能。

圖形處理器單元數(shù)量:指GPU內(nèi)部圖形處理單元,涵蓋光柵單元

(ROP)和紋理單元(TMU)等數(shù)量。光柵單元(ROP):進行光

線、反射計算,負責游戲中高分辨率、高畫質(zhì)的效果生成。紋理單元

(TMU):能夠?qū)ΧM制的圖形進行一系列翻轉(zhuǎn)、縮放變化,再將

其紋理傳輸至3D平面模型中。CUDA核數(shù):作為GPU內(nèi)部的流處

理器,是主要的計算單元,CUDA核數(shù)越多,GPU性能等級越高。

Tensor核數(shù):能夠進行張量核加速GEMM計算以及加速卷積和遞歸

神經(jīng)網(wǎng)絡運行,Tensor核數(shù)越多,在人工智能、深度學習領(lǐng)域的性

能越強。

顯存容量:顯存作為GPU核心部件,用以臨時存儲未處理數(shù)據(jù)。顯

存容量的大小對于GPU存儲臨時數(shù)據(jù)的多少起決定性作用,在GPU

核心性能能夠提供充足支撐前提下,越大的顯存容量能夠減少數(shù)據(jù)讀

取次數(shù),減少延遲出現(xiàn)。顯存位寬:是GPU在單位時鐘周期內(nèi)傳送

數(shù)據(jù)的最大位數(shù),位數(shù)越大GPU的吞吐量越大。顯存頻率:顯存數(shù)

據(jù)傳輸?shù)乃俣燃达@存工作頻率,通常以MHz為顯存頻率計數(shù)單位。

顯存帶寬:顯存帶寬=顯存頻率X顯存位寬/8,為顯存與顯卡芯片間

數(shù)據(jù)傳輸量。

PolyMorphEngine(黃色部分,多形體引擎),是全球首款實現(xiàn)了可

擴展幾何學流水線的重要元件。主要負責頂點拾取(VertexFetch)、

細分曲面(Tessellation)、視口轉(zhuǎn)換(ViewportTransform)、屬性

設(shè)定(AttributeSetup)、流輸出(StreamOutput)五個方面的處理

工作。在圖形渲染流水線中:VertexFetch通過三角形索引取出三角

形數(shù)據(jù)。ViewportTransform負責模塊處理已完成vertex-shader的

所有指令,進行裁剪二角形,準備柵格化。AttributeSetup確保經(jīng)過

插值后的vertex-shader數(shù)據(jù)在pixelshader中的可讀性。

微架構(gòu)未來方向:更多、更專、更智能

更專:圖形渲染能力更精細,通用計算能力更高效。圖形渲染領(lǐng)域:

采用光線追蹤技術(shù),相較傳統(tǒng)光柵化渲染方式,光線追蹤采用基于物

理渲染方式,使得所實現(xiàn)的效果更加接近顯示,具有更加逼真的圖顯

能力。通用計算領(lǐng)域:目前國際各大廠商均推出GPGPU計算解決方

案,大規(guī)模擴展計算能力的高性能計算。例如:1)ATIStream:為

程序員提供SDK開發(fā)工具包以協(xié)同進行GPU計算。2)NVIDIACUDA:

推出統(tǒng)一計算架構(gòu),由管線分工式設(shè)計轉(zhuǎn)變?yōu)榻y(tǒng)一化的處理器設(shè)計,

學習成本較低,能夠通過C、C++編程語言進行程序編寫。

更智能:GPUAI運算能力上升。GPU在AI領(lǐng)域得到廣泛的應用,

包括自動駕駛、醫(yī)療影像分析、人工智能計算能力、金融模型建立等

領(lǐng)域,如第三代的張量單元相較于上代在吞吐量上提升了1倍。GPU

自身結(jié)構(gòu)特點決定其在Al的發(fā)展方向:1)多線程,計算單元數(shù)量多,

并行計算方式能夠同時計算大量數(shù)據(jù)。2)擁有更直接、迅速訪問緩

存的能力。3)擁有更高精度的浮點算力,能夠更佳適配于推理訓練、

深度學習。

應用場景:數(shù)據(jù)中心、游戲業(yè)務、圖形顯示、OEM、加密貨幣

GPU技術(shù)不斷發(fā)展,GPU的應用場景也隨之不斷拓寬,不僅包含圖

形處理,還在AI、邊緣計算等新領(lǐng)域發(fā)揮重要作用。圖形顯示是GPU

最基本的功能。GPU的誕生原因就是分擔CPU計算量,憑借其處理

并行計算的優(yōu)勢承擔圖像信息的運算工作。在游戲畫面顯示、圖像運

算等領(lǐng)域廣泛應用。GPGPU被視為AI時代的算力核心。應用于人

工智能場景的服務器通常搭載GPU、FPGA、ASIC等加速芯片。加

速芯片和中央處理器的性能結(jié)合支撐高吞吐量的運算需求,為圖形視

覺處理、語音交互等場景提供算力支持,已經(jīng)成為人工智能發(fā)展的重

要支撐力量。GPU由于在架構(gòu)設(shè)計上擅長進行大量數(shù)據(jù)運算,被廣

泛應用于人工智能計算中。在人工智能的應用和研究、智能安防、邊

緣計算、無人駕駛等領(lǐng)域發(fā)揮作用。

應用場景:人工智能芯片GPGPU、FPGA、ASIC的選擇

GPGPU:為通用圖形處理器,擅長圖形處理,“粗粒度并行”技術(shù)。

特點為擁有高靈活性、運用并行結(jié)構(gòu)、在圖形和復雜算法上效率較高;

缺點為價格貴且功耗高。FPGA:為現(xiàn)場可編程邏輯陣列,擅長于算

法更新頻繁的專用領(lǐng)域。特點為靈活性適中、可以同時進行數(shù)據(jù)并行

和任務并行計算、制作成本低于ASIC、定制化、功耗低。在國內(nèi)多

用于芯片驗證。ASIC:為專用集成電路,應用于市場需求量大的專

用領(lǐng)域。指應特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計、制造的集

成電路,特點是靈活性較低、高性能、成本高、可靠性高。缺點是算

法相對固定、開發(fā)時間成本高。

1.3、GPU指令集:GPU進行圖形渲染和通用計算的指令集合

GPU指令集本質(zhì)是硬件執(zhí)行功能的機器碼。指令是計算機運行的最

基本工作單位,是GPU功能實現(xiàn)的重要基礎(chǔ),通常包括指令格式、

尋址方式和數(shù)據(jù)形式等。GPU指令集是GPU中用以計算和控制系統(tǒng)

的指令集合,指令集的先進與否直接關(guān)系到GPU性能的高低。操作

系統(tǒng)通過指令集對硬件進行管理和資源分配,并規(guī)范程序按認可方式

編譯運行。GPU指令集分類包括PTX、CUDASASS指令集等。

指令集相關(guān)性質(zhì):指令集本身在特定架構(gòu)改變下會表現(xiàn)為指令性能變

化,而本身的編碼和功能并沒有發(fā)生改變。兼容性:經(jīng)過CUDAC、

C++編譯完成后,會同時生成與SM單元對應的PTX和SASS代碼。

指令執(zhí)行吞吐是評價GPGPU執(zhí)行的有效指標,GPU指令吞吐一般

用每單位SM在一周期內(nèi)執(zhí)行的指令數(shù)量計算SASS指令集分類:

主要包括Predicate操作指令、Float指令、Integer指令、格式轉(zhuǎn)化/

數(shù)據(jù)移動/內(nèi)存操作/跳轉(zhuǎn)分支指令和UMformDataPath指令。

MOV:能夠完成基本傳送指令。MOV指令是編程中最基本的指令,能

夠?qū)?shù)據(jù)從起始源地址傳送到目標地址。功能范圍覆蓋立即數(shù)傳送、

寄存器傳送、儲存器傳送、段寄存器傳送。MUFU:作為SASS指

令集中計算超越函數(shù)的重要工具。超越函數(shù)指的是相對有限次加減乘

除等組合而言,便件上無法用多項式表小的函數(shù)需要通過該指令進行

近似計算,若對精度有進一步要求,還需要調(diào)用數(shù)學函數(shù)庫中其他軟

件。完善的GPU生態(tài)體系能夠兼容不同的軟件、硬件平臺,使得

GPU性能得到最佳釋放。GPU生態(tài)的由三大部分基本構(gòu)成:1)上

層圖形引擎、算法庫。2)中層標準API接口適配各類驅(qū)動、編譯器。

3)底層硬件/指令集架構(gòu)。

GPU生態(tài)體系:構(gòu)筑行業(yè)壁壘的基石

IP研發(fā)難度高:IP研發(fā)難度大、需要多年沉淀才能產(chǎn)出穩(wěn)定性較佳

的產(chǎn)品。目前GPU領(lǐng)域中,想要短期內(nèi)產(chǎn)出需要依賴外部IP授權(quán)。

市場上大多公司使用Imagination提供的IP,即在購買商用GPUIP

之后自行修改迭代。以蘋果芯片IP專利為例,蘋果在A10之前處理

器芯片都是采用Imagination的IP。軟件門檻高:計算機芯片除了硬

件之外,還要求有與之配套的軟件體系,而GPU軟件體系復雜,涵

蓋各類圖形API、計算接口、基礎(chǔ)庫、應用對接適配等等。NVIDIA

在各類軟件驅(qū)動測試上已投入大量時間,形成較強的生態(tài)效應。

規(guī)?;逃秒y:要實現(xiàn)規(guī)?;逃?,就需要廠商實現(xiàn)軟硬件技術(shù)生態(tài)

完整部署。由于行業(yè)在生態(tài)建設(shè)上先發(fā)優(yōu)勢明顯,NVIDIA通過旦期

與客戶企業(yè)的平臺適配、軟件開源合作,較好的用戶體驗加強了客戶

粘性,使新的競爭企業(yè)難以進行轉(zhuǎn)移。市場認可度:市場認可度一方

面需要生產(chǎn)商具備生產(chǎn)高品質(zhì)產(chǎn)品的實力,另一方面需要用戶經(jīng)過一

定時間使用形成反饋累積為企業(yè)信譽。在GPU市場內(nèi),長期以來,

AMD和NVIDIA兩大產(chǎn)商占據(jù)了主要市場份額,也相應形成了較高

的市場認可度,客戶在選擇產(chǎn)品時普遍優(yōu)先考慮這兩大產(chǎn)商的產(chǎn)品;

其他廠商的產(chǎn)品,由于未使用過且市場認可度不高,存在較大的不確

定性,客戶選購意愿較低。

2、他山之石:Nvidia/AMD競爭啟示一架構(gòu)創(chuàng)新升級和新興領(lǐng)域前瞻

探索是主旋律

2.1、總覽:NVIDIA經(jīng)歷風雨遙遙領(lǐng)先,AMD(ATI)再顯崢噪

總體而言,NVIDIA引領(lǐng)GPU行業(yè)發(fā)展數(shù)十年,大多數(shù)時期技術(shù)和

市場份額均領(lǐng)先;AMD(ATI)長期與保持NVIDIA競爭,N/A卡之

爭愈演愈烈。NVIDIA市場份額雖有波動,但長期高于50%,與其產(chǎn)

品性能優(yōu)勢和生態(tài)構(gòu)建優(yōu)勢密不可分。2006年起,英偉達GPU架構(gòu)

保持約每兩年更新一次的節(jié)奏。在這一節(jié)奏下,英偉達代際之間產(chǎn)品

性能提升顯著,生態(tài)構(gòu)建完整,Geforce系列產(chǎn)品市占率長期超過

Radeon鐳龍系列,NVIDIA牢牢把握市場龍頭地位“2019年后,AMD

憑借RDNA架構(gòu)再度崛起。

NVIDIA、AMD(ATI)等企業(yè)構(gòu)筑GPU發(fā)展主旋律

自1999年NVIDIA提出GPU概念,GPU已經(jīng)有20余年發(fā)展歷史。

1995年,3Dfx發(fā)布第一款消費級3D顯卡,拉開圖形處理芯片的發(fā)

展序幕。1999年,NVIDIA提出GPU概念,奠定其GPU行業(yè)霸主

地位,自此AMD、ATI、3Dfx等企業(yè)與NVIDIA合力推動GPU快速

發(fā)展。NVIDIA率先構(gòu)筑通用計算的CUDA生態(tài),引領(lǐng)GPU的行業(yè)

革命;AMD(ATI)CPU、GPU雙線并行緊隨其后。如今人工智能

高速發(fā)展,幾乎應用于各行各業(yè),GPU是目前應用最廣的AI芯片。

NVIDIA把握游戲、數(shù)據(jù)中心市場機遇;AMD加速提升架構(gòu)性能緊隨

其后。

AMD:ATI時代開端奠定市場基礎(chǔ)

AMD顯卡發(fā)展可大致劃分為兩階段:第一階段ATI時代從1985年

至2006年,第二階段從2006年至今為AMD時代一Radeon系列持

續(xù)迭代更新。自早期開始,AMD分為兩路研發(fā),兼顧高端顯卡市場

和低端顯卡市場,其中,高端產(chǎn)品如Radeon8500>RadeonX1800XT

等;從高端顯卡中衍生出多款低端顯卡產(chǎn)品,包括Radeon9000、

9000Pro>9100、9200以及9250。2012年以來,AMD在架構(gòu)上保

持創(chuàng)新態(tài)勢,制程引領(lǐng)行業(yè)先進性。2012年發(fā)布RadeonHD系列,

AMD在架構(gòu)上實現(xiàn)創(chuàng)新,推出GCN架構(gòu),并且是業(yè)界第一款采用

28納米工藝制程的GPU圖形芯片。在圖形渲染和通用計算領(lǐng)域性能

均領(lǐng)先市場內(nèi)競爭對手。2019年,AMD推出RDNA架構(gòu),同時兼

容原有GCN架構(gòu),在性能、功耗、能效等多方面實現(xiàn)超越,正式開

啟第五代架構(gòu)革新之路。

2.2、1962-1995年:圖形處理技術(shù)不斷發(fā)展,3Dfx憑Voodoo一枝

獨秀

1962年起,計算機圖形學不斷發(fā)展,圖形處理技術(shù)實現(xiàn)從2D到3D

的突破。1962年麻省理工學院博士伊凡?蘇澤蘭奠定了計算機圖形學

基礎(chǔ);1984年,SGI公司推出了面向?qū)I(yè)領(lǐng)域的高端圖形工作站,

俗稱圖形加速器,是首個專門的圖形處理硬件。1994年,3DLabs

發(fā)布GLINT300SX,是PC最早的3D硬件加速圖形芯片,從此開啟

3D顯卡時代。1995年,3Dfx發(fā)布Voodoo圖形芯片組配和GlideAPI

接口,一度統(tǒng)治市場。Glide是3Dfx為Voodoo打造的底層3DAPI,

是第一個在PC游戲領(lǐng)域得到大范圍使用的程序接口,使得Voodoo

無須硬件廠商額外提供API就可以直接開發(fā)游戲,具有易用性和穩(wěn)定

性。NVIDIA同期的rival28性能與其有差距。當時的頂級游戲和

部分PC游戲基本都支持Glide。因此即使Voodoo的價格遠遠高于

市場上其他產(chǎn)品,也深受消費者追捧。

3DfxVoodoo系列后續(xù)產(chǎn)品被NVIDIA反超,開始由盛轉(zhuǎn)衰。1996年,

3Dfx憑借Voodoo成為全球3D顯卡和GPU制造領(lǐng)域的壟斷者。1997

年,NVIDIA推出的NV3(RIVA128)有128bit的2D、3D力口速圖形

核心,采用0.35微米工藝,支持微軟Direct3D接口,且性價比高于

Voodoo,被OEM廠商廣泛使用。1998-1999年,NVIDIA推出NV4

性能擊敗Voodoo3,隨后3Dfx的Voodoo4延遲發(fā)布、Voodoo5由

于能耗大、散熱高敗給NVIDIA。

1999年8月,NVIDIA公司發(fā)布圖形芯片Geforce256,首次提出GPU

的概念。Geforce256采用技術(shù)包括硬件變換、“T&L”、立方環(huán)境材質(zhì)

貼圖和頂點混合、凹凸映射貼圖、雙重紋理四像素256位渲染引擎、

紋理壓縮等,兼容DirectX和OpenGL,被稱為世界上第一款GPU。

此前如頂點變換必須在CPU中完成,光柵化后像素有限等,而GPU

將這些功能獨立出來,使顯示核心與CPU并列成為計算機核心,大

大減少CPU的運算壓力。

1999年,NVIDIA崛起,擊敗并收購難以為繼的3Dfx1999年,

NVIDIA的Geforce256奠定了NVIDIA在GPU市場的領(lǐng)先地位。與

此同時的3DFX由于一系列決策失誤,由盛轉(zhuǎn)衰。2000年12月15

日,Nvidia低價收購3Dfx圖形處理相關(guān)所有產(chǎn)業(yè)。3Dfx的失敗可以

歸因于戰(zhàn)略和產(chǎn)品策略問題戰(zhàn)略失誤:芯片廠商涉足板卡制造領(lǐng)域

面臨困難。3Dfx收購板卡制造商STB,希望獨自生產(chǎn)Voodoo顯卡,

但二者的合作并沒有表現(xiàn)出1+1>2的效果,反而拖慢新品發(fā)布進度,

令3Dfx丟掉不少市場份額。同時失去原有板卡廠商合作伙伴,

DIAMOND.GIGABYTE.CREATIVE.ELSA者創(chuàng)口入NVIDIA陣營。

產(chǎn)品策略問題:Voodoo3與Voodoo2相比性能進步很小,只是換了

馬甲;Voodoo4和Voodoo5不支持硬件轉(zhuǎn)換和TV輸出功能,失去

\DVD和家庭影院市場;Voodoo4和Voodoo5不支持DDR內(nèi)存,

而自身適配的SDRAM在性價比上輸給NVIDIA的DDR內(nèi)存,再次

流失市場份額。

2000年顯卡市場格局洗牌,ATI憑Radeon9700強勢崛起,2000年,

ATI發(fā)布Radeon256,180nm工藝,內(nèi)有3000萬顆晶體管,具備

在當時屬于先進技術(shù)的幾何變形、圖像剪切功能、光照效果,性能優(yōu)

于Nvidia同代的Geforce256o自此,PC端獨立顯卡市場形成Radeon

系列與Geforce系列對峙的局面。2002年,ATI發(fā)布R300(即

Radeon9700)支持DirectX9.0、4頂點著色器、8像素流水線、256

位DDR內(nèi)存總線;2003年發(fā)布Radeon9800pro,性能均超過Nvidia

的GeforceFX5900oATI逐步站穩(wěn)腳跟。隨后NVIDIA的

GeforceFX6800又在性能反超Radeon9800o在此之后,ATI真正與

Nvidia在GPU市場平分秋色,二者產(chǎn)品性能相互追趕。

NVIDIA遇強力對手,市場份額跌破50%;ATI獲微軟XBOX2主機

圖形芯片訂單。在ATIRadeon9700和XBOX2訂單的幫助下,ATI

市場份額最高達到55%,而NVIDIA市場份額跌破50%,為NVIDIA

迄今為止最低點。微軟和Nvidia共同研發(fā)微軟第一代XBOX的圖形

處理器芯片,而2003年ATI獲得第二代XBOX的圖形處理器訂單,

股價因此由上漲1美元到13.2美元,并在2004年順利完成該訂單

顯卡的開發(fā)工作,市場份額有所上漲。

自2006年起,英偉達GPU架構(gòu)保持約每兩年更新一次的節(jié)奏,代

際之間產(chǎn)品性能提升顯著,性能和市場份額均領(lǐng)先AMD。2006年,

英偉達推出了CUDA編程軟件,使GPU成為通用并行數(shù)據(jù)處理加速

器,并逐步構(gòu)筑起CUDA生態(tài)。CUDA讓顯卡可以用于通用并行計

算和其他非圖形計算,使得GPU能夠承擔和CPU一樣的計算任務。

程序員可以通過CUDA直接對GPU進行編程。為NVIDIA的數(shù)據(jù)中

心業(yè)務高速擴張打下基礎(chǔ)。CUDA包括硬件平臺和軟件棧(軟件集合)

兩層含義,加上第三方應用及工具的擴展,形成從開發(fā)到應用的

CUDA生態(tài)。CUDA生態(tài)也成為NVIDIA的生態(tài)護城河。

架構(gòu)創(chuàng)新升級和新興領(lǐng)域前瞻探索是領(lǐng)跑GPU行業(yè)的關(guān)鍵。NVIDIA

堅持每兩到二年完成一次架構(gòu)迭代,持續(xù)保持領(lǐng)先的圖顯和計算性能:

2001年發(fā)布Kelvin,2003年發(fā)布Rankine,2004年發(fā)布Curie,2006

年發(fā)布Tesla,2009年發(fā)布Fermi,2012年發(fā)布Kepler,2014年發(fā)

布Maxwell,2016年發(fā)布Pascal,2017年發(fā)布Volta,2018年發(fā)布

Turing,2020年Ampere,2022年先后發(fā)布Hopper和Adalovelace。

架構(gòu)創(chuàng)新迭代高效,架構(gòu)之間性能提升顯著。而AMD(ATI)也曾憑

借Radeon9700、Radeon9800強勢崛起,近些年的RDNA架構(gòu)也

令其市場份額快速提高。

NVIDIA前瞻性布局新興領(lǐng)域數(shù)據(jù)中心、自動駕駛等領(lǐng)域,推動業(yè)績

爆發(fā)增長。其自2006年開始構(gòu)筑CUDA生態(tài)并推出Tesla通用計算

GPU架構(gòu),從以硬件為核心的企業(yè)變成以軟硬件平臺為核心的科技

公司,前瞻性的布局使其在計算生態(tài)上構(gòu)筑了極深的壁壘,占據(jù)了絕

大部分市場。近年公司開始布局元宇宙等領(lǐng)域,持續(xù)探索新興領(lǐng)域以

保持GPU行業(yè)的龍頭地位。

未來競爭:NVIDIA維持游戲和數(shù)據(jù)中心領(lǐng)先地位,同時瞄準元宇宙、

智能汽車市場

NVIDIA各主要業(yè)務線持續(xù)發(fā)力,以技術(shù)創(chuàng)新技術(shù)保持行業(yè)領(lǐng)先,開

啟元宇宙布局。游戲:NVIDIA新發(fā)布AdaLovelace架構(gòu)的4000系

列GPU有極強的光追性能,比前代提高1-3倍,性能顯著領(lǐng)先AMD,

但成本也顯著提高。汽車:在2022GTC大會上發(fā)布的

NVIDIADRIVEThorSoC系統(tǒng),算力達至ij2000TOPS,公司計劃在

2025年裝車。Thor可以將智能汽車的所有功能集成在單個AI計算

器上,將顯著降低成本,對智能座艙領(lǐng)域?qū)⑹穷嵏残杂绊?。元宇宙?/p>

Omniverse是為元宇宙打造的軟硬件方案,彰顯其在元宇宙領(lǐng)域提前

布局的野心。使用者可以在Omniverse中創(chuàng)建虛擬世界,而他們所

創(chuàng)建的虛擬物體也會成為NVIDIA元宇宙生態(tài)的重要組成部分。與

NVIDIA的GPU、CPU等硬件基礎(chǔ)一起,共同構(gòu)成NVIDIA元宇宙

的一站式云服務體系。

云端芯片市場格局未定,NVIDIA實行“GPU十CPU十DPU”路線,布局

云端異構(gòu)AI芯片。2021年的GTC大會NVIDIA推出面向數(shù)據(jù)中心

AI和高性能計算的自研的采用ArmNeoverse架構(gòu)的Grace芯片。并

取得ARM授權(quán)協(xié)議,可開發(fā)ARM架構(gòu)CPU芯片。2019年,NVIDIA

以70億美元收購Mellanox,2020年推出BlueField?2DPU,成功布

局DPU業(yè)務。

未來競爭:AMD結(jié)合自身CPU優(yōu)勢全方位布局AI芯片

2022年6月19日,AMD講述其未來發(fā)展戰(zhàn)略,概述為技術(shù)和產(chǎn)品

組合更新、擴大數(shù)據(jù)中心解決方案產(chǎn)品組合、加速打造無所不在的

AI領(lǐng)域領(lǐng)導地位、擴大PC領(lǐng)先、推動圖形解決方案發(fā)展勢頭。AMD

結(jié)合CPU優(yōu)勢,GPU、FPGA、APU業(yè)務多點布局搶占Al芯片行

業(yè)先機。AMD希望未來將更多AI功能引入CPU的硬件層面中,如

AVX-512VNNI指令集。AMD認為,在CPU中運行大部分推理很重

要并會是未來趨勢。AMD預計明年發(fā)布全球第一個數(shù)據(jù)中心

APU——lnstinctMI300(此前該系列為GPU加速卡),面向訓練領(lǐng)

域,結(jié)合使用Zen4架構(gòu)的CPU和CDNA3架構(gòu)的GPU。APU是將

處理器和獨顯集成到一個晶片上,實現(xiàn)GPU和CPU的融合。AMD

收購Xilinx(賽靈思)以更好地開展FPGA業(yè)務,補全FPGA領(lǐng)域的

短板,擴大自身AI芯片市場。

3、國內(nèi)市場:GPU細分市場前景廣闊,國內(nèi)廠商大有可為

3.1>GPU市場空間廣闊,國內(nèi)企業(yè)規(guī)模逐步起量

2022年全球GPU市場規(guī)模達到448.3億美元,國內(nèi)外市場空間正高

速增長,年復合增長率達到32.8%oVerifiedMarketResearch數(shù)據(jù)顯

示,2020年,全球GPU市場規(guī)模為254.1億美元,且該機構(gòu)預計

2028年市場規(guī)模將達到2465.1億美元,對應年復合增長率達32.8%。

國際獨立GPU市場由Nvidia、AMD八二分成,國內(nèi)市場中國企業(yè)

體量快速增長。國際市場上,英偉達、AMD瓜分市場,

JonPeddieResearch數(shù)據(jù)顯示2022Q1英偉達占據(jù)79%市場份額,

AMD占據(jù)21%。英偉達在獨立GPU領(lǐng)域一枝獨秀,AMD在集成

GPU領(lǐng)域可與英偉達競爭。國內(nèi)GPU龍頭企業(yè)景嘉微2022年上半

年營業(yè)收入5.44億人民幣,2021年營業(yè)收入10.93億人民幣;2022

年上半年海光信息營業(yè)收入為25.3億元,而英偉達2022Q2營收為

67億美元,2021年NVIDIA中國區(qū)的營收約為71億美元。相比之

下,國產(chǎn)廠商相對規(guī)模暫時較小,未來成長空間廣闊。

GPU應用場景不斷擴大拉動GPU市場空間迅猛增長,根據(jù)

VerifiedMarketResearch預測,2027年中國GPU市場規(guī)模將會增長

至345.57億美元。GPU市場主要應用場景可概括為:AI&數(shù)據(jù)中心、

智能汽車、游戲。AI&數(shù)據(jù)中心:新一輪AI對算力需求遠超以往:

ChatGPT類語言大模型底層是2017年出現(xiàn)的Transformer架構(gòu),該

架構(gòu)相比傳統(tǒng)的CNN/RNN為基礎(chǔ)的AI模型,參數(shù)量達到數(shù)千億,

對算力消耗巨大,對算力硬件有大量需求。隨著對商業(yè)數(shù)據(jù)和大數(shù)據(jù)

處理要求算力的不斷提高,GPU的通用計算能力正在越來越廣泛地

被應用與數(shù)據(jù)中心和國家超算中心的建設(shè)。智能汽車:智能汽車方興

未艾,自動駕駛和智慧座艙是智能汽車發(fā)展的主要方向,均需大量使

用GPU。游戲:游戲業(yè)務是GPU應用的傳統(tǒng)領(lǐng)域,對游戲畫面進行

3D渲染,英偉達的游戲業(yè)務穩(wěn)中有進。

3.2、Al:ChatGPT等AI大模型加速對大算力的需求

ChatGPT模型引發(fā)市場關(guān)注,對話類AI效果超大眾預期,大模型需

要更大的算力。2022年11月人工智能實驗室OpenAI推出了一款

AI對話系統(tǒng)一ChatGPT,ChatGPT模型從GPT-3.5系列中的一個模

型微調(diào)而成,并在AzureAl超級計算基礎(chǔ)設(shè)施上進行訓練,能夠進行

有邏輯的對話、撰寫代碼、撰寫劇本、糾正錯誤、拒絕不正當?shù)恼埱?/p>

等,效果超越大眾預期。這標志著對話類人工智能可以在大范圍、細

節(jié)問題上給出較合理準確的答案,并根據(jù)上下文形成一定像人類一樣

有邏輯且有創(chuàng)造力的回答。ChatGPT的優(yōu)化主要來自模型的增大,

以及因此帶來的算力增加。GPT、GPT-2和GPT-3(當前開放的版

本為GPT-3.5)的參數(shù)量從1.17億增加到1750億,預訓練數(shù)據(jù)量

從5GB增加到45TB,其中GPT-3訓練單次的成本就高達460萬美

yeo

依據(jù)部署位置劃分,AI芯片可以細分為終端芯片和云端芯片,云端

芯片市場空間越為終端芯片的2-3倍。云端芯片:云端芯片應用于云

端服務器,可以進一步細分為推理芯片和訓練芯片。根據(jù)甲子光年數(shù)

據(jù),2018年中國云端芯片市場約46.1億元,該機構(gòu)預計2023年增

長至384.6億元。終端芯片:應用于嵌入式、移動終端、智能制造、

智能家居等領(lǐng)域的AI芯片,終端芯片需要低功耗和更高的能效比,

但是對算力的需求也相對較低,主要應用與A

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論