2022年半導(dǎo)體行業(yè)專題研究_第1頁
2022年半導(dǎo)體行業(yè)專題研究_第2頁
2022年半導(dǎo)體行業(yè)專題研究_第3頁
2022年半導(dǎo)體行業(yè)專題研究_第4頁
2022年半導(dǎo)體行業(yè)專題研究_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

2022年半導(dǎo)體行業(yè)專題研究報告緣起市場需求:AI、高性能計算、圖形渲染等推動GPU等并行計算芯片需求需求場景:AI訓(xùn)練&推理、復(fù)雜科學(xué)計算、大規(guī)模圖形渲染等,持續(xù)推動并行計算芯片需求。由于GPU(GraphicsProcessingUni,圖形處理器)是由成百上千個陣列排布的運算單元ALU組成,使得GPU更適用于大規(guī)模并發(fā)運算,其在圖形處理、計算加速等領(lǐng)域有著廣泛的運用。2)由于GPU加速器強大的并行處理能力,超算中心工作人員可以更好地設(shè)計深度網(wǎng)絡(luò)結(jié)構(gòu),使得其在超算領(lǐng)域&數(shù)據(jù)中心領(lǐng)域更具經(jīng)濟效益,導(dǎo)致GPU在AI訓(xùn)練&推理、科學(xué)計算等領(lǐng)域有著廣泛的應(yīng)用。GPU用于AI訓(xùn)練&AI推理領(lǐng)域。在典型AI模型卷積網(wǎng)絡(luò)中,大量數(shù)據(jù)以圖片形式導(dǎo)入,在進行運算過程中,數(shù)據(jù)均為矩陣形式,而矩陣運算通常適合并行,因此AI算法的特性,使得GPU的運算速度明顯大于CPU,使得GPU得以大量應(yīng)用在AI的訓(xùn)練與推理當(dāng)中。GPU可用于復(fù)雜科學(xué)計算中??茖W(xué)計算將物理、化學(xué)、生物、航空航天等領(lǐng)域的問題轉(zhuǎn)化為數(shù)學(xué)模型,通過計算和求解模型用于實際產(chǎn)業(yè)。從計算數(shù)據(jù)來看,由于科學(xué)計算中所用數(shù)據(jù)多數(shù)以矩陣為形式,同時由于科學(xué)計算對誤差有強制要求,因此在運算中需要在并行運算基礎(chǔ)上保證一定的精度。而現(xiàn)代GPU在并行&矩陣運算的基礎(chǔ)上,已經(jīng)能夠滿足科學(xué)計算所需的精度要求。近些年來,隨著人工智能軟件算法的發(fā)展,復(fù)雜科學(xué)計算的進步,以及圖形渲染功能的增加,帶動底層芯片并行計算能力需求的快速提升。以全球AI芯片領(lǐng)軍者英偉達的發(fā)展?fàn)顩r來看,公司AI芯片算力由2012年的4Tops提升至2021年的1248Tops,9年時間提升了約315倍。AI框架、并行計算框架等引入&豐富,不斷推動針對并行計算芯片軟件開發(fā)門檻降低。1)從人工智能軟件算法框架的發(fā)展歷史來看,2015年谷歌宣布開源TensorFlow,2019年P(guān)FN宣布將研究方向由Chainer轉(zhuǎn)向PyTorch。目前AI框架形成了TensorFlow和PyTorch雙寡頭壟斷的競爭格局。其中,谷歌開源TensorFlow項目,在很大程度上降低了人工智能的開發(fā)門檻和難度。2)TensorFlow主要用于處理機器學(xué)習(xí)中的計算機視覺、推薦系統(tǒng)和自然語言處理(NLP)的模型訓(xùn)練和推理,涉及模型隱藏層相對較多,模型量相對較大,基本上均需要CUDA的加速處理。隨著TensorFlow的開源,涉及到的開發(fā)開發(fā)者快速增加,CUDA軟件下載量也呈現(xiàn)陡增趨勢。據(jù)英偉達在2021GTC大會上宣布,截至2020年底,CUDA累計下載量超過2000萬次,其中2020年下載量超過600萬次。涉及到的開發(fā)人員約230萬人(2020年新增超過60萬人)。算法豐富、算法復(fù)雜度提升等,亦成為市場需求的重要驅(qū)動力。1)如前所述,過去9年,AI芯片的算力大幅提升,也帶動AI算法模型參數(shù)的大幅增加。從Alexnet、ResNet開始,到BERT網(wǎng)絡(luò)模型,參數(shù)量已超過3億規(guī)模,隨后GPT-3模型超過百億,SwitchTransformer的問世還一舉突破萬億規(guī)模。2)英偉達2020年發(fā)布的Megatron-LM模型,參數(shù)量達到了83億,相比于在2018年以參數(shù)量震驚世界的BERT模型又提升了5倍。模型體積幾何倍數(shù)的增長也帶了更多數(shù)據(jù)中心側(cè)的需求,只有依靠上千塊GPU并行運算才能在以天為單位的訓(xùn)練時長中完成對Transformer模型的訓(xùn)練。2021年,全球數(shù)據(jù)中心邏輯計算芯片市場規(guī)模高達436億美元。1)在過去數(shù)年,全球數(shù)據(jù)中心芯片市場保持高速增長,由2012的122億美元增長至2021的436億美元,符合增長率約15%。2)從市占率來看,早期英特爾和Altera幾乎壟斷數(shù)據(jù)中心約市場份額,伴隨著AMD和英偉達產(chǎn)品矩陣的增加,AMD和英偉達在數(shù)據(jù)中心領(lǐng)域中的的市占率不斷提升。截至2022Q2,英特爾全球數(shù)據(jù)中心芯片市占率約41.5%、英偉達市占率為34.0%、AMD市占率為24.5%。英偉達歷史借鑒:產(chǎn)品技術(shù)、軟件生態(tài)等構(gòu)筑GPU核心壁壘近期,英偉達最新兩則公告,導(dǎo)致市場對國產(chǎn)GPU的關(guān)注度提升。1)8月31日,英偉達發(fā)布公告稱:(a)8月26日,美國政府對英偉達未來出口到中國(包括香港)和俄羅斯的A100和即將推出的H100芯片實施了新的許可證要求,該許可立即生效。新的許可證要求將解決涉及的產(chǎn)品可能用于或轉(zhuǎn)移到中國和俄羅斯的“軍事最終用途”或“軍事最終用戶”的風(fēng)險。(b)該許可涉及到的芯片主要包括:英偉達A100和即將出貨的H100兩款芯片、基于A100/H100打造的DGX產(chǎn)品、以及未來實現(xiàn)峰值性能和芯片對芯片I/O性能均等于或大于大致相當(dāng)于A100的閾值的任何NVIDIA芯片。目前來看,美國政府對中國以及俄羅斯出口限制的主要是針對數(shù)據(jù)中心的高端獨立GPU芯片及相關(guān)產(chǎn)品。(c)公司于2022年8月24日提供的FY2023Q3展望(對應(yīng)CY2022年8月-CY2022年10月),其中有對中國大約4億美元的潛在銷售可能會受到新的許可證要求的限制。2)9月1日,公司發(fā)布公告稱,公司已美國政府新的授權(quán)審批,具體內(nèi)容包括:(a)美國政府已批準(zhǔn)英偉達繼續(xù)開發(fā)H100芯片所需要的出口、在出口和國內(nèi)轉(zhuǎn)移。(b)允許英偉達在2023年3月1日前,為A100的美國客戶提供所需的出口支持。目前,公司A100的美國客戶包括戴爾、思科等服務(wù)器設(shè)備廠商,以及終端客戶亞馬遜、谷歌等。(c)美國政府授權(quán)A100和H100,在2023年9月1日之前通過英偉達在中國香港的工廠履行訂單和物流。(d)美國政府放寬許可授權(quán)的主要原因是,A100的部分開發(fā)工作是依賴中國工程師&中國運營部門進行。若A100無法完成開發(fā),對英偉達的業(yè)績影響相對較大。英偉達圖形渲染領(lǐng)域:保持穩(wěn)定、高頻技術(shù)迭代,不斷實現(xiàn)技術(shù)領(lǐng)先,例如RTX&DLSS等技術(shù),并和開發(fā)者、應(yīng)用廠商構(gòu)成穩(wěn)固的合作同盟。1)2020年安培架構(gòu)產(chǎn)品中,RTX技術(shù)升級到第二代,并逐步向第三代TensorCore技術(shù)推進,帶動RTX系列顯卡圖像運算能力的全面提升,而DLSS、Reflex等能力帶動游戲體驗的提升,DLSS2.0將FPS提升近30,Reflex降低50%的游戲延遲。對于超大型以及精品游戲的運行,大幅提升體驗?zāi)芰?。對于大?A游戲,在高畫質(zhì)條件下需滿足45-90FPS,電競場景下需要120-140FPS。在GTX的傳統(tǒng)產(chǎn)品線中,開啟RT(光線追蹤)之后,游戲幀數(shù)從60掉至不足30幀。但在RTX產(chǎn)品中,可提升至90FPS以上。2)鑒于英偉達GPU在軟件領(lǐng)域的優(yōu)勢顯著,公司PC用獨顯GPUASP亦顯著高于競爭對手AMD。2016年,英偉達PC用獨顯GPUASP為81.3美元/個,AMD對應(yīng)ASP為31.0美元/個。2021年,英偉達PC用獨顯GPUASP為163.2美元/個,AMD對應(yīng)ASP為86.6美元/個。英偉達數(shù)據(jù)中心領(lǐng)域:借助CUDA實現(xiàn)GPU從圖形顯示到通用計算的跨越,以及產(chǎn)業(yè)生態(tài)壁壘的構(gòu)建,并借助DSA、NVlink等架構(gòu)創(chuàng)新、優(yōu)化等實現(xiàn)持續(xù)性能領(lǐng)先。1)沿著技術(shù)層面的核心差異,我們按照訓(xùn)練&推理、邊緣&數(shù)據(jù)中心兩個維度,梳理目前全球主要的AI芯片參與者,整體而言,相較于全球其他主要競爭對手,英偉達在產(chǎn)品完整度、存量市場份額等層面實現(xiàn)領(lǐng)先,同時我們判斷這種領(lǐng)先優(yōu)勢長周期亦將大概率維持。2)從公司的軟件生態(tài)布局來看,英偉達構(gòu)建了從底層到上游細(xì)分領(lǐng)域的應(yīng)用開發(fā)軟件,可大幅降低開發(fā)者的開發(fā)周期。產(chǎn)品豐富度&技術(shù)競爭力:英偉達系統(tǒng)級產(chǎn)品布局、在訓(xùn)練環(huán)節(jié)的突出表現(xiàn)&領(lǐng)先優(yōu)勢已基本成為市場的共識,而在推理領(lǐng)域,伴隨新一代安培架構(gòu)、Hopper架構(gòu)的升級,以及由此實現(xiàn)的訓(xùn)練、推理的統(tǒng)一,以及對稀疏矩陣運算問題的良好支持,目前在推理方面,英偉達最新的A100芯片的Int8Tops已經(jīng)達到1248,較上一代提升超過5X。同時在訓(xùn)練環(huán)節(jié),根據(jù)Mlperf的評測,在圖像識別、對話式AI、推薦系統(tǒng)等多個模型的對比評測中,英偉達芯片訓(xùn)練性能全面領(lǐng)先華為、谷歌等主要競爭對手?;诩夹g(shù)層面的全面分析,我們判斷英偉達有望在企業(yè)對外服務(wù)(訓(xùn)練、推理)、企業(yè)內(nèi)部服務(wù)(訓(xùn)練)環(huán)節(jié)保持持續(xù)領(lǐng)先,但在企業(yè)內(nèi)部服務(wù)(推理)仍面臨延遲、功耗等層面的明顯短板。而我們看到,英偉達在數(shù)據(jù)中心市場的產(chǎn)品迭代節(jié)奏繼續(xù)延續(xù)既有的習(xí)慣,即繼續(xù)保持對芯片性能的狂熱追逐,以及每兩年升級一次產(chǎn)品(CPU、DPU、GPU)的頻率。英偉達基于CUDA構(gòu)建了豐富的軟件生態(tài),顯著提升GPU的易用性。從軟件技術(shù)分類來看,公司在軟件領(lǐng)域中的產(chǎn)品布局主要分為:基礎(chǔ)架構(gòu)、游戲與娛樂、應(yīng)用工具、應(yīng)用框架四大部分。具體內(nèi)容如下:(a)在基礎(chǔ)架構(gòu)方面,公司軟件產(chǎn)品主要圍繞AI&通用能力布局。其中AI主要包括邊緣AI、AI垂直領(lǐng)域解決方案、AI推理等;通用領(lǐng)域則圍繞IO傳輸、vGPU等。(b)在游戲娛樂方面,公司的產(chǎn)品布局主要包括Geforce云游戲平臺、直播領(lǐng)域的BroadcastApp和元宇宙領(lǐng)域中的OmniverseMachinima;(c)在應(yīng)用工具方面,公司可面向不同的應(yīng)用場景(AI、數(shù)據(jù)分析、元宇宙等領(lǐng)域),提供不同的開發(fā)工具。如:在AI領(lǐng)域,可提供加速AI部署與工作流程的NGC產(chǎn)品;在元宇宙領(lǐng)域,可提供3D虛擬協(xié)作的Omniverse產(chǎn)品。(d)在具體應(yīng)用框架方面,主要憑借公司AI與數(shù)據(jù)分析能力,在自動駕駛、視頻分析、推薦系統(tǒng)等各垂直領(lǐng)域提供具體應(yīng)用框架,幫助提高各行業(yè)運營效率。小結(jié):伴隨AI、高性能計算、大規(guī)模圖形渲染等應(yīng)用場景的不斷拓展和豐富,市場對大算力并行計算芯片的需求快速增長,截止目前,全球數(shù)據(jù)中心領(lǐng)域邏輯芯片市場規(guī)模已經(jīng)超過400億美元。同時近期市場對國產(chǎn)GPU領(lǐng)域的關(guān)注度提升?;谟ミ_的歷史復(fù)盤,可以看出公司在圖形渲染&數(shù)據(jù)中心領(lǐng)域保持較高的市占率,并實現(xiàn)產(chǎn)業(yè)引領(lǐng)。我們認(rèn)為核心原因在于:借助持續(xù)、高頻迭代保持產(chǎn)品技術(shù)行業(yè)領(lǐng)先,并借助CUDA等實現(xiàn)軟件生態(tài)構(gòu)建,不斷提升產(chǎn)品易用性等。GPU作為大算力并行計算芯片領(lǐng)域最為可行的承載者,在本篇報告中,我們將從全球市場出發(fā),就GPU產(chǎn)業(yè)本身的產(chǎn)品特性、技術(shù)路線、市場空間,以及國內(nèi)市場現(xiàn)狀、演進路徑、競爭格局等展開系統(tǒng)的分析和討論,力圖針對國內(nèi)GPU市場構(gòu)建一個完整的產(chǎn)業(yè)&投資藍圖。全球GPU市場:并行計算理想載體芯片,數(shù)據(jù)中心為中期需求增長主要場景GPU:通用并行計算理想載體芯片,從圖形處理向AI、高性能計算等領(lǐng)域擴展GPU定義:圖形處理器,但承載功能已在早期定義上明顯泛化。1)發(fā)展早期,更多稱為圖形處理器(GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、游戲機和一些移動設(shè)備(如平板電腦、智能手機等)上做圖像和圖形相關(guān)運算工作的微處理器。2)由于計算機只能識別二進制數(shù)字,因此在進行圖形運算時,要把圖片轉(zhuǎn)換成計算機能夠理解的二級制數(shù)組(見下圖圖示),因此GPU在進行運算時,所針對的都是矩陣數(shù)據(jù),因此GPU的大部分計算是并行的。這意味著GPU更加適合并行計算與矩陣運算。GPU應(yīng)用場景:由早期的圖形渲染,逐步拓展至高性能運算、科學(xué)計算等領(lǐng)域,GPU是通用并行計算的理想載體。1)由于計算機以及圖形運算的特性,GPU所進行的運算多數(shù)為矩陣運算、并行運算,這些特征使得GPU更加適合當(dāng)前以AI為代表的高性能計算、科學(xué)計算等領(lǐng)域,GPU的使用范圍也由早期的圖形渲染領(lǐng)域,逐步拓展至高性能運算&科學(xué)運算領(lǐng)域。2)與其他邏輯計算芯片相比,GPU在通用性、計算速度、規(guī)?;渴鸾?jīng)濟性等核心指標(biāo)上面,能夠做到較好的平衡,因此在目前AI、復(fù)雜科學(xué)計算等并行計算領(lǐng)域,逐步形成了GPU主導(dǎo),F(xiàn)PGA、ASIC、CPU為輔的穩(wěn)定局面。CPU:適合處理復(fù)雜的串行計算和邏輯控制,并行運算性能顯著弱于GPU。由于功能與設(shè)計架構(gòu)的不同,CPU與GPU的計算能力也存在差異,CPU的架構(gòu)使得其適合流水線式的串行計算與復(fù)雜計算,而GPU的架構(gòu)使得其適合運算邏輯簡單但可以同步進行的并行計算。因此在參數(shù)上,我們會看到CPU具有更高的頻率與緩存,而GPU具備更多的核心。FPGA:靈活性突出,但易用性、計算速度、經(jīng)濟性較GPU欠佳。FPGA是一種偏向于硬件的可編程芯片,F(xiàn)PGA中使用了大量邏輯門(數(shù)字電路中的基礎(chǔ)部件,通過電壓高低以及組合,將輸入的命令轉(zhuǎn)化為0或1),建立真值表(輸入不同代碼,輸出不同結(jié)果的查詢表),通過可編程邏輯布線(可以理解為電路開關(guān),編程即是對開關(guān)調(diào)整,實現(xiàn)門之間的電路組合)來實現(xiàn)算法。由于直接對硬件編程,相較于GPU的平均計算效率與可編程性更高,但由于需要直接對硬件進行編程以及較高的成本(為滿足編程要求通常晶體管冗余設(shè)計),通用性、大規(guī)模部署成本以及最高計算能力不如GPU。ASIC:特定場景性能最優(yōu),但通用性不足。ASIC芯片是針對某一特定場景所研制的專用芯片,優(yōu)勢在于運算效率極高、部署成本較低。但對于實際應(yīng)用而言,如果算法出現(xiàn)迭代升級或數(shù)據(jù)結(jié)構(gòu)發(fā)生改變,ASIC的效率將會大幅下降,因此相較于GPU而言,ASIC更多用于挖礦、音視頻解碼等專用場景。因此ASIC的平均算力會更強,但在通用場景下以及最高運算能力上,GPU優(yōu)勢更大。小結(jié):整體而言,正是基于GPU本身的優(yōu)異特性,以及英偉達等企業(yè)在芯片架構(gòu)、軟件生態(tài)等層面的不斷努力,疊加AI、高性能計算、大規(guī)模圖形渲染等應(yīng)用場景的快速崛起,GPU逐步成為全球大算力并行計算領(lǐng)域的主導(dǎo)者。而在產(chǎn)品端,我們也總結(jié)發(fā)現(xiàn),GPU廠商亦結(jié)合下游的應(yīng)用場景,在一個大的體系結(jié)構(gòu)下,針對計算單元、緩存、總線帶寬等技術(shù)點的優(yōu)化和組合。在下文內(nèi)容中,我們主要討論當(dāng)下最主流的應(yīng)用場景&產(chǎn)品:用于游戲等場景中圖形渲染的顯卡,以及用于數(shù)據(jù)中心AI、高性能計算等場景的GPGPU(通用計算GPU)。圖形渲染:游戲為主,中期有望保持10%~15%平穩(wěn)增長目前在圖形渲染領(lǐng)域,游戲畫面渲染為主要應(yīng)用場景,同時亦包括圖形工作站等場景,獨立顯卡為主要硬件載體。IDC數(shù)據(jù)顯示,目前全球獨立顯卡出貨量,近5年穩(wěn)定在8000-9300萬部。按獨立顯卡的類型劃分,其中臺式機用獨立顯卡比例約40%-53%,筆記本&工作站獨立顯卡比例約47%-60%。按照品牌商來看,英偉達獨立顯卡近5年市占率一直穩(wěn)步提升,市占率由2018年的58.8%提升至2021年的74.3%,AMD市占率由2018年的31%降低至2021年的19%。市場規(guī)模判斷:預(yù)計2025、2030年將分別達到278、568億美元。2021年,英偉達游戲顯卡業(yè)務(wù)實現(xiàn)銷售收入105億美元,專業(yè)視覺收入(圖形工作站)21億美元。我們假設(shè)英偉達在全球游戲顯卡領(lǐng)域收入占比80%,專業(yè)視覺領(lǐng)域收入占比80%,則2021年,在圖形渲染(含游戲、專業(yè)視覺等)領(lǐng)域,全球GPU市場規(guī)模為158億美元。同時為了測算該領(lǐng)域中期市場規(guī)模,我們作出如下簡化假設(shè):1)假設(shè)圖形渲染領(lǐng)域,中期應(yīng)用場景仍主要由游戲畫面渲染、專業(yè)視覺構(gòu)成,其他長尾場景忽略;2)顯卡ASP,參考英偉達產(chǎn)品價格走勢,考慮到產(chǎn)品性能、制造成本等因素,預(yù)計顯卡ASP年復(fù)合增速在10%~15%之間,取中位值12.5%;3)游戲用戶,期間,全球高端游戲玩家出現(xiàn)大幅增長(預(yù)計增幅1億人),中期預(yù)計保持平穩(wěn)增長,每年增速0~5%,取中位值2.5%;4)假設(shè)專業(yè)視覺的市場規(guī)模占游戲比例維持在20%左右。綜合上述假設(shè),中性情形下,我們預(yù)計全球GPU(圖形渲染)在2025、2030年的市場規(guī)模有望分別達到278、568億美元。數(shù)據(jù)中心:AI&高性能計算等,預(yù)計中期保持25%以上年均復(fù)合增速市場格局:英偉達GPU在AI訓(xùn)練、高性能計算領(lǐng)域占據(jù)主導(dǎo)地位。作為圖形渲染之后另一主要應(yīng)用場景,目前客戶主要通過在數(shù)據(jù)中心部署英偉達、AMD的GPU芯片,實現(xiàn)AI訓(xùn)練、高性能計算等,同時輔以自研加速卡等,服務(wù)于特定場景的AI訓(xùn)練、推理等。1)根據(jù)LiftrInsights數(shù)據(jù)顯示,2021Q1,在全球TOP云廠商數(shù)據(jù)中心AI加速芯片市場,英偉達份額占比為78%,近年來基本穩(wěn)定在80%附近,市場領(lǐng)先地位穩(wěn)固。同時根據(jù)Lifter2019年5月的數(shù)據(jù)顯示,全球四大云計算平臺阿里云、AWS、Azure和谷歌云(GCP)中,英偉達TESLA系列GPU產(chǎn)品的市場占有率大幅領(lǐng)先。其中,阿里云采用英偉達TESLA系列GPU比例為81%,AWS、Azure和GCP使用比例分別為89%、100%和100%,市場份額絕對領(lǐng)先。2)另外據(jù)Top500.Org數(shù)據(jù)顯示,英偉達GPU產(chǎn)品在全球Top500超算中心的滲透率逐年提高,由2013H1的72.2%提升至2021H2的90.3%,幾乎處于壟斷地位。市場規(guī)模:我們測算全球數(shù)據(jù)中心GPU芯片市場規(guī)模,2021年約為100億美元左右。FY2022(對應(yīng)CY2021)英偉達數(shù)據(jù)中心營收約106億美元,其中Mellanox營收約25.7億美元,則英偉達數(shù)據(jù)中心GPU相關(guān)產(chǎn)品營收約80.3億美元。在市場競爭段落中提到,英偉達在數(shù)據(jù)中心領(lǐng)域中的市占率約80%,依次測算,2021年,全球數(shù)據(jù)中心GPU芯片市場規(guī)模約為100億美元左右。GPU數(shù)量:我們測算2021年,全球數(shù)據(jù)中心GPU芯片市場出貨量約200萬個。依據(jù)英偉達在數(shù)據(jù)中心領(lǐng)域中GPU產(chǎn)品的價格測算,假設(shè)對應(yīng)產(chǎn)品的ASP約5000美元/個,對應(yīng)FY2022年(對應(yīng)CY2021年)英偉達GPU產(chǎn)品出貨量約160萬個。在市場競爭段落中提到,英偉達在數(shù)據(jù)中心領(lǐng)域中的市占率約80%,依次計算,全球數(shù)據(jù)中心GPU市場出貨量約200萬個。數(shù)據(jù)中心GPU市場規(guī)模:預(yù)計2025、2030年將分別達到245、828億美元。結(jié)合既有的認(rèn)知和判斷,我們做出如下簡化假設(shè):1)假設(shè)中期全球數(shù)據(jù)中心大算力邏輯芯片市場增速和過去相似(2014~2021年),年市場規(guī)模復(fù)合增速維持在15%~20%之間,取中位值17.5%;2)數(shù)據(jù)中心領(lǐng)域,并行計算需求占比持續(xù)提升,預(yù)計每年相對份額提升3%左右?;谏鲜龊喕僭O(shè),我們中性預(yù)計,全球數(shù)據(jù)中心GPU市場規(guī)模將在2025、2030年分別達到245、828億美元,同時若中期AI技術(shù)進步、高性能計算需求超出我們的預(yù)期,則最終市場規(guī)模將顯著高于我們當(dāng)前的預(yù)測。國內(nèi)GPU市場:中期潛在空間可觀,本土廠商開始規(guī)模崛起&產(chǎn)品落地國內(nèi)市場現(xiàn)狀:和全球市場同步,預(yù)計2030年規(guī)模將突破300億美元圖形渲染:當(dāng)前國內(nèi)市場規(guī)模約27億美元,預(yù)計2025、2030年將分別達到47、97億美元。由于缺乏直接的統(tǒng)計數(shù)據(jù),我們做出如下簡化假設(shè):1)IDC數(shù)據(jù)顯示,2016-2021年,全球PC出貨量為2.6-3.5億臺,同期國內(nèi)PC銷量占全球銷量比重約在17%左右,我們假設(shè)在圖形渲染領(lǐng)域,國內(nèi)GPU出貨量占比亦和PC表現(xiàn)相對一致,并保持和全球市場相似的增速,以及應(yīng)用場景分布等。參考我們在上文中的測算,我們測算、預(yù)測2021年、2025年、2030年,國內(nèi)GPU(圖形渲染)的市場規(guī)模約為27、47、97億美元。當(dāng)然,若考慮到國內(nèi)龐大的游戲用戶數(shù),以及專業(yè)視覺等領(lǐng)域的旺盛需求等,最終的實際數(shù)據(jù)料將大幅優(yōu)于我們當(dāng)前的測算&預(yù)測。數(shù)據(jù)中心:我們測算國內(nèi)數(shù)據(jù)中心GPU市場約占全球20%左右比重,對應(yīng)2021年整體出貨量約40萬個,對應(yīng)市場規(guī)模約20億美元。1)從互聯(lián)網(wǎng)云廠商Capex支出來看,阿里巴巴+騰訊+百度三家互聯(lián)網(wǎng)廠商的Capex占全球主要互聯(lián)網(wǎng)云商場(微軟、亞馬遜(含租賃)、谷歌、Meta)總Capex比例的7%-13%。若扣除亞馬遜在租賃領(lǐng)域中的Capex支出,我們預(yù)計中國三家互聯(lián)網(wǎng)廠商的Capex占比將超過10%。2)Top500.Org網(wǎng)站顯示,截至2021年11月,全球Top500超算中心,中國擁有173個超算中心,為全世界最多的超算中心國家,占有率約34.6%。3)綜合考慮中國互聯(lián)網(wǎng)云廠商Capex占比約10%,Top500超級計算機個數(shù)市占率約34.6%,我們認(rèn)為中國數(shù)據(jù)中心GPU需求量約占全球數(shù)據(jù)中心總GPU需求量的20%左右。4)如前面章節(jié)測算,我們判斷2021年全球數(shù)據(jù)中心GPU加速器市場出貨量約180-200萬個,2021年全球數(shù)據(jù)中心GPU加速市場規(guī)模約100億美元。按照20%市占率計算,我們預(yù)計2021年中國數(shù)據(jù)中心GPU加速器市場出貨量約40萬個,對應(yīng)市場規(guī)模約20億美元。中期展望:我們預(yù)計2030年國內(nèi)數(shù)據(jù)中心GPU芯片市場規(guī)模有望增長至250億美元,對應(yīng)CAGR為32%。如前所述,我們預(yù)計全球數(shù)據(jù)中心GPU加速市場規(guī)模有望由2021年的100億美元增長至2030年的828億美元(對應(yīng)CAGR為26%)。綜合考慮國內(nèi)AI、高性能產(chǎn)業(yè)的發(fā)展,以及頭部科技公司的資本開支,Top500超級計算機數(shù)量等,我們認(rèn)為未來中國數(shù)據(jù)中心GPU芯片需求量將占到全球數(shù)據(jù)中心總GPU需求量的25%-30%左右。依此計算,我們預(yù)計中國數(shù)據(jù)中心GPU芯片市場規(guī)模有望由2021年的20億美元增長至2030年的250億美元(對應(yīng)CAGR為32%)。當(dāng)然考慮到國內(nèi)企業(yè)在AI、高性能計算領(lǐng)域的積極努力和進展,最終實際數(shù)字大概率會好于我們當(dāng)前的中性預(yù)期。國內(nèi)市場格局:本土廠商快速崛起,產(chǎn)品亦逐步上市國內(nèi)GPU廠商:開始快速崛起,大多數(shù)企業(yè)目前已發(fā)布1-3款相關(guān)產(chǎn)品,大部分核心團隊具有英偉達、AMD工作經(jīng)歷。1)2014-2020年,國內(nèi)成立若干GPU&云端AI芯片相關(guān)企業(yè),目前此類企業(yè)已發(fā)布1-3代產(chǎn)品,產(chǎn)品落地進度不斷加快。2)從國產(chǎn)GPU相關(guān)企業(yè)創(chuàng)始人的團隊背景來看,大部分企業(yè)創(chuàng)始人團隊均有在英偉達、AMD等企業(yè)有多年的工作經(jīng)驗。產(chǎn)品競爭力:國內(nèi)廠商產(chǎn)品核心參數(shù)約落后英偉達、AMD1~2代左右,正逐步從“可用”走向“好用”。1)通過對比海外GPU廠商和國內(nèi)GPU廠商相關(guān)產(chǎn)品的參數(shù),可以看出國內(nèi)GPU廠商在半精度&單精度領(lǐng)域中的計算能力,相差約1代差距;國內(nèi)GPU廠商在雙精度(64位)計算領(lǐng)域能力近乎空白,但雙精度運算更多應(yīng)用于復(fù)雜科學(xué)計算。2)考慮到英偉達、AMD在GPU架構(gòu)中加入了張量核TensorCore或MatrixCore(可用于執(zhí)行融合乘法加法運算),這種計算單元層面的DSA架構(gòu)設(shè)計,亦使得他們在AI訓(xùn)練、推理環(huán)節(jié)具有更高的計算效率:英偉達TensorCore:2017年公司發(fā)布的Volta架構(gòu)首次引入了張量核TensorCore模塊,用于執(zhí)行融合乘法加法,支持INT32計算;2018年公司發(fā)布的Turing架構(gòu)對TensorCore進行了升級,并增加了對INT8、INT4、Binary(INT1)的計算能力;2020年公司發(fā)布的Ampere架構(gòu)對TensorCore再次升級,增加了TF32和BF16兩種數(shù)據(jù)格式的支持,也增加了對稀疏矩陣計算的支持。2022年公司發(fā)布的Hopper架構(gòu)對TensorCore再次升級,增加了TF8數(shù)據(jù)格式的支持。AMDMatrixCore:2020年英偉達推出張量核MatrixCore,對標(biāo)英偉達TensorCore,并用于MI100加速器(可支持FP64、FP32計算格式);2021年底,AMD發(fā)布MI250/250X加速卡,基于MatrixCore的加持下,F(xiàn)P64/FP32計算能力可提升一倍。本土GPU廠商:有望率先在AI領(lǐng)域?qū)崿F(xiàn)落地,并逐步擴展至圖形渲染、復(fù)雜科學(xué)計算等場景市場機遇:基于上文對英偉達歷史的復(fù)盤和分析,作為典型的通用芯片,產(chǎn)品技術(shù)、軟件生態(tài)是GPU廠商不斷做大做強的核心基礎(chǔ)和支撐。同時在GPU實際落地應(yīng)用中,需要將硬件、軟件應(yīng)用、游戲引擎、操作系統(tǒng)、OEM等眾多環(huán)節(jié)匹配到一起,才能更好地發(fā)揮性能作用。目前國產(chǎn)GPU廠商正處于起步階段,市場需求、產(chǎn)業(yè)政策均有利于其發(fā)展&壯大:1)國產(chǎn)GPU廠商開始切入相關(guān)客戶產(chǎn)品中:英偉達最新公告背景下,倒逼國內(nèi)相關(guān)客戶開始使用國產(chǎn)GPU產(chǎn)品,在一定程度上能夠幫助相關(guān)企業(yè)與客戶建立密切聯(lián)系,進而幫助相關(guān)企業(yè)進行快速的技術(shù)和產(chǎn)品迭代。2)市場需求:依據(jù)我們前文預(yù)測,2030年全球GPU(圖形渲染)市場規(guī)模為568億美元,中國市場規(guī)模約97億美元;2030年全球數(shù)據(jù)中心GPU(AI、高性能計算等)市場規(guī)模為828億美元,中國市場規(guī)模約250億美元。面臨挑戰(zhàn):目前國產(chǎn)GPU廠商大多仍處于早期發(fā)展階段,仍需要在技術(shù)、產(chǎn)品商業(yè)化落地等方面不斷努力:1)核心技術(shù)人才招募。(a)從英偉達GPU&AMD的發(fā)展歷史來看,公司GPU架構(gòu)基本可以做到兩年更新一代,這對于架構(gòu)師對于芯片研發(fā)的理解和應(yīng)用場景的全判斷要求較高。如:JimKeller于2012年左右加入AMD,幫助涉及了Zen微架構(gòu),大幅提升公司產(chǎn)品在數(shù)據(jù)中心領(lǐng)域的競爭力。(b)GPU下游應(yīng)用領(lǐng)域,并非是單純的硬件算力比拼,對于軟件開發(fā)及軟件生態(tài)的建設(shè)亦相對重要。未來如何招聘大量的軟件&AI人才,仍是國產(chǎn)GPU廠商目前需要面臨的重要問題。2)產(chǎn)品設(shè)計、流片、客戶驗證,再到量產(chǎn)交付的全流程跑通。(a)GPU是一種技術(shù)門檻極高的細(xì)分賽道領(lǐng)域,前期投入資金成本相對較高,這對于企業(yè)的融資能力要求相對較高。(b)從GPU的開發(fā)及使用流程來看,GPU從最初設(shè)計到制造、流片、量產(chǎn),周期通常不會低于18-24個月。從產(chǎn)品點亮到推出,再到后續(xù)的大量出貨和用戶驗證,再到后續(xù)找到可持續(xù)落得的應(yīng)用場景,仍面臨著較多的挑戰(zhàn)。技術(shù)路線選擇:AI為中短期最可能突破&落地場景,并可逐步向圖形渲染、復(fù)雜科學(xué)計算等領(lǐng)域擴展。目前GPU的應(yīng)用場景,主要應(yīng)用于圖形渲染、AI訓(xùn)練&推理、復(fù)雜科學(xué)計算等領(lǐng)域,結(jié)合市場規(guī)模、客戶結(jié)構(gòu)、技術(shù)特性等要素,對于本土GPU廠商而言,我們判斷,AI將是最可能率先獲得突破的領(lǐng)域,并在此基礎(chǔ)上,不斷向圖形渲染、復(fù)雜科學(xué)計算等領(lǐng)域進行延伸:AI訓(xùn)練:大模型逐步成為AI領(lǐng)域的主流,疊加下游自然語言理解、計算機視覺、推薦系統(tǒng)等應(yīng)用場景的不斷擴展,AI訓(xùn)練料將成為中期國內(nèi)GPU最大的需求領(lǐng)域。同時AI模型更多基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),因此對計算精度要求并不嚴(yán)苛,亦使得本土GPU廠商面臨的技術(shù)門檻相應(yīng)降低,我們預(yù)計這將是本土GPU廠商最容易實現(xiàn)突破的領(lǐng)域。AI推理:從英偉達&谷歌等科技巨頭的產(chǎn)品參數(shù)來看,AI推理環(huán)節(jié)對計算精度的要求顯著低于AI訓(xùn)練環(huán)節(jié),一般4~8位即可滿足,但AI推理本身對實時性要求較高,且下游場景過于碎片化,如何實現(xiàn)靈活性、細(xì)分場景之間的有效平衡,是當(dāng)前面臨的主要難題,因此初創(chuàng)企業(yè)更多在自動駕駛、安防等領(lǐng)域?qū)ふ沂袌鰴C遇。圖形渲染:主要場景包括游戲畫面渲染,以及專業(yè)圖形創(chuàng)作&渲染等領(lǐng)域,作為典型的2C市場,客戶更專注產(chǎn)品的性價比、品牌、生態(tài)支持等,且GPU圖形管線設(shè)計復(fù)雜度相對更高。復(fù)雜科學(xué)計算:主要應(yīng)用場景包括國防、航天、氣象等高性能計算領(lǐng)域,為控制累計誤差,需要較高的計算精度,一般需要64位雙精度運算,整體技術(shù)架構(gòu)復(fù)雜性遠(yuǎn)大于AI訓(xùn)練、推理環(huán)節(jié)。國內(nèi)部分重點GPU企業(yè)介紹摩爾線程:專注于研發(fā)設(shè)計全功能GPU芯片及相關(guān)產(chǎn)品英偉達背景出身,打造研運一體GPU公司。成立于2020年10月,致力于構(gòu)建視覺計算及人工智能領(lǐng)域計算平臺,研發(fā)全球領(lǐng)先的GPU,建立高性能計算生態(tài)系統(tǒng)。摩爾線程擁有能夠覆蓋GPU研發(fā)設(shè)計、生產(chǎn)制造、市場銷售、服務(wù)支持等完整成熟的團隊,逐步成為國產(chǎn)現(xiàn)代全功能GPU實現(xiàn)的核心力量。創(chuàng)始人張建中是前英偉達全球副總裁,中國區(qū)總經(jīng)理,英偉達中國公司創(chuàng)始人,曾任惠普、戴爾公司高管。全功能GPU蘇堤問世。公司成立不到300天的時間,于2021年11月公布首顆國產(chǎn)全功能GPU芯片研制成功,開創(chuàng)國產(chǎn)GPU研發(fā)速度先河。2022年3月30日,公司推出基于其統(tǒng)一系統(tǒng)架構(gòu)MUSA的首款GPU蘇堤、基于蘇堤的首款臺式機顯卡MTTS60、首款數(shù)據(jù)中心級產(chǎn)品MTTS2000,開拓GPU在中國市場的生態(tài)系統(tǒng),助力驅(qū)動數(shù)字經(jīng)濟的發(fā)展。沐曦集成電路:國產(chǎn)高性能GPU芯片解決方案領(lǐng)先公司公司概述:沐曦集成成立于2020年9月。公司專注于設(shè)計具有完全自主知識產(chǎn)權(quán),針對異構(gòu)計算等各類應(yīng)用的高性能通用GPU芯片,致力于打造國內(nèi)具有商用價值的GPU芯片,產(chǎn)品主要應(yīng)用方向包括人工智能、云計算、數(shù)據(jù)中心等高性能異構(gòu)計算領(lǐng)域。公司創(chuàng)始人團隊背景。公司匯聚頂尖技術(shù)、量產(chǎn)經(jīng)驗、管理能力人才,創(chuàng)始人陳維良曾任AMDGPU設(shè)計高級總監(jiān)、AMD全球GPUSOC設(shè)計總負(fù)責(zé)人、AMD全球通用GPUMI產(chǎn)品線(高性能計算、云計算)設(shè)計總負(fù)責(zé)人。公司擁有國內(nèi)最完整的GPU設(shè)計研發(fā)團隊,參與過AMD從圖像到高性能計算應(yīng)用GPU的架構(gòu)設(shè)計和量產(chǎn),團隊構(gòu)建完整,且有多年合作共事基礎(chǔ)。目前公司有兩款產(chǎn)品,MXN系列的MXN100和MXC系列的MXC500。(1)MXN系列是面向云端數(shù)據(jù)中心應(yīng)用的人工智能推理產(chǎn)品,采用先進工藝結(jié)合高帶寬內(nèi)存,提供強大的AI算力和領(lǐng)先的視頻編解碼能力,可廣泛應(yīng)用于智慧城市、公有云計算、智能視頻處理、云游戲等場景。目前的MXN100是一款7nm芯片,于2022年8月已經(jīng)流片,成功點亮。目前在正常測試軟硬件,公司預(yù)計年底送達客戶側(cè)測試。(2)MXC系列通用GPU(GPGPU)芯片是針對AI訓(xùn)練和推理及科學(xué)計算的完美解決方案,沐曦自主知識產(chǎn)權(quán)架構(gòu)提供強大高精度及多精度混合算力,可廣泛應(yīng)用于人工智能、數(shù)據(jù)中心以及科學(xué)計算、教育和科研等場景。MXC500是一款6nm芯片,公司計劃2022年10月流片,2023年上半年回片。瀚博半導(dǎo)體:從AI與視頻轉(zhuǎn)向更廣闊的通用計算市場公司概覽:專注于高性能通用加速芯片的AI與視頻芯片廠商。公司成立于2018年12月,創(chuàng)始人錢軍曾在思科、AMD擔(dān)任高管,具備25年以上的芯片設(shè)計經(jīng)驗。公司曾于2020和2021年間完成A輪、A+輪和B輪融資,總募資額超過人民幣24億元。其中最近一筆融資發(fā)生于2021年12月,由阿里巴巴集團、人保資本、經(jīng)緯創(chuàng)投和五源資本聯(lián)合領(lǐng)投,包含B-1和B-2輪,共計人民幣16億元。產(chǎn)品布局:從加速卡向GPU邁進。目前公司擁有VA1通用AI推理加速卡與SV100系列芯片。VA1加速卡具備高效的AI推理能力,INT8峰值算力超2000TOPS,并能夠滿足高密度視頻的解碼,支持FP16的浮點數(shù)運算。SV100芯片則聚焦云端的推理,支持深度學(xué)習(xí)與計算機視覺等場景。根據(jù)公司在2022年世界人工智能大會的披露,公司發(fā)布了瀚博統(tǒng)一計算架構(gòu)、全新數(shù)據(jù)中心(云端)AI推理卡載天VA10、邊緣AI推理加速卡載天VE1、以及瀚博軟件平臺VastStream擴展版等產(chǎn)品,并將繼續(xù)整合統(tǒng)一計算架構(gòu),在邊緣計算、云計算以及軟件平臺上持續(xù)進行投入,并預(yù)覽了云端GPU芯片SG100,正式進入到GPU市場。商業(yè)化:簽約多家政企客戶,并與快手等互聯(lián)網(wǎng)廠商建立合作。根據(jù)公司在2022世界人工智能大會的披露,2022年以來,公司先后與福建大數(shù)據(jù)集團、國寧瑞能,高新興、超聚變等行業(yè)領(lǐng)先企業(yè),在智慧城市、智慧政務(wù)、智慧交通、智慧園區(qū)、智慧能源等多元場景,開展深入合作,為企業(yè)智能化、數(shù)據(jù)化提供國產(chǎn)AI算力解決方案。而公司依靠在視頻領(lǐng)域的特色,亦與快手等互聯(lián)網(wǎng)廠商建立合作關(guān)系。壁仞科技:專研通用計算體系,向圖形渲染進發(fā)公司概覽:聚焦高性能算力芯片,專研通計算體系。GPU壁仞科技創(chuàng)立于2019年,主要從事GPU、DSA(專用加速器)的研發(fā)和銷售,致力于開發(fā)原創(chuàng)通用計算體系,提供智能計算領(lǐng)域一體化解決方案。創(chuàng)始人張文曾任商湯科技總裁,具有哈佛大學(xué)法學(xué)博士及哥倫比亞工商管理碩士學(xué)位;聯(lián)合創(chuàng)始人焦國方是圖形GPU產(chǎn)品線總經(jīng)理,具有超過25年的GPU產(chǎn)品架構(gòu)及研發(fā)經(jīng)驗,曾任高通GPU團隊負(fù)責(zé)人;聯(lián)席CEO李新榮曾任AMD全球副總裁、中國研發(fā)中心總經(jīng)理。由通用計算向圖形渲染全功能發(fā)力,補齊GPU全領(lǐng)域能力。1)公司聚焦云端通用智能芯片,并逐步擴展產(chǎn)品線至人工智能訓(xùn)練和推理、圖形渲染等多個領(lǐng)域,實現(xiàn)GPU芯片的全功能全領(lǐng)域覆蓋。2)目前公司產(chǎn)品線主要為BR100系列的通用GPU,針對人工智能(AI)訓(xùn)練、推理,及科學(xué)計算等更廣泛的通用計算場景開發(fā),包含BR100與BR104兩款產(chǎn)品。其中BR100產(chǎn)品形態(tài)為OAM模組,搭載一顆BR100GPU芯片,制程為7nm,在FP32精度下能夠?qū)崿F(xiàn)256TFLOPS的計算峰值。BR104產(chǎn)品形態(tài)為PCIe板卡,搭載一顆BR104GPU芯片,用于數(shù)據(jù)中心GPU服務(wù)器,采用7nm制程,F(xiàn)P32精度下可達到128TFLOPS計算峰值。此外,公司提供BIRENSUPA軟件開發(fā)平臺,為旗下硬件提供完整功能架構(gòu)的軟件開發(fā)平臺。后續(xù)看,公司將繼續(xù)圍繞通用計算芯片,進行硬件與軟件的開發(fā)。商業(yè)化:GPU芯片已經(jīng)點亮,客戶拓展進行時。2022年3月,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論