版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
英偉達(dá)人工智能發(fā)展戰(zhàn)略研究報告鼎帷咨詢戰(zhàn)略創(chuàng)新研究院2024年9月·GPU(圖像處理器)作為英偉達(dá)的核心產(chǎn)品,特·CPU(中央處理器)的加入使得英偉達(dá)能夠更好地應(yīng)對需要快速邏輯判斷和高度并行處理能力的應(yīng)用;·游戲業(yè)務(wù)是英偉達(dá)的基本盤。英偉達(dá)提供GeForceRTXGPU等針對個人電腦的顯卡、SoC等針對游戲主機(jī)的顯卡和GeForceNow為主的云游戲服務(wù)“云游戲+AI”為發(fā)展主線,不斷強(qiáng)化RTX光線追蹤和ACE虛擬數(shù)字人類生成兩大關(guān)鍵技術(shù),預(yù)計(jì)將在2025年發(fā)布AIPC芯片,進(jìn)入高端筆記本電腦市場。·專業(yè)可視化業(yè)務(wù)主要聚焦于為設(shè)計(jì)和可視化專業(yè)人土提供先進(jìn)解決方案。英偉達(dá)面向?qū)I(yè)級和企業(yè)級市場提供Quadro系列和RTX系列GPU,面向創(chuàng)作者和專業(yè)開發(fā)者提05英偉達(dá)競爭策略·通過提供全面的軟件支持和優(yōu)化,英偉達(dá)的GPU在訓(xùn)練和部署AI模型方面07供應(yīng)鏈主導(dǎo)地位為了方便您的閱讀,請先了解以下常見術(shù)語用途支持大規(guī)模Al訓(xùn)練和科學(xué)計(jì)算用于5G和邊緣網(wǎng)絡(luò)的Al平臺提升電信網(wǎng)絡(luò)的性能和智能化一組預(yù)定義的函數(shù)或協(xié)議,用于構(gòu)建軟件應(yīng)用程序支持軟件開發(fā)和集成用于醫(yī)療健康領(lǐng)域的Al計(jì)算平臺提升醫(yī)療設(shè)備和應(yīng)用的性能ComputeUnifiedDeviceArchitecture的縮寫,是NVIDIA的并行計(jì)算架構(gòu)和編程模用于開發(fā)GPU加速的應(yīng)用程序和算法。CUDA計(jì)算單元,GPU中用于并行處理任務(wù)的基本處理單元。用于執(zhí)行并行計(jì)算任務(wù),加速計(jì)算密集型應(yīng)CUDA程序中執(zhí)行的并行計(jì)算函數(shù)。CUDA的并行執(zhí)行機(jī)制,允許多個任務(wù)在不同的流中并行處用于提升并行計(jì)算的效率。包含編譯器、庫、開發(fā)工具和文檔的完整開發(fā)工具包,用于CUDA編程。用于開發(fā)和優(yōu)化CUDA應(yīng)用程序。用于半導(dǎo)體制造的計(jì)算光刻技術(shù)提升芯片制造的精度和效率用于物流和路徑優(yōu)化的AI工具提高物流效率和降低成本NVIDIA提供的軟件開發(fā)工具包,包含用于深度學(xué)習(xí)的庫和工提供大規(guī)模Al訓(xùn)練和推理能力NVIDIA的深度學(xué)習(xí)超級計(jì)算機(jī)平臺,集成了高性能GPU和優(yōu)化的軟件Al超分辨率算法,通過較低分辨率輸入預(yù)測更高分辨率輸出專用于數(shù)據(jù)處理的處理器提升數(shù)據(jù)中心網(wǎng)絡(luò)和存儲性能用于自動駕駛汽車模擬訓(xùn)練的軟件平臺提高自動駕駛系統(tǒng)的安全性和效率一種能夠檢測和修正常見的數(shù)據(jù)損壞類型內(nèi)存用于邊緣計(jì)算的GPU平臺實(shí)現(xiàn)實(shí)時Al推理和分析16-bit浮點(diǎn)數(shù)精度,用于加速深度學(xué)習(xí)模型的訓(xùn)練和推面向游戲娛樂領(lǐng)域的顯卡系列提供高性能游戲體驗(yàn)專門用于處理圖形和視覺計(jì)算任務(wù)的處理器提供圖形渲染和視覺計(jì)算能力NVIDIA技術(shù),允許直接在GPU之間傳輸數(shù)據(jù),從而減少CPU和主內(nèi)存的干同步顯示器刷新率與顯卡輸出,減少畫面撕裂改善游戲和視頻的視覺質(zhì)量用于高性能計(jì)算的GPU平臺支持科學(xué)研究和復(fù)雜計(jì)算任務(wù)專為智能邊緣設(shè)備設(shè)計(jì)的計(jì)算平臺提供安全、高效的邊緣Al計(jì)算用于機(jī)器人開發(fā)的軟硬件平臺簡化機(jī)器人的設(shè)計(jì)、開發(fā)和部署公從虧鼎帷咨詢公從虧鼎帷咨詢鼎帷咨詢3為了方便您的閱讀,請點(diǎn)擊圖片橫屏瀏覽專為機(jī)器人和邊緣設(shè)備設(shè)計(jì)的計(jì)算平臺提供Al和計(jì)算機(jī)視覺能力用于構(gòu)建推薦系統(tǒng)的AI框架用于視頻分析和監(jiān)控的Al平臺提升視頻分析的智能化水平允許單個物理GPU被劃分為多個獨(dú)立實(shí)例的技術(shù)用于生成式Al應(yīng)用開發(fā)的框架支持自然語言處理和語音合成提供顯卡驅(qū)動更新、性能監(jiān)控和游戲優(yōu)化的工具簡化顯卡管理和游戲設(shè)置降低延遲,提升競技游戲體驗(yàn)用于連接GPU和CPU或其他GPU的高速通信接口提升數(shù)據(jù)傳輸速度和系統(tǒng)性能NVIDIA提供的高帶寬交換技術(shù),用于在多個GPU之間提供高速連接。用于實(shí)現(xiàn)GPU集群中的高效數(shù)據(jù)交換和并行計(jì)算。用于3D設(shè)計(jì)和實(shí)時協(xié)作的平臺提供虛擬世界構(gòu)建和模擬的能力面向?qū)I(yè)設(shè)計(jì)和可視化的顯卡系列提供精確的顏色再現(xiàn)和高質(zhì)量的圖形渲染用于數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的加速平臺提高數(shù)據(jù)處理速度和效率用于生成合成數(shù)據(jù)的AI工具提高AI模型訓(xùn)練的質(zhì)量和效率用于語音識別和合成的Al平臺一種用于實(shí)時渲染畫面,模擬接近現(xiàn)實(shí)的光照、陰影等效果的技術(shù)增強(qiáng)游戲的沉浸感,提升畫面通真度配備RTX顯卡的AI增強(qiáng)型個人電腦SymmetricMultiprocessing,對稱多處理,指多個處理器共享內(nèi)存和系統(tǒng)資源。用于提升計(jì)算性能,支持多線程和多任務(wù)處為創(chuàng)意專業(yè)人士設(shè)計(jì)的軟硬件平臺提供專業(yè)級的內(nèi)容創(chuàng)作工具高性能網(wǎng)絡(luò)接口卡提升網(wǎng)絡(luò)通信速度和效率NVIDIAGPU中專為加速深度學(xué)習(xí)運(yùn)算而設(shè)計(jì)的核心。用于提升深度學(xué)習(xí)模型的訓(xùn)練和推理性能。NVIDIA提供的高性能深度學(xué)習(xí)推理優(yōu)化庫。用于優(yōu)化和加速深度學(xué)習(xí)模型的推理過程。面向數(shù)據(jù)中心和高性能計(jì)算的GPU系列提供強(qiáng)大的計(jì)算和數(shù)據(jù)處理能力顯卡的設(shè)定功耗,用于選擇合適的電源電源選擇和功耗管理用于創(chuàng)建虛擬形象和數(shù)字人的平臺提供虛擬形象創(chuàng)建和管理的能力用于Al模型推理的服務(wù)平臺提供高性能的Al推理能力提供高性能計(jì)算和AI推理能力虛擬化技術(shù),允許多個虛擬機(jī)共享物理GPU資源提升數(shù)據(jù)中心和云計(jì)算環(huán)境中的圖形處理能力久生鼎惟咨詢4鼎惟咨詢4一、發(fā)展階段。英偉達(dá)創(chuàng)立至今經(jīng)過了創(chuàng)業(yè)初期、GPU定義時期、GPU迭代時期、AI萌芽時期、AI輝煌時期五個階段,并在2024年6月19日成為全球市值最高的公司上發(fā)布代號為"Fermi"的新一代CUDAGPU架構(gòu)器Tegra2推出Maxwell(第10代架構(gòu))2001:攜nFORCE進(jìn)軍集DPU三種芯片的公司二鼎帷咨詢|6GPU產(chǎn)品的定義者市場競爭和財(cái)務(wù)困境創(chuàng)新精神和戰(zhàn)略轉(zhuǎn)型在圖形芯片市場取得重要勝利成為專業(yè)可視化領(lǐng)域的領(lǐng)導(dǎo)者在GPU技術(shù)、游戲機(jī)合作、和顯卡市場競爭方面取得重大進(jìn)展CUDA平臺的開發(fā)和推廣為Al鋪路在游戲顯卡市場中占據(jù)領(lǐng)導(dǎo)地位在高性能計(jì)算領(lǐng)域取得進(jìn)展推出革命性GPU架構(gòu)和產(chǎn)品,實(shí)現(xiàn)技術(shù)突破鼎帷咨詢|7第二階段:2015年英偉達(dá)首次發(fā)布了面向深度學(xué)習(xí)處理器,GPU芯片構(gòu)架向AI方向大步邁進(jìn),目前人工智能芯片方向的以市占率80%處于絕對壟斷的地位AI覺醒時期十重點(diǎn)領(lǐng)域重要節(jié)點(diǎn)進(jìn)行了進(jìn)一步的升級,增加了對稀疏矩陣計(jì)算的支持深度學(xué)習(xí)AIAI應(yīng)用等領(lǐng)域AI輝煌時期(2022~今)數(shù)宇生物氣候科學(xué)自動駕駛汽車機(jī)器人等領(lǐng)域2022鼎帷咨詢|8其他收入凈利潤同比增長581%24年其他收入凈利潤同比增長581%營業(yè)利潤同比增長674%同比增長674%475億美元同比增長217%475億美元同比增長217%稅收41億美元443億美元同比增長188%營業(yè)收入609億美元同比增長126%營業(yè)收入609億美元同比增長126%研發(fā)87億美元同比增長18%銷售及管理費(fèi)用27億美元同比增長9%營業(yè)成本113億美元同比增長2%同比增長15%16億美元同比增長1%汽車業(yè)務(wù)11億美元同比增長21%其他業(yè)務(wù)03億美元同比增長-33%營收成本 其他業(yè)務(wù)03億美元同比增長-33%2020年至2023年,公司營業(yè)收入和凈利潤均呈現(xiàn)波動上升趨勢,其中2023年?duì)I業(yè)收入中數(shù)據(jù)中心業(yè)務(wù)貢獻(xiàn)最大,00 營業(yè)收入(億美元)營業(yè)收入值凈利潤一變動比率凈利潤(億美元)0~5.6號292帷咨詢發(fā)費(fèi)用總投入過去三年增長約150%,銷售與管理費(fèi)用增加約40%產(chǎn)品研發(fā)一研發(fā)費(fèi)用率5公眾號·鼎帷咨詢愿景:人工智能計(jì)算領(lǐng)域的領(lǐng)導(dǎo)者路徑路徑機(jī)器人技術(shù)基石技術(shù)基石ASAP技術(shù)應(yīng)應(yīng)用層平平臺層軟件生態(tài)硬件層硬件層英偉英偉達(dá)憑借快速迭代的研發(fā)能力、供應(yīng)鏈的主導(dǎo)地位、多種營銷策略、扁平化的組織、多元投資合作支撐游戲、專業(yè)可視化、數(shù)據(jù)中心、汽車四大業(yè)務(wù)發(fā)展,進(jìn)一步鞏固企業(yè)在AI市場領(lǐng)導(dǎo)地位目標(biāo)改變計(jì)算的工作方式和計(jì)算機(jī)的功能數(shù)據(jù)中心人工智能推動全球的數(shù)據(jù)中心行業(yè)現(xiàn)代化全球人工智能基礎(chǔ)設(shè)施的引擎路徑提供可供于AI工業(yè)機(jī)器人訓(xùn)練和操作的GPU,及其對應(yīng)調(diào)試、訓(xùn)練用的底層軟件游戲業(yè)務(wù)NVIDIAOmniverseEnterprise平臺AI芯片級芯片定制交換機(jī)、網(wǎng)卡等網(wǎng)絡(luò)產(chǎn)品超級計(jì)算機(jī)及AI工廠國家主權(quán)AI、電信云云計(jì)算業(yè)務(wù)(量子計(jì)算)企業(yè)NvidiaAIEnterprise)自動駕駛芯片自動駕駛端到端方案虛擬工廠規(guī)劃仿真設(shè)計(jì)應(yīng)用場景高性能計(jì)算體系社區(qū)營銷品牌營銷內(nèi)容營銷“胡蘿卜加大棒”的管理方式大訂單擠占GPU短缺組件供應(yīng)提前支付預(yù)付款搶占供應(yīng)人工智能重塑英偉達(dá)產(chǎn)業(yè)鏈地位創(chuàng)始人技術(shù)專業(yè)與銷售背景兼具極致扁平化的組織架構(gòu)賦權(quán)式管理,不給工作建議摒棄會議匯報摒棄傳統(tǒng)戰(zhàn)略規(guī)劃向全體員工透明共享網(wǎng)絡(luò)、自動駕駛、生物科技與醫(yī)療等初創(chuàng)投資項(xiàng)目企業(yè)間的三級合作伙伴國家政府合作系統(tǒng)管理■維持軟硬件生態(tài)■數(shù)據(jù)集并行運(yùn)用異構(gòu)計(jì)算■數(shù)據(jù)中心基礎(chǔ)設(shè)施■卸載網(wǎng)絡(luò)、存儲、安全業(yè)務(wù)中科數(shù)控架構(gòu)服務(wù)器端還是ARM架構(gòu)移動端PC(一顆CPU)和服務(wù)器(數(shù)量不定)應(yīng)用應(yīng)用類型加速計(jì)算并行計(jì)算任務(wù)建立了“GPU+CUDA”的強(qiáng)大算力生態(tài)特點(diǎn)功能英偉品數(shù)據(jù)中心智能駕駛預(yù)計(jì)未來用于數(shù)據(jù)中心的DPU數(shù)量增長主要應(yīng)用英偉品提供加速計(jì)算的通用算力的基礎(chǔ)保障針對數(shù)據(jù)中心和網(wǎng)絡(luò)設(shè)備的需求翼有高效處理數(shù)據(jù)包和協(xié)議的能力能夠更好地應(yīng)對各種計(jì)算任輯判斷和高度并行處理能力的應(yīng)用“三類芯片、逐年飛躍、一個架構(gòu)”鼎帷咨詢18計(jì)算機(jī)產(chǎn)業(yè)伴隨著兼容機(jī)的出現(xiàn),產(chǎn)業(yè)結(jié)構(gòu)從過去的縱向一體化轉(zhuǎn)變?yōu)闄M向切片式,這種水平分層的產(chǎn)業(yè)形態(tài)造新的橫向式計(jì)算機(jī)產(chǎn)業(yè)(并非按比例展示)新的橫向式計(jì)算機(jī)產(chǎn)業(yè)(并非按比例展示)約1995年約1980年銷售與分銷銷售與分銷芯片王安公司王安公司底層結(jié)構(gòu)的碎片化會帶來上層重復(fù)工作量和成本的大幅增加款件層面對于底層硬件高度統(tǒng)一的強(qiáng)烈訴求計(jì)算機(jī)產(chǎn)業(yè)底層硬件強(qiáng)慣性、高壟斷性特征替代幾乎無法發(fā)生眾鼎帷咨詢性特征替代幾乎無法發(fā)生英偉達(dá)沒有試圖從CPU上取代英特爾,而是將其為CPU+GPU,給英特爾塑造計(jì)算機(jī)系統(tǒng)應(yīng)該是純CPU還是CPU+GPU的形態(tài)的難題通過推出3D圖形加速卡進(jìn)入市場,吸引眾多游戲玩家為了在英特爾每18個月更新一代英偉達(dá)沒有試圖從CPU上取代英特爾,而是將其為CPU+GPU,給英特爾塑造計(jì)算機(jī)系統(tǒng)應(yīng)該是純CPU還是CPU+GPU的形態(tài)的難題通過推出3D圖形加速卡進(jìn)入市場,吸引眾多游戲玩家X替代X替代加一倍,性能也將提升一倍,而價格下降為原來的一半逐步演進(jìn)在數(shù)據(jù)中心市場,推動在服務(wù)器中加入少量顯卡,從逐步演進(jìn)采用“三團(tuán)隊(duì)-兩季度”的創(chuàng)新研發(fā)迭代模式隨著顯卡數(shù)量增加,權(quán)重增大,加入技術(shù)和特性,服隨著顯卡數(shù)量增加,權(quán)重增大,加入技術(shù)和特性,服對英特爾來說,無論選擇哪種方案,英偉達(dá)競爭,可能導(dǎo)致GPU英偉達(dá)競爭,可能導(dǎo)致GPU在體系中的重要性逐漸超過CPU。最終,大家都專注GPU,問題就變成了誰的GPU更強(qiáng)如果英特爾選擇只做CPU,它必須接受CPU加施英偉達(dá)通過構(gòu)筑軟件生態(tài)、調(diào)動開發(fā)者、發(fā)據(jù)應(yīng)用場景去塑造有利于自身的計(jì)算機(jī)演化方向英偉達(dá)發(fā)布2025-2027年產(chǎn)品規(guī)劃,AI芯片規(guī)劃的戰(zhàn)略核心是“OneArchitecture”統(tǒng)一架構(gòu),AI芯片從兩年數(shù)據(jù)中心規(guī)?!褚荒旯?jié)奏2.3xmoreperformarceperwattinMicroservices>2xmoreperformanceperw背景背景新一代數(shù)據(jù)中心的基礎(chǔ),面向服務(wù)器和數(shù)據(jù)中心生態(tài)系統(tǒng),可采用多種配置滿足不同數(shù)據(jù)中心的需求超強(qiáng)性能與效率:采用ARM架構(gòu),擁有72個ArmNeoverseN2內(nèi)核,配備LPDDR5x內(nèi)存,具有超強(qiáng)的性能和效率雙重使用能效:可與GPU緊密結(jié)合以增強(qiáng)加速計(jì)算能高效的獨(dú)立CPU進(jìn)行部署支持支持平臺兩個GraceCPU,共144個內(nèi)核72核GraceCPU十十加ANrCMA1CPULPCOR5XMutheroord核心架構(gòu)更高指令原子操作GraceCPU在Armv8.1中首次引入的大型系統(tǒng)低成本的原子操作,提高CPU到CPU通信、鎖和互斥鎖的系統(tǒng)量緩存架構(gòu)由NVIDIA設(shè)計(jì)的可擴(kuò)展一致性結(jié)構(gòu)(SCF)是一種網(wǎng)狀結(jié)構(gòu)和分布式緩存架構(gòu),提供超過3.2TB/s的總二分帶寬內(nèi)存子系統(tǒng)GraceCPUSuperchip使用高達(dá)960GB的服務(wù)器、級低功耗DDR5X(LPDDR5X)內(nèi)存和ECC,實(shí)現(xiàn)帶寬、能效、容量和成本的最佳平衡GraceCPUSuperchip支持128條PCleGen5通道和128GB/s的形狀維度芯片互連技術(shù)采用了NVIDIA獨(dú)特的NVLink-C2C互連技術(shù)(最大區(qū)別)指令集架構(gòu)x86指令集架構(gòu)核心數(shù)量和線程數(shù)量更多的核心數(shù)量和線程數(shù)量核心數(shù)量和線程數(shù)量相對較少緩存架構(gòu)分布式緩存設(shè)計(jì)層次式緩存設(shè)計(jì)內(nèi)存子系統(tǒng)低功耗的LPDDR5X內(nèi)存通常采用DDR4或DDR5內(nèi)存集成度將CPU、GPU和其他組件集成在一個芯片上通常需要與其他芯片配合使用超級芯片設(shè)計(jì)最多配備144個XeonW9-3495X(56Core/5.3GHzLN2)Threadripper5995WX(64C卓越的相干接口高封裝密度決方案的兩倍每瓦性能CPU的兩倍計(jì)算(HPC)可運(yùn)行所有堆棧和平臺34.7千極強(qiáng)的兼高性能24.5千23.0千人工智能領(lǐng)域:與NVIDIA的GPU相結(jié)合,為訓(xùn)練和在2026年推出其下一代VeraCPU在未來幾年內(nèi)推出基于Arm的消費(fèi)者級別CPU模擬數(shù)據(jù)分析人工智能TensorRT培訓(xùn)(DLFW)TT開源且商業(yè)的作業(yè)調(diào)度器煲要理容器與編排開源且商業(yè)的開源且商業(yè)的作業(yè)調(diào)度器煲要理容器與編排開源且商業(yè)的集群管理通信庫庫開豆商業(yè)的編譯器開商烈的通信庫庫開豆商業(yè)的編譯器開商烈的和具和具遵循主流遵循主流CPU設(shè)計(jì)原則提供符合標(biāo)準(zhǔn)的平臺提供符合標(biāo)準(zhǔn)的平臺GPU結(jié)構(gòu)寄存器寄存器GPU結(jié)構(gòu)寄存器寄存器主機(jī)硬件它是現(xiàn)代計(jì)算機(jī)系統(tǒng)中的關(guān)鍵組件,特別是在的圖形和計(jì)算任務(wù)。對于高效圖形處理至關(guān)重要。負(fù)責(zé)處理圖像的紋理映射和濾波,這對于生成逼真的圖像非常重要。到顯示設(shè)備。■GPU的設(shè)計(jì)重點(diǎn)在于并行處理能力,能夠同時處理大量的圖形數(shù)據(jù),這使得它在視頻游戲、圖形設(shè)計(jì)、視頻編輯和某些類型的計(jì)算密集型任務(wù)中表現(xiàn)出色核心顯存流處理器著色器輸出接口高級圖形特性支持費(fèi)米開普勒麥克斯韋帕斯卡伏特圖靈安培赫柏布萊克威爾時間14億30億71億80億135億211億146億540億800億2080億128個16個Core,共計(jì)512個CUDA15個SMX*(192個單清度+64個雙精度具有3072個CUDA核心3840個CUDA核心5120個新增了640個張量核心4608個CUDA核心、576個張量核心具有6912個CUDA核心、432個張量核心具有18432個核心,576個張量核心特點(diǎn)首個通用GPU計(jì)算架構(gòu),采用全新的CUDA架構(gòu),支持使用C語言進(jìn)行GPU編程,標(biāo)志著GPU開始從專用圖形處理器轉(zhuǎn)變?yōu)橥ㄓ脭?shù)據(jù)并行處理器引入L1/L2快速緩存、錯誤修復(fù)功能以及技術(shù)首個支持超級計(jì)算和雙精度計(jì)算的GPU架構(gòu),計(jì)算能力比Fermi架構(gòu)提高3-4倍,GPU開始成為高性能計(jì)算的關(guān)注點(diǎn)在功耗效率、計(jì)算密度上獲得重大提升,計(jì)算密度是標(biāo)志著GPU的節(jié)能計(jì)算時代到來有300W,比Maxwell架構(gòu)這使得GPU可的人工智能、到112TFLOPS,新增了RayTracing核心(RTCore),可硬件加速光線追蹤運(yùn)算在人工智能、光線追蹤和圖形渲染等方面功耗卻只有400W,能效比顯著提高former引擎可以做到FP16和FP8之間逐層交換,利用的啟發(fā)算法來降低所需精度通過10TB/S的片間互聯(lián)技術(shù)連接成一塊統(tǒng)一的GPU背景定義功能4口4RegisterFile(16,3842nka2a中種年中P4t以將GPU的性能吞吐量加速至比PascalGPU高出多達(dá)32倍,且首次在消費(fèi)級產(chǎn)品中配備TensorCore■隨著Hopper微架構(gòu)發(fā)布,NVIDIA聲稱這將使大型語言模型的訓(xùn)練速度“比上一代快30倍“2024年NVIDIA發(fā)布第五代BlackwellTensorCore,與上一代相比,可為大型模型提供30倍的加速,且提供更高的準(zhǔn)確性和精度公第一代支持的精度支持的精度鼎帷咨詢鼎帷咨詢進(jìn)一步鞏固英偉達(dá)在高性能計(jì)算和AI市場的領(lǐng)先地位,為更復(fù)雜計(jì)算任務(wù)提供支持。⑨·鼎帷咨詢啟動Blackwell芯片的量產(chǎn),推出基于x86架構(gòu)的H200h,L40S,B100和B40芯片。H200將提升內(nèi)存至282GB,帶寬增加3⊙采用8顆HBM4內(nèi)存,作為Blackwell平臺的繼任者。程技術(shù),特點(diǎn)是搭載了2080億個晶體管和高達(dá)192GB的HBM3e內(nèi)存,以及8TB/s的內(nèi)存帶寬,顯示出其在硅張量縮放技術(shù),使得Al模型可以在保持高精度的同時實(shí)現(xiàn)更高的性能。等主流框架兼容,并通過與各類生態(tài)系統(tǒng)合作伙伴協(xié)作,增強(qiáng)了應(yīng)用開發(fā)和部零的靈活性。數(shù)據(jù)中心轉(zhuǎn)型推動發(fā)展基于BlackwellGPU的幾種產(chǎn)品變體包括GB200、B200和B100,涵蓋從在提供一體化解決方案方面實(shí)力突出。B100能應(yīng)對1730億參數(shù)的大語言模型。2000張BlackwellGPU僅需1/4的電力即可完成與8000張HopperGPU相同的訓(xùn)練任務(wù)。代表著數(shù)據(jù)中心轉(zhuǎn)型的實(shí)現(xiàn)和工業(yè)智能化的進(jìn)強(qiáng)大的計(jì)高效的轉(zhuǎn)化數(shù)據(jù)中心到建立全新的智能工廠和AI基礎(chǔ)設(shè)施構(gòu)成因案地區(qū)企業(yè)代表產(chǎn)品制程特點(diǎn)海外主要品牌英偉達(dá)而設(shè)計(jì)具備54億個晶體管和第三代TensorCore基于CDNA架構(gòu)的數(shù)據(jù)中心系列加速卡理器和208個計(jì)算單元英特爾銳炫ArcA770不具備高通不具備-專為WindowsonARM系統(tǒng)設(shè)計(jì)的驍龍X系列SoC的第一代集成顯卡國內(nèi)主要品牌寒武紀(jì)不具備器,滿足不同層次的人工智能計(jì)算需求海光信息深算一號摩爾線程不具備“春曉“壁仞科技壁礪100P不具備標(biāo)準(zhǔn)天數(shù)智芯天垓100不具備理,廣泛兼容主流軟硬件生態(tài)使GPU的并行計(jì)算能力能夠應(yīng)用于加速大習(xí)、密碼學(xué)等領(lǐng)域作提供了契機(jī)開發(fā)需要英特爾合作契機(jī)開發(fā)背景CUDA開發(fā)庫開發(fā)庫規(guī)模并行計(jì)算問題CUDACUDA運(yùn)行環(huán)境提供應(yīng)用開發(fā)接口和運(yùn)行期組件,支持程序代碼在CPU和GPU上運(yùn)行涵蓋了數(shù)據(jù)類型定義、內(nèi)存管理、設(shè)備訪問和執(zhí)行調(diào)度等功能,幫助開發(fā)人員實(shí)現(xiàn)各種計(jì)算需求CUDA驅(qū)動CUDA驅(qū)動CUDA應(yīng)用需要NVIDIACUDA-enable硬件支持,通過這一層,CUDA可以實(shí)現(xiàn)硬件設(shè)備的各種功能驅(qū)動程序提供了不同版本GPU之間的設(shè)備抽象層接口和計(jì)算任務(wù)的執(zhí)行鼎帷咨詢|30工具和容器部署支持:支持容科學(xué)計(jì)算、圖像處理和深度學(xué)習(xí),提升訓(xùn)練和推理速度rrFTensorflowmFTensorflowm支持C/C++、Python等語言編寫GPU程序,提供CUDA工具包和API接口度學(xué)習(xí)算法的GPU加速實(shí)現(xiàn)性代數(shù)操作而設(shè)計(jì),廣泛應(yīng)用于深度學(xué)習(xí)和高性能計(jì)算領(lǐng)域庫,用于優(yōu)化、加速和部署深度神經(jīng)網(wǎng)絡(luò)模型庫,旨在高效處理科學(xué)計(jì)算、深度學(xué)習(xí)和AI應(yīng)用程序中的復(fù)雜數(shù)學(xué)運(yùn)算cUDA-X工具包,提供API和工具,幫助開發(fā)者利用GPU加速計(jì)算,編程接口集,允許高性能計(jì)算,■基礎(chǔ)的并行計(jì)算軟件庫細(xì)分行業(yè)軟件庫配套輔助軟件等針對AI領(lǐng)域而言,諸多AI框架的完善支持對于細(xì)分行業(yè)的支持需要較長時間積累費(fèi)米(Fermi)麥克斯韋伏特(Volta)圖靈(Turing)優(yōu)勢特點(diǎn)易部署(用戶開箱即用)層次靈活的開發(fā)接口滿足不同領(lǐng)域開發(fā)者編程語言品類齊全的工具集第三方工具和軟件庫投入大量研發(fā),市場反應(yīng)冷淡。用戶少,市值長期低迷CUDA在科學(xué)計(jì)算領(lǐng)域持續(xù)滲透加速在AI領(lǐng)域的發(fā)展經(jīng)過多年迭代,推出12.0版本,與HPC與Al生態(tài)深度綁定,成為核心工具箱功能優(yōu)化支揚(yáng)A1000MGCUDA10.0新互聯(lián)技術(shù)技豐槽皮浮點(diǎn)5和和1024個規(guī)程快個線程128個128個5242圖200620082010201220142016每個CUDA新版本都會引入新功能或API,如CUDA10的任務(wù)圖功能和CUDA11的新編程模型和庫功能CUDA升級時會持續(xù)優(yōu)化性能,提高運(yùn)行速度和效新版本會對舊版代碼的兼容性進(jìn)行調(diào)整,某些舊特性或API行為可能會被慘改或不再支持新版本會修復(fù)已知的錯誤,并提高穩(wěn)定性和可靠性,使CUDA能更好地處理GPU加速庫GPU加速庫為您的應(yīng)用進(jìn)程提供“嵌入式”加速,大幅減少渲染時間,提高效率。(如深度學(xué)習(xí)深度學(xué)習(xí)線性代數(shù)線性代數(shù)信號與圖像處理信號與圖像處理處理大量矩陣運(yùn)算的深度學(xué)習(xí)框架(如速度。 鼎帷咨詢|34形成同一架構(gòu),缺乏相應(yīng)核心生態(tài)競爭力AMDCTM/CAL20002005對比對象CUDA優(yōu)勢CUDA劣勢■性能與NVIDIA硬件緊密結(jié)合,充分發(fā)揮GPU性能工具鏈。學(xué)計(jì)算與深度學(xué)習(xí)兼容性不如OpenCL廣泛,OpenCL適用于更多硬件平臺■應(yīng)用范圍廣泛應(yīng)用于科學(xué)計(jì)算和深度學(xué)習(xí),優(yōu)化庫豐富■硬件控制CTM接近硬件,提供更高的在特定應(yīng)用場景中有獨(dú)特優(yōu)持科學(xué)計(jì)算和深度學(xué)習(xí)領(lǐng)域DirectCompute在通用性和多平臺支持上更強(qiáng),適用于微軟操作系統(tǒng)及多種硬件。①指令集不統(tǒng)一,硬件架構(gòu)分散②軟件棧不同意。用戶學(xué)習(xí)成本高③算子覆蓋度低,用戶遷移成本高CUDA同時面向個人用戶和企業(yè)用戶市場,以低學(xué)習(xí)門檻、使用完全免費(fèi)及開發(fā)者生態(tài)建設(shè)占領(lǐng)市場份額■構(gòu)建強(qiáng)化與開發(fā)者的聯(lián)系工具服務(wù)壇、培訓(xùn)等形式,發(fā)布與CUDA增進(jìn)用戶交流?!ひ蚤_源形式打造強(qiáng)大的開發(fā)庫和開發(fā)者的社區(qū)參與度、用戶粘性與忠誠度在全球350所大學(xué)開設(shè)相關(guān)課程業(yè)時不再陌生渠道2:面向企業(yè)用戶的賦能支持·鼎帷咨詢英偉達(dá)云G英偉達(dá)Al自動駕駛智慧城市健康養(yǎng)護(hù)軟件、硬件、庫、系統(tǒng)深度學(xué)習(xí)HPC數(shù)據(jù)中心CUDA&GPU計(jì)算機(jī)構(gòu)●截至2020年,CUDA開發(fā)者數(shù)量達(dá)到了200萬,并于2023年增長到400萬,其中包括Adobe等大型企業(yè)客戶AI開發(fā)者GPU過硬cUDA生態(tài)圈Tencent摩賦能安全、計(jì)算、存儲和網(wǎng)絡(luò)業(yè)務(wù)市場機(jī)會全球算力需求平均每3.5個月翻一倍,傳統(tǒng)“CPU+xPU”算架構(gòu)在性能上的提升無法滿足當(dāng)前的網(wǎng)絡(luò)帶寬的發(fā)展,求壓力不斷增大平臺基礎(chǔ)設(shè)施平臺基礎(chǔ)設(shè)施功能。高性能的網(wǎng)絡(luò)處理能力支持高速網(wǎng)絡(luò)連接·融入通用計(jì)算能力價值與未來·將成為未來計(jì)算的第三大支柱,構(gòu)建高效計(jì)算生態(tài)多元化異構(gòu)計(jì)CPU的計(jì)算需架構(gòu)計(jì)尊分布式計(jì)算領(lǐng)先進(jìn)入Technologies,同年推出BlueField-2DPUDPU介紹安全安全關(guān)的功能接支撐的功能英偉達(dá)布局DPU產(chǎn)品,每18個月推出新一代Bluefield芯片,目前第四代算力已達(dá)1000TOPS(每秒萬億次操作)世界上第一個針對現(xiàn)代企業(yè)數(shù)據(jù)中心優(yōu)化的芯片架構(gòu)的數(shù)據(jù)中心基礎(chǔ)設(shè)施是第三代NVIDIADPU預(yù)期將GPU進(jìn)行集成到DPU中,為邊緣設(shè)備提供低成本、高性能的安全數(shù)據(jù)處理能力發(fā)布時間2020年10月2021年4月/70億個220億個640億個網(wǎng)絡(luò)端口10/25/50/100G雙端口200G單端口25/50/100G四端口400G以太網(wǎng)PCle端口8或16道PCle4.032道PCle5.0ARM+ASIC+專用加速器ARM+ASIC+GPU專用加速器40.00030.000寬的2計(jì)算能力算力9/2倍的網(wǎng)絡(luò)帶寬4倍的計(jì)算能力幾乎5倍的內(nèi)存帶寬高達(dá)8倍的速度運(yùn)行工作負(fù)載整數(shù)處理性能提高近4倍Buzfa62Butdd3Bufdd2圖1.與NVIDIABlueField-2DPU相比,NVIDIABlueField-3DPU的內(nèi)存帶寬和計(jì)算能力提高了四倍帷咨詢海內(nèi)外主要AI廠商均通過自研和并購布局DPU,海外聚焦DPUSoC芯片,國內(nèi)聚焦CPU+FPGA的DPU解決方案,技術(shù)路線公司名應(yīng)用方向發(fā)布時間核心處理器代表產(chǎn)品技術(shù)路線公司名應(yīng)用方向發(fā)布時間核心處理器代表產(chǎn)品BlueFieid-4①BlueFieid-4①②③④AWS收購Annapurna公司開發(fā)DPUSoC芯片用加連器NVIDIA用加連器NVIDIAPU專用加速器面向交換機(jī)、路由器芯片面向網(wǎng)絡(luò)、存儲和計(jì)算加迷功能面向交換機(jī)、路由器芯片面向網(wǎng)絡(luò)、存儲和計(jì)算加迷功能面向集成機(jī)器學(xué)習(xí)推理引擎和內(nèi)聯(lián)加密處理器等面向交換機(jī)、路由器芯片面向交換機(jī)、路由器芯片面向網(wǎng)絡(luò)、存儲、虛擬化為智能網(wǎng)卡數(shù)據(jù)提供線逸加密和解密軟件定義網(wǎng)絡(luò)處理器基于CPU+FPGA的DPU解決方案優(yōu)勢劣優(yōu)勢劣勢更短的開發(fā)時間和快速的迭代,促進(jìn)功能快速定制CatapultvCatapultv3面向虛擬機(jī)營理程序面向連接FC網(wǎng)絡(luò)的應(yīng)用,面向虛擬機(jī)營理程序面向連接FC網(wǎng)絡(luò)的應(yīng)用,②高帶寬高性能存儲組網(wǎng)方案加密應(yīng)用加密應(yīng)用Al電信/媒體DOCA服務(wù)DOCA庫編排內(nèi)存是釋放DPU潛力的關(guān)鍵提供一個靈活而強(qiáng)大的平臺功能應(yīng)用價值DOCADOCA合作伙伴生態(tài)建設(shè)極客天成、炎融科技、愛瑞無線等。英偉達(dá)目前拓展Oracle、Cisco、DDN、DellEMC、Juniper、VMWare等二十多個生態(tài)系統(tǒng)合作伙伴使用BlueField數(shù)據(jù)中心加速技術(shù)來更高效地運(yùn)行其軟件平臺NVIDIA與其主要合作伙伴的合作內(nèi)容■將■將BlueField-2DPU集成到產(chǎn)品技鼎帷咨詢|41公司已完成CPU+GPU+DPU三芯的硬件布局,通過底層硬件架構(gòu)和CUDA生態(tài)整合,構(gòu)建全領(lǐng)域加速計(jì)算平臺。近幾年00收入0NVIDIARTXGPU和EGX平臺為客戶提供涵蓋專業(yè)圖形渲染、云端XR應(yīng)用、Al數(shù)據(jù)科學(xué)與大數(shù)據(jù)研究的專業(yè)可視化業(yè)務(wù)DRIVEOrinSoC芯片能夠?yàn)樽詣玉{駛功能、置信度視圖、數(shù)字儀表盤以及Al座艙提供強(qiáng)力支持,Hyperion架構(gòu)將Al計(jì)算503心業(yè)務(wù)■游戲業(yè)務(wù)0.1%%50鼎帷咨詢|43英偉達(dá)基于GPU等芯片架構(gòu)上的底層技術(shù)積累,圍繞各個業(yè)務(wù)場景設(shè)計(jì)了系列產(chǎn)品線汽車汽車Blackwell系列可視化工作站可視化工作站游戲筆記本GPU游戲筆記本GPU:以太網(wǎng)交換機(jī)以太網(wǎng)交換機(jī)可視化平臺鼎帷咨詢|44一家大客戶超過其總收入的10%AGUAR數(shù)據(jù)中心汽車鼎惟咨詢|46業(yè)務(wù)構(gòu)成業(yè)務(wù)構(gòu)成云游戲服務(wù)SoC芯片SoC芯片游戲本游戲本GTX770M與桌面湍GTX770性能懸殊與桌面端同型號規(guī)格差距縮小,開始采用相同內(nèi)核設(shè)計(jì)“游戲本元年”除主頻降低外,與桌面端同型號規(guī)格基本一致性能落后于桌面端及使游戲本首次實(shí)現(xiàn)輕0要程首款真正首款支持的顯卡首款基于Kelper架構(gòu)的顯卡首款基于的顯卡的顯卡首款基于Turing架構(gòu)的顯卡的顯卡GeForceGTX4080首款基于4070SUPER基于盡管游戲業(yè)務(wù)已不是英偉達(dá)營收的最大來源,但游戲憑借對硬件技術(shù)迭代的持續(xù)推動,以及作為AI技術(shù)的高頻應(yīng)用場景,仍然是英偉達(dá)的核心業(yè)務(wù),并圍繞它確立了“云游戲+AI”發(fā)展思路英偉達(dá)發(fā)展主線:云游戲業(yè)務(wù)+AI英偉達(dá)發(fā)展主線:云游戲業(yè)務(wù)+AI游戲玩家需求推動硬件技術(shù)打磨游戲技術(shù)對前沿科技貢獻(xiàn)模尚不到整個游戲產(chǎn)業(yè)2%,英偉達(dá)71%存量用戶仍未模尚不到整個游戲產(chǎn)業(yè)2%,英偉達(dá)71%存量用戶仍未體現(xiàn)-科技公司迭代技術(shù)、發(fā)展自身產(chǎn)業(yè)的“順風(fēng)車”芯片聚焦客戶生成式AI賦能游戲生成式AI賦能游戲占據(jù)了GPU市場100%的份額開發(fā)端美術(shù)端體驗(yàn)端效率模,節(jié)省大量時間,效率模,節(jié)省大量時間,能NPC能夠進(jìn)行實(shí)時對話、自然語言鼎帷咨詢英偉達(dá)通過NVIDIARTX(光線追蹤技術(shù))實(shí)現(xiàn)實(shí)時電影級渲染,NVIDIAACE(虛擬數(shù)字人類生成技術(shù))將NVIDIANVIDIARTX光線追蹤技術(shù)·2018年推出,提供廣泛應(yīng)用加速,融入各領(lǐng)域發(fā)展,如游戲、內(nèi)容創(chuàng)作、影音、生產(chǎn)力、開發(fā)等·光線追蹤技術(shù),可實(shí)現(xiàn)實(shí)時電影級渲染。長期用于電影行業(yè)的特效,是一種計(jì)算密集型技從而在計(jì)算機(jī)生成的場景中實(shí)現(xiàn)更逼真的效果。適用范圍適用范圍NVIDIANVIDIAACE虛擬數(shù)字人類生成技術(shù)一套可幫助開發(fā)者利用生成式AI創(chuàng)建栩栩如生的虛擬數(shù)字人物的技術(shù)。在ACE的加持下,普通的非玩家角色(NPC)可以搖身一變,成為能夠發(fā)起對話 (用于自動語音識別、文字轉(zhuǎn)語音轉(zhuǎn)換和翻譯)等語音識別轉(zhuǎn)換技術(shù)極大優(yōu)化游戲中的NPC角色極大優(yōu)化游戲中的NPC角色音軌制作出面部動畫)·NVIDIAOmniverseRTX(用即時光線追蹤技術(shù)制作逼真的皮膚和毛發(fā))新的小型語言模型(SLM),專PC推理而設(shè)計(jì)在游戲業(yè)務(wù)領(lǐng)域,英偉達(dá)通過與聯(lián)發(fā)科合作積極布局AIPC業(yè)務(wù)進(jìn)入高端筆記本電腦市場,預(yù)計(jì)在25年上半年發(fā)辛格在硅谷首次提出"AIPC",發(fā)布AIPC芯片⑨⑤2023市場潛力巨大AIPC推理優(yōu)勢·更適用于廣大消費(fèi)者市場對比項(xiàng)目安裝基數(shù)~0m×基礎(chǔ)×√更高質(zhì)量鼎帷咨詢憑借著RTX技術(shù)和3D設(shè)計(jì)平臺的應(yīng)用,被廣泛應(yīng)用于建筑和工業(yè)設(shè)計(jì)、高級特效、科學(xué)可視化等領(lǐng)域4500萬設(shè)計(jì)師和創(chuàng)意人員672024Q14.27億美元267551430210加10加與獨(dú)立軟件供應(yīng)商合作,協(xié)助優(yōu)化針對NVIDIA與獨(dú)立軟件供應(yīng)商合作,協(xié)助優(yōu)化針對NVIDIA通過GPU計(jì)算解決方案提高生產(chǎn)力,為設(shè)計(jì)、制造及數(shù)字內(nèi)容創(chuàng)建等領(lǐng)域的關(guān)鍵工作引入新功能應(yīng)用市場圖形設(shè)計(jì)、3D建模、視頻編輯等專業(yè)領(lǐng)域.擁有更高的顯存容量和帶寬,以庫價格相對較高,定位于專業(yè)用戶和企業(yè)級市場(VR)、工作站NVIDIARTX系列顯卡采用AdaLovela架構(gòu),支持第三代光線追蹤核心和第四代技術(shù),提供卓越的圖形和計(jì)算性能用戶,覆蓋從主流消費(fèi)級到高端發(fā)燒級市場,為各種圖形密集型和計(jì)算密集型應(yīng)用19992000200Shader架構(gòu)系列名稱鶿發(fā)布CUDA時間核心數(shù)量基世頻率導(dǎo)存顯存(位)工藝接口師鼎帷咨詢51NVIDIAOmniverse是英偉達(dá)基于USD構(gòu)建的實(shí)時協(xié)作平臺,利用NVIDIA光線追蹤、人工智能和模擬等先進(jìn)技術(shù),為用戶提供了一個高度逼真和物理上準(zhǔn)確的虛擬世界構(gòu)建和交互的環(huán)境模擬+世界面向作流、生成合成數(shù)據(jù)和構(gòu)建工業(yè)元宇宙應(yīng)用程序。在虛擬空間中實(shí)現(xiàn)協(xié)作和創(chuàng)新應(yīng)用創(chuàng)作者開發(fā)者VIEWVIEWCREATEAUDIO2FACE拓展套件拓展套件NVIDIAOmniverse平臺由五大核心組件和兩大擴(kuò)展組件組成,并與一系列第三方數(shù)字內(nèi)容創(chuàng)作工具和其他游戲開發(fā)電影制作建筑和設(shè)計(jì)自動駕駛汽車開發(fā)機(jī)器人技術(shù)虛擬現(xiàn)實(shí)和增強(qiáng)和培訓(xùn)組件名描述數(shù)據(jù)庫服務(wù)器(Omniverse的核心),用于存這是連接Omniverse和其他第三方3D創(chuàng)建工具之間無縫傳輸序的API和工具。基于NVIDIARTX技術(shù)的實(shí)時渲染器,提供逼不犧牲性能的情況下渲染高質(zhì)量的圖像。提供仿真服務(wù),通過OmniverseKit的小插件和微服務(wù)使虛擬世界看起來更真實(shí)用于啟動和管理Omniverse應(yīng)用程序和場景提供對各種應(yīng)用程序和工具的集成支持作用生成OpenUSD數(shù)據(jù)的全光線追蹤作用生成OpenUSD數(shù)據(jù)的全光線追蹤RTX渲染用戶可修改OpenUSD數(shù)據(jù)并與之交互支持場景查詢和交互式場景追蹤USD變化并提供更新信息協(xié)作應(yīng)用借助CloudAPI可將Omniverse核心技術(shù)集成到軟件應(yīng)用及機(jī)器人或自動駕駛汽車等自主案例用戶群體功能專業(yè)3D藝術(shù)家和設(shè)計(jì)師提供強(qiáng)大3D創(chuàng)作工具和實(shí)時協(xié)作功能開發(fā)者開源平臺開發(fā)工具包,允許自定義和擴(kuò)展/提供直觀界面,用于構(gòu)建、布置和編輯場景非技術(shù)用戶用于審閱和批準(zhǔn)3D場景的應(yīng)用程序企業(yè)客戶的企業(yè)級功能/專注于實(shí)時渲染,提供逼真的視覺效果效率允許全球團(tuán)隊(duì)成員在同能即時看到對方更改和Omniverse能夠連接和兼容多種不同3D設(shè)計(jì)軟件,可在不中斷工作流程情況下輕松切換不同軟件Nucleus存儲、管理和共享3D世界和場景,所有團(tuán)隊(duì)成員都能訪問到最新數(shù)據(jù)和場景它支持多種光線追蹤技術(shù),可在不犧牲性能情況下渲染高質(zhì)量圖像如OmniverseAudio2Face可將語音轉(zhuǎn)換為3D面部動畫的工Replicator可生成高度逼真的3D資產(chǎn)發(fā)者自定義和擴(kuò)展其能夠適應(yīng)不斷變化的需求和挑戰(zhàn)·鼎帷咨詢鼎帷咨詢[54數(shù)據(jù)中心業(yè)務(wù)涵蓋多層面TensorRT推理優(yōu)化庫英偉達(dá)數(shù)據(jù)中心平臺fngigeent數(shù)據(jù)中心業(yè)務(wù)成為公司業(yè)績飛速發(fā)展的引擎數(shù)據(jù)中心業(yè)務(wù)占英偉達(dá)23年?duì)I收的78%,主要來自云服務(wù)提供商、專用GPU到2023年底,英偉達(dá)在全球人工智能芯片的市場份額高達(dá)90%,使AMD和英單位:億美元■數(shù)據(jù)中心專業(yè)可視化汽車其■數(shù)據(jù)中心專業(yè)可視化汽車其他推理階段單次GPT-4推理所需要的算力成本約為0.05美分,按照AIPRM統(tǒng)計(jì),截至2023年12月,ChatGPT擁有約1.8億用戶,平均每月產(chǎn)生17億次網(wǎng)站瀏覽量,則平均每天訪問次數(shù)為567萬次,假設(shè)每次訪問進(jìn)行10輪推理對話,則平均每秒進(jìn)行推理次數(shù)推理階段單次GPT-4推理所需要的算力成本約為0.05美分,按照AIPRM統(tǒng)計(jì),截至2023年12月,ChatGPT擁有約1.8億用戶,平均每月產(chǎn)生17億次網(wǎng)站瀏覽量,則平均每天訪問次數(shù)為567萬次,假設(shè)每次訪問進(jìn)行10輪推理對話,則平均每秒進(jìn)行推理次數(shù)為17/30*10/3600*10^8≈157407次訓(xùn)練算力需求平均參數(shù)數(shù)量(億個,N)單Token訓(xùn)練所需運(yùn)算次數(shù)訓(xùn)練數(shù)據(jù)圖片分辨率*像素?cái)?shù)Patch量(個)-壓縮比例Patch到tokens的換算比例單次訓(xùn)練Token數(shù)量(億個)訓(xùn)練步數(shù)(steps)單次訓(xùn)練所需總算力(TFLOPS)單次訓(xùn)練所需時間(天)333按上述時間計(jì)算,每秒的訓(xùn)練算力需求A100算力值(非稀疏,TFLOPS)集群利用率(MFU)所需卡數(shù)鼎帷572,68GPU數(shù)量=總算力需求/(每個GPU每秒運(yùn)算能力×訓(xùn)練時間×有效算力比率),訓(xùn)練算力需求平均參數(shù)數(shù)量(億個,N)單Token訓(xùn)練所需運(yùn)算次數(shù)訓(xùn)練數(shù)據(jù)5億圖片+1000萬個視頻圖片分辨率*像素?cái)?shù)Patch量(個)壓縮比例Patch到tokens的換算比例單次訓(xùn)練Token數(shù)量(億個)訓(xùn)練步數(shù)(steps)單次訓(xùn)練所需總算力(TFLOPS)單次訓(xùn)練所需時間(天)按上述時間計(jì)算,每秒的訓(xùn)練算力需求A100算力值(非稀疏,TFLOPS)集群利用率(MFU)所需卡數(shù)英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)結(jié)構(gòu)包含了“CPU+GPU+DPU”三類芯片和網(wǎng)絡(luò)硬件超級計(jì)算機(jī)網(wǎng)卡低能耗成本延遲的連接提高計(jì)算網(wǎng)絡(luò)的性能場景云傳統(tǒng)以太網(wǎng)生成式AI云·以南北流量需求為主(云和用戶間流量)·東西流量需求(數(shù)據(jù)中心內(nèi)部流量)鼎帷咨詢|58根據(jù)數(shù)據(jù)中心產(chǎn)品路線圖,AI芯片布局涵蓋了訓(xùn)練和推理兩個人工智能關(guān)鍵應(yīng)用,訓(xùn)練推理融合,并側(cè)重推理,同時支持x86和Arm兩種不同硬件生態(tài),預(yù)計(jì)將于2025年發(fā)布基于Rubin架構(gòu)的R100訓(xùn)練卡和R40推理卡中里x86架構(gòu)的服務(wù)器服務(wù)器鼎帷咨詢59AlAl芯片市場云端AI芯片市場邊緣側(cè)AI芯片市場應(yīng)用“非常邊緣”(新興)客戶類型云服務(wù)商企業(yè)和國家(主權(quán)Al)電信運(yùn)營商和供應(yīng)商競爭格局英偉達(dá)布局機(jī)器人導(dǎo)航的SLAM(同時定位和映射)在這個領(lǐng)域進(jìn)行激烈的競爭打造NVIDIA邊緣AI應(yīng)用打造的卓越平臺,并通過智能工業(yè)應(yīng)用天然氣領(lǐng)域SDK提供支持,能夠加速軟件開發(fā)將超低功耗AI芯片組嵌入WAN網(wǎng)中的傳感器和其他小端節(jié)點(diǎn)中域主要由FPGA廠商、RISC-V設(shè)計(jì)和ASIC廠響主導(dǎo)客戶客戶亞馬遜微軟谷歌阿里云微軟特斯拉法國新加坡愛立信諾基亞新加坡電信布局為云服務(wù)廠商及Al超級計(jì)算機(jī)在可信電信基礎(chǔ)設(shè)施上構(gòu)建、開發(fā)和部署主權(quán)Al通過生成式AI增強(qiáng)電信運(yùn)營能力 數(shù)據(jù)中心的下游客戶涵蓋云服務(wù)提供商、私人企業(yè)、主權(quán)國家、電信企業(yè)、智能設(shè)備制造商等,其產(chǎn)品和服務(wù)被廣泛應(yīng)用于大數(shù)據(jù)分析、人工智能訓(xùn)練、處理高度敏感數(shù)據(jù)、構(gòu)建5G基礎(chǔ)設(shè)施以及邊緣計(jì)算等多個專業(yè)領(lǐng)域場歌、微軟、Meta、特斯拉分布式AI:在設(shè)備端運(yùn)行Al模型,提供要求不斷擴(kuò)大Al超級工廠互聯(lián)第一層算力單芯片算力聚構(gòu)SM數(shù)量N/AN/A第二層算力V進(jìn)化歷程:從P100搭載的NVLink—代進(jìn)化到0過光交換機(jī)、光線拓?fù)浠ヂ?lián),形成AI超級算力工廠多進(jìn)化方式:從單一機(jī)柜進(jìn)化到更多機(jī)柜,8臺機(jī)多多進(jìn)化方式:從單—SuperPOD進(jìn)化到多個多進(jìn)化歷程:2023年GTC大會提出最高支持8000個英偉達(dá)將持續(xù)布局AI工廠,通過其DGX系列AI超級計(jì)算機(jī)解決方案,引領(lǐng)人工智能發(fā)展的下一代可擴(kuò)展基礎(chǔ)設(shè)施產(chǎn)品線配置產(chǎn)品線配置(從概念到產(chǎn)品)集群技術(shù)開發(fā)合作伙伴生態(tài)布局定義AI工廠也稱為AI數(shù)據(jù)中心,是一種有別于傳統(tǒng)數(shù)據(jù)中心的新型數(shù)(從概念到產(chǎn)品)集群技術(shù)開發(fā)合作伙伴生態(tài)布局定義務(wù)器集群務(wù)器集群介紹擴(kuò)展基礎(chǔ)設(shè)施DGXSuperPOD是英偉達(dá)推出的高度集成的超級計(jì)算解決方案,允許用戶快速構(gòu)建和部署雜的Al和機(jī)器學(xué)習(xí)挑戰(zhàn)36個GB200,共72個BlackwellGPU,36個Grace■13.3TB的HBM3e顯存、30.2TB的高速內(nèi)存以及240T高速顯存通過第五代NVLink連接,采用水冷技術(shù)散熱FP4精度下提供11.5EXAFLOPS人工智整個DGX系統(tǒng)在FP4精度下算力達(dá)到1440PFLOS■靈活的拓展性,默認(rèn)DGXSuperPOD由8個DGXGB200數(shù)量的DGXGB200松部署和管理大規(guī)模的機(jī)器學(xué)習(xí)以及高性能的計(jì)算鼎帷咨詢|65數(shù)據(jù)中心業(yè)務(wù)面臨來自美國出口管制、下游客戶自研芯片、安全與隱私限制等多重因素的影響,為業(yè)務(wù)發(fā)展帶來 88■英偉達(dá)在中國的數(shù)據(jù)中心營收占比從2022年19%降至個位數(shù)正籌集5-7萬億美元來建設(shè)AI芯片等基礎(chǔ)設(shè)施私限制用例要求更加嚴(yán)格-50%21Q121Q2210321Q422Q122Q222Q322Q423Q123Q223Q323Q424Q1——微軟資本支出增速——微軟智能云營收增速一谷歌資本支出增速谷歌云營收增速一英偉達(dá)營收增速 鼎帷咨詢|66主權(quán)主權(quán)A常見落地模式英偉達(dá)主權(quán)A業(yè)務(wù)先進(jìn)AI芯片為國家和地區(qū)賦能建立“主權(quán)AI”背景數(shù)據(jù)不出境歐盟、中國等國家或地區(qū)數(shù)據(jù)監(jiān)管的重要紅線,AI主導(dǎo)權(quán)在政府手中,能有效管轄本國AI及其產(chǎn)出內(nèi)容,避免他國AI在本國獲取敏感數(shù)據(jù)定義主權(quán)AI涵蓋物理和數(shù)據(jù)基礎(chǔ)設(shè)施。后者包括自主基礎(chǔ)模型(例如大型語言模型),由本地團(tuán)隊(duì)開發(fā)并在本地?cái)?shù)據(jù)集上進(jìn)行訓(xùn)練,以促進(jìn)特定方言、文化和實(shí)踐的包容性用本國語言用本國語言模型向各國政府出售A100/H100/B100等先進(jìn)AI芯片軟件服務(wù),聯(lián)合拓展政府客戶創(chuàng)始人黃仁勛在迪拜世界政府峰會直言,每個國家都應(yīng)該建立自己的“主權(quán)Al”占比不高,但增長明顯。2024年“主權(quán)Al”業(yè)務(wù)將為英偉達(dá)帶來近100億美元營收。而在2023年,該業(yè)務(wù)收入為0尋找產(chǎn)業(yè)升級機(jī)會與國企和公共事業(yè)公司與國企和公共事業(yè)公司合作建設(shè)本國AI基礎(chǔ)設(shè)施希望借此強(qiáng)化本國云和AI能力因?yàn)橹袊菢O少數(shù)能夠?qū)崿F(xiàn)Al全產(chǎn)業(yè)鏈自主可控的國家之一中國的三大電信運(yùn)營商、各地方城市均在采購國產(chǎn)AI芯片建設(shè)智算中心出家方莫的嚴(yán)品圖美國新加玻電信Singtol力5G、66S用的健生成A平臺和AIT廠語摩述案購GH2008片建設(shè)助修算力中心,錦實(shí)工業(yè)定127個DGXH100統(tǒng)1016個H1008片,英傳達(dá)ALEnterprise軟件新類作達(dá)芯算中心,2開發(fā)意大科大植型Orade深購英偉達(dá)芯片,與TEAMIM建設(shè)西蘭02英nuoi理設(shè)主反云型數(shù)據(jù)現(xiàn)狀8月28日上午2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式華為董事、質(zhì)量流程IT2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式華為董事、質(zhì)量流程IT總裁陶景文未來方向基礎(chǔ)模型未來方向企業(yè)知識庫企業(yè)應(yīng)用場景企業(yè)知識庫企業(yè)應(yīng)用場景Al訓(xùn)練的數(shù)據(jù)鏈垂直應(yīng)用企業(yè)數(shù)據(jù)鼎帷咨詢|68和運(yùn)營商的數(shù)字化轉(zhuǎn)型將將Al能力和平臺擴(kuò)展到電信業(yè),支持電信運(yùn)營商內(nèi)部數(shù)字化轉(zhuǎn)型實(shí)施途徑實(shí)施途徑信運(yùn)營能力③推動RAN的性能(提升)和創(chuàng)新電信運(yùn)營商通信設(shè)備商鼎帷咨詢|69鼎帷咨詢|69英偉達(dá)正在積極推動公司進(jìn)軍云服務(wù)領(lǐng)域市場優(yōu)勢途徑達(dá)領(lǐng)先的GPU技術(shù),進(jìn)一步鞏固其在Al市場領(lǐng)導(dǎo)地位。NVIDIANVIDIA上是將傳統(tǒng)云服務(wù)提供商(此處為以便Nvidia能夠控制和增強(qiáng)GPU服務(wù)器,為其自己的客戶服務(wù)。,這代表著3000億美谷歌和甲骨文等主要云服務(wù)供應(yīng)商投資90億美元。通過云廠商部署英偉達(dá)云 ,銷售自己開發(fā)的Al軟件并贏得市場份額投資CoreWeave、國的中小云服務(wù)商向其傾斜分配稀缺的GPU芯片英偉達(dá)正在建立一個專注于為云計(jì)算公司和其他公司設(shè)計(jì)定制芯片的部門占領(lǐng)新的市場,英偉達(dá)持續(xù)開拓其他新興領(lǐng)域和細(xì)分賽道的收入英偉達(dá)持續(xù)開拓其他新興領(lǐng)域和細(xì)分賽道的收入ASIC芯片的訓(xùn)練和推理效率約為GPU的10倍和100倍,市場規(guī)模有望逐步提升優(yōu)勢專用的云定制芯片減少客戶自研芯片帶來的替代壓力,本化、定制化提前做好準(zhǔn)備途徑籌建為云計(jì)算公司務(wù)部門已接觸亞馬遜、心定制芯片業(yè)務(wù)定制芯片市場億(美元)算力成本高景背功耗(W)1云云邊緣側(cè)端鼎帷咨詢[71在云計(jì)算領(lǐng)域,英偉達(dá)積極布局下一代量子計(jì)算技術(shù),利用技術(shù)研發(fā)能力的優(yōu)勢押寶顛覆性技術(shù),通過建立合作伙伴生態(tài)、與大學(xué)展開合作等方式參與下一代云計(jì)算領(lǐng)域的競爭先進(jìn)工業(yè)科學(xué)技術(shù)研究所建造的ABCI-Q超級計(jì)算機(jī),這臺超級計(jì)算機(jī)配備超過2000顆NvidiaH100TensorCore.GPU,通過英偉達(dá)Quantum-2InfiniBand互聯(lián)一個全球獨(dú)一無二、完全可Q平臺理器(QPU)上直接執(zhí)行混合代碼,并通過cuQuantum加速模擬后個量子計(jì)算框架中的15個進(jìn)行合作,包括多倫多大學(xué)Classi實(shí)現(xiàn)NIST正在標(biāo)準(zhǔn)化的KyberPQC算法,使其在單個H100GPU上運(yùn)行速度比傳統(tǒng)CPU實(shí)現(xiàn)提高約500倍競爭格局為實(shí)現(xiàn)規(guī)?;瘮U(kuò)展,成本隱私低時延隱私低時延可靠性高效使用終端側(cè)中心云邊端云Al處理正在向邊緣發(fā)展英偉達(dá)發(fā)布邊緣人工智能堆棧應(yīng)用程序框架保健翻譯KioskAI管理和編排為邊緣系統(tǒng)設(shè)計(jì)的英偉達(dá)保障2023年底全球5G基站將突破480萬個,650Group的Weckle預(yù)計(jì)電信定制芯片市場每年約為40億至50億美元。邊緣計(jì)算包括提供者邊緣、企業(yè)邊緣、工業(yè)邊緣、嵌入式邊緣四大類型,憑借其低時延、減少通信依賴和增強(qiáng)數(shù)據(jù)安全性等優(yōu)勢,在多樣化應(yīng)用場景中迅速發(fā)展邊端計(jì)算:新興行業(yè)趨勢全性和客戶降低優(yōu)勢存儲成本,數(shù)據(jù)隱私權(quán),保護(hù)隱提供者邊緣企業(yè)邊緣工業(yè)邊緣嵌入式邊緣邊端計(jì)算豐富的應(yīng)用場景應(yīng)用場景云游戲等D8位置響應(yīng)時問帶求e種云計(jì)算8運(yùn)輸流造業(yè)■數(shù)字標(biāo)牌■倉庫自主移動機(jī)器人■感知機(jī)器人■材料處理零售城市■購物者分析■社交距離檢測■交通分析及車輛計(jì)數(shù)■監(jiān)控與公共安全■手術(shù)機(jī)器人■醫(yī)療影像助理■病人健康監(jiān)測智能農(nóng)場機(jī)器鼎帷咨詢74介紹硬介紹硬件翼品的生態(tài)系統(tǒng)以加速軟件開發(fā)優(yōu)勢優(yōu)勢產(chǎn)品產(chǎn)品45mm×70mm45mm×70mm應(yīng)用案例應(yīng)用案例能自助服務(wù)終端、傳感器融合、生成式Al...JetsonJetson軟硬件的未來發(fā)展方向JetsonThor將夠執(zhí)行更復(fù)雜的任務(wù)并安全、自然地與人和機(jī)有針對性能、功耗和尺寸優(yōu)化的模塊化架構(gòu)。已發(fā)布軟JetPack6將通過微服務(wù)和一系列新功能進(jìn)一步擴(kuò)展Jetson平臺的靈活件性和可擴(kuò)展性,可快速集成到工作流程中。已放布開發(fā)中口計(jì)劃中99計(jì)算堆棧更新即將發(fā)布即將發(fā)布產(chǎn)品發(fā)布·計(jì)算堆棧更新產(chǎn)品發(fā)布鼎帷咨詢|76定義功能作用端到端的云原生軟件平臺,旨在簡化企業(yè)在構(gòu)建AlFactory或AI卓越中心時的開發(fā)、訓(xùn)練和推理工作加速數(shù)據(jù)科學(xué)管道,并簡化生產(chǎn)級人工智能的開發(fā)和部署整個AI工作流程基礎(chǔ)設(shè)施管理和BaseCommandManager能夠處理安全掃描和CVE跟蹤,確保部署的安全性整合了RAPIDS庫、DALI工具、TensorRT和Triton推理服務(wù)器等提供微服務(wù)以增強(qiáng)這些開源工具的易用性和可靠性提供豐富的示例工作流程,幫助企業(yè)快速啟動和調(diào)整Al項(xiàng)目提供企業(yè)支持、安全性保證和服務(wù)水平協(xié)議,確保項(xiàng)目的穩(wěn)定性和安全性使開發(fā)人員能夠?qū)W⒂跇?gòu)建和部署新的人工智能服務(wù)合作對象對象對象內(nèi)容內(nèi)容云廠商的大型團(tuán)隊(duì)并提供CUDA生態(tài)每個GPU收取4500美元分支生產(chǎn)分支確保API穩(wěn)定性和定期安全更新適用發(fā)布需要穩(wěn)定性、在生產(chǎn)中部每6月一次署人工智能周期9個月樹頂端軟件更新每月發(fā)布/功能分支最新開發(fā)環(huán)樹頂端軟件更新每月發(fā)布/功能分支長期支持分支/高度監(jiān)管每2.5年長期支持分支/學(xué)習(xí)的NVIDIATAOToolkit,運(yùn)用在訓(xùn)練及推理中的PyTorch和TensorFlow等等,并且這一切的工具、SDK及框架,NVIDIA都針對企業(yè)環(huán)境及了專門的優(yōu)化,確保了更高的訓(xùn)練和推理精度,幫助任何想使用Al的企業(yè)進(jìn)行RecognitionAutomationAlAnalyticsr好地在例如kubernetes或容器的環(huán)境中,更好掛載及使用GPU及底層網(wǎng)絡(luò),基于虛擬化和容器化的底座,包括Vmware、RedHat以及Kubernetes.標(biāo)準(zhǔn)接口視頻、3D、生物NCCL、后處理解碼器cuBLAS、cuDNN、戰(zhàn)斗內(nèi)批處理內(nèi)存優(yōu)化、FP8量化單GPU、多GPU、多節(jié)點(diǎn)模型權(quán)重模型權(quán)重機(jī)密管理概念的服務(wù)。每個服務(wù)獨(dú)立運(yùn)行,并通過網(wǎng)絡(luò)接口進(jìn)行通信的架構(gòu)模式稱架構(gòu)優(yōu)點(diǎn)核心優(yōu)勢NIM專為可移植性和可控性而構(gòu)建,可以使得算法模型的部著與調(diào)用支持跨各種基礎(chǔ)設(shè)施。使用行業(yè)標(biāo)準(zhǔn)API與優(yōu)化的推理引擎的推理引擎,在加速基礎(chǔ)設(shè)施上提供盡可能的要求,NIM的底層集成了眾多獲取來自NVIDIA和社區(qū)的優(yōu)化推理引擎,包括TensorRT、隨時隨地部署算法模型推理服務(wù)鼎帷咨詢|79智能駕駛層級軟件應(yīng)用智能駕駛層級軟件應(yīng)用32個·主動巡航控制·車道偏離警告系統(tǒng)·32個·主動巡航控制·車道偏離警告系統(tǒng)·車道保持輔助個·傳感器融合·高速無人駕駛輔助求·自動緊急制動·駕駛員監(jiān)控·交通堵塞輔助個個·立體攝像機(jī)1個-Ubolo1個感器6個個個硬件需求英偉達(dá)近四代汽車芯片算力性能最新款1000TOPS,支持400Gbs網(wǎng)絡(luò)和安全網(wǎng)關(guān)··英偉達(dá)Xavier只有1.3TFlops,還達(dá)不到處理L5的數(shù)據(jù)能力是英偉達(dá)高算力新能芯片0鼎帷咨詢|80英偉達(dá)的汽車業(yè)務(wù)持續(xù)增長,涵蓋了從硬件到軟件的全面解決方案,廣泛與行業(yè)伙伴合作推動智能駕駛技術(shù)發(fā)展汽車業(yè)務(wù)近五年收入情況(百萬美元)700特斯拉自研業(yè)務(wù)涵蓋了基礎(chǔ)硬件軟件轉(zhuǎn)向端到端解決方案業(yè)務(wù)涵蓋了基礎(chǔ)硬件軟件轉(zhuǎn)向端到端解決方案Hyperion用于感知的深度神經(jīng)網(wǎng)絡(luò)仿真模擬平臺生成數(shù)據(jù)集/驗(yàn)證自動駕駛堆棧9◎組成部分合作伙伴1模擬平臺總覽AI工廠鼎帷咨詢|81合作伙伴從2015年開始,英偉達(dá)開始涉足自動駕駛業(yè)務(wù),DriveThor是當(dāng)前汽車業(yè)務(wù)的最新一代芯片,并陸續(xù)與與特斯合作伙伴拉、奔馳、理想和比亞迪等企業(yè)在自動駕駛領(lǐng)域進(jìn)行深度合作駕駛特斯拉PX2芯片奔馳達(dá)從“供應(yīng)商”轉(zhuǎn)變?yōu)椤俺邪獭盭avier平臺蔚來理想/BYD長城/極氮/英偉達(dá)持續(xù)迭代自動駕駛芯片架構(gòu),工藝制程和芯片構(gòu)成,以滿足自動駕駛技術(shù)算力持續(xù)增長的需求芯片產(chǎn)品發(fā)布時間2018年Xavier工藝制程芯片構(gòu)成2個TegraX12個TegraX22個PascalMWMGPU1個Volta2個Volta2個Turing2個AmpereDRIVEThor在核心參數(shù)及制造工藝等方面具有顯著優(yōu)勢,廣泛吸引主機(jī)廠客戶基于Thor構(gòu)建未來汽車產(chǎn)品內(nèi)容170億770億 ●整合數(shù)字儀表盤、信息娛樂泊車、基于Thor構(gòu)建基于Thor打造車,實(shí)現(xiàn)L4級其他主機(jī)廠和智能駕駛解決方案公司也在持續(xù)布局車規(guī)級芯片,英偉達(dá)在市場競爭中仍憑借其算力優(yōu)勢占有一席特特ModelS/X/Y特斯拉作為主要競爭對手,新版FSD已實(shí)現(xiàn)端到端大模型落地,海量數(shù)據(jù)對于系統(tǒng)優(yōu)2EyeQ系列芯片在出貨量上具有優(yōu)勢,累計(jì)超過6000萬片,但其產(chǎn)品更新速度較慢,算力水平相對較低,預(yù)期通過Ultra鞏固市問界華為智駕全棧程度高,涵蓋芯片、算法及各地地線線5地平線憑借高出貨量大幅提升了市場占有率,J6P早于英偉達(dá)DRIVEThor實(shí)現(xiàn)量產(chǎn),先發(fā)制人搶占高算力市場份額汽車制造商傾向于自主研發(fā)智能駕駛芯片以解決英偉達(dá)智駕芯片的頻繁變化和高昂成本以及國際政治經(jīng)濟(jì)關(guān)系的波動性,這為英偉達(dá)汽車業(yè)務(wù)的發(fā)展帶來了潛在的風(fēng)險與挑戰(zhàn)下一代智駕芯片頻繁變化的不確定性高昂芯片價格及市場競爭白熱化的不確定性改變(Orin后續(xù))(更高算力級別)2000TOPS改變組成的2000TOPS算力組成的2000TOPS算力與數(shù)據(jù)中心芯片相同國際關(guān)系變化的不確定性國際關(guān)系變化的不確定性資金的車企)檻較低)蔚來已經(jīng)明確表示將會自研智駕芯片,NX9031 類型主廠機(jī)汽車供應(yīng)商軟件供應(yīng)商合作商比亞迪特斯拉小鵬汽車、極越汽車.廣汽、奇瑞汽車知行富士康聯(lián)發(fā)科合作類型從汽車拓展到云端購買GPU用于訓(xùn)練搭載NVIDIADRIVE多環(huán)節(jié)合作基于DRIVEThor提供不同的L4級解決方案的電子控制單元合作內(nèi)容在其車輛中提供云端游戲平臺結(jié)合NVIDIADRIVE平臺作為其下一代電動汽車的“人工智能大腦”搭載英偉達(dá)Al和圖形計(jì)算IP,共同為軟件定義汽車提供完整的AI智能座艙方案鼎帷咨詢|86使用像素渲染,毫米波雷達(dá)和激光雷達(dá)進(jìn)行數(shù)據(jù)訓(xùn)練和實(shí)時算法驗(yàn)證使用像素渲染,毫米波雷達(dá)和激光雷達(dá)進(jìn)行數(shù)據(jù)訓(xùn)練和實(shí)時算法驗(yàn)證①①自動駕駛汽車1.0時代基于標(biāo)注圖像的訓(xùn)練,并在上面開發(fā)和部署深度神經(jīng)網(wǎng)絡(luò)的集成,會有40-50個深度神經(jīng)網(wǎng)絡(luò)從L2+層級轉(zhuǎn)向更高級的自動駕駛基于標(biāo)注圖像的訓(xùn)練,并在上面開發(fā)和部署深度神經(jīng)網(wǎng)絡(luò)的集成,會有40-50個深度神經(jīng)網(wǎng)絡(luò)從L2+層級轉(zhuǎn)向更高級的自動駕駛工廠的工作流程優(yōu)化實(shí)際案例22自動駕駛汽車2.0時代基于視頻進(jìn)行模型的訓(xùn)練,是融蛤世界的統(tǒng)一模型其規(guī)模將增長13倍,數(shù)據(jù)存儲規(guī)模將增長17倍。以GPT4作為基礎(chǔ)的話這可能需要上萬的服務(wù)器節(jié)點(diǎn),即達(dá)到超算水平臺四大智能駕駛平臺四大智能駕駛平臺完整的工作流平臺,可用于數(shù)據(jù)的提取、管護(hù)、標(biāo)記·可在開放的硬件在環(huán)平臺上實(shí)現(xiàn)基于物理性質(zhì)的仿真,從而在上路之前對自動駕駛汽車進(jìn)行測試和驗(yàn)證具備可擴(kuò)展和軟件定義特性,提供先進(jìn)的性能,助力自動駕駛汽車處理大量傳感器數(shù)據(jù),并做出實(shí)時駕駛決策。的一系列智能服務(wù)AVSDK的AI輔助駕駛平臺,可以實(shí)現(xiàn)點(diǎn)到點(diǎn)駕駛用于設(shè)計(jì)自動駕駛汽車的完整開發(fā)平臺及參考架構(gòu),套件,加速開發(fā)、測試和驗(yàn)證·適用于自動駕駛的完整軟件?!o線更新駕駛員監(jiān)控和可視化功能·能夠?yàn)樯疃壬窠?jīng)網(wǎng)絡(luò)模型的大規(guī)模訓(xùn)練與優(yōu)化提供所需的計(jì)算能力②③①④·讓客戶快速搭建、驗(yàn)證、部署L2自動駕駛技術(shù),包英偉達(dá)構(gòu)建從數(shù)據(jù)采集到驗(yàn)證、感知到規(guī)控、需求到交付的端到端自動
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 北京市石景山區(qū)2025-2026學(xué)年高三上學(xué)期期末考試物理試卷(含答案)
- 五年級數(shù)學(xué)試卷及答案
- 部編版六年級語文上冊期末測試卷4(附參考答案)
- 廣東省揭陽市普寧市2025-2026學(xué)年七年級上學(xué)期1月期末歷史試題(原卷版+解析版)
- 辯論賽培訓(xùn)教學(xué)
- 電氣故障診斷技術(shù)要領(lǐng)
- 雅安名山太平110kV輸變電工程建設(shè)項(xiàng)目環(huán)境影響報告表
- 2025 小學(xué)三年級科學(xué)下冊植物葉片脈絡(luò)觀察記錄課件
- 輸血反應(yīng)考試題及答案
- 神經(jīng)科入科考試題及答案
- DB5203∕T 38-2023 特色酒莊旅游服務(wù)等級劃分與評定
- 四川省成都市嘉祥外國語學(xué)校2024-2025學(xué)年七年級數(shù)學(xué)第一學(xué)期期末學(xué)業(yè)質(zhì)量監(jiān)測試題含解析
- 華為客戶分級管理制度
- 雙向轉(zhuǎn)診職責(zé)與患者體驗(yàn)提升
- 2025年中考道德與法治三輪沖刺:主觀題常用答題術(shù)語速查寶典
- 2025屆北京豐臺區(qū)高三二模高考語文試卷試題(含答案詳解)
- 《四川省普通國省道養(yǎng)護(hù)預(yù)算編制辦法》及配套定額解讀2025
- 論語的測試題及答案
- 《機(jī)械制圖(第五版)》 課件 第9章 裝配圖
- 教師年薪合同協(xié)議
- 旅游情景英語(第二版)Unit 6-1學(xué)習(xí)資料
評論
0/150
提交評論