版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
E-mail:lixingjie@yongxiE-mail:xiamingda@yong20% 8% -4%-16%-28%-40%計算機滬深30011/2301/2403/2406/2408/2410/24資料來源:Wind,甬興證券研究所球范圍內掀起了有史以來規(guī)模最大人工智能浪潮,2023年以來海外平,其中Hunyuan-Turbo-Preview、AndesGPT-2.0、S表現(xiàn)領先。由于大模型性能表現(xiàn)顯著優(yōu)于小模型,同時模型參數(shù)量提升為重要技術路線之一,我們認為“大”算力剛需屬性凸顯。短期看,訓/推兩端算力需求或隨模型參數(shù)量、要求訓練效率、用戶使用頻率等關鍵指標同步提升,假設模型平均參數(shù)量保持1000億個不再增長,當大模型數(shù)量達到10個,平均訓練token時,訓練端峰值算力需求或將達3472Pflops-day,推理端最大并發(fā)峰持續(xù)增長,AI需求保持強勁。24Q2北美四大CPS資本開支總計解決通用大模型的垂直化適配問題,GCI解決方法源,計算規(guī)?;驅⑻嵘?,帶動算力需求同步提升。GPU因并行計算架構帶來強大計算效率,適配大模型計算需求。據(jù)內高端AI芯片領域的前沿力量。據(jù)華東師范大學,F(xiàn)P16精度下,我們認為,受益于大模型的蓬勃發(fā)展,算力需求正處于高增階段。AI芯片作為重要算力底座,在自主可控的背景下景氣度有望提升,重點關注華為昇騰鏈相關環(huán)節(jié)投資機會,以及海光信息、寒武紀等算力鏈投資機會行業(yè)競爭加劇風險、商業(yè)化進度不及預期風險、技術路線調整風險 3 3 5 7 11 17 17 3 4 5 5 5 5 6 6 7 7 8 8 9 10 12 13 13 13 14 15 15 15 16 7 8 9 17大模型,通向人工智能的基座模型。據(jù)《中國人工智能系列白皮書》(中國人工智能學會,2023.9本次大模型熱潮主要由語言大模型(亦稱為大語言模型)引領,大模型通過在海量無標注數(shù)據(jù)上進行大規(guī)模預訓練,能夠學習到大量的語言知識與世界知識,并且通過指令微調、人類對齊等關鍵技術,擁有面向多任務的通用求解能力。據(jù)《大模型關鍵技術與未來絡結構,能學習并理解更多的特征和模式,從而在處理復雜任務時展現(xiàn)出較強的自然語言理解、意圖識別、推理、上下文建模、語言生成以及通用問題求解能力,已成為AI領域的重要基礎設施。球范圍內掀起了有史以來規(guī)模最大人工智能浪潮,國內外大模型更新迭代層出不窮,我們梳理在此過程中大模型發(fā)展經(jīng)歷三個階段:1:起步期(2022年底~ChatGPT發(fā)布后國Meta開源Llama2等;國內大模文心一言1.0、阿里云發(fā)布通義千問、清華開源ChatGLM、百川智能開源3:爆發(fā)期(2024年~至今各類大模型加速問世,開源模型崛起豐在部分通用能力上與國際領跑者差距已縮小至2%以內。從國內格局看,對比國內外頭部模型長文本能力,我們認為國內大模型具備競爭優(yōu)勢,據(jù)Superclue數(shù)據(jù),在32K,64K,128K文本能力測試中,國內大模型XVERSE-13B-LONGCONTEXT(元象科技對GPT4-Turbo-0125(OpenAI)領先。我們認為,長文本能力是具有產(chǎn)業(yè)落地意義的核心能力,有助于國內大模型的場景應用開拓。w64K文本得分 w64K文本得分 123456789Anthropic資料來源:SuperClue,甬興證券研究所資料來源:SuperClue,甬興證券研究所大模型性能顯著優(yōu)于小模型,指引發(fā)展方向。據(jù)《ScalingLawsfor率(sampleefficiency)更高,若要求達到相同效果,則大模型僅需更少的數(shù)據(jù)量(tokensprocessed)以及訓練步驟(estimatedsmin有助于降低整體模型復雜度,提高運行速度。另外一方面,相同條件下大模型輸出效果同數(shù)量的tokens并給予同等訓練步驟,則大模型訓練訓資料來源:《ScalingLawsforNeuralLanguageModels》(OpenAI,2020甬興證券研究所資料來源:《ScalingLawsforNeuralLanguageModels》(OpenAI,2020甬興證券研究所研究所大模型參數(shù)量提升為重要技術路線之一,計算資源剛需《中國人工智能系列白皮書》,預訓練語言模型的研發(fā)過程中遵循經(jīng)驗法則——擴展定律(ScalingLaw即模型能力與任務效果將會隨模型參數(shù)規(guī)模和預訓練數(shù)據(jù)規(guī)模的增加,而不斷改善;OpenAI亦證明了模型參數(shù)億參數(shù))三個不同參數(shù)規(guī)模的模型,GPT-3在沒有微調的情況下,可以僅通過In-contextlearning(上下文學習)完成多種任務,甚至在某些任務上超過當時最好的專用模型。大算力滿足人工智能高并發(fā)、高彈性、高精度的計算需求,在訓練和推理過程中,能夠提升效率和準確度;高性能的計算能力為機器學習、深度學習和自然語言處理等人工智能技術的發(fā)展提供了有力的支持,通過實現(xiàn)復究所1.3.模型擴容+下游CapEx增長+垂類模型落地,推動算力需短期看,AI大模型在訓練/推理端均產(chǎn)生海量算力需求,且需求量將大模型所需的算力分為訓練端+推理端。據(jù)澎湃新聞,訓練是一個計算密集型的學習過程,通過訓練可提升模型的精準度,如果計算結果沒有達到預期,就需要調整參數(shù)重新訓練,直到達到預期。一旦模型精準度達到一定水準后,則進入推理階段。推理是一個判斷過程,基于訓練好的模平均訓練tokens數(shù)達到7000個時,訓練端峰值算力需求或將達資料來源:《ScalingLawsforNeuralLanguageModels》(OpenAI,2020甬興證券研究所資料來源:《ScalingLawsforNeuralLanguageModels》(OpenAI,2020甬興證券研究所模型參數(shù)模型平均參數(shù)量(億個,N)單模型單Token所需訓練成本:6N52222所測算JohnsHopkinsUniversity,OpenAI,2020大模型前向推理公式為Cforward=2N+2nlayernctxdattn,其中N為模型參數(shù)量,nlayer為模型層數(shù),nctx為上下文長度(ScalingLaws默認上下文長度1024dattn為注意力輸出維度量級相比兩倍模型參數(shù)2N仍較小,因此推理算力可近似為C=2NBS。如能力要求及時響應,因此推理算力一般以秒為單位來衡量(Pflops-s最后通過調節(jié)最大并發(fā)峰值算力乘數(shù),給與一定程度冗余保障峰值流量(參時,最大并發(fā)峰值算力需求將達到23148/115741/46資料來源:《ScalingLawsforNeuralLanguageModels》=推理端每秒峰值算力需求*最大并發(fā)峰值算力乘數(shù)資料來源:《ScalingLawsforNeuralLanguageModels》(OpenAI,2020甬興證券研究所模型參數(shù)模型平均參數(shù)量(億個,N)單模型單Token所需推理成本:2N服務次數(shù)555555554444所以微軟為例,其數(shù)據(jù)中心方面投資大部分投向AI基礎設施建設以滿足云需求。我們認為,云計算是大模型最重要的基礎設施和平臺之一,頭部CSP大廠資本開支對于AI算力行業(yè)景氣度前瞻意義明顯:北美四大云計大CPS資本開支總計516.3億美元,同比+59.0%,其中,微軟/谷歌/Amazon/Meta資本開支分別達138.7/131.9/163.9/81.7億美元,分別同比+55.1%/91.4%/57.4%/31.5%。谷歌Amazon資料來源:Wind,甬興證券研究所長期看,行業(yè)/垂類模型發(fā)展將帶動算力需求再上臺階。行業(yè)模型/垂類模型是AI+落地最后一公里,據(jù)騰訊研究院,通用大模型具備豐富的知識和強大的泛化能力可賦能垂直行業(yè)應用,當前部分行業(yè)大模型,大多已應用在金融、法律、教育、傳媒、文旅等領域。資料來源:騰訊研究院,甬興證券研究所為解決通用大模型的垂直化適配問題,計算規(guī)?;驅⑻嵘?,需求同步提升。據(jù)《MoreThanCatastrophicForgett大模型在針對特定領域認為進行微調后,由于模型最近的學習掩蓋并削弱了其先前的獲得的知識,可能導致一般任務性能有所下降,即“災難性遺),步長內整合領域知識,來為用戶詢問提供答復,有效協(xié)調通用模型和領域模型的知識,在這一過程中,調用知識資源或將耗用更多計算能力,帶動圖14:領域數(shù)據(jù)注入通用大模型后可能引起“災難性遺忘”速器/計算卡,是專門用于處理人工智能應用中的相關計GPU算力強大的原因源于其并行計算能力(parallelcomputingGPU基于將復雜問題拆解成為數(shù)千個乃至數(shù)百萬個單獨任務的設計思路,通過資料來源:NVIDIA官網(wǎng),甬興證券研究所其通用性計算能力強的特征,滿足大型AI運營商的訓/推、運營與調度需ASIC,1.0%FPGA,0.4%NPU,NPU,9.6%GPU,89.0%資料來源:IDC,中商產(chǎn)業(yè)研究院,甬興證券研究所現(xiàn)場可編程邏輯門陣列(FPGA)是一種帶有可編程硬件架構的集成電路。FPGA內部電路旨在實現(xiàn)多種功能,可根據(jù)需要重新編程以執(zhí)行這些功能。因此,就靈活性和快速面市而言,F(xiàn)PGA通常是較好選擇,因為隨著新功能的成熟,固化集成電路設計會更加經(jīng)濟和節(jié)能。專用集成電路(ASIC)專門針對特定功能而打造和批量生產(chǎn)。我們認為,ASIC相對高性能低消耗、可以基于多個人工智算法進行定制的特點,有望在AI成熟度提升后全球GPU市場規(guī)模(十億美元)30025020050020242029E資料來源:Statista,甬興證券研究所NvidiaAMD其他90807060504030201023Q123Q223Q323Q424Q1資料來源:JPR,甬興證券研究所我們認為,優(yōu)秀的架構設計是英偉達GPU芯片性能不斷提升的底層包括一個新的TransformerEngine,可以在不損失準確性的前提下將這些網(wǎng)絡的速度提高6倍,Transformer模型訓練時間從數(shù)周縮短至數(shù)天;H100的大規(guī)模訓練性能是A100的9倍,大型語言模型推理吞吐量是資料來源:Nvidia官網(wǎng),甬興證券研究所能。據(jù)百度開發(fā)者中心,CUDA(ComputeUnifiedDeviceArchitect英偉達公司開發(fā)的一種并行計算平臺和編程模型,它允許開發(fā)者使用階段,CUDA同樣發(fā)揮著關鍵作用,通過利用GPU的并行計算能力,CUDA可以加速模型的推理速度,提高實時性能。在處理海量數(shù)據(jù)時,資料來源:英偉達官網(wǎng),甬興證券研究所性技術,可支持多達10萬億參數(shù)的模型進行AI訓練和實時大語言模型2:第二代Transformer引擎:結合BlackwellTensorCore技術和Blackwell將通過新的4位浮點AI支持雙倍的計算和模型大小推理能力;3:第五代NVLink:為提高數(shù)萬億參數(shù)和混合專家AI模型的性能,于AI的預防性維護進行診斷和預測可靠性問題。這可以最大限度地延長5:安全人工智能:先進的機密計算功能可在不影響性能的情況下保護AI模型和客戶數(shù)據(jù),并支持新的本機接口加密協(xié)議,進一步增強了芯6:解壓縮引擎:專用解壓縮引擎支持最新格式,加快數(shù)據(jù)庫查詢,提供數(shù)據(jù)分析和數(shù)據(jù)科學的最高性能。資料來源:toms’Hardware,Nvidia,甬興證券研究所資料來源:toms’Hardware,Nvidia,甬興證券研究所資料來源:toms’Hardware,Nvidia,甬興證券研究所部工業(yè)和安全局(BIS)發(fā)布了一系列出口管制規(guī)則,更新了對先進計算集成電路、半導體制造設備以及支持超級計算應用和最終用途的物項向包括中國在內的武器禁運國家的出口管制措施,并將中國的部分實體列入了資料來源:BIS,甬興證券研究所據(jù)IT之家,徐直軍介紹稱,華為昇騰910采用自研達芬源計算框架MindSpore配合,可創(chuàng)新編程范式,AI科學用,便于開放式創(chuàng)新,最大化利用芯片算力。據(jù)華東師范大學研究NVIDIAA10019.5TFLOPS156TFLOPS(TC)312TFLOPS624TFLOPS(稀疏)512TFLOPS80GB4.0TB/s沐曦MXC50030/36TFLOPS240/280TFLOPS480/560TFLOPS64GB1.87TB/s華為910B81TFLOPS313TFLOPS512TFLOPS64GB1.6TB/s海光Z100L10.1TFLOPS20.2TFLOPS40.5TFLOPS32GB1TB/s寒武紀MLU370-X824TFLOPS96TFLOPS256TFLOPS48GB0.6TB/s資料來源:華東師范大學,寒武紀官網(wǎng),甬興證券研究所我們認為,受益于大模型的蓬勃發(fā)展,算力需求正處于高增階段。AI芯片作為重要算力底座,在自主可控的背景下景氣度有望提升,重點關注1、行業(yè)競爭加劇風險:行業(yè)景氣度高,可能吸引較多新進入者,產(chǎn)2、商業(yè)化進度不及預期風險:若算力行業(yè)應用端落地進度不及預期,3、技術路線調整風險:若前沿技術快速迭代,可能造成技術路線的請務必閱讀報告正文后各項聲明本報告署名分析師具有中國證券業(yè)協(xié)會授予的證券投資咨詢執(zhí)業(yè)資格并注冊為證券分析師,以勤勉盡責的職業(yè)態(tài)度,專業(yè)審慎的研究方法,獨立、客觀地出具本報告,保證報告采用的信息均來自合規(guī)渠道,并對本報告的內容和觀點負責。負責準備以及撰寫本報告的所有研究人員在此保證,本報告所發(fā)表的任何觀點均清晰、準確、如實地反映了研究人員的觀點和結論,并不受任何第三方的授意或影響。此外,所有研究人員薪酬的任何部分不曾、不與、也將不會與本報告中的具體推薦意見或觀點直接或間接相關。甬興證券有限公司經(jīng)中國證券監(jiān)督管理委員會核準,取得證券投資咨詢業(yè)務許可,具備證券投資咨詢業(yè)務資格。股票投資評級:分析師給出下列評級中的其中一項代表其根據(jù)公司基本面及(或)估值預期以報告日起6個月內公司股價相對于同期市場基準指數(shù)表現(xiàn)的看法。買入股價表現(xiàn)將強于基準指數(shù)20%以上增持股價表現(xiàn)將強于基準指數(shù)5-20%中性股價表現(xiàn)將介于基準指數(shù)±5%之間減持股價表現(xiàn)將弱于基準指數(shù)5%以上行業(yè)投資評級:分析師給出下列評級中的其中一項代表其根據(jù)行業(yè)歷史基本面及(或)估值對所研究行業(yè)以報告日起12個月內的基本面和行業(yè)指數(shù)相對于同期市場基準指數(shù)表現(xiàn)的看法。增持行業(yè)基本面看好,相對表現(xiàn)優(yōu)于同期基準指數(shù)行業(yè)基本面穩(wěn)定,相對表現(xiàn)與同期基準指數(shù)持平減持行業(yè)基本面看淡,相對表現(xiàn)弱于同期基準指數(shù)相關證券市場基準指數(shù)說明:A股市場以滬深300指數(shù)為基準;港股市場以恒生指數(shù)為基準;新三板市場以三板成指(針對協(xié)議轉讓標的)或三板做市指數(shù)(針對做市轉讓標的)為基準指數(shù)。投資評級說明:不同證券研究機構采用不同的評級術語及評級標準,投資者應區(qū)分不同機構在相同評級名稱下的定義差異。本評級體系采用的是相對評級體系。投資者買賣證券的決定取決于個人的實際情況。投資者應閱讀整篇報告,以獲取比較完整的觀點與信息,投資者不應以分析師的投資評級取代個人的分析與判斷。在法律許可的情況下,甬興證券有限公司(以下簡稱“本公司”)或其關聯(lián)機構可能會持有報告中涉及的公司所發(fā)行的證券或期權并進行交易,也可能為這些公司提供或爭取提供投資銀行、財務顧問以及金融產(chǎn)品等各種服務。因此,投資者應當考慮到本公司或其相關人員可能存在影響本報告觀點客觀性的潛在利益沖突,投資者請勿將本報告視為投資或其他決定的唯一參考依據(jù)。也不應當認為本報告可以取代自己的判斷。本報告版權歸屬于本公司所有,屬于非公開資料。本公司對本報告保留一切權利。未經(jīng)本公司事先書面許可,任何機構或個人不得以任何形式翻版、復制、轉載、刊登和引用本報告中的任何內容。否則由此造成的一切不良后果及法律責任由
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年服裝設計(時尚服裝設計)試題及答案
- 2026年美甲設計(漸變案例)試題及答案
- 2025年中職園林技術(綠化工程施工)試題及答案
- 2025年大學藥物制劑(藥物制劑理論)試題及答案
- 2025年高職電工電子技術(電路故障排查)試題及答案
- 2025年大學農(nóng)業(yè)(農(nóng)業(yè)生態(tài)學)試題及答案
- 2026年寫字樓物業(yè)(辦公設施維護)試題及答案
- 中央醫(yī)院科普大賽
- 送女朋友的520祝福語參考
- 近十年北京中考數(shù)學試題及答案2025
- 北京通州產(chǎn)業(yè)服務有限公司招聘參考題庫必考題
- 催收管理制度及流程規(guī)范
- 交通安全志愿者培訓課件
- 化工防止靜電安全培訓課件
- AI藥物研發(fā)中的倫理風險防控
- 2025年江蘇省泰州市保安員理論考試題庫及答案(完整)
- 公司酶制劑發(fā)酵工工藝技術規(guī)程
- JC∕T 940-2022 玻璃纖維增強水泥(GRC)裝飾制品
- 《兒科護理學》課件-兒童健康評估特點
- 廣東省深圳市南山區(qū)2023-2024學年六年級上學期期末科學試卷
- 臨床研究數(shù)據(jù)清洗與質量控制
評論
0/150
提交評論