人工智能行業(yè)2026年度中國AI從百舸爭流到自成畦徑_第1頁
人工智能行業(yè)2026年度中國AI從百舸爭流到自成畦徑_第2頁
人工智能行業(yè)2026年度中國AI從百舸爭流到自成畦徑_第3頁
人工智能行業(yè)2026年度中國AI從百舸爭流到自成畦徑_第4頁
人工智能行業(yè)2026年度中國AI從百舸爭流到自成畦徑_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

證券研究報

告從百舸爭流到自成畦徑——2026年中國AI投資策略主要內(nèi)容算力:國產(chǎn)架構(gòu)元年模型:性能差距拐點應(yīng)用:商業(yè)化突破10%重點標(biāo)的與估值3108.2139.9273.5190.629%96%110%0%20%40%60%80%100%120%0.050.0100.0150.0200.0250.0300.02022A2023A 2024A國內(nèi)AI芯片出貨量(萬片)2025H1yoy86%85%70%62%10%9%24%17%1%

0%

1%3%100%90%80%70%60%50%40%30%20%10%0%2025H12023A寒武紀(jì)2022A英偉達(dá) 華為平頭哥天數(shù)智芯 燧原科技2024A昆侖芯 海光沐曦股份 摩爾線程40

AI芯片,需求放量,國產(chǎn)加速迭代國內(nèi)自2024H2進(jìn)入算力需求爆發(fā)期,AI芯片出貨量高增2025H1,國內(nèi)AI芯片出貨量191萬片,yoy+110%外部環(huán)境下,國產(chǎn)化趨勢明確,份額快速提升2025H1,國產(chǎn)芯片市場份額約38%,2023年僅為15%,2年實現(xiàn)翻倍以上增長國內(nèi)AI芯片格局明晰,華為、寒武紀(jì)、海光+大廠ASIC凸顯趨勢一:出貨高增,訓(xùn)推雙驅(qū)動趨勢二:國產(chǎn)份額快速提升IDC(國際數(shù)據(jù)公司),申萬宏源研究50

AI芯片,需求放量,國產(chǎn)加速迭代品牌英偉達(dá)具體型號GB200H100MI350XFP8(TFLOPS)/INT8(TOPS)2000002000296-性能達(dá)到國內(nèi)領(lǐng)先水平200560-4614FP16(TFLOPS)100001000148800100280-2309.6FP32(TFLOPS)1606044-2536-144.2顯存容量48

GB64GBHBM2e8TB/s96GBHBM2e700GB/s372GBHBM3e顯存帶寬 16TB/s互聯(lián)帶寬 3.6TB/s功耗80

GBHBM33TB/s900GB/s700W96GBHBM34TB/s900GB/s400W128GBHBM2e3.2TB/s784GB/s700W768

GB/s~800GB/s450W350W 400W288GBHBM3e8TB/s1075.21000W超節(jié)點形態(tài) NVL無無384卡超節(jié)點開發(fā)中640卡超節(jié)點ShanghaiC暫無 ube

卡 暫無超節(jié)點暫無趨勢三:國產(chǎn)產(chǎn)品迭代加速,國產(chǎn)AI芯片性能接近英偉達(dá)H100華為 寒武紀(jì) 海光信息 摩爾線程 沐曦股份

阿里平頭哥 AMDH20 昇騰910C MLU590 DCU

3號 S4000 C550 810各公司官網(wǎng),各公司公告,申萬宏源研究61

超節(jié)點:趨勢明確,Scale-up國產(chǎn)化優(yōu)勢顯著節(jié)點內(nèi)GPU數(shù)量

多側(cè)重協(xié)議開放節(jié)點內(nèi)GPU數(shù)量

多英偉達(dá)NVLink

Fusion華為CM384(Unified

Bus)阿里磐久128(ALink

System)騰訊等ETH64(ETH-X

RoCE)側(cè)重生態(tài)閉環(huán) 谷歌TPUv4

4096(ICI、OCS)英偉達(dá)GB300

NVL72

~NVL144

~

Rubin

NVL576代表:多機柜多xPU代表:單柜高密高電UALinkAMDHelios

UALoE72(UALink)博通等SUEESUN曙光scaleX640申萬宏源研究算力集群擴容的兩個維度:Scale-up

&Scale-outScale-up是全球算力網(wǎng)絡(luò)發(fā)展的重心:xPU在“超節(jié)點”內(nèi)部性能擴充,原因是大模型的張量并行、專家并行等,需要放在超高帶寬、超低時延的網(wǎng)絡(luò)中進(jìn)行處理。海外NVLink、SUE、UALink等格局逐步清晰,國產(chǎn)華為基于UB網(wǎng)絡(luò)的CM384、阿里磐久、騰訊等ETH-X、海光、摩爾等方案具備較強競爭力。國產(chǎn)超節(jié)點Scale-up分化為:“單柜高密高電多xPU”和“多機柜多xPU”兩大路徑不同路徑超節(jié)點總覽71

超節(jié)點:Scale-out從設(shè)備到芯片,國產(chǎn)化提速注:圖表折線代表交換機設(shè)備的發(fā)貨規(guī)模市場份額,%。IDC(國際數(shù)據(jù)公司),申萬宏源研究0%我國交換機出貨規(guī)模中,華為/新華三/銳捷/中興占比領(lǐng)先,國產(chǎn)芯片替代大有可為45%40%35%30%25%20%15%10%5%RuijieSangforOthersAristaHuaweiZTENVIDIAH3CCiscoDigital

China盛科通信為代表,國產(chǎn)以太網(wǎng)芯片具備全球?qū)?biāo)能力各公司官網(wǎng),各公司公告,IDC(國際數(shù)據(jù)公司),申萬宏源研究Scale-out代表xPU在節(jié)點外部的性能擴充,協(xié)議與設(shè)備相對成熟,往往借助InfiniBand、以太網(wǎng)等網(wǎng)絡(luò)協(xié)議。海外基本形成IB網(wǎng)絡(luò)、基于以太網(wǎng)的AI

演進(jìn)兩大生態(tài)陣營,博通鏈的高速成長代表了以太網(wǎng)市場的景氣。我們認(rèn)為,本土Scale-out方案在設(shè)備端已經(jīng)具備規(guī)模優(yōu)勢,未來芯片端國產(chǎn)替代(圍繞以太網(wǎng)生態(tài))是重點。高端市場Arctic系列(在研)中低端市場盛科通信25.6Tbps數(shù)據(jù)中心博通Tomahawk

5Tomahawk

4Tbps數(shù)據(jù)中心,AI25.6Tbps數(shù)據(jù)中心Jericho

3-AIJericho

2c+14.4Tbps14.4TbpsAI優(yōu)化MarvellTeralynx

10Teralynx

825.6Tbps數(shù)據(jù)中心瑞昱TsingMa.MX2.4Tbps(IDC(國際數(shù)據(jù)司)、匯聚)TsingMa400Gbps(接入?yún)R聚)GoldenGateTbpsTrident3-X7Trident-X3.2Tbps244GbpsPrestera270GbpsRTL9311216GbpsTbps數(shù)據(jù)中心,AI81

超節(jié)點:光電混合,光、銅共進(jìn)中際旭創(chuàng)OCP演講材料,Light

Counting(光通信市場機構(gòu)),申萬宏源研究光通信的降本需求長期持續(xù)光與銅連接在距離、成本、功耗等方面的對比,影響了超節(jié)點Scale-up的設(shè)計市場普遍關(guān)心:超節(jié)點趨勢下,算力網(wǎng)絡(luò)光信號、電信號應(yīng)用趨勢,分別對應(yīng)光通信以及PCB、背板、銅纜等銅連接的成長空間。通信方案在距離、速率、成本上的不可能三角,決定了較長時間內(nèi),Scale-up將是光電混合、光銅共進(jìn)的格局。由于超節(jié)點在兩個方向的發(fā)展并不收斂,尤其對于國產(chǎn)算力,光、銅不同方案都有較佳空間和成長性。英偉達(dá)技術(shù)文檔,申萬宏源研究92

生態(tài):短期類CUDA,長期CANN開源廠商軟件平臺 AI

訓(xùn)推框架適配程度

核心工具豐富度

是否類CUDA是否支持Triton華為CANN深度適配

PyTorch、TensorFlow,PyTorch

適配版本與社區(qū)同步演進(jìn),自有框架MindSporeAscend

Profiler)、模型轉(zhuǎn)換工具等提供算子開發(fā)工具、性能分析工具(如

全棧自研,支持端邊云協(xié)同,算子性能優(yōu)化深入,生態(tài)適 是配廣泛寒武紀(jì)TensorFlow

等NeuWare

全面兼容

PyTorch(2.1-

2.8

版本)、

擁有

CNNL

算子庫、CNCL

通信庫、

云邊端一體、訓(xùn)推一體架構(gòu),CNSantizer

調(diào)試工具等

移工具便捷CNPerf-GUI

性能分析工具、

大模型適配速度快,GPU

是海光信息DTK兼容

ROCm

生態(tài),原生支持TensorFlow、PyTorch、PaddlePaddle

等,覆蓋多精度訓(xùn)練推理結(jié)合海光

DCU

的通用架構(gòu)和全精度優(yōu)勢,集成超過2000個算子,對

CUDA的算子覆蓋度超過

99%“類CUDA”環(huán)境/深度適配

PyTorch(支持至

2.5.0+),

提供

Torch-MUSA

擴展庫、MUSA摩爾線程 MUSA 支持

FSDP2、AOTInductor、Triton

DK(含

muDNN、MUSA-X計算庫)、后端等 性能分析工具等無縫替代

CUDA,提供Musify遷移工具是沐曦股份MXMACA適配

PyTorch、TensorFlow

等主流框

包含高性能算子庫、編譯工具、調(diào)試分架,支持混合精度訓(xùn)練 析工具等類CUDA,算子優(yōu)化針對性強,適配多種

AI

場景是各公司官網(wǎng),海光信息公告,申萬宏源研究國產(chǎn)AI芯片軟件工具兩條腿走路:多家廠商類CUDA,華為CANN開源走獨立路線類CUDA:海光信息、摩爾線程、沐曦股份等25.9月華為CANN開源,不類CUDA;寒武紀(jì)NeuWare多家國產(chǎn)AI芯片類CUDA,華為、寒武紀(jì)為獨立路線103

2026年是供給側(cè)突破的一年資料來源:

TrendForce(集邦咨詢),申萬宏源研究7/6nm1Q232Q233Q234Q231Q242Q243Q244Q241Q252Q253Q25

4Q25F1Q26F2Q26F3Q26F4Q26F中國臺灣95.5%95.5%89.8%

89.8%92.6%92.6%92.6%

92.6%89.8%89.8%89.8%

89.3%87.2%84.7%80.2%

80.2%韓國3%3%2%2%2%2%2%2%2%2%2% 2%2%1%1%1%中國大陸3.2%3.2%9.0%9.0%6.2%6.2%6.2%6.2%9.0%9.0%9.0% 9.5%16%14.1%18.7%

18.7%5/4nm1Q232Q233Q234Q231Q242Q243Q244Q241Q252Q253Q25

4Q25F1Q26F2Q26F3Q26F

4Q26F中國臺灣70.3%71%71%7

1%67.5%67.5%65.8%

63.9%69.4%78%73.2%

75.6%73.9%73.9%73.9%

73.9%韓國29.7%28.9%28.9%

28.9%30.0%30.0%36%

33.3%27.8%25.6%24.4%

22.2%23.9%23.9%23.9%

23.9%中國大陸.%.%.%.%.%.%.%.%.%.%.% .%.%.%.%.%供給擴張進(jìn)度超預(yù)期,國產(chǎn)供應(yīng)鏈逐步佐證寒武紀(jì)預(yù)告2025年營收50-70億(華為昇騰外的算力芯片公司開始起量);沐曦下一代國產(chǎn)供應(yīng)鏈產(chǎn)品曦云C600正式推出并穩(wěn)步啟動量產(chǎn)(第二代的國產(chǎn)芯片逐步采用本土供應(yīng)鏈);華為全聯(lián)接大會2025上,華為預(yù)計2026Q1推出昇騰950PR,2026Q4推出昇騰950DT,2027Q4推出昇騰960,2028Q4推出昇騰970;阿里平頭哥自研AI芯片PPU。全球晶圓代工市場6/7nm及5/4nm節(jié)點份額變化(按K/M計算)0%-100%100%200%300%400%500%QAQAQAQAQAQAQAQAQAQAQAQAQAQAQAQAQAQAQA阿里騰訊4

需求:大廠更具彈性,“雙飛輪”驅(qū)動算力需求算力-模型/應(yīng)用閉環(huán),模型+應(yīng)用推理Token指數(shù)性增長,驅(qū)動Capex上行吳泳銘在阿里云棲大會上的發(fā)言:Token消耗量每2-3月翻番;今年全球AI的投資總額超過4000億美元,未來五年預(yù)計全球AI投入超4萬億美元。模型應(yīng)用:2B

API調(diào)用Token增長迅速國內(nèi)互聯(lián)網(wǎng)大廠Capex同比增速顯著提升模型:豆包模型Token消耗量一年翻二十倍(單位:萬億)能力提升0.53416.412.73005

0.12353025201510各公司財報,字節(jié)跳動AI

Force大會,OpenRouter(AI

Tokens統(tǒng)計網(wǎng)站),中國新聞網(wǎng),申萬宏源研

11究124

需求:運營商和智算穩(wěn)健算力作為國家戰(zhàn)略,是運營商、地方近年產(chǎn)業(yè)發(fā)展的戰(zhàn)略重點算力投資在運營商Capex占比不斷提高;中國智算算力規(guī)模至2028年較當(dāng)前翻100%以上,對應(yīng)投資規(guī)模翻倍100%以上。3353913713730%5%10%15%20%25%30%20001800160014001200100080060040020002025E2022算力連接2023能力2024基礎(chǔ)算力占比(右軸)2713563273180%10%20%30%40%0400200600800100012002025E2024寬帶網(wǎng)產(chǎn)業(yè)數(shù)字化2022 2023運營系統(tǒng)與基礎(chǔ)設(shè)施移動網(wǎng)產(chǎn)業(yè)數(shù)字化占比(右軸)2025年,中國移動算力Capex計劃373億元,占比不斷提升(單位:億元)中國電信資本開支及產(chǎn)業(yè)數(shù)字化占比(左軸單位:億元,右軸單位:%)中國智能算力規(guī)模未來穩(wěn)步上升(單位:EFLOPS)資料來源:IDC(國際數(shù)據(jù)公司),中國移動、中國電信公司公告,申萬宏源研究75155.2259.9416.7725.31037.31460.32019.9278

95001000150020002500300002020 2021 2022 2023 20242025E2026E2027E

2028E134

需求:多模態(tài)、Agent成熟后,指數(shù)級增長應(yīng)用形態(tài)的變化帶來算力需求的劇變:Agent>多模態(tài)>Chatbot火山引擎總裁譚待:一個Agent任務(wù)的Token消耗可能與用戶和模型聊一小時天的量級相當(dāng);一次Agent任務(wù)運行,算力成本達(dá)到幾十元的水準(zhǔn)。應(yīng)用形態(tài)算力需求Agent時代算力需求指數(shù)增長Chatbot 多模態(tài) Agent各類任務(wù)消耗Token、費用對比單輪對話生成一張中等

生成1分鐘視

Agent:制作質(zhì)量圖片 頻 個人網(wǎng)站消耗Token數(shù)

幾百到幾千 幾百到幾千 - -算力費用 0.00219美金

約0.039美金 約21美金 約6美金使用模型GoogleDeepseekR1Gemini

2.5Flash

ImageVeo

2.0ManusDeepseek官網(wǎng),Manus官網(wǎng),Hrefgo

AI(AI調(diào)用模型平臺),申萬宏源研究145

電源:定制化趨勢下轉(zhuǎn)向直流的架構(gòu)變革帶來增量機遇由UPS到HVDC到SST的方案演進(jìn)示意Sidecar:通過邊柜將交流電轉(zhuǎn)為800V直流,再在服務(wù)器柜內(nèi)將800V直流轉(zhuǎn)為12V直流為減少高密度大容量數(shù)據(jù)中心的供配電轉(zhuǎn)換損耗,供電架構(gòu)正從傳統(tǒng)UPS向HVDC(高壓直流)與更前沿的SST(固態(tài)變壓器)演進(jìn)UPS/HVDC主要產(chǎn)品代際差小,增量需求或主要由與核心客戶定制關(guān)系驅(qū)動;SST暫未出現(xiàn)適配數(shù)據(jù)中心的成熟方案,UPS/HVDC、變壓器、上游部件等環(huán)節(jié)預(yù)計都將深度參與。英偉達(dá)800VDC白皮書,申萬宏源研究156

液冷:從1到10的滲透率奇點,2026年規(guī)?;帕吭暌淮蝹?cè) 二次側(cè)管路 管路機柜manifold快接頭服務(wù)器冷板室外冷源 CDU系冷統(tǒng)板示式意液圖冷價值量約1000-1500元/kW(兩路冗余備份)約400-500元/kW(In-row

CDU)manifold約400-500元/kW快接頭約300-400元/對冷板約3000-5000元/kW產(chǎn)業(yè)鏈標(biāo)的傳統(tǒng)冷機廠商為主Vertiv,英維克等中航光電,Vertiv,英維克等英維克、飛榮達(dá)、銀輪股份等IDC(國際數(shù)據(jù)公司),申萬宏源研究多家國產(chǎn)廠商方案落地,

2026年為規(guī)模化放量元年據(jù)IDC數(shù)據(jù),24年國內(nèi)液冷服務(wù)器出貨量約為23萬臺,滲透率5.2%;預(yù)計2024-2029年,中國液冷服務(wù)器市場年復(fù)合增長率將達(dá)到46.8%,2029年市場規(guī)模將達(dá)到162億美元。華為、曙光等超節(jié)點方案落地,將進(jìn)一步推動液冷在智算中心建設(shè)配置中成為必選項。液冷產(chǎn)業(yè)鏈條中的冷、熱環(huán)節(jié)與ICT理解緊密耦合,中國制造業(yè)優(yōu)勢是本土液冷各環(huán)節(jié)核心競爭力。冷板式液冷方案示意圖167

IDC:供需有望借國產(chǎn)算力東風(fēng)迎來“第二次拐點”本土IDC供需格局顯著邊際改善,行業(yè)經(jīng)歷由NV芯片主導(dǎo)到國產(chǎn)算力初步導(dǎo)入的轉(zhuǎn)型期國產(chǎn)算力迭代與部署接近“破局”,行業(yè)將迎來第二次拐點科智咨詢,政府公告,工信部,申萬宏源研究177

IDC:存量資源持續(xù)去化,供給側(cè)邊際改善顯著在建工程轉(zhuǎn)固(約等于數(shù)據(jù)中心交付)增速24年迎來轉(zhuǎn)折點,25H1進(jìn)一步加速廊坊地區(qū)作為核心區(qū)位,

25Q1

IDC上架率顯著回升(單位:MW,%)-100%-50%0%50%100%150%200%250%奧飛數(shù)據(jù)2017 2018 2019 2020 2021 2022 2023 2024 25H1萬國數(shù)據(jù)寶信軟件世紀(jì)互聯(lián)光環(huán)新網(wǎng)潤澤科技數(shù)據(jù)港64%66%68%70%72%74%76%78%80%82%84%02004006008001000120014002020202120222023202425Q1供給規(guī)模需求規(guī)模上架率量:25年加速消化21-23年存量有效供給,而核心區(qū)位資源緊缺,新增供給顯著下降在建工程轉(zhuǎn)固作為后驗指標(biāo),已清晰體現(xiàn)24年以來需求回升與第三方IDC存量資源的快速響應(yīng),預(yù)計25-26年這一趨勢進(jìn)一步放大。上架率:核心區(qū)位整體上架率持續(xù)回升,交付與上架周期相較歷史顯著縮短至約6個月價:供需關(guān)系改善以來逐步企穩(wěn),需求集中節(jié)點核心區(qū)位邊際定價小幅回升IDC(國際數(shù)據(jù)公司),公司公告,申萬宏源研究主要內(nèi)容算力:國產(chǎn)架構(gòu)元年模型:性能差距拐點應(yīng)用:商業(yè)化突破10%重點標(biāo)的與估值182025/12025/22025/3DeepSeek-R1OpenAI

o3-miniClaude3.7OpenAI

o3及o4-mini阿里Qwen-3字節(jié)豆包5深度思考谷歌Gemini2.5

Flash谷歌Gemini2.5

Pro字節(jié)豆包

6月之暗面KimiK2xAIGrok4推理能

代碼和力提升,

工具使高性價

用能力比 提升Oai中最智能模型、工具使用能力提升代碼、推理、多模態(tài)能力提升OpenAIGPT-4.1編碼、指令跟蹤、長上下文能力提升Gemini系列最強版本推理能力提升10倍推理、數(shù)學(xué)能力提升,API價格大幅下降性能媲美DeepSeekR1,繼續(xù)降本深度思考趕上,視覺理解技術(shù)融合復(fù)雜推理、競賽數(shù)學(xué)、多輪對話提升,降本代碼、Agent、工具調(diào)用能力出圈,價格僅Claude1/5AI編程需求推動Anthropic

年化達(dá)30億美元OpenAI

年化達(dá)120億美元Cursor

年化達(dá)5億美元豆包日均tokens超16.4萬億Anthropic

年化到10億美元阿里發(fā)布全系列大模型,包括萬億參數(shù)基座Max、原生多模態(tài)大模型Omni等國內(nèi):開源涌現(xiàn),推理能力趕上,性價比高。海外:閉源為主,核心是提高推理能力、重視代碼能力和工具調(diào)用能力。原生多模態(tài)提升迅速。2025/4 2025/5 2025/6 2025/7 2025/82025/9谷歌Genie3ClaudeOpus4.1GPT5世界模型、推理代碼能力提升智譜GLM-4.5VDeepSeek

V3.1谷歌NanoBanana媲美P圖級別的生圖模型全模態(tài)推理、Agent阿里Qwen3-Max萬億參數(shù)代碼、智能、體推理、多語言提升阿里原生多模態(tài)Omni媲美NanoBanana2.0

2025年大模型主要變化:貨幣化、AI編程、多模態(tài)2025年大模型復(fù)盤大模型貨幣化加速,AI編碼、多模態(tài)為重點場景InfoQ(計算機資訊網(wǎng)站),36氪,reuters(路透社),IT之家,cursor(海外AI大模型公司),新浪

19網(wǎng),申萬宏源研究202.0

中美主流大模型效果逐漸不分伯仲地 主要模型 廠商 參數(shù)量(十億)

輸入價格(美金/百萬

輸出價格(美金/百萬

MMLU(通用MMMU(多模

AIME(數(shù)學(xué)

SWE-bench(

LMArena(人類真實區(qū) tokens) tokens) 語言) 理解推理) 推理) 編程) 偏好)GPT-5 OpenAI未公開2510.0087.0%8

5%93.4%68.8%1425海Gemini

2.5 谷歌未公開0.302.5083.7%79.5%49.8%53.6%1404外Claude4.5

Anthropic未公開3.0015.0087.3%79.3%88.5%69.8%1445Grok-4 xAI17003.0015.0085.3%76.3%90.6%58.6%1413DeepSeek 深度求索6850.280.4285.0%-89.3%67.8%1408Qwen3-Max 阿里>10000.863.4483.5%-60.7%55.4%1434內(nèi)豆包

6 字節(jié)2300.1112--86.3%--GLM-4.5智譜3550.110.2882%-86.7%54.2%1406Kimi

K2月之暗面10000.562.2489.5%-62.7%43.8%1417FlashSonnetV3.2國語言能力持平,多模態(tài)、數(shù)學(xué)、編程仍有差距但縮小,人類真實偏好反饋國內(nèi)模型不落后于海外LMSYS

Chatbot

Arena美國和中國模型性能逐漸接近中美頂級模型在主要基準(zhǔn)上結(jié)果逐漸接近《2025年人工智能指數(shù)報告》,各公司官網(wǎng),Vals.AI(模型測試網(wǎng)站),swebench(模型測試網(wǎng)站),騰訊新聞,CSDN(中國開發(fā)者網(wǎng)絡(luò)),火山引擎,LMArena(模型測試網(wǎng)站),申萬宏源研究2.1

算力創(chuàng)新:算力耦合的架構(gòu)、范式創(chuàng)新模型:不僅追求Scaling,通過一系列創(chuàng)新,在性能、效率與成本之間尋求更優(yōu)的平衡算力與模型耦合:國產(chǎn)最新方向,例如UE8M0精度、各類算子新算子出現(xiàn)低精度MoE改造注意力機制Feed-ForwardNetworkRMS

NormAttentionRMS

Norm架構(gòu)創(chuàng)新訓(xùn)練范式創(chuàng)新Deepseekwen3QMoE

-NextMLA混合注意力線性注意力推理創(chuàng)新強化學(xué)習(xí)長短思維鏈混合精度訓(xùn)練……模型量化分布式推理適配新框架W4A4MX-FP8MX-FP4Sparse

AttentionLinear

AttentionDLMVLMDiTDeepseek官網(wǎng),寒武紀(jì)官網(wǎng),申萬宏源研究2122?

2025為效率轉(zhuǎn)化年:全球216家科技公司累計裁員近10萬人,結(jié)構(gòu)上傳統(tǒng)職能、中層管理為重災(zāi)區(qū),AI研發(fā)、云計算等仍在擴招地區(qū) 公司 公司自身AI進(jìn)展描述美國部分代表公司亞馬遜??宣布啟動新一輪裁員,裁減約

4萬名,占總數(shù)4%,內(nèi)部會議強調(diào)AI重塑公司運營模式,部分崗位消失是技術(shù)進(jìn)步的必然。業(yè)績強勢增長,25FYQ2銷售額達(dá)1677億美元,yoy+13%,營運利潤192億美元,yoy+31%。ServiceNow??25年5月以來平臺Assist使用次數(shù)增長55倍,ACV計劃年底超5億美元,主要來自于訂閱。72%自助服務(wù)請求AI自動支持、37%的案例工作流程AI代理完成、60%的知識文章AI生成。Salesforce??2025年不再招聘新軟件工程師,重心轉(zhuǎn)向銷售崗位幫客戶更好理解和應(yīng)用AI技術(shù)。Agentforce讓工程團(tuán)隊工作效率提升30%。國內(nèi)部分代表公司字節(jié)海外TikTok全球裁員數(shù)百人,重點轉(zhuǎn)向使用AI進(jìn)行內(nèi)容審核,80%違規(guī)內(nèi)容由AI自動化刪除。字節(jié)巨量引擎AI廣告治理實現(xiàn)90%廣告素材10分鐘內(nèi)完成審核,相較傳統(tǒng)方式提升75%。阿里26年招聘3000崗位中AI相關(guān)占比近5成,高德部門AI相關(guān)崗位占比65%,阿里云超80%。25FYQ2阿里云業(yè)務(wù)收入同比增長26%,AI相關(guān)產(chǎn)品收入連續(xù)個季度保持三位數(shù)增長。模型能力提升→AI落地加速、對傳統(tǒng)工作和人力替代→效率提升→業(yè)績表現(xiàn)012345672025年大模型tokens使用量持續(xù)上升(單位:T)19.2%16.4%8.4%7.0%6.6%4.1%3.0%2.0%5.7%0.0%5.0%10.0%15.0%20.0%25.0%30.0%251026-251102的周調(diào)用量市場份額顯示國內(nèi)多家占據(jù)重要地位27.7%OpenRouter(AI

Tokens統(tǒng)計網(wǎng)站),鈦媒體,ServiceNow(海外SaaS公司),博客園,IT之家,新浪網(wǎng),申萬宏源研究2.2

直觀行業(yè)變化:使用量快速上升,人力替代效應(yīng)出現(xiàn)232.3

模型迭代方向預(yù)測一:突破長上下文瓶頸、效率提升論文《DeepSeek-OCR:

Contexts

Optical

Compression》,申萬宏源研究93.8%83.8%85.8%79.3%76.3%59.1%96.5%

98.5%97.3%96.8%96.8%9

5%89.8%87.1%10.51

813.215.116.517.719.76.77.58.59.710.61

312.60x5x10x15x20x25x0%20%40%60%80%100%120%600-700700-8001100-12001200-1300compression(x)precision(%)800-900 900-1000 1000-1100TextTokensinPer

Page(Ground-truth)CompressiononFox

benchmarkDeepSeek提供創(chuàng)新性光學(xué)上下文壓縮新思路:視覺模態(tài)作為文本高效壓縮媒介,文本→圖像→視覺token處理效率大幅提升:壓縮比<10倍時,精度達(dá)97%;壓縮比20倍時,精度~60%。實際應(yīng)用中單張A100-40G

GPU可支持20萬頁數(shù)據(jù)處理每日。視覺輸入模擬人類記憶衰減:久遠(yuǎn)上下文壓縮為低分辨率圖像實現(xiàn)自然遺忘,實現(xiàn)優(yōu)化長上下文管理。壓縮比<10倍時,OCR解碼精度可達(dá)97%64

vistoks(left) 100

vistoks(left) 64

vistoks(right) 100vis

toks(right)242.3

模型迭代方向預(yù)測一:突破長上下文瓶頸、效率提升核心架構(gòu)設(shè)計是編碼器、壓縮、解碼器DeepEncoder編碼器:80M

SAM-base(窗口注意力主導(dǎo),局部特征提取)、16倍卷積壓縮、300M

Clip-large(密集全局注意力,全局語義理解)三級串聯(lián)。DeepSeek-3B-MoE解碼器:3B參數(shù)規(guī)模(570激活參數(shù)),將視覺token重建為原始文本表征。DeepEncoder是核心創(chuàng)新:例如1024x1024輸入圖像,先分割成4096patch

token,前半部分80M產(chǎn)數(shù)量激活內(nèi)存消耗可接受,進(jìn)入全局注意力之前先壓縮至256個,使整體激活內(nèi)存有效控制。文字transformer計算復(fù)雜度O(n^2),DS-OCR在Clip以前為O(n)。處理高分辨率能力、高分辨率下低激活內(nèi)存、少量視覺token、支持多分辨率輸入、適中參數(shù)量。DeepSeek

OCR核心架構(gòu)論文《DeepSeek-OCR:

Contexts

Optical

Compression》,申萬宏源研究252.3

模型迭代方向預(yù)測二:多模態(tài)的細(xì)節(jié)與控制海外核心進(jìn)展 國內(nèi)核心進(jìn)展OpenAI

GPT-4o、Google

Gemini、Meta

Llama4

阿里、字節(jié)等均發(fā)布原生融合多模態(tài)大模型。視覺技術(shù)理念和架構(gòu) 等采用端到端原生多模態(tài)架構(gòu),強調(diào)統(tǒng)一模型處理多

理解能力媲美海外,中文內(nèi)容準(zhǔn)確性更高。具備多種信息,指令跟隨加強、響應(yīng)快、一致性強。 模態(tài)長思維鏈推理和多模態(tài)強化學(xué)習(xí)。商業(yè)化與落地落地主要來自圖像、視頻生成,例如可靈、midjourney等收入增速較快圖像、視頻生成出海:快手、可靈、美圖;具身智能:機器人、自動駕駛阿里Omni內(nèi)置ControlNet,細(xì)節(jié)控制能力提升海外、國內(nèi)均重視多模態(tài)大模型Qwen(千問),申萬宏源研究未來趨勢:更細(xì)節(jié)可控的多模態(tài)能力例如谷歌Nano

Banana媲美P圖級別的效果262.3

模型迭代方向預(yù)測二:多模態(tài)、世界模型騰訊新聞、Genie3官網(wǎng)、英偉達(dá)官網(wǎng)、Meta官網(wǎng)、申萬宏源研究模型名稱核心共性模型目標(biāo)技術(shù)側(cè)重是否需要3D建模核心優(yōu)勢局限性實時及豐富性物理規(guī)律工程價值語義能力Meta

V-JEPA

2英偉達(dá)Cosmos谷歌Genie31)自監(jiān)督學(xué)習(xí)框架:均通過分析海量視頻

/交互數(shù)據(jù)隱式學(xué)習(xí)物理規(guī)律,避免過多的顯式公式建模;2)多模態(tài)數(shù)據(jù)驅(qū)動:支持視覺、語言、傳感器等多模態(tài)輸入;3)動態(tài)預(yù)測能力:可預(yù)測物體運動軌跡、因果關(guān)系及環(huán)境變化視覺

-

語言聯(lián)合表征與機器人規(guī)劃聯(lián)合嵌入預(yù)測架構(gòu)(JEPA),通過時空注意力機制學(xué)習(xí)跨模態(tài)語義對齊無需預(yù)先建模推理速度極快:規(guī)劃用時僅為Cosmos

1/30,成功率更高缺乏實時交互能力★☆★☆★★★★★零樣本泛化:無需特定訓(xùn)練即可完成機器人抓取、放置等任務(wù)(成功率

65-80%)工業(yè)級準(zhǔn)確性:在PhyGenBench

測試中對浮力、摩擦力等現(xiàn)象的模擬具有較好表現(xiàn)極端條件支持:可精確模擬車輛在暴雨、地震等極端環(huán)境下的動力學(xué)響應(yīng)物理推理局限于視覺可觀測范圍,無法處理多體動力學(xué)實時交互能力較弱,更適合離線訓(xùn)練部分依賴預(yù)訓(xùn)練

3D物理引擎(如NVIDIA

PhysX),較高的成本規(guī)?;呔任锢矸抡鏀U散+自回歸模型結(jié)合部分依賴建模★★★★★★★★★實時交互的動態(tài)

3D

場景生成自回歸+空間時間變換器完全隱式生成沉浸式交互:720p

分辨率、24幀

/

秒生成可探索環(huán)境,物理一致性維持長達(dá)數(shù)分鐘復(fù)雜物理現(xiàn)象模擬存在缺陷★★★★★★☆★★創(chuàng)意生成能力:支持天氣變化、

文本物體添加等動態(tài)修改,如

“在暴風(fēng)雨中添加摩托艇”渲染質(zhì)量待提升,場景持久性有限?

未來趨勢:從多模態(tài)理解走向世界模型,核心是能模擬物理規(guī)則、預(yù)測未來狀態(tài)272.3

模型迭代方向預(yù)測三:Mid-training效率優(yōu)化 更少高質(zhì)量數(shù)據(jù)實現(xiàn)顯著性能提升通過動作抽象壓縮決策空間,降低Agent學(xué)習(xí)復(fù)雜任

務(wù)的難度和成本 中期訓(xùn)練作為橋梁,提升預(yù)訓(xùn)練模型專業(yè)能力,為后訓(xùn)練提供關(guān)鍵過渡和熱身通過中期訓(xùn)練,能將Llama改造成與RL可比的推理模型,在數(shù)學(xué)推理上與Qwen媲美論文《A

Survey

on

LLM

Mid-Training》,《OctoThinker:Mid-TrainingIncentivizesReinforcement

Learning

Scaling》申萬宏源研究從過去的“預(yù)訓(xùn)練+后訓(xùn)練”兩階段變?yōu)椤邦A(yù)訓(xùn)練-中期訓(xùn)練-后訓(xùn)練”三階段:預(yù)訓(xùn)練:接觸大規(guī)模多樣化語料庫奠定基礎(chǔ)能力(類比通識教育階段);中期訓(xùn)練:通過部分高質(zhì)量、特定領(lǐng)域數(shù)據(jù)系統(tǒng)性增強模型核心能力(類比專業(yè)深造階段);后訓(xùn)練:微調(diào)和對齊(類比崗前培訓(xùn))。標(biāo)志大模型開發(fā)從相對粗放的規(guī)模擴張進(jìn)入精細(xì)化的系統(tǒng)工程階段Mid-training對模型效果、成本壓縮、Agent能力提升皆有重要意義對大模型效果的關(guān)鍵影響 對AIAgent效果的關(guān)鍵影響核心價值

輸出緊致先驗/世界表征/高層動作庫從源頭縮小搜索空間、縮短有

將復(fù)雜原子動作抽象為高層推理、調(diào)用工具等技能,效視界,增強RL性能 壓縮后續(xù)RL動作空間性能提升 系統(tǒng)性增強推理、代碼、數(shù)學(xué)等認(rèn)知能力 提高RL起點質(zhì)量,提升訓(xùn)練樣本效率和穩(wěn)定性282.4

模型是否吞噬軟件?中國軟件有定制化需求乙方定制化是中國軟件行業(yè)特色,特別是To

B的軟件公司軟件供應(yīng)商普遍以鋪設(shè)大量人員方式為企業(yè)做定制開發(fā);定制化程度高,壓制利潤率和人效。中國AI范式為人機共駕,決定了模型難以取代軟件過去10年中美典型軟件公司毛利率復(fù)盤292.4

模型是否吞噬軟件?本質(zhì)是行業(yè)的know-how的積累中國大模型與軟件的邊界更清晰,行業(yè)know-how形成壁壘,大模型無法完全取代應(yīng)用軟件供應(yīng)商與客戶深度綁定,開展定制化的過程中積累了大量行業(yè)know-how。AI應(yīng)用真正落地依靠行業(yè)know-how,路徑上由軟件公司實現(xiàn)可能性更大大模型缺乏行業(yè)know-how,無法完全取代應(yīng)用申萬宏源研究全行業(yè)各場景金融風(fēng)控、估值、交易醫(yī)療診斷、病理、流程制造供應(yīng)鏈、生產(chǎn)工藝各行業(yè)領(lǐng)域不同場景+專業(yè)流程基于客戶私有的行業(yè)Know-how結(jié)構(gòu)/非結(jié)構(gòu)的數(shù)據(jù)積累行業(yè)數(shù)據(jù)庫 流程代碼、算法、小模型(機器學(xué)習(xí)、深度學(xué)習(xí)算法)產(chǎn)品化To

B-各類行業(yè)IT產(chǎn)品/服務(wù)金融IT醫(yī)療IT工業(yè)IT(ERP、CAM…)To

C-各類軟件工具類社交類內(nèi)容類交易類…………游戲類傳統(tǒng)軟件公司大模型廠商基于公開信息大模型

模型替換軟件?更可能的路徑

大模型+小模型+人

機共駕主要內(nèi)容算力:國產(chǎn)架構(gòu)元年模型:性能差距拐點應(yīng)用:商業(yè)化突破10%重點標(biāo)的與估值302000300050004000600070008000900010000110001200002004006008001,0001,200廣聯(lián)達(dá)總市值(億元)申萬計算機指數(shù)(右軸)313.0

軟件行業(yè)擊球點:新業(yè)務(wù)占比10%時,市值快速提升?

特點:趨勢確定(云化為軟件廠商必然路徑),節(jié)奏不確定、可跟蹤性不高(低頻數(shù)據(jù))。?廣聯(lián)達(dá)17年首次公布云收入4500萬元,17-18年股價逆勢增長47%;19-20年主升:云收入占比13%→26%→41%,漲幅300%+。2017年,年報首次提及云轉(zhuǎn)型,云

收入0.45億元(占總營收2%)2018年云收入3.7億元(占總營收13%);2017年初-2018年末計算機整體振蕩向下,廣聯(lián)達(dá)逆勢而上,漲幅47%。2019-2020年,云收入分別為9.2

億元、16.2億元YoY+149%、76%;

占總營收26%、41%;廣聯(lián)達(dá)迎來主升浪,大幅跑贏計算機行業(yè),漲幅300%+。YoY+58%、+28%、+17%;

占總營收46%、50%、58%;下游宏觀環(huán)境承壓,云收入、云合同增幅放緩導(dǎo)致股價承壓。2021-2023年,云收入分別為25.6、32.8、38.2億元;

2024年云合同增速轉(zhuǎn)負(fù),但股價已提前反應(yīng),隨著下游市場企穩(wěn),以及工地智慧化、新產(chǎn)品等推出,進(jìn)入估值修復(fù)階段。2000250030003500400045005000550060006500700002004006008001,0001,2001,4001,6001,800201720182019202420252020 2021用友網(wǎng)絡(luò)總市值(億元)2022 2023申萬計算機指數(shù)(右軸)32用友網(wǎng)絡(luò)17年首次公布云業(yè)務(wù)收入4.1億元,占總營收6%。股價與云收入占比演繹與廣聯(lián)達(dá)類似,超過10%時行情啟動,在超過40%后股價趨緩。3.0

軟件行業(yè)擊球點:新業(yè)務(wù)占比10%時,市值快速提升2017年,首次公布云收入4.1億元

(占總營收6%);2018年云收入8.5億元(占總營收11%);2017年初-2018年末用友整體波動不大,2018年初行情主要受到業(yè)績預(yù)告驅(qū)動,漲幅~96%。

占總營收23%、40%;用友網(wǎng)絡(luò)迎來主升浪,漲幅142%。行業(yè)競爭加劇導(dǎo)致公司凈利潤從2020年開始下滑,2020-2024年,歸母凈利潤分別為9.9億元、7.1億元、2.2億元、-9.7億元、-20.6億元。2019-2020年,云收入分別為19.7

2021-2024年,云收入分別為53.2、63.5、70.9、68.50億元;

2025,億元、34.2億元YoY+132%、74%;

YoY+55%、+19%、+12%、-3%;占總營收60%、69%、72%、75%;困境反轉(zhuǎn)廠商 產(chǎn)品 發(fā)布時間 核心特點OpenAI Deep

Research2025.2

由o3-mini模型驅(qū)動,可投入30分鐘以上進(jìn)行多步驟探索及動態(tài)調(diào)整搜索策略,在HLE測試中取得突出成績谷歌Gemini

DeepResearch2024.12

引用來源可靠性高,免費用戶每月可免費體驗數(shù)次Perplexity.aiDeep

Search2025.2

Pro用戶支持每天500次查詢,報告

生成速度更快,大多在3分鐘內(nèi)完成AnthropicClaude

DeepResearch2025.6

基于Multi-Agent實現(xiàn),更適合處理開放、動態(tài)的研究任務(wù)月之暗面 KimiResearcher

2025.6

基于端到端自主強化學(xué)習(xí)訓(xùn)練的agent模型,轉(zhuǎn)為深度研究任務(wù)字節(jié)跳動 eerFlow(開源)

2025.5

采用Multi-Agent架構(gòu)設(shè)計,支持深度研究、報告生成、播客生成等阿里通義 支持多種推理形式,包括原生ReAct和上下文管理模式,多項測評上拿DeepResearch 2025.9

到SOTA智譜AI AutoGLM沉思 . 集深度研究和實際操作能力于一體25年海外和國內(nèi)爭相發(fā)布Deep

Research央廣網(wǎng),IT之家,搜狐網(wǎng),CSDN(中國開發(fā)者網(wǎng)絡(luò)),DeerFlow(開源深度研究框架),飛書云,申

33萬宏源研究3.1

AI應(yīng)用爆款之一:Deep

Research34AI應(yīng)用達(dá)到5億美金ARR的速度,cursor位居前列從代碼庫或文檔中獲取引用一鍵應(yīng)用模型生成的代碼Cursor的部分核心功能,也是現(xiàn)在AI

IDE產(chǎn)品方向Cursor(海外大模型廠商),reddit(AI在線社區(qū)),申萬宏源研究3.2

AI應(yīng)用爆款之二:AI代碼+IDECursor:ARR提升至5億,已吸引超過3萬家付費企業(yè)客戶Cursor通過以下能力顯著提升開發(fā)效率:1)智能預(yù)測與補全:精準(zhǔn)預(yù)測開發(fā)者意圖,自動生成或編輯代碼;2)自然語言交互:開發(fā)者可直接用自然語言提示(如高亮代碼后要求解釋功能)進(jìn)行操作;3)無縫集成與糾錯:深度融入現(xiàn)有工作流,高效發(fā)現(xiàn)并修復(fù)錯誤。推出了40美元/月的企業(yè)許可模式,此前大部分收入來自個人用戶的20美元/月專業(yè)版訂閱。TRAE是字節(jié)跳動于2025年1月19日推出的AI編程工具,旨在提升開發(fā)效率,目前有國際版和國內(nèi)版智能代碼操作:通過自然語言輸入生成代碼片段,提供優(yōu)化建議,支持從零構(gòu)建項目,可通過對話獲取編程幫助。集成多種模型:集成Claude

3.5+3.7和GPT-4o,國內(nèi)版搭載doubao- 5-pro,支持切換DeepSeek-R1&V3。項目上下文同步:構(gòu)建完整“項目語義圖譜”,可進(jìn)行跳轉(zhuǎn)函數(shù)定義、生成組件調(diào)用代碼等操作TRAE與Cursor的區(qū)別模型與費用:Trae國際版可免費使用Claude等;國內(nèi)版免費且無需復(fù)雜配置。Cursor需付費使用部分高級功能,接入了DeepSeek、GPT和Claude等模型。功能細(xì)節(jié):TRAE的Builder模式目前不如Cursor的Agent模式智能,代碼生成準(zhǔn)確度有待提高。但TRAE代碼回滾更方便,有二次確認(rèn)機制。用戶體驗:TRAE界面更符合中文開發(fā)者習(xí)慣,操作更簡潔,新手更友好、端到端;Cursor界面類似VSCode,功能豐富但操作相對復(fù)雜。353.2

AI應(yīng)用爆款之二:AI代碼+IDE36圖片生成美圖RoboNeo訂閱制+點數(shù)制25年7月上線,1月左右MAU達(dá)100萬;25H1影像與設(shè)計產(chǎn)品收入13.51億,yoy+45.2%,成為收入支柱。Midjourney訂閱制25H1

ARR接近5億美元。賽道 代表公司/產(chǎn)品 核心變現(xiàn)模式 商業(yè)化成效視頻生成快手可靈會員訂閱+積分制+API調(diào)用?25Q1可靈收入超

5億元,3月ARR突破1億美元,截止25年6月,全球用戶突破2200萬;70%來自C端,30%來自B端;70%來自海外市場,30%來自國內(nèi)。Minimax海螺AI訂閱Runway訂閱制+企業(yè)定制上線后連續(xù)6月全球榜單中位居視頻生成產(chǎn)品第一,截止25年1月海螺AI海外版訪問量達(dá)1635萬,為國內(nèi)6倍多。截止25年6月,ARR超過9000萬美元。視頻生成/圖片生成為多模態(tài)AI應(yīng)用變現(xiàn)較快路徑之一1)高頻剛需場景;2)多元變現(xiàn)路徑:個人創(chuàng)作者/中小企業(yè)采用訂閱制,特定行業(yè)大型企業(yè)采用API調(diào)用和定制化;3)技術(shù)成熟度支撐商用:模型語義理解、生成質(zhì)量、時長等方面持續(xù)進(jìn)步,進(jìn)入可商用階段。全球多模態(tài)AI商業(yè)化進(jìn)展加速,可靈進(jìn)展突出36氪,新浪網(wǎng),金靈Gilin,鈦媒體,CSDN(中國開發(fā)者網(wǎng)絡(luò)),申萬宏源研究3.3

AI應(yīng)用爆款之三:多模態(tài)37維度可靈2.1Veo

3核心技術(shù)物理動態(tài)渲染(3D時空注意力機制)原生音視頻同步(V2A音頻引輩)生成質(zhì)量全球圖生視頻榜首(Artificial

Analysis)文生視頻真實性全球第一視頻長度最長支持2分鐘(大師版)限制8秒生成速度5秒視頻≈30秒(標(biāo)準(zhǔn)模式)8秒視頻≈2分鐘(完整版)單幀成本5秒視頻≈¥2(標(biāo)準(zhǔn)版)8秒視頻≈¥23(Veo3標(biāo)準(zhǔn)版)使用場景商業(yè)短劇、高定制廣告創(chuàng)意短片、多語言教育內(nèi)容分析可靈商業(yè)化快速原因:1)技術(shù)領(lǐng)先:20+次迭代領(lǐng)跑;2)成本優(yōu)勢:相較于海外主流模型具有顯著成本優(yōu)勢;3)快手生態(tài):商業(yè)短劇、廣告等需求量高。對比谷歌Veo3,可靈更具成本優(yōu)勢Artificial

Analysis(AI測評網(wǎng)站),虎嗅網(wǎng),可靈AI,智源社區(qū),Google

AI

for

Developers(谷歌AI開發(fā)者社區(qū)),36氪,申萬宏源研究3.3

AI應(yīng)用爆款之三:多模態(tài)383.4

AI應(yīng)用爆款之四:各項技術(shù)組合之Agent重要的技術(shù)進(jìn)展模型任務(wù)規(guī)劃和反思能力提升 ? Deep

Research:具備深度思考與任務(wù)規(guī)劃能力,通過思考-規(guī)劃-執(zhí)行閉環(huán)動態(tài)調(diào)整策略持久化記憶從簡單注意力機制轉(zhuǎn)向復(fù)雜多層記憶管理2025年4月發(fā)布Mem0:獨立于上下文窗口外的持久化知識庫,較低API費用下維持長期對話自動構(gòu)建知識圖譜、在過去錯誤中學(xué)習(xí);2025年10月DeepSeek

OCR:通過視覺輸入模擬人類記憶衰減;多模態(tài)與世界模型Agent能看懂圖像和視頻,通過世界模型在內(nèi)部模擬物理動態(tài)預(yù)測行為后果,為具身智能和實體AI奠定基礎(chǔ)高效的工具使用2024年11月MCP:解決智能體與工具集成的復(fù)雜度;年月MCP執(zhí)行代碼:解決大量MCP工具帶來的上下文窗口重載、中間工具額外消耗tokens問題。GAIA 74.55% - 58.18% 32.73% 30.30% -通用AI

Agent基準(zhǔn)測試,450個答案明確的題目,測試推理、多模態(tài)處理、網(wǎng)頁瀏覽和工具使用熟練度。WebArena68%-58.10%7.12%-7.14%通過系列自然語言描述的高級任務(wù)測試模型Web交互能力評估完成度

OSWorld 62.90% 53.10% 23% - - 4

60%真實計算機環(huán)境中對多模態(tài)Agent進(jìn)行開放式任務(wù)測試 Agent在技術(shù)實現(xiàn)性上仍有較大提升空間:單步驟成功率在多步復(fù)合下,成功率大幅降低各類復(fù)雜任務(wù)Benchmark中得分較低,尤其是無正確答案的開放式任務(wù)。幾類較常見的Agent測評榜單(選擇廠商得分最高的模型分?jǐn)?shù)比較)Anthropic 字節(jié) OpenAI 谷歌 DeepSeek 阿里千問 測評簡介?

2025逐漸顯現(xiàn)的發(fā)展方向:通過構(gòu)建多層次架構(gòu)解決Agent瓶頸,分層&多智能體、多步搜索+自我糾錯、記憶持久化等2025年出現(xiàn)的對Agent滲透提升的重要技術(shù)進(jìn)展論文《Mem0:Building

Production-Ready

AI

Agents

with

Scalable

Long-Term

Memory》,Github(海外編程社區(qū)),Anthropic(海外大模型公司),Gaia(AI評測網(wǎng)站),WebArena(AI

Agent網(wǎng)站),OS

World(AI評測網(wǎng)站),申萬宏源研究39重點方向 具體進(jìn)展預(yù)測MAS多Agent系統(tǒng)???2025年CrewAI、AutoGen、LangGraph等框架的熱門證明MAS可行性和優(yōu)越性;字節(jié)、Anthropic的Deep

Research都采用MAS架構(gòu);2026年有望從開發(fā)者社區(qū)擴展到企業(yè)架構(gòu)。人-機勞動力重組???AI

Agent從任務(wù)自動化到角色自動化;2025年軟件開發(fā)Agent平臺開始內(nèi)置產(chǎn)品經(jīng)理、開發(fā)、測試等角色;HCM平臺或?qū)⑻峁?shù)字員工管理能力,包括訪問權(quán)限、績效評估等。慢思考+端側(cè)操作2025年Deep

Research進(jìn)展看到模型規(guī)劃-執(zhí)行-反思能力的增強;智譜AutoGLM等已探索結(jié)合多模態(tài)、實際操作的端側(cè)通用助手。具身智能 ? 基于世界模型的實體Agent代表最終的專業(yè)化,在機器人、供應(yīng)鏈和自動駕駛等物理世界應(yīng)用中展現(xiàn)價值。2026年AI

Agent重要方向預(yù)測一個常見的MAS示例——拆分為分析助手和文本寫作兩步智譜AutoGLM端側(cè)Agent助手——打印機接入Agent實現(xiàn)缺墨自動購買Medium(AI資訊網(wǎng)站),申萬宏源研究3.4

AI應(yīng)用爆款之四:各項技術(shù)組合之Agent403.5

AI4S:助力科研突破的重要應(yīng)用領(lǐng)域AI4S涉及領(lǐng)域:生命科學(xué)、地球科學(xué)、物質(zhì)科學(xué),包括生物醫(yī)學(xué)、新材料、新能源、半導(dǎo)體、農(nóng)業(yè)等。核心模式:AI4S領(lǐng)域通常缺乏數(shù)據(jù),AI賦能:1)自動數(shù)據(jù)生成(量子第一性原理、自動化實驗室);2)原子級別建模,模擬物質(zhì)微觀行為;3)預(yù)測結(jié)構(gòu)篩選。AI4S涉及多空間、時間尺度計算科學(xué)研究論文《How

tobuild

thevirtualcellwith

artificial

intelligence:

Priorities

andopportunities》,北京科學(xué)智能研究院,晶泰科技官網(wǎng),申萬宏源研究413.6

營銷AI:更早商業(yè)化Marketing領(lǐng)域能夠較大程度發(fā)揮AI大模型價值,AI接受度和滲透率高。數(shù)據(jù)驅(qū)動:利用大數(shù)據(jù)和AI模型優(yōu)化營銷和銷售策略。容錯率高:營銷策略落實的機會成本低,虧損可控,投流策略和合規(guī)風(fēng)險引入人工審核,包容、鼓勵大模型“試錯”以發(fā)現(xiàn)更多優(yōu)秀的營銷方案。ROI可量化:營銷策略的每一步都有明確的日志和財務(wù)記錄,貨幣化模型簡單,便于成本控制和效果評估。美國受訪調(diào)查,Marketing從業(yè)人員使用大模型的比例最高數(shù)據(jù)驅(qū)動容錯率高ROI可量化營銷AI工具廣告投流內(nèi)容營銷用戶運營&轉(zhuǎn)化AIGC內(nèi)容千人千面擴大供給效率提升粘性提升77%71%67%40%38%33%90%80%70%60%50%40%30%20%10%0%營銷AI工具賦能三大板塊各公司財報,HR

Dive(海外新聞網(wǎng)站),申萬宏源研究423.6

營銷AI:更早商業(yè)化AI

Agent在營銷領(lǐng)域的核心價值貢獻(xiàn)在于客戶交互、內(nèi)容生成和數(shù)據(jù)分析客戶交互:被動應(yīng)答→主動服務(wù),如預(yù)測用戶需求、動態(tài)策略調(diào)整。內(nèi)容生成:靜態(tài)工具→動態(tài)創(chuàng)作引擎,實時數(shù)據(jù)反饋與生成式模型結(jié)合。數(shù)據(jù)分析:分析結(jié)果→即時行動指令,提升廣告投放ROI。國內(nèi)邁富時收入2024年增速開始上行海外APPLOVIN收入也在高速增長100%90%80%70%60%50%40%30%20%10%0%50454035302520151050收入(億美元)yoy各公司財報,HR

Dive(海外新聞網(wǎng)站),申萬宏源研究0%20%40%60%80%100%120%1816141210864202020A2021A2022A2023A2024A2025H1收入(億元人民幣)yoy433.7

辦公:標(biāo)準(zhǔn)化軟件壁壘明確,AI迭代效果直觀辦公軟件存在高壁壘,大模型廠商是賦能而不是顛覆生態(tài)復(fù)雜:形成協(xié)同辦公平臺,其項目管理、溝通協(xié)作等形成辦公軟件生態(tài)粘性;交付載體:工作流程圍繞特定辦公軟件,是成果交付的主要載體,使用習(xí)慣形成依賴。標(biāo)準(zhǔn)化SaaS迭代迅速,效果直觀迭代快:產(chǎn)品標(biāo)準(zhǔn)化程度高,在AI應(yīng)用整體較前期階段,實現(xiàn)AI功能的快速迭代推廣。變現(xiàn)快:市場不需要教育,效果呈現(xiàn)直觀,用戶基數(shù)大,商業(yè)化變現(xiàn)效果好。金山WPS已經(jīng)集成多種AI功能,月活快速提升 合合信息將AI嵌入到產(chǎn)品各條線AI閱讀AI文檔問答通過問答精準(zhǔn)總結(jié)段落,精準(zhǔn)定位相關(guān)章節(jié)精讀AI全文總結(jié)總結(jié)全文提煉要點AI劃詞翻譯、專業(yè)術(shù)語釋義AI條件格式 輸入目標(biāo),自動調(diào)用表格指令(例如將F列低于5000的單元格進(jìn)行加粗并標(biāo)黃)AI數(shù)據(jù)AI數(shù)據(jù)分析 直接對已有數(shù)據(jù),按照文字指令進(jìn)行分析,數(shù)據(jù)檢查、關(guān)聯(lián)性分析等AI寫公式 按照文字指令自動生成公式;并且可以對已經(jīng)有的多層嵌套的公式進(jìn)行文字解讀類別 功能 具體效果AI寫作AI伴寫 主動根據(jù)正在編輯的內(nèi)容,理解前文寫出下一句AI幫寫 輸入主題直接生成大綱或全文(文檔形式呈現(xiàn)),并以對話形式進(jìn)行修改AI幫改 智能優(yōu)化文本內(nèi)容,并可更改文本風(fēng)格(更正式/口語化等)靈感市集 已經(jīng)成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論