版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
12報告背景當前,人工智能正朝著AGI的方向邁進。伴隨技術突破與產業(yè)應用的深度融合,人工智能進入全新發(fā)展階段。
2025年被視為“智能體元年”
,AI
Agent已成為驅動產業(yè)變革的核心力量。
智能體通過自主任務規(guī)劃、
動態(tài)決策與閉環(huán)執(zhí)行,實現(xiàn)從被動響應指令到主動解決復雜問題的跨越。
與此同時,各類AI硬件迎來新一輪迭代升級,從輕量化AI眼鏡到便攜AI錄音卡片,硬件設備在便攜性與場景適配性方面不斷突破
?!岸嗄B(tài)模型”進一步打破技術邊界,實現(xiàn)語言理解、視覺識別、
音頻處理等核心能力的深度融合。“世界模型”扮演更為重要的角色,基于內在模擬理解現(xiàn)實世界的物理與因果結構,通過預設未來場景指導決策。在此背景下,天津市人工智能學會、
中關村科學城公司、
深圳市人工智能行業(yè)協(xié)會、
至頂科技、
至頂智庫、
與非網聯(lián)合發(fā)布《通向AGI之路—2025年全球人工智能展望報告》
。
報告從AGI特征出發(fā)
,全面總結全球人工智能產業(yè)的主要參與者、典型產品和應用,對AGI發(fā)展的關鍵領域、核心技術進行分析解讀,并呈現(xiàn)當前關注度較高的智能體、AI硬件及應用進展。
最后,報告對AGI的未來發(fā)展方向進行展望。
報告為政府部門、行業(yè)從業(yè)者、教育工作者以及社會公眾更好了解2025年全球人工智能的發(fā)展進程,以及探索通向AGI的前進路徑提供參考。3中國信通院人工智能研究所副總工程師—王蘊韜達觀數(shù)據董事長兼CEO—陳運文至頂科技CEO兼總編輯—高飛LangGPT社區(qū)創(chuàng)始人—云中江樹明略科技副總裁兼研發(fā)團隊負責人—李夢林明略科技高級產品總監(jiān)/DeepMiner產品負責人—黃楠Plug
and
Play璞躍中國基金合伙人—朱曉雯PlugandPlay璞躍中國投研負責人—楊鈞報告支持專家41.
AI演進路徑與產業(yè)概況2.
邁向AGI的關鍵領域3.
智能體技術與應用進展4.
智能硬件與典型AI應用5.
全球AI企業(yè)最新布局6.
AGI未來發(fā)展路徑探究報告目錄51.
AI演進路徑與產業(yè)概況人工智能演進路徑
何為通用人工智能人工智能全景圖譜人工智能發(fā)展路線圖量子神經網絡(QNN)
:基于量子力學原理設計的新型計算模
型,將傳統(tǒng)神經網絡架構與量子計算
技術相結合
。
核心機制通過引入量子
門避免量子比特的過早坍縮,提升計
算效率。全腦模擬(WBE)
:通過逆向工程復制生物大腦的認知功能
。包含神經符號系統(tǒng)融合和意識連續(xù)性測
試等技術體系。遞歸自我改進(RSI)
:在無人工干預下,自主增強自身能力
。
包含元學習控制器、
代碼自主修改和目標函數(shù)進化等技術路徑。資料來源:至頂智庫結合公開資料整理繪制。1.1通用人工智能成為AI演進路徑的關鍵節(jié)點世界模型:實現(xiàn)AGI的關鍵路徑之
一,世界模型融合物理理解
、
推理
、
規(guī)劃與持久記憶能力。具身智能:實現(xiàn)AGI的關鍵路徑之一,具身智能的本質是讓AI
從虛擬
的信息處理走向真實的物理實踐。AlphaGo:2016
年3月
,
AlphaGo與圍棋世界冠軍
、
職業(yè)九段棋手李世石進行圍棋人機大戰(zhàn),最終擊敗李世石。在特定領域具有感知能力的智能弱人工智能ArtificialNarrowIntelligence在全領域擁有超越人類能力的智能超級人工智能ArtificialSuperIntelligence在跨領域達到人類認知能力的智能通用人工智能ArtificialGeneralIntelligence深藍計算機:1997
年
5
月
,
IBM
“
深藍計算機
”
首次擊敗人類冠軍卡斯帕羅夫。?2025.9ZD
Insights
自主學習不可遷移任務專用跨域推理自主實現(xiàn)自主創(chuàng)新6Anthropic創(chuàng)始人兼首席執(zhí)行官DarioAmodei認為,AGI擁有完整的數(shù)字接口、
可以自主規(guī)劃并長期執(zhí)行任務、
沒有物理實體但可以控制與其連接的任何機器人,訓練資源可以重新部署,以運行數(shù)百萬個示例并且每個示例可獨立運行。Google
Deep
MindGoogleDeepMind聯(lián)合創(chuàng)始人兼首席執(zhí)行官DemisHassabis提出,真正的AGI需要證明“該系統(tǒng)能做到歷史上最優(yōu)秀的人類用相同大腦架構做到的事情。資料來源:至頂智庫結合公開資料整理繪制。
席”AI(
a
n
i,gen“c
,
.
MetaAMI不追求通用性
,而是一種能夠理解物理世界
、
具備推理規(guī)劃能力
、
擁有持久記憶并服從目標導向的智能形式。ANTHROPIC
AMI)進機e,先Intell提出chineLeCuAdvanced
M科學家Yann器智能Meta首1.2何為通用人工智能(AGI)OpenAI聯(lián)合創(chuàng)始人兼首席執(zhí)行官Sam
Altman表示,AGI是一個能夠在人類水平上解決許多領域日益復雜問題的系統(tǒng)。?2025.9ZD
Insights
7Eric
Schmidt
.
●2030Elon
Musk
.-.2026資料來源:至頂智庫結合公開資料整理繪制。關于AGI落地時間,全球人工智能領域的業(yè)內代表紛紛做出預測。
xAI創(chuàng)始人Elon
Musk較為樂觀,他認為AGI已初具雛形
,有望在2026年到來
。
GoogleDeepMind聯(lián)合創(chuàng)始人兼首席執(zhí)行官DemisHassabis與Meta首席AI科學家Yann
LeCun均認為AGI會在2030到2035年到來。
圖靈獎得主Geoffrey
Hinton則持相對保守的立場
,預測AGI將在2030到2045年到來。1.3通用人工智能何時到來2025-20302030-2035
2035-2040
2040-2045?2025.9ZD
Insights
Yann
LeCunDemis
HassabisGeoffreyHinton2035203520458應用硬件層通用智能體編程智能體辦公智能體營銷智能體金融智能體醫(yī)療智能體客服智能體HR智能體工業(yè)智能體1910261066876智能體
開發(fā)平臺智能助手AI手機AI眼鏡&錄音AI
PC智能汽車具身智能AI搜索AI辦公4431111377101426AI寫作AI圖像AI視頻AI音樂AI音頻AI+營銷AI+醫(yī)療AI+金融AI+教育14312091122151614模型層多模態(tài)基礎模型圖像模型視頻模型語音模型開源模型177982523AI芯片AI服務器基礎設施層AI計算集群開發(fā)平臺數(shù)據服務1.42025全球人工智能全景圖譜2025年全球人工智能全景圖譜包含應用硬件層、
模型層以及基礎設施層。
其中
,應用硬件層廣泛覆蓋各細分領域,涉及智能體、
智能助手、
智能硬件、具身智能、C端/B端各類應用;模型層包含多模態(tài)基礎模型、
圖像模型、視頻模型、語音模型、
推理模型、
開源模型;基礎設施層涵蓋AI芯片、AI服務器、AI計算集群、
開發(fā)平臺、
數(shù)據服務。
圖譜中涉及各領域全球具有代表性的AI應用、AI硬件、AI模型以及典型企業(yè),為讀者提供更為詳實的參考信息。2025全球人工智能全景圖譜概覽13
5
9
10
10注:數(shù)字代表圖譜所涉及的企業(yè)、產品應用或模型數(shù)量。資料來源:至頂智庫整理繪制。?2025.9ZD
Insights
推理模型9B
Microsoft
?personalAl
RDevRev-Aise
ra
om
日BasisJoule
Agents
R
e
tnt
AI
Agent
Search
Agent
Bardeen
Agent
Assist
AI
Agent
MeetingAgentBreezeAgentslutraBasis
agents
京東云JoyAgent
Shadow
AI
WPS靈犀
達觀Agent
S
差旅智能體
bo
i
AI
體體能能智智核析審分同場合市體x智能ardmwiftAgent智能分析內容校對智能體校對通多模態(tài)訊飛文書訊飛智文超級智能體樂享企業(yè)Agenr
AgesthycAnalesearChatGPT
agent
GensparkSuper
Agent?Hyper
writeHyperWriteAI
AgentAgent
Maven日
Gradient
LabsOttoya
inF
unc
super
focusGensparkSuper
superhumanAIAgent
agents夸克
天禧個人
天工超級YOYO智能體AI超級框
超級智能體
智能體納米AIGoogleCodexagents
AlphaEvolve
Gemini
CLIJulesClaudeCode
OpenHands
Anysphere-Cursor
Composer
Agent通義靈碼文心快碼Comate
ZuluTencent騰訊ENocode
CodeBuddy
Agent美團NoCodeaiXcoderAgentWordLiftAgentAI
Sales
Agents
Piperthe
AI
SDRJasperAgentsAvasalesagent
xa
yerAuto-PilotAgentsXaverAIagentTencent騰訊
企點營銷云Agent
DeepMiner
有贊智能體智能體SIEMENSIndustrial
Copilot
Industrial
AI
agents
設備維護智能體siE賽意制造業(yè)
智能體Voice
AI
AgentsEcho
ClerkAgentavienticAI
agentsChatBot
AIVoiceAgent
螞蟻數(shù)科
客服智能體七陌客服智能體AI
HR
Agent人事智能助理?Borderless/N
%Te
ziBorderlessAIMaxMoonhub's
AIRecruiter候選人篩選智能體iBuildert`Assort
Health
Voice
AI
agent
HealthcareAgent多synthpopAI
Agents?thoughtful.aiAI
AgentsohyRe
viaAI
ContactCenterAgent醫(yī)療智能體Concourse's
AI
Agentswn.dAlice
AgentAI合規(guī)助手容犀Agent
&
CopilotAI
Agent應用2025全球人工智能全景圖譜—智能體(AIAgent)?2025.9ZD
Insights
Rox
Agent
Workistagent自動化魔術師CoMiAgent資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。manusn.fowithManus
Flowith工業(yè)智能體辦公智能體通用智能體HR智能體編程智能體醫(yī)療智能體本報告來源于三個皮匠報告站(),由用戶Id:349461下載,文檔Id:916235,下載日期:2025-09-23金融智能體
客服智能體crescendo工業(yè)裝備節(jié)能智能體設備管理智能體營銷智能體AutoGLM沉思MiniMax
AgentAI
BankerAgentRoots'
AI
Agents萬智Agent百度心響Pokee
AIAgent10百度文心智能體平臺匯智智能Gnomic智能體平臺阿里云百煉騰訊元器
騰訊云智能體應用開發(fā)平臺開發(fā)平臺極簡未來AI智能體搭建平臺JoyAgent智能體平臺BetterYeahAIAgent開發(fā)平臺
eamon
Dify
copyaiwizr.aienesancenn2025全球人工智能全景圖譜—智能體開發(fā)平臺&智能助手
IIElevenLabs學Moveworks
鈴Decagon
Bricklayer?Dust
Developer
Conversational
AI
AgentStudioMindpalPlatformAgent
OperatingBricklayer
AIPlatform
Procedures
(AOPs)AIAgent開發(fā)平臺智能助手智能體平臺
句子秒懂意言科技TyrionCAIP智能體開發(fā)平臺OmAgent
Studio
智能體構建平臺Amazon
Bedrock
NVIDIA
Azure
Agentforce
3
Dify
SanaUiPath
Agentic
AI
Agent
Studio
GTM
Agent
Wizr
Enterprise
AI
Agent
OS
AIStudio?2025.9ZD
Insights
AgentCore
NeMo
AI
Foundry
Agents
Automation
PlatformPlatform資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。字節(jié)扣子開發(fā)平臺oppoOPPO
智能體平臺BMi
cos
ot
Copilotsnms
unc
Bixby“百寶箱”智能體
訊飛星辰智能體平臺開發(fā)平臺MetaoMeta
AIGoogleGeminiAI
HQWorkato
ONE
AgentX
Beam
Platform國內國外siriSiri國內智譜清言
SkyAgents開放平臺EngineeringMulti-
Agent
AI
SystemsChatGPTClaudeGrok國外星辰智能體平臺小藝開放平臺靈犀語音助手心流AI助手YOYO
助理超級小愛訊飛星火騰訊元寶智譜清言小布助手WPS靈犀DeepSeek文小言百小應問小白階躍AIMiniMax通義天工小藝豆包華知商量n8nAlexa11Kimi 具身智能
1XDynamics
Tesla
Figure
Technologies
宇樹科技
銀河通用
星動紀元
逐際動力優(yōu)必選
傅利葉智能MetaROYNeoRo
kid
2025全球人工智能全景圖譜—硬件&具身&AI搜索&AI辦公AI
搜索AI
辦公智能硬件
AI
PC
DLL
Iech
roo
ges
西聯(lián)想nuwveaPLnuo.AliSlide輕竹辦公筆格PPT歌者PPT博思AIPPT麥當秀
會譯
靈辦AI?2025.9ZD
Insights
與it
Mind億圖腦圖MindMaster
GitMind
perplexityPerplexity孕sup
pr超能文獻Suppr超能文獻騰訊文檔
百度文庫資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。GoogleAI
Mode遲開搜AI搜索開搜AIBi
cro
soft
ingBingC知道beautiful
aiBeautiful.aiLavender訊飛智文AMiner沉思QMi
kuMiku
AI搜索百度智能框博查AI手機智能汽車AI錄音設備AI眼鏡秘塔AI搜索SeekAll""VERSEVERSE萬知AiPPTnDiaWPS
AI
360AI辦公ChatExcel
NotionDia瀏覽器知乎直答FigmaSlidesHelpLookxmind釘釘Boston12象寄千鹿AI妙多AI
百度網盤AI修圖
標小智
Pixso
AI
數(shù)畫造物云AISeedeAI造夢日記
360鴻圖2025全球人工智能全景圖譜—AI寫作&圖像&音視頻&音樂AI
視頻?Hyper
write
HyperWriteSudowrite團新華妙筆
新華妙筆AI寫作樹熊AI寫作AI
圖像AArt
breederFREE
PYKArtbreeder
Freepik?2025.9ZD
Insights
AI
音頻AI
音樂資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。pic
sarfigma
Picsart
ZMO.AIModify
VideoZB騰訊智影Vidu
海螺AI
度加創(chuàng)作工具智譜清影AI
寫作ProWritingAid美圖設計室創(chuàng)客貼有道文檔FM米可智能
魔音工坊藍藻AI火山寫作火龍果寫作光速寫作
筆靈AICanva可畫
稿定AI墨刀Mure
kaMurekarunwayrunway美間
JsDesign易可圖學LONG
SHorMasterGo豆繪AI懶設計
萬相營造ElevenLabsRESEMBLE.AIWellSaid模力視頻MOKI網易天音
歌歌AI寫歌Giiso寫作機器人TME
studioACE
studioEffie寫作訊飛寫作像素蛋糕彩云小夢海綿音樂悅音配音快手可靈synthesiaMidjourneydescriptX
studio和弦派LongShot智小象咻圖AI音剪AI即夢AIBoolvideoHeyGenClipflyPlayAIMURF.AI反譜loomVEED13PikaGoogleMetacuo
tin
go
Quiz
let
道ou
doo
回作業(yè)幫
資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。dcn
son東信
善觀遠數(shù)據Google
Meta
?Gen
Health.ai
2025全球人工智能全景圖譜—AI+營銷&醫(yī)療&金融&教育AI+營銷AI+金融AI+教育AI+醫(yī)療?2025.9ZD
Insights
Meta
BA醫(yī)聯(lián)ANTHROPICRco
hereGoogle14GDALL·E
3Gemini
2.5
Flash
Image(Nano
Banana)StableDiffusion
3.5AuroraSeedream
4.0HunyuanImage
2.1CogView-4SoraVeo
3Gen-4Wan2.2豆包·視頻生成模型
Seedance
1.0
pro混元視頻生成模型可靈2.0視頻生成模型Hailuo
02Vidu
2.0MuseNetLyria
2Stable
Audio
2.0豆包·實時語音模型MiniMax
Speech
2.5GLM-ASRMureka
O1Mureka
V7.5 Llama
4
Hunyuan-Large-Vision
SkyworkUniPic
2.0多模態(tài)基礎模型2025全球人工智能全景圖譜—多模態(tài)模型
Gemini
2.5
Pro
豆包1.6
SenseNova
V6.5
GPT-5
文心4.5系列
MiniCPM-V
4.5?2025.9ZD
Insights
Grok
4CoGenAVGLM-4V-Flash語音模型視頻模型圖像模型MistralMedium
3PixtralLargeMistral
Small
3.1MiniMax-VL-01資料來源:主要體現(xiàn)2024年10月以來推出的各類模型,至頂智庫結合公開資料整理繪制。Grunway階躍AI
Step
3G15推理模型開源模型2025全球人工智能全景圖譜—推理模型&開源模型GPT-5ThinkingGrok
4文心X1.1ERNIE-4.5-21B-A3B-
ThinkingDeepseek-V3.1Deepseek-R1MiniMax-M1Claude
Opus
4.1Claude
Sonnet
4Phi-4-reasoningHunyuan-A13B日日新SenseNova
V6Skywork-OR1Llama
4Qwen3QwQ-32BQwen2.5-Omni-7BSkywork-OR1SkyworkUniPic
2.0
Matrix-Game
2.0Matrix-3DGPT-OSS文心4.5系列ERNIE-4.5-21B-A3B-
ThinkingMiniMax-M1Llama
4LFM2LFM-7Bdoubao-seed-
1.6-thinkingKimi
K2Step
3?2025.9ZD
Insights
Hunyuan-A13BHunyuan-MT-7BGLM-4.5VCogVideoXv1.5CogAgent-9B
Gemini
2.5
Pro
MagistralMistral
Small
3.1
PixtralLargeDeepseek-V3.1Deepseek-R1資料來源:主要體現(xiàn)2024年10月以來推出的各類模型,至頂智庫結合公開資料整理繪制。Qwen3QwQ-32B訊飛星火X1GLM-4.5
Gemma
3
Kimi
K2階躍AI16基礎設施層GO-g
le
cloudMetaintel.Qual
com2025全球人工智能全景圖譜—AI基礎設施
AI芯片envnaAmoa?2025.9ZD
Insights
資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。開發(fā)平臺數(shù)據服務AI服務器AI計算集群GO-g
le
cloudGoogle
cloudD&LL
Techno
ogesMetagretel171.5全球人工智能產業(yè)發(fā)展路線圖(2024-2025)
1.15
1.13
12.19
12.18
,
i?2025.9ZD
Insights
Gemma
3輕量級模型(開源)GeminiRobotics
VLA模型GeminiRobotics-ER視覺語言模型GGemini
2.0
Flash2.5-G
Gemi
0
-Lite2.18態(tài)模型Flash多模ni
2.11.5混元LargeMoE大語言模型(開源)Hunyuan3D-1.0
3D生成大模型(開源)2.142.193.33.63.12NVIDIA
ISAACGR00T
N1機器人基礎模型3.1812.16
Veo
2視頻生成模型Imagen
3圖像生成模型Aurora圖像生成模型G
12.3vlliHailuo
I2V-
01-Live圖生視頻模型12.4OmniSearch通用智能體MiniMax-Text-01基礎語言大模型MiniMax-VL-01視覺多模態(tài)大模型(開源)Matrix-Zero3D場景生成模型Matrix-Zero可交互視頻生成大模型Qwen2.5-VL視覺理解模型Qwen2.5-1M
大模型Qwen2.5-MaxMoE模型Claude
3.7
Sonnet混合推理模型Claude
Code編程智能體資料來源:至頂智庫結合公開資料整理繪制。GLM-4-Air-0111大語言模型GLM-4V-Plus視覺理解模型訊飛星火深度推理模型X1星火語音同傳大模型Gemini
2.0
ProjectAstraProjectMariner
JulesMistralSmall
3.1輕量級模型(開源)Genie
2世界模型G2.24Wan
2.1視頻生成模型(開源)SkyReels-V1視頻生成模型(開源)Skywork-R1V多模態(tài)推理模型(開源)Phi-4-mini-instructPhi-4-multimodalQwen2.5-Coder系列編程模型(開源)混元視頻生成模型(開源)10.2411.8
12.9
Pixtral
Large多模態(tài)模型(開源)QwQ-32B推理模型(開源)CogVideoXv1.5視頻模型(開源)GLM-4-Voice端到端語音模型2.2
2.271.23
1.28Skywork
o1推理模型(開源)T2A-01系列語音生成模型10.25Magma多模態(tài)VLA基礎模型DeepSeek-R1推理模型(開源)豆包·音樂模型4.0豆包·視覺理解模型文心大模型4.5文心大模型X1Codestral
25.01編程模型20242025開放Sora視頻生成模型12.53.13GLM-4V-Flash多模態(tài)模型FastHunyuan混元視頻模型訊飛星火4.0TurboDeepSeek-V3(開源)2.25Grok
3Grok
3
MiniTurbo
S快思考模型Manus通用智能體CogAgent-9B
(開源)星火醫(yī)療大模型X1發(fā)布deep
researchQwen2.5-Turbo夸克AI超級框發(fā)布Operatoro1/o1
ProGPT-4.512.2611.2012.1112.1311.1811.123.173.161.201.16Phi-4LFM-7B1.6181.5全球人工智能產業(yè)發(fā)展路線圖(2024-2025)混元3D
v2.53D生成模型Kimi-Researcher盤古大模型5.5系列6.20Agent
Hailuo
VideoAgent視頻創(chuàng)作智能體豆包1.5·深度思考模型豆包·文生圖模型3.0豆包·視覺理解模型豆包1.5·UI-TARS模型Parakeet-TDT語音識別模型Conan-Embedding-V2
4.22(開源)5.9HunyuanCustom視頻生成模型(開源)文百度文庫GenFlow通用智能體CodestralEmbed代碼嵌入模型5.7
4.304.29天禧個人超級智能體樂享企業(yè)超級智能體城市超級智能體4.28ResearcherAgent
AnalystAgentCosmosPredict-2世界基礎模型6.11GLM-4-32B-0414
系列模型(開源)GPT-4.1GPT-4.1miniGPT-4.1nano5.21T1-Vision視覺深度推理模型混元Voice端到端語音通話模型混元游戲視覺生成模型
4.17 4.18?2025.9ZD
Insights
4.25文心4.5Turbo多模態(tài)模型文心大X1Turbo深度思考模型心響通用智能體文心快碼ComateZulu編程智能體5.155.16Seed-Coder代碼生成模型(開源)Skywork-R1V
2.0多模態(tài)推理模型(開源)Gemini
2.5Flash-LiteGLlama4
Scout
日日新Llama
4
Maverick
SenseNova
V6
Skywork-OR1系列(開源)
多模態(tài)推理模型推理模型(開源)語音生成模型
空間智能大模型(開源)Codex編程智能體Nano
VL多模態(tài)視覺語言模型6.35.28CoGenAV多模態(tài)語音表征模型5.22天工超級智能體PerceptionLanguage
Model視覺語言模型MetaLocate
3D端到端模型(開源)MiniMax-M1MiniMax
MiniMax混合推理模型
Hailuo02(開源)
視頻生成模型Qwen3混合推理模型(開源)
聯(lián)想法律智能體豆包大模型1.6豆包·視頻生成模型Seedance
1.0
pro豆包·實時語音模型5.14MiniMaxSpeech-02Magistral推理模型6.10資料來源:至頂智庫結合公開資料整理繪制。Seed1.5-VL多模態(tài)視覺語言模型豆包1.5·視覺深度Lyria2音樂生成模型GMistralMedium3通義靈碼多模態(tài)模型
編程智能體MurekaV6音樂生成模型MurekaO1音樂推理大模型5.13Matrix-GameWan2.1-VACE-1.3B視頻生成模型(開源)思考模型Seedance
1.0
lite視頻生成模型AssetGen
2.03D基礎模型(開源)3.273.213.253.314.244.54.104.154.134.163.286.4Gemini
2.5GQwen2.5-Omni-7B(開源)Phi-4-reasoning推理模型6.185.19QVQ-Max視頻推理模型3.26AutoGLM沉思通用智能體6.194.23端到端語音大模型OpenAI
o3
o4-mini混元T1推理模型MistralCode6.17197.101.5全球人工智能產業(yè)發(fā)展路線圖(2024-2025)Hunyuan-A13B混合推理模型(開源)6.27Qwen
VLo多模態(tài)理解生成模型?2025.9ZD
Insights
8.26Gemini
2.5
Flash
Image(Nano
Banana)圖像生成模型混元3D世界模型1.0(開源)CodeBuddy
Agent編程智能體企點營銷云Agent騰訊地圖旅游規(guī)劃Agent8.18百度文庫GenFlow2.0通用智能體Skywork-R1V
3.0多模態(tài)推理模型(開源)7.9文心4.5系列模型(開源)6.30豆包·同聲傳譯模型
SeedLiveInterpret2.0Qwen-MT機器翻譯模型Gemini
CLI編程智能體(開源)GGPixel
10系列AI手機TensorG5芯片ERNIE-4.5-21B-A3B-Thinking(開源)文心X1.1深度思考模型Gemma
3n
(開源)G6.26GLM-4.1V-
Thinking
(開源)7.2Skywork-
Reward-V2
(開源)7.4資料來源:至頂智庫結合公開資料整理繪制。8.15
Mureka
V7.5音樂模型SkyworkUniPic
2.0多模態(tài)生成模型(開源)Mureka
TTS
V1音頻模型Mureka
V7
音樂模型9.9Genie
3世界模型Ggpt-oss輕量級語言模型(開源)混元3D世界模型1.0-Lite版本
(開源)MiniCPM-V4.5多模態(tài)模型(開源)Skywork
UniPic多模態(tài)統(tǒng)一預訓練模型(開源)SkyReels-A3音頻驅動人像視頻模型(開源)Hunyuan小尺寸融合推理模型系列(開源)GLM-4.5V視覺推理模型(開源)日日新SenseNova
V6.5多模態(tài)大模型Wan2.2視頻生成模型(開源)Qwen-Image圖像生成模型(開源)Qwen3-Coder-Flash編程模型(開源)Hunyuan3D-PolyGen3D生成大模型豆包·圖像創(chuàng)作模型Seedream4.0Matrix-Game2.0
世界模型(開源)MiniMax
Speech
2.5語音生成模型Qwen3-Coder編程模型(開源)6.258.21HunyuanImage
2.1圖像生成模型Kimi
K2基礎大模型(開源)Nemotron
Nano
2推理模型豆包·圖像編輯模型SeedEdit3.08.13混元Large-
Vision視覺模型GLM-4.5基礎模型(開源)Wan2.2-S2V
視頻生成模型DeepSeek
V3.1
(開源)AutoGLM
2.0通用智能體WebWatcher視覺智能體GClaude
Opus
4.1
7.24ChatGPTAgent文Grok
4GPT-57.278.117.287.308.128.207.237.177.11LFM2-VL8.18.58.48.77.79.3LFM220212.
邁向AGI的關鍵領域推理模型算力基建強化學習開源生態(tài)21驅動AGI發(fā)展關鍵因素:推理+強化學習+算力基建+開源生態(tài)通用人工智能的不斷演進主要由四大因素驅動。
一是模型推理能力的不斷躍升。
DeepSeek相關模型在性能上達到全球開源模型的頂尖水平。
二是強化學習的不斷迭代。
如GRPO等新型算法通過組內相對獎勵機制
,解決傳統(tǒng)PPO算法對價值函數(shù)的依賴問題。
三是算力基建的持續(xù)投入。
美國“星際之門”計劃未來四年投資5000億美元構建AI基礎設施,為大規(guī)模AI模型訓練和推理提供算力基礎
。
四是開源生態(tài)的廣泛構建與繁榮共享。HuggingFace匯聚超6000個可部署開源模型,推動前沿技術快速轉化為生產力,構建全球協(xié)作的創(chuàng)新網絡。?2025.9ZD
Insights
算力基礎設施開源生態(tài)推理+強化學習資料來源:至頂智庫結合公開資料整理繪制。OPY
TorchGRPOToTCoTGoTMoEAI服務器DPOAI芯片AI計算集群RLHFPPORLAIF222.2推理路徑:通過各類算法機制提升模型推理能力大模型基于一套系統(tǒng)化技術路徑來提升其推理能力。
以思維鏈(CoT)
為基礎實現(xiàn)分步推理,通過自我反饋和情境記憶形成動態(tài)調整機制,并借助自一致性校驗確保邏輯一致性。在訓練層面,采用監(jiān)督微調(SFT)
與基于人類反饋強化學習(RLHF)
相結合的方式
,借助優(yōu)勢估計和終端獎勵完成策略更新。
同時,引入對抗性獎勵信號、KL懲罰以及價值函數(shù)訓練以實現(xiàn)策略優(yōu)化的目標。推理時間推理(Inference-timeReasoning)監(jiān)督微調偏好對專家策略示范使用策略生成多路徑離線軌跡長思維鏈示例+監(jiān)督微調近端策略優(yōu)化獎勵計算對抗性獎勵信號近端策略優(yōu)化+KL散度正則化價值函數(shù)訓練拒絕采樣與監(jiān)督微調思維樹思維鏈提示推理與行動自我反饋情景記憶代理自一致性KL散度正則化直接優(yōu)化REINFORCE策略優(yōu)化KL約束正則化價值引導
損失函數(shù)強化學習
友好性對齊策略優(yōu)化獎勵模型訓練參考策略監(jiān)督微調監(jiān)督微調優(yōu)勢估計終端獎勵{0,1}相對策略優(yōu)化?2025.9ZD
Insights
資料來源:LLMPost-Training:ADeep
Diveinto
Reasoning
LargeLanguage
Models,至頂智庫整理繪制。GRPOOREOTRPORLAIFDPORLHF大模型后訓練人工標注232.2推理路徑:
多種范式增強模型應對復雜任務的能力大模型通過多種推理路徑適應不同任務需求
。
基礎范式包括直接輸出(Direct)和思維鏈(CoT)推理。自一致性(Self-consistency)
與多重思維鏈(Multiple
CoT)通過生成多條推理路徑并采用投票機制
,為不確定性任務進行方案擇優(yōu)。
面對需要多路徑探索的復雜任務,思維樹(ToT)
引入樹狀結構,支持分支評估與回溯機制,實現(xiàn)不同路徑之間的探索。
最新提出的思維圖(GoT)則突破樹狀結構的限制,利用圖結構實現(xiàn)路徑間的動態(tài)聚合與信息重組,為更復雜的非線性推理問題提供更優(yōu)的解決思路。大模型推理路徑Direct輸入輸出未評分正向評分負向評分回溯自我精煉投票機制輸出輸出輸出聚合輸出
輸出?2025.9ZD
Insights
資料來源:LLM
Post-Training:
A
Deep
Dive
into
Reasoning
Large
Language
Models
,至頂智庫整理繪制。Self-consistency輸入Multiple
CoT輸入CoT輸入GoT輸入ToT輸入242.3
混合專家架構(MoE):推動推理效率與模型性能突破MoE(Mixture
of
Experts)架構中
,輸入數(shù)據通過前饋神經網絡(Feed-Forward
Neural
Network,
FFNN)
與激活
函數(shù)處理
,再由門控機制為每個專家分配激活概率。
在稠密MoE架構中,所有專家均被激活參與計算,最終輸
出為各專家結果的加權和;在稀疏MoE架構中,僅激活其中若干專家(如圖中激活FFNN1)
,
以提高推理效率
并降低計算資源開銷。該機制實現(xiàn)在保持模型性能的同時,優(yōu)化推理效率,適用于大規(guī)模參數(shù)部署。
近年來,大模型已引入MoE架構以提升參數(shù)利用率和訓練擴展性。路由機制專家1激活(概率高)P
=
.45P=0.37FFNN1FFNN2P=0.52門控機制P=0.08FFNN1FFNN2門控機制?2025.9ZD
Insights25資料來源:
Maarten
Grootendorst,混合專家模型(MoE)
到底是什么?
,至頂智庫結合公開資料整理繪制。激活函數(shù)FFNN4混合專家架構(MoE)原理圖前饋神經網絡FFNN↑
Y加法
+
歸一化.45.31.05.19Xb.
稀疏MoEFFNN4FFNN2FFNN3FFNN1專家被激活的概率混合專家層2/3/4未被激活加法
+
歸一化FFNN4FFNN3a.
稠密MoEFFNN3激活權重
P=0.19P=0.41P=0.32XY24模型蒸餾:壓縮計算復雜度,實現(xiàn)模型高性能和輕量化部署模型蒸餾是指大型復雜模型(教師模型)
的知識遷移到小型高效模型(學生模型)
的技術
,其核心目標是在保持模型性能的同時
,顯著降低模型的計算復雜度和存儲需求
,使模型更適合在資源受限的環(huán)境中部署。
教師模型規(guī)模龐大,性能較高,但在計算和存儲資源上存在較大壓力;
學生模型結構較為簡單
,通過模仿教師模型輸出的軟標簽(概率分布)
學習其知識和表示能力
,軟標簽包含類別間相似性和內在關系的更多信息
,有助于學生模型捕捉潛在特征并提升泛化能力。在實際應用中,DeepSeek-R1對Qwen和Llama等開源模型進行蒸餾,得到更高效的小模型,顯著降低推理成本。
此外,諸如DistilBERT、TinyBERT以及MobileBERT模型也都采用蒸餾技術,用以在保持性能的同時提升效率,推動輕量化模型的發(fā)展和普及。模型蒸餾的原理與機制教師模型?2025.9ZD
Insights
知識數(shù)據資料來源:至頂智庫結合公開資料整理繪制。知識轉移學生模型蒸餾轉移26DeepSeek-R1Kimi-k1.5o1Hermes
3Athene-70BStarling-7BGemma2Qwen2Llama
3Nemotron-4
340BChatGLMDeepSeek-V2deep
seekNWSNN
nexus
rowGoogleAli
babaO
MetaRL
through
CoTRL
through
CoTRL
througt
CoTDPORLHFRLAIF,PPORLHFDPODPODPO,RPOChatGLM-RLHFGRPO2.5
主流模型的后訓練過程已普遍采用強化學習方法當前
,主流大模型利用強化學習技術進一步提效。
強化學習作為機器學習領域的核心技術之一,
由智能體、環(huán)境、
狀態(tài)、行動、
獎勵及策略六大核心部分組成。
與監(jiān)督學習和無監(jiān)督學習不同,強化學習是指智能體通過執(zhí)行動作來影響環(huán)境,并根據環(huán)境反饋的獎勵來調整策略,以便在未來做出更好的決策。目前主流模型的強化學習獎勵
策略后訓練過程均已采用相關強化學習方法進行優(yōu)化。強化學習核心要素模型
企業(yè)
強化學習方法?2025.9ZD
Insights
27資料來源:
Reinforcement
Learning
Enhanced
LLMs:
A
Survey,至頂智庫整理繪制。主流模型后訓練的強化學習方法智能體
環(huán)境下一狀態(tài)環(huán)境初始狀態(tài)強化學習通用流程獎勵策略行動狀態(tài)
行動2.5傳統(tǒng)與簡化強化學習成為大模型提效“雙渦輪”主流大模型在后訓練階段采用的強化學習方法主要包含兩類。
一類是傳統(tǒng)強化學習方法如人類反饋強化學習
(RLHF)
和AI反饋強化學習(RLAIF)
;另一類是簡化強化學習方法如直接偏好優(yōu)化(DPO)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川2025下半年四川省文化館招聘工作人員3人筆試歷年參考題庫附帶答案詳解
- 吉林2025年吉林財經大學招聘合同制科研型教師20人筆試歷年參考題庫附帶答案詳解
- 安全員A證考試能力檢測含答案詳解【基礎題】
- 南充四川南充市市場監(jiān)督管理局下屬事業(yè)單位招聘工作人員筆試歷年參考題庫附帶答案詳解
- 北海2025年廣西北海市合浦縣教育事業(yè)單位引進急需緊缺教師招聘70人筆試歷年參考題庫附帶答案詳解
- 考試(人力資源管理類)歷年參考題庫含答案詳解(5卷合輯)
- 金融投資知識測試2026年基金知識要點試題
- 招聘63人考前自測高頻考點模擬試題附答案詳解(黃金題型)
- 市場營銷策略運用測試題品牌定位策略案例分析題2026
- 安全員A證考試試題(得分題)含完整答案詳解【奪冠系列】
- 2025福建省安全員C證考試(專職安全員)題庫附答案
- 2026中國電氣裝備集團有限公司高層次人才招聘筆試備考試題及答案解析
- 糖尿病酮癥酸中毒治療指南
- 黨群工作部室部管理制度
- 2025至2030年中國兔子養(yǎng)殖行業(yè)市場現(xiàn)狀調查及投資方向研究報告
- 委外施工安全試題及答案
- DBT29-320-2025 天津市建筑工程消能減震隔震技術規(guī)程
- 產品技術維護與保養(yǎng)手冊
- 2024年國家電網招聘之電工類考試題庫(突破訓練)
- 中建公司建筑機電設備安裝工程標準化施工手冊
- 心臟科醫(yī)生在心血管疾病治療及介入手術方面的總結
評論
0/150
提交評論