通向AGI之路-2025年全球人工智能展望報告_第1頁
通向AGI之路-2025年全球人工智能展望報告_第2頁
通向AGI之路-2025年全球人工智能展望報告_第3頁
通向AGI之路-2025年全球人工智能展望報告_第4頁
通向AGI之路-2025年全球人工智能展望報告_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

12報告背景當前,人工智能正朝著AGI的方向邁進。伴隨技術突破與產業(yè)應用的深度融合,人工智能進入全新發(fā)展階段。

2025年被視為“智能體元年”

,AI

Agent已成為驅動產業(yè)變革的核心力量。

智能體通過自主任務規(guī)劃、

動態(tài)決策與閉環(huán)執(zhí)行,實現(xiàn)從被動響應指令到主動解決復雜問題的跨越。

與此同時,各類AI硬件迎來新一輪迭代升級,從輕量化AI眼鏡到便攜AI錄音卡片,硬件設備在便攜性與場景適配性方面不斷突破

?!岸嗄B(tài)模型”進一步打破技術邊界,實現(xiàn)語言理解、視覺識別、

音頻處理等核心能力的深度融合。“世界模型”扮演更為重要的角色,基于內在模擬理解現(xiàn)實世界的物理與因果結構,通過預設未來場景指導決策。在此背景下,天津市人工智能學會、

中關村科學城公司、

深圳市人工智能行業(yè)協(xié)會、

至頂科技、

至頂智庫、

與非網聯(lián)合發(fā)布《通向AGI之路—2025年全球人工智能展望報告》

。

報告從AGI特征出發(fā)

,全面總結全球人工智能產業(yè)的主要參與者、典型產品和應用,對AGI發(fā)展的關鍵領域、核心技術進行分析解讀,并呈現(xiàn)當前關注度較高的智能體、AI硬件及應用進展。

最后,報告對AGI的未來發(fā)展方向進行展望。

報告為政府部門、行業(yè)從業(yè)者、教育工作者以及社會公眾更好了解2025年全球人工智能的發(fā)展進程,以及探索通向AGI的前進路徑提供參考。3中國信通院人工智能研究所副總工程師—王蘊韜達觀數(shù)據董事長兼CEO—陳運文至頂科技CEO兼總編輯—高飛LangGPT社區(qū)創(chuàng)始人—云中江樹明略科技副總裁兼研發(fā)團隊負責人—李夢林明略科技高級產品總監(jiān)/DeepMiner產品負責人—黃楠Plug

and

Play璞躍中國基金合伙人—朱曉雯PlugandPlay璞躍中國投研負責人—楊鈞報告支持專家41.

AI演進路徑與產業(yè)概況2.

邁向AGI的關鍵領域3.

智能體技術與應用進展4.

智能硬件與典型AI應用5.

全球AI企業(yè)最新布局6.

AGI未來發(fā)展路徑探究報告目錄51.

AI演進路徑與產業(yè)概況人工智能演進路徑

何為通用人工智能人工智能全景圖譜人工智能發(fā)展路線圖量子神經網絡(QNN)

:基于量子力學原理設計的新型計算模

型,將傳統(tǒng)神經網絡架構與量子計算

技術相結合

。

核心機制通過引入量子

門避免量子比特的過早坍縮,提升計

算效率。全腦模擬(WBE)

:通過逆向工程復制生物大腦的認知功能

。包含神經符號系統(tǒng)融合和意識連續(xù)性測

試等技術體系。遞歸自我改進(RSI)

:在無人工干預下,自主增強自身能力

。

包含元學習控制器、

代碼自主修改和目標函數(shù)進化等技術路徑。資料來源:至頂智庫結合公開資料整理繪制。1.1通用人工智能成為AI演進路徑的關鍵節(jié)點世界模型:實現(xiàn)AGI的關鍵路徑之

一,世界模型融合物理理解

、

推理

規(guī)劃與持久記憶能力。具身智能:實現(xiàn)AGI的關鍵路徑之一,具身智能的本質是讓AI

從虛擬

的信息處理走向真實的物理實踐。AlphaGo:2016

年3月

,

AlphaGo與圍棋世界冠軍

、

職業(yè)九段棋手李世石進行圍棋人機大戰(zhàn),最終擊敗李世石。在特定領域具有感知能力的智能弱人工智能ArtificialNarrowIntelligence在全領域擁有超越人類能力的智能超級人工智能ArtificialSuperIntelligence在跨領域達到人類認知能力的智能通用人工智能ArtificialGeneralIntelligence深藍計算機:1997

5

IBM

深藍計算機

首次擊敗人類冠軍卡斯帕羅夫。?2025.9ZD

Insights

自主學習不可遷移任務專用跨域推理自主實現(xiàn)自主創(chuàng)新6Anthropic創(chuàng)始人兼首席執(zhí)行官DarioAmodei認為,AGI擁有完整的數(shù)字接口、

可以自主規(guī)劃并長期執(zhí)行任務、

沒有物理實體但可以控制與其連接的任何機器人,訓練資源可以重新部署,以運行數(shù)百萬個示例并且每個示例可獨立運行。Google

Deep

MindGoogleDeepMind聯(lián)合創(chuàng)始人兼首席執(zhí)行官DemisHassabis提出,真正的AGI需要證明“該系統(tǒng)能做到歷史上最優(yōu)秀的人類用相同大腦架構做到的事情。資料來源:至頂智庫結合公開資料整理繪制。

席”AI(

a

n

i,gen“c

,

.

MetaAMI不追求通用性

,而是一種能夠理解物理世界

具備推理規(guī)劃能力

、

擁有持久記憶并服從目標導向的智能形式。ANTHROPIC

AMI)進機e,先Intell提出chineLeCuAdvanced

M科學家Yann器智能Meta首1.2何為通用人工智能(AGI)OpenAI聯(lián)合創(chuàng)始人兼首席執(zhí)行官Sam

Altman表示,AGI是一個能夠在人類水平上解決許多領域日益復雜問題的系統(tǒng)。?2025.9ZD

Insights

7Eric

Schmidt

.

●2030Elon

Musk

.-.2026資料來源:至頂智庫結合公開資料整理繪制。關于AGI落地時間,全球人工智能領域的業(yè)內代表紛紛做出預測。

xAI創(chuàng)始人Elon

Musk較為樂觀,他認為AGI已初具雛形

,有望在2026年到來

GoogleDeepMind聯(lián)合創(chuàng)始人兼首席執(zhí)行官DemisHassabis與Meta首席AI科學家Yann

LeCun均認為AGI會在2030到2035年到來。

圖靈獎得主Geoffrey

Hinton則持相對保守的立場

,預測AGI將在2030到2045年到來。1.3通用人工智能何時到來2025-20302030-2035

2035-2040

2040-2045?2025.9ZD

Insights

Yann

LeCunDemis

HassabisGeoffreyHinton2035203520458應用硬件層通用智能體編程智能體辦公智能體營銷智能體金融智能體醫(yī)療智能體客服智能體HR智能體工業(yè)智能體1910261066876智能體

開發(fā)平臺智能助手AI手機AI眼鏡&錄音AI

PC智能汽車具身智能AI搜索AI辦公4431111377101426AI寫作AI圖像AI視頻AI音樂AI音頻AI+營銷AI+醫(yī)療AI+金融AI+教育14312091122151614模型層多模態(tài)基礎模型圖像模型視頻模型語音模型開源模型177982523AI芯片AI服務器基礎設施層AI計算集群開發(fā)平臺數(shù)據服務1.42025全球人工智能全景圖譜2025年全球人工智能全景圖譜包含應用硬件層、

模型層以及基礎設施層。

其中

,應用硬件層廣泛覆蓋各細分領域,涉及智能體、

智能助手、

智能硬件、具身智能、C端/B端各類應用;模型層包含多模態(tài)基礎模型、

圖像模型、視頻模型、語音模型、

推理模型、

開源模型;基礎設施層涵蓋AI芯片、AI服務器、AI計算集群、

開發(fā)平臺、

數(shù)據服務。

圖譜中涉及各領域全球具有代表性的AI應用、AI硬件、AI模型以及典型企業(yè),為讀者提供更為詳實的參考信息。2025全球人工智能全景圖譜概覽13

5

9

10

10注:數(shù)字代表圖譜所涉及的企業(yè)、產品應用或模型數(shù)量。資料來源:至頂智庫整理繪制。?2025.9ZD

Insights

推理模型9B

Microsoft

?personalAl

RDevRev-Aise

ra

om

日BasisJoule

Agents

R

e

tnt

AI

Agent

Search

Agent

Bardeen

Agent

Assist

AI

Agent

MeetingAgentBreezeAgentslutraBasis

agents

京東云JoyAgent

Shadow

AI

WPS靈犀

達觀Agent

S

差旅智能體

bo

i

AI

體體能能智智核析審分同場合市體x智能ardmwiftAgent智能分析內容校對智能體校對通多模態(tài)訊飛文書訊飛智文超級智能體樂享企業(yè)Agenr

AgesthycAnalesearChatGPT

agent

GensparkSuper

Agent?Hyper

writeHyperWriteAI

AgentAgent

Maven日

Gradient

LabsOttoya

inF

unc

super

focusGensparkSuper

superhumanAIAgent

agents夸克

天禧個人

天工超級YOYO智能體AI超級框

超級智能體

智能體納米AIGoogleCodexagents

AlphaEvolve

Gemini

CLIJulesClaudeCode

OpenHands

Anysphere-Cursor

Composer

Agent通義靈碼文心快碼Comate

ZuluTencent騰訊ENocode

CodeBuddy

Agent美團NoCodeaiXcoderAgentWordLiftAgentAI

Sales

Agents

Piperthe

AI

SDRJasperAgentsAvasalesagent

xa

yerAuto-PilotAgentsXaverAIagentTencent騰訊

企點營銷云Agent

DeepMiner

有贊智能體智能體SIEMENSIndustrial

Copilot

Industrial

AI

agents

設備維護智能體siE賽意制造業(yè)

智能體Voice

AI

AgentsEcho

ClerkAgentavienticAI

agentsChatBot

AIVoiceAgent

螞蟻數(shù)科

客服智能體七陌客服智能體AI

HR

Agent人事智能助理?Borderless/N

%Te

ziBorderlessAIMaxMoonhub's

AIRecruiter候選人篩選智能體iBuildert`Assort

Health

Voice

AI

agent

HealthcareAgent多synthpopAI

Agents?thoughtful.aiAI

AgentsohyRe

viaAI

ContactCenterAgent醫(yī)療智能體Concourse's

AI

Agentswn.dAlice

AgentAI合規(guī)助手容犀Agent

&

CopilotAI

Agent應用2025全球人工智能全景圖譜—智能體(AIAgent)?2025.9ZD

Insights

Rox

Agent

Workistagent自動化魔術師CoMiAgent資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。manusn.fowithManus

Flowith工業(yè)智能體辦公智能體通用智能體HR智能體編程智能體醫(yī)療智能體本報告來源于三個皮匠報告站(),由用戶Id:349461下載,文檔Id:916235,下載日期:2025-09-23金融智能體

客服智能體crescendo工業(yè)裝備節(jié)能智能體設備管理智能體營銷智能體AutoGLM沉思MiniMax

AgentAI

BankerAgentRoots'

AI

Agents萬智Agent百度心響Pokee

AIAgent10百度文心智能體平臺匯智智能Gnomic智能體平臺阿里云百煉騰訊元器

騰訊云智能體應用開發(fā)平臺開發(fā)平臺極簡未來AI智能體搭建平臺JoyAgent智能體平臺BetterYeahAIAgent開發(fā)平臺

eamon

Dify

copyaiwizr.aienesancenn2025全球人工智能全景圖譜—智能體開發(fā)平臺&智能助手

IIElevenLabs學Moveworks

鈴Decagon

Bricklayer?Dust

Developer

Conversational

AI

AgentStudioMindpalPlatformAgent

OperatingBricklayer

AIPlatform

Procedures

(AOPs)AIAgent開發(fā)平臺智能助手智能體平臺

句子秒懂意言科技TyrionCAIP智能體開發(fā)平臺OmAgent

Studio

智能體構建平臺Amazon

Bedrock

NVIDIA

Azure

Agentforce

3

Dify

SanaUiPath

Agentic

AI

Agent

Studio

GTM

Agent

Wizr

Enterprise

AI

Agent

OS

AIStudio?2025.9ZD

Insights

AgentCore

NeMo

AI

Foundry

Agents

Automation

PlatformPlatform資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。字節(jié)扣子開發(fā)平臺oppoOPPO

智能體平臺BMi

cos

ot

Copilotsnms

unc

Bixby“百寶箱”智能體

訊飛星辰智能體平臺開發(fā)平臺MetaoMeta

AIGoogleGeminiAI

HQWorkato

ONE

AgentX

Beam

Platform國內國外siriSiri國內智譜清言

SkyAgents開放平臺EngineeringMulti-

Agent

AI

SystemsChatGPTClaudeGrok國外星辰智能體平臺小藝開放平臺靈犀語音助手心流AI助手YOYO

助理超級小愛訊飛星火騰訊元寶智譜清言小布助手WPS靈犀DeepSeek文小言百小應問小白階躍AIMiniMax通義天工小藝豆包華知商量n8nAlexa11Kimi 具身智能

1XDynamics

Tesla

Figure

Technologies

宇樹科技

銀河通用

星動紀元

逐際動力優(yōu)必選

傅利葉智能MetaROYNeoRo

kid

2025全球人工智能全景圖譜—硬件&具身&AI搜索&AI辦公AI

搜索AI

辦公智能硬件

AI

PC

DLL

Iech

roo

ges

西聯(lián)想nuwveaPLnuo.AliSlide輕竹辦公筆格PPT歌者PPT博思AIPPT麥當秀

會譯

靈辦AI?2025.9ZD

Insights

與it

Mind億圖腦圖MindMaster

GitMind

perplexityPerplexity孕sup

pr超能文獻Suppr超能文獻騰訊文檔

百度文庫資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。GoogleAI

Mode遲開搜AI搜索開搜AIBi

cro

soft

ingBingC知道beautiful

aiBeautiful.aiLavender訊飛智文AMiner沉思QMi

kuMiku

AI搜索百度智能框博查AI手機智能汽車AI錄音設備AI眼鏡秘塔AI搜索SeekAll""VERSEVERSE萬知AiPPTnDiaWPS

AI

360AI辦公ChatExcel

NotionDia瀏覽器知乎直答FigmaSlidesHelpLookxmind釘釘Boston12象寄千鹿AI妙多AI

百度網盤AI修圖

標小智

Pixso

AI

數(shù)畫造物云AISeedeAI造夢日記

360鴻圖2025全球人工智能全景圖譜—AI寫作&圖像&音視頻&音樂AI

視頻?Hyper

write

HyperWriteSudowrite團新華妙筆

新華妙筆AI寫作樹熊AI寫作AI

圖像AArt

breederFREE

PYKArtbreeder

Freepik?2025.9ZD

Insights

AI

音頻AI

音樂資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。pic

sarfigma

Picsart

ZMO.AIModify

VideoZB騰訊智影Vidu

海螺AI

度加創(chuàng)作工具智譜清影AI

寫作ProWritingAid美圖設計室創(chuàng)客貼有道文檔FM米可智能

魔音工坊藍藻AI火山寫作火龍果寫作光速寫作

筆靈AICanva可畫

稿定AI墨刀Mure

kaMurekarunwayrunway美間

JsDesign易可圖學LONG

SHorMasterGo豆繪AI懶設計

萬相營造ElevenLabsRESEMBLE.AIWellSaid模力視頻MOKI網易天音

歌歌AI寫歌Giiso寫作機器人TME

studioACE

studioEffie寫作訊飛寫作像素蛋糕彩云小夢海綿音樂悅音配音快手可靈synthesiaMidjourneydescriptX

studio和弦派LongShot智小象咻圖AI音剪AI即夢AIBoolvideoHeyGenClipflyPlayAIMURF.AI反譜loomVEED13PikaGoogleMetacuo

tin

go

Quiz

let

道ou

doo

回作業(yè)幫

資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。dcn

son東信

善觀遠數(shù)據Google

Meta

?Gen

Health.ai

2025全球人工智能全景圖譜—AI+營銷&醫(yī)療&金融&教育AI+營銷AI+金融AI+教育AI+醫(yī)療?2025.9ZD

Insights

Meta

BA醫(yī)聯(lián)ANTHROPICRco

hereGoogle14GDALL·E

3Gemini

2.5

Flash

Image(Nano

Banana)StableDiffusion

3.5AuroraSeedream

4.0HunyuanImage

2.1CogView-4SoraVeo

3Gen-4Wan2.2豆包·視頻生成模型

Seedance

1.0

pro混元視頻生成模型可靈2.0視頻生成模型Hailuo

02Vidu

2.0MuseNetLyria

2Stable

Audio

2.0豆包·實時語音模型MiniMax

Speech

2.5GLM-ASRMureka

O1Mureka

V7.5 Llama

4

Hunyuan-Large-Vision

SkyworkUniPic

2.0多模態(tài)基礎模型2025全球人工智能全景圖譜—多模態(tài)模型

Gemini

2.5

Pro

豆包1.6

SenseNova

V6.5

GPT-5

文心4.5系列

MiniCPM-V

4.5?2025.9ZD

Insights

Grok

4CoGenAVGLM-4V-Flash語音模型視頻模型圖像模型MistralMedium

3PixtralLargeMistral

Small

3.1MiniMax-VL-01資料來源:主要體現(xiàn)2024年10月以來推出的各類模型,至頂智庫結合公開資料整理繪制。Grunway階躍AI

Step

3G15推理模型開源模型2025全球人工智能全景圖譜—推理模型&開源模型GPT-5ThinkingGrok

4文心X1.1ERNIE-4.5-21B-A3B-

ThinkingDeepseek-V3.1Deepseek-R1MiniMax-M1Claude

Opus

4.1Claude

Sonnet

4Phi-4-reasoningHunyuan-A13B日日新SenseNova

V6Skywork-OR1Llama

4Qwen3QwQ-32BQwen2.5-Omni-7BSkywork-OR1SkyworkUniPic

2.0

Matrix-Game

2.0Matrix-3DGPT-OSS文心4.5系列ERNIE-4.5-21B-A3B-

ThinkingMiniMax-M1Llama

4LFM2LFM-7Bdoubao-seed-

1.6-thinkingKimi

K2Step

3?2025.9ZD

Insights

Hunyuan-A13BHunyuan-MT-7BGLM-4.5VCogVideoXv1.5CogAgent-9B

Gemini

2.5

Pro

MagistralMistral

Small

3.1

PixtralLargeDeepseek-V3.1Deepseek-R1資料來源:主要體現(xiàn)2024年10月以來推出的各類模型,至頂智庫結合公開資料整理繪制。Qwen3QwQ-32B訊飛星火X1GLM-4.5

Gemma

3

Kimi

K2階躍AI16基礎設施層GO-g

le

cloudMetaintel.Qual

com2025全球人工智能全景圖譜—AI基礎設施

AI芯片envnaAmoa?2025.9ZD

Insights

資料來源:企業(yè)/產品/應用排序不分先后,至頂智庫結合公開資料整理繪制。開發(fā)平臺數(shù)據服務AI服務器AI計算集群GO-g

le

cloudGoogle

cloudD&LL

Techno

ogesMetagretel171.5全球人工智能產業(yè)發(fā)展路線圖(2024-2025)

1.15

1.13

12.19

12.18

,

i?2025.9ZD

Insights

Gemma

3輕量級模型(開源)GeminiRobotics

VLA模型GeminiRobotics-ER視覺語言模型GGemini

2.0

Flash2.5-G

Gemi

0

-Lite2.18態(tài)模型Flash多模ni

2.11.5混元LargeMoE大語言模型(開源)Hunyuan3D-1.0

3D生成大模型(開源)2.142.193.33.63.12NVIDIA

ISAACGR00T

N1機器人基礎模型3.1812.16

Veo

2視頻生成模型Imagen

3圖像生成模型Aurora圖像生成模型G

12.3vlliHailuo

I2V-

01-Live圖生視頻模型12.4OmniSearch通用智能體MiniMax-Text-01基礎語言大模型MiniMax-VL-01視覺多模態(tài)大模型(開源)Matrix-Zero3D場景生成模型Matrix-Zero可交互視頻生成大模型Qwen2.5-VL視覺理解模型Qwen2.5-1M

大模型Qwen2.5-MaxMoE模型Claude

3.7

Sonnet混合推理模型Claude

Code編程智能體資料來源:至頂智庫結合公開資料整理繪制。GLM-4-Air-0111大語言模型GLM-4V-Plus視覺理解模型訊飛星火深度推理模型X1星火語音同傳大模型Gemini

2.0

ProjectAstraProjectMariner

JulesMistralSmall

3.1輕量級模型(開源)Genie

2世界模型G2.24Wan

2.1視頻生成模型(開源)SkyReels-V1視頻生成模型(開源)Skywork-R1V多模態(tài)推理模型(開源)Phi-4-mini-instructPhi-4-multimodalQwen2.5-Coder系列編程模型(開源)混元視頻生成模型(開源)10.2411.8

12.9

Pixtral

Large多模態(tài)模型(開源)QwQ-32B推理模型(開源)CogVideoXv1.5視頻模型(開源)GLM-4-Voice端到端語音模型2.2

2.271.23

1.28Skywork

o1推理模型(開源)T2A-01系列語音生成模型10.25Magma多模態(tài)VLA基礎模型DeepSeek-R1推理模型(開源)豆包·音樂模型4.0豆包·視覺理解模型文心大模型4.5文心大模型X1Codestral

25.01編程模型20242025開放Sora視頻生成模型12.53.13GLM-4V-Flash多模態(tài)模型FastHunyuan混元視頻模型訊飛星火4.0TurboDeepSeek-V3(開源)2.25Grok

3Grok

3

MiniTurbo

S快思考模型Manus通用智能體CogAgent-9B

(開源)星火醫(yī)療大模型X1發(fā)布deep

researchQwen2.5-Turbo夸克AI超級框發(fā)布Operatoro1/o1

ProGPT-4.512.2611.2012.1112.1311.1811.123.173.161.201.16Phi-4LFM-7B1.6181.5全球人工智能產業(yè)發(fā)展路線圖(2024-2025)混元3D

v2.53D生成模型Kimi-Researcher盤古大模型5.5系列6.20Agent

Hailuo

VideoAgent視頻創(chuàng)作智能體豆包1.5·深度思考模型豆包·文生圖模型3.0豆包·視覺理解模型豆包1.5·UI-TARS模型Parakeet-TDT語音識別模型Conan-Embedding-V2

4.22(開源)5.9HunyuanCustom視頻生成模型(開源)文百度文庫GenFlow通用智能體CodestralEmbed代碼嵌入模型5.7

4.304.29天禧個人超級智能體樂享企業(yè)超級智能體城市超級智能體4.28ResearcherAgent

AnalystAgentCosmosPredict-2世界基礎模型6.11GLM-4-32B-0414

系列模型(開源)GPT-4.1GPT-4.1miniGPT-4.1nano5.21T1-Vision視覺深度推理模型混元Voice端到端語音通話模型混元游戲視覺生成模型

4.17 4.18?2025.9ZD

Insights

4.25文心4.5Turbo多模態(tài)模型文心大X1Turbo深度思考模型心響通用智能體文心快碼ComateZulu編程智能體5.155.16Seed-Coder代碼生成模型(開源)Skywork-R1V

2.0多模態(tài)推理模型(開源)Gemini

2.5Flash-LiteGLlama4

Scout

日日新Llama

4

Maverick

SenseNova

V6

Skywork-OR1系列(開源)

多模態(tài)推理模型推理模型(開源)語音生成模型

空間智能大模型(開源)Codex編程智能體Nano

VL多模態(tài)視覺語言模型6.35.28CoGenAV多模態(tài)語音表征模型5.22天工超級智能體PerceptionLanguage

Model視覺語言模型MetaLocate

3D端到端模型(開源)MiniMax-M1MiniMax

MiniMax混合推理模型

Hailuo02(開源)

視頻生成模型Qwen3混合推理模型(開源)

聯(lián)想法律智能體豆包大模型1.6豆包·視頻生成模型Seedance

1.0

pro豆包·實時語音模型5.14MiniMaxSpeech-02Magistral推理模型6.10資料來源:至頂智庫結合公開資料整理繪制。Seed1.5-VL多模態(tài)視覺語言模型豆包1.5·視覺深度Lyria2音樂生成模型GMistralMedium3通義靈碼多模態(tài)模型

編程智能體MurekaV6音樂生成模型MurekaO1音樂推理大模型5.13Matrix-GameWan2.1-VACE-1.3B視頻生成模型(開源)思考模型Seedance

1.0

lite視頻生成模型AssetGen

2.03D基礎模型(開源)3.273.213.253.314.244.54.104.154.134.163.286.4Gemini

2.5GQwen2.5-Omni-7B(開源)Phi-4-reasoning推理模型6.185.19QVQ-Max視頻推理模型3.26AutoGLM沉思通用智能體6.194.23端到端語音大模型OpenAI

o3

o4-mini混元T1推理模型MistralCode6.17197.101.5全球人工智能產業(yè)發(fā)展路線圖(2024-2025)Hunyuan-A13B混合推理模型(開源)6.27Qwen

VLo多模態(tài)理解生成模型?2025.9ZD

Insights

8.26Gemini

2.5

Flash

Image(Nano

Banana)圖像生成模型混元3D世界模型1.0(開源)CodeBuddy

Agent編程智能體企點營銷云Agent騰訊地圖旅游規(guī)劃Agent8.18百度文庫GenFlow2.0通用智能體Skywork-R1V

3.0多模態(tài)推理模型(開源)7.9文心4.5系列模型(開源)6.30豆包·同聲傳譯模型

SeedLiveInterpret2.0Qwen-MT機器翻譯模型Gemini

CLI編程智能體(開源)GGPixel

10系列AI手機TensorG5芯片ERNIE-4.5-21B-A3B-Thinking(開源)文心X1.1深度思考模型Gemma

3n

(開源)G6.26GLM-4.1V-

Thinking

(開源)7.2Skywork-

Reward-V2

(開源)7.4資料來源:至頂智庫結合公開資料整理繪制。8.15

Mureka

V7.5音樂模型SkyworkUniPic

2.0多模態(tài)生成模型(開源)Mureka

TTS

V1音頻模型Mureka

V7

音樂模型9.9Genie

3世界模型Ggpt-oss輕量級語言模型(開源)混元3D世界模型1.0-Lite版本

(開源)MiniCPM-V4.5多模態(tài)模型(開源)Skywork

UniPic多模態(tài)統(tǒng)一預訓練模型(開源)SkyReels-A3音頻驅動人像視頻模型(開源)Hunyuan小尺寸融合推理模型系列(開源)GLM-4.5V視覺推理模型(開源)日日新SenseNova

V6.5多模態(tài)大模型Wan2.2視頻生成模型(開源)Qwen-Image圖像生成模型(開源)Qwen3-Coder-Flash編程模型(開源)Hunyuan3D-PolyGen3D生成大模型豆包·圖像創(chuàng)作模型Seedream4.0Matrix-Game2.0

世界模型(開源)MiniMax

Speech

2.5語音生成模型Qwen3-Coder編程模型(開源)6.258.21HunyuanImage

2.1圖像生成模型Kimi

K2基礎大模型(開源)Nemotron

Nano

2推理模型豆包·圖像編輯模型SeedEdit3.08.13混元Large-

Vision視覺模型GLM-4.5基礎模型(開源)Wan2.2-S2V

視頻生成模型DeepSeek

V3.1

(開源)AutoGLM

2.0通用智能體WebWatcher視覺智能體GClaude

Opus

4.1

7.24ChatGPTAgent文Grok

4GPT-57.278.117.287.308.128.207.237.177.11LFM2-VL8.18.58.48.77.79.3LFM220212.

邁向AGI的關鍵領域推理模型算力基建強化學習開源生態(tài)21驅動AGI發(fā)展關鍵因素:推理+強化學習+算力基建+開源生態(tài)通用人工智能的不斷演進主要由四大因素驅動。

一是模型推理能力的不斷躍升。

DeepSeek相關模型在性能上達到全球開源模型的頂尖水平。

二是強化學習的不斷迭代。

如GRPO等新型算法通過組內相對獎勵機制

,解決傳統(tǒng)PPO算法對價值函數(shù)的依賴問題。

三是算力基建的持續(xù)投入。

美國“星際之門”計劃未來四年投資5000億美元構建AI基礎設施,為大規(guī)模AI模型訓練和推理提供算力基礎

。

四是開源生態(tài)的廣泛構建與繁榮共享。HuggingFace匯聚超6000個可部署開源模型,推動前沿技術快速轉化為生產力,構建全球協(xié)作的創(chuàng)新網絡。?2025.9ZD

Insights

算力基礎設施開源生態(tài)推理+強化學習資料來源:至頂智庫結合公開資料整理繪制。OPY

TorchGRPOToTCoTGoTMoEAI服務器DPOAI芯片AI計算集群RLHFPPORLAIF222.2推理路徑:通過各類算法機制提升模型推理能力大模型基于一套系統(tǒng)化技術路徑來提升其推理能力。

以思維鏈(CoT)

為基礎實現(xiàn)分步推理,通過自我反饋和情境記憶形成動態(tài)調整機制,并借助自一致性校驗確保邏輯一致性。在訓練層面,采用監(jiān)督微調(SFT)

與基于人類反饋強化學習(RLHF)

相結合的方式

,借助優(yōu)勢估計和終端獎勵完成策略更新。

同時,引入對抗性獎勵信號、KL懲罰以及價值函數(shù)訓練以實現(xiàn)策略優(yōu)化的目標。推理時間推理(Inference-timeReasoning)監(jiān)督微調偏好對專家策略示范使用策略生成多路徑離線軌跡長思維鏈示例+監(jiān)督微調近端策略優(yōu)化獎勵計算對抗性獎勵信號近端策略優(yōu)化+KL散度正則化價值函數(shù)訓練拒絕采樣與監(jiān)督微調思維樹思維鏈提示推理與行動自我反饋情景記憶代理自一致性KL散度正則化直接優(yōu)化REINFORCE策略優(yōu)化KL約束正則化價值引導

損失函數(shù)強化學習

友好性對齊策略優(yōu)化獎勵模型訓練參考策略監(jiān)督微調監(jiān)督微調優(yōu)勢估計終端獎勵{0,1}相對策略優(yōu)化?2025.9ZD

Insights

資料來源:LLMPost-Training:ADeep

Diveinto

Reasoning

LargeLanguage

Models,至頂智庫整理繪制。GRPOOREOTRPORLAIFDPORLHF大模型后訓練人工標注232.2推理路徑:

多種范式增強模型應對復雜任務的能力大模型通過多種推理路徑適應不同任務需求

。

基礎范式包括直接輸出(Direct)和思維鏈(CoT)推理。自一致性(Self-consistency)

與多重思維鏈(Multiple

CoT)通過生成多條推理路徑并采用投票機制

,為不確定性任務進行方案擇優(yōu)。

面對需要多路徑探索的復雜任務,思維樹(ToT)

引入樹狀結構,支持分支評估與回溯機制,實現(xiàn)不同路徑之間的探索。

最新提出的思維圖(GoT)則突破樹狀結構的限制,利用圖結構實現(xiàn)路徑間的動態(tài)聚合與信息重組,為更復雜的非線性推理問題提供更優(yōu)的解決思路。大模型推理路徑Direct輸入輸出未評分正向評分負向評分回溯自我精煉投票機制輸出輸出輸出聚合輸出

輸出?2025.9ZD

Insights

資料來源:LLM

Post-Training:

A

Deep

Dive

into

Reasoning

Large

Language

Models

,至頂智庫整理繪制。Self-consistency輸入Multiple

CoT輸入CoT輸入GoT輸入ToT輸入242.3

混合專家架構(MoE):推動推理效率與模型性能突破MoE(Mixture

of

Experts)架構中

,輸入數(shù)據通過前饋神經網絡(Feed-Forward

Neural

Network,

FFNN)

與激活

函數(shù)處理

,再由門控機制為每個專家分配激活概率。

在稠密MoE架構中,所有專家均被激活參與計算,最終輸

出為各專家結果的加權和;在稀疏MoE架構中,僅激活其中若干專家(如圖中激活FFNN1)

以提高推理效率

并降低計算資源開銷。該機制實現(xiàn)在保持模型性能的同時,優(yōu)化推理效率,適用于大規(guī)模參數(shù)部署。

近年來,大模型已引入MoE架構以提升參數(shù)利用率和訓練擴展性。路由機制專家1激活(概率高)P

=

.45P=0.37FFNN1FFNN2P=0.52門控機制P=0.08FFNN1FFNN2門控機制?2025.9ZD

Insights25資料來源:

Maarten

Grootendorst,混合專家模型(MoE)

到底是什么?

,至頂智庫結合公開資料整理繪制。激活函數(shù)FFNN4混合專家架構(MoE)原理圖前饋神經網絡FFNN↑

Y加法

+

歸一化.45.31.05.19Xb.

稀疏MoEFFNN4FFNN2FFNN3FFNN1專家被激活的概率混合專家層2/3/4未被激活加法

+

歸一化FFNN4FFNN3a.

稠密MoEFFNN3激活權重

P=0.19P=0.41P=0.32XY24模型蒸餾:壓縮計算復雜度,實現(xiàn)模型高性能和輕量化部署模型蒸餾是指大型復雜模型(教師模型)

的知識遷移到小型高效模型(學生模型)

的技術

,其核心目標是在保持模型性能的同時

,顯著降低模型的計算復雜度和存儲需求

,使模型更適合在資源受限的環(huán)境中部署。

教師模型規(guī)模龐大,性能較高,但在計算和存儲資源上存在較大壓力;

學生模型結構較為簡單

,通過模仿教師模型輸出的軟標簽(概率分布)

學習其知識和表示能力

,軟標簽包含類別間相似性和內在關系的更多信息

,有助于學生模型捕捉潛在特征并提升泛化能力。在實際應用中,DeepSeek-R1對Qwen和Llama等開源模型進行蒸餾,得到更高效的小模型,顯著降低推理成本。

此外,諸如DistilBERT、TinyBERT以及MobileBERT模型也都采用蒸餾技術,用以在保持性能的同時提升效率,推動輕量化模型的發(fā)展和普及。模型蒸餾的原理與機制教師模型?2025.9ZD

Insights

知識數(shù)據資料來源:至頂智庫結合公開資料整理繪制。知識轉移學生模型蒸餾轉移26DeepSeek-R1Kimi-k1.5o1Hermes

3Athene-70BStarling-7BGemma2Qwen2Llama

3Nemotron-4

340BChatGLMDeepSeek-V2deep

seekNWSNN

nexus

rowGoogleAli

babaO

MetaRL

through

CoTRL

through

CoTRL

througt

CoTDPORLHFRLAIF,PPORLHFDPODPODPO,RPOChatGLM-RLHFGRPO2.5

主流模型的后訓練過程已普遍采用強化學習方法當前

,主流大模型利用強化學習技術進一步提效。

強化學習作為機器學習領域的核心技術之一,

由智能體、環(huán)境、

狀態(tài)、行動、

獎勵及策略六大核心部分組成。

與監(jiān)督學習和無監(jiān)督學習不同,強化學習是指智能體通過執(zhí)行動作來影響環(huán)境,并根據環(huán)境反饋的獎勵來調整策略,以便在未來做出更好的決策。目前主流模型的強化學習獎勵

策略后訓練過程均已采用相關強化學習方法進行優(yōu)化。強化學習核心要素模型

企業(yè)

強化學習方法?2025.9ZD

Insights

27資料來源:

Reinforcement

Learning

Enhanced

LLMs:

A

Survey,至頂智庫整理繪制。主流模型后訓練的強化學習方法智能體

環(huán)境下一狀態(tài)環(huán)境初始狀態(tài)強化學習通用流程獎勵策略行動狀態(tài)

行動2.5傳統(tǒng)與簡化強化學習成為大模型提效“雙渦輪”主流大模型在后訓練階段采用的強化學習方法主要包含兩類。

一類是傳統(tǒng)強化學習方法如人類反饋強化學習

(RLHF)

和AI反饋強化學習(RLAIF)

;另一類是簡化強化學習方法如直接偏好優(yōu)化(DPO)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論