信息技術(shù)-計(jì)算機(jī)行業(yè)行業(yè)深度報(bào)告：AI Agent投資框架：算力需求測(cè)算與應(yīng)用趨勢(shì)展望

上傳人：策*** IP屬地：山西上傳時(shí)間：2025-07-12 格式：DOCX 頁(yè)數(shù)：41 大小：811.73KB 積分：19.9 舉報(bào) 版權(quán)申訴

信息技術(shù)-計(jì)算機(jī)行業(yè)行業(yè)深度報(bào)告：AI Agent投資框架：算力需求測(cè)算與應(yīng)用趨勢(shì)展望_第2頁(yè)

信息技術(shù)-計(jì)算機(jī)行業(yè)行業(yè)深度報(bào)告：AI Agent投資框架：算力需求測(cè)算與應(yīng)用趨勢(shì)展望_第3頁(yè)

信息技術(shù)-計(jì)算機(jī)行業(yè)行業(yè)深度報(bào)告：AI Agent投資框架：算力需求測(cè)算與應(yīng)用趨勢(shì)展望_第4頁(yè)

信息技術(shù)-計(jì)算機(jī)行業(yè)行業(yè)深度報(bào)告：AI Agent投資框架：算力需求測(cè)算與應(yīng)用趨勢(shì)展望_第5頁(yè)

已閱讀5頁(yè)，還剩36頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

中國(guó)銀河證券|CGSSIMULATION行業(yè)深度報(bào)告·行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)AIAgent投資框架：算力需求測(cè)算與應(yīng)用趨勢(shì)展望●海外推理算力供需剪刀差將不斷擴(kuò)大。我們?cè)?月24日發(fā)布的2025年中期策略報(bào)告里測(cè)算了未來(lái)3年海外AIAgent應(yīng)用每日消耗的算力總量，測(cè)算思路主要是每日Agent應(yīng)用算力消耗=每日Agent需求總token數(shù)*單token消耗算力。根據(jù)測(cè)算，推理算力需求總量2026-2028年的增速分別達(dá)到8倍、3.5倍、2.5倍。而英偉達(dá)將于2026下半年推出的VeraRubinNVL144,性能是GB300NVL72的3.3倍；下一代的RubinUltraNVL576將于2027年下半年推出，性能是GB300NVL72的14倍。AI芯片性能的進(jìn)化無(wú)法●海外AI算力與應(yīng)用實(shí)現(xiàn)正向循環(huán)，國(guó)內(nèi)AI應(yīng)用整體月活量增長(zhǎng)弱于海外，豆包相對(duì)優(yōu)勢(shì)較為突出。根據(jù)全球AIWeb產(chǎn)品月活數(shù)據(jù)，海外整體活躍度較國(guó)內(nèi)更高，截至今年5月，海外前20名產(chǎn)品合計(jì)月活量呈現(xiàn)逐月增長(zhǎng)的趨勢(shì)(月增速約4%),而國(guó)內(nèi)合計(jì)月活量環(huán)比下降比較明顯，豆包增長(zhǎng)較為突出。截至今年5月，豆包大模型日均tokens使用量超過(guò)16.4萬(wàn)億，同時(shí)火山引擎占據(jù)國(guó)內(nèi)公有云上大模型調(diào)用量46.4%的市場(chǎng)份額，位列第一。在海外AI應(yīng)用月活量呈現(xiàn)逐月增長(zhǎng)的趨勢(shì)算力與應(yīng)用實(shí)現(xiàn)正向循環(huán)，驅(qū)動(dòng)北美四大云廠商2025年資本開(kāi)支積極指引?！馎IAgent的商業(yè)模式正從“提供工具”向“交付價(jià)值”轉(zhuǎn)變，SAAS企業(yè)有望迎來(lái)價(jià)值重估的機(jī)會(huì)。生產(chǎn)力智能體以提升效率為核心，除了通用型同于生產(chǎn)力智能體，企業(yè)級(jí)智能體的參與者更大比例是原有深耕垂直領(lǐng)域的Agent時(shí)會(huì)重點(diǎn)考慮投資回報(bào)率(ROI),結(jié)鏈、法律/政務(wù)、醫(yī)療/教育。的相關(guān)公司；2、字節(jié)在AI應(yīng)用生態(tài)領(lǐng)域已構(gòu)建起相對(duì)優(yōu)勢(shì)，建議關(guān)注字節(jié)型卡位公司的投資機(jī)會(huì)相對(duì)提升，建議關(guān)注在AIAgent方面布局領(lǐng)先的垂萬(wàn)興科技；2)企業(yè)Agent:第四范式、漢得信息、金蝶國(guó)際、致遠(yuǎn)互聯(lián)、泛微網(wǎng)絡(luò)、用友網(wǎng)絡(luò)；3)金融Agent:稅友股份、恒生電子、同花順、財(cái)富趨勢(shì)、金證股份、京北方、長(zhǎng)亮科技、宇信科技；4)工業(yè)Agent:道通科技、鼎捷數(shù)智、能科科技、賽意信息；5)辦公Agent:金山辦公、彩訊股份；6)醫(yī)療Agent:衛(wèi)寧健康、東軟集團(tuán)、嘉和美康；7)能源Agent:國(guó)能日新、朗新集團(tuán)?！耧L(fēng)險(xiǎn)提示：技術(shù)研發(fā)進(jìn)度不及預(yù)期風(fēng)險(xiǎn)；供應(yīng)鏈風(fēng)險(xiǎn)；消費(fèi)需求不及預(yù)期風(fēng)險(xiǎn)；行業(yè)競(jìng)爭(zhēng)加劇風(fēng)險(xiǎn)。計(jì)算機(jī)行業(yè)推薦維持評(píng)級(jí)相對(duì)滬深300表現(xiàn)圖2025-7-62請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲233中國(guó)銀河證券中國(guó)銀河證券行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)目錄 4二、AIAgent技術(shù)范式革命 7 7(二)環(huán)境感知：從文本到多模態(tài)融 8 (四)工具使用：從API調(diào)用到交互協(xié)作 (五)記憶能力：從短期緩存到長(zhǎng)期記憶增強(qiáng) 三、全球AI大模型動(dòng)態(tài)更新：功能與趨勢(shì) 11 (一)AIAgent正從“提供工具”向“交付價(jià)值”轉(zhuǎn)變 (二)AI智能體開(kāi)發(fā)平臺(tái)：大廠逐步構(gòu)建各自的AIAgent生態(tài) (三)生產(chǎn)力智能體：通用型和AI工具類(lèi)增長(zhǎng)最快 (四)企業(yè)級(jí)智能體：SAAS服務(wù)商迎來(lái)彎道超車(chē)機(jī)遇五、產(chǎn)業(yè)鏈投資機(jī)會(huì) 17六、風(fēng)險(xiǎn)提示 19行業(yè)深度報(bào)告·行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)一、AIAgent推理算力供需剪刀差測(cè)算我們?cè)?月24日發(fā)布的2025年中期策略報(bào)告里測(cè)算了未來(lái)3年海外AIAgent應(yīng)用每日消我們根據(jù)以下假設(shè)來(lái)測(cè)算，未來(lái)3年海外AIAgent應(yīng)用每日消耗的算力總量。(1)假設(shè)目前全球AIAgent日活人數(shù)與AIWeb總?cè)栈钊藬?shù)相當(dāng)，即2025年AIAgent全球(不含中國(guó))滲透率約為7%。我們預(yù)期2026-2028年滲透率分別為11%、14%、16%。根據(jù)非凡產(chǎn)研統(tǒng)計(jì)的全球AIWeb產(chǎn)品月活數(shù)據(jù)，海外整體AIWeb產(chǎn)品活躍度較國(guó)內(nèi)更高，2025年5月前20名海外產(chǎn)品合計(jì)月活量約為8.47億，國(guó)內(nèi)約為1.05億；海外合計(jì)月活量呈現(xiàn)逐月增長(zhǎng)的趨勢(shì)(月增速4%左右),而國(guó)內(nèi)合計(jì)月活量環(huán)比下降比較明顯(5月環(huán)比4月仍下降約考慮到AIWeb日常使用率較高，我們假設(shè)DAU(日活)/MAU(月活)=38%,則AIAgent全球(不含中國(guó))日活人數(shù)約為3.25億。若按照2026-2028年滲透率分別為11%、14%、16%計(jì)算，則AIAgent全球(不含中國(guó))日活人數(shù)分別為5.24億、6.84億、8.00億。23國(guó)內(nèi)4567m89出海內(nèi)容檢測(cè)931國(guó)內(nèi)資料來(lái)源：非凡產(chǎn)研，中國(guó)銀河證券研究院圖2:2025年5月中國(guó)AIWeb產(chǎn)品月活數(shù)據(jù)6騰訊元寶個(gè)人助理yuanbao.tenc13即夢(mèng)AI圖片生成1420問(wèn)小白智慧搜索965.7544請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。行業(yè)深度報(bào)告·行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)圖3:2025年5月全球AIAPP產(chǎn)品月活數(shù)據(jù)123-0.13%-0.13%4國(guó)內(nèi)5MicrosoftEdge:AIBrows6國(guó)內(nèi)78國(guó)內(nèi)9CharacterAI:Chat,Talk國(guó)內(nèi)TalkieAI:ChatWithCharaChaton-AIChatBotAssi-2.12%-2.12%Genius:AIArtPhotoEd-28.15%B612AIPhoto&VideoEdi圖片增強(qiáng)UpFoto-AIPhotoEnhanChatbotAI-AIWritingfoRemini-AIPhotoEnh圖4:2025年5月中國(guó)AIAPP產(chǎn)品月活數(shù)據(jù)2百度A搜索34-0.15%5美圖公司6美圖公司789錄4.17%美圖公司即夢(mèng)AI圖片生成即夢(mèng)AI-即刻造夢(mèng)資資(2)假設(shè)每個(gè)日活用戶(hù)2025年每日僅使用1次AIAgent應(yīng)用，2026-2028年分別增加到2、3、4次(場(chǎng)景增加);且隨著應(yīng)用深度的增加，單次使用AIAgent產(chǎn)生的請(qǐng)求次數(shù)也會(huì)增加，假設(shè)2025-2028年分別為50、80、100、120次。AI系統(tǒng)，那么每一次自主規(guī)劃或API調(diào)用都對(duì)應(yīng)著一次對(duì)模型的請(qǐng)求，每循環(huán)一次至少對(duì)應(yīng)著10次請(qǐng)求，若一個(gè)任務(wù)拆解為5次循環(huán)，則至少需要請(qǐng)求50次。未來(lái)MCP的成熟應(yīng)用有望使循環(huán)次Agento5請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲56請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。6(3)假設(shè)每一次請(qǐng)求需要的token數(shù)，2025-2028年分別為2000、2500、3000、3500。目前主流AI智能體完成一個(gè)簡(jiǎn)單的任務(wù)(比如制作一張數(shù)據(jù)圖表)大約消耗10萬(wàn)token,比較復(fù)雜的任務(wù)(比如制作一個(gè)Web應(yīng)用)能達(dá)到消耗90萬(wàn)token以上。我們假設(shè)2025年平均使用一次AIAgent應(yīng)用消耗10萬(wàn)token,對(duì)應(yīng)50次請(qǐng)求，則單次請(qǐng)求比如一張512*512像素的圖片對(duì)應(yīng)約334tokens,Kimi的Vision模型實(shí)行按量計(jì)費(fèi)方式，單張(4)假設(shè)目前平均單token消耗算力約為8TFLOPs,隨著模型參數(shù)量以及多模態(tài)數(shù)據(jù)量的增加，單token消耗算力有望逐年增長(zhǎng)，我們假設(shè)2025-2028年平均單token消耗算力分別為我們基于通義千問(wèn)2多模態(tài)代表模型Qwen2-VL-2B-Instruct的官方測(cè)試結(jié)果來(lái)推算單token消耗算力，推理速度測(cè)試基于NVIDIAA10080GB,測(cè)試了生成2048個(gè)token時(shí)，輸入長(zhǎng)度分別模型在公有云和私有化部署下的值也區(qū)別很大。我們可以參考OpenAI的毛利率認(rèn)為其成本主要是推理計(jì)算消耗的算力，根據(jù)財(cái)務(wù)文件，OpenAI預(yù)計(jì)其2025年毛利率能達(dá)到49%。那么我們根據(jù)OpenAI目前token收費(fèi)就能計(jì)算出單token消耗算力值。參考H200租賃價(jià)格約3美元/小時(shí)，H200在BF16下的算力為1979TFLOPs,那么3美元相當(dāng)于能買(mǎi)到720萬(wàn)TFLOPs。截至2025年6月的最新價(jià)格，價(jià)格處于中位的GPT-40輸出價(jià)格為15美元/百萬(wàn)token,毛利率49%對(duì)應(yīng)算力成本約7.5美元/百萬(wàn)token,計(jì)算出單token消耗算力達(dá)到18TFLOPs。對(duì)于多模態(tài)模型而言，多模態(tài)數(shù)據(jù)使得token數(shù)急劇增加，單token消耗算力也會(huì)相應(yīng)增長(zhǎng)。比如OpenAI在4月發(fā)布的圖像生成模型GPT-image-1,在價(jià)格方面，GPT-image-1按token定價(jià)，圖像定價(jià)是文本的8倍：文本輸入token(提示文本):每100萬(wàn)token5美元；圖像輸入token(輸入圖像):每100萬(wàn)token10美元；圖像輸出token(生成的圖像):每100萬(wàn)token40美元。AWQGPU數(shù)量11111號(hào)關(guān)單蹣度厚點(diǎn)咳C(CUDACore)NVLink40張量還算核TensorCore)光E息端核心(ETCore)10請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。(5)基于以上假設(shè)，我們計(jì)算出未來(lái)3年全球(不含中國(guó))AIAgent應(yīng)用每日消耗的推理算力總量，2026-2028年的增速分別達(dá)到8倍、3.5倍、2.5倍。在40%的算力利用率下，對(duì)應(yīng)2025年H200的需求量為380.54萬(wàn)塊，2026年B200的需求量為1347.87萬(wàn)塊。AI芯片性能的進(jìn)化全球互聯(lián)網(wǎng)用戶(hù)(單位億，不含中國(guó))Agent日活人數(shù)(單位億)1234每日請(qǐng)求總數(shù)(單位億)總token數(shù)(單位億)單token消耗算力(TFLOPs)8H200需求(萬(wàn)塊)單塊B200在BF16下的24h算力(PFLOPs)B200需求(萬(wàn)塊)資料來(lái)源：中國(guó)銀河證券研究院二、AIAgent技術(shù)范式革命AutoGLM。Anthropic于2024年10月23日發(fā)布了Claude3.5Sonnet模型，得益于Anthropic推出的API,Claude可以感知并與計(jì)算機(jī)界8請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。8擊屏幕以及通過(guò)虛擬鍵盤(pán)輸入信息。智譜同樣于2024年10月推出了AutoGLM,聚焦于設(shè)備操控能力，支持通過(guò)工具調(diào)用完成具體任務(wù)(如操作手機(jī)、電腦等),能理解屏幕信息、規(guī)劃任務(wù)、自如果說(shuō)2024年的AIAgent像是一個(gè)操控工具，那么經(jīng)歷了2025年至今的技術(shù)演進(jìn)，AIAgent已經(jīng)從“被動(dòng)工具”邁向“自主決策體”,并且智能體從個(gè)體走向協(xié)作，AIAgen臺(tái)出現(xiàn)，AIAgent應(yīng)用逐漸形成生態(tài)。2025年AIAgent的技術(shù)演進(jìn)主要可以從以下四個(gè)方面來(lái)表2:2025年AIAgent的主要技術(shù)演進(jìn)工具使用從API調(diào)用到交互協(xié)作(視覺(jué)交互與協(xié)議標(biāo)準(zhǔn)化MCP與A2A)從短期緩存到長(zhǎng)期記憶增強(qiáng)(RAG向量數(shù)據(jù)庫(kù)與MemGPT)資料來(lái)源：中國(guó)銀河證券研究院Anthropic于2025年5月發(fā)布ClaudeOpus4和ClaudeSonnet4,再次將代碼、高級(jí)推理雜圖文信息、支持多圖對(duì)比和圖像驅(qū)動(dòng)的工具調(diào)用，為AIAgent提Manus是中國(guó)初創(chuàng)公司Monica于2025年3月發(fā)布的通用型AI智能體。Manus的核心能力是基于多模態(tài)感知做“真實(shí)世界任務(wù)”,可以批量讀圖、提取表格、拍圖識(shí)別文件結(jié)構(gòu)從而自動(dòng)生成幻燈片、代碼、項(xiàng)目說(shuō)明等，實(shí)現(xiàn)了圖文交互，是字節(jié)跳動(dòng)2025年通過(guò)AgentTARS、BAGEL多模態(tài)模型、Seed系列等模型體現(xiàn)出強(qiáng)環(huán)境理解+工具控制+多模態(tài)融合的綜合實(shí)力。AgentTARS從文本語(yǔ)言模型到視覺(jué)語(yǔ)言融合感知，在GUI中執(zhí)行真實(shí)操作；BAGEL多模態(tài)模型具有統(tǒng)一感知2024年：基于思維鏈(CoT)和思維樹(shù)(ToT)的提示詞工程，依賴(lài)人工設(shè)計(jì)流程。比如CoT使用線(xiàn)性分步驟推理，應(yīng)用于數(shù)學(xué)題、邏輯判斷、代碼生成等場(chǎng)景，依然依賴(lài)于人類(lèi)提前設(shè)定結(jié)構(gòu)主執(zhí)行任務(wù)拆解、重試、選擇路徑、調(diào)用工具的能力；Anthropic推出的ClaudeOpus4在編碼和復(fù)雜問(wèn)題的解決方面表現(xiàn)出色，能獨(dú)立運(yùn)行長(zhǎng)達(dá)七小時(shí)，具有長(zhǎng)期任務(wù)規(guī)劃能力，ExtendedThinking是一種增強(qiáng)的推理能力，使模型回答前更好的分解問(wèn)題、規(guī)劃解決方案并尋找不同的解決方法；Manus采用多智能體架構(gòu)，能夠自動(dòng)完成復(fù)雜任務(wù)，例如研究、執(zhí)行、交付結(jié)構(gòu)化結(jié)果；字節(jié)跳動(dòng)AgentTARS能夠通過(guò)自然語(yǔ)言與計(jì)算機(jī)圖形用戶(hù)界面交互，實(shí)現(xiàn)文件管理、瀏覽器導(dǎo)航等自動(dòng)化，UI-TARS-1.5是視覺(jué)語(yǔ)言模型，能有效執(zhí)行多種任務(wù)增強(qiáng)模型推理和適應(yīng)能力。Softwareengineer圖10:ClaudeOpus4測(cè)試碾壓OpenAI最強(qiáng)推理模型o3-一-tt99行業(yè)深度報(bào)告行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)2024年：API調(diào)用階段。早期模型比如Claude次智能處理一個(gè)工具調(diào)用，缺乏任務(wù)拆解和工具序列執(zhí)行的能力。這個(gè)階段的交互是單向的，并不具備持續(xù)控制、反饋處理或多工具協(xié)同能力。2025年：視覺(jué)交互與協(xié)議標(biāo)準(zhǔn)化(MCP與A2A)。工具調(diào)用體系在2025年迎來(lái)關(guān)鍵轉(zhuǎn)折一首先，視覺(jué)交互能力的提升讓AI能理解內(nèi)容并進(jìn)行自動(dòng)化操作，比如Anthropic的BrowserUse,開(kāi)源網(wǎng)頁(yè)自動(dòng)化接口，無(wú)需調(diào)用預(yù)定義API,個(gè)工具API也有獨(dú)特的數(shù)據(jù)結(jié)構(gòu)，開(kāi)發(fā)者需要為每個(gè)組合編寫(xiě)定制化連接代碼。MCP(ModelContextProtocol),簡(jiǎn)稱(chēng)模型上下文協(xié)議，是Anthropic公司于2024年11月推出的開(kāi)放標(biāo)準(zhǔn)協(xié)議，讓各種不同的大型語(yǔ)言模型能夠無(wú)縫地與各種外部數(shù)據(jù)源和工具(如業(yè)務(wù)軟件、數(shù)據(jù)庫(kù)、代碼庫(kù)等)進(jìn)行交互操作。開(kāi)發(fā)者只需按MCP標(biāo)準(zhǔn)開(kāi)發(fā)一次接口，即可被多個(gè)模型調(diào)用。OpenAI、A2A(Agent2Agent)協(xié)議是谷歌于2025年4月推出，作為AI智能體間的“通用語(yǔ)言”,允51資料來(lái)源：騰訊研究院，中國(guó)銀河證券研究院●Agent2米資料來(lái)源：谷歌，中國(guó)銀河證券研究院OpenAI的AgentSDK使得開(kāi)發(fā)以標(biāo)準(zhǔn)方式構(gòu)建、測(cè)試、發(fā)布AIA用，強(qiáng)調(diào)工具的模塊化。AIAge2024年：短期記憶優(yōu)化。通過(guò)擴(kuò)展上下文窗口(如GPT-4支持128KTokens)提升對(duì)話(huà)連請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。行業(yè)深度報(bào)告行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)可以在不分拆摘要的情況下一次性處理長(zhǎng)文檔、財(cái)報(bào)等。但對(duì)話(huà)結(jié)束后就“失憶”,無(wú)法做到跨會(huì)話(huà)記憶，并且為被動(dòng)式記憶，記憶內(nèi)容需人工重新附加到Prompt,模型無(wú)法記住用戶(hù)的個(gè)性化偏憶”的躍遷，AI不再僅依賴(lài)于上下文窗口，具備跨會(huì)話(huà)、跨任務(wù)的持續(xù)記憶能力。RAG(檢索增強(qiáng)生成)就是通過(guò)檢索獲取相關(guān)的知識(shí)并將其融入Prompt,讓大模型能夠參考相應(yīng)的知識(shí)從而給出合理回答；因此，可以將RAG的核心理解為“檢索+生成”,向量數(shù)據(jù)庫(kù)用來(lái)存放向量化之后的知MemGPT(Memory-GPT)由伯克利大學(xué)的研究團(tuán)隊(duì)開(kāi)發(fā)，被譽(yù)為最專(zhuān)業(yè)的LL架。該技術(shù)靈感來(lái)源于傳統(tǒng)操作系統(tǒng)中的分層內(nèi)存系統(tǒng)，通過(guò)快速內(nèi)存和慢速內(nèi)存之間的數(shù)據(jù)移動(dòng)提供較大內(nèi)存資源的可能。MemGPT也是一個(gè)智能管理不同可以分析遠(yuǎn)超底層LLM上下文窗口的大型文檔，并且可以創(chuàng)建會(huì)話(huà)代理，通過(guò)與用戶(hù)的長(zhǎng)期交互OpenAI為GPT-40引入MemoryAPI,使模型能夠記住個(gè)性向量數(shù)據(jù)庫(kù)json.img數(shù)據(jù)檢索數(shù)據(jù)準(zhǔn)備inMemGPT,afixed-contexfunchonsthatalowittomanagetparsestheLLMtextouputsateachprocessingcycle,andeithefunchioncal,tcanrequestinmedlaeretumofexyield,theLLMwinotberunagainunithenextextemaleventtrigger( scheduledinternupfl.從全球AI大模型2024年12月至2025年5月的流量趨勢(shì)來(lái)看，不同功能的大模型流量分化較為明顯。AI工具類(lèi)模型的總流量增速經(jīng)歷了先抑后揚(yáng)的走勢(shì)，2025年3月以來(lái)的同比增速保持在20%以上；其中通用類(lèi)、編程類(lèi)大模型流量增速最快，2025年3月以來(lái)的同比增速分別保持在請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。行業(yè)深度報(bào)告行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)25%、75%以上。近一個(gè)月流量同比下降比較明顯的領(lǐng)域依次為法律、客服、寫(xiě)作、圖片生成?！觥觥觥觥觥觥觥觥觥觥鯝llother資料來(lái)源：similarweb,中國(guó)銀河證券研究院資料來(lái)源：similarweb,中國(guó)銀河證券研究院通用類(lèi)大模型里，2025年3月以來(lái)的流量同比增速表現(xiàn)較好的依次為Grok、Google、Meta;流量在2025年初經(jīng)歷了爆發(fā)式增長(zhǎng)，但近一個(gè)月同比下降；Huggingface和Poe近一個(gè)月流量也圖17:通用類(lèi)大模型的流量趨勢(shì)(2024.12-20圖17:通用類(lèi)大模型的流量趨勢(shì)(2024.12-2025.5)Depsek211%223%1013%3029%7694%%資料來(lái)源：similarweb,中國(guó)銀河證券研究院圖18:通用類(lèi)大模型的流量份額(2024.12-2025.5)資料來(lái)源：similarweb,中國(guó)銀河證券研究院四、AIAgent商業(yè)模式變革2024Q4,我們認(rèn)為AIAgent模型有望推動(dòng)APP生態(tài)逐漸向模型生態(tài)轉(zhuǎn)變，AIAgent應(yīng)用有望取代APP的地位；2025年至今，我們已經(jīng)看到多個(gè)擁有頭部模型的大廠也推出了AI智能體開(kāi)發(fā)平臺(tái)，正在逐步構(gòu)建起各自的AIAgent生態(tài)。請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。伴隨著AIAgent從“被動(dòng)工具”邁向“自主決策體”,并且從個(gè)體走向協(xié)作，AIAgent的商業(yè)模式也將發(fā)生變革，AIAgent應(yīng)用的競(jìng)爭(zhēng)點(diǎn)正從“提供工具”向“交付價(jià)值”轉(zhuǎn)變。能真正提升下游企業(yè)利潤(rùn)的AIAgent應(yīng)用將會(huì)勝出，從這個(gè)角度來(lái)說(shuō)，對(duì)應(yīng)垂直行業(yè)knowhow型卡位公司的投資機(jī)會(huì)相對(duì)提升，能融入智能體能力的SAAS企業(yè)有望迎來(lái)價(jià)值重估的機(jī)會(huì)。通用智熊體智能體開(kāi)發(fā)平臺(tái)文心智能體平臺(tái)騰訊元器KUNLUN滴普科技KortixAl4gen1Buder生產(chǎn)力智能體文心快碼創(chuàng)作智能體企業(yè)級(jí)智能體致遠(yuǎn)互聯(lián)企業(yè)級(jí)智能體致遠(yuǎn)互聯(lián)焦點(diǎn)科技卓世科技紫鼠云(二)AI智能體開(kāi)發(fā)平臺(tái)：大廠逐步構(gòu)建各自的AIAgent生態(tài)AI智能體開(kāi)發(fā)平臺(tái)具有匯聚流量的優(yōu)勢(shì)，如果在上面的Agent應(yīng)用豐富起來(lái)，構(gòu)建起AIAgent生態(tài)，則有望成為AI時(shí)代的“安卓”圈，因此平臺(tái)的開(kāi)放性和模型技術(shù)優(yōu)勢(shì)也是關(guān)鍵驅(qū)動(dòng)力。字節(jié)跳動(dòng)發(fā)布“Coze”,以零代碼方式構(gòu)建多模態(tài)、可記憶的智能體，應(yīng)用于內(nèi)容創(chuàng)作、教育輔導(dǎo)等場(chǎng)景，提升營(yíng)銷(xiāo)效率，也可輔助教學(xué)；阿里推出“百煉平臺(tái)”,支持從模型調(diào)用到插件集成的全流程智能體開(kāi)發(fā)，應(yīng)用于電商服務(wù)助手、日程管理助手等場(chǎng)景；騰訊的“元器”,結(jié)合混元大模型與微信生態(tài)，實(shí)現(xiàn)一站式創(chuàng)建和分發(fā)，應(yīng)用于客服助手、內(nèi)容創(chuàng)作等場(chǎng)景，可以提升服務(wù)效率，輔助創(chuàng)作。根據(jù)IDC報(bào)告顯示，2024年中國(guó)公有云上大模型調(diào)用量達(dá)114.2萬(wàn)億tokens(不包含出海群體使用的海外MaaS平臺(tái)的調(diào)用量),按照大模型調(diào)用量的市場(chǎng)份額來(lái)看，字節(jié)火山引擎占據(jù)了46.4%的市場(chǎng)份額，位列第一，其次為百度智能云(19.3%)和阿里云(19.3%)。此外，騰訊云、中國(guó)移動(dòng)、天翼云等其他廠商整體占據(jù)15%的市場(chǎng)份額。2024年模型調(diào)用量仍然以文本類(lèi)的能力為主，2024Q4語(yǔ)音類(lèi)模型調(diào)用量也開(kāi)始增長(zhǎng)。預(yù)計(jì)2025年圖像、視頻類(lèi)大模型的調(diào)用量也將開(kāi)始起量，成為驅(qū)動(dòng)未來(lái)2年大模型tokens增長(zhǎng)的重要力量。行業(yè)深度報(bào)告行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)圖20:2024.6-2024.12中國(guó)公有云大模型日均調(diào)用量0資料來(lái)源：IDC,中國(guó)銀河證券研究院圖21:2024年中國(guó)大模型服務(wù)調(diào)用量分布百度云百度云19.30%火山引擎阿里云資料來(lái)源：IDC,中國(guó)銀河證券研究院作等領(lǐng)域增長(zhǎng)最快。根據(jù)火山引擎數(shù)據(jù)，其AI工具類(lèi)場(chǎng)景tokens消耗5個(gè)月增長(zhǎng)4.4倍，其中AI搜索增長(zhǎng)10倍，AI編程增長(zhǎng)8.4倍，K12在線(xiàn)教育增長(zhǎng)12倍。智能巡檢、視頻檢索等新場(chǎng)景突破計(jì)算機(jī)和數(shù)學(xué)占比37.2%(編程、開(kāi)發(fā))、藝術(shù)和創(chuàng)作10.3%、教育/檔案9.3%。圖22:火山引擎AI工具類(lèi)場(chǎng)景tokens消耗5個(gè)月增長(zhǎng)4.4倍5學(xué)習(xí)教育：幅一可智驗(yàn)、圖片信自理解等惚%一起題一資料來(lái)源：火山引擎，中國(guó)銀河證券研究院資料來(lái)源：Anthropic,中國(guó)銀河證券研究院通用型：Manus智能體和Genspark智慧搜索核心用于跨領(lǐng)域信息整合以及自動(dòng)化執(zhí)行。Manus的商業(yè)模型為基于任務(wù)效果“后付費(fèi)”或“按結(jié)果計(jì)費(fèi)”,用戶(hù)只為成功輸出付費(fèi)，近20人團(tuán)隊(duì)支撐千萬(wàn)級(jí)收入；Genspark聚焦于知識(shí)工作者、學(xué)生、程序員等使用場(chǎng)景學(xué)術(shù)類(lèi)、代碼等查詢(xún)，更注重“本地化內(nèi)容”以及“中文搜索習(xí)慣”,結(jié)合多模態(tài)能力，支持圖片創(chuàng)作型：LiblibAI圖片生成服務(wù)主要為設(shè)計(jì)師、插畫(huà)師、自的服務(wù)，同時(shí)構(gòu)建內(nèi)容共創(chuàng)與分享的垂直社區(qū)生態(tài)，產(chǎn)品涵蓋多樣化的圖像生成方式、豐富的模型資源、活躍的社區(qū)互動(dòng)以及多模態(tài)擴(kuò)展等。2025年2月完成數(shù)億人民幣的A+輪融資，投資方包括請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。行業(yè)深度報(bào)告行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)流程自動(dòng)化開(kāi)發(fā)。產(chǎn)品核心功能與架構(gòu)為多智能體協(xié)作、自然語(yǔ)言編程、全準(zhǔn)化操作流程，適合于無(wú)深入編程技能的個(gè)人開(kāi)發(fā)者、輔助編程教學(xué)的教育(百萬(wàn)美金產(chǎn)品收入102930405760748圖片編相09000圖片編相000600200040圖25:豆包大模型日均tokens使用量超過(guò)16.4萬(wàn)億截至2025年5月底，豆包大模型日均截至2025年5月底，豆包大模型日均tokens使用量超過(guò)16.4萬(wàn)億，較去年5月剛發(fā)布時(shí)增長(zhǎng)超過(guò)137倍。16.4萬(wàn)億+12.7萬(wàn)億截至2025年5月4萬(wàn)億企業(yè)級(jí)智能體指專(zhuān)為企業(yè)環(huán)境設(shè)計(jì)和部署的AI執(zhí)部分決策和執(zhí)行行為。當(dāng)前國(guó)內(nèi)外企業(yè)級(jí)智能體正加速落地，成為企業(yè)提企業(yè)架構(gòu)面臨全面轉(zhuǎn)型(多模態(tài))(大規(guī)模GPU推理)請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)因?yàn)镸CP、A2A協(xié)議出現(xiàn)以及Agent生態(tài)的模式會(huì)呈指數(shù)級(jí)增長(zhǎng)，而這些故障對(duì)基礎(chǔ)設(shè)施的影響是巨大的，對(duì)于企業(yè)來(lái)說(shuō)，無(wú)論是為智能體重商能很好地幫企業(yè)解決這種復(fù)雜性部署，因此在Agent技術(shù)布局具有先發(fā)優(yōu)勢(shì)的SAAS企業(yè)有望迎數(shù)據(jù)基礎(chǔ)與商業(yè)價(jià)值，我們認(rèn)為企業(yè)級(jí)智能體有望最快落地的領(lǐng)域按優(yōu)先級(jí)排序?yàn)椋浩髽I(yè)服務(wù) 企業(yè)服務(wù)(OA/ERP/CRM等)營(yíng)銷(xiāo)/電商醫(yī)療教育資料來(lái)源：中國(guó)銀河證券研究院猿”大圣AI中臺(tái)系列：為B端而生的AIPaaS平臺(tái)+開(kāi)箱即用基礎(chǔ)應(yīng)用；2)應(yīng)用層“靈手”業(yè)務(wù)智能體系列：各大業(yè)務(wù)領(lǐng)域數(shù)十個(gè)場(chǎng)景AI助手/智能專(zhuān)家，構(gòu)建覆蓋全業(yè)務(wù)鏈的智能體生態(tài)；3)模型層“靈?！贝怪蹦Ｐ拖盗校憾鄠€(gè)行業(yè)專(zhuān)識(shí)模型+飛碼代碼大模型；4)服務(wù)層“靈策”配套服務(wù)系A(chǔ)I,提供多模型對(duì)接能力，內(nèi)置智能對(duì)話(huà)、可自配置的多分類(lèi)智能知識(shí)問(wèn)答等應(yīng)用，同時(shí)，還提供向量管理與應(yīng)用能力、私有模型訓(xùn)練與應(yīng)用能力，可以幫助企業(yè)高效自定義實(shí)現(xiàn)各種業(yè)務(wù)流程+AI能力，提供智能助手與AIGC應(yīng)用編排能力，實(shí)現(xiàn)企業(yè)流程智能化交互、引導(dǎo)、流轉(zhuǎn)，幫助企業(yè)快需求從基礎(chǔ)服務(wù)向合規(guī)稅優(yōu)轉(zhuǎn)化，中小微企業(yè)面臨內(nèi)部高價(jià)值財(cái)稅方案供不應(yīng)求，而以AI為驅(qū)動(dòng)的財(cái)稅平臺(tái)是打破痛點(diǎn)的關(guān)鍵。稅友股份作為財(cái)稅SaaS領(lǐng)軍者在Agent上布局領(lǐng)先，公司憑借深耕行業(yè)25年的經(jīng)驗(yàn)，已直接服務(wù)超100萬(wàn)中小企業(yè)，賦能財(cái)稅代理服務(wù)行業(yè)支撐服務(wù)超700萬(wàn)小微企業(yè)，擁有活躍企業(yè)用戶(hù)900萬(wàn)，付費(fèi)企業(yè)用戶(hù)615萬(wàn)。手IntuitAssist不謀而合，后者通過(guò)每月1200萬(wàn)次交互驗(yàn)證了生成式AI的商業(yè)潛力。請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲明。行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)快麥小智客服機(jī)器人、深繪美工機(jī)器人、快麥工單、跟單寶等力融入公司現(xiàn)有的快麥小智客服機(jī)器人、深繪美工機(jī)器人、有成系列產(chǎn)圖28:稅友股份人工智能平臺(tái)“犀友”實(shí)現(xiàn)合規(guī)稅優(yōu)服務(wù)圇場(chǎng)開(kāi)72國(guó)服0資料來(lái)源：稅友股份官網(wǎng)，中國(guó)銀河證券研究院a三資料來(lái)源：漢得信息官網(wǎng)，中國(guó)銀河證券研究院五、產(chǎn)業(yè)鏈投資機(jī)會(huì)根據(jù)英偉達(dá)產(chǎn)品計(jì)劃，其BlackwellUltra(GB300)芯片，BlackwellUltraNVL72平臺(tái)將于2025下半年推出，在NVL72狀態(tài)下(72顆芯片互聯(lián))AI性能是GB200的1.5倍。其下一代AI芯片Rubin,VeraRubinNVL144將于2026下半年推出，性能是GB300NVL72的3.3倍；而更強(qiáng)的RubinUltraNVL576將于2027年下半年推出，性能是GB300NVL72的14倍。我們可以看力與應(yīng)用實(shí)現(xiàn)正向循環(huán)，驅(qū)動(dòng)北美四大云廠商2025年資本開(kāi)支積極指引。在海外token需求持續(xù)海外推理算力供需剪刀差將會(huì)不斷擴(kuò)大。建議關(guān)注國(guó)內(nèi)NV鏈相關(guān)企業(yè)：工業(yè)富聯(lián)截至2025年5月底，豆包大模型日均tokens使用量超過(guò)16.4萬(wàn)億，較去年5月剛發(fā)布時(shí)增長(zhǎng)137倍。同時(shí)，字節(jié)火山引擎占據(jù)了國(guó)內(nèi)公有云上大模型調(diào)用量的46.4%的市場(chǎng)份額，位列第一。字節(jié)在AI應(yīng)用生態(tài)領(lǐng)域已構(gòu)建起相對(duì)優(yōu)勢(shì)，建議關(guān)注字節(jié)生態(tài)合作伙伴：潤(rùn)澤科技、漢得信息、行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)中國(guó)銀河證券行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)從應(yīng)用層面來(lái)說(shuō)，伴隨著AIAgent從“被動(dòng)工具”邁向“自主決策體”,并且從個(gè)體走向協(xié)轉(zhuǎn)變。能真正提升下游企業(yè)利潤(rùn)的AIAghow型卡位公司的投資機(jī)會(huì)相對(duì)提升，能融入智能體能力的SAAS企業(yè)有望迎來(lái)價(jià)值重估的機(jī)會(huì)。個(gè)股層面我們建議重點(diǎn)關(guān)注：1)電商Agent:光云科技、美圖公司、虹軟科技、萬(wàn)興科技；2)衛(wèi)寧健康、東軟集團(tuán)、嘉和美康；7)能源Agent:國(guó)能日新、朗新集團(tuán)。-美圖公司-同花順鼎捷數(shù)智中國(guó)銀河證券行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)東軟集團(tuán)國(guó)能日新朗新集團(tuán)請(qǐng)務(wù)必閱讀正文最后的中國(guó)銀河證券股份有限公司免責(zé)聲行業(yè)深度報(bào)告·行業(yè)深度報(bào)告·計(jì)算機(jī)行業(yè)圖1:2025年5月全球AIWeb產(chǎn)品月活數(shù)據(jù) 4圖2:2025年5月中國(guó)AIWeb產(chǎn)品月活數(shù)據(jù) 4圖3:2025年5月全球AIAPP產(chǎn)品月活數(shù)據(jù) 5圖4:2025年5月中國(guó)AIAPP產(chǎn)品月活數(shù)據(jù) 5圖5:AIAgent工作流程 5 6圖7:A100、H100等算力卡的參數(shù) 6圖8:基于思維樹(shù)(ToT)的提示詞工程 9 9圖10:ClaudeOpus4測(cè)試碾壓OpenAI最強(qiáng)推理模型03 圖11:MCP的技術(shù)架構(gòu)三個(gè)核心部分：MCPHost(執(zhí)行環(huán)境)、MCPClient(通信樞紐)和MCPServer 圖12:MCP與A2A的協(xié)作機(jī)制圖13:RAG系統(tǒng)結(jié)合向量數(shù)據(jù)庫(kù)的運(yùn)行流程 1圖14:MemGPT如何擴(kuò)展LLM的上下文范圍 1圖15:按大模型功能劃分的流量趨勢(shì)(2024.12-2025.5) 圖16:按大模型功能劃分的流量份額(2024.12-2025.5) 圖17:通用類(lèi)大模型的流量趨勢(shì)(2024.12-2025.5) 圖18:通用類(lèi)大模型的流量份額(2024.12-2025.5) 圖19:中國(guó)AIAgent行業(yè)圖譜圖20:2024.6-2024.12中國(guó)公有云大模型日均調(diào)用量圖21:2024年中國(guó)大模型服務(wù)調(diào)用量分布圖22:火山引擎AI工具類(lèi)場(chǎng)景tokens消耗5個(gè)月增長(zhǎng)4.4倍圖23:Claude模型的使用量按工作類(lèi)型劃分：編程開(kāi)發(fā)、藝術(shù)創(chuàng)作靠前圖24:中國(guó)AI產(chǎn)品年收入榜單圖25:豆包大模型日均tokens使用量超過(guò)16.4萬(wàn)億圖26:企業(yè)架構(gòu)轉(zhuǎn)型(從PC時(shí)代到AI時(shí)代) 圖27:企業(yè)

人人文庫(kù)> 全部分類(lèi)> 應(yīng)用文書(shū) > 研究報(bào)告

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

信息技術(shù)-計(jì)算機(jī)行業(yè)行業(yè)深度報(bào)告：AI Agent投資框架：算力需求測(cè)算與應(yīng)用趨勢(shì)展望

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

信息技術(shù)-計(jì)算機(jī)行業(yè)行業(yè)深度報(bào)告：AI Agent投資框架：算力需求測(cè)算與應(yīng)用趨勢(shì)展望

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔