版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
增持(維持)間可并行但控制流完全不同。分支類(lèi)任務(wù)不適合由GPU流發(fā)散導(dǎo)致算力利用率急劇下降。而分支類(lèi)任務(wù)卻正是CP推理會(huì)產(chǎn)生巨大的KVcache,其占用隨對(duì)話輪次與上下文長(zhǎng)度線性增長(zhǎng),快速耗盡GPUHBM容量。而CPU搭道:從實(shí)驗(yàn)數(shù)據(jù)復(fù)盤(pán)來(lái)看,CPU成為AgenticAI的真實(shí)瓶頸。研究顯產(chǎn)業(yè)端推進(jìn)方面,AWS和GoogleCloud等頭部CSP的隔離與編排能力,通過(guò)運(yùn)行時(shí)與調(diào)度體系的Forest采用純能效核設(shè)計(jì),核心數(shù)可達(dá)144甚至288核。我們認(rèn)為,與高并發(fā)場(chǎng)景下CXL驅(qū)動(dòng)的“存力+算力”協(xié)同升級(jí)。建議關(guān)注龍芯中2 4 4 4 5 5 7 72.2.CPU龍頭迭代方向明確:Agent驅(qū)動(dòng)下的超 8 9 3 4 4 5 5 7 8 9 41.從對(duì)話模型到行動(dòng)智能體:Agent架構(gòu)重塑CPU與GPU分工1.1.主流Agent形態(tài)從模型推理走向“瀏覽器+代碼執(zhí)行”Agent的本質(zhì)是運(yùn)行在一個(gè)具備操作系統(tǒng)能力的云端沙盒計(jì)算環(huán)境中。我們認(rèn)為Agent的能力躍遷,并非來(lái)自在GPU上堆疊更多token進(jìn)行推理,而是來(lái)自調(diào)用外部系披露,ChatGPTAgent通過(guò)視覺(jué)瀏覽器、代碼解釋器等工具完成復(fù)雜多步驟任務(wù),能力圖1:OpenAI的Agent模式集成多種工具調(diào)用形態(tài)圖2:Manus沙盒數(shù)據(jù)來(lái)源:OpenAI,數(shù)據(jù)來(lái)源:Manus,1.2.為何CPU在Agent時(shí)代具有控制流完全不同。在同一周期內(nèi)執(zhí)行同一條指令。一旦同一warp內(nèi)線程進(jìn)入不同分支路徑(WarpDivergenceGPU會(huì)將不同分支串行執(zhí)在32路完全發(fā)散的極端情況下,性能下降可達(dá)2正是CPU微架構(gòu)長(zhǎng)期優(yōu)化的主戰(zhàn)場(chǎng)。圖3:不同GPU在不同Warp分支發(fā)散程度下性能表現(xiàn)(單位:毫秒)圖4:CPU在復(fù)雜任務(wù)編排中具備同步與調(diào)度能力數(shù)據(jù)來(lái)源:ScienceDirect,數(shù)據(jù)來(lái)源:SemiEngineering,56Agent場(chǎng)景下,單純追求極致GPU延遲并非最優(yōu)解。以GP配大容量DDR5/LPDDR5(并通過(guò)CXL擴(kuò)展)承載KVCa7CPU成為AgenticAI的真實(shí)瓶頸。在AgenticAI場(chǎng)景下,CPU側(cè)工作負(fù)載呈現(xiàn)爆6.3秒以上,增幅超過(guò)2倍。其根本原因是并發(fā)進(jìn)程而是決定Agent系統(tǒng)并發(fā)上限與服務(wù)能力的關(guān)鍵基礎(chǔ)設(shè)施,其配置與規(guī)模將直接約束圖5:Agent任務(wù)中,CPU占據(jù)端到端總延遲的絕大部分?jǐn)?shù)據(jù)來(lái)源:《ACPU-CentricPerspectiveonAgenticAI》,注:圖中數(shù)據(jù)為各類(lèi)Agentic工作流在不同基準(zhǔn)任務(wù)下的端到端運(yùn)行時(shí)間拆分(單位:秒其中堆疊部分區(qū)分CPU側(cè)工具執(zhí)行耗時(shí)與GPU側(cè)模型推理耗時(shí)8推出AmazonBedrockAgentCoreRuntime/CodeInt行代碼,并對(duì)每個(gè)session設(shè)定明確的CPU與內(nèi)存資源邊界,實(shí)管化與資源池化管理。GoogleCloud在2025年明確提出AgentSandb在頭部廠商產(chǎn)品規(guī)劃中得到驗(yàn)證:AMD推出的Turin最高可達(dá)192核,主打高密度圖6:IntelXeon6700/6900代數(shù)據(jù)中心CPU的核心數(shù)最高可達(dá)288核數(shù)據(jù)來(lái)源:HotHardware,Intel,9圖7:AMD數(shù)據(jù)中心CPU核心數(shù)持續(xù)上行數(shù)據(jù)來(lái)源:TheNextPlatform,AMD,內(nèi)存體系之下。作為對(duì)比,傳統(tǒng)GPU服務(wù)器所搭載的大容量、高帶寬內(nèi)存實(shí)際承擔(dān)了Agent圖8:英偉達(dá)GB200GraceBlackwellSuperchip結(jié)構(gòu)圖數(shù)據(jù)來(lái)源:英偉達(dá)官網(wǎng),DeepSeek新模型架構(gòu)將部分參數(shù)外置并由CPU調(diào)度。DeepSeek在2026年論文中圖9:DeepSeek明確由CPU調(diào)度Engram數(shù)據(jù)庫(kù),CPU重要性凸顯數(shù)據(jù)來(lái)源:DeepSeek,著高于已披露水平,供給約束已成為主要掣肘。AMD:數(shù)據(jù)中心業(yè)務(wù)增長(zhǎng)強(qiáng)勁。AMD在25Q3業(yè)績(jī)法說(shuō)會(huì)上聲稱(chēng)數(shù)據(jù)中心業(yè)務(wù)實(shí)現(xiàn)創(chuàng)紀(jì)錄增長(zhǎng),核心由EPYC服務(wù)器C/MI400/MI450機(jī)架級(jí)AI方圖10:AMD營(yíng)收拆分及盈利預(yù)測(cè)(億美元)游戲客戶(hù)端嵌入式數(shù)據(jù)中心500450400350300250200500202020212022202320242025(E)2026(E)數(shù)據(jù)來(lái)源:Bloomberg,注:盈利預(yù)測(cè)采用Bloomberg一致預(yù)期圖11:Intel營(yíng)收拆分及盈利預(yù)測(cè)(億美元)400020212022202320242021202220232024注:內(nèi)部抵消項(xiàng)系扣減代工部為自家產(chǎn)品線代工而重復(fù)計(jì)入的內(nèi)部關(guān)聯(lián)交易收入數(shù)據(jù)來(lái)源:Bloomberg,注:盈利預(yù)測(cè)采用Bloomberg一致預(yù)期Agent時(shí)代“高并發(fā)、長(zhǎng)任務(wù)、強(qiáng)隔離”所要求的超多核、高內(nèi)存帶寬算力
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 超聲探頭的清潔消毒制度
- 警醫(yī)聯(lián)席制度
- 行業(yè)自律與風(fēng)險(xiǎn)準(zhǔn)備金制度
- 用地政策培訓(xùn)課件
- 心內(nèi)科患者的睡眠管理
- 2026年福建寧德市司法局招聘2人備考考試題庫(kù)附答案解析
- 2026年安徽某機(jī)關(guān)醫(yī)院門(mén)診部招聘2名備考考試題庫(kù)附答案解析
- 2026廣西北海市合浦縣民政局招錄城鎮(zhèn)公益性崗位人員11人備考考試試題附答案解析
- 2026西安鴻德高級(jí)中學(xué)教師招聘參考考試試題附答案解析
- 零售藥品培訓(xùn)課件
- 2026新疆阿合奇縣公益性崗位(鄉(xiāng)村振興專(zhuān)干)招聘44人筆試參考題庫(kù)及答案解析
- 北京中央廣播電視總臺(tái)2025年招聘124人筆試歷年參考題庫(kù)附帶答案詳解
- 紀(jì)委監(jiān)委辦案安全課件
- 兒科pbl小兒肺炎教案
- 2025年學(xué)校領(lǐng)導(dǎo)干部民主生活會(huì)“五個(gè)帶頭”對(duì)照檢查發(fā)言材料
- 浙江省紹興市上虞區(qū)2024-2025學(xué)年七年級(jí)上學(xué)期語(yǔ)文期末教學(xué)質(zhì)量調(diào)測(cè)試卷(含答案)
- 《審計(jì)法》修訂解讀
- 江蘇省姜堰市勵(lì)才實(shí)驗(yàn)學(xué)校2024屆七年級(jí)數(shù)學(xué)第一學(xué)期期末經(jīng)典試題含解析
- 我國(guó)歷史文化名城保護(hù)面臨的沖擊與對(duì)策
- 白油化學(xué)品安全技術(shù)說(shuō)明書(shū)
- 馬鞍山市恒達(dá)輕質(zhì)墻體材料有限公司智能化生產(chǎn)線環(huán)保設(shè)施改造項(xiàng)目環(huán)境影響報(bào)告表
評(píng)論
0/150
提交評(píng)論