多模型與智能體聚合及服務(wù)引擎(MoMA)白皮書_第1頁
多模型與智能體聚合及服務(wù)引擎(MoMA)白皮書_第2頁
多模型與智能體聚合及服務(wù)引擎(MoMA)白皮書_第3頁
多模型與智能體聚合及服務(wù)引擎(MoMA)白皮書_第4頁
多模型與智能體聚合及服務(wù)引擎(MoMA)白皮書_第5頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

服務(wù)引擎(MoMA)白皮書本白皮書旨在提出中國移動九天人工智能研究院對于多模型與征和典型應(yīng)用場景,并借助本白皮書面向產(chǎn)業(yè)提出共建共享的MoMA 1 2 3 3 4 6 6 8 8 9 2逐步由模型的技術(shù)創(chuàng)新轉(zhuǎn)變?yōu)橐月涞貎r值為導(dǎo)向的應(yīng)用創(chuàng)新,更加關(guān)注應(yīng)用的任務(wù)完成質(zhì)量和用戶體驗,成為部署模型和智能體實現(xiàn)在這一背景下,大模型和智能體的發(fā)展已進入一個迫切需要體系化AI基礎(chǔ) 3圖1MoMA的愿景和目標模型和智能體的規(guī)模化應(yīng)用和商用落地進程,本白皮書基于中國移動在AI領(lǐng)域ofModelsandAgents(MoMA)的態(tài)路由、智能規(guī)劃、精確調(diào)度,提供高準確、高安全、高可靠、高效能的大模匯聚的模型和智能體能力,并識別和理解用戶意圖,精準匹配滿足用戶 4l提供MoMA引擎:提供具備超大規(guī)模服務(wù)能力和極致優(yōu)化成本的工程引擎。在效果、效率、成本三重約束下實現(xiàn)對任務(wù)類型、資源分配、執(zhí)l構(gòu)建MoMA協(xié)議:構(gòu)建支持模型、智能體接口互聯(lián)互通的標準化、高證及安全通信等能力,使能模型、智能體、工具、數(shù)據(jù)、環(huán)境和應(yīng)用系圖2MoMA總體框架 5多樣、質(zhì)量優(yōu)良、安全可控的模型、智能體及工具的資源池型、智能體及工具的供應(yīng)商建立嚴格的準入機制,以及通過作流程,持續(xù)吸引并激勵優(yōu)質(zhì)供應(yīng)商持續(xù)提供核心能力。在持續(xù)進行能力資源的篩選、評估與進化,并依托技術(shù)性能、安全與合規(guī)、服務(wù)穩(wěn)定性四維能力評估體系,確保資源池始協(xié)同、可信的智能服務(wù)流,提供高準確、高安全、高可靠、全、便捷的接口,將平臺智能服務(wù)高效輸出至個人與企業(yè)場 6MoMA生態(tài)匯聚層是整個體系架構(gòu)的底層,是承接供應(yīng)側(cè)能力輸入、支撐構(gòu)建起一套規(guī)?;⒔Y(jié)構(gòu)化、可調(diào)度的AI能力集群,為上層智能體服務(wù)、API在MoMA體系中,生態(tài)匯聚層直接對接供應(yīng)商,是能力接入的直接來源。作為總體架構(gòu)的底層支撐,MoMA生態(tài)匯聚面向模型、智能體、工具等多元異標衡量服務(wù)的質(zhì)量,指標包括TPS、TTFT、TPOT等。在推理效果評估方面,則聚焦服務(wù)提供方在生成內(nèi)容安全、數(shù)據(jù)保護和版權(quán)管在實際落地中,MoMA生態(tài)匯聚由一套清晰的智能能力聚合與服務(wù)支撐體 7圖3MoMA生態(tài)匯聚層功能框圖l能力匯聚:聚合了多類型的模型、智能體以及工具,包括語這些能力單元覆蓋從通用生成到垂直工具的多模態(tài)任務(wù)類型,借助MoMA協(xié)議體系提供的統(tǒng)一接口接入,構(gòu)成MoMA智能調(diào)度的操作單元。在運行過程中,這些能力可被動態(tài)路由、組合調(diào)用,用以支撐上層復(fù)雜任務(wù)的執(zhí)行。能力組件在設(shè)計上遵循“最小可調(diào)度單元”原則,便于穩(wěn)定性的多維評估機制。所有接入的模型能力需完成接入前的統(tǒng)一評估響應(yīng)可控、質(zhì)量可溯。供應(yīng)商管理機制也嵌入該流程之中,要求能力提供方配置支持團隊提供服務(wù)保障,從制度層面形成體系化的生態(tài)治理能上述模塊共同構(gòu)成了MoMA生態(tài)匯聚層的核心框架,在聚合的基礎(chǔ)上實現(xiàn)能力支撐基礎(chǔ)??梢哉f,生態(tài)匯聚既是MoMA能力廣度的體現(xiàn),也是其能力深度的基礎(chǔ)。在這一資源底座的支撐下,MoMA得以構(gòu)建起從供應(yīng)商、協(xié)議調(diào)度到智能體服務(wù)的縱向能力通路,形成智能服務(wù)體系的完整閉環(huán)。 8圖4MoMA模型功能框圖好地適應(yīng)數(shù)據(jù)變化、業(yè)務(wù)需求和環(huán)境波動。MoMAl模型探測:通過對模型和智能體能力的深入探測,從成程度等方面構(gòu)建其能力高維表征,實現(xiàn)用戶需求與智能體路由的快速匹配;通過評分機制,評估不同模型和智能體的效果,便于分層路由模型l任務(wù)規(guī)劃:負責(zé)需求解構(gòu),將用戶輸入拆分為相互獨立子任務(wù),并綜合任務(wù)難易程度,工具、模型及多智能體特性,為 9力覆蓋廣度、成本控制效能與任務(wù)適應(yīng)彈性上的固有局限,促進了AI從被動響圖5MoMA工程引擎功能框圖l多級路由機制:在分層路由機制中,多級路雜任務(wù)的拆解與實現(xiàn)。其中一級路由完成專家模型、簡單任務(wù)、復(fù)雜任務(wù)的分發(fā);二級路由在綜合準確度和成本的條件下,根據(jù)復(fù)雜度把問題l動態(tài)洞察:采用MonitorModel對推理內(nèi)容進行實時監(jiān)控、復(fù)盤兩級路了Planner-Executor-Summarizer架構(gòu),能夠根據(jù)具體任務(wù)動態(tài)地采用干預(yù)的情況下執(zhí)行數(shù)十個步驟。通過采用復(fù)雜任務(wù)路由技術(shù),將請求發(fā)送給專門的規(guī)劃模型,選擇不同的執(zhí)行模式或混合模式,將用戶的意圖 分配至合適的智能體或大模型,并通過監(jiān)控推理輸出內(nèi)容,進行動態(tài)接管與調(diào)整,從而保證回答的效果和效率。此外,這種方式還避免了或減少了依賴中心規(guī)劃模型對智能體或工具輸出內(nèi)容的重復(fù)推理評估,降低圖6MoMA協(xié)議體系功能框圖范,主流協(xié)議包括MCP(ModelContextProtocol,模型上下文協(xié)議)[2]和A2A(Agent2Agent)[3]。其中MCP是一種用于規(guī)范模型或智能具和服務(wù)之間的交互的開放協(xié)議,其通過結(jié)構(gòu)化的輸入/輸出將模型或智能體與A2A協(xié)議則是一種用于促進獨立且可能成為黑箱的智能體系統(tǒng)之間通信與互操表1MCP與A2A對比對比維度MCPA2A協(xié)議定位模型/智能體與工具、資源的連接智能體之間的復(fù)雜協(xié)作核心優(yōu)勢結(jié)構(gòu)化輸入輸出、對接成本低支持多輪交互、上下文共享、狀態(tài)維護局限性僅適用于單論調(diào)用、不支持多輪交互和狀態(tài)跟蹤協(xié)議設(shè)計和實現(xiàn)復(fù)雜度高、多任務(wù)協(xié)作中成本高應(yīng)用場景模型/智能體調(diào)用數(shù)據(jù)庫等多智能體項目管理等 在此基礎(chǔ)上,采用MCP規(guī)范模型或智能體與具備明確功能定義、結(jié)構(gòu)化輸入輸功能擴展。采用A2A規(guī)范智能體與智能體之間的協(xié)同交互,提供標準化的能力MoMA協(xié)議體系下MCP與A2A也會協(xié)同使用。一個A2AServer(遠端智能體)可以將其部分具備清晰定義、可按無狀A(yù)NP(AgentNetworkProtocol)[5]作為面向未來智能體互聯(lián)網(wǎng)環(huán)境下,智能體網(wǎng)協(xié)同上的不足。為MoMA后續(xù)更好地適配開放異構(gòu)的智能體網(wǎng)絡(luò)生態(tài),構(gòu)建大規(guī)模、動態(tài)演化的智能服務(wù)網(wǎng)絡(luò)提供通信基礎(chǔ)與對于與大模型的交互,MoMA同樣予以考慮。鑒于當(dāng)前主流大模型多以開放API的形式提供服務(wù),且這些API通常采用HTTP進行通信并以JSON作為數(shù)據(jù)格式,其本質(zhì)上與MCP所規(guī)范的工具接入方式高度接近。因此在MoMA對話、連續(xù)推理、長鏈路任務(wù)管理等,這些能力超出了MCP所面向的單次請求基于現(xiàn)有協(xié)議的二次開發(fā),如補齊MCP在上 止未經(jīng)授權(quán)的獲取和篡改。通過在認證與安全通信兩方面的協(xié)同設(shè)計,MoMA該協(xié)議體系體現(xiàn)的價值:MoMA協(xié)議體系通過MCP與A2A的互補協(xié)同,與擴展性,構(gòu)建了覆蓋數(shù)據(jù)、工具、模型、智能體的完整協(xié)議體系,為AI要素聚合與能力調(diào)度提供支撐。同時,國內(nèi)智能體相關(guān)標準化體系的持續(xù)建設(shè),如圖7MoMA開放服務(wù)功能框圖MoMA提供的服務(wù)均以開放API的形式對外提供,通過構(gòu)建API開放與管提供便捷、統(tǒng)一、規(guī)范的API調(diào)用,也承擔(dān)安全防護、調(diào)用統(tǒng)計等一系列平臺API開放與管理平臺承接了MoMA服務(wù)的對外統(tǒng)一入口,提供穩(wěn)定可靠的API調(diào)用、標準化的接口文檔及配套的SDK工具,以幫助不同能力水平的開發(fā) API開放平臺提供全鏈路的用量統(tǒng)計,通過對API調(diào)用次數(shù)、消耗token、饋,同時也為MoMA路由與調(diào)度引擎提供數(shù)據(jù)支撐。API開放平臺支持多元化同服務(wù)需求,配合賬單管理、結(jié)算對賬等功能,保障API開放與管理平臺平臺提升了MoMA能力對外服務(wù)的可用性、便捷性與 同的應(yīng)用與服務(wù)中,使用便捷性較差。MoMA通過語義理解、多智能體協(xié)作和然的方式發(fā)出指令,獲得從需求解析、任務(wù)規(guī)劃到表,并融合運營商特色的語音通話能力,提供AI代打電話服務(wù)。當(dāng)用戶點擊卡自然語言解析與任務(wù)拆解(多輪Agent+MoMA調(diào)度引擎將用戶請 邀請與日程同步管理(日程Agent+通信工具統(tǒng)一操作邀請在行業(yè)應(yīng)用場景中,MoMA不僅是一個多模型與智能體的聚合平臺,更是現(xiàn)對模型能力的合理統(tǒng)籌、實時調(diào)度和最優(yōu)路徑執(zhí)行。通過這一機制,MoMA將人工智能技術(shù)從單一的任務(wù)執(zhí)行模塊擴展為企業(yè)全業(yè)務(wù) 用不同工具,導(dǎo)致流程割裂、效率低且算力與資源利用率不高。在MoMA體系化運行成本。同時,MoMA能夠?qū)δP秃椭悄荏w能力進行維護、迭代與實時更在行業(yè)應(yīng)用場景中,MoMA不僅作為智能能力中樞,同時也是成本控制與能力池與算力池統(tǒng)一管理:集中管理企業(yè)內(nèi)部及外部接入的模型、APIMoMA為企業(yè)級AI平臺提供了一個可擴展、可演化的智能調(diào)度中樞,使敏捷擴展:無需重構(gòu)IT架構(gòu),即可引入新模型、新算法和新數(shù)據(jù)源,替換難度大等普遍痛點,不僅大幅降低了企業(yè)在AI技術(shù)選型與替換上的成本, 展望未來,大模型與智能體技術(shù)的蓬勃發(fā)展及其產(chǎn)業(yè)的快速壯大,為構(gòu)建類型的用戶提供精準匹配應(yīng)用需求的,如同通信服務(wù)般便捷、普惠、可靠的模海量用戶、運營通信業(yè)務(wù)及數(shù)智化服務(wù)方面積累的豐富經(jīng)驗可供借鑒。同時,新,合力打造共建共享的開放運營生態(tài)。因此,提蓋個人、家庭、行業(yè)用戶、應(yīng)用開發(fā)者的典型場景需求,推動場景與能力之間的精準匹配與聯(lián)動優(yōu)化。通過真實場景驅(qū)動模型與智能體能力的演進與融合,以用戶為中心形成“場景驅(qū)動、能力倍增、價值閉環(huán)”的良2)攻關(guān)MoMA模型和工程引擎關(guān)鍵技術(shù)。MoMA模型和工程引擎的決定了MoMA服務(wù)水平的上限。它不僅是連接“資源池”與“用戶需求”的我們呼吁產(chǎn)業(yè)合作伙伴加入這一關(guān)鍵技術(shù)攻關(guān),合作研發(fā)模型框架和引擎算法、制定技術(shù)標準、分享實踐經(jīng)驗,打造強大的MoMA的“大腦”研究和制定,攜手推動模型與智能體之間的能力互聯(lián)、語義互通與行為協(xié)同,打造統(tǒng)一、高效的模型智能協(xié)作基礎(chǔ)。鼓勵開發(fā)者、研究機構(gòu)和 企業(yè)依托開源社區(qū)和標準化組織,積極貢獻智慧和經(jīng)驗、凝聚共識,合4)共商MoMA生態(tài)匯聚的評測準入規(guī)則。面向模型與智能體能力的多源匯聚與統(tǒng)籌管理,推動建立統(tǒng)一、權(quán)威的評測準入體系。聯(lián)合產(chǎn)業(yè)各方就技術(shù)性能、推理效果、安全合規(guī)等核心維度,協(xié)商形成業(yè)界共同認可并愿意遵循的評測指標和準入規(guī)則,保障平臺納管資源的可控性與高質(zhì)我們期待MoMA匯聚業(yè)界優(yōu)質(zhì)大模型及智能體,依托中國移動充沛的算力 縮略語A2AAgenttoAgent智能體到智能體AIArtificialIntelligence人工智能ANPAgentNetworkProtocol智能體網(wǎng)絡(luò)協(xié)議APIApplicationProgrammingInterface應(yīng)用編程接口ASRAutomaticSpeechRecognition自動語音識別BIBusinessIntelligence商業(yè)智能CRMCustomerRelationshipManagement客戶關(guān)系管理ERPEnterpriseResourcePlanning企業(yè)資源計劃GPTGenerativePre-trainedTransformer生成式預(yù)訓(xùn)練變換器HTTPHyperTextTransferProtocol超文本傳輸協(xié)議JSONJavaScriptObjectNotationJavaScript對象表示法LLMLargeLanguageModel大語言模型MaaSModelasaService模型即服務(wù)MCPModelContextProtocol模型上下文協(xié)議MoMAMixtureofModelsandAgents模型和智能體聚合OCROpticalCharacterRecognition光學(xué)字符識別POIPointofInterest興趣點QAQuestionAnswering問答任務(wù)RAGRetrieval-augmentedGeneration檢索增強生成SDKSoftwareDevelopmentKit軟件開發(fā)工具包TPOTTimePerOutputToken輸出每個詞元時間TPSToken

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論