2025年阿里云AI原生應(yīng)用實(shí)踐沙龍-Serverless AI專場(PTT合集)-阿里云_第1頁
2025年阿里云AI原生應(yīng)用實(shí)踐沙龍-Serverless AI專場(PTT合集)-阿里云_第2頁
2025年阿里云AI原生應(yīng)用實(shí)踐沙龍-Serverless AI專場(PTT合集)-阿里云_第3頁
2025年阿里云AI原生應(yīng)用實(shí)踐沙龍-Serverless AI專場(PTT合集)-阿里云_第4頁
2025年阿里云AI原生應(yīng)用實(shí)踐沙龍-Serverless AI專場(PTT合集)-阿里云_第5頁
已閱讀5頁,還剩182頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

企業(yè)級AI應(yīng)用開發(fā):從技術(shù)選型到生產(chǎn)落地墨飏(洪曉龍)阿里云ServerlessAI團(tuán)隊(duì)01企業(yè)級AI應(yīng)用開發(fā)的真實(shí)面貌02模型、工具和智能體生產(chǎn)實(shí)踐Serverless是應(yīng)用架構(gòu)演進(jìn)的必然趨勢,也是當(dāng)前最有可能演進(jìn)為AINativeInfra的技術(shù)架構(gòu)單體架構(gòu)垂直架構(gòu)單體架構(gòu)垂直架構(gòu)SOA架構(gòu)微服務(wù)架構(gòu)云原生架構(gòu)AI原生架構(gòu)實(shí)現(xiàn)快維護(hù)成本高模塊化負(fù)載均衡高密度部署原子、自治極致彈性??物理機(jī)物理機(jī)虛擬機(jī)虛擬機(jī)容器容器KubernetesKubernetesServerlessServerlessServerlessxAI?企業(yè)AI應(yīng)用開發(fā)的真實(shí)面貌智能體正成為企業(yè)應(yīng)用開發(fā)新范式,生產(chǎn)級AI系統(tǒng)遠(yuǎn)不止表面的智能對話,90%工作在于底層的軟件工程與基礎(chǔ)設(shè)施開發(fā)者看到的企業(yè)看到的負(fù)責(zé)讓大模型連接外部工具負(fù)責(zé)規(guī)劃大模型的行動(dòng)AIAgentMemory負(fù)責(zé)規(guī)劃大模型的行動(dòng)負(fù)責(zé)管理大模型對話時(shí)的記憶Action負(fù)責(zé)管理大模型行動(dòng)的基本流程企業(yè)AI應(yīng)用開發(fā)的真實(shí)需求企業(yè)的生產(chǎn)實(shí)踐發(fā)現(xiàn),除彈性外,模型選型關(guān)注效率&可靠;工具選型關(guān)注簡單&經(jīng)濟(jì);智能體選型關(guān)注安全&可擴(kuò)展。模型智能體大模型、領(lǐng)域模型?參數(shù)規(guī)模0.6/1.7B/4B/8B/14B/32B/235B?工具類型Code/RL/BrowserUse/SimSandbox?開發(fā)范式LLMAgent/FlowAgent/CodeAgent?模型服務(wù)有2種技術(shù)選型:模型服務(wù)商(如OpenAI、百煉等)、開源自建(Qwen、DeepSeek等)維度SaaS(模型服務(wù)商)安全×數(shù)據(jù)風(fēng)險(xiǎn)高:?數(shù)據(jù)在第三方,合規(guī)不可控?數(shù)據(jù)在客戶私網(wǎng),廠商基礎(chǔ)安全保障?數(shù)據(jù)在客戶私網(wǎng),廠商基礎(chǔ)安全保障效率?開箱即用,零配置×幾乎不可定制:?無法修改底層框架,可選模型少?開箱即用,無需管服務(wù)器及其環(huán)境依賴?框架/模型自由,開源選擇多×開發(fā)效率低:?需手動(dòng)配置集群、網(wǎng)絡(luò)、依賴×定制效率低:?小規(guī)模效率高,大規(guī)模效率低可靠?服務(wù)商提供SLA,自動(dòng)容災(zāi)×完全黑盒:?故障依賴服務(wù)商修復(fù)?3AZ高可用,自動(dòng)容災(zāi)?自帶監(jiān)控日志鏈路追蹤等工具×可靠性低:?自主實(shí)現(xiàn)高可用架構(gòu)?需要自建監(jiān)控日志,代價(jià)高彈性?按請求彈性,配額受限則不可再彈×成本不可控:?按請求單價(jià)高,突發(fā)流量費(fèi)用激增?按請求彈性,毫秒/秒級供給資源?按資源單價(jià)低,利用率高浪費(fèi)少×普通彈性:?手動(dòng)/自動(dòng)擴(kuò)展VM或Pod,分鐘級×成本可控:?按資源單價(jià)低,利用率低浪費(fèi)多初創(chuàng)公司PoC階段,快速驗(yàn)證,SaaS/PaaS的開箱即用是最簡單的選擇。規(guī)模擴(kuò)大生產(chǎn)上量,核心業(yè)務(wù)自建&創(chuàng)新,業(yè)務(wù)成熟,有專業(yè)團(tuán)隊(duì),PaaS/IaaS自建是追求自主可控的必然選擇。函數(shù)計(jì)算FC提供PaaS(Serverless自建)方案,云上最快彈性、最小規(guī)格、最細(xì)計(jì)費(fèi)粒度、自動(dòng)3AZ高可用,ROI最高模型服務(wù)智能體AgentAI工具AI應(yīng)用模型服務(wù)智能體AgentAI工具AI應(yīng)用ComfyUI,SD,etc.ServerlessDify,流程編排MCPSSE&企業(yè)專屬市場規(guī)格粒度最小規(guī)格:FC0.05C128MB,0不使用不計(jì)費(fèi)按請求調(diào)度,毫/秒計(jì)費(fèi),低峰自動(dòng)縮0異構(gòu)算力ServerlessxAI運(yùn)行時(shí)生態(tài)集成Qwen,DeepSeek,etc.產(chǎn)品集成,事件驅(qū)動(dòng)云產(chǎn)品Serverless產(chǎn)品集成,事件驅(qū)動(dòng)云產(chǎn)品Serverless化安全隔離,自動(dòng)容災(zāi)沙箱容器2.0快速交付,極致彈性資源池化2.0高密部署,主動(dòng)調(diào)度第四代神龍架構(gòu)50+Python/Node/Java/PHP/Go/.NET等50+50+內(nèi)置運(yùn)行時(shí)環(huán)境,支持自定義運(yùn)行時(shí)和自定義鏡像,方便開發(fā)者靈活定制CPU50+內(nèi)置運(yùn)行時(shí)環(huán)境,支持自定義運(yùn)行時(shí)和自定義鏡像,方便開發(fā)者靈活定制CPU算力(x86)魔搭社區(qū)、HuggingFace熱門模型一鍵部署,內(nèi)置vLLM/SGLang/Ollama/Transformers推理框架,OpenAIAPI兼容圖像生成ComfyUI、StableDiffusion原生開發(fā)體驗(yàn),專屬開發(fā)空間,一鍵發(fā)布為企業(yè)級ServerlessAPI,易集成、易定制,TCO最高設(shè)計(jì)師定制個(gè)人工作助手客戶原聲場景:某4A景區(qū)設(shè)計(jì)師蔣鵬,希望用Al繪畫平臺為游客照進(jìn)行風(fēng)格化助力,增加趣味性和景區(qū)收入痛點(diǎn):不會(huì)編程,希望開箱即用,無需操心軟硬件維護(hù),費(fèi)用可控。78%出圖速度設(shè)計(jì)師定制個(gè)人工作助手客戶原聲場景:某4A景區(qū)設(shè)計(jì)師蔣鵬,希望用Al繪畫平臺為游客照進(jìn)行風(fēng)格化助力,增加趣味性和景區(qū)收入痛點(diǎn):不會(huì)編程,希望開箱即用,無需操心軟硬件維護(hù),費(fèi)用可控。78%出圖速度初創(chuàng)公司智能家居領(lǐng)域的潮流引領(lǐng)客戶原聲場景:某??萍际且患揖劢褂谝徽臼街悄芗揖右曨l解決方案的高新技術(shù)企業(yè),通過Al的增強(qiáng)大大擴(kuò)寬場景、提升體驗(yàn)。痛點(diǎn)視頻業(yè)務(wù)有明顯的峰谷特性,深受saas限流、昂貴且無法定制的困擾靈活定制大型企業(yè)靈活可定制,加速業(yè)務(wù)AI創(chuàng)新客戶原聲場景:服裝企業(yè)森馬,希望借助Al技術(shù)實(shí)現(xiàn)服裝行業(yè)從產(chǎn)品設(shè)計(jì)、生產(chǎn)制造、營銷推廣的多場景提效。痛點(diǎn)適配多種開源大模型,定制化要求高、開發(fā)周期長、GPU持有浪費(fèi)多33%迭代效率3天->30分開發(fā)者開發(fā)者少兒閱讀App創(chuàng)新功能客戶原聲場景:某朵科技是一家兒童閱讀解決方案提者,引入2.5w+繪本童書,1.5w+音頻內(nèi)容,其利用生成式語音大模型開發(fā)的Al互動(dòng)閱讀解鎖閱讀新方式。痛點(diǎn)llidea"要快速驗(yàn)證,開發(fā)效率要高,特別是要避免繁瑣的環(huán)境和資源維護(hù)1萬/年1萬/年->0.5萬/年發(fā)送請求+toolsscheme拼裝內(nèi)容,返回響應(yīng)調(diào)用工具返回結(jié)果Agent大模型MCP是AI發(fā)送請求+toolsscheme拼裝內(nèi)容,返回響應(yīng)調(diào)用工具返回結(jié)果Agent大模型本地文件①本地訪問STDIO協(xié)議本地?cái)?shù)據(jù)調(diào)用工具返回結(jié)果SSE/SSE/StreamableHTTP協(xié)議1.STDIOMCP升級為SSEMCP,統(tǒng)一開發(fā)和部署標(biāo)準(zhǔn);②遠(yuǎn)程調(diào)用2.MCP冷熱不均,RemoteAPIs②遠(yuǎn)程調(diào)用3.構(gòu)建企業(yè)專屬M(fèi)CPMarketPlace,統(tǒng)一管理工具資產(chǎn);外部依賴遠(yuǎn)程調(diào)用RemoteAPIsRemot函數(shù)計(jì)算FC提供MCPRuntime和彈性算力,支持STDIO零改造升級SSE、會(huì)話親和、閑置計(jì)費(fèi)、隱私變量、流量鑒權(quán)等能力函數(shù)計(jì)算FC聯(lián)合魔搭社區(qū)發(fā)布最大MCP中文社區(qū),聯(lián)合百煉發(fā)布業(yè)界首個(gè)全生命周期MCP服務(wù)市場,將MCP沉淀為平臺資產(chǎn)函數(shù)計(jì)算FC已為數(shù)百萬開發(fā)者的海量訪問提供大規(guī)模MCPRuntime服務(wù)函數(shù)計(jì)算FC已為數(shù)萬企業(yè)的海量訪問提供大規(guī)模MCPSandbox工具-技術(shù)選型Agent痛點(diǎn):行為不可預(yù)測、易受注入攻擊、權(quán)限邊界模糊,Agent需求:Runtime、Sandbox、Memory、Gateway、…WorkflowWorkflowAgentCodeAgentCodeAgent執(zhí)行代碼生成代碼、運(yùn)行代碼、分析數(shù)調(diào)用工具瀏覽網(wǎng)頁、控制電腦、調(diào)用MCP訪問外部API等執(zhí)行命令執(zhí)行任務(wù)、依賴管理、文件操作、分析診斷等強(qiáng)化學(xué)習(xí)動(dòng)態(tài)決策、環(huán)境交互、多實(shí)體協(xié)作等CodeSandbox:通過安全隔離的運(yùn)行環(huán)境,執(zhí)行大模型動(dòng)態(tài)生成的代碼,使得Agent具備靈活擴(kuò)展的能力AIAIAgent流程式CodeServer問題分類器節(jié)點(diǎn)LLM節(jié)點(diǎn)函數(shù)計(jì)算節(jié)點(diǎn)執(zhí)行代碼節(jié)點(diǎn)流程式CodeServer問題分類器節(jié)點(diǎn)LLM節(jié)點(diǎn)函數(shù)計(jì)算節(jié)點(diǎn)執(zhí)行代碼節(jié)點(diǎn)FunFlow用戶編碼式推理行動(dòng)觀察自省AIAgentSelfRuntimeon函數(shù)計(jì)算CodeSandboxonFC優(yōu)勢?安全隔離地執(zhí)行LLM/用戶生成代碼2.互聯(lián)互通?提供免費(fèi)URL,請求直接調(diào)度到沙箱3.高并發(fā)隔離與資源保障4.超低時(shí)延場景優(yōu)化能力案BrowserUse:輔助大模型實(shí)現(xiàn)數(shù)據(jù)采集和聯(lián)網(wǎng)搜索,使得Agent具備低成本獲取實(shí)時(shí)信息的渠道AIAgent流程式問題分類器節(jié)點(diǎn)LLM節(jié)點(diǎn)流程式問題分類器節(jié)點(diǎn)LLM節(jié)點(diǎn)1.會(huì)話親和性(SessionAffinity)函數(shù)計(jì)算節(jié)點(diǎn)采集數(shù)據(jù)節(jié)點(diǎn)函數(shù)計(jì)算節(jié)點(diǎn)采集數(shù)據(jù)節(jié)點(diǎn)FunFLow用戶編碼式?按內(nèi)存擴(kuò)容:滿足瀏覽器內(nèi)存需求FunFLow用戶編碼式推理行動(dòng)觀察自省AIAgentSelfRuntimeon函數(shù)計(jì)算推理行動(dòng)觀察自省AIAgentSelfRuntimeon函數(shù)計(jì)算函數(shù)計(jì)算FC為Qwen3-Coder提供彈性RLSandbox服務(wù),助力其成為迄今為止最具代理能力的代碼模型百煉智能體、工作流應(yīng)用函數(shù)計(jì)算百煉智能體、工作流應(yīng)用函數(shù)計(jì)算FC為百煉智能體/工作流提供官方CodeInterpreter、腳本轉(zhuǎn)換等服務(wù)函數(shù)計(jì)算FC為Qwen3-Coder提供超大規(guī)模彈性CodeRL訓(xùn)練要解決三個(gè)核心問題:環(huán)境依賴包不確定性問題;文件信息路徑不確定性問題;解決會(huì)話(Session)請求親和&隔離的問題用戶AIAgent管控服務(wù)AIAgent管控服務(wù)獲取可用資源不再需要復(fù)雜的與K8sPod交互的邏輯只需要返回函數(shù)計(jì)算中函數(shù)的訪問URL,在請求Header中傳入SessionId即可資源管理服務(wù)函數(shù)實(shí)例一旦被某個(gè)Session占據(jù),會(huì)拒絕其他的請求。Session不連續(xù)且有較長時(shí)間沒有請求,實(shí)例才會(huì)銷毀可設(shè)置函數(shù)實(shí)例一旦被某個(gè)Session占據(jù),會(huì)拒絕其他的請求。Session不連續(xù)且有較長時(shí)間沒有請求,實(shí)例才會(huì)銷毀可設(shè)置Session超時(shí)時(shí)間(SessionIdleTime)★tar&&upload函數(shù)實(shí)例存儲(chǔ)任務(wù)執(zhí)行過程中產(chǎn)生的文件存儲(chǔ)在臨時(shí)云盤Session不活躍備份數(shù)據(jù),釋放計(jì)算資源download&&untar★恢復(fù)快照,還是新Session判斷邏輯:基于SessionId去查OSS(或者是客戶自己的數(shù)據(jù)表)如果差不多,就是新的會(huì)話,從零開始即可Session恢復(fù)下載數(shù)據(jù)并恢復(fù)目錄函數(shù)計(jì)算User-2-Session-2Session親和,保證一個(gè)SessionId只在一個(gè)實(shí)例處理Step-2Step-3Step-2Step-3實(shí)例-1Step-1實(shí)例-2實(shí)例-3AI網(wǎng)關(guān)(LLMAPI)地圖服務(wù)搜索服務(wù)地圖服務(wù)搜索服務(wù)天氣服務(wù)…Embedding多模態(tài)?3分鐘創(chuàng)建Dify應(yīng)用?默認(rèn)集監(jiān)控日志能力?底層資源按需彈縮?默認(rèn)支持智能化可用區(qū),支持指定三AZ?默認(rèn)支持負(fù)載均衡與健康檢查聯(lián)動(dòng),提供無損上下線成本經(jīng)濟(jì)?按需按量付費(fèi)??3分鐘創(chuàng)建Dify應(yīng)用?默認(rèn)集監(jiān)控日志能力?底層資源按需彈縮?默認(rèn)支持智能化可用區(qū),支持指定三AZ?默認(rèn)支持負(fù)載均衡與健康檢查聯(lián)動(dòng),提供無損上下線成本經(jīng)濟(jì)?按需按量付費(fèi)?支持多種規(guī)格資源,并提供閑時(shí)計(jì)量模式,夜間成本更低?Dify版本更新快,SAE默認(rèn)具備灰度發(fā)布能力?AI應(yīng)用監(jiān)控提供Trace能力,結(jié)合日志查詢,問題定位更加迅速終端用戶——瀏覽器/APP/小程序拖拽式編排快速構(gòu)建Dify-ServiceDify-可用區(qū)CDify-可用區(qū)CDify-webDify-APIDify-sandboxDify-workerDify-webDify-APIDify-sandboxDify-workerDify-webDify-APIDify-sandboxDify-workerServerless應(yīng)用平臺(SAE)業(yè)務(wù)接口調(diào)用數(shù)據(jù)庫調(diào)用業(yè)務(wù)接口調(diào)用云RDSPostgreSQL版本云數(shù)據(jù)庫云RDSPostgreSQL版本云數(shù)據(jù)庫RedisAnalyticDBPostgreSQL業(yè)務(wù)應(yīng)用MCPServer云數(shù)據(jù)庫RedisServerless應(yīng)用平臺AnalyticDBServerless應(yīng)用平臺函數(shù)計(jì)算FC提供兼容Dify的可視化工作流開發(fā)體驗(yàn),采用自研工作流執(zhí)行引擎,10倍提升Agent運(yùn)行效率兼容Dify兼容業(yè)內(nèi)流行Agent平臺Dify的UI體驗(yàn)兼容DifyDSL標(biāo)準(zhǔn),存量遷移無負(fù)擔(dān)自研引擎對比Dify托管版,性能和吞吐提升10+倍靈活定制,LLM/工具/節(jié)點(diǎn)均支持使用云上自建服務(wù)如FC生態(tài)集成無縫打通阿里云100+云產(chǎn)品,支持VPC互聯(lián)互通支持事件驅(qū)動(dòng),可由云產(chǎn)品事件觸發(fā)工作流執(zhí)行各類AIAgent托管OpenManus運(yùn)行用戶自行編寫的優(yōu)勢和特點(diǎn)各類AIAgent托管OpenManus運(yùn)行用戶自行編寫的優(yōu)勢和特點(diǎn)兩種類型JavaCPU實(shí)例(百毫秒彈性)MCP運(yùn)行時(shí).NetCoreJavaCPU實(shí)例(百毫秒彈性)MCP運(yùn)行時(shí).NetCoreGPUGPU實(shí)例彈性伸縮負(fù)載均衡流量控制消息緩存高可用部署跨集群容災(zāi)多租戶隔離彈性伸縮負(fù)載均衡流量控制消息緩存高可用部署跨集群容災(zāi)多租戶隔離安全安全容器神龍服務(wù)器網(wǎng)絡(luò)通信安全安全容器神龍服務(wù)器網(wǎng)絡(luò)通信OSSOSS存儲(chǔ)函數(shù)計(jì)算FC聯(lián)動(dòng)阿里云ServerlessxAI產(chǎn)品生態(tài),提供簡單、經(jīng)濟(jì)、彈性的企業(yè)級AI應(yīng)用基礎(chǔ)設(shè)施FunAgent(智能體開發(fā))FunArt(文生圖/視頻)FunAgent(智能體開發(fā))應(yīng)用集成CloudFlowMNSRocketMQEvent數(shù)據(jù)庫ADBADB微服務(wù)微服務(wù)ARMSARMSAPIGAPIG大數(shù)據(jù)大數(shù)據(jù)人工智能人工智能存儲(chǔ)通義萬象通義萬象通義千問通義靈碼魔搭社區(qū)百煉通義千問通義靈碼夸克原子化全鏈路彈性可編程、可編排原子化全鏈路彈性原子化設(shè)計(jì),易于集成和被集成,VPC互聯(lián)互通更安全ServerlessxAI讓應(yīng)用開發(fā)更簡單Gartner魔力象限領(lǐng)導(dǎo)者,F(xiàn)orrester全球領(lǐng)導(dǎo)者象限(亞太唯一,3次蟬聯(lián)),AI應(yīng)用開發(fā)能力獲滿分AI應(yīng)用開發(fā)能力AlibabaTencent基于FunctionAI分鐘級構(gòu)建生產(chǎn)級AI應(yīng)用——Serverless+AI讓應(yīng)用開發(fā)更簡單肯夢(陳濤)云原生-產(chǎn)品經(jīng)理傳統(tǒng)應(yīng)用開發(fā)AI應(yīng)用開發(fā)智能體知識庫記憶/工具服務(wù)智能體知識庫記憶/工具服務(wù)數(shù)據(jù)庫大語言模型數(shù)據(jù)庫大語言模型研發(fā)的關(guān)注點(diǎn)發(fā)生變化傳統(tǒng)應(yīng)用開發(fā):如何確保業(yè)務(wù)邏輯正確穩(wěn)定運(yùn)行AI應(yīng)用開發(fā):如何最大可靠的發(fā)揮LLM價(jià)值業(yè)務(wù)邏輯基礎(chǔ)設(shè)施業(yè)務(wù)邏輯基礎(chǔ)設(shè)施研發(fā)基礎(chǔ)設(shè)施AI應(yīng)用基本要素門檻高、迭代快,效果好,低成本1大模型2領(lǐng)域模型開箱即用、一鍵托管、可觀測完備、低成本開箱即用、快速迭代、靈活可擴(kuò)展,低成本3業(yè)務(wù)邏輯基本要素4領(lǐng)域抽象領(lǐng)域適配、業(yè)界標(biāo)準(zhǔn)、活躍生態(tài)AI應(yīng)用性能、成本、穩(wěn)定、安全、體驗(yàn)5BaaS服務(wù)6流程編排極簡運(yùn)維按需付費(fèi)極簡運(yùn)維按需付費(fèi)?簡單,易用,減少發(fā)布/擴(kuò)容時(shí)??通過不斷的優(yōu)化資源供給能力:降低用戶保有資源的成本,提?通過不斷的加強(qiáng)和云產(chǎn)品及周邊生態(tài)的集成,降低用戶業(yè)務(wù)構(gòu)建的門檻,減少業(yè)務(wù)發(fā)布和擴(kuò)容運(yùn)維時(shí)間,提升業(yè)務(wù)效率;??平臺及體驗(yàn)?zāi)芰ι墸涸品?wù)集成,事件驅(qū)動(dòng),函數(shù)編排,應(yīng)用模版,計(jì)費(fèi)優(yōu)化,觀測能力集成業(yè)務(wù)開發(fā)先進(jìn)工具按需模型托管服務(wù)極低成本靈活組裝便于二次開發(fā)一鍵極速創(chuàng)建AI應(yīng)用業(yè)務(wù)開發(fā)先進(jìn)工具按需模型托管服務(wù)極低成本靈活組裝便于二次開發(fā)針對AI場景的Studio開發(fā)能務(wù)平均成本降低60%針對AI場景的Studio開發(fā)能務(wù)平均成本降低60%AI領(lǐng)域應(yīng)用的主體智能體應(yīng)用集成及應(yīng)用運(yùn)維價(jià)值A(chǔ)I領(lǐng)域應(yīng)用的主體智能體應(yīng)用集成及應(yīng)用運(yùn)維價(jià)值?行動(dòng):碎片化代碼,需要靈活、快速、輕量的運(yùn)行時(shí),函數(shù)是最合適的形態(tài)(MCP,functionHostingServicesMCP/FunctionCallingServerlessGPUServerless是Agent的最佳運(yùn)行時(shí)承載托管生態(tài)及Serverless算力,擴(kuò)展及運(yùn)維價(jià)值工具模型服務(wù)ServerlessGPU支撐自定義領(lǐng)域模型托管組裝式開發(fā),彈性開放,按需選擇Agent服務(wù)服務(wù)模型托管Function組裝式開發(fā),彈性開放,按需選擇Agent服務(wù)服務(wù)模型托管FunctionAI一鍵創(chuàng)建應(yīng)用無縫升級AI應(yīng)用開發(fā)范式應(yīng)用開發(fā)應(yīng)用市場AI運(yùn)行時(shí)內(nèi)置vLLM,SGLang,AI運(yùn)行時(shí)內(nèi)置vLLM,SGLang,Ollama,HuggingFace推理框架STDIO零改造升級SSE開源模型/智能體應(yīng)用增強(qiáng)AgentFlow:高性能的Agent流程開發(fā)平臺交互式開發(fā)(交互式開發(fā)(AIStudio)觸發(fā)器工作流引擎觸發(fā)器標(biāo)準(zhǔn)工作流(標(biāo)準(zhǔn)工作流(Standard)快速工作流(Express)定時(shí)觸發(fā)定時(shí)觸發(fā)消息隊(duì)列…畫布&視圖AIStudioAIStudioCloudStudio基礎(chǔ)組件工具拓展基礎(chǔ)組件工具拓展LLM/Agent知識檢索LLM/Agent知識檢索代碼執(zhí)行代碼執(zhí)行條件分支/并行/條件分支/并行/迭代更多…FunctionCallMarkplace可觀測可觀測/可運(yùn)維/可靠交付流量灰度沙箱隔離/彈性擴(kuò)縮版本管理版本管理/草稿業(yè)務(wù)場景電商場景廣告場景電商場景廣告場景教育場景游戲場景輔助設(shè)計(jì)場景AIGC圖像生成工作流廣場模型廣場工作流廣場模型廣場實(shí)例登陸基礎(chǔ)功能應(yīng)用監(jiān)控文件管理實(shí)例登陸基礎(chǔ)功能應(yīng)用監(jiān)控文件管理彈性API應(yīng)用運(yùn)維彈性API應(yīng)用運(yùn)維異步調(diào)用LoRA訓(xùn)練LoRA訓(xùn)練場景功能場景功能基礎(chǔ)設(shè)施對象存儲(chǔ)對象存儲(chǔ)OSS文件存儲(chǔ)模型托管:ServerlessGPU讓模型服務(wù)更普惠模型托管服務(wù)提供GPU資源的按需和極速模式,在保留用戶原有長持預(yù)留GPU的使用形態(tài)下,通過區(qū)分GPU實(shí)例的忙閑時(shí)刻,閑時(shí)定價(jià)大幅低于忙時(shí)定價(jià),幫助客戶大幅降低AI落地成本,同時(shí)保證模型冷啟動(dòng)推理耗時(shí)。?低延時(shí):規(guī)避GPU按量場景下的冷啟動(dòng)?降成本:對比K8S自建,大幅降低AI落地成本?保交付:GPU緊張背景,確定資源交付,保證業(yè)務(wù)永續(xù)對象存儲(chǔ)OSS應(yīng)用應(yīng)用傳統(tǒng)的在線推理場景傳統(tǒng)的在線推理場景延時(shí)高度變化,負(fù)載高度不確定,偏C端的應(yīng)用形態(tài),日均資源利用率普遍較低;例如:傳統(tǒng)的CV類模型(OCR)、NLP模型(機(jī)器翻譯)新興的大模型推理場景AIGC浪潮下的新興推理應(yīng)用,LLM文生文、StableDiffusioFunASR文生音頻等插件廣場:加速智能體應(yīng)用集成MCP為LLM連接數(shù)據(jù)源和工具提供了標(biāo)準(zhǔn)化的方法?內(nèi)置MCPProxy,存量STDIO無改造直接生成SSE/StreamableHTTP服務(wù),且具備單實(shí)例多并發(fā)能力?發(fā)布MCP會(huì)話親和性調(diào)度,保證相同sessionID會(huì)話綁定到相同實(shí)例,具備會(huì)話配額控制保證單實(shí)例會(huì)話公平、MCP會(huì)話優(yōu)雅升級?發(fā)布長連接閑置計(jì)費(fèi),最高降低87%成本?提供模板一鍵部署、自定義MCP服務(wù),滿足開源托管以及二次開發(fā)需求?提供隱私變量管理、服務(wù)鑒權(quán)、內(nèi)網(wǎng)訪問能力,本地STDIO協(xié)議無需改造即可提供安全的企業(yè)級服務(wù)AgentFlow行業(yè)案例:社區(qū)內(nèi)容審查客戶Z作為中國最大的問答社區(qū)之一,每天面臨海量內(nèi)容審核需求,傳統(tǒng)人工審核方式效率低下,難以應(yīng)對突發(fā)流量。解決方案基于AIstudio工作流引擎構(gòu)建LLM內(nèi)容審查系統(tǒng),采用多級審核流程:?第一級:基于規(guī)則的快速過濾?第二級:LLM語義理解和上下文分析?第三級:人工確認(rèn)和反饋學(xué)習(xí)?利用AIstudio高吞吐特性,支持1000QPS的內(nèi)容審核需求?沙箱環(huán)境確保敏感內(nèi)容處理安全性?彈性伸縮應(yīng)對突發(fā)流量,降低資源成本機(jī)器人端接收圖像,通過與亞毫米精度工業(yè)機(jī)械臂等設(shè)備的協(xié)作,xbot機(jī)器人能夠?qū)崿F(xiàn)像素機(jī)器人端接收圖像,通過與亞毫米精度工業(yè)機(jī)械臂等設(shè)備的協(xié)作,xbot機(jī)器人能夠?qū)崿F(xiàn)像素像摳臉+風(fēng)格化處理。(人像摳臉如用工作流實(shí)現(xiàn)不夠精細(xì),可結(jié)合阿里云人臉檢測與五官定位模型進(jìn)行前序處理)客戶端生圖2.客戶端調(diào)用API進(jìn)行圖片風(fēng)格化處理賽博朋克古風(fēng)美人職場麗人校園女神聯(lián)合魔搭社區(qū)發(fā)布最大MCP中文社區(qū),聯(lián)合百煉發(fā)布業(yè)界首個(gè)全生命周期MCP服務(wù)市場,將MCP沉淀為平臺資產(chǎn)快速開發(fā)和部署MCP快速開發(fā)和部署MCP服務(wù)STDIO零改造升級為MCP百煉全周期MCP百煉全周期MCP服務(wù)AIServerless:為客戶提供安全高效的Sandbox運(yùn)行環(huán)境率,降低資使用源成本動(dòng)的Agent提供干凈獨(dú)占的運(yùn)行環(huán)境Trace支持Serverless應(yīng)用引擎SAE:從傳統(tǒng)應(yīng)用到AI應(yīng)用的一站式托管賦能企業(yè)安全高效構(gòu)建部署AI智能體應(yīng)用盧令Serverless應(yīng)用引擎(ServerlessAI|AppEngine)技術(shù)負(fù)責(zé)人01傳統(tǒng)應(yīng)用運(yùn)維的9簡、穩(wěn)、省9優(yōu)化之道02加速AI創(chuàng)新:從快速探索到高效落地傳統(tǒng)應(yīng)用運(yùn)維的9簡、穩(wěn)、省9優(yōu)化之傳統(tǒng)應(yīng)用運(yùn)維的9簡、穩(wěn)、省9優(yōu)化之道簡:一站式容器托管平臺,讓運(yùn)維更簡單業(yè)務(wù)應(yīng)用APP后臺Web應(yīng)用業(yè)務(wù)應(yīng)用APP后臺Web應(yīng)用定時(shí)/xxl-JobServerless應(yīng)用引擎Serverless應(yīng)用引擎SpringCloud/Dubbo無縫遷移微服務(wù)流量灰度全套微服務(wù)治理SpringCloud/Dubbo無縫遷移微服務(wù)流量灰度全套微服務(wù)治理無損上下線服務(wù)鑒權(quán)無損上下線服務(wù)鑒權(quán)端云聯(lián)調(diào)一鍵啟停環(huán)境事件中心端云聯(lián)調(diào)一鍵啟停環(huán)境事件中心Java冷啟動(dòng)加速分批/金絲雀發(fā)布分批/金絲雀發(fā)布CICDCICD集成權(quán)限隔離/審批生命周期管理阿里云沙箱容器2.0阿里云沙箱容器2.0兼容容器生態(tài)兼容容器生態(tài)?支持Sidecar模式,可以自定義安裝Agent能力?產(chǎn)品化支持多種灰度策略:藍(lán)綠發(fā)布,滾動(dòng)升級,全鏈路灰度,標(biāo)簽路由等。?免費(fèi)提供全鏈路的無侵入式監(jiān)控,和微服務(wù)治理能力?企業(yè)級特性的加強(qiáng):符合企業(yè)習(xí)慣的權(quán)限管理,優(yōu)化的批量操作,巡檢等。多可用區(qū)容災(zāi)穩(wěn):從架構(gòu)到防護(hù),全程保障線上穩(wěn)定運(yùn)行多可用區(qū)容災(zāi)多可用區(qū)容災(zāi)對于多可用區(qū)容災(zāi)對于SAE是默認(rèn)的能力:一鍵開啟SAESAE默認(rèn)應(yīng)用實(shí)例分散部署在多個(gè)可用區(qū),實(shí)現(xiàn)跨機(jī)房容災(zāi)。單個(gè)可用區(qū)故障時(shí),流量自動(dòng)切換至其他可SAESAE內(nèi)部架構(gòu)示意圖多可用區(qū)優(yōu)勢多可用區(qū)優(yōu)勢跨可用區(qū)容災(zāi)(Multi-AZ)單區(qū)故障秒級流量切換,可用性達(dá)全托管運(yùn)維全托管運(yùn)維資源池,無需手動(dòng)配置,運(yùn)維成本降低70%。?按需跨AZ彈性伸縮,資源利用率提升50%?同可用區(qū)優(yōu)先路由:優(yōu)先訪問同AZ實(shí)例,跨區(qū)延遲降低80%?全局負(fù)載均衡(SLB):故障時(shí)自動(dòng)移動(dòng)應(yīng)用Web應(yīng)用合作伙伴內(nèi)部系統(tǒng)AI應(yīng)用注冊配置中心微服務(wù)治理云原生可觀測安全防護(hù)安全防護(hù)注冊配置中心微服務(wù)治理云原生可觀測安全防護(hù)安全防護(hù)云原生網(wǎng)關(guān)服務(wù)統(tǒng)一出口可用區(qū)A可用區(qū)B可用區(qū)A可用區(qū)B可用區(qū)C核心競爭力核心競爭力?無需人工干預(yù),系統(tǒng)實(shí)時(shí)監(jiān)控流量(如?通過資源超分配(Over-Subscription)技術(shù),在不增加實(shí)例數(shù)的條件下提升?無需人工干預(yù),系統(tǒng)實(shí)時(shí)監(jiān)控流量(如?通過資源超分配(Over-Subscription)技術(shù),在不增加實(shí)例數(shù)的條件下提升單實(shí)例處理能力,避免傳統(tǒng)橫向擴(kuò)容的復(fù)雜度。?基線+彈性組合都Serverless付費(fèi)全自動(dòng)觸發(fā)持萬級實(shí)例瞬間拉起,承載百萬級QPS沖瞬時(shí)響應(yīng)全自動(dòng)觸發(fā)非橫向擴(kuò)容?擴(kuò)容過程不斷開現(xiàn)有連接、不變更零感知切換非橫向擴(kuò)容服務(wù)IP,業(yè)務(wù)流量無感知切換至新實(shí)例,服務(wù)連續(xù)性100%保障。靈活應(yīng)對資源變化混合計(jì)費(fèi)模式秒級計(jì)費(fèi)粒度靈活應(yīng)對資源變化混合計(jì)費(fèi)模式?突發(fā)時(shí)按秒計(jì)費(fèi)擴(kuò)容,流量回落后自動(dòng)縮容至基線實(shí)例數(shù),閑時(shí)成本直降50%。極速擴(kuò)容(秒級拉起實(shí)例)、高并發(fā)承載能力加速AI創(chuàng)新:從快速探索到高效落地成本不可控安全合規(guī)風(fēng)險(xiǎn)運(yùn)維復(fù)雜度高?流量防護(hù)弱,很容易被穿透?成本不可控安全合規(guī)風(fēng)險(xiǎn)運(yùn)維復(fù)雜度高?流量防護(hù)弱,很容易被穿透?數(shù)據(jù)隱私與合規(guī)性管理困難數(shù)據(jù)庫等)參數(shù)非最優(yōu)配置?管控面與數(shù)據(jù)鏈路耦合,高并發(fā)無法保證穩(wěn)定性?數(shù)據(jù)源存儲(chǔ)格式單一,推理服務(wù)需要大量的計(jì)算資源,資源分配不均會(huì)導(dǎo)致性能瓶頸?本地部署復(fù)雜且維護(hù)成本高,需要頻繁升級版本?需要自己管理應(yīng)用的版本發(fā)布?周邊配套不完善:沒有配套的治理、可觀測體系,事前事后無法及時(shí)發(fā)現(xiàn)并定位問題?資源錯(cuò)配,要么業(yè)務(wù)低峰期閑置燒錢,要么業(yè)務(wù)高峰期瞬間被打滿,影響業(yè)務(wù)?人力維護(hù)投入大企業(yè)真正需要的是:開箱即用的開發(fā)體驗(yàn)+生產(chǎn)級的性能、穩(wěn)定性及安全保障不做開發(fā)平臺的替代者,而是做它們的“護(hù)航艦”手機(jī)APP生態(tài)云原生應(yīng)用架構(gòu)AI原生應(yīng)用架構(gòu)Serverless手機(jī)APP生態(tài)云原生應(yīng)用架構(gòu)AI原生應(yīng)用架構(gòu)Serverless大模型(通義…)手機(jī)APP微服務(wù)1微服務(wù)微服務(wù)1微服務(wù)2MySQL/Redis/OSS微服微服務(wù)3大數(shù)據(jù)(大數(shù)據(jù)(Blink+ES)SAESAE致力于托管主流開源AI智能體應(yīng)用開發(fā)平臺(深度適配+全局賦能)Token限流綠網(wǎng)/敏感信息過濾Tools/MCPServerPCPCAI智能體(Agents)Jmanus/Dify/workflow….PromptTemplateDocumentTransformerEmbeddingModelVectorStore…API管理流量防護(hù)WAF防護(hù)服務(wù)發(fā)現(xiàn)安全保障持續(xù)迭代低成本穩(wěn)定高可用安全域,保證數(shù)據(jù)絕對安全安全保障持續(xù)迭代低成本穩(wěn)定高可用安全域,保證數(shù)據(jù)絕對安全二次開發(fā)性使用,無需冗余保證資源閑時(shí)計(jì)量資源類型,提供更低成本的算力默認(rèn)支持智能化可用區(qū),實(shí)例粒度的自動(dòng)化遷移查聯(lián)動(dòng)保證無損上下線簡單易用何額外配置低成本靈活+性能普通容器啟動(dòng)慢根因:1.容器啟動(dòng)之前,OCIV1標(biāo)準(zhǔn)的鏡像下載和解壓耗時(shí)大2.應(yīng)用啟動(dòng)僅依賴6.4%的鏡像數(shù)據(jù)DADI鏡像加速方案:轉(zhuǎn)化鏡像格式、OnDemandread(按需加載啟動(dòng)容器)加速原理運(yùn)維配套-自定義彈性伸縮應(yīng)用實(shí)例應(yīng)用實(shí)例…應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例…應(yīng)用實(shí)例應(yīng)用實(shí)例適用于有突發(fā)流量、典型脈沖的應(yīng)用場景,多用于互娛/游戲/社交平臺/電商等行業(yè)。優(yōu)勢:比開源K8sHPA指標(biāo)豐富,且可以自定義指標(biāo)。應(yīng)用實(shí)例應(yīng)用實(shí)例…應(yīng)用實(shí)例應(yīng)用實(shí)例2.定時(shí)彈性適用于資源畫像存在周期性的應(yīng)用場景,多用于餐飲/出行/證券/醫(yī)療政府等行業(yè)。3.混合彈性(定時(shí)彈性&指標(biāo)彈性混用)適用于固定時(shí)段內(nèi)有突發(fā)流量、典型脈沖,常穩(wěn)時(shí)段內(nèi)流量波動(dòng)不均的應(yīng)用場景,多用于媒體報(bào)社/在線教育/語音識別合成應(yīng)用實(shí)例eg:最大10,最小2特殊時(shí)間段1eg:最大30,最小15特殊時(shí)間段N應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例……應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例……應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例應(yīng)用實(shí)例……eg:最大50,最小40優(yōu)勢:比開源K8sHPA指標(biāo)豐富,且可以自定義指標(biāo)。中大型企業(yè)多套環(huán)境,內(nèi)部環(huán)境長期資源浪費(fèi),使用中大型企業(yè)多套環(huán)境,內(nèi)部環(huán)境長期資源浪費(fèi),使用SAE一鍵啟停,可以節(jié)省一部分資源成本。生產(chǎn)環(huán)境命名空間一鍵開啟所有應(yīng)用測試環(huán)境命名空間測試環(huán)境命名空間一鍵開啟所有應(yīng)用一鍵停止所有應(yīng)用生產(chǎn)環(huán)境命名空間一鍵開啟所有應(yīng)用測試環(huán)境命名空間測試環(huán)境命名空間一鍵開啟所有應(yīng)用一鍵停止所有應(yīng)用便于需要時(shí)一鍵秒級拉起。生產(chǎn)環(huán)境命名空間生產(chǎn)環(huán)境命名空間一鍵開啟所有應(yīng)用定時(shí)啟停運(yùn)維配套-可灰度、可觀測、可回滾將阿里巴巴沉淀多年的安全生產(chǎn)實(shí)踐產(chǎn)品化將阿里巴巴沉淀多年的安全生產(chǎn)實(shí)踐產(chǎn)品化,應(yīng)用生命周期管理純白屏化操作,應(yīng)用發(fā)布可灰度、可觀測、可回滾。??支持單批、分批、金絲雀等發(fā)布策略。支持按流量灰度、按內(nèi)容灰度。批次間自動(dòng)/手動(dòng)任選?允許人工介入控制發(fā)布流程,手動(dòng)確認(rèn)通過、異常中止、一鍵回滾傳統(tǒng)架構(gòu)Serverless容器化遷移實(shí)踐SAE賦能企業(yè)高效、穩(wěn)定、無縫實(shí)現(xiàn)全托管容器化楊躍山阿里云云原生高級架構(gòu)師企業(yè)云原生上云的挑戰(zhàn)技術(shù)?部署在IDC或運(yùn)營商云IaaS?技術(shù)架構(gòu)滯后?缺少體系化的PaaS服務(wù)構(gòu)建?穩(wěn)定性與高可用性保障?安全性面向挑戰(zhàn)大?架構(gòu)轉(zhuǎn)型難度?toC及新業(yè)務(wù)建設(shè)和輿情壓力大管理?運(yùn)維管理復(fù)雜度高?研發(fā)依賴外包、缺少統(tǒng)一的技術(shù)規(guī)范、技術(shù)棧多樣?建設(shè)周期長成本?成本壓力大?歷史包袱大,需要考慮遺留系統(tǒng),系統(tǒng)考慮遷移路徑?系統(tǒng)集成復(fù)雜度高?如何快速、低成本融合先進(jìn)的云ServerlessServerless容器化架構(gòu)的演講趨勢新零售/電商semir傳媒/醫(yī)療PON游戲千行百業(yè)百萬開發(fā)者AllOnServerless讓應(yīng)用開發(fā)新零售/電商semir傳媒/醫(yī)療PON游戲千行百業(yè)百萬開發(fā)者Serverless工具鏈數(shù)據(jù)庫服務(wù)消息/微服務(wù)中間件Serverless工具鏈數(shù)據(jù)庫服務(wù)消息/微服務(wù)中間件APIGW、CLB、ALBBAAS服務(wù)聯(lián)動(dòng)極簡編程云產(chǎn)品深度集成,構(gòu)建事件驅(qū)動(dòng)AI推理GPU虛擬化+AIGCServerless解決方案音視頻轉(zhuǎn)碼/直播錄制/圖片加工上下游聯(lián)動(dòng)計(jì)算游戲/汽車等戰(zhàn)斗結(jié)算/游戲打包/移動(dòng)車聯(lián)等Serverless計(jì)算事件驅(qū)動(dòng)型無服務(wù)器計(jì)算服務(wù),豐富的云產(chǎn)品集成觸發(fā)微服務(wù)微服務(wù)架構(gòu)和容器平臺的深度融微服務(wù)微服務(wù)架構(gòu)和容器平臺的深度融合,集成微服務(wù)治理、應(yīng)用監(jiān)控等WEB應(yīng)用面向單體應(yīng)用的全托管平臺,集成流量網(wǎng)關(guān),支持實(shí)例縮0、閑置計(jì)費(fèi)等Job/批任務(wù)極簡批量任務(wù)運(yùn)行平臺,支持定時(shí)、XXL-Job等開源調(diào)度框架面向應(yīng)用的全托管、簡化運(yùn)維、高可用K8s平臺Serverless會(huì)極大促進(jìn)企業(yè)技術(shù)架構(gòu)升級,提升效率:資源效率、運(yùn)維效率、研發(fā)效率主機(jī)包年包月主機(jī)+容器依賴調(diào)度組件,用好有上手門檻資源浪費(fèi),高峰時(shí)需排隊(duì)基于云主機(jī)方案:資源使用模型基于K8S方案:資源使用模型資源Serverless完全按需彈性伸縮 基于Serverless部署業(yè)務(wù):資源使用模型資源管理革命資源利用率革命資源成本革命從人工運(yùn)維從預(yù)算采購低利用率從固定成本支出到云平臺工具運(yùn)維到有限彈性高利用率到根據(jù)資源策略伸縮到Serverless根據(jù)業(yè)務(wù)策略資源免維護(hù)業(yè)務(wù)高彈性平臺低成本基于Serverless架構(gòu)的分布式應(yīng)用云原生網(wǎng)關(guān)微服務(wù)治理數(shù)據(jù)庫PolarDB微服務(wù)治理服務(wù)統(tǒng)一出口微服務(wù)應(yīng)用微服務(wù)應(yīng)用微服務(wù)應(yīng)用云原生可觀測云消息隊(duì)列微服務(wù)應(yīng)用微服務(wù)應(yīng)用微服務(wù)應(yīng)用云原生可觀測安全防護(hù)注冊配置中心編寫業(yè)務(wù)邏輯代碼編寫業(yè)務(wù)邏輯代碼構(gòu)建交付物編寫業(yè)務(wù)邏輯代碼編寫業(yè)務(wù)邏輯代碼構(gòu)建交付物ZIP、JAR、鏡像按請求粒度調(diào)度神龍裸金屬+安全容器構(gòu)建鏡像搭建負(fù)載均衡網(wǎng)關(guān)構(gòu)建鏡像搭建負(fù)載均衡網(wǎng)關(guān)配置集群網(wǎng)絡(luò)、網(wǎng)段管理集群、管理應(yīng)用管理應(yīng)用周邊組件JAR/WAR、ZIP、鏡像配置負(fù)載均衡網(wǎng)關(guān)Serverless應(yīng)用引擎ASKASK微服務(wù)、可觀測組件神龍裸金屬+安全容器研發(fā)與運(yùn)維效率Serverless應(yīng)用ServerlessServerless應(yīng)用Serverless容器?可免資源購買、維護(hù)?可具備自動(dòng)彈性??可免資源購買、維護(hù)?可具備自動(dòng)彈性?微服務(wù)免改造?單體需存算分離?提升系統(tǒng)彈性能力?提升系統(tǒng)容災(zāi)能力?全套微服務(wù)治理、應(yīng)用可觀測?平滑遷移,多種灰度策略?可提升資源利用率+彈性效率,簡化維護(hù)+秒級彈性?平滑遷移,簡化運(yùn)維?運(yùn)維更簡單,更易用?平滑遷移,支持不停服?遷移工具輔助遷移SAE適用的軟件架構(gòu):微服務(wù),單體,Job(任務(wù))從傳統(tǒng)架構(gòu)到從傳統(tǒng)架構(gòu)到SAE的平滑路徑資源使用方式代碼部署方式微服務(wù)/單體應(yīng)用代碼平滑遷移資源使用方式代碼部署方式云主機(jī)自建資源準(zhǔn)備階段集群初始化集群初始化研發(fā)&部署階段運(yùn)維階段運(yùn)維監(jiān)控日志組件運(yùn)維監(jiān)控日志組件使用SAE免購買免創(chuàng)建集群代碼平滑遷移Jar/ZIP/鏡像免運(yùn)維應(yīng)用種類單體/WEB應(yīng)用單體/WEB應(yīng)用微服務(wù)應(yīng)用微服務(wù)應(yīng)用代碼包/鏡像鏡像倉庫部署全生命周全生命周期配置管理負(fù)載均衡優(yōu)雅下線一鍵啟停優(yōu)雅上線灰度發(fā)布彈性伸縮應(yīng)用監(jiān)控注冊發(fā)現(xiàn)APP/H5Web應(yīng)用防火墻VPC網(wǎng)絡(luò)APP/H5Web應(yīng)用防火墻ServerlessServerless應(yīng)用引擎SAEVPC網(wǎng)絡(luò)a.擴(kuò)縮容簡單,秒級彈性a.僅在有請求時(shí)分配CPU場景二:單體應(yīng)用遷移到SAEAPP/H5 部署方式一已經(jīng)存算分離Serverless 部署方式一已經(jīng)存算分離Serverless應(yīng)用引擎SAEVPC網(wǎng)絡(luò)VPC網(wǎng)絡(luò)VPCAPP/H5VPC業(yè)務(wù)邏輯本地磁盤1.Nginx可以直接省掉,如果配置過于復(fù)雜,可把Nginx也部署到SAE上部署方式二大單體2.NAT網(wǎng)關(guān)+EIP模式可以直接用SAE的默認(rèn)出公網(wǎng)能力,如果需要固定公網(wǎng)出口IP,可以保留NAT網(wǎng)關(guān)+部署方式二大單體3.大單體需要拆分成存算分離架構(gòu),SAE代替其中業(yè)務(wù)邏輯部分:易擴(kuò)展、穩(wěn)定性好微服務(wù)架構(gòu)“0”改造上云/升級到SAE只用把代碼從IDC/ECS虛擬機(jī)以代碼包或者鏡像的方式部署到SAE,中間件、數(shù)據(jù)庫等可復(fù)用,支持存量業(yè)務(wù)混部、互訪APP/H5APPAPP/H5DDOSWeb應(yīng)用防火墻DDOSDDOSWeb應(yīng)用防火墻云原生API網(wǎng)關(guān)注冊注冊注冊中心:Serverless應(yīng)用引擎SAE使用SAE內(nèi)置、VPC網(wǎng)絡(luò)VPC網(wǎng)絡(luò)VPC網(wǎng)絡(luò)從自建逐步切換到SAE部署模式:以應(yīng)用粒度遷移更新A應(yīng)用的ECS更新A應(yīng)用的ECS實(shí)例更新代碼開發(fā)應(yīng)用代碼捕獲變更統(tǒng)一發(fā)布系統(tǒng)更新代碼開發(fā)應(yīng)用代碼捕獲變更統(tǒng)一發(fā)布系統(tǒng)更新B應(yīng)用的SAE實(shí)例更新B應(yīng)用的SAE實(shí)例云原生API網(wǎng)關(guān)VPCAPP1SAE實(shí)例SAE實(shí)例SAE實(shí)例SAE實(shí)例自建注冊中心/商業(yè)版MSE注冊中心南北流量SLB為公網(wǎng)流量入口如果SAE實(shí)例需要主動(dòng)出公網(wǎng),需要可以在VPC層面配置NAT網(wǎng)關(guān)SAE實(shí)例SAE實(shí)例SAESAE實(shí)例微服務(wù)流量SAE實(shí)例SAE實(shí)例SAESAE實(shí)例根據(jù)不同的Path路由到不同的應(yīng)用//path-a/path-b/path-aVPC1APPASAESAE實(shí)例SAE實(shí)例SAE實(shí)例APPBAPPCSAESAE實(shí)例也可以使用自建注冊中心,以及眾多微服務(wù)治理功能自建Nginx,且維持原有Nginx不變,只遷移業(yè)務(wù)邏輯SAE實(shí)例SAESAE實(shí)例SAE實(shí)例1.(不推薦)將內(nèi)網(wǎng)SLB加到Nginx的UpStr例數(shù)調(diào)整權(quán)重。SAE擴(kuò)縮容的時(shí)候需要調(diào)整權(quán)重,可作為過渡方案,不2.(推薦)通過Nginx配置Path路由,轉(zhuǎn)發(fā)流量到SLB。3.全部遷移到SAE后,可選擇繼續(xù)保有Nginx,或者替換成SLB,或者把 VPC1ECS實(shí)例SAE實(shí)例ECS實(shí)例SAE實(shí)例SAE實(shí)例SAE實(shí)例1.SAE應(yīng)用正常設(shè)置公網(wǎng),并將網(wǎng)關(guān)2.應(yīng)用基本遷移到SAE后,從DNS去掉SLB1,待完全沒流量后,將SLB1回收。3.假設(shè)有一側(cè)訪問失敗,可能無法做到流量及時(shí)摘除;嚴(yán)格測試,風(fēng)險(xiǎn)可控。/document_detail/300086.html微服務(wù)架構(gòu)轉(zhuǎn)型?對企業(yè)級項(xiàng)目,還是建議使用獨(dú)享的企業(yè)級注冊中心MSE?其他SpringCloud組件兼容?需要保證SAE所使用的VPC和注冊中心在同一VPC內(nèi)也可以考慮使用自建的注冊中心或者把注冊中心遷移到SpringCloudAlibabaNacosDiscoverySpringCloudSpringBootSpringCloudAlibabaHoxton.SR82.2.3.RELEASE2.3.2.RELEASEGreenwich.SR62.1.3.RELEASE2.1.13.RELEASEHoxton.SR82.2.2.RELEASE2.3.2.RELEASEHoxton.SR32.2.1.RELEASE2.2.5.RELEASEHoxton.RELEASE2.2.0.RELEASE2.2.X.RELEASEGreenwich2.1.2.RELEASE2.1.X.RELEASE2.0.3.RELEASE2.0.X.RELEASE1.5.1.RELEASE1.5.X.RELEASE詳細(xì)文檔說明:/document_detail/123010.html#section-szi-5ba-gtv微服務(wù)-東西流量-服務(wù)遷移混合切流方案:保留自建注冊中心ConsumerConsumerConsumerConsumerConsumerConsumer?復(fù)用原有注冊中心,經(jīng)過測試環(huán)境測試后,逐步在生產(chǎn)環(huán)境調(diào)?遷移完成后,可以考慮遷移注冊中心。隔離切流方案:注冊中心一起遷移ConsumerConsumer云原生API網(wǎng)關(guān)ConsumerConsumerConsumerConsumerConsumerConsumer?SAE獨(dú)立鏈路,經(jīng)過充分測試后,再通過入口切流(按比例切流或按?缺點(diǎn):需要構(gòu)建一條完整的請求鏈路,可能會(huì)涉及較多應(yīng)用,實(shí)施相全套微服務(wù)治理-無損下線通過無損下線,有效避免服務(wù)端升級時(shí)客戶端調(diào)用報(bào)錯(cuò),實(shí)現(xiàn)在白天大流量發(fā)布也能絲般潤滑客戶端感知到服務(wù)客戶端感知到服務(wù)服務(wù)調(diào)用報(bào)錯(cuò)期客戶端視角注冊中心3通知消費(fèi)者2服務(wù)下線3通知消費(fèi)者提供者AAgent消費(fèi)者提供者A主動(dòng)通知客戶端主動(dòng)刷新4調(diào)用其他提供者提供者BAgent消費(fèi)者4調(diào)用其他提供者提供者BSAE方案VS開源自研的優(yōu)勢:1.延時(shí)更短2.穩(wěn)定性兜底3.無需投入研發(fā)通過無損上線,避免應(yīng)用尚未啟動(dòng)完成就承接正常流量導(dǎo)致實(shí)例被打掛,通過延遲注冊和小流量預(yù)熱實(shí)現(xiàn)擴(kuò)容時(shí)流通過無損上線,避免應(yīng)用尚未啟動(dòng)完成就承接正常流量導(dǎo)致實(shí)例被打掛,通過延遲注冊和小流量預(yù)熱實(shí)現(xiàn)擴(kuò)容時(shí)流數(shù)據(jù)庫:druid連接池異步創(chuàng)建連接應(yīng)用初始化預(yù)建連接服務(wù)注冊通過readiness檢查小?流量需要緩慢增加,但Dubbo以下版本存在服務(wù)預(yù)熱不生效問題SAE方案VS開源自研的優(yōu)勢:1.無需投入研發(fā)2.穩(wěn)定性有保障2.白屏化使用,體驗(yàn)更簡單3.完整的可觀測能力通過全鏈路灰度發(fā)布,白屏化配置規(guī)則,實(shí)現(xiàn)精準(zhǔn)灰度能力,比傳統(tǒng)多環(huán)境部署的方案大幅降低了運(yùn)維和機(jī)器成本。全套微服務(wù)治理-端到端的全鏈路灰度發(fā)布通過全鏈路灰度發(fā)布,白屏化配置規(guī)則,實(shí)現(xiàn)精準(zhǔn)灰度能力,比傳統(tǒng)多環(huán)境部署的方案大幅降低了運(yùn)維和機(jī)器成本。適用場景n調(diào)用鏈中因個(gè)別/部分應(yīng)用新上線,需要精準(zhǔn)用戶灰度驗(yàn)證價(jià)值n控制最小爆炸半徑n無需重新搭建一整套新環(huán)境,降低部署運(yùn)維和硬件成本n能覆蓋七層流量到四層微服務(wù)接口、方法的灰度ECS本地磁盤文件遷移拷貝遷移Serverless應(yīng)用引擎SAEECS已經(jīng)掛載NAS,無需遷移Serverless應(yīng)用引擎SAE使用OSS存儲(chǔ)文件●Serverless應(yīng)用引擎SAE?OSS適合讀多寫少的場景,特別不能用于寫日志的場景;?使用NAS存儲(chǔ)日志,會(huì)遇到多進(jìn)程/多客戶端并發(fā)寫同一個(gè)文件可能會(huì)出現(xiàn)覆蓋、交叉、串行等現(xiàn)象,解決方案參考文檔,建議日志直接最佳實(shí)踐:設(shè)置日志收集至SLS?SAE無縫集成了SLS,在SAE中部署的應(yīng)用建議將日志輸出到文件,并配置SLS日志采集,并在SLS側(cè)做進(jìn)一步的分析、可視化、告警等。?同時(shí)也可以配置將SAE運(yùn)行的代碼,打印的stdout標(biāo)準(zhǔn)日志重定向輸出到SLS。?SAE默認(rèn)將標(biāo)準(zhǔn)輸出的內(nèi)容收集并展示在SAE的實(shí)時(shí)日志中,支持查看最近500行日志信息,方便快速定位問題。APPSAESAE實(shí)例最佳實(shí)踐:設(shè)置日志收集至Kafka(ELK、日志分析等場景)?SAE無縫集成了Kafka,在SAE中支持將應(yīng)用實(shí)例的標(biāo)準(zhǔn)輸出(stdout),以及將應(yīng)用實(shí)例指定路徑的日志采集到消息隊(duì)列Kafka版中。?適用于需要將Kafka的數(shù)據(jù)投遞到例如Elasticsearch等其他持久化庫中,便于集不推薦:將日志寫入到NAS盤?文件存儲(chǔ)NAS為多客戶端提供了統(tǒng)一名字空間的文件共享讀寫能力,但在多進(jìn)程/多客戶端并發(fā)寫同一個(gè)文件的場景中會(huì)出現(xiàn)文件覆蓋、?(推薦)不同進(jìn)程/客戶端寫入同一文件系統(tǒng)的不同文件中,后續(xù)分析處理時(shí)再進(jìn)行歸并,這個(gè)方案能夠很好地解決并發(fā)寫入導(dǎo)致的問題,同時(shí)無需使用文件鎖,不會(huì)對性能造成影響。?對于并發(fā)追加寫同一個(gè)文件(如日志)的場景,可以使用文件鎖+seek機(jī)制來保證寫入的原子性和一致性。但是文件鎖+seek是一個(gè)比較耗時(shí)的操作,可能會(huì)對性能產(chǎn)生顯著的影響。應(yīng)用監(jiān)控基礎(chǔ)監(jiān)控:云監(jiān)控?應(yīng)用遷移到SAE后,基于云監(jiān)控可以查看實(shí)例的運(yùn)行信息,SAE會(huì)對應(yīng)用所運(yùn)行設(shè)備的CPU、負(fù)載、內(nèi)存、網(wǎng)絡(luò)和磁盤進(jìn)行數(shù)據(jù)采集與分析。?在云監(jiān)控試圖下,可以統(tǒng)一查看所有云服務(wù)的監(jiān)控大盤。?注意事項(xiàng):由于從數(shù)據(jù)采集到分析存在一定延時(shí),時(shí)延約2分鐘。如果托管在SAE上的應(yīng)用在升級或擴(kuò)縮容導(dǎo)致Pod發(fā)生變更,那么將會(huì)導(dǎo)致監(jiān)控?cái)?shù)據(jù)?支持調(diào)用云監(jiān)控的API接口來拉取基礎(chǔ)監(jiān)控?cái)?shù)據(jù),上報(bào)到自建監(jiān)控系統(tǒng)。應(yīng)用監(jiān)控:SAE集成了ARMS無侵入提供應(yīng)用級監(jiān)控?SAE目前提供的應(yīng)用監(jiān)控主要是JAVA語言和);GC次數(shù)、慢SQL次數(shù),以及這些指標(biāo)和上周、上一天的同比升降幅度等。應(yīng)用監(jiān)控:支持對接Prometheus,構(gòu)建統(tǒng)一監(jiān)控?在云上開通PrometheusforVPC版本,或者自建Prometheus。?采用服務(wù)框架自帶的上報(bào)組件進(jìn)行應(yīng)用監(jiān)控?cái)?shù)據(jù)的投遞。?注意:產(chǎn)品化的Prometheus投遞能力還在對接開發(fā)中。企業(yè)落地SAE的案例傳統(tǒng)能源行業(yè)Serverless新突破-中國石化多個(gè)系統(tǒng)完成Serverless轉(zhuǎn)型中石化?;肺锪飨到y(tǒng)-運(yùn)單管理模塊,企業(yè)地圖模塊,任務(wù)系統(tǒng)中石化CRM系統(tǒng)中石化電子錢包系統(tǒng)私有云多個(gè)系統(tǒng)完成Serverless轉(zhuǎn)型中石化危化品物流系統(tǒng)-運(yùn)單管理模塊,企業(yè)地圖模塊,任務(wù)系統(tǒng)中石化CRM系統(tǒng)中石化電子錢包系統(tǒng)私有云訂單中心客戶中心數(shù)據(jù)庫RDSADB監(jiān)聽私有云EDAS雙協(xié)議中HTTPS服務(wù)注冊到MSE共有云服務(wù)調(diào)用私有云服務(wù)公共云外網(wǎng)訪問內(nèi)網(wǎng)訪問WAFJavaSpringCloud技術(shù)棧橫向自動(dòng)擴(kuò)縮統(tǒng)一標(biāo)準(zhǔn)服務(wù)注冊服務(wù)發(fā)現(xiàn)統(tǒng)一CRM客戶準(zhǔn)入應(yīng)用運(yùn)營管理應(yīng)用數(shù)據(jù)庫RDSADB構(gòu)建企業(yè)級Serverless轉(zhuǎn)型標(biāo)準(zhǔn)-中國寶馬請求密集型服務(wù)微服務(wù)架構(gòu)業(yè)務(wù)周期性任務(wù)服務(wù)于BBA內(nèi)部的系統(tǒng)運(yùn)維、DevOps平臺后端服務(wù)以Serverless請求密集型服務(wù)微服務(wù)架構(gòu)業(yè)務(wù)周期性任務(wù)服務(wù)于BBA內(nèi)部的系統(tǒng)運(yùn)維、DevOps平臺后端服務(wù)成本分析成本分析處理流程Dataworks與FC深度集成云監(jiān)控云監(jiān)控 數(shù)據(jù)采集函數(shù)數(shù)據(jù)分析函數(shù) 數(shù)據(jù)分發(fā)函數(shù)-數(shù)據(jù)聚合函數(shù)Serverless應(yīng)用引擎SAEServerless應(yīng)用引擎SAESLB/ALBAPIGW…選擇資源SLB/ALBAPIGW…選擇資源流程化編排流程化編排通過SAE通過SAEOpenAPI集成構(gòu)建應(yīng)用核心能力基于CloudFlow編排函數(shù)計(jì)算FC構(gòu)建自動(dòng)化流程產(chǎn)品產(chǎn)品OpenAPI函數(shù)環(huán)境初始化函數(shù)一Terraform函數(shù)一通過通過FCOpenAPI集成構(gòu)建函數(shù)核心能力可視化構(gòu)建可視化構(gòu)建ServerlessServerlessManagedforserverlessarchitecture44WheelsforK8sarchitectureServerlessServerlessLandingZone解決出行頭部企業(yè)-全棧云原生上云持續(xù)以技術(shù)和創(chuàng)新作為業(yè)務(wù)推動(dòng)模式,并結(jié)合有效的價(jià)值鏈擴(kuò)張戰(zhàn)略,為客戶提供與時(shí)俱進(jìn)的汽車出行解決方案,不斷提升用戶體驗(yàn),在汽車出行服務(wù)行業(yè)的革命性變化中把握未來增長機(jī)會(huì)Nacos微服務(wù)治理zkMQAPINacos微服務(wù)治理zkMQAPI管理服務(wù)發(fā)現(xiàn)WAF防護(hù)流量防護(hù)云原生API網(wǎng)關(guān)客戶痛點(diǎn)iOS/Android車機(jī)端后臺其他生態(tài)終端其他生態(tài)終端API網(wǎng)關(guān)端&生態(tài)API網(wǎng)關(guān)端&生態(tài)構(gòu)建全鏈路可觀測體系實(shí)現(xiàn)了現(xiàn)有系統(tǒng)的云原生化改造。構(gòu)建全鏈路可觀測體系在上云的過程中逐漸實(shí)現(xiàn)了系統(tǒng)云原生化,利用云產(chǎn)品幫助提升了系統(tǒng)的穩(wěn)定性,利用開源技術(shù)替換自研技術(shù)提升了系統(tǒng)的可維護(hù)性,客戶上線后將持續(xù)構(gòu)建可灰度、可觀測、可回滾的云原生的運(yùn)維能力。新系統(tǒng)上線后已經(jīng)順利支持了清明、五一、端午等多個(gè)業(yè)務(wù)峰值,順利穩(wěn)定的支撐了業(yè)務(wù),而且設(shè)計(jì)了完整的應(yīng)對節(jié)假日業(yè)務(wù)峰值的容量設(shè)計(jì)和重保方案?提升系統(tǒng)穩(wěn)定性:在上云的過程中逐漸實(shí)現(xiàn)了系統(tǒng)云原生化,利用云產(chǎn)品幫助提升了系統(tǒng)的穩(wěn)定性,利用開源技術(shù)替換自研技術(shù)提升了系統(tǒng)的可維護(hù)性,客戶上線后將持續(xù)構(gòu)建可灰度、可觀測、可回滾的云原生的運(yùn)維能力。新系統(tǒng)上線后已經(jīng)順利支持了清明、五一、端午等多個(gè)業(yè)務(wù)峰值,順利穩(wěn)定的支撐了業(yè)務(wù),而且設(shè)計(jì)了完整的應(yīng)對節(jié)假日業(yè)務(wù)峰值的容量設(shè)計(jì)和重保方案?基于指標(biāo)進(jìn)行彈性,提升資源利用率:應(yīng)用采用SAE來做核合節(jié)假日的定制彈性方案可以在平時(shí)和節(jié)假日都可以維持一個(gè)比較好的水位,同時(shí)保持較高的API網(wǎng)關(guān)替換了自研網(wǎng)關(guān)在性能和可維護(hù)性上都得到了極大的提升l應(yīng)用實(shí)時(shí)監(jiān)控服務(wù)ARMSlSAEserverless應(yīng)用引擎SLSSLS茶飲頭部企業(yè)-全棧云原生助力業(yè)務(wù)高速發(fā)展門店10003000家,運(yùn)維團(tuán)隊(duì)持續(xù)一個(gè)人,三年增長6倍,周年活動(dòng)7天籌備,0故障支持120萬QPS,業(yè)務(wù)遍布馬來、泰國、新加坡、美國、日本、韓國等門店消費(fèi)者企業(yè)客戶痛點(diǎn)門店消費(fèi)者企業(yè)InternetCDNDDOSWeb應(yīng)用防火墻?業(yè)務(wù)快速發(fā)展要求:業(yè)務(wù)增長數(shù)倍,線上線下快速發(fā)展、全渠道融合,IDCInternetCDNDDOSWeb應(yīng)用防火墻?大促活動(dòng)頻繁業(yè)務(wù)峰值變化大:大促、秒殺、521、周年慶、代言人、健康大使等各種活動(dòng)頻繁、活動(dòng)常態(tài)化,在IDC云原生網(wǎng)關(guān)?云原生網(wǎng)關(guān)CI/CI/CD存儲(chǔ)云效可用區(qū)A可用區(qū)B存儲(chǔ)云效業(yè)務(wù)應(yīng)用業(yè)務(wù)應(yīng)用業(yè)務(wù)應(yīng)用業(yè)務(wù)應(yīng)用業(yè)務(wù)應(yīng)用業(yè)務(wù)應(yīng)用業(yè)務(wù)應(yīng)用業(yè)務(wù)應(yīng)用業(yè)務(wù)應(yīng)用業(yè)務(wù)應(yīng)用業(yè)務(wù)應(yīng)用注冊發(fā)現(xiàn)應(yīng)用監(jiān)控壓測ARMS應(yīng)用監(jiān)控PTS壓測經(jīng)歷過IDC、SaaS托管,在上云過程中,全棧采用云原生的方案,包括應(yīng)用構(gòu)建基于SAE應(yīng)用引擎、應(yīng)用監(jiān)控壓測ARMS應(yīng)用監(jiān)控PTS壓測業(yè)務(wù)日志注冊配置中心微服務(wù)治理PolarDBRedisMQ?基于SAE構(gòu)建全部應(yīng)用,免運(yùn)維、高彈性、全托管:無論是toB還是toC業(yè)務(wù),都基于業(yè)務(wù)日志注冊配置中心微服務(wù)治理PolarDBRedisMQ?提升系統(tǒng)穩(wěn)定性:云原生網(wǎng)關(guān)、MSE微服務(wù)注冊中心、所有應(yīng)用接入服務(wù)治理,提供無損上下線能力,前端灰度,全鏈路灰度等,構(gòu)建業(yè)務(wù)高可用。網(wǎng)關(guān)支持業(yè)務(wù)活動(dòng)的限流,構(gòu)建了支撐百萬QPS流量洪峰的網(wǎng)關(guān)及后端系統(tǒng)處理能力。?電商業(yè)務(wù)異步解偶:大促活動(dòng)基于rocketMQ構(gòu)建了海量優(yōu)惠券發(fā)券,訂單、配送、客戶服務(wù)等異步系統(tǒng)解耦,提供可以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論