版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
AI+微服務(wù)體系下的可觀測性實(shí)踐2025.6.27-282025.6.27-28 匯報(bào)人錢世俊目目錄傳統(tǒng)微服務(wù)觀測實(shí)踐字節(jié)跳動(dòng)-微服務(wù)框架cloudweGO是一套由字節(jié)跳動(dòng)基礎(chǔ)架構(gòu)服務(wù)框架團(tuán)隊(duì)開源的、可快速構(gòu)建企業(yè)級云原生微服務(wù)架構(gòu)的中間件集合。共同的特點(diǎn)是高性能、高擴(kuò)展性、高可靠,專注于微服務(wù)通信與治理。涵蓋GO與Rust開發(fā)語言,上至框架下至網(wǎng)絡(luò)庫、編解碼庫、序列化庫均是自研,各個(gè)項(xiàng)目既可獨(dú)立使用也可搭配使用,并圍繞這些項(xiàng)目,構(gòu)建了完整的上下游生態(tài)。字節(jié)跳動(dòng)-微服務(wù)框架kitex是一個(gè)Golang微服務(wù)RPC框架,具有高性能、強(qiáng)可擴(kuò)展的特點(diǎn)。如果對微服務(wù)性能有要求,又希望定制擴(kuò)展融入自己的治理體系,kitex會(huì)是一個(gè)不錯(cuò)的選擇。Hertz是一個(gè)Golang微服務(wù)HTTP框架,具有高易用性、高性能、高擴(kuò)展性等特點(diǎn)。如果對微服務(wù)性能有要求,又希望框架能夠充分滿足內(nèi)部的可定制化需求,Hertz會(huì)是一個(gè)不錯(cuò)的選擇。volo是字節(jié)跳動(dòng)服務(wù)框架團(tuán)隊(duì)研發(fā)的輕量級、高性能、可擴(kuò)展性強(qiáng)、易用性好的RustRPC框架,使傳統(tǒng)微服務(wù)框架的觀測體系monitor-prometheus項(xiàng)目(observability)obs-opentelemetry項(xiàng)目Metrics請求量/處理耗時(shí)運(yùn)行時(shí)監(jiān)控傳統(tǒng)微服務(wù)框架的觀測埋點(diǎn)·LevelDisabled禁用埋點(diǎn)LevelBase僅啟用基本埋點(diǎn)·LevelDetailed啟用基本埋點(diǎn)和細(xì)粒度埋點(diǎn)客戶端埋點(diǎn)服務(wù)端埋點(diǎn)RPC調(diào)用開始連接建立開始連接建立結(jié)束請求發(fā)送(含編碼)開始請求發(fā)送(含編碼)結(jié)束響應(yīng)接收(含解碼)開始響應(yīng)二進(jìn)制讀取開始(僅適用于FastCodec)響應(yīng)二進(jìn)制讀取完畢(僅適用于FastCodec)響應(yīng)接收(含解碼)完畢RPC調(diào)用結(jié)束RPC調(diào)用開始請求接收(含解碼)開始請求二進(jìn)制讀取完畢(僅適用于FastCodec)請求接收(含解碼)完畢handler處理開始handler處理完畢響應(yīng)發(fā)送(含編碼)開始響應(yīng)發(fā)送(含編碼)結(jié)束RPC調(diào)用結(jié)束客戶端埋點(diǎn)微服務(wù)應(yīng)用傳統(tǒng)微服務(wù)框架的觀測體系微服務(wù)應(yīng)用OTELCollector應(yīng)用觀測平臺Trace/Metrics/LogScrapeMetricsRemoteWrite采集器PrometheusRemoteWrite傳統(tǒng)微服務(wù)框架的觀測體系采集器采集器Metrics傳統(tǒng)微服務(wù)框架的觀測體系 AI+微服務(wù)的特點(diǎn)MultiAgent應(yīng)用層多語言,多技術(shù)棧大語言模型服務(wù)依賴層服務(wù)依賴層ToolsGPU集群基礎(chǔ)設(shè)施層·高帶寬低延遲網(wǎng)絡(luò)(如InfiniBand、NVLink)·高速存儲(如HBM)基礎(chǔ)設(shè)施層AI+微服務(wù)時(shí)代下新的觀測挑戰(zhàn) 更完整的端到端全鏈路 模型訓(xùn)練&推理監(jiān)控 智能體用量&會(huì)話分析AI+微服務(wù)體系的全棧觀測能力觀測能力增強(qiáng)AI端到端全鏈路觀測模型訓(xùn)練觀測模型推理觀測AI應(yīng)用/智能體觀測會(huì)話分析模型維度分析多維度分析能力Token用量分析會(huì)話分析模型維度分析多維度分析能力推理引擎訓(xùn)練框架推理引擎訓(xùn)練框架AI網(wǎng)關(guān)觀測埋點(diǎn)豐富端到端全鏈路觀測埋點(diǎn)覆蓋完整的AI全鏈路端到端全鏈路觀測APMAPM客戶端監(jiān)控端側(cè) 應(yīng)用告警告警統(tǒng)一關(guān)聯(lián)告警統(tǒng)一關(guān)聯(lián)統(tǒng)一可觀測大盤統(tǒng)一可觀測大盤用APM服務(wù)端監(jiān)控應(yīng)用層 應(yīng)用告警時(shí)序數(shù)據(jù)統(tǒng)一存儲Metrics時(shí)序數(shù)據(jù)引擎Metrics時(shí)序數(shù)據(jù)引擎Trace數(shù)據(jù)統(tǒng)一存儲Log數(shù)據(jù)統(tǒng)一存儲TraceTrace分析引擎應(yīng)用指標(biāo)Infra指標(biāo)云組件指標(biāo)Trace應(yīng)用指標(biāo)Infra指標(biāo)云組件指標(biāo)TraceIDTraceTrace 全量LOG 模型訓(xùn)練/推理平臺PaaSPaaS告警基礎(chǔ)設(shè)施觀測IaaS告警統(tǒng)一觀測與下鉆分析gsG超參數(shù)記錄自研推理引擎xLLM模型訓(xùn)練/推理觀測gsG超參數(shù)記錄自研推理引擎xLLM訓(xùn)練實(shí)驗(yàn)觀測橫向?qū)Ρ日埱笏俾式涌谘訒r(shí)錯(cuò)誤率錯(cuò)誤率Token消耗速率首Token延時(shí)非首Token延時(shí)首Token延時(shí)非首Token延時(shí)訓(xùn)練集群狀態(tài)運(yùn)行時(shí)指標(biāo)運(yùn)行時(shí)指標(biāo)容容器觀測基基礎(chǔ)資源觀測運(yùn)行時(shí)指標(biāo)運(yùn)行時(shí)指標(biāo)模型訓(xùn)練/推理觀測推理指標(biāo)訓(xùn)練實(shí)驗(yàn)觀測訓(xùn)訓(xùn)練實(shí)驗(yàn)觀測AccuracyAccuracy超參數(shù)記錄超參數(shù)記錄橫向?qū)Ρ葯M向?qū)Ρ戎笜?biāo)橫向?qū)Ρ榷嗝襟w支持AI應(yīng)用/智能體觀測智能體的時(shí)代正在到來,隨著各類框架與相關(guān)協(xié)議的涌現(xiàn)對觀測也帶來了更多的挑戰(zhàn)AI應(yīng)用/智能體框架Eino是覆蓋devops全流程的大模型具鏈。AI應(yīng)用/智能體框架-觀測埋點(diǎn)支持"橫切面功能注入"和"中間狀態(tài)透出".用戶提供、注冊"function"(callbackHandler)AI應(yīng)用/智能體-Metrics觀測大模型指標(biāo)黃金指標(biāo)運(yùn)行時(shí)監(jiān)控指標(biāo)AI應(yīng)用/智能體-Tracing觀測Trace列表Trace詳情(火焰圖)Trace詳情(列表視圖)Trace詳情(拓?fù)湟晥D)AI應(yīng)用/智能體-LLM性能&Token用量分析Token用量分析LLM性能分析多智能體-模型視角觀測多輪會(huì)話分析每次對話對應(yīng)著一條調(diào)用鏈ClientClient1000msAgentAgent900msLLMLLM300msMCPMCP300msLLMLLM300ms多輪會(huì)話分析根據(jù)會(huì)話I根據(jù)會(huì)話I戶I等信息篩選會(huì)話會(huì)話ID與用戶ID配置會(huì)話整體token消耗,調(diào)用鏈總數(shù)以及每個(gè)調(diào)用鏈的起始時(shí)間、耗時(shí)、Input、Output、調(diào)用鏈ID、Token消耗用D如何更進(jìn)一步利用觀測數(shù)據(jù)AI場景下數(shù)據(jù)的重要性毋庸置疑而觀
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026山東事業(yè)單位統(tǒng)考濱州市惠民縣招聘43人備考考試試題及答案解析
- 2026江蘇大學(xué)附屬醫(yī)院招聘編外人員56人(一)筆試模擬試題及答案解析
- 2026渭南合陽縣農(nóng)村合作經(jīng)濟(jì)工作站招聘(2人)備考考試試題及答案解析
- 月老牽線活動(dòng)策劃方案(3篇)
- 挖溝拆除施工方案(3篇)
- 親子義賣活動(dòng)方案策劃(3篇)
- 肯德基衛(wèi)生管理制度表模板(3篇)
- 2026匯才(福建泉州市)企業(yè)管理有限公司派駐晉江市永和鎮(zhèn)招聘5人備考考試試題及答案解析
- 2026山東事業(yè)單位統(tǒng)考威海火炬高技術(shù)產(chǎn)業(yè)開發(fā)區(qū)鎮(zhèn)(街道)招聘初級綜合類崗位9人筆試模擬試題及答案解析
- 2026年河北張家口赤城縣農(nóng)業(yè)農(nóng)村局公開招聘特聘農(nóng)技員4名考試備考題庫及答案解析
- 頸椎病頸椎病的常見癥狀及治療方法
- 單證專員述職報(bào)告
- 眼底病OCT解讀演示教學(xué)課件
- 民間個(gè)人借款擔(dān)保書
- LY/T 1598-2011石膏刨花板
- GB/T 31588.1-2015色漆和清漆耐循環(huán)腐蝕環(huán)境的測定第1部分:濕(鹽霧)/干燥/濕氣
- GB/T 21268-2014非公路用旅游觀光車通用技術(shù)條件
- GA/T 1495-2018道路交通安全設(shè)施基礎(chǔ)信息采集規(guī)范
- 夜間綜合施工專項(xiàng)專題方案公路
- ★神東煤炭集團(tuán)xx煤礦礦井災(zāi)害預(yù)防與處理計(jì)劃
- Q∕GDW 11421-2020 電能表外置斷路器技術(shù)規(guī)范
評論
0/150
提交評論