版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
ICS33.030
CCSM21
15
內(nèi)蒙古自治區(qū)地方標(biāo)準(zhǔn)
DB15/T4065—2025
IT運(yùn)維大模型能力要求
Abilityrequirementsforinformationtechnologyoperationand
maintenanceoflargelanguagemodel
2025-06-26發(fā)布2025-07-26實(shí)施
內(nèi)蒙古自治區(qū)市場監(jiān)督管理局發(fā)布
DB15/T4065—2025
目次
前言.................................................................................II
1范圍...............................................................................1
2規(guī)范性引用文件.....................................................................1
3術(shù)語和定義.........................................................................1
4總體框架...........................................................................2
5IT運(yùn)維大模型構(gòu)建...................................................................3
業(yè)務(wù)需求分析與資源評(píng)估.........................................................3
IT運(yùn)維數(shù)據(jù)與大模型共建.........................................................4
IT運(yùn)維大模型微調(diào)與優(yōu)化部署.....................................................4
6IT運(yùn)維大模型能力與評(píng)估.............................................................5
數(shù)據(jù)管理能力...................................................................5
分析決策能力...................................................................6
自動(dòng)控制能力...................................................................7
7IT運(yùn)維大模型場景實(shí)現(xiàn)...............................................................8
場景分析.......................................................................8
場景構(gòu)建.......................................................................8
場景交付.......................................................................8
評(píng)估方法.......................................................................9
附錄A(資料性)常見IT運(yùn)維大模型場景說明...........................................10
參考文獻(xiàn).............................................................................15
I
DB15/T4065—2025
前言
本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定
起草。
請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別專利的責(zé)任。
本文件由內(nèi)蒙古自治區(qū)工業(yè)和信息化廳歸口。
本文件起草單位:內(nèi)蒙古科電數(shù)據(jù)服務(wù)有限公司、中通服咨詢設(shè)計(jì)研究院有限公司、中通服智慧城
市公司工程建設(shè)有限責(zé)任公司、內(nèi)蒙古自治區(qū)大數(shù)據(jù)中心、內(nèi)蒙古電力集團(tuán)蒙電信息通信產(chǎn)業(yè)有限責(zé)任
公司、巨鵬信息科技有限公司、內(nèi)蒙古天地方正信息有限責(zé)任公司、內(nèi)蒙古華強(qiáng)數(shù)智科技股份有限公司、
內(nèi)蒙古生態(tài)環(huán)境大數(shù)據(jù)有限公司、內(nèi)蒙古智慧青城科技有限公司、內(nèi)蒙古方銳科技信息服務(wù)有限公司、
內(nèi)蒙古匯鑫軟件股份有限公司、內(nèi)蒙古慧瑞系統(tǒng)集成有限公司、內(nèi)蒙古大學(xué)、內(nèi)蒙古財(cái)經(jīng)大學(xué)。
本文件主要起草人:崔連偉、巴圖烏力吉、李鑫、陳滿意、米世成、劉云升、謝炯、全鑫、賈瑞紅、
蔡斐、朱國新、于森、屈強(qiáng)、宋喜斌、嚴(yán)則虎、聶文亮、高軍、劉陽、趙燕、王鵬、周平、李運(yùn)博、王
文杰、劉云浩。
II
DB15/T4065—2025
IT運(yùn)維大模型能力要求
1范圍
本文件規(guī)定了IT運(yùn)維大模型構(gòu)建、IT運(yùn)維大模型能力與評(píng)估、IT運(yùn)維大模型場景實(shí)現(xiàn)。
本文件適用于規(guī)范IT運(yùn)維大模型建設(shè)應(yīng)用活動(dòng)。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,
僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本
文件。
GB/T25069信息安全技術(shù)術(shù)語
GB/T43208.1信息技術(shù)服務(wù)智能運(yùn)維第1部分:通用要求
GB/T44109信息技術(shù)大數(shù)據(jù)數(shù)據(jù)治理實(shí)施指南
3術(shù)語和定義
GB/T25069、GB/T43208.1界定的以及下列術(shù)語和定義適用于本文件。
IT運(yùn)維大模型informationtechnologyoperationandmaintenanceoflargelanguagemodel
(LLM)
具有大規(guī)模參數(shù)和復(fù)雜計(jì)算結(jié)構(gòu)的,具備能感知、會(huì)描述、自學(xué)習(xí)、會(huì)診斷、可決策、自執(zhí)行、自
適應(yīng)等能力,能夠提供運(yùn)維服務(wù)的機(jī)器學(xué)習(xí)模型。
IT運(yùn)維大模型場景informationtechnologyoperationandmaintenanceoflargelanguage
model(LLM)scenarios
為實(shí)現(xiàn)特定的IT運(yùn)維目標(biāo),并體現(xiàn)運(yùn)維大模型特征,所需的人員、活動(dòng)與對(duì)象的組合。
模型訓(xùn)練modeltraining
通過不斷迭代優(yōu)化,找到一組最優(yōu)參數(shù),使得模型對(duì)于給定輸入的預(yù)測輸出與真實(shí)輸出之間的差異
最小化,求解最優(yōu)化問題的過程。
自學(xué)習(xí)self-learning
1
DB15/T4065—2025
一種機(jī)器學(xué)習(xí)方法,系統(tǒng)能夠通過自身的探索和經(jīng)驗(yàn)積累來改進(jìn)其性能,而無需依賴外部的監(jiān)督或
指導(dǎo)。
自適應(yīng)adaptive
在人工智能和機(jī)器學(xué)習(xí)中,自適應(yīng)是系統(tǒng)能夠根據(jù)環(huán)境的變化自動(dòng)調(diào)整其行為或參數(shù),以優(yōu)化性能
或達(dá)到特定目標(biāo)。
過擬合overfitting
模型在訓(xùn)練數(shù)據(jù)上表現(xiàn)得過于完美,以至于無法對(duì)新數(shù)據(jù)做出準(zhǔn)確預(yù)測的現(xiàn)象。
欠擬合underfitting
模型對(duì)訓(xùn)練數(shù)據(jù)的擬合程度不夠,導(dǎo)致模型的泛化能力差。
4總體框架
IT運(yùn)維大模型能力要求框架圖1如下所示。
圖1總體框架
2
DB15/T4065—2025
IT運(yùn)維大模型的建設(shè)分為IT運(yùn)維大模型構(gòu)建、IT運(yùn)維大模型能力與評(píng)估、IT運(yùn)維大模型場景實(shí)現(xiàn)三
部分。
IT運(yùn)維大模型構(gòu)建是針對(duì)IT運(yùn)維業(yè)務(wù)中構(gòu)建大模型應(yīng)用所需的基礎(chǔ)步驟,是對(duì)于構(gòu)建IT運(yùn)維大模
型的整體流程說明,分為業(yè)務(wù)需求分析與資源評(píng)估、IT運(yùn)維數(shù)據(jù)與大模型共建、IT運(yùn)維大模型微調(diào)與優(yōu)
化部署。
IT運(yùn)維大模型能力與評(píng)估是針對(duì)IT運(yùn)維大模型應(yīng)該具備的能力與評(píng)估指標(biāo)的說明,定義了對(duì)IT運(yùn)
維大模型基礎(chǔ)能力要求和評(píng)估指標(biāo)。能力指標(biāo)分為含數(shù)據(jù)建模、元數(shù)據(jù)管理、數(shù)據(jù)采集、數(shù)據(jù)加工、數(shù)
據(jù)存儲(chǔ)、質(zhì)量管理、數(shù)據(jù)服務(wù)、數(shù)據(jù)安全的數(shù)據(jù)管理能力,含數(shù)據(jù)探索、特征提煉、分析決策、可視化、
安全可信的分析決策能力,含接入管控、安全管控、過程管控、執(zhí)行管控的自動(dòng)控制能力。
IT運(yùn)維大模型場景實(shí)現(xiàn)是對(duì)IT運(yùn)維相關(guān)場景應(yīng)用的實(shí)現(xiàn)說明,分為場景分析、場景構(gòu)建、場景交付
和評(píng)估方法。
5IT運(yùn)維大模型構(gòu)建
業(yè)務(wù)需求分析與資源評(píng)估
5.1.1業(yè)務(wù)需求評(píng)估
業(yè)務(wù)需求評(píng)估要明確業(yè)務(wù)的具體需求,深入理解業(yè)務(wù)流程、業(yè)務(wù)量、業(yè)務(wù)峰值、關(guān)鍵性能指標(biāo)(KPI)、
服務(wù)級(jí)別協(xié)議(SLA),將業(yè)務(wù)需求轉(zhuǎn)換為明確、可量化的目標(biāo),以確定IT運(yùn)維大模型構(gòu)建的基本方向。
評(píng)估內(nèi)容包括但不限于:
a)業(yè)務(wù)數(shù)據(jù):需輸入到大模型的業(yè)務(wù)數(shù)據(jù)范圍、業(yè)務(wù)數(shù)據(jù)類型;
b)業(yè)務(wù)指標(biāo):細(xì)化為多個(gè)子任務(wù),明確子任務(wù)期望指標(biāo);
c)業(yè)務(wù)服務(wù)方式:私有化部署或公有化部署。
5.1.2算力層評(píng)估
算力層評(píng)估要確定IT運(yùn)維大模型在實(shí)際訓(xùn)練和部署中所需算力資源類型、大小以及相應(yīng)成本。評(píng)估
內(nèi)容包括但不限于:
a)計(jì)算能力:模型訓(xùn)練、微調(diào)、推理所需算力;
b)存儲(chǔ)方案:模型訓(xùn)練、微調(diào)、推理所需數(shù)據(jù)采用的對(duì)象存儲(chǔ)、文件存儲(chǔ)等方案;
c)網(wǎng)絡(luò)通信:根據(jù)模型參數(shù)量級(jí)和訓(xùn)練數(shù)據(jù)量,采用的網(wǎng)絡(luò)技術(shù)要求。
5.1.3算法層評(píng)估
算法層評(píng)估要根據(jù)業(yè)務(wù)需求、算力資源限制,確定適合業(yè)務(wù)場景的大模型和微調(diào)算法。選擇內(nèi)容包
括但不限于:
a)基礎(chǔ)大模型選擇:選擇基礎(chǔ)的語言大模型、視覺大模型或語音大模型,以及大模型的參數(shù)版本;
b)微調(diào)算法選擇:結(jié)合算力和時(shí)間要求,選擇微調(diào)時(shí)采用的算法。
5.1.4數(shù)據(jù)層評(píng)估
數(shù)據(jù)層評(píng)估要根據(jù)IT運(yùn)維業(yè)務(wù)實(shí)際情況、期望目標(biāo),對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行評(píng)估。評(píng)估內(nèi)容包括但不限于:
a)數(shù)據(jù)規(guī)模:評(píng)估已積累IT運(yùn)維數(shù)據(jù)的條數(shù)或存儲(chǔ)量;
b)數(shù)據(jù)質(zhì)量:評(píng)估已積累IT運(yùn)維相關(guān)數(shù)據(jù)集的完整性、一致性、準(zhǔn)確性等質(zhì)量情況;
c)數(shù)據(jù)安全和隱私:評(píng)估是否涉及個(gè)人信息、敏感信息等,必要時(shí)需做脫敏處理;
d)數(shù)據(jù)格式:評(píng)估文本數(shù)據(jù)、音頻數(shù)據(jù)或其他格式類型數(shù)據(jù)占比情況。
3
DB15/T4065—2025
5.1.5工程層評(píng)估
工程層評(píng)估要根據(jù)需求目標(biāo)和構(gòu)建成本對(duì)配套工具或第三方平臺(tái)進(jìn)行選擇。評(píng)估內(nèi)容包括但不限
于:
a)模型訓(xùn)練平臺(tái):評(píng)估是否包含所需基礎(chǔ)大模型或基礎(chǔ)行業(yè)大模型;
b)數(shù)據(jù)標(biāo)注平臺(tái):評(píng)估是否提供數(shù)據(jù)標(biāo)注作業(yè)、場景數(shù)據(jù)挖掘等數(shù)據(jù)服務(wù);
c)訓(xùn)練和部署加速庫:評(píng)估是否具有加速組件以提升模型訓(xùn)練效率;
d)數(shù)據(jù)應(yīng)用平臺(tái):評(píng)估是否支持快速接入模型、數(shù)據(jù)和智能設(shè)備,是否提供模型服務(wù)、應(yīng)用工作
流編排、云邊端調(diào)度等;
e)部署兼容性:評(píng)估部署平臺(tái)與IT運(yùn)維大模型的兼容性,以及升級(jí)方式;
f)模型加密:評(píng)估是否針對(duì)內(nèi)置模型加密。
IT運(yùn)維數(shù)據(jù)與大模型共建
5.2.1模型選擇
模型選擇是根據(jù)IT運(yùn)維大模型的應(yīng)用領(lǐng)域,確定選擇的模型類型。模型類型包括但不限于:
a)自然語言處理大模型;
b)計(jì)算機(jī)視覺大模型;
c)語音識(shí)別大模型;
d)推薦系統(tǒng)大模型;
e)強(qiáng)化學(xué)習(xí)大模型;
f)多模態(tài)大模型。
5.2.2訓(xùn)練環(huán)境搭建
訓(xùn)練環(huán)境搭建是搭建模型訓(xùn)練所需硬件環(huán)境和軟件平臺(tái)。
5.2.3數(shù)據(jù)處理
數(shù)據(jù)處理是將數(shù)據(jù)加工為模型訓(xùn)練所需數(shù)據(jù)。處理步驟包括但不限于:
a)原始數(shù)據(jù)處理:進(jìn)行數(shù)據(jù)脫敏、數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)清洗、數(shù)據(jù)增強(qiáng)等;
b)數(shù)據(jù)標(biāo)注:對(duì)文本、圖像、視頻、音頻類非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行標(biāo)注;
c)數(shù)據(jù)集劃分:將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集、測試集。
5.2.4模型訓(xùn)練
模型訓(xùn)練共建是對(duì)選定的模型進(jìn)行訓(xùn)練。
在IT運(yùn)維中,特別關(guān)注模型的檢索增強(qiáng)能力、場景實(shí)現(xiàn)能力和實(shí)時(shí)性能??赡苄枰M(jìn)行多輪訓(xùn)練和
調(diào)優(yōu),以達(dá)到最優(yōu)的模型效果。訓(xùn)練過程中還要定期評(píng)估模型的性能,以確保不出現(xiàn)過擬合或欠擬合的
情況。
IT運(yùn)維大模型微調(diào)與優(yōu)化部署
5.3.1模型微調(diào)
模型微調(diào)階段首先選擇合適的微調(diào)算法,微調(diào)算法選定后,利用前期準(zhǔn)備的IT運(yùn)維特定場景數(shù)據(jù)進(jìn)
行大模型的訓(xùn)練微調(diào)。選擇合適的微調(diào)算法時(shí),需要考慮IT運(yùn)維場景的特點(diǎn),包括實(shí)時(shí)性要求、數(shù)據(jù)規(guī)
模和模型復(fù)雜度。例如,對(duì)于實(shí)時(shí)監(jiān)控任務(wù),需要選擇計(jì)算效率更高的算法。選定算法后,利用前期準(zhǔn)
4
DB15/T4065—2025
備的特定場景數(shù)據(jù)進(jìn)行訓(xùn)練微調(diào),包括實(shí)際的運(yùn)維日志、性能指標(biāo)數(shù)據(jù)、事件記錄等。微調(diào)過程中,通
過調(diào)整學(xué)習(xí)率、批次大小、正則化參數(shù)等超參數(shù)來優(yōu)化模型性能。
5.3.2模型評(píng)估
模型評(píng)估階段是在微調(diào)生成對(duì)應(yīng)任務(wù)的大模型后,對(duì)模型進(jìn)行評(píng)估,以判斷模型是否滿足應(yīng)用要求。
在IT運(yùn)維中,模型評(píng)估不僅要考察準(zhǔn)確性、召回率等標(biāo)準(zhǔn)指標(biāo),還要特別關(guān)注模型在實(shí)際環(huán)境中的響應(yīng)
時(shí)間、資源消耗和穩(wěn)定性。根據(jù)評(píng)估結(jié)果,判斷模型是否滿足應(yīng)用要求,例如是否能夠準(zhǔn)確預(yù)測故障、
是否能夠有效降低誤報(bào)率等。
5.3.3模型重訓(xùn)優(yōu)化
模型重訓(xùn)優(yōu)化階段是根據(jù)模型評(píng)估的情況,通常需要對(duì)模型進(jìn)行多輪迭代訓(xùn)練優(yōu)化。在IT運(yùn)維中,
特別注重減少模型的無效告警,以避免告警疲勞。同時(shí),也會(huì)關(guān)注模型的泛化能力,確保其在不同環(huán)境
和條件下都能保持穩(wěn)定運(yùn)行。
5.3.4模型聯(lián)調(diào)部署
模型聯(lián)調(diào)部署階段包括推理服務(wù)部署、服務(wù)配置、應(yīng)用服務(wù)聯(lián)調(diào)。推理服務(wù)部署涉及到將訓(xùn)練好的
模型集成到現(xiàn)有的IT運(yùn)維系統(tǒng)中。服務(wù)配置包括設(shè)置合理的資源限制、接口定義和權(quán)限控制。應(yīng)用服務(wù)
聯(lián)調(diào)則確保模型輸出能夠被運(yùn)維系統(tǒng)正確理解和處理,同時(shí)保證系統(tǒng)的其他部分能夠按照預(yù)期與模型
交互。
5.3.5模型應(yīng)用運(yùn)營
模型應(yīng)用運(yùn)營階段是在生產(chǎn)環(huán)境中為已上線的模型服務(wù)提供監(jiān)控、管理、運(yùn)營維護(hù)等能力。在生產(chǎn)
環(huán)境中,上線的模型服務(wù)需要有一套完整的監(jiān)控和管理機(jī)制。監(jiān)控包括跟蹤模型的性能指標(biāo)、異常檢測
和實(shí)時(shí)反饋。管理則涉及模型的版本控制、更新策略和回滾機(jī)制。運(yùn)營維護(hù)包括定期檢查模型的健康狀
況、收集用戶反饋、處理模型漂移問題以及按需進(jìn)行模型更新。
6IT運(yùn)維大模型能力與評(píng)估
數(shù)據(jù)管理能力
IT運(yùn)維大模型在數(shù)據(jù)管理能力方面主要包括數(shù)據(jù)建模、元數(shù)據(jù)管理、數(shù)據(jù)采集、數(shù)據(jù)加工、數(shù)據(jù)存
儲(chǔ)、質(zhì)量管理、數(shù)據(jù)服務(wù)、數(shù)據(jù)安全:
a)數(shù)據(jù)建模:基于對(duì)運(yùn)維數(shù)據(jù)的深入理解和分析,抽象出數(shù)據(jù)的核心特征,并對(duì)數(shù)據(jù)的層次化架
構(gòu)、數(shù)據(jù)對(duì)象以及它們之間的關(guān)系進(jìn)行標(biāo)準(zhǔn)化定義;
b)元數(shù)據(jù)管理:通過對(duì)數(shù)據(jù)的描述性信息全面管理,構(gòu)建一個(gè)完整的數(shù)據(jù)資產(chǎn)管理目錄,詳細(xì)列
出了所有數(shù)據(jù)資產(chǎn)的信息,包括它們的特點(diǎn)、來源、使用方式等;
c)數(shù)據(jù)采集:通過各種技術(shù)手段獲取運(yùn)維原始數(shù)據(jù),如服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、安全等設(shè)備的日志、
告警、事件等數(shù)據(jù)。數(shù)據(jù)采集技術(shù)手段包括日志分析、數(shù)據(jù)庫查詢等,以確保全面、準(zhǔn)確地獲
取運(yùn)維數(shù)據(jù);
d)數(shù)據(jù)加工:對(duì)運(yùn)維原始數(shù)據(jù)進(jìn)行一系列的處理操作,如清洗、轉(zhuǎn)換、聚合和脫敏等。通過這些
處理,能提高數(shù)據(jù)的準(zhǔn)確性和可用性,使其更符合業(yè)務(wù)需求;
注:對(duì)于數(shù)據(jù)采集、數(shù)據(jù)加工、元數(shù)據(jù)管理等操作標(biāo)準(zhǔn)要求,按照GB/T44109信息技術(shù)大數(shù)據(jù)數(shù)據(jù)治理實(shí)施指南。
5
DB15/T4065—2025
e)數(shù)據(jù)存儲(chǔ):按照數(shù)據(jù)存儲(chǔ)標(biāo)準(zhǔn)在計(jì)算機(jī)的存儲(chǔ)裝置或外圍的存儲(chǔ)設(shè)備中存儲(chǔ)海量離線與實(shí)時(shí)
運(yùn)維數(shù)據(jù)的能力;
f)質(zhì)量管理:對(duì)運(yùn)維數(shù)據(jù)在計(jì)劃、獲取、存儲(chǔ)、共享、維護(hù)、應(yīng)用和消亡的各階段中可能存在的
數(shù)據(jù)質(zhì)量問題,進(jìn)行識(shí)別、度量、監(jiān)控、預(yù)警和處置,提高數(shù)據(jù)質(zhì)量的能力;
g)數(shù)據(jù)服務(wù):提供運(yùn)維數(shù)據(jù)消費(fèi)接口及自服務(wù)的能力;
h)數(shù)據(jù)安全:基于數(shù)據(jù)安全相關(guān)策略和流程,利用技術(shù)和管理手段,對(duì)運(yùn)維數(shù)據(jù)的安全風(fēng)險(xiǎn)進(jìn)行
防范和處置的能力;
i)數(shù)據(jù)管理能力需設(shè)立可評(píng)估或可量化的指標(biāo),評(píng)估指標(biāo)包括但不限于:
1)數(shù)據(jù)一致性:確保數(shù)據(jù)在各個(gè)系統(tǒng)和流程中保持一致,無矛盾或沖突的信息;
2)數(shù)據(jù)對(duì)象及其關(guān)系定義:數(shù)據(jù)的組織方式應(yīng)該清晰并且遵循一定的標(biāo)準(zhǔn),以便于理解和使
用;
3)元數(shù)據(jù)覆蓋率:衡量元數(shù)據(jù)管理完整性的指標(biāo),即已有元數(shù)據(jù)覆蓋的數(shù)據(jù)范圍比例;
4)元數(shù)據(jù)更新頻率:指元數(shù)據(jù)在需要時(shí)更新的頻次。高頻次的更新能夠更好地反映底層數(shù)據(jù)
的變化,保持元數(shù)據(jù)的時(shí)效性;
5)數(shù)據(jù)采集準(zhǔn)確率:通過對(duì)比采集到的數(shù)據(jù)與原始數(shù)據(jù)的差異來衡量的,高準(zhǔn)確率意味著數(shù)
據(jù)采集方法的正確性和可靠性;
6)數(shù)據(jù)采集系統(tǒng)穩(wěn)定性:通過系統(tǒng)運(yùn)行故障間隔時(shí)間來評(píng)估。長間隔時(shí)間表示系統(tǒng)更加穩(wěn)定,
對(duì)于持續(xù)的數(shù)據(jù)采集尤為重要;
7)數(shù)據(jù)加工正確率:通過對(duì)比加工后數(shù)據(jù)與預(yù)期結(jié)果的一致性來衡量的,高正確率表明數(shù)據(jù)
加工過程的準(zhǔn)確性高;
8)數(shù)據(jù)加工速度:即數(shù)據(jù)加工的速度,能以單位時(shí)間內(nèi)處理的數(shù)據(jù)量來衡量??焖俚奶幚砟?/p>
力有助于及時(shí)供應(yīng)所需數(shù)據(jù);
9)存儲(chǔ)可用性:通過測量存儲(chǔ)系統(tǒng)正常服務(wù)時(shí)間占總時(shí)間的比例來評(píng)估的。高可用性意味著
更高的系統(tǒng)穩(wěn)定性;
10)數(shù)據(jù)準(zhǔn)確度:通過比較實(shí)際數(shù)據(jù)與標(biāo)準(zhǔn)或真實(shí)值之間的差異來衡量。
分析決策能力
IT運(yùn)維大模型在分析決策能力方面主要包括數(shù)據(jù)探索、特征提煉、分析能力、決策能力、可視化、
安全可信:
a)數(shù)據(jù)探索:對(duì)海量、多源和異構(gòu)的運(yùn)維數(shù)據(jù),通過查詢、篩選、整合、分析等手段,有效認(rèn)識(shí)
和處理運(yùn)維數(shù)據(jù)的能力。對(duì)于海量、多源和異構(gòu)的運(yùn)維數(shù)據(jù),數(shù)據(jù)探索包括使用查詢工具來檢
索特定的數(shù)據(jù)點(diǎn),應(yīng)用篩選標(biāo)準(zhǔn)來隔離關(guān)鍵性能指標(biāo),整合來自不同來源的數(shù)據(jù)以獲得全面的
視角,以及通過統(tǒng)計(jì)分析來識(shí)別趨勢和異常。這一過程還涉及到對(duì)數(shù)據(jù)的預(yù)處理,如清洗和格
式化,以確保后續(xù)分析的準(zhǔn)確性;
b)特征提煉:對(duì)運(yùn)維數(shù)據(jù)進(jìn)行特征提取、生成、評(píng)估、選擇和提煉的能力,涉及到從原始運(yùn)維數(shù)
據(jù)中提取出對(duì)預(yù)測和分類任務(wù)最有用的信息。包括:
1)特征生成:從時(shí)間序列數(shù)據(jù)中提取趨勢和周期性特征;
2)特征評(píng)估:確定哪些特征對(duì)模型的預(yù)測能力最有價(jià)值;
3)特征選擇:挑選出最重要的特征以供模型訓(xùn)練使用。
c)分析能力:規(guī)則應(yīng)用、模型建立、模型訓(xùn)練的能力,包括規(guī)則的應(yīng)用、模型的建立與訓(xùn)練過程。
規(guī)則應(yīng)用涉及到自動(dòng)化的決策制定,如基于閾值的告警系統(tǒng)。模型建立和訓(xùn)練則是使用歷史數(shù)
據(jù)來構(gòu)建能夠預(yù)測未來事件的數(shù)學(xué)模型;
6
DB15/T4065—2025
d)決策能力:進(jìn)行模型推理,進(jìn)而推動(dòng)科學(xué)決策的能力。模型推理是利用這些模型來分析新的數(shù)
據(jù)點(diǎn),從而為運(yùn)維決策提供支持;
e)可視化:將運(yùn)維對(duì)象及關(guān)聯(lián)關(guān)系、運(yùn)維流程、運(yùn)維活動(dòng)和運(yùn)維管理信息轉(zhuǎn)換成數(shù)字化的圖形或
圖像,并通過多媒體技術(shù)和交互接口,有效展示運(yùn)維信息,實(shí)現(xiàn)人數(shù)交互的能力,包括運(yùn)維對(duì)
象及其關(guān)聯(lián)關(guān)系的圖譜展示、運(yùn)維流程的流程圖、運(yùn)維活動(dòng)的實(shí)時(shí)監(jiān)控圖表以及管理信息的儀
表板。通過多媒體技術(shù)和交互接口,可視化工具幫助運(yùn)維人員快速識(shí)別問題、監(jiān)控性能和理解
復(fù)雜的系統(tǒng)行為;
f)安全可信:在分析決策過程中對(duì)可能影響運(yùn)維場景目標(biāo)實(shí)現(xiàn)的風(fēng)險(xiǎn)加以識(shí)別、評(píng)估和規(guī)避,保
障分析過程和結(jié)果有效的能力,包括識(shí)別可能影響運(yùn)維目標(biāo)實(shí)現(xiàn)的風(fēng)險(xiǎn),如數(shù)據(jù)泄露、錯(cuò)誤配
置或系統(tǒng)故障。對(duì)這些風(fēng)險(xiǎn)進(jìn)行評(píng)估,并通過適當(dāng)?shù)拇胧﹣硪?guī)避,如實(shí)施加密、訪問控制和使
用冗余系統(tǒng)。保障分析過程和結(jié)果的有效性還包括制定和遵循嚴(yán)格的操作標(biāo)準(zhǔn)和流程,幫助用
戶理解和信任模型的決策過程;
g)分析決策能力需設(shè)立可評(píng)估或可量化的指標(biāo),評(píng)估指標(biāo)包括但不限于:
1)數(shù)據(jù)覆蓋率:通過查詢和篩選手段覆蓋的數(shù)據(jù)種類和數(shù)據(jù)量占總運(yùn)維數(shù)據(jù)的百分比;
2)特征相關(guān)性評(píng)分:通過統(tǒng)計(jì)方法或算法評(píng)估提取特征與目標(biāo)變量之間的相關(guān)性,高相關(guān)性
評(píng)分意味著提取的特征對(duì)于分析目標(biāo)具有較高的解釋力;
3)模型準(zhǔn)確率:通過交叉驗(yàn)證等方法評(píng)估模型預(yù)測的準(zhǔn)確度,高準(zhǔn)確率表示模型具有良好的
泛化能力,能夠準(zhǔn)確進(jìn)行推理和決策;
4)規(guī)則應(yīng)用成功率:將規(guī)則應(yīng)用于數(shù)據(jù)時(shí)成功實(shí)現(xiàn)預(yù)期效果的比例,高成功率表明規(guī)則設(shè)置
合理有效;
5)可視化覆蓋率:展示的可視化內(nèi)容占全部運(yùn)維信息的比例,高覆蓋率意味著更全面的展示
運(yùn)維情況;
6)風(fēng)險(xiǎn)識(shí)別率:成功識(shí)別的風(fēng)險(xiǎn)數(shù)量占總風(fēng)險(xiǎn)數(shù)量的比例,高識(shí)別率表明強(qiáng)大的風(fēng)險(xiǎn)識(shí)別能
力。
自動(dòng)控制能力
IT運(yùn)維大模型在自動(dòng)控制能力方面主要包括接入管控、安全管控、過程管控、執(zhí)行管控:
a)接入管控:構(gòu)建連接運(yùn)維對(duì)象或運(yùn)維服務(wù)的通道,實(shí)現(xiàn)控制運(yùn)維對(duì)象或管理服務(wù)調(diào)用的自動(dòng)化
能力,包括:對(duì)應(yīng)用系統(tǒng)、服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)、云資源和基礎(chǔ)環(huán)境等IT資源進(jìn)行管控,保
障自動(dòng)化的操控能力;對(duì)運(yùn)維工具的自動(dòng)化服務(wù)能力進(jìn)行整合及管控,對(duì)外提供統(tǒng)一服務(wù)的能
力;
b)安全管控:通過技術(shù)手段對(duì)用戶身份、用戶權(quán)限、自動(dòng)化任務(wù)進(jìn)行合法性認(rèn)證、合規(guī)性檢查,
并生成滿足監(jiān)管、審計(jì)要求的相關(guān)記錄的能力;
c)過程管控:通過操作、服務(wù)的編排實(shí)現(xiàn)各項(xiàng)運(yùn)維活動(dòng)的串聯(lián)與管控,提升運(yùn)維活動(dòng)效率的能力;
d)執(zhí)行管控:利用自動(dòng)化技術(shù)或手段,安全高效地以自動(dòng)化方式執(zhí)行運(yùn)維操作并驗(yàn)證成果,以及
在異常情況下運(yùn)維人員可對(duì)執(zhí)行活動(dòng)進(jìn)行干預(yù)的能力;
e)自動(dòng)控制能力需設(shè)立可評(píng)估或可量化的指標(biāo),評(píng)估指標(biāo)包括但不限于:
1)自動(dòng)化接口集成成功率:成功創(chuàng)建和維護(hù)自動(dòng)化接口與協(xié)議的比例,確保各種IT資源(如
應(yīng)用系統(tǒng)、服務(wù)器等)能夠無縫接入。通過自動(dòng)化測試和日常運(yùn)維記錄,計(jì)算成功集成的
次數(shù)占總嘗試次數(shù)的比例;
2)服務(wù)響應(yīng)時(shí)間:用戶發(fā)起服務(wù)請求到系統(tǒng)做出響應(yīng)的平均時(shí)間;
3)服務(wù)可用性:通過系統(tǒng)的運(yùn)行時(shí)間記錄,計(jì)算在總時(shí)間內(nèi)服務(wù)可用的比例;
4)身份驗(yàn)證成功率:用戶或自動(dòng)化任務(wù)在進(jìn)行身份驗(yàn)證時(shí),成功通過的比例;
7
DB15/T4065—2025
5)合規(guī)性檢查通過率:自動(dòng)化IT運(yùn)維任務(wù)和用戶操作在符合運(yùn)維政策和監(jiān)管標(biāo)準(zhǔn)方面的合
格率;
6)流程編排效率:通過工具自動(dòng)化編排運(yùn)維活動(dòng)的效率,通常指完成特定任務(wù)所需的時(shí)間;
7)異常處理能力:在運(yùn)維過程中出現(xiàn)異常情況時(shí),系統(tǒng)能夠多快恢復(fù)或通知相關(guān)人員進(jìn)行干
預(yù);
8)業(yè)務(wù)恢復(fù)時(shí)間:在面臨威脅時(shí)恢復(fù)正常業(yè)務(wù)的速度;
9)自動(dòng)化執(zhí)行覆蓋率:通過自動(dòng)化技術(shù)執(zhí)行的運(yùn)維操作占所有運(yùn)維操作的比例;
10)執(zhí)行結(jié)果驗(yàn)證準(zhǔn)確率:自動(dòng)化執(zhí)行后,對(duì)執(zhí)行結(jié)果進(jìn)行驗(yàn)證的準(zhǔn)確率。
7IT運(yùn)維大模型場景實(shí)現(xiàn)
場景分析
場景分析是通過前期調(diào)研和評(píng)估,確定場景構(gòu)建的方案和計(jì)劃,應(yīng)遵守以下要求:
a)明確預(yù)期場景實(shí)現(xiàn)目標(biāo),如提高管理質(zhì)量、降低故障時(shí)間、提升運(yùn)維效能、節(jié)省人力成本、提
升用戶體驗(yàn)等;
b)評(píng)估場景實(shí)現(xiàn)的可行性,包括成本、收益、資源投入等;
c)識(shí)別場景實(shí)現(xiàn)的共性需求,優(yōu)先采用平臺(tái)化建設(shè)思路,避免功能重復(fù)建設(shè);
d)評(píng)估相關(guān)場景對(duì)現(xiàn)狀的影響,如組織、過程、相關(guān)方等,并制定風(fēng)險(xiǎn)應(yīng)對(duì)措施;
e)根據(jù)場景復(fù)雜度、技術(shù)實(shí)現(xiàn)難度、數(shù)據(jù)質(zhì)量情況、資源支持情況、需求緊迫性等,明確場景構(gòu)
建的階段和步驟,混合場景可拆分成多個(gè)單一場景分階段實(shí)現(xiàn);
f)重點(diǎn)評(píng)估數(shù)據(jù)需求,結(jié)合場景特點(diǎn),確定所需數(shù)據(jù)的時(shí)效要求、質(zhì)量要求、數(shù)據(jù)范圍、采集方
法、存儲(chǔ)方式等;
g)重點(diǎn)評(píng)估安全要求,考慮數(shù)據(jù)訪問權(quán)限控制、信息保密、模型修正、失效補(bǔ)償?shù)龋?/p>
h)以合理的顆粒度拆解場景涉及到的具體活動(dòng),可采用列舉、分析、歸納等方法,識(shí)別場景實(shí)現(xiàn)
的運(yùn)維角色、運(yùn)維活動(dòng)、運(yùn)維對(duì)象、智能特征等;
i)基于數(shù)據(jù)管理、分析決策、自動(dòng)控制能力,確定待建設(shè)的能力項(xiàng)和待提升的能力要素;
j)設(shè)立可評(píng)估或可量化的指標(biāo),如故障發(fā)現(xiàn)準(zhǔn)確率、平均故障修復(fù)時(shí)間等;
k)根據(jù)場景分析的結(jié)論,形成場景構(gòu)建方案和計(jì)劃。
場景構(gòu)建
場景構(gòu)建是按既定方案和計(jì)劃開展場景相關(guān)能力建設(shè),應(yīng)遵守以下要求:
a)按照場景構(gòu)建方案和計(jì)劃,研發(fā)、優(yōu)化、建設(shè)相關(guān)能力項(xiàng);
b)根據(jù)具體場景進(jìn)行能力項(xiàng)組合,重點(diǎn)關(guān)注能力項(xiàng)的可復(fù)用性;
c)確保場景構(gòu)建過程可追溯,交付結(jié)果可計(jì)量或可評(píng)估;
d)重點(diǎn)關(guān)注數(shù)據(jù)質(zhì)量和模型運(yùn)行效果;
e)對(duì)于涉及自動(dòng)化和批量操作的場景,增加必要的約束措施,設(shè)計(jì)安全控制點(diǎn)和回退功能;
f)測試和驗(yàn)證關(guān)鍵場景的高可用性,并制定失效補(bǔ)償措施;
g)將規(guī)則知識(shí)、專家經(jīng)驗(yàn)、模型訓(xùn)練結(jié)果等固化到信息系統(tǒng)中;
h)關(guān)注各系統(tǒng)間的數(shù)據(jù)打通和流程聯(lián)動(dòng);
i)場景構(gòu)建需要包含IT運(yùn)維大模型微調(diào)與優(yōu)化部署,滿足IT運(yùn)維大模型相關(guān)能力指標(biāo)要求。
(常見IT運(yùn)維大模型場景說明參見附錄A)
場景交付
8
DB15/T4065—2025
場景交付是場景構(gòu)建完成后進(jìn)行實(shí)施交付及配套活動(dòng),應(yīng)遵守以下要求:
a)按既定計(jì)劃完成場景實(shí)施交付,交付物包括但不限于交付方案、使用手冊、應(yīng)急預(yù)案等;
b)開展培訓(xùn)工作,如場景的使用、運(yùn)維、應(yīng)急處理等;
c)開展試點(diǎn)和推廣工作;
d)開展測試驗(yàn)收工作;
e)開展關(guān)鍵指標(biāo)適配、調(diào)優(yōu)工作,如資源交付的效率、根因定位的準(zhǔn)確率等。
評(píng)估方法
場景交付后需評(píng)估是否達(dá)到預(yù)期效果,并設(shè)定下階段迭代目標(biāo),應(yīng)遵守以下要求:
a)建立評(píng)估機(jī)制,組織相關(guān)方開展效果評(píng)估;
b)評(píng)估已建場景是否滿足既定目標(biāo),對(duì)未達(dá)目標(biāo)或指標(biāo)的情況開展原因分析;
c)與利益相關(guān)者建立順暢的溝通渠道,對(duì)意見做好收集與反饋;
d)評(píng)估已建場景是否滿足運(yùn)維相關(guān)安全要求;
e)制定改進(jìn)措施和提升計(jì)劃,并持續(xù)改進(jìn)、快速迭代。
9
DB15/T4065—2025
A
A
附錄A
(資料性)
常見IT運(yùn)維大模型場景說明
在IT運(yùn)維大模型場景實(shí)現(xiàn)過程中,宜從實(shí)際出發(fā),立足當(dāng)前運(yùn)維痛點(diǎn),從場景切入,由點(diǎn)到面進(jìn)行IT
運(yùn)維大模型體系建設(shè),并通過設(shè)立評(píng)價(jià)指標(biāo)對(duì)實(shí)施效果進(jìn)行測量,確保已建場景滿足既定運(yùn)維目標(biāo)并有
效體現(xiàn)大模型特征。本附錄選取和描述了常見IT運(yùn)維大模型場景,說明見表A.1。
表A.1常見IT運(yùn)維大模型場景說明
B場景描述關(guān)鍵指標(biāo)智能特征目標(biāo)
該場景通過超文本傳輸協(xié)議(HTTP)請
求、傳輸控制協(xié)議/網(wǎng)際協(xié)議(TCP/IP)
應(yīng)用系統(tǒng)異常撥測率
應(yīng)用系統(tǒng)異請求、應(yīng)用系統(tǒng)應(yīng)用程序編程接口
=撥測發(fā)現(xiàn)異常對(duì)象會(huì)診斷
常撥測(API)請求等不同形式,對(duì)應(yīng)用系統(tǒng)運(yùn)
數(shù)/總異常對(duì)象數(shù)
行狀態(tài)進(jìn)行自動(dòng)撥測,根據(jù)響應(yīng)結(jié)果發(fā)
現(xiàn)異常并告警
該場景通過自動(dòng)化方式對(duì)系統(tǒng)、中間
快速處置率=處置對(duì)
快速處置件、數(shù)據(jù)庫、應(yīng)用系統(tǒng)等運(yùn)維對(duì)象執(zhí)行自執(zhí)行
象數(shù)/總對(duì)象數(shù)
啟停、切換等便捷操作
該場景通過算法或規(guī)則,將無效和重復(fù)
告警聚合率=1-聚合
告警聚合等相同原因觸發(fā)的告警合并為一個(gè)告會(huì)診斷質(zhì)量可靠:
后告警數(shù)/總告警數(shù)
警在事前、事中、事后
該場景通過實(shí)時(shí)海量數(shù)據(jù)處理、非結(jié)構(gòu)的各方面,有效提高
能感知、可決
化數(shù)據(jù)識(shí)別、數(shù)據(jù)關(guān)系挖掘等方式,對(duì)故障自愈率=自愈故運(yùn)維服務(wù)對(duì)象的運(yùn)行
故障自愈策、會(huì)診斷、自
故障場景特征精準(zhǔn)識(shí)別,并自動(dòng)調(diào)用預(yù)障數(shù)/總故障數(shù)穩(wěn)定性和可靠性
執(zhí)行
設(shè)的應(yīng)急動(dòng)作,實(shí)現(xiàn)業(yè)務(wù)的快速恢復(fù)
該場景通過實(shí)時(shí)收集運(yùn)維對(duì)象的業(yè)務(wù)異常發(fā)現(xiàn)準(zhǔn)確率=有
交易量、成功率、耗時(shí)、系統(tǒng)性能、日效告警數(shù)/總告警數(shù);自適應(yīng)、自學(xué)
異常發(fā)現(xiàn)志等數(shù)據(jù),利用機(jī)器學(xué)習(xí)訓(xùn)練歷史數(shù)據(jù)異常發(fā)現(xiàn)漏報(bào)率=(應(yīng)習(xí)、能感知、會(huì)
運(yùn)行模型,實(shí)時(shí)檢測運(yùn)行數(shù)據(jù),實(shí)現(xiàn)快告警數(shù)-有效告警診斷
速發(fā)現(xiàn)運(yùn)維對(duì)象的運(yùn)行異常狀態(tài)數(shù))/應(yīng)告警數(shù)
故障影響分析準(zhǔn)確率
該場景通過綜合分析業(yè)務(wù)、應(yīng)用系統(tǒng)間
故障影響分=影響范圍分析正確可決策、會(huì)描
依賴關(guān)系和配置數(shù)據(jù),實(shí)現(xiàn)快速準(zhǔn)確地
析的故障數(shù)量/故障總述
推斷某個(gè)故障的影響范圍和程度
數(shù)
10
DB15/T4065—2025
表A.1常見IT運(yùn)維大模型場景說明(續(xù))
場景名稱場景描述關(guān)鍵指標(biāo)智能特征目標(biāo)
該場景通過排障決策樹、對(duì)象關(guān)聯(lián)圖故障根因定位準(zhǔn)確率
譜、故障傳播影響分析等方式,實(shí)現(xiàn)對(duì)=準(zhǔn)確推薦根因故障能感知、可決
故障根因定版本變更、業(yè)務(wù)參數(shù)調(diào)整、代碼邏輯或數(shù)/總推薦根因故障策、會(huì)診斷、自
位基礎(chǔ)設(shè)施故障帶來的各種大規(guī)模、并發(fā)數(shù);故障根因定位覆學(xué)習(xí)、自適應(yīng)、
異常告警進(jìn)行根因分析定位和根因故蓋率=準(zhǔn)確推薦根因會(huì)描述
障推薦故障數(shù)/總故障數(shù)
該場景通過收集和處理運(yùn)維對(duì)象歷史質(zhì)量可靠:
運(yùn)行數(shù)據(jù)和故障數(shù)據(jù),建立不同技術(shù)領(lǐng)在事前、事中、事后的
故障預(yù)測準(zhǔn)確率=準(zhǔn)自學(xué)習(xí)、會(huì)診
故障預(yù)測域的故障模型,提取故障特征,歸納故各方面,有效提高運(yùn)
確預(yù)測數(shù)/總預(yù)測數(shù)斷
障演化規(guī)律,實(shí)現(xiàn)對(duì)運(yùn)維對(duì)象運(yùn)行趨勢維服務(wù)對(duì)象的運(yùn)行穩(wěn)
的動(dòng)態(tài)預(yù)測定性和可靠性
該場景通過自動(dòng)收集運(yùn)維對(duì)象信息,如
性能數(shù)據(jù)、狀態(tài)數(shù)據(jù)、技術(shù)數(shù)據(jù)和日志
健康檢查覆蓋率=自能感知、會(huì)描
數(shù)據(jù)等,利用同類運(yùn)維對(duì)象的橫向比
健康檢查動(dòng)健康檢查運(yùn)維對(duì)象述、可決策、會(huì)
較、歷史數(shù)據(jù)分布比較、最佳實(shí)踐基線
數(shù)/總運(yùn)維對(duì)象診斷、自執(zhí)行
比較等方式,實(shí)現(xiàn)精準(zhǔn)、快速、全方位
地評(píng)估運(yùn)維對(duì)象健康度
通過采用軟件定義網(wǎng)絡(luò)(SDN)技術(shù)架
構(gòu),對(duì)網(wǎng)絡(luò)資源統(tǒng)一調(diào)度、集中管理、
網(wǎng)絡(luò)堵塞年度減少次
智能網(wǎng)絡(luò)負(fù)實(shí)時(shí)計(jì)算,實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)的快速轉(zhuǎn)發(fā)、會(huì)診斷、自執(zhí)成本降低:
數(shù)=上一年度發(fā)生數(shù)-
載高效傳輸,并根據(jù)網(wǎng)絡(luò)質(zhì)量智能選路、行在基礎(chǔ)設(shè)施、應(yīng)用系
本年度發(fā)生數(shù)
業(yè)務(wù)路徑調(diào)優(yōu),充分利用網(wǎng)絡(luò)資源,降統(tǒng)等運(yùn)維領(lǐng)域(資源)
低使用成本方面,有效降低服務(wù)
該場景利用軟件機(jī)器人,根據(jù)運(yùn)維工單對(duì)象的運(yùn)行和管理成
工單自動(dòng)化率=自動(dòng)
運(yùn)維工單流流程,以更快的速度、更高的準(zhǔn)確率實(shí)本
化工單流程的數(shù)量/自執(zhí)行
程自動(dòng)化現(xiàn)運(yùn)維工單自動(dòng)化填寫等操作,有效代
運(yùn)維工單流程的總數(shù)
替人工并降低成本
11
DB15/T4065—2025
表A.1常見IT運(yùn)維大模型場景說明(續(xù))
場景名稱場景描述關(guān)鍵指標(biāo)智能特征目標(biāo)
在云環(huán)境下,對(duì)一組或多組資源指標(biāo)進(jìn)
行有效監(jiān)控,根據(jù)資源使用情況進(jìn)行動(dòng)
態(tài)伸縮,當(dāng)資源不足時(shí),利用資源分配
算法動(dòng)態(tài)調(diào)度部署節(jié)點(diǎn),并加入到當(dāng)前資源調(diào)整自動(dòng)化率=能感知、自學(xué)
資源彈性伸
的運(yùn)行環(huán)境,當(dāng)資源利用率很低時(shí),能自動(dòng)化調(diào)整資源次數(shù)習(xí)、可決策、自
縮
回收資源,避免資源的浪費(fèi),如數(shù)據(jù)庫/總調(diào)整資源次數(shù)執(zhí)行、自適應(yīng)
擴(kuò)容、私有云的動(dòng)態(tài)伸縮、文件系統(tǒng)、
內(nèi)存、中央處理器(CPU)等動(dòng)態(tài)擴(kuò)容或
收縮等
該場景通過實(shí)時(shí)或定期自動(dòng)收集CPU、
I/O、內(nèi)存、日志信息等應(yīng)用系統(tǒng)性能應(yīng)用系統(tǒng)性能預(yù)測準(zhǔn)能感知、自學(xué)
應(yīng)用系統(tǒng)性
相關(guān)數(shù)據(jù),利用相關(guān)模型及算法,對(duì)應(yīng)確率=準(zhǔn)確預(yù)測數(shù)/總習(xí)、可決策、自
能預(yù)測成本降低:
用系統(tǒng)性能消耗資源進(jìn)行精準(zhǔn)預(yù)測,實(shí)預(yù)測數(shù)執(zhí)行、自適應(yīng)
在基礎(chǔ)設(shè)施、應(yīng)用系
現(xiàn)資源合理劃分,降低運(yùn)行成本
統(tǒng)等運(yùn)維領(lǐng)域(資源)
不同應(yīng)用服務(wù)資源消耗偏好不一樣(包
方面,有效降低服務(wù)
括計(jì)算密集型、內(nèi)存密集型、I/O密集
對(duì)象的運(yùn)行和管理成
型等等),同一應(yīng)用服務(wù)在不同時(shí)間資應(yīng)用混合部署自動(dòng)化
能感知、自學(xué)本
應(yīng)用智能混源消耗也不一樣,不加區(qū)分的同比例資率=自動(dòng)化混合部署
習(xí)、可決策、自
合部署源分配會(huì)造成部分資源的閑置浪費(fèi)。通次數(shù)/總混合部署次
執(zhí)行、自適應(yīng)
過智能計(jì)算和預(yù)測將不同資源類型的數(shù)
服務(wù)自動(dòng)在同一主機(jī)上混合部署,能有
效提高主機(jī)各方面資源的綜合利用率
通過智能運(yùn)維對(duì)機(jī)房能耗進(jìn)行優(yōu)化,綜
合監(jiān)控、日志、環(huán)境等數(shù)據(jù)建立模型,
實(shí)時(shí)數(shù)據(jù)進(jìn)行迭代,通過大模型算法對(duì)能感知、自學(xué)
機(jī)房能耗智
能耗進(jìn)行分析,對(duì)電能利用效率(PUE)PUE下降百分比習(xí)、可決策、自
能優(yōu)化
進(jìn)行預(yù)測并智能生成優(yōu)化方案,降低非執(zhí)行、自適應(yīng)
計(jì)算方面的能耗,從而降低數(shù)據(jù)中心整
體運(yùn)行PUE,實(shí)現(xiàn)綠色數(shù)據(jù)中心
12
DB15/T4065—2025
表A.1常見IT運(yùn)維大模型場景說明(續(xù))
場景名稱場景描述關(guān)鍵指標(biāo)智能特征目標(biāo)
自動(dòng)化巡檢能將硬件狀態(tài)、設(shè)備負(fù)載、
系統(tǒng)時(shí)間、磁盤空間、線路流量、數(shù)據(jù)日常巡檢自動(dòng)化率=
日常巡檢自
庫表空間使用率、網(wǎng)絡(luò)設(shè)備端口狀態(tài)、自動(dòng)巡檢任務(wù)數(shù)/總自執(zhí)行
動(dòng)化
流量等進(jìn)行自動(dòng)巡檢,并形成符合要求巡檢任務(wù)數(shù)
的巡檢報(bào)告
通過向客戶端下發(fā)備份副本、配置信
息、環(huán)境參數(shù),備份業(yè)務(wù)數(shù)據(jù),并停止客
戶端應(yīng)用服務(wù),然后批量自動(dòng)下發(fā)新版軟件分發(fā)配置自動(dòng)化
軟件分發(fā)配本的安裝配置文件、動(dòng)態(tài)鏈接庫(DLL)率=自動(dòng)化分發(fā)的運(yùn)
自執(zhí)行
置自動(dòng)化文件等,最后啟動(dòng)客戶端應(yīng)用服務(wù),對(duì)維對(duì)象數(shù)量/運(yùn)維對(duì)
應(yīng)用系統(tǒng)的服務(wù)狀態(tài)與相關(guān)日志信息象總數(shù)
進(jìn)行檢查,以確認(rèn)軟件分發(fā)和配置工作
自動(dòng)部署、灰度發(fā)布成功完成效率提升:
機(jī)器人巡檢準(zhǔn)確率=有效提高各運(yùn)維行為
該場景利用多傳感器融合、軟件探測和正確巡檢隱患數(shù)量/的時(shí)效性和準(zhǔn)確性
能感知、會(huì)診
服務(wù)編排等技術(shù),對(duì)運(yùn)維對(duì)象定期巡實(shí)際隱患數(shù)量;機(jī)器
機(jī)器人巡檢斷、可決策、自
檢,根據(jù)規(guī)則判定并給出巡檢結(jié)果,提人巡檢自動(dòng)化率=機(jī)
執(zhí)行
升工作效率器完成的巡檢任務(wù)數(shù)
/需完成的總?cè)蝿?wù)數(shù)
該場景通過文本識(shí)別、圖像識(shí)別、語音知識(shí)檢索率=被檢索能感知、會(huì)描
運(yùn)維知識(shí)庫
識(shí)別、知識(shí)圖譜等技術(shù),實(shí)現(xiàn)運(yùn)維知識(shí)使用的知識(shí)條目數(shù)/述、自學(xué)習(xí)、可
智能應(yīng)用
檢索、推薦、歸納、展示等知識(shí)總條目數(shù)決策
該場景通過利用自動(dòng)化腳本、自動(dòng)化流
能感知、可決
程、智能算法對(duì)運(yùn)維活動(dòng)中大量重復(fù)、智能作業(yè)調(diào)度準(zhǔn)確率
智能作業(yè)調(diào)策、會(huì)診斷、自
復(fù)雜的作業(yè)進(jìn)行智能化編排,實(shí)現(xiàn)作業(yè)=完成作業(yè)正確數(shù)/作
度執(zhí)行、自適應(yīng)、
時(shí)間短、質(zhì)量高、資源利用均衡等目標(biāo),業(yè)執(zhí)行息數(shù)
自學(xué)習(xí)
降低運(yùn)維人員壓力,提升運(yùn)維服務(wù)效能
13
DB15/T4065—2025
表A.1常見IT運(yùn)維大模型場景說明(續(xù))
場景名稱場景描述關(guān)鍵指標(biāo)智能特征目標(biāo)
威脅IP檢測準(zhǔn)確率識(shí)
該場景根據(jù)制定的規(guī)則,自動(dòng)化快速識(shí)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025山東菏澤曹縣蘇教高級(jí)中學(xué)教師招聘6人備考考試試題及答案解析
- 2026福建三明市建寧縣公開招聘緊缺急需專業(yè)教師19人參考筆試題庫附答案解析
- 2025新疆第十四師昆玉市學(xué)校引進(jìn)高層次人才18人考試參考試題及答案解析
- 2026華能云南滇東能源有限責(zé)任公司招聘60人參考筆試題庫附答案解析
- 深度解析(2026)《GBT 25866-2010玉米干全酒糟(玉米DDGS)》(2026年)深度解析
- 2025河南輕工職業(yè)學(xué)院2025年公開招聘工作人員(博士)5人模擬筆試試題及答案解析
- 深度解析(2026)《GBT 25811-2010染料試驗(yàn)用標(biāo)準(zhǔn)漂白滌綸布》
- 2026福建龍巖人民醫(yī)院招聘醫(yī)學(xué)類緊缺急需專業(yè)畢業(yè)生4人備考考試試題及答案解析
- 高校畢業(yè)生專業(yè)結(jié)構(gòu)與產(chǎn)業(yè)需求錯(cuò)配-基于OECD《技能戰(zhàn)略》供需匹配指數(shù)
- 2025重慶市長壽區(qū)城市管理服務(wù)中心招聘數(shù)字城管工作人員3人參考筆試題庫附答案解析
- 沃柑銷售合同范本
- 2025年居家養(yǎng)老助餐合同協(xié)議
- 公安車輛盤查課件
- 石材行業(yè)合同范本
- 基礎(chǔ)部分6se70變頻柜-整流單元
- GB∕T 37092-2018 信息安全技術(shù)密碼模塊安全要求
- 2022年《內(nèi)蒙古自治區(qū)建設(shè)工程費(fèi)用定額》取費(fèi)說明
- 淺孔留礦法采礦方法設(shè)計(jì)
- CJT24-2018 園林綠化木本苗
- 利用K-means聚類分析技術(shù)分析學(xué)生成績
評(píng)論
0/150
提交評(píng)論