DB15∕T 4065-2025 IT運(yùn)維大模型能力要求_第1頁
DB15∕T 4065-2025 IT運(yùn)維大模型能力要求_第2頁
DB15∕T 4065-2025 IT運(yùn)維大模型能力要求_第3頁
DB15∕T 4065-2025 IT運(yùn)維大模型能力要求_第4頁
DB15∕T 4065-2025 IT運(yùn)維大模型能力要求_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

ICS33.030

CCSM21

15

內(nèi)蒙古自治區(qū)地方標(biāo)準(zhǔn)

DB15/T4065—2025

IT運(yùn)維大模型能力要求

Abilityrequirementsforinformationtechnologyoperationand

maintenanceoflargelanguagemodel

2025-06-26發(fā)布2025-07-26實(shí)施

內(nèi)蒙古自治區(qū)市場監(jiān)督管理局發(fā)布

DB15/T4065—2025

目次

前言.................................................................................II

1范圍...............................................................................1

2規(guī)范性引用文件.....................................................................1

3術(shù)語和定義.........................................................................1

4總體框架...........................................................................2

5IT運(yùn)維大模型構(gòu)建...................................................................3

業(yè)務(wù)需求分析與資源評(píng)估.........................................................3

IT運(yùn)維數(shù)據(jù)與大模型共建.........................................................4

IT運(yùn)維大模型微調(diào)與優(yōu)化部署.....................................................4

6IT運(yùn)維大模型能力與評(píng)估.............................................................5

數(shù)據(jù)管理能力...................................................................5

分析決策能力...................................................................6

自動(dòng)控制能力...................................................................7

7IT運(yùn)維大模型場景實(shí)現(xiàn)...............................................................8

場景分析.......................................................................8

場景構(gòu)建.......................................................................8

場景交付.......................................................................8

評(píng)估方法.......................................................................9

附錄A(資料性)常見IT運(yùn)維大模型場景說明...........................................10

參考文獻(xiàn).............................................................................15

I

DB15/T4065—2025

前言

本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定

起草。

請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別專利的責(zé)任。

本文件由內(nèi)蒙古自治區(qū)工業(yè)和信息化廳歸口。

本文件起草單位:內(nèi)蒙古科電數(shù)據(jù)服務(wù)有限公司、中通服咨詢設(shè)計(jì)研究院有限公司、中通服智慧城

市公司工程建設(shè)有限責(zé)任公司、內(nèi)蒙古自治區(qū)大數(shù)據(jù)中心、內(nèi)蒙古電力集團(tuán)蒙電信息通信產(chǎn)業(yè)有限責(zé)任

公司、巨鵬信息科技有限公司、內(nèi)蒙古天地方正信息有限責(zé)任公司、內(nèi)蒙古華強(qiáng)數(shù)智科技股份有限公司、

內(nèi)蒙古生態(tài)環(huán)境大數(shù)據(jù)有限公司、內(nèi)蒙古智慧青城科技有限公司、內(nèi)蒙古方銳科技信息服務(wù)有限公司、

內(nèi)蒙古匯鑫軟件股份有限公司、內(nèi)蒙古慧瑞系統(tǒng)集成有限公司、內(nèi)蒙古大學(xué)、內(nèi)蒙古財(cái)經(jīng)大學(xué)。

本文件主要起草人:崔連偉、巴圖烏力吉、李鑫、陳滿意、米世成、劉云升、謝炯、全鑫、賈瑞紅、

蔡斐、朱國新、于森、屈強(qiáng)、宋喜斌、嚴(yán)則虎、聶文亮、高軍、劉陽、趙燕、王鵬、周平、李運(yùn)博、王

文杰、劉云浩。

II

DB15/T4065—2025

IT運(yùn)維大模型能力要求

1范圍

本文件規(guī)定了IT運(yùn)維大模型構(gòu)建、IT運(yùn)維大模型能力與評(píng)估、IT運(yùn)維大模型場景實(shí)現(xiàn)。

本文件適用于規(guī)范IT運(yùn)維大模型建設(shè)應(yīng)用活動(dòng)。

2規(guī)范性引用文件

下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,

僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本

文件。

GB/T25069信息安全技術(shù)術(shù)語

GB/T43208.1信息技術(shù)服務(wù)智能運(yùn)維第1部分:通用要求

GB/T44109信息技術(shù)大數(shù)據(jù)數(shù)據(jù)治理實(shí)施指南

3術(shù)語和定義

GB/T25069、GB/T43208.1界定的以及下列術(shù)語和定義適用于本文件。

IT運(yùn)維大模型informationtechnologyoperationandmaintenanceoflargelanguagemodel

(LLM)

具有大規(guī)模參數(shù)和復(fù)雜計(jì)算結(jié)構(gòu)的,具備能感知、會(huì)描述、自學(xué)習(xí)、會(huì)診斷、可決策、自執(zhí)行、自

適應(yīng)等能力,能夠提供運(yùn)維服務(wù)的機(jī)器學(xué)習(xí)模型。

IT運(yùn)維大模型場景informationtechnologyoperationandmaintenanceoflargelanguage

model(LLM)scenarios

為實(shí)現(xiàn)特定的IT運(yùn)維目標(biāo),并體現(xiàn)運(yùn)維大模型特征,所需的人員、活動(dòng)與對(duì)象的組合。

模型訓(xùn)練modeltraining

通過不斷迭代優(yōu)化,找到一組最優(yōu)參數(shù),使得模型對(duì)于給定輸入的預(yù)測輸出與真實(shí)輸出之間的差異

最小化,求解最優(yōu)化問題的過程。

自學(xué)習(xí)self-learning

1

DB15/T4065—2025

一種機(jī)器學(xué)習(xí)方法,系統(tǒng)能夠通過自身的探索和經(jīng)驗(yàn)積累來改進(jìn)其性能,而無需依賴外部的監(jiān)督或

指導(dǎo)。

自適應(yīng)adaptive

在人工智能和機(jī)器學(xué)習(xí)中,自適應(yīng)是系統(tǒng)能夠根據(jù)環(huán)境的變化自動(dòng)調(diào)整其行為或參數(shù),以優(yōu)化性能

或達(dá)到特定目標(biāo)。

過擬合overfitting

模型在訓(xùn)練數(shù)據(jù)上表現(xiàn)得過于完美,以至于無法對(duì)新數(shù)據(jù)做出準(zhǔn)確預(yù)測的現(xiàn)象。

欠擬合underfitting

模型對(duì)訓(xùn)練數(shù)據(jù)的擬合程度不夠,導(dǎo)致模型的泛化能力差。

4總體框架

IT運(yùn)維大模型能力要求框架圖1如下所示。

圖1總體框架

2

DB15/T4065—2025

IT運(yùn)維大模型的建設(shè)分為IT運(yùn)維大模型構(gòu)建、IT運(yùn)維大模型能力與評(píng)估、IT運(yùn)維大模型場景實(shí)現(xiàn)三

部分。

IT運(yùn)維大模型構(gòu)建是針對(duì)IT運(yùn)維業(yè)務(wù)中構(gòu)建大模型應(yīng)用所需的基礎(chǔ)步驟,是對(duì)于構(gòu)建IT運(yùn)維大模

型的整體流程說明,分為業(yè)務(wù)需求分析與資源評(píng)估、IT運(yùn)維數(shù)據(jù)與大模型共建、IT運(yùn)維大模型微調(diào)與優(yōu)

化部署。

IT運(yùn)維大模型能力與評(píng)估是針對(duì)IT運(yùn)維大模型應(yīng)該具備的能力與評(píng)估指標(biāo)的說明,定義了對(duì)IT運(yùn)

維大模型基礎(chǔ)能力要求和評(píng)估指標(biāo)。能力指標(biāo)分為含數(shù)據(jù)建模、元數(shù)據(jù)管理、數(shù)據(jù)采集、數(shù)據(jù)加工、數(shù)

據(jù)存儲(chǔ)、質(zhì)量管理、數(shù)據(jù)服務(wù)、數(shù)據(jù)安全的數(shù)據(jù)管理能力,含數(shù)據(jù)探索、特征提煉、分析決策、可視化、

安全可信的分析決策能力,含接入管控、安全管控、過程管控、執(zhí)行管控的自動(dòng)控制能力。

IT運(yùn)維大模型場景實(shí)現(xiàn)是對(duì)IT運(yùn)維相關(guān)場景應(yīng)用的實(shí)現(xiàn)說明,分為場景分析、場景構(gòu)建、場景交付

和評(píng)估方法。

5IT運(yùn)維大模型構(gòu)建

業(yè)務(wù)需求分析與資源評(píng)估

5.1.1業(yè)務(wù)需求評(píng)估

業(yè)務(wù)需求評(píng)估要明確業(yè)務(wù)的具體需求,深入理解業(yè)務(wù)流程、業(yè)務(wù)量、業(yè)務(wù)峰值、關(guān)鍵性能指標(biāo)(KPI)、

服務(wù)級(jí)別協(xié)議(SLA),將業(yè)務(wù)需求轉(zhuǎn)換為明確、可量化的目標(biāo),以確定IT運(yùn)維大模型構(gòu)建的基本方向。

評(píng)估內(nèi)容包括但不限于:

a)業(yè)務(wù)數(shù)據(jù):需輸入到大模型的業(yè)務(wù)數(shù)據(jù)范圍、業(yè)務(wù)數(shù)據(jù)類型;

b)業(yè)務(wù)指標(biāo):細(xì)化為多個(gè)子任務(wù),明確子任務(wù)期望指標(biāo);

c)業(yè)務(wù)服務(wù)方式:私有化部署或公有化部署。

5.1.2算力層評(píng)估

算力層評(píng)估要確定IT運(yùn)維大模型在實(shí)際訓(xùn)練和部署中所需算力資源類型、大小以及相應(yīng)成本。評(píng)估

內(nèi)容包括但不限于:

a)計(jì)算能力:模型訓(xùn)練、微調(diào)、推理所需算力;

b)存儲(chǔ)方案:模型訓(xùn)練、微調(diào)、推理所需數(shù)據(jù)采用的對(duì)象存儲(chǔ)、文件存儲(chǔ)等方案;

c)網(wǎng)絡(luò)通信:根據(jù)模型參數(shù)量級(jí)和訓(xùn)練數(shù)據(jù)量,采用的網(wǎng)絡(luò)技術(shù)要求。

5.1.3算法層評(píng)估

算法層評(píng)估要根據(jù)業(yè)務(wù)需求、算力資源限制,確定適合業(yè)務(wù)場景的大模型和微調(diào)算法。選擇內(nèi)容包

括但不限于:

a)基礎(chǔ)大模型選擇:選擇基礎(chǔ)的語言大模型、視覺大模型或語音大模型,以及大模型的參數(shù)版本;

b)微調(diào)算法選擇:結(jié)合算力和時(shí)間要求,選擇微調(diào)時(shí)采用的算法。

5.1.4數(shù)據(jù)層評(píng)估

數(shù)據(jù)層評(píng)估要根據(jù)IT運(yùn)維業(yè)務(wù)實(shí)際情況、期望目標(biāo),對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行評(píng)估。評(píng)估內(nèi)容包括但不限于:

a)數(shù)據(jù)規(guī)模:評(píng)估已積累IT運(yùn)維數(shù)據(jù)的條數(shù)或存儲(chǔ)量;

b)數(shù)據(jù)質(zhì)量:評(píng)估已積累IT運(yùn)維相關(guān)數(shù)據(jù)集的完整性、一致性、準(zhǔn)確性等質(zhì)量情況;

c)數(shù)據(jù)安全和隱私:評(píng)估是否涉及個(gè)人信息、敏感信息等,必要時(shí)需做脫敏處理;

d)數(shù)據(jù)格式:評(píng)估文本數(shù)據(jù)、音頻數(shù)據(jù)或其他格式類型數(shù)據(jù)占比情況。

3

DB15/T4065—2025

5.1.5工程層評(píng)估

工程層評(píng)估要根據(jù)需求目標(biāo)和構(gòu)建成本對(duì)配套工具或第三方平臺(tái)進(jìn)行選擇。評(píng)估內(nèi)容包括但不限

于:

a)模型訓(xùn)練平臺(tái):評(píng)估是否包含所需基礎(chǔ)大模型或基礎(chǔ)行業(yè)大模型;

b)數(shù)據(jù)標(biāo)注平臺(tái):評(píng)估是否提供數(shù)據(jù)標(biāo)注作業(yè)、場景數(shù)據(jù)挖掘等數(shù)據(jù)服務(wù);

c)訓(xùn)練和部署加速庫:評(píng)估是否具有加速組件以提升模型訓(xùn)練效率;

d)數(shù)據(jù)應(yīng)用平臺(tái):評(píng)估是否支持快速接入模型、數(shù)據(jù)和智能設(shè)備,是否提供模型服務(wù)、應(yīng)用工作

流編排、云邊端調(diào)度等;

e)部署兼容性:評(píng)估部署平臺(tái)與IT運(yùn)維大模型的兼容性,以及升級(jí)方式;

f)模型加密:評(píng)估是否針對(duì)內(nèi)置模型加密。

IT運(yùn)維數(shù)據(jù)與大模型共建

5.2.1模型選擇

模型選擇是根據(jù)IT運(yùn)維大模型的應(yīng)用領(lǐng)域,確定選擇的模型類型。模型類型包括但不限于:

a)自然語言處理大模型;

b)計(jì)算機(jī)視覺大模型;

c)語音識(shí)別大模型;

d)推薦系統(tǒng)大模型;

e)強(qiáng)化學(xué)習(xí)大模型;

f)多模態(tài)大模型。

5.2.2訓(xùn)練環(huán)境搭建

訓(xùn)練環(huán)境搭建是搭建模型訓(xùn)練所需硬件環(huán)境和軟件平臺(tái)。

5.2.3數(shù)據(jù)處理

數(shù)據(jù)處理是將數(shù)據(jù)加工為模型訓(xùn)練所需數(shù)據(jù)。處理步驟包括但不限于:

a)原始數(shù)據(jù)處理:進(jìn)行數(shù)據(jù)脫敏、數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)清洗、數(shù)據(jù)增強(qiáng)等;

b)數(shù)據(jù)標(biāo)注:對(duì)文本、圖像、視頻、音頻類非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行標(biāo)注;

c)數(shù)據(jù)集劃分:將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集、測試集。

5.2.4模型訓(xùn)練

模型訓(xùn)練共建是對(duì)選定的模型進(jìn)行訓(xùn)練。

在IT運(yùn)維中,特別關(guān)注模型的檢索增強(qiáng)能力、場景實(shí)現(xiàn)能力和實(shí)時(shí)性能??赡苄枰M(jìn)行多輪訓(xùn)練和

調(diào)優(yōu),以達(dá)到最優(yōu)的模型效果。訓(xùn)練過程中還要定期評(píng)估模型的性能,以確保不出現(xiàn)過擬合或欠擬合的

情況。

IT運(yùn)維大模型微調(diào)與優(yōu)化部署

5.3.1模型微調(diào)

模型微調(diào)階段首先選擇合適的微調(diào)算法,微調(diào)算法選定后,利用前期準(zhǔn)備的IT運(yùn)維特定場景數(shù)據(jù)進(jìn)

行大模型的訓(xùn)練微調(diào)。選擇合適的微調(diào)算法時(shí),需要考慮IT運(yùn)維場景的特點(diǎn),包括實(shí)時(shí)性要求、數(shù)據(jù)規(guī)

模和模型復(fù)雜度。例如,對(duì)于實(shí)時(shí)監(jiān)控任務(wù),需要選擇計(jì)算效率更高的算法。選定算法后,利用前期準(zhǔn)

4

DB15/T4065—2025

備的特定場景數(shù)據(jù)進(jìn)行訓(xùn)練微調(diào),包括實(shí)際的運(yùn)維日志、性能指標(biāo)數(shù)據(jù)、事件記錄等。微調(diào)過程中,通

過調(diào)整學(xué)習(xí)率、批次大小、正則化參數(shù)等超參數(shù)來優(yōu)化模型性能。

5.3.2模型評(píng)估

模型評(píng)估階段是在微調(diào)生成對(duì)應(yīng)任務(wù)的大模型后,對(duì)模型進(jìn)行評(píng)估,以判斷模型是否滿足應(yīng)用要求。

在IT運(yùn)維中,模型評(píng)估不僅要考察準(zhǔn)確性、召回率等標(biāo)準(zhǔn)指標(biāo),還要特別關(guān)注模型在實(shí)際環(huán)境中的響應(yīng)

時(shí)間、資源消耗和穩(wěn)定性。根據(jù)評(píng)估結(jié)果,判斷模型是否滿足應(yīng)用要求,例如是否能夠準(zhǔn)確預(yù)測故障、

是否能夠有效降低誤報(bào)率等。

5.3.3模型重訓(xùn)優(yōu)化

模型重訓(xùn)優(yōu)化階段是根據(jù)模型評(píng)估的情況,通常需要對(duì)模型進(jìn)行多輪迭代訓(xùn)練優(yōu)化。在IT運(yùn)維中,

特別注重減少模型的無效告警,以避免告警疲勞。同時(shí),也會(huì)關(guān)注模型的泛化能力,確保其在不同環(huán)境

和條件下都能保持穩(wěn)定運(yùn)行。

5.3.4模型聯(lián)調(diào)部署

模型聯(lián)調(diào)部署階段包括推理服務(wù)部署、服務(wù)配置、應(yīng)用服務(wù)聯(lián)調(diào)。推理服務(wù)部署涉及到將訓(xùn)練好的

模型集成到現(xiàn)有的IT運(yùn)維系統(tǒng)中。服務(wù)配置包括設(shè)置合理的資源限制、接口定義和權(quán)限控制。應(yīng)用服務(wù)

聯(lián)調(diào)則確保模型輸出能夠被運(yùn)維系統(tǒng)正確理解和處理,同時(shí)保證系統(tǒng)的其他部分能夠按照預(yù)期與模型

交互。

5.3.5模型應(yīng)用運(yùn)營

模型應(yīng)用運(yùn)營階段是在生產(chǎn)環(huán)境中為已上線的模型服務(wù)提供監(jiān)控、管理、運(yùn)營維護(hù)等能力。在生產(chǎn)

環(huán)境中,上線的模型服務(wù)需要有一套完整的監(jiān)控和管理機(jī)制。監(jiān)控包括跟蹤模型的性能指標(biāo)、異常檢測

和實(shí)時(shí)反饋。管理則涉及模型的版本控制、更新策略和回滾機(jī)制。運(yùn)營維護(hù)包括定期檢查模型的健康狀

況、收集用戶反饋、處理模型漂移問題以及按需進(jìn)行模型更新。

6IT運(yùn)維大模型能力與評(píng)估

數(shù)據(jù)管理能力

IT運(yùn)維大模型在數(shù)據(jù)管理能力方面主要包括數(shù)據(jù)建模、元數(shù)據(jù)管理、數(shù)據(jù)采集、數(shù)據(jù)加工、數(shù)據(jù)存

儲(chǔ)、質(zhì)量管理、數(shù)據(jù)服務(wù)、數(shù)據(jù)安全:

a)數(shù)據(jù)建模:基于對(duì)運(yùn)維數(shù)據(jù)的深入理解和分析,抽象出數(shù)據(jù)的核心特征,并對(duì)數(shù)據(jù)的層次化架

構(gòu)、數(shù)據(jù)對(duì)象以及它們之間的關(guān)系進(jìn)行標(biāo)準(zhǔn)化定義;

b)元數(shù)據(jù)管理:通過對(duì)數(shù)據(jù)的描述性信息全面管理,構(gòu)建一個(gè)完整的數(shù)據(jù)資產(chǎn)管理目錄,詳細(xì)列

出了所有數(shù)據(jù)資產(chǎn)的信息,包括它們的特點(diǎn)、來源、使用方式等;

c)數(shù)據(jù)采集:通過各種技術(shù)手段獲取運(yùn)維原始數(shù)據(jù),如服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、安全等設(shè)備的日志、

告警、事件等數(shù)據(jù)。數(shù)據(jù)采集技術(shù)手段包括日志分析、數(shù)據(jù)庫查詢等,以確保全面、準(zhǔn)確地獲

取運(yùn)維數(shù)據(jù);

d)數(shù)據(jù)加工:對(duì)運(yùn)維原始數(shù)據(jù)進(jìn)行一系列的處理操作,如清洗、轉(zhuǎn)換、聚合和脫敏等。通過這些

處理,能提高數(shù)據(jù)的準(zhǔn)確性和可用性,使其更符合業(yè)務(wù)需求;

注:對(duì)于數(shù)據(jù)采集、數(shù)據(jù)加工、元數(shù)據(jù)管理等操作標(biāo)準(zhǔn)要求,按照GB/T44109信息技術(shù)大數(shù)據(jù)數(shù)據(jù)治理實(shí)施指南。

5

DB15/T4065—2025

e)數(shù)據(jù)存儲(chǔ):按照數(shù)據(jù)存儲(chǔ)標(biāo)準(zhǔn)在計(jì)算機(jī)的存儲(chǔ)裝置或外圍的存儲(chǔ)設(shè)備中存儲(chǔ)海量離線與實(shí)時(shí)

運(yùn)維數(shù)據(jù)的能力;

f)質(zhì)量管理:對(duì)運(yùn)維數(shù)據(jù)在計(jì)劃、獲取、存儲(chǔ)、共享、維護(hù)、應(yīng)用和消亡的各階段中可能存在的

數(shù)據(jù)質(zhì)量問題,進(jìn)行識(shí)別、度量、監(jiān)控、預(yù)警和處置,提高數(shù)據(jù)質(zhì)量的能力;

g)數(shù)據(jù)服務(wù):提供運(yùn)維數(shù)據(jù)消費(fèi)接口及自服務(wù)的能力;

h)數(shù)據(jù)安全:基于數(shù)據(jù)安全相關(guān)策略和流程,利用技術(shù)和管理手段,對(duì)運(yùn)維數(shù)據(jù)的安全風(fēng)險(xiǎn)進(jìn)行

防范和處置的能力;

i)數(shù)據(jù)管理能力需設(shè)立可評(píng)估或可量化的指標(biāo),評(píng)估指標(biāo)包括但不限于:

1)數(shù)據(jù)一致性:確保數(shù)據(jù)在各個(gè)系統(tǒng)和流程中保持一致,無矛盾或沖突的信息;

2)數(shù)據(jù)對(duì)象及其關(guān)系定義:數(shù)據(jù)的組織方式應(yīng)該清晰并且遵循一定的標(biāo)準(zhǔn),以便于理解和使

用;

3)元數(shù)據(jù)覆蓋率:衡量元數(shù)據(jù)管理完整性的指標(biāo),即已有元數(shù)據(jù)覆蓋的數(shù)據(jù)范圍比例;

4)元數(shù)據(jù)更新頻率:指元數(shù)據(jù)在需要時(shí)更新的頻次。高頻次的更新能夠更好地反映底層數(shù)據(jù)

的變化,保持元數(shù)據(jù)的時(shí)效性;

5)數(shù)據(jù)采集準(zhǔn)確率:通過對(duì)比采集到的數(shù)據(jù)與原始數(shù)據(jù)的差異來衡量的,高準(zhǔn)確率意味著數(shù)

據(jù)采集方法的正確性和可靠性;

6)數(shù)據(jù)采集系統(tǒng)穩(wěn)定性:通過系統(tǒng)運(yùn)行故障間隔時(shí)間來評(píng)估。長間隔時(shí)間表示系統(tǒng)更加穩(wěn)定,

對(duì)于持續(xù)的數(shù)據(jù)采集尤為重要;

7)數(shù)據(jù)加工正確率:通過對(duì)比加工后數(shù)據(jù)與預(yù)期結(jié)果的一致性來衡量的,高正確率表明數(shù)據(jù)

加工過程的準(zhǔn)確性高;

8)數(shù)據(jù)加工速度:即數(shù)據(jù)加工的速度,能以單位時(shí)間內(nèi)處理的數(shù)據(jù)量來衡量??焖俚奶幚砟?/p>

力有助于及時(shí)供應(yīng)所需數(shù)據(jù);

9)存儲(chǔ)可用性:通過測量存儲(chǔ)系統(tǒng)正常服務(wù)時(shí)間占總時(shí)間的比例來評(píng)估的。高可用性意味著

更高的系統(tǒng)穩(wěn)定性;

10)數(shù)據(jù)準(zhǔn)確度:通過比較實(shí)際數(shù)據(jù)與標(biāo)準(zhǔn)或真實(shí)值之間的差異來衡量。

分析決策能力

IT運(yùn)維大模型在分析決策能力方面主要包括數(shù)據(jù)探索、特征提煉、分析能力、決策能力、可視化、

安全可信:

a)數(shù)據(jù)探索:對(duì)海量、多源和異構(gòu)的運(yùn)維數(shù)據(jù),通過查詢、篩選、整合、分析等手段,有效認(rèn)識(shí)

和處理運(yùn)維數(shù)據(jù)的能力。對(duì)于海量、多源和異構(gòu)的運(yùn)維數(shù)據(jù),數(shù)據(jù)探索包括使用查詢工具來檢

索特定的數(shù)據(jù)點(diǎn),應(yīng)用篩選標(biāo)準(zhǔn)來隔離關(guān)鍵性能指標(biāo),整合來自不同來源的數(shù)據(jù)以獲得全面的

視角,以及通過統(tǒng)計(jì)分析來識(shí)別趨勢和異常。這一過程還涉及到對(duì)數(shù)據(jù)的預(yù)處理,如清洗和格

式化,以確保后續(xù)分析的準(zhǔn)確性;

b)特征提煉:對(duì)運(yùn)維數(shù)據(jù)進(jìn)行特征提取、生成、評(píng)估、選擇和提煉的能力,涉及到從原始運(yùn)維數(shù)

據(jù)中提取出對(duì)預(yù)測和分類任務(wù)最有用的信息。包括:

1)特征生成:從時(shí)間序列數(shù)據(jù)中提取趨勢和周期性特征;

2)特征評(píng)估:確定哪些特征對(duì)模型的預(yù)測能力最有價(jià)值;

3)特征選擇:挑選出最重要的特征以供模型訓(xùn)練使用。

c)分析能力:規(guī)則應(yīng)用、模型建立、模型訓(xùn)練的能力,包括規(guī)則的應(yīng)用、模型的建立與訓(xùn)練過程。

規(guī)則應(yīng)用涉及到自動(dòng)化的決策制定,如基于閾值的告警系統(tǒng)。模型建立和訓(xùn)練則是使用歷史數(shù)

據(jù)來構(gòu)建能夠預(yù)測未來事件的數(shù)學(xué)模型;

6

DB15/T4065—2025

d)決策能力:進(jìn)行模型推理,進(jìn)而推動(dòng)科學(xué)決策的能力。模型推理是利用這些模型來分析新的數(shù)

據(jù)點(diǎn),從而為運(yùn)維決策提供支持;

e)可視化:將運(yùn)維對(duì)象及關(guān)聯(lián)關(guān)系、運(yùn)維流程、運(yùn)維活動(dòng)和運(yùn)維管理信息轉(zhuǎn)換成數(shù)字化的圖形或

圖像,并通過多媒體技術(shù)和交互接口,有效展示運(yùn)維信息,實(shí)現(xiàn)人數(shù)交互的能力,包括運(yùn)維對(duì)

象及其關(guān)聯(lián)關(guān)系的圖譜展示、運(yùn)維流程的流程圖、運(yùn)維活動(dòng)的實(shí)時(shí)監(jiān)控圖表以及管理信息的儀

表板。通過多媒體技術(shù)和交互接口,可視化工具幫助運(yùn)維人員快速識(shí)別問題、監(jiān)控性能和理解

復(fù)雜的系統(tǒng)行為;

f)安全可信:在分析決策過程中對(duì)可能影響運(yùn)維場景目標(biāo)實(shí)現(xiàn)的風(fēng)險(xiǎn)加以識(shí)別、評(píng)估和規(guī)避,保

障分析過程和結(jié)果有效的能力,包括識(shí)別可能影響運(yùn)維目標(biāo)實(shí)現(xiàn)的風(fēng)險(xiǎn),如數(shù)據(jù)泄露、錯(cuò)誤配

置或系統(tǒng)故障。對(duì)這些風(fēng)險(xiǎn)進(jìn)行評(píng)估,并通過適當(dāng)?shù)拇胧﹣硪?guī)避,如實(shí)施加密、訪問控制和使

用冗余系統(tǒng)。保障分析過程和結(jié)果的有效性還包括制定和遵循嚴(yán)格的操作標(biāo)準(zhǔn)和流程,幫助用

戶理解和信任模型的決策過程;

g)分析決策能力需設(shè)立可評(píng)估或可量化的指標(biāo),評(píng)估指標(biāo)包括但不限于:

1)數(shù)據(jù)覆蓋率:通過查詢和篩選手段覆蓋的數(shù)據(jù)種類和數(shù)據(jù)量占總運(yùn)維數(shù)據(jù)的百分比;

2)特征相關(guān)性評(píng)分:通過統(tǒng)計(jì)方法或算法評(píng)估提取特征與目標(biāo)變量之間的相關(guān)性,高相關(guān)性

評(píng)分意味著提取的特征對(duì)于分析目標(biāo)具有較高的解釋力;

3)模型準(zhǔn)確率:通過交叉驗(yàn)證等方法評(píng)估模型預(yù)測的準(zhǔn)確度,高準(zhǔn)確率表示模型具有良好的

泛化能力,能夠準(zhǔn)確進(jìn)行推理和決策;

4)規(guī)則應(yīng)用成功率:將規(guī)則應(yīng)用于數(shù)據(jù)時(shí)成功實(shí)現(xiàn)預(yù)期效果的比例,高成功率表明規(guī)則設(shè)置

合理有效;

5)可視化覆蓋率:展示的可視化內(nèi)容占全部運(yùn)維信息的比例,高覆蓋率意味著更全面的展示

運(yùn)維情況;

6)風(fēng)險(xiǎn)識(shí)別率:成功識(shí)別的風(fēng)險(xiǎn)數(shù)量占總風(fēng)險(xiǎn)數(shù)量的比例,高識(shí)別率表明強(qiáng)大的風(fēng)險(xiǎn)識(shí)別能

力。

自動(dòng)控制能力

IT運(yùn)維大模型在自動(dòng)控制能力方面主要包括接入管控、安全管控、過程管控、執(zhí)行管控:

a)接入管控:構(gòu)建連接運(yùn)維對(duì)象或運(yùn)維服務(wù)的通道,實(shí)現(xiàn)控制運(yùn)維對(duì)象或管理服務(wù)調(diào)用的自動(dòng)化

能力,包括:對(duì)應(yīng)用系統(tǒng)、服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)、云資源和基礎(chǔ)環(huán)境等IT資源進(jìn)行管控,保

障自動(dòng)化的操控能力;對(duì)運(yùn)維工具的自動(dòng)化服務(wù)能力進(jìn)行整合及管控,對(duì)外提供統(tǒng)一服務(wù)的能

力;

b)安全管控:通過技術(shù)手段對(duì)用戶身份、用戶權(quán)限、自動(dòng)化任務(wù)進(jìn)行合法性認(rèn)證、合規(guī)性檢查,

并生成滿足監(jiān)管、審計(jì)要求的相關(guān)記錄的能力;

c)過程管控:通過操作、服務(wù)的編排實(shí)現(xiàn)各項(xiàng)運(yùn)維活動(dòng)的串聯(lián)與管控,提升運(yùn)維活動(dòng)效率的能力;

d)執(zhí)行管控:利用自動(dòng)化技術(shù)或手段,安全高效地以自動(dòng)化方式執(zhí)行運(yùn)維操作并驗(yàn)證成果,以及

在異常情況下運(yùn)維人員可對(duì)執(zhí)行活動(dòng)進(jìn)行干預(yù)的能力;

e)自動(dòng)控制能力需設(shè)立可評(píng)估或可量化的指標(biāo),評(píng)估指標(biāo)包括但不限于:

1)自動(dòng)化接口集成成功率:成功創(chuàng)建和維護(hù)自動(dòng)化接口與協(xié)議的比例,確保各種IT資源(如

應(yīng)用系統(tǒng)、服務(wù)器等)能夠無縫接入。通過自動(dòng)化測試和日常運(yùn)維記錄,計(jì)算成功集成的

次數(shù)占總嘗試次數(shù)的比例;

2)服務(wù)響應(yīng)時(shí)間:用戶發(fā)起服務(wù)請求到系統(tǒng)做出響應(yīng)的平均時(shí)間;

3)服務(wù)可用性:通過系統(tǒng)的運(yùn)行時(shí)間記錄,計(jì)算在總時(shí)間內(nèi)服務(wù)可用的比例;

4)身份驗(yàn)證成功率:用戶或自動(dòng)化任務(wù)在進(jìn)行身份驗(yàn)證時(shí),成功通過的比例;

7

DB15/T4065—2025

5)合規(guī)性檢查通過率:自動(dòng)化IT運(yùn)維任務(wù)和用戶操作在符合運(yùn)維政策和監(jiān)管標(biāo)準(zhǔn)方面的合

格率;

6)流程編排效率:通過工具自動(dòng)化編排運(yùn)維活動(dòng)的效率,通常指完成特定任務(wù)所需的時(shí)間;

7)異常處理能力:在運(yùn)維過程中出現(xiàn)異常情況時(shí),系統(tǒng)能夠多快恢復(fù)或通知相關(guān)人員進(jìn)行干

預(yù);

8)業(yè)務(wù)恢復(fù)時(shí)間:在面臨威脅時(shí)恢復(fù)正常業(yè)務(wù)的速度;

9)自動(dòng)化執(zhí)行覆蓋率:通過自動(dòng)化技術(shù)執(zhí)行的運(yùn)維操作占所有運(yùn)維操作的比例;

10)執(zhí)行結(jié)果驗(yàn)證準(zhǔn)確率:自動(dòng)化執(zhí)行后,對(duì)執(zhí)行結(jié)果進(jìn)行驗(yàn)證的準(zhǔn)確率。

7IT運(yùn)維大模型場景實(shí)現(xiàn)

場景分析

場景分析是通過前期調(diào)研和評(píng)估,確定場景構(gòu)建的方案和計(jì)劃,應(yīng)遵守以下要求:

a)明確預(yù)期場景實(shí)現(xiàn)目標(biāo),如提高管理質(zhì)量、降低故障時(shí)間、提升運(yùn)維效能、節(jié)省人力成本、提

升用戶體驗(yàn)等;

b)評(píng)估場景實(shí)現(xiàn)的可行性,包括成本、收益、資源投入等;

c)識(shí)別場景實(shí)現(xiàn)的共性需求,優(yōu)先采用平臺(tái)化建設(shè)思路,避免功能重復(fù)建設(shè);

d)評(píng)估相關(guān)場景對(duì)現(xiàn)狀的影響,如組織、過程、相關(guān)方等,并制定風(fēng)險(xiǎn)應(yīng)對(duì)措施;

e)根據(jù)場景復(fù)雜度、技術(shù)實(shí)現(xiàn)難度、數(shù)據(jù)質(zhì)量情況、資源支持情況、需求緊迫性等,明確場景構(gòu)

建的階段和步驟,混合場景可拆分成多個(gè)單一場景分階段實(shí)現(xiàn);

f)重點(diǎn)評(píng)估數(shù)據(jù)需求,結(jié)合場景特點(diǎn),確定所需數(shù)據(jù)的時(shí)效要求、質(zhì)量要求、數(shù)據(jù)范圍、采集方

法、存儲(chǔ)方式等;

g)重點(diǎn)評(píng)估安全要求,考慮數(shù)據(jù)訪問權(quán)限控制、信息保密、模型修正、失效補(bǔ)償?shù)龋?/p>

h)以合理的顆粒度拆解場景涉及到的具體活動(dòng),可采用列舉、分析、歸納等方法,識(shí)別場景實(shí)現(xiàn)

的運(yùn)維角色、運(yùn)維活動(dòng)、運(yùn)維對(duì)象、智能特征等;

i)基于數(shù)據(jù)管理、分析決策、自動(dòng)控制能力,確定待建設(shè)的能力項(xiàng)和待提升的能力要素;

j)設(shè)立可評(píng)估或可量化的指標(biāo),如故障發(fā)現(xiàn)準(zhǔn)確率、平均故障修復(fù)時(shí)間等;

k)根據(jù)場景分析的結(jié)論,形成場景構(gòu)建方案和計(jì)劃。

場景構(gòu)建

場景構(gòu)建是按既定方案和計(jì)劃開展場景相關(guān)能力建設(shè),應(yīng)遵守以下要求:

a)按照場景構(gòu)建方案和計(jì)劃,研發(fā)、優(yōu)化、建設(shè)相關(guān)能力項(xiàng);

b)根據(jù)具體場景進(jìn)行能力項(xiàng)組合,重點(diǎn)關(guān)注能力項(xiàng)的可復(fù)用性;

c)確保場景構(gòu)建過程可追溯,交付結(jié)果可計(jì)量或可評(píng)估;

d)重點(diǎn)關(guān)注數(shù)據(jù)質(zhì)量和模型運(yùn)行效果;

e)對(duì)于涉及自動(dòng)化和批量操作的場景,增加必要的約束措施,設(shè)計(jì)安全控制點(diǎn)和回退功能;

f)測試和驗(yàn)證關(guān)鍵場景的高可用性,并制定失效補(bǔ)償措施;

g)將規(guī)則知識(shí)、專家經(jīng)驗(yàn)、模型訓(xùn)練結(jié)果等固化到信息系統(tǒng)中;

h)關(guān)注各系統(tǒng)間的數(shù)據(jù)打通和流程聯(lián)動(dòng);

i)場景構(gòu)建需要包含IT運(yùn)維大模型微調(diào)與優(yōu)化部署,滿足IT運(yùn)維大模型相關(guān)能力指標(biāo)要求。

(常見IT運(yùn)維大模型場景說明參見附錄A)

場景交付

8

DB15/T4065—2025

場景交付是場景構(gòu)建完成后進(jìn)行實(shí)施交付及配套活動(dòng),應(yīng)遵守以下要求:

a)按既定計(jì)劃完成場景實(shí)施交付,交付物包括但不限于交付方案、使用手冊、應(yīng)急預(yù)案等;

b)開展培訓(xùn)工作,如場景的使用、運(yùn)維、應(yīng)急處理等;

c)開展試點(diǎn)和推廣工作;

d)開展測試驗(yàn)收工作;

e)開展關(guān)鍵指標(biāo)適配、調(diào)優(yōu)工作,如資源交付的效率、根因定位的準(zhǔn)確率等。

評(píng)估方法

場景交付后需評(píng)估是否達(dá)到預(yù)期效果,并設(shè)定下階段迭代目標(biāo),應(yīng)遵守以下要求:

a)建立評(píng)估機(jī)制,組織相關(guān)方開展效果評(píng)估;

b)評(píng)估已建場景是否滿足既定目標(biāo),對(duì)未達(dá)目標(biāo)或指標(biāo)的情況開展原因分析;

c)與利益相關(guān)者建立順暢的溝通渠道,對(duì)意見做好收集與反饋;

d)評(píng)估已建場景是否滿足運(yùn)維相關(guān)安全要求;

e)制定改進(jìn)措施和提升計(jì)劃,并持續(xù)改進(jìn)、快速迭代。

9

DB15/T4065—2025

A

A

附錄A

(資料性)

常見IT運(yùn)維大模型場景說明

在IT運(yùn)維大模型場景實(shí)現(xiàn)過程中,宜從實(shí)際出發(fā),立足當(dāng)前運(yùn)維痛點(diǎn),從場景切入,由點(diǎn)到面進(jìn)行IT

運(yùn)維大模型體系建設(shè),并通過設(shè)立評(píng)價(jià)指標(biāo)對(duì)實(shí)施效果進(jìn)行測量,確保已建場景滿足既定運(yùn)維目標(biāo)并有

效體現(xiàn)大模型特征。本附錄選取和描述了常見IT運(yùn)維大模型場景,說明見表A.1。

表A.1常見IT運(yùn)維大模型場景說明

B場景描述關(guān)鍵指標(biāo)智能特征目標(biāo)

該場景通過超文本傳輸協(xié)議(HTTP)請

求、傳輸控制協(xié)議/網(wǎng)際協(xié)議(TCP/IP)

應(yīng)用系統(tǒng)異常撥測率

應(yīng)用系統(tǒng)異請求、應(yīng)用系統(tǒng)應(yīng)用程序編程接口

=撥測發(fā)現(xiàn)異常對(duì)象會(huì)診斷

常撥測(API)請求等不同形式,對(duì)應(yīng)用系統(tǒng)運(yùn)

數(shù)/總異常對(duì)象數(shù)

行狀態(tài)進(jìn)行自動(dòng)撥測,根據(jù)響應(yīng)結(jié)果發(fā)

現(xiàn)異常并告警

該場景通過自動(dòng)化方式對(duì)系統(tǒng)、中間

快速處置率=處置對(duì)

快速處置件、數(shù)據(jù)庫、應(yīng)用系統(tǒng)等運(yùn)維對(duì)象執(zhí)行自執(zhí)行

象數(shù)/總對(duì)象數(shù)

啟停、切換等便捷操作

該場景通過算法或規(guī)則,將無效和重復(fù)

告警聚合率=1-聚合

告警聚合等相同原因觸發(fā)的告警合并為一個(gè)告會(huì)診斷質(zhì)量可靠:

后告警數(shù)/總告警數(shù)

警在事前、事中、事后

該場景通過實(shí)時(shí)海量數(shù)據(jù)處理、非結(jié)構(gòu)的各方面,有效提高

能感知、可決

化數(shù)據(jù)識(shí)別、數(shù)據(jù)關(guān)系挖掘等方式,對(duì)故障自愈率=自愈故運(yùn)維服務(wù)對(duì)象的運(yùn)行

故障自愈策、會(huì)診斷、自

故障場景特征精準(zhǔn)識(shí)別,并自動(dòng)調(diào)用預(yù)障數(shù)/總故障數(shù)穩(wěn)定性和可靠性

執(zhí)行

設(shè)的應(yīng)急動(dòng)作,實(shí)現(xiàn)業(yè)務(wù)的快速恢復(fù)

該場景通過實(shí)時(shí)收集運(yùn)維對(duì)象的業(yè)務(wù)異常發(fā)現(xiàn)準(zhǔn)確率=有

交易量、成功率、耗時(shí)、系統(tǒng)性能、日效告警數(shù)/總告警數(shù);自適應(yīng)、自學(xué)

異常發(fā)現(xiàn)志等數(shù)據(jù),利用機(jī)器學(xué)習(xí)訓(xùn)練歷史數(shù)據(jù)異常發(fā)現(xiàn)漏報(bào)率=(應(yīng)習(xí)、能感知、會(huì)

運(yùn)行模型,實(shí)時(shí)檢測運(yùn)行數(shù)據(jù),實(shí)現(xiàn)快告警數(shù)-有效告警診斷

速發(fā)現(xiàn)運(yùn)維對(duì)象的運(yùn)行異常狀態(tài)數(shù))/應(yīng)告警數(shù)

故障影響分析準(zhǔn)確率

該場景通過綜合分析業(yè)務(wù)、應(yīng)用系統(tǒng)間

故障影響分=影響范圍分析正確可決策、會(huì)描

依賴關(guān)系和配置數(shù)據(jù),實(shí)現(xiàn)快速準(zhǔn)確地

析的故障數(shù)量/故障總述

推斷某個(gè)故障的影響范圍和程度

數(shù)

10

DB15/T4065—2025

表A.1常見IT運(yùn)維大模型場景說明(續(xù))

場景名稱場景描述關(guān)鍵指標(biāo)智能特征目標(biāo)

該場景通過排障決策樹、對(duì)象關(guān)聯(lián)圖故障根因定位準(zhǔn)確率

譜、故障傳播影響分析等方式,實(shí)現(xiàn)對(duì)=準(zhǔn)確推薦根因故障能感知、可決

故障根因定版本變更、業(yè)務(wù)參數(shù)調(diào)整、代碼邏輯或數(shù)/總推薦根因故障策、會(huì)診斷、自

位基礎(chǔ)設(shè)施故障帶來的各種大規(guī)模、并發(fā)數(shù);故障根因定位覆學(xué)習(xí)、自適應(yīng)、

異常告警進(jìn)行根因分析定位和根因故蓋率=準(zhǔn)確推薦根因會(huì)描述

障推薦故障數(shù)/總故障數(shù)

該場景通過收集和處理運(yùn)維對(duì)象歷史質(zhì)量可靠:

運(yùn)行數(shù)據(jù)和故障數(shù)據(jù),建立不同技術(shù)領(lǐng)在事前、事中、事后的

故障預(yù)測準(zhǔn)確率=準(zhǔn)自學(xué)習(xí)、會(huì)診

故障預(yù)測域的故障模型,提取故障特征,歸納故各方面,有效提高運(yùn)

確預(yù)測數(shù)/總預(yù)測數(shù)斷

障演化規(guī)律,實(shí)現(xiàn)對(duì)運(yùn)維對(duì)象運(yùn)行趨勢維服務(wù)對(duì)象的運(yùn)行穩(wěn)

的動(dòng)態(tài)預(yù)測定性和可靠性

該場景通過自動(dòng)收集運(yùn)維對(duì)象信息,如

性能數(shù)據(jù)、狀態(tài)數(shù)據(jù)、技術(shù)數(shù)據(jù)和日志

健康檢查覆蓋率=自能感知、會(huì)描

數(shù)據(jù)等,利用同類運(yùn)維對(duì)象的橫向比

健康檢查動(dòng)健康檢查運(yùn)維對(duì)象述、可決策、會(huì)

較、歷史數(shù)據(jù)分布比較、最佳實(shí)踐基線

數(shù)/總運(yùn)維對(duì)象診斷、自執(zhí)行

比較等方式,實(shí)現(xiàn)精準(zhǔn)、快速、全方位

地評(píng)估運(yùn)維對(duì)象健康度

通過采用軟件定義網(wǎng)絡(luò)(SDN)技術(shù)架

構(gòu),對(duì)網(wǎng)絡(luò)資源統(tǒng)一調(diào)度、集中管理、

網(wǎng)絡(luò)堵塞年度減少次

智能網(wǎng)絡(luò)負(fù)實(shí)時(shí)計(jì)算,實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)的快速轉(zhuǎn)發(fā)、會(huì)診斷、自執(zhí)成本降低:

數(shù)=上一年度發(fā)生數(shù)-

載高效傳輸,并根據(jù)網(wǎng)絡(luò)質(zhì)量智能選路、行在基礎(chǔ)設(shè)施、應(yīng)用系

本年度發(fā)生數(shù)

業(yè)務(wù)路徑調(diào)優(yōu),充分利用網(wǎng)絡(luò)資源,降統(tǒng)等運(yùn)維領(lǐng)域(資源)

低使用成本方面,有效降低服務(wù)

該場景利用軟件機(jī)器人,根據(jù)運(yùn)維工單對(duì)象的運(yùn)行和管理成

工單自動(dòng)化率=自動(dòng)

運(yùn)維工單流流程,以更快的速度、更高的準(zhǔn)確率實(shí)本

化工單流程的數(shù)量/自執(zhí)行

程自動(dòng)化現(xiàn)運(yùn)維工單自動(dòng)化填寫等操作,有效代

運(yùn)維工單流程的總數(shù)

替人工并降低成本

11

DB15/T4065—2025

表A.1常見IT運(yùn)維大模型場景說明(續(xù))

場景名稱場景描述關(guān)鍵指標(biāo)智能特征目標(biāo)

在云環(huán)境下,對(duì)一組或多組資源指標(biāo)進(jìn)

行有效監(jiān)控,根據(jù)資源使用情況進(jìn)行動(dòng)

態(tài)伸縮,當(dāng)資源不足時(shí),利用資源分配

算法動(dòng)態(tài)調(diào)度部署節(jié)點(diǎn),并加入到當(dāng)前資源調(diào)整自動(dòng)化率=能感知、自學(xué)

資源彈性伸

的運(yùn)行環(huán)境,當(dāng)資源利用率很低時(shí),能自動(dòng)化調(diào)整資源次數(shù)習(xí)、可決策、自

回收資源,避免資源的浪費(fèi),如數(shù)據(jù)庫/總調(diào)整資源次數(shù)執(zhí)行、自適應(yīng)

擴(kuò)容、私有云的動(dòng)態(tài)伸縮、文件系統(tǒng)、

內(nèi)存、中央處理器(CPU)等動(dòng)態(tài)擴(kuò)容或

收縮等

該場景通過實(shí)時(shí)或定期自動(dòng)收集CPU、

I/O、內(nèi)存、日志信息等應(yīng)用系統(tǒng)性能應(yīng)用系統(tǒng)性能預(yù)測準(zhǔn)能感知、自學(xué)

應(yīng)用系統(tǒng)性

相關(guān)數(shù)據(jù),利用相關(guān)模型及算法,對(duì)應(yīng)確率=準(zhǔn)確預(yù)測數(shù)/總習(xí)、可決策、自

能預(yù)測成本降低:

用系統(tǒng)性能消耗資源進(jìn)行精準(zhǔn)預(yù)測,實(shí)預(yù)測數(shù)執(zhí)行、自適應(yīng)

在基礎(chǔ)設(shè)施、應(yīng)用系

現(xiàn)資源合理劃分,降低運(yùn)行成本

統(tǒng)等運(yùn)維領(lǐng)域(資源)

不同應(yīng)用服務(wù)資源消耗偏好不一樣(包

方面,有效降低服務(wù)

括計(jì)算密集型、內(nèi)存密集型、I/O密集

對(duì)象的運(yùn)行和管理成

型等等),同一應(yīng)用服務(wù)在不同時(shí)間資應(yīng)用混合部署自動(dòng)化

能感知、自學(xué)本

應(yīng)用智能混源消耗也不一樣,不加區(qū)分的同比例資率=自動(dòng)化混合部署

習(xí)、可決策、自

合部署源分配會(huì)造成部分資源的閑置浪費(fèi)。通次數(shù)/總混合部署次

執(zhí)行、自適應(yīng)

過智能計(jì)算和預(yù)測將不同資源類型的數(shù)

服務(wù)自動(dòng)在同一主機(jī)上混合部署,能有

效提高主機(jī)各方面資源的綜合利用率

通過智能運(yùn)維對(duì)機(jī)房能耗進(jìn)行優(yōu)化,綜

合監(jiān)控、日志、環(huán)境等數(shù)據(jù)建立模型,

實(shí)時(shí)數(shù)據(jù)進(jìn)行迭代,通過大模型算法對(duì)能感知、自學(xué)

機(jī)房能耗智

能耗進(jìn)行分析,對(duì)電能利用效率(PUE)PUE下降百分比習(xí)、可決策、自

能優(yōu)化

進(jìn)行預(yù)測并智能生成優(yōu)化方案,降低非執(zhí)行、自適應(yīng)

計(jì)算方面的能耗,從而降低數(shù)據(jù)中心整

體運(yùn)行PUE,實(shí)現(xiàn)綠色數(shù)據(jù)中心

12

DB15/T4065—2025

表A.1常見IT運(yùn)維大模型場景說明(續(xù))

場景名稱場景描述關(guān)鍵指標(biāo)智能特征目標(biāo)

自動(dòng)化巡檢能將硬件狀態(tài)、設(shè)備負(fù)載、

系統(tǒng)時(shí)間、磁盤空間、線路流量、數(shù)據(jù)日常巡檢自動(dòng)化率=

日常巡檢自

庫表空間使用率、網(wǎng)絡(luò)設(shè)備端口狀態(tài)、自動(dòng)巡檢任務(wù)數(shù)/總自執(zhí)行

動(dòng)化

流量等進(jìn)行自動(dòng)巡檢,并形成符合要求巡檢任務(wù)數(shù)

的巡檢報(bào)告

通過向客戶端下發(fā)備份副本、配置信

息、環(huán)境參數(shù),備份業(yè)務(wù)數(shù)據(jù),并停止客

戶端應(yīng)用服務(wù),然后批量自動(dòng)下發(fā)新版軟件分發(fā)配置自動(dòng)化

軟件分發(fā)配本的安裝配置文件、動(dòng)態(tài)鏈接庫(DLL)率=自動(dòng)化分發(fā)的運(yùn)

自執(zhí)行

置自動(dòng)化文件等,最后啟動(dòng)客戶端應(yīng)用服務(wù),對(duì)維對(duì)象數(shù)量/運(yùn)維對(duì)

應(yīng)用系統(tǒng)的服務(wù)狀態(tài)與相關(guān)日志信息象總數(shù)

進(jìn)行檢查,以確認(rèn)軟件分發(fā)和配置工作

自動(dòng)部署、灰度發(fā)布成功完成效率提升:

機(jī)器人巡檢準(zhǔn)確率=有效提高各運(yùn)維行為

該場景利用多傳感器融合、軟件探測和正確巡檢隱患數(shù)量/的時(shí)效性和準(zhǔn)確性

能感知、會(huì)診

服務(wù)編排等技術(shù),對(duì)運(yùn)維對(duì)象定期巡實(shí)際隱患數(shù)量;機(jī)器

機(jī)器人巡檢斷、可決策、自

檢,根據(jù)規(guī)則判定并給出巡檢結(jié)果,提人巡檢自動(dòng)化率=機(jī)

執(zhí)行

升工作效率器完成的巡檢任務(wù)數(shù)

/需完成的總?cè)蝿?wù)數(shù)

該場景通過文本識(shí)別、圖像識(shí)別、語音知識(shí)檢索率=被檢索能感知、會(huì)描

運(yùn)維知識(shí)庫

識(shí)別、知識(shí)圖譜等技術(shù),實(shí)現(xiàn)運(yùn)維知識(shí)使用的知識(shí)條目數(shù)/述、自學(xué)習(xí)、可

智能應(yīng)用

檢索、推薦、歸納、展示等知識(shí)總條目數(shù)決策

該場景通過利用自動(dòng)化腳本、自動(dòng)化流

能感知、可決

程、智能算法對(duì)運(yùn)維活動(dòng)中大量重復(fù)、智能作業(yè)調(diào)度準(zhǔn)確率

智能作業(yè)調(diào)策、會(huì)診斷、自

復(fù)雜的作業(yè)進(jìn)行智能化編排,實(shí)現(xiàn)作業(yè)=完成作業(yè)正確數(shù)/作

度執(zhí)行、自適應(yīng)、

時(shí)間短、質(zhì)量高、資源利用均衡等目標(biāo),業(yè)執(zhí)行息數(shù)

自學(xué)習(xí)

降低運(yùn)維人員壓力,提升運(yùn)維服務(wù)效能

13

DB15/T4065—2025

表A.1常見IT運(yùn)維大模型場景說明(續(xù))

場景名稱場景描述關(guān)鍵指標(biāo)智能特征目標(biāo)

威脅IP檢測準(zhǔn)確率識(shí)

該場景根據(jù)制定的規(guī)則,自動(dòng)化快速識(shí)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論