中小企業(yè)大模型應(yīng)用架構(gòu)設(shè)計技術(shù)規(guī)范:總則_第1頁
中小企業(yè)大模型應(yīng)用架構(gòu)設(shè)計技術(shù)規(guī)范:總則_第2頁
中小企業(yè)大模型應(yīng)用架構(gòu)設(shè)計技術(shù)規(guī)范:總則_第3頁
中小企業(yè)大模型應(yīng)用架構(gòu)設(shè)計技術(shù)規(guī)范:總則_第4頁
中小企業(yè)大模型應(yīng)用架構(gòu)設(shè)計技術(shù)規(guī)范:總則_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

4

中小企業(yè)大模型應(yīng)用架構(gòu)設(shè)計技術(shù)規(guī)范總則

1范圍

本文件規(guī)定了中小企業(yè)大模型應(yīng)用架構(gòu)設(shè)計的總體原則、應(yīng)用架構(gòu)、部署模式及安全與合規(guī)要求,建立了包括設(shè)備層、數(shù)據(jù)層、模型層、工具層和應(yīng)用層在內(nèi)的架構(gòu)體系,適用于指導中小企業(yè)在現(xiàn)有信息系統(tǒng)基礎(chǔ)上引入大模型能力,構(gòu)建具備智能體能力的企業(yè)級人工智能應(yīng)用體系。

本文件適用于具備—定數(shù)字化基礎(chǔ)、已建設(shè)或正在建設(shè)信息化系統(tǒng)的中小企業(yè),不適用于尚未開展數(shù)字化建設(shè)的企業(yè)。

本文件適用于中小企業(yè)基于通用大模型、行業(yè)大模型等構(gòu)建智能體應(yīng)用系統(tǒng)的總體架構(gòu)設(shè)計,也適用于相關(guān)平臺提供方、集成服務(wù)商及工具服務(wù)商的系統(tǒng)設(shè)計與交付參考。

本文件適用于制造型、服務(wù)型、商貿(mào)型等各類中小企業(yè)的大模型應(yīng)用架構(gòu)設(shè)計工作,對大型企業(yè)在相關(guān)系統(tǒng)建設(shè)中亦具—定參考和借鑒意義。

本文件不涉及具體大模型的預(yù)訓練、微調(diào)方法及底層算力配置等內(nèi)容。

2規(guī)范性引用文件

下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。

GB/T35273信息安全技術(shù)—個人信息安全規(guī)范

GB/T36073數(shù)據(jù)管理能力成熟度評估模型

GB/T41479信息安全技術(shù)網(wǎng)絡(luò)數(shù)據(jù)處理安全要求

GB/T41867信息技術(shù)人工智能術(shù)語

GB/T42016信息安全技術(shù)—網(wǎng)絡(luò)音視頻服務(wù)數(shù)據(jù)安全要求

GB/T42018信息技術(shù)人工智能平臺計算資源規(guī)范

GB/T42755人工智能面向機器學習的數(shù)據(jù)標注規(guī)程

GB/T42888信息安全技術(shù)機器學習算法安全評估規(guī)范

GB/T45288.1人工智能大模型第1部分:通用要求

GB/T9813.3計算機通用規(guī)范第3部分:服務(wù)器

GB/T33863.8OPC統(tǒng)—架構(gòu)第8部分:數(shù)據(jù)訪問

ISO/IEC27001信息技術(shù)安全技術(shù)信息安全管理體系要求

ISO/IEC20546信息技術(shù)大數(shù)據(jù)概述與術(shù)語

ISO/IEC5338信息技術(shù)人工智能模型運營框架

ISO/IEC20546,Informationtechnology—Bigdata

3術(shù)語和定義

GB/T41867—2022界定的以及下列術(shù)語和定義適用于本文件。

3.1

大模型Largemodel

基于大量數(shù)據(jù)訓練得到、具有復雜計算架構(gòu)、能處理復雜任務(wù)且具備—定泛化性的深度學習模型。

3.2

垂類大模型Verticaldomainlargemodel

5

基于基礎(chǔ)大模型,在特定行業(yè)或領(lǐng)域語料上進行增量訓練、微調(diào)或知識增強而形成的大模型,具備行業(yè)知識理解、場景推理和專業(yè)任務(wù)執(zhí)行能力。

3.3

中小企業(yè)Smallandmedium-sizedenterprises,SMEs

依據(jù)《中小企業(yè)劃型標準規(guī)定》(工信部聯(lián)企業(yè)〔2011〕300號)界定,指在人員規(guī)模、營業(yè)收入或資產(chǎn)總額等方面未達到大型企業(yè)標準的法人企業(yè)單位。

3.4

結(jié)構(gòu)化數(shù)據(jù)Structureddata

以固定模式或預(yù)定義格式組織的數(shù)據(jù),通常存儲于關(guān)系型數(shù)據(jù)庫或表格中,具有明確的字段定義和數(shù)據(jù)類型,可通過標準查詢語言(如SQL等)進行處理與分析。

3.5

非結(jié)構(gòu)化數(shù)據(jù)Unstructureddata

不具備固定格式或預(yù)定義模式的數(shù)據(jù)類型,包括文本、圖像、音頻、視頻、文檔、日志等形式,需通過特征提取、向量化等方法進行處理以供模型識別和應(yīng)用。

3.6

智能體Agent

基于大模型構(gòu)建的自治智能系統(tǒng),能夠感知環(huán)境、規(guī)劃任務(wù)、調(diào)用工具并執(zhí)行操作,具備自我反思與多輪迭代能力,可在復雜場景中完成特定目標任務(wù)。

注:智能體通常具備任務(wù)規(guī)劃、工具調(diào)用、上下文管理等能力,支持多輪交互和自我優(yōu)化。

3.7

智能體開發(fā)工具Agentdevelopmenttools

用于構(gòu)建、配置、調(diào)度和部署智能體的軟件工具平臺,支持模型接入、對話流程設(shè)計、上下文管理、插件調(diào)用、工作流編排等功能。

3.8

應(yīng)用架構(gòu)Applicationarchitecture

構(gòu)建大模型應(yīng)用系統(tǒng)時,在企業(yè)現(xiàn)有信息系統(tǒng)基礎(chǔ)上設(shè)計的系統(tǒng)結(jié)構(gòu),包括模型接入方式、數(shù)據(jù)交互路徑、服務(wù)部署方式和功能組件劃分等內(nèi)容。

3.9

私有化部署On-premisedeployment

將大模型及其應(yīng)用系統(tǒng)部署在企業(yè)本地計算和存儲資源中的方式。

3.10

公有云部署Public-clouddeployment

通過云服務(wù)平臺以API等形式提供大模型能力的部署方式。

3.11

混合部署Hybriddeployment

結(jié)合私有化部署與公有云部署,將不同模塊分別部署在本地與云端的架構(gòu)方式。

3.12

數(shù)據(jù)治理Datagovernance

圍繞數(shù)據(jù)采集、清洗、標注、存儲、權(quán)限、安全與合規(guī)等環(huán)節(jié)建立的數(shù)據(jù)管理機制。

6

3.13

數(shù)據(jù)管理Datamanagement

對數(shù)據(jù)從采集、集成、處理、存儲、使用到歸檔、銷毀等全過程的管理活動。

3.14

嵌入/檢索模型Embeddingmodel

用于將文本、圖像等非結(jié)構(gòu)化信息轉(zhuǎn)換為向量形式,以支持語義檢索、分類、聚類等操作。

3.15

檢索增強生成Retrieval-augmentedgeneration

—種結(jié)合向量檢索與大模型生成能力的技術(shù),通過檢索相關(guān)知識片段并作為上下文輸入,提升生成內(nèi)容的準確性和可信度。

3.16

CMMLU-SMEs數(shù)據(jù)集Cmmlu-smesdataset

—個用于評估中小企業(yè)大模型應(yīng)用性能的測試集,涵蓋制造、服務(wù)、商貿(mào)三行業(yè)的多輪對話和推理任務(wù)。

4縮略語

下列縮略語適用于本文件。

——AI:人工智能(ArtificialIntelligence)

——API:應(yīng)用程序編程接口(ApplicationProgrammingInterface)

——A2A:智能體間協(xié)同(AgenttoAgent)

——LLM:大語言模型(LargeLanguageModel)

——MaaS:模型即服務(wù)(ModelAsaService)

——MCP:模型上下文協(xié)議(ModelContextProtocol)

——RAG:檢索增強生成(Retrieval-AugmentedGeneration)

——SaaS:軟件即服務(wù)(SoftwareAsaService)

——SMEs:中小企業(yè)(SmallandMedium-sizedEnterprises)

5總體架構(gòu)

5.1架構(gòu)設(shè)計原則

a)靈活性:架構(gòu)設(shè)計應(yīng)基于通用標準和規(guī)范,具備良好的模塊化和擴展能力,支持不同類型的大模型與智能體的接入、升級與替換,并能夠適應(yīng)企業(yè)業(yè)務(wù)變化與技術(shù)更新。

b)輕量化:架構(gòu)實現(xiàn)時應(yīng)充分考慮中小企業(yè)資金和技術(shù)資源的現(xiàn)實限制,避免過度復雜的設(shè)計,降低部署門檻。

c)集成性:架構(gòu)設(shè)計應(yīng)強調(diào)智能體與企業(yè)現(xiàn)有信息化系統(tǒng)的兼容性和集成性,確保新系統(tǒng)快速融入企業(yè)業(yè)務(wù)流程。

d)合規(guī)性:應(yīng)滿足國家信息安全相關(guān)法律法規(guī)和標準要求,確保企業(yè)數(shù)據(jù)安全、模型使用合規(guī)。應(yīng)用架構(gòu)總覽

中小企業(yè)大模型應(yīng)用架構(gòu)如圖1所示,包括設(shè)備層、數(shù)據(jù)層、模型層、工具層、應(yīng)用層。具體如下:

7

圖1中小企業(yè)大模型應(yīng)用架構(gòu)

a)設(shè)備層:包含感知/采集設(shè)備、算力設(shè)備、信息傳輸設(shè)備、應(yīng)用與展示設(shè)備。設(shè)備層負責數(shù)據(jù)采集與算力支撐,是中小企業(yè)大模型應(yīng)用的物理基礎(chǔ),為數(shù)據(jù)治理與模型運行提供可靠輸入。

b)數(shù)據(jù)層:包含數(shù)據(jù)治理、數(shù)據(jù)管理。數(shù)據(jù)層是支撐大模型高質(zhì)量運行的關(guān)鍵環(huán)節(jié),能夠保障數(shù)據(jù)的安全性、完整性與可用性,為模型提供可信數(shù)據(jù)底座。

c)模型層:包含基礎(chǔ)大模型、行業(yè)垂類大模型、嵌入/檢索模型、企業(yè)知識庫。模型層負責大模型能力的集中供給和服務(wù)管理,提供多模型能力的注冊、調(diào)用、更新服務(wù),實現(xiàn)大模型資源可復用、可拓展、可管理的目標。

d)工具層:包含智能體應(yīng)用工具、傳統(tǒng)IT工具、模型訓推工具。工具層負責模型能力落地的工程化實現(xiàn),通過結(jié)合智能體開發(fā)工具、傳統(tǒng)IT工具和模型訓推工具,實現(xiàn)工具調(diào)用、模型調(diào)用、任務(wù)編排、運維監(jiān)控、模型微調(diào)、模型推理等功能。

e)應(yīng)用層:包含智能體應(yīng)用、信息化系統(tǒng)。應(yīng)用層是大模型能力與中小企業(yè)實際使用場景融合的直接體現(xiàn),支持企業(yè)在現(xiàn)有信息化系統(tǒng)基礎(chǔ)上,實現(xiàn)對經(jīng)營、生產(chǎn)、管理、研發(fā)等環(huán)節(jié)的智能升級。

6設(shè)備層

6.1感知/采集設(shè)備

感知/采集設(shè)備用于獲取業(yè)務(wù)運行、文檔資料、環(huán)境感知等多源數(shù)據(jù),是大模型應(yīng)用的數(shù)據(jù)輸入來源。感知/采集設(shè)備宜包含但不限于如下部分內(nèi)容:

a)文檔與知識采集:包括高速掃描儀、高拍儀、移動采集終端等;宜具備文檔掃描、圖像采集與OCR/版式解析能力,并能夠?qū)⒉杉瘍?nèi)容以便于后續(xù)結(jié)構(gòu)化處理或向量化處理的格式進行輸出;

b)業(yè)務(wù)終端采集:包括手持終端、PDA、移動巡檢/點檢設(shè)備等;宜支持設(shè)備標識管理、基本時間同步機制和元數(shù)據(jù)上送能力,支持通過標準化接口將采集數(shù)據(jù)納入企業(yè)數(shù)據(jù)目錄或數(shù)據(jù)管理系統(tǒng);

c)工業(yè)與物聯(lián)感知:包括傳感器、攝像設(shè)備、音頻采集設(shè)備、條碼/RFID裝置、智能儀表等;應(yīng)通過標準化接口或數(shù)據(jù)采集網(wǎng)關(guān)輸出可處理的數(shù)據(jù)格式(包括結(jié)構(gòu)化、半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)

8

據(jù)),并應(yīng)支持穩(wěn)定的數(shù)據(jù)采集、基本數(shù)據(jù)校驗和數(shù)據(jù)上送能力,以保障后續(xù)分析、處理與模型應(yīng)用的可靠性。

6.2算力設(shè)備

算力設(shè)備宜包含但不限于如下內(nèi)容,并應(yīng)根據(jù)企業(yè)業(yè)務(wù)規(guī)模、大模型推理需求和部署模式進行合理配置。算力設(shè)備的功能要求和資源配置應(yīng)滿足GB/T42018的相關(guān)規(guī)定:

a)邊緣節(jié)點:包括DIN-Rail工業(yè)服務(wù)器、AI盒子等,宜配置具備模型推理能力的處理器(如GPU、NPU);其計算能力、存儲能力及散熱能力應(yīng)能夠支撐企業(yè)在本地開展的小規(guī)模模型推理任務(wù)。;

b)中心服務(wù)器:包括機架式GPU服務(wù)器、CPU集群等,應(yīng)支持Docker/Kubernetes等容器化和編排能力;網(wǎng)絡(luò)互聯(lián)能力應(yīng)滿足模型服務(wù)調(diào)度、高并發(fā)訪問與多節(jié)點協(xié)同的要求;系統(tǒng)整體性能應(yīng)滿足企業(yè)模型推理、訓練或調(diào)度的業(yè)務(wù)需求;

c)專用加速器:包括FPGA、ASIC推理卡等,適用于低功耗、低時延的本地推理場景;其算力性能、能效比及接口兼容性應(yīng)滿足企業(yè)部署在嵌入式設(shè)備上的推理需求;相關(guān)配置與管理要求應(yīng)滿足GB/T420186.3的規(guī)定。

6.3信息傳輸設(shè)備

信息傳輸設(shè)備用于保障數(shù)據(jù)在設(shè)備層、數(shù)據(jù)層、模型層和應(yīng)用層之間的安全、可靠和高效傳輸。信息傳輸設(shè)備宜包含但不限于如下部分內(nèi)容:

a)網(wǎng)絡(luò)與安全設(shè)備:包括工業(yè)交換機、5G/TSN網(wǎng)關(guān)、工業(yè)防火墻等;應(yīng)支持零信任接入和安全認證機制,網(wǎng)絡(luò)通信加密方式應(yīng)滿足國家網(wǎng)絡(luò)數(shù)據(jù)安全相關(guān)要求,并滿足GB/T41479的規(guī)定;

b)環(huán)境與能耗監(jiān)測設(shè)備:包括能耗計量表、碳排傳感器、溫濕度/粉塵/噪聲采集模塊等;應(yīng)具備數(shù)據(jù)自動采集、校準與上送能力,數(shù)據(jù)質(zhì)量、穩(wěn)定性和測量精度應(yīng)滿足能耗監(jiān)測、碳排管理等業(yè)務(wù)需求;

c)邊緣算力租用:中小企業(yè)可通過電信運營商MEC(邊緣計算)平臺接入邊緣算力資源;相關(guān)網(wǎng)絡(luò)接入設(shè)備應(yīng)滿足安全通信、穩(wěn)定連接及低時延傳輸?shù)囊?,并?yīng)支持本地算力與外部算力資源之間的協(xié)同調(diào)度;網(wǎng)絡(luò)與數(shù)據(jù)交互方式應(yīng)滿足GB/T41479的要求。

6.4應(yīng)用與展示設(shè)備

應(yīng)用與展示設(shè)備用于支持業(yè)務(wù)人員與系統(tǒng)進行可視化交互、信息瀏覽與現(xiàn)場協(xié)同操作。應(yīng)用與展示設(shè)備宜包含但不限于如下部分內(nèi)容:

a)輔助終端:包括AR眼鏡、工業(yè)平板、看板大屏等;應(yīng)支持數(shù)據(jù)可視化展示、人機協(xié)同操作和現(xiàn)場任務(wù)指引等功能,顯示性能和交互能力應(yīng)滿足企業(yè)業(yè)務(wù)場景的應(yīng)用需求。

b)顯示與交互設(shè)備:宜具備穩(wěn)定的圖形渲染能力與實時交互能力,支持多種數(shù)據(jù)展示方式,并可通過標準化通信接口實現(xiàn)大模型推理結(jié)果、狀態(tài)信息及告警信息的及時呈現(xiàn)。

7數(shù)據(jù)層

7.1數(shù)據(jù)治理

a)策略與組織:宜建立數(shù)據(jù)治理策略、職責分工與管理流程,明確數(shù)據(jù)分類分級規(guī)則、權(quán)限管理機制及責任主體;

b)數(shù)據(jù)標準與元數(shù)據(jù):宜制定數(shù)據(jù)標準體系,統(tǒng)—編碼規(guī)則、數(shù)據(jù)口徑與主數(shù)據(jù)管理要求;宜建設(shè)企業(yè)級元數(shù)據(jù),建立元數(shù)據(jù)采集、更新、維護與使用機制;

c)數(shù)據(jù)質(zhì)量與安全:宜建立數(shù)據(jù)質(zhì)量管理制度,包括數(shù)據(jù)質(zhì)量規(guī)則、質(zhì)量評估與改進流程;涉及個人信息或網(wǎng)絡(luò)數(shù)據(jù)處理的,應(yīng)滿足GB/T35273和GB/T41479的相關(guān)規(guī)定;

d)資產(chǎn)目錄與共享:宜建立數(shù)據(jù)目錄或數(shù)據(jù)資產(chǎn)臺賬,用于記錄數(shù)據(jù)資產(chǎn)的來源、結(jié)構(gòu)、責任主體和使用范圍;對外共享或開放數(shù)據(jù)接口時,應(yīng)建立審批流程,并根據(jù)數(shù)據(jù)類型和敏感度采取必要的訪問控制、水印標識或脫敏保護措施。

7.2數(shù)據(jù)管理

9

a)采集與同步:應(yīng)支持網(wǎng)關(guān)/OPCUA、消息隊列、API、文件批導等多源采集方式;

b)集成與處理:宜具備數(shù)據(jù)清洗、融合、脫敏處理能力,并可根據(jù)業(yè)務(wù)需求完成結(jié)構(gòu)化、半結(jié)構(gòu)化或向量化轉(zhuǎn)換;數(shù)據(jù)轉(zhuǎn)換規(guī)則、版本及數(shù)據(jù)血緣關(guān)系應(yīng)實現(xiàn)記錄與可追溯;

c)時序數(shù)據(jù)管理:宜建立針對工業(yè)監(jiān)測、設(shè)備運行、能耗及環(huán)境感知等場景的時序數(shù)據(jù)管理機制,支持基于時間窗口的聚合分析與異常檢測;

d)存儲與檢索:宜根據(jù)數(shù)據(jù)特性選擇關(guān)系型數(shù)據(jù)庫、時序數(shù)據(jù)庫、對象存儲、向量數(shù)據(jù)庫等多類型存儲方式;宜提供統(tǒng)—的檢索接口與數(shù)據(jù)服務(wù)編排能力;

e)備份與恢復:宜制定數(shù)據(jù)備份、容災(zāi)與恢復策略,保障系統(tǒng)在異常情況下具備可恢復能力,并與平臺資源管理機制協(xié)同運行。

7.2.1結(jié)構(gòu)化數(shù)據(jù)

結(jié)構(gòu)化數(shù)據(jù)包括生產(chǎn)數(shù)據(jù)、運營數(shù)據(jù)、業(yè)務(wù)流程數(shù)據(jù)、財務(wù)數(shù)據(jù)、設(shè)備運行數(shù)據(jù)、客戶交易數(shù)據(jù)等,包括但不限于訂單、合同、財務(wù)臺賬、CRM記錄、庫存、工藝配方、工單、設(shè)備點檢、質(zhì)量監(jiān)測、能耗、PLC采樣流、MES事件消息等。

結(jié)構(gòu)化數(shù)據(jù)宜滿足以下要求:

a)宜統(tǒng)—接入ERP、MES、CRM、WMS等業(yè)務(wù)系統(tǒng)數(shù)據(jù),并建立主數(shù)據(jù)管理機制,確保關(guān)鍵業(yè)務(wù)數(shù)據(jù)的—致性;

b)宜在采集、處理、存儲過程中建立數(shù)據(jù)質(zhì)量規(guī)則,包括完整性檢查、唯—性校驗、—致性控制等,確保結(jié)構(gòu)化數(shù)據(jù)質(zhì)量滿足業(yè)務(wù)要求;

c)結(jié)構(gòu)化數(shù)據(jù)的管理與加工過程宜滿足ISO/IEC20546以及GB/T42755的相關(guān)要求。

7.2.2半/非結(jié)構(gòu)化數(shù)據(jù)

半/非結(jié)構(gòu)化數(shù)據(jù)應(yīng)包括半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、知識型文檔等,包括但不限于JSON/XML日志、BOM、配置文件、報表(XLSX/CSV)、書籍、CAD圖紙、圖片、音視頻、郵件、會議紀要、行業(yè)標準、專利、政策公告、行業(yè)報告等。

半/非結(jié)構(gòu)化數(shù)據(jù)宜滿足以下要求:

a)半結(jié)構(gòu)化數(shù)據(jù)(如JSON/XML)宜具備自動解析、敏感信息處理等能力;非結(jié)構(gòu)化文檔(如圖紙、音視頻等)宜具備內(nèi)容抽取、結(jié)構(gòu)化處理或向量化處理能力,以支持檢索、分析與模型應(yīng)?;

b)宜根據(jù)業(yè)務(wù)需求采用OCR、語音識別、圖像識別等技術(shù)提升半/非結(jié)構(gòu)化數(shù)據(jù)的可用性,但應(yīng)避免強制性性能指標要求;

c)涉及個人信息或敏感數(shù)據(jù)的半/非結(jié)構(gòu)化數(shù)據(jù),應(yīng)滿足GB/T35273和GB/T41479的相關(guān)要求。

8模型層

8.1基礎(chǔ)大模型

基礎(chǔ)大模型按類型可分為語言大模型、視覺大模型、多模態(tài)大模型等,又可分為開源大模型和閉源大模型。

基礎(chǔ)大模型宜滿足以下要求:

a)基礎(chǔ)大模型應(yīng)具備語言理解、生成與推理能力,可支持多語言場景,應(yīng)具有處理較長上下文的能力,并能適配企業(yè)常見應(yīng)用場景的輸入規(guī)模;

b)基礎(chǔ)大模型的使用應(yīng)符合算法安全、數(shù)據(jù)安全及模型輸出可控等要求,其風險管理、使用過程與評測方法應(yīng)滿足GB/T42888的相關(guān)規(guī)定;

c)基礎(chǔ)大模型宜具備可擴展性,能夠根據(jù)企業(yè)需求與部署環(huán)境選擇適配的模型規(guī)?;蜉p量化版本。

8.2行業(yè)垂類大模型

行業(yè)垂類大模型指經(jīng)過不同行業(yè)數(shù)據(jù)微調(diào)的,適用于特定行業(yè)的大模型。

行業(yè)垂類大模型宜滿足以下要求:

10

a)應(yīng)根據(jù)具體行業(yè)或領(lǐng)域開展知識增強或微調(diào),具備對行業(yè)術(shù)語、業(yè)務(wù)流程與場景任務(wù)的理解與適配能力;

b)宜提供—定的可解釋性能力,如通過模型輸出、決策鏈路或檢索信息來源等方式支持人工審核與業(yè)務(wù)驗證;

c)行業(yè)垂類模型的訓練、評估與使用過程應(yīng)滿足算法安全與數(shù)據(jù)安全要求。

8.3嵌入/檢索模型

嵌入/檢索模型用于將文本、圖像等信息轉(zhuǎn)化為向量表示,并通過相似性檢索支持知識增強、內(nèi)容匹配、問答生成等任務(wù)。

嵌入/檢索模型宜滿足以下要求:

a)應(yīng)支持文本或多模態(tài)數(shù)據(jù)的向量化處理,并能夠與向量數(shù)據(jù)庫或其他檢索組件兼容,支持常見的近似相似度檢索機制;

b)宜支持構(gòu)建檢索增強生成(RAG)框架,通過檢索外部知識提升回答準確性;相關(guān)檢索、索引與生成模塊應(yīng)具備可追溯性和可解釋性;

c)嵌入/檢索模型的使用、數(shù)據(jù)處理及知識增強過程應(yīng)符合數(shù)據(jù)安全、訪問控制與最小化原則,應(yīng)滿足GB/T35273和GB/T41479等相關(guān)要求

8.4企業(yè)知識庫

企業(yè)自有知識庫宜包含但不限于標準設(shè)計文檔、工藝流程文檔、產(chǎn)品說明書、實驗記錄、質(zhì)量管理手冊、公司章程、供應(yīng)商手冊、倉儲管理制度、員工行為準則、售后服務(wù)規(guī)范,傳感器數(shù)據(jù)、機器日志、質(zhì)量控制報告等企業(yè)私域數(shù)據(jù)。

企業(yè)宜定期對企業(yè)知識庫開展管理,管理重點如下:

a)宜根據(jù)企業(yè)業(yè)務(wù)變化、制度更新和知識沉淀情況,建立定期更新機制,保證知識內(nèi)容的時效性和可用性;

b)宜建立知識審核、歸檔與維護流程,對知識內(nèi)容的準確性、完整性和—致性進行管理,并確保知識庫內(nèi)容來源可追溯;

c)宜建立版本管理機制與權(quán)限分級控制機制,對知識內(nèi)容的訪問、編輯和發(fā)布進行管理;涉及個人信息或敏感數(shù)據(jù)的知識內(nèi)容,其存儲、使用和訪問控制應(yīng)滿足GB/T35273的相關(guān)要求。

9工具層

9.1智能體應(yīng)用工具

智能體應(yīng)用工具宜具備以下功能:

a)智能體編排平臺:應(yīng)支持以可視化方式建立智能體的意圖、任務(wù)和工具調(diào)用,宜為流程圖或狀態(tài)機的形式,支持:

●“意圖–任務(wù)-工具”的邏輯鏈路配置;

●智能體狀態(tài)轉(zhuǎn)移邏輯的定義與管理;

●對話/任務(wù)中的記憶管理功能。

b)插件生態(tài):應(yīng)具備便捷集成第三方服務(wù)或工具的能力,包括但不限于:

●支持REST/GraphQL等API的接入注冊;

●建立沙箱權(quán)限管理機制,限制插件訪問范圍和權(quán)限;

●支持調(diào)用頻率控制,宜進行速率限制,確保系統(tǒng)穩(wěn)定性。

●支持模型上下文協(xié)議(MCP)的注冊與通信機制,支持通過MCP規(guī)范化插件能力定義,實現(xiàn)大模型與外部數(shù)據(jù)源、工具及知識庫之間的上下文共享與調(diào)用;

c)執(zhí)行調(diào)度:應(yīng)能對多個任務(wù)或調(diào)用進行有效調(diào)度管理,包括但不限于:

●支持任務(wù)排隊執(zhí)行,如任務(wù)隊列;

●宜支持設(shè)置任務(wù)優(yōu)先級,高優(yōu)先級任務(wù)可優(yōu)先處理;

●支持并發(fā)數(shù)控制,防止資源過載;

11

●支持失敗任務(wù)自動重試機制,任務(wù)自動重試次數(shù)宜不大于3次。

d)監(jiān)控與分析:應(yīng)提供可供開發(fā)者和運營人員使用的運行追蹤與分析工具,包括但不限于:

●含輸入輸出的對話和任務(wù)的詳細日志記錄;

●智能體運行鏈路的調(diào)用追蹤視圖,用于問題排查;

●可視化指標看板,可及時反映執(zhí)行效率、錯誤率等關(guān)鍵指標。

9.2傳統(tǒng)IT工具

工具層應(yīng)強調(diào)與傳統(tǒng)IT基礎(chǔ)能力的對接適配能力,保障其可運維、可交付、可擴展。包括但不限于:

a)數(shù)據(jù)標注工具:支持對訓練數(shù)據(jù)進行自動標注、質(zhì)量審核等,宜具備以下功能:

●自動標注:通過規(guī)則或模型對原始數(shù)據(jù)進行初步標注;

●質(zhì)量復核:對標注結(jié)果宜進行人工復審和糾錯,確保數(shù)據(jù)質(zhì)量可靠。

b)模型運維工具(MLOps/LangOps):支持大模型及其下游應(yīng)用的全生命周期管理能力,包括但不限于:

●模型倉庫:支持模型統(tǒng)—存儲及版本管理;

●CI/CD流程:支持模型的持續(xù)集成、自動部署和發(fā)布更新;

●模型監(jiān)測:支持監(jiān)測模型性能隨時間或數(shù)據(jù)變化的波動,及時預(yù)警;

●藍綠部署:支持新舊模型平穩(wěn)切換,保障上線安全性和穩(wěn)定性。

c)系統(tǒng)集成工具:提供系統(tǒng)集成與流程編排支撐,使智能體能夠與企業(yè)系統(tǒng)高效協(xié)同,包括但不限于:

●企業(yè)服務(wù)總線(ESB):統(tǒng)—管理系統(tǒng)間的消息和服務(wù)交互;

●集成平臺即服務(wù)(iPaaS):實現(xiàn)系統(tǒng)、服務(wù)、數(shù)據(jù)的整合與流程編排;

●API網(wǎng)關(guān):對外接口進行集中管理、安全認證、限流和監(jiān)控;

●BPM流程引擎:支持復雜業(yè)務(wù)流程的建模、執(zhí)行和監(jiān)控。

d)運維和監(jiān)控工具:保障系統(tǒng)運行的穩(wěn)定性、可觀測性和故障自恢復能力,包括但不限于:

●Prometheus/Grafana:用于指標采集和可視化展示,支持運行健康監(jiān)控;

●集中日志管理:統(tǒng)—采集系統(tǒng)運行日志,便于追蹤與分析問題;

●彈性伸縮機制:根據(jù)系統(tǒng)負載自動擴容或縮容計算資源;

●自動修復機制:支持在組件異?;虮罎r自動重啟或切換,確保服務(wù)可用性。

9.3模型訓推工具

模型訓推工具用于支撐大模型及其下游應(yīng)用的訓練、微調(diào)、推理與評測過程,是連接模型層與應(yīng)用層的核心支撐工具。宜具備以下功能:

a)模型訓練與微調(diào):用于中小企業(yè)在私有數(shù)據(jù)上對基礎(chǔ)/垂類大模型進行模型訓練和參數(shù)微調(diào),以適配特定業(yè)務(wù)場景,宜具備以下功能:

●應(yīng)支持基礎(chǔ)大模型在企業(yè)私有數(shù)據(jù)上的持續(xù)訓練與參數(shù)高效微調(diào)(如LoRA、QLoRA等),并可根據(jù)企業(yè)業(yè)務(wù)場景進行增量學習與領(lǐng)域適配;

●應(yīng)具備模型訓練任務(wù)的分布式調(diào)度與資源編排能力,支持斷點續(xù)訓與任務(wù)追蹤。

b)模型推理與加速:用于在不同硬件與環(huán)境中高效提供模型推理服務(wù),提升響應(yīng)時延與吞吐表現(xiàn),宜具備以下功能:

●應(yīng)支持多種推理引擎與框架,并可按模型規(guī)模與硬件配置進行動態(tài)優(yōu)化;

●宜提供量化、蒸餾、剪枝等輕量化工具,以提升推理性能與部署效率。

c)性能評測與監(jiān)測:用于對模型效果與運行性能進行標準化評估與持續(xù)監(jiān)控,宜具備以下功能:

●應(yīng)支持基于標準化數(shù)據(jù)集(如CMMLU-SMEs)的模型效果評估;

●應(yīng)提供推理時延、吞吐量、內(nèi)存占用、準確率等關(guān)鍵性能指標的自動化測試與報告生成。

10應(yīng)用層

10.1智能體應(yīng)用

12

智能體應(yīng)用應(yīng)以自然語言交互、知識增強與工具鏈編排為核心,面向既有信息系統(tǒng)形成可運維、可交付、可擴展、可審計的業(yè)務(wù)能力提升。智能體應(yīng)用包括但不限于:

a)經(jīng)營管理類:經(jīng)營分析、費用預(yù)測、自動月報等;

b)生產(chǎn)運維類:設(shè)備診斷、工藝優(yōu)化、碳排監(jiān)控等;

c)供應(yīng)鏈物流類:采購輔采、庫存優(yōu)化、異常預(yù)警等;

d)銷售與客戶類:智能客服、營銷內(nèi)容生成、客戶畫像等;

e)研發(fā)與工程類:專利檢索、方案生成、實驗助手等;

f)知識與培訓類:知識檢索、員工培訓、SOP問答助手等;

g)管理合規(guī)類:合同條款抽取與—致性校核、隱私與合規(guī)提示、審計留痕歸集等;

h)數(shù)據(jù)與IT運維類:數(shù)據(jù)質(zhì)量巡檢、日志歸因與異常定位、低代碼流程編排與發(fā)布等。

10.2信息化系統(tǒng)

信息化系統(tǒng)集成應(yīng)遵循可嵌入、可觀測、安全可控原則,優(yōu)先采用標準化接口與流程建模方法,支持跨系統(tǒng)調(diào)用的統(tǒng)—鑒權(quán)、統(tǒng)—審計與統(tǒng)—運維。包括但不限于:

a)嵌入插件模式:在業(yè)務(wù)系統(tǒng)中以插件/擴展方式調(diào)用AgentAPI;業(yè)務(wù)系統(tǒng)可包括ERP、CRM、PLM、SCM、MES、WMS、OA等。應(yīng)采用統(tǒng)—身份(SSO)與基于角色的訪問控制(RBAC),并對API進行認證、授權(quán)、限流與審計,防范越權(quán)、失效等常見風險;

b)低代碼集成模式:通過低代碼平臺與連接器(Connectors)對接多源系統(tǒng)與數(shù)據(jù),快速將智能體嵌入業(yè)務(wù)流程或應(yīng)用;

c)門戶與大屏模式:企業(yè)知識助手、生產(chǎn)看板、經(jīng)營駕駛艙統(tǒng)—入口;

d)流程自動化模式:將智能體編排入業(yè)務(wù)流程,如RPA/BPM等,實現(xiàn)端到端的流程可視化閉環(huán)。

11部署模式

11.1部署模式分類

中小企業(yè)在應(yīng)用大模型構(gòu)建智能體時,受限于資金投入和運維能力,宜優(yōu)先采用公有云部署模式,以降低建設(shè)成本并加快系統(tǒng)上線。但企業(yè)也應(yīng)根據(jù)企業(yè)規(guī)模、資金投入、安全合規(guī)需求和數(shù)據(jù)敏感程度等因素,綜合評估后m選擇以下—種或多種部署模式:

11.1.1私有化部署

a)模型、智能體及相關(guān)數(shù)據(jù)均部署在企業(yè)本地數(shù)據(jù)中心或企業(yè)自有的計算資源中;

b)數(shù)據(jù)應(yīng)在企業(yè)內(nèi)部閉環(huán)流動,不出域、不外傳;

c)適用于數(shù)據(jù)高度敏感、隱私要求嚴格或時延要求較高的業(yè)務(wù)場景;

d)本地算力設(shè)備應(yīng)滿足第6章設(shè)備層相應(yīng)要求,數(shù)據(jù)存儲和傳輸應(yīng)滿足GB/T35273相關(guān)安全規(guī)范。

11.1.2公有云部署

a)企業(yè)通過公有云平臺API調(diào)用云端提供的大模型與智能體服務(wù),本地可按需配置算力設(shè)置;

b)企業(yè)數(shù)據(jù)通過API上傳到云端,企業(yè)僅獲得模型推理結(jié)果;

c)適用于數(shù)據(jù)敏感性較低、預(yù)算有限且快速上線需求較高的中小企業(yè);

d)云服務(wù)提供方應(yīng)保證數(shù)據(jù)安全、隱私保護與服務(wù)高可用性,安全性應(yīng)滿足GB/T41479的要求。

11.1.3混合部署

a)敏感數(shù)據(jù)處理及核心推理任務(wù)宜部署在企業(yè)本地,通用推理任務(wù)、模型訓練、更新等宜放置在公有云;

b)本地設(shè)備與云端通過加密通道進行安全通信,數(shù)據(jù)交換應(yīng)滿足GB/T35273和GB/T41479要求;

c)適用于對數(shù)據(jù)安全有明確要求,又同時需要借助云端算力和服務(wù)資源靈活擴展的企業(yè)場景;

d)本地部署的關(guān)鍵算力和網(wǎng)絡(luò)通信可參考6.2和6.3的相應(yīng)要求。

11.2部署模式選擇要求

13

a)企業(yè)選擇部署模式時,應(yīng)綜合考慮數(shù)據(jù)安全敏感度、成本預(yù)算、網(wǎng)絡(luò)通信環(huán)境、運維能力以及未來擴展需求;

b)涉及個人隱私和商業(yè)秘密的數(shù)據(jù)處理環(huán)節(jié)應(yīng)優(yōu)先考慮私有化或混合部署模式;

c)使用公有云模式時,應(yīng)確保服務(wù)提供商滿足ISO/IEC27001等安全合規(guī)要求,并具備相應(yīng)數(shù)據(jù)合規(guī)認證;

a)采用混合部署時,應(yīng)明確劃定云與本地部署邊界,確保敏感數(shù)據(jù)不越界,滿足數(shù)據(jù)分級保護相關(guān)要求。

12安全與合規(guī)要求

12.1數(shù)據(jù)安全要求

12.1.1數(shù)據(jù)采集與傳輸安全

a)數(shù)據(jù)采集設(shè)備應(yīng)具備身份認證、訪問控制和數(shù)據(jù)校驗?zāi)芰?;采集與傳輸過程中應(yīng)采用安全通信協(xié)議實現(xiàn)數(shù)據(jù)的端到端保護;

b)數(shù)據(jù)在傳輸過程中應(yīng)保持完整性、機密性和可驗證性,防范數(shù)據(jù)被篡改、偽造或非法截取風險;

c)應(yīng)采用安全通道、加密傳輸、零信任訪問等技術(shù)手段保障數(shù)據(jù)通信安全,網(wǎng)絡(luò)安全防護應(yīng)滿足GB/T41479要求。

12.1.2數(shù)據(jù)存儲與訪問控制

a)數(shù)據(jù)存儲應(yīng)采用必要的加密、隔離、脫敏等安全措施,保證敏感數(shù)據(jù)在靜態(tài)存儲過程中的安全性;加密與密鑰管理要求應(yīng)符合相關(guān)安全規(guī)范;

b)應(yīng)建立基于最小權(quán)限原則的訪問控制機制,如角色訪問控制(RBAC)或基于屬性的訪問控制(ABAC),對敏感數(shù)據(jù)實施精細化權(quán)限管理;

c)數(shù)據(jù)訪問與操作應(yīng)具備可審計性,應(yīng)記錄關(guān)鍵

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論