版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
DB14/T2527—2022
云平臺人工智能建模系統(tǒng)功能要求
1范圍
本文件規(guī)定了云平臺人工智能建模系統(tǒng)的各組件功能要求。
本文件適用于云平臺上人工智能建模系統(tǒng)及解決方案的數(shù)據(jù)處理、算法設(shè)計、模型訓(xùn)練、模型管理
等功能要求,可作為云平臺上人工智能建模系統(tǒng)的規(guī)劃、設(shè)計、建設(shè)、評估及驗收的依據(jù)。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,
僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本
文件。
GB/T5271.31-2006信息技術(shù)詞匯第31部分:人工智能機器學(xué)習(xí)
GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)
3術(shù)語和定義
GB/T5271.31-2006,GB/T5271.34-2006界定的以及下列術(shù)語和定義適用于本文件。
3.1
云平臺
本文件所指云平臺是面向全省域,為政府、社會團體和企事業(yè)組織提供專業(yè)化服務(wù)的一體化云服務(wù)
體系。
3.2
人工智能建模系統(tǒng)
為數(shù)據(jù)分析人員、業(yè)務(wù)建模人員和模型管理人員提供數(shù)據(jù)處理、模型構(gòu)建與訓(xùn)練、模型部署與管理
解決方案的模型平臺。
3.3
算子
構(gòu)成人工智能建模算法的計算單元。
3.4
特征工程
利用領(lǐng)域知識從原始數(shù)據(jù)中提取特征的過程。
1
DB14/T2527—2022
4縮略語
下列縮略語適用于本文件。
AI:人工智能(ArtificialIntelligence)
DAG:有向無環(huán)圖(DirectedAcyclicGraph)
NLP:自然語言處理(NaturalLanguageProcessing)
JDBC:Java數(shù)據(jù)庫連接(JavaDatabaseConnectivity)
HDFS:Hadoop分布式文件系統(tǒng)(HadoopDistributedFileSystem)
SQL:結(jié)構(gòu)化查詢語言(StructuredQueryLanguage)
API:應(yīng)用程序接口(ApplicationProgrammingInterface)
ROC:接收者操作特征(ReceiverOperatingCharacteristic)
PR:查全率(Precision-Recall)
REST:表述性狀態(tài)轉(zhuǎn)移(RepresentationalStateTransfer)
5功能要求
5.1概述
云平臺人工智能建模系統(tǒng)的功能框架見圖1,包括數(shù)據(jù)導(dǎo)入導(dǎo)出、數(shù)據(jù)預(yù)覽與探索、數(shù)據(jù)預(yù)處理、
特征工程、算法選擇、模型訓(xùn)練與評估、模型管理、模型市場、工作流調(diào)度等核心能力。
圖1云平臺人工智能建模系統(tǒng)的功能框架
5.2數(shù)據(jù)導(dǎo)入導(dǎo)出
5.2.1數(shù)據(jù)導(dǎo)入
支持多種數(shù)據(jù)源包括關(guān)系型數(shù)據(jù)庫、Hive、HBase、ElasticSearch、HDFS、文件格式、JDBC等,同
時支持數(shù)據(jù)導(dǎo)入時轉(zhuǎn)換數(shù)據(jù)類型。數(shù)據(jù)源接入使用統(tǒng)一視圖及規(guī)范。
5.2.2數(shù)據(jù)導(dǎo)出
2
DB14/T2527—2022
支持將結(jié)果數(shù)據(jù)導(dǎo)出至關(guān)系型數(shù)據(jù)庫、Hive、HDFS、JDBC等,同時支持結(jié)果數(shù)據(jù)導(dǎo)出至數(shù)據(jù)源。
5.2.3數(shù)據(jù)樣例
人工智能平臺應(yīng)提供不同類型的樣例數(shù)據(jù)以供測試。
5.3數(shù)據(jù)預(yù)覽與探索
5.3.1數(shù)據(jù)質(zhì)量分析
支持對臟數(shù)據(jù),數(shù)據(jù)缺失值、異常值等的檢查。
5.3.2數(shù)據(jù)統(tǒng)計分析
支持查看數(shù)據(jù)的分布情況和統(tǒng)計學(xué)指標。支持圖形化自定義統(tǒng)計分析數(shù)據(jù)。
5.3.3數(shù)據(jù)特征分析
支持在數(shù)據(jù)集合進行分布分析,對比分析,統(tǒng)計量分析和相關(guān)分析,為數(shù)據(jù)建模人員提供基本的特
征描述。
5.3.4復(fù)雜數(shù)據(jù)特征分析
支持交互式分析和探索的編程環(huán)境。包括R、Python等編程環(huán)境,用于復(fù)雜的數(shù)據(jù)特征分析。
5.4數(shù)據(jù)預(yù)處理
5.4.1數(shù)據(jù)清洗
支持按照預(yù)定義的清洗模式對全量數(shù)據(jù)進行原始無效異常數(shù)據(jù)過濾和缺失數(shù)據(jù)補齊。
5.4.2數(shù)據(jù)變換
提供包括數(shù)據(jù)屬性轉(zhuǎn)換、新屬性生成在內(nèi)的處理能力。
5.4.3數(shù)據(jù)規(guī)約
提供對基本數(shù)據(jù)屬性的歸一化處理能力。
5.4.4自動化預(yù)處理
支持數(shù)據(jù)預(yù)處理自動化,包括自動填充、自動清理、自動轉(zhuǎn)換以及自動歸一化等。
5.4.5預(yù)處理行業(yè)模板
人工智能平臺應(yīng)提供預(yù)處理操作算子樣例及常用模板。
5.5特征工程
5.5.1特征工程流程
特征工程流程包括特征變換、特征重要性評估、特征選擇、特征生成等。
5.5.2特征工程自動化
特征工程自動化包括自動多表擴展、自動特征變換、自動特征選擇以及自動特征生成等。
3
DB14/T2527—2022
5.5.3特征提取模板
支持特征提取算子和模板配置。
5.6算法選擇
5.6.1基礎(chǔ)能力
支持多種優(yōu)化算法,算法參數(shù)可配置。
5.6.2支持但不限于以下的算法類型
特征權(quán)重、流處理、預(yù)處理、表操作、機器學(xué)習(xí)、圖嵌入、驗證與評估、NLP、時間序列、統(tǒng)計、
集成學(xué)習(xí)、深度學(xué)習(xí)、圖計算、圖像處理、強化學(xué)習(xí)等。
5.6.3自定義算法
支持通過Python,R等實現(xiàn)自定義算法,支持用戶自定義持久化擴展算子庫。
5.6.4實用工具庫
提供支持子流程、添加宏、提取宏、生成宏、刪除宏、循環(huán),支持子流程的自定義封裝和命名,支
持自定義單機腳本算子快速實現(xiàn)分布式化等功能的實用工具。
5.6.5算法樣例庫
提供章節(jié)5.6.2、5.6.3所列算法的使用樣例。
5.7模型訓(xùn)練與評估
5.7.1訓(xùn)練過程
可以啟動和停止訓(xùn)練任務(wù),可以查看運行日志。訓(xùn)練過程中支持調(diào)試功能,可進行單步調(diào)試,斷點
調(diào)試。支持訓(xùn)練過程中間數(shù)據(jù)查看、導(dǎo)出。
5.7.2資源共享
支持多個用戶分組管理和共享計算資源。
5.7.3資源管控
支持對物理資源進行虛擬化管控,可以動態(tài)進行資源的申請或釋放。
5.7.4復(fù)雜任務(wù)依賴
支持多任務(wù)之間圖形化構(gòu)建依賴,以構(gòu)建復(fù)雜的模型訓(xùn)練任務(wù)及數(shù)據(jù)分析任務(wù)。
5.7.5自動調(diào)參與自動建模
支持自動調(diào)參和搜索網(wǎng)格,包括在給定命中率和覆蓋率的要求下搜索參數(shù)輸出結(jié)果,及在給定參數(shù)
下搜索最優(yōu)結(jié)果。
支持自動建模,自動選擇算法及參數(shù)。
5.7.6交叉驗證
4
DB14/T2527—2022
支持按比例隨機分配訓(xùn)練與測試集,支持交叉檢驗。
5.7.7評估指標
支持多種評估指標,如混淆矩陣,ROC曲線,PR曲線,加權(quán)召回率等。對于二分類,輸出包括評價
指標的數(shù)目表格;對于多分類,輸出混淆矩陣。
5.7.8評估樣例庫
提供所有評估算子樣例。
5.8模型管理
5.8.1模型的版本管理
支持歷史、新建及外部導(dǎo)入模型的保存和版本管理,支持模型詳細查看,模型結(jié)果查看。
5.8.2模型導(dǎo)入導(dǎo)出
支持多種模型格式。支持導(dǎo)出Json模型,包括聚類、分類、回歸等類型。
5.8.3深度學(xué)習(xí)模型管理
支持深度學(xué)習(xí)模型導(dǎo)入導(dǎo)出和可視化查看,支持實驗應(yīng)用。
5.9模型市場
5.9.1模型用戶管理
支持管理員對其所屬普通用戶項目情況及權(quán)限進行管理。
5.9.2模型服務(wù)上架
支持任務(wù)/實驗、代碼、自定義鏡像等在模型市場上架。
5.9.3模型服務(wù)上、下線
支持模型服務(wù)的上、下線與列表查看。
5.9.4模型服務(wù)更新
支持滾動更新及灰度更新,且灰度升級支持分配流量權(quán)重。
5.9.5模型服務(wù)測試
支持服務(wù)上線后的API測試。
5.9.6模型服務(wù)管理
支持自定義模型部署,生成相應(yīng)RESTAPI,手動增加實例數(shù)量提高服務(wù)的負載均衡;可查看當前導(dǎo)
入平臺的API列表。
5.9.7模型服務(wù)監(jiān)控
支持線上模型服務(wù)監(jiān)控,可查看模型服務(wù)內(nèi)容、運行狀態(tài)、實例詳情、資源設(shè)置等,后臺可以統(tǒng)計
API的調(diào)用情況和結(jié)果統(tǒng)計。
5
DB14/T2527—2022
5.9.8模型服務(wù)使用
API服務(wù)上線后,可通過RESTAPI調(diào)用,傳入?yún)?shù)并獲得預(yù)測值。
5.10工作流調(diào)度
5.10.1任務(wù)配置
支持可視化建模、代碼建模、特征和模型上架、上線等任務(wù)類型。支持對單個任務(wù)進行資源配置,
如可視化建模、代碼建模等。
5.10.2設(shè)計工作流
任務(wù)定義成功后,確定各任務(wù)彼此間的邏輯依賴關(guān)系,任務(wù)會自上而下執(zhí)行。支持通過Cron表達式,
來設(shè)置整個工作流的調(diào)度周期。
5.10.3執(zhí)行工作流
支持對工作流進行調(diào)試,確保整體流程可執(zhí)行,再進行調(diào)度。設(shè)置工作流的調(diào)度周期后,工作流會
按照設(shè)置的周期定時調(diào)度。
5.10.4工作流上、下線
支持對工作流進行上線、下線操作。
5.10.5工作流導(dǎo)入導(dǎo)出
支持從外部導(dǎo)入工作流,支持工作流導(dǎo)出到本地,導(dǎo)入導(dǎo)出文件為JSON格式。
5.10.6工作流詳情
支持查看單個工作流每次的執(zhí)行時間和執(zhí)行狀態(tài)。支持查看工作流下的單個任務(wù)每次的執(zhí)行時間、
狀態(tài)和日志詳情。
6
DB14/T2527—2022
參考文獻
[1]《國家新一代人工智能標準體系建設(shè)指南》國標委聯(lián)﹝2020﹞35
7
ICS35.080
CCSL76
14
山西省地方標準
DB14/T2527—2022
云平臺人工智能建模系統(tǒng)框架及功能要求
2022-08-18發(fā)布2022-11-18實施
山西省市場監(jiān)督管理局??發(fā)布
DB14/T2527—2022
云平臺人工智能建模系統(tǒng)功能要求
1范圍
本文件規(guī)定了云平臺人工智能建模系統(tǒng)的各組件功能要求。
本文件適用于云平臺上人工智能建模系統(tǒng)及解決方案的數(shù)據(jù)處理、算法設(shè)計、模型訓(xùn)練、模型管理
等功能要求,可作為云平臺上人工智能建模系統(tǒng)的規(guī)劃、設(shè)計、建設(shè)、評估及驗收的依據(jù)。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,
僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本
文件。
GB/T5271.31-2006信息技術(shù)詞匯第31部分:人工智能機器學(xué)習(xí)
GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)
3術(shù)語和定義
GB/T5271.31-2006,GB/T5271.34-2006界定的以及下列術(shù)語和定義適用于本文件。
3.1
云平臺
本文件所指云平臺是面向全省域,為政府、社會團體和企事業(yè)組織提供專業(yè)化服務(wù)的一體化云服務(wù)
體系。
3.2
人工智能建模系統(tǒng)
為數(shù)據(jù)分析人員、業(yè)務(wù)建模人員和模型管理人員提供數(shù)據(jù)處理、模型構(gòu)建與訓(xùn)練、模型部署與管理
解決方案的模型平臺。
3.3
算子
構(gòu)成人工智能建模算法的計算單元。
3.4
特征工程
利用領(lǐng)域知識從原始數(shù)據(jù)中提取特征的過程。
1
DB14/T2527—2022
4縮略語
下列縮略語適用于本文件。
AI:人工智能(ArtificialIntelligence)
DAG:有向無環(huán)圖(DirectedAcyclicGraph)
NLP:自然語言處理(Natural
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 水毀河堤修復(fù)工程施工方案
- 2026年5C管理技能進階題庫企業(yè)員工素養(yǎng)
- 2026年及未來5年市場數(shù)據(jù)中國酒店餐飲行業(yè)市場發(fā)展數(shù)據(jù)監(jiān)測及投資戰(zhàn)略咨詢報告
- 2025-2030重慶家居裝飾品市場現(xiàn)狀供需分析及投資前景規(guī)劃研究報告
- 2026年金融分析師金融市場投資策略及風險管理理論試卷
- 2026年健康食品科技產(chǎn)品經(jīng)理專業(yè)能力測試題目
- 2026年現(xiàn)代市場營銷經(jīng)理資格考試試題
- 2025至2030中國冷鏈物流行業(yè)基礎(chǔ)設(shè)施布局及運營效率分析報告
- 中國家庭儲能電池智能監(jiān)控系統(tǒng)消費者行為與市場滲透分析報告
- 中國咖啡連鎖店運營效率與單店盈利模型研究報告
- 2026年無錫工藝職業(yè)技術(shù)學(xué)院單招綜合素質(zhì)考試題庫附答案解析
- 2026年中考語文一輪復(fù)習(xí)課件:記敘文類閱讀技巧及示例
- 培訓(xùn)中心收費與退費制度
- 2025腫瘤靶向藥物皮膚不良反應(yīng)管理專家共識解讀課件
- 腳手架施工安全技術(shù)交底標準模板
- 設(shè)備部2025年度工作總結(jié)報告
- (2026年)壓力性損傷的預(yù)防和護理課件
- 化工廠設(shè)備維護保養(yǎng)培訓(xùn)
- 淘寶主體變更合同范本
- 《交易心理分析》中文
- 2025中國電信股份有限公司重慶分公司社會成熟人才招聘筆試考試參考題庫及答案解析
評論
0/150
提交評論