《數(shù)據(jù)要素服務(wù)平臺數(shù)據(jù)資源服務(wù)目錄建設(shè)指南》(征求意見稿)_第1頁
《數(shù)據(jù)要素服務(wù)平臺數(shù)據(jù)資源服務(wù)目錄建設(shè)指南》(征求意見稿)_第2頁
《數(shù)據(jù)要素服務(wù)平臺數(shù)據(jù)資源服務(wù)目錄建設(shè)指南》(征求意見稿)_第3頁
《數(shù)據(jù)要素服務(wù)平臺數(shù)據(jù)資源服務(wù)目錄建設(shè)指南》(征求意見稿)_第4頁
《數(shù)據(jù)要素服務(wù)平臺數(shù)據(jù)資源服務(wù)目錄建設(shè)指南》(征求意見稿)_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2T/ZADTXXXX—XXXX數(shù)據(jù)要素服務(wù)平臺數(shù)據(jù)資源服務(wù)目錄建設(shè)指南本文件提供了數(shù)據(jù)要素服務(wù)平臺數(shù)據(jù)資源服務(wù)目錄在數(shù)據(jù)資源服務(wù)內(nèi)容、數(shù)據(jù)分類與編碼規(guī)范、目錄管理、核心元數(shù)據(jù)、數(shù)據(jù)資源標(biāo)識符編碼等方面的建設(shè)指導(dǎo)建議。本文件適用于產(chǎn)業(yè)園區(qū)的數(shù)據(jù)要素服務(wù)平臺數(shù)據(jù)資源服務(wù)目錄的建設(shè)和管理。2規(guī)范性引用文件下列文件對于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅所注日期的版本適用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T37988-2019信息安全技術(shù)數(shù)據(jù)安全能力成熟度模型GB/T43697-2024數(shù)據(jù)安全技術(shù)數(shù)據(jù)分類分級規(guī)則GB/T38667-2020信息技術(shù)大數(shù)據(jù)數(shù)據(jù)分類指南GB/T7027-2002信息分類和編碼的基本原則與方法T/COSOCC028-2024數(shù)據(jù)要素數(shù)據(jù)資源分類指南TC609-5-2025-XX高質(zhì)量數(shù)據(jù)集格式要求GB/T37043-2018智慧城市術(shù)語ISO/IEC11179-1:2023信息技術(shù).元數(shù)據(jù)的注冊(MDR).第1部分:框架3術(shù)語GB/T43697、GB/T38667-2020、GB/T37043—XXXX界定的以及下列術(shù)語和定義適用于本文件。為了便于使用,以下重復(fù)列出了GB/T37043—XXXX中的某些術(shù)語和定義。3.1元數(shù)據(jù)metadata關(guān)于數(shù)據(jù)或數(shù)據(jù)元素的數(shù)據(jù)(可能包括其他數(shù)據(jù)描述),以及關(guān)于數(shù)據(jù)擁有權(quán)、存取路徑、訪問權(quán)和數(shù)據(jù)易變性的數(shù)據(jù)。[來源:GB/T35295—2017,2.2]3.2數(shù)據(jù)資源dataresource以電子化形式記錄和保存的具備原始性、可機(jī)器讀取、可供社會化再利用的數(shù)據(jù)集合。[來源:GB/T37043—2018,3.1]3.3高質(zhì)量數(shù)據(jù)集high-qualitydataset經(jīng)過采集、加工等數(shù)據(jù)處理,可直接用于開發(fā)和訓(xùn)練人工智能模型,能有效提升模型性能的數(shù)據(jù)的集合。[來源:TC609-5-2025-XX,3.1]T/ZADTXXXX—XXXX33.4數(shù)據(jù)產(chǎn)品和服務(wù)dataproductsandservices基于數(shù)據(jù)加工形成的,可滿足特定需求的數(shù)據(jù)加工品和數(shù)據(jù)服務(wù)。[來源:GB/T37043—XXXX,3.1]4縮略語下列縮略語適用于本文件。TLS:傳輸層安全性協(xié)議(TransportLayerSecurity)API:應(yīng)用程序編程接口(ApplicationProgrammingInterface)TEE:可信執(zhí)行環(huán)境(TrustedExecutionEnvironment)RBAC:基于角色的訪問控制(Role-BasedAccessControl)5數(shù)據(jù)資源服務(wù)內(nèi)容5.1基礎(chǔ)數(shù)據(jù)服務(wù)基礎(chǔ)數(shù)據(jù)服務(wù)宜包括如下功能:a)企業(yè)數(shù)據(jù)共享:支持企業(yè)通過接口上傳脫敏后的經(jīng)營數(shù)據(jù),平臺提供數(shù)據(jù)標(biāo)準(zhǔn)化模板與合規(guī)性校驗(yàn)工具,實(shí)現(xiàn)跨企業(yè)數(shù)據(jù)互通;b)第三方數(shù)據(jù)集成:對接第三方數(shù)據(jù)供應(yīng)商,提供數(shù)據(jù)融合接口,支持多源異構(gòu)數(shù)據(jù)的統(tǒng)一接入與格式轉(zhuǎn)換。5.2數(shù)據(jù)加工處理服務(wù)數(shù)據(jù)加工處理服務(wù)宜包括如下功能:a)數(shù)據(jù)清洗與脫敏:提供自動化清洗工具及匿名化算法,確保數(shù)據(jù)質(zhì)量與隱私合規(guī);b)數(shù)據(jù)建模與分析:內(nèi)置行業(yè)通用模型庫,支持用戶自定義參數(shù)輸入并生成可視化分析報告。5.3算法與模型服務(wù)算法與模型服務(wù)宜包括如下功能:a)預(yù)訓(xùn)練模型庫:開放自然語言處理(NLP)、圖像識別等通用AI模型,支持用戶通過接口調(diào)用模型服務(wù)并返回結(jié)構(gòu)化結(jié)果(如文本分類標(biāo)簽、圖像特征向量);b)行業(yè)算法包:針對數(shù)字貿(mào)易場景定制算法,封裝為標(biāo)準(zhǔn)化模塊,支持一鍵部署至企業(yè)業(yè)務(wù)系統(tǒng)。5.4技術(shù)工具服務(wù)技術(shù)工具服務(wù)宜包括如下功能:a)數(shù)據(jù)治理工具:提供元數(shù)據(jù)管理、數(shù)據(jù)血緣追蹤、權(quán)限分級控制功能,支持企業(yè)實(shí)現(xiàn)數(shù)據(jù)全生命周期管理;b)數(shù)據(jù)產(chǎn)品定制:支持企業(yè)按需訂制數(shù)據(jù)集或API服務(wù)包,根據(jù)行業(yè)特征(如跨境電商、供應(yīng)鏈金融)篩選特定字段并配置更新頻率,滿足差異化業(yè)務(wù)需求;c)模型訓(xùn)練優(yōu)化:提供算法模型參數(shù)調(diào)優(yōu)服務(wù),用戶可上傳自有數(shù)據(jù)訓(xùn)練行業(yè)垂直模型,平臺提供算力資源與模型評估工具;d)開發(fā)者工具包:提供接口調(diào)用示例及錯誤日志分析模塊,降低技術(shù)接入門檻。5.5安全與合規(guī)服務(wù)安全與合規(guī)服務(wù)宜包括如下功能:T/ZADTXXXX—XXXX4a)加密與權(quán)限控制:傳輸層采用TLS1.3協(xié)議加密,存儲層實(shí)施分級密鑰管理(主密鑰+數(shù)據(jù)密鑰支持細(xì)粒度訪問控制(如IP白名單、操作權(quán)限分級);b)合規(guī)性審查:內(nèi)置《個人信息保護(hù)法》等合規(guī)檢查工具,自動識別敏感數(shù)據(jù)并生成合規(guī)報告。6目錄管理6.1目錄編制支持?jǐn)?shù)據(jù)資源目錄新增、批量導(dǎo)入導(dǎo)出等操作,最后提交審核。6.2目錄發(fā)布對提交審核的目錄進(jìn)行審核操作,數(shù)據(jù)資源目錄成功發(fā)布時數(shù)據(jù)資源標(biāo)識符自動生成。6.3數(shù)據(jù)資源關(guān)聯(lián)把目錄和可用的數(shù)據(jù)資源進(jìn)行關(guān)聯(lián),可關(guān)聯(lián)到數(shù)據(jù)庫、文件、接口服務(wù)、技術(shù)和模型等多種數(shù)據(jù)資源。6.4目錄檢索可根據(jù)數(shù)據(jù)資源分類等多個關(guān)鍵詞對數(shù)據(jù)資源進(jìn)行組合查詢。6.5目錄維護(hù)由于技術(shù)更新或業(yè)務(wù)調(diào)整等原因需要對數(shù)據(jù)資源目錄進(jìn)行變更,應(yīng)評估變更影響的范圍及程度,根據(jù)實(shí)際業(yè)務(wù)進(jìn)行數(shù)據(jù)項(xiàng)修改、停用等操作。在歷史記錄中可檢索已停用的數(shù)據(jù)資源目錄。6.6動態(tài)管理與更新機(jī)制目錄動態(tài)管理和審核機(jī)制宜包括如下機(jī)制:a)目錄動態(tài)更新規(guī)則:需要定期更新目錄內(nèi)容,確保數(shù)據(jù)時效性。建立周期性數(shù)據(jù)質(zhì)量審核流程,對數(shù)據(jù)完整性、準(zhǔn)確性、時效性進(jìn)行校驗(yàn),明確校驗(yàn)周期(如月度/季度)及不合格數(shù)據(jù)的處理規(guī)則;b)有效性審核機(jī)制:建立數(shù)據(jù)質(zhì)量評估標(biāo)準(zhǔn),對失效或低質(zhì)數(shù)據(jù)進(jìn)行下架處理。制定數(shù)據(jù)失效判定標(biāo)準(zhǔn)(如超過更新周期、應(yīng)用場景不匹配等),在發(fā)現(xiàn)失效或違規(guī)數(shù)據(jù)后有效期內(nèi)完成下架,并在目錄中標(biāo)注下架原因。7數(shù)據(jù)分類與編碼規(guī)范7.1概述本章規(guī)范了園區(qū)數(shù)據(jù)資源的分類標(biāo)準(zhǔn)及數(shù)據(jù)資源編碼規(guī)則,并根據(jù)園區(qū)數(shù)據(jù)資源的實(shí)際應(yīng)用場景,在第8章、第9章分別對數(shù)據(jù)資源的分類、數(shù)據(jù)資源編碼規(guī)則進(jìn)行進(jìn)一步的描述。7.2分類標(biāo)準(zhǔn)本標(biāo)準(zhǔn)的數(shù)據(jù)資源分類方法參考GB/T43697-2024、GB/T38667-2020和T/COSOCC028的規(guī)定執(zhí)行,并根據(jù)浙江產(chǎn)業(yè)園區(qū)數(shù)據(jù)資源常見的實(shí)際應(yīng)用場景,依據(jù)數(shù)字貿(mào)易的云服務(wù)、數(shù)字內(nèi)容、數(shù)字服務(wù)、跨境電商等核心場景對數(shù)據(jù)資源進(jìn)行行業(yè)分類,按數(shù)據(jù)生產(chǎn)方式分為原始類數(shù)據(jù)資源、過程類數(shù)據(jù)資源、應(yīng)用類數(shù)據(jù)資源。本標(biāo)準(zhǔn)從技術(shù)選型、業(yè)務(wù)應(yīng)用和安全隱私保護(hù)等視角給出不同的分類維度,數(shù)據(jù)資源各維度分類信息詳見第8章的核心元數(shù)據(jù)描述部分。7.3統(tǒng)一編碼規(guī)則T/ZADTXXXX—XXXX5本標(biāo)準(zhǔn)標(biāo)識符編碼規(guī)則主要按照GB/T7027—2002規(guī)定執(zhí)行,確??缙脚_兼容性,考慮到可能未來數(shù)據(jù)資源跨園區(qū)的共享利用,并支持動態(tài)擴(kuò)展。數(shù)據(jù)資源標(biāo)識符編碼中直接包括數(shù)據(jù)資源部分分類信息,編碼數(shù)據(jù)分類代碼分為三級,第一分類采用面分法,根據(jù)數(shù)據(jù)生產(chǎn)方式進(jìn)行分類,第二級為業(yè)務(wù)場景,第三級為自定義分類,詳見第9章數(shù)據(jù)資源標(biāo)識符編碼。8核心元數(shù)據(jù)8.1元數(shù)據(jù)屬性本標(biāo)準(zhǔn)標(biāo)元數(shù)據(jù)屬性主要參照TC609-5-2025-XX(稍做修改元數(shù)據(jù)屬性包括標(biāo)識符、中文名稱、英文名稱、定義、數(shù)據(jù)類型、值域和備注等。表1元數(shù)據(jù)描述元數(shù)據(jù)的中文名稱,相同環(huán)境下的名稱唯一8.2核心元數(shù)據(jù)描述數(shù)據(jù)資源核心元數(shù)據(jù)主要包括數(shù)據(jù)資源名稱、來源、來源系統(tǒng)、來源類型、來源詳情、格式、更新頻率、使用范圍、授權(quán)方式等,其中元數(shù)據(jù)屬性來源類型和來源詳情參照TC609-5-2025-XX(稍做修改)。部分核心元數(shù)據(jù)(如來源類型、來源詳情)的設(shè)置為未來建設(shè)高質(zhì)量數(shù)據(jù)集做準(zhǔn)備。表2核心元數(shù)據(jù)描述DataResourceSourceSDataResourceSourceTT/ZADTXXXX—XXXX6互聯(lián)網(wǎng)、圖書、論文、報告、標(biāo)準(zhǔn)、專利、官DataResourceSourceDDataResourceClassificatCoreSceneClassificDataAuthorizationMetT/ZADTXXXX—XXXX7DataResourceDataForoffice文件:doc、docx、ppt、pptx、xls、db2、sqlserver、dbf、access、dm等;文本cvs格式文本文件ResourceUpdateFreDataStructureFormatClassificat9數(shù)據(jù)資源標(biāo)識符編碼9.1編碼結(jié)構(gòu)數(shù)據(jù)資源標(biāo)識符用于標(biāo)識一個數(shù)據(jù)元,標(biāo)識符唯一,采用分段編碼,總共28位,包括4位數(shù)據(jù)代碼、1位來源層級代碼、5位數(shù)據(jù)分類代碼、12位順序代碼、4位擴(kuò)展碼、2位版本號,編碼結(jié)構(gòu)圖如下所示。8圖1數(shù)據(jù)資源標(biāo)識符編碼結(jié)構(gòu)9.2數(shù)據(jù)代碼數(shù)據(jù)代碼用4位字母和數(shù)字字符來表示,取數(shù)據(jù)英文名稱首字母大寫的前4位,如果不足4位用數(shù)字0補(bǔ)全。9.3來源層級代碼數(shù)據(jù)來源層級代碼用1位數(shù)字來表示,用于表示數(shù)據(jù)資源目錄來源所在的層級,其中編碼值為1~4的表示數(shù)據(jù)來源于公共事務(wù)職能的組織,編碼5表示數(shù)據(jù)資源目錄來源于企業(yè)等其他數(shù)據(jù)源。表3數(shù)據(jù)來源層級代碼表123459.4數(shù)據(jù)分類代碼數(shù)據(jù)分類代碼分為為三級,用5位數(shù)字來表示,其中第1位表示一級分類,第2~3位表示二級分類,第4~5位表示自定義分類,后兩個級別的代碼范圍為00~99。表4數(shù)據(jù)分類代碼表9.5順序代碼順序代碼總共12位,由日期編碼和序列號編碼兩部分組成,前8位為日期編碼,包括年月日(yyyyMMdd),如20201122,后4位序列號編碼為數(shù)據(jù)資源生成時的流水碼,由4位數(shù)字字符組成,從0001開始編碼,均在數(shù)據(jù)資源時進(jìn)行編碼。如無法滿足數(shù)字字符時,可采用大寫英文字符(不使用I、O英文字符)。T/ZADTXXXX—XXXX9圖2順序代碼編碼結(jié)構(gòu)9.6擴(kuò)展碼擴(kuò)展碼總共4位,用于擴(kuò)展當(dāng)前系統(tǒng)標(biāo)識符,根據(jù)需要自定義編碼,無擴(kuò)展碼時用數(shù)字字符0000表示。9.7版本號代碼最后兩位為版本號部分,用來標(biāo)識元數(shù)據(jù)版本,用于元數(shù)據(jù)的管理和維護(hù)。編碼從數(shù)字字符01開始編碼,如元數(shù)據(jù)信息發(fā)生重大修改后編碼加1,如從01更新為02。9.8編碼示例一訂單數(shù)據(jù)資源編號:orde530400202011220001000001,根據(jù)不同結(jié)構(gòu)格式化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論