TGXDSL 026-2025 人工智能數(shù)據(jù)標(biāo)注服務(wù)規(guī)范_第1頁
TGXDSL 026-2025 人工智能數(shù)據(jù)標(biāo)注服務(wù)規(guī)范_第2頁
TGXDSL 026-2025 人工智能數(shù)據(jù)標(biāo)注服務(wù)規(guī)范_第3頁
TGXDSL 026-2025 人工智能數(shù)據(jù)標(biāo)注服務(wù)規(guī)范_第4頁
TGXDSL 026-2025 人工智能數(shù)據(jù)標(biāo)注服務(wù)規(guī)范_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

ICS3524001I6550

T/GXDSL團(tuán) 體 標(biāo) 準(zhǔn)T/GXDSL026—2025人工智能數(shù)據(jù)標(biāo)注服務(wù)規(guī)范ArtificialIntelligenceDataAnnotationServiceSpecification2025-5-16發(fā)布 2025-5-18實(shí)施廣西電子商務(wù)企業(yè)聯(lián)合會 發(fā)布IIT/GXDSL026—2025目??次前??言 III一、引言 1二、范圍 1三、規(guī)范性引用文件 2四、術(shù)語和定義 2(一)人工智能數(shù)據(jù)標(biāo)注 3(二)數(shù)據(jù)標(biāo)注服務(wù)提供者 3(三)數(shù)據(jù)標(biāo)注服務(wù)需求方 3(四)數(shù)據(jù)標(biāo)注工具 3(五)數(shù)據(jù)標(biāo)注規(guī)范 3(六)數(shù)據(jù)標(biāo)注質(zhì)量 3五、基本要求 4(一)數(shù)據(jù)標(biāo)注服務(wù)提供者資質(zhì) 4(二)數(shù)據(jù)標(biāo)注服務(wù)使用者要求 4(三)數(shù)據(jù)標(biāo)注工具要求 4(四)數(shù)據(jù)標(biāo)注規(guī)范要求 5六、數(shù)據(jù)標(biāo)注流程規(guī)范 5(一)需求分析 5(二)數(shù)據(jù)準(zhǔn)備 5(三)數(shù)據(jù)標(biāo)注 6(四)數(shù)據(jù)審核 6(五)數(shù)據(jù)交付 6(六)數(shù)據(jù)驗(yàn)收 6七、數(shù)據(jù)標(biāo)注質(zhì)量控制 7(一)質(zhì)量控制目標(biāo) 7(二)質(zhì)量控制措施 7(三)質(zhì)量評估指標(biāo) 7(四)質(zhì)量改進(jìn)措施 8八、數(shù)據(jù)安全與隱私保護(hù) 8PAGE\*ROMANPAGE\*ROMANIIT/GXDSL026—2025(一)數(shù)據(jù)安全要求 8(二)隱私保護(hù)要求 8(三)數(shù)據(jù)安全事件應(yīng)急處理 9九、數(shù)據(jù)標(biāo)注人員管理 9(一)人員招聘與培訓(xùn) 9(二)人員考核與激勵 9(三)人員職業(yè)道德 9十、附則 10T/GXDSL026—2025前??言本文件依據(jù)GB/T1.1-20201草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別專利的責(zé)任。本文件由廣西產(chǎn)學(xué)研科學(xué)研究院提出。本文件由廣西電子商務(wù)企業(yè)聯(lián)合會歸口。本文件主要起草人:莊文斌,韋新,龔才春,陳世卿,譚婧婧,王建,李征驥,李三雁,張志敏,本文件為首次發(fā)布。PAGEPAGE1T/GXDSL026—2025人工智能數(shù)據(jù)標(biāo)注服務(wù)規(guī)范一、引言AI本標(biāo)準(zhǔn)適用于所有提供人工智能數(shù)據(jù)標(biāo)注服務(wù)的企業(yè)、機(jī)構(gòu)和個人,以及使用數(shù)據(jù)標(biāo)注服務(wù)的用戶。二、范圍計(jì)算機(jī)視覺:圖像分類、目標(biāo)檢測、圖像分割、圖像標(biāo)注、視頻分析等。自然語言處理:文本分類、情感分析、機(jī)器翻譯、問答系統(tǒng)、文本摘要等。語音識別:語音轉(zhuǎn)文字、語音合成、語音情感分析等。數(shù)據(jù)挖掘:數(shù)據(jù)清洗、數(shù)據(jù)分類、數(shù)據(jù)聚類、關(guān)聯(lián)規(guī)則挖掘等。其他領(lǐng)域:醫(yī)療影像分析、自動駕駛、智能客服、金融風(fēng)控等。本標(biāo)準(zhǔn)適用于以下場景:T/GXDSL026—2025企業(yè)內(nèi)部數(shù)據(jù)標(biāo)注:企業(yè)為自身業(yè)務(wù)需求進(jìn)行數(shù)據(jù)標(biāo)注。數(shù)據(jù)標(biāo)注外包服務(wù):企業(yè)將數(shù)據(jù)標(biāo)注任務(wù)外包給專業(yè)的數(shù)據(jù)標(biāo)注服務(wù)提供商。眾包數(shù)據(jù)標(biāo)注:通過眾包平臺將數(shù)據(jù)標(biāo)注任務(wù)分發(fā)給大量用戶完成。開源數(shù)據(jù)標(biāo)注:開放數(shù)據(jù)標(biāo)注平臺,供用戶免費(fèi)使用和貢獻(xiàn)數(shù)據(jù)。本標(biāo)準(zhǔn)不適用于以下內(nèi)容:涉及國家秘密的數(shù)據(jù)標(biāo)注。涉及個人隱私的數(shù)據(jù)標(biāo)注,除非獲得相關(guān)授權(quán)。其他法律法規(guī)禁止的數(shù)據(jù)標(biāo)注活動。三、規(guī)范性引用文件GB/T35273-2020信息安全技術(shù)個人信息安全規(guī)范GB/T22239-2019信息安全技術(shù)網(wǎng)絡(luò)安全等級保護(hù)基本要求GB/T25069-2010信息安全技術(shù)術(shù)語GB/T39335-2020信息技術(shù)人工智能數(shù)據(jù)標(biāo)注框架與要求GB/T38667-2020信息技術(shù)大數(shù)據(jù)數(shù)據(jù)分類指南GB/T37988-2019信息安全技術(shù)數(shù)據(jù)安全能力成熟度模型GB/T36344-2018信息技術(shù)數(shù)據(jù)質(zhì)量評價(jià)指標(biāo)GB/T38664-2020信息技術(shù)大數(shù)據(jù)數(shù)據(jù)管理能力成熟度模型GB/T38673-2020信息技術(shù)人工智能機(jī)器學(xué)習(xí)模型與算法規(guī)范GB/T38674-2020信息技術(shù)人工智能數(shù)據(jù)集質(zhì)量要求GB/T42755-2023《人工智能面向機(jī)器學(xué)習(xí)的數(shù)據(jù)標(biāo)注規(guī)程》四、術(shù)語和定義PAGEPAGE3T/GXDSL026—2025下列術(shù)語和定義適用于本文件。(一)人工智能數(shù)據(jù)標(biāo)注(二)數(shù)據(jù)標(biāo)注服務(wù)提供者提供人工智能數(shù)據(jù)標(biāo)注服務(wù)的企業(yè)、機(jī)構(gòu)或個人。(三)數(shù)據(jù)標(biāo)注服務(wù)需求方使用人工智能數(shù)據(jù)標(biāo)注服務(wù)的企業(yè)、機(jī)構(gòu)或個人。(四)數(shù)據(jù)標(biāo)注工具用于輔助完成數(shù)據(jù)標(biāo)注任務(wù)的軟件或平臺。(五)數(shù)據(jù)標(biāo)注規(guī)范對數(shù)據(jù)標(biāo)注的具體要求、標(biāo)準(zhǔn)和流程的詳細(xì)說明。(六)數(shù)據(jù)標(biāo)注質(zhì)量數(shù)據(jù)標(biāo)注結(jié)果的準(zhǔn)確性、一致性、完整性和可用性。T/GXDSL026—2025五、基本要求(一)數(shù)據(jù)標(biāo)注服務(wù)提供者資質(zhì)數(shù)據(jù)標(biāo)注服務(wù)提供者應(yīng)具備以下資質(zhì):依法注冊的企業(yè)、機(jī)構(gòu)或個人,具有獨(dú)立法人資格;具備完善的組織架構(gòu)和管理制度;擁有專業(yè)的數(shù)據(jù)標(biāo)注團(tuán)隊(duì)和必要的技術(shù)設(shè)備;具備良好的信譽(yù)和履約能力。(二)數(shù)據(jù)標(biāo)注服務(wù)需求方要求數(shù)據(jù)標(biāo)注服務(wù)需求方應(yīng):明確數(shù)據(jù)標(biāo)注需求,提供清晰、完整的數(shù)據(jù)標(biāo)注任務(wù)說明;提供符合要求的數(shù)據(jù)集,并確保數(shù)據(jù)的合法性和安全性;配合數(shù)據(jù)標(biāo)注服務(wù)提供者完成數(shù)據(jù)標(biāo)注任務(wù),及時(shí)反饋意見。(三)數(shù)據(jù)標(biāo)注工具要求數(shù)據(jù)標(biāo)注工具應(yīng)滿足以下要求:功能齊全,能夠滿足不同類型數(shù)據(jù)標(biāo)注的需求;操作簡便,易于學(xué)習(xí)和使用;性能穩(wěn)定,運(yùn)行流暢;安全可靠,保障數(shù)據(jù)安全。PAGEPAGE5T/GXDSL026—2025(四)數(shù)據(jù)標(biāo)注規(guī)范要求數(shù)據(jù)標(biāo)注規(guī)范應(yīng):明確數(shù)據(jù)標(biāo)注的具體要求、標(biāo)準(zhǔn)和流程;詳細(xì)說明數(shù)據(jù)標(biāo)注的規(guī)則、方法和注意事項(xiàng);提供數(shù)據(jù)標(biāo)注示例和參考;定期更新和完善。六、數(shù)據(jù)標(biāo)注流程規(guī)范(一)需求分析數(shù)據(jù)標(biāo)注服務(wù)提供者應(yīng)與數(shù)據(jù)標(biāo)注服務(wù)需求方充分溝通,明確數(shù)據(jù)標(biāo)注需求,包括:數(shù)據(jù)類型和格式;數(shù)據(jù)標(biāo)注任務(wù)類型(如分類、檢測、分割等);數(shù)據(jù)標(biāo)注的具體要求(如標(biāo)簽體系、標(biāo)注精度等);數(shù)據(jù)標(biāo)注的交付時(shí)間和格式;數(shù)據(jù)標(biāo)注的預(yù)算和付款方式。(二)數(shù)據(jù)準(zhǔn)備數(shù)據(jù)清洗:去除重復(fù)、無效、錯誤的數(shù)據(jù);數(shù)據(jù)格式轉(zhuǎn)換:將數(shù)據(jù)轉(zhuǎn)換為標(biāo)注工具支持的格式;數(shù)據(jù)抽樣:根據(jù)數(shù)據(jù)量和標(biāo)注需求,進(jìn)行數(shù)據(jù)抽樣;數(shù)據(jù)加密:對敏感數(shù)據(jù)進(jìn)行加密處理,確保數(shù)據(jù)安全。T/GXDSL026—2025(三)數(shù)據(jù)標(biāo)注數(shù)據(jù)標(biāo)注服務(wù)提供者應(yīng)按照數(shù)據(jù)標(biāo)注規(guī)范,使用數(shù)據(jù)標(biāo)注工具對數(shù)據(jù)進(jìn)行標(biāo)注,并確保標(biāo)注質(zhì)量,包括:準(zhǔn)確性:標(biāo)注結(jié)果與實(shí)際情況一致;一致性:相同類型的標(biāo)注結(jié)果保持一致;完整性:所有需要標(biāo)注的數(shù)據(jù)都進(jìn)行了標(biāo)注;可用性:標(biāo)注結(jié)果清晰、易讀,便于后續(xù)使用。(四)數(shù)據(jù)審核數(shù)據(jù)標(biāo)注服務(wù)提供者應(yīng)對標(biāo)注結(jié)果進(jìn)行審核,確保標(biāo)注質(zhì)量,包括:人工審核:由經(jīng)驗(yàn)豐富的標(biāo)注人員對標(biāo)注結(jié)果進(jìn)行人工審核,糾正錯誤標(biāo)注;自動審核:利用算法對標(biāo)注結(jié)果進(jìn)行自動審核,識別潛在錯誤;交叉審核:由不同標(biāo)注人員對同一批數(shù)據(jù)進(jìn)行交叉審核,提高標(biāo)注準(zhǔn)確性。(五)數(shù)據(jù)交付數(shù)據(jù)標(biāo)注服務(wù)提供者應(yīng)按照約定的時(shí)間和格式,將標(biāo)注結(jié)果交付給數(shù)據(jù)標(biāo)注服務(wù)需求方,包括:標(biāo)注數(shù)據(jù)文件:包含原始數(shù)據(jù)和標(biāo)注結(jié)果的文件;標(biāo)注說明文檔:詳細(xì)說明標(biāo)注規(guī)范、標(biāo)注工具、標(biāo)注流程等信息;標(biāo)注質(zhì)量報(bào)告:對標(biāo)注結(jié)果的準(zhǔn)確性、一致性、完整性等進(jìn)行評估。(六)數(shù)據(jù)驗(yàn)收數(shù)據(jù)標(biāo)注服務(wù)需求方應(yīng)對交付的標(biāo)注結(jié)果進(jìn)行驗(yàn)收,包括:PAGEPAGE7T/GXDSL026—2025檢查標(biāo)注數(shù)據(jù)文件是否完整、格式是否正確;核對標(biāo)注結(jié)果是否符合標(biāo)注規(guī)范和要求;評估標(biāo)注質(zhì)量是否達(dá)到預(yù)期標(biāo)準(zhǔn);反饋驗(yàn)收意見,提出修改建議。七、數(shù)據(jù)標(biāo)注質(zhì)量控制(一)質(zhì)量控制目標(biāo)(二)質(zhì)量控制措施數(shù)據(jù)標(biāo)注服務(wù)提供者應(yīng)采取以下措施,確保數(shù)據(jù)標(biāo)注質(zhì)量:建立完善的質(zhì)量管理體系,明確質(zhì)量控制流程和責(zé)任;制定詳細(xì)的數(shù)據(jù)標(biāo)注規(guī)范,并對標(biāo)注人員進(jìn)行培訓(xùn);使用可靠的數(shù)據(jù)標(biāo)注工具,提高標(biāo)注效率和準(zhǔn)確性;對標(biāo)注結(jié)果進(jìn)行多輪審核,及時(shí)發(fā)現(xiàn)和糾正錯誤;定期進(jìn)行質(zhì)量評估,持續(xù)改進(jìn)數(shù)據(jù)標(biāo)注質(zhì)量。(三)質(zhì)量評估指標(biāo)數(shù)據(jù)標(biāo)注質(zhì)量評估指標(biāo)包括:準(zhǔn)確率:標(biāo)注結(jié)果與實(shí)際情況一致的比例;一致率:相同類型的標(biāo)注結(jié)果保持一致的比例;完整率:所有需要標(biāo)注的數(shù)據(jù)都進(jìn)行了標(biāo)注的比例;T/GXDSL026—2025可用率:標(biāo)注結(jié)果清晰、易讀,便于后續(xù)使用的比例。(四)質(zhì)量改進(jìn)措施數(shù)據(jù)標(biāo)注服務(wù)提供者應(yīng)根據(jù)質(zhì)量評估結(jié)果,采取以下措施,持續(xù)改進(jìn)數(shù)據(jù)標(biāo)注質(zhì)量:分析錯誤標(biāo)注原因,優(yōu)化標(biāo)注規(guī)范和流程;加強(qiáng)標(biāo)注人員培訓(xùn),提高標(biāo)注技能和責(zé)任心;引入更先進(jìn)的數(shù)據(jù)標(biāo)注工具,提高標(biāo)注效率和準(zhǔn)確性;建立標(biāo)注質(zhì)量獎懲機(jī)制,激勵標(biāo)注人員提高標(biāo)注質(zhì)量。八、數(shù)據(jù)安全與隱私保護(hù)(一)數(shù)據(jù)安全要求數(shù)據(jù)標(biāo)注服務(wù)提供者應(yīng)采取以下措施,確保數(shù)據(jù)安全:建立完善的數(shù)據(jù)安全管理制度,明確數(shù)據(jù)安全責(zé)任;對數(shù)據(jù)進(jìn)行加密存儲和傳輸,防止數(shù)據(jù)泄露;嚴(yán)格控制數(shù)據(jù)訪問權(quán)限,防止未經(jīng)授權(quán)的訪問;定期進(jìn)行數(shù)據(jù)安全風(fēng)險(xiǎn)評估,及時(shí)發(fā)現(xiàn)和消除安全隱患。(二)隱私保護(hù)要求數(shù)據(jù)標(biāo)注服務(wù)提供者應(yīng)采取以下措施,保護(hù)用戶隱私:遵守國家相關(guān)法律法規(guī),尊重用戶隱私權(quán);對涉及個人隱私的數(shù)據(jù)進(jìn)行脫敏處理,防止隱私泄露;與數(shù)據(jù)標(biāo)注服務(wù)需求方簽訂保密協(xié)議,明確雙方隱私保護(hù)責(zé)任;定期進(jìn)行隱私保護(hù)培訓(xùn),提高員工隱私保護(hù)意識。PAGEPAGE9T/GXDSL026—2025(三)數(shù)據(jù)安全事件應(yīng)急處理九、數(shù)據(jù)標(biāo)注人員管理(一)人員招聘與培訓(xùn)數(shù)據(jù)標(biāo)注服務(wù)提供者應(yīng)建立完善的人員招聘和培訓(xùn)機(jī)制,確保數(shù)據(jù)標(biāo)注人員具備必要的技能和素質(zhì),包括:制定明確的招聘標(biāo)準(zhǔn),選拔具備相關(guān)專業(yè)背景和技能的人員;提供系統(tǒng)的培訓(xùn),包括數(shù)據(jù)標(biāo)注規(guī)范、標(biāo)注工具使用、數(shù)據(jù)安全與隱私保護(hù)等內(nèi)容;定期進(jìn)行技能考核,評估標(biāo)注人員的專業(yè)能力和工作表現(xiàn)。(二)人員考核與激勵數(shù)據(jù)標(biāo)注服務(wù)提供者應(yīng)建立科學(xué)的考核和激勵機(jī)制,激發(fā)數(shù)據(jù)標(biāo)注人員的工作積極性和創(chuàng)造性,包括:制定合理的考核指標(biāo),定期對標(biāo)注人員的工作質(zhì)量、效率、態(tài)度等進(jìn)行考核;根據(jù)考核結(jié)果,給予相應(yīng)的獎勵

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論