《人工智能 算子接口 第3部分:機器學(xué)習(xí)類》編制說明_第1頁
《人工智能 算子接口 第3部分:機器學(xué)習(xí)類》編制說明_第2頁
《人工智能 算子接口 第3部分:機器學(xué)習(xí)類》編制說明_第3頁
《人工智能 算子接口 第3部分:機器學(xué)習(xí)類》編制說明_第4頁
《人工智能 算子接口 第3部分:機器學(xué)習(xí)類》編制說明_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

團體標準《人工智能算子接口第3部分:機器學(xué)習(xí)類》

(送審稿)編制說明

一、工作簡況

1.1任務(wù)來源

根據(jù)新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟與中關(guān)村視聽產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)

盟聯(lián)合下達的2023年第一批團體標準立項的通知(2023年第1號),《人工智

能算子接口第3部分:機器學(xué)習(xí)類算子》(項目號:2023011204)立項。技

術(shù)歸口單位為中關(guān)村視聽產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟。

1.2起草單位

本標準的主要起草單位包括北京大學(xué)、北京大學(xué)長沙計算與數(shù)字經(jīng)濟研究

院、鵬城實驗室、中國科學(xué)院軟件研究所、深圳市海思半導(dǎo)體有限公司、北京百

度網(wǎng)訊科技有限公司。

1.3編制過程

《人工智能算子接口第3部分:機器學(xué)習(xí)類》的正式制定起始于2017年12

月舉行的新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟AI標準工作組第一次會議,會上

討論了“高性能擴展數(shù)學(xué)庫接口規(guī)范”,會議認為面向AI領(lǐng)域的高性能基礎(chǔ)庫開

發(fā)接口標準的制定是一項緊急的重要工作。

2018年3月,聯(lián)盟第二次會議上,成立了專題組,啟動標準研制工作,確定

了標準涉及的基本范疇。

2018年6月,中科院計算所、北大舉行了專題組研討會,匯總了指令集、開

發(fā)接口的相關(guān)國際進展,收集、聚焦了若干待解決的問題,明確了下一步工作計

劃。

2018年8月,聯(lián)盟第四次會議上,來自北大、寒武紀、中科院軟件所、武大、

北交大、海思、訊飛、三星通信等單位討論了AI開發(fā)接口數(shù)據(jù)類型專家推薦稿并

輸出了AIN1059《AI開發(fā)接口提案征集書》。

2020年3月,聯(lián)盟第十次會議上,來自北京大學(xué)、中國科學(xué)院軟件研究所、

鵬城實驗室等單位討論了《AI開發(fā)接口標準-機器學(xué)習(xí)提案》,會議共添加了K-

最近鄰算法(KNN)與支持向量機算法(SVM)兩個子類共13個函數(shù)接口。

2020年8月,聯(lián)盟第十二次會議上,北京大學(xué)、鵬城實驗室、中國科學(xué)院軟

件研究所三單位聯(lián)合提出提案《AI開發(fā)接口標準-機器學(xué)習(xí)操作提案》,該提案

基于核心張量數(shù)據(jù)類型,針對機器學(xué)習(xí)模塊,提出了K-最近鄰算法(KNN)、支

持向量機算法(SVM)、線性回歸、邏輯回歸、模型評估共五個子類共25個函數(shù)

接口。

2021年3月,在聯(lián)盟第十四次會議上,北京大學(xué)、中國科學(xué)院軟件研究圻、

鵬城實驗室三單位聯(lián)合提出《AI開發(fā)接口標準-機器學(xué)習(xí)操作提案》,該提案基

于核心張量數(shù)據(jù)類型,針對機器學(xué)習(xí)模塊,提出了共五個子類共25個函數(shù)接口。

2021年6月,在聯(lián)盟第十五次會議上,北京大學(xué)、中國科學(xué)院軟件研究所、

鵬城實驗室三單位聯(lián)合提出《AI開發(fā)接口標準-機器學(xué)習(xí)操作提案》,該提案基

于核心張量數(shù)據(jù)類型,針對機器學(xué)習(xí)模塊,提出了共六個子類共24個函數(shù)接口。

2021年12月,在聯(lián)盟第十七次會議上,北京大學(xué)、鵬城實驗室聯(lián)合提出《人

工智能算子接口標準-第3部分:機器學(xué)習(xí)操作》WD-接口新增提案,該提案基于

核心張量數(shù)據(jù)類型,針對機器學(xué)習(xí)模塊中的各個模型,增加模型的保存和加載操

作接口。共提出34個函數(shù)接口。

2022年6月,在聯(lián)盟第十九次會議上,北京大學(xué)、鵬城實驗室聯(lián)合提出《人

工智能算子接口標準》第3部分WD修改提案,該提案針對《AIN1348人工智能算

子接口標準-第3部分:機器學(xué)習(xí)操作》TD-vl.O進行少量內(nèi)容和格式修改。

2023年5月,在聯(lián)盟第二十三次會議上,北京大學(xué)、鵬城實驗室聯(lián)合提出《人

工智能算子接口標準》第3部分補充提案,該提案針對《人工智能算子接口標

準-第3部分:機器學(xué)習(xí)類》增加高斯混合模型和K均值聚類算法兩大類共12個接

口。

2024年6月,經(jīng)工咋組討論決定上報新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略我盟

正式征求意見。

主要起草人楊超帶頭標準制定工作、提出了技術(shù)提案、參與了參考軟件開發(fā)

并負責了標準文本編輯工作;主要起草人熬玉龍、黎子毅、李雨芮、李克森、范

睿博、段煉、勾海鵬、張軍、劉益群、洪明、胡曉光、李笑如、樊春、馬銀萍、

楊宏輝、李若淼、付振新,提出了技術(shù)提案、參與了標準制定過程中的討論、參

考軟件開發(fā)和標準文本審閱修訂;主要起草人趙海英參與了標準需求討論及部分

技術(shù)討論、在標準制定過程中給出了指導(dǎo)意見。

二、標準編制原則和確定主要內(nèi)容的論據(jù)及解決的主要問題

2.1編制原則

本標準的編制遵循以下原則:

1)科學(xué)適用原則:《人工智能算子接口第3部分:機器學(xué)習(xí)類》的制定充

分考慮了國內(nèi)高校、科研機構(gòu)以及AT框架廠商和硬件廠商實際情況,清晰地給出

了標準的適用范圍和技術(shù)內(nèi)容。標準只規(guī)范了接口相關(guān)技術(shù)內(nèi)容,不限制軟硬件

的實現(xiàn)方式,與框架和硬件解耦,給予接口實現(xiàn)者較大的優(yōu)化空間和創(chuàng)新空間,

科學(xué)適用性強.

2)協(xié)調(diào)性原則:標準的起草由國內(nèi)知名高校、科研機構(gòu)以及人工智能和信

息技術(shù)領(lǐng)域有關(guān)企業(yè)等利益相關(guān)方共同編制而成,起草過程中做到了共商共議、

協(xié)商一致,確保了標準的制定具有廣泛的代表性,能夠綜合考慮不同領(lǐng)域的需求

和技術(shù)特點。

3)通用性原則:標準應(yīng)適用于多種不同的應(yīng)用和系統(tǒng),而不僅限于特定的

平臺或框架。這有助于提高算子接口的互操作性和復(fù)用性。

4)可擴展性/可持續(xù)性原則:隨著技術(shù)的發(fā)展,算子接口可能會有新的需求

和應(yīng)用場景。因此,標準在內(nèi)容上列出了常用算子接口,并在此基礎(chǔ)上提煉出算

子接口最小集,融合了標準的規(guī)范性和指導(dǎo)性雙重屬性,并為后續(xù)接口擴展和技

術(shù)內(nèi)容更迭留有充分的制標空間,應(yīng)具有一定的前瞻性和靈活性,能夠適應(yīng)未來

的變化和需求。

5)規(guī)范性原則:標準的編寫遵守國家標準GB/T1.1-2020《標準化工作導(dǎo)

則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》。

2.2主要內(nèi)容及解決的問題

《人工智能算子接口第3部分:機器學(xué)習(xí)類》是國內(nèi)知名高校、科研機構(gòu)

和全球人工智能及信息技術(shù)領(lǐng)域有影響力的企業(yè)共同編制而成。起草組廣泛征集

了AI框架廠商和芯片提供商的技術(shù)與應(yīng)用需求,確定了機器學(xué)習(xí)類算子接口共計

14個子類62個接口,內(nèi)容包括K-最近鄰算法(KNN)、支持向量機算法(SVM)、

線性回歸算法、邏輯叵歸算法、模型評估、主成分分析、線性判別分析、高斯樸

素貝葉斯、決策樹分類模型(DTClassifier)、決策樹回歸模型(DTRegressor)、

隨機森林分類模型(RFClassifier)、隨機森林回歸模型(RFRegressor)、自適

應(yīng)提升分類模型(AdaBoostClassifier)>自適應(yīng)提升回歸模型(AdaBoost

Regressor)等接口,主要給出了接口的功能,輸入輸出參數(shù)列表,參數(shù)可選/

必選,接口返回值,C語言參考定義等內(nèi)容,適用于常用AI算法中的大部分機器

學(xué)習(xí)操作。

本標準的研制對于解決人工智能底層標準缺失、人工智能軟硬件兼容性突

出、算法部署應(yīng)用硬件體積功耗受限及適配成本高等問題具有一定貢獻。

三、主要試驗[或醛證]情況分析

本文件主要針對人T智能機器學(xué)習(xí)類算子接口相關(guān)功能、參數(shù)、返回值、C

語言參考定義等方面做出約定或給出參考,屬于人工智能算子接口系列標準的第

3部分。該系列標準包含4個部分,其中前三個部分為算子接口類別標準,第四部

分為接口自動化測試框架。自動化測試框架提供AI算子自動化測試驗證功能。AI

算子測試具有相同或相似的邏輯和流程,即“創(chuàng)建張量”、“執(zhí)行算子”和“對

比結(jié)果”。對于機器學(xué)習(xí)類算子而言,算子測試代碼的不同之處主要在于數(shù)據(jù)結(jié)

構(gòu)(如DataType、Device和Tensor等)和函數(shù)名,因為數(shù)據(jù)結(jié)構(gòu)和函數(shù)名均為用

戶自定義的。目前,百度已經(jīng)完成了機器學(xué)習(xí)類算子接口的自動化測試驗證,并

拿到了第三方檢測機構(gòu)的測試報告,算子的輸出參數(shù)、返回值等結(jié)果符合預(yù)期。

四、知識產(chǎn)權(quán)情況說明

本文件不涉及專利等知識產(chǎn)權(quán)內(nèi)容。

五、產(chǎn)業(yè)化情況、推廣應(yīng)用論證和預(yù)期達到的經(jīng)濟效果

《人工智能算了接口第3部分:機器學(xué)習(xí)類》標準的研制,得到了科技部

的支持,在分委會通過立項審查后,完成標準制定工作。在標準制定過程中,起

草組充分考慮了國內(nèi)廠商實際情況,綜合了百度PaddlePaddle、華為MindSpore

等AI框架軟件廠商和深圳市海思半導(dǎo)體有限公司的技術(shù)提案,這些國內(nèi)廠商對標

準的制定和實施做出了積極貢獻。北京大學(xué)、北京大學(xué)長沙計算與數(shù)字經(jīng)濟研究

院、鵬城實驗室、中國科學(xué)院軟件研究所等科研學(xué)術(shù)單位,在學(xué)術(shù)研究、技術(shù)提

案貢獻、會議組織討論、草案更新、材料編制等工作中給予了大力度支持。

《人工智能算子接口第3部分:機器學(xué)習(xí)類》標準的制定有助于聯(lián)通人工

智能產(chǎn)業(yè)底層硬件與上層AI框架開發(fā)平臺,有效破解AI軟件碎片化、硬件多樣化、

軟硬件適配難等行業(yè)難題,促進AI軟硬件解耦,為構(gòu)建我國新一代人工智能軟硬

件技術(shù)體系,促進人工智能產(chǎn)業(yè)的良性發(fā)展貢獻根極力量。

六、采用國際標準和國外先進標準情況

本部分未采用對應(yīng)國際標準,而是采用自主制定的技術(shù)路線。

七、與現(xiàn)行相關(guān)法律、法規(guī)、規(guī)章及相關(guān)標準的協(xié)調(diào)性

符合我國有關(guān)的現(xiàn)行法律、法規(guī)。

八、重大分歧意見的處理經(jīng)過和依據(jù)

無C

九、標準性質(zhì)的建議

建議發(fā)布為推薦性標準。

十、貫徹標準的要求和措施建議

應(yīng)通過各類國家級科技計劃和產(chǎn)業(yè)化項目資助,大力開展基于《人工智能算

子接口第3部分:機器學(xué)習(xí)類》標準的AI芯片通用算子庫和AI框架等產(chǎn)品的開發(fā)

設(shè)計,扶持算子接口標準產(chǎn)業(yè)鏈的形成。

十一、替代或廢止現(xiàn)行相關(guān)標準的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論