版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1數(shù)據(jù)中心算力技術(shù)要求和測評方法本文件規(guī)定了面向數(shù)據(jù)中心算力全生命周期,覆蓋算力接入、算力度量、算力調(diào)度、算力運(yùn)營等的技術(shù)要求以及算力測評方法。本文件適用于數(shù)據(jù)中心規(guī)劃、設(shè)計(jì)、建設(shè)、運(yùn)維等環(huán)節(jié)。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件。僅該日期對應(yīng)的版本適用于本文件,不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T43331-2023互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)技術(shù)和分級要求3術(shù)語和定義下列術(shù)語和定義適用于本文件數(shù)據(jù)中心datacenter由計(jì)算機(jī)場地(機(jī)房),其他基礎(chǔ)設(shè)施、信息系統(tǒng)軟硬件、信息資源(數(shù)據(jù))和人員以及相應(yīng)的規(guī)章制度組成的實(shí)體。服務(wù)器對數(shù)據(jù)進(jìn)行處理并實(shí)現(xiàn)結(jié)果輸出的一種能力,是衡量設(shè)備或系統(tǒng)計(jì)算能力的一個(gè)綜合指標(biāo),數(shù)值越大代表綜合計(jì)算能力越強(qiáng),包含以CPU為代表的通用計(jì)算能力和以GPU為代表的高性能算力。數(shù)據(jù)中心算力與功率的比值,即“數(shù)據(jù)中心單位功率所產(chǎn)生的算力”,是同時(shí)考慮計(jì)算性能與功率的一種效率。數(shù)值越大,代表單位功率的算力越強(qiáng),效能越高。算力度量hashratemeasurement對不同計(jì)算類型的異構(gòu)算力資源進(jìn)行統(tǒng)一抽象描述,實(shí)現(xiàn)異構(gòu)物理資源的統(tǒng)一資源描述,形成算力能力模板,為算力路由、算力設(shè)備管理、算力計(jì)費(fèi)等提供標(biāo)準(zhǔn)的算力度量規(guī)則。通過對不同業(yè)務(wù)的算力資源和算力需求進(jìn)行匹配,使合理的算力去處理相應(yīng)數(shù)據(jù)的一種以多樣性算力為基礎(chǔ),以算力網(wǎng)絡(luò)為連接,以供給有效算力求,算力服務(wù)需滿足綠色、共享、智能、可信等特征才能更好地支撐算力的典型應(yīng)用場景。包含算力設(shè)備的注冊、OAM(操作維護(hù)管理)、運(yùn)營等。統(tǒng)一的管理面可以對網(wǎng)絡(luò)和算力進(jìn)行管理4縮略語下列縮略語適用于本文件AI:人工智能(artificialintelligence)ASIC:專用集成電路(applicationspecificintegratedcircuit)CE:算效(computationalefficiency)CP:算力(computationalpower)CPM:算力管理(computationalpowermanagement)FPGA:現(xiàn)場可編程門陣列(fieldprogrammablegatearray)HPC:高性能計(jì)算(highperfornancecomputing)HPL:高性能浮點(diǎn)運(yùn)算(highperfornaneelinpack)GPU:圖形處理器(graphicsprocessingunit)HM:算力度量(hashratemeasurenent)NPU:神經(jīng)網(wǎng)絡(luò)處理器(NeuralnetworkProcessingUnit)SLA:服務(wù)等級協(xié)議(service-levelagreement)5數(shù)據(jù)中心算力接入算力資源的感知主要指對數(shù)據(jù)中心物理設(shè)備算力能力的感知與抽象,便于上層應(yīng)用對與存儲(chǔ)等算力資源的統(tǒng)一協(xié)調(diào)調(diào)度,對分布式,動(dòng)態(tài)的數(shù)據(jù)中心算力資源進(jìn)行多維度的進(jìn)行按需實(shí)時(shí)調(diào)用,快速實(shí)現(xiàn)業(yè)務(wù)部署。算力資源的感知與抽象應(yīng)滿足以下要求。b)對不同維度的算力資源進(jìn)行感知,如計(jì)算能力(算力)與功耗水平(算效):c)對異構(gòu)物理算力資源建立統(tǒng)一的算力資源描述模型,根據(jù)不同需求與應(yīng)用的算力指標(biāo),與該算d)對數(shù)據(jù)中心算力資源提供統(tǒng)一的算力資源標(biāo)識(shí),便于上層應(yīng)用的統(tǒng)一識(shí)別與調(diào)用。包括消費(fèi)和生產(chǎn)兩類需求。消費(fèi)類需求水平通過移動(dòng)互聯(lián)網(wǎng)月來呈現(xiàn):生產(chǎn)需求可通過產(chǎn)數(shù)規(guī)模指標(biāo)。應(yīng)用場景需求能夠中文全稱M1lionInstructionsPerDhrystoneMillionInstructiFloating-pointOperationsPerSec中文全稱4超算算力(CPa):指超級計(jì)算機(jī)輸出的計(jì)算能力,超級計(jì)算利用并行工作的多臺(tái)計(jì)算機(jī)系統(tǒng)的集中式計(jì)算資源,并通過專用的操作系統(tǒng)來處理極端復(fù)雜或數(shù)據(jù)密集型的問題,計(jì)算系統(tǒng)由CPU和智算算力(CPw算):指通過使用大規(guī)模異構(gòu)算力資源,包括CPU輸出的計(jì)算能力和智能算力6.3算力評級6.3.1算力評級概述數(shù)據(jù)中心的算力評級是指對數(shù)據(jù)中心服務(wù)器算力進(jìn)行綜合測算,并根據(jù)總分得到數(shù)據(jù)等級。根據(jù)得分對通用算力、超算算力、智算算力進(jìn)行1~5級的評級,其中1級為最低等級,5級為最高等表4算力評級1級國內(nèi)落后國內(nèi)領(lǐng)先國際領(lǐng)先7.1算力智能調(diào)度引擎規(guī)范作業(yè)調(diào)度包括一級調(diào)度和二級調(diào)度。一級調(diào)度系統(tǒng)根據(jù)二級調(diào)度系統(tǒng)提供的集群狀態(tài)態(tài),能夠通過最優(yōu)調(diào)度策略將用戶作業(yè)下發(fā)到某個(gè)目標(biāo)資源池集群進(jìn)行排隊(duì),再由該計(jì)算集群的二級調(diào)度系統(tǒng)進(jìn)行調(diào)度。通過統(tǒng)一接口進(jìn)行對接兩層調(diào)度系統(tǒng)。作業(yè)狀態(tài)應(yīng)包括提交后等待調(diào)度狀態(tài)、調(diào)度后下發(fā)到目標(biāo)集群狀態(tài)、目標(biāo)集群等待調(diào)度執(zhí)行狀態(tài)、目標(biāo)集群執(zhí)行狀態(tài)、目標(biāo)集群結(jié)束狀態(tài)。作業(yè)調(diào)度過程應(yīng)主要圍繞作業(yè)生命周期,推動(dòng)作業(yè)狀態(tài)的跳轉(zhuǎn),直到作業(yè)達(dá)到結(jié)束狀接口接口b(見圖2)接口c(見圖2)入接口d(見圖2)3)分布式通信模塊接口深度學(xué)習(xí)訓(xùn)練框架與異構(gòu)硬件設(shè)備適配后的軟硬件平臺(tái)應(yīng)具備多能力:應(yīng)提供對應(yīng)軟/硬件環(huán)境下的深度學(xué)習(xí)開發(fā)框架鏡像、容器編譯鏡像,支持安裝,卸載功能支持容器內(nèi)運(yùn)行環(huán)內(nèi)源碼編譯:宜支持異構(gòu)CPU編譯并支持純CPU訓(xùn)練場景,支持CPU算子深度學(xué)習(xí)訓(xùn)練框架與異構(gòu)硬件設(shè)備適配后的軟硬件平臺(tái)應(yīng)支持在圖像分類、目標(biāo)檢測、圖像分割、語義表示、機(jī)器翻譯、視頻分類、智能推薦等應(yīng)用領(lǐng)深度學(xué)習(xí)訓(xùn)練框架與異構(gòu)硬件設(shè)備適配后的軟硬件平臺(tái)應(yīng)在訓(xùn)練與穩(wěn)定性、可靠性、大規(guī)模分布式等方面達(dá)到要深度學(xué)習(xí)框架在多硬件接入適配工作上應(yīng)滿足易擴(kuò)展性的技術(shù)要8算力調(diào)度適用場景主要有資源直接調(diào)度場景、資源間接調(diào)用場景、業(yè)務(wù)調(diào)用場景、用戶驅(qū)動(dòng)業(yè)務(wù)調(diào)用場景。具體如下:a)資源直接調(diào)用場景:用戶通過算力網(wǎng)絡(luò)發(fā)布業(yè)務(wù)需求,并可直接尋找到匹配需求的算力基礎(chǔ)資源節(jié)點(diǎn)。算力網(wǎng)絡(luò)在用戶與基礎(chǔ)資源之間建立有效的資源鏈接,用戶可直接調(diào)用基礎(chǔ)資源:b)資源間接調(diào)用場景:用戶并不直接與算力網(wǎng)絡(luò)直接交互,而是通過具體的業(yè)務(wù)平臺(tái)實(shí)現(xiàn)。業(yè)務(wù)平臺(tái)通過算力網(wǎng)絡(luò)發(fā)布服務(wù)需求,尋找匹配服務(wù)需求的算力基礎(chǔ)資源,并建立資源連接。用戶單純通過業(yè)務(wù)平臺(tái)使用相應(yīng)的業(yè)務(wù)服務(wù)即可:c)業(yè)務(wù)調(diào)用場景:業(yè)務(wù)提供方已事先在算力網(wǎng)絡(luò)中某個(gè)節(jié)點(diǎn)位置完成了業(yè)務(wù)部署,并通過算力網(wǎng)絡(luò)完成業(yè)務(wù)信息發(fā)布。用戶通過算力網(wǎng)絡(luò)發(fā)起服務(wù)需求后,在算力網(wǎng)絡(luò)中直接匹配到滿足需求的業(yè)務(wù)信息,并直接調(diào)用相應(yīng)的業(yè)務(wù)服務(wù):d)用戶驅(qū)動(dòng)業(yè)務(wù)調(diào)用場景:通過細(xì)化上述幾個(gè)場景后衍化得到,即用戶驅(qū)動(dòng)業(yè)務(wù)調(diào)用場景。該場景下盡管業(yè)務(wù)需求依然由用戶在算力網(wǎng)絡(luò)中發(fā)布,并直接尋找到匹配需求的算力基礎(chǔ)資源節(jié)點(diǎn),但用戶自身并不直接負(fù)責(zé)業(yè)務(wù)服務(wù)提供和部署。用戶將匹配到的節(jié)點(diǎn)信息告知相應(yīng)的(第三方)業(yè)務(wù)平臺(tái)完成相應(yīng)的部署,并實(shí)現(xiàn)服務(wù)調(diào)用。8數(shù)據(jù)中心算力運(yùn)營8.1算力服務(wù)規(guī)則8.1.1自服務(wù)能力算力服務(wù)平臺(tái)應(yīng)具備自服務(wù)能力包括但不限于:a)用戶可通過公開平臺(tái)訪問算力資源;b)用戶可自行在平臺(tái)進(jìn)行咨詢、試用、選購、售后等服務(wù);c)用戶可進(jìn)行算力、數(shù)據(jù)、軟件等資源管理、監(jiān)控與調(diào)整;d)用戶可進(jìn)行組織、人員、對賬等運(yùn)營服務(wù)。8.1.2按需服務(wù)算力服務(wù)平臺(tái)應(yīng)具備按雷服務(wù)的能力,包括但不限于:a)用戶可根據(jù)需求進(jìn)行資源選擇及使用;b)用戶可根據(jù)需求進(jìn)行資源計(jì)量計(jì)費(fèi)c)算力服務(wù)平臺(tái)可根據(jù)資源使用情況進(jìn)行彈性伸縮。8.2算力管理規(guī)則算力服務(wù)應(yīng)具備統(tǒng)一的用戶及任務(wù)管理能力,包括但不限于a)具備統(tǒng)一的用戶管理和用戶環(huán)境配置:b)具備多種優(yōu)先級的資源調(diào)度策略;c)具備多種策略管理能力,為作業(yè)請求提供最佳資源。算力服務(wù)應(yīng)具備算力服務(wù)調(diào)度的能力,包括但不限于:a)應(yīng)具有統(tǒng)一的管理中心,進(jìn)行用戶、編排策略、服務(wù)目錄、定價(jià)管理等:b)應(yīng)具有統(tǒng)一協(xié)同中心,能夠進(jìn)行系統(tǒng)監(jiān)視、數(shù)據(jù)管理、作業(yè)管理等;9c)應(yīng)能夠協(xié)同多種算力引擎。9算力測評方法9.1通用算力測評9.1.1通用算力測評方法現(xiàn)代通用計(jì)算服務(wù)器典型應(yīng)用場景的性能需求a)評價(jià)指標(biāo)體系個(gè)秒b)綜合評分方法采用加權(quán)算術(shù)平均數(shù)計(jì)算法實(shí)現(xiàn)對系統(tǒng)每個(gè)維度的性能評分參考基礎(chǔ)配置,見附錄A,根據(jù)公式(1)將實(shí)測數(shù)據(jù)通過歸一化方法換算為無量綱的指標(biāo)得分,另外當(dāng)指標(biāo)值大于基準(zhǔn)平臺(tái)參考值時(shí),指標(biāo)得分取100。將各項(xiàng)指標(biāo)得分和權(quán)重代入公式(2)計(jì)算綜合得分w,T——不同測試指標(biāo)的權(quán)重,權(quán)重取值可參考附錄B。9.1.2通用算力評級根據(jù)得分對通用算力進(jìn)行1~5級的評級,其中1級為最低等級,5級為最高等級。具體分級情況見表10。9.2.1超算算力測試方法根據(jù)待測集群的HPL性能將系統(tǒng)規(guī)模分為大超算算力測試指標(biāo)涵蓋浮點(diǎn)性能、稀疏線性系統(tǒng)性能、存儲(chǔ)系統(tǒng)帶寬、網(wǎng)絡(luò)帶寬、AI推理及訓(xùn)練力寬寬遲測試系統(tǒng)使用MaskR-CNN模型在C參考基礎(chǔ)配置,見附錄C,根據(jù)公式(3)將實(shí)測數(shù)據(jù)通過歸一化方法換算為無量綱的指標(biāo)得分,另式中:將各項(xiàng)指標(biāo)得分和權(quán)重代入公式(4)計(jì)算綜合得分w,P?——指標(biāo)i在被測集群上的性能得分;T——不同測試指標(biāo)的權(quán)重,權(quán)重取值可參考附錄D。9.2.2超算算力評級根據(jù)得分對超算算力進(jìn)行1~5級的評級,其中1級為最低等級,5級為最高等級,具體分級情況見表13。9.3智算算力測評9.3.1智算算力評測工具智算算力測試主要分為訓(xùn)練性能測試和推理性能測試,評測工具主要包括模型和14和表15.a)訓(xùn)練測試模型訓(xùn)練性能測試所用模型及數(shù)據(jù)集如表14.目標(biāo)檢測目標(biāo)檢測目標(biāo)檢測能nrecall練的性能參考基礎(chǔ)配置,見附錄E.1,根據(jù)公式(5)將實(shí)測數(shù)據(jù)通過歸一化方法換算為無量綱的指標(biāo)得分另外當(dāng)指標(biāo)值大于基準(zhǔn)平臺(tái)參考值時(shí),指標(biāo)得分取100。將各項(xiàng)指標(biāo)得分和權(quán)重代入公式(6)計(jì)算綜合得分w。P——指標(biāo)i在被測集群上的性能得分;T——不同測試指標(biāo)的權(quán)重,權(quán)重取值可參考附錄F.1。b)推理性能測試推理性能測試主要包括不同種類推理任務(wù)的性能測試,推理任務(wù)具體包括:圖像分類、目標(biāo)檢測、型目標(biāo)檢測能1.1數(shù)據(jù)集上的推理性能參考基礎(chǔ)配置,見附錄E.2,根據(jù)公式(7)將實(shí)測數(shù)據(jù)通過歸一化方法換算為無量綱的指標(biāo)得分。另外當(dāng)指標(biāo)值大于基準(zhǔn)平臺(tái)參考值時(shí),指標(biāo)得分取100。將各項(xiàng)指標(biāo)得分和權(quán)重代入公式(8)計(jì)算綜合得分w。T——不同測試指標(biāo)的權(quán)重,權(quán)重取值可參考附錄F.2。9.3.3智算算力評級智算算力按照訓(xùn)練類和推理類進(jìn)行分別評級,其中1級為最低等級,5級為最高等a)訓(xùn)練類評級通用算力基準(zhǔn)平臺(tái)性能參考值A(chǔ).1基準(zhǔn)平臺(tái)性能參考通用算力基準(zhǔn)平臺(tái)性能參考值如表A.1所示表A.1基準(zhǔn)平臺(tái)性能參考(根據(jù)IntelXeon4214)超算算力基準(zhǔn)平臺(tái)性能參考值C.1基準(zhǔn)平臺(tái)性能參考超算算力基準(zhǔn)平臺(tái)性能參考值如表C.1所示。表C.1基準(zhǔn)平臺(tái)性能參考值(根據(jù)top500排名的指標(biāo)值)網(wǎng)絡(luò)系統(tǒng)帶寬8網(wǎng)絡(luò)系統(tǒng)帶寬
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年1月湖南高速物流發(fā)展有限公司招聘考試備考試題及答案解析
- 2026新疆石河子市華僑國有資本運(yùn)營有限公司招聘1人考試備考試題及答案解析
- 2026中國國際貨運(yùn)航空股份有限公司機(jī)務(wù)維修工程師崗位校園招聘5人筆試備考試題及答案解析
- 2026年運(yùn)動(dòng)營養(yǎng)補(bǔ)劑應(yīng)用培訓(xùn)
- 2026云南紅河州個(gè)舊市醫(yī)療衛(wèi)生共同體賈沙分院招聘編外工作人員1人筆試模擬試題及答案解析
- 2026年大連工業(yè)大學(xué)公開招聘高層次人才54人筆試參考題庫及答案解析
- 2026年可再生資源流動(dòng)的動(dòng)力學(xué)特性
- 2026年樁基設(shè)計(jì)中的地質(zhì)勘察實(shí)例
- 2026年卡通世界中的新年狂歡
- 2026年地質(zhì)災(zāi)害的多維度影響評價(jià)方法
- 七年級語文文言文閱讀理解專項(xiàng)訓(xùn)練
- 中藥熱熨敷技術(shù)及操作流程圖
- 臨床提高吸入劑使用正確率品管圈成果匯報(bào)
- 娛樂場所安全管理規(guī)定與措施
- 電影項(xiàng)目可行性分析報(bào)告(模板參考范文)
- 老年協(xié)會(huì)會(huì)員管理制度
- LLJ-4A車輪第四種檢查器
- 大索道竣工結(jié)算決算復(fù)審報(bào)告審核報(bào)告模板
- 2025年南充市中考理科綜合試卷真題(含標(biāo)準(zhǔn)答案)
- 人衛(wèi)基礎(chǔ)護(hù)理學(xué)第七版試題及答案
- 煙草物流寄遞管理制度
評論
0/150
提交評論