版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1信息技術(shù)智算服務(wù)異構(gòu)算力虛擬化及池化系統(tǒng)要求部署和優(yōu)化算力系統(tǒng),為用戶選用異構(gòu)算力服務(wù)產(chǎn)GB/T35293-2017信息技術(shù)云計算虛GB/T44158-2024信息技術(shù)云計算面向云原生的應(yīng)用支撐平臺功能要求GB/T43782-2024信息技術(shù)人工智能機器學習系統(tǒng)技術(shù)要求異構(gòu)算力heterogeneouscomp指由不同類型的計算硬件(如CPU、GPU、FPGA、NPU、ASIC等)組成的計算能力。這構(gòu)、指令集和性能特征上存在差異,共同構(gòu)成了多樣化的異構(gòu)算力虛擬化heterogeneouscomputingpowervir異構(gòu)算力池化heterogeneouscomputingp2跨平臺模型部署cross-platformmodeldeplo一種構(gòu)建和運行應(yīng)用程序的方法,充分利用云計算模型的優(yōu)勢,包括容器化、微服務(wù)、DevOps和4縮略語3AI:人工智能(ArtificialIntelligence)CPU:中央處理器(CentralProcessingCUDA:統(tǒng)一計算設(shè)備架構(gòu)(ComputeUnifiedDeviceArchitecFPGA:現(xiàn)場可編程門陣列(Field-ProgrammableGateArrGPU:圖形處理單元(GraphicsProcessingUK8S:一種開源的容器編排引擎(KuberneMiB:兆字節(jié)(Mebibyte)NPU:神經(jīng)網(wǎng)絡(luò)處理單元(NeuralProcessingUnit)ONNX:開放神經(jīng)網(wǎng)絡(luò)交換(OpenNeuralNetworkExchRBAC:基于角色的訪問控制(Role-BasedAccessContr5異構(gòu)算力虛擬化及池化技術(shù)架構(gòu)運營,實現(xiàn)對異構(gòu)算力資源的全流程管理與優(yōu)化,提升整體算力資源利異構(gòu)算力調(diào)度、異構(gòu)算力接口、運維監(jiān)控等核心技術(shù)能力,為G大模型技術(shù)體系中算力基礎(chǔ)設(shè)施與上層模型應(yīng)用銜接的關(guān)鍵紐帶,助力構(gòu)建符合國家標準的“泛在連4圖1異構(gòu)算力虛擬化及池化技術(shù)架構(gòu)a)應(yīng)支持算力接入組件管理能力;b)應(yīng)支持多架構(gòu)算力接入,包括x86架構(gòu)、ARM架構(gòu)、RISC-V架構(gòu)等多種類型處理c)應(yīng)支持多類型處理器接入,包括CPU、GPU、NPU、FPGA、ASICd)應(yīng)支持多形態(tài)算力接入,包括硬件算力、云算力、邊緣算力等多形態(tài)接入方式;e)宜支持多樣化通信協(xié)議接入,如PC于數(shù)據(jù)中心內(nèi)高性能計算集群互聯(lián),提供低延遲、高帶寬連接通用網(wǎng)絡(luò)連接協(xié)議)等,以滿足不同算力設(shè)備的通信f)宜具備算力設(shè)備自動發(fā)現(xiàn)與識別能力,可快速準確識別新接入的算力設(shè)備,自動獲取設(shè)備基礎(chǔ)信息,如型號、規(guī)格、性能參數(shù)等,并在系統(tǒng)中完成注冊與初始化g)宜支持算力設(shè)備的熱插拔接入與移除,在設(shè)備接入或移除過程中,系統(tǒng)可自動進行資源狀態(tài)更新與配置調(diào)整,不影響其他已接入算力設(shè)備h)宜具備對算力接入鏈路的監(jiān)測與故障診斷能力,實時監(jiān)控鏈路帶寬、延遲、丟包率等指標,i)宜支持對多架構(gòu)、多類型、多形態(tài)的異構(gòu)資源進行標準化識別,建立統(tǒng)一資源標簽體系,如5b)應(yīng)支持多類型處理器算力池化,包括CPU、GPc)應(yīng)支持多形態(tài)算力池化,包括硬件算力、云算力、邊緣算力等多形態(tài)的池化;d)應(yīng)支持算力池化資源分配能力,動態(tài)且精準地將池化后的算力分配至不同應(yīng)用或用戶,保障e)應(yīng)具備具備算力池化資源隔離與安全保障機制,確保不同用戶在使用池化算力時,資源相互f)宜支持算力資源的快速檢索與匹配,當有新的算力需求時,能在短時間內(nèi)從算力池中篩選出g)宜增加多種算力精度(FP32/FP16/BF16/INT8)的動態(tài)匹配兼容性要h)宜增加算力池數(shù)據(jù)交換性能要求,如“單節(jié)點≥400Gbps吞吐,端到端延遲≤1.5us”。c)應(yīng)支持多形態(tài)算力池化,包括硬件算力、云算力、邊緣算力等多形態(tài)的算力虛擬化;d)應(yīng)具備高效的資源抽象與封裝能力,將不同架構(gòu)、類型和形態(tài)的底層算力資源抽象為統(tǒng)一的虛擬資源對象,屏蔽硬件差異,為上層應(yīng)用提供簡潔、標準的資源訪e)應(yīng)支持細粒度的資源分配,如顯存、算力、vGPU數(shù)等,能夠根據(jù)應(yīng)用的具體需求分和分配虛擬算力資源,提高資源利用率,避如增加或減少虛擬核心數(shù)量、調(diào)整內(nèi)存分配等,確保應(yīng)用始終獲得最優(yōu)的g)應(yīng)提供完善的資源監(jiān)控與管理功能,實時監(jiān)測虛擬算力資源的使用情況,包括利用率、性能h)應(yīng)具備資源隔離與安全保障能力,通過硬件虛擬化技術(shù)或軟件隔離機制,確保不同虛擬算力i)宜支持虛擬算力資源的遷移,在不中斷應(yīng)用運行的情況下,實現(xiàn)虛擬算力資源在不同物理節(jié)j)宜增加遷移過程中的數(shù)據(jù)一致性保障機制要求,確保資源遷移時應(yīng)用狀態(tài)無損,避免中斷或9.1基礎(chǔ)調(diào)度能力要求6確保高優(yōu)先級任務(wù)優(yōu)先獲取算力資源,低優(yōu)先級任務(wù)錯峰如GPU顯存、CPU核心數(shù)配額等,保障資源分配公平性,避免單租戶搶占導c)宜提供可視化調(diào)度策略配置界面,支持自定義調(diào)度規(guī)則,如“優(yōu)先使用邊緣算力任務(wù)”“優(yōu)先使用低成本云算力處理非緊急任e)宜增加算力資源故障隔離機制,避免為任務(wù)分配故障節(jié)點。9.2動態(tài)調(diào)度能力要求a)應(yīng)支持網(wǎng)絡(luò)拓撲感知調(diào)度策略,通過統(tǒng)一的網(wǎng)絡(luò)拓撲API和智能調(diào)度策略,解決大規(guī)模數(shù)據(jù)b)應(yīng)支持基于實時負載數(shù)據(jù),動態(tài)調(diào)整調(diào)度策略,提供任務(wù)跨節(jié)點,跨域遷移;c)應(yīng)支持實時感知任務(wù)運行時資源需求變化,提供資源動態(tài)擴縮容,如GPU顯存分配d)應(yīng)支持定義緊急任務(wù)觸發(fā)規(guī)則,提供中斷低優(yōu)先級任務(wù)并優(yōu)先調(diào)度緊急任務(wù);e)宜支持跨域協(xié)同調(diào)度策略,進行云—邊—端協(xié)同調(diào)度,根據(jù)任務(wù)類型、網(wǎng)絡(luò)時延動態(tài)等選擇f)可支持基于算法的調(diào)度策略自優(yōu)化,通過歷史調(diào)度數(shù)據(jù),如任務(wù)完成率、資源利用率等,持g)可支持分布式環(huán)境協(xié)同調(diào)度,萬級節(jié)點規(guī)模的分布式調(diào)度架構(gòu),通過分層調(diào)度實現(xiàn)跨數(shù)據(jù)中a)應(yīng)支持硬件設(shè)備接入接口;b)應(yīng)支持資源狀態(tài)接入接口;h)應(yīng)支持資源回收接口;k)應(yīng)支持設(shè)備控制接口;m)南向接口要求和北向接口要求中,需要接口的功能細節(jié)做描述或增加接口基礎(chǔ)字段樣例。7a)應(yīng)支持跨池協(xié)同調(diào)度接口;b)應(yīng)支持推理服務(wù)調(diào)用接口;k)應(yīng)支持數(shù)據(jù)交互接口;n)應(yīng)支持算力資源計費接口。a)應(yīng)支持對異構(gòu)算力資源的算力數(shù)據(jù)的采集,如處理器算力、資源負載等;c)應(yīng)支持異構(gòu)算力指標的統(tǒng)一標準化處理,通過適配器將不同異構(gòu)資源的私有指標轉(zhuǎn)換為統(tǒng)一d)應(yīng)提供歷史數(shù)據(jù)存儲與查詢能力,e)應(yīng)支持自定義告警規(guī)則,緊急告警多通道通g)可支持異構(gòu)算力資源的多維度性能指標監(jiān)控,覆蓋硬件層、虛擬層及鏈路層;h)宜支持算力任務(wù)執(zhí)行過程的全面監(jiān)控;i)宜支持算力調(diào)度的監(jiān)控,如調(diào)度策略的執(zhí)行情況、任務(wù)隊列長度、k)可支持算力網(wǎng)絡(luò)鏈路監(jiān)控,展示網(wǎng)絡(luò)狀a)應(yīng)支持在異構(gòu)算力虛擬化和池化過程中,用戶數(shù)據(jù)的安全策略。包括數(shù)據(jù)的加密存儲、傳輸b)應(yīng)提供全鏈路安全審計日志,記錄用戶對算力資源的訪問行為、數(shù)據(jù)流向等;c)可支持數(shù)據(jù)分類分級保護,根據(jù)用戶數(shù)據(jù)敏感等級,如公開數(shù)據(jù)、商業(yè)機密、個人隱私,自8d)可支持合規(guī)性審計:定期掃描算力環(huán)境的安全配置,生a)應(yīng)具備故障檢測能力,如硬件、軟件、網(wǎng)絡(luò)等;b)應(yīng)具備數(shù)據(jù)的定期備份和快速恢復(fù)策略,確保在發(fā)c)應(yīng)具備容錯機制,當出現(xiàn)硬件故障e)可支持跨域容災(zāi)切換,如主數(shù)據(jù)中心與邊緣節(jié)點間的任務(wù)無縫遷移。a)應(yīng)具備良好的擴展性,能夠靈活應(yīng)對異構(gòu)計算設(shè)備的增加、業(yè)務(wù)規(guī)模的擴大以及技術(shù)的更新b)應(yīng)支持快速接入新型異構(gòu)算力設(shè)備及算力資源,只需在算力資源中部署相應(yīng)的接入組件,即f)應(yīng)預(yù)留未來技術(shù)適配接口,支持新型算力形態(tài)的接入框架,通過抽象層設(shè)計屏蔽底層技術(shù)差a)應(yīng)提供嚴格的資源隔離機制,確保不同用戶之間的計算資源、內(nèi)存資源、網(wǎng)絡(luò)資源等不會相b)應(yīng)支持性能隔離,確保不同用戶或者任務(wù)在高負載下仍能保持穩(wěn)定的性能,不受其他用戶或c)應(yīng)支持安全隔離,通過訪問控制和數(shù)據(jù)保護機制,確保不同任務(wù)或用戶之間的數(shù)據(jù)安全。a)應(yīng)支持異構(gòu)算力資源目錄管理能力,明確各類算力的技術(shù)參數(shù)、算力形態(tài)及服務(wù)屬性,形成b)應(yīng)支持多租戶資源配額管理,基于RBAC(基于角色的訪問控制)為不同使用c)應(yīng)支持多維度計量計費標準,包括按資源使用量、時長、性能等級及任務(wù)類型等進行計量計d)應(yīng)支持清晰的計費賬單與費用明細查詢能力,包括按租戶、時間周期、資源類型等生成賬單e)宜支持對接第三方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年草除靈乙酯項目建議書
- 2025年多路信號老化檢測系統(tǒng)項目合作計劃書
- 急腹癥護理科研進展視頻
- 肺部疾病的護理創(chuàng)新實踐
- 癲癇護理技能培訓要點
- 精神護理中的倫理問題與應(yīng)對策略
- 刮痧護理與現(xiàn)代醫(yī)學結(jié)合
- 聽課件困教學課件
- 預(yù)防醫(yī)學中的醫(yī)患
- 非銷售場景溝通話術(shù)
- 全球重點區(qū)域算力競爭態(tài)勢分析報告(2025年)-
- 2025北京熱力熱源分公司招聘10人參考筆試題庫及答案解析
- 2025年湖南省法院系統(tǒng)招聘74名聘用制書記員筆試參考題庫附答案
- 2025廣西機電職業(yè)技術(shù)學院招聘教職人員控制數(shù)人員79人備考題庫及答案解析(奪冠)
- 2026屆高考政治一輪復(fù)習:必修2 經(jīng)濟與社會 必背主干知識點清單
- 大學生校園創(chuàng)新創(chuàng)業(yè)計劃書
- 護士職業(yè)壓力管理與情緒調(diào)節(jié)策略
- 貴州國企招聘:2025貴州涼都能源有限責任公司招聘10人備考題庫及答案詳解(必刷)
- 招標人主體責任履行指引
- 2025-2026學年北師大版五年級數(shù)學上冊(全冊)知識點梳理歸納
- 2021年廣東省廣州市英語中考試卷(含答案)
評論
0/150
提交評論