算力集群多云調度技術規(guī)范_第1頁
算力集群多云調度技術規(guī)范_第2頁
算力集群多云調度技術規(guī)范_第3頁
算力集群多云調度技術規(guī)范_第4頁
算力集群多云調度技術規(guī)范_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1算力集群多云調度技術規(guī)范2.規(guī)范性引用文件3.術語和定義25.基礎能力要求5.1.1集群管理b)系統(tǒng)應提供查看、修改已創(chuàng)建的集群信息的能力,信息需包c)系統(tǒng)應具備管理員能夠將算力資源進行刪除的能力,如算力資源已承載業(yè)務,需進行清理或遷a)系統(tǒng)應提供配置文件或操作命令,使得訪問系統(tǒng)的人或程序可通過調整配置,達到算力資源異5.1.2數(shù)據(jù)存儲3a)多云容器平臺應支持跨集群的應用彈性伸縮策略,用以均衡各集群的應用實例分布,實現(xiàn)全局b)多云容器平臺應支持集群節(jié)點的水平擴展,多云容器平臺將根據(jù)應用的負載情況,輕松靈活的d)應支持跨集群的服務發(fā)現(xiàn)機制,能夠基于服務就近訪問原則實現(xiàn)業(yè)務的區(qū)域親和,從而在業(yè)務e)多云容器平臺兼容Kubernetes社區(qū)最新Federation架構,提供原生KubernetesAPI及KarmadaAPI。g)多云容器平臺應支持提供混合云、多云、多區(qū)域三?云上統(tǒng)一管理:在云上實現(xiàn)資源、應用、網(wǎng)絡等多云統(tǒng)一管理。?云上伸縮應用:當業(yè)務出現(xiàn)突發(fā)流量高峰時,實現(xiàn)云上資源的快速擴容。?云上數(shù)據(jù)無關:核心數(shù)據(jù)放在線下,公有云上運行與核心數(shù)據(jù)無關的應用。4?業(yè)務遷移過渡:合理利用原有的物理計算資源,將業(yè)務逐步平穩(wěn)切換到公有云上,實現(xiàn)資源的?統(tǒng)一管理:實現(xiàn)資源、應用、網(wǎng)絡等多云統(tǒng)一管理。?可擴展性:比單集群更高的橫向擴展性,解決單集群管理容量受限的問題。?智能路由:多集群分布在不同區(qū)域,實現(xiàn)地域親和的請求轉發(fā),降低用戶因跨區(qū)域訪問造成的?多云容災:相同業(yè)務部署到不同云運營商的集群,實現(xiàn)多云容災。?統(tǒng)一管理:實現(xiàn)資源、應用、網(wǎng)絡等多云統(tǒng)一管理。?可擴展性:比單集群更高的橫向擴展性,解決單集群管理容量受限的問題。?智能路由:多集群分布在不同區(qū)域,實現(xiàn)地域親和的請求轉發(fā),降低用戶因跨區(qū)域訪問造成的?多區(qū)域容災:相同業(yè)務部署到不同區(qū)域的集群,實現(xiàn)多云容災。集群建立聯(lián)邦后,可以使用集群管理API來管理多個集d)在多個集群之間分散工作負載(容器),以提升應用(服務f)跨集群的服務發(fā)現(xiàn),服務可以就近訪問,以降低延遲。c)應用實例自動彈性到其他云上,實現(xiàn)業(yè)務的容災管理;c)結合服務網(wǎng)格技術打通多集群網(wǎng)絡,實現(xiàn)多云/混合云應用流量治理,靈活應對業(yè)務流量突發(fā),5算力注冊為底層算力服務廠商提供與多云調度系統(tǒng)的對接能力,其目的在于采集底層算力的基礎d)應支持網(wǎng)絡策略填報,包括多云調度系統(tǒng)與底層算力對接所需的網(wǎng)絡策略信息,如a)應為用戶提供模板化API信息填報能力,包括基礎接口、參數(shù)b)應按照多云調度能力需求,將API?應對多云調度系統(tǒng)與底層算力網(wǎng)絡連通性進行校驗;?應根據(jù)用戶錄入API信息,對API接口的連通性進行校驗。b)應對用戶填報數(shù)據(jù)、API接口等進行校驗。?應支持按照規(guī)則、三方數(shù)據(jù)等對用戶錄入算力信息的校驗能力;?應支持對用戶錄入API信息,包括參數(shù)完整性、合法性、參數(shù)一性指多云調度系統(tǒng)內各個算力的標識不重復,層次性指算力標識體系應當按照標識范圍由大到小組6c)應支持將資源標識、服務標識進行組織,并定義編碼規(guī)則從而生成針對算力的唯一標識,如將資源標識和服務標識按照層級生成樹結構后a)應支持對底層算力資源的狀態(tài)、靜態(tài)配置和動態(tài)利用率等信息進行感知:?應支持對算力節(jié)點的連通性、穩(wěn)定性等的感知;?應支持對算力節(jié)點的資源總量、異構資源占比、網(wǎng)絡配置、存儲總量等配置信息等的感知;?應支持對算力節(jié)點的計算、存儲、網(wǎng)絡等資源動態(tài)利用率的感知。b)應支持對底層算力承載的服務狀態(tài)、服務占用資源量等的感知。感知管理應包括感知存儲、感知分析、感知共享和感知配置能b)應支持對感知數(shù)據(jù)的加工和分析處理能力,包括:?應支持對原始感知數(shù)據(jù)的加工能力,包括非結構化數(shù)據(jù)的信息抽取、異常數(shù)據(jù)清洗、數(shù)據(jù)預處?應支持內嵌規(guī)則策略、算法模型等,支持異常檢測等能力。c)應支持以API接口、數(shù)據(jù)庫開放等形式,向算力編b)應支持通過Benchmark、理論模型等7資源編排應支持將需求轉換等得到的大顆粒資源需求按照底層算力資資源調度應支持根據(jù)資源編排策略,實現(xiàn)資源開通等調度能力,同時a)調度執(zhí)行:應支持與底層算力資源對接,實現(xiàn)資源鏡像下發(fā)、資源預留、資源開b)調度管理:應支持在多任務情況下的調度隊列管d)調度異常處理:應支持在調度失敗、調度擁塞、調度沖突等情況下,進行算力節(jié)點和集e)資源異常處理:應支持在算力、網(wǎng)絡、存儲等資源異常情況下,自動進行資源銷毀、應用遷移8資源監(jiān)控應支持以算力感知能力為基礎,對資源a)資源監(jiān)控:應具備對已接入算力資源進行利用率、算力異常等的監(jiān)b)節(jié)點運維:應支持對集群內算力節(jié)點以及相應虛擬機、容器等進行配置變更、下線、親和度調c)應用運維:應支持對集群內服務的下線、凍結、重啟等運d)安全運維:應支持對算力節(jié)點接入的安全策略、算力集群內安全策略以及應用安全等任務管理承接業(yè)務邏輯層提供的應用需求和服務質量需求,應a)任務拆分:應支持按照任務間的依賴關系、子任務的數(shù)據(jù)需求等進行任務拆分,以滿足b)資源映射:應支持將拆分后的子任務集與資源管理能力對接,進行算力資源開通或與已開通的任務調度應支持按照任務拆分后的模板以及與底層資源的映射關系,a)調度執(zhí)行:應支持與底層算力資源對接,實現(xiàn)任務鏡像下發(fā)、環(huán)境部署、任務拉起、任b)調度管理:應支持在多任務情況下的調度隊列管理c)調度容錯:應支持面向調度流程和任務的異常處d)調度異常處理:應支持在調度失敗、調度擁塞、調度沖突等情況下,進行調度策略回退以e)任務異常處理:應支持在任務異常情況下的任務遷移、任務重啟等能力,同時支持異地雙活等高9任務監(jiān)控應支持以算力感知能力為基礎,對任務的運行狀態(tài)進行監(jiān)控,同時與業(yè)務和調度系a)任務監(jiān)控:應具備對已調度任務的運行狀態(tài)、資源占用情況、服務質量等的監(jiān)控a)應具備算力資源可視化的能力,包括但不限于資源統(tǒng)計、b)應具備網(wǎng)絡資源可視化的能力,包括但不限于網(wǎng)絡信息、拓撲信息c)應具備基礎設施可視化的能力,包括但不限于基9.1.2運維可視化9.1.3運

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論