2023算網(wǎng)操作系統(tǒng)白皮書-未來網(wǎng)絡發(fā)展大會_第1頁
2023算網(wǎng)操作系統(tǒng)白皮書-未來網(wǎng)絡發(fā)展大會_第2頁
2023算網(wǎng)操作系統(tǒng)白皮書-未來網(wǎng)絡發(fā)展大會_第3頁
2023算網(wǎng)操作系統(tǒng)白皮書-未來網(wǎng)絡發(fā)展大會_第4頁
2023算網(wǎng)操作系統(tǒng)白皮書-未來網(wǎng)絡發(fā)展大會_第5頁
已閱讀5頁,還剩154頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

本白皮書版權屬于網(wǎng)絡通信與安全紫金山實驗室及其合作單位網(wǎng)絡通信與安全紫金山實驗室、北京郵電大學江蘇省未來網(wǎng)絡創(chuàng)新研究院張晨、黃韜、周俊、謝人超、汪碩、霍如、劉韻潔):羅曙暉、汪年、張玉軍、夏令明、潘鳳薇、孫?娟、高新平、肖玉明、高松、李偉、趙芷晴、吳海喬I I III 1 1 3 7 7 10 12 15 15 19 23 28 28 31 33 38 38 42 47 55 55 56 61 67 70 73 76 76 79 83 8512速地進行函數(shù)發(fā)布與在線運行,并首次?出了FaaS(Functionasa34商將自身核心云上的技術體系以新的產(chǎn)品形態(tài)和全局統(tǒng)一的管理架身算力資源開放?供給用戶使用。源調(diào)度,使這些集群形成了一個邏輯上的算力網(wǎng);2)在第一種基礎52)通過在路由器上引入確定性傳輸能力,以保證算力間地?升網(wǎng)絡連接的擴展性和業(yè)務的靈活性,解決了光連接中的N平方問題,同時還能夠滿足應用服務/任務間靈活的流量傳輸需求;3)北向的算網(wǎng)協(xié)同關注終端用戶與應用/任務之間的交互質(zhì)量,側重于純的網(wǎng)絡上下行傳輸時間短或云端渲染時間短都可能無法滿足用戶6礎設施的理想形態(tài)就是算力資源在全網(wǎng)任意分布并為用戶統(tǒng)一呈現(xiàn)7需求到資源側的算力/網(wǎng)絡資源的調(diào)度。算網(wǎng)操作系統(tǒng)在設計之初就2.1定義推演 。來說, 。 89用同時運行時對帶寬資源進行靈活、細致的調(diào)配,3)網(wǎng)絡資源的無發(fā)、調(diào)度反饋、日志追蹤等主要能力;3)資源管理負責實現(xiàn)對于算4.2)閉環(huán)監(jiān)控判斷當前應用程序/應用間連接的運行操作系統(tǒng)的核心功能在于管理底層硬件資源以便上層應用使用。3.1.1算力資源建模節(jié)點?述方法,實現(xiàn)了對于核心云、邊緣云、零散節(jié)點、邊緣網(wǎng)關、 “資源數(shù)量”維度從網(wǎng)絡資源所能?供的“帶寬、時延、抖動” 蔽底層網(wǎng)絡層復雜邏輯把網(wǎng)絡資源抽象為一組可量化服務能力的虛 3.1.3算網(wǎng)拓撲建模多個廣域網(wǎng)彼此之間的相互聯(lián)通,并形成一個獨立的算網(wǎng)協(xié)同平面。3.2業(yè)務抽象與建模業(yè)務建模旨在通過構建一種通用的模型來?繪業(yè)務系統(tǒng)的自身與定性資源需求的不同點在于不需要對資源的剩余量進行扣減;3)如圖3-5所示,業(yè)務流量建模?述了應用訪問/被訪問的流量的2)部署要求則是?述承載該流量的網(wǎng)絡資源需求。這些?述信息旨在量化訪問路徑上流量的需求特征,同樣分為定量需求與定性需求。并進一步?述了應用與流量的關系,以此構成業(yè)務系統(tǒng)的拓撲結構。3.3調(diào)度框架與建模3.3.1應用調(diào)度模型定量調(diào)度模型則是根據(jù)應用的定量資源需求匹配合適的算力資量資源需求的算力資源的同時,需要扣減該算力資源的可用資源量。源標識,目的標識>為單元?述該流量傳輸中對網(wǎng)絡資源需求與預期3.3.3協(xié)同調(diào)度模型上述應用調(diào)度建模與流量調(diào)度建模僅能實現(xiàn)應用和流量各自獨首先,資源供應方需要對算力資源和網(wǎng)絡資源進行信息的錄用間服務訪問的網(wǎng)絡時延/帶寬需求。協(xié)同調(diào)度引擎會根據(jù)用戶藍圖4.2.2服務訪問接口4.3算網(wǎng)協(xié)同調(diào)度算網(wǎng)協(xié)同調(diào)度的核心任務是實現(xiàn)業(yè)務藍圖與算網(wǎng)拓撲之間的匹送最新業(yè)務數(shù)據(jù)到APP1,無明確的網(wǎng)絡服協(xié)同調(diào)度將對業(yè)務藍圖的需求進行分解并與相應的資源進行匹為實現(xiàn)應用/流量在初始部署時的分發(fā)/轉(zhuǎn)發(fā),以及在運行狀態(tài)下度功能模塊分別從算網(wǎng)拓撲中篩選出符合部署要求的算力資源與網(wǎng)5.1算網(wǎng)協(xié)同調(diào)度模式此小節(jié)將重點?述算網(wǎng)協(xié)同調(diào)度中三種典型的算網(wǎng)協(xié)同調(diào)度聯(lián)5.1.1先應用調(diào)度后流量5.1.2先流量調(diào)度后應用5.1.3應用流量聯(lián)合保障僅當算力和網(wǎng)絡資源能夠同時滿足應用和流量需求時才視為一次成5.2分級跨域拓撲結構5.2.1對等式結構對等式結構常見于多個業(yè)務關系緊密但運營耦合程度較低的主以作為其子集群的父集群,如此迭代即可形成一個樹狀的分層形態(tài),持這種父子關系在各個層次之間的可傳遞性以及調(diào)用接口的冪等性。5.2.3混合式結構5.3分級跨域調(diào)度流程5.3.1面向?qū)Φ仁浇Y構的調(diào)度流程業(yè)務藍圖觸發(fā)服務訪問觸發(fā)在該結構下通過服務定制網(wǎng)絡API?出流量需求5.3.2面向級聯(lián)式結構的調(diào)度流程業(yè)務藍圖觸發(fā)局協(xié)同調(diào)度進行指標分拆,如藍圖中聲明的應用總副本數(shù)約服務訪問觸發(fā)在該結構下通過服務定制網(wǎng)絡API?出流量需求5.3.3面向混合式結構的調(diào)度流程業(yè)務藍圖觸發(fā)服務訪問觸發(fā)算網(wǎng)操作系統(tǒng)在設計之初就旨在解決東數(shù)西算將面臨的挑戰(zhàn)和一種“新型總線”來實現(xiàn)數(shù)據(jù)/內(nèi)容、應用/算法在跨區(qū)域、跨集群的資源就近地接入到主板上面;2)需要有一個“新型桌面”為用戶?布式位置,而只是?出應用/算法、數(shù)據(jù)/內(nèi)容對于CPU/跨集群的情況需要分配相應的路由器隊列/光通道等廣域網(wǎng)資源,以一抽象,并進行“計算+網(wǎng)絡”的協(xié)同調(diào)度,同時能夠為用戶?供多6.2算網(wǎng)操作系統(tǒng)核心能力要用戶?前在有意向的公有云或其他資源供應方分別進行賬號與權雖然它們能夠通過容器/擴縮容的形式將應用自動地跑在物理機或者系統(tǒng)可以根據(jù)應用在測試環(huán)境中的運行效果來判斷其在實際部署運而為實現(xiàn)資源高效管理與精準調(diào)度?供基礎。傳統(tǒng)只能在終端側實現(xiàn)的實時處理能力與云端的并發(fā)處理能力相結研發(fā)等科學計算領域需要進行復雜的數(shù)值模擬和大規(guī)模數(shù)據(jù)處理,慧園區(qū)場景要求跨域協(xié)作來實現(xiàn)跨多個地理位置的設備互聯(lián)和數(shù)據(jù)用戶進行超低延遲的實時交互,多種感官信號需要高精度同步傳輸。實現(xiàn)單一服務器性能?升的目標也難以為繼。相比之下GPU可支持通算業(yè)務建模力集群內(nèi)部也可能發(fā)生在核心云和邊緣云的算力集群之間并對網(wǎng)絡多”來?高GPU復用效率,更加類似于通算場景的業(yè)務模式。分布脹以及高端算力芯片的零散分布,分布式訓練有必要從“多機多卡”任務/模型部署、任務/模型間通信的結構顯得更加固定。以數(shù)據(jù)并行超算業(yè)務建模超算業(yè)務場通常依賴于專用的超級計算或高性能計算進群來處計算進行數(shù)據(jù)文件和任務程序的切割并調(diào)度到空閑集群上實現(xiàn)協(xié)同式因而更加固定,相比于智算業(yè)務(以數(shù)據(jù)并行為例超算業(yè)務的行,任務程序間需要通過專用的集合通信來實現(xiàn)高性能的延遲能夠控制在us量級,因此需要盡量避免跨廣域網(wǎng)進行并行計算6.4.1通算典型用例6.4.3超算典型用例方之間的橋梁,平臺自身并不以任何形式直接?供算力與網(wǎng)絡資源。而淘寶自身則不?供任何貨品;高德為網(wǎng)約車和打車人?供了行程接術上能夠?qū)崿F(xiàn)責任判定是算網(wǎng)調(diào)度中心在該模式下面臨的一個某種形式的入口,因此在平臺的渠道壟斷也受到了一定程度的制約。6.6產(chǎn)業(yè)政策建議6.6.1統(tǒng)一資源并網(wǎng)成網(wǎng),為用戶便捷使用?供前?。建議:1)制定“邏輯并網(wǎng)”標準,減輕算網(wǎng)平臺與算力集群間6.6.2統(tǒng)一用戶入口在此進行單點的賬號登錄即可由入口在后臺自動打通用戶在多區(qū)域、建議:1)制定用戶身份認證與授權標準,以實現(xiàn)跨算力集群間6.6.3統(tǒng)一效用定價6.6.4統(tǒng)一多方交易的商業(yè)閉環(huán);2)加強對于數(shù)字人民幣、開放許可鏈等技術路線在算力交易中的試驗示范,實現(xiàn)算力交易從“下單、計費、分賬、付費”識、權限、性能等方面的設計中都隱式地植入了這種假設,而在其圖7-2從“存算耦合”到“存算分離”應用/任務間通信的時延不必準時但需要及時,帶寬則需要隨應用彈實現(xiàn)資源池化并?供彈性化承載通道。如圖7-3所示。上述光電融合的廣域網(wǎng)將傳統(tǒng)路由器和光的松散結合變?yōu)榫o密異構算力驅(qū)動的目標是解決不同算力芯片使用接口的多樣性和(1)制定算力驅(qū)動程序的接口標準。制定一套統(tǒng)一的算力資源程序編譯成中間指令集或WASM,并由驅(qū)動程序?qū)⑵浞g成特定硬 7.2.2統(tǒng)一數(shù)據(jù)建模 傳統(tǒng)的通用編譯器無法適應異構算力并生成高效的跨平臺代碼。(1)靜態(tài)推斷式優(yōu)化。通過對源代碼進行靜態(tài)分析,識別潛在 \\\ApplicationprogrammInformationandCommuni\UserNetworkInterfaceNNINetworktoNetworkInterfaceNATBroadcastMultipleANBMANon-BroadcastMultipleAccessMultiprotocolLabelSwitPeertoPeerParameterServerFloatingPointOperationsHorizontalPodAutoscaIntermediateRepresNaaS[1]CNCF.cf.io/about/who-we-are/[2]GoogleBlog./2008/04/introducing-google-app-[3]AWSEC2Post./cn/about-aws/whats-new/2006/08/24/announcing-amazon-elastic-compute-cloud-amazon-ec2---b[4]AW

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論