2025年智算網(wǎng)絡運維理論競賽試題附答案_第1頁
2025年智算網(wǎng)絡運維理論競賽試題附答案_第2頁
2025年智算網(wǎng)絡運維理論競賽試題附答案_第3頁
2025年智算網(wǎng)絡運維理論競賽試題附答案_第4頁
2025年智算網(wǎng)絡運維理論競賽試題附答案_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

2025年智算網(wǎng)絡運維理論競賽試題附答案1.單項選擇題(每題2分,共20分)1.1在智算網(wǎng)絡中,RDMAoverConvergedEthernet(RoCEv2)流量優(yōu)先級通常通過以下哪一類DSCP值進行映射?A.CS0B.AF41C.EFD.CS7答案:D1.2某智算中心采用FatTree拓撲,核心層與匯聚層端口速率為400Gbps,服務器接入為200Gbps,若全網(wǎng)實現(xiàn)無阻塞轉(zhuǎn)發(fā),核心層與匯聚層帶寬收斂比應設計為:A.1:1B.2:1C.4:1D.8:1答案:A1.3當使用BGPEVPN控制平面實現(xiàn)VXLANoverlay時,以下哪一條BGP屬性用于攜帶VNI信息?A.ASPathB.PMSITunnelAttributeC.ExtendedCommunityD.MED答案:C1.4在GPU池化場景下,NVLink域間轉(zhuǎn)發(fā)需依賴哪一類網(wǎng)絡協(xié)議完成跨節(jié)點尋址?A.InfiniBandSubnetManagementB.EthernetARPC.PCIeSRIOVD.RDMACM答案:A1.5智算網(wǎng)絡運維平臺通過Telemetry秒級采集接口counters,若某400Gbps接口持續(xù)出現(xiàn)Pause幀且利用率低于5%,最可能的原因是:A.光模塊誤碼B.PFC死鎖C.ECN門限過低D.隊列緩存溢出答案:B1.6某RDMA寫操作吞吐異常,抓包發(fā)現(xiàn)MTU1500字節(jié)幀占比99%,而網(wǎng)卡已開啟9000字節(jié)JumboFrame,首要排查對象應為:A.交換機ACLB.主機防火墻C.路由MTU不一致D.網(wǎng)卡驅(qū)動版本答案:C1.7在Kubernetes智算集群中,MultusCNI為Pod分配SRIOVVF時,以下哪一項CRD對象用于定義VF資源池?A.NetworkAttachmentDefinitionB.SriovNetworkNodePolicyC.SriovNetworkD.SriovNetworkPoolConfig答案:B1.8智算存儲網(wǎng)絡采用NVMeoF,若發(fā)現(xiàn)主機側(cè)出現(xiàn)“ConnectInvalidParameter”報錯,最可能缺失的配置是:A.發(fā)現(xiàn)子系統(tǒng)NQNB.控制器隊列深度C.主機NQND.傳輸層PSK答案:C1.9針對800GbpsOSFP模塊,以下哪一項數(shù)字診斷監(jiān)控(DDM)參數(shù)最能直接反映信號完整性劣化?A.TemperatureB.RxPowerC.PreFECBERD.LaserBias答案:C1.10在智算網(wǎng)絡變更窗口中,采用“灰度+回滾”策略,若BGPEVPN路由撤銷延遲超過30s,需優(yōu)先調(diào)整哪一項定時器?A.BGPKeepaliveB.BGPUpdateDelayC.BGPRouteRefreshD.BGPGracefulRestartTimer答案:D2.多項選擇題(每題3分,共15分;多選、少選、錯選均不得分)2.1以下哪些技術(shù)組合可同時實現(xiàn)智算網(wǎng)絡東西向流量負載均衡與故障域隔離?A.ECMP+BGPLinkStateB.VXLAN+EVPNAnycastGatewayC.SegmentRoutingv6+TILFAD.MLAG+VRRPE.PFC+ECN答案:A、B、C2.2在智算中心部署RDMA時,為降低尾延遲,可在主機側(cè)開啟:A.DCQCNB.ACC(AdaptiveCongestionControl)C.PCIExpressACSD.PCIeARIE.RDMACNP答案:A、B、E2.3以下哪些操作可能導致RoCEv2流量瞬斷?A.交換機升級Firmware并自動復位B.修改PFCWatchdog超時時間C.更改DSCP到CoS映射表D.關(guān)閉ECN并重啟網(wǎng)卡驅(qū)動E.更換光模塊未清除TxFault答案:A、C、D、E2.4智算網(wǎng)絡可視化平臺采集gNMI數(shù)據(jù)時,必須攜帶的gRPCmetadata包括:A.usernameB.passwordC.encodingD.subscriptionidE.enterpriseid答案:A、B、C2.5在GPUDirectStorage訪問遠端NVMeoF目標時,以下哪些路徑需保證MTU≥9000?A.主機到ToR交換機B.ToR到Leaf交換機C.Leaf到Storage交換機D.存儲目標內(nèi)部PCIe交換E.管理網(wǎng)絡帶外口答案:A、B、C3.填空題(每空2分,共20分)3.1在BGPEVPNType2路由中,同時攜帶MAC與IP信息時,RouteDistinguisher格式為“RouterID:______”。答案:VLANID或VNI(任答其一即可)3.2若某400Gbps鏈路采用PAM4調(diào)制,波特率為______GBaud,則單通道速率為106.25Gbps。答案:53.1253.3當使用SRIOVVF進行RDMA通信時,VF的PCIeBus、Device、Function號需在______文件中持久化,以保證重啟后PCI地址不變。答案:/etc/udev/rules.d/80persistentnet.rules3.4在Linux內(nèi)核5.14以上版本,DCQCN算法默認通過______模塊實現(xiàn)。答案:mlx5_ib3.5智算網(wǎng)絡常用“1+1”模型進行AI訓練流量仿真,其中“1”表示______流量,另“1”表示______流量。答案:AllReduce,ParameterServer3.6若交換機ACL同時匹配TCPFlags=0x18且DSCP=48,則該ACL可過濾______類流量。答案:RoCEv2(RDMA)3.7在NVMeoF/TCP場景,主機側(cè)端口默認使用______TCP端口。答案:44203.8當使用NetronomeAgilio智能網(wǎng)卡時,eBPF程序需通過______工具鏈編譯為NIC可執(zhí)行格式。答案:nfpsdk6wind3.9智算中心冷板液冷系統(tǒng)二次側(cè)供液溫度通常設定為______℃。答案:453.10在Kubernetes集群中,為Pod分配HugePages2MiB資源時,需在容器spec.resources.limits字段填寫______。答案:hugepages2Mi4.判斷題(每題1分,共10分;正確打“√”,錯誤打“×”)4.1RoCEv1與RoCEv2主要區(qū)別在于是否支持IP路由。答案:√4.2在FatTree拓撲中,若k=48,則核心層交換機數(shù)量為k2/4。答案:√4.3交換機芯片Buffer深度越大,RDMA尾延遲一定越低。答案:×4.4使用IPv6SegmentRouting時,SRH頭中SegmentLeft字段值為0表示報文已到達最后一跳。答案:√4.5在NVMeoF/InfiniBand中,子網(wǎng)管理器(SM)高可用需通過OpenSM的虛擬路由冗余實現(xiàn)。答案:×4.6若BGPEVPN路由攜帶的EthernetTagID與本地VLAN不一致,則該路由會被靜默丟棄。答案:√4.7智算網(wǎng)絡運維中,gNMISubscribeONCE模式適用于持續(xù)監(jiān)控接口利用率。答案:×4.8當GPU采用HBM3顯存時,其帶寬與位寬成正比,與頻率無關(guān)。答案:×4.9在Linux系統(tǒng)中,ethtoolS可查看網(wǎng)卡NIClevelPFC幀計數(shù)。答案:√4.10采用液冷后,智算機房PUE可低于1.05。答案:√5.簡答題(封閉型,每題5分,共15分)5.1簡述RDMACNP(CongestionNotificationPacket)報文格式關(guān)鍵字段及作用。答案:CNP為RoCEv2ICMPv6報文,Type=0x8B,Code=0。關(guān)鍵字段包括:1)FlowLabel:復制自觸發(fā)CNP的數(shù)據(jù)報文,用于標識流;2)ECNEcho:置1,通知發(fā)送端發(fā)生擁塞;3)QueuePair(QP)Number:占用32bit,指示需降速的QP;4)SL(ServiceLevel):用于選擇降速的優(yōu)先級隊列。發(fā)送端收到CNP后按DCQCN算法降低速率,實現(xiàn)擁塞控制。5.2列舉并解釋智算網(wǎng)絡常用的三種Telemetry編碼格式。答案:1)GPB(GoogleProtocolBuffers):二進制、高效、需.proto文件;2)JSON:文本、可讀性好、帶寬開銷大;3)KVGPB:KeyValue嵌套GPB,兼容性與效率折中。5.3說明在BGPEVPN中“MassWithdraw”場景下,如何加速收斂至小于500ms。答案:1)開啟BGPAdditionalPath,預置備份路徑;2)調(diào)整BGPWithdraw處理優(yōu)先級為高速隊列;3)啟用BGPPrefixSID,結(jié)合TILFA實現(xiàn)50ms本地保護;4)在Leaf節(jié)點設置BGPRouteMap,匹配0/0路由并設置LocalPreference=50,確??焖偾袚Q;5)配置BFDforBGP,檢測間隔150ms,倍增系數(shù)3,實現(xiàn)450ms故障檢測。6.簡答題(開放型,每題10分,共20分)6.1某智算中心訓練大模型,參數(shù)規(guī)模175B,采用DP+PP+TP三維并行,GPU卡數(shù)為1024A10080GB,網(wǎng)絡為三層FatTree400Gbps。訓練過程出現(xiàn)周期性30%吞吐跌落,持續(xù)約5s,間隔約300s。請給出系統(tǒng)性排查思路與驗證步驟。答案:步驟1:采集全網(wǎng)秒級Telemetry,重點查看LeafSpine鏈路利用率、PFCPause幀、ECN標記比例;步驟2:在GPU節(jié)點運行nccltests,排除NCCL算法自身瓶頸;步驟3:使用nvidiasmitopom驗證GPU與NIC是否在同一NUMA,排除PCIe擁塞;步驟4:檢查AllReduce桶大小,若bucket=5MB,嘗試調(diào)為50MB,降低通信頻次;步驟5:對比RDMAQP數(shù)量與網(wǎng)卡上限,若QP>16k,啟用XRC減少Q(mào)P;步驟6:在交換機側(cè)查看是否出現(xiàn)MicroBurst,若瞬時緩存>15MB,調(diào)低ECN門限Kmin=50KB,Kmax=500KB;步驟7:若PFCPause幀集中來自某Spine,定位該Spine上行鏈路是否存在光模塊PreFECBER>1E6,更換模塊;步驟8:開啟DCQCN并驗證ratereductionfactor=0.5,觀察是否消除周期性跌落;步驟9:若問題仍存在,使用TensorBoardProfiler查看計算通信重疊度,若<60%,調(diào)整PPstage數(shù)由8降為4,減少氣泡;步驟10:最終通過對比實驗,記錄吞吐穩(wěn)定在95%以上,完成優(yōu)化。6.2智算存儲網(wǎng)絡需從傳統(tǒng)NAS升級為NVMeoF,要求單客戶端吞吐≥30GB/s,時延<100μs。請給出端到端設計方案,包括拓撲、協(xié)議選擇、交換機配置、主機調(diào)優(yōu)及驗證指標。答案:拓撲:采用獨立存儲Fabric,LeafSpine兩層,Leaf32口400Gbps下行,Spine64口400Gbps,存儲目標側(cè)配16口400Gbps,客戶端側(cè)雙口200Gbps×2,確保無阻塞;協(xié)議:選擇NVMeoF/RDMAoverRoCEv2,因吞吐高、時延低;交換機:開啟PFC(34隊列),ECN(Kmin=50KB,Kmax=1MB),Headroom=25KB,Jumbo9KB;存儲目標:采用NVMeOFTarget,每控制器64核,DDR1TB,Optane6TB做元數(shù)據(jù),TLC1PB做數(shù)據(jù)池,使用SPDK加速;主機:CPU隔離,NICNUMA親和,開啟ARFS、RPS、XPS,HugePages1GiB×400,fioioengine=libaio,iodepth=128,numjobs=16;驗證:fio1MiB順序讀,聚合吞吐30.5GB/s,平均時延84μs,P99時延96μs,滿足要求;監(jiān)控:通過Prometheus采集NVMeoFTargetIOPS、延遲,Grafana大盤實時告警;備份:采用雙活+快照,RPO=5min,RTO=30s。7.計算題(每題10分,共20分)7.1某智算網(wǎng)絡核心層共128臺交換機,每臺64個400Gbps口,采用DR(DimensionalRouting)算法,若全網(wǎng)東西向流量矩陣均勻,單服務器平均流量5Gbps,共32768臺服務器,計算核心層所需最少交換機臺數(shù),并驗證是否滿足無阻塞。答案:總流量=32768×5Gbps=163.84Tbps;單臺核心交換容量=64×400Gbps=25.6Tbps;理論最少臺數(shù)=163.84/25.6=6.4→向上取整7臺;實際FatTree需k2/4,k=64,核心層=1024臺,遠大于7臺,故滿足無阻塞;結(jié)論:理論最小7臺,實際部署1024臺,冗余充足。7.2某RoCEv2流以速率100Gbps發(fā)送,RTT=20μs,交換機緩存深度=1MB,ECN門限Kmin=200KB,Kmax=800KB,計算當隊列長度達到Kmin時的CNP生成間隔,并給出發(fā)送端降速后隊列排空時間。答案:隊列長度=200KB,鏈路速率=100Gbps;排隊速率=100Gbps,排空速率=0(假設降速至0),則排空時間=200KB/(100Gbps)=200×1024×8bit/100×1E9bit/s=16.384μs;CNP生成間隔由DCQCN規(guī)定為≥RTT,即≥20μs;結(jié)論:CNP間隔≥20μs,排空時間16.384μs,小于RTT,可避免隊頭阻塞。8.綜合分析題(20分)背景:某互聯(lián)網(wǎng)巨頭新建智算中心,規(guī)劃10240張A800GPU,雙軌FatTree800Gbps,業(yè)務包含千卡模型訓練、推理、存儲三網(wǎng)融合。請完成以下任務:1)給出網(wǎng)絡分層與地址規(guī)劃(含Underlay/Overlay);2)設計QoS策略,確保訓練流量零丟包,推理流量可容忍<0.1%丟包,存儲流量高吞吐;3)制定變更灰度方案,實現(xiàn)單Spine故障業(yè)務無感知;4)給出運維指標體系與告警閾值;5)計算年度能耗與PUE目標。答案:1)分層:Core:128臺800GbpsSpine,支持DR+VOQ;Leaf:640臺800Gbps,下行400Gbps×64,上行800Gbps×16;Server:雙200Gbps×2,PCIe5.0;Underlay:IPv6/64,AS=42000000004200000255,每Leaf一個/48;Overlay:VXLANVNI=1000130000,EVPNRT=AS:VNI;管理:帶外I

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論