版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
流批混部未來展望…ServerlessFlink…vn-agentvn-agent↓VirtualCluster標(biāo)準(zhǔn)化多租VirtualAPIServer輕量化多租VirtualAPIServer輕量化多租……↓↓↓agentansmagentansmflink-reserveflink-reserve-capacityflinkflink-pay-as-you-go…… …………AjobjobAjobjob …………replicas:2-ntopologySpreadConstra-labelSelector:matchLabels:/network-service-id:abcdmaxSkew:1topologyKey:topology.kubernetes.io/zonewhenUnsatisfiable:DoNotScheduleaffinity:nodeAffinity:requiredDuringSchedulingIgnoredDuri-matchExpressions:-key:topology.kubernetes.io/zoneoperator…………XXXXansmappswatchappswatchwatchwatch……pyxispyxis-managerTHANKYOUFlinkonYarnFlinkonK8sFlinkon20182023↓7.create6.createvalidate2.spec5.create...jobmanagerjobmanager2jobmanager1jobmanager1........taskmanager1....taskmanager1taskmanager2!!4.4.3.上傳jar1.提交jar3.上傳jar1.提交jar—學(xué)alerttalos!aggregatealerttalos!aggregateapply 核THANKYOUServerlessFlink:小紅書在云上k8sServerlessFlink:Xiaohongshu'sJourneyinMigratingandDeployingFlinkClusters………………各個(gè)子業(yè)務(wù)使用不同的獨(dú)占資源池,維護(hù)上百資源池人力成本巨大各個(gè)子業(yè)務(wù)使用不同的獨(dú)占資源池,維護(hù)上百資源池人力成本巨大Flink獨(dú)占池?cái)U(kuò)縮容流程復(fù)雜,涉及預(yù)算審批、云廠商開關(guān)機(jī)、機(jī)器環(huán)境初單次流程耗時(shí)在天級(jí)別nodeFlinkPodFlinkPodnodeFlinkPodFlinkPodnodeFlinkPodnodeFlinkPodFlinkPodnodeFlinkPodFlinkPodnodeFlinkPodFlinkPodnodeFlinkPodFlinkPodFlink獨(dú)占集群公共混部集群FlinkQuotaFlinkQuotaB其他業(yè)務(wù)其他業(yè)務(wù)quotaCFlinkQuotaAFlinkQuotaAnodeFlinkPodFlinkPodnodeFlinkPodFlinkPodnodeFlinkPodFlinkPodFlinkPodnodeFlinkPodFlinkPodFlinkPodnodenodeFlinkPodnodenodeFlinkPodPodFlinkPodquota擴(kuò)容quota縮容啟動(dòng)quota擴(kuò)容BaremetalSupplyBaremetalSupply標(biāo)準(zhǔn)混部池標(biāo)準(zhǔn)混部池Bu?erBu?erControllerAPIServerWorkload畫像服務(wù)Workload畫像服務(wù)ControllerMetricsAwareController更新預(yù)測(cè)指標(biāo)獲取歷史監(jiān)控監(jiān)控系統(tǒng)resourcePro?lerMetricsAware監(jiān)控系統(tǒng)resourcePro?lerMetricsAware匯總畫像,更新NodeMetrics監(jiān)聽監(jiān)聽MetricsAwareAgentAgentAgentAgentresourcePro?lerlMetricsAwareresourcePro?lerlMetricsAware實(shí)時(shí)負(fù)載感知調(diào)度SchedulerDescheduler動(dòng)態(tài)更新規(guī)則實(shí)時(shí)負(fù)載感知二次調(diào)度容器服務(wù)容器服務(wù)Node維度匯總待驅(qū)逐的pod構(gòu)造Flink請(qǐng)求URL請(qǐng)求驅(qū)逐Pod列表請(qǐng)求驅(qū)逐Pod列表校驗(yàn)pod是否在用返回RequestId或者結(jié)果根據(jù)RequestId輪訓(xùn)結(jié)果申請(qǐng)冗余pod資源ready后拉黑pod并觸發(fā)task重啟返回是否可驅(qū)逐根據(jù)返回結(jié)果執(zhí)行驅(qū)逐或放棄釋放空閑pod根據(jù)返回結(jié)果執(zhí)行驅(qū)逐或放棄收到驅(qū)逐請(qǐng)求收到驅(qū)逐結(jié)果請(qǐng)求生成并返回RequestId返回生成并返回RequestId返回RequestId對(duì)應(yīng)的請(qǐng)求狀態(tài)結(jié)束根據(jù)請(qǐng)求傳入的Pod結(jié)束根據(jù)請(qǐng)求傳入的Pod數(shù)量,申請(qǐng)對(duì)應(yīng)的新Pod否是否申請(qǐng)完成 是否申請(qǐng)完成 是否超時(shí)是觸發(fā)checkpoint觸發(fā)checkpoint獲取Pod上的Task集合主動(dòng)重啟Task上述流程正常上述流程正常執(zhí)行否設(shè)置驅(qū)逐請(qǐng)求為失敗否設(shè)置驅(qū)逐請(qǐng)求為失敗是設(shè)置驅(qū)逐請(qǐng)求為成功結(jié)束設(shè)置驅(qū)逐請(qǐng)求為成功結(jié)束使用CSIEphemeralInlineVolum資源擴(kuò)縮容耗時(shí)資源擴(kuò)縮容耗時(shí)擴(kuò)大池化資源覆蓋度年底遷移60kcore左右總體成本收益接近10k年底遷移60kcore左右總體成本收益接近10kcore應(yīng)用AutoScaler進(jìn)一步THANKYOUjobjob1job2job3...managerapiserverflinkmanagerapiserverflink/cancel等操作fetchjarjobjob-修復(fù)線程池設(shè)置bugrest服務(wù)就緒慢-不等待service關(guān)聯(lián)pod-池化復(fù)用RestClient序列化操作頻繁-刪除不必要的序列化操作operator可調(diào)諧的單集群任務(wù)數(shù)達(dá)到2w提交作業(yè)吞吐可達(dá)1000app/分鐘,全程穩(wěn)定整體吞吐1000整體吞吐1000app/m單app啟動(dòng)時(shí)延小于1.5minwatchindex優(yōu)化watcherswatchers單機(jī)Pod數(shù)與系統(tǒng)內(nèi)存關(guān)系(G)864208單機(jī)Pod數(shù)與系統(tǒng)內(nèi)存關(guān)系(G)86420850nodeCache:一輪調(diào)度中同質(zhì)作業(yè)的調(diào)度cache,nodeCache:一輪調(diào)度中同質(zhì)作業(yè)的調(diào)度cache,cachecachejobjobjoballocatejobache3allocatejobache3 源assignableexclusivewatchwatchapiserverwatchTaint/cordon/drainwatchTHANKYOULarge-ScaleCloud-NativePracticeOfFlinkatBilStreaming數(shù)量:6500+Batch數(shù)量:3000+Streaming數(shù)量:6500+Batch數(shù)量:3000+流批混部、Spark混部/opt/flink/opt/flinkconfconfpluginsusrlibL──tableapi等依賴jar物理機(jī)遷移機(jī)器從YARN物理機(jī)遷移機(jī)器從YARN集群遷移為Pod掛載物理磁盤磁盤異構(gòu)物理機(jī)磁盤數(shù)量不統(tǒng)一磁盤故障,權(quán)限問題等磁盤異構(gòu)物理機(jī)磁盤數(shù)量不統(tǒng)一磁盤故障,權(quán)限問題等磁盤負(fù)載不均RocksDB默認(rèn)隨機(jī)選擇磁盤磁盤掛載在/mnt子目錄Flink進(jìn)程啟動(dòng)時(shí)篩選可用目錄磁盤優(yōu)化殘留數(shù)據(jù)在殘留數(shù)據(jù)在Pod退出時(shí),不會(huì)刪除數(shù)據(jù)增加Podlifecycle,Pod退出時(shí)通過preStop清理數(shù)據(jù)開啟HA時(shí):任務(wù)可以從正確的Checkpoint恢復(fù),但遇PodPod處于失敗狀態(tài)Pod處于Pod處于Running狀態(tài)啟動(dòng)時(shí)根據(jù)numberOfTaskSlots值調(diào)整閾值大小,避免固定參數(shù)的不足Pid數(shù)量限制優(yōu)化服務(wù)器無法創(chuàng)建線程優(yōu)化部分作業(yè)中線程泄漏,引起所在機(jī)器可用線程數(shù)不足,影響機(jī)器上所有作
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- CCAA - 2023年01月建筑施工領(lǐng)域?qū)I(yè)答案及解析 - 詳解版(65題)
- 營(yíng)銷業(yè)務(wù)市場(chǎng)調(diào)查報(bào)告作業(yè)模板
- 2026年上海市松江區(qū)中考一模物理試題(含答案)
- 養(yǎng)老院志愿者服務(wù)管理制度
- 養(yǎng)老院環(huán)境保護(hù)管理制度
- 企業(yè)項(xiàng)目管理制度
- 統(tǒng)編版(2024)七年級(jí)上冊(cè)歷史期末復(fù)習(xí):材料分析題解題方法+50題練習(xí)題(含答案解析)
- 建立健全現(xiàn)代企業(yè)制度提升管理水平
- 2025年福建省人資集團(tuán)漳州地區(qū)招聘考試真題
- 手持小型動(dòng)力工具制作工操作管理能力考核試卷含答案
- 中藥學(xué)教材課件
- 夢(mèng)雖遙追則能達(dá)愿雖艱持則可圓模板
- 能源與動(dòng)力工程測(cè)試技術(shù) 課件 第一章 緒論確定
- 配件售后管理制度規(guī)范
- 浙江省紹興市上虞區(qū)2024-2025學(xué)年七年級(jí)上學(xué)期期末語文試題(解析版)
- 《隸書千字文》-清席夔
- 2024校長(zhǎng)在寒假期末教職工大會(huì)上精彩發(fā)言主要引用3個(gè)關(guān)鍵詞善待自己改變自己提升自己
- 《鐵路技術(shù)管理規(guī)程》(普速鐵路部分)
- 2024-2025年度“地球小博士”全國(guó)地理科普知識(shí)大賽參考試題庫(含答案)
- 北師大版六年級(jí)上冊(cè)分?jǐn)?shù)混合運(yùn)算100題帶答案
- 2024年度工程成本控制優(yōu)化合同
評(píng)論
0/150
提交評(píng)論