2025年以計算加速邁進智能化未來-IDC新一代云基礎(chǔ)設(shè)施實踐報告-IDC阿里云_第1頁
2025年以計算加速邁進智能化未來-IDC新一代云基礎(chǔ)設(shè)施實踐報告-IDC阿里云_第2頁
2025年以計算加速邁進智能化未來-IDC新一代云基礎(chǔ)設(shè)施實踐報告-IDC阿里云_第3頁
2025年以計算加速邁進智能化未來-IDC新一代云基礎(chǔ)設(shè)施實踐報告-IDC阿里云_第4頁
2025年以計算加速邁進智能化未來-IDC新一代云基礎(chǔ)設(shè)施實踐報告-IDC阿里云_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

以計算加速邁進智能化未來—IDC新一代云基礎(chǔ)設(shè)施實踐報告020304趨勢:云服務能力持續(xù)躍升,加速企業(yè)數(shù)智度融合,行業(yè)定制化與智能化服務加速滲透,成本優(yōu)化與綠色計算將成為競爭的關(guān)鍵。未來,基礎(chǔ)設(shè)施的核心矛盾將從“資源供給”轉(zhuǎn)向“效率與價值平衡”,技術(shù)迭代將圍繞“彈性算力調(diào)越來越多的企業(yè)核心數(shù)據(jù)正在向云數(shù)據(jù)中心遷移,計算密集型任務處理能力與彈性資源供給能力正成為云服務商的核心競爭力。面對企業(yè)客戶的數(shù)字化轉(zhuǎn)型需求,減少延遲和工作負載可移植性將是客戶的關(guān)鍵優(yōu)先事項,為垂直特定數(shù)據(jù)類型提供量身定制的云服務將創(chuàng)造有利的競爭優(yōu)勢。在AI高速發(fā)展和在線業(yè)務快速膨脹的時代,企業(yè)用戶對云基礎(chǔ)設(shè)施的性能、成本、穩(wěn)定性、安全性等方面提出了全新的要求。為適應企業(yè)創(chuàng)新、降本增效以及業(yè)務出海等需要,云服務商不斷通過協(xié)同創(chuàng)新升級全棧服務品質(zhì),同時也利用自身融合發(fā)展的經(jīng)驗優(yōu)勢,助力企業(yè)積極開展國際化00企業(yè)在線業(yè)務的受眾范圍和功能復雜度在快速增加,在金融交易、電商直播、實時游戲等場景下,服務端動輒需要支持百萬級并發(fā)連接和毫秒級響應要求,應對海量的網(wǎng)絡協(xié)議處理、頁面加載、安全等事務。企業(yè)云計算客戶不僅對算力密度有極致追求,還期望通過連接性能和存儲技術(shù)等多個方面的協(xié)同進步,實現(xiàn)數(shù)據(jù)庫、大數(shù)據(jù)等服務平臺的性能躍升。在IDC面向全球1350家企業(yè)所做的數(shù)字化進程與業(yè)務成果調(diào)研中,應用的可用性、綜合安全性、應用的性能等都成為企業(yè)對算力密度的極致追求:企業(yè)希望利用有限的物理空間輸出更強大的算力。這一方面體現(xiàn)在一些高端的云服務實例可以提供數(shù)百、數(shù)千甚至數(shù)萬數(shù)量級的CPU、GPU核服務能力;另一方面,為滿足大數(shù)據(jù)、數(shù)據(jù)庫、3D視頻處理在內(nèi)的一些單核敏感型業(yè)務的需要,云服務仍將多技術(shù)融合提升連接性能:云服務商綜合利用內(nèi)存/緩存、PCle、RDMA、IP網(wǎng)、EIP、VPC等一系列技術(shù)升級和軟硬件融合優(yōu)化成果,大幅提升云、邊、端不同位置服務之間的協(xié)同效存儲方案升級應對大數(shù)據(jù)量沖擊:云服務商通過采用更高性能的存儲設(shè)備和更高效的存儲架構(gòu),結(jié)合對數(shù)據(jù)布局的優(yōu)化,提供貼合不同在線業(yè)務需求的個性化存儲服務,例如低時延塊存儲(數(shù)據(jù)庫多副本場景,<0.1ms延遲)、高帶寬彈性盤(大數(shù)據(jù)單副本場景,吞吐量達AI預訓練和推理過程需要存儲和預處理海量的多模態(tài)數(shù)據(jù),數(shù)據(jù)向量化趨勢也非常顯著,為保障AI應用特別是中小模型推理和傳統(tǒng)AI搜推場景的實時響應,云基礎(chǔ)設(shè)施也在架構(gòu)層面做出了持續(xù)Faiss/Flat等向量化算法進行分布式改造,使其能夠在多個計算節(jié)點上并行運行。通過數(shù)據(jù)分片和任務分配,充分利用集群的計算資源,提高處理大規(guī)模向量數(shù)據(jù)的能力。這需要云計算利用硬件加速提升數(shù)據(jù)預處理和Al推理效率:在處理器內(nèi)部增加專用硬件加速單元和專用指令集,提升數(shù)據(jù)清洗、加密與傳輸效率。對于視覺模型、視頻處理、數(shù)據(jù)庫模糊檢查詢等任務,云實例基于新一代處理器的向量指令集、矩陣加速指令集等,能夠直接支持相關(guān)AI算子執(zhí)行,簡化系統(tǒng)架構(gòu),提升響應性能與可靠性,持續(xù)改善搜推廣、語音/視頻處理以及中小模云原生方案形成整體保障:除了算力層面的降本措施,云服務商還通過持續(xù)增強彈性伸縮、Serverless以及統(tǒng)一運維等云原生解決方案的效能,實現(xiàn)硬件、算法、平臺、服務的協(xié)同進化。例如,在強化彈性伸縮能力時,綜合運用編排調(diào)度(例如Kubernetes)、服務監(jiān)控、服務治理以及相關(guān)的配置管理等云原生能力,在提高彈性伸縮的速率的同時,持續(xù)增強自動化面對智能化、全球化、融合化的發(fā)展浪潮,國內(nèi)云服務商憑借自身在互聯(lián)網(wǎng)創(chuàng)新、跨境電商以及AI創(chuàng)新應用等領(lǐng)域的創(chuàng)新優(yōu)勢,不僅可以為自身拓展新的廣闊發(fā)展空間,也為全球市場帶來新的互聯(lián)網(wǎng)創(chuàng)新推動全球市場繁榮:國內(nèi)云服務商在互聯(lián)網(wǎng)創(chuàng)新方面的成果優(yōu)勢,一方面體現(xiàn)在業(yè)務的示范效應,例如在電商、社交媒體、在線教育、遠程辦公等互聯(lián)網(wǎng)服務領(lǐng)域,國內(nèi)云服務商具有豐富的融合開發(fā)和運營經(jīng)驗,可以通過國際合作與交流,輸出到全球市場。另一方面也體現(xiàn)在豐富的技術(shù)融合經(jīng)驗,即基于自身的互聯(lián)網(wǎng)創(chuàng)新業(yè)務推動云計算服務能力的發(fā)展和進步,例如綜合運用云網(wǎng)絡、分布式云架構(gòu)、負載均衡、CDN等技術(shù),保障全球用戶獲跨境電商形成市場綜合服務優(yōu)勢:一些國內(nèi)大型云服務商具備豐富的跨境電商業(yè)務運營經(jīng)驗,可以整合跨境物流、支付等環(huán)節(jié)的資源,為跨境電商企業(yè)提供一站式的解決方案。在信息服務方面,具備強大的數(shù)據(jù)分析工具,能夠幫助跨境電商企業(yè)精準洞察不同地區(qū)消費者的AI創(chuàng)新應用不斷挖掘新的市場潛力:近年來,國內(nèi)云服務商在AI創(chuàng)新應用方面不斷突破,為挖掘全球市場新潛力提供了強大動力。相關(guān)的基礎(chǔ)AI模型和AI技術(shù)棧都十分強大,特別是能夠持續(xù)利用云計算的海量數(shù)據(jù)存儲和強大計算能力優(yōu)勢,支撐智能化的云應用出AI產(chǎn)品已經(jīng)在市場中發(fā)揮了巨大作用,例如B端市場的國內(nèi)企業(yè)生產(chǎn)、供應鏈管理、風險控面對企業(yè)海量在線業(yè)務以及復雜的創(chuàng)新場景,現(xiàn)有的云基礎(chǔ)設(shè)施常常難以應對用戶在彈性、低時復雜應用的復合性能挑戰(zhàn):以游戲場景為例,其涉及復雜的圖形渲染,以及物需要可靠的的多線程并發(fā)能力,支持多玩家同步時的后臺任務處理和AI推理。游戲業(yè)務的周期特性對于資源的彈性伸縮能力要求極高。此外,玩家數(shù)據(jù)的記錄也涉及頻繁的寫操作,需要保持長連接、低時延的計算、存儲服務。當前的游戲業(yè)務還廣泛使用到數(shù)智驅(qū)動,利用AI存算分離架構(gòu)帶來網(wǎng)絡、存儲性能壓力:在大數(shù)據(jù)、數(shù)據(jù)庫場景中,存算分離架構(gòu)使計算節(jié)點和存儲節(jié)點之間的數(shù)據(jù)傳輸量大幅增加。大數(shù)據(jù)平臺運行時,CPU負載普遍在60%以上,內(nèi)存帶寬利用率可高達80%以上。高負載情況下,保持算力的平穩(wěn)輸出非常重要,包括性能的線性度指標以及資源隔離的力度等。特別在是高密度計算環(huán)境下,單服務器下的租戶更多,相關(guān)租戶之間的故障隔離以及緩存、存儲等資源的共享訪問問題會更加突出,既要確保租戶之間運行不受任何影響,又不能以犧牲用戶訪問性能為代價。此外,多副本存儲策略在面對存算分離架構(gòu)時也會帶來數(shù)據(jù)一致性的挑戰(zhàn)。一些分布式事務處理涉及多個計算節(jié)點和云原生架構(gòu)帶來系統(tǒng)架構(gòu)和技術(shù)棧的新問題:例如如何處理微服務間頻繁的通信、復雜的拓撲、多樣化存儲以及動態(tài)多變的負載等,并強化隔離保障安全。云服務商通過持續(xù)增強彈性伸縮、Serverless以及統(tǒng)一運維等云原生解決方案的效能,幫助用戶降低成本。例如,在強化彈性伸縮能力時,綜合運用編排調(diào)度(例如Kubernetes)、服務監(jiān)控、服務治理以及相關(guān)多,格式和標準不統(tǒng)一,進一步導致管理和存儲成本的上升。在海量AI數(shù)據(jù)預處理過程中,協(xié)同計算挑戰(zhàn):規(guī)?;腁I訓練和推理任務,往往采用分布式架構(gòu)執(zhí)行,參數(shù)同步時的通信需求巨大,傳統(tǒng)云網(wǎng)絡在高并發(fā)實時通信場景下難以滿足PB級數(shù)據(jù)傳輸?shù)牡脱舆t需求。同時,很多AI任務混合使用CPU、GPU、TPU等算力,但一些云平臺對大量的異構(gòu)算力缺乏統(tǒng)體驗與效率挑戰(zhàn):大量的AI模型服務以API高并發(fā)請求極易導致服務崩潰。值得注意的是,AI任務的多樣化意味著并非所有AI任務都適合采用GPU集群方式進行處理。例如一些實時推薦、召回分析、游戲狀態(tài)管理等場景,需要全球化業(yè)務對企業(yè)云計算的規(guī)模、彈性以及各項性能指標的要求更高,技術(shù)實現(xiàn)相對復雜且成本高昂。各國家、地區(qū)的政策法規(guī)、基礎(chǔ)設(shè)施差異大,同時還要盡量保障全球服務質(zhì)量和體驗的一云服務與算力網(wǎng)點布局問題:在本土之外構(gòu)建云基礎(chǔ)設(shè)施,可能涉及土地、供電、人力等多項工作,組織協(xié)調(diào)難度極大。不同國家基礎(chǔ)設(shè)施發(fā)展水平不一,無論是中企出海還是外企入華,都會因不熟悉當?shù)丨h(huán)境而困難重重,難以獲得理想的云服務與算力支持。此外,合規(guī)風險問題不容忽視,各國對數(shù)據(jù)存儲、跨境傳輸?shù)扔袊栏褚?guī)定,稍有不慎將面臨巨額罰款和聲規(guī)模、性能與彈性需求:不同市場的業(yè)務規(guī)模差異大,在海外拓展初期,業(yè)務波動往往較大,各地區(qū)的增長難以預測,這給云計算的技術(shù)需求規(guī)劃也帶來了難題。企業(yè)既要避免初期大規(guī)模投入造成資源浪費,又要確保業(yè)務高峰時有足夠云計算資源支撐。部分地區(qū)的云服務服務質(zhì)量與體驗一致性:很多大型企業(yè),對全球化業(yè)務的服務質(zhì)量和體驗一致性要求極高,確保用戶身處任何國家都期望獲得相同體驗、相同水準的服務。但不同國家文化背景、使用習慣和技術(shù)水平差異性,都會嚴重對上述目標產(chǎn)生嚴重影響。這需要企業(yè)投入資源,兼顧全數(shù)據(jù)安全性—信任與合規(guī)的雙重考驗:云計算的多租戶架構(gòu)和分布式存儲特性增加了數(shù)據(jù)被跨域非法訪問的風險,在金融、醫(yī)療、零售等場景中,數(shù)據(jù)泄露可能引發(fā)災難性后果。此應用穩(wěn)定性—Al與線上業(yè)務的雙重沖擊:AI應用的普及加劇了云計算的不確定性。模型訓練需要應對海量數(shù)據(jù)沖擊,推理服務對延遲非常敏感。同時,大量的線上業(yè)務依賴7×24小運維復雜度—人力與資源的雙重負擔:云計算的分布式架構(gòu)和動態(tài)資源調(diào)度需求增加了運維難度。大型企業(yè)可能使用跨區(qū)域、跨云環(huán)境下數(shù)以千計的實例,處理自動化擴容、故障轉(zhuǎn)移成本控制—算力性價比難題:企業(yè)多云集群和異構(gòu)計算資源的效率和適配不足,使算力成本長期居高不下,彈性能力的缺失造成的大量云實例閑置,也加劇了浪費現(xiàn)象。在企業(yè)加速業(yè)務創(chuàng)新的背景下,大型企業(yè)的多業(yè)務線體系需要頻繁地應付新業(yè)務上線部署時千奇百怪的CIPU作為新一代云計算管控和加速中心,向下對數(shù)據(jù)中心的計算、存儲、網(wǎng)絡資源快速云化并進行硬件加速,向上接入飛天云操作系統(tǒng)實現(xiàn)彈性多租戶的安全隔離、性能優(yōu)化和成本控制,全方能,更適合公有云工作負載,能夠為浮點運算、事務型數(shù)據(jù)庫和科學計算等工作負載提供更高的PCIe3.0,48條通道PCIe5.0,80條通道支持PCIe5.0,g9i允許用戶調(diào)整CPU核心數(shù)量與時鐘頻率,以滿足特定計算需求,例如可以從120核改配2.402.292.401.531.741.53通過一系列創(chuàng)新功能顯著提升系統(tǒng)的穩(wěn)定性、可靠性和可維護性,旨在最大化平均故障間隔時間04優(yōu)秀實踐分析4.1小鵬汽車4.1小鵬汽車

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論