生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略_第1頁(yè)
生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略_第2頁(yè)
生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略_第3頁(yè)
生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略_第4頁(yè)
生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

InfoBrief,贊助商:亞馬遜云科技和英偉達(dá)|2025年5月生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略路線圖:從概念驗(yàn)證到規(guī)?;a(chǎn)IDC未來(lái)數(shù)字基礎(chǔ)設(shè)施議程研究副總裁生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略|路線圖:從概念驗(yàn)證到規(guī)模化生產(chǎn)單擊下方各個(gè)標(biāo)題,跳轉(zhuǎn)到相應(yīng)章節(jié)。本簡(jiǎn)報(bào)內(nèi)容 3未來(lái)兩年,AI工作負(fù)載將成為企業(yè)基礎(chǔ)設(shè)施投資和變革的頭號(hào)驅(qū)動(dòng)力 4許多AI項(xiàng)目之所以失敗,是因?yàn)閷?duì)AI應(yīng)用層和數(shù)據(jù)層的基礎(chǔ)設(shè)施要求不夠了解 5創(chuàng)建AI就緒型基礎(chǔ)設(shè)施需要了解場(chǎng)景的性能、安全、合規(guī)、成本和可持續(xù)發(fā)展要求 6AI模型選擇關(guān)系到成本、成果和基礎(chǔ)設(shè)施要求 7不同的AI模型和場(chǎng)景對(duì)基礎(chǔ)設(shè)施的要求也不同 8在制定部署決策時(shí)必須考慮安全、成本、連接性和數(shù)據(jù)主權(quán)/合規(guī) 9運(yùn)營(yíng)模式優(yōu)先項(xiàng)會(huì)影響部署方法 治理很重要—AI卓越中心可確保整個(gè)企業(yè)齊頭并進(jìn),加速做好AI就緒工作 根據(jù)生產(chǎn)規(guī)模要求設(shè)計(jì)概念驗(yàn)證 基本指南 贊助商寄語(yǔ) 簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)2生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略|路線圖:從概念驗(yàn)證到規(guī)模化生產(chǎn)AI解決方案和服務(wù)上每花一美元,就會(huì)為經(jīng)濟(jì)帶來(lái)4.60美元的間接和誘導(dǎo)效應(yīng)。來(lái)源:IDCMacroeconomicCenterofExcellence,2024和數(shù)據(jù)管理工具鏈在推動(dòng)這類強(qiáng)大技術(shù)應(yīng)用于大規(guī)模生產(chǎn)過(guò)程中起到的關(guān)鍵作AI可實(shí)現(xiàn)日常工作自動(dòng)化,提高效率,因此可能會(huì)徹底改變從客服到各種內(nèi)部流程的運(yùn)營(yíng)方式。AI技術(shù)的快速普及必然會(huì)產(chǎn)生深遠(yuǎn)的經(jīng)濟(jì)影響,重塑行業(yè),開辟新市場(chǎng),改變競(jìng)爭(zhēng)格局。本簡(jiǎn)報(bào)將介紹IDC對(duì)AI全球使用情況、影響和價(jià)值創(chuàng)造的研究,聚焦企一些建議,確保他們成功部署和規(guī)?;\(yùn)營(yíng)AI。3簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)3生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略|路線圖:從概念驗(yàn)證到規(guī)?;a(chǎn)4簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)4施投資和變革的頭號(hào)驅(qū)動(dòng)力未來(lái)兩年,以下哪些趨勢(shì)將對(duì)貴企業(yè)的計(jì)算和存儲(chǔ)資源利用產(chǎn)生最大的影響?65%65%渡到應(yīng)用于大規(guī)模生產(chǎn)取決于企業(yè)能否化基礎(chǔ)設(shè)施戰(zhàn)略。注意:按國(guó)家/地區(qū)IT支出加權(quán)。n=1,129;來(lái)源:IDCWorldwideDigitalInfrastructureSentimentSurvey,2024年6月5簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)5?AI的計(jì)算要求可能因AI項(xiàng)目的生命周期而異。?并非所有AI計(jì)劃都必須有立竿見影的效果;許多計(jì)劃可能需要分批進(jìn)行,需要數(shù)天甚至數(shù)周才能交付結(jié)果。數(shù)據(jù)存儲(chǔ)系統(tǒng)不統(tǒng)一加速器可擴(kuò)展性不足(無(wú)數(shù)據(jù)湖)沒有AIOps團(tuán)隊(duì)加速器可擴(kuò)展性不足生產(chǎn)環(huán)境設(shè)計(jì)不當(dāng)模型太大或太復(fù)雜不完整或不兼容的基礎(chǔ)設(shè)施堆棧層計(jì)算容量不足數(shù)據(jù)攝取能力不足硬件成本(資本支出)云實(shí)例成本(運(yùn)營(yíng)支出)將AI集成到大型基礎(chǔ)設(shè)施加速器可編程性有限過(guò)程復(fù)雜處理能力遇到瓶頸延遲問(wèn)題可擴(kuò)展特征存在差異延遲問(wèn)題硬件(結(jié)構(gòu)、互連、處理器)不合適擴(kuò)展現(xiàn)有安全防護(hù)措施6簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)6許多(但不是全部)AI工作負(fù)許多(但不是全部)AI工作負(fù)載需要高性能計(jì)算和數(shù)據(jù)基礎(chǔ)設(shè)施,這樣才能為實(shí)時(shí)分析和決策提供所需的處理能進(jìn)行。成本管理AI工作負(fù)載生命周期各個(gè)階段對(duì)基礎(chǔ)設(shè)施的消耗情況差可能成本高昂,但時(shí)間越長(zhǎng)靈活性越大。專用資產(chǎn)成本是可預(yù)測(cè)的,但難以擴(kuò)展??沙掷m(xù)發(fā)展高性能基礎(chǔ)設(shè)施對(duì)電源和冷型大小和規(guī)模的決策將直接影響能源使用和可持續(xù)發(fā)展。的全球企業(yè)一致認(rèn)為,GenAI是一項(xiàng)重要的新型企業(yè)工作負(fù)載,與ERP和電子商務(wù)一樣,未來(lái)幾年需要增加技術(shù)支出。企業(yè)基礎(chǔ)設(shè)施必須具備強(qiáng)大的安全控制和合規(guī)功能,以保護(hù)敏感數(shù)據(jù),符合AI監(jiān)管要求。n=889;來(lái)源:IDCFutureEnterpriseResiliency&SpendingSurveyWave4,2024年4月7簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)7成果和基礎(chǔ)設(shè)施要求利用現(xiàn)有模型創(chuàng)建私有模型對(duì)特殊技能的需求更低》更新頻率》數(shù)據(jù)加權(quán)和參數(shù)調(diào)整影響模型選擇的因素》數(shù)據(jù)質(zhì)量和數(shù)量》可解釋性和集成》檢索增強(qiáng)生成(模型大小相差很大,源模型都需要—定程度的調(diào)優(yōu),8簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)8診《診《部署位置和集成處理器和存儲(chǔ)之間的權(quán)衡部署位置和集成權(quán)控制的程度.模型規(guī)模和性能.數(shù)據(jù)量和速度.所需的價(jià)值實(shí)現(xiàn)時(shí)間.所需的輸出精度.數(shù)據(jù)安全、合規(guī)和主權(quán).使用量和容量.模型自定義和更新的級(jí)別和頻率.數(shù)據(jù)和工作流互操作水平.延遲和性能、制定動(dòng)態(tài)持續(xù)的模型更新和遷移計(jì)劃,以滿足不斷變化的數(shù)據(jù)科學(xué)9簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)9在判斷應(yīng)用及其數(shù)據(jù)集部署位置和部署方式(跨本地?cái)?shù)據(jù)中心、托管和數(shù)據(jù)中心托管站點(diǎn)、邊緣或公有云)時(shí),哪些標(biāo)準(zhǔn)最重要?注意:按國(guó)家/地區(qū)IT支出加權(quán)。n=1,129;來(lái)源:IDCWorldwideDigitalInfrastructureSentimentSurvey,2024年6月制定跨專用和共享基礎(chǔ)設(shè)施部署數(shù)據(jù)政策框架專用計(jì)算專屬數(shù)據(jù)共享計(jì)算專屬數(shù)據(jù)專用計(jì)算公共數(shù)據(jù)共享計(jì)算公共數(shù)據(jù)簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略|路線圖:從概念驗(yàn)證到規(guī)?;a(chǎn)運(yùn)營(yíng)模式優(yōu)先項(xiàng)會(huì)影響部署方法●客戶責(zé)任共同責(zé)任●提供商責(zé)任傳統(tǒng)的本地部署資本支出數(shù)據(jù)中心托管/托管專用基礎(chǔ)設(shè)施即服務(wù)共享公有云服務(wù)設(shè)施、電力和熱力硬件配置和容量基礎(chǔ)設(shè)施軟件配置和容量生命周期管理和更新網(wǎng)絡(luò)體系結(jié)構(gòu)數(shù)據(jù)管理和安全基礎(chǔ)設(shè)施運(yùn)營(yíng)工具和人員避免技術(shù)債務(wù)來(lái)源:IDCBuildVersusBuyDecision-Making:OptimizingAI-ReadyInfrastructureROI,#US51930224,2024年3月生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略|路線圖:從概念驗(yàn)證到規(guī)模化生產(chǎn)簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)AI基礎(chǔ)設(shè)施決策框架AI基礎(chǔ)設(shè)施決策框架政策和戰(zhàn)略提供指導(dǎo),應(yīng)牽頭制定決策框架和部署指南?!仿?lián)合內(nèi)外部最好的基礎(chǔ)設(shè)施?!分笇?dǎo)選擇最適合的專用平臺(tái)和基礎(chǔ)設(shè)施技術(shù)?!吩谡麄€(gè)企業(yè)范圍內(nèi)共享經(jīng)驗(yàn)教訓(xùn)?!方⑷谫Y模式,促進(jìn)跨AI場(chǎng)景的數(shù)據(jù)和工作流集成。IT就緒工作負(fù)載性能概況服務(wù)水平目標(biāo)合規(guī)與主權(quán)參考架構(gòu)工作負(fù)載性能概況服務(wù)水平目標(biāo)合規(guī)與主權(quán)參考架構(gòu)簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略|路線圖:從概念驗(yàn)證到規(guī)?;a(chǎn)根據(jù)生產(chǎn)規(guī)模要求設(shè)計(jì)概念驗(yàn)證價(jià)值》成本》價(jià)值》成本》效率復(fù)雜性和實(shí)施障礙評(píng)估》技能和文化就緒情況》生產(chǎn)途徑生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略|路線圖:從概念驗(yàn)證到規(guī)?;a(chǎn)基本指南AI就緒型基礎(chǔ)設(shè)施成功清單?調(diào)整現(xiàn)有治理和運(yùn)營(yíng)模式,以適應(yīng)AI就緒型基礎(chǔ)設(shè)施成功清單?調(diào)整現(xiàn)有治理和運(yùn)營(yíng)模式,以適應(yīng)AI賦能型業(yè)務(wù)。?貫徹工作負(fù)載和數(shù)據(jù)驅(qū)動(dòng)的決策框架。?根據(jù)使用場(chǎng)景,將應(yīng)用和數(shù)據(jù)匹配到最合適的平臺(tái)和??利用開源社區(qū)和供應(yīng)商群體,獲取最新的創(chuàng)新成果和最佳實(shí)踐。?基于AI優(yōu)化的基礎(chǔ)設(shè)施(例如GPU服務(wù)器、全閃存陣列)50%50%簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)IDC未來(lái)數(shù)字基礎(chǔ)設(shè)施議程研究副總裁MaryJohnstonTurner是IDC未來(lái)企業(yè)研究團(tuán)隊(duì)成員,擔(dān)任未來(lái)數(shù)字基礎(chǔ)設(shè)施研究副總裁。她分析企業(yè)IT和業(yè)務(wù)戰(zhàn)略如何利用部署在專用數(shù)據(jù)中心和共享公共服務(wù)環(huán)境中的無(wú)處不在的自主云基礎(chǔ)設(shè)施解決方案。她的研究工作以企業(yè)改革數(shù)字基礎(chǔ)設(shè)施解決方案采購(gòu)、保護(hù)和優(yōu)化的最佳實(shí)踐為基礎(chǔ)開展調(diào)查和深入分析,強(qiáng)調(diào)企業(yè)客戶的聲音。她的研究著重探討即用即付訂閱、跨云控制面和協(xié)作式企業(yè)基礎(chǔ)設(shè)施治理模式如何幫助企業(yè)更好地將基礎(chǔ)設(shè)施投資與關(guān)鍵業(yè)務(wù)成果和創(chuàng)新優(yōu)先點(diǎn)保持—致。生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略|路線圖:從概念驗(yàn)證到規(guī)模化生產(chǎn)簡(jiǎn)報(bào),贊助商:2025年5月亞馬遜云科技和英偉達(dá)簡(jiǎn)報(bào),贊助商:2025年5月亞馬遜云科技和英偉達(dá)亞馬遜云科技nvIDIA在快速發(fā)展的AI領(lǐng)域,企業(yè)尋求加速部署生成式和代理式AI解決方案,以更快地釋放商業(yè)價(jià)值。14年來(lái),AWS和NVIDIA—直合作提供全面的高性能AI訓(xùn)練平臺(tái),可為企業(yè)提供靈活的大規(guī)模GPU集群短期使用權(quán)。該平臺(tái)可通過(guò)AWSMarketplace以專屬優(yōu)惠的形式提供,簡(jiǎn)化了采購(gòu)流程,旨在簡(jiǎn)化和擴(kuò)展高級(jí)AI模型的開發(fā),使其成為尋求更快價(jià)值實(shí)現(xiàn)的成熟企業(yè)和初創(chuàng)公司的理想之選。NVIDIADGXCloudonAWS通過(guò)直接訪問(wèn)NVIDIA最先進(jìn)的GPU集群、—流的訓(xùn)練和編排軟件以及AI專業(yè)知識(shí)有這些都以托管服務(wù)的形式提供。該平臺(tái)針對(duì)大規(guī)模多節(jié)點(diǎn)訓(xùn)練進(jìn)行了優(yōu)化,通過(guò)內(nèi)置的作業(yè)調(diào)度和工作負(fù)載管理功能,提供連續(xù)集群、低延遲和高GPU利用率。AWSNitro系統(tǒng)通過(guò)實(shí)時(shí)更新和智能硬件監(jiān)控實(shí)現(xiàn)工作負(fù)載的持續(xù)運(yùn)行,最大限度地減少維護(hù)停機(jī)時(shí)間,同時(shí)最大限度地提高穩(wěn)定性。憑借AWS99.99%的基礎(chǔ)設(shè)施正常運(yùn)行時(shí)間,結(jié)合NVIDIA彈性GPU架構(gòu)和企業(yè)級(jí)軟件堆棧,您的工作負(fù)載將中斷風(fēng)險(xiǎn)降至最低。生成式和代理式AI就緒基礎(chǔ)設(shè)施戰(zhàn)略|路線圖:從概念驗(yàn)證到規(guī)?;a(chǎn)AI工作負(fù)載的訓(xùn)練。企業(yè)從—開始就受益于更快的模型訓(xùn)練、更短的解決方案交付時(shí)間和更高的生產(chǎn)力。AmazonEC2P6e-GB200實(shí)例搭載NVIDIAGraceBlackwell超級(jí)芯片和NVIDIA優(yōu)化的軟件堆棧,可提供前所未有的AI訓(xùn)練和推理性能。安全性至關(guān)重要,AWS提供包括加密網(wǎng)絡(luò)和安全數(shù)據(jù)存儲(chǔ)在內(nèi)的全面功能。AWSNitro系統(tǒng)為數(shù)據(jù)和模型權(quán)重提供基于硬件的安全隔離和保護(hù),而AWSKeyManagementService通過(guò)NitroEnclaves實(shí)現(xiàn)加密認(rèn)證和安全密鑰管理。與生成式和代理式AI工作流集成該平臺(tái)與AWS生成式AI堆棧無(wú)縫集成,使組織能夠構(gòu)建復(fù)雜的AI應(yīng)用程序——從聊天機(jī)器人和代碼生成器到自主AI代理。(EKS)上進(jìn)行推理,同時(shí)利用NVIDIANIM微服務(wù)和NVIDIABlueprints實(shí)現(xiàn)快速部署。作為全球最全面、應(yīng)用最廣泛的云平臺(tái),AWS提供容量最大的NVIDIAGPU驅(qū)動(dòng)的AI加速器,使客戶能夠大規(guī)模運(yùn)行要求最嚴(yán)苛的AI工作負(fù)載。NVIDIADGXCloudonAWS代表著在實(shí)現(xiàn)高性能AI基礎(chǔ)設(shè)施的普惠化訪問(wèn)方面實(shí)現(xiàn)了重大跨越。通過(guò)將NVIDIA的AI專業(yè)知識(shí)與AWS的可擴(kuò)展云服務(wù)相結(jié)合,企業(yè)可以加速其AI創(chuàng)新之旅,降低運(yùn)營(yíng)復(fù)雜性,并釋放新的商機(jī)。該平臺(tái)的性能、安全性和靈活性使其成為尋求始終站在AI創(chuàng)新前沿的組織的基石。簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)簡(jiǎn)報(bào),贊助商:亞馬遜云科技和英偉達(dá)IDccustomsolu

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論