AI 時(shí)代企業(yè)數(shù)據(jù)基建升級(jí)路線圖 2025 -面向Agent與大模型的數(shù)據(jù)基建指南與最佳實(shí)踐_第1頁(yè)
AI 時(shí)代企業(yè)數(shù)據(jù)基建升級(jí)路線圖 2025 -面向Agent與大模型的數(shù)據(jù)基建指南與最佳實(shí)踐_第2頁(yè)
AI 時(shí)代企業(yè)數(shù)據(jù)基建升級(jí)路線圖 2025 -面向Agent與大模型的數(shù)據(jù)基建指南與最佳實(shí)踐_第3頁(yè)
AI 時(shí)代企業(yè)數(shù)據(jù)基建升級(jí)路線圖 2025 -面向Agent與大模型的數(shù)據(jù)基建指南與最佳實(shí)踐_第4頁(yè)
AI 時(shí)代企業(yè)數(shù)據(jù)基建升級(jí)路線圖 2025 -面向Agent與大模型的數(shù)據(jù)基建指南與最佳實(shí)踐_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

A火山引擎AI-EraEnterpriseDataInfrastructureEvolutionRoadmap火山引擎數(shù)智平臺(tái)出品CONTENTS/1.1新時(shí)代、新資產(chǎn)與新基建011.2數(shù)據(jù)新基建為企業(yè)帶來(lái)的核心收益041.3AI時(shí)代企業(yè)數(shù)據(jù)基建升級(jí)的北極星原則06/2.1企業(yè)數(shù)據(jù)基建演進(jìn)階段082.2AI時(shí)代企業(yè)數(shù)據(jù)基建升級(jí)路線圖10n?/3.1基建主張:打造自由高效的數(shù)據(jù)"樂(lè)高底座"133.2核心解法:提供開(kāi)放、靈活、漸進(jìn)式基建升級(jí)方案143.3價(jià)值錨點(diǎn):回歸數(shù)據(jù)基建的實(shí)用主義153.4火山引擎的"AI時(shí)代新基建"方案16nA/案例1:運(yùn)維提效50%+,某智能決策支持平臺(tái)的敏捷進(jìn)化18案例2:從"分鐘級(jí)"到"秒級(jí)",某大模型企業(yè)的訓(xùn)練效率躍遷19案例3:給30年媒體資產(chǎn)裝上數(shù)據(jù)大腦,傳媒領(lǐng)軍者的數(shù)智進(jìn)化20案例4:資源利用率飆升至95%,某智駕企業(yè)的效能突圍21案例5:構(gòu)建全鏈路數(shù)據(jù)合規(guī)追溯,某機(jī)器人公司的智造升級(jí)22案例6:故障率降低80%,某游戲公司的AI數(shù)據(jù)加速23ve1.1新時(shí)代、新資產(chǎn)與新基建這一轉(zhuǎn)變重新定義了企業(yè)數(shù)據(jù)基建的核心使命:這一轉(zhuǎn)變重新定義了企業(yè)數(shù)據(jù)基建的核心使命:核心多模態(tài)數(shù)據(jù)資產(chǎn)核心多模態(tài)數(shù)據(jù)資產(chǎn)核心多模態(tài)數(shù)據(jù)資產(chǎn)核心多模態(tài)數(shù)據(jù)資產(chǎn)核心多模態(tài)數(shù)據(jù)資產(chǎn)核心多模態(tài)數(shù)據(jù)資產(chǎn)A/時(shí)化的多模態(tài)數(shù)據(jù)資產(chǎn),將直接轉(zhuǎn)為企業(yè)生產(chǎn)力新業(yè)務(wù)促生新需求:從"數(shù)據(jù)分析"到"模型驅(qū)動(dòng)"新需求促生新資產(chǎn):從"原始記錄"到"Token價(jià)值流"在模型驅(qū)動(dòng)的業(yè)務(wù)下,資產(chǎn)不再局限于結(jié)構(gòu)化表格,而是全面覆蓋圖像、視頻、向量等非結(jié)構(gòu)化數(shù)據(jù)。新資產(chǎn)促生新方案:實(shí)現(xiàn)數(shù)據(jù)與AI的深度融合BeforeNOWBeforeNOW傳統(tǒng)數(shù)據(jù)基礎(chǔ)設(shè)施AI時(shí)代數(shù)據(jù)新基建傳統(tǒng)數(shù)據(jù)基礎(chǔ)設(shè)施W麗CPUToken+GPUCPU結(jié)構(gòu)化數(shù)據(jù)多模態(tài)、向量化、自動(dòng)化結(jié)構(gòu)化數(shù)據(jù)新方案呼喚新基建:構(gòu)建以Token為核心流轉(zhuǎn)的新一代基建0202新需求新業(yè)務(wù)新需求新基建新資產(chǎn)新基建新方案打通AI數(shù)據(jù)生產(chǎn)-處理-消費(fèi)閉環(huán)因此,企業(yè)數(shù)據(jù)基礎(chǔ)設(shè)施升級(jí)目的,已從"擁有多少信息"轉(zhuǎn)向"駕馭多少智能"。0303ve1.2數(shù)據(jù)新基建為企業(yè)帶來(lái)的核心收益企業(yè)收益集中體現(xiàn)在以下四個(gè)方面:企業(yè)痛點(diǎn):升級(jí)亮點(diǎn):企業(yè)收益商業(yè)量化感知企業(yè)收益商業(yè)量化感知戰(zhàn)略敏捷技術(shù)棧長(zhǎng)期靈活戰(zhàn)略敏捷技術(shù)棧長(zhǎng)期靈活極致效能提升算力極致效能提升算力ROI企業(yè)痛點(diǎn):升級(jí)亮點(diǎn):企業(yè)收益商業(yè)量化感知企業(yè)收益商業(yè)量化感知0404企業(yè)痛點(diǎn):升級(jí)亮點(diǎn):企業(yè)收益商業(yè)量化感知企業(yè)收益商業(yè)量化感知業(yè)務(wù)實(shí)效應(yīng)用落地速度提升業(yè)務(wù)實(shí)效應(yīng)用落地速度提升競(jìng)爭(zhēng)壁壘內(nèi)生性進(jìn)化機(jī)制競(jìng)爭(zhēng)壁壘內(nèi)生性進(jìn)化機(jī)制企業(yè)痛點(diǎn):升級(jí)亮點(diǎn):企業(yè)收益企業(yè)收益商業(yè)量化感知極致穩(wěn)定確保系統(tǒng)在高并發(fā)場(chǎng)景下的高可用性與穩(wěn)定性。企業(yè)級(jí)實(shí)踐驗(yàn)證戰(zhàn)略保障適配未來(lái)演進(jìn)構(gòu)建面向AI時(shí)代的"模型友好型"數(shù)據(jù)基礎(chǔ)設(shè)施,將為企業(yè)帶來(lái)"三提兩降"的顯著商業(yè)價(jià)值:0505ve1.3AI時(shí)代企業(yè)數(shù)據(jù)基建升級(jí)的北極星原則能被轉(zhuǎn)化為Token并被模型高效理解的數(shù)據(jù),才是AI時(shí)代的真資產(chǎn)。構(gòu)筑企業(yè)數(shù)據(jù)安全的堅(jiān)實(shí)底座,全方位保障數(shù)據(jù)資產(chǎn)安全。支撐業(yè)務(wù)的高速迭代,實(shí)現(xiàn)算力與存儲(chǔ)的最優(yōu)解。建立數(shù)據(jù)與模型的效果反饋機(jī)制,保持持續(xù)競(jìng)爭(zhēng)力。06060707擁抱技術(shù)變革,拒絕"推倒重來(lái)"的技術(shù)革新風(fēng)險(xiǎn)。ve2.1企業(yè)數(shù)據(jù)基建演進(jìn)階段企業(yè)數(shù)據(jù)基建的演進(jìn),是業(yè)務(wù)需求和底層技術(shù)能力迭代的宏觀體現(xiàn),其發(fā)展可劃分為三個(gè)特征鮮明的階段。PC時(shí)代PC時(shí)代(數(shù)據(jù)For報(bào)表)Mobile時(shí)代(數(shù)據(jù)ForAPP/API)演進(jìn)階段0808AI時(shí)代(數(shù)據(jù)For模型)流程化ETL,周期長(zhǎng)流程化ETL,周期長(zhǎng)管理需求和流程優(yōu)化用戶體驗(yàn)和流量增長(zhǎng)創(chuàng)新業(yè)務(wù)和全流程自動(dòng)化09091010ve2.2AI時(shí)代企業(yè)數(shù)據(jù)基建升級(jí)路線圖GPU+CPUGPU+CPU階段三:AI數(shù)據(jù)基座演進(jìn)期CPU+GPUspark,RayCPU+GPUspark,Ray階段二:算力擴(kuò)展加速期CPUCPU階段一:傳統(tǒng)計(jì)算期異構(gòu)算力引入與分布式引擎擴(kuò)展階段"模型即引擎"與多模態(tài)數(shù)據(jù)重構(gòu)階段在技術(shù)落地層面,這一轉(zhuǎn)型推動(dòng)了算力計(jì)量體系與交互模式的升級(jí):本階段推動(dòng)了數(shù)據(jù)處理范疇的全面擴(kuò)展,從單一文本模態(tài)延伸至音頻、視頻、圖像等多模態(tài)領(lǐng)域。AI時(shí)代的企業(yè)數(shù)據(jù)基建升級(jí)不再是單一計(jì)算能力的提升,AI時(shí)代的企業(yè)數(shù)據(jù)基建升級(jí)不再是單一計(jì)算能力的提升,而是涵蓋算力、引擎、平臺(tái)和治理的系統(tǒng)性工程。全域數(shù)據(jù)資產(chǎn)治理與平臺(tái)融合階段1212n?ve3.1基建主張:打造自由高效的數(shù)據(jù)樂(lè)高底座傳統(tǒng)方案邏輯(傳統(tǒng)一體化)傳統(tǒng)方案邏輯(傳統(tǒng)一體化)火山引擎新邏輯(樂(lè)高式組合底座)替代決策幫企業(yè)直接解決問(wèn)題價(jià)值錨點(diǎn)替代決策幫企業(yè)直接解決問(wèn)題價(jià)值錨點(diǎn)賦能決策讓企業(yè)具備更高效解決問(wèn)題的能力落地路徑交付形態(tài)固定路徑落地路徑交付形態(tài)固定路徑數(shù)據(jù)湖→訓(xùn)練→場(chǎng)景SOP封閉系統(tǒng)封閉的"黑盒"系統(tǒng),煙囪式閉環(huán)敏捷組合提供最佳原子化引擎,企業(yè)按需編排開(kāi)放工具開(kāi)放、解耦、可插拔的"引擎與工具集"被動(dòng)使用被動(dòng)的解決方案使用者被動(dòng)使用被動(dòng)的解決方案使用者主導(dǎo)共創(chuàng)主動(dòng)的解決方案主導(dǎo)者與共創(chuàng)者企業(yè)角色企業(yè)角色1313生態(tài)兼容,生態(tài)兼容,打破壁壘的開(kāi)放策略火山引擎主張新一代數(shù)據(jù)基建應(yīng)消除技術(shù)孤島,全面擁抱開(kāi)源與開(kāi)放標(biāo)準(zhǔn)。架構(gòu)解耦,構(gòu)建自由的架構(gòu)解耦,構(gòu)建自由的"可插拔"技術(shù)?;鹕揭嬷鲝埰髽I(yè)數(shù)據(jù)資產(chǎn)與技術(shù)路線保持獨(dú)立性,不應(yīng)被單一廠商的閉源技術(shù)棧"鎖定"。演進(jìn)路徑,演進(jìn)路徑,業(yè)務(wù)驅(qū)動(dòng)的漸進(jìn)式升級(jí)14143.3價(jià)值錨點(diǎn):回歸數(shù)據(jù)基建的實(shí)用主義火山引擎模式火山引擎模式協(xié)同開(kāi)源協(xié)同AI賦能開(kāi)放oAioAI賦能開(kāi)放oAio1515ve3.4火山引擎的"AI時(shí)代新基建"方案多模態(tài)數(shù)據(jù)湖解決方案處理&推理一體化多模態(tài)處理引擎多模態(tài)模型推理ceepseelk處理&推理一體化多模態(tài)處理引擎多模態(tài)模型推理ceepseelk多模湖格式存儲(chǔ)原始文件存儲(chǔ)多模湖格式存儲(chǔ)原始文件存儲(chǔ)火山引擎多模態(tài)數(shù)據(jù)湖解決方案多模態(tài)數(shù)據(jù)存儲(chǔ)層1616處理&推理一體化平臺(tái)AI算子廣場(chǎng)智能化數(shù)據(jù)管理工具自然語(yǔ)言交互1717企業(yè)痛點(diǎn)海量異構(gòu)數(shù)據(jù)開(kāi)發(fā)成本高運(yùn)維人力投入大海量異構(gòu)數(shù)據(jù)開(kāi)發(fā)成本高運(yùn)維人力投入大</>火山引擎多模態(tài)數(shù)據(jù)湖解決方案:數(shù)據(jù)入庫(kù)文獻(xiàn)解析+清洗文檔翻譯數(shù)據(jù)入庫(kù)IDC存儲(chǔ)數(shù)據(jù)查詢AI數(shù)據(jù)湖IDC存儲(chǔ)數(shù)據(jù)查詢AI數(shù)據(jù)湖LAS平臺(tái)豆包文本生成大模型doubao-1.5-lite-32k豆包圖片內(nèi)容理解大模型doubao-1.5-vision-pro-32k企業(yè)收益3運(yùn)維43運(yùn)維4開(kāi)發(fā)周期縮短67%翻譯準(zhǔn)確率提效50%+圖文數(shù)據(jù)分析1818企業(yè)痛點(diǎn)數(shù)據(jù)索引效率低數(shù)據(jù)索引效率低資源拓展受限多模態(tài)格式異構(gòu)、邏輯分塊模糊,傳統(tǒng)設(shè)施無(wú)法快速拓展至百億級(jí),任務(wù)完成率僅60%火山引擎多模態(tài)數(shù)據(jù)湖解決方案:數(shù)據(jù)采集+AI數(shù)據(jù)湖管理數(shù)據(jù)預(yù)處理+推理標(biāo)注RAYEMRserverRAYEMRserverlessspark圖片打分UDF清洗關(guān)聯(lián)圖像元數(shù)據(jù)解析md解析段落聚合去重serverlessspark節(jié)點(diǎn)池模型訓(xùn)練多模態(tài)混排關(guān)聯(lián)處理模型訓(xùn)練doclabelimage訓(xùn)練平臺(tái)image(Binary)image(Binary)image(Binary)image(Binary)Listdoclabelimage訓(xùn)練平臺(tái)image(Binary)image(Binary)image(Binary)image(Binary)Listrow_idimage(Binary)image(Binary)image(Binary)ListBinary企業(yè)收益時(shí)效躍遷至存儲(chǔ)性能提升8+倍3提升8+倍1919案例3:給30年媒體資產(chǎn)裝上數(shù)據(jù)大腦,傳媒領(lǐng)軍者的數(shù)智進(jìn)化企業(yè)痛點(diǎn)數(shù)據(jù)質(zhì)量不穩(wěn)數(shù)據(jù)質(zhì)量不穩(wěn)跨模態(tài)數(shù)據(jù)分散跨模態(tài)數(shù)據(jù)缺乏統(tǒng)一向量化與索引能力,檢索響應(yīng)慢、功能單一,難滿足智能檢索需求火山引擎多模態(tài)數(shù)據(jù)湖解決方案:數(shù)據(jù)入湖數(shù)據(jù)處理對(duì)象存儲(chǔ)TOS數(shù)據(jù)集對(duì)象存儲(chǔ)TOS數(shù)據(jù)集數(shù)據(jù)集數(shù)據(jù)集算子廣場(chǎng)DOUBaoCPU節(jié)點(diǎn)池GPU推理節(jié)點(diǎn)池歷史報(bào)刊圖片庫(kù)/攝影部算子廣場(chǎng)DOUBaoCPU節(jié)點(diǎn)池GPU推理節(jié)點(diǎn)池歷史報(bào)刊圖片庫(kù)/攝影部歷史視頻庫(kù)CMS稿件第三方內(nèi)容采購(gòu)DDeepseek數(shù)據(jù)應(yīng)用數(shù)據(jù)檢索Al數(shù)據(jù)湖服務(wù)(LAS)數(shù)據(jù)管理數(shù)據(jù)管理ByteHouse混合檢索數(shù)據(jù)挖掘媒資平臺(tái)FDify.ByteHouse混合檢索數(shù)據(jù)挖掘媒資平臺(tái)FDify.企業(yè)收益工程交付效率提升60%元數(shù)據(jù)完備度提升80%提升90%提升90%內(nèi)容價(jià)值從0到1挖掘2020案例4:資源利用率飆升至95%,某智駕企業(yè)的效能突圍企業(yè)痛點(diǎn)任務(wù)效率低無(wú)法同時(shí)調(diào)用任務(wù)效率低無(wú)法同時(shí)調(diào)用CPU/GPU資源GPU資源利用率低單卡GPU僅支持1個(gè)標(biāo)注模型成本高新增標(biāo)注需重讀/重建全量數(shù)據(jù)成本高新增標(biāo)注需重讀/重建全量數(shù)據(jù)模型訓(xùn)練效率低數(shù)據(jù)加載導(dǎo)致CPU負(fù)載過(guò)高火山引擎多模態(tài)數(shù)據(jù)湖解決方案:車輛數(shù)據(jù)采集數(shù)據(jù)預(yù)處理+推理標(biāo)注sensor.tarlabel.tarlabelsensor.tarlabel.tarlabelcol模型訓(xùn)練數(shù)據(jù)挖掘&管理sensorcolMLP平臺(tái)GPU訓(xùn)練節(jié)點(diǎn)池vepFSMLP平臺(tái)GPU訓(xùn)練節(jié)點(diǎn)池vepFSsensorcollabelcolAI數(shù)據(jù)湖LAS平臺(tái)AI數(shù)據(jù)湖管理CPU節(jié)點(diǎn)池企業(yè)收益資源利用率升至95%資源利用率升至95%成本降至1/4提速1.5倍2121案例5:構(gòu)建全鏈路數(shù)據(jù)合規(guī)追溯,某機(jī)器人公司的智造升級(jí)企業(yè)痛點(diǎn)品流程管控缺位搜索體驗(yàn)割裂火山引擎多模態(tài)數(shù)據(jù)湖解決方案:機(jī)器人應(yīng)用Modle火山引擎Isaacsim圖片語(yǔ)音結(jié)構(gòu)化湖格式

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論