2024數(shù)據(jù)智能白皮書_第1頁
2024數(shù)據(jù)智能白皮書_第2頁
2024數(shù)據(jù)智能白皮書_第3頁
2024數(shù)據(jù)智能白皮書_第4頁
2024數(shù)據(jù)智能白皮書_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數(shù)據(jù)智能白皮書(2024)目錄一、數(shù)據(jù)智能綜述 1(一)數(shù)據(jù)智能概念探討 1(二)數(shù)據(jù)智能的歷史發(fā)展沿革 3(三)數(shù)據(jù)智能的價值和意義 5二、數(shù)據(jù)智能技術 8(一)數(shù)據(jù)智能技術體系概覽 8(二)數(shù)據(jù)智能關鍵技術發(fā)展態(tài)勢 9(三)數(shù)據(jù)智能技術未來展望 21三、數(shù)據(jù)智能應用 22(一)數(shù)據(jù)智能應用發(fā)展態(tài)勢 23(二)數(shù)據(jù)智能應用當前問題 26(三)數(shù)據(jù)智能應用未來展望 28四、數(shù)據(jù)智能產業(yè)生態(tài) 34(一)數(shù)據(jù)智能全景化布局提速,產業(yè)體系逐步完善 34(二)全球數(shù)據(jù)智能產業(yè)快速發(fā)展,規(guī)?;躏@ 37(三)數(shù)據(jù)智能產業(yè)挑戰(zhàn)與機遇并存 40五、總結與展望 44圖目錄圖1數(shù)據(jù)和智能間關系的變化 1圖2數(shù)據(jù)智能發(fā)展脈絡 3圖3數(shù)據(jù)智能技術體系概覽 8圖4部分生成式大模型發(fā)布情況統(tǒng)計 17圖5數(shù)據(jù)智能應用體系概覽 22圖6大模型賦能的數(shù)據(jù)智能應用場景 29圖7數(shù)據(jù)智能產業(yè)圖譜 35圖8數(shù)據(jù)智能企業(yè)營收分布情況 36圖9數(shù)據(jù)智能企業(yè)研發(fā)人員數(shù)量占比情況 37表目錄表1數(shù)據(jù)智能應用發(fā)展階段 24表2各行業(yè)數(shù)據(jù)智能應用落地的頭部場景 25數(shù)據(jù)智能白皮書(2024年)數(shù)據(jù)智能白皮書(2024年)PAGEPAGE10一、數(shù)據(jù)智能綜述(一)數(shù)據(jù)智能概念探討1956(AI)主線,但仍以“決策式人工智能”為主要發(fā)展領域。近兩年,在以Transformer10%如圖1圖1數(shù)據(jù)和智能間關系的變化二是智能化技術開始反向助力數(shù)據(jù)技術發(fā)展和非結構化數(shù)據(jù)應80%(二)數(shù)據(jù)智能的歷史發(fā)展沿革80圖2數(shù)據(jù)智能發(fā)展脈絡202000~0020(三)數(shù)據(jù)智能的價值和意義二、數(shù)據(jù)智能技術(一)數(shù)據(jù)智能技術體系概覽總圖3數(shù)據(jù)智能技術體系概覽據(jù)存儲&計算、數(shù)據(jù)管理、數(shù)據(jù)開發(fā)&應用、數(shù)據(jù)安全五大部分,人工智能技術可以分為數(shù)據(jù)準備、模型訓練&推理、模型開發(fā)&應用三大階段。(二)數(shù)據(jù)智能關鍵技術發(fā)展態(tài)勢數(shù)據(jù)供給技術賦能模型訓練高質量的數(shù)據(jù)供給在人工智能模型的訓練中扮演著至關重要的OpenAI在GPT4合成數(shù)據(jù)是通過專用數(shù)學模型或算法進行數(shù)據(jù)生成的過程,通常擬等能力,可有效解決數(shù)據(jù)規(guī)模和質量不足等問題。如J.PMorgan隨著企業(yè)數(shù)智化轉型對數(shù)據(jù)價值釋放需求的提升和對隱私保護二是數(shù)據(jù)標注向自動化、智能化演進。未來數(shù)據(jù)標注將更多地依賴于自動化、智能化工具完成數(shù)據(jù)預處理過程,提供初步標注結果,再由人工進行校正和細化的方式提高數(shù)據(jù)標注效率。三是數(shù)據(jù)質量問題將成為關注重點,通過建立嚴格的數(shù)據(jù)采集標準和流程,確保供給數(shù)據(jù)具有高質量、高相關性和高準確性。多模態(tài)數(shù)據(jù)存儲與治理支撐模型高質量訓練當前多模態(tài)數(shù)據(jù)的存儲治理仍存在以下突出問題:多模態(tài)數(shù)未來,多模數(shù)據(jù)存儲與治理領域呈現(xiàn)出三大趨勢:CSIOpenAI數(shù)據(jù)智能平臺支撐企業(yè)數(shù)據(jù)及模型開發(fā)Snowflake力的Data+AI一是異構計算資源高效納管能力有待提升。模型訓練需要大量CPUGPU未來,數(shù)據(jù)智能平臺發(fā)展主要有以下三大趨勢:現(xiàn)集群間資源協(xié)作和任務調度。數(shù)據(jù)流通技術支撐企業(yè)安全高效匯聚利用外部數(shù)據(jù)在面向企業(yè)數(shù)智化轉型的過程中,當前數(shù)據(jù)流通技術仍存在以下問題:面向企業(yè)數(shù)智化轉型,為更高效支持企業(yè)獲取和利用外部數(shù)據(jù),數(shù)據(jù)流通技術未來主要有以下趨勢:智能化技術賦能數(shù)據(jù)安全產品升級換代未來,智能化數(shù)據(jù)安全產品將呈現(xiàn)出兩點趨勢:生成式大模型驅動生產力躍升生成式大模型指具有大規(guī)模參數(shù)和復雜計算結構的生成式機器圖4部分生成式大模型發(fā)布情況統(tǒng)計二是生成式大模型存在數(shù)據(jù)安全及隱私問題。模型訓練需要大量數(shù)據(jù),其中極可能包含敏感和隱私信息,存在數(shù)據(jù)泄露風險,同時,部分用戶在使用過程中,也可能通過特定方式套取部分隱私信息。未來,生成式大模型發(fā)展呈現(xiàn)出三大方向:OpenAI公司的、MetaLlama3Mistral二是視頻生成大模型成為生成式模型發(fā)展的前沿方向。OpenAI2024215SORA優(yōu)化,能夠更準確地理解和處理特定領域任務。專業(yè)領域大模型在大模型賦能的數(shù)據(jù)智能應用促進數(shù)據(jù)智能價值釋放數(shù)據(jù)智能應用技術是指包括數(shù)據(jù)可視化、數(shù)據(jù)分析、數(shù)據(jù)挖掘、BI、當前階段,數(shù)據(jù)智能應用技術仍面臨著三大問題:未來,數(shù)據(jù)智能應用技術發(fā)展呈現(xiàn)出三大趨勢:一是“大模型+二是數(shù)據(jù)智能技術將為大模型的落地提供更高效支撐。數(shù)據(jù)智能應用技術對大模型的賦能也成為各方關注的重點方向,基于知識圖譜、(三)數(shù)據(jù)智能技術未來展望三、數(shù)據(jù)智能應用圖5數(shù)據(jù)智能應用體系概覽(一)數(shù)據(jù)智能應用發(fā)展態(tài)勢通用范疇來看,數(shù)據(jù)智能應用的目標呈現(xiàn)出多樣化發(fā)展的態(tài)勢。一的營銷策略。在用戶的運營管理過程中,數(shù)據(jù)智能被用于構筑用戶畫像、表1數(shù)據(jù)智能應用發(fā)展階段申生產型服務業(yè)為主導的第三產業(yè)在數(shù)據(jù)智能應用的深度和廣度方面都顯著強于其它行業(yè),在數(shù)據(jù)智能應用創(chuàng)新過程中發(fā)揮著引領作用。表2各行業(yè)數(shù)據(jù)智能應用落地的頭部場景(二)數(shù)據(jù)智能應用當前問題((要單獨設計A/B如金融、電信等)和非數(shù)據(jù)原生行業(yè)(如制造業(yè)、醫(yī)療、交通等)((三)數(shù)據(jù)智能應用未來展望BI圖6大模型賦能的數(shù)據(jù)智能應用場景(RAG)些賦能一線的數(shù)據(jù)智能應用正在成為業(yè)務側數(shù)據(jù)智能能力建設的重點。5G四、數(shù)據(jù)智能產業(yè)生態(tài)(一)數(shù)據(jù)智能全景化布局提速,產業(yè)體系逐步完善根據(jù)中國通信標準化協(xié)會大數(shù)據(jù)技術標準推進委員會(CCSATC601)(2024數(shù)據(jù)智能基礎設施數(shù)據(jù)治理企業(yè)主要圍繞數(shù)據(jù)質量管理、數(shù)據(jù)標準管理、數(shù)據(jù)資產管理、數(shù)據(jù)標準等方面提供平臺及服務,支撐數(shù)據(jù)管理相關工作。/圖7數(shù)據(jù)智能產業(yè)圖譜數(shù)據(jù)智能開發(fā)企業(yè)主要圍繞數(shù)據(jù)開發(fā)、人工智能算法開發(fā)、數(shù)據(jù)科學、知識圖譜等提供平臺能力,支撐數(shù)據(jù)智能產品及應用開發(fā)。11%6%11%13%31%11%6%11%13%31%28%1000萬以下 1000萬-2000萬 2000萬-5000萬 5000萬-1億 1億-5億 5億及以上圖8數(shù)據(jù)智能企業(yè)營收分布情況從企業(yè)發(fā)展情況來看,入選產業(yè)圖譜的企業(yè)大多數(shù)成立于從企31.777.2103050%30%95%10%的企業(yè)研發(fā)人員數(shù)量超過80%;人才層次方面,平均本科學歷以上比例達到10%5%30%55%小于30% 30-50% 50%-80%10%5%30%55%小于30% 30-50% 50%-80% 80%以上圖9數(shù)據(jù)智能企業(yè)研發(fā)人員數(shù)量占比情況(二)全球數(shù)據(jù)智能產業(yè)快速發(fā)展,規(guī)模化效應初顯20233202320242024313進以人為本、值得信賴的人工智能發(fā)展應用。202443000045002000ACharacter.ai、ScaleAIMeta等開發(fā)應用,加速構建數(shù)據(jù)智能產業(yè)生態(tài)。2.02022500248%202312月,IBMMeta50(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論