版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2025年中國世界模型發(fā)展洞察2025年8月執(zhí)行摘要本報(bào)告聚焦
“世界模型
”(World
Models)
這一前沿人工智能技術(shù),分析其發(fā)展現(xiàn)狀、技術(shù)路徑、市場(chǎng)格局及未來趨勢(shì)。世界模型是理解現(xiàn)實(shí)世界動(dòng)態(tài)
(包括其物理和空間
屬性)的生成式AI模型。
它們使用文本、
圖像、視頻和運(yùn)動(dòng)等輸入數(shù)據(jù)來生成視頻。通過學(xué)習(xí),
它們能夠理解現(xiàn)實(shí)世界環(huán)境的物理特性,從而對(duì)運(yùn)動(dòng)、應(yīng)力以及感官數(shù)據(jù)中的空間關(guān)系等動(dòng)態(tài)進(jìn)行表示和預(yù)測(cè),加速物理AI的虛擬世界生成,生成可擴(kuò)展的增
強(qiáng)型數(shù)據(jù),從而消除數(shù)據(jù)瓶頸,實(shí)現(xiàn)更高效的基礎(chǔ)模型訓(xùn)練。研究目的本白皮書的研究目的在于全面梳理世界模型的發(fā)展歷程、現(xiàn)狀、核心技術(shù)及其在智能
駕駛中的應(yīng)用,并通過對(duì)不同廠商能力的對(duì)比分析,探討世界模型未來的發(fā)展趨勢(shì)。世界模型作為模擬和預(yù)測(cè)現(xiàn)實(shí)世界動(dòng)態(tài)的生成式AI框架,
已在自動(dòng)駕駛、機(jī)器人、數(shù)字孿生等領(lǐng)域展現(xiàn)出巨大潛力,我們期望為相關(guān)領(lǐng)域的研究者、開發(fā)者以及企業(yè)提供
有價(jià)值的參考信息,促進(jìn)技術(shù)進(jìn)步和產(chǎn)業(yè)發(fā)展。目錄u
報(bào)告摘要u
關(guān)鍵發(fā)現(xiàn)u
章節(jié)一:世界模型概述
6?
世界模型定義與基本概念
7?
世界模型核心要素
8?
世界模型發(fā)展歷程與現(xiàn)狀
9?世界模型關(guān)鍵能力及主流場(chǎng)景
10u
章節(jié)二:
世界模型技術(shù)能力分析
11?
世界模型關(guān)鍵技術(shù)與能力
12?
世界模型技術(shù)指標(biāo)概述
14?
世界模型對(duì)比及評(píng)價(jià)
15?
主流世界模型介紹
16u
章節(jié)三:
世界模型在自動(dòng)駕駛中的應(yīng)用-
17?自動(dòng)駕駛系統(tǒng)概述
-18?自動(dòng)駕駛發(fā)展現(xiàn)狀及核心痛點(diǎn)
19?世界模型在自動(dòng)駕駛中的生成場(chǎng)景
20?世界模型在自動(dòng)駕駛中的關(guān)鍵能力
21?世界模型在自動(dòng)駕駛中的價(jià)值分析
22?世界模型在自動(dòng)駕駛中的未來方向
23目錄u
章節(jié)四:
世界模型在具身智能中的應(yīng)用
24?
具身智能基本概述
25?
具身智能發(fā)展現(xiàn)狀
26?
具身智能核心痛點(diǎn)及需求分析
27?世界模型在具身智能中的關(guān)鍵能力
28?世界模型在具身智能中的價(jià)值分析
29?世界模型在具身智能中的未來方向
-
30u
章節(jié)五:
世界模型廠商競爭格局
31?世界模型廠商綜合實(shí)力評(píng)估指標(biāo)定義
32?中國世界模型廠商總覽與簡介
34?中國世界模型廠商綜合實(shí)力評(píng)估表現(xiàn)
35?
世界模型優(yōu)秀案例分析
36以商湯為代表的平臺(tái)型
世界模型提供商通過構(gòu)建開放通用的產(chǎn)業(yè)基座,避免了車企重復(fù)自研與科研模型的工程化瓶頸,有效賦能自動(dòng)駕駛、具身智能等領(lǐng)域的規(guī)
?;瘧?yīng)用與跨場(chǎng)景遷移商湯絕影「開悟」世界模型在技術(shù)產(chǎn)品、應(yīng)用能力以及生態(tài)建設(shè)三方面綜合評(píng)價(jià)位
第一居榜單多模態(tài)感知融合、真實(shí)物理世界構(gòu)建與動(dòng)態(tài)環(huán)境預(yù)測(cè)作為世界模型的核心能力正成為驅(qū)動(dòng)智能系統(tǒng)向高階感知與決策能力躍升的核心技術(shù)支柱。當(dāng)前在自動(dòng)駕駛領(lǐng)域世界模型應(yīng)用成熟度高于具身智能領(lǐng)域,未來,世界
模型將成為具身智能的“認(rèn)知核心”世界模型的本質(zhì)是視覺和空間的認(rèn)知,最重要的是保證4D數(shù)據(jù)重建的真實(shí)性7KeyFindings關(guān)鍵發(fā)現(xiàn)80%自動(dòng)駕駛算法使用世界模型進(jìn)行輔助訓(xùn)練其中頭部玩家正憑借其先發(fā)優(yōu)勢(shì)與技術(shù)能力,與
世界領(lǐng)先的廠商同臺(tái)競技。目前,中國世界模型領(lǐng)域玩家已經(jīng)超過10+超過世界模型概述第一章世界模型輸入與輸出觀測(cè)數(shù)據(jù)(Observations)世界模型內(nèi)部表征(Implicitrepresentation)+未來預(yù)測(cè)(Futureprediction)預(yù)測(cè)規(guī)劃(Predict/Plan)正成為驅(qū)動(dòng)智能系統(tǒng)向高階感知與決策能力躍升的核心技術(shù)支柱。世界模型基本概念內(nèi)部表征的世界模型可以通過概率模型、物理模型等形式存在,它們通過對(duì)歷史數(shù)據(jù)的學(xué)習(xí)和理解,形成對(duì)未來事件和狀態(tài)的預(yù)測(cè)。未來預(yù)測(cè)的世界模型則依賴于生成模型,如擴(kuò)散模型或視頻生成模型,通過模擬連續(xù)的時(shí)間動(dòng)態(tài)來生成真實(shí)場(chǎng)景。世界模型(WorldModels,WMs)作為一種生成式AI模型,能夠通過構(gòu)建內(nèi)部表征理解真實(shí)世界的動(dòng)態(tài)規(guī)律(涵蓋物理特性與空間屬性),同時(shí)借助文本、圖像、視頻和運(yùn)動(dòng)數(shù)據(jù)等輸入信息生成視頻內(nèi)容。通過從感官數(shù)據(jù)中學(xué)習(xí)表征和預(yù)測(cè)運(yùn)動(dòng)、力和空間關(guān)系等動(dòng)態(tài)特性,實(shí)現(xiàn)對(duì)現(xiàn)實(shí)環(huán)境物理屬性的理解并通過生成環(huán)境及動(dòng)作,從而模擬、指導(dǎo)及實(shí)施決策。這類模型已在自動(dòng)駕駛、機(jī)器人技術(shù)、數(shù)字孿生等前沿領(lǐng)域展現(xiàn)出巨大應(yīng)用潛力,世界模型概述世界模型定義物理規(guī)則(Physical
Rules)物理感知
(Perception)視頻信息
(Video
Info)動(dòng)作指令(Actions)來源:
弗若斯特沙利文7——WorldsLabs
李飛飛學(xué)習(xí)與更新世界模型的另一重要特征是能夠通過學(xué)習(xí)不斷更新自己的結(jié)構(gòu)。無論是人類通過經(jīng)驗(yàn)積累,還是人工智能通過訓(xùn)練數(shù)據(jù),世界模型都能夠隨著新信息的加入而不斷優(yōu)化,以提高其對(duì)未來預(yù)測(cè)的準(zhǔn)確性。動(dòng)態(tài)性與預(yù)測(cè)能力世界模型不僅僅是被動(dòng)地接收信息,它還具有根據(jù)現(xiàn)有數(shù)據(jù)進(jìn)行預(yù)測(cè)和推理的能力。例如,基于過去的經(jīng)驗(yàn),世界模型可以預(yù)測(cè)未來的狀態(tài),幫助決策者在面對(duì)不確定性時(shí)做出更加理性和高效的選擇。世界模型核心要素世界模型不僅應(yīng)當(dāng)感知和建?,F(xiàn)實(shí)世界,還應(yīng)具備展望可能存在的未來狀態(tài)的能力,從而為決策提供指導(dǎo)。”感知與建模人類的感知能力是世界模型構(gòu)建的第一步。當(dāng)我們通過視覺、聽覺、觸覺等感官獲取到外界信息時(shí),大腦就會(huì)將這些信息處理并轉(zhuǎn)化為對(duì)世界的認(rèn)知。在機(jī)器學(xué)習(xí)中,這一過程通常通過傳感器、圖像識(shí)別、自然語言處理等技術(shù)來實(shí)現(xiàn)。狀態(tài)表示一旦獲取了感知數(shù)據(jù),世界模型就需要將這些信息表示為某種形式的狀態(tài)。比如,在強(qiáng)化學(xué)習(xí)中,狀態(tài)通常是對(duì)環(huán)境某一時(shí)刻的抽象表示。在其他領(lǐng)域,狀態(tài)可能是對(duì)事物屬性或時(shí)間序列數(shù)據(jù)的集合。來源:
弗若斯特沙利文“8Google、Meta、NVIDIA等海外廠商在世界模型持續(xù)發(fā)力,不斷推出新模型,如NVIDIACOSMOS、METAV-JEPA2等。世界模型邁入具身智能領(lǐng)域提出“隱式世界模型”,直接建模獎(jiǎng)勵(lì)與動(dòng)態(tài),商湯發(fā)布“開悟”世界模型系統(tǒng)升級(jí)4構(gòu)建多視角、高保真生成平臺(tái),打通智駕系統(tǒng)與算力平臺(tái),首次實(shí)現(xiàn)“車-模-云”閉環(huán)的商業(yè)級(jí)部署。?從感知壓縮到因果推理,世界模型正處于從早期探索走向復(fù)雜智能行為生成的關(guān)鍵過渡期
目前,世界模型整體仍處于早期探索階段,大多集中在感知層面的模擬與壓縮,尚未真正實(shí)現(xiàn)“感知-預(yù)測(cè)-決策
”一體化的
穩(wěn)定閉環(huán)。盡管在自動(dòng)駕駛領(lǐng)域已有試點(diǎn)應(yīng)用,但多依賴特定環(huán)境與強(qiáng)先驗(yàn),不具備通用性與長期泛化能力。
未來的發(fā)展方向?qū)⒓性谌齻€(gè)方面:一是通過多模態(tài)輸入增強(qiáng)
對(duì)世界狀態(tài)的理解;二是引入因果建模與可控生成機(jī)制,提升
預(yù)測(cè)準(zhǔn)確性與行為規(guī)劃能力;三是將世界模型與具身智能系統(tǒng)深度融合,實(shí)現(xiàn)從“觀察世界
”到“理解并參與世界
”的躍遷。世界模型發(fā)展歷程與現(xiàn)狀世界模型仍處早期階段,以感知壓縮和因果推理為主,閉環(huán)尚未穩(wěn)定成型。MuZero發(fā)布、BEV模型落地和“升格”系統(tǒng)升級(jí)。?未來將突破三方面:多模態(tài)感知、因果可控生成、與具身智能系統(tǒng)深度融合。以小鵬、理想為代表的中國廠商,通過結(jié)合VLA、VLM與世界模型,推
進(jìn)自動(dòng)駕駛向無圖化、端到端演進(jìn)。2018
2022無需重建圖像,顯著提
升規(guī)劃與泛化能力。DeepMind發(fā)表論文MuZero首次構(gòu)建潛空間世界模型(VAE+RNN),通過
“做夢(mèng)”學(xué)習(xí)策略,奠
定模型式強(qiáng)化學(xué)習(xí)基礎(chǔ)。?
AI?發(fā)展歷程從理論提出到產(chǎn)業(yè)試點(diǎn),包括首次在物理機(jī)器人上實(shí)現(xiàn)高效學(xué)習(xí),驗(yàn)證世界模型在具身智能中的泛化與實(shí)用性。中國廠商加入世界模型戰(zhàn)場(chǎng)世界模型成為廠商必爭之地論文《World來源:
弗若斯特沙利文Models》20249235——世界模型四大應(yīng)用場(chǎng)景世界模型主要場(chǎng)景成熟度哪些領(lǐng)域?qū)⒂瓉碜兏??自?dòng)駕駛
具身智能你覺得哪一個(gè)場(chǎng)景會(huì)先落地?顏色越深技術(shù)成熟度越高游戲與VR應(yīng)用成熟度科學(xué)模擬來源:
弗若斯特沙利文10一、自動(dòng)駕駛實(shí)時(shí)感知周圍環(huán)境,世界模型可以分析其他車輛、行人、非機(jī)動(dòng)車的運(yùn)動(dòng)狀態(tài)和行
為意圖,預(yù)測(cè)它們未來的行動(dòng)軌跡。例如,當(dāng)識(shí)別到騎車人轉(zhuǎn)頭的動(dòng)作時(shí),世界模型能夠判斷騎車人可能有左拐的意圖,從而提前提醒自動(dòng)駕駛系統(tǒng)做好減速、避讓等準(zhǔn)備。此外,世界模型還可以模擬不同天氣、路況下的駕駛場(chǎng)景,幫助車輛制定更合理的行駛策略,大幅提升自動(dòng)駕駛的安全性和可靠性,推動(dòng)自動(dòng)駕駛技術(shù)從輔助
駕駛向完全自動(dòng)駕駛邁進(jìn)。二、具身智能世界模型將徹底改變機(jī)器人的應(yīng)用形態(tài),使其從只能執(zhí)行簡單重復(fù)動(dòng)作的機(jī)器,轉(zhuǎn)變?yōu)槟軌蛲瓿筛鞣N復(fù)雜任務(wù)的通用勞動(dòng)力。在家庭服務(wù)場(chǎng)景中,機(jī)器人可以利用世界模型理解家居環(huán)境和用戶需求,自主完成打掃房間、整理物品等工作;在工業(yè)生產(chǎn)領(lǐng)域,機(jī)器人能夠根據(jù)世界模型規(guī)劃任務(wù)方案,靈活應(yīng)對(duì)不同的生產(chǎn)需求,進(jìn)行精密裝配、質(zhì)量檢測(cè)、設(shè)備維護(hù)等操作。世界模型在游戲與虛擬現(xiàn)實(shí)中扮演著核心角色。它用于構(gòu)建虛擬環(huán)境的邏輯與物理
規(guī)則,使玩家能與動(dòng)態(tài)場(chǎng)景互動(dòng)。通過世界模型,系統(tǒng)可模擬重力、碰撞、光照等真實(shí)效果,提升沉浸感。同時(shí),它還支持
AI角色的行為決策,推動(dòng)劇情發(fā)展。在VR中,世界模型確保視覺、聽覺與動(dòng)作的實(shí)
時(shí)同步,增強(qiáng)用戶體驗(yàn)的真實(shí)性與連貫性。四、科學(xué)模擬在科學(xué)研究和工程領(lǐng)域,世界模型為復(fù)雜系統(tǒng)的模擬和預(yù)測(cè)提供了強(qiáng)大的工具。通過跨尺度的推演,世界模型幫助科學(xué)家和工程師更好地理解和掌控復(fù)雜系統(tǒng),推動(dòng)
科學(xué)技術(shù)的進(jìn)步和社會(huì)的可持續(xù)發(fā)展。哪些領(lǐng)域?qū)⒂瓉碜兏??——世界模型四大?yīng)用場(chǎng)景三、游戲與虛擬現(xiàn)實(shí)注:
圖中圓形大小表示目前該領(lǐng)域的整體成熟度與投入情況來源:
弗若斯特沙利文11世界模型技術(shù)分析第二章因果推理能力因果推理要求AI能夠回答“如果A發(fā)生
,
B
會(huì)怎樣?
”
這類假設(shè)性問題,這對(duì)模型來說是一個(gè)巨大的挑戰(zhàn)。
因此人工智能不應(yīng)該僅僅是對(duì)于已有知識(shí)的復(fù)制或檢索
,
而應(yīng)當(dāng)具備一種更廣泛、更深層次的理解周圍環(huán)境的能力。由于生活中大多數(shù)數(shù)據(jù)為動(dòng)態(tài)視覺信息,如何利用圖像、視頻等視覺輸入自發(fā)地理解現(xiàn)實(shí)概念并實(shí)現(xiàn)與人類的交互一直是一大難題,最先進(jìn)的視覺問答模型在視覺因果推理方面與人類相比仍存在較大改進(jìn)空間,世界模型通過構(gòu)建視覺感知組件與記憶組件,所學(xué)習(xí)到的關(guān)于環(huán)境的表征與對(duì)于未來的預(yù)測(cè)能有效地幫助模型理解現(xiàn)實(shí)概念,構(gòu)建強(qiáng)大的復(fù)雜因果推理能力,提升AI在動(dòng)態(tài)環(huán)境中的自主決策能力。例如:在自動(dòng)駕駛場(chǎng)景中,需要模擬如果前方突然出現(xiàn)一個(gè)行人,車輛采取不同的避讓策略會(huì)產(chǎn)生怎樣的后果;在工業(yè)生產(chǎn)中,要預(yù)測(cè)如果設(shè)備某個(gè)部件出現(xiàn)故障,整個(gè)生產(chǎn)流程會(huì)受到哪些影響。場(chǎng)景重建時(shí)空一致性常見的視頻生成通常側(cè)重于以單一模態(tài)或單一視角生成數(shù)據(jù),雖然其已經(jīng)初步展現(xiàn)出對(duì)時(shí)空一致性、視覺因果鏈的建模能力
,
但受限于物體遮擋、視角信息固定、缺乏3D結(jié)構(gòu)信息等因素,而難以實(shí)現(xiàn)真正的因果推理能力場(chǎng)景重建中的時(shí)空一致性世界模型的關(guān)鍵技術(shù)與能力多模數(shù)據(jù)物理規(guī)則描述執(zhí)行與實(shí)時(shí)反饋的閉環(huán)控制來源:
弗若斯特沙利文13來源:
弗若斯特沙利文WorldModel執(zhí)行與實(shí)時(shí)反饋智能體行為低延遲響應(yīng)誤差自動(dòng)修正多模數(shù)據(jù)物理規(guī)則描述模擬復(fù)雜的物理規(guī)則仍然是一項(xiàng)極具挑戰(zhàn)性的任務(wù),現(xiàn)實(shí)世界中的流體運(yùn)動(dòng)、物體碰撞等物理現(xiàn)象涉及到大量的參數(shù)和變量
,
具有高度的非線性和不確定性。
以流體模擬為例,水的流動(dòng)受到重力、粘度、表面張力等多種因素的影響,不同場(chǎng)景下的流體行為差異巨大,想要精確模擬十分困難。在物體碰撞模擬中,不僅要考慮物體的材質(zhì)、形狀、質(zhì)量等屬性,還需要準(zhǔn)確計(jì)算碰撞瞬間的力的傳遞和能量轉(zhuǎn)換,稍有偏差就會(huì)導(dǎo)致模擬結(jié)果與現(xiàn)實(shí)不符。時(shí)空一致性。在3D世界中,我們的視角通常會(huì)隨心所欲地沿著不同路徑,向各種各樣的方向移動(dòng)
,
在這一場(chǎng)景下世界模型需要更強(qiáng)的時(shí)空一致性與動(dòng)態(tài)3D環(huán)境生成能力。如保持空間結(jié)構(gòu)穩(wěn)定(如物體形狀、位置、遮擋關(guān)系)和時(shí)間演化連貫(如運(yùn)動(dòng)軌跡、因果關(guān)系、物理規(guī)律)等。當(dāng)前世界模型通過長期記憶機(jī)制、潛在空間建模、對(duì)象中心表征等技術(shù)在更高維度空間利用潛變量向量代替像素重建,帶來泛化能力和樣本效率的提升,從而達(dá)成更優(yōu)的時(shí)空一致性。環(huán)境感知與表征時(shí)序自然演化場(chǎng)景理解物理規(guī)律學(xué)習(xí)多模態(tài)信息融合物理響應(yīng)交互長時(shí)記憶機(jī)制隱空間建??缫暯菍?duì)齊物理規(guī)則模擬因果推理能力時(shí)空一致性14世界模型預(yù)測(cè)的是3D場(chǎng)景結(jié)構(gòu),而非簡單的像素,這為后續(xù)的交互和真實(shí)感奠定了基礎(chǔ),因此生成的場(chǎng)景遵循基本的3D幾何和物理規(guī)則(如物體的遮擋、深度、實(shí)體感),避免了傳統(tǒng)模型生成視頻常出現(xiàn)的扭曲、變形等“
夢(mèng)境般
”的不真實(shí)感。且生成的世界是穩(wěn)定的,不會(huì)因視角變化或短暫離開而改變,保證了體驗(yàn)的連貫性。執(zhí)行與實(shí)時(shí)反饋在真實(shí)世界中,獲取實(shí)時(shí)的交互數(shù)據(jù)面臨諸多困難,收集數(shù)據(jù)需要耗費(fèi)大量的時(shí)間
、人力和物力,而且存在安全風(fēng)險(xiǎn),難以獲取足夠豐富和多樣化的數(shù)據(jù)。而世界模型通過結(jié)合強(qiáng)化學(xué)習(xí),可以實(shí)現(xiàn)從感知
→
建模
→規(guī)劃
→
執(zhí)行
→
感知更新→模型修正的動(dòng)態(tài)循環(huán)過程,甚至在過程中還可以根據(jù)主動(dòng)干預(yù)來驗(yàn)證預(yù)測(cè),并利用反饋信號(hào)持續(xù)優(yōu)化自身。如在自動(dòng)駕駛中世界模型可以根據(jù)感知建模信息預(yù)測(cè)行人軌跡,規(guī)劃避讓路徑并執(zhí)行轉(zhuǎn)向操作,再通過更新的感知內(nèi)容如雷達(dá)、視覺等信息修正預(yù)測(cè)模型。在這個(gè)過程中,低延遲響應(yīng)的實(shí)時(shí)反饋是實(shí)際應(yīng)用的基礎(chǔ),可以通過輕量化技術(shù)與潛空間狀態(tài)生成等技術(shù)實(shí)現(xiàn)。來源:
弗若斯特沙利文15FID是衡量生成圖像與真實(shí)圖像分布之間差
異的指標(biāo),FID值越低,表示生成圖像的質(zhì)量和多樣性越接近真實(shí)數(shù)據(jù),用于評(píng)估世界模
型生成的單幀圖像質(zhì)量FVD是FID的視頻擴(kuò)展版本,用于衡量生成視頻與真實(shí)視頻在時(shí)空特征上的相似性。評(píng)估
世界模型生成的視頻片段在內(nèi)容和動(dòng)態(tài)方面
與真實(shí)視頻的匹配程度幀率指模型生成或預(yù)測(cè)的視頻每秒包含的幀
數(shù),決定模型生成視頻的的時(shí)間分辨率。高
幀率可提供更平滑的視頻,但計(jì)算成本更高。世界模型能夠生成或預(yù)測(cè)的連續(xù)視頻幀的數(shù)
量或時(shí)間長度,
衡量模型的長期預(yù)測(cè)能力。
在相同幀率下,
長時(shí)預(yù)測(cè)更難,易出現(xiàn)累積
誤差和模式崩潰。指生成視頻在時(shí)間維度上的連貫性,
包括運(yùn)
動(dòng)平滑性、物體身份保持、場(chǎng)景邏輯合理等。??紤]多模態(tài)內(nèi)容一致性、物體一致性、時(shí)
空一致性等。世界模型有哪些關(guān)鍵指標(biāo)?幀率時(shí)長FIDFVD世界模型技術(shù)指標(biāo)概述一致性來源:
弗若斯特沙利文16模型FIDFVD幀率時(shí)長一致性英偉達(dá)
COSMOS谷歌
Genie3MetaV-JEPA2商湯
絕影開悟WayveGAIA2非生成式世界模型側(cè)重于學(xué)習(xí)對(duì)控制有用的狀態(tài)表示,避免預(yù)測(cè)所有的觀測(cè)細(xì)節(jié)。這類模型通常不顯式地生成環(huán)境觀測(cè),而是通過其他方式來學(xué)習(xí)狀態(tài)表示,例如預(yù)測(cè)價(jià)值函數(shù)、預(yù)測(cè)下一個(gè)狀態(tài)的隱向量等。生成式世界模型旨在學(xué)習(xí)一個(gè)能夠生成或者預(yù)測(cè)的環(huán)境狀態(tài)的概率模型。給定當(dāng)前狀態(tài)和動(dòng)作,
生成式模型能夠預(yù)測(cè)下一個(gè)可能的狀態(tài),能夠生成逼真的環(huán)境觀測(cè),
為智能體提供豐富的感知信息。但同時(shí)也需要處理高維數(shù)據(jù),
計(jì)算復(fù)雜度高。
全球世界模型主流模型技術(shù)能力指標(biāo)均值線不同世界模型廠商根據(jù)其自身戰(zhàn)略與不同維度的技術(shù)優(yōu)勢(shì),打造獨(dú)特的世界模型能力及相關(guān)產(chǎn)品非生成式世界模型生成式世界模型來源:
弗若斯特沙利文17支持文本提示、圖像、照片甚至手繪草圖作為輸入,理解并解析復(fù)雜的場(chǎng)景描述,同時(shí)支持鍵盤
鼠標(biāo)等標(biāo)準(zhǔn)交互設(shè)備,實(shí)現(xiàn)豐富的人機(jī)交互體驗(yàn)。通過觀察大量視頻數(shù)據(jù)自主學(xué)習(xí)物理規(guī)律不需要硬編碼的物理引擎,就能夠理解重力、碰撞、水流動(dòng)力學(xué)、光照效果等復(fù)雜物理現(xiàn)象。通過Omniverse、Genesis等,生成遵循現(xiàn)實(shí)物理規(guī)律的模擬視頻數(shù)據(jù)。通過CosmosTransfer來提升模擬數(shù)據(jù)的真實(shí)性和多樣性通過引用歷史軌跡信息維護(hù)長期一致性,能夠記住數(shù)分鐘前的環(huán)境狀態(tài),支持用戶重新訪問之前探索過的區(qū)域并保持完全一致性。從3D仿真場(chǎng)景中生成高保真度的合成數(shù)據(jù),為下游用戶提供合成數(shù)據(jù)生成和后訓(xùn)練能力,構(gòu)建高效數(shù)據(jù)工廠,推動(dòng)視覺AI和具身AI的發(fā)展。通過將強(qiáng)大的仿真平臺(tái)、高效的數(shù)據(jù)生成工具和尖端的智能決策核心深度整合,為全球機(jī)器人和自動(dòng)化開發(fā)者提供一了個(gè)全棧式的開發(fā)平臺(tái)。Genie3能夠從簡單文本提示生成720p、24fps的實(shí)時(shí)交互3D環(huán)境,遠(yuǎn)超傳統(tǒng)AI視頻生成質(zhì)量,且對(duì)于交互的實(shí)時(shí)性支持更迅速。CosmosReason、Transfer、Transfer精簡版、Transfer2、Predict2等一系列預(yù)訓(xùn)練多模態(tài)模型提供了豐富的應(yīng)用場(chǎng)景與功能選擇。英偉達(dá)
COSMOS——
世界模型應(yīng)用先鋒谷歌
Genie3
——
世界模型前沿探索3
數(shù)據(jù)工廠加速下游基礎(chǔ)模型開發(fā)1
摒棄傳統(tǒng)硬編碼物理引擎4
構(gòu)建AI時(shí)代的平臺(tái)系統(tǒng)2
高質(zhì)量生成與實(shí)時(shí)交互1
基于真實(shí)物理的引擎4
長期記憶一致性3
多模態(tài)輸入處理2
多種模型選擇來源:
弗若斯特沙利文18提供從基礎(chǔ)設(shè)施到模型再到平臺(tái)的全套生態(tài)能力,使機(jī)器人能夠在現(xiàn)實(shí)物理世界中自主探索,完成自我迭代與持續(xù)進(jìn)化。WaymoSimAgent競賽連
續(xù)兩年榜單第一名為滿足模型閉環(huán)高效實(shí)訓(xùn),商湯世界模型提供了訓(xùn)練前的數(shù)據(jù)合成、編輯能力以及數(shù)據(jù)解析等能力;并且支持高質(zhì)量4D數(shù)字資產(chǎn)重建與實(shí)時(shí)交互,從而推動(dòng)具身模型在4D真實(shí)世界不斷學(xué)習(xí)迭代。視頻分辨率滿足機(jī)器人場(chǎng)景算法訓(xùn)練、稀疏控制更貼近具身數(shù)據(jù)集標(biāo)注分布情況,二者加成有利于世界模型應(yīng)用落地,結(jié)合多視角生產(chǎn)能力,突破了具身數(shù)據(jù)合成的技術(shù)瓶頸。開啟機(jī)器人技術(shù)的新時(shí)代,為在物理環(huán)境中導(dǎo)航以處理家務(wù)和復(fù)雜任務(wù)的AIAgent賦能,也可以幫助個(gè)體在嘈雜環(huán)境中導(dǎo)航,提供障礙物和危險(xiǎn)的實(shí)時(shí)警報(bào)。商湯
開悟世界模型——
世界模型平臺(tái)賦能具身智能V-JEPA2可以預(yù)測(cè)世界將如何演變,它利用世界模型來理解物理現(xiàn)實(shí),預(yù)測(cè)結(jié)果,并計(jì)劃有效的策略,并且只需要最少的監(jiān)督。編碼器和預(yù)測(cè)器通過視覺數(shù)據(jù)的自我監(jiān)督學(xué)習(xí)進(jìn)行預(yù)訓(xùn)練,利用豐富的自然視頻來引導(dǎo)對(duì)物理世界的理解和預(yù)測(cè)。以合成數(shù)據(jù)為核心,支撐模型算法訓(xùn)練和仿真測(cè)試兩翼發(fā)展。通過合成數(shù)據(jù),實(shí)現(xiàn)與下游模型單幀級(jí)別實(shí)時(shí)交互。Meta
V-JEPA2——
自監(jiān)督基礎(chǔ)世界模型與語言建模相結(jié)合時(shí),提供了卓越的運(yùn)動(dòng)理解能力和領(lǐng)先的視覺推理能力。3
首個(gè)高分辨率與稀疏控制的多視世界模型4
應(yīng)用于機(jī)器人與可穿戴設(shè)備4
全流程數(shù)據(jù)處理能力2
解鎖物理世界理解2
具身智能訓(xùn)練場(chǎng)1
合成數(shù)據(jù)為核心3
預(yù)測(cè)未來動(dòng)向1
自監(jiān)督訓(xùn)練來源:
弗若斯特沙利文19處理多個(gè)攝像頭視角、不同的路況和關(guān)鍵的彎道情況。通過提供對(duì)關(guān)鍵驅(qū)動(dòng)因素的精細(xì)控制,GAIA-2使工程師和研究人員能夠創(chuàng)建更豐富、更真實(shí)的訓(xùn)練場(chǎng)景。GAIA-2利用潛在擴(kuò)散框架,在多個(gè)攝像機(jī)視點(diǎn)上提供穩(wěn)定、長時(shí)間的視頻序列,具有時(shí)空一致性。同時(shí)提供對(duì)自我車輛行為和場(chǎng)景特征的精確控制。采用連續(xù)潛在空間,結(jié)合32倍空間壓縮率與64通道高語義維度,通過增強(qiáng)的可控性、擴(kuò)大的地理多樣性,推動(dòng)了合成數(shù)據(jù)生成的邊界。GAIA-2可以系統(tǒng)地生成罕見和高風(fēng)險(xiǎn)的場(chǎng)景,如突然車道變換和緊急機(jī)動(dòng),以改善自動(dòng)駕駛系統(tǒng)的測(cè)試和驗(yàn)證。Wayve
GAIA2——
生成式AI世界模型2
專為自動(dòng)駕駛復(fù)雜場(chǎng)景構(gòu)建4
安全臨界情況的模擬1
生成式世界模型3
多鏡頭高保真來源:
弗若斯特沙利文20世界模型在自動(dòng)駕駛中的應(yīng)用第三章當(dāng)前自動(dòng)駕駛技術(shù)在L2級(jí)輔助駕駛已大規(guī)模
落地。2024年上半年,中國乘用車L2及以上自動(dòng)駕駛新車滲透率已達(dá)55.7%,預(yù)計(jì)2025年將達(dá)到65%。L2級(jí)自動(dòng)駕駛正從高端車型專屬逐漸下放至更多中低端車型,向“全民智駕
”躍遷。L3級(jí)是輔助駕駛和自動(dòng)駕駛的分水嶺,從L2提升到L3級(jí)需要跨越式的技術(shù)與成本。
目前,L3級(jí)自動(dòng)駕駛已從前期驗(yàn)證階段邁向商用初步落地階段,未來2-3年將成為L3級(jí)量產(chǎn)的關(guān)鍵期。然而,對(duì)L4及更高級(jí)別的探索仍面臨法規(guī)、成本與安全等限制,仍聚焦于Robotaxi
、物流貨運(yùn)等限定場(chǎng)景。自動(dòng)駕駛發(fā)展概述L2提升到L3級(jí)自動(dòng)駕駛需要跨越式的技術(shù)與成本,目前整體實(shí)際落地仍停留在L3以下。按照SAE的標(biāo)準(zhǔn),
自動(dòng)駕駛汽車可以依據(jù)智能化、
自動(dòng)化水平被分為6個(gè)等級(jí),從L0到L5反映了車輛自動(dòng)駕駛能力的不斷提升以及人類駕駛員參與程度的逐漸減少。近年來,中國自動(dòng)駕駛滲透率整體呈現(xiàn)提升趨勢(shì),增長主要體現(xiàn)在L2及以上的車型。其中,新能源車型的電氣化和智能化優(yōu)勢(shì)為自動(dòng)駕駛搭載提供了良好基礎(chǔ)。來源:
弗若斯特沙利文從224決策預(yù)測(cè)不穩(wěn)定?
模塊割裂導(dǎo)致響應(yīng)延遲:傳
統(tǒng)“感知-規(guī)劃
”架構(gòu)缺乏整
體協(xié)同理解,面對(duì)動(dòng)態(tài)變換時(shí)容易產(chǎn)生保守或誤判行為?長時(shí)序推理能力弱
:傳統(tǒng)規(guī)
則系統(tǒng)僅能預(yù)測(cè)1秒內(nèi)路況,
無法應(yīng)對(duì)長時(shí)間未來場(chǎng)景預(yù)
測(cè)需求1環(huán)境理解能力不足?動(dòng)態(tài)障礙物誤判率高:自動(dòng)駕
駛系統(tǒng)在惡劣天氣(如雨、霧、雪)中使用的
LiDAR
等傳感器
表現(xiàn)明顯下降?單一傳感器可靠性受限:
多傳
感器融合復(fù)雜度高,時(shí)間同步
誤差過大會(huì)使感知融合失效造
成誤判5
研發(fā)與運(yùn)營成本高昂?
硬件成本高:
高等級(jí)所需
的
LiDAR
、冗余感應(yīng)器與冗余硬
件顯著提升單車成本,維護(hù)與
地圖標(biāo)注、傳感器校準(zhǔn)帶來長期經(jīng)營壓力?長期數(shù)據(jù)成本高:長期訓(xùn)練還
需龐大的數(shù)據(jù)團(tuán)隊(duì)和高成本數(shù)
據(jù)標(biāo)注流程,產(chǎn)業(yè)普遍負(fù)擔(dān)重3
高度依賴高精地圖?
時(shí)效性難以保持:流動(dòng)環(huán)境中地圖需頻繁更新,否則造成定位與決策誤差,但地圖維護(hù)成本過高?跨區(qū)域適配成本高:支持不同
區(qū)域(如中/美/歐)
的差異化
交規(guī)需定制地圖,開發(fā)周期延
長,成本增加6
安全信任度不足?安全驗(yàn)證時(shí)間長:
在統(tǒng)計(jì)意義
上證明自動(dòng)駕駛的致命事故率
優(yōu)于人類駕駛需耗時(shí)數(shù)十年甚
至數(shù)百年,傳統(tǒng)“行駛里程證
明安全
”策略幾乎不可行?
公眾信任程度保守:
全球僅
38%消費(fèi)者信
任
L3+
系統(tǒng)
,
67%擔(dān)憂算法倫理決策不透明泛化能力差2?長尾場(chǎng)景稀有:需數(shù)億甚至數(shù)
十億英里實(shí)測(cè)才能統(tǒng)計(jì)驗(yàn)證安全性,數(shù)據(jù)量需求不現(xiàn)實(shí)?仿真與真實(shí)場(chǎng)景鴻溝:虛擬測(cè)
試中動(dòng)態(tài)物體行為建模誤差較
大,極端天氣(如暴雨、大霧)的物理效應(yīng)模擬失真度激增,導(dǎo)致實(shí)車失效率陡增自動(dòng)駕駛當(dāng)前發(fā)展障礙
——
6大核心痛點(diǎn)來源:
弗若斯特沙利文23世界模型能夠生成或應(yīng)對(duì)的高復(fù)雜度、高風(fēng)險(xiǎn)的真實(shí)駕駛環(huán)境。這些場(chǎng)景通常具有高動(dòng)態(tài)性、高不確定性的特點(diǎn),傳統(tǒng)算法難以覆蓋。其核心價(jià)值在于解決自動(dòng)駕駛的長尾問題,覆蓋極端天氣、突發(fā)風(fēng)險(xiǎn)、全域連續(xù)駕駛等不足0.1%但決定99.9%安全性的場(chǎng)景,推動(dòng)L3級(jí)系統(tǒng)落地。極端天氣下動(dòng)態(tài)避障無規(guī)則路口群體博弈世界模型能通過生成多層復(fù)雜要素結(jié)合的場(chǎng)景,將傳統(tǒng)算法難以覆蓋的“
高動(dòng)態(tài)+高不確定性
”場(chǎng)景轉(zhuǎn)化為可控問題。世界模型應(yīng)用的生成場(chǎng)景是多層要素的結(jié)合:靜態(tài)和動(dòng)態(tài)參與者、道路環(huán)境、天氣和光照條件、不同國家和地區(qū)的交通背景。?動(dòng)態(tài)物體:如行人、車輛、自行車的運(yùn)動(dòng)規(guī)律和行為預(yù)測(cè)。?靜態(tài)環(huán)境:如道路的寬度、標(biāo)志線、路邊設(shè)施的多樣性。世界模型在自動(dòng)駕駛中生成了哪些場(chǎng)景?不同國家和地區(qū)的交通
法規(guī)和基礎(chǔ)設(shè)施差異催
生區(qū)域化適配要求地區(qū)背景自然環(huán)境道路層參與者世界模型在自動(dòng)駕駛中的生成場(chǎng)景場(chǎng)景生成要素高速公路
鄉(xiāng)間小路靜態(tài)——交通基礎(chǔ)設(shè)施來源:
弗若斯特沙利文城市道路動(dòng)態(tài)2425
不同模塊協(xié)同優(yōu)化
世界模型能夠助力自動(dòng)駕駛系統(tǒng)在產(chǎn)品性
能和市場(chǎng)表現(xiàn)的雙重升級(jí)。一方面,世界
模型能夠快速生成海量高保真場(chǎng)景,覆蓋
長尾與極端事件,顯著增強(qiáng)系統(tǒng)魯棒性與
安全保障。另一方面,世界模型通過高效
仿真替代真實(shí)路測(cè),不再依賴昂貴標(biāo)注和
地圖數(shù)據(jù),在降低研發(fā)成本體系的同時(shí)推動(dòng)產(chǎn)品快速迭代和市場(chǎng)拓展。世界模型是突破L4(如Robotaxi等)規(guī)模
化部署瓶頸的加速器,是構(gòu)成自動(dòng)駕駛智
能體走向類人認(rèn)知與判斷模式的關(guān)鍵基礎(chǔ)。“超過80%的
自動(dòng)駕駛算法使用世界模型進(jìn)行輔助訓(xùn)練
”世界模型通過構(gòu)建“真實(shí)數(shù)據(jù)→模型訓(xùn)練→仿真場(chǎng)景驗(yàn)證→模型部署”的閉環(huán)反饋機(jī)制,并提供統(tǒng)一的潛在世界狀態(tài)表征,從而為感知、預(yù)測(cè)、規(guī)劃、控制等模塊提供一致的認(rèn)知語境。因此,世界模型能夠推動(dòng)自動(dòng)駕駛系統(tǒng)持續(xù)學(xué)習(xí)、自主驗(yàn)證并快速迭代優(yōu)化,從而顯著提升端到端自動(dòng)駕駛表現(xiàn)。優(yōu)化成本效率?
大幅降低實(shí)車測(cè)試依
賴與成本?
節(jié)省高清地圖和長尾
數(shù)據(jù)采集投入?研發(fā)閉環(huán)效率提升加速商業(yè)化落地?
加速產(chǎn)品迭代?
擴(kuò)展功能場(chǎng)景與市場(chǎng)
覆蓋?
突破L4規(guī)?;渴?/p>
瓶頸復(fù)雜場(chǎng)景建模推理?
物理屬性與因果
推理?
多模態(tài)融合感知?
長時(shí)間動(dòng)態(tài)推演強(qiáng)化安全保障?
全場(chǎng)景覆蓋驗(yàn)證?
長尾及極端場(chǎng)景模擬生成?
陌生情況的即時(shí)推演與自適應(yīng)數(shù)據(jù)采集世界模型在自動(dòng)駕駛中的能力分析
端到端訓(xùn)練閉環(huán)
世界模型如何賦能自動(dòng)駕駛系統(tǒng)?世界模型推動(dòng)自動(dòng)駕駛系統(tǒng)持續(xù)進(jìn)化產(chǎn)品性能升級(jí)市場(chǎng)表現(xiàn)升級(jí)世界模型來源:
弗若斯特沙利文25世界模型能夠自動(dòng)生成自帶標(biāo)注的圖像與視
頻數(shù)據(jù),包括極端或罕見場(chǎng)景,避免昂貴的真實(shí)數(shù)據(jù)采集成本。同時(shí),世界模型可在無需大量人工設(shè)計(jì)的情況下,生成多模態(tài)、跨
時(shí)序一致的場(chǎng)景,顯著降低人工建模與標(biāo)簽標(biāo)注的投入。雖然構(gòu)建世界模型初始需要大量訓(xùn)練與計(jì)算資源成本投入,但一旦訓(xùn)練完
成,其生成額外高質(zhì)量數(shù)據(jù)的邊際成本極低,相較于采集真實(shí)數(shù)據(jù)和傳統(tǒng)仿真重建場(chǎng)景更
具數(shù)據(jù)規(guī)模經(jīng)濟(jì)優(yōu)勢(shì)。綜合以下6個(gè)維度對(duì)比分析(A.初始投入;
B.邊際生成成本;
C.極端/長尾場(chǎng)景覆蓋能力;
D.數(shù)據(jù)規(guī)模經(jīng)濟(jì);E.真實(shí)性;
F.一致性),世界模型擁有更優(yōu)秀的成本表現(xiàn),且生成的
數(shù)據(jù)質(zhì)量會(huì)隨模型訓(xùn)練持續(xù)改進(jìn)。維度真實(shí)數(shù)據(jù)
采集傳統(tǒng)仿真世界模型A高中等偏高B極高中等偏高低C有限一般優(yōu)秀D弱中等強(qiáng)E高較優(yōu)中等偏高F高中等偏高較優(yōu)世界模型通過模擬未來場(chǎng)景、提供更豐富、更高效的訓(xùn)練信號(hào),顯著加速了自動(dòng)駕駛模型的收斂過程。這不僅提升訓(xùn)練效率,還增強(qiáng)了模型的性能和泛化能力。下圖中,橫軸表示訓(xùn)練時(shí)間,縱軸表示模型在實(shí)際執(zhí)行任務(wù)中的表現(xiàn)。圖中兩條曲線的對(duì)比顯示,世界模型能在相同訓(xùn)練時(shí)間內(nèi),對(duì)比基線模型更快達(dá)到更優(yōu)性能,提升自動(dòng)駕駛感知、規(guī)劃甚至端到端的學(xué)習(xí)效率。
世界模型的收斂曲線以更快的速度上升,其達(dá)到穩(wěn)定性能所需訓(xùn)練時(shí)間或迭代次數(shù)遠(yuǎn)低于基線模型,表示模型能在更少的訓(xùn)練時(shí)間或更少的數(shù)據(jù)下,學(xué)到高質(zhì)量的參數(shù)和策略。
世界模型的收斂曲線最終性能提升水平高于基線模型,基線模型的收斂曲線顯得緩慢、震蕩且總值較低。26性能表現(xiàn)世界模型的訓(xùn)練收斂曲線基線模型的訓(xùn)練收斂曲線訓(xùn)練時(shí)間進(jìn)一步理解世界模型對(duì)自動(dòng)駕駛的實(shí)際價(jià)值“世界模型能夠節(jié)省近50%的成本,提高約70%的效率”
由淺至深對(duì)應(yīng)由低至高的表現(xiàn)優(yōu)秀程度來源:
弗若斯特沙利文通用世界模型將具備更強(qiáng)的泛化和遷移能力,可以跨城市、跨車輛平臺(tái)發(fā)揮作用,成為自動(dòng)駕駛的“通用大腦
”。有了通用世界模型,不同廠家和地區(qū)的自動(dòng)駕駛系統(tǒng)或可共享同一套核心智能。目前,多家主流廠商已將世界模型視為下一代智能駕駛架構(gòu)的核心,計(jì)劃訓(xùn)練能夠全面表達(dá)和預(yù)測(cè)真實(shí)世界的通用模型。未來的通用世界模型或?qū)⑷诤蠑?shù)百億參數(shù)、多模態(tài)輸入,成為驅(qū)動(dòng)L4/L5自動(dòng)駕駛的基礎(chǔ)設(shè)施。?多輛自動(dòng)駕駛車輛之間可以共享各自感知信息,在云端融合成更大范圍、更精細(xì)的世界模型,實(shí)現(xiàn)車隊(duì)層面的環(huán)境建模與決策優(yōu)化,有助于解決單車視野受限、傳感器冗余不足的問題。?未來,多車協(xié)同世界模型可應(yīng)用于車隊(duì)編隊(duì)、智能調(diào)度等場(chǎng)景,通過群體智能優(yōu)化決策與交通效率。?在車路協(xié)同上,路側(cè)感知與車端世界模型融合也是典型方向,可擴(kuò)展車輛對(duì)整體環(huán)境的認(rèn)知。A?世界模型將重塑高精地圖的生成與使用模式,催生AI原生地圖,支持車輛在行駛過程中實(shí)時(shí)構(gòu)建環(huán)境模型,并同步至云端進(jìn)行共享。?不同于靜態(tài)預(yù)制地圖,AI原生地圖具備動(dòng)態(tài)更新能力,深度融合車載感知,甚至能主動(dòng)預(yù)測(cè)環(huán)境變化,支持陌生道路下的即時(shí)環(huán)境認(rèn)知,實(shí)現(xiàn)“所見即所知
”的能力。建?未來自動(dòng)駕駛系統(tǒng)或?qū)⒋笠?guī)模采用
世界模型輔助的強(qiáng)化學(xué)習(xí):先由世
界模型模擬環(huán)境和車輛動(dòng)力學(xué),再讓決策策略在其中通過強(qiáng)化學(xué)習(xí)不
斷試錯(cuò)優(yōu)化。?世界模型與強(qiáng)化學(xué)習(xí)的結(jié)合有望使
得自動(dòng)駕駛成為真正具備自主進(jìn)化
能力的智能體系統(tǒng),即通過不斷地
自我博弈和環(huán)境交互來提高。隨著
算力提升,
自動(dòng)駕駛系統(tǒng)可能探索
出連人類都未想到的最優(yōu)駕駛策略。?世界模型將綜合視覺、雷達(dá)、地圖、V2X通信、
自然語言等多模態(tài)信息源,構(gòu)建更全面的數(shù)字孿生,賦予模型“知識(shí)
”和“
常識(shí)
”理解能力。?未來,世界模型將進(jìn)一步深化與
BEV架構(gòu)和VLA(視-語-行動(dòng))模型的融合,實(shí)現(xiàn)向統(tǒng)一語義認(rèn)
知與決策一體化演進(jìn),使自動(dòng)駕
駛系統(tǒng)接近人類司機(jī)的直覺判斷?!笆澜缒P臀磥眍A(yù)計(jì)1-2年內(nèi)實(shí)現(xiàn)上車,引領(lǐng)自動(dòng)駕駛從車
端走向云端”從“兩段式
”到“一段式
”端到端,最終實(shí)現(xiàn)世界模型的應(yīng)用,是自動(dòng)駕駛從車端到云端的技術(shù)路線圖。未來1-2年,世界模型的成熟將引領(lǐng)自動(dòng)駕駛迎來真正的爆發(fā)。未來世界模型在自動(dòng)駕駛中將走向何處?
通用
世
界模型跨模態(tài)世
界建模與強(qiáng)化學(xué)習(xí)融合多車協(xié)同建模I原生地圖構(gòu)來源:
弗若斯特沙利文27??世界模型在具身智能中的應(yīng)用第四章無人機(jī)人形機(jī)器人機(jī)械臂履帶式機(jī)器雙足機(jī)器人過去十年是感知智能快速發(fā)展的時(shí)期,而未來十年將是具身智能的黃金時(shí)代。具身智能是指通過機(jī)器人等物體實(shí)體與環(huán)境交互,實(shí)現(xiàn)對(duì)世界的感知、決策、行動(dòng)、反饋閉環(huán),并能由此實(shí)現(xiàn)智能增長和行動(dòng)
自適應(yīng)的智能系統(tǒng)。具身智能代表著AI從
純粹的信息處理轉(zhuǎn)向物理世界的交互。具身智能的基礎(chǔ)架構(gòu)由本體、數(shù)據(jù)和軟硬
件技術(shù)底座共同構(gòu)成。本體作為任務(wù)執(zhí)行機(jī)構(gòu),其形態(tài)、傳感器及核心零部件硬件直接影響感知與行動(dòng)能力。其中,人形機(jī)器人憑借高自由度的操作移動(dòng)能力、強(qiáng)環(huán)境適應(yīng)性及良好接受度,被廣泛視為最具潛力的通用形態(tài)。數(shù)據(jù)是關(guān)鍵驅(qū)動(dòng)力,需要依賴高質(zhì)量真實(shí)數(shù)據(jù)和高效低成本的仿真數(shù)據(jù)實(shí)現(xiàn)0到1的突破,并支撐1到N的深度復(fù)雜應(yīng)用。軟硬件底座提供三位一體的支撐:
軟件工具鏈支撐靈活開發(fā)與高效測(cè)試,通用計(jì)算平臺(tái)保障復(fù)雜計(jì)算的可靠運(yùn)行。操作系統(tǒng)中間件云計(jì)算與邊緣計(jì)算仿真平臺(tái)多模態(tài)傳感數(shù)據(jù)采集數(shù)據(jù)從感知智能向具身智能的躍遷物理仿真場(chǎng)景、生成式合成數(shù)據(jù)、數(shù)字孿生體、對(duì)抗增強(qiáng)數(shù)據(jù)、邏輯規(guī)則數(shù)據(jù)
……視覺、音頻、溫度、觸覺、力覺、距離感知、慣性
……運(yùn)動(dòng)軌跡、動(dòng)作指
令、視頻記錄
……交互真實(shí)世界數(shù)據(jù)仿真合成數(shù)據(jù)具身智能技術(shù)架構(gòu)具身本體環(huán)境基礎(chǔ)支撐關(guān)鍵技術(shù)eVTOL四足機(jī)器人仿生機(jī)器人無人車輪式機(jī)器人世界模型LLMVLA強(qiáng)化學(xué)習(xí)VLM②決策③
行動(dòng)④
反饋①
感知從環(huán)境感知信息來源:
弗若斯特沙利文行動(dòng)改變環(huán)境29機(jī)器人
智能等級(jí)階段定義信息獲取
信息反饋
行為應(yīng)用
行為創(chuàng)新L2感知操控機(jī)器人能夠感知周圍環(huán)境并反饋?zhàn)陨頎顟B(tài)如位姿、故障信息
/L3自適應(yīng)機(jī)器人在特定場(chǎng)景和特定范圍內(nèi)可以實(shí)現(xiàn)高度的自適應(yīng)
/L4完全自主機(jī)器人完全自主、獨(dú)立行動(dòng)、自由與其他智能體交互隨著智能化
、自動(dòng)化水平的提升,L2至L4
級(jí)別
的機(jī)器人因其高級(jí)感知
、
決策和適應(yīng)能力,
對(duì)于滿足工業(yè)制造
、醫(yī)療健康
、
零售和服務(wù)等行業(yè)的復(fù)雜動(dòng)態(tài)需求至關(guān)重要。大模型技術(shù)的突破為具身智能帶來了技術(shù)
范式轉(zhuǎn)移,
具身智能產(chǎn)業(yè)目前正處于快速
拓展期,預(yù)計(jì)未來將在更多行業(yè)實(shí)現(xiàn)規(guī)模
化應(yīng)用,
成為推動(dòng)社會(huì)智能化轉(zhuǎn)型的重要
力量
。
長期來看,
具身智能未來產(chǎn)業(yè)發(fā)展
空間巨大,
2050年潛在的全球市場(chǎng)規(guī)模將
超過一萬億元。水平被劃分為五個(gè)等級(jí),從基礎(chǔ)操作到完全自主,依次為L0(人工操控)
、L1(程序操控)
、L2(感知操控)
、L3(自適應(yīng)操控)和L4(完全自主)。當(dāng)前,尤其在工業(yè)制造領(lǐng)域,應(yīng)用最為普遍的是L0和L1級(jí)別的機(jī)器人,如執(zhí)行固定程序的機(jī)械臂和直角坐標(biāo)機(jī)器人。盡管這些機(jī)器人能夠高效地處理高精度的重復(fù)性制造任務(wù),但它們?cè)趹?yīng)對(duì)商業(yè)市場(chǎng)快速變化和迭代方面存在局限。具身智能代表了機(jī)器人發(fā)展的高級(jí)階段,
也是走向通用人工智能(
AGI)
的必經(jīng)之路機(jī)器人沒有任何自主性,完全依賴人為操控L1
程序操控機(jī)器人受預(yù)先編程的程序控制/靈活、快速迭代、自適應(yīng)固定、笨重、死板在機(jī)器人技術(shù)領(lǐng)域,智能機(jī)器人的自動(dòng)化具身智能范疇智能機(jī)器人分級(jí)來源:
弗若斯特沙利文人工操控L030具身智能所需的數(shù)據(jù)需要整合文本指令、多視角視覺、關(guān)節(jié)運(yùn)動(dòng)軌跡及物理交互等多維信號(hào),復(fù)雜度遠(yuǎn)超純文本或單一視覺模態(tài)。采集真實(shí)的物理交互數(shù)據(jù)則需要搭建各種工作生活場(chǎng)景,耗時(shí)長成本高,使得技術(shù)研發(fā)速度嚴(yán)重滯后。數(shù)據(jù)獲取困難、場(chǎng)景復(fù)雜多變、試錯(cuò)成本巨大、標(biāo)注成本高昂、數(shù)據(jù)標(biāo)準(zhǔn)不一致等挑戰(zhàn)嚴(yán)重阻礙了具身智能行業(yè)的發(fā)展。為了應(yīng)對(duì)這些挑戰(zhàn),具身智能行業(yè)對(duì)合成數(shù)據(jù)的需求和認(rèn)可逐漸增長,幾乎所有頭部的具身智能企業(yè)均在使用合成數(shù)據(jù)。具身智能的核心困境在于模型訓(xùn)練對(duì)數(shù)據(jù)的
需求量大,但物理交互數(shù)據(jù)極度缺乏。在數(shù)據(jù)規(guī)模上,相比大語言模型的TB級(jí)存量和自
動(dòng)駕駛的PB級(jí)積累,具身智能只有約240萬
的積累但需要數(shù)百PB級(jí)的物理交互數(shù)據(jù)支撐,數(shù)據(jù)缺口超過99%。
同時(shí),真實(shí)數(shù)據(jù)的獲取
周期較長,無法滿足具身智能爆發(fā)式的需求。
每家企業(yè)實(shí)現(xiàn)通用能力需約400萬小時(shí)數(shù)據(jù),國內(nèi)全行業(yè)共需約6000萬小時(shí)
數(shù)據(jù)采集時(shí)長:
機(jī)器人本體企業(yè)約6.5年,模型企業(yè)約32年——物理交互數(shù)據(jù)的“千倍級(jí)缺口”數(shù)據(jù)獲取困難具身智能領(lǐng)域的核心痛點(diǎn)標(biāo)注成本高昂場(chǎng)景復(fù)雜多變?cè)囧e(cuò)成本巨大合成數(shù)據(jù)數(shù)據(jù)標(biāo)準(zhǔn)不一致具身智能~240萬文本~15萬億數(shù)據(jù)集規(guī)模圖像~60億來源:
弗若斯特沙利文~26億視頻31
提升模型泛化能力通過世界模型生成的海量、多樣化合成數(shù)
據(jù)進(jìn)行訓(xùn)練,能顯著提升具身智能模型在
未知環(huán)境中的適應(yīng)能力和任務(wù)執(zhí)行成功率。?增強(qiáng)模型魯棒性:世界模型為智能體訓(xùn)
練提供多樣化的變體數(shù)據(jù),顯著增強(qiáng)模
型對(duì)真實(shí)世界中的噪聲和變化的魯棒性?跨平臺(tái)與跨任務(wù)遷移:在大規(guī)模、多樣
化的合成數(shù)據(jù)上訓(xùn)練的基礎(chǔ)模型,其學(xué)
習(xí)到的表征和策略更可能捕捉到任務(wù)的
本質(zhì)和共性,從而更容易遷移到不同的
機(jī)器人平臺(tái)或執(zhí)行相關(guān)的新任務(wù)上
高質(zhì)量合成數(shù)據(jù)世界模型能生成視覺逼真、物理精確的合
成數(shù)據(jù),有效克服了傳統(tǒng)仿真數(shù)據(jù)與真實(shí)
世界之間的差異。?多模態(tài)融合:先進(jìn)的世界模型能夠處理和理解多模態(tài)的輸入信息?物理一致性:通過整合物理引擎的約束,生成的合成數(shù)據(jù)不僅物理擁有精準(zhǔn)性,行為和互動(dòng)也更合理
高成本效益與可擴(kuò)展性世界模型能夠大幅降低數(shù)據(jù)獲取的時(shí)間和經(jīng)濟(jì)成本,并輕松實(shí)現(xiàn)數(shù)據(jù)規(guī)模的擴(kuò)展。?大幅降低數(shù)據(jù)成本:合成數(shù)據(jù)生成主要依賴計(jì)算資源,能顯著降低成本并縮短迭代周期?多樣化數(shù)據(jù)擴(kuò)展:零風(fēng)險(xiǎn)生成在現(xiàn)實(shí)世界中稀少、危險(xiǎn)的極端場(chǎng)景如何量化合成數(shù)據(jù)的成本效益
數(shù)據(jù)獲取成本降低約60%
縮短數(shù)據(jù)獲取周期:本體企業(yè)縮短約70%,模型企業(yè)縮短約95%(
以真實(shí)數(shù)據(jù):合成數(shù)據(jù)=1:9的比例保障訓(xùn)練數(shù)據(jù)有效性)世界模型“世界模型為具身智能提供高質(zhì)量、低成本、易擴(kuò)展的合成數(shù)據(jù)生成路徑,解決當(dāng)前數(shù)據(jù)瓶頸”世界模型為具身智能提供大規(guī)模高質(zhì)量合成數(shù)據(jù)場(chǎng)景生成視頻未來預(yù)測(cè)視頻場(chǎng)景生成需求當(dāng)前行為信息大量高質(zhì)量合成數(shù)據(jù)極少量真實(shí)樣本來源:
弗若斯特沙利文32“世界模型不僅為具身智能提供數(shù)據(jù)支持,更正在重塑其整個(gè)開發(fā)范式”以世界模型為核心構(gòu)建具身智能的一站式
開發(fā)平臺(tái)能夠提供集成化的工具鏈和環(huán)境,重塑了具身智能的開發(fā)范式。通過將數(shù)據(jù)
合成、算法訓(xùn)練和仿真驗(yàn)證無縫連接,形
成閉環(huán)迭代系統(tǒng),能夠大幅提升研發(fā)效率,降低技術(shù)門檻,從而消除具身智能發(fā)展的
工程障礙,讓研究人員和工程師專注于算
法和應(yīng)用的創(chuàng)新,而不是基礎(chǔ)設(shè)施的構(gòu)建。首先,世界模型為算法訓(xùn)練提供了安全、
高效且可解釋的仿真環(huán)境。世界模型通過模擬智能體動(dòng)作引發(fā)的精確狀態(tài)變化和物理交互,支持對(duì)“感知-決策-執(zhí)行
”全流程進(jìn)行閉環(huán)驗(yàn)證與迭代優(yōu)化,從而系統(tǒng)性提升智能體在復(fù)雜動(dòng)態(tài)環(huán)境中的適應(yīng)性和可靠性。其次,
以世界模型為引擎的開發(fā)范式能夠深度整合開發(fā)工具鏈,為具身智能研究提供端到端的高效支持。世界模型作為核心預(yù)測(cè)與生成引擎,能夠無縫銜接從開發(fā)、訓(xùn)練到仿真部署的全流程,消除了工具鏈割裂帶來的效率損耗。
因此,世界模型能夠大幅提升具身智能主流模型的開發(fā)與訓(xùn)練效率,并支持模型性能的優(yōu)化。進(jìn)一步理解世界模型如何賦能具身智能算法訓(xùn)練提供算法開發(fā)平臺(tái)及工具鏈,實(shí)現(xiàn)算法設(shè)計(jì)、模型訓(xùn)練至
部署全流程標(biāo)準(zhǔn)化,提升協(xié)
作性及研發(fā)效率閉環(huán)仿真構(gòu)建虛擬環(huán)境和訓(xùn)練場(chǎng)景,執(zhí)行測(cè)試程序來驗(yàn)證算法、模型的性能,尤其針對(duì)失
效場(chǎng)景的算法優(yōu)化數(shù)據(jù)合成機(jī)器人工作場(chǎng)景及軌跡數(shù)據(jù)合成
,輸出視頻
,并提供合成數(shù)據(jù)的編輯和管理功能反饋優(yōu)化針對(duì)以上各步驟中的算法能力提供量化的反饋,支撐算法迭代與產(chǎn)品優(yōu)化提供數(shù)據(jù)解析導(dǎo)入合成或存量數(shù)據(jù),進(jìn)行格式解析清洗、預(yù)處理和基本特征提取等工作真值生產(chǎn)通過AI算法為解析后的數(shù)據(jù)標(biāo)注真值支持自動(dòng)化審核和人工審核校準(zhǔn)
一站式閉環(huán)
開發(fā)平臺(tái)以世界模型為核心的一站式閉環(huán)開發(fā)平臺(tái)來源:
弗若斯特沙利文
><
33心智世界模型所需信息:物理世界模型所需信息:目標(biāo)和意圖:動(dòng)機(jī)、偏好和價(jià)值觀用戶的情緒和情感狀態(tài),以及理解這些情緒如何影響行為捕捉社會(huì)動(dòng)態(tài),包括個(gè)體、群體和機(jī)構(gòu)之間的關(guān)系,以及文化規(guī)范、習(xí)俗和期望言語和非言語交流,包括語言、語調(diào)、肢體語言和面部表情“世界模型的未來框架是基于物理+心智的雙軌建模”相比于傳統(tǒng)物理世界模型僅關(guān)注物體運(yùn)動(dòng)和機(jī)械因果的單一視角,未來的心智世界模型將人類的心理規(guī)律(如意圖、情緒、信念、社會(huì)關(guān)系等)納入建模范疇,形成“物理+心智
”的雙軌架構(gòu)。這種架構(gòu)使智能體能夠表征并理解人類的心理狀態(tài)、行為模式和文化慣例,進(jìn)而實(shí)現(xiàn)對(duì)目標(biāo)意圖的預(yù)測(cè)、信念差異的推斷以及情緒反應(yīng)的模擬。借助這種能力,智能體可從被動(dòng)執(zhí)行轉(zhuǎn)向主動(dòng)響應(yīng)用戶需求,提供符合心理預(yù)期的協(xié)助,從而使人機(jī)交互從機(jī)械響應(yīng)邁向具有情境感知與心理理解層次的協(xié)同模式。同時(shí),
心智世界模型還為多智能體協(xié)作提
供了“
共識(shí)心智
”的理論基礎(chǔ)
。
各智能體
不僅能識(shí)別共用的外部環(huán)境信息,
還能夠
相互推斷彼此的意圖
、信念和預(yù)期,
通過心智建模實(shí)現(xiàn)高階的行為對(duì)齊與策略協(xié)調(diào)。面對(duì)不確定或沖突情況下,
心智世界模型
幫助智能體識(shí)別他方內(nèi)在目標(biāo),
從而調(diào)整自身策略以尋找平衡,
推動(dòng)協(xié)作從簡單的同步執(zhí)行向情境感知和情緒兼顧的方向發(fā)
展
。
這種協(xié)同機(jī)制將使未來的人機(jī)互動(dòng)與
智能體間協(xié)作更具社會(huì)性與同理心,
更符
合現(xiàn)實(shí)世界中多主體間合作的復(fù)雜性和柔
性需求,
推動(dòng)具身智能向更復(fù)雜
、
更協(xié)調(diào)
的群體協(xié)同演進(jìn)。
物體及其屬性:形狀、
大小、顏色
物體之間的空間關(guān)系:鄰近性、距離
環(huán)境的動(dòng)態(tài)變化:運(yùn)動(dòng)、時(shí)間上的變化
基于物理定律的動(dòng)作與
結(jié)果之間的因果關(guān)系世界模型在具身智能中的下一步會(huì)走向何處?心智世界模型物理世界模型未來雙軌建模架構(gòu)
來源:
弗若斯特沙利文34世界模型廠商競爭格局第五章應(yīng)用能力
產(chǎn)品能力
生態(tài)建設(shè)行業(yè)覆蓋環(huán)境建模與預(yù)測(cè)數(shù)據(jù)生態(tài)決策與規(guī)劃軟硬件協(xié)同生態(tài)場(chǎng)景覆蓋模擬仿真預(yù)訓(xùn)練合作伙伴生態(tài)研發(fā)投入與創(chuàng)新開發(fā)者生態(tài)?行業(yè)覆蓋考量是否已在主流車企或智能汽車品牌中實(shí)現(xiàn)技術(shù)部署;跨行業(yè)協(xié)同拓展能力:是否具備將世界模型技術(shù)延伸至智慧交通、智慧城市、工業(yè)互聯(lián)網(wǎng)等領(lǐng)域的能力,其他行業(yè)如機(jī)器人、游戲等。?場(chǎng)景覆蓋考量是否能在不同復(fù)雜場(chǎng)景具備良好適應(yīng)性與生成能力,如城市環(huán)境;高速與匝道;極端天氣情況如雨雪、霧霾、夜間、強(qiáng)光等惡劣環(huán)境下的建模與預(yù)測(cè);特殊區(qū)域覆蓋;多模態(tài)交互場(chǎng)景兼
容性等。?環(huán)境建模與預(yù)測(cè)考量對(duì)多源傳感器數(shù)據(jù)的融合建模能力;動(dòng)態(tài)目標(biāo)行為預(yù)測(cè):對(duì)行人、車輛、非機(jī)動(dòng)車等交通參與者的未來軌跡預(yù)測(cè)
準(zhǔn)確性等。?決策與規(guī)劃考量在復(fù)雜環(huán)境中生成合規(guī)路徑的能力;多目標(biāo)優(yōu)化能力;應(yīng)對(duì)突發(fā)狀況的反應(yīng)速度,面對(duì)緊急情況的實(shí)時(shí)響應(yīng)能力以及
長周期任務(wù)規(guī)劃的能力世界模型廠商綜合實(shí)力評(píng)估指標(biāo)定義產(chǎn)品能力應(yīng)用能力來源:
弗若斯特沙利文36?合作伙伴生態(tài)考量廠商的產(chǎn)學(xué)研合作深度,與高校、研究機(jī)構(gòu)在世界模型方向的合作項(xiàng)目與成果轉(zhuǎn)化;產(chǎn)業(yè)鏈協(xié)同能力:與車企、Tier1供應(yīng)商、云服務(wù)商等上下游企業(yè)的聯(lián)合開發(fā)案例等。?開發(fā)者生態(tài)考量廠商的開發(fā)者支持體系:是否提供SDK、API、文檔、教程、示例代碼等資源;是否具備開發(fā)者社區(qū),社區(qū)活躍度以及開發(fā)者熱度。是否建立閉環(huán)的用戶體驗(yàn)反饋機(jī)制以持續(xù)優(yōu)化模型
性能及商業(yè)化落地能力。?技術(shù)研發(fā)投入與創(chuàng)新能力考量企業(yè)在世界模型相關(guān)技術(shù)上的資金與人力投入情況;算法創(chuàng)新成果:是否提出具有原創(chuàng)性的世界模型架構(gòu)或改進(jìn)方案;專利與論文產(chǎn)出:在世界模型與智能駕駛交叉領(lǐng)域的專利申請(qǐng)數(shù)量及學(xué)術(shù)論文發(fā)表質(zhì)量?數(shù)據(jù)生態(tài)考量數(shù)據(jù)采集能力;數(shù)據(jù)標(biāo)注與治理能力:數(shù)據(jù)清洗、標(biāo)注、脫敏、版本管理等流程的完善程度;數(shù)據(jù)多樣性與覆蓋廣度:涵蓋不同地區(qū)、天氣、光照、交通密度等場(chǎng)景的豐富度;數(shù)據(jù)安全
與合規(guī)性。?軟硬件協(xié)同生態(tài)考量芯片適配與算力優(yōu)化能力:模型在不同計(jì)算平臺(tái)上的部署效率;中間件與工具鏈完整性:是否提供從模型訓(xùn)練、部署、推理到監(jiān)控的全流程開發(fā)工具;與其他系統(tǒng)集成能力:與現(xiàn)
有自動(dòng)駕駛系統(tǒng)的兼容性和耦合性等。?模擬仿真與訓(xùn)練能力考量虛擬環(huán)境構(gòu)建能力,能否構(gòu)建高保真、可編程的模擬世界用于模型訓(xùn)練與驗(yàn)證;是否支持基于世界模型的端到端強(qiáng)化學(xué)習(xí)策略訓(xùn)練;生態(tài)建設(shè)能力來源:
弗若斯特沙利文37主要提供底層技術(shù)、平臺(tái)和仿真能力,面向整車廠與行業(yè)合作伙伴輸出解決方案。中國世界模型廠商總覽與簡介以車企為代表,直接自研世界模型并將其嵌入自身智能駕駛系統(tǒng)。來源:
弗若斯特沙利文具身智能自動(dòng)駕駛38
產(chǎn)品技術(shù):4.71分
應(yīng)用能力:4.55分
生態(tài)建設(shè):4.54分*注:藍(lán)色系廠商為第三方自動(dòng)駕駛解決方案商世界模型能力,黃色廠商為造車新勢(shì)力自研世界模型能力39
產(chǎn)品技術(shù):4.57分
應(yīng)用能力:4.22分
生態(tài)建設(shè):4.20分
產(chǎn)品技術(shù):4.55分
應(yīng)用能力:4.00分
生態(tài)建設(shè):4.10分中國世界模型廠商競爭格局商湯世界模型綜合能力在獨(dú)立第三方及主機(jī)廠中處于領(lǐng)先地位
產(chǎn)品技術(shù):4.50分
應(yīng)用能力:4.30分
生態(tài)建設(shè):4.10分●
產(chǎn)品技術(shù):4.54分
應(yīng)用能力:4.32分
生態(tài)建設(shè):4.19分
產(chǎn)品技術(shù):4.43分
應(yīng)用能力:4.25分
生態(tài)建設(shè):4.11分
產(chǎn)品技術(shù):4.50分
應(yīng)用能力:4.35分
生態(tài)建設(shè):4.32分
產(chǎn)品技術(shù):4.35分
應(yīng)用能力:4.30分
生態(tài)建設(shè):4.14分
產(chǎn)品技術(shù):4.51分
應(yīng)用能力:4.52分
生態(tài)建設(shè):4.54分4.534.394.354.304.604.224.274.264.33
來源:
弗若斯特沙利文具身智能
合成數(shù)據(jù)能力領(lǐng)先
一鏈生成場(chǎng)景多樣性可控泛化場(chǎng)景要素可控耦合、任意編輯3D技術(shù)控制生成逼真軌跡基礎(chǔ)動(dòng)作:擰螺絲、跳躍、精細(xì)放置、手指抓取……場(chǎng)景軌跡:醫(yī)療護(hù)
理、超市補(bǔ)貨、流水線工作……首個(gè)
支持高分辨率與稀疏控制的多視世界模型
,
突破具身智能數(shù)據(jù)合成技術(shù)瓶頸商湯絕影構(gòu)建了以開悟世界模型為核心引擎的悟能具身智能平臺(tái),實(shí)現(xiàn)視覺感知、精準(zhǔn)導(dǎo)航與多模態(tài)交互,并通過端側(cè)與云側(cè)算力支撐,實(shí)現(xiàn)智能體在真實(shí)環(huán)境中的自主理解與行動(dòng)。為自動(dòng)駕駛廠商提供低成本海量仿真數(shù)據(jù)與極端場(chǎng)景覆蓋,助力加速訓(xùn)練迭代與量產(chǎn)落地。商湯絕影在上海自動(dòng)駕駛
實(shí)訓(xùn)場(chǎng)支撐數(shù)據(jù)到模型上
車的全鏈路,規(guī)?;?/p>
多視角仿真數(shù)據(jù),降低數(shù)
據(jù)成本并提升研發(fā)效率。智能駕駛
合成數(shù)據(jù)
高效學(xué)習(xí)物理世界快速學(xué)習(xí)命令、知
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 代管代發(fā)協(xié)議書
- 商場(chǎng)線上活動(dòng)策劃方案(3篇)
- 企業(yè)股權(quán)協(xié)議書
- 工地隔墻施工方案(3篇)
- 修改管道協(xié)議書
- 高鐵列車制造行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 高速鐵路信號(hào)系統(tǒng)行業(yè)市場(chǎng)現(xiàn)狀技術(shù)革新分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 修繕租房協(xié)議書
- 預(yù)定活動(dòng)策劃方案模板(3篇)
- 廚房水道施工方案(3篇)
- 小品聰明的小明小明同學(xué)臺(tái)詞
- 2022年銅陵市義安區(qū)檢察院招聘考試真題
- 高中英語語法過去完成時(shí)優(yōu)秀公開課課件
- 《思想道德與法治》材料分析題
- CQI-12特殊過程:涂裝系統(tǒng)評(píng)估表(中文第三版)
- 云南省地方課程四年級(jí)上冊(cè)《源遠(yuǎn)流長話云南》期末試卷
- 套筒窯工藝控制
- 任良天集體備課基本不等式
- GB/T 2975-2018鋼及鋼產(chǎn)品 力學(xué)性能試驗(yàn)取樣位置及試樣制備
- GB/T 21254-2017呼出氣體酒精含量檢測(cè)儀
- GB/T 11334-2005產(chǎn)品幾何量技術(shù)規(guī)范(GPS)圓錐公差
評(píng)論
0/150
提交評(píng)論