2025物理AI發(fā)展現(xiàn)狀、應(yīng)用領(lǐng)域及產(chǎn)業(yè)鏈?zhǔn)崂矸治鰣?bào)告_第1頁(yè)
2025物理AI發(fā)展現(xiàn)狀、應(yīng)用領(lǐng)域及產(chǎn)業(yè)鏈?zhǔn)崂矸治鰣?bào)告_第2頁(yè)
2025物理AI發(fā)展現(xiàn)狀、應(yīng)用領(lǐng)域及產(chǎn)業(yè)鏈?zhǔn)崂矸治鰣?bào)告_第3頁(yè)
2025物理AI發(fā)展現(xiàn)狀、應(yīng)用領(lǐng)域及產(chǎn)業(yè)鏈?zhǔn)崂矸治鰣?bào)告_第4頁(yè)
2025物理AI發(fā)展現(xiàn)狀、應(yīng)用領(lǐng)域及產(chǎn)業(yè)鏈?zhǔn)崂矸治鰣?bào)告_第5頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025行業(yè)分析報(bào)告 5 5 8 圖1:物理AI本質(zhì)是一個(gè)系統(tǒng)工程 5圖2:英偉達(dá)通過(guò)物理實(shí)現(xiàn)虛擬與現(xiàn)實(shí)的結(jié)合 6圖3:Omniverse平臺(tái)集成多類(lèi)型軟件 8圖4:Omniverse在汽車(chē)設(shè)計(jì)方向的應(yīng)用 9圖5:Cosmos根據(jù)語(yǔ)義及視頻生成數(shù)據(jù)供機(jī)器人訓(xùn)練 9圖6:Cosmos根據(jù)不同需求提供多版本 圖7:數(shù)字孿生實(shí)現(xiàn)物理世界與數(shù)字世界的動(dòng)態(tài)交互 圖8:將工業(yè)機(jī)器人融入至Foxconn的工廠數(shù)字孿生實(shí)現(xiàn)部署優(yōu)化 圖9:NVIDIAOmniverseDSX設(shè)計(jì)運(yùn)營(yíng)GW級(jí)算力工廠 圖10:物理AI生成更多復(fù)雜環(huán)境 圖11:生成不同環(huán)境下的行車(chē)環(huán)境 圖12:在虛擬環(huán)境中完成智能體訓(xùn)練 圖13:天準(zhǔn)科技產(chǎn)品同步整合英偉達(dá)軟件工具鏈 21圖14:對(duì)低空氣象突變實(shí)時(shí)仿真,具備生成物理數(shù)據(jù)的能力 22圖15:3D高斯語(yǔ)義數(shù)據(jù)集InteriorGS包含大量物理信息 22圖16:3D掃描可以采集大量物理信息的數(shù)據(jù) 23圖17:索辰提供機(jī)器人訓(xùn)練平臺(tái) 24圖18:索辰提供機(jī)器人實(shí)時(shí)感知算法 24圖19:亞信科技實(shí)現(xiàn)多領(lǐng)域數(shù)字孿生落地方案 25表1:物理AI與傳統(tǒng)AI的對(duì)比 7表2:幾個(gè)常見(jiàn)世界模型的特征和技術(shù)側(cè)重 表3:主流智能駕駛及具身智能模型方案對(duì)比 表4:JetsonThor為機(jī)器人大腦提供硬件基礎(chǔ) 表5:智微智能完整的機(jī)器人大小腦方案 20表6:部分重點(diǎn)公司估值表 26人工智能的下一個(gè)浪潮,將是能夠理解并適應(yīng)物理世界的物理AI(PhysicalAI)。AI正從主要處理數(shù)字和信息任務(wù)的工具,演進(jìn)為能夠在復(fù)雜、動(dòng)態(tài)的物理環(huán)境中進(jìn)行感知、推理、決策和行動(dòng)的智能體。這一轉(zhuǎn)變,標(biāo)志著AI技術(shù)從虛擬世界全面邁向現(xiàn)實(shí)世界,其影響力將深遠(yuǎn)地涉及機(jī)器人、自動(dòng)駕駛、工業(yè)制造等領(lǐng)域。物理AI并非單一技術(shù)的突破,而是一個(gè)融合了世界模型、物理仿真引擎與具身智能的系統(tǒng)性工程。它的核心是讓AI真正“懂得”物理規(guī)律,從重力、摩擦到材料屬性和流體力學(xué),并在此基礎(chǔ)上進(jìn)行準(zhǔn)確的預(yù)測(cè)與決策。以英偉達(dá)的Cosmos、谷歌的Genie等為代表的世界基礎(chǔ)模型,正通過(guò)開(kāi)源與競(jìng)爭(zhēng),加速整個(gè)技術(shù)棧的成熟與普及。物理AI、世界模型、空間智能等核心概念其核心均聚焦于解決AI從“語(yǔ)言符號(hào)理解”到“物理現(xiàn)實(shí)交互”的核心難題,但在定義內(nèi)涵上存在一定差異,且隨著技術(shù)探索概念也在演繹,概念的界定也并不一致,我們?cè)诖讼葒L試對(duì)其進(jìn)行簡(jiǎn)單區(qū)分。其結(jié)構(gòu)可簡(jiǎn)化為“空間智能(感知基座)——世界模型(認(rèn)知及決策中樞)——物理AI(系統(tǒng)整合載體)”。空間智能:本質(zhì)是AI核心“認(rèn)知能力”,人工智能系統(tǒng)感知、理解和推理三維空間及其內(nèi)部物體關(guān)系的能力。這一概念源于人類(lèi)認(rèn)知科學(xué),關(guān)注的是AI如何像人類(lèi)一樣理解空間結(jié)構(gòu)、物體之間的幾何關(guān)系以及環(huán)境中的動(dòng)態(tài)變化。當(dāng)前最先進(jìn)的多模態(tài)大語(yǔ)言模型在空間推理任務(wù)中的表現(xiàn)遜于人類(lèi),在估算距離、方向、大小或進(jìn)行心理旋轉(zhuǎn)等任務(wù)上差距明顯。這一能力缺口嚴(yán)重限制了AI在自動(dòng)駕駛、機(jī)器人導(dǎo)航等場(chǎng)景中的實(shí)際應(yīng)用。世界模型:本質(zhì)上是為AI系統(tǒng)提供一個(gè)內(nèi)部的物理世界模擬器,使其能夠預(yù)測(cè)行動(dòng)的結(jié)果,而無(wú)需在現(xiàn)實(shí)世界中通過(guò)試錯(cuò)來(lái)學(xué)習(xí)。這一技術(shù)方向在2018年重新引入現(xiàn)代AI研究領(lǐng)域,其學(xué)習(xí)方式多為無(wú)監(jiān)督學(xué)習(xí),無(wú)需明確標(biāo)注即可從數(shù)據(jù)中掌握世界動(dòng)態(tài),是智能體實(shí)現(xiàn)自主決策的核心認(rèn)知架構(gòu)。物理AI:一個(gè)系統(tǒng)性工程概念,其核心目標(biāo)是構(gòu)建能夠理解、推理并直接作用于物理世界的智能系統(tǒng)。與傳統(tǒng)僅限于軟件層面的AI不同,物理AI強(qiáng)調(diào)從感知、決策到執(zhí)行的完整閉環(huán),致力于將AI的虛擬能力嵌入到物理實(shí)體中,實(shí)現(xiàn)與物理世界的交互與操控。物理AI與傳統(tǒng)的生成式AI的區(qū)別在于:物理AI是讓自動(dòng)駕駛車(chē)輛或者智能系統(tǒng)能夠在現(xiàn)實(shí)(物理)世界中感知、理解并執(zhí)行復(fù)雜操作的AI技術(shù)性工程。與傳統(tǒng)AI主要處理數(shù)字信息和虛擬內(nèi)容不同,物理AI的核心在于將物理規(guī)律等基礎(chǔ)科學(xué)原理與真實(shí)場(chǎng)景數(shù)據(jù)深度融合,使AI能夠像人類(lèi)一樣基于已知規(guī)律推導(dǎo)決策。物理AI的實(shí)現(xiàn)依賴(lài)于三大技術(shù)支柱的協(xié)同作用:世界模型、物理仿真引擎和具身智能控制器。世界模型:作為物理AI的認(rèn)知核心,負(fù)責(zé)構(gòu)建對(duì)三維空間的完整理解,包括物體的幾何形狀、材質(zhì)屬性、運(yùn)動(dòng)狀態(tài)和相互關(guān)系。技術(shù)上,這通常通過(guò)神經(jīng)輻射場(chǎng)(NeRF)、3D高斯濺射(3DGaussianSplatting)或體素網(wǎng)格(VoxelGrid)等方法來(lái)實(shí)現(xiàn)空間表征,模型需要學(xué)習(xí)物理定律的隱式表示,比如重力加速度、摩擦系數(shù)、彈性模量等參數(shù),并能夠根據(jù)當(dāng)前狀態(tài)預(yù)測(cè)未來(lái)的物理演化。物理仿真引擎:負(fù)責(zé)實(shí)時(shí)計(jì)算物理交互,是基于偏微分方程求解器的動(dòng)態(tài)計(jì)算系統(tǒng),需要處理剛體動(dòng)力學(xué)、流體力學(xué)、軟體變形等復(fù)雜物理現(xiàn)象。具身智能控制器:連接虛擬推理和物理執(zhí)行的橋梁,它接收來(lái)自世界模型的預(yù)測(cè)結(jié)果和物理仿真的計(jì)算輸出,生成具體的控制指令。圖2:英偉達(dá)通過(guò)物理實(shí)現(xiàn)虛擬與現(xiàn)實(shí)的結(jié)合從系統(tǒng)架構(gòu)角度看,物理AI的工程基本采用分層設(shè)計(jì),包括感知層、認(rèn)知層和執(zhí)行感知層集成多模態(tài)傳感器陣列,包括RGB-D攝像頭、激光雷達(dá)、IMU、力/扭矩傳感器等,關(guān)鍵技術(shù)挑戰(zhàn)在于傳感器融合和實(shí)時(shí)處理。認(rèn)知層運(yùn)行世界模型和物理仿真引擎,這一層的計(jì)算密集度極高,需要專(zhuān)門(mén)的硬件加速(如英偉達(dá)Thor平臺(tái))。執(zhí)行層負(fù)責(zé)運(yùn)動(dòng)規(guī)劃和控制,技術(shù)核心是逆運(yùn)動(dòng)學(xué)求解和軌跡優(yōu)化。這種架構(gòu)使得物理AI能夠在復(fù)雜的現(xiàn)實(shí)環(huán)境中實(shí)現(xiàn)實(shí)時(shí)的感知、推理和行動(dòng),真正實(shí)現(xiàn)了AI從虛擬世界向物理世界的跨越。物理AI主要解決的是現(xiàn)實(shí)世界中的復(fù)雜物理交互問(wèn)題,核心包括:仿真與現(xiàn)實(shí)差距:在機(jī)器人技術(shù)中,在仿真環(huán)境中訓(xùn)練的模型往往在現(xiàn)實(shí)世界中性能下降,物理AI通過(guò)高精度物理仿真和Sim-to-Real遷移技術(shù)縮小這一差距。數(shù)據(jù)收集成本:現(xiàn)實(shí)世界的數(shù)據(jù)采集成本極高且存在安全風(fēng)險(xiǎn),物理AI通過(guò)合成數(shù)據(jù)生成解決了這一瓶頸。英偉達(dá)通過(guò)Omniverse和Cosmos平臺(tái),生成大規(guī)模的合成訓(xùn)練數(shù)據(jù),包括各種物理場(chǎng)景、材質(zhì)屬性和交互模式。物理規(guī)律遵守:傳統(tǒng)生成式AI可能會(huì)創(chuàng)造出違反物理定律的內(nèi)容,如物體懸浮或機(jī)械臂穿過(guò)固體障礙物,而物理AI確保所有生成的內(nèi)容完全符合物理世界的運(yùn)作方式。實(shí)時(shí)決策與操作:在機(jī)器人、自動(dòng)駕駛等應(yīng)用中,系統(tǒng)需要在毫秒級(jí)時(shí)間內(nèi)感知環(huán)境、理解物理狀態(tài)并做出決策,物理AI的分層架構(gòu)和專(zhuān)用硬件加速使這成為可能。英偉達(dá)2019年即提出Omniverse,作為3D的實(shí)時(shí)協(xié)作平臺(tái),通過(guò)對(duì)主流3D軟件的接口整合,以及RTX在圖像領(lǐng)域的超強(qiáng)能力,為用戶提供簡(jiǎn)單高效的3D協(xié)作環(huán)境。在平臺(tái)推出之后,元宇宙、工業(yè)協(xié)作、人形機(jī)器人等領(lǐng)域均在該平臺(tái)實(shí)現(xiàn)相關(guān)應(yīng)用,英偉達(dá)的提前布局,或?qū)mniverse作為繼CUDA之后的又一個(gè)“軟核心”,成為下一個(gè)階段硬件增長(zhǎng)的重要支撐,這也成為英偉達(dá)布局物理AI的“第一步”。NvidiaOmniverse是多GPU實(shí)時(shí)模擬和協(xié)作平臺(tái),可以簡(jiǎn)化理解為3D軟件的連接平臺(tái)。Omniverse主要用于3D制作流程,前期是基于Pixar(皮克斯)的通用場(chǎng)景描述以及NvidiaRTX的基礎(chǔ)上構(gòu)建,主要的目的是完成應(yīng)用之間通用實(shí)時(shí)互操作,并充當(dāng)互聯(lián)客戶機(jī)和應(yīng)用中心的樞紐。Omniverse進(jìn)入工業(yè)領(lǐng)域?qū)嵺`,主要是仿真能力重要提升。Omniverse在2019年提出之后,在動(dòng)畫(huà)、影視、游戲等創(chuàng)作過(guò)程中被廣泛應(yīng)用,初代開(kāi)放Nucleus接口的3D軟件也主要包括AutodeskMAYA等創(chuàng)作類(lèi)軟件。隨著工業(yè)場(chǎng)景更加復(fù)雜化、數(shù)字化,對(duì)于數(shù)字孿生等需求更加明顯,Omniverse也成為工業(yè)、甚至元宇宙構(gòu)建的重要平臺(tái),在這過(guò)程中對(duì)于仿真的要求顯著提升。仿真能力是實(shí)現(xiàn)工業(yè)等領(lǐng)域的關(guān)鍵。RTcore主要完成了光線追蹤等視覺(jué)上的追求,相較于傳統(tǒng)泛娛樂(lè)行業(yè),實(shí)際生產(chǎn)應(yīng)用中需要符合物理規(guī)律的3D構(gòu)建,其區(qū)別的核心就是仿真,Tensorcore的能力提升,實(shí)際可以幫助假設(shè)場(chǎng)景和數(shù)據(jù)進(jìn)行開(kāi)發(fā)。英偉達(dá)憑借其硬件優(yōu)勢(shì)及前瞻性布局,構(gòu)建了最為完整的物理AI技術(shù)棧,目前核心是世界基礎(chǔ)模型Cosmos。2025年1月,英偉達(dá)CEO黃仁勛在CES演講上正式推出物理AI大模型Cosmos,并宣布將其以開(kāi)源的形式發(fā)布。Cosmos被定義為“世界基礎(chǔ)模型”,它能夠理解世界語(yǔ)言、物理特性、空間位置等要素,并合成相關(guān)物理數(shù)據(jù),是加速智能汽車(chē)、具身智能等AI終端普及的關(guān)鍵所在。Cosmos是一個(gè)世界性的基礎(chǔ)模型開(kāi)發(fā)平臺(tái),包含生成式模型、數(shù)據(jù)管護(hù)器、標(biāo)記器和框架,可加速物理AI開(kāi)發(fā)。Cosmos通過(guò)生成物理學(xué)數(shù)據(jù)實(shí)現(xiàn)端側(cè)模型訓(xùn)練。核心功能在于使開(kāi)發(fā)者能夠根據(jù)文本、圖像和視頻等輸入組合以及機(jī)器人傳感器或運(yùn)動(dòng)數(shù)據(jù)生成基于物理學(xué)的視頻,實(shí)現(xiàn)對(duì)現(xiàn)實(shí)環(huán)境(如倉(cāng)庫(kù)、工廠、交通路況等)的預(yù)測(cè),從而完成對(duì)機(jī)器人和自動(dòng)駕駛汽車(chē)的訓(xùn)練。與傳統(tǒng)的生成式AI模型相比,Cosmos的獨(dú)特之處在于其對(duì)物理規(guī)律的嚴(yán)格遵守和對(duì)三維空間的深度理解。Cosmos模型獲得重大更新,適配實(shí)時(shí)環(huán)境。在技術(shù)演進(jìn)方面,SIGGRAPH2025大會(huì)上,英偉達(dá)發(fā)布了全新的CosmosReason和CosmosTransfer-2模型。CosmosReason作為一款開(kāi)源、可定制70億參數(shù)推理視覺(jué)語(yǔ)言模型(VLM其設(shè)計(jì)目標(biāo)是賦予機(jī)器人和視覺(jué)智能體高級(jí)的推理能力。它的核心突破在于超越了傳統(tǒng)VLM僅限于語(yǔ)義標(biāo)簽的理解,能夠進(jìn)行多步驟任務(wù)分解、常識(shí)推理以及對(duì)物理世界的深度理解。在機(jī)器人規(guī)劃中,其能作為VLA模型的大腦,將高層指令(如“拿起杯子并放到桌子上”)轉(zhuǎn)化為可執(zhí)行的低層任務(wù)序列。而CosmosTransfer-2模型則專(zhuān)注于合成數(shù)據(jù)生成,通過(guò)簡(jiǎn)化提示詞,支持多模態(tài)輸入,能高效地創(chuàng)建高質(zhì)量、物理精準(zhǔn)的訓(xùn)練數(shù)據(jù)。在模型性能優(yōu)化方面,其精簡(jiǎn)版本通過(guò)創(chuàng)新的“單步蒸餾”技術(shù),可將原本繁瑣的70個(gè)步驟計(jì)算過(guò)程壓縮為一步。這一優(yōu)化降低了模型推理的計(jì)算量和延遲,使得模型能夠在NVIDIARTXPROBlackwell平臺(tái)、邊緣、甚至本地設(shè)備上以極高效率運(yùn)行。目前客戶涵蓋機(jī)器人+汽車(chē)領(lǐng)域領(lǐng)先廠商。根據(jù)英偉達(dá)披露的名單,Cosmos首批用戶包括1X、AgileRobots、Agility、FigureAI、Foretellix、Fourier、Galbot、Hillbot、IntBot、NeuraRobotics、SkildAI、VirtualIncision、Waabi和小鵬汽車(chē)等十余個(gè)國(guó)內(nèi)外機(jī)器人和汽車(chē)廠商。這一廣泛的行業(yè)采用情況表明,Cosmos模型已經(jīng)在物理AI的關(guān)鍵應(yīng)用領(lǐng)域形成了生態(tài)系統(tǒng)優(yōu)勢(shì)。目前英偉達(dá)已經(jīng)建立一套相對(duì)完整的物理AI使用流程,軟硬一體化方案解釋Nvidia的下一代“軟核心”布局:1)構(gòu)建虛擬3D環(huán)境(Omniverse):Omniverse提供眾多API、SDK,開(kāi)發(fā)者基于其他軟件廠商的能力(包括CAE、CAD等),在平臺(tái)上構(gòu)建物理場(chǎng)景,并通過(guò)RTX渲染集成到仿真流程。2)生成和合成數(shù)據(jù)(CosmosOmniverse提供ReplicatorSDK構(gòu)建自定義合成數(shù)據(jù)生成(SDG)工作流。Replicator具有內(nèi)置功能,例如域隨機(jī)化,允許在3D仿真過(guò)程中更改許多物理參數(shù)。此外,還可以使用采用ControlNet的擴(kuò)散模型來(lái)進(jìn)一步增強(qiáng)生成的圖像。3)訓(xùn)練驗(yàn)證(DGXNVIDIADGX平臺(tái)是一個(gè)全集成式硬件和軟件AI平臺(tái),與基于物理的數(shù)據(jù)一起結(jié)合使用,通過(guò)TensorFlow、PyTorch等框架,以及NVIDIANGC上提供的預(yù)訓(xùn)練計(jì)算機(jī)視覺(jué)模型來(lái)訓(xùn)練或調(diào)優(yōu)AI模型。經(jīng)過(guò)訓(xùn)練后,這些模型及其軟件堆??墒褂肗VIDIAIsaacSim等參考應(yīng)用進(jìn)行仿真驗(yàn)證。4)部署(下一代機(jī)器人設(shè)備)將經(jīng)優(yōu)化的堆棧部署到NVIDIAJetsonOrin以及即將推出的新一代JetsonThor機(jī)器人超級(jí)計(jì)算機(jī)上,為類(lèi)人型機(jī)器人或工業(yè)自動(dòng)化系統(tǒng)等物理自主機(jī)器賦能。綜上,英偉達(dá)通過(guò)鏈接外部軟件的Omniverse的平臺(tái),提供構(gòu)建虛擬場(chǎng)景、整合數(shù)據(jù),并使開(kāi)發(fā)者在DGX硬件平臺(tái)上完成訓(xùn)練模擬驗(yàn)證,最終將模型轉(zhuǎn)裝配至下一代機(jī)器人設(shè)備中,完成對(duì)于軟、硬、生態(tài)一體的機(jī)器人研發(fā)工具鏈,實(shí)現(xiàn)硬件銷(xiāo)售的重要目的。最終機(jī)器人開(kāi)發(fā)者的差異化可能體現(xiàn)在:算法優(yōu)勢(shì)、數(shù)據(jù)質(zhì)量。谷歌DeepMind此前推出通用世界模型Genie3。基于文本提示,Genie3可以允許用戶以每秒24幀的速度,以720p的分辨率生成長(zhǎng)達(dá)數(shù)分鐘的交互式3D環(huán)境,Genie2僅能生成10到20秒。區(qū)別于可靈、即夢(mèng)、sora、googleveo的類(lèi)似電影體驗(yàn)的視頻生成,Genie3主要生成3D場(chǎng)景,并且鏡頭動(dòng)作可以交互,更加類(lèi)似玩游戲。從產(chǎn)品發(fā)布案例來(lái)看,我們認(rèn)為genie3在1)質(zhì)量;2)一致性;3)交互性;4)指令遵循上效果較強(qiáng)。Genie每一代產(chǎn)品都做到了部分迭代。1)Genie2做到了3D,而且可以開(kāi)始模擬部分效果,包括重力、光線、反射、煙霧。2)Genie3實(shí)現(xiàn)了高清720P,交互時(shí)間更長(zhǎng),而且基本無(wú)時(shí)延。我們認(rèn)為,genie3優(yōu)勢(shì)在于無(wú)需NeRFs或高斯濺射那樣依賴(lài)于顯式的三維表示,而是逐幀生成動(dòng)態(tài)和豐富的世界。不需要依賴(lài)建模仿真,使得模型可以在更低的成本上加入更多未經(jīng)過(guò)標(biāo)注的訓(xùn)練樣本,更快實(shí)現(xiàn)“涌現(xiàn)”。/交互數(shù)據(jù)隱人規(guī)劃態(tài)語(yǔ)義對(duì)齊1/30,成功率更高★★中添加摩托艇”持久性有限資料來(lái)源:google、英偉達(dá)、Meta等物理AI正從技術(shù)概念迅速邁向規(guī)模化商業(yè)應(yīng)用,其核心價(jià)值在于將物理規(guī)律與數(shù)據(jù)驅(qū)動(dòng)決策相結(jié)合,在多個(gè)行業(yè)實(shí)現(xiàn)效率提升、成本優(yōu)化和全新商業(yè)模式創(chuàng)造。實(shí)現(xiàn)路徑的體現(xiàn)形式是世界模型,世界模型的潛在應(yīng)用橫跨眾多領(lǐng)域,每個(gè)領(lǐng)域?qū)斫饽芰皖A(yù)測(cè)能力都有獨(dú)特需求。以自動(dòng)駕駛為例,世界模型需要實(shí)時(shí)感知道路狀況并精準(zhǔn)預(yù)判環(huán)境演變,尤其注重即時(shí)環(huán)境感知與復(fù)雜趨勢(shì)預(yù)測(cè)。物理AI作為一項(xiàng)系統(tǒng)性工程,最核心的是讓AI從虛擬世界走向真實(shí)的物理世界并實(shí)現(xiàn)執(zhí)行,我們認(rèn)為其最核心的領(lǐng)域在于:1)數(shù)字孿生;2)智能駕駛及具身智能。數(shù)字孿生是實(shí)體資產(chǎn)和流程的虛擬映射,企業(yè)借助其優(yōu)化設(shè)計(jì)、仿真與運(yùn)營(yíng)效率。這一技術(shù)通過(guò)創(chuàng)建高保真數(shù)字模型,實(shí)現(xiàn)對(duì)物理世界的動(dòng)態(tài)模擬與精準(zhǔn)控制,成為工業(yè)數(shù)字化轉(zhuǎn)型的核心工具。數(shù)字孿生技術(shù)源于美國(guó)國(guó)家航空航天局的早期實(shí)踐,并隨計(jì)算與數(shù)據(jù)科學(xué)進(jìn)步不斷成熟。例如在阿波羅13號(hào)任務(wù)中,地面模擬器通過(guò)實(shí)時(shí)數(shù)據(jù)聯(lián)動(dòng)助力故障排除,奠定了其應(yīng)用基礎(chǔ);如今,借助開(kāi)放數(shù)據(jù)框架、生成式AI與加速計(jì)算,數(shù)字孿生已演進(jìn)為融合物理規(guī)律與智能算法的先進(jìn)系統(tǒng)。1)數(shù)字孿生如何構(gòu)建執(zhí)行?數(shù)字孿生通過(guò)集成多維數(shù)據(jù)源構(gòu)建其虛擬模型,并依賴(lài)物聯(lián)網(wǎng)實(shí)現(xiàn)數(shù)字與物理世界的動(dòng)態(tài)同步。數(shù)字孿生通過(guò)整合最貼切描述其現(xiàn)實(shí)世界對(duì)應(yīng)物數(shù)據(jù)而創(chuàng)建。數(shù)據(jù)通常由一維數(shù)據(jù)(如IT/OT系統(tǒng)中的表格數(shù)據(jù))和二維/三維數(shù)據(jù)(如CAD、現(xiàn)實(shí)捕捉掃描、BIM)數(shù)據(jù)組成。實(shí)現(xiàn)先進(jìn)設(shè)計(jì)、規(guī)劃、仿真、遠(yuǎn)程實(shí)時(shí)監(jiān)控及運(yùn)營(yíng)控制。物聯(lián)網(wǎng)傳感器和設(shè)備提供實(shí)時(shí)數(shù)據(jù),可確保數(shù)字孿生保持準(zhǔn)確和最新,從而實(shí)現(xiàn)物理與數(shù)字領(lǐng)域之間的動(dòng)態(tài)交互。2)數(shù)字孿生有何意義?該技術(shù)為企業(yè)帶來(lái)顯著效益,尤其體現(xiàn)在流程優(yōu)化、成本控制與風(fēng)險(xiǎn)規(guī)避層面。例如寶馬集團(tuán)通過(guò)工廠數(shù)字孿生將規(guī)劃效率提升近30%;緯創(chuàng)則實(shí)現(xiàn)氣流仿真速度提高15000倍,極大壓縮了研發(fā)周期與資源投入。3)數(shù)字孿生的技術(shù)來(lái)源?數(shù)字孿生的實(shí)現(xiàn)依托于多項(xiàng)前沿技術(shù)的協(xié)同,包括開(kāi)放數(shù)據(jù)標(biāo)準(zhǔn)、AI生成能力與高性能計(jì)算。OpenUSD解決了多源數(shù)據(jù)融合的難題,生成式AI助力合成數(shù)據(jù)生成與自然語(yǔ)言交互,而加速計(jì)算則支撐了大規(guī)模實(shí)時(shí)仿真與物理AI訓(xùn)練需求。AI在其中的重要作用:生成式AI正在成為新的軟件接口,以更輕松地以自然語(yǔ)言與工業(yè)數(shù)據(jù)和系統(tǒng)進(jìn)行交互,從而實(shí)現(xiàn)快速檢索知識(shí)、進(jìn)行分析并獲得建議。物理AI在其中的重要作用:如果企業(yè)無(wú)法獲取足夠的現(xiàn)實(shí)世界數(shù)據(jù)來(lái)開(kāi)發(fā)數(shù)字孿生,可以利用生成式AI來(lái)加速開(kāi)發(fā)過(guò)程。開(kāi)發(fā)者能夠簡(jiǎn)化并加速工作流,快速開(kāi)發(fā)和部署數(shù)字孿生解決方案,并生成物理精準(zhǔn)的合成數(shù)據(jù)以訓(xùn)練物理AI。4)數(shù)字孿生有何應(yīng)用?超越單一行業(yè),物理AI驅(qū)動(dòng)的仿真技術(shù)正成為各領(lǐng)域復(fù)雜系統(tǒng)決策的科學(xué)基礎(chǔ)。通過(guò)構(gòu)建高精度虛擬模型,管理者能夠在數(shù)字世界探索不同策略的實(shí)施效果。目前已滲透至制造業(yè)、能源、醫(yī)療與城市管理等廣泛行業(yè),推動(dòng)各領(lǐng)域效率革新。工業(yè)場(chǎng)景中,如富士康通過(guò)虛擬工廠優(yōu)化機(jī)器人部署;醫(yī)療領(lǐng)域,外科醫(yī)生利用患者大腦數(shù)字孿生預(yù)演手術(shù);智慧城市方面,數(shù)字孿生助力交通模擬與能源管理,實(shí)現(xiàn)精細(xì)化運(yùn)營(yíng)。在生產(chǎn)優(yōu)化方面,物理AI可對(duì)整條產(chǎn)線進(jìn)行仿真模擬,提前識(shí)別瓶頸環(huán)節(jié)。通過(guò)模擬設(shè)備運(yùn)行、物料流動(dòng)和人員操作,幫助企業(yè)優(yōu)化布局與調(diào)度,提升整體生產(chǎn)效率。這種虛擬調(diào)試能力顯著縮短產(chǎn)線部署時(shí)間。預(yù)測(cè)性維護(hù)是另一關(guān)鍵應(yīng)用。物理AI結(jié)合設(shè)備物理模型與實(shí)時(shí)傳感器數(shù)據(jù),能夠更精準(zhǔn)地預(yù)測(cè)部件壽命和故障風(fēng)險(xiǎn)。企業(yè)可從計(jì)劃性維修轉(zhuǎn)向按需維護(hù),減少非計(jì)劃停機(jī)帶來(lái)的損失?,F(xiàn)部署優(yōu)化算力工廠資料來(lái)源:英偉達(dá)官網(wǎng),申萬(wàn)宏源研究資世界模型是物理AI實(shí)現(xiàn)的核心引擎,訓(xùn)練推理側(cè)對(duì)于智能駕駛、具身智能均有重要意義。應(yīng)用可分為兩大階段:訓(xùn)練端利用世界模型生成符合物理規(guī)律的高質(zhì)量合成數(shù)據(jù),解決真實(shí)數(shù)據(jù)稀缺與長(zhǎng)尾場(chǎng)景覆蓋問(wèn)題;推理端則通過(guò)物理推理模型實(shí)現(xiàn)感知-決策-執(zhí)行的閉環(huán)控制,確保智能體在現(xiàn)實(shí)環(huán)境中的安全性與可靠性。(一)訓(xùn)練端在訓(xùn)練端,世界模型通過(guò)構(gòu)建高保真數(shù)字孿生環(huán)境,生成無(wú)限規(guī)模的符合物理學(xué)規(guī)律的訓(xùn)練數(shù)據(jù)。目前主流世界模型可以基于物理規(guī)律的仿真引擎能夠模擬各種極端天氣、復(fù)雜路況及罕見(jiàn)場(chǎng)景,有效彌補(bǔ)真實(shí)數(shù)據(jù)收集成本高、覆蓋不全的短板。通過(guò)多物理場(chǎng)建模,包括重力、摩擦、流體力學(xué)等復(fù)雜環(huán)境因素,生成的數(shù)據(jù)既保持物理真實(shí)性,又具備足夠的多樣性,使模型在訓(xùn)練階段就能接觸各種邊緣案例,顯著提升系統(tǒng)的魯棒性和泛化能力。生成式物理引擎的進(jìn)步進(jìn)一步提升了合成數(shù)據(jù)的真實(shí)性與多樣性?,F(xiàn)代物理仿真平臺(tái)通過(guò)整合多模態(tài)傳感器模型和環(huán)境動(dòng)力學(xué)參數(shù),構(gòu)建出高度擬真的虛擬測(cè)試場(chǎng)。這些平臺(tái)不僅能夠模擬常規(guī)操作場(chǎng)景,還能復(fù)現(xiàn)各種危險(xiǎn)工況和極端條件,為自動(dòng)駕駛系統(tǒng)和機(jī)器人算法提供安全、可控的測(cè)試環(huán)境。自監(jiān)督學(xué)習(xí)等先進(jìn)方法的引入,使得模型能夠從海量未標(biāo)注數(shù)據(jù)中自主提取物理規(guī)律,顯著提升了對(duì)物體運(yùn)動(dòng)軌跡和交互行為的預(yù)測(cè)準(zhǔn)確性。資料來(lái)源:英偉達(dá)官網(wǎng),申萬(wàn)宏源研究資料來(lái)源:英偉達(dá)官網(wǎng),申萬(wàn)宏源研究(二)推理執(zhí)行端在推理決策端,物理AI通過(guò)端到端模型架構(gòu)與實(shí)時(shí)物理推理,實(shí)現(xiàn)從感知到動(dòng)作的精準(zhǔn)閉環(huán)控制。新一代的VLA模型摒棄了傳統(tǒng)的模塊化設(shè)計(jì),直接將多模態(tài)感知信號(hào)映射為控制指令,大幅降低系統(tǒng)延遲,提升響應(yīng)速度。這種架構(gòu)不僅能夠處理常規(guī)任務(wù),還展現(xiàn)出對(duì)復(fù)雜場(chǎng)景的理解能力和突發(fā)情況的應(yīng)對(duì)能力,實(shí)現(xiàn)了真正意義上的環(huán)境交互智能。物理推理能力的融入使智能系統(tǒng)具備了對(duì)現(xiàn)實(shí)世界的常識(shí)認(rèn)知。通過(guò)構(gòu)建分層物理知識(shí)表示,AI系統(tǒng)能夠理解空間關(guān)系、時(shí)間連續(xù)性和基礎(chǔ)物理規(guī)律,在進(jìn)行決策時(shí)自動(dòng)評(píng)估行動(dòng)的物理可行性。這種內(nèi)在的物理常識(shí)機(jī)制為智能駕駛和機(jī)器人系統(tǒng)的安全部署提供了重要保障,使其在遇到未訓(xùn)練場(chǎng)景時(shí)仍能做出符合物理規(guī)律的合理決策。在智能駕駛領(lǐng)域,世界模型正推動(dòng)行業(yè)從單一功能實(shí)現(xiàn)向全棧能力進(jìn)化的轉(zhuǎn)變?;谖锢鞟I的自動(dòng)駕駛系統(tǒng)不僅關(guān)注即時(shí)感知與決策,更注重長(zhǎng)時(shí)序的行為預(yù)測(cè)與規(guī)劃。通過(guò)將強(qiáng)化學(xué)習(xí)與場(chǎng)景推演深度融合,系統(tǒng)能夠在虛擬環(huán)境中進(jìn)行自我對(duì)抗訓(xùn)練,不斷優(yōu)化決策策略。具身智能領(lǐng)域,世界模型成為機(jī)器人通用能力提升的關(guān)鍵賦能技術(shù)。機(jī)器人系統(tǒng)通過(guò)物理世界模型理解環(huán)境交互的內(nèi)在規(guī)律,在工業(yè)制造、服務(wù)咨詢等場(chǎng)景中展現(xiàn)出越來(lái)越強(qiáng)的自主決策能力??缒B(tài)知識(shí)遷移技術(shù)的突破,使得不同形態(tài)的智能體能夠共享物理常識(shí),形成跨場(chǎng)景的能力傳遞閉環(huán)。這種技術(shù)路徑大幅降低了機(jī)器人適應(yīng)新環(huán)境、新任務(wù)的學(xué)習(xí)目前關(guān)于世界模型與VLA及端到端存在實(shí)現(xiàn)路徑之爭(zhēng)。短期看,VLA依靠其可解釋性、泛化能力強(qiáng),且可以很大程度利用目前相對(duì)成熟的LLM模型,是實(shí)現(xiàn)快速商業(yè)化的優(yōu)選。中長(zhǎng)期看,世界模型作為更前瞻更高效的選擇,運(yùn)算執(zhí)行效率更高,可能成為智能駕駛、具身智能后續(xù)商業(yè)化的重點(diǎn)。),代表:GoogleRT-2代表:GoogleRT-2代表:DeepMind、Meta注:代表廠商僅代表其目前已知推廣過(guò)程中的主流方案,部分廠商實(shí)際上在三種方案均有布局,并且實(shí)現(xiàn)了不同行業(yè)競(jìng)爭(zhēng)焦點(diǎn)正從單一算法創(chuàng)新轉(zhuǎn)向物理AI的整體落地效能。領(lǐng)先企業(yè)通過(guò)構(gòu)建自主可控的仿真測(cè)試平臺(tái),持續(xù)優(yōu)化虛擬與真實(shí)場(chǎng)景的域差距。產(chǎn)業(yè)應(yīng)用方面,智能駕駛與具身智能的融合發(fā)展正在創(chuàng)造新的商業(yè)模式,在智能制造、智慧物流、城市管理等場(chǎng)景中展現(xiàn)出巨大的應(yīng)用潛力。全棧技術(shù)布局成為行業(yè)競(jìng)爭(zhēng)的關(guān)鍵,從底層芯片到中間件再到應(yīng)用算法的完整生態(tài)構(gòu)建,正在形成顯著的技術(shù)壁壘。未來(lái)技術(shù)演進(jìn)將圍繞多尺度時(shí)空建模、跨模態(tài)感知融合與仿真-現(xiàn)實(shí)協(xié)同優(yōu)化三大方向深入發(fā)展。時(shí)空建模技術(shù)致力于在更細(xì)粒度上捕捉物理世界的動(dòng)態(tài)變化,為智能系統(tǒng)提供更精準(zhǔn)的環(huán)境理解。多模態(tài)融合技術(shù)旨在打破視覺(jué)、語(yǔ)言、動(dòng)作等不同模態(tài)間的語(yǔ)義隔閡,實(shí)現(xiàn)更自然的人機(jī)交互。仿真與現(xiàn)實(shí)協(xié)同優(yōu)化則通過(guò)持續(xù)的數(shù)據(jù)閉環(huán),不斷縮小虛擬與真實(shí)場(chǎng)景的差距,提升物理AI在復(fù)雜環(huán)境中的適應(yīng)能力。產(chǎn)業(yè)鏈各環(huán)節(jié)的協(xié)同加速物理AI的商業(yè)化進(jìn)程。從芯片廠商的算力支撐,到平臺(tái)廠商的工具鏈提供,再到應(yīng)用廠商的場(chǎng)景落地,完整的產(chǎn)業(yè)生態(tài)初步形成。此前已經(jīng)提到,由于英偉達(dá)在物理AI布局較早,且依靠其硬件優(yōu)勢(shì)及平臺(tái)化能力,形成了較為完整的生態(tài)。其軟件工具平臺(tái)開(kāi)放性較好,Cosmos也實(shí)現(xiàn)了開(kāi)源,但其硬件生態(tài)封閉導(dǎo)致在其部分專(zhuān)用性場(chǎng)景下,標(biāo)準(zhǔn)化的方案難以滿足各家廠商及不同算法路線的需求,因此在物理AI成為大趨勢(shì)的背景下,產(chǎn)業(yè)鏈各環(huán)節(jié)均具備重要投資機(jī)會(huì)。3.1芯片及控制器芯片與控制器是物理AI的硬件中樞,承擔(dān)著環(huán)境感知、實(shí)時(shí)計(jì)算與運(yùn)動(dòng)控制的核心功能。其技術(shù)壁壘不僅在于原始計(jì)算能力,更體現(xiàn)在對(duì)物理規(guī)律實(shí)時(shí)計(jì)算的優(yōu)化能力,以及能否融入主流開(kāi)發(fā)生態(tài)。英偉達(dá)基于Blackwell架構(gòu)推出其智駕、機(jī)器人的Thor平臺(tái)。英偉達(dá)2025年基于新一代Blackwell架構(gòu),推出了兩款Thor系列計(jì)算平臺(tái):JetsonAGXThor(專(zhuān)注于機(jī)器人與物理AI)和DRIVEThor(專(zhuān)注于智能駕駛)。JetsonThor搭載的AI計(jì)算能力是上一代Orin的7.5倍,最高達(dá)到2070TFLOPS(FP4能效是上一代的3.5倍。其內(nèi)存容量提升兩倍達(dá)到128G,顯存帶寬達(dá)到273GB/s。JetsonThor專(zhuān)為生成式AI模型的推理打造,可支持物理AI智能體。這類(lèi)智能體可以由大型Transformer模型、視覺(jué)語(yǔ)言模型(VLM)及視覺(jué)語(yǔ)言動(dòng)作模型(VLA)驅(qū)動(dòng),能夠在端側(cè)實(shí)時(shí)運(yùn)行,最大限度地降低對(duì)云端的依賴(lài)。AI性能2070TFLOPS主控芯片領(lǐng)域呈現(xiàn)多元化競(jìng)爭(zhēng)格局。除英偉達(dá)憑借其完整的工具鏈(Jetson系列、DRIVE平臺(tái)、Omniverse)占據(jù)生態(tài)優(yōu)勢(shì)外,該領(lǐng)域也涌現(xiàn)出各具特色的競(jìng)爭(zhēng)者。高通憑借其在車(chē)載智能座艙的積累向自動(dòng)駕駛主控域滲透;地平線等國(guó)內(nèi)芯片商則通過(guò)“算法+芯片”的協(xié)同設(shè)計(jì)在特定場(chǎng)景實(shí)現(xiàn)差異化競(jìng)爭(zhēng)。小鵬、蔚來(lái)等整車(chē)廠為追求算法與硬件的深度適配,已開(kāi)啟自研芯片的進(jìn)程,旨在打通從感知決策到車(chē)輛控制的完整鏈路。這種垂直整合趨勢(shì)反映了物理AI對(duì)算力效率的極控制器與邊緣算力方案是“機(jī)器人大腦”,邁向AGI重要通道。機(jī)器人大腦承擔(dān)著環(huán)境感知、實(shí)時(shí)決策與運(yùn)動(dòng)控制的核心功能。這一環(huán)節(jié)已從單純的算力執(zhí)行單元,升級(jí)為整合芯片算力、多源感知與上層算法的智能中樞,負(fù)責(zé)將抽象的AI模型轉(zhuǎn)化為精準(zhǔn)的物理世界動(dòng)作指令。具身智能的商業(yè)化除了依賴(lài)于高性能機(jī)器人本體計(jì)算單元所提供的算力支持和實(shí)時(shí)推理能力,還需結(jié)合芯片廠商提供的算法工具鏈,對(duì)已訓(xùn)練完成的模型進(jìn)行深度裁剪與優(yōu)化,以適配端側(cè)芯片的片內(nèi)硬件資源??刂破鲝S商在該領(lǐng)域具備重要意義。智微智能推出完整的機(jī)器人大小腦方案?!按竽X”(決策規(guī)劃系統(tǒng))基于NVIDIAJetsonThor等高性能計(jì)算平臺(tái),負(fù)責(zé)高階認(rèn)知功能。它處理來(lái)自攝像頭、激光雷達(dá)等傳感器的多模態(tài)數(shù)據(jù),進(jìn)行環(huán)境感知、任務(wù)規(guī)劃和智能決策。這一系統(tǒng)使機(jī)器人能夠理解抽象指令,并自主分解為具體步驟?!靶∧X”(運(yùn)動(dòng)控制系統(tǒng))則采用IntelCoreUltra或RK3588等處理器,專(zhuān)注于高精度、低延遲的運(yùn)動(dòng)控制。它確保機(jī)器人的每個(gè)動(dòng)作流暢、穩(wěn)定且安全,實(shí)現(xiàn)“手眼協(xié)同”的精準(zhǔn)操作。兩者通過(guò)高速數(shù)據(jù)傳輸與智能調(diào)度機(jī)制深度融合,解決傳統(tǒng)控制器“算力內(nèi)耗”與“響應(yīng)延遲”的痛點(diǎn)。智微智能的“大腦-小腦”架構(gòu)創(chuàng)新體現(xiàn)在多個(gè)層面:硬件層面,采用異構(gòu)計(jì)算架構(gòu),為不同任務(wù)匹配最合適的計(jì)算單元。高性能AI芯片負(fù)責(zé)復(fù)雜推理,實(shí)時(shí)控制芯片確保動(dòng)作精準(zhǔn)同步。軟件層面,集成“多模態(tài)感知+深度學(xué)習(xí)+生成式AI”,讓大腦能處理“圖像、語(yǔ)言、觸覺(jué)”等多源信息,小腦則通過(guò)“運(yùn)動(dòng)控制+RTOS實(shí)時(shí)操作系統(tǒng)+EtherCAT”,保障毫秒級(jí)控制精度,精確控制數(shù)據(jù)傳輸?shù)目煽啃院蛯?shí)時(shí)性。天準(zhǔn)科技控股子公司天準(zhǔn)星智發(fā)布新一代千TOPS級(jí)高算力具身智能大腦產(chǎn)品——星智007。該產(chǎn)品基于NVIDIAJetsonThor系列打造,不僅能滿足具身智能行業(yè)主流算法模型的算力需求,還完成了NVIDIAIsaacGR00TN1.5、通義千問(wèn)模型等主流操作與交互生成式AI模型的適配部署。遙操作采集訓(xùn)練等多場(chǎng)景驗(yàn)證軟硬結(jié)合效果。通過(guò)手柄控制等遙操作方式獲取機(jī)器人操作數(shù)據(jù),再借助ROS2對(duì)數(shù)據(jù)進(jìn)行處理,形成結(jié)構(gòu)化訓(xùn)練樣本。同時(shí),IsaacLab采用行為克隆算法,使智能體能夠模仿遙操作數(shù)據(jù)中呈現(xiàn)的操作行為,將虛擬環(huán)境中的合成數(shù)據(jù)與真實(shí)操作邏輯相結(jié)合,實(shí)現(xiàn)模型對(duì)任務(wù)執(zhí)行模式的學(xué)習(xí)。盡管其底層算力仍依賴(lài)于英偉達(dá)等芯片廠商,但這些控制器通過(guò)硬件集成、算法部署與系統(tǒng)優(yōu)化,將通用算力轉(zhuǎn)化為特定場(chǎng)景的智能行為,成為實(shí)現(xiàn)數(shù)字智能與物理執(zhí)行深度融合的關(guān)鍵載體。隨著機(jī)器人及自動(dòng)駕駛系統(tǒng)復(fù)雜度的提升,具備強(qiáng)集成能力與行業(yè)知識(shí)的控制器廠商,其產(chǎn)業(yè)地位正從“從屬執(zhí)行者”向“系統(tǒng)定義者”逐步躍遷。符合物理規(guī)律的高質(zhì)量數(shù)據(jù)是訓(xùn)練物理AI模型的前提,其獲取成本與規(guī)模構(gòu)成了核心壁壘。與互聯(lián)網(wǎng)數(shù)據(jù)不同,物理AI所需的時(shí)空關(guān)聯(lián)、多模態(tài)數(shù)據(jù)需求明確。數(shù)據(jù)的獲取目前兩個(gè)途徑:(1)現(xiàn)實(shí)世界采集高質(zhì)量數(shù)據(jù),或是利用此前已經(jīng)存儲(chǔ)過(guò)的帶有物理信息的數(shù)據(jù);(2)利用生成式模型生成符合物理學(xué)規(guī)律的數(shù)據(jù)。1)CAE仿真與合成數(shù)據(jù)生成有望成為物理AI的“數(shù)據(jù)工廠”。CAE是工業(yè)領(lǐng)域設(shè)計(jì)仿真軟件,主要應(yīng)用于高端制造業(yè)?;谖锢砟P瓦M(jìn)行模擬仿真的標(biāo)準(zhǔn)化、工具型工業(yè)軟件,主要應(yīng)用于高端制造,特別是單次試錯(cuò)成本高的行業(yè),如飛機(jī)、汽車(chē)制造等。其核心是本把物理和工程學(xué)科的理論模型做數(shù)學(xué)處理后得到的代數(shù)求解過(guò)程固化而成的計(jì)算機(jī)程序。因此CAE廠商在物理求解具備顯著優(yōu)勢(shì),其物理求解器開(kāi)發(fā)及用戶使用過(guò)程中,形成大量物理學(xué)數(shù)據(jù)積累。索辰科技是國(guó)產(chǎn)CAE領(lǐng)軍企業(yè),其核心價(jià)值在于利用多物理場(chǎng)仿真技術(shù)(涵蓋流體、結(jié)構(gòu)、電磁等)生成高保真合成數(shù)據(jù)。目前其“低空三維物理地圖”可生成高分辨率、高量級(jí)密度的風(fēng)場(chǎng)與電磁場(chǎng)數(shù)據(jù),為低空飛行器的訓(xùn)練提供了在現(xiàn)實(shí)世界中難以采集的極端環(huán)境數(shù)據(jù)。這一能力可以具備泛化性,可在眾多領(lǐng)域?qū)崿F(xiàn)物理數(shù)據(jù)的供給。2)CAD等廠商積累大量細(xì)分場(chǎng)景下的具備物理屬性的空間信息。群核科技發(fā)布高質(zhì)量3D高斯語(yǔ)義數(shù)據(jù)集InteriorGS,旨在為機(jī)器人和AI智能體提升空間感知能力。InteriorGS數(shù)據(jù)集包含1000個(gè)3D高斯語(yǔ)義場(chǎng)景,涵蓋超80種室內(nèi)環(huán)境,賦予智能體一個(gè)“空間大腦”,以提高其環(huán)境理解和交互能力。據(jù)公司公眾號(hào),該數(shù)據(jù)集或是全球首個(gè)適用于智能體自由運(yùn)動(dòng)的大規(guī)模3D數(shù)據(jù)集。3)數(shù)據(jù)的采集和校準(zhǔn)對(duì)于精密儀器會(huì)有增量需求?,F(xiàn)實(shí)世界感知與數(shù)字化構(gòu)建物理AI的“數(shù)據(jù)校準(zhǔn)源”。此環(huán)節(jié)負(fù)責(zé)將物理世界精準(zhǔn)地?cái)?shù)字化,為仿真提供初始模型并進(jìn)行數(shù)據(jù)采集校準(zhǔn)。思看科技、奧比中光、凌云光等3D視覺(jué)廠商處于數(shù)據(jù)采集領(lǐng)域上游。它們的機(jī)器視覺(jué)與深度感知技術(shù),能夠?qū)崟r(shí)采集物體與環(huán)境的精確三維物理屬性(如形變、位姿等為構(gòu)建數(shù)字孿生提供關(guān)鍵的初始數(shù)據(jù)輸入。從“萬(wàn)物數(shù)字化”到構(gòu)建“虛擬物理世界”,底層邏輯高度一致。數(shù)字化的底層邏輯是將日??芍筛械奈矬w轉(zhuǎn)化為數(shù)字世界的數(shù)字信號(hào)。模型與算法構(gòu)成物理AI產(chǎn)業(yè)的“智能核心”,是驅(qū)動(dòng)整個(gè)產(chǎn)業(yè)鏈價(jià)值創(chuàng)造的核心樞紐。隨著以Thor為代表的先進(jìn)芯片快速迭代,機(jī)器人及智能駕駛的硬件基礎(chǔ)正逐步標(biāo)準(zhǔn)化,這促使產(chǎn)業(yè)競(jìng)爭(zhēng)焦點(diǎn)從算力追逐轉(zhuǎn)向上層算法的創(chuàng)新與優(yōu)化。未來(lái),企業(yè)的核心競(jìng)爭(zhēng)力將集中體現(xiàn)在其對(duì)物理規(guī)律的算法建模能力、對(duì)垂直場(chǎng)景的深度理解以及商業(yè)化落地效在模型與算法層,產(chǎn)業(yè)格局呈現(xiàn)四類(lèi)主要參與者并行發(fā)展的態(tài)勢(shì)。1)以英偉達(dá)、谷歌為代表的全球科技巨頭。英偉達(dá)不僅提供GR00T機(jī)器人基礎(chǔ)模型和IsaacSim仿真平臺(tái),更通過(guò)Omniverse構(gòu)建了從模型訓(xùn)練、仿真測(cè)試到邊緣部署的全鏈路能力,形成了“芯片+模型+工具鏈”的閉環(huán)生態(tài)。谷歌則憑借其在Transformer架構(gòu)上的先發(fā)優(yōu)勢(shì),通過(guò)RT系列模型在機(jī)器人操作領(lǐng)域持續(xù)突破,推動(dòng)具身智能從專(zhuān)用型向通用型演進(jìn)。2)專(zhuān)注于空間智能與世界模型的第三方平臺(tái)。這類(lèi)企業(yè)通常不直接涉足硬件制造或整機(jī)集成,而是專(zhuān)注于物理規(guī)律的數(shù)字化建模與仿真。它們通過(guò)構(gòu)建高精度的多物理場(chǎng)仿真引擎和世界模型,為行業(yè)提供可靠的“虛擬試驗(yàn)場(chǎng)”,使客戶能夠在數(shù)字世界中安全、高效地訓(xùn)練和驗(yàn)證其AI模型。這類(lèi)平臺(tái)的核心價(jià)值在于其對(duì)復(fù)雜物理現(xiàn)象的精準(zhǔn)模擬能力,填補(bǔ)了通用基座模型與特定行業(yè)應(yīng)用之間的技術(shù)鴻溝。3)第三方算法解決方案提供商。以Momenta為代表的自動(dòng)駕駛解決方案商,基于世界模型技術(shù)為整車(chē)企業(yè)提供包括感知、預(yù)測(cè)、規(guī)劃在內(nèi)的全棧算法能力。這類(lèi)企業(yè)的優(yōu)勢(shì)在于能夠?qū)⑶把氐腁I研究成果與具體的行業(yè)需求相結(jié)合,通過(guò)工程化優(yōu)化實(shí)現(xiàn)技術(shù)的大規(guī)模商業(yè)化應(yīng)用。在機(jī)器人領(lǐng)域,類(lèi)似的企業(yè)正通過(guò)構(gòu)建可復(fù)用的算法模塊,顯著降低各行業(yè)部署智能機(jī)器人的技術(shù)門(mén)檻。索辰科技依靠其強(qiáng)大的物理仿真能力,已經(jīng)在低空、機(jī)器人等領(lǐng)域提供成熟的算法解決方案,在特定場(chǎng)景實(shí)現(xiàn)規(guī)?;瘧?yīng)用。圖17:索辰提供機(jī)器人訓(xùn)練平臺(tái)資料來(lái)源:索辰科技公眾號(hào),申萬(wàn)宏源研究資料來(lái)源:索辰科技公眾號(hào),4)整機(jī)廠自研。在智能駕駛領(lǐng)域,小鵬、理想等車(chē)企加大全棧自研投入,其中小鵬推出的第二代VLA模型實(shí)現(xiàn)了從視覺(jué)信號(hào)到控制指令的端到端映射,理想自研的Mi

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論