具身智能發(fā)展報告(2025年)_第1頁
具身智能發(fā)展報告(2025年)_第2頁
具身智能發(fā)展報告(2025年)_第3頁
具身智能發(fā)展報告(2025年)_第4頁
具身智能發(fā)展報告(2025年)_第5頁
已閱讀5頁,還剩114頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2026年12025年《政府工作報告》首次將“具身智能”列入國家未來產(chǎn)學(xué)習(xí)作業(yè)技能,為真實場景應(yīng)用打下基礎(chǔ)。產(chǎn)業(yè)整體展現(xiàn)出“融合”合輪臂式機器人、人形機器人等操作類產(chǎn)品,解決“三是產(chǎn)業(yè)生態(tài)體系不斷完善,市場空間廣闊。斗賽”“運動會”引發(fā)社會高度關(guān)注,據(jù)披露數(shù)據(jù)統(tǒng)計,截至2025據(jù)與仿真/合成數(shù)據(jù)如何選擇、處理和混合訓(xùn)練?具身智能整體處于 3 6 20 25 30 31 38 43 45 49 52 54 圖圖圖圖圖圖圖圖圖1一、全球具身智能總體發(fā)展情況(一)具身智能的概念與內(nèi)涵逐步明確1.具身智能核心內(nèi)涵:基于身體交互的“智能閉環(huán)”是“人工智能+機器人”,而是人工智能通過物理本體與環(huán)境交互實1/kxyj/qwfb/bps/202408/P020240830312499650772.pdf2來源:中國信息通信研究院2.具身智能以增加認(rèn)知、協(xié)作和學(xué)習(xí)三個能力為目標(biāo)能(EAI,EmbodiedArtificialIntel3來源:ITU-TF.748.66(二)具身智能成為全球關(guān)注的下一個科技前沿2/~/media/mckinsey/mckinsey%20global%20institute/obig%20arenas%20of%20competition/the-next-big-arenas-of-competition_final.pdf4人技術(shù)列為塑造未來全球生產(chǎn)力和數(shù)字基礎(chǔ)設(shè)施的五大新興前沿之一。根據(jù)美國市場研究公司GrandViewResearch預(yù)測,到2030年被家具身智能公司估值突破百億元。英偉達(dá)創(chuàng)始人黃仁勛在2025年消自主性的人形機器人作為優(yōu)先事項。OpenAI也重啟了四年前的機器表的主要玩家運營路徑可分為三類。一是軟硬件全棧派,從AI大腦研端到端模型Helix,可實現(xiàn)人形機器人上半身的高速精確控制;智Apptronik等。例如,宇樹科技產(chǎn)品在成本控制方面具有明顯優(yōu)勢,3/industry-analysis/humanoid-robot-mark4/industry-analysis/semi-autonomous-vehicl5/industry-analysis/drone-marke5的雙足機器人Digit專注于物流場景,已與亞馬遜等巨頭合作。Apptronik于2023年發(fā)布人形機器人產(chǎn)品Apollo,并與GoogleDeepMind合作進(jìn)一步提升產(chǎn)品功能。三是重軟件“大腦派”,以成型,代表公司如PhysicalIntelligence、FieldAI和銀河通用。例如,6(三)具身智能產(chǎn)業(yè)發(fā)展階段仍需客觀冷靜看待段。2025年以來以美為代表的多家公司突破單筆最高融資,2月和機器人領(lǐng)域投資事件數(shù)達(dá)744起,融資總額735.43億元人民幣。無論是模型實現(xiàn)路徑、數(shù)據(jù)方案還是本體分類分級的應(yīng)78二、數(shù)據(jù)驅(qū)動下的具身智能軟硬融合創(chuàng)新9來源:中國信息通信研究院(一)算法技術(shù)尚未收斂,多路徑探索快速迭代具身智能技術(shù)突破是生成式人工智能與機器人學(xué)習(xí)技術(shù)的融合方法包括模型預(yù)測控制(ModelPredictiveControl,MPC)和全身控仿學(xué)習(xí)或兩者結(jié)合,從數(shù)據(jù)經(jīng)驗中學(xué)習(xí)運動策略。2022年以后,隨義理解能力。VLM在語言知識的基礎(chǔ)上進(jìn)一步融合了大量的視覺信端到端地輸出動作。2023年至2024年,VLA通過利用Transformer),續(xù)動作(如DiffusionPolicy)。同時借助VLM提升策略泛化性(例2025年,圍繞“通用大腦”和“技能可擴展學(xué)習(xí)”兩大方向開知、決策能力單點突破,向VLA、世界模型等“感知-認(rèn)知-決策-執(zhí)行”閉環(huán)能力演進(jìn),技術(shù)創(chuàng)新呈現(xiàn)爆炸式增長。前Meta公司、在關(guān)注VLA”。楊立昆認(rèn)為“機器人是否足夠聰明甚至具備通用用年谷歌學(xué)術(shù)以“端到端VLA”為關(guān)鍵詞的論文在不到一年時間翻了來源:公開信息整理知與運控的模塊化組合或高難度組合式運控。例如自主移動機器人(AMR)的倉儲搬運,機器人在運動會上的舞蹈表演、自由搏擊等徑關(guān)注如何讓機器人等物理實體更好地理解外部任務(wù)需求并進(jìn)行規(guī)端VLA將視覺、語言和動作統(tǒng)一到一個學(xué)習(xí)框架,根據(jù)視覺觀測和制本體執(zhí)行任務(wù)。例如PhysicalIntelligenceπ0.57采用VLM結(jié)合 6/abs7pany/bl自變量機器人WALL-OSS8采用MO測,以指導(dǎo)VLA動作策略學(xué)習(xí)或動作生成。例如清華大學(xué)聯(lián)來源:中國信息通信研究院效銜接。2024年,LLM和VLM在不改變底層本體架構(gòu)的情況下實8/en/research/68bc2cde8497d7f238dde690并調(diào)用API接口或與ROS等中間件進(jìn)行交互來控制本體。例使用ChatGPT通過預(yù)定義函數(shù)庫和提示工程,生成可調(diào)用不同機器能力。一是提升環(huán)境感知能力。例如中山大學(xué)RoBridge結(jié)合對象分作軌跡的建模能力。二是提升規(guī)劃推理能力。上海人工智能實驗室OWMM-VLM模型基于多模態(tài)輸入進(jìn)行鏈?zhǔn)剿伎?,生成關(guān)鍵目標(biāo)位務(wù)。智源VLM模型RoboBrain2.010結(jié)合RoboOS2.011分層框架,將10/FlagOpen/RoboBrain2.011https://arxiv.or擬世界,通過行為推演和預(yù)測優(yōu)化行為策略。DayDreamer通過預(yù)測瑞士蘇黎世聯(lián)邦理工學(xué)院RoboticWorldModel在大腦預(yù)演行為過程端到端大模型VLA呈現(xiàn)“大一統(tǒng)”和“分層協(xié)作”兩類設(shè)計架語言等完整多感官模態(tài),通過整合異構(gòu)信號提供更穩(wěn)健的知和行動的異步時間處理,同時支持端到端的訓(xùn)練和模型12https://arxiv.or13/blog/nov-04-2025-GE14https://www.figure.智平方公司提出Fast-in-Slow15(FiS),將快速執(zhí)行系統(tǒng)嵌入慢速推端到端VLA通過融合或集成不同組件實現(xiàn)關(guān)鍵能力突破,整體行為認(rèn)知能力。上海交通大學(xué)推出DreamVLA17,融合清華大學(xué)聯(lián)合多個單位開發(fā)的首個面向具身智能的大規(guī)模強化學(xué)習(xí)15https://arxiv.or16https://arxiv.or17https://arxiv.or18/RLinf/RLinf化學(xué)習(xí)方法改進(jìn)VLA模型,能從專家糾正指導(dǎo)中修復(fù)錯誤,并不斷端到端VLA尚未形成“感知-決策-執(zhí)行”的完整如1XWorldModel在面臨不熟悉的任務(wù)和環(huán)境時,很難準(zhǔn)確地理解降。另外,現(xiàn)有VLA模型性能表現(xiàn)與本體強相關(guān),在跨本體遷移時19pany/仿學(xué)習(xí)、強化學(xué)習(xí)或兩者結(jié)合等方式掌握特定技能。例如PhysicalIntelligenceπ0和英偉達(dá)GR00TN1預(yù)訓(xùn)練階段學(xué)習(xí)本體無關(guān)的通用 主地探索環(huán)境。德國馬普智能系統(tǒng)研究所提出CWYC方法在學(xué)習(xí)過業(yè)大學(xué)提出LEGION終身學(xué)習(xí)框架,能夠在連續(xù)任務(wù)輸入時持續(xù)積(二)數(shù)據(jù)成為核心需求,相關(guān)技術(shù)加速發(fā)展基礎(chǔ)模型的性能提升具有顯著作用。清華大學(xué)ManiBox論文指出空間泛化所需數(shù)據(jù)量與空間體積呈現(xiàn)冪律關(guān)系,如果要在38倍的空間20Tan,Hengkai,etal."ManiBox:Enhan通過物理模擬引擎結(jié)合仿真平臺、世界模型或其他合成技術(shù)合成的少高低高中中中中Generation."arXivpreprintarXiv:2411.01850(2021/blog/nov-04-2025-GEN-0低高低來源:中國信息通信研究院真合成數(shù)據(jù)方面,英偉達(dá)基于物理模擬引擎Omniverse的IsaacSim平臺構(gòu)建了完整的數(shù)據(jù)合成管線,并在2025年幾乎逐月更新,不斷完善平臺功能。IsaacSim5.0則集成了Cosmos世界模型提升合成真銀河通用基于英偉達(dá)仿真平臺的合成數(shù)據(jù)管線能夠在一周內(nèi)生成十據(jù)采集是綁定本體的手把手教學(xué),包括采用VR設(shè)備、境采集是支持跨本體學(xué)到人類動作示范,包括UMI夾爪、靈巧手和22/p/193099027585092932023/abs/2505.24https://homietele.github.io/和采樣頻率可能均不一致。例如π0.5的訓(xùn)練數(shù)據(jù)包括對象檢測和視真到真實的大規(guī)模合成數(shù)據(jù)訓(xùn)練。例如銀河通用利用1數(shù)據(jù),讓VLA模型學(xué)會抓取技能,并實現(xiàn)真實場景的泛化。三是真時間內(nèi)從1次成功操作進(jìn)化到能連續(xù)工作24小時且成功率達(dá)到(三)本體技術(shù)多元發(fā)展,重在軟硬一體的零部件創(chuàng)新模型帶動具身智能本體多形態(tài)協(xié)同發(fā)展,包括人形、四足/多足氫能無人機、氫動力汽車和氫動力機器人等。2025年4月,川崎重合材料和聚醚醚酮(PEEK)等輕量化、高強度的高性能材料結(jié)構(gòu)件需求持續(xù)增長。例如空客A350機身夾板、托架等零部件,特斯拉OptimusGen2均用到了PEEK材料。1/3,散熱效率提升50%,實現(xiàn)爆發(fā)力、靈活性和穩(wěn)定性兼?zhèn)?。天工通過結(jié)構(gòu)優(yōu)化設(shè)計和關(guān)節(jié)導(dǎo)熱技術(shù),在相同功率下電機銅損降低15%~20%,從源頭減少熱源產(chǎn)生。國外廠商如瑞士Maxon、德國Faulhaber和瑞士Portescap在一體化關(guān)節(jié)方面也具備技術(shù)優(yōu)勢。靈巧北京通用人工智能研究院與北京大學(xué)聯(lián)合研制仿生視觸覺靈巧手F-TACHand25,集成17個高分辨率觸覺傳感器和高維觸覺數(shù)據(jù)的手產(chǎn)加工、標(biāo)定檢測等方面有較高技術(shù)壁壘。美國ATI、SCHUNK、Robotiq等品牌在性能指標(biāo)和高端市場上具有較大先發(fā)優(yōu)勢,國內(nèi)柯25https://arxiv.o(四)云-邊-端協(xié)同運行,支撐現(xiàn)實應(yīng)用落地芝麻智能計劃于2025年量產(chǎn)的華山A2000系列最高算力也達(dá)到1000TFLOPS。二是大內(nèi)存帶寬支持大規(guī)模多模態(tài)數(shù)據(jù)的高效處理。實現(xiàn)百GB級帶寬26。三是低能耗與良好的熱管理,以支持系統(tǒng)長時間高強度運行,避免過熱導(dǎo)致性能下降或系統(tǒng)崩潰。地平線遠(yuǎn)征6P采用ASIC方案,其能效比是Thor系列的1.2-1.4倍。四是算控一體升大小腦一體化控制能力。例如天準(zhǔn)科技的星智007、國訊芯微NSPIC-R007NP+等。26/a/cn/news/rockchip/2025/1021/云CloudRobo平臺在云側(cè)結(jié)合視頻生成模型和物理引擎提供合成數(shù)是端邊云協(xié)同依賴操作系統(tǒng)及中間件進(jìn)行本體功能開源項目ROS2通過工業(yè)級的數(shù)據(jù)分發(fā)服務(wù)(DDS)支持可靠數(shù)據(jù)傳輸。美國OpenMind推出OM1操作系統(tǒng)支持OpenAI、Gemini、內(nèi)置功能開發(fā)包,支持端云異構(gòu)算力整合和AI模型調(diào)度,幫助本體力在275TOPS左右。該芯片在運行7B參數(shù)規(guī)模的模型時性能會明顯下降,運行3B參數(shù)規(guī)模的模型也需要更多的加載時間27。三是通三、場景驅(qū)動下的具身智能產(chǎn)品譜系不斷豐富體上,驅(qū)動多樣化載體融合發(fā)展。復(fù)合輪臂式機器人、四足/多足機熱點。同時,如仿生機器人、智能機器臂、無人船、變形移集群式微型智能機器人、智能可穿戴設(shè)備等產(chǎn)品形態(tài)也在加27https://dev.to/jeremycmorgan/review-the-new-nvidia-jetson-orin-nano-4ci7?utm現(xiàn)階段部署端到端VLA模型的產(chǎn)品還處于演示階段,例如容易出現(xiàn)長尾問題(long-tailproblem)和失效案例(badcase)等很可能導(dǎo)致(一)機器人成為具身智能的最“熱門”載體1.人形機器人構(gòu)型是業(yè)界追逐的熱點方向作業(yè)能力同步升級。2025年以來,國外特斯拉公司的O波士頓動力公司的Atlas系列以及FigureAI公司的系列產(chǎn)品持續(xù)更新2025年,輪式人形機器人成為市場關(guān)注重點,銀河通用基于GalbotG1機器人形28/a/202507273468476973.html2.機器狗復(fù)雜地形適應(yīng)性升級,初步落地行業(yè)場景豹四足狗以10.3米/秒的速度打破由波士頓動力WildCat創(chuàng)造的8.89足機器人學(xué)會攀爬70度到90度不同傾斜角的梯子30。二是更輕,但態(tài)交互能力升級,成為人們的生活伙伴。維他動力Vbot通過協(xié)同屏29/detail/2077330/html/2409.177幕表情,肢體、揚聲器和指示燈提供豐富情感表達(dá)。蔚藍(lán)科技小時無故障電力巡檢31,并與湖南長沙市消防救援支隊合作,代替指技Loona機器狗發(fā)布后半年即達(dá)成400萬美元銷售額。美國Tom31/a/202507/28/WS688762bca310a07bb590aa632/c/8EYi1b應(yīng)用局限性在于,一是行業(yè)采用率有限。IDC數(shù)據(jù)顯示2024年要采用方基本只支持單臺套采購模式,這些高強度作業(yè)場景對(例如60度傾斜角爬坡、細(xì)小金屬桿密集的障礙區(qū)域等),導(dǎo)致單障礙讓機器人卡住。另外,金屬管網(wǎng)拓?fù)浣Y(jié)構(gòu)也打造了弱信號區(qū)域,33/getdoc.jsp?containerId=prCHC5364杭州落地具身智能4S店,提供用戶定制和樂高式模塊化開發(fā)的產(chǎn)品3.仿生機器人、智能機械臂等產(chǎn)品加速探索機器人、復(fù)合輪臂式機器人、四足/多足機器人外,業(yè)界也在廣泛探術(shù)支持34。再如哈爾濱工業(yè)大學(xué)研發(fā)的蛇形機器人,可實現(xiàn)水中和陸34/(二)智能運載裝備是具身智能落地“最快”載體1.自動駕駛汽車法規(guī)不斷完善,加速商業(yè)化進(jìn)程一樣思考,交互性和復(fù)雜路況處理問題解決能力明顯提升。理想i8搭載VLA司機大模型后,可以直接通過“前方掉頭”“前進(jìn)10米”等簡單指令調(diào)整行車路線。Waymo推出VLA架構(gòu)的EMMA端到端自動駕駛汽車的上路通行和場景試點提供有力支持。其中,北京市2025年4月實施的《北京市自動駕駛汽車條例》明確支持自動駕駛劃,并批準(zhǔn)Zoox公司的自動駕駛汽車路測35,加速松綁監(jiān)管政策,自動駕駛汽車L3級車型量產(chǎn)和L4級商業(yè)化運營并行推進(jìn)。摩元36。一是L3級別智駕能力上車。華為智駕方案乾崑智駕ADS4計租車(Robotaxi)為代表,正在探索規(guī)模化、商業(yè)化示范應(yīng)用。高盛35/press-releases/nhtsa-issues-first-ever-demonstration-exemption-american-b3637/articles/view/1496814565/593793e502001qgpi38/pdfs/insights/goldman-sachs-research/robotaxi/report.pdf至千臺。三是L4級別無人駕駛小車在無人公交、無人配送、無人環(huán)衛(wèi)等場景應(yīng)用落地,推動未來出行與生活方式轉(zhuǎn)變。截至2025年7應(yīng)用規(guī)模越大,才能更早發(fā)現(xiàn)和解決問題,從而反哺技術(shù)加速雖然全國多地已經(jīng)開展測試,但真正實現(xiàn)規(guī)?;圏c示范的僅武漢等少數(shù)城市突破千臺級規(guī)模,而其他城市大多停留在百臺2.無人駕駛航空器快速發(fā)展,推進(jìn)多元場景應(yīng)用用更加廣泛和深入。2025年6月,美團(tuán)無人機在香港航線上進(jìn)行外對比傳統(tǒng)騎行方式效率提升近7倍40。隨著深度強化學(xué)破性進(jìn)展。eVTOL支持單次更大載荷、更多貨物的點對點運輸,通39/doi/10.1126/scirob40/economy/2025_06_06_778470.shtml41/a/202506/11/WS68495cffa3102053742/dlxxh/wurenji/2025-08-20優(yōu)勢,確保長時間、長距離的安全飛行。2025年7月,億航智能物流無人駕駛eVTOL裝載海鮮從廣東珠海唐家港運起飛,途經(jīng)中山、廣州三市82.9公里,在廣州穗港碼頭落地,歷時約55分鐘,內(nèi),制約了在物流配送、農(nóng)業(yè)植保、安防監(jiān)控等場景的工作效率。eVTOL電池能量密度也僅能勉強滿足200公里以內(nèi)的短途飛行。如43/2025/07/30/ARTIpKfLgArEVLO2yDLIBlET2(三)新型智能產(chǎn)品是具身智能“前沿”探索方向望應(yīng)用于應(yīng)急救援、野外探索、月球探測等場景45。集群式微型智能44/product/apas45https://actu.epfl.ch/news/morphing-robot-turns-challenging-terrain-to-its--2/46/document/10598230料,導(dǎo)致成本較高。目前具備AI動態(tài)調(diào)節(jié)、多模態(tài)交互等四、具身智能產(chǎn)業(yè)生態(tài)加速完善(一)產(chǎn)業(yè)鏈橫跨多個領(lǐng)域,生態(tài)體系初步形成),來源:中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟具身智能工作組、具身智能測試實驗室(截至9月25日)從地域角度看,目前我國在十余個省市/地區(qū)均有企業(yè)布局,產(chǎn)家)、浙江?。?3家)緊隨其后,五大省市匯聚主要產(chǎn)業(yè)力量,其來源:中國信息通信研究院務(wù)方面,人形機器人(雙足/輪式)是業(yè)界關(guān)注熱點,企業(yè)占比達(dá)到其他方向占比均超過6%,呈現(xiàn)均衡發(fā)展的整體態(tài)勢。四大板塊企業(yè)來源:中國信息通信研究院(二)訓(xùn)練場建設(shè)成熱點,實際效用仍需進(jìn)一步驗證智能訓(xùn)練場超過30家,覆蓋了北京、上海、天津、廣東、浙江、江思路,北京人形機器人數(shù)據(jù)訓(xùn)練中心一期47搭建了家庭康養(yǎng)、汽車裝47/m1/mtgz/20250329/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論