人形機器人市場分析_第1頁
人形機器人市場分析_第2頁
人形機器人市場分析_第3頁
人形機器人市場分析_第4頁
人形機器人市場分析_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

人形機器人市場分析

技術(shù)革新+巨頭入局+政策激勵,多維度催化人形機器人落地

技術(shù)進步+巨頭入局+政策激勵加速2023年人形機器人產(chǎn)業(yè)發(fā)展.

2023年ChatGPT等大語言模型超預(yù)期發(fā)展,增強人形機器人交互

能力,拓寬其應(yīng)用領(lǐng)域;硬件方面,特斯拉等科技公司紛紛入局,有

望加快產(chǎn)業(yè)鏈技術(shù)進步。我們認為人形雙足機器人為通用機器人的最

優(yōu)解,因為人類社會的種種事物都按照人類的生理結(jié)構(gòu)進行設(shè)計,貼

近人類形態(tài)的雙足機器人更能適應(yīng)種類多樣的任務(wù),達到通用的目的,

隱形成本較小。隨著科技龍頭入局、ChatGPT等AI技術(shù)力口速、相關(guān)

政策密集落地,作為“具身智能”理想載體的人形機器人在多種因素的

推動下有望快速發(fā)展。

大模型幫助機器人思考學(xué)習(xí),推動具身智能發(fā)展。英偉達創(chuàng)始人兼

CEO黃仁勛在ITFWorld2023半導(dǎo)體大會上表示,AI下一個浪潮將

是“具身智能”,即能夠理解、推理物理世界并與物理世界互動的智能

系統(tǒng)。微軟、Google.英偉達等大廠均積極開展具身智能相關(guān)研究。

微軟基于ChatGPT的強大自然語言理解和推理能力生成控制機器人

的相關(guān)代碼;英偉達VIMA基于T5模型,將文本和多模態(tài)輸入交錯

融合,結(jié)合歷史信息預(yù)測機器人的下一步行動動作;英偉達

OPTIMUS使用任務(wù)運動規(guī)劃器來自動生成足夠的機器人軌跡數(shù)據(jù),

然后訓(xùn)練Transformer視覺■運動策略,進而預(yù)測機器人動作;谷歌

RT-2則通過VLM與機器人數(shù)據(jù)的結(jié)合,賦予機器人語義理解和基本

推理能力。大模型不斷進步提升人形機器人交互能力,推動具身智能

發(fā)展。

特斯拉機器人快速迭代,24年有望在工廠投入使用。2021年特斯拉

在AIDay上首次提出其人形機器人Optimus的渲染圖;2022年AIDay

上,特斯拉推出原型機,在沒有外接線纜的情況下實現(xiàn)了緩慢行走與

揮手;2023年5月股東大會上,特斯拉人形機器人已經(jīng)可以實現(xiàn)流

暢的行走與抓取物品,靈活度較原型機大大提高。2023年7月20

日,馬斯克表示,目前特斯拉人形機器人擎天柱的制造數(shù)量為10臺

左右,將會在2023年11月左右對特斯拉自己設(shè)計的執(zhí)行器進行行

走等測試,明年人形機器人有望率先在內(nèi)部工廠投入使用。在應(yīng)用場

景方面,除了工廠以外,公司還考慮將人形機器人與Neuralink結(jié)合,

為殘障人士提供義歧應(yīng)用場景有望不斷拓展。

多方玩家布局人形機器人,百舸爭流加快硬件變革。除特斯拉外,國

內(nèi)外多家公司積極所發(fā)人形機器人并取得快速進步。2019年波士頓

動力機器人Atlas掌握“體操”技巧,能夠連續(xù)的跳躍、翻滾;2022年

8月,小米發(fā)布人形機器人"Cyberone";2023年4月1/technologies

機器人EVE應(yīng)用于美國和歐洲部分地區(qū)的商業(yè)場景;優(yōu)必選、傅利

葉所生產(chǎn)機器人都具備行走,與人協(xié)同完成動作等功能;三星宣布將

于2023年10月闡述其“Semicon人形機器人”計劃。各高校實驗室也

在積極嘗試各種技術(shù)路徑研發(fā)人形機器人,清華大學(xué)交叉信息研究院

陳建宇團隊機器人“小星”采用準直驅(qū)力控方案,可完成多種動作。多

方玩家并驅(qū)爭先,有望加速人形機器人硬件升級。

■Alt/”??夫?舄人

OpamuB供.力*0.#庖&■***

小公Cytetont?侑.—人

Atetn<.

AgtryRoMcsw”■今收?八包II.”*?

1XtochnologmEVE??.,成?■4??UKAI

ArtsAmeca與人,蒙?,?????“??.▲蠟?什文渡:AK.“冷?af

WaftwX??金”?&q?9/?睜■???U-SLAM?*<.It

■,力FourwrGRd,戰(zhàn)■然.Q?XT?.■紂”,?■??FUtXA.

AI.??.

CloudGng*20tRitfAM*t.

一人A.

政策密集出臺,加速人形機器人產(chǎn)業(yè)化進程。2023年6月28日,北

京印發(fā)《北京市機器人產(chǎn)業(yè)創(chuàng)新發(fā)展行動方案(2023-2025年)》,

強調(diào)要對標國際領(lǐng)先人形機器人產(chǎn)品,支持企業(yè)和高校院所開展人形

機器人研發(fā)和工程化,目標在2025年前實現(xiàn)百臺(套)級人形機器

人原型機的生產(chǎn),并在3?4個典型場景中開展示范性應(yīng)用。十四五以

來,中央和地方陸續(xù)推出支持人形機器人產(chǎn)業(yè)發(fā)展的政策,如《"十

四五”機器人產(chǎn)業(yè)發(fā)展規(guī)劃》、《“機器人”應(yīng)用行動實施方案》、《山

東省制造業(yè)創(chuàng)新能力提升三年行動計劃(2023-2025年)》、《深圳

市加快推動人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動方案(2023-2024

年)》等。多地利好政策有望推動人形機器人加快工程化和產(chǎn)業(yè)化。

決策層:大模型賦予機器人“大腦”,具身智能迎來曙光

大模型使機器人理解自然語言,增強泛化能力

大模型為機器人裝上“大腦”,提升其理解能力與泛化能力。谷歌

DeepMind于2023年7月28日推出全球首個控制機器人的視覺■語

言■動作(VLA)模型RT-2;斯坦福大學(xué)李飛飛教授研究團隊于2023

年7月12日推出VoxPoser,通過大語言模型加視覺語言模型指導(dǎo)

機器人行動。搭載此類模型的機器人可以像ChatGPT一樣被操縱,

種任務(wù),并且涌現(xiàn)出了4種行為能力,可以自主分步完成任務(wù),掌握

評估方法,根據(jù)最新要求做出判斷進而調(diào)整輸出動作。

RT-2泛化能力還體現(xiàn)在其思維鏈(CoT)助其進行多階段語義推理,

完成更復(fù)雜任務(wù)°DeepMind研究團隊展示了將思維鏈推理納入RT-2

中使其能夠進行多階段語義推理,他們用少量的“增強”數(shù)據(jù)微調(diào)一個

RT?2?PaLM?E變種,增強數(shù)據(jù)中加入了“Plan”步驟,使得VLM首先

用自然語言描述機器人將要采取的動作的目的,然后再給出預(yù)測的機

器人動作標記。例如:“指示:我餓了。計劃:選擇rxbar巧克力,行

動:1128124136121158111255?!蓖ㄟ^實驗結(jié)果可以觀察到,具有

思維鏈推理的RT-2能夠回答更復(fù)雜的命令。

決策結(jié)果到運動控制映射方式改變,機器人實現(xiàn)“手腦協(xié)調(diào)”

此前大模型產(chǎn)出的策略需要借助低級別策咯或API才能完成對機器

人的運動控制。視覺語言模型生成的結(jié)果到機器人動作的映射方式,

主要取決于該預(yù)測結(jié)果的層級。之前模型中預(yù)測結(jié)果處于高級別設(shè)計

層級:以GooglePaLM-E和微軟ChatGPTforRobotics為例,PaLM-E

實現(xiàn)了對具身任務(wù)的決策方案預(yù)測,但不涉及機器人動作的實際控制,

需要依賴低級別的現(xiàn)成策略或規(guī)劃器來將決策方案“翻譯”為機器人

動作。微軟默認提供控制機器人的低層級API,ChatGPT輸出是更

高層級的代碼,需調(diào)用到機器人低層級的庫或API,從而實現(xiàn)對機器

人動作的映射和控制。RT-2和VoxPoser預(yù)測結(jié)果已經(jīng)到了低級別

動作層級,不需要再經(jīng)過復(fù)雜的翻譯即可將高層級設(shè)計映射到低層級

動作。

RT-2輸出字符串可直接對應(yīng)到機器人的坐標、旋轉(zhuǎn)角等信息。RT-2

動作控制采用的方法是將機器人動作表示為另一種語言,即文本

token,并與Web規(guī)模的視覺■語言數(shù)據(jù)集一起訓(xùn)練。代表機器人動

作的文本字符串可以是機器人動作token編號的序列,例如

ri128912415101127217J,該字符串以一個標志開始,該標志指

示機器人是繼續(xù)還是終止當前情節(jié),然后機器人根據(jù)指示改變末端執(zhí)

行器的位置和旋轉(zhuǎn)以及機器人抓手等命令。由于動作被表示為文本字

符串,因此機器人執(zhí)行動作命令就像執(zhí)行字符串命令一樣簡單。這種

表示方式允許谷歌對現(xiàn)有的視覺-語言模型進行微調(diào),并將其轉(zhuǎn)換為

視覺■語言■動作模型。

Voxposer規(guī)劃結(jié)果直接為機器人運行軌跡。Voxposer的動作控制實

現(xiàn)過程是首先給定環(huán)境信息(用相機采集RGB-D圖像)和自然語言

指令,之后LLM(大語言模型)根據(jù)這些內(nèi)容編寫代碼,所生成代

碼與VLM(視覺語言模型)進行交互,指導(dǎo)系統(tǒng)生成相應(yīng)的操作指

示地圖(3DValueMap),之后動作規(guī)劃器將生成的3D地圖作為目

標函數(shù),直接合成最終操作軌跡。在用LLM和VLM將語言指令映射

為3D地圖的過程中,系統(tǒng)利用“感興趣的實體(entityofinterest)”來

引導(dǎo)機器人進行操作,也就是通過3DValueMap中標記的值來反應(yīng)

哪個物體是對它具有“吸引力”的,哪些物體是具有“排斥性”,比如在

打開抽屜的例子中,抽屜就是“吸引”的,花瓶是“排斥”的。

感知層:聚焦力傳感器應(yīng)用,機器人知“輕重”懂交互

人形機器人需借助多種傳感器識別自身運動狀態(tài)和環(huán)境狀況,收集多

模態(tài)數(shù)據(jù)以供交互。具身智能重點在于具有身體體驗的能力,與環(huán)境

交互獲得視、聽、觸覺等多模態(tài)數(shù)據(jù)再做出反應(yīng),需要模型與傳感器

等硬件相互配合。李飛飛教授團隊在介紹Voxposer的論文中提到,

具身智能依賴于外部感知模塊,在需要整體視覺推理或理解細粒度物

體幾何形狀的任務(wù)中具有局限性,需要更高級的視覺傳感器或其他傳

感方式。因此人形機器人產(chǎn)業(yè)化不僅需要大模型完成決策,還需要傳

感器等硬件不斷升級進行配合,提供多模態(tài)數(shù)據(jù)。

S4L18:多“傳感R?動A彩機M人祝別2分的送動代合/壞垸狀況

傳奏作用

**視覺伶感JS視覺改便.

麥包鳳停當26遺fti??文互

紅外相“梟笈外體感2s感加物體令4

M近傳亳③整/攻學(xué)道/TOF用來淘期

光電釬美及區(qū)力井累AM5婚乂&

內(nèi)部4度伶亳4R淘注度.?幼教嬉

X度、區(qū)力傳離B檢洲機名人體極

IMU慣值導(dǎo)新桂11平的“穩(wěn)定療々的美KfliftB.柒型IMU伶53有三”如途從計.三“陀螺伐.

力拉傳感d及"力校遣這14件感衣木心力傳感看占用見底.齦公校依可保譴事公功能

力ti檢洲疆力.”曼號.

關(guān)節(jié)力控檢制關(guān)節(jié)⑵出U坯

六維力/關(guān)節(jié)扭矩傳感器為力控核心,使人形機器人知“輕重”

力傳感發(fā)展仍處初期,六維力傳感器和關(guān)節(jié)扭矩傳感器是核心。在機

器人多種感知中,力覺感知及對應(yīng)的力傳感器發(fā)展較慢,但其在人形

機器人的運動控制中起重要作用,可以增強機器人本體感知及獲取環(huán)

境物理信息的能力。力傳感器是人形機器人感測力和力矩信息的主流

選擇,可協(xié)助機器人完成精細和智能的操作任務(wù)。人形機器人力感知

主要包括兩種模式,一種使用末端的六維力傳感器,一種使用關(guān)節(jié)扭

矩傳感器。人形機器人旋轉(zhuǎn)、線性執(zhí)行結(jié)構(gòu)類似于人類關(guān)節(jié),對于力

的感知相對簡單,可采用關(guān)節(jié)扭矩傳感器;而對于人形機器人末端執(zhí)

行器(如腕部、踝部)在執(zhí)行操作的過程中,力的方向和作用點都在

三維空間內(nèi)隨機變化,測量需要精確處理,六維力傳感器更符合需求。

六維力傳感器精度高、獲取力信息最全面。六維力傳感器是一類可以

同時檢測X、丫、Z三軸方向的力和繞三個坐標軸方向的力矩的傳感

器,目前已應(yīng)用于協(xié)作機器人和康復(fù)醫(yī)療機器人中,可以增強機器人

與人協(xié)同的安全性。六維力傳感器測量維度最高,可以提供最全面的

力覺信息,其具有高精度、高靈敏度、快速響應(yīng)、高耐用性和可靠性

的特點,可以輕松檢測到微小的力的變化,實時記錄和傳輸數(shù)據(jù),滿

足各種應(yīng)用的需求。相較于三維力傳感器,六維力傳感器適用于力的

作用點離傳感器標定參考點距離較遠,且隨機變化,測量精度要求較

高的情況。同時機器人可以利用獲得的力矩信息推算受力部件的姿態(tài),

監(jiān)測力矩是否在安全范圍內(nèi),有效避免傳感器的過載損壞。

六維力傳感器主要用于人形機器人腕部及踝部。六維力傳感器可裝載

于機器人的腕部、踝部等核心關(guān)節(jié)處,讓機器人知“輕重”、懂交互,

真正實現(xiàn)類人的運動能力。雙足機器人由于有腳掌的存在,其在落足

時會產(chǎn)生力矩,測量該力矩的大小和方向是運動控制中的重要一環(huán)。

六維力傳感器可搭或于雙足機器人腳踝處,測量各方向的力和力矩,

并由控制器通過分析傳感器輸出的各維度數(shù)據(jù),得出落腳時的受力狀

態(tài),從而對機器人姿態(tài)進行調(diào)整。六維力傳感器還適用于人形機器人

手腕關(guān)節(jié)處,機械手在執(zhí)行抓取或裝配工作時,會受到各方向的力,

有六維力傳感器作為感知元件,機器人才能精準執(zhí)行這些工作,甚至

做到“穿針引線,

關(guān)節(jié)扭矩傳感器增強機器人本體感知。關(guān)節(jié)扭矩傳感器將扭轉(zhuǎn)力矩引

起的物理變化轉(zhuǎn)換成精確的電信號,從而形成對機器人單關(guān)節(jié)力矩的

測量和記錄。機器人本體感知依賴關(guān)節(jié)扭矩傳感器感測各個關(guān)節(jié)扭力,

獲得各個部位受力情況,提供機器人整體的姿態(tài)及位置信息。關(guān)節(jié)扭

矩傳感器可以實時反饋高質(zhì)量扭矩信號,迅速識別接觸并立即降低力

和速度,因為該傳感器距離電機較近,避免了機器人機械本體動態(tài)特

性的干擾,帶寬更高,動態(tài)響應(yīng)更快。關(guān)節(jié)扭矩傳感器本質(zhì)測量一維

力,但要抵抗五維力的干擾,抗干擾能力要求高。

高價值高壁壘,六維力傳感器面臨動靜態(tài)特性及解耦問題

進口六維力傳感器價格昂貴,國內(nèi)外產(chǎn)品在多方面仍存在差距。2022

年,在接受高工機器人采訪時,坤維科技創(chuàng)始人熊琳表示:“一臺高

性能的進口力傳感器的價格頂?shù)蒙蠂鴥?nèi)一臺協(xié)作機器人的價格,導(dǎo)致

國內(nèi)機器人行業(yè)用不起,加之標校能力和生產(chǎn)方式等多方面的約束,

國內(nèi)多數(shù)六維力傳感器廠商無法滿足產(chǎn)能需求,阻礙了第三代工業(yè)機

器人的發(fā)展?!备咝阅芰S傳感器價格從幾千到上萬不等,價值量較

高。國內(nèi)參與者主要是鑫精誠、宇立儀器(安川電機、KUKA、ABB

的力傳感器合作商)、坤維科技(供貨給節(jié)卡、遨博、睿爾曼、大族

等國內(nèi)協(xié)作機器人廠商),但國產(chǎn)六維力傳感器與外資主流傳感器在

靈敏度、串擾、抗過載能力及維間耦合誤差等方面仍存在差距。

應(yīng)變片式為當前六維力傳感器主流,硅應(yīng)變傳感器在穩(wěn)定性、信噪比、

剛度方面表現(xiàn)較好。根據(jù)GGIL六維力傳感器根據(jù)傳感元件的不同

主要分為三種基本類型:應(yīng)變片式、光學(xué)式以及壓電/電容式。應(yīng)變

片式可分為金屬電阻應(yīng)變片和硅應(yīng)變片,當基體受力發(fā)生應(yīng)力變化時,

應(yīng)變片也一起產(chǎn)生變形,使應(yīng)變片的阻值發(fā)生變化。壓電/電容式中,

電容是通過極距的變化導(dǎo)致電壓變化,壓電則是通過形變改變電荷。

光學(xué)式則通常使用光柵或其他光纖技術(shù)檢測光功率并將其轉(zhuǎn)換為電

能。目前市場應(yīng)用的大部分是基于應(yīng)變片式的測量,其具有靈敏度高、

測量范圍大、可靠性高、技術(shù)成熟等優(yōu)點。其中硅應(yīng)變傳感器在穩(wěn)定

性、信噪比、剛度方面有比較優(yōu)勢。

應(yīng)變片式傳感器的彈性體結(jié)構(gòu)是關(guān)鍵,一體化和Stewart并聯(lián)為主流。

應(yīng)變片式六維力傳感器的彈性體結(jié)構(gòu)設(shè)計是核心問題,傳感器的結(jié)構(gòu)

受到其應(yīng)用場合的限制,而力敏感元件的形式和布置直接影響傳感器

的靈敏度、剛度、動態(tài)性能、維間耦合等,很大程度上決定傳感器性

能的優(yōu)劣。六維力傳感器的典型結(jié)構(gòu)設(shè)計主要是一體化結(jié)構(gòu)(豎梁、

橫梁)和Stewart并聯(lián)結(jié)構(gòu)。以Waston腕力傳感器為典型代表的豎

梁結(jié)構(gòu)橫向效應(yīng)好、結(jié)構(gòu)簡單、承載能力強,但豎向效應(yīng)差、維間干

擾大、靈敏度較低;十字橫梁結(jié)構(gòu)靈敏度高、易加工,易于標定,但

存在維間耦合和徑向效應(yīng);Stewart平臺中彈性體采用復(fù)合式結(jié)構(gòu),

該類傳感器具有結(jié)構(gòu)緊湊、承載能力強、俁差不累積等優(yōu)點。

六維力傳感器選型難度大,技術(shù)難點集中于保持優(yōu)良的靜態(tài)性能、動

態(tài)性能和低維間耦合。六維力傳感器選型難點在于應(yīng)用多樣性、復(fù)雜

性。由于傳感器量程和精度成反比關(guān)系,選擇合適量程的傳感器才能

使精度達到最大;同時在復(fù)雜應(yīng)用場景下,傳感器本體是否能適應(yīng)應(yīng)

用場景也需要考慮;此外還要綜合考慮精密機構(gòu)當中的傳感器如何安

裝在狹小空間內(nèi),如何與機構(gòu)融為一體等問題。六維力傳感器選型四

個核心步驟為確定量程需求——確定使用環(huán)境——確定機械出線需

求——確定通訊方式。六維力矩傳感器技術(shù)難點集中于需兼顧優(yōu)良的

靜態(tài)性能、動態(tài)性能和低維間耦合。未來六維力矩傳感器需要六維聯(lián)

合加載標定設(shè)備等先進儀器、動態(tài)特性優(yōu)化和矢量運算中的解耦算法

解決技術(shù)難點。

難點一:六維力傳感器非線性特性顯著,需要更為復(fù)雜的六維聯(lián)合加

載標定。標定是指通過加載理論值的載荷并同時記錄傳感器輸出的對

應(yīng)原始信號的方式,獲得六維力傳感器內(nèi)部算法的各個參數(shù),建立傳

感器原始信號和受力之間的映射關(guān)系。標定解耦是六維力傳感器提高

精度的主要方法,因此標定工作在傳感器的研發(fā)過程中扮演著重要角

色?,F(xiàn)有標定裝置存在較多局限性,如加載載荷有限、無法進行復(fù)合

加載、無法加載所有維度正負方向、維間耦合較大等。這些局限性因

素限制了六維力傳感器標定的有效性,影響其最終使用精度,只有采

用六維力聯(lián)合加載標定,才能使傳感器的準度更好、串擾更低。

難點二:實際應(yīng)用條件復(fù)雜,動態(tài)性能優(yōu)化算法仍需提升。六維力傳

感器使機器人實現(xiàn)柔順化、智能化控制,因此在動載荷下性能指標要

求更高。在實際的力/力矩測量過程中,被測信號大多是動態(tài)信號,

如機器人打磨拋光時的接觸力、物體高速運動過程中的稱重和炮彈發(fā)

射過程時的后座力等,這些信號屬于快速時變信號,動態(tài)性能較差的

傳感器跟蹤測量這些信號難度較大。且當前動態(tài)性能的分析方法很難

獲得完全意義的沖擊信號和階躍信號,造成感應(yīng)系統(tǒng)的精度下降。當

前業(yè)界主要使用優(yōu)化自身結(jié)構(gòu)、形狀等方法提高動態(tài)性能,國內(nèi)外學(xué)

者還嘗試利用動態(tài)補償濾波器、遺傳算法、神經(jīng)網(wǎng)絡(luò)算法等智能算法

來提高傳感器的動態(tài)性能。

難點三:維間耦合問題無法徹底避免,解耦算法紛繁復(fù)雜。理想的六

維力傳感器,每一方向輸出通道的電壓值僅取決于該方向作用力/力

矩的大小,與其余五個方向作用力/力矩大小無關(guān)。但是由于傳感器

的結(jié)構(gòu)設(shè)計、機械加工的精度、貼片技術(shù)、應(yīng)變片橫向效應(yīng)與檢測方

式等方面的原因,幾乎每一維作用到傳感器上的力/力矩分量都會對

傳感器的各路輸出信號產(chǎn)生影響,造成維間耦合問題。因此需要解耦

算法來對六維力傳感器的輸出進行解耦,消除維間干擾,提高傳感器

的測量精度。但當前對于多維力傳感器的解耦問題并沒有統(tǒng)一的處理

方法,需根據(jù)實際情況及傳感器結(jié)構(gòu)進行選擇和優(yōu)化。

六維力傳感器+本體感知帶來機器人手部物品姿態(tài)估計新解法

位姿估計是機器人領(lǐng)域重要問題,特殊環(huán)境下視覺反饋算法估計物品

姿態(tài)可靠性較差。早期位姿估計算法包括模板匹配和特征點檢測,前

者預(yù)構(gòu)建目標位姿模板庫,檢索得到最相似模板圖像對應(yīng)位姿;后者

提取目標二維圖像特征,構(gòu)建關(guān)鍵點匹配后使用N點透視法解算。

這兩種方法依賴物體表面顏色紋理,受環(huán)境因素影響大。之后三維相

機在機器人視覺領(lǐng)域得到應(yīng)用,引入場景三維幾何信息提高目標位姿

估計精度,但其需要人工設(shè)計圖像特征提取方式,泛化性能差。近期

PoseCNN構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)自動提取圖像特征,采用端到端的方式

回歸物體三維位姿,但總體來看基于視覺系統(tǒng)的位姿估計算法應(yīng)用場

景受到較大限制,在視覺被阻礙的環(huán)境中(狹窄空間進行精細裝配或

操作)估計結(jié)果可靠性較差。

六維力傳感器搭配本體感知提供機器人手部物品姿態(tài)估計新解法。

2023年7月,RSS會議上刊登了機器人感知手部物品姿態(tài)解決方案

的論文,密歇根大學(xué)機器人系的AndreaSipos和NimaFazeli利用

機器人本體感知(自身關(guān)節(jié)處扭矩傳感器的感知反饋)以及手腕上六

維力傳感器的觸覺反饋,并使用接觸粒子濾波器算法,定位接觸位置

并估計物體姿態(tài),簡稱SCOPE,該方法可精確的完成接觸位置的確

定和物體姿態(tài)的估計,有望推動人形機器人的位姿估計能力。

SCOPE可精準確定接觸位置,快速迭代估計物體姿態(tài)。SCOPE方

法是在接收到六維力傳感器和關(guān)節(jié)扭矩傳感器的信號數(shù)據(jù)后,使用接

觸粒子濾波器處理,完成物體姿態(tài)識別。上述論文中的實驗選用來源

于德國宇航局的FrankaEmikaPanda機器人,其是一款高性能七軸

協(xié)作機器人,每個關(guān)節(jié)都配有扭矩傳感器,力控性能在同類型機器人

里面處于領(lǐng)先地位,手腕的六維力傳感器則是美國企業(yè)ATI生產(chǎn)。在

估計過程中雖然初始分布有較大的誤差和高方差,但SCOPE可以在

短短幾次迭代中以低方差估計物體姿態(tài)。并且實驗發(fā)現(xiàn),即使對十較

小的,非凸形狀的工具,SCOPE方法依然可以給出較為精確的姿態(tài)

估計結(jié)果。

圖表41:SCOPE選取合理的抓取接觸位*(下三圖)

使用接觸粒子濾波器算法進行采樣定位,提供準確力信息?,F(xiàn)有的物

體姿態(tài)估計信號處理算法可以分為三大類:幾何匹配、概率方法和機

器學(xué)習(xí)方法。目前主流方法是使用概率方法(粒子過濾器、SLAM和

蒙特卡洛方法等)來估計物體的姿勢,其中粒子濾波器所需計算量小,

且在非線性情況下表現(xiàn)較好,常被用于定位、跟蹤物體等問題。Sipos

和Fazeli使用了兩個互補的接觸粒子濾波器(ContactParticleFilter):

一個用于估計接觸位置,另一個用于估計物體姿態(tài),都是在接收到關(guān)

節(jié)處扭矩傳感器和手腕處六維力傳感器的信號后進行概率分布的計

算更新,幫助去除來自環(huán)境的噪聲和不確定性,得到更準確和可靠的

接觸力信息。

MultiSCOPE實現(xiàn)多個接觸跨物體姿態(tài)估計,助力機器人使用人類工

具。Sipos和Fazeli進一步于2023年6月提出MultiSCOPE,該方

法使用本體感知和手腕處六維力傳感同時估計兩個物體在未知配置

情況下被兩個協(xié)同手臂抓取的姿態(tài)。該方法由單個物體的感知擴展到

多接觸的交互,實現(xiàn)了跨動作的物體姿態(tài)估計。在該實驗中機器人手

持扳手可以擰動一個螺釘,即機器人既可以感受到直接接觸的扳手形

態(tài),又可以通過扳手和另一只手臂上的力傳感器感受到螺釘?shù)臓顟B(tài)變

化,估計兩個抓取物體的姿態(tài),從而完成多任務(wù)。該實驗的成功使機

器人具備多物體的感知能力,有助于機器人操作人類工具完成多項任

務(wù),提高人形機器人多場景下的通用性。

六維力傳感器+本體感知技術(shù)使姿態(tài)估計向多模態(tài)+高效連續(xù)性發(fā)展。

基于六維力傳感器和本體感知的物體姿態(tài)估計技術(shù)為機器人感知并

抓取物體提供了新解法。該方法可與其他方法完成多模態(tài)互補,在無

遮擋場景中,視覺感知方法可以與SCOPE共同使用以提高性能:比

如機器人可以使用視覺反饋來初始化作用域和初步識別,提高感知效

率。SCOPE技術(shù)未來的發(fā)展方向也會集中于減少收斂到準確的物體

姿態(tài)估計所需的動作數(shù)量和連續(xù)的下一步動作選擇算法,以提高機器

人抓取物體的連續(xù)性和高效性。SCOPE與六維力傳感器的結(jié)合有望

加快人形機器人實際應(yīng)用。

執(zhí)行層:剛性驅(qū)動器方案成熟,準直驅(qū)方案滲透率有望提高

特斯拉采用成熟的剛性驅(qū)動器方案,未來準直驅(qū)方案滲透率有望提高。

機器人關(guān)節(jié)驅(qū)動器按動力來源可以分為液壓、氣動、電驅(qū)等。液壓雖

然功率高,但可靠性和精度低,噪音大,成本高;氣動柔順性好,安

全性高,但精度差,時滯高。電驅(qū)因其精度、安靜、高效方面的優(yōu)勢

逐漸成為主流,其經(jīng)過30多年的發(fā)展,經(jīng)歷了從剛性驅(qū)動器、彈性

驅(qū)動器到準直驅(qū)驅(qū)動器的過程。特斯拉采用的是戢早推出,也是相對

成熟的剛性驅(qū)動器方案。如果電機和減速器性能沒有大幅提升的情況

下,在雙足機器人領(lǐng)域剛性驅(qū)動器將會逐步被取代。近幾年新興的準

直驅(qū)驅(qū)動器技術(shù)發(fā)展迅速,未來有望替代傳統(tǒng)的剛性驅(qū)動器。

剛性驅(qū)動器技術(shù)相對成熟,整體設(shè)計較難創(chuàng)新。1983年,早稻田大

學(xué)研究出剛性驅(qū)動器(TSA),自此TSA在雙足仿人機器人上廣泛

應(yīng)用。結(jié)構(gòu)上,TSA是常規(guī)無刷電機驅(qū)動高傳動比減速器,有些在

電機端增加剎車,在減速器和輸出端增加高剛性力矩傳感器。力矩測

量上,TSA是基于電流或應(yīng)變片式力矩傳感器。控制上,TSA控制

簡單,精度高。功率和效率方面,TSA無功率可調(diào),效率較低,安

全性較差。TSA整體設(shè)計方面已經(jīng)較難有創(chuàng)新,在合適工作區(qū)間內(nèi)

的最大輸出功率密度只能到200-300W/kg,遠沒有達到動物肌肉的

500W/kg,同時也解決不了機器人受外部沖擊時零部件強度問題,目

前的研究集中在優(yōu)化設(shè)計上。

彈性驅(qū)動器技術(shù)路線多樣,多數(shù)結(jié)構(gòu)和控制復(fù)雜。動物利用剛?cè)岵?/p>

的肌肉骨骼系統(tǒng)在運動過程中儲存和釋放能量,調(diào)節(jié)能量在時間和功

率密度上的不匹配,提高關(guān)節(jié)爆發(fā)力,同時能夠?qū)崿F(xiàn)落地緩沖。1995

年,MIT推出彈性驅(qū)動器來模擬肌肉系統(tǒng)功能,使關(guān)節(jié)表現(xiàn)出柔順、

安全和高能量效率特性,目前已演化出SEA、PEA、CEA和MEA

多種結(jié)構(gòu)。彈性驅(qū)動器多在剛性執(zhí)行器的基礎(chǔ)上串聯(lián)或并聯(lián)彈性體。

力矩測量上與剛性傳感器較為類似。控制上,多數(shù)彈性驅(qū)動器方案結(jié)

構(gòu)與控制復(fù)雜,精度一般。綜合來看,由于彈性體引入,系統(tǒng)為欠驅(qū)

動,給控制帶來了難度,尤其在機器人腿部使用,機器人整機的運動

控制比較難實現(xiàn)。

準直驅(qū)驅(qū)動器是新興技術(shù),編碼器和電機功率密度為其主攻方向。受

限于工藝和技術(shù),電機直驅(qū)的扭矩密度不能滿足機器人應(yīng)用的需求,

因此,2016年Wensing等推出準直驅(qū)驅(qū)動器(PA),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論