計(jì)算機(jī)-人形機(jī)器人感知系統(tǒng):迭代有望加速_第1頁
計(jì)算機(jī)-人形機(jī)器人感知系統(tǒng):迭代有望加速_第2頁
計(jì)算機(jī)-人形機(jī)器人感知系統(tǒng):迭代有望加速_第3頁
計(jì)算機(jī)-人形機(jī)器人感知系統(tǒng):迭代有望加速_第4頁
計(jì)算機(jī)-人形機(jī)器人感知系統(tǒng):迭代有望加速_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1告計(jì)算機(jī)告計(jì)算機(jī)華泰研究專題研究增增持(維持)計(jì)算機(jī)人形機(jī)器人感知系統(tǒng):迭代有望加速2022年9月30日,特斯拉2022年AIDAY發(fā)布了人形機(jī)器人Optimus的產(chǎn)品進(jìn)展,披露了包括手部感知和視覺導(dǎo)航等感知系統(tǒng)的最新進(jìn)展。我們認(rèn)為,人形機(jī)器人的感知系統(tǒng)可以分為內(nèi)部和外部兩部分,主要通過視覺、聽覺、觸覺、力覺等傳感器,實(shí)現(xiàn)從內(nèi)外部環(huán)境信號向可處理數(shù)據(jù)的轉(zhuǎn)化。通過對比不同類型機(jī)器人的手部感知和視覺導(dǎo)航方案,我們發(fā)現(xiàn),隨著驅(qū)動結(jié)構(gòu)改進(jìn)、自由度提升、AI算法進(jìn)步,目前人形機(jī)器人感知系統(tǒng)迭代速度正在不斷加快,未來商業(yè)化進(jìn)程有望加速。手部感知系統(tǒng):感知系統(tǒng)的關(guān)鍵執(zhí)行部件機(jī)械手是人形機(jī)器人感知系統(tǒng)的關(guān)鍵組成,機(jī)械手的靈活度、協(xié)調(diào)度、精細(xì)度決定了人形機(jī)器人實(shí)際應(yīng)用場景的寬窄。1)傳統(tǒng)六軸工業(yè)機(jī)器人一般有6個(gè)自由度,內(nèi)置有六個(gè)伺服電機(jī),直接通過減速器、同步帶輪等驅(qū)動六個(gè)關(guān)節(jié)軸的旋轉(zhuǎn),可以實(shí)現(xiàn)諸如自動裝配、噴漆等工作,但靈活性較差。2)英國機(jī)器人公司ShadowRobot推出的靈巧手擁有24個(gè)關(guān)節(jié),各個(gè)關(guān)節(jié)通過直流電機(jī)驅(qū)動,主要用于空間探索、危險(xiǎn)環(huán)境作業(yè)等場景。3)Optimus機(jī)械手采用仿生學(xué)設(shè)計(jì),每只手都有11個(gè)自由度,由電機(jī)配合金屬肌腱驅(qū)動,目前可以實(shí)現(xiàn)辦公室澆水、工廠搬運(yùn)等特定場景工作。機(jī)械手對比:Optimus機(jī)械手迭代潛力較大1)對比驅(qū)動方式來看,電機(jī)驅(qū)動結(jié)構(gòu)簡單、性能穩(wěn)定,因此目前主流機(jī)械手均采用電機(jī)驅(qū)動,預(yù)計(jì)Optimus或?qū)⒉捎每招谋姍C(jī)。2)對比自由度來具備更加靈活的運(yùn)動能力;但相較Shadow靈巧手最高24個(gè)自由度而言,Optimus仍存在較大提升空間,未來自由度有望隨版本迭代逐步遞增。3)對比機(jī)械手抓力來看,Optimus機(jī)械手相較目前主流方案具備一定優(yōu)勢,有望率先應(yīng)用于需要重復(fù)搬運(yùn)的工作場景。視覺導(dǎo)航系統(tǒng):機(jī)器人智能化的第一步波士頓動力的Altas采用RGB攝像頭+TOF深度傳感+激光雷達(dá)方案,可以通過感知算法觀察環(huán)境,按照實(shí)時(shí)數(shù)據(jù)實(shí)現(xiàn)自主規(guī)劃行動。WalkerX搭載力覺、視覺、環(huán)境和人體識別等全方位的感知系統(tǒng),依托U-SLAM視覺導(dǎo)航自主路徑規(guī)劃。Optimus視覺導(dǎo)航方案移植自特斯拉汽車,采用基于攝像頭的純視覺方案。其中OccupancyNetworks是視覺算法的核心,采用“占用”替代傳統(tǒng)檢測過程,從而優(yōu)化視覺導(dǎo)航能力。視覺方案對比:期待神經(jīng)網(wǎng)絡(luò)進(jìn)步帶來軟件快速迭代對比來看,目前主流機(jī)器人視覺導(dǎo)航系統(tǒng)方案中,只有特斯拉采用純視覺路線,其他廠商如波士頓動力采用RGB攝像頭+TOF深度傳感+激光雷達(dá)方案、優(yōu)必選采用激光雷達(dá)+RGBD攝像頭+四目立體視覺方案。我們認(rèn)為,純視覺方案由于減少了激光雷達(dá)等硬件投入,有望進(jìn)一步降低導(dǎo)航系統(tǒng)成本,或?qū)椭鶲ptimus更快實(shí)現(xiàn)商業(yè)化量產(chǎn)。此外,在占用神經(jīng)網(wǎng)絡(luò)模型、運(yùn)動模擬等AI算法加持下,Optimus有望實(shí)現(xiàn)軟件端快速迭代,視覺方案有望朝著更加精確、智能的方向演進(jìn)。風(fēng)險(xiǎn)提示:技術(shù)落地不及預(yù)期;軟件迭代不及預(yù)期;本研報(bào)中涉及到的公司、個(gè)股內(nèi)容系對其客觀公開信息的整理,并不代表本研究團(tuán)隊(duì)對該公司、該股票的推薦或覆蓋。研究員SACNo.S0570519080006SFCNo.BQZ938聯(lián)系人SACNo.S0570122060076春生xiechunsheng@+(86)2129872036linhailiang@+(86)2128972228行業(yè)走勢圖計(jì)算機(jī)滬深300(%)(1)(12)(22)(33)Oct-21Feb-22Jun-22Sep-22資料來源:Wind,華泰研究Optimus統(tǒng)拆解系統(tǒng):基本概念解析人形機(jī)器人感知分為內(nèi)部和外部兩個(gè)模塊。人形機(jī)器人感知是依靠感知不同信息的傳感器,包括視覺、聽覺、觸覺以及力傳感等傳感器,把機(jī)器人的內(nèi)部信息和環(huán)境信息從原始信號轉(zhuǎn)變?yōu)闄C(jī)器人能夠應(yīng)用和處理的數(shù)據(jù),實(shí)現(xiàn)類人類感知,進(jìn)而對機(jī)器人下達(dá)控制命令以完成既定的工作任務(wù)和工作目標(biāo)。人形機(jī)器人感知系統(tǒng)可以根據(jù)信息來源細(xì)分為內(nèi)部傳感器模塊、外部傳感器模塊,內(nèi)部傳感器用來感知機(jī)器人內(nèi)部狀態(tài)信息(如手臂間角度),使得機(jī)器人可以按照規(guī)定的位置、軌跡和速度等參數(shù)運(yùn)動,包括位置傳感器、速度傳感器、角度傳感器等,外部傳感器用來感知機(jī)器人所處外部環(huán)境(如離物體的距離)及狀況(如抓取的物體是否滑落)信息,具體包括視覺傳感器、觸覺傳感器、力覺傳感器等。資料來源:華泰研究外部感知以視覺感知為主,依靠多種傳感器。除了需要感知自身工作狀態(tài)外,為了更好地與人類和環(huán)境進(jìn)行交互作用,人形機(jī)器人還需要具備人類五官的感知能力的傳感器。視覺是人類感官獲取信息的主要途徑之一,并且在所有的感知信息中,動態(tài)的視覺信息是最為復(fù)雜的,因此人形機(jī)器人的視覺信息處理尤為重要。目前視覺傳感已經(jīng)在人形機(jī)器人層面實(shí)現(xiàn)突破進(jìn)展,并且隨著AI技術(shù)的加持,能夠更加智能地實(shí)現(xiàn)外部信息感知。人形機(jī)器人的視覺任務(wù)主要包括對環(huán)境、目標(biāo)的識別以及相對定位、智能導(dǎo)航、地圖重建等任務(wù)。目前視覺傳感主要依靠攝像機(jī)、3D視覺傳感器、激光傳感器、紅外傳感器、超聲波傳感器等多個(gè)傳感器。手部感知系統(tǒng):感知系統(tǒng)的關(guān)鍵執(zhí)行部件機(jī)械手是人形機(jī)器人感知系統(tǒng)的關(guān)鍵組成。一般來說,人形機(jī)器人的手部關(guān)節(jié)越多,靈活度越高,就代表著手部可以做的操作越多。手部自由度的增加,使得人形機(jī)器人可以實(shí)現(xiàn)從簡單抓取到擰瓶蓋、拆包裹、操作機(jī)器設(shè)備等不同難度的工作。此外,目前人類世界大多數(shù)工作,如工廠流水線作業(yè),主要依據(jù)人的生理構(gòu)造設(shè)計(jì)業(yè)務(wù)流程和機(jī)械設(shè)備。因此,機(jī)械手的靈活度、協(xié)調(diào)度、精細(xì)度決定了人形機(jī)器人實(shí)際應(yīng)用場景的寬窄。資料來源:特斯拉官網(wǎng)、華泰研究六軸工業(yè)機(jī)器人:當(dāng)前應(yīng)用范圍最廣的機(jī)械手六軸機(jī)械手臂是當(dāng)前應(yīng)用范圍最廣的機(jī)械手臂方案。傳統(tǒng)六軸工業(yè)機(jī)器人一般有6個(gè)自由度,常見的六軸工業(yè)機(jī)器人包含旋轉(zhuǎn)(S軸),下臂(L軸)、上臂(U軸)、手腕旋轉(zhuǎn)(R軸)、手腕擺動(B軸)和手腕回轉(zhuǎn)(T軸)。機(jī)械手臂內(nèi)置有六個(gè)伺服電機(jī),直接通過減速器、同步帶輪等驅(qū)動六個(gè)關(guān)節(jié)軸的旋轉(zhuǎn),從而實(shí)現(xiàn)諸如本體回旋、大小臂運(yùn)動、手腕旋轉(zhuǎn)擺動等動作?;诹S設(shè)計(jì),傳統(tǒng)工業(yè)機(jī)器人可以實(shí)現(xiàn)諸如自動裝配、噴漆、搬運(yùn)、焊接及后處理等工作。六軸機(jī)器人有較高的自由度,適應(yīng)幾乎任何軌跡或角度的工作,但靈活性較差,一般主要應(yīng)用于特定生產(chǎn)流程。資料來源:ESTUN官網(wǎng)、華泰研究Shadow靈巧手:最接近人手的機(jī)械手Shadow靈巧手的靈敏度可以媲美人手。靈巧手(ShadowDexterousHand)是一款由英國ShadowRobot公司推出的仿生機(jī)械手。靈巧手采用類人手的仿生學(xué)設(shè)計(jì),前臂結(jié)構(gòu)比人類前臂略寬,擁有24個(gè)關(guān)節(jié)、20個(gè)自由度,比人手的自由度還大,可以完成精細(xì)的抓取動作。靈巧手控制系統(tǒng)基于ROS進(jìn)行開發(fā),并提供功能豐富的圖形化控制界面。應(yīng)用層面來看,靈巧手可以廣泛應(yīng)用于AI&VR、科研教育、航天航空、核能工業(yè)等領(lǐng)域,從而替代人類進(jìn)行危險(xiǎn)或重復(fù)的勞動工作。Shadow靈巧手通過遙操作模式實(shí)現(xiàn)遠(yuǎn)程控制。Shadow靈巧手可以通過遙操作系統(tǒng),實(shí)時(shí)模擬人手運(yùn)動,從而實(shí)現(xiàn)對機(jī)械手的遠(yuǎn)程控制,完成疊杯子、旋轉(zhuǎn)魔方等精細(xì)動作。技術(shù)層面來看,遙操作實(shí)現(xiàn)依賴于:1)Shadow靈巧手內(nèi)置了129個(gè)傳感器,可以對周圍環(huán)境及自身狀態(tài)實(shí)現(xiàn)更加精確的感知;2)靈巧手共有20個(gè)電機(jī)驅(qū)動,4個(gè)欠驅(qū)動(欠驅(qū)動系統(tǒng)是指系統(tǒng)的獨(dú)立控制變量個(gè)數(shù)小于系統(tǒng)自由度個(gè)數(shù)的一類非線性系統(tǒng)),24個(gè)自由度都有與人類相近的運(yùn)動范圍,可以實(shí)現(xiàn)對人手動作的模擬;3)在觸覺手套的幫助下,能夠?qū)㈧`巧手受到的力反饋回來,反而幫助操作者掌握力的大小、方向和距離。資料來源:ShadowRobot官網(wǎng)、華泰研究資料來源:ShadowRobot官網(wǎng)、華泰研究Optimus機(jī)械手:仿生學(xué)設(shè)計(jì)賦予指關(guān)節(jié)高靈活度Optimus機(jī)械手采用仿生學(xué)設(shè)計(jì)模擬人手。人手能以每秒300度的速度移動,擁有成千上萬的觸覺傳感器。特斯拉機(jī)械手的設(shè)計(jì)靈感來自于生物學(xué),和人手一樣同樣使用五個(gè)手指來驅(qū)動,既可以完成大口徑物體抓取,同時(shí)也能滿足抓取精巧物體的需求。Optimus每只手都有11個(gè)自由度,其中拇指就擁有2個(gè)自由度,這些自由度由6個(gè)專門的執(zhí)行機(jī)構(gòu)派生而來。Optimus的手指是由金屬肌腱驅(qū)動的,兼?zhèn)潇`活與堅(jiān)固的特性,能夠完成大孔徑的力量抓取,同時(shí)也優(yōu)化了抓取小、薄和精致物體的精度。資料來源:特斯拉官網(wǎng)、華泰研究基于精密設(shè)計(jì),Optimus能夠完成多種復(fù)雜任務(wù)?;诜律鷮W(xué)設(shè)計(jì)思想,Optimus相較于傳統(tǒng)人形機(jī)器人,能夠?qū)崿F(xiàn)更多需要人手完成的精細(xì)化工作,例如在辦公室澆水、在工廠搬運(yùn)盒子與零部件等等。其次,特斯拉機(jī)械手還有“讓手適應(yīng)所抓物體的復(fù)雜機(jī)制”,使得Optimus不必打開手中馬達(dá)就能實(shí)現(xiàn)抓握和運(yùn)輸物體。最后,特斯拉通過對人體動作進(jìn)行捕捉后進(jìn)行可視化處理,對軀干的位置進(jìn)行分析,映射到Optimus身上,實(shí)現(xiàn)動作細(xì)節(jié)的擬人化。資料來源:特斯拉官網(wǎng)、華泰研究資料來源:特斯拉官網(wǎng)、華泰研究對比角度一:驅(qū)動方式目前主流機(jī)械手均采用電機(jī)驅(qū)動,Optimus或?qū)⒉捎每招谋姍C(jī)。一般來說,機(jī)械手主要包括液壓驅(qū)動、氣壓驅(qū)動及電機(jī)驅(qū)動三種。液壓末端執(zhí)行器調(diào)速方便,但壓力較大,系統(tǒng)成本高,維護(hù)較麻煩;氣動末端執(zhí)行器成本較低,但氣壓的不穩(wěn)定輸出可能導(dǎo)致加持力度不好掌控;電動末端執(zhí)行器用電機(jī)替代氣源、過濾網(wǎng)、電磁閥等組件,結(jié)構(gòu)性能更優(yōu)。因此,目前行業(yè)內(nèi)機(jī)械手驅(qū)動方案仍然以電機(jī)驅(qū)動為主,其中:1)六軸機(jī)器人采用六個(gè)伺服電機(jī)直接通過諧波減速器、同步帶輪等驅(qū)動六個(gè)關(guān)節(jié)軸的旋轉(zhuǎn),其中關(guān)節(jié)一至關(guān)節(jié)四的驅(qū)動電機(jī)一般為空心結(jié)構(gòu),方便管線從中穿過;2)Shadow靈巧手擁有24個(gè)自由度,其中20個(gè)由直流電機(jī)驅(qū)動,4個(gè)欠驅(qū)動(欠驅(qū)動系統(tǒng)是指系統(tǒng)的獨(dú)立控制變量個(gè)數(shù)小于系統(tǒng)自由度個(gè)數(shù)的一類非線性系統(tǒng));3)Optimus每只手都有11個(gè)自由度,由6個(gè)專門的執(zhí)行機(jī)構(gòu)派生而來。考慮到Optimus機(jī)械手尺寸、功率、成本等多重限制因素,我們預(yù)計(jì)其或?qū)⒉捎每招谋姍C(jī)作為主要的電機(jī)驅(qū)動方案。液壓驅(qū)動氣壓驅(qū)動電機(jī)驅(qū)動優(yōu)勢調(diào)速方便成本較低結(jié)構(gòu)簡單、性能穩(wěn)定劣勢成本高、維護(hù)麻煩氣壓穩(wěn)定性差功率較低資料來源:DEKA官網(wǎng)、華泰研究自由度特斯拉機(jī)械手的自由度仍有提升空間。在機(jī)器人領(lǐng)域,自由度是指根據(jù)機(jī)械原理,特定機(jī)構(gòu)具有確定運(yùn)動時(shí)所必須給定的獨(dú)立運(yùn)動參數(shù)的數(shù)目。如果一個(gè)構(gòu)件組合體的自由度F>0,他就可以成為一個(gè)機(jī)構(gòu),即表明各構(gòu)件間可有相對運(yùn)動;如果F=0,則它將是一個(gè)結(jié)構(gòu),退化為一個(gè)構(gòu)件。因此,自由度的數(shù)量直接決定了機(jī)械手的靈活度,自由度越高則機(jī)械手臂能完成的任務(wù)越精密、復(fù)雜。對比主流方案來看,特斯拉Optimus每只手有11個(gè)自由度,較六軸工業(yè)機(jī)器人的6個(gè)自由度而言,具備更加靈活的運(yùn)動能力;但相較Shadow靈巧手最高24個(gè)自由度而言,Optimus仍存在較大提升空間。我們認(rèn)為,特斯拉機(jī)械手仍處于第一代版本,而有限的自由度會限制機(jī)器人執(zhí)行更加精巧的工作內(nèi)容,考慮到未來Optimus替代洗衣、做飯等人類勞動的愿景,機(jī)械手自由度有望隨著版本迭代逐步遞增。概述特斯拉Optimus六軸機(jī)器人靈巧手靈巧手精簡版靈巧手額外精簡版靈巧手超精簡版手指數(shù)4+1(拇指)04+1(拇指)3+1(拇指)2+1(拇指)1+1(拇指)關(guān)節(jié)數(shù)6248自由度(DOF)6207資料來源:特斯拉官網(wǎng)、ShadowRobot官網(wǎng)、華泰研究資料來源:特斯拉官網(wǎng)、ShadowRobot官網(wǎng)、華泰研究對比角度三:單手抓力Optimus單手抓力表現(xiàn)出色,或?qū)?yīng)用于搬運(yùn)場景。對比機(jī)械手抓力來看:1)據(jù)Tesla官網(wǎng),Optimus單手抓力約20LBS(即9.1kg);2)據(jù)ShadowRobot官網(wǎng),靈巧手最大負(fù)載約5kg;3)六軸機(jī)器人的有效負(fù)載一般在10kg以內(nèi),以庫卡CYBERTECHnanoARC為例,其有效負(fù)載約為6~8kg?;诖?,我們認(rèn)為特斯拉機(jī)械手相較目前主流方案具備較好抓力表現(xiàn),有望率先應(yīng)用于需要重復(fù)搬運(yùn)的工作場景。此外,考慮到Optimus具備較好的靈敏度表現(xiàn),適用場景有望進(jìn)一步拓寬。Optimus機(jī)械手迭代潛力較大。總結(jié)來看,Optimus機(jī)械手目前主要采用電機(jī)驅(qū)動方案,抓力表現(xiàn)較同業(yè)競品有一定優(yōu)勢,但自由度仍有提升空間??紤]到:1)Optimus初代版本就已經(jīng)能夠?qū)崿F(xiàn)辦公室澆花、工廠特定線路搬運(yùn)等特定場景任務(wù);2)一輛汽車有上千萬自由度,特斯拉有望將電動車經(jīng)驗(yàn)移植到機(jī)器人,實(shí)現(xiàn)硬件迭代;3)Optimus從2022年4月邁出第一步至今,經(jīng)過不到6個(gè)月的AI仿真訓(xùn)練,已經(jīng)能實(shí)現(xiàn)直立行走、搬運(yùn)、揮手等基本功能,AI能力加持有望幫助機(jī)械手強(qiáng)化運(yùn)動能力。因此,我們認(rèn)為Optimus機(jī)械手具備較大迭代潛力,未來有望實(shí)現(xiàn)對更多人力勞動場景的替代。視覺導(dǎo)航系統(tǒng):機(jī)器人智能化的第一步波士頓動力:Altas采用RGB攝像頭+TOF深度傳感+激光雷達(dá)方案使用實(shí)時(shí)感知方案,通過感知算法規(guī)劃行動和路徑。目前,最新版的Atlas已經(jīng)可以通過感知算法去“看”環(huán)境,按照實(shí)時(shí)數(shù)據(jù)實(shí)現(xiàn)自主規(guī)劃行動。視覺感知上,Atlas利用頭部的RGB攝像頭和TOF深度傳感器獲取環(huán)境信息,TOF深度傳感器以每秒15幀的速度生成環(huán)境的點(diǎn)云(pointclouds),Atlas的感知軟件使用多平面分割的算法從點(diǎn)云中提取平面,并在三維向量空間構(gòu)建出目標(biāo)對象的模型。獲取模型后,Atlas通過MPC(模型預(yù)測控制器)分析出最佳行動規(guī)劃。此外,Atlas還配備了激光雷達(dá)和三維感應(yīng)器,可以讓其避開障礙物,輔助導(dǎo)航。下圖顯示了Atlas建立的模型、預(yù)測的行動軌跡,左上角是相機(jī)拍攝的紅外圖像,主圖像中的白點(diǎn)形成點(diǎn)云,橙色輪廓標(biāo)記了障礙物檢測到的矩形面,這些矩形面將會被傳感器持續(xù)跟蹤,幫助Atlas完成行為設(shè)置。資料來源:波士頓動力官網(wǎng)、華泰研究依靠姿態(tài)傳感器實(shí)現(xiàn)平衡感知、控制姿態(tài)。除視覺感知外,Atlas人型機(jī)器人還需要保持身體平衡,完成行走、跳躍、反轉(zhuǎn)等動作,因此需要依靠身體內(nèi)部以及腿部的傳感器。人類的平衡主要依靠小腦,而Atlas則需要通過分布在其軀干的陀螺儀、加速度計(jì)來實(shí)現(xiàn)平衡感知。Atlas通過姿態(tài)傳感器獲取各部位的姿態(tài)數(shù)據(jù),整理信息上傳至中央處理器,通過計(jì)算處理找到應(yīng)對策略并傳遞給軀干,從而獲取平衡、控制姿態(tài)。優(yōu)必選:Walker以U-SLAM技術(shù)為核心搭建導(dǎo)航系統(tǒng)WalkerX搭載力覺、視覺、環(huán)境和人體識別等全方位的感知系統(tǒng)。在力覺方面,機(jī)器人搭載力矩傳感器、高精度慣導(dǎo)傳感器,可以實(shí)現(xiàn)平穩(wěn)快速地類人行走、手眼協(xié)調(diào)操作。在視覺方面,Walker搭載激光雷達(dá)、RGBD攝像頭和四目立體視覺,依托U-SLAM視覺導(dǎo)航自主路徑規(guī)劃,實(shí)現(xiàn)動態(tài)場景下全局最優(yōu)路徑自主導(dǎo)航。U-SLAM技術(shù)是優(yōu)必選自研的基于三維視覺的定位導(dǎo)航系統(tǒng),其系統(tǒng)分為建圖、重定位、定位和導(dǎo)航四大技術(shù),據(jù)公司官網(wǎng)數(shù)據(jù),WalkerX已經(jīng)實(shí)現(xiàn)定位精度10cm,導(dǎo)航精度20cm,精定位精度1cm。在環(huán)境和人體識別方面,基于深度學(xué)習(xí)的物體檢測、人臉識別算法等技術(shù),可以在復(fù)雜環(huán)境中實(shí)現(xiàn)人臉識別、物體識別和場景識別,為其進(jìn)行交互和操作提供了穩(wěn)定的外部信息。資料來源:優(yōu)必選官網(wǎng)、華泰研究Optimus:占用神經(jīng)網(wǎng)絡(luò)模型有望帶來強(qiáng)大感知能力特斯拉將車端感知方案移植到Optimus。Optimus采用與特斯拉汽車類似的視覺方案,包括自動駕駛攝像頭、屏幕顯示和自動駕駛計(jì)算機(jī)。Optimus采用多攝像頭解決方案,包括左柱式、魚眼式和右柱式攝像頭,并基于3D占用、全景分割和YUV以及利用合成等方法實(shí)現(xiàn)世界視圖渲染、體積深度渲染、視覺導(dǎo)航等能力。不同于其他機(jī)器人導(dǎo)航方案,特斯拉采用的是純視覺技術(shù)路線,即在神經(jīng)網(wǎng)絡(luò)模型的主導(dǎo)下,攝像頭承擔(dān)了感知方面的大部分工作。Tesla車端感知是基于視覺主導(dǎo)的純視覺方案。根據(jù)2021年8月TeslaAIDay展示,特斯拉最新的感知方案完全摒棄了激光雷達(dá)、毫米波雷達(dá)等非攝像頭傳感器,僅采用攝像頭進(jìn)行感知。其自動駕駛視覺感知方案效仿人類視覺系統(tǒng)原理,采用8個(gè)攝像頭分布在車體四周,可實(shí)現(xiàn)360度視野范圍。其中,前視攝像頭為:窄視野攝像頭(250米)適用高速行駛場景、主視野攝像頭(150米)覆蓋大部分交通場景、寬視野攝像頭(60米)適用城市街道、低速緩行場景、兩個(gè)側(cè)方前視攝像頭(80米)適用視野受限的交叉路口、高速公路前方車輛突然并道場景。其他3個(gè)攝像頭面向汽車的側(cè)面和后部:后視攝像頭(50米)適用變道和匯入高速公路場景、側(cè)方后視攝像頭(100米)適用復(fù)雜泊車場景。資料來源:Tesla官網(wǎng)、華泰研究OccupancyNetworks是特斯拉視覺算法的核心。OccupancyNetworks及占用網(wǎng)絡(luò)模型,是特斯拉HydraNetsAI模型的改進(jìn)版本。由于基于純視覺的導(dǎo)航系統(tǒng)對AI數(shù)據(jù)集的全面性要求較高,且對3D世界的縱深理解有限,因此可能存在物體檢測失敗的風(fēng)險(xiǎn)。特斯拉占用神經(jīng)網(wǎng)絡(luò)模型通過將3維世界劃分為網(wǎng)格單元,定義單元的占用狀態(tài),用“占用”替代傳統(tǒng)檢測過程,從而優(yōu)化導(dǎo)航能力。對比鳥瞰圖,OccupancyNetworks網(wǎng)絡(luò)呈現(xiàn)出來的是一個(gè)3D場景,可以看到更加真實(shí)的物體3D體積。資料來源:特斯拉官網(wǎng)、華泰研究資料來源:特斯拉官網(wǎng)、華泰研究純視覺方案獨(dú)樹一幟,期待OccupancyNetworks帶來軟件快速迭代。對比來看,目前主流機(jī)器人視覺導(dǎo)航系統(tǒng)方案中,只有特斯拉采用純視覺路線,其他廠商如波士頓動力采用RGB攝像頭+TOF深度傳感+激光雷達(dá)方案、優(yōu)必選采用激光雷達(dá)+RGBD攝像頭+四目立體視覺方案。我們認(rèn)為,純視覺方案由于減少了激光雷達(dá)等硬件投入,有望進(jìn)一步降低導(dǎo)musOptimus加持。特斯拉研發(fā)人員通過運(yùn)動計(jì)劃和控制堆棧,生成機(jī)器人運(yùn)動學(xué)模型,然后將所需路徑生成底層平臺,讓整個(gè)系統(tǒng)參考其軌跡進(jìn)行訓(xùn)練。我們認(rèn)為,在占用神經(jīng)網(wǎng)絡(luò)模型、運(yùn)動模擬等AI算法加持下,Optimus有望實(shí)現(xiàn)軟件端快速迭代,視覺方案有望朝著更加精確、智能的方向演進(jìn)。公司代碼TSLAUS未上市未上市未上市公司簡稱特斯拉波士頓動力ShadowRobot優(yōu)必選資料來源:Bloomberg、華泰研究提示技術(shù)進(jìn)步不及預(yù)期。人形機(jī)器人涉及軟硬件等多方面技術(shù),橫跨多個(gè)細(xì)分行業(yè)及領(lǐng)域,若相關(guān)技術(shù)進(jìn)步不及預(yù)期,可能導(dǎo)致人形機(jī)器人的功能無法達(dá)到預(yù)想的水平,產(chǎn)業(yè)發(fā)展速度可能受到影響。軟件迭代不及預(yù)期。人形機(jī)器人手部控制系統(tǒng)、導(dǎo)航系統(tǒng)等軟件需要進(jìn)行持續(xù)迭代,才能滿足不斷深化的機(jī)器人應(yīng)用需求。若軟件迭代速度低于預(yù)期,或?qū)?dǎo)致機(jī)器人商業(yè)化應(yīng)用進(jìn)展受到影響。本研報(bào)中涉及到的公司、個(gè)股內(nèi)容系對其客觀公開信息的整理,并不代表本研究團(tuán)隊(duì)對該公司、該股票的推薦或覆蓋。分析師聲明本人,謝春生,茲證明本報(bào)告所表達(dá)的觀點(diǎn)準(zhǔn)確地反映了分析師對標(biāo)的證券或發(fā)行人的個(gè)人意見;彼以往、現(xiàn)在或未來并無就其研究報(bào)告所提供的具體建議或所表迖的意見直接或間接收取任何報(bào)酬。一般聲明及披露本報(bào)告由華泰證券股份有限公司(已具備中國證監(jiān)會批準(zhǔn)的證券投資咨詢業(yè)務(wù)資格,以下簡稱“本公司”)制作。本報(bào)告所載資料是僅供接收人的嚴(yán)格保密資料。本報(bào)告僅供本公司及其客戶和其關(guān)聯(lián)機(jī)構(gòu)使用。本公司不因接收人收到本報(bào)告而視其為客戶。本報(bào)告基于本公司認(rèn)為可靠的、已公開的信息編制,但本公司及其關(guān)聯(lián)機(jī)構(gòu)(以下統(tǒng)稱為“華泰”)對該等信息的準(zhǔn)確性及完整性不作任何保證。本報(bào)告所載的意見、評估及預(yù)測僅反映報(bào)告發(fā)布當(dāng)日的觀點(diǎn)和判斷。在不同時(shí)期,華泰可能會發(fā)出與本報(bào)告所載意見、評估及預(yù)測不一致的研究報(bào)告。同時(shí),本報(bào)告所指的證券或投資標(biāo)的的價(jià)格、價(jià)值及投資收入可能會波動。以往表現(xiàn)并不能指引未來,未來回報(bào)并不能得到保證,并存在損失本金的可能。華泰不保證本報(bào)告所含信息保持在最新狀態(tài)。華泰對本報(bào)告所含信息可在不發(fā)出通知的情形下做出修改,投資者應(yīng)當(dāng)自行關(guān)注相應(yīng)的更新或修改。本公司不是FINRA的注冊會員,其研究分析師亦沒有注冊為FINRA的研究分析師/不具有FINRA分析師的注冊資華泰力求報(bào)告內(nèi)容客觀、公正,但本報(bào)告所載的觀點(diǎn)、結(jié)論和建議僅供參考,不構(gòu)成購買或出售所述證券的要約或招攬。該等觀點(diǎn)、建議并未考慮到個(gè)別投資者的具體投資目的、財(cái)務(wù)狀況以及特定需求,在任何時(shí)候均不構(gòu)成對客戶私人投資建議。投資者應(yīng)當(dāng)充分考慮自身特定狀況,并完整理解和使用本報(bào)告內(nèi)容,不應(yīng)視本報(bào)告為做出投資決策的唯一因素。對依據(jù)或者使用本報(bào)告所造成的一切后果,華泰及作者均不承擔(dān)任何法律責(zé)任。任何形式的分享證券投資收益或者分擔(dān)證券投資損失的書面或口頭承諾均為無效。除非另行說明,本報(bào)告中所引用的關(guān)于業(yè)績的數(shù)據(jù)代表過往表現(xiàn),過往的業(yè)績表現(xiàn)不應(yīng)作為日后回報(bào)的預(yù)示。華泰不承諾也不保證任何預(yù)示的回報(bào)會得以實(shí)現(xiàn),分析中所做的預(yù)測可能是基于相應(yīng)的假設(shè),任何假設(shè)的變化可能會顯著影響所預(yù)測的回報(bào)。華泰及作者在自身所知情的范圍內(nèi),與本報(bào)告所指的證券或投資標(biāo)的不存在法律禁止的利害關(guān)系。在法律許可的情況下,華泰可能會持有報(bào)告中提到的公司所發(fā)行的證券頭寸并進(jìn)行交易,為該公司提供投資銀行、財(cái)務(wù)顧問或者金融產(chǎn)品等相關(guān)服務(wù)或向該公司招攬業(yè)務(wù)。華泰的銷售人員、交易人員或其他專業(yè)人士可能會依據(jù)不同假設(shè)和標(biāo)準(zhǔn)、采用不同的分析方法而口頭或書面發(fā)表與本報(bào)告意見及建議不一致的市場評論和/或交易觀點(diǎn)。華泰沒有將此意見及建議向報(bào)告所有接收者進(jìn)行更新的義務(wù)。華泰的資產(chǎn)管理部門、自營部門以及其他投資業(yè)務(wù)部門可能獨(dú)立做出與本報(bào)告中的意見或建議不一致的投資決策。投資者應(yīng)當(dāng)考慮到華泰及/或其相關(guān)人員可能存在影響本報(bào)告觀點(diǎn)客觀性的潛在利益沖突。投資者請勿將本報(bào)告視為投資或其他決定的唯一信賴依據(jù)。有關(guān)該方面的具體披露請參照本報(bào)告尾部。本報(bào)告并非意圖發(fā)送、發(fā)布給在當(dāng)?shù)胤苫虮O(jiān)管規(guī)則下不允許向其發(fā)送、發(fā)布的機(jī)構(gòu)或人員,也并非意圖發(fā)送、發(fā)布給因可得到、使用本報(bào)告的行為而使華泰違反或受制于當(dāng)?shù)胤苫虮O(jiān)管規(guī)則的機(jī)構(gòu)或人員。本報(bào)告版權(quán)僅為本公司所有。未經(jīng)本公司書面許可,任何機(jī)構(gòu)或個(gè)人不得以翻版、復(fù)制、發(fā)表、引用或再次分發(fā)他人(無論整份或部分)等任何形式侵犯本公司版權(quán)。如征得本公司同意進(jìn)行引用、刊發(fā)的,需在允許的范圍內(nèi)使用,并需在使用前獲取獨(dú)立的法律意見,以確定該引用、刊發(fā)符合當(dāng)?shù)剡m用法規(guī)的要求,同時(shí)注明出處為“華泰證券研究所”,且不得對本報(bào)告進(jìn)行任何有悖原意的引用、刪節(jié)和修改。本公司保留追究相關(guān)責(zé)任的權(quán)利。所有本報(bào)告中使用的商標(biāo)、服務(wù)標(biāo)記及標(biāo)記均為本公司的商標(biāo)、服務(wù)標(biāo)記及標(biāo)記。中國香港本報(bào)告由華泰證券股份有限公司制作,在香港由華泰金融控股(香港)有限公司向符合《證券及期貨條例》及其附屬法律規(guī)定的機(jī)構(gòu)投資者和專業(yè)投資者的客戶進(jìn)行分發(fā)。華泰金融控股(香港)有限公司受香港證券及期貨事務(wù)監(jiān)察委員會監(jiān)管,是華泰國際金融控股有限公司的全資子公司,后者為華泰證券股份有限公司的全資子公司。在香港獲得本報(bào)告的人員若有任何有關(guān)本報(bào)告的問題,請與華泰金融控股(香港)有限公司聯(lián)系。香港-重要監(jiān)管披露?華泰金融控股(香港)有限公司的雇員或其關(guān)聯(lián)人士沒有擔(dān)任本報(bào)告中提及的公司或發(fā)行人的高級人員。?有關(guān)重要的披露信息,請參華泰金融控股(香港)有限公司的網(wǎng)頁.hk/stock_disclosure其他信息請參見下方“美國-重要監(jiān)管披露”。美國在美國本報(bào)告由華泰證券(美國)有限公司向符合美國監(jiān)管規(guī)定的機(jī)構(gòu)投資者進(jìn)行發(fā)表與分發(fā)。華泰證券(美國)有限公司是美國注冊經(jīng)紀(jì)商和美國金融業(yè)監(jiān)管局(FINRA)的注冊會員。對于其在美國分發(fā)的研究報(bào)告,華泰證券(美國)有限公司根據(jù)《1934年證券交易法》(修訂版)第15a-6條規(guī)定以及美國證券交易委員會人員解釋,對本研究報(bào)告內(nèi)容負(fù)責(zé)。華泰證券(美國)有限公司聯(lián)營公司的分析師不具有美國金融監(jiān)管(FINRA)分析師的注冊資格,可能不屬于華泰證券(美國)有限公司的關(guān)聯(lián)人

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論