版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分產(chǎn)業(yè)深度2023.05.192023.05.19AI大模型賦能人形機(jī)器人,邁向通用人工智能的一大步摘要:作者:肖群稀電話格證書編號(hào):S0880522120001作者:鮑雁辛電話箱:baoyanxin@資格證書編號(hào):S0880513070005AI大模型賦能人形機(jī)器人,邁向通用人工智能的一大步摘要:作者:肖群稀電話格證書編號(hào):S0880522120001作者:鮑雁辛電話箱:baoyanxin@資格證書編號(hào):S0880513070005解、多語(yǔ)種識(shí)別、多輪對(duì)話、情緒識(shí)別、模糊語(yǔ)義識(shí)別等通用語(yǔ)言任務(wù)上,C備品類、算法、實(shí)時(shí)算力要求更高。4)運(yùn)動(dòng)控制:類似于工業(yè)機(jī)器人產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分2of27 33 3 4 8 8 9 3.人形,讓機(jī)器人的運(yùn)動(dòng)執(zhí)行更加通用 3.1.1.電驅(qū)成本低、易于維護(hù)、控制精度高,商業(yè)化潛力高 3.2.1.波士頓動(dòng)力Atlas:深度相機(jī)+ 3.2.2.特斯拉Optimus: 3.3.運(yùn)動(dòng)控制:尚未形成通用的控制器解決方案 3.3.1.運(yùn)動(dòng)控制算法:思路相似,均為離線行為庫(kù)和實(shí)時(shí)調(diào)整.223.3.2.運(yùn)動(dòng)控制器:多為自主設(shè)計(jì),不同廠商需求差異大 4.投資結(jié)論及產(chǎn)業(yè)鏈?zhǔn)崂? 產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分3of271.通用——解決機(jī)器人高需求和低滲透率的矛盾到通用服務(wù)機(jī)器人商業(yè)化落地的前提是產(chǎn)品能提供真實(shí)價(jià)值,真實(shí)價(jià)值的判斷在于機(jī)器人我們認(rèn)為原因在于:目前大多數(shù)服務(wù)機(jī)器人都或多或少的存在場(chǎng)景適應(yīng)性的問(wèn)題,如無(wú)法適應(yīng)環(huán)境變化,環(huán)境變化后,用戶無(wú)法通過(guò)簡(jiǎn)單操作實(shí)現(xiàn)場(chǎng)景適配;智能化與,且當(dāng)需要變更時(shí),仍需現(xiàn)場(chǎng)部署工程師進(jìn)行操作。以商超場(chǎng)景為例:發(fā)生碰撞、跌落、無(wú)法靠近作業(yè)。對(duì)于依賴視覺傳感器的機(jī)器人來(lái)說(shuō),要在普通光線、黑暗、過(guò)曝等光照條件都能穩(wěn)定運(yùn)行難度較大。以上問(wèn)題在工業(yè)機(jī)器人領(lǐng)域同樣存在,影響了工業(yè)機(jī)器人滲透率的提升,直到協(xié)作機(jī)器人的出現(xiàn)。2022年全球協(xié)作機(jī)器人市場(chǎng)規(guī)模89.5億元人民幣,預(yù)計(jì)2022~2028年市場(chǎng)規(guī)模將以22.05%的增速達(dá)到30協(xié)作機(jī)器人也可以被認(rèn)為是服務(wù)機(jī)器人,因?yàn)樗麄冎荚谂c人類并肩作戰(zhàn)。傳統(tǒng)機(jī)器人在柵欄后與人分開作業(yè),完成的工作也有限,例如焊接、噴涂、吊裝等。協(xié)作機(jī)器人更靈活,更智能,更容易合作,更具有適應(yīng)能力,使汽車、電子等制造行業(yè)能夠?qū)⒆詣?dòng)化擴(kuò)展到最終產(chǎn)品組裝,完成任務(wù)(例如拋光和施涂涂層)以及質(zhì)量1.2.如何讓機(jī)器人更加通用?使機(jī)器人更加通用,需要機(jī)器人的感知能力、思考和決策能力、行動(dòng)執(zhí)行能力的全面提升。我們認(rèn)為GPT(預(yù)訓(xùn)練大預(yù)言模導(dǎo)航是主流應(yīng)用方案。計(jì)算機(jī)視覺的發(fā)展經(jīng)歷了基于以特征描述子代表的傳統(tǒng)視覺方法、以CNN卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)技術(shù),目前于研究探索階段,人形機(jī)器人的場(chǎng)景相對(duì)工業(yè)機(jī)器人更通用、更復(fù)雜,視覺大模型大模型的強(qiáng)擬合能力使得人形機(jī)器人在進(jìn)行目標(biāo)識(shí)別、避障、三維重建、語(yǔ)義分割等任務(wù)時(shí)具備更高的精確度;另一方面,大模型解決了深度學(xué)習(xí)技術(shù)過(guò)分依賴單一任務(wù)數(shù)據(jù)分布,場(chǎng)景泛化效果不佳的問(wèn)題,通用視覺大模型通過(guò)大量數(shù)據(jù)學(xué)到更多的通用知識(shí),并遷移到下游任務(wù)中,基于海量數(shù)據(jù)獲得的預(yù)訓(xùn)練模型具有較好的知產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分4of27景中應(yīng)用,即使是機(jī)器人抓取,基于計(jì)算機(jī)視覺,仍然是在限定場(chǎng)景中,算法僅用于識(shí)別物體,如何做、做什么仍需要人的定義。要讓機(jī)器人通用,叫他就知道去拿水壺,接水,然后澆花,這是需要常識(shí)才能完成的事情。如何能讓機(jī)器人擁有常識(shí)?在大模型出現(xiàn)之前,這個(gè)問(wèn)題幾乎是無(wú)解的。大模型讓機(jī)器人可以擁人類工具和環(huán)境的適應(yīng)性,不用再為了機(jī)器人而造工具。執(zhí)行能力讓機(jī)器人的執(zhí)行能力更加通用。機(jī)器人執(zhí)行任務(wù)時(shí)所處的環(huán)境是按照人類的體型建造起來(lái)的:建筑、道路、設(shè)施、工具等,這個(gè)世界是為了方便人類這種人形生物才這樣設(shè)計(jì)。如果出現(xiàn)了某種新形態(tài)的機(jī)器人,人們就必須重新設(shè)計(jì)一套機(jī)器人適應(yīng)的全新環(huán)境。設(shè)計(jì)在某個(gè)特定范圍內(nèi)執(zhí)行任務(wù)的機(jī)器人相對(duì)容易,如果想要提高機(jī)器人的通用性,就必須選擇可以作為分身的人形機(jī)器人。此外,人類與人形機(jī)器人更容易有情感上的交流,人形機(jī)器人會(huì)讓人感到親近。日本機(jī)器人專家森昌弘的假設(shè)指出:由于機(jī)器人與人類在外表、動(dòng)作上相似,所以人類亦會(huì)對(duì)機(jī)器人產(chǎn)生正面的情感。1.3.人形機(jī)器人進(jìn)入商業(yè)化前夜形機(jī)器人的商業(yè)形態(tài)。我們對(duì)人形機(jī)器人發(fā)展過(guò)程中有代表性的產(chǎn)品進(jìn)行了梳理:團(tuán)隊(duì)研發(fā)出世界上第一臺(tái)真人大小的人形智能機(jī)器人——WABOT-1。該機(jī)器人有產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分5of27各種人類肢體動(dòng)作之外,還可以預(yù)先設(shè)定動(dòng)作,并依據(jù)人類的聲音、手勢(shì)等指令,數(shù)據(jù)來(lái)源:樂(lè)博機(jī)器人、國(guó)泰君安證券研究數(shù)據(jù)來(lái)源:樂(lè)博機(jī)器人、國(guó)泰君安證券研究頭與國(guó)立先進(jìn)工業(yè)科學(xué)技術(shù)研究院(AIST)和川崎重工株式會(huì)社共同研發(fā)的通用家數(shù)據(jù)來(lái)源:樂(lè)博機(jī)器人、國(guó)泰君安證券研究產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分6of27波士頓動(dòng)力最早因研發(fā)的BigDog而被世界聞名,機(jī)器人到人形機(jī)器人,有著明顯的軍事化應(yīng)用的路線特征。波士頓動(dòng)力是一家典型的技術(shù)驅(qū)動(dòng)的公司,從機(jī)械結(jié)構(gòu)、算法步態(tài)控制、動(dòng)力系統(tǒng)耗能等方面對(duì)機(jī)器人持續(xù)迭代更新,核心在于發(fā)展腿式機(jī)器人以適應(yīng)不同環(huán)境的使用,技術(shù)關(guān)鍵在于動(dòng)力數(shù)據(jù)來(lái)源:公司官網(wǎng)、國(guó)泰君安證券研究列是AgilityRobotics公司在物流領(lǐng)域商業(yè)化的嘗試,公司是從俄勒岡州立大學(xué)(OSU)拆分出來(lái)的機(jī)器人公司,致力于研發(fā)和制造雙足機(jī)器人,前后開發(fā)了數(shù)據(jù)來(lái)源:Aleteia、國(guó)泰君安證券研究式機(jī)器人的首次嘗試。2022年8月,小種人類語(yǔ)義情緒,分辨85種環(huán)境語(yǔ)義;搭產(chǎn)業(yè)深度數(shù)據(jù)來(lái)源:優(yōu)必選、國(guó)泰君安證券研究數(shù)據(jù)來(lái)源:TeslaInvestorday2023、國(guó)泰君安證券研究年面世。索菲婭皮膚由Frubber仿生材料制成,基于語(yǔ)音識(shí)別、計(jì)算機(jī)視覺技術(shù),后,能對(duì)著鏡子眨眼、抿嘴、皺眉、微笑。阿梅卡能夠自由進(jìn)行幾十種仿人類的肢體運(yùn)動(dòng),被認(rèn)為是“世界上最逼真機(jī)器人”。數(shù)據(jù)來(lái)源:Aleteia、國(guó)泰君安證券研究數(shù)據(jù)來(lái)源:視覺中國(guó)、國(guó)泰君安證券研究請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分7of27產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分8of27我們選擇了7款有代表性的人形機(jī)器人,從驅(qū)動(dòng)、感知、控制器三個(gè)方面進(jìn)Atlas系列ICUB3WalkerX45kg48kg4041-部三枚攝像頭(魚眼+左+右)激光傳感外部計(jì)算機(jī)集群+總控板卡+DSP負(fù)-三臺(tái)計(jì)算機(jī)數(shù)據(jù)來(lái)源:本田官網(wǎng)、波士頓動(dòng)力官網(wǎng)、優(yōu)必選官網(wǎng)、Tesla官網(wǎng)、小米官網(wǎng)、軟銀官網(wǎng)、國(guó)泰君安證券研究2.AI大模型+人形機(jī)器人:給機(jī)器人提供常識(shí)2、GPT-3、GPT-4模型的出現(xiàn),模型的參數(shù)量級(jí)實(shí)現(xiàn)了遷移學(xué)習(xí)是預(yù)訓(xùn)練模型的主要思想,當(dāng)目標(biāo)場(chǎng)景數(shù)據(jù)不足時(shí),先在數(shù)據(jù)量大的公開場(chǎng)景中的小數(shù)據(jù)集進(jìn)行微調(diào),使模型達(dá)到要求的性能。預(yù)訓(xùn)練模型極大地減少了模產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分9of27數(shù)據(jù)來(lái)源:IBMDeveloper、國(guó)泰君安證券研究大模型的發(fā)展過(guò)程和趨勢(shì):從參數(shù)規(guī)模上看,大模型經(jīng)歷了從預(yù)訓(xùn)練模型、大規(guī)模從數(shù)據(jù)模態(tài)來(lái)看,大模型正在從文本、語(yǔ)音、視覺等單一模態(tài)大模型,向著多種模數(shù)據(jù)來(lái)源:百度、國(guó)泰君安證券研究感知、決策、控制閉環(huán),大大提升機(jī)器人的“智慧”程度:語(yǔ)言交互。例如,機(jī)器人可以通過(guò)ChatGPT來(lái)理解人類指令進(jìn)行相應(yīng)的動(dòng)作。自然語(yǔ)言是人類最通用的交互媒介,語(yǔ)音作為自然語(yǔ)言的載體將會(huì)是機(jī)器人擬人化的關(guān)鍵任務(wù)。盡管深度學(xué)習(xí)的出現(xiàn)已經(jīng)自然語(yǔ)言處理、語(yǔ)音生成技術(shù)為構(gòu)成模塊的語(yǔ)音交互技術(shù)推向相對(duì)成熟情況。語(yǔ)言大模型為機(jī)器人的自主語(yǔ)音交互難題提供了解決方現(xiàn)出了不亞于人類的理解力和語(yǔ)言生成能力。在以請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分10of27視覺:視覺大模型賦能人形機(jī)器人識(shí)別更精確,場(chǎng)景更通用。計(jì)算機(jī)視覺的發(fā)展經(jīng)歷了基于以特征描述子代表的傳統(tǒng)視覺方法、以CNN卷積神學(xué)習(xí)技術(shù),目前通用的視覺大模型正處于研究探索階段。一方面,大參數(shù)量模型的強(qiáng)擬合能力使得人形機(jī)器人在進(jìn)行目標(biāo)識(shí)別、避障、三維重建、語(yǔ)義分割等任務(wù)時(shí)具備更高的精確度;另一方面,通用大模型解決了過(guò)去以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)技術(shù)過(guò)分依賴單一任務(wù)數(shù)據(jù)分布,場(chǎng)景泛化效果不佳的問(wèn)題,通用視覺大模型通過(guò)大量數(shù)據(jù)學(xué)到更多的通用知識(shí),并遷移到下游任務(wù)中,基于海量數(shù)據(jù)獲得的預(yù)訓(xùn)練模型具有較好的知識(shí)完備性,大大提升場(chǎng)景泛化效果。人形機(jī)器人的場(chǎng)景相決策:通用語(yǔ)言、環(huán)境感知能力是自動(dòng)化決策的基礎(chǔ),多模態(tài)大模型契合人形機(jī)器人的決策需求。單一模態(tài)智能無(wú)法解決設(shè)計(jì)多模態(tài)信息的決策問(wèn)題,如“語(yǔ)音告知機(jī)器人去取桌子上綠色蘋果”的任務(wù)。多模態(tài)統(tǒng)一建模,目的是增強(qiáng)模型的跨模態(tài)語(yǔ)義對(duì)齊能力,使模型逐步標(biāo)準(zhǔn)化,使得機(jī)器人能綜合視覺、語(yǔ)音、文本多維度信息,實(shí)現(xiàn)各感官融合決策的能力?;诙嗄B(tài)的預(yù)訓(xùn)練大模型或?qū)⒊蔀槿斯ぶ悄芑A(chǔ)設(shè)施,增強(qiáng)機(jī)器人可完成任務(wù)的多樣性與通用性,讓其不只局限于文本和圖像等單個(gè)部分,而是多應(yīng)用相容,拓展單一智能為融合智能,使機(jī)器人能結(jié)合其感知到產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分11of27數(shù)據(jù)來(lái)源:北京大學(xué)多媒體信息研究室、國(guó)泰君安證券研究機(jī)器人的感知、決策、動(dòng)作形成閉環(huán),達(dá)到自我控制的目的。事實(shí)上,近來(lái)微軟團(tuán)隊(duì)已經(jīng)嘗試將ChatGPT應(yīng)用于機(jī)器人控制的場(chǎng)景中,通過(guò)的推動(dòng)下,機(jī)器人編程的門檻將會(huì)慢慢降低,最終實(shí)現(xiàn)自我編程、自我控制,并完2.3.OpenAI和微軟將大語(yǔ)言模型應(yīng)用于機(jī)器人機(jī)器人環(huán)節(jié)和事后經(jīng)驗(yàn)回訪基線實(shí)施,并用來(lái)訓(xùn)練在物理機(jī)器人上工作的模型。22數(shù)據(jù)來(lái)源:IBMDeveloper、國(guó)泰君安證券研究產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分12of27這項(xiàng)研究的目標(biāo)是觀察ChatGPT是否可以超越文本思考用,并在后端講高級(jí)函數(shù)庫(kù)鏈接到各個(gè)平臺(tái),場(chǎng)景和工具的現(xiàn)有庫(kù)和API。結(jié)果證對(duì)話系統(tǒng)中輸出相關(guān)操作,不需要生成代碼。這樣,人類可以實(shí)現(xiàn)無(wú)縫部署各種平人類在機(jī)器人pipeline中的任務(wù)主要是行設(shè)計(jì),并且應(yīng)該從機(jī)器人的控制?;蚋兄獛?kù)映射到現(xiàn)有的低層次具體實(shí)現(xiàn)。為高些函數(shù)可用。提示還可以包含有關(guān)任務(wù)約束的信息,或者Ch產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分13of27ChatGPT可以以zero-shot的方式解決簡(jiǎn)單的機(jī)器人任務(wù)。對(duì)于簡(jiǎn)單的法的大部分關(guān)鍵模塊,但需要人工反饋無(wú)人機(jī)朝向等信息。人工反饋高級(jí)的自然語(yǔ)在其“代碼“輸出中構(gòu)建感知-動(dòng)作循環(huán),實(shí)現(xiàn)估計(jì)相對(duì)物體角度、探索未知環(huán)境、輸出僅返回向前的運(yùn)動(dòng)距離和轉(zhuǎn)彎角度,實(shí)現(xiàn)了用“對(duì)話系統(tǒng)”指導(dǎo)機(jī)器人一步步產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分14of273.人形,讓機(jī)器人的運(yùn)動(dòng)執(zhí)行更加通用是為了讓機(jī)器人的執(zhí)行能力更加通用。機(jī)器人執(zhí)行任務(wù)時(shí)所處的環(huán)境是按照人類的體型建造起來(lái)的:建筑、道路、設(shè)施、工具等,這個(gè)世界是為了方便人類這種人形生物才這樣設(shè)計(jì)。如果出現(xiàn)了某種新形態(tài)的機(jī)器人,人們就必須重新設(shè)計(jì)一套機(jī)器人適應(yīng)的全新環(huán)境。設(shè)計(jì)在某個(gè)特定范圍內(nèi)執(zhí)行任務(wù)的機(jī)器人相對(duì)容易,如果想要提高機(jī)器人的通用性,就必須選擇可以作為分身的人形機(jī)器人。本章選擇兩個(gè)代表波士頓動(dòng)力Altas定位于技術(shù)的前瞻性研究,側(cè)重探索技術(shù)應(yīng)用的可能性而非商業(yè)化。從硬件架構(gòu)來(lái)看,Altas具備出色的動(dòng)頓動(dòng)力當(dāng)前主要考量因素,Altas項(xiàng)目更多作為一個(gè)研究平臺(tái)供研究者進(jìn)行學(xué)術(shù)試特斯拉Optimus發(fā)心于人形機(jī)器人的規(guī)?;?、商業(yè)化、標(biāo)準(zhǔn)化,商業(yè)化的目標(biāo)驅(qū)產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分15of27Altas200萬(wàn)美元的運(yùn)動(dòng)(跑酷、后空翻等)大電池組:52V、較低成本實(shí)現(xiàn),相對(duì)動(dòng)態(tài)性能數(shù)據(jù)來(lái)源:BostonDynamics、TeslaAIDay2022、國(guó)泰君安證券研究3.1.1.電驅(qū)成本低、易于維護(hù)、控制精度高,商業(yè)化潛力高比電氣驅(qū)動(dòng),液壓驅(qū)動(dòng)輸出力矩大、功率密度高和過(guò)載能力強(qiáng),因而能滿足波士頓時(shí)容易出現(xiàn)漏液等問(wèn)題、可維護(hù)性差。一方面,商用場(chǎng)景下高后空翻等)屬于非必要行為,另一方面,隨著電驅(qū)系統(tǒng)功率密度和響應(yīng)速度的不斷提升,我們認(rèn)為結(jié)合電驅(qū)成本低、易于維護(hù)且技術(shù)應(yīng)用成熟的優(yōu)勢(shì),基于電驅(qū)的人Atlas系列優(yōu)必選-WalkerX本田ASIMO液壓驅(qū)動(dòng)電機(jī)驅(qū)動(dòng)電機(jī)驅(qū)動(dòng)電機(jī)驅(qū)動(dòng)電機(jī)驅(qū)動(dòng)電機(jī)驅(qū)動(dòng)電機(jī)驅(qū)動(dòng)Atlas的液壓動(dòng)力源21個(gè)模組驅(qū)機(jī)+諧波減速+驅(qū)動(dòng)控14個(gè)旋轉(zhuǎn)執(zhí)行器、均由電機(jī)+減速器流檢測(cè)/扭力傳感數(shù)據(jù)來(lái)源:本田官網(wǎng)、波士頓動(dòng)力官網(wǎng)、優(yōu)必選官網(wǎng)、Tesla官網(wǎng)、小米官網(wǎng)、軟銀官網(wǎng)、國(guó)泰君安證券研究數(shù)據(jù)來(lái)源:Ofweek、國(guó)泰君安證券研究產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分16of273.1.2.波士頓動(dòng)力Atlas:采用“液壓驅(qū)動(dòng)”方案電液經(jīng)由流體管線連接至各液壓泵,可實(shí)現(xiàn)快速響應(yīng)和精確力控,其高瞬時(shí)功率密度的液壓驅(qū)動(dòng)器能支持機(jī)器人實(shí)現(xiàn)奔跑、跳躍、后空翻等復(fù)雜動(dòng)作,機(jī)器人的結(jié)構(gòu)數(shù)據(jù)來(lái)源:MOOG、國(guó)泰君安證券研究數(shù)據(jù)來(lái)源:BostonDynamics、國(guó)泰君安證券研究3.1.3.特斯拉Optimus:采用“電動(dòng)驅(qū)動(dòng)”節(jié)部分采用減速器/絲桿+伺服電機(jī)的傳動(dòng)方式,共計(jì)數(shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究數(shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究人,線性執(zhí)行器和微型伺服電機(jī)是人形機(jī)器人新需求,具體看:產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分17of27數(shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究-2*2=4-286數(shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究,以上均為國(guó)泰君安根據(jù)發(fā)布會(huì)信息隨著更多廠商的涌入,其執(zhí)行器方案可能存在差異,若線性執(zhí)行器被旋轉(zhuǎn)執(zhí)行器替--286數(shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究,以上均為國(guó)泰君安根據(jù)發(fā)布會(huì)信息產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分18of27行器空間利用率高、能提供較大的推動(dòng)力。我們猜測(cè),線性執(zhí)行器基于力矩電機(jī)結(jié)合行星滾柱絲杠的方案將應(yīng)用于線性執(zhí)行器關(guān)節(jié)(髖、膝、踝、肘、腕)中,預(yù)計(jì)2*2=4數(shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究,以上均為國(guó)泰君安根據(jù)發(fā)布會(huì)信息行星滾柱絲杠以其高承載、高剛度、長(zhǎng)壽命的特點(diǎn)或成為人形機(jī)器人線性執(zhí)行器的絲杠一體式伺服電動(dòng)缸。我們認(rèn)為下肢髖、膝、踝關(guān)節(jié)及上肢的肘關(guān)節(jié)的伺服電缸采用高承載、高剛度的行星滾柱絲杠作為傳動(dòng)裝置可能性比較大。行星滾柱絲杠結(jié)構(gòu)復(fù)雜、加工難度大因而成本很高,通過(guò)調(diào)整設(shè)計(jì)、工藝方案適配人形機(jī)器人的需數(shù)據(jù)來(lái)源:博特精工、國(guó)泰君安證券研究機(jī)械手:Optimus單手包括6個(gè)執(zhí)行器,可實(shí)現(xiàn)11個(gè)自的數(shù)目小于其自由度數(shù)目,因?yàn)闄C(jī)械手本身高自由度數(shù)目的特性,出于提高系統(tǒng)設(shè)計(jì)的集成性、緊湊性和降低成本、更出于簡(jiǎn)化后續(xù)運(yùn)動(dòng)控制的考慮,設(shè)計(jì)者們會(huì)減欠驅(qū)動(dòng)方案。通過(guò)通過(guò)機(jī)械結(jié)構(gòu)的優(yōu)化實(shí)現(xiàn)以較少的執(zhí)行機(jī)構(gòu)驅(qū)動(dòng)更多的自由度,產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分19of27君安證券研究1.從機(jī)電系統(tǒng)硬件層面上來(lái)說(shuō),系統(tǒng)的整體集成性太差:在現(xiàn)有電機(jī)和機(jī)械傳動(dòng)方案下,全驅(qū)動(dòng)機(jī)械手往往是“龐然大物”2.上層的運(yùn)動(dòng)控制系統(tǒng)繁瑣及冗雜:所需控制關(guān)節(jié)與執(zhí)行器眾多的緣故,與欠驅(qū)動(dòng)方案相比缺乏抓取物體的“形狀自適應(yīng)性”3.缺乏抗外界沖擊的柔性:這一點(diǎn)在機(jī)械手實(shí)際運(yùn)用當(dāng)中相當(dāng)重要,尤其是針對(duì)【手指關(guān)一次較大的沖擊往往意味著損壞一個(gè)關(guān)節(jié)電機(jī);4.設(shè)計(jì)復(fù)雜以及成本過(guò)高:20多個(gè)電機(jī)及機(jī)械傳動(dòng)的設(shè)計(jì)與成本再怎么精打細(xì)算1.機(jī)電系統(tǒng)硬件上系統(tǒng)的集成度高:整體系統(tǒng)簡(jiǎn)潔高效,體積小,質(zhì)量輕,目前適2.上層運(yùn)動(dòng)控制系統(tǒng)簡(jiǎn)潔高效:以PISA饋閉環(huán),就能實(shí)現(xiàn)對(duì)絕大多數(shù)物體的抓握。欠驅(qū)動(dòng)的機(jī)械特性能夠使得手指自動(dòng)適應(yīng)物體的形狀,具備很好的”形狀自3.具備良好的抗外界沖擊柔性:欠驅(qū)動(dòng)的特4.設(shè)計(jì)簡(jiǎn)潔以及成本低廉:與全驅(qū)動(dòng)方案相比1.欠驅(qū)動(dòng)機(jī)械手的缺點(diǎn)在于功能性不足,尤其是對(duì)于精度要求比較高的手指精巧控?cái)?shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究。注:以上均為國(guó)泰君安根據(jù)發(fā)布會(huì)信息推測(cè)機(jī)械手驅(qū)動(dòng)方案差異較大,電機(jī)的輕量化、低成本是關(guān)鍵。機(jī)械傳動(dòng)結(jié)構(gòu)上,機(jī)械構(gòu)緊湊和抓取力強(qiáng)的要求,因此電機(jī)應(yīng)具有尺寸小、質(zhì)量輕、精度高、扭矩大的特點(diǎn)。空心杯電機(jī)結(jié)構(gòu)緊湊、能量密度高、能耗低,和人形機(jī)器人機(jī)械手需求契合度產(chǎn)業(yè)深度極大的靈活性,可以極大簡(jiǎn)化設(shè)計(jì)難度和系統(tǒng)的復(fù)雜性,更高的運(yùn)動(dòng)自由度、靈活性、適應(yīng)性和人機(jī)交數(shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究。注:以上均為國(guó)泰君安根據(jù)發(fā)布會(huì)信息推測(cè)特斯拉Optimus機(jī)械手采取電機(jī)+腱繩驅(qū)動(dòng)的方式,可能對(duì)手部傳動(dòng)方案進(jìn)行優(yōu)化。盡管繩驅(qū)給機(jī)械手帶來(lái)了極大的靈活性,且可以極大簡(jiǎn)化設(shè)計(jì)難度和系統(tǒng)的復(fù)雜性,但其可靠性、傳動(dòng)效率都低于傳統(tǒng)連桿、齒輪齒條等方式,可能是研發(fā)團(tuán)隊(duì)數(shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究數(shù)據(jù)來(lái)源:Bebionic、國(guó)泰君安證券研究3.2.環(huán)境感知:深度相機(jī)+激光雷達(dá)VS純視覺方案IMU等,對(duì)應(yīng)機(jī)器人感知系統(tǒng)的不同傳感器類別。SLAM(是發(fā)展比較成熟、應(yīng)用廣泛的定位技術(shù),它是機(jī)器人通過(guò)對(duì)各種傳感器數(shù)據(jù)進(jìn)行采集和計(jì)算,生成對(duì)其自身位置姿態(tài)的定位和場(chǎng)描述為:機(jī)器人在未知環(huán)境中從一個(gè)未知位置開始移動(dòng),在移動(dòng)過(guò)程中根據(jù)位置估計(jì)和傳感器數(shù)據(jù)進(jìn)行自身定位,同時(shí)建造增量式地圖。獲取定位和地圖后,再根據(jù)請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分20of27產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分21of27Atlas系列WalkerX本田ASIMO激光雷達(dá)+深度相機(jī),兩個(gè)攝像頭放置純視覺方案,頭部搭基于AI交互相機(jī),采用多目立體視覺、搭4個(gè)深度相機(jī)+j兩個(gè)攝像頭作為視覺傳Atlas使用ToF深度相機(jī)以在眼球內(nèi),以每載三枚攝像頭(魚眼通過(guò)MiSense視配全向聽覺和慣性、測(cè)激光雷達(dá),支持感器,激光傳感器和紅每秒15幀的頻率生成點(diǎn)秒15幀的速攝像頭+左右攝像覺空間系統(tǒng)自研的距等全方位的感知系搭載額外的感知外傳感器結(jié)合用于探測(cè)云,基于多平面分割算法度捕獲圖像,分頭通過(guò)全景分割+三維重建算法,能元件和支持強(qiáng)化地面的地面上的障礙從點(diǎn)云中提取環(huán)境表面,辨率自研的三維重建算法實(shí)現(xiàn)8m內(nèi)深度信導(dǎo)航技術(shù),實(shí)現(xiàn)自主路學(xué)習(xí)功能以及相物、超聲波傳感器超聲進(jìn)行步態(tài)規(guī)劃實(shí)現(xiàn)環(huán)境感知心1%的精度徑規(guī)劃關(guān)應(yīng)用波傳感器用于測(cè)量周圍物體數(shù)據(jù)來(lái)源:本田官網(wǎng)、波士頓動(dòng)力官網(wǎng)、優(yōu)必選官網(wǎng)、Tesla官網(wǎng)、小米官網(wǎng)、軟銀官網(wǎng)、國(guó)泰君安證券研究3.2.1.波士頓動(dòng)力Atlas:深度相機(jī)+激光雷達(dá)波士頓動(dòng)力Atlas感知方案融合深度相機(jī)和激光雷達(dá),基于多平面分割算法實(shí)現(xiàn)步型,搭建HydraNet神經(jīng)網(wǎng)絡(luò)模型,優(yōu)化視覺算法,完成了自動(dòng)駕駛純視覺系統(tǒng)的法從點(diǎn)云中提取環(huán)境表面,數(shù)據(jù)經(jīng)過(guò)映射后完成對(duì)周邊物體的識(shí)別。之后,工控機(jī)基于識(shí)別到的表面和物體信息進(jìn)行步態(tài)規(guī)劃,以實(shí)現(xiàn)避障、探測(cè)地面狀況以和巡航法的頂尖機(jī)構(gòu),主要研發(fā)人形機(jī)器人行走所數(shù)據(jù)來(lái)源:BostonDynamics、國(guó)泰君安證券研究數(shù)據(jù)來(lái)源:BostonDynamics、國(guó)泰君安證券研究規(guī)劃3.2.2.特斯拉Optimus:純視覺方案,成本更低特斯拉Optimus環(huán)境感知采用基于攝像頭的純視覺方案,移植特斯拉全自動(dòng)駕駛案相比激光雷達(dá)等感知設(shè)備成本更低,但對(duì)算力要求高。機(jī)器人繼承了Autopilot算法框架,通過(guò)重新采集數(shù)據(jù)訓(xùn)練適用于機(jī)器人的神經(jīng)網(wǎng)絡(luò),以實(shí)現(xiàn)環(huán)境的三維重產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分22of27數(shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究3.3.運(yùn)動(dòng)控制:尚未形成通用的控制器解決方案制能力及感知計(jì)算能力要求較高,且不同廠商的執(zhí)行器數(shù)量和類別差異較大,未來(lái)運(yùn)控算法或成為廠商核心競(jìng)爭(zhēng)力,且自研可能性較大;此外人形機(jī)器人控制方案,對(duì)于客戶應(yīng)用場(chǎng)景的了解程度及工藝要求也是重要因素,目前下游場(chǎng)景分散,單獨(dú)Atlas系列優(yōu)必選-WalkerX本田ASIMO接收來(lái)自激光雷達(dá)和深度相根據(jù)離線運(yùn)動(dòng)庫(kù)通過(guò)專有的機(jī)器人軟件框動(dòng)作指定非基于系統(tǒng),方案包括水平反應(yīng)控制、機(jī)的數(shù)據(jù),基于離線行為庫(kù)和制器根據(jù)傳感器信息實(shí)時(shí)調(diào)架——機(jī)器人操作系統(tǒng)應(yīng)而是遠(yuǎn)端控制,使用模型預(yù)測(cè)控制實(shí)現(xiàn)行為控制,ARCHER的學(xué)習(xí)型算實(shí)際運(yùn)動(dòng)過(guò)程采集IMU、關(guān)于動(dòng)捕和逆運(yùn)動(dòng)學(xué)映射構(gòu)成身控制器控制身法體系。用一臺(tái)相機(jī)捕ASIMO可實(shí)現(xiàn)預(yù)測(cè)運(yùn)動(dòng)節(jié)位置傳感器數(shù)據(jù)進(jìn)行實(shí)時(shí)體完成動(dòng)作活性控制、穩(wěn)定控制算法獲并處理圖像,對(duì)失敗控制,可計(jì)算轉(zhuǎn)彎的向心調(diào)整和動(dòng)作優(yōu)化自適應(yīng)操作的嘗試分析,找出最佳的射擊角度、軌跡等免跌倒數(shù)據(jù)來(lái)源:本田官網(wǎng)、波士頓動(dòng)力官網(wǎng)、優(yōu)必選官網(wǎng)、Tesla官網(wǎng)、小米官網(wǎng)、軟銀官網(wǎng)、國(guó)泰君安證券研究3.3.1.運(yùn)動(dòng)控制算法:思路相似,均為離線行為庫(kù)和實(shí)時(shí)調(diào)整指定行為目標(biāo)后,從行為庫(kù)中選擇盡可能接近目標(biāo)的行為,獲得理論上可行的動(dòng)態(tài)產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分23of27分參數(shù)(力、姿勢(shì)、關(guān)節(jié)動(dòng)作時(shí)間等)的細(xì)節(jié),以適應(yīng)真實(shí)環(huán)境同理想的差異和其數(shù)據(jù)來(lái)源:6thWorkshoponLeggedRobotsICRA'22、國(guó)泰君安證券研究制器根據(jù)傳感器信息實(shí)時(shí)調(diào)整優(yōu)化行為,控制算步態(tài)控制算法中,運(yùn)動(dòng)規(guī)劃器首先基于預(yù)期路徑,生成參考軌跡,確定機(jī)器人模型的動(dòng)力學(xué)參數(shù)??刂破骰趥鞲衅鲾?shù)據(jù)對(duì)機(jī)器人進(jìn)行姿態(tài)估計(jì),根據(jù)現(xiàn)實(shí)環(huán)境和理想模型的差異,對(duì)機(jī)器人行為參數(shù)進(jìn)行校正,得到真實(shí)行為。此外,在連續(xù)的步態(tài)身的協(xié)調(diào)擺臂運(yùn)動(dòng),實(shí)現(xiàn)自然擺臂、大跨步以及盡可能的直膝行走,提高行走效率特斯拉技術(shù)人員表示Optimus的平衡問(wèn)題可能需要1數(shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究產(chǎn)業(yè)深度請(qǐng)務(wù)必閱讀正文之后的免責(zé)條款部分24of27數(shù)據(jù)來(lái)源:TeslaAIDay2022、國(guó)泰君安證券研究3.3.2.運(yùn)動(dòng)控制器:多為自主設(shè)計(jì),不同廠商需求差異大人形機(jī)器人采集并處理多種模態(tài)數(shù)據(jù),執(zhí)行機(jī)構(gòu)復(fù)雜程度遠(yuǎn)高于工業(yè)機(jī)器人,對(duì)控制器實(shí)時(shí)算力、集成度要求高。人形機(jī)器人傳感器類型、數(shù)量遠(yuǎn)超工業(yè)機(jī)現(xiàn)閉環(huán)控制等等,流程相對(duì)繁雜,數(shù)據(jù)維度、數(shù)據(jù)量均高于工業(yè)機(jī)器人,對(duì)算力要求高。工業(yè)機(jī)器人一般通過(guò)外接的圖像采集卡和圖像處理軟件實(shí)現(xiàn)識(shí)別儲(chǔ)等有不同的需求,因此控制器的組成有差異,以自主設(shè)計(jì)為主。我們認(rèn)為人形機(jī)器人控制器采用分布式控制系統(tǒng)的方案可能性較大,即由一個(gè)核心控制器和多個(gè)小Atlas系列歐洲ICUBOptimus優(yōu)必選本田ASIMO搭載三臺(tái)NUC/工控頭部PC104主板,對(duì)集成所有傳感器特斯拉的FSD芯片集成控制器包括一個(gè)多核異構(gòu)搭載兩個(gè)多核控制器位于軀體,由四機(jī)完成運(yùn)控系統(tǒng)的和電機(jī)狀態(tài)信息的各種數(shù)據(jù)流進(jìn)行同了三個(gè)4核CPU、兩個(gè)處理器硬件平臺(tái),支持多CPU用于控制個(gè)運(yùn)行著VxWorks實(shí)種三種總線,最多3塊主時(shí)操作系統(tǒng)的處理器構(gòu)控板卡同步運(yùn)行,可選用模塊化設(shè)計(jì)并LAN或Wi-Fi等時(shí)的計(jì)算在外部的計(jì)算機(jī)集群中完成碼器等部件ARM/DSP/X86多種類
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026湖南岳陽(yáng)汨羅市第三人民醫(yī)院面向社會(huì)招聘編外勞務(wù)派遣制專業(yè)技術(shù)人員7人備考題庫(kù)附答案
- 2026福建廈門市湖里區(qū)國(guó)有資產(chǎn)投資集團(tuán)有限公司招聘1人參考題庫(kù)附答案
- 2026福建省標(biāo)準(zhǔn)化研究院下屬國(guó)有企業(yè)第一批人員招聘5人備考題庫(kù)附答案
- 2026福建省順昌人力資源服務(wù)有限公司( 就業(yè)見習(xí)崗位)招聘1人參考題庫(kù)附答案
- 2026西北工業(yè)大學(xué)材料學(xué)院輻射探測(cè)材料與器件團(tuán)隊(duì)招聘1人(陜西)參考題庫(kù)附答案
- 公共交通車輛購(gòu)置管理制度
- 三臺(tái)縣2025年縣級(jí)事業(yè)單位面向縣內(nèi)鄉(xiāng)鎮(zhèn)公開選調(diào)工作人員(16人)參考題庫(kù)附答案
- 豐城市2025年機(jī)關(guān)事業(yè)單位公開選調(diào)工作人員【48人】考試備考題庫(kù)附答案
- 山東高速集團(tuán)有限公司2025年下半年校園招聘(管培生和戰(zhàn)略產(chǎn)業(yè)人才招聘)(60人) 考試備考題庫(kù)附答案
- 招130人!海北州公安局2025年度面向社會(huì)公開招聘警務(wù)輔助人員(第二批)參考題庫(kù)附答案
- 2025 年度VC PE 市場(chǎng)數(shù)據(jù)報(bào)告 投中嘉川
- 2025年網(wǎng)約車司機(jī)收入分成合同
- 2026年海南財(cái)金銀河私募基金管理有限公司招聘?jìng)淇碱}庫(kù)參考答案詳解
- 2026年GRE數(shù)學(xué)部分測(cè)試及答案
- 癌癥疼痛與心理護(hù)理的綜合治療
- 浙江省寧波市鎮(zhèn)海中學(xué)2026屆高二上數(shù)學(xué)期末教學(xué)質(zhì)量檢測(cè)模擬試題含解析
- (2025年)電力交易員練習(xí)試題附答案
- 2026年咨詢工程師現(xiàn)代咨詢方法與實(shí)務(wù)模擬測(cè)試含答案
- 2026屆湖北省黃岡市重點(diǎn)名校數(shù)學(xué)高一上期末質(zhì)量檢測(cè)試題含解析
- 甘肅省酒泉市2025-2026學(xué)年高一上學(xué)期期末語(yǔ)文試題(解析版)
- 2026年滬教版初一歷史上冊(cè)期末考試題目及答案
評(píng)論
0/150
提交評(píng)論