海外人形機(jī)器人巨頭深度剖析_第1頁(yè)
海外人形機(jī)器人巨頭深度剖析_第2頁(yè)
海外人形機(jī)器人巨頭深度剖析_第3頁(yè)
海外人形機(jī)器人巨頭深度剖析_第4頁(yè)
海外人形機(jī)器人巨頭深度剖析_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

海外人形機(jī)器人巨頭深度剖析1.特斯拉:由人類(lèi)打造、為人類(lèi)服務(wù)的機(jī)器人1.1.后人工智能時(shí)代機(jī)器人將取代人類(lèi)進(jìn)行重復(fù)性勞動(dòng)Optimus定位為解放勞動(dòng)力,可替代4億崗位。特斯拉的人形機(jī)器人項(xiàng)目Optimus(擎天柱)最早于2021年AIDay上公布(早期名稱(chēng)為T(mén)eslaBot),定位為解放勞動(dòng)力的通用型機(jī)器人。人形機(jī)器人作為模仿人類(lèi)的擬態(tài)物,相比機(jī)械臂等傳統(tǒng)機(jī)器人,能無(wú)縫在眾多場(chǎng)景替代人類(lèi)工作。馬斯克表示,在后人工智能時(shí)代機(jī)器人將取代人類(lèi)進(jìn)行重復(fù)性勞動(dòng),生產(chǎn)力充足的前景下可行的經(jīng)濟(jì)模式是政府實(shí)行全民補(bǔ)貼,而體力勞動(dòng)將成為個(gè)人的選擇。根據(jù)世界銀行數(shù)據(jù),2022年全球勞動(dòng)人口約34.3億人,勞動(dòng)力人口已呈現(xiàn)下降趨勢(shì),據(jù)麥肯錫報(bào)告預(yù)測(cè),到2030年全球約4億人的崗位將會(huì)被自動(dòng)化機(jī)器人替代,即11.7%的勞動(dòng)者會(huì)被機(jī)器人所取代。以O(shè)ptimus單價(jià)2萬(wàn)美元計(jì)算,長(zhǎng)期全球人形機(jī)器人市場(chǎng)天花板達(dá)8萬(wàn)億美元,是一個(gè)龐大的藍(lán)海市場(chǎng)。高自由度結(jié)構(gòu)與精細(xì)控制初步具備實(shí)用性。目前Optimus原型機(jī)身高約172cm,體重約57kg,力量能單手舉起一架鋼琴。其身體共有28個(gè)自由度(下一代預(yù)計(jì)超過(guò)200個(gè)自由度),采用了更加靈活的彈簧負(fù)載設(shè)計(jì)與6種類(lèi)型執(zhí)行器,關(guān)節(jié)采用仿生學(xué)關(guān)節(jié)設(shè)計(jì),模擬人類(lèi)關(guān)節(jié)與肌腱形態(tài),手部是Optimus最大亮點(diǎn),采用人體工程學(xué)設(shè)計(jì),擁有11個(gè)自由度(下一代預(yù)期27個(gè)),相比之下工業(yè)機(jī)器人全身一般僅有4到6個(gè)自由度。特斯拉已于演示視頻中展示了精細(xì)手部動(dòng)作,在Dojo超算的支持下Optimus利用動(dòng)作捕捉對(duì)人類(lèi)活動(dòng)方式進(jìn)行學(xué)習(xí),可抓取雜物,力道控制精細(xì),甚至不會(huì)打碎雞蛋。根據(jù)特斯拉介紹,Optimus已經(jīng)在特斯拉弗里蒙特工廠試驗(yàn)簡(jiǎn)單工作,如移動(dòng)零件或用扳手將螺栓固定在汽車(chē)上。1.2.自動(dòng)駕駛的終極形態(tài),F(xiàn)SD自動(dòng)駕駛-超算-機(jī)器人三位一體人形機(jī)器人是自動(dòng)駕駛技術(shù)的終極形態(tài)。自動(dòng)駕駛的本質(zhì)就是有輪子的機(jī)器人,特斯拉已經(jīng)打通了FSD軟件(完全自動(dòng)駕駛)和機(jī)器人的底層模塊,特斯拉在FSD上的積累將使得人形機(jī)器人全面受益。特斯拉將FSD從其汽車(chē)轉(zhuǎn)移到了機(jī)器人,并經(jīng)過(guò)調(diào)整以適應(yīng)機(jī)器人的身體和不同的工作環(huán)境。特斯拉主要通過(guò)對(duì)人進(jìn)行真實(shí)世界任務(wù)的運(yùn)動(dòng)捕捉,如提起物體、行走等,然后使用反向運(yùn)動(dòng)學(xué)技術(shù)讓Optimus重復(fù)這些動(dòng)作,同時(shí)應(yīng)用了在線動(dòng)作適應(yīng)技術(shù),使這些任務(wù)更加靈活,并能根據(jù)環(huán)境進(jìn)行調(diào)整。同時(shí)由于采用了相同的FSD系統(tǒng),機(jī)器人可直接復(fù)用電動(dòng)車(chē)成熟的視覺(jué)系統(tǒng),由于特斯拉決定采用同樣的攝像頭方案,而不是LIDAR傳感器,因此可直接移植到人形機(jī)器人上。自動(dòng)駕駛為機(jī)器人搭建技術(shù)框架。機(jī)器人的反饋機(jī)制本質(zhì)上是與自動(dòng)駕駛相同的架構(gòu),即感知層-決策層-執(zhí)行層。特斯拉在汽車(chē)上使用自研的HW硬件與FSD軟件,而機(jī)器人的感知層和決策層可直接復(fù)用自動(dòng)駕駛技術(shù),特斯拉基于Transformer的BEV方案結(jié)合時(shí)序隊(duì)列與OccupancyNetwork,實(shí)現(xiàn)包含空間和時(shí)間的4D感知,即使在純視覺(jué)方案下仍能實(shí)現(xiàn)高效的環(huán)境感知。在決策層上,模型訓(xùn)練階段的數(shù)據(jù)標(biāo)注和模擬環(huán)境同樣可復(fù)用于機(jī)器人上,因此Optimus能在立項(xiàng)僅一年就拿出展示機(jī)型,遠(yuǎn)快于其他人形機(jī)器人廠商,軟件層面上只需要更多優(yōu)質(zhì)的訓(xùn)練數(shù)據(jù)積累就能快速提高運(yùn)動(dòng)能力。Dojo超算——云端訓(xùn)練AI的基石。超級(jí)計(jì)算機(jī)Dojo基于特斯拉自研的7nmD1芯片,具備采集、訓(xùn)練和進(jìn)化的能力,能夠更理想的采集道路交通標(biāo)識(shí)、生物形象、路面情況等信息。該芯片將354個(gè)獨(dú)立處理器封裝在一起,產(chǎn)生362TFLOPS的計(jì)算和440MB的內(nèi)部靜態(tài)隨機(jī)存取存儲(chǔ)器存儲(chǔ)。在保持完全可編程性的同時(shí),DOJO強(qiáng)調(diào)資源分配和極高帶寬的互連,使其能夠從小型系統(tǒng)一直擴(kuò)展到exaFLOP超級(jí)計(jì)算機(jī)。在產(chǎn)品形態(tài)上,Dojo的最終落地單位是名為ExaPOD的超級(jí)計(jì)算集群,它集成了3000顆D1芯片,包含120個(gè)訓(xùn)練瓦片,最終能夠?qū)崿F(xiàn)高達(dá)1.1EFlops的BF16/CFP8峰值算力。2023年7月特斯拉Dojo正式投產(chǎn),預(yù)期到2024年2月,特斯拉算力規(guī)模將進(jìn)入全球前五,2024年10月總規(guī)模將達(dá)到100Exa-Flops,相當(dāng)于30萬(wàn)塊英偉達(dá)A100顯卡的算力總和。Dojo超算為機(jī)器人提供最強(qiáng)AI大腦。超級(jí)計(jì)算機(jī)Dojo被特斯拉稱(chēng)為PureLearningMachine(純學(xué)習(xí)機(jī)器),特斯拉FSD芯片最大的優(yōu)勢(shì)就是只有一個(gè)客戶(hù),而Dojo也是同樣的設(shè)計(jì)思路,它是一種專(zhuān)為深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練而生的可拓展系統(tǒng)。傳統(tǒng)CPU和GPU都不是為機(jī)器學(xué)習(xí)而設(shè)計(jì)的,在Dojo之前的超級(jí)計(jì)算機(jī)主要由專(zhuān)業(yè)的計(jì)算機(jī)設(shè)備制造商研發(fā)、集中在國(guó)家級(jí)實(shí)驗(yàn)室,主要用途在中長(zhǎng)期天氣預(yù)報(bào)、油氣勘探、物理模擬、量子力學(xué)等超大型計(jì)算應(yīng)用場(chǎng)景;相比之下,Dojo的應(yīng)用場(chǎng)景主要是以視頻和圖像數(shù)據(jù)訓(xùn)練AI,專(zhuān)為自動(dòng)駕駛和機(jī)器人訓(xùn)練使用。原本在A100陣列上需要進(jìn)行一周的自動(dòng)駕駛學(xué)習(xí)任務(wù),在Dojo上可能只需要2至3天就能完成,而人形機(jī)器人由于高自由度以及四肢協(xié)作,訓(xùn)練數(shù)據(jù)體量遠(yuǎn)大于自動(dòng)駕駛,根據(jù)特斯拉數(shù)據(jù)顯示,在同樣的成本之下,Dojo超級(jí)計(jì)算機(jī)相比英偉達(dá)A100能夠?qū)崿F(xiàn)4倍的性能、能耗比提升1.3倍。技術(shù)整合帶來(lái)人形機(jī)器人奇點(diǎn)。Optimus采用了與Tesla車(chē)輛相同的芯片,支持Wi-Fi、LTE鏈接和音頻交流,其系統(tǒng)軟硬件的安全性保障也正在不斷提升,通過(guò)量產(chǎn)與技術(shù)發(fā)展控制制造成本,而軟件復(fù)用汽車(chē)FSD系統(tǒng)、算力調(diào)用Dojo超算,在規(guī)?;a(chǎn)后預(yù)計(jì)遠(yuǎn)期成本遠(yuǎn)低于一輛汽車(chē)。Optimus的版本迭代十分之快,會(huì)遠(yuǎn)超汽車(chē)等產(chǎn)品,自2021年AIDay公布一年后已改進(jìn)到第二代,在2023年5月的股東大會(huì)演示視頻上第二代人形Optimus已能流暢行走。據(jù)證券時(shí)報(bào),馬斯克在2022AIDay上透露,Optimus有望在3-5年間量產(chǎn)上市,預(yù)期產(chǎn)量可以達(dá)到數(shù)百萬(wàn)臺(tái),預(yù)估Optimus機(jī)器人穩(wěn)定生產(chǎn)后的價(jià)格將達(dá)到2萬(wàn)美元以下。1.3.未來(lái)展望:仍在等待GPT時(shí)刻的到來(lái)機(jī)器人領(lǐng)域仍在等待著“大腦”的進(jìn)化。GPT模型的自然語(yǔ)言處理已經(jīng)匯聚了自回歸變換器+下一個(gè)詞預(yù)測(cè)+強(qiáng)化學(xué)習(xí)高級(jí)特征的“配方”。然而,對(duì)于人形機(jī)器人的技術(shù)而言,還沒(méi)有算法能夠達(dá)到同樣的效果。目前Optimus可期待的應(yīng)用場(chǎng)景還是重復(fù)性的小場(chǎng)景工作,因?yàn)镕SD模型無(wú)法對(duì)未知信息進(jìn)行預(yù)測(cè),近日特斯拉Optimus的官方推特賬號(hào)上傳了新的演示視頻,Optimus能夠僅依靠視覺(jué)來(lái)對(duì)物體進(jìn)行分類(lèi),還能完成難度更大的瑜伽動(dòng)作,采用了類(lèi)似于特斯拉自動(dòng)駕駛技術(shù)FSD12的端到端神經(jīng)網(wǎng)絡(luò)控制:視頻輸入,控制輸出,并由此來(lái)控制各個(gè)部件和關(guān)節(jié)的移動(dòng)。谷歌Deepmind已在測(cè)試多模態(tài)模型RT-2控制機(jī)器人,內(nèi)嵌120億參數(shù)PaLM-E模型以及550億參數(shù)PaLI-X模型的RT-2在陌生任務(wù)中的平均準(zhǔn)確率相比RT-1翻倍,達(dá)到62%。如果行業(yè)能打造出“RobotGPT”的基座模型,實(shí)現(xiàn)零樣本或少樣本學(xué)習(xí),則能在更復(fù)雜乃至陌生的環(huán)境中執(zhí)行任務(wù),實(shí)現(xiàn)人形機(jī)器人的智能涌現(xiàn)。Optimus初步落地可期,應(yīng)用想象力擴(kuò)大。根據(jù)馬斯克發(fā)言,Optimus預(yù)計(jì)將于今年11月進(jìn)行行走測(cè)試,之后在生產(chǎn)穩(wěn)定后開(kāi)始加速,明年進(jìn)入工廠測(cè)試實(shí)際工作。此外,Optimus的核心硬件模塊化同樣有巨大的應(yīng)用潛力,透過(guò)將Neuralink腦機(jī)接口植入物與機(jī)器人手臂或腿結(jié)合,可構(gòu)成優(yōu)秀的假肢,為被截肢的人提供一個(gè)優(yōu)秀的機(jī)器人身體,可能只需要6萬(wàn)美元。2.波士頓動(dòng)力:機(jī)器人領(lǐng)域的頂尖實(shí)驗(yàn)室2.1.最強(qiáng)動(dòng)態(tài)性能的跑酷機(jī)器人Atlas機(jī)器人領(lǐng)域三十年積累,造就最靈活人形機(jī)器人。波士頓動(dòng)力(BostonDynamics)由麻省理工學(xué)院副教授馬克·雷波特于1992年創(chuàng)立,最初的機(jī)器人是為美軍研制的大狗(BigDog)機(jī)器人,可在廢墟、泥地、雪地、水中行走,奠定了Atlas運(yùn)動(dòng)能力的基礎(chǔ)。波士頓動(dòng)力目前最先進(jìn)的機(jī)器人Atlas身高1.5米,體重80kg,速度1.5m/s,依靠28個(gè)液壓執(zhí)行器實(shí)現(xiàn)各種高難度運(yùn)動(dòng),足部踝關(guān)節(jié)由兩個(gè)直線執(zhí)行器并聯(lián)驅(qū)動(dòng),髖關(guān)節(jié)和手臂多是伺服擺動(dòng)缸。Atlas不僅擁有卓越的物理機(jī)動(dòng)性,更因其高級(jí)的控制系統(tǒng)和算法而獨(dú)立于眾,多次在演示中展現(xiàn)出近乎超乎人類(lèi)的運(yùn)動(dòng)與平衡能力。2.2.創(chuàng)新硬件與算法沉淀,Atlas實(shí)現(xiàn)卓越運(yùn)動(dòng)性能Atlas以高性能電液驅(qū)動(dòng)系統(tǒng)、復(fù)雜的AI算法和多模態(tài)視覺(jué)感知實(shí)現(xiàn)優(yōu)異運(yùn)動(dòng)性能:強(qiáng)大運(yùn)動(dòng)性能得益于獨(dú)特液壓驅(qū)動(dòng)。不同于多數(shù)機(jī)器人采用電驅(qū),Atlas為了獲得最強(qiáng)的機(jī)動(dòng)性采用液壓伺服驅(qū)動(dòng),具有高負(fù)載驅(qū)動(dòng)特性,即使是高難度動(dòng)作如后空翻等依然能平穩(wěn)落地。Atlas機(jī)器人全身有28個(gè)自由度,在多個(gè)液壓關(guān)節(jié)與算法的協(xié)調(diào)配合下,Atlas已經(jīng)可以熟練的完成垂直起跳、跨越障礙、后空翻,甚至完成整套的舞蹈以及手腳都參與的跑酷功能。離線模板與在線精細(xì)控制構(gòu)成獨(dú)特運(yùn)動(dòng)算法。Atlas的離線軌跡庫(kù)模板包含了眾多預(yù)設(shè)的最優(yōu)運(yùn)動(dòng)方案,會(huì)向決策層MPC(模型預(yù)測(cè)控制)提示最佳的解決方案選擇,此后MPC利用機(jī)器人的動(dòng)力學(xué)模型來(lái)預(yù)測(cè)其未來(lái)的動(dòng)作。這種控制器的核心工作機(jī)制是優(yōu)化計(jì)算,確定機(jī)器人當(dāng)前應(yīng)該進(jìn)行的最優(yōu)動(dòng)作,從而隨著時(shí)間的推移產(chǎn)生最佳行為。當(dāng)遇到如環(huán)境改變、腳滑等實(shí)時(shí)因素時(shí),MPC會(huì)調(diào)整機(jī)器人的發(fā)力、姿勢(shì)和動(dòng)作的發(fā)生時(shí)機(jī)來(lái)適應(yīng)。此外,MPC還能跨行為邊界預(yù)測(cè)下一步的行動(dòng),例如知悉跳躍后要進(jìn)行后空翻,它便會(huì)自動(dòng)創(chuàng)建行為之間的過(guò)渡,確保動(dòng)作連貫。在MPC3.0版本中,Atlas已能主動(dòng)使用參數(shù)已知的工具,在官方演示視頻中Atlas用木板搭了一座橋通過(guò)障礙。TOF+預(yù)設(shè)地圖構(gòu)成Atlas的“眼睛”。在感知層,Atlas使用TOF深度相機(jī)每秒生成15幀的環(huán)境點(diǎn)云,這些點(diǎn)云基于大規(guī)模的測(cè)距集合。它的感知軟件采用多平面分割算法從點(diǎn)云中提取平面,并將此信息輸入到映射系統(tǒng)中,為Atlas構(gòu)建通過(guò)相機(jī)看到的各種對(duì)象的模型。當(dāng)Atlas執(zhí)行擴(kuò)展的跑酷行為時(shí),波士頓動(dòng)力的研發(fā)團(tuán)隊(duì)為其提供了一張高級(jí)地圖,指明了它應(yīng)該前往的地方和沿途應(yīng)該執(zhí)行的動(dòng)作。盡管這張地圖并不完全與真實(shí)路線的幾何形狀匹配,但它提供了障礙模板和注釋動(dòng)作的近似描述,Atlas則利用這些稀疏信息進(jìn)行導(dǎo)航,并用實(shí)時(shí)感知數(shù)據(jù)來(lái)填補(bǔ)細(xì)節(jié)。2.3.從機(jī)械狗Spot開(kāi)始,商業(yè)化前路漫長(zhǎng)機(jī)械狗Spot率先開(kāi)啟商業(yè)化之路。Spot是波士頓動(dòng)力2015年2月發(fā)布的四足機(jī)器人,身高僅一米有余。SpotMini是Spot機(jī)器人的更加小型且防水的版本,加上機(jī)器臂重量29.5kg,一次充電可以跑90分鐘,相比波士頓動(dòng)力其他液壓結(jié)構(gòu)驅(qū)動(dòng)的機(jī)器人,SpotMini是純電動(dòng)的,因此是波士頓動(dòng)力最安靜的機(jī)器人之一,搭配多種傳感器,可以完成各項(xiàng)復(fù)雜的動(dòng)作以及巡航,如無(wú)人區(qū)巡邏、尋找氣體泄露、公園安保等。SpotMini是公司商業(yè)化探索的第一步,于2020年6月開(kāi)始公開(kāi)發(fā)售,每只定價(jià)74,500美元,折合人民幣超過(guò)50萬(wàn)元。Spotmini整體的設(shè)計(jì)以高集成度、高任務(wù)作業(yè)能力為主,繼承了波士頓動(dòng)力其他機(jī)器人的高運(yùn)動(dòng)能力,最優(yōu)異的性能就是樓梯攀爬,其采用全視覺(jué)方案構(gòu)建全局地圖,進(jìn)一步選擇合適的落足點(diǎn)避開(kāi)臺(tái)階邊緣以及不安全的落足區(qū)域。難以降本量產(chǎn)約束商業(yè)化落地。波士頓動(dòng)力從學(xué)術(shù)領(lǐng)域?qū)嶒?yàn)室誕生,因此機(jī)器人的設(shè)計(jì)多是不計(jì)成本以性能為導(dǎo)向,早期為美國(guó)國(guó)防高級(jí)研究計(jì)劃局承包項(xiàng)目,由于商業(yè)化進(jìn)程不及預(yù)期,被谷歌收購(gòu)后又經(jīng)歷兩度易主,2017年6月軟銀接手、2021年6月由現(xiàn)代汽車(chē)接管。根據(jù)Analytic

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論