付費下載
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
人形機器人感知硬件專題研究:人形機器人的五類感官和硬件支撐人形機器人加速發(fā)展,感知能力愈發(fā)重要人形機器人迅速迭代,國內(nèi)外廠商加速布局特斯拉機器人迭代迅速,歷時8個月便可執(zhí)行復(fù)雜動作。2022年10月,在特斯拉AIDay上,特斯拉機器人Optimus首次亮相,當時還需要人工推出,僅能完成簡單的肢體動作。而在2023年3月的投資者日中,Optimus便展現(xiàn)了步行以及組裝機器人的工作能力。到2023年5月的股東大會上,Optimus已經(jīng)可以實現(xiàn)對物品的抓取等復(fù)雜動作。馬斯克提出,Optimus將面向應(yīng)用場景進行快速迭代,預(yù)計在特定應(yīng)用場景將快速推出量產(chǎn)機型。我們認為特斯拉強大的汽車供應(yīng)鏈有望加速Optimus量產(chǎn)實現(xiàn)。特斯拉強大的供應(yīng)鏈及解決方案有望加速人形機器人量產(chǎn)進程。目前人形機器人商業(yè)化量產(chǎn)的瓶頸主要可歸結(jié)為技術(shù)、成本和應(yīng)用場景三個方面。但特斯拉在三大瓶頸方面均有特有優(yōu)勢。1)技術(shù)方面,擁有FSD自動駕駛技術(shù)以及DOJOD1超級計算芯片的特斯拉在人形運動控制、硬件執(zhí)行器、運動規(guī)劃算法等方面正在進行廣泛深入的底層研究;2)成本方面:研發(fā)團隊在設(shè)計階段已充分考慮量產(chǎn)階段的降本可行性,例如高度集成的電池、6種執(zhí)行器等,強大供應(yīng)鏈保障有望降低量產(chǎn)成本;3)應(yīng)用場景:特斯拉汽車工廠將為人形機器人提供巨大的試驗田,早期版本的機器人將在工廠中進行大量訓(xùn)練,并不斷迭代,解決了大多數(shù)廠商早期尋找應(yīng)用場景這一大難題。傳統(tǒng)機器人公司技術(shù)迭代速度較慢,且并未面向應(yīng)用場景設(shè)計機器人,供應(yīng)鏈問題也導(dǎo)致機器人造價十分昂貴。以大家熟知的波士頓動力
Atlas為例,根據(jù)波士頓動力官網(wǎng),波士頓動力的Atlas擁有近40年的發(fā)展歷史,1983年-2013年,從麻省理工LegLab走出來的Atlas基本完成了簡單的肢體動作和行走能力,2016年Atlas開始具有簡單的物體搬運功能,并且沒有靈巧手,2019年Atlas行走能力進一步增強,可實現(xiàn)后空翻等動作,并且能夠識別復(fù)雜地形,2021年,Atlas具有一定的工作能力,用簡單的靈巧手搬運物體。目前,發(fā)展了40年的Atlas仍然沒有明確的應(yīng)用場景,且售價十分昂貴,達到200萬美元以上。特斯拉或在機器人行業(yè)再次帶來鲇魚效應(yīng)?;仡櫺履茉雌囋谥袊袌龅陌l(fā)展史,特斯拉這條“鲇魚”對于我國新能源汽車升級與降本帶來巨大推動作用。2019年1月,特斯拉上海工廠奠基,2020年1月,特斯拉上海工廠新車交付,國產(chǎn)版Model3售價下調(diào),扣除補貼后,基礎(chǔ)版車型售價從35.58萬元下調(diào)至29.9萬元,低廉的售價以及優(yōu)良的性能對我國新能源車廠商帶來了巨大沖擊,迫使我國新能源車廠商降本提效,加速了新能源車行業(yè)的發(fā)展,同時也推動了我國消費者對新能源車的接受度提高。因此,我們認為特斯拉在機器人行業(yè)中也將扮演這條“鲇魚”,極快的迭代速度以及可預(yù)期的低廉的售價將迫使老牌機器人廠商加速發(fā)展。國內(nèi)外巨頭紛紛參股或設(shè)立人形機器人研發(fā)公司?,F(xiàn)有人形機器人產(chǎn)品主要為日本本田ASIMO、美國波士頓動力Atlas、美國AgilityRobot、優(yōu)必選Walkers、中國小米CyberOne、以及特斯拉Optimus等。其中,日本本田、小米及特斯拉皆研發(fā)了自己的人形機器人。而波士頓動力相繼輾轉(zhuǎn)谷歌、軟銀后,目前被現(xiàn)代公司收購。美國AgilityRobot的2022年B+輪融資的投資者中,出現(xiàn)了亞馬遜及索尼。國內(nèi)外巨頭紛紛下場加碼人形機器人,人形機器人有望迎來快速發(fā)展。國內(nèi)外機器人創(chuàng)業(yè)公司也紛紛推出人形機器人或產(chǎn)品。國內(nèi)機器人行業(yè)創(chuàng)業(yè)公司如追覓科技、達闥科技等先后推出自己的雙足人形機器人,國內(nèi)四足機器人領(lǐng)先企業(yè)宇樹科技也在加入到人形機器人的研發(fā)中,騰訊RoboticsX實驗室推出自研機器人靈巧手“TRX-Hand”和機械臂“TRX-Arm”,為其后續(xù)在機器人行業(yè)的發(fā)展作出鋪墊,華為于2023年6月注冊成立東莞極目機器有限公司,正式進軍機器人領(lǐng)域,注冊資本8.7億元。國外方面,OpenAI
在A2輪領(lǐng)投挪威人形機器人公司1XTechnologies,旨在將其強大的AI系統(tǒng)與實體機器人結(jié)合起來,從而為AGI的發(fā)展奠定基礎(chǔ)。人形機器人浪潮下,類人型機器人也迎來快速發(fā)展,但人形機器人仍然是各大廠商的主要目標。隨著人形機器人浪潮襲來,類人型機器人如四足機器人也迎來了快速發(fā)展,成為各大廠商的必爭之地,早在2021年3月騰訊便發(fā)布多模態(tài)四足機器人Max,并在2022年8月推出Max二代,小米于2021年8月發(fā)布第一代四足機器人鐵蛋,小鵬鵬行機器也于2022年7月發(fā)布首款四足機器人。此外一些在機器人領(lǐng)域深耕多年的創(chuàng)業(yè)公司也擁有自己的標桿四足機器人產(chǎn)品,例如宇樹科技的A1、云深處的絕影X20、蔚藍科技的E系列、優(yōu)寶特的YoBoGo。國外較為出名的四足機器人有波士頓動力的Spot、IIT的HyQReal。但人形機器人相較于仿人形機器人仍有較大優(yōu)勢:(1)仿生步態(tài)下運動能力較傳統(tǒng)履帶/四輪/雙輪機器人大幅提升;(2)靈巧手可實現(xiàn)雙手配合和工具替換,較工業(yè)機器人技能更廣;(3)依靠算法能力實現(xiàn)復(fù)雜環(huán)境識別并實施決策。預(yù)計到2027年,全球人形機器人市場規(guī)模將達到141億美元。根據(jù)優(yōu)必選招股書,弗若斯特沙利文預(yù)計2026年全球智能服務(wù)機器人產(chǎn)品及解決方案的市場規(guī)模將達到676億美元,2021年到2026年CAGR達到25%。而根據(jù)StratisticsMarketResearchConsulting數(shù)據(jù),全球人形機器人市場規(guī)模將在2027年達到141億美元,2020年到2027年CAGR達到58%。人形機器人是具身智能的重要載體,AI發(fā)展賦能機器人感知人工智能的下一個浪潮將是具身智能。在ITFWorld2023半導(dǎo)體大會上,英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,人工智能的下一個浪潮將是具身智能,即能理解、推理、并與物理世界互動的智能系統(tǒng)。具身智能是具有身體體驗的智能。1950年,圖靈在他的論文“ComputingMachineryandIntelligence”中首次提出了具身智能的概念。之后的幾十年里,大家都覺得這是一個很重要的概念,但是由于技術(shù)限制,具身智能并未有很好的發(fā)展。從認知的角度來看,人類是第一人稱視角的智能,用1963年的實驗來說明,有兩只貓,一直貓被綁起來,只能看這個世界,另一只貓可以主動去走。被動的貓是一種旁觀的智能,而主動的貓是具身的智能。到最后,這只旁觀的貓失去了行走能力。當機器可以主動感知世界時,人工智能也就變成了第一人稱的智能,也就無限接近于人類。具身智能由具身感知、具身想象和具身執(zhí)行三個基礎(chǔ)模塊構(gòu)成。上海交通大學(xué)盧策吾教授在機器之心AI科技年會中提出了PIE方案,即具身感知(Perception)、具身想象(Imagination)和具身執(zhí)行(Execution)。PIE方案幫助機器模擬了人類的思維及行動方式,即機器人首先需要識別物體,然后通過交互感知物體,再通過數(shù)字孿生進行仿真模擬,利用最好的結(jié)果去執(zhí)行。盧教授也演示了機器人如何抓取被打碎的陶瓷瓶碎片,對于不規(guī)整的碎片,機器人總是能成功抓取。作為具身智能的大腦,多模態(tài)大模型更符合人類大腦接受與處理信息的方式。從人類接受信息的角度看,我們所接收到真實世界的信息來自于多模態(tài)的數(shù)據(jù)源,如語音、文本、圖像等,而單模態(tài)預(yù)訓(xùn)練模型只涵蓋了單一模態(tài)的信息,無法對人類的信息獲取、環(huán)境感知、知識學(xué)習(xí)與表達的主動學(xué)習(xí)過程進行有效表達,不同模態(tài)之間的隱式交互信息并未被充分利用與學(xué)習(xí)?!癎PT一小步,多模態(tài)AI的一大步”,GPT-4支持圖片和文本類信息同時輸入。GPT-4是由OpenAI發(fā)布的大型多模態(tài)模型,它不僅能與用戶一起生成、編輯,完成創(chuàng)意的迭代和技術(shù)寫作任務(wù),更重要的是,它還能讀懂圖片。多模態(tài)感知是實現(xiàn)通用人工智能的必要條件,無論是知識/能力獲取還是與現(xiàn)實物理世界的交互,這也是其與上一代GPT的主要區(qū)別。在GPT-4中,多模態(tài)輸入的圖像和文本基于Transformer作為通用接口,圖形感知模塊與語言模塊對接進行進一步計算?;赥ransformer技術(shù),GPT-1只有12層,而到了GPT-3,則增加到96層。GPT-4增加了額外的視覺語言模塊,理論上具有更大的模型尺寸和輸入窗口。語言方面,以ChatGPT為代表的大模型已具備協(xié)助機器人處理語言,從而可以高效地對感知信息進行交互,如人類通過自然語言對機器人進行調(diào)試。根據(jù)微軟SaiVemprala等最新的論文:“目前的機器人需要專門的工程師不斷編寫新的代碼來修正機器人的行為,而我們使用ChatGPT的目標是讓非技術(shù)用戶參與到修正過程中,通過高級語言命令與語言模型交互,無縫部署各種平臺和任務(wù)。”如果付諸實踐,AI有望幫助編寫新代碼和規(guī)范來糾正機器人的行為,因此允許了不懂技術(shù)的廣大用戶提供反饋,輕松地與機器人互動,直到用戶對機器人的處理解決方案滿意為止,再將這個代碼部署到機器人上,一個調(diào)試就結(jié)束了。視覺方面,谷歌推出ViT統(tǒng)一了CV和NLP框架,用于圖像識別。ViT模型將語言模型的transformer架構(gòu)用于視覺模型,代替了傳統(tǒng)的CNN,統(tǒng)一了CV和NLP的架構(gòu)。2020年10月,谷歌推出VisionTransformer(ViT)模型,證明了不使用CNN,直接將Transformer結(jié)構(gòu)應(yīng)用于視覺模型也可以很好地執(zhí)行圖像分類任務(wù)。Transformer將句子中的每個詞(token)并行輸入編碼器,ViT直接將圖像拆分為多個塊,將每個塊的位置和包含的圖像信息當做是一個詞,輸入到編碼器中,訓(xùn)練好的編碼器可以將圖像輸出為一個包含了圖像特征的編碼,類似于在語言模型中將一句話輸出為一個包含了語言信息的編碼,之后通過MLP層將編碼器的輸出轉(zhuǎn)化為不同分類的概率。信息處理方面,算法模型與軟硬件一起集成為可供機器人“思考”的“大腦”。如谷歌發(fā)布RoboCat,其基于谷歌的多模態(tài)模型Gato,可以在模擬和物理環(huán)境中處理語言、圖像和動作。通過將Gato的架構(gòu)與一個大型訓(xùn)練數(shù)據(jù)集結(jié)合起來,該數(shù)據(jù)集由各種機器人手臂的圖像序列和動作組成,可以解決數(shù)百種不同的任務(wù)。RoboCat先通過機器視覺觀察由人工操作的機械臂完成任務(wù),搜集數(shù)據(jù)后通過在物理和虛擬環(huán)境中進行練習(xí),通過練習(xí)生成新的訓(xùn)練數(shù)據(jù),合并進入訓(xùn)練集,用于新版本的訓(xùn)練,從而學(xué)會此次任務(wù)。學(xué)會此次任務(wù)的RoboCat可被移植到新的機械臂上,對新的機械臂進行微調(diào)后執(zhí)行相同的任務(wù),RoboCat在幾小時內(nèi)觀察1000次人工演示后,可以靈巧的指揮新手臂抓取齒輪,成功率高達86%。RoboCat的出現(xiàn)為未來更加通用的機器人出現(xiàn)打下基礎(chǔ)。人工智
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中學(xué)學(xué)生社團活動風(fēng)險管理制度
- 人力資源管理與發(fā)展制度
- 企業(yè)調(diào)休制度
- 2026年物流管理專業(yè)模擬試題及答案詳解
- 2026年歷史事件解析歷史人物研究考試題集
- 2026年網(wǎng)絡(luò)工程師網(wǎng)絡(luò)配置試題網(wǎng)絡(luò)故障排查與優(yōu)化題
- 2026年現(xiàn)代企業(yè)管理知識評估試題庫
- 2026年建筑工程設(shè)計與施工專業(yè)題庫資源
- 2025年企業(yè)產(chǎn)品水足跡核算軟件采購合同
- 急診骨折患者的固定急救處理流程及制度
- 泰康入職測評題庫及答案
- 天津市河?xùn)|區(qū)2026屆高一上數(shù)學(xué)期末考試試題含解析
- DB37-T6005-2026人為水土流失風(fēng)險分級評價技術(shù)規(guī)范
- 彈性工作制度規(guī)范
- 仁愛科普版(2024)八年級上冊英語Unit1~Unit6補全對話練習(xí)題(含答案)
- 腎寶膠囊產(chǎn)品課件
- YST 581.1-2024《氟化鋁化學(xué)分析方法和物理性能測定方法 第1部分:濕存水含量和灼減量的測定 重量法》
- 小學(xué)五年級數(shù)學(xué)上冊寒假作業(yè)天天練30套試題(可打印)
- 金蟬環(huán)保型黃金選礦劑使用說明
- 常見中草藥別名大全
- YY/T 0884-2013適用于輻射滅菌的醫(yī)療保健產(chǎn)品的材料評價
評論
0/150
提交評論