欠驅(qū)動機器人學習、規(guī)劃和控制Ecient和敏捷的機器_第1頁
欠驅(qū)動機器人學習、規(guī)劃和控制Ecient和敏捷的機器_第2頁
欠驅(qū)動機器人學習、規(guī)劃和控制Ecient和敏捷的機器_第3頁
欠驅(qū)動機器人學習、規(guī)劃和控制Ecient和敏捷的機器_第4頁
欠驅(qū)動機器人學習、規(guī)劃和控制Ecient和敏捷的機器_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、欠驅(qū)動機器人:對高效與敏捷機器的學習、規(guī)劃和控制(麻省理工學院)1驅(qū)動與欠驅(qū)動系統(tǒng)今天的機器人移動過于保守,只能完成一小部分任務,只具有實現(xiàn)一小部分機械性能的能力。在很多情況下,我們?nèi)匀粡母旧鲜芟抻诳刂萍夹g,這項技術使剛性機械臂在結(jié)構(gòu)化的工廠環(huán)境更加成熟。欠驅(qū)動機器人的研究專注于構(gòu)建使用自然動力機器的控制系統(tǒng),這可以實現(xiàn)非凡的性能。1.1動機讓我們先從一些例子開始我們的講述。1.1.1本田的ASIMO與被動動態(tài)行走世界機器人機器人世界最遲是在1996年末改變的,本田汽車宣布他們已經(jīng)研究步行機器人技術近15年(秘密地)。他們的設計持續(xù)發(fā)展在過去的12年里,設計出了一款人形機器人,他們稱它ASI

2、MO(在創(chuàng)新流動上先進了一步)。本田的ASIMO被廣泛地認為是步行機器人的藝術狀態(tài),雖然現(xiàn)在有許多機器人與ASIMO的設計和性能非常相似?,F(xiàn)在我只是想讓你熟悉ASIMO動作的外觀和感覺。我希望你的第一反應是ASIMO多功能性的運動是令人難以置信的和深刻的。現(xiàn)在仔細看一下。雖然ASIMO的步態(tài)運動很平滑,但還是有一點不自然。感覺有點像宇航員穿著一個笨重的宇航服。事實上,這是一個合理的類比。ASIMO走路就像一個不熟悉動力學的人。它的控制系統(tǒng)使用高增益反饋,因此有相當大的關節(jié)轉(zhuǎn)矩,取消了自然動力機器嚴所需格遵循的軌跡。這種控制方法有嚴厲處罰。ASIMO使用約為人類在平坦路面上(運輸成本來衡量)行走

3、的20倍的能量(擴展),同時,控制穩(wěn)定在一個相對較小的狀態(tài)空間(當立場腳地面是平的),所以ASIMO不能快速移動,不能走在未建?;虿黄降牡匦巍榱藢Ρ?讓我們現(xiàn)在考慮一個非常不同的類型的步行機器人,稱為被動動態(tài)沃克。這種“機器人”沒有汽車、沒有控制器,沒有電腦,但仍然是能走一個小斜坡并穩(wěn)定下來,只靠重力驅(qū)動。大多數(shù)人會同意,這機器的被動步態(tài)自然比ASIMO的更有效率。2章1完全驅(qū)動和欠驅(qū)動系統(tǒng)被動行走機器有很長的歷史有專利的被動行走玩具可以追溯到1800年代中期。我們將在細節(jié)上討論,人們知道這些機器的動力是什么并且完成了這些實驗。這個最令人印象深刻的被動動態(tài)沃克是由史蒂夫柯林斯在康奈爾大學的實

4、驗室設計出來的。被動步行者證明ASIMO中應用的高增益反饋的方法不是必要的。事實上,行走的動力學是美麗的,應該利用,而不是取消。1.1.2鳥類與現(xiàn)代飛機這個故事是在不同類型的機器中所體現(xiàn)的驚人的相似性。現(xiàn)代飛機在空氣中可以非常有效地穩(wěn)定飛行。螺旋槳產(chǎn)生的推力非常有效,今天弧形的翼型有著高度優(yōu)化的速度和(或)效率。很容易說服自己,我們從鳥類的學習方面沒有任何遺漏。但是,就像ASIMO,這些機器大多局限于低攻飛行政權(quán)在機翼上的空氣動力學,這是非常保守并且眾所周知的事情。鳥類經(jīng)常執(zhí)行這飛行包線以外的動作(例如,當它們在樹枝上著陸時),這比我們最好的飛機更有效地利用能源(例如,風能)。因此,鳥類是非常

5、高效的飛行機器,其中一些可以遷移數(shù)千公里,而僅僅需要非常小的燃料供應。流浪的信天翁可以飛幾個小時,甚至幾天,沒有拍打它的翅膀這些鳥類利用剪切層形成的風在海洋表面的飛行技術稱為動態(tài)飆升。值得注意的是,這些鳥類的飛行成本是不可區(qū)分的基礎代謝成本,這意味著他們可以幾乎完全使用漸變的風來完成令人難以置信的飛行距離(逆風或旅行順風)。其他鳥類實現(xiàn)效率也是通過與空氣同樣豐富的交互包括編隊飛行、熱飆升,脊飆升等。大型昆蟲、小鳥、蝴蝶和蝗蟲,可以使用“陣風飆升”遷移數(shù)百甚至數(shù)千公里。鳥類也非常容易操作。高度雜技飛機的滾轉(zhuǎn)角速度(空中之鷹)大約是720度/秒;家燕有滾轉(zhuǎn)率超過5000度/秒。在一個方向上蝙蝠可以

6、在完全反方向的同時保持全速飛行的前進速度,僅僅在距離不到一半的翼展揮動翅膀。雖然定量可視化數(shù)據(jù)流,從機動飛行是稀缺的,是占主導地位的理論。大部隊機動性可以歸因于非定常空氣動力學,如。動物創(chuàng)建一個大型吸入渦迅速改變方向。這些驚人的功能要求經(jīng)常運用喇叭鏟等動作高速飛過森林和洞穴。即使在高速度和高利率,這些動物有令人難以置信的靈活性蝙蝠有時捕獲獵物翅膀,游隼可以拉25克重量并以240英里每小時的速度潛水捉麻雀。甚至可以看到小鳥通過圍欄,潛水并咬碎食物。盡管有許多對鳥類的飛行記錄令人印象深刻的統(tǒng)計數(shù)據(jù),我們的部分實驗可訪問性限制在它們做出最令人印象深刻的動作并不去打擾他們的假設下去仔細衡量鳥類(和周圍

7、的氣流) 是很困難的這,就像動力學研究游泳的魚。海豚已經(jīng)知道優(yōu)雅的游泳波與船只移動,小的魚,如藍鰓太陽魚,具有一種逃避反應,從身體不到一個身長全速推進自己;流動可視化的確證實,這是通過創(chuàng)建一個沿著身體的一側(cè)的大型吸入渦來完成的類似于蝙蝠在不到一個身長改變方向。這種被動的推進,大概是虹鱒魚逆流游泳時所使用的技術。1.1.3共同的主題古典機器人控制技術都是基于反饋,這可以用來覆蓋我們的機器的動力。這些例子表明,為了設計優(yōu)秀動態(tài)性能(效率、靈活性和健壯性)的機器人,我們需要了解如何設計控制系統(tǒng),利用動態(tài),而不是取消他們。這是本論文的主題。令人驚訝的是,有相對較少的正式控制思想,考慮“利用”動力學。為

8、了說服控制理論家考慮動力學(效率參數(shù)是不夠的),你不得不使用一些激進的方法,比如拿走他的控制權(quán)威刪除一個電動機,或一個執(zhí)行轉(zhuǎn)矩。這些問題已經(jīng)創(chuàng)建了一個正式的類系統(tǒng)欠驅(qū)動系統(tǒng),人們也開始更仔細地考慮他們機器的動態(tài)控制。1.2定義根據(jù)牛頓,機械系統(tǒng)動力學的第二定理 (F = ma)。狀態(tài)是由一個向量的位置和一個速度矢量和時間組成。二階控制動力系統(tǒng)的一般形式是:q= f(q;q_;u;t);即你在哪里控制向量,我們將看到,許多機器人的前進動力。我們關心的是反射扭矩,讓我們考慮一個略約束形式:q= f1(;q_;t)+ f2(;q_;t)u??刂葡到y(tǒng)描述方程揭示了在配置(q;q_;t)如果它能夠計算在

9、任意方向一個瞬間的加速度:rank f2(q; q_ ; t) = dimq :定義2(欠系統(tǒng))。控制系統(tǒng)描述方程1.1是欠驅(qū)動在配置(q;q_;t)。 4章1完全驅(qū)動和欠驅(qū)動系統(tǒng)在任意方向加速度a: rank f2(q; q_ ; t) dimq : 注意是否是欠驅(qū)動可能取決于控制系統(tǒng)的狀態(tài)。也就是說,欠驅(qū)動控制系統(tǒng)控制輸入的是那些不能在任意方向加快機器人的狀態(tài)。因此,圖像揭示了這個系統(tǒng)不能隨時跟隨任意欠驅(qū)動系統(tǒng)軌跡。示例1.1機器人機械手圖1.1簡單的雙擺考慮一個簡單的機器人機械手。如圖1.1中描述的運動方程,這個系統(tǒng)可以通過標準形式方程來簡單地獲得:H(q)q + C(q; q_ )q_

10、 +G(q) = B(q)u:眾所周知,慣性矩陣,H(q)是(總是)均勻?qū)ΨQ的正定,因此可逆。方程1.1收益率: q =H1(q) C(q; q_ )q_ +G(q)+H1(q)B(q)u: 因為rank,(H)-1(q)表明我們發(fā)現(xiàn)的操縱方程所描述的系統(tǒng),揭示當且僅當B(q)充滿行排名。對于這個特定的例子(q T和u =1,2=1,2T和B(q)= I22)的系統(tǒng)是完全驅(qū)動。現(xiàn)在想象在某些情況下,我們有一個電動機在肘部提供轉(zhuǎn)矩,但沒有馬達的肩膀。在這種情況下,我們有u = 2,B(q)=0,1。這個系統(tǒng)顯然是欠驅(qū)動。雖然這聽起來可能像一個牽強的例子中,事實證明,正是學習的動力,我們將在第4章

11、使用指南針步態(tài)行走的模型。因此,作為在這個例子中最常見的一種情況,這并不是唯一的案例。又例如,人體有著令人難以置信的數(shù)量的致動器(肌肉),并在許多情況下有多個肌肉/關節(jié);盡管存在更多的致動器位置變量,但當我跳在空中,沒有肌肉的組合輸入,可以改變我的重心的彈道軌跡(除非空氣動力學效應)。這樣的一個控制系統(tǒng)也是欠驅(qū)動的。在這節(jié)課我將嘗試使用保持一致的提問,q表示位置和速度,儲備x的狀態(tài)(x =q;q_T)。現(xiàn)在指出,向量總是視為列向量,向量和矩陣是標量。1.3反饋線性化完全驅(qū)動系統(tǒng)明顯比欠驅(qū)動系統(tǒng)更容易控制。主要研究結(jié)果揭示了系統(tǒng)與已知動態(tài)(如f1和f2是已知的)間可以使用反饋,這就使一個非線性控

12、制問題改變成為一個線性控制問題。線性控制領域非常先進,有許多著名的線性控制系統(tǒng)的解決方案,關鍵是反饋線性化。當f2充滿行排名,它是可逆的。考慮非線性反饋法: U0是一些額外的控制輸入。應用此方程反饋控制器,可以結(jié)果線性解耦,得到二階系統(tǒng): 換句話說,如果f1和f2是可逆的,然后我們說系統(tǒng)“反饋等價”q = U0。這個想法是對f1和f2估計,而不是已知的真值。示例1.2 反饋雙擺讓我們說,我們希望我們的簡單雙擺像一個簡單的單擺(阻尼),其動力學給出: 這是很容易實現(xiàn)的應用。根據(jù)這個想法,可以使控制看起來更容易當這種特殊情況確定系統(tǒng)動力學是時,控制派生就不會變得更困難,如果機器人有100個關節(jié),單

13、純只借助欠驅(qū)動系統(tǒng)的反饋,控制設計師就沒有選擇,只能對動力裝置的控制設計進行非線性的原因分析,這使得反饋控制器極大的復雜化。欠驅(qū)動機器人1.4欠驅(qū)動系統(tǒng)的控制是一個開放的和有趣的問題,雖然有一些特殊情況,欠驅(qū)動系統(tǒng)的控制只有相對較少的一般原則。最有趣的問題是機器人欠驅(qū)動:腿是欠驅(qū)動機器人,考慮一個與N個內(nèi)部關節(jié)和N個執(zhí)行機構(gòu)相聯(lián)系的腿部機械。如果機器人沒有與地面連接的螺栓,然后自由度系統(tǒng)包括內(nèi)部的關節(jié)和六個自由度,這個自由度系統(tǒng)定義了太空機器人的位置和方向。(大多數(shù))游泳和飛行機器人是欠驅(qū)動。這里的故事都是相同的。至于腿機器,每個控件表面添加一個致動器和一個自由度這已經(jīng)是一個簡化的了,因為實際

14、的系統(tǒng)應該包括它本身的流(華氏)狀態(tài)。機器人操縱(經(jīng)常)是欠驅(qū)動的,我們可以考慮一個完全驅(qū)動的機械手臂,當這手臂操縱的對象有多個自由度,它可能無法實現(xiàn)驅(qū)動。如果可以實現(xiàn)強制關閉和維護,那我們可以認為系統(tǒng)是完全驅(qū)動的,因為這是對多自由度對象的約束(除非操縱對象有額外的自由度)。就像我們之前所講的有腿機器人的平行設計。甚至揭示了控制系統(tǒng)可以提高使用欠教訓系統(tǒng),特別是如果有需要增加他們的動作的效率或降低設計的復雜性。1.5我們的目標本文章是基于這樣的觀察:從計算機科學的新工具它被用來為欠驅(qū)動系統(tǒng)設計反饋控制。這包括工具從數(shù)值最優(yōu)控制、運動規(guī)劃、機器學習。這個類別的目的是開發(fā)以設計機器人更有活力和更靈

15、活,比當前最先進的類別的目標受眾,包括計算機科學和機械。雖然我和線性假設一種代數(shù)、常微分方程、Matlab,將提供大部分的材料和課程筆記引用所需的課程。第二章簡單的擺2.1介紹本章的目標:我們想了解擺的動力學。為什么一個擺?在某種程度上,因為大多數(shù)我們的多連桿機器人的動力學操縱者只是大量的動力學耦合翻車機。同時,單擺的動力學是有錢的大部分概念介紹非線性動力學,我們將使用在這個文本,但易處理的足夠我們(大部分)這些在接下來的幾頁展開進行。2.2非線性動力學恒轉(zhuǎn)矩讓我們首先考慮鐘擺的動力,如果它是在一個特定的驅(qū)動的簡單方法:一個力矩,和不隨時間: I_+ b_ + mgl sin _ = u0:2

16、.2.1過阻尼擺讓我們開始學習一個特例,當這是重阻尼的情況下,b術語占主導地位加速來看,我們有: 換句話說,在沉重的阻尼的情況下,這個系統(tǒng)看起來大約一階。這是一個系統(tǒng)的一般屬性操作在低雷諾數(shù)液體。我想忽略了一個細節(jié):事實上,包裝本身在每一個2。需要明確的是,讓我們寫沒有全方位的系統(tǒng): bx_ = u0 -我們的目標是理解該系統(tǒng)的長期行為:找到x(1)x(0)。讓我們開始策劃x_ vs x為半= 0時的情況: mgl sin x:首先要注意的是,該系統(tǒng)有許多固定的點或穩(wěn)定州,每當發(fā)生x_ = 0。在這個簡單的示例中,零交叉x_ = 當系統(tǒng)在其中的一個州,它永遠不會離開狀態(tài)。如果初始條件在一個固定

17、的點,我們知道x(1)將在同一不動點。10第二章單擺接下來讓我們調(diào)查系統(tǒng)的行為在當?shù)馗浇墓潭c。選人在x =定點,如果系統(tǒng)開始固定的權(quán)利點,然后x_是積極的,所以該系統(tǒng)將離開不動點。如果它開始在左邊,然后x_是消極的,該系統(tǒng)將在相反的方向移動。我們將打電話給定點,這個屬性不穩(wěn)定。如果我們看看定點x = 0,然后這個故事是不同的:軌跡開始右邊或左邊將回來不動點。我們將稱之為定點在本地穩(wěn)定。更具體地說,我們將區(qū)分三種類型的局部穩(wěn)定性: 局部穩(wěn)定的李雅普諾夫(i.s.L)。一個固定的點,x是局部穩(wěn)定i.s.L.如果為每一個小,我可以生產(chǎn),如果kx(0)-xk 0,流是向右移動,x_ 0,流動是向左移動。如果我們進一步標注圖,箭頭指示的方向流,然后整個(長期)系統(tǒng)行為變得清晰:例如,我們可以看到,任何初始條件x(0)2(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論