當(dāng)機(jī)器人遇見機(jī)器學(xué)習(xí)_第1頁
當(dāng)機(jī)器人遇見機(jī)器學(xué)習(xí)_第2頁
當(dāng)機(jī)器人遇見機(jī)器學(xué)習(xí)_第3頁
當(dāng)機(jī)器人遇見機(jī)器學(xué)習(xí)_第4頁
當(dāng)機(jī)器人遇見機(jī)器學(xué)習(xí)_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

當(dāng)機(jī)器人遇見機(jī)器學(xué)習(xí)——NAO機(jī)器人的人機(jī)互動(dòng)及示教編程應(yīng)用背景介紹一、關(guān)于NAO機(jī)器人本項(xiàng)目的開發(fā)基礎(chǔ)是法國(guó)AldebaranRobotics公司(軟銀機(jī)器人公司)生產(chǎn)的人形NAO機(jī)器人,它具備較高水平的人工智能,能夠與人親切的互動(dòng),它主要用于科研教學(xué)領(lǐng)域,用戶可以通過官方提供Choregraphe軟件和SDK來控制NAO。也有愛好者使用NAO機(jī)器人來完成一些簡(jiǎn)單的舞蹈表演、擊球項(xiàng)目以及模仿人類各種行為等。如圖為如圖為NAO的組成??偣灿?5關(guān)節(jié),主要分成頭部(2),手臂(12),腰部(1),腿部(10)。手臂和腿部關(guān)節(jié)是左右對(duì)稱的。有霍爾效應(yīng)傳感器(32)、接觸傳感器(3)、紅外線傳感器(2)、超聲波傳感器(2)、一個(gè)雙軸陀螺儀傳感器(1)、三軸加速度傳感器(2)、減壓傳感器(8)和避震器(2)。還有使用于圖像和語音處理的攝影機(jī)(2)、麥克風(fēng)(4)和揚(yáng)聲器(2)。Nao是在學(xué)術(shù)領(lǐng)域世界范圍內(nèi)運(yùn)用最廣泛的類人機(jī)器人。法國(guó)AldebaranRobotics(阿爾德巴蘭機(jī)器人)公司將Nao的技術(shù)開放給所有的高等教育項(xiàng)目,并于2010年成立基金會(huì)支持在機(jī)器人及其應(yīng)用領(lǐng)域的教學(xué)項(xiàng)目。Nao的多用途是基于它可以通過現(xiàn)成的指令塊進(jìn)行可視化編程,因此它允許用戶探索各種領(lǐng)域、運(yùn)用各種復(fù)雜程度的編程程序并達(dá)到用戶想要體驗(yàn)的各種不同效果。教學(xué)用機(jī)器人通常是有趣、有挑戰(zhàn)性和能激發(fā)想象力的。Nao作為教與學(xué)的得力助手,正在創(chuàng)造著未來的教育方式。超過1700個(gè)Nao已經(jīng)被全球30個(gè)國(guó)家的450多所頂尖高校和實(shí)驗(yàn)室購買作為研究工具。正在使用Nao的高校機(jī)構(gòu)有美國(guó)哈佛大學(xué)和布朗大學(xué)、英國(guó)威爾士大學(xué)、德國(guó)弗萊堡大學(xué)、日本東京大學(xué)、中國(guó)浙江大學(xué)、同濟(jì)大學(xué)和山西大學(xué)。高校不僅將Nao運(yùn)用在機(jī)器人研究,人工智能和計(jì)算機(jī)科學(xué)領(lǐng)域,還運(yùn)用在社會(huì)學(xué)和醫(yī)療保健領(lǐng)域。Nao參與的研究項(xiàng)目包括自閉癥治療、多智能體系統(tǒng)、自動(dòng)化、訊號(hào)處理、全身運(yùn)動(dòng)以及路徑規(guī)劃。Nao硬件采用最新科技設(shè)計(jì)制造,保證了Nao動(dòng)作的流暢性,還配備了多種傳感器。Nao機(jī)器人比較特別的地方是使用Intel的嵌入式處理器,使用C++或Python語言來控制,高度為23寸,約60公分。此外,NAO機(jī)器人可以在多種平臺(tái)上編程并且擁有一個(gè)開放式的編程構(gòu)架,所以不同的軟件模塊可以更好的相互作用,不論使用者的專業(yè)水平如何,都能夠通過圖像編程平臺(tái)來為NAO機(jī)器人編制程。二、關(guān)于人體姿態(tài)傳感器姿態(tài)傳感器是基于MEMS技術(shù)的高性能三維運(yùn)動(dòng)姿態(tài)測(cè)量系統(tǒng)。它包含三軸陀螺儀、三軸加速度計(jì),三軸電子羅盤等運(yùn)動(dòng)傳感器,通過內(nèi)嵌的低功耗ARM處理器得到經(jīng)過溫度補(bǔ)償?shù)娜S姿態(tài)與方位等數(shù)據(jù)。利用基于四元數(shù)的三維算法和特殊數(shù)據(jù)融合技術(shù),實(shí)時(shí)輸出以四元數(shù)、歐拉角表示的零漂移三維姿態(tài)方位數(shù)據(jù)。LPMS系列和iAHRS-M0[1]姿態(tài)傳感器可廣泛嵌入到航模無人機(jī),機(jī)器人,機(jī)械云臺(tái),車輛船舶,地面及水下設(shè)備,虛擬現(xiàn)實(shí),人體運(yùn)動(dòng)分析等需要自主測(cè)量三維姿態(tài)與方位的產(chǎn)品設(shè)備中。通過WiFi將姿態(tài)傳感器的數(shù)據(jù)發(fā)送給機(jī)器人,讓機(jī)器人識(shí)別人體實(shí)時(shí)動(dòng)作,然后做出相應(yīng)反應(yīng),即可實(shí)現(xiàn)人機(jī)互動(dòng)或者是對(duì)機(jī)器人的實(shí)時(shí)控制。目的與功能基于動(dòng)作的人機(jī)互動(dòng)目的:目前使用NAO機(jī)器人與人進(jìn)行互動(dòng)多是基于語音和視覺,但是這兩種方式準(zhǔn)確度都不夠高。因此我們希望通過捕捉人類互動(dòng)時(shí)的各種動(dòng)作讓NAO學(xué)習(xí)人類互動(dòng)的方式。預(yù)期效果:NAO能夠與人進(jìn)行常規(guī)的互動(dòng),比如:揮手打招呼、握手、擁抱等。2.通過肢體動(dòng)作遠(yuǎn)程控制NAO目的:方便用戶不在家時(shí)能夠輕松控制放在家里的NAO機(jī)器人,讓機(jī)器人能夠代替人去做一些事情。預(yù)期效果:通過捕捉用戶上半身的動(dòng)作實(shí)時(shí)控制機(jī)器人所有動(dòng)作。3.實(shí)現(xiàn)一種新的示教式編程方式目的:目前對(duì)機(jī)器人的示教式編程多是一種“手把手”示教的方式,即由人直接掰動(dòng)機(jī)器人的但這種方式在對(duì)多自由度的類人機(jī)器人進(jìn)行編程時(shí)顯得十分不便。預(yù)期效果:通過捕捉人的肢體數(shù)據(jù)直接對(duì)機(jī)器人示教,從而讓機(jī)器人“看”一次人類如何做一件簡(jiǎn)單的事之后就會(huì)做這件事。前期經(jīng)驗(yàn)已經(jīng)對(duì)官方提供的各功能模塊有了較好的掌握,未來將更加注重細(xì)節(jié),通過對(duì)程序的優(yōu)化和算法的創(chuàng)新彌補(bǔ)機(jī)器人自身的一些不足之處。機(jī)器人存在的問題主要是因?yàn)楸旧碛布o法達(dá)到理想狀態(tài),導(dǎo)致很多問題不像想象中的簡(jiǎn)單。雖然生產(chǎn)人形機(jī)器人的公司都宣稱自己的機(jī)器人可以做這樣那樣的事情,但其精確性和穩(wěn)定性都不太好。大多數(shù)機(jī)器人比賽其實(shí)就是看誰能更好的解決這些機(jī)器人硬件本身不足導(dǎo)致的問題。例如:①機(jī)器人走不穩(wěn)走不直,行走參數(shù)不易調(diào)整→通過機(jī)器學(xué)習(xí)優(yōu)化機(jī)器人行走步態(tài);②官方提供的檢測(cè)摔倒程序占用了寶貴的CPU資源→加入自主創(chuàng)新的摔倒處理程序;③減少對(duì)電腦的依賴,盡可能用手機(jī)控制程序的運(yùn)行。機(jī)器學(xué)習(xí)技術(shù)實(shí)現(xiàn)目標(biāo):通過已有數(shù)據(jù)進(jìn)行分類數(shù)據(jù)示例:上圖中所示的數(shù)據(jù)為,測(cè)試者做出某一特定動(dòng)作時(shí),傳感器采集到的16個(gè)參數(shù),首先將其結(jié)構(gòu)化為下表中的形式。參數(shù)1參數(shù)2…….參數(shù)16動(dòng)作類型動(dòng)作1XxxxXxx…….Xxx0動(dòng)作2XxxXxx…….Xxx1動(dòng)作3XxxXxx…….Xxx1我們采用SVM分類方法,通過更換不同的核函數(shù)進(jìn)行測(cè)試,結(jié)果如下:SVM核函數(shù)LinearQuadraticCubicMediumGaussianCoarseGaussian準(zhǔn)確率99.899.999.799.999.6另外我們也嘗試用GDA分類方法:分類方法GDA(GaussianDiscriminantAnalysis)準(zhǔn)確率99.86方法:先對(duì)16個(gè)特征降維,然后選擇可解釋度最高,且之和大于95%的前幾個(gè)特征(一般是前7個(gè))訓(xùn)練與測(cè)試數(shù)據(jù):然后分別用5中支持向量機(jī)對(duì)其進(jìn)行分類(這里采用5folds,即將數(shù)據(jù)分為5分,4分訓(xùn)練一份測(cè)試,如此循環(huán),直到全部數(shù)據(jù)都被測(cè)試),最后畫出置混淆矩陣,給出每種方法的準(zhǔn)確率:。以性能表現(xiàn)較好的LinearSVM方法為例:散點(diǎn)圖:混淆矩陣:其他信息:總結(jié):每種方法都可以得到較高的準(zhǔn)確率,但識(shí)別出錯(cuò)的情況各不相同。由此,如果像進(jìn)一步提高準(zhǔn)確率,可以將5種方法作為5個(gè)分類器,集成為boosting算法將是較為可行的思路。進(jìn)度安排第一階段進(jìn)行數(shù)據(jù)的采集和訓(xùn)練,通過機(jī)器學(xué)習(xí)對(duì)傳感器采集到的數(shù)據(jù)進(jìn)行動(dòng)作分類,完成機(jī)器人、傳感器、電腦(或手機(jī))三者之間的通信程序。第二階段讓機(jī)器人通過已經(jīng)訓(xùn)練好的結(jié)果來判斷人在做什么動(dòng)作,并做出相應(yīng)的互動(dòng)和回應(yīng)第三階段將第二階段的實(shí)驗(yàn)結(jié)果拓展到實(shí)際應(yīng)用領(lǐng)域,比如交通指揮,音樂指揮,旗語交流等,使我們的研究結(jié)果具有實(shí)際價(jià)值。拓展方向 在原有DRL(深度增強(qiáng)學(xué)習(xí))算法訓(xùn)練的基礎(chǔ)上,通過模仿人類的動(dòng)作來調(diào)整策略,使得機(jī)器人的行為看起來更像人,而不是僵死地行動(dòng)。 這種方法使得機(jī)器人的行為看起來很人非常像,而使用人的樣本還可以很少。 波士頓動(dòng)力的大狗,研發(fā)幾十年得到的成果,現(xiàn)在則可能通過深度學(xué)習(xí)可能可以更快更好的實(shí)現(xiàn)。參考文獻(xiàn)[1]孫翔侃,白寶興.基于機(jī)器學(xué)習(xí)的NAO機(jī)器人檢測(cè)跟蹤[J].長(zhǎng)春理工大學(xué)學(xué)報(bào)(自然科學(xué)版).2016年02期[2]張仁彥,劉孟茹,孔凡超,趙傳林,趙洪亮.基于Python的Nao機(jī)器人實(shí)驗(yàn)系統(tǒng)設(shè)計(jì)[J].中國(guó)現(xiàn)代教育裝備.2017年01期[3]秦嬌,王向華.基于PID控制的NAO機(jī)器人循線行走技術(shù)研究[J].山東科技大學(xué)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論