已閱讀5頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
一篇較長(zhǎng)介紹RoboCup的畢業(yè)論文.pdf.pdf 免費(fèi)下載
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
浙江大學(xué)本科畢業(yè)論文 i摘 要 隨著計(jì)算機(jī)技術(shù)的發(fā)展,分布式人工智能中多智能體系統(tǒng)(MAS:Multi-agent System)的理論及應(yīng)用研究已經(jīng)成為人工智能研究的熱點(diǎn)。RoboCup(Robot World Cup),即機(jī)器人世界杯足球錦標(biāo)賽,是一個(gè)在實(shí)時(shí)異步,有噪聲的對(duì)抗環(huán)境下,研究多智能體的決策和合作的問(wèn)題。要實(shí)現(xiàn)多智能體間的良好的合作必須克服諸如通訊帶寬低,通訊不可靠,干擾因素多,每個(gè)智能體獲得的感知信息是不完整的,智能體的執(zhí)行動(dòng)作也存在誤差等問(wèn)題。作為國(guó)際上一項(xiàng)為提高相關(guān)領(lǐng)域的教育和研究水平而舉行的大型比賽和學(xué)術(shù)活動(dòng),通過(guò)提供一個(gè)標(biāo)準(zhǔn)任務(wù)來(lái)促進(jìn)分布式人工智能、智能機(jī)器人技術(shù)、及其相關(guān)領(lǐng)域的研究與發(fā)展。 本篇論文詳細(xì)介紹了計(jì)算機(jī)仿真足球機(jī)器人的設(shè)計(jì)與實(shí)現(xiàn)。首先介紹了RoboCup的研究背景,然后介紹了SoccerServer的仿真環(huán)境。從第三章開(kāi)始介紹了具體的足球機(jī)器人Agent的設(shè)計(jì)和實(shí)現(xiàn)。Agent的框架部分說(shuō)明了開(kāi)發(fā)環(huán)境,程序的基本框架。通訊層主要分析智能體獲得信息后,怎么處理這些信息,更新智能體內(nèi)部維持的世界模型。 Agent的個(gè)人技術(shù)部分則側(cè)重闡述了程序設(shè)計(jì)中的難點(diǎn)。最后分析了Agent的頂層策略,講述了球隊(duì)上層結(jié)構(gòu)的設(shè)計(jì),提出了Agent的智能化設(shè)計(jì)。例如基于場(chǎng)上形勢(shì)的動(dòng)態(tài)站位和角色變換,智能性的觀察和通訊機(jī)制。 關(guān)鍵詞: RoboCup,SoccerServer,多智能體系統(tǒng),分布式人工智能 浙江大學(xué)本科畢業(yè)論文 iiAbstract With the development of the computer technology, research on the theory and application of Multi-agent system (MAS) has become a hotspot of Artificial Intelligence. RoboCup,the Robot World Cup,is a fully distributed, multi-agent domain with both teammates and adversaries under the condition of real-time asynchronous and noisy conflict. In order to achieve a good co-operation between the agents, some problems must be resolved such as low bandwidth, unstable communication and too much interference. As an academic initiative of the education and research in such fields, RoboCup provides a standard project for development of DAI (Distributed Artificial Intelligence), Robotic, etc. The paper presents a Design and Implement of the Soccer Simulator Robot. First, the background of RoboCup and the simulator model of the Soccerserver are introduced. Then the design and implementation of Soccer Agent is described. In chapter 3, the main framework of the Agent is suggested. Simultaneously, how to maintain the world state when the agent receives sense information from server is analyzed. Finally the top-level strategy such as Situation Based Dynamic Positioning and Role Exchange, Intelligent Perception and Communication is discussed in detail. Keywords: RoboCup, SoccerServer, Multi-agent system,Distributed Artificial Intelligence 浙江大學(xué)本科畢業(yè)論文 iii目 錄 摘 要.I ABSTRACT . II 目 錄.III 第一章 ROBOCUP研究背景. 1 1.1 引言. 1 1.2 中國(guó)ROBOCUP研究現(xiàn)狀. 3 第二章 SOCCERSERVER仿真環(huán)境. 4 2.1 ROBOCUP仿真比賽環(huán)境. 4 2.2 SOCCERSERVER仿真模型. 5 2.2.1 場(chǎng)地和球員. 5 2.2.2 環(huán)境干擾. 6 2.2.3 球員的體力模型. 6 2.2.4 球員的感知信息. 7 2.3 特點(diǎn). 12 2.4 小結(jié). 12 第三章 AGENT框架概述. 13 3.1 開(kāi)發(fā)環(huán)境. 13 3.2 程序框架. 13 3.2.1 根據(jù)智能層次劃分. 13 3.2.2 根據(jù)程序結(jié)構(gòu)劃分程序框架. 16 3.3 小結(jié). 20 第四章 通訊及信息處理. 21 4.1 球員體系結(jié)構(gòu). 21 4.2 智能體基本循環(huán). 21 4.3 預(yù)言性記憶. 22 4.3.1 對(duì)象描述. 22 4.3.2 智能體世界模型的更新. 23 第五章 底層技術(shù). 26 浙江大學(xué)本科畢業(yè)論文 iv5.1 PLOS. 26 5.2 幾何計(jì)算和神經(jīng)網(wǎng)絡(luò). 26 5.3 底層動(dòng)作的發(fā)送策略. 27 5.4 小結(jié). 28 第六章 頂層策略. 29 6.1 陣型和角色. 29 6.2 陣線(xiàn)位置的確定. 30 6.3 攻防狀態(tài)的切換. 31 6.4 基于場(chǎng)上形勢(shì)的動(dòng)態(tài)站位和角色變換. 32 6.5 智能感知和通訊. 33 6.5.1 智能通訊機(jī)制. 33 6.5.2 智能觀察機(jī)制. 33 6.6 小結(jié). 34 第七章 結(jié)論和展望. 35 參考文獻(xiàn). 36 致 謝. 37 RobuCup研究背景 1第一章 RoboCup研究背景 1.1 引言 RoboCup(Robot World Cup),即機(jī)器人世界杯足球錦標(biāo)賽。它是國(guó)際上一項(xiàng)為提高相關(guān)領(lǐng)域的教育和研究水平而舉行的大型比賽和學(xué)術(shù)活動(dòng),通過(guò)提供一個(gè)標(biāo)準(zhǔn)任務(wù)來(lái)促進(jìn)分布式人工智能、智能機(jī)器人技術(shù)、及其相關(guān)領(lǐng)域的研究與發(fā)展。 訓(xùn)練和制造機(jī)器人進(jìn)行足球賽,是當(dāng)前人工智能和機(jī)器人領(lǐng)域的研究熱點(diǎn)之一。機(jī)器人足球比賽的設(shè)想首先是由加拿大不列顛哥倫比亞大學(xué)的教授Alan Mackworth在1992年的論文On Seeing Robots中提出的。同年10月,在東京舉行的關(guān)于人工智能領(lǐng)域重大挑戰(zhàn)的研討會(huì)中,與會(huì)的研究人員討論了人工智能領(lǐng)域中具有挑戰(zhàn)性的問(wèn)題,同時(shí)對(duì)制造和訓(xùn)練機(jī)器人進(jìn)行足球比賽以促進(jìn)相關(guān)領(lǐng)域研究的問(wèn)題進(jìn)行了探討。在一些學(xué)者的積極倡導(dǎo)(如美國(guó)CMU的Manuela M. Veloso教授等),以及SONY公司的全力支持下,RoboCup世界聯(lián)合會(huì)于1996年宣告成立,并于同年在日本舉行了一次表演賽,獲得了很大地成功。比賽每年舉辦一屆。第一屆RoboCup比賽和會(huì)議于1997年在日本的名古屋舉行,大約有40支機(jī)器人球隊(duì)(包括美國(guó)、日本和歐洲的主要大學(xué)及研究機(jī)構(gòu))和超過(guò)5000名觀眾參加此次盛會(huì)。1998年7月,正當(dāng)?shù)?6屆世界杯足球賽漸入佳境之時(shí),第二屆機(jī)器人足球世界杯賽在巴黎隆重舉行,60多支球隊(duì)參加了比賽。1999年7月,第三屆機(jī)器人足球世界杯賽在瑞典斯德哥爾摩舉行,參賽隊(duì)多達(dá)90余支。一些著名的大學(xué)(如美國(guó)卡內(nèi)基梅隆大學(xué)、康奈爾大學(xué))、國(guó)立研究機(jī)構(gòu)(如美國(guó)NASA國(guó)家航空和宇宙航行局)和大公司(如日本SONY公司)均參與了相關(guān)的活動(dòng)和比賽。第四屆RoboCup機(jī)器人足球世界杯賽在澳大利亞墨爾本舉行,中國(guó)有了第一支進(jìn)入 RoboCup 世界杯賽仿真組比賽的球隊(duì)科大藍(lán)鷹隊(duì),并獲得第九名。今年8月將在美國(guó)西雅圖舉行第五屆機(jī)器人足球世界杯賽。 1997年可以說(shuō)是人工智能發(fā)展史上重要的一年。1997年5月,IBM公司的深藍(lán)計(jì)算機(jī)在國(guó)際象棋比賽中擊敗了人類(lèi)的國(guó)際象棋冠軍卡斯帕洛夫。1997年7月4日,NASA的自治機(jī)器人系統(tǒng)寄居者,成功登陸火星,并在火星表面RobuCup研究背景 2開(kāi)展活動(dòng)。1997年8月23日到29日,第一屆RoboCup比賽和會(huì)議成功舉行,從而為實(shí)現(xiàn)機(jī)器人足球隊(duì)在未來(lái)?yè)魯∪祟?lèi)足球冠軍隊(duì)的夢(mèng)想邁出了堅(jiān)實(shí)的第一步。 舉辦機(jī)器人世界杯足球賽的目的是為了促進(jìn)分布式人工智能研究與教育的發(fā)展。通過(guò)提供一個(gè)標(biāo)準(zhǔn)任務(wù),使得研究人員利用各種技術(shù),獲得更好的解決方案,從而有效促進(jìn)各領(lǐng)域的發(fā)展。為了讓一個(gè)機(jī)器人組成的足球隊(duì)更接近一個(gè)人類(lèi)的足球隊(duì),各種技術(shù)必須完美的結(jié)合在一起。涉及的研究領(lǐng)域包括:智能機(jī)器人系統(tǒng)、多智能體系統(tǒng)、實(shí)時(shí)模式識(shí)別與行為系統(tǒng)、智能體結(jié)構(gòu)設(shè)計(jì)、實(shí)時(shí)規(guī)劃和推理、基于網(wǎng)絡(luò)的三維圖形交互、傳感器技術(shù)等。研究目標(biāo)是計(jì)劃經(jīng)過(guò)五十年左右的研究,使機(jī)器人足球隊(duì)能戰(zhàn)勝人類(lèi)足球冠軍隊(duì)。 在棋類(lèi)比賽中人工智能已經(jīng)取得了很大的成功。比較一下Chess和RoboCup的區(qū)別(表一),可以明顯看出RoboCup有如下特點(diǎn):動(dòng)態(tài)、實(shí)時(shí)、信息不完全、非符號(hào)化,和分布性。這就對(duì)人工智能的研究提出了更高的要求。 Chess Robocup Environment Static Dynamic State Change Turn Taking RealTime Info.accessibility Complete Incomplete Sensor Readings Symbolic Non-Symbolic Control Central Distributed 表一 棋類(lèi)比賽和RoboCup的對(duì)比 目前,RoboCup活動(dòng)包括如下幾個(gè)方面: 1. 技術(shù)會(huì)議 2. 機(jī)器人足球賽 3. 機(jī)器人足球挑戰(zhàn)賽 4. 教育程序 5. 基礎(chǔ)結(jié)構(gòu)發(fā)展 當(dāng)然,機(jī)器人足球賽是整個(gè)活動(dòng)的主要部分,研究者們會(huì)聚一堂,評(píng)價(jià)研究的進(jìn)展情況。機(jī)器人足球賽錦標(biāo)包括: 1. 仿真組比賽 RobuCup研究背景 32. 小型機(jī)器人組比賽 3. 小型機(jī)器人組標(biāo)準(zhǔn)比賽(每隊(duì)11人) 4. 中型機(jī)器人組比賽 5. Sony 有腿機(jī)器人比賽 (Sony公司發(fā)起) 6. 類(lèi)人機(jī)器人組比賽 (計(jì)劃從2002年開(kāi)始) 7. 遙操作比賽(即將宣布) 8. RoboCup展示會(huì) RoboCup仿真組比賽是各種比賽中參賽隊(duì)數(shù)目最多的一種。由于仿真環(huán)境與人類(lèi)足球比賽的環(huán)境相似,比賽隊(duì)員的仿真模型與實(shí)際隊(duì)員也很接近,這里可以實(shí)現(xiàn)機(jī)器人比賽中由于機(jī)器人硬件的不足而放棄的規(guī)則,故其對(duì)于分布式人工智能理論的研究具有重要意義。 1.2 中國(guó)RoboCup研究現(xiàn)狀 1999年6月,經(jīng)國(guó)際RoboCup聯(lián)合會(huì)主席北野宏明授權(quán),由清華大學(xué)和中國(guó)科大共同發(fā)起,成立了國(guó)際RoboCup聯(lián)合會(huì)中國(guó)分會(huì),即China RoboCup Association(CRA)。并于當(dāng)年10月在重慶舉辦第一屆中國(guó)RoboCup仿真機(jī)器人足球賽。2000年6月在安徽合肥中國(guó)科學(xué)技術(shù)大學(xué)舉行的全球智能控制大會(huì)上同時(shí)進(jìn)行了中國(guó)RoboCup2000機(jī)器人足球錦標(biāo)賽。中國(guó)RoboCup-2001機(jī)器人足球錦標(biāo)賽將于今年8月13日至16日在昆明舉行,參賽隊(duì)伍有浙江大學(xué)、中國(guó)科技大學(xué)、清華大學(xué)、北京理工大學(xué)等院校。中國(guó)科技大學(xué)已經(jīng)參加了2000年RoboCup 世界杯賽仿真組比賽,還將參加今年八月在美國(guó)西雅圖舉行的第五屆機(jī)器人足球世界杯仿真組比賽和有腿組比賽;參加今年仿真組比賽的中國(guó)隊(duì)伍還有清華大學(xué)隊(duì)。SoccerServer仿真環(huán)境 4第二章 SoccerServer仿真環(huán)境 2.1 RoboCup仿真比賽環(huán)境 RoboCup仿真組比賽是各種比賽中參賽隊(duì)數(shù)目最多的一種。仿真比賽是在一個(gè)標(biāo)準(zhǔn)的計(jì)算機(jī)環(huán)境內(nèi)進(jìn)行的,比賽規(guī)則與國(guó)際足球聯(lián)合會(huì)的比賽規(guī)則相似,只是在某些方面有改動(dòng)。本節(jié)簡(jiǎn)要的介紹仿真比賽主要部分。 比賽采用Client/Server方式,由RoboCup聯(lián)合會(huì)提供標(biāo)準(zhǔn)的SoccerServer系統(tǒng),參賽隊(duì)編寫(xiě)各自的Client程序,模擬實(shí)際足球隊(duì)員進(jìn)行比賽。 SoccerServer是一個(gè)允許競(jìng)賽者使用各種程序語(yǔ)言進(jìn)行仿真足球比賽的系統(tǒng)。它提供了一個(gè)虛擬場(chǎng)地,并對(duì)比賽雙方的全部隊(duì)員和足球的狀態(tài)進(jìn)行仿真。Client,相當(dāng)于球員的大腦,指揮球員的運(yùn)動(dòng)。由于比賽是以Client/Server方式進(jìn)行的,所以對(duì)球隊(duì)的開(kāi)發(fā)編譯沒(méi)有任何限制。僅要求球隊(duì)的開(kāi)發(fā)工具提供通過(guò)UDP/IP連接的Client/Server支持,這是因?yàn)镾erver和每個(gè)Client之間的通訊都是通過(guò)UDP/IP端口實(shí)現(xiàn)的。每個(gè)Client都是獨(dú)立的進(jìn)程,通過(guò)給定的端口和Server連接。一支球隊(duì)可以有最多11個(gè)Client(或者說(shuō)是球員),也就是說(shuō)競(jìng)賽者同時(shí)運(yùn)行與比賽球員數(shù)目相等的Client。當(dāng)球員和Server連接上后,所有的信息都通過(guò)這個(gè)端口傳遞。球員發(fā)送他們下一步要做的動(dòng)作請(qǐng)求給Server(如踢球,轉(zhuǎn)身等)。Server接收到這些消息后,執(zhí)行對(duì)應(yīng)指令,并相應(yīng)的更新 圖1 SoccerMonitor SoccerServer仿真環(huán)境 5環(huán)境。另一方面,Server向所有的球員提供感知信息(如:關(guān)于足球,球門(mén)和其他球員位置的可視信息)。每個(gè)Client模塊只允許控制一名球員,Client之間不允許直接進(jìn)行通信,Client之間的通訊必須通過(guò)SoccerServer來(lái)進(jìn)行,因此通訊帶寬受到一定的限制。SoccerServer包含兩個(gè)程序:SoccerServer和SoccerMonitor。 SoccerServer的工作是仿真足球和隊(duì)員的狀態(tài)、與Client進(jìn)行通信、按照一定的規(guī)則控制游戲的進(jìn)程(裁判功能)。SoccerMonitor是一個(gè)可視化的工具,負(fù)責(zé)利用Windows(X window或Windows 9X/2K)系統(tǒng)顯示虛擬場(chǎng)地,如圖1所示。在SoccerMonitor上顯示的信息包括比分,球隊(duì)名字,所有球員和足球的位置。SoccerMonitor也提供了一個(gè)很簡(jiǎn)單的Server接口。如:當(dāng)兩支球隊(duì)都連接上后,可以點(diǎn)擊在SoccerMonitor上的“KickOff”按鈕開(kāi)始比賽。當(dāng)然,在Server上進(jìn)行比賽,SoccerMonitor并不是必需的。然而,如果有需要的話(huà),可以同時(shí)與多個(gè)SoccerMonitor相連,在多個(gè)顯示器上同時(shí)顯示比賽的情況。 2.2 SoccerServer仿真模型 2.2.1 場(chǎng)地和球員 仿真環(huán)境中足球場(chǎng)和其中的全部對(duì)象都是二維的。任何對(duì)象都沒(méi)有高度的概念。比賽場(chǎng)地的尺寸為10568(單位沒(méi)有意義),球門(mén)寬度為14.64,是實(shí)際比例的兩倍。實(shí)驗(yàn)證明,對(duì)于正常的寬度比例是很難進(jìn)球的。 球員和球都使用圓圈來(lái)表示。動(dòng)作模型是離散的(在一個(gè)仿真周期結(jié)束時(shí)全部的動(dòng)作被執(zhí)行一次)。每個(gè)仿真周期時(shí)間的長(zhǎng)短是由參數(shù)simulator_step*決定的。在每個(gè)仿真周期結(jié)束前,SoccerServer接收所有Client的命令,并執(zhí)行命令,利用當(dāng)前場(chǎng)上對(duì)象(球員和球)的位置和速度信息計(jì)算出全部對(duì)象新的位置和速度信息。 在仿真周期內(nèi),對(duì)象的移動(dòng)按如下公式進(jìn)行計(jì)算: (11,+ tytxuu)=(tytxvv ,)+(tytxaa ,):accelerate (11,+ tytxpp)=(tytxpp ,)+(11,+ tytxuu):move (11,+ tytxvv)= ),(11 +tytxuudecay:decayspeed *斜體表示SoccerServer的參數(shù)。 SoccerServer仿真環(huán)境 6(11,+ tytxaa)=(0,0):resetacceleration 其中,(tytxpp ,)和(tytxvv ,)分別表示t時(shí)刻物體的位置和速度。Decay是一個(gè)參數(shù),分別由ball-decay和player-decay控制。(tytxaa ,)表示對(duì)象的加速度,可以通過(guò)dash*(針對(duì)隊(duì)員)和kick(針對(duì)足球)的Power 參數(shù)計(jì)算得到: (tytxaa ,)= Powerpower_rate )sin(),(cos(tt 其中t表示對(duì)象在t時(shí)刻的前進(jìn)方向,power_rate就是dash_power_rate或者是kick_power_rate。如果對(duì)象為球員,它的方向就是球員臉朝向的方向。 對(duì)于足球,其方向的計(jì)算方法是: Directiontkictball+=ker 其中tball和tkic ker表示球和踢球隊(duì)員當(dāng)前的方向,而Direction是kick命令中第二個(gè)參數(shù)。 2.2.2 環(huán)境干擾 為了反映出實(shí)際比賽中球及球員運(yùn)動(dòng)的不確定性,SoccerServer在球及球員的移動(dòng)和轉(zhuǎn)身過(guò)程中加入了一定的干擾因素。 首先考慮移動(dòng),干擾是以如下方式加入的: (11,+ tytxuu)=(tytxvv ,)+(tytxaa ,)+(maxmax,rrrr) maxrr為屬于maxmax, rr的隨機(jī)數(shù)。rmax的定義為: rmax ),(tytxvvrand = rand是player-rand和ball-rand的參數(shù)。 命令中的Moment和Power參數(shù)的干擾為:(用argument表示) umentrumentrandarg)1(arg += 2.2.3 球員的體力模型 每個(gè)球員都有自己的體力值。SoccerServer通過(guò)限制球員的體力來(lái)阻止隊(duì)員始終以最大速度(player_sp_max)跑動(dòng)。球員的體力模型包含三個(gè)方面: 1) stamina ( 0,stamina_max),表示球員的體力,它限制dash命令的Power參數(shù)。 2) effort ( effort_min,1.0) 表示了球員體力的使用效率。 3) recovery ( recovery_min,1.0) 控制體力的恢復(fù)速率。 *黑色斜體表示SoccerServer定義的球員命令。 SoccerServer仿真環(huán)境 7具體的計(jì)算方法為: z 當(dāng)一個(gè)球員使用(dash Power)命令時(shí),他的Power參數(shù)要受到stamina和effort的影響: effective_dash_power = Min(stamina, Power) effort stamina = stamina effective_dash_power 由上式可知,effort的大小決定了stamina中可以有效使用的部分。 z 在每個(gè)循環(huán)周期內(nèi),如果stamina低于effort_dec_thr時(shí),effort減少,stamina高于effort_inc_thr時(shí),effort增加: if stamina effort_dec_thr stamina_max and effort effort_min then effort = effort - effort_dec if stamina effort_inc_thr stamina_max and effort recover_min then recovery = recovery - recover_dec z 在每個(gè)循環(huán)周期內(nèi),stamina會(huì)得到一定程度的恢復(fù)?;謴?fù)時(shí),依recovery的當(dāng)前值進(jìn)行: stamina = stamina + recoverystamina_inc if stamina stamina_max, then stamina = stamina_max 2.2.4 球員的感知信息 球員從SoccerServer接受的感知信息包括聽(tīng)覺(jué)和視覺(jué)信息。對(duì)于球員來(lái)說(shuō),這些信息是非常重要的。本節(jié)詳細(xì)論述感知信息的格式和使用方法。 1聽(tīng)覺(jué)信息 當(dāng)某球員或裁判(referee)發(fā)送消息(say Message)時(shí),附近的其他球員包括對(duì)方球員可以立即聽(tīng)到消息,沒(méi)有延遲。他們從Server接收到(hear Time SoccerServer仿真環(huán)境 8Sender Message)格式的消息。其中: 1. Time:當(dāng)前的仿真周期。 2. Sender 如果是其他球員發(fā)送的消息,那么是發(fā)送者的相對(duì)方向,否則就是下面的可能選項(xiàng): self:發(fā)送者是球員本人。 referee:發(fā)送者是裁判。 online_coach_left或者online_coach_ringt:發(fā)送者是在線(xiàn)教練。 3. 如是裁判發(fā)的消息,Sender為“referee”,且可能的Message為:before_kick_off、kick_off_l、kick_off_r、kick_in_l、kick_in_r、corner_kick_l、corner_kick_r、goal_kick_l、goal_kick_r、free_kick_l、free_kik_r、offside_l、offside_r、play_on、half_time、time_up、extend、foul_Side_Unum、goal_Side_Point。 4. Message代表消息的內(nèi)容,最長(zhǎng)say_msg_size個(gè)字節(jié)。 隊(duì)員僅有有限的通訊能力,只能聽(tīng)到一定距離之內(nèi)的聲音,此距離由SoccerServer參數(shù)audio_cut_off_dist決定。同時(shí)隊(duì)員在hear_decay個(gè)循環(huán)周期內(nèi)只能聽(tīng)到hear_inc條消息。一般情況下,在2個(gè)循環(huán)周期內(nèi),當(dāng)多名隊(duì)員同時(shí)發(fā)送多個(gè)某消息時(shí),一名隊(duì)員只能接收一條,而丟失了其它的消息,被接收到的消息是不確定的(現(xiàn)在是根據(jù)消息到達(dá)的順序來(lái)選擇)。裁判(referee)所發(fā)的消息具有最高的優(yōu)先級(jí),可以被全部隊(duì)員接收到。為了避免球隊(duì)阻塞信道使對(duì)手的交流失效,我們將球員的兩支球隊(duì)的聽(tīng)覺(jué)能力分離,也就是說(shuō),每個(gè)球員在每?jī)蓚€(gè)仿真周期內(nèi)能從每支球隊(duì)接收到一條消息。 2視覺(jué)信息 球員定期從SoccerServer得到視覺(jué)信息,視覺(jué)信息按如下格式定義: (see Time ObjInfo ObjInfo ) Time指示當(dāng)前時(shí)間。 ObjInfo表示了可視對(duì)象的信息。其格式為: (ObjName Distance Direction DistChng DirChng BodyDir HeadDir) ObjName = (p Teamname UniformNumber goalier) |(g l|r) |(b) |(f c) SoccerServer仿真環(huán)境 9|(f l | c | r t | b ) |(f p l | r t | c | b ) |(f g l | r t | b ) |(f t | b l | r 10 | 20 | 30 | 40 |50 ) |(f l | r t | b 10 | 20 | 30 ) |(l l | r | t | b ) Distance,Direction表示目標(biāo)的相對(duì)距離和相對(duì)方向。DistChng和DirChng分別表示目標(biāo)距離和方向的相對(duì)變化,DistChng和DirChng不是精確值,只是一個(gè)粗略值。當(dāng)被觀察的目標(biāo)是其他隊(duì)員時(shí),參數(shù)中增加BodyDir和HeadDir,分別是被觀察球員相對(duì)觀察者的身體和頭部的相對(duì)角度。如果兩個(gè)球員的身體都是相同的角度,那么BodyDir就等于零。HeadDir也一樣。字母:“l(fā) r c t b”分別表示了左,右,中心,上,下?!皃”表示罰球區(qū)。詳見(jiàn)下圖。 圖 2 比賽場(chǎng)地標(biāo)志 Distance,Direction,DistChng和DirChng的計(jì)算方法為: 0xxtrxPPP = 0yytryPPP = 0xxtrxPvv = 0yytryPvv = Distance = 22ryrxPP + SoccerServer仿真環(huán)境 10Direction = 0)/arctan( aPPrxry rxrxPe = / Distance ryryPe = / Distance )*()*(ryryrxrxevevDistChng += /)*()*(ryryrxrxevevDirChng += Distance )/180(* 其中),(ytxtPP是目標(biāo)的絕對(duì)位置坐標(biāo),),(00 yxPP是接收視覺(jué)信息的隊(duì)員自己本身的絕對(duì)坐標(biāo),),(ytxtvv是目標(biāo)的絕對(duì)速度,),(00 yxvv隊(duì)員自己的絕對(duì)速度。0a是隊(duì)員所面向的絕對(duì)方向。另外),(ryrxPP和),(ryrxvv表示目標(biāo)的相對(duì)位置和相對(duì)速度。),(ryrxee表示平行于相對(duì)位置向量的單位向量。 球員的視覺(jué)信息由下面幾個(gè)方面決定: z 視野寬度。正常模式為-45,45,寬模式為-90,90,窄模式為-22.5,22.5。 z 鄰域。距離自己3米之內(nèi)。當(dāng)某個(gè)對(duì)象在球員的鄰域內(nèi)但在視野之外時(shí),球員只能知道對(duì)象的類(lèi)型(球,其他隊(duì)員,球門(mén)或標(biāo)志),不知道對(duì)象的準(zhǔn)確名字。 z 遠(yuǎn)處目標(biāo)信息的不確定性。無(wú)論遠(yuǎn)處的目標(biāo)是球還是球員,目標(biāo)的距離值按如下方式進(jìn)行量化: )1.0),_),(log(exp(stepquantizedQuantizeQuantized = 其中, dd分別表示精確距離和相應(yīng)的量化距離。且: =),( QVQuantize ceiling(V / Q)*Q 這表示隊(duì)員是不能知道遠(yuǎn)處物體的精確位置的。例如:當(dāng)距離為100.0時(shí),最大噪聲可達(dá)到10.0,但當(dāng)距離在10.0之內(nèi)時(shí),噪聲小于1.0。 對(duì)于遠(yuǎn)處目標(biāo)是旗或線(xiàn)的情況,距離值按如下公式量化: )1.0),_),(log(exp(lsteppquantizedQuantizeQuantized = 觀察模式?jīng)Q定了觀察頻率和從SoccerServer所接受視覺(jué)信息的細(xì)節(jié)。觀察模式的包含兩個(gè)參數(shù):ANGLE_WIDTH和QUALITY。ANGLE_WIDTH為wide(=180)、normal(=90)和narrow(45)之一。QUALITY為high或low。當(dāng)QUALITY設(shè)置為high時(shí),SoccerServer為觀察者發(fā)送詳細(xì)的目標(biāo)位置信息。當(dāng)QUALITY設(shè)置為low時(shí),Server為觀察者發(fā)送簡(jiǎn)化的目標(biāo)信息(只有目標(biāo)的方向)。另一方面,Server為隊(duì)員發(fā)送視覺(jué)信息的頻率隨著ANGLE_WIDTH和QUALITY而變化。缺省時(shí)間間隔為150毫秒(由Server參數(shù)send_step控制)。當(dāng)觀察角變寬時(shí),頻率加倍,反之減半。 SoccerServer仿真環(huán)境 11請(qǐng)參考圖3的標(biāo)志,球員所獲得的視覺(jué)信息和距離的相關(guān)程度很大。對(duì)于近距離球員,它既可以看到它所屬的球隊(duì)同時(shí)也可以看到它的球員號(hào)碼。然而,隨著距離的增加,首先消失的是球員的號(hào)碼。然后距離的增加還會(huì)導(dǎo)致球員的隊(duì)別也分不清楚了。在服務(wù)器端假定這些距離是 ar_lengthteam_too_fengthteam_far_lar_lengthunum_too_fengthunum_far_l 這里假定dist是球員和自己的距離,那么: z 如果lengthfarunum _dist ,那么球員號(hào)碼和球隊(duì)名稱(chēng)都可見(jiàn) z 如果lengthfartoounum _dist ength unum_far_l 0說(shuō)明在對(duì)方半場(chǎng)),從而設(shè)定控球度??厍蚨萬(wàn)lag取三個(gè)值,-1,0,1。初始情況下flag0,如果我方性能弱(目前設(shè)置為控球時(shí)間占小于等于30%),則flag1;如果對(duì)方性能較弱(目前取控球時(shí)間占大于等于70%),則flag1;如果雙方球隊(duì)性能相差不大(我方控球時(shí)間介于40%到60%之間),flag0; 其余flag不變。 球場(chǎng)上每支球隊(duì)都有陣型,每個(gè)球員都有自己的角色,RoboCup也不例外。我們采用了三種陣型,433、334和541。比賽剛開(kāi)始時(shí),采用的陣型是433打法,在比賽期間,球隊(duì)根據(jù)比分、剩余時(shí)間和球隊(duì)控球度f(wàn)lag來(lái)轉(zhuǎn)換陣型。 z 在比賽的大部分時(shí)間內(nèi),我們主要根據(jù)flag來(lái)轉(zhuǎn)換陣型。 (1) 如果flag0,陣型不變; (2) 如果flag1,切換陣型到541,采用防守反擊打法。 (3) 如果flag1,切換陣型到334,用以加強(qiáng)進(jìn)攻。 z 在比賽臨近結(jié)束時(shí),則根據(jù)場(chǎng)上比分來(lái)確定陣線(xiàn) (1) 如果我方落后,切換陣型到334,意圖通過(guò)加強(qiáng)進(jìn)攻,反敗為勝。 (2) 如果我方領(lǐng)先,切換陣型到541,確保當(dāng)前的勝利。 角色只有三種,前鋒、中場(chǎng)、后衛(wèi)(對(duì)于守門(mén)員,有專(zhuān)門(mén)的守門(mén)員策略)。我們對(duì)基本角色的劃分非常粗略,角色的動(dòng)態(tài)變換依賴(lài)于第二棵決策樹(shù)的基于場(chǎng)頂層策略 30上動(dòng)態(tài)形勢(shì)的分析。當(dāng)前只是簡(jiǎn)單的以空間位置來(lái)劃分球員角色,并且指明在對(duì)應(yīng)陣型下的球員應(yīng)該在的策略站位點(diǎn)。對(duì)于已經(jīng)確定的陣型,簡(jiǎn)單的劃分位置靠前的相應(yīng)幾個(gè)球員為前鋒,位置靠后的相應(yīng)幾個(gè)球員為后衛(wèi),中間剩下的就是中場(chǎng)。為了保證前鋒線(xiàn)、中場(chǎng)線(xiàn)、后衛(wèi)線(xiàn)這三條線(xiàn)的協(xié)調(diào)配合,我們還要確定這三線(xiàn)(也就是陣線(xiàn))的大致位置范圍。 6.2 陣線(xiàn)位置的確定 陣線(xiàn)位置直接關(guān)系到球員個(gè)體的場(chǎng)上站位。如果能夠找到一種算法,能夠?qū)⑶ё內(nèi)f化的場(chǎng)上形勢(shì)抽象出一個(gè)場(chǎng)上模型出來(lái),那么我們可以很輕松的根據(jù)這個(gè)場(chǎng)上模型來(lái)進(jìn)行各種決策。到目前為止,還沒(méi)有出現(xiàn)一種行之有效的算法。我們考慮的是和陣線(xiàn)有關(guān)的兩個(gè)因素:足球位置和對(duì)方前鋒位置。我方前鋒的位置主要是由足球位置確定,而我方后衛(wèi)則是考慮對(duì)方前鋒而定,中場(chǎng)位置用來(lái)保證三條線(xiàn)之間的銜接。 為了更好的確定量度足球和對(duì)方前鋒的位置,我們首先將球場(chǎng)模糊劃分。 假設(shè)我方在左半場(chǎng)(球場(chǎng)長(zhǎng)度是105) 16.5 15 21 21 15 16.5 -52.5 -36 -21 0 21 36 52.5 10 10 13 14 14 13 10 10 一區(qū)中心線(xiàn) 二區(qū)中心線(xiàn) 三區(qū)中心線(xiàn) 四區(qū)中心線(xiàn) 五區(qū)中心線(xiàn) 球場(chǎng)分成五個(gè)區(qū)域,相鄰兩個(gè)區(qū)域是重疊在一起的。如果不進(jìn)行模糊劃分,頂層策略 31相鄰區(qū)域間有明確的分界線(xiàn),那么一旦對(duì)象在分界線(xiàn)附近左右移動(dòng),會(huì)造成較大的振蕩,影響球隊(duì)性能。 z 足球在三區(qū),即球場(chǎng)中央位置 前鋒線(xiàn)在四區(qū)活動(dòng),中場(chǎng)線(xiàn)在三區(qū)活動(dòng)。 如果在一區(qū)活動(dòng)的對(duì)方球員人數(shù)超過(guò)了一個(gè),那么后衛(wèi)線(xiàn)在一區(qū)活動(dòng);否則,考慮造越位情況,后衛(wèi)線(xiàn)于二區(qū)活動(dòng)。 如果足球在三區(qū)的停留時(shí)間超過(guò)一定限度,則前鋒線(xiàn)后移,向三區(qū)靠攏。 z 足球在二區(qū),即靠近我方球門(mén)的一邊 前鋒線(xiàn)于三區(qū)活動(dòng),中場(chǎng)線(xiàn)于二區(qū)活動(dòng),后衛(wèi)線(xiàn)在一區(qū)。 如果足球在二區(qū)停留時(shí)間超過(guò)一定限度,則前鋒線(xiàn)后移,向二區(qū)靠攏。 z 足球位于四區(qū),即靠近對(duì)方球門(mén)處 前鋒線(xiàn)為五區(qū),中場(chǎng)線(xiàn)為四區(qū)。 如果在一區(qū)活動(dòng)的對(duì)方球員人數(shù)超過(guò)了一個(gè),那么后衛(wèi)線(xiàn)在一區(qū)活動(dòng);否則,考慮造越位情況,后衛(wèi)線(xiàn)于二區(qū)活動(dòng)。 如果足球在四區(qū)的停留時(shí)間超過(guò)一定限度,則后衛(wèi)線(xiàn)前移。 z 足球位于一區(qū),即我方罰球區(qū)附近 前鋒位于三區(qū),中場(chǎng)位于二區(qū),后衛(wèi)位于一區(qū)。 如果足球在一區(qū)的停留時(shí)間超過(guò)一定限度,則中場(chǎng)退后支援,同時(shí)前鋒稍微退后,保證中場(chǎng)和前鋒的銜接。 如果足球在一區(qū)的停留時(shí)間更長(zhǎng),則中場(chǎng)線(xiàn)融入后衛(wèi)線(xiàn),前鋒線(xiàn)退后支援。 z 足球位于五區(qū),即對(duì)方罰球區(qū)附近 前鋒位于五區(qū),中場(chǎng)位于四區(qū)。 對(duì)方球員在一區(qū)二區(qū)的球員人數(shù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)學(xué)美容紋足跟技術(shù)培訓(xùn)
- 中醫(yī)科主任中醫(yī)診療與科研創(chuàng)新
- 標(biāo)書(shū)制作培訓(xùn)教學(xué)課件
- 課件的幾種格式
- 核酸檢查培訓(xùn)課件模板
- 課件電腦教學(xué)課件
- 課件猜謎語(yǔ)教學(xué)課件
- 核損核價(jià)崗培訓(xùn)課件
- 《DZT 0198.4-1997地質(zhì)儀器 工藝管理導(dǎo)則 工藝方案設(shè)計(jì)》專(zhuān)題研究報(bào)告
- 核安全形勢(shì)課件教案
- 工地清場(chǎng)協(xié)議書(shū)
- 2026年包頭輕工職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)附答案詳解
- 2026年及未來(lái)5年市場(chǎng)數(shù)據(jù)中國(guó)內(nèi)貿(mào)集裝箱行業(yè)全景評(píng)估及投資規(guī)劃建議報(bào)告
- 2025貴州鹽業(yè)(集團(tuán))有限責(zé)任公司貴陽(yáng)分公司招聘筆試考試備考題庫(kù)及答案解析
- 重慶八中高2026屆高三12月適應(yīng)性月考(四)生物試卷(含答案解析)
- 電商行業(yè)個(gè)性化服務(wù)2025年用戶(hù)需求分析報(bào)告
- 湘教版(2024)八上地理教學(xué)設(shè)計(jì)-第二章第三節(jié) 中國(guó)的河流 第二課時(shí) 長(zhǎng)江
- 2024年全國(guó)職業(yè)院校技能大賽中職組(舞蹈表演賽項(xiàng))考試題庫(kù)(含答案)
- 中醫(yī)外治技術(shù)之穴位注射操作指南:精準(zhǔn)操作與安全優(yōu)化的臨床應(yīng)用解析
- 農(nóng)業(yè)物聯(lián)網(wǎng)技術(shù)服務(wù)合同
- 湖湘文廟建筑文化傳承與保護(hù)研究
評(píng)論
0/150
提交評(píng)論