版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
任務(wù)1決策規(guī)劃整體認知01任務(wù)1決策規(guī)劃整體認知02任務(wù)引入任務(wù)引入某自動駕駛技術(shù)公司旗下一輛卡車在測試自動駕駛系統(tǒng)時發(fā)生事故。在進行調(diào)查的過程中,公司將事故原因歸咎為“人為失誤”。根據(jù)曝出的行車記錄儀視頻,該自動駕駛公司運營的一輛半掛車在亞利桑那州某州際公路上行駛時突然向左急轉(zhuǎn),撞上了路中間的混凝土隔離帶。經(jīng)調(diào)查該事故原因是路徑規(guī)劃決策出現(xiàn)錯誤。那么什么是路徑?jīng)Q策規(guī)劃呢?03任務(wù)目標(biāo)掌握決策規(guī)劃的概念1掌握決策規(guī)劃的概念2掌握決策規(guī)劃的分類和要求3了解路徑規(guī)劃的一般步驟決策規(guī)劃的概念決策規(guī)劃是智能網(wǎng)聯(lián)汽車自動駕駛的關(guān)鍵部分之一,它首先融合多傳感信息,對周圍可能存在障礙物的目標(biāo)狀態(tài)進行預(yù)測,然后根據(jù)駕駛需求進行行為決策,規(guī)劃出兩點間多條可選安全路徑,并在這些路徑中規(guī)劃選取一條最優(yōu)的路徑作為車輛行駛軌跡。決策規(guī)劃的基本效果如下圖所示。和人類駕駛員一樣,機器在做駕駛決定時需要回答幾個問題。我在哪兒?周圍的環(huán)境怎么樣?接下來會發(fā)生什么?我該做什么?這是一個基于信息感知進行決策的過程,具體如何決定需要自動駕駛的決策層完成。決策規(guī)劃的概念圖4-1-1自動駕駛決策規(guī)劃效果圖決策層包括環(huán)境認知和決策規(guī)劃兩部分,主要完成工作具體來說可分為兩個步驟:第一步認知理解,即依據(jù)感知層不同傳感器采集的信息,通過高精度地圖對智能網(wǎng)聯(lián)汽車自身的位置精確定位,同時對車輛周圍的環(huán)境信息和目標(biāo)狀態(tài)進行精確感知;第二步?jīng)Q策規(guī)劃包含目標(biāo)狀態(tài)預(yù)測、行為決策和路徑規(guī)劃,依據(jù)對智能網(wǎng)聯(lián)汽車周圍的目標(biāo)狀態(tài)精確感知,準(zhǔn)確預(yù)測未來可能發(fā)生的情況,對下一步行為進行正確判斷和決策,規(guī)劃并選擇適宜的路徑達到目標(biāo),如下圖所示。決策規(guī)劃的概念圖4-1-2決策層實施步驟決策規(guī)劃的分類從軌跡決策的角度考慮,根據(jù)事先對環(huán)境信息的已知程度,可把路徑規(guī)劃劃分為基于先驗完全信息的全局路徑規(guī)劃和基于傳感器信息的局部路徑規(guī)劃。05全局路徑規(guī)劃全局路徑規(guī)劃全局路徑規(guī)劃是全局環(huán)境已知,按照一定的算法搜尋一條最優(yōu)或者近似最優(yōu)的無碰撞路徑。例如,從上海到北京有很多條路,規(guī)劃出一條最優(yōu)行駛路線,即為全局規(guī)劃。06局部路徑規(guī)劃局部路徑規(guī)劃局部路徑規(guī)劃是對環(huán)境局部未知或完全未知,隨著自主車輛的運動,通過傳感器為自主車輛提供有用的信息,從而能夠確定出障礙物和目標(biāo)點的位置,規(guī)劃出一條由起始點到目標(biāo)點的路徑,如圖4所示。例如,在全局規(guī)劃好的上海到北京的那條路線上會有其他車輛或者障礙物,想要避過這些障礙物或者車輛,需要轉(zhuǎn)向調(diào)整車道,這就是局部路徑規(guī)劃。圖4-1-3局部路徑規(guī)劃局部路徑規(guī)劃從獲取障礙物信息是靜態(tài)或是動態(tài)的角度看,全局路徑規(guī)劃屬于靜態(tài)規(guī)劃(又稱離線規(guī)劃),局部路徑規(guī)劃屬于動態(tài)規(guī)劃(又稱在線規(guī)劃)。全局路徑規(guī)劃需要掌握所有的環(huán)境信息,是高精度地圖下的車道級尋徑問題,解決的是起點到終點的最佳道路行駛序列;局部路徑規(guī)劃只需要由傳感器實時采集環(huán)境信息,了解環(huán)境地圖信息,然后確定出所在地圖的位置及其局部的障礙物分布情況,從而可以選出從當(dāng)前結(jié)點到某一子目標(biāo)結(jié)點的最優(yōu)路徑。根據(jù)所研究環(huán)境的信息特點,路徑規(guī)劃還可分為離散域范圍內(nèi)的路徑規(guī)劃問題和連續(xù)域范圍內(nèi)的路徑規(guī)劃問題。離散域范圍內(nèi)的路徑規(guī)劃問題屬于一維靜態(tài)優(yōu)化問題,相當(dāng)于環(huán)境信息簡化后的路線優(yōu)化問題;而連續(xù)域范圍內(nèi)的路徑規(guī)劃問題則是連續(xù)性多維動態(tài)環(huán)境下的問題。決策規(guī)劃的要求決策規(guī)劃是自動駕駛進行行為決策和路徑規(guī)劃過程,該過程要完全符合人類對于駕駛性的預(yù)期,并且滿足安全、舒適、高效等性能和品質(zhì)的要求。具體表現(xiàn)在以下幾個方面:(1)車輛應(yīng)該在自動避開所有障礙物的前提下,到達指定的目的地。(2)車輛安全到達目的地所用的時間最短,路程最短。(3)采用的路徑簡單可靠,以便簡單實現(xiàn)對無人車的控制。(4)車輛行駛的路徑盡量不重復(fù)或者少重復(fù)。(5)車輛選用合適的行駛策略,減少車輛的能量消耗。決策規(guī)劃是智能網(wǎng)聯(lián)汽車自動駕駛的關(guān)鍵部分之一,它首先融合多傳感信息,對周圍可能存在障礙物的目標(biāo)狀態(tài)進行預(yù)測,然后根據(jù)駕駛需求進行行為決策,規(guī)劃出兩點間多條可選安全路徑,并在這些路徑中規(guī)劃選取一條最優(yōu)的路徑作為車輛行駛軌跡。決策規(guī)劃的要求從軌跡決策的角度考慮,根據(jù)事先對環(huán)境信息的已知程度,可把路徑規(guī)劃劃分為基于先驗完全信息的全局路徑規(guī)劃和基于傳感器信息的局部路徑規(guī)劃。決策規(guī)劃要完全符合人類對于駕駛性的預(yù)期,并且滿足安全、舒適、高效等性能和品質(zhì)要求。決策規(guī)劃的要求任務(wù)2決策規(guī)劃方法認知任務(wù)引入廣州黃埔區(qū)大力建設(shè)廣州市區(qū)級智能網(wǎng)聯(lián)汽車道路測試先行試點區(qū),目前自動駕駛公交車、自動駕駛出租車在知識城、科學(xué)城、生物島區(qū)域?qū)崿F(xiàn)常態(tài)化運營。乘客乘坐自動駕駛出租車只需要在手機上輸入所在地及目的地,自動駕駛出租車自動規(guī)劃路徑,無需人工操作可將乘客送達目的地。那么,自動駕駛出租車如何實現(xiàn)路徑規(guī)劃的呢?任務(wù)目標(biāo)1了解目標(biāo)狀態(tài)預(yù)測的常用方法2了解行為決策的常用方法3了解路徑規(guī)劃的常用算法和一般步驟知識鏈接目標(biāo)狀態(tài)預(yù)測目標(biāo)狀態(tài)預(yù)測,是對智能網(wǎng)聯(lián)汽車周邊的目標(biāo)(人、車、物等)進行未來比較短時間內(nèi)的行為和軌跡預(yù)測,該預(yù)測信息可附加在目標(biāo)感知結(jié)果中,與環(huán)境感知信息一并發(fā)送給下層的決策端,為汽車安全決策規(guī)劃提供信息依據(jù)。目標(biāo)狀態(tài)預(yù)測主要解決兩大類問題:一是目標(biāo)的行為預(yù)測(包括靜止、左行、右行或直行等);二是目標(biāo)的軌跡預(yù)測(包含位置、時間戳、速度、角度、加速度等信息)。通過辨識目標(biāo)的行為和擬合運動軌跡,實現(xiàn)對目標(biāo)的狀態(tài)預(yù)測。當(dāng)前主流的目標(biāo)狀態(tài)預(yù)測方法主要包括三種:07基于運動模型的卡爾曼濾波方法基于運動模型的卡爾曼濾波方法基于馬爾可夫鏈的預(yù)測方法基于數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)方法下面逐一介紹:08基于運動模型的卡爾曼濾波方法基于運動模型的卡爾曼濾波方法基于卡爾曼濾波的目標(biāo)狀態(tài)預(yù)測算法,考慮了目標(biāo)運動狀態(tài)的不確定性變化,在恒速模型中實現(xiàn)了目標(biāo)的運動軌跡預(yù)測。這種預(yù)測方法的優(yōu)點在于計算速度快,但預(yù)測的前提是假設(shè)目標(biāo)的速度與行駛方向不變,這與實際的情況并不相符,所以實際應(yīng)用效果并不理想。09基于馬爾可夫鏈的預(yù)測方法基于馬爾可夫鏈的預(yù)測方法馬爾可夫鏈?zhǔn)侵敢粋€滿足馬爾可夫性質(zhì)的隨機過程,馬爾可夫性質(zhì)是指t+k時刻的狀態(tài)與t時刻的狀態(tài)有關(guān)而與t時刻以前的狀態(tài)無關(guān)。該方法實現(xiàn)了對目標(biāo)狀態(tài)的高效預(yù)測。10基于數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)方法基于數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)方法神經(jīng)網(wǎng)絡(luò)方法主要基于對大數(shù)據(jù)的收集和分析,根據(jù)道路采集的環(huán)境信息和跟蹤目標(biāo)的運動信息,預(yù)測周圍人、車以及物的運動位置。與人的大腦類似,神經(jīng)網(wǎng)絡(luò)具有很強的自學(xué)性和記憶性,對于復(fù)雜的非線性系統(tǒng)具有很強的函數(shù)逼近能力,其特性正好可以解決目標(biāo)狀態(tài)預(yù)測上傳統(tǒng)方法所不能解決的問題。行為決策智能網(wǎng)聯(lián)汽車行為決策系統(tǒng)指通過傳感器感知得到交通環(huán)境信息,考慮周邊環(huán)境、動靜態(tài)障礙物、車輛匯入以及讓行規(guī)則等,與智能駕駛庫中的經(jīng)驗知識等進行匹配,進而選擇適合當(dāng)前交通環(huán)境下的駕駛策略。這種駕駛策略一般指的是在某個特定狀態(tài)下,是變道、跟隨還是超車等宏觀意義上的駕駛行為。行為決策的目標(biāo)主要是保證智能網(wǎng)聯(lián)汽車可以像人類一樣產(chǎn)生安全的駕駛行為,滿足車輛安全性能、遵守交通法規(guī)等原則。智能網(wǎng)聯(lián)汽車的行為決策方法包括基于規(guī)則的行為決策方法和基于強化學(xué)習(xí)的行為決策方法。11基于規(guī)則的行為決策方法基于規(guī)則的行為決策方法智能網(wǎng)聯(lián)汽車基于規(guī)則的行為決策方法是最常用的。如下圖所示,該方法主要是將無人車的運動行為進行劃分,根據(jù)當(dāng)前任務(wù)路線、交通環(huán)境、交通法規(guī)以及駕駛規(guī)則知識庫等建立行為規(guī)則庫,對不同的環(huán)境狀態(tài)進行行為決策邏輯推理,輸出駕駛行為,同時接受運動規(guī)劃層對當(dāng)前執(zhí)行情況的反饋情況進行實時動態(tài)調(diào)整。圖4-2-1基于規(guī)則的行為決策方法基于規(guī)則的行為決策方法有限狀態(tài)機是一種離散的數(shù)學(xué)模型,用來研究有限個狀態(tài)以及狀態(tài)之間的轉(zhuǎn)移。其主要包括有限狀態(tài)集合、輸入集合和狀態(tài)轉(zhuǎn)移規(guī)則集合三部分。狀態(tài)、轉(zhuǎn)移、事件和動作是有限狀態(tài)機的四大要素。以基于規(guī)則的超車行為決策為例,主要分為頂層狀態(tài)機和超車頂層狀態(tài)下的子狀態(tài)機,如下圖所示。圖4-2-2基于規(guī)則的超車行為決策基于規(guī)則的行為決策方法在超車頂層狀態(tài)機下設(shè)置了超車子狀態(tài)機,對超車過程中不同駕駛階段下的轉(zhuǎn)換進行邏輯建模。超車行為決策與人類駕駛行為類似,在超車子狀態(tài)機下分別包括左換道準(zhǔn)備、左換道、并行超越等。左換道準(zhǔn)備為超車子狀態(tài)機的默認初始狀態(tài),在左右換向狀態(tài)下,智能網(wǎng)聯(lián)汽車將開啟相應(yīng)的轉(zhuǎn)向信號燈,產(chǎn)生一定的轉(zhuǎn)向偏移,以此來提示后方車輛。同時,智能網(wǎng)聯(lián)汽車會根據(jù)其左后或右后車輛是否避讓的狀態(tài)來決定是否進行下一步的超車計劃。并行超越主要用于車輛進行超車的階段,指導(dǎo)車輛在超車過程中的速度變化、方向盤角度變化等,并指導(dǎo)車輛在超車完成后及時返回原來的車道,減少在整個超車過程中的安全風(fēng)險。12基于強化學(xué)習(xí)的行為決策方法基于強化學(xué)習(xí)的行為決策方法基于強化學(xué)習(xí)算法的行為決策方法主要是利用各種學(xué)習(xí)算法來進行決策,利用智能網(wǎng)聯(lián)汽車配備的各種傳感器,來感知周邊的環(huán)境信息,傳遞給強化學(xué)習(xí)決策系統(tǒng),此時強化學(xué)習(xí)決策系統(tǒng)的作用就相當(dāng)于人腦,來對各類信息進行分析和處理,并結(jié)合經(jīng)驗來對無人駕駛汽車做出行為決策?;趶娀瘜W(xué)習(xí)的行為決策方法近年來發(fā)展迅速,主要有馬爾可夫決策、神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法等。這些行為決策方法可以通過大量的數(shù)據(jù)更容易覆蓋全部的工況以及不同的場景。如自動駕駛汽車公司W(wǎng)aymo就通過模擬駕駛及道路測試來獲取了大量的數(shù)據(jù)對其基于學(xué)習(xí)算法的行為決策系統(tǒng)進行訓(xùn)練,使得該系統(tǒng)對物體的檢測性能得到了極大地提高,還可以對障礙物進行語義理解等。路徑規(guī)劃路徑規(guī)劃是智能網(wǎng)聯(lián)汽車實現(xiàn)自主駕駛的基礎(chǔ),其作用是在當(dāng)前工作環(huán)境中按照某種性能指標(biāo)搜索出一條從起點到終點的最優(yōu)或次優(yōu)路徑。嚴格意義上講,路徑規(guī)劃是將行為決策的宏觀指令解釋成一條帶有時間信息的軌跡曲線,包括軌跡規(guī)劃和速度規(guī)劃。根據(jù)車輛導(dǎo)航系統(tǒng)的研究歷程,智能網(wǎng)聯(lián)汽車路徑規(guī)劃算法可分為靜態(tài)路徑規(guī)劃算法和動態(tài)路徑算法。靜態(tài)路徑規(guī)劃是以物理地理信息和交通規(guī)則等條件為約束來尋求最短路徑,靜態(tài)路徑規(guī)劃算法已日趨成熟,相對比較簡單,但對于實際的交通狀況來說,其應(yīng)用意義不大。動態(tài)路徑規(guī)劃是在靜態(tài)路徑規(guī)劃的基礎(chǔ)上,結(jié)合實時的交通信息對預(yù)先規(guī)劃好的最優(yōu)行車路線進行適時的調(diào)整直至到達目的地最終得到最優(yōu)路徑。下面介紹幾種常見的車輛路徑規(guī)劃方法。13A*算法A*算法A*算法是一種啟發(fā)式搜索算法,其是由Hart、Nilsson、Raphael等人率先提出,算法通過引入估價損失函數(shù),加快算法收斂速度,提高了局部搜索算法的搜索精度,進而得到廣泛的應(yīng)用,是當(dāng)今較為流行的最短路算法。同時,A*算法運算所消耗的存儲空間少于Dijkstra算法。A*算法如圖所示,其會根據(jù)柵格地圖上的障礙物信息(非白色柵格),建立從起點到目標(biāo)點的路徑評估函數(shù)表達式,并依據(jù)尋找最少的損失函數(shù)為依據(jù),規(guī)劃最短可行路徑。圖4-2-3A*算法最短路徑尋優(yōu)柵格效果圖14Dijkstra算法Dijkstra算法Dijkstra(迪杰斯特拉)算法是經(jīng)典的最短路算法的算法之一,由E.W.Dijkstra在20世紀(jì)60年代提出。此外,其他的較常用的規(guī)劃算法還包括Floyd算法、雙向搜索算法、蟻群算法、基于分層路網(wǎng)的搜索算法、神經(jīng)網(wǎng)絡(luò)算法、實時啟發(fā)式搜索算法、模糊控制以及遺傳算法等,需要根據(jù)不同的實際需求設(shè)計和優(yōu)化不同的規(guī)劃算法。如圖所示,該算法適用于計算道路權(quán)值均為非負的最短路徑問題,能夠給出柵格圖中某一節(jié)點到其他所有節(jié)點的最短路徑,以搜索準(zhǔn)確,思路清晰見長。相對的,由于輸入為大型稀疏矩陣限定性,又具有占用空間大,耗時長等缺陷。Dijkstra算法圖4-2-4Dijkstra權(quán)值計算策略示意圖路徑規(guī)劃的一般步驟在目標(biāo)狀態(tài)預(yù)測之后,需要對智能網(wǎng)聯(lián)汽車路徑進行規(guī)劃。路徑規(guī)劃的基本思路是:把需要解決的最短時間、最短距離、最少花費等問題轉(zhuǎn)變成求解最短路徑,因為只有找到了最短路徑,以上問題都將得到解決。其一般步驟主要包括環(huán)境建模、路徑搜索和路徑平滑三個環(huán)節(jié)。圖4-2-5路徑規(guī)劃的一般步驟15環(huán)境建模環(huán)境建模環(huán)境建模是路徑規(guī)劃的重要環(huán)節(jié),目的是建立一個便于計算機進行路徑規(guī)劃所使用的環(huán)境模型,即將實際的物理空間抽象成算法能夠處理的抽象空間,實現(xiàn)相互間的映射。16路徑搜索路徑搜索路徑搜索階段是在環(huán)境模型的基礎(chǔ)上應(yīng)用相應(yīng)算法尋找一條行走路徑,使預(yù)定的性能函數(shù)獲得最優(yōu)值。17路徑平滑路徑平滑通過相應(yīng)算法搜索出的路徑并不一定是一條運動體可以行走的可行路徑,需要作進一步處理與平滑才能使其成為一條實際可行的路徑。對于離散域范圍內(nèi)的路徑規(guī)劃問題,或者在環(huán)境建模或路徑搜索前己經(jīng)做好路徑可行性分析的問題,路徑平滑環(huán)節(jié)可以省去。目標(biāo)狀態(tài)預(yù)測,是對智能網(wǎng)聯(lián)汽車周邊的目標(biāo)(人、車、物等)進行未來比較短時間內(nèi)的行為和軌跡預(yù)測,該預(yù)測信息可附加在目標(biāo)感知結(jié)果中,與環(huán)境感知信息一并發(fā)送給下層的決策端,為汽車安全決策規(guī)劃提供信息依據(jù)。當(dāng)前主流的目標(biāo)狀態(tài)預(yù)測方法包括運動模型的卡爾曼濾波法、基于馬爾可夫鏈的預(yù)測法和基于數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)法;路徑平滑智能網(wǎng)聯(lián)汽車行為決策系統(tǒng)指通過傳感器感知得到交通環(huán)境信息,考慮周邊環(huán)境、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《GA 872-2010防爆球》專題研究報告
- 企業(yè)設(shè)備管理規(guī)范制度
- 企業(yè)財務(wù)預(yù)算與審核制度
- 2026湖北省定向湖南大學(xué)選調(diào)生招錄參考題庫附答案
- 2026湖南益陽沅江市衛(wèi)生事業(yè)單位編外臨聘人員招聘9人備考題庫附答案
- 2026福建省面向北京師范大學(xué)選調(diào)生選拔工作參考題庫附答案
- 公共交通智能調(diào)度管理制度
- 2026貴州黔南州長順縣醫(yī)療集團中心醫(yī)院招聘備案編制人員21人備考題庫附答案
- 紀(jì)檢監(jiān)察知識講課課件
- 2026陜西省面向中南大學(xué)招錄選調(diào)生考試備考題庫附答案
- 2025年公民素質(zhì)養(yǎng)成知識考察試題及答案解析
- 老年人營養(yǎng)和飲食
- 《關(guān)鍵軟硬件自主可控產(chǎn)品名錄》
- 2025年濟南市九年級中考語文試題卷附答案解析
- 信息安全風(fēng)險評估及應(yīng)對措施
- 紅藍黃光治療皮膚病臨床應(yīng)用專家共識(2025版)解讀
- 錄音棚項目可行性研究報告
- (標(biāo)準(zhǔn))警局賠償協(xié)議書
- GB/T 20921-2025機器狀態(tài)監(jiān)測與診斷詞匯
- 人教版英語九年級全一冊單詞表
- 護工培訓(xùn)課件內(nèi)容
評論
0/150
提交評論