版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、特斯拉自動駕駛發(fā)展史“我們設定的目標都實現(xiàn)了,只是有時會晚一些?!边@是特斯拉創(chuàng)始人埃隆·馬斯克曾經說過的一句話,也貫穿著特斯拉Autopilot技術發(fā)展的整個歷程。自2013年起,特斯拉就開始了對自動駕駛技術的探索與實踐,追求著讓駕駛變得更加安全、便捷的夢想。然而,這一路并不平坦,Autopilot的發(fā)展歷程充滿了挑戰(zhàn)與奮斗,每一步的進展都是團隊不懈努力的成果。讓我們一起回顧特斯拉Autopilot的發(fā)展歷程,以及如何演變到端到端的自動駕駛,見證這一項技術從概念到現(xiàn)實的華麗蛻變。在2013年,特斯拉的車型還僅限于一款豪華車型ModelS。馬斯克早在這個時候就已經開始思考將自動駕駛技術應用于汽車之中。當時,他曾與Google探討過聯(lián)合開發(fā)一套高速公路自動駕駛系統(tǒng)的可能性。然而,由于Google在2013年推出的半自動駕駛系統(tǒng)AutoPilot的測試受挫,雙方未能合作。Google停止測試的原因在于一名員工在自動駕駛車輛上睡著,這引發(fā)了安全方面的擔憂。盡管如此,特斯拉仍然堅定地走上了自動駕駛技術的開發(fā)之路,開始了Autopilot項目的探索和實踐。2014年10月,特斯拉發(fā)布了AutopilotHardware1.0(簡稱HW1.0),這一里程碑標志著公司在自動駕駛技術領域的重要進展。令人驚嘆的是,從概念到實際發(fā)布,僅用了不到一年的時間。HW1.0的發(fā)布標志著特斯拉將自動駕駛技術帶入了汽車行業(yè)的新紀元。AutopilotHardware1.0套件所使用的傳感器和計算平臺包括:1個前置單目攝像頭、1個毫米波雷達、12個超聲波傳感器、MobileyeEyeQ3計算平臺。特斯拉的Autopilot和Google的Firefly都是早期階段的自動駕駛項目,但它們的傳感器配置和技術路線存在顯著差異。最大的區(qū)別在于特斯拉沒有使用激光雷達,而GoogleFirefly則采用了Velodyne64線激光雷達。這一差異主要源于成本和技術路線的考量。這要來自于馬斯克所推崇的“第一性原理”,他認為人類能夠通過眼睛和大腦駕駛汽車,因此給汽車配置視覺設備和運算系統(tǒng)就能實現(xiàn)自動駕駛。2016年初,特斯拉在內部啟動了全自動駕駛計算平臺FSD(FullSelf-Driving)的研發(fā)工作。這個計算平臺是無人駕駛硬件系統(tǒng)的重要組成部分,其作用是接收來自硬件傳感器的環(huán)境信息,并將數(shù)據(jù)導入計算平臺,由不同的芯片進行運算。這些芯片可以被看作是無人駕駛系統(tǒng)的核心,相當于其大腦,需要滿足高算力、高穩(wěn)定性、高安全性、低功耗等相互之間很難平衡的特性要求。2016年10月,特斯拉推出了AutopilotHardware2.0(簡稱HW2.0),這標志著Autopilot2.0(簡稱AP2.0)正式開始量產。相較于HW1.0,HW2.0經歷了重大升級。最明顯的改進是在傳感器方面:HW1.0僅使用了一個前置攝像頭和一個后視攝像頭,而HW2.0配備了8個攝像頭,實現(xiàn)了車輛周圍360度全視野探測,這種改進使系統(tǒng)能更好地了解車輛周圍的環(huán)境和情況。實際上,在HW2.0推出后,特斯拉已經宣稱HW2.0硬件系統(tǒng)足以支撐完全無人駕駛,同時也表明了特斯拉的自動駕駛路線圖:計算機視覺感知派。2019年3月,HW3.0率先在ModelS和
ModelX上實現(xiàn)量產,一個月后又在Model3上量產,Autopilot硬件正式進入3.0時代,其中最大的亮點是特斯拉采用了自研的FSD芯片。2019年4月22日,Tesla舉行了“自動駕駛AIDay”活動,推出搭載特斯拉自主研發(fā)的FSD芯片的全自動駕駛計算平臺,旨在為車輛提供更強大的計算能力,從而支持更復雜的自動駕駛功能。同時介紹了特斯拉在視覺神經網絡和數(shù)據(jù)搜集體系上的建設成果,致力于提高車輛對周圍環(huán)境的感知能力,并優(yōu)化自動駕駛算法的性能。特斯拉在完成硬件準備工作之后,便著手對自動駕駛算法進行史詩級重構,2020年對于特斯拉來說是璀璨與厚積薄發(fā)的一年,2020年8月,馬斯克在推特上透露,特斯拉的Autopilot團隊正在對軟件底層代碼進行重寫,并進行深度神經網絡的重構。同時,他們還在開發(fā)全新的訓練計算機Dojo,當然最為引人注目的還是引入的
BEV+Transfomer架構,從此,特斯拉自動駕駛進入大模型時代。特斯拉認為,依賴于"2D圖像+CNN"的方式來實現(xiàn)全自動駕駛并不可行,因為攝像頭采集的數(shù)據(jù)是2D圖像,而自動駕駛需要應對的是三維真實世界。在這種情況下,將二維數(shù)據(jù)解決三維問題是不切實際的。特斯拉認為,最佳的解決方案是通過使用鳥瞰圖(BEV)將2D圖像"升維"到3D,以更好地理解和處理車輛周圍的環(huán)境。關于BEV的內容,可以看一下《一文了解什么是BEV感知?》。2023年8月28日,埃隆·馬斯克進行了直播,試駕了特斯拉FSDV12版本。這個版本被稱為FSDBetaV12,是有史以來特斯拉推出的第一個端到端AI自動駕駛系統(tǒng),這一里程碑標志著特斯拉在自動駕駛技術上邁出了一大步,向著實現(xiàn)完全自動駕駛的愿景邁進了一步。2、特斯拉端到端自動駕駛介紹特斯拉的端到端智能駕駛系統(tǒng),是一種創(chuàng)新的自動駕駛解決方案,與傳統(tǒng)分模塊方案有顯著區(qū)別。在傳統(tǒng)的自動駕駛系統(tǒng)設計中,感知模塊負責通過各類傳感器(如攝像頭、雷達、激光雷達等)收集環(huán)境信息,識別道路、車輛、行人、交通標志等元素;規(guī)劃模塊基于感知模塊提供的信息進行路徑規(guī)劃和決策制定;控制模塊則依據(jù)規(guī)劃結果執(zhí)行具體動作,如調整車速、轉向等。而特斯拉的端到端大模型,則打破了這種模塊化的界限,構建了一個統(tǒng)一的神經網絡架構,直接從原始傳感器數(shù)據(jù)輸入開始,經過深度學習算法處理后,一步到位輸出對車輛的操控指令,包括轉向角度、制動力以及加速力度等。這樣做的好處在于減少了各模塊間的信息傳遞延遲和誤差累積,使得自動駕駛系統(tǒng)的反應更加敏捷、準確,同時也簡化了系統(tǒng)結構,便于整體優(yōu)化和訓練。但同時,端到端的學習模式也帶來了系統(tǒng)解釋性相對較弱、問題定位相對困難等問題,這是技術發(fā)展中需要持續(xù)關注并解決的挑戰(zhàn)。2.1端到端自動駕駛工作原理
2.1.1、視覺感知層計算機視覺中物體檢測任務的架構通常包含以下組成部分:(1)Input:
輸入是一幅或多幅圖像,可能經過預處理以適應模型的需求,例如歸一化、縮放等。(2)Backbone:特征提取網絡的核心部分,負責從輸入圖像中提取高層次的特征。它通?;诮浀涞木矸e神經網絡(CNN)結構,比如AlexNet、VGGNet、ResNet,這些網絡通過一系列卷積層和池化層逐層抽象并壓縮信息。(3)Neck:在主干網絡之后,這部分網絡對不同層級的特征進行整合與優(yōu)化,有時稱為“中間層”或“特征融合層”。(4)DetectionHead:此部分用于預測最終的物體位置和類別。在特征提?。ü歉桑┲?,提供輸入的特征圖表示。(5)Output:輸出通常是物體檢測的結果,包括每個對象的類別標簽、置信度分數(shù)以及精確的邊界框坐標。2021年,特斯拉創(chuàng)建HydraNet自動駕駛網絡,用于視覺感知任務,這是一種多任務學習神經網絡架構,通過一個統(tǒng)一的神經網絡模型來并行處理多種不同的感知任務。在自動駕駛場景下,車輛需要同時完成多個復雜環(huán)境下的理解任務,涵蓋目標檢測(如識別其他車輛、行人、交通標志等)、車道線檢測、可行駛區(qū)域分割以及深度估計等。在HydraNet中,為了同時完成多種感知任務,例如車道線檢測、車輛和行人檢測與追蹤、交通信號燈識別等,設計了多個并行的“任務頭”(task-specificheads)。每個任務頭都連接到共享的基礎特征提取層(backbone),從而可以從同一份輸入數(shù)據(jù)中抽取不同層次的語義信息,并分別對特定任務進行處理。其構建了這樣一個流程:(1)圖像預處理與特征提?。和ㄟ^類似于ResNet的神經網絡結構對環(huán)繞車身的8個攝像頭拍攝的圖像進行初步處理。(2)多機位融合:使用Transformer-like架構將來自不同視角和位置的8幅圖像信息進行深度融合,生成一個綜合了多個視圖信息的“超級圖像”以消除單個相機視野受限帶來的問題。(3)時間融合:將時間維度納入考慮范圍,將連續(xù)時間段內的“超級圖像”序列進行融合以增強感知模型對動態(tài)環(huán)境的理解。(4)任務導向輸出:最后,融合后的時空特征會被送入多個任務導向的輸出層(HEADS),每個HEAD專門負責一個特定的感知任務,比如車道線檢測、車輛/行人檢測與追蹤、交通信號識別等。2.1.2、路徑規(guī)劃層特斯拉的OccupancyNetwork通過處理攝像頭捕捉到的多視圖圖像數(shù)據(jù),來預測三維空間中每個點被物體占據(jù)的概率。這一網絡模型旨在實現(xiàn)對車輛周圍環(huán)境的精確建模,從而幫助車輛在沒有使用超聲波傳感器或雷達的情況下(純視覺方案),也能有效地理解道路場景和進行路徑規(guī)劃。在特斯拉端到端的自動駕駛系統(tǒng)規(guī)劃模塊中,引入占據(jù)網絡(OccupancyNetwork)后,系統(tǒng)的感知和規(guī)劃決策過程可以概述如下:感知階段:第1步:視覺測量—特斯拉車輛利用其8個攝像頭收集環(huán)境數(shù)據(jù),包括車道線、靜態(tài)和動態(tài)物體的位置以及空間中的占用率信息。占用網絡負責處理這些圖像數(shù)據(jù),以生成三維空間的占用概率圖,即預測環(huán)境中哪些區(qū)域可能被其他車輛、行人或其他障礙物占據(jù)。軌跡生成與評估階段:第2-3步:候選目標和軌跡生成—根據(jù)占用率網絡和其他感知模塊(如車道檢測)的輸出,規(guī)劃器會生成一系列潛在駕駛軌跡,每個軌跡對應一個不同的行駛決策或目標。第4-5步:選擇評估—對于每一個生成的軌跡,規(guī)劃器會進行規(guī)則驅動的選擇評估,例如考慮“行人讓行”與“獲取行駛權”的情況,以及“右側來車讓行”等交通規(guī)則。每條軌跡都會根據(jù)一套人工設計的成本函數(shù)進行打分,該函數(shù)綜合考慮碰撞概率、舒適度(比如加速度變化)、是否需要人為干預的可能性以及行為模式與人類駕駛員的相似程度等因素。決策階段:成本優(yōu)化—在生成的多條軌跡中,規(guī)劃器會選擇成本最低的那一條作為最優(yōu)解決方案,以決定車輛接下來的行駛動作,輸出規(guī)劃行駛軌跡。2.2端到端自動駕駛的優(yōu)點
(1)更高的技術潛力:端到端結構允許模型從原始輸入直接推導出最終控制輸出,能夠通過聯(lián)合優(yōu)化各個部分來提升整體性能,從而可能達到比模塊化系統(tǒng)更高的技術上限。(2)數(shù)據(jù)驅動解決復雜問題:該方法依賴于大數(shù)據(jù)集進行訓練,使得系統(tǒng)在處理各種復雜的邊緣情況(cornercase)時表現(xiàn)更佳。大量數(shù)據(jù)有助于模型學習并適應不同環(huán)境下的駕駛場景,增強系統(tǒng)的魯棒性和適應性。(3)減少累積誤差:由于全棧神經網絡結構將感知、決策和控制等環(huán)節(jié)緊密地結合在一起,信息無需經過多個獨立模塊間的轉換
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年美容行業(yè)從業(yè)人員培訓考試題
- 宜黃縣城市管理局公開招聘編外工作人員【40人】備考考試題庫及答案解析
- 2025至2030中國跨境電商行業(yè)發(fā)展模式變革與新興市場機遇研究報告
- 2026年經濟分析方法宏觀與微觀經濟學原理模擬題庫
- 2026年上半年四川成都信息工程大學考核招聘事業(yè)編制工作人員86人備考題庫及參考答案詳解1套
- 2025浙江嘉興市銀建工程咨詢評估有限公司招聘備考題庫及一套答案詳解
- 2026年甘肅省隴南市徽縣恒輝學校招聘備考題庫及答案詳解1套
- 2026年浙江省榮軍醫(yī)院公開招聘人員25人備考題庫附答案詳解
- 2026年天津市東麗區(qū)國有企業(yè)基層工作人員聯(lián)合招聘18人備考考試題庫及答案解析
- 2026年歷史知識深度與廣度測試題
- 2025大模型安全白皮書
- 工程款糾紛專用!建設工程施工合同糾紛要素式起訴狀模板
- 地坪漆施工方案范本
- 2025年低壓電工理論考試1000題(附答案)
- 《質量管理體系成熟度評價指南》
- 《人類行為與社會環(huán)境》課件
- 通用技術技術與設計2必修2高二下期全套教案
- 常見危重癥早期識別及處理原則()課件
- GB∕T 39402-2020 面向人機協(xié)作的工業(yè)機器人設計規(guī)范
- 國家開放大學《理工英語1》邊學邊練參考答案
- 印鐵涂料知識分析
評論
0/150
提交評論