【開(kāi)源證券】智能汽車(chē)系列深度:ChatGPT橫空出世大模型全面賦能自動(dòng)駕駛漸行漸近_第1頁(yè)
【開(kāi)源證券】智能汽車(chē)系列深度:ChatGPT橫空出世大模型全面賦能自動(dòng)駕駛漸行漸近_第2頁(yè)
【開(kāi)源證券】智能汽車(chē)系列深度:ChatGPT橫空出世大模型全面賦能自動(dòng)駕駛漸行漸近_第3頁(yè)
【開(kāi)源證券】智能汽車(chē)系列深度:ChatGPT橫空出世大模型全面賦能自動(dòng)駕駛漸行漸近_第4頁(yè)
【開(kāi)源證券】智能汽車(chē)系列深度:ChatGPT橫空出世大模型全面賦能自動(dòng)駕駛漸行漸近_第5頁(yè)
已閱讀5頁(yè),還剩51頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明1/31 伐謀-中小盤(pán)策略專(zhuān)題2022年底ChatGPT橫空出世,其在理解人類(lèi)意圖、思等諸多行業(yè)大模型廣泛賦能,人工智能迎來(lái)l大模型賦能自動(dòng)駕駛,算法、數(shù)據(jù)閉環(huán)、仿真全面受益為下一代主流技術(shù)—中小盤(pán)周報(bào)》《次新股說(shuō):本批??乒怆姷戎档弥貫橄乱淮髁骷夹g(shù)—中小盤(pán)周報(bào)》《次新股說(shuō):本批埃科光電等值得重大模型有效賦能自動(dòng)駕駛,數(shù)據(jù)閉環(huán)、仿真、算法全面受益。數(shù)據(jù)閉環(huán)方面,l重點(diǎn)關(guān)注:德賽西威、經(jīng)緯恒潤(rùn)、華陽(yáng)集團(tuán)、北京君正、晶晨股份、美格智l風(fēng)險(xiǎn)提示:技術(shù)發(fā)展進(jìn)度不及預(yù)期、市場(chǎng)需求不及預(yù)期。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明2/311、OpenAI引領(lǐng),人工智能進(jìn)入大模型時(shí)代 51.1、ChatGPT橫空出世,引領(lǐng)人工智能新浪潮 51.2、算法是人工智能的基石,Transformer逐步成為主流 81.2.1、始于NLP,延伸至各領(lǐng)域,Transformer在人工智能行業(yè)展現(xiàn)統(tǒng)治力 81.2.2、大語(yǔ)言模型多基于Transformer構(gòu)建,Decoder-Only系列占優(yōu) 91.3、大模型+預(yù)訓(xùn)練+人類(lèi)反饋微調(diào),大模型蓄勢(shì)待發(fā) 1.3.1、探求ChatGPT的能力來(lái)源,尋找構(gòu)建大模型的有效方法 1.3.2、大參數(shù)+海量數(shù)據(jù)預(yù)訓(xùn)練+基于人類(lèi)反饋的微調(diào)構(gòu)成打造大語(yǔ)言模型的要素 1.4、多模態(tài)成為趨勢(shì),應(yīng)用端千帆競(jìng)渡,人工智能迎來(lái)iPhone時(shí)刻 2、大模型賦能自動(dòng)駕駛,算法、數(shù)據(jù)閉環(huán)、仿真全面受益 2.1、自動(dòng)駕駛算法、數(shù)據(jù)不斷迭代,長(zhǎng)尾問(wèn)題處理成為關(guān)鍵 2.2、大模型全面賦能,自動(dòng)駕駛各大環(huán)節(jié)全面受益 2.2.1、大模型助力數(shù)據(jù)挖掘和自動(dòng)標(biāo)注,數(shù)據(jù)飛輪飛馳推動(dòng)自動(dòng)駕駛落地 2.2.2、大模型推動(dòng)算法迭代,感知規(guī)控全賦能 202.2.3、生成海量數(shù)據(jù),大模型助力仿真平臺(tái)及端到端自動(dòng)駕駛模型構(gòu)建 223、自動(dòng)駕駛漸行漸近,行業(yè)玩家乘風(fēng)起 233.1、科技巨頭構(gòu)筑自動(dòng)駕駛行業(yè)“安卓”,技術(shù)鴻溝有望縮小 233.2、行業(yè)分工加速,成本下降可期 253.3、大模型開(kāi)發(fā)者、自動(dòng)駕駛產(chǎn)業(yè)鏈玩家全面受益 263.3.1、百度Apollo:自動(dòng)駕駛元老,文心大模型全面賦能 263.3.2、商湯科技:AI算法領(lǐng)軍,布局大模型探索自動(dòng)駕駛新機(jī)遇 273.3.3、地平線:智駕芯片新星,對(duì)算法的深入理解指引芯片架構(gòu)迭代完美適配需求 273.3.4、產(chǎn)業(yè)鏈玩家:自動(dòng)駕駛落地加速,產(chǎn)業(yè)鏈各大環(huán)節(jié)全面受益 284、風(fēng)險(xiǎn)提示 29圖1:達(dá)特茅斯會(huì)議開(kāi)啟人工智能發(fā)展之路 5圖2:視覺(jué)識(shí)別領(lǐng)域AI在2015年超越人類(lèi) 5圖3:ChatGPT引領(lǐng)人工智能新范式 5圖4:ChatGPT可完美實(shí)現(xiàn)用戶的需求甚至可輸出代碼 6圖5:ChatGPT用戶數(shù)2個(gè)月過(guò)億超越TikTok 6圖6:GPT-4的性能顯著強(qiáng)于上個(gè)版本 6圖7:GPT4在推理和邏輯能力上大幅提升 6圖8:GPT-4可理解部分圖片笑話 7圖9:GPT4準(zhǔn)確度相比之前的版本大幅提升 7圖10:對(duì)不被允許和敏感的內(nèi)容的錯(cuò)誤響應(yīng)顯著下降 7圖11:GPT4的多項(xiàng)能力超越人類(lèi)平均水平 7圖12:循環(huán)神經(jīng)網(wǎng)絡(luò)適合處理序列信息 8圖13:卷積神經(jīng)網(wǎng)絡(luò)可實(shí)現(xiàn)圖像處理等任務(wù) 8圖14:Transformer采用編碼器和解碼器的組合,有優(yōu)異全局信息感知能力 8圖15:Transformer在計(jì)算機(jī)視覺(jué)領(lǐng)域形成諸多路線 9 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明3/31圖16:Transformer應(yīng)用領(lǐng)域迅速泛化 9圖17:GPT模式采用Decoder-Only的算法 9圖18:Bert模式采用Encoder-Only算法 9圖19:大語(yǔ)言模型擁有三大技術(shù)方向,類(lèi)GPT模式的技術(shù)路線近年成為主流 圖20:GPT版本和能力演進(jìn)路徑——各類(lèi)訓(xùn)練、微調(diào)方法下形成最終ChatGPT 圖21:模型規(guī)模到達(dá)一定程度會(huì)出現(xiàn)“涌現(xiàn)”現(xiàn)象 圖22:通用化的大模型通常會(huì)采用內(nèi)容豐富的海量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練 圖23:ChatGPT通過(guò)多個(gè)步驟訓(xùn)練而來(lái) 圖24:參數(shù)超過(guò)100億的大語(yǔ)言模型不斷出現(xiàn) 圖25:大模型的應(yīng)用將不斷延伸 圖26:基礎(chǔ)大模型將能完成諸多任務(wù)有望賦能千行百業(yè) 圖27:廣汽研究院認(rèn)為人工智能將在算法中更多滲透 圖28:端到端自動(dòng)駕駛算法逐步映入眼簾 圖29:長(zhǎng)尾場(chǎng)景稀缺而不常見(jiàn) 圖30:路標(biāo)多種多樣,考驗(yàn)算法的泛化能力 圖31:自動(dòng)駕駛長(zhǎng)尾問(wèn)題出現(xiàn)概率較低 圖32:毫末智行認(rèn)為自動(dòng)駕駛能力與數(shù)據(jù)量直接相關(guān) 圖33:軟件升級(jí)速率滯后于硬件 圖34:自動(dòng)駕駛算法、數(shù)據(jù)閉環(huán)、仿真工具仍待完善 圖35:蒸餾、量化、剪枝是三大模型壓縮的方式 圖36:大模型從多個(gè)維度全面推動(dòng)自動(dòng)駕駛前行 圖37:百度采用大模型實(shí)現(xiàn)長(zhǎng)尾數(shù)據(jù)的挖掘 圖38:大模型助力完美實(shí)現(xiàn)兒童、異型車(chē)等場(chǎng)景的實(shí)時(shí)挖掘 圖39:商湯推動(dòng)標(biāo)注2.0時(shí)代演進(jìn),自動(dòng)標(biāo)注成為主流 圖40:商湯明眸提供強(qiáng)大的自動(dòng)標(biāo)注能力 20圖41:毫末智行DriveGPT大幅降低標(biāo)注成本 20圖42:感知大模型依靠半監(jiān)督的方式迭代 21圖43:通過(guò)感知大模型的蒸餾,實(shí)現(xiàn)車(chē)端遠(yuǎn)距離3D視覺(jué)感知性能提升 21圖44:大模型可賦能車(chē)端多模態(tài)模型 22圖45:大模型賦能下,車(chē)端多模態(tài)模型感知能力提升 22圖46:毫末智行DriveGPT大模型將助力自動(dòng)駕駛落地 22圖47:云驥智行認(rèn)為端到端的自動(dòng)駕駛算法優(yōu)勢(shì)顯著 23圖48:自動(dòng)駕駛端到端大模型構(gòu)建需要海量資源 23圖49:商湯自動(dòng)駕駛多模態(tài)大模型有望實(shí)現(xiàn)傳統(tǒng)自動(dòng)駕駛算法無(wú)法實(shí)現(xiàn)的功能 23圖50:特斯拉自動(dòng)駕駛解決方案堪稱(chēng)自動(dòng)駕駛界“IOS” 24圖51:第三方巨頭憑工具鏈有望構(gòu)筑自駕領(lǐng)域“安卓” 24圖52:微軟云可提供OpenAI接口服務(wù) 24圖53:微軟AirSim是強(qiáng)大的虛擬場(chǎng)景仿真平臺(tái) 24圖54:英偉達(dá)DriveSim可完美生成自動(dòng)駕駛仿真場(chǎng)景 25圖55:英偉達(dá)擁有整套端到端自動(dòng)駕駛解決方案 25圖56:VideoLDM可合成視頻實(shí)現(xiàn)多模式駕駛場(chǎng)景預(yù)測(cè) 25圖57:NeuralField-LDM可實(shí)現(xiàn)高質(zhì)量的3D場(chǎng)景生成 25圖58:英偉達(dá)推出Thor產(chǎn)品面向艙駕融合場(chǎng)景 26圖59:高通推出SnapdragonRideFlex實(shí)現(xiàn)艙駕融合 26圖60:百度致力于利用文心大模型實(shí)現(xiàn)自動(dòng)駕駛感知模型增強(qiáng)和長(zhǎng)尾數(shù)據(jù)挖掘 26 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明4/31圖61:商湯將大模型用來(lái)賦能自動(dòng)駕駛感知閉環(huán)和決策閉環(huán)等環(huán)節(jié) 27圖62:地平線認(rèn)為未來(lái)自動(dòng)駕駛終將走向端到端算法 27圖63:納什架構(gòu)芯片將專(zhuān)為大參數(shù)Transformer而設(shè)計(jì) 27表1:大模型均對(duì)應(yīng)超大規(guī)模的預(yù)訓(xùn)練數(shù)據(jù) 表2:受益公司盈利預(yù)測(cè)與估值 28 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明5/31深藍(lán)計(jì)算機(jī)打敗國(guó)際象棋大師卡斯帕羅夫成為首臺(tái)打敗國(guó)際象棋世界冠軍的電腦。2010年,谷歌宣布自動(dòng)駕駛汽車(chē)計(jì)劃。2012年卷積神經(jīng)網(wǎng)絡(luò)AlexNet在大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽中以比第二名低10.8個(gè)百世石,人類(lèi)將圍棋冠軍也讓與計(jì)算機(jī),掀起人工智能新一輪熱潮。多年以來(lái),像計(jì)算器超越人類(lèi)的計(jì)算能力一樣,人工智能在越來(lái)越多領(lǐng)域超越人類(lèi),并被應(yīng)用到千行百業(yè),未來(lái)將繼續(xù)在更多的領(lǐng)域嶄露頭角,為人類(lèi)賦能。請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明6/31世,作為一種應(yīng)用在對(duì)話場(chǎng)景的大語(yǔ)言模型,它可以通過(guò)更貼近人的方式與使用者互動(dòng),可以回答問(wèn)題、承認(rèn)錯(cuò)誤、挑戰(zhàn)不正確的前提、拒絕不適當(dāng)?shù)恼?qǐng)求,同時(shí)擁有驚艷的思維鏈推理能力和零樣本下處理問(wèn)題能力。在理解人類(lèi)意圖、精準(zhǔn)回答問(wèn)題、流暢生成結(jié)果方面遠(yuǎn)超人類(lèi)預(yù)期,幾乎“無(wú)所不能”,引發(fā)網(wǎng)絡(luò)熱潮。據(jù)瑞銀數(shù)據(jù),ChatGPT產(chǎn)品推出2個(gè)月后用戶數(shù)量即過(guò)億,而上一個(gè)現(xiàn)象級(jí)應(yīng)用TikTok達(dá)到提升至約32000個(gè)tokens,對(duì)應(yīng)約2.5萬(wàn)單詞。性能方面1)理解/推理/多語(yǔ)言能全性指標(biāo)相比GPT3.5有顯著提升,對(duì)不允許和敏感內(nèi)容的錯(cuò)誤反應(yīng)顯著下降。請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明7/31 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明8/31自然語(yǔ)言處理和圖像處理的領(lǐng)域主流算法。早年人工智能領(lǐng)域常見(jiàn)的算法包含循環(huán)卷積神經(jīng)網(wǎng)絡(luò)則以圖像識(shí)別為核心,通過(guò)卷積核進(jìn)行窗口滑動(dòng)來(lái)進(jìn)行特征提取,進(jìn)而實(shí)現(xiàn)圖像識(shí)別等功能。但兩類(lèi)算法均存在自身的問(wèn)題,循環(huán)神經(jīng)網(wǎng)絡(luò)并行度低,計(jì)算效率受限,同時(shí)輸入的數(shù)據(jù)較為龐大時(shí),早期的記憶容易丟失。而卷積神經(jīng)網(wǎng)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)。該算法采用編碼器解碼器(Encoder-Decoder)架構(gòu),編碼器接受輸入并將其編碼為固定長(zhǎng)度的向量,解碼器獲取該向量并將其解碼為輸出序列。該算法早期被應(yīng)用于翻譯領(lǐng)域,相比傳統(tǒng)RNN只關(guān)注句子相鄰詞之間的關(guān)系,確定該詞在句子里更準(zhǔn)確的意義。因此Transformer擁有更優(yōu) 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明9/31Transformer算法的結(jié)合體涌現(xiàn),誕生了最初應(yīng)用在圖像識(shí)別領(lǐng)域的Vision之內(nèi),其所覆蓋的領(lǐng)域迅速泛化,涵蓋文本、圖像、語(yǔ)音、視頻等。構(gòu)成,而單獨(dú)基于編碼器或者解碼器均可構(gòu)建大語(yǔ)言模型,因此業(yè)內(nèi)形成三類(lèi)大?!巴晷翁羁铡笔降念A(yù)訓(xùn)練,再根據(jù)所需的應(yīng)用領(lǐng)域用少量標(biāo)注過(guò)的數(shù)據(jù)進(jìn)行方式進(jìn)行預(yù)訓(xùn)練,之后通過(guò)指令微調(diào)等實(shí)現(xiàn)特定領(lǐng)域功能的激發(fā)。此外也有采用值得注意的是當(dāng)GPT3推出后,大量基于Deco的大模型算法構(gòu)建方式。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明10/31于不同領(lǐng)域的模型。對(duì)比這些不同的模型,在初代的G界知識(shí)(事實(shí)性知識(shí)和常識(shí))等能力,而這些能力幾乎都來(lái)自于大規(guī)模的預(yù)訓(xùn)練,域的能力如遵循指令來(lái)實(shí)現(xiàn)問(wèn)答式的聊天機(jī)器人,或泛化到其他新的任務(wù)領(lǐng)域。而讓大模型具備了和人類(lèi)“對(duì)齊”的能力,即給予提問(wèn)者詳實(shí)、公正的回應(yīng),拒絕不當(dāng)?shù)膯?wèn)題,拒絕其知識(shí)范圍外的問(wèn)題等特性。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明11/31而當(dāng)參數(shù)量上升到一定程度,模型的性能會(huì)突然躍遷,打破比例定律,實(shí)現(xiàn)質(zhì)的飛ofthought(思維鏈,即可逐步解決問(wèn)題)方面會(huì)出現(xiàn)“涌現(xiàn)”現(xiàn)象。因此模型擁有較大參數(shù)量是其擁有超乎想象性能的前提。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明12/31海量數(shù)據(jù)預(yù)訓(xùn)練不可或缺。參數(shù)量龐大的大語(yǔ)言模型需要大量覆蓋廣泛內(nèi)容的高質(zhì)量數(shù)據(jù)。目前的語(yǔ)料庫(kù)包含網(wǎng)頁(yè)、書(shū)籍、對(duì)話、百科、書(shū)籍、代碼等。數(shù)據(jù)集的規(guī)模和質(zhì)量對(duì)模型的性能表現(xiàn)至關(guān)重要,大模型玩家采用獨(dú)特的數(shù)據(jù)訓(xùn)練模型以請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明13/31Apr-2022Nov-2022MicrosoftApr-2022--恰當(dāng)?shù)哪P臀⒄{(diào)亦尤為重要。預(yù)訓(xùn)練構(gòu)筑模型強(qiáng)大的基礎(chǔ)能力之后,恰當(dāng)?shù)哪P臀⒄{(diào)將賦予模型在特定領(lǐng)域的能力和與人類(lèi)“對(duì)齊”的能力。在這里,模型調(diào)整分為三步1)采用人工標(biāo)注好的數(shù)據(jù)來(lái)訓(xùn)練模型2)通過(guò)人類(lèi)對(duì)模型答案的排拒絕有害內(nèi)容??梢钥闯瞿P臀⒄{(diào)對(duì)模型最終的效果實(shí)現(xiàn)至關(guān)重要,玩家獨(dú)特的訓(xùn)練和微調(diào)方法會(huì)讓自己的模型形成獨(dú)特的性能。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明14/31領(lǐng)域。在模型構(gòu)建方面,ChatGPT等產(chǎn)品提供良好范式,玩家可基于此方式構(gòu)建自己的產(chǎn)品。同時(shí)多模態(tài)的大模型已經(jīng)成為玩家們的終極目標(biāo),而隨著圖像、視頻數(shù)據(jù)的介入,大模型的能力亦將實(shí)現(xiàn)進(jìn)一步提升。在應(yīng)用端,也呈現(xiàn)出繁榮發(fā)展的態(tài)勢(shì),諸多玩家與大模型廠商合作以求探索新的業(yè)務(wù)和盈利模式。而隨著后期多模態(tài) 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明15/31點(diǎn)。首先,基于神經(jīng)網(wǎng)絡(luò)的算法逐步替代基于規(guī)則的算法,早年神經(jīng)網(wǎng)絡(luò)主要用于部署,每個(gè)模塊擁有獨(dú)立的優(yōu)化目標(biāo),但整體模型的效果未必達(dá)到最優(yōu),因此端到端的自動(dòng)駕駛解決方案映入人們眼簾,學(xué)界和產(chǎn)業(yè)界均進(jìn)行了諸多探索。最后,我趨同,這無(wú)疑將推動(dòng)包含芯片在內(nèi)的整個(gè)產(chǎn)業(yè)鏈加速發(fā)展。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明16/31長(zhǎng)尾問(wèn)題處理是自動(dòng)駕駛面臨的主要挑戰(zhàn),數(shù)據(jù)驅(qū)動(dòng)提供解藥算法可以覆蓋主要的行車(chē)場(chǎng)景,但駕駛環(huán)境紛繁復(fù)雜,仍有諸多罕見(jiàn)的長(zhǎng)尾場(chǎng)景需要算法識(shí)別和處理,這類(lèi)場(chǎng)景雖不常見(jiàn)但無(wú)法忽視,成為制約自動(dòng)駕駛成熟的主要瓶頸。行業(yè)通常采用大量的數(shù)據(jù)去訓(xùn)練自動(dòng)駕駛算法,以求讓自動(dòng)駕駛模型成為見(jiàn)數(shù)據(jù)解決長(zhǎng)尾問(wèn)題。馬斯克曾經(jīng)在推特上贊同了實(shí)現(xiàn)超越人類(lèi)的自動(dòng)駕駛能力至少需要100億公里駕駛數(shù)據(jù)的說(shuō)法。國(guó)內(nèi)毫末智行將數(shù)據(jù)作為“自動(dòng)駕駛能力函數(shù)”?;?,至少要做到人類(lèi)司機(jī)的安全水平,最好比人類(lèi)司機(jī)水平高一個(gè)數(shù)量級(jí),因此需要至少千億公里的測(cè)試,解決百萬(wàn)長(zhǎng)尾問(wèn)題。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明17/31展迅猛,硬件預(yù)埋軟件持續(xù)迭代的風(fēng)潮下,車(chē)載算力急劇增長(zhǎng)快速普及,但軟件端功能進(jìn)化滯后于算力。軟件端算法、數(shù)據(jù)閉環(huán)、仿真系統(tǒng)均有待完善。算法領(lǐng)域感知、預(yù)測(cè)、決策、規(guī)劃模型都在不斷升級(jí)演進(jìn),精度、可靠性均有提升空間。數(shù)據(jù)閉環(huán)系統(tǒng)方面,伴隨有關(guān)車(chē)型量產(chǎn),數(shù)據(jù)的挖掘、標(biāo)注和處理工作量龐大,數(shù)據(jù)閉環(huán)系統(tǒng)自動(dòng)化高效運(yùn)行決定模型能否由數(shù)據(jù)驅(qū)動(dòng)持續(xù)迭代。仿真環(huán)節(jié),理論上優(yōu)質(zhì)仿真可替代實(shí)車(chē)數(shù)據(jù)收集,降低算法搭建成本并提升迭代速率,但逼真的仿真環(huán)境的構(gòu)建、諸多的長(zhǎng)尾場(chǎng)景的復(fù)現(xiàn)難度大。蒸餾、剪枝、量化。蒸餾類(lèi)似于老師教學(xué)生,將一個(gè)大模型或多個(gè)模型集學(xué)到的知識(shí)遷移到另一個(gè)輕量級(jí)的模型上方便部署。剪枝可理解為將復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)精簡(jiǎn)使其變得輕量化。量化則為直接降低模型中的參數(shù)精度,進(jìn)而實(shí)現(xiàn)模型輕量化?;诙喾N模型壓縮的方式,大模型也擁有了加速垂直行業(yè)的基礎(chǔ)。大模型可在算法、數(shù)據(jù)閉環(huán)、仿真等環(huán)節(jié)全面的認(rèn)知和推理性能,作為人工智能最先落地的應(yīng)用領(lǐng)域之一,自動(dòng)駕駛有望得到全面助力。首先在數(shù)據(jù)閉環(huán)和仿真環(huán)節(jié),大模型的精準(zhǔn)識(shí)別和數(shù)據(jù)挖掘以及數(shù)據(jù)生成能力可對(duì)數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注、以及仿真場(chǎng)景構(gòu)建賦能。其次在模塊化的算法部署模式下,感知算法、規(guī)控算法亦可受到大模型的加強(qiáng)而實(shí)現(xiàn)感知精度和規(guī)控效果的提升。最后,端到端的感知決策一體化算法被認(rèn)為是自動(dòng)駕駛算法終局,但面臨諸多難以解決的問(wèn)題,比如構(gòu)建適合該算法的仿真換環(huán)境、端到端的數(shù)據(jù)標(biāo)注等,而在大模型時(shí)代以上問(wèn)題或不再成為瓶頸,落地指日可待。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明18/31在自動(dòng)駕駛的數(shù)據(jù)閉環(huán)體系構(gòu)建過(guò)程中存在數(shù)據(jù)挖掘和自動(dòng)標(biāo)注量產(chǎn)車(chē)型數(shù)量增加,產(chǎn)生的數(shù)據(jù)量呈現(xiàn)指數(shù)級(jí)增長(zhǎng),一方面,高效的利用數(shù)據(jù)實(shí)現(xiàn)預(yù)期的訓(xùn)練效果要求系統(tǒng)具有數(shù)據(jù)挖掘、處理能力。另一方面,海量數(shù)據(jù)的標(biāo)注帶百度首先利用文字和圖像輸入編碼器預(yù)訓(xùn)練一個(gè)原始模型用來(lái)實(shí)現(xiàn)向量搜索,再利用算法將街景圖像數(shù)據(jù)進(jìn)行物體識(shí)別并定位和分割,經(jīng)過(guò)圖像編碼器,形成底庫(kù);簡(jiǎn)單來(lái)說(shuō)就是基于街景建立一個(gè)擁有圖片和文字信息對(duì)應(yīng)的大模型。最后,面請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明19/31商湯科技在大模型加持下,落地?cái)?shù)據(jù)自動(dòng)標(biāo)注服務(wù)商湯明眸。公司請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明20/31毫末智行開(kāi)發(fā)DriveGPT,并釋放云端駕駛場(chǎng)景識(shí)別能力。毫末智行訓(xùn)練了片中所有車(chē)道線、交通參與者(行人、自動(dòng)車(chē)等)標(biāo)注出來(lái),單幀圖像整體標(biāo)注成本降低至行業(yè)平均水平的十分之一。性能。百度將文心大模型的能力與自動(dòng)駕駛感知技術(shù)結(jié)合,提升車(chē)載端側(cè)模型的感知能力。百度用半監(jiān)督方法通過(guò)用2D和3D數(shù)據(jù)訓(xùn)練出一個(gè)感知大模型。其中“半的感知性能實(shí)現(xiàn)快速提升。應(yīng)用這個(gè)大模型即可實(shí)現(xiàn)對(duì)視覺(jué)小模型、多模態(tài)模型感請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明21/31(1)利用大模型賦能增強(qiáng)小模型遠(yuǎn)距離3D視覺(jué)感知:一方面通過(guò)大模型對(duì)圖全面提升了多模態(tài)模型的感知效果,識(shí)別出了 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明22/31即將外部環(huán)境作為預(yù)訓(xùn)練數(shù)據(jù)輸入模型,訓(xùn)練模型預(yù)測(cè)未來(lái)情景演化的能力。人類(lèi)并將模型輸出的行為進(jìn)行排序,進(jìn)行強(qiáng)化訓(xùn)練。同時(shí)在根據(jù)輸入端的提示語(yǔ)及毫末自動(dòng)駕駛場(chǎng)景庫(kù)的樣本訓(xùn)練模型,讓模型學(xué)習(xí)推理關(guān)系。最終訓(xùn)練好的模型,可將完整的駕駛策略分拆為自動(dòng)駕駛場(chǎng)景的動(dòng)態(tài)識(shí)別過(guò)程,進(jìn)而實(shí)現(xiàn)可理解、可解釋的推理邏輯鏈條。毫末智行的DriveGPT大模練、場(chǎng)景脫困等功能,云端,大模型將開(kāi)放接口提供包括智駕能力、駕駛場(chǎng)景識(shí)別等能力。為自動(dòng)駕駛的終局會(huì)演進(jìn)成為一個(gè)超大規(guī)模的端到端自動(dòng)駕駛神經(jīng)網(wǎng)絡(luò):AD-GP 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明23/31這些在模塊化構(gòu)建算法的時(shí)代難以實(shí)現(xiàn),而當(dāng)大模型誕生后,無(wú)論在車(chē)端一體化模型的構(gòu)建、還是端到端訓(xùn)練仿真數(shù)據(jù)的生成似乎都觸手可及。究其本源,大模型本質(zhì)上是對(duì)輸入信息作出反應(yīng),而自動(dòng)駕駛則是這類(lèi)行為中的力上限。同時(shí)自動(dòng)駕駛多模態(tài)大模型可做到感知決策一體化集成,在輸出端通過(guò)環(huán)徑規(guī)劃;動(dòng)機(jī)解碼器可用自然語(yǔ)言對(duì)推理過(guò)程進(jìn)行描述,使得自動(dòng)駕駛系統(tǒng)變得更加安全可靠可解釋。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明24/31量的車(chē)隊(duì)數(shù)據(jù)形成數(shù)據(jù)壁壘,其他玩家難以復(fù)制。而大模型時(shí)代,諸多第三方科技巨頭如微軟、英偉達(dá)、百度、商湯等加入自動(dòng)駕駛行列,可通過(guò)提供強(qiáng)大的大模型構(gòu)建能力以及完善的工具鏈幫助整車(chē)廠構(gòu)建自己的自動(dòng)駕駛算法和數(shù)據(jù)閉環(huán)系統(tǒng),同時(shí)依靠大模型的數(shù)據(jù)生成能力彌補(bǔ)與頭部玩家在數(shù)據(jù)領(lǐng)域的差距,從而構(gòu)建自動(dòng)圖50:特斯拉自動(dòng)駕駛解決方案堪稱(chēng)自動(dòng)駕駛界“IOS”圖51:第三方巨頭憑工具鏈有望構(gòu)筑自駕領(lǐng)域“安卓”科技巨頭摩拳擦掌,微軟、英偉達(dá)爭(zhēng)相布局,有望加速行業(yè)發(fā)展。我們已經(jīng)看到,巨頭如微軟、英偉達(dá)在自動(dòng)駕駛領(lǐng)域以及大模型領(lǐng)域都進(jìn)行了深度布局,有望微軟:自動(dòng)駕駛方面,微軟通過(guò)微軟云可提供力,借助云上的PaaS和SaaS軟件可賦能各類(lèi)算法和應(yīng)用開(kāi)發(fā)。2021年發(fā)者將數(shù)據(jù)進(jìn)行導(dǎo)入分析,對(duì)模型進(jìn)行訓(xùn)練仿真。微軟基于虛幻引擎開(kāi)發(fā)的AirSim仿真平臺(tái)在無(wú)人機(jī)仿真領(lǐng)域扮演重要角色,該平臺(tái)也同時(shí)可實(shí)現(xiàn)對(duì)無(wú)人駕駛汽車(chē)的仿真。大模型方面,微軟云推出了AzureOpenAI服務(wù),企業(yè)可獲得對(duì)大模型(含GPT、Codex、嵌入模型)的訪問(wèn)權(quán)限并將其應(yīng)用于新的場(chǎng)景如語(yǔ)言、代碼、邏輯、推理、理解等,同時(shí)也允許客戶微調(diào)生成定制化的模型。而結(jié)合微軟的認(rèn)知搜索,型能力,未來(lái)或許能在自動(dòng)駕駛算法、仿真領(lǐng)域擦出新的火花。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明25/31能夠提供核心模擬和渲染引擎,生成逼真的數(shù)據(jù)流,創(chuàng)建各種測(cè)試環(huán)境,模擬暴雨和暴雪等各種天氣條件,以及不同的路面和地形,還可以模擬白天不同時(shí)間的眩目強(qiáng)光以及晚上有限的視野,達(dá)到“照片級(jí)逼真且物理精確”的傳感器仿真。DriveSim還擁有完善的工具鏈支持,如神經(jīng)重建引擎(NER)可以將真實(shí)世界的數(shù)據(jù)直接帶入仿真中,開(kāi)發(fā)者可在仿真環(huán)境中修改場(chǎng)景、添加合成對(duì)象,并應(yīng)用隨機(jī)化技術(shù),幫助企業(yè)玩家構(gòu)建自己的大模型產(chǎn)品。在2023年GTC大會(huì)上,英偉達(dá)推出AI動(dòng)駕駛領(lǐng)域的不懈探索,其中一篇推出了生成式視頻模型VideoLDM,可生成最高也可以從同一個(gè)起始幀生成多個(gè)不同的事件演進(jìn)方向來(lái)訓(xùn)練算法。而另一篇文獻(xiàn)則推出了神經(jīng)場(chǎng)擴(kuò)散模型NeuralField-LDM,現(xiàn)有數(shù)據(jù)集中實(shí)現(xiàn)了最強(qiáng)性能,為高效實(shí)現(xiàn)自動(dòng)駕駛仿真助力。行業(yè)分工加速,自動(dòng)駕駛算法體系成本或迎下降。隨著大模型逐步介入自動(dòng)駕駛,行業(yè)分工將進(jìn)一步明確。第三方科技巨頭的加持下,整車(chē)廠無(wú)需大規(guī)模搭建龐雜的算法、數(shù)據(jù)等整個(gè)閉環(huán)體系的團(tuán)隊(duì),即可擁有比肩全球一線水平的自動(dòng)駕駛算進(jìn)一步提升,反過(guò)來(lái)推動(dòng)行業(yè)進(jìn)步。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明26/31將加速芯片和傳感器迭代,傳感器方面,玩家有望能夠以類(lèi)似特斯拉的形式構(gòu)建自動(dòng)駕駛系統(tǒng),進(jìn)而降低成本。算力芯片方面,大模型將進(jìn)一步推升對(duì)芯片算力的需求。而我們看到在車(chē)載高算力芯片領(lǐng)域,無(wú)論英偉達(dá)、高通還是本土的地平線、黑芝麻均明確艙駕融合的芯片是未來(lái)的發(fā)展方向。這樣的趨勢(shì)將顯著推動(dòng)自動(dòng)駕駛系統(tǒng)降本,一方面,艙駕融合芯片通常會(huì)集成座艙、智駕甚至車(chē)身控制等域控制器功的算力可大幅縮減。大模型驅(qū)使下,行業(yè)艙駕融合產(chǎn)品上車(chē)趨勢(shì)將加速,系統(tǒng)降本投入研發(fā),起步較早,因此對(duì)于大模型在自動(dòng)駕駛領(lǐng)域的應(yīng)用深有心得。最新的ApolloDay及文心一言發(fā)布會(huì)上,百度表示將在自動(dòng)駕駛感知算法、圖文監(jiān)督預(yù)訓(xùn)練下的數(shù)據(jù)挖掘方案兩個(gè)方向推動(dòng)大模型賦能自動(dòng)駕駛,全面助力自動(dòng)駕駛能力提升。同時(shí)百度亦擁有Apollo開(kāi)放平臺(tái),對(duì)自動(dòng)駕駛?cè)鞒涕_(kāi)發(fā)體系并與諸多開(kāi)發(fā)者形成緊密的互動(dòng),未來(lái)有望深度受益本輪技術(shù)變革。 中小盤(pán)策略專(zhuān)題請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明27/31商湯利用大模型對(duì)小模型進(jìn)行知識(shí)蒸餾,同時(shí)通過(guò)自動(dòng)化標(biāo)注實(shí)現(xiàn)感知和決策公司作為本土智能駕駛芯片領(lǐng)軍,對(duì)算法及大模型理解深入,有望指引公司芯片迭代以完美適應(yīng)客戶需求。地平線認(rèn)為算法終將走向端到端的形式,因此公司也的自動(dòng)駕駛算法框架,該文章首次在檢測(cè)、跟蹤、預(yù)測(cè)、建圖、軌跡預(yù)測(cè)、端到端完成自動(dòng)駕駛的算法,這可以讓玩家用海

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論