人工智能行業(yè)策略報(bào)告把握賦能、創(chuàng)新與安全三條主線_第1頁
人工智能行業(yè)策略報(bào)告把握賦能、創(chuàng)新與安全三條主線_第2頁
人工智能行業(yè)策略報(bào)告把握賦能、創(chuàng)新與安全三條主線_第3頁
人工智能行業(yè)策略報(bào)告把握賦能、創(chuàng)新與安全三條主線_第4頁
人工智能行業(yè)策略報(bào)告把握賦能、創(chuàng)新與安全三條主線_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

人工智能行業(yè)策略報(bào)告把握賦能、創(chuàng)新與安全三條主線(報(bào)告出品方/作者:中信建投證券,閻貴成、于芳博)一、人工智能行業(yè)簡介及投資策略1.1人工智能發(fā)展歷史:一波三折,深度學(xué)習(xí)引領(lǐng)第三次發(fā)展浪潮人工智能第一次發(fā)展浪潮:推理與搜索占據(jù)主導(dǎo),但由于當(dāng)時(shí)機(jī)器計(jì)算能力的不足而經(jīng)歷了第一次低迷期。人工智能(ArtificialIntelligence,縮寫AI),是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。這一概念最早由麻省理工學(xué)院的約翰麥卡錫在1956年的達(dá)特茅斯會(huì)議上提出,隨之迎來了人工智能的第一次發(fā)展浪潮(1956-1974)。這一時(shí)期的核心在于讓機(jī)器具備邏輯推理能力,通過推理與搜索嘗試開發(fā)能夠解決代數(shù)應(yīng)用題、證明幾何定理、使用英語的機(jī)器。該階段的成果幾乎無法解決實(shí)用問題,另外實(shí)際應(yīng)用中人工智能計(jì)算量的增長是驚人的,特別是模擬人類感知帶來的巨大運(yùn)算量遠(yuǎn)超70年代的計(jì)算能力,因此人工智能經(jīng)歷了第一次低迷期。人工智能第二次發(fā)展浪潮(1980-1987):專家系統(tǒng)開始商業(yè)化,場景局限性限制其發(fā)展。這一時(shí)期的核心是基于“專家系統(tǒng)”思想,讓AI程序能解決特定領(lǐng)域問題,知識(shí)庫系統(tǒng)和知識(shí)工程成為了這一時(shí)期的主要研究方向,專家系統(tǒng)能夠根據(jù)該領(lǐng)域已有的知識(shí)或經(jīng)驗(yàn)進(jìn)行推理和判斷,從而做出可以媲美人類專家的決策。典型代表如醫(yī)學(xué)專家系統(tǒng)MYCIN,MYCIN具有450條規(guī)則,其推導(dǎo)患者病情的過程與專家的推導(dǎo)過程類似,開處方的準(zhǔn)確率可以達(dá)到69%,該水平強(qiáng)于初級(jí)醫(yī)師,但比專業(yè)醫(yī)師(準(zhǔn)確率80%)還是差一些。隨著人們發(fā)現(xiàn)專家系統(tǒng)具有很強(qiáng)的場景局限性,同時(shí)面臨著升級(jí)迭代的高難度和高昂的維護(hù)費(fèi)用,因而AI技術(shù)發(fā)展經(jīng)歷了第二次低迷期。從1993年開始,AI技術(shù)步入了第三次發(fā)展浪潮:深度學(xué)習(xí)引領(lǐng)浪潮。這一時(shí)期,計(jì)算性能上的障礙被逐步克服,2006年深度學(xué)習(xí)這一重要理論被提出,并解決了訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)時(shí)的過擬合問題。2011年以來,深度學(xué)習(xí)算法的突破進(jìn)一步加速了AI技術(shù)發(fā)展的第三次浪潮,標(biāo)志性事件是2012年ImageNet圖像識(shí)別大賽,其深度CNN網(wǎng)絡(luò)的錯(cuò)誤率僅為15%左右,遠(yuǎn)遠(yuǎn)好于第二名支持向量機(jī)算法的26%,這一結(jié)果迅速點(diǎn)燃了產(chǎn)業(yè)對(duì)神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的興趣,深度學(xué)習(xí)也快速的實(shí)現(xiàn)了商業(yè)化。1.2人工智能產(chǎn)業(yè)鏈:關(guān)注AI芯片國產(chǎn)化,看好AI與金融、工業(yè)和醫(yī)療等方向結(jié)合人工智能產(chǎn)業(yè)鏈:主要分為基礎(chǔ)層、技術(shù)層和應(yīng)用層?;A(chǔ)層主要包括人工智能芯片、傳感器、云計(jì)算、數(shù)據(jù)采集及處理等產(chǎn)品和服務(wù),智能傳感器、大數(shù)據(jù)主要負(fù)責(zé)數(shù)據(jù)采集,AI芯片和云計(jì)算一起負(fù)責(zé)運(yùn)算。技術(shù)層是連接產(chǎn)業(yè)鏈基礎(chǔ)層與應(yīng)用層的橋梁,包括各種深度學(xué)習(xí)框架、底層算法、通用算法和開發(fā)平臺(tái)等。應(yīng)用層則是將人工智能進(jìn)行商業(yè)化應(yīng)用,主要提供各種行業(yè)解決方案、硬件和軟件產(chǎn)品。基礎(chǔ)層之AI芯片:CPU憑借通用性,依然在AI訓(xùn)練中占據(jù)重要位置;GPU憑借生態(tài)優(yōu)勢和強(qiáng)大的計(jì)算能力在AI應(yīng)用中占據(jù)主導(dǎo)地位,F(xiàn)PGA/ASIC未來占比將不斷提升。AI芯片是AI加速服務(wù)器中用于AI訓(xùn)練與推理的核心計(jì)算硬件,主要可以分為CPU/GPU/FPGA/ASIC/NPU等。CPU是目前常見的計(jì)算單元,具有很高的靈活性,但在大規(guī)模運(yùn)算方面的性能和功耗表現(xiàn)一般。GPU因具有大規(guī)模的并行架構(gòu)而能夠在AI計(jì)算任務(wù)中實(shí)現(xiàn)較好的性能表現(xiàn),但同時(shí)他會(huì)帶來不菲的能耗成本。ASIC指的是人工智能專用芯片,在AI任務(wù)中有著最優(yōu)秀的性能表現(xiàn),其缺點(diǎn)是靈活性較低同時(shí)具有高昂的研發(fā)成本和能耗成本。與ASIC相反的是靈活性很高的可重復(fù)編程芯片F(xiàn)PGA,其高效的異步并行能力幫助其在AI計(jì)算加速中扮演重要的作用,但其成本較高。目前,GPU因其更強(qiáng)的計(jì)算能力和更為成熟的編程框架(如CUDA、OpenCL等),已經(jīng)成為當(dāng)前AI應(yīng)用中的重要處理器和通用解決方案,而FPGA和ASIC則在特定的應(yīng)用場景下有著各自的優(yōu)勢。AI芯片空間大。AI芯片是目前人工智能產(chǎn)業(yè)鏈中與國外差距較大的一個(gè)環(huán)節(jié),CPU基本被Intel和AMD所壟斷;GPU基本被英偉達(dá)、AMD所壟斷;FPGA全球90%份額集中在AMD(Xilinx)、Intel(Altera)和Lattice等公司。除AI芯片以外,基礎(chǔ)層還包括光學(xué)、聲學(xué)傳感器,公司包括舜宇光學(xué)、禾賽科技等;計(jì)算平臺(tái)主要指的是能夠?yàn)槿斯ぶ悄苡?jì)算提供所需的專用算力的數(shù)據(jù)計(jì)算中心,主要包括浪潮、阿里云、騰訊云、華為云等。數(shù)據(jù)服務(wù)主要指的是為各業(yè)務(wù)場景中的AI算法訓(xùn)練與調(diào)優(yōu)而提供的數(shù)據(jù)庫設(shè)計(jì)、數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注與數(shù)據(jù)質(zhì)檢服務(wù),主要公司包括海天瑞聲、愛數(shù)智慧、云測、標(biāo)貝科技等;硬件設(shè)施主要指的是AI芯片和傳感器。技術(shù)層為包括核心算法在內(nèi)的關(guān)鍵技術(shù)研發(fā)和生產(chǎn)企業(yè),主要分為AI軟件框架、理論算法、通用技術(shù)三個(gè)方面。軟件框架簡單來說就是庫,編程時(shí)需導(dǎo)入軟件框架,里面有各種模型或算法的一部分,主要提供給使用者設(shè)計(jì)自己的AI模型。目前市場上主要的深度學(xué)習(xí)開源框架有Google的TensorFlow、Facebook的Pytorch,而國內(nèi)企業(yè)參與AI軟件框架開發(fā)較晚,主要有百度的飛槳PaddlePaddle、騰訊Angel等。底層算法典型代表如GNN、CNN、RNN、Transformer等底層理論,相關(guān)參與方包括DeepMind、OpenAI、阿里達(dá)摩院等。通用技術(shù)主要指的是感知、認(rèn)知、思維、決策等不同的應(yīng)用方向的技術(shù),包括計(jì)算機(jī)視覺、自然語言處理、知識(shí)圖譜、推薦系統(tǒng)等,相關(guān)公司包括商湯科技(計(jì)算機(jī)視覺)、云從科技(計(jì)算機(jī)視覺)、科大訊飛(自然語言處理)等。隨著底層理論算法的不斷創(chuàng)新和通用技術(shù)的不斷成熟,人工智能算法模型所需算力呈現(xiàn)指數(shù)級(jí)增長趨勢。2012年以前,模型的算力需求以接近摩爾定律的速度增長(兩年翻一倍)。2012年以后,模型訓(xùn)練所需計(jì)算量增長接近一年翻10倍。應(yīng)用層:安防占據(jù)AI應(yīng)用主要場景,金融應(yīng)用AI較好,醫(yī)療、工業(yè)具有一定快速應(yīng)用前景。在應(yīng)用場景維度,目前人工智能已在安防、金融、教育、交通、醫(yī)療、家居、營銷等多垂直領(lǐng)域取得一定發(fā)展,尤其是AI+安防、金融、交通領(lǐng)域發(fā)展較快,典型公司有??低?、商湯科技等;應(yīng)用產(chǎn)品維度廣闊,包括自動(dòng)駕駛汽車、無人機(jī)、智能語音助手、智能機(jī)器人等,典型公司包括小馬智行、科大訊飛等。從下游需求方來看,安防依然占據(jù)著AI主要需求,金融賽道則是下一個(gè)應(yīng)用較好的場景,金融行業(yè)本身有較好的信息化基礎(chǔ)以及數(shù)據(jù)積累,并且對(duì)精準(zhǔn)營銷、智能風(fēng)控、反欺詐和反洗錢等機(jī)器學(xué)習(xí)產(chǎn)品有強(qiáng)烈需求,因此金融賽道應(yīng)用AI較好。醫(yī)療、工業(yè)等賽道未來具有一定快速增長潛力,如AI在新藥研發(fā)、手術(shù)機(jī)器人等領(lǐng)域的應(yīng)用,工業(yè)領(lǐng)域也從機(jī)器視覺質(zhì)檢進(jìn)一步拓展至更多領(lǐng)域。從整體市場規(guī)模上來看,人工智能行業(yè)整體市場呈現(xiàn)穩(wěn)步增長的趨勢。2021年全球市場人工智能市場收入規(guī)模(含軟件、硬件及服務(wù))達(dá)850億美元。IDC預(yù)測,2022年該市場規(guī)模將同比增長約20%至1017億美元,并將于2025年突破2000億美元大關(guān),CAGR達(dá)24.5%。中國人工智能市場規(guī)模(含軟件、硬件及服務(wù))達(dá)82億美元,占全球市場規(guī)模的9.6%,在全球人工智能產(chǎn)業(yè)化地區(qū)中僅次于美國和歐盟,位居全球第三。數(shù)據(jù)顯示,中國人工智能市場規(guī)模由2016年的154億元增長至2020年的1280億元,年均復(fù)合增長率為69.9%。2022年中國人工智能市場規(guī)模將達(dá)2729億元。計(jì)算機(jī)視覺和自然語言處理是商業(yè)化落地較快的兩項(xiàng)人工智能通用技術(shù)。計(jì)算機(jī)視覺相關(guān)技術(shù)已經(jīng)十分成熟,技術(shù)落地效果超過人類水平,目前國內(nèi)有35%的AI企業(yè)聚集計(jì)算機(jī)視覺領(lǐng)域,2020年市場規(guī)模近千億,在所有領(lǐng)域中占比最高,是目前最具商業(yè)化價(jià)值的AI賽道。自然語言處理技術(shù)逐步實(shí)現(xiàn)從學(xué)術(shù)研究發(fā)展到商業(yè)應(yīng)用推廣的轉(zhuǎn)變,核心產(chǎn)品及帶動(dòng)的相關(guān)產(chǎn)業(yè)規(guī)模均穩(wěn)步增長,2021年自然語言處理核心產(chǎn)品規(guī)模預(yù)計(jì)達(dá)到219億元,相關(guān)產(chǎn)業(yè)規(guī)模達(dá)到514億元,未來幾年年增長率均維持在20%左右。1.3人工智能產(chǎn)業(yè)2023年投資策略人工智能本質(zhì)上是工具,要結(jié)合算法成熟度、數(shù)據(jù)積累和算力情況等多方面去判斷其在不同領(lǐng)域的應(yīng)用情況,同時(shí)下業(yè)發(fā)展的不同周期也一定程度上影響AI的應(yīng)用,我們認(rèn)為未來AI投資方向主要來自四個(gè)方面:第一,算法相對(duì)比較成熟,數(shù)據(jù)訓(xùn)練也達(dá)到商業(yè)化要求,處于從1到N滲透的階段,典型的如深度學(xué)習(xí)算法在金融、教育、工業(yè)等領(lǐng)域的應(yīng)用,重點(diǎn)關(guān)注教育行業(yè)復(fù)蘇以及工業(yè)領(lǐng)域的AI應(yīng)用。深度學(xué)習(xí)在視覺、自然語言處理均屬于發(fā)展多年且成熟度較高的算法,隨著數(shù)據(jù)的不斷積累和硬件邊際成本的降低,在該領(lǐng)域不斷滲透,尤其是以安防、金融、教育和工業(yè)等領(lǐng)域滲透較好。展望明年,我們認(rèn)為,安防、教育等行業(yè)今年受疫情以及政府支出縮減等影響,明年有望復(fù)蘇,同時(shí)受益于財(cái)政補(bǔ)貼等因素影響。工業(yè)和機(jī)器視覺的結(jié)合,是未來幾年AI應(yīng)用最重要的方向之一,核心成長邏輯有三方面:一是下游高成長帶動(dòng)需求,如新能源領(lǐng)域快速發(fā)展帶動(dòng)了相關(guān)智能視覺檢測設(shè)備;二是,成本疊加服務(wù)優(yōu)勢,有望逐步替代基恩士、康耐視等;三是新冠疫情下,制造業(yè)對(duì)機(jī)器替代人的訴求更強(qiáng)了,該領(lǐng)域公司都具備品類拓張的能力。由于多數(shù)工業(yè)領(lǐng)域的機(jī)器視覺公司主要收入來自消費(fèi)電子領(lǐng)域,今年受下游需求影響增速較慢,明年有望復(fù)蘇。第二,算法尚不成熟,數(shù)據(jù)積累量不夠,算力也剛剛突破,整體看仍處于從0到1階段,典型的如自動(dòng)駕駛。我們認(rèn)為智能駕駛是明年重要景氣賽道之一:一是展望明年,消費(fèi)需求有所復(fù)蘇;二是智能駕駛的滲透率繼續(xù)提升,明年下半年比亞迪、廣汽Aion、吉利極氪等傳統(tǒng)車廠明年都會(huì)有硬件達(dá)到L4級(jí)別的自動(dòng)駕駛車型量產(chǎn);三是人民幣進(jìn)入升值通道,板塊毛利率將逐步修復(fù)。因此,明年整個(gè)板塊在總量、滲透率還有盈利水平上都將有向好的邊際變化。第三,新算法的應(yīng)用,實(shí)現(xiàn)從0到1,創(chuàng)造出新的需求。如DiffusionModel(擴(kuò)散模型)的推出,基于擴(kuò)散模型的文本生成圖像模型越來越多,并很快擴(kuò)展到文本生成視頻、文本生成3D、文本生成音頻等,創(chuàng)造出新的業(yè)態(tài)和應(yīng)用。第四,AI軟硬件平臺(tái)的國產(chǎn)化比例提升。在中美貿(mào)易戰(zhàn)、科技戰(zhàn)持續(xù)深化的背景下,加強(qiáng)對(duì)卡脖子的關(guān)鍵核心技術(shù)研發(fā)的支持,加速的步伐,重點(diǎn)看好FPGA、EDA等細(xì)分板塊。二、人工智能算法2.1深度學(xué)習(xí)引領(lǐng)風(fēng)潮深度學(xué)習(xí)是多層人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。人工智能是個(gè)大范疇,機(jī)器學(xué)習(xí)是人工智能的一個(gè)研究分支——通過計(jì)算模型和算法從數(shù)據(jù)中學(xué)習(xí)規(guī)律,機(jī)器學(xué)習(xí)有很多種算法,包括神經(jīng)網(wǎng)絡(luò)、kNN、樸素貝葉斯、支持向量機(jī)(SVM)等算法。其中,神經(jīng)網(wǎng)絡(luò)經(jīng)過不斷的迭代,從一層迭代到多層,因此可以實(shí)現(xiàn)更準(zhǔn)確的判斷,標(biāo)準(zhǔn)性事件是ImageNet圖像識(shí)別比賽中,深度神經(jīng)網(wǎng)絡(luò)戰(zhàn)勝支持向量機(jī)算法,并在此后逐步超越人類。其中,深度學(xué)習(xí)的理論基礎(chǔ)就是神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)層數(shù)夠深就可以稱為深度模型。深度學(xué)習(xí)是過去十年AI研究最熱方向,也是商業(yè)化應(yīng)用最廣泛的算法之一。根據(jù)人工智能發(fā)展報(bào)告(2020)數(shù)據(jù)顯示,過去十年中,有5405篇以卷積神經(jīng)網(wǎng)絡(luò)為研究主題的論文在人工智能國際頂會(huì)頂刊論文中發(fā)表,其總引用量達(dá)299729,并且在這些頂會(huì)頂刊論文引用量排名前十的論文中出現(xiàn)過125次,是2011-2020年最熱門的AI研究主題。深度學(xué)習(xí)通過學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,這些學(xué)習(xí)過程中獲得的信息對(duì)諸如文字,圖像和聲音等數(shù)據(jù)的解釋有很大的幫助。深度學(xué)習(xí)在包括計(jì)算機(jī)視覺、自然語言處理、推薦系統(tǒng)等相關(guān)領(lǐng)域都取得了優(yōu)異成果。神經(jīng)網(wǎng)絡(luò)的研究是深度學(xué)習(xí)發(fā)展的基礎(chǔ),上個(gè)世紀(jì)50-60年代神經(jīng)網(wǎng)絡(luò)只能處理線性分類,因此應(yīng)用領(lǐng)域狹窄,使得神經(jīng)網(wǎng)絡(luò)研究陷入20年停滯。在深度學(xué)習(xí)概念被明確提出之前,針對(duì)神經(jīng)網(wǎng)絡(luò)的研究為后續(xù)深度學(xué)習(xí)的提出和發(fā)展完成了基礎(chǔ)性工作。第一代神經(jīng)網(wǎng)絡(luò)從1958年感知機(jī)算法被提出開始,其可以對(duì)輸入的多維數(shù)據(jù)進(jìn)行二分類,并通過梯度下降(使網(wǎng)絡(luò)的預(yù)測值與網(wǎng)絡(luò)的實(shí)際/期望值之間的差異不斷縮?。┑姆椒◤挠?xùn)練樣本中自動(dòng)學(xué)習(xí)更新權(quán)值(模型進(jìn)行分類的參數(shù)),由此引發(fā)了第一次神經(jīng)網(wǎng)絡(luò)研究的熱潮。1969年,Minsky在著作中證明了感知機(jī)本質(zhì)上只是線性模型,對(duì)于即使是最簡單的非線性問題都無法正確分類,隨后導(dǎo)致了對(duì)神經(jīng)網(wǎng)絡(luò)的研究陷入了近20年的停滯。上個(gè)世紀(jì)80-90年代神經(jīng)網(wǎng)絡(luò)具備持續(xù)優(yōu)化和解決非線性能力后,開啟第二代神經(jīng)網(wǎng)絡(luò)研究熱潮,但由于存在梯度消失問題,研究也逐漸冷淡。Hinton于1986年提出了反向傳播算法(從最后輸出的神經(jīng)元開始,反向更新迭代每一個(gè)神經(jīng)元的權(quán)值,計(jì)算當(dāng)前數(shù)據(jù)通過神經(jīng)網(wǎng)絡(luò)后的結(jié)果與實(shí)際結(jié)果的差距,從而根據(jù)差距進(jìn)行參數(shù)優(yōu)化),并采用Sigmoid作為激活函數(shù)進(jìn)行了非線性映射,讓神經(jīng)網(wǎng)絡(luò)具有了解決非線性問題的能力,由此開啟了第二代神經(jīng)網(wǎng)絡(luò)研究熱潮。但后續(xù)由于神經(jīng)網(wǎng)絡(luò)缺乏相應(yīng)的嚴(yán)格數(shù)學(xué)理論支持,甚至被指出存在梯度消失問題(隨神經(jīng)網(wǎng)絡(luò)層數(shù)增多,靠近輸入層的層之間的權(quán)重?zé)o法得到有效修正),嚴(yán)重影響深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效率和效果,因而神經(jīng)網(wǎng)絡(luò)的第二次熱潮也逐漸冷淡。這一時(shí)期中,也出現(xiàn)了具有革新意義的模型,如CNN-LeNet和LSTM模型,其分別在手寫數(shù)字識(shí)別、序列建模兩個(gè)方面取得了良好效果,但由于神經(jīng)網(wǎng)絡(luò)研究整體處于下坡而并沒有引起足夠關(guān)注。解決了梯度消失以及利用GPU進(jìn)行深度學(xué)習(xí)訓(xùn)練后,深度學(xué)習(xí)圖像識(shí)別準(zhǔn)確率大幅提升,掀起深度學(xué)習(xí)第三次研究熱潮,并持續(xù)至今。2006年Hiton提出了梯度消失的解決方案以及利用GPU進(jìn)行深度學(xué)習(xí)訓(xùn)練,首次提出了深度學(xué)習(xí)這一概念。2011年,新的ReLU激活函數(shù)被提出,有效抑制了梯度消失的問題。2011年,微軟首次將深度學(xué)習(xí)應(yīng)用在語音識(shí)別上,取得了重大突破。2012年,Hiton課題組參加ImageNet圖像識(shí)別比賽,其深度學(xué)習(xí)模型AlexNet奪得冠軍,識(shí)別率遠(yuǎn)遠(yuǎn)超越了基于SVM方法的第二名。理論上的不斷完善和硬件算力(GPU)的突破共同在全世界范圍內(nèi)掀起了研究深度學(xué)習(xí)的熱潮并持續(xù)至今。2012年開始,在計(jì)算機(jī)視覺領(lǐng)域內(nèi),深度學(xué)習(xí)不斷迭代出性能更好的架構(gòu)。如2014年的VGG、GoogleNet。與之前的模型相比,VGG通過增加網(wǎng)絡(luò)深度的方法,在一定程度上提升了神經(jīng)網(wǎng)絡(luò)的效果。其中VGG-16包含了16層,參數(shù)量達(dá)到了1.38億。而GoogleNet(Inception)則采用寬度代替深度,并引入了模塊化思想,其核心思想是分別用不同大小的卷積模塊對(duì)前層的輸入進(jìn)行運(yùn)算,再對(duì)各個(gè)模塊運(yùn)算的結(jié)果進(jìn)行通道組合。最終GoogleNet(Inception)以遠(yuǎn)小于VGG的參數(shù)量實(shí)現(xiàn)了相當(dāng)?shù)男阅苄Ч?015年的ResNet通過殘差結(jié)構(gòu)進(jìn)一步優(yōu)化了神經(jīng)網(wǎng)絡(luò)的性能,而后MobileNet的提出讓神經(jīng)網(wǎng)絡(luò)嵌入到移動(dòng)端成為可能,NAS和RegNet等算法及模型的應(yīng)用,使得神經(jīng)網(wǎng)絡(luò)可以由機(jī)器自動(dòng)設(shè)計(jì)。ResNet的核心思想在于在輸出跟輸入之間引入一個(gè)短路連接(殘差模塊),讓每一層的輸入在網(wǎng)絡(luò)深度增加的時(shí)候也能得以保留,進(jìn)而解決了由于網(wǎng)絡(luò)深度過大帶來的梯度消失問題,讓訓(xùn)練出成百上千層的神經(jīng)網(wǎng)絡(luò)成為可能。2017年,谷歌團(tuán)隊(duì)提出MobileNet這一輕量級(jí)網(wǎng)絡(luò)結(jié)構(gòu),相比于傳統(tǒng)的卷積操作能夠大大的減少參數(shù)量和提高網(wǎng)絡(luò)運(yùn)行的特性,進(jìn)而讓其能夠有效嵌入到移動(dòng)端使用的網(wǎng)絡(luò)模型中。2019年開始,神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索(NeuralArchitectureSearch,簡稱NAS)開始興起,核心思路是從手工設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)到機(jī)器自動(dòng)設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)。此后,RegNet進(jìn)一步優(yōu)化這種機(jī)器自動(dòng)設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)的過程,RegNet也是搜索最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu),但是又與NAS有明顯區(qū)別,NAS在定義的搜索空間內(nèi)找到一個(gè)最優(yōu)網(wǎng)絡(luò),RegNet則是在一個(gè)巨大的初始搜索空間中,不斷縮減,最終獲得一個(gè)高性能模型更加集中的子空間,在這個(gè)過程中,發(fā)掘網(wǎng)絡(luò)優(yōu)化準(zhǔn)則,增強(qiáng)網(wǎng)絡(luò)優(yōu)化的可解釋性。自然語言處理領(lǐng)域中的Transformer結(jié)構(gòu)的提出是深度學(xué)習(xí)發(fā)展過程中的重要里程碑,為后續(xù)深度學(xué)習(xí)的進(jìn)一步發(fā)展奠定基礎(chǔ)。2017年,為NLP下游任務(wù)中的機(jī)器翻譯而提出的Transformer模型成為了新的重要?jiǎng)?chuàng)新。其利用多個(gè)注意力模塊的組合,讓神經(jīng)網(wǎng)絡(luò)得以利用有限的資源從大量信息中快速篩選出高價(jià)值信息,不斷提取并學(xué)習(xí)目標(biāo)對(duì)象中更為重要的特征,進(jìn)而實(shí)現(xiàn)性能的提升。后續(xù)OpenAI和Google基于Transformer分別提出了GPT和BERT,提升了諸多自然語言處理下游項(xiàng)目的最優(yōu)性能。后續(xù)Transformer強(qiáng)大的特征提取能力被包括計(jì)算機(jī)視覺在內(nèi)的其他人工智能領(lǐng)域廣泛采用,其核心注意力模塊逐漸成為深度學(xué)習(xí)中不可或缺的部分,大幅推進(jìn)了各領(lǐng)域人工智能算法的性能表現(xiàn)。后續(xù)人工智能深度學(xué)習(xí)中的大部分模型框架也都是建立在Transformer的基礎(chǔ)上,包括引發(fā)熱議的GPT-3和ChatGPT(2.3節(jié))。至此,深度學(xué)習(xí)便從最初簡單的感知機(jī)算法,簡單的神經(jīng)網(wǎng)絡(luò),發(fā)展到目前參數(shù)量達(dá)到數(shù)千萬億的龐大而復(fù)雜的神經(jīng)網(wǎng)絡(luò),成為當(dāng)下人工智能技術(shù)、應(yīng)用、產(chǎn)業(yè)中的主流解決方案。深度學(xué)習(xí)這一技術(shù)所展現(xiàn)出來的變革世界的潛力超越了過去的科技創(chuàng)新,預(yù)計(jì)將以前所未有的方式改變世界的生產(chǎn)生活方式,創(chuàng)造大量的經(jīng)濟(jì)價(jià)值。根據(jù)ARK數(shù)據(jù)顯示,過去二十年來,互聯(lián)網(wǎng)為全球股票市值增加了13萬億美元。而截至2020年,深度學(xué)習(xí)已經(jīng)創(chuàng)造了2萬億美元的市值。根據(jù)ARK測算,深度學(xué)習(xí)將在未來15-20年內(nèi),為全球股票市場增加30萬億美元的市值。2.2計(jì)算機(jī)視覺:AI下游最好的應(yīng)用方向計(jì)算機(jī)視覺是“賦予機(jī)器自然視覺能力”的學(xué)科。實(shí)際上,計(jì)算機(jī)視覺是研究視覺感知問題的學(xué)科:視覺感知是指對(duì)“環(huán)境表達(dá)和理解中,對(duì)視覺信息的組織、識(shí)別和解釋的過程”。核心問題是研究如何對(duì)輸入的圖像信息進(jìn)行組織,對(duì)物體和場景進(jìn)行識(shí)別,進(jìn)而對(duì)圖像內(nèi)容給予解釋。更進(jìn)一步的說,就是指用攝影機(jī)和計(jì)算機(jī)代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖像處理,用計(jì)算機(jī)處理成為更適合人眼觀察或傳送給儀器檢測的圖像。從計(jì)算機(jī)視覺的整理發(fā)展歷程上來看,在研究對(duì)象的豐富、研究方法的革新、研究數(shù)據(jù)的完善等過程中不斷發(fā)展。50年代,主題是二維圖像的分析和識(shí)別。60年代,開創(chuàng)了三維視覺理解為目的的研究。70年代,出現(xiàn)課程和明確理論體系。1989年,YannLeCun將一種后向傳播風(fēng)格學(xué)習(xí)算法應(yīng)用于卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。在完成該項(xiàng)目幾年后,LeCun發(fā)布了LeNet-5——這是第一個(gè)引入我們今天仍在使用的一些基本成分的現(xiàn)代網(wǎng)絡(luò)。90年代,特征對(duì)象識(shí)別開始成為重點(diǎn)。21世紀(jì)初,出現(xiàn)真正擁有標(biāo)注的高質(zhì)量數(shù)據(jù)集。隨后便是Hinton提出深度學(xué)習(xí),其學(xué)生于2012年贏得ImageNet大賽,讓CNN真正家喻戶曉,也讓深度學(xué)習(xí)方法計(jì)算機(jī)視覺研究領(lǐng)域流行,在應(yīng)用端實(shí)現(xiàn)了百花齊放。計(jì)算機(jī)視覺領(lǐng)域中早期的重要算法同時(shí)也是深度學(xué)習(xí)發(fā)展中的重要革新(2.1節(jié)),后續(xù)計(jì)算機(jī)視覺在內(nèi)容生成、特征提取兩個(gè)方面又向前邁出了一大步。2018年末,英偉達(dá)發(fā)布的視頻到視頻生成(Video-to-Videosynthesis),其通過精心設(shè)計(jì)的發(fā)生器、鑒別器網(wǎng)絡(luò)以及時(shí)空對(duì)抗物鏡,合成高分辨率、照片級(jí)真實(shí)、時(shí)間一致的視頻,實(shí)現(xiàn)了讓AI更具物理意識(shí),更強(qiáng)大,并能夠推廣到新的和看不見的更多場景。2019年,更強(qiáng)大的GAN,BigGAN被提出,其擁有更強(qiáng)的學(xué)習(xí)技巧,由它訓(xùn)練生成的圖像連它自己都分辨不出真假,被譽(yù)為史上最強(qiáng)的圖像生成器。2020年,隨著VIT的提出,Transformer開始在計(jì)算機(jī)視覺領(lǐng)域進(jìn)行應(yīng)用,顛覆了傳統(tǒng)的CNN結(jié)構(gòu),后續(xù)Swim-Transformer被提出,通過分而治之的思想解決了Transformer應(yīng)用到圖像領(lǐng)域時(shí)面臨的:視覺實(shí)體變化大影響不同場景下性能和圖像的高分辨率帶來的高計(jì)算量問題,在計(jì)算機(jī)視覺的多個(gè)下游任務(wù)中實(shí)現(xiàn)了對(duì)CNN結(jié)構(gòu)的壓倒性優(yōu)勢。隨著計(jì)算機(jī)視覺算法和技術(shù)的不斷成熟,下游應(yīng)用場景也逐步滲透和拓展。從2018-2021獲得投資的計(jì)算機(jī)視覺企業(yè)來看,其業(yè)務(wù)領(lǐng)域遍布公安、交通、金融、工業(yè)、醫(yī)療等各行各業(yè)。從核心產(chǎn)品和產(chǎn)業(yè)規(guī)模來看,計(jì)算機(jī)視覺產(chǎn)品技術(shù)在泛安防中的應(yīng)用深受政策及財(cái)政支持,多年以來一直是計(jì)算機(jī)視覺乃至整個(gè)國內(nèi)人工智能產(chǎn)業(yè)實(shí)際落地的重要基石。2021年,國內(nèi)泛安防領(lǐng)域計(jì)算機(jī)視覺核心產(chǎn)品市場規(guī)模已達(dá)到531億元,占計(jì)算機(jī)視覺總核心產(chǎn)品規(guī)模的70.7%,這一領(lǐng)域的代表公司有商湯科技、海康威視、大華股份;金融領(lǐng)域主要通過計(jì)算機(jī)視覺產(chǎn)品技術(shù)完成人臉識(shí)別、證照識(shí)別及行為動(dòng)作檢測等工作,代表公司有云從科技(人臉識(shí)別),格靈深瞳(行為動(dòng)作識(shí)別);醫(yī)療領(lǐng)域中,主要借助計(jì)算機(jī)視覺技術(shù)進(jìn)行AI醫(yī)學(xué)影像輔助診斷及新型智能醫(yī)療器械開發(fā),代表公司為依圖科技;互聯(lián)網(wǎng)領(lǐng)域中,計(jì)算機(jī)視覺算法技術(shù)主要基于AI技術(shù)開放平臺(tái),通過API調(diào)用模式開放給更廣泛的開發(fā)者,代表平臺(tái)有阿里云(阿里巴巴)、騰訊云(騰訊)、華為云(華為)。工業(yè)領(lǐng)域中,視覺算法被應(yīng)用在生產(chǎn)過程中的工況監(jiān)視、成品檢驗(yàn)、質(zhì)量控制等方面,主力打造生產(chǎn)制造智能化,主要代表公司為凌云光(零件生產(chǎn)監(jiān)測)、奧普特等。隨著計(jì)算機(jī)視覺相關(guān)技術(shù)及硬件設(shè)施的加速發(fā)展與成熟,以及各行業(yè)數(shù)字化程度的不斷提升,計(jì)算機(jī)視覺有望在更多具體場景中創(chuàng)造更大的經(jīng)濟(jì)價(jià)值。從競爭格局上分析,目前中國計(jì)算機(jī)視覺行業(yè)主要分為三大陣營:1)AI算法公司,多以細(xì)分賽道為具體發(fā)力點(diǎn),提供定制化的解決方案,代表企業(yè)為“CV四小龍”商湯科技、曠視科技、云從科技、依圖科技及格靈深瞳等;2)互聯(lián)網(wǎng)巨頭,借助更完整的產(chǎn)業(yè)生態(tài)逐步在各個(gè)領(lǐng)域進(jìn)行滲透,代表企業(yè)包括阿里巴巴、百度、騰訊、華為等;3)傳統(tǒng)安防巨頭,在云邊融合的架構(gòu)下,借助原有的硬件優(yōu)勢和市場優(yōu)勢,逐步引入算法,研發(fā)智能化解決方案,代表公司包括??低?,大華股份等。目前我國計(jì)算機(jī)視覺市場呈現(xiàn)出市場集中度高的特點(diǎn),以“CV四小龍”為代表的頭部企業(yè)已逐漸占據(jù)國內(nèi)CV的主要市場份額,2020年,商湯科技市場份額排名第一,達(dá)到17.4%;其次為曠視科技,市占率為15.2%;云從科技及依圖科技分別占比9.8%、9%。目前CV四小龍等公司憑借算法享有一定的先發(fā)優(yōu)勢,但隨著計(jì)算機(jī)視覺技術(shù)進(jìn)一步走向具體場景的商業(yè)化應(yīng)用,在場景應(yīng)用層面享有更多資源的互聯(lián)網(wǎng)巨頭和擁有硬件優(yōu)勢的傳統(tǒng)安防巨頭也將獲得更大發(fā)展機(jī)會(huì),未來的核心比拼仍將是應(yīng)用端的商業(yè)化落地。2.3AIGC成為人工智能新方向,擴(kuò)散模型引發(fā)研究熱潮AIGC即AI-GeneratedContent,是一種新的內(nèi)容生產(chǎn)方式。AI從理解內(nèi)容,走向了可以生成內(nèi)容,甚至能夠創(chuàng)造出獨(dú)立價(jià)值和獨(dú)立視角的內(nèi)容。事實(shí)上,使用計(jì)算機(jī)生成內(nèi)容的想法自上個(gè)世紀(jì)五十年代就已經(jīng)出現(xiàn),早期的嘗試側(cè)重通過讓計(jì)算機(jī)生成照片和音樂來模仿人類的創(chuàng)造力,但是與當(dāng)今合成媒體不同的是,早期階段生成的內(nèi)容很容易與人類創(chuàng)建的內(nèi)容區(qū)分開來。人工智能經(jīng)歷數(shù)十年的重大飛躍,目前使用計(jì)算機(jī)生成的內(nèi)容已經(jīng)達(dá)到高水平的真實(shí)感。根據(jù)中國信通院劃分,AIGC經(jīng)歷了早期萌芽階段(1950s-1990s),沉淀積累階段(1990s-2010s)以及快速發(fā)展階段(2010s-至今)。其中,早期萌芽期受限于科技水平,AIGC僅限于小范圍實(shí)驗(yàn),并沒有取得重大突破,例如通過將計(jì)算機(jī)程序中的控制變量換成音符完成了歷史上第一支由計(jì)算機(jī)創(chuàng)作的音樂作品——弦樂四重奏《依利亞克組曲(IlliacSuite)》,或者世界第一款可人機(jī)對(duì)話的機(jī)器人“伊莉莎”等。沉淀積累階段受益于深度學(xué)習(xí)的重大突破,自然語言處理、語音識(shí)別等領(lǐng)域開始向?qū)嵱眯赞D(zhuǎn)變,例如此階段誕生了全世界第一部完全由人工智能創(chuàng)作的小說;微軟推出全自動(dòng)同聲傳譯系統(tǒng)。快速發(fā)展時(shí)期,AIGC迎來百發(fā)齊放階段,該階段人工智能算法可以生成極高質(zhì)量的圖片、視頻、繪畫作品等。AIGC當(dāng)前快速發(fā)展得益于生成模型的飛躍。與用于監(jiān)督任務(wù)的判別模型不同的是,生成模型通過學(xué)習(xí)某個(gè)樣本生成的概率對(duì)新數(shù)據(jù)進(jìn)行建模,即判別模型可以識(shí)別圖像中的人,而生成模型可以生成一個(gè)以前從未存在過的人的新圖像。生成模型的飛躍是GAN(生成對(duì)抗網(wǎng)絡(luò))的出現(xiàn),自GAN推出后,AI生成的媒體模型已經(jīng)實(shí)現(xiàn)了逼真的合成,包括照片級(jí)圖像的生成、聲音克隆以及面部識(shí)別等。AI內(nèi)容創(chuàng)作也已經(jīng)完成了從文字到圖畫再到視頻的躍遷。GAN網(wǎng)絡(luò)包括兩部分,一個(gè)生成器和一個(gè)判別器。生成器負(fù)責(zé)生成類似輸入數(shù)據(jù)的新內(nèi)容,判別器是將生成的輸出與真實(shí)數(shù)據(jù)區(qū)分開來,這兩個(gè)部分在一個(gè)GAN網(wǎng)絡(luò)反饋循環(huán)中相互競爭并試圖超越對(duì)方,導(dǎo)致生成輸出的真實(shí)性逐漸增加。在GAN網(wǎng)絡(luò)基礎(chǔ)上有兩個(gè)經(jīng)典的延伸,一個(gè)是StyleGAN,能夠通過將圖像不同部位進(jìn)行區(qū)分,從而能夠直觀控制生成圖像的細(xì)節(jié);另外一個(gè)是in-domainGAN,支持對(duì)GAN生成圖像進(jìn)行編輯,從而可以在現(xiàn)有圖像進(jìn)出上進(jìn)行增添元素。除了用于圖像處理上,GAN網(wǎng)絡(luò)也被用于視頻配音、圖像動(dòng)畫等應(yīng)用中。AIGC中,文本生成領(lǐng)域也得益于GPT-3等語言模型的出現(xiàn)而大放異彩,GPT-3在用于文本處理之外,也可以用于文本到圖像的生成。AIGC已被廣泛用于多種行業(yè),包括娛樂、客戶服務(wù)與營銷。例如在移動(dòng)程序Reface中,用戶能夠在視頻剪輯和GIF中換臉以與朋友分享;在Pinscreen上創(chuàng)建AI虛擬助手,在直播中進(jìn)行面部替換;甚至于可以在視頻中生成嘴唇運(yùn)動(dòng)模型,從而允許將視頻翻譯成另外一種語言,嘴唇運(yùn)動(dòng)和配音之間沒有任何明顯差異。根據(jù)Capterra調(diào)研顯示,雖然只有33%的營銷人員使用AIGC,但大多數(shù)都對(duì)AIGC內(nèi)容質(zhì)量都感到滿意。AIGC領(lǐng)域投資力度空前。AIGC文字生成領(lǐng)域,負(fù)責(zé)文字生成的AIGC公司彩云小夢、聆心智能獲得了天使輪融資,Jasper.ai更是在A輪融資階段獲得了1.25億美元的融資,估值15億美元。AIGC圖像生成領(lǐng)域,負(fù)責(zé)AI作畫的初創(chuàng)公司詩云科技先后獲得了天使輪、Pre-A輪融資,ZMO.AI獲得了800萬美元的A輪融資,英國開源人工智能公司StabilityAI獲得了1.01億美元的融資,目前該公司估值高達(dá)10億美元,成為了行業(yè)獨(dú)角獸。AIGC視頻生成領(lǐng)域,負(fù)責(zé)產(chǎn)出視頻的小冰公司A輪融資由高瓴資本領(lǐng)投,目前估值超過10億美元,Meta的新產(chǎn)品Make-A-Video也可以直接通過文字生成視頻,谷歌也推出了生成視頻的AI模型ImagenVideo、Phenaki。擴(kuò)散模型(DiffusionModel)正引起AIGC領(lǐng)域新一波浪潮。生成模型主要包括GAN(生成對(duì)抗網(wǎng)絡(luò))、VAE(變分自編碼器)、基于流的模型以及擴(kuò)散模型等。GAN模型具有對(duì)抗性訓(xùn)練性質(zhì),具有潛在的不穩(wěn)定訓(xùn)練和較少的生成多樣性;VAE依賴于替代損失;基于流的模型必須使用專門的體系結(jié)構(gòu)來構(gòu)建可逆變換。擴(kuò)散模型的靈感來自非平衡熱力學(xué),模型定義了一個(gè)擴(kuò)散步驟的馬爾可夫鏈,在正向擴(kuò)散過程中,將隨機(jī)噪聲添加到數(shù)據(jù)中,然后學(xué)習(xí)反向擴(kuò)散過程,從噪聲中構(gòu)建所需的數(shù)據(jù)樣本。與VAE或基于流的模型不同,擴(kuò)散模型是通過固定過程學(xué)習(xí)的,并且潛在變量具有高維性。在webofscience平臺(tái)上,通過關(guān)鍵字“diffusionmodel”在webofscience核心合集數(shù)據(jù)庫中按照主題檢索(檢索時(shí)間為2022年11月30日),2020年相關(guān)主題論文為446篇,2021年相關(guān)論文456篇,為近二十年高峰。擴(kuò)散模型成為ICLR熱門關(guān)鍵詞之一。根據(jù)人工智能頂級(jí)會(huì)議ICLR2023發(fā)布的評(píng)審結(jié)果,擴(kuò)散模型成了今年ICLR的熱門關(guān)鍵詞之一,以擴(kuò)散模型為研究主題的投稿論文數(shù)量出現(xiàn)暴漲。擴(kuò)散模型引發(fā)了席卷式的AIGC熱潮,今年4月OpenAI發(fā)布文本生成圖像模型DALLE2,之后谷歌推出Imagen,直接對(duì)標(biāo)DALLE2,文本生成圖像領(lǐng)域開始出現(xiàn)激烈競爭。今年8月,初創(chuàng)公司Stability.AI發(fā)布深度學(xué)習(xí)文生圖模型StableDiffusion,開源后更是一石激起千層浪,后續(xù)基于擴(kuò)散模型的文本生成圖像模型層出不窮,并很快擴(kuò)展到文本生成視頻、文本生成3D、文本生成音頻等。擴(kuò)散模型主要包括三個(gè)子類別,已應(yīng)用于各種生成建模任務(wù)。第一類擴(kuò)散模型為DDPM(去噪擴(kuò)散概率模型),DDPM是一種潛在變量模型,利用潛在變量來估計(jì)概率分布,可以看做是一種特殊的VAE;第二類擴(kuò)散模型是NCSN(噪聲條件評(píng)分網(wǎng)絡(luò)),通過評(píng)分匹配訓(xùn)練共享神經(jīng)網(wǎng)絡(luò)來估計(jì)不同噪聲水平下受擾數(shù)據(jù)分布的評(píng)分函數(shù);第三類擴(kuò)散模型是SDE(隨機(jī)微分方程),代表模擬擴(kuò)散的方式。當(dāng)前擴(kuò)散模型已用于各種生成建模任務(wù),如圖像生成、圖像超分辨率、圖像填充、圖像編輯等領(lǐng)域。未來,擴(kuò)散模型將在圖像去霧化、視頻異常檢測、物體檢測、視頻模擬等領(lǐng)域有所突破。2.4NLP發(fā)展情況自然語言處理(naturallanguageprocessing,NLP)是基于自然語言理解和自然語言生成的信息處理技術(shù),近些年來,自然語言處理在機(jī)器翻譯、智能語言助手、文本自動(dòng)分類都取得了突破性進(jìn)展。1950年,圖靈發(fā)表論文“計(jì)算機(jī)器與智能”,其中提到著名的用于衡量機(jī)器智能程度的圖靈測試,可以被認(rèn)為是自然語言的開端,自然語言處理的技術(shù)發(fā)展大致可以分為三個(gè)階段:規(guī)則—統(tǒng)計(jì)—深度學(xué)習(xí)。20世紀(jì)50年代到90年代,研究人員重點(diǎn)關(guān)注語言的規(guī)則,從語言學(xué)的角度來解析自然語言的規(guī)則結(jié)構(gòu),從而實(shí)現(xiàn)自然語言的處理,但是這個(gè)階段還不能處理復(fù)雜的語言問題,因而沒有太大的應(yīng)用價(jià)值。20世紀(jì)90年代以后,隨著互聯(lián)網(wǎng)的高速發(fā)展,語料庫的日益豐富、計(jì)算機(jī)運(yùn)行速度的提升以及統(tǒng)計(jì)方法的成熟,極大地推動(dòng)了自然語言處理技術(shù)的發(fā)展。2006年深度學(xué)習(xí)算法提出,隨后很快被應(yīng)用到自然語言處理領(lǐng)域,取得了驚人的成績和廣泛的應(yīng)用。誕生了多種神經(jīng)網(wǎng)絡(luò)語言模型,包括多層感知機(jī)(MLP)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和長短記憶(LSTM)網(wǎng)絡(luò),但是都存在一定的不足,MLP難以捕捉局部特征,CNN難以獲得遠(yuǎn)距離特征,RNN難以充分利用并行計(jì)算加速,LSTM減少了網(wǎng)絡(luò)的層數(shù),相對(duì)來說更容易優(yōu)化。2017年,采用注意力機(jī)制的Transformer模型被引入到自然語言處理以后取得了極大的成功。注意力機(jī)制更加關(guān)注上下文的相關(guān)程度和深層的語義信息,因而Transformer模型在長距離建模和訓(xùn)練速度方面都優(yōu)于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型。近年來,在Transformer模型的基礎(chǔ)之上,衍生出了GPT、BERT等超大規(guī)模的動(dòng)態(tài)預(yù)訓(xùn)練語言模型,除此以外,還有基于Word2vec的詞向量方法提出的ELMo模型也得到了大規(guī)模的應(yīng)用,ELMo考慮了上下文的詞向量表示,較好的解決了多義詞的問題。GPT模型是OpenAI公司于2018年6月提出的動(dòng)態(tài)預(yù)訓(xùn)練模型,版本也在不停更新迭代,最新版本GPT-3是目前最為強(qiáng)大的預(yù)訓(xùn)練模型之一,于2020年5月提出。GPT每代模型的參數(shù)數(shù)目不斷提升,初始GPT版本只有1.17億個(gè)參數(shù),GPT-2參數(shù)超過10億,GPT-3參數(shù)高達(dá)1750億,使用了高達(dá)45TB的訓(xùn)練樣本。GPT-3已經(jīng)商業(yè)化落地,基于GPT-3產(chǎn)生的APP達(dá)300多個(gè),覆蓋傳媒、營銷等領(lǐng)域,OpenAI以API的形式向開發(fā)者提供有償?shù)腉PT-3模型使用權(quán)限,按照token(1000tokens=750words)使用量收費(fèi),1000tokens收費(fèi)在0.0004~0.2美元之間。BERT模型由Goegle于2018年10月提出,BERT使用包含1.1億個(gè)參數(shù)的BERTBASE和包含3.4億個(gè)參數(shù)的BERTLARGE,在自然語言識(shí)別的SQuAD測試中,BERT模型的表現(xiàn)甚至超越了人類?;贐ERT模型衍生出了更多具備特定優(yōu)勢的模型,例如增強(qiáng)長文本理解能力的XLNet,具備強(qiáng)大文本生成能力的BART等。隨著預(yù)訓(xùn)練語言模型的提出和計(jì)算機(jī)算力的快速提升,自然語言處理技術(shù)已經(jīng)進(jìn)入全新的發(fā)展階段。預(yù)訓(xùn)練模型通過無需人工標(biāo)注的大規(guī)模文本庫進(jìn)行高算力的預(yù)先訓(xùn)練,得到通用的語言模型和表現(xiàn)形式,再經(jīng)過特定應(yīng)用環(huán)境對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào),從而在各種下游應(yīng)用領(lǐng)域得到目標(biāo)任務(wù)的快速收斂和準(zhǔn)確率提升。各種預(yù)訓(xùn)練語言模型還在快速的更新迭代,不斷刷新自然語言處理任務(wù)的表現(xiàn)記錄,預(yù)訓(xùn)練模型已經(jīng)在自然語言處理中得到了廣泛應(yīng)用。當(dāng)前自然語言處理技術(shù)在某些領(lǐng)域已經(jīng)可以媲美人類水平,同時(shí)具備多種功能應(yīng)用,包括文本檢索、信息過濾、機(jī)器翻譯、客服問答、文本生成等,在金融、教育、醫(yī)療、互聯(lián)網(wǎng)行業(yè)當(dāng)中得到了廣泛的應(yīng)用,隨著自然語言處理和傳統(tǒng)行業(yè)的深度融合,將人力從部分重復(fù)性的語言工作當(dāng)中解放了出來,實(shí)現(xiàn)了人工智能替代。2022年11月30日,OpenAI發(fā)布了ChatGPT人機(jī)對(duì)話交互模型,相比過去的人機(jī)對(duì)話模型,ChatGPT展現(xiàn)出更貼近人類的思維邏輯,可以回復(fù)用戶的連續(xù)問題,具有一定的道德準(zhǔn)則,減少了錯(cuò)誤問答的出現(xiàn)概率,具備代碼的編寫和debug功能。ChatGPT在人機(jī)對(duì)話上到達(dá)了前所未有的高度,模型開放測試一周用戶便突破了百萬級(jí)別。ChatGPT作為GPT3.5的微調(diào)版本,采用了人類反饋強(qiáng)化學(xué)習(xí)方式(RLHF)和近端優(yōu)化策略(PPO),通過獎(jiǎng)勵(lì)模型的設(shè)定,極大減少了無效的、編造的、有害的答案出現(xiàn)概率,更多輸出了人們期望的答案。當(dāng)前ChatGPT已經(jīng)在諸多問答環(huán)節(jié)里表現(xiàn)出極高的擬人化,足以以假亂真。目前ChatGPT處于免費(fèi)的開源公測階段,仍在優(yōu)化迭代過程中。我們預(yù)計(jì),超大規(guī)模的自然語言預(yù)處理模型將率先在傳媒營銷、搜索引擎增強(qiáng)、代碼編程等領(lǐng)域?qū)崿F(xiàn)商業(yè)落地。當(dāng)前自然語言處理的快速發(fā)展已讓我們更加臨近圖靈測試的奇點(diǎn),未來人工智能將深刻地改變我們的生產(chǎn)生活方式。我們應(yīng)當(dāng)重點(diǎn)關(guān)注自然語言處理的技術(shù)進(jìn)展、大規(guī)模商業(yè)的落地途徑以及我國超大規(guī)模預(yù)訓(xùn)練模型的發(fā)展進(jìn)展。三、AI基礎(chǔ)層及應(yīng)用層投資機(jī)會(huì):自動(dòng)駕駛、機(jī)器視覺景氣度高,F(xiàn)PGA芯片空間大3.1自動(dòng)駕駛:技術(shù)不斷突破,滲透率不斷提升3.1.1自動(dòng)駕駛技術(shù)不斷突破,Transformer模型應(yīng)用進(jìn)一步提升準(zhǔn)確率視覺Transformer正推動(dòng)自動(dòng)駕駛向前邁進(jìn)。自動(dòng)駕駛初期階段,主要目標(biāo)是讓汽車在單車道內(nèi)行駛,隨著駕駛復(fù)雜性,需要對(duì)路況進(jìn)行影像提取與3D建模等。特斯拉自動(dòng)駕駛算法使用的是多任務(wù)學(xué)習(xí)HydraNets架構(gòu),從而讓汽車共享相同神經(jīng)網(wǎng)絡(luò)或特征提取器的同時(shí)能進(jìn)行交通燈檢測、車輛避讓等多項(xiàng)任務(wù)。特斯拉自動(dòng)駕駛算法中,首先讓車載攝像頭使用RegNet(殘差網(wǎng)絡(luò))對(duì)路況/汽車進(jìn)行原始圖像提取。在每個(gè)攝像頭都處理完單個(gè)圖像后,使用具有多頭自注意力的Transformer模型進(jìn)行處理,Transformer模型不僅解決了CNN算法在BEV(鳥瞰圖)遮擋區(qū)域預(yù)測問題,同時(shí)還有更高的性能和算法準(zhǔn)確度。后續(xù)將處理結(jié)果進(jìn)行多尺度特征、視頻神經(jīng)網(wǎng)絡(luò)等處理,從而完成整個(gè)自動(dòng)駕駛算法。近年來Transformer憑借傳統(tǒng)CNN算法所不能企及的感知能力以及其優(yōu)秀的魯棒性和泛化性,已逐步取代IPM、Lift-splat、MLP成為BEV(鳥瞰圖)感知領(lǐng)域的主流算法。特斯拉中的Transformer模型側(cè)重于使用交叉注意力。根據(jù)特斯拉2021人工智能日,特斯拉Transformer算法主要原理為:首先初始化一個(gè)輸出空間大小的柵格,在輸出空間中利用正弦和余弦的位置編碼進(jìn)行填充,用多層感知機(jī)將其編碼成一組查詢向量。所有的圖像及其特征均生成屬于自己的鍵和值。最后將鍵和值查詢輸入到注意力中。我們認(rèn)為Transformer模型因其注意力機(jī)制解決了CNN中卷積層遮擋區(qū)域檢測問題,成為了自動(dòng)駕駛領(lǐng)域的首選,交叉注意力機(jī)制目前也更有利于Transformer模型在汽車上進(jìn)行部署,Transformer模型正推動(dòng)自動(dòng)駕駛技術(shù)實(shí)現(xiàn)飛躍式的迭代。2022年6月2日,馬斯克發(fā)布推特稱,Transformer正在取代C啟發(fā)式算法去處理視覺神經(jīng)網(wǎng)絡(luò)中大量的節(jié)點(diǎn),特斯拉全自動(dòng)駕駛正在使用運(yùn)行在TRIP芯片上的GPT算法實(shí)現(xiàn)計(jì)算機(jī)視覺。根據(jù)特斯拉2022AI開放日,特斯拉全自動(dòng)駕駛(FullSelfDriving(beta))客戶已從2021年的2000個(gè)增長到2022年的16000個(gè)。2022年11月24日,馬斯克發(fā)布推特稱,特斯拉全自動(dòng)駕駛(FullSelfDriving(beta))已經(jīng)可以提供給北美任何一個(gè)購買相關(guān)服務(wù)的車主使用,成為特斯拉Autopilot/AI團(tuán)隊(duì)一個(gè)重要里程碑。在特斯拉的引領(lǐng)下,自動(dòng)駕駛功能滲透率將不斷提升,其中智能駕駛域控制器率先放量。3.1.2智能駕駛滲透率繼續(xù)提升,L3車型開始落地深圳發(fā)布《深圳經(jīng)濟(jì)特區(qū)智能網(wǎng)聯(lián)汽車管理?xiàng)l例》,自動(dòng)駕駛政策放開臨近。近些年來,為了支持自動(dòng)駕駛等智能汽車行業(yè)的發(fā)展,我國政府陸續(xù)發(fā)布了許多政策。例如,2018年工信部發(fā)布《車聯(lián)網(wǎng)(智能網(wǎng)聯(lián)汽車)產(chǎn)業(yè)發(fā)展行動(dòng)計(jì)劃》,指出要加快建設(shè)智能網(wǎng)聯(lián)汽車制造業(yè)創(chuàng)新中心,促進(jìn)產(chǎn)業(yè)鏈上下游及與相關(guān)行業(yè)之間的融合。2022年11月,工信部發(fā)布《關(guān)于開展智能網(wǎng)聯(lián)汽車準(zhǔn)入和上路通行試點(diǎn)工作的通知(征求意見稿)》,將在全國智能網(wǎng)聯(lián)汽車道路測試與示范應(yīng)用工作基礎(chǔ)上,選出符合條件的企業(yè)和智能網(wǎng)聯(lián)汽車產(chǎn)品,開展準(zhǔn)入試點(diǎn),其中智能網(wǎng)聯(lián)汽車搭載的自動(dòng)駕駛功能為L3和L4級(jí)。2022年6月,深圳市發(fā)布《深圳經(jīng)濟(jì)特區(qū)智能網(wǎng)聯(lián)汽車管理?xiàng)l例》,這是國內(nèi)首部關(guān)于智能網(wǎng)聯(lián)汽車管理的法規(guī),對(duì)智能網(wǎng)聯(lián)汽車的準(zhǔn)入登記、上路行駛等事項(xiàng)做出具體規(guī)定。北京、上海、重慶、四川等多地也均發(fā)布相關(guān)支持政策。L2級(jí)別自動(dòng)駕駛前裝滲透率不斷提升。根據(jù)上險(xiǎn)量數(shù)據(jù),2022年10月我國智能汽車銷量39.73萬輛,同比增長68.1%,滲透率為24.78%。在2022年世界智能網(wǎng)聯(lián)汽車大會(huì)上,工信部副部長辛國斌介紹,今年上半年具備組合駕駛輔助功能的乘用車銷量達(dá)288萬輛,滲透率升至32.4%,同比增長46.2%。國內(nèi)自動(dòng)駕駛正進(jìn)入發(fā)展快車道。根據(jù)高工智能研究院數(shù)據(jù),截至2022年9月,我國前向L2級(jí)ADAS前裝滲透率已達(dá)27.7%,2019-2021年該數(shù)據(jù)分別為2%、12%、19.4%。未來國內(nèi)自動(dòng)駕駛級(jí)別將從L2向L3/L4轉(zhuǎn)換,例如上海市發(fā)布《上海市加快智能網(wǎng)聯(lián)汽車創(chuàng)新發(fā)展實(shí)施方案》指出,到2025年,上海市初步建成國內(nèi)領(lǐng)先的智能網(wǎng)聯(lián)汽車創(chuàng)新發(fā)展體系,產(chǎn)業(yè)規(guī)模力爭達(dá)到5000億元,具備組合駕駛輔助功能(L2級(jí))和有條件自動(dòng)駕駛功能(L3級(jí))汽車占新車生產(chǎn)比例超過70%,具備高度自動(dòng)駕駛功能(L4級(jí)及以上)汽車在限定區(qū)域和特定場景實(shí)現(xiàn)商業(yè)化應(yīng)用。2023年新出自動(dòng)駕駛車型中L2依舊為主流,L3/L4開始落地。2023年多家車廠推出L3級(jí)別自動(dòng)駕駛汽車,從半自動(dòng)駕駛階段跨越至特定場景中完全自動(dòng)駕駛階段。例如現(xiàn)代汽車將在2023年推出包括捷尼賽思G90和起亞EV9在內(nèi)的多款L3級(jí)別自動(dòng)駕駛汽車;寶馬L3自動(dòng)駕駛系統(tǒng)“PersonalPilot”將在2023年底推出,并將在寶馬7系列上使用;小米純電汽車搭載L3級(jí)別自動(dòng)駕駛系統(tǒng),目前正處于測試階段,預(yù)計(jì)2024年上半年量產(chǎn);奇瑞與華為將合作在2023年推出搭載L3級(jí)別自動(dòng)駕駛系統(tǒng)的E03與E0Y。部分自動(dòng)駕駛汽車車廠直接跳過L3,直接從L2邁向L4級(jí)別。例如通用公司旗下的Cruise支持L4級(jí)別駕駛,推出Origin車型;百度發(fā)布ApolloRT6,支持L4級(jí)別自動(dòng)駕駛,并將于2023年開始試運(yùn)營。3.2FPGA:高成長、高壁壘的優(yōu)質(zhì)賽道,看好FPGA芯片3.2.1FPGA:時(shí)延低、單位能耗比低、并行運(yùn)算更高效的可編程芯片,中國市場快速增長FPGA的全稱為Field-ProgrammableGateArray,即現(xiàn)場可編程門陣列。主要由可編程的邏輯單元(LC)、輸入輸出單元(IO)和開關(guān)連線陣列(SB)三個(gè)部分構(gòu)成??删幊踢壿媶卧ㄟ^數(shù)據(jù)查找表LUT中存放的二進(jìn)制數(shù)據(jù)來實(shí)現(xiàn)不同的電路功能,開關(guān)陣列通過內(nèi)部MOS管的開關(guān)控制信號(hào)連線的走向。FPGA的無指令特征,使其具有時(shí)延低、單位能耗比低、并行運(yùn)算更高效三大特征。1.時(shí)延低:因無指令的特征,所有程序都自存儲(chǔ)器讀取結(jié)果,不需要像CPU一樣進(jìn)行程序編譯等過程,因此算法運(yùn)行時(shí)間遠(yuǎn)小于CPU和GPU,適用于時(shí)延要求高的領(lǐng)域。2.單位能耗比低:無指令特征下,節(jié)省了編碼、譯碼等過程,因此能耗比更低。3.并行運(yùn)算更高效:因無指令特征,F(xiàn)PGA可以做到異步的并行,如果說GPU的計(jì)算是1名指揮員協(xié)調(diào)10條生產(chǎn)線,ASIC/FPGA就是由10名指揮員分別指揮自己的生產(chǎn)線。因此在執(zhí)行并行運(yùn)算的時(shí)候(AI領(lǐng)域),與CPU、GPU相比,F(xiàn)PGA具有更高的速度和極低的計(jì)算能耗,使深度學(xué)習(xí)實(shí)時(shí)計(jì)算更容易在端側(cè)執(zhí)行。FPGA的最大特點(diǎn)是可編程特性。邏輯單元、開關(guān)陣列可編程,使得FPGA功能可以隨時(shí)改變,從而具有可編程特性。FPGA基于的是查找表技術(shù),任何邏輯都儲(chǔ)存在SRAM電路中,而SRAM電路是易失性存儲(chǔ)器,斷電后數(shù)據(jù)則不被保存,因此FPGA通過改寫SRAM中的數(shù)據(jù)表以及開關(guān)陣列,即可實(shí)現(xiàn)不同功能。全球市場快速增長:根據(jù)Frost&Sullivan數(shù)據(jù),2019年全球FPGA芯片產(chǎn)業(yè)規(guī)模約為56.8億美元,2016-2019年復(fù)合增速為9.38%。隨著全球新一代通信設(shè)備部署以及人工智能與自動(dòng)駕駛技術(shù)等新興市場領(lǐng)域需求的不斷增長,F(xiàn)PGA市場規(guī)模預(yù)計(jì)將持續(xù)提高。中國市場增速快于全球市場:根據(jù)Frost&Sullivan數(shù)據(jù),中國FPGA市場從2016年的約65.5億元增長至2019年的129.6億元,復(fù)合增速為25.48%。工業(yè)、汽車電子、數(shù)據(jù)中心成為FPGA增長最快的細(xì)分市場。FPGA芯片因其現(xiàn)場可編程的靈活性和不斷提升的電路性能,擁有豐富的下游應(yīng)用領(lǐng)域,包括網(wǎng)絡(luò)通信、工業(yè)控制、消費(fèi)電子、數(shù)據(jù)中心、汽車電子等。2020年中國FPGA市場下游應(yīng)用中,通信領(lǐng)域和工業(yè)控制占比最高,分別達(dá)到41%和32%。隨著智能汽車、AI推理的不斷滲透,汽車電子、數(shù)據(jù)中心、工業(yè)成為FPGA增長最快的細(xì)分市場,預(yù)計(jì)2022-2025年汽車FPGA市場復(fù)合增長率將達(dá)到13.3%,數(shù)據(jù)中心FPGA市場復(fù)合增長率將達(dá)到12.7%,除此之外,工業(yè)視覺也有較快的增長。海外龍頭AMD和Intel的FPGA產(chǎn)品價(jià)格上漲,凸顯行業(yè)景氣度。根據(jù)國際電子商情的消息,由于疫情沖擊、供需情況緊張和產(chǎn)品成本上漲,AMD將從2023年1月9日起對(duì)旗下Xilinx品牌的FPGA產(chǎn)品進(jìn)行漲價(jià),其中Spartan6系列漲價(jià)25%,Versal系列不漲價(jià),其他Xilinx產(chǎn)品全部漲價(jià)8%。此外Xilinx產(chǎn)品的產(chǎn)能也受到影響,產(chǎn)品的交貨周期存在不同程度的延長,16nmUltraScale+系列、20nmUltraScale系列、28nm7系列都需要20周,預(yù)計(jì)到2023年第二季度末才能緩解交付壓力。剩余Xilinx成熟節(jié)點(diǎn)產(chǎn)品的標(biāo)準(zhǔn)交貨周期持續(xù)到2023年第一季度末。2022年7月底,Intel也通知其FPGA產(chǎn)品從2022年10月9日起全線漲價(jià),其中ArriaV、Arria10、CycloneIV、CycloneV、Cyclone10、MAXV、MAX10、eASIC等新款漲價(jià)10%,ArriaII、CycloneII、CycloneIII、MAXII、StratixIII、StratixIV、StratixV、EPCQ-A等舊型號(hào)產(chǎn)品漲價(jià)20%。兩家海外龍頭的漲價(jià)主要集中在舊產(chǎn)品和中低端市場,屬于的可覆蓋范圍。海外FPGA產(chǎn)品的漲價(jià)將提高國內(nèi)公司的使用成本,從而推動(dòng)的節(jié)奏。全球FPGA公司均呈現(xiàn)快速增長,:1)AMD:全球第一大FPGA公司Xilinx于2020年以350億美元的價(jià)格被AMD收購,該交易于2022年2月14日完成。去掉原本屬于AMD嵌入式芯片業(yè)務(wù)合并報(bào)表因素影響,2022Q2和Q3的AMD的FPGA業(yè)務(wù)營收達(dá)到12.01億美元和12.62億美元,與對(duì)應(yīng)的Xilinx財(cái)年數(shù)據(jù)比較,同比增長36.63%和34.83%;2)IntelFPGA業(yè)務(wù)預(yù)計(jì)今年增速達(dá)26%,持續(xù)推出新產(chǎn)品,行業(yè)成長空間廣闊。2022英特爾FPGA中國技術(shù)周上,公司預(yù)計(jì)今年FPGA業(yè)務(wù)收入超24億美金,同比去年19億美金增長26%,是過去五年來增速最快的一年;3)Lattice營收近五年持續(xù)增長,2021年后增速加快,主要增長點(diǎn)為工業(yè)和汽車、通信與計(jì)算兩大板塊。2021年收入5.15億美元,同比增長26.3%,2022年前三季度收入4.8億美元,同比增長29.8%,增速進(jìn)一步加快。工業(yè)和汽車主要用于工業(yè)自動(dòng)化和機(jī)器人、ADAS和信息娛樂應(yīng)用,在2021年收入2.26億美金,同比增長34.4%。2022Q1-Q3收入2.3億美元,同比增長38.6%,是增速和占比最大的一塊。通信和計(jì)算主要用于數(shù)據(jù)中心服務(wù)器、客戶端計(jì)算和5G基礎(chǔ)設(shè)施,在2021年收入2.18億美元,同比增長24.8%。2022Q1-Q3收入2.05億美元,同比增長29.7%。消費(fèi)和許可與服務(wù)業(yè)務(wù)開始增長,在2021年分別同比增長11.3%和4.4%。FPGA:高成長、高壁壘的優(yōu)質(zhì)賽道:隨著架構(gòu)、先進(jìn)制程的迭代,F(xiàn)PGA從傳統(tǒng)通信密集領(lǐng)域的應(yīng)用拓展到了計(jì)算密集領(lǐng)域,包括AI、邊緣計(jì)算、自動(dòng)駕駛等新領(lǐng)域的應(yīng)用,整個(gè)行業(yè)打開了新的成長空間。3.2.2FPGA呈現(xiàn)寡頭壟斷市場格局,空間大全球FPGA市場呈現(xiàn)寡頭壟斷格局:從全球FPGA市場競爭格局來看,相關(guān)市場目前基本由龍頭企業(yè)把控,Xilinx和Intel占比達(dá)到80%,目前中國廠商在全球市場中所占份額較低。中國FPGA市場由賽靈思(Xilinx)和英特爾(Intel)兩家供應(yīng)商主導(dǎo),兩家公司在中國的市場份額超過70%。目前本土供應(yīng)商也占據(jù)了一定市場份額,2021年在中國的總份額超過15%,隨著國產(chǎn)化的推進(jìn),國內(nèi)市場具有廣闊的提升空間。美國限制國內(nèi)AI芯片發(fā)展,F(xiàn)PGA最大下游通信領(lǐng)域頻受制裁:2022年10月7日,拜登政府宣布了一項(xiàng)關(guān)于人工智能(AI)和半導(dǎo)體技術(shù)對(duì)中國的新出口管制政策。此外,部分公司也受到制裁。以華為為例,美國政府禁止華為購買美國元器件和軟件。通信是FPGA最大的下游市場,在中國市場中占比超過40%,華為是全球第一大通信設(shè)備商,2021年占全球通信設(shè)備市場28.7%的份額,是通信FPGA主要需求方,以華為為主的這些受到制裁的大客戶無法或受限制使用國外FPGA。信創(chuàng)快速推進(jìn),F(xiàn)PGA將受益于信創(chuàng)發(fā)展:自2021年以來,繼黨政信創(chuàng)展開后,包括三大運(yùn)營商及金融機(jī)構(gòu)持續(xù)展開國產(chǎn)化服務(wù)器集采,表明信創(chuàng)產(chǎn)業(yè)正在不斷向行業(yè)延伸。信創(chuàng)產(chǎn)業(yè)龐大,其中芯片、整機(jī)、操作系統(tǒng)、數(shù)據(jù)庫、中間件是重要的產(chǎn)業(yè)鏈環(huán)節(jié)。2022年下半年開始信創(chuàng)將繼續(xù)快速推進(jìn),整體大趨勢已經(jīng)形成。FPGA作為重要的計(jì)算芯片,服務(wù)器中將其應(yīng)用于后端的通信板卡。同時(shí),F(xiàn)PGA是電力、交通領(lǐng)域重要的通信部件,在銀行系統(tǒng)中應(yīng)用于企業(yè)級(jí)交換機(jī)路由器,在云計(jì)算中也起到運(yùn)算加速作用。3.3AI+工業(yè):助力制造業(yè)轉(zhuǎn)型升級(jí),看好機(jī)會(huì)我們認(rèn)為,在人工智能和工業(yè)制造的結(jié)合過程中,應(yīng)當(dāng)重點(diǎn)關(guān)注工業(yè)機(jī)器視覺、工業(yè)互聯(lián)網(wǎng)和EDA。3.3.1工業(yè)機(jī)器視覺助力制造業(yè)轉(zhuǎn)型升級(jí),技術(shù)突破加速根據(jù)美國自動(dòng)化協(xié)會(huì)定義:機(jī)器視覺是光學(xué)、機(jī)械、電子、計(jì)算、軟件等技術(shù)一體化的工業(yè)應(yīng)用系統(tǒng),其利用相機(jī)和計(jì)算機(jī)代替人的視覺感知和判斷能力,自動(dòng)采集并分析圖象,以獲取用于控制或評(píng)估特定活動(dòng)所需的數(shù)據(jù)。主要由成像、信號(hào)分析與處理、決策與執(zhí)行三個(gè)關(guān)鍵環(huán)節(jié)構(gòu)成。功能上具體可以分為識(shí)別、測量、定位和檢測四種。在工業(yè)應(yīng)用場景中,機(jī)器視覺相比人眼視覺在識(shí)別精確度、識(shí)別速度、環(huán)境要求、識(shí)別客觀性、可靠性、工作效率、數(shù)據(jù)價(jià)值方面均存在顯著優(yōu)勢,能夠較好的替代人工進(jìn)行工作。隨著深度學(xué)習(xí)、3D視覺技術(shù)、高精度成像技術(shù)和機(jī)器視覺互聯(lián)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論