下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
人工智能芯片發(fā)展態(tài)勢分析及對策建議作者:叢瑛瑛陳絲來源:《信息通信技術(shù)與政策》2018年第8期摘要:人工智能市場前景以及暴力型計算特征趨勢直接帶動人工智能芯片技術(shù)創(chuàng)新升級和市場規(guī)模擴張的新需求,催生集成電路技術(shù)產(chǎn)業(yè)競爭的新焦點。當前,人工智能芯片呈現(xiàn)多技術(shù)路徑并行發(fā)展態(tài)勢,以英偉達、英特爾、谷歌為代表的國際巨頭加速布局初步搶奪先發(fā)優(yōu)勢;我國企業(yè)快速跟進,并在部分領(lǐng)域取得一定進展,但國內(nèi)集成電路產(chǎn)業(yè)基礎(chǔ)薄弱的問題依然嚴峻,恐制約人工智能芯片產(chǎn)業(yè)創(chuàng)新發(fā)展。因而亟需發(fā)揮市場帶動優(yōu)勢,加強關(guān)鍵技術(shù)攻關(guān),促進產(chǎn)業(yè)協(xié)同聯(lián)動,切實推進我國人工智能芯片技術(shù)產(chǎn)業(yè)的發(fā)展。關(guān)鍵詞:人工智能;人工智能芯片;GPU;FPGA;ASIC1人工智能浪潮催生芯片發(fā)展良機1.1人工智能應(yīng)用爆發(fā)催生百億規(guī)模芯片新市場以圖像識別、語音識別等為代表的智能化技術(shù)水平大幅提升和應(yīng)用起步,掀起了新一輪人工智能研發(fā)和應(yīng)用熱潮,對底層芯片的計算能力需求呈現(xiàn)爆發(fā)式增長。據(jù)Tractica預(yù)估,全球人工智能芯片出貨量持續(xù)走高,市場規(guī)模將從2016年的5億美元增長至2025年的122億美元,復(fù)合年均增長率保持超過40%的高速率。與此同時,伴隨人工智能芯片技術(shù)不斷成熟和應(yīng)用落地,人工智能芯片占據(jù)人工智能總體市場規(guī)模的比例逐年遞增,據(jù)CITICS預(yù)計將從2016年的8%提高至2020年的12%?,F(xiàn)階段,人工智能應(yīng)用正處于應(yīng)用起量階段,產(chǎn)業(yè)鏈上下游企業(yè)紛紛結(jié)合自身優(yōu)勢加入芯片領(lǐng)域布局,試圖搶占市場發(fā)展先機,圍繞人工智能芯片領(lǐng)域的競賽已經(jīng)拉開序幕。1.2暴力計算型人工智能對芯片算力提出新挑戰(zhàn)本輪人工智能研究的關(guān)鍵詞是基于概率統(tǒng)計學的深度學習,采用日益復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型和更大規(guī)模數(shù)據(jù)樣本實現(xiàn)識別精度不斷突破,但同時產(chǎn)生的計算量也持續(xù)攀升,這種暴力計算模式對底層芯片的計算能力提出了更高要求并相應(yīng)產(chǎn)生更多能耗。例如,2012年的ImageNet比賽中,采用8層神經(jīng)網(wǎng)絡(luò)的AlexNet網(wǎng)絡(luò)取得16%的錯誤率,迭代一次的計算量約為1.4GFLOP(10億次浮點計算);2015年,擁有152層神經(jīng)元的ResNet網(wǎng)絡(luò)錯誤率降至3.5%,但計算量為22.6GFLOP,大約達到AlexNet的16倍。與此同時,深度學習需要處理的數(shù)據(jù)規(guī)模及其龐大,如采用卷積神經(jīng)網(wǎng)絡(luò)基于ImageNet數(shù)據(jù)集訓練模型,統(tǒng)計掃描100遍樣本即達到E級計算規(guī)模,即使提供充足的計算資源,仍需幾天甚至幾周的訓練時長。1.3深度學習算法對芯片技術(shù)創(chuàng)新提出新需求深度學習算法區(qū)別于傳統(tǒng)算法特征,既是計算密集型也是存儲密集型運算,對芯片的專用計算能力和內(nèi)存存取能效等提出新的升級需求。一方面,具備復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對卷積、矩陣乘加等線性代數(shù)類運算任務(wù)密集又頻繁,因而集成矩陣乘加等專用運算單元的計算芯片能顯著加速深度學習處理效率;另一方面,深度學習需要處理海量數(shù)據(jù)樣本,強調(diào)芯片高并行計算能力,同時大量數(shù)據(jù)搬運操作對內(nèi)存存取帶寬等要求更高,而內(nèi)存存取尤其是片外內(nèi)存訪問消耗的功耗要遠大于計算功耗,因而高能效的內(nèi)存訪存架構(gòu)設(shè)計對芯片應(yīng)用尤其是端側(cè)部署至關(guān)重要。2人工智能芯片技術(shù)路徑百花齊放2.1人工智能芯片處于多技術(shù)路徑競相發(fā)展階段深度學習處理任務(wù)應(yīng)用主要分為訓練和推理兩個階段,實現(xiàn)高精度模型提取的訓練階段需快速處理海量數(shù)據(jù),現(xiàn)階段集中在云端執(zhí)行,對芯片計算能力、通用性、擴展性有較高要求;實現(xiàn)模型最終應(yīng)用部署的推理階段既可以在云端執(zhí)行,也可在智能手機、智能攝像頭、智能汽車等終端操作,多樣化細分場景對人工智能芯片性能、功耗、延時以及成本等標準需求各異。諸多差異化的應(yīng)用階段和細分場景導致人工智能芯片處于多種技術(shù)方案競爭發(fā)展起步階段。2.2不同類型人工智能芯片各有所長現(xiàn)階段,常見的人工智能芯片類型包括GPU、FPGA、ASIC等芯片(見表1)。其中,GPU芯片集成大量計算單元和高速內(nèi)存,通用性較強且適合大規(guī)模并行計算任務(wù),能顯著縮減數(shù)據(jù)的訓練時長,但高能耗引發(fā)散熱問題以及高售價限制,使其多應(yīng)用于數(shù)據(jù)中心或自動駕駛場景。FPGA硬件配置靈活,能快速適應(yīng)算法迭代更新,且能效優(yōu)于GPU,但開發(fā)復(fù)雜度較高,開發(fā)者生態(tài)建設(shè)仍需增強。針對特定算法定制的專用ASIC芯片量產(chǎn)后性能、功耗、成本相對于FPGA具備更強優(yōu)勢,但人工智能算法仍處于快速演進階段,定制化ASIC開發(fā)周期長、面臨風險高。目前,深度學習訓練任務(wù)多集中在云端執(zhí)行,以GPU和ASIC芯片居多;推理芯片根據(jù)云端、終端場景區(qū)別,F(xiàn)PGA、ASIC和GPU芯片均有涉及。此外,CPU芯片架構(gòu)絕大部分為控制和緩存單元,更擅長復(fù)雜的邏輯控制和通用類型數(shù)據(jù)運算,并行計算效率低,在人工智能任務(wù)中多用于樣本數(shù)據(jù)預(yù)處理操作。3人工智能芯片領(lǐng)域競賽群雄逐鹿3.1云側(cè)訓練市場初步由GPU芯片取得優(yōu)勢基于大數(shù)據(jù)量、復(fù)雜算法模型的人工智能模型訓練階段多集中在云端處理,需求高并行、高吞吐量的芯片架構(gòu)?,F(xiàn)階段,英偉達憑借高性能的GPU芯片占據(jù)應(yīng)用規(guī)模優(yōu)勢,快速推出業(yè)內(nèi)高并行計算能力的TeslaGPU系列產(chǎn)品,其中V100GPU芯片集成專為人工智能運算設(shè)計的大型矩陣乘加計算核心和16G的高帶寬內(nèi)存,實現(xiàn)每秒120萬億次的峰值運算能力。AMD也加速追趕,2018年6月初發(fā)布全球首款7nm制程的RadeonInstinctVegaGPU芯片產(chǎn)品,針對云端人工智能市場研發(fā),設(shè)計引入可編程幾何流水線、混合精度計算單元等架構(gòu)技術(shù),內(nèi)置32G的高帶寬內(nèi)存,正式產(chǎn)品將于2018年下半年推出。3.2新興力量借助ASIC芯片創(chuàng)新構(gòu)筑競爭實力谷歌面向谷歌云業(yè)務(wù)需求自研人工智能ASIC系列芯片TPU,并于2017年5月正式發(fā)布第二代產(chǎn)品CloudTPU,采用了脈動陣列架構(gòu),增添了浮點計算單元和高帶寬內(nèi)存,同時具備深度訓練和推理能力,CloudTPU于2018年2月初通過谷歌云平臺正式面向客戶服務(wù),但開放數(shù)量有限且按時收費,每小時成本為6.50美元。英特爾收購人工智能芯片初創(chuàng)企業(yè)Nervana后積極整合推廣其訓練芯片技術(shù),推出面向人工智能計算密度優(yōu)化的ASIC訓練芯片,最新SpringCrest芯片產(chǎn)品將于2019年下半年向用戶開放,功耗小于210W。3.3高能效、低時延芯片成為云端推理市場角逐焦點云端推理平臺需求高能效、高吞吐量或低延時的人工智能芯片,主要包括3類:一是英偉達針對推理市場需求推出TeslaP系列GPU芯片,可提供低時延或低功耗的推理性能;二是賽靈思和英特爾主導的FPGA芯片憑借靈活架構(gòu)、高能效、低延時特性,吸引亞馬遜和微軟等云服務(wù)商進行部署。賽靈思推出基于FPGA架構(gòu)的新型多核異構(gòu)計算平臺ACAP,可針對人工智能任務(wù)需求,實現(xiàn)硬件層面低至毫秒級別的高效靈活配置。英特爾收購FPGA廠商Altera后推出了基于FPGA的專用深度學習加速卡,結(jié)合自有CPU芯片打造可編程、高能效比的推理功能;三是以谷歌為代表的自研ASIC芯片陣營,谷歌于2016年5月最先發(fā)布專為數(shù)據(jù)中心推理任務(wù)定制的ASIC芯片產(chǎn)品TPU,計算核心是矩陣乘加單元,峰值計算能力達到每秒92萬億次計算操作。3.4終端人工智能芯片市場正在起步,涉及芯片類型多樣化伴隨人工智能市場大幅擴張,實現(xiàn)應(yīng)用部署的終端推理芯片將具備更廣闊的市場前景和應(yīng)用需求,其中智能手機、安防監(jiān)控、自動駕駛等領(lǐng)域?qū)⒊蔀槭袌鍪纵啽l(fā)焦點。在智能手機領(lǐng)域,蘋果發(fā)布iPhoneX智能手機內(nèi)置A11bionic芯片,集成雙核神經(jīng)引擎,運算速度達到每秒6000億次,支持快速人臉解鎖、增強現(xiàn)實等功能。高通推出的驍龍845移動芯片基于CPU+GPU+DSP的移動異構(gòu)計算平臺,并重點提升DSP單元針對神經(jīng)網(wǎng)絡(luò)處理速度和能效至CPU的8和24倍。在安防監(jiān)控領(lǐng)域,英特爾收購Movidius芯片廠商推出高速低功耗Mybriad系列視覺芯片,最新款MyriadX芯片具備每秒超過1萬億的次運算能力。在自動駕駛領(lǐng)域,英偉達推出高能效、高可靠性的車用XaiverSoC芯片,性能達到每秒30萬億的次計算能力,功耗僅為30W,支持L3?L4級別自動駕駛。4我國人工智能芯片產(chǎn)業(yè)創(chuàng)新活躍4.1積極突破云端人工智能芯片領(lǐng)域受限于國內(nèi)在GPU和FPGA芯片領(lǐng)域基礎(chǔ)薄弱,企業(yè)多采用ASIC路線布局云端謀求戰(zhàn)略突破,參與企業(yè)包括百度、寒武紀、比特大陸等。百度面向自身業(yè)務(wù)需求開發(fā)云端人工智能芯片“昆侖”,峰值處理速度達到每秒260萬億次定點運算,可滿足訓練和推理的需求。寒武紀發(fā)布云端智能芯片MLU100,最高峰值速度可達166.4萬億次定點運算,對應(yīng)功耗110W,可支持各類深度學習和常見機器學習算法,滿足計算機視覺、語音識別、數(shù)據(jù)挖掘等計算需求;同時,寒武紀聯(lián)合聯(lián)想、中科曙光分別推出深度學習專用服務(wù)器ThinkSystemSR650和PHANERON,可面向多類云處理任務(wù)提供服務(wù)。比特大陸針對云端推理任務(wù)設(shè)計專用處理器SOPHON,采用類似谷歌的脈動陣列架構(gòu),提供每秒2萬億次的計算能力,具備60W低功耗優(yōu)勢,支持CNN、RNN、DNN等常見深度神經(jīng)網(wǎng)絡(luò)算法的推理預(yù)測。4.2重點聚焦終端細分市場芯片布局國內(nèi)企業(yè)面向智能手機、安防監(jiān)控、自動駕駛等終端重點細分領(lǐng)域加速人工智能芯片研發(fā),試圖搶占市場先機。在智能手機領(lǐng)域,華為發(fā)布麒麟970芯片集成寒武紀的深度學習IP內(nèi)核,峰值計算能力達到每秒1.93萬億次運算,重點提升智能手機的圖像識別、機器翻譯、語音降噪等功能。紫光展銳針對中端智能手機開發(fā)SC9863處理器,應(yīng)用ARMDynamlQ技術(shù)和Cortex-A55CPU內(nèi)核,支持智能場景檢測識別、智能拍照增強、人臉識別等功能。在自動駕駛領(lǐng)域,地平線機器人開發(fā)嵌入式人工智能視覺芯片一一征程處理器,具備每秒一萬次運算性能,功耗低至1.5W,支持L2級別ADAS系統(tǒng),可實時檢測和識別行人、機動車、車道線等多類目標。在安防監(jiān)控領(lǐng)域,深鑒科技發(fā)布聽濤SoC芯片,基于自研架構(gòu)提供4.1TOPS的峰值性能,功耗1.1W,可面向多類應(yīng)用場景提供人臉檢測識別、視頻結(jié)構(gòu)化處理等解決方案。此外,??狄?guī)劃開發(fā)視覺加速芯片,由智能攝像頭整機設(shè)備向底層芯片滲透,完善產(chǎn)業(yè)鏈布局。4.3我國人工智能芯片發(fā)展機遇與挑戰(zhàn)并存我國人工智能應(yīng)用市場規(guī)模龐大,數(shù)據(jù)積累形成海量規(guī)模,為國內(nèi)人工智能芯片發(fā)展提供巨大空間?,F(xiàn)階段我國企業(yè)緊跟人工智能芯片創(chuàng)新機遇,積極開展定制ASIC芯片研發(fā),并在部分領(lǐng)域取得一定進展,為人工智能產(chǎn)業(yè)持續(xù)升級夯實基礎(chǔ)。與此同時,我國集成電路產(chǎn)業(yè)基礎(chǔ)薄弱問題再次凸顯。一是國內(nèi)企業(yè)在高性能GPU和FPGA芯片領(lǐng)域研發(fā)滯后,企業(yè)多采用ASIC芯片架構(gòu)進行創(chuàng)新,影響國內(nèi)人工智能芯片全產(chǎn)品線布局;二是國內(nèi)布局人工智能芯片研發(fā)多為初創(chuàng)企業(yè),缺乏長期芯片架構(gòu)設(shè)計和軟件編譯等經(jīng)驗累積,應(yīng)用生態(tài)尚未搭建完善,市場關(guān)系仍需持續(xù)開拓;三是現(xiàn)有人工智能芯片研發(fā)人員也遠遠不能滿足需求,芯片產(chǎn)品創(chuàng)新發(fā)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年教育心理學與教育方法考核題目集
- 2026年程序員團隊技術(shù)領(lǐng)導力及項目執(zhí)行決策能力測試
- 2026年P(guān)ython數(shù)據(jù)分析與挖掘試題詳解
- 2026年地理地質(zhì)地貌分析地理信息題庫
- 2026年旅游行業(yè)導游員崗位面試與筆試題目
- 2026年國際能源管理發(fā)展趨勢研究與實踐題目
- 2026年證券投資顧問考試知識題庫
- 2026年大學英語六級模擬試題及答案解析
- 2026年北京農(nóng)村自建房監(jiān)理合同三篇
- 農(nóng)村電商直播帶貨培訓基地2026年直播帶貨商業(yè)模式創(chuàng)新可行性研究
- 國企財務(wù)審批管理辦法
- 新型農(nóng)業(yè)經(jīng)營主體法律制度完善研究
- 高中國際班數(shù)學試卷
- 北京市2019-2024年中考滿分作文131篇
- 2024-2025學年湖北省武漢市常青聯(lián)合體高二上學期期末考試語文試題(解析版)
- xx中學十五五發(fā)展規(guī)劃(2025-2030)
- 快遞保證金合同協(xié)議
- 中藥學教材課件
- 能源與動力工程測試技術(shù) 課件 第一章 緒論確定
- 鋁錠居間合同協(xié)議
- 生產(chǎn)管理部經(jīng)理競聘
評論
0/150
提交評論