信息技術(shù)-計(jì)算機(jī)行業(yè):如何理解AI算力的指標(biāo)參數(shù)和不同精度適用的場景_第1頁
信息技術(shù)-計(jì)算機(jī)行業(yè):如何理解AI算力的指標(biāo)參數(shù)和不同精度適用的場景_第2頁
信息技術(shù)-計(jì)算機(jī)行業(yè):如何理解AI算力的指標(biāo)參數(shù)和不同精度適用的場景_第3頁
信息技術(shù)-計(jì)算機(jī)行業(yè):如何理解AI算力的指標(biāo)參數(shù)和不同精度適用的場景_第4頁
信息技術(shù)-計(jì)算機(jī)行業(yè):如何理解AI算力的指標(biāo)參數(shù)和不同精度適用的場景_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

發(fā)現(xiàn)價值免責(zé)聲明發(fā)現(xiàn)價值行業(yè)評級告日期相對市場表現(xiàn)3-06-29行業(yè)評級告日期相對市場表現(xiàn)3-06-29計(jì)計(jì)算機(jī)行業(yè)核心觀點(diǎn):對于FP64數(shù)據(jù)類型計(jì)算的支持是其重要特點(diǎn)。這一特點(diǎn)導(dǎo)致英偉達(dá)的AI芯片在應(yīng)用于對于計(jì)算精度要求較高的科學(xué)研究領(lǐng)域具有較強(qiáng)優(yōu)得英偉達(dá)拉開和其競品明顯差距。I示。矩陣運(yùn)算性能提升難度較大,國產(chǎn)AI基礎(chǔ)算力的差距縮小。40%28%4%08/220/222/2202/2308/220/222/2202/2304/23-8%-21% 計(jì)算機(jī)滬深300SFCCENoBNX04003675iuxuefenggfcomcn8286912houyuangfcomcn請注意,周源并非香港證券及期貨事務(wù)監(jiān)察委員會的注冊持牌人,不可在香港從事受監(jiān)管活動。智能網(wǎng)聯(lián)駕駛月報(2023年反彈產(chǎn)業(yè)有望迎來發(fā)展計(jì)算機(jī)行業(yè):風(fēng)險偏好波動下繼續(xù)推薦應(yīng)用軟件龍頭和拐點(diǎn)位置的智能汽車與醫(yī)療IT23-06-2623-06-2523-06-25計(jì)算機(jī)發(fā)現(xiàn)價值發(fā)現(xiàn)價值2/8司估值和財(cái)務(wù)分析表稱碼報告日期級合理價值(元/股)2023E2024E2023E2024E2023E2024E2023E2024E寒武紀(jì)-U6.SH95/05/0275-1.70-1.00-----15.90-10.40.SZ/06/14.461.2325.578.009.201.SH/04/260.9362.65.SZ/04/1225.3619.890計(jì)算機(jī)發(fā)現(xiàn)價值發(fā)現(xiàn)價值3/8一、不同精度的AI計(jì)算適用的場景數(shù)據(jù)類型是不同字節(jié)在精度和范圍的排列組合。數(shù)據(jù)存儲在計(jì)算機(jī)中的物理形態(tài)是由0和1組成的二進(jìn)制代碼。通過給這一組二進(jìn)制代碼分配不同的存儲空間并進(jìn)行符(1)整型:整型數(shù)據(jù)是在符號位(1個bit,表示正負(fù))和數(shù)據(jù)位(若干bit,表示范(2)浮點(diǎn)型:浮點(diǎn)型數(shù)據(jù)是在符號位(1個bit,表示正負(fù))、幅度位(若干bit,表tFPTFFPBF>FP8??椥问酱a組織形式率、高吞吐的搭建輸入數(shù)據(jù)與輸出結(jié)果之間的關(guān)系(構(gòu)建模型),并確定決定該關(guān)系tsBiasFPPINT推理功能的同時確保通用性。計(jì)算機(jī)發(fā)現(xiàn)價值發(fā)現(xiàn)價值4/8(3)高性能計(jì)算:HPC(高性能計(jì)算)主要應(yīng)用于材料科學(xué)、氣象仿真、生物醫(yī)藥等和科學(xué)研究領(lǐng)域較為相關(guān)的領(lǐng)域,其對于輸出結(jié)果的精度要求較高,因此大量科表1:AI計(jì)算中不同精度數(shù)據(jù)類型的應(yīng)用場景AI訓(xùn)練AI理應(yīng)用需求較高精度對這些數(shù)據(jù)進(jìn)行集中計(jì)算計(jì)算升性能,縮短訓(xùn)練所需時間要求嚴(yán)謹(jǐn),對精度要求較高,如理解AIAI理應(yīng)用的可靠部署,在低延遲下絡(luò)通過模擬大氣數(shù)據(jù)來更好地預(yù)測極為之做好準(zhǔn)備NT是其重要特點(diǎn)。這一特點(diǎn)導(dǎo)致英偉達(dá)的AI芯片在應(yīng)用于對于計(jì)算精度要求較高的科FP化落地的場景中應(yīng)用空FP這一特性并不會使得英偉達(dá)拉開和其競品明顯差距。表2:英偉達(dá)與寒武紀(jì)芯片架構(gòu)處理數(shù)據(jù)類型對比公司是否否否否是是是否Ampere是否是是是是是是否是否是是是否否是否是是否否否否是是是是是否否是否是是是英偉達(dá)的AI芯片引入TensorCore,優(yōu)化矩陣計(jì)算的能力提升算力水平。英偉達(dá)在Volta架構(gòu)AI芯片產(chǎn)品的時候首次引入了TensorCore,其將單一維度的英偉達(dá)產(chǎn)品的過程中,矩陣運(yùn)算能力的優(yōu)化升級是AI算力提升的關(guān)鍵。計(jì)算機(jī)發(fā)現(xiàn)價值發(fā)現(xiàn)價值5/8表3:英偉達(dá)和寒武紀(jì)AI加速卡性能對比A00PCIeA00PCIeAmpereAmpere26TFLOPS9.7TFLOPSFLOPS - orCoreLOPS-LOPSLOPSTFLOPSTFTFLOPS156TFLOPS----LOPSnsorCoreTFLOPS312TFLOPSFLOPS----LOPSorCoreTFLOPS312TFLOPSFLOPS-rCore-TFLOPS---------TOPSCoreOPSOPSOPS-GBGBGB48GBTBS4GB/S600GB/SNVLink600GB/SNVLink00GB/SNVLinkGB/SMLU-Link計(jì)算機(jī)發(fā)現(xiàn)價值發(fā)現(xiàn)價值6/8二、風(fēng)險提示(一)矩陣運(yùn)算性能提升難度較大,國產(chǎn)AI基礎(chǔ)算力的差距縮小仍需要(二)國產(chǎn)AI芯片存在供應(yīng)鏈不穩(wěn)定的風(fēng)險(三)美方出口管制政策變化的不確定性計(jì)算機(jī)發(fā)現(xiàn)價值發(fā)現(xiàn)價值/8研究小組研究工作,2014年加入廣發(fā)證券發(fā)展研究中。雷棠棣:資深分析師,哈爾濱工業(yè)大學(xué)軟件工程碩士,悉尼大學(xué)商科碩士(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論