版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
欲了解更多信息,請訪問www.DeepL.co探索融合型HPCCAI工作負載在Groq人工智能推理加速器托比亞斯-貝克1月Groq專有什么是聚合計算?.適用于人工智能和高性能計算組合工作負載的基礎(chǔ)設(shè)施.結(jié)合人工智能和高性能計算算法的混合應(yīng)用?Groq,Inc.Groq專利2GroqGroq簡化計算典型GPU圖形處理器復(fù)雜編程困難響應(yīng)能力較低非確定性執(zhí)行成本較高GroqChip?1首個LPU?加速器簡化?Groq,Inc.Groq專利3GroqChip?1概覽可擴展的計算架構(gòu)SRAM內(nèi)存大規(guī)模并發(fā)80TB/秒的BW230MB容量對跨步不敏感GroqTruePoint?矩陣4x發(fā)動機750TOP/sint8 188TFLOP/sfp16320x320融合點積可編程矢量單元5,120?Groq,Inc.Groq專利4個高性能矢量ALU聯(lián)網(wǎng)480GB/s帶寬可擴展的網(wǎng)絡(luò)擴展能力多種拓撲結(jié)構(gòu)數(shù)據(jù)交換機移位、平移、翻轉(zhuǎn),改進數(shù)據(jù)移動和數(shù)據(jù)重塑指令控制多條指令隊列實現(xiàn)指令并行?Groq,Inc.Groq專利5可視化數(shù)據(jù)協(xié)調(diào)交給Groq?編譯器?Groq,Inc.Groq專利6規(guī)?;腉roq工作負載集群就緒節(jié)點擴展至卡擴展到節(jié)8xRealScale外機架TSP架構(gòu)提供近點部端口GroqRack:8個乎線性的擴展性能GroqNode包含8張卡帶4xGroqCard的2U服務(wù)器計算節(jié)點+1個冗余節(jié)點?Groq,Inc.Groq專利7GroqChip?1GroqCard?戴爾GroqNode?GroqRack?R750XA?Groq,Inc.Groq專利8融合計算:CFD結(jié)構(gòu)網(wǎng)格法的傳統(tǒng)求解器和基于人工智能的求解器求解器摘要.二維結(jié)構(gòu)網(wǎng)格.不可壓縮的氣流.顯式時間積分.JAX-CFD中的框架基于不可壓縮納維-斯托克斯方程的純DNS擴散壓力對流擴散壓力D.Kochkov等人"機器學(xué)習(xí)加速計算流體動力學(xué)"PNAS2021?Groq,Inc.Groq專利9人工智能可取代或增強直接數(shù)值模擬(DNS)?Groq,Inc.Groq專利101111具有人工智能增強功能的混合CFD比較傳統(tǒng)方法和基于人工智能的方法四種方法:.傳統(tǒng)DNS:基于壓力投影的標(biāo)準(zhǔn)求解器(高分辨率和低分辨率).學(xué)習(xí)校正:基于CNN修正的小網(wǎng)格DNS.純ML:基于LSTM的編碼器-處理-解碼器.融合型ML-HPC兼具高吞吐量和高精確度潛在應(yīng)用?Groq,?Groq,Inc.航空航天汽車工業(yè)能源醫(yī)療?Groq,Inc.Groq專利12圖神經(jīng)網(wǎng)絡(luò)(GNNs).通用深度神經(jīng)網(wǎng)絡(luò)(DNN)架構(gòu)對非歐幾里得數(shù)據(jù)的泛化.考慮用圖形表示問題:□計算化學(xué)中的分子□社交媒體推薦系統(tǒng).計算化學(xué)用例:取代基于DFT的傳統(tǒng)算法13?Groq,13?Groq,Inc.關(guān)于鐵鉑(FePt)的端到端GNN,包括運行時間在內(nèi)的端到端基準(zhǔn)測試HydraGNN使用案例:.模型可預(yù)測每種鉑鐵配置的總能量、電荷密度和磁矩(多重預(yù)測,即九頭蛇模型)。.這樣,我們就能在1000萬個分子的數(shù)據(jù)集中識別出具有所需反應(yīng)性的分子需要規(guī)模:.生產(chǎn)需要對HydraGNN進行10k次并行行走(第1批次.可在整個GroqRack上并行運行.目前正在ORNL訓(xùn)練的模型增加了每個分子的原子數(shù),Groq可以擴展到多芯片執(zhí)行?Groq,Inc.可通過Netron實現(xiàn)Onnx圖形可視化Groq專利50x18000350HydraGNNLsmsFePt模型(MLupoPasinietal2022.)用于同時預(yù)測鐵磁系統(tǒng)全局和原子特性的多任務(wù)圖神經(jīng)網(wǎng)絡(luò)?Groq,Inc.可通過Netron實現(xiàn)Onnx圖形可視化Groq專利鐵鉑數(shù)據(jù)集包含32000種鉑鐵構(gòu)型的量子化學(xué)特性的靜態(tài)數(shù)據(jù)集.鐵鉑數(shù)據(jù)集由32,000個具有體心立方(BCC)結(jié)構(gòu)的鐵鉑二元容許構(gòu)型組成。.從0%Fe-100%Pt到100%Fe-0%Pt,所有成分的構(gòu)型均可使用。.每種構(gòu)型的總能量、電荷密度和磁矩都是通過在OLCFTitan上使用LSMS-3模擬DFT進行預(yù)測的。.這是一個靜態(tài)問題,每個分子有32個固定節(jié)點和206個邊緣連接。?Groq,?Groq,Inc.Chemprop:信息傳遞GNN用于化學(xué)性質(zhì)預(yù)測的機器學(xué)習(xí)軟件包使用案例:.ChemProp是一種消息傳遞神經(jīng)網(wǎng)絡(luò),具有分子性質(zhì)預(yù)測功能,可預(yù)測各種性質(zhì)42x.通過微笑字符串輸入對藥物發(fā)現(xiàn)進行專門測試。38.5k可擴展性:.生產(chǎn)配置包括處理40億個化合物。?Groq,Inc.Groq專利.42倍的速度大幅提高了使用較少硬件的迭代速度。ChemProp模型資源庫?Groq,Inc.Groq專利合HPC合HPC工作負載提供了額外的加速。ISC2023研討會文件(23年5月)探索在圖神經(jīng)網(wǎng)絡(luò)工作負載中使用數(shù)據(jù)流架構(gòu)(Hosseinietal.)與阿貢國家實驗室和Sambanova合作。成果.2022年8月,在撰寫論文期間,GroqChip?將GNN卷積層(CGConv、GINConv等)的速度提高了37倍。.去年,Groq?編譯器的優(yōu)化使這些GNN卷積層的速度提高了50倍*。.這種提速是數(shù)據(jù)流范式和運算器微基準(zhǔn)(經(jīng)常出現(xiàn)在GNN架構(gòu)中)提速高達10倍的結(jié)果。這為非歐幾里得數(shù)據(jù)上的融?Groq,Inc.*Groq編譯器在不斷改進,自論文撰寫(2022年8月)以來,速度提高了35%(2023年4月)Groq專利37x34x圖1(2022年8月在PyTorchGeometric(PyG)的CGConv和GINCov圖形卷積層上,GroqChip與GPUA100的性能比較?Groq,Inc.*Groq編譯器在不斷改進,自論文撰寫(2022年8月)以來,速度提高了35%(2023年4月)Groq專利性能193kIPS@0.6ms性能193kIPS@0.6ms批次128Groq架構(gòu)以超低延遲提供確定性ML,其5-20倍的性能可滿足1毫秒響應(yīng)窗口的要求1。聚變反應(yīng)堆控制智能電網(wǎng)"不可能的任務(wù)"托卡馬克聚變反應(yīng)堆模擬中的等離子體不穩(wěn)定性預(yù)測在1毫秒硬性要求內(nèi)最大化LSTM模型的性能Groq優(yōu)勢確定性人工智能處理器提供超低延遲實現(xiàn)高度可靠69kIPS@0.14ms英偉達47kIPS@5.5ms英偉達47kIPS@5.5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年智能化辦公系統(tǒng)部署與維護手冊
- 管理計劃培訓(xùn)制度
- 2025年醫(yī)療護理服務(wù)操作流程與患者關(guān)懷手冊
- 高速學(xué)習(xí)培訓(xùn)制度
- 車輛維修人員培訓(xùn)制度
- 2026年產(chǎn)品主管面試技巧及答案
- 鄉(xiāng)鎮(zhèn)定期培訓(xùn)制度
- 化妝品工廠培訓(xùn)制度
- 建筑學(xué)習(xí)培訓(xùn)制度
- 風(fēng)險預(yù)控管理培訓(xùn)制度
- 電石生產(chǎn)安全技術(shù)規(guī)程
- 2025-2026學(xué)年統(tǒng)編版(2024)七年級道德與法治下冊全冊教案(教學(xué)設(shè)計)
- 智能制造車間SCADA系統(tǒng)設(shè)計方案
- 自考勞動法2025年10月真題及答案
- hsk標(biāo)準(zhǔn)教程教學(xué)課件
- CD20單抗治療免疫性疾病
- 三角債三方協(xié)議合同范本
- 醫(yī)保年度工作匯報
- 創(chuàng)傷性腎靜脈破裂的護理課件
- 2025年廣東省中考道德與法治真題(原卷版)
- 2025年重慶市中考地理試卷真題(含標(biāo)準(zhǔn)答案及解析)
評論
0/150
提交評論