2025AICon全球人工智能開發(fā)與應用大會-上海站:開源大模型創(chuàng)新背后的RISC-V 算力架構革新_第1頁
2025AICon全球人工智能開發(fā)與應用大會-上海站:開源大模型創(chuàng)新背后的RISC-V 算力架構革新_第2頁
2025AICon全球人工智能開發(fā)與應用大會-上海站:開源大模型創(chuàng)新背后的RISC-V 算力架構革新_第3頁
2025AICon全球人工智能開發(fā)與應用大會-上海站:開源大模型創(chuàng)新背后的RISC-V 算力架構革新_第4頁
2025AICon全球人工智能開發(fā)與應用大會-上海站:開源大模型創(chuàng)新背后的RISC-V 算力架構革新_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

開源大模型創(chuàng)新背后的RISC-V算力架構革新演講人:蘇中知合計算

/首席AI科學家Allmen

are

mortal.Socrates

isa

man.Therefore,Socrates

ismortal所有人都會死。蘇格拉底是人。因此,蘇格拉底會死。亞里士多德《Prior

Analytics》拉丁文版約1290年,佛羅倫薩勞倫齊亞納醫(yī)學院圖書館

人工智能發(fā)展:從符號主義到鏈接主義符號主義的鼻祖:亞里士多德與他的三段論亞里士多德

?ριστοτ?λη?Aristotél

(古希臘

公元前384–公元前322年)/wiki/AristotleLogicTheorist:第一個人工智能程序(第一個特別設計用于模仿人類解決問題能力的程序)由赫伯特·西蒙(HerbertSimon),艾倫·紐厄爾(AllenNewell)和約翰·肖(JohnShaw)于1955年至1956年創(chuàng)建,在數(shù)學定理證明方面取得突破。/wiki/History_of_artificial_intelligence/p/legacy-japans-fifth-generation-computer-systems-fgcs-project-ai

/details/fifthgeneration00edwa/mode/2up?view=theater符號主義的發(fā)展:從第一個AI程序LogicTheorist,專家系統(tǒng)的成功到日本第五代計算機計劃第五代電腦是日本通商產(chǎn)業(yè)省于1982年的一個大型研發(fā)計劃,其目的為開發(fā)一部劃時代的電腦,利用大量平行計算,使它擁有超級電腦的運算效能和可用的人工智能能力。

符號主義的發(fā)展

鏈接主義的起步,來自于人類對于腦的認識1899年繪制的鴿子小腦普金耶細

胞(A)和顆粒細胞(B)

圖/wiki/Santiago_Ram%C3%B3n_y_Cajal桑地亞哥·拉蒙·伊·卡哈爾(1852-1934、西班牙)Ramó

n

y

Cajal

in

18991906年諾貝爾生理學/醫(yī)學獎《comparativestudyofthesensoryareas

of

the

humancortex》,

1900智能的來源:結構與規(guī)模/wiki/Alan_Turing圖靈發(fā)明的“炸彈

”,它是一種機電計算裝置,二戰(zhàn)期間成功破譯了德國恩尼格瑪機加密的信息

人工智能的評測標準:

圖靈實驗艾倫

圖靈

Alan

Mathison

Turing(英國

1912–1954)/wiki/Bombe#/media/File:Wartime_picture_of_a_Bletchley_Park_Bombe.jpg人工智能的發(fā)展:規(guī)模與結構人類視覺皮層的縱向切面(橫放)桑地亞哥·拉蒙·伊·卡哈爾,

1900Geoffrey

Hinton深度學習技術的引爆點:

圖像識別的AlexNet

架構。它由

8層組成:5個卷積層和3個全連接層Yann

LeCun

人工神經(jīng)元網(wǎng)絡:從感知機到深度學習https://viso.ai/deep-learning/alexnet/

/about/2018-turingAlexNet=6000萬個參數(shù)+65萬個神經(jīng)元+卷積神經(jīng)網(wǎng)絡的高性能C++/CUDA實現(xiàn)+2*GTX580GPU該模型由Alex

Krizhevsky與多倫多大學的IlyaSutskever和博士顧問Geoffrey

Hinton于2012年

合作開發(fā)@UniversityofTorontoCPU計算電路控制電路計算電路緩存電路GPU AlexNet:AI算力架構從CPU轉向GPU的起點?

計算密度相對低?

復雜的控制電路,應對復雜的運算?

龐大的緩存電路,緩存數(shù)據(jù)?

計算密度高?

能做的運算的計算復雜度低?內(nèi)存訪問的帶寬高計算電路計算電路

人工智能的發(fā)展:從感知到認知大語言模型的發(fā)展帶來對于算力無盡的需求

基于Transformer架構的大模型

Wo

,

OpenA模IGPT1O

A,I

3

A2

7戰(zhàn)La“百模大模型LGPT4了出開發(fā)布國etpe中MO???模PT億數(shù)規(guī)出G50參推模p型推出上下文語義學習rd2Vec訓練方法與詞向量的推出神經(jīng)網(wǎng)絡語言模型階段三(2003-至今)基于神經(jīng)網(wǎng)絡(鏈接主義)階段一(1960-至今)基于語法與規(guī)則(符號主義)階段二(1970-至今)基于概率與統(tǒng)計196019702003201020132017201820192020202220231.OpenAI提出GPT-2模型2.

谷歌提出BERT模型3.

谷歌提出T5模型OpenAI推出ChatGPTTransformer架構提出,成為大模型的基礎結構DeepSeek

R

1

正式發(fā)布RNN循環(huán)神經(jīng)網(wǎng)路用于NLP2025

當前計算架構無法滿足未來的需求從大語言模型進一步發(fā)展到多模態(tài),AI的“讀萬卷書

”和“行萬里路

”?人工智能的發(fā)展,完全顛覆了算力實際需求增長速度,計算架構重構成為唯一出路技術趨勢:面向領域的架構(DSA)將支撐計算機體系結構黃

金十年

RISC架構先驅、圖靈獎獲得者John

Hennessy和David

Patterson教

授預測,隨著摩爾定律的放緩,計算機體系結構方面形成突破變得尤

其重要,未來十年是DSA架構的黃金十年;

新突破方向有:面向領域軟硬件協(xié)同設計,增強的安全技術,開源的

指令架構和敏捷開發(fā)

正式提出了RISC-V是新架構創(chuàng)新的底座

未來十年是計算架構創(chuàng)新的黃金10年算力瓶頸、存力瓶頸、互聯(lián)瓶頸亟待突破現(xiàn)代計算機之父

約翰·馮·諾伊曼AI時代(2020年代-)?

新架構的演進能力、定制化能力要強?以RISC-V為代表的開源精簡指令集成為CPU架構創(chuàng)新主要力量?開源、開放的特性,為基于RISC-V架構的產(chǎn)品帶來以下優(yōu)勢:硬件架構

可擴展的模塊化指令集體系

針對AI不斷完善的RISC-VVector/Matrix/Tensor擴展

開源、自主可控的指令集軟件生態(tài)

開源軟件體系

日趨成熟的基礎生態(tài)

快速覆蓋的應用生態(tài)應用落地

靈活度更高的商業(yè)模式

易于根據(jù)實際需求平衡計算、內(nèi)存和互聯(lián)能力 RISC-V:最適合AI時代高性能CPU打造的架構開放技術底座加上可擴展的能力是實現(xiàn)AI時代最佳算力移動時代(2000年代

–2020年代)?

功耗要低?

ARM架構成為主流?

ARM架構采用授權

模式,但由單獨公

司掌握,定制化程

度低PC時代(1980年代

–2000年代)?

通用計算能力要強?

以X86架構成為主流

?

X86架構完全閉源,架構不可定制?經(jīng)過多年發(fā)展,X86架構與ARM架構在PC、移動場景各自擁有豐富的軟件生態(tài)?

閉源模式的中心化驅動,對AI的支持需要代際間的大

版本更新?

CPU

IP根技術依存于少數(shù)企業(yè),缺乏自主權?傳統(tǒng)架構對于異構可擴展性的支持仍然有待加強

Scale

Up&ScaleOut潛力巨大RISC-V架構創(chuàng)新嘗試?tens

torrentAI+CPUVVENT

ANAAI

(PIM)O

MetaCPU+AIAI

全球都在推動RISC-V架構在AI方面的演進打開開源硬件之門,以無限潛力獲得更多成功可能RISC-V創(chuàng)造了開源硬件的無限潛力?

從通用計算到AI計算、

圖形計算、隱私計算、科學計算等各種計算場景,RISC-V以其開源特性帶來的創(chuàng)新顆粒度,擁有更多的成功可能X86架構:3600+條指令ARM架構:1000+條指令RISC-V架構:47條基礎指令硬件邏輯設計相對簡潔能效比高且功耗小RISC-V更適配AI高性能計算場景無需購買CPU

IP授權每代新產(chǎn)品無需重新購買支持可拓展指令支持模塊化指令子集之esperanto.

aiAI歷史包袱小成本更低靈活性好功耗小CPU

IPCPUSiFive

U74 SiFive

U54

蜂鳥E200

玄鐵C902 RISC-V處理器性能不斷提升SPECint2006評分每兩年提升2/GHzAMD

Zen4AMD

Zen3Intel

Ice

LakeSiFive

P670SpecInt2006/GHz20+1816141210864202016201720182019202020212022202320242025SiFive

P870VentanaVeyronV22025

RISC-V標桿產(chǎn)品賽昉

天樞SiFive

P550香山雁棲湖香山

昆明湖

玄鐵930

IntelSapphire

RapidsO

Apple

M3玄鐵C910兩種Matrix架構特點對比Attached

MatrixIntegrated

Matrix算力與Vector解耦,Matrix算力可靈活配置,可方便實現(xiàn)大算力受限于Vector算力,Matrix/Vector算力配比相對固定拓撲支持靈活拓撲結構,包括多核共享Matrix算力僅支持單核獨享硬件實現(xiàn)與Vector松耦合,頻率支持異步,時序功耗更加友好與vector緊耦合,與CPU同頻,大算力下頻率功耗物理實現(xiàn)不易收斂前端帶寬占用指令力度大,對前端取指壓力小指令力度較小,前端取指帶寬占用大資源需要額外Matrix寄存器資源,執(zhí)行單元可以設計更加高效無需專用Matrix寄存器資源,同算力下執(zhí)行單元較attached架構更大軟件編程需增加額外Matrix相關context維護復用vector資源

立足中國走向世界:AI國際標準建設競爭激烈Scalar:1element---

1operationVector:Nelements---

NoperationMatrix:N2

elements---N3

operationVector

Registers架構1:與vector

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論