版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
DeepSeek爆火--C端:Deepseek全球破圈,成為用戶規(guī)模增長最快的移動AI應用超級app增長1億用戶所用時間App上線后同樣天數(shù)DeepSeek與ChatGPT移動端全球DAU對比情況DeepSeek爆火--B端:科技巨頭積極擁抱DeepSeekDeepSeek明星產(chǎn)品:DeepSeek的LLM模型分為三個版本:基座模型V3、強化推理版R1-Zero、泛化推理版R1DeepSeek爆火的原因:一流的性能表現(xiàn)、大幅降低的算力成本、開源模式低成本實現(xiàn)高性能低成本實現(xiàn)高性能開源策略推動技術普及術門檻,促進全球開發(fā)者參與,推和FP8混合精度訓練,大幅提升模型一流的性能表現(xiàn):DeepSeek-V3性能對齊海外領軍閉源模型一流的性能表現(xiàn):DeepSeek-R1性能對標OpenAI-o1正式版?DeepSeek-R1性能比肩O技術,在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學8大幅降低的算力成本:訓練算力下降90%DeepSeek-V3和R1模型不僅性能出色,用2048塊H800GPU訓練2個月,消耗278.8萬GPU小時。Llama3-405B消耗了3080萬GPU小時,是V3的11倍。按H800GPU每小時2美金計算,V3的訓練成本僅為557.6萬美金,而同等性能的模型通常需要0.6-1億美金。R1模型在V3基礎上,通過引入大規(guī)模強化學習和多階段訓練,進一步提升了推理能力,成本API定價下降89%(V3)、96%(R1)開源大模型:打破OpenAI等閉源模型生態(tài)DeepSeekV3與R1模型實現(xiàn)了開源,采用MIT協(xié)議。這產(chǎn)生多方面影響:?對大模型發(fā)展:這提升了世界對中國AI大模型能力的認自有數(shù)據(jù)訓練,從而適合具體下游場景;此外,模型訓推成本降低,將果訓練其他模型),盡可能降低用戶使用壁壘,全球范圍出圈和更中國智能算力市場規(guī)模持續(xù)增長,算力中心從訓練側向推理側轉移2022202320242025智能算力推理訓練訓練算力頭部集中,推理算力爆發(fā)式增長頭部企業(yè)會持續(xù)進行教師模型的訓練:模型蒸餾的前提是有一個好的教師模型,字節(jié)、阿里、百度等已經(jīng)明確會持續(xù)加大投入;24年H2有些停滯的大模型訓練各模型廠商會借鑒deepseek的優(yōu)化方法如FP8精度訓練、跨節(jié)點通信等,與自身模型訓練結合,探索更高效的模型訓練方法推理算力爆發(fā)式增長:杰文斯悖論在推理側上演,開源模型和較低的推理成本,有助于應用的繁榮,助推推理25年,字節(jié)資本開支有望達到1600億元,宏提到,百度需要繼續(xù)在芯片、數(shù)據(jù)中心和云基礎設施上加大投入,目的是為?硅谷四大科技巨頭(谷歌、微軟、Meta、亞馬遜)2025年合,重點投向AI數(shù)據(jù)中心建設。模型輕量化催生端側算力的崛起DeepSeek通過知識蒸餾技術,將大模型壓縮至輕量數(shù)據(jù)安全與隱私計算剛需推動隱私計算技術發(fā)展,2024年數(shù)據(jù)治理一體機等端側算力市場擴容優(yōu)刻得、寶德、華鯤振宇、超聚變等均推AI服務器出貨量增長,2025年市場規(guī)模預從“算力堆砌”到“算效優(yōu)化”的產(chǎn)業(yè)轉型DeepSeek提出的“四兩撥千斤”的技術路徑推翻了統(tǒng)治了2023年-2024年的全球大模型產(chǎn)業(yè)的“暴力美學”邏輯,2025年再次進入算算效優(yōu)化的必要性算力堆砌的傳統(tǒng)模式算效優(yōu)化的必要性算力、數(shù)據(jù)、算法的三角創(chuàng)新體系,在動態(tài)循環(huán)中?2023年:數(shù)據(jù)創(chuàng)新為主,數(shù)據(jù)合成、成為高質量數(shù)據(jù)集建設的熱點方向算力運營商等產(chǎn)業(yè)新物種誕生AI應用AI應用DeepSeek通過PTX優(yōu)化等創(chuàng)新技術,降低了模型訓練對NV芯片的依賴,推動國產(chǎn)算力的應用落地,對國產(chǎn)GPU的底層接口適配有一定幫助(需要重新設計工具鏈,短期內(nèi)難以實現(xiàn)無縫遷移)成適配,包括華為昇騰、沐曦、天數(shù)智芯、摩爾線程、海光信息、鯤云科技、希姆計算、算能、清微智能和芯動力等?英偉達?英偉達H800芯片互聯(lián)帶寬相比H100被閹割,為彌補這一缺陷,DeepSeek借助PTX手動優(yōu)化跨芯片通信,保障數(shù)據(jù)傳輸效率。?PTX是CUDA編譯的中間代碼,處于高級編程語言(如CUDAC/C++)和底層機器碼(SASS)之間,起到在CUDA和最終機器碼之間的橋梁作用。?借助PTX,開發(fā)者能夠直接對GPU的寄存器分配、線程調度等硬件級操作進行控制,實現(xiàn)細粒度的性能優(yōu)化。在多GPU協(xié)同訓練場景中,可通過PTX手動調整跨芯片通信效率,提升整體訓練效能。私有化部署及端側小模型大量涌現(xiàn),為國產(chǎn)芯片在實際場景的應用及試錯提供了大量機會,為國產(chǎn)芯片的設計、性能提升等提供空間 芯片智算中心大模型AI應用 DeepSeek采用FP8混合精度訓練取得較好效果,國內(nèi)芯片企業(yè)亟待增強對原生FP8支持出來效率最高的計算方式。如果不是原生支持FP8,而是需要通過度的轉譯,至少損失30%性能和20%的智商采用FP8數(shù)據(jù)格式的整體混合精度框架?在DeepSeek的訓練過程中,絕大多數(shù)核心計算核(即通用矩陣乘法GE。這些GEMM操作接受FP8張量作為輸入,并輸出BF16或FP32格式的結果。如下圖所示,與線性算?對以下模塊維持原有精度(如BF16或FP32嵌入模塊(embeddinghead)、混合專家門控模塊(MoEgatingmodul注意力算子(attentionoperators)。(盡管FP8格式具有計算效率優(yōu)勢,但由于部分算子對低精國內(nèi)芯片對三種計算精度的支持情況企業(yè)200多家AI應用AI應用A類的原創(chuàng)教師大模型,A100/A800A100/A800、 芯片智算中心大模型AI應用推理類智算中心爆發(fā)增長,超大規(guī)模智算中心建設加快A類建設速度不減:頭部科技大廠仍計劃大量投資;超前建設的需要;下一輪AI技術的涌現(xiàn)(如多模態(tài)等)仍需要十倍左右的算力支美博弈(美國“星際之門”、歐洲“InvestAI計劃”等)結構性過剩,建設減緩:規(guī)模小、位置偏僻、型號舊&性價比低、國產(chǎn)算力等類型的智算中心閑置狀況新建要看是不是有強主體包銷,如果有強主題的3-5年包爆發(fā)式增長:推理算力需求大幅增加,端側、邊緣側分布式算力部署快速增長,私有化部署1~10臺GPU服務器的小規(guī)模集群需求在內(nèi)算力包銷合同主題分強、弱兩類,市場上更多的?強主體:各個參與方資質和信譽主題都很強。央國企、A股上市公司承建、金融機構墊資、互聯(lián)網(wǎng)大廠包銷,這種風險非常高,H系列租金每個月6~8w/臺。這類的算力中心風險非常大,需要AI應用AI應用中國大模型主要有兩類玩家eAliAI創(chuàng)業(yè)公司 芯片智算中心大模型AI應用 Deepseek發(fā)布后科技大廠:擁抱DeepSeek,同時跟進類似的自研產(chǎn)品及模型路線規(guī)模的調整及模型路線規(guī)模的調整專家模型),它使用了與DeepSeek-R1類線?百度宣布文心一言4月1日起開源免費,并計劃推出文/知識引擎、國民應用微信、AI智能工作臺ima、主力AI應用元寶全方位擁抱DeepSeek,紛紛宣布接入R1模型/合作,基于昇騰云服務推出DeepSeek-R1/V3推Deepseek發(fā)布后AI創(chuàng)業(yè)企業(yè):從參數(shù)競爭到進入理性期AI六小虎的策略變化發(fā)布新語言大模型Step-2-mini和Step-2文學大師版/舉辦首屆“StepUp生態(tài)開放日”創(chuàng)立發(fā)起人唐杰出席第三屆人工智能行動峰AgenticGLM登陸三星最新款GalaxyS/升級發(fā)布T2A-01系列語音模型,并上線海螺語 芯片智算中心大模型AI應用大模型領域迎來“安卓時刻”,大量AI應用將爆發(fā)式出現(xiàn)回顧安卓與iOS應用的發(fā)展,安卓系統(tǒng)發(fā)布一年后,大量的安卓應用開始出現(xiàn)。現(xiàn)在的deepse?GitHub的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蔬菜扶貧協(xié)議書
- 襪業(yè)銷售協(xié)議書
- 認養(yǎng)家禽協(xié)議書
- 認購點位協(xié)議書
- 設備劃轉協(xié)議書
- 設計托管協(xié)議書
- 設計終止協(xié)議書
- 請人護理協(xié)議書
- 工程分期合同范本
- 山嶺承包合同范本
- 2024年青海省中考生物地理合卷試題(含答案解析)
- 大學美育-美育賞湖南智慧樹知到期末考試答案章節(jié)答案2024年湖南高速鐵路職業(yè)技術學院
- JT-T-915-2014機動車駕駛員安全駕駛技能培訓要求
- JJG 393-2018便攜式X、γ輻射周圍劑量當量(率)儀和監(jiān)測儀
- 黃金期貨基礎知識培訓資料
- FANUC數(shù)控系統(tǒng)連接與調試實訓 課件全套 1.0i –F系統(tǒng)規(guī)格 -10.機床動作設計與調試
- 宇電溫控器ai 500 501用戶手冊s 6中文說明書
- 成立易制爆危險化學品治安保衛(wèi)機構
- 軌道交通PIS系統(tǒng)介紹
- 二次結構鋼筋工程施工方案
- 地產(chǎn)設計總結(優(yōu)選14篇)
評論
0/150
提交評論