DeepSeek華為云AI解決方案主打膠片1mb_第1頁(yè)
DeepSeek華為云AI解決方案主打膠片1mb_第2頁(yè)
DeepSeek華為云AI解決方案主打膠片1mb_第3頁(yè)
DeepSeek華為云AI解決方案主打膠片1mb_第4頁(yè)
DeepSeek華為云AI解決方案主打膠片1mb_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

DeepSeek華為云AI解決方案主打膠片Security

Level:目錄DeepSeek介紹和洞察DeepSeek華為云部署方案DeepSeek

應(yīng)用場(chǎng)景HuaweiProprietary-Restricted

Distribution3DeepSeek歷程:23年5月成立持續(xù)走開源道路,24年底發(fā)布AI核彈級(jí)產(chǎn)品震驚全球DeepSeek下載量霸占165多個(gè)國(guó)家榜首1月底,DeepSeek

在蘋果應(yīng)用商店中霸占了157

個(gè)國(guó)家

/地區(qū)的第一名位置,其中包括美國(guó)這某省市場(chǎng)。1月底,DeepSeek遭受黑客攻擊,美國(guó)科技股蒸發(fā)萬億2

1

日:DeepSeek

的人工智能助手在

140某省市場(chǎng)下載次數(shù)最多的某著名企業(yè)應(yīng)用程序排行榜上名列前茅。由對(duì)沖基金幻方量化實(shí)際控制人成立DeepSeek成立2023年5月華為云開始與DeepSeek合作,并在12月業(yè)務(wù)上量華為云合作2023年8月High-Flyer幻方量化對(duì)沖基金、量化基金和人工智能公司,成立于2015年。發(fā)布首個(gè)模型DeepSeek

coder,免費(fèi)供商業(yè)使用且完全開源DeepSeekcoder發(fā)布11.211.29推出DeepSeek

LLM,參數(shù)規(guī)模達(dá)670億,同時(shí)發(fā)布聊天版本DeepSeek

Chat。LLM發(fā)布聊天版本2024年5月價(jià)格低于同行,在滑鐵盧大學(xué)老虎實(shí)驗(yàn)室的LLM排名中位列第七DeepSeek

V2發(fā)布2024年11月宣稱在邏輯推理、數(shù)學(xué)推理和實(shí)時(shí)問題解決等任務(wù)上超越OpenAIO1,但《華爾街日?qǐng)?bào)》測(cè)試發(fā)現(xiàn)OpenAI

O1在部分問題上更快。DeepSeekR1-Lite-Preview發(fā)布12.26DeepSeek-V3發(fā)布671B億參數(shù),僅55天訓(xùn)練,十分之一的成本,(558萬美元),超越Llama3.1和Qwen

2.5,與GPT

-

4O相當(dāng)。2025.1.20比肩OpenAI

o1,支持模型蒸餾,國(guó)產(chǎn)AI迎來里程碑時(shí)刻DeepSeek

R1發(fā)布某著名企業(yè)、英偉達(dá)、亞部接入DeepSeek華為云、騰訊云、百度智能云、阿里云也先后接入DeepSeek相關(guān)大模型全球增長(zhǎng)最快應(yīng)用,增長(zhǎng)勢(shì)頭超越ChatGPT截止2.5號(hào),上線不到一個(gè)月DeepSeek日活躍用戶數(shù)已突破2000

萬,達(dá)到

2215

萬,全球下載量接近

4000

萬;DeepSeek的訪問量達(dá)到了創(chuàng)紀(jì)錄的

4900

萬次,比前一了

614%DeepSeek時(shí)刻,云巨頭集中接入HuaweiProprietary-Restricted

Distribution4DeepSeek大模型解讀:通過系統(tǒng)優(yōu)化實(shí)現(xiàn)極致性能,完全開源+免費(fèi)商用,挑戰(zhàn)A國(guó)AI霸權(quán)低成本完美對(duì)標(biāo)OpenAI

O1,突破精確語義理解及復(fù)雜推理任務(wù)數(shù)學(xué)+編程領(lǐng)域大幅領(lǐng)先,DeepSeek-V3訓(xùn)練成本不足Meta/OpenAI的10%,DeepSeek-R1推理成本僅為OpenAI

o1的3%,成為開源模型SOTA。低成本繞過CUDA挖掘FP8硬件潛力,MOE和MLA技術(shù)實(shí)現(xiàn)不到10%的成本方案~150M$Llama3.1-405B訓(xùn)練成本5.57M$DeepSeek–V3訓(xùn)練成本DeepSeek-R1推理成本僅為OpenAI

o1的3%性能優(yōu)數(shù)學(xué)、科學(xué)和代碼等領(lǐng)域領(lǐng)先業(yè)界,成為業(yè)界公認(rèn)的LLM的領(lǐng)先模型來源:DeepSeek模型測(cè)試數(shù)據(jù)&互聯(lián)網(wǎng)技術(shù)創(chuàng)新硬件級(jí)、算法級(jí)、架構(gòu)級(jí)、工程級(jí)、開源生態(tài)5大技術(shù)創(chuàng)新,轟動(dòng)全球硬件級(jí)優(yōu)化算法革命架構(gòu)創(chuàng)新工程奇跡開源生態(tài)繞過CUDA進(jìn)行PTX編程計(jì)算與通信優(yōu)化,性能提升30%GRPO:群體進(jìn)化的智慧篩選器自我驗(yàn)證機(jī)制:AI的"錯(cuò)題本系統(tǒng)"混合專家模型的"智能路由器“多頭潛在注意力MLA:空間壓縮術(shù)訓(xùn)練框架加速:16到3的量化壓縮,通信降低89%推理加速:預(yù)加載,動(dòng)態(tài)批處理等模型、數(shù)據(jù)、工具鏈、部署全開源蒸餾技術(shù)使能第三方模型性能目錄DeepSeek介紹和洞察DeepSeek華為云部署方案DeepSeek

應(yīng)用場(chǎng)景華為云DeepSeek三大部署場(chǎng)景全景圖銷售場(chǎng)景場(chǎng)景一在昇騰云裸金屬服務(wù)器部署DeepSeek模型場(chǎng)景二MaaS(ModelArts

Studio)平臺(tái)DeepSeek模型場(chǎng)景三開發(fā)者基于DeepSeek應(yīng)用Demo打通典型客戶腰部重點(diǎn)客戶,以及模型服務(wù)提供商AI

ISV,AI行業(yè)場(chǎng)景應(yīng)用創(chuàng)業(yè)公司,人工智能研究院開發(fā)者、中小企業(yè)嘗鮮客戶部署模型DeepSeek-V3DeepSeek-R1DeepSeek-V3DeepSeek-R1DeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Qwen-14BDeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-1.5BDeepSeek-R1-Distill-Qwen-7BDeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-14BDeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Llama-70B業(yè)務(wù)體驗(yàn)專屬資源專屬資源/公共資源專屬資源/公共資源可銷售Offering賣昇騰云算力+專業(yè)服務(wù)ModelArtsLite/ModelArtsStandard+昇騰云遷移適配/AI平臺(tái)架構(gòu)規(guī)劃服務(wù)賣MaaS服務(wù)華為云ModelArts

StudioFlexus

X/GPU

一鍵部署Ollama-Deepseek模型銷售量綱包月/年(需開白名單)按需(需開白名單)、包月/年,每個(gè)模型可免費(fèi)體驗(yàn)200wtokens按需、包月/年典型配置昇騰云部署:DeepSeek-V3和DeepSeek-R1:32卡910B起步,根據(jù)推理并發(fā)量配置DeepSeek-R1-Distill-Qwen-32B:2卡910B起步,根據(jù)推理并發(fā)量配置DeepSeek-R1-Distill-Qwen-14B和-Distill-Llama-8B:1卡910B起步,根據(jù)推理并發(fā)量配置DeepSeek-R1-Distill-Qwen-1.5B:4u4g

Flexus

X實(shí)例DeepSeek-R1-Distill-Qwen-7B&Llama-8B:16u16g

Flexus

X實(shí)例更大尺寸模型:Nvidia

GPU實(shí)例(需開白名單)相關(guān)鏈接

studio/deployment中國(guó)站::華東二(DeepSeek-R1-Distill),西南貴陽一(DeepSeek-R1-Distill,DeepSeek-R1&V3)

ons/building-a-deepseek-lnference-system.html中國(guó)站:北京四,上海一,華南廣州國(guó)際站:土耳其,香港2.賣什么 offering通過私有部署DeepSeek-R1模型按需/包月費(fèi)用預(yù)估如下,Tokens/s為單并發(fā)場(chǎng)景1:基于ModelArts

Lite/Standard部署DeepSeek

R1&V3全尺寸模型靈活部署:提供ModelArts

Lite(裸金屬服務(wù)器)和ModelArts

Standard(Console平臺(tái))兩種方式部署。解決方案架構(gòu)1.是什么3.核心優(yōu)勢(shì) 方案核心優(yōu)勢(shì)DeepSeek模型云服務(wù)卡數(shù)包月(元/月)R1ModelArts

Lite&Standard32卡起步606480V3ModelArts

Lite&Standard32卡起步606480ElasticServerElasticCluster一、方案簡(jiǎn)介:面向腰部重點(diǎn)客戶,以及模型服務(wù)提供商等需要獨(dú)立部署DeepSeek全尺寸模型R1&V3的場(chǎng)景基于華為云ModelArts

Lite&Standard部署DeepSeek

R1&V3全尺寸模型DeepSeek

R1&V3虛擬機(jī)/裸金屬昇騰910系列AI計(jì)算超節(jié)點(diǎn)集群2.賣什么 offering通過私有部署DeepSeek-R1模型按需/包月費(fèi)用預(yù)估如下,Tokens/s為單并發(fā)場(chǎng)景2:基于ModelArts

Studio部署DeepSeek

V3&

R1&

R1-Distill模型開箱即用:提供開箱即用的MaaS

API服務(wù),客戶輕松對(duì)接業(yè)務(wù)需求。多重計(jì)費(fèi)方式:按需/包費(fèi)方式均可使用解決方案架構(gòu)1.是什么一、方案簡(jiǎn)介:面向AI

ISV,AI行業(yè)場(chǎng)景應(yīng)用創(chuàng)業(yè)公司,人工智能研究院等客戶,提供開箱即用的模型API服務(wù)基于華為云ModelArts

Lite&Standard部署DeepSeek

R1&V3全尺寸模型3.核心優(yōu)勢(shì) 方案核心優(yōu)勢(shì)DeepSeek模型云服務(wù)卡數(shù)按需(元/小時(shí))包月(元/月)R1ModelArts

Studio32卡起步1263.5606480V3ModelArts

Studio32卡起步1263.5606480R1-Distill-32BModelArts

Studio2卡起步68.7/R1-Distill-14BModelArts

Studio1卡起步34.35/R1-Distill-8BModelArts

Studio1卡起步34.35/2.賣什么 offering通過私有部署DeepSeek-R1模型按需/包月費(fèi)用預(yù)估如下,Tokens/s為單并發(fā)場(chǎng)景3:基于云服務(wù)器私有化部署DeepSeek-Distill模型低成本:提供高性價(jià)比的云服務(wù)器,用戶可以根據(jù)實(shí)際需求自定義不同規(guī)格的云服務(wù)器。一鍵部署:一鍵輕松部署,即可完成云服務(wù)器及公網(wǎng)IP等資源的快速下發(fā)和DeepSeek-R1蒸餾版模型的搭建。解決方案架構(gòu)1.是什么一、方案簡(jiǎn)介:面向開發(fā)者、企業(yè)等需要獨(dú)立部署DeepSeek推理系統(tǒng)的場(chǎng)景基于華為云Flexus云服務(wù)器X實(shí)例(彈性云服務(wù)器ECS)上快速搭建DeepSeek-R1:1.5B和7B輕量級(jí)推理系統(tǒng)基于華為云GPU服務(wù)器上快速搭建DeepSeek-R1:7B和8B、14B等推理系統(tǒng)3.核心優(yōu)勢(shì) 方案核心優(yōu)勢(shì)DeepSeek-R1模型方案云服務(wù)系統(tǒng)盤GB數(shù)量包月(元/月)按需(元/小時(shí))Tokens/s1.5B方案1X實(shí)例

x1.4u.4g401271.300.38137B、8B方案1X實(shí)例

x1.16u.16g16761.388811方案2GPU-G5R16U32GB顯卡

1*16G13905.813.3260方案3GPU-pi516U64GB

顯卡1*24G`140188.24314B方案1GPU-G5R

16U32GB

顯卡

1*16G10013,947.8013.37733方案2GPU-pi5

16U64GB

顯卡1

*

24G13,9458.172432B方案1GPU-pi5

16U64GB

顯卡1

*

24G10013,9458.171270B方案1GPU-pi5

32U128GB

顯卡2

*

24G20017,89016.34510目錄DeepSeek介紹和洞察DeepSeek華為云部署方案DeepSeek

應(yīng)用場(chǎng)景11基于DeepSeek

搭建應(yīng)用場(chǎng)景解決方案語音交互服務(wù)SIS文字交互數(shù)字人服務(wù)用戶本地知識(shí)庫(kù)MaaS

API(適配Open

AI

API)昇騰服務(wù)器集群RAG用戶問題互聯(lián)網(wǎng)ModelArts

Studio(MaaS)本地知識(shí)庫(kù)檢索:內(nèi)置強(qiáng)大的知識(shí)庫(kù)能力,導(dǎo)入您的知識(shí)文檔即可實(shí)現(xiàn)基于私域知識(shí)的對(duì)話助手聯(lián)網(wǎng)檢索:內(nèi)置聯(lián)網(wǎng)插件,可實(shí)現(xiàn)大模型聯(lián)網(wǎng)搜索的能力檢索增強(qiáng)生成RAG,提高回答問題準(zhǔn)確度語音交互:精準(zhǔn)的語音轉(zhuǎn)寫能力,支持大容量熱詞定制,可方便快捷提升特定場(chǎng)景識(shí)別率數(shù)字人:

D

e

e

p

S

e

e

k

+

知識(shí)庫(kù)+

聯(lián)網(wǎng)搜索的數(shù)字人大腦讓數(shù)字人既懂私域知識(shí)也懂外部知識(shí);數(shù)字人口型更精準(zhǔn),業(yè)界領(lǐng)先支持多種交互形態(tài),提升用戶體驗(yàn)安全防護(hù)高效存儲(chǔ)推理加速模型應(yīng)用基于GPU一鍵部署Gpu實(shí)例/Flexus云服務(wù)器X實(shí)例Ollama

APIFlexus云服務(wù)器X實(shí)例12基于

華為云FlexusX實(shí)例(部署Dify工作流平臺(tái))+

DeepSeek構(gòu)建的DeepSeek聯(lián)網(wǎng)+知識(shí)庫(kù)助手,使得DeepSeek具備更多客戶私域知識(shí)和外部知識(shí),提高DeepSeek模型落地能力,此外工作流平臺(tái)還可以進(jìn)行意圖理解等強(qiáng)大功能,拓展DeepSeek智能助手能力邊界。1.

DeepSeek性能卓越,用戶體驗(yàn)佳,擁有強(qiáng)大的自然語言處理能力,其思維鏈的特性進(jìn)一步強(qiáng)化了上下文對(duì)話能力。2.

Dify內(nèi)置聯(lián)網(wǎng)搜索插件,可實(shí)現(xiàn)大模型聯(lián)網(wǎng)搜索的能力3.

Dify內(nèi)置強(qiáng)大的知識(shí)庫(kù)能力,導(dǎo)入您的知識(shí)文檔即可實(shí)現(xiàn)基于私域知識(shí)的對(duì)話助手項(xiàng)目方案服務(wù)大類服務(wù)子類計(jì)費(fèi)模式DeepSeek部署方案1ModelArtsModelArts

Studio(MaaS)包/按需方案2計(jì)算Flexus

X實(shí)例包/按需GPU包/按需Dify工作流平臺(tái)部署/計(jì)算Flexus

X實(shí)例包/按需方案核心優(yōu)勢(shì)4.核心優(yōu)勢(shì)3.賣給誰 目標(biāo)客戶AI行業(yè)場(chǎng)景應(yīng)用創(chuàng)業(yè)公司/人工智能ISV/人工智能研究院高校和AI培訓(xùn)機(jī)構(gòu)中型傳統(tǒng)企業(yè)(需要企業(yè)問答助手)offering2.賣什么解決方案架構(gòu)1.是什么DeepSeek聯(lián)網(wǎng)助手解決方案一指禪13基于

華為云部署DeepSeek

+

FlexusX實(shí)例(部署Dify工作流平臺(tái))+MetaStudio 構(gòu)建的DeepSeek交互數(shù)字人方案,可以輕松掛載個(gè)人/企業(yè)知識(shí)庫(kù)以及聯(lián)網(wǎng)搜索服務(wù),實(shí)現(xiàn)搜索增強(qiáng)模型生成(RAG),DeepSeek的思維鏈強(qiáng)化了上下文記憶能力,極大提升了數(shù)字人多輪對(duì)的話能力項(xiàng)目服務(wù)大類服務(wù)子類計(jì)費(fèi)模式DeepSeek部署方案1ModelArtsModelArts

Studio(MaaS)包/按需方案2計(jì)算Flexus

X實(shí)例包/按需GPU包/按需Dify工作流平臺(tái)部署/計(jì)算Flexus

X實(shí)例包/按需數(shù)字人/MetaStudio數(shù)字人交互包費(fèi)數(shù)字人形象加聲音一次性計(jì)費(fèi)解決方案架構(gòu)1.是什么offering2.賣什么賣給誰 目標(biāo)客戶零售業(yè)門店,餐飲業(yè),制造業(yè),學(xué)校(大廳或門店數(shù)字人)數(shù)字人直播,數(shù)字人教育核心優(yōu)勢(shì) 方案核心優(yōu)勢(shì)1.

DeepSeek+知識(shí)庫(kù)+聯(lián)網(wǎng)搜索的數(shù)字人大腦讓數(shù)字人既懂私域知識(shí)也懂外部知識(shí)2.

Deepseek思維鏈的特性進(jìn)一步強(qiáng)化了多輪對(duì)話的能力,提升用戶與智能數(shù)字人對(duì)話體驗(yàn)3.

數(shù)字人口型更精準(zhǔn),業(yè)界領(lǐng)先4.

整體交互時(shí)延低,用戶體驗(yàn)好DeepSeek智能交互數(shù)字人 解決方案一指禪14基于

華為云部署DeepSeek

+

Flexus

X實(shí)例(部署Dify工作流平臺(tái))+SIS語音交互服務(wù)

構(gòu)建的輕量化智能語音交互方案,可做智能語音助手,同時(shí)也可基于意圖分類模塊和大模型能力可實(shí)現(xiàn)智能終端云底座,使得終端類設(shè)備(攝像頭,耳機(jī),玩具,手表,智能座艙)實(shí)現(xiàn)語音交互智能決策。項(xiàng)目服務(wù)大類服務(wù)子類計(jì)費(fèi)模式DeepSeek部署方案1ModelArtsModelArts

Studio(MaaS)包/按需方案2計(jì)算Flexus

X實(shí)例包/按需GPU包/按需Dify工作流平臺(tái)部署/計(jì)算Flexus

X實(shí)例包/按需語音交互/SIS/包費(fèi)解決方案架構(gòu)1.是什么offering2.賣什么3.賣給誰 目標(biāo)客戶電子終端類ISV(手表,藍(lán)牙耳機(jī),攝像頭,學(xué)習(xí)機(jī)等電子類設(shè)備智能化升級(jí))汽車廠商/汽車行業(yè)ISV

(智能座艙)玩具廠商/

玩具ISV(玩具智能體,如機(jī)器狗)4.核心優(yōu)勢(shì) 方案核心優(yōu)勢(shì)本方案可實(shí)現(xiàn)意圖識(shí)別和分類,通過人聲轉(zhuǎn)文字再識(shí)別用戶意圖的方式,驅(qū)動(dòng)終端實(shí)施具體操作本方案具備并發(fā)能力,并可按照并發(fā)量的增大逐漸增大用量,比按路數(shù)計(jì)費(fèi)的某省市大量成本,可按商用效果逐漸增大并發(fā)量,避免初期客戶投入過大而流失DeepSeek智能語音交互/智能終端解決方案一指禪15部署指導(dǎo):ModelArts

Lite

部署DeepSeek指導(dǎo)書:MaaS

DeepSeek免費(fèi)tokens部署文檔:Flexus

X實(shí)例/GPU上部署蒸餾版本Deep

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論