DeepSeek大模型分享與展望-清華大學(xué)

上傳人：海*** IP屬地：廣西上傳時間：2025-06-11 格式：PPTX 頁數(shù)：82 大?。?2.81MB 積分：7.19 舉報 版權(quán)申訴

已閱讀5頁，還剩77頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

DeepSeek展望大模型介紹與2025/02/0601

引言概述02

DeepSeek

大模型概述03

DeepSeek

應(yīng)用場景04

技術(shù)創(chuàng)新與突破目錄CONTENTS05

挑戰(zhàn)與解決方案06

未來發(fā)展趨勢07

結(jié)論與展望目錄CONTENTS引言概述大模型定義應(yīng)用場景廣泛技術(shù)創(chuàng)新驅(qū)動大模型概念介紹具有海量參數(shù)和強大能力

的模型涵蓋自然語言處理、計算

機視覺等自監(jiān)督學(xué)習(xí)等技術(shù)推動大

模型發(fā)展多領(lǐng)域應(yīng)用前景在自然語言處理、計算機視覺等多領(lǐng)

域有廣泛應(yīng)用前景DeepSeek

應(yīng)運而生基于大模型趨勢，開發(fā)具有獨特優(yōu)勢

的大模型DeepSeek

背景簡述大模型發(fā)展趨勢模型規(guī)模持續(xù)增長，技術(shù)創(chuàng)新不斷大模型概述DeepSeek模型架構(gòu)解析深度學(xué)習(xí)架構(gòu)采用先進的深度學(xué)習(xí)框架多層神經(jīng)網(wǎng)絡(luò)包含多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模塊化設(shè)計支持模塊化設(shè)計，便于擴展與優(yōu)化訓(xùn)練數(shù)據(jù)與方法DeepLearning自監(jiān)督學(xué)習(xí)結(jié)合自監(jiān)督學(xué)習(xí)方法提升效果精細調(diào)優(yōu)通過精細調(diào)優(yōu)提升模型性能大規(guī)模數(shù)據(jù)集使用海量數(shù)據(jù)進行訓(xùn)練泛化能力強具備出色的泛化能力，適應(yīng)多種場景低資源消耗在保證性能的同時，降低

資源消耗高效處理高效處理大規(guī)模數(shù)據(jù)，響

應(yīng)迅速特點與優(yōu)勢概述DeepSeek應(yīng)用場景情感分析精準識別文本情感，助力智能

客服等領(lǐng)域語言翻譯支持多語種翻譯，提升跨語言

溝通效率文本生成與理解利

用DeepSeek

進行高效文本

生成與理解自然語言處理應(yīng)用圖像識別DeepSeek

在圖像識別領(lǐng)域展現(xiàn)出色性能物體檢測高效檢測圖像中物體，提升自動化處理能力視頻分析支持視頻內(nèi)容分析，為智能監(jiān)控等領(lǐng)域提供支持計算機視覺應(yīng)用圖文結(jié)合分析結(jié)合文本與圖像信息，提升信

息分析準確性語音與文本交互實現(xiàn)語音與文本的流暢交互，提升用戶體驗跨模態(tài)檢索支持跨文本、圖像、語音等多

模態(tài)信息的檢索多模態(tài)應(yīng)用實例技術(shù)創(chuàng)新與突破自監(jiān)督學(xué)習(xí)技術(shù)提升模型泛化能力增強模型在未標注數(shù)據(jù)上的表現(xiàn)自監(jiān)督學(xué)習(xí)應(yīng)用DeepSeek

采用自監(jiān)督學(xué)習(xí)技術(shù)減少標注成本有效降低對大量標注數(shù)據(jù)的依賴模型壓縮與加速可解釋性與安全性模型可解釋性增強提升模型決策過程的透明度安全性保障加強模型對數(shù)據(jù)隱私和安全性的保護防范潛在風險有效應(yīng)對模型偏見與公平性問題挑戰(zhàn)與解決方案數(shù)據(jù)隱私與安

全保護數(shù)據(jù)隱私保護確保數(shù)據(jù)收集、存儲、

處理合規(guī)安全審計機制建立安全審計機制，

監(jiān)控數(shù)據(jù)使用數(shù)據(jù)加密技術(shù)采用先進加密技術(shù)保

障數(shù)據(jù)安全模型偏見與公平性透明化決策提高模型決策透明度，

增強公平性減少模型偏見優(yōu)化訓(xùn)練數(shù)據(jù)，減少偏

見影響公平性評估引入公平性評估指標，

監(jiān)控模型輸出-amnan1可r4C

mrUc出非博

r腿:3mP由M黑高效計算架構(gòu)采用高效計算架構(gòu)，減少資源消耗模型壓縮技術(shù)利用模型壓縮技術(shù)，降低能耗綠色計算策略實施綠色計算策略，促進可持續(xù)發(fā)展計算資源與能耗問題未來發(fā)展趨勢計算能力提升利用更強大的計算資源支持模型

訓(xùn)練數(shù)據(jù)效率優(yōu)化通過技術(shù)創(chuàng)新提高數(shù)據(jù)利用效率，促進模型規(guī)模增長D

Leaming模型規(guī)模持續(xù)擴大DeepSeek將不斷提升模型參數(shù)數(shù)量模型規(guī)模持續(xù)增長多模態(tài)技術(shù)融合DeepSeek

將融合自然語言、

計算機視覺等多模態(tài)技術(shù)技術(shù)交叉融合推動AI與其他前沿技術(shù)如區(qū)塊

鏈、物聯(lián)網(wǎng)的交叉融合跨領(lǐng)域應(yīng)用拓展拓展至醫(yī)療、金融、教育等領(lǐng)域，實現(xiàn)跨領(lǐng)域創(chuàng)新跨領(lǐng)域融合創(chuàng)新智能化應(yīng)用場景DeepSeek

將應(yīng)用于智能客服、

智能助手等人機協(xié)作場景智能化決策支持為決策提供智能化支持，提高決

策效率和準確性人機協(xié)作與智能化結(jié)論與展望推動AI技術(shù)創(chuàng)新DeepSeek

促進自監(jiān)督學(xué)習(xí)等

技術(shù)創(chuàng)新廣泛應(yīng)用場景在自然語言處理等多領(lǐng)域展現(xiàn)應(yīng)用潛力DeepSeek

潛力與影響解決行業(yè)挑戰(zhàn)針對數(shù)據(jù)隱私、模型偏見等提

出解決方案人機協(xié)作智能化推動人機協(xié)作，提升智能化應(yīng)

用水平跨領(lǐng)域融合創(chuàng)新促進AI與其他領(lǐng)域融合，實現(xiàn)

更多創(chuàng)新應(yīng)用模型規(guī)模持續(xù)擴大DeepSeek

將隨技術(shù)進步持續(xù)

擴大規(guī)模未來技術(shù)發(fā)展展望所CN33HIQ

量子位

insightsAI大模型創(chuàng)業(yè)格局報告量子位智庫

QbitAlInsights

分析師王昕祎xinyi@qbit微信公眾號：零豎質(zhì)量insights2

年11

月ChatGPT發(fā)布，引爆國內(nèi)百模大戰(zhàn)，創(chuàng)業(yè)玩家如雨后春筍，互聯(lián)網(wǎng)巨頭也紛紛下場，巔峰時期國內(nèi)公開大模型數(shù)量超越300個。如今一年半過去

…

巨頭們依托固有業(yè)務(wù)，更早形成壁壘，率先晉級。而創(chuàng)業(yè)玩家這邊，勝局也已鎖定，

天模型創(chuàng)業(yè)第一梯隊倉經(jīng)形成,目前或許只有少數(shù)幾家公司拿到了和巨頭角逐下半場的門票。創(chuàng)

業(yè)

六

小

強

他

們

分

別

是一

智

譜

Al、MiniMax、階

躍

星

辰

、

百

川

智

能

、

月

之

暗

面

和

零

一

萬

物

，

這

六

家公司背后都轉(zhuǎn)起了一個關(guān)鍵飛輪

—

模型、應(yīng)用和融資飛輪，這使得他們能夠與巨頭同場競技。另外，兩位值得特別關(guān)注的玩家

這

一賽道上還有

面壁智能和

DeepSeek.他們共同組成了國內(nèi)大模型創(chuàng)業(yè)玩家“6+2”格局。許多人認為，繼移動互聯(lián)網(wǎng)之后的Al

時代，新的巨頭或?qū)倪@八家公司中誕生。而放眼全球，美國大模型行業(yè)同樣存在類似的階段性競爭格局變化，像曾經(jīng)的移動互聯(lián)網(wǎng)時代一樣，中美再次在兩個“平行宇宙”中上演新的歷史進程

…..在本篇報告中，量子位智庫將以一個逐步放大的視角，從國內(nèi)創(chuàng)業(yè)玩家“6+2”格局、國內(nèi)巨頭玩家格局、海外玩家格局三個層次，力求為讀者描繪大模型行業(yè)格局完整畫卷。insights1.0

國內(nèi)創(chuàng)業(yè)玩家“6+2”格局2.0

國內(nèi)巨頭玩家格局3.0

海外玩家格局4.0

新階段競速標準微信公眾號：零豎質(zhì)量insights國內(nèi)創(chuàng)業(yè)玩家“6+2”格局微信公眾號：零豎質(zhì)量智譜清言、清影星野、海螺、

TalkieKimi躍問、冒泡鴨百小應(yīng)、健康厥問APL、云端私有化

本地私有化APIAPIA

金融、

內(nèi)

容創(chuàng)

作MaaS+AaaS

行

業(yè)

解決方案數(shù)字人解決方案全行業(yè)ToB

解

決方案、

AlIinfra

解決方案約30億美元約25億美元約30億美元約20億美元*超20億美元超10億美元為投前估值●十2創(chuàng)業(yè)特別關(guān)注分

類學(xué)院派青年派大佬派創(chuàng)

始

人唐杰閆俊杰楊植麟姜大昕王小川李開復(fù)MINIMAx階躍星展萬

物2020.06.11OpenAI

發(fā)

布GPT3doopsook模

型DeepSeek2023.05,16零一萬物成立創(chuàng)

始

人梁文鋒2023.07.1

7深度求索成立模

型GLMababMoonshotStepBaichuanYi2022.08面壁智能成立國內(nèi)創(chuàng)業(yè)玩家“6+2”格局總覽面壁智能創(chuàng)

始

人李大海

劉知遠C端產(chǎn)品

B端

產(chǎn)

品

最新估值2022.11OpenAI

發(fā)布ChaiGPT,引爆百模大戰(zhàn)創(chuàng)業(yè)六小強模

型MiniCPMinsights2023.04.0

6階躍星辰成立2023.04.1

0百川智相成立2021.12MinMax

成立2023.03月之暗面成立2019.06智造A成立在模型維度上，本章將根據(jù)各家創(chuàng)業(yè)公司特點有側(cè)重地介紹其研發(fā)歷程、模型能力特點、架構(gòu)特色、矩陣構(gòu)成、Benchmark

成

績

、AGI

路徑規(guī)劃等情況中的一到三項。在應(yīng)用維度上，本章將根據(jù)各家創(chuàng)業(yè)公司特點有側(cè)重地介紹其大模型應(yīng)用矩陣、特色應(yīng)用、主

力應(yīng)用、實現(xiàn)功能、用戶數(shù)據(jù)、戰(zhàn)珞特點、生態(tài)布局、付費模式等情況中的一到三項.在融資維度上，本章將介紹各家創(chuàng)業(yè)公司融資歷程，具體包括歷次融資時間、輪次、金額、估值及投資機構(gòu)。在團隊維度上，本章將介紹各家創(chuàng)業(yè)公司核心團隊成員情況，具體包括教育背景、學(xué)術(shù)影響力、

重要頭銜、相關(guān)工作履歷等信息。國內(nèi)創(chuàng)業(yè)玩家核心競爭力四維度競爭力維度

具體內(nèi)容模

型應(yīng)

用融資團隊insightsinsights創(chuàng)業(yè)六小強玩家微信公眾號：零豎質(zhì)量19962015.12

2019.062020.06CpenAI正式成立智港A正式成立

OpenAI發(fā)

布GPT-3OpenAl

智譜

GLM-4

模型主流Benchmark

成

績智譜Al——模型：清華系成果轉(zhuǎn)化，自研底層架構(gòu)，對標OpenAl

insights脫胎于高校實驗室，技術(shù)成熟自然轉(zhuǎn)化：智譜A脫胎于清華KEG

實驗室，是清華計算機系技術(shù)成熟到一定程度的轉(zhuǎn)化成果，于2019年6月正式成立，2022年8月發(fā)布自研百億參數(shù)大模型GLM,

彼時GPT-3.5

還未發(fā)布。自研底層框架打破壟斷，矩陣全面對標OpenA

I:2022年3月，唐杰團隊提出了全新自研的通用預(yù)訓(xùn)練框架GLM,

打破當時西方壟斷主流大模型預(yù)訓(xùn)練框架技術(shù)路徑

的局面。智譜AI在模型和產(chǎn)品矩陣甚至投資策略上均對標OpenAI,最新的GM4

基座大模型能力多方位接近世界領(lǐng)先水平。ModeMMLU

GSM8K

MATH

BBH

GFQA

HamanEvalGPT-4(0314)GPT4

Turto(1106)GPT4Turbo(2024-04-09)Cwde

30pusGkmii1.5Pro86.484.786.786.885.992095.795.695.090.852.964.373.460.167.783.188388286.889235.742.549.350.446.267.083.788.284.984.1GLM-4-9B-ChutGLM-4-Air(0605)GLM-4(0116)GLM-4(0520)72.481.981.583.379.690.987.693.350.657.947.96L376.380.482384.728838.435.739.971875.772078.5ChanGLM智譜清言GLMCogVicwCogVdoo清影CodeGeeXCogVLMbigmodal,ai智諾清言智能體中心面壁智能、生數(shù)科技、無問芯育等ChatGPTGPTDALL-

ESaraCodexGPT-40

platlorm.openaigptstore

Helion,Rain

A、Anthropic等應(yīng)用產(chǎn)品底層框架圖像生成視頻生成代

碼多

模

態(tài)MaaS平臺Agent開發(fā)平臺產(chǎn)業(yè)投資智譜GLM-4(0520)在GSM8K、MATH、BBH、GPOA、HumanEval等

多個國際主流Benchmark

上成績超過GPT-4(0314).清華KEG

實檢室成立

致力于網(wǎng)絡(luò)環(huán)境下知

識工程理論.方法和應(yīng)用研究2021智譜百億參數(shù)大梗里GLM發(fā)布，采用全新預(yù)訓(xùn)練模型框架2024.01智進發(fā)布最新一代基

座大模型GU44

性能

達到國際領(lǐng)先水平2022.08智諾發(fā)布開源干億大模GUM1308,

效果對標GPT-3175B2022.12OpenAI

發(fā)

布GPT-

3.5,引爆白模大戰(zhàn)2023.08智譜上線A助手應(yīng)用智諧清言2024.07智語發(fā)布視煩生

成功能清影信息來源：智譜及公開他息整理AI汽

車售后服務(wù)Al手

機生活服務(wù)助手智能問診Al醫(yī)療AI營養(yǎng)師其他AI風控智能投顧報告解讀請當-A生

程曰t口ssem智進清影A生成視頻功能網(wǎng)頁端ToB

基因突出，主打MaaS

平臺：智譜脫胎的清華KEG

知識工程研究室自90年代就強調(diào)工程落地，造就了團隊將技術(shù)落地到需求中的做事風格。智譜團隊以ToB

背景為主，商業(yè)化重心在B端，智譜大模型開放平臺目前已有超40萬的企業(yè)用戶，主要覆蓋金融、教育、互聯(lián)網(wǎng)、零售、汽車、能源、傳統(tǒng)制造業(yè)等行業(yè)，ToC側(cè)重生產(chǎn)力應(yīng)用，視頻生成功能清影上線：智譜ToC

業(yè)務(wù)目前仍以免費為主，主力應(yīng)用“智譜清言”,截至2024年6月歷史下載量突破500萬，同時智譜清言也

是智能體開發(fā)平臺，目前已有超過30萬個智能體活躍在智譜清言APP

可供使用，2024年7月新上線視頻生成功能清影”,對標Sora,免費公開使用不限次。依據(jù)量子位智庫發(fā)布的《

智能助手APP8

月榜單》

,智譜的ToC

主力應(yīng)用智譜清言下載量突破500萬，位列第七。(完整報告數(shù)據(jù)請查看量

子位智庫公眾號)API單日調(diào)用量

API單日調(diào)用tokens

服務(wù)企業(yè)客戶600萬+

400億+

30萬+信息來源：智譜及公開他息整理Q智譜Al——應(yīng)用：工程基因，側(cè)重ToB,

商業(yè)化進程身位領(lǐng)先insightsToB

業(yè)

務(wù)ToC

業(yè)

務(wù)智能導(dǎo)游

行程規(guī)劃AI質(zhì)檢

Al供應(yīng)鏈智能座艙

市場營銷售后服務(wù)

研發(fā)制造AI

BIAI陪

伴AI導(dǎo)

購AI客服AI旅行Al金融AI營銷智譜融資歷程時間輪次金額估值投資機構(gòu)2024/D9B

輪數(shù)十億200億中關(guān)村科學(xué)城2024/05B+輪約4億美元約30億美元Prospery7Venlures2024/03B+輪順椿基金2024/01B+輪光速光合2023/10B+輪螞蟻集團2023109B+輪12億25億好未來，小米，紅杉、美團，調(diào)投備、金山軟件、阿里巴

巴.順為資本、高犧資本、聯(lián)備本2023107B+輪約3億40億美團2023/05B

輪約4億4

億今日資本，螞效金服，光速中國2022109B輪約2億2

億啟明創(chuàng)投，君聯(lián)資本，華控基金2021/09A輪約1.5億四靈創(chuàng)投、凌云光、華控基金、將門創(chuàng)投、海南智橋、MO

Venues、達晨財智、北京榮品2021/04天使輪北京創(chuàng)新智科技有限公司2019108種子輪中科創(chuàng)星、華控技術(shù)轉(zhuǎn)移有陽公司、清控資管集團

智譜

Al——

融資：融資輪次多、估值領(lǐng)先，全產(chǎn)業(yè)鏈投資積極布局生態(tài)

insights融

資

金

額

及

估

值

處

于

第

一

梯

隊

：

智

譜

是目

前國

內(nèi)

估

值

最

高

的

大

模

型

初

創(chuàng)

公

司

之

一

，

最

新

一

輪

融

資

估

值

報

據(jù)

傳

為

億

美

元

，

從團

隊

背

景

、

模

型

開

發(fā)

進

展

、

商

業(yè)

化

方

向

及

資

金

儲

備

情

況來

看，公

司

處

于國內(nèi)Al創(chuàng)

業(yè)

公

司

頭

部

。積

極

布

局

產(chǎn)

業(yè)

生

態(tài)，

投

資

多

家

技

術(shù)

優(yōu)

勢

公

司

：

為

打

造自己

的A大

模

型

生

態(tài)圈，

智

譜

參

與

了

十

多

家A大

模

型

產(chǎn)

業(yè)

相

關(guān)

創(chuàng)

業(yè)

公

司

的

投

資

，

被

投

企

業(yè)

多

為

清

華

系

，

且

以

技

術(shù)無問芯穹聆心智能面壁智能智

譜基流科技霉律皆能發(fā)起總額為10億人民幣的大模型創(chuàng)業(yè)基金，支持大模型

原始創(chuàng)新，覆蓋大模型算法、底層算子、芯片優(yōu)化、行業(yè)

大模型和超級應(yīng)用等各方面。分別聯(lián)合CCF

中國計算機學(xué)會、中國中文信息學(xué)會社會媒

體處理專委會發(fā)起了CCF-智譜大模型基金、SMP-

智譜大

模型交叉學(xué)科基金，用于支持大模型理論、算法、模型、應(yīng)用等相關(guān)研究和跨領(lǐng)域交叉創(chuàng)新。成立大模型開源基金，計劃累計用1000張

GPU.1000萬人民幣和1000億tokens

來支持人工智能開

源社區(qū)建設(shè)

.智譜產(chǎn)業(yè)生態(tài)布局智譜投資布局對開源社區(qū)對學(xué)術(shù)界對創(chuàng)業(yè)者信息來源：智譜、相關(guān)報道及公開信息整理導(dǎo)

向為主

。清程極智生數(shù)科技智譜Al—

團隊：學(xué)院派代表，清華計算機系人才眾多

insights依托清華A1

人才資源：截至2024年9月，公司員工共計600余人，其中大模型研發(fā)人員接近半數(shù)，其余為客戶服務(wù)落地人員及產(chǎn)品人員。公司借助清華系高校背景，持

續(xù)吸引高端人才

.團隊具備從研發(fā)到落地全棧能力：公司團隊源自清華知識工程研究室KEG,

該實驗室自90年代成立起就走的是科研+工程化落地路線，團隊成員具備深厚技術(shù)積累及

綜合運營經(jīng)驗；創(chuàng)始人唐杰教授是認知智能領(lǐng)域頂尖專家，具備20余年人工智能領(lǐng)域研究經(jīng)驗。insights微信公眾號：零豎質(zhì)量●巴黎第十一大學(xué)計算機碩士、法國梅斯大學(xué)計算機碩士●曾任大搜車集團CTO,曾創(chuàng)立元因智能任CEO,

創(chuàng)立妙

計旅行任CEO,是智能技術(shù)領(lǐng)域連續(xù)創(chuàng)業(yè)者●曾在字節(jié)，騰訊，搜狗從事技術(shù)管理工作張

帆CO0SUNIVERSITE

PARISSUD●20余年技術(shù)和政府項目綜合經(jīng)驗●清華數(shù)據(jù)科學(xué)研究院科技大數(shù)據(jù)研究中心副主任●中科院計算所博士，師從高文院士●獲得授權(quán)發(fā)明專利40余項，國際標準一項●清華計算機系本碩博，中國新間信息標準化分會委員●電子學(xué)會標準化工作委員會機器人技術(shù)委員會委員●在ICML、ISWC

等頂級會議上發(fā)表10余篇文章●清華大學(xué)計算機科學(xué)與技術(shù)工學(xué)博士、IEEE

Fellow●清華大學(xué)計算機系教授，研究方向知識圖譜●曾主導(dǎo)開發(fā)全球最大萬億級超大規(guī)模預(yù)訓(xùn)練模型悟道●曾任清華數(shù)據(jù)科學(xué)研究院科技大數(shù)據(jù)研究中心副主任●凹凸科技北京公司總經(jīng)理●獲得授權(quán)發(fā)明專利15項，關(guān)國發(fā)明專利2項唐

杰創(chuàng)始人技術(shù)顧問劉德兵

董事長張

鵬CEO王紹蘭

總

裁信息來源：智譜及公開他息整理Sicro0MiniMax——

模型：選擇混合專家架構(gòu)技術(shù)路徑，打造多模態(tài)模型

insights國內(nèi)最早研發(fā)MoE

及

Linear

Atent

ion:2023年6月

，MiniMax

在MoE

混合專家架構(gòu)仍是行業(yè)非共識時選擇Al

MoE,彼時行業(yè)大部分公司仍在訓(xùn)練Dense

稠密模

型，2024年1月，MnMax

發(fā)布干億參數(shù)MoE

架構(gòu)模型；4月底，推出萬億參數(shù)MoE

架構(gòu)模型。即將發(fā)布的abab7模型將基于MOE+Linear

Atention.圍繞產(chǎn)品需求打造全矩陣多模

態(tài)

模

型：

截

至

024

年9

月，MniMax

已推出視頻大模型

、音

樂大模型及語

音大模型

，

最新主

力模型abab6.5在多

項核

心

能

力

上

開

始

接近世界最領(lǐng)先

大

語言模型

水平

。視頻大模型abab-video-1壓縮宰高

.文本響應(yīng)好。風格多樣，支持原生高分

辨平、高幀率視頻音

樂

大

模

型abab-music-1支持多功能端到端音樂生

成，可合成多種音樂形式，支持伴奏人聲同時生成語音大模型單日交互次數(shù)30億次日

均

處

理

Tokens3萬億abab6.5與世界領(lǐng)先語言模型在多個開源測試集上的成靖對比FFNSADense稠

密

模

型|FFNFFNFFN

3由SAMoE混合專家模型美文院魯

MT-Bnc中文綜音

細眼

他

教

霞字解

輔屋理從AncMMU0SMKwTM864m

FwFbb

15-2024

045B.7774278.T751381176.078.9abab

6.52024

041587.1873067542.674.5683728GPT-48.967594920529811670561-152160670.0ST,134.164.64170.50e

15o89788158584019校Oudo

30pus800*762950610M9Cude

3Soe8476.771.023405829730cude3uk89642*752894697379由自注意力機制層(

SA)

和的饋神經(jīng)網(wǎng)絡(luò)層

(FFN)

組

成

，

每一層都與前層直接相

連

。每次前向傳播中所有

的參數(shù)都被渺活和使

用，需要的計算量和

顯存更大。自注意力機制層(SA)

后接了多個前饋神經(jīng)

網(wǎng)

絡(luò)

層(FFN).在每次前向傳播中，

由路由機制選擇性激

活部分FFN,可減少計算量和顯存

需求，同時提高模型

在同等條件下的靈活

性和容量。abab-speech-1支持粵語、韓語、西班牙語等多語種，生成語句超擬人，情緒細膩自然abab

6.5

系列包含兩個模型

：abab6.5和

abab6.5s,

在各類核心能力測

試中，abab

6.5開始接近

GPT-4

、Claude-3、Gemin-1.5

等世界上最領(lǐng)

先的大語言模型。模型架構(gòu)對比模型矩陣主流測試集成績·····信息來源：MniMax

及公開他息整理Cut

ClingCard

Gest國內(nèi)星野：星子于2023年9月上線，用戶可以在星野上通

過簡單描述定制Al

智能體的形象，聲音、人設(shè)、技能，井

在后續(xù)對話中不斷調(diào)整強化。也可以選擇首頁推薦的數(shù)百萬款由用戶創(chuàng)腱的智能體進行多模態(tài)沉浸式互動。此外，星野還探素了訂閱制和抽卡制的付費模式，以寶石為主的經(jīng)濟體系

和以星念為中心的用戶共創(chuàng)激勵體系依據(jù)量子位智庫發(fā)布

的《

陪

伴

月APP

榜

單

》,

星

野APP

下載總量

超1400萬，月新增下載及DAU

均位列國內(nèi)同類A

產(chǎn)品第

一

.海

外

Talk

ie:Talk

io于2023年6月上線，主要面向北美

市場。產(chǎn)品玩法與星野類似，用戶可以定制AI

智能體的形

象，聲音、人設(shè)、技能，并進行卡牌抽取及交易。根

據(jù)

Sensor

Tower

數(shù)

據(jù)

，Talkie2024年H1在美國市場累計下載量380萬次，位列美國同類

產(chǎn)品排名第一

，超過

CharacterAL,目

前

Talkie

全球月活數(shù)據(jù)已達到1100萬，

一

半以上用戶來自美國，與

Character.ai月活數(shù)據(jù)1700萬的差距逐漸縮小。MiniMax——應(yīng)用：以娛樂陪伴方向為主，專注打造超級應(yīng)用

insightsToC

打造超級應(yīng)用工廠：Mr

iMax

是國內(nèi)創(chuàng)業(yè)公司里做應(yīng)用產(chǎn)品最早、最多的公司，2022年早于ChatGPT一個月上線Glow,

又陸續(xù)推出了A

內(nèi)容平臺應(yīng)用星野

Talkie,

以及生產(chǎn)力助手海螺A,8

月最新發(fā)布海螺Al

創(chuàng)意視頻平臺，可調(diào)用最新視頻生成模型，視頻生成能力尤其是人物表情生成方面受到海內(nèi)外好評。ToB

布局開放平臺：ToB

方向布局API

開放平臺，目前已接入3萬余家企業(yè)客戶，主要落地場景包含零售、教育、辦公、智能硬件、招聘、客服、聊天等?！蚝Ｂ軦I#oa附落地場景角

色

智能Al扮

演

客

服

硬

件

教育聊

天

AlAlAl問

答

招聘

辦

公

零

售國內(nèi)外AI

內(nèi)容平臺應(yīng)用海

螺A

海螺A

I于2024年5月上線，支持多種

交互方式：可以發(fā)送文字消息、上傳圖片、PDF、PPT、TXT、DOCX

等格式文件，支持語音通話。8

月下句最新開放音樂創(chuàng)作與視頻創(chuàng)作入口，可由此進入海生產(chǎn)力應(yīng)用螺音樂及海螺AI

創(chuàng)意視場平臺，調(diào)用海螺視頻生成大模型能

力

，A

開

放

平

臺信息來源：MriMax、SensorTower及公開他息整理不.融資歷程時間輪次金

額估值投資機構(gòu)2024/03A輪6億美元25億美元阿里巴巴、紅杉中國、高

瓴投資、經(jīng)緯創(chuàng)投2023/06A輪2.5億美元12億美元騰訊投資、綠洲資本、小

紅書、順為資本、高瓴投

資、IDG資本202207202201A輪天使輪超2000萬美元IDG資本、明勢資本、高

瓴創(chuàng)投、米哈游云啟資本估值高、投資門檻高、融資金額高：MiniMax作為國內(nèi)大模型創(chuàng)業(yè)六小強中唯二在ChatGPT

爆火之前就成立的大模型公司，很早就吸引了頭部機構(gòu)注意，目前已集齊

阿里、紅衫、高瓴、經(jīng)緯、IDG、順為、明勢、云啟一眾頭部機構(gòu)，估值約25億美元，人才技術(shù)實力強，產(chǎn)品經(jīng)驗豐富：創(chuàng)始人兼CEO

閆俊杰具備豐富的技術(shù)、產(chǎn)品和商業(yè)化管理經(jīng)驗，核心技術(shù)團隊擁有世界頂尖自然語言處理、語音、計算機視覺、計

算機圖形學(xué)等工業(yè)和學(xué)術(shù)經(jīng)驗。閆俊杰創(chuàng)始人、CEO●中科院自動化所博士，在人工智能頂會及核心期刊發(fā)表論文200余篇，谷歌學(xué)術(shù)被引用超3萬次●曾任商湯集團副總裁，從零打造通用計算機視覺模型、深度學(xué)習(xí)工具鏈和人臉識別相關(guān)的技術(shù)體系●獲得多項重要獎項和榮營，包括超過10次重要國際學(xué)術(shù)克賽的冠軍，廣東省技術(shù)發(fā)明一等獎，兩次吳文俊

人工智能二等獎等MiniMax——融資&團隊：率先晉升獨角獸，Under

35創(chuàng)始人帶隊畢業(yè)于約翰霍普金斯大學(xué)，主修電子計算機工程、數(shù)學(xué)和經(jīng)濟，主研深度學(xué)習(xí)在醫(yī)療影像領(lǐng)域的技術(shù)和應(yīng)用●普任商湯科技投融資經(jīng)理、戰(zhàn)略國際化總監(jiān)、創(chuàng)新業(yè)務(wù)總經(jīng)理，負責集團多項業(yè)務(wù)孵化、國際化探索，參與團隊成員魏

偉合伙人開放平臺業(yè)務(wù)負責人負

燁

祎聯(lián)合創(chuàng)始人、

COO●涉足技術(shù)和業(yè)務(wù)兩大領(lǐng)域，早在2011年就開始使用GPU

驅(qū)動深應(yīng)學(xué)習(xí)，支持算力平臺的發(fā)展●

曾任云副總裁，百度技術(shù)總監(jiān)，中國云計算領(lǐng)域的早期貢獻者insights信息來源：MniMax

及公開他息整理集團多輪融資月之暗面——模型：明確主打長文本能力，專注迭代文本模型

insights主打長文本，專注

迭

代

唯

一

模

型

：

月

之

暗

面

成

立

于

年

月，

同

年1

月

首

次

發(fā)

布

支

持

8k上

下

文

長

度

的

模

型

時

處

于

業(yè)

界

領(lǐng)

先

地

位，目

前

萬

文

本

長

度

功能內(nèi)

測中，

僅

發(fā)

布

唯

—

款

干

億

參

數(shù)

大

語

言

模

型，

下

階

段

即

將

發(fā)

力多

模

態(tài)

。AGI路

徑

戰(zhàn)

珞

有

一

定

前

瞻

性

：

多

次

在

行

業(yè)

非

共

識

階

段

提出

公

司

的AGI戰(zhàn)

略

思

路，

如

長

文

本

是

必

經(jīng)

之

路、

通

過ToC

產(chǎn)品實現(xiàn)數(shù)據(jù)

Scaing

、

專

注

迭

代

文

本

能力、

在

智力密

集

場

景

打

造

超

級

應(yīng)

用

轉(zhuǎn)

動

數(shù)

據(jù)

飛

輪

反

哺

模

型

等

觀

念

。-*senee?.

mn,n*1m*r.MWL.Tim**innnnnn,Dnn,Nen.2023.10推出Kimi智能助手，支持20萬字上下文輸入X支

持

萬

字

上

下

文

了Longwniong200萬字是什么?和親密的人十年的聊天對話.…量先糜的全部古

…申清M

入202402Kiml開放平臺公測根據(jù)月之暗面

提供的信息，

對于中文文本，

1個Token

大

約相當于1.5-2

個漢字，如果

按1

75的比例

換算，200萬字

相

當

于

萬

tokens.

(Kimi

智能助

手

萬

字

上

下文目前未對

公眾開放，只

能通過申請內(nèi)

測使用。)2023.03月之瑞面成立申請內(nèi)測Kimi智能助手200萬字上下文功能上傳英偉達2016-2024年財報后進行長文本分析。2024.07Kimi

開放平臺引入上下文緩存功能，加快模型響應(yīng)速度2024.03Kimi智能助手200萬字上下文功能內(nèi)測二百萬字長文本2024.08正式發(fā)布企業(yè)級API信息來源：月之暗面Kimi

及公開信息整理KimiK.流量領(lǐng)跑創(chuàng)業(yè)玩家，積極探索變現(xiàn)路徑：2023年10月推出kimi智能助手，2024年3月爆火，帶漲kimi概念股；6月網(wǎng)頁端點擊量超越百度文小言；2024年5月，率先上線六檔打賞功能，強調(diào)靈活性和趣味性，持續(xù)積極探索變現(xiàn)路徑。營銷能力突出，獲客成本高引爭議：營銷年輕化、網(wǎng)感好，獲客手段之一是投流，據(jù)傳CPA

高達30元，雖然在業(yè)內(nèi)引起爭議，但也投出了一個早期爆款應(yīng)用

開始通過API建設(shè)生態(tài)，加碼B端業(yè)務(wù)：2024年2月正式面向企業(yè)和開發(fā)者開放企業(yè)級API服務(wù)，在增加B端服務(wù)的同時也開始布局產(chǎn)業(yè)生態(tài)W00ong國有200萬字無報土下文綠力的(麻康太：(Longcontext電子Al卿重重地賞!短3打常項目價格高峰期使用權(quán)限平均每天價格送Kimi一朵花5.2元4天1.30元給Kimi加雞腿9.9元8天1.23元請Kimi喝啦啡28.8元23天1.25元給Kimi充充電49.9元40天1.24元請Kimi吃頓飯99元93天1.06元和Kimi一起登月399元365天1.09元AI應(yīng)用月報

·AI智能助手rWeb

端月訪問量」Kim

智E

手2000x

心

-根

據(jù)量子位智庫《AI

智

能

助

手

APP8

月榜單

》及

《AI

智

能

助

手

月Web

端榜單》,

Kimi

智能助手截

至

年

月APP

端歷史總下載量近3000萬，位列國內(nèi)第二，僅次于豆包

A;Web

端月訪問量超

2000萬，位列國內(nèi)第

一

(完整報告請查看量子位

智庫公眾號)Kimi

智能助手積極探索變現(xiàn)路徑，首發(fā)打賞制，相比傳統(tǒng)訂閱制度更

加靈活機動，強調(diào)趣味互動，營造

智能助手伙伴感，提供的高峰期不

限速服務(wù)平均日價格約12元天海外競品OpenAI

訂閱價格為20美

元

月(

約

人

民

幣

元

月

)

國

內(nèi)

寬品大多為免費制。Kimi

智能助手打賞價格Kimi

智能助手用戶流量月之暗面——應(yīng)用：高成本獲客打造爆款應(yīng)用，網(wǎng)感營銷風格突出博定社交平臺網(wǎng)感營銷準的Qinsights信息來源：量子位智庫、月之暗面Kml

及公開信息整理存人

無

敵JK用之面rkimi.n@時間輪次金額估值投資機構(gòu)20241062024/02B+超10億美元騰訊.高榕創(chuàng)投阿里、紅杉中國、小紅

書、美團、礪思資本2023/072023/06A超2乙

美元美團龍珠真格基金、紅杉中國、

今日資本融資估值高、金額高、門檻高：截至2024年7月月之暗面已進行4輪融資，估值高達30億美元，融資金額均為上億美元，資方全部為頭部機構(gòu)。很大程度由于創(chuàng)始人楊植麟在求學(xué)之路早期就開始閃耀天才星光，符合資本投人小天才畫像，早早吸引投資人押注，其中部分資方與楊植麟在創(chuàng)辦循環(huán)智能時就已結(jié)緣。創(chuàng)始團隊為清華計算機系四同門：主要團隊是清華計算機系本科同學(xué)。靈魂人物楊植麟標簽包括但不限于“天才學(xué)霸、“連續(xù)創(chuàng)業(yè)、頂尖計算機學(xué)府”、“懂藝術(shù)”、情

智

雙

高

"?！?/p>

高中競賽保送清華大學(xué)，大二轉(zhuǎn)去計算機系師從

IEEE

Follow唐杰，2015年以年級第

一名成績畢

業(yè)，本科期間普組建搖滾樂隊

Splay

Tree,任

鼓

手和詞曲作者●

博士就讀于卡內(nèi)基梅隆大學(xué)，在語言技術(shù)研究

所LTI

深造，師從蘋果AI

研

究

負

責

人

RuslanSalakhutdinov、

谷

歌

Al首

席

科

學(xué)

家William

Cohen,博士期間，

一作身份論文引用次數(shù)破

萬，頂會發(fā)表論文20余篇，和眾多學(xué)術(shù)明星

如Yoshua

Bengio.Yann

LeCun,QuocV.

等合著論文●

博二時和張宇鋁創(chuàng)辦循環(huán)智能●

博士畢業(yè)后任清華大學(xué)交叉信息研究院助理教

授●

清華大學(xué)計算機系本科畢業(yè)，后到卡耐基梅隆大學(xué)深造，研究方向為計

算機視覺中的檢測和識別問題，谷歌學(xué)術(shù)被引超過1

.9萬次●

2018年獲歐洲計算機視覺會議ECCV

最佳論文提名。同年在GeekPwn國際安全極客大賽上成為唯一破解人臉識別算法的參賽團隊●

曾

在

Meta

人

工

智

始

實

驗

室FAIR,與隊員何愷明共同提出組歸

一

化

Group

Normalizaion

方法。期間還創(chuàng)建了

Delectron2,是

Meta最

受

歡

迎

的A項目

之

一●

清華大學(xué)計算機系本科，本科曹與楊植麟共同組建樂隊Splay

Tree●

在曠視科技從事算法量產(chǎn)工作，與曠視研究院基礎(chǔ)科研負責人張祥雨合

作在CVPR

發(fā)

表ShufleNet

論文，后影響包括蘋果3D人臉解鎖在內(nèi)的

各種手機毫秒級人臉解鎖技術(shù)月之暗面——融資&團隊：資本寵兒，小天才范本，創(chuàng)業(yè)流量擔當創(chuàng)始團隊月之暗面融資歷程MEEVI

曠

視吳育昕聯(lián)合創(chuàng)始人周昕宇聯(lián)合創(chuàng)始人B30億美元天使楊植麟

創(chuàng)始人insights信息來源：月之暗面Kim

及公開信息整理XMetaB

階躍星辰——模型：模型矩陣能力全面，技術(shù)路徑規(guī)劃清晰

insights蟄伏一年，亮相驚艷，

Sca

ing

Law攀登者：2023年4月階躍星辰成立，

一年后首次發(fā)布Step-1

干億參數(shù)語言大模型、

Step-1V

干億參數(shù)多模態(tài)模型和Step2

萬億參

數(shù)MoE

語言大模型預(yù)覽版三款大模型，團隊主要從算力、系統(tǒng)、數(shù)據(jù)、算法四方面為攀登Scaling

Law作準備。MoE、

多模態(tài)兩手抓，邁入萬億模型俱樂部：2024年7月4日，階躍星辰在2024年世界人工智能大會上第二次亮相，發(fā)布了Stp2萬億參數(shù)MoE

語言大模型正式版、Step-1.5V千億參數(shù)多模態(tài)大模型、Step-1X

圖像生成大模型三款

Step

系列模型新款。通過自建機房+租用算力，積極儲備算力。成員實踐過單集群萬卡以上的系統(tǒng)建設(shè)與管理，訓(xùn)

練干億模型的有效算力輸出MFU

達

,數(shù)據(jù)團隊核心骨干來自必應(yīng)搜索引擎，曾支持全球

100多種語言，為200多個國家和地區(qū)提供服務(wù)。

對全球互聯(lián)網(wǎng)高質(zhì)量語料的分布有深入了解。并建

立了高質(zhì)量數(shù)據(jù)處理和知識圖譜流水線。駕馭多種大模型架構(gòu)，同時對大模型的認知以及發(fā)展路線進行深刻洞察。類型模型參數(shù)架構(gòu)對標文本Step-2萬億MoEGPT-4多模態(tài)Step-1.5V千億GPT-4V圖像生成Stop-1X8BDiTDALLE四方面發(fā)力攀登萬億參數(shù)MoE

大模型驚會O山

37.5

58.6

8.6O階躍星辰Step-2在VCUNA,AGIEVAL,BBH、DROP、MATH等多個國際主流Benchmark上成績超過GPT-4-1106,Claude3和Llama370BChat,多模態(tài)大模型

統(tǒng)一

理解及

生

成當前主流測試集成績語言模型視覺模型聲音模型86.079.383.1標M090895.00

93.068.464.160.1504A

路

徑知

識1082.968.3

85.864785.7572

89.3橫型矩陣時齊抽象

Swe2歸納nawe

世

界對我勝率48J341.918444.5數(shù)據(jù)系統(tǒng)算法算力考試69.563.161.7592參數(shù)

數(shù)據(jù)

算力

Scale探

索物理

世界理89.46178.2信息來源：階躍星展及公開信息整理186.64.787多模理解多模生成?；ノ磥碓缙跀?shù)

學(xué)階躍星辰——應(yīng)用：發(fā)力ToC,

繁星計劃意圖布局應(yīng)用生態(tài)

insightsToC

布局生產(chǎn)力和娛樂陪伴兩款產(chǎn)品：2024年3月首發(fā)亮相時同步發(fā)布生產(chǎn)力智能助手“躍問和A

內(nèi)容開放平臺應(yīng)用“冒泡鴨兩款產(chǎn)品，躍問目前已實現(xiàn)A

聯(lián)

網(wǎng)

搜

索

、多格式文檔解析、拍照識圖、語音輸入等功能

.推出模型開放平臺，啟動繁星計劃布局生態(tài)：階躍星辰開放平臺目前已上線，2024年7月啟動繁星計劃，尋找多模態(tài)優(yōu)秀初創(chuàng)企業(yè)、團隊和獨立開發(fā)者，提供模型、

算力及其他配套支持，補充豐富自身應(yīng)用生態(tài)矩陣。信息來源：躍問、冒海鴨、階躍星辰及公開信息整理微信公眾號：零豎質(zhì)量繁星計劃我們支持“

星

火

燎

原

”一十開

月snE*mn

行的融力，產(chǎn)品曝光.u■對接合作免費工位RPM/TPM

支

持.目前優(yōu)秀案例包括胃之書

APP

、

野貓子工作室這秤三分的的茶

，

是多少這杯三分約紅茶野奇保奶茶嶺卡路里大約

在349大卡左右。這個數(shù)酒可能會因具體的制作

過程和配料郁潛不闊，想總體來誠，一秤三分的

紅第瑪n

的

和

對

流.

如

世

在

飲曲或減肥常武可能前話當經(jīng)的

的貓入量理解方面：目前已支持拍照識圖、語

音輸入、pdf、docldocx、excel、csv

、png、ipg等多格式文檔解析。生成方面：可以快速完成內(nèi)容創(chuàng)作、邏輯

推理

、

數(shù)據(jù)分析等任務(wù)

。功能方面：優(yōu)化了聯(lián)網(wǎng)搜索、文檔

解析、推理速度等性能，最新推出

瀏

覽

器

插

件

?？蓪崿F(xiàn)長篇網(wǎng)頁、復(fù)雜文檔理解

及

總

結(jié)htp/hkchinaxgoecnacto/1000127GS22109ostestml

根據(jù)這個政，我

哪天姆究成當年的算

?根據(jù)常理供的國家糧務(wù)總局政量潔理庫.

即區(qū)家枕務(wù)總場關(guān)于辦理2023年陛個人相所得廠M

法的公善，2023年

CM辦

時

間為2024年3月1日里6月30B.

回

此，

需

性

需

在2024年4月20日之前究成去的CW用戶在冒泡鴨上可以根據(jù)自身偏好打造智能體和劇情。冒泡鴨支持用戶自定義智能體的形象

、

個性

、

聲音

、

記憶

、

背景經(jīng)歷等

。娛樂陪

伴應(yīng)

用

—

—冒

泡

鴨智能助手應(yīng)用—

—躍問可實現(xiàn)拍腳問答、圖片理解項日落地m免費Tokens技術(shù)支持上新體驗階躍星辰——融資&團隊：團隊聚集學(xué)術(shù)大牛，大模型相關(guān)經(jīng)驗豐富

insights融資進展神秘，資方選擇審慎：成立至今未正式披露融資情況，據(jù)傳僅在2023年11月完成過一輪融資，投資方或包括紅杉中國、啟明創(chuàng)投、五源資本，據(jù)量子位報

道，2024年6月階躍星辰正在接洽新一輪估值20億美元的新融資，阿里巴巴在投資機構(gòu)名單中。研發(fā)實力突出，人才引力強，據(jù)傳背景深厚：有深厚研發(fā)技術(shù)積淀，數(shù)據(jù)算力經(jīng)驗豐富，CEO

技術(shù)強，有大團隊經(jīng)驗，核心團隊聚集來自微軟、谷歌、字節(jié)、臘訊、

曠視等公司相關(guān)人才，成立短短一年，規(guī)模已達150人，先后吸引多位行業(yè)大牛加入。據(jù)傳有著名基金管理合伙人、獨角獸公司創(chuàng)始人、微軟華人大佬等支持。信息來源：階躍星辰及公開信息整理微信公眾號：零豎質(zhì)量●西安交通大學(xué)與微款亞洲研究院博士生聯(lián)合培養(yǎng)項目，師從孫劍和何愷明，博士學(xué)位●曾在微軟亞洲研究院工作，陰間與何愷明、孫劍、任少卿共同完

成了著名的AesNet,負責底層框架和編碼，2016獲得CVPR

最

佳論文獎，2023未來科學(xué)大獎數(shù)學(xué)與計算機科學(xué)獎”,谷歌學(xué)

術(shù)被引用數(shù)已超23萬●曾在曠視工作，與周昕宇共同完成移動端高效卷積神經(jīng)網(wǎng)絡(luò)ShufHeNet●天津大學(xué)博士、中國科學(xué)技術(shù)大學(xué)、西安交通大學(xué)兼職博導(dǎo)，天津大

學(xué)兼職教授●曾任微軟亞洲研究院MSRA

資深首席研究員，自然語言計算團隊研究經(jīng)理，主要從事自然語言處理、多模態(tài)智能、代碼智能、機器推理等

研究，多項研究成果成功應(yīng)用到微軟A產(chǎn)品中，擔任微軟NOVA系

列模型家族項目研究組長和導(dǎo)師●谷歌學(xué)術(shù)被引用次數(shù)逼近1.9萬，與CEO

姜大昕合著過44篇論文●細約布法羅州紐約州立大學(xué)計算機科學(xué)博士，南洋理工大學(xué)擔任

助理教授●在機器學(xué)習(xí)、數(shù)據(jù)挖掘、自然語言處理、生物信息等領(lǐng)域有豐富經(jīng)驗●前微軟全球副總裁，微軟亞洲互聯(lián)網(wǎng)工程院STCA

首席科學(xué)家，在微軟附間主導(dǎo)多個人工智能項目，曾為Microsot

365.Azum.智

能語音助手

Cortana等核心產(chǎn)品提供關(guān)鍵技術(shù)支持●畢業(yè)于美國加州大學(xué)圣芭芭拉分校●營任微軟研究院研究員，曾任職字節(jié)跳動，負責公司Al

基礎(chǔ)設(shè)施與

基礎(chǔ)Al

框架，積累了萬卡集群的搭建經(jīng)驗，曾任谷歌高級主管，直接支持Anthropic●山東大學(xué)本科，上海交通大學(xué)計算機碩士，南洋理工大學(xué)博士●

曾任訊擔任研究總監(jiān)，曠視Detection

組長，負責檢測、分割、跟蹤，骨架、動作行為等方面的研究以及算法落地工作，后在

PCG

光影研究室從事CV相關(guān)算法及技術(shù)研究●

中科大和MSRA

聯(lián)合培養(yǎng)博士●微軟必應(yīng)引擎核心搜索團隊前負責人，負責利用數(shù)據(jù)挖狂和NLP

算法優(yōu)化索引和搜索質(zhì)量●普開發(fā)全球高質(zhì)量站點的自動挖搖算法并用于索引和排序MEGVII

曠

視

Tencent姜大昕創(chuàng)始人、

CEO俞

剛主任研究員朱亦博系統(tǒng)負責人焦斌星數(shù)據(jù)負責人張祥雨段

楠百川智能——模型：開源生態(tài)突出，模型矩陣全面

insights開源模型生態(tài)建設(shè)表現(xiàn)突出：百川智能成立于2023年4月，同年6月發(fā)布國內(nèi)第一款開源模型，同年8月首批通過了生成式人工智能備案，是名單中最年輕的公司；

百川大模型支持LLAMA

熱插拔，兼容及可拓展性好，開源后下載量領(lǐng)先，累計下載超700萬次。搜索引擎技術(shù)基因，先天優(yōu)勢：自2023年4月10日成立以來，持續(xù)迭代基座大模型，最新

一代基座超干億參數(shù)大模型

Baichuan4在SuperCLUE評測中處于國內(nèi)大模型第一梯隊，在知識百科、長文本、生成創(chuàng)作等文科類中文任務(wù)方面，表現(xiàn)優(yōu)于國外大模型。Modes

10Kbuichunire/Baichuan2-78-ChatTtnincd

四baichuan-ine/Bafchuan2-138-ChutTtCn

d041taichuan-inc/aichuan2-79-asew

2mbaichuan-inc/Laichuar2-138-Dann

wdbk

-■baichuanire/Bafchuan2-138-Chat-4bitsT

ncn

4Baichuan

開源模型hugirgface8

月月下載量SSot

outha

baichuan-ine/Baichun-8TatGmetan-Udidbaichan-in/Baichn-139-CutTetGmeston

013Abaichuan-1ng/Baichuan-137-Basefeam

.22:baichuan-ine/Daichuan2-78-Oat-4bits

benIbaichuan-ine/Baichuan2-78-Intermediate-C

pdidb2021美文通用美文通用中文通用中文通用數(shù)學(xué)推理MMNUNMBench-ENCMMMUMMBench-CNMathVistaGPT4V56.882.142.580.156.5Baichuan452.281344.379948Claude3-sonnet47467863.745Lva-NeXT-7286480.5466GeminiPro47.97527446.5百川智能

Baichuan4在MMMU,MMBench-EN

、CMMMU等多個國際主流Benchmark

上

成

績

接

近GPT4V.百川智能Baichuan2系

列

開

源

模

型

在

開

放

社

區(qū)

公

開

累

計

下

載

量

已

經(jīng)

突

破

萬次，最新huggingface月下載量超6萬次開源橫型下載量2024.05發(fā)布Baichuan4,并推出智能助手應(yīng)

用百小應(yīng)2023.07推出130億參數(shù)大

模型

Baichuan-1382023.09發(fā)

布Baichuan2大

模

型，開放API

接

口2024.01發(fā)布超千億參數(shù)大語

言模型Baichuan

32023.08發(fā)布530億參數(shù)模型，同步啟動干億參數(shù)模型練2023.06推出70億參數(shù)大模型

Baichuan-7B信息來源：百川智能、huggingface及公開他息整理最新閉源基座大模型主流Benchmark2023.04百智能成立2024.07聯(lián)合天津大學(xué)推出Sbyl

Syslem

Agem

柜架，GAA排名苑一成績

百川智能——應(yīng)用：ToC上線生產(chǎn)力應(yīng)用，發(fā)力Al生命醫(yī)療

insightsToC

布局生產(chǎn)力應(yīng)用，發(fā)力Al生命醫(yī)療方向：百川智能于2024年5月發(fā)布了ToC

生產(chǎn)力助手百小應(yīng)，主打多輪搜索能力。另外，還在2024WAIC上發(fā)布了A健康顧問應(yīng)用，具備豐富醫(yī)學(xué)知識，高度擬人，可連續(xù)交互并給出診斷建議，百川智能計劃在2025年實現(xiàn)L3級

別AI醫(yī)療。ToB

以

MaS

平臺為業(yè)務(wù)重心：百川智能在

ToB

方向推出

MaS(Model

service)+AaaS(Agent

service)服

務(wù)

，Maas為重心，分旗艦版和專業(yè)版，

AaaS服務(wù)已開啟公測，API

調(diào)用能力接近OpenAl。人私更置罐場綠

和

研

究

眼對比理四年能州K寧a009

或候深，閱讀》■網(wǎng)面o

人s或碗深讀，讀網(wǎng)面m8.幅網(wǎng)

寧

江n或邪，E們在過的

四理

了ar

長，下面鴻時比兩始200年202s*mso

以經(jīng)里葉地解En

的經(jīng)濟

覺從中可

以

看出

ncoP

在

過四

*所

長

。not?ns780262

元00anmeAKE人

租

n人機實Dn

Corpte

ractos,簡棒WCO

一個

計

機

科

蘋

。o

理學(xué)。

。說計學(xué)ss

個學(xué)科ra性，±

■

研

覺

人

計招系就之間的交直方式，交直過程以最受顯監(jiān),以

的人機更置墻經(jīng)畫作研度：一

、人眼獎1.CDt

ACoeanseAppaciwb

g)Mm

這本em公

工r◎百小應(yīng)APP斕頁面等級百川智能劃分AI醫(yī)療水平L5完全白動化健康

管理A能夠管理明者的整個健康程，從預(yù)防、診斷到

治療，無需人工干預(yù)L4高度白動化診療A可以在大多數(shù)常見疾病中獨立做出診斷和治療決

策，僅復(fù)雜案例需要醫(yī)生介入L3條件白動化診療A可以在特定條件下白動推薦治療方案，但在關(guān)鍵

決策時需要醫(yī)生端認L2多模態(tài)輛助AI可以整合多種數(shù)據(jù)原(如病歷、影像實驗室結(jié)

果),提供更全面的軸動信息L1輔助診斷AI可以提供數(shù)據(jù)分析活圖像識別等單一功前的輔助，

幫助醫(yī)生做出更好的決策L0傳統(tǒng)醫(yī)療醫(yī)生負責所有的診斷和治療決策，沒有AI介入百川智能ToC

應(yīng)用百小應(yīng)主打多輪搜索功能，相比單輪

按索，在市場調(diào)研、

產(chǎn)業(yè)分析等復(fù)雜場景下，能更有效地獲取專業(yè)深度信息，

搜素結(jié)果可結(jié)構(gòu)化呈現(xiàn)，還能實現(xiàn)網(wǎng)

頁鏈接、

PDF、ward

文檔長文理解

分析

.輸船

(

C寧

化

R2015780.261045202060011240604795241404920227251164522023m164578發(fā)

力

N醫(yī)

療Al教育Al供應(yīng)鏈AI

法

律Al醫(yī)療百川智能計劃在2025

年

實

現(xiàn)L3

級

別AI

醫(yī)

療To

B業(yè)

務(wù)ToB云服務(wù)信

息

來

源

：百

川

智

能、

蝶

境

內(nèi)

測

及

公

開

信

息

整

理時間輪次金額估值投資機構(gòu)2024.07A50億人民幣三七互娛、中金資本、亞投資本、

信雅達、卓源亞洲、好未來，小米

集團、慕華資本、深創(chuàng)投、紅點中國、物投資、阿里巴巴、順為資本、上海人工智能產(chǎn)業(yè)股權(quán)投資基

金合伙企業(yè)、臨港科創(chuàng)投、北京市人

工智能產(chǎn)業(yè)投資基金、順禧基金，中

貝通信集團股份有限公司2023.10A3.5億美元19億美元阿里巴巴、腦訊投資、小米集團、

心資本、愉悅資本、金山軟件、順

為資本、好未來，清華控股、深創(chuàng)

投、紅點中國、慕華科創(chuàng)、淡策資

本、卓源亞洲、眾為資本2023.04天使輪5000萬王小川

百川智能——融資&團隊：A

輪融資已完成，搜狗核心班底再創(chuàng)業(yè)

insights已完成A輪融資，金額大、估值高：截至2024年7月，百川智能已完成A

輪融資，7月最新一輪融資規(guī)模50億人民幣，資方包括阿里巴巴、騰訊投資、小米集團等

機構(gòu)以及北京市人工智能產(chǎn)業(yè)投資基金、上海人工智能產(chǎn)業(yè)投資基金、深創(chuàng)投等國資基金。目前已經(jīng)以200億估值開啟B輪融資。王小川帶隊，拱搜狗核心班底再創(chuàng)業(yè)：作為搜狗前任CEO,

王小川是大模型創(chuàng)業(yè)六小強中唯一具備創(chuàng)業(yè)并上市經(jīng)歷的創(chuàng)始人，他帶領(lǐng)搜狗核心班底創(chuàng)立百川智能，團

隊技術(shù)實力不容小覷，由強系統(tǒng)性工程經(jīng)驗人才，語言模型認知優(yōu)勢的研發(fā)人員兩部分組成?！衽c清華大學(xué)共建天工智能計算研究院，任聯(lián)席院長●

曾任搜狗公司CEO、董事、搜現(xiàn)高級副總裁兼CTO,帶領(lǐng)搜狗在美國紐交所上市焦

可聯(lián)合創(chuàng)始人、產(chǎn)品負責人●清華大學(xué)計算機系本科，中科院計算所碩士王小川創(chuàng)始人、

CEO●清華大學(xué)計算機科學(xué)與技術(shù)專業(yè)，擁有工學(xué)學(xué)士、工學(xué)碩士、工程博士及EMEA

學(xué)

位洪

濤聯(lián)合創(chuàng)始人、商業(yè)負責人●清華大學(xué)電子工程系本科，長江商學(xué)院EMBA百川智能融資歷程團隊成員●清華大學(xué)計算機系博士，浙江省高考狀元，清華大學(xué)天工智能研究院副院長●曾任授狗公司000,負責運營及按索事業(yè)部，人工智能激育公司葡萄智學(xué)創(chuàng)始人兼CEO茹

立

云聯(lián)合創(chuàng)始人、運營負責人●曾任智融集團創(chuàng)始人兼CEO、百度高級產(chǎn)品經(jīng)理●

曾任授拘科技

MO、

睡訊

PCG

海業(yè)化GM微信公眾號：零豎質(zhì)量信息來源：百川智能及公開信息整理Tencent零一萬物——模型：Al

Infra

技術(shù)領(lǐng)先，模型開閉源并重

insights領(lǐng)先Al

Infra技術(shù)節(jié)約訓(xùn)練成本：構(gòu)建數(shù)干卡GPU

集群進行訓(xùn)練、調(diào)優(yōu)和推理，提高數(shù)據(jù)有效參數(shù)量，以及使用的高質(zhì)量數(shù)據(jù)的密度，以構(gòu)建連續(xù)、可控、科學(xué)化

的訓(xùn)練能力。目前，零一萬物具備全棧A

Infra能力，在國內(nèi)率先端到端實現(xiàn)全球先進

FP8訓(xùn)練框架，模型取得國際SOTA,閉源開源并重：2023年11月首次發(fā)布Y系列大模型，涵蓋閉源和開源，2024年5月閉源模型VLarge

在測試集LMSYS中成績位列國產(chǎn)第一，

以干億參數(shù)尺寸追齊硅谷巨頭萬億模型。開源矩陣目前已經(jīng)推出多模態(tài)模型、代碼模型及通用模型等。零一萬物致力于通過自主創(chuàng)新架構(gòu)加速追趕OpenA.信息來源：零一萬物、零一萬物大模型開放平臺及公開信息整理微信公眾號：零豎質(zhì)量Yi-LargeGlobalSOTA

LLMMr

Intnersnt2577

7紀

23校4

0412

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

DeepSeek大模型分享與展望-清華大學(xué)

文檔簡介

溫馨提示

最新文檔

評論

DeepSeek大模型分享與展望-清華大學(xué)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔