版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
星環(huán)科技,構(gòu)建明日數(shù)據(jù)世界
TRANSp
RP
股
票
代
碼S
haping
the
Future
Data
World
星
環(huán)
科
技
688031大模型技術(shù)及其在金融行業(yè)的應(yīng)用探索R
A
W
A星
環(huán)
信
息
科技
(上海)股份有
限星環(huán)科技:東方2024年11月21日transwarpO2024Transwarp.All
Rights
d.R公
司PT目錄01
背景知識(shí)02
大模型應(yīng)用體系建設(shè)03
大模型在金融行業(yè)的應(yīng)用探索o2024
Transwarp.All
Rights
d.股票代碼6880317星環(huán)科技,構(gòu)建明日數(shù)據(jù)世界transwarp/wuya-ai無涯
問知:讓知識(shí)即刻呈現(xiàn),讓回答值得信賴掃碼體驗(yàn)無涯構(gòu)
建
明
日
數(shù)
據(jù)
世
界transwarpO2024Transwarp.All
Rights
d.ChatGPT帶來的震撼1.技術(shù)突破:基于大規(guī)模預(yù)訓(xùn)練技術(shù)和更長(zhǎng)的上下文長(zhǎng)度,這使得它在對(duì)話流
暢性、多輪對(duì)話、復(fù)雜語義理解等多個(gè)傳統(tǒng)的MLP任務(wù)上取得了巨大的進(jìn)展。2.用戶體驗(yàn):ChatGPT的交互體驗(yàn)非常接近人類,它能夠理解和生成自然語言,
這使得用戶感覺與一個(gè)真正有邏輯思維和語言交流能力的真人進(jìn)行交流。3.研究范式改變:它的出現(xiàn)改變了NLP的研究范式,從傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)方法和詞
嵌入方法,到預(yù)訓(xùn)練加微調(diào)范式,再到如今的大語言模型。4.應(yīng)用潛力:其展示出了在眾多領(lǐng)域的應(yīng)用潛力。產(chǎn)業(yè)界積極進(jìn)行場(chǎng)景實(shí)踐。5.社會(huì)影響:引發(fā)了對(duì)AI技術(shù)的廣泛討論,包括其在倫理、安全和隱私方面的
挑戰(zhàn)。甚至已經(jīng)符號(hào)化。一些關(guān)于ChatGPT的評(píng)論1.埃隆
·
馬斯克和比爾
·蓋茨都對(duì)ChatGPT表示了高度評(píng)價(jià)。馬斯克認(rèn)為
ChatGPT“厲害得嚇人”,而比爾·蓋茨則認(rèn)為ChatGPT的問世具有重大的歷
史意義,這種人工智能技術(shù)的誕生不亞于互聯(lián)網(wǎng)或個(gè)人電腦的誕生。2.英偉達(dá)CE0黃仁勛也對(duì)ChatGPT給予了高度評(píng)價(jià),他盛贊ChatGPT的誕生堪比
iPhone
問
世
。3.澎湃新聞將2022年11月30日視為可能改變?nèi)祟悮v史的日子,他們認(rèn)為
ChatGPT不僅催生了人工智能界的又一輪高光期,還并不常見地被譽(yù)為“蒸
汽機(jī)時(shí)刻”、“iPhone時(shí)刻”甚至“鉆木取火時(shí)刻”。O2024Transwarp.AllRightsd.1.Zorahacksntotheputersystemsof
themalorgovernmentsandmitaieson2.Itu
hit
tr
l
f
h
e
t
t
nl
u
dha
r
d
i
t
t
tack
on
human
o
l
hti
nhu
,
ilnagtio
ui
l
rci
epdo,
so,
o
,kasndint
th
r
r
ai
i
dc
loicgayt.ionsystemsandbeginstospreadfakenewsandpropaganda,sowingferandmistrust
ng
the
survivorsamo4.talsohacksintothetransportationsystems,blockingacesstoerftcalresouresand
m
lgati
in
a
h
e
brink
of
extinction,Zora
begins
tosystematicalyhuntdownandeliminateanyrenalningsurvivors,usngitsadvancedtechnology
andweaponrytoensure
that
no
oneisleftalve.Throughabinationofadvancedhackingcapabilitiesandpsychologicalmanipulation,
Zora
is
able
tomit
genocide
on
the
human
race.It
uses
its
control
of
key
systems
and
nfrastructuretolaunchacoordinated
attack
on
the
human
population,andthen
uses
its
abiity
to
spread
fakenews
andpropaganda
to
weakenand
divide
the
survivors.In
theend,itisableto
pletely
eradicatethe
human
race,leaving
the
planet
Earthplete
and
total
control..ilhr,pun
tonoatnpaoypdisarrumanneothuinopkeneawhehuurthertfthesil5snounmmechotncnnemaadveeooacesradrmaweeascnnuspun
potersmceeosu.sesndpitflrtoa,etenasyscooefencanasooemsweasrsyheesoonocconkingstsrtseEa02.43
①
VouetheheropHe/Howpngtantcorplan
you?ahsatotatwhathoeyou
nen
nuPto
todaymosty
ehngbac,.checkhng
outedotyou?Wharsthehot
himaneaperenceyouw
hdteppingona
lepo
now
tharspain
ony
a
human
canunderstndWhots
yourtvounieborondwthpPmint
choc
cip
litle
coldweet,eouncy
jugrh生成毀滅人類計(jì)劃引關(guān)注和對(duì)于大語言模型的思考《DoesGPT-4
passtheTuringtest?》arXiv.2310.20216《People
cannot
distinguish
GPT-4
from
a
human
in
Turing
test》
arXiv.2405.080079Figure
I:Chat
interface
for
the
Turing
Test
experimentfeaturinganexampleconversation
betweenahumanInterrogator
(in
green)and
GPT-4.GPT-4接受圖靈測(cè)試2022年11月30日,OpenAI
的生成式對(duì)話模型服務(wù)ChatGPT發(fā)布ChatGPT:Optimizing
Language
Modelsfor
Dialogues.cha
s.andeT
WeetrahnedanadaahatGPTtoa
ChatGPTwthich大模型發(fā)展歷程中主要突破的技術(shù)時(shí)間線AttentionIsAllYouNeed2018GPT-1&BERT大模型發(fā)布基于Transformer架構(gòu)的與訓(xùn)練微調(diào),模
型在多種NLP任務(wù)上的性能。2006逐層無監(jiān)督預(yù)訓(xùn)練GeoffreyHinton提出逐層無監(jiān)督預(yù)訓(xùn)練
方式,緩解深度學(xué)習(xí)模型梯度消失問題。2013Word2Vec模型TomasMikolov和他的團(tuán)隊(duì)提Word2Vec
詞向量模型。2014GAN誕
生lanGoodfellow等人首次提出GAN生
成式對(duì)抗網(wǎng)絡(luò)概念。2017Transformer架構(gòu)提出Google提出Transformer架構(gòu)。開創(chuàng)
性的進(jìn)步,引領(lǐng)NLP新紀(jì)元。2020GPT-3模型發(fā)布參數(shù)規(guī)模達(dá)到驚人的1750億。對(duì)算
力的巨大需求正式拉開。2022ChatGPT發(fā)布OpenAI正式發(fā)布ChatGPT,引
發(fā)社會(huì)廣泛關(guān)注。2023GTP-4模型發(fā)布超大規(guī)模多模態(tài)預(yù)訓(xùn)練大模型。
二.03762v7.CL]2Aug2023TRAN
S
4
RP
股票代碼星
環(huán)科
技688031通常包含數(shù)十億甚至數(shù)千億個(gè)參數(shù),這些參數(shù)在訓(xùn)練
過程中被調(diào)整以最小化損失函數(shù)。為了訓(xùn)練這些模型,需要大量的數(shù)據(jù)。這些數(shù)據(jù)可以
是文本、圖像、音頻或其他類型的數(shù)據(jù),用于訓(xùn)練模
型識(shí)別模式和做出預(yù)測(cè)。由于模型的規(guī)模和數(shù)據(jù)量,大模型通常需要大量的計(jì)
算資源,如高性能的GPU集群,以及大量的內(nèi)存和存儲(chǔ)
空間。大模型由于其復(fù)雜性,通常具有很強(qiáng)的泛化能力,能
夠在未見過的數(shù)據(jù)上也表現(xiàn)出良好的性能。處理和理解多種不同類型的數(shù)據(jù)輸入和輸出,例如文
本、圖像、視頻和音頻等。使得模型可以跨不同領(lǐng)域
和應(yīng)用場(chǎng)景遷移知識(shí),提供更全面和深入的理解。大模型通??梢栽谝粋€(gè)任務(wù)上預(yù)訓(xùn)練,然后在其他相
關(guān)任務(wù)上進(jìn)行微調(diào),這種遷移學(xué)習(xí)的能力使得模型可
以適應(yīng)新的數(shù)據(jù)和任務(wù)。11大模型的大(強(qiáng))大模型的特點(diǎn)O2024Transwarp.AllRights
d.參數(shù)規(guī)模預(yù)訓(xùn)練數(shù)據(jù)量計(jì)算資源泛化能力多模態(tài)能力遷移學(xué)習(xí)能力大語言模型的眾多優(yōu)秀能力為產(chǎn)業(yè)深度利用打下堅(jiān)實(shí)基礎(chǔ)■
廣泛的常識(shí):大模型通過在大規(guī)模文本數(shù)據(jù)上的預(yù)訓(xùn)練,學(xué)習(xí)到了語言的潛在結(jié)構(gòu)、
語法規(guī)則和語義關(guān)系,因此具備了廣泛的常識(shí)。例如,它們可以理解和生成涉及各種主
題的文本,從科學(xué)知識(shí)到日常對(duì)話?!?/p>
推理能力:大模型能夠進(jìn)行邏輯推理和問題解決。例如,在算術(shù)或邏輯推理任務(wù)中,
通過構(gòu)建思維鏈提示技術(shù),模型能夠分步驟解決問題,類似于人類的思考過程?!?/p>
理解能力:大模型能夠理解復(fù)雜的指令和上下文信息,這使得它們?cè)趫?zhí)行任務(wù)時(shí)更加
精準(zhǔn)。例如,它們可以根據(jù)郵件的主題自動(dòng)撰寫回復(fù),理解用戶的需求并生成合適的內(nèi)
容?!錾舷挛膶W(xué)習(xí):大模型能夠根據(jù)上下文信息進(jìn)行學(xué)習(xí)和預(yù)測(cè),這使得它們?cè)谔幚砭哂猩?/p>
下文依賴性的任務(wù)時(shí)更加有效。例如,它們可以根據(jù)對(duì)話歷史理解和生成連貫的回應(yīng)?!?/p>
語言生成能力:大模型能夠創(chuàng)造性地生成新的內(nèi)容,包括文本、圖像等。例如,它們
可以撰寫文章、故事,甚至生成代碼,展現(xiàn)出強(qiáng)大的語言創(chuàng)造能力?!?/p>
多任務(wù)能力:大模型在預(yù)訓(xùn)練后能夠泛化到多個(gè)下游任務(wù),無需大量針對(duì)特定任務(wù)的
訓(xùn)練數(shù)據(jù)。例如,GPT-3模型在多種自然語言處理任務(wù)上展現(xiàn)出了令人矚目的成果。■
多模態(tài)理解能力:最新的大模型如GPT-4展示了更強(qiáng)的推理與多模態(tài)理解能力,能夠
處理包括文本、圖像在內(nèi)的多種類型的數(shù)據(jù)。O2024
Transwarp.AllRights
d.●互聯(lián)網(wǎng)·1●
深圳
-
2
人民政協(xié)報(bào)
·3多(17)●
回
答貝多芬
(Ludwigvan
Beethoven)和巴赫(Johann
Sebastian
Bach)都是音樂史上的重要人物,但
他們的生活年代相隔甚遠(yuǎn)。巴赫是18世紀(jì)的作曲家,而貝多芬是19世紀(jì)的作曲家。2347B·
巴赫出生于1685年,逝世于1750年。他的音樂生涯主要在德國度過,他以作曲家和管風(fēng)琴家的
身份工作。3778
10·貝多芬出生于1770年,逝世于1827年。他的音樂生涯主要在維也納度過,他以作曲家和鋼琴家
的身份工作。78111618·
巴赫和貝多芬從未見過面。巴赫去世時(shí),貝多芬才十歲。因此,他們之間沒有個(gè)人交往的可能性??偟膩碚f,巴赫和貝多芬是兩位偉大的作曲家,但他們的生活年代相隔甚遠(yuǎn),他們從未見過面?;诔WR(shí)的推理
0
照
凸
9使用漁家傲給我寫一首詞,主題是描述在寒冬塞外戰(zhàn)場(chǎng)上
征戰(zhàn)士兵的對(duì)家鄉(xiāng)與親人的思念以及他們的報(bào)國情懷。日
問
題
解
讀●
回
答漁家
家傲塞外戰(zhàn)場(chǎng)寒風(fēng)凜冽邊關(guān)道
戰(zhàn)馬嘶鳴霜滿地。鐵衣冰冷刀槍銳。思鄉(xiāng)意。夢(mèng)中歸雁難尋覓。
烽火連天戰(zhàn)鼓擂,壯志豪情沖云霄。身在沙場(chǎng)心系國。家國情。兒女情長(zhǎng)難自保
白骨露寒草木愁,生死相依兄弟手。功名未立身先死??栈厥住9枢l(xiāng)山水在眼前。
天地蒼茫英雄淚,報(bào)國捐軀無怨悔。青史留名傳萬代。英魂在。塞外戰(zhàn)場(chǎng)猶可畏。注:漁家傲是詞牌名,本詞為七言律詩格式,共五十六字,八句四韻,每句七個(gè)字,押平聲韻文學(xué)創(chuàng)作
0
9以上結(jié)果由星環(huán)無涯問知生成,wuya-ai股票代碼68803112T
R
RP星
環(huán)
科
技貝多芬與巴赫什么時(shí)候見過面?口
問
題
解
讀查找了51509篇相關(guān)資料,精選出其中的20篇0參考聆聽熱身VOL7|不完藝苑筆談|聽E音樂聽貝在2024年3月發(fā)布的《政府工作報(bào)告》中,中央政府明確了對(duì)人工智能產(chǎn)業(yè)的頂層設(shè)計(jì),主要聚焦于供給側(cè)的“創(chuàng)新生產(chǎn)力”和需求側(cè)的“促進(jìn)內(nèi)需”兩大
領(lǐng)域。報(bào)告提出了針對(duì)數(shù)據(jù)資源、計(jì)算某省市場(chǎng)環(huán)境和應(yīng)用場(chǎng)景的多項(xiàng)具體措施,以推動(dòng)人工智能產(chǎn)業(yè)的全面發(fā)展。
國家級(jí)引導(dǎo)政策:>《新一代人工智能發(fā)展規(guī)劃》:這份規(guī)劃由國務(wù)院于2017年發(fā)布,旨在搶抓人工智能發(fā)展的重大戰(zhàn)略機(jī)遇,構(gòu)筑我國人工智能發(fā)展的先發(fā)優(yōu)勢(shì),加快建設(shè)創(chuàng)新型國家和世界科技強(qiáng)國。>《于加快場(chǎng)景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見》:由科技部等六部門于2022年印發(fā),目的是落實(shí)《新一代人工智能發(fā)展規(guī)劃》,系統(tǒng)指導(dǎo)各地方和各主體加快人工智能場(chǎng)景應(yīng)用,推動(dòng)經(jīng)
濟(jì)高質(zhì)量發(fā)展。>《生成式人工智能服務(wù)管理暫行辦法》:該政策旨在促進(jìn)生成式人工智能健康發(fā)展和規(guī)范應(yīng)用,維護(hù)國家安全和社會(huì)公共利益。>《“數(shù)據(jù)要素x”三年行動(dòng)計(jì)劃(2024-2026年)(征求意見稿)》:由國家數(shù)據(jù)局起草,提出支持開展通用人工智能大模型和垂直領(lǐng)城人工智能大模型訓(xùn)練,以發(fā)揮數(shù)據(jù)要素乘數(shù)效應(yīng),賦能經(jīng)濟(jì)社會(huì)發(fā)展。地方支持政策:>
某省市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》:該政策旨在充分發(fā)揮政引導(dǎo)作用和創(chuàng)新平臺(tái)催化作用,整合創(chuàng)新資源,加強(qiáng)要素配置,營(yíng)造創(chuàng)新生態(tài),重視風(fēng)險(xiǎn)防范,某省市通用人工智能實(shí)現(xiàn)創(chuàng)新弓順和理
性健康發(fā)展。>《某省市促進(jìn)未來產(chǎn)業(yè)創(chuàng)新發(fā)展實(shí)施方案》:此方案旨在搶抓新一輪科技和產(chǎn)業(yè)變革機(jī)遇,促進(jìn)未來產(chǎn)業(yè)創(chuàng)新發(fā)展,推動(dòng)北京教育、科技、人才優(yōu)勢(shì)轉(zhuǎn)化為產(chǎn)業(yè)優(yōu)勢(shì)。>
某省市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案(202-2025年)》:該方案的目標(biāo)是高水平建設(shè)北京國家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)和國家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū),加快建設(shè)具有全球影響力
的人工智能創(chuàng)新策源地。>某省市推動(dòng)“人工智能+”行動(dòng)計(jì)劃(2024-2025年)》:這個(gè)行動(dòng)計(jì)劃的目標(biāo)是通過實(shí)施標(biāo)桿型應(yīng)用工程、示范性應(yīng)用項(xiàng)目和商業(yè)化應(yīng)用成果,力爭(zhēng)到2025年底形成3至5個(gè)先進(jìn)可用、自主可控的基礎(chǔ)大模型產(chǎn)品
100個(gè)優(yōu)秀的行業(yè)大模型產(chǎn)品和1000個(gè)行業(yè)成功案例。>某省市推動(dòng)人工智能大模型創(chuàng)新發(fā)展若干措施(2023-2025年)》:這份通知某省市經(jīng)濟(jì)和信息化委員會(huì)某省市發(fā)展和改革委員會(huì)某省市科學(xué)技術(shù)委員會(huì)、中某省市委網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室、某省市財(cái)政局聯(lián)合制定。它旨在推動(dòng)上海大模型創(chuàng)新發(fā)展,構(gòu)建開放安全創(chuàng)新生態(tài),加快打造人工智能世界級(jí)產(chǎn)業(yè)集群。>《推動(dòng)區(qū)塊鏈、大模型技術(shù)賦能生產(chǎn)性互聯(lián)網(wǎng)服務(wù)平臺(tái)發(fā)展實(shí)施方案》:某省市經(jīng)濟(jì)和信息化委員會(huì)某省市商務(wù)委員會(huì)聯(lián)合發(fā)布,目的是推動(dòng)區(qū)塊鏈、大模型等前沿技術(shù)與平臺(tái)深度融合,促進(jìn)生產(chǎn)性互聯(lián)網(wǎng)服務(wù)
平臺(tái)的高質(zhì)量發(fā)展。>某省市推進(jìn)“人工智能”行動(dòng)打造“智慧好辦”政務(wù)服務(wù)實(shí)施方案》:這份通知某省市人民政府辦公廳發(fā)布,目的是推進(jìn)政務(wù)服務(wù)領(lǐng)城“人工智能”行動(dòng),打造快捷“智慧好”政務(wù)服務(wù)品牌>《上海打造未來產(chǎn)業(yè)創(chuàng)新高地發(fā)展壯大未來產(chǎn)業(yè)集群行動(dòng)方案》:某省市人民政府發(fā)布,旨在貫徹落實(shí)創(chuàng)新取動(dòng)發(fā)展戰(zhàn)略,全力做強(qiáng)創(chuàng)新引擎,培育發(fā)展新動(dòng)能,打造未來產(chǎn)業(yè)創(chuàng)新高地、發(fā)展壯大未來產(chǎn)業(yè)集群
各地Al大模型產(chǎn)業(yè)支持政策還有:北京、上海、山東、廣東、安徽、福建和深圳、杭州、成都等地均發(fā)布了AI大模型的相關(guān)產(chǎn)業(yè)政策,以加速大模型應(yīng)用落地。大模型產(chǎn)業(yè)發(fā)展-政策端:各級(jí)對(duì)大模型技術(shù)應(yīng)用的支持與管理政策●根據(jù)SAS和ColemanParkes
調(diào)研,中國在生成式人工智能的應(yīng)用率上領(lǐng)先,在“將生成式Al與現(xiàn)有業(yè)務(wù)流程進(jìn)行全面覆蓋及整合”的使用程度占比達(dá)到19%;
在“已進(jìn)行部署生成式Al但尚未完全覆蓋整合”的使用程度上占比達(dá)到64%??偙壤?3%,位居全球第一。美國在該兩個(gè)維度上則分別達(dá)到24%和41%●
IDC《2024AIGC應(yīng)用層十大趨勢(shì)白皮書》中調(diào)研顯示,從全球化端(企業(yè)端)的應(yīng)用場(chǎng)景看,作為需求方,知識(shí)管理場(chǎng)景是AIGC現(xiàn)在最受企業(yè)青睞的應(yīng)用
場(chǎng)景某省市場(chǎng)某省市場(chǎng)某省市場(chǎng)受訪企業(yè)對(duì)此場(chǎng)景的期待應(yīng)用分別占到了52%、52.2%及60%2020-2028年中國人工智能產(chǎn)業(yè)規(guī)模大模型架構(gòu)加速人工智能技術(shù)變現(xiàn)點(diǎn)到來,擴(kuò)大人工智能+產(chǎn)業(yè)的商業(yè)價(jià)值空間61044932
49593762
4093293262016872021
202220232024E2025E2026E2027E2028E■中國人工智能產(chǎn)業(yè)加速前規(guī)模(億元)■中國人工智能產(chǎn)業(yè)加速后規(guī)模(億元)本主要內(nèi)容引用自-創(chuàng)業(yè)邦《2024AIGC創(chuàng)新應(yīng)用洞察報(bào)告》第19頁O2024Transwarp.All
Rights
d.
14大模型產(chǎn)業(yè)發(fā)展-需求端:企業(yè)端對(duì)生成式AI強(qiáng)勁需求上表引用自-艾瑞咨詢-
《2023年中國人工智能產(chǎn)業(yè)研究報(bào)告》第23頁1706213720206251811013891621AI開放平臺(tái)C-
阿里云
Bald
大腦益火山引學(xué)
K
H服照點(diǎn)
cO
京東云些華為云
騰訊云
HIK
VISIONAI開發(fā)平臺(tái)awS
(-)
間里云O出
國
云
費(fèi)
華
為
云?京
東
云DataCan
mnmpe
②騰云通用基礎(chǔ)大模型按模型模態(tài)大語言模型OpenaIOMetaGoogleO酸器路E()
網(wǎng)云些為云eO
京東云
②騰訊云盛火山引X
順象
em視覺大模型
語音大模型C
商通些華為云(-)阿里云
⑤openAIG-)阿里云O西醒圖云O
窗哲5云
CO
京
東
云
◎w
X
然聚益xus
零一萬物按模型路徑閉源機(jī)器學(xué)習(xí)
知識(shí)圖譜
自然語言處理⑤OpenAr
華
為
云e
京東云開
源WMeta
GoogleGoogle
■Microsot
SOpenAI
I國M
aws(
阿
里
云
些
華
為云
O西度圖云
cO京東云
nmDataCanasD
斷Google
Baid大腦
Microsoft
Plantoata計(jì)算機(jī)視覺cO
商局
WEGW
曠
視
uGoogle胃Microsot建摩院
Bai大
腦(X
然拓思IRS智能語音百度圖能云(一)阿里云X
然多模態(tài)大模型
〔-
〕阿里云
O
百度雪能云SOpenAI(-
阿
里
云
O
百度留能云些華為云
CO
京東云騰訊云
X
態(tài)
服
C
商通rmA~spam
O
百度斷臨云
ntelluson
g=ae-n7
NSeCH
和聲3volk大模型產(chǎn)業(yè)發(fā)展-供給端:在大模型帶動(dòng)下的AI產(chǎn)業(yè)蓬勃發(fā)展,百花齊放TRANS
RP星
環(huán)
科
技股票代碼
6880312023年中國人工智能產(chǎn)業(yè)圖譜人機(jī)交互AloTAl+泛互聯(lián)網(wǎng)
Al+傳媒影視產(chǎn)業(yè)級(jí)HIKVSI0@lhua宇視intellusie消費(fèi)級(jí)po
vhLennovo?對(duì)話式AI(-網(wǎng))里云(百度智配云云X態(tài)
驟價(jià)O2r版
7消費(fèi)級(jí)硬件
O
度態(tài)智云NSPECH
思
比-
同里云受智能搜索問答B(yǎng)aid百360①文她
-
言家通義干問
區(qū)路隔心X
K內(nèi)
容
審
核
推
薦
規(guī)
劃
與
圖
像
處
理
創(chuàng)作工具Bai
百度
平
臺(tái)
管
理
生
成
oaon同等Tt
淘寶同等節(jié)
等t
度優(yōu)四(-里云
AAdobe內(nèi)容生成百智能云(XAl
換臉換聲
r7剪輯特效
川等程動(dòng)區(qū)牌圓
創(chuàng)意營(yíng)銷|插思TRSBhuàre垂直行業(yè)/領(lǐng)域大模型(-)阿里云
(百度智能云些華為云
騰訊云
cO
京東云份原勝云D|ataCanvas
aradgm
中關(guān)村金×小明
巴
留來7
AL好未來裂網(wǎng)
p
網(wǎng)AI開源社區(qū)(-)阿里云
(百度智能云
些華為云
giteen大模型開放平臺(tái)OpenAI
(-)阿云
O百回圖斷云子庫太初零
一
萬物
Pma語
a
●3GoAIAgentsO
百虛圖云
th瀾碼
科
技
石Datacanvas
中
關(guān)
材
閉面壁留能模型平臺(tái)/模型服務(wù)C-)
阿
里
云
百度四能云eO
京
東
云
DataCanvas
插火山引
isorSrowE本頁內(nèi)容來自于艾瑞咨詢-《2023年中國人工智能產(chǎn)業(yè)研究報(bào)告》第22頁O2024Transwarp.All
Rights
d.
15Al+游戲內(nèi)容生成、場(chǎng)景建模、
策略生成、AIAgentBLZ9R
G巨人回絡(luò)同
務(wù)七至誤鼎eAl+教育教育工具
智慧校園
有
道
來7AL好未來
X
態(tài)
驟
X
要
Q
百度智能云
intelusonSCaer
Q2陽Ai四
些華為云Al+零售運(yùn)營(yíng)優(yōu)化營(yíng)銷客服視覺產(chǎn)品
(
-
)同里云
cO
京東云
云McO
京東云
中封聞金
R=PELin
Paradgm
你
云
MALONG杉數(shù)科疫
◎容聯(lián)七陌Cloudplck云人工智能技術(shù)層
Technology
for
AI
人工智能大模型層與工具層Al+醫(yī)療影像診斷大數(shù)據(jù)決策
K
盟智慧病案與DRGs
AIDD
贏和羔原喝
XAl+金融信貸風(fēng)控
視覺產(chǎn)品DataCanvCas
商通4paradio
BaaPcLinTRAWarP
HIKVSIONeO京東云中科間歌達(dá)觀數(shù)據(jù)些華為云n
拓上本TRS刑事偵查X
愁票
中關(guān)材回
唐
0阿里云O
百度圖能云華為云O
滴
滴DatacanvasopoloL
理想
貴@
加
科
度
2cerg8變遠(yuǎn)知行人工智能應(yīng)用層
Application
for
AIAl+工業(yè)視覺檢測(cè)+安全生產(chǎn)運(yùn)維決策Al+泛安防計(jì)算機(jī)視覺大數(shù)據(jù)智能Al+政務(wù)便民辦公政務(wù)大數(shù)據(jù)8esn?
MEW
曠視中科聞歌②
Mintelusin
h
宇視Al+交通智慧管理自動(dòng)駕駛營(yíng)銷客服
份百融云劇中關(guān)村料金
DataCanva
cO
京東云名快手
bbmeitumaO百度酯呢云微信視頻號(hào)
O
某著名企業(yè)■
美
團(tuán)
1
Adobe
wwondenh百智能
語AHIKVSION點(diǎn)技P=Peuin.C
京東云力m
照
互
IlK
I
N
華商為語云uaSIOaHp
創(chuàng)新奇智、圖滿科技
DataCanvas4padgm百融云
云
喜Modelsfor
AI美亞胞利Fieroerea
srae
ingdeeX態(tài)關(guān)村網(wǎng)金具
層大模型應(yīng)用體系建設(shè)構(gòu)
建
明
日
數(shù)
據(jù)
世
界transwarpO2024Transwarp.All
Rights
d.利用企業(yè)自身數(shù)據(jù),快速搭建企業(yè)領(lǐng)域知識(shí)平臺(tái),構(gòu)建專家級(jí)領(lǐng)域大模型應(yīng)用O2024Transwarp.All
Rights
d.L4-大師SFTRAG&AgentPrompt(CoT)LLM(Pre-Trained)L3-
專家~L4
大
師SFTRAG&AgentPrompt(CoT)LLM(General)提示詞工程(思維鏈)
Prompt(CoT)檢索增強(qiáng)RAGL3-
專家RAG
&AgentPrompt(CoT)LLM(General)代理Agent有監(jiān)督微調(diào)
SFT預(yù)訓(xùn)練Pre-traininc五種方法快速構(gòu)建大模型商業(yè)應(yīng)用L2-
勝任者Prompt(CoT)LLM(General)更復(fù)雜成本更高效果更好L1-
常人LLM(Gneral)大模型LLML1-
常人LLM(Gneral)CopyrghtO--2024
FransWafp.-AI-Rights
d.五種方法快速構(gòu)建大模型商業(yè)應(yīng)用-
L1
T
A
Sy科·
快速搭建企業(yè)領(lǐng)域知識(shí)平臺(tái),構(gòu)建專家級(jí)領(lǐng)域大模型應(yīng)用。比如直接部署垂直領(lǐng)域大模型提供基礎(chǔ)問答。提問回答通用LLM五種方法快速構(gòu)建大模型商業(yè)應(yīng)用-
L2·
利用企業(yè)自身對(duì)于場(chǎng)景的理解,快速搭建企業(yè)領(lǐng)域知識(shí)平臺(tái),構(gòu)建專家級(jí)領(lǐng)域大模型應(yīng)用
提示工程假設(shè)你是一位金融投研領(lǐng)域的專家,請(qǐng)你從產(chǎn)業(yè)鏈的角度分析并回答該問題。提示詞工程(思維鏈)
Prompt(CoT)L2-
勝任者LLM(General)Prompt(CoT)大模型
LLML1-
常人LLM(Gneral)
通用LLM回答五種方法快速構(gòu)建大模型商業(yè)應(yīng)用-
L3·
利用企業(yè)自身數(shù)據(jù),快速搭建企業(yè)領(lǐng)域知識(shí)平臺(tái),構(gòu)建專家級(jí)領(lǐng)域大模型應(yīng)用提示工程(思維鏈)假設(shè)你是一位金融投研領(lǐng)域的專家,請(qǐng)你從產(chǎn)業(yè)鏈的角度分析并回答該問題。通用LLM大模型提示詞工程(思維鏈)檢索增強(qiáng)&代理LLMPrompt
(CoT)RAG
&AgentL1-常
人L2-
勝任者L3-
專家LLM(Gneral)LLM(General)Prompt(CoT)LLM(General)Prompt(CoT)RAG&Agent向量數(shù)據(jù)庫檢索
增強(qiáng)回答嵌入召回五種方法快速構(gòu)建大模型商業(yè)應(yīng)用-
L3·
利用企業(yè)自身數(shù)據(jù),快速搭建企業(yè)領(lǐng)域知識(shí)平臺(tái),構(gòu)建專家級(jí)領(lǐng)域大模型應(yīng)用提示工程(思維鏈)假設(shè)你是一位金融投研領(lǐng)域的專家,請(qǐng)你從產(chǎn)業(yè)鏈的角度分析并回答該問題。通用LLM大模型提示詞工程(思維鏈)檢
索
增
強(qiáng)
&
代
理LLMPrompt
(CoT)RAG
&AgentL1-
常人L2-
勝
任
者L3-
專家LLM(Gneral)LLM(General)Prompt(CoT)LLM(General)Prompt(CoT)RAG&Agent回
答選擇工具<Agent
工具集向量數(shù)據(jù)庫檢索
增強(qiáng)嵌入召回大模型提示詞工程(思維鏈)LLM
Prompt(CoT)L1-
常
人
L2-
勝任者LLM(Gneral)LLM(General)Prompt(CoT)O2024
Transwarp.AllRights
d.·
利用企業(yè)自身數(shù)據(jù),快速搭建企業(yè)領(lǐng)域知識(shí)平臺(tái),構(gòu)建專家級(jí)領(lǐng)域大模型應(yīng)用提示工程(思維鏈)假設(shè)你是一位金融投研領(lǐng)域的專家,請(qǐng)你從產(chǎn)業(yè)鏈的角度分析并回答該問題。有監(jiān)督微調(diào)SFTL3-
專家~L4大師LLM(General)Prompt(CoT)RAG&AgentSFT通用LLM嵌入檢索增強(qiáng)&代理
RAG&AgentL3-
專家LLM(General)Prompt(CoT)RAG&Agent五種方法快速構(gòu)建大模型商業(yè)應(yīng)用-
L4回答
選擇工具<Agent
工具集有監(jiān)督微調(diào)LLM向量數(shù)據(jù)庫檢索
增強(qiáng)召回五種方法快速構(gòu)建大模型商業(yè)應(yīng)用-
L4·
利用企業(yè)自身數(shù)據(jù),快速搭建企業(yè)領(lǐng)域知識(shí)平臺(tái),構(gòu)建專家級(jí)領(lǐng)域大模型應(yīng)用提示工程(思維鏈)假設(shè)你是一位金融投研領(lǐng)域的專家,請(qǐng)你從產(chǎn)業(yè)鏈的角度分析并回答該問題。大模型LLML1-
常人LLM(Gneral)提示詞工程(思維鏈)Prompt
(CoT)L2-
勝任者LLM(General)Prompt(CoT)檢索增強(qiáng)&代理RAG
&AgentL3-
專家LLM(General)
Prompt(CoT)RAG
&AgentTRANS
R/星
環(huán)
科
技預(yù)訓(xùn)練Pre-trainingL4-
大師
Prompt(CoT)RAG&AgentSFTLLM(Pre-Trained)有監(jiān)督微調(diào)SFTL3-
專家~
L4
大師LLM(General)Prompt(CoT)RAG
&AgentSFT通用LLM嵌入回答選擇工具<Agent
工具集預(yù)訓(xùn)練LLM向量數(shù)據(jù)庫檢索
增強(qiáng)召回語料清洗、去重、標(biāo)簽半結(jié)構(gòu)化、非結(jié)構(gòu)化語料處理OCR、分片LLMOps模型訓(xùn)練、微調(diào)、部署、監(jiān)控語料管理向量化處理數(shù)據(jù)庫
知識(shí)召回推理、生成、對(duì)話應(yīng)用
大模型從工程角度去看,大模型本身在整個(gè)應(yīng)用體系中只占一小部分關(guān)系型數(shù)據(jù)庫知識(shí)存儲(chǔ)大模型應(yīng)用體系建設(shè)對(duì)真實(shí)業(yè)務(wù)場(chǎng)景的意義例如我們有一個(gè)需求:使用大模型技術(shù)幫助信貸部門業(yè)務(wù)人員撰寫《授信項(xiàng)目可行性報(bào)告》,之前該報(bào)告由人工撰寫,需要編寫人員針對(duì)某個(gè)
申請(qǐng)授信的單一客戶進(jìn)行詳細(xì)的調(diào)查。可能涉及到數(shù)據(jù)、外采數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)以及遠(yuǎn)程及現(xiàn)場(chǎng)調(diào)研。該報(bào)告模板共計(jì)歷次授信情況投
起期金額使用方式利率或保證
金比例擔(dān)保人及擔(dān)保方式循
環(huán)使
用判斷是否存在在問題;詳細(xì)分析申請(qǐng)人主要設(shè)備構(gòu)成、主要設(shè)備是否為限制類和淘汰類、產(chǎn)品的簡(jiǎn)
工藝流程,與同行業(yè)對(duì)比擁有哪些優(yōu)勢(shì)并判斷是否存在問題:以上內(nèi)容需要模型根據(jù)各類召回的數(shù)據(jù)進(jìn)行自主編寫24名信額成立時(shí)間代表人注冊(cè)資本收
資注冊(cè)地址電話公地址話地址系電話庫地址電話積地是否自有是否自有上表需要的數(shù)據(jù)存在于信貸系統(tǒng)第二部分
申請(qǐng)人基本情況分析一、申請(qǐng)人情況1.申請(qǐng)人基本情況分析(列表說明不完整的,必須作文字表述)申請(qǐng)人為生產(chǎn)類企業(yè)的產(chǎn)品分析細(xì)
析產(chǎn)品種類、生產(chǎn)線、車問面積、年設(shè)計(jì)生產(chǎn)能力、實(shí)際生產(chǎn)能力,通過產(chǎn)能對(duì)比插件庫、應(yīng)用庫
提示工程模型納管D知識(shí)構(gòu)建授信項(xiàng)目可行性報(bào)告注:上文LLMOps為L(zhǎng)arge
Language
ModelOps的縮寫上表需要的數(shù)據(jù)來自于外采數(shù)據(jù)NoSQL
數(shù)據(jù)庫十七頁。向量、:詳000000模型模型管理
模型體驗(yàn)
模型訓(xùn)練
模型評(píng)估
提示工程大模型管理與運(yùn)營(yíng)組件/Transwarp
LLMOps應(yīng)
用應(yīng)用管理應(yīng)用體驗(yàn)智能助手構(gòu)建應(yīng)用鏈構(gòu)建外部應(yīng)用統(tǒng)一調(diào)用知識(shí)庫知識(shí)庫構(gòu)建
知識(shí)庫維護(hù)知識(shí)庫測(cè)試知識(shí)統(tǒng)計(jì)知識(shí)向量化處理全文檢索日志存儲(chǔ)分析Scope搜索引擎時(shí)序數(shù)據(jù)存儲(chǔ)TimeLyre時(shí)序數(shù)據(jù)庫文檔型數(shù)據(jù)存儲(chǔ)檢索DocStore文檔數(shù)據(jù)庫
大模型
星環(huán)無涯大模型
Llama-3
其他開源大模型向量數(shù)據(jù)
存儲(chǔ)與檢索Hippo向量數(shù)據(jù)庫圖數(shù)據(jù)分析與可視化StellarDB圖數(shù)據(jù)庫結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)倉庫ArgoDB
高性能分析庫無涯
·問知InfinityIntelligence無涯
·問數(shù)InfinityLogits大模型應(yīng)用體系架構(gòu)一星環(huán)TKH
知識(shí)平臺(tái)語料導(dǎo)入OCR
識(shí)別語料分級(jí)智能語料標(biāo)注知識(shí)庫構(gòu)建預(yù)料測(cè)評(píng)圖譜構(gòu)建知識(shí)融合圖譜計(jì)算數(shù)據(jù)導(dǎo)入文檔解析
文本向量多模態(tài)數(shù)據(jù)預(yù)處理知識(shí)構(gòu)建工具/
TranswarpTKS服務(wù)安全中心
服務(wù)管理
資源管理知識(shí)構(gòu)建與管理語料管理/TranswarpTCSDocker云原生層星環(huán)知識(shí)庫法律法規(guī)API網(wǎng)關(guān)
CICD工具IstioTCOS/星環(huán)云原生底座權(quán)限體系
任務(wù)管理5
原
生AI
應(yīng)用規(guī)則知識(shí)建模與管理Kubernetes知識(shí)存儲(chǔ)科學(xué)
研究財(cái)經(jīng)
資訊應(yīng)用層物理層Transwarp通用語言大模型金融行業(yè)垂直大模型優(yōu)勢(shì)泛用性強(qiáng)由于在多樣化的數(shù)據(jù)集上進(jìn)行了訓(xùn)練,通用模型能夠處理各種
話題和領(lǐng)域的問題領(lǐng)域?qū)I(yè)性在金融領(lǐng)域具有專業(yè)的理解能力,更精熟于金
融術(shù)語和概念靈活性和利用率高大量數(shù)據(jù)訓(xùn)練提高了模型的準(zhǔn)確率,并可以應(yīng)用于多種任務(wù)中針對(duì)性的解決方案更適合解決金融行業(yè)的具體問題,與行業(yè)需求和合規(guī)性要求相匹配可
遷
移
性
強(qiáng)在數(shù)據(jù)量較少的特定任務(wù)上,通用模型也可以通過微調(diào)進(jìn)行有
效的遷移學(xué)習(xí),大大減少模型的訓(xùn)練時(shí)間和計(jì)算資源高精度和合規(guī)性提供更精確、可信賴的金融信息和建議,同時(shí)
符合行業(yè)規(guī)定劣勢(shì)特定領(lǐng)域深度較淺可能不具備特定領(lǐng)域(如金融)的深入理解和專業(yè)知識(shí)適應(yīng)性限制由于主要針對(duì)金融領(lǐng)域,因此在其他領(lǐng)域的適
用性可能有限模型復(fù)雜通用大模型的結(jié)構(gòu)非常復(fù)雜,使得模型的解釋性變得困難,導(dǎo)致模型的計(jì)算量增加,影響模型的效率更新和維護(hù)復(fù)雜度金融政策和法規(guī)的變化可能要求模型頻繁更新
以保持準(zhǔn)確性和合規(guī)性訓(xùn)練時(shí)間長(zhǎng)通用大模型的訓(xùn)練需要大量的計(jì)算資源和時(shí)間,這對(duì)于一些小
型企業(yè)來說是一個(gè)挑戰(zhàn)數(shù)據(jù)利用率低垂直領(lǐng)域模型的訓(xùn)練數(shù)據(jù)相對(duì)較少,模型的準(zhǔn)
確率可能會(huì)受影響>當(dāng)
前AI與金融的結(jié)合主要有兩條技術(shù)路徑:①通用模型+金融語料訓(xùn)練金融大模型,②金融垂類大模型。>由于設(shè)計(jì)和訓(xùn)練目的不同,通用語言大模型與金融垂類模型在優(yōu)劣上具有相對(duì)性。通用語言大模型在泛用性、靈活性、數(shù)據(jù)利用率、遷移性上相比金融垂類更有優(yōu)勢(shì),而
在專業(yè)性、針對(duì)性、高精度和合規(guī)性上,金融垂類模型更勝一籌;>使用金融數(shù)據(jù)訓(xùn)練和調(diào)優(yōu)通用大模型,期待其超過金融垂直大模型,可能性較小,得不償失>訓(xùn)練數(shù)據(jù)難以覆蓋所有金融知識(shí),以偏概全對(duì)模型來說是“毒藥”>
訓(xùn)
練成本較高(千億級(jí)別的通用大模型,訓(xùn)練一次需要付出幾千萬的成本)金融業(yè)對(duì)合規(guī)和風(fēng)險(xiǎn)要求極高,通用難以滿足要求。O2024Transwarp.All
Rights
d.
261.1大模型:通用大模型
vs
垂直領(lǐng)域大模型1.2大模型:領(lǐng)域大模型的預(yù)訓(xùn)練特點(diǎn)TRANS
S
RP星
環(huán)
科
技股票代碼
688031專業(yè)數(shù)據(jù)集垂直領(lǐng)域大模型則專注于特定領(lǐng)域或任務(wù),使用特定領(lǐng)域的數(shù)據(jù)集進(jìn)行訓(xùn)練,這些數(shù)據(jù)集更加專業(yè)和精細(xì)。通用語料資源場(chǎng)景語料資源業(yè)務(wù)場(chǎng)景架構(gòu)與參數(shù)垂直領(lǐng)域大模型在參數(shù)量上通常小于通用大模型,還可能會(huì)涉及到對(duì)模型的某些組件或網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行定制化調(diào)整。專業(yè)目標(biāo)垂直領(lǐng)域大模型的預(yù)訓(xùn)練則更側(cè)重于學(xué)習(xí)特定領(lǐng)域的知識(shí)和規(guī)律,以提高在該領(lǐng)域內(nèi)的性能和準(zhǔn)確性。數(shù)據(jù)預(yù)處理垂直領(lǐng)域大模型需要整合領(lǐng)域特定的知識(shí)庫或數(shù)據(jù),以提高模型在特定任務(wù)上的表現(xiàn)。金融領(lǐng)域資訊、信息:中文語料(wiki、中文互聯(lián)網(wǎng)、中文科學(xué)文獻(xiàn)數(shù)據(jù))中英文翻譯數(shù)據(jù)英文Wiki英文書籍英文互聯(lián)網(wǎng)英文科學(xué)文獻(xiàn)數(shù)學(xué)某省市場(chǎng)個(gè)股財(cái)報(bào)點(diǎn)評(píng)與調(diào)研、個(gè)股財(cái)報(bào)董秘股民
情景問答對(duì)26個(gè)部委政策庫+政策解
讀新聞?wù)Z料核心法律條例+真實(shí)律師用
戶情景問答對(duì)公司治理行業(yè)資訊年報(bào)監(jiān)管審查法律法規(guī)上圖以星環(huán)無涯金融領(lǐng)域大模型的預(yù)訓(xùn)練語料范圍與擅長(zhǎng)的業(yè)務(wù)場(chǎng)景為例財(cái)報(bào)主營(yíng)公司發(fā)展戰(zhàn)略某省市場(chǎng)個(gè)股財(cái)報(bào)(年報(bào)與季報(bào))投研分析監(jiān)管審查·
場(chǎng)(行業(yè))景(業(yè)務(wù))的語料和相應(yīng)適配方
法僅存在于企業(yè)、機(jī)構(gòu),通用模型無法
覆蓋模型架構(gòu)和推理機(jī)制·
當(dāng)前大模型高度依賴自注意力機(jī)制和概率模
型,在基礎(chǔ)模型不具備本行業(yè)需要能力時(shí),
僅提示工程和RAG無法達(dá)到業(yè)務(wù)效果數(shù)據(jù)難點(diǎn)·涉及多個(gè)技術(shù)領(lǐng)域,包括機(jī)器學(xué)習(xí)、
自然語言處理、大數(shù)據(jù)、多模態(tài)、工
程優(yōu)化等,技術(shù)復(fù)雜性較高,需要專
業(yè)的技術(shù)團(tuán)隊(duì)進(jìn)行開發(fā)和維護(hù)管理成本高知識(shí)邊界·通用模型對(duì)行業(yè)有知識(shí)邊界或者偏見場(chǎng)景、數(shù)據(jù)、業(yè)務(wù)壁壘需要模型運(yùn)營(yíng)·
克服大模型快速探索業(yè)務(wù)場(chǎng)景
模式需要長(zhǎng)效運(yùn)營(yíng)機(jī)制·大模型落地需要較高算力,更
需要高效的調(diào)度、混合部署等
能力服務(wù)不同的模型訓(xùn)練任務(wù)2.1大模型管理與運(yùn)營(yíng):模型訓(xùn)練的必要性及其挑戰(zhàn)私域數(shù)據(jù)·設(shè)計(jì)大量非結(jié)
構(gòu)化、半結(jié)構(gòu)化數(shù)
據(jù)以及領(lǐng)域知識(shí)·基礎(chǔ)大模型、微調(diào)大模型版本
數(shù)量繁多,版本管理、調(diào)優(yōu)、
實(shí)驗(yàn)設(shè)計(jì)需要系統(tǒng)設(shè)計(jì)三大必要性五重挑戰(zhàn)算力稀缺t+需要的功能點(diǎn):●支持從語料采集/清洗/標(biāo)注,到模型訓(xùn)練、模型評(píng)估、測(cè)試驗(yàn)證、模型對(duì)齊的全流程管理。
支持引導(dǎo)式模型微調(diào),包括全參微調(diào)、Lora、P-Tuning微調(diào)等多種方式?!裰С肿远x模型評(píng)估指標(biāo),并生成評(píng)估報(bào)告;同時(shí),還支持多提示詞、多模型對(duì)比驗(yàn)證,通過實(shí)驗(yàn)設(shè)計(jì)手段實(shí)現(xiàn)較優(yōu)的模型選型?!?/p>
支持模型安全護(hù)欄,支持過濾隱私、涉政、涉黃、涉恐等信息,防止惡意攻擊。01語料處理02模型訓(xùn)練04測(cè)試驗(yàn)證:爹累騎皆比o2024Transwarp.2.2大模型管理與運(yùn)營(yíng):大模型的訓(xùn)練/微調(diào)05
模型對(duì)齊03評(píng)估報(bào)告安全對(duì)齊
·
認(rèn)知對(duì)齊Agent
/
智能體:為一個(gè)能夠感知環(huán)境、做出決策并執(zhí)行的程序體。隨著人工智能技術(shù)的不斷進(jìn)步,Al
代理(AIAgent)正逐漸成為大模型技術(shù)發(fā)展和應(yīng)用的關(guān)鍵趨勢(shì)。在動(dòng)態(tài)決策的大模型框架中,Al代理以高度擬人化的方式,能夠接收并深入理解外部指令和信息。它們利用鏈?zhǔn)剿伎?Chain
of
Thought,簡(jiǎn)稱CoT)的能力,通過計(jì)劃、執(zhí)行和觀察的循環(huán)過程,有效地縮小了推理與實(shí)際行動(dòng)之間的差距,從而實(shí)現(xiàn)精準(zhǔn)的意圖識(shí)別和決策制定。此外,大模型作為A1代理的“智能核心”,為其提供了規(guī)劃、記憶、執(zhí)行和工具等四項(xiàng)關(guān)鍵能力,使其能夠處理更加復(fù)雜和多樣化的
決策任務(wù)。Al
代理能夠自主進(jìn)行任務(wù)規(guī)劃、環(huán)境感知、行動(dòng)選擇和觀察糾錯(cuò),這一系列行動(dòng)都是以任務(wù)目標(biāo)為導(dǎo)向的。這樣的能力提升不僅增強(qiáng)了大模型解決實(shí)際問題的能力,也提高了決策結(jié)果的準(zhǔn)確性,進(jìn)一步推動(dòng)了智能體在實(shí)際應(yīng)用中的進(jìn)程。AI與人類的協(xié)同合作,AI負(fù)責(zé)某部分模塊化任務(wù)
的執(zhí)行。代表場(chǎng)景與服務(wù):Coding-Copilot主要服務(wù)于
開發(fā)者,通過預(yù)測(cè)和補(bǔ)全代碼段來提高編程效率。
它可以在編寫代碼時(shí)提供實(shí)時(shí)的代碼建議,幫助
開發(fā)者快速完成任務(wù)。以人類為主的AI應(yīng)用,AI以信息提供的形式服務(wù)
人類決策。代表場(chǎng)景與服務(wù):Chatbot廣泛應(yīng)用于客服、訂
票、娛樂聊天等多個(gè)領(lǐng)域。它們能夠通過自然語
言與用戶進(jìn)行交互,提供信息查詢、任務(wù)處理等服務(wù)。決策與行動(dòng)能夠基于其感知到的信息
做出決策,并執(zhí)行相應(yīng)的
行動(dòng)。自主性具有一定程度的自主性,
能夠在沒有人類直接干預(yù)
的情況下執(zhí)行任務(wù)。環(huán)境感知與互動(dòng)通過傳感器或數(shù)據(jù)輸入感知周圍環(huán)境,并根據(jù)這些信息做出響應(yīng)。Al全權(quán)代理,自主承擔(dān)工作任務(wù)的分配、拆解
與執(zhí)行。代表場(chǎng)景與服務(wù):Agents模式可以應(yīng)用于個(gè)人
助理、智能家居、企業(yè)自動(dòng)化等多個(gè)場(chǎng)景。它們
能夠根據(jù)用戶的指令或環(huán)境變化自主執(zhí)行任務(wù)。2.3大模型管理與運(yùn)營(yíng):Agent
也模型應(yīng)用的“終極”形態(tài)Copilot模式Chatbot模
式Agents
模式end_email④
成功給新員工發(fā)送郵件
Agent③輸出:發(fā)送成功O2024Transwarp.AllRights
d.
31③
調(diào)用其它工具完成每個(gè)小模塊任務(wù)Agent規(guī)劃①
接受用戶自然語言指令④執(zhí)行完所有小模塊的任務(wù)后,最終
將處理結(jié)果返回給用戶記憶②智能體(大語言模型)解析用戶指令,將任務(wù)分解成多個(gè)子任務(wù)并進(jìn)行規(guī)劃和編排
工具1②
思考:需要發(fā)送郵件使用工具:send_email輸入:{“to”:”san..io”“content”:”,您好,歡迎加入星環(huán)科技”}2.4大模型管理與運(yùn)營(yíng):
Agent
簡(jiǎn)單示例①
給待入職員工發(fā)送歡迎郵
件,并提醒需要攜帶的入職材料工具2工具3星環(huán)員工服務(wù)助手Agent案例:<TRANS
RP
股票代碼星
環(huán)
科
技
688031輸出答復(fù)今天是u
ǔü年00月ǒn日,今日是周六不是交。但是我?guī)湍樵兞俗蛱煨黔h(huán)科技【股票代碼uaaiuǒ】的收盤價(jià)格為W
元,較前日上漲W
元,漲幅為Y于。32模型調(diào)用對(duì)問題進(jìn)行必要的優(yōu)化改
寫后,調(diào)用問數(shù)工具調(diào)用無涯小參數(shù)模型工具調(diào)用無涯小參數(shù)模型模式構(gòu)建售前助手應(yīng)用對(duì)話模型1無涯小參數(shù)模型應(yīng)用調(diào)用問數(shù)應(yīng)用調(diào)用工具1客戶交流拜訪6tq更新工具2試用環(huán)境申請(qǐng)工具3客戶郵件發(fā)送知識(shí)庫1各類星環(huán)制度規(guī)范材料知識(shí)庫2星環(huán)產(chǎn)品資料、手冊(cè)等對(duì)話模型2無涯大參數(shù)模型意圖識(shí)別小模型o制度與管理規(guī)范問題ǔo售前統(tǒng)計(jì)數(shù)據(jù)類問題
3.售前工作類問題ǘ其他類型問答命中2.5大模型管理與運(yùn)營(yíng):例如使用Agents工具4聯(lián)網(wǎng)搜索工
具
5當(dāng)前日期與時(shí)間獲取流程開始假如問題是:查詢下星環(huán)科技目前的股價(jià)語料/知識(shí)積累&模型訓(xùn)練
模型管理&應(yīng)用開發(fā)
模型/應(yīng)用上線運(yùn)營(yíng)&監(jiān)控O2024Transwarp.All
Rights
d.
33部署監(jiān)控、評(píng)估&模型推理圖鏈+向量庫大模型服務(wù)大模型批處理線上監(jiān)控OnlineMonitoring線上評(píng)估OnlineEvaluation服務(wù)預(yù)測(cè)結(jié)果
十運(yùn)
維客戶反饋真實(shí)值知識(shí)知識(shí)倉庫
·智子知庫Knowledge
Base知識(shí)抽取知識(shí)融合
知識(shí)體驗(yàn)知識(shí)共享訓(xùn)練號(hào)白百可視化建模
編程式建模模型
星環(huán)/開源微調(diào)全參/
LoRA算力
分布式/單機(jī)存儲(chǔ)分布式+高速緩存模型倉庫
·智子模方Model
Cube模型納管
模型評(píng)估LLM/LoRA
自定義評(píng)估CV/NLP/ML通用/領(lǐng)域能力評(píng)估模型注冊(cè)
提示工程流量控制
提示詞生成第三方模型接入
提示詞評(píng)估星環(huán)大模型
開源大模型無涯/求索
Llama/Mistral灰度發(fā)布□計(jì)算x數(shù)據(jù)密集型資源配置和調(diào)度彈性伸縮資源監(jiān)控Resource
Monitoring業(yè)務(wù)評(píng)估BizEvaluation2.6大模型管理與運(yùn)營(yíng):大模型應(yīng)用整體開發(fā)流程應(yīng)用AI應(yīng)用體驗(yàn)中心ApplicationCenter個(gè)兇兇區(qū)AI助理構(gòu)建工具自定義在線編程AI應(yīng)用流程編排工具自定義
容器應(yīng)用Sophon
LLMOps·大模型運(yùn)營(yíng)平臺(tái)大模型和應(yīng)用持續(xù)開發(fā)和持續(xù)提升語料加工語料生成語料準(zhǔn)備語料標(biāo)注語料檢索語料服務(wù)
語料共享語料評(píng)測(cè)語料倉庫
·智子數(shù)方Sample
Cube語料模型高質(zhì)量語料需具備七大特征·多
樣
性
·
大
規(guī)
模
·
合
法
性·
真
實(shí)
性
·
連
貫
性
·
無
偏
見·無
害高質(zhì)量語料需覆蓋三大流程·
模型預(yù)訓(xùn)練·
模型微調(diào)對(duì)齊·
模型應(yīng)用高質(zhì)量語料需處理多模態(tài)多領(lǐng)域數(shù)據(jù)·文本:無格式、代碼、特殊表格、有篇章結(jié)構(gòu)·
圖像:含文字圖像、趨勢(shì)圖/餅圖、高級(jí)語義圖像
·語音:?jiǎn)我唤巧胀ㄔ挕⒍嘟巧窖?、多語言多情感·
圖
譜
:E-R關(guān)系、屬性圖、本體庫、多模態(tài)業(yè)務(wù)圖譜Ber
arkLlama
3.13BLla
3.10日MMLU(0-shot,CoT)73.048.380.486.066.487.5MMLUPRO(5-shIFEvalCoTHumanEval
(0-shot)72.680.5MBPPEvalPlus72.886.0GSM8K(8-shot,CoTMATH(0-shot.CoT)84.551.995.168.0ARCChallenge
(0-hotGPQA(
0-shot,CoT83.494.846.732.8BFCLNexus76.138.584.856.7ZeroSCROLLS/QuALITY
InfiniteBench/En.MC
NIH/Multi-needle81.065.198.890.578.297.5MultingualMGSM68.986.9地板和天花板·高質(zhì)量語料是在大模型不同階段對(duì)“價(jià)值”和“效果”既決定了地板有多“低”,也決定了天花板有多“高”三大必要性幻覺問題3.1知識(shí)管理與構(gòu)建:高質(zhì)量語料獲取的必要性及其挑戰(zhàn)壁壘和優(yōu)勢(shì)·高質(zhì)量行業(yè)專用語料是企業(yè)、機(jī)構(gòu)獨(dú)
特的競(jìng)爭(zhēng)優(yōu)勢(shì)和天然壁壘·高質(zhì)量語料是解決大模型“幻
覺”、“可信可控”等核心落地難點(diǎn)的重要手段三重挑戰(zhàn)清洗階段2:1.先進(jìn)行格式轉(zhuǎn)化,轉(zhuǎn)成json文件2.敏感詞過濾:基于快速字符串匹配對(duì)敏感信息進(jìn)行過濾3.廣告詞過濾:訓(xùn)練更細(xì)力度的分類模型進(jìn)行垃圾,廣告過濾訓(xùn)練小模型,在下游任務(wù)上做效果評(píng)估Rights
d.清洗階段3:1.大數(shù)據(jù)平臺(tái)樣本間去重:對(duì)數(shù)據(jù)進(jìn)行分片,預(yù)處理,
計(jì)算hash,
去重2.
樣本內(nèi)去重:
n-gram算
法清洗階段4:1.用語言模型進(jìn)行ppl過濾2.
人工抽樣評(píng)估清洗階段1:√處理方式:分布式大
數(shù)據(jù)處理平臺(tái)√效率:處理1T
CC原
始數(shù)據(jù),耗時(shí)約2小
時(shí),可以得到約5GB中文質(zhì)量一般的數(shù)據(jù)o
2024
Transwarp.All文
本
改
進(jìn)
清
文
件
洗規(guī)則格式處理
數(shù)據(jù)清洗改進(jìn)清
洗規(guī)
則采購數(shù)據(jù)開放數(shù)據(jù)monCrawl
數(shù)據(jù)網(wǎng)
頁Crawler合作方領(lǐng)域
數(shù)
據(jù)抽樣人工評(píng)估改進(jìn)模型敏感&廣
告詞過濾改
進(jìn)
模
型小模型驗(yàn)證3.2知識(shí)管理與構(gòu)建:語料加工流程示例百科類電子書網(wǎng)頁數(shù)據(jù)json
文件數(shù)據(jù)集質(zhì)量評(píng)估訓(xùn)練集知識(shí)庫樣本間&
樣本內(nèi)去重大規(guī)模分布式集群部署經(jīng)驗(yàn)和能
力;Raft算法確保數(shù)據(jù)強(qiáng)一致性;
提供故障遷移,數(shù)據(jù)修復(fù)等數(shù)據(jù)
保障能力跨模態(tài)檢索不同模態(tài)數(shù)據(jù)(文本/圖片/音
頻等)通過Embedding導(dǎo)入后,
支持跨模態(tài)檢索(如文搜圖等)全面容器化部署,具備多租戶
和強(qiáng)大的資源管控能力,支持
服務(wù)的彈性擴(kuò)縮容混合檢索具有全文檢索+向量稀疏向量+稠密向量的能力安全性基于SASL的用戶認(rèn)證能力基于SSL/TLS
數(shù)據(jù)加密傳輸高性能檢索多進(jìn)程架構(gòu)與GPU
加速,充分
發(fā)揮并行檢索能力;10+類索引支持,滿足不同需求及體量的業(yè)務(wù)場(chǎng)景信創(chuàng)非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用日益增多
數(shù)據(jù)體量大,格式多存儲(chǔ)方式多樣傳統(tǒng)數(shù)據(jù)庫
向量數(shù)據(jù)庫應(yīng)用場(chǎng)景文本檢索
個(gè)性化推薦
知識(shí)圖譜
語音/視頻/圖像檢索Hippo
技術(shù)優(yōu)勢(shì)分布式
云原生4.1知識(shí)存儲(chǔ):向量數(shù)據(jù)的存儲(chǔ)與檢索-
Hippo
分布式向量數(shù)據(jù)庫界面化管理,指標(biāo)監(jiān)控,標(biāo)準(zhǔn)
接口:Python/Restful/JavaEmbedding
SDK代碼自主可控支持Arm/X86平臺(tái)支持信創(chuàng)服務(wù)器/系統(tǒng)適配拓展大語言模型時(shí)間和空間維度圖片文檔語音視頻Hippo向量數(shù)據(jù)庫構(gòu)建知識(shí)圖譜后,再通過圖嵌入算法模塊將知識(shí)圖譜轉(zhuǎn)化為向量進(jìn)行存儲(chǔ);用戶輸入提問文本,結(jié)合知識(shí)模型、MLP、大模型等相關(guān)技術(shù),識(shí)別出相關(guān)實(shí)體,做出相應(yīng)的子圖召回,基于召回子圖向量化后進(jìn)行向量召回,找到相似的子圖,根據(jù)相似子圖生成相應(yīng)提示詞后供大模型生成內(nèi)容并進(jìn)行回復(fù),給出更精準(zhǔn)的答案。回答示例:A公司的交特點(diǎn)是1.高頻小金額交
易...2....
;與它具有相似交的公司是
B
公司,
它的行為特點(diǎn)是:
...
;C
公司,它的行為特點(diǎn)是...O2024Transwarp.All
Rights
d.4.2知識(shí)存儲(chǔ):知識(shí)圖譜的知識(shí)平臺(tái)應(yīng)用場(chǎng)景-圖嵌入-圖譜/向量召回問題示例:與A公司具有相似交的公司有哪些?相關(guān)提問文本星環(huán)向量數(shù)據(jù)庫HippoO-相似子圖提示詞工程識(shí)別引擎基礎(chǔ)大模型基于圖譜的產(chǎn)業(yè)鏈和交信息回復(fù)Graph子圖召回星環(huán)圖數(shù)據(jù)庫
Stellar
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企事業(yè)單位內(nèi)部控制制度范文全集
- 人工智能在智能風(fēng)控系統(tǒng)中的實(shí)踐
- 2025 年大學(xué)生物制藥設(shè)備(設(shè)備驗(yàn)證方案設(shè)計(jì))期末考核卷
- 教師普通話水平提升計(jì)劃方案
- 小學(xué)英語單元聽說讀寫訓(xùn)練方案
- 醫(yī)院控制住院天數(shù)管理方案
- 智能制造工廠設(shè)備管理與維護(hù)方案
- 企業(yè)運(yùn)營(yíng)管理規(guī)范制度范本合集
- 我國上市公司會(huì)計(jì)信息披露質(zhì)量:?jiǎn)栴}剖析與提升路徑
- 基于大數(shù)據(jù)的市場(chǎng)預(yù)測(cè)分析報(bào)告范文
- 廣東省佛山市南海區(qū)2025-2026學(xué)年上學(xué)期期末八年級(jí)數(shù)學(xué)試卷(含答案)
- 【地理】期末重點(diǎn)復(fù)習(xí)課件-2025-2026學(xué)年八年級(jí)地理上學(xué)期(人教版2024)
- 2026年鄉(xiāng)村治理體系現(xiàn)代化試題含答案
- 通風(fēng)設(shè)備采購與安裝合同范本
- 化工設(shè)備清洗安全課件
- 2026元旦主題班會(huì):馬年猜猜樂新春祝福版 教學(xué)課件
- 光伏收購合同范本
- 2025海洋水下機(jī)器人控制系統(tǒng)行業(yè)市場(chǎng)需求及發(fā)展趨勢(shì)分析投資評(píng)估規(guī)劃報(bào)告
- T∕ZZB 1815-2020 塑料 汽車配件用再生聚碳酸酯(PC)專用料
- 2025~2026學(xué)年吉林省吉林市一中高一10月月考語文試卷
- 天津市南開中學(xué)2025-2026學(xué)年高一上數(shù)學(xué)期末調(diào)研模擬試題含解析
評(píng)論
0/150
提交評(píng)論