版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
AIGC行業(yè)市場(chǎng)分析
國(guó)內(nèi)大模型發(fā)展
國(guó)內(nèi)AI市場(chǎng)迅速發(fā)展,數(shù)據(jù)量增速或?qū)⑷虻谝?/p>
國(guó)內(nèi)應(yīng)用層面的需求推動(dòng)AI產(chǎn)業(yè)的加速發(fā)展,或?qū)?lái)市場(chǎng)的爆發(fā)
性增長(zhǎng)。根據(jù)IDC數(shù)據(jù)預(yù)測(cè),2021年中國(guó)人工智能軟件及應(yīng)用市場(chǎng)
規(guī)模為51億美元,預(yù)計(jì)2026年將會(huì)達(dá)到211億美元。數(shù)據(jù)、算法、
算力是AI發(fā)展的驅(qū)動(dòng)力,其中數(shù)據(jù)是AI發(fā)展的基石,中國(guó)數(shù)據(jù)規(guī)模
增速或排名全球第一。據(jù)IDC統(tǒng)計(jì),中國(guó)數(shù)據(jù)規(guī)模將從2021年的
18.51ZB增長(zhǎng)至2026年的56.16ZB,年均增長(zhǎng)速度CAGR為24.9%,
增速位居全球第一。
國(guó)內(nèi)各大科技企業(yè)紛紛入局AI大模型
大模型增強(qiáng)了AI技術(shù)的通用性,助力普惠AI的實(shí)現(xiàn)。未來(lái),大模型
有望于場(chǎng)景深度融合,配合專業(yè)工具和平臺(tái)支持應(yīng)用落地,開(kāi)放的生
態(tài)來(lái)激發(fā)創(chuàng)新,形成良性循環(huán)。頭部企業(yè)均采取“模型+工具平臺(tái)+生
態(tài)”三層共建模式,有助于業(yè)務(wù)的良性循環(huán),也更容易借助長(zhǎng)期積累
形成競(jìng)爭(zhēng)壁壘。大模型廠商主要包括百度、騰訊、阿里、商湯、華為
等企業(yè),也有智源研究院、中科院自動(dòng)化所等研究機(jī)構(gòu),同時(shí)英偉達(dá)
等芯片廠商也紛紛入局。
百度:文心大模型
百度文心大模型:模型+平臺(tái)+產(chǎn)品構(gòu)成全套體系
百度文心構(gòu)建了文心大模型層、工具平臺(tái)層、產(chǎn)品與社區(qū)三層體系。
產(chǎn)品能力:文心大模型+飛槳PaddlePaddle深度學(xué)習(xí)平臺(tái),滿足市
場(chǎng)大規(guī)模落地需求,應(yīng)用能力:百度已在金融、能源、制造、城市、
傳媒、互聯(lián)網(wǎng)等行業(yè)擁有實(shí)際落地的標(biāo)桿案例。生態(tài)能力:在社區(qū)用
戶的基礎(chǔ)上,可以實(shí)現(xiàn)與開(kāi)發(fā)者、行業(yè)用戶、上下游產(chǎn)業(yè)的正向互動(dòng)。
百度飛槳:深度學(xué)習(xí)平臺(tái)為大模型研發(fā)基石
飛槳(Paddle-Paddle)以百度多年的深度學(xué)習(xí)技術(shù)研究和業(yè)務(wù)應(yīng)用
為基礎(chǔ),集深度學(xué)習(xí)核心訓(xùn)練和推理框架、基礎(chǔ)模型庫(kù)、端到端開(kāi)發(fā)
套件、豐富的工具組件于一體,是國(guó)內(nèi)功能豐富、開(kāi)源開(kāi)放的產(chǎn)業(yè)級(jí)
深度學(xué)習(xí)平臺(tái)。截止2022年底,共服務(wù)企事業(yè)單位20萬(wàn)家,創(chuàng)建
模型67萬(wàn)個(gè)。飛槳深度學(xué)習(xí)平臺(tái)解決大模型研發(fā)和部署的各類問(wèn)題,
文心大模型是飛槳模型庫(kù)的重要組成部分,與飛槳共享生態(tài),包含產(chǎn)
業(yè)級(jí)知識(shí)增強(qiáng)大模型體系,以及工具平臺(tái)、API和創(chuàng)意社區(qū)助力大模
型的高效應(yīng)用。
文心大模型在市場(chǎng)格局中處于第一梯隊(duì)
百度率先在2019年3月發(fā)布預(yù)訓(xùn)練模型ERNIE1.0,文心大模型構(gòu)
建了“基礎(chǔ)+任務(wù)+行業(yè)”的三級(jí)模型體系,基礎(chǔ)大模型支撐任務(wù)與行業(yè)
大模型的建設(shè),任務(wù)和行業(yè)大模型結(jié)合真實(shí)場(chǎng)景與數(shù)據(jù)反哺基礎(chǔ)大模
型優(yōu)化,目前已有36個(gè)大模型。基礎(chǔ)大模型:聚焦技術(shù)挑戰(zhàn)、通用
性、泛化性探索,包括含NLP大模型、CV大模型和跨模態(tài)大模型。
任務(wù)大模型:包含對(duì)話、搜索、信息抽取、生物計(jì)算等多個(gè)典型任務(wù)。
行業(yè)大模型:包含與來(lái)自8個(gè)行業(yè)的頭部企業(yè)或機(jī)構(gòu)共建的11個(gè)行
業(yè)大模型。IDC評(píng)估結(jié)果顯示,百度文心大模型處于第一梯隊(duì),產(chǎn)品
能力、生態(tài)能力達(dá)到L4水平,應(yīng)用能力達(dá)到L3水平。
基礎(chǔ)大模型:聚焦技術(shù)挑戰(zhàn)、通用性、泛化性探索
文心基礎(chǔ)大模型覆蓋了NLP、CV、跨模態(tài)三大方向。文心NLP大模
型:ERNIE3.0基于知識(shí)增強(qiáng)的多范式統(tǒng)一預(yù)訓(xùn)練框架,深入融合的
千億級(jí)知識(shí),具備強(qiáng)大的語(yǔ)言理解能力與小說(shuō)、摘要、文案創(chuàng)意、歌
詞、詩(shī)歌等文學(xué)創(chuàng)作能力;與鵬城實(shí)驗(yàn)室合作發(fā)布了知識(shí)增強(qiáng)千億大
模型“鵬城?百度?文心“。文心CV大模型:VIMER系列的CV大模型,
包括視覺(jué)自監(jiān)督預(yù)訓(xùn)練大模型VIMER-CAE,多任務(wù)學(xué)習(xí)模型
VIMERUFO2.0,端到端文檔OCR表征學(xué)習(xí)預(yù)訓(xùn)練模型
VIMER-StrucTexT2.0等。文心跨模態(tài)大模型:ERNIE?ViLG2.0文生
圖大模型、ERNIE-ViL視覺(jué)■語(yǔ)言大模型、ERNIE-Layout文檔智能大
模型等。
任務(wù)大模型:面向多個(gè)經(jīng)典下游任務(wù)推出的模型
任務(wù)大模型包括,對(duì)話大模型PLATO、搜索大模型ERNIE-Search.
信息抽取大模型ERNIE-UIE、代碼生成大模型ERNIE-Code、生物
計(jì)算大模型等。PLATO:基于隱變量的生成式開(kāi)放域?qū)υ挻竽P停?/p>
具備接近真人水平的多輪流暢對(duì)話能力,開(kāi)放域?qū)υ捫Ч_(dá)到世界領(lǐng)
百度文心圍繞大模型產(chǎn)業(yè)應(yīng)用的不同研發(fā)環(huán)節(jié),面向各階段不同技術(shù)、
業(yè)務(wù)背景的開(kāi)發(fā)者或用戶,打造系列工具平臺(tái)與場(chǎng)景化產(chǎn)品。面向開(kāi)
發(fā)者:擁有面向NLP工程師的大模型套件ERNIEKit,包括數(shù)據(jù)標(biāo)注
與處理、大模型精調(diào)、大模型壓縮、高性能部署、場(chǎng)景化工具五大模
塊能力;AI開(kāi)發(fā)平臺(tái),包括零門檻AI開(kāi)放平臺(tái)EasyDL,和面向Al
算法開(kāi)發(fā)者提供全功能Al開(kāi)發(fā)平臺(tái)BML。面向下游應(yīng)用:文心開(kāi)放
了API接口,包括NLP大模型ERNIE3.0、跨模態(tài)大模型ERNIE-ViLG、
對(duì)話大模型PLATO。面向用戶:推出了基于大模型驅(qū)動(dòng)的新一代產(chǎn)
業(yè)級(jí)搜索系統(tǒng)文心百中,以及AI藝術(shù)與創(chuàng)意輔助平臺(tái)文心一格。
騰訊:混元大模型
騰訊HunYuan大模型:深入產(chǎn)業(yè)落地的重要舉措
2022年4月,騰訊首次對(duì)外披露HunYuan大模型,協(xié)同了騰訊預(yù)
訓(xùn)練研發(fā)力量,完整覆蓋NLP大模型、CV大模型、多模態(tài)大模型及
眾多行業(yè)/領(lǐng)域任務(wù)模型。HunYuan-NLP:萬(wàn)億級(jí)別中文NLP預(yù)訓(xùn)
練模型,參數(shù)量達(dá)1T,排名CLUE1.1總排行榜第一。HunYuan-vcr:
排名VCR(VisualCommonsenseReasoning)榜單第一。Hun
Yuanjvr:跨模態(tài)文字?視頻檢索Al大模型。
太極機(jī)器學(xué)習(xí)平臺(tái):HunYuan大模型的底層支持
太極是騰訊自主研發(fā)的一站式機(jī)器學(xué)習(xí)生態(tài)服務(wù)平臺(tái),為AI工程師
打造從數(shù)據(jù)預(yù)處理、模型訓(xùn)練、模型評(píng)估到模型服務(wù)的全流程高效開(kāi)
發(fā)工具,為大模型的訓(xùn)練提供了有力保障。太極AngelPTM:預(yù)訓(xùn)
練加速組件,單機(jī)最大可容納55B模型,需要192張卡就可以訓(xùn)練
萬(wàn)億模型。太極-HCFToolKit:大模型壓縮和分布式推理組件,包含
了從模型蒸儲(chǔ)、壓縮量化到模型加速的完整能力。太極-HCF
distributed為大模型分布式推理組件,使得HunYuan-NLP1T大模型
推理只需96張A100(4G)卡,相比于“威震天'資源設(shè)備占用減少了
40%o太極-SNIP為大模型壓縮組件,從蒸播框架和壓縮加速算法兩
方面,實(shí)現(xiàn)了迭代更快,效果更好,成本更低的大模型壓縮。
應(yīng)用:為騰訊生態(tài)降本增效,廣告類應(yīng)用表現(xiàn)出色
HunYuan先后支持了包括微信、QQ、游戲、騰訊廣告、騰訊云等
眾多產(chǎn)品和業(yè)務(wù),降本增效。依靠HunYuan的多模態(tài)理解能力,在
廣告內(nèi)容理解、行業(yè)特征挖掘、文案創(chuàng)意生成等方面的應(yīng)用,在為騰
訊廣告帶來(lái)大幅GMV提升的同時(shí),也初步驗(yàn)證了大模型的商業(yè)化潛
力。HunYuan大模型和騰訊廣告精排大模型基于太極機(jī)器學(xué)習(xí)平臺(tái),
共同完善優(yōu)化了廣告理解、用戶理解、廣告和用戶匹配的整個(gè)流程,
提升對(duì)廣告理解、匹配效率、精準(zhǔn)度和轉(zhuǎn)化效率。HunYuan大模型
的生成能力,可以提升廣告制作的效率:圖生視頻'功能,可以將靜
態(tài)的圖片自動(dòng)生成不同樣式的視頻廣告;文案助手”功能,可以為廣
告自動(dòng)生成更恰當(dāng)?shù)臉?biāo)題,提升廣告的效果;“文生視頻”功能,未來(lái)
只需要提供一句廣告文案,就可以自動(dòng)生成與之匹配的視頻廣告。
阿里:通義大模型
通義大模型:讓Al更通用
2022年9月,在阿里巴巴達(dá)摩院主辦的世界人工智能大會(huì)“大規(guī)模預(yù)
訓(xùn)練模型”主題論壇上,發(fā)布“通義'大模型系列,并宣布相關(guān)核心模型
向全球開(kāi)發(fā)者開(kāi)源亓放。阿里達(dá)摩院基于其AI統(tǒng)一底座構(gòu)建了通用
模型與專業(yè)模型協(xié)同的層次化人工智能體系。統(tǒng)一底座層:M6-OFA
模型作為單一模型,在不引入新增結(jié)構(gòu)的情況下,可處理超過(guò)30種
跨模態(tài)任務(wù)。通用模型層:NLP模型“通義-AliceMind”;CV模型“通
義?視覺(jué)”;多模態(tài)模型“通義?M6”。專業(yè)模型層:深入電商、醫(yī)療、娛
樂(lè)、設(shè)計(jì)、金融、工業(yè)、制造業(yè)等行業(yè)。
底座層:實(shí)現(xiàn)模態(tài)表示、任務(wù)表示、模型結(jié)構(gòu)統(tǒng)一
通義大模型背后的核心技術(shù)為統(tǒng)一學(xué)習(xí)范式OFA,使其具備了多種
任務(wù)的“大一統(tǒng)”能力。單一模型即可同時(shí)處理圖像描述、視覺(jué)定位、
文生圖、視覺(jué)蘊(yùn)含、文檔摘要等10余項(xiàng)單模態(tài)和跨模態(tài)任務(wù);升級(jí)
后更是可以處理超過(guò)包括語(yǔ)音和動(dòng)作在內(nèi)的30多種跨模態(tài)任務(wù)。架
構(gòu)統(tǒng)一:使用Transformer架構(gòu),統(tǒng)一進(jìn)行預(yù)訓(xùn)練和微調(diào),無(wú)需在應(yīng)
對(duì)不同任務(wù)時(shí),增加任何特定的模型層。模態(tài)統(tǒng)一:不管是NLP、
CV這種單模態(tài),還是圖文等多模態(tài)任務(wù),全都采用同一個(gè)框架和訓(xùn)
練思路。任務(wù)統(tǒng)一:將所有單模態(tài)、多模態(tài)任務(wù)統(tǒng)一表達(dá)成序列到序
列(Seq2seq)生成的形式,同類任務(wù)的輸入幾乎就是“一個(gè)模子里
刻出來(lái)的”。
通用模型層:趨向于統(tǒng)一大模型的演化
通義-M6為多模態(tài)大模型,已經(jīng)從2020年6月的3億參數(shù)基礎(chǔ)模型
發(fā)展到2021年10月的10萬(wàn)億參數(shù)全球最大預(yù)訓(xùn)練模型到2022年
1月的業(yè)界首個(gè)通用統(tǒng)一大模型M6-OFAo2021年3月,發(fā)布通義-
AliceMind,為達(dá)摩院開(kāi)源的深度語(yǔ)言模型體系,CLUE1.1總排行榜
第二。AliceMind生態(tài)體系包括:通用語(yǔ)言模型StructBERT、多模
態(tài)語(yǔ)言模型StructVBERT、多語(yǔ)言模型VECO、生成式模型PALM、
文檔圖像理解模型StructuralLM、表格理解模型SDCUP、超大中文
理解與生成模型PLUG(24層StructBERT編碼器+“24?6”層的PALM
編碼器-解碼器)、超大圖像-文本模型mPLUG等。
華為:盤古大模型
華為盤古大模型:深耕大模型的行業(yè)應(yīng)用
華為云團(tuán)隊(duì)于2020年立項(xiàng)AI大模型,并且于2021年4月發(fā)布“盤
古大模型”。受益于華為的全棧式AI解決方案,大模型與昇騰(Ascend)
芯片、昇思(MindSpore)語(yǔ)言、ModelArts平臺(tái)深度結(jié)合。盤古大
模型己經(jīng)發(fā)展出包括基礎(chǔ)大模型(L0)、行業(yè)大模型(L1)、行業(yè)
細(xì)分場(chǎng)景模型(L2)三大階段的成熟體系。2022年11月,在華為
全聯(lián)接大會(huì)2022中國(guó)站_L,華為云進(jìn)一步迭代盤古大模型的技術(shù)能
力,擴(kuò)展盤古大模型的服務(wù)范圍,發(fā)布盤古氣象大模型、盤古礦山大
模型、盤古OCR大模型三項(xiàng)重磅服務(wù)。
ModelArts:大模型研發(fā)的平臺(tái)支持
ModelArts是面向開(kāi)發(fā)者的一站式Al平臺(tái),為機(jī)器學(xué)習(xí)與深度學(xué)習(xí)
提供海量數(shù)據(jù)預(yù)處理及交互式智能標(biāo)注、大規(guī)模分布式訓(xùn)練、自動(dòng)化
模型生成,及端一邊-云模型按需部署能力,幫助用戶快速創(chuàng)建和部署
模型,管理全周期AI工作流。ModelArts的主要能力包括數(shù)據(jù)處理、
算法開(kāi)發(fā)、模型訓(xùn)練、AI應(yīng)用管理和部署;功能模塊涵蓋了強(qiáng)化學(xué)
習(xí)、天籌(OptVerse)AI求解器、盤古大模型、AIGallery(人工智能
知識(shí)與實(shí)訓(xùn)專區(qū))、IDE(云原生Notebook)等。
基礎(chǔ)大模型:將Transformer應(yīng)用于各模態(tài)
盤古語(yǔ)音語(yǔ)義大模型:語(yǔ)義模型是業(yè)界首個(gè)千億中文大模型;語(yǔ)音模
型擁有超過(guò)4億參數(shù),是當(dāng)前最大的中文語(yǔ)音模型之一。語(yǔ)義部分,
基于Transformer搭建基礎(chǔ)架構(gòu),針對(duì)理解能力,使用類似BERT
的MLM方式訓(xùn)練;針對(duì)生成能力,使用回歸語(yǔ)言模
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026湖北省面向西安交通大學(xué)普通選調(diào)生招錄考試備考試題及答案解析
- 2026年杭州西湖區(qū)古蕩街道辦事處招聘編外合同工5人考試參考題庫(kù)及答案解析
- 2026年安康市漢濱區(qū)第三人民醫(yī)院招聘(22人)考試備考試題及答案解析
- 2026江蘇南京市鼓樓區(qū)城市管理局招聘道路停車收費(fèi)員1人考試備考試題及答案解析
- 2026青海海南州州本級(jí)醫(yī)療機(jī)構(gòu)面向社會(huì)招聘?jìng)浒钢漆t(yī)務(wù)人員80人考試備考試題及答案解析
- 2026年鶴崗師范高等??茖W(xué)校單招職業(yè)技能筆試參考題庫(kù)帶答案解析
- 2026甘肅蘭州市皋蘭縣融媒體中心面向社會(huì)招聘主持人、全媒體記者2人考試參考題庫(kù)及答案解析
- 2026年陜西省安康市鹽業(yè)有限公司招聘(3人)考試備考試題及答案解析
- 2026河北唐山玉田啟臻高級(jí)中學(xué)招聘教師考試備考試題及答案解析
- 2026中國(guó)一汽校園招聘考試備考試題及答案解析
- 2026南水北調(diào)東線山東干線有限責(zé)任公司人才招聘8人筆試模擬試題及答案解析
- 動(dòng)量守恒定律(教學(xué)設(shè)計(jì))-2025-2026學(xué)年高二物理上冊(cè)人教版選擇性必修第一冊(cè)
- 2025年全國(guó)注冊(cè)監(jiān)理工程師繼續(xù)教育題庫(kù)附答案
- 網(wǎng)絡(luò)素養(yǎng)與自律主題班會(huì)
- 波形護(hù)欄工程施工組織設(shè)計(jì)方案
- 非靜脈曲張性上消化道出血管理指南解讀課件
- 自建房消防安全及案例培訓(xùn)課件
- 2025年廣東省第一次普通高中學(xué)業(yè)水平合格性考試(春季高考)思想政治試題(含答案詳解)
- 2025云南楚雄州永仁縣人民法院招聘聘用制司法輔警1人參考筆試試題及答案解析
- 2024年和田地區(qū)遴選公務(wù)員筆試真題匯編附答案解析
- 股份掛靠協(xié)議書(shū)范本
評(píng)論
0/150
提交評(píng)論