版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
CONTENTS目錄IDC觀點(diǎn) 0101 前言 02大模型發(fā)端及內(nèi)涵 02國(guó)家政策推動(dòng)中國(guó)大模型加速發(fā)展 03大模型成為AI開發(fā)新范式 06人工智能發(fā)展的挑戰(zhàn)與阻礙 06大模型帶來(lái)AI開發(fā)新范式 09大模型加速產(chǎn)業(yè)智能化變革 12大模型帶來(lái)AI技術(shù)與應(yīng)用變革潛能被廣泛驗(yàn)證 12“模型+工具平臺(tái)+生態(tài)三級(jí)協(xié)同加速產(chǎn)業(yè)智能化 15大模型加深度學(xué)習(xí)平臺(tái)正在成為產(chǎn)業(yè)智能化基座 16大模型的評(píng)估與典型市場(chǎng)參與者 19產(chǎn)業(yè)生態(tài)圖譜 19大模型評(píng)估框架及評(píng)估結(jié)果 20百度文心大模型 22大模型未來(lái)發(fā)展趨勢(shì) 33大模型的發(fā)展是大勢(shì)所趨 33對(duì)行業(yè)用戶的建議 34對(duì)大模型供應(yīng)商的建議 35IDC觀點(diǎn)隨著數(shù)字化轉(zhuǎn)型需求增AI在企業(yè)中的應(yīng)用也越來(lái)越AI開發(fā)門檻高應(yīng)用場(chǎng)景復(fù)雜多樣對(duì)場(chǎng)景標(biāo)注數(shù)據(jù)依賴等問(wèn)題成為AI規(guī)?;涞氐奶魬?zhàn)而預(yù)訓(xùn)練大模型的出現(xiàn)則為人工智能帶來(lái)了新的機(jī)遇與希望大模型作為政府和企業(yè)推進(jìn)人工智能產(chǎn)業(yè)發(fā)展的重要抓手在識(shí)別理解決策生成等AI任務(wù)的泛化性通用性遷移性方面都表現(xiàn)出顯著優(yōu)勢(shì)和巨大潛力。IDC預(yù)測(cè)未來(lái)大模型將帶動(dòng)新的產(chǎn)業(yè)和服務(wù)應(yīng)用范IDC預(yù)測(cè)未來(lái)大模型將帶動(dòng)新的產(chǎn)業(yè)和服務(wù)應(yīng)用范在深度學(xué)習(xí)平臺(tái)的支撐下將成為產(chǎn)業(yè)智能化基企業(yè)需加快建設(shè)人工智能統(tǒng)一底融合專家知識(shí)圖打造可面向跨場(chǎng)景或行業(yè)服務(wù)“元能力引擎。具體來(lái)看:大模型具有良好的通用性泛化顯著降低人工智能應(yīng)用門檻預(yù)訓(xùn)練大模型在海量數(shù)據(jù)的學(xué)習(xí)訓(xùn)練后具有良好的通用性和泛化性用戶基于大模型通過(guò)零樣本小樣本學(xué)習(xí)即可獲得領(lǐng)先的效果同“預(yù)訓(xùn)練+精調(diào)等開發(fā)范讓研發(fā)過(guò)程更加標(biāo)準(zhǔn)顯著降低了人工智能應(yīng)用門成為AI走向工程化應(yīng)用落地的重要手段。深度學(xué)習(xí)平臺(tái)為預(yù)訓(xùn)練大模型的發(fā)展保駕護(hù)兩者結(jié)合夯實(shí)了產(chǎn)業(yè)智能化基座深度學(xué)習(xí)平臺(tái)是推動(dòng)產(chǎn)業(yè)智能化轉(zhuǎn)型升級(jí)的核心載為大模型的算法開發(fā)訓(xùn)練部署保駕護(hù)航大模型加上深度學(xué)習(xí)平臺(tái)貫通了從硬件適配模型訓(xùn)練推理部署到場(chǎng)景應(yīng)用的AI全產(chǎn)業(yè)鏈夯實(shí)產(chǎn)業(yè)智能化基座將加速產(chǎn)業(yè)智能化升級(jí)。大模型在推進(jìn)產(chǎn)業(yè)智能化升級(jí)中已表現(xiàn)出巨大潛企業(yè)應(yīng)該盡早關(guān)注大模型目前的產(chǎn)業(yè)應(yīng)用包括面向企業(yè)提供AI中臺(tái)基座深度定制支持產(chǎn)品或生產(chǎn)的優(yōu)化與創(chuàng)新開放模型服務(wù)等大模型已經(jīng)在搜索推薦智能交互AIGC生產(chǎn)流程變革產(chǎn)業(yè)提效等場(chǎng)景表現(xiàn)出巨大的潛企業(yè)應(yīng)該盡早關(guān),在業(yè)務(wù)中布局。未來(lái)還需加強(qiáng)大模型與真實(shí)場(chǎng)景需求匹推動(dòng)大模型大規(guī)模落地目前中國(guó)大模型廠商在模型布局方面較為完善應(yīng)進(jìn)一步圍繞行業(yè)賦能的廣度和深度持續(xù)探索不斷夯實(shí)基于大模型的產(chǎn)品建設(shè)推動(dòng)大模型技術(shù)從實(shí)驗(yàn)室走向?qū)嶋H大規(guī)模落地。前言人工智能顯著的溢出效應(yīng)加快推進(jìn)了新一輪科技革也帶動(dòng)了其他技術(shù)的進(jìn)步隨著產(chǎn)業(yè)應(yīng)用的深入場(chǎng)景復(fù)雜度提升隨之而來(lái)的是數(shù)據(jù)的爆發(fā)式增長(zhǎng)算法的飛速更新迭代算力的消耗指數(shù)上升這些都對(duì)人工智能的發(fā)展提出新的要求。1.1大模型發(fā)端及內(nèi)涵隨著人工智能賦能實(shí)體經(jīng)濟(jì)進(jìn)入深水區(qū)企業(yè)通常面臨數(shù)據(jù)資源有限算力投資難度大高水平人才稀缺的發(fā)展瓶頸大模型作為解決上述問(wèn)題的最優(yōu)路徑之一可極大降低企業(yè)的技術(shù)門檻和開發(fā)成本。IDC定義下的AI大模型是基于海量多源數(shù)據(jù)打造的預(yù)訓(xùn)練模是對(duì)原有算法模型的技術(shù)升級(jí)和產(chǎn)品迭用戶可通過(guò)開源或開放API/工具等形式進(jìn)行模型零樣本/小樣本數(shù)據(jù)學(xué)以實(shí)現(xiàn)更優(yōu)的識(shí)別理解決策生成效果和更低成本的開發(fā)部署方案大模型的核心作用是突破數(shù)據(jù)標(biāo)注的困通過(guò)學(xué)習(xí)海量無(wú)標(biāo)注的數(shù)據(jù)來(lái)做預(yù)訓(xùn)練拓展整體模型前期學(xué)習(xí)的廣度和深度以此提升大模型的知識(shí)水從而低成本高適應(yīng)性地賦能大模型在后續(xù)下游任務(wù)中的應(yīng)用在實(shí)踐預(yù)訓(xùn)練大模型在基于海量數(shù)據(jù)的自監(jiān)督學(xué)習(xí)階段完成“通識(shí)教再借“預(yù)訓(xùn)練+精調(diào)等模在共享參數(shù)的情況根據(jù)具體應(yīng)用場(chǎng)景的特用少量數(shù)據(jù)進(jìn)行相應(yīng)微即可高水平完成任務(wù)。產(chǎn)業(yè)應(yīng)用原子能力任務(wù)相關(guān)少量數(shù)
圖1訓(xùn)練大?!邦A(yù)訓(xùn)練+精調(diào)模智能檢索智能推薦智能客服智能審核工業(yè)質(zhì)檢智能錄入智能檢索智能推薦智能客服智能審核工業(yè)質(zhì)檢智能錄入......智能對(duì)話智能創(chuàng)作智能問(wèn)答文檔理解目標(biāo)檢測(cè)圖像分割......
類似人學(xué)習(xí)機(jī)
精調(diào)專業(yè)教育預(yù)訓(xùn)練通識(shí)教育海量無(wú)標(biāo)注數(shù)據(jù)自監(jiān)督學(xué)習(xí)文本 海量無(wú)標(biāo)注數(shù)據(jù)自監(jiān)督學(xué)習(xí)文本 知識(shí) 圖像 視頻從技術(shù)的角度來(lái)看大模型發(fā)端于自然語(yǔ)言處理領(lǐng)域以谷歌的BERTOpenAI的GPT和百度文心大模型為代參數(shù)規(guī)模逐步提升至千億萬(wàn)同時(shí)用于訓(xùn)練的數(shù)據(jù)量級(jí)也顯著提帶來(lái)了模型能力的提高此外繼語(yǔ)言模態(tài)之后如視覺(jué)大模型等其他模態(tài)的大模型研究也開始逐步受到重視進(jìn)一步地單模態(tài)的大模型被統(tǒng)一整合起來(lái)模擬人腦多模態(tài)感知的大模型出現(xiàn)推動(dòng)了AI從感知到認(rèn)知的發(fā)展。1.2國(guó)家政策推動(dòng)中國(guó)大模型加速發(fā)展AI軟件及應(yīng)用市場(chǎng)快速增AI大規(guī)模落地成主要關(guān)注點(diǎn)2021年中國(guó)人工智能軟件及應(yīng)用市場(chǎng)規(guī)模為51億美元預(yù)計(jì)2026年將會(huì)達(dá)到211億美元各行業(yè)的需求正大力推進(jìn)AI的發(fā)將推動(dòng)市場(chǎng)的持續(xù)增長(zhǎng)。25000.020000.015000.010000.05000.00.0
圖2中國(guó)人工智能軟件及應(yīng)用市場(chǎng)規(guī)模預(yù)2021-2026單位百萬(wàn)美元21077.016801.112840.69160.45082.66467.82021 2022 2023單位百萬(wàn)美元21077.016801.112840.69160.45082.66467.8來(lái)源IDCAICloudtracker隨著數(shù)字經(jīng)濟(jì)元宇宙等概念的逐漸興起人工智能進(jìn)入大規(guī)模落地應(yīng)用的關(guān)鍵時(shí)期但其開發(fā)門檻高應(yīng)用場(chǎng)景復(fù)雜多樣對(duì)場(chǎng)景標(biāo)注數(shù)據(jù)依賴等問(wèn)題開始顯阻礙了規(guī)?;涞谹I大模型憑借其越的泛化性通用性遷移為人工智能大規(guī)模落地帶來(lái)新的希望。國(guó)家政策對(duì)AI產(chǎn)業(yè)應(yīng)用的關(guān)注與引導(dǎo)將推動(dòng)預(yù)訓(xùn)練大模型加速發(fā)展在國(guó)家層面各國(guó)都在強(qiáng)調(diào)人工智能在發(fā)展中的重要性并相繼出臺(tái)相關(guān)政策希望在新一輪產(chǎn)業(yè)變革中占據(jù)上風(fēng)中國(guó)“十四五期針對(duì)人工智能的未來(lái)發(fā)展陸續(xù)出臺(tái)了相關(guān)指導(dǎo)方案和激勵(lì)支撐政策對(duì)人工智能的整體發(fā)展方向和技術(shù)發(fā)展重點(diǎn)做出重要規(guī)劃同時(shí)提出加強(qiáng)算法創(chuàng)新與應(yīng)用推動(dòng)算力基礎(chǔ)設(shè)施建設(shè)完善數(shù)據(jù)基礎(chǔ)支撐體系等關(guān)鍵建倡導(dǎo)未來(lái)不斷夯實(shí)產(chǎn)業(yè)發(fā)展新基礎(chǔ)。具體來(lái)上海市發(fā)《上海市人工智能產(chǎn)業(yè)發(fā)“十四五規(guī)劃《規(guī)劃中提“十三五時(shí)期上海人工智能發(fā)展面臨的瓶頸規(guī)?;瘧?yīng)用深度不足人工智能的應(yīng)用以單個(gè)場(chǎng)景使用為主深入傳統(tǒng)行業(yè)核心業(yè)務(wù)流程完整解決行業(yè)痛點(diǎn)實(shí)現(xiàn)商業(yè)價(jià)值的應(yīng)用較少而大模型憑借其特性直擊痛點(diǎn)將會(huì)是未來(lái)突破發(fā)展瓶頸的關(guān)鍵技術(shù)在基礎(chǔ)理論研究中《規(guī)劃還提到“十四五人工智能發(fā)展的主要任務(wù)是深化人工智能通用技術(shù)突面向自然語(yǔ)言處理計(jì)算機(jī)視覺(jué)語(yǔ)音識(shí)別等通用技支持相關(guān)科研機(jī)構(gòu)和企業(yè)加快研發(fā)建設(shè)先進(jìn)算法模型相關(guān)測(cè)試性能達(dá)到國(guó)際領(lǐng)先水平支持對(duì)各類算法模型進(jìn)行深度優(yōu)適配實(shí)際應(yīng)用需求此北京市發(fā)《北京“十四五時(shí)期高精尖產(chǎn)業(yè)發(fā)展規(guī)劃,《規(guī)劃重點(diǎn)關(guān)注全面突破智能芯片開源框架等核心技構(gòu)建自主可控的產(chǎn)業(yè)鏈體系建設(shè)國(guó)家級(jí)人工智能前沿研究中心超大規(guī)模人工智能模型訓(xùn)練平臺(tái)融合人工智能和產(chǎn)業(yè)應(yīng)用同廣州市也發(fā)《廣州市人工智能產(chǎn)業(yè)鏈高質(zhì)量發(fā)展三年行動(dòng)計(jì)劃《規(guī)劃提到對(duì)大模型及其上下游產(chǎn)業(yè)生態(tài)鏈的布局要求和對(duì)相關(guān)技術(shù)平臺(tái)在落地應(yīng)用時(shí)的可靠性把握針對(duì)昇騰云從訊飛等開放平未來(lái)將重點(diǎn)關(guān)注產(chǎn)業(yè)技術(shù)生態(tài)的塑促進(jìn)AI精準(zhǔn)賦提升人工智能應(yīng)用的安全性與可信性。大模型的技術(shù)特點(diǎn)實(shí)現(xiàn)方式以及場(chǎng)景應(yīng)用能力均“十四五時(shí)期政策期望相能夠有效解決人工智能所面臨的部分挑戰(zhàn)在場(chǎng)景驅(qū)動(dòng)下大模型技術(shù)將不斷迭代發(fā)展數(shù)據(jù)的增長(zhǎng)和算力的發(fā)展也賦能模型訓(xùn)練和平臺(tái)優(yōu)形成技術(shù)供給和場(chǎng)景需求互通演進(jìn)的持續(xù)創(chuàng)新力。大模型成為AI開發(fā)新范式人工智能發(fā)展的挑戰(zhàn)與阻礙數(shù)據(jù)算法算力是AI發(fā)展的驅(qū)動(dòng)力也是瓶頸所在數(shù)據(jù)算法和算力是人工智能的三大要素在核心技術(shù)發(fā)展以及應(yīng)用落地中起著至關(guān)重要的作用三者互相作用形成對(duì)人工智能的正向推動(dòng)力人工智能企業(yè)多數(shù)都是使用開源框架自建數(shù)據(jù)庫(kù)購(gòu)買算力的方式進(jìn)行研究但是隨著企業(yè)信息化和數(shù)字化的發(fā)展帶來(lái)AI場(chǎng)景多樣化和數(shù)據(jù)的井噴式增隨之也使得算法的復(fù)雜度急劇提升算力的消耗成倍增導(dǎo)致不少企業(yè)發(fā)展受亟需技術(shù)與產(chǎn)品的突破來(lái)解決AI所面臨的問(wèn)題。信息化的發(fā)展使得數(shù)據(jù)量爆發(fā)式增帶來(lái)數(shù)“寶藏的同時(shí)也對(duì)技術(shù)提出更多挑戰(zhàn)數(shù)據(jù)是AI發(fā)展的基石隨著人工智能區(qū)塊鏈IoT等新興技術(shù)的發(fā)展中國(guó)乃至全球的數(shù)據(jù)規(guī)模都將高速增長(zhǎng)據(jù)IDC統(tǒng)計(jì)中國(guó)數(shù)據(jù)規(guī)模將從2021年的18.51ZB增長(zhǎng)至2026年的56.16ZB年均增長(zhǎng)速度CAGR為24.9增速位居全球第一。250200150100500
圖3全球數(shù)據(jù)圈按地區(qū)劃2021-202(單位ZB)56.1658.99100.8432.2959.2839.2670.6348.5884.56中國(guó)數(shù)據(jù)量規(guī)模CAGR24.9為全球第一56.1658.99100.8432.2959.2839.2670.6348.5884.5618.5121.7742.1922.7326.5249.7244.4635.6428.372021 2022 2023 2024 2025 202618.5121.7742.1922.7326.5249.7244.4635.6428.37中國(guó) 北美 其他地區(qū)來(lái)源IDCGlobalDataSpher2022注IDC將每年被創(chuàng)建采集或復(fù)制的數(shù)據(jù)集合定義為數(shù)據(jù)(DataSphere)隨著數(shù)據(jù)量的高速增長(zhǎng)數(shù)據(jù)特征高維模態(tài)格式多樣的趨勢(shì)也逐漸明顯對(duì)數(shù)據(jù)的AI建模也相應(yīng)地更加復(fù)雜涉及到研究對(duì)象的多變量維度如時(shí)間空間維度計(jì)算復(fù)雜度會(huì)隨之呈指數(shù)增加數(shù)據(jù)標(biāo)注難度也會(huì)增加同海量的數(shù)據(jù)將不可避免帶來(lái)更大的數(shù)據(jù)噪聲問(wèn)題數(shù)據(jù)偏見(jiàn)風(fēng)為模型如何有效利用好數(shù)據(jù)學(xué)習(xí)其中的知識(shí)帶來(lái)更大挑戰(zhàn)。數(shù)據(jù)是產(chǎn)業(yè)智能化發(fā)展中最寶貴的資源海量的數(shù)據(jù)為人工智能自監(jiān)督學(xué)習(xí)帶來(lái)巨大助力利用好爆發(fā)增長(zhǎng)的海量數(shù)將會(huì)是企業(yè)充分挖掘數(shù)據(jù)紅利構(gòu)建數(shù)字經(jīng)濟(jì)下競(jìng)爭(zhēng)壁壘的重要抓手。應(yīng)用場(chǎng)景多元化和復(fù)雜增加了模型生產(chǎn)的難度隨著AI技術(shù)的發(fā)展產(chǎn)業(yè)應(yīng)用的深入應(yīng)用場(chǎng)景變得更多元更復(fù)雜例如工業(yè)場(chǎng)景下有工業(yè)質(zhì)檢、安全巡檢等應(yīng)質(zhì)檢中不同產(chǎn)線生產(chǎn)的零部件千差萬(wàn)別智能辦公場(chǎng)景文檔的分類文檔OCR識(shí)別文檔知識(shí)抽取文檔審校也都是不同的任務(wù)類型解決一個(gè)場(chǎng)景的問(wèn)往往需要多個(gè)任務(wù)的深度融涉及多任務(wù)統(tǒng)一建模等問(wèn)因而對(duì)算法提出了更高的挑戰(zhàn)按照現(xiàn)在主流的算法應(yīng)這意味著技術(shù)廠商需要針對(duì)不同場(chǎng)景不同任務(wù)生產(chǎn)大量的算法或模型一方面這將會(huì)導(dǎo)致重復(fù)性工作量加大另一方面也對(duì)開發(fā)人員的算法能力和業(yè)務(wù)理解有更高的要求隨著智能化轉(zhuǎn)型的需求增加AI開發(fā)門檻和研發(fā)效率問(wèn)題凸顯。應(yīng)用復(fù)雜度攀算力承壓持續(xù)增加算力是AI發(fā)展的基礎(chǔ)設(shè)施是通過(guò)對(duì)信息數(shù)據(jù)進(jìn)行處理實(shí)現(xiàn)目標(biāo)結(jié)果輸出的計(jì)算能力除了要求提升計(jì)算能技術(shù)的發(fā)展對(duì)于軟硬件也提出了新的要求目前整體市場(chǎng)發(fā)展還不及預(yù)具體來(lái)硬件方面需要針對(duì)不同的場(chǎng)景和高性能計(jì)算能力進(jìn)行拓展融合滿足研發(fā)企業(yè)的多芯部署分布式優(yōu)化高性能計(jì)算的需求目前人工智能芯片主要有GPUFPGA和ASIC等類從英偉達(dá)GPU的發(fā)展可以看出算力內(nèi)存網(wǎng)絡(luò)傳輸?shù)榷荚谔嵘?jì)算能力逐步增強(qiáng)但在產(chǎn)業(yè)落地應(yīng)用中的成本還相對(duì)較高隨著分布式訓(xùn)練的發(fā)數(shù)據(jù)存儲(chǔ)和網(wǎng)絡(luò)傳輸問(wèn)題成為大模型訓(xùn)練的瓶頸目前In?niBan已經(jīng)可以支持節(jié)點(diǎn)內(nèi)以及節(jié)點(diǎn)之間高吞吐低延遲的數(shù)據(jù)互緩解網(wǎng)絡(luò)傳輸?shù)膯?wèn)但數(shù)據(jù)存儲(chǔ)仍存在挑需要新技術(shù)的出現(xiàn)來(lái)解決在軟件方廠商需要打造完整的開發(fā)軟件支持計(jì)算密集型算子和訪存密集型算子協(xié)同編譯優(yōu)增強(qiáng)通用性編程能滿足企業(yè)針對(duì)不同訓(xùn)練推理數(shù)據(jù)格式和量級(jí)進(jìn)行底層編譯以及融合調(diào)度和統(tǒng)一運(yùn)營(yíng)管理的需求在整體軟件棧中深度學(xué)習(xí)平臺(tái)尤為重可以提供覆蓋AI能力生產(chǎn)運(yùn)用管理等全流程的工程化實(shí)踐方法推動(dòng)產(chǎn)業(yè)鏈上下游協(xié)同創(chuàng)新聯(lián)動(dòng)底層算力數(shù)據(jù)和上層應(yīng)用服打破企業(yè)在數(shù)字化轉(zhuǎn)型升級(jí)中面臨的多種瓶解決數(shù)據(jù)成本高模型開發(fā)難算力分配不合理等問(wèn)題。2.1.2中國(guó)人工智能的其他挑戰(zhàn)與阻礙2022年是實(shí)現(xiàn)產(chǎn)業(yè)數(shù)字化的元人工智能加快賦能千行百與實(shí)體經(jīng)濟(jì)深度綁在醫(yī)療城市、工業(yè)能源金融等領(lǐng)域進(jìn)一步落地應(yīng)給企業(yè)帶來(lái)了新的發(fā)展方,除了底層數(shù)據(jù)算法和算力對(duì)人工智能發(fā)展所帶來(lái)的瓶頸以IDC認(rèn)為人工智能領(lǐng)域還面臨三大維度下的挑戰(zhàn)。數(shù)據(jù)互通壁壘明共建生態(tài)存在阻礙新一代信息技術(shù)與產(chǎn)業(yè)的深度融合擴(kuò)大了網(wǎng)絡(luò)空間的邊界數(shù)據(jù)作為一種新的生產(chǎn)要素已成為推動(dòng)企業(yè)智能化升級(jí)的重要資源但同時(shí)流轉(zhuǎn)無(wú)序區(qū)域性限制大定價(jià)機(jī)制不完善監(jiān)管機(jī)制不完備等問(wèn)導(dǎo)致數(shù)據(jù)不流數(shù)據(jù)對(duì)數(shù)字經(jīng)濟(jì)的放大和疊加作用沒(méi)有得到充分發(fā)揮數(shù)據(jù)的流通和共享是釋放數(shù)字紅利的前提高數(shù)據(jù)流通性可以推動(dòng)社會(huì)資源配置的優(yōu)化節(jié)約社會(huì)成本為此需要明確數(shù)據(jù)的權(quán)責(zé)完善政策規(guī)范數(shù)據(jù)的使推動(dòng)數(shù)據(jù)共享流支撐人工智能技術(shù)的高速發(fā)展。技術(shù)門檻平臺(tái)層挑戰(zhàn)不斷AI算法的開發(fā)與模型訓(xùn)練調(diào)優(yōu)有著一定的技術(shù)門需要進(jìn)一步依托在算法框架上的產(chǎn)品與工具套降低AI開發(fā)門檻因深度學(xué)習(xí)與大模型平臺(tái)需要向下銜接硬件向上承接應(yīng)用未來(lái)不管是訓(xùn)練還是推硬件的種類會(huì)變得非常繁向平臺(tái)層提出了更高的銜接要求同時(shí)隨著AI規(guī)?;涞氐男枨笤銎脚_(tái)面向?qū)嶋H應(yīng)用需要持續(xù)降低模型開發(fā)的學(xué)習(xí)門檻降低模型優(yōu)化難度當(dāng)開發(fā)平臺(tái)發(fā)展重點(diǎn)在于提供專業(yè)且豐富的技術(shù)組向下驅(qū)動(dòng)算子和數(shù)據(jù)管理工具的高性能延向上帶動(dòng)產(chǎn)品線研發(fā)并推動(dòng)門檻的降低。人才儲(chǔ)備不技術(shù)發(fā)展受限除了技術(shù)戰(zhàn)略部署資金投入等問(wèn)題以外智能化發(fā)展所遇到的最大挑戰(zhàn)便是人才短缺IDC預(yù)計(jì)到2025全球500強(qiáng)中有一半的企業(yè)將自己開發(fā)軟這將加劇企業(yè)軟件人才不足的問(wèn)題隨著人工智能落地場(chǎng)景的復(fù)雜度增需要更多既懂業(yè)務(wù)又能運(yùn)用AI技術(shù)的綜合型創(chuàng)新人才目前企業(yè)和高校的合作可促進(jìn)人才的優(yōu)化配高校為企業(yè)提供技術(shù)的理論學(xué)習(xí)企業(yè)為學(xué)校提供有效的實(shí)踐基地經(jīng)濟(jì)全球化的發(fā)展不斷促進(jìn)社會(huì)資源流動(dòng)資源配置方式根本性變革極大提高了資源的利用率但目前來(lái)看人才缺口仍然存在未來(lái)需要進(jìn)一步建立人才合作培養(yǎng)生態(tài)接受人才及技術(shù)在機(jī)構(gòu)間的循環(huán)流動(dòng)同時(shí)推動(dòng)降低技術(shù)接觸年齡提前布局儲(chǔ)備年輕人才力量。大模型帶來(lái)AI開發(fā)新范式面對(duì)人工智能的各種挑預(yù)訓(xùn)練大模型的出現(xiàn)提供了通用化解決方從無(wú)標(biāo)注數(shù)據(jù)中通過(guò)自監(jiān)學(xué)習(xí)獲取大“知識(shí)實(shí)現(xiàn)用更統(tǒng)一的方式推動(dòng)人工智能產(chǎn)業(yè)落地。大模型增強(qiáng)人工智能泛化性通用性在過(guò)去每一次關(guān)鍵技術(shù)的通用性得到解決后生產(chǎn)方式都有巨大改變生產(chǎn)水平也產(chǎn)生質(zhì)的飛躍人工智能是第四次工業(yè)革命的重要驅(qū)動(dòng)力所以提升人工智能的通用性是加速產(chǎn)業(yè)智能化升級(jí)的關(guān)鍵。“大模型是打通人工智能技術(shù)通用“任督二脈的關(guān)鍵過(guò)去在分散化的模型研發(fā)模式單一的AI應(yīng)用場(chǎng)景下多個(gè)任務(wù)需要由多個(gè)模型共同支撐完每一個(gè)模型建設(shè)都需要算法開發(fā)數(shù)據(jù)處理模型訓(xùn)練與調(diào)優(yōu)過(guò)程預(yù)訓(xùn)練大模型增強(qiáng)了人工智能的通用性泛化性基于大模型通過(guò)零樣本或小樣本精調(diào)就可實(shí)現(xiàn)在多種任務(wù)上的較好效果大?!邦A(yù)訓(xùn)練+精調(diào)等模式帶來(lái)了新的標(biāo)準(zhǔn)化AI研發(fā)范實(shí)現(xiàn)AI模型在更統(tǒng)一簡(jiǎn)單的方式下規(guī)模化生產(chǎn)。大模型降低人工智能應(yīng)用門檻大模型基“預(yù)訓(xùn)練+精調(diào)等新范式有效降低AI開發(fā)門檻具體來(lái)大模型的通用性泛化性以及基“預(yù)訓(xùn)練+精調(diào)等新開發(fā)范讓AI場(chǎng)景應(yīng)用的模型定制流程變得更標(biāo)準(zhǔn)化效果優(yōu)化更簡(jiǎn)有效降低對(duì)標(biāo)注數(shù)據(jù)算法人員能力的要求圍繞大模型布局相關(guān)的AI開發(fā)工具組件與平將大幅加速人工智能大規(guī)模產(chǎn)業(yè)化進(jìn)程例如百度文心大模型在模型層構(gòu)建了基(包括NLPCV跨模態(tài)等任(對(duì)話搜索OCR等行(能源金融制造傳媒等三層大模型體系深入考慮各大應(yīng)用場(chǎng)景特性向上打造工具與平臺(tái)層將大模型能力在開發(fā)平臺(tái)與套件中輸出封裝模型訓(xùn)練與精調(diào)模型壓縮與部署各環(huán)節(jié)等這些都極大降低了AI開發(fā)門讓更多企業(yè)或開發(fā)者可以低成本高效率地獲得AI能應(yīng)用到自己的業(yè)務(wù)中。深度學(xué)習(xí)平臺(tái)為大模型發(fā)展與應(yīng)用護(hù)航深度學(xué)習(xí)平臺(tái)的發(fā)展已相對(duì)成大模型的出現(xiàn)對(duì)深度學(xué)習(xí)平臺(tái)來(lái)說(shuō)“如虎添翼”深度學(xué)習(xí)平臺(tái)面向多樣的產(chǎn)業(yè)需基于開源框架提供算法模型以及工作組件和平臺(tái)能向下協(xié)調(diào)度硬件算向上支持各項(xiàng)任包含開發(fā)框架算法模型以及工具平臺(tái)三大核心層呈現(xiàn)出標(biāo)準(zhǔn)化自動(dòng)化模塊化特性大模型則進(jìn)一步增強(qiáng)模型通用性和泛化性帶來(lái)新的模型開發(fā)范式深度學(xué)習(xí)平臺(tái)與大模型合力將進(jìn)一步降低模型開發(fā)門檻提升研發(fā)效率貫通了從硬件適配模型訓(xùn)練研發(fā)部到場(chǎng)景應(yīng)用的AI全產(chǎn)業(yè)鏈。深度學(xué)習(xí)平臺(tái)底層開發(fā)框架成為大模型與算力之間的橋梁ASIC等芯通過(guò)簡(jiǎn)化底層硬件技在大模型與算力之間建立溝通針對(duì)不同的模型和硬將資源抽象成統(tǒng)一的分布式資源視圖通過(guò)底層硬件感知和映射功能找到軟硬之間的最優(yōu)組合并將模型的運(yùn)算步驟分配到相應(yīng)的計(jì)算卡達(dá)到負(fù)載均衡提升大模型訓(xùn)推性能的目的。深度學(xué)習(xí)平臺(tái)助力大模型解決訓(xùn)練推理部署困難問(wèn)題超大模型訓(xùn)練推理需要消耗密集和昂貴的算力等資源對(duì)算法本身提出了極高的要求在海量數(shù)據(jù)上訓(xùn)練百億千億萬(wàn)億的參數(shù)對(duì)模型訓(xùn)練速度模型精度以及訓(xùn)練資源成本都是極大的挑戰(zhàn)深度學(xué)習(xí)平臺(tái)通過(guò)超大規(guī)模并行方支撐大模型高效高性價(jià)比訓(xùn)練超大規(guī)模的模型參也讓模型預(yù)測(cè)單次的成本與耗時(shí)都大幅提成為規(guī)?;漠a(chǎn)業(yè)應(yīng)用瓶頸深度學(xué)習(xí)平臺(tái)通過(guò)提供量化稀疏蒸餾剪枝等能力幫助大模型在精度無(wú)損的情況下進(jìn)行壓縮推動(dòng)大模型輕量化和模型推理加速為產(chǎn)業(yè)大規(guī)模應(yīng)用做好保障。大模型與深度學(xué)習(xí)平臺(tái)相輔相將會(huì)持續(xù)釋放紅并滲透到各行各業(yè)的場(chǎng)景中。未以大模型為生態(tài)基座的產(chǎn)業(yè)鏈將成為智能化升級(jí)過(guò)程中可大規(guī)模復(fù)用的基礎(chǔ)設(shè)施在大模型用性泛化性以及降低人工智能應(yīng)用門檻的優(yōu)勢(shì)推動(dòng)人工智能也將會(huì)加快落形成新的機(jī)遇。大模型加速產(chǎn)業(yè)智能化變革大模型帶來(lái)AI技術(shù)與應(yīng)用變革潛能被廣泛驗(yàn)證NLP大模型自然語(yǔ)言處(NaturalLanguageProcessinNLP是用計(jì)算機(jī)來(lái)模擬延伸及拓展人類語(yǔ)言能力的理論技術(shù)及方法是融合語(yǔ)言學(xué)計(jì)算機(jī)科學(xué)數(shù)學(xué)等于一體的綜合性學(xué)科自然語(yǔ)言處理目前面臨的關(guān)鍵問(wèn)題是人類語(yǔ)言的復(fù)雜性和多樣例如同樣的詞匯在不同的語(yǔ)境之下意思不完全一致日常用語(yǔ)中的反諷等反向情感表達(dá)句式結(jié)構(gòu)的多變和缺失所引發(fā)的歧義以及方言“行話等語(yǔ)言個(gè)性化特點(diǎn)。近十年來(lái)深度學(xué)習(xí)成為NLP模型研發(fā)的主流技術(shù)框架帶來(lái)了巨大的進(jìn)步但仍然受限于對(duì)大量有標(biāo)注數(shù)據(jù)的依賴模型泛化性通用性仍有不足近幾年隨著預(yù)訓(xùn)練技術(shù)的發(fā)展算力提升以及NLP領(lǐng)域的海量數(shù)據(jù)和任務(wù)特大規(guī)模預(yù)訓(xùn)練模型首先在該領(lǐng)域取得突破2018隨著BERT的誕,大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型利用海量的無(wú)標(biāo)注文本自監(jiān)督學(xué)習(xí)即可深入掌握大量語(yǔ)言知識(shí)刷新多個(gè)AI權(quán)威榜單記錄3億參數(shù)的BERT模型在權(quán)威通用語(yǔ)言理解類評(píng)測(cè)榜單GLUE上的11個(gè)任務(wù)刷新紀(jì)錄將基準(zhǔn)值推至80.4%絕對(duì)提升了7.6個(gè)點(diǎn)在機(jī)器閱讀理解頂級(jí)水平測(cè)試SQuAD1.1的全部?jī)蓚€(gè)衡量指標(biāo)上超越人類平均水平由OpenAI推出的GPT系列模不僅在效果上刷新了多項(xiàng)記更是表現(xiàn)出高水平的生成能力開放的API服務(wù)催生孵化了系列創(chuàng)新產(chǎn)品國(guó)內(nèi)文心ERNIE系列大模型在GLUE上實(shí)現(xiàn)9個(gè)任務(wù)突破90ERNIE3.0系列在問(wèn)答分類情感分析抽取識(shí)別等93個(gè)典型NLP任務(wù)上刷新業(yè)界紀(jì)錄百度文心系列大模型已應(yīng)用于百度搜索信息流小度等重要產(chǎn)品服務(wù)數(shù)億用也被廣泛應(yīng)用于百度智能云的智能文檔審??头犬a(chǎn)品中。CV大模型計(jì)算機(jī)視(ComputerVisioCV是指使用計(jì)算機(jī)及相關(guān)設(shè)備來(lái)模擬生物視覺(jué)的技即基于傳統(tǒng)或深度學(xué)習(xí)算法賦能計(jì)算機(jī)理解數(shù)字圖像和視頻并從各種模態(tài)的數(shù)據(jù)之中提取目標(biāo)信息其主要目標(biāo)是開“機(jī)器之眼不僅讓計(jì)算機(jī)具備視覺(jué)能更讓計(jì)算機(jī)識(shí)別理“看到的多模態(tài)數(shù)據(jù)。計(jì)算機(jī)視覺(jué)作為人工智能和深度學(xué)習(xí)的子領(lǐng)目前主要以深度卷積神經(jīng)網(wǎng)(CNN和Transform-er為支針對(duì)各個(gè)應(yīng)用場(chǎng)景開發(fā)優(yōu)化類人視覺(jué)功例如廠商利用圖像識(shí)別圖像和視頻搜索視頻合成等技術(shù)應(yīng)用于汽車交通媒體標(biāo)簽等常用場(chǎng)景當(dāng)前技術(shù)上的瓶頸包括雜物遮擋識(shí)別角度等問(wèn)題。計(jì)算機(jī)視覺(jué)大模型發(fā)展迅速比如2021年150億參數(shù)的V-MoE被推出該模型表現(xiàn)出大模型在縮放視覺(jué)模型方面的潛并在ImageNet上準(zhǔn)確率達(dá)到了90.35%此V-MoE具有可擴(kuò)展其表示能力和遷移能力表現(xiàn)為SOTA國(guó)內(nèi)廠商也逐漸開始在計(jì)算機(jī)視覺(jué)方面深入探索盤古CV大模型在ImageNet數(shù)據(jù)集的線性分類評(píng)估上達(dá)到了與全監(jiān)督相比擬的結(jié)果在應(yīng)用方面可提供OCR文字識(shí)別服務(wù)支持通用類證件類行業(yè)類以及自定義模板識(shí)別等多個(gè)場(chǎng)景落地應(yīng)用目前已經(jīng)在TFDS圖像自動(dòng)識(shí)別精度上超過(guò)人類檢測(cè)員水平另外通用視覺(jué)?!皶↖NTERN在任務(wù)上也有優(yōu)異的表在目標(biāo)檢測(cè)任務(wù)上平均錯(cuò)誤率降低了47.3%據(jù)了“書生只需要少量的下游數(shù)就能超過(guò)CLIP基于完整下游數(shù)據(jù)的準(zhǔn)確度。表1NLP&CV發(fā)展現(xiàn)狀與挑戰(zhàn)對(duì)比NLPCV現(xiàn)狀分別在語(yǔ)言理解與生成智能創(chuàng)作機(jī)器翻譯智能對(duì)話知識(shí)圖譜和定制化語(yǔ)言解決方案落地整體算法發(fā)展順數(shù)據(jù)源可獲得性較強(qiáng)2D數(shù)據(jù)工業(yè)質(zhì)檢智慧城市落地完善應(yīng)用場(chǎng)景多可商業(yè)化市場(chǎng)大擁有最佳實(shí)踐人臉OCR識(shí)別發(fā)展較為成熟挑戰(zhàn)語(yǔ)言的歧義文化差異及多樣化情感分析困難3D/4D數(shù)據(jù)識(shí)別面臨變形光照遮擋等可以依靠大規(guī)模預(yù)訓(xùn)練模型解決部分痛點(diǎn)的問(wèn)題數(shù)字人數(shù)字孿生的數(shù)據(jù)獲取困算法處理復(fù)雜預(yù)期未來(lái)發(fā)以多個(gè)數(shù)據(jù)信息維度約束來(lái)驗(yàn)證情感分析及文本分析的準(zhǔn)確性打通數(shù)據(jù)融合以突破3D/4D獲取瓶頸來(lái)源IDC多模態(tài)大模型多模態(tài)大模型的發(fā)展從OpenAI的CLIP(文本圖像匹配)以及Dall·(文生圖拉開帷幕目前跨多個(gè)模態(tài)的數(shù)據(jù)融合問(wèn)題開始變成行業(yè)探究的重點(diǎn)多模態(tài)是指多個(gè)模態(tài)感知與認(rèn)知的融合對(duì)于人類說(shuō)所有感知交互方式的融合形成了社會(huì)交流對(duì)于計(jì)算機(jī)來(lái)說(shuō)是通過(guò)對(duì)文本圖片視頻和音頻等不同儲(chǔ)存信息載體的認(rèn)知和理結(jié)合環(huán)境因素來(lái)模擬人與人之間的交互方式多模態(tài)技術(shù)的重要不言而喻讓人工智能理解人類世界的最優(yōu)辦法就是讓AI成功理解多模態(tài)信息并能夠?qū)Υ祟愋畔⑿纬煞治鐾评淼倪壿嫼蜕尚滦畔⒌哪芰?。近年?lái)大模型技術(shù)發(fā)展推動(dòng)多模態(tài)模型不斷升級(jí)迭代首先預(yù)訓(xùn)練大模型賦能多模態(tài)機(jī)器學(xué)習(xí)的廣度和深例如通用性AI大模型M十萬(wàn)億級(jí)的參數(shù)持續(xù)提高模型上賦能模型應(yīng)用的通用進(jìn)而拓寬大模型應(yīng)用廣度覆蓋電商智能交互等業(yè)務(wù)場(chǎng)景同時(shí)多模態(tài)預(yù)訓(xùn)練模型mPLUG榮登全球權(quán)“機(jī)器視覺(jué)問(wèn)答榜單(VQAChallenge2021榜并超越了人類平均水平此多模態(tài)大模型能夠?qū)崿F(xiàn)圖像文本語(yǔ)音等模態(tài)之間的統(tǒng)一表示和相互生成例百度文心ERNIE-ViLG2.0文生大模型在公開權(quán)威評(píng)測(cè)集MS-COCO和人工盲評(píng)中效果位于前在語(yǔ)義可控性圖像清晰度中文化理解等方面均展現(xiàn)出優(yōu)初步實(shí)現(xiàn)在多個(gè)場(chǎng)景的商業(yè)應(yīng)用。我們看頭部廠商在多模態(tài)大模型領(lǐng)域持續(xù)布注重模型整體通用性的同時(shí)不斷提升子領(lǐng)域的化體驗(yàn)和技術(shù)升級(jí)未基于技術(shù)的不斷突多模態(tài)將持續(xù)拓展各行業(yè)場(chǎng)景下的信息融合應(yīng)用。3.1.4科學(xué)計(jì)算大模型科學(xué)計(jì)算領(lǐng)域近年來(lái)發(fā)展態(tài)勢(shì)向好持續(xù)推進(jìn)技術(shù)突破科學(xué)計(jì)算指的是通過(guò)計(jì)算機(jī)高效率完成再現(xiàn)預(yù)測(cè)和發(fā)現(xiàn)客觀世界運(yùn)動(dòng)規(guī)律及演化特征的全過(guò)即出于解決科學(xué)和工程中的復(fù)雜數(shù)學(xué)問(wèn)題的目?jī)?yōu)化計(jì)算機(jī)性能以完成數(shù)值計(jì)算。近年“AI+科學(xué)計(jì)算(科學(xué)智能也在引發(fā)科研方式的大變革如生物制藥氣象預(yù)報(bào)地震探測(cè)材料研發(fā)等科研領(lǐng)域大模型技術(shù)同樣也在這些領(lǐng)域帶來(lái)巨大的突破科學(xué)計(jì)算的子領(lǐng)域生物計(jì)算(Bio-computing即基于生物學(xué)固有理論信息和大量的生物學(xué)實(shí)驗(yàn)結(jié)果及研究分析開發(fā)的解決物學(xué)問(wèn)題的計(jì)算模型正是走在前列的科研方向2021年以來(lái)生物計(jì)算領(lǐng)域持續(xù)突破例如Deep-Mind推出的AlphaFold2能夠覆蓋98.5%的人類蛋白質(zhì)組并對(duì)20種其他生物蛋白質(zhì)的結(jié)構(gòu)進(jìn)行預(yù)測(cè)同該公司與EMB-EI歐洲分子生物學(xué)實(shí)驗(yàn)室合推出蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)以儲(chǔ)備和匹配蛋白質(zhì)3D結(jié)構(gòu)圖像各大企業(yè)自此之后紛紛提出AIforScience的概著手利用人工智能技術(shù)加快點(diǎn)科學(xué)技術(shù)研發(fā)與突破目國(guó)內(nèi)市場(chǎng)活躍產(chǎn)品有頭部廠商打造的通用大模融合自監(jiān)督和多任務(wù)學(xué)習(xí)以賦能生物醫(yī)藥行業(yè)例如百度文心的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)大模型化合物表征學(xué)習(xí)大模型等此外也有專注于生物計(jì)算大模型以發(fā)現(xiàn)靶點(diǎn)研發(fā)新藥的百圖生科以及醫(yī)藥知識(shí)圖譜平臺(tái)德睿智藥等?!澳P?工具平臺(tái)+生態(tài)三級(jí)協(xié)同加速產(chǎn)業(yè)智能化新一代信息技術(shù)與產(chǎn)業(yè)的深度融合是搶占數(shù)字經(jīng)濟(jì)發(fā)展領(lǐng)先地位的必然選擇人工智能是新一輪科技革命中和產(chǎn)業(yè)交叉最密集的技術(shù)對(duì)AI核心驅(qū)動(dòng)要素的潛能激正在從生產(chǎn)規(guī)則落地方式商業(yè)模式等多維度重塑產(chǎn)業(yè)智能化。大模型增強(qiáng)了AI技術(shù)的通用讓開發(fā)者以更低成本更低門面向場(chǎng)景研發(fā)更好的AI模助力普惠AI的實(shí)現(xiàn)但目前基礎(chǔ)大模型距離大規(guī)模產(chǎn)業(yè)應(yīng)用并成為產(chǎn)業(yè)基座還有很長(zhǎng)的一段路要走不僅需要有與場(chǎng)景深度融合的大模型體也需要有支持全流程應(yīng)用落地的專業(yè)工具和平還需要開放的生態(tài)來(lái)激發(fā)創(chuàng)新三層之間交互賦能才能形成良性循環(huán)的產(chǎn)業(yè)智能化生態(tài)共同體我們看到OpenAI在開發(fā)GPT大模型的過(guò)程中具有相似的思在不斷加強(qiáng)大模型本身性能的同將GPT打包成產(chǎn)品對(duì)外提供API服務(wù)相關(guān)開發(fā)者企業(yè)學(xué)術(shù)機(jī)構(gòu)以及高校都可以申請(qǐng)使用開放后大量開發(fā)者利用API開發(fā)出了各種各樣的功例如翻譯機(jī)網(wǎng)站生成器等OpenAI則通過(guò)用戶獲取了更多的行為數(shù)形成了對(duì)GPT的反哺由此可“模型+工具平臺(tái)+生態(tài)三層共建有助于業(yè)務(wù)的良性循也更容易借助長(zhǎng)期積累形成競(jìng)爭(zhēng)壁壘。 全面開花 通過(guò)生態(tài)賦能開發(fā)者 全面開花 通過(guò)生態(tài)賦能開發(fā)者反哺反哺為抓手以大模型為底以工具平臺(tái)支撐來(lái)源IDC模型層是大模型能力的核心引擎模型層從技術(shù)發(fā)展與產(chǎn)業(yè)應(yīng)用出主要包含基礎(chǔ)任務(wù)行業(yè)大模模型的訓(xùn)練要求算力消耗建設(shè)人員主要為高級(jí)算法人員基礎(chǔ)大模型主要優(yōu)勢(shì)在于其通用可以讓該技術(shù)方向的相關(guān)應(yīng)用任務(wù)都得到進(jìn)一步提但也正是這樣的優(yōu)勢(shì)導(dǎo)致基礎(chǔ)大模型在行業(yè)任務(wù)中表現(xiàn)尚未最優(yōu)任務(wù)大模型是在基礎(chǔ)大模型上面向典型的任務(wù)如對(duì)話搜索文檔智能人臉識(shí)別OCR等進(jìn)一步結(jié)合任務(wù)特性優(yōu)化模型算法學(xué)習(xí)任務(wù)相關(guān)數(shù)據(jù)與知識(shí)從而使得大模型在任務(wù)上表現(xiàn)出更優(yōu)異的效果很多任務(wù)甚至可以零樣本直接應(yīng)用行業(yè)大模型是在基礎(chǔ)或任務(wù)大模型上進(jìn)一步融合行業(yè)數(shù)據(jù)知識(shí)以及專家經(jīng)驗(yàn)提升大模型對(duì)行業(yè)應(yīng)用的適配性目前在金融能源制造傳媒城市等已經(jīng)有頭部企業(yè)或機(jī)構(gòu)與科技公司或科研單位聯(lián)合發(fā)布了行業(yè)大模型基礎(chǔ)+任務(wù)+行業(yè)三層大模型相互促共同支撐起產(chǎn)業(yè)轉(zhuǎn)化。工具平臺(tái)層將大模型落地研發(fā)標(biāo)準(zhǔn)推動(dòng)AI廣泛落地大模型在深度學(xué)習(xí)平臺(tái)的有力支撐下,實(shí)現(xiàn)了高效生產(chǎn)并真正為產(chǎn)業(yè)所深度學(xué)習(xí)平臺(tái)為大模型解決硬件適提供蒸餾剪枝壓縮等技術(shù)并向外輸出部署方案支撐自然語(yǔ)言處理計(jì)算機(jī)視覺(jué)跨模態(tài)等各類大模型的應(yīng)用同時(shí)基于深度學(xué)習(xí)平臺(tái)進(jìn)一步推出基于大模型的AI開發(fā)平臺(tái)工具套件大模型API等將基于大模型的精調(diào)大模型能力調(diào)用產(chǎn)品讓更多AI應(yīng)用型開發(fā)者或業(yè)務(wù)??梢粤汩T檻或低門檻地將大模型應(yīng)用于自己的業(yè)務(wù)以此全面釋放大模型效助力開發(fā)者效率提升。生態(tài)層是基于大模型能力打造共創(chuàng)共享社區(qū)大?!邦A(yù)訓(xùn)練+精調(diào)的新研發(fā)范式讓AI在識(shí)別理解生成等方面的能力實(shí)現(xiàn)突破帶來(lái)深度語(yǔ)義理解智能交互內(nèi)容生成的技術(shù)與產(chǎn)品變革動(dòng)能打造基于大模型能力的生提供能力工具服連接供吸引更多的開發(fā)者和企業(yè)共創(chuàng)共是釋放大模型潛力的重要路徑?!澳P?工具平臺(tái)+生態(tài)的模式需要協(xié)同優(yōu)拓寬人工智能技術(shù)落地的場(chǎng)景覆蓋廣加深產(chǎn)業(yè)實(shí)應(yīng)用的深共同加速產(chǎn)業(yè)智能推動(dòng)人工智能技術(shù)賦能千行百惠及千家萬(wàn)戶。3.3大模型加深度學(xué)習(xí)平臺(tái)正在成為產(chǎn)業(yè)智能化基座大模型推動(dòng)人工智能向著通用化工業(yè)化集約化發(fā)展大模型是人工智能走向工程化應(yīng)用落地的重要手段當(dāng)人工智能已經(jīng)從安防識(shí)別智能推薦語(yǔ)音對(duì)話等多種應(yīng)用場(chǎng)景進(jìn)入社會(huì)生產(chǎn)生活隨著產(chǎn)業(yè)發(fā)展需求層級(jí)的不斷深入以及數(shù)字經(jīng)濟(jì)智能經(jīng)濟(jì)數(shù)字化轉(zhuǎn)型新基建等政策的加快推人工智能賦能千行百業(yè)以實(shí)現(xiàn)大規(guī)模工程化應(yīng)用落地迎來(lái)高速發(fā)展的窗口期如何縮短人工智能研發(fā)周期降低開發(fā)應(yīng)用成本提升實(shí)際工作效已成為各行業(yè)關(guān)注的核心問(wèn)題大模型具備場(chǎng)景通用性和泛化性、工程標(biāo)準(zhǔn)化大模型建設(shè)集約化的特性可以滿足實(shí)際產(chǎn)業(yè)發(fā)展中的應(yīng)用需求提供高水平能力的工程化實(shí)踐案打造智能化升級(jí)的基礎(chǔ)底座。一是場(chǎng)景應(yīng)用中的通用性與泛化性通過(guò)學(xué)習(xí)海量數(shù)大模型可以不斷豐富模型參數(shù)和模型結(jié)構(gòu)此通過(guò)引入相關(guān)知將數(shù)據(jù)與知識(shí)相結(jié)大模型能擁有更高的識(shí)別水平和模型遷移在廣泛的基礎(chǔ)任務(wù)和特定行業(yè)任務(wù)上均表現(xiàn)出較好的效果僅需少量特定標(biāo)注數(shù)據(jù)訓(xùn)練就可實(shí)現(xiàn)快速落地?fù)Q句話說(shuō)大模型作基礎(chǔ)設(shè)在上面進(jìn)行簡(jiǎn)單的微調(diào)優(yōu)將能夠建造不同的建筑。二是工程標(biāo)準(zhǔn)化深度學(xué)習(xí)平臺(tái)本身已具備標(biāo)準(zhǔn)化特深度學(xué)習(xí)平臺(tái)本身已具備標(biāo)準(zhǔn)化特AI模型開發(fā)包括模型選擇數(shù)據(jù)處理模型優(yōu)化模型迭代等一系列環(huán)節(jié)大模型“預(yù)訓(xùn)練+精調(diào)的范令A(yù)I模型開發(fā)變成基于預(yù)訓(xùn)練大模型+少量樣本數(shù)據(jù)精調(diào)參數(shù)的通用流進(jìn)一步增強(qiáng)AI模型的開發(fā)標(biāo)準(zhǔn)化簡(jiǎn)化流程。三是大模型建設(shè)集約化當(dāng)人工智能技術(shù)從實(shí)驗(yàn)室環(huán)境走向企業(yè)生產(chǎn)環(huán)由于研發(fā)環(huán)境和開發(fā)目的不企業(yè)更關(guān)注技術(shù)投入的高能效和低成但傳統(tǒng)面向單點(diǎn)任務(wù)的模型反復(fù)開發(fā)和訓(xùn)練將不可避免地導(dǎo)致成本的增加這成為AI賦能千行百業(yè)的關(guān)鍵阻礙大模型恰逢其時(shí)帶動(dòng)整體產(chǎn)業(yè)結(jié)構(gòu)“倒金字塔形式更健康發(fā)展但大模型本身的研發(fā)有數(shù)據(jù)算法算力的高門檻因此通過(guò)一部分具有領(lǐng)先的數(shù)據(jù)算力資源供給能力和算法人才的企業(yè)打造大模型基礎(chǔ)底可以幫助上層各行業(yè)領(lǐng)域的服務(wù)企業(yè)以更低的投入成本和更高的效率建設(shè)繁榮的產(chǎn)品應(yīng)用生態(tài)。深度學(xué)習(xí)平臺(tái)解決大模型落地關(guān)鍵挑釋放大模型潛能深度學(xué)習(xí)平臺(tái)是推動(dòng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型升級(jí)的核心載體隨著人工智能技術(shù)的逐漸成熟和應(yīng)用落地AI技術(shù)平臺(tái)基礎(chǔ)軟件等產(chǎn)品進(jìn)入大眾視野通過(guò)提供基礎(chǔ)算法庫(kù)和全周期開發(fā)組可以幫助開發(fā)者實(shí)現(xiàn)更高層級(jí)的創(chuàng)新突破和技術(shù)更迭。一是實(shí)現(xiàn)算法模型創(chuàng)新開發(fā)從編程范式來(lái)當(dāng)前主流深度學(xué)習(xí)平臺(tái)均支持動(dòng)靜統(tǒng)一的編程范即同時(shí)支持動(dòng)態(tài)圖和靜態(tài)圖兩種類在實(shí)現(xiàn)動(dòng)態(tài)圖高效開發(fā)訓(xùn)練的同也支持開發(fā)后一行代碼轉(zhuǎn)靜態(tài)圖的訓(xùn)練加速和部署可以大幅度提升開發(fā)者算法研發(fā)準(zhǔn)確率和生產(chǎn)部署效果從算法模型庫(kù)來(lái)說(shuō)深度學(xué)習(xí)平臺(tái)作為模型開發(fā)后資產(chǎn)沉淀的主要承可提供業(yè)界領(lǐng)先的算子和模型結(jié)幫助開發(fā)者基于大模型進(jìn)行下一步調(diào)優(yōu)和創(chuàng)新提升研發(fā)和應(yīng)用效率從工具組件來(lái)說(shuō)深度學(xué)習(xí)平臺(tái)不斷融合強(qiáng)化學(xué)習(xí)聯(lián)邦學(xué)習(xí)圖學(xué)習(xí)量子計(jì)算生物計(jì)算等前沿技術(shù)提供所需的專業(yè)化框架套件和解決方滿足大模型在廣泛應(yīng)用場(chǎng)景的落地需例如飛槳打造圖學(xué)習(xí)框架PG提供異構(gòu)圖數(shù)據(jù)采樣和存儲(chǔ)能以及圖卷積神經(jīng)網(wǎng)絡(luò)圖注意力網(wǎng)絡(luò)基于圖卷積的無(wú)監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)等模并結(jié)合分布式嵌入存儲(chǔ)能力實(shí)現(xiàn)大規(guī)模分布式訓(xùn)練。二是支持企業(yè)全流程協(xié)同管理大模型是人工智能算法的先進(jìn)性成果還需配合深度學(xué)習(xí)平臺(tái)提供覆蓋數(shù)據(jù)管理模型開發(fā)訓(xùn)練調(diào)優(yōu)推理部署協(xié)同監(jiān)管為一體的全流程研發(fā)套件來(lái)滿足企業(yè)用戶側(cè)的應(yīng)用服務(wù)系統(tǒng)化開發(fā)管理需求深度學(xué)習(xí)平臺(tái)通過(guò)端到端的開發(fā)部署能力縱深打造專業(yè)化能力套件配合通用大模型任務(wù)大模型以及行業(yè)大模賦能政府和企業(yè)不同場(chǎng)景下的自主AI模型開發(fā)例如百度全功能AI開發(fā)平臺(tái)BML整合底層開源框架以及上層數(shù)據(jù)處理模型開發(fā)建模模型訓(xùn)練管理以及端側(cè)部署能支持多種方式建模和調(diào)參選輔助企業(yè)實(shí)現(xiàn)一站式模型定制能力。三是加快大模型訓(xùn)練部署在模型訓(xùn)練方面數(shù)億參數(shù)的大模型讀寫存儲(chǔ)和訓(xùn)練成本巨大因此需要深度學(xué)習(xí)平臺(tái)提供高效的大規(guī)模分布式訓(xùn)練技術(shù)根據(jù)模型參數(shù)以及訓(xùn)練數(shù)據(jù)量的不同實(shí)現(xiàn)底層資源彈性調(diào)度管理全自動(dòng)選擇最優(yōu)并行策略技術(shù)高效計(jì)算及通信技術(shù)另外面對(duì)多樣化的底層硬件深度學(xué)習(xí)平臺(tái)也需要加快GPUCPUASICFPGA等多類型芯片的軟硬適從而在自定義優(yōu)化統(tǒng)一硬件接口自動(dòng)化編譯等方面提升模型訓(xùn)練速度在模型部署方面深度學(xué)習(xí)平臺(tái)需要滿足大模型的云邊端部署推理需求覆蓋服務(wù)器端移動(dòng)端邊緣端網(wǎng)頁(yè)端等不同硬件場(chǎng)景的推理引擎并提供模型壓縮工具對(duì)大模型進(jìn)行蒸餾剪枝來(lái)適配端側(cè)設(shè)備的性能要求和存儲(chǔ)條件同時(shí)平臺(tái)也需提供統(tǒng)一的API接助力開發(fā)者進(jìn)行無(wú)代碼調(diào)用部署。開開源社區(qū)大模型測(cè)評(píng)大模型的評(píng)估與典型市場(chǎng)參與者4.1產(chǎn)業(yè)生態(tài)圖譜大模型生態(tài)涉及底層服務(wù)支持算法平臺(tái)以及行業(yè)應(yīng)用廠商主要包括百度阿里商湯華為等人工智能企也有智源研究院中科院自動(dòng)化所等研究機(jī)同時(shí)英偉達(dá)等芯片廠商也紛紛入局。圖5中國(guó)大模型生態(tài)行業(yè)應(yīng)用賦能層搜索遙感行業(yè)應(yīng)用賦能層搜索遙感對(duì)話基礎(chǔ)科學(xué)推薦元宇宙醫(yī)療城市計(jì)算機(jī)視覺(jué)基礎(chǔ)算法平臺(tái)自然語(yǔ)言處理開發(fā)平算法框多模態(tài)底層服務(wù)支撐層芯片數(shù)據(jù)服務(wù)來(lái)源IDC大模型底層服務(wù)支撐基本完善各廠商圍繞核心算法與模型庫(kù)上層軟件平臺(tái)深入布局優(yōu)化在底層服務(wù)支撐層英偉達(dá)單卡芯片可完成百億參數(shù)模型訓(xùn)將有效支撐大模型訓(xùn)練和應(yīng)用推廣在基礎(chǔ)法平臺(tái)層科技巨頭企業(yè)以及研究機(jī)構(gòu)積極布局訓(xùn)練框架模型庫(kù)和工具平臺(tái)大幅降低大模型快速訓(xùn)練部署的算力依賴最后行業(yè)應(yīng)用大模型在搜索對(duì)話推薦等基礎(chǔ)功能應(yīng)用領(lǐng)域已建立行業(yè)標(biāo)企業(yè)更多需關(guān)注醫(yī)療遙感城市基礎(chǔ)科學(xué)元宇宙等復(fù)雜場(chǎng)景。國(guó)內(nèi)的科技巨頭都在預(yù)訓(xùn)練大模型領(lǐng)域投入研發(fā)力量以百度為代表的自研全棧技術(shù)企業(yè)生態(tài)加速了我國(guó)技術(shù)普惠與產(chǎn)業(yè)賦能是構(gòu)建國(guó)產(chǎn)化生態(tài)體系的重要一環(huán)為驅(qū)動(dòng)千行百業(yè)大規(guī)模智能化升級(jí)提升產(chǎn)業(yè)獨(dú)立性和抗風(fēng)險(xiǎn)能力奠定基礎(chǔ)。4.2大模型評(píng)估框架及評(píng)估結(jié)果大模型評(píng)估框架為充分評(píng)估大模型技術(shù)能力功能豐富度與底層深度學(xué)習(xí)平臺(tái)開發(fā)能以及對(duì)各行業(yè)賦能的實(shí)際效并考慮到大模型的未來(lái)商業(yè)化前IDC搭建大模型評(píng)估框架V1.框架構(gòu)成“1-3-6-11架,即1個(gè)整體評(píng)估框架3個(gè)評(píng)估維度6個(gè)一級(jí)指標(biāo)和11個(gè)二級(jí)指標(biāo):分類一級(jí)二級(jí)產(chǎn)品能力模型能力模型豐富度模型性能工具平臺(tái)能力功能豐富度平臺(tái)成熟度易上手程度開放性開放可體驗(yàn)的能力數(shù)對(duì)用戶數(shù)據(jù)隱私保護(hù)數(shù)據(jù)安全措施應(yīng)用能力應(yīng)用廣度已覆蓋的行業(yè)數(shù)應(yīng)用深度客戶業(yè)務(wù)流程關(guān)鍵環(huán)節(jié)滲透度生態(tài)能力應(yīng)用生態(tài)基于大模型進(jìn)行產(chǎn)品開發(fā)的開發(fā)者數(shù)基于大模型工具與平臺(tái)開發(fā)者創(chuàng)建的模型或應(yīng)用數(shù)產(chǎn)品能力主要考慮到大模型的技術(shù)能力和功能豐富以及底層深度學(xué)習(xí)平臺(tái)的核心支撐能,具體包括3個(gè)一級(jí)指標(biāo)分別是模型能力工具平臺(tái)能力和開放性其中模型能力包括模型豐富度和模型性能工具平臺(tái)能力包括功能豐富度平臺(tái)成熟度和易上手程度開放性包括開發(fā)可體驗(yàn)的功能數(shù)和對(duì)用戶隱私保護(hù)及數(shù)據(jù)安全措施。應(yīng)用能力主要考慮“大模型+深度學(xué)習(xí)平臺(tái)的實(shí)際應(yīng)用廣度和深度商業(yè)化前具體包括2個(gè)一級(jí)指標(biāo)分別是應(yīng)用廣度和應(yīng)用深度其中應(yīng)用廣度為考察覆蓋行業(yè)數(shù)應(yīng)用深度為考察客戶業(yè)務(wù)流程關(guān)鍵環(huán)節(jié)滲透度。生態(tài)能力主要考慮到大模型市場(chǎng)生態(tài)布局情考察基于大模型進(jìn)行產(chǎn)品開發(fā)的開發(fā)者數(shù)量基于大模型工具與平臺(tái)開發(fā)者創(chuàng)建的模型或應(yīng)用數(shù)?;谝陨峡蚣躀DC將對(duì)中國(guó)市場(chǎng)主流大模型廠商進(jìn)行評(píng)估明確在當(dāng)前的行業(yè)局面下大模型的發(fā)展進(jìn)幫助企業(yè)在開展相關(guān)業(yè)務(wù)時(shí)提供選型參并幫助平臺(tái)廠商更好地制定競(jìng)爭(zhēng)戰(zhàn)略。百度文心大模型評(píng)估結(jié)果基于IDC搭建的大模型評(píng)估框架V1.0并選取國(guó)內(nèi)主流廠(N=9從模型能力工具平臺(tái)能力開放性應(yīng)用廣度應(yīng)用深度應(yīng)用生態(tài)共6大維度的11項(xiàng)指通過(guò)定性和定量?jī)蓚€(gè)方式進(jìn)行打分評(píng)計(jì)算出各廠商在不同維度的得分和平均分情況IDC發(fā)布中國(guó)大模型市場(chǎng)2022年百度文心大模型評(píng)估結(jié)果:圖6中國(guó)大模型市場(chǎng)2022年評(píng)估結(jié)果—百度文心L4產(chǎn)品能L3L2
百度文心大模型L1L1L1L2應(yīng)用能力L3
L2
L4生態(tài)能
平均分
來(lái)源1IDC注目前尚未有廠商在產(chǎn)品能力和生態(tài)能力方面達(dá)到L應(yīng)用能力尚未有廠商達(dá)到L因此不在本次評(píng)估中凸顯注IDC中國(guó)將大模型市場(chǎng)服務(wù)劃分為L(zhǎng)1-L5五個(gè)層來(lái)衡量大模型產(chǎn)品能力應(yīng)用能力和生態(tài)能層級(jí)越廠商在大模型市場(chǎng)梯隊(duì)越靠當(dāng)前大部分廠商能力處于L2-L3層級(jí)。評(píng)估結(jié)果顯評(píng)估結(jié)果顯百度文心大模型在市場(chǎng)格局中處于第一梯產(chǎn)品能力生態(tài)能力達(dá)到L4水,應(yīng)用能力達(dá)到L3水平。具體來(lái)看:百度文心大模型在產(chǎn)品能力呈現(xiàn)出較強(qiáng)技術(shù)實(shí)力和平臺(tái)積“文心大模型+深度學(xué)習(xí)平臺(tái)創(chuàng)新了人工智能研發(fā)應(yīng)用范式滿足市場(chǎng)大規(guī)模落地需求達(dá)到行業(yè)前端水平應(yīng)用能力方面百度已在金融能源制造城市傳媒互聯(lián)網(wǎng)等行業(yè)擁有實(shí)際落地的標(biāo)桿案例截止目前文心已累計(jì)發(fā)布11個(gè)行業(yè)大模且積極布致力于解決用戶實(shí)際痛并參與到客戶業(yè)務(wù)流程關(guān)鍵環(huán)節(jié)其應(yīng)用深度與廣度方面在評(píng)估廠商中位列前沿在生態(tài)能力方面百度文心大模型在社區(qū)用戶的基礎(chǔ)上可以實(shí)現(xiàn)與開發(fā)者行業(yè)用戶上下游產(chǎn)業(yè)的正向互在評(píng)估廠商中處于行業(yè)領(lǐng)先位置。面向未不論是百度還是其他大模型廠都應(yīng)圍繞整體平臺(tái)化能力行業(yè)賦能進(jìn)行持續(xù)攻堅(jiān)突,解決大模型開發(fā)落地難生態(tài)基礎(chǔ)薄弱等問(wèn)將大模型變成驅(qū)動(dòng)人工智能產(chǎn)業(yè)進(jìn)一步高速發(fā)展的元能力引擎。百度文心大模型百度率先在2019年3月發(fā)布預(yù)訓(xùn)練模型ERNIE1.0持續(xù)投入大模型的技術(shù)創(chuàng)新與產(chǎn)業(yè)應(yīng)用布局了NLPCV跨模態(tài)等大模率先提出行業(yè)大模構(gòu)建大模型工具與平探索產(chǎn)品與社在企業(yè)端和用戶端均有不同程度的突破基于以上背我們將百度作為典型的市場(chǎng)參與者進(jìn)行著重梳理和析。圖7百度文心大模型全景圖產(chǎn)品與社產(chǎn)品與社AI藝術(shù)和創(chuàng)意輔助平EasyD-大模型零門檻AI開發(fā)平臺(tái)
文心全景圖升級(jí)文心百中大模型驅(qū)動(dòng)的產(chǎn)業(yè)級(jí)搜索系BM-大模型全功能AI開發(fā)平臺(tái)
旸谷社區(qū)大模型創(chuàng)意與探索社區(qū)大模型API工具與平
大模型套件 數(shù)據(jù)標(biāo)注與處理 大模型精調(diào) 大模型壓縮 高性能部署 場(chǎng)景化工具 大模型套件 國(guó)網(wǎng)-百度·文心浦發(fā)-百度·文心航天-百度·文心人民網(wǎng)-百度·文心冰城-百度·文心電影頻道-百度·文深燃-百度·文心 吉利-百度·文心 泰康-百度·文心 C-百度·文心 辭海-百度·文文心大模
NLP大模型醫(yī)療ERNIE-Halth金融ERNIE-Finane 對(duì)話PLO 搜索ERNIESach信息抽取ERNIE-UIE跨語(yǔ)言ERNIE-M 代碼ERNIE-Code圖網(wǎng)絡(luò)ERNIESae語(yǔ)言理解與生成 ERNIE3.0Tin輕量ERNIE3.百億)鵬城-百度·文千億ERNIE3.0eus任務(wù)知識(shí)增項(xiàng)千億)
CV大模型商品圖文搜索表征學(xué)VIME-UMSOCR圖像表征學(xué)習(xí)VIMEtruT多任務(wù)視覺(jué)表征學(xué)習(xí) VIME-UO 視覺(jué)處理多任務(wù)學(xué)習(xí) VIMECIR 自監(jiān)督視覺(jué)表征學(xué)VIME-CAE
跨模態(tài)大模型文圖生成ERNIEViG文檔只能視覺(jué)-語(yǔ)言ERNIEViL語(yǔ)音-語(yǔ)言ERNIEST地理-語(yǔ)言
生物計(jì)算大模化合物表征學(xué)習(xí)HeliGEM蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè) Helixold 單序列蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)HelixoldSingle來(lái)源百度百度憑借海量的知識(shí)積淀和豐富的應(yīng)用場(chǎng)景推出的文心大模型具備知識(shí)增強(qiáng)產(chǎn)業(yè)級(jí)兩大特色百度自研的多源異構(gòu)知識(shí)圖擁有超過(guò)5500億條知識(shí)被融入到文心大模型的預(yù)訓(xùn)練中百度文心大模型同時(shí)從海量數(shù)據(jù)和大規(guī)模知識(shí)中融合學(xué)習(xí)在知識(shí)的指導(dǎo)下以語(yǔ)義單元為單位進(jìn)行學(xué)習(xí)效率更高效果更好可解釋性更強(qiáng)文心大模型已應(yīng)用于百度搜索信息流智能駕駛百度地圖小度等重要產(chǎn)品服務(wù)數(shù)億用戶在行業(yè)落地中文心率先提出行業(yè)大模型概念通過(guò)百度智能云在制造能源金融城市傳媒等行業(yè)廣泛應(yīng)用通過(guò)大模型工具平臺(tái)開源開放的模型與服已有近百萬(wàn)開發(fā)者使用文心大模型。在近年的大模型技術(shù)探索與產(chǎn)業(yè)實(shí)踐百度文心形成了支撐大模型產(chǎn)業(yè)落地的關(guān)鍵路構(gòu)建文心大模型層工具平臺(tái)層產(chǎn)品與社區(qū)三層體系建設(shè)更適配場(chǎng)景需求的基礎(chǔ)任務(wù)行業(yè)三層大模型體系提供全流程支持應(yīng)用落地的工具和方法孵化基于大模型的任務(wù)系統(tǒng)與創(chuàng)新產(chǎn)品營(yíng)造激發(fā)創(chuàng)新的開放生態(tài)。文心大模型的模型布局文「基礎(chǔ)+任務(wù)+行業(yè)三級(jí)模型體系:文心大模型結(jié)合技術(shù)發(fā)展趨勢(shì)產(chǎn)業(yè)實(shí)構(gòu)建基礎(chǔ)任務(wù)行業(yè)三級(jí)模型體系基礎(chǔ)大模型聚焦技術(shù)方向的技術(shù)挑戰(zhàn)通用性泛化性探索任務(wù)大模型深入理解任務(wù)特性構(gòu)建預(yù)訓(xùn)練算法訓(xùn)練數(shù)據(jù)集打造緊貼任務(wù)的模型能力行業(yè)大模型深度融合行業(yè)數(shù)據(jù)與知識(shí)特性構(gòu)建更適配行業(yè)的模型底座基礎(chǔ)大模型支撐任務(wù)與行業(yè)大模型的建任務(wù)和行業(yè)大模型結(jié)合真實(shí)場(chǎng)景與數(shù)據(jù)反哺基礎(chǔ)大型優(yōu)化。目文心大模型已經(jīng)建設(shè)了36個(gè)大模其中基礎(chǔ)大模型包含NL(自然語(yǔ)言處理大模型C(計(jì)算機(jī)視覺(jué)大模型跨模態(tài)大模型任務(wù)大模型包含對(duì)話搜索信息抽取生物計(jì)算等多個(gè)典型任務(wù),行業(yè)大模型包含與來(lái)自8個(gè)行業(yè)的頭部企業(yè)或機(jī)構(gòu)共建的11個(gè)行業(yè)大模型?;A(chǔ)大模型文心基礎(chǔ)大模型覆蓋了NLPCV跨模態(tài)三大方向文心NLP大模型百度發(fā)布了文心ERNIE系列NLP大模ERNIE3.0基于知識(shí)增強(qiáng)的多范式統(tǒng)一預(yù)訓(xùn)練框深入融合的千億級(jí)知具備強(qiáng)大的語(yǔ)言理解能力與小說(shuō)摘要文案創(chuàng)意歌詞詩(shī)歌等文學(xué)創(chuàng)作能力其中與鵬城實(shí)驗(yàn)室合作發(fā)布了知識(shí)增強(qiáng)千億大模型“鵬城-百度·文“目文心ERNIE已經(jīng)刷新93個(gè)中文NLP任務(wù)基并多次登頂SuperGLUE全球已在機(jī)器閱讀理解文本分類語(yǔ)義相似度計(jì)算等60多項(xiàng)任務(wù)中實(shí)際應(yīng)用。文心CV大模型百度文心發(fā)布了VIMER系列的CV大模型視覺(jué)自監(jiān)督預(yù)訓(xùn)練大模型VIMER-CAE創(chuàng)新性地提出“在隱含的編碼表征空間完成掩碼預(yù)測(cè)任務(wù)的預(yù)訓(xùn)練框在圖像分類目標(biāo)檢測(cè)語(yǔ)義分割等經(jīng)典下游任務(wù)上刷新SOTA結(jié)果在此之多任務(wù)學(xué)習(xí)模型VIMER-UFO2.0可抽取輕量級(jí)小模兼顧大模型效果和小模型推理性單模型覆蓋20多個(gè)CV基礎(chǔ)任在28個(gè)公開測(cè)試集上效果刷新SOTA端到端文檔OCR表征學(xué)習(xí)預(yù)訓(xùn)練模型VIMER-StrucexT2.0解決了訓(xùn)練數(shù)據(jù)匱乏和傳統(tǒng)OCR+NLP鏈路過(guò)長(zhǎng)導(dǎo)致的模型表達(dá)能力不足優(yōu)化效率偏低等問(wèn)能夠廣泛應(yīng)用于各行各業(yè)行的文檔卡證票據(jù)等圖像文字識(shí)別和結(jié)構(gòu)化理解。文心跨模態(tài)大模型文心跨模態(tài)大模型包括ERNIE-ViLG2.0文生圖大模型ERNIE-ViL視覺(jué)-語(yǔ)言大模型ERNIE-Layout文檔智能大模型等ERNIE-ViLG2.0是知識(shí)增強(qiáng)的AI作畫大模在公開權(quán)威評(píng)測(cè)集MS-COCO上取得了當(dāng)前該領(lǐng)域的領(lǐng)先效在語(yǔ)義可控性圖像清晰度中國(guó)文化理解等方面均展現(xiàn)出了顯著優(yōu)勢(shì)跨模態(tài)文檔智能大模型ERNIE-Layou基于布局知識(shí)增強(qiáng)技,融合文本圖像布局等信息進(jìn)行聯(lián)合建模在文檔抽取布局理解表格理解文檔問(wèn)答網(wǎng)頁(yè)問(wèn)答等5類11項(xiàng)任務(wù)刷新業(yè)界SOTA。任務(wù)大模型:百度文心面向典型任務(wù)推出對(duì)話大模型PLATO搜索大模型ERNIE-Search信息抽取大模型ERNIE-UIE代碼生成大模型RENIE-Code生物計(jì)算大模型等對(duì)話大模型PLTO是基于隱變量的生成式開放域?qū)υ挻竽P途邆浣咏嫒怂降亩噍喠鲿硨?duì)話能力開放域?qū)υ捫Ч_(dá)到世界領(lǐng)先水平信息抽取ERNIE-UIE是專門基于ERNIE通用模型在開放域信息抽取領(lǐng)域進(jìn)行優(yōu)化的模利用單一模型支持多種類型的開放抽取任用戶可以使用自然語(yǔ)言自定義抽取目無(wú)需訓(xùn)練即可抽取輸入文本中的對(duì)應(yīng)信息ERNIE-Code基于海量代碼和文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)引入聯(lián)合學(xué)具備跨多種自然語(yǔ)言和編程語(yǔ)言的語(yǔ)義理解和生成能力已經(jīng)在代碼翻譯代碼提取任務(wù)上取得不錯(cuò)的效果文心生物計(jì)算大模型構(gòu)建面向化合物分子蛋白分子的生物計(jì)算領(lǐng)域預(yù)訓(xùn)練模型賦能生物醫(yī)藥行業(yè)。HelixFold借鑒AlphaFold2的組合多軌模型結(jié)完整實(shí)現(xiàn)從蛋白序列-蛋白結(jié)構(gòu)-蛋白功能的預(yù)測(cè)。HelixFold-Single是開源的基于單序列語(yǔ)言模型的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)大模并在抗體結(jié)構(gòu)預(yù)測(cè)場(chǎng)景下效果超越AlphaFold2HelixGEM-2主要面向小分子藥物研發(fā)融合量子力學(xué)第一性原理創(chuàng)新性地提出多軌機(jī)每個(gè)軌道對(duì)化合物不同階的多體集合進(jìn)行長(zhǎng)程建在量子化學(xué)屬性預(yù)測(cè)和虛擬篩選雙場(chǎng)景上達(dá)到領(lǐng)先效果。行業(yè)大模型:
圖8百度文心行業(yè)大模型能源能源金融航天制造傳媒城市社科影視文心·行業(yè)大模型文心·行業(yè)大模型行業(yè)知識(shí)增強(qiáng)行業(yè)知識(shí)增強(qiáng)通用文心大模深度學(xué)習(xí)通用文心大模深度學(xué)習(xí)語(yǔ)義單元1語(yǔ)義單元2語(yǔ)義單元3語(yǔ)義單元4語(yǔ)義單元5??大規(guī)模知識(shí)海量無(wú)結(jié)構(gòu)數(shù)據(jù)行業(yè)數(shù)據(jù)挖掘行業(yè)數(shù)據(jù)海量數(shù)據(jù)行業(yè)特色數(shù)據(jù)與知識(shí)行業(yè)特色數(shù)據(jù)行業(yè)特色知識(shí)來(lái)源百度行業(yè)大模型是百度推進(jìn)文心大模型深入產(chǎn)業(yè)落地的一項(xiàng)重要舉是百度與行業(yè)頭部企業(yè)機(jī)構(gòu)聯(lián)合研發(fā)的融合行業(yè)數(shù)據(jù)知識(shí)以及專家經(jīng)驗(yàn)的大模型目前百度文心在能源金融航天制造傳媒城市社科以及影視等領(lǐng)域與國(guó)網(wǎng)浦發(fā)吉利TCL人民網(wǎng)哈爾濱上海辭書出版社等均有案例應(yīng)用的行業(yè)大模型這些行業(yè)大模型作為重要AI底座在各行業(yè)的技術(shù)效果突破產(chǎn)品創(chuàng)新生產(chǎn)流程變革降本增效等維度產(chǎn)生價(jià)值。圖9百度文心行業(yè)大模型全景辭海-百度·文心辭海-百度·文心TC-百度·文心泰康-百度·文心吉利-百度·文心深燃-百度·文心冰城-百度·文心 電影頻道-百度·文心人民網(wǎng)-百度·文心航天-百度·文心浦發(fā)-百度·文心國(guó)網(wǎng)-百度·文心來(lái)源百度例如百度與國(guó)網(wǎng)合作的NLP大模型共同打造行業(yè)級(jí)人工智能基礎(chǔ)設(shè)施探索研發(fā)電力人工智能聯(lián)合大模型不僅提升了傳統(tǒng)電力專用模型的精度而且大幅降低了研發(fā)門檻實(shí)現(xiàn)了算力數(shù)據(jù)技術(shù)等資源的統(tǒng)籌優(yōu)化百度與人民網(wǎng)的合作的NLP大模引入輿情數(shù)據(jù)中心積淀的行業(yè)知識(shí)來(lái)更好訓(xùn)練知識(shí)增強(qiáng)的傳媒行業(yè)大模實(shí)現(xiàn)更少的標(biāo)注數(shù)據(jù)下大幅提升傳媒行業(yè)自然語(yǔ)言處理任務(wù)效如新聞內(nèi)容審核分類輿情分析摘要生成等行業(yè)任務(wù)相對(duì)于通用模型提升顯著百度與TCL合作的CV大模面向多個(gè)產(chǎn)線多個(gè)環(huán)節(jié)的工業(yè)質(zhì)檢提供AI基座能在TCL幾個(gè)產(chǎn)線檢測(cè)mAP指標(biāo)平均提升10%訓(xùn)練樣本減少到原有訓(xùn)練樣本30%~40產(chǎn)線指標(biāo)即可達(dá)到原有產(chǎn)線效新產(chǎn)線冷啟動(dòng)效率可提升3產(chǎn)線上線開發(fā)周期降低30%。4.3.2文心大模型產(chǎn)品矩陣百度文心圍繞大模型產(chǎn)業(yè)應(yīng)用的不同研發(fā)環(huán)節(jié)面向各階段不同技術(shù)業(yè)務(wù)背景的開發(fā)者或用戶打造系列工具平臺(tái)與場(chǎng)景化產(chǎn)品。圖10文心大模型產(chǎn)品矩陣開發(fā)套件開發(fā)套件ERNIEKit開發(fā)平臺(tái)開發(fā)工具集源碼級(jí)的NLP開發(fā)工具集面向?qū)I(yè)的NLP算法工程師百度內(nèi)部的主流NLP開發(fā)工具NLP算法定制BM-智能文本 EasyD-文本全功能AI開發(fā)平臺(tái) 零門檻AI開發(fā)平臺(tái)一站式NLP模型 一站式NLP模定制平臺(tái) 定制平臺(tái)面向有一定算法 面向初級(jí)開發(fā)基礎(chǔ)的開發(fā)者 或業(yè)務(wù)專家功能完善全支 零代碼全流程持靈活調(diào)參 可視化操作服務(wù)平臺(tái)ERNIE-API大模型API服務(wù)一站式NLP大模型調(diào)用平臺(tái)面向初級(jí)開發(fā)者或業(yè)務(wù)專家界面試用與接口調(diào)用兩種模式產(chǎn)品大模型驅(qū)動(dòng)產(chǎn)文心百中文心一格業(yè)級(jí)搜索系統(tǒng)AI藝術(shù)與創(chuàng)意輔助平臺(tái)高可用云原生, 強(qiáng)大的文生圖二可一鍵部署次編輯能力三步完成搜索引 高質(zhì)量多風(fēng)格多擎構(gòu)建尺寸系統(tǒng)搭建人力成 恢弘藝術(shù)性深入本節(jié)省90%的中國(guó)文化理解領(lǐng)先的中國(guó)風(fēng)畫作 文心大模型ERNIE文心大模型ERNIE來(lái)源百度大模型套件百度文心推出新一代預(yù)訓(xùn)練范式的NLP算法定制開發(fā)工具集ERNIEKi面向NLP工程提供全流程大模型開發(fā)與部署工具端到端全方位發(fā)揮大模型效能包括數(shù)據(jù)標(biāo)注與理大模型精調(diào)大模型壓縮高性能部署場(chǎng)景化工具五大模塊能力。AI開發(fā)平臺(tái)百度AI開發(fā)以雙平臺(tái)模式驅(qū)面向應(yīng)用開發(fā)者或業(yè)務(wù)專家提供零門檻AI開放平臺(tái)EasyD面向AI算法開發(fā)者提供全功能AI開發(fā)平臺(tái)BMLEasyDL使用百度文心NLPCV跨模態(tài)大模型作為訓(xùn)練基座利用少量數(shù)據(jù)即可獲得理想的模型效果具有零門檻高精度低成本數(shù)據(jù)超靈活部署四大核心優(yōu)勢(shì)BML深度融合文心大模提供Notebook建模預(yù)置模型調(diào)參可視化建模模型產(chǎn)線建模Pipeline建模實(shí)驗(yàn)管理等功兼具性能和性價(jià)比。大模型API文心開放了NLP大模型ERNIE3.0跨模態(tài)大模型ERNIE-ViLG對(duì)話大模型PLATO。ERNIE3.0提供文案改寫開放問(wèn)答摘要文案創(chuàng)作小說(shuō)創(chuàng)作文本補(bǔ)全等文本理解與創(chuàng)作能力ERNIE-ViLG提供基于文本描述的AI作畫能圖文相關(guān)性強(qiáng)圖片質(zhì)量在中國(guó)文化理解、中國(guó)風(fēng)二次元等方面表現(xiàn)優(yōu)異PLATO提供生成式開放域?qū)υ挿?wù)邏輯清晰知識(shí)多元情感豐閑聊能力接近真人水平。場(chǎng)景化產(chǎn)品在搜索和文生圖兩個(gè)典型的應(yīng)用場(chǎng)景百度文心推出基于大模型驅(qū)動(dòng)的新一代產(chǎn)業(yè)級(jí)搜索系統(tǒng)文心百中以及AI藝術(shù)與創(chuàng)意輔助平臺(tái)文心一格文心百中實(shí)現(xiàn)了系統(tǒng)極簡(jiǎn)化通過(guò)搜索配置數(shù)據(jù)導(dǎo)入搜索體驗(yàn)三步完成搜索引擎構(gòu)具備優(yōu)秀的語(yǔ)義理解能構(gòu)建一個(gè)索引擎可節(jié)省90%的人預(yù)置多個(gè)常用搜索場(chǎng)景文心一讓用戶實(shí)現(xiàn)一語(yǔ)成只需輸入一段自己的創(chuàng)想文字并選擇期望的畫作風(fēng)格即可瞬間生成創(chuàng)意精美的畫作既能生產(chǎn)恢弘絢麗的藝術(shù)畫也能生產(chǎn)創(chuàng)意腦洞的超寫實(shí)圖支持國(guó)風(fēng)動(dòng)漫插畫油畫等十余種繪畫風(fēng)格和不同畫幅的選讓每個(gè)人都能展現(xiàn)個(gè)性化格享受藝術(shù)創(chuàng)作的樂(lè)趣。文心大模型應(yīng)用舉例文檔智能場(chǎng)景賦能文檔智能化識(shí)別抽取錄入審助力智能化辦公文檔智能化在OCR和智能解析環(huán)面臨格式繁多布局形式多樣訓(xùn)練數(shù)據(jù)稀缺業(yè)務(wù)定制成本高等問(wèn)題百度打造了文心ERNIE-Layout文檔智能大模針對(duì)文檔場(chǎng)景融合了文本圖像布局等信,引入了布局語(yǔ)義與視覺(jué)語(yǔ)義理解能力進(jìn)行聯(lián)合建能夠?qū)ξ臋n圖片PDF文件掃描件等多模態(tài)文檔進(jìn)行深度理解與分為各類上層應(yīng)用提供多語(yǔ)言的模型底助力文檔內(nèi)容解析語(yǔ)義理解審核分析等全鏈路的智能化方案升級(jí)。目前基于文心大模型的智能文檔分析平臺(tái)extMind可提供包括文檔信息抽取文本內(nèi)容審查企業(yè)文檔管理文檔格式解析文檔內(nèi)容比對(duì)等全方位一站式的文檔智能服務(wù)已形成一套完整的企文檔場(chǎng)景化解決方案滿足銀行券商法律能源傳媒通信物流等不同行業(yè)和場(chǎng)景的文檔處理需求植根市場(chǎng)需求推出的合同智能處理解決方則可全流程賦能企業(yè)合同管理法務(wù)信息服提高合同審查效率及準(zhǔn)確助力企業(yè)辦公的數(shù)字化轉(zhuǎn)型和智能化升級(jí)。人機(jī)對(duì)話場(chǎng)景賦能開放域擬人對(duì)助力交互創(chuàng)新在人機(jī)對(duì)話場(chǎng)景下主要面臨對(duì)話邏輯差知識(shí)準(zhǔn)確性不高和缺乏長(zhǎng)期記憶等挑戰(zhàn)百度提出了基隱變量的生成式開放域?qū)υ挻竽P蚉LT同時(shí)結(jié)合知識(shí)內(nèi)化和知識(shí)外用的全面知識(shí)增強(qiáng)策略一方模型從海量公開網(wǎng)頁(yè)與社交數(shù)據(jù)中學(xué)將大量的知識(shí)記憶到內(nèi)部參數(shù)中另一方模型進(jìn)一步模仿人類對(duì)外部信息的查詢和利用學(xué)習(xí)在回復(fù)生成中融合外部知識(shí)此外PLATO還實(shí)現(xiàn)了在交互過(guò)程中實(shí)時(shí)識(shí)別記憶和使用對(duì)話歷史文心對(duì)話大模型生成的對(duì)話回復(fù)邏輯清晰知識(shí)多元情感豐開放域多輪對(duì)話能力接近真人水平。文心對(duì)話大模型已經(jīng)廣泛應(yīng)用于百度搜索信息流智能音箱等互聯(lián)網(wǎng)產(chǎn)累計(jì)服務(wù)超過(guò)10億用戶、超過(guò)5億個(gè)智能家居設(shè)備同時(shí)通過(guò)百度智能對(duì)話平臺(tái)及產(chǎn)品矩陣廣泛賦能通信傳媒能源汽車、金融等20多個(gè)行覆蓋行業(yè)頭部媒體運(yùn)營(yíng)商航空公司車企銀行等客并催生了數(shù)字人客服、AI訓(xùn)練師等新業(yè)態(tài)新模式在電話客服場(chǎng)景百度建立了面向?qū)υ捓斫鈫?wèn)題的專用預(yù)訓(xùn)練模型該模型對(duì)數(shù)據(jù)標(biāo)注量的需求比以往降低45%以支持頭部電信運(yùn)營(yíng)商實(shí)現(xiàn)了覆蓋全國(guó)的智能客服改,顯著減少了人工服務(wù)時(shí)長(zhǎng)與用戶等待時(shí)長(zhǎng)在數(shù)字人客服場(chǎng)百度聯(lián)合頭部商業(yè)銀行發(fā)布了客服數(shù)字2021年累計(jì)服務(wù)客戶超千萬(wàn)人銷售額上百億元通過(guò)百度智能對(duì)話平臺(tái)的公有云服文心對(duì)話大模型還廣泛支持了近4萬(wàn)智能對(duì)話開發(fā)累計(jì)創(chuàng)建對(duì)話應(yīng)用超過(guò)17萬(wàn)個(gè)。無(wú)人駕駛場(chǎng)景賦能感知場(chǎng)提升感知智能在無(wú)人駕駛場(chǎng)景下面臨大規(guī)模自動(dòng)駕駛數(shù)據(jù)上云大算力AI芯片性能突圍城市場(chǎng)景下通用自動(dòng)駕駛產(chǎn)品服務(wù)的規(guī)?;葐?wèn)題過(guò)去十年百度在自動(dòng)駕駛領(lǐng)域長(zhǎng)期持續(xù)投入目百度自動(dòng)駕駛專利總申請(qǐng)量達(dá)到3477自動(dòng)駕駛測(cè)試總里程超過(guò)4000萬(wàn)公里背靠百度自研的AI芯片文心大模型自動(dòng)駕駛實(shí)現(xiàn)了全鏈條關(guān)鍵技術(shù)的自主創(chuàng)新。百度自動(dòng)駕駛依托文心大模從數(shù)據(jù)和感知模型的角度率先實(shí)現(xiàn)智能感知閉環(huán)迭代基于數(shù)十億圖文對(duì)訓(xùn)練得到的文心-圖文弱監(jiān)督預(yù)訓(xùn)練大模百度已具備近百萬(wàn)類常用概(物體顏色形狀動(dòng)作狀態(tài)等的泛化識(shí)別區(qū)分能實(shí)現(xiàn)了基于語(yǔ)義概念描述的低成本數(shù)據(jù)挖掘方從而大幅擴(kuò)充了自動(dòng)駕駛語(yǔ)義識(shí)別數(shù)如特殊車(消防車救護(hù)車識(shí)別塑料袋誤檢使得自動(dòng)駕駛長(zhǎng)尾問(wèn)題解決的效率實(shí)現(xiàn)了指數(shù)級(jí)提升在感知模型基于10億級(jí)參數(shù)規(guī)模的文心-自動(dòng)駕駛感知模實(shí)現(xiàn)了感知大模型小型化閉環(huán)迭自動(dòng)駕駛感知泛化能力顯著增有效完成模型域適應(yīng)遷移并解決遠(yuǎn)距離和小目標(biāo)長(zhǎng)尾目標(biāo)定位不準(zhǔn)等問(wèn)題目前大模型已經(jīng)成為自動(dòng)駕駛感知能力提升的核心驅(qū)動(dòng)力。此外隨著自動(dòng)駕駛走向規(guī)模化落地高精度地圖成為其發(fā)展的瓶頸百度依托文心大模型將高精圖自動(dòng)化生成能力大幅度提升至96%解決了應(yīng)用成本高的問(wèn)題百度提出“高提純高消化的數(shù)據(jù)閉環(huán)設(shè)計(jì)理念全面強(qiáng)化自動(dòng)駕駛的數(shù)據(jù)利用能力據(jù)了解該方案的數(shù)據(jù)提純路徑是利用車端模型和云端大模型實(shí)現(xiàn)高效率數(shù)據(jù)挖掘和自動(dòng)化標(biāo)注數(shù)據(jù)消化架構(gòu)實(shí)現(xiàn)自動(dòng)化訓(xùn)練具備聯(lián)合化和數(shù)據(jù)分布理解的能有效地利用高純度數(shù)據(jù)進(jìn)一步提升自動(dòng)駕駛系統(tǒng)的整體智能水平。工業(yè)質(zhì)檢場(chǎng)景助力降本增效提升產(chǎn)能在工業(yè)質(zhì)檢場(chǎng)景伴隨工業(yè)4.0的到傳統(tǒng)生產(chǎn)方式轉(zhuǎn)型升級(jí)成為工業(yè)制造企業(yè)亟需思考的問(wèn)題。傳統(tǒng)的工業(yè)質(zhì)檢以人工質(zhì)檢為主面臨著質(zhì)檢效率低的挑戰(zhàn)同時(shí)工業(yè)質(zhì)檢產(chǎn)線往往工藝復(fù)雜但對(duì)檢測(cè)精度要求又非常高。從行業(yè)現(xiàn)狀出文心工業(yè)質(zhì)檢大模借助行業(yè)數(shù)突破了少樣本和強(qiáng)標(biāo)注限在多個(gè)工業(yè)質(zhì)檢場(chǎng)(3C鋼鐵紡織等使得任務(wù)訓(xùn)練樣本節(jié)省30%~40開發(fā)周期降低了30冷啟動(dòng)效率提升3倍指標(biāo)提升10%文心工業(yè)質(zhì)檢大模型大幅優(yōu)化了質(zhì)檢流程提升了模型研發(fā)與運(yùn)營(yíng)效率實(shí)現(xiàn)了成本的顯著降低基于文心大模型的工業(yè)質(zhì)檢場(chǎng)景方可應(yīng)用于鋼筋計(jì)數(shù)安全帽智能識(shí)別工業(yè)園區(qū)電力負(fù)荷檢測(cè)金屬零部件質(zhì)檢廠區(qū)吸煙檢測(cè)立體庫(kù)智能盤點(diǎn)等具體場(chǎng)實(shí)現(xiàn)高精度性能識(shí)提升企業(yè)生產(chǎn)及交付效率。AIGC場(chǎng)景賦能內(nèi)容生助力數(shù)字經(jīng)濟(jì)在AIGC場(chǎng)景下主要有來(lái)自技術(shù)和商業(yè)兩方面的挑戰(zhàn)技術(shù)上面臨生成內(nèi)容質(zhì)量技術(shù)倫理等問(wèn)題;商業(yè)上面臨創(chuàng)造力歸屬創(chuàng)作倫理知識(shí)產(chǎn)權(quán)等問(wèn)題百度利用知識(shí)增強(qiáng)的大模型基座賦能內(nèi)容生,在智能對(duì)話小說(shuō)等文本生文本到圖片視頻等跨模態(tài)生成方面均有深入的產(chǎn)業(yè)應(yīng)用。百度推出ERNIE3.0文本理解與創(chuàng)作AP覆蓋寫作文摘要文案小說(shuō)對(duì)聯(lián)等多項(xiàng)生成能每天服務(wù)上萬(wàn)用戶也已應(yīng)用于百度自有產(chǎn)品的創(chuàng)比如在小初學(xué)“寫作文的場(chǎng)景解決學(xué)“無(wú)寫作靈感的痛點(diǎn)需形成產(chǎn)品的差異化優(yōu)勢(shì)基于文生圖大模型能百度開放AI作畫AP同時(shí)推出AI藝術(shù)與創(chuàng)意輔助平臺(tái)文心一格用戶只需輸入一段自己的創(chuàng)想文字并選擇期望的畫作風(fēng)格即可生創(chuàng)意精美的畫目前已服務(wù)上百萬(wàn)用戶在視頻生成場(chǎng)百度以文心大模型技術(shù)作為基打造支撐通用型大規(guī)模生產(chǎn)的智能視頻合成平臺(tái)用戶僅需一鍵輸入新聞圖文內(nèi)容鏈接就可以自動(dòng)化成視頻制整套制作流程只需數(shù)分日產(chǎn)智能視頻達(dá)到萬(wàn)級(jí)別日分發(fā)量達(dá)億級(jí)同時(shí)結(jié)合知識(shí)問(wèn)答動(dòng)態(tài)新聞數(shù)字人活動(dòng)專題等推出差異化的視頻自動(dòng)生產(chǎn)能力。文心大模型生態(tài)預(yù)訓(xùn)練大模型市場(chǎng)正處于高速發(fā)展階需要解決差異化水平下開發(fā)者和企業(yè)的應(yīng)用需求百度飛槳深度學(xué)習(xí)平臺(tái)向下適配各種硬支持文心大模型的開發(fā)高性能訓(xùn)練模型壓縮服務(wù)部署的各種能貫通AI全產(chǎn)業(yè)串聯(lián)起全棧化的產(chǎn)業(yè)生態(tài)體系。文心大模型+飛槳深度學(xué)習(xí)平臺(tái)生態(tài)共在市場(chǎng)生態(tài)方面持續(xù)發(fā)力以百度飛槳為代表的國(guó)產(chǎn)開發(fā)框架已經(jīng)逐步與產(chǎn)業(yè)融在社區(qū)生態(tài)建設(shè)上持續(xù)發(fā)力飛(Paddle-Paddle以百度多年的深度學(xué)習(xí)技術(shù)研究和業(yè)務(wù)應(yīng)用為基集深度學(xué)習(xí)核心訓(xùn)練和推理框架基礎(chǔ)模型庫(kù)端到端開發(fā)套件豐富的工具組件于一體是國(guó)內(nèi)功能豐富開源開放的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)平臺(tái)文心大模型是飛槳模型庫(kù)的重要組成部與飛槳共享生包含產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型體以及工具平臺(tái)API和創(chuàng)意社區(qū)助力大模型的高效應(yīng)用飛槳深度學(xué)習(xí)平臺(tái)解決大模型研發(fā)和部署的各類問(wèn)題大模型使得AI模型的研發(fā)門檻更低效果更好流程更加標(biāo)準(zhǔn)化硬件廠商開發(fā)者以及模型應(yīng)用企業(yè)在文心+飛槳生態(tài)緊密鏈接相互促形成共聚共研共創(chuàng)的健康生態(tài)。目前生態(tài)已凝聚535萬(wàn)開發(fā)服務(wù)20萬(wàn)家企事業(yè)單與12家硬件伙伴聯(lián)合發(fā)布飛槳生態(tài)發(fā)行推動(dòng)深度學(xué)習(xí)平臺(tái)與更多硬件適配還與國(guó)內(nèi)科研院所實(shí)驗(yàn)室以及高校強(qiáng)強(qiáng)聯(lián)一同攻克AI技術(shù)難目前已賦能389所高服務(wù)747名教學(xué)分課培養(yǎng)10萬(wàn)余名AI學(xué)子。大模型未來(lái)發(fā)展趨
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025廣西東盟經(jīng)濟(jì)技術(shù)開發(fā)區(qū)直屬國(guó)有企業(yè)招聘緊缺領(lǐng)導(dǎo)人員2人筆試歷年典型考點(diǎn)題庫(kù)附帶答案詳解
- 2025安徽省新能創(chuàng)業(yè)投資有限責(zé)任公司子公司電力市場(chǎng)化交易員崗位社會(huì)招聘1人筆試歷年常考點(diǎn)試題專練附帶答案詳解
- 2025四川越王樓文化傳播有限公司招聘行政崗測(cè)試筆試歷年備考題庫(kù)附帶答案詳解
- 憲法競(jìng)賽單選試題及答案
- 事業(yè)培訓(xùn)考試題庫(kù)及答案
- 汽車行業(yè)IT支持員面試問(wèn)題集
- 2025年浙江移動(dòng)招聘試題及答案
- 人力資源經(jīng)理面試技巧與答案解析
- 影視制作公司工程經(jīng)理面試全流程與答案
- 旅游線路推廣合作合同
- 學(xué)堂在線 雨課堂 學(xué)堂云 生活英語(yǔ)聽(tīng)說(shuō) 期末復(fù)習(xí)題答案
- 第十四屆全國(guó)交通運(yùn)輸行業(yè)“大象科技杯”城市軌道交通行車調(diào)度員(職工組)理論知識(shí)競(jìng)賽題庫(kù)(1400道)
- 2025年希望杯IHC真題-二年級(jí)(含答案)
- T/CCT 002-2019煤化工副產(chǎn)工業(yè)氯化鈉
- 砂石運(yùn)輸施工方案
- 醫(yī)院如何規(guī)范服務(wù)態(tài)度
- 輸液空氣的栓塞及預(yù)防
- 中建鋼筋工程優(yōu)化技術(shù)策劃指導(dǎo)手冊(cè) (一)
- 廣東省汕頭市金平區(qū)2024-2025學(xué)年七年級(jí)上學(xué)期期末考試語(yǔ)文試題
- 2025年供電所所長(zhǎng)個(gè)人工作總結(jié)(2篇)
- 12J12無(wú)障礙設(shè)施圖集
評(píng)論
0/150
提交評(píng)論