版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2023中國AIGC商業(yè)潛力研究報告前言在人工智能發(fā)展的漫長歷程中,如何讓機器學會創(chuàng)作一直被視為難以逾越的天塹,“創(chuàng)造力”也因此被視為人類與機器最本質的區(qū)別之一。然而,人類的創(chuàng)造力也終將賦予機器創(chuàng)造力,把世界送入智能創(chuàng)作的新時代。從機器學習到智能創(chuàng)造,從PGC,UGC到,我們即將見證一場深刻的生產力變革,而這份變革也會影響到我們工作與生活的方方面面。本報告將向所有關注未來科技的相關機構、從業(yè)者、創(chuàng)業(yè)者、投資人傳遞億歐對的市場潛力場景的洞察和優(yōu)秀企業(yè)案例。跨入生成式階段預學習引發(fā)技術質變,擺脫過去的高門檻、訓練成本高、生成內容單一的痛點?;诖竽P偷姆夯芰?,知識蒸餾與微調后進入專用領域的應用,覆蓋短頭、長尾的場景。多模態(tài)打破多種信息之間的邊界,提升內容多樣性與技術多樣性,拓寬應用的場景。原因1原因2原因3中國生成式與國外先進水平存在一定差距,但憑借國內應用場景的多樣性,具備的數據積累優(yōu)勢,有望追上先進步伐。中外差距大模型生態(tài)圈解析短期內,擴大算力是的剛需。FPGA及ASIC有望在遠期成為主力芯片。算力成本為大模型成本65%算力為大模型能力的下限為防止中國大模型出現“數據馬太效應”,大模型亟需高質量的標注數據進行訓練,提高生成能力。數據為大模型能力的上限目前大模型以服務B端為主,其中平臺服務模式的占比相對較高高質量的算法使大模型能力貼近上限數據成本為大模型成本23%算法成本為大模型成本12%2030年中國市場規(guī)模將接近萬億02-導覽01-導覽 03-導覽導覽商業(yè)潛力邊界模型0.510.690.761.17億歐智庫:基礎原子能力潛力指數1.87代碼視頻音頻圖像文本AIGS 0.18知識圖譜 0.16億歐智庫:多模態(tài)原子能力潛力指數聊天機器人 0.25虛擬人 0.22合成數據 0.20認知謬誤邊界基礎設施邊界技術可行性邊界經濟價值邊界2原子能力商業(yè)潛力評估模型規(guī)模潛力利潤潛力泛化與通用場景專業(yè)場景基礎原子能力多模態(tài)原子能力目錄CO
N
T
E
N
T
S概述人工智能概念梳理生成式人工智能因素分析中外人工智能對比AIGC原子能力變化0102 生態(tài)底座價值鏈分析生態(tài)底座價值拆解算力價值分析數據價值分析算法價值分析生態(tài)服務商總結大模型生態(tài)底座產業(yè)圖譜03 原子能力商業(yè)潛力分析原子能力覆蓋行業(yè)梳理基礎模態(tài)原子能力分析多模態(tài)原子能力分析原子能力商業(yè)潛力評估總結原子能力產業(yè)圖譜優(yōu)秀企業(yè)案例商業(yè)潛力規(guī)模預判商業(yè)潛力邊界模型邊界突破趨勢未來商業(yè)潛力規(guī)模預測04目錄CO
N
T
E
N
T
S概述人工智能概念梳理生成式人工智能因素分析中外人工智能對比AIGC原子能力變化0102 生態(tài)底座價值鏈分析生態(tài)底座價值拆解算力價值分析數據價值分析算法價值分析生態(tài)服務商總結大模型生態(tài)底座產業(yè)圖譜03 原子能力商業(yè)潛力分析原子能力覆蓋行業(yè)梳理基礎模態(tài)原子能力分析多模態(tài)原子能力分析原子能力商業(yè)潛力評估總結原子能力產業(yè)圖譜優(yōu)秀企業(yè)案例商業(yè)潛力規(guī)模預判商業(yè)潛力邊界模型邊界突破趨勢未來商業(yè)潛力規(guī)模預測045跨入3.0
+深度加強學習范式,利用獎懲模型強化生成能力1.0邏輯范式 2.0概率范式資料來源:卡內基梅隆大學、朱松純《淺談人工智能:現狀、任務、架構與統一》、公開資料、億歐智庫整理3.0
深度學習范式3.0+
深度強化學習范式4.0
??范式范式(
Generated
Content)是基于GAN、預訓練大模型、多模態(tài)技術融合的產物,通過已有的數據尋找規(guī)律,并通過泛化能力形成相關內容。從商業(yè)角度看,是一種賦能技術,通過高質量、高自由度、低門檻的生成方式為內容相關場景及生產者進行服務。早期決策式依賴邏輯判斷的純粹性,萬物都能完美觀察、任何測量不存在誤差的前提不符合真實世界的“不確定性”;概率范式基于經驗主義與理性主義一定程度上解決了“不確定性”;深度加強學習可以利用合理的數據豐度與獎懲達到類人類智能的水平,實現高質量內容與內容創(chuàng)作自動化;通用型具備泛人類智能,可以像人類一樣執(zhí)行各種任務。決策式 生成式 通用型綜合能力在早期工作在于關注邏輯、自動定理證明和操縱各種符號,該類理解基礎的物理知識,具備一定的邏輯能力,通過分析數據和信息,幫助使用者更好的做出判斷與決概率與統計可以初步解決“不確定性”,但是概率范式需要經驗主義先于理性主義填充。以Bayes模型為例,需要經驗主義者先設定先驗數據。以數據為中心,深層次的網絡堆疊為架構,樣本數據及數據種類的豐富,訓練的模型泛化能力就越強,效果越好。同時深度學習訓練的已經可以很好的執(zhí)行任務。不過,強化學習的效果卻不一定受到豐度的影響。強化學習遵循Markov原則,只要獎懲設計合理就能實現不錯的效果。具備泛人類智能的,可以像人類一樣執(zhí)行各種任務。自迭代能力策。但基于邏輯的缺乏感知能力,對真實世界普遍存在的“不確定性”較難處理。Markov獎懲模型:倫理道德智能體獎勵行動環(huán)境目前位置協作能力狀態(tài)執(zhí)行能力感知能力學習能力決策能力認知能力6資料來源:公開資料、億歐智庫整理歷次寒潮沉淀的技術,終在算法、算力、數據三者共振的情況下誕生出大模型在1956年的達特茅斯會議上,“人工智能”的概念被首次提出,六十多年以來,歷經邏輯推理、專家系統、深度學習等技術的發(fā)展,人工智能也經歷了數次沉浮,有如日中天的發(fā)展時期,也有因技術不足熱度退去后的寒潮。而每一次寒潮后,也會經歷技術的蟄伏發(fā)展,為人工智能帶來里程碑式的進步。發(fā)展的2.5次寒潮1970年代第1次寒潮當時主要研究集中在邏輯抽象、邏輯運算和邏輯表達等方面,出現許多邏輯證明相關的邏輯程序語言,如著名的Prolog。但是當時研發(fā)出來的人工智能系統缺乏實用性,幾乎無法解決任何實際問題,無法達到人們期望,政府逐步減少投資,高潮衰落,進入第一次寒冬。1990年代第2次寒潮出現神經系統與專家網絡。神經系統在解決復雜問題上能力不足,且訓練時需要的數據量較大。專家系統的實用性只局限于特定領域,同時升級難度和維護成本都居高不下。日本推出第五代計算機計劃——拋棄馮諾依曼架構,采用新的并行架構,采用新的存儲器,新的編程語言,以及能處理自然語言、圖像的新操作方式,但局限于理論和計算機算力,以及知識完全依靠人工輸入和維護,最終宣告項目失敗。2010年代第2.5次寒潮存在計算能力不足的瓶頸,以深度學習為驅動力的人工智能技術更多仍停在分類、聚類和預測階段,能夠完全復制人類思維方式的強人工智能依舊發(fā)展緩慢。互聯網公司對的開發(fā)便捷程度與先進程度超過許多公司,因為互聯網可以使用自己的不公開的內部數據進行訓練。感知器神經網絡的第一個里程碑算法可以解決簡單的線性分類問題為后期更復雜的算法奠定基礎Hopfield神經網絡一種具有循環(huán)、遞歸特性,結合存儲和二元系統的神經網絡提供了模擬人類記憶的模型在機器學習、聯想記憶、模式識別、優(yōu)化計算等方面有著廣泛應用多層前向BP網絡非線性映射能力:適合于求解內部機制復雜的問題自學習和自適應能力:訓練時能自適應的將學習內容記憶于網絡的權值中容錯能力:局部神經元受到破壞后對全局的訓練結果不會造成很大的影響深度學習彌補了傳統BP神經網絡的缺陷,利于可視化和分類,識別精度上升,訓練難度下降無需人工提取規(guī)則特征,機器通過海量數據,即可自動實現規(guī)則的特征提取,有機器本身完成最復雜的算法歸納芯片&服務器&計算機硬件設施飛速發(fā)展,GPU、TPU等新一代芯片及FPGA異構計算服務器,提供強大算力互聯網、物聯網發(fā)展迅猛,為人工智能提供了規(guī)??涨暗挠柧殧祿?,數據可獲得性大幅提升ChatGPT出現技術發(fā)展里程碑共振:振動頻率相同的物體、當一個發(fā)生振動時、引起其他物體振動7資料來源:arXiv、億歐智庫整理預學習引發(fā)技術質變預學習的出現解決了過去生成式大模型的痛點,但預學習本身存在模型尺寸、小樣本數量、微調能力的不可能三角,解決方法也不盡相同:對于極大模型,使用知識蒸餾;對于少樣本學習能力,進行數據增強;對于監(jiān)督訓練表現欠佳的模型,進行提示學習。以GPT為例,在目前階段,廠商通常的做法是擴大模型尺寸。億歐智庫:預學習大模型引發(fā)技術質變億歐智庫:預學習之不可能三角與對應解決方案預學習大模型的出現解決了過去各類生成式模型使用門檻高、訓練成本高、內容生成簡單和質量偏低的痛點,滿足真實內容消費場景中的靈活多變、高精度、高質量等需求。預學習思路:將大量低成本收集的訓練數據集中,學習其中的共性然后將其中的共性移植到特定任務的模型中,再微調,去學習該特定任務的特性部分合理的模型尺寸(小于10億參數量)先進的小樣本先進微調訓練任務共性學習特性學習微調特定任務知識蒸餾大模型是網絡的集合,擁有良好的性能和泛化能力,小模型網絡規(guī)模較小,表達能力有限降低模型時延,壓縮網絡參數:利用大模型學習的知識指導小模型訓練,使得小模型與大模型性能相當,而參數數量可大幅降低,從而實現模型壓縮與加速提升模型精度:訓練一個更高精度的大模型,用大模型對原模型知識蒸餾,獲得更高精度數據增強缺少足夠的標記數時,可以生成偽標簽和偽數據實例,利用這些額外數據,模型能夠有效的監(jiān)督訓練。提示學習利用離散提示(離散文本模板)或連續(xù)提示(連續(xù)參數嵌入)微調,在微調期間僅更新離散提示或連續(xù)提示中的一種,提高準確度8資料來源:公開資料、億歐智庫整理大模型底座驅動概念落地在概念實際落地的過程中,只有基礎大模型與通用技術是遠遠不夠的,還需要能與場景融合匹配,更需要支持應用落地的工具平臺和開放包容的創(chuàng)新生態(tài),三者協同優(yōu)化,加速落地。在全應用流程中,主要通過大量的無標注文本進行共性學習,獲得預訓練大模型,此后再根據場景特征微調,更好與項目任務適配。大模型驅動概念落地工具平臺生態(tài)大模型特性學習共性學習通過海量無標注文本和自監(jiān)督學習,進行共性學習,得到預訓練大模型通過任務相關少量數據進行精調,進行特性學習通過工具平臺支撐生態(tài)應用落地通過學習海量無標注文本與數據進行預訓練和自學習監(jiān)督,提高大模型在前期學習的范圍與深度,提升水平,賦能大模型在后續(xù)具體任務中的應用共性學習在共性學習“預訓練”的基礎上,根據具體應用場景的特性,使用少量數據進行微調,高精度地完成任務特性學習大模型:在發(fā)展和產業(yè)應用方面占據重要地位,主要包含基礎、任務和行業(yè)大模型,三層大模型相互促進,共同支撐產業(yè)轉化與發(fā)展工具平臺:推出了基于大模型的開發(fā)平臺、工具套件、大模型API等,讓更多開發(fā)者能夠低門檻地將大模型應用于自己的業(yè)務中,從而助力開發(fā)者效率提升生態(tài):釋放大模型的潛力,推動的廣泛應用和產業(yè)化大模型支撐生態(tài)發(fā)展,而生態(tài)反哺大模型進行技術進步+工具平臺+生態(tài)模式需要協同優(yōu)化,以更好幫助在不同領域快速落地9資料來源:CSDN、中信建投證券、億歐智庫整理多模態(tài)打破多種信息之間的邊界并生成質量穩(wěn)定的內容,提升內容多樣性相比于模態(tài)單一的單模態(tài)模型,多模態(tài)模型可以同時處理更多模態(tài)的并將它們相互轉化?,F今多模態(tài)模型以圖文多模塊為主。Transformer雖受制于單模態(tài)但其權重共享適用于多模態(tài);ViT處理輸入圖片,使得Transformer可用,從而打破NLP和CV間屏障;BEiT將生成式預訓練從自然語言處理遷移到了計算機視覺;擴散模型多用于文本圖像生成。億歐智庫:從單模態(tài)轉向多模態(tài)億歐智庫:多模態(tài)提升內容多樣性文本聲音圖像視頻……信號多模態(tài)多模態(tài)信息單模態(tài)模型:信息來源或形式單一,例如文字、圖片、音頻等信息媒介和紅外、雷達等傳感器。Transformer權重共享適用于多模態(tài),但存在單模態(tài)局限因為輸入數據的長度有限制,所以基于Transformer的大模型只能基于單一文本模態(tài),不能將其泛化能力遷移到其他如圖片、音頻的模態(tài)上,但其擁有的權重共享理念適用于多模態(tài)模型,權重共享指部分模塊共享權重參數在圖片和文字的多模態(tài)中,圖片訓練得到的權重參數可以直接用于訓練文本,結果有效且無需進一步微調擴散包括正向擴散與反向擴散兩個過程,填補文本圖像生成中的空白圖片分割TransformerEncoderClassViT模型對圖片線性映射處理,變成Transformer可用的輸入,打破自然語言處理和計算機視覺之間的壁壘PositionEmbeddingBEiT將生成式預訓練從NLP遷移到CV 利用ViT解除輸入限制,進行特征提取圖片分割[M][M][M]BlockwiseMaskingBEiTEncoderPatch&PositionEmbeddingDecoderBEiT將BERT中的掩碼語言學習方法應用到圖像領域,將生成式預訓練從自然語言處理NLP遷移到了計算機視覺CV。擴散模型幫助生成文本圖像BEiT解決了計算機視覺上生成式預訓練遇到的問題,解決方法:使用ViT結構處理圖像信息10資料來源:CSDN、中信建投證券、億歐智庫整理多模態(tài)信息持續(xù)融合增加技術多樣性,拓寬場景多模態(tài)在視頻分類、情感分析、語音識別等領域都得到了廣泛,涉及圖像、視頻、語音、文本等融合內容,未來還將進入交互、感知、內容等更多場景。億歐智庫:多模態(tài)融合架構用戶發(fā)出模糊指令用戶環(huán)境聲紋聲音中的文字聲音中的情感肢體動作人臉面部表情嘴唇的動作相對位置環(huán)境服務1生物識別服務2用戶意圖感知多模態(tài)自然語言理解多模態(tài)情感服務3服務呈現音視頻輸出IoT控制應用場景生成內容跨模態(tài)搜索圖像、文本圖像標注 圖像、文本轉移學習 圖像、文本跨模態(tài)嵌入 圖像、視頻、文本視頻分類 語音、視頻、文本事件檢測 語音、視頻、文本情緒分析 語音、視頻、文本情感分析 語音、視頻、文本語音識別 語音、視頻視覺問答 圖像、文本圖像標注 圖像、文本圖像合成 圖像、文本視頻解碼 視頻、文本11在決策式方面,中國已經處在第一梯隊,中國是發(fā)表論文最多的國家,且近10年來占比逐年增加。而在生成式方面,與國外還存在參數量的差距,背后隱含著算力資源、數據質量等基礎要素的不足的原因。中國決策式已達到世界一流水平,而生成式還與國外存在基礎要素的不足億歐智庫:中國的決策式已經達到世界領先水平億歐智庫:中國生成式參數量與國外有一定差距中國是發(fā)表相關論文最多的國家,近十年發(fā)表9萬余篇,占近10年全球論文發(fā)表總量的22.7%。在2021年受關注論文居前十的企業(yè)中,中國企業(yè)占到4家。技術2023年,中國的“燈塔工廠”增至50座,占比超過總數的1/3以上,持續(xù)排名全球第一。此項目由達沃斯世界經濟論壇與管理咨詢公司麥肯錫合作開展遴選,“燈塔工廠”也被譽為“世界上最先進的工廠”,具有榜樣意義的“數字化制造”和“全球化4.0”示范者,代表當今全球制造業(yè)領域智能制造和數字化最高水平。應用2018年1月
2018年6月
2019年1月
2019年6月 2020年1月2020年6月2021年1月
2021年6月
2022年1月
2022年6月GPT
BERTELMo
1.17億1.1億940萬GPT-215億26億RoBERTAERNIE3.55億KEPLER1.02億 1.1億94億Megatron-LMGenerative
BST83億ERNIE100億Meena
DeBERTa15億Megatron-TuringNLG5300億Minerva5400億GPT-31750億Chinchilla700億GLM1300億10億100億1000億10000億參數量中國開發(fā)者其它開發(fā)者中國的生成式處于發(fā)展的初期,底層技術和國外還有較大的差距。國外芯片龍頭公司的斷供及次品供應使得中國生成式的基礎硬件提供不了足夠算力。技術雖然國內眾多廠商開始布局,但是目前的商業(yè)模式還不成熟。技術層面的不足也限制了應用端的發(fā)展。應用0 20 40 60資料來源:中國信通院、Leonis
Capital行研、億歐智庫整理80100120140Alphabet微軟IBMMeta騰訊控股阿里巴巴集團華為技術亞馬遜英偉達國家電網2021年受關注論文篇數居前10的企業(yè)Fastfollower→Firstin
classCopytoChina→CopyfromChina中國開發(fā)者其它開發(fā)者中外大模型參數量對比12資料來源:公開資料、億歐智庫整理原子能力動態(tài)變化曲線的原子隨著時間的變化,內容呈現復雜化、多維化的特征,基礎模態(tài)原子能力向多模態(tài)轉變,表明目前商業(yè)的嘗試正下沉至長尾場景,大模型的泛化能力、實時性、強推理與共情正在不斷滲透為虛擬人、聊天機器人、知識圖譜、合成數據、AIGS進行多維度的賦能,推動通用人工智能時代到來。原子能力:指支撐各類應用、各類場景的要素技術;以生成內容為例,目前大部分應用和場景都需要的文本、代碼輸出、圖像生成音視頻合成的原子能力原子能力維度(內容復雜度)復雜度根據單位內容的token大小時間目錄CO
N
T
E
N
T
S概述人工智能概念梳理生成式人工智能因素分析中外人工智能對比AIGC原子能力變化0102 生態(tài)底座價值鏈分析生態(tài)底座價值拆解算力價值分析數據價值分析算法價值分析生態(tài)服務商總結大模型生態(tài)底座產業(yè)圖譜03 原子能力商業(yè)潛力分析原子能力覆蓋行業(yè)梳理基礎模態(tài)原子能力分析多模態(tài)原子能力分析原子能力商業(yè)潛力評估總結原子能力產業(yè)圖譜優(yōu)秀企業(yè)案例商業(yè)潛力規(guī)模預判商業(yè)潛力邊界模型邊界突破趨勢未來商業(yè)潛力規(guī)模預測0414短期內算力成本占據生態(tài)圈核心,算法與配套的數據價值在遠期凸顯芯片65%內存17%硬盤4%其他14%23%大模型的訓練、微調和運營需要大量的計算資源支撐,目前算力占據生態(tài)圈65%成本,數據及算法占據剩下35%的成本。從短期看,一頭獨大的格局不會發(fā)生太大變化,大模型新入局玩家的算法訓練和老玩家大模型的微調、迭代將會持續(xù)刺激算力成本上揚。從長期看,有望出現三頭并進格局,模型算法的迭代會成為通往AGI的解決方案,隨著應用不斷下沉長尾的專用場景,專用算法及場景沉淀的數據將會成為體驗的核心,另外,合成數據及減少算力依賴的框架算法成熟將會加大緩和算力緊張的缺口。生態(tài)底座價值鏈算力65%算法12%收集35%數據標注45%清洗/存儲20%人力算力65%算力層為模型訓練提供最重要的基礎支持,成本主要由芯片、內存、硬盤等構成,其中芯片是算力的核心數據集快速膨脹和參數量持續(xù)上漲導致算力需求及算力成本大幅上升23%層主要負責數據的收集、標注、清洗、儲存隨著不斷發(fā)展,專業(yè)領域的復雜數據標注需求提升算法12%隨著資產的復用和自動化程度的提升,可以實現規(guī)模效應資料來源:專家訪談、國海證券、公開資料、億歐智庫整理
該成本測算基于2023年數據15資料來源:浪潮、OpenAI、Nature、
公開資料、億歐智庫整理擴大算力是的剛需隨著數字經濟蓬勃發(fā)展,數字化新事物、新業(yè)態(tài)、新模式推動應用場景向多元化發(fā)展,擴大算力是短期內最需要解決的問題,在后摩爾時代,算力供給和需求都會飆升,據預測,中國智能算力規(guī)模將會擁有47.5%的年復合增長率,但與智能算力需求仍存在較大差距。億歐智庫:中國算力需求剪刀差算力構成了產業(yè)的核心底座,主要包括芯片、服務器和數據中心芯片:是算力的基礎,主要分為CPU、GPU、FPGA、ASIC四類。CPU是人工智能計算的基礎,而GPU、FPGA和ASIC為協助CPU進行大規(guī)模計算的加速芯片。服務器:對芯片進行系統集成。服務器的架構為“CPU+加速芯片”,在進行模型處理推理和訓練時,效率更高。數據中心:提供計算服務,承接算力需求。使用算力資源在云端實現模型訓練。3275155268427641923127114001200100080060040020002024E2025E2026E2019 2020 2021 2022 2023E中國智能算力規(guī)模及預測億歐智庫:中國2019-2026年智能算力供應2022-2026ECAGR:47.5%單位:EFLOPS1e+21e+01e-21e-41e-61e-81e-101e+419852015NETtalkRNNfor
speech1995 2005TD-Gammom
v2.11985-2025年智能算力需求單位:petaFLOPdaysGPT-32020 2025Megatron-BERTGPT-2BERTAlexNetAlphaGoZeroAlphaZeroRetsNets2022年之后時代每年算力需求在短期內會有6400%的年需求MLP-based
neuralnetworkbreaksBILSTMfor
speech根據Open預測,人工智能算力需求短期類年均將增長64倍*華為輪值董事長胡厚崑也在2022年WAIC上表示,未來10年人工智能算力需求將增長500倍根據浪潮預測,未來五年內,智能算力的CAGR為47.5%,算力存在明顯的短缺狀態(tài)。16資料來源:專家訪談、公開資料、億歐智庫整理短期內GPU不可撼動,但隨著任務比例變化,FPGA及ASIC有望遠期成為主力芯片短期看,GPU占據訓練及推理的絕對地位,英偉達基于CUDA強大的并行計算能力及自身產品力構建了護城河;遠期看,FPGA及ASIC芯片時延低、特需設計等特點將成為主力芯片,國內廠商憑借兩者的多年積累有望加速芯片的自主化進程。短期內遠期變化云端云端邊緣端云端主要部署高算力的訓練芯片和推理芯片進行訓練和推理任務,邊緣端基本只部署推理芯片應用芯片種類GPUGPUFPGAFPGAASICASICGPU在構建中具有高適配性與高并行性的特點,可以更好支持模型訓練中大量矩陣和向量的計算,同時,其強大的通用能力在推理任務中表現良好(GPU目前在訓練和推理中占據絕對主力,不過推理的市占地位整體不及訓練任務)根據GPU強大的通用能力依舊在芯片占據一席之地FPGA在訓練任務所需要的浮點運算能力中較弱;可通過編程靈活配置芯片架構適應算法迭代,平均性能較高,擁有可編程性、可重構性和定點運算功能,在推理端使用較多開發(fā)時間長,研發(fā)成本高,進入門檻高大模型架構未統一,導致訓練端未普及應特定用戶要求和應用程序的需要而設計、制造的集成電路,有穩(wěn)定的性能和優(yōu)秀的功耗控制在面對推斷環(huán)節(jié)的小批量數據處理時,可以憑借流水線并行,達到高并行+低延遲的效果受延遲、隱私和帶寬限制的驅動,逐漸被布署于IoT設備當中,以滿足低功耗+靈活推理+快速響應的需求隨著、算法的普及和趨向統一,專業(yè)性更強的ASIC將更具備競爭優(yōu)勢,ASIC在研發(fā)制作方面一次性成本較高,但量產后平均成本低,具有批量生產的成本優(yōu)勢訓練 推理云端霧/邊緣端云端 霧/邊緣端遠期來看,大模型進入出清階段,芯片主要負責日常運行的推理任務,訓練任務則下渡到霧/邊緣側以滿足具身智能應用需求訓練推理17資料來源:《近10年國際學術論文中的語言選擇和中文使用情況分析研究》、OneFlow、w3techs、億歐智庫整理缺乏優(yōu)質數據,讓中文大模型患上“心臟病”由PGC和UGC進行內容支撐,缺乏過往內容的將會直接性影響,缺乏高質量的中文數據資料,將會影響到中文大模型在知識領域的能力。此外,國內擁有大量高價值數據的互聯網企業(yè)更傾向于將數據封閉在APP和平臺中,不同APP間數據不能連通,無法搜索,形成“數據孤島”現象。英文占領主導地位億歐智庫:中文數據質與量皆有差距1英文互聯網和中文互聯網普及的時間差達到了半個世紀2當今高質量的學術論文以英文為主公開已標注數據集以英文為主,缺乏中文3英文擁有數量極大的訓練用數據集GPT訓練來源Common
Crawl(網站抓取的大型數據集)WebText2(Reddit網頁爬?。〣ooks(故事型書籍數據集)Wikipedia(維基百科)Journals(學術寫作數據集)CommonCrawl包含約31億個網頁內容和320TB的文字信息包含原始網頁、元和文本提取數據集中,英文占46%,俄、德、日、中都占5%左右移動互聯網時代,國內大廠從融資、估值到上升都需要用戶講故事,所以大量封閉在各企業(yè)的APP和平臺中,最終形成了APP內部的閉環(huán),產生了“孤島”的現象。5445184684222018.62019.62020.62021.6數量(萬個)國內的網站數量規(guī)模下降,但是互聯網的流量有著上升趨勢互聯網企業(yè)為了實現自己的流量和盈利目的,屏蔽其他軟件,切斷搜索路徑,進行資源與內容的分割。導致不同平臺之間流通共享大幅減少,信息可檢索度降低。中國移動互聯網的興起,導致從更開放的網站,遷移至較為封閉的APP/小程序中億歐智庫:中國網站數量18資料來源:公開資料、億歐智庫整理數據馬太效應或導致中國大模型難以獲得商業(yè)循環(huán)的支撐由于英文數據和中文數據之間的指數級別的差距,建立在數據之上的模型也會出現越來越大的差距,形成數據馬太效應。馬太效應或導致英文大模型獲得更多的商業(yè)機會,中文大模型亟需大量高質量的標注數據提升模型能力。億歐智庫:數據馬太效應中文大模型缺乏優(yōu)質中文中國下游開發(fā)者英文大模型海外下游開發(fā)者無法滿足尋求大模型尋求大模型提供大模型提供高質量標注使用英文訓練大模型尋求大模型提供大模型提供高質量標注數據馬太效應或導致中國大模型發(fā)展缺乏商業(yè)支撐數據馬太效應對于中國大模型服務商,缺乏高質量的標注數據,缺乏愿意買單的下游客戶,無法形成積極正向的商業(yè)循環(huán),形成中外大模型的馬太效應。以GPT-4為例,雖然靠遷移回譯能夠滿足大部分中文對話,但是隨著模型的不斷迭代,以及英文數據的持續(xù)填充,數據馬太效應導致英文模型和中文模型的能力差距會逐漸增大。目前來看,中英模型的能力差距在5%-10%左右,長此以往,基于“大模型+微調”的原則,使用中文大模型的下游應用也會出現差距,英語(甚至是日耳曼語系)下游開發(fā)企業(yè)將會獲得相對競爭優(yōu)勢。使用英文數據訓練的模型整體將比使用中文數據的模型強,且會越來越強19資料來源:整數智能、公開資料、億歐智庫整理中文高質標注數據是國內大模型能力躋身國際先進水平的充要條件數據工程是工程的基礎環(huán)節(jié),其核心在于高質高效的數據標注,數據工程所得出的數據的質量,直接影響到整個模型的質量與精度。中國數據量呈指數級增長,其中大占比的非結構化數據產生海量數據標注與清洗的需求,未來市場前景廣闊。億歐智庫:數據巨量化,標注需求擴張采集標注影響±10%的準確率模型訓練部署影響±1%的準確率億歐智庫:中國生產量(2018-2026E)48.67.5 1256.162018 2020 2025E中國生產數據量(單位:ZB)2026E數據類型 結構化數據占20%以文件形式存在的非結構化和半結構化數據占80%標注在大模型早起開發(fā)和專用領域開發(fā)中有著不可替代的作用,模型的監(jiān)督學習需要數據的標注來保證精度,而半監(jiān)督學習和無監(jiān)督學習往往無法達到同樣的精度。非結構化非結構化機器數據和文件占非結構化數據的90%非結構數據需要經過標注才能被利用,帶來大量數據的標注需求但國內只有22%的企業(yè)有自建的數據團隊,且目前數據標注的精度與國外頂尖水平還存在差距理論、算法模型、應用場景不斷優(yōu)化創(chuàng)新,人工智能產業(yè)對訓練數據的質量與數量要求快速提升數據標注
產業(yè)對數據類型的需求多樣化,垂直類需求增長,產業(yè)鏈出現專業(yè)化分工的趨勢,使得不同領域的專業(yè)化數據服務提供商作用凸顯億歐智庫:數據工程占80%工程時長數據工程時長占比80% 模型工程時長占比10%充要條件:充分必要條件資料來源:公開資料、億歐智庫整理開發(fā)通用大模型成為應用的底座算法模型是人工智能的“靈魂”,通過建立算法模型并進行下行研發(fā)實現資產的復用獲得盈利。盈利方式通過大模型使用授權、行業(yè)大模型定制、工作流訂閱及基于下游任務微調三種途徑訂閱模式、平臺服務模式、定制化服務模式、API服務模式、廣告和推廣模式、數據授權模式的商業(yè)變現。行業(yè)大模型通用大模型原子工作流訂閱及基于下游任務微調行業(yè)大模型定制通用大模型使用授權訂閱模式API服務模式平臺服務模式定制化服務模式廣告和推廣模式數據授權模式大模型商業(yè)應用演化大模型各階段盈利模式大模型細分收費方式20目前大模型生成應用服務以B端為主,平臺服務模式占比相對較高作為服務提供商,向B端和C端用戶提供生成內容的技術平臺和工具,并通過收取平臺使用費、交易手續(xù)費、廣告和推廣收益以及數據授權收益等方式獲得收益。在用戶定位方面,主要面向B端用戶,如媒體、廣告主、文化機構等,以及開發(fā)者、科研機構等需要使用生成內容技術的用戶。B端C端訂閱模式平臺服務模式定制化服務模式API服務模式廣告和推廣模式授權模式5%10%15%20%25%30%2022年Q4-2023年Q1盈利模式占比定義:用戶通過訂閱服務,定期或按需獲取人工智能生成的內容。案例:Open:提供了GPT-3訂閱服務Grammarly:提供英文語法和寫作幫助的訂閱服務定義:提供生成內容技術平臺和工具,通過收取平臺使用費獲得收益。案例:GoogleCloud
:提供各種平臺服務定義:公司可以根據客戶的特定需求,提供定制化的人工智能生成內容服務。案例:Hugging
Face:提供NLP領域的開源軟件,同時也提供定制化的NLP服務定義:公司提供人工智能生成內容的API,供開發(fā)者集成到自己的應用程序中。案例:GoogleCloudVision
API:提供基于圖像和視頻的視覺智能API服務定義:人工智能生成的內容可以作為廣告或推廣渠道,通過展示廣告或推廣內容來獲得收益。案例:阿里巴巴“文娛大腦”:為企業(yè)生成各種類型的廣告文案定義:人工智能生成的內容可以作為數據的授權和授權來源,被其他公司或個人購買或授權使用。案例:Open:將GPT-3的API授權給了Microsoft和GitHub等公司資料來源:專家訪談、公開資料、億歐智庫整理2122資料來源:公開資料、億歐智庫整理生態(tài)底座服務商總結整體來看,數據和算力是大模型性能的關鍵限制因素,而算法的不斷改進是讓大模型接近其上限能力的關鍵,同時也是商業(yè)變現的“接口”。生態(tài)底座服務商會形成以互聯網企業(yè)的通用大模型+行業(yè)大模型+原子基礎能力的泛化派玩家,以大模型服務商、行業(yè)/垂直領域服務商為主的專用派服務商,結合企業(yè)自身過去的業(yè)務與技術強化在長尾場景的能力。底座能力評估模型底座不同類型玩家天花板:數據地板:算力數據的多樣性和數量對于大模型的表現至關重要,因為大模型需要大規(guī)模的高質量數據進行訓練,以提高其理解和生成語言的能力。大模型需要強大的計算資源來進行訓練和推理,以處理龐大的參數量和復雜的計算任務。較低的算力會限制大模型的訓練速度和性能。三類玩家模型能力原子能力行業(yè)大模型通用大模型互聯網企業(yè)大模型服務商(以過去做NLP和CV模型為主的企業(yè))行業(yè)/垂直領域服務商(行業(yè)服務商,例如自動駕駛、醫(yī)療等):?????算法:?????算力:?????:????算法:?????算力:????:????算法:????算力:??通過基礎原子能力向各行各業(yè)進行“+”式的賦能。利用大模型的生成能力、實時能力、推理能力及泛化能力,結合自身過去NLP和CV相關能力的積累,強化和創(chuàng)新原子能力,另外通過大模型的上述開發(fā)可以覆蓋行業(yè)場景的長尾環(huán)節(jié)。大模型服務商以合作形式進行開發(fā)行業(yè)大模型。通常將收集、數據標注等處理業(yè)務外包給服務商。與行業(yè)龍頭合作增強行業(yè)的認知,將行業(yè)常規(guī)的問題處理邏輯嵌入行業(yè)大模型中?;谧陨韺τ谛袠I(yè)/垂直領域的理解,結合自身的開發(fā)行業(yè)大模型,具備算法與數據的能力,但是通常需要外包算力的支持。大模型的先驅者,以數據、算法、算力三者全而強的互聯網企業(yè)為主。他們具備web1.0時代至今積攢的巨額市場利潤以及龐大的高質量數據與優(yōu)秀人才大模型的開發(fā)。公司通常擁有專門的機器學習工程師和科學家,能夠創(chuàng)建并優(yōu)化復雜的模型。-算法是大模型“建筑的主體結構”,任何天花板、地板都不能獨立于“建筑主體結構”而存在。如果算法存在代差,再高質量的數據與充沛的算力都無法拔高大模型的能力,所以引入更高效的算法是提高大模型學習速度、推理能力和語言生成質量的關鍵因素。主體結構:算法23大模型生態(tài)底座產業(yè)圖譜產業(yè)基礎層以提供算法、算力、數據處理的企業(yè)為主,產出大模型,再經過中間層服務商微調及針對訓練。算力算法ASIC服務器芯片GPUFPGAAIDC云計算數據存儲存儲設備云存儲服務查詢與處理轉換與編排數據標注與管理治理與合規(guī)機器學習機器學習增強學習深度學習CV多模態(tài)NLP資料來源:億歐智庫整理目錄CO
N
T
E
N
T
S概述人工智能概念梳理生成式人工智能因素分析中外人工智能對比AIGC原子能力變化0102 生態(tài)底座價值鏈分析生態(tài)底座價值拆解算力價值分析數據價值分析算法價值分析生態(tài)服務商總結大模型生態(tài)底座產業(yè)圖譜03 原子能力商業(yè)潛力分析原子能力覆蓋行業(yè)梳理基礎模態(tài)原子能力分析多模態(tài)原子能力分析原子能力商業(yè)潛力評估總結原子能力產業(yè)圖譜優(yōu)秀企業(yè)案例商業(yè)潛力規(guī)模預判商業(yè)潛力邊界模型邊界突破趨勢未來商業(yè)潛力規(guī)模預測0425資料來源:國家統計局、公開資料、億歐智庫整理賦能趨勢明顯,創(chuàng)意設計輸出、前端展示相關的賽道將會率先受益大模型推出對文本、圖像、音頻、視頻了直接性的影響,為各個行業(yè)賦能的趨勢已經顯現,服務類行業(yè)、制造類行業(yè)、文娛類行業(yè)將會受到較大沖擊?;A原子能力文本音頻圖像視頻編碼服務類行業(yè)居民和家庭健康服務養(yǎng)老服務居民零售和互聯網銷售居民出行住宿餐飲教育培訓居民住房金融服務制造類行業(yè)醫(yī)藥制造航空、航天器及設備制造電子及通信設備制造計算機及辦公設備制造醫(yī)療儀器設備及儀器儀表制造化學品制造文娛類行業(yè)新聞出版發(fā)行廣播電視電影文化信息傳輸文化創(chuàng)意與設計文化休閑娛樂旅游游覽和娛樂體育游戲虛擬人合成數據知識圖譜聊天機器人AIGS多模態(tài)原子能力資料來源:公開資料、億歐智庫整理文字模態(tài)原子能力作為語言能力的核心,已有大量的商業(yè)應用早期發(fā)展的重點之一是基于自然語言處理技術的文字單模態(tài)原子能力,其包含文本回復、文章生成、內容續(xù)寫等細分功能。文字單模態(tài)原子能力能夠在各職能中落地,主要應用有經營決策,管理協作,產品研發(fā),市場營銷,涵蓋會議記錄、需求分析等。文字單模態(tài)原子能力應用介紹強調實時性文本回復:用于自動回復和解決用戶的問題,應用于智能問答系統、聊天客服機器人和智能推薦系統文本交互:為用戶提供心理疏導和情感咨詢與支持,如虛擬伴侶/朋友開發(fā)實時文字類交互游戲,如AI
dungeon1交互性文本生成強調內容推理性文章生成:結構性寫作,有較強的生成規(guī)律,包括文本風格遷移、對話式/結構式文本生成等,為目前落地最廣泛的場景輔助寫作:基于已獲得的素材輔助創(chuàng)作,包括文本素材預處理、自動智能去重、根據要求提供對應文本素材等文本續(xù)寫:根據已有內容續(xù)寫,使內容符合邏輯而又有文學價值營銷文案:非結構性寫作,需要一定創(chuàng)意和個性化,包括廣告文案、產品描述、社群營銷、社交媒體發(fā)布等2非交互性文本生成26文字單模態(tài)原子能力在各職能應用市場情報分析:分析市場趨勢和消費者需求,幫助決策者制定戰(zhàn)略輿情監(jiān)測:分析新聞等渠道中的文字信息,評估對企業(yè)聲譽的影響經營決策會議記錄與匯總:分析會議紀要,生成會議摘要或行動項清單文檔自動生成:根據輸入信息生成文檔的摘要、概述或推薦內容管理協作用戶需求分析:分析用戶反饋、市場調研等文本數據競爭對手分析:幫助識別和分析競爭對手的產品特點產品研發(fā)智能創(chuàng)意營銷:通過分析用戶評論、等文本信息,幫助優(yōu)化廣告創(chuàng)意智能銷售流程:自動分析和處理銷售相關的文本信息市場營銷27資料來源:公開資料、億歐智庫整理圖片生成技術難度相對較大,但發(fā)展速度迅猛,具有較高的商業(yè)潛力圖像生成技術主要包括GAN、Diffusion
Model、NeRF等,圖像的生成難度遠大于文字生成,現今生成穩(wěn)定高質的圖像仍有難度。主要有圖像分析、視覺項目管理、圖像識別廣告等應用。億歐智庫:圖片單模態(tài)原子能力的應用圖片單模態(tài)原子能力在各職能的應用基于原圖像進行修改圖像屬性編輯:自動或輔助進行圖片修改調整,如提升清晰度或分辨率、設置濾鏡、去水印圖像局部生成及更改:在原圖片基礎上進行微調,更改部分圖像、改動圖片人像特征1圖片編輯基于草圖生成完整圖像功能性圖像生成:制作營銷宣傳類海報/公眾號界面、logo、衣物/妝容效果示意圖創(chuàng)意圖像生成:較為前沿,多出現在數字藏品、加密數字資產藝術品中2圖像生成圖像數據分析:對大量圖像數據進行分析,獲取有關產品需求視覺競爭對手分析:幫助企業(yè)分析競爭對手的廣告等圖像信息,提供視覺上的競爭優(yōu)勢經營決策圖像標注和共享:實現圖像標注和注釋,提高協作效率視覺項目管理:該能力可以幫助管理團隊跟蹤視覺項目,以確保項目按時交付管理協作產品可視化和設計:實現產品的三維可視化、虛擬樣機等基于圖像的用戶反饋分析:分析用戶對產品外觀、包裝等圖像方面的反饋,為產品改進和創(chuàng)新提供支持產品研發(fā)圖像識別廣告:識別圖像中的產品等,實現與之相關的廣告投放圖像社交媒體分析:分析社交媒體平臺上的圖像內容,為市場營銷人員提供洞察和反饋市場營銷28資料來源:公開資料、億歐智庫整理音頻單模態(tài)可用于有聲內容創(chuàng)作,是文字、圖像之后同樣具備潛力的賽道基于技術的音樂生成將會是音頻單模態(tài)原子應用領域的快速成長賽道,同時音頻生成將會對短視頻、虛擬偶像、影視劇等文娛領域產生深遠且意義重大的影響。音頻單模態(tài)原子能力有語音分析、聲音品牌塑造等細分功能。音頻單模態(tài)原子能力的應用音頻單模態(tài)原子能力在各行業(yè)應用聲音合成:將已有文本轉換為語音,基于深度學習,根據文本內容推斷感情和情緒,從而在語音中呈現語音克?。褐付繕艘羯?,采集語音信號,進行預處理和特征提取,訓練出語音模型,進行文本轉語音1文本轉語音場景作曲:通過對音高、音長等低維度樂理提取,在獲得樂曲主旋律的基礎上,進行續(xù)寫或改編編曲:根據給定的情緒或風格,基于主旋律生成和弦,完成整體編配虛擬歌曲:將生成的主旋律、人聲和音軌渲染混合,得到完整樂曲2樂曲生成場景語音數據分析:對大量語音數據進行分析,如電話客服錄音,以獲取有關市場趨勢的洞察聲音品牌塑造:幫助企業(yè)塑造聲音品牌,以提升品牌的識別度經營決策語音記錄和共享:實現語音記錄和共享,例如會議錄音的自動轉錄和存檔,便于團隊成員回顧和參考音頻編輯與處理:支持團隊對音頻編輯和處理管理協作語音交互設計:可以設計和開發(fā)語音交互的產品和服務基于音頻數據的用戶洞察:分析用戶在產品使用過程中的語音反饋和需求,為產品改進和創(chuàng)新提供支持產品研發(fā)語音廣告和推廣:生成語音廣告和推廣內容,例如電話營銷、語音廣播等,以增加品牌曝光和用戶參與度聲音情感分析:分析音頻中的情感色彩,識別用戶情緒和情感反饋市場營銷29資料來源:AMR、開源證券、《2020數字虛擬人發(fā)展白皮書》、億歐智庫整理虛擬人擁抱解決成本痛點,拓寬場景應用,產生長期價值虛擬人已經開始廣泛的行業(yè)探索,市場潛力巨大,利用賦能的虛擬人產業(yè)全球規(guī)模將于2031年達到5910億美元??梢越档吞摂M人的制作壁壘,利用虛擬人技術的快速鋪開。同時,可以驅動虛擬人運作,進行實時交互,拓寬虛擬人的場景。億歐智庫:全球虛擬人市場規(guī)模預測(2021-2031E)賦能虛擬人11316445475908202120222023E2024E2025E2026E2027E2028E2029E2030E2031E前全球虛擬人市場規(guī)模預測曲線(億美元)賦能全球虛擬人市場規(guī)模(億美元)據國際知名數據機構預測,經過全球賦能的虛擬人市場規(guī)模在2031年將達5910億美元,的增幅約為30%。降低虛擬人成本開始嘗試將虛擬人物引入現實世界,整體以手繪為主萌芽期動捕和CG等計算機逐步替代手繪,成本高昂探索期成為必要工具,深度學習簡化數字人的制作,但成本依舊高企智能驅動虛擬人實時交互建模虛擬人制作渲染驅動規(guī)劃規(guī)劃運營運營維護直播商業(yè)變現帶貨活動成本占比60%30%10%智能分析與決策 識別感知終端用戶人物語音錄制動捕遷移生成動畫音視頻合成顯示文本虛擬人的成本集中于制作及運營環(huán)節(jié),利用強大的生成能力輔助建模、渲染等重要環(huán)節(jié),減少虛擬人投入成本利用技術的實時驅動型虛擬人運作流程為“用戶-終端-智能分析-合成-終端-用戶”的閉環(huán),減少利用“真人”數據的依賴大突破,強大的泛化、交互促進虛擬人真正走向智能化、實時化發(fā)展期中國虛擬人現今所處階段成熟期賦能可以為占據虛擬人90%成本的制作、規(guī)劃運營環(huán)節(jié)賦能,降本增效利用大模型的生成、推理、共情賦予虛擬人實時互動能力真人 音視頻監(jiān)控系統賦能XX億歐智庫:中國虛擬人進程階段30資料來源:億歐智庫整理虛擬人在服務類行業(yè)、文化傳媒類行業(yè)擁有較多的應用虛擬人主要在服務類行業(yè)、文化傳媒類行業(yè)進行,在的時代,利用自動生成的能力,虛擬人可以實現實時交互、降低建模成本、覆蓋多種場景,且可擴展性高、降低真人產生的侵權風險。虛擬人在各行業(yè)落地應用,加速產業(yè)智能化服務類行業(yè)01文化傳媒類行業(yè)02制造類行業(yè)03電商產品展示:利用虛擬人的類人特性,展現衣物在不同體型的人身上的試穿效果虛擬人主播:形成“真人+虛擬人”的24小時不間斷直播,且無需上崗培訓,壓縮人員成本實時互動:利用強大的內容生成能力與共情能力,和觀眾實時交流互動前臺接待/情感陪護:以較低廉成本生成虛擬人,覆蓋接待、陪護等場景元宇宙分身:利用生成全身化、定制化的虛擬分身,作為元宇宙的入口虛擬人的場景更貼近用戶端,以前端展示類場景、中端的攝制制造類場景、后段的運營維護場景為主。整體來看,虛擬人更偏向于服務類與文化傳媒類行業(yè),應用更聚焦于核心環(huán)節(jié)。利用加持,降低建模、渲染等成本,同時加強“虛擬人-用戶”的互動性。故障排查:利用與數字孿生生成工業(yè)元宇宙模擬真實生產環(huán)境,由虛擬人進行危險、故障排摸人員培訓:利用虛擬人模仿真實操作設備的場景,以沉浸式的感官體驗,教授工人進行作業(yè)以前端對接為主以代人攝制為主以維護、運營為主三維數字人:利用虛擬人進行三維電影拍攝,在的加持下,幫助導演實現現實拍攝中無法表現的內容和效果數字復活:利用虛擬人與過世演員的臉部特征進行數字復活,避免拍攝中斷數字替身:虛擬人仿真缺席拍攝的演員(包括劣跡藝人)31資料來源:Cognilytica、Grand
View
Research、Gartner、J.P.Morgan、億歐智庫整理利用強大的生成能力及多模態(tài)能力助力合成數據多樣化,模擬真實世界屬性2030用于人工智能的數據今天的人工智能未來的人工智能真實數據合成數據真實數據Real
Data真實數據度量RealData
Metrics結果比較MetricsComparator合成DataGenerator合成數據SyntheticData合成數據度量Synthetic
DataMetrics判斷真實數據存在的痛點:難以獲取、質量差、標準不統一采集費時費力,獲取成本較高缺乏多樣性,難以覆蓋長尾、邊緣案例存在隱私保護問題賦能合成數據,解決數據獲取難、數據采集成本高、數據樣本多樣性不足和數據隱私保護需求等痛點問題。實現數據增強和數據模擬,解決數據匱乏等問題降低采集的成本,擴展的應用可能性確保數據多樣性更多反映真實世界,并應對長尾、邊緣案例,提高
Al
的準確性、可靠性避免隱私/安全/保密問題,利用合成數據訓練可以避免直接應用隱私數據的法律風險合成數據(
synthetic
data
):通過,生成合成人工智能發(fā)展所需的海量數據,可以在數學或統計學上反映真實數據的屬性與特征,可作為真實數據的輔助與替代品,幫助訓練和驗證模型。60%到2024
年,用于訓練
Al
的數據中有
60%
將是合成數據利用的生成能力與多模態(tài)能力大量合成反映真實數據屬性和特征的海量數據,并于新興技術,以自身為例,將在未來成為訓練數據的主要來源,預計到2030年將完全取代真實數據。賦能合成數據,能夠解決真實數據獲取難、獲取成本高、多樣性不足、缺乏隱私保護等痛點問題。訓練合成數據占比預測 億歐智庫:數據合成過程2020 202432資料來源:騰訊研究院、億歐智庫整理加快合成數據發(fā)展結構化數據是指具有明確格式和規(guī)則的數據,主要用于服務類行業(yè)。在金融行業(yè)中可以用來防范金融詐騙。在零售行業(yè)中,超市可以將銷售歷史數據、庫存數據和供應商數據合成,以便跟蹤產品銷售趨勢并進行采購決策。非結構化數據是指沒有明確格式和規(guī)則的數據,如文本、圖像等,主要用于工業(yè)制造類行業(yè)。在自動駕駛業(yè)中可以用來幫助解決系統開發(fā)的數據量和多樣性不足的問題。億歐智庫:合成數據在服務類和工業(yè)制造類行業(yè)中的應用合成數據在服務類和工業(yè)制造類行業(yè)中都有廣泛應用,通過合成多種來源的數據,能夠更好地了解決業(yè)務問題。金融服務業(yè):利用生成對抗網絡(GAN)和自然語言生成(NLG),訓練、優(yōu)化進行欺詐檢測的模型,防范金融詐騙和反洗錢等重大問題。零售業(yè):零售公司需要管理大量的庫存數據、銷售數據和客戶數據等結構化數據,以便了解市場趨勢、優(yōu)化庫存和提高銷售額等。物流運輸業(yè):物流和運輸公司需要處理大量的運輸和倉儲數據,以便跟蹤貨物運輸狀態(tài)、優(yōu)化運輸路線和降低成本等。健康醫(yī)療業(yè):健康醫(yī)療行業(yè):醫(yī)療機構需要處理大量的病歷、藥品和治療數據等結構化數據,以便為患者提供更好的醫(yī)療服務。結構化數據是指具有明確格式和規(guī)則的數據,如數據庫中的表格、電子表格、CSV文件等。服務類行業(yè)支撐部門的業(yè)務優(yōu)化非結構化數據是指沒有明確格式和規(guī)則的數據,如文本、圖像和視頻等。工業(yè)制造類行業(yè)工業(yè)配套軟件優(yōu)化自動駕駛業(yè):模擬海量仿真環(huán)境與駕駛場景,訓練、開發(fā)自動駕駛系統,幫助解決系統開發(fā)過程中的數據量和多樣性不足的問題。產品仿真:幫助制造商在各種虛擬環(huán)境中模擬產品性能、測試產品強度和耐用性,進行各種模擬測試。輔助大模型:通過合成數據,對大模型進行訓練和驗證,提升速度與質量。制造業(yè)流程優(yōu)化結構化數據 非結構化數據33資料來源:Precedence
Research、Salesforce、麻省理工學院技術評論、Accenture
Digital、億歐智庫整理賦能聊天機器人知識庫能力、對于用戶的問題進行擬人回復全球企業(yè)都在越來越重視聊天機器人的,聊天機器人可以提高生產力和便利性,改善客戶服務體驗、提升員工利用率,加快與品牌溝通速度,更快解決客戶問題和投訴,以及帶來更高的投資回報率??梢詫⒅R庫的能力灌注至聊天機器人,并通過上下文聯系、提示詞等手段智能回復,同時拒絕不恰當的請求。聊天機器人工作流程聊天機器人是一種可以模擬和處理人類會話(書面/語音)的計算機程序,讓人能夠與數字設備交互,就像和真人交流一樣。消費者使用聊天機器人加快與品牌溝通速度67%企業(yè)報告使用機器人可以更快地解決投訴90%企業(yè)稱聊天機器人以最少的投資獲得巨大回報57%客戶交互可以通過聊天機器人來解決80%可以分析用戶提出的觀點或論斷,并根據事實和邏輯反駁或糾正有助于減少惡意的傳播,為用戶提供一個良好的交流環(huán)境提供較為準確可靠的信息維護秩序和良好的交流環(huán)境提供個性化和定制化的回答,無需用戶重復輸入問題背景和前提條件,增強用戶滿意度和體驗通過承認回答中的錯誤,逐步提升邏輯與回答水平提升用戶滿意度不斷提升自主學習能力語音識別ASR自然語言理解NLU對話管理DM命令執(zhí)行自然語言生成NLU語音合成TTS用戶口頭輸入賦能聊天機器人進行擬人回復過濾或拒絕不恰當請求挑戰(zhàn)或反駁不正確意見承認回答中的錯誤可以根據歷史提問記錄回答問題34資料來源:公開資料、億歐智庫整理聊天機器人成為各個應用的前端場景,成為“可以交互的UI界面”服務類行業(yè)01文化傳媒類行業(yè)02制造類行業(yè)03聊天機器人在服務類行業(yè)、文化傳媒類行業(yè)、制造類行業(yè)都有著廣泛的,可以提供預約調度、旅游規(guī)劃、庫存管理等自動化服務,進一步提升效率和用戶體驗。聊天機器人的場景不斷拓展,將越來越受到各行業(yè)的歡迎和青睞。以前端對話服務為主以智能化服務為主以運營保障為主預約調度:根據客戶需求和業(yè)務規(guī)則,自動處理日程預定、會議預約等,提供定制化服務醫(yī)療服務:與患者對話,獲取患者信息,推薦與調度醫(yī)療專家,同時進行藥物提醒和情緒跟蹤客戶服務:聊天機器人可以幫助企業(yè)為客戶提供快速、高效的服務,如客戶咨詢、投訴處理等語音客服:聊天機器人可以結合語音識別和語音合成,為客戶提供智能化的語音客服服務酒店服務:聊天機器人可以幫助酒店為客戶提供更加便捷、舒適的服務聊天機器人的場景越來越多樣化,能夠提高人們事務處理的效率,節(jié)省人們的時間與精力。通過聊天機器人,企業(yè)能夠提高生產效率,加快反饋速度,優(yōu)化客戶體驗,從而增強企業(yè)的競爭力。聊天機器人多場景旅游規(guī)劃:提供旅游咨詢和旅行路線規(guī)劃等服務,省時省力劇情梗概撰寫:自動回復總結出影視文學作品的梗概,并輸出視頻,無需人工處理情感陪護:即時輸出文字/音頻,對用戶情感陪護投訴處理等新媒體營銷:聊天機器人可以作為新媒體營銷的重要工具,提供產品推廣和品牌營銷服務內容推薦:聊天機器人可以通過自然語言處理,分析用戶的興趣和喜好,為用戶推薦個性化的內容庫存管理:跟蹤庫存水平、物料需求和供應鏈狀況,為制造商提供庫存管理建議和調整策略協助查詢:協助員工查詢和理解工藝流程和安全規(guī)范等,提高員工生產力和質量質量控制:聊天機器人可以通過圖像識別和自然語言處理,自動分析產品的質量問題和缺陷設備維修:聊天機器人可以通過物聯網和傳感器監(jiān)測設備的運行狀態(tài)和健康狀況供應鏈管理:聊天機器人可以為制造商提供實時的供應鏈和建議35資料來源:公開資料、億歐智庫整理賦能知識圖譜多模態(tài)能力完成長尾識別與跨模態(tài)鏈接可以通過文本分析和圖像處理等多模態(tài)技術,從海量的文本和圖像數據中自動抽取和識別實體和關系,并將它們映射到知識圖譜中,自動產生新的實體和關系,幫助知識圖譜不斷豐富和擴展。還可以通過提高知識圖譜的自然語言理解能力,將實體和關系作為上下文信息,從而提高檢索和推薦的準確性和個性化程度。億歐智庫:知識圖譜進行多模態(tài)轉化與知識圖譜的多模態(tài)轉變視頻音頻圖片知識圖譜模態(tài)能力疊加知識圖譜需要利用進行多模態(tài)轉化知識圖譜,即是將互相鏈接,其數據來源不僅限于文本和結構化數據,同時還包括圖片、音頻、視頻等。在經過多模態(tài)轉化后,知識圖譜將得到極大提升:利用多種模態(tài)的知識,進行知識互補同時關聯多種模態(tài),提升實體消歧效果正確鏈接多模態(tài)數據與知識圖譜中的對應實體,實現跨模態(tài)語義搜索補全知識圖譜幫助知識圖譜進行多模態(tài)轉變知識圖譜現存痛點 賦能解決KG痛點推理能力弱
通過強大的跨模態(tài)能力增強kg關聯推理能力,人工成本高 提升泛化能力架構調整難
大模型合成數據不需要人工額外標注可通過調優(yōu)訓練,適配新領域賦能實現知識圖譜長尾識別、跨模態(tài)鏈接長尾識別主要目標長尾目標跨模態(tài)實體鏈接穿白裙子、戴白帽子在草地上走路的人穿在戴白裙子白帽子36資料來源:億歐智庫整理多模態(tài)知識圖譜提升內容厚度,實現更個性化與精細化的服務產出服務類行業(yè)01文化傳媒類行業(yè)02制造類行業(yè)03整體來看,知識圖譜主要通過構建提供個性化服務的體系、構建產品知識庫、可視化交互等方式,為企業(yè)提供語義搜索、知識問答、推薦與決策等功能,幫助企業(yè)實現個性化服務和精準觸達,并增強平臺的黏性和用戶留存率。通過個性化屬性的挖掘,提供更針對性的服務通過圖譜明晰信息的內在聯系,主要用于可視化交互、營銷通過知識數據庫對設備狀態(tài)、產品狀態(tài)進行對比性分析,并進行優(yōu)化賦予知識圖譜更高的準確性、智能化程度以及多模態(tài)內容厚度,通過大模型的智能化能力和數據驅動能力,為企業(yè)和用戶帶來更加豐富、高效、智能的知識體系構建的服務。知識圖譜多場景數字化文物、藏品管理:通過將文物、藏品數字化,并利用知識圖譜將其與相關的文化關聯,可以實現對文物的全方位管理和展示。傳媒受眾畫像:利用知識圖譜分析受眾的行為和偏好,從而構建畫像,為個性化運營和營銷提供決策支持。狀態(tài)監(jiān)測與預測性維護:知識圖譜通過收集設備、工藝、物料等制造關鍵,實現工業(yè)制造過程的數據集成、分析和優(yōu)化,實現設備的狀態(tài)監(jiān)測和預測性維護。質量管理控制:建立產品質量的知識圖譜,在生產之后通過比對分析,以便監(jiān)控和管理產品質量,提高客戶滿意度。風險評估:知識圖譜通過將金融產品、市場數據、客戶畫像等信息構建為知識圖譜,實現數據關聯和挖掘,并風險評估、投資建議、智能客戶管理等功能,提高金融機構的競爭力和服務水平。個性化推薦:通過將商品屬性、用戶需求、歷史行為等構建知識圖譜,提高用戶購物體驗和銷售轉化率。招聘:知識圖譜可以用于搭建智能招聘系統,實現基于技能和經驗的自動匹配和推薦,提高招聘效率和招聘質量。內容概念構思:構建事件、人物、場景等元素的關聯關系,實現藝術創(chuàng)作的自動生成,從而提高創(chuàng)作效率37資料來源:第四范式、公開資料、億歐智庫整理重構辦公軟件,提升企業(yè)軟件效率與體驗AIGS
(
Generated
Software)即為生成式軟件,通過AIGS進行數據一體化、輔助頁面交互、優(yōu)化代碼編寫,企業(yè)軟件得到多方面提升,企業(yè)辦公效率進一步提高。AIGS以生成式重構企業(yè)軟件AIGS為企業(yè)軟件賦能AIGS
1.0利用對辦公軟件、工業(yè)軟件賦能,進行數據、應用、服務一體化、頁面UI交互優(yōu)化、自動迭代,協助執(zhí)行任務與用戶指令,進行不同信息的調度AIGS
2.0參照企業(yè)規(guī)則的知識庫,給出攻略AIGS
3.0大模型調整完成,形成思維鏈,可完全自動完成復雜任務與指令AIGS與思維鏈(chainof
thought):思維鏈在解決多步驟問題時,模仿人類將復雜任務拆分的思維過程,進行逐步推理,執(zhí)行指令,是實現AIGS的關鍵通過深入學習多重領域,獲取并學習海量數據,形成不同領域的思維鏈,當思維鏈達到一定復雜程度后,企業(yè)軟件即能執(zhí)行更多復雜功能整合以不同的媒體格式(文本、圖像、結構化/非結構化數據)存在的數據進行數據的數字化,整理分布在不同系統中的數據將不同性質的數據轉換為統一的向量格式對數據開展質量驗證01改變傳統軟件的菜單式開發(fā)頁面,無需重復進行設計與開發(fā)省去搜索、聚類、生成等過程的時間功能和邏輯被編排在數據、API和內容層面,提升開發(fā)效率降低用戶門檻,適用范圍覆蓋非開發(fā)者推理能力增強,代碼質量提升幫助企業(yè)自動生成代碼,節(jié)省人力與時間,縮短項目周期03數據、應用、服務一體化頁面UI交互優(yōu)化自動生成代碼輔助軟件迭代AIGS
2.0AIGS
3.0AIGS
1.0數據、應用、?服務一體化02頁面UI交互優(yōu)化代碼生成輔助軟件迭代38資料來源:公開資料、億歐智庫整理AIGS對于需要應用多個工業(yè)軟件的行業(yè)具有較強的商業(yè)潛力未來,AIGS在各行業(yè)都將產生,利用數據一體化、頁面UI交互、代碼優(yōu)化的能力為各行業(yè)降低不同軟件的集成難度,提高數據質量與利用率,降低系統成本,滿足用戶更多樣化的需求。AIGS在各行業(yè)應用賦能企業(yè)軟件服務類行業(yè)&文化傳媒類行業(yè)制造類行業(yè)整合:利用多種類型,整合垂類數據,增優(yōu)化:幫助制造企業(yè)更好地掌握整個生產流程,加數據多樣性識別生產過程中的問題,及時解決優(yōu)化數據一體化營銷推廣:數據一體化幫助企業(yè)更精準地識別目標供應鏈管理:通過數據分析對能源試用情況供應商的交貨客戶,并根據客戶的需求和偏好更有針對性的、產品質量等指標監(jiān)控和分析,優(yōu)化供應鏈的管定向營銷和推廣活動,拓展市場份額理和運營效率頁面UI交互降低操作難度:在電商相關軟件和影視游戲制作相關技術平臺,使用者可以更快速便捷操作提高生產效率:通過簡化UI界面,員工可以更快速方便地使用辦公軟件操作,從而提高生產效率降低員工培訓成本:由于UI界面更加簡單易懂,員工學習軟件操作的時間縮短代碼優(yōu)化滿足多樣化需求:通過編寫代碼的快速迭代能力,覆蓋某些產品的長尾需求數字化管理:實現生產軟件開發(fā):通過制造業(yè)的不同領域的歷史生產數據,進行定制化工業(yè)軟件開發(fā)過程的數字化管理,包括訂單管理、生產計劃、庫存管理、質量管理等,優(yōu)化生產流程,降低成本應用特點降低系統集成成本提高數據質量提高數據利用率提高用戶體驗提高工作效率提高代碼質量降低系統成本滿足需求迭代整體來看,AIGS主要應用于電影、游戲創(chuàng)作及制造類的行業(yè),這些行業(yè)大體需要大量的工業(yè)軟件進行創(chuàng)作/制造。AIGS可以整合不同軟件的格式,提高數據的利用率。資料來源:專家訪談、公開資料、億歐智庫整理原子能力商業(yè)潛力評估總結的原子能力商業(yè)潛力評估涉及三大維度:應用范圍場景維度、規(guī)模維度、利潤維度。應用范圍場景:基礎原子具有較強的泛化通用能力,于短頭場景,整體來看可以覆蓋全職能的業(yè)務流程(經營決策、管理協作、產品研發(fā)、市場營銷)。多模態(tài)原子需要多種技術融合滿足各個行業(yè)的長尾“+”需求。規(guī)模潛力與利潤潛力:衡量原子能力市場規(guī)模潛力與利潤率情況。原子能力商業(yè)潛力評估模型基本的生成能力體現廣泛應用于通用的場景,通常在商業(yè)應用方面具有較大的規(guī)模潛力壁壘相較于多模態(tài)原子能力低,激烈的競爭導致利潤率攤薄0.510.690.761.171.87文本圖像音頻視頻代碼基礎原子能力潛力指數基礎原子能力基礎原子能力的復合形態(tài),可以與現在的信息技術結合,以“+”的形式進行賦能多模態(tài)原子能力多用于長尾的專業(yè)場景,市場規(guī)模不及基礎原子能力復合技術的難點構成進入壁壘,從長遠看,相對具有較高的凈利潤率0.160.180.200.220.25知識圖譜聊天機器人虛擬人合成數據AIGS億歐智庫:多模態(tài)原子能力潛力指數多模態(tài)原子能力指數說明:能力潛力指數基于學術論文、市場研究、創(chuàng)業(yè)大賽及專家訪談綜合得出未來五年內的商業(yè)潛力3939規(guī)模潛力利潤潛力泛化與通用場景專業(yè)場景基礎原子能力多模態(tài)原子能力4
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026 年中職進化心理學(進化心理基礎)試題及答案
- 基于AHP與Schwartz-moon模型的長城汽車數據資產價值評估研究
- 辦公場所租賃補充條款合同協議2025年
- 城市運力匹配分析
- 2025 八年級數學上冊三角形角平分線與角度計算課件
- 本溪高中化學試卷及答案
- 2025年英式口語測試題目及答案
- 工程采購維修合同范本
- 國際項目建設合同范本
- 委托代招聘合同范本
- 設備工程師年終工作總結
- 《油氣儲存企業(yè)安全風險評估細則(2025年修訂)》解讀
- 四旋翼無人機飛行原理
- GB/T 45966.1-2025石油天然氣工業(yè)井完整性第1部分:生命周期管理
- 流動車接種活動方案
- 高風險行業(yè)安全管理措施與環(huán)保體系評估
- 2025年長護險考試試題及答案
- 監(jiān)理廉潔自律培訓
- JJF(鄂) 118-2024 電子防潮柜濕度、溫度偏差校準規(guī)范
- 《結直腸癌的治療進展》課件
- epc居間服務合同協議
評論
0/150
提交評論