2025年-Chapter5-第5章大模型人工智能的前沿-廈門大學(xué)-數(shù)字素養(yǎng)通識教程（2025年1月）-新版

上傳人：海*** IP屬地：廣西上傳時間：2025-10-15 格式：PPTX 頁數(shù)：68 大?。?.16MB 積分：9.6 舉報 版權(quán)申訴

2025年-Chapter5-第5章大模型人工智能的前沿-廈門大學(xué)-數(shù)字素養(yǎng)通識教程（2025年1月）-新版_第2頁

2025年-Chapter5-第5章大模型人工智能的前沿-廈門大學(xué)-數(shù)字素養(yǎng)通識教程（2025年1月）-新版_第3頁

2025年-Chapter5-第5章大模型人工智能的前沿-廈門大學(xué)-數(shù)字素養(yǎng)通識教程（2025年1月）-新版_第4頁

2025年-Chapter5-第5章大模型人工智能的前沿-廈門大學(xué)-數(shù)字素養(yǎng)通識教程（2025年1月）-新版_第5頁

已閱讀5頁，還剩63頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)字素養(yǎng)通識教程匯報人：數(shù)字素養(yǎng)通識教程廈門大學(xué)第5章大模型：人工智能的前沿大模型概述大模型產(chǎn)品大模型的基本原理大模型的特點(diǎn)大模型的分類大模型的成本大模型的應(yīng)用領(lǐng)域目錄08基于大模型的智能體09大模型對人們工作和生活的影響10

大模型的挑戰(zhàn)與未來發(fā)展01020304050607知識星球【無憂智庫，星球號：53232205】無憂智庫-新基建智慧城市圈子，數(shù)字工作者必備的專業(yè)行業(yè)智庫。截止至2025年1月份，星球已穩(wěn)定

運(yùn)營1400多天，目前星球已上傳資料合計超過5600份+,大小超過100G+(PPT1880

份+、WORD616份+、PDF3119份+、其他71+),還在不斷持續(xù)更新中，歡迎微信掃碼加入。本星球?qū)Ｗ⑷袠I(yè)智慧解決方案(數(shù)字化轉(zhuǎn)型、數(shù)據(jù)要素、智慧城市、新質(zhì)生產(chǎn)力、智能制造、工業(yè)

互聯(lián)網(wǎng)、元宇宙等)、行業(yè)報告、高端PPT

模版、商業(yè)計劃、各類大會峰會資料、標(biāo)準(zhǔn)規(guī)范、項目管

理體系、質(zhì)量管理體系、ITTL

、TOGAF

、Scrum

敏捷管理、軟考等考試認(rèn)證資料等幾十個板塊，致

力于打造國內(nèi)領(lǐng)先的行業(yè)智庫，為數(shù)字工作者提供一站式服務(wù)。掃碼加入后無限制免費(fèi)下載，希望本廣告沒有打擾到您的閱讀，感謝支持!掃碼關(guān)注微信公眾號掃碼添加星主微信掃碼加入知識星球大模型概述Part

one大模型(英文為

“Foundation

Model”)是指具有龐大的參數(shù)規(guī)模和復(fù)雜程度的機(jī)器學(xué)習(xí)模型，這些模型可以在訓(xùn)練過程中處理大規(guī)模的數(shù)據(jù)集，并且能夠提供更高的預(yù)測能力和準(zhǔn)確性。大模型通常需要大量的計算資源和更長的訓(xùn)練時間大模型可以被分為多種類型，其中一類就是大語言模型(LLM,Large

Language

Model),另一類則是圖像、語音和推薦等領(lǐng)域的大模型。大語言模型主要用于處理自然語言處理任務(wù)，例如文本分類、情感分析、機(jī)器翻譯等，而大模型在圖像領(lǐng)域可

以用于圖像分類、目標(biāo)檢測等任務(wù)，在語音領(lǐng)域可以用于語音識別、語音合成等任務(wù)，在推薦領(lǐng)域則可以用于個性化推薦、廣告推薦等任務(wù)5.1.1大模型的概念在深度學(xué)習(xí)領(lǐng)域，大模型通常是具有數(shù)百萬到數(shù)十億甚至上萬億參數(shù)的神經(jīng)網(wǎng)絡(luò)模型比如，2020年，OpenAl

公司推出了GPT-3,

模型參數(shù)規(guī)模達(dá)到了1750億，2023年3月發(fā)布的GPT-4的參數(shù)規(guī)模是GPT-3的10倍以上，達(dá)到1.8萬億，2021年11月阿里推出的M6模型的參數(shù)量達(dá)10萬億這些模型需要大量的計算資源和存儲空間來訓(xùn)練和存儲，并且往往需要進(jìn)行分布式計算和特殊的硬件加速技術(shù)。簡單來講，大模型就是用大數(shù)據(jù)模型和算法進(jìn)行訓(xùn)練的模型，它能夠捕捉到大規(guī)模數(shù)據(jù)中的復(fù)雜模式和規(guī)律，從而預(yù)測出更加準(zhǔn)確的結(jié)果大模型的“大”的特點(diǎn)體現(xiàn)在：參數(shù)數(shù)量龐大

訓(xùn)練數(shù)據(jù)量大

計算資源需求高很多先進(jìn)的模型由于擁有很“大”的特點(diǎn)，使得模型參數(shù)越來越多，泛化性能越來越好，在各種專門的領(lǐng)域輸出結(jié)果也越來越準(zhǔn)確5.1.1大模型的概念大模型的設(shè)計和訓(xùn)練旨在提供更強(qiáng)大、更準(zhǔn)確的模型性能，以應(yīng)對更復(fù)雜、更龐大的數(shù)據(jù)集或任務(wù)。大模型通常能夠?qū)W習(xí)到更細(xì)微的模式和規(guī)律，具有更強(qiáng)的泛化能力和表達(dá)能力學(xué)習(xí)能力強(qiáng)大模型可以從大量的數(shù)據(jù)中學(xué)習(xí)，并利用學(xué)到的知識和模式來提供

更精準(zhǔn)的答案和預(yù)測。這使得它

們在解決復(fù)雜問題和應(yīng)對新的場

景時表現(xiàn)更加出色上下文理解能力大模型具有更強(qiáng)的上下文理解能力，能夠理解更復(fù)雜的語意和語

境。這使得它們能夠產(chǎn)生更準(zhǔn)確、

更連貫的回答可遷移性高學(xué)習(xí)到的知識和能力可以在不同的任務(wù)和領(lǐng)域中遷移和應(yīng)用。這意味著一次訓(xùn)練就可以將模型應(yīng)

用于多種任務(wù)，無需重新訓(xùn)練語言生成能力大模型可以生成更自然、更流利

的語言，減少了生成輸出時呈現(xiàn)

的錯誤或令人困惑的問題5.1.1大模型的概念當(dāng)前在我國，百度、阿里巴巴、騰訊和華為等公司均已開發(fā)出AI大模型，并且這些模型各自有所側(cè)重百度由于其在Al領(lǐng)域的多年布局，具有顯著的大模型先發(fā)優(yōu)勢，其文心一言API

調(diào)用服務(wù)已經(jīng)吸引了大量企業(yè)進(jìn)行測試。

在行業(yè)大模型應(yīng)用方面，百度已經(jīng)與國網(wǎng)、浦發(fā)、人民網(wǎng)等組織合作，實(shí)現(xiàn)了多個案例應(yīng)用另一方面，阿里巴巴的通義大模型在邏輯運(yùn)算、編碼能力和語音處理方面表現(xiàn)突出，而阿里巴巴集團(tuán)豐富的生態(tài)和在線產(chǎn)品使得該模型在出行、辦公和購物等場景中得到了廣泛應(yīng)用西

貓”

儲565*

媒5.1.1大模型的概念通義大模型架構(gòu)小模型通常指參數(shù)較少、層數(shù)較淺的模型，它們具有輕量級、高效率、易于部署等優(yōu)點(diǎn)，適用于數(shù)據(jù)量較小、計算資源有限的場景，例如移動端應(yīng)用、嵌入式設(shè)備、物聯(lián)網(wǎng)等

5.1.2大模型與小模型的區(qū)別而當(dāng)模型的訓(xùn)練數(shù)據(jù)和參數(shù)不斷擴(kuò)大，直到達(dá)到一定的臨界規(guī)模后，其表現(xiàn)出了一些未能預(yù)測的、更復(fù)雜的能力和特性，模型能夠從原始訓(xùn)練數(shù)據(jù)中自動學(xué)習(xí)并發(fā)現(xiàn)新的、更高層次的特征和模式，這種能力被稱為“涌現(xiàn)能力”。

而具備涌現(xiàn)能力的機(jī)器學(xué)習(xí)模型就被認(rèn)為是獨(dú)立意義上的大模型，這也是其和小模型最大意義上的區(qū)別相比于小模型，大模型通常參數(shù)較多、層數(shù)較深，具有更強(qiáng)的表達(dá)能力和更高的準(zhǔn)確度，但也需要更多的計算資源和時間來訓(xùn)練和推理，適用于數(shù)據(jù)量較大、計算資源充足的場景，例如云端計算、高性能計算、人工智能等5.1.2大模型與小模型的區(qū)別OpenAlGPT31750億微軟Florence6.4億NVIDIAMT-NLG5300億OpenAlDALL-E2120億GPT410000億(預(yù)估)GooglePalM-E5660億百度文心大模型2600億GoogleSwitchtransformer16000億阿

里

巴

巴M6100000億華為盤古大模型10850億OpenAlGoogleBert3

億OpenAlGPT215億微

軟Turing-NLG170億GoogleT5110億

5.1.3大模型的發(fā)展歷程萌芽期基于規(guī)則的少量

LeNet-5數(shù)據(jù)處理

6萬19502005大模型發(fā)展歷經(jīng)三個階段，分別是萌芽期、沉淀期和爆發(fā)期GAN百萬-千萬級2014性能(參數(shù)、層數(shù)等)202

2022

20232018

2019

2020迅猛發(fā)展期探索沉淀期時間5.1.3大模型的發(fā)展歷程■萌芽期(1950-2005)這是一個以CNN(Convolutional

Neural

Networks,卷積神經(jīng)網(wǎng)絡(luò))為代表的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型階段■1956年，從計算機(jī)專家約翰·麥卡錫提出“人工智能”概念開始，Al

發(fā)展由最開始基于小規(guī)模專家知識逐步發(fā)展為基于機(jī)器學(xué)習(xí)■1980年，卷積神經(jīng)網(wǎng)絡(luò)的雛形CNN

誕生■1998年，現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)LeNet-5誕生，機(jī)器學(xué)習(xí)方

法由早期基于淺層機(jī)器學(xué)習(xí)的模型，變?yōu)榱嘶谏疃葘W(xué)習(xí)的模型，

為自然語言生成、計算機(jī)視覺等領(lǐng)域的深入研究奠定了基礎(chǔ)，對后

續(xù)深度學(xué)習(xí)框架的迭代及大模型發(fā)展具有開創(chuàng)性的意義

5.1.3大模型的發(fā)展歷程■沉淀期(2006-2019)這是一個以Transformer為代表的全新神經(jīng)網(wǎng)絡(luò)模型階段2013年，自然語言處理模型Word2Vec

誕生，首次提出將單詞轉(zhuǎn)換為向量的“詞向量模型”,以便計算機(jī)更好地理解和處理文本數(shù)據(jù)。2014年，被譽(yù)為21世紀(jì)最強(qiáng)大算法模型之一的GAN(GenerativeAdversarial

Networks,對抗式生成網(wǎng)絡(luò))誕生，標(biāo)志著深度學(xué)習(xí)進(jìn)入了生成模型研究的新階段2017年，Google

顛覆性地提出了基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)一—Transformer

架構(gòu)，奠定了大模型預(yù)訓(xùn)練算法架構(gòu)的基礎(chǔ)2018年，OpenAl

基于Transformer

架構(gòu)發(fā)布了GPT-1大模型，意味著預(yù)訓(xùn)練大模型成為自然語言處理領(lǐng)域的主流，其中，

GPT

的英文全稱是Generative

Pre-Trained

Transformer,是一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來訓(xùn)練的、文本生成的深度學(xué)習(xí)模型2019年，OpenAl

發(fā)布了GPT-25.1.3大模型的發(fā)展歷程■爆發(fā)期(2020-至今)這是一個以GPT為代表的預(yù)訓(xùn)練大模型階段2020年6月，

OpenAl

公司推出了GPT-3,

模型參數(shù)規(guī)模達(dá)到了1750億，成

為當(dāng)時最大的語言模型，并且在零樣本學(xué)習(xí)任務(wù)上實(shí)現(xiàn)了巨大性能提升。隨后，更多策略如基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF,ReinforcementLearning

from

Human

Feedback)、代碼預(yù)訓(xùn)練、指令微調(diào)等開始出現(xiàn)，

被用于進(jìn)一步提高推理能力和任務(wù)泛化2022年11月，搭載了GPT3.5

的ChatGPT(Chat

Generative

Pre-trainedTransformer)橫空出世，憑借逼真的自然語言交互與多場景內(nèi)容生成能

力，迅速引爆互聯(lián)網(wǎng)，在全球范圍內(nèi)引起轟動，使得大模型的概念迅速進(jìn)

入普通大眾的視野。

ChatGPT

是人工智能技術(shù)驅(qū)動的自然語言處理工具，

它能夠通過理解和學(xué)習(xí)人類的語言來進(jìn)行對話，還能根據(jù)聊天的上下文進(jìn)

行互動，真正像人類一樣來聊天交流，甚至能完成撰寫郵件、視頻腳本、

文案、翻譯、代碼，寫論文等任務(wù)TRANSCRIPTIONOUTSOURCING,LCGPT-3Is

this

the

technology

that

will

transform

Artificial

Intelligence

programs?OpenAl

在2023年3月發(fā)布了GPT-4,

它是一個多模態(tài)大模型(接受圖像和文本輸入，生成文本)。相比上一代的GPT-3,GPT-4可以更準(zhǔn)確地解決難題，具有更廣泛的常識和解決問題的能力。2023年12月，谷歌發(fā)布大模型Gemini,它可以同時識別文本、圖像、音頻、視頻和代碼五種類型信息，還可以理解并生成主流編程語言(如Python、Java、C++)

的高質(zhì)量

代碼，并擁有全面的安全性評估5.1.3大模型的發(fā)展歷程■爆發(fā)期(2020-至今)ChatGPT文心一言)預(yù)訓(xùn)練模型機(jī)器學(xué)習(xí)預(yù)訓(xùn)練大語言模型預(yù)訓(xùn)練大模型GPT文心ERNIE大語言模型人工智能包含了機(jī)器學(xué)習(xí)，機(jī)器學(xué)習(xí)包含了深度學(xué)習(xí)，深度學(xué)習(xí)可以采用不同的模型，其中一種模型是預(yù)訓(xùn)練模型，預(yù)訓(xùn)練模型包含了預(yù)訓(xùn)練大模型(可以簡稱為“大模型”),預(yù)訓(xùn)練大模型包含了預(yù)訓(xùn)練大語言模型(可以簡稱為“大語言模型

”

預(yù)訓(xùn)練大語言模型的典型代表包括OpenAl

的GPT和百度的文心ERNIE,ChatGPT是基于GPT開發(fā)的大模型產(chǎn)品，文心一言是基于文心ERNIE

開發(fā)的大模型產(chǎn)品6.1.4人工智能與大模型的關(guān)系深度學(xué)習(xí)模型人工智能深度學(xué)習(xí)預(yù)訓(xùn)練大模型是人工智能技術(shù)發(fā)展的重要推動力大模型的出現(xiàn)，使得人工智能技術(shù)得到了更廣泛的應(yīng)用。在

許多領(lǐng)域，如自然語言處理、圖像識別、語音識別等，大模

型都能夠提供更準(zhǔn)確、更高效的處理能力。例如，在自然語

言處理領(lǐng)域，大模型可以通過學(xué)習(xí)大量的文本數(shù)據(jù)，自動提

取出文本中的語義信息，從而實(shí)現(xiàn)對文本的自動分類、情感

分析、問答等任務(wù)。隨著數(shù)據(jù)量的不斷增加和計算能力的不斷提升，大模型能夠處理的數(shù)據(jù)量和處理速度也在不斷提升。這使得人工智能技術(shù)能夠更好地應(yīng)對各種復(fù)雜的問題和挑戰(zhàn)，

進(jìn)一步推動了人工智能技術(shù)的發(fā)展5.1.4人工智能與大模型的關(guān)系人工智能和大模型是相互關(guān)聯(lián)的。人工智能是研究和開發(fā)使機(jī)器能夠模仿人類智能行為的技術(shù)和方法的學(xué)科，包括機(jī)器學(xué)習(xí)、自然語言處理、計算機(jī)視覺等。而大模型則是指訓(xùn)練過程中使用了大量數(shù)據(jù)和參數(shù)的模型，這些模型包含了

大量的知識和規(guī)則，能夠更好地模擬人類智能行為人工智能的發(fā)展也推動了大模型的發(fā)展為了提高人工智能系統(tǒng)的性能，研究者們不斷嘗試使用更大

的模型來提高準(zhǔn)確率和效果。例如，近年來非常熱門的Transformer

模型，就是一種大模型，它在自然語言處理領(lǐng)

域取得了很多突破性進(jìn)展。大模型的使用能夠幫助人工智能

系統(tǒng)更好地理解語義、提高處理能力和決策準(zhǔn)確性提升人工智能的應(yīng)用效果大模型能夠使用大量的數(shù)據(jù)和強(qiáng)大的計算資源，學(xué)習(xí)到數(shù)據(jù)中的復(fù)雜特征和規(guī)律，從而在各種任務(wù)中表現(xiàn)出色。這使得人工智能

技術(shù)在各個領(lǐng)域的應(yīng)用效果得到了顯著的提升增加公眾對人工智能技術(shù)的信任和支持大模型的展示可以讓更多的人了解人工智能技術(shù)的潛力和影響力，從而增加公眾對人工智能技術(shù)的信任和支持。這也可以為人工智

能行業(yè)爭取更多的政策支持和資源投入推動人工智能技術(shù)的進(jìn)步大模型作為人工智能技術(shù)的重要組成部分，展示了人工智能技術(shù)

的最新進(jìn)展和趨勢。這些新技術(shù)和模型的應(yīng)用場景可能會更加廣

泛，效果也可能會更好，從而推動人工智能技術(shù)的進(jìn)步促進(jìn)人工智能行業(yè)的發(fā)展大模型的展示能夠吸引更多的投資者和用戶關(guān)注人工智能行業(yè)，從而加速行業(yè)的發(fā)展。同時，大模型也可以促進(jìn)人工智能領(lǐng)域的

交流和合作，從而推動整個行業(yè)的發(fā)展5.1.5大模型在人工智能領(lǐng)域的重要性大模型在人工智能領(lǐng)域的重要性大模型產(chǎn)品Part

twoChatGPT

是一種由OpenAl訓(xùn)練的大語言模型。它是基于Transformer

架構(gòu)，經(jīng)過大量文本數(shù)據(jù)訓(xùn)練而成，能夠生成自然流暢的語言，并具備回答問題、生成文本、語言翻譯等多種功能ChatGPT的應(yīng)用范圍廣泛，可以用于客服、問答系統(tǒng)、對話生成、文本生成等領(lǐng)域。它能夠理解人類語言，并能夠回答各種問題，提供相關(guān)的知識和信息。與其他聊天機(jī)器人相比，ChatGPT

具備更強(qiáng)的語言理解和生成能力，能夠更自然地與人類交流，并且能夠更好地適應(yīng)不同的領(lǐng)域和場景。ChatGPT

的訓(xùn)練數(shù)據(jù)來自互聯(lián)網(wǎng)上的大量文本，因此，它能夠涵蓋多種語言風(fēng)格和文化背景5.2.1國外的大模型產(chǎn)品■

ChatGPT5.2.1國外的大模型產(chǎn)品

■

GeminiGemini是谷歌發(fā)布的大模型，它能夠同時處理多種類型的數(shù)據(jù)和任務(wù)，覆蓋文本、圖像、音頻、視頻等多個領(lǐng)域。Gemini采用了全新的架構(gòu)，將多模態(tài)編碼器和多模態(tài)解碼器兩個主要組件結(jié)合在一起，以提供最佳結(jié)果Gemini包括三種不同規(guī)模的模型：Gemini

Ultra、Gemini

Pro和Gemini

Nano

適用于不同任務(wù)和設(shè)備。2023年12月6日，Gemini的初始版本已在Bard中提供，開發(fā)人員版本可通過GoogleCloud的API獲得。Gemini

可以應(yīng)用于Bard

和Pixel8Pro智能手機(jī)。Gemini

的應(yīng)用范圍廣泛，包括問題回答、摘要生成、翻譯、字幕生成、情感分析等任務(wù)。然而，由于其復(fù)雜性和黑箱性質(zhì)，Gemini的可解釋性仍然是一個挑戰(zhàn)5.2.1國外的大模型產(chǎn)品■Sora2024年2月16日，OpenAl

再次震撼全球科技界，發(fā)布了名為Sora

的文本生成視頻大模型，只需輸入文本就能自動生成視頻。這一技術(shù)的誕生，不僅標(biāo)志著人工智能在視頻生成領(lǐng)域的重大突破，更引發(fā)了關(guān)于人工智

能發(fā)展對人類未來影響的深刻思考。隨著Sora

的發(fā)布，人工智能似乎正式踏入了通用人工智能(AGI:ArtificialGeneral

Intelligence)的時代。AGI

是指能夠像人類一樣進(jìn)行各種智能活動的機(jī)器智能，包括理解語言、識別圖像、進(jìn)行復(fù)雜推理等。Sora

大模型能夠直接輸出長達(dá)60秒的視頻，

并且視頻中包含了高度細(xì)致的背景、復(fù)雜的多角度鏡頭，以及富有情感的多個角色。這種能力已經(jīng)超越了簡單的圖像或文本生成，開始觸及到視頻這一更加復(fù)雜和動態(tài)的媒介。這意味著人工智能不僅在處理靜態(tài)信息上越來越強(qiáng)大，而且在動態(tài)內(nèi)容的創(chuàng)造上也展現(xiàn)出了驚人的潛力5.2.1國外的大模型產(chǎn)品■Sora右圖是Sora

根據(jù)文本自動生成的視頻畫面，一位戴著墨鏡、穿著皮衣的時尚女子走在雨后夜晚的東京市區(qū)

街道上，抹了鮮艷唇彩的唇角微微翹起，即便帶著墨

鏡也能看到她的微笑，地面的積水映出了她的身影和

燈紅酒綠的霓虹燈，熱鬧非凡的唐人街正在進(jìn)行舞龍

表演，熙熙攘攘的人群目光都聚焦在躍動的彩龍身上，

整個環(huán)境的喜慶氛圍仿佛令人身臨其境一位時尚女性走在布滿溫暖霓虹燈和動畫城市標(biāo)牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴

子，拎著黑色錢包。她戴著太陽鏡，涂著紅色口紅。她走路自信又隨意。街道潮濕且反光，在彩色燈光的

照射下形成鏡面效果。許多行人走來走去。Sora

生成的視頻：提示詞譯文：5.2.2國內(nèi)的大模型產(chǎn)品■文心一言·

文心一言是由百度研發(fā)的知識增強(qiáng)大模型，能夠與人對話互動、回答

問題、協(xié)助創(chuàng)作，高效便捷地幫助人們獲取信息、知識和靈感·

文心一言基于飛槳深度學(xué)習(xí)平臺和文心知識增強(qiáng)大模型，持續(xù)從海量

數(shù)據(jù)和大規(guī)模知識中融合學(xué)習(xí)，具備知識增強(qiáng)、檢索增強(qiáng)和對話增強(qiáng)的技術(shù)特色·

文心一言具有廣泛的應(yīng)用場景，例如智能客服、智能家居、移動應(yīng)用

等領(lǐng)域。它可以與用戶進(jìn)行自然語言交互，幫助用戶解決各種問題，

提供相關(guān)的知識和信息·

文心一言還可以與各種設(shè)備和應(yīng)用進(jìn)行集成，例如智能音箱、手機(jī)APP等，為用戶提供更加便捷的服務(wù)。文心一言在深度學(xué)習(xí)領(lǐng)域有著重要的地位，它代表了人工智能技術(shù)的前沿水平，是百度在人工智能

領(lǐng)域持續(xù)投入和創(chuàng)新的成果。文心一言的推出，不僅將為用戶提供更加智能化和高效的服務(wù)，也將為人工智能行業(yè)的發(fā)展注入新的動力5.2.2國內(nèi)的大模型產(chǎn)品■通義千問通義千問是阿里云推出的一個超大規(guī)模的語言模型，它具備多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持的能力。通義千問這個名字有“通義”和“千問”兩層含義，“通義”表示這個模型能夠理解各種語

言的含義，“千問”則表示這個模型能夠回答各種問題。通義千問基于深度學(xué)習(xí)技術(shù)，通過對大量文本數(shù)據(jù)進(jìn)行訓(xùn)練，從而具備了強(qiáng)大的語言理解和生成能力。它能夠理解自然語言，并能夠生成自然語言文本同時，通義千問還具備多模態(tài)理解能力，能夠處理圖像、音頻等多種類型的數(shù)據(jù)。通義千問的應(yīng)用范圍非常廣泛，可以應(yīng)用于智能客服、智能家居、

移動應(yīng)用等多個領(lǐng)域。它可以與用戶進(jìn)行自然語言交互，幫助用戶解決各種問題，提供相關(guān)的知識和信息。同時，通義千問還可以與各種設(shè)備和應(yīng)

用進(jìn)行集成，為用戶提供更加便捷的服務(wù)阿里所有產(chǎn)品未來將接入大模型全面升級ntegratngAlbaba'oerngswitToneyQuanwen通義千問數(shù)據(jù)收集和處理訊飛星火認(rèn)知大模型采用了先進(jìn)的技術(shù)和算法，能夠快速地處理大量的數(shù)據(jù)，并從中提取有用的信息。這使得它能夠更好地理解和處理復(fù)雜的語言信息，提高人機(jī)交互的效率和準(zhǔn)確性應(yīng)用訊飛星火認(rèn)知大模型已經(jīng)被廣泛應(yīng)用于多個領(lǐng)域，如自然語言處理、計算機(jī)視覺、智能客服等。通過與各領(lǐng)域的專業(yè)知識和經(jīng)驗相結(jié)合，訊飛星火認(rèn)知大模型能夠提供更加精準(zhǔn)和個性化的服務(wù)，提高各行各業(yè)的工作效率和質(zhì)量訊飛星火認(rèn)知大模型是科大訊飛發(fā)布的一款強(qiáng)大的人工智能模型。它具有多種核心能力，包括文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力以及多模態(tài)能力。這些能力使得訊飛星火認(rèn)知大模型能夠處理各種復(fù)雜的語言任務(wù)，并為用戶提供準(zhǔn)確、高效的服務(wù)5.2.2國內(nèi)的大模型產(chǎn)品■訊飛星火認(rèn)知大模型X

態(tài)調(diào)開放合作，共建人工智能「星火」生態(tài)《2023科大訊飛AI

星火營生態(tài)計劃》賦能更多開發(fā)者打造更具價值的AI應(yīng)用讓工作辦公更輕松讓人機(jī)交互更自然讓內(nèi)容創(chuàng)作更簡單

讓數(shù)字員工更智能新譯賦能開發(fā)者，讓每一款應(yīng)用都具備新的價值圖像識別賬分析

讓智慧教育更有成效

讓虛擬助理更全面讓智能家居更好用

讓智能營銷更精準(zhǔn)

讓知識問答更快捷050是面晰TB73#

作路眼

準(zhǔn)■訊飛星火認(rèn)知大模型訊飛星火認(rèn)知大模型還注重可解釋性和公平性。通過改進(jìn)算法和技術(shù)，它能夠提供更加清晰和準(zhǔn)確的決策依據(jù)，減少偏見和不公平現(xiàn)象。同時，它還具備強(qiáng)大的自適應(yīng)學(xué)習(xí)能力，能夠不斷適應(yīng)新的任務(wù)和環(huán)境，提高自身的性能和表現(xiàn)5.2.2國內(nèi)的大模型產(chǎn)品訊飛星火01020304多輪對話

內(nèi)容創(chuàng)作

邏輯推理

知識增強(qiáng)準(zhǔn)確理解用戶意圖，基于輸入數(shù)據(jù)或信息進(jìn)行推理、

分析5.2.2國內(nèi)的大模型產(chǎn)品

■

騰訊混元大模型騰訊混元大模型是由騰訊全鏈路自研的通用大語言模型，具備強(qiáng)大的中文創(chuàng)作能力、復(fù)雜語境下的邏輯推理能力以及可靠的任務(wù)執(zhí)行能力具備上下文理解和長文記憶能力，流暢完成各專業(yè)領(lǐng)域的多輪問答支持文學(xué)創(chuàng)作、文本概要和角色扮演有效解決事實(shí)性、時效性問題，提升內(nèi)容生成效果5.2.2國內(nèi)的大模型產(chǎn)品■華為盤古大模型華為盤古大模型是華為云推出的一個大語言模型，旨在提供更加智能化、高效化的語言交互體驗。它基于深度學(xué)習(xí)技術(shù)，通過對大量文本數(shù)據(jù)進(jìn)行訓(xùn)練，從而具備了強(qiáng)大的語言理解和生成能力。華為盤古大模型采用了先進(jìn)的架構(gòu)

和技術(shù)，包括Transformer、BERT

等模型架構(gòu)以及注意力機(jī)制、自注意力機(jī)制等先進(jìn)的神經(jīng)網(wǎng)絡(luò)技術(shù)它還采用了多模態(tài)學(xué)習(xí)技術(shù)，能夠處理文本、圖像、音頻等多種類型的數(shù)據(jù)。這使得它能夠更好地理解和處理復(fù)雜的語言信息，提高人機(jī)交互的效率和準(zhǔn)確性華為盤古大模型的應(yīng)用范圍非常廣泛，可以應(yīng)用于智能客服、智能家居、移動應(yīng)用等多個領(lǐng)域。它可以與用戶進(jìn)行自然語言交互，幫助用戶解決各種問題，提供相關(guān)的知識和信息。同時，它還可以與各種設(shè)備和應(yīng)用進(jìn)行集成，為用戶提供更加便捷的服務(wù)基于盤古數(shù)字人大模型，賦能行業(yè)應(yīng)用從“0101的比特傳輸行業(yè)扇用

二盛始金護(hù)a華為云盤古大模型[

工業(yè)化開發(fā)」AI

開發(fā)新模式HDC.Clod>有溫度的模型交互”千億級參數(shù)大模型的基本原理Part

three大模型是基于Transformer架構(gòu)的，這種架構(gòu)是一種專門用于自然語言處理的“編碼-解碼器”架構(gòu)。在訓(xùn)練過程中，大模型將輸入的單詞以向量的形式傳遞給神經(jīng)網(wǎng)絡(luò)，然后通過網(wǎng)絡(luò)的編碼解碼以及自注意力機(jī)制，建立起每個單詞之間聯(lián)系的權(quán)重。大模型的核心能力在于將輸入的每句話中的每個單詞與已經(jīng)編碼在模型中的單詞進(jìn)行相關(guān)性的計算，并把相關(guān)性又編碼

疊加在每個單詞中。這樣，大模型能夠更好地理解和生成自然文本，同時還能夠表現(xiàn)出一定的邏輯思維和推理能力不斷地調(diào)整模型參數(shù)具有大量參數(shù)的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練大量的數(shù)據(jù)和計算資源基于深度學(xué)習(xí)利用大模型

5.3大模型的基本原理模型能夠在各種任務(wù)中取得最佳表現(xiàn)警ほ羊地數(shù)據(jù)驅(qū)動大模型的學(xué)習(xí)主要依賴于大量的文

本數(shù)據(jù)。這些數(shù)據(jù)可以來自互聯(lián)網(wǎng)、

書籍、文章等各種來源。通過對這

些數(shù)據(jù)進(jìn)行訓(xùn)練，大模型能夠?qū)W習(xí)

到自然語言的統(tǒng)計規(guī)律和模式自注意力機(jī)制這是Transformer的一個關(guān)鍵特性，允許模型在處理文本時考慮到每個

單詞與其他單詞的關(guān)系。通過計算

每個單詞與其他所有單詞的關(guān)聯(lián)度，

模型能夠捕捉到文本中的復(fù)雜依賴

關(guān)系編碼-解碼過程在Transformer

架構(gòu)中，編碼器和解

碼器是兩個核心組件。編碼器負(fù)責(zé)

將輸入的文本轉(zhuǎn)換為一種內(nèi)部表示，

而解碼器則負(fù)責(zé)將這種內(nèi)部表示轉(zhuǎn)

換回文本泛化能力一旦訓(xùn)練完成，大模型就能夠?qū)π?/p>

的、未見過的文本進(jìn)行理解和生成。

這種能力使得大模型在各種自然語

言處理任務(wù)中表現(xiàn)出色，如機(jī)器翻

譯、文本摘要、問答系統(tǒng)等神經(jīng)網(wǎng)絡(luò)大模型通常使用深度學(xué)習(xí)中的神經(jīng)

網(wǎng)絡(luò)，尤其是Transformer結(jié)構(gòu)。這

種結(jié)構(gòu)特別適合于處理序列數(shù)據(jù)

(比如文本)。神經(jīng)網(wǎng)絡(luò)由多層的

神經(jīng)元組成，每一層都會對數(shù)據(jù)進(jìn)

行一定的轉(zhuǎn)換和處理訓(xùn)練和優(yōu)化大模型的訓(xùn)練通常使用梯度下降等

優(yōu)化算法。在訓(xùn)練過程中，模型會

不斷地調(diào)整其內(nèi)部的參數(shù)，以最小

化預(yù)測結(jié)果與實(shí)際結(jié)果之間的差異

5.3大模型的基本原理大模型的特點(diǎn)Part

four5.4大模型的特點(diǎn)(1)巨大的規(guī)模大模型通常包含數(shù)十億個參數(shù)，模型大小可以達(dá)到數(shù)百GB甚至更大。這種巨大的規(guī)模不僅提供了強(qiáng)大的表達(dá)能力

和學(xué)習(xí)能力，還使得大模型在處理復(fù)雜任務(wù)時具有更高的效率和準(zhǔn)確性O(shè)PT-175BPaLM

BB3PaLM-Coder175BMinerva540B

UL220BYaLMGopher

100B280BChinchilla

●SeeKeR

2.7B70B

Flamingo

oZ-Code++710M80B

Gato

1.2B

20B

AlexaTM

WeLM

FIMVIMA200M·

BERT

340M

Plato-XLGPT-NeoX-20B·

GPT-117M1B

MacawGPT-21.5B11B

Cohere

52.4BMegatron-11BruGPT-3

MT-NLG

530BGPT-3175B

Jurassic-1178B20BLuminous200BCM3

13BVLM-410BmGPT13BBLOOM176BAtlas1NLLB54.5BGLM-130BParametersAI

lab/groupLaMDA137Blle

Fairseq(

13BAnthropic-LMGPT-JBlenderBot2.09.410B

OOR

GAL

120BBerwbbet,smirto

scale.shlecdiedhiuhghts

arlyALnDThonnon.Decber2022

加asardhinsLAvallableClosed52B5.4大模型的特點(diǎn)(2)涌現(xiàn)能力涌現(xiàn)能力是指模型在訓(xùn)練過程中突然展現(xiàn)出之前小模型所沒有的、更深層次的復(fù)雜特性和能力。當(dāng)模型的訓(xùn)練數(shù)據(jù)突破一定規(guī)模時，模型能夠綜合

分析和解決更深層次的問題，展現(xiàn)出類似人類的思維和智能。這種涌現(xiàn)能力是大模型最顯著的特點(diǎn)之一，也是其超越傳統(tǒng)模型的關(guān)鍵所在大模型的涌現(xiàn)能力源于其巨大的規(guī)模和復(fù)雜的結(jié)構(gòu)。這些模型包含數(shù)億甚

至數(shù)十億個參數(shù)，能夠捕捉到數(shù)據(jù)中的復(fù)雜模式和關(guān)系。在訓(xùn)練過程中，

大模型通過不斷優(yōu)化參數(shù)，逐漸形成了一種高度協(xié)調(diào)和自適應(yīng)的結(jié)構(gòu)，從

而產(chǎn)生了意想不到的特性和能力。這種涌現(xiàn)能力使得大模型在處理復(fù)雜任務(wù)時具有更高的效率和準(zhǔn)確性。它們能夠更好地理解和模擬現(xiàn)實(shí)世界中的

各種復(fù)雜現(xiàn)象，并從中提取出更深層次的知識和規(guī)律。這種能力使得大模

型在自然語言處理、圖像識別、語音識別等領(lǐng)域中展現(xiàn)出了卓越的性能5.4大模型的特點(diǎn)(3)更好的性能和泛化能力大模型因其巨大的規(guī)模和復(fù)雜的結(jié)構(gòu)，展現(xiàn)出更出色的性能和泛化能力。它們在各種任務(wù)上都能表現(xiàn)出色，超越了傳統(tǒng)的小模型。這主要?dú)w功于大模型的參數(shù)規(guī)模和學(xué)習(xí)能力。大模型能夠更好

地理解和模擬現(xiàn)實(shí)世界中的復(fù)雜現(xiàn)象，從而在各種任務(wù)中表現(xiàn)出更高的準(zhǔn)確性和效率。它們能夠

捕捉到數(shù)據(jù)中的微妙差異和復(fù)雜模式，使得在未見過的數(shù)據(jù)上也能表現(xiàn)優(yōu)秀，即具有良好的泛化

能力(4)多任務(wù)學(xué)習(xí)大模型的多任務(wù)學(xué)習(xí)特點(diǎn)使其能夠同時處理多種不同的任務(wù)，并從中學(xué)習(xí)到更廣泛和泛化的語言理解能力。通過多任務(wù)學(xué)習(xí)，大模型可以在不同的NLP(Natural

Language

Processing)任務(wù)

中進(jìn)行訓(xùn)練，例如機(jī)器翻譯、文本摘要、問答系統(tǒng)等。

這種多任務(wù)學(xué)習(xí)的方式有助于大模型更好

地理解和應(yīng)用語言的規(guī)則和模式在多任務(wù)學(xué)習(xí)中，大模型可以共享參數(shù)和知識，使其在不同的任務(wù)之間建立聯(lián)系，提高模型的泛化能力。通過多任務(wù)學(xué)習(xí)，大模型能夠從多個領(lǐng)域的數(shù)據(jù)中學(xué)習(xí)知識，并在不同領(lǐng)域中進(jìn)行應(yīng)用。

這有助于促進(jìn)跨領(lǐng)域的創(chuàng)新，使得大模型在自然語言處理、圖像識別、語音識別等領(lǐng)域中展現(xiàn)出

卓越的性能5.4大模型的特點(diǎn)(5)大數(shù)據(jù)訓(xùn)練大模型需要大規(guī)模的數(shù)據(jù)來訓(xùn)練，通常在TB

級別甚至PB

級別。這是因為大模型擁有數(shù)億甚至數(shù)

十億的參數(shù)，需要大量的數(shù)據(jù)來提供足夠的信息供模型學(xué)習(xí)和優(yōu)化。只有大規(guī)模的數(shù)據(jù)才能讓大

模型的參數(shù)規(guī)模發(fā)揮優(yōu)勢，提高模型的泛化能力和性能。同時，大數(shù)據(jù)訓(xùn)練也是保證大模型能夠

處理復(fù)雜任務(wù)的關(guān)鍵。通過使用大規(guī)模數(shù)據(jù)，大模型能夠更好地理解數(shù)據(jù)中的復(fù)雜模式和關(guān)系，

從而更好地模擬現(xiàn)實(shí)世界中的各種現(xiàn)象(6)強(qiáng)大的計算資源大模型需要強(qiáng)大的計算資源來訓(xùn)練和運(yùn)行。由于模型規(guī)模龐大，參數(shù)數(shù)量眾多，計算復(fù)雜度極高，

因此需要高性能的硬件設(shè)備來支持。通常，訓(xùn)練大模型需要使用GPU(Graphics

ProcessingUnit,

圖形處理器)或TPU(Tensor

Processing

Unit,張量處理器)等專用加速器來提高計算

效率。這些加速器能夠并行處理大量的參數(shù)和數(shù)據(jù)，使得大模型的訓(xùn)練和推斷速度更快。除了硬

件設(shè)備，大模型的訓(xùn)練還需要大量的時間。由于模型參數(shù)眾多，訓(xùn)練過程中需要進(jìn)行大量的迭代

和優(yōu)化，因此，訓(xùn)練周期可能長達(dá)數(shù)周甚至數(shù)月5.4大模型的特點(diǎn)(7)遷移學(xué)習(xí)和預(yù)訓(xùn)練通過在大規(guī)模數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練，大模型能夠?qū)W習(xí)到豐富的語言知識和模式，從而在各種任務(wù)上展現(xiàn)出卓越的性能。遷移學(xué)習(xí)和預(yù)訓(xùn)練有助于大模型更好地適應(yīng)特定任務(wù)遷移學(xué)習(xí)和預(yù)訓(xùn)練也有助于大模型實(shí)現(xiàn)跨領(lǐng)域的應(yīng)用。通過在多個領(lǐng)域的數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練，大模型可以學(xué)

習(xí)到不同領(lǐng)域的知識和模式，并在不同領(lǐng)域中進(jìn)行應(yīng)用。這種跨領(lǐng)域的應(yīng)用能力，有助于大模型更好地服務(wù)于實(shí)際需求，推動人工智能技術(shù)的創(chuàng)新和發(fā)展在大規(guī)模數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練后，大模型可以在特定任務(wù)的數(shù)據(jù)上進(jìn)行微調(diào)，從而更好地適應(yīng)目標(biāo)任務(wù)的特性和要求。這種微調(diào)過程可以幫助大模型更好地理解和處理目標(biāo)任務(wù)的特定問題，進(jìn)一步提高模型的性能在特定任務(wù)的數(shù)據(jù)上進(jìn)行微調(diào)

跨領(lǐng)域的應(yīng)用能力5.4大模型的特點(diǎn)(8)自監(jiān)督學(xué)習(xí)自監(jiān)督學(xué)習(xí)利用大規(guī)模未標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練，通過從數(shù)據(jù)中挖掘內(nèi)在的規(guī)律和模式，使模型能夠自動地理解和預(yù)測數(shù)據(jù)中的信息。在大規(guī)模的未標(biāo)記數(shù)據(jù)中，大模型通過預(yù)測輸入數(shù)據(jù)的標(biāo)簽或下一個時刻的狀態(tài)來進(jìn)行訓(xùn)練。這種訓(xùn)練方式使得大模型能夠從大量的數(shù)據(jù)中自動

地學(xué)習(xí)到語言的內(nèi)在結(jié)構(gòu)和模式，而不需要人工標(biāo)注和干預(yù)自監(jiān)督學(xué)習(xí)使得大模型能夠更好地適應(yīng)大規(guī)模未標(biāo)記數(shù)據(jù)的處理，減少了對于人工標(biāo)注的依賴，提高了訓(xùn)練的效率和泛化能力。同時，自

監(jiān)督學(xué)習(xí)也使得大模型能夠更好地捕捉數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和模式，進(jìn)一步提高模型在處理復(fù)雜任務(wù)時的性能和準(zhǔn)確性原始數(shù)據(jù)INPUT

RAW

DATA

算法Algorithm狗品□CatsInterpretation貓?zhí)幚砦礃?biāo)記數(shù)據(jù)輸出OUTPUTProcessingUnlabeleddataDogs解釋(9)領(lǐng)域知識融合大模型通過領(lǐng)域知識融合，能夠?qū)⒉煌I(lǐng)域的數(shù)據(jù)和知識融合在一起，從而更好地模擬現(xiàn)實(shí)世界中的復(fù)雜現(xiàn)象領(lǐng)域知識融合使得大模型能夠從多個領(lǐng)域中學(xué)習(xí)到廣泛的知識和模式，并將這些知識和模式整合到統(tǒng)一的框架中通過領(lǐng)域知識融合，大模型能夠更好地理解不同領(lǐng)域之間的聯(lián)系和共同規(guī)律，從而更好地處理復(fù)雜任務(wù)。這種能力有助于大模型在不同領(lǐng)域之間進(jìn)行知識遷移和應(yīng)用，促進(jìn)跨領(lǐng)域的創(chuàng)新和發(fā)展Training

DomainSupervisedMappingAppearance

ChangeADAPTEDSupervisedMappingTraining

LabelsLabalsPredic-tionsApplicationPredictionsbtGqicIoU2ybbjics|ou5.4大模型的特點(diǎn)ApplicationybbjicspouDomainsDousjua(10)自動化和效率大模型在應(yīng)用中展現(xiàn)出高度的自動化和效率。由于大模型具有強(qiáng)大的表達(dá)能力和學(xué)習(xí)能力，它可以自動化許多復(fù)雜的任務(wù)，大大提高工作

效率。大模型通過預(yù)訓(xùn)練和微調(diào)過程，能夠自動地適應(yīng)特定任務(wù)，而不需要過多的手工調(diào)整和干預(yù)。這使得大模型能夠快速地應(yīng)用于各種實(shí)際場景，并且自動地處理復(fù)雜的任務(wù)，如自動編程、自動翻譯、自動摘要等大模型的自動化和效率還體現(xiàn)在其對大規(guī)模數(shù)據(jù)的處理能力上。大模型能夠高效地處理TB級別甚至PB

級別的數(shù)據(jù)，從中自動地提取出有用

的信息和知識。這種高效的數(shù)據(jù)處理能力使得大模型在處理大規(guī)模數(shù)據(jù)時具有顯著的優(yōu)勢，提高了數(shù)據(jù)處理和分析的效率5.4大模型的特點(diǎn)大模型的分類Part

five語言大模型是指在自然語言處理(Natural

Language

Processing,NLP)領(lǐng)域中的一類大模型，通常

用于處理文本數(shù)據(jù)和理解自然語言。這類大模型

的主要特點(diǎn)是它們在大規(guī)模語料庫上進(jìn)行了訓(xùn)練，

以學(xué)習(xí)自然語言的各種語法、語義和語境規(guī)則。

代表性產(chǎn)品包括GPT

系列(OpenAl)、Bard(Google)

、

文心

一

言(百度)等視覺大模型是指在計算機(jī)視覺(Computer

Vision,CV)領(lǐng)

域中使用的大模型，通常用于圖像處理和分析。

這類模型通過在大規(guī)模圖像數(shù)據(jù)上進(jìn)行訓(xùn)練，可

以實(shí)現(xiàn)各種視覺任務(wù)，如圖像分類、目標(biāo)檢測、

圖像分割、姿態(tài)估計、人臉識別等。代表性產(chǎn)品

包括VIT系列

(Google)

、

文心UFO

、華為盤古

、INTERN

(商湯)等多模態(tài)大模型是指能夠處理多種不同類型數(shù)據(jù)的大模型，例如

文本、圖像、音頻等多模態(tài)數(shù)據(jù)。這類模型結(jié)合

了NLP

和CV

的能力，以實(shí)現(xiàn)對多模態(tài)信息的綜合

理解和分析，從而能夠更全面地理解和處理復(fù)雜

的數(shù)據(jù)。代表性產(chǎn)品包括DingoDB

多模向量數(shù)據(jù)

庫(九章云極DataCanvas)、DALL-E(OpenAl)、悟空畫畫(華為)、

midjourney

等5.5大模型的分類通用大模型LO是指可以在多個領(lǐng)域和任務(wù)上通用

的大模型。它們利用大算力、使用

海量的開放數(shù)據(jù)與具有巨量參數(shù)的

深度學(xué)習(xí)算法，在大規(guī)模無標(biāo)注數(shù)

據(jù)上進(jìn)行訓(xùn)練，以尋找特征并發(fā)現(xiàn)

規(guī)律，進(jìn)而形成可“舉一反三”的

強(qiáng)大泛化能力，可在不進(jìn)行微調(diào)或少量微調(diào)的情況下完成多場景任務(wù)，相當(dāng)于AI完成了“通識教育”行業(yè)大模型L1是指那些針對特定行業(yè)或領(lǐng)域的大模型。它們通常使用行業(yè)相關(guān)的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練或微調(diào)，以提高在該

領(lǐng)域的性能和準(zhǔn)確度，相當(dāng)于AI成

為“行業(yè)專家”垂直大模型L2是指那些針對特定任務(wù)或場景的大

模型。它們通常使用任務(wù)相關(guān)的數(shù)

據(jù)進(jìn)行預(yù)訓(xùn)練或微調(diào)，以提高在該

任務(wù)上的性能和效果

5.5大模型的分類按照應(yīng)用領(lǐng)域的不同，大模型主要可以分為LO、L1、L2

三個層級大模型的成本Part

six大模型的成本涉及到多個方面，包括硬件設(shè)備、軟件許可、數(shù)據(jù)收集和處理、人力資源以及運(yùn)營和維護(hù)等(1)硬件設(shè)備成本大模型的訓(xùn)練和推理需要大量的計算資源，包括高性能的計算機(jī)、服務(wù)器、存儲設(shè)備等。這些硬件設(shè)備的購置和維護(hù)成本通常較高。為了滿足大模型的計算需求，需要購買或租賃大量的服務(wù)器和存儲設(shè)備，并進(jìn)行相應(yīng)的硬件升級和維護(hù)GPT-3

訓(xùn)練一次的成本約為140萬美元，對于一些更大的大模型，訓(xùn)練成本更高，GPT-4

的一次訓(xùn)練成本約為6300萬美元。以ChatGPT

在2023年1月的獨(dú)立訪客平均數(shù)1300萬計算，其對應(yīng)芯片需求為3萬多片英偉達(dá)A100GPU,初始投入成本約為8億美元，每日電費(fèi)在5萬美元左右5.6大模型的成本大模型的訓(xùn)練需要大量的標(biāo)記數(shù)據(jù)。數(shù)據(jù)的收集、清洗、標(biāo)注和

處理都需要投入大量的人力、物

力和時間成本。此外，為了確保

數(shù)據(jù)的準(zhǔn)確性和有效性，還需要

進(jìn)行數(shù)據(jù)驗證和校驗，這也增加了數(shù)據(jù)處理的成本大模型的訓(xùn)練和推理需要專業(yè)的團(tuán)隊進(jìn)行維護(hù)和優(yōu)化。這包括數(shù)

據(jù)科學(xué)家、機(jī)器學(xué)習(xí)工程師、運(yùn)

維人員等。這些人員需要具備專業(yè)的技能和經(jīng)驗，因此，人力資

源成本也是大模型成本的重要組成部分大模型的運(yùn)營和維護(hù)也需要投入成本。這包括模型的部署、監(jiān)控、

調(diào)優(yōu)、更新等。為了確保模型的

穩(wěn)定性和性能，需要進(jìn)行持續(xù)的

維護(hù)和優(yōu)化，這也增加了運(yùn)營和

維護(hù)的成本大模型的訓(xùn)練和推理通常需要使

用特定的軟件和框架，如TensorFlow

、PyTorch

等。這些

軟件通常需要購買許可證或訂閱

服務(wù)，這也會增加大模型的訓(xùn)練

成本軟件許可成本

數(shù)據(jù)收集和處理成本

人力資源成本

運(yùn)營和維護(hù)成本5.6大模型的成本大模型的應(yīng)用領(lǐng)域Part

seven(2)計算機(jī)視覺大模型在計算機(jī)視覺領(lǐng)域也有廣泛應(yīng)用，可以用于圖像分類(識別圖像中的物體和場景)、目標(biāo)檢測(能夠定位并識別圖像中的特定物體)、圖像生成(如風(fēng)格遷移、圖像超分辨率增強(qiáng))、人臉識別(用于安全驗證和身份識別)、醫(yī)學(xué)影像分析(輔助醫(yī)生診斷疾病)等(1)自然語言處理大模型在自然語言處理領(lǐng)域具有重要的應(yīng)用，可以用于文本生成(如文章、小說、新聞等的創(chuàng)作)、翻譯系統(tǒng)(能夠?qū)崿F(xiàn)高質(zhì)量的

跨語言翻譯)、問答系統(tǒng)(能夠回答用戶提出的問題)、情感分析(用于判斷文本中的情感傾向)、語言生成(如聊天機(jī)器人)等大模型的應(yīng)用領(lǐng)域非常廣泛，涵蓋了自然語言處理、計算機(jī)視覺、語音識別、推薦系統(tǒng)、醫(yī)療健康、金融風(fēng)控、工業(yè)制造、生物信息學(xué)、自動駕駛、氣候研究等多個領(lǐng)域5.7大模型的應(yīng)用領(lǐng)域用戶行為數(shù)據(jù)產(chǎn)品推薦系統(tǒng)用戶畫像發(fā)據(jù)5.7大模型的應(yīng)用領(lǐng)域(3)語音識別大模型在語音識別領(lǐng)域也有應(yīng)用，如語音識別、語音合成等。通過學(xué)習(xí)大量的語音數(shù)據(jù)，大模型可以實(shí)現(xiàn)高質(zhì)量的跨語言翻譯和語音

識別以及生成自然語音(4)推薦系統(tǒng)大模型可以用于個性化推薦、廣告推薦等任務(wù)。通過分析用戶的歷史行為和興趣偏好，大模型可以為用戶提供個性化的推薦服務(wù)，提高用

戶滿意度和轉(zhuǎn)化率大模型可以用于自動駕駛中的感知、決策

等任務(wù)。通過學(xué)習(xí)大量的駕駛數(shù)據(jù)，大模型可以實(shí)現(xiàn)對車輛周圍環(huán)境的感知和識別，以及進(jìn)行決策和控制，提高自動駕駛的安

全性和效率大模型可以用于信用評估、欺詐檢測等任

務(wù)。通過分析大量的金融數(shù)據(jù)，大模型可

以評估用戶的信用等級和風(fēng)險水平，以及

檢測欺詐行為，提高金融系統(tǒng)的安全性和

穩(wěn)定性大模型可以用于醫(yī)療影像診斷、疾病預(yù)測

等任務(wù)。通過學(xué)習(xí)大量的醫(yī)學(xué)影像數(shù)據(jù)，

大模型可以輔助醫(yī)生進(jìn)行疾病診斷和治療

方案制定，提高醫(yī)療水平和效率5.7大模型的應(yīng)用領(lǐng)域在生物信息學(xué)領(lǐng)域，大模型可以用于基因序列分析(識別基因中的功能元件和變異

位點(diǎn))、蛋白質(zhì)結(jié)構(gòu)預(yù)測(推測蛋白質(zhì)的

二級和三級結(jié)構(gòu))、藥物研發(fā)(預(yù)測分子

與靶點(diǎn)的相互作用)等在氣候研究領(lǐng)域，大模型可以處理氣象數(shù)據(jù)，進(jìn)行天氣預(yù)測和氣候模擬。它們能夠

分析復(fù)雜的氣象現(xiàn)象，提供準(zhǔn)確的氣象預(yù)

報，幫助人們做出應(yīng)對氣候變化的決策大模型可以用于質(zhì)量控制、故障診斷等任務(wù)。通過學(xué)習(xí)大量的工業(yè)制造數(shù)據(jù)，大模

型可以輔助工程師進(jìn)行產(chǎn)品質(zhì)量控制和故

障診斷，提高生產(chǎn)效率和產(chǎn)品質(zhì)量生物信息學(xué)氣候研究工業(yè)制造5.7大模型的應(yīng)用領(lǐng)域基于大模型的智能體Parteight

5.8基于大模型的智能體基于大模型的智能體基于大模型的智能體是指利用大型

語言模型(如GPT、BERT

等)作為

核心組件，構(gòu)建的能夠執(zhí)行特定任

務(wù)、與環(huán)境交互并做出決策的人工

智能系統(tǒng)。這些智能體具有自主性、

交互性、適應(yīng)性等特點(diǎn)，能夠模擬

人類的認(rèn)知和決策過程，提供更加

自然、高效和個性化的交互體驗。它們能夠處理海量數(shù)據(jù)，進(jìn)行高效

的學(xué)習(xí)與推理，并展現(xiàn)出跨領(lǐng)域的

應(yīng)用潛力。文心智能體平臺AgentBuilder

官方想象即現(xiàn)實(shí)人人都是開發(fā)者基于文心大模型的智能體平臺>一句話、零代碼創(chuàng)建智能體>調(diào)優(yōu)迭代快、分發(fā)渠道廣、商業(yè)可閉環(huán)>立即創(chuàng)建大模型對人們工作和生活的影響Part

nine大模型在自然語言處理、機(jī)器大模型能夠收集、整理和分析大模型的發(fā)展使得一些繁瑣、隨著大模型的普及和應(yīng)用，將

翻譯等領(lǐng)域的應(yīng)用，使得人們大量的數(shù)據(jù)，通過數(shù)據(jù)挖掘和重復(fù)的工作可以由機(jī)器來完成，創(chuàng)造出許多新的就業(yè)機(jī)會。例能夠快速、準(zhǔn)確地處理大量文

機(jī)器學(xué)習(xí)技術(shù)，幫助人們更準(zhǔn)從而減輕了人們的工作負(fù)擔(dān)。如，需要更多的人來開發(fā)和維本數(shù)據(jù)，提高工作效率。例如，確地了解問題現(xiàn)狀，預(yù)測未來例如，在金融領(lǐng)域，大模型可護(hù)大模型，也需要更多的人來

在翻譯領(lǐng)域，大模型能夠自動

趨勢，從而做出更明智的決策

以自動分析大量的金融數(shù)據(jù)，

利用大模型進(jìn)行各種應(yīng)用開發(fā)

翻譯多種語言，減少人工翻譯幫助人們做出更準(zhǔn)確的決策的時間和成本，提高翻譯效率5.8.1大模型對工作的影響創(chuàng)造新的

就業(yè)機(jī)會自動化部分工作提高工作效率優(yōu)化決策過程提高學(xué)習(xí)效率大模型在教育領(lǐng)域的應(yīng)用，可以幫助人

們更高效地學(xué)習(xí)新知識。例如，通過大

模型的智能推薦功能，人們可以根據(jù)自

己的興趣和需求，獲取更加個性化的學(xué)

習(xí)資源增強(qiáng)娛樂體驗大模型在娛樂領(lǐng)域的應(yīng)用，可以提供更

加豐富、多樣的娛樂體驗。例如，通過

大模型的語音識別功能，人們可以通過

語音指令控制游戲，實(shí)現(xiàn)更加智能化的

游戲體驗改善生活質(zhì)量大模型在智能家居、智能客服等領(lǐng)域的

應(yīng)用，使得人們的生活更加便利、舒適。

例如，通過智能家居系統(tǒng)，人們可以通

過語音指令控制家電，實(shí)現(xiàn)智能化生活5.8.2大模型對生活的影響免責(zé)聲明【無憂智庫，星球號：53232205】知識星球【無憂智庫-新基建智慧城市圈子】內(nèi)的資源均通過互聯(lián)網(wǎng)等公開合法渠道獲取的資料，該資料僅作為閱讀交流使用，并無任何商業(yè)目的。其版權(quán)歸作者或出版社所有，本星球不對所涉及的版權(quán)問題承擔(dān)法律責(zé)任。若版權(quán)方、出版社認(rèn)為本星球侵權(quán)，請立即通知星主刪除，請勿投訴，無意冒犯。本星球入駐會員費(fèi)，是本星球收集整理加工該資料以及整理資料運(yùn)營所必須的費(fèi)用支付，資料索取者(客戶)尊重版權(quán)方的知識產(chǎn)權(quán)，支持版權(quán)方和出版社。謝謝!掃碼關(guān)注微信公眾號掃碼添加星主微信掃碼

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

2025年-Chapter5-第5章大模型人工智能的前沿-廈門大學(xué)-數(shù)字素養(yǎng)通識教程（2025年1月）-新版

文檔簡介

溫馨提示

最新文檔

評論

2025年-Chapter5-第5章 大模型人工智能的前沿-廈門大學(xué)-數(shù)字素養(yǎng)通識教程（2025年1月）-新版

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

2025年-Chapter5-第5章大模型人工智能的前沿-廈門大學(xué)-數(shù)字素養(yǎng)通識教程（2025年1月）-新版