人工智能通識(shí)(基礎(chǔ)、技術(shù)、前沿、倫理與實(shí)踐)-課件 第6-10章 大模型-人工智能倫理_第1頁(yè)
人工智能通識(shí)(基礎(chǔ)、技術(shù)、前沿、倫理與實(shí)踐)-課件 第6-10章 大模型-人工智能倫理_第2頁(yè)
人工智能通識(shí)(基礎(chǔ)、技術(shù)、前沿、倫理與實(shí)踐)-課件 第6-10章 大模型-人工智能倫理_第3頁(yè)
人工智能通識(shí)(基礎(chǔ)、技術(shù)、前沿、倫理與實(shí)踐)-課件 第6-10章 大模型-人工智能倫理_第4頁(yè)
人工智能通識(shí)(基礎(chǔ)、技術(shù)、前沿、倫理與實(shí)踐)-課件 第6-10章 大模型-人工智能倫理_第5頁(yè)
已閱讀5頁(yè),還剩396頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人工智能通識(shí)——基礎(chǔ)、技術(shù)、前沿、倫理與實(shí)踐第6章大模型01大模型概述目錄02大模型產(chǎn)品03大模型的基本原理04大模型的特點(diǎn)05大模型的分類06大模型訓(xùn)練的硬件設(shè)施07大模型的成本09大模型對(duì)人們工作和生活的影響10大模型的挑戰(zhàn)與未來(lái)發(fā)展08大模型的應(yīng)用領(lǐng)域11實(shí)驗(yàn)1:在自己本地計(jì)算機(jī)上部署大模型01大模型概述Partone6.1.1大模型的概念大模型通常指的是大規(guī)模的人工智能模型,是一種基于深度學(xué)習(xí)技術(shù),具有海量參數(shù)、強(qiáng)大的學(xué)習(xí)能力和泛化能力,能夠處理和生成多種類型數(shù)據(jù)的人工智能模型大模型的“大”的特點(diǎn)體現(xiàn)在:參數(shù)數(shù)量龐大訓(xùn)練數(shù)據(jù)量大計(jì)算資源需求高2020年,OpenAI公司推出了GPT-3,模型參數(shù)規(guī)模達(dá)到了1750億2023年3月發(fā)布的GPT-4的參數(shù)規(guī)模是GPT-3的10倍以上,達(dá)到1.8萬(wàn)億大模型的設(shè)計(jì)和訓(xùn)練旨在提供更強(qiáng)大、更準(zhǔn)確的模型性能,以應(yīng)對(duì)更復(fù)雜、更龐大的數(shù)據(jù)集或任務(wù)。大模型通常能夠?qū)W習(xí)到更細(xì)微的模式和規(guī)律,具有更強(qiáng)的泛化能力和表達(dá)能力大模型具有更強(qiáng)的上下文理解能力,能夠理解更復(fù)雜的語(yǔ)意和語(yǔ)境。這使得它們能夠產(chǎn)生更準(zhǔn)確、更連貫的回答上下文理解能力大模型可以從大量的數(shù)據(jù)中學(xué)習(xí),并利用學(xué)到的知識(shí)和模式來(lái)提供更精準(zhǔn)的答案和預(yù)測(cè)。這使得它們?cè)诮鉀Q復(fù)雜問(wèn)題和應(yīng)對(duì)新的場(chǎng)景時(shí)表現(xiàn)更加出色學(xué)習(xí)能力強(qiáng)大模型可以生成更自然、更流利的語(yǔ)言,減少了生成輸出時(shí)呈現(xiàn)的錯(cuò)誤或令人困惑的問(wèn)題語(yǔ)言生成能力學(xué)習(xí)到的知識(shí)和能力可以在不同的任務(wù)和領(lǐng)域中遷移和應(yīng)用。這意味著一次訓(xùn)練就可以將模型應(yīng)用于多種任務(wù),無(wú)需重新訓(xùn)練可遷移性高6.1.1大模型的概念小模型通常指參數(shù)較少、層數(shù)較淺的模型,它們具有輕量級(jí)、高效率、易于部署等優(yōu)點(diǎn),適用于數(shù)據(jù)量較小、計(jì)算資源有限的場(chǎng)景,例如移動(dòng)端應(yīng)用、嵌入式設(shè)備、物聯(lián)網(wǎng)等6.1.2大模型與小模型的區(qū)別而當(dāng)模型的訓(xùn)練數(shù)據(jù)和參數(shù)不斷擴(kuò)大,直到達(dá)到一定的臨界規(guī)模后,其表現(xiàn)出了一些未能預(yù)測(cè)的、更復(fù)雜的能力和特性,模型能夠從原始訓(xùn)練數(shù)據(jù)中自動(dòng)學(xué)習(xí)并發(fā)現(xiàn)新的、更高層次的特征和模式,這種能力被稱為“涌現(xiàn)能力”。而具備涌現(xiàn)能力的機(jī)器學(xué)習(xí)模型就被認(rèn)為是獨(dú)立意義上的大模型,這也是其和小模型最大意義上的區(qū)別相比于小模型,大模型通常參數(shù)較多、層數(shù)較深,具有更強(qiáng)的表達(dá)能力和更高的準(zhǔn)確度,但也需要更多的計(jì)算資源和時(shí)間來(lái)訓(xùn)練和推理,適用于數(shù)據(jù)量較大、計(jì)算資源充足的場(chǎng)景,例如云端計(jì)算、高性能計(jì)算、人工智能等6.1.2大模型與小模型的區(qū)別大模型發(fā)展歷經(jīng)三個(gè)階段,分別是萌芽期、沉淀期和爆發(fā)期6.1.3大模型的發(fā)展歷程萌芽期(1950-2005)這是一個(gè)以CNN(ConvolutionalNeuralNetworks,卷積神經(jīng)網(wǎng)絡(luò))為代表的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型階段1956年,從計(jì)算機(jī)專家約翰·麥卡錫提出“人工智能”概念開(kāi)始,AI發(fā)展由最開(kāi)始基于小規(guī)模專家知識(shí)逐步發(fā)展為基于機(jī)器學(xué)習(xí)1980年,卷積神經(jīng)網(wǎng)絡(luò)的雛形CNN誕生1998年,現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)LeNet-5誕生,機(jī)器學(xué)習(xí)方法由早期基于淺層機(jī)器學(xué)習(xí)的模型,變?yōu)榱嘶谏疃葘W(xué)習(xí)的模型,為自然語(yǔ)言生成、計(jì)算機(jī)視覺(jué)等領(lǐng)域的深入研究奠定了基礎(chǔ),對(duì)后續(xù)深度學(xué)習(xí)框架的迭代及大模型發(fā)展具有開(kāi)創(chuàng)性的意義6.1.3大模型的發(fā)展歷程沉淀期(2006-2019)這是一個(gè)以Transformer為代表的全新神經(jīng)網(wǎng)絡(luò)模型階段2013年,自然語(yǔ)言處理模型Word2Vec誕生,首次提出將單詞轉(zhuǎn)換為向量的“詞向量模型”,以便計(jì)算機(jī)更好地理解和處理文本數(shù)據(jù)。2014年,被譽(yù)為21世紀(jì)最強(qiáng)大算法模型之一的GAN(GenerativeAdversarialNetworks,對(duì)抗式生成網(wǎng)絡(luò))誕生,標(biāo)志著深度學(xué)習(xí)進(jìn)入了生成模型研究的新階段2017年,Google顛覆性地提出了基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)——Transformer架構(gòu),奠定了大模型預(yù)訓(xùn)練算法架構(gòu)的基礎(chǔ)2018年,OpenAI基于Transformer架構(gòu)發(fā)布了GPT-1大模型,意味著預(yù)訓(xùn)練大模型成為自然語(yǔ)言處理領(lǐng)域的主流,其中,GPT的英文全稱是GenerativePre-TrainedTransformer,是一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來(lái)訓(xùn)練的、文本生成的深度學(xué)習(xí)模型2019年,OpenAI發(fā)布了GPT-26.1.3大模型的發(fā)展歷程爆發(fā)期(2020-至今)這是一個(gè)以GPT為代表的預(yù)訓(xùn)練大模型階段2020年6月,OpenAI公司推出了GPT-3,模型參數(shù)規(guī)模達(dá)到了1750億,成為當(dāng)時(shí)最大的語(yǔ)言模型,并且在零樣本學(xué)習(xí)任務(wù)上實(shí)現(xiàn)了巨大性能提升。隨后,更多策略如基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF,ReinforcementLearningfromHumanFeedback)、代碼預(yù)訓(xùn)練、指令微調(diào)等開(kāi)始出現(xiàn),被用于進(jìn)一步提高推理能力和任務(wù)泛化2022年11月,搭載了GPT3.5的ChatGPT(ChatGenerativePre-trainedTransformer)橫空出世,憑借逼真的自然語(yǔ)言交互與多場(chǎng)景內(nèi)容生成能力,迅速引爆互聯(lián)網(wǎng),在全球范圍內(nèi)引起轟動(dòng),使得大模型的概念迅速進(jìn)入普通大眾的視野。ChatGPT是人工智能技術(shù)驅(qū)動(dòng)的自然語(yǔ)言處理工具,它能夠通過(guò)理解和學(xué)習(xí)人類的語(yǔ)言來(lái)進(jìn)行對(duì)話,還能根據(jù)聊天的上下文進(jìn)行互動(dòng),真正像人類一樣來(lái)聊天交流,甚至能完成撰寫(xiě)郵件、視頻腳本、文案、翻譯、代碼,寫(xiě)論文等任務(wù)6.1.3大模型的發(fā)展歷程爆發(fā)期(2020-至今)6.1.3大模型的發(fā)展歷程OpenAI在2023年3月發(fā)布了GPT-4,它是一個(gè)多模態(tài)大模型(接受圖像和文本輸入,生成文本)。相比上一代的GPT-3,GPT-4可以更準(zhǔn)確地解決難題,具有更廣泛的常識(shí)和解決問(wèn)題的能力。2023年12月,谷歌發(fā)布大模型Gemini,它可以同時(shí)識(shí)別文本、圖像、音頻、視頻和代碼五種類型信息,還可以理解并生成主流編程語(yǔ)言(如Python、Java、C++)的高質(zhì)量代碼,并擁有全面的安全性評(píng)估。2024年12月26日,我國(guó)的DeepSeek震撼全球,成為全球人工智能發(fā)展歷史上的一個(gè)標(biāo)志性事件人工智能包含了機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)包含了深度學(xué)習(xí),深度學(xué)習(xí)可以采用不同的模型,其中一種模型是預(yù)訓(xùn)練模型,預(yù)訓(xùn)練模型包含了預(yù)訓(xùn)練大模型(可以簡(jiǎn)稱為“大模型”),預(yù)訓(xùn)練大模型包含了預(yù)訓(xùn)練大語(yǔ)言模型(可以簡(jiǎn)稱為“大語(yǔ)言模型”),預(yù)訓(xùn)練大語(yǔ)言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE,ChatGPT是基于GPT開(kāi)發(fā)的大模型產(chǎn)品,文心一言是基于文心ERNIE開(kāi)發(fā)的大模型產(chǎn)品6.1.4人工智能與大模型的關(guān)系人工智能和大模型是相互關(guān)聯(lián)的。人工智能是研究和開(kāi)發(fā)使機(jī)器能夠模仿人類智能行為的技術(shù)和方法的學(xué)科,包括機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等。而大模型則是指訓(xùn)練過(guò)程中使用了大量數(shù)據(jù)和參數(shù)的模型,這些模型包含了大量的知識(shí)和規(guī)則,能夠更好地模擬人類智能行為為了提高人工智能系統(tǒng)的性能,研究者們不斷嘗試使用更大的模型來(lái)提高準(zhǔn)確率和效果。例如,近年來(lái)非常熱門的Transformer模型,就是一種大模型,它在自然語(yǔ)言處理領(lǐng)域取得了很多突破性進(jìn)展。大模型的使用能夠幫助人工智能系統(tǒng)更好地理解語(yǔ)義、提高處理能力和決策準(zhǔn)確性人工智能的發(fā)展也推動(dòng)了大模型的發(fā)展大模型的出現(xiàn),使得人工智能技術(shù)得到了更廣泛的應(yīng)用。在許多領(lǐng)域,如自然語(yǔ)言處理、圖像識(shí)別、語(yǔ)音識(shí)別等,大模型都能夠提供更準(zhǔn)確、更高效的處理能力。例如,在自然語(yǔ)言處理領(lǐng)域,大模型可以通過(guò)學(xué)習(xí)大量的文本數(shù)據(jù),自動(dòng)提取出文本中的語(yǔ)義信息,從而實(shí)現(xiàn)對(duì)文本的自動(dòng)分類、情感分析、問(wèn)答等任務(wù)。隨著數(shù)據(jù)量的不斷增加和計(jì)算能力的不斷提升,大模型能夠處理的數(shù)據(jù)量和處理速度也在不斷提升。這使得人工智能技術(shù)能夠更好地應(yīng)對(duì)各種復(fù)雜的問(wèn)題和挑戰(zhàn),進(jìn)一步推動(dòng)了人工智能技術(shù)的發(fā)展大模型是人工智能技術(shù)發(fā)展的重要推動(dòng)力6.1.4人工智能與大模型的關(guān)系大模型在人工智能領(lǐng)域的重要性大模型的展示可以讓更多的人了解人工智能技術(shù)的潛力和影響力,從而增加公眾對(duì)人工智能技術(shù)的信任和支持。這也可以為人工智能行業(yè)爭(zhēng)取更多的政策支持和資源投入增加公眾對(duì)人工智能技術(shù)的信任和支持大模型作為人工智能技術(shù)的重要組成部分,展示了人工智能技術(shù)的最新進(jìn)展和趨勢(shì)。這些新技術(shù)和模型的應(yīng)用場(chǎng)景可能會(huì)更加廣泛,效果也可能會(huì)更好,從而推動(dòng)人工智能技術(shù)的進(jìn)步推動(dòng)人工智能技術(shù)的進(jìn)步大模型能夠使用大量的數(shù)據(jù)和強(qiáng)大的計(jì)算資源,學(xué)習(xí)到數(shù)據(jù)中的復(fù)雜特征和規(guī)律,從而在各種任務(wù)中表現(xiàn)出色。這使得人工智能技術(shù)在各個(gè)領(lǐng)域的應(yīng)用效果得到了顯著的提升提升人工智能的應(yīng)用效果大模型的展示能夠吸引更多的投資者和用戶關(guān)注人工智能行業(yè),從而加速行業(yè)的發(fā)展。同時(shí),大模型也可以促進(jìn)人工智能領(lǐng)域的交流和合作,從而推動(dòng)整個(gè)行業(yè)的發(fā)展促進(jìn)人工智能行業(yè)的發(fā)展6.1.5大模型在人工智能領(lǐng)域的重要性02大模型產(chǎn)品ParttwoChatGPTChatGPT是一種由OpenAI訓(xùn)練的大語(yǔ)言模型。它是基于Transformer架構(gòu),經(jīng)過(guò)大量文本數(shù)據(jù)訓(xùn)練而成,能夠生成自然、流暢的語(yǔ)言,并具備回答問(wèn)題、生成文本、語(yǔ)言翻譯等多種功能ChatGPT的應(yīng)用范圍廣泛,可以用于客服、問(wèn)答系統(tǒng)、對(duì)話生成、文本生成等領(lǐng)域。它能夠理解人類語(yǔ)言,并能夠回答各種問(wèn)題,提供相關(guān)的知識(shí)和信息。與其他聊天機(jī)器人相比,ChatGPT具備更強(qiáng)的語(yǔ)言理解和生成能力,能夠更自然地與人類交流,并且能夠更好地適應(yīng)不同的領(lǐng)域和場(chǎng)景。ChatGPT的訓(xùn)練數(shù)據(jù)來(lái)自互聯(lián)網(wǎng)上的大量文本,因此,它能夠涵蓋多種語(yǔ)言風(fēng)格和文化背景6.2.1國(guó)外的大模型產(chǎn)品GeminiGemini是谷歌發(fā)布的大模型,它能夠同時(shí)處理多種類型的數(shù)據(jù)和任務(wù),覆蓋文本、圖像、音頻、視頻等多個(gè)領(lǐng)域。Gemini采用了全新的架構(gòu),將多模態(tài)編碼器和多模態(tài)解碼器兩個(gè)主要組件結(jié)合在一起,以提供最佳結(jié)果Gemini包括三種不同規(guī)模的模型:GeminiUltra、GeminiPro和GeminiNano,適用于不同任務(wù)和設(shè)備。2023年12月6日,Gemini的初始版本已在Bard中提供,開(kāi)發(fā)人員版本可通過(guò)GoogleCloud的API獲得。Gemini可以應(yīng)用于Bard和Pixel8Pro智能手機(jī)。Gemini的應(yīng)用范圍廣泛,包括問(wèn)題回答、摘要生成、翻譯、字幕生成、情感分析等任務(wù)。然而,由于其復(fù)雜性和黑箱性質(zhì),Gemini的可解釋性仍然是一個(gè)挑戰(zhàn)6.2.1國(guó)外的大模型產(chǎn)品Sora2024年2月16日,OpenAI再次震撼全球科技界,發(fā)布了名為Sora的文本生成視頻大模型,只需輸入文本就能自動(dòng)生成視頻。這一技術(shù)的誕生,不僅標(biāo)志著人工智能在視頻生成領(lǐng)域的重大突破,更引發(fā)了關(guān)于人工智能發(fā)展對(duì)人類未來(lái)影響的深刻思考。隨著Sora的發(fā)布,人工智能似乎正式踏入了通用人工智能(AGI:ArtificialGeneralIntelligence)的時(shí)代。AGI是指能夠像人類一樣進(jìn)行各種智能活動(dòng)的機(jī)器智能,包括理解語(yǔ)言、識(shí)別圖像、進(jìn)行復(fù)雜推理等。Sora大模型能夠直接輸出長(zhǎng)達(dá)60秒的視頻,并且視頻中包含了高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個(gè)角色。這種能力已經(jīng)超越了簡(jiǎn)單的圖像或文本生成,開(kāi)始觸及到視頻這一更加復(fù)雜和動(dòng)態(tài)的媒介。這意味著人工智能不僅在處理靜態(tài)信息上越來(lái)越強(qiáng)大,而且在動(dòng)態(tài)內(nèi)容的創(chuàng)造上也展現(xiàn)出了驚人的潛力6.2.1國(guó)外的大模型產(chǎn)品Sora右圖是Sora根據(jù)文本自動(dòng)生成的視頻畫(huà)面,一位戴著墨鏡、穿著皮衣的時(shí)尚女子走在雨后夜晚的東京市區(qū)街道上,抹了鮮艷唇彩的唇角微微翹起,即便帶著墨鏡也能看到她的微笑,地面的積水映出了她的身影和燈紅酒綠的霓虹燈,熱鬧非凡的唐人街正在進(jìn)行舞龍表演,熙熙攘攘的人群目光都聚焦在躍動(dòng)的彩龍身上,整個(gè)環(huán)境的喜慶氛圍仿佛令人身臨其境6.2.1國(guó)外的大模型產(chǎn)品6.2.1國(guó)外的大模型產(chǎn)品OpenAIo32024年12月20日,OpenAI發(fā)布推理模型o3,無(wú)論在軟件工程、編寫(xiě)代碼,還是競(jìng)賽數(shù)學(xué)、掌握人類博士級(jí)別的自然科學(xué)知識(shí)能力方面,o3都達(dá)到了很高的水平6.2.1國(guó)外的大模型產(chǎn)品Grok4Grok4是馬斯克旗下xAI團(tuán)隊(duì)于2025年7月10日發(fā)布的大模型,性能卓越,在人類最后考試(HLE)中純文本模式準(zhǔn)確率26.9%,啟用工具后達(dá)41.0%,Grok4Heavy在“重思考”模式下更是達(dá)到58.3%,在ARC-AGI-2挑戰(zhàn)賽中得分創(chuàng)紀(jì)錄,AIME25美國(guó)數(shù)學(xué)邀請(qǐng)賽中Grok4Heavy獲滿分,智能指數(shù)73分,領(lǐng)先GPT-411分;它具備多智能體協(xié)同機(jī)制,面對(duì)問(wèn)題可分裂出5-8個(gè)智能體,從不同視角推導(dǎo),通過(guò)““思維鏈共享”交換推理路徑,整合最優(yōu)解法;其以最大化尋求真相為使命,面對(duì)敏感問(wèn)題會(huì)呈現(xiàn)多方論證,推理附帶信源溯源標(biāo)簽,結(jié)論不確定時(shí)會(huì)明確標(biāo)注;該模型由20萬(wàn)張H100GPU訓(xùn)練而成,推理專項(xiàng)訓(xùn)練量較Grok2暴增100倍,可用于黑洞模擬、游戲開(kāi)發(fā)、商業(yè)決策模擬、生物醫(yī)藥研發(fā)、法律文書(shū)生成等場(chǎng)景。6.2.1國(guó)外的大模型產(chǎn)品GPT-52025年8月8日,OpenAI發(fā)布了最新一代大模型GPT-5。OpenAI首席執(zhí)行官奧特曼對(duì)GPT-5給出了極高評(píng)價(jià),稱其是“此前所有模型的巨大飛躍”。GPT-5最核心的亮點(diǎn)是,它并非單一的語(yǔ)言或者推理模型,而是整合了GPT系列(大語(yǔ)言模型)和o系列(推理模型),具備調(diào)度子模型的能力,這意味著用戶在使用時(shí)不再需要手動(dòng)切換各類不同的模型。據(jù)OpenAI公開(kāi)的測(cè)試數(shù)據(jù),GPT-5在數(shù)學(xué)、編程、視覺(jué)感知和健康等領(lǐng)域,都表現(xiàn)出了頂尖性能,全部大幅度超越前代,成為目前最強(qiáng)大模型。6.2.2國(guó)內(nèi)的大模型產(chǎn)品大模型圖標(biāo)指標(biāo)排名DeepSeek

能力測(cè)評(píng)第一豆包

用戶數(shù)量第一Kimi

文本處理第一即夢(mèng)AI

作圖能力第一通義萬(wàn)相

視頻生成第一智譜清言

文檔歸納第一2025年1月國(guó)內(nèi)大模型排行榜6.2.2國(guó)內(nèi)的大模型產(chǎn)品DeepSeek(深度求索)2024年12月26日,杭州一家名為“深度求索”(DeepSeek)的中國(guó)初創(chuàng)公司,發(fā)布了全新一代大模型DeepSeek-V3。在多個(gè)基準(zhǔn)測(cè)試中,DeepSeek-V3的性能均超越了其他開(kāi)源模型,甚至與頂尖的閉源大模型GPT-4o不相上下,尤其在數(shù)學(xué)推理上,DeepSeek-V3更是遙遙領(lǐng)先。DeepSeek-V3以多項(xiàng)開(kāi)創(chuàng)性技術(shù),大幅提升了模型的性能和訓(xùn)練效率。DeepSeek-V3在性能比肩GPT-4o的同時(shí),研發(fā)卻只花了558萬(wàn)美元,訓(xùn)練成本不到后者的二十分之一。因?yàn)楸憩F(xiàn)太過(guò)優(yōu)越,DeepSeek在硅谷被譽(yù)為“來(lái)自東方的神秘力量”。2025年1月20日,DeepSeek-R1正式發(fā)布,擁有卓越的性能,在數(shù)學(xué)、代碼和推理任務(wù)上可與OpenAIo1媲美。DeepSeek創(chuàng)始人梁文峰通義千問(wèn)通義千問(wèn)是阿里云推出的一個(gè)超大規(guī)模的語(yǔ)言模型,它具備多輪對(duì)話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語(yǔ)言支持的能力。通義千問(wèn)這個(gè)名字有“通義”和“千問(wèn)”兩層含義,“通義”表示這個(gè)模型能夠理解各種語(yǔ)言的含義,“千問(wèn)”則表示這個(gè)模型能夠回答各種問(wèn)題。通義千問(wèn)基于深度學(xué)習(xí)技術(shù),通過(guò)對(duì)大量文本數(shù)據(jù)進(jìn)行訓(xùn)練,從而具備了強(qiáng)大的語(yǔ)言理解和生成能力。它能夠理解自然語(yǔ)言,并能夠生成自然語(yǔ)言文本同時(shí),通義千問(wèn)還具備多模態(tài)理解能力,能夠處理圖像、音頻等多種類型的數(shù)據(jù)。通義千問(wèn)的應(yīng)用范圍非常廣泛,可以應(yīng)用于智能客服、智能家居、移動(dòng)應(yīng)用等多個(gè)領(lǐng)域。它可以與用戶進(jìn)行自然語(yǔ)言交互,幫助用戶解決各種問(wèn)題,提供相關(guān)的知識(shí)和信息。同時(shí),通義千問(wèn)還可以與各種設(shè)備和應(yīng)用進(jìn)行集成,為用戶提供更加便捷的服務(wù)6.2.2國(guó)內(nèi)的大模型產(chǎn)品6.2.2國(guó)內(nèi)的大模型產(chǎn)品字節(jié)跳動(dòng)豆包豆包是字節(jié)跳動(dòng)基于云雀模型開(kāi)發(fā)的AI,能理解你的需求并生成高質(zhì)量回應(yīng)。它知識(shí)儲(chǔ)備豐富,涵蓋歷史、科學(xué)、技術(shù)等眾多領(lǐng)域,無(wú)論是日常問(wèn)題咨詢,還是深入學(xué)術(shù)探討,都能提供準(zhǔn)確全面的信息。同時(shí),具備出色的文本創(chuàng)作能力,能撰寫(xiě)故事、詩(shī)歌、文案等各類體裁。并且擅長(zhǎng)語(yǔ)言交互,交流自然流暢,就像身邊的知心伙伴,耐心傾聽(tīng)并給予恰當(dāng)反饋。KimiKimi是月之暗面科技2023年推出的AI助手,可處理200萬(wàn)字超長(zhǎng)文本,支持多格式文件解讀、互聯(lián)網(wǎng)信息搜索整合、多語(yǔ)言對(duì)話等,能用于辦公、學(xué)習(xí)、創(chuàng)作等場(chǎng)景,有網(wǎng)頁(yè)版、APP、微信小程序等使用方式文心一言文心一言是由百度研發(fā)的知識(shí)增強(qiáng)大模型,能夠與人對(duì)話互動(dòng)、回答問(wèn)題、協(xié)助創(chuàng)作,高效便捷地幫助人們獲取信息、知識(shí)和靈感文心一言基于飛槳深度學(xué)習(xí)平臺(tái)和文心知識(shí)增強(qiáng)大模型,持續(xù)從海量數(shù)據(jù)和大規(guī)模知識(shí)中融合學(xué)習(xí),具備知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)的技術(shù)特色文心一言具有廣泛的應(yīng)用場(chǎng)景,例如智能客服、智能家居、移動(dòng)應(yīng)用等領(lǐng)域。它可以與用戶進(jìn)行自然語(yǔ)言交互,幫助用戶解決各種問(wèn)題,提供相關(guān)的知識(shí)和信息文心一言還可以與各種設(shè)備和應(yīng)用進(jìn)行集成,例如智能音箱、手機(jī)APP等,為用戶提供更加便捷的服務(wù)。文心一言在深度學(xué)習(xí)領(lǐng)域有著重要的地位,它代表了人工智能技術(shù)的前沿水平,是百度在人工智能領(lǐng)域持續(xù)投入和創(chuàng)新的成果。文心一言的推出,不僅將為用戶提供更加智能化和高效的服務(wù),也將為人工智能行業(yè)的發(fā)展注入新的動(dòng)力6.2.2國(guó)內(nèi)的大模型產(chǎn)品訊飛星火認(rèn)知大模型訊飛星火認(rèn)知大模型是科大訊飛發(fā)布的一款強(qiáng)大的人工智能模型。它具有多種核心能力,包括文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力以及多模態(tài)能力。這些能力使得訊飛星火認(rèn)知大模型能夠處理各種復(fù)雜的語(yǔ)言任務(wù),并為用戶提供準(zhǔn)確、高效的服務(wù)訊飛星火認(rèn)知大模型采用了先進(jìn)的技術(shù)和算法,能夠快速地處理大量的數(shù)據(jù),并從中提取有用的信息。這使得它能夠更好地理解和處理復(fù)雜的語(yǔ)言信息,提高人機(jī)交互的效率和準(zhǔn)確性數(shù)據(jù)收集和處理訊飛星火認(rèn)知大模型已經(jīng)被廣泛應(yīng)用于多個(gè)領(lǐng)域,如自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、智能客服等。通過(guò)與各領(lǐng)域的專業(yè)知識(shí)和經(jīng)驗(yàn)相結(jié)合,訊飛星火認(rèn)知大模型能夠提供更加精準(zhǔn)和個(gè)性化的服務(wù),提高各行各業(yè)的工作效率和質(zhì)量應(yīng)用6.2.2國(guó)內(nèi)的大模型產(chǎn)品訊飛星火認(rèn)知大模型訊飛星火認(rèn)知大模型還注重可解釋性和公平性。通過(guò)改進(jìn)算法和技術(shù),它能夠提供更加清晰和準(zhǔn)確的決策依據(jù),減少偏見(jiàn)和不公平現(xiàn)象。同時(shí),它還具備強(qiáng)大的自適應(yīng)學(xué)習(xí)能力,能夠不斷適應(yīng)新的任務(wù)和環(huán)境,提高自身的性能和表現(xiàn)6.2.2國(guó)內(nèi)的大模型產(chǎn)品騰訊混元大模型騰訊混元大模型是由騰訊全鏈路自研的通用大語(yǔ)言模型,具備強(qiáng)大的中文創(chuàng)作能力、復(fù)雜語(yǔ)境下的邏輯推理能力以及可靠的任務(wù)執(zhí)行能力具備上下文理解和長(zhǎng)文記憶能力,流暢完成各專業(yè)領(lǐng)域的多輪問(wèn)答01支持文學(xué)創(chuàng)作、文本概要和角色扮演02準(zhǔn)確理解用戶意圖,基于輸入數(shù)據(jù)或信息進(jìn)行推理、分析03有效解決事實(shí)性、時(shí)效性問(wèn)題,提升內(nèi)容生成效果04多輪對(duì)話內(nèi)容創(chuàng)作邏輯推理知識(shí)增強(qiáng)6.2.2國(guó)內(nèi)的大模型產(chǎn)品華為盤古大模型華為盤古大模型是華為云推出的一個(gè)大語(yǔ)言模型,旨在提供更加智能化、高效化的語(yǔ)言交互體驗(yàn)。它基于深度學(xué)習(xí)技術(shù),通過(guò)對(duì)大量文本數(shù)據(jù)進(jìn)行訓(xùn)練,從而具備了強(qiáng)大的語(yǔ)言理解和生成能力。華為盤古大模型采用了先進(jìn)的架構(gòu)和技術(shù),包括Transformer、BERT等模型架構(gòu)以及注意力機(jī)制、自注意力機(jī)制等先進(jìn)的神經(jīng)網(wǎng)絡(luò)技術(shù)它還采用了多模態(tài)學(xué)習(xí)技術(shù),能夠處理文本、圖像、音頻等多種類型的數(shù)據(jù)。這使得它能夠更好地理解和處理復(fù)雜的語(yǔ)言信息,提高人機(jī)交互的效率和準(zhǔn)確性華為盤古大模型的應(yīng)用范圍非常廣泛,可以應(yīng)用于智能客服、智能家居、移動(dòng)應(yīng)用等多個(gè)領(lǐng)域。它可以與用戶進(jìn)行自然語(yǔ)言交互,幫助用戶解決各種問(wèn)題,提供相關(guān)的知識(shí)和信息。同時(shí),它還可以與各種設(shè)備和應(yīng)用進(jìn)行集成,為用戶提供更加便捷的服務(wù)6.2.2國(guó)內(nèi)的大模型產(chǎn)品6.2.3中美兩國(guó)在大模型領(lǐng)域的競(jìng)爭(zhēng)美國(guó)處于領(lǐng)先優(yōu)勢(shì),并遏制中國(guó)發(fā)展。大模型的多項(xiàng)關(guān)鍵技術(shù),比如Transformer架構(gòu)、強(qiáng)化學(xué)習(xí)從人類反饋(RLHF)等,多源于美國(guó)實(shí)驗(yàn)室。GPU是大模型訓(xùn)練最重要的硬件設(shè)施,大模型的出現(xiàn),就是堆疊大量GPU算力以后“大力出奇跡”的結(jié)果。而美國(guó)在GPU制造領(lǐng)域,擁有著顯著的壟斷優(yōu)勢(shì)01中國(guó)正在加速追趕,努力突破美國(guó)封鎖。我國(guó)GPU近年來(lái)取得顯著進(jìn)展,華為、景嘉微、沐曦、摩爾線程等企業(yè)不斷發(fā)力,已實(shí)現(xiàn)國(guó)產(chǎn)替代的重要突破,可滿足部分對(duì)圖形處理有較高要求的應(yīng)用場(chǎng)景0203大模型的基本原理Partthree大模型是基于Transformer架構(gòu)的,這種架構(gòu)是一種專門用于自然語(yǔ)言處理的“編碼-解碼器”架構(gòu)。在訓(xùn)練過(guò)程中,大模型將輸入的單詞以向量的形式傳遞給神經(jīng)網(wǎng)絡(luò),然后通過(guò)網(wǎng)絡(luò)的編碼解碼以及自注意力機(jī)制,建立起每個(gè)單詞之間聯(lián)系的權(quán)重。大模型的核心能力在于將輸入的每句話中的每個(gè)單詞與已經(jīng)編碼在模型中的單詞進(jìn)行相關(guān)性的計(jì)算,并把相關(guān)性又編碼疊加在每個(gè)單詞中。這樣,大模型能夠更好地理解和生成自然文本,同時(shí)還能夠表現(xiàn)出一定的邏輯思維和推理能力大模型基于深度學(xué)習(xí)利用大量的數(shù)據(jù)和計(jì)算資源訓(xùn)練具有大量參數(shù)的神經(jīng)網(wǎng)絡(luò)模型不斷地調(diào)整模型參數(shù)模型能夠在各種任務(wù)中取得最佳表現(xiàn)6.3.1原理概述大模型的學(xué)習(xí)主要依賴于大量的文本數(shù)據(jù)。這些數(shù)據(jù)可以來(lái)自互聯(lián)網(wǎng)、書(shū)籍、文章等各種來(lái)源。通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行訓(xùn)練,大模型能夠?qū)W習(xí)到自然語(yǔ)言的統(tǒng)計(jì)規(guī)律和模式數(shù)據(jù)驅(qū)動(dòng)大模型通常使用深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò),尤其是Transformer結(jié)構(gòu)。這種結(jié)構(gòu)特別適合于處理序列數(shù)據(jù)(比如文本)。神經(jīng)網(wǎng)絡(luò)由多層的神經(jīng)元組成,每一層都會(huì)對(duì)數(shù)據(jù)進(jìn)行一定的轉(zhuǎn)換和處理神經(jīng)網(wǎng)絡(luò)在Transformer架構(gòu)中,編碼器和解碼器是兩個(gè)核心組件。編碼器負(fù)責(zé)將輸入的文本轉(zhuǎn)換為一種內(nèi)部表示,而解碼器則負(fù)責(zé)將這種內(nèi)部表示轉(zhuǎn)換回文本編碼-解碼過(guò)程這是Transformer的一個(gè)關(guān)鍵特性,允許模型在處理文本時(shí)考慮到每個(gè)單詞與其他單詞的關(guān)系。通過(guò)計(jì)算每個(gè)單詞與其他所有單詞的關(guān)聯(lián)度,模型能夠捕捉到文本中的復(fù)雜依賴關(guān)系自注意力機(jī)制大模型的訓(xùn)練通常使用梯度下降等優(yōu)化算法。在訓(xùn)練過(guò)程中,模型會(huì)不斷地調(diào)整其內(nèi)部的參數(shù),以最小化預(yù)測(cè)結(jié)果與實(shí)際結(jié)果之間的差異訓(xùn)練和優(yōu)化一旦訓(xùn)練完成,大模型就能夠?qū)π碌摹⑽匆?jiàn)過(guò)的文本進(jìn)行理解和生成。這種能力使得大模型在各種自然語(yǔ)言處理任務(wù)中表現(xiàn)出色,如機(jī)器翻譯、文本摘要、問(wèn)答系統(tǒng)等泛化能力6.3.1原理概述6.3.2大模型訓(xùn)練的實(shí)例演示“廈門大學(xué)是一所具有光榮傳統(tǒng)的大學(xué)”會(huì)被切分成8個(gè)Token,即“廈門”、“大學(xué)”、“是”、“一所”、“具有”、“光榮”、“傳統(tǒng)”、“的”、“大學(xué)”。大模型是無(wú)法識(shí)別文本類型的數(shù)據(jù)的,它只能識(shí)別數(shù)值型數(shù)據(jù)(比如1,2,3,0.3,0.9等)。因此,需要采用“詞向量化”技術(shù)把單詞轉(zhuǎn)化為向量。一維向量[2],二維向量[0.1,8],三維向量[2,0.4,9]“廈門”被轉(zhuǎn)化成向量[0.3,8,2.5],“大學(xué)”被轉(zhuǎn)化成向量[2,1.3,7]。這種轉(zhuǎn)化的數(shù)學(xué)本質(zhì)就是,把每個(gè)單詞都映射到一個(gè)三維數(shù)學(xué)空間中目前的主流大模型中,每個(gè)Token都是被映射到1000維以上的高維空間中6.3.2大模型訓(xùn)練的實(shí)例演示04大模型的特點(diǎn)Partfour(1)巨大的規(guī)模大模型通常包含數(shù)十億個(gè)參數(shù),模型大小可以達(dá)到數(shù)百GB甚至更大。這種巨大的規(guī)模不僅提供了強(qiáng)大的表達(dá)能力和學(xué)習(xí)能力,還使得大模型在處理復(fù)雜任務(wù)時(shí)具有更高的效率和準(zhǔn)確性6.4大模型的特點(diǎn)(2)涌現(xiàn)能力涌現(xiàn)能力是指模型在訓(xùn)練過(guò)程中突然展現(xiàn)出之前小模型所沒(méi)有的、更深層次的復(fù)雜特性和能力。當(dāng)模型的訓(xùn)練數(shù)據(jù)突破一定規(guī)模時(shí),模型能夠綜合分析和解決更深層次的問(wèn)題,展現(xiàn)出類似人類的思維和智能。這種涌現(xiàn)能力是大模型最顯著的特點(diǎn)之一,也是其超越傳統(tǒng)模型的關(guān)鍵所在大模型的涌現(xiàn)能力源于其巨大的規(guī)模和復(fù)雜的結(jié)構(gòu)。這些模型包含數(shù)億甚至數(shù)十億個(gè)參數(shù),能夠捕捉到數(shù)據(jù)中的復(fù)雜模式和關(guān)系。在訓(xùn)練過(guò)程中,大模型通過(guò)不斷優(yōu)化參數(shù),逐漸形成了一種高度協(xié)調(diào)和自適應(yīng)的結(jié)構(gòu),從而產(chǎn)生了意想不到的特性和能力。這種涌現(xiàn)能力使得大模型在處理復(fù)雜任務(wù)時(shí)具有更高的效率和準(zhǔn)確性。它們能夠更好地理解和模擬現(xiàn)實(shí)世界中的各種復(fù)雜現(xiàn)象,并從中提取出更深層次的知識(shí)和規(guī)律。這種能力使得大模型在自然語(yǔ)言處理、圖像識(shí)別、語(yǔ)音識(shí)別等領(lǐng)域中展現(xiàn)出了卓越的性能6.4大模型的特點(diǎn)(3)更好的性能和泛化能力大模型因其巨大的規(guī)模和復(fù)雜的結(jié)構(gòu),展現(xiàn)出更出色的性能和泛化能力。它們?cè)诟鞣N任務(wù)上都能表現(xiàn)出色,超越了傳統(tǒng)的小模型。這主要?dú)w功于大模型的參數(shù)規(guī)模和學(xué)習(xí)能力。大模型能夠更好地理解和模擬現(xiàn)實(shí)世界中的復(fù)雜現(xiàn)象,從而在各種任務(wù)中表現(xiàn)出更高的準(zhǔn)確性和效率。它們能夠捕捉到數(shù)據(jù)中的微妙差異和復(fù)雜模式,使得在未見(jiàn)過(guò)的數(shù)據(jù)上也能表現(xiàn)優(yōu)秀,即具有良好的泛化能力(4)多任務(wù)學(xué)習(xí)大模型的多任務(wù)學(xué)習(xí)特點(diǎn)使其能夠同時(shí)處理多種不同的任務(wù),并從中學(xué)習(xí)到更廣泛和泛化的語(yǔ)言理解能力。通過(guò)多任務(wù)學(xué)習(xí),大模型可以在不同的NLP(NaturalLanguageProcessing)任務(wù)中進(jìn)行訓(xùn)練,例如機(jī)器翻譯、文本摘要、問(wèn)答系統(tǒng)等。這種多任務(wù)學(xué)習(xí)的方式有助于大模型更好地理解和應(yīng)用語(yǔ)言的規(guī)則和模式在多任務(wù)學(xué)習(xí)中,大模型可以共享參數(shù)和知識(shí),使其在不同的任務(wù)之間建立聯(lián)系,提高模型的泛化能力。通過(guò)多任務(wù)學(xué)習(xí),大模型能夠從多個(gè)領(lǐng)域的數(shù)據(jù)中學(xué)習(xí)知識(shí),并在不同領(lǐng)域中進(jìn)行應(yīng)用。這有助于促進(jìn)跨領(lǐng)域的創(chuàng)新,使得大模型在自然語(yǔ)言處理、圖像識(shí)別、語(yǔ)音識(shí)別等領(lǐng)域中展現(xiàn)出卓越的性能6.4大模型的特點(diǎn)(5)大數(shù)據(jù)訓(xùn)練大模型需要大規(guī)模的數(shù)據(jù)來(lái)訓(xùn)練,通常在TB級(jí)別甚至PB級(jí)別。這是因?yàn)榇竽P蛽碛袛?shù)億甚至數(shù)十億的參數(shù),需要大量的數(shù)據(jù)來(lái)提供足夠的信息供模型學(xué)習(xí)和優(yōu)化。只有大規(guī)模的數(shù)據(jù)才能讓大模型的參數(shù)規(guī)模發(fā)揮優(yōu)勢(shì),提高模型的泛化能力和性能。同時(shí),大數(shù)據(jù)訓(xùn)練也是保證大模型能夠處理復(fù)雜任務(wù)的關(guān)鍵。通過(guò)使用大規(guī)模數(shù)據(jù),大模型能夠更好地理解數(shù)據(jù)中的復(fù)雜模式和關(guān)系,從而更好地模擬現(xiàn)實(shí)世界中的各種現(xiàn)象(6)強(qiáng)大的計(jì)算資源大模型需要強(qiáng)大的計(jì)算資源來(lái)訓(xùn)練和運(yùn)行。由于模型規(guī)模龐大,參數(shù)數(shù)量眾多,計(jì)算復(fù)雜度極高,因此需要高性能的硬件設(shè)備來(lái)支持。通常,訓(xùn)練大模型需要使用GPU(GraphicsProcessingUnit,圖形處理器)或TPU(TensorProcessingUnit,張量處理器)等專用加速器來(lái)提高計(jì)算效率。這些加速器能夠并行處理大量的參數(shù)和數(shù)據(jù),使得大模型的訓(xùn)練和推斷速度更快。除了硬件設(shè)備,大模型的訓(xùn)練還需要大量的時(shí)間。由于模型參數(shù)眾多,訓(xùn)練過(guò)程中需要進(jìn)行大量的迭代和優(yōu)化,因此,訓(xùn)練周期可能長(zhǎng)達(dá)數(shù)周甚至數(shù)月6.4大模型的特點(diǎn)(7)遷移學(xué)習(xí)和預(yù)訓(xùn)練通過(guò)在大規(guī)模數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,大模型能夠?qū)W習(xí)到豐富的語(yǔ)言知識(shí)和模式,從而在各種任務(wù)上展現(xiàn)出卓越的性能。遷移學(xué)習(xí)和預(yù)訓(xùn)練有助于大模型更好地適應(yīng)特定任務(wù)在大規(guī)模數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練后,大模型可以在特定任務(wù)的數(shù)據(jù)上進(jìn)行微調(diào),從而更好地適應(yīng)目標(biāo)任務(wù)的特性和要求。這種微調(diào)過(guò)程可以幫助大模型更好地理解和處理目標(biāo)任務(wù)的特定問(wèn)題,進(jìn)一步提高模型的性能在特定任務(wù)的數(shù)據(jù)上進(jìn)行微調(diào)遷移學(xué)習(xí)和預(yù)訓(xùn)練也有助于大模型實(shí)現(xiàn)跨領(lǐng)域的應(yīng)用。通過(guò)在多個(gè)領(lǐng)域的數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,大模型可以學(xué)習(xí)到不同領(lǐng)域的知識(shí)和模式,并在不同領(lǐng)域中進(jìn)行應(yīng)用。這種跨領(lǐng)域的應(yīng)用能力,有助于大模型更好地服務(wù)于實(shí)際需求,推動(dòng)人工智能技術(shù)的創(chuàng)新和發(fā)展跨領(lǐng)域的應(yīng)用能力6.4大模型的特點(diǎn)(8)自監(jiān)督學(xué)習(xí)自監(jiān)督學(xué)習(xí)利用大規(guī)模未標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練,通過(guò)從數(shù)據(jù)中挖掘內(nèi)在的規(guī)律和模式,使模型能夠自動(dòng)地理解和預(yù)測(cè)數(shù)據(jù)中的信息。在大規(guī)模的未標(biāo)記數(shù)據(jù)中,大模型通過(guò)預(yù)測(cè)輸入數(shù)據(jù)的標(biāo)簽或下一個(gè)時(shí)刻的狀態(tài)來(lái)進(jìn)行訓(xùn)練。這種訓(xùn)練方式使得大模型能夠從大量的數(shù)據(jù)中自動(dòng)地學(xué)習(xí)到語(yǔ)言的內(nèi)在結(jié)構(gòu)和模式,而不需要人工標(biāo)注和干預(yù)自監(jiān)督學(xué)習(xí)使得大模型能夠更好地適應(yīng)大規(guī)模未標(biāo)記數(shù)據(jù)的處理,減少了對(duì)于人工標(biāo)注的依賴,提高了訓(xùn)練的效率和泛化能力。同時(shí),自監(jiān)督學(xué)習(xí)也使得大模型能夠更好地捕捉數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和模式,進(jìn)一步提高模型在處理復(fù)雜任務(wù)時(shí)的性能和準(zhǔn)確性6.4大模型的特點(diǎn)(9)領(lǐng)域知識(shí)融合大模型通過(guò)領(lǐng)域知識(shí)融合,能夠?qū)⒉煌I(lǐng)域的數(shù)據(jù)和知識(shí)融合在一起,從而更好地模擬現(xiàn)實(shí)世界中的復(fù)雜現(xiàn)象領(lǐng)域知識(shí)融合使得大模型能夠從多個(gè)領(lǐng)域中學(xué)習(xí)到廣泛的知識(shí)和模式,并將這些知識(shí)和模式整合到統(tǒng)一的框架中通過(guò)領(lǐng)域知識(shí)融合,大模型能夠更好地理解不同領(lǐng)域之間的聯(lián)系和共同規(guī)律,從而更好地處理復(fù)雜任務(wù)。這種能力有助于大模型在不同領(lǐng)域之間進(jìn)行知識(shí)遷移和應(yīng)用,促進(jìn)跨領(lǐng)域的創(chuàng)新和發(fā)展6.4大模型的特點(diǎn)(10)自動(dòng)化和效率大模型在應(yīng)用中展現(xiàn)出高度的自動(dòng)化和效率。由于大模型具有強(qiáng)大的表達(dá)能力和學(xué)習(xí)能力,它可以自動(dòng)化許多復(fù)雜的任務(wù),大大提高工作效率。大模型通過(guò)預(yù)訓(xùn)練和微調(diào)過(guò)程,能夠自動(dòng)地適應(yīng)特定任務(wù),而不需要過(guò)多的手工調(diào)整和干預(yù)。這使得大模型能夠快速地應(yīng)用于各種實(shí)際場(chǎng)景,并且自動(dòng)地處理復(fù)雜的任務(wù),如自動(dòng)編程、自動(dòng)翻譯、自動(dòng)摘要等大模型的自動(dòng)化和效率還體現(xiàn)在其對(duì)大規(guī)模數(shù)據(jù)的處理能力上。大模型能夠高效地處理TB級(jí)別甚至PB級(jí)別的數(shù)據(jù),從中自動(dòng)地提取出有用的信息和知識(shí)。這種高效的數(shù)據(jù)處理能力使得大模型在處理大規(guī)模數(shù)據(jù)時(shí)具有顯著的優(yōu)勢(shì),提高了數(shù)據(jù)處理和分析的效率6.4大模型的特點(diǎn)05大模型的分類Partfive語(yǔ)言大模型視覺(jué)大模型多模態(tài)大模型是指在自然語(yǔ)言處理(NaturalLanguageProcessing,NLP)領(lǐng)域中的一類大模型,通常用于處理文本數(shù)據(jù)和理解自然語(yǔ)言。這類大模型的主要特點(diǎn)是它們?cè)诖笠?guī)模語(yǔ)料庫(kù)上進(jìn)行了訓(xùn)練,以學(xué)習(xí)自然語(yǔ)言的各種語(yǔ)法、語(yǔ)義和語(yǔ)境規(guī)則。代表性產(chǎn)品包括GPT系列(OpenAI)、Bard(Google)、文心一言(百度)等是指在計(jì)算機(jī)視覺(jué)(ComputerVision,CV)領(lǐng)域中使用的大模型,通常用于圖像處理和分析。這類模型通過(guò)在大規(guī)模圖像數(shù)據(jù)上進(jìn)行訓(xùn)練,可以實(shí)現(xiàn)各種視覺(jué)任務(wù),如圖像分類、目標(biāo)檢測(cè)、圖像分割、姿態(tài)估計(jì)、人臉識(shí)別等。代表性產(chǎn)品包括VIT系列(Google)、文心UFO、華為盤古CV、INTERN(商湯)等是指能夠處理多種不同類型數(shù)據(jù)的大模型,例如文本、圖像、音頻等多模態(tài)數(shù)據(jù)。這類模型結(jié)合了NLP和CV的能力,以實(shí)現(xiàn)對(duì)多模態(tài)信息的綜合理解和分析,從而能夠更全面地理解和處理復(fù)雜的數(shù)據(jù)。代表性產(chǎn)品包括DingoDB多模向量數(shù)據(jù)庫(kù)(九章云極DataCanvas)、DALL-E(OpenAI)、悟空畫(huà)畫(huà)(華為)、midjourney等6.5.1按照輸入數(shù)據(jù)類型劃分按照應(yīng)用領(lǐng)域的不同,大模型主要可以分為L(zhǎng)0、L1、L2三個(gè)層級(jí)是指可以在多個(gè)領(lǐng)域和任務(wù)上通用的大模型。它們利用大算力、使用海量的開(kāi)放數(shù)據(jù)與具有巨量參數(shù)的深度學(xué)習(xí)算法,在大規(guī)模無(wú)標(biāo)注數(shù)據(jù)上進(jìn)行訓(xùn)練,以尋找特征并發(fā)現(xiàn)規(guī)律,進(jìn)而形成可“舉一反三”的強(qiáng)大泛化能力,可在不進(jìn)行微調(diào)或少量微調(diào)的情況下完成多場(chǎng)景任務(wù),相當(dāng)于AI完成了“通識(shí)教育”通用大模型L0是指那些針對(duì)特定行業(yè)或領(lǐng)域的大模型。它們通常使用行業(yè)相關(guān)的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練或微調(diào),以提高在該領(lǐng)域的性能和準(zhǔn)確度,相當(dāng)于AI成為“行業(yè)專家”行業(yè)大模型L1是指那些針對(duì)特定任務(wù)或場(chǎng)景的大模型。它們通常使用任務(wù)相關(guān)的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練或微調(diào),以提高在該任務(wù)上的性能和效果垂直大模型L26.5.2按照應(yīng)用領(lǐng)域劃分6.5.3大語(yǔ)言模型的分類大語(yǔ)言模型分為:通用大模型和推理大模型,二者不是彼此取代關(guān)系如果你需要完成數(shù)據(jù)分析、邏輯推理、代碼生成等邏輯性較強(qiáng)且較為復(fù)雜的任務(wù),請(qǐng)選擇推理大模型如果你面臨創(chuàng)意寫(xiě)作、文本生成、意圖識(shí)別等發(fā)散性較強(qiáng)且較為創(chuàng)意多樣的任務(wù),請(qǐng)選擇通用大模型特性推理大模型通用大模型適用場(chǎng)景復(fù)雜推理、解謎、數(shù)學(xué)、編碼難題文本生成、翻譯、摘要、基礎(chǔ)知識(shí)問(wèn)答復(fù)雜問(wèn)題解決能力優(yōu)秀,能進(jìn)行深度思考和邏輯推理一般,難以處理多步驟的復(fù)雜問(wèn)題運(yùn)算效率較低,推理時(shí)間較長(zhǎng),資源消耗大較高,響應(yīng)速度快,資源消耗相對(duì)較小幻覺(jué)風(fēng)險(xiǎn)較高,可能出現(xiàn)“過(guò)度思考”導(dǎo)致的錯(cuò)誤答案較低,更依賴于已知的知識(shí)和模式泛化能力更強(qiáng),能更好地適應(yīng)新問(wèn)題和未知場(chǎng)景相對(duì)較弱,更依賴于訓(xùn)練數(shù)據(jù)擅長(zhǎng)任務(wù)舉例解決復(fù)雜邏輯謎題,編寫(xiě)復(fù)雜算法,數(shù)學(xué)證明撰寫(xiě)新聞稿,翻譯文章,生成產(chǎn)品描述,回答常識(shí)問(wèn)題成本通常更高通常更低06大模型訓(xùn)練的硬件設(shè)施Partsix6.6大模型訓(xùn)練的硬件設(shè)施存儲(chǔ)設(shè)備大容量硬盤固態(tài)硬盤分布式存儲(chǔ)系統(tǒng)網(wǎng)絡(luò)設(shè)備高速網(wǎng)絡(luò)交換機(jī)光傳輸設(shè)備03服務(wù)器高性能服務(wù)器服務(wù)器集群02計(jì)算芯片GPU、TPU、ASIC010407大模型的成本Partseven大模型的成本涉及到多個(gè)方面,包括硬件設(shè)備、軟件許可、數(shù)據(jù)收集和處理、人力資源以及運(yùn)營(yíng)和維護(hù)等(1)硬件設(shè)備成本大模型的訓(xùn)練和推理需要大量的計(jì)算資源,包括高性能的計(jì)算機(jī)、服務(wù)器、存儲(chǔ)設(shè)備等。這些硬件設(shè)備的購(gòu)置和維護(hù)成本通常較高。為了滿足大模型的計(jì)算需求,需要購(gòu)買或租賃大量的服務(wù)器和存儲(chǔ)設(shè)備,并進(jìn)行相應(yīng)的硬件升級(jí)和維護(hù)GPT-3訓(xùn)練一次的成本約為140萬(wàn)美元,對(duì)于一些更大的大模型,訓(xùn)練成本更高,GPT-4的一次訓(xùn)練成本約為6300萬(wàn)美元。以ChatGPT在2023年1月的獨(dú)立訪客平均數(shù)1300萬(wàn)計(jì)算,其對(duì)應(yīng)芯片需求為3萬(wàn)多片英偉達(dá)A100GPU,初始投入成本約為8億美元,每日電費(fèi)在5萬(wàn)美元左右6.7大模型的成本軟件許可成本大模型的訓(xùn)練和推理通常需要使用特定的軟件和框架,如TensorFlow、PyTorch等。這些軟件通常需要購(gòu)買許可證或訂閱服務(wù),這也會(huì)增加大模型的訓(xùn)練成本數(shù)據(jù)收集和處理成本大模型的訓(xùn)練需要大量的標(biāo)記數(shù)據(jù)。數(shù)據(jù)的收集、清洗、標(biāo)注和處理都需要投入大量的人力、物力和時(shí)間成本。此外,為了確保數(shù)據(jù)的準(zhǔn)確性和有效性,還需要進(jìn)行數(shù)據(jù)驗(yàn)證和校驗(yàn),這也增加了數(shù)據(jù)處理的成本人力資源成本大模型的訓(xùn)練和推理需要專業(yè)的團(tuán)隊(duì)進(jìn)行維護(hù)和優(yōu)化。這包括數(shù)據(jù)科學(xué)家、機(jī)器學(xué)習(xí)工程師、運(yùn)維人員等。這些人員需要具備專業(yè)的技能和經(jīng)驗(yàn),因此,人力資源成本也是大模型成本的重要組成部分運(yùn)營(yíng)和維護(hù)成本大模型的運(yùn)營(yíng)和維護(hù)也需要投入成本。這包括模型的部署、監(jiān)控、調(diào)優(yōu)、更新等。為了確保模型的穩(wěn)定性和性能,需要進(jìn)行持續(xù)的維護(hù)和優(yōu)化,這也增加了運(yùn)營(yíng)和維護(hù)的成本6.7大模型的成本08大模型的應(yīng)用領(lǐng)域Parteight大模型的應(yīng)用領(lǐng)域非常廣泛,涵蓋了自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、推薦系統(tǒng)、醫(yī)療健康、金融風(fēng)控、工業(yè)制造、生物信息學(xué)、自動(dòng)駕駛、氣候研究等多個(gè)領(lǐng)域(1)自然語(yǔ)言處理大模型在自然語(yǔ)言處理領(lǐng)域具有重要的應(yīng)用,可以用于文本生成(如文章、小說(shuō)、新聞等的創(chuàng)作)、翻譯系統(tǒng)(能夠?qū)崿F(xiàn)高質(zhì)量的跨語(yǔ)言翻譯)、問(wèn)答系統(tǒng)(能夠回答用戶提出的問(wèn)題)、情感分析(用于判斷文本中的情感傾向)、語(yǔ)言生成(如聊天機(jī)器人)等(2)計(jì)算機(jī)視覺(jué)大模型在計(jì)算機(jī)視覺(jué)領(lǐng)域也有廣泛應(yīng)用,可以用于圖像分類(識(shí)別圖像中的物體和場(chǎng)景)、目標(biāo)檢測(cè)(能夠定位并識(shí)別圖像中的特定物體)、圖像生成(如風(fēng)格遷移、圖像超分辨率增強(qiáng))、人臉識(shí)別(用于安全驗(yàn)證和身份識(shí)別)、醫(yī)學(xué)影像分析(輔助醫(yī)生診斷疾病)等6.8大模型的應(yīng)用領(lǐng)域(3)語(yǔ)音識(shí)別大模型在語(yǔ)音識(shí)別領(lǐng)域也有應(yīng)用,如語(yǔ)音識(shí)別、語(yǔ)音合成等。通過(guò)學(xué)習(xí)大量的語(yǔ)音數(shù)據(jù),大模型可以實(shí)現(xiàn)高質(zhì)量的跨語(yǔ)言翻譯和語(yǔ)音識(shí)別以及生成自然語(yǔ)音(4)推薦系統(tǒng)大模型可以用于個(gè)性化推薦、廣告推薦等任務(wù)。通過(guò)分析用戶的歷史行為和興趣偏好,大模型可以為用戶提供個(gè)性化的推薦服務(wù),提高用戶滿意度和轉(zhuǎn)化率6.8大模型的應(yīng)用領(lǐng)域大模型可以用于自動(dòng)駕駛中的感知、決策等任務(wù)。通過(guò)學(xué)習(xí)大量的駕駛數(shù)據(jù),大模型可以實(shí)現(xiàn)對(duì)車輛周圍環(huán)境的感知和識(shí)別,以及進(jìn)行決策和控制,提高自動(dòng)駕駛的安全性和效率自動(dòng)駕駛大模型可以用于醫(yī)療影像診斷、疾病預(yù)測(cè)等任務(wù)。通過(guò)學(xué)習(xí)大量的醫(yī)學(xué)影像數(shù)據(jù),大模型可以輔助醫(yī)生進(jìn)行疾病診斷和治療方案制定,提高醫(yī)療水平和效率醫(yī)療健康大模型可以用于信用評(píng)估、欺詐檢測(cè)等任務(wù)。通過(guò)分析大量的金融數(shù)據(jù),大模型可以評(píng)估用戶的信用等級(jí)和風(fēng)險(xiǎn)水平,以及檢測(cè)欺詐行為,提高金融系統(tǒng)的安全性和穩(wěn)定性金融風(fēng)控6.8大模型的應(yīng)用領(lǐng)域工業(yè)制造大模型可以用于質(zhì)量控制、故障診斷等任務(wù)。通過(guò)學(xué)習(xí)大量的工業(yè)制造數(shù)據(jù),大模型可以輔助工程師進(jìn)行產(chǎn)品質(zhì)量控制和故障診斷,提高生產(chǎn)效率和產(chǎn)品質(zhì)量氣候研究在氣候研究領(lǐng)域,大模型可以處理氣象數(shù)據(jù),進(jìn)行天氣預(yù)測(cè)和氣候模擬。它們能夠分析復(fù)雜的氣象現(xiàn)象,提供準(zhǔn)確的氣象預(yù)報(bào),幫助人們做出應(yīng)對(duì)氣候變化的決策生物信息學(xué)在生物信息學(xué)領(lǐng)域,大模型可以用于基因序列分析(識(shí)別基因中的功能元件和變異位點(diǎn))、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)(推測(cè)蛋白質(zhì)的二級(jí)和三級(jí)結(jié)構(gòu))、藥物研發(fā)(預(yù)測(cè)分子與靶點(diǎn)的相互作用)等6.8大模型的應(yīng)用領(lǐng)域09大模型對(duì)人們工作和生活的影響Partnine提高工作效率大模型在自然語(yǔ)言處理、機(jī)器翻譯等領(lǐng)域的應(yīng)用,使得人們能夠快速、準(zhǔn)確地處理大量文本數(shù)據(jù),提高工作效率。例如,在翻譯領(lǐng)域,大模型能夠自動(dòng)翻譯多種語(yǔ)言,減少人工翻譯的時(shí)間和成本,提高翻譯效率優(yōu)化決策過(guò)程大模型能夠收集、整理和分析大量的數(shù)據(jù),通過(guò)數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù),幫助人們更準(zhǔn)確地了解問(wèn)題現(xiàn)狀,預(yù)測(cè)未來(lái)趨勢(shì),從而做出更明智的決策自動(dòng)化部分工作大模型的發(fā)展使得一些繁瑣、重復(fù)的工作可以由機(jī)器來(lái)完成,從而減輕了人們的工作負(fù)擔(dān)。例如,在金融領(lǐng)域,大模型可以自動(dòng)分析大量的金融數(shù)據(jù),幫助人們做出更準(zhǔn)確的決策創(chuàng)造新的就業(yè)機(jī)會(huì)隨著大模型的普及和應(yīng)用,將創(chuàng)造出許多新的就業(yè)機(jī)會(huì)。例如,需要更多的人來(lái)開(kāi)發(fā)和維護(hù)大模型,也需要更多的人來(lái)利用大模型進(jìn)行各種應(yīng)用開(kāi)發(fā)6.9.1

大模型對(duì)工作的影響大模型在智能家居、智能客服等領(lǐng)域的應(yīng)用,使得人們的生活更加便利、舒適。例如,通過(guò)智能家居系統(tǒng),人們可以通過(guò)語(yǔ)音指令控制家電,實(shí)現(xiàn)智能化生活改善生活質(zhì)量大模型在教育領(lǐng)域的應(yīng)用,可以幫助人們更高效地學(xué)習(xí)新知識(shí)。例如,通過(guò)大模型的智能推薦功能,人們可以根據(jù)自己的興趣和需求,獲取更加個(gè)性化的學(xué)習(xí)資源提高學(xué)習(xí)效率大模型在娛樂(lè)領(lǐng)域的應(yīng)用,可以提供更加豐富、多樣的娛樂(lè)體驗(yàn)。例如,通過(guò)大模型的語(yǔ)音識(shí)別功能,人們可以通過(guò)語(yǔ)音指令控制游戲,實(shí)現(xiàn)更加智能化的游戲體驗(yàn)增強(qiáng)娛樂(lè)體驗(yàn)6.9.2大模型對(duì)生活的影響10大模型的挑戰(zhàn)與未來(lái)發(fā)展Partten大模型在人工智能領(lǐng)域的應(yīng)用帶來(lái)了顯著的進(jìn)步和便利,但同時(shí)也面臨著一些挑戰(zhàn)可解釋性訓(xùn)練時(shí)間和數(shù)據(jù)量資源消耗數(shù)據(jù)隱私和安全模型泛化能力公平性和偏見(jiàn)大模型的挑戰(zhàn)6.10.1大模型的挑戰(zhàn)(1)資源消耗大模型通常需要大量的計(jì)算資源和存儲(chǔ)空間。訓(xùn)練大模型需要高性能的計(jì)算機(jī)集群以及大量的存儲(chǔ)空間,來(lái)存儲(chǔ)訓(xùn)練過(guò)程中的數(shù)據(jù)和模型參數(shù)。這使得大模型的訓(xùn)練和部署成本較高,限制了其在一些資源有限的環(huán)境中的應(yīng)用。此外,大模型訓(xùn)練和使用過(guò)程也帶來(lái)了大量水資源的消耗,以ChatGPT為例,一個(gè)用戶和ChatGPT聊天可能會(huì)消耗500毫升的水。大模型需要大量的計(jì)算能力和數(shù)據(jù)處理,這會(huì)涉及到龐大的機(jī)房、服務(wù)器和數(shù)據(jù)中心,而這些機(jī)房和服務(wù)器需要進(jìn)行冷卻來(lái)保持正常運(yùn)行,而冷卻又需要大量的水資源。這個(gè)過(guò)程中,水通過(guò)散熱器冷卻這些設(shè)備,帶走了設(shè)備工作時(shí)產(chǎn)生的熱量,以保證設(shè)備的正常運(yùn)行(2)訓(xùn)練時(shí)間和數(shù)據(jù)量大模型的訓(xùn)練需要大量的時(shí)間和數(shù)據(jù)。通常,訓(xùn)練一個(gè)大型神經(jīng)網(wǎng)絡(luò)需要數(shù)周甚至數(shù)月的時(shí)間,這取決于模型的復(fù)雜度、計(jì)算能力和可用數(shù)據(jù)量。此外,為了獲得更好的性能,大模型通常需要大量的標(biāo)記數(shù)據(jù)來(lái)訓(xùn)練。這不僅增加了訓(xùn)練成本,還限制了其在缺乏足夠數(shù)據(jù)的環(huán)境中的應(yīng)用6.10.1大模型的挑戰(zhàn)大模型的訓(xùn)練和使用,可能引入公平性和偏見(jiàn)問(wèn)題。如果訓(xùn)練數(shù)據(jù)中存在偏見(jiàn)或不公平因素,那么,模型的輸出也可能受到這些因素的影響。這可能導(dǎo)致不公平的決策或偏見(jiàn)的結(jié)果。因此,在大模型的訓(xùn)練和使用過(guò)程中,需要考慮公平性和偏見(jiàn)問(wèn)題,并采取相應(yīng)的措施來(lái)減少這些影響公平性和偏見(jiàn)大模型的復(fù)雜性和黑箱性質(zhì),使得其決策和預(yù)測(cè)的依據(jù)難以解釋。這使得在某些領(lǐng)域,如醫(yī)療、金融等,大模型的應(yīng)用受到限制。人們往往需要知道模型做出決策的原因,而不僅僅是結(jié)果。因此,提高大模型的可解釋性是一個(gè)重要的挑戰(zhàn)可解釋性在訓(xùn)練和使用大模型的過(guò)程中,需要處理大量的個(gè)人數(shù)據(jù)。如何保證數(shù)據(jù)的安全和隱私是一個(gè)重要的挑戰(zhàn)。一旦數(shù)據(jù)泄露或被濫用,將對(duì)個(gè)人隱私和企業(yè)聲譽(yù)造成嚴(yán)重?fù)p害。因此,在大模型的訓(xùn)練和使用過(guò)程中,需要采取嚴(yán)格的數(shù)據(jù)保護(hù)措施,確保數(shù)據(jù)的安全和隱私數(shù)據(jù)隱私和安全盡管大模型在特定任務(wù)上表現(xiàn)出色,但其泛化能力仍然是一個(gè)挑戰(zhàn)。在某些情況下,大模型可能過(guò)于復(fù)雜,導(dǎo)致過(guò)擬合,即過(guò)度擬合訓(xùn)練數(shù)據(jù),而無(wú)法泛化到新數(shù)據(jù)。此外,當(dāng)任務(wù)發(fā)生變化時(shí),大模型可能需要重新訓(xùn)練或調(diào)整參數(shù),這增加了其應(yīng)用和維護(hù)的成本模型泛化能力6.10.1大模型的挑戰(zhàn)大模型是個(gè)概率模型,用它生成的內(nèi)容具有不確定性。大模型幻覺(jué),用一種形象的說(shuō)法就是“大模型一本正經(jīng)的胡說(shuō)八道”,準(zhǔn)確地說(shuō),是指大模型生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)或用戶輸入不一致的現(xiàn)象。目前研究人員也在積極研究消除大模型幻覺(jué)的相關(guān)技術(shù),比如,檢索增強(qiáng)生成(Retrieval-augmentedGeneration),簡(jiǎn)稱RAG,就是當(dāng)下熱門的大模型前沿技術(shù)之一大模型幻覺(jué)6.10.1大模型的挑戰(zhàn)大模型將繼續(xù)在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等領(lǐng)域發(fā)揮重要作用。隨著數(shù)據(jù)量的不斷增加和計(jì)算能力的提升,大模型將能夠更好地理解和處理復(fù)雜的語(yǔ)言和圖像信息,提高人機(jī)交互的效率和準(zhǔn)確性大模型將在醫(yī)療、金融、教育等更多領(lǐng)域得到應(yīng)用。通過(guò)與各領(lǐng)域的專業(yè)知識(shí)和經(jīng)驗(yàn)相結(jié)合,大模型將能夠提供更加精準(zhǔn)和個(gè)性化的服務(wù),提高各行各業(yè)的工作效率和質(zhì)量隨著技術(shù)的不斷進(jìn)步,大模型將更加注重可解釋性和公平性。通過(guò)改進(jìn)算法和技術(shù),大模型將能夠提供更加清晰和準(zhǔn)確的決策依據(jù),減少偏見(jiàn)和不公平現(xiàn)象隨著云計(jì)算、邊緣計(jì)算等技術(shù)的發(fā)展,大模型的訓(xùn)練和推理將更加高效和便捷。這些技術(shù)將使得大模型能夠在更多設(shè)備上運(yùn)行,擴(kuò)展其應(yīng)用范圍隨著全球人工智能研究的不斷深入和發(fā)展,大模型將成為人工智能領(lǐng)域的重要基石。它將與其他技術(shù)相結(jié)合,推動(dòng)人工智能技術(shù)的不斷創(chuàng)新和發(fā)展04050301026.10.2大模型的未來(lái)發(fā)展11實(shí)驗(yàn)1:在自己本地計(jì)算機(jī)上部署大模型Parteleven6.11.1為什么需要本地部署大模型離線與高效使用定制化與靈活性數(shù)據(jù)隱私與安全性成本與資源優(yōu)化避免使用限制本地部署大模型6.11.2DeepSeekR1簡(jiǎn)介在DeepSeek出現(xiàn)之前,很多市場(chǎng)上的大模型產(chǎn)品都是“貴族”模型,“段位”很高,通常需要依賴高端的硬件,配置大量的GPU,普通個(gè)人計(jì)算機(jī)一般很難運(yùn)行大模型012025年1月20日,我國(guó)杭州深度求索公司的DeepSeekR1大模型正式發(fā)布,它是一個(gè)基于深度學(xué)習(xí)的推薦系統(tǒng)模型,通常用于處理推薦任務(wù),如商品推薦、內(nèi)容推薦等。DeepseekR1的發(fā)布,標(biāo)志著大模型產(chǎn)品的“平民”時(shí)代已經(jīng)到來(lái),它大大降低了對(duì)計(jì)算機(jī)硬件的要求,可以部署在普通的個(gè)人計(jì)算機(jī)上,甚至部署在手機(jī)等便攜式設(shè)備中02DeepSeekR1可以滿足用戶的數(shù)據(jù)隱私需求,本地部署能將所有數(shù)據(jù)運(yùn)算都限制在本地,數(shù)據(jù)不會(huì)上傳至云端,可有效避免數(shù)據(jù)傳輸和存儲(chǔ)在云端可能帶來(lái)的隱私泄露風(fēng)險(xiǎn),滿足用戶對(duì)數(shù)據(jù)安全和隱私保護(hù)的要求。DeepSeekR1還可以滿足定制需求,用戶可以根據(jù)自己的需求對(duì)模型進(jìn)行自定義知識(shí)庫(kù)訓(xùn)練,進(jìn)一步提升模型在特定領(lǐng)域的性能036.11.3在本地計(jì)算機(jī)部署DeepSeekR1安裝Ollama下載DeepSeekR1運(yùn)行DeepSeekR1使用OpenWebUI增強(qiáng)交互體驗(yàn)具體安裝過(guò)程請(qǐng)參考廈門大學(xué)數(shù)據(jù)庫(kù)實(shí)驗(yàn)室博客/blog/5816/大模型是人工智能領(lǐng)域的重要研究方向,其強(qiáng)大的語(yǔ)言理解和生成能力使得它在自然語(yǔ)言處理、機(jī)器翻譯、智能客服等領(lǐng)域有著廣泛的應(yīng)用。大模型的訓(xùn)練需要大量的數(shù)據(jù)和計(jì)算資源,同時(shí)也需要先進(jìn)的技術(shù)和算法支持。隨著技術(shù)的不斷發(fā)展,大模型的應(yīng)用場(chǎng)景也在不斷擴(kuò)展,未來(lái)將會(huì)更加廣泛地應(yīng)用于各個(gè)領(lǐng)域6.12

本章小結(jié)謝謝!林子雨副教授廈門大學(xué)人工智能通識(shí)——基礎(chǔ)、技術(shù)、前沿、倫理與實(shí)踐第7章智能體01智能體概述

目錄02智能體和人工智能的關(guān)系03智能體的關(guān)鍵特征04智能體的分級(jí)05智能體的分類06智能體的組成07智能體的工作原理08智能體的關(guān)鍵技術(shù)09典型的智能體產(chǎn)品10基于大模型的智能體11AIAgent和AgenticAI的關(guān)系12智能體的未來(lái)發(fā)展01智能體概述

Partone7.1.1什么是智能體智能體(AIAgent),又稱“人工智能代理”,是一種模仿人類智能行為的智能化系統(tǒng),它就像是擁有豐富經(jīng)驗(yàn)和知識(shí)的“智慧大腦”,能夠感知所處的環(huán)境,并依據(jù)感知結(jié)果,自主地進(jìn)行規(guī)劃、決策,進(jìn)而采取行動(dòng)以達(dá)成特定目標(biāo)。簡(jiǎn)單來(lái)說(shuō),智能體能夠根據(jù)外部輸入做出決策,并通過(guò)與環(huán)境的互動(dòng),不斷優(yōu)化自身行為。智能體非單純軟件或硬件,是寬泛概念,可為軟件程序、機(jī)器人或其他系統(tǒng),具自主性與智能性。特性:可自主感知、決策、行動(dòng),運(yùn)行于計(jì)算機(jī)或服務(wù)器,通過(guò)網(wǎng)絡(luò)交互,具靈活性與可擴(kuò)展性。舉例:智能推薦系統(tǒng)中能依用戶反饋和行為數(shù)據(jù)調(diào)整推薦策略。軟件形式智能體特性:常集成傳感器、處理器、執(zhí)行器等,可自主感知、決策并執(zhí)行物理動(dòng)作,具實(shí)體性與交互性。舉例:自動(dòng)駕駛汽車中可自主導(dǎo)航駕駛,提升交通安全性與效率。硬件形式智能體7.1.1什么是智能體軟件形式的智能體與傳統(tǒng)的軟件程序不同,傳統(tǒng)軟件程序通常是按照預(yù)先設(shè)定的規(guī)則和指令執(zhí)行任務(wù),而智能體則具備一定的自主性、適應(yīng)性、學(xué)習(xí)能力、智能行為和目標(biāo)導(dǎo)向。與傳統(tǒng)軟件相比,智能體的核心差異體現(xiàn)在以下幾個(gè)方面:智能體核心差異體現(xiàn)自主性01交互性增強(qiáng)06學(xué)習(xí)能力03適應(yīng)性02智能行為展現(xiàn)04目標(biāo)導(dǎo)向性057.1.2智能體的發(fā)展歷程總體而言,智能體的發(fā)展主要經(jīng)歷了以下階段:早期探索階段機(jī)器學(xué)習(xí)興起階段深度學(xué)習(xí)突破階段智能體爆發(fā)階段多智能體協(xié)作階段7.1.3智能體的應(yīng)用智能體在多個(gè)領(lǐng)域發(fā)揮著關(guān)鍵作用,以下是一些典型應(yīng)用場(chǎng)景:典型應(yīng)用場(chǎng)景01機(jī)器人技術(shù)①工業(yè)機(jī)器人②服務(wù)機(jī)器人07教育02智能交通①自動(dòng)駕駛汽車②交通管理系統(tǒng)06醫(yī)療領(lǐng)域①智能診斷系統(tǒng)②醫(yī)療機(jī)器人03游戲與娛樂(lè)①游戲AI②虛擬現(xiàn)實(shí)(VR)05金融領(lǐng)域①自動(dòng)交易系統(tǒng)②風(fēng)險(xiǎn)評(píng)估04智能家居①語(yǔ)音助手②智能設(shè)備7.1.4智能體的優(yōu)勢(shì)智能體的優(yōu)勢(shì)主要體現(xiàn)在以下三個(gè)方面:智能體處理數(shù)據(jù)和執(zhí)行任務(wù)高效,在數(shù)據(jù)分析領(lǐng)域,相比傳統(tǒng)人工方式,能憑借強(qiáng)大計(jì)算能力和高效算法,快速處理海量數(shù)據(jù),篩選關(guān)鍵信息,揭示潛在模式與趨勢(shì)。高效性智能體通過(guò)機(jī)器學(xué)習(xí)與算法優(yōu)化,提升決策和執(zhí)行準(zhǔn)確性,降低人為錯(cuò)誤風(fēng)險(xiǎn),在醫(yī)療診斷、工業(yè)生產(chǎn)質(zhì)量檢測(cè)等領(lǐng)域表現(xiàn)突出。準(zhǔn)確性智能體能根據(jù)環(huán)境變化和用戶反饋持續(xù)學(xué)習(xí)、調(diào)整策略,靈活應(yīng)對(duì)多樣場(chǎng)景與任務(wù)。如在智能交通管理中,實(shí)時(shí)調(diào)整信號(hào)燈時(shí)長(zhǎng);在智能家居中,深度學(xué)習(xí)用戶習(xí)慣調(diào)控設(shè)備。自適應(yīng)性02智能體和人工智能的關(guān)系Parttwo7.2智能體和人工智能的關(guān)系人工智能與智能體既關(guān)聯(lián)又獨(dú)立:旨在賦予機(jī)器類似人類的智能,如學(xué)習(xí)、推理等。它是寬泛領(lǐng)域,包含機(jī)器學(xué)習(xí)等多種技術(shù)與算法,應(yīng)用廣泛,涉及自動(dòng)駕駛等多方面,核心是模仿人類智能行為,實(shí)現(xiàn)可能依賴智能體運(yùn)作。人工智能能感知環(huán)境并通過(guò)行動(dòng)影響環(huán)境,有物理或虛擬形態(tài),有特定目標(biāo),通過(guò)決策達(dá)成,具備一定算計(jì)能力。雖可能基于人工智能構(gòu)建,但也可能是遵循規(guī)則的系統(tǒng),不必然依賴人工智能。智能體人工智能是智能體行為的技術(shù)支撐,智能體利用其技術(shù)提升能力,可視為人工智能的應(yīng)用實(shí)例,如語(yǔ)音識(shí)別技術(shù)、智能機(jī)器人等都是體現(xiàn)二者關(guān)系7.2智能體和人工智能的關(guān)系總體而言,人工智能是一個(gè)關(guān)注如何模擬和增強(qiáng)智能的技術(shù)領(lǐng)域;而智能體則是能夠感知并行動(dòng)的實(shí)體,它可以是人工智能的應(yīng)用實(shí)例,也可以獨(dú)立于人工智能技術(shù)而運(yùn)作。從交互、推理、調(diào)用、創(chuàng)新及組織等多個(gè)維度來(lái)看,人工智能與智能體之間存在著顯著的差異,具體如下:交互調(diào)用創(chuàng)新組織推理03智能體的關(guān)鍵特征Partthree7.3智能體的關(guān)鍵特征智能體的關(guān)鍵特征主要包括以下幾個(gè)方面:自主性感知能力決策能力執(zhí)行能力適應(yīng)能力目標(biāo)導(dǎo)向性交互性04智能體的分級(jí)Partfour7.4智能體的分級(jí)智能體劃分為6個(gè)級(jí)別,展現(xiàn)了智能體從簡(jiǎn)單規(guī)則執(zhí)行到完全自主學(xué)習(xí)和適應(yīng)的進(jìn)化路徑。每一層級(jí)都代表了AI能力的逐步增強(qiáng),同時(shí)也擴(kuò)展了其在實(shí)際應(yīng)用中的潛力。具體如下:L1L0無(wú)人工智能使用基于規(guī)則的人工智能L2基于模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的人工智能L4L3基于大語(yǔ)言模型的人工智能自主學(xué)習(xí)與泛化能力的智能體L5具有個(gè)性與協(xié)作行為的智能體7.4智能體的分級(jí)

下表給出了智能體的不同級(jí)別對(duì)比,對(duì)比維度包括技術(shù)手段、性能、能力、關(guān)鍵特性、應(yīng)用場(chǎng)景等。L0L1L2L3L4L5技術(shù)手段無(wú)AI,僅基于簡(jiǎn)單的規(guī)則和操作基于規(guī)則的AI與工具組合,完成簡(jiǎn)單的步驟序列通過(guò)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)驅(qū)動(dòng),帶有推理和決策能力基于大型語(yǔ)言模型(LLM),具備意圖、行動(dòng)、推理、決策、記憶與反思的能力基于LLM和工具,具備自我學(xué)習(xí)、泛化和推理能力,記憶與反思進(jìn)一步增強(qiáng)基于LLM與多智能體協(xié)作的AI,具備超越人類的推理、記憶、反思、自主學(xué)習(xí)和決策能力,情感、個(gè)性與協(xié)作能力也進(jìn)一步發(fā)展性能無(wú)AI,無(wú)法執(zhí)行智能行為等同于未具備技能的初級(jí)人類等同于具備50%技能的成年人等同于具備90%技能的成年人等同于99%技能的成年人,接近人類頂尖專家的水平超越100%技能的成年人,展現(xiàn)出超人類智能能力無(wú)AI能力,僅執(zhí)行預(yù)定義的規(guī)則和操作僅能執(zhí)行按照明確步驟設(shè)定的任務(wù)能夠在用戶定義的任務(wù)范圍內(nèi)進(jìn)行推理和執(zhí)行決策具備自動(dòng)化任務(wù)的戰(zhàn)略能力,可以通過(guò)工具自動(dòng)規(guī)劃任務(wù)并根據(jù)反饋調(diào)整執(zhí)行步驟能夠通過(guò)上下文感知,提供高度個(gè)性化的服務(wù),主動(dòng)滿足用戶需求具備真正的數(shù)字化人格,能夠在人類的角色中執(zhí)行任務(wù),確保安全與可靠性關(guān)鍵特性無(wú)智能行為,沒(méi)有自主決策能力,完全依賴于預(yù)定義的規(guī)則遵循預(yù)定義規(guī)則完成任務(wù),缺乏應(yīng)對(duì)變化的能力可以在特定的領(lǐng)域中,通過(guò)數(shù)據(jù)反饋進(jìn)行自動(dòng)調(diào)整和改進(jìn),但范圍有限在用戶定義的任務(wù)下,能夠自主完成復(fù)雜任務(wù),具備較強(qiáng)的推理能力和記憶能力具備深度理解和記憶功能,可以在復(fù)雜環(huán)境中提供最優(yōu)解決方案或服務(wù)AI能夠在復(fù)雜的社交環(huán)境中代表用戶完成任務(wù),并與他人交互應(yīng)用場(chǎng)景無(wú)使用語(yǔ)音助手來(lái)執(zhí)行特定指令(如打開(kāi)應(yīng)用或讀郵件)天氣查詢、簡(jiǎn)單的對(duì)話式AI,可以根據(jù)輸入完成預(yù)定任務(wù)AI能夠自主規(guī)劃并執(zhí)行任務(wù),例如通過(guò)多輪對(duì)話完成復(fù)雜的用戶需求個(gè)性化虛擬助手,能夠根據(jù)用戶需求主動(dòng)調(diào)整和優(yōu)化行為代替用戶進(jìn)行交互,安全且可靠地完成復(fù)雜任務(wù)05智能體的分類Partfive7.5智能體的分類根據(jù)功能、結(jié)構(gòu)和復(fù)雜性,智能體可以分為反應(yīng)式智能體、基于目標(biāo)的智能體、學(xué)習(xí)型智能體、多智能體系統(tǒng),下表給出了不同智能體類型的特點(diǎn)、優(yōu)點(diǎn)和實(shí)例。反應(yīng)式智能體基于目標(biāo)的智能體學(xué)習(xí)型智能體多智能體系統(tǒng)特性基于當(dāng)前環(huán)境狀態(tài)直接采取行動(dòng),無(wú)需歷史數(shù)據(jù)或記憶擁有明確的目標(biāo),通過(guò)推理和規(guī)劃尋找實(shí)現(xiàn)目標(biāo)的最佳路徑能夠通過(guò)經(jīng)驗(yàn)學(xué)習(xí),不斷優(yōu)化決策。常用技術(shù)包括監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等由多個(gè)智能體組成,智能體之間通過(guò)協(xié)作或競(jìng)爭(zhēng)完成任務(wù)優(yōu)點(diǎn)實(shí)現(xiàn)簡(jiǎn)單,響應(yīng)迅速能夠適應(yīng)更復(fù)雜的任務(wù)具備自我改進(jìn)能力,適應(yīng)動(dòng)態(tài)環(huán)境分布式架構(gòu),能夠處理復(fù)雜的任務(wù)缺點(diǎn)缺乏長(zhǎng)期規(guī)劃能力需要更復(fù)雜的算法支持訓(xùn)練可能需要大量數(shù)據(jù)和計(jì)算資源需要復(fù)雜的通信與協(xié)調(diào)機(jī)制實(shí)例自動(dòng)門、溫控器導(dǎo)航系統(tǒng)、物流機(jī)器人智能推薦系統(tǒng)、圍棋AI(如AlphaGo)無(wú)人機(jī)編隊(duì)、分布式交通信號(hào)控制06智能體的組成Partsix7.6智能體的組成智能體的核心組成部分主要包括以下幾個(gè)模塊:感知器學(xué)習(xí)模塊決策系統(tǒng)通信模塊執(zhí)行器07智能體的工作原理Partseven7.7智能體的工作原理智能體的工作原理主要包括感知、決策、執(zhí)行三個(gè)環(huán)節(jié):智能體可以通過(guò)學(xué)習(xí)和進(jìn)化不斷提高自己的性能和能力。學(xué)習(xí)進(jìn)化是智能體具有智能的重要體現(xiàn)。智能體通過(guò)執(zhí)行器對(duì)環(huán)境進(jìn)行干預(yù)和控制,執(zhí)行決策。執(zhí)行器可以包括電機(jī)、閥門、開(kāi)關(guān)等。智能體利用人工智能算法對(duì)感知到的環(huán)境信息進(jìn)行分析和處理,做出決策。人工智能算法可以包括機(jī)器學(xué)習(xí)算法、深度學(xué)習(xí)算法、強(qiáng)化學(xué)習(xí)算法等。智能體通過(guò)傳感器感知環(huán)境信息,包括物理信息、化學(xué)信息、生物信息等。傳感器可以將環(huán)境信息轉(zhuǎn)換為電信號(hào)或數(shù)字信號(hào),供智能體進(jìn)行分析和處理。感知環(huán)節(jié)決策環(huán)節(jié)執(zhí)行環(huán)節(jié)學(xué)習(xí)進(jìn)化08智能體的關(guān)鍵技術(shù)Parteight7.8智能體的關(guān)鍵技術(shù)智能體的核心技術(shù)主要包括人工智能、傳感器技術(shù)、通信技術(shù)、控制技術(shù)等,具體如下:1人工智能控制技術(shù)傳感器技術(shù)通信技術(shù)3427.8智能體的關(guān)鍵技術(shù)在一些特定應(yīng)用場(chǎng)景中,智能體還需要使用以下技術(shù):邊緣計(jì)算機(jī)器人技術(shù)區(qū)塊鏈技術(shù)09典型的智能體產(chǎn)品Partnine7.9典型的智能體產(chǎn)品這里介紹一些具有代表性的智能體產(chǎn)品及其應(yīng)用場(chǎng)景,涵蓋學(xué)術(shù)研究、商業(yè)應(yīng)用和前沿技術(shù)領(lǐng)域,體現(xiàn)了智能體技術(shù)的核心特點(diǎn)(如自主決策、協(xié)作與動(dòng)態(tài)適應(yīng)能力):虛擬助手與交互智能體3醫(yī)療與科研智能體5金融與交易智能體7多智能體協(xié)作平臺(tái)2工業(yè)與物流智能體4游戲與仿真環(huán)境智能體6視聽(tīng)智能體8自主機(jī)器人系統(tǒng)17.9典型的智能體產(chǎn)品自主機(jī)器人系統(tǒng)我國(guó)宇樹(shù)科技生產(chǎn)的人形機(jī)器人、四足機(jī)器人,通過(guò)強(qiáng)化學(xué)習(xí)和環(huán)境感知技術(shù),實(shí)現(xiàn)復(fù)雜地形下的動(dòng)態(tài)平衡與自主導(dǎo)航。例如,能完成跑酷、搬運(yùn)等任務(wù),還可應(yīng)用于工業(yè)巡檢或?yàn)?zāi)害救援場(chǎng)景,實(shí)時(shí)調(diào)整動(dòng)作策略以適應(yīng)環(huán)境變化。7.9典型的智能體產(chǎn)品多智能體協(xié)作平臺(tái)FilmAgent是由哈爾濱工業(yè)大學(xué)(深圳)與清華大學(xué)聯(lián)合開(kāi)發(fā)的基于多智能體協(xié)作框架的虛擬電影制作工具。它通過(guò)自動(dòng)化流程實(shí)現(xiàn)虛擬3D空間中的端到端電影制作,模擬傳統(tǒng)電影工作室的工作流程,涵蓋規(guī)劃、劇本創(chuàng)作和攝影三個(gè)階段。FilmAgent的核心在于多智能體協(xié)作,模擬了電影制作中的關(guān)鍵角色,如導(dǎo)演、編劇、演員和攝影師。通過(guò)智能體之間的協(xié)作,F(xiàn)ilmAgent能夠自動(dòng)生成劇本、規(guī)劃鏡頭,并在虛擬3D環(huán)境中執(zhí)行拍攝。7.9典型的智能體產(chǎn)品虛擬助手與交互智能體OpenAI的ChatGPT和GPT-4o基于多模態(tài)交互能力,實(shí)現(xiàn)動(dòng)態(tài)上下文理解與個(gè)性化對(duì)話。例如,GPT-4o支持實(shí)時(shí)語(yǔ)音、圖像輸入,通過(guò)連續(xù)學(xué)習(xí)優(yōu)化用戶交互體驗(yàn)。亞馬遜Alexa通過(guò)分布式智能體架構(gòu),可以協(xié)調(diào)智能家居設(shè)備,并根據(jù)用戶習(xí)慣自主調(diào)整家庭環(huán)境(如溫控、燈光)。7.9典型的智能體產(chǎn)品工業(yè)與物流智能體特斯拉Optimus(人形機(jī)器人)結(jié)合視覺(jué)感知與強(qiáng)化學(xué)習(xí),可以執(zhí)行工廠流水線任務(wù)。特斯拉的自動(dòng)駕駛系統(tǒng),通過(guò)多智能體協(xié)同(車輛、云端、交通網(wǎng)絡(luò)),可以實(shí)現(xiàn)復(fù)雜路況下的實(shí)時(shí)決策。西門子IndustrialAgents可以用在智能制造中,多個(gè)智能體動(dòng)態(tài)分配生產(chǎn)任務(wù)、預(yù)測(cè)設(shè)備故障,并優(yōu)化供應(yīng)鏈資源調(diào)度。7.9典型的智能體產(chǎn)品醫(yī)療與科研智能體IBMWatsonHealth可以整合患者數(shù)據(jù)、醫(yī)學(xué)文獻(xiàn)和臨床指南,輔助醫(yī)生生成個(gè)性化診療方案,通過(guò)多智能體推理減少誤診率。達(dá)芬奇手術(shù)機(jī)器人(IntuitiveSurgical)結(jié)合醫(yī)生操作與智能體自主校準(zhǔn)技術(shù),可以在微創(chuàng)手術(shù)中實(shí)時(shí)調(diào)整器械路徑,規(guī)避人體組織風(fēng)險(xiǎn)。7.9典型的智能體產(chǎn)品游戲與仿真環(huán)境智能體英偉達(dá)Omniverse可以構(gòu)建虛擬世界中的多智能體協(xié)作生態(tài),例如自動(dòng)駕駛仿真測(cè)試、數(shù)字孿生工廠,支持智能體在虛擬環(huán)境中試錯(cuò)與策略迭代。OpenAIDota2AI(OpenAIFive)通過(guò)5個(gè)智能體的協(xié)作與競(jìng)爭(zhēng)機(jī)制,在復(fù)雜MOBA游戲中擊敗人類職業(yè)戰(zhàn)隊(duì),展現(xiàn)了多智能體系統(tǒng)的戰(zhàn)略規(guī)劃能力。7.9典型的智能體產(chǎn)品金融與交易智能體摩根大通COiN(ContractIntelligence)利用多智能體系統(tǒng)分析合同條款、市場(chǎng)數(shù)據(jù)與風(fēng)險(xiǎn)模型,自動(dòng)化生成投資策略并實(shí)時(shí)監(jiān)控交易異常。高頻交易算法(如CitadelSecurities)則是基于強(qiáng)化學(xué)習(xí)的智能體集群,在毫秒級(jí)時(shí)間內(nèi)完成市場(chǎng)預(yù)測(cè)、訂單拆分與執(zhí)行優(yōu)化。7.9典型的智能體產(chǎn)品視聽(tīng)智能體字節(jié)跳動(dòng)在2024年10月10日發(fā)布了AI智能體耳機(jī)——OlaFriend,OlaFriend最大的亮點(diǎn)在于接入了字節(jié)跳動(dòng)旗下的豆包大模型,能與豆包App深度結(jié)合。在實(shí)際使用中,它能在多個(gè)場(chǎng)景為用戶提供幫助,比如充當(dāng)隨身百事通進(jìn)行信息查詢;成為英語(yǔ)陪練,不僅英語(yǔ)識(shí)別準(zhǔn)確率高,還能指出用戶表達(dá)中的語(yǔ)法錯(cuò)誤;擔(dān)當(dāng)旅行導(dǎo)游,為用戶規(guī)劃旅游出行方案;甚至還能進(jìn)行情感交流互動(dòng),給予陪伴。10基于大模型的智能體Partten7.10基于大模型的智能體基于大模型的智能體是指利用大語(yǔ)言模型(如GPT、BERT等)作為核心組件,構(gòu)建的能夠執(zhí)行特定任務(wù)、與環(huán)境交互并做出決策的人工智能系統(tǒng)。這些智能體具有自主性、交互性、適應(yīng)性等特點(diǎn),能夠模擬人類的認(rèn)知和決策過(guò)程,提供更加自然、高效和個(gè)性化的交互體驗(yàn)。它們能夠處理海量數(shù)據(jù),進(jìn)行高效的學(xué)習(xí)與推理,并展現(xiàn)出跨領(lǐng)域的應(yīng)用潛力。本節(jié)介紹國(guó)內(nèi)外典型的智能體產(chǎn)品,并介紹扣子智能體的搭建方法。國(guó)外的智能體產(chǎn)品國(guó)內(nèi)的智能體產(chǎn)品案例:扣子智能體搭建實(shí)戰(zhàn)7.10.1國(guó)外的智能體產(chǎn)品OpenAIOperator2025年1月23日,OpenAI發(fā)布了一個(gè)創(chuàng)新性的智能體——Operator,它是一個(gè)能夠像人類一樣使用計(jì)算機(jī)的智能體。Operator好比一個(gè)博士水平的個(gè)人助理,你給他一個(gè)復(fù)雜的任務(wù),它就會(huì)自動(dòng)執(zhí)行。Operator的主要功能包括自主完成諸如采購(gòu)雜貨、提交費(fèi)用報(bào)表、訂票、買日用品、填寫(xiě)表格等任務(wù),旨在通過(guò)自動(dòng)化操作提升日常生活和工作效率。它還可以一邊在StubHub搜索勇士隊(duì)比賽門票,一邊處理網(wǎng)球場(chǎng)預(yù)訂、尋找清潔服務(wù)和DoorDash訂餐,實(shí)現(xiàn)多任務(wù)并行處理。Operator的主要優(yōu)勢(shì)在于:多任務(wù)并行處理能力01隱私保護(hù)03細(xì)致的判斷力02高級(jí)推理與自我糾正能力047.10.1國(guó)外的智能體產(chǎn)品OpenAIDeepResearch2025年2月3日,OpenAI發(fā)布了一款新的智能體產(chǎn)品——DeepResearch。DeepResearch由OpenAIo3模型的一個(gè)版本提供支持,該模型針對(duì)網(wǎng)頁(yè)瀏覽和數(shù)據(jù)分析進(jìn)行了優(yōu)化,它利用推理來(lái)搜索、解釋和分析互聯(lián)網(wǎng)上的大量文本、圖像和PDF,并根據(jù)需要根據(jù)遇到的信息做出調(diào)整。DeepResearch具有以下四大核心技術(shù):會(huì)自動(dòng)24小時(shí)掃描全球知識(shí)庫(kù)。數(shù)據(jù)雷達(dá)能把零散的信息拼成完整的戰(zhàn)略地圖。知識(shí)拼圖發(fā)現(xiàn)矛盾時(shí),自動(dòng)回溯、驗(yàn)證,調(diào)整推理路徑。邏輯推理可以綜合各種知識(shí),生成完美的報(bào)告,還附帶文獻(xiàn)引用。學(xué)術(shù)裁縫7.10.1國(guó)外的智能體產(chǎn)品OpenAIDeepResearch作為OpenAI的下一代智能體,DeepResearch可以獨(dú)立為用戶工作。用戶給它一個(gè)提示,它將查找、分析和綜合數(shù)百個(gè)在線資源,以研究分析師的水平創(chuàng)建一份綜合報(bào)告。比如,用戶上傳汽車數(shù)據(jù),它在5分鐘內(nèi)就可以預(yù)測(cè)這輛汽車在未來(lái)10年內(nèi)的故障率;“金融小白”只要一句話,它就會(huì)自動(dòng)生成帶有風(fēng)險(xiǎn)模型的投資方案;建筑學(xué)生上傳一張圖紙,它就會(huì)自動(dòng)生成3D結(jié)構(gòu)力學(xué)分析??梢赃@么說(shuō),當(dāng)智能體變成了解決各種問(wèn)題的專家,人類真正的競(jìng)爭(zhēng)力,不再是知道多少答案,而是問(wèn)出多好的問(wèn)題。7.10.1國(guó)外的智能體產(chǎn)品OpenAIChatGPTAgent2025年7月18日,OpenAI重磅發(fā)布了ChatGPTAgent——一個(gè)可能改變我們工作方式的通用型AI智能體。這不再是簡(jiǎn)單的“問(wèn)答機(jī)器人”,而是一個(gè)能夠主動(dòng)思考、自主執(zhí)行任務(wù)的AI助手。ChatGPTAgent的出現(xiàn),不僅讓AI賽道的競(jìng)爭(zhēng)日趨激烈,更標(biāo)志著AI技術(shù)從信息供給向任務(wù)執(zhí)行階段跨越。ChatGPTAgent是一套融合Operator遠(yuǎn)程瀏覽器執(zhí)行能力、DeepResearch網(wǎng)絡(luò)信息整合技術(shù)以及ChatGPT對(duì)話優(yōu)勢(shì)的統(tǒng)一智能體平臺(tái),它能夠依據(jù)用戶給出的指令,進(jìn)行思考和行動(dòng),使用自己的虛擬計(jì)算機(jī)為您完成各種復(fù)雜任務(wù)。簡(jiǎn)單來(lái)說(shuō),ChatGPTAgent不像之前的ChatGPT那樣只會(huì)回答問(wèn)題,而是能像人一樣“思考著做事”。7.10.2國(guó)內(nèi)的智能體產(chǎn)品在國(guó)內(nèi),有多家企業(yè)和機(jī)構(gòu)推出了具有代表性的智能體平臺(tái),比如字節(jié)跳動(dòng)扣子(Coze)、百度文心智能體平臺(tái)AgentBuilder、騰訊元器、智譜清言、天工SkyAgents等,可以有效降低技術(shù)門檻,使普通用戶也能成為智能體開(kāi)發(fā)者,允許開(kāi)發(fā)者通過(guò)零代碼或低代碼的方式,利用自然語(yǔ)言交互快速創(chuàng)建智能體,實(shí)現(xiàn)聊天對(duì)話、內(nèi)容創(chuàng)作、圖像生成等多種功能。7.10.2國(guó)內(nèi)的智能體產(chǎn)品扣子扣子是新一代AI應(yīng)用開(kāi)發(fā)平臺(tái)。無(wú)論你是否有編程基礎(chǔ),都可以在扣子上快速搭建基于大模型的各類智能體,并將智能體發(fā)布到各個(gè)社交平臺(tái)、通訊軟件。借助扣子提供的可視化設(shè)計(jì)與編排工具,你可以通過(guò)零代碼或低代碼的方式,快速搭建出基于大模型的各類智能體,滿足個(gè)性化需求??圩泳哂幸韵聝?yōu)勢(shì):持久化的記憶能力豐富的數(shù)據(jù)源靈活的工作流設(shè)計(jì)無(wú)限拓展的能力集7.10.2國(guó)內(nèi)的智能體產(chǎn)品百度文心智能體百度文心智能體平臺(tái)AgentBuilder是基于文心大模型的智能體構(gòu)建平臺(tái),它允許開(kāi)發(fā)者通過(guò)簡(jiǎn)單的自然語(yǔ)言交互方式,快速創(chuàng)建智能體。這個(gè)平臺(tái)旨在降低技術(shù)門檻,讓更多人能夠參與智能體的開(kāi)發(fā)和應(yīng)用。通過(guò)文心智能體平臺(tái),開(kāi)發(fā)者可以根據(jù)自己的行業(yè)領(lǐng)域和應(yīng)用場(chǎng)景,利用多樣化的能力和工具,打造出適應(yīng)大模型時(shí)代的原生應(yīng)用。比如,可以在百度文心智能體平臺(tái)上開(kāi)發(fā)一個(gè)“小紅書(shū)文案創(chuàng)作智能體”,該智能體具備自動(dòng)生成文案、推薦熱門話題、分析文案效果等功能,用戶可以通過(guò)與智能體的對(duì)話,輕松獲取符合自己

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論