2025DeepSeek與AIGC應(yīng)用場(chǎng)景講義_第1頁(yè)
2025DeepSeek與AIGC應(yīng)用場(chǎng)景講義_第2頁(yè)
2025DeepSeek與AIGC應(yīng)用場(chǎng)景講義_第3頁(yè)
2025DeepSeek與AIGC應(yīng)用場(chǎng)景講義_第4頁(yè)
2025DeepSeek與AIGC應(yīng)用場(chǎng)景講義_第5頁(yè)
已閱讀5頁(yè),還剩93頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

DeepSeek與AIGC應(yīng)用2025年2月20日摘要

本次講座為DeepSeek原理和應(yīng)用系列研討的講座之一,主要介紹DeepSeek的基本概念,以及大模型技術(shù)和AIGC工具應(yīng)用,不需要大家具備專(zhuān)業(yè)的AI或IT技術(shù)背景。

本次講座首先分析當(dāng)前備受矚目的DeepSeek-R1

的概念、優(yōu)勢(shì)和歷史地位。然后進(jìn)一步探討大模型和AIGC的底層工作機(jī)制,旨在幫助讀者突破工具應(yīng)用的局限,理解

DeepSeek和AIGC的深層次價(jià)值。最后,介紹如何科學(xué)選擇與高效使用AI工具,為大家提供更具深度與實(shí)用性的應(yīng)用場(chǎng)景的指導(dǎo),給聽(tīng)眾帶來(lái)更落地的AI應(yīng)用價(jià)值。

盡管DeepSeek-R1以其低成本和開(kāi)源策略為行業(yè)帶來(lái)變革,但當(dāng)前網(wǎng)絡(luò)上的大量相關(guān)內(nèi)容僅停留在工具應(yīng)用層面,易對(duì)初級(jí)AI應(yīng)用人員造成概念和思維方式的誤導(dǎo),這也是本次講座希望解決的問(wèn)題。3詳解Deep

Seek

R1AIGC的能力揭秘AIGC的概念和應(yīng)用選擇AIGC工具目

錄詳解Deep

Seek-R

1PART

01簡(jiǎn)介本部分介紹了DeepSeek-R1模型的技術(shù)特性、發(fā)展歷程、應(yīng)用場(chǎng)景及其在AIGC領(lǐng)域的定位。首先介紹人工智能的發(fā)展歷程,以及大模型相關(guān)術(shù)語(yǔ),并對(duì)比DeepSeek-R1與其他模型的性能表現(xiàn)。DeepSeek-R1以其低成本、開(kāi)源策略和卓越的推理能力脫穎而出,尤其在復(fù)雜邏輯推理、數(shù)學(xué)和編程任務(wù)中表現(xiàn)優(yōu)異。隨后介紹DeepSeek公司的背景、市場(chǎng)定位以及DeepSeek-R1的技術(shù)原理和應(yīng)用場(chǎng)景,揭示了其在推理密集型任務(wù)、教育、科研、知識(shí)應(yīng)用和文檔分析等領(lǐng)域的獨(dú)特優(yōu)勢(shì),并列舉接入該模型的第三方應(yīng)用。通過(guò)對(duì)人工智能發(fā)展歷史以及DeepSeek-R1的介紹和分析,本部分旨在為聽(tīng)眾提供一個(gè)對(duì)DeepSeek的客觀、全面的認(rèn)識(shí),并理解該模型在AIGC領(lǐng)域的重要地位和應(yīng)用潛力。人工智能發(fā)展歷程2023年GPT-4AIGC的發(fā)展歷程1950s-1990S1990s-2010S2010s-2022年大模型相關(guān)術(shù)語(yǔ)多模態(tài)文本、圖片、音頻、視頻AI工具(國(guó)內(nèi))DeepSeek、豆包、Kimi、騰訊元寶、智譜清言、通義千問(wèn)、秘塔搜索、微信搜索...通用模型大語(yǔ)言模型(LLM,Large

Language

Model)視頻模型多模態(tài)模型……行業(yè)模型(垂直模型、垂類(lèi)模型)教育、醫(yī)療、金融等大模型的關(guān)鍵發(fā)展生成模型ref:中文大模型基準(zhǔn)測(cè)評(píng)2024年度報(bào)告(2025.01.08)推理模型生成模型與推理大模型的對(duì)比比較項(xiàng)GPT-4o(生成模型)DeepSeek-R1(推理模型)模型定位專(zhuān)注于通用自然語(yǔ)言處理和多模態(tài)能力,適合日常對(duì)話、內(nèi)容生成、翻譯以及圖文、音頻、視頻等信息處理、生成、對(duì)話等。側(cè)重于復(fù)雜推理與邏輯能力,擅長(zhǎng)數(shù)學(xué)、編程和自然語(yǔ)言推理任務(wù),適合高難度問(wèn)題求解和專(zhuān)業(yè)領(lǐng)域應(yīng)用,在中文表達(dá)上容易出彩。推理能力在日常語(yǔ)言任務(wù)中表現(xiàn)均衡,但在復(fù)雜邏輯推理(如數(shù)學(xué)題求解)上準(zhǔn)確率較低。在復(fù)雜推理任務(wù)表現(xiàn)卓越,尤其擅長(zhǎng)數(shù)學(xué)、代碼推理任務(wù),在部分基準(zhǔn)測(cè)試(如GPQA)中準(zhǔn)確率高于GPT-4o。多模態(tài)支持支持文本、圖像、音頻乃至視頻輸入,可處理多種模態(tài)信息。當(dāng)前主要支持文本輸入,不具備圖像處理等多模態(tài)能力。應(yīng)用場(chǎng)景適合廣泛通用任務(wù),如對(duì)話、內(nèi)容生成、多模態(tài)信息處理以及多種語(yǔ)言相互翻譯和交流;面向大眾市場(chǎng)和商業(yè)應(yīng)用。適合需要高精度推理和邏輯分析的專(zhuān)業(yè)任務(wù),如數(shù)學(xué)競(jìng)賽、編程問(wèn)題和科學(xué)研究;在思路清晰度要求高的場(chǎng)景具有明顯優(yōu)勢(shì),比如采訪大綱、方案梳理;在對(duì)中文語(yǔ)言表達(dá)和情感表達(dá)方面有明顯優(yōu)勢(shì)。用戶(hù)交互體驗(yàn)提供流暢的實(shí)時(shí)對(duì)話體驗(yàn),支持多種輸入模態(tài);用戶(hù)界面友好,適合大眾使用。可展示大部分鏈?zhǔn)剿伎歼^(guò)程,便于專(zhuān)業(yè)用戶(hù)理解推理過(guò)程;界面和使用體驗(yàn)具有較高的定制性,但整體交互節(jié)奏較慢。推理模型的優(yōu)劣勢(shì)優(yōu)勢(shì)劣勢(shì)-演繹或歸納等推理能力強(qiáng)(如謎題、數(shù)學(xué)證明)-響應(yīng)速度慢且計(jì)算成本高(需要更多推理時(shí)間)-鏈?zhǔn)剿季S推理出色(善于分解多步驟問(wèn)題)-基于知識(shí)的任務(wù)更容易出錯(cuò)(容易產(chǎn)生幻覺(jué))-擅長(zhǎng)復(fù)雜決策任務(wù)-處理簡(jiǎn)單任務(wù)的時(shí)候效率低(容易"過(guò)度思考")-可以呈現(xiàn)思考過(guò)程常見(jiàn)推理模型DeepSeekR1OpenAI

o1OpenAI

o3-miniGemini

2.0Grok3Kimi

1.5火爆全網(wǎng)的DeepSeek-R1爆火原因DeepSeek-R1的推理能力進(jìn)入了第一梯隊(duì)(媲美OpenAI

o1),但訓(xùn)練和推理成本低、速度快、全部開(kāi)源DeepSeek打破了硅谷傳統(tǒng)的“堆算力、拼資本”的大模型發(fā)展路徑對(duì)AI行業(yè)的重大影響DeepSeek-R1以低成本和開(kāi)源特性打破以往頭部企業(yè)巨頭割據(jù)局面DeepSeek-R1的API定價(jià)僅為行業(yè)均價(jià)的1/10,推動(dòng)了中小型企業(yè)低成本接入AI,對(duì)行業(yè)產(chǎn)生了積極影響DeepSeek-R1促使行業(yè)開(kāi)始從

“唯規(guī)模論”轉(zhuǎn)向更加注重

“性?xún)r(jià)比”和“高效能”方向010203打破壟斷價(jià)格下調(diào)推動(dòng)創(chuàng)新DeepSeek公司2025年1月20日推出DeepSeek-R1推理模型作為由知名私募巨頭幻方量化孕育而生的公司,DeepSeek獲得了強(qiáng)大的資金支持和行業(yè)影響力,幻方量化與九坤投資、明汯投資、靈均投資并稱(chēng)量化私募領(lǐng)域的“四大天王”,管理資金規(guī)模均超過(guò)600億元。這為DeepSeek提供了清晰的市場(chǎng)定位和投資者背景術(shù)推動(dòng)人工智能在多個(gè)領(lǐng)域的應(yīng)用和創(chuàng)新DeepSeek,全稱(chēng)杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技企業(yè),專(zhuān)注于人工智能基礎(chǔ)技術(shù)的研究與開(kāi)發(fā)公司成立背景與發(fā)展歷程大語(yǔ)言模型(LLM)

DeepSeek專(zhuān)注于開(kāi)發(fā)先進(jìn)的大語(yǔ)言模型(LLM)和相關(guān)技術(shù),旨在通過(guò)這些技的創(chuàng)新應(yīng)用投資者背景與市場(chǎng)定位里程碑DeepSeek產(chǎn)品信息官方渠道官網(wǎng):新聞:/zh-cn/news/news250120Github:/deepseek-ai/對(duì)話:DeepSeek模型系列DeepSeek最新的生成模型和推理模型版本對(duì)比比較方面生成模型(V3)推理模型(R1)設(shè)計(jì)初衷想要在各種自然語(yǔ)言處理的任務(wù)中都能表現(xiàn)好,更通用重點(diǎn)是為了搞定復(fù)雜的推理情況,比如深度的邏輯分析和解決問(wèn)題性能展現(xiàn)在數(shù)學(xué)題、多語(yǔ)言任務(wù)還有編碼任務(wù)里表現(xiàn)不錯(cuò),像Cmath能得90.7分,Human

Eval編碼任務(wù)通過(guò)率是65.2%在需要邏輯思考的測(cè)試?yán)锖馨?,比如DROP任務(wù)F1分?jǐn)?shù)能達(dá)到92.2%,AIME2024的通過(guò)率是79.8%應(yīng)用的范圍適合大規(guī)模的自然語(yǔ)言處理工作,像對(duì)話式AI、多語(yǔ)言翻譯還有內(nèi)容生成等等,能給企業(yè)提供高效的AI方案,滿足好多領(lǐng)域的需求適合學(xué)術(shù)研究、解決問(wèn)題的應(yīng)用和決策支持系統(tǒng)等需要深度推理的任務(wù),也能拿來(lái)當(dāng)教育工具,幫學(xué)生鍛煉邏輯思維DeepSeek-R1工作原理思維鏈(Chain

of

Thought)讓模型進(jìn)行慢思考蒸餾(Distillation)在不損失能力的情況下縮小模型強(qiáng)化學(xué)習(xí)(Reinforcement

Learning)讓模型自我探索和訓(xùn)練DeepSeek

R1論文:/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdfDeepSeek

R1論文圖解:/p/20844750193DeepSeek-R1版本模型名稱(chēng)DeepSeek-R1-671B滿血版,能力最強(qiáng)DeepSeek-R1-Distill-Qwen-7B蒸餾版,能力稍弱--實(shí)際上是增加了推理能力的Qwen或Llama模型DeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-14BDeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Llama-70B部署DeepSeek-R1滿血版的算力要求和性能DeepSeek-R1的優(yōu)勢(shì)理科能力強(qiáng),且準(zhǔn)確率高數(shù)學(xué)推理代碼生成復(fù)雜任務(wù)處理DeepSeek-R1的局限通用能力R1的通用能力(尤其是生成能力)低于DeepSeek-V3R1的幻覺(jué)仍舊比較明顯(可能源于R1的中文語(yǔ)言表達(dá)能力更強(qiáng))語(yǔ)言混雜R1在處理非中英文問(wèn)題時(shí),偶爾會(huì)出現(xiàn)語(yǔ)言混雜現(xiàn)象這個(gè)現(xiàn)象在R1

Zero版本中更加明顯提示詞工程使用few-shot提示可能會(huì)降低R1性能使用過(guò)多的過(guò)程指導(dǎo)指令可能會(huì)降低R1的推理能力DeepSeek-R1應(yīng)用場(chǎng)景推理密集型任務(wù)編程任務(wù)中的代碼生成、算法設(shè)計(jì),媲美Claude

3.5

Sonet數(shù)學(xué)問(wèn)題求解、科學(xué)推理和邏輯分析等需要復(fù)雜推理的場(chǎng)景。教育與知識(shí)應(yīng)用可用于解決教育領(lǐng)域的問(wèn)題,支持知識(shí)理解與解答??捎糜诳蒲腥蝿?wù)的實(shí)驗(yàn)設(shè)計(jì)、數(shù)據(jù)分析和論文撰寫(xiě)。文檔分析與長(zhǎng)上下文理解適合處理需要深入文檔分析和理解長(zhǎng)上下文的任務(wù),例如復(fù)雜信息提取與整合。開(kāi)放領(lǐng)域問(wèn)答與寫(xiě)作在內(nèi)容生成、問(wèn)題回答以及創(chuàng)造性寫(xiě)作中具有廣泛應(yīng)用,例如生成高質(zhì)量文本或進(jìn)行內(nèi)容編輯。如何使用DeepSeek

R1DeepSeek官方網(wǎng)站和官方app騰訊系騰訊元寶微信AI搜索騰訊ima個(gè)人知識(shí)庫(kù)AI搜索秘塔搜索納米AI搜索知乎直答其它接入DeepSeek-R1的產(chǎn)品Molly

R1(向量智能)問(wèn)小白接入DeepSeek

R1第三方服務(wù)的廠家互聯(lián)網(wǎng)大廠:騰訊:騰訊元寶、ima、微信、騰訊云百度:百度搜索、文小言字節(jié)跳動(dòng):豆包、扣子、飛書(shū)阿里:釘釘……互聯(lián)網(wǎng)小廠:科大訊飛、知乎、秘塔、納米AI搜索、……AI初創(chuàng)公司:零一萬(wàn)物、階躍星辰、minmax、……AI應(yīng)用公司(教育類(lèi)):學(xué)而思、北大青鳥(niǎo)、網(wǎng)易有道、猿輔導(dǎo)、作業(yè)幫、…...手機(jī)廠商:華為、榮耀、魅族、......其它云服務(wù)平臺(tái):三大運(yùn)營(yíng)商、云服務(wù)商(硅基流動(dòng)等)AIGC的概念和應(yīng)用PART

02簡(jiǎn)介本部分著重介紹人工智能生成內(nèi)容(AIGC)的定義、應(yīng)用范圍及其在各行業(yè)的實(shí)際影響:首先梳理AIGC相關(guān)的術(shù)語(yǔ),包括AI、AGI、生成式AI和決策式AI等,明確了其在人工智能領(lǐng)域的定位。隨后,詳細(xì)列舉AIGC在文本、圖像、音頻和視頻生成方面的多樣化應(yīng)用,并探討其在電商、新聞傳媒、影視、游戲、教育和金融等行業(yè)的具體實(shí)踐,展示AIGC在提升效率、降低成本和增強(qiáng)創(chuàng)新方面的核心價(jià)值。此外,還分析AIGC帶來(lái)的挑戰(zhàn),如數(shù)據(jù)隱私、倫理問(wèn)題、生成質(zhì)量控制以及對(duì)就業(yè)結(jié)構(gòu)的影響。通過(guò)深入探討AIGC的應(yīng)用現(xiàn)狀和未來(lái)趨勢(shì),本部分旨在幫助讀者全面理解AIGC的潛力和影響,為應(yīng)對(duì)技術(shù)變革提供參考。本部分的內(nèi)容參考了《人工智能通識(shí)課(微課版)》和相關(guān)的視頻(B站的思睿觀通)初識(shí)AIGC眼花繚亂的名詞眼花繚亂的名詞AI(人工智能)AGI(通用人工智能)(artificial

general

intelligence)決策式AIAIGCChatGPTAI

Generated

Content(人工智能生成內(nèi)容)生成式AIAIGC能干什么生成視頻生成音頻生成文本生成圖像生成內(nèi)容AI文本Perplexity知?直答秘塔AI搜索引擎納米AI搜索微信搜索(DeepSeek

R1、元寶)小紅書(shū)的筆記助手短視頻平臺(tái)的內(nèi)容創(chuàng)意自動(dòng)回復(fù)機(jī)器人企業(yè)微信的智能回復(fù)英國(guó)廣播公司(BBC)的Juicer彭博社的Cyborg新華社的快筆小新人民日?qǐng)?bào)的創(chuàng)作大腦第一財(cái)經(jīng)的DT稿王微軟“小冰”出版詩(shī)集AI撰寫(xiě)劇本電影《陽(yáng)春》百萬(wàn)字小說(shuō)《天命使徒》清華大學(xué)的《機(jī)憶之地》CursorWindsurfMarsCodeGitHub

Copilot阿里云通義靈碼新聞作品創(chuàng)作社交媒體代碼AI搜索AI繪畫(huà)太空歌劇院2022年8月,獲得比賽

“數(shù)字藝術(shù)/數(shù)字修飾照片”一等獎(jiǎng)AI繪畫(huà)AI繪畫(huà)新西湖繁勝全景圖全景圖是一副百米畫(huà)卷,再現(xiàn)了當(dāng)下西湖邊的景觀特色、生活場(chǎng)景,還有一些已經(jīng)消失的景觀,比如曾經(jīng)聞名遐邇的大佛寺。圖中包含5000個(gè)建筑,作者白小蘇說(shuō)如果這些建筑都要自己親手畫(huà),一天畫(huà)10個(gè)都要500天。最后他借助于AI技術(shù),在一年內(nèi)完成了作品AI音頻語(yǔ)音對(duì)話語(yǔ)音克隆創(chuàng)作音樂(lè)AI視頻千秋詩(shī)頌視頻特效視頻添加圖片AIGC的行業(yè)應(yīng)用AIGC的行業(yè)應(yīng)用各行各業(yè)...電商行業(yè)01其它行業(yè)(教育、金融...)06新聞傳媒03內(nèi)容廣告02影視行業(yè)04游戲行業(yè)05電商行業(yè)商品3D模型改善購(gòu)物體驗(yàn)AI模特產(chǎn)品拍攝降本增效虛擬主播提升直播帶貨效率內(nèi)容廣告全流程參與提高效率雪花啤酒虛擬偶像提升品牌宣傳效果錄音語(yǔ)音轉(zhuǎn)寫(xiě)智能新聞寫(xiě)作智能視頻剪輯應(yīng)用場(chǎng)景拓展應(yīng)用功能升級(jí)應(yīng)用形態(tài)完善采編環(huán)節(jié)傳播環(huán)節(jié)對(duì)傳媒機(jī)構(gòu)對(duì)媒體從業(yè)者對(duì)傳媒用戶(hù)大幅提高生產(chǎn)效率,并帶來(lái)新的視覺(jué)化、互動(dòng)化體驗(yàn);豐富了新聞報(bào)道的形式,推動(dòng)傳媒向智媒轉(zhuǎn)變將部分采編、播放工作自動(dòng)化,讓其更專(zhuān)注于思考創(chuàng)造如將精力集中于深度報(bào)道專(zhuān)題報(bào)道等更需發(fā)揮人類(lèi)精準(zhǔn)分析事物、妥善處理情感的領(lǐng)域;短時(shí)間獲得更多新聞,提高獲取及時(shí)性及便捷性;降低傳媒門(mén)檻,使得受眾可以參與內(nèi)容生產(chǎn),增強(qiáng)參與感AIGC對(duì)傳媒行業(yè)參與主體的影響新聞傳媒傳媒影視行業(yè)影視劇本文稿創(chuàng)作拓展角色范疇賦能影視剪輯拓展場(chǎng)景空間AIGC游戲研發(fā)環(huán)節(jié)作用游戲行業(yè)01體驗(yàn)02功能03角色04劇情05策略增強(qiáng)游戲體驗(yàn)特定風(fēng)格模擬:AI通過(guò)模仿職業(yè)選手,玩家則感覺(jué)像在與真實(shí)的職業(yè)選手對(duì)抗;玩法教學(xué):幫助玩家快速熟悉操作與游戲玩法,提高游戲可玩性。前期平衡性測(cè)試:充分模擬玩家在某套數(shù)值體系下的游戲體驗(yàn),提出優(yōu)化策略;游戲功能測(cè)試:針對(duì)性找出游戲交互的可能性,發(fā)現(xiàn)潛在漏洞輔助游戲策劃。游戲性能測(cè)試NPC角色生成AI創(chuàng)造不同的面孔、服飾、聲音甚至性格特征,甚至可同步驅(qū)動(dòng)嘴型、表情等面部變化,達(dá)到 高度逼真;并通過(guò)大量數(shù)據(jù)模擬人類(lèi)運(yùn)動(dòng),完成行走、跑步等一系列動(dòng)作反應(yīng)。AI智能NPC能夠分析玩家的實(shí)時(shí)輸入,與玩家動(dòng)態(tài)交互,構(gòu)建幾乎無(wú)限且不重復(fù)的劇情;AI能夠生產(chǎn)相關(guān)的圖文、音樂(lè)等,創(chuàng)造游戲素材,輔以劇情鋪排,提升劇情飽滿度。劇情生成游戲策略生成讓AI感知環(huán)境、自身狀態(tài)并基于特定目標(biāo)決定當(dāng)下需要執(zhí)行的動(dòng)作,基于特定問(wèn)題和場(chǎng)景,自主提出解決方案。游戲運(yùn)營(yíng)環(huán)節(jié)AI自動(dòng)化廣告投放:目前抖音等平臺(tái)的廣告分發(fā)、內(nèi)容推薦已通過(guò)算法實(shí)現(xiàn),且效果較高;生成廣告素材:素材主要是圖像及音視頻內(nèi)容,預(yù)計(jì)AIGC的加持下廣告素材生成會(huì)更高效、高質(zhì)量;玩家分類(lèi)提升體驗(yàn):通過(guò)不同玩家的數(shù)據(jù),將用戶(hù)細(xì)分類(lèi)型,為不同類(lèi)型玩家提供獨(dú)特的玩法,提高用戶(hù)體驗(yàn)。其他行業(yè)教育行業(yè)金融行業(yè)其它自動(dòng)批改作業(yè)和考試虛擬實(shí)驗(yàn)室生成學(xué)習(xí)資料翻譯文獻(xiàn)資料其它風(fēng)險(xiǎn)管理自動(dòng)處理和分析金融文檔合規(guī)管理AIGC的未來(lái)AIGC的核心價(jià)值降本增效增強(qiáng)創(chuàng)新企業(yè)賦能個(gè)人賦能AIGC的挑戰(zhàn)數(shù)據(jù)隱私及安全泄露隱私數(shù)字身份冒用制作虛假信息詐騙知識(shí)產(chǎn)權(quán)挑戰(zhàn)侵權(quán)與被侵權(quán)生成質(zhì)量結(jié)果幻象、可控性、理解能力生成精準(zhǔn)度、還原度、仿真度倫理挑戰(zhàn)社會(huì)偏見(jiàn)、性別歧視等“復(fù)活”逝者損害已故人的隱私權(quán)01020304AIGC的未來(lái)AIGC的生成質(zhì)量和準(zhǔn)確性將得到提升在更多領(lǐng)域得到應(yīng)用,如保險(xiǎn)、醫(yī)療和法律

服務(wù)等更多地與人類(lèi)專(zhuān)家協(xié)作,以提供更高質(zhì)量的內(nèi)容和服務(wù)預(yù)計(jì)將出現(xiàn)更多關(guān)于內(nèi)容生成和使用的監(jiān)管框架01020304技術(shù)進(jìn)步更廣泛的應(yīng)用人機(jī)協(xié)作監(jiān)管框架的發(fā)展生成式人工智能(AI)目前處于期望膨脹期,預(yù)計(jì)將在2~5年內(nèi)產(chǎn)生巨大效益到2026年,Gartner預(yù)測(cè)超過(guò)80%的企業(yè)將使用生成式AI的API或模型,或在生產(chǎn)環(huán)境中部署支持生成式AI的應(yīng)用,而在2023年初這一比例不到5%。數(shù)據(jù)來(lái)源:Gartner(2023年8月)工作崗位需求變化顯著上升STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué))相關(guān)職業(yè)醫(yī)療保健和其他高技能職業(yè)下降顯著辦公室職員生產(chǎn)工人客戶(hù)服務(wù)代表等傳統(tǒng)職業(yè)到2030

年,歐洲和美國(guó)多達(dá)30%的工作時(shí)間可能實(shí)現(xiàn)自動(dòng)化2024年5月24日麥肯錫報(bào)告:《工作的新未來(lái):在歐洲及其他地區(qū)部署人工智能和提升技能的競(jìng)賽》技能類(lèi)型需求變化技能類(lèi)型需求變化技術(shù)技能大幅增長(zhǎng)炙手可熱的“新寵”技能是社會(huì)和情感技能體力和手動(dòng)技能的需求預(yù)計(jì)將保持大致穩(wěn)定認(rèn)知技能(文字和信息處理、編程、科研、工程等)的需求預(yù)計(jì)將減少14%2024年5月24日麥肯錫報(bào)告:《工作的新未來(lái):在歐洲及其他地區(qū)部署人工智能和提升技能的競(jìng)賽》與AI共舞學(xué)習(xí)AIGC基礎(chǔ)知識(shí)積極使用AIGC工具關(guān)注AIGC在各行業(yè)的應(yīng)用案例跟蹤最新發(fā)展趨勢(shì)A

I

G

C

的能力揭秘PART

03簡(jiǎn)介本部分深入剖析AIGC背后的技術(shù)原理,涵蓋文本生成和圖像生成兩大核心領(lǐng)域。通過(guò)對(duì)比文本生成和圖像生成的不同路徑,大家能夠全面理解AIGC在不同模態(tài)下的工作原理,以及如何利用這些技術(shù)實(shí)現(xiàn)高效的內(nèi)容創(chuàng)作和應(yīng)用。在文本生成方面,以O(shè)penAI的GPT-4o為例,詳細(xì)介紹了通用大語(yǔ)言模型(LLM)的工作原理,包括其基于

Transformer架構(gòu)的生成機(jī)制、上下文編碼、自注意力機(jī)制以及預(yù)訓(xùn)練和微調(diào)過(guò)程。探討了GPT-4o在多輪對(duì)話、語(yǔ)言轉(zhuǎn)換、意圖理解、文本生成和推理能力等方面的優(yōu)勢(shì),同時(shí)也指出其在知識(shí)局限、上下文窗口限制和生成幻覺(jué)等方面的不足。在圖像生成方面,以StableDiffusion模型為例,解釋了其核心組件(文本編碼器、圖像信息生成器和圖像解碼器)的工作流程,揭示了文生圖和圖生圖技術(shù)的優(yōu)勢(shì)與局限。本部分的內(nèi)容參考了《人工智能通識(shí)課(微課版)》和相關(guān)的視頻(B站的思睿觀通)。文本生成的奧秘AIGC與GPT(通用大模型的代表)1950s-1990S1990s-2010S2010s-2022年2023年OpenAI

GPT4-多模態(tài)大模型OpenAI

GPT的學(xué)霸養(yǎng)成記GPT:生成式預(yù)訓(xùn)練變換模型(GenerativePre-trainedTransformer)3大核心能力多輪對(duì)話任意語(yǔ)言的轉(zhuǎn)換能力意圖和情感理解能力對(duì)比能力窮舉能力假設(shè)推理能力文本總結(jié)能力文本改寫(xiě)能力文本生成能力推理能力創(chuàng)作能力對(duì)話能力工作原理-1概率預(yù)測(cè)+文字接龍1.收到提示詞示例:“今天天氣不錯(cuò),我決定”4.基于上下文預(yù)測(cè)下一個(gè)token為可能的單詞分配概率分?jǐn)?shù)示例:{“去”:0.7.“停":0.2,“站":0.1}5.根據(jù)概率分?jǐn)?shù)選擇標(biāo)記示例:“去”采用Transformer架構(gòu)處理token理解token之間的關(guān)系識(shí)別提示詞的整體含義2.將輸入拆分為token[“今”,“天”,“天”,“氣”,“不”,“錯(cuò)”,“,”,“我”,“決”,“定”]自回歸:重復(fù)步驟4和步驟5直到形成完整的句子示例:今天天氣不錯(cuò),我決定去公園GPTGenerative(生成式)Pre-trained(預(yù)訓(xùn)練)Transformer(變換器)LLM:Large

Language

Model工作原理-2預(yù)訓(xùn)練(自監(jiān)督)監(jiān)督微調(diào)人類(lèi)反饋強(qiáng)化學(xué)習(xí)接收輸入處理輸入進(jìn)行推理生成輸出上下文+訓(xùn)練知識(shí)階段1:模型訓(xùn)練階段2:推理大模型工作過(guò)程工作原理-3數(shù)據(jù)來(lái)源說(shuō)明維基百科在線百科,嚴(yán)謹(jǐn)圖書(shū)經(jīng)典為主的古登堡計(jì)劃和自助出版平臺(tái)Smashwords等雜志期刊論文:ArXiv等鏈接WebText,RedditCommon

Crawl開(kāi)源項(xiàng)目,爬取互聯(lián)網(wǎng)所有數(shù)據(jù)GitHub程序員聚集地合計(jì)700

多GB,約有19萬(wàn)套四大名著的閱讀量5

000億左右的token數(shù)量。(13萬(wàn)億token:gpt4)100個(gè)標(biāo)記大約等于75個(gè)英語(yǔ)單詞訓(xùn)練語(yǔ)料(gpt-3)GPT-4o上下文窗口大?。?192個(gè)token(標(biāo)記)典型的新技能學(xué)習(xí)曲線:規(guī)模到達(dá)臨界點(diǎn)之后才會(huì)迅速增長(zhǎng)模型參數(shù):1.8萬(wàn)億參數(shù)(GPT-4)生成式通用大語(yǔ)言模型的優(yōu)勢(shì)與劣勢(shì)vs優(yōu)勢(shì)劣勢(shì)語(yǔ)言理解和生成能力世界知識(shí)能力一定的推理能力幻覺(jué)(生成錯(cuò)誤答案)知識(shí)庫(kù)有限上下文窗口限制如何與GPT對(duì)話多輪對(duì)話引導(dǎo)基本對(duì)話方法對(duì)話工具:ChatGPTPOE各種對(duì)話能力邊界智慧對(duì)話使用對(duì)話工具ChatGPT:聊天機(jī)器人應(yīng)用訪問(wèn)地址:/GPT:大語(yǔ)言模型GPT-3.5、GPT-4o對(duì)話能力-多輪對(duì)話上下文編碼自注意力機(jī)制原理上下文窗口限制問(wèn)題+回答總數(shù)包括字符、標(biāo)點(diǎn)、空格限制分段對(duì)話定期總結(jié)使用關(guān)鍵詞提醒精簡(jiǎn)輸入使用建議GPT-3.5:4096,大約3000個(gè)英文 單詞或4000個(gè)漢字GPT-4:8192,大約6000個(gè)英文單詞或8000個(gè)漢字(/tokenizer)對(duì)話能力-語(yǔ)言轉(zhuǎn)換能力人類(lèi)語(yǔ)言之間轉(zhuǎn)換機(jī)器語(yǔ)言之間轉(zhuǎn)換人類(lèi)語(yǔ)言與機(jī)器語(yǔ)言之間轉(zhuǎn)換不同語(yǔ)言人類(lèi)語(yǔ)言生成能力不同

前5名:英語(yǔ)、西班牙語(yǔ)、 法語(yǔ)、德語(yǔ)、中文機(jī)器語(yǔ)言生成能力不同前4名:python、Java、Typescript、Javascript限制GPT:使用英文中文優(yōu)先選擇國(guó)內(nèi)產(chǎn)品編程盡量選用前4種語(yǔ)言使用建議對(duì)話能力--意圖和情感分析能力真實(shí)意圖情緒識(shí)別判斷行為特點(diǎn)重要他人能力缺乏真正的情感上下文理解有限缺乏深層次推理限制提供清晰具體的信息簡(jiǎn)短和連貫的對(duì)話使用明確的情感表達(dá)使用建議創(chuàng)作能力文本分析能力最強(qiáng)文本潤(rùn)色修改能力強(qiáng)文本生成能力不可控創(chuàng)作能力-文本分析能力文本統(tǒng)計(jì)統(tǒng)計(jì)字符數(shù)、單詞數(shù)、句子數(shù)等基本統(tǒng)計(jì)信息文本摘要從長(zhǎng)文檔中提取主要信息,并生成一個(gè)簡(jiǎn)短的概述文本分類(lèi)新聞分類(lèi)、情感分析(正面、負(fù)面、中性)文本總結(jié)文本的整體內(nèi)容進(jìn)行簡(jiǎn)要概述,通常比文本摘要更為簡(jiǎn)短知識(shí)更新、長(zhǎng)文本理解、數(shù)據(jù)偏見(jiàn)、數(shù)據(jù)質(zhì)量、語(yǔ)境歧義、領(lǐng)域?qū)I(yè)知識(shí)、新穎和未知類(lèi)別、不確定性限制創(chuàng)作能力-文本潤(rùn)色能力限制新詞匯與表達(dá)、語(yǔ)境誤判、高度主觀性、

文化敏感性和幽默、不斷更新的語(yǔ)言規(guī)則、知識(shí)更新限制、長(zhǎng)文本處理能力、用戶(hù)意圖識(shí)別文本校對(duì)錯(cuò)別字識(shí)別與修改、語(yǔ)法錯(cuò)誤檢查與修正、標(biāo)點(diǎn)符號(hào)調(diào)整、詞匯選擇優(yōu)化、語(yǔ)句重組與調(diào)整、保持一致的寫(xiě)作風(fēng)格文本改寫(xiě)口語(yǔ)轉(zhuǎn)書(shū)面語(yǔ)、不同體裁風(fēng)格、語(yǔ)義保持、文本簡(jiǎn)化、文本優(yōu)化、保持一致性文本擴(kuò)寫(xiě)增加細(xì)節(jié)、舉例說(shuō)明、提供背景信息、解釋專(zhuān)業(yè)術(shù)語(yǔ)或概念、描述過(guò)程或步驟、增加文學(xué)修辭、提供多種觀點(diǎn)等創(chuàng)作能力-使用建議使用優(yōu)先級(jí)文本分析>文本潤(rùn)色>文本生成分段處理長(zhǎng)文本明確和具體的指示補(bǔ)充背景信息注意多義詞和模糊表達(dá)推理能力限制對(duì)比能力

對(duì)比分析:事物、概念、人物、事件、文學(xué)作品、藝術(shù)作品等列舉能力

簡(jiǎn)單列舉任務(wù):組合/排列/序列,簡(jiǎn)單數(shù)學(xué)問(wèn)題等假設(shè)推理能力

多個(gè)領(lǐng)域能力不同:歷史事件、文學(xué)作品解讀等

主觀判斷、上下文窗口、非專(zhuān)業(yè)算法、數(shù)據(jù)局限、缺乏常識(shí)和領(lǐng)域?qū)iL(zhǎng)、模型理解能力、過(guò)度生成偏見(jiàn)、難以驗(yàn)證答案的準(zhǔn)確性使用建議明確問(wèn)題和期望補(bǔ)充背景信息結(jié)合領(lǐng)域知識(shí)基本對(duì)話和多輪對(duì)話

追問(wèn)澄清引導(dǎo)多輪對(duì)話學(xué)會(huì)提問(wèn)

明確、具體、避免歧義邏輯清晰

上下文信息示范數(shù)據(jù)驗(yàn)證輸出

從回復(fù)中找到有價(jià)值的部分判斷結(jié)果質(zhì)量:初步識(shí)別可靠信息評(píng)估信息準(zhǔn)確性:與其他來(lái)源進(jìn)行對(duì)比處理錯(cuò)誤信息:指出錯(cuò)誤,重新提問(wèn)基本對(duì)話圖像生成的奧秘Stable

Diffusion模型如何實(shí)現(xiàn)圖像生成?文生圖圖生圖Stable

Diffusion模型的構(gòu)成三大核心組件文本編碼器圖像信息生成器圖像解碼器(翻譯官)(工匠)(畫(huà)家)文本編碼器解析用戶(hù)輸入的提示詞將提示詞轉(zhuǎn)化為高維向量表示圖像信息生成器將輸入信息逐步處理和轉(zhuǎn)換為圖像數(shù)據(jù)圖像解碼器接收來(lái)自圖像信息生成器的處理后的信息矩陣將信息矩陣轉(zhuǎn)換為可視化的圖像文生圖的優(yōu)勢(shì)與局限局限精確控制困難隨機(jī)性太強(qiáng)復(fù)雜場(chǎng)景理解優(yōu)勢(shì)降低門(mén)檻提高效率藝術(shù)風(fēng)格多樣化選擇AIGC工具PART

04簡(jiǎn)介本部分聚焦于如何科學(xué)選擇和高效應(yīng)用AIGC工具,以滿足不同場(chǎng)景下的多樣化需求。首先介紹當(dāng)前AIGC領(lǐng)域的工具類(lèi)型,包括聊天對(duì)話機(jī)器人、圖像生成工具、音頻與視頻生成工具以及搜索工具等,并列舉了國(guó)內(nèi)外代表性工具。隨后,以DeepSeek-R1、Kimi、豆包、騰訊元寶等具體工具為例,詳細(xì)分析了它們的特點(diǎn)、優(yōu)勢(shì)及適用場(chǎng)景,展示了不同工具在推理能力、多模態(tài)支持、長(zhǎng)文本處理和搜索效率等方面的差異。最后,還提出了選擇AIGC工具的依據(jù),包括明確需求、評(píng)估工具性能和考慮使用成本等,幫助讀者根據(jù)自身需求做出合理選擇。通過(guò)深入分析和對(duì)比,本部分旨在為讀者提供一份實(shí)用的AIGC

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論