生成式人工智能 課件 項目1 走進生成式AI_第1頁
生成式人工智能 課件 項目1 走進生成式AI_第2頁
生成式人工智能 課件 項目1 走進生成式AI_第3頁
生成式人工智能 課件 項目1 走進生成式AI_第4頁
生成式人工智能 課件 項目1 走進生成式AI_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

任務一項目一

走進生成式AIAIGC入門時間目錄01AIGC的技術發(fā)展02AIGC引領創(chuàng)新時代03生成式AI的局限性04AIGC對社會與科技的影響在當今數(shù)字化時代,內容創(chuàng)作需求呈爆發(fā)式增長。某新媒體公司負責運營多個社交媒體賬號,每天需要大量優(yōu)質的圖文、視頻等內容來吸引用戶。然而,傳統(tǒng)的人工創(chuàng)作方式效率較低,難以滿足快速更新的需求。同時,公司也在嘗試借助生成式AI技術來提升內容創(chuàng)作效率,豐富內容形式,解決當前面臨的困境。任務分析要完成任務,學生需理解人工智能基本概念。學習過程中,需學會從多渠道獲取AIGC信息,分析數(shù)據(jù)和案例。面對AIGC的復雜影響,要具備辯證思維,能客觀分析其利弊,同時思考如何在實際應用中規(guī)避風險、發(fā)揮優(yōu)勢。任務情境AIGC技術的核心概念AIGC生成式人工智能技術,是在神經(jīng)網(wǎng)絡復雜學習模型和自然語言處理等技術快速發(fā)展下,產生的人工智能的創(chuàng)新應用方式。它不僅能與用戶智能對話、提供信息查詢和建議,還具備針對真實場景需求提出問題、規(guī)劃解決方案和解決問題的能力。AIGC在生成文本、信息抽取、多語言翻譯、閱讀理解、情感分析、問答系統(tǒng)等任務中不斷提升創(chuàng)新性和吸引力,在多個領域得到廣泛應用。任務實施1950s-1990s早期萌芽階段1990s-2010s沉淀累積階段2010s至今(1)技術躍遷(2)ChatGPT

讓AIGC“爆火”快速發(fā)展階段1.1.1AIGC的技術發(fā)展01傳媒行業(yè)新聞寫作:AIGC可快速收集和分析各類信息,自動生成新聞稿件,提高新聞生產效率。內容推薦:通過分析用戶的瀏覽歷史、興趣偏好等數(shù)據(jù),利用AIGC算法為用戶精準推薦個性化的新聞、文章、視頻等內容,提升用戶粘性和平臺流量。1.1.2AIGC引領創(chuàng)新時代02商業(yè)領域電商平臺是生成式AI技術普惠的最佳試驗場之一。商品描述生成:根據(jù)商品的屬性、特點和賣點,自動生成吸引人的商品描述文案,節(jié)省人力成本,同時提高商品描述的質量和吸引力。虛擬試穿和試用:利用AIGC技術實現(xiàn)虛擬試衣、虛擬試用化妝品等功能,讓消費者在購買前更好地了解產品效果,提升購物體驗,減少退貨率。用于商業(yè)文案生成、圖像識別與處理、數(shù)據(jù)分析等。媒體和廣告公司利用AI生成新聞報道和創(chuàng)意廣告文案,企業(yè)通過AI分析市場數(shù)據(jù),制定營銷策略。數(shù)字人應用:如招商局集團構建的基于招商云和數(shù)據(jù)湖的自主數(shù)字賦能平臺。平臺孵化出首位數(shù)字員工“招小影”,在文化宣傳、工作匯總、知識管理等多個業(yè)務場景中發(fā)揮作用,還在招商局集團歷史博物館中提供藏品講解服務,平臺自上線以來,已納管多個數(shù)字人租戶,服務于內外部多類人群。1.1.2AIGC引領創(chuàng)新時代02商業(yè)領域電商平臺是生成式AI技術普惠的最佳試驗場之一。商品描述生成:根據(jù)商品的屬性、特點和賣點,自動生成吸引人的商品描述文案,節(jié)省人力成本,同時提高商品描述的質量和吸引力。虛擬試穿和試用:利用AIGC技術實現(xiàn)虛擬試衣、虛擬試用化妝品等功能,讓消費者在購買前更好地了解產品效果,提升購物體驗,減少退貨率。用于商業(yè)文案生成、圖像識別與處理、數(shù)據(jù)分析等。媒體和廣告公司利用AI生成新聞報道和創(chuàng)意廣告文案,企業(yè)通過AI分析市場數(shù)據(jù),制定營銷策略。數(shù)字人應用:如招商局集團構建的基于招商云和數(shù)據(jù)湖的自主數(shù)字賦能平臺。平臺孵化出首位數(shù)字員工“招小影”,在文化宣傳、工作匯總、知識管理等多個業(yè)務場景中發(fā)揮作用,還在招商局集團歷史博物館中提供藏品講解服務,平臺自上線以來,已納管多個數(shù)字人租戶,服務于內外部多類人群。1.1.2AIGC引領創(chuàng)新時代03

游戲行業(yè)游戲劇情和任務生成:為游戲自動生成豐富多樣的劇情和任務,增加游戲的趣味性和可玩性,延長游戲的生命周期。游戲角色和場景設計:幫助游戲開發(fā)者快速創(chuàng)建游戲角色、設計游戲場景,提高游戲開發(fā)效率,降低開發(fā)成本。1.1.2AIGC引領創(chuàng)新時代04

影視娛樂行業(yè)劇本創(chuàng)作:輔助編劇創(chuàng)作劇本,提供創(chuàng)意靈感、情節(jié)建議,甚至生成完整的劇本初稿,加快劇本創(chuàng)作過程。特效制作:通過AIGC技術生成逼真的特效場景和虛擬角色,提升影視作品的視覺效果和觀賞性。1.1.2AIGC引領創(chuàng)新時代05

教育領域輔助教學,提供個性化學習建議,智能批改作業(yè),解答各類知識問題,生成在線課程、教材和習題,實現(xiàn)教育的精細化和個性化。例如,通過分析學生的學習數(shù)據(jù),為每個學生定制專屬的學習路徑和練習題目。1.1.2AIGC引領創(chuàng)新時代06

醫(yī)療領域輔助醫(yī)生診斷,提供醫(yī)學知識查詢服務。如幫助醫(yī)生快速檢索疾病相關的最新研究成果和診斷案例,輔助分析醫(yī)學影像等。1.1.2AIGC引領創(chuàng)新時代07

金融領域進行風險評估,提供投資建議。利用大量的金融數(shù)據(jù)和市場信息,為投資者分析投資風險,推薦合適的投資組合。1.1.2AIGC引領創(chuàng)新時代08

客服領域代替人工客服,提供24小時在線咨詢服務,支持語音與文字的相互轉換以及多語言翻譯。提高客服效率,降低人力成本,同時提升用戶服務體驗。1.1.2AIGC引領創(chuàng)新時代09

智能家居領域控制家電設備,提供語音助手服務。用戶通過語音指令就能輕松控制家中的智能設備,實現(xiàn)便捷的智能家居生活。1.1.2AIGC引領創(chuàng)新時代10

程序開發(fā)具備代碼理解、修改和生成能力。幫助開發(fā)者快速生成代碼片段,理解復雜代碼邏輯,提高開發(fā)效率。1.1.2AIGC引領創(chuàng)新時代11

工業(yè)領域推進“數(shù)實”融合,加快產業(yè)升級。借助AIGC技術實現(xiàn)工業(yè)設計的創(chuàng)新、生產流程的優(yōu)化和質量檢測的智能化。1.1.2AIGC引領創(chuàng)新時代大模型在收集數(shù)據(jù)時,可能存在未經(jīng)用戶充分授權就收集個人信息的情況隱私與數(shù)據(jù)安全問題生成的內容質量參差不齊內容質量不穩(wěn)定計算資源支持,硬件設備要求高,高昂的能耗和成本資源和成本的價格高昂若訓練數(shù)據(jù)存在偏差或不完整,會導致模型生成的內容帶有偏見數(shù)據(jù)依賴和偏見用于訓練大模型的數(shù)據(jù)可能涉及版權問題安全問題和人們過度依賴機器安全和倫理問題1.1.3生成式AI的局限性大模型使人工智能在自然語言處理、圖像識別、語音交互等領域性能大幅提升。架構優(yōu)化與多模態(tài)融合進階也是生成式AI技術的重要進展。邏輯推理能力的深化拓展也是生成式AI的一個重要發(fā)展方向制造業(yè):優(yōu)化流程、預測故障、智能制造,提效保量。金融行業(yè):精準風險評估、市場預測和智能決策。醫(yī)療領域:疾病診斷、藥物研發(fā)和治療方案制定。交通領域:優(yōu)化交通流量調度,自動駕駛、,提高交通安全性催生新的應用場景,推動跨界融合應用,形成新的業(yè)態(tài)和模式,如智能農業(yè)。(1)推動技術創(chuàng)新變革(2)促進產業(yè)升級轉型(3)拓展科技應用邊界AIGC對社會與科技的影響1.對未來科技的影響一些重復性、規(guī)律性強的工作可能被大模型驅動的智能系統(tǒng)取代;但也會創(chuàng)造出如大模型訓練師、算法倫理專家、人工智能產品經(jīng)理等新的就業(yè)機會。教育方面:以適應大模型時代對人才的需求。公平性問題:可能加劇數(shù)字鴻溝,可能在資源分配、機會獲取等方面造成新的不公平。倫理道德挑戰(zhàn):涉及數(shù)據(jù)隱私保護、算法偏見、人工智能的責任界定等問題。社交方式:智能聊天機器人和虛擬社交助手可能成為人們社交的新伙伴,也可能導致社交隔離等問題。生活服務:在更便捷、個性化的服務,提升生活品質。(1)改變就業(yè)結構與教育體系(2)影響社會公平與倫理道德(3)拓展科技應用邊界AIGC對社會與科技的影響2.對未來社會的影響AIGC的核心技術包括深度學習、自然語言處理、計算機視覺、生成對抗網(wǎng)絡以及Transformer、GPT系列等模型。依據(jù)工作需求選擇合適的生成式AI,需要綜合考慮應用場景、模型功能、數(shù)據(jù)安全等多方面因素,考驗著使用者的綜合分析和決策能力。AIGC對社會與科技的影響具有復雜性,其在推動技術創(chuàng)新、產業(yè)升級的同時,也帶來就業(yè)結構改變、社會公平性等問題,大眾需具備辯證思維,全面分析這些影響。任務小結結合生活案例,分組討論當前AIGC的發(fā)展現(xiàn)狀與應用價值。實踐創(chuàng)新謝謝大家任務二項目一

走進生成式AI大模型的百家爭鳴時間目錄01認識OpenAI02認知文心一言03認知訊飛星火04認知Deepseek05認知豆包06認知kimi某創(chuàng)新型科技企業(yè)計劃開展多個AI相關項目,涵蓋智能寫作、圖像生成、智能客服等領域。在項目籌備階段,需要評估和選擇合適的大模型。企業(yè)內部團隊對市場上眾多大模型的特點、功能和適用場景了解有限,難以做出精準決策。任務分析

我們需要了解不同大模型的技術原理、發(fā)展動態(tài)、功能特點、應用場景需求、模型性能。在操作大模型過程中,要熟悉不同平臺的界面和交互方式,掌握基本指令和參數(shù)設置。任務情境學術界的大模型即基礎模型,是新型機器學習模型,能在大規(guī)模數(shù)據(jù)集上進行自監(jiān)督訓練,適應多種下游任務。本文中的大模型指基礎模型。任務實施OpenAI于2015年創(chuàng)立,旨在通過安全的人工智能通用技術(AGI)推動人類進步。早期,OpenAI專注于開發(fā)用于視頻游戲和其他娛樂目的的AI和機器學習工具。OpenAIGym,這是一個用于開發(fā)強化學習(RL)算法的開源工具包。生成式預訓練Transformer(GPT)

是一種神經(jīng)網(wǎng)絡,能像人類大腦一樣運作,通過對大量數(shù)據(jù)集的學習,生成對用戶問題的回答。1.2.1認識OpenAIDALL-E是一種生成式AI模型,可分析人類用戶的自然語言文本,并根據(jù)文本描述生成圖像。2022年11月發(fā)布的ChatGPT更是舉世矚目,引發(fā)了全球對人工智能的廣泛關注和討論,僅5天用戶量超100萬,兩個月突破1億人。2023年2月,Google推出基于對話編程語言模型LanMDA的人工智能對話產品Bard,參數(shù)量達1370億個。1.2.1認識OpenAI2023年2月

百度智能云宣布文心一言將通過百度智能云對外提供服務。

同年6月

文心大模型升級,能生成實時準確信息,ChatFile支持超長文本輸入。截至2024年6月

,文心一言累計用戶規(guī)模達3億,日調用次數(shù)達5億

。2024年9月

,文心一言APP正式升級為

“文小言”,定位為百度旗下

“新搜索”

智能助手。1.2.2認知文心一言

現(xiàn)模型擁有

超8000億個參數(shù),能夠捕捉更豐富的語言特征和模式,提升語言理解和生成能力。在預訓練階段采用多任務學習策略,可同時處理文本分類、問答、文本生成等多種語言任務,增強模型的通用性。1.2.2認知文心一言

融入豐富知識庫,提高對知識的理解和運用能力,使生成的內容更具知識性和準確性。能夠有效處理長文本數(shù)據(jù),對長篇文章或文檔的理解和生成表現(xiàn)出色。支持多種語言,具備跨語言的理解和生成能力,滿足不同語言用戶的需求。

1.2.2認知文心一言

API接入?yún)?shù):使用文心一言API時,需設置ques(用戶問題或輸入文本,必填)、appKey(應用身份驗證密鑰,可從官網(wǎng)個人中心獲?。id(用戶賬號唯一標識,可從官網(wǎng)個人中心獲取)等參數(shù)。1.2.2認知文心一言操作方法是:打開“文心一言”官網(wǎng):,操作界面如圖1-1所示。1.2.2認識文心一言圖1-1“文心一言”操作界面輸入提示詞:請生成贊美廣西南寧的五言詩,生成效果如圖1-2所示。1.2.2認識文心一言圖1-1“文心一言”操作界面圖1-2生成“詩”

2022年12月,科大訊飛啟動

“1+N”

大模型技術攻關,“1”

代表通用認知智能大模型算法研發(fā)及高效訓練方案底座平臺,“N”

則是將認知智能大模型技術應用在教育、醫(yī)療、人機交互、辦公、翻譯等多個行業(yè)領域。1.2.3認知訊飛星火2023年訊飛星火認知大模型V1.0發(fā)布,作為以中文為核心的認知智能大模型,能基于自然語言對話的方式實現(xiàn)用戶需求理解與任務執(zhí)行,具備文本、語言理解、知識問答、邏輯推理、數(shù)學思維、代碼理解等多種能力,并能持續(xù)學習進化。V3.0正式發(fā)布,推出了星火科研助手、AI心理伙伴、訊飛星火醫(yī)療大模型,以及業(yè)界首個集“大模型+具身智能”一體的人形機器人,還新增虛擬人格功能。隨后,該模型提升了數(shù)學自動提煉規(guī)律、小樣本學習、代碼項目級理解能力、多模態(tài)指令跟隨與細節(jié)表達等能力。1.2.3認知訊飛星火1.2.3認知訊飛星火01自然語言處理能力在文本生成方面表現(xiàn)出色,能夠撰寫新聞報道、小說故事、文案策劃、學術論文等各類文本,還能根據(jù)不同風格和要求進行創(chuàng)作。例如寫一篇旅游宣傳文案,它能結合當?shù)靥厣?,以生動、吸引人的語言。在語言理解上,可準確理解用戶輸入的復雜語義和語境,實現(xiàn)高效的問答交互。比如針對復雜的政策法規(guī)問題,能精準解讀含義。1.2.3認知訊飛星火02邏輯推理與數(shù)學能力具備較強的邏輯推理能力,無論是分析事件因果關系、解決邏輯謎題,還是處理復雜的業(yè)務邏輯問題,都能給出合理推斷。在數(shù)學能力上,可進行復雜的數(shù)學計算、幾何證明、數(shù)學建模等,能解決從基礎數(shù)學到高等數(shù)學的各類問題。像求解多元函數(shù)極值、復雜的幾何證明題等都不在話下。1.2.3認知訊飛星火03代碼能力支持多種編程語言,如Python、C++、Java等??梢詫崿F(xiàn)代碼生成,根據(jù)自然語言描述生成可運行的代碼;代碼解釋,對已有的代碼進行注釋和解釋,幫助開發(fā)者理解代碼邏輯;還能進行代碼糾錯和單元測試生成,提高軟件開發(fā)效率和質量。比如根據(jù)一個功能需求,快速生成Python代碼實現(xiàn)該功能。1.2.3認知訊飛星火04多模態(tài)能力涵蓋多模理解、視覺問答、多模生成、虛擬人視頻等功能。上傳圖片后,模型能識別理解并返回準確描述,還能圍繞圖片回答用戶問題。多模生成以及虛擬人視頻則能根據(jù)用戶描述,生成符合期望的合成音頻和視頻,也可整合AI虛擬人,快速生成匹配視頻。比如輸入一段關于風景的描述,就能生成一段包含對應風景畫面的視頻。1.2.3認知訊飛星火以對話方式為例,其操作方法是打開訊飛星火的官方網(wǎng)頁版網(wǎng)址/操作界面如圖1-3所示圖1-3訊飛星火的官網(wǎng)界面1.2.3認知訊飛星火在提示詞輸入框中,輸入提示詞:請介紹請介紹5個生成式人工智能大模型的登錄方式及其功能、特點。單擊按鈕,即可生成相應內容。圖1-4輸入提示詞1.2.4認知Deepseek

2023年11月,DeepSeek發(fā)布了專為編碼任務設計的開源模型DeepSeekCoder,標志著其正式進軍競爭激烈的AI市場;同月,又推出了擁有670億參數(shù)的語言模型DeepSeekLLM。

1.2.4認知Deepseek

DeepSeek-V2憑借極具競爭力的低價策略,迅速在中國AI市場掀起波瀾,促使字節(jié)跳動、騰訊、百度和阿里巴巴等中國大型科技公司調整定價結構。2025年1月,DeepSeek推出了DeepSeek-V3和DeepSeek-R1。其中開源模型DeepSeek-R1基于DeepSeek-V3,以其出色的性能和低成本引起了廣泛關注。

01自然語言處理能力

在文本生成方面,DeepSeek能夠根據(jù)給定的主題或提示,生成邏輯清晰、內容豐富的文本,無論是新聞報道、故事創(chuàng)作還是學術論文,都能信手拈來。

在語言理解上,它可以準確理解用戶輸入的自然語言,包括復雜的語義、語境和隱含信息,實現(xiàn)高效的人機對話。

例如,用戶詢問關于科技發(fā)展趨勢的問題,它能快速理解問題意圖,并給出全面且深入的回答。1.2.4認知Deepseek02代碼能力DeepSeekCoder對多種主流編程語言如Python、Java、C++等都有良好支持,能根據(jù)自然語言描述生成高質量的可執(zhí)行代碼,也能對現(xiàn)有代碼進行解讀、優(yōu)化和調試。比如開發(fā)者想要實現(xiàn)一個數(shù)據(jù)處理功能,只需輸入功能需求描述,DeepSeekCoder就能生成對應的Python代碼。1.2.4認知Deepseek03推斷決策能力DeepSeek-R1在面對復雜問題時,能進行深度的邏輯推理和分析。在商業(yè)決策模擬中,它可以綜合考慮市場趨勢、競爭對手、成本效益等多方面因素,為決策者提供合理的建議和預測。1.2.4認知DeepseekDeepSeek登錄的操作方法是:(1)下載安裝:目前DeepSeek可在軟件應用商店下載,在手機桌面找到并點擊App圖標打開應用。注冊賬號:打開App后,若沒有賬號,點擊

“注冊”

按鈕。點擊

“獲取驗證碼”,將接收到的短信驗證碼填入對應位置,設置好密碼后,點擊

“完成注冊”。(2)登錄賬號:已有賬號時,在App首頁點擊

“登錄”,如圖1-5所示。輸入注冊時的手機號碼和密碼,點擊

“登錄”

即可進入DeepSeek主界面。若忘記密碼,可點擊

“忘記密碼”,通過手機驗證碼重置密碼。圖1-5登錄界面案例1:一位股民想了解如何提高A股投資勝率,打開DeepSeek后,在對話輸入框中輸入

“如何提高A股投資勝率”

。DeepSeek經(jīng)過分析,認為要考慮基本面、技術面分析,兼顧倉位管理、投資風格選擇、辨別信息真?zhèn)蔚?/p>

。它給出了如選擇新能源、高端制造等優(yōu)質賽道進行基本面選股;技術面輔助方面,在股價站上60日均線等上升趨勢中操作,避免逆勢抄底;還推薦定投滬深300ETF、創(chuàng)業(yè)板ETF等指數(shù)基金降低擇時風險,如圖1-6所示。1.2.4認知Deepseek圖1-6案例1案例2:假如有用戶手頭有100萬閑置資金,想進行合理理財規(guī)劃。在DeepSeek中輸入“100萬怎么理財”,它會針對不同風險偏好給出資產配置方案。對于保守型投資者,推薦大額存單、貨幣基金等低風險產品;對于穩(wěn)健型投資者,推薦配置一定比例的指數(shù)基金、債券基金;對于激進型投資者,除了上述產品,還會建議配置部分股票型基金、黃金、REITs等,生成的參考效果如圖1-7所示。1.2.4認知Deepseek圖1-7案例2案例3:開發(fā)者要實現(xiàn)一個簡單的數(shù)據(jù)處理功能,將Excel表格中的數(shù)據(jù)進行篩選,提取出特定條件的數(shù)據(jù)并保存為新的Excel文件

。在DeepSeek中輸入

“用Python實現(xiàn)從Excel表格篩選特定條件數(shù)據(jù)并保存為新Excel文件的代碼”

。DeepSeek會快速生成Python代碼,生成的參考效果如圖1-8所示。1.2.4認知Deepseek圖1-8案例3豆包是字節(jié)跳動基于云雀模型開發(fā)的AI智能體。2024年5月

,字節(jié)跳動宣布豆包大模型正式開啟對外服務。2024年

字節(jié)跳動豆包發(fā)布首款AI智能體耳機OlaFriend,進一步拓展了豆包的應用場景,讓用戶能以更便捷的方式與豆包交互。1.2.5認知豆包01自然語言處理與對話交互

豆包能夠精準理解用戶輸入的自然語言,無論是日常交流的閑聊話題,如分享生活趣事、討論熱門影視;還是專業(yè)領域的深度問題,像探討量子物理的前沿理論、分析復雜的法律條文,它都能迅速理解意圖,并給出自然流暢、邏輯清晰的回答,實現(xiàn)高效的人機對話。1.2.5認知豆包02內容創(chuàng)作輔助

在寫作方面,豆包堪稱強大的助手。無論是撰寫正式的商務報告、學術論文,還是創(chuàng)作充滿創(chuàng)意的小說故事、廣告文案,亦或是生成實用的旅行攻略、產品說明書,只需輸入相關主題、要求或關鍵信息,豆包就能生成內容豐富、結構合理的文本。還能對已有文本進行潤色、改寫、擴寫、縮寫等操作,幫助用戶優(yōu)化文字表達。1.2.5認知豆包03多語言翻譯

支持多種語言之間的互譯,涵蓋常見的英語、日語、韓語、法語、德語等,以及一些相對小眾的語言。無論是學習外語時查詢單詞、翻譯句子,還是閱讀外文文獻、與國外友人交流,豆包都能提供準確、快速的翻譯服務,打破語言障礙。1.2.5認知豆包04知識問答與信息提供

擁有龐大的知識體系,涵蓋科學、歷史、文化、技術、生活等各個領域。當用戶有疑問時,比如詢問歷史事件的詳細經(jīng)過、科學原理的解釋、生活小竅門等,豆包能快速檢索知識,給出準確、詳實的答案,滿足用戶的求知需求。1.2.5認知豆包豆包登錄的操作方法是:1.手機APP登錄:在手機的官方應用商店(如蘋果AppStore或安卓應用商店)搜索“豆包”,下載并安裝完成后,打開應用,如圖1-9所示。若已有賬號,可以選擇“抖音一鍵登錄”,或在登錄頁面輸入注冊時使用的手機號碼或郵箱,以及對應的密碼,點擊“登錄”即可。若忘記密碼,可點擊“忘記密碼”,按照提示通過手機驗證碼或郵箱驗證的方式重置密碼。若首次使用,點擊“注冊”,填寫手機號碼、接收驗證碼并設置密碼完成注冊流程。1.2.5認知豆包圖1-9豆包登錄界面2.網(wǎng)頁版登錄:打開常用的瀏覽器,在地址欄輸入豆包官方網(wǎng)站地址(

)。進入官網(wǎng)后,點擊頁面右上角的“登錄”按鈕。3.第三方平臺登錄:豆包支持通過微信、QQ等第三方平臺登錄。以微信登錄為例,在手機APP或網(wǎng)頁版登錄頁面點擊“微信登錄”圖標,會彈出微信授權頁面,使用手機微信掃描二維碼,在微信端確認授權登錄,即可成功進入豆包。這種登錄方式方便快捷,無需重復注冊賬號。1.2.5認知豆包豆包以文生文為例,其操作方法是:小王計劃和家人去桂林旅游,他向豆包提問“一家五口,預算15000元,從成都去桂林的五天四夜的旅游攻略,包含交通、住宿、美食和景點,考慮老人和小孩需求”。豆包根據(jù)小王的需求,推薦了適合全家出行的交通方式;篩選出環(huán)境舒適、位置便利且價格合理的酒店;列舉了桂林著名的美食,并推薦了適合帶老人小孩游玩的景點,如桂林象鼻山、漓江、西街等,還規(guī)劃了詳細的每日行程安排。1.2.5認知豆包圖1-10案例效果北京月之暗面科技有限公司推出智能助手產品kimi。2024年實現(xiàn)200萬字無損上下文,支持常用語、語音輸入輸出等,api支持toolcalling,具備AI自主搜索并整合關鍵信息,可按需求限定網(wǎng)站搜索,能引用信息來源。能迅速對長篇文本進行摘要,幫助用戶把握文獻、報告等的核心內容。支持金融分析、法律咨詢等領域。1.2.6認知kimi支持多種文件格式和圖片上傳。能智能識別并整理大量數(shù)據(jù),如發(fā)票或會議記錄,自動提取關鍵信息點。能根據(jù)用戶提供的鏈接、文件或指令,協(xié)助構建大綱、擴展文章、創(chuàng)作文案等。能幫助瀏覽API文檔,定位信息,生成代碼或進行調試,支持多種編程語言。其被廣泛應用于學術研究,撰寫論文;為教師和教育工作者輔助教學、準備教案、解答學生問題提供便利;商業(yè)應用和程序開發(fā)等領域應用成效也很顯著。1.2.6認知kimiKimi官網(wǎng)界面如圖所示。1.2.6認知kimiKimi側邊功能欄1.學會主流大模型的登錄方式和基本操作,如文心一言的文生文、訊飛星火、Kimi等。3.使用大模型時,要避免因輸入不恰當?shù)奶崾驹~導致生成結果不符合預期。2.理解不同大模型的技術原理和優(yōu)勢,以便在實際應用場景中做出準確選擇。任務小結百度搜索kimi官網(wǎng),并打開官方網(wǎng)站,點擊左側邊欄“登錄”,使用微信掃碼授權登錄。打開工作界面,在提示詞對話框中,輸入:我是準備參加計算機等級考試辦公軟件應用一級考試的學生,請幫我生成考試模擬試題一份,并給出答案解析。實踐創(chuàng)新謝謝大家任務三項目一

走進生成式AI設計類大模型的百家爭鳴時間目錄01020304認知騰訊智影0506認知可靈AI認知Motiff妙多大模型認知靈鹿未來認知酷云AI認知即夢一家專注于數(shù)字內容創(chuàng)作的工作室承接了多個項目,包括為電商平臺制作產品宣傳視頻、為教育機構設計教學課件、為游戲公司設計角色和場景等。工作室現(xiàn)有的創(chuàng)作工具和方法效率較低,難以滿足客戶對質量和交付時間的要求。工作室決定引入新的AI創(chuàng)作平臺和大模型來提升創(chuàng)作能力,在眾多的平臺和模型中做出選擇并學會熟練運用,成為工作室當前面臨的重要任務。任務分析完成任務需要學生了解數(shù)字內容創(chuàng)作的基本流程和要求,才能更好地運用相關平臺和模型。操作過程中,要處理好素材準備、參數(shù)設置、效果調整等細節(jié),掌握平臺工具的使用技巧。面對不同設計項目需求,要能靈活運用相應模型的功能,發(fā)揮創(chuàng)意,提升創(chuàng)作質量和效率。任務情境理解即夢、靈鹿未來等平臺或模型的功能和應用場景;熟練掌握數(shù)字內容的工作流程和要求。知識目標能根據(jù)給定的應用場景,選擇合適的大模型并說明理由;掌握不少于3個主流設計類大模型的登錄方式和基本操作方法。能力目標培養(yǎng)創(chuàng)新意識,在創(chuàng)作中積極探索和應用新技術;增強團隊合作精神,合作協(xié)同完成創(chuàng)作任務。素質目標任務目標數(shù)字內容創(chuàng)作的工作流程和要求是:第一,規(guī)劃構思階段。明確目標與受眾,開展創(chuàng)意策劃。第二,素材準備階段。依據(jù)創(chuàng)意收集素材,包括文本、圖像、音頻、視頻等。收集與主題的契合度、質量高、合法的素材,處理素材。第三,制作階段。運用數(shù)字工具進行創(chuàng)作。第四,優(yōu)化調整階段。完成初稿后審核校對,修改后再次審核,確保質量達到標準。第五,發(fā)布與推廣階段。選擇合適平臺發(fā)布,通過多種方式推廣。第六,評估反饋階段。數(shù)據(jù)監(jiān)測,分析用戶行為和反饋,持續(xù)改進提高質量。依據(jù)工作需求,我們可以選擇不同的生成式AI大模型輔助設計,以下介紹幾個的創(chuàng)作平臺和大模型。任務實施即夢是字節(jié)跳動旗下剪映推出的AI創(chuàng)作平臺。即夢原名為Dreamina。它能讓普通人無需專業(yè)技能也能制作出精美的圖片和視頻,滿足社交媒體分享、個人興趣創(chuàng)作等需求,如制作個性化的朋友圈海報、生活記錄視頻。在服務商業(yè)營銷方面,能為企業(yè)和商家提供了高效的廣告制作、產品宣傳等解決方案,能快速生成吸引人的廣告海報和宣傳視頻,提升營銷效率和效果。在推動教育創(chuàng)新方面,可用于制作教學課件、動畫演示等,使教學內容更加生動形象,提高學生的學習興趣和效果。在豐富文化藝術創(chuàng)作方面,能為藝術家、創(chuàng)作者提供了新的創(chuàng)作工具和靈感來源,有助于推動文化藝術的創(chuàng)新和發(fā)展,如創(chuàng)作藝術插畫、動畫短片等。主要功能介紹如下:1.3.1認知即夢01AI繪圖功能文生圖:輸入文本描述可生成對應場景圖片,支持動漫、寫實、攝影、插畫等多種風格。圖生圖:以圖片為基礎生成新圖片,可實現(xiàn)風格轉換等操作。圖像編輯:能將較低分辨率圖像處理為4K、8K分辨率的超清圖片,并支持擴圖功能,可更改圖片比例。局部重繪:提供畫筆和橡皮擦工具,對生成后的圖片進行局部重繪。1.3.1認知即夢02AI視頻生成功能文生視頻:將文字描述轉換成視頻。圖生視頻:利用單圖或兩張圖片作為首幀和尾幀,直接生成視頻或配合提示詞描述生成視頻。AI對口型:為生成視頻中的人物配音并匹配口型,提供多種音色,也可上傳自己的配音。鏡頭與速度控制:有鏡頭放大、推遠、旋轉等多種運鏡選擇,提供正常、快速、慢速三種運動速度控制。1.3.1認知即夢03智能畫布素材拼接:支持本地素材上傳,在畫布上自由拼接。分圖層AI生成:可進行分圖層AI生成、AI擴圖、局部重繪、局部消除等,確保創(chuàng)作風格統(tǒng)一和諧。1.3.1認知即夢04故事創(chuàng)作支持一站式生成故事分鏡、鏡頭組織管理、編輯等功能。1.3.1認知即夢即夢的登錄操作方法是:1.電腦端:打開瀏覽器,輸入即夢平臺網(wǎng)址/,打開工作界面如圖1-14所示。在平臺首頁右上角找到

“登錄”

按鈕,輸入用戶名和密碼后,點擊

“登錄”

進入即夢平臺。首次登錄需先

“注冊”

賬號,有抖音賬號的用戶,也可通過抖音APP掃碼登錄。圖1-14即夢AI官網(wǎng)登錄界面04故事創(chuàng)作1.3.1認知即夢小提示:即夢AI需要使用抖音賬號登錄,如果沒有抖音賬號的讀者需要提前注冊抖音賬號,如圖1-15所示。圖1-15即夢AI界面登錄即夢AI后,工作界面由導航欄,工具欄,菜單欄,“視圖”窗口,“材質管理器”窗口,“對象”窗口,“屬性”窗口,“動畫”窗口等區(qū)域組成,如圖1-16所示。04故事創(chuàng)作1.3.1認知即夢以制作數(shù)字人對口型視頻為例,即夢平臺的操作方法是:(1)準備工作:確保設備網(wǎng)絡穩(wěn)定,準備好數(shù)字人的照片或視頻,以及清晰、無雜音的音頻文件或準確、完整的文本內容。(2)選擇數(shù)字人:登錄后在平臺素材庫或角色選擇區(qū)域挑選合適數(shù)字人。(3)輸入文本或上傳配音:選擇“對口型——文本朗讀”輸入框輸入文本,或點擊“上傳本地配音”按鈕上傳音頻文件。(4)生成、預覽和下載視頻:設置完成后點擊

“生成”

按鈕,生成后進行預覽,滿意則下載。04故事創(chuàng)作1.3.1認知即夢以制作繪畫人物說話的教學視頻為例,即夢平臺的操作方法是:(1)素材收集與準備:選擇合適的繪畫作品,準備好想要人物表達的臺詞或講解內容,并整理成清晰準確的文本形式。(2)上傳繪畫與輸入文本:登錄后點擊“AI視頻生成”,進入創(chuàng)作頁面,在“對口型”功能中上傳繪畫圖片,在“文本朗讀”欄輸入臺詞文本,也可選擇“上傳本地音頻”。(3)選擇聲音與生成效果:選擇合適的聲音,設置相關參數(shù)。(4)生成并預覽視頻:點擊

“生成視頻”

按鈕,生成后進行預覽,查看效果是否符合預期,可返回修改調整。

由北京酷云互動科技有限公司推出,該公司創(chuàng)立于2009年1月。成立之初,酷云互動就致力于在大數(shù)據(jù)與人工智能領域開拓創(chuàng)新,憑借對市場趨勢的敏銳洞察和技術研發(fā)的不懈投入,逐漸在行業(yè)中嶄露頭角

??嵩艫I可以幫助用戶快速創(chuàng)作自媒體文案、營銷文案、短視頻腳本、商品文案、小說等300多種AI應用。用戶可一鍵生成原創(chuàng)文章、小紅書文案、公眾號文章、電商文案、短視頻腳本、營銷推廣文案、各類圖片素材等,有效為每位用戶提高創(chuàng)作質量和工作效率。1.3.2認知酷云AI其技術特點是:1.3.2認知酷云AI第一,自然語言處理深度優(yōu)化??嵩艫I運用先進的深度學習算法,對自然語言處理技術進行深度優(yōu)化。通過海量文本數(shù)據(jù)的學習,模型能夠精準理解人類語言的語義、語法和邏輯結構,從而生成自然流暢、語義準確的文本內容。第二,多模態(tài)融合技術。酷云AI還具備多模態(tài)融合技術。它能將文本與圖像、音頻等多種信息模態(tài)進行融合處理,能根據(jù)描述生成匹配的圖像,實現(xiàn)圖文并茂的創(chuàng)作輸出,提供一體化的創(chuàng)作方案,豐富創(chuàng)作維度。第三,個性化學習與自適應調整??嵩艫I可以根據(jù)用戶的使用習慣、歷史創(chuàng)作記錄進行個性化學習。通過分析用戶偏好的寫作風格、常用詞匯、主題領域等信息,為用戶提供更貼合其需求的創(chuàng)作建議和內容生成,能實時自適應調整,越來越懂用戶的創(chuàng)作思路。第四,強大的知識圖譜支撐。內置龐大且精細的知識圖譜和豐富的知識儲備,為生成的內容提供堅實的知識基礎。無論是科學知識、歷史事件,還是行業(yè)動態(tài)、文化典故,都能信手拈來并合理運用,保證內容的專業(yè)性和豐富度。登錄酷云AI后,其工作界面如圖1-11所示。1.3.2認知酷云AI如圖1-11功能欄:展現(xiàn)了AI酷云的5個功能,包含“AI應用”“AI聊天”“AI行業(yè)”“AI繪畫”“AI訓練”等5個功能。工作臺:分為左側工作臺和橫向工作臺,兩個工作臺包含的內容一致。包含“我的收藏”“小紅書”“微信公眾號”“短視頻/直播”“商品文案”“影視/書籍”“社交媒體”“創(chuàng)作助手”“電子商務”“品牌營銷”“商業(yè)助手”“合同助手”“學術教育”“小說推文”等14個子工作臺。

場景模塊:分為多個助力AI品牌營銷的場景模塊。包含“品牌起名及生成”“產品介紹”“品牌故事”“公司介紹”“廣告語”“商業(yè)計劃書”“競品分析”“節(jié)日營銷活動方案”“營銷策劃”“營銷策劃方案”“網(wǎng)頁TDK生成”“偽原創(chuàng)改寫”等子場景。靈鹿未來AI設計平臺是國內首個以Agent(智能體)驅動的AI設計平臺、自主研發(fā)的多模態(tài)設計行業(yè)大模型。由Agent驅動,具備“生成式對話+時序卡片”功能,可實現(xiàn)動態(tài)展現(xiàn)并可控交付,還能做到模型與應用解耦。它精準賦能設計剛需的千行百業(yè),降低平臺使用門檻、打通工作流上下節(jié)點,針對工業(yè)設計領域特點和需求及中國傳統(tǒng)文化設計表達進行深度訓練開發(fā),助力實現(xiàn)“設計強國”。能提供產品定義、競品分析、趨勢追蹤、產品圖生成、精準CMF、智能體開發(fā)、智能打標、模型訓練等功能,構建開放可擴展的DesignBOM運行支撐體系,打造產品全周期全流智能設計引擎。其被廣泛應用于工業(yè)設計等多個垂直行業(yè),可用于產品設計的全流程,從概念生成到具體設計方案輸出,提高產品全生命周期的開發(fā)效率,推動規(guī)模化創(chuàng)意創(chuàng)新。1.3.3認知靈鹿未來操作方法是:打開官方網(wǎng)址:/auth/login,點擊注冊賬號,完成注冊后輸入賬號密碼即可登錄。案例應用操作方法:如設計一款智能手表,在靈鹿未來平臺的生成式對話框輸入“設計一款具有健康監(jiān)測功能的智能手表,風格簡約時尚”等需求,通過對話框修改如顏色、材質等參數(shù),確認后點擊“確認以上參數(shù)”,在時序卡片確認信息無誤后點擊“生成圖片”,可一次性生成4張產品圖片,還可利用重繪、局部調整等功能優(yōu)化設計,生成的產品定義及競品分析文檔可在時序卡片點擊“AI編輯”進行編輯。1.3.3認知靈鹿未來Motiff妙多推出自主研發(fā)的UI多模態(tài)大模型——Motiff妙多大模型,是全球首個由UI設計工具。

其具備出色的UI理解能力和執(zhí)行開放式指令的能力,能識別界面中所有圖片、圖標、文字和40多種細粒度UI組件,精確標注元素區(qū)域坐標,還具備交互導覽能力應用。主要應用于UI設計領域,可用于APP界面設計、網(wǎng)頁設計等,幫助設計師提高設計效率,提升設計質量,確保設計的一致性和規(guī)范性。1.3.4認知Motiff妙多大模型其登錄操作方法:訪問Motiff妙多官方平臺,點擊注冊獲取賬號,注冊成功后使用賬號密碼登錄。案例應用操作方法:進行APP界面設計時,若要設計一個社交APP的聊天界面,在Motiff妙多中可使用AI生成UI功能,輸入

“社交APP聊天界面,有聊天輸入框、發(fā)送按鈕、聊天記錄展示區(qū)等”

的需求,模型生成初步設計稿,利用AI布局功能調整元素位置和排版,用AI一致性檢查功能檢查是否符合設計規(guī)范,再通過AI魔法框在聊天輸入框附近添加提示文案等細節(jié)內容,對生成的設計稿不滿意還可再次輸入指令讓模型重新生成或修改。1.3.4認知Motiff妙多大模型技術特點是采用類Sora的DiT結構,用Transformer取代傳統(tǒng)的卷積網(wǎng)絡結構,提升了模型的處理和生成能力。使用flow模型作為擴散模型基座,并使用分布式訓練集群,通過算子優(yōu)化和重算策略優(yōu)化,顯著提升了硬件利用率。構建了完備的標簽體系,從視頻基礎質量、美學和自然度等多個維度對視頻數(shù)據(jù)進行篩選和優(yōu)化,并研發(fā)了視頻描述模型,大幅提升了視頻生成模型的文本指令響應能力。在訓練過程中,采用分階段訓練策略,初期階段通過大量數(shù)據(jù)增強模型對概念的理解,后期階段通過高質量數(shù)據(jù)進一步提升模型性能和細節(jié)表現(xiàn)。1.3.5認知可靈AI應用亮點:支持生成長達2分鐘的30fps視頻,分辨率高達

1080p,并且支持多種寬高比;用戶可通過“運動筆刷”為圖片中的元素指定運動軌跡,還能為某些元素額外指定靜止區(qū)域,讓視頻內容有更好的運動控制及運動表現(xiàn);

在圖生視頻時,能根據(jù)圖片和提示詞生成細節(jié)豐富、邏輯合理的視頻;支持多種尺寸格式的圖片生成視頻。1.3.5認知可靈AI騰訊智影上線。騰訊智影是騰訊公司開發(fā)的云端智能視頻創(chuàng)作工具,于2023年3月上線以來,在不斷發(fā)展中功能日益豐富,逐漸成為行業(yè)內具有影響力的創(chuàng)作平臺,該平臺涵蓋智影數(shù)字人、文本配音、文章轉視頻等AI創(chuàng)作工具,致力于降低視頻制作成本,提高生產效率。

其數(shù)字人功能不斷完善,支持文本或音頻識別,能在幾分鐘內生成數(shù)字人播報視頻,還可實現(xiàn)針對真人的

“形象克隆”

“聲音克隆”

,創(chuàng)作者上傳少量素材就能得到數(shù)字人分身和定制音色。文本配音功能提供近百種仿真聲線,支持手動調整語音倍速、局部變速、多音字和停頓,還支持方言播報。視頻剪輯功能也不斷豐富,提供專業(yè)易用的視頻剪輯器,支持多軌道剪輯、添加特效與轉場等操作。在教育領域,數(shù)字人播報功能為教師提供全新教學方式,可創(chuàng)建生動有趣的虛擬角色授課,特殊情況下還能替代教師授課,確保教學進度。在電商直播領域,數(shù)字人可實現(xiàn)7*24小時不間斷直播。1.3.6認知騰訊智影操作方法簡介:1.打開騰訊智影官網(wǎng),如圖1-12所示。2.單擊右上角的“登錄”按鈕

,彈出登錄/注冊對話框,提供微信登錄、手機號登錄、QQ登錄三種登錄方式。未注冊的用戶選擇手機號登錄,輸入手機號和驗證碼,單擊“登錄/注冊”按鈕

,登錄并自動注冊。如圖1-13所示。進入騰訊智影首頁,智影首頁分為四個部分,頂部是焦點圖推薦新功能等,左側為導航欄,中部是工具導航,底部是近期的視頻項目列表。如圖1-14所示。1.3.6認知騰訊智影圖1-12官網(wǎng)界面圖1-14工作界面圖1-13登錄界面3.單擊頂部焦點圖數(shù)字人播報中的“去創(chuàng)作”按鈕

,或單擊中部“數(shù)字人播報”工具

,進入數(shù)字人播報創(chuàng)作界面。創(chuàng)作界面由①主顯示/預覽區(qū)、②軌道區(qū)、③編輯區(qū)、④工具欄、⑤工具展開列表、⑥合成按鈕等組成。如圖1-15所示。4.單擊左側工具欄的“PPT模式”按鈕

,單擊工具展開列表上部的“上傳PPT或PDF”按鈕

,彈出“打開”對話框,找到素材“大學信息技術基礎課程PPT”并單擊選中。如圖1-16所示。1.3.6認知騰訊智影圖1-15數(shù)字人創(chuàng)作界面圖1-16導入PPT5.單擊“打開”對話框右下角的“打開”按鈕

,彈出即將導入PPT對話框,如圖1-17所示。6.單擊“覆蓋當前”按鈕,導入完成后,PPT顯示在工具展開列表、預覽區(qū)和軌道區(qū)中,并自動生成數(shù)字人。如圖1-18所示。1.3.6認知騰訊智影圖1-17檢測界面圖1-18生成數(shù)字人7.單擊選中第一張幻燈片,單擊左側工具欄的“數(shù)字人”按鈕

,單擊展開列表的“預覽效果”選項,選擇一個你想要的數(shù)字人形象。如圖1-19所示。8.單擊監(jiān)視器中的數(shù)字人,在右側編輯區(qū),進行更換服裝、更換服裝顏色、更改蒙板形狀和改變動作的數(shù)字人編輯。如圖1-20所示。1.3.6認知騰訊智影圖1-19選擇數(shù)字人圖1-20設置參數(shù)9.在右側的對話框中,單擊“畫面”選項,進行基礎調節(jié)。要改變數(shù)字人的位置,在編輯區(qū)中輸入坐標值,或按住鼠標左鍵拖動預覽區(qū)中的數(shù)字人到合適位置后釋放鼠標左鍵。要調節(jié)數(shù)字人的大小,改變編輯區(qū)中縮放比例,或按住鼠標左鍵拖動預覽區(qū)中數(shù)字人選區(qū)的任一角節(jié)點到合適大小后釋放鼠標左鍵。如圖1-21所示。10.單擊監(jiān)視器左下角畫面比例顯示框

,在彈出的下拉菜單中選擇合適的比例,一般電腦橫屏選擇16:9,手機豎屏選擇9:16。如圖1-22所示。1.3.6認知騰訊智影圖1-22設置顯示比例圖1-21調整參數(shù)11.單擊預覽區(qū)右下角“字幕”按鈕,選擇開啟或關閉字幕。12.單擊預覽區(qū)空白處,單擊右側編輯區(qū)的“導入文庫”按鈕,導入素材“第1張幻燈片視頻旁白”,或打開“第1張幻燈片視頻旁白”文檔,將內容復制粘貼到文本輸入框中。設置插入停頓、檢查多音字和數(shù)字符號等。如果對視頻腳本不滿意,可以在編輯區(qū)中進行改寫、擴寫和縮寫。如圖1-23所示。1.3.6認知騰訊智影圖1-23導入文本信息13.單擊編輯區(qū)文本框左下角的音色頭像按鈕“1.0”彈出選擇音色對話框。如圖1-24所示。選擇想要的音色,拖動左下角“讀速”的控制點調節(jié)讀速,一般1.0為正常讀速,單擊“確認”按鈕。1.3.6認知騰訊智影圖1-24設置聲音14.單擊右側編輯區(qū)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論