大學(xué)計算機(jī)-計算思維與人工智能（第2版）課件第8章人工智能典型應(yīng)用

上傳人：y*** IP屬地：山東上傳時間：2025-12-28 格式：PPTX 頁數(shù)：93 大?。?5.19MB 積分：15 舉報 版權(quán)申訴

大學(xué)計算機(jī)-計算思維與人工智能（第2版）課件第8章人工智能典型應(yīng)用_第2頁

大學(xué)計算機(jī)-計算思維與人工智能（第2版）課件第8章人工智能典型應(yīng)用_第3頁

大學(xué)計算機(jī)-計算思維與人工智能（第2版）課件第8章人工智能典型應(yīng)用_第4頁

大學(xué)計算機(jī)-計算思維與人工智能（第2版）課件第8章人工智能典型應(yīng)用_第5頁

已閱讀5頁，還剩88頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第8章人工智能典型應(yīng)用content重點(diǎn)難點(diǎn)重點(diǎn)：1.AIGC的應(yīng)用2.創(chuàng)建智能體3.工作流的創(chuàng)建難點(diǎn)：1.AIGC的關(guān)鍵技術(shù)2.工作流的創(chuàng)建Contents目錄8.1AIGC簡介8.2AIGC的應(yīng)用8.3創(chuàng)建智能體8.4工作流的使用8.5AIGC的社會價值與發(fā)展挑戰(zhàn)8.1AIGC簡介8.1.1AIGC的定義騰訊發(fā)布的《AIGC發(fā)展趨勢報告2023》指出，狹義上的AIGC是“繼專業(yè)生成內(nèi)容（ProfessionalGeneratedContent,PGC）和用戶生成內(nèi)容（UserGeneratedContent,UGC）之后，利用人工智能技術(shù)自動生成內(nèi)容的一種新型生產(chǎn)方式”。廣義上的AIGC可以視為“像人類一樣具備生成創(chuàng)造能力的AI技術(shù)，它能基于訓(xùn)練數(shù)據(jù)和生成算法模型，自主生成新的文本、圖像、音樂、3D交互內(nèi)容（如虛擬化身、虛擬物品、虛擬環(huán)境）等各種形式的內(nèi)容和數(shù)據(jù)，甚至包括開啟科學(xué)新發(fā)現(xiàn)、創(chuàng)造新的價值和意義等”。麥肯錫的定義是：生成式人工智能旨在以一種接近人類行為的方式與人類進(jìn)行交互式協(xié)作。Gartner的定義是：生成式人工智能是一種顛覆性技術(shù)，它能生成以往依賴于人類創(chuàng)造的內(nèi)容，且能在無人類經(jīng)驗和思維過程偏見的情況下提供創(chuàng)新的結(jié)果。信通院的定義是：AIGC既是從內(nèi)容生產(chǎn)者視角進(jìn)行分類的一類內(nèi)容，又是一種內(nèi)容生產(chǎn)方式，還是一類用于內(nèi)容自動化生成的技術(shù)集合。8.1.2AIGC的關(guān)鍵技術(shù)1.生成算法模型生成算法模型通過概率建模與對抗學(xué)習(xí)，使AI能夠生成高質(zhì)量文本、圖像、音頻、視頻甚至3D內(nèi)容，主要包括：（1）生成對抗網(wǎng)絡(luò)（2014年）：（2）Transformer模型（2017年）：（3）擴(kuò)散模型（2020年以后）：2.預(yù)訓(xùn)練模型預(yù)訓(xùn)練模型通過自監(jiān)督學(xué)習(xí)從大規(guī)模數(shù)據(jù)中提取通用表征，顯著降低下游任務(wù)開發(fā)成本，推動AI工業(yè)化進(jìn)程。預(yù)訓(xùn)練模型引發(fā)了AIGC技術(shù)能力的質(zhì)變。AI預(yù)訓(xùn)練模型，又稱為大模型、基礎(chǔ)模型（foundationmodels），是一種基于大量數(shù)據(jù)，通常使用大規(guī)模自監(jiān)督學(xué)習(xí)訓(xùn)練的擁有巨量參數(shù)的模型。按照應(yīng)用領(lǐng)域分類預(yù)訓(xùn)練模型包括：自然語言處理（NLP）預(yù)訓(xùn)練模型、計算機(jī)視覺（CV）預(yù)訓(xùn)練模型、多模態(tài)預(yù)訓(xùn)練模型。3.多模態(tài)技術(shù)多模態(tài)技術(shù)能夠以不同角度和感知方式獲取數(shù)據(jù)，并將這些數(shù)據(jù)進(jìn)行融合和整合。多模態(tài)預(yù)訓(xùn)練模型致力于處理不同模態(tài)、不同來源、不同任務(wù)的數(shù)據(jù)和信息。主要的技術(shù)突破包括：（1）CLIP（ContrastiveLanguage-ImagePre-training，2021年）（2）DALL.E系列（2021年—2022年）（3）多模態(tài)大模型（2023年以后）8.1.3AIGC的主要功能AIGC是通過人工智能技術(shù)自動生成多模態(tài)內(nèi)容的技術(shù)范式，其核心應(yīng)用涵蓋文本、圖像、語音、視頻四大領(lǐng)域。以下分述其功能與技術(shù)實現(xiàn)：1．文本生成（AITextGeneration）2．圖像生成（AIImageGeneration）3．語音生成（AIAudioGeneration）4．視頻生成（AIVideoGeneration）AIGC主要基于機(jī)器學(xué)習(xí)，尤其是深度學(xué)習(xí)技術(shù)，涵蓋自然語言處理（NLP）、計算機(jī)視覺（CV）及多模態(tài)建模。這些技術(shù)通過數(shù)學(xué)建模與模式識別，而非直接模仿人腦，使AI能夠?qū)W習(xí)數(shù)據(jù)分布并生成類人內(nèi)容。在文本內(nèi)容生成中，自然語言處理（NLP）起著核心作用?；赥ransformer架構(gòu)的生成式預(yù)訓(xùn)練模型，可以通過海量文本數(shù)據(jù)學(xué)習(xí)語言規(guī)律。模型通過自注意力機(jī)制捕捉長距離依賴，基于概率采樣生成連貫文本。在圖像內(nèi)容生成中，計算機(jī)視覺技術(shù)發(fā)揮關(guān)鍵作用，主要的技術(shù)包括擴(kuò)散模型，如StableDiffusion、生成對抗網(wǎng)絡(luò)（GAN）。音頻和視頻內(nèi)容生成同樣利用了深度學(xué)習(xí)技術(shù)。8.1.4AIGC的工作原理2.AIGC的工作流程:(1)數(shù)據(jù)收集與處理(2)模型選擇與訓(xùn)練(3)特征學(xué)習(xí)與優(yōu)化(4)內(nèi)容生成與后處理(5)反饋與迭代8.1.5國內(nèi)外主流的AI大模型1．國外大模型產(chǎn)品（1）OpenAI的GPT大模型生成式預(yù)訓(xùn)練變換器（GenerativePre-trainedTransformer，GPT）是一種基于Transformer架構(gòu)的先進(jìn)人工智能語言模型，能夠通過深度學(xué)習(xí)技術(shù)理解和生成自然語言文本。（2）GeminiGemini是一款由GoogleDeepMind于2023年12月6日發(fā)布的人工智能模型。它功能強(qiáng)大，具備同時識別文本、圖像、音頻、視頻以及代碼這五類信息的能力。美國當(dāng)?shù)貢r間2024年2月15日，美國人工智能研究公司OpenAI正式對外發(fā)布了人工智能文生視頻大模型Sora，可以快速制作最長一分鐘、準(zhǔn)確反映用戶提示、可一鏡到底的視頻，該模型了解這些物體在物理世界中的存在方式，可以深度模擬真實物理世界，能生成具有多個角色、包含特定運(yùn)動的復(fù)雜場景。（3）Sora2．國內(nèi)大模型產(chǎn)品（1）百度的文心大模型文心大模型是百度自主研發(fā)的知識增強(qiáng)型產(chǎn)業(yè)級大模型體系，基于飛槳（PaddlePaddle）深度學(xué)習(xí)框架構(gòu)建，深度融合行業(yè)知識與應(yīng)用場景，覆蓋自然語言處理、計算機(jī)視覺、跨模態(tài)、生物計算及垂直行業(yè)五大方向。（2）科大訊飛的訊飛星火認(rèn)知大模型訊飛星火認(rèn)知大模型是科大訊飛發(fā)布的大模型。主要功能如下：文本生成語言理解知識問答邏輯推理數(shù)學(xué)能力代碼能力多模交互（3）DeepSeek大模型中國初創(chuàng)公司深度求索（DeepSeek）是一家創(chuàng)新型科技公司，成立于2023年，專注于通過數(shù)據(jù)蒸餾技術(shù)優(yōu)化訓(xùn)練數(shù)據(jù)集，并開發(fā)先進(jìn)的大語言模型（LLM）及相關(guān)技術(shù)，成立一年內(nèi)即實現(xiàn)“低成本對標(biāo)頂尖性能”的技術(shù)突破。（4）豆包豆包是字節(jié)跳動公司基于云雀模型開發(fā)的AI工具，提供聊天機(jī)器人、寫作助手以及英語學(xué)習(xí)助手等功能，它可以回答各種問題并進(jìn)行對話，幫助人們獲取信息，豆包算法是一種基于Transformer架構(gòu)的語言模型，通過前文預(yù)測下一個最可能的詞語來實現(xiàn)文本生成。2025年3月28日，豆包測試了新版“深度思考”功能，該功能將推理過程的思維鏈與搜索深度結(jié)合，支持“邊想邊搜”。（5）通義千問通義，由通義千問更名而來，是阿里云推出的語言模型，2023年9月13日正式向公眾開放。是一個MaaS（模型即服務(wù)）的底座，為多模態(tài)大模型(MultimodalModels)。具備全副AI能力，致力于成為人們的工作、學(xué)習(xí)、生活助手。（6）KimiKimi是北京月之暗面科技有限公司于2023年10月9日推出的一款智能助手。主要有6項功能：長文總結(jié)和生成、聯(lián)網(wǎng)搜索、數(shù)據(jù)處理、編寫代碼、用戶交互、翻譯。是全球首個支持輸入20萬漢字的智能助手產(chǎn)品。（7）騰訊混元大模型騰訊混元大模型（TencentHunyuan）是由騰訊公司研發(fā)的大語言模型，該模型基于Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu)，具有萬億參數(shù)規(guī)模，具備強(qiáng)大的中文創(chuàng)作能力、復(fù)雜語境下的邏輯推理能力，以及可靠的任務(wù)執(zhí)行能力，屬于深度合成和生成式人工智能技術(shù)。8.2AIGC的應(yīng)用8.2.1使用提示詞與AI高效溝通1.提示詞工程提示詞工程（PromptEngineering）也稱“指令工程”，是通過設(shè)計和優(yōu)化輸入指令來引導(dǎo)生成式AI模型輸出更精準(zhǔn)、更符合需求內(nèi)容的技術(shù)體系。8.2AIGC的應(yīng)用按任務(wù)類型可以將大模型分為推理大模型和非推理大模型兩大類。推理大模型、非推理大模型。模型類型技術(shù)特性提示策略推理大模型強(qiáng)化邏輯推理與符號計算能力，支持?jǐn)?shù)學(xué)證明、代碼調(diào)試等任務(wù)因其已內(nèi)化推理邏輯，提示語應(yīng)更簡潔，只需明確任務(wù)目標(biāo)和需求。無須逐步指導(dǎo)，模型自動生成結(jié)構(gòu)化推理過程，若強(qiáng)行拆解步驟，反而可能限制其能力。通用大模型側(cè)重語言生成與上下文理解，擅長創(chuàng)意寫作、文本摘要等開放任務(wù)需顯式引導(dǎo)推理步驟，否則可能跳過關(guān)鍵邏輯。依賴提示語補(bǔ)償能力短板（如要求分步思考、提供示例）。2.提示詞策略2.提示詞策略例如，現(xiàn)在有一個證明勾股定理的任務(wù)，這是一個數(shù)學(xué)任務(wù)，推理模型更擅長，可以選擇DeepSeek大模型，Prompt就可以寫成：“證明勾股定理”，直接提問，無須分步引導(dǎo)。3.提示詞結(jié)構(gòu)提示語的基本結(jié)構(gòu)一般包括指令、上下文和期望。（1）指令（Instruction）（2）上下文（Context）（3）期望（Expectation）4.優(yōu)化提示語的關(guān)鍵策略（1）精準(zhǔn)任務(wù)定義（2）復(fù)雜任務(wù)拆解（3）控制生成自由度（4）引入引導(dǎo)性問題，提升生成內(nèi)容的深度（5）控制提示詞長度，確保生成的準(zhǔn)確性使用指令模板可以提高AI回答的準(zhǔn)確性。例如：使用文心一言的Prompt模板“一言百寶箱”生成提示詞的步驟如下：（1）首先打開文心一言官網(wǎng)，在對話界面選擇“我的指令”->“一言百寶箱”選項，選擇“場景”選項。（2）選擇“數(shù)據(jù)分析”使用場景，然后選擇“折線圖生成”選項，單擊“使用”按鈕，默認(rèn)生成的指令為：“請用[折線圖]展示[世界人口增長趨勢]”。（3）可以根據(jù)實際情況對指令模板進(jìn)行修改5.使用指令模板生成提示詞1．文心一言生成新聞稿AIGC可以輔助完成各類任務(wù)，其中包括撰寫常見的新聞文本。例如：學(xué)校的辯論賽剛剛結(jié)束，作為一名校園記者，需要撰寫一篇報道該活動的新聞稿的步驟如下：（1）打開“文心一言”大語言模型官網(wǎng)，登錄后選擇“創(chuàng)意寫作”選項，在體裁模板中選擇“新聞媒體”模板，選擇“活動新聞”類型。（2）在右下角prompt模板中，修改指令模板為：“幫我寫一個校園辯論賽的新聞稿，要求是按照新聞的基本框架撰寫，辯題“社交媒體對大學(xué)生的影響利大于弊還是弊大于利”，法學(xué)院奪冠，時間2025年3月20日，500字左右”8.2.2AIGC在文本處理中的應(yīng)用2.通義千問高效閱讀學(xué)術(shù)論文DeepSeek、文心一言、通義千問、豆包、Kimi等大模型都支持文檔閱讀，例如：利用通義千問完成學(xué)術(shù)論文的高效閱讀，操作步驟如下：（1）首先打開通義千問大模型官網(wǎng)，單擊導(dǎo)航欄中的“發(fā)現(xiàn)”選項，然后選擇“閱讀助手”工具。（2）將提前準(zhǔn)備好的論文通過拖拽或單擊“添加”按鈕的方式，將論文上傳至通義千問的“閱讀助手”中，單擊頁面下方的“最近記錄”中已上傳的論文，可以進(jìn)入“閱讀助手”頁面。2.通義千問高效閱讀學(xué)術(shù)論文（3）單擊“導(dǎo)讀”頁面，通過“全文摘要”和“論文速讀”兩項內(nèi)容，可以快速了解論文的主要內(nèi)容和研究目的，對論文的整體內(nèi)容有一個初步認(rèn)識。2.通義千問高效閱讀學(xué)術(shù)論文（4）單擊“翻譯”頁面，通過“中英互譯”功能，將中文論文翻譯成英文，或者將英文論文翻譯成中文。2.通義千問高效閱讀學(xué)術(shù)論文（5）單擊“腦圖”頁面，可以看到大模型根據(jù)論文生成的思維導(dǎo)圖，幫助用戶以可視化的方式理解和組織學(xué)術(shù)論文的內(nèi)容。2.通義千問高效閱讀學(xué)術(shù)論文（6）單擊“筆記”頁面，在閱讀論文時，可以結(jié)合論文的結(jié)構(gòu)和關(guān)鍵點(diǎn)，逐段閱讀并做筆記。很多大模型提供了制作PPT的功能，將生成的文本以更直觀的方式表達(dá)，快速幫助用戶完成任務(wù)。例如：使用Kimi制作一個關(guān)于人工智能簡介的PPT，其操作步驟如下：（1）首先打開Kimi官網(wǎng)，單擊左側(cè)導(dǎo)航欄中的“PPT助手”選項。（2）在對話窗口輸入提示詞，如果有相關(guān)文件，可以單擊“上傳文件”按鈕進(jìn)行上傳，單擊“發(fā)送”按鈕即可生成大綱內(nèi)容。（3）單擊“一鍵生成PPT”按鈕，選擇一個適合的模板，單擊“生成PPT”按鈕，在此界面可以單擊“去編輯”按鈕，對PPT做進(jìn)一步的修改編輯，最后單擊“下載”按鈕，將制作好的PPT下載至本地。3.Kimi制作PPT4.豆包文本翻譯AIGC工具可以將一種語言的文本翻譯成另一種語言的文本，幫助用戶克服語言障礙。很多大模型都提供了翻譯功能。例如：使用豆包翻譯一本英文小說的目錄，其操作步驟如下：（1）打開豆包官網(wǎng)，選擇“翻譯”選項。將要翻譯的內(nèi)容輸入到對話框中，這里輸入一本英文小說的目錄。（2）單擊“發(fā)送”按鈕后，豆包的翻譯結(jié)果如圖所示。從本例中可以看到大模型對用戶提供的英文目錄進(jìn)行了翻譯，翻譯的內(nèi)容較完整，準(zhǔn)確性較高。當(dāng)然，某些細(xì)節(jié)處還需要進(jìn)一步修改。8.2.3AIGC在繪畫中的應(yīng)用1．用AIGC工具生成圖像使用AIGC工具可以生成符合用戶需要的圖片?？梢陨蓤D像的工具很多，比如即夢AI、文心一言、豆包、Midjourney、DALL.E2、騰訊智影等。即夢AI是由深圳市臉萌科技有限公司開發(fā)的一款為創(chuàng)意愛好者打造的AI表達(dá)平臺，具有AI圖片創(chuàng)作、視頻創(chuàng)作、探索創(chuàng)意世界等功能。下面演示使用即夢AI生成一幅創(chuàng)意圖片的步驟。步驟1：打開即夢AI官網(wǎng)，單擊AI作圖中的“圖片生成”按鈕。步驟2：設(shè)置圖片提示詞及參數(shù)。步驟3：單擊“立即生成”。（1）即夢AI生成創(chuàng)意圖片百度AI圖片助手，是一款引領(lǐng)潮流的智能圖像編輯工具。例如：使用百度AI圖片助手，對一張尺寸較小且分辨率較低的圖片進(jìn)行擴(kuò)展并提升分辨率，操作步驟如下：步驟1：訪問百度AI圖片助手官網(wǎng)，登錄后導(dǎo)入一張像素為300*200的低像素圖片。上傳圖片后，百度AI圖片助手默認(rèn)進(jìn)行了一次“清晰化”操作。步驟2：在右側(cè)的“選擇編輯方式”區(qū)域選擇需要的編輯方式，比如選擇“AI擴(kuò)圖”，選擇擴(kuò)展比例為“1：1”。步驟3：單擊“立即生成”按鈕，稍等片刻后，在生成4張圖片中選擇一幅滿意的圖片單擊“下載”按鈕，即可得到一張1024*1024像素的AI擴(kuò)展圖。（2）百度AI圖片助手完成圖片擴(kuò)展及高清化騰訊智影具有AI繪畫能力，利用深度學(xué)習(xí)算法和大量圖像數(shù)據(jù)，可以幫助用戶輕松地生成各類繪畫作品。由底圖生成圖片的步驟如下：步驟1：打開“騰訊智影”官網(wǎng)并登錄，選擇“智能畫布”選項，選擇左側(cè)導(dǎo)航欄中“圖生圖”選項。步驟2：在“參考圖”處單擊“添加圖片”按鈕，上傳一張圖片作為參考圖片，在“畫面描述”對話框中輸入提示詞，模型主題選擇“漫繪V2”主題，畫面比例選擇“1：1”，分辨率選擇“1024*1024”。步驟3：單擊“生成繪畫”按鈕，生成的圖像效果如圖所示。（3）騰訊智影圖片控制生圖還可以使用AIGC工具完成一些設(shè)計任務(wù)，以下是使用騰訊智影進(jìn)行設(shè)計的大致步驟：步驟1：登錄“騰訊智影”官網(wǎng)，在主頁選擇“AI繪畫”，點(diǎn)擊“去創(chuàng)作”按鈕。步驟2：在“由底圖生成”區(qū)域單擊“添加圖片”按鈕，選擇一張圖片，模型主題中選擇“建筑設(shè)計”主題。再調(diào)整頁面中“效果預(yù)設(shè)”，如選擇“好看的燈光”、“鳥瞰圖”、“建筑渲染”，再選擇生成圖像的數(shù)量。步驟3：單擊“生成繪畫”按鈕，生成如圖所示的圖像。（4）騰訊智影完成設(shè)計任務(wù)2.用AIGC工具進(jìn)行3D藝術(shù)創(chuàng)作AIGC工具可以輔助設(shè)計師快速生成3D藝術(shù)作品，提高設(shè)計的效率，節(jié)省時間。下面演示使用騰訊智影進(jìn)行3D藝術(shù)創(chuàng)作的步驟及方法。步驟1：進(jìn)入騰訊智影平臺，在主頁選擇“AI繪畫”，點(diǎn)擊“去創(chuàng)作”按鈕進(jìn)入該模塊。步驟2：如在“畫面描述”對話框中輸入以下提示詞，“模型主題”處選擇“寫實增強(qiáng)”主題，“畫面比例”選擇“1:1”，“效果預(yù)設(shè)”選擇“晨光”光照效果、“人在遠(yuǎn)方”視角、“真實感”鏡頭效果，“生成數(shù)量”選擇“4”，如圖所示。2.用AIGC工具進(jìn)行3D藝術(shù)創(chuàng)作步驟3：設(shè)置好所有參數(shù)后，單擊“生成繪畫”按鈕，即可得到最終的3D效果圖，從生成的4幅圖像中選擇一幅比較符合要求的即可，效果如圖所示。2.用AIGC工具進(jìn)行藝術(shù)風(fēng)格遷移藝術(shù)風(fēng)格遷移是一種將一幅圖像的風(fēng)格應(yīng)用到另一幅圖像上的技術(shù)，通過算法將源圖像的風(fēng)格特征轉(zhuǎn)移到目標(biāo)圖像上，使得目標(biāo)圖像呈現(xiàn)出源圖像的風(fēng)格效果。下面使用通義萬相做藝術(shù)風(fēng)格遷移演示。步驟1：準(zhǔn)備一幅圖片，如印象主義油畫圖片，如圖所示。步驟2：準(zhǔn)備需要進(jìn)行藝術(shù)風(fēng)格遷移的圖片，這里準(zhǔn)備一張超現(xiàn)實主義藝術(shù)風(fēng)格的圖像，如左1圖所示。步驟3：在瀏覽器中輸入通義萬相網(wǎng)址，選擇左側(cè)導(dǎo)航欄中的“應(yīng)用廣場”選項，再選擇“風(fēng)格遷移”選項，打開如左2圖所示頁面。步驟4：將“印象主義藝術(shù)圖像”拖拽到“風(fēng)格圖”處，將“超現(xiàn)實主義藝術(shù)風(fēng)格圖像”拖拽到“原圖”中。步驟5：單擊“生成畫作”按鈕。圖片藝術(shù)風(fēng)格遷移后的效果如左3圖所示。用AIGC工具進(jìn)行藝術(shù)風(fēng)格遷移1.通義萬相視頻生成下面介紹使用通義萬相生成視頻的方法：步驟1：在瀏覽器中輸入通義萬相的網(wǎng)址打開主頁，選擇“視頻生成”選項-->“文生視頻”。步驟2：設(shè)置提示詞及參數(shù)。在文字提示處輸入預(yù)想的畫面，盡量描述具體，選擇“16:9”的比例，添加“視頻音效”。步驟3：選擇“生成視頻”按鈕，等待幾分鐘后即可獲得視頻，生成效果如圖所示。8.2.4AIGC在視頻生成與剪輯中的應(yīng)用例如：使用騰訊智影制作數(shù)字人課程教學(xué)視頻。步驟1：在瀏覽器中輸入騰訊智影網(wǎng)址，選擇“數(shù)字人播報”模塊。這里直接選擇“PPT模式”，單擊頁面左上角的“上傳PPT或PDF”按鈕，將準(zhǔn)備好的PPT導(dǎo)入。步驟2：將每頁P(yáng)PT的解說詞填寫到右側(cè)的“播報內(nèi)容”中，如果沒有播報內(nèi)容，可以讓AI創(chuàng)作文章。步驟3：選擇左側(cè)的“數(shù)字人”選項，選擇喜歡的數(shù)字人形象，可以通過拖拽的方式改變數(shù)字人的位置和大小，如圖所示。步驟4：單擊：“合成視頻”按鈕，即可得到數(shù)字人播報的課程視頻。2.騰訊智影數(shù)字人生成下面介紹使用訊飛智作進(jìn)行語音生成的步驟：步驟1：在瀏覽器中輸入“訊飛智作”網(wǎng)址，打開訊飛智作首頁，選擇“訊飛配音”模塊。步驟2：選擇一種合適的“主播”，將要朗讀的文本復(fù)制到“本文輸入”區(qū)域，如需添加背景音樂可以選擇頁面右上部的“背景音樂”選項，選擇一個背景音樂，單擊“使用”按鈕。步驟3：單擊“生成音頻”按鈕即可生成語音。如圖所示。1.訊飛智作語音生成下面介紹使用“通義聽悟”進(jìn)行語音識別的步驟。步驟1：通過瀏覽器訪問通義聽悟，進(jìn)入主頁，選擇“上傳音視頻”模塊。步驟2：選擇一個音頻文件，單擊“開始轉(zhuǎn)寫”按鈕。2.通義聽悟語音識別8.3創(chuàng)建智能體8.3創(chuàng)建智能體8.3.1智能體簡介智能體（Agent）是指能夠感知環(huán)境并采取行動以實現(xiàn)特定目標(biāo)的代理體。它可以是軟件、硬件或一個系統(tǒng)，具備自主性、適應(yīng)性和交互能力。1.智能體的主要特征（1）自主性（2）反應(yīng)性（3）目標(biāo)導(dǎo)向（4）進(jìn)化性’（5）交互性2.智能體的工作原理核心工作機(jī)制如下：（1）感知（2）決策（3）執(zhí)行（4）學(xué)習(xí)8.3.2基于大模型的智能體1.扣子（Coze）Coze是一款由字節(jié)跳動推出的低代碼或無代碼AI開發(fā)平臺，旨在幫助用戶快速構(gòu)建、部署和管理智能體（Agent）。具有以下特點(diǎn)：（1）靈活的工作流設(shè)計（2）無限拓展的能力集

（3）豐富的數(shù)據(jù)源（4）持久化的記憶能力2.百度文心智能體文心智能體平臺AgentBuilder，是基于文心大模型的智能體構(gòu)建平臺，為開發(fā)者提供低成本的開發(fā)方式，支持廣大開發(fā)者根據(jù)自身行業(yè)領(lǐng)域、應(yīng)用場景，采用多樣化的能力、工具，打造大模型時代的原生應(yīng)用。其核心能力包括：（1）零基礎(chǔ)自然語言創(chuàng)建（2）數(shù)字形象一鍵配置（3）高兼容數(shù)據(jù)集能力（4）多樣化工具插件（5）百度生態(tài)流量分發(fā)（6）數(shù)據(jù)飛輪全面調(diào)優(yōu)3.OpenAIOperatorOperator是OpenAI于2025年1月推出的全新AI助理產(chǎn)品。支持Operator的是簡稱CUA的模型，是一種通過強(qiáng)化學(xué)習(xí)將OpenAI旗艦?zāi)Ｐ虶PT-4o的視覺功能與高級推理相結(jié)合的模型。Operator能像人類一樣使用互聯(lián)網(wǎng)，通過打開瀏覽器，自如地單擊頁面按鈕、輸入文本內(nèi)容，獨(dú)立完成各類復(fù)雜任務(wù)。支撐Operator的核心技術(shù)Computer-UsingAgent（CUA），被訓(xùn)練用于與圖形用戶界面GUI（在屏幕上看到的按鈕、菜單和文本框）進(jìn)行交互，就像人類一樣。例如：創(chuàng)建一個聊天機(jī)器人智能體，以下是使用Coze平臺制作智能體的步驟，涵蓋從環(huán)境配置到部署的全流程。1．創(chuàng)建智能體（1）訪問Coze官網(wǎng)，注冊賬號并登錄，單擊左側(cè)導(dǎo)航欄的“工作空間”選項，單擊右上角“+創(chuàng)建”按鈕，選擇“創(chuàng)建智能體”選項，單擊“創(chuàng)建”按鈕。8.3.3使用Coze創(chuàng)建智能體（2）按要求填寫智能體信息，“智能體名稱”中輸入智能體名稱如“HeartLink”。在“智能體功能介紹”中簡要說明功能如“AI聊天機(jī)器人”?！皥D標(biāo)”可以通過AI自動生成，也可以本地上傳圖片。填寫完成后，單擊“確認(rèn)”按鈕。1.創(chuàng)建智能體（3）創(chuàng)建智能體后，直接進(jìn)入智能體編排頁面。1.創(chuàng)建智能體在智能體編排頁面的“人設(shè)與回復(fù)邏輯”面板中輸入提示詞。例如聊天機(jī)器人的提示詞可以設(shè)置為右側(cè)提示詞?？梢詥螕簟皟?yōu)化”按鈕，讓大語言模型將提示詞優(yōu)化為結(jié)構(gòu)化內(nèi)容。2.編寫提示詞當(dāng)模型能力能夠基本涵蓋智能體所需功能時，僅需為智能體精心編寫提示詞，即可使其高效運(yùn)作。若為智能體規(guī)劃的功能超出模型能力范疇，就必須為智能體增設(shè)技能，以拓展其能力邊界。3.為智能體添加技能（添加插件）修改“人設(shè)與回復(fù)邏輯”面板，指示智能體使用“必應(yīng)搜索”插件來回答自己不確定的問題。在“技能”處添加如下提示詞：###技能4:回答專業(yè)問題遇到無法回復(fù)的問題時，調(diào)用“必應(yīng)搜索”搜索答案。修改后的“人設(shè)與回復(fù)邏輯”如圖所示。3.為智能體添加技能（添加插件）為智能體添加開場白、用戶問題建議、背景圖片、選擇“語音”等增強(qiáng)對話體驗。3.為智能體添加技能（添加插件）配置好智能體后，就可以在“預(yù)覽與調(diào)試”區(qū)域中測試智能體是否符合預(yù)期。4.調(diào)試智能體發(fā)布的步驟如下：（1）在智能體的編排頁面右上角，單擊“發(fā)布”按鈕。（2）在發(fā)布頁面輸入“發(fā)布記錄”，單擊“Tab”鍵可以自動生成發(fā)布記錄。（3）選擇發(fā)布平臺，最后單擊“發(fā)布”按鈕即可，如圖所示。5.發(fā)布智能體（4）發(fā)布成功后，在“發(fā)布管理”中可以查看智能體的使用日志。5.發(fā)布智能體8.4工作流的使用8.4工作流的使用8.4.1工作流簡介1．什么是工作流工作流，作為一系列可執(zhí)行指令集合，旨在達(dá)成特定業(yè)務(wù)邏輯或完成指定任務(wù)。它為應(yīng)用程序與智能體的數(shù)據(jù)交互及任務(wù)處理構(gòu)建了一個嚴(yán)謹(jǐn)?shù)慕Y(jié)構(gòu)化框架。Coze平臺提供了一個可視化畫布，用戶僅需簡單地拖拽節(jié)點(diǎn)，便能迅速搭建個性化工作流，極大簡化了工作流的構(gòu)建流程。2.工作流與對話流扣子平臺提供以下兩類工作流，以滿足多樣化的業(yè)務(wù)需求：工作流（Workflow）：主要用于處理功能性請求，它能夠按照順序依次執(zhí)行一系列節(jié)點(diǎn)，從而達(dá)成特定功能。對話流（Chatflow）：這是一種專門為對話場景打造的特殊工作流，尤其擅長處理對話類請求。3.工作流的核心要素——節(jié)點(diǎn)工作流涵蓋的開始節(jié)點(diǎn)、結(jié)束節(jié)點(diǎn)、輸出節(jié)點(diǎn)、插件節(jié)點(diǎn)、子工作流節(jié)點(diǎn)、代碼節(jié)點(diǎn)、SQL自定義節(jié)點(diǎn)、新增數(shù)據(jù)節(jié)點(diǎn)、查詢數(shù)據(jù)節(jié)點(diǎn)、更新數(shù)據(jù)節(jié)點(diǎn)、刪除數(shù)據(jù)節(jié)點(diǎn)、問答節(jié)點(diǎn)、批處理節(jié)點(diǎn)、循環(huán)節(jié)點(diǎn)、變量聚合節(jié)點(diǎn)、變量節(jié)點(diǎn)以及選擇器節(jié)點(diǎn)。均對多種變量類型提供全面支持，變量類型包括字符串（String）、整數(shù)（Integer）、數(shù)值（Number）、布爾值（Boolean）、對象（Object）、文件（File）和數(shù)組（Array）等。4.工作流的權(quán)限工作流的所有者對其創(chuàng)建的工作流擁有完整權(quán)限，可自由編輯、發(fā)布或刪除相應(yīng)工作流。默認(rèn)狀態(tài)下，僅工作流所有者可對工作流進(jìn)行編輯操作。1.創(chuàng)建工作流例如創(chuàng)建一個工作流對新聞進(jìn)行檢索和總結(jié)，其步驟如下：（1）登錄扣子平臺，在左側(cè)導(dǎo)航欄中選擇“工作空間”選項，并于頁面頂部空間列表中選擇“個人空間”或通過“創(chuàng)建新工作空間”去創(chuàng)建一個“團(tuán)隊空間”。系統(tǒng)默認(rèn)創(chuàng)建一個“個人空間”，在此空間內(nèi)創(chuàng)建的智能體、插件、知識庫等資源屬于用戶的私有資源，其他用戶無法查看。（2）選擇“資源庫”選項，單擊頁面右上角的“+資源”按鈕，選擇“工作流”選項。（3）設(shè)置工作流的名稱與描述，清晰準(zhǔn)確的名稱和描述，有助于大語言模型更好地理解工作流功能，單擊“確認(rèn)”按鈕。8.4.2工作流的創(chuàng)建（4）創(chuàng)建完成后，頁面會自動跳轉(zhuǎn)至工作流編排頁面。初始狀態(tài)下，工作流包含開始節(jié)點(diǎn)與結(jié)束節(jié)點(diǎn)。開始節(jié)點(diǎn)用于啟動工作流，結(jié)束節(jié)點(diǎn)用于返回工作流運(yùn)行結(jié)果。1.創(chuàng)建工作流創(chuàng)建工作流后，在畫布中添加節(jié)點(diǎn)，并依照任務(wù)執(zhí)行順序連接節(jié)點(diǎn)。（1）添加并連接節(jié)點(diǎn)：在底部面板單擊“添加節(jié)點(diǎn)”按鈕，選擇要使用的節(jié)點(diǎn)，將各個節(jié)點(diǎn)連接起來。在本例中需要加入的節(jié)點(diǎn)有：一個“大模型”節(jié)點(diǎn)一個“頭條新聞”的插件節(jié)點(diǎn)‘再添加一個“大模型”節(jié)點(diǎn)2.編排工作流（2）配置節(jié)點(diǎn)的輸入和輸出參數(shù)：“開始”節(jié)點(diǎn)參數(shù)設(shè)置：單擊“開始”節(jié)點(diǎn)，在右側(cè)的對話窗口中輸入的變量名。這里將“輸入”中的變量名設(shè)置為“input”，變量類型為：“str.String”。2.編排工作流“大模型”節(jié)點(diǎn)參數(shù)設(shè)置：使用大模型理解用戶的自然語言，并將其轉(zhuǎn)換為新聞搜索的關(guān)鍵詞，在“模型”中可以選擇模型的類型。在輸入?yún)?shù)中，變量名設(shè)置為“input”，引用的內(nèi)容是“開始”節(jié)點(diǎn)的“input”。提示詞可以寫成：“輸出以下內(nèi)容想要新聞的關(guān)鍵字，內(nèi)容是{{input}}”，也可以使用“自動優(yōu)化提示詞”去優(yōu)化提示詞。2.編排工作流“getToutiaoNews”插件參數(shù)設(shè)置：通過“大模型”節(jié)點(diǎn)分析理解得到關(guān)鍵詞后，輸入至“getToutiaoNews”插件，調(diào)用“頭條新聞”插件并檢索關(guān)鍵詞。此處變量“q”的值為“引用”，引用的內(nèi)容為“大模型output”。2.編排工作流“大模型_1”節(jié)點(diǎn)參數(shù)設(shè)置：此處的大模型主要負(fù)責(zé)將檢索到的新聞按照規(guī)定的格式輸出，模型選擇“DeepSeek-R1”模型，輸入的變量名為：input，變量值為“Array<Object>”，引用的對象是“getToutiaoNews.news”，也就是頭條新聞插件的輸出結(jié)果。提示詞中描述新聞的輸出格式，可以寫成如下內(nèi)容：“請將以下內(nèi)容以標(biāo)題：<新聞標(biāo)題>,時間戳:<新聞發(fā)布時間>,摘要：<新聞文章150字摘要>形式給出，內(nèi)容是{{input}}”。2.編排工作流“結(jié)束”節(jié)點(diǎn)參數(shù)設(shè)置：此節(jié)點(diǎn)只需定義輸出變量“output”，變量值為引用，引用的內(nèi)容為“大模型_1.output”。2.編排工作流（1）若要在智能體內(nèi)使用該工作流，

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

大學(xué)計算機(jī)-計算思維與人工智能（第2版）課件第8章人工智能典型應(yīng)用

文檔簡介

溫馨提示

最新文檔

評論

大學(xué)計算機(jī)-計算思維與人工智能（第2版）課件 第8章 人工智能典型應(yīng)用

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

大學(xué)計算機(jī)-計算思維與人工智能（第2版）課件第8章人工智能典型應(yīng)用