版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第8章人工智能典型應(yīng)用content重點(diǎn)難點(diǎn)重點(diǎn):1.AIGC的應(yīng)用2.創(chuàng)建智能體3.工作流的創(chuàng)建難點(diǎn):1.AIGC的關(guān)鍵技術(shù)2.工作流的創(chuàng)建Contents目錄8.1AIGC簡介8.2AIGC的應(yīng)用8.3創(chuàng)建智能體8.4工作流的使用8.5AIGC的社會價值與發(fā)展挑戰(zhàn)8.1AIGC簡介8.1.1AIGC的定義騰訊發(fā)布的《AIGC發(fā)展趨勢報告2023》指出,狹義上的AIGC是“繼專業(yè)生成內(nèi)容(ProfessionalGeneratedContent,PGC)和用戶生成內(nèi)容(UserGeneratedContent,UGC)之后,利用人工智能技術(shù)自動生成內(nèi)容的一種新型生產(chǎn)方式”。廣義上的AIGC可以視為“像人類一樣具備生成創(chuàng)造能力的AI技術(shù),它能基于訓(xùn)練數(shù)據(jù)和生成算法模型,自主生成新的文本、圖像、音樂、3D交互內(nèi)容(如虛擬化身、虛擬物品、虛擬環(huán)境)等各種形式的內(nèi)容和數(shù)據(jù),甚至包括開啟科學(xué)新發(fā)現(xiàn)、創(chuàng)造新的價值和意義等”。麥肯錫的定義是:生成式人工智能旨在以一種接近人類行為的方式與人類進(jìn)行交互式協(xié)作。Gartner的定義是:生成式人工智能是一種顛覆性技術(shù),它能生成以往依賴于人類創(chuàng)造的內(nèi)容,且能在無人類經(jīng)驗和思維過程偏見的情況下提供創(chuàng)新的結(jié)果。信通院的定義是:AIGC既是從內(nèi)容生產(chǎn)者視角進(jìn)行分類的一類內(nèi)容,又是一種內(nèi)容生產(chǎn)方式,還是一類用于內(nèi)容自動化生成的技術(shù)集合。8.1.2AIGC的關(guān)鍵技術(shù)1.生成算法模型生成算法模型通過概率建模與對抗學(xué)習(xí),使AI能夠生成高質(zhì)量文本、圖像、音頻、視頻甚至3D內(nèi)容,主要包括:(1)生成對抗網(wǎng)絡(luò)(2014年):(2)Transformer模型(2017年):(3)擴(kuò)散模型(2020年以后):2.預(yù)訓(xùn)練模型預(yù)訓(xùn)練模型通過自監(jiān)督學(xué)習(xí)從大規(guī)模數(shù)據(jù)中提取通用表征,顯著降低下游任務(wù)開發(fā)成本,推動AI工業(yè)化進(jìn)程。預(yù)訓(xùn)練模型引發(fā)了AIGC技術(shù)能力的質(zhì)變。AI預(yù)訓(xùn)練模型,又稱為大模型、基礎(chǔ)模型(foundationmodels),是一種基于大量數(shù)據(jù),通常使用大規(guī)模自監(jiān)督學(xué)習(xí)訓(xùn)練的擁有巨量參數(shù)的模型。按照應(yīng)用領(lǐng)域分類預(yù)訓(xùn)練模型包括:自然語言處理(NLP)預(yù)訓(xùn)練模型、計算機(jī)視覺(CV)預(yù)訓(xùn)練模型、多模態(tài)預(yù)訓(xùn)練模型。3.多模態(tài)技術(shù)多模態(tài)技術(shù)能夠以不同角度和感知方式獲取數(shù)據(jù),并將這些數(shù)據(jù)進(jìn)行融合和整合。多模態(tài)預(yù)訓(xùn)練模型致力于處理不同模態(tài)、不同來源、不同任務(wù)的數(shù)據(jù)和信息。主要的技術(shù)突破包括:(1)CLIP(ContrastiveLanguage-ImagePre-training,2021年)(2)DALL.E系列(2021年—2022年)(3)多模態(tài)大模型(2023年以后)8.1.3AIGC的主要功能AIGC是通過人工智能技術(shù)自動生成多模態(tài)內(nèi)容的技術(shù)范式,其核心應(yīng)用涵蓋文本、圖像、語音、視頻四大領(lǐng)域。以下分述其功能與技術(shù)實現(xiàn):1.文本生成(AITextGeneration)2.圖像生成(AIImageGeneration)3.語音生成(AIAudioGeneration)4.視頻生成(AIVideoGeneration)AIGC主要基于機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí)技術(shù),涵蓋自然語言處理(NLP)、計算機(jī)視覺(CV)及多模態(tài)建模。這些技術(shù)通過數(shù)學(xué)建模與模式識別,而非直接模仿人腦,使AI能夠?qū)W習(xí)數(shù)據(jù)分布并生成類人內(nèi)容。在文本內(nèi)容生成中,自然語言處理(NLP)起著核心作用?;赥ransformer架構(gòu)的生成式預(yù)訓(xùn)練模型,可以通過海量文本數(shù)據(jù)學(xué)習(xí)語言規(guī)律。模型通過自注意力機(jī)制捕捉長距離依賴,基于概率采樣生成連貫文本。在圖像內(nèi)容生成中,計算機(jī)視覺技術(shù)發(fā)揮關(guān)鍵作用,主要的技術(shù)包括擴(kuò)散模型,如StableDiffusion、生成對抗網(wǎng)絡(luò)(GAN)。音頻和視頻內(nèi)容生成同樣利用了深度學(xué)習(xí)技術(shù)。8.1.4AIGC的工作原理2.AIGC的工作流程:(1)數(shù)據(jù)收集與處理(2)模型選擇與訓(xùn)練(3)特征學(xué)習(xí)與優(yōu)化(4)內(nèi)容生成與后處理(5)反饋與迭代8.1.5國內(nèi)外主流的AI大模型1.國外大模型產(chǎn)品(1)OpenAI的GPT大模型生成式預(yù)訓(xùn)練變換器(GenerativePre-trainedTransformer,GPT)是一種基于Transformer架構(gòu)的先進(jìn)人工智能語言模型,能夠通過深度學(xué)習(xí)技術(shù)理解和生成自然語言文本。(2)GeminiGemini是一款由GoogleDeepMind于2023年12月6日發(fā)布的人工智能模型。它功能強(qiáng)大,具備同時識別文本、圖像、音頻、視頻以及代碼這五類信息的能力。美國當(dāng)?shù)貢r間2024年2月15日,美國人工智能研究公司OpenAI正式對外發(fā)布了人工智能文生視頻大模型Sora,可以快速制作最長一分鐘、準(zhǔn)確反映用戶提示、可一鏡到底的視頻,該模型了解這些物體在物理世界中的存在方式,可以深度模擬真實物理世界,能生成具有多個角色、包含特定運(yùn)動的復(fù)雜場景。(3)Sora2.國內(nèi)大模型產(chǎn)品(1)百度的文心大模型文心大模型是百度自主研發(fā)的知識增強(qiáng)型產(chǎn)業(yè)級大模型體系,基于飛槳(PaddlePaddle)深度學(xué)習(xí)框架構(gòu)建,深度融合行業(yè)知識與應(yīng)用場景,覆蓋自然語言處理、計算機(jī)視覺、跨模態(tài)、生物計算及垂直行業(yè)五大方向。(2)科大訊飛的訊飛星火認(rèn)知大模型訊飛星火認(rèn)知大模型是科大訊飛發(fā)布的大模型。主要功能如下:文本生成語言理解知識問答邏輯推理數(shù)學(xué)能力代碼能力多模交互(3)DeepSeek大模型中國初創(chuàng)公司深度求索(DeepSeek)是一家創(chuàng)新型科技公司,成立于2023年,專注于通過數(shù)據(jù)蒸餾技術(shù)優(yōu)化訓(xùn)練數(shù)據(jù)集,并開發(fā)先進(jìn)的大語言模型(LLM)及相關(guān)技術(shù),成立一年內(nèi)即實現(xiàn)“低成本對標(biāo)頂尖性能”的技術(shù)突破。(4)豆包豆包是字節(jié)跳動公司基于云雀模型開發(fā)的AI工具,提供聊天機(jī)器人、寫作助手以及英語學(xué)習(xí)助手等功能,它可以回答各種問題并進(jìn)行對話,幫助人們獲取信息,豆包算法是一種基于Transformer架構(gòu)的語言模型,通過前文預(yù)測下一個最可能的詞語來實現(xiàn)文本生成。2025年3月28日,豆包測試了新版“深度思考”功能,該功能將推理過程的思維鏈與搜索深度結(jié)合,支持“邊想邊搜”。(5)通義千問通義,由通義千問更名而來,是阿里云推出的語言模型,2023年9月13日正式向公眾開放。是一個MaaS(模型即服務(wù))的底座,為多模態(tài)大模型(MultimodalModels)。具備全副AI能力,致力于成為人們的工作、學(xué)習(xí)、生活助手。(6)KimiKimi是北京月之暗面科技有限公司于2023年10月9日推出的一款智能助手。主要有6項功能:長文總結(jié)和生成、聯(lián)網(wǎng)搜索、數(shù)據(jù)處理、編寫代碼、用戶交互、翻譯。是全球首個支持輸入20萬漢字的智能助手產(chǎn)品。(7)騰訊混元大模型騰訊混元大模型(TencentHunyuan)是由騰訊公司研發(fā)的大語言模型,該模型基于Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu),具有萬億參數(shù)規(guī)模,具備強(qiáng)大的中文創(chuàng)作能力、復(fù)雜語境下的邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力,屬于深度合成和生成式人工智能技術(shù)。8.2AIGC的應(yīng)用8.2.1使用提示詞與AI高效溝通1.提示詞工程提示詞工程(PromptEngineering)也稱“指令工程”,是通過設(shè)計和優(yōu)化輸入指令來引導(dǎo)生成式AI模型輸出更精準(zhǔn)、更符合需求內(nèi)容的技術(shù)體系。8.2AIGC的應(yīng)用按任務(wù)類型可以將大模型分為推理大模型和非推理大模型兩大類。推理大模型、非推理大模型。模型類型技術(shù)特性提示策略推理大模型強(qiáng)化邏輯推理與符號計算能力,支持?jǐn)?shù)學(xué)證明、代碼調(diào)試等任務(wù)因其已內(nèi)化推理邏輯,提示語應(yīng)更簡潔,只需明確任務(wù)目標(biāo)和需求。無須逐步指導(dǎo),模型自動生成結(jié)構(gòu)化推理過程,若強(qiáng)行拆解步驟,反而可能限制其能力。通用大模型側(cè)重語言生成與上下文理解,擅長創(chuàng)意寫作、文本摘要等開放任務(wù)需顯式引導(dǎo)推理步驟,否則可能跳過關(guān)鍵邏輯。依賴提示語補(bǔ)償能力短板(如要求分步思考、提供示例)。2.提示詞策略2.提示詞策略例如,現(xiàn)在有一個證明勾股定理的任務(wù),這是一個數(shù)學(xué)任務(wù),推理模型更擅長,可以選擇DeepSeek大模型,Prompt就可以寫成:“證明勾股定理”,直接提問,無須分步引導(dǎo)。3.提示詞結(jié)構(gòu)提示語的基本結(jié)構(gòu)一般包括指令、上下文和期望。(1)指令(Instruction)(2)上下文(Context)(3)期望(Expectation)4.優(yōu)化提示語的關(guān)鍵策略(1)精準(zhǔn)任務(wù)定義(2)復(fù)雜任務(wù)拆解(3)控制生成自由度(4)引入引導(dǎo)性問題,提升生成內(nèi)容的深度(5)控制提示詞長度,確保生成的準(zhǔn)確性使用指令模板可以提高AI回答的準(zhǔn)確性。例如:使用文心一言的Prompt模板“一言百寶箱”生成提示詞的步驟如下:(1)首先打開文心一言官網(wǎng),在對話界面選擇“我的指令”->“一言百寶箱”選項,選擇“場景”選項。(2)選擇“數(shù)據(jù)分析”使用場景,然后選擇“折線圖生成”選項,單擊“使用”按鈕,默認(rèn)生成的指令為:“請用[折線圖]展示[世界人口增長趨勢]”。(3)可以根據(jù)實際情況對指令模板進(jìn)行修改5.使用指令模板生成提示詞1.文心一言生成新聞稿AIGC可以輔助完成各類任務(wù),其中包括撰寫常見的新聞文本。例如:學(xué)校的辯論賽剛剛結(jié)束,作為一名校園記者,需要撰寫一篇報道該活動的新聞稿的步驟如下:(1)打開“文心一言”大語言模型官網(wǎng),登錄后選擇“創(chuàng)意寫作”選項,在體裁模板中選擇“新聞媒體”模板,選擇“活動新聞”類型。(2)在右下角prompt模板中,修改指令模板為:“幫我寫一個校園辯論賽的新聞稿,要求是按照新聞的基本框架撰寫,辯題“社交媒體對大學(xué)生的影響利大于弊還是弊大于利”,法學(xué)院奪冠,時間2025年3月20日,500字左右”8.2.2AIGC在文本處理中的應(yīng)用2.通義千問高效閱讀學(xué)術(shù)論文DeepSeek、文心一言、通義千問、豆包、Kimi等大模型都支持文檔閱讀,例如:利用通義千問完成學(xué)術(shù)論文的高效閱讀,操作步驟如下:(1)首先打開通義千問大模型官網(wǎng),單擊導(dǎo)航欄中的“發(fā)現(xiàn)”選項,然后選擇“閱讀助手”工具。(2)將提前準(zhǔn)備好的論文通過拖拽或單擊“添加”按鈕的方式,將論文上傳至通義千問的“閱讀助手”中,單擊頁面下方的“最近記錄”中已上傳的論文,可以進(jìn)入“閱讀助手”頁面。2.通義千問高效閱讀學(xué)術(shù)論文(3)單擊“導(dǎo)讀”頁面,通過“全文摘要”和“論文速讀”兩項內(nèi)容,可以快速了解論文的主要內(nèi)容和研究目的,對論文的整體內(nèi)容有一個初步認(rèn)識。2.通義千問高效閱讀學(xué)術(shù)論文(4)單擊“翻譯”頁面,通過“中英互譯”功能,將中文論文翻譯成英文,或者將英文論文翻譯成中文。2.通義千問高效閱讀學(xué)術(shù)論文(5)單擊“腦圖”頁面,可以看到大模型根據(jù)論文生成的思維導(dǎo)圖,幫助用戶以可視化的方式理解和組織學(xué)術(shù)論文的內(nèi)容。2.通義千問高效閱讀學(xué)術(shù)論文(6)單擊“筆記”頁面,在閱讀論文時,可以結(jié)合論文的結(jié)構(gòu)和關(guān)鍵點(diǎn),逐段閱讀并做筆記。很多大模型提供了制作PPT的功能,將生成的文本以更直觀的方式表達(dá),快速幫助用戶完成任務(wù)。例如:使用Kimi制作一個關(guān)于人工智能簡介的PPT,其操作步驟如下:(1)首先打開Kimi官網(wǎng),單擊左側(cè)導(dǎo)航欄中的“PPT助手”選項。(2)在對話窗口輸入提示詞,如果有相關(guān)文件,可以單擊“上傳文件”按鈕進(jìn)行上傳,單擊“發(fā)送”按鈕即可生成大綱內(nèi)容。(3)單擊“一鍵生成PPT”按鈕,選擇一個適合的模板,單擊“生成PPT”按鈕,在此界面可以單擊“去編輯”按鈕,對PPT做進(jìn)一步的修改編輯,最后單擊“下載”按鈕,將制作好的PPT下載至本地。3.Kimi制作PPT4.豆包文本翻譯AIGC工具可以將一種語言的文本翻譯成另一種語言的文本,幫助用戶克服語言障礙。很多大模型都提供了翻譯功能。例如:使用豆包翻譯一本英文小說的目錄,其操作步驟如下:(1)打開豆包官網(wǎng),選擇“翻譯”選項。將要翻譯的內(nèi)容輸入到對話框中,這里輸入一本英文小說的目錄。(2)單擊“發(fā)送”按鈕后,豆包的翻譯結(jié)果如圖所示。從本例中可以看到大模型對用戶提供的英文目錄進(jìn)行了翻譯,翻譯的內(nèi)容較完整,準(zhǔn)確性較高。當(dāng)然,某些細(xì)節(jié)處還需要進(jìn)一步修改。8.2.3AIGC在繪畫中的應(yīng)用1.用AIGC工具生成圖像使用AIGC工具可以生成符合用戶需要的圖片??梢陨蓤D像的工具很多,比如即夢AI、文心一言、豆包、Midjourney、DALL.E2、騰訊智影等。即夢AI是由深圳市臉萌科技有限公司開發(fā)的一款為創(chuàng)意愛好者打造的AI表達(dá)平臺,具有AI圖片創(chuàng)作、視頻創(chuàng)作、探索創(chuàng)意世界等功能。下面演示使用即夢AI生成一幅創(chuàng)意圖片的步驟。步驟1:打開即夢AI官網(wǎng),單擊AI作圖中的“圖片生成”按鈕。步驟2:設(shè)置圖片提示詞及參數(shù)。步驟3:單擊“立即生成”。(1)即夢AI生成創(chuàng)意圖片百度AI圖片助手,是一款引領(lǐng)潮流的智能圖像編輯工具。例如:使用百度AI圖片助手,對一張尺寸較小且分辨率較低的圖片進(jìn)行擴(kuò)展并提升分辨率,操作步驟如下:步驟1:訪問百度AI圖片助手官網(wǎng),登錄后導(dǎo)入一張像素為300*200的低像素圖片。上傳圖片后,百度AI圖片助手默認(rèn)進(jìn)行了一次“清晰化”操作。步驟2:在右側(cè)的“選擇編輯方式”區(qū)域選擇需要的編輯方式,比如選擇“AI擴(kuò)圖”,選擇擴(kuò)展比例為“1:1”。步驟3:單擊“立即生成”按鈕,稍等片刻后,在生成4張圖片中選擇一幅滿意的圖片單擊“下載”按鈕,即可得到一張1024*1024像素的AI擴(kuò)展圖。(2)百度AI圖片助手完成圖片擴(kuò)展及高清化騰訊智影具有AI繪畫能力,利用深度學(xué)習(xí)算法和大量圖像數(shù)據(jù),可以幫助用戶輕松地生成各類繪畫作品。由底圖生成圖片的步驟如下:步驟1:打開“騰訊智影”官網(wǎng)并登錄,選擇“智能畫布”選項,選擇左側(cè)導(dǎo)航欄中“圖生圖”選項。步驟2:在“參考圖”處單擊“添加圖片”按鈕,上傳一張圖片作為參考圖片,在“畫面描述”對話框中輸入提示詞,模型主題選擇“漫繪V2”主題,畫面比例選擇“1:1”,分辨率選擇“1024*1024”。步驟3:單擊“生成繪畫”按鈕,生成的圖像效果如圖所示。(3)騰訊智影圖片控制生圖還可以使用AIGC工具完成一些設(shè)計任務(wù),以下是使用騰訊智影進(jìn)行設(shè)計的大致步驟:步驟1:登錄“騰訊智影”官網(wǎng),在主頁選擇“AI繪畫”,點(diǎn)擊“去創(chuàng)作”按鈕。步驟2:在“由底圖生成”區(qū)域單擊“添加圖片”按鈕,選擇一張圖片,模型主題中選擇“建筑設(shè)計”主題。再調(diào)整頁面中“效果預(yù)設(shè)”,如選擇“好看的燈光”、“鳥瞰圖”、“建筑渲染”,再選擇生成圖像的數(shù)量。步驟3:單擊“生成繪畫”按鈕,生成如圖所示的圖像。(4)騰訊智影完成設(shè)計任務(wù)2.用AIGC工具進(jìn)行3D藝術(shù)創(chuàng)作AIGC工具可以輔助設(shè)計師快速生成3D藝術(shù)作品,提高設(shè)計的效率,節(jié)省時間。下面演示使用騰訊智影進(jìn)行3D藝術(shù)創(chuàng)作的步驟及方法。步驟1:進(jìn)入騰訊智影平臺,在主頁選擇“AI繪畫”,點(diǎn)擊“去創(chuàng)作”按鈕進(jìn)入該模塊。步驟2:如在“畫面描述”對話框中輸入以下提示詞,“模型主題”處選擇“寫實增強(qiáng)”主題,“畫面比例”選擇“1:1”,“效果預(yù)設(shè)”選擇“晨光”光照效果、“人在遠(yuǎn)方”視角、“真實感”鏡頭效果,“生成數(shù)量”選擇“4”,如圖所示。2.用AIGC工具進(jìn)行3D藝術(shù)創(chuàng)作步驟3:設(shè)置好所有參數(shù)后,單擊“生成繪畫”按鈕,即可得到最終的3D效果圖,從生成的4幅圖像中選擇一幅比較符合要求的即可,效果如圖所示。2.用AIGC工具進(jìn)行藝術(shù)風(fēng)格遷移藝術(shù)風(fēng)格遷移是一種將一幅圖像的風(fēng)格應(yīng)用到另一幅圖像上的技術(shù),通過算法將源圖像的風(fēng)格特征轉(zhuǎn)移到目標(biāo)圖像上,使得目標(biāo)圖像呈現(xiàn)出源圖像的風(fēng)格效果。下面使用通義萬相做藝術(shù)風(fēng)格遷移演示。步驟1:準(zhǔn)備一幅圖片,如印象主義油畫圖片,如圖所示。步驟2:準(zhǔn)備需要進(jìn)行藝術(shù)風(fēng)格遷移的圖片,這里準(zhǔn)備一張超現(xiàn)實主義藝術(shù)風(fēng)格的圖像,如左1圖所示。步驟3:在瀏覽器中輸入通義萬相網(wǎng)址,選擇左側(cè)導(dǎo)航欄中的“應(yīng)用廣場”選項,再選擇“風(fēng)格遷移”選項,打開如左2圖所示頁面。步驟4:將“印象主義藝術(shù)圖像”拖拽到“風(fēng)格圖”處,將“超現(xiàn)實主義藝術(shù)風(fēng)格圖像”拖拽到“原圖”中。步驟5:單擊“生成畫作”按鈕。圖片藝術(shù)風(fēng)格遷移后的效果如左3圖所示。用AIGC工具進(jìn)行藝術(shù)風(fēng)格遷移1.通義萬相視頻生成下面介紹使用通義萬相生成視頻的方法:步驟1:在瀏覽器中輸入通義萬相的網(wǎng)址打開主頁,選擇“視頻生成”選項-->“文生視頻”。步驟2:設(shè)置提示詞及參數(shù)。在文字提示處輸入預(yù)想的畫面,盡量描述具體,選擇“16:9”的比例,添加“視頻音效”。步驟3:選擇“生成視頻”按鈕,等待幾分鐘后即可獲得視頻,生成效果如圖所示。8.2.4AIGC在視頻生成與剪輯中的應(yīng)用例如:使用騰訊智影制作數(shù)字人課程教學(xué)視頻。步驟1:在瀏覽器中輸入騰訊智影網(wǎng)址,選擇“數(shù)字人播報”模塊。這里直接選擇“PPT模式”,單擊頁面左上角的“上傳PPT或PDF”按鈕,將準(zhǔn)備好的PPT導(dǎo)入。步驟2:將每頁P(yáng)PT的解說詞填寫到右側(cè)的“播報內(nèi)容”中,如果沒有播報內(nèi)容,可以讓AI創(chuàng)作文章。步驟3:選擇左側(cè)的“數(shù)字人”選項,選擇喜歡的數(shù)字人形象,可以通過拖拽的方式改變數(shù)字人的位置和大小,如圖所示。步驟4:單擊:“合成視頻”按鈕,即可得到數(shù)字人播報的課程視頻。2.騰訊智影數(shù)字人生成下面介紹使用訊飛智作進(jìn)行語音生成的步驟:步驟1:在瀏覽器中輸入“訊飛智作”網(wǎng)址,打開訊飛智作首頁,選擇“訊飛配音”模塊。步驟2:選擇一種合適的“主播”,將要朗讀的文本復(fù)制到“本文輸入”區(qū)域,如需添加背景音樂可以選擇頁面右上部的“背景音樂”選項,選擇一個背景音樂,單擊“使用”按鈕。步驟3:單擊“生成音頻”按鈕即可生成語音。如圖所示。1.訊飛智作語音生成下面介紹使用“通義聽悟”進(jìn)行語音識別的步驟。步驟1:通過瀏覽器訪問通義聽悟,進(jìn)入主頁,選擇“上傳音視頻”模塊。步驟2:選擇一個音頻文件,單擊“開始轉(zhuǎn)寫”按鈕。2.通義聽悟語音識別8.3創(chuàng)建智能體8.3創(chuàng)建智能體8.3.1智能體簡介智能體(Agent)是指能夠感知環(huán)境并采取行動以實現(xiàn)特定目標(biāo)的代理體。它可以是軟件、硬件或一個系統(tǒng),具備自主性、適應(yīng)性和交互能力。1.智能體的主要特征(1)自主性(2)反應(yīng)性(3)目標(biāo)導(dǎo)向(4)進(jìn)化性’(5)交互性2.智能體的工作原理核心工作機(jī)制如下:(1)感知(2)決策(3)執(zhí)行(4)學(xué)習(xí)8.3.2基于大模型的智能體1.扣子(Coze)Coze是一款由字節(jié)跳動推出的低代碼或無代碼AI開發(fā)平臺,旨在幫助用戶快速構(gòu)建、部署和管理智能體(Agent)。具有以下特點(diǎn):(1)靈活的工作流設(shè)計(2)無限拓展的能力集
(3)豐富的數(shù)據(jù)源(4)持久化的記憶能力2.百度文心智能體文心智能體平臺AgentBuilder,是基于文心大模型的智能體構(gòu)建平臺,為開發(fā)者提供低成本的開發(fā)方式,支持廣大開發(fā)者根據(jù)自身行業(yè)領(lǐng)域、應(yīng)用場景,采用多樣化的能力、工具,打造大模型時代的原生應(yīng)用。其核心能力包括:(1)零基礎(chǔ)自然語言創(chuàng)建(2)數(shù)字形象一鍵配置(3)高兼容數(shù)據(jù)集能力(4)多樣化工具插件(5)百度生態(tài)流量分發(fā)(6)數(shù)據(jù)飛輪全面調(diào)優(yōu)3.OpenAIOperatorOperator是OpenAI于2025年1月推出的全新AI助理產(chǎn)品。支持Operator的是簡稱CUA的模型,是一種通過強(qiáng)化學(xué)習(xí)將OpenAI旗艦?zāi)P虶PT-4o的視覺功能與高級推理相結(jié)合的模型。Operator能像人類一樣使用互聯(lián)網(wǎng),通過打開瀏覽器,自如地單擊頁面按鈕、輸入文本內(nèi)容,獨(dú)立完成各類復(fù)雜任務(wù)。支撐Operator的核心技術(shù)Computer-UsingAgent(CUA),被訓(xùn)練用于與圖形用戶界面GUI(在屏幕上看到的按鈕、菜單和文本框)進(jìn)行交互,就像人類一樣。例如:創(chuàng)建一個聊天機(jī)器人智能體,以下是使用Coze平臺制作智能體的步驟,涵蓋從環(huán)境配置到部署的全流程。1.創(chuàng)建智能體(1)訪問Coze官網(wǎng),注冊賬號并登錄,單擊左側(cè)導(dǎo)航欄的“工作空間”選項,單擊右上角“+創(chuàng)建”按鈕,選擇“創(chuàng)建智能體”選項,單擊“創(chuàng)建”按鈕。8.3.3使用Coze創(chuàng)建智能體(2)按要求填寫智能體信息,“智能體名稱”中輸入智能體名稱如“HeartLink”。在“智能體功能介紹”中簡要說明功能如“AI聊天機(jī)器人”?!皥D標(biāo)”可以通過AI自動生成,也可以本地上傳圖片。填寫完成后,單擊“確認(rèn)”按鈕。1.創(chuàng)建智能體(3)創(chuàng)建智能體后,直接進(jìn)入智能體編排頁面。1.創(chuàng)建智能體在智能體編排頁面的“人設(shè)與回復(fù)邏輯”面板中輸入提示詞。例如聊天機(jī)器人的提示詞可以設(shè)置為右側(cè)提示詞??梢詥螕簟皟?yōu)化”按鈕,讓大語言模型將提示詞優(yōu)化為結(jié)構(gòu)化內(nèi)容。2.編寫提示詞當(dāng)模型能力能夠基本涵蓋智能體所需功能時,僅需為智能體精心編寫提示詞,即可使其高效運(yùn)作。若為智能體規(guī)劃的功能超出模型能力范疇,就必須為智能體增設(shè)技能,以拓展其能力邊界。3.為智能體添加技能(添加插件)修改“人設(shè)與回復(fù)邏輯”面板,指示智能體使用“必應(yīng)搜索”插件來回答自己不確定的問題。在“技能”處添加如下提示詞:###技能4:回答專業(yè)問題遇到無法回復(fù)的問題時,調(diào)用“必應(yīng)搜索”搜索答案。修改后的“人設(shè)與回復(fù)邏輯”如圖所示。3.為智能體添加技能(添加插件)為智能體添加開場白、用戶問題建議、背景圖片、選擇“語音”等增強(qiáng)對話體驗。3.為智能體添加技能(添加插件)配置好智能體后,就可以在“預(yù)覽與調(diào)試”區(qū)域中測試智能體是否符合預(yù)期。4.調(diào)試智能體發(fā)布的步驟如下:(1)在智能體的編排頁面右上角,單擊“發(fā)布”按鈕。(2)在發(fā)布頁面輸入“發(fā)布記錄”,單擊“Tab”鍵可以自動生成發(fā)布記錄。(3)選擇發(fā)布平臺,最后單擊“發(fā)布”按鈕即可,如圖所示。5.發(fā)布智能體(4)發(fā)布成功后,在“發(fā)布管理”中可以查看智能體的使用日志。5.發(fā)布智能體8.4工作流的使用8.4工作流的使用8.4.1工作流簡介1.什么是工作流工作流,作為一系列可執(zhí)行指令集合,旨在達(dá)成特定業(yè)務(wù)邏輯或完成指定任務(wù)。它為應(yīng)用程序與智能體的數(shù)據(jù)交互及任務(wù)處理構(gòu)建了一個嚴(yán)謹(jǐn)?shù)慕Y(jié)構(gòu)化框架。Coze平臺提供了一個可視化畫布,用戶僅需簡單地拖拽節(jié)點(diǎn),便能迅速搭建個性化工作流,極大簡化了工作流的構(gòu)建流程。2.工作流與對話流扣子平臺提供以下兩類工作流,以滿足多樣化的業(yè)務(wù)需求:工作流(Workflow):主要用于處理功能性請求,它能夠按照順序依次執(zhí)行一系列節(jié)點(diǎn),從而達(dá)成特定功能。對話流(Chatflow):這是一種專門為對話場景打造的特殊工作流,尤其擅長處理對話類請求。3.工作流的核心要素——節(jié)點(diǎn)工作流涵蓋的開始節(jié)點(diǎn)、結(jié)束節(jié)點(diǎn)、輸出節(jié)點(diǎn)、插件節(jié)點(diǎn)、子工作流節(jié)點(diǎn)、代碼節(jié)點(diǎn)、SQL自定義節(jié)點(diǎn)、新增數(shù)據(jù)節(jié)點(diǎn)、查詢數(shù)據(jù)節(jié)點(diǎn)、更新數(shù)據(jù)節(jié)點(diǎn)、刪除數(shù)據(jù)節(jié)點(diǎn)、問答節(jié)點(diǎn)、批處理節(jié)點(diǎn)、循環(huán)節(jié)點(diǎn)、變量聚合節(jié)點(diǎn)、變量節(jié)點(diǎn)以及選擇器節(jié)點(diǎn)。均對多種變量類型提供全面支持,變量類型包括字符串(String)、整數(shù)(Integer)、數(shù)值(Number)、布爾值(Boolean)、對象(Object)、文件(File)和數(shù)組(Array)等。4.工作流的權(quán)限工作流的所有者對其創(chuàng)建的工作流擁有完整權(quán)限,可自由編輯、發(fā)布或刪除相應(yīng)工作流。默認(rèn)狀態(tài)下,僅工作流所有者可對工作流進(jìn)行編輯操作。1.創(chuàng)建工作流例如創(chuàng)建一個工作流對新聞進(jìn)行檢索和總結(jié),其步驟如下:(1)登錄扣子平臺,在左側(cè)導(dǎo)航欄中選擇“工作空間”選項,并于頁面頂部空間列表中選擇“個人空間”或通過“創(chuàng)建新工作空間”去創(chuàng)建一個“團(tuán)隊空間”。系統(tǒng)默認(rèn)創(chuàng)建一個“個人空間”,在此空間內(nèi)創(chuàng)建的智能體、插件、知識庫等資源屬于用戶的私有資源,其他用戶無法查看。(2)選擇“資源庫”選項,單擊頁面右上角的“+資源”按鈕,選擇“工作流”選項。(3)設(shè)置工作流的名稱與描述,清晰準(zhǔn)確的名稱和描述,有助于大語言模型更好地理解工作流功能,單擊“確認(rèn)”按鈕。8.4.2工作流的創(chuàng)建(4)創(chuàng)建完成后,頁面會自動跳轉(zhuǎn)至工作流編排頁面。初始狀態(tài)下,工作流包含開始節(jié)點(diǎn)與結(jié)束節(jié)點(diǎn)。開始節(jié)點(diǎn)用于啟動工作流,結(jié)束節(jié)點(diǎn)用于返回工作流運(yùn)行結(jié)果。1.創(chuàng)建工作流創(chuàng)建工作流后,在畫布中添加節(jié)點(diǎn),并依照任務(wù)執(zhí)行順序連接節(jié)點(diǎn)。(1)添加并連接節(jié)點(diǎn):在底部面板單擊“添加節(jié)點(diǎn)”按鈕,選擇要使用的節(jié)點(diǎn),將各個節(jié)點(diǎn)連接起來。在本例中需要加入的節(jié)點(diǎn)有:一個“大模型”節(jié)點(diǎn)一個“頭條新聞”的插件節(jié)點(diǎn)‘再添加一個“大模型”節(jié)點(diǎn)2.編排工作流(2)配置節(jié)點(diǎn)的輸入和輸出參數(shù):“開始”節(jié)點(diǎn)參數(shù)設(shè)置:單擊“開始”節(jié)點(diǎn),在右側(cè)的對話窗口中輸入的變量名。這里將“輸入”中的變量名設(shè)置為“input”,變量類型為:“str.String”。2.編排工作流“大模型”節(jié)點(diǎn)參數(shù)設(shè)置:使用大模型理解用戶的自然語言,并將其轉(zhuǎn)換為新聞搜索的關(guān)鍵詞,在“模型”中可以選擇模型的類型。在輸入?yún)?shù)中,變量名設(shè)置為“input”,引用的內(nèi)容是“開始”節(jié)點(diǎn)的“input”。提示詞可以寫成:“輸出以下內(nèi)容想要新聞的關(guān)鍵字,內(nèi)容是{{input}}”,也可以使用“自動優(yōu)化提示詞”去優(yōu)化提示詞。2.編排工作流“getToutiaoNews”插件參數(shù)設(shè)置:通過“大模型”節(jié)點(diǎn)分析理解得到關(guān)鍵詞后,輸入至“getToutiaoNews”插件,調(diào)用“頭條新聞”插件并檢索關(guān)鍵詞。此處變量“q”的值為“引用”,引用的內(nèi)容為“大模型output”。2.編排工作流“大模型_1”節(jié)點(diǎn)參數(shù)設(shè)置:此處的大模型主要負(fù)責(zé)將檢索到的新聞按照規(guī)定的格式輸出,模型選擇“DeepSeek-R1”模型,輸入的變量名為:input,變量值為“Array<Object>”,引用的對象是“getToutiaoNews.news”,也就是頭條新聞插件的輸出結(jié)果。提示詞中描述新聞的輸出格式,可以寫成如下內(nèi)容:“請將以下內(nèi)容以標(biāo)題:<新聞標(biāo)題>,時間戳:<新聞發(fā)布時間>,摘要:<新聞文章150字摘要>形式給出,內(nèi)容是{{input}}”。2.編排工作流“結(jié)束”節(jié)點(diǎn)參數(shù)設(shè)置:此節(jié)點(diǎn)只需定義輸出變量“output”,變量值為引用,引用的內(nèi)容為“大模型_1.output”。2.編排工作流(1)若要在智能體內(nèi)使用該工作流,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年醫(yī)院工程監(jiān)理服務(wù)合同
- 2026年航空創(chuàng)新服務(wù)合同
- 2026年醫(yī)療采購平臺使用合同
- 2025年環(huán)保紙制品制造項目可行性研究報告
- 2025年學(xué)生課外實踐基地建設(shè)項目可行性研究報告
- 2025年智慧物流配送系統(tǒng)開發(fā)項目可行性研究報告
- 中移在線協(xié)議書
- 生豬買賣協(xié)議合同
- 呂梁市2024山西呂梁市開發(fā)區(qū)新媒體文物考古專項校園招聘53人筆試歷年參考題庫典型考點(diǎn)附帶答案詳解(3卷合一)
- 網(wǎng)絡(luò)編程崗位面試題目及答案參考
- 項目分包制合同范本
- (2026.01.01施行)《生態(tài)環(huán)境監(jiān)測條例》解讀與實施指南課件
- 2025年及未來5年市場數(shù)據(jù)中國廢舊輪胎循環(huán)利用市場深度分析及投資戰(zhàn)略咨詢報告
- 《科研倫理與學(xué)術(shù)規(guī)范》期末考試試題及答案2025
- 2025天津大學(xué)管理崗位集中招聘15人考試筆試備考題庫及答案解析
- Unit 7 When Tomorrow Comes Section A (1a-1d) 課件 2025-2026學(xué)年人教版八年級英語上冊
- 學(xué)堂在線 雨課堂 學(xué)堂云 批判性思維-方法和實踐 章節(jié)測試答案
- GB/T 44971-2024土壤硒含量等級
- 專題十-復(fù)合場課件
- 智慧樹知到《走進(jìn)故宮》2019期末考試答案
- 樂隊指揮教案
評論
0/150
提交評論