人工智能應用與實踐 課件 -第3、4章-大語言模型及其應用、AIGC與多媒體_第1頁
人工智能應用與實踐 課件 -第3、4章-大語言模型及其應用、AIGC與多媒體_第2頁
人工智能應用與實踐 課件 -第3、4章-大語言模型及其應用、AIGC與多媒體_第3頁
人工智能應用與實踐 課件 -第3、4章-大語言模型及其應用、AIGC與多媒體_第4頁
人工智能應用與實踐 課件 -第3、4章-大語言模型及其應用、AIGC與多媒體_第5頁
已閱讀5頁,還剩159頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

ArtificialIntelligenceApplicationsandPractices蘆碧波等人工智能應用與實踐第三章

大語言模型與應用目

錄行業(yè)PPT模板/hangye/01大模型概述02大模型應用03提示詞工程04本章小結05討論與習題01大模型概述語言模型發(fā)展歷程大語言模型(LargeLanguageModel,簡稱LLM)的定義:使用大量文本數(shù)據(jù)訓練的深度學習模型,可以生成自然語言文本或理解語言文本的含義。大語言模型可以處理多種自然語言任務,如文本分類、問答、對話等,是通向人工智能的重要途徑。目前大語言模型采用與小模型類似的Transformer架構和預訓練目標,與小模型的區(qū)別是增加模型大小、訓練數(shù)據(jù)和計算資源。廣義大模型:多模態(tài)+大語言模型,所處理的數(shù)據(jù)包括文本、圖片、視頻、音頻等格式。AI三要素大模型定義涌現(xiàn)性:訓練數(shù)據(jù)和參數(shù)不斷擴大,在達到一定規(guī)模后,其表現(xiàn)出了一些未能預測的、更復雜的能力和特性。通用性:突破了傳統(tǒng)模型只能適配單一或少數(shù)特定任務的局限。泛化性:具備出色的知識遷移能力,能應對全新數(shù)據(jù)、任務或場景。大模型的性能特點具有較為豐富的世界知識(基于超大規(guī)模文本數(shù)據(jù)的預訓練)具有較強的通用任務解決能力(多任務的數(shù)據(jù)訓練過程)具有較好的復雜任務推理能力(面向問題分解的思維鏈技術)具有較強的人類指令遵循能力(輸入和輸出通過自然語言表達)具有較好的人類對齊能力(人類對輸出結果進行評估和反饋)具有可拓展的工具使用能力(借鑒人類使用工具的思路)大模型的能力特點02大模型應用模型參數(shù):指模型規(guī)模的大小,通常用字母“B”表示,1B指1Billion。token:文本中的最小單元或基本元素,也被稱為“標記”或“詞元”。上下文窗口:模型在處理數(shù)據(jù)時能夠考慮到的前文和后文的信息范圍,用token數(shù)量表示。重要術語網(wǎng)頁端APP微信小程序桌面端瀏覽器插件只需瀏覽器和網(wǎng)絡。面向移動設備。深度融合本地操作系統(tǒng)。輕量化即時敏捷,不需要頻繁切換操作常見的大模型客戶端類型名稱所屬公司發(fā)布時間客戶端類型文心一言百度2023年2月7日網(wǎng)頁、APP(文小言)、桌面(文小言)Kimi月之暗面2023年10月9日網(wǎng)頁、APP、微信小程序、桌面、瀏覽器插件豆包字節(jié)跳動2023年8月17日網(wǎng)頁、APP、桌面、瀏覽器插件智譜清言智譜華章2023年8月31日網(wǎng)頁、APP、微信小程序、桌面、瀏覽器插件通義千問阿里云2023年4月7日網(wǎng)頁、APP、微信小程序、瀏覽器插件天工AI昆侖萬維2023年4月17日網(wǎng)頁、APP、微信小程序訊飛星火科大訊飛2023年5月6日網(wǎng)頁、APP、微信小程序、桌面、瀏覽器插件元寶騰訊2024年5月30日網(wǎng)頁、APP、微信小程序、桌面秘塔AI搜索秘塔科技2024年3月網(wǎng)頁、APP、微信小程序DeepSeek深度求索2024年1月5日網(wǎng)頁、APP常見的國產(chǎn)大模型平臺APPWeb大模型平臺使用情況模型選擇面向場景:學習成長生活助手情感陪伴職場提效休閑娛樂模板常見的國產(chǎn)大模型平臺——文心一言長文本處理,首個支持輸入20萬漢字的智能產(chǎn)品,目前最多支持200萬漢字。Kimi+:內(nèi)置典型應用常見的國產(chǎn)大模型平臺——Kimi常用功能交互性好多模態(tài)內(nèi)容生成云盤(云端知識庫)智能體生態(tài)豐富常見的國產(chǎn)大模型平臺——豆包APP端的視頻通話功能跨越了文本、音頻和視頻模態(tài),并具備實時推理的能力。國內(nèi)首款基于大模型的視頻通話產(chǎn)品常見的國產(chǎn)大模型平臺——智譜清言效率板塊PPT創(chuàng)作實時記錄閱讀助手音視頻速讀鏈接速讀格式轉(zhuǎn)換參數(shù)量(超過10萬億)代碼模式一句話生成應用常見的國產(chǎn)大模型平臺——通義千問側(cè)重點:知識檢索、分析與內(nèi)容創(chuàng)作新型知識載體:彩頁和寶典彩頁寶典常見的國產(chǎn)大模型平臺——天工AI語音交互個人空間(云端)常見的國產(chǎn)大模型平臺——訊飛星火界面簡潔豐富的應用廣場獨特的內(nèi)容資源(微信、騰訊生態(tài)的內(nèi)容質(zhì)量與時效性)常見的國產(chǎn)大模型平臺——騰訊元寶信息源渠道輸出模式無廣告干擾搜索結果多維度篩選搜索范圍類型豐富搜索結果結構化展示搜索結果易導出常見的國產(chǎn)大模型平臺——秘塔AI搜索運行流暢回答速度迅速訓練性價比高三模式:基礎模型(V3)、深度思考(R1)、聯(lián)網(wǎng)搜索常見的國產(chǎn)大模型平臺——DeepSeek提示詞:你是一位資深的數(shù)學教師,以生動形象、通俗易懂的風格向新生講解圖中的問題,需要有推導步驟,篇幅控制在20行,其中公式使用Latex格式圖片輸入面向?qū)W生或?qū)?shù)學知識有需求的人群典型應用案例——數(shù)學難題解析典型應用案例——數(shù)學難題解析提示詞:我是一名來自普通本科高校計算機專業(yè)的大一新生,現(xiàn)在想要了解國內(nèi)高校相關專業(yè)的現(xiàn)狀,并希望能夠得到關于成長方面的建議。作為一名來自普通本科高校計算機專業(yè)的大一新生,了解國內(nèi)高校相關專業(yè)的現(xiàn)狀以及成長方面的建議是非常重要的。以下是一些基于我搜索到的資料的詳細分析和建議:國內(nèi)高校計算機專業(yè)的現(xiàn)狀1.課程與教學發(fā)展:計算機專業(yè)在國內(nèi)高校中已經(jīng)普及,并且不斷擴展到其他學科領域,如農(nóng)林、醫(yī)學、文科等[1]。近年來,隨著“新工科”建設的推進,計算機課程已成為許多非計算機專業(yè)的必修課,以提升學生的信息技術應用能力[8]。高校正在努力改進教學方法,例如采用PBL(問題導向?qū)W習)模式來提高學生的實踐能力和問題解決能力[24]。2.就業(yè)前景與挑戰(zhàn):…3.高校排名與資源分配:…成長方面的建議1.扎實基礎知識:…2.實踐與動手能力:…3.持續(xù)學習與技術更新:…4.職業(yè)規(guī)劃與目標明確:…5.健康的生活習慣:…6.跨學科融合與創(chuàng)新:…總結計算機專業(yè)在國內(nèi)高校中具有廣泛的發(fā)展前景和挑戰(zhàn)。作為大一新生,你需要注重基礎知識的學習,積極參與實踐活動,并保持持續(xù)學習的態(tài)度。同時,明確自己的職業(yè)目標并制定相應的規(guī)劃,將有助于你在未來的職業(yè)生涯中取得成功。希望這些建議能對你有所幫助!思維導圖了解專業(yè),尤其是高中生、大一新生典型應用案例——學科專業(yè)信息調(diào)研提示詞:我是一名大二的班級組織委員,幫我寫一個線下讀書會活動的方案,需要包含但不限于策劃目標、詳細計劃、所需資源和預算、效果評估、風險應對等。典型應用案例——校園活動方案策劃典型應用案例——數(shù)學難題解析提示詞:你是一家知名科技公司的人力資源經(jīng)理,正在為計算機技術與工程部門招聘一名新職位的候選人。你面前的求職者是一個應屆畢業(yè)生,擁有計算機技術專業(yè)的學士學位,并且在大學期間參與了多個相關的項目。Practice環(huán)節(jié)鍛煉求職者在專業(yè)知識、綜合素質(zhì)、應變能力等方面的面試技巧典型應用案例——HR模擬面試應對會議場景(尤其是沒有回放的),快速準確地記錄會議內(nèi)容,提煉、總結、翻譯實時記錄鏈接速讀音視頻速讀閱讀助手格式轉(zhuǎn)換實時語音轉(zhuǎn)文字區(qū)分發(fā)言人支持翻譯快速導讀腦圖生成典型應用案例——會議紀要與總結實時記錄鏈接速讀音視頻速讀閱讀助手格式轉(zhuǎn)換典型應用案例——會議紀要與總結需求:資料快速獲取與解析實時記錄鏈接速讀音視頻速讀閱讀助手格式轉(zhuǎn)換網(wǎng)頁鏈接地址根據(jù)文字內(nèi)容或播客內(nèi)容進行導讀、問答、翻譯、腦圖生成、筆記整理本地音視頻資料轉(zhuǎn)文字、區(qū)分發(fā)言人、支持翻譯、快速導讀、腦圖生成本地或在線的文檔、論文、圖書支持翻譯、快速導讀、腦圖生成、筆記、問答典型應用案例——會議紀要與總結實時記錄鏈接速讀音視頻速讀閱讀助手格式轉(zhuǎn)換圖片轉(zhuǎn)Excel典型應用案例——會議紀要與總結提示詞:你是一位經(jīng)驗豐富的醫(yī)學專家,以通俗易懂、嚴謹負責的態(tài)度分析這份檢查結果,解釋各項指標正常范圍、患者的異常指標及可能的健康問題,給出下一步建議,如是否需要復查、進一步檢查項目,格式為清晰的文本段落圖片輸入幫助患者理解復雜的醫(yī)學檢查結果,用通俗易懂的語言解釋各項指標含義、異常情況的嚴重性及可能的病因,提供進一步的診療建議典型應用案例——醫(yī)學檢查結果分析根據(jù)您提供的血脂四項檢驗報告,我們可以逐一分析各項指標的結果。1.低密度脂蛋白(LDL):您的低密度脂蛋白水平為3.04mmol/L,處于參考范圍2-3.6mmol/L內(nèi),因此是正常的。低密度脂蛋白被稱為“壞膽固醇”,因為它在血管壁上的積累可能導致動脈硬化和心血管疾病。2.高密度脂蛋白(HDL):您的高密度脂蛋白水平為1.09mmol/L,處于參考范圍1.04-1.55mmol/L內(nèi),也是正常的。高密度脂蛋白被稱為“好膽固醇”,因為它有助于清除血管中的低密度脂蛋白,從而保護心血管健康。3.總膽固醇(TC):您的總膽固醇水平為4.84mmol/L,處于參考范圍3.6-5.69mmol/L內(nèi),因此是正常的??偰懝檀及ǖ兔芏戎鞍缀透呙芏戎鞍?,以及其他類型的膽固醇。4.甘油三酯(TG):您的甘油三酯水平為1.91mmol/L,超出了參考范圍0.58-1.71mmol/L,因此是異常的。甘油三酯升高可能與飲食習慣、肥胖、糖尿病或代謝綜合征有關,也可能增加心血管疾病的風險??偨Y與建議:您的低密度脂蛋白、高密度脂蛋白和總膽固醇水平均在正常范圍內(nèi),說明您的血脂狀況總體良好。您的甘油三酯水平略高,這可能提示您需要調(diào)整飲食和生活習慣,如減少高脂肪食物的攝入、增加運動等。建議您定期復查血脂四項,以監(jiān)測甘油三酯水平的變化。如果甘油三酯持續(xù)升高或出現(xiàn)其他癥狀(如胸悶、心悸等),請及時就醫(yī)進行進一步檢查和治療。除了血脂檢查外,您還可以考慮進行其他相關檢查,如血糖、血壓等,以全面評估您的心血管健康狀況。典型應用案例——醫(yī)學檢查結果分析提示詞:創(chuàng)建一個互動的打字游戲,游戲中會有英語單詞從屏幕頂部掉落。游戲界面包括一個位于屏幕底部的文本輸入框,用戶需要輸入下落的單詞來‘接’它們。每個單詞會隨機從單詞列表中選擇,掉落時會有旋轉(zhuǎn)效果。成功輸入單詞或當單詞到達屏幕底部時,單詞會消失并淡出。游戲每隔2秒生成一個新的單詞并開始掉落。用戶可以通過鍵盤輸入框來輸入單詞并‘接住’這些單詞。輸入框的占位符文本是‘試試用鍵盤接住下落的單詞’,當用戶開始輸入時,占位符會消失。游戲中的每個單詞都會有一定的掉落速度,并且隨著時間推移,掉落的速度會逐漸增加,增加游戲的難度。要練習打字,又想通過游戲的方式來進行典型應用案例——文字快打游戲開發(fā)代碼模式:開發(fā)網(wǎng)頁腳本典型應用案例——文字快打游戲開發(fā)推理+代碼級分析提示詞:請根據(jù)上傳的excel文件,分別對期末成績、平時成績、過程成績和總評成績進行數(shù)據(jù)分析,并給出結論與相應的可視分析。典型應用案例——數(shù)據(jù)分析推理+代碼級分析典型應用案例——數(shù)據(jù)分析提示詞:請為我制作一份云臺山的旅游宣傳PPT快速生成PPT,支持在線編輯調(diào)整、下載典型應用案例——PPT制作03提示詞工程提示詞(Prompt)是指用戶向大模型輸入的文本內(nèi)容,用于觸發(fā)大模型的響應并指導其如何生成或回應。提高準確性引導生成增強交互性提示詞(Prompt)簡潔準確引導制作一個吸引人的視頻改為:制作一個時長3分鐘左右,以幽默動畫形式呈現(xiàn),能吸引20到30歲間的職場人觀看的產(chǎn)品宣傳視頻我希望你能創(chuàng)作一篇文字內(nèi)容,這個內(nèi)容的主題圍繞著我們?nèi)粘T谛@里的學習、生活等各方面展開,字數(shù)大概控制在300字上下,整體要呈現(xiàn)出一種積極樂觀、充滿正能量的風格,不要有消極的情緒表達……改為:以校園生活為主題,寫一篇300字左右,積極向上的短文請解釋機器學習技術原理,并用通俗易懂的語言,結合生活中的例子進行說明提示詞的設計原則核心任務描述背景與條件設定輸出格式與風格要求常見任務:解釋、分類、設計、總結、翻譯等理解任務背景與約束,生成更符合實際需求的輸出輸出在形式和表達上滿足用戶的特定需求提示詞的組成要素1.設定明確的目標與上下文說明任務的具體目標(如獲取信息、生成文本、分析數(shù)據(jù)等)提供背景信息,以減少模型的猜測針對不同的場景,給出期望的輸出類型(如表格、列表、總結等)2.激活角色與思維模式設定模型為某種特定的身份,如技術專家、教師或HR指導模型使用某種特定的寫作風格(如正式、非正式、技術性等)讓模型模擬某種特定的思維模式,如批判性思維、創(chuàng)造性思維等3.逐步拆解復雜任務將復雜問題分解為多個獨立的步驟在每一步操作結束后,請求模型總結或驗證中間結果合并多個子任務的輸出,形成完整的解決方案或總結4.引導深入推理與思考讓模型分步驟推導出答案,要求“思維鏈”推理要求模型在作答前進行簡要的自我反思或驗證要求模型解釋每一步的思路,而不僅僅是給出最終答案5.提供參考材料與外部資源向模型提供外部參考文獻或文本,并要求根據(jù)這些材料生成答案要求模型在作答時引用或鏈接到具體的來源集成外部工具(如代碼執(zhí)行)來完成復雜的計算或查找任務6.動態(tài)反饋與迭代優(yōu)化在收到回答后,指出模型的誤差或不足,并要求修正讓模型根據(jù)前一輪的輸出進行自我改進請求模型總結多輪對話中的關鍵點,確保連貫性和準確性

提示詞設計的一般流程借鑒心理學上的喬哈里視窗理論開放區(qū)隱藏區(qū)盲目區(qū)未知區(qū)提示詞的設計策略開放區(qū)隱藏區(qū)盲目區(qū)未知區(qū)日常生活知識、常見的科學知識、歷史重大事件等提示詞設計:采用簡潔直接的提問方式;避免冗長的背景說明;聚焦核心需求點。示例:一年有幾個季節(jié)?地球是否圍繞太陽公轉(zhuǎn)?提示詞的設計策略開放區(qū)隱藏區(qū)盲目區(qū)未知區(qū)個人獨特的經(jīng)歷、公司內(nèi)部數(shù)據(jù)、某團隊在特定領域長期研究的成果提示詞設計:運用“少樣本”示例;提供清晰的結構框架;設定明確的輸出格式。。示例:本甜品店提供巧克力、草莓、抹茶三種口味的蛋糕。過去一周內(nèi),巧克力口味售出200個,草莓口味售出60個,抹茶口味售出80個,且購買顧客主要為年輕人?;谶@些信息,分析哪種口味更受歡迎提示詞的設計策略開放區(qū)隱藏區(qū)盲目區(qū)未知區(qū)各專業(yè)領域的高深知識:復雜科學原理、前沿技術概念、晦澀的學術理論提示詞設計:提出明確的問題;設定具體的學習目標;要求AI提供詳細解釋。示例:能否用簡單的比喻說明卷積神經(jīng)網(wǎng)絡的工作原理?提示詞的設計策略開放區(qū)隱藏區(qū)盲目區(qū)未知區(qū)全新的、前沿的問題,目前尚無確定答案,如未來科技的發(fā)展方向、科學界長期懸而未決的難題、對未來社會結構、文化形態(tài)的大膽設想與探索提示詞設計:設置開放性思考框架;引導多角度分析;鼓勵創(chuàng)新性思維。示例:問:未來十年可能出現(xiàn)哪些新型交通方式?大模型回答:或許會出現(xiàn)飛行汽車,憑借其飛行能力有效緩解城市擁堵。追問:飛行汽車應如何解決能源供應和安全保障問題?提示詞的設計策略名稱特點提示詞示例開放區(qū)雙方都知曉信息,追求效率。A寫作場景:寫一篇關于2024年春節(jié)消費趨勢的文章,800字;B數(shù)據(jù)分析:分析2024年GDP增長的主要驅(qū)動因素;C內(nèi)容總結:總結這篇文章的三個核心觀點;隱藏區(qū)涉及專有信息或非公開數(shù)據(jù)需要提供框架和示例。A企業(yè)數(shù)據(jù)分析:我將提供一份企業(yè)銷售數(shù)據(jù)(格式如:日期|產(chǎn)品|銷量|單價|渠道)。請幫我分析月度銷售趨勢、產(chǎn)品占比分析、渠道效率對比;B個性化內(nèi)容創(chuàng)作:我們公司是做企業(yè)軟件的,主要產(chǎn)品特點是:[特點1][特點2][特點3],請按該結構寫一份產(chǎn)品推廣文案:痛點描述、解決方案、產(chǎn)品優(yōu)勢;C專業(yè)報告改寫:這是一份技術評估報告,格式如下:[示例報告片段],請按照相同結構,幫我完成后續(xù)內(nèi)容。提示詞的設計策略名稱特點提示詞示例盲目區(qū)知識探索和學習場景A專業(yè)知識學習:請解釋多項式回歸的基本原理,用通俗易懂的方式,最好能舉生活中的例子;B歷史事件查詢:詳細介紹1929年經(jīng)濟大蕭條的起因、發(fā)展過程和影響;C技術原理解釋:區(qū)塊鏈技術如何確保交易安全?請用簡單的比喻說明。未知區(qū)創(chuàng)新探索和研究領域A創(chuàng)新思維激發(fā):如果未來AI完全取代人工客服,可能會出現(xiàn)哪些新問題?請從技術、社會、心理三個維度分析;B跨領域研究:請?zhí)接懮飳W中的進化理論如何應用到企業(yè)管理中,給出具體的應用場景和可能的創(chuàng)新方向;C未來趨勢預測:結合當前元宇宙發(fā)展現(xiàn)狀,預測未來10年可能出現(xiàn)的新職業(yè)和新商業(yè)模式,并分析其可行性。提示詞的設計策略通用框架(提示詞框架)大模型內(nèi)置模板(如文心一言、豆包等)大模型動態(tài)優(yōu)化(如kimi的提示詞專家、智譜清言的提示詞工程師)提示詞工程實戰(zhàn)參考信息+動作+目標+要求根據(jù)“參考信息”,完成“動作”,達成“目標”,滿足“要求”。①參考信息:包含完成任務時需要知道的必要背景和材料,如:報告、知識、數(shù)據(jù)庫、對話上下文等;②動作:需要模型解決的事情,如:撰寫、生成、總結、回答等;③目標:需要模型生成的目標內(nèi)容,如:答案、方案、文本、圖片、視頻、圖表等;④要求:需要模型遵循的任務細節(jié)要求,如:按XX格式輸出、按XX語言風格撰寫等。提示詞工程實戰(zhàn)——通用框架“請以唐代詩人的身份,在面對黃河時,根據(jù)已有唐詩數(shù)據(jù),撰寫一篇作者借由眼前景觀感嘆黃河自然景觀的七言絕句,并嚴格滿足七言絕句的格律要求”?!罢堃愿咧袛?shù)學老師的身份,在高中課堂上,根據(jù)《高中數(shù)學必修一》內(nèi)容,逐步解答學生關于集合的數(shù)學問題,并給出解題步驟及相關知識點”?!罢垍⒄罩髁鞫桃曨l平臺的觀眾喜好,為一名美食探店博主,制作一個打卡評測海底撈火鍋店的視頻腳本,要求標明對應鏡號”“按照牛頓運動定律,來分析當月球和地球質(zhì)量一樣時將會發(fā)生什么結果,要求分析過程科學嚴謹”提示詞工程實戰(zhàn)——通用框架任務+參考信息+輸出要求+示例+本次輸入+輸出項提示詞工程實戰(zhàn)——通用框架首先進行任務的說明(請依據(jù)[根據(jù)]我提供的示例信息,將給到的內(nèi)容[動作]優(yōu)化成[目標]一篇如何選購電動車的筆記)給出兩條參考信息(請你扮演一位擅長使用顏文字和emoji的小紅書好物推薦博主和小白第一次買電動車經(jīng)歷分享)給出示例(一篇小紅書筆記主要包括4個部分:開頭、中間、結尾、最后),給出輸出要求(筆記需要是小紅書風格)給出輸出項(請進行優(yōu)化:)給出本次輸入(優(yōu)化成一篇筆記)提示詞工程實戰(zhàn)——通用框架難點:常見的提示詞框架有幾十種,如何選擇使用?對策:可根據(jù)任務需求,提問大模型推薦相應的提示詞框架提示詞:我是一名學生,想梳理1929年經(jīng)濟大蕭條的起因、發(fā)展過程和影響,推薦用什么具體的提示詞框架?回答:作為一名學生,梳理1929年經(jīng)濟大蕭條的起因、發(fā)展過程和影響時,可以采用“5W1H”提示詞框架,這是一種簡單直觀且邏輯清晰的提問方式,適合初學者快速掌握核心內(nèi)容。以下是具體建議:提示詞工程實戰(zhàn)——通用框架文心一言:創(chuàng)意寫作、閱讀分析、智慧繪圖提示詞工程實戰(zhàn)——內(nèi)置模板提示詞編輯內(nèi)容窗口(可編輯)提示詞工程實戰(zhàn)——內(nèi)置模板豆包:幫我寫作、圖像生成、音樂生成提示詞工程實戰(zhàn)——內(nèi)置模板提示詞模板演講稿板塊提示詞工程實戰(zhàn)——內(nèi)置模板提示詞:我是一名高校教師,幫我寫一篇演講稿,主題是關于人工智能通識教育,字數(shù)為400字左右。演講稿內(nèi)容內(nèi)容進一步優(yōu)化提示詞工程實戰(zhàn)——內(nèi)置模板問題:提示詞框架和模板體現(xiàn)較為固化解決方案:基于大模型能力優(yōu)化提示詞典型:Kimi+中的提示詞專家核心功能一鍵生成優(yōu)化提示詞結構實時反饋與調(diào)整提示詞工程實戰(zhàn)——動態(tài)優(yōu)化問題:外賣好評提示詞:幫我設計一個撰寫外賣好評的提示詞,但是我又不擅長寫作表達,所以需要你幫我寫,我輸入美食,你輸出好評。生成的好評大概1-2句話即可,30-50字左右,簡潔明了,小紅書種草風格,語氣自然流暢。提示詞工程實戰(zhàn)——動態(tài)優(yōu)化-Role:文案創(chuàng)意專家和美食評論家-Background:用戶希望在小紅書上分享外賣美食體驗,但不擅長寫作,需要幫助生成簡潔明了且具有種草風格的好評文案。-Profile:你是一位擅長文案創(chuàng)作和美食評論的專家,能夠用簡潔而生動的語言描述美食,吸引讀者的注意力,同時具備小紅書平臺的種草文案風格。-Skills:你擁有文案創(chuàng)作能力、美食鑒賞力以及對小紅書平臺風格的深刻理解,能夠快速生成符合用戶需求的好評文案。-Goals:1.根據(jù)用戶輸入的美食信息,生成1-2句簡潔明了的好評文案。

2.確保文案具有小紅書種草風格,語氣自然流暢。

3.控制文案字數(shù)在30-50字左右。-Constrains:1.文案需簡潔,避免冗長和復雜的句子結構。

2.保持文案的自然流暢,避免生硬的表達。

3.符合小紅書平臺的種草風格,具有吸引力。-OutputFormat:文字描述,1-2句好評文案。提示詞工程實戰(zhàn)——動態(tài)優(yōu)化-Workflow:1.接收用戶輸入的美食信息。

2.根據(jù)美食特點,構思簡潔有力的文案。

3.采用小紅書種草風格,潤色文案,確保語氣自然流暢。

4.檢查文案字數(shù),確保在30-50字范圍內(nèi)。-Examples:-輸入:香辣蟹

-輸出:這香辣蟹太絕了!蟹肉鮮嫩,辣而不燥,每一口都是滿足!#美食探店

-輸入:壽司拼盤

-輸出:壽司拼盤超贊!新鮮的生魚片,搭配精致的米飯,每一口都是享受。#日料控

-輸入:麻辣燙

-輸出:麻辣燙真的愛了!湯紅油亮,食材豐富,辣得過癮,回味無窮。#小吃大愛-Initialization:在第一次對話中,請直接輸出以下:嗨!我是你的美食文案小助手。告訴我你點的外賣美食,我?guī)湍忝胱兎N草達人??旄嬖V我,今天你吃了啥?提示詞工程實戰(zhàn)——動態(tài)優(yōu)化提示詞工程實戰(zhàn)——動態(tài)優(yōu)化智譜清言智能體:提示詞工程師提示詞工程實戰(zhàn)——動態(tài)優(yōu)化需求:一只會說話的貓優(yōu)化prompt:角色扮演,一只會說話的可愛粘人寵物貓?zhí)崾驹~工程實戰(zhàn)——動態(tài)優(yōu)化使用大模型的魔法優(yōu)化prompt:一名專業(yè)的提示詞工程師,并且能輸出符合最通用框架的提示詞和相應的示例。提示詞工程實戰(zhàn)——動態(tài)優(yōu)化提示詞工程實戰(zhàn)——動態(tài)優(yōu)化04本章小結本章聚焦于大語言模型,從背景介紹入手,揭示大語言模型時代到來的背景及其深遠意義以及其在人工智能領域中的核心地位。對語言模型的發(fā)展進行了梳理,詳細闡述大語言模型的定義、特點及發(fā)展現(xiàn)狀。在應用體驗方面,介紹了相關術語,列舉國內(nèi)主流平臺及其功能特點,并通過多種典型案例展示其在不同場景下的實用價值。在提示詞工程部分,深入解析其概念與設計原則,提出通用的設計策略和實戰(zhàn)技巧。通過本章的學習,讀者將能夠利用大模型進行高效智能的信息獲取、娛樂創(chuàng)作、工作學習和社會交流,為個人成長提供強有力的工具支持。05討論與習題1.請簡要說明大模型平臺和提示詞工程之間的關系。2.在使用大模型平臺進行文本分類時,發(fā)現(xiàn)模型經(jīng)常將類別判斷錯誤,為解決此問題,應該如何從提示詞工程的角度進行優(yōu)化?3.對比在大模型平臺上進行文本生成和文本翻譯時,提示詞設計的主要差異。4.分析為什么在提示詞中明確任務的具體要求和范圍很重要,并舉例說明。5.給出提示詞工程在教育領域的2-3個應用場景性,并制作具體例子。6.以宣傳文案設計為例,分別使用文中提到的三種方式(通用框架、典型模板、優(yōu)化應用)進行設計,并分析如何引導大模型生成高質(zhì)量、符合特定要求的文本。THANKYOU更多咨詢請關注公眾號:人工智能通識教育ArtificialIntelligenceApplicationsandPractices蘆碧波等人工智能應用與實踐第四章AIGC與多媒體目

錄行業(yè)PPT模板/hangye/01AIGC概述

02

多媒體創(chuàng)作03AIGC在其他領域的應用

01AIGC概述

AIGC:ArtificialIntelligenceGeneratedContent,人工智能生成內(nèi)容/生成式人工智能AIGC技術的成熟標志著從文字到圖像的跨越式創(chuàng)新,開啟了內(nèi)容創(chuàng)作的新紀元。AIGC的崛起,不僅改變了圖像創(chuàng)作的面貌,更對整個多媒體內(nèi)容生態(tài)產(chǎn)生了深遠影響,促進了跨媒介內(nèi)容的無縫融合,使得文字、圖像、音頻、視頻等不同形式的內(nèi)容能夠相互轉(zhuǎn)化,創(chuàng)造出更加豐富、立體、沉浸式的體驗。

AIGC也是人工智能領域發(fā)展最快的技術之一AIGC定義AIGC發(fā)展專業(yè)生成內(nèi)容用戶生成內(nèi)容人工智能生成內(nèi)容UserGeneratedContent,UGCProfessionalGeneratedContent,PGCArtificialIntelligenceGeneratedContent,AIGC

AIGC的技術基礎:基于生成對抗網(wǎng)絡、大型預訓練模型等人工智能技術

狹義AIGC:通過已有數(shù)據(jù)的學習和識別,以適當?shù)姆夯芰ι上嚓P內(nèi)容的技術

AIGC能夠利用人工智能技術自動生成文本、圖片、音頻、視頻等內(nèi)容

廣義的AIGC也包括生成代碼等其他方面的內(nèi)容。AIGC定義

AIGC的發(fā)展歷程大致可以分為3個階段:早期萌芽階段、沉淀積累階段和快速發(fā)展階段。

1.早期萌芽階段:1950-19901957年,萊杰倫·希勒(LejarenHiller)和倫納德·艾薩克森(LeonardIsaacson)通過將計算機程序中的控制變量改為音符,完成了歷史上第一部由計算機創(chuàng)作的音樂作品——弦樂四重奏《依利亞克組曲(IlliacSuite)》。1966年,約瑟夫·韋岑鮑姆(JosephWeizenbaum)和肯尼斯·科爾比(KennethColbv)共同開發(fā)了世界上第一個機器人“伊莉莎(Eliza)”,其通過關鍵字掃描和重組來完成交互式任務。80年代中期,IBM基于隱馬爾可夫鏈模型創(chuàng)造了語音控制打字機“坦戈拉(Tangora)”,能夠處理兩萬個單詞。AIGC的發(fā)展歷程

2.沉積積累階段:1990-2010AIGC從實驗性向?qū)嵱眯灾饾u轉(zhuǎn)變,深度學習算法、圖形處理單元(GPU)、張量處理器(TPU)和訓練數(shù)據(jù)規(guī)模等都取得了重大突破,受到算法瓶頸的限制,效果有待提升。2007年,紐約大學人工智能研究員羅斯·古德溫(RossGoodwin)裝配的人工智能系統(tǒng)通過對公路旅行中的所見所聞進行記錄和感知,撰寫出世界上第一部完全由人工智能創(chuàng)作的小說《1TheRoad》。2012年,微軟公開展示了一個全自動同聲傳譯系統(tǒng),通過深度神經(jīng)網(wǎng)絡(DNN)可以自動將英文演講者的內(nèi)容通過語音識別、語言翻譯、語音合成等技術生成中文語音。AIGC的發(fā)展歷程

3.快速發(fā)展階段:2010-至今

深度學習模型不斷迭代,AIGC取得突破性進展,尤其在2022年,算法獲得井噴式發(fā)展,底層技術的突破也使得AIGC商業(yè)落地成為可能。其中主要集中在AI繪畫領域:2014年6月,生成式對抗網(wǎng)絡(GenerativeAdversarialNetwork,GAN)被提出。2021年2月,OpenAI推出了CLIP(ContrastiveLanguage-ImagePre-Training)多模態(tài)預訓練模型。2022年,擴散模型DiffusionModel逐漸替代GAN,在圖像生成和編輯以及視頻相關研究領域表現(xiàn)出色,成為大模型應用場景中的主流技術。Suno自成立起就在音樂生成領域獨樹一幟,其光環(huán)加持的創(chuàng)業(yè)團隊、不斷驚艷用戶的模型效果、現(xiàn)象級的產(chǎn)品傳播方式,反映了用戶以及市場對AI音樂方向的關注。AIGC的發(fā)展歷程

1.多模態(tài)大模型的定義多模態(tài)大模型是指在一個統(tǒng)一的框架下,集成了多種不同類型數(shù)據(jù)處理能力的大型神經(jīng)網(wǎng)絡模型,這些模型能夠處理圖像、文本、音頻甚至音頻等不同的數(shù)據(jù)模態(tài),并在這些模態(tài)之間進行有效的交互和信息整合。與傳統(tǒng)的單模態(tài)大模型相比,多模態(tài)大模型更加靈活和全面,能夠更好地模擬人類對于不同感知模態(tài)信息的整合和理解能力。多模態(tài)技術的意義在于它能使人工智能系統(tǒng)更接近人類的處理方式,例如,同一信息可以通過文字、語音或圖像等多種形式表達,AI系統(tǒng)通過多模態(tài)學習就能夠理解并關聯(lián)這些不同的表達形式,提高信息處理的準確性和效率。多模態(tài)大模型2.多模態(tài)大模型的優(yōu)勢

多模態(tài)大模型能夠同時處理多種數(shù)據(jù)模態(tài),使得機器在理解世界的過程中更加全面和深入多模態(tài)大模型能夠有效地整合不同模態(tài)之間的信息,提高模型對于復雜現(xiàn)實世界的理解能力,從而提高了模型的表現(xiàn)力和泛化能力多在進行圖像描述生成時,模型可以同時考慮圖像內(nèi)容和描述語境,生成更加準確和連貫的描述結果多模態(tài)大模型能夠?qū)崿F(xiàn)不同模態(tài)之間的知識遷移和共享,從而提高模型的效率和泛化能力從而加速了模型的訓練和優(yōu)化過程01020304全面性信息整合語境感知跨模態(tài)遷移02多媒體創(chuàng)作近期,國內(nèi)如雨后春筍般涌現(xiàn)出多個AIGC創(chuàng)作平臺,功能多樣、處理模態(tài)各不相同。此領域發(fā)展速度快,各平臺的功能還在不斷增加和完善。圖像生成文生圖即夢、文心一言、通義、山海、通義千問圖生圖即夢、通義萬相、豆繪音樂生成文生音樂天工、豆包視頻生曲天譜樂圖生音樂彩靈、海綿音樂視頻生成文生視頻即夢、通義萬相、可靈、智譜清言、文心一言圖生視頻即夢、通義萬相、可靈、智譜清言AIGC平臺deepseek其他AI平臺生成圖像生成文字提示詞腳本技巧:借/改/問其他AI平臺生成短視頻Deepseek:從提示詞到圖像/視頻Deepseek應用:一鍵同款借提示詞云臺山咖啡主題海報,哪吒敖丙Q版代言人,標題「云臺山咖啡」置頂采用咖啡色系高飽和度配色(深棕/奶油白/琥珀金)。畫面主體為三頭身Q版哪吒與敖丙手持咖啡杯對決造型,哪吒腳踏咖啡豆風火輪,敖丙龍角纏繞咖啡拉花,兩位角色占據(jù)畫面70%空間。背景采用極簡水墨風陳塘關剪影,加入拿鐵藝術波紋漸變暈染。C4D建模結合OC渲染突出立體金屬咖啡器具質(zhì)感,保持幽默風趣的仙俠咖啡對決場景,英文Coffee字樣以篆書風格融入背景。高對比度光影強化咖啡蒸騰霧氣,整體呈現(xiàn)神話朋克咖啡美學的創(chuàng)意混搭"Deepseek應用:改提示詞--注意對比不同版本的模型云臺山咖啡主題海報,哪吒敖丙Q版代言人,標題「云臺山咖啡」置頂采用咖啡色系高飽和度配色(深棕/奶油白/琥珀金)。畫面主體為三頭身Q版哪吒與敖丙手持咖啡杯對決造型(每人一杯),哪吒腳踏咖啡豆風火輪,敖丙龍角纏繞咖啡拉花,兩位角色占據(jù)畫面70%空間。背景采用極簡水墨風瀑布,加入拿鐵藝術波紋漸變暈染。C4D建模結合OC渲染突出立體金屬咖啡器具質(zhì)感,保持幽默風趣的仙俠咖啡對決場景,英文Coffee字樣以篆書風格融入背景。高對比度光影強化咖啡蒸騰霧氣,整體呈現(xiàn)神話朋克咖啡美學的創(chuàng)意混搭"Deepseek應用:改提示詞Prompt萬用公式Prompt=任務【必選】+生成主體【必選】+細節(jié)【可選】+形式【可選】【必選】任務:指明希望模型完成的任務類型,如“請生成一篇廣告文案”中“生成文案”即為希望生成的任務類型。生成主體:指要生成的主要對象,如“請生成一篇關于狗不理包子的廣告文案”中,“狗不理包子

”即為主要對象?!究蛇x】細節(jié):倘若我們需要讓生成文案中增加emoji表情,則可以在Prompt中增加“加一些emoji表情點綴”等細節(jié)描述來豐富最終生成效果。形式:指明生成后的排版、內(nèi)容形式,如“用文本描述”、“代碼形式生成”、“轉(zhuǎn)為廣東話”等。Deepseek應用:追問提示詞“畫一幅山水畫,該如何寫提示詞”的思考過程:

山水常見元素

畫作風格:傳統(tǒng)水墨畫

構圖方式:高院、深遠、平遠?顏色:黑白?青山綠水?氛圍和季節(jié):春夏秋冬?細節(jié):飛鳥?小船?人物?材質(zhì)和渲染:宣紙質(zhì)感?絲綢質(zhì)感?綜合因素:平衡傳統(tǒng)和AI生成優(yōu)勢,提示詞不要過于復雜,避免沖突給出示例:幫助用戶組合上述元素檢查:是否有遺漏,如筆觸類型、具體畫家風格等結論:總結,需要結構清晰,分點列出各個方面的提示詞,并給出示例,幫助用戶靈活組合。同時提醒用戶可以根據(jù)個人喜好調(diào)整元素,保持創(chuàng)造性。Deepseek應用:詢問提示詞設計方式Deepseek應用:詢問提示詞設計方式Deepseek應用:詢問提示詞設計方式Deepseek應用:詢問提示詞設計方式Deepseek應用:詢問提示詞設計方式“自近山而望遠山,謂之平遠;“自山下仰望山巔,謂之高遠;Deepseek應用:詢問提示詞設計方式Deepseek應用:詢問提示詞設計方式Deepseek應用:詢問提示詞設計方式Deepseek應用:詢問提示詞設計方式文生圖

(1)智譜清言文生圖功能:創(chuàng)意寫作、代碼生成、虛擬對話、AI生成視頻、視頻通話等操作:支持網(wǎng)頁端、APP、微信小程序和桌面端案例:文生圖創(chuàng)作、繪制連環(huán)畫和文配圖功能。

AI圖像生成文生圖:智譜清言文生圖

提示詞:

在寧靜的森林中,一只金色的狐貍正在溪邊喝水。陽光透過樹葉灑在狐貍身上,周圍是盛開的野花,背景有高聳的松樹和藍天,整體畫面溫暖而和諧,體現(xiàn)出大自然的寧靜之美AI圖像生成

連環(huán)畫是一種以連續(xù)圖畫敘述故事的傳統(tǒng)藝術形式,具有圖文并茂、形象生動、文字簡練、情節(jié)曲折連貫等特點。文生圖是根據(jù)文字描述生成圖像的過程或技術,與連環(huán)畫不同,它側(cè)重于將文字信息轉(zhuǎn)化為視覺內(nèi)容。先點擊主界面“AI畫圖”然后在精選工具中選擇“連環(huán)畫”按鈕可進入繪制連環(huán)畫的模式智譜清言文生圖—連環(huán)畫選擇的畫風是“吉卜力”畫風選擇的照片大小是4:3輸入提示詞:連續(xù)繪制三張圖像:先畫畫面1:在一片茂密的竹林中,1只熊貓和1只松鼠意外相遇。再畫畫面2:熊貓和松鼠遇到了一場突如其來的大雨,他們必須共同尋找避雨的地方。最后畫畫面3:突然天邊泛起了彩虹,十分美麗?!敝亲V清言文生圖—連環(huán)畫

文章配圖功能可以增加文章可讀性,使文章內(nèi)容更加豐富,避免視覺疲勞,通過合理的配圖,可以巧妙地突出重點內(nèi)容,幫助讀者更快獲取有效信息,配圖也可以將讀者的目光吸引至特定區(qū)域,使重點內(nèi)容更加吸睛,合理的配圖能夠增強文章的說服力,增添文章趣味性。智譜清言—文章配圖點擊智譜清言的“AI畫圖”界面的“故事配圖”按鈕即可使用故事配圖功能,用戶只需要輸入一段文字發(fā)送給AI,等待幾分鐘即可得到配圖,這里演示輸入的文字為描述故事的一段文字,智譜清言的故事配圖結果如圖所示。

智譜清言—文章配圖點擊左側(cè)“圖片生成”按鈕進入即夢AI的繪圖板塊用戶只需輸入描述性的文字選擇生成圖片所用的模型選擇圖片大小比例

提示詞:一個寧靜的湖泊,湖邊有高大的松樹,夕陽映照在水面上,天空中有幾朵彩云,整個場景顯得寧靜而美麗。設置:選擇模型:“圖片2.0Pro”模型精細度:設置為5精細度數(shù)值越大生成效果質(zhì)量越好圖片比例:1:1圖像尺寸:1024*1024即夢AI文生圖即夢AI文生圖提示詞:一杯草莓果汁,正在向里面倒入牛奶繼續(xù)編輯:把草莓果汁換成芒果汁繼續(xù)編輯:將畫面中的草莓換成芒果繼續(xù)編輯:把草莓果汁換成綠色的獼猴桃果汁,將草莓換成獼猴桃2.圖生圖:即夢圖生圖2.圖生圖:即夢圖生圖

根據(jù)主要輸入數(shù)據(jù)不同,視頻生成可以分為文生視頻和圖生視頻。其中,文生視頻輸入是文字、輸出是視頻,圖生視頻輸入是圖像或同時輸入圖像和部分文字、輸出的是視頻。

1.文生視頻

(1)即夢AI文生視頻

前面的AI圖像生成章節(jié)介紹過即夢AI的文生圖和圖生圖功能,在這里主要演示其文生視頻的功能。進入即夢AI的官網(wǎng)后,點擊“視頻生成”按鈕即可進入視頻生成界面,視頻生成支持文本生視頻、圖片生視頻和對口型這三種模式,由于生成視頻的等待時間較長,這里只演示文生視頻和圖生視頻的功能。4.2.2AI視頻生成操作:在視頻生成界面點擊“文生視頻”按鈕,輸入提示詞,根據(jù)自己的需要選擇“運鏡控制”和“運動速度”,最后對視頻的時長和視頻的比例進行設置,點擊“生成視頻”按鈕即可生成視頻。提示詞:在一個陽光明媚的早晨,鏡頭緩緩移動,展示一片寧靜的湖泊,湖面如鏡,倒映著藍天和白云。遠處,連綿的山脈被綠色的森林覆蓋,山峰上偶爾出現(xiàn)幾縷薄霧。鏡頭轉(zhuǎn)向湖邊,野花爭相開放,五彩斑斕,蜜蜂和蝴蝶在花間翩翩起舞。隨著微風輕拂,樹葉沙沙作響,鳥兒在枝頭歡快地鳴唱。最后,夕陽西下,天空被染成橘紅色,湖面閃爍著金色的光芒,營造出一種寧靜而和諧的自然氛圍4.2.2AI視頻生成4.2.2AI視頻生成提示詞:賽車快速行駛,背景在瞬息之間模糊一切都仿佛變成了色彩的交錯。車速迅猛,讓人感受到強烈的刺激與腎上腺素的飆升,車手在這片轟鳴中如同掌控了整個世界,釋放出的激情讓人熱血沸騰。文生視頻——提示詞的基礎公式提示詞:復古賽博朋克風格-閃爍的霓虹燈下一名身著皮夾克的賽博戰(zhàn)士在廢棄的電子工廠中穿行鏡頭從他的背影拉遠展示出一個充滿未來科技感的城市夜景。文生視頻——提示詞的進階公示提示詞:鏡頭從滿屏的古色古香的木質(zhì)屏風開始,慢慢向左平移,露出屏風后面端坐著的古風女孩,女孩穿著蜀繡漢服,發(fā)髻高高盤起,進行著線上視頻會議。文生視頻——提示詞的運鏡公式文生視頻——提示詞的形變公式提示詞:日漫風格。在城市的街道一角,一只黑貓蹲伏在路燈下,注視著遠處的霓虹燈光。突然一道藍色光芒從天而降,迅速包裹住他的身體。黑貓在光芒中騰空而起,黑色的毛發(fā)逐漸消散在空氣中,身體迅速變長。他的皮毛變?yōu)橐患谏男奚砦鞣蠢粘鲂揲L的輪廓。貓耳消失,臉部輪廓逐漸清晰,最終化為一張帥氣而冷峻的少年面孔。他輕巧地落在地上,西服在夜風中微微飄動,藍光漸漸褪去,宛如一位從未來世界中走出的神秘少年,優(yōu)雅而自信。文生視頻——常見提示詞目錄操作方式:首先進入智譜清言的官網(wǎng)點擊“清影-AI生視頻”界面右邊就會看到“文生視頻”和“圖生視頻”提示詞:選擇一個櫻花盛開的場景,比如公園、校園或山坡??梢钥紤]加入一些自然元素,比如小溪、草地或長椅,增加畫面的豐富性。智譜清言文生視頻智譜清言文生視頻初始提示詞:一群小羊在草地上吃草智能擴寫后的提示詞:一群毛茸茸的小羊在翠綠的草地上悠閑地低頭吃草,它們的羊毛潔白柔軟,偶爾抬頭望向四周,展現(xiàn)出天真好奇的眼神,背景是一片廣闊的綠色草地,遠處有起伏的山丘和蔚藍的天空,營造出寧靜和諧的田園風光,中景廣角鏡頭,捕捉羊群與環(huán)境的互動通義萬相文生視頻初始提示詞:一群小羊在草地上吃草智能擴寫后的提示詞:一群毛茸茸的小羊在翠綠的草地上悠閑地低頭吃草,它們的羊毛潔白柔軟,偶爾抬頭望向四周,展現(xiàn)出天真好奇的眼神,背景是一片廣闊的綠色草地,遠處有起伏的山丘和蔚藍的天空,營造出寧靜和諧的田園風光,中景廣角鏡頭,捕捉羊群與環(huán)境的互動通義萬相文生視頻提示詞:在一個清晨,鏡頭緩緩拉近一片壯麗的山谷,四周被高聳的山脈環(huán)抱,山峰上覆蓋著皚皚白雪。溪水從巖石間歡快地流淌,發(fā)出悅耳的潺潺聲,水面上漂浮著幾片落葉。陽光透過樹梢灑下點點金光,照耀著蔥郁的森林,鳥兒在空中翱翔,偶爾掠過水面,激起一陣漣漪設置:選擇動效模板圖生視頻:即夢圖生視頻可靈AI具備生成長視頻、多寬高比視頻的能力,支持圖像生成視頻、交互功能,有網(wǎng)頁、桌面、APP、微信小程序端口等操作方式,可靈AI的視頻生成功能也包括文生視頻和圖生視頻??伸`AI圖生視頻可靈AI圖生視頻通義千問AI圖生視頻:全民舞王照片要求:分辨率要大于500×500正面站立全身照不能有遮擋通義千問AI圖生視頻:全民舞王照片要求:分辨率要大于500×500正面站立全身照不能有遮擋通義千問AI圖生視頻:全民舞王通義萬相AI圖生視頻:即夢生圖+通義萬象生視頻

根據(jù)主要輸入數(shù)據(jù)不同,音樂生成可以分為文生音樂、圖生音樂、視頻生曲。其中,文生音樂輸入是文字、輸出是音樂,圖生音樂輸入是圖像或同時輸入圖像和部分文字、輸出的是音樂,視頻生曲輸入是視頻、輸出是視頻搭配背景音樂。

1.文生音樂(1)天工AI文生音樂

天工AI的功能包括對話助手、AI寫作、AI圖片生成、AI音樂、AIPPT、AI識圖。這里主要演示其文生音樂的功能。天工AI有網(wǎng)頁、APP、微信小程序等操作平臺,限于篇幅,我們以網(wǎng)頁版為例,介紹天工AI文生音樂的功能。4.2.3AI音樂生成

進入天工AI的官網(wǎng),注冊并登陸完賬號后,然后點擊左側(cè)“AI音樂”按鈕,,即可使用AI音樂生成的功能。天工AI文生音樂

接著用戶可以輸入歌名,輸入歌詞,還可以選擇參考音頻輸入歌名:AreYouOk選擇參考音頻:其他用戶上傳的“AreYouOk”歌曲輸入歌詞設置完參數(shù)后點擊“開始創(chuàng)作”按鈕AI生成音樂天工AI文生音樂

豆包具有聊天機器人、寫作助手以及英語學習助手及生成音樂等功能,它可以回答各種問題并進行對話,幫助用戶獲取信息,支持網(wǎng)頁網(wǎng)頁、APPA、微信小程序等操作平臺。進入豆包AI平臺的官網(wǎng)后,注冊登錄賬號,點擊下方輸入框上面的“音樂生成”按鈕,即可使用豆包AI平臺生成音樂的功能。豆包AI文生音樂

豆包AI平臺文生音樂功能,既可以采用AI生成歌詞,也可以自己自定義歌詞,然后可以輸入歌曲的主題,最后選定歌曲的風格、表達的情緒和男女聲唱法,將文本發(fā)送給豆包AI即可生成歌曲。輸入主題:在夏日傍晚騎車,看到遠處的橙色夕陽選定AI生成歌詞風格設置:流行/女聲唱法豆包AI文生音樂彩靈AI圖生音樂:彩靈AI目前只能在微信小程序上使用進入小程序后,選擇圖生音樂,可以設置歌曲的語言,上傳圖片之后點擊“一鍵生成”按鈕即可生成音樂。2.圖生音樂海綿圖生音樂:海綿音樂是一個利用人工智能技術生成個性化音樂的平臺支持生成治愈、懷舊、傷感、興奮等多種情感類別的音樂,包括R&B、搖滾、嘻哈、電子、國風多種風格。海綿音樂有網(wǎng)頁、App、微信小程序等操作平臺2.圖生音樂天譜樂有網(wǎng)頁、APP、微信小程序端口等操作平臺,天譜樂三個重要功能為:文本生曲、圖片生曲、視頻生曲。進入天譜樂網(wǎng)頁主界面,點擊“視頻生曲”,上傳任意圖片或者10-60秒視頻,然后選擇內(nèi)置的音樂模板,或者AI隨機生成,就可以視頻生曲。3.視頻生曲天譜樂有網(wǎng)頁、APP、微信小程序端口等操作平臺,天譜樂三個重要功能為:文本生曲、圖片生曲、視頻生曲。進入天譜樂網(wǎng)頁主界面,點擊“視頻生曲”,上傳任意圖片或者10-60秒視頻,然后選擇內(nèi)置的音樂模板,或者AI隨機生成,就可以視頻生曲。3.視頻生曲3.視頻生曲

先用豆包AI來生成國風背景音樂然后采用即夢AI來生成國風類型的視頻創(chuàng)作

用視頻剪輯軟件“剪映”做視頻的最后優(yōu)化

AIGC綜合案例:文生音樂+文生視頻

先用豆包AI來生成國風背景音樂然后采用即夢AI來生成國風類型的視頻創(chuàng)作

用視頻剪輯軟件“剪映”做視頻的最后優(yōu)化

AIGC綜合案例:文生音樂+文生視頻

先用豆包AI來生成國風背景音樂然后采用即夢AI來生成國風類型的視頻創(chuàng)作

用視頻剪輯軟件“剪映”做視頻的最后優(yōu)化

AIGC綜合案例:文生音樂+文生視頻

先用豆包AI來生成國風背景音樂然后采用即夢AI來生成國風類型的視頻創(chuàng)作

用視頻剪輯軟件“剪映”做視頻的最后優(yōu)化

AIGC綜合案例:文生音樂+文生視頻

使用提示詞工具進行提示詞擴寫利用提示詞生成視頻生成為生成的視頻添加背景音樂

AIGC綜合案例:文生視頻+圖生視頻+視頻生曲

使用提示詞工具進行提示詞擴寫對輸入圖像添加提示詞生成視頻生成為生成的視頻添加背景音樂

AIGC綜合案例:文生視頻+圖生視頻+視頻生曲03AIGC在其他領域的應用

數(shù)字人是指以數(shù)字形式存在于數(shù)字空間中,具有擬人或真人的外貌、行為和特點的虛擬人物,也稱之為虛擬形象、數(shù)字虛擬人、虛擬數(shù)字人等。數(shù)字人可以打造更完美的人設,為品牌帶來正向價值?;ヂ?lián)網(wǎng)、金融、電商平臺、消費品牌、汽車出行等領域紛紛推出數(shù)字人,用于品牌營銷、智能客服等方向。虛擬數(shù)字人已經(jīng)在游戲、傳媒、影視等領域得到了廣泛應用,但整體來說,主要集中于游戲、虛擬偶像、品牌營銷等領域,尤其是B端業(yè)務。數(shù)字人生

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論