信息技術(shù)基礎(chǔ)與生成式人工智能課件第5章 AIGC+多媒體

上傳人：h*** IP屬地：山東上傳時間：2025-12-28 格式：PPTX 頁數(shù)：137 大小：169.75MB 積分：15 舉報 版權(quán)申訴

信息技術(shù)基礎(chǔ)與生成式人工智能課件第5章 AIGC+多媒體_第2頁

信息技術(shù)基礎(chǔ)與生成式人工智能課件第5章 AIGC+多媒體_第3頁

信息技術(shù)基礎(chǔ)與生成式人工智能課件第5章 AIGC+多媒體_第4頁

信息技術(shù)基礎(chǔ)與生成式人工智能課件第5章 AIGC+多媒體_第5頁

已閱讀5頁，還剩132頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

福建師范大學(xué)走

進AIGC時

代信盧宇息技術(shù)基礎(chǔ)目錄CONTENTS2341信息技術(shù)與AIGC基礎(chǔ)WPSOfficeAIGC+智能辦公AIGC+寫作

56AIGC+多媒體

AIGC+編程

AIGC+多媒體本章將系統(tǒng)講解AIGC在圖像、視頻、配音及數(shù)字人等領(lǐng)域的核心技術(shù)與應(yīng)用，通過案例拆解和實操演示，帶你掌握提示詞設(shè)計、多模態(tài)生成與編輯技巧，探索如何高效生成高質(zhì)量內(nèi)容。無論你是教育工作者、設(shè)計師還是內(nèi)容創(chuàng)作者，都能從中獲得靈感，將AIGC轉(zhuǎn)化為教學(xué)創(chuàng)新與藝術(shù)表達的有力工具。35.1AI圖像5.1.1AI圖像概述5.1.2文生圖5.1.3圖生圖5.1.1AI圖像概述AI圖像目前主要包括“文生圖”與“圖生圖”兩種方式5.1.1AI圖像概述“文生圖”，即文本生成圖像（Text-to-Image）?！拔纳鷪D”允許創(chuàng)作者通過輸入文本的創(chuàng)意描述，智能地生成與文本內(nèi)容相匹配的AI圖像。這一功能利用先進的自然語言處理和圖像生成技術(shù)，確保生成的圖片能夠精準(zhǔn)反映文本所描述的場景、對象或概念。5.1.1AI圖像概述“圖生圖”，即在“文生圖”的基礎(chǔ)上支持創(chuàng)作者上傳一張參考圖或墊圖（ReferenceImage）作為額外的輸入?yún)?shù)，以期更精細地定制和優(yōu)化最終生成的圖片結(jié)果。通過“圖生圖”，AI能夠結(jié)合用戶提供的文本描述和參考圖像，生成與參考圖內(nèi)容相關(guān)聯(lián)、風(fēng)格或元素相似的新圖片。這一過程不僅提升了圖片生成的靈活性和創(chuàng)意性，還使得生成的圖片更加貼近用戶的個性化需求和預(yù)期效果。5.1.2文生圖什么是提示詞提示詞（Prompt）是調(diào)控文生圖大模型的關(guān)鍵工具，它扮演著至關(guān)重要的角色。通過精確輸入您所期望的內(nèi)容與視覺效果，模型能夠洞悉創(chuàng)作者的創(chuàng)意意圖，進而創(chuàng)造出與創(chuàng)作設(shè)想高度契合的圖片。所以，為了確保模型能夠清晰理解并生成優(yōu)質(zhì)的圖像，提示詞必須信息詳實且表述明確。文生圖的過程就像老師向?qū)W生布置繪畫作業(yè)，創(chuàng)作者是老師，AI是學(xué)生。如果老師僅向?qū)W生說畫一幅畫，卻未說明畫中應(yīng)有的元素或繪畫的目的，學(xué)生自然會感到無所適從。所以在模型生成圖像的過程中，提示詞就是指導(dǎo)模型的指令，需要詳細、準(zhǔn)確、清晰。提示詞的描述越具體，模型所生成的畫面就越精確、越穩(wěn)定。1.撰寫提示詞5.1.2文生圖如何寫文生圖提示詞在文生圖平臺撰寫提示詞時，創(chuàng)作者需要構(gòu)思一系列精煉且富有啟發(fā)性的詞匯或短語，這些詞匯能夠引導(dǎo)AI模型生成符合你預(yù)期的圖像。（1）明確主題與核心要素（2）使用具象與抽象詞匯結(jié)合（3）設(shè)定風(fēng)格與情感基調(diào)（4）引導(dǎo)創(chuàng)意與細節(jié)（5）避免模糊與冗長（6）嘗試不同組合與調(diào)整1.撰寫提示詞5.1.2文生圖如何寫文生圖提示詞（1）明確主題與核心要素主題：首先確定你想要生成的圖像主題，比如是自然風(fēng)光、人物肖像、城市街景還是抽象藝術(shù)。核心要素：列出構(gòu)成主題的關(guān)鍵元素，如顏色、形狀、紋理、情感氛圍等。（2）使用具象與抽象詞匯結(jié)合具象詞匯：描述具體可見的特征，如“紅色的玫瑰”、“藍色的海洋”。抽象詞匯：表達情感、氛圍或風(fēng)格，如“浪漫”、“神秘”、“夢幻”。1.撰寫提示詞5.1.2文生圖如何寫文生圖提示詞（3）設(shè)定風(fēng)格與情感基調(diào)風(fēng)格：指定圖像的藝術(shù)風(fēng)格，如“油畫風(fēng)格”、“水彩畫效果”、“素描線條”。情感基調(diào)：確定圖像想要傳達的情感，如“歡快”、“寧靜”、“激昂”。（4）引導(dǎo)創(chuàng)意與細節(jié)創(chuàng)意引導(dǎo)：添加一些能夠激發(fā)AI創(chuàng)意的詞匯，如“想象”、“創(chuàng)意”、“獨特”。細節(jié)描述：對于關(guān)鍵元素，可以適當(dāng)增加細節(jié)描述，使圖像更加生動具體。1.撰寫提示詞5.1.2文生圖如何寫文生圖提示詞（5）避免模糊與冗長避免模糊：確保每個詞匯都清晰明了，避免使用含義模糊的詞匯。避免冗長：提示詞應(yīng)簡潔有力，避免過長的描述，一般建議在5-10個詞匯左右。（6）嘗試不同組合與調(diào)整組合嘗試：嘗試不同的詞匯組合，看看哪些組合能夠產(chǎn)生更好的圖像效果。靈活調(diào)整：根據(jù)生成的圖像效果，靈活調(diào)整提示詞，直到達到滿意的結(jié)果。1.撰寫提示詞5.1.2文生圖“5W1H”公式在撰寫文生圖提示詞時創(chuàng)作者可以采用“5W1H”公式以提高文生圖的質(zhì)量及效率1.撰寫提示詞5.1.2文生圖“5W1H”公式“Who”是指提示詞要描述畫面中的主體，可以是人物、動物、植物、食物、建筑或者其他物體等具體的人或物。例如：人物可以是醫(yī)生、演員、學(xué)生、工程師、設(shè)計師……等等。動物可以是獅子、公雞、鯨魚、鴿子、蝸?！鹊?。植物可以是向日葵、梅花、松樹、玫瑰、竹子……等等。食物可以是米飯、面條、漢堡、蛋糕、冰淇淋……等等。建筑可以是圖書館、宮殿、寫字樓、寺廟、小木屋……等等。其他物體還包括計算機、手表、鋼筆、小提琴、航空母艦……等等。1.撰寫提示詞5.1.2文生圖“5W1H”公式“What”是指提示詞要描述圖像中的主要對象或焦點。描述要明確主體，即清晰地定義圖像中的人物、動物、建筑等主要對象，比如：一個穿格子襯衫的程序員；要提供特征，即描述主體的外貌、姿態(tài)、著裝等特征，比如：一個穿著白色實驗室外套的年輕女科學(xué)家；要說明特定情境，描述主體所在的場景或上下文，比如：一個站在沙灘上的老船長；要結(jié)合情感和行為，即詳細說明主體的情感狀態(tài)和正在進行的動作，比如：一個微笑著讀報紙的老人。1.撰寫提示詞5.1.2文生圖“5W1H”公式“When”是指提示詞要描述時間，即畫面發(fā)生的時間節(jié)點。例如：具體時間點：拂曉、正午、傍晚六點、午夜十二點、凌晨四點。時間段：清晨、下午、傍晚、夜晚、深夜。歷史時期或年代：唐朝、康乾盛世、工業(yè)革命、中世紀(jì)、二戰(zhàn)期間。季節(jié)性時間節(jié)點：初春、盛夏、秋分、初冬、嚴(yán)冬。1.撰寫提示詞5.1.2文生圖“5W1H”公式“Where”是指提示詞要描述環(huán)境，即主體對象所在的背景或者周圍的物理空間，它為場景提供了上下文和氛圍。例如：自然環(huán)境：山谷、沙漠、海邊、雪山、高原、熱帶雨林。城市環(huán)境：繁忙的商業(yè)區(qū)、寧靜的郊區(qū)、古老的街區(qū)、現(xiàn)代化的科技園區(qū)、巨大的購物中心。室內(nèi)環(huán)境：溫馨的客廳、現(xiàn)代辦公間、豪華餐廳、溫馨的小臥室、安靜的圖書館。特殊環(huán)境：江南水鄉(xiāng)、激烈的戰(zhàn)場、古代的宮殿、未來的科技城市、魔法森林。1.撰寫提示詞5.1.2文生圖“5W1H”公式“Why”是指主體為什么出現(xiàn)在畫面里，在做什么。例如：主體正在進行的具體動作：閱讀書籍、彈鋼琴、打籃球、喝咖啡、玩游戲。主體與其他人或物的互動行為：與朋友聊天、喂養(yǎng)寵物、跳舞、打乒乓球、打電話。主體在進行某個動作時的情感狀態(tài)或表現(xiàn)：微笑著看向遠方、皺眉思考、大笑、流淚、驚訝。主體持續(xù)進行的某個活動：游泳、野餐、爬山、騎自行車、在公園里跑步。1.撰寫提示詞5.1.2文生圖“5W1H”公式“How”是指畫面的細節(jié)描述，是對圖像中具體元素和視覺效果的詳細、具體的文字描述。例如：構(gòu)圖——描述圖像內(nèi)各元素的布局和排列方式：黃金分割構(gòu)圖、斜線構(gòu)圖、三角形構(gòu)圖。視角——描述圖像的視角和拍攝角度：鳥瞰、仰拍、俯拍、平拍。藝術(shù)流派——描述圖像的藝術(shù)風(fēng)格或流派：潑墨山水、工筆花鳥、印象派、現(xiàn)實主義、賽博朋克。色調(diào)——描述圖像的整體色調(diào)和配色方案：冷色調(diào)、暖色調(diào)、中國風(fēng)配色。光影效果——描述圖像中的光照和陰影效果：柔和光線、強烈陰影、晨光。質(zhì)感——描述圖像中物體的表面質(zhì)感：光滑、粗糙、絨毛、細膩。細節(jié)元素——描述圖像中的微小元素或附加細節(jié)：裝飾物、背景元素、精致的花紋。1.撰寫提示詞5.1.2文生圖“5W1H”公式提示詞：一枝傲骨的梅花在冬日雪后的清晨中靜靜綻放，矗立在銀裝素裹的枝頭，周圍是稀疏的殘雪和未融的冰晶，國畫風(fēng)格，清冷色調(diào)，近景特寫，展現(xiàn)出堅韌不拔的氣節(jié)1.撰寫提示詞5.1.2文生圖當(dāng)前主流的文生圖平臺均支持借助DeepSeek的靈感生成提示詞。1.撰寫提示詞5.1.2文生圖畫面類型對于文生圖的作用在某些文生圖的平臺上，創(chuàng)作者在輸入完提示詞后還可以選擇“畫面類型”。畫面類型是對預(yù)期圖像藝術(shù)風(fēng)格的進一步定義，起到了影響視覺效果、拓展應(yīng)用場景、提升創(chuàng)作效率和激發(fā)創(chuàng)作靈感的作用。創(chuàng)作者可以根據(jù)自己的需求和喜好選擇合適的畫面類型來生成滿意的圖像。2.畫面類型5.1.2文生圖畫面類型對于文生圖的作用（1）定義藝術(shù)風(fēng)格畫面類型首先定義了圖像的藝術(shù)風(fēng)格。創(chuàng)作者可以選擇多種不同的畫面類型，如唯美二次元、中國風(fēng)、藝術(shù)創(chuàng)想、插畫、明亮插畫、炫彩插畫、梵高等。這些畫面類型各自代表了不同的藝術(shù)風(fēng)格和視覺特點，能夠滿足用戶對于不同風(fēng)格圖像的需求。2.畫面類型5.1.2文生圖畫面類型對于文生圖的作用（2）影響視覺效果不同的畫面類型會對圖像的視覺效果產(chǎn)生顯著影響。例如，選擇“明亮插畫”風(fēng)格可能會生成色彩鮮艷、線條明快的圖像，適合用于兒童書籍、廣告海報等場景；而選擇“中國風(fēng)”風(fēng)格則可能會生成具有中國傳統(tǒng)文化元素的圖像，適合用于文化宣傳、藝術(shù)展覽等場景。2.畫面類型5.1.2文生圖畫面類型對于文生圖的作用（3）拓展應(yīng)用場景畫面類型的多樣性也為文生圖的應(yīng)用場景提供了更多可能性。無論是設(shè)計師、藝術(shù)家還是普通創(chuàng)作者，都可以根據(jù)自己的需求和喜好選擇合適的畫面類型來生成圖像。例如，設(shè)計師可以利用文生圖生成各種設(shè)計元素和背景圖案，藝術(shù)家可以利用文生圖尋找創(chuàng)作靈感，而普通創(chuàng)作者則可以用文生圖來制作個性化的頭像、壁紙等。2.畫面類型5.1.2文生圖畫面類型對于文生圖的作用（4）提升創(chuàng)作效率通過選擇合適的畫面類型，用戶可以更快速地生成符合自己需求的圖像，從而提升了創(chuàng)作效率。文生圖大模型的智能化算法能夠根據(jù)用戶選擇的畫面類型和輸入的文本描述來生成相應(yīng)的圖像，無需創(chuàng)作者具備專業(yè)的繪畫技能或花費大量時間進行創(chuàng)作。2.畫面類型5.1.2文生圖畫面類型對于文生圖的作用（5）激發(fā)創(chuàng)作靈感畫面類型的多樣性還能夠激發(fā)創(chuàng)作者的創(chuàng)作靈感。當(dāng)創(chuàng)作者看到不同風(fēng)格的圖像時，可能會產(chǎn)生新的想法和創(chuàng)意，從而推動他們的創(chuàng)作活動。文生圖平臺作為一個AI繪畫工具，不僅能夠輔助創(chuàng)作者進行創(chuàng)作，還能夠成為他們靈感的源泉。2.畫面類型5.1.2文生圖畫面類型解析在不同的文生圖平臺可以選擇各種不盡相同的畫面類型，并且還不斷保持著更新。例如，文心一格就包括了唯美二次元、中國風(fēng)、藝術(shù)創(chuàng)想、插畫、明亮插畫、炫彩插畫、梵高、超現(xiàn)實主義、像素主義等九種可選的畫面類型。2.畫面類型5.1.2文生圖畫面類型解析（1）唯美二次元特點：色彩鮮艷，線條明快，通常包含動漫、漫畫等二次元元素。圖像示例：包括卡通角色、夢幻場景、動漫風(fēng)格的建筑或物品等。2.畫面類型5.1.2文生圖畫面類型解析（2）中國風(fēng)特點：融合中國傳統(tǒng)文化元素，如水墨畫風(fēng)格、傳統(tǒng)建筑、山水、花鳥等。圖像示例：包括水墨山水畫、古代建筑、傳統(tǒng)服飾的人物等。2.畫面類型5.1.2文生圖畫面類型解析（3）藝術(shù)創(chuàng)想特點：強調(diào)創(chuàng)意和想象力，可能包含抽象、超現(xiàn)實主義或概念藝術(shù)作品。圖像示例：包括形狀奇特、色彩對比強烈的抽象畫，或具有深刻寓意的概念圖像。2.畫面類型5.1.2文生圖畫面類型解析（4）插畫特點：注重細節(jié)和表現(xiàn)力，常用于書籍、雜志、廣告等媒介中的插圖。圖像示例：包括人物肖像、動植物描繪、場景插畫等，風(fēng)格多樣，可以偏寫實，也可以偏卡通。2.畫面類型5.1.2文生圖畫面類型解析（5）明亮插畫特點：色彩明亮，線條清晰，通常給人以積極向上、充滿活力的感覺。圖像示例：包括兒童書籍中的插圖、廣告海報中的元素、卡通形象等。2.畫面類型5.1.2文生圖畫面類型解析（6）炫彩插畫特點：色彩鮮艷且富有變化，注重色彩的搭配和視覺沖擊力。圖像示例：包括音樂節(jié)海報、時尚雜志封面、游戲角色設(shè)計等。2.畫面類型5.1.2文生圖畫面類型解析（7）梵高特點：模仿梵高等著名藝術(shù)家的繪畫風(fēng)格，強調(diào)筆觸、色彩和情感的表達。圖像示例：包括類似《星夜》、《向日葵》等梵高名作的風(fēng)格化圖像，具有獨特的藝術(shù)感染力。2.畫面類型5.1.2文生圖畫面類型解析（8）超現(xiàn)實主義特點：通過夢幻與現(xiàn)實的交織、無意識的表達以及分解與重構(gòu)等手法，營造出一種超越現(xiàn)實的、令人震撼的視覺效果。畫面示例：融合了現(xiàn)實物品與幻想元素的畫作，如漂浮的巨大時鐘與奇異生物的共存，或是日常物品呈現(xiàn)出扭曲與變形的狀態(tài)，挑戰(zhàn)觀眾的視覺認(rèn)知。2.畫面類型5.1.2文生圖畫面類型解析（9）像素主義特點：以簡潔的像素塊構(gòu)建，色彩鮮明，風(fēng)格復(fù)古且充滿創(chuàng)意。畫面示例：由像素塊組成的經(jīng)典游戲角色，如勇敢的騎士，背景是像素風(fēng)格的城堡和山川，整體色彩對比強烈。2.畫面類型5.1.2文生圖3.畫面比例創(chuàng)作者在生成之前還需要明確生成圖像的畫面比例。圖像比例不僅決定了圖像的寬度和高度，還影響了圖像的整體尺寸和形狀。因為畫面的不同比例，圖像可以分為橫圖、豎圖和方圖。5.1.2文生圖3.畫面比例豎圖的畫面比例通常為9:16、3:4、2:3。豎圖能夠完整地呈現(xiàn)畫面主體的高度和比例，使觀眾能夠感受到的畫面主體的立體感和生動性并強化視覺沖擊力，所以比較適合展示人物肖像與寫真或高樓、樹木等垂直景物。豎圖更符合手機屏幕的顯示比例，能夠為用戶提供更好的操作體驗和視覺效果，所以也常常應(yīng)用于社交媒體和移動應(yīng)用。5.1.2文生圖3.畫面比例橫圖的畫面比例通常為16:9、4:3或3:2。橫圖能夠完整地呈現(xiàn)景物的寬度和廣度，使觀眾感受到場景的遼闊和壯觀，所以比較適合展示風(fēng)景畫、自然風(fēng)光、城市景觀等。橫圖能夠吸引觀眾的注意力，并有效地傳達信息，所以也常常應(yīng)用于廣告和宣傳素材。5.1.2文生圖3.畫面比例方圖的畫面比例為1:1。方圖的常見的應(yīng)用場景主要是社交媒體和UI設(shè)計領(lǐng)域。在社交媒體平臺上，方圖常被用作個人或品牌的頭像、封面圖片。在UI設(shè)計中，方圖常被用于界面、圖標(biāo)或角色設(shè)計。5.1.2文生圖4.生成圖像創(chuàng)作者可以選擇生成圖像的數(shù)量，通常為一次1-9張。生成圖像的同時會消耗相應(yīng)的算力，不同的文生圖平臺消耗值不同。圖像生成后，文生圖平臺通常都支持創(chuàng)作者對指定圖像的點贊、收藏、下載、分享。某些平臺也可以以指定圖像為基礎(chǔ)繼續(xù)做圖片擴展、圖片變高清、涂抹消除、智能摳圖、涂抹編輯、圖片疊加等AI編輯操作，或者將指定圖像作為參考圖執(zhí)行圖生圖、圖生視頻。5.1.3圖生圖如果創(chuàng)作者無法準(zhǔn)確地將腦海中的畫面用文字描述給AI大模型，那么也可以選擇在AI創(chuàng)作平臺上傳參考圖，讓AI大模型在理解提示詞的同時參考圖片的風(fēng)格、構(gòu)圖、景深、形象、姿勢等各方面特征以圖生圖的方式生成結(jié)果。圖生圖就像老師布置學(xué)生畫一張畫，并且給學(xué)生指定了一幅優(yōu)秀的作品作為參考和對標(biāo)，學(xué)生在創(chuàng)作的時候就會有目的地對這幅作品進行不同程度的臨摹。在不同的AI創(chuàng)作平臺圖生圖的參考方式和參考維度都不盡相同并特色鮮明。5.1.3圖生圖1.可靈AI在可靈AI圖生圖可以通過調(diào)整參考強度控制生成結(jié)果和參考圖的關(guān)系，參考強度越強，生成結(jié)果越接近參考圖，參考強度越弱，生成結(jié)果越接近提示詞。單圖參考角色特征人物長相風(fēng)格轉(zhuǎn)繪通用墊圖5.1.3圖生圖1.可靈AI在可靈AI圖生圖可以通過調(diào)整參考強度控制生成結(jié)果和參考圖的關(guān)系，參考強度越強，生成結(jié)果越接近參考圖，參考強度越弱，生成結(jié)果越接近提示詞。多圖參考主體場景風(fēng)格5.1.3圖生圖1.可靈AI角色特征——維持角色一致適用于人物、常見動物角色或二次元等虛擬角色，維持角色的長相、衣著等特征，使整個主體能保持不變，支持用戶分別調(diào)節(jié)長相和主體的相似強度，通過提示詞可以更改動作、場景，將角色置于任何場景，為用戶在創(chuàng)作階段提供單角色在多鏡頭多場景的穩(wěn)定素材支持?？蓤D1.5模型支持使用場景：劇情角色保持、泛同人創(chuàng)作、表情包、社交媒體等參考數(shù)值越大保持越強，提示詞起作用越小上傳圖片，填寫提示詞，可填入環(huán)境、動作等，立即生成5.1.3圖生圖1.可靈AI角色特征——維持角色一致參考圖：5.1.3圖生圖1.可靈AI角色特征——維持角色一致臉部參考：65主體物參考：50創(chuàng)意描述：這個男生打籃球，看正面，表情專注，在一個戶外的坐滿觀眾的籃球場5.1.3圖生圖1.可靈AI角色特征——維持角色一致結(jié)果：5.1.3圖生圖1.可靈AI人物長相——get最像本人的寫真維持人物的人臉長相不變，通過提示詞即可隨意改變?nèi)宋锏姆b、發(fā)型、配飾、場景等元素，且可保持人物長相與參考圖高度相似，輕易實現(xiàn)同一人物在多場景的創(chuàng)作需求?？蓤D1.5模型支持使用場景：人物寫真、劇情、泛同人創(chuàng)作目前僅支持參考一個人長相，如果圖片有多人，需要選擇一個參考人物長相參考數(shù)值越大，人物長相越像，提示詞起作用越小上傳圖片，提示詞可填入衣著變化、妝容、動作、環(huán)境背景等5.1.3圖生圖1.可靈AI人物長相——get最像本人的寫參考圖：5.1.3圖生圖1.可靈AI人物長相——get最像本人的寫真參考強度：60提示詞：一位男士，穿著時尚的西裝，坐在咖啡店里，手里拿著咖啡，在打電話，攝影級畫質(zhì)5.1.3圖生圖1.可靈AI人物長相——get最像本人的寫真結(jié)果：5.1.3圖生圖1.可靈AI風(fēng)格轉(zhuǎn)繪——一鍵變風(fēng)格維持畫面的主要內(nèi)容，包括主體、構(gòu)圖、姿勢等不變，通過提示詞描述改變畫面風(fēng)格。可圖2.0模型支持使用場景：圖片風(fēng)格化、頭像生成、轉(zhuǎn)繪等想象力場景參考數(shù)值越大，人物長相越像，提示詞起作用越小上傳圖片，提示詞可填入想要變成的風(fēng)格5.1.3圖生圖1.可靈AI風(fēng)格轉(zhuǎn)繪——一鍵變風(fēng)格參考圖：5.1.3圖生圖1.可靈AI風(fēng)格轉(zhuǎn)繪——一鍵變風(fēng)格提示詞：變?nèi)S動畫風(fēng)5.1.3圖生圖1.可靈AI風(fēng)格轉(zhuǎn)繪——一鍵變風(fēng)格結(jié)果：5.1.3圖生圖1.可靈AI通用墊圖——萬能墊圖基于圖片內(nèi)容，根據(jù)提示詞要求來重新繪圖。可圖1.0模型支持使用場景：前述墊圖場景或基他未覆蓋的場景5.1.3圖生圖1.可靈AI通用墊圖——萬能墊圖參考圖：5.1.3圖生圖1.可靈AI通用墊圖——萬能墊圖提示詞：讓這匹馬長出巨大的翅膀，飛翔在空中5.1.3圖生圖1.可靈AI通用墊圖——萬能墊圖結(jié)果：5.1.3圖生圖1.可靈AI多圖參考支持用戶上傳多張參考圖，融合多種特征及元素(主體、風(fēng)格、場景)，并可通過文本描述指定畫面內(nèi)容，一鍵生成創(chuàng)意圖片!可圖2.0模型支持使用場景：支持用戶上傳多張參考圖，融合多種特征及元素(主體、風(fēng)格、場景)，并可通過文本描述指定畫面內(nèi)容，一鍵生成創(chuàng)意圖片!主體：單次生成最多可上傳4張場景：單次生成最多可上傳1張風(fēng)格：單次生成最多可上傳1張5.1.3圖生圖1.可靈AI多圖參考參考圖：5.1.3圖生圖1.可靈AI多圖參考參數(shù)：5.1.3圖生圖1.可靈AI多圖參考結(jié)果：5.1.3圖生圖2.即夢AI在即夢AI圖生圖可以選擇主體、人物長相、角色特征、風(fēng)格、邊緣輪廓、景深和人物姿勢等七種參考項和超清、細節(jié)修復(fù)、局部重繪、擴圖、消除筆、對口型等六種編輯。主體人物長相角色特征風(fēng)格邊緣輪廓景深人物姿勢5.1.3圖生圖2.即夢AI參考“主體”以“一個男生在書房看書”作為參考圖以“主體”作為參考維度，參考圖中綠色的區(qū)域即為被即夢AI智能識別的主體；如果智能識別的區(qū)域不準(zhǔn)確，創(chuàng)作者還可以通過畫筆或橡皮擦工具修改主體區(qū)域以“一個男生在船上看書”為提示詞以5級的中等精細度生成結(jié)果5.1.3圖生圖2.即夢AI參考“主體”參考圖參考主體生成結(jié)果5.1.3圖生圖2.即夢AI參考“人物長相”以“一張男生的臉，插畫風(fēng)格”作為參考圖以“人物長相”作為參考維度，參考圖中明顯的人臉區(qū)域即會被智能識別；如果參考圖中沒有明顯的人臉，則會出現(xiàn)“上傳的參考圖未識別出人物長相”的提示以“一位威武的將軍”為提示詞以10級的最高精細度生成結(jié)果5.1.3圖生圖2.即夢AI參考“人物長相”參考圖參考”人物長相“生成結(jié)果5.1.3圖生圖2.即夢AI參考“角色特征”以“一位威武的將軍”作為參考圖以“角色特征”作為參考維度，其中包括“臉部參考強度”和“主體參考強度”兩項參考程度，可以參考圖中人物的臉部和主體的細節(jié)及特征以主體人物所處的事件或情境作為提示詞，例如：一位騎在馬上的將軍、“大漠孤煙直，長河落日圓”、指揮千軍萬馬、坐在火車上以5級的中等精細度生成結(jié)果5.1.3圖生圖2.即夢AI參考“角色特征”參考圖參考”角色特征“提示詞：一位騎在馬上的將軍5.1.3圖生圖2.即夢AI參考“風(fēng)格”以“一位威武的將軍”作為參考圖以“風(fēng)格”作為參考維度以人或物作為提示詞，例如：一匹馬、一朵花、一座宮殿、一個飛行員以5級的中等精細度生成結(jié)果5.1.3圖生圖2.即夢AI參考“風(fēng)格”參考圖參考”風(fēng)格“提示詞：一朵花5.1.3圖生圖2.即夢AI參考“邊緣輪廓”以“一位威武的將軍”作為參考圖以“邊緣輪廓”作為參考維度，即夢AI智能識別了參考圖中的關(guān)鍵線條并生成輪廓圖以人物、職業(yè)、畫風(fēng)、物品或場景等作為提示詞，例如：愛因斯坦、兵馬俑、瓷器、荷塘月色以5級的中等精細度生成結(jié)果5.1.3圖生圖2.即夢AI參考“邊緣輪廓”參考圖參考”風(fēng)格“提示詞：兵馬俑5.1.3圖生圖2.即夢AI參考“景深”以“七瓣花”作為參考圖以“景深”作為參考維度，即夢AI會智能識別參考圖中主體的景深信息并生成景深圖以材質(zhì)、顏色、質(zhì)感、氛圍等作為提示詞，例如：塑料、金色、繩子、星空以5級的中等精細度生成結(jié)果5.1.3圖生圖2.即夢AI參考“景深”參考圖參考”景深“提示詞：金色5.1.3圖生圖2.即夢AI參考“人物姿勢”以“武術(shù)運動員”作為參考圖以“人物姿勢”作為參考維度，即夢AI會智能識別參考圖中人物的姿勢并生成骨骼圖以職業(yè)、形象、氛圍等作為提示詞，例如：機器人、兵馬俑、熊貓、火焰以5級的中等精細度生成結(jié)果5.1.3圖生圖2.即夢AI參考“人物姿勢”參考圖參考”人物姿勢“提示詞：熊貓5.1.3圖生圖2.即夢AI編輯“超清”如果生成結(jié)果的尺寸無法滿足創(chuàng)作者的要求，創(chuàng)作者可以使用“超清”編輯功能，將生成結(jié)果等比例放大2倍。同一個生成結(jié)果可以使用兩次“超清”編輯最高可以達到4K畫質(zhì)5.1.3圖生圖2.即夢AI編輯“細節(jié)修復(fù)”如果生成結(jié)果的細節(jié)存在瑕疵，創(chuàng)作者可以使用“細節(jié)修復(fù)”編輯功能，讓即夢AI進一步優(yōu)化生成結(jié)果原圖結(jié)果5.1.3圖生圖2.即夢AI參考”局部重繪“如果生成結(jié)果的局部和預(yù)期存在比較大的差距，創(chuàng)作者可以使用“局部重繪”編輯功能，讓即夢AI在創(chuàng)作者制定的區(qū)域重新生成結(jié)果5.1.3圖生圖2.即夢AI參考”局部重繪““局部重繪”原圖編輯“局部重繪”區(qū)域結(jié)果5.1.3圖生圖2.即夢AI參考”擴圖“如果創(chuàng)作者希望擴展圖像的即有畫面空間，可以使用“擴圖”編輯功能，基于原圖生成或描述提示詞生成5.1.3圖生圖2.即夢AI參考”擴圖““擴圖”原圖編輯“擴圖”二次“擴圖”生成結(jié)果一次“擴圖”生成結(jié)果5.1.3圖生圖2.即夢AI參考”消除筆“如果畫面中有多余的人或物，創(chuàng)作者可以使用“消除筆”編輯功能，編輯要從原圖中消除的區(qū)域，讓即夢AI智能消除5.1.3圖生圖2.即夢AI參考”消除筆““消除筆”原圖編輯“消除筆”區(qū)域結(jié)果5.2AI視頻5.2.3圖生視頻5.2.4運動筆刷5.2.2文生視頻5.2.1AI視頻概述5.2.5對口型/數(shù)字人5.2.1AI視頻概述以可靈、即夢、海螺、Vidu等為代表的AI視頻大模型平臺不僅都具備了文生視頻和圖生視頻的基礎(chǔ)功能，還兼具了模型多樣、參數(shù)豐富、風(fēng)格迥異的特色功能。而且，各個平臺的大模型及各項功能都始終保持著高速的發(fā)展、迭代與更新，新模型、新功能日新月異、層出不窮。5.2.1AI視頻概述文生視頻，能將文本描述轉(zhuǎn)化為1080P、30fps的高清視頻圖生視頻功能可上傳靜態(tài)圖片生成動態(tài)視頻，還支持續(xù)寫，總時長可達3分鐘視頻續(xù)寫能根據(jù)已有視頻風(fēng)格和內(nèi)容生成連貫后續(xù)片段運動筆刷、對口型等功能“多圖參考”模式可整合多個圖片中的不同主體，生成融合視頻1.可靈AI5.2.1AI視頻概述文生視頻需要輸入內(nèi)容描述，選擇寫實、卡通等風(fēng)格后，按類似步驟設(shè)置參數(shù)圖生視頻支持上傳單張或多張圖片，可設(shè)置運鏡、速度、時長、比例等參數(shù)，還能選生成模式和次數(shù)動作模仿可以人物模仿參考視頻動作數(shù)字人可以匹配音頻動作2.即夢AI5.2.1AI視頻概述3.ViduAI支持文生、圖生及多模態(tài)混合生成，可解析含50+元素的中英文復(fù)合指令，提供8種藝術(shù)風(fēng)格切換基于U-ViT架構(gòu)，端到端生成最長16秒1080P視頻，時空壓縮算法保障120幀/秒流暢度具備參考生視頻功能，支持7張主體圖上傳以保一致性，內(nèi)置物理引擎，且深度訓(xùn)練中華文化特征庫5.2.2文生視頻文生視頻是指創(chuàng)作者用提示詞描述在AIGC大模型平臺生成視頻內(nèi)容。文生視頻提示詞公式增加主體和場景的細節(jié)描述增加鏡頭語言和光影氛圍生成成功率5.2.2文生視頻主體：視頻中的主要表現(xiàn)對象，是畫面主題的重要體現(xiàn)者。如人、動物、植物，以及物體等。該項為必選項。主體描述：對主體外貌細節(jié)和肢體姿態(tài)等的描述，可通過多個短句進行列舉。如運動表現(xiàn)、發(fā)型發(fā)色、服飾穿搭、五官形態(tài)、肢體姿態(tài)等。運動：對主體運動狀態(tài)的描述，包括靜止和運動等，運動狀態(tài)不宜過于復(fù)雜，符合5s視頻內(nèi)可以展現(xiàn)的畫面即可。文生視頻提示詞公式5.2.2文生視頻場景描述：對主體所處環(huán)境的細節(jié)描述，可通過多個短句進行列舉，但不宜過多，符合5s視頻內(nèi)可以展現(xiàn)的畫面即可。如室內(nèi)場景、室外場景、自然場景等。鏡頭語言：是指通過鏡頭的各種應(yīng)用以及鏡頭之間的銜接和切換來傳達故事或信息，并創(chuàng)造出特定的視覺效果和情感氛圍。如超大遠景拍攝，背景虛化、特寫長焦鏡頭拍攝、地面拍攝、頂部拍攝、航拍、景深等。文生視頻提示詞公式5.2.2文生視頻光影：光影是賦予攝影作品靈魂的關(guān)鍵元素，光影的運用可以使照片更具深度，更具情感，我們可以通過光影創(chuàng)造出富有層次感和情感表達力的作品。如氛圍光照、晨光、夕陽、光影、丁達爾效應(yīng)、燈光等。氛圍：對預(yù)期視頻畫面的氛圍描述。如熱鬧的場景、電影級調(diào)色、溫馨美好等。文生視頻提示詞公式5.2.2文生視頻提示詞“一位宇航員在地上采了一束玫瑰”文生視頻提示詞公式可靈AI的生成結(jié)果即夢AI的生成結(jié)果5.2.2文生視頻提示詞“一個宇航員在外星球的地上采了一束發(fā)著藍色的熒光玫瑰，宇航員的身后有一艘飛船，天上有巨大的月亮，遠處是浩瀚的星空和奇幻的星河”增加主體和場景的細節(jié)描述可靈AI的生成結(jié)果即夢AI的生成結(jié)果5.2.2文生視頻提示詞“鏡頭中景拍攝，背景虛化，氛圍光照，一個宇航員在外星球的地上采了一束發(fā)著藍色的熒光玫瑰，宇航員的身后有一艘飛船，天上有巨大的月亮，遠處是浩瀚的星空和奇幻的星河，電影級調(diào)色”增加鏡頭語言和光影氛圍可靈AI的生成結(jié)果即夢AI的生成結(jié)果5.2.2文生視頻無論用哪個大模型文生視頻都好像開盲盒，創(chuàng)作者并不知道大模型會給出一個怎樣的結(jié)果，也并不能保證一次就能得到預(yù)期的結(jié)果，所以文生視頻存在一定的生成崩壞的概率。所謂崩壞，包含了多個不同角度的理解。（1）生成結(jié)果中出現(xiàn)違反自然世界客觀規(guī)律的內(nèi)容、運動、表現(xiàn)的情況。例如，蹦跑中的馬出現(xiàn)了五條腿、采玫瑰的宇航員出現(xiàn)明細違反人體運動規(guī)律的動作、雙腿筆直的人物向卡片一樣朝著一個方向運動等。（2）以及生成結(jié)果的構(gòu)圖、比例、運鏡、質(zhì)感出現(xiàn)較強的違和感。例如，在塑料質(zhì)感的玫瑰花、繪制比例和風(fēng)格明顯失調(diào)的宇航員、落幅畫面中主體構(gòu)圖失誤的運動鏡頭等。面對崩壞，創(chuàng)作者可以采用優(yōu)化提示詞、多次反復(fù)生成或先生圖再由圖生視頻的方式提高生成的成功率。生成成功率5.2.3圖生視頻圖生視頻是指創(chuàng)作者在AIGC大模型平臺上傳想要變?yōu)橐曨l的圖片，即所謂的“墊圖”，再通過AIGC大模型的判斷或提示詞描述將圖片轉(zhuǎn)變?yōu)橐曨l。圖生視頻是當(dāng)前創(chuàng)作者較為常用的創(chuàng)作手段，因為視頻畫面中的主體、元素、景別、構(gòu)圖、色彩、風(fēng)格都已知，而AIGC大模型平臺僅需控制視頻中的方式、動作、光線等動效因素，極大提高了圖生視頻的創(chuàng)作質(zhì)量，同時降低了專業(yè)視頻的創(chuàng)作成本與門檻。簡單動作復(fù)雜動作5.2.3圖生視頻視頻墊圖“一個兵馬俑”，提示詞“看手機”簡單動作：對圖生視頻來說，控制圖像中的主體運動是核心，所以圖生視頻的提示詞公式和文生視頻略有不同，而且不同平臺的圖生視頻的生成效率也不同。墊圖可靈AI的生成結(jié)果即夢AI的生成結(jié)果5.2.3圖生視頻視頻墊圖“一個兵馬俑”，提示詞“打電話”，結(jié)果崩壞復(fù)雜動作：如果創(chuàng)作者需要生成更復(fù)雜的動作時，創(chuàng)作者就要從語義理解的角度將復(fù)雜動作的提示詞表達得更精確、要更明白、更簡潔。墊圖可靈AI的生成結(jié)果即夢AI的生成結(jié)果5.2.3圖生視頻視頻墊圖“一個兵馬俑”，提示詞“聽電話”，結(jié)果崩壞復(fù)雜動作：如果創(chuàng)作者需要生成更復(fù)雜的動作時，創(chuàng)作者就要從語義理解的角度將復(fù)雜動作的提示詞表達得更精確、要更明白、更簡潔。墊圖可靈AI的生成結(jié)果即夢AI的生成結(jié)果5.2.3圖生視頻視頻墊圖“一個兵馬俑”，提示詞“拿手機聽電話”，可靈崩壞復(fù)雜動作：如果創(chuàng)作者需要生成更復(fù)雜的動作時，創(chuàng)作者就要從語義理解的角度將復(fù)雜動作的提示詞表達得更精確、要更明白、更簡潔。墊圖可靈AI的生成結(jié)果即夢AI的生成結(jié)果5.2.3圖生視頻視頻墊圖“一個兵馬俑”，提示詞“用手拿著手機放在耳邊聽電話”復(fù)雜動作：如果創(chuàng)作者需要生成更復(fù)雜的動作時，創(chuàng)作者就要從語義理解的角度將復(fù)雜動作的提示詞表達得更精確、要更明白、更簡潔。墊圖可靈AI的生成結(jié)果可靈AI的生成結(jié)果5.2.4運動筆刷可靈AI提供了“運動筆刷”功能提升了圖生視頻的可控性。創(chuàng)作者可以用“運動筆刷”在墊圖中自定義運動主體及運動軌跡，可靈AI大模型會依據(jù)指定的運動軌跡并參考提示詞描述及物理世界的運動規(guī)律控制特定主體完成符合預(yù)期的指定運動。運動筆刷具有比圖生視頻更高成功率的可控生成能力，可以生成“球類運動”“人物或動物轉(zhuǎn)向和行走路線”等圖生視頻比較難實現(xiàn)的復(fù)雜運動。在運動筆刷中，“畫筆”和“橡皮”可以設(shè)置從5到50的大小，可以支持同時繪制6個運動區(qū)域和相對應(yīng)的運動軌跡并支持“自動檢測區(qū)域”，還支持撤銷、恢復(fù)、區(qū)域重置及全部重置等功能。5.2.4運動筆刷單個運動主體多個運動主體運動主體既不存在運動的主觀姿態(tài)又不存在運動的客觀環(huán)境運動主體既不存在運動的主觀姿態(tài)但存在運動的客觀環(huán)境基礎(chǔ)物理環(huán)境中的運動提示詞和運動軌跡之間的關(guān)系靜態(tài)筆刷5.2.4運動筆刷“一匹行走的馬”墊圖運動筆刷繪制生成結(jié)果單個運動主體創(chuàng)作預(yù)期：一匹行走的馬5.2.4運動筆刷“兩匹馬”墊圖運動筆刷繪制生成結(jié)果多個運動主體創(chuàng)作預(yù)期：兩匹擺頭看向遠方的馬，馬身前的草隨風(fēng)擺動5.2.4運動筆刷“一尊石獅子”墊圖運動筆刷繪制生成結(jié)果運動主體既不存在運動的主觀姿態(tài)又不存在運動的客觀環(huán)境如果創(chuàng)作者繪制的運動主體是在物理世界中既不存在運動的主觀姿態(tài)又不存在運動的客觀環(huán)境，那么可靈AI大模型會將運動軌跡理解為以這個運動區(qū)域為主體的運動鏡頭5.2.4運動筆刷“一艘在河上緩慢航行的帆船”墊圖運動筆刷繪制生成結(jié)果運動主體既不存在運動的主觀姿態(tài)但存在運動的客觀環(huán)境如果創(chuàng)作者繪制的運動主體在物理世界中不存在運動的主觀姿態(tài)但存在運動的客觀環(huán)境，那么可靈AI大模型會讓主體根據(jù)運動的客觀環(huán)境的特點產(chǎn)生運動5.2.4運動筆刷“手拿著茶壺向茶杯里倒水”墊圖運動筆刷繪制生成結(jié)果基礎(chǔ)物理環(huán)境中的運動可靈AI大模型還可以為主體提供空氣、重力等自然世界中產(chǎn)生運動的物理環(huán)境，讓主體產(chǎn)生空氣流動、自由落體等基本的物理學(xué)運動5.2.4運動筆刷“一匹馬站在溪邊”墊圖運動筆刷繪制提示詞和運動軌跡之間的關(guān)系為了提高運用“運動筆刷”控制運動主體遵循運動軌跡生成預(yù)期結(jié)果視頻的成功率，創(chuàng)作者要在博大精深的漢語詞匯中找到精確、恰當(dāng)?shù)奶崾驹~對結(jié)果視頻中預(yù)期的運動效果做圖片創(chuàng)意描述，并且要和運動軌跡保持一致提示詞為“一匹馬跳過小溪”的生成結(jié)果5.2.4運動筆刷“生日蠟燭”墊圖運動筆刷繪制結(jié)果靜態(tài)筆刷為了提高運用“運動筆刷”控制運動主體遵循運動軌跡生成預(yù)期結(jié)果視頻的成功率，創(chuàng)作者要在博大精深的漢語詞匯中找到精確、恰當(dāng)?shù)奶崾驹~對結(jié)果視頻中預(yù)期的運動效果做圖片創(chuàng)意描述，并且要和運動軌跡保持一致5.2.5對口型/數(shù)字人所謂“對口型”或“數(shù)字人”功能是指AIGC大模型可以采用圖生視頻或視頻生視頻的方式生成設(shè)定角色開口說話的視頻。在“對口型”的視頻中，角色會根據(jù)設(shè)定的內(nèi)容和參數(shù)生成語音并同步產(chǎn)生相應(yīng)的口型動作?？伸`的“對口型”功能即夢的“數(shù)字人”功能5.2.5對口型/數(shù)字人即夢-數(shù)字人創(chuàng)作預(yù)期：生成一段蘇東坡誦讀《定風(fēng)波》的視頻生成一個蘇東坡角色的圖片：用即夢AI的文生圖功能以“一個古裝詩人，半身，正面，擬真，在竹林中，動漫形象”作為提示詞點擊“音頻”-“生成音頻”（PS：亦可通過“上傳音頻”上傳本地錄制的音頻）在“文本朗讀”中輸入《定風(fēng)波》的詩文（PS：文本的字?jǐn)?shù)上限為120個字，其中包含標(biāo)點符號）“朗讀音色”以角色的形象

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

信息技術(shù)基礎(chǔ)與生成式人工智能課件第5章 AIGC+多媒體

文檔簡介

溫馨提示

最新文檔

評論

信息技術(shù)基礎(chǔ)與生成式人工智能 課件 第5章 AIGC+多媒體

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

信息技術(shù)基礎(chǔ)與生成式人工智能課件第5章 AIGC+多媒體