版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
人工智能應(yīng)用基礎(chǔ)授課人:張老師
應(yīng)用篇項目16?讓歷史文物活靈活現(xiàn)01項目描述05項目拓展02項目分析06項目小結(jié)03相關(guān)知識07項目練習(xí)04項目實施目錄項目描述01小華是一名歷史系的學(xué)生,對古代文物有著濃厚的興趣。在一次參觀博物館時,他被一件古代舞蹈俑深深吸引,想象著如果這些文物能夠“活”起來,展現(xiàn)出它們當(dāng)年的風(fēng)采,那將是多么奇妙的體驗。因此,他決定嘗試利用現(xiàn)代AI技術(shù),將這些靜態(tài)的文物通過視頻展現(xiàn)出動態(tài)的舞蹈動作。16.1項目描述02項目分析在這個項目中,我們使用可靈AI平臺制作文物舞蹈視頻,通過可靈提供的運鏡控制功能可以精細地控制文物模型的肢體動作,從而達到更符合需求、更自然靈動的視頻效果。16.2項目分析03相關(guān)知識可靈(Kling)是由快手大模型團隊自研打造的視頻生成大模型,現(xiàn)已支持文生視頻、圖生視頻、視頻續(xù)寫、運鏡控制、首尾幀等多個能力,讓用戶輕松高效地完成藝術(shù)視頻創(chuàng)作。16.3相關(guān)知識——可靈AI平臺介紹輸入一段文字,可靈大模型根據(jù)文本表達生成5s或105視頻,將文字轉(zhuǎn)變?yōu)橐曨l畫面?,F(xiàn)已支持“標準”與“高品質(zhì)”兩個生成模式,標準模式生成速度更快,高品質(zhì)模式畫面質(zhì)量更佳;可靈同時支持16:9,9:16與1:1三種畫幅比例,更多元滿足用戶的視頻創(chuàng)作需求。16.3相關(guān)知識——可靈AI視頻功能介紹:文生視頻我們在上個項目中已經(jīng)知道,“Prompt'”作為文生視頻大模型最主要的交互語言,將直接決定了模型返回的視頻內(nèi)容,可靈官方也提供了提示詞公式,可供參考:提示詞=主體(主體描述)+運動+場景(場景描述)+(鏡頭語言+光影+氛圍)——括號里的內(nèi)容可選填以上公式最核心的構(gòu)成就是主體、運動和場景,這也是描述一個視頻畫面最簡單、最基本的單元。當(dāng)我們希望更細節(jié)地描述主體與場景時,只需要通過列舉多個描述詞短句,保持Prompt中希望出現(xiàn)要素的完整性即可,可靈會根據(jù)我們的表達進行提示示詞擴寫,生成符合預(yù)期的視頻。16.3相關(guān)知識——可靈AI視頻功能介紹:文生視頻“一只大熊貓在咖啡廳里看書”案例16.3相關(guān)知識——可靈AI視頻功能介紹:文生視頻Prompt一只大熊貓在咖啡廳看書一只大熊貓戴著黑框眼鏡在咖啡廳看書,書本放在桌子上,桌子上還有一杯咖啡,冒著熱氣,旁邊是咖啡廳的窗戶鏡頭中景拍攝,背景虛化,氛圍光照,一只大熊貓戴著黑框眼鏡在咖啡廳看書,書本放在桌子上,桌子上還有一杯啡,冒著熱氣,旁邊是咖啡廳的窗戶,電影級調(diào)色生成效果截圖
16.3相關(guān)知識——可靈AI視頻功能介紹:圖生視頻輸入一張圖片,可靈大模型根據(jù)圖片理解生成5s或10s視頻,將圖片轉(zhuǎn)變?yōu)橐曨l畫面;輸入一張圖片加文本描述,可靈大模型根據(jù)文本表達將圖片生成一段視頻?,F(xiàn)已支持“標準”與“高品質(zhì)”兩個生成模式,以及16:9,9:16與1:1三種畫幅比例,更多元滿足用戶的視頻創(chuàng)作需求。對圖生視頻來說,控制圖像中的主體運動是核心,可靈提供了以下公式,可供參考:提示詞=主體+運動或背景+運動①主體。畫面中的人物、動物、物體等主體。②運動。指目標主體希望實現(xiàn)的運動軌跡。③背景。畫面中的背景?!懊赡塞惿髂R”案例16.3相關(guān)知識——可靈AI視頻功能介紹:圖生視頻原圖Prompt戴墨鏡蒙娜麗莎用手戴上墨鏡蒙娜麗莎用手戴上墨鏡,背景出現(xiàn)一道光
生成視頻截圖
運動筆刷功能,即上傳任意一張圖片,用戶可以在圖片中通過“自動選區(qū)”或者“涂抹”對某一個區(qū)域或主體進行選中,添加運動軌跡,同時輸入符合預(yù)期的運動Prompt(主體+運動),單擊生成后模型將為用戶生成添加指定運動后的圖生視頻結(jié)果,以此來控制特定主體的運動表現(xiàn),補足進階的圖生視頻可控生成。運動筆刷功能作為圖生視頻更強的可控生成能力,可以進一步按照意愿生成期望的區(qū)域或主體的指定運動,比如圖生視頻比較難實現(xiàn)的“球類運動”,以及對“人物/動物轉(zhuǎn)向和行走路線”的生成等,支持6種主體和軌跡的同時設(shè)置,另外,可靈支持“靜態(tài)筆刷"功能,用靜態(tài)筆刷涂抹后,模型將固定涂抹區(qū)域的像素點,避免運鏡發(fā)生,如果不希望運動軌跡可能引起的鏡頭運動,可以在圖片底部添加靜態(tài)筆刷。16.3相關(guān)知識——可靈AI視頻功能介紹:運動筆刷功能運動筆刷功能使用示例16.3相關(guān)知識——可靈AI視頻功能介紹:運動筆刷功能輸入文字提示輸入原始圖片操作圖片帆船在海上緩慢行駛,大海泛起波浪
小草被風(fēng)吹動,兩只狗向不同方向轉(zhuǎn)頭看向遠方
以圖生視頻為例,包含以下流程。(1)上傳圖片(2)輸入描述詞(3)參數(shù)設(shè)置(4)生成視頻(5)結(jié)果預(yù)覽與選擇16.3相關(guān)知識——可靈AI視頻生成流程(6)編輯與優(yōu)化可靈提供了以下高級功能:①視頻延長。在當(dāng)前基礎(chǔ)上延長視頻的時長。②對口型。對于滿足對口型的視頻可以選擇對口型,支持輸入文本和上傳本地配音。③補幀。補幀功能可以為當(dāng)前視頻添加更多幀來補充細節(jié),從而讓視頻更加流暢。④提升分辨率。此功能可以讓視頻分辨率更高,更清晰。⑤AI配樂。可以選擇自動根據(jù)畫面配樂,也可選擇自定義AI配樂。(7)導(dǎo)出與下載完成所有編輯后,用戶可以下載視頻到本地,格式為.mp4。04項目實施——步驟一:訪問可靈AI工具16.4項目實施訪問可靈AI工具的官方網(wǎng)站,登錄賬戶后進入主頁——步驟二:上傳圖片16.4項目實施在主頁上選擇“AI視頻”模塊的“圖生視頻”功能,在“圖片及創(chuàng)意描述”選框下單擊按鈕即可上傳圖片,選擇一張你希望制作成舞蹈效果的文物圖片,也可以先使用可靈的AI圖片功能生成想要的圖片。比如我們輸入“一個全身的三星堆,人形銅器,站在地上,背景是一個博物館”,單擊“立即生成”,等待一段時間后,即可看到生成結(jié)果?!襟E三:使用圖片生成視頻16.4項目實施選擇喜歡的一張圖片后,單擊該圖片,再單擊圖片下方的“生成視頻”按鈕,即可跳轉(zhuǎn)至圖生視頻界面——步驟四:輸入描述詞16.4項目實施在“圖片創(chuàng)意描述”欄下方輸入描述詞,如“三星堆人型青銅器在跳廣場舞,歡快的表情和動作”,單擊下方的“立即生成”按鈕,等待一段時間后可以看到生成結(jié)果——步驟五:使用運動筆刷控制畫面16.4項目實施如果對生成的效果不滿意,可以使用更高級的動能來優(yōu)化視頻控制。比如使用可靈的“運動筆刷”工具,自行選擇要控制的畫面部分和運動軌跡。比如在當(dāng)前項目中,我們將三星堆的兩只胳膊以及頭部分別設(shè)置為一個獨立的區(qū)域,為他們設(shè)置不同的運動軌跡,來組合為最終的動態(tài)效果。首先要切換到可靈1.0模型(1.5模型暫不支持此功能),再單擊下方“運動筆刷”功能的繪制按鈕,即可打開編輯界面——步驟五:使用運動筆刷控制畫面16.4項目實施在運動筆刷編輯界面,單擊“區(qū)域”按鈕繪制3個區(qū)域,分別涂抹三星堆的兩只胳膊和頭部,再單擊“軌跡”按鈕繪制運動軌跡。最后單擊右下角“確認添加”即可完成運動筆刷的參數(shù)控制——步驟五:使用運動筆刷控制畫面16.4項目實施編輯好運動筆刷的區(qū)域和軌跡后,再次單擊“立即生成”,等待一段時間后可查看添加運動筆刷后的生成效果——步驟六:導(dǎo)出結(jié)果16.4項目實施單擊生成結(jié)果右下角的“下載”按鈕可將視頻下載到本地保存。05項目拓展在掌握了基本操作后,可以嘗試使用更多的高級功能,或者按照自己喜歡的動作重新繪制運動筆刷,也可以嘗試“對口型”功能,讓文物邊唱邊跳。16.5項目拓展06項目小結(jié)通過本項目,小華成功將靜態(tài)的文物轉(zhuǎn)化為生動的舞蹈視頻,幫助文物變得活靈活現(xiàn)。在操作過程中,小華學(xué)習(xí)了運動筆刷等更精細的視頻參數(shù)控制功能,得到了更符合需求的視頻結(jié)果,同時也掌握了更多的AI生視頻平臺的使用方法,對AI生成視頻的技能掌握更加得心應(yīng)手。16.6項目小結(jié)07項目練習(xí)一、選擇題1.文生視頻功能中,提示詞的核心組成是什么?(
)A.場景和光影B.主體、運動和場景C.背景和氛圍D.畫面比例和分辨率2.圖生視頻生成時,提示詞中需要特別描述的是哪兩部分?(
)A.主體和運動B.主體和光影C.背景和場景D.分辨率和鏡頭語言3.什么功能可以實現(xiàn)對圖生視頻中特定區(qū)域的運動控制?(
)A.AI優(yōu)化功能B.視頻延長功能C.運動筆刷功能D.對口型功能16.7項目練習(xí)一、選擇題4.AI生視頻中視頻延長功能的主要作用是什么?(
)A.提升視頻的清晰度B.延長視頻的時長C.增強運動軌跡的范圍D.增加更多的特效5.以下哪一項是文生視頻提示詞優(yōu)化的正確做法?(
)A.簡單描述主體動作B.增加光影和鏡頭語言細節(jié)C.使用默認提示詞生成即可D.刪除提示詞中的運動描述16.7項目練習(xí)二、填空題1.圖生視頻提示詞的核心要素包括
和
。2.可靈AI提供了“
”功能,用于控制特定區(qū)域的運動軌跡。3.
是指通過鏡頭的各種應(yīng)用以及鏡頭之間的銜接和切換來傳達故事或信息,并創(chuàng)造出特定的視覺效果和情感氛圍。如超大遠景拍攝,背景虛化、特寫、長焦鏡頭拍攝、地面拍攝、頂部拍攝、航拍、景深等。16.7項目練習(xí)三、操作題制作一段“動態(tài)博物館之旅”視頻,嘗試更多高級功能??蓞⒖家韵虏襟E。①
上傳素材。選擇一張清晰的博物館內(nèi)景圖片,作為靜態(tài)背景圖。②
描述內(nèi)容。在提示詞框中輸入提示詞:“一位導(dǎo)游走過博物館,講解文物背景,背景墻上的文物逐漸亮起光芒,整個場景充滿神秘感?!雹?/p>
使用運動筆刷。為背景墻上的幾個文物區(qū)域分別繪制運
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年西湖區(qū)人力資源和社會保障局公開招聘編外工作人員備考題庫及一套參考答案詳解
- 養(yǎng)老院健康講座制度
- 2026年馬鞍山市人民醫(yī)院博望分院(博望區(qū)人民醫(yī)院)招聘派遣制工作人員5人備考題庫及答案詳解參考
- 2026年西安惠安醫(yī)院招聘備考題庫完整參考答案詳解
- 2026年正定產(chǎn)業(yè)投資控股集團有限公司面向社會招聘職業(yè)經(jīng)理人的備考題庫及答案詳解參考
- 中學(xué)學(xué)生社團活動經(jīng)費管理獎懲制度
- 大理農(nóng)林職業(yè)技術(shù)學(xué)院2026年公開招聘非編工作人員備考題庫附答案詳解
- 2026年武漢市區(qū)屬國有企業(yè)招聘備考題庫含答案詳解
- 修水縣投資集團有限公司及所屬企業(yè)2026年公開招聘備考題庫及答案詳解1套
- 2026年自貢市自流井區(qū)人力資源和社會保障局自流井區(qū)事業(yè)單位公開選調(diào)工作人員的備考題庫及1套完整答案詳解
- 大仲馬課件教學(xué)課件
- 2025至2030尿素硝酸銨(UAN)行業(yè)產(chǎn)業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 集團公司年度經(jīng)營狀況分析報告
- 2025蜀道集團下屬四川金通工程試驗檢測有限公司招聘18人考試參考題庫附答案解析(奪冠)
- 2025四川長江擔(dān)保集團有限公司下屬子公司宜賓和正融資擔(dān)保有限公司第三批員工招聘1人筆試歷年參考題庫附帶答案詳解
- 浙江省臺金七校聯(lián)盟2025-2026學(xué)年高一上學(xué)期11月期中聯(lián)考語文試題含答案
- 汽車網(wǎng)絡(luò)與新媒體營銷 教案 項目5-8 汽車直播營銷-汽車網(wǎng)絡(luò)與新媒體營銷綜合技能
- 醫(yī)院抗菌藥物合理使用管理記錄
- 2025年熱科院筆試試題及答案
- 物業(yè)管理員實操簡答試題附答案
- T-CSF 0114-2025 城市綠地植物物種多樣性評價規(guī)范
評論
0/150
提交評論