版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
生成式視覺(jué)模型
原理與實(shí)踐9:19:06下午1第7章
典型應(yīng)用場(chǎng)景9:19:06下午2主要內(nèi)容典型應(yīng)用場(chǎng)景實(shí)戰(zhàn)案例9:19:06下午3典型應(yīng)用場(chǎng)景可控圖像生成圖像翻譯圖像超分辨率圖像修復(fù)圖像分割圖像編輯……9:19:06下午4可控圖像生成ControllableImageGeneration根據(jù)用戶(hù)的指定的條件,生成具有特定屬性或內(nèi)容的圖像。9:19:06下午5典型方法:條件生成模型CVAE、SNGAN、SAGAN、BigGAN、CFG、ADM等GigaGAN、隱擴(kuò)散模型、StableDiffusion等9:19:06下午6文生圖9:19:06下午7提示詞:一幅具有畢加索風(fēng)格的最后的晚餐基于語(yǔ)義圖的圖像生成9:19:06下午8天空樹(shù)木湖泊視頻風(fēng)格轉(zhuǎn)換9:19:06下午9輸入風(fēng)格圖輸出圖像翻譯
9:19:06下午10源域目標(biāo)域SourceDomainTargetDomain典型方法CycleGAN(2017)CycleGAN-Turbo(2024)Palette(2022)調(diào)色板DiffI2(2023)……9:19:06下午11照片上色
9:19:06下午12自動(dòng)駕駛
9:19:06下午13醫(yī)療影像分析
9:19:06下午14人像卡通化大頭照卡通化9:19:06下午15草稿圖到完整繪畫(huà)9:19:06下午16輸入草稿提示詞輸入草稿提示詞圖像超分辨率Super-Resolution(SR)將低分辨率(LowResolution,LR)圖像轉(zhuǎn)換為高分辨率(HighResolution,HR)圖像,從而增強(qiáng)圖像的細(xì)節(jié)和清晰度。9:19:06下午17典型方法SRGAN(2017)經(jīng)典模型,引用極多ESRGAN(2018)GigaGAN(2023),能夠支持4K超分辨率StableDiffusion(2022)ResShift(2024)……9:19:06下午18遙感圖像的超分辨率重建9:19:06下午19圖像修復(fù)對(duì)受到損壞的圖像進(jìn)行修復(fù)重建或者去除圖像中的多余物體的過(guò)程。9:19:06下午20典型方法9:19:06下午21基于WassersteinGAN的圖像修復(fù)(2020)采用GAN的架構(gòu)和對(duì)抗損失將修復(fù)問(wèn)題轉(zhuǎn)化為對(duì)抗生成問(wèn)題典型方法9:19:06下午22Repaint(2022)將圖像修復(fù)歸納為一個(gè)以已知區(qū)域?yàn)闂l件的條件生成式建模問(wèn)題利用DDPM模型進(jìn)行圖像修復(fù)圖像分割將圖像劃分為若干個(gè)具有獨(dú)特性質(zhì)的區(qū)域,并識(shí)別出感興趣的目標(biāo)9:19:06下午23典型方法SegDiff(2021)將分割任務(wù)轉(zhuǎn)化為條件生成式建模任務(wù)以待分割圖片為條件利用擴(kuò)散模型進(jìn)行建模9:19:06下午24圖像編輯對(duì)圖像進(jìn)行各種編輯和轉(zhuǎn)換的過(guò)程。這包括但不限于圖像的縮放、裁剪、旋轉(zhuǎn)、翻轉(zhuǎn)、添加水印、添加文本、添加倒影、圖像遮罩、設(shè)置背景色、高斯模糊、像素化等操作。9:19:06下午25典型方法:DragGANDragGAN僅需通過(guò)簡(jiǎn)單的拖動(dòng)動(dòng)作,即可實(shí)現(xiàn)對(duì)圖像中對(duì)象的形狀、布局、姿態(tài)、表情等特征的精確調(diào)整,同時(shí)保持圖像的整體真實(shí)性和多樣性。9:19:06下午26注意:合法使用、防止AI詐騙9:19:06下午27實(shí)戰(zhàn)案例案例1:醫(yī)療影像的模態(tài)轉(zhuǎn)換案例2:遙感圖像的超分辨率案例3:StableDiffusion文生圖9:19:06下午28案例1:醫(yī)療影像的模態(tài)轉(zhuǎn)換主要任務(wù):實(shí)現(xiàn)腦部CT影像與核磁共振影像(MRI)間的相互轉(zhuǎn)換。9:19:06下午29案例1:醫(yī)療影像的模態(tài)轉(zhuǎn)換數(shù)據(jù)集:Kaggle平臺(tái)上的“CTandMRIBrainScans”數(shù)據(jù)集2486張腦部CT影像和2488張腦部MRI影像9:19:06下午30案例1:醫(yī)療影像的模態(tài)轉(zhuǎn)換模型:CycleGANCycleGAN是一種無(wú)需配對(duì)數(shù)據(jù)的圖像翻譯模型,它借助了GAN的結(jié)構(gòu)實(shí)現(xiàn)兩個(gè)不同域之間的圖像風(fēng)格轉(zhuǎn)換,并通過(guò)循環(huán)一致性損失保證轉(zhuǎn)換的準(zhǔn)確性。9:19:06下午31[1]Zhu,Jun-Yan,etal."Unpairedimage-to-imagetranslationusingcycle-consistentadversarialnetworks."
ProceedingsoftheIEEEinternationalconferenceoncomputervision.2017.源域目標(biāo)域案例1:醫(yī)療影像的模態(tài)轉(zhuǎn)換完整訓(xùn)練目標(biāo)9:19:06下午32案例1:醫(yī)療影像的模態(tài)轉(zhuǎn)換實(shí)驗(yàn)效果9:19:06下午33案例2:遙感圖像的超分辨率
9:19:06下午34案例2:遙感圖像的超分辨率數(shù)據(jù)集:OLI2MSI該數(shù)據(jù)集由Landsat8-OLI與Sentinel2-MSI圖像組成,其中OLI圖像作為低分辨率(Low-Resolution,LR)圖像,MSI圖像則被視為真實(shí)的(GroundTruth)高分辨率(High-Resolution,HR)圖像9:19:06下午35案例2:遙感圖像的超分辨率數(shù)據(jù)集:OLI2MSI整個(gè)數(shù)據(jù)集包含5225個(gè)可用于訓(xùn)練的“低清-高清”圖像對(duì),另有100個(gè)“低清-高清”圖像對(duì)可用于測(cè)試。9:19:06下午36案例2:遙感圖像的超分辨率模型:SRGAN9:19:06下午37案例2:遙感圖像的超分辨率實(shí)驗(yàn)效果:9:19:06下午38案例3:StableDiffusion文生圖本地部署方法:訪問(wèn)“秋葉aaaki”的Bilibili官方主頁(yè),以便獲取最新版本的整合包資源(本指南以V4.9.1版本為范例進(jìn)行說(shuō)明)9:19:06下午39案例3:StableDiffusion文生圖本地部署方法:執(zhí)行“啟動(dòng)器運(yùn)行依賴(lài)-dotnet-6.0.11.exe”程序,以便安裝所有必需的依賴(lài)項(xiàng)解壓“sd-webui-aki-v4.9.1.7z”壓縮包,這將生成一個(gè)名為“sd-webui-aki-v4.9.1”的文件夾9:19:06下午40案例3:StableDiffusion文生圖本地部署方法:將位于“./controlnet/模型”路徑下的checkpoint文件復(fù)制到“./sd-webui-aki-v4.9.1/models/ControlNet”目錄內(nèi)最后,只需在“./sd-webui-aki-v4.9.1”文件夾下運(yùn)行“A繪世啟動(dòng)器.exe”9:19:
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年甘肅省平?jīng)鍪惺兄睂W(xué)校招聘協(xié)議培養(yǎng)師范生23人(第二批)備考核心試題附答案解析
- 2025青海西寧市城北區(qū)事業(yè)單位招聘1人考試重點(diǎn)題庫(kù)及答案解析
- 2025吉林四平市伊通滿(mǎn)族自治縣衛(wèi)生系統(tǒng)事業(yè)單位招聘(含專(zhuān)項(xiàng)招聘高校畢業(yè)生)117人筆試重點(diǎn)題庫(kù)及答案解析
- 2025南平市消防救援支隊(duì)招聘消防文員2人考試重點(diǎn)題庫(kù)及答案解析
- 2025年英山縣事業(yè)單位第二批公開(kāi)考核招聘“三支一扶”服務(wù)期滿(mǎn)人員參考筆試題庫(kù)附答案解析
- 2025安徽蚌埠市中欣國(guó)有控股有限公司招聘副總經(jīng)理2人考試重點(diǎn)題庫(kù)及答案解析
- 2025安徽省中煤三建國(guó)際公司機(jī)關(guān)工作人員內(nèi)部競(jìng)聘31人筆試重點(diǎn)試題及答案解析
- 2025廣東深圳市規(guī)劃和自然資源局光明管理局勞務(wù)派遣人員招聘1人考試重點(diǎn)試題及答案解析
- 2025重慶科技大學(xué)招聘14人考試備考題庫(kù)及答案解析
- 2025年?yáng)|航實(shí)業(yè)集團(tuán)陜西分公司招聘(8人)筆試重點(diǎn)試題及答案解析
- 俄羅斯易貨貿(mào)易操作手冊(cè)2024年
- 個(gè)體工商戶(hù)入股協(xié)議書(shū)
- DB37-T 3080-2022特種設(shè)備作業(yè)人員配備要求
- DL∕T 1878-2018 燃煤電廠儲(chǔ)煤場(chǎng)盤(pán)點(diǎn)導(dǎo)則
- 科學(xué)精神與科學(xué)研究方法智慧樹(shù)知到期末考試答案2024年
- JB-T 14509-2023 反滲透海水淡化設(shè)備技術(shù)規(guī)范
- 種豬場(chǎng)人工授精技術(shù)推廣與應(yīng)用樣本
- 景觀模型設(shè)計(jì)與制作課件
- 工傷認(rèn)定申請(qǐng)表
- 信息化建設(shè)情況調(diào)查表
- 靜脈導(dǎo)管常見(jiàn)并發(fā)癥臨床護(hù)理實(shí)踐指南1
評(píng)論
0/150
提交評(píng)論