版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
生成式視覺模型
原理與實(shí)踐9:16:08下午1第3章
變分自編碼器9:16:08下午2主要內(nèi)容預(yù)備知識自編碼器極大似然估計(jì)總體思路模型結(jié)構(gòu)9:16:08下午3理論目標(biāo)訓(xùn)練算法后驗(yàn)/先驗(yàn)采樣條件VAE實(shí)現(xiàn)代碼1.預(yù)備知識I:自編碼器降維在機(jī)器學(xué)習(xí)中,降維是減少描述數(shù)據(jù)的特征數(shù)量的過程。降維可以被理解為數(shù)據(jù)壓縮,包含一個(gè)抽象的編碼器和一個(gè)抽象的解碼器。編碼器壓縮數(shù)據(jù),解碼器則用于解壓縮。9:16:08下午41.預(yù)備知識I:自編碼器自編碼器(Autoencoder)用神經(jīng)網(wǎng)絡(luò)來作為編碼器和解碼器,并使用迭代優(yōu)化學(xué)習(xí)最佳的編碼-解碼方案。9:16:08下午5隱空間的維度一般遠(yuǎn)小于數(shù)據(jù)空間的維度1.預(yù)備知識I:自編碼器
9:16:08下午61.預(yù)備知識I:自編碼器問題:自編碼器是否是生成模型?為什么?9:16:08下午7復(fù)習(xí):什么是生成式建模?9:16:08下午8
復(fù)習(xí):密度估計(jì)的方法9:16:08下午9
1.預(yù)備知識I:自編碼器根據(jù)以上定義,自編碼器不是生成模型!9:16:08下午101.預(yù)備知識II:極大似然估計(jì)9:16:08下午11
1.預(yù)備知識II:極大似然估計(jì)9:16:08下午12
1.預(yù)備知識II:極大似然估計(jì)9:16:08下午13
極大似然估計(jì)(MaximumLikelihoodFunction,MLE),屬于點(diǎn)估計(jì)法
通俗理解極大似然估計(jì)就是一個(gè)猜參數(shù)的方法。我們看哪個(gè)參數(shù)值能讓觀測到的數(shù)據(jù)出現(xiàn)的可能性最大,就認(rèn)為它是真實(shí)參數(shù)的估計(jì)值。1.預(yù)備知識II:極大似然估計(jì)9:16:08下午14
1.預(yù)備知識II:極大似然估計(jì)
9:16:08下午152.總體思路
9:16:08下午162.總體思路
9:16:08下午17什么是隱變量?2.總體思路變分自編碼器(VariationalAutoencoder,VAE)是一種含有隱變量的生成模型。顯變量(ObservableVariable)可直接觀測隱變量(LatentVariable)不可直接觀測9:16:08下午18變分自編碼器在編碼過程中引入了一個(gè)隱變量,使得模型能夠?qū)W習(xí)到數(shù)據(jù)的潛在分布。通過優(yōu)化潛在變量的變分下界,變分自編碼器能夠生成與原始數(shù)據(jù)分布相似的新樣本。9:16:08下午192.總體思路2.總體思路
9:16:08下午202.總體思路:如何建模?
9:16:08下午21一個(gè)直觀想法(Na?veidea)2.總體思路:如何建模?
9:16:08下午222.總體思路:聯(lián)合分布的分解
9:16:08下午23分解一:分解二:2.總體思路:一些定義與假設(shè)
9:16:08下午24分解一:分解二:定義&假設(shè):2.總體思路:一些定義與假設(shè)9:16:08下午25分解一:分解二:定義&假設(shè):用推斷網(wǎng)絡(luò)建模
用生成網(wǎng)絡(luò)建模變分分布
2.總體思路:最大化證據(jù)下界9:16:08下午26
2.總體思路:總結(jié)9:16:08下午279:16:08下午283.模型結(jié)構(gòu)
9:16:08下午29
3.模型結(jié)構(gòu)
9:16:08下午303.模型結(jié)構(gòu)
9:16:08下午313.模型結(jié)構(gòu)自編碼器和變分自編碼器在模型結(jié)構(gòu)上有什么區(qū)別?9:16:08下午324.理論目標(biāo):證據(jù)下界對分解二等號兩側(cè)取對數(shù),可得移項(xiàng),可得9:16:08下午33分解二:對數(shù)似然函數(shù)4.理論目標(biāo):證據(jù)下界
9:16:08下午34接下來,我們來推導(dǎo)證據(jù)下界(ELBO)的具體表達(dá)式!4.理論目標(biāo):證據(jù)下界9:16:08下午354.理論目標(biāo):證據(jù)下界9:16:08下午364.理論目標(biāo):證據(jù)下界9:16:08下午374.理論目標(biāo):證據(jù)下界9:16:08下午384.理論目標(biāo):證據(jù)下界9:16:08下午394.理論目標(biāo):證據(jù)下界9:16:08下午404.理論目標(biāo):證據(jù)下界9:16:08下午414.理論目標(biāo):證據(jù)下界9:16:08下午424.理論目標(biāo):證據(jù)下界9:16:08下午434.理論目標(biāo):證據(jù)下界9:16:08下午444.理論目標(biāo):證據(jù)下界證據(jù)下界具有如下形式:9:16:08下午454.理論目標(biāo):證據(jù)下界9:16:08下午46當(dāng)且僅當(dāng)時(shí),對數(shù)似然等于ELBO。這也意味著,當(dāng)變分分布越接近后驗(yàn)分布,ELBO對對數(shù)似然的替代性越強(qiáng)。注意:4.理論目標(biāo):琴生不等式
9:16:08下午474.理論目標(biāo):更簡潔的推導(dǎo)應(yīng)用琴生不等式,可得9:16:08下午484.理論目標(biāo):最大化ELBO
9:16:08下午494.理論目標(biāo):最大化ELBO根據(jù)分解一,可得9:16:08下午50分解一:4.理論目標(biāo):先驗(yàn)匹配項(xiàng)先驗(yàn)匹配項(xiàng)已假設(shè)變分分布已假設(shè)先驗(yàn)分布則先驗(yàn)匹配項(xiàng)有顯式表達(dá)式9:16:08下午514.理論目標(biāo):先驗(yàn)匹配項(xiàng)注意:高斯分布之間的KL散度具有顯示表達(dá)式9:16:08下午524.理論目標(biāo):重構(gòu)項(xiàng)
9:16:08下午53
4.理論目標(biāo):重構(gòu)項(xiàng)
9:16:08下午544.理論目標(biāo):重參數(shù)化
9:16:08下午554.理論目標(biāo):重參數(shù)化
9:16:08下午564.理論目標(biāo):重參數(shù)化那么,我們可以將原始目標(biāo)函數(shù)改寫9:16:08下午57改寫估計(jì)
4.理論目標(biāo):重參數(shù)化
9:16:08下午58對應(yīng)元素相乘4.理論目標(biāo):擴(kuò)展至整個(gè)分布
9:16:08下午595.訓(xùn)練算法:理論損失函數(shù)對理論目標(biāo)函數(shù)取負(fù),可得到理論損失函數(shù)(TheoreticalLossFunction),即9:16:08下午605.訓(xùn)練算法:經(jīng)驗(yàn)損失函數(shù)
9:16:08下午615.訓(xùn)練算法:經(jīng)驗(yàn)損失函數(shù)經(jīng)驗(yàn)損失可以進(jìn)一步化簡為:9:16:08下午62假設(shè):化簡5.訓(xùn)練算法:經(jīng)驗(yàn)損失函數(shù)
9:16:08下午635.訓(xùn)練算法:總體流程9:16:08下午649:16:08下午656.采樣
9:16:08下午66復(fù)習(xí):模型結(jié)構(gòu)
9:16:08下午676.采樣:后驗(yàn)采樣9:16:08下午686.采樣:后驗(yàn)采樣9:16:08下午696.采樣:先驗(yàn)采樣9:16:08下午706.采樣:先驗(yàn)采樣9:16:08下午717.條件VAE條件變分自編碼器(ConditionalVariationalAutoencoder,CVAE)是變分自編碼器的變體模型,它可以對條件分布進(jìn)行估計(jì),并根據(jù)給定條件進(jìn)行圖像生成。9:16:08下午727.條件VAE將條件輸入到變分自編碼器中的方式有多種,此處我們介紹基于線性投影(LinearProjection)的方法。9:16:08下午738.代碼示例:數(shù)據(jù)集
9:16:08下午748.代碼示例:載入Python包9:16:08下午758.代碼示例:參數(shù)設(shè)置9:16:08下午768.代碼示例:數(shù)據(jù)載入9:16:08下午778.代碼示例:定義VAE類9:16:08下午789:16:08下午799:16:08下午809:16:08下午819:16:08下午82
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)數(shù)學(xué)知識點(diǎn)及 100 個(gè)自測題答案
- 知識點(diǎn)及2025秋期末測試卷(附答案)-浙美版小學(xué)美術(shù)六年級上冊
- 數(shù)控水射流切割機(jī)操作工安全教育水平考核試卷含答案
- 井下出礦工崗前基礎(chǔ)實(shí)戰(zhàn)考核試卷含答案
- 電切削工安全演練強(qiáng)化考核試卷含答案
- 2025湖北鶴峰巧才勞務(wù)派遣有限公司招聘工作人員2人筆試參考題庫附帶答案詳解(3卷)
- 戲服制作工安全意識強(qiáng)化模擬考核試卷含答案
- 2025年國家能源投資集團(tuán)有限責(zé)任公司高校畢業(yè)生統(tǒng)招筆試參考題庫附帶答案詳解(3卷)
- 2025年中國林產(chǎn)品集團(tuán)有限公司公開招聘工作人員筆試參考題庫附帶答案詳解(3卷)
- 通??h2024云南玉溪市通海縣融媒體中心提前招聘播音員2人筆試歷年參考題庫典型考點(diǎn)附帶答案詳解(3卷合一)
- 2025年全國礦山安全生產(chǎn)事故情況
- 船舶安全獎(jiǎng)懲管理制度
- 印刷ctp制版管理制度
- T-CWAN 0063-2023 焊接數(shù)值模擬熱彈塑性有限元方法
- 2024鄂爾多斯市東勝國有資產(chǎn)投資控股集團(tuán)有限公司招聘26人筆試參考題庫附帶答案詳解
- 外研版(三起)(2024)三年級下冊英語Unit 5 單元測試卷(含答案)
- 山東省濟(jì)南市2024-2025學(xué)年高三上學(xué)期1月期末考試 化學(xué)試題(含答案)
- 幼兒園防食物中毒安全主題
- 我的家鄉(xiāng)四川南充
- 市場拓展與銷售渠道拓展方案
- 工地大門施工協(xié)議書
評論
0/150
提交評論