版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
(19)國家知識產(chǎn)權(quán)局(12)發(fā)明專利(10)授權(quán)公告號CN115731199B(65)同一申請的已公布的文獻(xiàn)號(73)專利權(quán)人福州大學(xué)地址350108福建省福州市閩侯縣福州大學(xué)城烏龍江北大道2號福州大學(xué)(74)專利代理機(jī)構(gòu)福州元創(chuàng)專利商標(biāo)代理有限公司35100專利代理師陳明鑫蔡學(xué)俊式生成對抗網(wǎng)絡(luò)的非成對水下圖像增強(qiáng).《電子學(xué)報》.2025,全文.審查員黃碧琴(54)發(fā)明名稱一種基于小波變換的非成對水下圖像增強(qiáng)方法(57)摘要本發(fā)明涉及一種基于小波變換的非成對水下圖像增強(qiáng)方法。包括:將待訓(xùn)練的非成對的數(shù)據(jù)進(jìn)行預(yù)處理;設(shè)計基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò),對輸入圖像的低頻和高頻部分進(jìn)行分別處理,再對高頻部分和低頻部分進(jìn)行結(jié)合;搭建循環(huán)生成對抗網(wǎng)絡(luò)框架,與基于小波變換的水下圖像質(zhì)量增強(qiáng)網(wǎng)絡(luò)結(jié)合得到基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò);設(shè)計用于訓(xùn)練非成對水下圖像增強(qiáng)網(wǎng)絡(luò)的目標(biāo)損失函數(shù);使用非成對的圖像訓(xùn)練基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)收斂到納什平衡;將待增強(qiáng)水下圖像進(jìn)行歸一化處理,然后輸入訓(xùn)練好的水下圖像增強(qiáng)模型,輸出增強(qiáng)圖像。本發(fā)明能對水下圖像進(jìn)行增21.一種基于小波變換的非成對水下圖像增強(qiáng)方法,其特征在于,包括如下步驟:S1、將待訓(xùn)練的非成對的數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理、數(shù)據(jù)增強(qiáng)和歸一化處理;S2、設(shè)計基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò),通過小波變換對輸入圖像的低頻和高頻部分分別處理,低頻部分使用低頻處理模塊進(jìn)行校正,高頻部分使用高頻處理模塊進(jìn)行校正,最后再對高頻部分和低頻部分進(jìn)行結(jié)合;具S21、基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò)的輸入為歸一化后的水下圖像I;將圖像輸入基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò)后,圖像經(jīng)過一個卷積核為1×1、步長為1的卷積,兩個卷積核為3×3、步長為1的卷積,提取水下圖像初始特征F1ut;水下圖像特征F1u通過一個小波池化層被分解為低頻特征11和高頻特征1h,h1,hh;S22、設(shè)計基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò)中的低頻處理模塊;低頻特征11進(jìn)入結(jié)合注意力機(jī)制的U-Net網(wǎng)絡(luò)結(jié)構(gòu)的低頻處理模塊,得到處理后的低頻特征11';具體實現(xiàn)如下:S221、設(shè)計S22中的結(jié)合注意力機(jī)制的U-Net網(wǎng)絡(luò)結(jié)構(gòu)的低頻處理模塊;低頻處理模塊由一個七個模塊堆疊的U-Net網(wǎng)絡(luò)結(jié)構(gòu)組成,低頻處理模塊的第2,4,6層的跳連部分,各結(jié)合一個低頻注意力模塊;U-Net的網(wǎng)絡(luò)結(jié)構(gòu)中的降采樣模塊由一個激活函數(shù),一個歸一化S222、設(shè)計S221中的低頻注意力模塊;低頻注意力模塊由一個拓展網(wǎng)絡(luò)串聯(lián)一個3×3的卷積,一個通道注意力模塊組成;拓展網(wǎng)絡(luò)由三層并聯(lián)的不同數(shù)量的卷積塊和一個特征拼接操作串聯(lián)組成,每個卷積塊由一個卷積和一個激活函數(shù)串聯(lián)組成;拓展網(wǎng)絡(luò)的第一層是一個1×1的卷積塊,第二層是一個1×1的卷積塊串聯(lián)一個3×3的卷積塊,第三層是一個1×1的卷積塊串聯(lián)兩個3×3的卷積塊;拓展網(wǎng)絡(luò)輸出的特征經(jīng)過一個3×3的卷積和一個通道注意力模塊;S23、設(shè)計基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò)中的高頻處理模塊;高頻處理模塊采用三個并聯(lián)的高頻注意力模塊分別處理三個高頻特征1h,h1,hh,輸出處理后的高頻特征為1h’,hl',hh’;高頻注意力模塊由一個拓展網(wǎng)絡(luò)串聯(lián)一個3×3的卷積,一個空間注意力模塊,一個通道注意力模塊組成;拓展網(wǎng)絡(luò)由三層并聯(lián)的不同數(shù)量的卷積塊和一個特征拼接操作串聯(lián)組成,每個卷積塊由一個卷積和一個激活函數(shù)串聯(lián)組成;第一層是一個3×3的卷積塊,第二層是兩個3×3的卷積塊,第三層是三個3×3的卷積塊;拓展網(wǎng)絡(luò)輸出的特征經(jīng)過一個3×S24、將低頻特征11'和高頻特征1h',hl',hh’融合并輸出增強(qiáng)圖像;低頻特征和高頻特征首先通過一個小波反池化層,再通過兩個卷積核為4×4、步長為1的卷積,輸出增強(qiáng)圖像E;小波反池化層是在小波池化層的基礎(chǔ)上將其卷積設(shè)為反卷積;S3、搭建循環(huán)生成對抗網(wǎng)絡(luò),與基于小波變換的水下圖像質(zhì)量增強(qiáng)網(wǎng)絡(luò)結(jié)合得到基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò);S4、設(shè)計基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)的目標(biāo)損失函數(shù);S5、使用非成對的圖像訓(xùn)練基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)收斂到納什平S6、將待增強(qiáng)水下圖像進(jìn)行歸一化處理,然后輸入訓(xùn)練好的基于小波變換的非成對水2.根據(jù)權(quán)利要求1所述的一種基于小波變換的非成對水下圖像增強(qiáng)方法,其特征在于,3所述S1具體實現(xiàn)如下:S11、將所有待訓(xùn)練非成對圖像分為原始的水下圖像和高質(zhì)量圖像;S12、將所有待訓(xùn)練非成對圖像進(jìn)行統(tǒng)一的放大,放大到原始圖像的1.12倍,對放大后S13、將所有待訓(xùn)練圖像進(jìn)行歸一化處理,給定圖像I(i,j),其歸一化處理后的圖像為1;在像素位置(i,j)處,計算歸一化值1(i,j)的公式如下:其中,(i,j)表示像素的位置,將歸一化后的水下圖像作為后續(xù)步驟的水下圖像,歸一化后的高質(zhì)量圖像作為后續(xù)步驟的高質(zhì)量圖像。3.根據(jù)權(quán)利要求1所述的一種基于小波變換的非成對水下圖像增強(qiáng)方法,其特征在于,S22中,低頻特征11進(jìn)入結(jié)合注意力機(jī)制的U-Net網(wǎng)絡(luò)結(jié)構(gòu)的低頻處理模塊,得到處理后的低頻特征11';計算公式如下:S23中,高頻處理模塊采用三個并聯(lián)的高頻注意力模塊分別處理三個高頻特征1h,hl,hh,輸出處理后的高頻特征為1h’,hl’,hh’;計算公式如下:其中HAM(*)表示高頻注意力模塊;S24中,低頻特征和高頻特征首先通過一個小波反池化層,再通過兩個卷積核為4×4、步長為1的卷積,輸出增強(qiáng)圖像E;計算公式如下:E=Conv(Conv(WaveUnpool(11',1h’,hl4.根據(jù)權(quán)利要求3所述的一種基于小波變換的非成對水下圖像增強(qiáng)方法,其特征在于,U-Net的網(wǎng)絡(luò)結(jié)構(gòu)中的上采樣模塊由一個激活函數(shù),一個歸一化層,一個2×2的反卷積組成;低頻處理模塊的具體計算公式如下:4其中Xn表示低頻處理模塊的輸入特征,Xou表示低頻處理模塊的輸出特征,Down(*)表示降采樣模塊,Up(*)表示上采樣模塊,LAM(*)表示低頻注意力模塊,ADD[*]表示矩陣加法S222中,低頻注意力模塊具體計算公式如下:X?=ReLU(Conv(ReLU(Conv(XX?=ReLU(Conv(ReLU(Conv(ReLU(Conv(XXout=SE_Layer(Conv(Cat[X?,X?其中Xin表示低頻注意力模塊的輸入特征,Xut表示低頻注意力模塊的輸出特征,Conv(*)表示通道注意力模塊。5.根據(jù)權(quán)利要求3所述的一種基于小波變換的非成對水下圖像增強(qiáng)方法,其特征在于,S23中,高頻注意力模塊的計算公式如下:X?=ReLU(Conv(ReLU(Conv(XX?=ReLU(Conv(ReLU(Conv(ReLU(Conv(XinXout=SE_Layer(SA_Layer(Conv(Cat[X?,X?其中,Xin表示高頻注意力模塊的輸入特征,Xut表示高頻注意力模塊的輸出特征,Conv(*)表示空間注意力模塊,SE_Layer(*)表示通道注意力模6.根據(jù)權(quán)利要求1所述的一種基于小波變換的非成對水下圖像增強(qiáng)方法,其特征在于,所述S3具體實現(xiàn)如下:S31、搭建循環(huán)生成對抗網(wǎng)絡(luò),包括將水下圖像進(jìn)行質(zhì)量增強(qiáng)的生成器Gw?c、將高質(zhì)量圖像轉(zhuǎn)化為水下圖像的生成器Gc?w、判斷生成的高質(zhì)量圖像的判別器Dc、判別生成的水下圖像的判別器D;生成器Gw?c、Gc2w的網(wǎng)絡(luò)使用S2設(shè)計的基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu);S32、將非配對的水下圖像與高質(zhì)量圖像輸入循環(huán)生成對抗網(wǎng)絡(luò),生成器Gw?c將水下圖像G進(jìn)行質(zhì)量增強(qiáng),生成增強(qiáng)圖像Ec,判別器D.將其與高質(zhì)量圖像進(jìn)行風(fēng)格比較;生成器Gc?w將高質(zhì)量圖像Gc轉(zhuǎn)化為水下圖像E,判別器D再將其與水下圖像進(jìn)行風(fēng)格比較。7.根據(jù)權(quán)利要求1所述的一種基于小波變換的非成對水下圖像增強(qiáng)方法,其特征在于,所述S4具體實現(xiàn)如下:設(shè)計基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)的目標(biāo)損失函數(shù),損失包括生成網(wǎng)絡(luò)損失和判別網(wǎng)絡(luò)損失;5生成網(wǎng)絡(luò)總目標(biāo)損失函數(shù)如下:tG=λ1·CGAN+λ2·tcycle+λ?·L項損失的系數(shù),·是實數(shù)的點乘操作;其中各項損失具體的計算公式如下:GAN=LMSE(1,Dc(Ec))+LMS其中,Dc(*)是判別增強(qiáng)圖像E的判別器,D(*)是判別生成的水下圖像E的判別器;Ec和E分別是生成器Gw?c生成的增強(qiáng)圖像和生成器Gc?W生成的水下圖像,LSE(*)是MSE損失;其中,R是生成器Gc?w將增強(qiáng)圖像E重構(gòu)得到的圖像,Rc是生成器Gw?c將生成出的水下圖像E重構(gòu)得到的圖像,G是輸入的水下圖像,Gc是輸入的高質(zhì)量圖像,L?(*)是L1損失;tidentity=L?(Fc,Gc)+L?(Fw,Gw)其中,F(xiàn)是將水下圖像G輸入生成器Gc?w成得到圖像,F(xiàn)是將高質(zhì)量圖像Gc輸入生成器Gw?c得到的圖像,G是輸入的水下圖像,Gc是輸入的高質(zhì)量圖像,L?(*)是L1損失;判別網(wǎng)絡(luò)損失如下:其中,tDw和tDw分別是判別器D的判別器損失以及判別器D的判別器損失,·是實數(shù)的點乘操作;tDc=0.5·(LMsE(0,Dc(Ec))+LMse(1,D其中,其中Dc(*)是判別增強(qiáng)圖像E的判別器;Ec是增強(qiáng)圖像,Gc是輸入的高質(zhì)量圖像,LDw=0.5·(LMsE(0,Dw(Ew))+LMsE(1,其中,D(*)是判別生成的水下圖像E的判別器;E是生成的水下圖像;Gw是輸入的水下8.根據(jù)權(quán)利要求1所述的一種基于小波變換的非成對水下圖像增強(qiáng)方法,其特征在于,所述S5具體實現(xiàn)如下:S51、將水下圖像和高質(zhì)量圖像隨機(jī)劃分為多個批次,每個批次包含N張水下圖像和N張高質(zhì)量圖像,將水下圖像和高質(zhì)量圖像隨機(jī)配對得到N對圖像;S52、將同一批次內(nèi)的每一對水下圖像Gw和高質(zhì)量圖像Gc輸入到S3的基于小波變換的非法計算圖像增強(qiáng)網(wǎng)絡(luò)中各參數(shù)的梯度,并利用隨機(jī)梯度下降方法更新圖像增強(qiáng)網(wǎng)絡(luò)的參成對水下圖像增強(qiáng)網(wǎng)絡(luò)的目標(biāo)損失函數(shù)數(shù)值收斂到納什平衡9.根據(jù)權(quán)利要求1所述的一種基于小波變換的非成對水下圖像增強(qiáng)方法,其特征在于,所述S6具體實現(xiàn)如下:6S61、將待增強(qiáng)的水下圖像進(jìn)行歸一化處理;S62、將經(jīng)過S61處理的圖像輸入訓(xùn)練好的基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)中的生成器Gw?C,輸出增強(qiáng)圖像。7一種基于小波變換的非成對水下圖像增強(qiáng)方法技術(shù)領(lǐng)域[0001]本發(fā)明涉及圖像處理以及計算機(jī)視覺領(lǐng)域,特別涉及一種基于小波變換的非成對水下圖像增強(qiáng)方法。背景技術(shù)[0002]水下圖像對海底資源勘探、水下目標(biāo)探測、水下打撈等水下環(huán)境應(yīng)用有著重要影響,這些都需要高質(zhì)量的視覺系統(tǒng)來感知周圍環(huán)境。然而,復(fù)雜的水下環(huán)境導(dǎo)致水下圖像質(zhì)量嚴(yán)重下降。由于水下環(huán)境和光照條件的復(fù)雜性,水下圖像增強(qiáng)是一個具有挑戰(zhàn)性的問題。水下圖像質(zhì)量下降的主要原因是光在水下傳播時的能量衰減和散射。光在水下傳播時,光波有不同的衰減系數(shù)。一般來說,紅光衰減比藍(lán)光和綠光快,所以水下圖像通常呈現(xiàn)藍(lán)綠色。此外,水下圖像也會受到波長相關(guān)的吸收和散射的影響,包括前向散射和后向散射,前向散射是指水中物體反射的光在傳輸?shù)较鄼C(jī)時發(fā)生小角度偏移的散射現(xiàn)象,導(dǎo)致圖像細(xì)節(jié)模糊。后向散射是指當(dāng)照射水中物體時,水中的雜質(zhì)被散射并直接被相機(jī)接收,導(dǎo)致圖像對音。這些不利的影響降低了水下圖像的能見度,對比度,甚至引入了色彩偏差,導(dǎo)致了水下圖像質(zhì)量嚴(yán)重下降。上述退化問題使得水下圖像增強(qiáng)成為一項具有挑戰(zhàn)性的任務(wù)。[0003]現(xiàn)有的水下圖像增強(qiáng)方法主要分為兩類:一是基于深度學(xué)習(xí)的方法,這類方法將水下圖像到正常圖像的轉(zhuǎn)化看成一種映射關(guān)系,利用網(wǎng)絡(luò)的學(xué)習(xí)擬合能力學(xué)習(xí)這種映射變化,從而實現(xiàn)水下圖像到正常圖像的轉(zhuǎn)化,但是這類方法對數(shù)據(jù)集的要求比較高,需要大量的成對圖像;并且在學(xué)習(xí)過程中通常伴隨著對圖像的編碼解碼操作,在這過程中可能會產(chǎn)生一些圖像信息的損失,造成增強(qiáng)后的圖像出現(xiàn)局部細(xì)節(jié)模糊現(xiàn)象。二是基于物理模型的方法,這類方法需先建立水下圖像退化過程的數(shù)學(xué)模型,通過對退化過程的反演得到清晰參數(shù)的估計比較困難且精度較低,導(dǎo)致增強(qiáng)后的圖像質(zhì)量普遍較低,同時不同的環(huán)境考慮的因素不同,需要建立的模型也不同,使得這些方法具有較大的局限性。[0004]現(xiàn)有的方法主要針對成對圖像,但是生活中較難收集成對圖像的數(shù)據(jù)集,并且在圖像增強(qiáng)過程中通常會伴隨著信息損失,導(dǎo)致增強(qiáng)后的圖像容易出現(xiàn)細(xì)節(jié)模糊現(xiàn)象。我們提出一種基于小波變化的非成對水下圖像質(zhì)量增強(qiáng)方法。該方法將圖像特征分為低頻高頻發(fā)明內(nèi)容[0005]本發(fā)明的目的在于提供一種基于小波變換的非成對水下圖像增強(qiáng)方法,該方法有利于提高水下圖像質(zhì)量。[0006]為實現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:一種基于小波變換的非成對水下圖像增[0007]步驟S1、將待訓(xùn)練的非成對的數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理、數(shù)據(jù)增強(qiáng)和歸一化處理;8納什平衡;的卷積,提取水下圖像初始特征F1out;水下圖像特征F1。通過一個小公式如下:模塊;塊采用三個并聯(lián)的高頻注意力模塊分別處理三個高頻特征1h,hl,hh,輸出處理后的高頻特征為1h′,hl′,hh′;計算公式如下:9[0029]步驟S24、將低頻特征11′和高頻特征1h′,hl′,hh′融合并輸出增強(qiáng)圖像;低頻特征和高頻特征首先通過一個小波反池化層,再通過兩個卷積核為4×4、步長為1的卷積,輸出增強(qiáng)圖像E;小波反池化層是在小波池化層的基礎(chǔ)上將其卷積設(shè)為反卷積;計算公式如下:[0030]E=Conv(Conv(WaveUnpool(11′[0031]其中,E表示增強(qiáng)圖像,Conv(*)表示卷積,WaveUnPool(*)表示小波反池化層。[0032]在本發(fā)明一實施例中,所述步驟S22具體實現(xiàn)如下:[0033]步驟S221、設(shè)計步驟S22中的結(jié)合注意力機(jī)制的U-Net網(wǎng)絡(luò)結(jié)構(gòu)的低頻處理模塊;低頻處理模塊由一個七個模塊堆疊的U-Net網(wǎng)絡(luò)結(jié)構(gòu)組成,低頻處理模塊的第2,4,6層的跳連部分,各結(jié)合一個低頻注意力模塊;U-Net的網(wǎng)絡(luò)結(jié)構(gòu)中的降采樣模塊由一個激活函數(shù),一個歸一化層,一個2×2的卷積組成;其計算公式如下:[0034]Xut=ReLU(Conv(Norm(X:)))[0035]其中,Xin表示降采樣模塊的輸入特征,Xut表示降采樣模塊的輸出特征,Conv(*)表示卷積,ReLU(*)表示激活函數(shù),Norm(*)表示歸一化層;[0036]U-Net的網(wǎng)絡(luò)結(jié)構(gòu)中的上采樣模塊由一個激活函數(shù),一個歸一化層,一個2×2的反卷積組成;[0037]低頻處理模塊的具體計算公式如下:Xp?=ADD[Up(Xdown),Xdo[0043]Xp?=ADD[Up(Xp?),LAXp?=ADD[Up(Xp3),LAM(XdowXp?=ADD[Up(Xup?),XdoXp?=ADD[Up(Xp),LAM(XdownXout=ADD(Up(Xup?),Xdow[0049]其中Xin表示低頻處理模塊的輸入特征,Xout表示低頻處理模塊的輸出特征,Down(*)表示降采樣模塊,UP(*)表示上采樣模塊,LAM(*)表示低頻注意力模塊,ADD[*]表示矩陣加法運(yùn)算;[0050]步驟S222、設(shè)計步驟S221中的低頻注意力模塊;低頻注意力模塊由一個拓展網(wǎng)絡(luò)串聯(lián)一個3×3的卷積,一個通道注意力模塊組成;拓展網(wǎng)絡(luò)由三層并聯(lián)的不同數(shù)量的卷積塊和一個特征拼接操作串聯(lián)組成,每個卷積塊由一個卷積和一個激活函數(shù)串聯(lián)組成;拓展網(wǎng)絡(luò)的第一層是一個1×1的卷積塊,第二層是一個1×1的卷積塊串聯(lián)一個3×3的卷積塊,第三層是一個1×1的卷積塊串聯(lián)兩個3×3的卷積塊;拓展網(wǎng)絡(luò)輸出的特征經(jīng)過一個3×3的卷積和一個通道注意力模塊;低頻注意力模塊具體計算公式如下:[0052]X?=ReLU(Conv(ReLU[0053]X?=ReLU(Conv(ReLU(Conv([0055]其中Xn表示低頻注意力模塊的輸入特征,Xout表示低頻注意力模塊的輸出特征,Conv(*)表示卷積,ReLU(*)表示激活函數(shù),Cat[*]表示按Layer(*)表示通道注意力模塊。[0056]在本發(fā)明一實施例中,步驟S23中,高頻注意力模塊由一個拓展網(wǎng)絡(luò)串聯(lián)一個3×3的卷積,一個空間注意力模塊,一個通道注意力模塊組成;拓展網(wǎng)絡(luò)由三層并聯(lián)的不同數(shù)量的卷積塊和一個特征拼接操作串聯(lián)組成,每個卷積塊由一個卷積和一個激活函數(shù)串聯(lián)組成;第一層是一個3×3的卷積塊,第二層是兩個3×3的卷積塊,第三層是三個3×3的卷積塊;拓展網(wǎng)絡(luò)輸出的特征經(jīng)過一個3×3的卷積,一個空間注意力模塊,和一個通道注意力模塊;高頻注意力模塊的計算公式如下:[0059]X?=ReLU(Conv(ReLU(Conv(ReLU(Conv(X:))))))[0060]Xout=SE_Layer(SA_Layer(Conv(Cat[X?,X?,X?])))[0061]其中,Xn表示高頻注意力模塊的輸入特征,Xot表示高頻注意力模塊的輸出特征,Layer(*)表示空間注意力模塊,SE_Layer(*)表示通道注意力模塊。[0062]在本發(fā)明一實施例中,所述步驟S3具體實現(xiàn)如下:高質(zhì)量圖像轉(zhuǎn)化為水下圖像的生成器Gc?w、判斷生成的高質(zhì)量圖像的判別器Dc、判別生成的水下圖像的生成器Dw;生成器Gw?c、Gc?w的網(wǎng)絡(luò)使用步驟S2設(shè)計的基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu);[0064]步驟S32、將非配對的水下圖像與高質(zhì)量圖像輸入循環(huán)生成對抗網(wǎng)絡(luò),生成器Gw?c將水下圖像G進(jìn)行質(zhì)量增強(qiáng),生成增強(qiáng)圖像Ec,判別器D.將其與高質(zhì)量圖像進(jìn)行風(fēng)格比較;生成器Gc?W將高質(zhì)量圖像Gc轉(zhuǎn)化為水下圖像Ew,判別器D再將其與水下圖像進(jìn)行風(fēng)格比較。[0065]在本發(fā)明一實施例中,所述步驟S4具體實現(xiàn)如下:[0066]設(shè)計基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)的目標(biāo)損失函數(shù),損失包括生成網(wǎng)絡(luò)損失和判別網(wǎng)絡(luò)損失;[0067]生成網(wǎng)絡(luò)總目標(biāo)損失函數(shù)如下:下圖像E重構(gòu)得到的圖像,G是輸入的水下圖像,Gc是輸入的高質(zhì)量圖像,L?(*)是L1損失;11[0075]其中,F(xiàn)是將水下圖像G,輸入生成器Gc?成得到圖像,F(xiàn)c是將高質(zhì)量圖像Gc輸入生[0076]判別網(wǎng)絡(luò)損失如下:實數(shù)的點乘操作;[0079]Dc=0.5·(LMse(0,Dc(Ec))+LMse(1,Dc(Gc)))[0080]其中,其中Dc(*)是判別增強(qiáng)圖像E的[0081]tDw=0.5·(LMsE(0,Dw(Ew))+[0083]在本發(fā)明一實施例中,所述步驟S5具體實現(xiàn)如下:[0084]步驟S51、將水下圖像和高質(zhì)量圖像隨機(jī)劃分為多個批次,每個批次包含N張水下圖像和N張高質(zhì)量圖像,將水下圖像和高質(zhì)量圖像隨機(jī)配對得到N對圖像;[0085]步驟S52、將同一批次內(nèi)的每一對水下圖像G和高質(zhì)量圖像Gc輸入到步驟S3的基于[0086]步驟S53、根據(jù)基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)的目標(biāo)損失函數(shù),使用反向傳播方法計算圖像增強(qiáng)網(wǎng)絡(luò)中各參數(shù)的梯度,并利用隨機(jī)梯度下降方法更新圖像增強(qiáng)網(wǎng)絡(luò)的參數(shù);[0087]步驟S54、以批次為單位重復(fù)進(jìn)行上述步驟S51至步驟S53圖像增強(qiáng)網(wǎng)絡(luò)訓(xùn)練步驟,直至基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)的目標(biāo)損失函數(shù)數(shù)值收斂到納什平衡,保存網(wǎng)絡(luò)參數(shù),完成圖像增強(qiáng)網(wǎng)絡(luò)的訓(xùn)練過程,得到訓(xùn)練好的基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)。[0088]在本發(fā)明一實施例中,所述步驟S6具體實現(xiàn)如下:[0089]步驟S61、將待增強(qiáng)的水下圖像進(jìn)行歸一化處理;[0090]步驟S62、將經(jīng)過步驟S61處理的圖像輸入訓(xùn)練好的基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)中的生成器Gw?c,輸出增強(qiáng)圖像。[0091]相較于現(xiàn)有技術(shù),本發(fā)明具有以下有益效果:本發(fā)明可適用于非成對的水下圖像,并且該方法能更有效的運(yùn)用水下圖像的信息,從而有效的恢復(fù)圖像失真顏色,去除圖像模糊,提升圖像對比度與亮度,增強(qiáng)的圖像符合人類主觀視覺感知?,F(xiàn)有的水下圖像增強(qiáng)方法增強(qiáng)后的圖像常會出現(xiàn)細(xì)節(jié)模糊現(xiàn)象,本發(fā)明提出了基于小波變換的非成對水下圖像增強(qiáng)方法,能夠有效減少圖像傳遞過程中的信息損失,保留圖像細(xì)節(jié)信息,避免細(xì)節(jié)模糊,同時可以適用于多數(shù)的復(fù)雜場景。附圖說明[0092]圖1是本發(fā)明方法的實現(xiàn)流程圖。[0093]圖2是本發(fā)明實施例中網(wǎng)絡(luò)模型結(jié)構(gòu)圖。[0094]圖3是本發(fā)明實施例中低頻注意力網(wǎng)絡(luò)結(jié)構(gòu)圖。[0095]圖4是本發(fā)明實施例中高頻注意力網(wǎng)絡(luò)結(jié)構(gòu)圖。具體實施方式[0096]下面結(jié)合附圖,對本發(fā)明的技術(shù)方案進(jìn)行具體說明。[0097]本發(fā)明提供一種基于小波變換的非成對水下圖像增強(qiáng)方法,如圖1-4所示,包括以下步驟:[0098]步驟S1、將待訓(xùn)練的非成對的數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理、數(shù)據(jù)增強(qiáng)[0099]步驟S2、設(shè)計基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò),通過小波變換對輸入圖像的低頻和高頻部分進(jìn)行分別處理,低頻部分使用低頻處理模塊對圖像低頻部分進(jìn)行校正,高頻部分使用高頻處理模塊進(jìn)行校正,最后再對高頻部分和低頻部分進(jìn)行結(jié)合;[0100]步驟S3、搭建循環(huán)生成對抗網(wǎng)絡(luò),與基于小波變換的水下圖像質(zhì)量增強(qiáng)網(wǎng)絡(luò)結(jié)合得到基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò);[0101]步驟S4、設(shè)計基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)的目標(biāo)損失函數(shù);[0102]步驟S5、使用非成對的圖像訓(xùn)練基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)收斂到納什平衡;[0103]步驟S6、將待增強(qiáng)水下圖像進(jìn)行歸一化處理,然后輸入訓(xùn)練好的基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò),輸出增強(qiáng)圖像。[0105]步驟S11、將所有待訓(xùn)練非成對圖像分為原始的水下圖像和高質(zhì)量圖像;[0106]步驟S12、將所有待訓(xùn)練非成對圖像進(jìn)行統(tǒng)一的放大,放大到原始圖像的1.12倍,對放大后的圖像通過隨機(jī)切割、隨機(jī)翻轉(zhuǎn)操作,進(jìn)行數(shù)據(jù)增強(qiáng);[0107]步驟S13、將所有待訓(xùn)練圖像進(jìn)行歸一化處理,給定圖像I(i,j),其歸一化處理后的圖像為1;在像素位置(i,j)處,計算歸一化值?(i,j)的公式如下:[0109]其中,(i,j)表示像素的位置,將歸一化后的水下圖像作為后續(xù)步驟的水下圖像,歸一化后的高質(zhì)量圖像作為后續(xù)步驟的高質(zhì)量圖像。[0111]步驟S21、通過小波變換對輸入圖像的低頻和高頻部分進(jìn)行分別處理;基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò)的輸入為歸一化后的水下圖像?;將圖像輸入基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò)后,圖像經(jīng)過一個卷積核為1×1、步長為1的卷積,兩個卷積核為3×31的卷積,提取水下圖像初始特征F1。t;水下圖像特征F1u通過一個小波池化層被分解為低頻特征11和高頻特征1h,h1,hh;[0112]步驟S22、設(shè)計基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò)中的低頻處理模塊;低頻特征11進(jìn)入結(jié)合注意力機(jī)制的U-Net網(wǎng)絡(luò)結(jié)構(gòu)的低頻處理模塊,得到處理后的低頻特征11′;計算公式如下:[0114]其中,11表示輸入低頻特征,11′表示處理后的低頻特征,LUNet(*)表示低頻處理[0115]步驟S22具體實現(xiàn)如下:[0116]步驟S221、設(shè)計步驟S22中的結(jié)合注意力機(jī)制的U-Net網(wǎng)絡(luò)結(jié)構(gòu)的低頻處理模塊;低頻處理模塊由一個七個模塊堆疊的U-Net網(wǎng)絡(luò)結(jié)構(gòu)組成,低頻處理模塊的第2,4,6層的跳連部分,各結(jié)合一個低頻注意力模塊;U-Net的網(wǎng)絡(luò)結(jié)構(gòu)中的降采樣模塊由一個激活函數(shù),一個歸一化層,一個2×2的卷積組成;其計算公式如下:[0117]Xut=ReL[0118]其中,Xin表示降采樣模塊的輸入特征,Xut表示降采樣模塊的輸出特征,Conv(*)表示卷積,ReLU(*)表示激活函數(shù),Norm(*)表示歸一化層;[0119]U-Net的網(wǎng)絡(luò)結(jié)構(gòu)中的上采樣模塊由一個激活函數(shù),一個歸一化層,一個2×2的反卷積組成;[0120]低頻處理模塊的具體計算公式如下:Xp?=ADD[Up(Xdown),XdoXp?=ADD[Up(Xup?),XdoXup?=ADD[Up(X?),LAM(Xdo[0131]Xout=ADD[0132]其中Xin表示低頻處理模塊的輸入特征,Xout表示低頻處理模塊的輸出特征,Down(*)表示降采樣模塊,UP(*)表示上采樣模塊,LAM(*)表示低頻注意力模塊,ADD[*]表示矩陣加法運(yùn)算;[0133]步驟S222、設(shè)計步驟S221中的低頻注意力模塊;低頻注意力模塊由一個拓展網(wǎng)絡(luò)串聯(lián)一個3×3的卷積,一個通道注意力模塊組成;拓展網(wǎng)絡(luò)由三層并聯(lián)的不同數(shù)量的卷積塊和一個特征拼接操作串聯(lián)組成,每個卷積塊由一個卷積和一個激活函數(shù)串聯(lián)組成;拓展網(wǎng)絡(luò)的第一層是一個1×1的卷積塊,第二層是一個1×1的卷積塊串聯(lián)一個3×3的卷積塊,第三層是一個1×1的卷積塊串聯(lián)兩個3×3的卷積塊;拓展網(wǎng)絡(luò)輸出的特征經(jīng)過一個3×3的卷積和一個通道注意力模塊;低頻注意力模塊具體計算公式如下:[0136]X?=ReLU(Conv(ReLU(Conv[0138]其中Xn表示低頻注意力模塊的輸入特征,X。ut表示低頻注意力模塊的輸出特征,Conv(*)表示卷積,ReLU(*)表示激活函數(shù),Cat[*]表示按通道維度進(jìn)行特征拼接操作,SE_Layer(*)表示通道注意力模塊;[0139]步驟S23、設(shè)計基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò)中的高頻處理模塊;高頻處理模塊采用三個并聯(lián)的高頻注意力模塊分別處理三個高頻特征1h,hl,hh,輸出處理后的高頻特征為lh',hl',hh';計算公式如下:[0143]其中HAM(*)表示高頻注意力模塊;高頻注意力模塊由一個拓展網(wǎng)絡(luò)串聯(lián)一個3×3的卷積,一個空間注意力模塊,一個通道注意力模塊組成;拓展網(wǎng)絡(luò)由三層并聯(lián)的不同數(shù)量的卷積塊和一個特征拼接操作串聯(lián)組成,每個卷積塊由一個卷積和一個激活函數(shù)串聯(lián)組成;第一層是一個3×3的卷積塊,第二層是兩個3×3的卷積塊,第三層是三個3×3的卷積塊;拓展網(wǎng)絡(luò)輸出的特征經(jīng)過一個3×3的卷積,一個空間注意力模塊,和一個通道注意力模塊;高頻注意力模塊的計算公式如下:[0146]X?=ReLU(Conv(ReLU(Conv(ReLU(Conv(X:))))))[0147]Xout=SE_Layer(SA_Lay[0148]其中,Xin表示高頻注意力模塊的輸入特征,Xut表示高頻注意力模塊的輸出特征,Layer(*)表示空間注意力模塊,SE_Layer(*)表示通道注意力模塊;[0149]步驟S24、將低頻特征11’和高頻特征1h',hl',hh’融合并輸出增強(qiáng)圖像;低頻特征和高頻特征首先通過一個小波反池化層,再通過兩個卷積核為4×4、步長為1的卷積,輸出增強(qiáng)圖像E;小波反池化層是在小波池化層的基礎(chǔ)上將其卷積設(shè)為反卷積;計算公式如下:[0150]E=Conv(Conv(WaveUnpool(1l',lh',hl',hh’)))[0152]在本實施例中,所述步驟S3具體實現(xiàn)如下:高質(zhì)量圖像轉(zhuǎn)化為水下圖像的生成器Gc?w、判斷生成的高質(zhì)量圖像的判別器Dc、判別生成的水下圖像的生成器Dw;生成器Gw?c、Gc?w的網(wǎng)絡(luò)使用步驟S2設(shè)計的基于小波變換的水下圖像增強(qiáng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu);[0154]步驟S32、將非配對的水下圖像與高質(zhì)量圖像輸入循環(huán)生成對抗網(wǎng)絡(luò),生成器Gw?c將水下圖像G進(jìn)行質(zhì)量增強(qiáng),生成增強(qiáng)圖像Ec,判別器D.將其與高質(zhì)量圖像進(jìn)行風(fēng)格比較;生成器Gc?將高質(zhì)量圖像Gc轉(zhuǎn)化為水下圖像Ew,判別器D再將其與水下圖像進(jìn)行風(fēng)格比較。[0155]在本實施例中,所述步驟S4具體實現(xiàn)如下:[0156]設(shè)計基于小波變換的非成對水下圖像增強(qiáng)網(wǎng)絡(luò)的目標(biāo)損失函數(shù),損失包括生成網(wǎng)絡(luò)損失和判別
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025成都農(nóng)商銀行產(chǎn)業(yè)金融崗社會招聘10人考試題庫附答案
- 2025年廣西崇左憑祥市公安局面向社會公開招聘警務(wù)輔助人員61人備考題庫附答案
- 2026重慶醫(yī)科大學(xué)附屬大足醫(yī)院招聘4人筆試備考試題及答案解析
- 2026臺州市計量技術(shù)研究院編外招聘1人筆試備考題庫及答案解析
- 2026年昆明冶金高等??茖W(xué)校高職單招職業(yè)適應(yīng)性測試模擬試題有答案解析
- 2026重慶市城投路橋管理有限公司食堂炊事員崗位2人筆試參考題庫及答案解析
- (能力提升)2025-2026學(xué)年下學(xué)期人教統(tǒng)編版小學(xué)語文五年級第一單元練習(xí)卷
- 2026年《東方煙草報》社有限公司高校畢業(yè)生招聘(3名)筆試備考試題及答案解析
- 2026年安徽工貿(mào)職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試參考題庫帶答案解析
- 2026福建石獅國有投資發(fā)展集團(tuán)有限責(zé)任公司招聘2人筆試參考題庫及答案解析
- 高二化學(xué)上學(xué)期期末試題帶答案解析
- 高標(biāo)準(zhǔn)農(nóng)田建設(shè)培訓(xùn)課件
- 體檢中心收費與財務(wù)一體化管理方案
- 解答題 概率與統(tǒng)計(專項訓(xùn)練12大題型+高分必刷)(原卷版)2026年高考數(shù)學(xué)一輪復(fù)習(xí)講練測
- 2024-2025學(xué)年北京市海淀區(qū)第二十中學(xué)高二上學(xué)期期末物理試題(含答案)
- 金屬加工工藝規(guī)劃
- 四川省內(nèi)江市2024-2025學(xué)年高二上學(xué)期期末檢測化學(xué)試題
- 送你一朵小紅花評語
- 廣東省深圳市龍崗區(qū)2024-2025學(xué)年二年級上學(xué)期學(xué)科素養(yǎng)期末綜合數(shù)學(xué)試卷(含答案)
- 臨床成人吞咽障礙患者口服給藥護(hù)理
- (16)普通高中體育與健康課程標(biāo)準(zhǔn)日常修訂版(2017年版2025年修訂)
評論
0/150
提交評論