版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
一、引言1.1研究背景與意義1.1.1低光照?qǐng)D像在現(xiàn)實(shí)場(chǎng)景中的普遍存在在我們的日常生活中,低光照?qǐng)鼍盁o(wú)處不在,它們給圖像采集帶來(lái)了諸多挑戰(zhàn),導(dǎo)致獲取的圖像質(zhì)量下降,對(duì)視覺(jué)和計(jì)算機(jī)視覺(jué)任務(wù)產(chǎn)生顯著影響。夜晚的城市,華燈初上,雖然燈光點(diǎn)綴,但整體環(huán)境光照不足。在這種情況下拍攝的街景圖像,建筑物、街道和行人等細(xì)節(jié)往往模糊不清,暗處的物體甚至難以辨認(rèn)。城市夜景照片中,暗處的樹(shù)木可能只是一團(tuán)黑影,無(wú)法看清枝葉的細(xì)節(jié);道路上的車(chē)輛也可能因光線不足,車(chē)牌號(hào)碼和車(chē)身顏色難以分辨。室內(nèi)暗光環(huán)境同樣常見(jiàn)。例如,在光線較暗的老舊房間里,家具的顏色和紋理在拍攝的圖像中可能變得模糊,墻壁上的裝飾畫(huà)也難以看清內(nèi)容。在一些沒(méi)有足夠照明的倉(cāng)庫(kù)中,貨物的標(biāo)識(shí)和種類(lèi)很難從圖像中識(shí)別出來(lái)。低光照?qǐng)D像對(duì)視覺(jué)任務(wù)造成了直接困擾。人類(lèi)視覺(jué)系統(tǒng)在低光照條件下的分辨能力大幅下降,難以從低光照?qǐng)D像中獲取清晰、準(zhǔn)確的信息,影響對(duì)場(chǎng)景的理解和判斷。當(dāng)我們查看一張低光照下拍攝的照片時(shí),可能需要花費(fèi)更多時(shí)間和精力去辨認(rèn)其中的物體和細(xì)節(jié),甚至仍然無(wú)法完全理解圖像所表達(dá)的內(nèi)容。在計(jì)算機(jī)視覺(jué)領(lǐng)域,低光照?qǐng)D像也給各種任務(wù)帶來(lái)了巨大挑戰(zhàn)。目標(biāo)檢測(cè)算法在低光照?qǐng)D像中容易出現(xiàn)誤檢和漏檢的情況。在低光照的監(jiān)控視頻中,檢測(cè)行人、車(chē)輛等目標(biāo)時(shí),由于圖像中的目標(biāo)特征不明顯,算法可能無(wú)法準(zhǔn)確識(shí)別目標(biāo)的位置和類(lèi)別,導(dǎo)致安全監(jiān)控出現(xiàn)漏洞。圖像分割任務(wù)也會(huì)受到嚴(yán)重影響,低光照使得圖像中的物體邊界模糊,難以準(zhǔn)確劃分不同物體的區(qū)域,影響后續(xù)的分析和處理。1.1.2圖像增強(qiáng)在各領(lǐng)域的重要應(yīng)用低光照?qǐng)D像增強(qiáng)技術(shù)在眾多領(lǐng)域都發(fā)揮著不可或缺的作用,具有極高的應(yīng)用價(jià)值。在安防監(jiān)控領(lǐng)域,保障全天候的監(jiān)控效果至關(guān)重要。夜晚或光線昏暗的環(huán)境下,監(jiān)控?cái)z像頭拍攝的圖像往往質(zhì)量較差,難以看清監(jiān)控區(qū)域內(nèi)的人員活動(dòng)和物體細(xì)節(jié)。通過(guò)低光照?qǐng)D像增強(qiáng)技術(shù),能夠提高監(jiān)控圖像的清晰度和對(duì)比度,使監(jiān)控人員更清晰地觀察到監(jiān)控畫(huà)面中的異常情況,及時(shí)發(fā)現(xiàn)潛在的安全威脅。在一些重要場(chǎng)所的監(jiān)控系統(tǒng)中,運(yùn)用圖像增強(qiáng)技術(shù)后,即使在深夜,也能清晰捕捉到人員的面部特征和行為動(dòng)作,為安全防范提供有力支持。醫(yī)療成像領(lǐng)域,低光照條件下獲取的醫(yī)學(xué)圖像可能會(huì)影響醫(yī)生對(duì)病情的準(zhǔn)確判斷。X光、CT等醫(yī)學(xué)影像在低光照或成像條件不佳時(shí),圖像中的病變區(qū)域和組織結(jié)構(gòu)可能顯示不清晰,容易導(dǎo)致誤診或漏診。低光照?qǐng)D像增強(qiáng)技術(shù)可以增強(qiáng)醫(yī)學(xué)圖像的細(xì)節(jié),突出病變部位,幫助醫(yī)生更準(zhǔn)確地診斷病情,制定更有效的治療方案。對(duì)于一些微小的病變,圖像增強(qiáng)后能夠使其更清晰地顯示出來(lái),提高診斷的準(zhǔn)確性。自動(dòng)駕駛是近年來(lái)快速發(fā)展的領(lǐng)域,低光照?qǐng)D像增強(qiáng)技術(shù)對(duì)于自動(dòng)駕駛系統(tǒng)的安全性和可靠性具有關(guān)鍵意義。在夜間或惡劣天氣條件下,自動(dòng)駕駛車(chē)輛的攝像頭獲取的圖像質(zhì)量會(huì)受到嚴(yán)重影響,這對(duì)車(chē)輛的感知和決策能力提出了巨大挑戰(zhàn)。通過(guò)低光照?qǐng)D像增強(qiáng)技術(shù),自動(dòng)駕駛車(chē)輛能夠更清晰地識(shí)別道路、交通標(biāo)志和其他車(chē)輛,及時(shí)做出準(zhǔn)確的決策,避免交通事故的發(fā)生。在夜間行駛時(shí),增強(qiáng)后的圖像可以讓車(chē)輛更準(zhǔn)確地檢測(cè)到前方的行人、車(chē)輛和障礙物,保障行車(chē)安全。1.2低光照?qǐng)D像增強(qiáng)的目標(biāo)與挑戰(zhàn)1.2.1圖像增強(qiáng)的主要目標(biāo)低光照?qǐng)D像增強(qiáng)旨在通過(guò)一系列技術(shù)手段,提升低光照環(huán)境下獲取圖像的質(zhì)量,使其更符合人眼視覺(jué)感知和計(jì)算機(jī)視覺(jué)任務(wù)的需求,主要聚焦于以下幾個(gè)關(guān)鍵目標(biāo):提升亮度:低光照?qǐng)D像的顯著特征是整體亮度偏低,許多細(xì)節(jié)信息被掩蓋在黑暗之中。增強(qiáng)圖像亮度,就是要將這些隱藏在暗處的信息揭示出來(lái),使圖像中的物體和場(chǎng)景更加清晰可見(jiàn)。在一張夜晚拍攝的城市街道低光照?qǐng)D像中,通過(guò)增強(qiáng)亮度,可以清晰地看到街道上的標(biāo)識(shí)、路邊的車(chē)輛以及行人的輪廓,原本模糊的建筑細(xì)節(jié)也變得清晰可辨。增強(qiáng)對(duì)比度:對(duì)比度是圖像中不同區(qū)域亮度差異的度量,低光照?qǐng)D像往往存在對(duì)比度不足的問(wèn)題,導(dǎo)致圖像中的物體和背景之間的區(qū)分度不高,視覺(jué)效果平淡。增強(qiáng)對(duì)比度能夠突出圖像中的重要信息,使亮部更亮,暗部更暗,從而增強(qiáng)圖像的層次感和視覺(jué)沖擊力。在一幅低光照的室內(nèi)場(chǎng)景圖像中,增強(qiáng)對(duì)比度后,家具的輪廓更加分明,墻壁上的裝飾畫(huà)與周?chē)h(huán)境的對(duì)比更加明顯,整個(gè)圖像的視覺(jué)效果得到顯著提升?;謴?fù)細(xì)節(jié):低光照條件下,圖像中的細(xì)節(jié)信息容易丟失,如物體的紋理、邊緣等?;謴?fù)細(xì)節(jié)是低光照?qǐng)D像增強(qiáng)的重要任務(wù)之一,通過(guò)合適的算法和技術(shù),盡可能地還原圖像在正常光照下應(yīng)有的細(xì)節(jié),使圖像更加真實(shí)、準(zhǔn)確地反映場(chǎng)景內(nèi)容。在低光照拍攝的文物圖像中,恢復(fù)細(xì)節(jié)后,文物表面的紋理、圖案等細(xì)節(jié)清晰呈現(xiàn),為文物研究和保護(hù)提供了更有價(jià)值的圖像資料。色彩還原:低光照環(huán)境可能會(huì)導(dǎo)致圖像色彩失真,顏色變得暗淡、不飽和或偏離實(shí)際顏色。色彩還原的目標(biāo)是使增強(qiáng)后的圖像色彩更加自然、準(zhǔn)確,接近人眼在正常光照下對(duì)場(chǎng)景的色彩感知。在低光照拍攝的自然風(fēng)光圖像中,色彩還原后,天空的藍(lán)色、植被的綠色等都能恢復(fù)到接近真實(shí)場(chǎng)景的色彩,使圖像更加生動(dòng)、美觀。1.2.2面臨的技術(shù)難題低光照?qǐng)D像增強(qiáng)雖然具有重要的應(yīng)用價(jià)值,但在實(shí)際實(shí)現(xiàn)過(guò)程中面臨著諸多技術(shù)難題,這些難題限制了圖像增強(qiáng)的效果和應(yīng)用范圍。光線條件復(fù)雜:現(xiàn)實(shí)世界中的光線條件千變?nèi)f化,低光照?qǐng)鼍暗墓饩€分布往往不均勻,可能存在局部強(qiáng)光和陰影區(qū)域,這增加了圖像增強(qiáng)的難度。在室內(nèi)場(chǎng)景中,可能會(huì)有部分區(qū)域受到窗戶(hù)透入光線的強(qiáng)烈照射,而其他區(qū)域則處于陰影中;在室外夜晚場(chǎng)景中,路燈、車(chē)燈等光源的分布和強(qiáng)度也各不相同,使得圖像中的光線條件極為復(fù)雜。不同的光照條件需要不同的增強(qiáng)策略,如何準(zhǔn)確地適應(yīng)各種復(fù)雜的光線條件,實(shí)現(xiàn)有效的圖像增強(qiáng),是一個(gè)亟待解決的問(wèn)題。噪聲干擾:低光照環(huán)境下,圖像傳感器采集到的信號(hào)較弱,容易受到噪聲的干擾。噪聲的存在會(huì)使圖像出現(xiàn)斑點(diǎn)、條紋等瑕疵,影響圖像的質(zhì)量和視覺(jué)效果。在低光照?qǐng)D像增強(qiáng)過(guò)程中,不僅要提升圖像的亮度和對(duì)比度,還要有效地抑制噪聲,避免在增強(qiáng)過(guò)程中噪聲被放大,導(dǎo)致圖像質(zhì)量進(jìn)一步下降。然而,噪聲的類(lèi)型和分布具有不確定性,如何在增強(qiáng)圖像的同時(shí),準(zhǔn)確地去除噪聲,是圖像增強(qiáng)技術(shù)面臨的一大挑戰(zhàn)。計(jì)算資源限制:一些先進(jìn)的低光照?qǐng)D像增強(qiáng)算法,如基于深度學(xué)習(xí)的方法,通常需要大量的計(jì)算資源來(lái)進(jìn)行模型訓(xùn)練和推理。在實(shí)際應(yīng)用中,很多設(shè)備的計(jì)算能力有限,無(wú)法滿(mǎn)足這些算法的需求。在一些嵌入式設(shè)備或移動(dòng)設(shè)備中,由于硬件資源的限制,難以運(yùn)行復(fù)雜的深度學(xué)習(xí)模型,這就要求圖像增強(qiáng)算法在保證效果的前提下,盡可能地降低計(jì)算復(fù)雜度,提高算法的效率和實(shí)時(shí)性。傳統(tǒng)方法的局限性:傳統(tǒng)的低光照?qǐng)D像增強(qiáng)方法,如直方圖均衡化、Retinex算法等,在處理簡(jiǎn)單的低光照?qǐng)D像時(shí)可能會(huì)取得一定的效果,但對(duì)于復(fù)雜的低光照?qǐng)鼍?,往往存在明顯的局限性。直方圖均衡化可能會(huì)導(dǎo)致圖像過(guò)度增強(qiáng),丟失部分細(xì)節(jié)信息;Retinex算法在處理光照不均勻的圖像時(shí),可能會(huì)出現(xiàn)光暈等偽影。這些傳統(tǒng)方法難以適應(yīng)復(fù)雜多變的低光照環(huán)境,無(wú)法滿(mǎn)足現(xiàn)代計(jì)算機(jī)視覺(jué)任務(wù)對(duì)圖像質(zhì)量的高要求。深度學(xué)習(xí)方法的挑戰(zhàn):雖然深度學(xué)習(xí)在低光照?qǐng)D像增強(qiáng)領(lǐng)域取得了顯著的進(jìn)展,但也面臨著一些挑戰(zhàn)。深度學(xué)習(xí)模型通常需要大量的標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,而獲取高質(zhì)量的低光照?qǐng)D像標(biāo)注數(shù)據(jù)是一項(xiàng)耗時(shí)、費(fèi)力且成本高昂的工作。此外,深度學(xué)習(xí)模型的可解釋性較差,難以理解模型的決策過(guò)程和內(nèi)部機(jī)制,這在一些對(duì)安全性和可靠性要求較高的應(yīng)用場(chǎng)景中,如醫(yī)療成像、自動(dòng)駕駛等,可能會(huì)成為限制其應(yīng)用的因素。深度學(xué)習(xí)模型在不同場(chǎng)景下的泛化能力也有待提高,如何使模型能夠在各種復(fù)雜的低光照?qǐng)鼍爸卸寄鼙憩F(xiàn)出良好的性能,是當(dāng)前研究的重點(diǎn)和難點(diǎn)之一。1.3研究?jī)?nèi)容與創(chuàng)新點(diǎn)1.3.1研究?jī)?nèi)容概述本研究聚焦于低光照?qǐng)D像增強(qiáng)方法,致力于探索高效、準(zhǔn)確的圖像增強(qiáng)技術(shù),以提升低光照?qǐng)D像的質(zhì)量和應(yīng)用價(jià)值。具體研究?jī)?nèi)容如下:傳統(tǒng)低光照?qǐng)D像增強(qiáng)算法分析:深入研究直方圖均衡化、Retinex算法等傳統(tǒng)低光照?qǐng)D像增強(qiáng)算法的原理和特點(diǎn)。通過(guò)對(duì)這些算法在不同低光照?qǐng)鼍跋碌膶?shí)驗(yàn)測(cè)試,分析它們?cè)谔嵘炼取⒃鰪?qiáng)對(duì)比度、恢復(fù)細(xì)節(jié)和色彩還原等方面的優(yōu)勢(shì)與不足。在研究直方圖均衡化算法時(shí),觀察其在增強(qiáng)圖像對(duì)比度方面的顯著效果,同時(shí)也注意到在某些復(fù)雜低光照?qǐng)鼍跋?,可能?huì)出現(xiàn)圖像細(xì)節(jié)丟失、過(guò)度增強(qiáng)等問(wèn)題。對(duì)Retinex算法,分析其在分離光照和反射分量、恢復(fù)圖像細(xì)節(jié)方面的原理,以及在處理光照不均勻圖像時(shí)容易產(chǎn)生光暈等偽影的局限性。深度學(xué)習(xí)在低光照?qǐng)D像增強(qiáng)中的應(yīng)用研究:全面調(diào)研當(dāng)前基于深度學(xué)習(xí)的低光照?qǐng)D像增強(qiáng)方法,包括基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)、生成對(duì)抗網(wǎng)絡(luò)(GAN)等的典型模型。分析這些模型的網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練方法和性能表現(xiàn),研究它們?cè)谔幚淼凸庹請(qǐng)D像時(shí)的優(yōu)勢(shì)和面臨的挑戰(zhàn)?;贑NN的模型在提取圖像特征方面具有強(qiáng)大的能力,但可能存在對(duì)復(fù)雜光照條件適應(yīng)性不足的問(wèn)題;基于GAN的模型能夠生成更具真實(shí)感的增強(qiáng)圖像,但訓(xùn)練過(guò)程往往不穩(wěn)定,容易出現(xiàn)模式坍塌等問(wèn)題。新型低光照?qǐng)D像增強(qiáng)算法設(shè)計(jì):針對(duì)現(xiàn)有方法的不足,提出一種融合多模態(tài)信息和自監(jiān)督學(xué)習(xí)的新型低光照?qǐng)D像增強(qiáng)算法。該算法將充分利用圖像的亮度、色彩、紋理等多模態(tài)信息,通過(guò)設(shè)計(jì)合理的網(wǎng)絡(luò)結(jié)構(gòu),實(shí)現(xiàn)對(duì)低光照?qǐng)D像的全面增強(qiáng)。引入自監(jiān)督學(xué)習(xí)機(jī)制,減少對(duì)大量標(biāo)注數(shù)據(jù)的依賴(lài),提高模型的泛化能力和適應(yīng)性。在網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)上,結(jié)合注意力機(jī)制,使模型能夠更加關(guān)注圖像中的關(guān)鍵區(qū)域和細(xì)節(jié)信息,從而提升增強(qiáng)效果。算法實(shí)驗(yàn)驗(yàn)證與性能評(píng)估:收集和整理低光照?qǐng)D像數(shù)據(jù)集,包括不同場(chǎng)景、不同光照條件下的圖像。使用這些數(shù)據(jù)集對(duì)所提出的算法進(jìn)行訓(xùn)練和測(cè)試,并與傳統(tǒng)算法和其他先進(jìn)的深度學(xué)習(xí)算法進(jìn)行對(duì)比實(shí)驗(yàn)。通過(guò)主觀視覺(jué)評(píng)價(jià)和客觀指標(biāo)評(píng)估,如峰值信噪比(PSNR)、結(jié)構(gòu)相似性指數(shù)(SSIM)等,全面評(píng)估算法的性能,驗(yàn)證算法的有效性和優(yōu)越性。在實(shí)驗(yàn)過(guò)程中,確保實(shí)驗(yàn)環(huán)境和參數(shù)設(shè)置的一致性,以保證實(shí)驗(yàn)結(jié)果的可靠性和可比性。1.3.2創(chuàng)新點(diǎn)闡述本研究在低光照?qǐng)D像增強(qiáng)方法上具有以下創(chuàng)新點(diǎn):多模態(tài)信息融合:創(chuàng)新性地將圖像的亮度、色彩、紋理等多模態(tài)信息進(jìn)行融合,使算法能夠更全面地理解和處理低光照?qǐng)D像。通過(guò)設(shè)計(jì)專(zhuān)門(mén)的多模態(tài)特征提取模塊和融合策略,充分挖掘不同模態(tài)信息之間的互補(bǔ)性,從而提升圖像增強(qiáng)的效果。在處理低光照?qǐng)D像時(shí),不僅關(guān)注圖像的亮度和對(duì)比度提升,還注重色彩的自然還原和紋理細(xì)節(jié)的恢復(fù),使增強(qiáng)后的圖像更加真實(shí)、自然。自監(jiān)督學(xué)習(xí)應(yīng)用:引入自監(jiān)督學(xué)習(xí)機(jī)制,利用圖像自身的信息進(jìn)行無(wú)監(jiān)督學(xué)習(xí),減少對(duì)大量標(biāo)注數(shù)據(jù)的依賴(lài)。通過(guò)設(shè)計(jì)自監(jiān)督學(xué)習(xí)任務(wù),如圖像重建、對(duì)比學(xué)習(xí)等,使模型能夠自動(dòng)學(xué)習(xí)到低光照?qǐng)D像的特征和增強(qiáng)規(guī)律,提高模型的泛化能力和適應(yīng)性。在不同場(chǎng)景和光照條件下,模型都能夠快速適應(yīng)并有效地增強(qiáng)圖像,克服了傳統(tǒng)深度學(xué)習(xí)方法對(duì)特定數(shù)據(jù)集的依賴(lài)問(wèn)題。算法優(yōu)化與改進(jìn):對(duì)現(xiàn)有算法進(jìn)行深入分析和改進(jìn),提出了一種更高效、準(zhǔn)確的低光照?qǐng)D像增強(qiáng)算法。在網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)上,采用了輕量級(jí)的網(wǎng)絡(luò)架構(gòu),減少計(jì)算量和參數(shù)數(shù)量,提高算法的運(yùn)行效率。同時(shí),結(jié)合注意力機(jī)制和殘差連接等技術(shù),增強(qiáng)模型對(duì)圖像細(xì)節(jié)的捕捉能力,提升圖像增強(qiáng)的質(zhì)量。在訓(xùn)練過(guò)程中,優(yōu)化損失函數(shù)和訓(xùn)練策略,使模型能夠更快地收斂,提高訓(xùn)練效率和穩(wěn)定性。二、低光照?qǐng)D像增強(qiáng)的理論基礎(chǔ)2.1低光照?qǐng)D像的特性分析2.1.1亮度與對(duì)比度的不足低光照?qǐng)D像最直觀的表現(xiàn)就是亮度偏低,這使得圖像中的許多細(xì)節(jié)被掩蓋在黑暗之中。在低光照環(huán)境下拍攝的室內(nèi)場(chǎng)景圖像,家具、墻壁等物體的顏色和紋理由于亮度不足而變得模糊不清,難以辨認(rèn)。在夜晚的城市街道圖像中,路燈的光線無(wú)法充分照亮整個(gè)場(chǎng)景,建筑物的陰影部分、道路的暗處等區(qū)域的細(xì)節(jié)信息嚴(yán)重缺失,導(dǎo)致圖像整體的可視性較差。為了更直觀地說(shuō)明低光照?qǐng)D像亮度不足的問(wèn)題,我們進(jìn)行了一個(gè)簡(jiǎn)單的實(shí)驗(yàn)。使用同一臺(tái)相機(jī)在不同光照條件下拍攝同一物體,得到正常光照和低光照下的兩張圖像。在正常光照下,物體的顏色鮮艷,表面的紋理清晰可見(jiàn),能夠準(zhǔn)確地識(shí)別物體的形狀和特征;而在低光照下,物體的亮度明顯降低,大部分區(qū)域呈現(xiàn)出灰暗的色調(diào),物體的邊緣變得模糊,難以分辨物體的細(xì)節(jié)。低光照?qǐng)D像的對(duì)比度也往往較差。對(duì)比度是指圖像中不同區(qū)域亮度差異的度量,低對(duì)比度的圖像中,亮部和暗部之間的區(qū)別不明顯,導(dǎo)致圖像的層次感和視覺(jué)沖擊力較弱。在一幅低光照的風(fēng)景圖像中,天空和地面的亮度差異較小,整個(gè)圖像看起來(lái)灰蒙蒙的,缺乏立體感和生動(dòng)感。在醫(yī)學(xué)影像中,低光照條件下獲取的X光圖像,病變部位與正常組織之間的對(duì)比度不足,使得醫(yī)生難以準(zhǔn)確地判斷病情。通過(guò)對(duì)大量低光照?qǐng)D像的分析,我們發(fā)現(xiàn)亮度和對(duì)比度不足對(duì)視覺(jué)效果產(chǎn)生了嚴(yán)重的影響。在人眼視覺(jué)方面,低亮度和低對(duì)比度的圖像會(huì)使觀察者的眼睛容易疲勞,難以快速、準(zhǔn)確地獲取圖像中的信息。在計(jì)算機(jī)視覺(jué)任務(wù)中,如目標(biāo)檢測(cè)、圖像分割等,亮度和對(duì)比度不足會(huì)導(dǎo)致算法難以準(zhǔn)確地識(shí)別目標(biāo)物體的邊界和特征,從而降低算法的準(zhǔn)確性和可靠性。在目標(biāo)檢測(cè)任務(wù)中,低光照?qǐng)D像中的目標(biāo)物體可能因?yàn)榱炼群蛯?duì)比度不足而被誤檢為背景,或者檢測(cè)不到,這在安防監(jiān)控、自動(dòng)駕駛等領(lǐng)域可能會(huì)帶來(lái)嚴(yán)重的后果。2.1.2噪聲與失真問(wèn)題在低光照環(huán)境下,圖像容易受到噪聲的干擾,這是由于圖像傳感器在采集信號(hào)時(shí),信號(hào)強(qiáng)度較弱,容易受到電子噪聲、熱噪聲等因素的影響。噪聲的存在會(huì)使圖像出現(xiàn)斑點(diǎn)、條紋等瑕疵,嚴(yán)重影響圖像的質(zhì)量和視覺(jué)效果。在低光照拍攝的照片中,常常可以看到圖像上布滿(mǎn)了細(xì)小的顆粒狀噪聲,這些噪聲不僅破壞了圖像的美感,還會(huì)掩蓋圖像中的細(xì)節(jié)信息,使得圖像的可讀性降低。圖像噪聲的類(lèi)型主要包括高斯噪聲、椒鹽噪聲等。高斯噪聲是一種服從高斯分布的隨機(jī)噪聲,其特點(diǎn)是在圖像中呈現(xiàn)為灰度值的隨機(jī)波動(dòng),通常由圖像傳感器的電子噪聲、信號(hào)傳輸過(guò)程中的干擾等因素引起。椒鹽噪聲則是指圖像中出現(xiàn)的亮點(diǎn)和暗點(diǎn),類(lèi)似于鹽和胡椒的顆粒,通常由圖像傳感器的故障像素、信號(hào)傳輸中的錯(cuò)誤等引起。在低光照?qǐng)D像中,高斯噪聲較為常見(jiàn),它會(huì)使圖像的灰度值產(chǎn)生隨機(jī)變化,導(dǎo)致圖像變得模糊。噪聲對(duì)圖像質(zhì)量的破壞是多方面的。噪聲會(huì)降低圖像的清晰度,使圖像中的物體邊緣變得模糊,難以準(zhǔn)確地分辨物體的形狀和特征。噪聲還會(huì)干擾圖像的顏色信息,導(dǎo)致圖像的顏色失真,無(wú)法真實(shí)地反映物體的顏色。在低光照拍攝的彩色圖像中,噪聲可能會(huì)使顏色的飽和度降低,色彩變得暗淡,影響圖像的視覺(jué)效果。除了噪聲,低光照?qǐng)D像還可能存在失真問(wèn)題。失真可能是由于相機(jī)的光學(xué)系統(tǒng)、圖像傳感器的特性以及拍攝環(huán)境等因素引起的。常見(jiàn)的失真類(lèi)型包括幾何失真、顏色失真等。幾何失真會(huì)導(dǎo)致圖像中的物體形狀發(fā)生變形,如拉伸、扭曲等,影響圖像的準(zhǔn)確性和可靠性。顏色失真則會(huì)使圖像的顏色與實(shí)際場(chǎng)景的顏色不一致,導(dǎo)致圖像的色彩還原度降低。在低光照條件下,由于光線的不均勻分布和相機(jī)的自動(dòng)調(diào)節(jié)功能,圖像可能會(huì)出現(xiàn)局部的顏色失真,使得圖像中的某些區(qū)域的顏色看起來(lái)不自然。噪聲和失真問(wèn)題對(duì)低光照?qǐng)D像的質(zhì)量和應(yīng)用產(chǎn)生了嚴(yán)重的影響。在安防監(jiān)控領(lǐng)域,噪聲和失真會(huì)使監(jiān)控圖像的清晰度和準(zhǔn)確性降低,難以識(shí)別監(jiān)控區(qū)域內(nèi)的人員和物體,影響安全防范的效果。在醫(yī)療成像領(lǐng)域,噪聲和失真可能會(huì)導(dǎo)致醫(yī)生對(duì)病情的誤判,影響患者的治療效果。因此,有效地抑制噪聲和減少失真,是低光照?qǐng)D像增強(qiáng)過(guò)程中需要解決的重要問(wèn)題。2.2圖像增強(qiáng)的基本原理2.2.1基于直方圖的增強(qiáng)原理直方圖是圖像中像素灰度分布的一種統(tǒng)計(jì)表示,它直觀地展示了圖像中不同灰度級(jí)的像素?cái)?shù)量。在一幅8位灰度圖像中,灰度級(jí)范圍是0到255,直方圖的橫坐標(biāo)表示灰度級(jí),縱坐標(biāo)表示對(duì)應(yīng)灰度級(jí)的像素個(gè)數(shù)。通過(guò)分析直方圖,可以了解圖像的亮度分布情況。如果直方圖中的像素主要集中在低灰度區(qū)域,說(shuō)明圖像整體偏暗;反之,如果像素主要集中在高灰度區(qū)域,圖像則整體偏亮。直方圖均衡化是一種基于直方圖的圖像增強(qiáng)方法,其核心思想是通過(guò)對(duì)圖像的直方圖進(jìn)行變換,將其灰度分布從原來(lái)的集中在某個(gè)區(qū)間,擴(kuò)展到整個(gè)灰度范圍,從而增強(qiáng)圖像的對(duì)比度。具體來(lái)說(shuō),直方圖均衡化的實(shí)現(xiàn)步驟如下:統(tǒng)計(jì)圖像的直方圖:計(jì)算圖像中每個(gè)灰度級(jí)的像素?cái)?shù)量,得到原始直方圖。計(jì)算累積分布函數(shù)(CDF):累積分布函數(shù)表示小于等于某個(gè)灰度級(jí)的像素在圖像中所占的比例。通過(guò)對(duì)原始直方圖進(jìn)行累加計(jì)算,可以得到累積分布函數(shù)。映射灰度值:根據(jù)累積分布函數(shù),將原始圖像中的每個(gè)灰度值映射到一個(gè)新的灰度值。映射公式為:s=T(r)=\frac{L-1}{N}\sum_{i=0}^{r}n_i其中,s是映射后的灰度值,T(r)是映射函數(shù),L是灰度級(jí)的總數(shù)(如8位灰度圖像中L=256),N是圖像的總像素?cái)?shù),n_i是灰度級(jí)為i的像素?cái)?shù)量,r是原始灰度值。生成增強(qiáng)后的圖像:根據(jù)映射后的灰度值,替換原始圖像中相應(yīng)像素的灰度值,得到直方圖均衡化后的圖像。以一幅低光照的灰度圖像為例,其原始直方圖可能呈現(xiàn)出像素集中在低灰度區(qū)域的特點(diǎn),導(dǎo)致圖像整體偏暗,對(duì)比度較低。經(jīng)過(guò)直方圖均衡化處理后,直方圖的分布變得更加均勻,灰度值在整個(gè)范圍內(nèi)得到了擴(kuò)展。這使得圖像中原本較暗的區(qū)域變得更亮,較亮的區(qū)域變得更亮,從而增強(qiáng)了圖像的對(duì)比度,使圖像中的細(xì)節(jié)更加清晰可見(jiàn)。然而,直方圖均衡化也存在一些局限性。在某些情況下,它可能會(huì)導(dǎo)致圖像過(guò)度增強(qiáng),丟失部分細(xì)節(jié)信息。當(dāng)圖像中存在大量相似灰度值的像素時(shí),直方圖均衡化可能會(huì)使這些像素的灰度值分布過(guò)于分散,導(dǎo)致圖像出現(xiàn)塊狀效應(yīng)或噪聲放大。在一些醫(yī)學(xué)圖像中,過(guò)度的直方圖均衡化可能會(huì)使病變區(qū)域的細(xì)節(jié)被掩蓋,影響醫(yī)生的診斷。直方圖均衡化是一種簡(jiǎn)單有效的圖像增強(qiáng)方法,在許多場(chǎng)景下能夠顯著提升圖像的對(duì)比度,但在應(yīng)用時(shí)需要根據(jù)具體情況進(jìn)行評(píng)估和調(diào)整,以避免出現(xiàn)過(guò)度增強(qiáng)等問(wèn)題。2.2.2基于Retinex理論的增強(qiáng)原理Retinex理論是由EdwinLand在20世紀(jì)60年代提出的一種顏色恒常性理論,它認(rèn)為人類(lèi)視覺(jué)系統(tǒng)感知到的物體顏色和亮度是由物體表面的反射特性決定的,而與光照條件無(wú)關(guān)。根據(jù)Retinex理論,圖像可以看作是由光照分量和反射分量組成的。光照分量決定了圖像的整體亮度,而反射分量則決定了圖像的顏色和細(xì)節(jié)。Retinex算法的目的就是從圖像中分離出光照分量和反射分量,然后對(duì)反射分量進(jìn)行增強(qiáng),以達(dá)到圖像增強(qiáng)的效果。假設(shè)一幅圖像I(x,y)可以表示為反射分量R(x,y)和光照分量L(x,y)的乘積,即:I(x,y)=R(x,y)\timesL(x,y)為了便于處理,通常將其轉(zhuǎn)換到對(duì)數(shù)域,得到:\logI(x,y)=\logR(x,y)+\logL(x,y)其中,\logI(x,y)是圖像在對(duì)數(shù)域下的表示,\logR(x,y)是反射分量在對(duì)數(shù)域下的表示,\logL(x,y)是光照分量在對(duì)數(shù)域下的表示。Retinex算法的關(guān)鍵步驟是估計(jì)光照分量L(x,y)。常用的方法是通過(guò)對(duì)圖像進(jìn)行高斯模糊來(lái)估計(jì)光照分量。高斯模糊可以平滑圖像,去除高頻細(xì)節(jié),從而得到圖像的低頻光照信息。具體步驟如下:對(duì)圖像進(jìn)行高斯模糊:使用高斯濾波器對(duì)圖像I(x,y)進(jìn)行模糊處理,得到模糊后的圖像\overline{I}(x,y),它近似表示光照分量L(x,y)。計(jì)算反射分量:在對(duì)數(shù)域下,通過(guò)原圖像與光照分量的差值計(jì)算反射分量。即:\logR(x,y)=\logI(x,y)-\log\overline{I}(x,y)增強(qiáng)反射分量:對(duì)計(jì)算得到的反射分量\logR(x,y)進(jìn)行適當(dāng)?shù)脑鰪?qiáng)處理,如調(diào)整對(duì)比度、拉伸灰度范圍等,以突出圖像的細(xì)節(jié)和顏色信息。合成增強(qiáng)后的圖像:將增強(qiáng)后的反射分量與光照分量重新合成,得到增強(qiáng)后的圖像。在對(duì)數(shù)域下,合成公式為:\logI'(x,y)=\logR'(x,y)+\log\overline{I}(x,y)其中,\logI'(x,y)是增強(qiáng)后圖像在對(duì)數(shù)域下的表示,\logR'(x,y)是增強(qiáng)后的反射分量在對(duì)數(shù)域下的表示。最后,通過(guò)反對(duì)數(shù)變換將圖像轉(zhuǎn)換回原空間,得到最終增強(qiáng)后的圖像I'(x,y)?;赗etinex理論的圖像增強(qiáng)方法具有以下優(yōu)勢(shì):自適應(yīng)增強(qiáng):能夠根據(jù)圖像的局部特征自適應(yīng)地增強(qiáng)圖像,在保留細(xì)節(jié)的同時(shí)增強(qiáng)圖像的整體對(duì)比度。對(duì)于一幅包含不同光照條件區(qū)域的圖像,Retinex算法可以分別對(duì)不同區(qū)域進(jìn)行適當(dāng)?shù)脑鰪?qiáng),使每個(gè)區(qū)域的細(xì)節(jié)都能得到清晰展現(xiàn)。去除光照不均勻:有效地去除圖像中的光照不均勻問(wèn)題。通過(guò)估計(jì)并調(diào)整光照分量,使得圖像的亮度在整個(gè)場(chǎng)景中更加均勻。在室內(nèi)場(chǎng)景圖像中,可能存在部分區(qū)域受窗戶(hù)光線照射較強(qiáng),而其他區(qū)域較暗的情況,Retinex算法可以平衡這些區(qū)域的亮度,使圖像整體看起來(lái)更加自然。保留細(xì)節(jié)信息:在增強(qiáng)圖像的同時(shí)能夠保留細(xì)節(jié)信息。通過(guò)對(duì)圖像的高頻分量(反射分量)進(jìn)行增強(qiáng),可以突出圖像中的細(xì)節(jié),使得圖像更加清晰和有層次感。在處理低光照的文物圖像時(shí),Retinex算法可以清晰地展現(xiàn)文物表面的紋理、圖案等細(xì)節(jié),為文物研究提供更有價(jià)值的圖像資料。然而,Retinex算法也存在一些不足之處,如在處理過(guò)程中可能會(huì)放大噪聲,導(dǎo)致圖像出現(xiàn)噪聲干擾;對(duì)于復(fù)雜場(chǎng)景的圖像,可能會(huì)出現(xiàn)光暈等偽影,影響圖像的視覺(jué)效果。在實(shí)際應(yīng)用中,需要根據(jù)具體情況對(duì)Retinex算法進(jìn)行優(yōu)化和改進(jìn),以提高圖像增強(qiáng)的效果。2.3深度學(xué)習(xí)基礎(chǔ)在圖像增強(qiáng)中的應(yīng)用2.3.1卷積神經(jīng)網(wǎng)絡(luò)(CNN)卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)是一種專(zhuān)門(mén)為處理具有網(wǎng)格結(jié)構(gòu)數(shù)據(jù)(如圖像、音頻)而設(shè)計(jì)的深度學(xué)習(xí)模型,在圖像增強(qiáng)領(lǐng)域展現(xiàn)出了強(qiáng)大的能力。它通過(guò)獨(dú)特的結(jié)構(gòu)和運(yùn)算方式,能夠自動(dòng)學(xué)習(xí)圖像的特征,從而實(shí)現(xiàn)對(duì)低光照?qǐng)D像的有效增強(qiáng)。CNN的基本結(jié)構(gòu)主要包括輸入層、卷積層、池化層、全連接層和輸出層。輸入層負(fù)責(zé)接收原始圖像數(shù)據(jù),將其傳遞給后續(xù)層進(jìn)行處理。卷積層是CNN的核心組成部分,通過(guò)卷積操作對(duì)輸入圖像進(jìn)行特征提取。卷積操作使用多個(gè)卷積核(也稱(chēng)為濾波器)在圖像上滑動(dòng),每個(gè)卷積核與圖像的局部區(qū)域進(jìn)行點(diǎn)乘運(yùn)算,得到一個(gè)特征映射(featuremap)。不同的卷積核可以提取不同類(lèi)型的特征,如邊緣、紋理、角點(diǎn)等。通過(guò)多個(gè)卷積層的堆疊,可以逐漸提取出從低級(jí)到高級(jí)的圖像特征。例如,在低光照?qǐng)D像增強(qiáng)中,淺層卷積層可能提取圖像的基本邊緣和輪廓信息,而深層卷積層則能夠?qū)W習(xí)到更抽象的語(yǔ)義特征,如物體的形狀、結(jié)構(gòu)等。池化層通常緊跟在卷積層之后,其作用是對(duì)特征圖進(jìn)行降采樣,減少特征圖的尺寸,從而降低計(jì)算量和模型參數(shù)數(shù)量。常見(jiàn)的池化操作有最大池化(MaxPooling)和平均池化(AveragePooling)。最大池化選取池化窗口內(nèi)的最大值作為輸出,能夠保留圖像中最顯著的特征;平均池化則計(jì)算池化窗口內(nèi)的平均值作為輸出,對(duì)圖像進(jìn)行平滑處理。池化操作在一定程度上還可以增強(qiáng)模型的平移不變性,提高模型的泛化能力。在處理低光照?qǐng)D像時(shí),池化層可以在保留關(guān)鍵特征的同時(shí),減少噪聲等干擾信息的影響。全連接層將經(jīng)過(guò)卷積層和池化層處理后的特征圖進(jìn)行扁平化處理,然后通過(guò)一系列全連接神經(jīng)元對(duì)特征進(jìn)行分類(lèi)或回歸等任務(wù)。在低光照?qǐng)D像增強(qiáng)中,全連接層可以根據(jù)提取到的特征,預(yù)測(cè)出增強(qiáng)后的圖像像素值或調(diào)整圖像的亮度、對(duì)比度等參數(shù)。輸出層則根據(jù)具體的任務(wù)輸出最終的結(jié)果,如增強(qiáng)后的圖像。CNN在圖像特征提取方面具有顯著優(yōu)勢(shì)。與傳統(tǒng)的手工設(shè)計(jì)特征提取方法(如SIFT、HOG等)相比,CNN能夠自動(dòng)從大量的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到圖像的特征,無(wú)需人工設(shè)計(jì)復(fù)雜的特征提取器。這種自動(dòng)學(xué)習(xí)的方式使得CNN能夠更好地適應(yīng)不同類(lèi)型的圖像和任務(wù),并且能夠?qū)W習(xí)到更復(fù)雜、更抽象的特征。在低光照?qǐng)D像增強(qiáng)中,CNN可以學(xué)習(xí)到低光照?qǐng)D像與正常光照?qǐng)D像之間的映射關(guān)系,從而對(duì)低光照?qǐng)D像進(jìn)行有效的增強(qiáng)。通過(guò)大量的訓(xùn)練,CNN可以學(xué)習(xí)到如何提升圖像的亮度、增強(qiáng)對(duì)比度、恢復(fù)細(xì)節(jié)和還原色彩,使增強(qiáng)后的圖像更接近正常光照下的圖像。在實(shí)際應(yīng)用中,許多基于CNN的模型被提出用于低光照?qǐng)D像增強(qiáng)。例如,LLNet(Low-LightImageEnhancementusingDeepLearning)模型通過(guò)構(gòu)建一個(gè)端到端的卷積神經(jīng)網(wǎng)絡(luò),直接學(xué)習(xí)低光照?qǐng)D像到增強(qiáng)圖像的映射。該模型在訓(xùn)練過(guò)程中使用了大量的低光照?qǐng)D像對(duì),通過(guò)最小化增強(qiáng)圖像與真實(shí)圖像之間的損失函數(shù),不斷調(diào)整模型的參數(shù),以提高增強(qiáng)效果。實(shí)驗(yàn)結(jié)果表明,LLNet在提升圖像亮度和對(duì)比度方面取得了較好的效果,能夠有效地增強(qiáng)低光照?qǐng)D像的視覺(jué)效果。Zero-DCE(Zero-ReferenceDeepCurveEstimationforLow-LightImageEnhancement)模型則提出了一種無(wú)參考的低光照?qǐng)D像增強(qiáng)方法。該模型通過(guò)設(shè)計(jì)一個(gè)深度曲線估計(jì)網(wǎng)絡(luò),自動(dòng)學(xué)習(xí)圖像的增強(qiáng)曲線,從而實(shí)現(xiàn)對(duì)低光照?qǐng)D像的增強(qiáng)。與傳統(tǒng)的有監(jiān)督方法不同,Zero-DCE不需要成對(duì)的低光照?qǐng)D像和真實(shí)圖像進(jìn)行訓(xùn)練,而是利用圖像自身的統(tǒng)計(jì)信息進(jìn)行自監(jiān)督學(xué)習(xí)。這種方法在一定程度上解決了標(biāo)注數(shù)據(jù)不足的問(wèn)題,并且在不同場(chǎng)景的低光照?qǐng)D像增強(qiáng)中表現(xiàn)出了較好的泛化能力。2.3.2生成對(duì)抗網(wǎng)絡(luò)(GAN)生成對(duì)抗網(wǎng)絡(luò)(GenerativeAdversarialNetwork,GAN)是一種由生成器(Generator)和判別器(Discriminator)組成的深度學(xué)習(xí)模型架構(gòu),在低光照?qǐng)D像增強(qiáng)領(lǐng)域也得到了廣泛的應(yīng)用,并取得了令人矚目的成果。GAN的基本原理基于博弈論中的二人零和博弈思想。生成器的任務(wù)是根據(jù)輸入的噪聲或低質(zhì)量圖像(如低光照?qǐng)D像)生成逼真的輸出圖像,使其盡可能地接近真實(shí)的高質(zhì)量圖像;判別器則負(fù)責(zé)判斷輸入的圖像是來(lái)自真實(shí)數(shù)據(jù)還是由生成器生成的偽造數(shù)據(jù)。在訓(xùn)練過(guò)程中,生成器和判別器相互對(duì)抗、相互學(xué)習(xí)。生成器努力生成更逼真的圖像,以欺騙判別器;判別器則不斷提高自己的辨別能力,以準(zhǔn)確地區(qū)分真實(shí)圖像和生成圖像。通過(guò)這種對(duì)抗訓(xùn)練的方式,生成器和判別器的性能不斷提升,最終達(dá)到一個(gè)動(dòng)態(tài)平衡。在低光照?qǐng)D像增強(qiáng)中,生成器學(xué)習(xí)將低光照?qǐng)D像轉(zhuǎn)換為正常光照下的高質(zhì)量圖像,判別器則對(duì)生成的增強(qiáng)圖像和真實(shí)的正常光照?qǐng)D像進(jìn)行判斷,促使生成器生成更符合真實(shí)情況的增強(qiáng)圖像。生成器通常采用反卷積(Deconvolution)或轉(zhuǎn)置卷積(TransposedConvolution)等操作來(lái)逐步恢復(fù)圖像的尺寸和細(xì)節(jié)。反卷積操作可以看作是卷積操作的逆過(guò)程,它通過(guò)對(duì)輸入特征圖進(jìn)行上采樣和卷積運(yùn)算,將低分辨率的特征圖轉(zhuǎn)換為高分辨率的圖像。在低光照?qǐng)D像增強(qiáng)中,生成器首先將低光照?qǐng)D像作為輸入,經(jīng)過(guò)一系列的卷積和反卷積層,逐漸恢復(fù)圖像的亮度、對(duì)比度、細(xì)節(jié)和色彩信息,最終生成增強(qiáng)后的圖像。生成器可以學(xué)習(xí)到如何調(diào)整圖像的亮度分布,增強(qiáng)圖像的對(duì)比度,使暗處的細(xì)節(jié)清晰可見(jiàn),同時(shí)保持圖像的自然度和真實(shí)性。判別器則由一系列卷積層和全連接層組成,用于提取圖像的特征并判斷圖像的真?zhèn)?。它通過(guò)對(duì)輸入圖像進(jìn)行卷積操作,提取圖像的各種特征,然后將這些特征傳遞給全連接層進(jìn)行分類(lèi)判斷。判別器的輸出是一個(gè)概率值,表示輸入圖像為真實(shí)圖像的概率。如果判別器輸出的值接近1,則表示它認(rèn)為輸入圖像是真實(shí)圖像;如果輸出的值接近0,則表示它認(rèn)為輸入圖像是生成器生成的偽造圖像。在訓(xùn)練過(guò)程中,判別器根據(jù)真實(shí)圖像和生成圖像的標(biāo)簽(真實(shí)圖像標(biāo)簽為1,生成圖像標(biāo)簽為0),通過(guò)反向傳播算法調(diào)整自身的參數(shù),以提高判斷的準(zhǔn)確性。在低光照?qǐng)D像增強(qiáng)中,GAN具有獨(dú)特的優(yōu)勢(shì)。傳統(tǒng)的圖像增強(qiáng)方法往往只能對(duì)圖像的某些特定特征進(jìn)行增強(qiáng),難以生成具有真實(shí)感的圖像。而GAN能夠生成更加逼真、自然的增強(qiáng)圖像,更符合人眼的視覺(jué)感知。這是因?yàn)镚AN通過(guò)對(duì)抗訓(xùn)練,使得生成器能夠?qū)W習(xí)到真實(shí)圖像的分布特征,從而生成與真實(shí)圖像相似的增強(qiáng)圖像。在處理低光照的夜景圖像時(shí),基于GAN的方法可以生成具有豐富細(xì)節(jié)和自然色彩的增強(qiáng)圖像,使建筑物的輪廓、燈光的效果等都更加逼真,給人一種身臨其境的感覺(jué)。一些基于GAN的低光照?qǐng)D像增強(qiáng)模型也取得了顯著的成果。例如,LIME(Low-LightImageEnhancementusingMulti-ScaleConditionalGenerativeAdversarialNetworks)模型采用了多尺度條件生成對(duì)抗網(wǎng)絡(luò)結(jié)構(gòu)。該模型在生成器中引入了多尺度的特征融合,能夠更好地處理圖像的不同尺度信息,從而恢復(fù)圖像的細(xì)節(jié)和紋理。判別器則基于多尺度的特征進(jìn)行判斷,提高了對(duì)生成圖像的辨別能力。實(shí)驗(yàn)結(jié)果表明,LIME在低光照?qǐng)D像增強(qiáng)方面表現(xiàn)出色,生成的增強(qiáng)圖像在視覺(jué)效果和客觀指標(biāo)上都優(yōu)于傳統(tǒng)的圖像增強(qiáng)方法。雖然GAN在低光照?qǐng)D像增強(qiáng)中取得了很大的進(jìn)展,但也面臨一些挑戰(zhàn)。訓(xùn)練過(guò)程的不穩(wěn)定性是一個(gè)常見(jiàn)的問(wèn)題,生成器和判別器之間的對(duì)抗可能會(huì)導(dǎo)致訓(xùn)練過(guò)程中出現(xiàn)梯度消失、梯度爆炸或模式坍塌等現(xiàn)象。模式坍塌是指生成器在訓(xùn)練過(guò)程中只能生成有限種類(lèi)的圖像,無(wú)法覆蓋真實(shí)圖像的多樣性。為了解決這些問(wèn)題,研究人員提出了許多改進(jìn)方法,如改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)、調(diào)整損失函數(shù)、引入正則化項(xiàng)等。一些方法通過(guò)改進(jìn)生成器和判別器的網(wǎng)絡(luò)結(jié)構(gòu),使其更加穩(wěn)定和高效;一些方法則通過(guò)調(diào)整損失函數(shù),如引入對(duì)抗損失、感知損失、結(jié)構(gòu)損失等,來(lái)平衡生成器和判別器的訓(xùn)練,提高生成圖像的質(zhì)量和多樣性。三、傳統(tǒng)低光照?qǐng)D像增強(qiáng)方法3.1基于直方圖的增強(qiáng)算法3.1.1直方圖均衡化直方圖均衡化(HistogramEqualization)是一種經(jīng)典的圖像增強(qiáng)方法,它基于圖像的灰度直方圖進(jìn)行操作,通過(guò)對(duì)圖像的灰度分布進(jìn)行調(diào)整,使圖像的對(duì)比度得到增強(qiáng),從而提升圖像的視覺(jué)效果。其算法步驟如下:計(jì)算原始圖像的灰度直方圖:對(duì)于一幅灰度圖像,假設(shè)其灰度級(jí)范圍是0到L-1(通常L=256,即8位灰度圖像)。首先統(tǒng)計(jì)圖像中每個(gè)灰度級(jí)r_k(k=0,1,\cdots,L-1)出現(xiàn)的像素個(gè)數(shù)n_k。設(shè)圖像的總像素?cái)?shù)為N,則灰度級(jí)r_k出現(xiàn)的概率p(r_k)為:p(r_k)=\frac{n_k}{N}這一步驟得到了圖像的原始灰度直方圖,它直觀地展示了圖像中不同灰度級(jí)像素的分布情況。計(jì)算累積分布函數(shù)(CDF):累積分布函數(shù)C(r_k)表示灰度級(jí)小于等于r_k的像素在圖像中所占的比例。通過(guò)對(duì)概率p(r_k)進(jìn)行累加計(jì)算得到:C(r_k)=\sum_{i=0}^{k}p(r_i)=\sum_{i=0}^{k}\frac{n_i}{N}累積分布函數(shù)反映了圖像中灰度級(jí)的累積分布情況,它是直方圖均衡化的關(guān)鍵步驟。計(jì)算映射函數(shù):根據(jù)累積分布函數(shù),將原始灰度級(jí)r_k映射到新的灰度級(jí)s_k。映射公式為:s_k=T(r_k)=(L-1)\timesC(r_k)其中,T(r_k)是映射函數(shù),(L-1)是最大灰度級(jí)(對(duì)于8位灰度圖像,L-1=255)。通過(guò)這個(gè)映射函數(shù),將原始圖像的灰度級(jí)分布映射到一個(gè)更均勻的分布上。生成增強(qiáng)后的圖像:根據(jù)映射后的灰度級(jí)s_k,替換原始圖像中相應(yīng)像素的灰度值,得到直方圖均衡化后的圖像。對(duì)于原始圖像中的每個(gè)像素,其灰度值r通過(guò)映射函數(shù)T(r)被轉(zhuǎn)換為新的灰度值s,從而生成增強(qiáng)后的圖像。為了更直觀地展示直方圖均衡化的增強(qiáng)效果,我們以一幅低光照的灰度圖像為例進(jìn)行實(shí)驗(yàn)。原始低光照?qǐng)D像整體偏暗,對(duì)比度較低,圖像中的物體和細(xì)節(jié)難以清晰分辨。通過(guò)計(jì)算其灰度直方圖,可以發(fā)現(xiàn)像素主要集中在低灰度區(qū)域,灰度分布較為集中。經(jīng)過(guò)直方圖均衡化處理后,圖像的對(duì)比度得到了顯著提升,原本模糊的物體輪廓變得清晰可見(jiàn),圖像中的細(xì)節(jié)也更加豐富。從均衡化后的直方圖可以看出,像素分布在整個(gè)灰度范圍內(nèi)變得更加均勻,灰度級(jí)得到了有效擴(kuò)展,從而增強(qiáng)了圖像的視覺(jué)效果。然而,直方圖均衡化也存在一些局限性。在某些情況下,它可能會(huì)導(dǎo)致圖像過(guò)度增強(qiáng),丟失部分細(xì)節(jié)信息。當(dāng)圖像中存在大量相似灰度值的像素時(shí),直方圖均衡化可能會(huì)使這些像素的灰度值分布過(guò)于分散,導(dǎo)致圖像出現(xiàn)塊狀效應(yīng)或噪聲放大。在一些醫(yī)學(xué)圖像中,過(guò)度的直方圖均衡化可能會(huì)使病變區(qū)域的細(xì)節(jié)被掩蓋,影響醫(yī)生的診斷。直方圖均衡化對(duì)圖像的整體對(duì)比度增強(qiáng)效果較好,但對(duì)于局部細(xì)節(jié)的處理能力有限,在處理復(fù)雜場(chǎng)景的低光照?qǐng)D像時(shí),可能無(wú)法滿(mǎn)足實(shí)際需求。3.1.2對(duì)比度受限的自適應(yīng)直方圖均衡化(CLAHE)對(duì)比度受限的自適應(yīng)直方圖均衡化(ContrastLimitedAdaptiveHistogramEqualization,CLAHE)是對(duì)傳統(tǒng)直方圖均衡化的一種改進(jìn)方法,它針對(duì)傳統(tǒng)方法在增強(qiáng)圖像對(duì)比度時(shí)容易出現(xiàn)的過(guò)度增強(qiáng)和噪聲放大等問(wèn)題,提出了一種基于局部區(qū)域的自適應(yīng)處理策略。CLAHE的核心思想是將圖像劃分為多個(gè)不重疊的小塊(通常稱(chēng)為“tiles”),對(duì)每個(gè)小塊分別進(jìn)行直方圖均衡化處理,然后通過(guò)插值方法將這些小塊的結(jié)果合并起來(lái),得到最終的增強(qiáng)圖像。在對(duì)每個(gè)小塊進(jìn)行直方圖均衡化時(shí),CLAHE引入了對(duì)比度限制機(jī)制,通過(guò)限制直方圖中灰度級(jí)的分布,避免了局部對(duì)比度過(guò)度增強(qiáng),從而有效地抑制了噪聲的放大。具體實(shí)現(xiàn)步驟如下:圖像分塊:將輸入圖像劃分為多個(gè)大小相同的不重疊小塊,每個(gè)小塊作為一個(gè)獨(dú)立的處理單元。小塊的大小通常可以根據(jù)圖像的尺寸和應(yīng)用需求進(jìn)行調(diào)整,常見(jiàn)的小塊大小有8\times8、16\times16等。將一幅大尺寸的圖像劃分為多個(gè)8\times8的小塊,每個(gè)小塊都包含了圖像的局部信息。局部直方圖均衡化:對(duì)于每個(gè)小塊,計(jì)算其局部灰度直方圖,并進(jìn)行直方圖均衡化處理。與傳統(tǒng)的全局直方圖均衡化不同,這里的直方圖均衡化是基于每個(gè)小塊的局部信息進(jìn)行的,因此能夠更好地適應(yīng)圖像的局部對(duì)比度變化。對(duì)于每個(gè)8\times8的小塊,統(tǒng)計(jì)其中每個(gè)灰度級(jí)的像素個(gè)數(shù),計(jì)算出局部直方圖,然后按照直方圖均衡化的步驟,對(duì)小塊內(nèi)的像素灰度值進(jìn)行映射,得到局部均衡化后的小塊圖像。對(duì)比度限制:為了避免局部對(duì)比度過(guò)度增強(qiáng),CLAHE引入了對(duì)比度限制參數(shù)(clipLimit)。在計(jì)算局部直方圖時(shí),如果某個(gè)灰度級(jí)的像素?cái)?shù)量超過(guò)了clipLimit,超出的部分會(huì)被裁剪掉,并均勻地重新分配到其他灰度級(jí)上。這樣可以有效地限制局部對(duì)比度的增大,避免噪聲的過(guò)度放大。假設(shè)clipLimit設(shè)置為4.0,當(dāng)某個(gè)小塊中某個(gè)灰度級(jí)的像素?cái)?shù)量超過(guò)這個(gè)閾值時(shí),超出的像素會(huì)被裁剪,并均勻地分配到其他灰度級(jí),使得直方圖的分布更加均勻,避免了局部對(duì)比度的異常增強(qiáng)。插值合并:經(jīng)過(guò)對(duì)比度限制后的每個(gè)小塊,其邊緣部分的像素值可能會(huì)出現(xiàn)不連續(xù)的情況。為了得到平滑的增強(qiáng)圖像,需要使用插值方法將這些小塊的結(jié)果進(jìn)行合并。常用的插值方法有雙線性插值、雙三次插值等。通過(guò)雙線性插值,根據(jù)相鄰小塊邊緣像素的灰度值,計(jì)算出中間像素的灰度值,從而實(shí)現(xiàn)小塊之間的平滑過(guò)渡,得到最終的增強(qiáng)圖像。為了對(duì)比CLAHE與傳統(tǒng)直方圖均衡化的效果,我們使用同一幅低光照?qǐng)D像進(jìn)行實(shí)驗(yàn)。傳統(tǒng)直方圖均衡化雖然能夠增強(qiáng)圖像的整體對(duì)比度,但在一些局部區(qū)域可能會(huì)出現(xiàn)過(guò)度增強(qiáng)的現(xiàn)象,導(dǎo)致圖像細(xì)節(jié)丟失,同時(shí)噪聲也被放大,圖像出現(xiàn)明顯的顆粒感。而CLAHE通過(guò)對(duì)局部區(qū)域進(jìn)行自適應(yīng)處理,有效地避免了這些問(wèn)題。在增強(qiáng)圖像局部對(duì)比度的同時(shí),CLAHE能夠較好地保留圖像的細(xì)節(jié)信息,噪聲也得到了有效的抑制,圖像的視覺(jué)效果更加自然、清晰。在低光照的人臉圖像中,CLAHE增強(qiáng)后的圖像能夠清晰地展現(xiàn)出人臉的五官細(xì)節(jié),皮膚的紋理也更加自然,而傳統(tǒng)直方圖均衡化后的圖像可能會(huì)出現(xiàn)面部過(guò)度曝光、細(xì)節(jié)模糊等問(wèn)題。CLAHE在處理低光照?qǐng)D像時(shí)具有明顯的優(yōu)勢(shì),它能夠在增強(qiáng)圖像對(duì)比度的同時(shí),更好地保留圖像的細(xì)節(jié)和抑制噪聲。然而,CLAHE也存在一些不足之處,如計(jì)算復(fù)雜度較高,需要對(duì)每個(gè)小塊進(jìn)行直方圖計(jì)算和均衡化處理,并且在插值合并過(guò)程中也需要一定的計(jì)算量;參數(shù)的選擇對(duì)增強(qiáng)效果有較大影響,clipLimit和小塊大小等參數(shù)需要根據(jù)具體圖像和應(yīng)用場(chǎng)景進(jìn)行調(diào)整,不同的參數(shù)設(shè)置可能會(huì)導(dǎo)致不同的增強(qiáng)效果。3.2基于Retinex理論的算法3.2.1單尺度Retinex算法單尺度Retinex(SingleScaleRetinex,SSR)算法是基于Retinex理論的一種基礎(chǔ)圖像增強(qiáng)算法,其核心原理是將圖像分解為反射分量和光照分量,通過(guò)對(duì)光照分量的處理來(lái)實(shí)現(xiàn)圖像增強(qiáng)。在現(xiàn)實(shí)場(chǎng)景中,物體的顏色和亮度感知是由其表面對(duì)光線的反射特性以及環(huán)境光照共同決定的。Retinex理論認(rèn)為,圖像I(x,y)可以表示為反射分量R(x,y)和光照分量L(x,y)的乘積,即I(x,y)=R(x,y)\timesL(x,y)。為了便于數(shù)學(xué)處理,通常將其轉(zhuǎn)換到對(duì)數(shù)域,得到\logI(x,y)=\logR(x,y)+\logL(x,y)。SSR算法的計(jì)算過(guò)程主要包括以下幾個(gè)關(guān)鍵步驟:估計(jì)光照分量:這是SSR算法的關(guān)鍵步驟之一,通常采用高斯模糊來(lái)估計(jì)圖像的光照分量。高斯模糊是一種線性平滑濾波,通過(guò)對(duì)圖像進(jìn)行加權(quán)平均,能夠有效地平滑圖像,去除高頻細(xì)節(jié),從而得到圖像的低頻光照信息。對(duì)于輸入圖像I(x,y),使用高斯濾波器G(x,y)對(duì)其進(jìn)行卷積操作,得到模糊后的圖像\overline{I}(x,y),該圖像近似表示光照分量L(x,y)。在實(shí)際應(yīng)用中,高斯濾波器的標(biāo)準(zhǔn)差\sigma是一個(gè)重要參數(shù),它決定了高斯模糊的程度。較小的\sigma值會(huì)使模糊后的圖像保留更多的高頻細(xì)節(jié),但可能無(wú)法充分去除噪聲和提取低頻光照信息;較大的\sigma值則會(huì)使圖像過(guò)度平滑,丟失一些重要的細(xì)節(jié)信息。一般來(lái)說(shuō),\sigma的取值范圍在80-100之間,具體取值需要根據(jù)圖像的特點(diǎn)和應(yīng)用需求進(jìn)行調(diào)整。計(jì)算反射分量:在估計(jì)出光照分量后,通過(guò)在對(duì)數(shù)域中計(jì)算原圖像與光照分量的差值來(lái)得到反射分量。即\logR(x,y)=\logI(x,y)-\log\overline{I}(x,y)。這個(gè)過(guò)程實(shí)際上是將圖像中的光照因素去除,得到僅包含物體反射特性的分量。反射分量包含了圖像的主要細(xì)節(jié)和顏色信息,對(duì)其進(jìn)行增強(qiáng)可以突出圖像的細(xì)節(jié)和特征。生成增強(qiáng)圖像:將計(jì)算得到的反射分量進(jìn)行指數(shù)運(yùn)算,從對(duì)數(shù)域轉(zhuǎn)換回原空間,得到增強(qiáng)后的反射分量R(x,y)。由于反射分量在計(jì)算過(guò)程中可能會(huì)超出圖像的灰度范圍,因此通常需要對(duì)其進(jìn)行歸一化處理,將其映射到合適的灰度區(qū)間,如0-255,以生成最終的增強(qiáng)圖像。以一幅低光照的室內(nèi)場(chǎng)景圖像為例,原始圖像由于光照不足,整體偏暗,許多細(xì)節(jié)難以辨認(rèn)。經(jīng)過(guò)單尺度Retinex算法處理后,圖像的亮度得到了提升,原本模糊的家具輪廓變得清晰可見(jiàn),墻壁上的裝飾畫(huà)也能看清內(nèi)容。從圖像的細(xì)節(jié)和紋理方面來(lái)看,處理后的圖像能夠更清晰地展現(xiàn)出物體的表面特征,如家具的紋理、墻壁的質(zhì)感等。在顏色方面,算法在一定程度上恢復(fù)了圖像的真實(shí)顏色,使圖像更加自然。然而,單尺度Retinex算法也存在一些局限性。在某些情況下,它可能會(huì)導(dǎo)致圖像的動(dòng)態(tài)范圍壓縮過(guò)度,使得圖像的亮部和暗部細(xì)節(jié)丟失。在處理包含強(qiáng)烈光照對(duì)比的圖像時(shí),如室內(nèi)有強(qiáng)光照射的區(qū)域和陰影區(qū)域,算法可能無(wú)法同時(shí)兼顧兩個(gè)區(qū)域的細(xì)節(jié)增強(qiáng),導(dǎo)致部分區(qū)域的細(xì)節(jié)丟失或過(guò)度增強(qiáng)。單尺度Retinex算法在處理復(fù)雜光照?qǐng)鼍暗膱D像時(shí),可能會(huì)出現(xiàn)光暈等偽影,影響圖像的視覺(jué)效果。在圖像中存在多個(gè)光源或光照不均勻的情況下,算法可能會(huì)在物體邊緣或不同光照區(qū)域的交界處產(chǎn)生光暈現(xiàn)象,降低圖像的質(zhì)量。3.2.2多尺度Retinex算法多尺度Retinex(Multi-ScaleRetinex,MSR)算法是在單尺度Retinex算法的基礎(chǔ)上發(fā)展而來(lái)的,旨在克服單尺度Retinex算法在處理圖像時(shí)的局限性,更好地增強(qiáng)圖像的細(xì)節(jié)和視覺(jué)效果。單尺度Retinex算法雖然能夠在一定程度上提升圖像的亮度和對(duì)比度,但由于它僅使用一個(gè)尺度的高斯模糊來(lái)估計(jì)光照分量,難以同時(shí)兼顧圖像的局部細(xì)節(jié)和整體特征。在處理包含不同尺度物體和光照條件復(fù)雜的圖像時(shí),單尺度Retinex算法可能會(huì)導(dǎo)致局部細(xì)節(jié)丟失或增強(qiáng)過(guò)度,無(wú)法滿(mǎn)足實(shí)際應(yīng)用的需求。MSR算法的核心改進(jìn)在于結(jié)合了不同尺度的高斯模糊來(lái)估計(jì)光照分量,從而綜合考慮圖像的局部和全局信息。其基本原理是通過(guò)多個(gè)不同尺度的高斯濾波器對(duì)圖像進(jìn)行處理,每個(gè)尺度的高斯濾波器都能捕捉到圖像中不同尺度的結(jié)構(gòu)和細(xì)節(jié)信息。具體來(lái)說(shuō),MSR算法使用N個(gè)不同尺度的高斯濾波器F_k(x,y)(k=1,2,\cdots,N)對(duì)原始圖像I(x,y)進(jìn)行濾波,得到N個(gè)不同尺度下的光照分量估計(jì)\overline{I}_k(x,y)。然后,通過(guò)對(duì)每個(gè)尺度下的反射分量\logR_k(x,y)=\logI(x,y)-\log\overline{I}_k(x,y)進(jìn)行加權(quán)平均,得到最終的反射分量估計(jì)。在實(shí)際應(yīng)用中,通常設(shè)置N=3,三個(gè)尺度的比例建議為15:80:250。這三個(gè)尺度分別對(duì)應(yīng)著不同的空間頻率范圍,小尺度(如15)的高斯濾波器能夠捕捉到圖像中的高頻細(xì)節(jié)信息,如物體的邊緣和紋理;中等尺度(如80)的高斯濾波器可以平衡局部和全局信息,對(duì)圖像的局部結(jié)構(gòu)進(jìn)行增強(qiáng);大尺度(如250)的高斯濾波器則主要關(guān)注圖像的低頻全局信息,能夠有效地去除光照不均勻的影響。MSR算法的計(jì)算過(guò)程如下:多尺度光照分量估計(jì):使用不同尺度的高斯濾波器對(duì)原始圖像進(jìn)行濾波,得到多個(gè)尺度下的光照分量估計(jì)。對(duì)于每個(gè)尺度k,通過(guò)高斯卷積操作\overline{I}_k(x,y)=I(x,y)*F_k(x,y)得到該尺度下的光照分量。多尺度反射分量計(jì)算:在對(duì)數(shù)域中,分別計(jì)算每個(gè)尺度下的反射分量\logR_k(x,y)=\logI(x,y)-\log\overline{I}_k(x,y)。反射分量融合:將多個(gè)尺度下的反射分量進(jìn)行加權(quán)平均,得到最終的反射分量估計(jì)。加權(quán)系數(shù)w_k通常設(shè)置為相等,即w_1=w_2=w_3=\frac{1}{3},這樣可以簡(jiǎn)單有效地綜合不同尺度的信息。最終的反射分量\logR(x,y)=\sum_{k=1}^{N}w_k\logR_k(x,y)。生成增強(qiáng)圖像:將最終的反射分量進(jìn)行指數(shù)運(yùn)算和歸一化處理,得到增強(qiáng)后的圖像。通過(guò)結(jié)合不同尺度的高斯模糊,MSR算法在增強(qiáng)圖像細(xì)節(jié)和避免光暈方面具有明顯的優(yōu)勢(shì)。在處理包含豐富細(xì)節(jié)的圖像時(shí),如自然風(fēng)光圖像,MSR算法能夠同時(shí)增強(qiáng)圖像中的遠(yuǎn)景和近景細(xì)節(jié),使遠(yuǎn)處的山巒和近處的花草都能清晰呈現(xiàn),而單尺度Retinex算法可能會(huì)導(dǎo)致遠(yuǎn)景或近景的細(xì)節(jié)丟失。在處理光照不均勻的圖像時(shí),MSR算法能夠更好地平衡不同區(qū)域的亮度,避免出現(xiàn)光暈現(xiàn)象。在室內(nèi)場(chǎng)景中,當(dāng)存在部分區(qū)域受強(qiáng)光照射,而其他區(qū)域較暗的情況時(shí),MSR算法可以有效地調(diào)整光照,使整個(gè)場(chǎng)景的亮度更加均勻,圖像更加自然。然而,MSR算法也并非完美無(wú)缺。由于它需要進(jìn)行多次高斯模糊和反射分量計(jì)算,計(jì)算復(fù)雜度相對(duì)較高,處理速度較慢,這在一些對(duì)實(shí)時(shí)性要求較高的應(yīng)用場(chǎng)景中可能會(huì)受到限制。MSR算法的參數(shù)設(shè)置,如尺度的選擇和加權(quán)系數(shù)的調(diào)整,對(duì)增強(qiáng)效果也有較大影響,需要根據(jù)具體圖像和應(yīng)用需求進(jìn)行優(yōu)化。3.3傳統(tǒng)方法的性能分析與局限性3.3.1客觀指標(biāo)評(píng)估為了全面、準(zhǔn)確地評(píng)估傳統(tǒng)低光照?qǐng)D像增強(qiáng)方法的性能,我們選取了峰值信噪比(PeakSignal-to-NoiseRatio,PSNR)和結(jié)構(gòu)相似性指數(shù)(StructuralSimilarityIndex,SSIM)這兩個(gè)常用的客觀指標(biāo),在標(biāo)準(zhǔn)數(shù)據(jù)集上對(duì)直方圖均衡化、CLAHE、單尺度Retinex(SSR)和多尺度Retinex(MSR)等傳統(tǒng)方法進(jìn)行量化評(píng)估。PSNR是一種用于衡量圖像重建質(zhì)量的客觀指標(biāo),它通過(guò)計(jì)算原始圖像與增強(qiáng)圖像之間的均方誤差(MeanSquaredError,MSE)來(lái)評(píng)估圖像的失真程度。PSNR值越高,表示增強(qiáng)圖像與原始圖像之間的差異越小,圖像質(zhì)量越好。其計(jì)算公式為:PSNR=10\log_{10}\left(\frac{MAX_{I}^2}{MSE}\right)其中,MAX_{I}是圖像像素值的最大值(對(duì)于8位灰度圖像,MAX_{I}=255),MSE是原始圖像與增強(qiáng)圖像對(duì)應(yīng)像素差值的均方值,計(jì)算公式為:MSE=\frac{1}{m\timesn}\sum_{i=1}^{m}\sum_{j=1}^{n}(I(i,j)-K(i,j))^2這里,I(i,j)是原始圖像在位置(i,j)處的像素值,K(i,j)是增強(qiáng)圖像在相同位置處的像素值,m和n分別是圖像的行數(shù)和列數(shù)。SSIM則是一種從結(jié)構(gòu)相似性角度衡量圖像質(zhì)量的指標(biāo),它考慮了圖像的亮度、對(duì)比度和結(jié)構(gòu)信息,更符合人眼的視覺(jué)感知特性。SSIM值的范圍在0到1之間,值越接近1,表示增強(qiáng)圖像與原始圖像的結(jié)構(gòu)越相似,圖像質(zhì)量越高。其計(jì)算公式較為復(fù)雜,涉及亮度比較函數(shù)l(x,y)、對(duì)比度比較函數(shù)c(x,y)和結(jié)構(gòu)比較函數(shù)s(x,y),最終的SSIM值為這三個(gè)函數(shù)的乘積:SSIM(x,y)=l(x,y)\cdotc(x,y)\cdots(x,y)其中,亮度比較函數(shù)l(x,y)=\frac{2\mu_x\mu_y+C_1}{\mu_x^2+\mu_y^2+C_1},對(duì)比度比較函數(shù)c(x,y)=\frac{2\sigma_x\sigma_y+C_2}{\sigma_x^2+\sigma_y^2+C_2},結(jié)構(gòu)比較函數(shù)s(x,y)=\frac{\sigma_{xy}+C_3}{\sigma_x\sigma_y+C_3}。\mu_x和\mu_y分別是圖像x和y的均值,\sigma_x和\sigma_y分別是圖像x和y的標(biāo)準(zhǔn)差,\sigma_{xy}是圖像x和y的協(xié)方差,C_1、C_2和C_3是用于穩(wěn)定計(jì)算的常數(shù)。我們使用的標(biāo)準(zhǔn)數(shù)據(jù)集包含了多種不同場(chǎng)景的低光照?qǐng)D像,如室內(nèi)暗光環(huán)境、夜晚室外場(chǎng)景等。在實(shí)驗(yàn)中,將傳統(tǒng)方法應(yīng)用于數(shù)據(jù)集中的圖像,并計(jì)算增強(qiáng)圖像與原始圖像之間的PSNR和SSIM值。實(shí)驗(yàn)結(jié)果如下表所示:增強(qiáng)方法PSNR(dB)SSIM直方圖均衡化20.560.65CLAHE22.340.72SSR21.250.68MSR23.120.75從表中數(shù)據(jù)可以看出,在PSNR指標(biāo)方面,MSR算法表現(xiàn)最佳,其PSNR值達(dá)到了23.12dB,表明MSR算法在減少圖像失真方面具有一定優(yōu)勢(shì)。CLAHE和SSR的PSNR值也相對(duì)較高,分別為22.34dB和21.25dB,而直方圖均衡化的PSNR值相對(duì)較低,為20.56dB,說(shuō)明直方圖均衡化在處理低光照?qǐng)D像時(shí),可能會(huì)引入較多的失真。在SSIM指標(biāo)方面,同樣是MSR算法表現(xiàn)最優(yōu),其SSIM值為0.75,說(shuō)明MSR算法增強(qiáng)后的圖像在結(jié)構(gòu)上與原始圖像更為相似,能夠較好地保留圖像的結(jié)構(gòu)信息。CLAHE的SSIM值為0.72,SSR的SSIM值為0.68,直方圖均衡化的SSIM值為0.65,這表明CLAHE和SSR在保持圖像結(jié)構(gòu)相似性方面也有一定的能力,但相對(duì)MSR稍遜一籌,而直方圖均衡化在這方面的表現(xiàn)則相對(duì)較差。3.3.2主觀視覺(jué)效果分析除了客觀指標(biāo)評(píng)估,我們還通過(guò)人眼觀察和對(duì)比,對(duì)傳統(tǒng)方法在增強(qiáng)圖像時(shí)的主觀視覺(jué)效果進(jìn)行分析。在實(shí)際應(yīng)用中,人眼的視覺(jué)感受對(duì)于圖像質(zhì)量的評(píng)價(jià)具有重要意義,因此主觀視覺(jué)效果分析能夠更直觀地反映傳統(tǒng)方法的性能和局限性。通過(guò)對(duì)標(biāo)準(zhǔn)數(shù)據(jù)集的圖像進(jìn)行傳統(tǒng)方法增強(qiáng)后,我們發(fā)現(xiàn)直方圖均衡化在增強(qiáng)圖像對(duì)比度方面有一定效果,但容易出現(xiàn)過(guò)度增強(qiáng)的問(wèn)題。在一些低光照?qǐng)D像中,直方圖均衡化后的圖像亮部區(qū)域過(guò)度曝光,細(xì)節(jié)丟失嚴(yán)重,同時(shí)暗部區(qū)域的噪聲也被明顯放大,導(dǎo)致圖像整體質(zhì)量下降。在一幅夜晚拍攝的城市街道低光照?qǐng)D像中,直方圖均衡化后的圖像中,路燈周?chē)膮^(qū)域變得非常亮,幾乎看不到任何細(xì)節(jié),而街道暗處的噪聲則變得更加明顯,使得圖像的視覺(jué)效果不佳。CLAHE雖然在一定程度上解決了直方圖均衡化的過(guò)度增強(qiáng)問(wèn)題,能夠更好地保留圖像的細(xì)節(jié)信息,但在處理某些圖像時(shí),仍然會(huì)出現(xiàn)一些不理想的情況。當(dāng)圖像中存在局部對(duì)比度差異較大的區(qū)域時(shí),CLAHE可能會(huì)導(dǎo)致這些區(qū)域的過(guò)渡不自然,出現(xiàn)明顯的塊狀效應(yīng)。在一幅室內(nèi)場(chǎng)景圖像中,由于部分區(qū)域受到窗戶(hù)光線的照射,而其他區(qū)域處于陰影中,CLAHE增強(qiáng)后的圖像在光照區(qū)域和陰影區(qū)域的交界處出現(xiàn)了明顯的塊狀邊界,影響了圖像的整體美觀度。SSR算法在提升圖像亮度和恢復(fù)部分細(xì)節(jié)方面有一定作用,但由于它僅使用一個(gè)尺度的高斯模糊來(lái)估計(jì)光照分量,難以同時(shí)兼顧圖像的局部細(xì)節(jié)和整體特征。在處理包含不同尺度物體和光照條件復(fù)雜的圖像時(shí),SSR算法可能會(huì)導(dǎo)致局部細(xì)節(jié)丟失或增強(qiáng)過(guò)度。在一幅包含遠(yuǎn)景和近景的自然風(fēng)光低光照?qǐng)D像中,SSR算法增強(qiáng)后的圖像中,遠(yuǎn)景部分的細(xì)節(jié)模糊不清,而近景部分的某些區(qū)域則出現(xiàn)了過(guò)度增強(qiáng)的現(xiàn)象,使得圖像的層次感和真實(shí)感不足。MSR算法通過(guò)結(jié)合不同尺度的高斯模糊來(lái)估計(jì)光照分量,在增強(qiáng)圖像細(xì)節(jié)和避免光暈方面具有一定優(yōu)勢(shì),但它也并非完美無(wú)缺。由于MSR算法需要進(jìn)行多次高斯模糊和反射分量計(jì)算,計(jì)算復(fù)雜度相對(duì)較高,處理速度較慢。在一些對(duì)實(shí)時(shí)性要求較高的應(yīng)用場(chǎng)景中,如實(shí)時(shí)監(jiān)控系統(tǒng),MSR算法的處理速度可能無(wú)法滿(mǎn)足需求。MSR算法的參數(shù)設(shè)置,如尺度的選擇和加權(quán)系數(shù)的調(diào)整,對(duì)增強(qiáng)效果也有較大影響,需要根據(jù)具體圖像和應(yīng)用需求進(jìn)行優(yōu)化。如果參數(shù)設(shè)置不當(dāng),可能會(huì)導(dǎo)致圖像出現(xiàn)顏色失真或增強(qiáng)效果不佳的問(wèn)題。在處理一幅低光照的人物圖像時(shí),如果MSR算法的尺度參數(shù)選擇不合適,可能會(huì)使人物的膚色出現(xiàn)明顯的失真,影響圖像的視覺(jué)效果。綜上所述,傳統(tǒng)的低光照?qǐng)D像增強(qiáng)方法在不同方面都存在一定的局限性。雖然它們?cè)谀承┖?jiǎn)單場(chǎng)景下能夠取得一定的增強(qiáng)效果,但在面對(duì)復(fù)雜的低光照環(huán)境和多樣化的圖像內(nèi)容時(shí),難以滿(mǎn)足對(duì)圖像質(zhì)量的高要求。這也為我們進(jìn)一步研究和改進(jìn)低光照?qǐng)D像增強(qiáng)方法提供了方向和動(dòng)力。四、基于深度學(xué)習(xí)的低光照?qǐng)D像增強(qiáng)方法4.1基于CNN的端到端學(xué)習(xí)方法4.1.1LLNetLLNet(Low-LightImageEnhancementusingDeepLearning)是一種較早應(yīng)用深度學(xué)習(xí)技術(shù)進(jìn)行低光照?qǐng)D像增強(qiáng)的方法,其核心思想是利用堆疊稀疏去噪自編碼器(StackedSparseDenoisingAutoencoders,SSDA)來(lái)同時(shí)學(xué)習(xí)對(duì)比度增強(qiáng)和去噪,從而實(shí)現(xiàn)對(duì)低光照?qǐng)D像的有效增強(qiáng)。在低光照環(huán)境下,圖像不僅亮度低、對(duì)比度差,還常常受到噪聲的干擾,嚴(yán)重影響圖像的質(zhì)量和視覺(jué)效果。傳統(tǒng)的圖像增強(qiáng)方法在處理這些復(fù)雜問(wèn)題時(shí)往往存在局限性,難以同時(shí)兼顧對(duì)比度增強(qiáng)和去噪的效果。LLNet的提出為解決這些問(wèn)題提供了新的思路。LLNet的網(wǎng)絡(luò)結(jié)構(gòu)基于堆疊稀疏去噪自編碼器構(gòu)建。自編碼器是一種無(wú)監(jiān)督學(xué)習(xí)模型,由編碼器和解碼器組成。編碼器將輸入數(shù)據(jù)映射到低維表示,解碼器則根據(jù)低維表示重構(gòu)出原始數(shù)據(jù)。通過(guò)訓(xùn)練自編碼器,使其能夠?qū)W習(xí)到數(shù)據(jù)的內(nèi)在特征和結(jié)構(gòu),從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的降維、特征提取和重構(gòu)。而堆疊稀疏去噪自編碼器則是在自編碼器的基礎(chǔ)上,通過(guò)堆疊多個(gè)自編碼器層,并在訓(xùn)練過(guò)程中加入噪聲,使得模型能夠?qū)W習(xí)到更魯棒的特征表示,同時(shí)具備去噪的能力。在LLNet中,通過(guò)合成數(shù)據(jù)來(lái)模擬低光環(huán)境進(jìn)行訓(xùn)練。具體來(lái)說(shuō),使用從互聯(lián)網(wǎng)數(shù)據(jù)庫(kù)獲得的圖像,然后對(duì)這些圖像進(jìn)行非線性變暗并添加高斯噪聲處理,以生成模擬低光照條件的訓(xùn)練樣本。這種方法解決了收集大量自然弱光圖像及其照明良好對(duì)應(yīng)物的困難,同時(shí)也能夠讓模型學(xué)習(xí)到不同程度低光照和噪聲情況下的圖像特征。LLNet主要有以下優(yōu)勢(shì):同時(shí)實(shí)現(xiàn)對(duì)比度增強(qiáng)和去噪:利用堆疊稀疏去噪自編碼器的特性,LLNet能夠在學(xué)習(xí)過(guò)程中同時(shí)對(duì)低光照?qǐng)D像進(jìn)行對(duì)比度增強(qiáng)和去噪處理。在一些低光照且?guī)в性肼暤膱D像中,LLNet可以有效地提升圖像的對(duì)比度,使圖像中的物體和細(xì)節(jié)更加清晰,同時(shí)降低噪聲的干擾,提高圖像的質(zhì)量。數(shù)據(jù)生成方法的創(chuàng)新性:提出的通過(guò)合成數(shù)據(jù)來(lái)模擬低光環(huán)境的訓(xùn)練數(shù)據(jù)生成方法具有創(chuàng)新性。這種方法不僅解決了實(shí)際中獲取大量低光照?qǐng)D像及其對(duì)應(yīng)正常光照?qǐng)D像的困難,而且通過(guò)對(duì)圖像進(jìn)行多樣化的處理,增加了訓(xùn)練數(shù)據(jù)的多樣性,有助于提高模型的泛化能力。通過(guò)對(duì)不同場(chǎng)景、不同內(nèi)容的圖像進(jìn)行非線性變暗和添加不同強(qiáng)度的高斯噪聲處理,使模型能夠?qū)W習(xí)到更廣泛的低光照?qǐng)D像特征,從而在面對(duì)各種實(shí)際低光照?qǐng)D像時(shí)都能有較好的表現(xiàn)。然而,LLNet也存在一些不足之處:計(jì)算復(fù)雜度較高:由于采用了堆疊稀疏去噪自編碼器結(jié)構(gòu),網(wǎng)絡(luò)層數(shù)較多,參數(shù)數(shù)量較大,導(dǎo)致計(jì)算復(fù)雜度較高。在處理大規(guī)模圖像數(shù)據(jù)集或?qū)?shí)時(shí)性要求較高的應(yīng)用場(chǎng)景中,可能會(huì)受到計(jì)算資源和時(shí)間的限制。在一些需要實(shí)時(shí)處理大量低光照?qǐng)D像的安防監(jiān)控系統(tǒng)中,LLNet的計(jì)算速度可能無(wú)法滿(mǎn)足實(shí)時(shí)性的要求。對(duì)合成數(shù)據(jù)的依賴(lài):訓(xùn)練過(guò)程主要依賴(lài)于合成數(shù)據(jù),雖然合成數(shù)據(jù)能夠模擬低光照環(huán)境,但與真實(shí)的低光照?qǐng)D像仍存在一定的差異。這可能導(dǎo)致模型在面對(duì)真實(shí)場(chǎng)景中的復(fù)雜低光照情況時(shí),泛化能力不足,增強(qiáng)效果不理想。在一些特殊的真實(shí)低光照?qǐng)鼍爸?,如極端低光照或光照分布非常不均勻的環(huán)境下,LLNet的增強(qiáng)效果可能會(huì)受到影響。4.1.2MSR-netMSR-net(Multi-ScaleRetinexConvolutionalNeuralNetwork)是一種將深度學(xué)習(xí)與多尺度Retinex理論相結(jié)合的低光照?qǐng)D像增強(qiáng)方法,它仿照多尺度Retinex(MSR)的流程,提出了一種端到端的映射網(wǎng)絡(luò),直接學(xué)習(xí)暗圖像到亮圖像的轉(zhuǎn)換。傳統(tǒng)的多尺度Retinex方法在低光照?qǐng)D像增強(qiáng)中取得了一定的效果,但它存在一些局限性,如計(jì)算復(fù)雜度較高、對(duì)參數(shù)的選擇較為敏感等。MSR-net的出現(xiàn)旨在利用深度學(xué)習(xí)的強(qiáng)大學(xué)習(xí)能力,克服傳統(tǒng)方法的不足,實(shí)現(xiàn)更高效、更準(zhǔn)確的低光照?qǐng)D像增強(qiáng)。MSR-net的網(wǎng)絡(luò)結(jié)構(gòu)主要包括三個(gè)模塊:多尺度對(duì)數(shù)變換、卷積差分和顏色恢復(fù)。多尺度對(duì)數(shù)變換模塊對(duì)輸入的低光照?qǐng)D像進(jìn)行多尺度的對(duì)數(shù)變換,將圖像從空間域轉(zhuǎn)換到對(duì)數(shù)域,以便更好地分離圖像的光照分量和反射分量。卷積差分模塊通過(guò)卷積操作對(duì)對(duì)數(shù)變換后的圖像進(jìn)行處理,計(jì)算不同尺度下的光照分量和反射分量的差值,從而突出圖像的細(xì)節(jié)和特征。顏色恢復(fù)模塊則根據(jù)前面得到的結(jié)果,對(duì)圖像進(jìn)行顏色校正和恢復(fù),使增強(qiáng)后的圖像顏色更加自然、準(zhǔn)確。在訓(xùn)練過(guò)程中,MSR-net使用了用PS調(diào)整過(guò)的高質(zhì)量圖像和對(duì)應(yīng)的合成低光照?qǐng)D像(隨機(jī)減少亮度、對(duì)比度,伽馬校正)作為訓(xùn)練數(shù)據(jù)。損失函數(shù)采用帶正則項(xiàng)的誤差矩陣的F-范數(shù)平方,即誤差平方和,通過(guò)最小化損失函數(shù)來(lái)調(diào)整網(wǎng)絡(luò)的參數(shù),使網(wǎng)絡(luò)能夠?qū)W習(xí)到從低光照?qǐng)D像到增強(qiáng)圖像的準(zhǔn)確映射。MSR-net在圖像增強(qiáng)中展現(xiàn)出了良好的效果:端到端的映射學(xué)習(xí):通過(guò)構(gòu)建端到端的網(wǎng)絡(luò)結(jié)構(gòu),MSR-net能夠直接學(xué)習(xí)低光照?qǐng)D像到增強(qiáng)圖像的映射關(guān)系,無(wú)需復(fù)雜的人工特征提取和參數(shù)調(diào)整過(guò)程。這種學(xué)習(xí)方式使得模型能夠自動(dòng)適應(yīng)不同的低光照?qǐng)鼍?,提高了圖像增強(qiáng)的效率和準(zhǔn)確性。在不同光照條件下的低光照?qǐng)D像上,MSR-net都能夠快速準(zhǔn)確地生成增強(qiáng)后的圖像,增強(qiáng)效果明顯。結(jié)合多尺度Retinex理論:借鑒多尺度Retinex理論,MSR-net能夠有效地分離圖像的光照分量和反射分量,從而在增強(qiáng)圖像的同時(shí),更好地保留圖像的細(xì)節(jié)和顏色信息。在處理包含豐富細(xì)節(jié)和復(fù)雜光照的圖像時(shí),MSR-net能夠清晰地展現(xiàn)出物體的輪廓和紋理,并且圖像的顏色還原度較高,視覺(jué)效果自然。為了更直觀地展示MSR-net的增強(qiáng)效果,我們進(jìn)行了一系列實(shí)驗(yàn)。在實(shí)驗(yàn)中,選取了不同場(chǎng)景的低光照?qǐng)D像,包括室內(nèi)暗光環(huán)境、夜晚室外場(chǎng)景等。將這些圖像輸入到MSR-net模型中進(jìn)行增強(qiáng)處理,并與傳統(tǒng)的多尺度Retinex方法以及其他一些基于深度學(xué)習(xí)的低光照?qǐng)D像增強(qiáng)方法進(jìn)行對(duì)比。從實(shí)驗(yàn)結(jié)果可以看出,MSR-net在提升圖像亮度和對(duì)比度方面表現(xiàn)出色。在低光照的室內(nèi)場(chǎng)景圖像中,MSR-net增強(qiáng)后的圖像亮度明顯提高,原本模糊的家具、墻壁等物體變得清晰可見(jiàn),對(duì)比度增強(qiáng)使得圖像的層次感更加豐富。在夜晚室外場(chǎng)景圖像中,MSR-net能夠有效地增強(qiáng)路燈、建筑物等物體的亮度,同時(shí)保留了圖像的細(xì)節(jié),如建筑物的紋理、道路的標(biāo)識(shí)等。與傳統(tǒng)的多尺度Retinex方法相比,MSR-net的增強(qiáng)效果更加穩(wěn)定,避免了傳統(tǒng)方法中可能出現(xiàn)的光暈、噪聲放大等問(wèn)題。與其他基于深度學(xué)習(xí)的方法相比,MSR-net在顏色還原和細(xì)節(jié)保留方面具有一定的優(yōu)勢(shì),增強(qiáng)后的圖像更加真實(shí)、自然。然而,MSR-net也并非完美無(wú)缺。由于其網(wǎng)絡(luò)結(jié)構(gòu)相對(duì)復(fù)雜,模型的訓(xùn)練時(shí)間較長(zhǎng),對(duì)計(jì)算資源的要求較高。在處理大規(guī)模數(shù)據(jù)集或?qū)?shí)時(shí)性要求較高的應(yīng)用場(chǎng)景中,可能會(huì)受到一定的限制。MSR-net在某些極端低光照條件下,或者圖像中存在復(fù)雜噪聲和干擾的情況下,增強(qiáng)效果可能會(huì)受到一定的影響。4.2基于生成對(duì)抗網(wǎng)絡(luò)(GAN)的方法4.2.1EnlightenGANEnlightenGAN是一種具有創(chuàng)新性的基于生成對(duì)抗網(wǎng)絡(luò)的低光照?qǐng)D像增強(qiáng)方法,它在解決低光照?qǐng)D像增強(qiáng)問(wèn)題上取得了顯著的進(jìn)展。與傳統(tǒng)的基于深度學(xué)習(xí)的圖像增強(qiáng)方法不同,EnlightenGAN不需要配對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,這在很大程度上解決了實(shí)際應(yīng)用中獲取大量配對(duì)低光照和正常光照?qǐng)D像的困難。它通過(guò)獨(dú)特的網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練策略,能夠有效地利用未配對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,從而提高模型的泛化能力,使其在多種場(chǎng)景下都能表現(xiàn)出良好的圖像增強(qiáng)效果。EnlightenGAN的核心架構(gòu)由生成器和全局-局部判別器組成。生成器采用了引入自注意力機(jī)制的U-Net結(jié)構(gòu)。U-Net是一種經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),它在圖像分割等任務(wù)中表現(xiàn)出色,其特點(diǎn)是具有對(duì)稱(chēng)的編碼器-解碼器結(jié)構(gòu),中間通過(guò)跳躍連接(skipconnection)將編碼器和解碼器的對(duì)應(yīng)層連接起來(lái),這種結(jié)構(gòu)有助于保留圖像的細(xì)節(jié)信息。在EnlightenGAN的生成器中,自注意力機(jī)制的引入進(jìn)一步增強(qiáng)了模型對(duì)圖像中不同區(qū)域的關(guān)注能力。自注意力機(jī)制能夠根據(jù)圖像中不同位置的特征相關(guān)性,動(dòng)態(tài)地分配注意力權(quán)重,使得模型能夠更加關(guān)注圖像中光照較弱的區(qū)域,從而有針對(duì)性地進(jìn)行增強(qiáng)。具體來(lái)說(shuō),自注意力圖的生成方式是將輸入的RGB圖像的照度通道I歸一化到[0,1],然后通過(guò)運(yùn)算1-I(逐元素作差)得到注意力圖??梢岳斫鉃椋瑢?duì)于光照越弱的地方,注意力越強(qiáng)。由于網(wǎng)絡(luò)中得到的每個(gè)特征圖大小都不一樣,所以將注意力圖resize為各中間特征圖對(duì)應(yīng)的大小,然后對(duì)應(yīng)相乘,最后得到輸出圖像。整個(gè)U-Net由8個(gè)卷積塊組成,每個(gè)卷積塊由兩個(gè)3??3的卷積層組成,卷積層后都連接一個(gè)BN(BatchNormalization)層和一個(gè)LeakRelu層。這里不使用傳統(tǒng)的Relu函數(shù),是因?yàn)镽elu函數(shù)得到的稀疏網(wǎng)絡(luò)不利于GAN的穩(wěn)定性,而LeakRelu函數(shù)在保持非線性特性的同時(shí),能夠避免神經(jīng)元死亡的問(wèn)題,使得網(wǎng)絡(luò)在訓(xùn)練過(guò)程中更加穩(wěn)定。為了減小棋盤(pán)效應(yīng),作者用一個(gè)雙線性上采樣層加一個(gè)卷積層來(lái)代替原本的標(biāo)準(zhǔn)反卷積層,棋盤(pán)效應(yīng)是在使用反卷積進(jìn)行上采樣時(shí)常見(jiàn)的問(wèn)題,表現(xiàn)為生成的圖像中出現(xiàn)棋盤(pán)狀的偽影,通過(guò)這種改進(jìn)可以有效減少這種現(xiàn)象,提高生成圖像的質(zhì)量。全局-局部判別器結(jié)構(gòu)是EnlightenGAN的另一個(gè)重要?jiǎng)?chuàng)新點(diǎn)。判別器的作用是判斷輸入的圖像是真實(shí)的正常光照?qǐng)D像還是由生成器生成的增強(qiáng)圖像。傳統(tǒng)的判別器通常只從全局角度對(duì)圖像進(jìn)行判斷,而EnlightenGAN的全局-局部判別器則結(jié)合了全局和局部的信息。全局判別器對(duì)整個(gè)圖像進(jìn)行判斷,關(guān)注圖像的整體特征和分布;局部判別器則將圖像劃分為多個(gè)局部區(qū)域,對(duì)每個(gè)局部區(qū)域進(jìn)行單獨(dú)判斷,這樣可以更好地捕捉圖像中局部的光照變化和細(xì)節(jié)信息。通過(guò)這種全局-局部的判別方式,模型能夠?qū)υ诳臻g不同光條件下的圖像都表現(xiàn)出良好的判斷能力,從而促使生成器生成更符合實(shí)際情況的增強(qiáng)圖像。在損失函數(shù)方面,EnlightenGAN采用了多種損失函數(shù)來(lái)指導(dǎo)模型的訓(xùn)練,以確保生成器能夠生成高質(zhì)量的增強(qiáng)圖像。標(biāo)準(zhǔn)GAN損失函數(shù):生成器和判別器的對(duì)抗訓(xùn)練基于標(biāo)準(zhǔn)GAN的損失函數(shù)。生成器的目標(biāo)是生成逼真的增強(qiáng)圖像,使得判別器難以區(qū)分生成圖像和真實(shí)圖像,其損失函數(shù)旨在最小化生成圖像被判別為假的概率;判別器的目標(biāo)是準(zhǔn)確地區(qū)分真實(shí)圖像和生成圖像,其損失函數(shù)旨在最大化對(duì)真實(shí)圖像判斷為真和對(duì)生成圖像判斷為假的概率。自特征保留損失(SelfFeaturePreservingLoss):為了彌補(bǔ)模型缺乏配對(duì)數(shù)據(jù)監(jiān)督的缺點(diǎn),EnlightenGAN引入了自特征保留損失。該損失通過(guò)比較生成圖像和原始低光照?qǐng)D像在經(jīng)過(guò)VGG(VisualGeometryGroup)網(wǎng)絡(luò)提取特征后的差異來(lái)實(shí)現(xiàn)。VGG網(wǎng)絡(luò)是一種在圖像特征提取方面表現(xiàn)出色的卷積神經(jīng)網(wǎng)絡(luò),通過(guò)計(jì)算生成圖像和原始圖像在VGG網(wǎng)絡(luò)不同層的特征差異,并將這些差異作為損失函數(shù)的一部分,可以使得生成器在增強(qiáng)圖像的同時(shí),盡可能保留原始圖像的特征信息,避免過(guò)度增強(qiáng)導(dǎo)致圖像失真。最終的損失:EnlightenGAN的最終損失是由生成器和判別器的損失以及自特征保留損失等多個(gè)損失項(xiàng)加權(quán)求和得到的。通過(guò)合理調(diào)整各個(gè)損失項(xiàng)的權(quán)重,可以平衡模型在不同方面的性能,使得生成器能夠生成既具有良好視覺(jué)效果又保留原始圖像特征的增強(qiáng)圖像。通過(guò)上述的網(wǎng)絡(luò)結(jié)構(gòu)和損失函數(shù)設(shè)計(jì),EnlightenGAN在低光照?qǐng)D像增強(qiáng)任務(wù)中取得了優(yōu)異的效果。在多種場(chǎng)景的低光照?qǐng)D像上,EnlightenGAN都能夠有效地提升圖像的亮度和對(duì)比度,同時(shí)保持圖像的自然度和真實(shí)性。在夜晚城市街道的低光照?qǐng)D像中,EnlightenGAN可以清晰地展現(xiàn)出建筑物的輪廓、路燈的光芒以及街道上的車(chē)輛和行人等細(xì)節(jié),生成的增強(qiáng)圖像在視覺(jué)效果上與真實(shí)的正常光照?qǐng)D像非常接近,且在客觀指標(biāo)評(píng)估中也表現(xiàn)出了較高的性能。4.2.2其他基于GAN的改進(jìn)方法除了EnlightenGAN,許多研究人員還對(duì)基于GAN的低光照?qǐng)D像增強(qiáng)方法進(jìn)行了各種改進(jìn),主要集中在損失函數(shù)和網(wǎng)絡(luò)結(jié)構(gòu)方面,以進(jìn)一步提升圖像增強(qiáng)的效果和模型的性能。在損失函數(shù)改進(jìn)方面,一些方法引入了新的損失項(xiàng)來(lái)更好地約束生成器的生成過(guò)程。除了傳統(tǒng)的對(duì)抗損失和像素?fù)p失外,還引入了感知損失和結(jié)構(gòu)損失。感知損失通過(guò)比較生成圖像和真實(shí)圖像在預(yù)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)(如VGG網(wǎng)絡(luò))特征空間中的距離,來(lái)衡量生成圖像的感知質(zhì)量。結(jié)構(gòu)損失則關(guān)注圖像的結(jié)構(gòu)信息,通過(guò)計(jì)算圖像的結(jié)構(gòu)相似性(SSIM)等指標(biāo),使生成圖像在結(jié)構(gòu)上更接近真實(shí)圖像。具體來(lái)說(shuō),感知損失的計(jì)算基于預(yù)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò),如VGG16。將生成圖像和真實(shí)圖像分別輸入到VGG16網(wǎng)絡(luò)中,提取網(wǎng)絡(luò)中特定層的特征圖,然后計(jì)算這些特征圖之間的歐氏距離或其他距離度量作為感知損失。由于VGG網(wǎng)絡(luò)在大規(guī)模圖像數(shù)據(jù)集上進(jìn)行了預(yù)訓(xùn)練,能夠提取到圖像的高級(jí)語(yǔ)義特征,因此感知損失可以從語(yǔ)義層面約束生成器,使得生成的增強(qiáng)圖像在視覺(jué)上更接近真實(shí)圖像。在處理低光照的人臉圖像時(shí),感知損失可以確保生成的增強(qiáng)圖像中人臉的五官結(jié)構(gòu)、表情等特征與真實(shí)人臉相似,避免出現(xiàn)五官變形、表情不自然等問(wèn)題。結(jié)構(gòu)損失則側(cè)重于保持圖像的結(jié)構(gòu)信息。以SSIM損失為例,它通過(guò)計(jì)算生成圖像和真實(shí)圖像的結(jié)構(gòu)相似性指數(shù)來(lái)衡量?jī)烧咧g的結(jié)構(gòu)差異。SSIM考慮了圖像的亮度、對(duì)比度和結(jié)構(gòu)三個(gè)方面的信息,能夠更全面地反映圖像的結(jié)構(gòu)特征。在計(jì)算SSIM損失時(shí),將生成圖像和真實(shí)圖像劃分為多個(gè)局部區(qū)域,分別計(jì)算每個(gè)區(qū)域的SSIM值,然后對(duì)這些值進(jìn)行加權(quán)平均得到總的SSIM損失。通過(guò)最小化SSIM損失,生成器可以生成在結(jié)構(gòu)上與真實(shí)圖像高度相似的增強(qiáng)圖像,有效地保留圖像的細(xì)節(jié)和紋理信息。在處理包含復(fù)雜紋理的低光照?qǐng)D像時(shí),結(jié)構(gòu)損失可以使生成的增強(qiáng)圖像中的紋理更加清晰、自然,避免出現(xiàn)紋理模糊或丟失的情況。在網(wǎng)絡(luò)結(jié)構(gòu)改進(jìn)方面,一些方法嘗試設(shè)計(jì)更復(fù)雜、更有效的網(wǎng)絡(luò)架構(gòu)來(lái)提高模型的性能。有的方法在生成器中引入了多尺度特征融合機(jī)制,通過(guò)融合不同尺
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 流引產(chǎn)課件教學(xué)課件
- 養(yǎng)老護(hù)理員服裝規(guī)范與更換技巧
- 2024-2025學(xué)年山西省呂梁市高一上學(xué)期期末考試歷史試題(解析版)
- 2024-2025學(xué)年山東省濟(jì)寧市兗州區(qū)高一下學(xué)期期中考試歷史試題(解析版)
- 2026年哲學(xué)思想史及重要理論考試題集
- 2026年國(guó)際漢語(yǔ)教師專(zhuān)業(yè)水平測(cè)試題目
- 2026年數(shù)據(jù)分析師實(shí)戰(zhàn)技能提升題集
- 2026年環(huán)境科學(xué)知識(shí)要點(diǎn)與筆試試題集詳解
- 2026年司法考試法理學(xué)與憲法精講模擬題
- 2026年高中生物競(jìng)賽生物化學(xué)基礎(chǔ)知識(shí)題庫(kù)
- 客戶(hù)開(kāi)發(fā)流程圖
- 音樂(lè)節(jié)活動(dòng)場(chǎng)地租賃合同
- 鋼琴樂(lè)理知識(shí)考試題庫(kù)200題(含答案)
- 風(fēng)險(xiǎn)管理顧問(wèn)協(xié)議
- 一年級(jí)下冊(cè)字帖筆順
- 2024屆高考語(yǔ)文復(fù)習(xí):散文訓(xùn)練王劍冰散文(含解析)
- SWITCH暗黑破壞神3超級(jí)金手指修改 版本號(hào):2.7.7.92380
- 二尖瓣狹窄講課課件
- 除銹劑MSDS參考資料
- 腸造瘺術(shù)后護(hù)理查房
- GB/T 9126.1-2023管法蘭用非金屬平墊片第1部分:PN系列
評(píng)論
0/150
提交評(píng)論