基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià):方法探索與拓展_第1頁
基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià):方法探索與拓展_第2頁
基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià):方法探索與拓展_第3頁
基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià):方法探索與拓展_第4頁
基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià):方法探索與拓展_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià):方法探索與拓展一、引言1.1研究背景與意義在當(dāng)今數(shù)字化信息時(shí)代,圖像作為一種重要的信息載體,廣泛應(yīng)用于各個(gè)領(lǐng)域,如計(jì)算機(jī)視覺、醫(yī)學(xué)成像、遙感、多媒體通信等。隨著成像技術(shù)的不斷發(fā)展和圖像數(shù)據(jù)量的爆炸式增長(zhǎng),對(duì)圖像質(zhì)量的評(píng)估變得愈發(fā)重要。圖像質(zhì)量評(píng)價(jià)(ImageQualityAssessment,IQA)旨在建立一種客觀的度量標(biāo)準(zhǔn),以衡量圖像在視覺感知、信息完整性等方面的優(yōu)劣程度,為圖像采集、處理、傳輸和存儲(chǔ)等環(huán)節(jié)提供重要的決策依據(jù)。在實(shí)際應(yīng)用中,由于成像系統(tǒng)的不完善、傳輸過程中的噪聲干擾、壓縮算法的失真等因素,圖像往往會(huì)出現(xiàn)不同程度的降質(zhì),這不僅影響了圖像的視覺效果,還可能對(duì)后續(xù)的圖像分析和處理任務(wù)造成負(fù)面影響。例如,在醫(yī)學(xué)診斷中,低質(zhì)量的醫(yī)學(xué)圖像可能導(dǎo)致誤診或漏診;在遙感監(jiān)測(cè)中,模糊或失真的圖像會(huì)降低對(duì)目標(biāo)物體的識(shí)別精度;在視頻通信中,圖像質(zhì)量的下降會(huì)影響用戶的觀看體驗(yàn)。因此,準(zhǔn)確、高效地評(píng)價(jià)圖像質(zhì)量對(duì)于保障圖像相關(guān)應(yīng)用的可靠性和有效性具有至關(guān)重要的意義。傳統(tǒng)的圖像質(zhì)量評(píng)價(jià)方法主要分為基于像素誤差的方法和基于結(jié)構(gòu)相似性的方法?;谙袼卣`差的方法,如均方誤差(MeanSquaredError,MSE)和峰值信噪比(PeakSignal-to-NoiseRatio,PSNR),通過計(jì)算參考圖像和待評(píng)價(jià)圖像之間的像素差異來衡量圖像質(zhì)量,雖然計(jì)算簡(jiǎn)單,但由于沒有考慮人類視覺系統(tǒng)(HumanVisualSystem,HVS)的特性,其評(píng)價(jià)結(jié)果與人類主觀感知的一致性較差?;诮Y(jié)構(gòu)相似性的方法,如結(jié)構(gòu)相似性指數(shù)(StructuralSimilarityIndex,SSIM),從圖像的結(jié)構(gòu)信息出發(fā),考慮了圖像的亮度、對(duì)比度和結(jié)構(gòu)等因素,在一定程度上提高了與人類主觀評(píng)價(jià)的相關(guān)性,但對(duì)于彩色圖像的評(píng)價(jià),仍然存在一些局限性。彩色圖像包含豐富的顏色信息,傳統(tǒng)的圖像質(zhì)量評(píng)價(jià)方法在處理彩色圖像時(shí),通常將彩色圖像分解為多個(gè)分量(如RGB分量),然后分別對(duì)每個(gè)分量進(jìn)行評(píng)價(jià),最后再將各個(gè)分量的評(píng)價(jià)結(jié)果進(jìn)行融合。這種方法忽略了彩色圖像各分量之間的內(nèi)在聯(lián)系,無法充分利用彩色圖像的顏色信息,導(dǎo)致評(píng)價(jià)結(jié)果不夠準(zhǔn)確。此外,彩色圖像在傳輸和處理過程中,不僅會(huì)出現(xiàn)亮度和對(duì)比度的變化,還可能發(fā)生顏色失真,而傳統(tǒng)方法對(duì)顏色失真的敏感度較低,難以準(zhǔn)確評(píng)估彩色圖像的質(zhì)量。四元數(shù)作為一種擴(kuò)展復(fù)數(shù)的數(shù)學(xué)工具,具有獨(dú)特的代數(shù)結(jié)構(gòu)和幾何性質(zhì),能夠自然地表示三維空間中的旋轉(zhuǎn)和變換,在圖像處理領(lǐng)域展現(xiàn)出了潛在的優(yōu)勢(shì)。將四元數(shù)引入彩色圖像質(zhì)量評(píng)價(jià)中,可以充分利用四元數(shù)的特性,有效地整合彩色圖像的顏色信息和結(jié)構(gòu)信息,為彩色圖像質(zhì)量評(píng)價(jià)提供一種新的思路和方法。與傳統(tǒng)的彩色圖像質(zhì)量評(píng)價(jià)方法相比,基于四元數(shù)的方法能夠更好地保留彩色圖像的顏色結(jié)構(gòu)和空間信息,提高評(píng)價(jià)結(jié)果與人類主觀感知的一致性,具有更高的準(zhǔn)確性和可靠性。綜上所述,研究四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法具有重要的理論意義和實(shí)際應(yīng)用價(jià)值。在理論方面,四元數(shù)的引入為彩色圖像質(zhì)量評(píng)價(jià)提供了新的數(shù)學(xué)模型和分析方法,有助于深入理解彩色圖像的質(zhì)量特性和人類視覺系統(tǒng)的感知機(jī)制,豐富和完善圖像質(zhì)量評(píng)價(jià)的理論體系。在實(shí)際應(yīng)用方面,基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià)方法能夠更準(zhǔn)確地評(píng)估彩色圖像的質(zhì)量,為圖像采集、處理、傳輸和存儲(chǔ)等環(huán)節(jié)提供可靠的質(zhì)量反饋,從而提高圖像相關(guān)應(yīng)用的性能和用戶體驗(yàn),在醫(yī)學(xué)、遙感、通信、多媒體等領(lǐng)域具有廣闊的應(yīng)用前景。1.2國(guó)內(nèi)外研究現(xiàn)狀隨著圖像處理技術(shù)的不斷發(fā)展,彩色圖像質(zhì)量評(píng)價(jià)作為其中的關(guān)鍵環(huán)節(jié),受到了國(guó)內(nèi)外學(xué)者的廣泛關(guān)注。傳統(tǒng)的彩色圖像質(zhì)量評(píng)價(jià)方法在處理顏色信息和結(jié)構(gòu)信息時(shí)存在一定的局限性,而四元數(shù)的引入為彩色圖像質(zhì)量評(píng)價(jià)提供了新的思路和方法,近年來成為了研究的熱點(diǎn)。在國(guó)外,一些學(xué)者較早地開始了對(duì)四元數(shù)在圖像處理領(lǐng)域應(yīng)用的研究。[具體研究者]等人將四元數(shù)用于彩色圖像的表示,通過將彩色圖像的RGB三個(gè)通道分別映射到四元數(shù)的三個(gè)虛部,實(shí)現(xiàn)了彩色圖像的四元數(shù)表示,并在此基礎(chǔ)上進(jìn)行了圖像增強(qiáng)和邊緣檢測(cè)等操作,取得了較好的效果。在彩色圖像質(zhì)量評(píng)價(jià)方面,[具體研究者]提出了一種基于四元數(shù)奇異值分解的彩色圖像質(zhì)量評(píng)價(jià)方法。該方法將彩色圖像表示為四元數(shù)矩陣,通過對(duì)四元數(shù)矩陣進(jìn)行奇異值分解,得到圖像的奇異值特征向量,然后計(jì)算參考圖像和失真圖像的奇異值特征向量之間的距離來度量圖像的質(zhì)量。實(shí)驗(yàn)結(jié)果表明,該方法在一定程度上提高了與人類主觀評(píng)價(jià)的相關(guān)性。然而,這種方法也存在一些不足之處。一方面,四元數(shù)奇異值分解的計(jì)算復(fù)雜度較高,導(dǎo)致算法的運(yùn)行效率較低,難以滿足實(shí)時(shí)性要求較高的應(yīng)用場(chǎng)景。另一方面,該方法在計(jì)算奇異值特征向量距離時(shí),沒有充分考慮人類視覺系統(tǒng)對(duì)不同頻率成分的敏感度差異,使得評(píng)價(jià)結(jié)果與人類主觀感知的一致性還有提升空間。在國(guó)內(nèi),相關(guān)研究也取得了不少成果。王宇慶等人提出了一種結(jié)合人眼視覺特性與顏色信息的彩色圖像質(zhì)量評(píng)價(jià)方法。該方法將四元數(shù)用于表征彩色圖像的結(jié)構(gòu)信息,四元數(shù)的3個(gè)虛部分別表示彩色圖像的三基色分量,為了突出圖像的細(xì)節(jié)信息對(duì)圖像質(zhì)量的影響,將彩色圖像亮度分量的局部方差作為四元數(shù)的實(shí)部,從而得到了包含彩色圖像結(jié)構(gòu)信息的四元數(shù)矩陣。通過將四元數(shù)運(yùn)算轉(zhuǎn)換為復(fù)數(shù)運(yùn)算,求得四元數(shù)矩陣的奇異值特征向量,通過計(jì)算兩奇異值特征向量夾角的大小度量二者所表征的待測(cè)圖像與參考圖像的結(jié)構(gòu)相似程度,從而實(shí)現(xiàn)了對(duì)待測(cè)圖像的質(zhì)量評(píng)價(jià)。實(shí)驗(yàn)結(jié)果表明,該方法的評(píng)價(jià)結(jié)果優(yōu)于傳統(tǒng)的MSE、PSNR以及SSIM方法,與人的主觀感覺的一致性較好,并且也可以用于評(píng)價(jià)與參考圖像尺寸不相等的待測(cè)圖像的質(zhì)量。但該方法在處理復(fù)雜失真類型的圖像時(shí),評(píng)價(jià)的準(zhǔn)確性還有待提高,對(duì)于一些特殊的圖像內(nèi)容,如具有大面積均勻區(qū)域或高頻細(xì)節(jié)豐富的圖像,評(píng)價(jià)結(jié)果可能會(huì)出現(xiàn)偏差。此外,還有學(xué)者將四元數(shù)與其他技術(shù)相結(jié)合來進(jìn)行彩色圖像質(zhì)量評(píng)價(jià)。例如,[具體研究者]將四元數(shù)與深度學(xué)習(xí)相結(jié)合,提出了一種基于四元數(shù)卷積神經(jīng)網(wǎng)絡(luò)的彩色圖像質(zhì)量評(píng)價(jià)模型。該模型利用四元數(shù)卷積層來處理彩色圖像的四元數(shù)表示,能夠同時(shí)學(xué)習(xí)圖像的顏色信息和空間結(jié)構(gòu)信息,在多個(gè)圖像質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)結(jié)果表明,該模型具有較高的評(píng)價(jià)準(zhǔn)確性和魯棒性。然而,深度學(xué)習(xí)模型通常需要大量的訓(xùn)練數(shù)據(jù)和計(jì)算資源,模型的訓(xùn)練時(shí)間較長(zhǎng),且模型的可解釋性較差,這在一定程度上限制了其實(shí)際應(yīng)用??偟膩碚f,目前基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià)方法在提高評(píng)價(jià)準(zhǔn)確性和與人類主觀感知的一致性方面取得了一定的進(jìn)展,但仍然存在一些問題和挑戰(zhàn)。例如,如何進(jìn)一步降低算法的計(jì)算復(fù)雜度,提高算法的運(yùn)行效率;如何更好地融合人類視覺系統(tǒng)的特性,使評(píng)價(jià)結(jié)果更符合人類的主觀感受;如何增強(qiáng)算法對(duì)不同類型失真圖像的適應(yīng)性和魯棒性等。針對(duì)這些問題,后續(xù)的研究可以從改進(jìn)四元數(shù)的表示方法、優(yōu)化算法的計(jì)算流程、探索新的特征提取和融合方式以及結(jié)合更先進(jìn)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)等方面展開,以推動(dòng)四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法的不斷發(fā)展和完善。1.3研究?jī)?nèi)容與創(chuàng)新點(diǎn)1.3.1研究?jī)?nèi)容本論文圍繞四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法展開深入研究,主要內(nèi)容包括以下幾個(gè)方面:四元數(shù)表示彩色圖像的方法研究:深入分析四元數(shù)的代數(shù)結(jié)構(gòu)和幾何性質(zhì),探究如何將彩色圖像的RGB三個(gè)通道信息有效地映射到四元數(shù)的虛部,構(gòu)建合理的四元數(shù)表示模型。研究不同的映射方式對(duì)彩色圖像信息保留和后續(xù)處理的影響,為基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià)奠定基礎(chǔ)。例如,探索將彩色圖像的亮度分量、色度分量等以不同組合方式融入四元數(shù)表示中,分析哪種方式能更好地體現(xiàn)彩色圖像的視覺特性和結(jié)構(gòu)信息。基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià)指標(biāo)設(shè)計(jì):在四元數(shù)表示彩色圖像的基礎(chǔ)上,結(jié)合人類視覺系統(tǒng)的特性,設(shè)計(jì)新的彩色圖像質(zhì)量評(píng)價(jià)指標(biāo)。從圖像的結(jié)構(gòu)相似性、顏色保真度、視覺顯著性等多個(gè)角度出發(fā),提取四元數(shù)域下的圖像特征,構(gòu)建能夠準(zhǔn)確反映彩色圖像質(zhì)量的評(píng)價(jià)指標(biāo)。例如,利用四元數(shù)的奇異值分解、梯度特征等,計(jì)算參考圖像和失真圖像之間的差異,設(shè)計(jì)出基于四元數(shù)的結(jié)構(gòu)相似性指標(biāo)(QSSIM)、顏色相似性指標(biāo)(QCSIM)等,并研究如何將這些指標(biāo)進(jìn)行合理融合,以提高評(píng)價(jià)結(jié)果與人類主觀感知的一致性。四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法的性能評(píng)估:收集和整理標(biāo)準(zhǔn)的彩色圖像質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù),如LIVE、TID2013等,利用這些數(shù)據(jù)庫(kù)對(duì)所提出的四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法進(jìn)行性能評(píng)估。通過與傳統(tǒng)的彩色圖像質(zhì)量評(píng)價(jià)方法(如MSE、PSNR、SSIM等)進(jìn)行對(duì)比實(shí)驗(yàn),分析所提方法在不同類型失真(如高斯噪聲、JPEG壓縮、模糊等)下的性能表現(xiàn),評(píng)估其在準(zhǔn)確性、魯棒性和計(jì)算效率等方面的優(yōu)勢(shì)和不足。同時(shí),采用主觀評(píng)價(jià)實(shí)驗(yàn),邀請(qǐng)人類觀察者對(duì)圖像質(zhì)量進(jìn)行打分,驗(yàn)證評(píng)價(jià)方法與人類主觀感知的相關(guān)性,進(jìn)一步完善和優(yōu)化評(píng)價(jià)方法。四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法的拓展研究:探索將四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法拓展到其他相關(guān)領(lǐng)域,如視頻質(zhì)量評(píng)價(jià)、圖像壓縮編碼中的質(zhì)量控制等。研究如何將基于四元數(shù)的圖像質(zhì)量評(píng)價(jià)方法應(yīng)用于視頻序列中,考慮視頻的時(shí)間維度信息,設(shè)計(jì)適用于視頻質(zhì)量評(píng)價(jià)的四元數(shù)模型和評(píng)價(jià)指標(biāo)。在圖像壓縮編碼方面,研究如何利用四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法對(duì)壓縮后的圖像質(zhì)量進(jìn)行實(shí)時(shí)監(jiān)測(cè)和反饋,優(yōu)化壓縮算法,提高壓縮圖像的質(zhì)量。例如,將四元數(shù)質(zhì)量評(píng)價(jià)指標(biāo)作為優(yōu)化目標(biāo),調(diào)整圖像壓縮算法的參數(shù),在保證一定壓縮比的前提下,提高壓縮圖像的視覺質(zhì)量。1.3.2創(chuàng)新點(diǎn)提出新穎的四元數(shù)彩色圖像表示方法:在已有四元數(shù)表示彩色圖像方法的基礎(chǔ)上,創(chuàng)新性地提出一種考慮圖像局部方差和顏色相關(guān)性的四元數(shù)表示方法。該方法將彩色圖像亮度分量的局部方差作為四元數(shù)的實(shí)部,RGB三個(gè)通道作為虛部,并通過對(duì)顏色相關(guān)性的分析對(duì)虛部進(jìn)行加權(quán)處理,從而更全面、準(zhǔn)確地保留彩色圖像的結(jié)構(gòu)和顏色信息,為后續(xù)的質(zhì)量評(píng)價(jià)提供更有效的數(shù)據(jù)基礎(chǔ)。設(shè)計(jì)多維度融合的四元數(shù)彩色圖像質(zhì)量評(píng)價(jià)指標(biāo):結(jié)合人類視覺系統(tǒng)對(duì)圖像亮度、對(duì)比度、顏色和結(jié)構(gòu)的感知特性,設(shè)計(jì)了多個(gè)基于四元數(shù)的質(zhì)量評(píng)價(jià)指標(biāo),并通過自適應(yīng)加權(quán)融合的方式將這些指標(biāo)進(jìn)行整合。這些指標(biāo)包括基于四元數(shù)奇異值分解的結(jié)構(gòu)相似性指標(biāo)、基于四元數(shù)梯度的邊緣保持指標(biāo)以及基于顏色空間轉(zhuǎn)換的顏色保真度指標(biāo)等。通過多維度指標(biāo)的融合,能夠更全面地反映彩色圖像的質(zhì)量變化,提高評(píng)價(jià)結(jié)果與人類主觀感知的一致性,在處理復(fù)雜失真類型的圖像時(shí),具有更高的準(zhǔn)確性和魯棒性。拓展四元數(shù)彩色圖像質(zhì)量評(píng)價(jià)方法的應(yīng)用領(lǐng)域:首次將四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法應(yīng)用于視頻質(zhì)量評(píng)價(jià)和圖像壓縮編碼的質(zhì)量控制中。在視頻質(zhì)量評(píng)價(jià)方面,提出了一種基于四元數(shù)時(shí)空特征融合的視頻質(zhì)量評(píng)價(jià)模型,該模型不僅考慮了視頻幀內(nèi)的四元數(shù)圖像特征,還通過時(shí)間維度上的卷積操作提取視頻幀間的動(dòng)態(tài)特征,實(shí)現(xiàn)了對(duì)視頻質(zhì)量的全面評(píng)估。在圖像壓縮編碼質(zhì)量控制方面,建立了基于四元數(shù)質(zhì)量評(píng)價(jià)指標(biāo)的壓縮參數(shù)優(yōu)化模型,根據(jù)圖像的四元數(shù)特征實(shí)時(shí)調(diào)整壓縮算法的參數(shù),在保證壓縮比的同時(shí),顯著提高了壓縮圖像的質(zhì)量,拓展了四元數(shù)彩色圖像質(zhì)量評(píng)價(jià)方法的應(yīng)用范圍。二、四元數(shù)與彩色圖像表示基礎(chǔ)2.1四元數(shù)基本理論四元數(shù)(Quaternion)由愛爾蘭數(shù)學(xué)家威廉?羅溫?漢密爾頓(WilliamRowanHamilton)于1843年提出,是一種對(duì)復(fù)數(shù)的擴(kuò)展,在數(shù)學(xué)和工程領(lǐng)域有著廣泛的應(yīng)用。它在圖像處理,尤其是彩色圖像處理中,為解決顏色信息的有效表示和處理提供了新的思路和方法。從定義上看,四元數(shù)是由一個(gè)實(shí)部和三個(gè)虛部組成的超復(fù)數(shù),一般形式可表示為:q=a+bi+cj+dk其中,a、b、c、d均為實(shí)數(shù),分別對(duì)應(yīng)四元數(shù)的實(shí)部和三個(gè)虛部;i、j、k是虛數(shù)單位,它們滿足以下特殊的乘法規(guī)則:i^2=j^2=k^2=-1ij=k,\quadji=-kjk=i,\quadkj=-iki=j,\quadik=-j這些規(guī)則表明四元數(shù)的乘法不滿足交換律,這是四元數(shù)與復(fù)數(shù)的重要區(qū)別之一。例如,對(duì)于兩個(gè)四元數(shù)q_1=a_1+b_1i+c_1j+d_1k和q_2=a_2+b_2i+c_2j+d_2k,它們的乘積q_1q_2與q_2q_1通常是不相等的。這種非交換性使得四元數(shù)在表示某些復(fù)雜的幾何變換和物理現(xiàn)象時(shí)具有獨(dú)特的優(yōu)勢(shì)。四元數(shù)的加法運(yùn)算相對(duì)簡(jiǎn)單,類似于實(shí)數(shù)向量的加法,即對(duì)應(yīng)分量相加。設(shè)q_1=a_1+b_1i+c_1j+d_1k,q_2=a_2+b_2i+c_2j+d_2k,則q_1+q_2=(a_1+a_2)+(b_1+b_2)i+(c_1+c_2)j+(d_1+d_2)k。加法運(yùn)算滿足交換律和結(jié)合律,即q_1+q_2=q_2+q_1,(q_1+q_2)+q_3=q_1+(q_2+q_3)。四元數(shù)的乘法運(yùn)算規(guī)則基于其虛數(shù)單位的特殊性質(zhì),如前文所述,在計(jì)算兩個(gè)四元數(shù)的乘積時(shí),需要根據(jù)乘法規(guī)則展開并合并同類項(xiàng)。例如,計(jì)算q_1q_2:\begin{align*}q_1q_2&=(a_1+b_1i+c_1j+d_1k)(a_2+b_2i+c_2j+d_2k)\\&=a_1a_2+a_1b_2i+a_1c_2j+a_1d_2k+b_1a_2i+b_1b_2i^2+b_1c_2ij+b_1d_2ik+c_1a_2j+c_1b_2ji+c_1c_2j^2+c_1d_2jk+d_1a_2k+d_1b_2ki+d_1c_2kj+d_1d_2k^2\\&=(a_1a_2-b_1b_2-c_1c_2-d_1d_2)+(a_1b_2+b_1a_2+c_1d_2-d_1c_2)i+(a_1c_2+c_1a_2+d_1b_2-b_1d_2)j+(a_1d_2+d_1a_2+b_1c_2-c_1b_2)k\end{align*}雖然乘法運(yùn)算相對(duì)復(fù)雜,但它滿足結(jié)合律和分配律,即(q_1q_2)q_3=q_1(q_2q_3),q_1(q_2+q_3)=q_1q_2+q_1q_3,(q_1+q_2)q_3=q_1q_3+q_2q_3。這些運(yùn)算規(guī)律為四元數(shù)在各種數(shù)學(xué)和工程計(jì)算中的應(yīng)用提供了基礎(chǔ)。此外,四元數(shù)還具有共軛、模等重要概念。四元數(shù)q=a+bi+cj+dk的共軛四元數(shù)q^*=a-bi-cj-dk,其模\vertq\vert=\sqrt{a^2+b^2+c^2+d^2}。共軛四元數(shù)和模在四元數(shù)的運(yùn)算和應(yīng)用中也起著關(guān)鍵作用,例如在計(jì)算四元數(shù)的逆時(shí),就會(huì)用到共軛四元數(shù)和模的概念。對(duì)于非零四元數(shù)q,其逆q^{-1}=\frac{q^*}{\vertq\vert^2},滿足qq^{-1}=q^{-1}q=1。四元數(shù)的這些基本理論和運(yùn)算規(guī)則是其在彩色圖像表示和處理中應(yīng)用的基石。通過將彩色圖像的顏色信息映射到四元數(shù)的各個(gè)部分,可以利用四元數(shù)的代數(shù)結(jié)構(gòu)和運(yùn)算特性,有效地處理彩色圖像中的顏色關(guān)系、空間結(jié)構(gòu)以及各種變換操作,為彩色圖像質(zhì)量評(píng)價(jià)等相關(guān)研究提供有力的數(shù)學(xué)工具。2.2彩色圖像的四元數(shù)表示方法彩色圖像通常由RGB(紅、綠、藍(lán))三個(gè)顏色通道組成,每個(gè)通道代表一種基色的強(qiáng)度信息。為了將彩色圖像用四元數(shù)表示,一種常見的方法是將RGB三基色分量分別編碼為四元數(shù)的三個(gè)虛部。假設(shè)彩色圖像中的一個(gè)像素點(diǎn)的RGB值分別為R、G、B,則可以將其表示為四元數(shù)q:q=r+Ri+Gj+Bk其中,r為四元數(shù)的實(shí)部,R、G、B分別對(duì)應(yīng)四元數(shù)的三個(gè)虛部系數(shù)。在這種表示方式中,四元數(shù)的虛部直接對(duì)應(yīng)彩色圖像的顏色信息,通過四元數(shù)的運(yùn)算可以方便地對(duì)顏色信息進(jìn)行處理。例如,在進(jìn)行顏色空間轉(zhuǎn)換時(shí),可以利用四元數(shù)的乘法規(guī)則來實(shí)現(xiàn)顏色分量的線性變換,從而實(shí)現(xiàn)從RGB顏色空間到其他顏色空間(如HSV、YUV等)的轉(zhuǎn)換。對(duì)于四元數(shù)實(shí)部r的確定,不同的研究提出了多種方法。一種方法是像王宇慶等人提出的,將彩色圖像亮度分量的局部方差作為四元數(shù)的實(shí)部。亮度分量可以通過RGB顏色空間的轉(zhuǎn)換公式得到,例如常見的轉(zhuǎn)換公式為:Y=0.299R+0.587G+0.114B計(jì)算亮度分量Y的局部方差,能夠反映圖像中局部區(qū)域的細(xì)節(jié)變化和紋理信息。具體計(jì)算時(shí),可以以每個(gè)像素點(diǎn)為中心,選取一個(gè)合適大小的鄰域窗口(如3\times3、5\times5等),計(jì)算該窗口內(nèi)亮度值的方差作為該像素點(diǎn)對(duì)應(yīng)的四元數(shù)實(shí)部。以3\times3鄰域窗口為例,設(shè)窗口內(nèi)的亮度值為Y_{ij},i=-1,0,1,j=-1,0,1,則局部方差\sigma^2的計(jì)算公式為:\sigma^2=\frac{1}{9}\sum_{i=-1}^{1}\sum_{j=-1}^{1}(Y_{ij}-\overline{Y})^2其中,\overline{Y}為窗口內(nèi)亮度值的均值,\overline{Y}=\frac{1}{9}\sum_{i=-1}^{1}\sum_{j=-1}^{1}Y_{ij}。將計(jì)算得到的局部方差作為四元數(shù)的實(shí)部,能夠突出圖像的細(xì)節(jié)信息對(duì)圖像質(zhì)量的影響。因?yàn)閳D像的細(xì)節(jié)部分往往具有較高的局部方差,將其作為實(shí)部可以在四元數(shù)表示中更好地保留圖像的結(jié)構(gòu)特征,使得后續(xù)基于四元數(shù)的圖像質(zhì)量評(píng)價(jià)等處理能夠更準(zhǔn)確地反映圖像的實(shí)際情況。另一種確定實(shí)部的思路是考慮圖像的頻率信息??梢酝ㄟ^對(duì)圖像進(jìn)行傅里葉變換,得到圖像的頻域表示,然后將低頻分量或高頻分量的某種統(tǒng)計(jì)特征作為四元數(shù)的實(shí)部。例如,計(jì)算圖像低頻分量的能量作為實(shí)部,低頻分量主要包含圖像的大致輪廓和背景信息,將其能量作為實(shí)部可以在四元數(shù)表示中突出圖像的整體結(jié)構(gòu);或者計(jì)算高頻分量的幅值之和作為實(shí)部,高頻分量包含圖像的細(xì)節(jié)和邊緣信息,這樣可以強(qiáng)調(diào)圖像的細(xì)節(jié)特征。具體實(shí)現(xiàn)時(shí),首先對(duì)彩色圖像的每個(gè)通道分別進(jìn)行二維離散傅里葉變換(2D-DFT),得到頻域表示F(u,v),然后根據(jù)需要計(jì)算低頻或高頻分量的統(tǒng)計(jì)特征。以計(jì)算低頻分量能量為例,設(shè)定一個(gè)截止頻率D_0,對(duì)于頻率(u,v)滿足D(u,v)\leqD_0(其中D(u,v)=\sqrt{(u-M/2)^2+(v-N/2)^2},M和N分別為圖像的行數(shù)和列數(shù))的低頻分量,計(jì)算其能量:E_{low}=\sum_{u=0}^{M-1}\sum_{v=0}^{N-1}|F(u,v)|^2\cdotH(u,v)其中,H(u,v)為低通濾波器,當(dāng)D(u,v)\leqD_0時(shí),H(u,v)=1,否則H(u,v)=0。將計(jì)算得到的低頻分量能量E_{low}作為四元數(shù)的實(shí)部,從而構(gòu)建出包含圖像頻率信息的四元數(shù)表示。通過將彩色圖像的RGB三基色分量編碼為四元數(shù)的虛部,并合理確定實(shí)部,能夠?qū)⒉噬珗D像有效地表示為四元數(shù)形式,為后續(xù)基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià)、增強(qiáng)、去噪等處理提供了基礎(chǔ)。不同的實(shí)部確定方法會(huì)對(duì)四元數(shù)表示的圖像信息產(chǎn)生不同的側(cè)重點(diǎn),在實(shí)際應(yīng)用中需要根據(jù)具體需求和圖像特點(diǎn)選擇合適的方法。2.3四元數(shù)運(yùn)算在彩色圖像中的特性分析在彩色圖像中,四元數(shù)運(yùn)算在旋轉(zhuǎn)、縮放、平移等變換中展現(xiàn)出獨(dú)特的特性,這些特性對(duì)圖像結(jié)構(gòu)信息有著重要的影響。在旋轉(zhuǎn)方面,四元數(shù)為彩色圖像的旋轉(zhuǎn)提供了一種高效且直觀的方式。傳統(tǒng)的二維圖像旋轉(zhuǎn)通常通過旋轉(zhuǎn)矩陣來實(shí)現(xiàn),對(duì)于彩色圖像,需要分別對(duì)RGB三個(gè)通道進(jìn)行相同的旋轉(zhuǎn)操作。而利用四元數(shù),可將彩色圖像視為一個(gè)整體進(jìn)行旋轉(zhuǎn)。假設(shè)旋轉(zhuǎn)四元數(shù)q_r=cos(\frac{\theta}{2})+u_xsin(\frac{\theta}{2})i+u_ysin(\frac{\theta}{2})j+u_zsin(\frac{\theta}{2})k,其中\(zhòng)theta是旋轉(zhuǎn)角度,(u_x,u_y,u_z)是旋轉(zhuǎn)軸的單位向量。對(duì)于圖像中的一個(gè)像素點(diǎn)對(duì)應(yīng)的四元數(shù)q=r+Ri+Gj+Bk,旋轉(zhuǎn)后的四元數(shù)q'可通過q'=q_rqq_r^{-1}計(jì)算得到。這種旋轉(zhuǎn)方式能夠很好地保持彩色圖像各顏色通道之間的相關(guān)性,避免了傳統(tǒng)旋轉(zhuǎn)方法中可能出現(xiàn)的顏色偏差和信息丟失。例如,在對(duì)一幅包含多種顏色物體的圖像進(jìn)行旋轉(zhuǎn)時(shí),使用四元數(shù)旋轉(zhuǎn)可以確保物體的顏色在旋轉(zhuǎn)過程中保持一致,不會(huì)出現(xiàn)顏色的錯(cuò)位或失真,從而更好地保留了圖像的結(jié)構(gòu)信息。在縮放操作中,四元數(shù)運(yùn)算同樣具有一定的優(yōu)勢(shì)。當(dāng)對(duì)彩色圖像進(jìn)行縮放時(shí),可通過對(duì)四元數(shù)的模進(jìn)行調(diào)整來實(shí)現(xiàn)。設(shè)圖像像素點(diǎn)的四元數(shù)表示為q,其模為\vertq\vert=\sqrt{r^2+R^2+G^2+B^2}。若要對(duì)圖像進(jìn)行縮放,可將四元數(shù)的模乘以縮放因子s,得到新的四元數(shù)q'=s\cdotq。在這個(gè)過程中,四元數(shù)的實(shí)部和虛部按照相同的比例進(jìn)行縮放,保證了顏色信息的一致性。與傳統(tǒng)方法相比,這種基于四元數(shù)??s放的方式能夠更均勻地對(duì)彩色圖像的各個(gè)通道進(jìn)行縮放,避免了因不同通道縮放不一致而導(dǎo)致的顏色失衡和圖像結(jié)構(gòu)變形。比如,在對(duì)一幅風(fēng)景圖像進(jìn)行縮小操作時(shí),使用四元數(shù)縮放可以使圖像中的天空、山水等各種顏色的區(qū)域都按照相同的比例縮小,保持圖像的整體結(jié)構(gòu)和顏色關(guān)系不變。對(duì)于平移操作,雖然四元數(shù)本身不能直接表示平移,但可以通過結(jié)合齊次坐標(biāo)的方式來實(shí)現(xiàn)彩色圖像的平移。將彩色圖像的像素點(diǎn)用齊次坐標(biāo)表示后,再與包含平移信息的四元數(shù)矩陣進(jìn)行乘法運(yùn)算,從而實(shí)現(xiàn)圖像的平移。在這個(gè)過程中,四元數(shù)運(yùn)算能夠確保彩色圖像在平移過程中顏色信息的準(zhǔn)確傳遞,不會(huì)對(duì)圖像的結(jié)構(gòu)和顏色造成額外的影響。例如,在將一幅人物圖像進(jìn)行平移時(shí),利用四元數(shù)結(jié)合齊次坐標(biāo)的方法可以保證人物的顏色和形狀在平移后保持不變,圖像的結(jié)構(gòu)信息得以完整保留。四元數(shù)運(yùn)算在彩色圖像的旋轉(zhuǎn)、縮放、平移等變換中,能夠有效地保持圖像的顏色相關(guān)性和結(jié)構(gòu)信息,為彩色圖像處理提供了一種更加有效的手段。這些特性使得基于四元數(shù)的彩色圖像質(zhì)量評(píng)價(jià)方法在處理經(jīng)過各種變換的圖像時(shí),能夠更準(zhǔn)確地評(píng)估圖像質(zhì)量的變化,具有更高的魯棒性和準(zhǔn)確性。三、四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法3.1傳統(tǒng)全參考彩色圖像質(zhì)量評(píng)價(jià)方法概述在圖像質(zhì)量評(píng)價(jià)領(lǐng)域,傳統(tǒng)的全參考彩色圖像質(zhì)量評(píng)價(jià)方法長(zhǎng)期占據(jù)重要地位,它們?yōu)閳D像質(zhì)量的量化評(píng)估提供了基礎(chǔ),在早期的圖像處理研究與應(yīng)用中發(fā)揮了關(guān)鍵作用。這些方法主要基于像素誤差和結(jié)構(gòu)相似性等原理,通過數(shù)學(xué)計(jì)算來衡量參考圖像與待評(píng)價(jià)圖像之間的差異,從而給出圖像質(zhì)量的評(píng)價(jià)結(jié)果。然而,隨著對(duì)圖像質(zhì)量要求的不斷提高以及對(duì)人類視覺系統(tǒng)研究的深入,傳統(tǒng)方法的局限性也逐漸凸顯。均方誤差(MSE)是一種基于像素誤差的經(jīng)典評(píng)價(jià)方法,其計(jì)算原理相對(duì)簡(jiǎn)單直接。假設(shè)參考圖像為f(x,y),待評(píng)價(jià)圖像為\hat{f}(x,y),圖像尺寸為M\timesN,則MSE的計(jì)算公式為:MSE=\frac{1}{MN}\sum_{x=0}^{M-1}\sum_{y=0}^{N-1}[f(x,y)-\hat{f}(x,y)]^2MSE通過計(jì)算兩幅圖像對(duì)應(yīng)像素點(diǎn)灰度值之差的平方和的平均值,來衡量圖像之間的差異程度。MSE的值越小,表明待評(píng)價(jià)圖像與參考圖像在像素層面上的差異越小,即圖像質(zhì)量越高;反之,MSE值越大,則圖像質(zhì)量越差。例如,在簡(jiǎn)單的圖像傳輸測(cè)試中,若原始參考圖像經(jīng)過傳輸后得到的待評(píng)價(jià)圖像的MSE值較小,說明傳輸過程中圖像的像素信息丟失較少,圖像質(zhì)量得到了較好的保持。峰值信噪比(PSNR)是基于MSE的一種衍生指標(biāo),它將MSE的值轉(zhuǎn)換為以分貝(dB)為單位的度量,以更直觀地反映圖像質(zhì)量。PSNR的計(jì)算公式為:PSNR=10\log_{10}\frac{f_{max}^2}{MSE}其中,f_{max}表示圖像像素的最大取值,對(duì)于8位灰度圖像,f_{max}=255。PSNR與MSE呈反比關(guān)系,PSNR值越高,意味著MSE值越小,圖像質(zhì)量越好。在圖像壓縮應(yīng)用中,常使用PSNR來評(píng)估不同壓縮算法對(duì)圖像質(zhì)量的影響,較高的PSNR值表示壓縮后的圖像保留了更多的原始信息,質(zhì)量更接近原始圖像。雖然MSE和PSNR計(jì)算簡(jiǎn)單,易于實(shí)現(xiàn),在一些對(duì)圖像質(zhì)量要求不高的場(chǎng)景中具有一定的應(yīng)用價(jià)值,如簡(jiǎn)單的圖像存儲(chǔ)和傳輸場(chǎng)景下,可以快速判斷圖像是否發(fā)生了明顯的失真。但它們都沒有考慮人類視覺系統(tǒng)(HVS)的特性。HVS對(duì)圖像的感知并非均勻的,它對(duì)圖像中的邊緣、紋理等結(jié)構(gòu)信息以及不同頻率成分具有不同的敏感度。例如,HVS對(duì)低頻信息(如圖像的大致輪廓和背景)更為敏感,而對(duì)高頻信息(如細(xì)微的噪聲和細(xì)節(jié))的敏感度相對(duì)較低。在實(shí)際圖像中,一些微小的像素誤差可能并不會(huì)被人眼察覺,但MSE和PSNR會(huì)將這些誤差同等對(duì)待,導(dǎo)致其評(píng)價(jià)結(jié)果與人類主觀感知的一致性較差。比如,在一幅包含復(fù)雜紋理的圖像中,即使待評(píng)價(jià)圖像在某些細(xì)微紋理處存在一定的像素誤差,使得MSE值有所增加,但由于這些誤差處于人眼不易察覺的高頻區(qū)域,人眼主觀上可能認(rèn)為圖像質(zhì)量并沒有明顯下降,而MSE和PSNR卻會(huì)給出較低的評(píng)價(jià)分?jǐn)?shù)。結(jié)構(gòu)相似性(SSIM)指數(shù)則從圖像的結(jié)構(gòu)信息出發(fā),試圖克服MSE和PSNR的不足,更準(zhǔn)確地評(píng)估圖像質(zhì)量。SSIM考慮了圖像的亮度、對(duì)比度和結(jié)構(gòu)三個(gè)重要因素,其計(jì)算過程基于局部窗口。對(duì)于參考圖像和待評(píng)價(jià)圖像中的每個(gè)局部窗口,分別計(jì)算亮度相似性l(x,y)、對(duì)比度相似性c(x,y)和結(jié)構(gòu)相似性s(x,y),然后通過加權(quán)組合得到該窗口的SSIM值SSIM(x,y):SSIM(x,y)=l(x,y)^{\alpha}c(x,y)^{\beta}s(x,y)^{\gamma}其中,\alpha、\beta、\gamma為加權(quán)參數(shù),通常取\alpha=\beta=\gamma=1。最后,對(duì)整幅圖像所有窗口的SSIM值進(jìn)行平均,得到整幅圖像的平均結(jié)構(gòu)相似性指數(shù)MSSIM,作為圖像質(zhì)量的評(píng)價(jià)指標(biāo)。MSSIM的值越接近1,表示圖像質(zhì)量越好,兩幅圖像的結(jié)構(gòu)相似性越高;值越接近0,則圖像質(zhì)量越差。例如,在圖像增強(qiáng)算法的評(píng)估中,SSIM能夠較好地衡量增強(qiáng)后的圖像在保持原始圖像結(jié)構(gòu)信息的同時(shí),對(duì)亮度和對(duì)比度的調(diào)整是否符合人眼的視覺感受。盡管SSIM在一定程度上提高了與人類主觀評(píng)價(jià)的相關(guān)性,但對(duì)于彩色圖像的評(píng)價(jià)仍存在局限性。彩色圖像包含豐富的顏色信息,而SSIM在處理彩色圖像時(shí),通常將彩色圖像分解為多個(gè)分量(如RGB分量),然后分別對(duì)每個(gè)分量進(jìn)行評(píng)價(jià),最后再將各個(gè)分量的評(píng)價(jià)結(jié)果進(jìn)行融合。這種處理方式忽略了彩色圖像各分量之間的內(nèi)在聯(lián)系,沒有充分考慮顏色信息對(duì)圖像質(zhì)量的影響。例如,在某些顏色失真的情況下,雖然圖像的亮度和結(jié)構(gòu)信息可能變化不大,SSIM值也較高,但人眼會(huì)明顯察覺到顏色的異常,從而認(rèn)為圖像質(zhì)量下降。此外,SSIM對(duì)于復(fù)雜的圖像內(nèi)容和不同類型的失真,其評(píng)價(jià)準(zhǔn)確性還有待提高。在面對(duì)包含大面積均勻區(qū)域或高頻細(xì)節(jié)豐富的圖像時(shí),SSIM可能無法準(zhǔn)確反映圖像質(zhì)量的變化。3.2四元數(shù)譜余量彩色圖像質(zhì)量評(píng)價(jià)方法(QSR-SIM)3.2.1參考圖像與失真圖像的四元數(shù)矩陣表示將參考圖像與失真圖像表示為純四元數(shù)矩陣,是四元數(shù)譜余量彩色圖像質(zhì)量評(píng)價(jià)方法(QSR-SIM)的基礎(chǔ)步驟,這一過程充分利用四元數(shù)的特性,實(shí)現(xiàn)對(duì)彩色圖像信息的有效整合與表達(dá)。對(duì)于一幅彩色圖像,其通常由RGB三個(gè)顏色通道組成。在四元數(shù)表示中,將每個(gè)像素點(diǎn)的RGB值分別映射到四元數(shù)的三個(gè)虛部,從而構(gòu)建純四元數(shù)矩陣。設(shè)參考圖像為I_r,失真圖像為I_d,圖像尺寸為M\timesN。對(duì)于圖像中的任意像素點(diǎn)(x,y),其RGB值分別為(R_{r}(x,y),G_{r}(x,y),B_{r}(x,y))(參考圖像)和(R_rpt91lv(x,y),G_ttjlp15(x,y),B_hldllnn(x,y))(失真圖像),則對(duì)應(yīng)的純四元數(shù)可表示為:q_{r}(x,y)=R_{r}(x,y)i+G_{r}(x,y)j+B_{r}(x,y)kq_njtd795(x,y)=R_1lbjtjh(x,y)i+G_x9dtt1f(x,y)j+B_ftftv9d(x,y)k通過這種方式,將整幅參考圖像和失真圖像分別表示為大小為M\timesN的純四元數(shù)矩陣Q_r和Q_d,其中矩陣元素為對(duì)應(yīng)像素點(diǎn)的四元數(shù)表示。這種表示方法的原理在于,四元數(shù)的三個(gè)虛部能夠自然地容納彩色圖像的三個(gè)顏色通道信息,使得彩色圖像在四元數(shù)域中得以完整呈現(xiàn)。與傳統(tǒng)的將彩色圖像分解為多個(gè)分量分別處理的方式不同,四元數(shù)矩陣表示能夠保持顏色通道之間的內(nèi)在聯(lián)系,為后續(xù)基于四元數(shù)的運(yùn)算和分析提供更全面、準(zhǔn)確的數(shù)據(jù)基礎(chǔ)。例如,在一幅風(fēng)景圖像中,天空的藍(lán)色、樹木的綠色和太陽的紅色等各種顏色信息通過四元數(shù)矩陣表示,能夠在四元數(shù)的代數(shù)結(jié)構(gòu)中相互關(guān)聯(lián),避免了傳統(tǒng)方法中因分量分離而導(dǎo)致的信息丟失或相關(guān)性破壞。這種表示方式不僅在數(shù)學(xué)上簡(jiǎn)潔高效,而且更符合彩色圖像的實(shí)際特性,有助于提高圖像質(zhì)量評(píng)價(jià)的準(zhǔn)確性和可靠性。通過將參考圖像與失真圖像表示為純四元數(shù)矩陣,為后續(xù)利用四元數(shù)譜余量方法檢測(cè)視覺顯著性區(qū)域以及融合四元數(shù)梯度特征進(jìn)行圖像質(zhì)量評(píng)價(jià)奠定了堅(jiān)實(shí)的基礎(chǔ)。3.2.2基于四元數(shù)譜余量的視覺顯著性區(qū)域檢測(cè)利用四元數(shù)譜余量方法檢測(cè)視覺顯著性區(qū)域,是QSR-SIM方法中的關(guān)鍵環(huán)節(jié),它基于四元數(shù)的頻譜分析,能夠有效捕捉圖像中引起人眼關(guān)注的重要區(qū)域,為圖像質(zhì)量評(píng)價(jià)提供更具針對(duì)性的信息。該檢測(cè)算法的流程首先對(duì)前面得到的參考圖像和失真圖像的純四元數(shù)矩陣Q_r和Q_d進(jìn)行四元數(shù)傅里葉變換(QFT)。四元數(shù)傅里葉變換將圖像從空間域轉(zhuǎn)換到頻域,能夠揭示圖像的頻率特性。對(duì)于四元數(shù)矩陣Q,其QFT定義為:F_Q(u,v)=\sum_{x=0}^{M-1}\sum_{y=0}^{N-1}q(x,y)e^{-2\pii(ux/M+vy/N)}其中,(u,v)是頻域坐標(biāo),(x,y)是空間域坐標(biāo)。通過QFT,得到參考圖像和失真圖像在頻域的四元數(shù)表示F_{Q_r}(u,v)和F_{Q_d}(u,v)。接著計(jì)算四元數(shù)譜余量。譜余量反映了圖像中每個(gè)頻率分量與周圍局部平均頻率的差異程度,差異越大,說明該頻率分量在圖像中越顯著。對(duì)于頻域的四元數(shù)F_Q(u,v),其譜余量S(u,v)計(jì)算如下:S(u,v)=\vertF_Q(u,v)\vert-\text{exp}\left(\frac{1}{n^2}\sum_{(m,n)\inN_{(u,v)}}\text{log}\vertF_Q(m,n)\vert\right)其中,N_{(u,v)}是以(u,v)為中心的局部鄰域窗口,n是鄰域窗口的大小。在實(shí)際計(jì)算中,通常采用高斯加權(quán)平均來更好地考慮鄰域內(nèi)不同位置的權(quán)重。通過計(jì)算參考圖像和失真圖像的譜余量S_r(u,v)和S_d(u,v),可以得到反映兩幅圖像中視覺顯著性的頻率信息。然后對(duì)譜余量進(jìn)行逆四元數(shù)傅里葉變換(IQFT),將頻域的顯著性信息轉(zhuǎn)換回空間域,得到視覺顯著性圖Saliency_r(x,y)和Saliency_d(x,y)。逆四元數(shù)傅里葉變換的公式為:saliency(x,y)=\sum_{u=0}^{M-1}\sum_{v=0}^{N-1}S(u,v)e^{2\pii(ux/M+vy/N)}在得到的顯著性圖中,值越大的區(qū)域表示在該區(qū)域的視覺顯著性越高,即越容易引起人眼的關(guān)注。這些區(qū)域通常包含了圖像的重要結(jié)構(gòu)和細(xì)節(jié)信息,對(duì)于圖像質(zhì)量的變化更為敏感。例如,在一幅人物圖像中,人物的面部、肢體動(dòng)作等關(guān)鍵部位在視覺顯著性圖中會(huì)呈現(xiàn)出較高的值,因?yàn)檫@些區(qū)域是人們?cè)谟^察圖像時(shí)重點(diǎn)關(guān)注的部分。當(dāng)圖像發(fā)生失真時(shí),這些顯著區(qū)域的變化往往更能反映圖像質(zhì)量的下降。通過基于四元數(shù)譜余量的方法檢測(cè)視覺顯著性區(qū)域,能夠準(zhǔn)確地定位圖像中對(duì)質(zhì)量評(píng)價(jià)具有重要意義的部分,為后續(xù)結(jié)合四元數(shù)梯度特征進(jìn)行圖像質(zhì)量評(píng)價(jià)提供了有效的視覺顯著性信息。3.2.3四元數(shù)梯度特征融合與評(píng)價(jià)指標(biāo)設(shè)計(jì)將四元數(shù)梯度特征融合作為評(píng)價(jià)指標(biāo),并融入視覺顯著性作為權(quán)值,是QSR-SIM方法的核心創(chuàng)新點(diǎn)之一,通過這種方式能夠更全面、準(zhǔn)確地評(píng)估彩色圖像的質(zhì)量。四元數(shù)梯度能夠反映圖像在四元數(shù)域中的局部變化情況,包含了豐富的結(jié)構(gòu)和細(xì)節(jié)信息。對(duì)于四元數(shù)矩陣Q(x,y),其在x和y方向上的梯度可以通過有限差分法計(jì)算。以x方向梯度為例,計(jì)算公式為:\nabla_xQ(x,y)=Q(x+1,y)-Q(x,y)同樣地,y方向梯度為:\nabla_yQ(x,y)=Q(x,y+1)-Q(x,y)通過計(jì)算參考圖像Q_r和失真圖像Q_d的四元數(shù)梯度,得到梯度矩陣\nabla_xQ_r、\nabla_yQ_r和\nabla_xQ_d、\nabla_yQ_d。這些梯度矩陣反映了圖像在不同方向上的變化率,對(duì)于判斷圖像的結(jié)構(gòu)完整性和失真程度具有重要作用。在設(shè)計(jì)評(píng)價(jià)指標(biāo)時(shí),考慮將四元數(shù)梯度特征進(jìn)行融合。一種常見的融合方式是計(jì)算梯度的幅值和方向信息。梯度幅值可以衡量圖像局部變化的劇烈程度,計(jì)算公式為:Mag_Q(x,y)=\sqrt{\vert\nabla_xQ(x,y)\vert^2+\vert\nabla_yQ(x,y)\vert^2}梯度方向則反映了圖像變化的方向特性。通過對(duì)參考圖像和失真圖像的梯度幅值和方向進(jìn)行比較,可以得到反映圖像結(jié)構(gòu)差異的特征量。為了進(jìn)一步提高評(píng)價(jià)指標(biāo)的準(zhǔn)確性和與人眼視覺感知的一致性,將前面得到的視覺顯著性作為權(quán)值融入評(píng)價(jià)指標(biāo)。具體來說,對(duì)于每個(gè)像素點(diǎn)(x,y),其評(píng)價(jià)指標(biāo)QI(x,y)可以設(shè)計(jì)為:QI(x,y)=w(x,y)\cdot\left(\alpha\cdot\vertMag_{Q_r}(x,y)-Mag_{Q_d}(x,y)\vert+\beta\cdot\vertDir_{Q_r}(x,y)-Dir_{Q_d}(x,y)\vert\right)其中,w(x,y)是視覺顯著性圖Saliency(x,y)在該像素點(diǎn)的值,作為權(quán)值對(duì)梯度特征差異進(jìn)行加權(quán);\alpha和\beta是權(quán)重系數(shù),用于平衡梯度幅值差異和方向差異在評(píng)價(jià)指標(biāo)中的貢獻(xiàn);Dir_{Q}(x,y)表示四元數(shù)梯度的方向。通過這種方式,在圖像的視覺顯著性區(qū)域,梯度特征差異對(duì)評(píng)價(jià)指標(biāo)的影響更大,因?yàn)檫@些區(qū)域?qū)θ搜鄣囊曈X感知更為重要。例如,在一幅包含建筑物的圖像中,建筑物的輪廓和細(xì)節(jié)部分通常具有較高的視覺顯著性,當(dāng)圖像發(fā)生失真時(shí),這些區(qū)域的梯度特征變化會(huì)被更突出地反映在評(píng)價(jià)指標(biāo)中。而在視覺顯著性較低的背景區(qū)域,梯度特征差異對(duì)評(píng)價(jià)指標(biāo)的影響相對(duì)較小。通過四元數(shù)梯度特征融合與視覺顯著性加權(quán)的評(píng)價(jià)指標(biāo)設(shè)計(jì),能夠更準(zhǔn)確地反映彩色圖像的質(zhì)量變化,提高圖像質(zhì)量評(píng)價(jià)的精度和可靠性。3.3基于四元數(shù)矩陣奇異值分解的評(píng)價(jià)方法3.3.1四元數(shù)矩陣奇異值分解算法四元數(shù)矩陣奇異值分解(Q-SVD)是將四元數(shù)矩陣分解為三個(gè)特殊矩陣乘積的過程,它在四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)中起著關(guān)鍵作用,為提取圖像的關(guān)鍵特征提供了有效的手段。四元數(shù)矩陣奇異值分解的基本原理與復(fù)數(shù)矩陣奇異值分解有一定的相似性,但由于四元數(shù)的非交換性,其分解過程更為復(fù)雜。對(duì)于一個(gè)m\timesn的四元數(shù)矩陣A,Q-SVD可以表示為:A=U\SigmaV^H其中,U是一個(gè)m\timesm的酉四元數(shù)矩陣,其列向量稱為左奇異向量;\Sigma是一個(gè)m\timesn的對(duì)角四元數(shù)矩陣,對(duì)角線上的非負(fù)元素\sigma_i(i=1,2,\cdots,\min(m,n))稱為奇異值,且通常按降序排列;V是一個(gè)n\timesn的酉四元數(shù)矩陣,V^H是V的共軛轉(zhuǎn)置,其列向量稱為右奇異向量。四元數(shù)矩陣奇異值分解的算法步驟較為復(fù)雜,涉及到一系列的矩陣運(yùn)算和變換。一種常見的計(jì)算方法是基于Householder變換和Givens旋轉(zhuǎn)的迭代算法。該算法的大致步驟如下:初始化:對(duì)于給定的四元數(shù)矩陣A,首先確定矩陣的大小m和n。然后,初始化酉矩陣U和V為單位矩陣,奇異值矩陣\Sigma為與A同型的零矩陣。Householder變換:通過一系列的Householder變換,將矩陣A逐步化為上三角形式。對(duì)于每一步Householder變換,找到一個(gè)Householder矩陣H,使得AH在某一列或某幾列的下方元素變?yōu)榱?。具體來說,對(duì)于第k步Householder變換(k=1,2,\cdots,\min(m,n)-1),選擇一個(gè)合適的四元數(shù)向量v_k,構(gòu)造Householder矩陣H_k=I-2\frac{v_kv_k^H}{v_k^Hv_k},其中I為單位矩陣。然后對(duì)A進(jìn)行變換A=AH_k,同時(shí)更新V=VH_k。通過多次這樣的變換,將A化為上三角矩陣。Givens旋轉(zhuǎn):在得到上三角矩陣后,再通過Givens旋轉(zhuǎn)進(jìn)一步將其化為對(duì)角形式。Givens旋轉(zhuǎn)是一種平面旋轉(zhuǎn)操作,通過選擇合適的旋轉(zhuǎn)角度\theta和旋轉(zhuǎn)軸,構(gòu)造Givens旋轉(zhuǎn)矩陣G,對(duì)矩陣的元素進(jìn)行旋轉(zhuǎn)操作,使得非對(duì)角元素逐步變?yōu)榱?。例如,?duì)于2\times2的子矩陣\begin{pmatrix}a&b\\c&d\end{pmatrix},選擇Givens旋轉(zhuǎn)矩陣G=\begin{pmatrix}\cos\theta&\sin\theta\\-\sin\theta&\cos\theta\end{pmatrix},使得G\begin{pmatrix}a&b\\c&d\end{pmatrix}的某個(gè)非對(duì)角元素為零。在四元數(shù)矩陣中,Givens旋轉(zhuǎn)矩陣的構(gòu)造需要考慮四元數(shù)的運(yùn)算規(guī)則。通過一系列的Givens旋轉(zhuǎn)操作,逐步將上三角矩陣化為對(duì)角矩陣,得到奇異值矩陣\Sigma。計(jì)算左奇異向量:在得到奇異值矩陣\Sigma和右奇異向量矩陣V后,通過公式U=AV\Sigma^{-1}計(jì)算左奇異向量矩陣U。其中,\Sigma^{-1}是\Sigma的偽逆,對(duì)于對(duì)角矩陣\Sigma,其偽逆是將對(duì)角線上非零元素取倒數(shù)得到的矩陣。四元數(shù)矩陣奇異值分解與復(fù)數(shù)矩陣奇異值分解存在一定的聯(lián)系和轉(zhuǎn)換方法。在某些情況下,可以通過將四元數(shù)矩陣轉(zhuǎn)化為復(fù)數(shù)矩陣,利用已有的復(fù)數(shù)矩陣奇異值分解算法進(jìn)行計(jì)算,然后再將結(jié)果轉(zhuǎn)換回四元數(shù)形式。一種常用的轉(zhuǎn)換方法是基于四元數(shù)的復(fù)表示。對(duì)于一個(gè)四元數(shù)q=a+bi+cj+dk,可以將其表示為一個(gè)2\times2的復(fù)數(shù)矩陣:\begin{pmatrix}a+bi&c+di\\-(c-di)&a-bi\end{pmatrix}對(duì)于一個(gè)四元數(shù)矩陣A,可以將其每個(gè)元素按照上述方式轉(zhuǎn)換為復(fù)數(shù)矩陣,從而得到一個(gè)更大的復(fù)數(shù)矩陣\widetilde{A}。然后對(duì)\widetilde{A}進(jìn)行復(fù)數(shù)矩陣奇異值分解,得到\widetilde{A}=\widetilde{U}\widetilde{\Sigma}\widetilde{V}^H。最后,再將\widetilde{U}、\widetilde{\Sigma}和\widetilde{V}轉(zhuǎn)換回四元數(shù)矩陣形式,得到四元數(shù)矩陣奇異值分解的結(jié)果A=U\SigmaV^H。這種轉(zhuǎn)換方法在一定程度上簡(jiǎn)化了四元數(shù)矩陣奇異值分解的計(jì)算,但在轉(zhuǎn)換過程中需要注意保持矩陣的結(jié)構(gòu)和運(yùn)算的一致性。通過四元數(shù)矩陣奇異值分解算法,可以得到彩色圖像四元數(shù)矩陣的奇異值和奇異向量,這些特征對(duì)于后續(xù)基于奇異值特征向量的圖像結(jié)構(gòu)相似性度量以及圖像質(zhì)量評(píng)價(jià)具有重要意義。3.3.2基于奇異值特征向量的圖像結(jié)構(gòu)相似性度量通過計(jì)算參考圖像和失真圖像四元數(shù)矩陣奇異值特征向量夾角來度量圖像結(jié)構(gòu)相似程度,是基于四元數(shù)矩陣奇異值分解的彩色圖像質(zhì)量評(píng)價(jià)方法的關(guān)鍵環(huán)節(jié),它從圖像的結(jié)構(gòu)特征角度出發(fā),能夠有效捕捉圖像失真對(duì)結(jié)構(gòu)信息的影響。在完成參考圖像和失真圖像的四元數(shù)矩陣奇異值分解后,得到各自的奇異值矩陣\Sigma_r和\Sigma_d以及奇異向量矩陣U_r、V_r和U_d、V_d。其中,奇異值反映了圖像不同頻率成分的能量大小,奇異向量則與圖像的結(jié)構(gòu)信息密切相關(guān)。對(duì)于奇異值特征向量夾角的計(jì)算,主要關(guān)注右奇異向量(也可選擇左奇異向量,原理類似)。設(shè)參考圖像的右奇異向量矩陣V_r的第i列向量為\mathbf{v}_{r,i},失真圖像的右奇異向量矩陣V_d的第i列向量為\mathbf{v}_{d,i},則這兩個(gè)向量夾角\theta_i的余弦值可以通過向量的內(nèi)積公式計(jì)算:\cos\theta_i=\frac{\vert\mathbf{v}_{r,i}^H\mathbf{v}_{d,i}\vert}{\vert\mathbf{v}_{r,i}\vert\vert\mathbf{v}_{d,i}\vert}其中,\vert\cdot\vert表示向量的模,\mathbf{v}_{r,i}^H是\mathbf{v}_{r,i}的共軛轉(zhuǎn)置。通過計(jì)算所有對(duì)應(yīng)列向量夾角的余弦值,得到一個(gè)夾角余弦值向量\mathbf{C}=[\cos\theta_1,\cos\theta_2,\cdots,\cos\theta_n],其中n為奇異向量的維數(shù)。為了得到一個(gè)綜合反映圖像結(jié)構(gòu)相似程度的度量值,對(duì)夾角余弦值向量進(jìn)行處理。一種常見的方法是計(jì)算其平均值,即結(jié)構(gòu)相似性度量指標(biāo)SSIM_Q:SSIM_Q=\frac{1}{n}\sum_{i=1}^{n}\cos\theta_iSSIM_Q的值越接近1,表示參考圖像和失真圖像的奇異值特征向量夾角越小,即兩幅圖像的結(jié)構(gòu)相似性越高,圖像質(zhì)量越好;反之,SSIM_Q的值越接近0,則表示圖像結(jié)構(gòu)差異越大,圖像質(zhì)量越差。例如,在一幅包含建筑物的彩色圖像中,建筑物的輪廓、線條等結(jié)構(gòu)信息在四元數(shù)矩陣的奇異值特征向量中會(huì)有相應(yīng)的體現(xiàn)。當(dāng)圖像發(fā)生模糊失真時(shí),這些結(jié)構(gòu)信息會(huì)變得模糊,導(dǎo)致奇異值特征向量發(fā)生變化,與參考圖像的奇異值特征向量夾角增大,從而使得SSIM_Q的值降低。通過基于奇異值特征向量夾角的圖像結(jié)構(gòu)相似性度量,可以準(zhǔn)確地量化這種結(jié)構(gòu)變化,為圖像質(zhì)量評(píng)價(jià)提供有力的依據(jù)。與傳統(tǒng)的基于像素誤差或簡(jiǎn)單結(jié)構(gòu)相似性的度量方法相比,這種基于四元數(shù)矩陣奇異值特征向量的方法能夠更好地捕捉彩色圖像的結(jié)構(gòu)信息,尤其是在處理復(fù)雜圖像內(nèi)容和多種失真類型時(shí),具有更高的準(zhǔn)確性和魯棒性。3.3.3結(jié)合人眼視覺特性的加權(quán)策略分析人眼對(duì)不同頻率、不同區(qū)域圖像信息的敏感度,提出基于人眼視覺特性的加權(quán)策略,是對(duì)基于四元數(shù)矩陣奇異值分解的彩色圖像質(zhì)量評(píng)價(jià)方法的進(jìn)一步優(yōu)化,旨在使評(píng)價(jià)結(jié)果更符合人類的主觀視覺感受。人眼視覺系統(tǒng)(HVS)對(duì)圖像的感知具有頻率選擇性和區(qū)域選擇性。在頻率方面,HVS對(duì)低頻信息更為敏感,因?yàn)榈皖l信息主要包含圖像的大致輪廓和背景等重要結(jié)構(gòu)信息,這些信息對(duì)于人眼理解圖像的整體內(nèi)容至關(guān)重要。例如,在觀看一幅風(fēng)景圖像時(shí),山脈、河流等大致輪廓的低頻信息能夠幫助人眼快速識(shí)別圖像的主題和場(chǎng)景。而高頻信息,如細(xì)微的紋理和噪聲,雖然也包含一定的圖像細(xì)節(jié),但人眼對(duì)其敏感度相對(duì)較低。在區(qū)域方面,HVS對(duì)圖像的中心區(qū)域和顯著區(qū)域更為關(guān)注,因?yàn)檫@些區(qū)域通常包含圖像的主要內(nèi)容和關(guān)鍵信息。例如,在一幅人物圖像中,人物的面部通常位于圖像中心區(qū)域,且具有較高的視覺顯著性,人眼會(huì)優(yōu)先關(guān)注面部的表情、特征等信息?;谝陨咸匦?,在評(píng)價(jià)圖像質(zhì)量時(shí),可以對(duì)不同頻率和不同區(qū)域的奇異值特征向量夾角賦予不同的權(quán)重。對(duì)于頻率加權(quán),根據(jù)人眼對(duì)不同頻率的敏感度曲線,可以構(gòu)建一個(gè)頻率加權(quán)函數(shù)w_f(i)。一種常見的方法是利用高斯低通濾波器的特性,將頻率與高斯函數(shù)的標(biāo)準(zhǔn)差相關(guān)聯(lián),距離低頻中心越近的頻率分量,對(duì)應(yīng)的權(quán)重越高。例如,設(shè)頻率為f_i,則頻率加權(quán)函數(shù)可以表示為:w_f(i)=\exp\left(-\frac{(f_i-f_0)^2}{2\sigma^2}\right)其中,f_0為低頻中心頻率,\sigma為標(biāo)準(zhǔn)差,控制頻率加權(quán)的范圍和變化率。通過這個(gè)加權(quán)函數(shù),對(duì)不同頻率對(duì)應(yīng)的奇異值特征向量夾角\cos\theta_i進(jìn)行加權(quán),得到頻率加權(quán)后的夾角余弦值向量\mathbf{C}_f=[w_f(1)\cos\theta_1,w_f(2)\cos\theta_2,\cdots,w_f(n)\cos\theta_n]。對(duì)于區(qū)域加權(quán),首先需要確定圖像的顯著區(qū)域和非顯著區(qū)域??梢岳们懊嫣岬降幕谒脑獢?shù)譜余量的視覺顯著性檢測(cè)方法,得到圖像的視覺顯著性圖Saliency。根據(jù)顯著性圖,對(duì)于每個(gè)像素點(diǎn)(x,y),可以計(jì)算其在圖像中的顯著性權(quán)重w_s(x,y)。顯著性越高的區(qū)域,對(duì)應(yīng)的權(quán)重越大。然后,將奇異值特征向量與圖像的像素點(diǎn)進(jìn)行對(duì)應(yīng),根據(jù)每個(gè)像素點(diǎn)的顯著性權(quán)重對(duì)奇異值特征向量夾角進(jìn)行加權(quán)。假設(shè)奇異值特征向量與圖像像素點(diǎn)的對(duì)應(yīng)關(guān)系已知,對(duì)于第i個(gè)奇異值特征向量夾角\cos\theta_i,其區(qū)域加權(quán)后的權(quán)重為該向量對(duì)應(yīng)像素點(diǎn)的顯著性權(quán)重的平均值\overline{w}_s(i)。通過區(qū)域加權(quán),得到區(qū)域加權(quán)后的夾角余弦值向量\mathbf{C}_s=[\overline{w}_s(1)\cos\theta_1,\overline{w}_s(2)\cos\theta_2,\cdots,\overline{w}_s(n)\cos\theta_n]。最后,將頻率加權(quán)和區(qū)域加權(quán)相結(jié)合,得到綜合加權(quán)后的夾角余弦值向量\mathbf{C}_{fw}。一種簡(jiǎn)單的結(jié)合方式是將頻率加權(quán)和區(qū)域加權(quán)的結(jié)果相乘,即:\mathbf{C}_{fw}=\mathbf{C}_f\odot\mathbf{C}_s其中,\odot表示逐元素相乘。再對(duì)綜合加權(quán)后的夾角余弦值向量求平均值,得到結(jié)合人眼視覺特性加權(quán)后的圖像結(jié)構(gòu)相似性度量指標(biāo)SSIM_{Qw}:SSIM_{Qw}=\frac{1}{n}\sum_{i=1}^{n}\mathbf{C}_{fw}(i)通過這種基于人眼視覺特性的加權(quán)策略,在計(jì)算圖像結(jié)構(gòu)相似性時(shí),能夠更突出地考慮人眼敏感的低頻信息和顯著區(qū)域的影響,使評(píng)價(jià)結(jié)果更符合人類的主觀視覺感受。例如,在評(píng)價(jià)一幅經(jīng)過壓縮失真的圖像時(shí),加權(quán)策略可以使評(píng)價(jià)指標(biāo)更關(guān)注圖像中對(duì)人眼視覺感知重要的部分,避免因高頻噪聲或非顯著區(qū)域的變化而導(dǎo)致評(píng)價(jià)結(jié)果與主觀感受不符。這種加權(quán)策略有效地提高了圖像質(zhì)量評(píng)價(jià)方法的準(zhǔn)確性和可靠性,使其在實(shí)際應(yīng)用中更具價(jià)值。四、四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法的拓展4.1拓展方向一:與深度學(xué)習(xí)結(jié)合的圖像質(zhì)量評(píng)價(jià)4.1.1基于深度學(xué)習(xí)的特征提取與融合隨著深度學(xué)習(xí)技術(shù)在圖像處理領(lǐng)域的廣泛應(yīng)用,其強(qiáng)大的特征提取能力為彩色圖像質(zhì)量評(píng)價(jià)帶來了新的思路。在將四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)方法與深度學(xué)習(xí)結(jié)合時(shí),基于深度學(xué)習(xí)的特征提取與融合是關(guān)鍵環(huán)節(jié)。卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為深度學(xué)習(xí)中最常用的模型之一,在圖像特征提取方面表現(xiàn)出色。它通過卷積層、池化層和全連接層等組件,能夠自動(dòng)學(xué)習(xí)到圖像的低級(jí)特征(如邊緣、紋理)和高級(jí)語義特征(如物體類別、場(chǎng)景信息)。在彩色圖像質(zhì)量評(píng)價(jià)中,利用CNN對(duì)彩色圖像進(jìn)行特征提取,可以獲取更豐富、更具代表性的圖像特征,從而提升評(píng)價(jià)的準(zhǔn)確性。在將四元數(shù)與CNN結(jié)合時(shí),首先需要將彩色圖像表示為四元數(shù)形式,以便充分利用四元數(shù)對(duì)彩色信息的整合能力。如前文所述,可將彩色圖像的RGB三個(gè)通道分別映射到四元數(shù)的三個(gè)虛部,構(gòu)建四元數(shù)表示的彩色圖像。然后,將四元數(shù)形式的彩色圖像輸入到CNN中進(jìn)行處理。為了使CNN能夠處理四元數(shù)數(shù)據(jù),需要對(duì)傳統(tǒng)的卷積層進(jìn)行改進(jìn),設(shè)計(jì)四元數(shù)卷積層。四元數(shù)卷積層的設(shè)計(jì)基于四元數(shù)的代數(shù)運(yùn)算規(guī)則。在傳統(tǒng)的卷積運(yùn)算中,卷積核與輸入數(shù)據(jù)進(jìn)行逐元素相乘并求和,而在四元數(shù)卷積中,由于四元數(shù)乘法的非交換性,需要考慮卷積核與四元數(shù)輸入數(shù)據(jù)的乘法順序。設(shè)四元數(shù)卷積核為K,四元數(shù)輸入數(shù)據(jù)為Q,則四元數(shù)卷積的計(jì)算過程可以表示為:Q'=\sum_{i,j}K_{ij}\cdotQ_{ij}其中,Q'為卷積后的輸出結(jié)果,K_{ij}和Q_{ij}分別為卷積核和輸入數(shù)據(jù)在位置(i,j)處的四元數(shù)元素,\cdot表示四元數(shù)乘法。通過這種方式,四元數(shù)卷積層能夠同時(shí)處理彩色圖像的顏色信息和空間結(jié)構(gòu)信息,提取出更全面的圖像特征。除了四元數(shù)卷積層,還可以在CNN中引入其他改進(jìn)的層結(jié)構(gòu),如四元數(shù)池化層和四元數(shù)全連接層。四元數(shù)池化層用于對(duì)四元數(shù)特征進(jìn)行降維,減少計(jì)算量的同時(shí)保留重要的特征信息;四元數(shù)全連接層則用于將提取到的特征映射到圖像質(zhì)量評(píng)價(jià)的分?jǐn)?shù)空間。在特征融合方面,將四元數(shù)特征與深度學(xué)習(xí)提取的特征進(jìn)行有效融合是提高評(píng)價(jià)性能的關(guān)鍵。一種常見的融合方法是在CNN的中間層或輸出層,將四元數(shù)特征與深度學(xué)習(xí)特征進(jìn)行拼接,然后再通過后續(xù)的層進(jìn)行進(jìn)一步的處理和融合。例如,在四元數(shù)卷積層之后,將提取到的四元數(shù)特征與傳統(tǒng)CNN卷積層提取的特征進(jìn)行拼接,然后輸入到后續(xù)的池化層和全連接層中。這樣可以充分利用四元數(shù)特征對(duì)彩色圖像顏色結(jié)構(gòu)的表達(dá)能力,以及深度學(xué)習(xí)特征對(duì)圖像語義和結(jié)構(gòu)的理解能力,實(shí)現(xiàn)特征的優(yōu)勢(shì)互補(bǔ)。為了確定融合的最佳位置和方式,可以通過實(shí)驗(yàn)對(duì)比不同融合策略下的圖像質(zhì)量評(píng)價(jià)性能。例如,分別在CNN的早期層、中期層和晚期層進(jìn)行四元數(shù)特征與深度學(xué)習(xí)特征的拼接,觀察不同情況下評(píng)價(jià)結(jié)果與人類主觀評(píng)價(jià)的相關(guān)性變化。同時(shí),還可以嘗試不同的融合權(quán)重,如等權(quán)重融合、自適應(yīng)權(quán)重融合等,以找到最優(yōu)的融合方案。通過合理的基于深度學(xué)習(xí)的特征提取與融合策略,可以為四元數(shù)全參考彩色圖像質(zhì)量評(píng)價(jià)提供更強(qiáng)大的特征表示,從而提高評(píng)價(jià)的準(zhǔn)確性和可靠性。4.1.2構(gòu)建端到端的四元數(shù)-深度學(xué)習(xí)圖像質(zhì)量評(píng)價(jià)模型構(gòu)建端到端的四元數(shù)-深度學(xué)習(xí)圖像質(zhì)量評(píng)價(jià)模型,是將四元數(shù)與深度學(xué)習(xí)相結(jié)合的核心目標(biāo)之一。這種模型能夠直接將四元數(shù)表示的彩色圖像作為輸入,經(jīng)過一系列的神經(jīng)網(wǎng)絡(luò)層處理后,輸出圖像質(zhì)量評(píng)價(jià)結(jié)果,實(shí)現(xiàn)從圖像到質(zhì)量分?jǐn)?shù)的直接映射,避免了傳統(tǒng)方法中復(fù)雜的特征工程和手工設(shè)計(jì)評(píng)價(jià)指標(biāo)的過程。在構(gòu)建端到端模型時(shí),首先需要確定模型的架構(gòu)。一種常用的架構(gòu)是基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的四元數(shù)卷積神經(jīng)網(wǎng)絡(luò)(Q-CNN)。Q-CNN在傳統(tǒng)CNN的基礎(chǔ)上,引入了四元數(shù)卷積層、四元數(shù)池化層等結(jié)構(gòu),以適應(yīng)四元數(shù)數(shù)據(jù)的處理。模型的輸入層接收四元數(shù)表示的彩色圖像,經(jīng)過多個(gè)四元數(shù)卷積層和池化層的交替處理,逐步提取圖像的特征。在卷積層中,通過四元數(shù)卷積核與圖像四元數(shù)數(shù)據(jù)的卷積運(yùn)算,提取圖像的顏色和空間結(jié)構(gòu)特征;池化層則用于對(duì)特征圖進(jìn)行降維,減少計(jì)算量并保留重要的特征信息。例如,在第一個(gè)四元數(shù)卷積層中,可以使用較小的卷積核(如3\times3)來提取圖像的局部特征,然后通過池化層(如最大池化或平均池化)對(duì)特征圖進(jìn)行下采樣。隨著網(wǎng)絡(luò)層數(shù)的增加,卷積核的大小和數(shù)量可以逐漸調(diào)整,以提取更高級(jí)的特征。在經(jīng)過多個(gè)卷積層和池化層后,模型的特征圖被輸入到全連接層中。全連接層將特征圖展開成一維向量,并通過一系列的線性變換和非線性激活函數(shù),將特征映射到圖像質(zhì)量評(píng)價(jià)的分?jǐn)?shù)空間。為了提高模型的泛化能力和穩(wěn)定性,可以在全連接層中引入正則化技術(shù),如Dropout,隨機(jī)丟棄一部分神經(jīng)元,以防止過擬合。最后,模型的輸出層輸出圖像的質(zhì)量評(píng)價(jià)分?jǐn)?shù)。模型的訓(xùn)練過程是構(gòu)建端到端模型的關(guān)鍵環(huán)節(jié)。在訓(xùn)練過程中,需要使用大量的參考圖像和失真圖像對(duì)模型進(jìn)行訓(xùn)練,以學(xué)習(xí)到圖像特征與質(zhì)量分?jǐn)?shù)之間的映射關(guān)系。首先,需要準(zhǔn)備訓(xùn)練數(shù)據(jù)集,包括從標(biāo)準(zhǔn)圖像質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù)(如LIVE、TID2013等)中選取的參考圖像和經(jīng)過不同失真處理(如高斯噪聲、JPEG壓縮、模糊等)的失真圖像。同時(shí),需要獲取這些圖像對(duì)應(yīng)的主觀質(zhì)量分?jǐn)?shù),作為訓(xùn)練的標(biāo)簽。在訓(xùn)練過程中,將四元數(shù)表示的參考圖像和失真圖像輸入到模型中,模型輸出預(yù)測(cè)的質(zhì)量分?jǐn)?shù)。然后,通過損失函數(shù)計(jì)算預(yù)測(cè)分?jǐn)?shù)與真實(shí)分?jǐn)?shù)之間的差異,常用的損失函數(shù)有均方誤差(MSE)、交叉熵?fù)p失等。以MSE為例,損失函數(shù)的計(jì)算公式為:L=\frac{1}{N}\sum_{i=1}^{N}(y_i-\hat{y}_i)^2其中,L為損失值,N為訓(xùn)練樣本的數(shù)量,y_i為第i個(gè)樣本的真實(shí)質(zhì)量分?jǐn)?shù),\hat{y}_i為模型預(yù)測(cè)的第i個(gè)樣本的質(zhì)量分?jǐn)?shù)。通過反向傳播算法,將損失值反向傳播到模型的各個(gè)層,更新模型的參數(shù)(如卷積核的權(quán)重、全連接層的權(quán)重等),使得損失值逐漸減小。在訓(xùn)練過程中,還需要設(shè)置合適的超參數(shù),如學(xué)習(xí)率、迭代次數(shù)、批量大小等,以保證模型的訓(xùn)練效果和效率。例如,學(xué)習(xí)率可以采用動(dòng)態(tài)調(diào)整的策略,在訓(xùn)練初期設(shè)置較大的值,以加快收斂速度,隨著訓(xùn)練的進(jìn)行逐漸減小,以避免錯(cuò)過最優(yōu)解。模型的優(yōu)化也是提高模型性能的重要步驟。除了在訓(xùn)練過程中調(diào)整超參數(shù)外,還可以采用一些優(yōu)化算法,如隨機(jī)梯度下降(SGD)、Adagrad、Adadelta、Adam等。這些算法在更新模型參數(shù)時(shí),采用不同的策略來計(jì)算梯度和調(diào)整學(xué)習(xí)率,以提高模型的收斂速度和穩(wěn)定性。例如,Adam算法結(jié)合了Adagrad和Adadelta的優(yōu)點(diǎn),能夠自適應(yīng)地調(diào)整每個(gè)參數(shù)的學(xué)習(xí)率,在很多深度學(xué)習(xí)任務(wù)中表現(xiàn)出良好的性能。此外,還可以對(duì)模型進(jìn)行剪枝和量化等操作,減少模型的參數(shù)數(shù)量和計(jì)算量,提高模型的運(yùn)行效率,使其更適合在資源受限的環(huán)境中應(yīng)用。通過構(gòu)建端到端的四元數(shù)-深度學(xué)習(xí)圖像質(zhì)量評(píng)價(jià)模型,并進(jìn)行有效的訓(xùn)練和優(yōu)化,可以實(shí)現(xiàn)高效、準(zhǔn)確的彩色圖像質(zhì)量評(píng)價(jià)。4.1.3實(shí)驗(yàn)驗(yàn)證與性能分析為了驗(yàn)證四元數(shù)-深度學(xué)習(xí)結(jié)合方法在彩色圖像質(zhì)量評(píng)價(jià)中的有效性,在標(biāo)準(zhǔn)圖像質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù)上進(jìn)行實(shí)驗(yàn),并與傳統(tǒng)四元數(shù)評(píng)價(jià)方法和其他經(jīng)典的圖像質(zhì)量評(píng)價(jià)方法進(jìn)行對(duì)比分析。實(shí)驗(yàn)選用了多個(gè)標(biāo)準(zhǔn)圖像質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù),如LIVE、TID2013和CSIQ等。這些數(shù)據(jù)庫(kù)包含了豐富的參考圖像和經(jīng)過不同類型失真處理的失真圖像,并且提供了相應(yīng)的主觀質(zhì)量分?jǐn)?shù),為客觀評(píng)價(jià)方法的性能評(píng)估提供了可靠的依據(jù)。在實(shí)驗(yàn)中,將數(shù)據(jù)庫(kù)中的圖像分為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于訓(xùn)練四元數(shù)-深度學(xué)習(xí)圖像質(zhì)量評(píng)價(jià)模型,測(cè)試集用于評(píng)估模型的性能。對(duì)于傳統(tǒng)四元數(shù)評(píng)價(jià)方法,如基于四元數(shù)譜余量的QSR-SIM方法和基于四元數(shù)矩陣奇異值分解的方法,直接在測(cè)試集上進(jìn)行計(jì)算和評(píng)價(jià)。同時(shí),選取了一些經(jīng)典的圖像質(zhì)量評(píng)價(jià)方法作為對(duì)比,如均方誤差(MSE)、峰值信噪比(PSNR)、結(jié)構(gòu)相似性指數(shù)(SSIM)等。在實(shí)驗(yàn)過程中,首先按照前面構(gòu)建的端到端四元數(shù)-深度學(xué)習(xí)圖像質(zhì)量評(píng)價(jià)模型,對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,調(diào)整模型的超參數(shù),使其達(dá)到較好的收斂效果。然后,將測(cè)試集中的圖像分別輸入到四元數(shù)-深度學(xué)習(xí)模型、傳統(tǒng)四元數(shù)評(píng)價(jià)方法和其他對(duì)比方法中,計(jì)算得到每個(gè)方法對(duì)測(cè)試圖像的質(zhì)量評(píng)價(jià)分?jǐn)?shù)。通過計(jì)算這些評(píng)價(jià)分?jǐn)?shù)與數(shù)據(jù)庫(kù)中提供的主觀質(zhì)量分?jǐn)?shù)之間的相關(guān)性,來評(píng)估各個(gè)方法的性能。常用的相關(guān)性指標(biāo)有斯皮爾曼等級(jí)相關(guān)系數(shù)(SROCC)和肯德爾等級(jí)相關(guān)系數(shù)(KROCC)。SROCC衡量了兩個(gè)變量之間的單調(diào)關(guān)系,KROCC則更側(cè)重于衡量?jī)蓚€(gè)變量之間的一致性。這兩個(gè)指標(biāo)的值越接近1,表示評(píng)價(jià)方法的結(jié)果與主觀評(píng)價(jià)的相關(guān)性越高,即評(píng)價(jià)方法越準(zhǔn)確。實(shí)驗(yàn)結(jié)果表明,四元數(shù)-深度學(xué)習(xí)結(jié)合方法在大多數(shù)情況下表現(xiàn)優(yōu)于傳統(tǒng)四元數(shù)評(píng)價(jià)方法和其他對(duì)比方法。在SROCC指標(biāo)上,四元數(shù)-深度學(xué)習(xí)模型在LIVE數(shù)據(jù)庫(kù)上的SROCC值達(dá)到了[具體數(shù)值],而傳統(tǒng)四元數(shù)評(píng)價(jià)方法中表現(xiàn)較好的基于四元數(shù)矩陣奇異值分解的方法的SROCC值為[具體數(shù)值],SSIM的SROCC值為[具體數(shù)值]。在KROCC指標(biāo)上也有類似的結(jié)果,四元數(shù)-深度學(xué)習(xí)模型的KROCC值為[具體數(shù)值],明顯高于其他方法。這表明四元數(shù)-深度學(xué)習(xí)結(jié)合方法能夠更準(zhǔn)確地預(yù)測(cè)圖像的質(zhì)量,其評(píng)價(jià)結(jié)果與人類主觀感知的一致性更高。進(jìn)一步分析四元數(shù)-深度學(xué)習(xí)結(jié)合方法的優(yōu)勢(shì),主要體現(xiàn)在以下幾個(gè)方面。首先,深度學(xué)習(xí)強(qiáng)大的特征提取能力使得模型能夠?qū)W習(xí)到更豐富、更高級(jí)的圖像特征,這些特征能夠更好地反映圖像的質(zhì)量變化。例如,在處理復(fù)雜失真類型的圖像時(shí),深度學(xué)習(xí)模型能夠自動(dòng)捕捉到圖像中的語義信息和結(jié)構(gòu)變化,從而更準(zhǔn)確地評(píng)估圖像質(zhì)量。而傳統(tǒng)四元數(shù)評(píng)價(jià)方法往往依賴于手工設(shè)計(jì)的特征和評(píng)價(jià)指標(biāo),對(duì)于復(fù)雜失真的適應(yīng)性較差。其次,將四元數(shù)表示與深度學(xué)習(xí)相結(jié)合,充分利用了四元數(shù)對(duì)彩色圖像顏色信息的整合能力,使得模型在處理彩色圖像時(shí)能夠更好地考慮顏色因素對(duì)圖像質(zhì)量的影響。相比之下,一些傳統(tǒng)方法在處理彩色圖像時(shí)對(duì)顏色信息的利用不夠充分,導(dǎo)致評(píng)價(jià)結(jié)果存在偏差。最后,端到端的模型結(jié)構(gòu)使得整個(gè)評(píng)價(jià)過程更加簡(jiǎn)潔高效,避免了傳統(tǒng)方法中復(fù)雜的特征工程和評(píng)價(jià)指標(biāo)設(shè)計(jì)過程,提高了評(píng)價(jià)的效率和準(zhǔn)確性。通過在標(biāo)準(zhǔn)圖像質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)驗(yàn)證和性能分析,充分證明了四元數(shù)-深度學(xué)習(xí)結(jié)合方法在彩色圖像質(zhì)量評(píng)價(jià)中的優(yōu)勢(shì)和有效性,為彩色圖像質(zhì)量評(píng)價(jià)提供了一種更先進(jìn)、更準(zhǔn)確的方法。4.2拓展方向二:無參考彩色圖像質(zhì)量評(píng)價(jià)4.2.1基于四元數(shù)的圖像特征提取用于無參考評(píng)價(jià)在無參考彩色圖像質(zhì)量評(píng)價(jià)中,基于四元數(shù)的圖像特征提取是關(guān)鍵步驟,它能夠從四元數(shù)表示的彩色圖像中挖掘出反映圖像質(zhì)量的關(guān)鍵信息,為后續(xù)的質(zhì)量評(píng)估提供有力支持。對(duì)于基于四元數(shù)的局部特征提取,主要關(guān)注圖像中局部區(qū)域的特性。一種常用的方法是利用四元數(shù)的梯度信息。在四元數(shù)域中,通過計(jì)算四元數(shù)矩陣的梯度,可以獲取圖像局部區(qū)域的變化情況。對(duì)于四元數(shù)矩陣Q(x,y),其在x和y方向上的梯度計(jì)算如下:\nabla_xQ(x,y)=Q(x+1,y)-Q(x,y)\nabla_yQ(x,y)=Q(x,y+1)-Q(x,y)這些梯度信息反映了圖像在不同方向上的局部變化率,對(duì)于判斷圖像的邊緣、紋理等結(jié)構(gòu)信息非常重要。例如,在一幅自然風(fēng)景圖像中,山脈的輪廓、樹木的紋理等區(qū)域在四元數(shù)梯度特征中會(huì)表現(xiàn)出明顯的變化,而平坦的天空等區(qū)域梯度變化相對(duì)較小。通過分析這些局部梯度特征,可以判斷圖像在這些區(qū)域是否存在失真,如邊緣模糊、紋理丟失等質(zhì)量問題。除了梯度特征,還可以提取四元數(shù)的局部統(tǒng)計(jì)特征。以局部均值和方差為例,對(duì)于以像素點(diǎn)(x,y)為中心的局部鄰域N(x,y),計(jì)算其局部均值\mu(x,y)和方差\sigma^2(x,y):\mu(x,y)=\frac{1}{|N(x,y)|}\sum_{(i,j)\inN(x,y)}Q(i,j)\sigma^2(x,y)=\frac{1}{|N(x,y)|}\sum_{(i,j)\inN(x,y)}(Q(i,j)-\mu(x,y))^2局部均值反映了局部區(qū)域的平均特征,方差則體現(xiàn)了局部區(qū)域的特征變化程度。在圖像質(zhì)量評(píng)價(jià)中,正常圖像的局部均值和方差通常具有一定的統(tǒng)計(jì)規(guī)律,而當(dāng)圖像發(fā)生失真時(shí),這些統(tǒng)計(jì)特征會(huì)發(fā)生改變。比如,在圖像受到高斯噪聲干擾時(shí),局部方差會(huì)增大,因?yàn)樵肼暤拇嬖谑沟脠D像局部區(qū)域的變化更加劇烈。通過對(duì)比正常圖像和待評(píng)價(jià)圖像的局部統(tǒng)計(jì)特征,可以判斷圖像是否存在質(zhì)量問題以及問題的嚴(yán)重程度。在統(tǒng)計(jì)特征方面,除了局部統(tǒng)計(jì)特征,還可以從全局角度分析四元數(shù)的統(tǒng)計(jì)特性。例如,計(jì)算四元數(shù)圖像的直方圖特征。將四元數(shù)的每個(gè)分量(實(shí)部和三個(gè)虛部)分別進(jìn)行直方圖統(tǒng)計(jì),得到多個(gè)直方圖。這些直方圖反映了四元數(shù)在不同取值范圍內(nèi)的分布情況,包含了圖像的整體亮度、顏色分布等信息。對(duì)于正常的彩色圖像,其直方圖具有一定的形狀和分布規(guī)律,而當(dāng)圖像發(fā)生顏色失真、亮度異常等質(zhì)量問題時(shí),直方圖會(huì)發(fā)生明顯的變化。通過比較待評(píng)價(jià)圖像與正常圖像的直方圖特征,可以評(píng)估圖像的質(zhì)量狀況。此外,還可以利用四元數(shù)的高階統(tǒng)計(jì)量,如偏度和峰度。偏度衡量了四元數(shù)分布的不對(duì)稱程度,峰度則描述了分布的尖峰程度。這些高階統(tǒng)計(jì)量能夠進(jìn)一步揭示圖像的統(tǒng)計(jì)特性,對(duì)于檢測(cè)圖像中的異常情況和質(zhì)量變化具有重要意義。在實(shí)際應(yīng)用中,通過提取基于四元數(shù)的局部特征和統(tǒng)計(jì)特征,并綜合分析這些特征的變化,可以更全面、準(zhǔn)確地判斷彩色圖像的質(zhì)量,為無參考彩色圖像質(zhì)量評(píng)價(jià)提供有效的特征依據(jù)。4.2.2基于寬度學(xué)習(xí)的無參考圖像質(zhì)量評(píng)價(jià)模型構(gòu)建寬度學(xué)習(xí)是一種新型的快速學(xué)習(xí)算法,它在無參考圖像質(zhì)量評(píng)價(jià)模型構(gòu)建中展現(xiàn)出獨(dú)特的優(yōu)勢(shì)。寬度學(xué)習(xí)的基本原理是通過構(gòu)建一個(gè)具有多個(gè)神經(jīng)元的隱藏層,利用隨機(jī)映射將輸入數(shù)據(jù)映射到隱藏層空間,然后通過簡(jiǎn)單的線性回歸計(jì)算輸出結(jié)果。與傳統(tǒng)的深度學(xué)習(xí)方法相比,寬度學(xué)習(xí)不需要復(fù)雜的迭代訓(xùn)練過程,計(jì)算效率高,且具有較好的泛化能力。在構(gòu)建基于寬度學(xué)習(xí)的無參考彩色圖像質(zhì)量評(píng)價(jià)模型時(shí),首先將前面提取的基于四元數(shù)的圖像特征作為模型的輸入。這些特征包括四元數(shù)的局部梯度特征、局部統(tǒng)計(jì)特征、直方圖特征以及高階統(tǒng)計(jì)量等,它們從不同角度反映了彩色圖像的質(zhì)量信息。將這些特征向量輸入到寬度學(xué)習(xí)模型的輸入層,模型的隱藏層由多個(gè)神經(jīng)元組成,每個(gè)神經(jīng)元通過隨機(jī)生成的映射函數(shù)對(duì)輸入特征進(jìn)行非線性變換。例如,對(duì)于輸入特征向量\mathbf{x},隱藏層神經(jīng)元i的輸出h_i可以表示為:h_i=g(\mathbf{w}_i^T\mathbf{x}+b_i)其中,\mathbf{w}_i是隨機(jī)生成的權(quán)重向量,b_i是偏置項(xiàng),g(\cdot)是非線性激活函數(shù),如ReLU函數(shù)g(x)=\max(0,x)。通過這種方式,隱藏層將輸入特征映射到一個(gè)高維的特征空間,增強(qiáng)了模型對(duì)特征的表達(dá)能力。在隱藏層之后,通過簡(jiǎn)單的線性回歸計(jì)算輸出結(jié)果。設(shè)隱藏層的輸出矩陣為H,其大小為n\timesm,其中n是樣本數(shù)量,m是隱藏層神經(jīng)元的數(shù)量。輸出層的權(quán)重矩陣為\mathbf{\beta},其大小為m\times1。則模型的輸出\mathbf{y}可以表示為:\mathbf{y}=H\mathbf{\beta}為了確定輸出層的權(quán)重矩陣\mathbf{\beta},可以使用最小二乘法。給定訓(xùn)練樣本集\{(\mathbf{x}_k,y_k)\}_{k=1}^{n},其中\(zhòng)mathbf{x}_k是第k個(gè)樣本的輸入特征向量,y_k是對(duì)應(yīng)的真實(shí)質(zhì)量分?jǐn)?shù),通過求解以下優(yōu)化問題來確定\mathbf{\beta}:\min_{\mathbf{\beta}}\|\mathbf{y}-H\mathbf{\beta}\|_2^2其解析解為\mathbf{\beta}=(H^TH)^{-1}H^T\mathbf{y}。在實(shí)際應(yīng)用中,為了防止過擬合,可以引入正則化項(xiàng),如嶺回歸,其優(yōu)化問題變?yōu)椋篭min_{\mathbf{\beta}}\|\mathbf{y}-H\mathbf{\beta}\|_2^2+\lambda\|\mathbf{\beta}\|_2^2其中,\lambda是正則化參數(shù),通過調(diào)整\lambda的值可以平衡模型的擬合能力和泛化能力。通過以上步驟,構(gòu)建了基于寬度學(xué)習(xí)的無參考彩色圖像質(zhì)量評(píng)價(jià)模型。該模型利用寬度學(xué)習(xí)的快速計(jì)算和良好泛化能力,結(jié)合基于四元數(shù)的圖像特征,能夠有效地對(duì)無參考彩色圖像的質(zhì)量進(jìn)行評(píng)估。在實(shí)際應(yīng)用中,可以使用大量的彩色圖像樣本對(duì)模型進(jìn)行訓(xùn)練,不斷優(yōu)化模型的性能,使其能夠準(zhǔn)確地預(yù)測(cè)不同類型失真的彩色圖像的質(zhì)量。4.2.3實(shí)驗(yàn)對(duì)比與分析為了驗(yàn)證基于四元數(shù)和寬度學(xué)習(xí)的無參考彩色圖像質(zhì)量評(píng)價(jià)方法的性能,在無參考圖像質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù)上進(jìn)行了一系列實(shí)驗(yàn),并與其他無參考評(píng)價(jià)方法進(jìn)行了全面對(duì)比分析。實(shí)驗(yàn)選用了多個(gè)標(biāo)準(zhǔn)的無參考圖像質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù),如LIVE、TID2013和CSIQ等。這些數(shù)據(jù)庫(kù)包含了豐富的不同類型失真的彩色圖像,且提供了相應(yīng)的主觀質(zhì)量分?jǐn)?shù),為客觀評(píng)價(jià)方法的性能評(píng)估提供了可靠依據(jù)。在實(shí)驗(yàn)中,將數(shù)據(jù)庫(kù)中的圖像劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于訓(xùn)練基于四元數(shù)和寬度學(xué)習(xí)的評(píng)價(jià)模型,測(cè)試集用于評(píng)估模型的性能。同時(shí),選取了一些經(jīng)典的無參考圖像質(zhì)量評(píng)價(jià)方法作為對(duì)比,如BRISQUE(基于自然圖像統(tǒng)計(jì)的方法)、NIQE(自然圖像質(zhì)量評(píng)估)和基于深度學(xué)習(xí)的無參考評(píng)價(jià)方法等。在實(shí)驗(yàn)過程中,首先按照前面構(gòu)建的基于四元數(shù)和寬度學(xué)習(xí)的評(píng)價(jià)模型,利用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練,調(diào)整模型的相關(guān)參數(shù),如隱藏層神經(jīng)元數(shù)量、正則化參數(shù)等,使其達(dá)到較好的性能。然后,將測(cè)試集中的圖像分別輸入到基于四元數(shù)和寬度學(xué)習(xí)的評(píng)價(jià)模型以及其他對(duì)比方法中,計(jì)算得到每個(gè)方法對(duì)測(cè)試圖像的質(zhì)量評(píng)價(jià)分?jǐn)?shù)。通過計(jì)算這些評(píng)價(jià)分?jǐn)?shù)與數(shù)據(jù)庫(kù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論