版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第5章對抗樣本綜述《多媒體信息安全》目錄三一
對抗樣本簡介二
典型的對抗樣本算法
針對深度檢索哈希的對抗樣本攻擊對抗樣本簡介DNN的脆弱性——對抗樣本對抗樣本定義:對抗樣本(Adversarialexamples)是指在原始輸入樣本中添加不可分辨的擾動所形成的新輸入樣本,該樣本會導致模型以高置信度給出一個錯誤的輸出。Szegedy等人在2014年的ICLR中首次提出了對抗樣本,并給出了對抗樣本的數(shù)學表達。對抗樣本評價指標:1)Perceptibility2)Performance3)EfficiencyC.Szegedy,W.Zaremba,I.Sutskever,J.Bruna,D.Erhan,I.Goodfellow,andR.Fergus.Intriguingpropertiesofneuralnetworks.InInternationalConferenceonLearningRepresentations,2014.(L-BFGS)01對抗樣本簡介對抗樣本的應用:1)智能駕駛:對抗樣本可以模擬智能駕駛過程中攻擊者對模型的干擾,避免真實使用中的可能發(fā)生的車輛事故。2)對抗訓練:通過將對抗樣本作為一種攻擊,通過對抗訓練的方式得到更加魯邦的模型。對抗樣本攻擊方式生成方式白盒攻擊:FGSM,BIM,PGD,CW,Deepfool,DDN…黑盒攻擊:UAP,ZOO,Onepixel…基于梯度的攻擊:FGSM,PGD,Deepfool…基于優(yōu)化的攻擊:CW,DDN…對抗樣本的研究發(fā)展與應用02對抗樣本簡介
03對抗樣本的相關數(shù)學基礎對抗樣本簡介04梯度下降
x=0.08646011,y=2.0074769020次迭代后目錄三一
對抗樣本簡介二典型的對抗樣本生成算法
針對深度檢索哈希的對抗樣本攻擊典型的對抗樣本生成算法1FastGradientSignMethod
(FGSM)&I-FGSMI.J.Goodfellow,J.Shlens,andC.Szegedy.ExplainingandHarnessingAdversarialExamples.InInternationalConferenceonLearningRepresentations,2015
優(yōu)點:快速
缺點:一步式攻擊,沒有像素裁剪,對復雜非線性模型成功率低
解決了FGSM一步攻擊無法成功攻擊復雜非線性模型的問題,同時每一次梯度下降后都進行像素裁剪,改進了對抗樣本質(zhì)量FGSMI-FGSMA.Kurakin,I.Goodfellow,andS.Bengio.Adversarialexamplesinthephysicalworld.InInternationalConferenceonLearningRepresentations(workshoptrack),2017典型的對抗樣本生成算法2MomentumIterativeFastGradientSignMethod(MI-FGSM)MI-FGSMDongY,LiaoF,PangT,etal.Boostingadversarialattackswithmomentum[C].ProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition,2018:9185-9193.
Nesterovmomentumiterativefastgradientsignmethod(N-MI-FGSM)進一步改進多步策略,運用動量的思想使得生成的對抗樣本具有良好的傳遞性和圖像質(zhì)量典型的對抗樣本生成算法3CWN.CarliniandD.Wagner.Towardsevaluatingtherobustnessofneuralnetworks.InIEEESymposiumonSecurityandPrivacy(SP),pages39–57,2017.
CW優(yōu)化
平均擾動大小攻擊成功率典型的對抗樣本生成算法3CWN.CarliniandD.Wagner.Towardsevaluatingtherobustnessofneuralnetworks.InIEEESymposiumonSecurityandPrivacy(SP),pages39–57,2017.
CW優(yōu)化尋找cc=0.1是個臨界點,c從0.1增大時攻擊成功率迅速上升,小于0.1或者大于1時,攻擊成功率比較平緩二分查找計算出盡量小的c評價:擾動最小的對抗樣本算法之一,攻擊成功率非常高,不足在于運行時間非常長典型的對抗樣本生成算法4Deepfool與UAPS.-M.Moosavi-Dezfooli,A.Fawzi,andP.Frossard.Deepfool:asimpleandaccuratemethodtofooldeepneuralnetworks.InProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition,pages2574–2582,2016.S.M.Moosavi-Dezfooli,A.Fawzi,O.Fawzi,andP.Frossard,‘‘Universaladversarialperturbations,’’inProc.IEEEConf.Comput.Vis.PatternRecognit.(CVPR),Jul.2017,pp.86–94.
UAP的思想是訓練出一種可以對整個數(shù)據(jù)集的圖像都有效的對抗樣本,圖像加上這個通用擾動后都會是分類器分類錯誤Deepfool基于Deepfool典型的對抗樣本生成算法4Deepfool與UAPdeepfool典型的對抗樣本生成算法5DecoupledDirectionandNormAttack(DDN)MI-FGSMCWR.Jerome,H.LuizG.andOliveira,LuizS.andA.IsmailBenandS.RobertandG.Eric.DecouplingDirectionandNormforEfficientGradient-BasedL2AdversarialAttacksandDefenses.ConferenceonComputerVisionandPatternRecognition,2019.典型的對抗樣本生成算法5DecoupledDirectionandNormAttack(DDN)R.Jerome,H.LuizG.andOliveira,LuizS.andA.IsmailBenandS.RobertandG.Eric.DecouplingDirectionandNormforEfficientGradient-BasedL2AdversarialAttacksandDefenses.ConferenceonComputerVisionandPatternRecognition,2019.DDN對抗樣本示例目錄三一
對抗樣本簡介二典型的對抗樣本算法
針對深度檢索哈希的對抗樣本攻擊深度檢索哈希簡介針對深度檢索哈希的對抗樣本攻擊每張圖片都可以通過某種算法得到一個hash值,稱為圖片指紋,兩張指紋相近的圖片可以認為是相似圖片,一般用漢明距離來衡量圖像之間的相似程度。圖像哈??梢杂脕碜鰣D像檢索、以圖搜圖、相似度比較等等隨著人工智能的發(fā)展和圖像數(shù)量的增多,傳統(tǒng)的哈希生成方法在實際應用中暴露出效率不高的問題,使用深度學習改進圖像哈希成為一個新的趨勢。深度哈希針對深度檢索哈希的對抗樣本攻擊深度哈希有監(jiān)督:訓練模型需要標簽,模型精確度高無監(jiān)督:訓練模型不需要標簽,模型精確度低Z.Cao,M.Long,J.Wang,andP.S.Yu,“HashNet:Deeplearningtohashbycontinuation,”inProc.ICCV,2017,pp.5609–5618.
HashAdversaryGeneration(HAG)針對深度檢索哈希的對抗樣本攻擊E.Yang,T.Liu,C.Deng,andD.Tao,“Adversarialexamplesforhammingspacesearch,”IEEETransactionsonCybernetics,vol.50,no.4,pp.1473–1484,2020.查詢圖像檢索數(shù)據(jù)庫的哈希碼漢明距離輸出漢明距離最小的前十張圖像增大漢明距離無目標攻擊
選擇性修改像素,避免像素全部修改
DeepHashingTargetedAttack(DHTA)針對深度檢索哈希的對抗樣本攻擊J.Bai,B.Chen,Y.Li,D.Wu,W.Guo,S.Xia,andE.Yang,“Targetedattackfordeephashingbasedretrieval,”inProceedingsofEuropeanConferenceonComputerVision(ECCV),2020,pp.618–634.DeepHashingTargetedAttack(DHTA)針對深度檢索哈希的對抗樣本攻擊深度哈希模型被對抗樣本攻擊后檢索結果發(fā)生變化Non-targetedDeepHashingAttack(NDHA)針對深度檢索哈希的對抗樣本攻擊(4)(3)2000epoch->360epochanchor-movingNon-targetedDeepHashingAttack(NDHA)針對深度檢索哈希的對抗樣本攻擊NUSWIDE
Z為像素數(shù)Non-targetedDeepHashingAttack(NDHA)針對深度檢索哈希的對抗樣本攻擊MAPTopN曲線PR曲線國家重點研發(fā)計劃項目申報謝謝!第6章生成對抗網(wǎng)絡《多媒體信息安全》目錄三一
背景知識二
GAN的基本原理及衍生模型
GAN的應用人工智能、機器學習和深度學習1956年,幾個計算機科學家相聚在達特茅斯會議,提出了“人工智能”的概念。2012年以后,得益于數(shù)據(jù)量的上漲、運算力的提升和機器學習新算法(深度學習)的出現(xiàn),人工智能開始大爆發(fā)。通常將人工智能分為弱人工智能和強人工智能。機器學習是用大量的數(shù)據(jù)來“訓練”,通過各種算法從數(shù)據(jù)中學習如何完成任務。機器學習直接來源于早期的人工智能領域,傳統(tǒng)的算法包括決策樹、支持向量機等等。從學習方法上來分,機器學習算法可以分為監(jiān)督學習、無監(jiān)督學習、半監(jiān)督學習等。最初的深度學習是利用深度神經(jīng)網(wǎng)絡來解決特征表達的一種學習過程。它本身并不是一個全新的概念,可大致理解為包含多個隱含層的神經(jīng)網(wǎng)絡結構。為了提高深層神經(jīng)網(wǎng)絡的訓練效果,對神經(jīng)元的連接方法和激活函數(shù)等方面做出相應的調(diào)整。人工智能:ArtificialIntelligence機器學習:MachineLearning深度學習:DeepLearning人工智能:從概念提出到走向繁榮機器學習:一種實現(xiàn)人工智能的方法深度學習:一種實現(xiàn)機器學習的技術人工智能研究的各個分支人工智能,機器學習和深度學習的關系人工智能、機器學習和深度學習DeepNeuralNetworks從感知機(1958)到神經(jīng)網(wǎng)絡感知機的模型感知機的模型是一個有若干輸入和一個輸出的模型輸出和輸入之間學習到一個線性關系,得到中間輸出結果
接著是一個神經(jīng)元激活函數(shù)
神經(jīng)網(wǎng)絡的擴展:(1)加入了隱藏層(2)輸出多個神經(jīng)元(3)擴展了激活函數(shù)Sigmoid函數(shù)
SoftMax函數(shù)tanh
Relu
DeepNeuralNetworksDeepResidualNetwork-ResNet一般印象當中,深度學習愈是深(復雜,參數(shù)多)愈是有著更強的表達能力。憑著這一基本準則CNN分類網(wǎng)絡自Alexnet的7層發(fā)展到了VGG的16乃至19層,后來更有了Googlenet的22層。層數(shù)越多越好嗎?顯然并不是。CNN網(wǎng)絡達到一定深度后,再一味地增加層數(shù)并不能帶來進一步地分類性能提高,反而會招致網(wǎng)絡收斂變得更慢,測試集的分類準確率也變得更差。排除數(shù)據(jù)集過小帶來的模型過擬合等問題后,發(fā)現(xiàn)過深的網(wǎng)絡仍然還會使分類準確度下降。深度網(wǎng)絡的退化問題至少說明深度網(wǎng)絡不容易訓練。但是我們考慮這樣一個事實:現(xiàn)在你有一個淺層網(wǎng)絡,你想通過向上堆積新層來建立深層網(wǎng)絡,一個極端情況是這些增加的層什么也不學習,僅僅復制淺層網(wǎng)絡的特征,即這樣新層是恒等映射(Identitymapping)。在這種情況下,深層網(wǎng)絡應該至少和淺層網(wǎng)絡性能一樣,也不應該出現(xiàn)退化現(xiàn)象。所以是目前的訓練方法有問題,才使得深層網(wǎng)絡很難去找到一個好的參數(shù)。HeK,ZhangX,RenS,etal.DeepResidualLearningforImageRecognition[J].IEEE,2016.DeepResidualNetwork-ResNet殘差學習
Input:Residual:特征:
特征:
殘差學習相比原始特征直接學習更容易。當殘差為0時,此時堆積層僅僅做了恒等映射,至少網(wǎng)絡性能不會下降。實際上殘差不會為0,這也會使得堆積層在輸入特征基礎上學習到新的特征,從而擁有更好的性能?!岸搪愤B接”(shortcuts,skipconnection)DenseNet更激進的密集連接機制:互相連接所有的層,即每個層都會接受其前面所有層作為其額外的輸入。HuangG,LiuZ,LaurensV,etal.DenselyConnectedConvolutionalNetworks[J].IEEEComputerSociety,2016.目錄三一
背景知識二
GAN的基本原理及衍生模型
GAN的應用GAN的工作原理黑線:真實樣本綠線:生成樣本G藍線:判別模型D
對判別模型D的優(yōu)化:D(x)--大,D(G(z))--小對生成模型G的優(yōu)化:D(G(z))--大GoodfellowIJ,Pouget-AbadieJ,MirzaM,etal.GenerativeAdversarialNetworks[J].AdvancesinNeuralInformationProcessingSystems,2014,3:2672-2680.:真實圖像的分布
:生成圖像的分布GAN的變體王正龍,張保穩(wěn).生成對抗網(wǎng)絡研究綜述[J].網(wǎng)絡與信息安全學報,7(4):18.GAN的應用場景DCGAN深度卷積生成對抗網(wǎng)絡(DeepConvolutionalGenerativeAdversarialNetwork)。參考論文:《UnsupervisedRepresentationLearningwithDeepConvolutionalGenerativeAdversarialNetworks》代碼地址:/eriklindernoren/Keras-GAN/blob/master/dcgan/dcgan.pyGAN的應用場景YangLC,ChouSY,YangYH.MidiNet:AConvolutionalGenerativeAdversarialNetworkforSymbolic-domainMusicGeneration[J].2017.GAN的應用場景標簽-街景,標簽-建筑物,黑白圖像-彩色圖像,俯拍圖-地圖,白天-晚上,輪廓-圖像GAN的應用場景ZhuJY,ParkT,IsolaP,etal.UnpairedImage-to-ImageTranslationusingCycle-ConsistentAdversarialNetworks[J].IEEE,2017.https://junyanz.github.io/CycleGAN/學習GAN的基礎了解導數(shù)、概率、矩陣及其運算等基本數(shù)學知識熟悉不同算法,掌握調(diào)參的技巧,務實代碼功底提高自己的編程能力(比如刷LeetCode,/,codeforces,/)條件生成對抗網(wǎng)絡-CGAN
GAN和CGAN的生成器G的目標函數(shù)超分辨率圖像復原生成對抗網(wǎng)絡-SRGAN從低分辨率(LowResolution)圖像中提取高分辨率(HighResolution)圖像稱為超分辨率(SuperResolution)。LedigC,TheisL,FHuszar,etal.Photo-RealisticSingleImageSuper-ResolutionUsingaGenerativeAdversarialNetwork[C]//IEEEComputerSociety.IEEEComputerSociety,2016.超分辨率圖像復原生成對抗網(wǎng)絡-SRGANSRGAN的生成器和判別器超分辨率圖像復原生成對抗網(wǎng)絡-SRGAN
目標函數(shù):損失函數(shù):
目錄三一
背景知識二
GAN的基本原理及衍生模型
GAN的應用基于CGAN的深度魯棒圖像水印攻擊基于CGAN的深度魯棒圖像水印攻擊國家重點研發(fā)計劃項目申報謝謝!第七章數(shù)字圖像取證《多媒體信息安全》目錄三一
數(shù)字圖像取證簡介二
圖像復制-粘貼篡改盲取證技術
圖像重采樣取證技術四
JPEG壓縮取證技術五
基于噪聲不一致性的圖像取證技術
重捕獲圖像取證技術六
圖像對比度增強取證技術七
DeepFake取證技術八一二
圖像復制-粘貼篡改盲取證技術53數(shù)字圖像取證簡介背景與重要性1.圖像作為信息載體的重要性
圖像比文字更直觀,是大眾獲取信息的重要來源。
數(shù)字時代,圖像篡改變得簡單且普遍,會對社會造成負面影響。2.圖像篡改的現(xiàn)狀
模擬膠卷相機時代:篡改難度高,真實性少受質(zhì)疑。
數(shù)字時代:智能手機和編輯軟件普及,篡改門檻大幅降低。
負面影響:偽造圖像可能影響司法公正、損害他人利益。54數(shù)字圖像取證簡介背景與重要性3.圖像取證的重要性
圖像取證技術用于驗證圖像來源和內(nèi)容的真實性。
隨著深度學習技術發(fā)展,篡改圖像更加“以假亂真”,取證技術需不斷進步。4.典型案例
華南虎照片事件:2007年陜西省農(nóng)民拍攝的“野生華南虎”照片被證實為年畫翻拍,多名官員受處分。目錄三一
數(shù)字圖像取證簡介二
圖像復制-粘貼篡改盲取證技術
圖像重采樣取證技術四
JPEG壓縮取證技術五
基于噪聲不一致性的圖像取證技術
重捕獲圖像取證技術六
圖像對比度增強取證技術七
DeepFake取證技術八一二
圖像復制-粘貼篡改盲取證技術56圖像復制-粘貼篡改數(shù)字圖像篡改的類型與示例1.圖像篡改的類型
圖像拼接篡改:用其他圖像的一部分替換目標圖像的部分。
復制-粘貼篡改:復制同一圖像的局部并粘貼到其他位置。2.復制-粘貼篡改示例
篡改目的:隱藏或修改圖像中的目標(如隱藏卡車)。
篡改手段:利用同幅圖像的光照、亮度一致性進行操作。
復制-粘貼篡改操作示例57圖像復制-粘貼篡改復制-粘貼篡改的分類1.按篡改目的分類
隱蔽性篡改:用其他圖像的一部分替換目標圖像的部分。
擴完性篡改:復制同一圖像的局部并粘貼到其他位置。2.按篡改手段分類
平移:直接移動圖像部分。
旋轉(zhuǎn)/尺度變換:調(diào)整圖像部分的方向或大小。
光照變換:改變圖像部分的光照效果。
58圖像復制-粘貼篡改
復制-粘貼篡改的分類
復制-粘貼篡改分類示意圖59圖像復制-粘貼篡改基于篡改目的分類1.隱蔽性復制-粘貼篡改
篡改區(qū)域紋理與背景相似,利用平滑背景遮蓋不希望存在的目標。
篡改圖像背景復雜且位置隱蔽。2.擴充性復制-粘貼篡改
造成假象類復制-粘貼篡改旨在增加圖像中目標數(shù)量,易造成圖像內(nèi)容的假象。
60圖像復制-粘貼篡改基于篡改手段分類1.平移
復制-粘貼篡改最簡單的操作,即復制圖像區(qū)域并平移粘貼到該圖像另一區(qū)域,其模型如圖所示。設復制區(qū)域A中任意點坐標為(x,y),平移后粘貼區(qū)域A'中對應點坐標為(x',y'),則復制區(qū)域A與粘貼區(qū)域A'對應點坐標滿足式(7-1)。(7-1)復制-粘貼篡改平移操作模型61圖像復制-粘貼篡改基于篡改手段分類2.旋轉(zhuǎn)
在實際應用中,旋轉(zhuǎn)和平移操作同時存在,即復制圖像區(qū)域,經(jīng)過旋轉(zhuǎn)后平移粘貼到該圖像另一區(qū)域,其模型如圖所示。設復制區(qū)域A中任意點坐標為(x,y),旋轉(zhuǎn)角度θ后區(qū)域A1,平移后粘貼區(qū)域A'中對應點坐標為(x',y'),則復制區(qū)域A與粘貼區(qū)域A'對應點坐標滿足式(7-2)。(7-2)
復制-粘貼篡改旋轉(zhuǎn)+平移操作模型62圖像復制-粘貼篡改基于篡改手段分類3.尺度變換
與旋轉(zhuǎn)操作類似,尺度變換和平移操作同時存在,即復制圖像區(qū)域,經(jīng)過尺度變換后平移粘貼到該圖像另一區(qū)域,其模型如圖7-6所示。設復制區(qū)域A中任意點坐標為(x,y),進行因子為k的尺度變換后區(qū)域是A1,平移后粘貼區(qū)域A'中對應點坐標為(x',y'),則復制區(qū)域A與粘貼區(qū)域A'對應點坐標滿足式(7-3)。(7-3)復制-粘貼篡改尺度變換+平移操作模型63圖像復制-粘貼篡改基于篡改手段分類4.光照變換
光照變換與前面三種操作方式不同,不僅是圖像像素位置發(fā)生變化,同時也伴隨像素值變化。由于同幅圖像中光照強度不同,直接復制-粘貼造成的篡改痕跡明顯,如圖(b)中的路牌,因此,光照變換是隱藏篡改痕跡的重要手段,如圖(c)中變暗的路牌。
(a)
(b)
(c)(a)真實圖像,(b)復制-粘貼篡改圖像,(c)光照變換篡改圖像64圖像復制-粘貼篡改盲取證技術
由于數(shù)字圖像復制-粘貼篡改的簡單性、有效性及易使用性,吸引了大量篡改者對數(shù)字圖像的內(nèi)容進行篡改。然而自然物體紋理多樣且復雜,不可能出現(xiàn)紋理信息完全一致的真實物體,復制-粘貼篡改盲取證算法則根據(jù)這一原則,尋找圖像中紋理完全一致的區(qū)域為復制-粘貼篡改區(qū)域。
復制-粘貼取證算法應當具有:
①高精度(能夠準確識別被篡改區(qū)域);
②低計算復雜度(能夠快速得到檢測結果);
③魯棒性(能夠應對旋轉(zhuǎn)、縮放、噪聲等攻擊)。
65圖像復制-粘貼篡改盲取證技術經(jīng)典復制-粘貼取證算法通用流程
經(jīng)典復制-粘貼取證算法通用流程,包括預處理、特征提取、特征匹配和后處理四個步驟。復制-粘貼篡改取證傳統(tǒng)方法基本流程圖66圖像復制-粘貼篡改盲取證技術預處理
在預處理階段,主要是對待檢測的圖像進行簡化預處理,為后續(xù)檢測工作做準備。其目的是在不改變待檢測圖像統(tǒng)計特征前提下,使待檢測圖像的結構更加簡單或更加適合檢測算法。常見預處理方式有從RGB映射到灰度、HSV(Hue,Saturation,Value)、YCbCr顏色空間,局部二值模式(localbinarypattern,LBP),中值濾波,離散小波變換(discretewavelettransform,DWT),主成分分析(principlecomponentanalysis,PCA)。一般情況下,預處理信息通常會使后續(xù)處理更加高效,從而導致更快的檢測速度或更高的檢測精度。
67圖像復制-粘貼篡改盲取證技術特征提取
特征提取是檢測篡改的關鍵步驟,直接影響系統(tǒng)準確性和效率。篡改者可能通過噪聲、模糊、旋轉(zhuǎn)等手段隱藏痕跡,同時平滑區(qū)域(如白色墻面、藍天)增加了檢測難度。特征提取方案分為兩類:
基于圖像分塊的方案與基于圖像特征點的方案
。
數(shù)字圖像復制-粘貼篡改的特征提取方案68圖像復制-粘貼篡改盲取證技術特征匹配
特征匹配旨在尋找原始圖像塊與復制移動區(qū)域的潛在關系。首先,將特征向量組成矩陣,通過字典排序或基數(shù)排序使相似向量相鄰。實際應用中,常用K-D樹、BBF算法及其改進算法g2NN進行快速匹配。此外,還可采用歐氏距離、漢明距離或相關系數(shù)等方法衡量向量相似度,初步篩選相似特征向量。
69圖像復制-粘貼篡改盲取證技術后處理
后處理通過誤差消除算法優(yōu)化檢測結果。特征匹配算法可找出相似特征向量和圖像區(qū)域,但自然圖像中相鄰區(qū)域的高相似度及平滑區(qū)域可能導致誤匹配。誤差消除算法通過計算相似圖像區(qū)域的位置距離來篩選結果,若距離足夠大,則認為是篡改區(qū)域。此外,復制-粘貼區(qū)域具有相同的偏移量,當具有相同偏移量的區(qū)域?qū)?shù)超過一定數(shù)值時,可判定為篡改區(qū)域
70圖像復制-粘貼篡改盲取證技術
完成以上所有步驟之后,有些方案會選擇性的對檢測結果做進一步處理。例如圖像的形態(tài)學運算,包括腐蝕和膨脹,目的是消除一些不連接的細小區(qū)域或者使檢測結果更連貫?;谔卣鼽c的檢測方案常使用隨機樣本一致算法(RandomSampleConsensus,RANSAC)來剔除無效點,保留有效點。
71基于圖像塊的復制-粘貼篡改取證算法
基于圖像分塊的取證方案首先采用某個固定大小的滑動窗口將待檢測圖像分為尺寸相同且不重疊的圖像塊。再對每個圖像塊提取特征值并構建其特征向量,用構建的特征向量代替圖像塊的像素值進行相似性比較,最后檢測并定位出篡改區(qū)域。合適的特征向量不但能最大程度地代表圖像塊,而且具有較強的魯棒性,使得篡改圖像在經(jīng)過后期篡改痕跡隱藏操作之后還能被檢測并定位。因此,為圖像塊提取合適的特征向量對于基于圖像分塊的取證方法是比較關鍵的一步。
72基于圖像塊的復制-粘貼篡改取證算法
基于圖像分塊的取證方案主要基于以下技術和方法:離散余弦變換DCT、
奇異值分解SVD、離散小波變換DWT、主成分分析PCA、方向梯度直方圖(HistogramofOrientationGradient,HOG)、Krawtchouk矩陣、Zernike矩陣、極性復數(shù)指數(shù)變換矩陣、YCbCr顏色空間、極性復數(shù)變換矩陣、一維描述符(1-DDescriptor)、一致性敏感哈希(CoherencySensitiveHashing)、空間和顏色模型等。
73基于圖像塊的復制-粘貼篡改取證算法基于DCT的復制-粘貼篡改取證方案
眾多算法中,提出較早的基于DCT的復制-粘貼篡改取證方案仍是最具有代表性算法之一。DCT通過將圖像從空域轉(zhuǎn)換到頻域,將能量集中在低頻部分,噪聲集中在高頻部分。在篡改檢測中,DCT系數(shù)可以作為特征向量,用于相似性匹配,從而定位篡改區(qū)域。即使圖像經(jīng)過高斯白噪聲、高斯模糊或JPEG壓縮等后期處理,DCT方法仍能有效檢測篡改區(qū)域。因此,基于DCT的算法具有較高的檢測準確率和較強的魯棒性。
基于DCT的復制-粘貼篡改取證算法流程圖:
74基于圖像塊的復制-粘貼篡改取證算法基于DCT的復制-粘貼篡改取證方案1.灰度圖像轉(zhuǎn)換:對于一幅N×M的RGB彩色圖像,通過標準公式(7-4)轉(zhuǎn)換為灰度圖像,其中,R,G和B分別代表RGB三通道,I為轉(zhuǎn)換后的灰度圖像。
(7-4)2.圖像分塊:將灰度圖像I劃分為
B×B大小的非重疊圖像塊,共得到(N-B+1)×(M-B+1)個圖像子塊。3.DCT操作:采用DCT對每個圖像塊進行特征提取。二維DCT變換如式(7-5)所示:(7-5)75基于圖像塊的復制-粘貼篡改取證算法基于DCT的復制-粘貼篡改取證方案
其中,f為某一圖像塊;
為正交系數(shù),使DCT變換為正交矩陣。DCT系數(shù)矩陣F的矩陣表示如公式(7-6)所示:其中,
為正交矩陣。
(7-6)76基于圖像塊的復制-粘貼篡改取證算法基于DCT的復制-粘貼篡改取證方案4.Z字型掃描:對每個塊的DCT系數(shù)進行Z字型掃描,并重新排列為行向量;將每個塊對應的行向量組合,得
到一個
的矩陣。5.字典排序降維:對上一步得到的系數(shù)矩陣進行字典排序,得到排序后的矩陣A。此時由于DCT系數(shù)個數(shù)較多,需要對矩陣A進行降維操作:引入因子
,只保留矩陣A每一行的前
個DCT系數(shù)。于是,截斷后的矩陣A為
。6.計算鄰近向量位移矢量:對A的每一行DCT系數(shù)向量
,測試所有滿足
的鄰近行
,其中Nf是控制鄰近行數(shù)量的參數(shù)用于判斷鄰近行是否相似。對于滿足條件的
和
,計算
(7-7)77基于圖像塊的復制-粘貼篡改取證算法基于DCT的復制-粘貼篡改取證方案其中
和
,分別代表
和
對應圖像塊的左上角像素坐標。如果
(Nd是用于控制圖像塊之間距離的參數(shù)),計算位移矢量s并歸一化。將該位移矢量的出現(xiàn)頻次加1。7.根據(jù)位移矢量判斷篡改區(qū)域:預定義閾值T,如果存在
,這說明存在篡改;反之,判斷為圖像未被篡改。在一幅N×M的黑色圖像中,將滿足
的圖像塊上色,通過開運算消除孤立區(qū)域。最后得到的圖像中,上色部分為篡改區(qū)域。篡改檢測結果示例所示。
(7-8)78基于圖像塊的復制-粘貼篡改取證算法基于DCT的復制-粘貼篡改取證方案
(a)原圖(b)篡改圖(c)檢測結果
79基于特征點的復制-粘貼篡改取證算法
基于特征點的取證方法是在不對待檢測圖像進行分塊的前提下,檢測出圖像區(qū)域中具有較高信息熵的點(特征點或感興趣點),再對每個點進行描述,最后得到一系列的特征點以及每個特征點的描述向量來進行接下來的相似性匹配。當兩個區(qū)域包含足夠多的相似特征點時,這兩個區(qū)域可以被認定為篡改區(qū)域?;趫D像分塊的取證方法只能檢測一些常規(guī)信號處理類攻擊,而基于特征點的方法除了可以抵抗噪聲及光照改變等信號處理攻擊外,還對圖像旋轉(zhuǎn)及仿射變換等都具有較好的魯棒性。
基于特征點取證方案主要有:加速穩(wěn)健特征、基于多支持區(qū)域的梯度直方圖、二進制穩(wěn)健性不變可擴展關鍵點、雙閾值SIFT描述符、Harris角點、SIFT描述符和Zernike矩等。80基于特征點的復制-粘貼篡改取證算法
關于基于特征點取證方案,SIFT是該領域的經(jīng)典方法,且仍是流行的方法。SIFT匹配計算法具有如下若干適用于篡改檢測的特點:
①SIFT點在自然物體表面及紋理區(qū)域數(shù)量眾多,可以避免檢測時漏掉篡改區(qū)域。
②SIFT點在天空等光滑區(qū)域數(shù)量很少,避免了檢測時將光滑區(qū)域誤判為篡改區(qū)域。
③SIFT特征點的獨特性好,特征包含的信息量豐富,可以進行快速、準確的匹配
④SIFT特征具有尺度和旋轉(zhuǎn)不變性,特征點的方向參照和尺度信息可以在檢測過程中獲得,以SIFT特征點為種子點可以檢測出經(jīng)過尺度和旋轉(zhuǎn)變換的被篡改區(qū)域。
⑤SIFT特征對亮度變化保持不變,對中等程度的仿射變換和噪聲也具有魯棒性。81基于特征點的復制-粘貼篡改取證算法基于SIFT的復制-粘貼篡改取證算法
基于SIFT的復制-粘貼篡改取證算法的流程圖如圖所示,流程大體可分為SIFT特征點提取、聚類、匹配和篡改區(qū)域定位。
基于SIFT的復制-粘貼篡改取證算法流程圖82基于特征點的復制-粘貼篡改取證算法基于SIFT的復制-粘貼篡改取證算法(1)SIFT特征提取:獲取SIFT的步驟可由4步組成:建立高斯金字塔尺度空間、建立高斯差分尺度空間(DifferenceofGaussian,DoG)、提取SIFT特征點以及描述SIFT特征向量。1.建立高斯金字塔尺度空間。高斯金字塔尺度空間實質(zhì)是通過高斯函數(shù)對圖像進行平滑建立空間層(interval)和降采樣建立空間組(octave)。建立空間層作用是對圖像進行模糊處理和降噪,如在提取大目標前去除圖像瑣碎細節(jié)、橋接直線或曲線縫隙,保留圖像重要信息,減少特征點的提取數(shù)量;建立空間組作用是保證圖像的尺度不變性。通過公式(7-9)對圖像進行高斯平滑,建立高斯尺度空間。其中
是原始圖像,
是高斯平滑函數(shù),
為標準差,控制平滑的尺度。(7-9)83基于特征點的復制-粘貼篡改取證算法基于SIFT的復制-粘貼篡改取證算法高斯尺度空間示意圖84基于特征點的復制-粘貼篡改取證算法基于SIFT的復制-粘貼篡改取證算法2.建立DoG。若直接對DoG提取極值點,容易提取到噪聲點。由于每組內(nèi)高斯尺度空間圖像尺寸大小相等,則若將每組相鄰的尺度空間相減,即對得到的DoG圖像提取極值點,可降低噪聲點的提取概率,如公式(7-10)所示。(7-10)85基于特征點的復制-粘貼篡改取證算法基于SIFT的復制-粘貼篡改取證算法3.提取SIFT特征點。將點與所在DoG圖像和上下兩層尺度空間和的共26個點比較。若點是極大值或極小值,則將其視為候選特征點,如圖所示。為了得到精確地特征點,仍需要去除低對比度點和去除邊緣響應點。候選SIFT特征點提取86基于特征點的復制-粘貼篡改取證算法基于SIFT的復制-粘貼篡改取證算法
去除低對比度點:令X0是DoG空間的一個候選特征點
,
,DoG空間函數(shù)
在點
處的泰勒展開為對式(7-11)求導,并令結果為零,得
,將其代入到泰勒展開式(7-11)中,只取前兩項,得
。
。若
,則移除該關鍵點,即
和
之間的像素差值很小,點
周圍的像素變化很小,雖是極值點,但仍然去除該對比度低點。(7-11)87基于特征點的復制-粘貼篡改取證算法基于SIFT的復制-粘貼篡改取證算法
去除邊緣響應點:不穩(wěn)定的邊緣點具有較大的主曲率。主曲率可通過Hessian矩陣H求出:
尺度空間函數(shù)的主曲率
和H的特征值成反比,設
為H的最大特征值,
為H的最小特征值,則H的
行列式
。令
,則滿足式(7-13)和(7-14)。
(7-12)(7-13)(7-14)88基于特征點的復制-粘貼篡改取證算法基于SIFT的復制-粘貼篡改取證算法設r的閾值為
,若滿足式(7-15),則此點為特征點。
4.確定特征點的方向。設點(x,y)的梯度方向
和模值m(x,y)定義如式(7-16)所示:
其中,
,
。計算特征點1.5σ鄰域內(nèi)所有點的梯度方向和模值,并平均分成10個方向并對各個方向的梯度模值累加,將具有最大模值的方向作為該特征點的主方向。
(7-15)(7-16)89基于特征點的復制-粘貼篡改取證算法基于SIFT的復制-粘貼篡改取證算法5.建立SIFT特征向量。為了保證旋轉(zhuǎn)不變性,以特征點主方向作為坐標軸進行旋轉(zhuǎn)后,以關鍵點為中心取16×16大小窗口,分成4×4的子塊,統(tǒng)計各塊8個梯度方向的大小,形成(16×8)=128維特征向量,如圖所示。令提取的SIFT關鍵點
為及對應特征描述子
。
生成SIFT特征向量90基于特征點的復制-粘貼篡改取證算法基于SIFT的復制-粘貼篡改取證算法(2)關鍵點匹配1.計算描述子f1與其他n?1個描述子之間的歐式距離,得到:2.將向量D按從大到小順序排列得到:如果
,則可以得到與描述子f1匹配的關鍵點xj(此時描述子f1與xj對應描述子fj為
),將關鍵點x1與xj分別存入兩個集合中。3.對未配對描述子f2~fn重復步驟a、b。
(7-17)(7-18)91基于特征點的復制-粘貼篡改取證算法基于SIFT的復制-粘貼篡改取證算法(3)特征點聚類和篡改定位
采用凝聚式層次聚類算法(AgglomerativeHierarchicalClustering,AHC)將集合中各特征點進行聚類。當發(fā)現(xiàn)類中有超過三對匹配特征點則認定為圖像可能受到的復制-粘貼攻擊區(qū)域。篡改檢測結果如圖所示,其中第一行為篡改圖像,第二行為匹配及篡改定位結果?;赟IFT特征點匹配的復制-粘貼篡改取證檢測結果圖目錄三一
數(shù)字圖像取證簡介二
圖像復制-粘貼篡改盲取證技術
圖像重采樣取證技術四
JPEG壓縮取證技術五
基于噪聲不一致性的圖像取證技術
重捕獲圖像取證技術六
圖像對比度增強取證技術七
DeepFake取證技術八一二
圖像復制-粘貼篡改盲取證技術93數(shù)字圖像重采樣模型
在數(shù)字圖像編輯或篡改過程中,往往會涉及到對原始圖像進行縮放或旋轉(zhuǎn)等幾何變換操作,即重采樣操作,以掩蓋圖像篡改痕跡,使篡改后的圖像更自然。因此,數(shù)字圖像重采樣操作檢測是數(shù)字圖像被動取證技術中較為重要的研究內(nèi)容之一。數(shù)字圖像
可以看作是由一個2×2的采樣矩陣T對二維的連續(xù)圖像信號
采樣后的結果。假設采樣矩陣T為單位矩陣I,則為了簡化分析,一般不考慮量化過程的影響。對于一個給定的數(shù)字圖像,當它經(jīng)歷重采樣操作時,一般會經(jīng)過四個步驟,即插值(interpolation)、扭曲(warping)、濾波(prefiltering)和采樣(sampling)。(7-19)94數(shù)字圖像重采樣模型插值:當對數(shù)字圖像進行幾何變換操作時,需要通過圖像插值算法構造原始圖像的連續(xù)插值圖像,此步驟通過原始圖像與插值濾波核函數(shù)h(x)做卷積生成連續(xù)插值圖像信號完成,即根據(jù)信號采樣定理可得,理想的插值核函數(shù)是sinc核函數(shù),然而在實際應用中,sinc插值核函數(shù)很難實現(xiàn)。因此,在圖像幾何操作過程中,往往使用線性插值核函數(shù)、雙線性插值核函數(shù)等代替理想插值核函數(shù)。(7-20)95數(shù)字圖像重采樣模型下表總結了常見的插值核函數(shù),為了保證對比的完整性,表中也包括了sinc核函數(shù)。96數(shù)字圖像重采樣模型扭曲:插值步驟獲得的連續(xù)插值圖像信號需要根據(jù)映射函數(shù)進行扭曲操作。本節(jié)所討論的一類仿射變換為,其中A表示2×2的變換矩陣。圖像旋轉(zhuǎn)和圖像縮放是兩種最常見的數(shù)字圖像幾何變換操作,對于圖像縮放操作,各向同性比例縮放的變換矩陣形式為其中,R表示數(shù)字圖像縮放因子。對于圖像旋轉(zhuǎn)操作,假設數(shù)字圖像圍繞其中心點順時針旋轉(zhuǎn)的方向為正,旋轉(zhuǎn)角度為,則圖像旋轉(zhuǎn)的變換矩陣的形式為(7-21)(7-22)97數(shù)字圖像重采樣模型濾波和采樣:經(jīng)過反向映射函數(shù)映射可得扭曲信號為其中表示的逆。扭曲信號由于經(jīng)過了反向映射,因此可能含有任意的高頻分量,所以通常采用預濾波器使扭曲信號滿足其輸出的奈奎斯特速率。在放大的情況下,沒有高頻信號被引入到輸出中,因此為了簡化分析過程,一般可以忽略預濾波器。為了獲得經(jīng)過幾何變換操作后的數(shù)字圖像,扭曲圖像信號需要通過采樣矩陣T=I進行采樣,最終可得幾何操作篡改的圖像為(7-23)
(7-24)98數(shù)字圖像重采樣模型
在上述的數(shù)字圖像重采樣過程中,插值過程會在最終獲得的數(shù)字圖像相鄰像素之間引入相關性,因此在重采樣圖像中會含有特殊的周期性痕跡。在重采樣圖像的高階統(tǒng)計信號的傅里葉變換頻譜中會出現(xiàn)與重采樣操作相關的特征峰,不同的插值方法會影響特征峰的峰值,但不會對特征峰的位置造成影響,特征峰的位置僅與重采樣因子有關。目前,多數(shù)重采樣檢測算法都是基于此特點進行設計,這種檢測算法不僅能夠檢測重采樣操作,同時還能夠估計重采樣因子。
99重采樣操作取證技術Popescu等人發(fā)現(xiàn)重采樣后的圖像像素與相鄰像素會因重采樣操作產(chǎn)生線性相關性,基于此提出一種基于EM算法的重采樣檢測技術。該技術本質(zhì)是構建貝葉斯后驗概率模型,估算待檢圖像中各像素為插值像素點的概率,再用迭代算法讓參數(shù)達到最佳。具體而言,EM算法在觀測數(shù)據(jù)基礎上添加未觀測的“潛在數(shù)據(jù)”,形成“完整數(shù)據(jù)”,使原觀測數(shù)據(jù)下的后驗分布轉(zhuǎn)變成參數(shù)在完整數(shù)據(jù)下的后驗分布,得到參數(shù)極大似然估計后,檢驗并改進添加的數(shù)據(jù)假定,將復雜極大化問題簡化。不過,該方法對初始化參數(shù)依賴性較強,可能使相同輸入出現(xiàn)異常結果,且算法時間復雜度較高。
100重采樣操作取證技術令
為待插值圖像像素值,則
可以表示成其2N鄰域內(nèi)像素值線性加權與估計殘差
的和的形式:其中,
恒為0,估計殘差
服從
正態(tài)分布。EM算法分成Expectation(E)和Maximization(M)兩部分。
(7-25)101重采樣操作取證技術1.Expectation步驟:使用M1和M2分別表示通過插值得到的圖像像素和原始的圖像像素兩種情況,由貝葉斯公式可以得到
的后驗概率為:其中,先驗概率
和
設置為0.5,
服從均值為
、方差為
的正態(tài)分布,
服從
最大值和最小值之間的均勻分布,
和
為待估計量。
(7-26)102重采樣操作取證技術2.Maximization步驟:
殘留誤差
的方差
實際上是殘留誤差的加權平均:其中,為了便于表達,令
。利用均方誤差最小準則,估計新的
。均方誤差計算公式為
(7-27)(7-28)103重采樣操作取證技術沿著
的方向求梯度,使之為0,可得其中,Y為由
鄰域組成的鄰域矩陣,W為由
組成的對角矩陣。當
收斂后,迭代結束。通過最終得到的
,構造待檢測圖像中像素點為插值點的概率圖。如果圖像經(jīng)過重采樣操作,則在概率圖的二維Fourier幅度譜中出現(xiàn)明顯的亮點,即存在某種周期性。
(7-29)104重采樣操作取證技術
不同倍率放大圖像后的檢測結果如圖所示,其中每一種情況自左至右的三幅圖像分別為待測圖像、概率圖和相應的幅度譜圖。在不考慮噪聲的情況下,上述算法能夠較好檢測出縮放和旋轉(zhuǎn)操作,但是只能定性而不能定量判斷重采樣操作參數(shù),此外EM迭代算法對初值設置的選擇過于依賴,算法的收斂性沒有得到嚴格證明。
基于EM的重采樣檢測結果105重采樣因子估計技術
縮放操作是最常見的幾何操作,常見于篡改圖像后,調(diào)整篡改區(qū)域的大小適配圖像內(nèi)容??s放因子估計是重采樣操作取證的另一個重要方向,可以較為準確地估計出圖像的縮放因子。
106重采樣因子估計技術1.基于差分周期特性的重采樣縮放因子估計算法Gallagher等人從重采樣圖像建模出發(fā),發(fā)現(xiàn)重采樣圖像的二階差分統(tǒng)計方差具有周期性,且重采樣因子與方差周期呈線性關系。通過離散傅立葉變換,可發(fā)現(xiàn)圖像頻譜中存在與重采樣因子相關的諧波峰值,進而判斷圖像是否重采樣并估計重采樣因子?;诓罘种芷谔匦缘闹夭蓸訖z測算法最大優(yōu)勢是能定量估計出重采樣因子。檢測算法的流程圖如圖所示。
基于差分周期特性的重采樣檢測算法流程圖107重采樣因子估計技術
為了簡化計算,采用沿列計算每個像素點二階差分絕對值期望來代替沿列計算每個像素點二階差分的統(tǒng)計方差。假設輸入圖像為
,
且
,其中R和C分別表示待檢測圖像的行數(shù)和列數(shù)。對于每一行的二階差分可以由下式計算得出:對信號
的每行求平均,可得近似方差信號
:
(7-30)(7-31)108重采樣因子估計技術對
做離散傅里葉變換DFT,其周期性可以通過檢測
的峰值來判斷,假設峰值處對應的頻率為
,則由于混疊的影響,估計重采樣因子的過程中頻譜中的一個峰值頻率
會對應兩個可能的重采樣因子
,即
(7-32)(7-33)109重采樣因子估計技術2.基于差分周期特性的圖像旋轉(zhuǎn)角度估計算法
Wei等人研究發(fā)現(xiàn)圖像頻譜提取操作順序不同,可使重采樣峰值特征更明顯,進而區(qū)分圖像旋轉(zhuǎn)與縮放操作,并提出了包含這兩種操作的二次幾何變換操作鏈估計方法。該方法將旋轉(zhuǎn)看作特殊縮放操作,結合旋轉(zhuǎn)角度估計與特定縮放因子,通過頻譜峰值與縮放因子關系推導出旋轉(zhuǎn)角度。同時,利用不同頻譜提取順序突出重采樣峰值特征,進一步區(qū)分旋轉(zhuǎn)和縮放操作,并基于此提出了只含旋轉(zhuǎn)和縮放的二次幾何變換操作鏈恢復算法。
110重采樣因子估計技術2.基于差分周期特性的圖像旋轉(zhuǎn)角度估計算法
圖像圍繞其中心旋轉(zhuǎn)的坐標變換關系為:其中,
和
分別表示對應像素點旋轉(zhuǎn)前后的坐標。
表示旋轉(zhuǎn)角度,規(guī)定逆時針方向旋轉(zhuǎn)時為正。假定
,則由上式可得:
(7-34)(7-35)111重采樣因子估計技術
可認為圖像旋轉(zhuǎn)操作導致圖像在水平方向產(chǎn)生倍率為
的縮放。對旋轉(zhuǎn)角度
后的圖像先使用拉普拉斯算子與圖像進行卷積得到差分圖像,再逐行計算差分圖像的DFT。
在
到的范圍內(nèi),可得峰值頻率
與轉(zhuǎn)角
的關系為
(7-36)112重采樣因子估計技術
以此類推,假定
,則
即旋轉(zhuǎn)前垂直方向投影到旋轉(zhuǎn)后水平方向的縮放倍率為
,同理可得峰值頻率
與轉(zhuǎn)角
的關系為:
(7-37)(7-38)113重采樣因子估計技術假設待估計旋轉(zhuǎn)角度的圖像大小為M×N,旋轉(zhuǎn)角度盲估計的具體步驟如下:①初始化。令峰值計數(shù)器的初始值
,
。②計算差分圖像。使用拉普拉斯算子L對圖像進行卷積得到差分圖像E,即
。③峰值計數(shù)。對差分圖像E逐行處理,假設第m行為
,
,求其DFT,記為
。若
為其鄰域
,
內(nèi)的最大值則更新峰值計數(shù)器,即
。該方法根據(jù)實驗確定
值為5。將各行的
取平均,得到水平方向的平均頻譜幅度
。④峰值檢測。將
歸一化得到頻率-峰值計數(shù)圖,由于頻譜對稱,僅需在一半的范圍內(nèi)查找局部峰值,得到候選的全局峰值及對應頻率集合
。候選峰值的條件是其值與鄰域中值之比大于閾值T。若集合為空則判定圖像沒有經(jīng)過旋轉(zhuǎn)。⑤計算旋轉(zhuǎn)角度。上一步中估計到的候選峰值可能有多個,取其中最大的兩個候選峰值。若只有一個候選峰值則規(guī)定另一個候選峰值對應的頻率為零。由公式可計算得到估計的旋轉(zhuǎn)角度。114重采樣因子估計技術連續(xù)縮放和旋轉(zhuǎn)處理的過程檢測,根據(jù)不同的處理順序分為了四種情況:①二次縮放:假設第一次縮放倍率為R1,第二次縮放倍率為R2,則兩次插值的混合頻率為
和
。②旋轉(zhuǎn)后縮放:假設圖像旋轉(zhuǎn)角度為
,縮放倍率為R,則旋轉(zhuǎn)并縮放后的混合頻率為
和
。③縮放后旋轉(zhuǎn):假設縮放倍率為R旋轉(zhuǎn)角度為
,則縮放后旋轉(zhuǎn)的混合頻率為
、
和
。④二次旋轉(zhuǎn):假設第一次旋轉(zhuǎn)角度為
,第二次旋轉(zhuǎn)角度為
,兩次旋轉(zhuǎn)后的混合頻率為
和
。目錄三一
數(shù)字圖像取證簡介二
圖像復制-粘貼篡改盲取證技術
圖像重采樣取證技術四
JPEG壓縮取證技術五
基于噪聲不一致性的圖像取證技術
重捕獲圖像取證技術六
圖像對比度增強取證技術七
DeepFake取證技術八一二
圖像復制-粘貼篡改盲取證技術116JPEG壓縮和取證JPEG壓縮技術簡介JPEG是1986年成立的聯(lián)合圖像專家組的縮寫,1992年正式通過成為國際數(shù)字圖像壓縮標準,被命名為“ISO10918-1”。JPEG圖像文件擴展名為“.jpg”或“.jpeg”,主要用于存儲亮度信息的變化。
最常用的壓縮模式是有損壓縮,去除圖像冗余信息和彩色信道數(shù)據(jù),能實現(xiàn)高壓縮比且保持圖像豐富生動,占用空間小且質(zhì)量高,還可根據(jù)需要調(diào)節(jié)圖像質(zhì)量,用不同壓縮比壓縮圖像。117JPEG壓縮和取證JPEG壓縮技術意義
相機型號、編輯軟件識別
:JPEG文件頭中的量化表具有獨特性,不同相機廠商和編輯軟件自行設計量化表,通過估計量化表可推斷拍攝相機品牌型號或所經(jīng)歷的軟件處理。
圖像篡改檢測和定位
:JPEG壓縮痕跡是關鍵線索。修改圖像局部會破壞其壓縮痕跡,復制拼接不同壓縮參數(shù)圖像會導致拼接圖像局部壓縮參數(shù)不一致等情況,通過檢測各個局部壓縮痕跡是否一致可發(fā)現(xiàn)并定位篡改區(qū)域。
隱寫分析
:JPEG壓縮痕跡會對隱寫分析造成干擾,而JPEG壓縮取證技術可估計壓縮參數(shù),據(jù)此選擇對應檢測器進行分類判決,減輕干擾,提升隱寫分析精度。
去塊效應
:重度JPEG壓縮會導致8×8分塊灰度趨同和相鄰分塊邊界處像素值明顯躍變,出現(xiàn)塊效應。JPEG壓縮取證技術可估計壓縮參數(shù),幫助塊效應濾波器調(diào)整濾波策略和強度,抑制塊效應,改善圖像感知質(zhì)量。118JPEG位圖圖像取證
多數(shù)具備攝影功能的相機或手機均默認采用JPEG格式輸出,這意味著網(wǎng)絡上大量位圖可能由JPEG圖像轉(zhuǎn)換格式后得到。當JPEG圖像解壓縮后轉(zhuǎn)存為位圖,原先保存在JPEG文件頭中的量化表信息將隨之丟失。JPEG解壓位圖取證的目的是檢測位圖是否經(jīng)歷過JPEG壓縮。同時如果由JPEG轉(zhuǎn)為位圖,可進一步估計壓縮量化表參數(shù)。JPEG位圖取證包含兩個任務,一是檢測位圖是否經(jīng)歷JPEG壓縮,二是估計解壓位圖的壓縮參數(shù),即量化步長。119JPEG位圖圖像取證
Fu等人提出利用Benford定律檢測位圖壓縮歷史的方法。正常JPEG系數(shù)的首位有效數(shù)字符合廣義Benford定律分布。通過將待測位圖壓縮為質(zhì)量因數(shù)QF=100的JPEG圖像,若其系數(shù)首位有效數(shù)字滿足Benford定律,則未經(jīng)過JPEG壓縮;否則,經(jīng)過了JPEG壓縮。下圖展示了UCID數(shù)據(jù)集中所有圖像JPEG系數(shù)第一位有效數(shù)字分布與廣義BenFord定律分布的比較。JPEG系數(shù)第一位有效數(shù)字分布120JPEG位圖圖像取證
Yao等人提出一種經(jīng)歷過JPEG壓縮并保存為位圖格式圖像的量化步長估計方法。實際情況中,高頻帶的量化步長的數(shù)值遠大于低頻帶和中頻帶的量化步長。因此高頻帶的量化DCT系數(shù)通常為零。高頻帶的量化步長難以估計。因此,該方法主要考慮在直流、低頻和中頻頻帶的15個頻帶的量化步長估計問題,如圖所示。8×8DCT系數(shù)塊的頻帶分類121JPEG位圖圖像取證
為方便表達,把需要估計的低頻頻帶和中頻頻帶稱為交流頻帶,并且頻帶(i,j)處的估計的量化步長值表示為
。值得注意的是,方法中提到的DCT系數(shù)是取整后的系數(shù),即
其中,
表示頻帶(i,j)處的取整DCT系數(shù),
表示8×8塊中坐標(u,v)的像素值。對于每個頻帶而言,無論是交流頻帶還是直流頻帶,估計
的過程可分為三個步驟:(1)判定
是否為1,(2)如果
不為1,則進一步
判定是否為2,(3)如果
不為1或者2,則進一步估計
。
(7-39)122JPEG位圖圖像取證估計量化步長的流程圖
國家重點研發(fā)計劃項目申報123JPEG重壓縮取證JPEG作為最常用的圖像格式,廣泛應用于網(wǎng)絡、社交媒體和數(shù)字媒體。其易編輯性導致篡改風險增加,圖像真實性面臨挑戰(zhàn)。多次JPEG壓縮會在圖像中留下獨特痕跡。這些痕跡可用于檢測圖像是否被篡改。研究意義:為數(shù)字取證提供可靠技術手段。保障圖像在法律、新聞等領域的可信度。通常情況下獲得的圖像多數(shù)為JPEG格式保存。文件中只保存了最后一次的JPEG壓縮的量化步長,但是無法確保圖像是否經(jīng)過多次的JPEG壓縮,JPEG重壓縮取證的重要任務就是估計JPEG圖像前次量化步長。根據(jù)兩次JPEG壓縮的分塊是否對齊,可將其分為網(wǎng)格對齊的重壓縮取證和網(wǎng)格不對齊的重壓縮取證。國家重點研發(fā)計劃項目申報124網(wǎng)格對齊的雙重壓縮取證JPEGGhos
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年福建莆田市特殊教育學校春季編外合同教師公開招聘2人考試參考題庫及答案解析
- 2026山東濰坊東辰育英中學教師招聘9人備考考試題庫及答案解析
- 2026年唐山青龍湖(河北)產(chǎn)業(yè)發(fā)展集團有限公司招聘工作人員15名備考考試題庫及答案解析
- 2026黑龍江黑河學院招聘博士筆試備考題庫及答案解析
- 2026福建漳州詔安縣四都中心衛(wèi)生院招聘1人備考考試試題及答案解析
- 2026年度濟寧經(jīng)濟開發(fā)區(qū)事業(yè)單位公開招聘初級綜合類崗位人員備考題庫含答案詳解
- 2026廣東佛山市獅山鎮(zhèn)聯(lián)表小學招聘教師1人備考題庫及答案詳解(奪冠系列)
- 2026河北衡水市第十二中學招聘教師考試參考試題及答案解析
- 2026湖北武漢硚口區(qū)公立初中招聘初中教師7人備考考試題庫及答案解析
- 2026天津市濱海新區(qū)衛(wèi)生健康委所屬事業(yè)單位招聘52人備考題庫及答案詳解(考點梳理)
- 經(jīng)圓孔翼腭神經(jīng)節(jié)射頻調(diào)節(jié)術
- 中藥學教材課件
- 夢雖遙追則能達愿雖艱持則可圓模板
- 能源與動力工程測試技術 課件 第一章 緒論確定
- 配件售后管理制度規(guī)范
- 浙江省紹興市上虞區(qū)2024-2025學年七年級上學期期末語文試題(解析版)
- 《隸書千字文》-清席夔
- 2024校長在寒假期末教職工大會上精彩發(fā)言主要引用3個關鍵詞善待自己改變自己提升自己
- 《鐵路技術管理規(guī)程》(普速鐵路部分)
- 2024-2025年度“地球小博士”全國地理科普知識大賽參考試題庫(含答案)
- 2024年度工程成本控制優(yōu)化合同
評論
0/150
提交評論