小基高比圖像下立體匹配方法的創(chuàng)新與突破_第1頁
小基高比圖像下立體匹配方法的創(chuàng)新與突破_第2頁
小基高比圖像下立體匹配方法的創(chuàng)新與突破_第3頁
小基高比圖像下立體匹配方法的創(chuàng)新與突破_第4頁
小基高比圖像下立體匹配方法的創(chuàng)新與突破_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

小基高比圖像下立體匹配方法的創(chuàng)新與突破一、引言1.1研究背景與意義在計算機視覺和攝影測量領(lǐng)域,立體匹配是一項至關(guān)重要的任務(wù),其核心目標(biāo)是從不同視角拍攝的圖像中尋找對應(yīng)點,進而獲取場景的深度信息。這一技術(shù)廣泛應(yīng)用于諸多領(lǐng)域,為各領(lǐng)域的發(fā)展提供了關(guān)鍵支持。在攝影測量中,立體匹配是實現(xiàn)地形三維信息提取的核心環(huán)節(jié)。傳統(tǒng)攝影測量在影像分辨率給定的情況下,通常采用大基高比方案來獲取高精度的高程信息。然而,在建筑物密集、高度起伏變化較大的城市地區(qū)測繪時,大基高比會導(dǎo)致較大的輻射和幾何差異,例如畸變、遮擋以及運動目標(biāo)影響等問題,這使得相關(guān)匹配處理變得極為困難,導(dǎo)致獲取高精度、大比例尺地形三維信息的自動化程度較低,難以滿足快速獲取的需求。小基高比圖像立體匹配在此背景下應(yīng)運而生。采用小基高比立體觀測模式,能夠有效避免上述不利因素,特別是在城市大比例尺立體測繪中展現(xiàn)出獨特優(yōu)勢。它可以克服大基高比攝影測量在城市測繪中遮擋多、“死區(qū)”多、數(shù)據(jù)獲取效率低的缺陷,為高效率獲取城市地區(qū)數(shù)字表面模型(DSM)/數(shù)字高程模型(DEM)提供了新的手段與方法。同時,小基高比還能為高精度影像處理提供輻射特性較為一致、幾何變形小的立體影像數(shù)據(jù)源,為大幅提高自動化處理效率奠定基礎(chǔ)。例如,在城市規(guī)劃項目中,通過小基高比圖像立體匹配獲取的高精度三維地形信息,能夠幫助規(guī)劃者更準(zhǔn)確地評估地形條件,合理布局建筑物和基礎(chǔ)設(shè)施;在地圖繪制領(lǐng)域,利用該技術(shù)可以制作出更精確的地圖,為導(dǎo)航、地理信息分析等提供更可靠的數(shù)據(jù)支持。然而,小基高比也不可避免地帶來了交會精度降低的問題。隨著基高比的減小,同名光線的交會角變小,這對立體匹配算法的精度提出了更高要求。若匹配算法的精度不足,將導(dǎo)致獲取的視差圖存在誤差,進而影響三維重建的精度和可靠性。因此,研究面向小基高比圖像的立體匹配方法具有重要的理論意義和實際應(yīng)用價值。從理論角度看,深入研究小基高比圖像的特性以及匹配過程中的難點問題,有助于推動立體匹配算法的發(fā)展,豐富計算機視覺和攝影測量的理論體系。從實際應(yīng)用角度出發(fā),高精度的小基高比圖像立體匹配方法能夠滿足城市測繪、自動駕駛、機器人導(dǎo)航等眾多領(lǐng)域?qū)_三維信息的需求,促進相關(guān)產(chǎn)業(yè)的發(fā)展。1.2國內(nèi)外研究現(xiàn)狀立體匹配技術(shù)作為計算機視覺和攝影測量領(lǐng)域的關(guān)鍵技術(shù),一直是國內(nèi)外學(xué)者研究的重點。在小基高比圖像立體匹配方面,國內(nèi)外學(xué)者也取得了一系列的研究成果,同時也面臨著一些挑戰(zhàn)和不足。國外在小基高比攝影測量的研究起步較早,NeusSabater等人深入探究了小基高比攝影測量的相關(guān)理論與方法,并成功開發(fā)出MARC、MARC2等適用于小基高比影像的高精度匹配算法。他們利用航空平臺對小基高比攝影測量技術(shù)展開全面試驗,通過實際數(shù)據(jù)驗證,初步證實了該技術(shù)在獲取高精度地形三維信息方面的可行性。在基于局部的立體匹配方法研究中,一些學(xué)者致力于改進匹配窗口的選擇策略,以適應(yīng)小基高比圖像的特點。例如,通過自適應(yīng)窗口技術(shù),根據(jù)圖像局部特征動態(tài)調(diào)整窗口大小和形狀,從而在復(fù)雜場景下提高匹配的準(zhǔn)確性。在基于全局的立體匹配方法上,國外學(xué)者不斷優(yōu)化能量函數(shù)和求解算法,以提升算法對遮擋、輻射差異等因素的魯棒性。如在動態(tài)規(guī)劃算法中,改進路徑搜索策略,減少誤匹配的發(fā)生。國內(nèi)在小基高比圖像立體匹配研究方面也取得了顯著進展。門朝光、邊繼龍等人從計算機視覺的角度出發(fā),深入研究小基高比條件下的立體匹配算法。他們通過理論分析和實驗驗證,表明所提出的算法能夠達到較高的匹配精度,有效彌補小基高比給高程信息帶來的損失。部分研究人員將注意力集中在算法的優(yōu)化與改進上,以提升小基高比圖像立體匹配的效率和精度。有學(xué)者提出一種基于積分圖像的快速小基高比立體匹配方法,通過簡化自適應(yīng)窗口公式,結(jié)合多窗口策略累積匹配代價,并引入可靠性約束拒絕錯誤匹配,同時采用基于圖分割的迭代傳播方法獲得稠密視差圖,有效提高了匹配效率和準(zhǔn)確率。還有學(xué)者針對小基高比立體匹配中的“粘合”現(xiàn)象和深度精度問題,提出將自適應(yīng)窗口技術(shù)和多窗口策略相結(jié)合確定匹配窗口,利用規(guī)范化互相關(guān)函數(shù)和“勝者全取”策略計算整數(shù)級視差,再通過基于二分法的亞像素匹配方法計算亞像級視差,最后采用基于圖像分割的迭代傳播方法獲得稠密視差圖,實驗結(jié)果表明該方法有效減少了“粘合”現(xiàn)象,獲得了高精度亞像素級視差。盡管國內(nèi)外在小基高比圖像立體匹配方面取得了諸多成果,但仍存在一些不足之處。在處理復(fù)雜場景時,現(xiàn)有算法的魯棒性有待進一步提高。例如,在城市復(fù)雜環(huán)境中,存在大量的遮擋、反光以及紋理相似區(qū)域,這些因素容易導(dǎo)致匹配錯誤,影響三維重建的精度。部分算法的計算復(fù)雜度較高,難以滿足實時性要求。在一些對實時性要求較高的應(yīng)用場景,如自動駕駛、機器人導(dǎo)航等,需要快速準(zhǔn)確的立體匹配算法,而目前的一些算法由于計算量過大,無法及時提供精確的深度信息。此外,對于小基高比圖像的特性挖掘還不夠深入,尚未充分利用其優(yōu)勢來改進立體匹配算法,在算法的適應(yīng)性和通用性方面還有提升空間。1.3研究目標(biāo)與內(nèi)容本研究旨在解決小基高比圖像立體匹配中面臨的挑戰(zhàn),通過深入分析小基高比圖像的特性,研究現(xiàn)有立體匹配方法的優(yōu)缺點,設(shè)計并實現(xiàn)一種適用于小基高比圖像的高精度、高效率立體匹配方法,具體研究目標(biāo)如下:深入分析小基高比圖像特性:全面剖析小基高比圖像在輻射、幾何等方面的特性,包括影像相關(guān)程度高、幾何差異小但交會精度降低等特點,明確這些特性對立體匹配算法設(shè)計的影響,為后續(xù)算法改進提供理論依據(jù)。研究常見立體匹配方法:對基于局部、全局以及深度學(xué)習(xí)的常見立體匹配方法進行系統(tǒng)研究,深入分析各方法在小基高比圖像匹配中的優(yōu)勢與不足,例如基于局部的方法在處理小基高比圖像時對窗口選擇的敏感性,基于全局的方法在計算復(fù)雜度和對復(fù)雜場景適應(yīng)性方面的問題,以及深度學(xué)習(xí)方法對大量標(biāo)注數(shù)據(jù)的依賴和在小樣本情況下的泛化能力等。設(shè)計面向小基高比圖像的立體匹配新方法:針對小基高比圖像的特點和現(xiàn)有方法的不足,結(jié)合多窗口策略、自適應(yīng)權(quán)重、亞像素匹配等技術(shù),設(shè)計一種新的立體匹配算法,以提高匹配精度和效率,增強算法對遮擋、輻射差異等因素的魯棒性。例如,通過動態(tài)調(diào)整匹配窗口大小和形狀,更好地適應(yīng)小基高比圖像中物體邊界和紋理變化;引入自適應(yīng)權(quán)重機制,根據(jù)圖像局部特征分配不同的權(quán)重,提高匹配的可靠性。實驗驗證與性能評估:利用實際采集的小基高比圖像數(shù)據(jù)集對所設(shè)計的算法進行實驗驗證,與現(xiàn)有經(jīng)典算法進行對比分析,從匹配精度、效率、魯棒性等多個維度評估算法性能,驗證新方法在小基高比圖像立體匹配中的有效性和優(yōu)越性。同時,根據(jù)實驗結(jié)果對算法進行優(yōu)化和改進,使其能夠更好地滿足實際應(yīng)用需求。圍繞上述研究目標(biāo),本研究的主要內(nèi)容包括以下幾個方面:小基高比圖像特性分析:從輻射特性和幾何特性兩方面入手,分析小基高比圖像與大基高比圖像的差異。研究小基高比條件下影像相關(guān)程度高的原因,以及幾何差異小對立體匹配的有利影響和交會精度降低帶來的挑戰(zhàn)。通過理論分析和實際數(shù)據(jù)統(tǒng)計,建立小基高比圖像特性模型,為后續(xù)算法設(shè)計提供量化依據(jù)。常見立體匹配方法研究:詳細研究基于局部的立體匹配方法,如基于自適應(yīng)窗口的匹配算法,分析其在小基高比圖像中窗口選擇的策略和影響因素;深入探討基于全局的立體匹配方法,如動態(tài)規(guī)劃、圖割等算法,研究其在小基高比圖像匹配中能量函數(shù)的構(gòu)建和求解過程,以及對遮擋、輻射差異等因素的處理方式;關(guān)注基于深度學(xué)習(xí)的立體匹配方法,分析其網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練策略以及在小基高比圖像應(yīng)用中的優(yōu)勢和局限性。通過對常見方法的對比分析,總結(jié)出適用于小基高比圖像匹配的方法特點和改進方向。面向小基高比圖像的立體匹配方法設(shè)計:結(jié)合小基高比圖像特性和常見方法的研究成果,提出一種新的立體匹配方法。該方法首先采用多窗口策略,根據(jù)圖像局部特征動態(tài)選擇多個不同大小和形狀的窗口進行匹配代價計算,以提高對復(fù)雜場景的適應(yīng)性;然后引入自適應(yīng)權(quán)重機制,對不同窗口的匹配代價進行加權(quán)融合,增強匹配的可靠性;接著利用基于二分法的亞像素匹配方法,在整數(shù)級視差的基礎(chǔ)上進一步提高視差精度;最后采用基于圖像分割的迭代傳播方法,獲得稠密視差圖。在算法設(shè)計過程中,充分考慮算法的計算復(fù)雜度和實時性要求,通過優(yōu)化算法流程和數(shù)據(jù)結(jié)構(gòu),提高算法的運行效率。實驗與結(jié)果分析:收集和整理實際的小基高比圖像數(shù)據(jù)集,包括不同場景、不同分辨率的圖像。利用該數(shù)據(jù)集對所設(shè)計的算法進行實驗驗證,設(shè)置合理的實驗參數(shù)和對比算法。從視差精度、匹配準(zhǔn)確率、運行時間等多個指標(biāo)對實驗結(jié)果進行評估,通過可視化分析和定量統(tǒng)計,直觀展示新方法在小基高比圖像立體匹配中的性能優(yōu)勢。同時,對實驗結(jié)果進行深入分析,找出算法存在的不足和需要改進的地方,為進一步優(yōu)化算法提供依據(jù)。1.4研究方法與技術(shù)路線為實現(xiàn)研究目標(biāo),本研究將綜合運用多種研究方法,從理論分析、算法設(shè)計到實驗驗證,全面深入地開展面向小基高比圖像的立體匹配方法研究。文獻研究法:廣泛收集國內(nèi)外關(guān)于小基高比圖像立體匹配的相關(guān)文獻資料,包括學(xué)術(shù)論文、研究報告、專利等。對這些文獻進行系統(tǒng)梳理和分析,了解該領(lǐng)域的研究現(xiàn)狀、發(fā)展趨勢以及存在的問題。通過文獻研究,掌握小基高比圖像的特性、常見立體匹配方法的原理和優(yōu)缺點,為后續(xù)研究提供理論基礎(chǔ)和研究思路。例如,通過對NeusSabater等人開發(fā)的MARC、MARC2等適用于小基高比影像的高精度匹配算法相關(guān)文獻的研究,深入了解其算法原理和應(yīng)用效果,從中汲取有益的經(jīng)驗和啟示。實驗對比法:搭建實驗平臺,利用實際采集的小基高比圖像數(shù)據(jù)集對不同的立體匹配算法進行實驗驗證。設(shè)置多種實驗場景和參數(shù),對比分析不同算法在匹配精度、效率、魯棒性等方面的性能表現(xiàn)。通過實驗對比,找出各種算法在小基高比圖像匹配中的優(yōu)勢和不足,為新算法的設(shè)計和改進提供依據(jù)。例如,將基于局部的自適應(yīng)窗口匹配算法、基于全局的動態(tài)規(guī)劃算法以及基于深度學(xué)習(xí)的立體匹配算法在相同的小基高比圖像數(shù)據(jù)集上進行實驗,對比它們在不同場景下的視差精度、匹配準(zhǔn)確率和運行時間等指標(biāo),直觀地評估各算法的性能差異。算法改進法:針對小基高比圖像的特點和現(xiàn)有算法的不足,對傳統(tǒng)立體匹配算法進行改進和優(yōu)化。結(jié)合多窗口策略、自適應(yīng)權(quán)重、亞像素匹配等技術(shù),設(shè)計新的匹配算法。在算法改進過程中,充分考慮算法的計算復(fù)雜度和實時性要求,通過優(yōu)化算法流程和數(shù)據(jù)結(jié)構(gòu),提高算法的運行效率。例如,在多窗口策略中,根據(jù)圖像局部特征動態(tài)選擇多個不同大小和形狀的窗口進行匹配代價計算,通過實驗不斷調(diào)整窗口選擇的策略和參數(shù),以提高算法對復(fù)雜場景的適應(yīng)性。本研究的技術(shù)路線如圖1所示:[此處插入技術(shù)路線圖,圖中應(yīng)清晰展示各步驟的先后順序和相互關(guān)系]首先,進行小基高比圖像特性分析,通過理論研究和實際數(shù)據(jù)統(tǒng)計,深入了解小基高比圖像在輻射、幾何等方面的特性,為后續(xù)算法研究提供基礎(chǔ)。接著,開展常見立體匹配方法研究,對基于局部、全局以及深度學(xué)習(xí)的常見立體匹配方法進行全面分析,總結(jié)其在小基高比圖像匹配中的優(yōu)勢與不足。在上述研究的基礎(chǔ)上,設(shè)計面向小基高比圖像的立體匹配新方法。結(jié)合多窗口策略、自適應(yīng)權(quán)重、亞像素匹配等技術(shù),構(gòu)建新的算法框架,并詳細設(shè)計算法的各個模塊和流程。然后,利用實際采集的小基高比圖像數(shù)據(jù)集對新算法進行實驗驗證。通過設(shè)置合理的實驗參數(shù)和對比算法,從匹配精度、效率、魯棒性等多個維度對新算法的性能進行評估。最后,根據(jù)實驗結(jié)果對新算法進行優(yōu)化和改進。針對實驗中發(fā)現(xiàn)的問題,調(diào)整算法的參數(shù)和結(jié)構(gòu),進一步提高算法的性能,使其能夠更好地滿足實際應(yīng)用需求。二、小基高比圖像特性及對立體匹配的挑戰(zhàn)2.1小基高比圖像的定義與特點在攝影測量中,基高比是一個關(guān)鍵概念,它指的是攝影基線B與相對航高H的比值,即B/H。傳統(tǒng)攝影測量為獲取高精度的高程信息,在影像分辨率給定的情況下,多采用大基高比方案。而小基高比圖像則是指基高比數(shù)值相對較小的立體影像。一般來說,當(dāng)基高比小于某個特定閾值(如0.3)時,可將其視為小基高比圖像,不過這個閾值并非絕對,會根據(jù)具體應(yīng)用場景和需求有所變化。小基高比圖像具有一系列獨特的特點,這些特點使其在攝影測量和計算機視覺領(lǐng)域展現(xiàn)出獨特的優(yōu)勢,同時也帶來了一些挑戰(zhàn)。輻射特性一致:由于小基高比圖像的拍攝視角差異較小,在相同光照條件下,獲取的立體影像對之間的輻射特性較為一致。這意味著圖像的亮度、色彩等特征在兩幅圖像中變化較小,例如在城市地區(qū)的小基高比航空影像中,建筑物、道路等物體在不同圖像中的顏色和亮度表現(xiàn)基本相同。這種一致性為立體匹配提供了有利條件,能夠減少因輻射差異導(dǎo)致的匹配錯誤,提高匹配的準(zhǔn)確性。因為在立體匹配過程中,基于區(qū)域的匹配算法通常依賴于圖像的灰度信息,輻射特性一致使得同名區(qū)域的灰度相似度更高,更容易找到正確的匹配點。幾何變形?。盒』弑葪l件下,立體影像對之間的幾何差異相對較小。從成像原理來看,較小的基高比意味著攝影基線較短,相對航高較高,這使得拍攝到的物體在不同圖像中的投影變形較小。以建筑物為例,在小基高比圖像中,建筑物的形狀、輪廓等幾何特征在兩幅圖像中幾乎沒有明顯差異,不會出現(xiàn)大基高比圖像中可能出現(xiàn)的因視角變化過大而導(dǎo)致的嚴重透視變形。這一特點使得在進行立體匹配時,幾何約束更容易滿足,能夠更準(zhǔn)確地建立同名點之間的對應(yīng)關(guān)系,從而提高立體匹配的精度。交會精度降低:隨著基高比的減小,同名光線的交會角變小,這不可避免地導(dǎo)致交會精度降低。根據(jù)三角測量原理,交會角與測量精度密切相關(guān),較小的交會角會使得在計算物體的三維坐標(biāo)時產(chǎn)生更大的誤差。例如,在地形測繪中,對于同一地面點,小基高比情況下通過立體匹配計算得到的高程精度會明顯低于大基高比情況。這就對立體匹配算法提出了更高的要求,需要算法能夠在交會精度降低的情況下,依然準(zhǔn)確地獲取視差信息,以保證后續(xù)三維重建的精度。2.2小基高比圖像對立體匹配的影響小基高比圖像的特性使其在立體匹配過程中既具有一定優(yōu)勢,也面臨諸多挑戰(zhàn),這些影響主要體現(xiàn)在以下幾個方面:“黏合”現(xiàn)象:在基于局部窗口的立體匹配方法中,窗口大小的選擇是一個關(guān)鍵問題。對于小基高比圖像,由于其幾何差異小,同名點在圖像中的位置變化相對較小。當(dāng)采用較大的匹配窗口時,雖然可以利用更多的鄰域信息來增強匹配的可靠性,但在物體邊界處,由于窗口內(nèi)可能包含多個不同視差的區(qū)域,容易導(dǎo)致不同物體的視差被錯誤地合并,從而產(chǎn)生“黏合”現(xiàn)象。以城市建筑場景為例,在小基高比圖像中,相鄰建筑物的邊界可能因為大窗口的使用而被錯誤地認為具有相同的視差,使得建筑物之間的邊界在視差圖中變得模糊,無法準(zhǔn)確區(qū)分。這不僅影響了對物體邊界的識別和提取,也會對后續(xù)的三維重建結(jié)果產(chǎn)生較大影響,導(dǎo)致重建的三維模型在物體邊界處出現(xiàn)失真。深度精度降低:如前所述,小基高比導(dǎo)致同名光線的交會角變小,根據(jù)三角測量原理,這會使得深度計算的精度降低。在立體匹配中,視差與深度之間存在著密切的關(guān)系,通過計算視差來獲取場景的深度信息。然而,由于交會精度的降低,相同的視差誤差在小基高比情況下會導(dǎo)致更大的深度誤差。例如,在對一個距離相機一定距離的物體進行深度測量時,小基高比圖像中較小的交會角會使得視差的微小變化引起深度的較大波動,從而降低了深度測量的準(zhǔn)確性。這對于需要高精度深度信息的應(yīng)用,如地形測繪、自動駕駛中的障礙物檢測等,是一個嚴重的問題。匹配難度增加:盡管小基高比圖像的輻射特性一致和幾何變形小為立體匹配提供了一定的便利,但在一些復(fù)雜場景下,匹配難度依然較大。在低紋理區(qū)域,由于缺乏明顯的特征信息,無論是基于局部的匹配方法還是基于全局的匹配方法,都難以準(zhǔn)確地找到同名點。小基高比圖像中相似紋理區(qū)域的存在也會增加誤匹配的概率。在城市街道場景中,可能存在大量相似的路面紋理或建筑物墻面紋理,這些相似區(qū)域在匹配過程中容易被誤判為同名區(qū)域,從而導(dǎo)致匹配錯誤。遮擋問題也是小基高比圖像立體匹配中的一個難點,由于遮擋區(qū)域在兩幅圖像中的信息不一致,很難通過常規(guī)的匹配算法找到正確的對應(yīng)點,這會影響視差圖的完整性和準(zhǔn)確性。對算法魯棒性要求提高:小基高比圖像在實際應(yīng)用中可能會受到各種噪聲、光照變化以及成像設(shè)備誤差等因素的影響。為了準(zhǔn)確地進行立體匹配,算法需要具備較強的魯棒性,能夠在這些不利因素的干擾下依然保持較高的匹配精度。傳統(tǒng)的立體匹配算法在處理小基高比圖像時,往往對這些因素較為敏感,容易產(chǎn)生誤匹配。在光照變化較大的情況下,基于灰度信息的匹配算法可能會因為圖像灰度值的改變而無法準(zhǔn)確找到同名點;成像設(shè)備的誤差可能導(dǎo)致圖像的幾何畸變和輻射誤差,進一步增加了匹配的難度。因此,需要研究更加魯棒的立體匹配算法,以適應(yīng)小基高比圖像的特點和實際應(yīng)用需求。2.3應(yīng)對小基高比圖像挑戰(zhàn)的必要性隨著科技的不斷進步,計算機視覺和攝影測量技術(shù)在眾多領(lǐng)域的應(yīng)用日益廣泛,對高精度、高效率的三維信息獲取需求也愈發(fā)迫切。小基高比圖像立體匹配作為獲取三維信息的關(guān)鍵技術(shù),解決其面臨的挑戰(zhàn)具有至關(guān)重要的必要性。在眾多依賴三維信息的應(yīng)用中,測量精度是一個核心要素。在地形測繪領(lǐng)域,高精度的地形三維信息對于土地規(guī)劃、資源勘探、水利工程建設(shè)等至關(guān)重要。傳統(tǒng)大基高比攝影測量在城市地區(qū)面臨諸多難題,而小基高比圖像雖能避免這些問題,但交會精度降低帶來的深度精度下降問題嚴重影響了地形測繪的準(zhǔn)確性。例如,在山區(qū)進行地形測繪時,若因小基高比導(dǎo)致深度精度不足,可能會錯誤估計山體的高度和坡度,這對于后續(xù)的道路建設(shè)、橋梁選址等工程將產(chǎn)生極大的安全隱患。在工業(yè)檢測領(lǐng)域,對于零部件的三維尺寸測量要求極高,小基高比圖像立體匹配的精度直接關(guān)系到產(chǎn)品質(zhì)量的把控。如果匹配算法無法準(zhǔn)確獲取零部件的三維信息,可能會導(dǎo)致次品流入市場,影響整個生產(chǎn)鏈條的質(zhì)量和效益。因此,提高小基高比圖像立體匹配的精度,對于提升測量精度,確保各領(lǐng)域應(yīng)用的準(zhǔn)確性和可靠性具有重要意義。自動化處理效率也是當(dāng)前各領(lǐng)域發(fā)展的重要追求。在大數(shù)據(jù)時代,海量的圖像數(shù)據(jù)需要快速、高效地處理。小基高比圖像立體匹配作為圖像數(shù)據(jù)處理的關(guān)鍵環(huán)節(jié),其處理效率直接影響到整個工作流程的進度。在城市大比例尺立體測繪中,需要處理大量的航空影像數(shù)據(jù),若立體匹配算法效率低下,將耗費大量的時間和人力成本,無法滿足快速獲取地形三維信息的需求。在自動駕駛領(lǐng)域,車輛需要實時獲取周圍環(huán)境的三維信息,以做出準(zhǔn)確的決策。如果小基高比圖像立體匹配算法不能在短時間內(nèi)完成處理,將導(dǎo)致車輛反應(yīng)滯后,增加交通事故的風(fēng)險。提高小基高比圖像立體匹配的自動化處理效率,能夠滿足各領(lǐng)域?qū)焖佾@取三維信息的需求,推動相關(guān)產(chǎn)業(yè)的高效發(fā)展。解決小基高比圖像立體匹配面臨的挑戰(zhàn),對于提高測量精度和自動化處理效率具有不可忽視的必要性。這不僅是推動計算機視覺和攝影測量技術(shù)發(fā)展的內(nèi)在要求,也是滿足眾多實際應(yīng)用領(lǐng)域需求,促進社會經(jīng)濟發(fā)展的關(guān)鍵所在。三、常見立體匹配方法分析3.1基于局部的立體匹配方法3.1.1算法原理與流程基于局部的立體匹配方法是立體匹配領(lǐng)域中一類重要的算法,其核心思想是利用圖像中每個像素鄰域的局部信息來尋找匹配點。這類方法通常包括以下幾個關(guān)鍵步驟:匹配代價計算、代價累積、視差優(yōu)化和視差細化。匹配代價計算是基于局部的立體匹配方法的第一步,其目的是衡量左右圖像中對應(yīng)像素或像素塊之間的相似程度。這一步驟通常通過計算某種相似性度量來實現(xiàn),常見的相似性度量包括絕對誤差和(SumofAbsoluteDifferences,SAD)、平方誤差和(SumofSquaredDifferences,SSD)、歸一化互相關(guān)(NormalizedCross-Correlation,NCC)等。以SAD為例,對于左圖像中的一個像素p及其鄰域窗口W_p,在右圖像中以相同大小的窗口在一定視差搜索范圍內(nèi)進行滑動,計算每個位置的窗口與W_p對應(yīng)像素的灰度值之差的絕對值之和,即SAD(p,d)=\sum_{(x,y)\inW_p}|I_l(x,y)-I_r(x,y-d)|,其中I_l(x,y)和I_r(x,y)分別表示左、右圖像在位置(x,y)處的灰度值,d表示視差。通過這種方式,可以得到每個像素在不同視差下的匹配代價,形成匹配代價矩陣。代價累積是為了增強匹配的可靠性,減少噪聲和局部干擾的影響。在這一步驟中,通常會利用鄰域信息對初始的匹配代價進行聚合。常見的代價累積方法包括基于窗口的方法和基于路徑的方法。基于窗口的方法通過在一個固定大小的窗口內(nèi)對匹配代價進行加權(quán)求和,使得窗口內(nèi)的像素對中心像素的匹配決策產(chǎn)生影響。窗口的大小和形狀可以根據(jù)圖像的局部特征進行自適應(yīng)調(diào)整,以更好地適應(yīng)不同的場景。例如,在紋理豐富的區(qū)域,可以使用較小的窗口以捕捉更精細的細節(jié);在低紋理區(qū)域,則可以使用較大的窗口來利用更多的鄰域信息?;诼窂降姆椒▌t沿著特定的路徑(如水平、垂直或?qū)蔷€方向)對匹配代價進行累積,通過考慮像素在不同方向上的鄰域關(guān)系,進一步提高匹配的準(zhǔn)確性。視差優(yōu)化是從累積后的匹配代價中確定每個像素的最佳視差。最常用的方法是“勝者全取”(Winner-Take-All,WTA)策略,即選擇累積代價最小的視差作為該像素的視差。這種方法簡單直觀,但容易受到噪聲和局部極小值的影響,導(dǎo)致在一些復(fù)雜場景下出現(xiàn)誤匹配。為了提高視差優(yōu)化的準(zhǔn)確性,可以引入一些約束條件,如唯一性約束、順序一致性約束等。唯一性約束要求每個像素在右圖像中只有一個最佳匹配點,避免出現(xiàn)一對多的匹配情況;順序一致性約束則保證在同一掃描線上,左右圖像中對應(yīng)點的順序保持一致,有助于消除因遮擋或視差不連續(xù)導(dǎo)致的錯誤匹配。視差細化是對初步得到的視差圖進行進一步的優(yōu)化,以提高視差的精度和連續(xù)性。這一步驟通常包括亞像素插值、中值濾波、左右一致性檢測等操作。亞像素插值通過對整數(shù)視差進行插值計算,得到更精確的亞像素級視差,從而提高深度信息的精度。中值濾波用于去除視差圖中的孤立噪聲點,通過用鄰域像素的中值替換當(dāng)前像素的值,平滑視差圖。左右一致性檢測則是檢查左右圖像的匹配是否一致,對于左右視差不一致的像素(即左圖中的點在右圖中的匹配點與右圖中該點在左圖中的匹配點不一致),進行標(biāo)記并進行修正,通??梢酝ㄟ^將這些點的視差設(shè)置為周圍可靠視差的平均值或采用其他修復(fù)策略來處理。通過這些視差細化操作,可以得到更準(zhǔn)確、更平滑的視差圖,為后續(xù)的三維重建等應(yīng)用提供高質(zhì)量的深度信息。3.1.2典型算法案例分析在基于局部的立體匹配方法中,絕對誤差和(SAD)算法和歸一化互相關(guān)匹配(NCC)算法是較為典型的代表,它們在小基高比圖像的立體匹配中具有不同的表現(xiàn)和特點。絕對誤差和(SAD)算法,其原理是計算左右圖像對應(yīng)像素塊的灰度值之差的絕對值之和來衡量匹配代價。該算法的計算過程相對簡單直接,對于小基高比圖像,由于其輻射特性一致和幾何變形小,SAD算法能夠較好地利用這些特點。在匹配代價計算階段,小基高比圖像中對應(yīng)區(qū)域的灰度差異相對較小,SAD算法能夠較為準(zhǔn)確地捕捉到這些細微的差異,從而在一定程度上提高匹配的準(zhǔn)確性。在城市街道的小基高比圖像中,建筑物、路面等區(qū)域在左右圖像中的灰度變化較為平穩(wěn),SAD算法可以通過計算這些區(qū)域的絕對誤差和,有效地找到匹配點。然而,SAD算法也存在一些明顯的缺點。它對噪聲非常敏感,當(dāng)圖像中存在噪聲時,噪聲會導(dǎo)致像素灰度值的波動,從而使SAD算法計算出的匹配代價產(chǎn)生較大偏差,容易造成誤匹配。在低紋理區(qū)域,由于缺乏明顯的灰度變化特征,SAD算法難以準(zhǔn)確區(qū)分不同的區(qū)域,導(dǎo)致匹配精度下降。在大面積的平坦墻面或天空等低紋理區(qū)域,SAD算法可能會將不同位置的區(qū)域誤判為匹配區(qū)域。歸一化互相關(guān)匹配(NCC)算法通過計算左右圖像對應(yīng)像素塊的歸一化互相關(guān)系數(shù)來確定匹配程度。該算法的優(yōu)點在于對光照變化具有一定的魯棒性。在小基高比圖像中,盡管輻射特性較為一致,但在實際拍攝過程中,仍可能存在一些光照差異,NCC算法能夠在一定程度上克服這些光照變化的影響,保持較好的匹配性能。NCC算法在紋理豐富的區(qū)域表現(xiàn)出色,它能夠充分利用圖像的紋理信息,準(zhǔn)確地找到匹配點。在小基高比圖像中,紋理豐富的區(qū)域能夠提供更多的特征信息,NCC算法通過計算歸一化互相關(guān)系數(shù),可以有效地利用這些信息進行匹配。NCC算法也存在一些不足之處。其計算復(fù)雜度較高,需要進行大量的乘法和除法運算,這使得算法的運行效率較低,在處理大尺寸圖像或?qū)崟r應(yīng)用場景中,可能無法滿足時間要求。NCC算法對窗口大小和形狀的選擇較為敏感,不合適的窗口選擇可能會導(dǎo)致匹配結(jié)果不準(zhǔn)確。如果窗口選擇過大,可能會包含過多的背景信息,干擾匹配決策;如果窗口選擇過小,則可能無法充分利用圖像的紋理信息,影響匹配精度。在小基高比圖像的立體匹配中,需要根據(jù)圖像的具體特點,合理選擇窗口大小和形狀,以提高NCC算法的性能。3.2基于全局的立體匹配方法3.2.1算法原理與流程基于全局的立體匹配方法旨在通過最小化一個全局能量函數(shù)來求解全局最優(yōu)的視差。這類方法將立體匹配問題轉(zhuǎn)化為一個能量優(yōu)化問題,考慮了圖像中所有像素之間的關(guān)系,而不僅僅是局部鄰域信息,從而能夠獲得更準(zhǔn)確和連續(xù)的視差圖。全局能量函數(shù)通常由數(shù)據(jù)項和平滑項兩部分組成。數(shù)據(jù)項用于衡量左右圖像中對應(yīng)像素之間的相似性,反映了圖像的原始匹配代價。常見的數(shù)據(jù)項計算方法與基于局部的立體匹配方法類似,如使用絕對誤差和(SAD)、平方誤差和(SSD)、歸一化互相關(guān)(NCC)等相似性度量來計算匹配代價。對于每個像素p和視差d,數(shù)據(jù)項D(p,d)可以表示為左右圖像對應(yīng)像素的某種相似性度量值。平滑項則用于約束視差的平滑性和連續(xù)性,它考慮了相鄰像素之間的視差關(guān)系。在實際場景中,物體表面通常是平滑的,相鄰像素的視差變化應(yīng)該是連續(xù)的,因此平滑項能夠減少視差圖中的噪聲和不連續(xù)點,使視差圖更加平滑和合理。平滑項的計算通?;谙噜徬袼氐囊暡畈町?,例如使用一階差分或二階差分來衡量視差的變化。對于相鄰像素p和q,平滑項S(p,q,d_p,d_q)可以表示為視差d_p和d_q的函數(shù),當(dāng)視差差異較小時,平滑項的值較??;當(dāng)視差差異較大時,平滑項的值較大,從而對不連續(xù)的視差進行懲罰。基于全局的立體匹配方法的核心就是找到一組視差d,使得全局能量函數(shù)E(d)最小,即:E(d)=\sum_{p}D(p,d_p)+\lambda\sum_{(p,q)}S(p,q,d_p,d_q)其中,\lambda是平衡數(shù)據(jù)項和平滑項的權(quán)重參數(shù),它決定了數(shù)據(jù)項和平滑項在能量函數(shù)中的相對重要性。\lambda的取值需要根據(jù)具體的圖像場景和應(yīng)用需求進行調(diào)整,較大的\lambda值會使視差圖更加平滑,但可能會丟失一些細節(jié)信息;較小的\lambda值則更注重數(shù)據(jù)項,能夠保留更多的細節(jié),但可能會導(dǎo)致視差圖中出現(xiàn)較多的噪聲和不連續(xù)點。求解全局能量函數(shù)的最小化問題是基于全局的立體匹配方法的關(guān)鍵步驟,通常采用一些優(yōu)化算法來實現(xiàn)。常見的優(yōu)化算法包括圖割法(GraphCuts)、置信度傳播算法(BeliefPropagation)、動態(tài)規(guī)劃算法(DynamicProgramming)等。這些算法各有特點,圖割法通過將圖像轉(zhuǎn)化為圖結(jié)構(gòu),利用最大流最小割算法來尋找最優(yōu)的視差分割;置信度傳播算法則通過在圖像像素之間傳播置信度信息,迭代更新視差估計,逐步收斂到全局最優(yōu)解;動態(tài)規(guī)劃算法則是通過將問題分解為子問題,利用最優(yōu)子結(jié)構(gòu)性質(zhì)來求解全局最優(yōu)解。不同的優(yōu)化算法在計算效率、精度和對復(fù)雜場景的適應(yīng)性等方面存在差異,需要根據(jù)具體情況選擇合適的算法。3.2.2典型算法案例分析在基于全局的立體匹配方法中,圖割法和置信度傳播算法是較為典型的代表,它們在小基高比圖像的立體匹配中展現(xiàn)出不同的性能特點。圖割法將立體匹配問題轉(zhuǎn)化為一個圖論中的最大流最小割問題。在圖割法中,首先構(gòu)建一個圖,圖中的節(jié)點對應(yīng)圖像中的像素,邊則表示像素之間的關(guān)系。節(jié)點與源節(jié)點s和匯節(jié)點t相連,邊的權(quán)重表示將像素分配到不同視差的代價。通過計算最大流最小割,將圖分割成兩個部分,分別對應(yīng)不同的視差,從而得到視差圖。在小基高比圖像的立體匹配中,圖割法能夠充分利用小基高比圖像輻射特性一致和幾何變形小的優(yōu)勢。由于小基高比圖像中對應(yīng)區(qū)域的相似性較高,圖割法在構(gòu)建圖的過程中,能夠更準(zhǔn)確地定義邊的權(quán)重,從而更有效地找到全局最優(yōu)的視差分割。在處理城市建筑場景的小基高比圖像時,圖割法可以通過合理設(shè)置數(shù)據(jù)項和平滑項,準(zhǔn)確地分割出建筑物的不同部分,得到較為準(zhǔn)確的視差圖。圖割法也存在一些局限性。它的計算復(fù)雜度較高,對于大尺寸圖像,構(gòu)建圖和求解最大流最小割的過程需要消耗大量的時間和計算資源。在復(fù)雜場景下,特別是存在大量遮擋和視差不連續(xù)的區(qū)域,圖割法可能會出現(xiàn)過分割或欠分割的問題,導(dǎo)致視差圖的準(zhǔn)確性下降。在處理包含大量樹木和車輛的城市街道場景時,由于樹木和車輛的遮擋以及視差的不連續(xù)性,圖割法可能無法準(zhǔn)確地分割出每個物體的視差,使得視差圖中出現(xiàn)錯誤的視差估計。置信度傳播算法是一種基于概率推理的方法,它通過在圖像像素之間傳播置信度信息來迭代更新視差估計。在置信度傳播算法中,每個像素都有一個關(guān)于視差的置信度分布,初始時,根據(jù)數(shù)據(jù)項計算每個像素在不同視差下的置信度。然后,通過鄰域像素之間的信息傳播,不斷更新置信度分布,使得置信度逐漸收斂到全局最優(yōu)的視差。在小基高比圖像的立體匹配中,置信度傳播算法能夠較好地處理小基高比圖像中可能存在的噪聲和局部干擾。由于它考慮了圖像中所有像素之間的關(guān)系,通過多次迭代傳播信息,能夠逐漸消除噪聲的影響,得到較為平滑和準(zhǔn)確的視差圖。在處理低紋理區(qū)域時,置信度傳播算法可以利用鄰域像素的信息來推斷當(dāng)前像素的視差,從而提高低紋理區(qū)域的匹配精度。置信度傳播算法的收斂速度較慢,需要進行多次迭代才能得到較好的結(jié)果,這導(dǎo)致算法的運行效率較低。在一些實時性要求較高的應(yīng)用場景中,置信度傳播算法可能無法滿足時間要求。置信度傳播算法對參數(shù)的設(shè)置較為敏感,不同的參數(shù)設(shè)置可能會導(dǎo)致不同的匹配結(jié)果,需要根據(jù)具體的圖像場景進行調(diào)優(yōu)。3.3半全局立體匹配方法3.3.1算法原理與流程半全局立體匹配方法旨在融合局部和全局立體匹配方法的優(yōu)點,以實現(xiàn)更高效、準(zhǔn)確的匹配效果。該方法的核心在于通過在多個方向上進行一維的能量聚合,近似地考慮全局信息,同時保持相對較低的計算復(fù)雜度。在匹配代價選取方面,半全局立體匹配方法通常采用基于像素或像素塊的相似性度量。常見的相似性度量包括絕對誤差和(SAD)、歸一化互相關(guān)(NCC)等。以SAD為例,對于左圖像中的像素p及其鄰域窗口W_p,在右圖像中以相同大小的窗口在一定視差搜索范圍內(nèi)進行滑動,計算每個位置的窗口與W_p對應(yīng)像素的灰度值之差的絕對值之和,以此作為匹配代價。這種基于窗口的匹配代價計算方式能夠利用鄰域信息,增強匹配的可靠性。在計算匹配代價時,還可以考慮圖像的梯度信息、顏色信息等,以進一步提高匹配的準(zhǔn)確性。例如,結(jié)合圖像的梯度信息,可以更好地區(qū)分圖像中的邊緣和紋理區(qū)域,從而在這些區(qū)域獲得更準(zhǔn)確的匹配代價。視差優(yōu)化是半全局立體匹配方法的另一個關(guān)鍵環(huán)節(jié)。在完成多個方向的能量聚合后,通過最小化一個能量函數(shù)來確定每個像素的最佳視差。該能量函數(shù)通常由數(shù)據(jù)項和平滑項組成,數(shù)據(jù)項衡量左右圖像對應(yīng)像素的相似性,平滑項則用于約束視差的平滑性和連續(xù)性。通過引入平滑項,可以有效減少視差圖中的噪聲和不連續(xù)點,使視差圖更加平滑和合理。在實際應(yīng)用中,還可以采用一些后處理技術(shù)對視差圖進行優(yōu)化,如中值濾波、雙邊濾波等,進一步提高視差圖的質(zhì)量。中值濾波可以去除視差圖中的孤立噪聲點,雙邊濾波則可以在保持視差邊緣的同時,平滑視差圖中的平坦區(qū)域。3.3.2典型算法案例分析以基于互信息的半全局匹配算法為例,該算法在提高實時性和魯棒性方面具有一定的優(yōu)勢?;バ畔⑹且环N衡量兩個隨機變量之間依賴程度的信息論度量,在立體匹配中,通過計算左右圖像對應(yīng)區(qū)域的互信息來衡量它們之間的相似性?;诨バ畔⒌陌肴制ヅ渌惴ɡ没バ畔庹兆兓驮肼暰哂幸欢敯粜缘奶攸c,能夠在復(fù)雜的光照條件和存在噪聲的情況下,依然保持較好的匹配性能。在室外場景中,光照條件可能會發(fā)生劇烈變化,基于互信息的算法能夠有效克服光照變化的影響,準(zhǔn)確地找到匹配點。該算法也存在一些不足之處?;バ畔⒌挠嬎銖?fù)雜度較高,需要進行大量的統(tǒng)計和計算,這使得算法的運行效率較低,難以滿足實時性要求較高的應(yīng)用場景。在低紋理區(qū)域,由于缺乏足夠的信息來準(zhǔn)確計算互信息,該算法的匹配精度會受到影響,容易出現(xiàn)誤匹配的情況。在大面積的天空、水面等低紋理區(qū)域,基于互信息的半全局匹配算法可能無法準(zhǔn)確地確定視差,導(dǎo)致視差圖中出現(xiàn)錯誤的視差估計。在遮擋區(qū)域,由于左右圖像的信息不一致,互信息的計算也會受到干擾,從而影響匹配的準(zhǔn)確性。3.4機器學(xué)習(xí)在立體匹配中的應(yīng)用3.4.1基于深度學(xué)習(xí)的立體匹配算法原理基于深度學(xué)習(xí)的立體匹配算法近年來在計算機視覺領(lǐng)域得到了廣泛關(guān)注和深入研究。這類算法利用深度學(xué)習(xí)強大的特征學(xué)習(xí)能力,自動從圖像中提取復(fù)雜的特征表示,從而實現(xiàn)更準(zhǔn)確的立體匹配。其基本原理是通過構(gòu)建深度神經(jīng)網(wǎng)絡(luò),將立體圖像對作為輸入,經(jīng)過網(wǎng)絡(luò)的一系列計算和處理,直接輸出視差圖。在基于深度學(xué)習(xí)的立體匹配算法中,網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計至關(guān)重要。常用的網(wǎng)絡(luò)結(jié)構(gòu)包括卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)及其變體。CNN通過卷積層、池化層和全連接層等組件,能夠自動提取圖像的特征。在立體匹配中,通常采用共享權(quán)重的卷積層對左右圖像進行特征提取,以確保提取的特征具有一致性和可比性。在特征提取階段,淺層卷積層主要捕捉圖像的低級特征,如邊緣、紋理等;隨著網(wǎng)絡(luò)層數(shù)的增加,深層卷積層能夠?qū)W習(xí)到更高級、更抽象的特征,這些特征包含了圖像的語義信息和上下文信息,有助于提高立體匹配的準(zhǔn)確性。匹配代價計算是立體匹配的關(guān)鍵步驟之一,基于深度學(xué)習(xí)的方法通過網(wǎng)絡(luò)學(xué)習(xí)到的特征來計算匹配代價。傳統(tǒng)的立體匹配方法通常采用手工設(shè)計的相似性度量,如絕對誤差和(SAD)、歸一化互相關(guān)(NCC)等,這些度量在復(fù)雜場景下往往表現(xiàn)出局限性。而深度學(xué)習(xí)算法能夠自動學(xué)習(xí)到更適合立體匹配的匹配代價函數(shù)。網(wǎng)絡(luò)可以通過對大量立體圖像對及其對應(yīng)的視差圖進行學(xué)習(xí),建立起圖像特征與匹配代價之間的映射關(guān)系。在這個過程中,網(wǎng)絡(luò)會根據(jù)訓(xùn)練數(shù)據(jù)中的信息,自動調(diào)整參數(shù),使得計算出的匹配代價能夠更好地反映圖像中像素之間的匹配程度。例如,在一些基于深度學(xué)習(xí)的立體匹配算法中,通過構(gòu)建匹配代價體(CostVolume)來存儲不同視差下的匹配代價。匹配代價體是一個三維張量,其中兩個維度對應(yīng)圖像的空間位置,第三個維度對應(yīng)視差。通過將左右圖像的特征在不同視差下進行組合和計算,可以得到每個位置和視差下的匹配代價,從而為后續(xù)的視差計算提供基礎(chǔ)。在計算出匹配代價后,需要從匹配代價中確定每個像素的視差。這通常通過視差回歸或分類的方式實現(xiàn)。視差回歸是直接預(yù)測每個像素的視差值,通過設(shè)計合適的損失函數(shù),如均方誤差損失函數(shù),來監(jiān)督網(wǎng)絡(luò)的訓(xùn)練,使得預(yù)測的視差值盡可能接近真實的視差值。視差分類則是將視差范圍劃分為多個離散的類別,網(wǎng)絡(luò)預(yù)測每個像素屬于不同視差類別的概率,然后選擇概率最大的類別作為該像素的視差。在實際應(yīng)用中,還可以采用一些后處理技術(shù),如中值濾波、雙邊濾波等,對視差圖進行優(yōu)化,進一步提高視差圖的質(zhì)量。中值濾波可以去除視差圖中的孤立噪聲點,雙邊濾波則可以在保持視差邊緣的同時,平滑視差圖中的平坦區(qū)域。3.4.2典型算法案例分析以FlowNet和DispNet為例,這兩種算法都是基于深度學(xué)習(xí)的立體匹配算法,在小基高比圖像立體匹配中具有一定的代表性,通過對它們的分析可以深入了解深度學(xué)習(xí)算法在該領(lǐng)域的精度和效率問題。FlowNet是一種用于估計光流的深度學(xué)習(xí)模型,光流與立體匹配中的視差具有密切的關(guān)系,因此FlowNet的思想也可應(yīng)用于立體匹配。FlowNet采用了卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過對大量立體圖像對的學(xué)習(xí),來預(yù)測圖像中像素的運動向量,進而得到視差信息。在小基高比圖像立體匹配中,F(xiàn)lowNet能夠利用其強大的特征學(xué)習(xí)能力,捕捉到小基高比圖像中微弱的特征差異。由于小基高比圖像的輻射特性一致和幾何變形小,圖像中的特征變化相對較小,F(xiàn)lowNet可以通過學(xué)習(xí)到的特征表示,準(zhǔn)確地找到匹配點,從而提高匹配精度。在一些簡單場景的小基高比圖像中,F(xiàn)lowNet能夠獲得較為準(zhǔn)確的視差圖,為后續(xù)的三維重建提供可靠的基礎(chǔ)。FlowNet也存在一些不足之處。它對訓(xùn)練數(shù)據(jù)的依賴性較強,需要大量的標(biāo)注數(shù)據(jù)來訓(xùn)練網(wǎng)絡(luò),以保證其泛化能力。在實際應(yīng)用中,獲取大量高質(zhì)量的標(biāo)注數(shù)據(jù)往往是困難且耗時的。FlowNet的計算復(fù)雜度較高,需要消耗大量的計算資源和時間,這使得它在一些對實時性要求較高的應(yīng)用場景中受到限制。在自動駕駛等需要實時獲取視差信息的場景中,F(xiàn)lowNet可能無法滿足時間要求,導(dǎo)致系統(tǒng)響應(yīng)滯后。DispNet是專門為立體匹配任務(wù)設(shè)計的深度學(xué)習(xí)模型,它直接輸出視差圖。DispNet同樣采用了卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過多尺度特征融合和視差回歸等技術(shù),來提高視差估計的準(zhǔn)確性。在小基高比圖像立體匹配中,DispNet通過對不同尺度下的圖像特征進行融合,可以更好地處理小基高比圖像中可能存在的遮擋、低紋理等問題。在低紋理區(qū)域,DispNet可以利用大尺度特征提供的上下文信息,輔助視差估計,從而提高匹配精度。DispNet在小基高比圖像立體匹配中也面臨一些挑戰(zhàn)。它在處理復(fù)雜場景時,對于遮擋區(qū)域和視差不連續(xù)區(qū)域的處理效果還有待提高。在這些區(qū)域,DispNet可能會出現(xiàn)誤匹配或視差估計不準(zhǔn)確的情況,影響視差圖的質(zhì)量。DispNet在小樣本情況下的泛化能力相對較弱,當(dāng)遇到與訓(xùn)練數(shù)據(jù)分布差異較大的小基高比圖像時,其匹配精度可能會明顯下降。四、面向小基高比圖像的立體匹配新方法設(shè)計4.1創(chuàng)新思路與理論基礎(chǔ)為了有效解決小基高比圖像立體匹配中存在的問題,提高匹配精度和效率,本研究提出了一種創(chuàng)新的立體匹配方法,將自適應(yīng)窗口技術(shù)、多窗口策略、最大似然估計等多種技術(shù)相結(jié)合。自適應(yīng)窗口技術(shù)在立體匹配中具有重要作用,其原理是根據(jù)圖像的局部特征動態(tài)調(diào)整匹配窗口的大小和形狀。在小基高比圖像中,由于不同區(qū)域的紋理、邊緣等特征差異較大,固定大小和形狀的窗口難以適應(yīng)所有區(qū)域的匹配需求。自適應(yīng)窗口技術(shù)能夠根據(jù)圖像中每個像素點周圍的局部特征,如灰度變化、梯度信息等,靈活地調(diào)整窗口的大小和形狀。在紋理豐富的區(qū)域,采用較小的窗口可以更精確地捕捉細節(jié)信息,提高匹配的準(zhǔn)確性;在低紋理區(qū)域,增大窗口尺寸可以利用更多的鄰域信息,增強匹配的可靠性。通過這種方式,自適應(yīng)窗口技術(shù)能夠更好地適應(yīng)小基高比圖像的特點,減少因窗口選擇不當(dāng)導(dǎo)致的誤匹配問題。多窗口策略是進一步提高小基高比圖像立體匹配精度的關(guān)鍵技術(shù)。該策略的核心思想是在匹配過程中同時使用多個不同大小和形狀的窗口,對每個窗口計算匹配代價,然后綜合考慮多個窗口的匹配結(jié)果來確定最終的匹配點。不同大小和形狀的窗口能夠捕捉到圖像中不同尺度和方向的特征信息,例如大窗口可以包含更多的上下文信息,有助于處理低紋理區(qū)域和遮擋問題;小窗口則對細節(jié)特征更為敏感,適用于紋理豐富的區(qū)域。通過多窗口策略,可以充分利用圖像的各種特征信息,提高匹配的準(zhǔn)確性和魯棒性。在城市建筑場景的小基高比圖像中,大窗口可以覆蓋整個建筑物,獲取建筑物的整體結(jié)構(gòu)信息,幫助確定建筑物的大致位置;小窗口可以聚焦于建筑物的邊緣和紋理細節(jié),準(zhǔn)確地找到建筑物邊界的匹配點,從而減少“黏合”現(xiàn)象的發(fā)生,提高視差圖的質(zhì)量。最大似然估計是一種基于概率統(tǒng)計的參數(shù)估計方法,在小基高比圖像立體匹配中,可用于優(yōu)化匹配代價和視差估計。其基本原理是在已知觀測數(shù)據(jù)的情況下,通過最大化似然函數(shù)來估計模型參數(shù)。在立體匹配中,將匹配代價視為觀測數(shù)據(jù),視差作為模型參數(shù),通過最大似然估計可以找到最有可能產(chǎn)生當(dāng)前觀測數(shù)據(jù)的視差。具體來說,最大似然估計考慮了圖像噪聲、特征分布等因素對匹配的影響,通過構(gòu)建合適的似然函數(shù),能夠更準(zhǔn)確地衡量不同視差下的匹配可能性。在存在噪聲的小基高比圖像中,最大似然估計可以通過對噪聲分布的建模,抑制噪聲對匹配的干擾,提高視差估計的精度。它還能夠根據(jù)圖像特征的分布情況,自適應(yīng)地調(diào)整匹配策略,使得匹配結(jié)果更加符合實際場景。將自適應(yīng)窗口技術(shù)、多窗口策略和最大似然估計相結(jié)合,能夠充分發(fā)揮各技術(shù)的優(yōu)勢,有效解決小基高比圖像立體匹配中面臨的挑戰(zhàn)。自適應(yīng)窗口技術(shù)和多窗口策略能夠更好地適應(yīng)小基高比圖像的復(fù)雜特征,提供更豐富的匹配信息;最大似然估計則可以在這些信息的基礎(chǔ)上,通過優(yōu)化匹配代價和視差估計,提高匹配的精度和可靠性。這種創(chuàng)新的方法為小基高比圖像立體匹配提供了新的思路和途徑,有望在實際應(yīng)用中取得更好的效果。4.2算法詳細設(shè)計4.2.1匹配窗口確定為了有效解決小基高比圖像立體匹配中因窗口選擇不當(dāng)導(dǎo)致的“黏合”現(xiàn)象和匹配精度問題,本方法將自適應(yīng)窗口技術(shù)和多窗口策略相結(jié)合來確定匹配窗口。在自適應(yīng)窗口技術(shù)中,窗口大小和形狀的確定依賴于圖像的局部特征。通過計算圖像中每個像素點鄰域的灰度變化、梯度信息等,來評估該區(qū)域的紋理豐富程度和邊緣特性。對于紋理豐富的區(qū)域,由于其具有明顯的特征變化,選擇較小的窗口能夠更精確地捕捉這些細節(jié)信息,從而提高匹配的準(zhǔn)確性。在建筑物的窗戶、裝飾線條等紋理豐富的部位,小窗口可以更好地匹配這些細節(jié),避免因窗口過大而包含過多背景信息導(dǎo)致的誤匹配。而在低紋理區(qū)域,如大面積的墻面、地面等,由于缺乏明顯的特征變化,選擇較大的窗口可以利用更多的鄰域信息,增強匹配的可靠性。大窗口可以綜合考慮周圍區(qū)域的灰度分布,減少因局部噪聲或干擾導(dǎo)致的誤匹配。多窗口策略則進一步優(yōu)化了匹配窗口的選擇。在匹配過程中,同時使用多個不同大小和形狀的窗口對每個像素點進行匹配代價計算。不同大小和形狀的窗口能夠捕捉到圖像中不同尺度和方向的特征信息,從而更全面地描述圖像的局部特征。大窗口可以包含更多的上下文信息,有助于處理低紋理區(qū)域和遮擋問題。在存在遮擋的情況下,大窗口可以通過上下文信息推斷被遮擋部分的視差,提高匹配的魯棒性。小窗口則對細節(jié)特征更為敏感,適用于紋理豐富的區(qū)域。在紋理復(fù)雜的區(qū)域,小窗口能夠準(zhǔn)確地匹配細節(jié)特征,提高匹配的精度。通過多窗口策略,可以充分利用圖像的各種特征信息,提高匹配的準(zhǔn)確性和魯棒性。具體實現(xiàn)時,對于參考圖像中的每個像素點,首先利用自適應(yīng)窗口技術(shù)初步確定窗口的大小和形狀范圍。然后在這個范圍內(nèi),選擇多個具有代表性的窗口,如不同大小的正方形窗口、不同長寬比的矩形窗口以及不同角度的旋轉(zhuǎn)窗口等。對每個窗口分別計算匹配代價,這些匹配代價反映了該窗口在不同視差下與目標(biāo)圖像對應(yīng)區(qū)域的相似程度。最后,綜合考慮多個窗口的匹配代價,通過一定的融合策略,如加權(quán)平均、最大值選擇或基于可信度的融合等,來確定最終的匹配窗口和匹配代價。加權(quán)平均融合策略可以根據(jù)每個窗口在不同區(qū)域的表現(xiàn),為其分配不同的權(quán)重,使得在紋理豐富區(qū)域小窗口的權(quán)重較大,而在低紋理區(qū)域大窗口的權(quán)重較大,從而綜合利用各個窗口的優(yōu)勢,提高匹配的準(zhǔn)確性。4.2.2視差計算在確定匹配窗口后,需要計算每個像素點的視差,本方法采用規(guī)范化互相關(guān)函數(shù)和“勝者全取”策略來計算整數(shù)級視差,并利用基于二分法的亞像素匹配方法計算亞像素級視差。規(guī)范化互相關(guān)(NormalizedCross-Correlation,NCC)函數(shù)是一種常用的相似性度量方法,它能夠有效地衡量兩個圖像區(qū)域之間的相似程度,對于小基高比圖像的立體匹配具有較好的適應(yīng)性。對于參考圖像中的像素點p及其匹配窗口W_p,在目標(biāo)圖像中以相同大小的窗口在一定視差搜索范圍內(nèi)進行滑動,計算每個位置的窗口與W_p的規(guī)范化互相關(guān)值,即NCC(p,d)=\frac{\sum_{(x,y)\inW_p}(I_l(x,y)-\overline{I_l})(I_r(x,y-d)-\overline{I_r})}{\sqrt{\sum_{(x,y)\inW_p}(I_l(x,y)-\overline{I_l})^2\sum_{(x,y)\inW_p}(I_r(x,y-d)-\overline{I_r})^2}},其中I_l(x,y)和I_r(x,y)分別表示左、右圖像在位置(x,y)處的灰度值,\overline{I_l}和\overline{I_r}分別是窗口W_p在左、右圖像中的平均灰度值,d表示視差。通過計算不同視差下的規(guī)范化互相關(guān)值,可以得到每個像素點在不同視差下的匹配代價,形成匹配代價矩陣。“勝者全取”(Winner-Take-All,WTA)策略是從匹配代價矩陣中確定每個像素點整數(shù)級視差的常用方法。該策略選擇匹配代價最?。匆?guī)范化互相關(guān)值最大)的視差作為該像素點的整數(shù)級視差,即d_{int}(p)=\arg\max_dNCC(p,d)。這種方法簡單直觀,能夠快速地確定每個像素點的初步視差,但容易受到噪聲和局部極小值的影響,導(dǎo)致在一些復(fù)雜場景下出現(xiàn)誤匹配。為了提高視差計算的準(zhǔn)確性,可以引入一些約束條件,如唯一性約束、順序一致性約束等。唯一性約束要求每個像素在目標(biāo)圖像中只有一個最佳匹配點,避免出現(xiàn)一對多的匹配情況;順序一致性約束則保證在同一掃描線上,左右圖像中對應(yīng)點的順序保持一致,有助于消除因遮擋或視差不連續(xù)導(dǎo)致的錯誤匹配。為了進一步提高視差的精度,需要計算亞像素級視差。本方法采用基于二分法的亞像素匹配方法,以整數(shù)級視差為基礎(chǔ)進行亞像素視差的計算。具體步驟如下:首先,在整數(shù)級視差d_{int}的鄰域內(nèi),如[d_{int}-1,d_{int}+1]范圍內(nèi),以一定的步長(如0.1)進行視差采樣,計算每個采樣視差下的匹配代價。然后,根據(jù)這些匹配代價構(gòu)建一個關(guān)于視差的函數(shù),該函數(shù)通常具有一定的單調(diào)性。通過二分法在這個函數(shù)上進行搜索,不斷縮小搜索區(qū)間,直到滿足一定的精度要求(如視差變化小于0.01),此時得到的視差即為亞像素級視差d_{sub}。通過這種基于二分法的亞像素匹配方法,可以有效地提高視差的精度,從而提高立體匹配的準(zhǔn)確性,為后續(xù)的三維重建提供更精確的深度信息。4.2.3視差優(yōu)化與傳播在計算得到每個像素點的亞像素級視差后,需要對視差進行優(yōu)化和傳播,以獲得更準(zhǔn)確、更稠密的視差圖。本方法采用基于圖像分割的迭代傳播方法來實現(xiàn)這一目標(biāo)。基于圖像分割的方法首先利用圖像分割算法將參考圖像和目標(biāo)圖像分割成多個具有相似特征的區(qū)域。常見的圖像分割算法包括基于閾值的分割、基于邊緣的分割、基于區(qū)域生長的分割以及基于深度學(xué)習(xí)的分割等。根據(jù)小基高比圖像的特點,選擇合適的圖像分割算法,如基于區(qū)域生長的分割算法,它能夠根據(jù)圖像的局部特征,如灰度、紋理等,將圖像分割成不同的區(qū)域,使得每個區(qū)域內(nèi)的像素具有相似的特征。通過圖像分割,可以將圖像中的物體、背景等不同部分區(qū)分開來,為視差優(yōu)化和傳播提供更準(zhǔn)確的基礎(chǔ)。迭代傳播過程則是在分割后的區(qū)域內(nèi)對視差進行優(yōu)化和傳播。對于每個分割區(qū)域,首先根據(jù)區(qū)域內(nèi)已有的視差信息,如區(qū)域內(nèi)像素點的平均視差或中心像素的視差,作為該區(qū)域的初始視差估計。然后,通過迭代的方式,將區(qū)域內(nèi)每個像素點的視差向其鄰域像素進行傳播。在傳播過程中,考慮鄰域像素的視差信息以及它們之間的相似性,通過一定的權(quán)重分配策略,對鄰域像素的視差進行加權(quán)融合,得到當(dāng)前像素點的新視差估計。如果鄰域像素與當(dāng)前像素的灰度、紋理等特征相似性較高,則賦予其較大的權(quán)重,使得當(dāng)前像素的視差更接近這些相似鄰域像素的視差;反之,則賦予較小的權(quán)重。通過多次迭代傳播,使得區(qū)域內(nèi)的視差逐漸趨于一致,從而提高視差的平滑性和準(zhǔn)確性。在不同區(qū)域之間,也進行視差的傳播和融合。當(dāng)兩個相鄰區(qū)域的邊界像素具有相似的特征時,可以將一個區(qū)域的視差信息傳播到另一個區(qū)域,以填補可能存在的視差空洞或不一致區(qū)域。在建筑物與周圍地面區(qū)域的邊界處,如果邊界像素的特征相似,可以將建筑物區(qū)域的視差信息傳播到地面區(qū)域,使得邊界處的視差更加連續(xù)和平滑。通過這種基于圖像分割的迭代傳播方法,可以有效地優(yōu)化視差,填補視差空洞,提高視差圖的稠密性和準(zhǔn)確性,從而得到高質(zhì)量的視差圖,為后續(xù)的三維重建等應(yīng)用提供可靠的數(shù)據(jù)支持。4.3算法優(yōu)勢分析本研究提出的面向小基高比圖像的立體匹配新方法,在解決小基高比圖像立體匹配問題方面具有顯著優(yōu)勢,主要體現(xiàn)在減少“黏合”現(xiàn)象、提高深度精度和亞像素精度等方面。在減少“黏合”現(xiàn)象方面,新方法通過將自適應(yīng)窗口技術(shù)和多窗口策略相結(jié)合確定匹配窗口,取得了良好的效果。在傳統(tǒng)的基于局部窗口的立體匹配方法中,固定大小和形狀的窗口難以適應(yīng)小基高比圖像中不同區(qū)域的復(fù)雜特征。在物體邊界處,大窗口容易包含多個不同視差的區(qū)域,從而導(dǎo)致“黏合”現(xiàn)象,使物體邊界在視差圖中變得模糊。而新方法中的自適應(yīng)窗口技術(shù)能夠根據(jù)圖像的局部特征,如紋理豐富程度、邊緣特性等,動態(tài)調(diào)整窗口的大小和形狀。在紋理豐富的區(qū)域,采用小窗口可以更精確地捕捉細節(jié)信息,避免窗口過大而包含過多背景信息導(dǎo)致的誤匹配;在低紋理區(qū)域,增大窗口尺寸可以利用更多的鄰域信息,增強匹配的可靠性。多窗口策略進一步優(yōu)化了匹配窗口的選擇。通過同時使用多個不同大小和形狀的窗口對每個像素點進行匹配代價計算,能夠充分利用圖像中不同尺度和方向的特征信息。不同大小和形狀的窗口能夠捕捉到圖像中不同的特征,大窗口可以包含更多的上下文信息,有助于處理低紋理區(qū)域和遮擋問題;小窗口則對細節(jié)特征更為敏感,適用于紋理豐富的區(qū)域。通過綜合考慮多個窗口的匹配結(jié)果,能夠更準(zhǔn)確地確定匹配點,從而減少“黏合”現(xiàn)象的發(fā)生。在城市建筑場景的小基高比圖像中,新方法能夠清晰地分辨出建筑物的邊界,避免了建筑物之間因“黏合”現(xiàn)象而導(dǎo)致的邊界模糊問題,使視差圖更加準(zhǔn)確地反映場景的真實結(jié)構(gòu)。在提高深度精度方面,新方法采用基于二分法的亞像素匹配方法計算亞像素級視差,有效地提高了深度精度。小基高比圖像由于同名光線的交會角變小,導(dǎo)致深度計算的精度降低。傳統(tǒng)的立體匹配方法在計算視差時,往往只能得到整數(shù)級視差,這對于高精度的深度測量來說是遠遠不夠的。新方法以整數(shù)級視差為基礎(chǔ),利用基于二分法的亞像素匹配方法,在整數(shù)級視差的鄰域內(nèi)進行精細搜索,能夠得到更精確的亞像素級視差。通過在整數(shù)級視差d_{int}的鄰域內(nèi),如[d_{int}-1,d_{int}+1]范圍內(nèi),以一定的步長(如0.1)進行視差采樣,計算每個采樣視差下的匹配代價,并根據(jù)這些匹配代價構(gòu)建關(guān)于視差的函數(shù),再通過二分法在該函數(shù)上進行搜索,不斷縮小搜索區(qū)間,直到滿足一定的精度要求(如視差變化小于0.01),此時得到的視差即為亞像素級視差d_{sub}。這種方法能夠有效地提高視差的精度,從而提高深度計算的準(zhǔn)確性。在地形測繪中,新方法能夠更準(zhǔn)確地測量地形的高度和坡度,為土地規(guī)劃、資源勘探等提供更可靠的數(shù)據(jù)支持。在提高亞像素精度方面,新方法同樣具有明顯優(yōu)勢。傳統(tǒng)的立體匹配算法在亞像素精度方面往往存在不足,難以滿足一些對精度要求極高的應(yīng)用場景。而新方法通過一系列的優(yōu)化措施,能夠獲得高精度的亞像素級視差。除了基于二分法的亞像素匹配方法外,新方法在匹配窗口確定、視差計算和視差優(yōu)化與傳播等環(huán)節(jié)都進行了精心設(shè)計。在匹配窗口確定階段,自適應(yīng)窗口技術(shù)和多窗口策略能夠更準(zhǔn)確地捕捉圖像的局部特征,為亞像素匹配提供更可靠的基礎(chǔ);在視差計算階段,規(guī)范化互相關(guān)函數(shù)和“勝者全取”策略的結(jié)合,能夠準(zhǔn)確地計算整數(shù)級視差,為亞像素匹配提供準(zhǔn)確的起始點;在視差優(yōu)化與傳播階段,基于圖像分割的迭代傳播方法能夠?qū)σ暡钸M行進一步優(yōu)化,提高視差的平滑性和準(zhǔn)確性,從而間接提高亞像素精度。實驗結(jié)果表明,該立體匹配算法的亞像素精度可優(yōu)于1/20個像元,能夠滿足如工業(yè)檢測、文物數(shù)字化等對亞像素精度要求較高的應(yīng)用場景。五、實驗與結(jié)果分析5.1實驗數(shù)據(jù)集與實驗環(huán)境為了全面、準(zhǔn)確地評估所提出的面向小基高比圖像的立體匹配方法的性能,本研究選用了多種具有代表性的實驗數(shù)據(jù)集,并在特定的硬件和軟件環(huán)境下進行實驗。在實驗數(shù)據(jù)集方面,選用了UCD航空遙感影像。該影像分辨率為0.05m,焦距f為101.4mm,像元大小為0.009mm。實驗中選取了5張連續(xù)且具有一定重疊度的UCD航空遙感影像(為方便實驗,影像從大幅影像中截取,影像大小均為800像素×900像素),其中影像1分別與影像2、影像3、影像4、影像5組成基高比為0.12、0.23、0.35、0.47的立體像對。通過使用這組影像,可以研究不同基高比情況下算法的性能表現(xiàn),分析基高比變化對立體匹配結(jié)果的影響。UCD航空遙感影像具有較高的分辨率和豐富的紋理信息,能夠很好地模擬實際應(yīng)用中的復(fù)雜場景,為驗證算法在真實場景下的有效性提供了有力支持。本實驗的硬件環(huán)境為:處理器采用IntelCorei7-12700K,具有強大的計算能力,能夠快速處理大量的數(shù)據(jù);內(nèi)存為32GBDDR43200MHz,確保在運行算法和處理圖像數(shù)據(jù)時,有足夠的內(nèi)存空間來存儲中間結(jié)果和圖像信息,避免因內(nèi)存不足導(dǎo)致的計算中斷或效率低下;顯卡為NVIDIAGeForceRTX3080,其具備高性能的圖形處理能力,對于深度學(xué)習(xí)算法的加速以及復(fù)雜圖像的處理具有重要作用,能夠顯著提高算法的運行速度。軟件環(huán)境方面,操作系統(tǒng)選用Windows1064位專業(yè)版,該系統(tǒng)具有良好的兼容性和穩(wěn)定性,能夠為實驗提供穩(wěn)定的運行環(huán)境。編程環(huán)境采用Python3.8,Python擁有豐富的開源庫和工具,如NumPy、SciPy、OpenCV等,這些庫為圖像讀取、處理、算法實現(xiàn)以及結(jié)果可視化提供了便捷的功能。深度學(xué)習(xí)框架使用PyTorch1.10,PyTorch具有動態(tài)計算圖、易于調(diào)試等優(yōu)點,能夠方便地構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型,為基于深度學(xué)習(xí)的立體匹配算法實現(xiàn)提供了強大的支持。5.2實驗方案設(shè)計為全面評估所提出的面向小基高比圖像的立體匹配方法的性能,本實驗采用對比實驗的方式,與其他典型立體匹配算法進行對比,并設(shè)置不同參數(shù)以探究其對算法性能的影響。在對比算法選擇上,選取了半全局匹配(Semi-GlobalMatching,SGM)算法、基于互信息的半全局匹配算法以及FlowNet和DispNet等基于深度學(xué)習(xí)的立體匹配算法。SGM算法是一種經(jīng)典的半全局立體匹配算法,它通過在多個方向上進行一維的能量聚合,近似地考慮全局信息,在立體匹配領(lǐng)域得到了廣泛應(yīng)用?;诨バ畔⒌陌肴制ヅ渌惴▌t利用互信息對光照變化和噪聲具有一定魯棒性的特點,在復(fù)雜的光照條件和存在噪聲的情況下,依然能保持較好的匹配性能。FlowNet和DispNet作為基于深度學(xué)習(xí)的立體匹配算法的代表,利用深度學(xué)習(xí)強大的特征學(xué)習(xí)能力,自動從圖像中提取復(fù)雜的特征表示,從而實現(xiàn)更準(zhǔn)確的立體匹配。通過與這些算法進行對比,可以全面評估本方法在不同場景下的性能表現(xiàn)。在不同參數(shù)設(shè)置下的實驗方面,主要對本方法中的關(guān)鍵參數(shù)進行調(diào)整,以探究其對算法性能的影響。匹配窗口的大小和形狀參數(shù)對算法性能有重要影響。設(shè)置不同大小的正方形窗口,如窗口大小為3×3、5×5、7×7等,以及不同長寬比的矩形窗口,如長寬比為1:2、2:1等,觀察算法在不同窗口設(shè)置下的匹配精度和效率。調(diào)整多窗口策略中不同窗口的權(quán)重分配參數(shù),如采用均勻權(quán)重分配和根據(jù)圖像局部特征動態(tài)分配權(quán)重等方式,分析權(quán)重分配對匹配結(jié)果的影響。在視差計算階段,調(diào)整亞像素匹配的步長和精度要求參數(shù),如步長設(shè)置為0.05、0.1、0.2等,精度要求設(shè)置為0.005、0.01、0.02等,研究這些參數(shù)對視差精度的影響。通過對這些參數(shù)的調(diào)整和實驗,能夠找到最優(yōu)的參數(shù)組合,使算法在不同場景下都能發(fā)揮出最佳性能。5.3實驗結(jié)果與分析5.3.1定性分析為直觀展示所提方法在小基高比圖像立體匹配中的優(yōu)勢,對不同算法處理小基高比圖像得到的視差圖進行定性分析。以UCD航空遙感影像中基高比為0.12的立體像對為例,分別采用SGM算法、基于互信息的半全局匹配算法、FlowNet、DispNet以及本文提出的方法進行立體匹配,得到的視差圖如圖[X]所示。[此處插入不同算法視差圖對比圖,圖中清晰標(biāo)注各子圖對應(yīng)的算法名稱]從圖中可以明顯看出,SGM算法在處理該小基高比圖像時,視差圖中存在較多噪聲點,尤其是在建筑物邊緣和低紋理區(qū)域,噪聲更為明顯。在建筑物的輪廓處,出現(xiàn)了許多孤立的噪聲點,使得建筑物的邊界不夠清晰,影響了對建筑物形狀和位置的準(zhǔn)確判斷。這是因為SGM算法在代價聚合過程中,雖然考慮了多個方向的信息,但對于小基高比圖像中復(fù)雜的局部特征適應(yīng)性不足,容易受到噪聲的干擾?;诨バ畔⒌陌肴制ヅ渌惴ǖ囊暡顖D中,低紋理區(qū)域的視差估計存在較大誤差。在大面積的草地等低紋理區(qū)域,視差圖出現(xiàn)了明顯的錯誤估計,導(dǎo)致該區(qū)域的深度信息不準(zhǔn)確。這是由于互信息計算復(fù)雜度較高,在低紋理區(qū)域缺乏足夠的信息來準(zhǔn)確計算互信息,從而影響了匹配的準(zhǔn)確性。FlowNet和DispNet等基于深度學(xué)習(xí)的算法,雖然在整體視差圖的平滑度上表現(xiàn)較好,但在遮擋區(qū)域和視差不連續(xù)區(qū)域存在明顯的誤匹配。在建筑物之間的遮擋區(qū)域,F(xiàn)lowNet和DispNet的視差圖出現(xiàn)了錯誤的視差估計,導(dǎo)致遮擋區(qū)域的深度信息錯誤。這是因為深度學(xué)習(xí)算法對訓(xùn)練數(shù)據(jù)的依賴性較強,當(dāng)遇到與訓(xùn)練數(shù)據(jù)分布差異較大的小基高比圖像時,在遮擋區(qū)域和視差不連續(xù)區(qū)域的處理能力較弱。相比之下,本文提出的方法得到的視差圖在細節(jié)表現(xiàn)和整體準(zhǔn)確性上具有明顯優(yōu)勢。在建筑物的邊緣和紋理豐富區(qū)域,視差圖能夠清晰地顯示出物體的輪廓和細節(jié),如建筑物的窗戶、裝飾線條等細節(jié)都能準(zhǔn)確地反映在視差圖中。在低紋理區(qū)域,通過自適應(yīng)窗口技術(shù)和多窗口策略,能夠有效地利用鄰域信息,減少視差估計的誤差。在遮擋區(qū)域,基于圖像分割的迭代傳播方法能夠較好地處理遮擋問題,使得遮擋區(qū)域的視差估計更加準(zhǔn)確,視差圖更加連續(xù)和平滑。從定性分析結(jié)果可以初步看出,本文方法在處理小基高比圖像時,能夠獲得更準(zhǔn)確、更清晰的視差圖,有效解決了其他算法存在的問題。5.3.2定量分析為進一步深入評估所提方法在小基高比圖像立體匹配中的性能,通過計算視差誤差等指標(biāo),從精度、效率等方面進行定量分析。在精度方面,采用平均絕對誤差(MAE)、均方根誤差(RMSE)和壞點率(Bad-PixelRatio)等指標(biāo)來衡量不同算法的視差精度。MAE表示預(yù)測視差與真實視差之間絕對誤差的平均值,計算公式為MAE=\frac{1}{N}\sum_{i=1}^{N}|d_{i}^{pred}-d_{i}^{gt}|,其中N為像素總數(shù),d_{i}^{pred}為預(yù)測視差,d_{i}^{gt}為真實視差。RMSE則衡量預(yù)測視差與真實視差之間誤差的平方和的平均值的平方根,公式為RMSE=\sqrt{\frac{1}{N}\sum_{i=1}^{N}(d_{i}^{pred}-d_{i}^{gt})^2}。壞點率是指視差誤差大于一定閾值(如3像素)的像素占總像素數(shù)的比例,用于評估算法在處理復(fù)雜場景時的可靠性。對UCD航空遙感影像中不同基高比的立體像對進行實驗,統(tǒng)計各算法的精度指標(biāo),結(jié)果如表1所示:[此處插入精度指標(biāo)對比表,表頭為算法名稱、基高比、MAE、RMSE、壞點率,表格內(nèi)容為不同算法在不同基高比下對應(yīng)的指標(biāo)數(shù)值]從表1可以看出,在不同基高比下,本文提出的方法在MAE、RMSE和壞點率等指標(biāo)上均優(yōu)于其他對比算法。隨著基高比的減小,本文方法的優(yōu)勢更加明顯。在基高比為0.12時,本文方法的MAE為[X],RMSE為[X],壞點率為[X],而SGM算法的MAE為[X],RMSE為[X],壞點率為[X];基于互信息的半全局匹配算法的MAE為[X],RMSE為[X],壞點率為[X];FlowNet的MAE為[X],RMSE為[X],壞點率為[X];DispNet的MAE為[X],RMSE為[X],壞點率為[X]。這表明本文方法能夠更準(zhǔn)確地估計視差,有效提高了小基高比圖像立體匹配的精度。在效率方面,主要對比各算法的運行時間。記錄不同算法處理同一組小基高比圖像所需的平均運行時間,結(jié)果如表2所示:[此處插入運行時間對比表,表頭為算法名稱、運行時間(秒),表格內(nèi)容為不同算法對應(yīng)的運行時間數(shù)值]從表2可以看出,本文方法在保證高精度的同時,運行時間相對較短。與基于深度學(xué)習(xí)的FlowNet和DispNet算法相比,本文方法的運行時間明顯更短,能夠滿足一些對實時性要求較高的應(yīng)用場景。與SGM算法和基于互信息的半全局匹配算法相比,本文方法雖然在運行時間上沒有絕對優(yōu)勢,但考慮到其在精度上的顯著提升,綜合性能依然更為優(yōu)越。通過定量分析,充分驗證了本文提出的面向小基高比圖像的立體匹配方法在精度和效率方面的性能提升,具有較高的應(yīng)用價值。5.4實驗結(jié)論通過對不同算法在小基高比圖像立體匹配中的定性和定量分析,充分驗證了本文提出的面向小基高比圖像的立體匹配新方法的有效性和優(yōu)越性。從定性分析的視差圖對比中可以直觀地看出,與SGM算法、基于互信息的半全局匹配算法、FlowNet和DispNet等算法相比,本文方法在處理小基高比圖像時,能夠有效減少視差圖中的噪聲、誤匹配和“黏合”現(xiàn)象。在建筑物邊緣、低紋理區(qū)域和遮擋區(qū)域等復(fù)雜場景下,本文方法能夠更準(zhǔn)確地反映物體的輪廓和深度信息,得到的視差圖更加清晰、連續(xù)和平滑,為后續(xù)的三維重建提供了更可靠的基礎(chǔ)。定量分析結(jié)果進一步證明了本文方法的優(yōu)勢。在精度方面,通過計算平均絕對誤差(MAE)、均方根誤差(RMSE)和壞點率等指標(biāo),發(fā)現(xiàn)在不同基高比下,本文方法的各項精度指標(biāo)均優(yōu)于其他對比算法。隨著基高比的減小,本文方法在提高視差精度方面的優(yōu)勢更加明顯,能夠更準(zhǔn)確地估計視差,有效提高了小基高比圖像立體匹配的精度。在效率方面,本文方法在保證高精度的同時,運行時間相對較短。與基于深度學(xué)習(xí)的FlowNet和DispNet算法相比,運行時間明顯更短,能夠滿足一些對實時性要求較高的應(yīng)用場景。與SGM算法和基于互信息的半全局匹配算法相比,雖然在運行時間上沒有絕對優(yōu)勢,但考慮到其在精度上的顯著提升,綜合性能依然更為優(yōu)越。本文提出的面向小基高比圖像的立體匹配新方法在精度和效率方面取得了良好的平衡,能夠有效解決小基高比圖像立體匹配中存在的問題,具有較高的應(yīng)用價值。在未來的研究中,可以進一步優(yōu)化算法,提高其對復(fù)雜場景的適應(yīng)性和魯棒性,拓展其在更多領(lǐng)域的應(yīng)用。六、結(jié)論與展望6.1研究成果總結(jié)本研究圍繞面向小基高比圖像的立體匹配方法展開,通過深入分析小基高比圖像的特性,研究常見立體匹配方法,提出了一種創(chuàng)新的立體匹配方法,并進行了實驗驗證與性能評估,取得了一系列具有重要理論和實踐價值的研究成果。在小基高比圖像特性分析方面,明確了小基高比圖像具有輻射特性一致、幾何變形小但交會精度降低的特點。這些特性為后續(xù)的算法設(shè)計提供了重要的理論依據(jù),使我們能夠針對小基高比圖像的獨特性質(zhì)來優(yōu)化立體匹配算法,從而提高匹配的準(zhǔn)確性和可靠性。例如,輻射特性一致的特點使得我們在設(shè)計匹配算法時,可以更加注重利用圖像的灰度信息,減少因輻射差異導(dǎo)致的匹配錯誤;而幾何變形小的特性則為建立準(zhǔn)確的幾何約束提供了便利,有助于提高同名點匹配的精度。對常見立體匹配方法的研究是本研究的重要基礎(chǔ)。我們系統(tǒng)地分析了基于局部、全局以及深度學(xué)習(xí)的常見立體匹配方法,深入探討了它們在小基高比圖像匹配中的優(yōu)勢與不足?;诰植康姆椒ㄔ谔幚硇』弑葓D像時,對窗口選擇的敏感性較高,容易出現(xiàn)“黏合”現(xiàn)象;基于全局的方法雖然能夠考慮圖像的全局信息,但計算復(fù)雜度較高,在復(fù)雜場景下的適應(yīng)性有待提高;深度學(xué)習(xí)方法雖然具有強大的特征學(xué)習(xí)能力,但對大量標(biāo)注數(shù)據(jù)的依賴以及在小樣本情況下的泛化能力不足,限制了其在小基高比圖像匹配中的應(yīng)用。通過對這些方法的全面分析,我們總結(jié)出了適用于小基高比圖像匹配的方法特點和改進方向,為后續(xù)的算法設(shè)計提供了有益的參考。本研究的核心成果是設(shè)計了一種面向小基高比圖像的立體匹配新方法。該方法創(chuàng)新性地將自適應(yīng)窗口技術(shù)、多窗口策略、最大似然估計等多種技術(shù)相結(jié)合,有效解決了小基高比圖像立體匹配中存在的問題。在匹配窗口確定環(huán)節(jié),通過將自適應(yīng)窗口技術(shù)和多窗口策略相結(jié)合,能夠根據(jù)圖像的局部特征動態(tài)選擇合適的匹配窗口,減少了“黏合”現(xiàn)象的發(fā)生。在視差計算階段,采用規(guī)范化互相關(guān)函數(shù)和“勝者全取”策略計算整數(shù)級視差,并利用基于二分法的亞像素匹配方法計算亞像素級視差,提高了視差的精度。在視差優(yōu)化與傳播過程中,采用基于圖像分割的迭代傳播方法,進一步優(yōu)化視差,填補視差空洞,提高了視差圖的稠密性和準(zhǔn)確性。通過在UCD航空遙感影像數(shù)據(jù)集上的實驗驗證,充分證明了新方法的有效性和優(yōu)越性。定性分析表明,與SGM算法、基于互信息的半全局匹配算法、FlowNet和DispNet等算法相比,新方法得到的視差圖在細節(jié)表現(xiàn)和整體準(zhǔn)確性上具有明顯優(yōu)勢,能夠更準(zhǔn)確地反映物體的輪廓和深度信息。定量分析結(jié)果顯示,在不同基高比下,新方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論