SAR圖像處理與檢測 課件 第4-6章 SAR圖像目標(biāo)檢測的黎曼幾何算法 -微分幾何理論基礎(chǔ)_第1頁
SAR圖像處理與檢測 課件 第4-6章 SAR圖像目標(biāo)檢測的黎曼幾何算法 -微分幾何理論基礎(chǔ)_第2頁
SAR圖像處理與檢測 課件 第4-6章 SAR圖像目標(biāo)檢測的黎曼幾何算法 -微分幾何理論基礎(chǔ)_第3頁
SAR圖像處理與檢測 課件 第4-6章 SAR圖像目標(biāo)檢測的黎曼幾何算法 -微分幾何理論基礎(chǔ)_第4頁
SAR圖像處理與檢測 課件 第4-6章 SAR圖像目標(biāo)檢測的黎曼幾何算法 -微分幾何理論基礎(chǔ)_第5頁
已閱讀5頁,還剩132頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2025/5/221第四章

SAR圖像目標(biāo)檢測的黎曼幾何方法4.1統(tǒng)計(jì)流形及其幾何結(jié)構(gòu)4.2SAR圖像目標(biāo)檢測算法2.3實(shí)驗(yàn)結(jié)果及分析2.4小結(jié)2025/5/222介紹信息幾何是將現(xiàn)代幾何理論方法應(yīng)用于信息學(xué)領(lǐng)域而發(fā)展起來的一套理論體系,其在非線性問題分析處理中具有獨(dú)特的優(yōu)勢。依據(jù)信息幾何理論,針對所分析問題本身所具有的非線性特點(diǎn),可通過構(gòu)建微分流形的方式,定義具有線性結(jié)構(gòu)的切叢,從而能像歐氏空間一樣在切叢上定義內(nèi)積,將非線性問題轉(zhuǎn)化為局部線性問題求解。本章旨在分析指數(shù)分布族的參數(shù)流形及其度量,分析參數(shù)空間的幾何結(jié)構(gòu),探索微分幾何理論應(yīng)用于SAR圖像目標(biāo)檢測問題的切入點(diǎn)。本章算法從指數(shù)分布族出發(fā),構(gòu)建參數(shù)流形,引入?yún)?shù)化的費(fèi)希爾信息度量,構(gòu)造切向量,對待檢測目標(biāo)區(qū)域進(jìn)行顯著性表示,實(shí)現(xiàn)SAR圖像目標(biāo)檢測。統(tǒng)計(jì)流形及其幾何結(jié)構(gòu)

2025/5/223統(tǒng)計(jì)流形及其幾何結(jié)構(gòu)

2025/5/22統(tǒng)計(jì)流形及其幾何結(jié)構(gòu)

2025/5/22統(tǒng)計(jì)流形及其幾何結(jié)構(gòu)

2025/5/22統(tǒng)計(jì)流形及其幾何結(jié)構(gòu)

2025/5/22統(tǒng)計(jì)流形及其幾何結(jié)構(gòu)

2025/5/22SAR圖像目標(biāo)檢測算法

2025/5/22SAR圖像目標(biāo)檢測算法

2025/5/22SAR圖像目標(biāo)檢測算法

2025/5/22SAR圖像目標(biāo)檢測算法

2025/5/22實(shí)驗(yàn)結(jié)果及分析實(shí)驗(yàn)結(jié)果為了驗(yàn)證本章目標(biāo)檢測算法的有效性,實(shí)驗(yàn)基于MATLAB仿真平臺進(jìn)行了仿真,所采用的SAR圖像如圖4.1所示(圖像像素大小為153*151),其中,圖4.1(a)和圖4.1(b)各含有一個待檢測目標(biāo)。本章采用威布爾分布對海雜波進(jìn)行統(tǒng)計(jì)建模。2025/5/22實(shí)驗(yàn)結(jié)果及分析

2025/5/22實(shí)驗(yàn)結(jié)果及分析不失一般性,運(yùn)用最大類間方差法分別對圖4.2和圖4.3所示的顯著性目標(biāo)圖像進(jìn)行二分類,得到最終的檢測結(jié)果,如圖4.4所示。在實(shí)驗(yàn)中,本章算法運(yùn)用威布爾分布對圖像各像素局部鄰域數(shù)據(jù)進(jìn)行統(tǒng)計(jì)建模,借助艦船目標(biāo)與其背景電磁散射的統(tǒng)計(jì)差異性,在參數(shù)流形上進(jìn)行幾何結(jié)構(gòu)分析,將SAR圖像各像素鄰域數(shù)據(jù)映射成切叢中的切向量長度,提高目標(biāo)與背景之間的比度,實(shí)現(xiàn)了SAR圖像艦船目標(biāo)檢測。實(shí)驗(yàn)結(jié)果表明,本章算法提供了一個將信息幾何理論應(yīng)用于SAR圖像檢測的好的切入點(diǎn)。2025/5/22實(shí)驗(yàn)結(jié)果及分析在實(shí)驗(yàn)中,本章算法運(yùn)用威布爾分布對圖像各像素局部鄰域數(shù)據(jù)進(jìn)行統(tǒng)計(jì)建模,借助艦船目標(biāo)與其背景電磁散射的統(tǒng)計(jì)差異性,在參數(shù)流形上進(jìn)行幾何結(jié)構(gòu)分析,將SAR圖像各像素鄰域數(shù)據(jù)映射成切叢中的切向量長度,提高目標(biāo)與背景之間的比度,實(shí)現(xiàn)了SAR圖像艦船目標(biāo)檢測。實(shí)驗(yàn)結(jié)果表明,本章算法提供了一個將信息幾何理論應(yīng)用于SAR圖像檢測的好的切入點(diǎn)。SAR圖像系統(tǒng)的相干成像特點(diǎn)及復(fù)雜的海面狀況,導(dǎo)致SAR圖像中的海雜波分布具有較強(qiáng)的時變性、非平穩(wěn)性、非高斯性等特征,嚴(yán)重影響了基于統(tǒng)計(jì)模型的傳統(tǒng)SAR圖像目標(biāo)檢測算法的性能。2025/5/22實(shí)驗(yàn)結(jié)果及分析圖4.1所示SAR圖像的三維網(wǎng)格圖如圖4.5和圖4.6所示,SAR圖像中存在大量與目標(biāo)比較相似的雜波尖峰,使得海雜波呈現(xiàn)出非高斯特性,具有拖尾分布特征。圖4.7和圖4.8分別給出了圖4.1(a)和圖4.1(b)所示SAR圖像數(shù)據(jù)的概率密度分布圖,以及對其進(jìn)行威布爾參數(shù)估計(jì)的概率分布曲線。由圖4.7和圖4.8可知,由威布爾參數(shù)估計(jì)所得到的概率分布曲線在一定程度上能夠擬合原SAR圖像數(shù)據(jù)的概率密度分布圖。2025/5/22實(shí)驗(yàn)結(jié)果及分析2025/5/22實(shí)驗(yàn)結(jié)果及分析

2025/5/22小結(jié)本章針對SAR圖像目標(biāo)檢測中海雜波數(shù)據(jù)的非均勻性、非平穩(wěn)性特點(diǎn),分析了信息幾何理論應(yīng)用于SAR圖像目標(biāo)檢測領(lǐng)域的切入點(diǎn),以及基于統(tǒng)計(jì)流形幾何結(jié)構(gòu)特征融合的圖像感興趣目標(biāo)顯著性表示方法。本章首先對高斯分布族的費(fèi)希爾信息度量引入了尺度調(diào)置參數(shù),以優(yōu)化統(tǒng)計(jì)流形上各點(diǎn)之間的距離測度,并運(yùn)用威布爾分布族對SAR圖像海雜波進(jìn)行了建模。結(jié)合高斯統(tǒng)計(jì)流形上的費(fèi)希爾信息度量形式,在威布爾統(tǒng)計(jì)流形上構(gòu)建黎曼度量,以歸一化的尺度參數(shù)和形狀參數(shù)構(gòu)造切向量,實(shí)現(xiàn)對SAR圖像目標(biāo)的顯著性表示。理論分析和實(shí)驗(yàn)結(jié)果表明,信息幾何檢測算法有潛力成為超越現(xiàn)有基于傳統(tǒng)統(tǒng)計(jì)學(xué)原理的檢測算法,獲得更加深刻、更加本質(zhì)的結(jié)論。2025/5/222025/5/2221SAR圖像目標(biāo)檢測的芬斯勒

幾何方法基于芬斯勒幾何理論的SAR圖像目標(biāo)檢測2025/5/2222芬斯勒流形結(jié)構(gòu)芬斯勒幾何是在其度量張量上沒有二次型限制的黎曼幾何,如果將芬斯勒幾何表述為某個集合,則黎曼幾何僅能表述這個幾何空間中由臨界面所連接的一些子集。5.1.1芬斯勒度量2025/5/2223芬斯勒流形結(jié)構(gòu)2025/5/2224芬斯勒流形結(jié)構(gòu)2025/5/2225芬斯勒流形結(jié)構(gòu)依據(jù)SAR相干成像的物理散射機(jī)理,SAR相干斑噪聲可被視作乘性噪聲模型,或可被視作雷達(dá)橫截面(RadarCross-Section,RCS)與單位均值指數(shù)強(qiáng)度分布噪聲的乘積?;谝陨霞僭O(shè),將對數(shù)引入到隨機(jī)變量函數(shù)構(gòu)造中,實(shí)現(xiàn)乘性模型到加性模型的轉(zhuǎn)化,降低問題復(fù)雜度。5.1.2LogGamma流形2025/5/2226芬斯勒流形結(jié)構(gòu)

2025/5/2227SAR圖像目標(biāo)檢測算法

2025/5/2228SAR圖像目標(biāo)檢測算法2025/5/2229SAR圖像目標(biāo)檢測算法算法步驟2025/5/2230實(shí)驗(yàn)結(jié)果及分析采用LogGamma分布族對海雜波數(shù)據(jù)進(jìn)行局部統(tǒng)計(jì)建模,通過參數(shù)流形空間,將感興趣目標(biāo)區(qū)域與背景海雜波區(qū)域分開。5.3.1實(shí)驗(yàn)結(jié)果兩個圖像中各有一個艦船目標(biāo),圖像像素大小為150像素×150像素2025/5/2231實(shí)驗(yàn)結(jié)果及分析為了降低計(jì)算復(fù)雜度,提高檢測效率,本章運(yùn)用超像素法替換像素子塊滑動方式。不失一般性,本章采用簡單線性迭代聚類(SimpleLinearIterativeCluster,SLIC)算法。SLIC算法的尺度參數(shù)取為9,迭代次數(shù)取為10。2025/5/2232實(shí)驗(yàn)結(jié)果及分析2025/5/2233實(shí)驗(yàn)結(jié)果及分析運(yùn)用最大類間方差法分別得到最終的檢測結(jié)果,SAR圖像目標(biāo)檢測結(jié)果如下圖所示。2025/5/2234實(shí)驗(yàn)結(jié)果及分析

5.3.2實(shí)驗(yàn)分析2025/5/2235實(shí)驗(yàn)結(jié)果及分析由于SAR圖像海雜波數(shù)據(jù)是非高斯的,不失一般性,假定海雜波數(shù)據(jù)符合威布爾分布,運(yùn)用基于威布爾分布的CFAR檢測算法分別獲得下圖所示的檢測結(jié)果。2025/5/2236小結(jié)本章針對SAR圖像目標(biāo)檢測問題,依據(jù)由芬斯勒幾何理論發(fā)展起來的信息幾何分析方法,探索統(tǒng)計(jì)流形中數(shù)據(jù)信息的描述方式。本章首先給出了芬斯勒空間的度量張量,在此范疇下,可將黎曼空間視為芬斯勒空間的一個特例,事實(shí)上,歐氏空間也可以被看作黎曼空間的一個特例,也就是說,本章旨在將SAR圖像目標(biāo)檢測問題放入更為寬泛的空間中進(jìn)行分析。其次,在此框架下,選取Gamma分布族作為問題分析的切入點(diǎn),在考慮SAR圖像乘性噪聲假設(shè)的前提下,引入LogGamma分布族。事實(shí)上,在特定的芬斯勒幾何結(jié)構(gòu)下,無論是Gamma分布族,還是LogGamma分布族,都未必是最優(yōu)的SAR圖像數(shù)據(jù)統(tǒng)計(jì)表述方式。因此,需要依據(jù)特定的統(tǒng)計(jì)流形空間來構(gòu)造特定的芬斯勒幾何結(jié)構(gòu),而這些工作的起點(diǎn)便是芬斯勒度量張量的構(gòu)造。理論分析和實(shí)驗(yàn)結(jié)果表明,芬斯勒幾何分析方法有潛力從更為深刻、更為本質(zhì)的層面去解釋檢測和估計(jì)問題的本質(zhì)。2025/5/2237信息幾何理論2025/5/2238微分幾何理論基礎(chǔ)微分幾何的主要研究范疇是流形上不同的微分幾何結(jié)構(gòu)以及相應(yīng)的變換規(guī)律。其中,黎曼幾何扮演著關(guān)鍵的角色,為流形提供了度量方法和基本的幾何概念,構(gòu)成了微分幾何的核心內(nèi)容。接下來主要針對流形、聯(lián)絡(luò)等幾何概念進(jìn)行闡述。2025/5/2239微分幾何理論基礎(chǔ)

1.1.1微分流形同胚映射:2025/5/2240微分幾何理論基礎(chǔ)

2025/5/2241微分幾何理論基礎(chǔ)定義:切空間是定義在每一點(diǎn)的向量空間,其中包含了該點(diǎn)上所有可能的切向量。在黎曼流形上,切空間則描述了該點(diǎn)處的局部線性結(jié)構(gòu)。同時,在黎曼流形上每一個切空間都配備有一個度量,即內(nèi)積,它用來定義切向量的長度和夾角。定義:余切空間是切空間的對偶空間,余切空間中的元素可以看作是一組線性函數(shù),它們作用于切向量時返回一個實(shí)數(shù),余切空間中的元素由切空間中的所有切向量所對應(yīng)的余切向量構(gòu)成。1.1.2切空間與余切空間2025/5/2242微分幾何理論基礎(chǔ)

加運(yùn)算:數(shù)乘運(yùn)算:

2025/5/2243微分幾何理論基礎(chǔ)

加運(yùn)算:數(shù)乘運(yùn)算:

2025/5/2244微分幾何理論基礎(chǔ)

2025/5/2245微分幾何理論基礎(chǔ)

1.1.3聯(lián)絡(luò)對每個和。2025/5/2246微分幾何理論基礎(chǔ)

2025/5/2247微分幾何理論基礎(chǔ)在這里設(shè)置:2025/5/2248微分幾何理論基礎(chǔ)

2025/5/2249微分幾何理論基礎(chǔ)特別是:也可以重寫為:

2025/5/2250微分幾何理論基礎(chǔ)

1.1.4黎曼流形

2025/5/2251微分幾何理論基礎(chǔ)

黎曼等距是一個局部等距,它也是一個微分同態(tài)。2025/5/2252微分幾何理論基礎(chǔ)

因此,保留向量長度的微分同胚必然是黎曼等距。2025/5/2253微分幾何理論基礎(chǔ)

2025/5/2254微分幾何理論基礎(chǔ)我們在M流形上構(gòu)造一個度量d:如果x和y都是流形M上的點(diǎn),那么:這確實(shí)給出了M上的度量。由該度量導(dǎo)出的拓?fù)渑cM上的原始拓?fù)湟恢隆?025/5/2255微分幾何理論基礎(chǔ)1.1.5測地線測地線:即為該流形上連接兩點(diǎn)局部最短的、連續(xù)參數(shù)化的平滑曲線。

2025/5/2256微分幾何理論基礎(chǔ)

如下式所示:

2025/5/2257微分幾何理論基礎(chǔ)

有且僅當(dāng):對所有k,才滿足式2025/5/2258微分幾何理論基礎(chǔ)這種普通的非線性二階微分方程(有時稱為“測地線方程”)提供了利用整個微分方程理論的強(qiáng)大工具來研究測地線的進(jìn)一步性質(zhì),特別是它們的存在性和唯一性,通過進(jìn)入切叢TM,可以方便地將二階方程變換為兩個一階方程組。此外,通過計(jì)算Christoffel符號并求解這些方程,至少可以在局部坐標(biāo)中計(jì)算測地線,但這通常與長計(jì)算相關(guān)。2025/5/2259信息幾何理論基礎(chǔ)指數(shù)分布族(ExponentialFamily):也稱為指數(shù)族、指數(shù)族分布,是統(tǒng)計(jì)中最重要的參數(shù)分布族。指數(shù)型分布族(exponentialfamily)的概率密度函數(shù)如下:1.2.1指數(shù)分布族

2025/5/2260信息幾何理論基礎(chǔ)

2025/5/2261信息幾何理論基礎(chǔ)

1.2.2Fisher信息理論

2025/5/2262信息幾何理論基礎(chǔ)Fisher信息定義為分?jǐn)?shù)的方差:

2025/5/2263信息幾何理論基礎(chǔ)

因此,F(xiàn)isher信息可以被視為支持曲線的曲率(對數(shù)似然圖),并且,在最大似然估計(jì)附近,較低的Fisher信息表明最大值顯得“鈍”,即最大值很淺,并且存在許多具有類似對數(shù)似然的附近值。相反,高Fisher信息表明最大值很尖銳。2025/5/2264信息幾何理論基礎(chǔ)

Fisher信息矩陣是一個N×N正半定矩陣。如果它是正定的,那么它定義了N維參數(shù)空間上的黎曼度量。信息幾何使用它來將Fisher信息矩陣連接到微分幾何,在這種情況下,該度量稱為

Fisher信息度量。2025/5/2265信息幾何理論基礎(chǔ)在一定的規(guī)律性條件下,F(xiàn)isher信息矩陣也可以寫為:如果Fisher信息矩陣是塊對角矩陣,并且這些分量位于單獨(dú)的塊中,我們稱兩個參數(shù)分量向量θ1和θ2是信息正交的。2025/5/2266信息幾何理論基礎(chǔ)在數(shù)學(xué)中,統(tǒng)計(jì)流形是黎曼流形,其每個點(diǎn)都是概率分布。統(tǒng)計(jì)流形為信息幾何領(lǐng)域提供了一個背景。Fisher信息度量提供了這些流形的度量。1.2.3統(tǒng)計(jì)流形

2025/5/2267信息幾何理論基礎(chǔ)

2025/5/2268信息幾何理論基礎(chǔ)自然梯度:是典型梯度的概括,它解釋了當(dāng)前函數(shù)的曲率。1.2.4自然梯度算法

優(yōu)化問題中,自然梯度算法能大大提高收斂速度。

2025/5/2269信息幾何理論基礎(chǔ)

自然梯度算法的優(yōu)勢:自然梯度算法具備考慮參數(shù)空間中概率分布幾何結(jié)構(gòu)的能力,以適當(dāng)?shù)目s放梯度方向方式更加準(zhǔn)確地體現(xiàn)參數(shù)的更新方向,從而提高了優(yōu)化的效果。對于概率模型訓(xùn)練來說,該算法能通過適當(dāng)?shù)膮?shù)縮放,防止在參數(shù)空間中某些方向過度更新,特別是當(dāng)存在高度相關(guān)的參數(shù)時,更能保證模型收斂的平穩(wěn)性。2025/5/2270Finsler幾何度量:在通常意義下,度量是用來測量空間中兩點(diǎn)之間的“距離”,因此從一點(diǎn)到另一點(diǎn)的距離函數(shù)稱為度量。1.3.1Finsler度量這里所考慮的空間是一個有限維光滑流形,所考慮的度量是可以用來計(jì)算曲線長度的一個函數(shù)。更確切地說,它是流形上點(diǎn)和切向量的函數(shù)。2025/5/2271Finsler幾何

2025/5/2272Finsler幾何構(gòu)成正定的矩陣,則稱F為M上的一個芬斯勒度量(Finslermetric)。

2025/5/2273Finsler幾何Randers度量

2025/5/2274Finsler幾何

1.3.2Finsler聯(lián)絡(luò)

2025/5/2275Finsler幾何根據(jù)以下屬性:

2025/5/2276Finsler幾何

2025/5/2277Finsler幾何仿射系數(shù)不是張量場的組成部分,可以證明,在坐標(biāo)變化下,它們服從變換定律:

2025/5/2278Finsler幾何介紹其中一種芬斯勒聯(lián)絡(luò)陳聯(lián)絡(luò):

2025/5/2279Finsler幾何

2025/5/2280Finsler幾何

1.3.3Finsler測地線

2025/5/2281Finsler幾何

2025/5/2282Finsler幾何

2025/5/2283Finsler幾何Finsler流形中的Ricci曲率是一個二階張量,描述了Finsler流形切叢上切矢量場的曲率。Ricci曲率的計(jì)算涉及到Finlser度量的二次導(dǎo)數(shù)和聯(lián)絡(luò)系數(shù)(Christoffel符號)。1.3.4Ricci曲率

2025/5/2284Finsler幾何里奇曲率張量,其中:里奇曲率張量也可以表示為,其中:2025/5/2285Finsler幾何

其中。里奇曲率張量可以通過其垂直的Hessian矩陣來恢復(fù):2025/5/2286Finsler幾何

2025/5/2287Finsler幾何將里奇曲率張量的概念推廣到芬斯勒度量上可以表示為:

2025/5/2288Finsler幾何

2025/5/2289小結(jié)本章旨在介紹微分幾何、信息幾何及Finsler幾何三個理論,以為后續(xù)目標(biāo)檢測算法的實(shí)踐操作提供深入思考。首先介紹提出優(yōu)化算法所需要的微分幾何理論和信息幾何理論如流形,聯(lián)絡(luò),指數(shù)分布族等概念,最后,第三節(jié)全面闡述Finsler幾何的相關(guān)理論,其中涉及Finsler度量、Finsler聯(lián)絡(luò)、Finsler測地線以及Ricci曲率等學(xué)術(shù)要點(diǎn),覆蓋了該領(lǐng)域的基礎(chǔ)知識,并為后續(xù)研究提供了堅(jiān)實(shí)的理論基礎(chǔ)。2025/5/2290SAR圖像目標(biāo)檢測的YOLO方法基于YOLOv4的SAR圖像艦船檢測2025/5/2291卷積神經(jīng)網(wǎng)絡(luò)基本理論神經(jīng)元是構(gòu)建神經(jīng)網(wǎng)絡(luò)的基本單元,其主要由三部分組成:連接、求和節(jié)點(diǎn)及激活函數(shù)。6.1.1人工神經(jīng)網(wǎng)絡(luò)(1)連接:神經(jīng)元中數(shù)據(jù)的流動方向。(2)求和節(jié)點(diǎn):對各通道的輸入信號和權(quán)重的乘積結(jié)果進(jìn)行累加求和。(3)激活函數(shù):一般都是非線性函數(shù),對求和節(jié)點(diǎn)輸出的信號進(jìn)行非線性映射。2025/5/2292卷積神經(jīng)網(wǎng)絡(luò)基本理論2025/5/2293卷積神經(jīng)網(wǎng)絡(luò)基本理論人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)由多個神經(jīng)元結(jié)構(gòu)組合而成,一般分為輸入層、隱藏層及輸出層。每一層都包含多個神經(jīng)元,而且每一個神經(jīng)元都擁有輸入和輸出,第l層網(wǎng)絡(luò)神經(jīng)元的輸出是下一層即第l+1層神經(jīng)元的輸入。2025/5/2294卷積神經(jīng)網(wǎng)絡(luò)基本理論

2025/5/2295卷積神經(jīng)網(wǎng)絡(luò)基本理論對這簡單的三層神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行向量化,輸入向量為X,權(quán)重向量為W,及偏置向量為b那么有:2025/5/2296卷積神經(jīng)網(wǎng)絡(luò)基本理論由此可見,單層神經(jīng)網(wǎng)絡(luò)的前向傳播算法可以使用如下矩陣形式:

2025/5/2297卷積神經(jīng)網(wǎng)絡(luò)基本理論卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的卷積層,其內(nèi)部的卷積操作本質(zhì)上就是對數(shù)字圖像信號進(jìn)行濾波處理,故而卷積核(ConvolutionKernel,CK)也被稱為濾波器。6.1.2卷積神經(jīng)網(wǎng)絡(luò)

2025/5/2298卷積神經(jīng)網(wǎng)絡(luò)基本理論根據(jù)不同的卷積操作,輸出的特征圖尺寸也各不相同,主要分為三種情況。2025/5/2299卷積神經(jīng)網(wǎng)絡(luò)基本理論從圖6.3所示的卷積計(jì)算可知,多層卷積計(jì)算過程本質(zhì)上就是神經(jīng)元的基本求和過程:2025/5/22100卷積神經(jīng)網(wǎng)絡(luò)基本理論為了提高神經(jīng)網(wǎng)絡(luò)的表達(dá)能力,激活函數(shù)一般都是單調(diào)遞增的非線性函數(shù),將輸入數(shù)據(jù)重新映射為一個個非線性值,從而控制輸出數(shù)值的大小。

常用的激活函數(shù)有sigmoid函數(shù)、tanh函數(shù)、softmax函數(shù)、ReLU函數(shù)、LeakyReLU函數(shù)。6.1.3激活函數(shù)及其導(dǎo)數(shù)2025/5/22101卷積神經(jīng)網(wǎng)絡(luò)基本理論sigmod函數(shù)sigmoid函數(shù)表達(dá)式如下:sigmoid函數(shù)易趨于飽和導(dǎo)致訓(xùn)練結(jié)果不理想。此外,函數(shù)輸出的非線性值并不是零均值,數(shù)據(jù)存在偏差,導(dǎo)致分布不均勻。2025/5/22102卷積神經(jīng)網(wǎng)絡(luò)基本理論tanh函數(shù)tanh函數(shù)又名為雙曲正切函數(shù):

tanh函數(shù)可以更容易地處理負(fù)數(shù)。同時,tanh函數(shù)的輸出值以0為中心,故數(shù)據(jù)分布均勻,且零均值。2025/5/22103卷積神經(jīng)網(wǎng)絡(luò)基本理論softmax函數(shù)softmax函數(shù)的公式如下:

softmax函數(shù)多用于多分類問題,首先使用指數(shù)函數(shù)將預(yù)測結(jié)果映射到零到正無窮區(qū)間,保證了概率的非負(fù)性;再將所有映射后的結(jié)果累加,并進(jìn)行歸一化,即可得到每個類別的概率。2025/5/22104卷積神經(jīng)網(wǎng)絡(luò)基本理論ReLU函數(shù)ReLU函數(shù)又名為修正線性單元(RectifiedLinearUnit):ReLU函數(shù)的梯度為0或常數(shù),相較于sigmoid函數(shù)、tanh函數(shù),ReLU函數(shù)不僅收斂速度快,還可以有效緩解梯度消失問題。2025/5/22105卷積神經(jīng)網(wǎng)絡(luò)基本理論LeakyReLU函數(shù)LeakyReLU函數(shù)的公式如下:當(dāng)輸入值小于零時,輸出值不再是零值,而有一個很小的遞增坡度。由于LeakyReLU函數(shù)的導(dǎo)數(shù)無零值,故有效解決了ReLU函數(shù)下權(quán)重?zé)o法更新的狀況。2025/5/22106卷積神經(jīng)網(wǎng)絡(luò)基本理論池化層亦被稱為降采樣層,在多個組合卷積操作之后,往往通過池化操作來降低輸出特征向量的維度,在壓縮數(shù)據(jù)和參數(shù)數(shù)量的同時,也保持了模型對目標(biāo)的平移、旋轉(zhuǎn)、伸縮等特性的不變性,從而增強(qiáng)了所提取特征的魯棒性。池化操作主要有最大池化(MaxPooling)和平均池化(AveragePooling)兩種。6.1.4池化操作2025/5/22107卷積神經(jīng)網(wǎng)絡(luò)基本理論最大池化最大池化如下圖所示,假設(shè)池化層的輸入是4×4的特征圖,使用2×2池化核,并以步長為2對上述特征向量進(jìn)行池化,相當(dāng)于將特征圖劃分為4個2×2的區(qū)域,在每個區(qū)域內(nèi)選取最大值,最后組合成尺寸更小的特征圖。2025/5/22108卷積神經(jīng)網(wǎng)絡(luò)基本理論平均池化平均池化如下圖所示,同理將每個2×2區(qū)域內(nèi)的數(shù)值累加并取均值。2025/5/22109卷積神經(jīng)網(wǎng)絡(luò)基本理論

6.1.3前向傳播與反向傳播2025/5/22110卷積神經(jīng)網(wǎng)絡(luò)基本理論假設(shè)激活函數(shù)為sigmoid函數(shù),即則有2025/5/22111卷積神經(jīng)網(wǎng)絡(luò)基本理論定義損失函數(shù):綜上,可得

至此,完成了一次前向傳播過程。2025/5/22112卷積神經(jīng)網(wǎng)絡(luò)基本理論

2025/5/22113卷積神經(jīng)網(wǎng)絡(luò)基本理論根據(jù)鏈?zhǔn)酵茖?dǎo)法則,繼續(xù)向后傳播,更新其他節(jié)點(diǎn)上的權(quán)值。根據(jù)上面求得偏導(dǎo),進(jìn)而更新權(quán)重:2025/5/22114YOLO4模型YOLO4的主干網(wǎng)絡(luò)為CSPDarknet53網(wǎng)絡(luò),即CSPNet與Darknet53網(wǎng)絡(luò)的結(jié)合。Darknet53網(wǎng)絡(luò)一共有5個特征層,均為殘差網(wǎng)絡(luò),每個殘差網(wǎng)絡(luò)都包含不同數(shù)量的殘差塊,從低層到高層分別包含1、2、8、8、4個殘差塊。CSPDarknet53殘差塊的結(jié)構(gòu)與Darknet53殘差塊的結(jié)構(gòu)類似,只不過在堆疊過后還要進(jìn)行一個1×1的卷積,而另一部分直接和主干部分的輸出拼接。6.2.1YOLO4模型的主干網(wǎng)絡(luò)2025/5/22115YOLO4模型為了解決多尺度的問題,特征金字塔(FPN)開創(chuàng)性地引入一種自上而下路徑的特征融合,即上采樣融合拼接,此方法可以在多個尺度上進(jìn)行特征融合并分別進(jìn)行目標(biāo)檢測,可以顯著提升小目標(biāo)檢測的精確度。

PANet在FPN的架構(gòu)基礎(chǔ)上設(shè)計(jì)了一條自底向上的連接路徑。PANet通過自上而下的路徑將高層的語義特征向下傳遞,增強(qiáng)了語義信息的提取能力;同時通過自下而上的路徑將低層的定位信息傳遞上去,彌補(bǔ)了FPN的不足。YOLO4模型采用了在性能和實(shí)用性方面都具有較好表現(xiàn)的PANet作為檢測頸6.2.1YOLO4模型的檢測頸2025/5/22116YOLO4模型YOLO4模型的檢測頸除了使用了PANet結(jié)構(gòu),還添加了改進(jìn)型的空間金字塔池化(SpatialPyramidPooling,SPP)模塊。

SPP模塊是三個不同尺寸的最大池化層的堆疊,并分別進(jìn)行平鋪(Flatten)操作來降維,得到1×C、4×C和16×C(C代表通道數(shù))這三個特征,然后將這三個特征拼接得到維度為(1+4+16)×C的特征。2025/5/22117YOLO4模型

為了能夠充分融合特征,YOLO4模型中的檢測頸還添加了多個五層卷積的卷積層,每個卷積層都包含一個BN層和一個LeakyReLU激活函數(shù)。2025/5/22118YOLO4模型

YOLO4模型的檢測頭由3×3的卷積層和1×1的卷積層組合而成。輸出通道數(shù)為3×(K+4+1),其中K是目標(biāo)類別數(shù)目,本章只進(jìn)行艦船檢測,目標(biāo)為一類,因此K=1,則預(yù)測通道數(shù)為3×(1+4+1)=18。

在本章中,第1個通道是對艦船類的預(yù)測,中間4個通道是對邊界框位置的預(yù)測,最后一個通道是目標(biāo)的置信度,用來區(qū)分前景背景。6.2.1YOLO4模型的檢測頭2025/5/22119YOLO4模型MosaicYOLO4模型中運(yùn)用了Mosaic數(shù)據(jù)增強(qiáng)方法。Mosaic方法是通過融合四張圖像來實(shí)現(xiàn)。優(yōu)點(diǎn):一方面,它極大地豐富了檢測目標(biāo)的背景,可以為模型提供更多的背景特征信息;另一方面,在進(jìn)行批歸一化時會計(jì)算所傳入的四張圖像的數(shù)據(jù),BatchSize(批次大小)不需要設(shè)置得很高,降低了對硬件的需求,使得YOLO4模型在單GPU上即可運(yùn)行。6.2.1YOLO4模型的訓(xùn)練2025/5/22120YOLO4模型Mosaic數(shù)據(jù)增強(qiáng)方法的步驟如下:(1)隨機(jī)選取四張SAR圖像作為輸入。(2)分別對這四張圖像進(jìn)行幾何變換、色域變換(調(diào)整明亮度、飽和度、色調(diào))等操作。(3)將處理過的四張圖像放置在左上、左下、右下、右上四個位置。(4)截取四張圖像部分區(qū)域并將它們拼接成一張圖像。2025/5/22121YOLO4模型在Mosaic幾何變換中,需要特別注意裁剪操作。對于四張待操作圖像,首先,隨機(jī)生成其中一張圖像的裁剪坐標(biāo),并根據(jù)坐標(biāo)計(jì)算出待裁剪部分的長和寬。其次,基于裁剪坐標(biāo)繪制出裁剪矩形并獲取它與原圖的交集。再次,將圖像的尺寸調(diào)整為YOLO4模型所需的大小。最后,根據(jù)裁剪坐標(biāo)和待裁剪的尺寸,取固定部分填充到新圖像的左上部分,并將其他三張圖像的裁剪部分分別填充到新圖像的左下、右下、右上部分。2025/5/22122YOLO4模型標(biāo)簽平滑為了解決錯誤標(biāo)簽帶來的問題,可以使用標(biāo)簽平滑技術(shù),它能夠有效減輕錯誤標(biāo)簽對模型訓(xùn)練的影響,并且有助于防止過擬合、提高目標(biāo)檢測的精度。

2025/5/22123YOLO4模型

上式等價于:

2025/5/22124YOLO4模型學(xué)習(xí)率余弦退火衰減當(dāng)目標(biāo)函數(shù)達(dá)到局部最優(yōu)解時,如果繼續(xù)使用梯度訓(xùn)練算法降低學(xué)習(xí)率就會陷入僵局,只能獲得局部最小值。此時,可以提高學(xué)習(xí)率來跳出局部最優(yōu)的循環(huán)。

2025/5/22125YOLO4模型CIoU目標(biāo)檢測中,通常使用交并比(IntersectionoverUnion,IoU)來篩選預(yù)測框,并計(jì)算預(yù)測框與真實(shí)框之間的損失值。IoU由預(yù)測框與真實(shí)框的交集面積除以并集面積得到,它具有尺度不變的優(yōu)點(diǎn),但忽略了預(yù)測框間的距離,無法精準(zhǔn)反映框間的重合度大小。完備交并比(CompleteIntersectionoverUnion,CIoU)考慮了預(yù)測框錨點(diǎn)與目標(biāo)間的距離、重合率、尺度,并添加懲罰因子用于估計(jì)預(yù)測框長寬比與真實(shí)框長寬比,避免了模型訓(xùn)練過程中的發(fā)散問題2025/5/22126YOLO4模型CIoU計(jì)算方式:

2025/5/22127YOLO4模型NMS在YOLO模型預(yù)測目標(biāo)檢測的結(jié)果時,面臨著對同一個目標(biāo)可能會生成多個預(yù)測框的問題,這時就需要使用非極大抑制(Non-MaximumSuppression,NMS)。

2025/5/22128實(shí)驗(yàn)結(jié)果及分析CAESAR-Radi數(shù)據(jù)集是中國科學(xué)院王超團(tuán)隊(duì)開放的SAR圖像艦船數(shù)據(jù)集,包含了Sentinel-1及GF-3兩種遙感衛(wèi)星的圖像數(shù)據(jù),且為了降低硬件需求以便于模型訓(xùn)練,將高分辨率的圖像分割成了4300張256像素×256像素的低分辨率SAR圖像切片。6.3.1CAESAR-Radi數(shù)據(jù)集2025/5/22129實(shí)驗(yàn)結(jié)果及分析采用精確率(Precision)、召回率(Recall)及平均精確率(AveragePrecision,AP)這三個指標(biāo)來評價網(wǎng)絡(luò)模型的檢測精度。模型檢測的預(yù)測標(biāo)簽可以分為正負(fù)兩類:6.3.2評價指標(biāo)TP(TruePositive)表示真實(shí)標(biāo)簽與預(yù)測標(biāo)簽均為正;FP(FalsePositive)表示真實(shí)標(biāo)簽為負(fù)但預(yù)測標(biāo)簽為正;TN(TrueNegative)表示真實(shí)標(biāo)簽為正但預(yù)測標(biāo)簽為負(fù);FN(Fal

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論