版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
物流人工智能技術(shù)技能培訓(xùn)項(xiàng)目二圖像信息處理任務(wù)三圖像分析目錄CONTENTS數(shù)字圖像分析PART1梯度方向直方圖PART2視頻分析PART3卷積神經(jīng)網(wǎng)絡(luò)CNNPART4【教學(xué)目標(biāo)】過(guò)程與方法:知識(shí)與技能:1.掌握是數(shù)字圖像分析步驟2.了解梯度方向直方圖的計(jì)算原理3.了解視頻分析的方法4.了解卷積神經(jīng)網(wǎng)絡(luò)的原理在學(xué)習(xí)動(dòng)畫(huà)視頻的過(guò)程中,理解其基本工作原理,了解其實(shí)際應(yīng)用價(jià)值。情感、態(tài)度與價(jià)值觀:1.提升對(duì)人工智能的認(rèn)識(shí),發(fā)展辯證思維,客觀認(rèn)識(shí)人工智能技術(shù)對(duì)社會(huì)的影響,培養(yǎng)正確的科學(xué)技術(shù)應(yīng)用觀。2.堅(jiān)定擁護(hù)中國(guó)共產(chǎn)黨領(lǐng)導(dǎo)和我國(guó)社會(huì)主義制度。一、數(shù)字圖像分析簡(jiǎn)介傳感器輸入數(shù)字圖像分析是圖像處理的高級(jí)階段,它所研究的是使用機(jī)器分析和識(shí)別周?chē)矬w的視覺(jué)圖像,從而可得出結(jié)論性的判斷。圖像分析基本上有四個(gè)過(guò)程。分割識(shí)別解釋二、梯度方向直方圖圖像的梯度相鄰像素之間的差值稱(chēng)為圖像梯度。最簡(jiǎn)單的計(jì)算梯度的方法使用一階微分實(shí)現(xiàn)。一幅圖像可以用函數(shù)
來(lái)表示,則
在坐標(biāo)
處的梯度:計(jì)算方向:方向角:幅值:差分,近似后:在水平梯度圖中,豎向的邊緣會(huì)顯示的比較清楚;在垂直梯度圖中,水平方向的邊緣會(huì)顯示的比較清楚。水平梯度圖垂直梯度圖原圖水平梯度和垂直梯度二、梯度方向直方圖二、梯度方向直方圖三、視頻分析1.視頻的概念人眼在觀察景物時(shí),光信號(hào)傳入大腦神經(jīng),需經(jīng)過(guò)一段短暫的時(shí)間,光的作用結(jié)束后,視覺(jué)形象并不立即消失,這種殘留的視覺(jué)稱(chēng)“后像”,視覺(jué)的這一現(xiàn)象則被稱(chēng)為“視覺(jué)暫留”。對(duì)于中等亮度的光刺激,視覺(jué)暫留時(shí)間約為0.1至0.4秒。用攝像機(jī)錄制的動(dòng)態(tài)畫(huà)面,我們稱(chēng)之為視頻。視頻實(shí)際上離散的,它是由一張張的圖片排列而成的圖像序列,當(dāng)我們對(duì)這個(gè)圖像序列按每秒鐘24幀快速播放的時(shí)候,由于人眼的視覺(jué)暫留機(jī)制,原本靜止的畫(huà)面就會(huì)運(yùn)動(dòng)起來(lái)。在視頻中,每一張圖像我們稱(chēng)之為幀,圖像序列也稱(chēng)為幀序列。視覺(jué)暫留視頻2.運(yùn)動(dòng)檢測(cè)最常見(jiàn)的運(yùn)動(dòng)檢測(cè)方法,核心實(shí)現(xiàn)算法是圖像的減法。用于靜止攝像機(jī)及恒定光照的環(huán)境下,通過(guò)在時(shí)間軸上不同位置的圖像幀相減,就可以檢測(cè)出運(yùn)動(dòng),得到的結(jié)果圖像被稱(chēng)為差值圖像。差分運(yùn)動(dòng)檢測(cè)光流運(yùn)動(dòng)檢測(cè)可以檢測(cè)出圖像中運(yùn)動(dòng)的方向和大小。光流是空間運(yùn)動(dòng)物體在觀察成像平面上的像素運(yùn)動(dòng)的瞬時(shí)速度。光流的計(jì)算基于以下兩個(gè)假設(shè):a.亮度恒定約束:同一物體點(diǎn)的亮度信息不會(huì)隨著時(shí)間的變化而改變。b.速度平滑約束:在圖像平面內(nèi),相鄰的點(diǎn)速度接近。光流運(yùn)動(dòng)檢測(cè)提前構(gòu)建一個(gè)背景模型,即背景幀,所有的檢測(cè)幀都和這個(gè)背景幀進(jìn)行差分運(yùn)算,則這種方法稱(chēng)為背景差分。常用的背景建模算法有codebook算法,混合高斯背景建模算法等。背景差分運(yùn)動(dòng)檢測(cè)AB三、視頻分析3.目標(biāo)跟蹤以搜索算法為主的卡爾曼(Kalman)濾波和粒子濾波以?xún)?yōu)化搜索方向?yàn)橹鞯木灯扑惴?Meanshift)和連續(xù)自適應(yīng)均值漂移(Camshift)算法。KLT特征點(diǎn)跟蹤算法、基于光流的跟蹤算法和基于深度學(xué)習(xí)的跟蹤算法等常用算法三、視頻分析圖像中確定好目標(biāo)后,在隨后的圖像序列中對(duì)指定目標(biāo)進(jìn)行定位的過(guò)程稱(chēng)為目標(biāo)跟蹤。目標(biāo)跟蹤實(shí)際上是通過(guò)對(duì)目標(biāo)圖像特征的提取、融合和匹配來(lái)實(shí)現(xiàn)的。目標(biāo)跟蹤卷積神經(jīng)網(wǎng)絡(luò)模型簡(jiǎn)稱(chēng)為CNN模型。CNN模型通常用于影像識(shí)別案例中,通過(guò)模型訓(xùn)練,計(jì)算機(jī)系統(tǒng)也能像大腦一樣識(shí)別出圖片、影像中的物體、符號(hào)等。四、卷積神經(jīng)網(wǎng)絡(luò)CNN可用于人臉識(shí)別,快速匹配身份信息,在醫(yī)療領(lǐng)域,通過(guò)對(duì)核磁共振,MRI影像進(jìn)行分析,對(duì)病情進(jìn)行診斷或預(yù)判。另外,在Tesla自動(dòng)駕駛Autopilot模型中。車(chē)載攝像頭可以獲取周邊360度影像,經(jīng)過(guò)CNN模型的訓(xùn)練,對(duì)道路上及周邊出現(xiàn)的各類(lèi)車(chē)輛物體標(biāo)識(shí)進(jìn)行識(shí)別。四、卷積神經(jīng)網(wǎng)絡(luò)CNN1.CNN的結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)(CNN)最早是由深度學(xué)習(xí)三大奠基人之一的勒丘恩在1998年提出來(lái)的,并在手寫(xiě)文字識(shí)別等方面得到廣泛應(yīng)用。卷積神經(jīng)網(wǎng)絡(luò)實(shí)際上就是一個(gè)多層感知機(jī),一個(gè)典型的卷積神經(jīng)網(wǎng)絡(luò)。其基本結(jié)構(gòu)如下圖所示:四、卷積神經(jīng)網(wǎng)絡(luò)CNN2.卷積層卷積卷積是一種向量和矩陣的數(shù)學(xué)運(yùn)算。因?yàn)閿?shù)字圖像使用矩陣來(lái)表示和存儲(chǔ),所以卷積是數(shù)字圖像處理的一種基本運(yùn)算方式,對(duì)圖像而言,做卷積實(shí)際上就是一種濾波操作。二維矩陣卷積中,通常大的矩陣是要處理的圖像,小的矩陣稱(chēng)為卷積核,也稱(chēng)為算子。小矩陣的尺寸稱(chēng)為卷積核尺寸(kernelsize),一般為奇數(shù)相乘,如3*3,5*5,7*7等,以保證有一個(gè)中心點(diǎn)。在遍歷圖像時(shí)每次卷積核移動(dòng)的像素個(gè)數(shù)稱(chēng)為步長(zhǎng)(Stride)。當(dāng)卷積核大于1的時(shí)候,卷積操作會(huì)減小目標(biāo)圖像的尺寸,可以通過(guò)填充(Padding)來(lái)填補(bǔ)結(jié)果圖像的邊緣,使其大小與一致。四、卷積神經(jīng)網(wǎng)絡(luò)CNN卷積層是深度學(xué)習(xí)經(jīng)常使用的一種層,如果一個(gè)深度神經(jīng)網(wǎng)絡(luò)主要由卷積層組成時(shí),我們稱(chēng)之為卷積神經(jīng)網(wǎng)絡(luò)。對(duì)于一幅圖像的多個(gè)通道以及圖像的不同位置區(qū)域使用不同的卷積核,可以獲得多個(gè)卷積結(jié)果,把這些結(jié)果再以不同的通道相組合,即稱(chēng)為特征圖,特征圖即為卷積層的最終輸出。卷積層可以作為神經(jīng)網(wǎng)絡(luò)的隱藏層,它即可以接受原始圖像也可以接受特征圖作為它的輸入,當(dāng)前卷積層產(chǎn)生的特征圖也可以作為下一層卷積層的輸入。在卷積神經(jīng)網(wǎng)絡(luò)卷積層中的卷積操作與數(shù)字圖像處理中的卷積操作過(guò)程是完全相同的,卷積核的尺寸,即參數(shù)數(shù)目也是由人為指定的,但是,卷積神經(jīng)網(wǎng)絡(luò)中的卷積核不是人為指定的,而是通過(guò)不斷地學(xué)習(xí)而獲得的。四、卷積神經(jīng)網(wǎng)絡(luò)CNN縮減圖像分辨率會(huì)解決卷積計(jì)算量過(guò)大的問(wèn)題,這也是前向池化的主要目的之一。池化可以實(shí)現(xiàn)不同尺度特征的提取。常見(jiàn)的池化方法包括平均池化和最大池化。3.池化層池化的效果就是放大或者縮小圖像分辨率。因此,池化分為前向池化(下采樣)和反向池化(上采樣)。池化四、卷積神經(jīng)網(wǎng)絡(luò)CNN平均池化假設(shè)我們池化的窗口為2*2,對(duì)于輸入圖像,展開(kāi)對(duì)2*2的窗口平移并取平均值采樣,即為平均池化的值。四、卷積神經(jīng)網(wǎng)絡(luò)CNN最大池化假設(shè)我們池化的窗口為2*2,對(duì)于輸入圖像,展開(kāi)對(duì)2*2的窗口平移并取最大值采樣,即為最大池化的值四、卷積神經(jīng)網(wǎng)絡(luò)CNN4.全連接層全連接層的每一個(gè)結(jié)點(diǎn)都與上一層的所有結(jié)點(diǎn)相連,用來(lái)把前邊提取到的特征綜合起來(lái)。全連接層可以整合卷積層或者池化層中具有類(lèi)別區(qū)分性的局部信息。為了提升CNN網(wǎng)絡(luò)性能,全連接層每個(gè)神經(jīng)元的激勵(lì)函數(shù)一般采用ReLU函數(shù)。最后一層全連接層的輸出值被傳遞給一個(gè)輸出,可采用softmax邏輯回歸進(jìn)行分類(lèi),也可稱(chēng)為softmax層。四、卷積神經(jīng)網(wǎng)絡(luò)CNN【課后小結(jié)】圖像分析
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025福建廈門(mén)市集美區(qū)寧寶幼兒園非在編廚房人員招聘1人備考題庫(kù)及答案詳解(奪冠系列)
- 2026四川成都市雙流區(qū)黃龍溪幼兒園招聘2人備考題庫(kù)及答案詳解(易錯(cuò)題)
- 2025下半年四川綿陽(yáng)市事業(yè)單位選調(diào)工作人員25人備考題庫(kù)及答案詳解1套
- 2025江西省中核南方新材料有限公司社會(huì)招聘2人備考題庫(kù)及答案詳解參考
- 2026河北保定雄安人才服務(wù)有限公司信息化管理崗招聘1人備考題庫(kù)及一套答案詳解
- 2026江蘇南京大學(xué)XZ2025-443現(xiàn)代工程與應(yīng)用科學(xué)學(xué)院科研人員招聘?jìng)淇碱}庫(kù)及答案詳解1套
- 2026吉林延邊州就業(yè)服務(wù)局招聘公益性崗位2人備考題庫(kù)完整參考答案詳解
- 2025下半年麗水遂昌縣部分機(jī)關(guān)事業(yè)單位編外招聘10人備考題庫(kù)及1套完整答案詳解
- 2025河北保定市博物館招聘講解員2名備考題庫(kù)及參考答案詳解1套
- 2026年湖南邵陽(yáng)邵陽(yáng)縣社會(huì)工作事務(wù)中心選調(diào)1人備考題庫(kù)帶答案詳解
- 吳江三小英語(yǔ)題目及答案
- 供水管道搶修知識(shí)培訓(xùn)課件
- 司法警察協(xié)助執(zhí)行課件
- 廣東物業(yè)管理辦法
- 業(yè)務(wù)規(guī)劃方案(3篇)
- 雙向晉升通道管理辦法
- 集團(tuán)債權(quán)訴訟管理辦法
- 上海物業(yè)消防改造方案
- 鋼結(jié)構(gòu)施工進(jìn)度計(jì)劃及措施
- 供應(yīng)商信息安全管理制度
- 智慧健康養(yǎng)老服務(wù)與管理專(zhuān)業(yè)教學(xué)標(biāo)準(zhǔn)(高等職業(yè)教育專(zhuān)科)2025修訂
評(píng)論
0/150
提交評(píng)論