計(jì)算機(jī)視覺開發(fā)課件 第一章 初識計(jì)算機(jī)視覺_第1頁
計(jì)算機(jī)視覺開發(fā)課件 第一章 初識計(jì)算機(jī)視覺_第2頁
計(jì)算機(jī)視覺開發(fā)課件 第一章 初識計(jì)算機(jī)視覺_第3頁
計(jì)算機(jī)視覺開發(fā)課件 第一章 初識計(jì)算機(jī)視覺_第4頁
計(jì)算機(jī)視覺開發(fā)課件 第一章 初識計(jì)算機(jī)視覺_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章初識計(jì)算機(jī)視覺計(jì)算機(jī)視覺開發(fā)01020304人類視覺系統(tǒng)計(jì)算機(jī)視覺計(jì)算機(jī)視覺常見任務(wù)計(jì)算機(jī)視覺發(fā)展過程目錄CONTENTS05計(jì)算機(jī)視覺行業(yè)應(yīng)用06基礎(chǔ)開發(fā)環(huán)境搭建人類視覺系統(tǒng)01第1章 初識計(jì)算機(jī)視覺人類視覺系統(tǒng)人腦視覺機(jī)理:是指視覺系統(tǒng)的信息處理在可視皮層是分級的,大腦的工作過程是一個不斷迭代、不斷抽象的過程。視網(wǎng)膜在得到原始信息后,首先經(jīng)由區(qū)域V1初步處理得到邊緣和方向特征信息,其次經(jīng)由區(qū)域V2的進(jìn)一步抽象得到輪廓和形狀特征信息,如此迭代地經(jīng)由更多更高層的抽象最后得到更為精細(xì)的分類。以人臉識別為例,識別過程如下:從原始信號攝入開始(瞳孔攝入像素Pixels);接著做初步處理(大腦皮層某些細(xì)胞發(fā)現(xiàn)邊緣和方向);然后抽象(大腦判定眼前的物體的部分信息,如眼睛、耳朵等);然后進(jìn)一步抽象(大腦進(jìn)一步判定該人臉是誰)。人類視覺系統(tǒng)對于不同物體,可視皮層的最底層(V1層)識別的特征基本上是類似的,

就是各種邊緣,越往上,越能提取出此類物體的一些特征(輪子、眼睛、軀干等),到最上層(V4層),不同的高級特征最終組合成相應(yīng)的圖像,從而能夠讓人類準(zhǔn)確的區(qū)分不同的物體。

計(jì)算機(jī)視覺02第1章 初識計(jì)算機(jī)視覺1.2.1計(jì)算機(jī)視覺的定義如何讓機(jī)器具有人一樣的視覺。1.2.1語義鴻溝輸入數(shù)據(jù)的底層特征和高層語義信息之間的不一致性和差異性人類可以輕松地從圖像中識別出目標(biāo),而計(jì)算機(jī)看到的圖像只是一組0到255之間的整數(shù)。1.2.2計(jì)算機(jī)視覺的定義給計(jì)算機(jī)安裝上眼睛(照相機(jī))和大腦(算法),讓計(jì)算機(jī)能夠感知環(huán)境1.2.3基于深度學(xué)習(xí)的計(jì)算機(jī)視覺工作原理通過構(gòu)造一種多層的結(jié)構(gòu),較低層的識別初級的圖像特征,若干底層特征組合成更上一層特征,最終通過多個層級的組合,在頂層做出分類計(jì)算機(jī)視覺常見任務(wù)03第1章 初識計(jì)算機(jī)視覺1.3.1圖像分類根據(jù)圖像的語義信息對不同類別圖像進(jìn)行區(qū)分,是將圖像結(jié)構(gòu)化為某一類別的信息,用事先確定好的類別來描述圖像。圖像分類是計(jì)算機(jī)視覺的核心,也是物體檢測、圖像分割、物體跟蹤、行為分析、人臉識別等其他高層次視覺任務(wù)的基礎(chǔ)。讓計(jì)算機(jī)理解這個圖像里有什么(瓶子、杯子等)1.3.1圖像分類圖像分類受光照、遮擋、背景干擾、姿勢形態(tài)等影響,同一物體在不同視角、不同光照條件、不同背景下可能會被錯誤分類1.3.2目標(biāo)檢測給定一張圖像或是一個視頻幀,讓計(jì)算機(jī)找出其中所有目標(biāo)的位置,并識別每個目標(biāo)的具體類別。目標(biāo)檢測通常是從圖像中輸出每個目標(biāo)的邊框(BoundingBox)以及標(biāo)簽,在多類別目標(biāo)檢測中,一般使用不同顏色的邊框?qū)z測到的不同物體的位置進(jìn)行標(biāo)記。除了給出圖像中所有目標(biāo)的類別信息,還用不同顏色的邊框顯示每個目標(biāo)的位置1.3.3圖像分割語義分割:將整個圖像分成像素組,為圖像中的每個像素分配一個類別,但是同一類別之間的對象不會區(qū)分。實(shí)例分割:目標(biāo)檢測和語義分割的結(jié)合,在圖像中將目標(biāo)檢測出來(目標(biāo)檢測),然后對每個像素打上標(biāo)簽(語義分割)計(jì)算機(jī)視覺發(fā)展過程04第1章 初識計(jì)算機(jī)視覺1.4.120世紀(jì)50年代,二維圖像的分析和識別貓的視覺實(shí)驗(yàn)首次發(fā)現(xiàn)了視覺初級皮層神經(jīng)元對于移動邊緣刺激敏感,發(fā)現(xiàn)了視功能柱結(jié)構(gòu),為視覺神經(jīng)研究奠定了基礎(chǔ)——促成了計(jì)算機(jī)視覺技術(shù)40年后的突破性發(fā)展,奠定了深度學(xué)習(xí)之后的核心準(zhǔn)則。1.4.220世紀(jì)60年代,理解三維場景從二維圖片中推導(dǎo)三維信息的過程,開創(chuàng)了理解三維場景為目的的計(jì)算機(jī)視覺研究。他從數(shù)字圖像中提取出立方體、鍥形體、棱柱體等多面體的三維結(jié)構(gòu),并描述物體形狀及其空間關(guān)系勞倫斯·吉爾曼·羅伯茨(LawrenceRoberts

)的《三維固體的機(jī)器感知》

1.4.320世紀(jì)70年代,恢復(fù)三維結(jié)構(gòu)大衛(wèi)·馬爾視覺表達(dá)三階段基元圖(Primalsketch):由于圖像的密度變化可能與物體邊界這類具體的物理性質(zhì)相對應(yīng),因此它主要描述圖像的密度變化及其局部幾何關(guān)系。2.5維圖(2.5Dimensionalsketch):以觀察者為中心,描述可見表面的方位、輪廓、深度及其他性質(zhì)。3維模型(3DModel):以物體為中心,是用來處理和識別物體的三維形狀表象。1.4.420世紀(jì)80年代,基于專家系統(tǒng)識別蘋果讓計(jì)算機(jī)識別一個蘋果,假設(shè)計(jì)算機(jī)事先知道蘋果的形狀或其他特征,并且建立了這樣一個先驗(yàn)知識庫,那么計(jì)算機(jī)就可以將這樣的先驗(yàn)知識和看到物體表征進(jìn)行匹配。如果能夠匹配,計(jì)算機(jī)就算識別或者理解了看到的物體。1.4.520世紀(jì)90年代,特征對象識別根據(jù)局部特征識別卡車形狀、顏色、紋理這些表征,其實(shí)會受到視角的影響,一個人從不同的角度去看物品,它的形狀、顏色、紋理可能都不太一樣。識別一輛卡車,通過形狀、顏色、紋理,可能并不穩(wěn)定,如果通過局部特征,即使視角變化了,也會準(zhǔn)確對其進(jìn)行辨識1.4.621世紀(jì)初,圖像特征工程2000年左右,機(jī)器學(xué)習(xí)方法開始盛行。以前需要通過一些規(guī)則、知識或者統(tǒng)計(jì)模型去識別圖像所代表的物品是什么,機(jī)器學(xué)習(xí)的方法則完全不同。機(jī)器學(xué)習(xí)能夠從海量數(shù)據(jù)里面去自動歸納物品的特征,然后去識別它。1.4.72010年至今,深度學(xué)習(xí)年代深度卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)框架以計(jì)算機(jī)視覺新系統(tǒng)和新技術(shù)賦能2022年度《MagicQuadrantforCloudAIDeveloperServices》計(jì)算機(jī)視覺行業(yè)應(yīng)用05第1章 初識計(jì)算機(jī)視覺1.5.1智慧醫(yī)療領(lǐng)域借助機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方法,應(yīng)用專業(yè)醫(yī)師的種類豐富、深度鉆研的醫(yī)學(xué)知識,提取醫(yī)學(xué)領(lǐng)域的特征工程,就可以對醫(yī)學(xué)數(shù)據(jù),包括影像、傳感器數(shù)據(jù),做出高準(zhǔn)確率的醫(yī)學(xué)判斷。病變檢測病理圖像分割病理圖像配準(zhǔn)基于病理圖像的三維建模與仿真1.5.2公共安全領(lǐng)域大型展會、體育、商演等安?;顒语w機(jī)場、火車站、政府、軍隊(duì)、要道等重點(diǎn)場所監(jiān)控景區(qū)安保活動自然災(zāi)害預(yù)警突發(fā)疾控安保城市水質(zhì)分析1.5.3智慧交通領(lǐng)域車輛分類行車違章檢測交通流量分析停車占用檢測自動車牌識別車輛重新識別行人檢測交通標(biāo)志檢測駕駛員注意力檢測1.5.4其他領(lǐng)域農(nóng)業(yè)工業(yè)服務(wù)業(yè)泛娛樂業(yè)基礎(chǔ)開發(fā)環(huán)境搭建06第1章 初識計(jì)算機(jī)視覺1.6.1下載及安裝Anaconda下載Anaconda開發(fā)工具安裝Anaconda開發(fā)工具從/distribution/#download-section網(wǎng)址進(jìn)入Anaconda下載頁面,選擇Python最新版本的下載鏈接即可下載,其中有Linux、Windows和MacOS的不同版本可以選擇,下載完成后即可安裝。雙擊Anaconda安裝文件,彈出的Anaconda安裝窗口,一路下一步1.6.1下載及安裝Anaconda具體值以實(shí)際的安裝路徑為準(zhǔn)1.6.2使用Anaconda安裝TensorFlow新建虛擬環(huán)境激活虛擬環(huán)境condaactivatetensorflowcondacreate-ntensorflowpython=3.8安裝TensorFlowpipinstalltensorflow==2.5.0-i/simple退出虛擬環(huán)境con

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論