項(xiàng)目7- 圖像識(shí)別_第1頁(yè)
項(xiàng)目7- 圖像識(shí)別_第2頁(yè)
項(xiàng)目7- 圖像識(shí)別_第3頁(yè)
項(xiàng)目7- 圖像識(shí)別_第4頁(yè)
項(xiàng)目7- 圖像識(shí)別_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

信息技術(shù)與人工智能基礎(chǔ)項(xiàng)目7

圖像識(shí)別01項(xiàng)目背景02思維導(dǎo)圖03思政聚焦04項(xiàng)目相關(guān)知識(shí)05項(xiàng)目任務(wù)目錄CONTENTS06項(xiàng)目小結(jié)與展望01項(xiàng)目背景圖像識(shí)別背景介紹伴隨著圖片成為互聯(lián)網(wǎng)中的主要信息載體,難題隨之出現(xiàn)。當(dāng)信息由文字記載時(shí),我們可以通過(guò)關(guān)鍵詞搜索輕易找到所需內(nèi)容并進(jìn)行任意編輯,而當(dāng)信息由圖片記載時(shí),我們卻無(wú)法對(duì)圖片中的內(nèi)容進(jìn)行檢索,從而影響了我們從圖片中找到關(guān)鍵內(nèi)容的效率。圖片給我們帶來(lái)了快捷的信息記錄和分享方式,卻降低了我們的信息檢索效率。在這個(gè)環(huán)境下,借助計(jì)算機(jī)實(shí)現(xiàn)圖像主體的識(shí)別技術(shù)就顯得尤為重要。計(jì)算機(jī)視覺(jué)應(yīng)用----圖像識(shí)別圖像識(shí)別,指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別圖像中各種不同模式的目標(biāo)和對(duì)象的技術(shù)。通俗地講,圖像識(shí)別是讓計(jì)算機(jī)像人一樣讀懂圖片的內(nèi)容,識(shí)別出圖像中有什么物體,并報(bào)告出這個(gè)物體在圖像中的位置和方向。02思維導(dǎo)圖思維導(dǎo)圖03課程思政圖像識(shí)別技術(shù)應(yīng)用在互聯(lián)網(wǎng)的海量圖片、視頻資料中,不少涉政敏感信息、暴力、低俗等內(nèi)容的圖片充斥其中,這些圖片嚴(yán)重影響著國(guó)家安全和網(wǎng)絡(luò)文明。在圖像識(shí)別還未發(fā)展成熟以前,需要人工隨機(jī)抽取圖片對(duì)圖片內(nèi)容進(jìn)行審核。借助人工智能、深度學(xué)習(xí)和大數(shù)據(jù)樣本等技術(shù),這一問(wèn)題得到了很好地解決。當(dāng)然,智能圖片鑒別模型并不能完全取代人工鑒別,相比人工審核,機(jī)器還很難理解內(nèi)容背后的深意。最佳的審核方式是智能為主,人工為輔。先由智能圖片鑒別模型將可疑的圖片篩選出來(lái),再由人工審核一遍,這樣既能保證效率又能保證準(zhǔn)確率。圖像識(shí)別技術(shù)應(yīng)用網(wǎng)絡(luò)上的內(nèi)容并不都是文明和健康的,我們應(yīng)該要懂得文明上網(wǎng),取其精華,去其糟粕。對(duì)于個(gè)人而言,不得在網(wǎng)上發(fā)布和傳播虛假信息、低俗或暴力信息;不得在網(wǎng)上通過(guò)發(fā)帖、評(píng)論等方式攻擊、謾罵他人;不得在網(wǎng)上從事其他違背公序良俗、損害他人合法權(quán)益的活動(dòng);不去瀏覽一些負(fù)面新聞,更不應(yīng)該去瀏覽一些低俗、暴力的網(wǎng)站,讓自己自覺(jué)抵制不良內(nèi)容;不參與網(wǎng)絡(luò)敏感話(huà)題,對(duì)于一些敏感的或者反動(dòng)的話(huà)題,要及時(shí)制止,不參與,不散播。04項(xiàng)目相關(guān)知識(shí)圖像識(shí)別人類(lèi)和計(jì)算機(jī)是如何識(shí)別這張圖片的呢?圖像識(shí)別的任務(wù)劃分

a)分類(lèi)

b)分類(lèi)+定位

c)多目標(biāo)檢測(cè)圖像識(shí)別任務(wù)劃分分類(lèi)的相關(guān)技術(shù)圖像分類(lèi)的流程包括訓(xùn)練階段和測(cè)試階段名詞解釋?zhuān)河?xùn)練集、測(cè)試集、獨(dú)熱編碼、置信率4種類(lèi)別的訓(xùn)練圖片圖像的原始特征表示形式萊娜灰度圖圖像的原始特征表示形式(a)彩色萊娜圖

(b)紅色分量

(c)綠色分量

(d)藍(lán)色分量彩色萊娜圖及其紅色、綠色、藍(lán)色分量圖像的預(yù)處理平移:把我們感興趣的、圖中的對(duì)象移到圖像的中間位置,便于盡可能準(zhǔn)確地、定量地分析圖像的特征縮放:一個(gè)數(shù)組越大,計(jì)算機(jī)處理該數(shù)組時(shí)消耗的內(nèi)存越大、花費(fèi)的時(shí)間越長(zhǎng),因而可以根據(jù)需要對(duì)圖像大小進(jìn)行調(diào)整填充:為了使待處理圖片符合分類(lèi)模型對(duì)圖像像素尺寸的要求,用特定的像素值對(duì)圖片的長(zhǎng)或?qū)挼南袼財(cái)?shù)量進(jìn)行補(bǔ)充傳統(tǒng)分類(lèi)算法特征提取:(1)顏色直方圖、局部二值模式、方向梯度直方圖特征、尺度不變特征變換、Gabor特征、區(qū)域協(xié)方差描述符

(2)主成分分析(PrincipalComponentAnalysis,PCA)、線(xiàn)性判別分析(lineardiscriminantanalysis,LDA)、流形學(xué)習(xí)(manifoldlearning)和稀疏編碼(SparseCoding,SC)分類(lèi)器:K近鄰(K-NearestNeighbor,KNN)、支持向量機(jī)(SupportVectorMachine,SVM)、決策樹(shù)、樸素貝葉斯、邏輯回歸等傳統(tǒng)分類(lèi)算法KNN分類(lèi)器原理示意圖深度學(xué)習(xí)算法深度學(xué)習(xí)算法的特點(diǎn)優(yōu)勢(shì):在訓(xùn)練集數(shù)量充足的情況下準(zhǔn)確率高局限性:(1)大數(shù)據(jù)集花費(fèi)昂貴且耗時(shí),并不容易獲得

(2)訓(xùn)練階段對(duì)硬件要求高目標(biāo)檢測(cè)相關(guān)技術(shù)滑動(dòng)窗口檢測(cè)示意圖目標(biāo)檢測(cè)相關(guān)技術(shù)預(yù)測(cè)框的交并比說(shuō)明非極大值抑制(Non-MaximumSuppression,NMS):當(dāng)邊框預(yù)測(cè)環(huán)節(jié)生成了大量建議邊框后,接著要為每個(gè)矩形框做類(lèi)別分類(lèi)概率,最后需要判別哪些矩形框是沒(méi)用的。所謂的非極大值抑制就是根據(jù)分類(lèi)器類(lèi)別分類(lèi)概率做排序,從小到大排序,先拿最大概率候選框與其他框計(jì)算重疊度IOU,丟棄高于閾值的建議框。然后從沒(méi)有被丟棄的建議框中再找最大概率建議框,重復(fù)上述操作,直到找到所有被保留下來(lái)的建議框。滑窗法改進(jìn)YOLO算法示意圖1.兩步檢測(cè)算法:R-CNN2.一步檢測(cè)算法:YOLO圖像識(shí)別的局限性1.多視角和尺度:同一個(gè)物體的圖像,它的角度和尺度是多變的,獲取到的這個(gè)物體的圖片也是多樣的;2.遮擋:目標(biāo)物體可能被擋住,圖片中只有目標(biāo)物體的一小部分;3.光照條件:在像素層面上,光照對(duì)圖片的影響非常大;4.類(lèi)內(nèi)差異:同一類(lèi)別的個(gè)體之間有許多不同的對(duì)象,每個(gè)個(gè)體都有自己的外形。圖像識(shí)別的優(yōu)勢(shì)1.在大數(shù)據(jù)時(shí)代,人類(lèi)獲取的圖片資料越來(lái)越多,人們需要借助計(jì)算機(jī)去承擔(dān)這些復(fù)雜沉重的工作,否則這些工作將由人類(lèi)負(fù)擔(dān)。2.在一些極端環(huán)境下,比如水下、嚴(yán)寒或酷暑的環(huán)境下的圖像識(shí)別,如果工作由人工智能來(lái)完成,人類(lèi)面臨的危險(xiǎn)、傷害和壓力將有所減輕。3.人類(lèi)判斷物體類(lèi)別的準(zhǔn)確率總體上會(huì)比機(jī)器的識(shí)別率高,但在一些要求精密度的識(shí)別,比如缺陷識(shí)別、醫(yī)學(xué)圖片等識(shí)別,人類(lèi)的優(yōu)勢(shì)可能會(huì)相應(yīng)降低。在這類(lèi)場(chǎng)合,通過(guò)機(jī)器替代人來(lái)實(shí)現(xiàn)圖像識(shí)別,能夠減少錯(cuò)誤和缺陷。圖像識(shí)別的應(yīng)用1.光學(xué)字符識(shí)別2.圖片識(shí)別分析3.工業(yè)瑕疵檢測(cè)4.視頻監(jiān)控分析5.醫(yī)療影像診斷04項(xiàng)目任務(wù)任務(wù)1:數(shù)字識(shí)別1、任務(wù)描述手寫(xiě)數(shù)字識(shí)別是常見(jiàn)的圖像識(shí)別任務(wù)。不同人的手寫(xiě)體風(fēng)格迥異,大小不一,造成了計(jì)算機(jī)對(duì)手寫(xiě)數(shù)字識(shí)別任務(wù)的一些困難。任務(wù)1實(shí)踐的主要目的是了解數(shù)字識(shí)別的基本原理與過(guò)程。首先通過(guò)查看數(shù)字圖像的像素表達(dá),了解圖像到數(shù)字的轉(zhuǎn)化過(guò)程,再通過(guò)手寫(xiě)數(shù)字的識(shí)別了解手寫(xiě)體識(shí)別的功能。2、任務(wù)實(shí)現(xiàn)2、任務(wù)實(shí)現(xiàn)2、任務(wù)實(shí)現(xiàn)任務(wù)2:目標(biāo)檢測(cè)1、任務(wù)描述目標(biāo)檢測(cè)是一個(gè)典型的計(jì)算機(jī)視覺(jué)任務(wù),主要是完成圖像中的物體的識(shí)別。與圖像分類(lèi)不同的是,圖像分類(lèi)是預(yù)測(cè)圖像屬于哪一種類(lèi)別,而目標(biāo)檢測(cè)則是對(duì)圖像中的一個(gè)或多個(gè)對(duì)象進(jìn)行定位和分類(lèi)。如果是視頻,則通過(guò)不斷的讀取視頻中的每一幀作為一幅幅圖像來(lái)進(jìn)行檢測(cè)。任務(wù)2實(shí)踐的主要目的是了解目標(biāo)檢測(cè)的基本原理與過(guò)程,通過(guò)上傳圖片來(lái)驗(yàn)證和實(shí)踐目標(biāo)檢測(cè)中的圖像預(yù)處理、目標(biāo)定位與分類(lèi)的各個(gè)步驟。2、任務(wù)實(shí)現(xiàn)2、任務(wù)實(shí)現(xiàn)2、任務(wù)實(shí)現(xiàn)04項(xiàng)目小結(jié)與展望項(xiàng)目小結(jié)

人類(lèi)感覺(jué)信息中的80%都是視覺(jué)信息,圖像是人類(lèi)獲取和交換信息的主要來(lái)源。機(jī)器視覺(jué)之于人工智能的意義就是視覺(jué)之于人類(lèi)的意義,而決定著機(jī)器視覺(jué)技術(shù)之一就是圖像識(shí)別技術(shù)。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,圖像識(shí)別技術(shù)也在不斷地優(yōu)化,其算法也在不斷地改進(jìn)。在某些應(yīng)用場(chǎng)景,機(jī)器視覺(jué)比人類(lèi)的生理視覺(jué)更具優(yōu)勢(shì),它更加準(zhǔn)確、客觀和穩(wěn)定。利用計(jì)算機(jī)代替人類(lèi)實(shí)現(xiàn)圖像識(shí)別,能夠盡量縮短時(shí)間并減少資源。項(xiàng)目展望

人們一直致力于開(kāi)發(fā)各種智能工具輔助人們的生產(chǎn)生活,比如機(jī)器人的研制,但是要想使得機(jī)器人可以像人一樣運(yùn)動(dòng),輔助人們的工作生活,那么前提是機(jī)器人必須具備類(lèi)似于人的視覺(jué)系統(tǒng),能夠識(shí)別物體以及場(chǎng)景,真正的智能工具應(yīng)該要具備“視覺(jué)”。目前的圖像識(shí)別技術(shù)是作為一個(gè)工具來(lái)幫助我們與外部世界進(jìn)行交互,為我們自身的視覺(jué)提供強(qiáng)有力的輔

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論