數(shù)據(jù)挖掘技術(shù)與應用(圖像分析)_第1頁
數(shù)據(jù)挖掘技術(shù)與應用(圖像分析)_第2頁
數(shù)據(jù)挖掘技術(shù)與應用(圖像分析)_第3頁
數(shù)據(jù)挖掘技術(shù)與應用(圖像分析)_第4頁
數(shù)據(jù)挖掘技術(shù)與應用(圖像分析)_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第九章圖像大數(shù)據(jù)目錄圖像分類face_recognition0102圖像大數(shù)據(jù)圖像分類圖像數(shù)據(jù)分析的內(nèi)容是什么?內(nèi)容分析,內(nèi)容識別,檢測都離不開圖像的分類分類目標:所謂圖像分類問題,就是已有固定的分類標簽集合,然后對于輸入的圖像,從分類標簽集合中找出一個分類標簽,最后把分類標簽分配給該輸入圖像。圖像大數(shù)據(jù)圖像分類的例子圖像大數(shù)據(jù)圖像分類的例子圖像分類模型讀取該圖片,并生成該圖片屬于集合{cat,dog,hat,mug}中各個標簽的概率圖像大數(shù)據(jù)圖像分類在別的領(lǐng)域雖然看起來挺簡單的,但這可是計算機視覺領(lǐng)域的核心問題之一,并且有著各種各樣的實際應用。衛(wèi)星影響醫(yī)學領(lǐng)域圖像大數(shù)據(jù)衛(wèi)星領(lǐng)域“空間考古學家”Sarah使用衛(wèi)星影像定位過許多遺失的埃及城市、古廟和陵墓。圖像大數(shù)據(jù)醫(yī)學領(lǐng)域基于海量的放射影像,準確識別疾病病灶并量化,為醫(yī)生提供最專業(yè)的診斷依據(jù)圖像大數(shù)據(jù)圖像在計算機中的結(jié)構(gòu)在進行圖像分類前我們了解一下圖像在計算機中的結(jié)構(gòu)對于計算機來說,圖像是一個由數(shù)字組成的巨大的3維數(shù)組。圖像大數(shù)據(jù)圖像在計算機中的結(jié)構(gòu)圖像大數(shù)據(jù)圖像在計算機中的結(jié)構(gòu)在這個例子中,貓的圖像大小是寬248像素,高400像素,有3個顏色通道,分別是紅、綠和藍(簡稱RGB)。如此,該圖像就包含了248X400X3=297600個數(shù)字,每個數(shù)字都是在范圍0-255之間的整型,其中0表示全黑,255表示全白。圖像大數(shù)據(jù)圖像與機器學習我們發(fā)現(xiàn)了圖像是以數(shù)組形式進行的表達能否將這些數(shù)組放入機器學習算法中通過比較數(shù)組的距離進行分類圖像大數(shù)據(jù)圖像與機器學習圖像大數(shù)據(jù)圖像分類的簡單實現(xiàn)我們在進行線性分類前,先了解一下將會使用到的工具OpenCVOpenCV是一個用于圖像處理、分析、機器視覺方面的開源函數(shù)庫該庫包含了橫跨工業(yè)產(chǎn)品檢測、醫(yī)學圖像處理、安防、用戶界面、攝像頭標定、三維成像、機器視覺,該庫也包含了比較常用的一些機器學習算法圖像大數(shù)據(jù)OpenCVOpenCV功能非常強大,我們在此只對常用功能做介紹更多的詳情參考:/圖像大數(shù)據(jù)最簡單的線性劃分>>>importcv2#Loadinputimage--'table.jpg'>>>input_file='D:/ml/flower.jpg'>>>img=cv2.imread(input_file)圖像大數(shù)據(jù)最簡單的線性劃分>>>input_file2='D:/ml/flower.jpg'>>>img2=cv2.imread(input_file2)>>>print(img2-img))圖像大數(shù)據(jù)圖像分類困難和挑戰(zhàn)計算機是機械的,即使非常細微的變化在圖像矩陣中也會變?yōu)榫薮蟮牟町悎D像大數(shù)據(jù)圖像分類困難和挑戰(zhàn)視角變化(Viewpointvariation):同一個物體,攝像機可以從多個角度來展現(xiàn)。大小變化(Scalevariation):物體可視的大小通常是會變化的(不僅是在圖片中,在真實世界中大小也是變化的)。形變(Deformation):很多東西的形狀并非一成不變,會有很大變化。圖像大數(shù)據(jù)圖像分類困難和挑戰(zhàn)遮擋(Occlusion):目標物體可能被擋住。有時候只有物體的一小部分(可以小到幾個像素)是可見的。光照條件(Illuminationconditions):在像素層面上,光照的影響非常大。背景干擾(Backgroundclutter):物體可能混入背景之中,使之難以被辨認。圖像大數(shù)據(jù)圖像分類的光照圖像大數(shù)據(jù)圖像分類的變形圖像大數(shù)據(jù)圖像分類的遮擋圖像大數(shù)據(jù)圖像分類困難和挑戰(zhàn)思考:為什么人可以快速識別?你是如何快速判斷的一個事物的呢?圖像大數(shù)據(jù)圖像分類困難和挑戰(zhàn)答案:特征,人們通過物體的特征來確定,回想一下我們是否通過尾巴和尖尖的耳朵確定了躲在窗簾后的貓?圖像大數(shù)據(jù)圖像分類的特征提取SIFT算法,尺度不變特征轉(zhuǎn)換(Scale-invariantfeaturetransform或SIFT)算法是一種特征提取的方法。它在尺度空間中尋找極值點,并提取出其位置、尺度、旋轉(zhuǎn)不變量,并以此作為特征點并利用特征點的鄰域產(chǎn)生特征向量圖像大數(shù)據(jù)圖像分類的特征提取FAST特征點檢測是公認的比較快速的特征點檢測方法,只利用周圍像素比較的信息就可以得到特征點,簡單,有效。該方法多用于角點檢測。圖像大數(shù)據(jù)圖像分類的特征提取圖像大數(shù)據(jù)圖像分類的特征提取實現(xiàn)>>>importcv2>>>sift=cv2.xfeatures2d.SIFT_create()圖像識別案例人臉識別人臉識別,是基于人的臉部特征信息進行身份識別的一種生物識別技術(shù)人臉與人體的其它生物特征(指紋、虹膜等)一樣與生俱來,它的唯一性和不易被復制的良好特性為身份鑒別提供了必要的前提圖像識別案例人臉識別人臉識別第三方庫face_recognition該庫可以通過python或者命令行即可實現(xiàn)人臉識別的功能。使用dlib識別技術(shù)構(gòu)建,在戶外臉部檢測數(shù)據(jù)庫基準(LabeledFacesintheWild)上的準確率為99.38%圖像識別案例人臉識別HOWITWORK?輸入的圖像不是完全隨機的。盡管它們存在差異,但在任何輸入信號中都存在模式。這樣的可以在所有信號中觀察到的模式,可能是在面部識別領(lǐng)域。一些物體(眼睛、鼻子、嘴巴)在任何面部和相關(guān)部位的存在這些物體之間的距離圖像識別案例人臉識別HOWITWORK?圖像總是存在模型規(guī)律的:這些特征被稱為特征臉面部識別(或主要成分)face_recognition的算法是EigenFace算法,從思想上其實挺簡單,就相當于把人臉從像素空間變換到另一個空間,在另一個空間中做相似性的計算圖像識別案例人臉識別HOWITWORK?那為什么要變換到另一個空間呢?當然是為了更好的做識別或者分類了,因為變換到另一個空間,同一個類別的圖像會聚到一起,不同類別的圖像會距離比較遠,或者在原像素空間中不同類別的圖像在分布上很難用個簡單的線或者面把他們切分開,然后如果變換到另一個空間,就可以很好的把他們分開了圖像識別案例EigenFace算法基于EigenFace人臉識別實現(xiàn)過程:1)將訓練集的每一個人臉圖像都拉長一列,將他們組合在一起形成一個大矩陣A。假設(shè)每個人臉圖像是MxM大小,那么拉成一列后每個人臉樣本的維度就是d=MxM大小了。假設(shè)有N個人臉圖像,那么樣本矩陣A的維度就是dxN了。圖像識別案例EigenFace算法圖像集圖像識別案例EigenFace算法2)將所有的N個人臉在對應維度上加起來,然后求個平均,就得到了一個“平均臉”。你把這個臉顯示出來的話,還挺帥的哦3)將N個圖像都減去那個平均臉圖像,得到差值圖像的數(shù)據(jù)矩陣Φ。圖像識別案例EigenFace算法“平均臉”圖像識別案例EigenFace算法4)計算協(xié)方差矩陣C=ΦΦT。再對其進行特征值分解。就可以得到想要的特征向量(特征臉)了5)將訓練集圖像和測試集的圖像都投影到這些特征向量上了,再對測試集的每個圖像找到訓練集中的最近鄰或者k近鄰啥的,進行分類即可圖像識別案例人臉識別與PCA

PCA帶來了什么可能在直觀上,感覺特征越多,就越多的描述樣本的屬性,可提高識別率圖像識別案例人臉識別與PCA

如果特征向量維度過高,不僅會增加計算復雜度,還會給分類問題帶來負面影響,造成識別,或者分類精度降低實質(zhì)上盡可能好的保留原始數(shù)據(jù)信息的條件下,我們只需要那些大的特征值對應的特征向量,而那些十分小甚至為0的特征值對于我們來說,對應的特征向量幾乎沒有意義圖像識別案例人臉識別HOWITWORK?特征向量與面部識別有什么關(guān)系?圖像識別案例人臉識別HOWITWORK?每個特征向量只表示某個臉部的某些特征,可能存在,也可能不存在于原始圖像中,如果臉部特征在原始圖像中是較高的程度的存在,那么相應的特征向量在權(quán)重更大圖像識別案例人臉識別算法的實現(xiàn)首先,訓練集的圖像轉(zhuǎn)換成一組面部的特征,計算訓練集的每個圖像存儲在集合W中在獲得未知圖像X時計算新圖像的權(quán)重并且存儲在向量Wx中圖像識別案例人臉識別算法的實現(xiàn)如果Wf和未知的圖像Wx權(quán)重向量的權(quán)重向量之間這個平均距離超過某一閾值θ那么我們可以視為非人臉圖像一種方法是把每個權(quán)值視為向量空間中的一點,并計算出一個平均距離D如果X是一個人臉,我們比較它與集合W中所有數(shù)據(jù)的相似性,如果Wx不存在W集合中,它的權(quán)重向量Wx將被存儲以供以后分類。圖像識別案例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論