機(jī)器學(xué)習(xí)原理與應(yīng)用電子教案 4圖像處理基礎(chǔ)_第1頁
機(jī)器學(xué)習(xí)原理與應(yīng)用電子教案 4圖像處理基礎(chǔ)_第2頁
機(jī)器學(xué)習(xí)原理與應(yīng)用電子教案 4圖像處理基礎(chǔ)_第3頁
機(jī)器學(xué)習(xí)原理與應(yīng)用電子教案 4圖像處理基礎(chǔ)_第4頁
機(jī)器學(xué)習(xí)原理與應(yīng)用電子教案 4圖像處理基礎(chǔ)_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

備課日期:年月日授課時(shí)間課時(shí)(理論+實(shí)驗(yàn))周次星期:節(jié)次:授課課題圖像處理基礎(chǔ)教學(xué)目標(biāo)1.理解圖像處理的意義。2.掌握圖像處理關(guān)鍵術(shù)語與常用方法。3.了解圖像擴(kuò)充技術(shù)。教學(xué)重點(diǎn)1.圖像處理關(guān)鍵術(shù)語。2.圖像處理常用方法。教學(xué)準(zhǔn)備PPT、點(diǎn)名冊等。教學(xué)方法案例法、探究法。教學(xué)過程設(shè)計(jì)備注課題引入【思考】人類從客觀世界獲取信息的渠道有哪些?哪個(gè)渠道最重要?【關(guān)鍵】視覺的重要性以及圖像處理的重要性?!緯r(shí)間】分鐘。教學(xué)步驟及主要內(nèi)容【主板書】§4.圖像處理基礎(chǔ)圖像處理意義【主板書】1.意義1.圖像獲取與處理的重要性。2.圖像處理技術(shù)的應(yīng)用?!糚PT〗圖像處理技術(shù)應(yīng)用實(shí)例?!緯r(shí)間】分鐘。【提問】。圖像處理關(guān)鍵術(shù)語【主板書】2.關(guān)鍵術(shù)語1.RGB顏色模型:任意顏色可由取值為0-255的紅(R)、綠(G)、藍(lán)(B)三種顏色混合而成,三種顏色比例不同,最終合成后的顏色也不同。例如:純紅色對應(yīng)的RGB分別為255、0與0;灰色對應(yīng)的RGB三個(gè)值相等(除0和255);白色對應(yīng)RGB值均為255;黑色對應(yīng)的RGB值均為0。2.圖像基本屬性(1)亮度亮度是指彩色光作用于人眼時(shí)在視覺上引起的明暗程度;如果是灰度圖像(每個(gè)像素取值范圍為0-255),灰度值越高則圖像越亮。(2)對比度對比度指圖像中不同顏色最亮處和最暗處之間的差別(對比度=最大灰度值/最小灰度值),差別越大對比度越高;一般而言,對比度越大,圖像越清晰醒目,色彩也越鮮明艷麗,但對比度過大,圖像就會(huì)顯得很刺眼。(3)飽和度飽和度指圖像顏色的深淺程度。飽和度越高,顏色就越深或飽滿,即所謂的青翠欲滴的感覺。飽和度越低,顏色就越淺或陳舊(飽和度為0時(shí),圖像就為灰度圖像);高飽和度的彩色光可因摻入白光而降低純度或變淺,變成低飽和度的色光。(4)色相色調(diào)指顏色的種類(如彩虹由紅、橙、黃、綠、青、藍(lán)、紫七色組成),是區(qū)別各種不同色彩的最準(zhǔn)確的標(biāo)準(zhǔn)。任何黑白灰以外的顏色都有色相的屬性,而對于灰度圖像,當(dāng)色調(diào)級別為255時(shí),就是白色,當(dāng)級別為0時(shí),就是黑色,中間是各種程度不同的灰色。3.圖像坐標(biāo)與顏色(1)圖像坐標(biāo):以圖像像素矩陣的左上角為原點(diǎn)、以圖像像素矩陣列數(shù)與行數(shù)分別為橫坐標(biāo)與縱坐標(biāo)建立以像素為單位的直角坐標(biāo)系,則可確定圖像像素矩陣中任意像素的位置。(2)顏色或灰度值:圖像像素矩陣中像素的具體值決定了其最終呈現(xiàn)的顏色?!糚PT〗圖像坐標(biāo)與顏色圖示與實(shí)例。4.分辨率(1)分辨率定義:水平分辨率與垂直分辨率,兩者分別指圖像在水平與垂直兩個(gè)方向各有多少像素。(2)分辨率指標(biāo):指標(biāo)DPI是指每英寸圖像內(nèi)的像素?cái)?shù)。【時(shí)間】分鐘。【提問】。三、圖像處理常用方法【主板書】3.常用方法〖PPT〗圖像處理結(jié)果。1.PIL圖像處理類庫:最重要的模塊為Image,利用相關(guān)函數(shù)可以方便地對圖像進(jìn)行圖像縮放、裁剪、旋轉(zhuǎn)、顏色轉(zhuǎn)換等處理。PIL庫Image類庫的導(dǎo)入方式如下:fromPILimportImage2.圖像處理(1)加載并顯示圖像:采用open()與show()函數(shù)加載與顯示圖像。im=Image.open('sample.jpg')#打開圖像im.show()#顯示圖像或采用Matplotlib庫imshow()也可顯示已加載圖像,即:plt.imshow(im)plt.axis('off')#不顯示坐標(biāo)軸(2)獲取圖像尺寸:圖像size、format與mode等屬性。(3)保存圖像(可更改格式):save()函數(shù)。im.save('002.png','PNG')【強(qiáng)化與拓展】圖像常用格式。(4)圖像與NumPy數(shù)組之間的轉(zhuǎn)換:np.array()函數(shù)與mage.fromarray()函數(shù)。im_array=np.array(im)#轉(zhuǎn)換為NumPy數(shù)組im_new=Image.fromarray(im_array)#NumPy數(shù)組轉(zhuǎn)換為圖像【強(qiáng)化與拓展】利用數(shù)組切片方式可對像素進(jìn)行批量操作。im_array[i,:]=im_array[j,:]#將第j行的數(shù)值賦值給第i行im_array[:,i]=255#將第i列的所有數(shù)值設(shè)為255im_array[10:20,30:40]#10-20行與30-40列(不含第20行與第40列)im_array[:,-1]#獲取最后1列注意,負(fù)序號表示逆向計(jì)數(shù)。(5)顯示指定圖像通道im_1=plt.imshow(im_array[:,:,0])#顯示第1個(gè)通道【強(qiáng)化與拓展】利用set_cmap()設(shè)置灰度顏色映射表。(6)RGB圖像轉(zhuǎn)換為灰度圖與二值圖利用convert()函數(shù)可將RGB圖像轉(zhuǎn)換為灰度與二值圖像。im_gray=im.convert('L')#轉(zhuǎn)換為灰度圖像im_bin=im.convert('1')#轉(zhuǎn)換為二值圖像(7)獲取像素RGB值可通過NumPy數(shù)組操作的方式獲取指定像素RGB值,即:rc=[100,200]#指定坐標(biāo)RGB=im_array[rc[0],rc[1],:]#獲取像素RGB值或者直接使用getpixel()獲取指定像素RGB值,即:RGB=im.getpixel((200,100))(8)修改像素RGB值im_array[rc[0],rc[1],:]=[255,0,0]#將指定像素顏色值修改為紅色或直接采用putpixel()函數(shù)進(jìn)行修改,即:im.putpixel((200,100),(255,0,0))【知識要點(diǎn)】批量修改像素RGB值。(9)添加噪聲c,r=im.sizeforiinrange(10000):x=np.random.randint(0,c)y=np.random.randint(0,r)im_array[y,x,:]=255im_new=Image.fromarray(im_array);im_new.show()(10)調(diào)整尺寸可利用resize()函數(shù)對圖像尺寸進(jìn)行修改,即:im_small=im.resize((128,128))(11)旋轉(zhuǎn)可利用rotate()函數(shù)對圖像進(jìn)行旋轉(zhuǎn)處理,即:im_rotate=im.rotate(45)#旋轉(zhuǎn)45度(12)圖像區(qū)域截取可使用crop()函數(shù)方法幅圖像中截取指定區(qū)域,其中區(qū)域使用坐標(biāo)依次是(左,上,右,下)的四元組指定,即:box=(10,20,400,300)#指定區(qū)域sub_im=im.crop(box)#截取區(qū)域(13)特效濾鏡PIL庫ImageFilter模塊集成模糊、銳化、邊緣強(qiáng)化、浮雕等特效,通過調(diào)用相關(guān)函數(shù)即可產(chǎn)生相應(yīng)的效果;示例如下:im_filter=im.filter(ImageFilter.CONTOUR)#輪廓im_filter=im.filter(ImageFilter.GaussianBlur(radius=2))#模糊(參數(shù)radius用于控制模糊的程度)im_filter=im.filter(ImageFilter.EDGE_ENHANCE)#邊緣增強(qiáng)發(fā)使得圖像中邊緣部分更加明顯。im_filter=im.filter(ImageFilter.EMBOSS)#浮雕im_filter=im.filter(ImageFilter.FIND_EDGES)#邊緣檢測(14)繪制點(diǎn)線Matplotlib庫不但具有強(qiáng)大的繪圖功能,可以對圖像中興趣點(diǎn)或區(qū)域進(jìn)行標(biāo)注。plt.imshow(im)x=[300,300,400,400]y=[200,300,200,300]plt.plot(x,y,'ro')#使用紅色星狀標(biāo)記繪制點(diǎn)plt.plot([x[0],x[3]],[y[0],y[3]],'b')#連接第1與4點(diǎn)plt.plot([x[1],x[2]],[y[1],y[2]],'g')#連接第2與3點(diǎn)plt.show()(15)交互式標(biāo)注當(dāng)需要通過用戶交互的方式在獲取圖像像素坐標(biāo)時(shí),可通過Matplotlib庫Pylab模塊中的ginput()函數(shù)實(shí)現(xiàn)。importmatplotlib.pylabasmpplt.imshow(im)xy=mp.ginput(3)#在圖像中點(diǎn)擊三下以將點(diǎn)擊處坐標(biāo)保存至xy【時(shí)間】分鐘?!咎釂枴俊D像擴(kuò)充技術(shù)【主板書】4.圖像擴(kuò)充1.概述:在利用機(jī)器學(xué)習(xí)算法(如深度神經(jīng)網(wǎng)絡(luò))構(gòu)建圖像識別模型時(shí),大量具有代表性的圖像是基礎(chǔ),圖像擴(kuò)充的目的是對原始圖像進(jìn)行隨機(jī)變換(平移、剪裁、旋轉(zhuǎn)、色彩變換等)以產(chǎn)生一些相似但不同的圖像,從而擴(kuò)大訓(xùn)練數(shù)據(jù)集的規(guī)模,降低過擬合的發(fā)生的可能性。此外,在圖像擴(kuò)充中,隨機(jī)改變訓(xùn)練樣本可以降低模型對某些屬性的依賴,從而提高模型的泛化能力。2.Torchvision庫:包含豐富的圖像預(yù)處理操作。importtorchvision.transformsasT#導(dǎo)入圖像變換類庫3.擴(kuò)充操作(1)圖像剪裁以圖像中心作為基準(zhǔn)點(diǎn),通過指定尺寸剪裁圖像區(qū)域。其中,圖像區(qū)域尺寸可通過元組tuple(H,W)或通過整數(shù)(寬高相等)指定。transform=T.CenterCrop(100)#定義圖像剪裁對象sub_im=transform(im)#對圖像進(jìn)行剪裁plt.imshow(np.array(result))(2)改變圖像亮度、對比度與飽和度transform=T.ColorJitter(brightness=0.8,contrast=0.3,saturation=0.9,hue=0.2)sub_im=transform(im)(3)截取五個(gè)圖像區(qū)域在圖像四個(gè)角及中心處剪裁五個(gè)圖像區(qū)域。transform=T.FiveCrop(100)sub_ims=transform(im)(4)圖像灰度處理對圖像進(jìn)行灰度化處理。transform=T.Grayscale(num_output_channels=3)#參數(shù)可設(shè)置為1或3(3表示RGB值通道數(shù)相同)im_gray=transform(im)plt.imshow(im_gray,cmap='gray')(5)圖像四邊填充transform=T.Pad(padding=(2,4,6,8),fill=(255,0,0),padding_mode='constant')result=transform(im)【強(qiáng)化與拓展】padding、fill與padding_mode等參數(shù)設(shè)置。(6)隨機(jī)仿射變換transform=T.RandomAffine(degrees=(-30,30),translate=None,scale=None,shear=30,resample=Image.BILINEAR,fillcolor=(255,0,0))im_new=transform(im)【強(qiáng)化與拓展】degree、translate、scale、shear、resample與fillcolor等參數(shù)設(shè)置。(7)隨機(jī)裁剪transform=T.RandomCrop((100,200))sub_im=transform(im)(8)按概率隨機(jī)灰度transform=T.RandomGrayscale(p=0.1)sub_im=transform(im)(9)按概率水平翻轉(zhuǎn)transform=T.RandomHorizontalFlip(p=0.9)im_new=transform(im)(10)按概率垂直翻轉(zhuǎn)transform=T.RandomVerticalFlip(p=0.9)im_new=transform(im)(11)調(diào)整尺寸transform=T.Resize((20,30),interpolation=Image.BILINEAR)im_new=transform(im)(12)以指定概率隨機(jī)選擇預(yù)處理操作transforms=[T.CenterCrop(160),T.Pad(padding=(2,4,6,8),fill=(255,255,255),padding_mode='constant')]transform=T.RandomApply(transforms,p=0.9)im_new=transform(im)plt.imshow(im_new)(13)隨機(jī)選擇預(yù)處理操作transforms=[T.CenterCrop(160),T.Pad(padding=(2,4,6,8),fill=(255,255,255),padding_mode='constant')]transform=T.RandomChoice(transform

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論