數(shù)字圖像處理與Python實現(xiàn)-課件 第1、2章 緒論、數(shù)字圖像基礎_第1頁
數(shù)字圖像處理與Python實現(xiàn)-課件 第1、2章 緒論、數(shù)字圖像基礎_第2頁
數(shù)字圖像處理與Python實現(xiàn)-課件 第1、2章 緒論、數(shù)字圖像基礎_第3頁
數(shù)字圖像處理與Python實現(xiàn)-課件 第1、2章 緒論、數(shù)字圖像基礎_第4頁
數(shù)字圖像處理與Python實現(xiàn)-課件 第1、2章 緒論、數(shù)字圖像基礎_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

數(shù)字圖像處理課程內(nèi)容入門認識第7章圖像分割第8章圖像壓縮基本操作應用第9章圖像水印第10章指紋識別第11章深度學習綜合案例第一章緒論1.1數(shù)字圖像基本概念1.2數(shù)字圖像處理1.3數(shù)字圖像處理的主要應用1.4數(shù)字圖像處理的發(fā)展1.5計算機視覺1.1數(shù)字圖像處理概念圖:反射光或透射光的分布,或自身發(fā)出的能量(客觀)像:人的視覺系統(tǒng)對圖的接收在大腦中形成的印象或認識(主觀)什么是圖像?客觀和主觀的結合要素:觀察系統(tǒng)使用的光波段:可見光、紅外、X射線、微波超聲波、射線等1.1數(shù)字圖像處理概念模擬圖像和數(shù)字圖像數(shù)字圖像:由連續(xù)的模擬圖像采樣和量化而得。組成數(shù)字圖像的基本單位是像素,所以數(shù)字圖像是象素的小塊區(qū)域組成的二維矩陣。像素:具有坐標和灰度值。像素值:圖像在該位置的亮度。

模擬圖像:采用數(shù)字化(離散化)表示和數(shù)字技術出現(xiàn)之前,圖像是連續(xù)的。比如在海邊用傳統(tǒng)相機拍攝的照片就是模擬圖像。第一章緒論1.1數(shù)字圖像基本概念1.2數(shù)字圖像處理1.3數(shù)字圖像處理的主要應用1.4數(shù)字圖像處理的發(fā)展1.5計算機視覺1.2數(shù)字圖像處理概念借助計算機的運算能力,運用去噪、特征提取、增強等技術對數(shù)字圖像處理。(1)提升圖像的視覺感知質(zhì)量(2)提升圖像中的感興趣區(qū)域或特征(3)方便圖像的存儲和傳輸數(shù)字圖像處理的目的1.2數(shù)字圖像處理數(shù)字圖像處理的特點(與模擬圖像相比)(1)可再現(xiàn)能力強(不易退化)(2)處理精度高(灰度級最高到32位以上)(3)適用范圍廣(4)靈活性高(線性與非線性、空域與頻域、點區(qū)域和整體)1.2數(shù)字圖像處理數(shù)字圖像處理系統(tǒng)組成思考:你和好友們拍照,并將照片用手機發(fā)送給他們的全過程包括哪些步驟。圖像獲取圖像存儲圖像處理圖像傳輸圖像展示1.2數(shù)字圖像處理數(shù)字圖像處理的三個層次圖像處理:對圖像進行加工,以改善圖像的視覺效果;強調(diào)圖像之間進行變換;從圖像到圖像圖像處理圖像分析:對圖像中感興趣的目標進行提取和分割,獲得目標的客觀信息(特點或性質(zhì));從圖像到數(shù)據(jù)圖像分析圖像理解圖像理解:研究圖像中各目標的性質(zhì)及其之間的相互聯(lián)系;得出對圖像內(nèi)容含義的理解及原來客觀場景的解釋,

屬于高層操作(符號運算)。1.3數(shù)字圖像處理數(shù)字圖像處理的三個層次圖像處理圖像分析圖像理解第一章緒論1.1數(shù)字圖像基本概念1.2數(shù)字圖像處理1.3數(shù)字圖像處理的主要應用1.4數(shù)字圖像處理的發(fā)展1.5計算機視覺1.3數(shù)字圖像處理主要應用數(shù)字圖像處理常見操作(經(jīng)典圖像處理)(1)圖像變換(2)圖像增強(4)形態(tài)學操作(3)圖像分割(5)圖像壓縮1.3數(shù)字圖像處理主要應用遙感圖像應用:資源調(diào)查、災害監(jiān)測、農(nóng)林業(yè)規(guī)劃、城市規(guī)劃、環(huán)境保護等高分辨率通過安裝在遙感平臺上的遙感儀器對地球表面攝影或掃描獲得的影像1.3數(shù)字圖像處理主要應用工業(yè)與實驗圖像處理:自動裝配生產(chǎn)線:實時圖像處理機器人視覺:立體圖像對處理無損探傷: 高能X射線探測金屬內(nèi)部車輛牌照識別:交通管制流動顯示與測速:PIV粒子圖像測速1.3數(shù)字圖像處理主要應用軍事公安圖像處理:指紋圖像處理:刑偵、司法鑒定、自動門衛(wèi)槍紋圖像處理:刑偵、司法鑒定面孔圖像處理:自動門衛(wèi)印章比對: 司法鑒定、銀行支票筆跡比對: 刑偵、司法鑒定俄烏戰(zhàn)爭是人類首次人工智能(AI)戰(zhàn)爭你說:人臉識別技術能識別動物的臉、指紋嗎?221.3數(shù)字圖像處理主要應用影視圖像處理:照片去模糊處理:焦距模糊、運動模糊綠幕剪影: 圖像合成變臉特技: 幀間插值處理靜止圖像壓縮:JPEG標準、網(wǎng)絡傳輸動態(tài)圖像壓縮:MPEG標準、VCD和DVD數(shù)字電影院: 未來電影技術以下哪項內(nèi)容不屬于數(shù)字圖像處理的范圍提取圖像邊緣信息獲取形狀信息為處理問題簡單化而進行的圖像變換為圖像中對象分類進行的目標檢測有目的的增強圖像的整體或局部特性ABCD提交單選題1分第一章緒論1.1數(shù)字圖像基本概念1.2數(shù)字圖像處理1.3數(shù)字圖像處理的主要應用1.4數(shù)字圖像處理的發(fā)展1.5計算機視覺1.4數(shù)字圖像處理的發(fā)展起源1921年,紐約-倫敦海底電纜進行“數(shù)字圖像傳輸”。傳遞時間從一個多星期減少到3小時1929年,倫敦-紐約15級色調(diào)傳遞照片。1964年,美國噴氣推進實驗室(JPL)使用數(shù)字計算機處理“徘徊者7號”太空船送回的4000+月球照片。1975年,GodfreyN.Hounsfield和AllanM.Cormack發(fā)明計算機斷層技術(CT),獲1979年諾貝爾醫(yī)學獎。20世紀60年代末和70年代初開始用于醫(yī)學圖像、地球遙感監(jiān)測和天文學等領域。1.4數(shù)字圖像處理的發(fā)展發(fā)展趨勢從低分辨率向高分辨率發(fā)展從二維(2D)向三維(3D)發(fā)展從靜止圖像向動態(tài)圖像發(fā)展從單態(tài)圖像向多態(tài)圖像發(fā)展結合應用數(shù)學新進展1.4數(shù)字圖像處理的發(fā)展AI時代+數(shù)字圖像處理數(shù)字圖像處理是人工智能的基石。(人工智能就是要實現(xiàn)計算機對人的視覺、聽覺、嗅覺、味覺、觸覺的模擬感知、思維決策和行為控制,視覺信息的智能化是最重要的方面。)從70年代中期開始,隨著計算機技術和人工智能、思維科學研究的迅速發(fā)展,數(shù)字圖像處理向更高、更深層次發(fā)展。研究如何用計算機系統(tǒng)解釋圖像,實現(xiàn)類似人類視覺系統(tǒng)理解外部世界,稱為圖像理解或計算機視覺。第一章緒論1.1數(shù)字圖像基本概念1.2數(shù)字圖像處理1.3數(shù)字圖像處理的主要應用1.4數(shù)字圖像處理的發(fā)展1.5計算機視覺1.5計算機視覺1.5計算機視覺圖像處理&計算機圖形學&計算機視覺圖像處理(DIP)計算機圖形學(CG)計算機視覺(CV)研究對象圖像虛擬場景的描述(景象結構、表面反射特性、光源配置及相機模型的信息),通常是多邊形數(shù)組圖像或圖像序列研究內(nèi)容圖像處理、圖像分割、圖像分析圖形的構造,從數(shù)據(jù)得到圖像視覺感知、圖像理解研究輸出由原始圖像處理出分析結果生成圖像(二維像素數(shù)組)圖像序列對應的真實世界的理解(比如檢測人臉、識別車牌)應用場景圖像的基本處理圖形成像、游戲類開發(fā)、視頻渲染除了DIP之外,人工智能含量大1.5計算機視覺人臉識別是人工智能視覺與圖像領域中最熱門的應用人臉識別對結構化的人、車、物等視頻內(nèi)容信息進行快速檢索、查詢視頻/監(jiān)控分析無人駕駛自動駕駛增強現(xiàn)實、虛擬現(xiàn)實AR、VR應用領域1.5計算機視覺應用實例/1.5計算機視覺應用實例網(wǎng)易易盾/基于人工智能技術及大數(shù)據(jù),提供智能文本圖片視頻內(nèi)容安全服務第一章小結1.1數(shù)字圖像基本概念1.2數(shù)字圖像處理1.3數(shù)字圖像處理的主要應用1.4數(shù)字圖像處理的發(fā)展1.5計算機視覺圖像處理技術有哪些用途?為每種用途舉出一個應用實例。作答主觀題10分數(shù)字圖像處理列舉數(shù)字圖像處理包含的內(nèi)容2.圖像處理技術有哪些應用,為每種用途舉出一個應用實例。作答主觀題10分課程內(nèi)容入門認識第7章圖像壓縮第8章圖像分割基本操作應用第9章圖像水印第10章指紋識別第11章深度學習綜合案例第二章數(shù)字圖像處理基礎2.1色度學基礎2.2圖像的數(shù)字化技術2.3像素的基本關系2.4圖像質(zhì)量評價2.1色度學基礎圖:反射光或透射光的分布,或自身發(fā)出的能量(客觀)像:人的視覺系統(tǒng)對圖的接收在大腦中形成的印象或認識(主觀)什么是圖像?客觀和主觀的結合感光細胞桿狀細胞:暗視器官錐狀細胞:明視器官,在照度足夠高時起作用,并能分別辨顏色2.1色度學基礎顏色模型將電磁光譜的可見部分分為三個波段:紅、綠、藍(三基色)把三種基色光按不同比例相加稱之為相加混色2.1色度學基礎廣泛使用的模型:面向機器(如顯示器、攝像機、打印機等)的RGB模型面向顏色處理(也面向人眼視覺)的HSI(或HSV)模型(1)RGB模型(面向硬件設備的彩色模型)顏色模型三基色比例相加混色C=R(R)+G(G)+B(B)RGB000黑色001藍色010綠色011青色100紅色101品紅110黃色111白色R=G=B灰色表2.1三基色相加混色表2.1色度學基礎顏色模型人眼感受顏色:色調(diào)(hue)、飽和度(saturation)和亮度(Intensity/Lightness)色調(diào)(H):由顏色所在光譜中的波長決定,表示顏色的種類;顏色“質(zhì)”的特征飽和度(S):取決于顏色中混入白光的數(shù)量,表示顏色的深淺;

混入的白光數(shù)量越多,其飽和度越高,顏色越鮮艷。亮度(I):取決于顏色的光強度,表征顏色的明亮程度;是顏色“量”的特征(2)HSI(或HSV)模型美國色彩學家孟塞爾(H.A.Munseu)于1915年提出,反映了人的視覺系統(tǒng)感知彩色的方式2.1色度學基礎思考:如果你會如何描述一種顏色?“這是什么顏色?深淺如何?明暗如何?”2.1色度學基礎顏色模型飽和度越大,顏色看起來越鮮艷(中心軸為灰色)HSI模型完全反映了人類感知顏色的基本屬性:H和S分量與人感知顏色的特性一一對應,I分量與圖像的彩色信息無關,在處理彩色圖像時,可僅處理Ⅰ分量,結果不改變原圖像中的彩色種類。HSI模型被廣泛應用于以人的視覺系統(tǒng)感知顏色的圖像表示和處理系統(tǒng)中。(2)HSI(或HSV)模型拓展學習:孟塞爾色彩標定方法顏色模型轉換(1)RGB

HSI轉換2.1色度學基礎將R、G、B分量歸一化到[0,1]范圍內(nèi)后,按如下公式轉換:顏色模型轉換(2)

HSI

RGB轉換2.1色度學基礎設S、I分量的值在[0,1]內(nèi),R、G、B分量的值也在[0,1]內(nèi):顏色模型轉換為什么需要轉換?2.1色度學基礎如果直接對RGB模型中的R、G和B分別進行處理,很可能會引起三個量不同程度的變化,引起色差或失真。HSI模型使得在保持色彩無失真的情況下實現(xiàn)圖像處理成為可能。I分量與圖像的彩色信息無關;H和S分量與人感受顏色的方式緊密相聯(lián)的。為什么HSI模型可以保證色彩無失真?圖2.常見彩色圖像處理流程

思考題:1、如何表示圖像中一點的彩色值?

在常用的顏色空間中,哪個顏色空間最接近人的視覺系統(tǒng)的特點?用顏色三維空間中的一個點來表示,每個點有三個分量,不同的顏色空間各分量的含義不同。大量應用的是HSI模型,這個模型是由色度(H),飽和度(S),亮度(I)三個分量組成的,與人的視覺特性比較接近。該模型重要性在于:一方面消除了亮度成分I在圖像中與顏色信息的聯(lián)系,另一方面色調(diào)H和飽和度S分量與人的視覺感受密切相關?;谌说囊曈X系統(tǒng)的顏色感覺特性,使HSI模型成為一個研究圖像處理的重要工具。HSI模型由色度(H),飽和度(S),亮度(I)三個分量組成的,與人的視覺特性比較接近。色調(diào)(H)表示顏色的種類,用角度來標定,用-180~180或0~360度量。飽和度(S)表示顏色的深淺,在徑向方向上的用離開中心線的距離表示。用百分比來度量,從0%到完全飽和的100%。亮度(I)表示顏色的明亮程度,用垂直軸表示。也通常用百分比度量,從0%(黑)到100%(白)。2、色調(diào)、色飽和度和亮度的定義是什么?在表征圖像一點顏色時,各起什么作用?張宇寧?第二章數(shù)字圖像處理基礎2.1色度學基礎2.2圖像的數(shù)字化技術2.3像素的基本關系2.4圖像質(zhì)量評價2.2圖像的數(shù)字化技術圖像的數(shù)學模型(矩陣表示)2.2圖像的數(shù)字化技術圖像的數(shù)學模型2.2圖像的數(shù)字化技術圖像的數(shù)學模型數(shù)字圖像中的像素與二維矩陣中的每個元素圖像的采樣(空間)常用辦法:對f(x,y)進行均勻采樣,取得各點的亮度值,構成一個離散函數(shù)f(i,j)。奈奎斯特定理?采樣率fs必須大于被測信號感興趣最高頻率分量的兩倍。2.2圖像的數(shù)字化技術圖像的采樣(空間)奈奎斯特定理2.2圖像的數(shù)字化技術s(x)是由多個正弦信號疊加構成的波型函數(shù)數(shù)字通信的引路人采樣率fs必須大于被測信號感興趣最高頻率分量的兩倍。根據(jù)一維采樣定理,若一維信號g(t)的最大頻率為w,以()為間隔進行采樣,則能夠根據(jù)采樣結果g(iT)(i=…,-1,0,1,…)完全恢復g(t)。T≤1/2wT≤wT≥1/2wT≥wABCD提交單選題1分圖像的采樣2.2圖像的數(shù)字化技術圖像的量化(灰度)M*N個采樣點,每個像素量化后的灰度二進制位數(shù)為Q,一般Q總是取為2的整數(shù)冪,即Q=2k,則存儲一幅數(shù)字圖像所需的二進制位數(shù)b為:字節(jié)數(shù):2.2圖像的數(shù)字化技術圖像的量化(灰度)2.2圖像的數(shù)字化技術像素鄰域2.3像素的基本關系ND(p)N8(p)N4(p)鄰接性、連通性、區(qū)域和邊界鄰接性:

滿足某一個灰度相似性定義的兩個像素p和q是否具有相鄰關系中的一種。p和q同屬于C,當q處在p的4鄰域中時,則它們?yōu)?鄰接;當q處在p的8鄰域或對角鄰域中,稱它們?yōu)?鄰接,或對角鄰接。2.3像素的基本關系第二章數(shù)字圖像處理基礎2.1色度學基礎2.2圖像的數(shù)字化技術2.3像素的基本關系2.4圖像質(zhì)量評價鄰接性、連通性、區(qū)域和邊界m-鄰接性(滿足下列條件之一即可):(1)q在p的4鄰域中

(2)

q在p的對角鄰域中且p的4鄰域和q的4鄰域的交集為空集,

(即交集中不存在屬于集合C的像素)在不同的灰度集合定義下,圖像中兩個像素的鄰接關系可能不一樣2.3像素的基本關系集合C={2}時,點p(1,1)和q(2,2)是m鄰接嗎?是否AB提交單選題1分集合C={1,2}時,點p(1,1)和q(2,2)是m鄰接嗎?是否AB提交單選題1分點n(1,2)和p、q的關系是m鄰接嗎?是否AB提交可為此題添加文本、圖片、公式等解析,且需將內(nèi)容全部放在本區(qū)域內(nèi)。點n是在p、q的4鄰域中,符合第一種m鄰接的定義答案解析單選題1分鄰接性、連通性、區(qū)域和邊界m-鄰接性

為什么要引入m鄰接的定義??討論:當集合C={1,2}時,(1)考慮8鄰接關系時,坐標點s到點q的通路是否唯一?(2)考慮m鄰接關系時,坐標點s到點q的通路是否唯一?s->t->n->qm鄰接消除8鄰接的二義性2.3像素的基本關系鄰接性、連通性、區(qū)域和邊界連通性點p(x1,y1)的像素與點q(x2,y2)的像素按某種鄰接關系存在一條連通的路徑連通性需要根據(jù)鄰接關系來確定由p到q的路徑:由點p到q所經(jīng)歷的路徑的像素點序列路徑的長度:從p點出發(fā)沿路徑到q點所需走的步數(shù)分析:4鄰域和8鄰域情況下,點p和q是否連通?2.3像素的基本關系鄰接性、連通性、區(qū)域和邊界區(qū)域和邊界區(qū)域:連通的像素點所組成的點的集合邊界點:區(qū)域中的某一像素,如果存在某一個鄰域不屬于這一區(qū)域內(nèi)邊界:一個區(qū)域的所有邊界點組成該區(qū)域的邊界,這些邊界點在區(qū)域內(nèi)外邊界:邊界點并不在當前考慮區(qū)域內(nèi),但有一個鄰域屬于當前區(qū)域區(qū)域也分為4連通區(qū)域和8連通區(qū)域2.3像素的基本關系鄰接性、連通性、區(qū)域和邊界區(qū)域和邊界邊緣(edge)和邊界(border)。邊緣:灰度值存在差異的地方,通常指相鄰像素之間的灰度值差大于某一個閾值邊緣不一定是閉合輪廓,邊界是閉合的輪廓2.3像素的基本關系距離度量給定3個點p(x,y)、q(s,t)、r(u,v),若滿足以下三個基本條件,則度量函數(shù)D稱為距離2.3像素的基本關系非負性與起始點無關直線距離最短(1)歐式距離:(2)城市距離:(3)棋盤距離:(a)歐式距離

(b)城市距離

(c)棋盤距離常見距離度量2.3像素的基本關系如下圖像子集:(1)在圖中畫出V={0,1}時的p到q的最短m-連接通路,(2)計算p到q的歐式距離、城市距離和棋盤距離。作答可為此題添加文本、圖片、公式等解析,且需將內(nèi)容全部放在本區(qū)域內(nèi)。(1)最短m-連接通路(2)答案解析主觀題10分第二章數(shù)字圖像處理基礎2.1色度學基礎2.2圖像的數(shù)字化技術2.3像素的基本關系2.4圖像質(zhì)量評價圖像質(zhì)量的主觀評價(最普通和最可靠的評價)兩種:絕對方式和比較方式2.4圖像質(zhì)量評價絕對方式:讓觀察者觀看一幅圖像,按照預先規(guī)定的評定標準判斷圖像質(zhì)量。

有時給觀察者配備一套標準參考圖像,以便評定時進行主觀校準;

但有時,觀察者不得不只根據(jù)以往的觀察經(jīng)驗判斷。質(zhì)量尺度妨礙尺度5分絲毫看不出圖像質(zhì)量變壞5分非常好4分能看出來圖像質(zhì)量變化但不妨礙觀看4分好3分清楚看出圖像質(zhì)量變壞,對觀看稍有妨礙3分一般2分對觀看有妨礙2分差1分非常嚴重的妨礙觀看1分非常差表

絕對評價尺度圖像質(zhì)量的主觀評價(最普通和最可靠的評價)2.4圖像質(zhì)量評價比較方式:請觀察者評定一套圖像,比較某一特定圖組中圖像的優(yōu)劣。分值相對評價尺度絕對評價尺度5分該群中最好非常好4分好于該群中平均水平好3分該群中的平均水平一般2分差于該群中的平均水平差1分該群中最差非常差表2.3相對評價尺度與絕對評價尺度對比圖像質(zhì)量的主觀評價(最普通和最可靠的評價)2.4圖像質(zhì)量評價優(yōu)點:真實的反映圖像直觀質(zhì)量,評價結果可靠,無技術障礙。缺點:主觀測試受被測圖像的類別以及試驗觀測條件的影響;

評價結果易受觀察者的知識背景、心理變化、觀測動機等因素影響;

依賴人眼視覺系統(tǒng),難以找到合適的數(shù)學模型描述;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論