機器視覺技術及應用 課件 任務1 圖像表達及其性質(zhì)_第1頁
機器視覺技術及應用 課件 任務1 圖像表達及其性質(zhì)_第2頁
機器視覺技術及應用 課件 任務1 圖像表達及其性質(zhì)_第3頁
機器視覺技術及應用 課件 任務1 圖像表達及其性質(zhì)_第4頁
機器視覺技術及應用 課件 任務1 圖像表達及其性質(zhì)_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

圖像表達及其性質(zhì)2.1.1像素與灰度圖像數(shù)字化主要是指空間位置的離散數(shù)字化和亮度電平值的離散數(shù)字化。圖像的數(shù)字化過程中關鍵的步驟就是采樣和量化。圖像采樣是對連續(xù)圖像在一個空間點陣上取樣,也就是空間位置上的數(shù)字化、離散化。原理如圖所示,其中M和N是點陣的列數(shù)和行數(shù),M、N的大小關系采樣后圖像質(zhì)量的高低,合適的M和N能使數(shù)字化的圖像損失最小。M和N的取值并不是隨意確定的,它首先要滿足奈奎斯特采樣定理,使得采樣的數(shù)據(jù)能不失真地反映原始圖像信息。通常所說的圖像空間分辨率表示的就是用多少個點來描述一張圖像,為了使采樣后的圖像保留更多的細節(jié)和更高的分辨率,人們希望使用更密集的空間像素點陣。也就是增加采樣頻率,即增加M和N,但采樣頻率越高圖像的數(shù)據(jù)量就越大,數(shù)字圖像的成本也隨之提高。一般說來,采樣間隔越大,所得圖像像素越少,圖像的空間分辨率低,可觀察到的原始圖像細節(jié)就越少,圖像質(zhì)量變差,嚴重時出現(xiàn)像素呈塊狀的棋盤效應;采樣間隔越小,所得圖像像素越多,則圖像就越細膩逼真,圖像空間分辨率就高,但數(shù)據(jù)量也隨之增大。如圖顯示的就是同一幅圖像在不同采樣頻率下的結(jié)果,從圖(a)到圖(f)是采樣間隔遞增獲得的圖像,在圖(b)中帽檐處已呈鋸齒狀,在圖(c)中這種現(xiàn)象更加明顯,頭發(fā)已變得不清晰,圖(e)已經(jīng)分不出人臉了,而圖(f)幾乎喪失了原圖像的所有信息??梢姴蓸娱g隔和圖像的光滑程度,質(zhì)量高低之間有密切關系。像素一般是指由圖像的小方格組成的,這些小方塊都有一個明確的位置和被分配的色彩數(shù)值,小方格顏色和位置就決定該圖像所呈現(xiàn)出來的樣子??梢詫⑾袼匾暈檎麄€圖像中不可分割的單位或者是元素。不可分割的意思是它不能夠再切割成更小單位或是元素,它是以一個單一顏色的小格存在。每一個點陣圖像包含了一定量的像素,這些像素決定圖像在屏幕上所呈現(xiàn)的大小。

如圖所示說明了減少圖像的量化級別(灰度級)所產(chǎn)生的效果。保持空間分辨率即采樣頻率不變,將灰度級較少為128,如圖(b)所示,肉眼很難看出有什么變化。如果進一步將灰度級減少為16,如圖(c)所示,此時在灰度緩變區(qū)會出現(xiàn)一些幾乎看不出來的非常細的山脊狀結(jié)構(gòu),這種效應稱為虛假輪廓,它是由于在數(shù)字圖像的灰度平滑區(qū)使用的灰度級不夠而造成的。圖(d)、(e)、(f)的灰度級逐漸減小為8、4、2,可以看到圖像的質(zhì)量越來越差??偟膩碚f,量化等級越多,所得圖像層次越豐富,灰度分辨率越好,質(zhì)量越好,但數(shù)據(jù)量比較大;量化等級少,圖像層次欠豐富,灰度分辨率差,但數(shù)據(jù)量小。2.1.2圖像1.圖像信號圖像按其亮度等級的不同,可以分成二值圖像(只有黑白兩種亮度等級)和灰度圖像(有多種亮度等級)兩種。按其色調(diào)不同.可分為無色調(diào)的灰度(黑白)圖像和有色調(diào)的彩色圖像兩種。按其內(nèi)容的變化性質(zhì)不同,有靜態(tài)圖像和活動圖像之分。而按其所占空間的維數(shù)不同,又可分為平面的二維圖像和立體的三維圖像等。2.模擬視頻信號根據(jù)三基色原理,利用R(紅)、G(綠)、B(藍)三色不同比例的混合可以表示各種色彩。攝像機在拍攝時,通過光敏器件(如CCD,電荷耦合器件),將光信號轉(zhuǎn)換為RGB三基色電信號。在電視機或監(jiān)視器內(nèi)部,最終也是使用RGB信號分別控制撞擊熒光屏的電子流,或液晶顯示屏的驅(qū)動電路使其發(fā)光產(chǎn)生影像。3.數(shù)字圖像的主要類型按數(shù)字圖像信息表示方式的不同,可以將數(shù)字圖像分為矢量圖(VectorBasedImage)和位圖(MappedImage)。矢量圖是用一系列計算指令來表示一幅圖,如畫點、畫線、畫曲線、畫矩形等。這種方式實際上是用一個數(shù)學表達式來描述一幅圖,然后通過編程來實現(xiàn)。矢量圖像文件數(shù)據(jù)量小,圖像進行縮小、放大時不會失真,目標圖像的移動、復制和旋轉(zhuǎn)都可以很容易做到。然而,對于構(gòu)造成分復雜的圖像,如自然風景等,就很難用數(shù)學表達式來表達了。位圖是指由一系列像素構(gòu)成的圖像,每個像素是由亮度、色度等參數(shù)數(shù)據(jù)來描述,位圖在數(shù)字圖像處理中得到廣泛應用。矢量圖和位圖最大的區(qū)別就是矢量圖處理的對象是由數(shù)學表達式描述的形狀,而位圖處理的對象是像素。按圖像攜帶的視覺信息類型不同,可以將數(shù)字圖像分為灰度圖像和彩色圖像。灰度圖像只包含了亮度信息而沒有色彩信息。灰度圖像又可以根據(jù)灰度等級的數(shù)目劃分為單色圖和灰度圖:單色圖的每個像素只用1位表示,要么為1,要么為0,即圖像只有兩種顏色;灰度圖的每個像素用1個字節(jié)表示,灰度等級為28=256級。彩色圖像除了亮度信息之外還包括了色彩信息。根據(jù)顏色數(shù)目的不同,彩色圖可分為256色圖像和真彩色圖像,用真彩色表示的圖像文件很大,需要較大的存儲空間和傳輸空間。

5.數(shù)字圖像的主要研究內(nèi)容數(shù)字圖像處理所包括的內(nèi)容很廣泛,從研究目的來講大致可以分為圖像預處理和圖像分析兩大類。圖像預處理通常是為了改善圖像的質(zhì)量,使圖像中的某部分信息更加突出,以滿足某種應用的需要;圖像分析則是從圖像中提取有用信息,實現(xiàn)應用的過程,具體包括的內(nèi)容有以下幾個方面:(1)圖像變換圖像變換的方法包括傅里葉變換,沃爾什變換、離散余弦變換,小波變換等,圖像從空間域轉(zhuǎn)換到變換域后,不僅可以減少計算量,而且可以獲得更加有效的處理。例如小波變換在頻域具有良好的局部化特征,在圖像編碼、圖像融合中獲得了廣泛而有效的應用。(2)圖像增強由于成像系統(tǒng)是個高度復雜的系統(tǒng),圖像在產(chǎn)生和傳輸?shù)倪^程中總會受到各種干擾而產(chǎn)生畸變和噪聲,使得圖像質(zhì)量下降,而圖像增強正是為了提高圖像的質(zhì)量,如抑制噪聲,提高對比度,邊緣銳化等,以便于觀察、識別和進一步的分析處理。增強后的圖像與原圖像不再一致,也許會損失一些有用信息,但如果這些信息是人眼無法感知的,這樣的處理就是合理的。(3)圖像復原大氣湍流、攝像機與被攝物體之間的相對運動都會造成圖像的模糊,圖像復原是指把退化、模糊了的圖像盡可能的恢復到原圖像的模樣,它要求對圖像退化的原因有所了解,建立相應的“退化模型”,再采用某種濾波方法,恢復或重建原來的圖像。(4)圖像編碼與壓縮圖像編碼壓縮技術主要是利用圖像信號的統(tǒng)計特性和人類視覺的生理學及心理學特性,對圖像信號進行編碼,有效減少描述圖像的冗余數(shù)據(jù)量,以便于圖像傳輸、存儲和處理。壓縮技術在日常的生活中隨處可見,如許多視頻文件都采用了MPEG-4技術進行壓縮,在滿足一定保真度的前提下,大大減小了存儲空間,網(wǎng)絡上的JPEG文件也都采取了壓縮編碼技術,減小了文件的字節(jié)數(shù)從而有利于在網(wǎng)絡上的傳輸。(5)圖像分割圖像分割是將感興趣的目標從背景中分離出來,便于提取出目標的特征和屬性,進行目標識別,為最終的決策提供依據(jù)。圖像自動分割是圖像處理領域中的難題,人類視覺系統(tǒng)能夠?qū)⑺^察的復雜場景中的對象一一分開,并識別出每個物體,但利用計算機進行分割往往還需要人工提供必需的信息才能實現(xiàn)。2.1.3色彩空間“色彩空間”一詞源于英文“ColorSpace”,又稱為“色域”。色彩學中,人們建立了多種色彩模型,以一維、二維、三維甚至四維空間坐標來表示某一色彩,這種坐標系統(tǒng)所能定義的色彩范圍即色彩空間。為了科學地定量描述和使用顏色,人們提出了各種顏色模型。最常見的是RGB模型,它主要面向諸如視頻監(jiān)視器、彩色攝像機或打印機之類的硬件設備;另一種常用模型是HSI模型,它主要面向以彩色處理為目的的應用,如動畫中的彩色圖形。另外,在印刷工業(yè)和電視信號傳輸中,經(jīng)常使用CMYK和YUV色彩系統(tǒng)。1.RGB顏色模型RGB顏色模型是由國際照明委員會(CIE)制定的。如圖所示,RGB顏色模型就是三維直角坐標顏色系統(tǒng)的一個單位正方體,原點為黑色,距離原點最遠的頂點(1,1,1)對應的顏色為白色,兩個點之間的連線是正方體的主對角線,從黑到白的灰度值分布在主對角線線上,該線稱為灰色線。正方體的其他六個角點分別為紅、黃、綠、青、藍和品紅。在三維空間的任一點都表示一種顏色,這個點有三個分量,分別對應了該點顏色的紅、綠、藍亮度值。RGB顏色模型稱為與設備相關的顏色模型,不同的掃描儀掃描同一幅圖像,會得到不同顏色的圖像數(shù)據(jù);不同型號的顯示器顯示同一幅圖像,也會有不同的顏色顯示結(jié)果。這是因為顯示器和掃描儀使用的RGB模型與CIERGB真實三原色表示系統(tǒng)空間是不同的,后者是與設備無關的顏色模型。2.HSI顏色模型HSI模型反映了人的視覺系統(tǒng)觀察彩色的方式,其中,H表示色調(diào)(Hue),S表示飽和度(Saturation),I表示明度(Intensity)。人的視覺系統(tǒng)經(jīng)常采用HSI模型,它比RGB顏色模型更符合人的視覺特性。HSI模型的三個屬性定義了一個三維柱形空間,如圖所示?;叶汝幱把刂S線從底部的黑變到頂部的白,具有最高亮度。最大飽和度的顏色位于圓柱上頂面的圓周上。HSI顏色模型和RGB模型只是同一種物理量的不同表示法,因此它們之間存在著轉(zhuǎn)換關系。對任何3個[0,1]范圍內(nèi)的R,G、B值都可以用下面的公式轉(zhuǎn)換為對應HSI模型中的I、S、H分量:由上式計算得到的H值應該是一個位于[0。,360。]之間的數(shù),若S=0時對應的是無色彩的中心點,此時H值沒有意義,定義為0。當I=0時,S也沒有意義。3.CMYK顏色模型彩色印刷或彩色打印的紙張是不能發(fā)射光線的,因而印刷機或打印機就只能用一些能夠吸收特定的光波來反射其他光波的油墨或顏料。油墨或顏料的三基色是青色(Cyan),品紅(Magenta)和黃色(Yellow),簡稱為CMY,這三基色能夠合成吸收所有顏色并產(chǎn)生黑色。實際上因為所有打印油墨都會包含一些雜質(zhì),這三種油墨混合實際上生成的是土灰色,必須與黑色油墨(Blackink)混合才能產(chǎn)生真正的黑色,所以這種顏色模型稱為CMYK。CMYK模型被稱為減色模型,是因為它減少了為視覺系統(tǒng)識別顏色所需要的反射光。CMYK空間正好與RGB空間互補,即用白色減去RGB空間中的某一顏色值就等于同樣顏色在CMYK空間中的值。4.YUV顏色模型在現(xiàn)代彩色電視系統(tǒng)中,通常采用彩色CCD攝像機,它把得到的彩色圖像信號,經(jīng)分色、分別放大校正得到RGB,再經(jīng)過矩陣變換電路得到亮度信號Y和兩個色差信號R-Y、B-Y,最后發(fā)送端將亮度和色差三個信號分別進行編碼,用同一信道發(fā)送出去,這就是常用的YUV顏色空間。采用YUV顏色模型的重要性是它的亮度信號Y和色度信號U、V是分離的。如果只有Y信號分量而沒有U、V分量,那么這樣表示的圖就是黑白灰度圖。彩色電視采用YUV空間正是為了用亮度信號Y解決彩色電視機和黑白電視機的兼容問題,使黑白電視機也能接收彩色信號。2.1.4圖像存儲

圖像存儲格式一般分為以下幾種。(1)BMP格式BMP圖像文件最早應用于微軟公司推出的MicrosoftWindows系統(tǒng),是一種MS-windows標準的位圖圖像文件格式。此格式由于在存儲過程中幾乎不進行壓縮,因此包含的圖像信息非常豐富。該文件格式支持RGB、索引顏色、灰度和位圖色彩模式,還支持l~32位的格式,其中對于4~8位的圖像使用RLE(行程長度編碼),這種壓縮方案不會損失數(shù)據(jù)。它最大的缺點就是要占用大量的存儲空間。(2)GIF格式GIF(GraphicInterchangeFormat圖形交換格式)是由CompuServer公司設計的。該格式是在因特網(wǎng)上應用最廣的圖像文件格式之一。GIF格式的最大特點是壓縮比高,文件占用存儲空間較小。該格式由于受到8位存儲格式的限制,因此要求圖像中顏色的數(shù)量減少到256或更少,這是縮小文件大小、減少占用存儲空間的一個主要因素。因為該格式存儲的圖像中顏色數(shù)量少。所以GIF格式通常用于沒有太多顏色過渡的圖像,只有索引色和灰度圖像可以保存為GIF格式。雖然該格式受到存儲格式的限制,但這種限制在傳輸速度至關重要的媒體中十分有利。(3)JPG/JPEG格式JPG/JPEG格式是由JointPhotographicExpertsGroup(聯(lián)合圖像專家組)開發(fā)的一種常見的圖像文件格式,是目前網(wǎng)絡可以支持的圖像文件格式之一。實際上JPG/JPEG并不是一種格式,確切地說是一種位圖圖像壓縮算法,其他一些文件格式如PICT格式和EPS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論