版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第二章多媒體信息的處理任務(wù)2.1音頻信號噪聲檢測及噪聲去除任務(wù)2.2顏色空間模型及轉(zhuǎn)換任務(wù)2.3車牌圖像的預(yù)處理任務(wù)2.4霧霾圖像的增強(qiáng)處理
任務(wù)2.1音頻信號噪聲檢測及噪聲去除
【學(xué)習(xí)目標(biāo)】
(1)了解噪聲的分類及產(chǎn)生方法。
(2)掌握音頻信號中噪聲的檢測方法及其原理圖。
(3)掌握MATLAB語言中音頻數(shù)據(jù)與信息的讀取、處理方法。
(4)掌握信號頻譜的繪制。
(5)結(jié)合具體應(yīng)用,掌握音頻信號噪聲去除的典型方法及其特點(diǎn)。
【任務(wù)分析】
(1)理解噪聲產(chǎn)生的原理。
(2)分析并掌握噪聲檢測的系統(tǒng)框圖、硬件結(jié)構(gòu)設(shè)計及軟件結(jié)構(gòu)設(shè)計。
(3)繪制出原始音頻信號一個聲道的時域圖和頻譜圖;繪制出加噪聲后混合信號同一聲道的時域圖和頻譜圖;繪制出濾波后音頻信號同一聲道的時域圖和頻譜圖。
(4)掌握音頻信號噪聲去除的方法,并了解每一種方法的工作原理及實現(xiàn)思路。
(5)能夠畫出每種去噪方法的實現(xiàn)流程圖。2.1.1噪聲的分類方式噪聲的物理學(xué)概念是指無規(guī)律的不具周期性特征的聲響,衛(wèi)生學(xué)概念泛指干擾睡眠休息和交談思考,給人以煩惱的感受,造成聽覺危害的一切聲響。因此可按噪聲源的物理特性、時間特性以及頻率成分分布等方式進(jìn)行分類。2.1.2語音信號的時域與頻域分析1.信號的特點(diǎn)(1)在頻域內(nèi)。語音信號的頻譜分量主要集中在300~3400Hz的范圍內(nèi)。利用這個特點(diǎn),可以用一個防混迭的帶通濾波器將此范圍內(nèi)的語音信號頻率分量取出,然后按一定的采樣率對語音信號進(jìn)行采樣,就可以得到離散的語音信號。(2)在時域內(nèi)。語音信號具有“短時性”的特點(diǎn),即在總體上,語音信號的特征是隨著時間的變化而變化的,但在一段較短的時間間隔內(nèi)會保持平穩(wěn)。語音信號在濁音段表現(xiàn)出周期信號的特征,在清音段表現(xiàn)出隨機(jī)噪聲的特征。2.語音信號的時域分析1)窗口的選擇在5~50ms的范圍內(nèi),語音頻譜特性和一些物理特性參數(shù)基本保持不變。我們將每個短時的語音稱為一個分析幀。一般幀長取10~30ms。采用一個長度有限的窗函數(shù)來截取語音信號形成分析幀,通常會采用矩形窗和漢明窗。在語音頻譜分析時常使用漢明窗,在計算短時能量和平均幅度時通常使用矩形窗。2)短時能量由于語音信號的能量隨時間變化,清音和濁音之間的能量差別相當(dāng)顯著。因此對語音的短時能量進(jìn)行分析,可以描述語音的這種特征變化情況。定義短時能量為短時能量函數(shù)可用于區(qū)分清音段與濁音段,En值大對應(yīng)于濁音段,En值小對應(yīng)于清音段;還可用于區(qū)分濁音變?yōu)榍逡艋蚯逡糇優(yōu)闈嵋舻臅r間;對高信噪比的語音信號,也可以用來區(qū)分有無語音。無信號時,En值很小,有語音信號時,能量顯著增大。過零率可以反映信號的頻譜特性。當(dāng)離散時間信號相鄰兩個樣點(diǎn)的正負(fù)號相異時,稱之為“過零”,即此時信號的時間波形穿過了零電平的橫軸。統(tǒng)計單位時間內(nèi)樣點(diǎn)值改變符號的次數(shù)就可以得到平均過零率。自相關(guān)函數(shù)用于衡量信號自身時間波形的相似性。清音和濁音的發(fā)聲機(jī)理不同,因而在波形上也存在著較大的差異。濁音的時間波形呈現(xiàn)出一定的周期性,波形之間相似性較好;清音的時間波形呈現(xiàn)出隨機(jī)噪聲的特性,樣點(diǎn)間的相似性較差。因此,一般用短時自相關(guān)函數(shù)來測定語音的相似特性。短時自相關(guān)函數(shù)定義為令m=n+m,并且ω(-m)=ω(m),可得3)時域分析方法的應(yīng)用(1)可用于基音頻率的估計。首先可利用時域分析(短時能量、短時過零率、短時自相關(guān))方法的某一個特征或某幾個特征的結(jié)合,判定某一語音有效的清音和濁音段;其次,針對濁音段,可直接利用短時自相關(guān)函數(shù)估計基音頻率,其方法是:先估算濁音段第一最大峰的位置,再利用抽樣率計算基音頻率。(2)可用于語音端點(diǎn)的檢測與估計。可利用時域分析方法的某一個特征或某幾個特征的結(jié)合,判定某一語音信號的端點(diǎn),尤其在有噪聲干擾時,如何準(zhǔn)確檢測語音信號的端點(diǎn),在語音處理中是富有挑戰(zhàn)性的一個課題。3.語音信號的頻域分析1)短時傅里葉變換由于語音信號是短時平穩(wěn)的隨機(jī)信號,某一語音信號幀的短時傅里葉變換的定義為式中,令n-m=k′,則得到于是可以得到短時傅里葉變換有兩個變量:n和ω,所以它既是時序n的離散函數(shù),又是角頻率ω的連續(xù)函數(shù)。與離散傅里葉變換逼近傅里葉變換一樣,如令ω=2πk/N,則得離散的短時傅里葉變換如下:2)語譜圖語譜圖的水平方向是時間軸,垂直方向是頻率軸,圖上的灰度條紋代表各個時刻的語音短時譜。語譜圖反映了語音信號的動態(tài)頻率特性,在語音分析中具有重要的實用價值,被視為可視語言。語譜圖的時間分辨率和頻率分辨率是由窗函數(shù)的特性決定的。時間辨率高,可以看出時間波形的每個周期及共振峰隨時間的變化,但頻率分辨率低,不足以分辨由于激勵所形成的細(xì)微結(jié)構(gòu),稱為寬帶語譜圖;而窄帶語譜圖正好與之相反。寬帶語譜圖可以獲得較高的時間分辨率,清晰地顯示共振峰結(jié)構(gòu)和語譜包絡(luò),反映頻譜的快速時變過程;窄帶語譜圖可以清晰地顯示諧波的結(jié)構(gòu),反映基頻的時變過程,反映頻譜的精細(xì)結(jié)構(gòu)。兩者相結(jié)合,可以提供與語音信號相關(guān)的特性。語譜圖上因其不同的灰度,形成不同的紋路,稱之為“聲紋”。聲紋因人而異,因此在司法安全等場合得到應(yīng)用。3)復(fù)倒譜和倒譜復(fù)倒譜是x(n)的Z變換取對數(shù)后的逆Z變換,其表達(dá)式如下:倒譜c(n)定義為:對x(n)取Z變換后的幅度求對數(shù),再取逆Z變換,即在時域上,語音產(chǎn)生模型實際上是一個激勵信號與聲道沖激響應(yīng)的卷積。對于濁音,激勵信號可以由周期脈沖序列表示;對于清音,激勵信號可以由隨機(jī)噪聲序列表示。聲道系統(tǒng)相當(dāng)于參數(shù)緩慢變化的零極點(diǎn)線性濾波器。這樣經(jīng)過同態(tài)處理后,語音信號的復(fù)倒譜、激勵信號的復(fù)倒譜、聲道系統(tǒng)的復(fù)倒譜之間滿足下面的關(guān)系:由于倒譜對應(yīng)于復(fù)倒譜的偶部,因此倒譜與復(fù)倒譜具有同樣的特點(diǎn),由復(fù)倒譜很容易知道語音信號的倒譜,激勵信號的倒譜以及聲道系統(tǒng)的倒譜之間滿足下面的關(guān)系:4)基因周期估計濁音信號的倒譜中存在峰值,它的出現(xiàn)位置等于該語音段的基音周期,而清音的倒譜中則不存在峰值。利用倒譜的這個特點(diǎn),可以進(jìn)行語音的清濁音判決,并且可以估計濁音的基音周期。首先計算語音的倒譜,然后在可能出現(xiàn)的基因周期附近尋找峰值。如果倒譜峰值超過了預(yù)先設(shè)置的門限,則輸入語音判斷為濁音,其峰值位置就是基因周期的估計值;反之,如果沒有超出門限的峰值,則輸入語音為清音。5)共振峰估計對倒譜進(jìn)行濾波,取出低時間部分進(jìn)行逆特征系統(tǒng)處理,可以得到一個平滑的對數(shù)譜函數(shù),這個對數(shù)譜函數(shù)顯示了輸入語音段的共振峰結(jié)構(gòu),同時譜的峰值對應(yīng)于共振峰頻率。通過此對數(shù)譜進(jìn)行峰值檢測,從而可以估計出前幾個共振峰的頻率和強(qiáng)度。對于濁音的聲道特性,可以采用前三個共振峰來描述;清音不具備共振峰特點(diǎn)。2.1.3噪聲檢測系統(tǒng)的設(shè)計根據(jù)對噪聲檢測系統(tǒng)的分析,確定噪聲硬件系統(tǒng)主要可由傳聲器、功率放大電路、交直流轉(zhuǎn)換電路、V/F變換電路、單片機(jī)和液晶顯示系統(tǒng)構(gòu)成。傳聲器俗稱“麥克風(fēng)”,是聲電轉(zhuǎn)換器件,在此硬件系統(tǒng)中占重要地位。其原理主要是:傳感器的振動膜受到聲波作用而振動,進(jìn)而轉(zhuǎn)換為電信號。此次設(shè)計使用咪頭作為傳聲器,咪頭主要利用膜片一面來感受聲壓,完成聲音信號的采集并轉(zhuǎn)換成信號。其他各電路或系統(tǒng)的設(shè)計詳細(xì)介紹如下。進(jìn)行功率放大以滿足設(shè)計要求。1.功率放大電路的設(shè)計功率放大電路主要由LM386構(gòu)成,其作用是對聲音信號進(jìn)行功率放大以滿足設(shè)計要求。2.交直流轉(zhuǎn)換電路的設(shè)計交直流轉(zhuǎn)換電路主要由AD536A構(gòu)成,其作用是完成電信號由交流到直流的轉(zhuǎn)換。AD536A可直接計算任何復(fù)雜輸入波形的均方值,并且測量誤差大小。當(dāng)輸入電壓為正時,CMIN輸出高電平,RS觸發(fā)器置位,輸出驅(qū)動管導(dǎo)通,F(xiàn)OUT輸出邏輯低電平。同時,當(dāng)C16兩端電壓大于VCC的2/3時,定時比較器輸出一高電平,使RS復(fù)位,輸出驅(qū)動管截止,F(xiàn)OUT輸出邏輯高電平。同時,C16放電,C10對電阻R8放電,當(dāng)C10所放電壓與輸入電壓相等時,CMIN輸出高電平。如此就構(gòu)成了電壓頻率轉(zhuǎn)換電路。4.單片機(jī)的設(shè)計單片機(jī)集成了CPU、存儲器、定時/計數(shù)器等功能,所以一直被廣泛應(yīng)用。本次噪聲檢測使用的是AT89C51單片機(jī),其原理簡單,功能易實現(xiàn),是整個系統(tǒng)的核心,其外部引腳與對應(yīng)電路相連,把各個部分的電路連接起來成為一個完整的系統(tǒng),內(nèi)部程序則完成相應(yīng)功能。該單片機(jī)內(nèi)部所帶可編程的FLASH存儲器為4KB,同時還帶有16位的定時/計數(shù)器各一個,程序可擦寫達(dá)幾萬次。這里主要利用單片機(jī)的定時計數(shù)功能,在內(nèi)部裝載軟件程序,根據(jù)在限定時間內(nèi)電壓/頻率傳送來的電平上升沿的計數(shù)值對應(yīng)出分貝值。5.液晶顯示系統(tǒng)的設(shè)計液晶顯示系統(tǒng)由LCD1602構(gòu)成。LCD1602是字符型液晶,1602是指顯示兩行內(nèi)容,每行16個字符。與常用的發(fā)光管和LED數(shù)碼管相比,LCD液晶顯示器畫質(zhì)高且不會閃爍,當(dāng)有信號時,每一個液晶屏上的點(diǎn)都恒定發(fā)光;LCD1602是數(shù)字式接口,便于與單片機(jī)連接,操作方便;芯片本身體積小、重量輕、功耗低。LCD1602用來顯示噪聲的分貝值,通常接+5V的電源,工作電流為2mA。LCD1602分為14腳或16腳,在實際應(yīng)用中兩者并沒差別,其引腳D0~D7是數(shù)據(jù)接口,與單片機(jī)外部P0.0~P0.7引腳對應(yīng)連接。液晶顯示系統(tǒng)通過編程完成顯示分貝值的功能,主要步驟為LCD經(jīng)初始化后延時,根據(jù)規(guī)定時間內(nèi)電平上升沿的統(tǒng)計次數(shù)來對應(yīng)噪聲的分貝值,設(shè)置第一行顯示位置,顯示第一行內(nèi)容,其形式為Noise:dB;設(shè)置第二行顯示位置,顯示第二行內(nèi)容,其形式為Limit:dB。PROTUES仿真時,會具體顯示數(shù)字大小。硬件電路設(shè)計完成后,在焊接前需要在PROTUES軟件上進(jìn)行仿真,仿真成功則說明可以進(jìn)行實際電路的焊接。仿真時首先通過電路連接線把各個部分的電路進(jìn)行連接,在檢查連接無誤后,把噪聲檢測的程序裝入單片機(jī),噪聲信號由信號發(fā)生器代替。2.1.4噪聲檢測系統(tǒng)的軟件設(shè)計噪聲檢測系統(tǒng)的軟件設(shè)計總體框圖如圖。由圖可見,開始后首先設(shè)置SP,8155相當(dāng)于單片機(jī)的擴(kuò)展,然后完成定時器和計數(shù)器的初始化,此時把中斷服務(wù)系統(tǒng)打開,在此期間,讀取計數(shù)器的值。再調(diào)用顯示子系統(tǒng),對噪聲的分貝取一個大致的值。最后分貝值的大小決定了蜂鳴器報警聲音的變大或變小。2.1.5系統(tǒng)的調(diào)試步驟及可能的故障分析硬件系統(tǒng)在焊接完成后要進(jìn)行檢測和調(diào)試,只有這樣才能給軟件調(diào)試提供一個正確的環(huán)境,去除一些硬件錯誤的干擾。硬件調(diào)試和軟件調(diào)試是不可分離的,只有硬件與軟件完美結(jié)合才算是完成了一個系統(tǒng)。系統(tǒng)的調(diào)試分為以下幾個步驟:(1)用電壓法檢查電路中器件的引腳是否焊接正確。(2)用數(shù)字萬用表檢測器件的各引腳是否連接正常。用兩只表筆分別接觸器件的引腳,若萬用表發(fā)出聲音則連接正常。(3)使用KEIL編寫程序,調(diào)試運(yùn)行沒有錯誤后,在硬件仿真時將程序下載到單片機(jī)。(4)連接好各硬件電路,觀察連線和接口是否正確,顯示系統(tǒng)是否正常。通電進(jìn)行觀察,看檢測系統(tǒng)是否正常工作,測量結(jié)果是否與實際相符。在噪聲檢測系統(tǒng)的設(shè)計與實現(xiàn)中可能會出現(xiàn)以下故障:(1)電源電壓錯誤。起初給所有電路提供+5V的電源,但是電壓/頻率轉(zhuǎn)換器輸出端沒有信號輸出,而LM331的工作電壓是+15V,改正后電路可以正常工作,有信號輸出。(2)硬件電路焊接錯誤。在實際焊接中,元器件較小,線路較多,所以容易焊錯。其中可能出現(xiàn)時鐘電路沒有接地,經(jīng)改正后,晶振才可以正常啟動,單片機(jī)也才可以正常工作;LCD顯示結(jié)構(gòu)的顯示完全反了,位選線連接錯誤,改正后會顯示正常。(3)軟件程序編寫錯誤。這會使顯示系統(tǒng)dB顯示錯誤,該故障可能是由于地址分配的問題引起的,可以重新分配地址,使顯示結(jié)果正常顯示。2.1.6去噪算法設(shè)計1.譜減法增強(qiáng)語音和減小噪聲是處理帶噪語音的兩種方法,譜減法是一種增強(qiáng)語音的方法。在假設(shè)噪聲是統(tǒng)計平穩(wěn)且與語音不相關(guān)的前提下,利用短時傅里葉變換在頻域?qū)г胝Z音的功率譜減去估計噪聲的功率譜,得到語音功率譜估計。由于人耳對相位的感覺不是很靈敏,所以可以將原帶噪語音的相位作為處理后信號的相位,只需在得到的幅度估計中插入帶噪語音的相位,再進(jìn)行快速傅里葉逆變換,就可以在時域上得到增強(qiáng)后的語音信號。在降噪算法研究中,噪聲以高斯白噪聲為主要對象,這種噪聲一般符合以下條件:噪聲是加性的;噪聲是平穩(wěn)的;噪聲與語音統(tǒng)計獨(dú)立。2.濾波法要進(jìn)行數(shù)字信號處理通常需要先將接收到的模擬信號經(jīng)過A/D(數(shù)模轉(zhuǎn)換器)進(jìn)行轉(zhuǎn)換,將模擬信號經(jīng)過采樣轉(zhuǎn)換為數(shù)字信號;接著需要保留有用的數(shù)字信號,濾除掉無關(guān)緊要的信號,這就需要用到濾波器,經(jīng)過濾波器的處理后得到一系列數(shù)字序列,然后經(jīng)過(D/A)轉(zhuǎn)換,將數(shù)字序列轉(zhuǎn)換為人們所能接收的模擬信號。3.最小均方算法LMSLMS以最小均方值為準(zhǔn)則,采用迭代計算得到最優(yōu)解。該算法采用的是梯度下降方法,因此不需要計算相關(guān)函數(shù),所以所需程序簡單,且對信道特性變化不敏感,簡單便捷,效果良好,在語音降噪領(lǐng)域應(yīng)用廣泛。出信號在時域幅值有所減小,而從頻域角度看,帶噪語音信號的幅值分布的頻率范圍較大。但帶噪語音經(jīng)過FIR低通濾波器處理后,頻譜主要分布在1500Hz之內(nèi),F(xiàn)IR低通濾波器濾除帶噪語音信號的高頻部分,留下自然的低頻部分,而人發(fā)出的聲音處于低頻段,因此我們可以聽見較為清晰的原聲。但由于高頻部分的語音信號被濾除,使得語音信號聽起來有點(diǎn)低沉、沉悶。利用LMS算法設(shè)計的FIR低通濾波器會根據(jù)輸入信號的統(tǒng)計特性自動調(diào)整自身的參數(shù)以達(dá)到最佳濾波效果。經(jīng)LMS算法處理后的帶噪語音信號的頻譜與原始語音信號的頻譜極為接近,與經(jīng)FIR數(shù)字低通濾波器處理后的語音信號相比,保留了原始語音信號的高頻部分,聽覺上不沉悶,比較悅耳。5.三種降噪算法仿真數(shù)據(jù)分析本次對三種降噪算法的評價主要從主觀和客觀出發(fā)。主觀方法是指通過人的聽覺對語音質(zhì)量有一個大致判斷,即根據(jù)人們的聽覺對處理后語音信號的優(yōu)劣進(jìn)行判斷統(tǒng)計,將降噪處理后的語音信號劃分優(yōu)、良、差三個等級。質(zhì)量優(yōu)表示處理前后的語音聽起來沒有什么差異;質(zhì)量良表示帶噪信號在處理后有明顯改善;質(zhì)量差表示降噪后的信號聽起來有明顯噪聲。客觀方法是指用實際測量的數(shù)據(jù)進(jìn)行評判,即信噪比SNR和對數(shù)譜失真度LSD。SNR越大、LSD越小則表明降噪效果越好。帶噪語音信號經(jīng)過處理后,信噪比都有明顯的改善,對數(shù)譜失真度數(shù)值都較小,說明算法達(dá)到了降噪的目的。三種算法從主觀和客觀兩方面來看,LMS算法在降噪方面性能最好,即處理后的語音信號和純凈語音信號有極小的差別,幾乎分辨不出;FIR低通濾波器降噪效果較好,但由于濾除了帶噪語音信號的高頻部分而使聲音變得低沉;譜減法基本上實現(xiàn)了語音信號的增強(qiáng),但是效果并不明顯,因為除去高斯白噪聲時帶來了音樂噪聲,聽起來會使人疲憊,所以降噪效果一般。2.1.7任務(wù)實施框圖軟件部分主要是C語言程序的設(shè)計,主要分為四個模塊。主程序是軟件系統(tǒng)的核心,處于循環(huán)工作狀態(tài),主要完成定時/計數(shù)器和中斷系統(tǒng)的初始化,并循環(huán)調(diào)用查表和顯示子程序。查表子程序中的內(nèi)容主要是計數(shù)值與噪聲分貝值的對應(yīng),顯示子程序主要是根據(jù)定時內(nèi)電平上升沿的計數(shù)值來確定分貝值并顯示。另外,在硬件部分加防風(fēng)防雨保護(hù)措施后可以用于室外的測量。2.1.8其他常用語音信號去噪方法簡介1.小波去噪原理在自動化系統(tǒng)中,小波是一個常用的用于語音處理的工具,像語音分析、基音檢測和語音識別等。小波分析是一種窗口大小固定但其形狀可改變,時間窗和頻率窗都可以改變的時頻局部化分析方法。語音通信過程不可避免地會受到各種噪聲的干擾,噪聲降低了語音的信噪比和可懂度。語音去噪有各種小波變換的方法,小波變換具有多尺度的特性,可以由粗及細(xì)地逐步觀察信號。首先對帶噪語音信號進(jìn)行小波變換,得到各尺度的小波系數(shù),然后對得到的小波系數(shù)進(jìn)行噪聲估計。進(jìn)行噪聲估計的方法比較多,可以針對每一層分解得到的小波系數(shù)進(jìn)行噪聲估計,也可以只是對近似部分的系數(shù)進(jìn)行估計,還可以針對所有得到的系數(shù)進(jìn)行估計。因為小波變換具有和人耳相似的頻率特性,所以利用小波變換進(jìn)行去噪可以達(dá)到比較理想的效果。使用小波變換進(jìn)行去噪的關(guān)鍵在于閾值的選取,閾值的選取方法可以是“硬閾值”,也可以是“軟閾值”。如果閾值選得過高,會使信號丟失過多的細(xì)節(jié),使信號失真;如果閾值選得過低,則不能達(dá)到去噪的目的。對待去噪的信號可假定其噪聲接近高斯分布,通過使用一個多分辨率的小波濾波器組計算系數(shù),濾波器的選擇取決于噪聲級和其他參數(shù)。然后再通過估算一個正確的門限電平來得到一個好的去噪效果,小波函數(shù)和分解層數(shù)對去噪信號的質(zhì)量也起了重要作用。2.遺傳算法去噪遺傳算法(GeneticAlgorithm)是一類借鑒生物界的進(jìn)化規(guī)律(適者生存、優(yōu)勝劣汰遺傳機(jī)制)演化而來的隨機(jī)化搜索方法。其主要特點(diǎn)是直接對結(jié)構(gòu)對象進(jìn)行操作,不存在求導(dǎo)和函數(shù)連續(xù)性的限定;具有內(nèi)在的隱蔽性和更好的全局尋優(yōu)能力;采用概率化的尋優(yōu)方法,能自動獲取和指導(dǎo)優(yōu)化的搜索空間,自適應(yīng)地調(diào)整搜索方向,不需要確定的規(guī)則。遺傳算法的基本運(yùn)算過程如下:(1)初始化過程:設(shè)置進(jìn)化代數(shù)計數(shù)器t=0,設(shè)置最大進(jìn)化代數(shù)T,隨機(jī)生成M個個體作為初始群體P(0)。(2)個體評價過程:計算群體P(t)中各個個體的適應(yīng)度。(3)選擇運(yùn)算過程:將選擇算子作用于群體。選擇的目的是把優(yōu)化的個體直接遺傳到下一代,或通過配對交叉產(chǎn)生新的個體再遺傳到下一代。選擇操作是建立在群體中個體的適應(yīng)度評估基礎(chǔ)上的。(4)交叉運(yùn)算過程:將交叉算子作用于群體。所謂交叉,是指把兩個父代個體的部分結(jié)構(gòu)加以替換重組而生成新個體的操作。遺傳算法中起核心作用的就是交叉算子。(5)變異運(yùn)算過程:將變異算子作用于群體。即對群體中個體串的某些基因座上的基因值作變動。群體P(t)經(jīng)過選擇、交叉、變異運(yùn)算之后得到下一代群體P(t1)。(6)終止條件判斷過程:若t>T,則以進(jìn)化過程中所得到的具有最大適應(yīng)度的個體作為最優(yōu)解輸出,終止計算。
任務(wù)2.2顏色空間模型及轉(zhuǎn)換
學(xué)習(xí)目標(biāo)(1)理解顏色空間的表示及轉(zhuǎn)換。(2)結(jié)合具體應(yīng)用,掌握顏色空間轉(zhuǎn)換的原因、方法及應(yīng)用場合。任務(wù)分析(1)在多媒體系統(tǒng)中經(jīng)常涉及用幾種不同的顏色空間表示圖形和圖像的顏色。常見的顏色空間模型有:RGB、YUV、HIS、CMYK、YCbCr、YIQ、HSV、CIELAB,它們是如何定義和表示的?(2)從一種顏色空間模型轉(zhuǎn)換到另一種顏色空間模型的流程是什么?(3)顏色空間轉(zhuǎn)換的意義是什么?(4)由于RGB顏色空間多用于顯示器等發(fā)光設(shè)備中,其他硬件設(shè)備大都與其之間有數(shù)據(jù)和圖像的傳輸,就不可避免地要與基于設(shè)備工藝的顏色空間進(jìn)行轉(zhuǎn)換。而與設(shè)備無關(guān)的基于感知的顏色空間用于圖像分析時也多依賴于顯示器,故與RGB顏色空間有關(guān)系的轉(zhuǎn)換在眾多轉(zhuǎn)換中占據(jù)著重要的地位。(5)實現(xiàn)下列顏色空間模型的轉(zhuǎn)換:RGB→CMY空間;RGB→YUV空間;RGB→YCbCr空間;RGB→HSI空間;RGB→CIELAB空間。2.2.1顏色的基本概念顏色是通過眼、腦和人們的生活經(jīng)驗所產(chǎn)生的一種對光的視覺效應(yīng)。人對顏色的感覺不僅僅由光的物理性質(zhì)所決定,比如人類對顏色的感覺還往往受到周圍顏色的影響。有時人們也將物質(zhì)產(chǎn)生不同顏色的物理特性直接稱為顏色。光是一種電磁波。電磁輻射的波長范圍很寬,按波長從長到短的順序排列,依次是無線電波、紅外線、可見光、紫外線、X射線和宇宙射線等。波長在380~780nm范圍內(nèi)的電磁波能夠使人眼產(chǎn)生顏色感覺,稱為可見光。可見光在整個電磁波譜中只占極小的一段。2.2.2彩色三要素描述一種色彩需要用亮度、色調(diào)和色飽和度三個基本參量,這三個參量稱為彩色三要素。1.亮度亮度反映光的明亮程度。彩色光輻射的功率越大,亮度越高,反之亮度越低;不發(fā)光物體的亮度取決于它反射光功率的大小。若照射物體的光強(qiáng)度不變,則物體的反射性能越好,物體越明亮,反之越暗;對于一定的物體,照射光越強(qiáng),物體越明亮,反之越暗。2.色調(diào)色調(diào)反映彩色的類別,例如紅、橙、黃、綠、青、藍(lán)、紫等不同顏色。發(fā)光物體的色調(diào)由光的波長決定,不同波長的光呈現(xiàn)不同的色調(diào);不發(fā)光物體的色調(diào)由照明光源和該物體的吸收、反射或透射特性共同決定。3.色飽和度色飽和度反映彩色光(色調(diào))深淺的程度。同一色調(diào)的彩色光會給人以深淺不同的感覺。深紅、粉紅是兩種不同飽和度的紅色,深紅色飽和度高,粉紅色飽和度低。2.2.3三基色原理1.三基色原理根據(jù)人眼的視覺特性,在電視機(jī)中重現(xiàn)圖像時并不要求完全重現(xiàn)原景物反射或透射光的光譜成分,而應(yīng)獲得與原景物相同的彩色感覺。仿效人眼三種錐狀細(xì)胞,可以選擇三種基色,將它們按不同比例進(jìn)行組合,就可得到自然界中絕大多數(shù)的彩色。同樣絕大多數(shù)單色光也可以分解成紅、綠、藍(lán)三種色光。這是色度學(xué)的最基本原理,即三基色原理。這三種基色必須是獨(dú)立的,任何一種基色都不能由其他兩種顏色合成。自然界中絕大多數(shù)的彩色可以分解為三基色。在彩色電視中,選用了紅、綠、藍(lán)作為三基色,分別用R、G、B來表示。2.相加混色原理在一般的彩色電視中,通常使用以下兩種相加混色法:(1)空間混色法:它將三種色光投射到同一表面上彼此相距很近的三個點(diǎn)上,由于人眼的分辨力有限,故產(chǎn)生一種基色光混合的色彩感覺。(2)時間混合法:它把三種基色光輪流投射到同一表面上,只要輪流速度足夠快,就能達(dá)到相加混色的效果(人的視覺惰性)。3.相減混色原理在白光照射下,青色顏料吸收紅色而反射青色,黃色顏料吸收藍(lán)色而反射黃色,品紅顏料吸收綠色而反射品紅。2.2.4RGB與CMY顏色空間模型1.RGB顏色空間模型在多媒體計算機(jī)中,使用最多的是RGB顏色空間模型。計算機(jī)和電視機(jī)的彩色顯示器的輸入需要RGB的彩色分量,通過3個分量的不同比例,在顯示器屏幕上合成所需要的任一顏色,所以此模型是相加性的。不管其中采用什么形式的顏色空間表示,多媒體系統(tǒng)的最終輸出一定要轉(zhuǎn)換為RGB表示。在RGB顏色空間模型中,對任意彩色光F,其配色方程可寫為F=r[R]+g[G]+b[B]2.CMY顏色空間模型彩色印刷或彩色打印的紙張是不能發(fā)射光線的,因而印刷機(jī)或彩色打印機(jī)就只能使用一些能夠吸收特定的光波而反射其他光波的油墨或顏料。CMY模型將青色(C)、品紅(M)、黃色(Y)三種不同比例的彩色墨放到印版上來展現(xiàn)出種類繁多的色彩。該模型根據(jù)色彩的減法來得到其他彩色,這種方法稱為減色合成法。3.兩者的關(guān)系因為CMY通過減色合成法得到,RGB通過加色混合法得到,故兩者是互補(bǔ)的。2.2.5RGB與YUV顏色空間模型1.YUV顏色空間模型YUV是PAL(PhaseAlternatingLine,逐行倒相)制彩色電視系統(tǒng)所采用的一種顏色空間模型,其中Y表示亮度,U表示藍(lán)色色差(即B-Y),V表示紅色色差(即R-Y)。亮度信號Y和色度信號U、V是分離的,完成了彩色和黑白電視的對接,使帶顏色的圖像能在所有電視機(jī)上顯示;U、V為色差并且能完全顯示所有彩色。它被歐洲的電視系統(tǒng)廣泛采用。另外,可以利用人眼對彩色的敏感度低于對亮度的敏感度的視覺特性,用較窄的頻帶傳送U、V信號,優(yōu)化彩色電視信號的傳輸。即用亮度信號Y傳送細(xì)節(jié),用色差信號U、V進(jìn)行大面積涂色。因此,彩色信號的清晰度由亮度信號的帶寬保證,而把色差信號的帶寬變窄。2.RGB與YUV的關(guān)系RGB與YUV的轉(zhuǎn)換公式為3.與YUV相似的YIQ顏色空間模型YIQ模型中Y也為所有電視提供亮度信號,I和Q表示色度,即圖像的色調(diào)及飽和度,該模型被北美的電視系統(tǒng)廣泛采用。YIQ顏色空間是由YUV推導(dǎo)而來,是NTSC制彩色電視系統(tǒng)所采用的一種顏色空間模型;I代表“同相”,Q代表“正交”,它們指的是用于發(fā)射顏色信息的調(diào)制方法;I、Q是通過將U、V軸逆時針旋轉(zhuǎn)33°獲得的。由人眼彩色視覺的特性表明,人眼分辨紅、黃之間顏色變化的能力最強(qiáng),而分辨藍(lán)、紫之間顏色變化的能力最弱。通過一定的變化,I對應(yīng)于人眼最敏感的色度,而Q對應(yīng)于人眼最不敏感的色度。這樣,傳送Q信號時可以用較窄的頻帶,而傳送分辨率較強(qiáng)的I信號時,可以用較寬的頻帶。4.RGB與YIQ的關(guān)系RGB與YIQ的轉(zhuǎn)換公式為
反轉(zhuǎn)換為2.2.6RGB與YCbCr顏色空間模型1.YCbCr顏色空間模型YCbCr是由YUV顏色空間派生出的一種顏色空間模型,主要用于數(shù)字電視系統(tǒng)。其中Y是亮度,可以完整地表示除了色度之外的所有圖像信息。色度信息完全存儲在Cb和Cr中,Cb代表藍(lán)色信息,Cr則代表紅色信息?;旧希琘CbCr和YUV代表相同的顏色空間,但YCbCr中的各成分是YUV顏色空間中各成分比例的補(bǔ)償數(shù)值。2.兩者的關(guān)系RGB與YCbCr的轉(zhuǎn)換公式為2.2.7RGB與HSI顏色空間模型1.HIS顏色空間模型HSI用色調(diào)(Hue)、色飽和度(Saturation)、亮度(Intensity)描述色彩信息,它可以用一個圓錐空間模型來描述。色調(diào)表示某顏色與純凈顏色的差距,飽和度表示純凈顏色中混入白色的多少,亮度代表眼睛受到光照射的強(qiáng)度。HSV與HSI近似相同,屬于同一類別,只有第三個分量不一樣,V代表明度(Value),HSV相比HSI在色彩的感知方面更好。2.2.8RGB與CIELAB顏色空間模型1.CIELAB顏色空間模型LAB是一種不常用的色彩空間。它是在1931年國際照明委員會(CIE)制定的顏色度量國際標(biāo)準(zhǔn)的基礎(chǔ)上建立起來的。1976年,經(jīng)修改后被正式命名為CIELAB。它是一種與設(shè)備無關(guān)的顏色系統(tǒng),也是一種基于生理特性的顏色系統(tǒng)。它用數(shù)字化的方法來描述人的視覺感應(yīng)。L分量用于表示像素的亮度,取值范圍是[0,100],表示從純黑到純白;A表示從紅色到綠色的范圍,取值范圍是[127,-128];B表示從黃色到藍(lán)色的范圍,取值范圍是[127,-128]。LAB顏色空間比計算機(jī)顯示器、打印機(jī)甚至比人類視覺的色域都要大,在獲得同樣的精度時,LAB位圖比RGB或CMYK位圖需要的像素數(shù)要多。2.兩者的關(guān)系RGB無法直接轉(zhuǎn)換成LAB,需要先轉(zhuǎn)換成XYZ再轉(zhuǎn)換成LAB,即RGB-XYZ-LAB。
任務(wù)2.3車牌圖像的預(yù)處理
學(xué)習(xí)目標(biāo)(1)理解并掌握位圖圖像的基本概念、性能指標(biāo)。(2)理解并掌握圖像的灰度化處理、常用邊緣檢測算子、常用圖像增強(qiáng)方法、數(shù)學(xué)形態(tài)學(xué)處理等常用圖像預(yù)處理方法。(3)結(jié)合具體應(yīng)用,能夠選擇合適的圖像預(yù)處理方法加以應(yīng)用。(4)會用MATLAB編程實現(xiàn)常用預(yù)處理方法。任務(wù)分析(1)針對獲取的車牌圖像,采用怎樣的處理流程實現(xiàn)車牌的提取?(2)在每個流程中,可以采用哪些處理方法,為什么選擇這種方法?(3)這些方法如何實現(xiàn)?(4)應(yīng)用圖像預(yù)處理方法的效果怎樣?還能再改進(jìn)哪些地方?2.3.1認(rèn)識位圖圖像在對圖像進(jìn)行預(yù)處理前,應(yīng)先了解有關(guān)圖像處理的基礎(chǔ)知識,這有助于對圖像進(jìn)行分析和處理方法的選擇。1.圖像與位圖圖像圖像(Image)是指由輸入設(shè)備捕捉的實際場景畫面,或以數(shù)字化形式存儲的任意畫面。靜止的圖像可用一個矩陣來表示,矩陣列中的各個元素用來描述構(gòu)成圖像的各個點(diǎn)(稱為像素Pixel)的強(qiáng)度和顏色等信息。這種圖像也稱為位圖(Bitmap)。2.位圖圖像的技術(shù)指標(biāo)1)分辨率(1)顯示分辨率:確定屏幕上顯示圖像區(qū)域的大小,即構(gòu)成全屏顯示的像素點(diǎn)個數(shù),以每行擁有的像素點(diǎn)個數(shù)×屏幕顯示行數(shù)來表示。(2)圖像分辨率:確立組成一幅圖像的像素數(shù)目,即該圖像在水平和垂直方向上的像素個數(shù),用dpi(每英寸多少點(diǎn))表示。不同分辨率的圖如圖2-3-2所示,圖像分辨率與清晰度的關(guān)系如圖2-3-3所示。(3)打印分辨率:打印機(jī)輸出圖像時采用的分辨率。不同打印機(jī)最高分辨率不同,而同一臺打印機(jī)也可以使用不同分辨率進(jìn)行打印。2)像素深度像素深度描述圖像中每個像素數(shù)據(jù)所占的二進(jìn)制位數(shù),它決定了彩色圖像中可出現(xiàn)的最多顏色數(shù),或灰度圖像中最大灰度等級數(shù)。3)真彩色、偽彩色與直接色(1)真彩色:圖像中的每個像素值都分成R、G、B三個基色分量,每個基色分量直接決定其基色的強(qiáng)度,這樣產(chǎn)生的顏色稱為真彩色。(2)偽彩色:圖像中每個像素值是一個索引或代碼值,作為顏色查找表中某項入口地址,查找出包含實際R、G、B的強(qiáng)度值,這樣產(chǎn)生的顏色稱偽彩色。(3)直接色:通過每個像素點(diǎn)R、G、B分量分別作為索引值進(jìn)行變換,經(jīng)相應(yīng)顏色變換表找出各自基色強(qiáng)度,用變換后的R、G、B強(qiáng)度值產(chǎn)生的顏色稱為直接色。4)調(diào)色板在生成一幅位圖圖像時,圖像處理軟件要對圖像中不同的色調(diào)進(jìn)行采樣,產(chǎn)生包含在此幅圖像中各種顏色的顏色表,即一組(R,G,B)組合值,這個顏色表就稱作調(diào)色板。5)顯示深度顯示深度表示顯示緩存中記錄屏幕上一個點(diǎn)的二進(jìn)制位數(shù),即顯示器可顯示的顏色數(shù)。顯示深度大于像素深度時,屏幕上的顏色能夠比較真實地反映圖像文件的顏色效果;顯示深度小于像素深度時,屏幕上的顏色不能真實地反映圖像文件的顏色效果,即發(fā)生失真;顯示深度等于像素深度時,若真彩色顯示模式顯示真彩色圖像,或顯示調(diào)色板與圖像調(diào)色板一致,則屏幕上顏色能較真實地反映圖像色彩效果,不一致則顯示顏色會出現(xiàn)失真。6)位圖圖像的數(shù)據(jù)量位圖圖像的數(shù)據(jù)量的估算方法為3.位圖的特點(diǎn)(1)表達(dá)圖像逼真:位圖與圖像復(fù)雜程度無關(guān),表現(xiàn)力強(qiáng),適合表現(xiàn)細(xì)節(jié)和層次。(2)對硬件要求高:當(dāng)處理高質(zhì)量彩色圖像時,對計算機(jī)硬件平臺要求較高。(3)文件數(shù)據(jù)量大:位圖由大量不同的亮度和顏色像素點(diǎn)組成,因此文件數(shù)據(jù)量大。(4)缺乏靈活性能:當(dāng)位圖圖像被放大時,圖像的清晰度會降低并出現(xiàn)鋸齒。4.位圖文件的結(jié)構(gòu)位圖文件的結(jié)構(gòu)主要包含文件頭、文件體、文件尾三部分。2.3.2矢量圖與位圖的區(qū)別1.矢量圖的定義矢量圖是一種抽象化的圖像。它用一組計算機(jī)指令集合描述圖形內(nèi)容,這些指令描述構(gòu)成該圖形所有直線、圓、圓弧、矩形、曲線等圖元的位置、維數(shù)和形狀等。在計算機(jī)屏幕上顯示矢量圖形有專門的軟件,如AutoCAD、CorelDraw、Adobe、Illustrator等。2.矢量圖的原理矢量圖的原理在于它用數(shù)學(xué)方式來描述一幅圖形。當(dāng)在計算機(jī)上顯示一幅圖時,先要使用專門軟件讀取并解釋這些指令,再將它們轉(zhuǎn)成屏幕上顯示的形狀和顏色,最后通過使用實心的或有等級深淺的單色或色彩填充一些區(qū)域而形成圖形。3.矢量圖的特點(diǎn)(1)壓縮后不變形:尺寸可以任意變化而不損失圖像質(zhì)量,壓縮后不會變形。(2)局部可處理性:各部件相對獨(dú)立,無論放大、縮小或旋轉(zhuǎn)等都不會失真。(3)文件數(shù)據(jù)量?。簩D像進(jìn)行抽象化,它使用圖形指令集合取代原始圖像。(4)不易描述復(fù)雜圖:對復(fù)雜圖,計算機(jī)要花費(fèi)很長的時間去執(zhí)行繪圖指令。4.矢量圖與位圖的對比2.3.3彩色圖像的灰度化處理灰度圖像只有亮度,不含其他顏色,它的值在0~255之間,且數(shù)值越大越亮,數(shù)值越小越暗,最亮為白色,最暗為黑色?;叶葓D像的處理速度快、操作簡單、儲存空間小,更有利于車牌定位處理。每個像素等于三個基色的加權(quán)平均值,根據(jù)人眼對三個基色的敏感性強(qiáng)弱,可給予三個基色不同的權(quán)值。2.3.4圖像的增強(qiáng)處理圖像增強(qiáng)處理的目的:一是改善圖像的視覺效果,二是將圖像轉(zhuǎn)換成一種更適合讓人或機(jī)器進(jìn)行分析和處理的形式。根據(jù)所處理的空間不同,可以有兩大類處理方法:基于空間域的方法:直接在圖像所在的空間進(jìn)行處理?;陬l率域的方法:在圖像變換域間接進(jìn)行處理。2.3.5圖像的二值化處理圖像二值化就是將圖像上像素點(diǎn)的灰度值設(shè)置為0或255,也就是將整個圖像呈現(xiàn)出明顯的黑白效果。將256個亮度等級的灰度圖像通過適當(dāng)?shù)拈撝颠x取,即可獲得仍然可以反映圖像整體和局部特征的二值化圖像。所有灰度大于或等于閾值的像素被判定為屬于特定物體,其灰度值為255,否則這些像素點(diǎn)被排除在物體區(qū)域以外,灰度值為0,表示背景或者例外的物體區(qū)域。常用的圖像二值化閾值的選取方法有雙峰法、P參數(shù)法、最大類間方差法(Otsu)、最大熵閾值法、迭代法等。該任務(wù)中采用最大類間方差法實現(xiàn)圖像的二值化處理。最大類間方差法是由Otsu于1979年提出的,它是基于整幅圖像的統(tǒng)計特性實現(xiàn)閾值的自動選取的,是全局二值化最杰出的代表。Otsu算法的基本思想是用某一假定的灰度值t將圖像的灰度分成兩組,當(dāng)兩組的類間方差最大時,此灰度值t就是圖像二值化的最佳閾值。設(shè)圖像有L個灰度值,取值范圍在0~L-1,在此范圍內(nèi)選取灰度值T,將圖像分成兩組,即G0和G1,G0的灰度值在0~T范圍內(nèi),G1的灰度值在T+1~L-1范圍內(nèi),用N表示圖像像素總數(shù),ni表示灰度值為i的像素的個數(shù)。2.3.6圖像的邊緣檢測邊緣是圖像上灰度變化最明顯的地方,傳統(tǒng)邊緣檢測利用此特點(diǎn),對圖像各像素點(diǎn)進(jìn)行求微分或二階微分來定位邊緣像素點(diǎn)。由灰度變化特點(diǎn),可將邊緣類型分為階梯狀、脈沖狀和屋頂狀三種。對于階梯狀邊緣,圖像邊緣點(diǎn)對應(yīng)一階微分圖像的峰值和二階微分圖像的零交叉處;對于脈沖狀和屋頂狀邊緣,邊緣點(diǎn)對應(yīng)一階導(dǎo)數(shù)的零交叉和二階導(dǎo)數(shù)的峰值。根據(jù)數(shù)字圖像的特點(diǎn),處理圖像時常采用差分代替導(dǎo)數(shù)運(yùn)算。對于圖像的簡單一階導(dǎo)數(shù)運(yùn)算,由于其具有固定的方向性,只能檢測特定方向的邊緣,所以不具有普遍性。為了克服一階導(dǎo)數(shù)的缺點(diǎn),我們定義圖像的梯度為梯度算子,它是圖像處理中最常用的一階微分算法。圖像梯度最重要的性質(zhì)是梯度的方向在圖像灰度最大變化率上,恰好可以反映出圖像邊緣上的灰度變化。邊緣檢測算子是利用圖像邊緣的突變性質(zhì)來檢測邊緣的。它主要分為兩種類型:一種是以一階導(dǎo)數(shù)為基礎(chǔ)的邊緣檢測算子,通過計算圖像的梯度值來檢測圖像邊緣;另一種是以二階導(dǎo)數(shù)為基礎(chǔ)的邊緣檢測算子,通過尋求二階導(dǎo)數(shù)中的過零點(diǎn)來檢測邊緣。2.3.7數(shù)學(xué)形態(tài)學(xué)處理數(shù)學(xué)形態(tài)學(xué)的基本思想是運(yùn)用具有一定形態(tài)結(jié)構(gòu)的元素去度量和提取圖像中的對應(yīng)形狀,以達(dá)到對圖像分析和識別的目的,它能有效地消除噪聲。在進(jìn)行邊緣檢測之后,車牌的特征已經(jīng)很明顯得到了加強(qiáng),為了進(jìn)一步確定車牌的位置,還要對它進(jìn)行數(shù)學(xué)形態(tài)學(xué)處理。在形態(tài)學(xué)算法中,結(jié)構(gòu)元素是很重要的,它的形狀、大小的選擇以及運(yùn)算的性質(zhì)對于圖像的提取和識別起著關(guān)鍵作用。結(jié)構(gòu)元素過大會使候選區(qū)域增多,還可能會使車牌區(qū)域與背景區(qū)域連接起來,給車牌的定位帶來困難。結(jié)構(gòu)元素選取過小,則很可能會使車牌區(qū)域無法真正地連接在一起,就無法確定出車牌的候選區(qū)域。數(shù)學(xué)形態(tài)學(xué)的基本運(yùn)算有:腐蝕運(yùn)算、膨脹運(yùn)算、開運(yùn)算和閉運(yùn)算四種運(yùn)算。1.腐蝕運(yùn)算腐蝕是一種消除邊界點(diǎn)的過程,目的是使目標(biāo)縮小,空洞增大,以有效地消除孤立噪聲點(diǎn)。腐蝕可以把小于結(jié)構(gòu)元素的物體去除。2.膨脹運(yùn)算膨脹是將與目標(biāo)體接觸的所有背景點(diǎn)合并到物體中的過程,目的是使目標(biāo)增大,空洞減小,以填補(bǔ)目標(biāo)物體中的空洞。3.開運(yùn)算和閉運(yùn)算雖然腐蝕運(yùn)算可以將粘連的目標(biāo)物體分離,膨脹運(yùn)算可以將斷開的物體連接起來,但是這兩種運(yùn)算都存在一個問題:經(jīng)過腐蝕運(yùn)算后,目標(biāo)物體的面積小于原有面積;而經(jīng)過膨脹運(yùn)算后,目標(biāo)物體的面積大于原有面積。開運(yùn)算和閉運(yùn)算就是基于這個問題被提出的。開運(yùn)算的過程:先對圖像進(jìn)行腐蝕,然后再對圖像進(jìn)行膨脹,最后得到結(jié)果。開運(yùn)算通常用于去掉小對象物體,以及去掉目標(biāo)外的孤立點(diǎn)。開運(yùn)算在平滑目標(biāo)物體邊界的同時并不明顯改變其面積。閉運(yùn)算的過程:先對圖像進(jìn)行膨脹,然后再對圖像進(jìn)行腐蝕,最后得到結(jié)果。閉運(yùn)算主要用來填充物體內(nèi)的細(xì)小空洞,可以去掉目標(biāo)內(nèi)的孔。閉運(yùn)算在連接鄰近物體、平滑其邊界的同時并不明顯改變其面積。
任務(wù)2.4霧霾圖像的增強(qiáng)處理
學(xué)習(xí)目標(biāo)(1)掌握常用的圖像處理方法。(2)結(jié)合霧霾天氣下獲取的圖像,能夠分析圖像特征,采用合適的方法進(jìn)行圖像增強(qiáng)處理。(3)能夠舉一反三,對于惡劣天氣條件下獲取的圖像,能夠采用合適的方法,對圖像進(jìn)行有效增強(qiáng)處理。任務(wù)分析(1)通常采用的霧霾圖像增強(qiáng)方法有哪些?各自是如何實現(xiàn)的?(2)不同增強(qiáng)方法在增強(qiáng)效果上有什么不同?傳統(tǒng)的方法是否存在弊端,能否改進(jìn)?怎樣改進(jìn)?(3)每種方法實現(xiàn)的流程是怎樣的?2.4.1直方圖均衡化算法直方圖是一種能反映圖像灰度分布情況的圖表。圖像的不同灰度值出現(xiàn)的概率和像素數(shù)量的多少,反映了圖像的信息內(nèi)容。直方圖均衡化就是經(jīng)過某種變換之后能使圖像灰度的概率變得更均勻化,使其信息熵能夠達(dá)到最大值。要尋找一種算法,實現(xiàn)經(jīng)過該算法變換后,圖像的所有像素分布的概率密度為1。設(shè)圖像的原像素灰度值為r(0≤r≤1),概率密度為Pr(r);經(jīng)過一系列變換之后,像素灰度值為s,概率密度為Ps(s);T(r)為變換過程函數(shù),則得出以下等式:以上等式所要滿足的條件有:①T(r)必須是單值單調(diào)遞增函數(shù),從而保證灰度是單值映射的同時且灰度值不會出現(xiàn)反轉(zhuǎn);②0≤T(r)≤1,確保原圖像的灰度動態(tài)范圍在經(jīng)過變換后不會被縮小,假設(shè)令則有2.4.2改進(jìn)的直方圖均衡化算法直方圖均衡化理論主要是針對于連續(xù)函數(shù),然而對具有離散灰度值的數(shù)字圖像進(jìn)行處理時,就需要在函數(shù)變換過程中,灰度值經(jīng)歷從連續(xù)到離散的近似。因而在直方圖均衡化中存在的問題有以下幾點(diǎn):(1)量化誤差,損失了原圖中的某些灰度信息。(2)由于原圖像中的低灰度層像素過多,概率密度極其不均勻,從而導(dǎo)致整個圖像的灰度動態(tài)范圍未能有效改善,在進(jìn)行直方圖均衡化過程中,圖像高低灰度的轉(zhuǎn)變導(dǎo)致圖像信息轉(zhuǎn)化不均衡,導(dǎo)致一些信息被覆蓋。為了解決這個問題,人們對常規(guī)的直方圖變換進(jìn)行改進(jìn)。改進(jìn)算法的基本思想是:通過變換函數(shù)對原圖像的直方圖進(jìn)行灰度拉伸,使其生成具有“平坦”概率分布的直方圖,再用新的均衡化后的直方圖去校正圖像。1.具體改進(jìn)方法(1)減少原圖像的低灰度層在生成圖像中的概率,進(jìn)而減少其對生成圖像的影響,使生成圖像的灰度分布范圍更廣。(2)由于原來圖像的低灰度層范圍的像素較密,分布不均勻,從整體觀察,相近的區(qū)域亮度相差較大,不利于對中間細(xì)節(jié)信息的觀察,為此需要對生成圖像作適當(dāng)?shù)恼{(diào)整,對亮度參數(shù)進(jìn)行修正。以下列出調(diào)整函數(shù)變換:在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《GBT 34690.7-2017 印刷技術(shù) 膠印數(shù)字化過程控制 第 7 部分:計算機(jī)直接制版》專題研究報告
- 《GBT 33290.5-2016 文物出境審核規(guī)范 第 5 部分:儀仗》專題研究報告
- 《GB-T 21021.1-2021無源射頻和微波元器件的互調(diào)電平測量 第1部分:一般要求和測量方法》專題研究報告
- 《GBT 32581-2016 入侵和緊急報警系統(tǒng)技術(shù)要求》專題研究報告
- 《AQ-T 2035-2023金屬非金屬地下礦山供水施救系統(tǒng)建設(shè)規(guī)范》專題研究報告
- 《寵物鑒賞》課件-雪納瑞
- 《Python語言程序設(shè)計》課件-7.2 理解數(shù)據(jù)的維度
- 《智慧景區(qū)服務(wù)與管理》課件-第二章 任務(wù)一 旅游景區(qū)票務(wù)服務(wù)
- 施工現(xiàn)場起重吊裝隱患識別及安全技術(shù)應(yīng)用
- 數(shù)字文旅景點(diǎn)導(dǎo)覽信息服務(wù)協(xié)議
- 心理因素對創(chuàng)新行為的影響
- 脊髓損傷的膀胱護(hù)理
- 《醫(yī)學(xué)影像診斷報告書寫指南》(2025版)
- 高校物業(yè)安全培訓(xùn)內(nèi)容課件
- (正式版)DB33∕T 1430-2025 《海塘安全監(jiān)測技術(shù)規(guī)程》
- 醫(yī)藥競聘地區(qū)經(jīng)理匯報
- 水庫調(diào)度操作規(guī)程模板
- 產(chǎn)科護(hù)士長年終總結(jié)
- 酒店情況診斷報告
- DBJ04-T483-2025 海綿型城市道路與廣場設(shè)計標(biāo)準(zhǔn)
- 農(nóng)藥運(yùn)輸儲存管理制度
評論
0/150
提交評論