《多媒體信息與通信》課件第2章

上傳人：1*** IP屬地：廣東上傳時間：2025-08-30 格式：PPT 頁數(shù)：68 大小：3.04MB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩63頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二章多媒體信息的處理任務(wù)2.1音頻信號噪聲檢測及噪聲去除任務(wù)2.2顏色空間模型及轉(zhuǎn)換任務(wù)2.3車牌圖像的預(yù)處理任務(wù)2.4霧霾圖像的增強(qiáng)處理

任務(wù)2.1音頻信號噪聲檢測及噪聲去除

【學(xué)習(xí)目標(biāo)】

（1）了解噪聲的分類及產(chǎn)生方法。

（2）掌握音頻信號中噪聲的檢測方法及其原理圖。

（3）掌握MATLAB語言中音頻數(shù)據(jù)與信息的讀取、處理方法。

（4）掌握信號頻譜的繪制。

（5）結(jié)合具體應(yīng)用，掌握音頻信號噪聲去除的典型方法及其特點(diǎn)。

【任務(wù)分析】

（1）理解噪聲產(chǎn)生的原理。

（2）分析并掌握噪聲檢測的系統(tǒng)框圖、硬件結(jié)構(gòu)設(shè)計及軟件結(jié)構(gòu)設(shè)計。

（3）繪制出原始音頻信號一個聲道的時域圖和頻譜圖；繪制出加噪聲后混合信號同一聲道的時域圖和頻譜圖；繪制出濾波后音頻信號同一聲道的時域圖和頻譜圖。

（4）掌握音頻信號噪聲去除的方法，并了解每一種方法的工作原理及實現(xiàn)思路。

（5）能夠畫出每種去噪方法的實現(xiàn)流程圖。2.1.1噪聲的分類方式噪聲的物理學(xué)概念是指無規(guī)律的不具周期性特征的聲響，衛(wèi)生學(xué)概念泛指干擾睡眠休息和交談思考，給人以煩惱的感受，造成聽覺危害的一切聲響。因此可按噪聲源的物理特性、時間特性以及頻率成分分布等方式進(jìn)行分類。2.1.2語音信號的時域與頻域分析1.信號的特點(diǎn)（1）在頻域內(nèi)。語音信號的頻譜分量主要集中在300～3400Hz的范圍內(nèi)。利用這個特點(diǎn)，可以用一個防混迭的帶通濾波器將此范圍內(nèi)的語音信號頻率分量取出，然后按一定的采樣率對語音信號進(jìn)行采樣，就可以得到離散的語音信號。（2）在時域內(nèi)。語音信號具有“短時性”的特點(diǎn)，即在總體上，語音信號的特征是隨著時間的變化而變化的，但在一段較短的時間間隔內(nèi)會保持平穩(wěn)。語音信號在濁音段表現(xiàn)出周期信號的特征，在清音段表現(xiàn)出隨機(jī)噪聲的特征。2.語音信號的時域分析1）窗口的選擇在5~50ms的范圍內(nèi)，語音頻譜特性和一些物理特性參數(shù)基本保持不變。我們將每個短時的語音稱為一個分析幀。一般幀長取10~30ms。采用一個長度有限的窗函數(shù)來截取語音信號形成分析幀，通常會采用矩形窗和漢明窗。在語音頻譜分析時常使用漢明窗，在計算短時能量和平均幅度時通常使用矩形窗。2）短時能量由于語音信號的能量隨時間變化，清音和濁音之間的能量差別相當(dāng)顯著。因此對語音的短時能量進(jìn)行分析，可以描述語音的這種特征變化情況。定義短時能量為短時能量函數(shù)可用于區(qū)分清音段與濁音段，En值大對應(yīng)于濁音段，En值小對應(yīng)于清音段；還可用于區(qū)分濁音變?yōu)榍逡艋蚯逡糇優(yōu)闈嵋舻臅r間；對高信噪比的語音信號，也可以用來區(qū)分有無語音。無信號時，En值很小，有語音信號時，能量顯著增大。過零率可以反映信號的頻譜特性。當(dāng)離散時間信號相鄰兩個樣點(diǎn)的正負(fù)號相異時，稱之為“過零”，即此時信號的時間波形穿過了零電平的橫軸。統(tǒng)計單位時間內(nèi)樣點(diǎn)值改變符號的次數(shù)就可以得到平均過零率。自相關(guān)函數(shù)用于衡量信號自身時間波形的相似性。清音和濁音的發(fā)聲機(jī)理不同，因而在波形上也存在著較大的差異。濁音的時間波形呈現(xiàn)出一定的周期性，波形之間相似性較好；清音的時間波形呈現(xiàn)出隨機(jī)噪聲的特性，樣點(diǎn)間的相似性較差。因此，一般用短時自相關(guān)函數(shù)來測定語音的相似特性。短時自相關(guān)函數(shù)定義為令m=n+m，并且ω(-m)=ω(m)，可得3）時域分析方法的應(yīng)用（1）可用于基音頻率的估計。首先可利用時域分析（短時能量、短時過零率、短時自相關(guān)）方法的某一個特征或某幾個特征的結(jié)合，判定某一語音有效的清音和濁音段；其次，針對濁音段，可直接利用短時自相關(guān)函數(shù)估計基音頻率，其方法是：先估算濁音段第一最大峰的位置，再利用抽樣率計算基音頻率。（2）可用于語音端點(diǎn)的檢測與估計。可利用時域分析方法的某一個特征或某幾個特征的結(jié)合，判定某一語音信號的端點(diǎn)，尤其在有噪聲干擾時，如何準(zhǔn)確檢測語音信號的端點(diǎn)，在語音處理中是富有挑戰(zhàn)性的一個課題。3.語音信號的頻域分析1）短時傅里葉變換由于語音信號是短時平穩(wěn)的隨機(jī)信號，某一語音信號幀的短時傅里葉變換的定義為式中，令n-m=k′，則得到于是可以得到短時傅里葉變換有兩個變量：n和ω，所以它既是時序n的離散函數(shù)，又是角頻率ω的連續(xù)函數(shù)。與離散傅里葉變換逼近傅里葉變換一樣，如令ω=2πk/N，則得離散的短時傅里葉變換如下：2）語譜圖語譜圖的水平方向是時間軸，垂直方向是頻率軸，圖上的灰度條紋代表各個時刻的語音短時譜。語譜圖反映了語音信號的動態(tài)頻率特性，在語音分析中具有重要的實用價值，被視為可視語言。語譜圖的時間分辨率和頻率分辨率是由窗函數(shù)的特性決定的。時間辨率高，可以看出時間波形的每個周期及共振峰隨時間的變化，但頻率分辨率低，不足以分辨由于激勵所形成的細(xì)微結(jié)構(gòu)，稱為寬帶語譜圖；而窄帶語譜圖正好與之相反。寬帶語譜圖可以獲得較高的時間分辨率，清晰地顯示共振峰結(jié)構(gòu)和語譜包絡(luò)，反映頻譜的快速時變過程；窄帶語譜圖可以清晰地顯示諧波的結(jié)構(gòu)，反映基頻的時變過程，反映頻譜的精細(xì)結(jié)構(gòu)。兩者相結(jié)合，可以提供與語音信號相關(guān)的特性。語譜圖上因其不同的灰度，形成不同的紋路，稱之為“聲紋”。聲紋因人而異，因此在司法安全等場合得到應(yīng)用。3）復(fù)倒譜和倒譜復(fù)倒譜是x(n)的Z變換取對數(shù)后的逆Z變換，其表達(dá)式如下：倒譜c(n)定義為：對x(n)取Z變換后的幅度求對數(shù)，再取逆Z變換，即在時域上，語音產(chǎn)生模型實際上是一個激勵信號與聲道沖激響應(yīng)的卷積。對于濁音，激勵信號可以由周期脈沖序列表示；對于清音，激勵信號可以由隨機(jī)噪聲序列表示。聲道系統(tǒng)相當(dāng)于參數(shù)緩慢變化的零極點(diǎn)線性濾波器。這樣經(jīng)過同態(tài)處理后，語音信號的復(fù)倒譜、激勵信號的復(fù)倒譜、聲道系統(tǒng)的復(fù)倒譜之間滿足下面的關(guān)系：由于倒譜對應(yīng)于復(fù)倒譜的偶部，因此倒譜與復(fù)倒譜具有同樣的特點(diǎn)，由復(fù)倒譜很容易知道語音信號的倒譜，激勵信號的倒譜以及聲道系統(tǒng)的倒譜之間滿足下面的關(guān)系：4）基因周期估計濁音信號的倒譜中存在峰值，它的出現(xiàn)位置等于該語音段的基音周期，而清音的倒譜中則不存在峰值。利用倒譜的這個特點(diǎn)，可以進(jìn)行語音的清濁音判決，并且可以估計濁音的基音周期。首先計算語音的倒譜，然后在可能出現(xiàn)的基因周期附近尋找峰值。如果倒譜峰值超過了預(yù)先設(shè)置的門限，則輸入語音判斷為濁音，其峰值位置就是基因周期的估計值；反之，如果沒有超出門限的峰值，則輸入語音為清音。5）共振峰估計對倒譜進(jìn)行濾波，取出低時間部分進(jìn)行逆特征系統(tǒng)處理，可以得到一個平滑的對數(shù)譜函數(shù)，這個對數(shù)譜函數(shù)顯示了輸入語音段的共振峰結(jié)構(gòu)，同時譜的峰值對應(yīng)于共振峰頻率。通過此對數(shù)譜進(jìn)行峰值檢測，從而可以估計出前幾個共振峰的頻率和強(qiáng)度。對于濁音的聲道特性，可以采用前三個共振峰來描述；清音不具備共振峰特點(diǎn)。2.1.3噪聲檢測系統(tǒng)的設(shè)計根據(jù)對噪聲檢測系統(tǒng)的分析，確定噪聲硬件系統(tǒng)主要可由傳聲器、功率放大電路、交直流轉(zhuǎn)換電路、V/F變換電路、單片機(jī)和液晶顯示系統(tǒng)構(gòu)成。傳聲器俗稱“麥克風(fēng)”，是聲電轉(zhuǎn)換器件，在此硬件系統(tǒng)中占重要地位。其原理主要是：傳感器的振動膜受到聲波作用而振動，進(jìn)而轉(zhuǎn)換為電信號。此次設(shè)計使用咪頭作為傳聲器，咪頭主要利用膜片一面來感受聲壓，完成聲音信號的采集并轉(zhuǎn)換成信號。其他各電路或系統(tǒng)的設(shè)計詳細(xì)介紹如下。進(jìn)行功率放大以滿足設(shè)計要求。1.功率放大電路的設(shè)計功率放大電路主要由LM386構(gòu)成，其作用是對聲音信號進(jìn)行功率放大以滿足設(shè)計要求。2.交直流轉(zhuǎn)換電路的設(shè)計交直流轉(zhuǎn)換電路主要由AD536A構(gòu)成，其作用是完成電信號由交流到直流的轉(zhuǎn)換。AD536A可直接計算任何復(fù)雜輸入波形的均方值，并且測量誤差大小。當(dāng)輸入電壓為正時，CMIN輸出高電平，RS觸發(fā)器置位，輸出驅(qū)動管導(dǎo)通，F(xiàn)OUT輸出邏輯低電平。同時，當(dāng)C16兩端電壓大于VCC的2/3時，定時比較器輸出一高電平，使RS復(fù)位，輸出驅(qū)動管截止，F(xiàn)OUT輸出邏輯高電平。同時，C16放電，C10對電阻R8放電，當(dāng)C10所放電壓與輸入電壓相等時，CMIN輸出高電平。如此就構(gòu)成了電壓頻率轉(zhuǎn)換電路。4.單片機(jī)的設(shè)計單片機(jī)集成了CPU、存儲器、定時/計數(shù)器等功能，所以一直被廣泛應(yīng)用。本次噪聲檢測使用的是AT89C51單片機(jī)，其原理簡單，功能易實現(xiàn)，是整個系統(tǒng)的核心，其外部引腳與對應(yīng)電路相連，把各個部分的電路連接起來成為一個完整的系統(tǒng)，內(nèi)部程序則完成相應(yīng)功能。該單片機(jī)內(nèi)部所帶可編程的FLASH存儲器為4KB，同時還帶有16位的定時/計數(shù)器各一個，程序可擦寫達(dá)幾萬次。這里主要利用單片機(jī)的定時計數(shù)功能，在內(nèi)部裝載軟件程序，根據(jù)在限定時間內(nèi)電壓/頻率傳送來的電平上升沿的計數(shù)值對應(yīng)出分貝值。5.液晶顯示系統(tǒng)的設(shè)計液晶顯示系統(tǒng)由LCD1602構(gòu)成。LCD1602是字符型液晶，1602是指顯示兩行內(nèi)容，每行16個字符。與常用的發(fā)光管和LED數(shù)碼管相比，LCD液晶顯示器畫質(zhì)高且不會閃爍，當(dāng)有信號時，每一個液晶屏上的點(diǎn)都恒定發(fā)光；LCD1602是數(shù)字式接口，便于與單片機(jī)連接，操作方便；芯片本身體積小、重量輕、功耗低。LCD1602用來顯示噪聲的分貝值，通常接+5V的電源，工作電流為2mA。LCD1602分為14腳或16腳，在實際應(yīng)用中兩者并沒差別，其引腳D0~D7是數(shù)據(jù)接口，與單片機(jī)外部P0.0~P0.7引腳對應(yīng)連接。液晶顯示系統(tǒng)通過編程完成顯示分貝值的功能，主要步驟為LCD經(jīng)初始化后延時，根據(jù)規(guī)定時間內(nèi)電平上升沿的統(tǒng)計次數(shù)來對應(yīng)噪聲的分貝值，設(shè)置第一行顯示位置，顯示第一行內(nèi)容，其形式為Noise:dB；設(shè)置第二行顯示位置，顯示第二行內(nèi)容，其形式為Limit:dB。PROTUES仿真時，會具體顯示數(shù)字大小。硬件電路設(shè)計完成后，在焊接前需要在PROTUES軟件上進(jìn)行仿真，仿真成功則說明可以進(jìn)行實際電路的焊接。仿真時首先通過電路連接線把各個部分的電路進(jìn)行連接，在檢查連接無誤后，把噪聲檢測的程序裝入單片機(jī)，噪聲信號由信號發(fā)生器代替。2.1.4噪聲檢測系統(tǒng)的軟件設(shè)計噪聲檢測系統(tǒng)的軟件設(shè)計總體框圖如圖。由圖可見，開始后首先設(shè)置SP，8155相當(dāng)于單片機(jī)的擴(kuò)展，然后完成定時器和計數(shù)器的初始化，此時把中斷服務(wù)系統(tǒng)打開，在此期間，讀取計數(shù)器的值。再調(diào)用顯示子系統(tǒng)，對噪聲的分貝取一個大致的值。最后分貝值的大小決定了蜂鳴器報警聲音的變大或變小。2.1.5系統(tǒng)的調(diào)試步驟及可能的故障分析硬件系統(tǒng)在焊接完成后要進(jìn)行檢測和調(diào)試，只有這樣才能給軟件調(diào)試提供一個正確的環(huán)境，去除一些硬件錯誤的干擾。硬件調(diào)試和軟件調(diào)試是不可分離的，只有硬件與軟件完美結(jié)合才算是完成了一個系統(tǒng)。系統(tǒng)的調(diào)試分為以下幾個步驟：（1）用電壓法檢查電路中器件的引腳是否焊接正確。（2）用數(shù)字萬用表檢測器件的各引腳是否連接正常。用兩只表筆分別接觸器件的引腳，若萬用表發(fā)出聲音則連接正常。（3）使用KEIL編寫程序，調(diào)試運(yùn)行沒有錯誤后，在硬件仿真時將程序下載到單片機(jī)。（4）連接好各硬件電路，觀察連線和接口是否正確，顯示系統(tǒng)是否正常。通電進(jìn)行觀察，看檢測系統(tǒng)是否正常工作，測量結(jié)果是否與實際相符。在噪聲檢測系統(tǒng)的設(shè)計與實現(xiàn)中可能會出現(xiàn)以下故障：（1）電源電壓錯誤。起初給所有電路提供+5V的電源，但是電壓/頻率轉(zhuǎn)換器輸出端沒有信號輸出，而LM331的工作電壓是+15V，改正后電路可以正常工作，有信號輸出。（2）硬件電路焊接錯誤。在實際焊接中，元器件較小，線路較多，所以容易焊錯。其中可能出現(xiàn)時鐘電路沒有接地，經(jīng)改正后，晶振才可以正常啟動，單片機(jī)也才可以正常工作；LCD顯示結(jié)構(gòu)的顯示完全反了，位選線連接錯誤，改正后會顯示正常。（3）軟件程序編寫錯誤。這會使顯示系統(tǒng)dB顯示錯誤，該故障可能是由于地址分配的問題引起的，可以重新分配地址，使顯示結(jié)果正常顯示。2.1.6去噪算法設(shè)計1.譜減法增強(qiáng)語音和減小噪聲是處理帶噪語音的兩種方法，譜減法是一種增強(qiáng)語音的方法。在假設(shè)噪聲是統(tǒng)計平穩(wěn)且與語音不相關(guān)的前提下，利用短時傅里葉變換在頻域?qū)г胝Z音的功率譜減去估計噪聲的功率譜，得到語音功率譜估計。由于人耳對相位的感覺不是很靈敏，所以可以將原帶噪語音的相位作為處理后信號的相位，只需在得到的幅度估計中插入帶噪語音的相位，再進(jìn)行快速傅里葉逆變換，就可以在時域上得到增強(qiáng)后的語音信號。在降噪算法研究中，噪聲以高斯白噪聲為主要對象，這種噪聲一般符合以下條件：噪聲是加性的；噪聲是平穩(wěn)的；噪聲與語音統(tǒng)計獨(dú)立。2.濾波法要進(jìn)行數(shù)字信號處理通常需要先將接收到的模擬信號經(jīng)過A/D(數(shù)模轉(zhuǎn)換器)進(jìn)行轉(zhuǎn)換，將模擬信號經(jīng)過采樣轉(zhuǎn)換為數(shù)字信號；接著需要保留有用的數(shù)字信號，濾除掉無關(guān)緊要的信號，這就需要用到濾波器，經(jīng)過濾波器的處理后得到一系列數(shù)字序列，然后經(jīng)過（D/A）轉(zhuǎn)換，將數(shù)字序列轉(zhuǎn)換為人們所能接收的模擬信號。3.最小均方算法LMSLMS以最小均方值為準(zhǔn)則，采用迭代計算得到最優(yōu)解。該算法采用的是梯度下降方法，因此不需要計算相關(guān)函數(shù)，所以所需程序簡單，且對信道特性變化不敏感，簡單便捷，效果良好，在語音降噪領(lǐng)域應(yīng)用廣泛。出信號在時域幅值有所減小，而從頻域角度看，帶噪語音信號的幅值分布的頻率范圍較大。但帶噪語音經(jīng)過FIR低通濾波器處理后，頻譜主要分布在1500Hz之內(nèi)，F(xiàn)IR低通濾波器濾除帶噪語音信號的高頻部分，留下自然的低頻部分，而人發(fā)出的聲音處于低頻段，因此我們可以聽見較為清晰的原聲。但由于高頻部分的語音信號被濾除，使得語音信號聽起來有點(diǎn)低沉、沉悶。利用LMS算法設(shè)計的FIR低通濾波器會根據(jù)輸入信號的統(tǒng)計特性自動調(diào)整自身的參數(shù)以達(dá)到最佳濾波效果。經(jīng)LMS算法處理后的帶噪語音信號的頻譜與原始語音信號的頻譜極為接近，與經(jīng)FIR數(shù)字低通濾波器處理后的語音信號相比，保留了原始語音信號的高頻部分，聽覺上不沉悶，比較悅耳。5.三種降噪算法仿真數(shù)據(jù)分析本次對三種降噪算法的評價主要從主觀和客觀出發(fā)。主觀方法是指通過人的聽覺對語音質(zhì)量有一個大致判斷，即根據(jù)人們的聽覺對處理后語音信號的優(yōu)劣進(jìn)行判斷統(tǒng)計，將降噪處理后的語音信號劃分優(yōu)、良、差三個等級。質(zhì)量優(yōu)表示處理前后的語音聽起來沒有什么差異；質(zhì)量良表示帶噪信號在處理后有明顯改善；質(zhì)量差表示降噪后的信號聽起來有明顯噪聲。客觀方法是指用實際測量的數(shù)據(jù)進(jìn)行評判，即信噪比SNR和對數(shù)譜失真度LSD。SNR越大、LSD越小則表明降噪效果越好。帶噪語音信號經(jīng)過處理后，信噪比都有明顯的改善，對數(shù)譜失真度數(shù)值都較小，說明算法達(dá)到了降噪的目的。三種算法從主觀和客觀兩方面來看，LMS算法在降噪方面性能最好，即處理后的語音信號和純凈語音信號有極小的差別，幾乎分辨不出；FIR低通濾波器降噪效果較好，但由于濾除了帶噪語音信號的高頻部分而使聲音變得低沉；譜減法基本上實現(xiàn)了語音信號的增強(qiáng)，但是效果并不明顯，因為除去高斯白噪聲時帶來了音樂噪聲，聽起來會使人疲憊，所以降噪效果一般。2.1.7任務(wù)實施框圖軟件部分主要是C語言程序的設(shè)計，主要分為四個模塊。主程序是軟件系統(tǒng)的核心，處于循環(huán)工作狀態(tài),主要完成定時/計數(shù)器和中斷系統(tǒng)的初始化,并循環(huán)調(diào)用查表和顯示子程序。查表子程序中的內(nèi)容主要是計數(shù)值與噪聲分貝值的對應(yīng)，顯示子程序主要是根據(jù)定時內(nèi)電平上升沿的計數(shù)值來確定分貝值并顯示。另外，在硬件部分加防風(fēng)防雨保護(hù)措施后可以用于室外的測量。2.1.8其他常用語音信號去噪方法簡介1.小波去噪原理在自動化系統(tǒng)中，小波是一個常用的用于語音處理的工具,像語音分析、基音檢測和語音識別等。小波分析是一種窗口大小固定但其形狀可改變，時間窗和頻率窗都可以改變的時頻局部化分析方法。語音通信過程不可避免地會受到各種噪聲的干擾，噪聲降低了語音的信噪比和可懂度。語音去噪有各種小波變換的方法，小波變換具有多尺度的特性，可以由粗及細(xì)地逐步觀察信號。首先對帶噪語音信號進(jìn)行小波變換，得到各尺度的小波系數(shù)，然后對得到的小波系數(shù)進(jìn)行噪聲估計。進(jìn)行噪聲估計的方法比較多，可以針對每一層分解得到的小波系數(shù)進(jìn)行噪聲估計，也可以只是對近似部分的系數(shù)進(jìn)行估計，還可以針對所有得到的系數(shù)進(jìn)行估計。因為小波變換具有和人耳相似的頻率特性，所以利用小波變換進(jìn)行去噪可以達(dá)到比較理想的效果。使用小波變換進(jìn)行去噪的關(guān)鍵在于閾值的選取，閾值的選取方法可以是“硬閾值”，也可以是“軟閾值”。如果閾值選得過高，會使信號丟失過多的細(xì)節(jié)，使信號失真；如果閾值選得過低，則不能達(dá)到去噪的目的。對待去噪的信號可假定其噪聲接近高斯分布，通過使用一個多分辨率的小波濾波器組計算系數(shù)，濾波器的選擇取決于噪聲級和其他參數(shù)。然后再通過估算一個正確的門限電平來得到一個好的去噪效果，小波函數(shù)和分解層數(shù)對去噪信號的質(zhì)量也起了重要作用。2.遺傳算法去噪遺傳算法（GeneticAlgorithm）是一類借鑒生物界的進(jìn)化規(guī)律（適者生存、優(yōu)勝劣汰遺傳機(jī)制）演化而來的隨機(jī)化搜索方法。其主要特點(diǎn)是直接對結(jié)構(gòu)對象進(jìn)行操作，不存在求導(dǎo)和函數(shù)連續(xù)性的限定；具有內(nèi)在的隱蔽性和更好的全局尋優(yōu)能力；采用概率化的尋優(yōu)方法，能自動獲取和指導(dǎo)優(yōu)化的搜索空間，自適應(yīng)地調(diào)整搜索方向，不需要確定的規(guī)則。遺傳算法的基本運(yùn)算過程如下：（1）初始化過程：設(shè)置進(jìn)化代數(shù)計數(shù)器t=0，設(shè)置最大進(jìn)化代數(shù)T，隨機(jī)生成M個個體作為初始群體P（0）。（2）個體評價過程：計算群體P（t）中各個個體的適應(yīng)度。（3）選擇運(yùn)算過程：將選擇算子作用于群體。選擇的目的是把優(yōu)化的個體直接遺傳到下一代，或通過配對交叉產(chǎn)生新的個體再遺傳到下一代。選擇操作是建立在群體中個體的適應(yīng)度評估基礎(chǔ)上的。（4）交叉運(yùn)算過程：將交叉算子作用于群體。所謂交叉，是指把兩個父代個體的部分結(jié)構(gòu)加以替換重組而生成新個體的操作。遺傳算法中起核心作用的就是交叉算子。（5）變異運(yùn)算過程：將變異算子作用于群體。即對群體中個體串的某些基因座上的基因值作變動。群體P（t）經(jīng)過選擇、交叉、變異運(yùn)算之后得到下一代群體P（t1）。（6）終止條件判斷過程：若t>T，則以進(jìn)化過程中所得到的具有最大適應(yīng)度的個體作為最優(yōu)解輸出，終止計算。

任務(wù)2.2顏色空間模型及轉(zhuǎn)換

學(xué)習(xí)目標(biāo)（1）理解顏色空間的表示及轉(zhuǎn)換。（2）結(jié)合具體應(yīng)用，掌握顏色空間轉(zhuǎn)換的原因、方法及應(yīng)用場合。任務(wù)分析（1）在多媒體系統(tǒng)中經(jīng)常涉及用幾種不同的顏色空間表示圖形和圖像的顏色。常見的顏色空間模型有：RGB、YUV、HIS、CMYK、YCbCr、YIQ、HSV、CIELAB，它們是如何定義和表示的？（2）從一種顏色空間模型轉(zhuǎn)換到另一種顏色空間模型的流程是什么？（3）顏色空間轉(zhuǎn)換的意義是什么？（4）由于RGB顏色空間多用于顯示器等發(fā)光設(shè)備中，其他硬件設(shè)備大都與其之間有數(shù)據(jù)和圖像的傳輸，就不可避免地要與基于設(shè)備工藝的顏色空間進(jìn)行轉(zhuǎn)換。而與設(shè)備無關(guān)的基于感知的顏色空間用于圖像分析時也多依賴于顯示器，故與RGB顏色空間有關(guān)系的轉(zhuǎn)換在眾多轉(zhuǎn)換中占據(jù)著重要的地位。（5）實現(xiàn)下列顏色空間模型的轉(zhuǎn)換：RGB→CMY空間；RGB→YUV空間；RGB→YCbCr空間；RGB→HSI空間；RGB→CIELAB空間。2.2.1顏色的基本概念顏色是通過眼、腦和人們的生活經(jīng)驗所產(chǎn)生的一種對光的視覺效應(yīng)。人對顏色的感覺不僅僅由光的物理性質(zhì)所決定，比如人類對顏色的感覺還往往受到周圍顏色的影響。有時人們也將物質(zhì)產(chǎn)生不同顏色的物理特性直接稱為顏色。光是一種電磁波。電磁輻射的波長范圍很寬，按波長從長到短的順序排列，依次是無線電波、紅外線、可見光、紫外線、X射線和宇宙射線等。波長在380～780nm范圍內(nèi)的電磁波能夠使人眼產(chǎn)生顏色感覺，稱為可見光。可見光在整個電磁波譜中只占極小的一段。2.2.2彩色三要素描述一種色彩需要用亮度、色調(diào)和色飽和度三個基本參量，這三個參量稱為彩色三要素。1.亮度亮度反映光的明亮程度。彩色光輻射的功率越大，亮度越高，反之亮度越低；不發(fā)光物體的亮度取決于它反射光功率的大小。若照射物體的光強(qiáng)度不變，則物體的反射性能越好，物體越明亮，反之越暗；對于一定的物體，照射光越強(qiáng)，物體越明亮，反之越暗。2.色調(diào)色調(diào)反映彩色的類別，例如紅、橙、黃、綠、青、藍(lán)、紫等不同顏色。發(fā)光物體的色調(diào)由光的波長決定，不同波長的光呈現(xiàn)不同的色調(diào)；不發(fā)光物體的色調(diào)由照明光源和該物體的吸收、反射或透射特性共同決定。3.色飽和度色飽和度反映彩色光（色調(diào)）深淺的程度。同一色調(diào)的彩色光會給人以深淺不同的感覺。深紅、粉紅是兩種不同飽和度的紅色，深紅色飽和度高，粉紅色飽和度低。2.2.3三基色原理1.三基色原理根據(jù)人眼的視覺特性，在電視機(jī)中重現(xiàn)圖像時并不要求完全重現(xiàn)原景物反射或透射光的光譜成分，而應(yīng)獲得與原景物相同的彩色感覺。仿效人眼三種錐狀細(xì)胞，可以選擇三種基色，將它們按不同比例進(jìn)行組合，就可得到自然界中絕大多數(shù)的彩色。同樣絕大多數(shù)單色光也可以分解成紅、綠、藍(lán)三種色光。這是色度學(xué)的最基本原理，即三基色原理。這三種基色必須是獨(dú)立的，任何一種基色都不能由其他兩種顏色合成。自然界中絕大多數(shù)的彩色可以分解為三基色。在彩色電視中，選用了紅、綠、藍(lán)作為三基色，分別用R、G、B來表示。2.相加混色原理在一般的彩色電視中，通常使用以下兩種相加混色法：（1）空間混色法：它將三種色光投射到同一表面上彼此相距很近的三個點(diǎn)上，由于人眼的分辨力有限，故產(chǎn)生一種基色光混合的色彩感覺。（2）時間混合法：它把三種基色光輪流投射到同一表面上，只要輪流速度足夠快，就能達(dá)到相加混色的效果（人的視覺惰性）。3.相減混色原理在白光照射下，青色顏料吸收紅色而反射青色，黃色顏料吸收藍(lán)色而反射黃色，品紅顏料吸收綠色而反射品紅。2.2.4RGB與CMY顏色空間模型1.RGB顏色空間模型在多媒體計算機(jī)中，使用最多的是RGB顏色空間模型。計算機(jī)和電視機(jī)的彩色顯示器的輸入需要RGB的彩色分量，通過3個分量的不同比例，在顯示器屏幕上合成所需要的任一顏色，所以此模型是相加性的。不管其中采用什么形式的顏色空間表示，多媒體系統(tǒng)的最終輸出一定要轉(zhuǎn)換為RGB表示。在RGB顏色空間模型中，對任意彩色光F，其配色方程可寫為F=r[R]+g[G]+b[B]2.CMY顏色空間模型彩色印刷或彩色打印的紙張是不能發(fā)射光線的，因而印刷機(jī)或彩色打印機(jī)就只能使用一些能夠吸收特定的光波而反射其他光波的油墨或顏料。CMY模型將青色（C）、品紅(M)、黃色（Y）三種不同比例的彩色墨放到印版上來展現(xiàn)出種類繁多的色彩。該模型根據(jù)色彩的減法來得到其他彩色，這種方法稱為減色合成法。3.兩者的關(guān)系因為CMY通過減色合成法得到，RGB通過加色混合法得到，故兩者是互補(bǔ)的。2.2.5RGB與YUV顏色空間模型1.YUV顏色空間模型YUV是PAL（PhaseAlternatingLine，逐行倒相）制彩色電視系統(tǒng)所采用的一種顏色空間模型，其中Y表示亮度，U表示藍(lán)色色差（即B-Y），V表示紅色色差（即R-Y）。亮度信號Y和色度信號U、V是分離的，完成了彩色和黑白電視的對接，使帶顏色的圖像能在所有電視機(jī)上顯示；U、V為色差并且能完全顯示所有彩色。它被歐洲的電視系統(tǒng)廣泛采用。另外，可以利用人眼對彩色的敏感度低于對亮度的敏感度的視覺特性，用較窄的頻帶傳送U、V信號，優(yōu)化彩色電視信號的傳輸。即用亮度信號Y傳送細(xì)節(jié)，用色差信號U、V進(jìn)行大面積涂色。因此，彩色信號的清晰度由亮度信號的帶寬保證，而把色差信號的帶寬變窄。2.RGB與YUV的關(guān)系RGB與YUV的轉(zhuǎn)換公式為3.與YUV相似的YIQ顏色空間模型YIQ模型中Y也為所有電視提供亮度信號，I和Q表示色度，即圖像的色調(diào)及飽和度，該模型被北美的電視系統(tǒng)廣泛采用。YIQ顏色空間是由YUV推導(dǎo)而來，是NTSC制彩色電視系統(tǒng)所采用的一種顏色空間模型；I代表“同相”，Q代表“正交”，它們指的是用于發(fā)射顏色信息的調(diào)制方法；I、Q是通過將U、V軸逆時針旋轉(zhuǎn)33°獲得的。由人眼彩色視覺的特性表明，人眼分辨紅、黃之間顏色變化的能力最強(qiáng)，而分辨藍(lán)、紫之間顏色變化的能力最弱。通過一定的變化，I對應(yīng)于人眼最敏感的色度，而Q對應(yīng)于人眼最不敏感的色度。這樣，傳送Q信號時可以用較窄的頻帶，而傳送分辨率較強(qiáng)的I信號時，可以用較寬的頻帶。4.RGB與YIQ的關(guān)系RGB與YIQ的轉(zhuǎn)換公式為

反轉(zhuǎn)換為2.2.6RGB與YCbCr顏色空間模型1.YCbCr顏色空間模型YCbCr是由YUV顏色空間派生出的一種顏色空間模型，主要用于數(shù)字電視系統(tǒng)。其中Y是亮度，可以完整地表示除了色度之外的所有圖像信息。色度信息完全存儲在Cb和Cr中，Cb代表藍(lán)色信息，Cr則代表紅色信息?；旧希琘CbCr和YUV代表相同的顏色空間，但YCbCr中的各成分是YUV顏色空間中各成分比例的補(bǔ)償數(shù)值。2.兩者的關(guān)系RGB與YCbCr的轉(zhuǎn)換公式為2.2.7RGB與HSI顏色空間模型1.HIS顏色空間模型HSI用色調(diào)（Hue）、色飽和度(Saturation)、亮度（Intensity）描述色彩信息，它可以用一個圓錐空間模型來描述。色調(diào)表示某顏色與純凈顏色的差距，飽和度表示純凈顏色中混入白色的多少，亮度代表眼睛受到光照射的強(qiáng)度。HSV與HSI近似相同，屬于同一類別，只有第三個分量不一樣，V代表明度（Value），HSV相比HSI在色彩的感知方面更好。2.2.8RGB與CIELAB顏色空間模型1.CIELAB顏色空間模型LAB是一種不常用的色彩空間。它是在1931年國際照明委員會（CIE）制定的顏色度量國際標(biāo)準(zhǔn)的基礎(chǔ)上建立起來的。1976年，經(jīng)修改后被正式命名為CIELAB。它是一種與設(shè)備無關(guān)的顏色系統(tǒng)，也是一種基于生理特性的顏色系統(tǒng)。它用數(shù)字化的方法來描述人的視覺感應(yīng)。L分量用于表示像素的亮度，取值范圍是[0，100]，表示從純黑到純白；A表示從紅色到綠色的范圍，取值范圍是[127，-128]；B表示從黃色到藍(lán)色的范圍，取值范圍是[127，-128]。LAB顏色空間比計算機(jī)顯示器、打印機(jī)甚至比人類視覺的色域都要大，在獲得同樣的精度時，LAB位圖比RGB或CMYK位圖需要的像素數(shù)要多。2.兩者的關(guān)系RGB無法直接轉(zhuǎn)換成LAB，需要先轉(zhuǎn)換成XYZ再轉(zhuǎn)換成LAB，即RGB-XYZ-LAB。

任務(wù)2.3車牌圖像的預(yù)處理

學(xué)習(xí)目標(biāo)（1）理解并掌握位圖圖像的基本概念、性能指標(biāo)。（2）理解并掌握圖像的灰度化處理、常用邊緣檢測算子、常用圖像增強(qiáng)方法、數(shù)學(xué)形態(tài)學(xué)處理等常用圖像預(yù)處理方法。（3）結(jié)合具體應(yīng)用，能夠選擇合適的圖像預(yù)處理方法加以應(yīng)用。（4）會用MATLAB編程實現(xiàn)常用預(yù)處理方法。任務(wù)分析（1）針對獲取的車牌圖像，采用怎樣的處理流程實現(xiàn)車牌的提取？（2）在每個流程中，可以采用哪些處理方法，為什么選擇這種方法？（3）這些方法如何實現(xiàn)？（4）應(yīng)用圖像預(yù)處理方法的效果怎樣？還能再改進(jìn)哪些地方？2.3.1認(rèn)識位圖圖像在對圖像進(jìn)行預(yù)處理前，應(yīng)先了解有關(guān)圖像處理的基礎(chǔ)知識，這有助于對圖像進(jìn)行分析和處理方法的選擇。1.圖像與位圖圖像圖像（Image）是指由輸入設(shè)備捕捉的實際場景畫面，或以數(shù)字化形式存儲的任意畫面。靜止的圖像可用一個矩陣來表示，矩陣列中的各個元素用來描述構(gòu)成圖像的各個點(diǎn)（稱為像素Pixel）的強(qiáng)度和顏色等信息。這種圖像也稱為位圖（Bitmap）。2.位圖圖像的技術(shù)指標(biāo)1）分辨率（1）顯示分辨率：確定屏幕上顯示圖像區(qū)域的大小，即構(gòu)成全屏顯示的像素點(diǎn)個數(shù)，以每行擁有的像素點(diǎn)個數(shù)×屏幕顯示行數(shù)來表示。（2）圖像分辨率：確立組成一幅圖像的像素數(shù)目，即該圖像在水平和垂直方向上的像素個數(shù)，用dpi（每英寸多少點(diǎn)）表示。不同分辨率的圖如圖2-3-2所示，圖像分辨率與清晰度的關(guān)系如圖2-3-3所示。（3）打印分辨率：打印機(jī)輸出圖像時采用的分辨率。不同打印機(jī)最高分辨率不同，而同一臺打印機(jī)也可以使用不同分辨率進(jìn)行打印。2）像素深度像素深度描述圖像中每個像素數(shù)據(jù)所占的二進(jìn)制位數(shù)，它決定了彩色圖像中可出現(xiàn)的最多顏色數(shù)，或灰度圖像中最大灰度等級數(shù)。3）真彩色、偽彩色與直接色（1）真彩色：圖像中的每個像素值都分成R、G、B三個基色分量，每個基色分量直接決定其基色的強(qiáng)度，這樣產(chǎn)生的顏色稱為真彩色。（2）偽彩色：圖像中每個像素值是一個索引或代碼值，作為顏色查找表中某項入口地址，查找出包含實際R、G、B的強(qiáng)度值，這樣產(chǎn)生的顏色稱偽彩色。（3）直接色：通過每個像素點(diǎn)R、G、B分量分別作為索引值進(jìn)行變換，經(jīng)相應(yīng)顏色變換表找出各自基色強(qiáng)度，用變換后的R、G、B強(qiáng)度值產(chǎn)生的顏色稱為直接色。4）調(diào)色板在生成一幅位圖圖像時，圖像處理軟件要對圖像中不同的色調(diào)進(jìn)行采樣，產(chǎn)生包含在此幅圖像中各種顏色的顏色表，即一組（R，G，B）組合值，這個顏色表就稱作調(diào)色板。5）顯示深度顯示深度表示顯示緩存中記錄屏幕上一個點(diǎn)的二進(jìn)制位數(shù)，即顯示器可顯示的顏色數(shù)。顯示深度大于像素深度時，屏幕上的顏色能夠比較真實地反映圖像文件的顏色效果；顯示深度小于像素深度時，屏幕上的顏色不能真實地反映圖像文件的顏色效果，即發(fā)生失真；顯示深度等于像素深度時，若真彩色顯示模式顯示真彩色圖像，或顯示調(diào)色板與圖像調(diào)色板一致，則屏幕上顏色能較真實地反映圖像色彩效果，不一致則顯示顏色會出現(xiàn)失真。6）位圖圖像的數(shù)據(jù)量位圖圖像的數(shù)據(jù)量的估算方法為3.位圖的特點(diǎn)（1）表達(dá)圖像逼真：位圖與圖像復(fù)雜程度無關(guān)，表現(xiàn)力強(qiáng)，適合表現(xiàn)細(xì)節(jié)和層次。（2）對硬件要求高：當(dāng)處理高質(zhì)量彩色圖像時，對計算機(jī)硬件平臺要求較高。（3）文件數(shù)據(jù)量大：位圖由大量不同的亮度和顏色像素點(diǎn)組成，因此文件數(shù)據(jù)量大。（4）缺乏靈活性能：當(dāng)位圖圖像被放大時，圖像的清晰度會降低并出現(xiàn)鋸齒。4.位圖文件的結(jié)構(gòu)位圖文件的結(jié)構(gòu)主要包含文件頭、文件體、文件尾三部分。2.3.2矢量圖與位圖的區(qū)別1.矢量圖的定義矢量圖是一種抽象化的圖像。它用一組計算機(jī)指令集合描述圖形內(nèi)容，這些指令描述構(gòu)成該圖形所有直線、圓、圓弧、矩形、曲線等圖元的位置、維數(shù)和形狀等。在計算機(jī)屏幕上顯示矢量圖形有專門的軟件，如AutoCAD、CorelDraw、Adobe、Illustrator等。2.矢量圖的原理矢量圖的原理在于它用數(shù)學(xué)方式來描述一幅圖形。當(dāng)在計算機(jī)上顯示一幅圖時，先要使用專門軟件讀取并解釋這些指令，再將它們轉(zhuǎn)成屏幕上顯示的形狀和顏色，最后通過使用實心的或有等級深淺的單色或色彩填充一些區(qū)域而形成圖形。3.矢量圖的特點(diǎn)（1）壓縮后不變形：尺寸可以任意變化而不損失圖像質(zhì)量，壓縮后不會變形。（2）局部可處理性：各部件相對獨(dú)立，無論放大、縮小或旋轉(zhuǎn)等都不會失真。（3）文件數(shù)據(jù)量?。簩D像進(jìn)行抽象化，它使用圖形指令集合取代原始圖像。（4）不易描述復(fù)雜圖：對復(fù)雜圖，計算機(jī)要花費(fèi)很長的時間去執(zhí)行繪圖指令。4.矢量圖與位圖的對比2.3.3彩色圖像的灰度化處理灰度圖像只有亮度，不含其他顏色，它的值在0~255之間，且數(shù)值越大越亮，數(shù)值越小越暗，最亮為白色，最暗為黑色?；叶葓D像的處理速度快、操作簡單、儲存空間小，更有利于車牌定位處理。每個像素等于三個基色的加權(quán)平均值，根據(jù)人眼對三個基色的敏感性強(qiáng)弱，可給予三個基色不同的權(quán)值。2.3.4圖像的增強(qiáng)處理圖像增強(qiáng)處理的目的：一是改善圖像的視覺效果，二是將圖像轉(zhuǎn)換成一種更適合讓人或機(jī)器進(jìn)行分析和處理的形式。根據(jù)所處理的空間不同，可以有兩大類處理方法：基于空間域的方法：直接在圖像所在的空間進(jìn)行處理?；陬l率域的方法：在圖像變換域間接進(jìn)行處理。2.3.5圖像的二值化處理圖像二值化就是將圖像上像素點(diǎn)的灰度值設(shè)置為0或255，也就是將整個圖像呈現(xiàn)出明顯的黑白效果。將256個亮度等級的灰度圖像通過適當(dāng)?shù)拈撝颠x取，即可獲得仍然可以反映圖像整體和局部特征的二值化圖像。所有灰度大于或等于閾值的像素被判定為屬于特定物體，其灰度值為255，否則這些像素點(diǎn)被排除在物體區(qū)域以外，灰度值為0，表示背景或者例外的物體區(qū)域。常用的圖像二值化閾值的選取方法有雙峰法、P參數(shù)法、最大類間方差法（Otsu）、最大熵閾值法、迭代法等。該任務(wù)中采用最大類間方差法實現(xiàn)圖像的二值化處理。最大類間方差法是由Otsu于1979年提出的，它是基于整幅圖像的統(tǒng)計特性實現(xiàn)閾值的自動選取的，是全局二值化最杰出的代表。Otsu算法的基本思想是用某一假定的灰度值t將圖像的灰度分成兩組，當(dāng)兩組的類間方差最大時，此灰度值t就是圖像二值化的最佳閾值。設(shè)圖像有L個灰度值，取值范圍在0～L-1，在此范圍內(nèi)選取灰度值T，將圖像分成兩組，即G0和G1，G0的灰度值在0～T范圍內(nèi)，G1的灰度值在T+1～L-1范圍內(nèi)，用N表示圖像像素總數(shù)，ni表示灰度值為i的像素的個數(shù)。2.3.6圖像的邊緣檢測邊緣是圖像上灰度變化最明顯的地方，傳統(tǒng)邊緣檢測利用此特點(diǎn)，對圖像各像素點(diǎn)進(jìn)行求微分或二階微分來定位邊緣像素點(diǎn)。由灰度變化特點(diǎn)，可將邊緣類型分為階梯狀、脈沖狀和屋頂狀三種。對于階梯狀邊緣，圖像邊緣點(diǎn)對應(yīng)一階微分圖像的峰值和二階微分圖像的零交叉處；對于脈沖狀和屋頂狀邊緣，邊緣點(diǎn)對應(yīng)一階導(dǎo)數(shù)的零交叉和二階導(dǎo)數(shù)的峰值。根據(jù)數(shù)字圖像的特點(diǎn)，處理圖像時常采用差分代替導(dǎo)數(shù)運(yùn)算。對于圖像的簡單一階導(dǎo)數(shù)運(yùn)算，由于其具有固定的方向性，只能檢測特定方向的邊緣，所以不具有普遍性。為了克服一階導(dǎo)數(shù)的缺點(diǎn)，我們定義圖像的梯度為梯度算子，它是圖像處理中最常用的一階微分算法。圖像梯度最重要的性質(zhì)是梯度的方向在圖像灰度最大變化率上，恰好可以反映出圖像邊緣上的灰度變化。邊緣檢測算子是利用圖像邊緣的突變性質(zhì)來檢測邊緣的。它主要分為兩種類型：一種是以一階導(dǎo)數(shù)為基礎(chǔ)的邊緣檢測算子，通過計算圖像的梯度值來檢測圖像邊緣；另一種是以二階導(dǎo)數(shù)為基礎(chǔ)的邊緣檢測算子，通過尋求二階導(dǎo)數(shù)中的過零點(diǎn)來檢測邊緣。2.3.7數(shù)學(xué)形態(tài)學(xué)處理數(shù)學(xué)形態(tài)學(xué)的基本思想是運(yùn)用具有一定形態(tài)結(jié)構(gòu)的元素去度量和提取圖像中的對應(yīng)形狀，以達(dá)到對圖像分析和識別的目的，它能有效地消除噪聲。在進(jìn)行邊緣檢測之后，車牌的特征已經(jīng)很明顯得到了加強(qiáng)，為了進(jìn)一步確定車牌的位置，還要對它進(jìn)行數(shù)學(xué)形態(tài)學(xué)處理。在形態(tài)學(xué)算法中，結(jié)構(gòu)元素是很重要的，它的形狀、大小的選擇以及運(yùn)算的性質(zhì)對于圖像的提取和識別起著關(guān)鍵作用。結(jié)構(gòu)元素過大會使候選區(qū)域增多，還可能會使車牌區(qū)域與背景區(qū)域連接起來，給車牌的定位帶來困難。結(jié)構(gòu)元素選取過小，則很可能會使車牌區(qū)域無法真正地連接在一起，就無法確定出車牌的候選區(qū)域。數(shù)學(xué)形態(tài)學(xué)的基本運(yùn)算有：腐蝕運(yùn)算、膨脹運(yùn)算、開運(yùn)算和閉運(yùn)算四種運(yùn)算。1.腐蝕運(yùn)算腐蝕是一種消除邊界點(diǎn)的過程，目的是使目標(biāo)縮小，空洞增大，以有效地消除孤立噪聲點(diǎn)。腐蝕可以把小于結(jié)構(gòu)元素的物體去除。2.膨脹運(yùn)算膨脹是將與目標(biāo)體接觸的所有背景點(diǎn)合并到物體中的過程，目的是使目標(biāo)增大，空洞減小，以填補(bǔ)目標(biāo)物體中的空洞。3.開運(yùn)算和閉運(yùn)算雖然腐蝕運(yùn)算可以將粘連的目標(biāo)物體分離，膨脹運(yùn)算可以將斷開的物體連接起來，但是這兩種運(yùn)算都存在一個問題：經(jīng)過腐蝕運(yùn)算后，目標(biāo)物體的面積小于原有面積；而經(jīng)過膨脹運(yùn)算后，目標(biāo)物體的面積大于原有面積。開運(yùn)算和閉運(yùn)算就是基于這個問題被提出的。開運(yùn)算的過程：先對圖像進(jìn)行腐蝕，然后再對圖像進(jìn)行膨脹，最后得到結(jié)果。開運(yùn)算通常用于去掉小對象物體，以及去掉目標(biāo)外的孤立點(diǎn)。開運(yùn)算在平滑目標(biāo)物體邊界的同時并不明顯改變其面積。閉運(yùn)算的過程：先對圖像進(jìn)行膨脹，然后再對圖像進(jìn)行腐蝕，最后得到結(jié)果。閉運(yùn)算主要用來填充物體內(nèi)的細(xì)小空洞，可以去掉目標(biāo)內(nèi)的孔。閉運(yùn)算在連接鄰近物體、平滑其邊界的同時并不明顯改變其面積。

任務(wù)2.4霧霾圖像的增強(qiáng)處理

學(xué)習(xí)目標(biāo)（1）掌握常用的圖像處理方法。（2）結(jié)合霧霾天氣下獲取的圖像，能夠分析圖像特征，采用合適的方法進(jìn)行圖像增強(qiáng)處理。（3）能夠舉一反三，對于惡劣天氣條件下獲取的圖像，能夠采用合適的方法，對圖像進(jìn)行有效增強(qiáng)處理。任務(wù)分析（1）通常采用的霧霾圖像增強(qiáng)方法有哪些？各自是如何實現(xiàn)的？（2）不同增強(qiáng)方法在增強(qiáng)效果上有什么不同？傳統(tǒng)的方法是否存在弊端，能否改進(jìn)？怎樣改進(jìn)？（3）每種方法實現(xiàn)的流程是怎樣的？2.4.1直方圖均衡化算法直方圖是一種能反映圖像灰度分布情況的圖表。圖像的不同灰度值出現(xiàn)的概率和像素數(shù)量的多少，反映了圖像的信息內(nèi)容。直方圖均衡化就是經(jīng)過某種變換之后能使圖像灰度的概率變得更均勻化，使其信息熵能夠達(dá)到最大值。要尋找一種算法，實現(xiàn)經(jīng)過該算法變換后，圖像的所有像素分布的概率密度為1。設(shè)圖像的原像素灰度值為r(0≤r≤1)，概率密度為Pr(r)；經(jīng)過一系列變換之后，像素灰度值為s，概率密度為Ps(s)；T(r)為變換過程函數(shù)，則得出以下等式：以上等式所要滿足的條件有：①T(r)必須是單值單調(diào)遞增函數(shù)，從而保證灰度是單值映射的同時且灰度值不會出現(xiàn)反轉(zhuǎn)；②0≤T(r)≤1，確保原圖像的灰度動態(tài)范圍在經(jīng)過變換后不會被縮小，假設(shè)令則有2.4.2改進(jìn)的直方圖均衡化算法直方圖均衡化理論主要是針對于連續(xù)函數(shù)，然而對具有離散灰度值的數(shù)字圖像進(jìn)行處理時，就需要在函數(shù)變換過程中，灰度值經(jīng)歷從連續(xù)到離散的近似。因而在直方圖均衡化中存在的問題有以下幾點(diǎn)：（1）量化誤差，損失了原圖中的某些灰度信息。（2）由于原圖像中的低灰度層像素過多，概率密度極其不均勻，從而導(dǎo)致整個圖像的灰度動態(tài)范圍未能有效改善，在進(jìn)行直方圖均衡化過程中，圖像高低灰度的轉(zhuǎn)變導(dǎo)致圖像信息轉(zhuǎn)化不均衡，導(dǎo)致一些信息被覆蓋。為了解決這個問題，人們對常規(guī)的直方圖變換進(jìn)行改進(jìn)。改進(jìn)算法的基本思想是：通過變換函數(shù)對原圖像的直方圖進(jìn)行灰度拉伸，使其生成具有“平坦”概率分布的直方圖，再用新的均衡化后的直方圖去校正圖像。1.具體改進(jìn)方法（1）減少原圖像的低灰度層在生成圖像中的概率，進(jìn)而減少其對生成圖像的影響，使生成圖像的灰度分布范圍更廣。（2）由于原來圖像的低灰度層范圍的像素較密，分布不均勻，從整體觀察，相近的區(qū)域亮度相差較大，不利于對中間細(xì)節(jié)信息的觀察，為此需要對生成圖像作適當(dāng)?shù)恼{(diào)整，對亮度參數(shù)進(jìn)行修正。以下列出調(diào)整函數(shù)變換：在

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《多媒體信息與通信》課件第2章

文檔簡介

溫馨提示

最新文檔

評論

《多媒體信息與通信》課件第2章

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔