基于數學形態(tài)學和投影法的車牌定位算法_第1頁
基于數學形態(tài)學和投影法的車牌定位算法_第2頁
基于數學形態(tài)學和投影法的車牌定位算法_第3頁
基于數學形態(tài)學和投影法的車牌定位算法_第4頁
基于數學形態(tài)學和投影法的車牌定位算法_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大學本科學生畢業(yè)設計(論文)基于數學形態(tài)學和投影法的車牌定位算法大學光電工程學院GraduationDesign(Thesis)ofChongqingVehicleLicensePlatelocationBasedonprojectionandMathematicalMorphologyUndergraduate:LiHuiyingSupervisor:Prof.LiZhiminAssistantSupervisor:LiangJunMajor:InformationEngineeringCollegeofChongqingJune2009重慶大學本科學生畢業(yè)設計(論文)摘要PAGEI摘要車牌識別技術是智能交通領域的重要課題之一,它主要包括車牌定位、字符分割、字符識別三個部分。其中,車牌定位算法的處理效果對字符識別起著決定性的作用。因此研究車牌定位算法有著重要的現實意義。本文采用了一種由數學形態(tài)學和投影法相結合的車牌定位方法,定位過程由以下幾個步驟實現:首先,是車牌圖像的預處理,它包括圖像的灰度化、灰度線性變換、二值化、圖像去噪等;然后,采用數學形態(tài)學算子進行車牌粗定位以提取候選車牌區(qū)域,因為它可增大目標、縮小孔洞,填補目標中的空洞,使目標形成連通域;最后,對車牌進行行掃描和列掃描,通過對跳變點的判斷完成車牌細定位。這種利用數學形態(tài)學方法對傳統(tǒng)投影定位法進行改進,從而實現車牌的準確定位的方法,具有定位準確、運算快速的優(yōu)點,適合實際應用。通過實驗表明,該方法的定位準確率達到了98.3%,定位時間約為40ms,基本上滿足了在復雜背景下有效提高了車牌圖像定位的準確性和運算速度等要求。關鍵詞:數學形態(tài)學,投影法,車牌定位,二值化重慶大學本科學生畢業(yè)設計(論文)ABSTRACTPAGEIIIABSTRACTThetechnologyofLicensePlateRecognitionisanimportantissueinthefieldofintelligenttransportation,whichincludesthreeparts:licenseplatelocation,charactersegmentation,characterrecognition.Amongthem,theeffectofthelicenseplatelocationplaysadecisiveroleinthecharacterrecognition.Sothereisaverypracticalsignificanceinstudyingthealgorithmoflicenseplatelocation.Thispaperpresentsalicenseplatelocationalgorithmbasedonprojectionwhichassociatewithmathematicalmorphology.Locationprocessingiscametruebythefollowingsteps:firstofall,preprocessingofthelicenseplateimage,whichincludesthecolortogray,gray-linear-transformation,binarization,imagedenoising,etc;then,usemorphologicaloperatorsforlicenseplateregion’sroughdetection,becauseitcaneliminatelittleobjectsandfillinlittleholesofobjects;finally,licenseplateexactlylocation,ontheplateforhorizontalandverticalprojection,hoppingtojudgetheaccuratepositionoftheplatesthroughthesaltuspoint.Thismethodwhichisusedmathematicalmorphologytoimprovethetraditionalprojectioninordertoachieveaccuratepositioningissuitableforpracticalapplicationwiththeadvantagesofpositioningaccuracyandsimpleoperation.Experimentsshowthatthemethod’spositioningaccuracyratereach98.3percent,positioningtimeisabout40ms,itmeetsthebasicrequirementsthatimprovingpositioningaccuracyandcomputationalspeedinthecomplexitybackgroundofthelicenseplateimageeffectively.Keywords:mathematicalmorphology,projections,platelocation,binarization重慶大學本科學生畢業(yè)設計(論文)目錄PAGEV目錄中文摘要 IABSTRACT II1緒論 11.1課題背景和現實意義 11.2國內外研究現狀 21.2.1LPRS的主要應用技術 21.2.2車牌定位的研究現狀 31.2.3車牌字符識別的研究現狀 51.3本文研究內容和各章安排 62圖像預處理 82.1圖像的灰度化 82.2灰度線性變換 92.2.1圖像增強介紹 92.2.2灰度線性變換 102.2.1基于區(qū)域分割的分段線性變換 112.3二值化 122.4中值濾波去噪 142.4.1中值濾波 143車牌定位 173.1基于數學形態(tài)學的粗定位 173.1.1數學形態(tài)學的發(fā)展史 173.1.2數學形態(tài)學與圖像處理 183.1.3數學形態(tài)學的有關定義 193.1.4基于形態(tài)學運算的候選區(qū)域選取 203.1.5基于結構特征的候選區(qū)域篩選 223.2基于投影法的車牌圖像精確定位 223.2.1水平方向定位 233.2.2牌照垂直方向的定位算法 244結論與展望 264.1實驗結果 264.2課題主要研究成果和創(chuàng)新點 264.3研究工作的展望 27參考文獻 28重慶大學本科學生畢業(yè)設計(論文)第1章緒論PAGE261緒論近年來,隨著國民經濟的快速發(fā)展,各種機動車輛不斷增加,導致道路交通量不斷增大,交通事故、交通堵塞等問題日益嚴重,我國正面臨著道路網通行能力不能滿足交通量增長需求等問題。為了解決這些問題,部分發(fā)達國家相繼推出了適應未來運輸需求的智能交通系統(tǒng)(IntelligentTrafficManagementSystem,ITS),我國也將發(fā)展ITS作為今后交通建設的一個重要發(fā)展方向。作為現代智能交通系統(tǒng)中的一項非常重要的技術,車牌識別(LicensePlateRecognition,LPR)技術是近幾年來的研究熱點。其涉及的領域包括模式識別、圖像處理、人工智能、信息論、計算機等多門學科,是一門綜合的應用技術。它主要包括車牌定位、字符分割、字符識別三個部分。其中,車牌定位與字符分割算法的處理效果對字符識別起著決定性的作用。車牌識別系統(tǒng)既具有重要的理論意義,也具有良好的實際應用價值,并且在現實生活中已經得到一定程度的應用。雖然它的研究已經有一段時間,但現有的車牌定位算法環(huán)境適應性差,在復雜背景下存在著定位困難的問題,因此車牌定位算法的研究仍有著很深的現實意義。本章首先就本課題提出的背景和現實意義進行闡述,然后對國內外車牌識別技術的研究現狀做一個概況。最后講述本文的內容安排。1.1課題背景和現實意義隨著21世紀經濟全球化和信息時代的到來,計算機技術、通信技術和網絡技術迅猛發(fā)展,自動化的信息處理能力和水平不斷提高,并在人們社會活動和生活的各個領域得到廣泛應用。高速度、高效率的生活節(jié)奏,使汽車普及成為必然趨勢。伴隨著世界各國汽車數量的增加,城市交通狀況日趨嚴峻,如何有效地進行交通管理,越來越成為各國政府相關部門關注的焦點。針對這一問題,人們運行先進的科學技術,相繼研發(fā)了各種交通道路監(jiān)視管理系統(tǒng)、車輛控制系統(tǒng)及公共交通系統(tǒng)。這些系統(tǒng)將車輛和道路綜合起來進行考慮,運行各種先進的技術解決道路交通的問題,統(tǒng)稱為智能交通系統(tǒng)。ITS是90年代興起的新一代交通運輸系統(tǒng)。它利用先進的信息處理技術、導航定位技術、無線通信技術、自動控制技術、圖像處理和識別技術及計算機網絡技術等加強道路、車輛、駕駛員和管理人員的聯(lián)系,實現道路交通管理自動化和車輛行駛的智能化,增強交通安全,減少交通堵塞,提高運輸效率,減少環(huán)境污染,節(jié)約能源,提高經濟活力。車牌識別系統(tǒng),是智能交通系統(tǒng)的重要組成部分,是交通管理自動化的重要手段和車輛檢測系統(tǒng)的一個重要環(huán)節(jié),在交通監(jiān)視和控制中占有很重要的地位。車輛牌照識別系統(tǒng)本身是一個整體的智能化解決方案,系統(tǒng)同時具有良好的維護性和擴展性,可在無需為車輛加裝其他特殊裝置情況下實現對車輛的自動檢測。車牌識別技術的推廣普及,必將對加強城市道路管理、提高運輸效率、提高經濟活力、減少交通事故及車輛被盜案件的發(fā)生、保障社會穩(wěn)定等方面產生重大而深遠的影響,因而對LPR技術的研究和應用系統(tǒng)開發(fā)具有重要的實際意義。目前的車牌識別系統(tǒng)主要是針對車輛自動注冊和收費、停車場管理等場合,所監(jiān)視區(qū)域的背景一般比較簡單。而實際應用中,所監(jiān)視的如高速公路、城市要道等往往都比較復雜,它包括一些路標、廣告牌、樹木、行人、建筑物等,都會對車輛檢測造成干擾,加上光照條件、拍攝角度等因素的影響,造成目前的算法不夠準確、快速,不能夠適應復雜背景下的車牌識別。這就要求車牌識別算法必須要具有較強的適應性,能夠去除各種干擾背景,可以克服視角不同所造成的車牌的變形,并能對不同尺度大小的車輛進行檢測等。因此,復雜背景下的車牌識別系統(tǒng),如果能夠實現高實時性和高識別率的話,必定可以創(chuàng)造出可觀的社會經濟效益。1.2國內外研究現狀本課題重點是對LPRS的相關技術進行研究,因此本節(jié)主要介紹與此相關的研究現狀,且分為以下三個部分:“LPRS的主要應用技術”、“車牌定位”和“車牌字符識別”的研究現狀。1.2.1LPRS的主要應用技術上世紀90年代初,各國學者對LPRS展開了研究,當前主要采用IC卡識別、條形碼識別、數字圖像處理、傳統(tǒng)模式識別和人工神經網絡等技術來實現系統(tǒng)要求。eq\o\ac(○,1)IC卡識別技術:IC卡是一種集微電子技術、通訊技術和計算機技術于一體的高科技產品,利用IC卡技術進行車牌識別,主要是指在車上安裝一個微型的電子信號接收和發(fā)射裝置即IC卡,卡內存儲了該車的車牌號碼以及其他一些信息,當車通過設有車輛檢測裝置的路口時,IC卡系統(tǒng)將與路口的計算機系統(tǒng)進行對話,使之識別出車牌號碼及其他信息,從而實現車輛的監(jiān)督和管理。IC卡識別技術具有識別率高,運行可靠和全天候作業(yè)等優(yōu)點,但整套裝置價格昂貴,硬件十分復雜,不適用于異地作業(yè),且需要制定出全國統(tǒng)一的標準。eq\o\ac(○,2)條形碼識別技術:在車輛的側面印刷條形碼或是制作帶有條形碼的車牌,條形碼包含了該車車型、車牌號碼等基本信息,當車通過紅外線掃描器時,條形碼上的信息被反射到讀取單元并被抽取出來,從而實現識別功能。條形碼識別技術具有識別速度快識別率高、成本低等優(yōu)點,但是該技術對于掃描器的要求很高,而且同IC卡技術一樣,須在全國范圍內制定出統(tǒng)一的標準。eq\o\ac(○,3)數字圖像處理技術:數字圖像處理(DigitalImageProcessing)又稱為計算機圖像處理,它是指將圖像信號轉換成數字信號并利用計算機對其進行處理的過程,具體的講就是將連續(xù)的模擬圖像變成離散的數字圖像后,用建立在特定的物理模型和數學模型基礎上編制的程序控制、運行并實現種種要求的處理。在LPRS中,用數字圖像處理實現識別的技術具有低成本、對硬件依賴性小等優(yōu)點,但其識別率的高低主要取決于識別算法。eq\o\ac(○,4)傳統(tǒng)模式識別技術:傳統(tǒng)模式識別技術一般包括模版匹配算法,統(tǒng)計特征等。進入90年代,由于計算機視覺技術(ComputerVisionTechnique)的發(fā)展,開始對車牌識別進行系統(tǒng)化的研究。1990年A.S.Johnson等運用計算機視覺技術開發(fā)出一套LPRS。該系統(tǒng)分為圖像分割、特征提取和模塊構造、字符識別等三個部分。利用不同閾值對應的直方圖,經過實驗確定出車牌位置的閾值范圍,從而根據特定閾值對應的直方圖分割出車牌,再利用預先設置的標準字符模塊進行模塊匹配。它具有識別率高的優(yōu)點,但識別速度較慢。eq\o\ac(○,5)人工神經網絡技術:近幾年來,一些發(fā)達國家開始探討用人工神經網絡解決車牌識別問題。它具有并行計算,分布式信息存儲,容錯能力強以及具備自適應學習功能等一系列優(yōu)點,但是它常常將初始權值取為零或隨機數,從而增加網絡的訓練時間或陷入非要求的局部最小值??偨Y上述技術,發(fā)現現階段最可行的車牌識別方法就是數字圖像處理技術。1.2.2車牌定位的研究現狀車牌定位(LicensePlateLocation,LPL)就是把車牌區(qū)域完整的從一幅具有復雜背景的車輛圖像中分割出來,它是LPRS中至關重要的一步。對于一幅車輛圖像來說,車牌區(qū)域只占全圖的一小部分,要想將其準確定位并分割出來是非常困難的,這就要求研究人員對車牌區(qū)域內字符的紋理特征和字符與其背景之間的灰度特征進行分析,尋找它們之間的差別。當前最常見的定位技術主要有:“基于邊緣檢測的方法”、“基于彩色分割的方法”、“基于小波變換的方法”和“遺傳算法”等。eq\o\ac(○,1)基于邊緣檢測的車牌定位方法:所謂“邊緣”就是指其周圍像素灰度有階躍變化的那些像素的集合。邊緣的兩側分屬于兩個區(qū)域,每個區(qū)域的灰度均勻一致,而兩個區(qū)域的灰度在特征上存在一定差異。邊緣檢測的基本原理是對圖像進行微分來達到檢測的目的。微分運算的結果表明:凡是灰度迅速變化的點都具有較高的微分值。大多數的邊緣檢測方法是基于方向導數掩模求卷積的方法。eq\o\ac(○,2)基于彩色分割的車牌定位方法:該方法由彩色分割和目標定位等模塊組成,采用多層感知器網絡對彩色圖像進行分割,然后通過投影法分割出潛在的車牌區(qū)域。在進行彩色分割時采用神經網絡模型,一般圖像采用RGB三原色,但RGB三原色中兩點的歐氏距離與顏色距離不成線性比例。為了更好的進行彩色分割,將RGB模式的彩色圖像轉化為HSI模式,然后對輸出圖像的飽和度作調整。為了減少計算量,將彩色圖像抽稀后再進行模式轉化,同時為了減少光照條件對圖像分割產生的影響,采用對數方法進行彩色飽和度調整。然后對模式轉化后的彩色圖像進行彩色神經網絡分割,最后根據車牌底色及長寬比等先驗知識,采用投影法分割出合理的車牌區(qū)域。當獲取的彩色圖像質量較高時,尤其是車牌區(qū)域顏色與附近顏色差別較大時,該定位算法正確率較高,但當區(qū)域顏色與附近顏色相似時,正確率將有所下降,且由于采用了神經網絡計算,因而計算速度較慢。eq\o\ac(○,3)基于小波變換的車牌定位:提出了一種基于小波分析和數學形態(tài)學的車牌定位方法,該方法通過小波多尺度分解提取出紋理清晰且具有不同空間分辨率、不同方向的邊緣子圖;然后利用車牌目標區(qū)域具有水平方向低頻、垂直方向高頻的的特點實現子圖提?。蛔詈笥脭祵W形態(tài)學方法對小波分解后的細節(jié)圖像進行一系列的形態(tài)運算,進一步消除無用信息和噪聲,以確定車牌位置。該方法在噪聲較小條件下定位效果好,分割精度高,其缺點是速度較慢,且在噪聲較大時誤定位機率也隨之增大。eq\o\ac(○,4)基于遺傳算法的車牌定位:該方法利用遺傳算法對圖像進行優(yōu)化搜索,結合區(qū)域特征矢量構造適應度函數,最終尋找車牌區(qū)域的最佳定位參量。車牌定位是尋找一個符合“車牌區(qū)域特征”最佳區(qū)域的過程,本質上就是從參量空間尋找最優(yōu)定位參量的問題,而尋找參量空間的最優(yōu)解正是遺傳算法最擅長的,但是在實時系統(tǒng)中,車牌定位速度受遺傳算法中迭代次數的影響很大。1.2.3車牌字符識別的研究現狀eq\o\ac(○,1)研究現狀:車牌字符識別實際上就是對車牌上的漢字、字母和數字進行準確確認的過程,其基本原理是將輸入字符與各個標準字符模版進行模式匹配,計算類似度,將具有最大類似度的標準字符作為識別結果輸出,當前字符識別的主要方法有“模板匹配法”、“神經網絡方法”、“特征點匹配法”、“光電混合聯(lián)合變換相關方法”和“小波法”等。模板匹配法計算快速,但對字符的噪聲、變形和光照較敏感。常用的神經網絡有BP神經網絡、Hopfield網絡和Coonan網絡等,其優(yōu)點是對于字符的噪聲和變形不敏感,缺點是不易區(qū)分特征值相近的字符,例如:0,D,Q,8,B等。特征點匹配法選取了能夠區(qū)分各字符的若干特征點,進而得到各字符的編碼,從而能較好的區(qū)分特征值相近的字符,但是該方法只適用于二值圖。光電混合聯(lián)合變換相關方法是利用“聯(lián)合變換相關器”根據輸出面上相關峰的位置確定目標圖像和參考圖像,但速度較慢。eq\o\ac(○,2)國內外字符識別的技術水平:字符識別中較難處理的是漢字識別。漢字識別技術是在英文、數字識別的基礎上,由日本學者于60年代末期最先開始研究的。并于1977年完成了日本通產省制定的“圖像信息處理系統(tǒng)”中的印刷漢字識別裝置,該裝置是一個龐大的硬件專用設備,可識別2000個漢字,識別速度可達到100字/秒。到80年代中期,日本的漢字識別技術已經相當成熟,并由東芝、三菱、三洋、松下等公司開發(fā)的以軟件為主并使用通用高檔微機的產品也已走向市場。我國于70年代末期開始對數字、英文、符號的識別進行研究,同期有少數大學和研究所對漢字識別方法進行了探索,并發(fā)表了一些學術論文,研究出少量模識識別軟件和系統(tǒng)。到80年代中期,我國漢字識別技術進入了研究的高潮,印刷體漢字識別技術的研究獲得了豐碩的成果,有11個單位進行了14次印刷體漢字識別成果的鑒定。進入90年代,在國家重點科研計劃的支持和市場驅動下,漢字識別系統(tǒng)一直朝著實用化的方向發(fā)展。今天,印刷體漢字識別已有四五個系統(tǒng),如北京信息工程學院研制的BI-OCR,清華大學研制的TH-OCR,國家智能計算機研究開發(fā)中心研制的NC-OCR,臺灣研究的丹青OCR等。它們能識別4000多個不同體、不同號的常用漢字,識別率達到95-99%,識別速度達到20-40字/秒。大陸和臺灣研制的聯(lián)機手寫漢字識別系統(tǒng)已有10多種,如中國科學院自動化研究所研制的漢王筆,臺灣研制的蒙恬筆等,市場銷售量已超過5萬套。這些系統(tǒng)能實時識別10000個以上的規(guī)范書寫的簡繁體漢字,筆順無限制或少限制,少數常用字可以連筆,識別率可達90%以上??傊覈∷Ⅲw漢字識別和聯(lián)機手寫漢字識別已經進入實用階段,其技術水平和當前世界最高水平并駕齊驅。1.3本文研究內容和各章安排本文以汽車牌照自動識別為背景,以車輛圖像為主要對象,深入研究了計算機圖像處理、人工智能、模式識別等背景知識,探索了用數字圖像處理進行車牌定位的方法。上述算法盡管在一定的條件下能夠分割出車牌,但車牌識別系統(tǒng)大多是在室外使用,這就會存在許多客觀的干擾,如天氣、背景、車牌磨損、圖像傾斜等因素,因此,定位并不理想,使得后期識別車牌難度增加,甚至產生拒絕識別或誤識別。而且這些方法多有針對性和局限性,適用范圍不大。傳統(tǒng)的投影定位法作為一種常用的車牌圖像定位技術也取得了一定的效果,但對車牌圖像質量有較高的要求,在實際應用中正確分割率不理想。由于形態(tài)學梯度基本能夠反映圖像的所有邊緣,而車牌圖像區(qū)是梯度變化較多區(qū)域,即邊緣信息較多區(qū)域,為此本文提出了一種新的車牌定位方法,采用一種基于投影法和數學形態(tài)學梯度相結合的車牌定位算法,即利用數學形態(tài)學方法對傳統(tǒng)定位方法投影法進行改進和優(yōu)化,將此二種方法相結合,最終獲得準確的車牌區(qū)域。定位流程圖如下:投影法定位投影法定位形態(tài)學邊緣檢測中值濾波去噪二值化彩色圖像灰度化灰度線性變換圖1.1程序流程圖本文各章安排如下:第一章:緒論部分,介紹了本課題的研究背景與現實意義。概述了車輛牌照識別系統(tǒng)在國內外的發(fā)展和應用現狀;簡單介紹了車牌識別系統(tǒng)中存在的難點;最后給出了本文的內容安排。第二章:詳細闡述了本文采用的車牌車牌圖像預處理的方法。首先,將圖像灰度化;然后對灰度圖像進行基于閾值分割的分段線性變換;再利用全局動態(tài)閾值化方法對圖像進行二值化后,最后對二值圖像進行中值濾波平滑去噪。第三章:結合形態(tài)學運算進行膨脹運算,并對膨脹后的連通區(qū)域進行篩選;再使用水平投影和垂直投影分別確定車牌的上下和左右邊界。第四章:總結全文,并對車牌定位和分割算法的研究加以展望,并提出了有待解決的問題。重慶大學本科學生畢業(yè)設計(論文)第2章圖像預處理2圖像預處理由CCD攝像機采集的圖象可以存儲在計算機中,為了用于牌照的分割和牌照字符的識別,原始圖像應具有適當的亮度,較大的對比度和清晰可辨的牌照圖像。但由于攝像工作在開放的戶外環(huán)境,加之車輛牌照的整潔度、自然光照條件、拍攝時CCD攝像機與牌照的距離和角度以及車輛行駛速度等因素的影響,牌照圖像可能出現模糊、歪斜和缺損等嚴重缺陷,因此需要對原始圖像進行識別前的預處理。2.1圖像的灰度化預處理前的圖像都是彩色圖像。對于彩色圖像,顏色本身就是其一個非常重要的屬性,所以在識別中可以利用顏色信息,于是發(fā)展了很多色彩模式,例如RGB模式、HSV模式、CMY模式、HSI模式、YUN模式等。顏色模型是三維顏色空間中的一個可見光子集,它包括某個顏色域的所有顏色。RGB(red,green,blue)(紅、綠、藍)是最常見的彩色模型,它是一種正方體的空間結構模型。紅、綠、藍是相互正交的坐標軸,每個坐標軸都量化為0~255,0對應最暗,255對應最亮。彩色立方體中任一點都表示一種顏色,RGB圖像又稱真彩色圖像,它是利用R,G,B這3個分量表示一個像素的顏色,通過三基色可以合成出任意顏色。以下是常見顏色的RGB數值,黑色=(0,0,0),白色=(255,255,255),灰色=(128,128,128),紅色=(255,0,0),綠色=(0,255,0),藍色=(0,0,255),青色=(0,255,255),品紅=(255,0,255),黃色=(255,255,0)。RGB彩色系統(tǒng)是通過對顏色進行加運算來完成顏色綜合的彩色系統(tǒng),其原點是黑色,通過在黑色中加入不同分量的紅色、綠色、藍色來得到某種彩色。大多數圖像格式都采用RGB模型來表示像素的顏色,Windows內部和位圖也采用RGB顏色模型。YUV模型(Y代表亮度,U和V是兩個彩色分量,表示色差)是另一種常見的顏色模型,主要用于多媒體計算機技術中,比如JPEG的圖像格式。其基本特征是將亮度和色度信號分離。由于人眼對亮度的變化比對彩色的更敏感,因此YUV模型中Y分量所占的帶寬大于彩色分量的帶寬。主要的YUV格式有4:1:1,4:2:2。彩色圖像包含著大量的顏色信息,不但在存儲上開銷很大,而且在處理上也會降低系統(tǒng)的執(zhí)行速度。由于圖像的每個象素都具有三個不同的顏色分量,存在許多與識別無關的信息,不便于進一步的識別工作,因此在對圖像進行識別等處理時需要將彩色圖像轉變?yōu)榛叶葓D像,以加快處理速度。YUV和RGB具有線性關系,其換算公式為:(2.1)灰度化結果如圖2.2所示:圖2.1原始圖像圖2.2灰度化后的圖像2.2灰度線性變換2.2.1圖像增強介紹對質量下降的圖像一般要進行改善。改善的辦法有兩類:一類是不考慮圖像質量下降的原因,只將圖像中感興趣的特征有選擇地突出,而衰減其它不需要的特征,故改善后的圖像不一定要逼近原圖像。這類圖像改善方法統(tǒng)稱為圖象增強技術。另一類改善圖像的方法是針對圖像質量下降的原因,設法去補償降質因素,從而使改善的圖像盡可能地逼近原圖像,這類圖像改善方法統(tǒng)稱為圖像復原技術。車輛圖像處理的目的是為了將感興趣的目標突出,因而要采用圖像增強技術來提高圖像質量。圖像增強技術有兩類方法:空間域法和頻率域法??臻g域法主要是在空間域內對圖像灰度值直接運算處理。頻率域法是在圖像的某種變換域內,對圖象的變換值進行運算。這是一種間接處理方法??臻g域增強是以對圖像的像素直接處理為基礎的增強,可用下式表示:(2.2)其中,是輸入圖像,是處理后的圖像,是對的一種操作,是圖像像素點的位置,操作最簡單的形式是鄰域為的尺度(即單個像素)。在這種情況下,僅依賴于在點的值,操作是灰度級變換函數,形式為。其中和分別為和在任意點的灰度級。2.2.2灰度線性變換如果一幅圖成像時由于光線過暗或曝光不足,則整幅圖將偏暗(如灰度范圍從0到63);光線過亮或曝光過度則圖像偏亮(如灰度范圍從200到255),這都會造成圖像對比度偏低問題,即灰度都擠在一起了,沒有拉開。在這種情況下,可以采用灰度變換的方法來增強圖像的對比度。所謂灰度變換就是將一個灰度區(qū)間映射到另一個灰度區(qū)間的變換。它是空間域圖像增強的一種,也就是通過分段線性變換函數來調整圖像灰度級的動態(tài)范圍,這樣的變換可以把我們感興趣的灰度區(qū)間拉開,使得亮的越亮,暗的越暗,從而達到增強對比度的目的。如圖2.3所示,通過點和點的位置控制變換函數的形狀,使得和之間的灰度級不同程度的展開,因而影響其對比度,以達到增強圖像之目的。圖2.3灰度線性變換示意圖分段線性變換公式如下:(2.3)(2.4)(2.5)(2.6)2.2.3基于區(qū)域分割的分段線性變換分段線性變換給出了變換的原理,合理的劃分灰度區(qū)間是取得較好增強效果的保證?;叶戎狈綀D描述了一幅圖像的灰度級內容,任何一幅直方圖都包括了可觀的信息,可以結合它來劃分灰度區(qū)間。但由于不能直觀地把某一灰度范圍和圖像中對應的區(qū)域聯(lián)系起來,調整灰度區(qū)間時帶有一定的盲目性,需要反復調整多次。本文提出的基于區(qū)域分割的分段線性變換提供了一種劃分灰度區(qū)間的方法,可以較快的確定圖像中需要增強的目標灰度范圍,然后變換到所需的灰度范圍。確定灰度變換區(qū)間包含如下三個方面:eq\o\ac(○,1)顯示圖像的灰度直方圖圖像的灰度直方圖是進行圖像處理的一種有利的工具,它顯示了圖像的灰度分布情況。通常,對于目標和背景的灰度可明確區(qū)分的圖像,目標對應直方圖中某一灰度范圍。通過觀察直方圖來確定谷點的大致位置,以它為分界點來確定目標的大致灰度范圍。本文生成了可以調節(jié)大小的灰度直方圖,其中橫坐標為0~255灰度級,縱坐標為圖中具有該灰度值的像素的個數。當圖像中包含較多的灰度級時,直方圖圖像的許多線會連成一片,這時調節(jié)直方圖的寬度,加大相鄰直線之間的距離即可找出分界點;當圖像中一些直線的長度較短又相距較近時,很難看出它們之間的相對長短,這時調節(jié)直方圖的高度,就可以看出它們之間的區(qū)別。當鼠標在直方圖圖像上移動時,可顯示縱橫坐標值。把灰度直方圖調整到合適的大小,這時就可以較容易確定谷點的大致位置。eq\o\ac(○,2)顯示圖像的像素灰度值灰度直方圖提供了圖像灰度分布的統(tǒng)計信息,但丟失了圖像像素的空間位置信息。對于含有多個目標的圖像,察看它們較大和較小的灰度級,可以確定多個目標的大致灰度范圍。圖像以像素為單位,當鼠標在圖像上移動時,顯示該位置處的坐標值和對應的灰度值。把鼠標放在目標上較亮和較暗的位置,就得到了較大和較小的灰度值。當灰度范圍太小,不宜察看較亮和較暗的位置,可以使鼠標在目標上來回移動來確定較大和較小的灰度值。eq\o\ac(○,3)顯示圖像的變換區(qū)域確定了某個灰度變換區(qū)間,我們并不知道所對應的圖像區(qū)域的確切范圍,通過顯示該灰度區(qū)間對應的圖像區(qū)域,可以知道要增強的目標是否包含在其內。由于人眼對顏色的信息較為敏感,對于灰度圖像,可以把某灰度區(qū)間對應的圖像區(qū)域顯示為彩色,這樣就可以得知劃分的灰度區(qū)間是否合理。通過顯示目標中沒有包含的區(qū)域或彩色部分中非目標區(qū)域的較大和較小的灰度值,調整灰度區(qū)間范圍,根據需要確定變換后的彩色部分大小是否合乎要求。實際應用時,我們可以靈活應用以上方法,大大加快了確定灰度變換區(qū)間的過程。然后進行分段線性變換,增強目標的對比度。灰度線性變換結果如圖2.4,變換后的圖像可以看清目標區(qū)域更多的細節(jié)信息,比較變換前后的直方圖,可見拉伸了目標對應的灰度區(qū)間,壓縮了背景對應的灰度區(qū)間。雖然損失了背景的一些信息,但目標得到了增強,變得清晰可見。圖2.4灰度線性變換后的圖像2.3二值化二值圖像是指整幅圖像畫面內僅有黑、白二值的圖像。在數字圖像處理中,二值圖像占有非常重要的地位。這是因為,一方面,有些需要處理的如文字圖像、指紋圖像、工程圖紙等圖像本身是二值的;另一方面,在某些情況下即使圖像本身是灰度的,我們也設法使它變成二值圖像再進行處理(即灰度圖像的二值化)。這是考慮到實用的圖像處理系統(tǒng)要求處理的速度高、成本低,信息量大,采用二值圖像進行處理,能大大地提高處理效率。而且,二值化后的圖像能夠用幾何學中的概念進行分析和特征描述,比灰度圖像優(yōu)勢大的多。在實際的車牌系統(tǒng)中,進行圖像二值變換的關鍵是要確定合適的閾值,根據閾值t來區(qū)分圖像中的對象和背景。在各種二值化方法中,全局閾值方法對輸入圖像量化噪聲或不均勻光照等情況抵抗能力差,在分割時會出現斷裂和大面積粘連現象,應用受到極大限制;局部閾值法也存在缺點和問題,分割時會出現非字符區(qū)域的干擾和粘連現象。當兩個相鄰的塊的閾值相差太大,二值化后的車牌字符就可能造成變形,不能保證字符筆劃連通性,降低了識別率。而且,該方法實現速度慢、容易出現偽影現象。本文采用全局動態(tài)閾值化方法進行二值化。該方法是從整個灰度圖像的像素分布出發(fā),尋求一個最佳的閾值。其中經典算法是OTSU算法—類間最大方差算法。該方法的主要思想是從圖像的灰度直方圖中把灰度的集合用閾值t分為兩類,然后根據兩個類別的平均值方差(類間方差)和各類的方差(類內方差)的比為最大來確定閾值t。該閾值即為二值化圖像的最佳閾值。這種方法不論圖像的直方圖有無明顯的雙峰,都能得到較為滿意的效果,因此這種方法是閾值自動選取的較優(yōu)方法。按灰度閾值t將圖像劃分為兩類:和,因此,和類的類出現概率及均值分別由下列各式給出:(2.7)(2.8)(2.9)(2.10)其中,,不難得出,對于任何t值,都有和類可由下式得(2.11)(2.12)定義類內方差,類間方差,總體方差為:(2.13)(2.14)(2.15)我們把使得和兩類得到最佳分離的t值作為最佳閾值,最佳閾值t應使類間方差最大,即選(2.16)為判斷準則,從1,2,…,L改變t,使最大的t值即為分割門限即最佳閾值。Ostu算法有以下優(yōu)點:算法實現較為簡單且適應性較強;它是基于圖像的整體特性而非局部特性的,可以推廣到多閾值的分割方法中去。圖2.5顯示了經過全局閾值法Ostu方法獲得的二值化圖像,從圖中可看到Ostu方法處理效果明顯,車牌區(qū)域在圖像中得到了完整的保留。圖2.5二值化圖像2.4中值濾波去噪2.4.1中值濾波中值濾波是一種非線性濾波技術,不屬于卷積算法的區(qū)域處理方法。它將區(qū)域中所有值按大小進行排序,并將排序后位于中間的像素值賦予中心像素。由于區(qū)域中像素值發(fā)生隨機突變的像素,經排序后將位于隊首或隊尾,因此取得的中位像素值是正常的像素值。噪聲往往以孤立點的形式隨機出現,這些點對應的像素數很少,而圖像則是由像素數較多、面積較大的小塊構成的,因此中值濾波可以采用一個含有奇數個像素的滑動窗口在圖像上滑動,將窗口中心點所對應像素值,用窗口內所有像素值的中間值代替。中值定義為:一組數據,把這n個數據按值的大小順序排列如下:則:(2.17)y稱為序列的中值。例如,在一維的情況下,若中值濾波器的窗口長度為5,窗口中像素的灰度值為80、90、200、110和120,則中值為110。因為,按小到大(或大到小)排序后,第三位的值是110,于是原來窗口正中的灰度值200就由110取代。如果200是一個噪聲的尖峰,則將被濾除,達到消除噪聲的目的。這樣中值濾波在一定條件下既可以克服線性濾波器濾波帶來的圖像細節(jié)模糊,又可以有效的濾除脈沖干擾和圖像的掃描噪聲。中值濾波器可以推廣到二維,即對二維圖像操作。對數字圖像進行中值濾波,實質是對二維序列的中值濾波,濾波窗口也是二維的。設表示數字圖像各點的灰度值,濾波窗口為A的二維中值濾波可定義為:(2.18)式中,A為窗口。二維中值濾波的窗口形狀和尺寸對濾波效果影響較大,不同的圖像內容和不同的應用要求,往往采用不同的窗口形狀和尺寸。常用的窗口形狀有線形、方形、圓形、十字形以及圓環(huán)形等,窗口的尺寸一般先用3再取5逐點增大,直到其濾波效果滿意為止。一般對于有緩變的較長輪廓線物體的圖像,采用方形或圓形窗口為宜,對于包含有尖頂角物體的圖像,適宜用十字形窗口。而窗口大小則以不超過圖像中最小有效的細線狀物體為宜,如果圖像中點、線、尖角細節(jié)較多,不宜采用中值濾波。本課題由于采集車輛圖像的噪聲點往往是孤立的,且這些點對應的像素數很少,而彩色圖像的各區(qū)域顏色具有單一性和連通性,其像素數較多、面積較大,因此,很適合用中值濾波來濾除噪聲。本文選用了的模板進行濾波去噪,效果如圖2.6顯示:圖2.6中值濾波后的圖像重慶大學本科學生畢業(yè)設計(論文)第3章車牌定位3車牌定位車牌定位的算法很多,不過,所有的車牌定位算法基本上都考慮了牌照區(qū)域的特點。所以在此也有必要先了解一下車牌區(qū)域的特征,其大體可分為以下幾類:eq\o\ac(○,1)車牌的幾何特征:車牌為矩形,寬、高比例約在3.0左右;eq\o\ac(○,2)車牌字符格式特征:車牌字符位于矩形框中且有間隔;eq\o\ac(○,3)車牌區(qū)域的紋理特征:車牌區(qū)具有排列基本均勻的字符;eq\o\ac(○,4)車牌區(qū)域內灰度直方圖統(tǒng)計特征:具有兩個明顯且分離的分布中心;eq\o\ac(○,5)車牌區(qū)域的灰度分布特征:水平灰度呈現連續(xù)的峰、谷、峰的分布;eq\o\ac(○,6)車牌區(qū)域圖像的水平(垂直)投影特征:投影呈現連續(xù)的峰、谷、峰的分布。直接利用車牌的某個或某幾個特征一般總能把車牌從車牌圖像中分離出來,不過并不一定能得到精確的車牌位置。本文采用了一種由數學形態(tài)學和投影法相結合的車牌定位方法,即利用數學形態(tài)學方法對傳統(tǒng)投影定位法進行改進,從而實現車牌的準確定位。3.1基于數學形態(tài)學的粗定位3.1.1數學形態(tài)學的發(fā)展史數學形態(tài)學是研究數字影像的形態(tài)、結構及其特征與快速并行處理方法的理論,它通過對目標影像的形態(tài)變換來實現結構分析和特征提取的目的。數學形態(tài)學是一門新興學科,1964年,法國的G.Mathern和J.Serra在積分幾何的基礎上首次創(chuàng)立了這門學科,此后,他們又在法國建立了“楓丹白露數學形態(tài)學研究中心”,在該中心學者和其他各國研究人員的共同努力下,數學形態(tài)學得到了不斷的豐富和完善。最初,由Maheron和Serra提出的數學形態(tài)學研究以二值圖像為對象,稱為二值形態(tài)學;此后,Serra和Sternberg等借助于傘理論,把二值形態(tài)算子推廣到灰度圖像,因而使灰度形態(tài)學的理論和應用研究也得到很大的發(fā)展。1982年,J.Serra的專著《圖像分析與數學形態(tài)學》問世后,數學形態(tài)學才在圖像處理、模式識別和計算機視覺等領域引起廣泛的重視和應用,并成為數字圖像信號處理和計算機視覺領域中的一種有效方法,這些應用反過來又促進它的進一步發(fā)展。數學形態(tài)學的理論內容包含十分廣闊。特別地,傳統(tǒng)圖像處理中的線性算子和非線性算子均是形態(tài)學算子的特例!這個令人吃驚的結論說明數學形態(tài)學是圖像處理的一個統(tǒng)一理論,是對傳統(tǒng)理論的推廣,在這個統(tǒng)一理論的框架下,經典的方法得以在一個新的、統(tǒng)一的層次上進行分析,從而幫助我們從不同的側面更深入地了解經典算法的性質,并在更廣泛的范圍以更靈活的方式對它們進行改進。目前國內許多有效的圖像處理系統(tǒng)有的是基于數學形態(tài)學方法原理設計的,有的是把數學形態(tài)學算法納入其基本軟件,并以其運算速度作為系統(tǒng)性能的重要標志之一。它被廣泛地應用到圖像處理的很多領域中,這些領域涉及醫(yī)學成像、顯微鏡學、生物學、機器人視覺、自動字符讀取、金相學、地質學、冶金學、遙感技術等等。在這些領域中,利用數學形態(tài)學可以對圖像進行增強、分割、邊緣檢測、結構分析、形態(tài)分析、骨架化、組分分析、曲線填充、圖像壓縮等。3.1.2數學形態(tài)學與圖像處理隨著計算機技術的飛速發(fā)展,圖像處理成為了當前人們廣泛關注的科學領域。它包含的領域寬廣,諸如:檢測圖像的質量,實現圖像清晰化的圖像增強;提取圖像的幾何特征,實現圖像分割和編碼壓縮;通過對圖像的分析、理解實現對投影圖像的三維重建;通過序列圖像分析,從而實現運動場景分析等。數學形態(tài)學是一種特殊的圖像處理技術,它的描述語言是集合論,它設計了一整套的基于集合運算的概念和方法,提供了統(tǒng)一而強大的工具來處理圖像中遇到的問題。它通過研究圖像中對象的幾何特征等來描述圖像中各個研究對象的特征和對象之間的相互關系。數學形態(tài)學進行圖像處理的基本思想是:用結構元素對原圖像進行位移、交、并等運算,然后輸出處理后的圖像。數學形態(tài)學算法的思想簡單直觀并且?guī)缀蚊枋龅奶攸c非常適合與視覺信息相關的信息處理與分析。利用數學形態(tài)學進行圖像分析的基本步驟一般有:eq\o\ac(○,1)提出所要描述的物體的幾何結構模式,即提取物體的幾何結構特征;eq\o\ac(○,2)根據模式選擇相應的結構元素,結構元素應簡單且對模式具有最強的表現力;eq\o\ac(○,3)用結構元對圖像進行形態(tài)變換,得到比原圖像更突出研究對象特征信息的圖像;eq\o\ac(○,4)從經過形態(tài)變換的圖像中提取出所需要的圖像信息。數學形態(tài)學方法比起其它圖像處理方法具有一些明顯的優(yōu)勢,它可以有效的濾除噪聲,同時保留圖像中的原有信息,并且突出圖像的幾何特征使得對圖像的進一步分析更加簡便。在數學形態(tài)學運算中,結構元的選擇對于能否有效的提取圖像的有關信息至關重要。故選擇結構元時一般要注意以下兩個原則:eq\o\ac(○,1)結構元有凸性;eq\o\ac(○,2)結構元在幾何結構上比原圖像簡單,且有界。3.1.3數學形態(tài)學的有關定義數學形態(tài)學的基本運算有4個:膨脹,腐蝕,開啟和閉合。他們在二值圖像和灰度圖像中各有特點。由于本文處理的是二值圖像,所以只需對二值形態(tài)學的基本運算進行探討。二值圖像是指圖像的灰度只有1和0構成。傳統(tǒng)的圖像處理一般取圖像中目標的灰度值為1,背景灰度值為0。二值形態(tài)學中的形態(tài)變換是針對集合的處理,記圖像中所有灰度值為1的點組成的集合為X。圖像形態(tài)處理時,就是在圖像中移動一個結構元素,然后對集合X用結構元素與圖像進行交,并等運算。以下是形態(tài)學有關算子的定義:eq\o\ac(○,1)具有某種確定性質的對象的全體或范圍稱之為集合,常常用大寫的英文字母表示;若這種全體或范圍中不包含任何對象稱為空集,計作。eq\o\ac(○,2)若設全集為I,集合,稱是集合B的補集。eq\o\ac(○,3)設X是某一基本集合,記,稱為X的冪集,若集合,則集合A,B之間只能有以下三種關系:1)集合包含于集合B,記作;2)集合A擊中集合B,記作;3)集合A相離于集合B,記作。eq\o\ac(○,4)設A,B是二維集合,記是集合A,B的元素,任意的二維向量,記,稱集合A平移X。顯然,若集合由一幅圖像中的每個點組成,則集合的平移表示圖像的每個點沿著坐標軸移動一定位置;集合的映像表示圖像的每個點關于原點的對稱點。eq\o\ac(○,5)若記集合,記為空集,則集合A被集合B膨脹記為:(3.1)其中“”數學形態(tài)學的膨脹算子。由上可以看出:集合A被集合B膨脹即是集合B中的元素先作關于原點的對稱點,每個對稱點平移x后,總有點落在集合A中。eq\o\ac(○,6)若記集合記為空集,則集合A被集合腐蝕記為:(3.2)其中“”數學形態(tài)學的腐蝕算子。顯然:集合A被集合B腐蝕即是集合B中的每個元素平移x后,全部落在集合A中。eq\o\ac(○,7)設A是輸入圖像,B是結構元圖像,則集合A被集合B作開運算記為,用膨脹和腐蝕記為:(3.3)開運算的結果實質上是集合A先被結構元B腐蝕后結果再被B膨脹。開運算可以平滑圖像輪廓,除去圖像中不能包含結構元的部分即是除去圖像中細小突出。A被B開后的邊界就是B在A內平移所能達到的B的邊界的集合。eq\o\ac(○,8)設A是輸入圖像,B是結構元圖像,則集合A被集合B作閉運算記為,用膨脹和腐蝕記為:(3.4)A被B作閉運算的實質就是A被B膨脹后結果再被B腐蝕。由閉運算的定義可知:閉運算也能平滑圖像,他能去掉原圖像中的小洞,填補輪廓上的小縫隙并能融合圖像上狹窄的缺口和細長的彎口。由于膨脹和腐蝕的對偶性,開運算與閉運算也可得到相應的對偶性。故而,A被B閉后的邊界就是B在內平移所能達到的B的邊界的集合,故A被B開還可記為:(3.5)腐蝕具有使目標縮小、目標內孔增大以及外部孤立噪聲消除的效果;膨脹是將圖像中與目標物體接觸的所有背景點合并到物體中的過程,結果是使目標增大、孔洞縮小,可填補目標中的空洞,使其形成連通域。對于開運算就是在腐蝕的基礎上再進行一次膨脹,對于閉運算就是在膨脹的基礎上再進行一次腐蝕。由上述定義可知,若取,即為一大小可調的正方形灰度平面,則膨脹運算的實質就是以為模板,尋找圖像在結構元大小范圍內所有點的灰度極大值,以該極大值代替該結構元大小范圍內所有點的類度值,在圖像灰度曲面上移動結構元模板,重復同樣的操作,直到圖像上所有點都參與運算為止。因此,膨脹的結果就濾去了小于二倍結構元的波峰,同時原圖像灰度曲面在原有基礎上有了一定程度的膨脹。而腐蝕運算就相當于削去小于二倍結構元的波谷。如果用原圖減去開運算的結果,就可以提取出原圖像小于結構元的波峰;用原圖減去閉運算的結果就可以提取出小于結構元的波谷,改變結構元的大小就可以提取不同的目標。3.1.4基于形態(tài)學運算的候選區(qū)域選取為了進一步確定車牌區(qū),用形態(tài)學運算對二值圖像進行分割,形成若干閉合的連通區(qū)域,并從這些區(qū)域中提取真實的車牌。為了防止連通區(qū)域斷裂和盡可能減少與背景紋理的粘連,結構元的形狀和尺寸的選取尤為重要。尺寸過大,會使車牌區(qū)域跟周圍非車牌區(qū)域的邊緣點發(fā)生粘連;尺寸過小,會使車牌區(qū)域無法粘連在一起,可能使真正的車牌區(qū)域不包含在可能的候選區(qū)域中。在車牌區(qū),各字符之間的最大距離(一般情況下為第二、三字符的間距)約為筆畫寬度w的4倍。為了避免形態(tài)運算后車牌區(qū)發(fā)生斷裂,將此間距作為設計結構元的一個主要依據。設width為采集圖像的寬度(以像素為單位),同時考慮到字符間距最大情況以及車牌傾斜等因素,為了保證能夠形成一個完整車牌連通區(qū),設計了一個水平結構元,其長度為:(3.6)式中,是車牌寬度與圖像寬度之比,是字符最大間距與車牌寬度之比。本文取=l/4,我國車牌的標準寬度為440mm,最大字符間距為34mm,其比例約為0.08,考慮到字符斷裂及磨損等因素,取=0.10。用此結構元進行形態(tài)閉運算,形成可能的字符連通域如圖3.1所示:圖3.1水平閉運算大多數情況下車牌區(qū)域經過上述閉運算后已經粘連,但對于車牌周圍紋理較為密集的情況,附近的其他紋理區(qū)也容易融入連通域范圍,從而擴大了有效車牌區(qū)域的范圍。為了斷開粘連,同時保證車牌字符形成的連通域不被斷開,需使用垂直方向上的結構元。大量實驗表明,該結構元尺度約為車牌字符高度的1/4到1/3時效果較好。基于這個尺度設計一個垂直結構元:(3.7)為結構元尺寸與字符高度的比例,本文取1/3;為字符高度與車牌寬度的比例,車牌的標準字符高度為90mm,則取值約為90/4400.20。用上述結構元對上一步形態(tài)學閉運算后得到的圖像進行開運算后,紋理區(qū)域集中部分得到較好的分割,實驗結果如圖3.2所示,方便了后續(xù)的連通域結構特征分析。圖3.2垂直開運算3.1.5基于結構特征的候選區(qū)域篩選車牌區(qū)具有明顯的結構和紋理特征,車輛前部的車牌寬高比約為3.14(考慮到拍攝及傾斜等原因,寬高比可取1.3到4),剔除不符合寬高比要求的連通域,此時若只有一個連通域,則可確認為車牌區(qū)域,否則再根據車牌的特征篩選出候選區(qū),結果如圖3.3所示:圖3.3符合結構特征的連通域大量實驗結果表明,可能出現的候選區(qū)包括車體上的車燈、車牌,以及散熱器等部分,也可能包括周圍環(huán)境帶來的干擾。3.2基于投影法的車牌圖像精確定位經過車牌圖像粗定位后獲得的圖像中不僅有含有車輛的車牌架,而且也包含了其他的圖像信息,為了便于后續(xù)的車牌圖像的字符分割和識別的效果,對粗定位后的車牌圖像進行精確定位是很必要的,本文采用的車牌圖像精確定位的算法流程如下圖所示:通過區(qū)域剪裁得到精確定位車牌圖像通過區(qū)域剪裁得到精確定位車牌圖像水平投影和垂直投影得到車牌圖像的精確邊界坐標車牌圖像的粗定位圖像圖3.4車牌圖像精確定位算法流程車牌的字符和背景的灰度對比較大,對應于車牌區(qū)域的水平灰度變化較頻繁,而且在車牌圖像中每個字符號碼本身都大小一致,即寬度和高度都相等,使得車牌區(qū)域在水平方向上的投影具有明顯的規(guī)律,且車牌一般掛在汽車的防撞器上或附近,靠近整幅圖像的下部,同時,在圖像的下部一般干擾較少,因此可通過自下而上的搜索方法確定車牌的上下邊界。另外,在投影圖上,車牌區(qū)與背景相比有較多的豎向紋理,車牌字符之間具有較低的谷點,較低谷點之間又至少有一個較高的峰值點,且谷點與谷點近似等距,根據這些特征就可以確定出車牌的左右邊界。由此推出的算法步驟為:eq\o\ac(○,1)對二值圖像做水平投影確定候選車牌的上下邊界,得到一個或多個帶狀區(qū)域;eq\o\ac(○,2)對帶狀區(qū)域作垂直方向上的投影確定左右邊界;eq\o\ac(○,3)根據車牌的幾何特征即長寬比為3.1-3.2排除偽車牌。3.2.1水平方向定位本文采用的車牌水平方向定位算法如下:eq\o\ac(○,1)對車牌灰度圖像進行水平方向的投影運算;eq\o\ac(○,2)找出車牌水平區(qū)域對應的峰值;eq\o\ac(○,3)確定切割點,在圖像上進行水平切割。對圖像的灰度值按(3.8)式做水平投影:(3.8)圖3.5水平投影圖在投影圖中,車牌投影值區(qū)域一般有以下特點:一般情況下,車牌區(qū)域中出現的投影波峰值為圖像下部往上搜索時出現的第一個較大波峰值;車牌投影區(qū)域大致對應于上述波峰值上、下臨近的波谷之間包含的投影值區(qū)域,且這兩個波谷大致對稱于波峰,波峰和波谷變化率較大。根據車牌特征,車牌中的垂直邊緣較為密集,而且車牌一般懸掛在車身較低的位置,其下方沒有很多的邊緣密集區(qū),因此在車牌對應的水平位置上會出現一個或連續(xù)多個峰值,連續(xù)峰群的第一個和最后一個峰值作為車牌邊緣峰。從圖中可以看出,這樣就得到了包含了車牌的帶狀區(qū)域。圖3.6投影圖確定車牌上下邊界第一個邊緣峰左邊的波谷點作為分割點,最后一個邊緣峰右邊的波谷點作為分割點,對圖像進行切割。圖3.7車牌水平切割區(qū)域3.2.2牌照垂直方向的定位算法車輛牌照垂直方向的定位算法跟車輛牌照水平方向的定位算法類似,首先對圖像做垂直方向的投影運算,然后確定切割點。平滑后的投影圖如圖3.8所示:圖3.8垂直投影圖從圖中可以看出,對于垂直方向的投影切割,車牌區(qū)域內的差分投影不是只有一個單峰,而是一群多峰,并且這一峰群對于車牌外區(qū)域的峰值相對要高出很多。于是我們選取最大峰值的0.6作為閾值,找出第一個和最后一個高于此閾值的峰作為車牌邊緣峰。第一個邊緣峰左邊的波谷點作為分割點,最后一個邊緣峰右邊的波谷點作為分割點,對圖像進行切割。對垂直方向進行投影切割的效果如圖3.9所示。圖3.9投影圖對應的車牌垂直區(qū)域圖3.10精確定位后的車牌重慶大學本科學生畢業(yè)設計(論文)第4章結論與展望4結論與展望4.1實驗結果綜上所述,為了檢驗本章提出的車輛牌照定位算法,本文建立了包含車牌的圖像的集合。實驗所用車輛圖像為用數碼相機在自然場景中拍攝的彩色圖像,其中牌照為普通牌照(底色為藍,字符為白)。圖像中牌照大小不一,背景不一,背景包括人、其它車輛、樹木、建筑物等,光照條件也不一。需要說明的是,所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論