版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于智能視頻分析的特定車輛識別研究摘要本課題的出發(fā)點是基于現(xiàn)有的、已經(jīng)覆蓋全市幾乎所有交通路口、停車場等各類現(xiàn)有視頻監(jiān)控系統(tǒng),利用路口等處的大量監(jiān)控探頭所提供的視頻,運用視頻和圖像處理分析技術(shù),實現(xiàn)對某些特定車輛的自動識別方法的研究探討,再通過監(jiān)控視頻的聯(lián)網(wǎng),實現(xiàn)對某些特定車輛的位置和行車軌跡等信息進行記錄和查詢,為某些特定的業(yè)務(wù)工作快速確定和定位某些特定車輛提供技術(shù)手段。在本文中對系統(tǒng)中涉及到的圖像預(yù)處理、HOG特征提取、特征庫建立、SVM分類器的訓練,以及對算法的改良都做了詳細的論述,同時針對有代表性的算法做了認真的分析學習,主要從以下幾個方面開展論文的書寫。第一章,主要介紹了國內(nèi)外在運用視頻監(jiān)控系統(tǒng)對車輛識別檢測的研究現(xiàn)狀,認識到該課題的研究價值及實際意義;第二章,對圖片特征的提取方法做了比擬分析,最后選取HOG特征作為車輛的特征;第三章,就目前通用的分類器訓練方法做了簡要分析,通過比擬各自的優(yōu)缺點,再結(jié)合本課題目標對象的特征,選取SVM作為分類器;第四章,對現(xiàn)有HOG特征在灰度域中提取的方法進行改良,將其在顏色域里提取,在HOG特征中含有顏色信息,同時對算法進一步的改良,結(jié)合視頻的多角度識別處理方法,得到改善后的算法,并實驗驗證算法有效;第五章,對本課題取得的成果做一總結(jié),并確定之后的研究方向。關(guān)鍵詞:特定車輛,車輛識別,HOG特征提取,顏色域HOG特征提取,SVM,多角度識別SPEACIFICVEHICLEIDENTIFICATIONBASEDONINTELLIGENTVIDEOANALYSISABSTRACTThepointofthisprojectisbasedonvariousexistingvideosurveillancesystems,hascoveredalmostallthecity'strafficjunctionsandparkinglotsandsoon.Theuseofalargenumberofvideoswhichareprovidedbyvideosurveillancecameras,andtheuseofvideoandimageprocessingandanalysistechniques,toachievecertainspecificvehicleautomaticidentificationmethodofstudywastoinvestigate.Alsothroughsurveillancevideonetworking,toachievecertainspecificvehicleinformationsuchasthelocationanddrivingtrackrecordandqueryforspecificoperationalworkquicklyidentifyandlocatecertainvehiclestechnicalmeans.Inthispaper,thesysteminvolvesimagepreprocessing,HOGfeatureextraction,featuredatabasecreation,SVMclassifiertraining.Alsoontheimprovementofthealgorithmhasdiscussedindetail,andhaslearnedandanalyzedrepresentativealgorithmscarefully,mainlyfromthefollowingaspectstowritepapers.Thefirstchapter,theresearchstatusofuseofvideomonitoringsystemondetectionofvehicleidentificationathomeandabroadwasintroduced,andknowingthevaluesandpracticalmeaningsofthesubject;thesecondchapter,analyzevariouspicturefeaturesextractionmethods,finallyselectHOGfeaturesasvehiclesfeatures;thethirdchapter,analyzethecurrentgeneralclassificationforthetrainingmethod,bycomparisontheirrespectiveadvantagesanddisadvantages,againcombinationofthesubjecttargetobjectfeatures,selectSVMasclassification;thefourthchapter,improveexistinghogfeaturesextractioningraygamuttocolorgamut,andthenewHOGfeaturescontainscolorinformation,atthesametimecombineidentificationofmulti-angletoimprovethealgorithmandexperimentalverificationtheeffectiveofalgorithms;thefifthchapter,sumtheresultsachievedonthissubject,anddetermineresearchdirections.KEYWORDS:specificvehicle,vehicleidentification,HOGfeatureextraction,colorgamutHOGfeatureextraction,SVM,identificationofmulti-angle目錄摘要IABSTRACTII第一章緒論11.1研究背景及研究意義11.2車輛檢測識別技術(shù)2對已有的車輛檢測技術(shù)進行介紹2車輛識別技術(shù)進行介紹3國內(nèi)外車輛檢測識別的研究現(xiàn)狀介紹31.3本文的主要研究工作51.4論文的組織結(jié)構(gòu)5第二章基于HOG特征的特定車輛檢測62.1車輛檢測的主要方法62.2面包車的主要特點及檢測方案8輪廓特征明顯8檢測方案:HOG92.3基于HOG特征的面包車HOG特征提取實現(xiàn)102.4本章小結(jié)12第三章基于SVM的面包車分類識別133.1車輛識別常用的分類器介紹133.2基于SVM的面包車分類器183.2.1SVM分類器原理18最優(yōu)分類超平面19內(nèi)積函數(shù)21車輛庫的建立223.2.5SVM分類器的訓練243.3基于SVM的面包車分類識別實驗243.4本章小結(jié)25第四章基于顏色+HOG的面包車檢測識別274.1顏色特征27彩色圖像27面包車的顏色特征284.2基于顏色特征的檢測識別預(yù)處理28常用的顏色特征提取方法有:28彩色空間29針對顏色對HOG算法的改良32實驗結(jié)果及分析344.3多角度識別354.4本章小結(jié)35第五章總結(jié)與展望375.1主要研究成果375.2進一步工作37致謝39參考文獻40緒論研究背景及研究意義今年來隨著電子技術(shù)、計算機視覺理論及智能理論的開展,視頻監(jiān)控技術(shù)應(yīng)用變得越來越普及,無論是在城市街道兩側(cè)、銀行營業(yè)廳、機場車站還是在學校校園都可看到監(jiān)控攝像頭的身影。視頻監(jiān)控已逐漸融入人們的日常生活過程中,特別為人們生命財產(chǎn)平安提供了一種有效的平安保障。通常視頻監(jiān)控技術(shù)常用于平安指數(shù)較高場所,能夠?qū)崿F(xiàn)無人值班情況利用監(jiān)視監(jiān)控系統(tǒng)獲得重要地點平安信息,這對于降低犯罪率及犯罪證據(jù)獲得有十分重要意義,實踐說明視頻監(jiān)控技術(shù)逐漸普以及為公安司法系統(tǒng)快速偵破各種形式案件起到重大作用;常見于監(jiān)控系統(tǒng)常用于公路等場合實現(xiàn)車速以及車流量的檢查,通過建立城市道路檢測網(wǎng)絡(luò)實現(xiàn)交通的智能疏導(dǎo)和意外事故檢查等功能,為城市交通的平安運行保駕護航。視頻監(jiān)控技術(shù)先后開展先后經(jīng)過模擬視頻監(jiān)控、數(shù)字視頻監(jiān)控、智能視頻監(jiān)控三個重要階段。第一代視頻監(jiān)控系統(tǒng)設(shè)備采用模擬攝像頭收集圖像信息,利用同軸電纜傳輸,由處于不同地方攝像機采集圖像后,分別通過多路電纜輸送到監(jiān)控室內(nèi),根據(jù)先后順序通過在顯示器上交替顯示,監(jiān)控人員必須時刻觀看監(jiān)視器,按照人工判斷是否會出現(xiàn)異常事件的方法,因此消耗了較大的人力,因為長時間人工監(jiān)視容易產(chǎn)生視覺疲勞,很難保證判斷的準備率。受到電纜制造技術(shù)限制,傳輸距離很短,又因為模擬信號傳輸通常要求帶寬較大,所以導(dǎo)致在帶寬分配靈活性上變得較差。同時還存在采集到的視頻圖像難以保存等缺點。有關(guān)數(shù)據(jù)統(tǒng)計,英國目前攝像機總數(shù)到達了500多萬個,按照有關(guān)數(shù)據(jù)計算顯示:在倫敦居住的居民平均每個人每天將要被攝像機拍攝300次。然而目前視頻監(jiān)控大局部都是由人來完成,攝像機增加后,既沒有足夠的屏幕供顯示觀看,也不可能安排足夠的人員24小時盯著屏幕看,這為居民人身財產(chǎn)帶來很大的平安隱患,于是公安系統(tǒng)2004年在全國范圍內(nèi)確定了22城市作為首示范城市,2005年先后確定中了西部地區(qū)多個城市以及江蘇、浙江、山東、廣東四省等23個城市作為第二批示范城市,至到2023年全國范圍內(nèi)示范城市到達180個,示范建設(shè)為視頻監(jiān)控技術(shù)開展及快速普及提供有力條件?,F(xiàn)在大約400萬個監(jiān)控攝系統(tǒng)用于城市道路監(jiān)控與報警系統(tǒng),國內(nèi)已建有130多萬不同級別安防系統(tǒng),每年增加各類安防系統(tǒng)超過了30萬個,其中銀行金融方面所就有5萬多個,車輛及車道檢測系統(tǒng)超過2萬多個;2023北京奧運會期間,我國己完整開發(fā)出一套"隨著視頻監(jiān)控規(guī)模逐漸擴大,通過安保人員進行人工實時監(jiān)控所暴露出來的局限性越發(fā)突出,經(jīng)過30多年開展,視頻監(jiān)控系統(tǒng)盡管在功能及性能上得到很大程度增強,但是很多地方還具有一定局限性:(l)人類本性的缺點大多數(shù)情況下,人類并不是值得一位完全信用的觀察者,不僅在視頻觀看還是視頻回放的情況下,因為人類本身固有缺點,常常使我們發(fā)覺不到威脅存在,從而時常會導(dǎo)致漏報現(xiàn)象出現(xiàn)。(2)監(jiān)控器上視頻停留時間過短大多情況下,除了一些特殊要求的的監(jiān)控系統(tǒng)外,視頻監(jiān)控系統(tǒng)會絕大多數(shù)不會按照1:1的比例進行攝像機配置監(jiān)視器配置,即很多視頻監(jiān)控系的各個監(jiān)控點不能時刻處在監(jiān)控者的監(jiān)視范圍內(nèi)。(3)誤報及漏報問題存在誤報和漏報為視頻監(jiān)視系統(tǒng)中最常出現(xiàn)的兩大問題,誤報指主要是將監(jiān)控點中平安動作誤認為具有威脅的活動,進而產(chǎn)生錯誤報警,漏報那么反之。(4)對視頻數(shù)據(jù)處理困難較大隨著現(xiàn)在車輛增減,交通事故發(fā)生次數(shù)也與日劇增,經(jīng)常被要求交通找出與肇事者有關(guān)錄像視頻資料,從而進一步確定事故責任及評估該事件存在的平安威脅,傳統(tǒng)視頻監(jiān)控系統(tǒng)缺乏智能分析技術(shù),大量錄像視頻數(shù)據(jù)不能按照一定分別標準進行有效的分類存儲,面對海量視頻數(shù)據(jù)進行分析時,使交通工作人員的工作量變得極其很大且耗時,很多情況下還不能獲得有效相關(guān)信息,而且還會出現(xiàn)誤判誤報等情況,使數(shù)據(jù)分析困難進一步加大,從而給交通或警察人員處理交通時間帶很大的困難。(5)響應(yīng)周期長視頻監(jiān)控系統(tǒng)時常由監(jiān)控人員對存在平安威脅作出響應(yīng)和處理,對響應(yīng)時間要求低的情況來說根本能夠滿足。但絕大情況下由于平安系統(tǒng)的需要多個功能局部,聯(lián)合配合處理時,這就要求監(jiān)控系統(tǒng)的響應(yīng)速度較快,這和用戶的身或財產(chǎn)的損失情況密切相關(guān)?,F(xiàn)在的視頻監(jiān)控系統(tǒng)向著數(shù)字化、智能化和網(wǎng)絡(luò)化的方向開展。利用圖像壓縮手段等數(shù)字化技術(shù),能夠進一步改善信息量及帶寬問題,借助于計算機視覺技術(shù)實現(xiàn)視頻的智能監(jiān)控,進而實現(xiàn)目標識別、報警等根本功能。數(shù)字化技術(shù)增強了抗干擾能力,傳輸段的問題且?guī)捿^小,采用視頻智能技術(shù),實現(xiàn)視頻自動監(jiān)控,很大限度的節(jié)約人力物力。數(shù)字化后的視頻圖像易于保存,可將視頻圖像數(shù)據(jù)建立數(shù)據(jù)庫對以后檢索、查閱提供方便。計算機網(wǎng)絡(luò)和便攜式網(wǎng)絡(luò)終端廣泛應(yīng)用,使遠程監(jiān)控逐漸成為現(xiàn)實。智能視頻監(jiān)重要作用之一為視頻圖像處理和分析程序,其中計算機視覺技術(shù)在其擔任著重要角色。車輛檢測識別技術(shù)對已有的車輛檢測技術(shù)進行介紹半個世界以來視頻車輛檢測技術(shù)的研究,無論在理論及實踐方面都取得豐碩成果,目前在視頻車輛檢測技術(shù)中核心技術(shù)為,圖像處理。即為得到圖像分析準確結(jié)果,檢測算法為關(guān)鍵環(huán)節(jié)。所以,如何設(shè)計交通流檢測算法是需要解決視屏車輛檢測中主要問題方式之一。通常分為:知識型、運動型、立體視覺型和像素強度型4類。(1)知識型。目的為檢測車輛的形狀、顏色、對稱性等常識信息。(2)運動型。主要借助于序列圖像之間大量信息,主流方法為:光流法和運動能量法。(3)立體視覺。借助于兩個或多個攝像機對同一景物從不同位置成像獲得立體像對,通過各種算法匹配出相應(yīng)像點,從而恢復(fù)深度(距離)信息。(4)基于像素強度的方法直接檢測幀間變化,有時間差分法和背景差分法。通常視頻車輛檢測技術(shù)分為兩大類:基于虛擬傳感器(虛擬點、虛擬線、虛擬線圈)的非模型交通信息檢測技術(shù)及基于目標提取和模型跟蹤交通信息檢測技術(shù)。(1)非模型交通信息檢測技術(shù)1982年,Takaba等提出以虛擬點為處理單元的交通參數(shù)提取方法,為交通參數(shù)的視頻檢測奠定重要根底。非模型交通信息檢測技術(shù)能夠檢測指定區(qū)內(nèi)移動像素群,優(yōu)點之處不需要理解像素群具體含義。主要工作原理為車道上設(shè)置一些虛擬傳感器,當車輛經(jīng)過傳感器時,引起圖像中局部區(qū)域內(nèi)容的變化,處理該變化信號,可以提取所需信息。(2)基于跟蹤交通信息檢測技術(shù)該類技術(shù)有如下優(yōu)勢不僅能夠?qū)崿F(xiàn)非模型檢測系統(tǒng)功能,還可以提取諸如車輛形狀、屬性等信息。該技術(shù)目前的研究主要針對于多運動目標的檢測方面,BenjaminCoifmana等提出一種基于特征跟蹤的交通參數(shù)提取方法,該方法以相機校正為根底,通過特征跟蹤提取出車流量、車速及車流密度等參數(shù)。Young-KeeJung等提出利用背景差分的視頻分割方法提取出運動車輛,然后通過基于Kalman濾波跟蹤運動車輛,獲取車流量和車速等參數(shù)。Daniel等對交通參數(shù)提取問題進行了研究,并于2000年提出一種先利用邊緣提取,獲取差分圖像中運動車輛的約束框,進而跟蹤車輛,獲取車長和平均車速的方法。SurendraGupte等長期致力于交通圖像處理的研究。車輛識別技術(shù)進行介紹目前車輛識別方法很多,主要圖像識別及雷達檢測兩種主要方法,由于現(xiàn)在圖像識別車輛精度較低,還不能準確地識別出大卡車和小轎車。Tan等[1]提出一種無須進行顯式特征符號提取與匹配的車輛識別方法,直接根據(jù)圖像梯度數(shù)據(jù)來確定目標車輛尋找圖像中準備位置,缺點之處為提前獲取交通場景中的先驗知識,且基于灰度的相關(guān)匹配算法對場景類型的適應(yīng)能力不強,這直接限制了該算法的廣泛適用性。vanLeuven等[2]利用圖像序列跟蹤車輛,將圖像中的模型與每個觀測到的車輛進行匹配,通過Kalman濾波器控制模型的位和比例,依據(jù)多假設(shè)策略來過濾跟模型具有相似局部特征的對象,而現(xiàn)實中車輛圖像模式有多樣性,有時會出現(xiàn)圖像畸變,增加了圖像匹配的復(fù)雜性。車輛識別本身就存在一定難度,要對車型再行細分必然使車輛識別更加困難、復(fù)雜。而車輛前方盲區(qū)及ROI[3]區(qū)域〔駕駛員感興趣區(qū)域〕內(nèi)不同類型車輛對駕駛員駕駛行為影響不同,因此,識別出前前方車輛且對被識別車輛進行大小檢測,準確確定前前方車輛的位置及大小最為重要。國內(nèi)外車輛檢測識別的研究現(xiàn)狀介紹計算機視覺及圖像處理技術(shù)不斷改良,使視頻在智能交通系統(tǒng)應(yīng)用成為可能。國外對視頻檢測技術(shù)從上世紀70年代視頻車輛檢測技術(shù)的開始研究,并在理論和實踐方面取得很大研究成果,經(jīng)過幾十年的開展逐漸商業(yè)化。1978年美國JPT(加州帕薩迪納市的噴氣推進實驗室)首先提出運用機器視覺來進行車輛的檢測[4],它是傳統(tǒng)檢測方法的一種可行的替代方案。后來ISS公司(ImageSensingSystem,INC)在1987年研制為第一代,驗證了交通領(lǐng)域中應(yīng)用視頻檢測技的可行性。NEWCAST大學的RourkeA,BellMGH和運輸工作研究組(TORG)提出基于圖像中的車輛的多窗口技術(shù)研究。后來對濾波器到沿圖形的邊界線擴展得到圖形檢測器,之后車輛檢測相當于檢測平行四邊形,在車輛停車場的圖像檢測中結(jié)果ChoiandYang[5]使用基于均值偏移的聚類算法提取具有對稱特性的車輛候選塊,用塊的幾何和輻射度特征對每個候選塊進行分類,Zheng[6]用多形態(tài)預(yù)處理得到候選車輛,這個過程用神經(jīng)網(wǎng)絡(luò)進行分類,這樣的兩步法系統(tǒng)的分割階段會產(chǎn)生誤差,ZhaoandNevatia[7]將車輛檢測視為一個三維目標識別問題,他們利用人類知識構(gòu)建典型車輛的的幾何模型。然而,效率來說,由于需要大量的人為建模,這個算法不容易檢測其他目標。Hinz[8]andSchlosseretal[9]應(yīng)用三維模型構(gòu)建車輛幾何模型進行車輛檢測和計數(shù)。AniruddhaKembhavi[10]等提出基于偏最小二乘法在車輛檢測應(yīng)用研究。東南大學的肖旺新[11]等基于小波變換的多尺度自適應(yīng)閉值圖像邊緣檢測的新方法應(yīng)用于交通圖像邊緣檢測。車輛檢測及識別是基于各種圖像處理算法,目前的車輛檢測方法主要有地感線圈車輛檢測法、波頻檢測法、智能視頻檢測法等。地感線圈檢測法是比擬傳統(tǒng)的車輛檢測方法[12]。其原理是電磁感應(yīng)的原理,而利用此種方法制成的車輛檢測器為線圈檢測器,它通常在同一車道的道路路基下埋設(shè)環(huán)形線圈,并讓線圈通過一定的工作電流,使其作為傳感器使用,當車輛通過此線圈或停在上面時,車輛自身的鐵質(zhì)就會使線圈里面的磁通改變,從而導(dǎo)致線圈回路的電感量的改變,檢測器將檢測得到的電感量的變化作為判斷正在通行的車輛狀態(tài)的依據(jù)。而不同車型本身的鐵質(zhì)分布不同,導(dǎo)致提取的車輛特征不同,所以采用模式識別的方法對特征[13]進行識別,從而判決出通過線圈的車輛類型。這種方法的優(yōu)點是靈敏度和識別準確率都很高,且投入少,易于掌握。是其剖路施工量較大、后期維護難度也大。且由于地埋,易受路面環(huán)境等因素影響,而且入線圈的路面容易受損,尤其是在十字路口的路面。波頻檢測方法用微波[14]、紅外線[15]或超聲波[16]裝置對車輛發(fā)出電磁波,并將感應(yīng)信息返回給裝置進行識別分析的一種檢測方法。這種方法可以用在城市道路的交通監(jiān)控中。其優(yōu)點是受氣候溫度影響較小,已在我國東北地區(qū)成為主流應(yīng)用,在深圳等大型城市也因為架構(gòu)較為簡便有占有率上升的趨勢。靈敏度和捕獲率不及地感線圈檢測法,且因為基于微波技術(shù),故可能存在一定錯誤率。智能視頻檢測[17]方法是直接集成在攝像機內(nèi)部或者構(gòu)建在前端工控機內(nèi)的一個功能強大的綜合事件檢測“軟件〞,對道路視頻信息進行實時識別檢測[18],一旦在分析過程中發(fā)現(xiàn)“車輛〞,便進行視頻跟蹤,當視頻檢測到相應(yīng)的車輛進入到最正確的拍照范圍時,便觸發(fā)相應(yīng)抓拍及后續(xù)的車型識別行為,其優(yōu)點是硬件易于安裝,維護方便,不會破壞路面,比擬靈活,能夠做到實檢測及更新。目前視頻中的車輛檢測方法[19]已經(jīng)在交通監(jiān)控管理系統(tǒng)中得到了廣泛的應(yīng)用,而且隨著物聯(lián)網(wǎng)技術(shù)的應(yīng)用及圖像處理、特征提取、模式識別等技術(shù)的不斷完善,智能視頻交通監(jiān)控的應(yīng)用前景將更加廣闊。目前,車輛檢測的根本方法是通過檢測視頻中明顯運動的目標檢測車輛。其中包括:背景相減法[20],幀差法[21],光流場法[22],高斯混合模型法[23]等等。但是這些方法中,背景的消除是一大難點,而且受到攝像機的抖動、光照變化、陰等的影響很大。后來,L.Anan[24]、L.Li[25]、NafiUrRashid[26,27]等人提出了基于虛擬檢測線[28,29](VirtualDetectionLine,VDL)的方法。這種方法的優(yōu)點是不用考慮背景的影響,在每幀圖的固定位置設(shè)置一條虛擬線,而提取每一幀在這條虛擬線上的信息,然后按照時間順序排列來就形成了一幅關(guān)于整個視頻的時空圖〔Time-SpatialImage,TSI〕。時空圖中每一個圖像塊表示一輛車的縮減信息。通過計算圖形塊在時空圖中的位置可得出要進行特征提取的關(guān)鍵幀。本文的主要研究工作本課題致力于研究在海量的標清和高清視頻資料中,運用動目標檢測跟蹤算法,在低清晰度的情況下,較為準確的對特定車輛〔面包車、渣土車〕進行檢測,面包車輪廓HOG特征提取,同時利用基于SVM等分類識別模型根底上,進行單一顏色面包車識別。目的是開發(fā)出一套低清晰度情況下特定車輛〔面包車、渣土車〕的實時檢測識別算法,為公安監(jiān)控實戰(zhàn)中對這類車倆的排查監(jiān)控和標準管理,提供智能化自動化的解決方案。本文主要研究內(nèi)容如下:1.對基于視頻的車輛識別算法的研究學習。通過對HAAR-LINK、邊緣檢測法和基于梯度方向直方圖〔HOG〕等基于視頻的車輛算法的學習,比擬不同算法優(yōu)點和適用領(lǐng)域。2.通過對基于梯度方向直方圖〔HOG〕算法的深入研究,闡述本課題利用該算法并結(jié)合顏色根底上,實現(xiàn)對車輛輪廓進行HOG特征提取,實現(xiàn)對某類特定車輛、單一顏色識別及管理。3.利用基于梯度方向直方圖〔HOG〕算法,實現(xiàn)對視頻中的面包車進行識別,經(jīng)過實驗驗證,由實驗仿真結(jié)果說明該基于智能視頻的車輛識別系統(tǒng)在實際管理中有效性。論文的組織結(jié)構(gòu)本論文主要內(nèi)容分為五個章:第1章論述本課題的研究背景及意義,介紹智能視頻車輛檢測和識別算法在國內(nèi)外的開展及研究現(xiàn)狀,以及本文所要研究的主要內(nèi)容。第2章,重點介紹基于HOG特征的特定車輛檢測,包括車輛檢測的主要方法:除對常用方法進行一般性介紹外,重點分析面包車的主要特點及檢測方案,其中包含輪廓特征明顯檢測方案,基于HOG特征的面包車檢測等。第3章著重分SVM的面包車分類識別進行分析,介紹了車輛識別常用的分類器,重點分析基于SVM的面包車分類器應(yīng)用,主要包括:SVM分類器原理、車輛庫的建立以及SVM分類器的訓練,最后利用基于SVM的面包車分類識別進行實驗分析,給出比擬結(jié)果。第4章建立顏色和HOG的面包車檢測識別系統(tǒng),首先分析了面包車的顏色特征,即為白色單一性,然后利用基于顏色區(qū)分輪廓類似的車輛〔SUV等〕、顏色特征的檢測識別預(yù)處理等根底上,最后通過提取其主顏色或顏色分布,并判斷是否符合面包車的主顏色或顏色分別,從而通過實驗進一步驗證該算法的有效性。第5章最后對論文進行總結(jié),說明對本文算法缺乏之處,以及本文你研究工作展望趨勢?;贖OG特征的特定車輛檢測車輛檢測的主要方法利用檢測算法檢測出運動車輛的運動范圍、輪廓等數(shù)據(jù)信息。車輛識別主要是通過對輪廓等信息進一步提取特征分析,識別出運動車輛的具體位置以及車輛本身相關(guān)信息。目前對運動車輛檢測和識別常用方法介紹如下:(1)背景差分法背景差分法是指采用當前與背景圖像進行相減方式來確定運動物體的檢測方法,為視頻檢測常用檢測方法。其中主要特點:圖像像素差,假設(shè)差值大于閾值那么說明該點是運動物體上的像素點,并標識出來;假設(shè)差值閾值那么說明是背景像素無需標識。關(guān)鍵之處如何有效性提取背景圖像。目前無運動物體的情況下拍攝一幅只含有背景下進行有效提取,該方法只適用于背景不變化或者變化甚微且無外界干擾很小情況下,應(yīng)用范圍小。該檢測算法的實時性差,且對急劇變化的外界干擾因素非常敏感。(2)光流法光流是指運動物體在觀測成像面上像素運動的瞬時速度。這種運動模式是指一個物體的外表和邊緣在一個視角條件下由攝像機和背景形成明顯的移動。假設(shè)沒有運動物體經(jīng)過,整個視場中的光流變化是均勻流動的,假設(shè)視場中存在運動物體,對速度光流場與及周圍的光流產(chǎn)生影響變化,可檢測出運動物體大量信息。(3)幀差法幀差法是指將待測圖像與前一幅圖像相減,當灰度值大于設(shè)定的閾值時那么認為該點運動體,假設(shè)小于閾值那么認為是背景。幀差法檢測關(guān)鍵之處是如何選幀間數(shù)量。假設(shè)選取的值較大、車速過快,幀差后的結(jié)果將大于運動區(qū)域,會帶來很多問題。假設(shè)選取的值較小、車速較慢,那么兩幀之間幾乎沒有位移,相減之后可能無法檢測出運動物體,這就是不能檢測出靜止物體或者接近于靜止物體原因所在。以上方法都存在缺乏之處,對圖像進行分類時,如何選擇適宜的方法對顏色、紋理、形狀等特征進行訓練,直接提取這些特征將會產(chǎn)生大量的高維數(shù)據(jù),從這些高維的特征中如何選取出最重要的特征具有十分重要意義。常見的基于視頻的車輛識別技術(shù),主要有以下幾種:1.梯度方向直方圖HOG最早由Dalal于2005年提出,最初被用于行人檢測中,取得了較好的效果。根據(jù)圖像的形狀、外觀等特征信息,能夠很好描述梯度或邊緣的方向密度分布原理,能夠快速隨外界光照變化和目標旋轉(zhuǎn)而變化。主要特征為:HOG主要先將圖像劃分為小細胞單元〔稱為cell〕,再計算所有細胞單元中各像素點的梯度或邊緣的方向直方圖。將假設(shè)干個細胞單元組成一個區(qū)間〔稱為block〕,然后在這些區(qū)間內(nèi)對各細胞單元的梯度進行歸一化,最后取得梯度方向向量。圖像的梯度方向向量數(shù)由圖像大小、cell大小、每個cell所取梯度維數(shù)等因素所決定。其計算方法為:〔2.1〕其中,——表示維數(shù);——表示block大??;——表示cell大?。弧硎綽lock移動步長;W、h——分別表示圖像寬與高。因此可以在應(yīng)用中根據(jù)實際情況調(diào)整片尺寸、cell維數(shù)等參數(shù),以降低特征向量維數(shù)。HOG特征為基于梯度方向的分布直方圖具有優(yōu)勢,既可描述運動車輛中輪廓特征,又會減弱光照及小量的偏移不敏感現(xiàn)象。2.邊緣檢測法邊緣檢測方法是在不同的光線條件下利用車體的不同部件、顏色等提供的邊緣信息有效的提取車輛的邊緣,從而進行靜止和運動車輛的檢測。相對于背景消減法,由于車輛的外表、形狀及顏色不同,邊緣檢測法所能提供的信息相當顯著。即便車輛與路面的顏色相同,因為車輛要比地面反射更多的光線所以車輛仍能被檢測出來。在邊緣檢測算法中有很多的經(jīng)典算子,但是每種算子都存在不一樣的缺陷,有的抗噪聲能力強,但檢測精度達不到要求,有的正好相反,還有就是能夠很好的實現(xiàn)抗噪聲能力弱,檢測精度也可以滿足需求,但是算法復(fù)雜運行時間長,可見,任何單一的邊緣檢測算法都有一定的缺陷在實現(xiàn)某一特定目標的檢測時。3.Harr-like矩形特征算法最早的Haar-like矩形特征庫是PapageorgiouC.等提出,ViolaP.等的快速人臉識別系統(tǒng)采用了3種類型5種形式的矩形特征,分別為:2矩形特征、3矩形特征和4矩形特征。其特征值的定義為黑色矩形內(nèi)所有像素值的和減去白色矩形內(nèi)所有像素值的和。LienhartR.等對Haar-like矩形特征庫作了進一步擴展,參加了旋轉(zhuǎn)45度角的矩形特征。擴展后的特征大致分為4種類型:邊緣特征、線特征環(huán)、中心環(huán)繞特征、和對角線特征。Haar特征一共有4類,15種形式,其中包括4種形式的邊緣特征,8種形式的線性特征,2種形式的點特征和1種形式的對角線特征。每一種特征模板內(nèi)都有白色和黑色兩種矩形,計算白色矩形像素和,減去黑色矩形像素和,記作該特征模板的特征值。每一種特征模板都可以在垂直和水平方向各自縮放生成一個完整的特征集。對于每一種特征值,計算公式如下:〔2.2〕其中:N——表示矩形ri的個數(shù);——表示權(quán)重;——表示矩形ri的像素和。面包車的主要特點及檢測方案輪廓特征明顯特性1,車型Figure1Model’sdifferences圖1車型的區(qū)別如上圖所示,面包車為中大車型,在外形輪廓方面明顯區(qū)別于出租車及轎車等嬌小型的車輛。特性2,輪廓一致性Figure2Silhouetteconsistency圖2輪廓一致性由圖片及統(tǒng)計可知:盡管顏色與品牌相異,但是從外形輪廓具有統(tǒng)一的相識性。特征3,外表顏色Figure3Exteriorcolor圖3外表顏色由上圖可知,在我們生活中,常用面包車外形輪廓顏色大局部為白色或偏白色。檢測方案:HOG基于HOG特征的檢測算法主要由兩局部組成:HOG特征計算及提取。HOG特征計算步驟具體如下:1)輸入圖像:輸入圖像為樣本庫中的某一個樣本圖像或者是前面在檢測階段得到的某個RoIs。2)梯度計算:將采集視頻圖像按照[-101]和[-101]進行濾波計算出該圖像的垂直梯度和水平梯度,最后求出梯度方向及梯度大小。3)將輸入圖像平局分成的小格,由幾個小格合組成一個小塊。4)方向通道確定:將0°~180°或者0°~360°均勻分成n個通道。5)直方圖獲取:統(tǒng)計每個小格中中每個像素的梯度方向直方圖,取直方圖用步驟3中選取的n個方向通道最為橫坐標,直方圖的縱坐標取某個方向通道的像素的梯度累加和。最終獲得一組向量。6)歸一化處理:以小塊為單位,利用向量進行歸一化處理,目前常用的歸一化方法有以下3種:,,〔2.3〕其中,V——表示歸一化之前的特征向量;——表示它的k階范數(shù)(k=1,2);——表示一個很小的常數(shù)(它的值不會影響結(jié)果,目的是為了防止分母為0)。7)形成HOG特征:將經(jīng)過處理后所有的向量合理連接起來,構(gòu)成組向量組,為HOG特征。HOG特征的提取思想HOG特征的提取思想:梯度方向直方圖(HOG)為基于圖像形狀邊緣提取算法,根本思想:優(yōu)點是對圖像相關(guān)梯度和邊緣位置的精確信息依賴性很小,可通過局部梯度大小和邊緣信息將圖像局部外觀和形狀進行特征化。在HOG特征提取的過程中,以下一些參數(shù)對檢測的結(jié)果有很重要的影響:不同尺度的參數(shù)模板,梯度方向的選擇,重疊塊、單元格的大小及歸一化因子。HOG特征過程如下:為減小光照因素的影響,所以進行圖像的顏色空間進行歸一化;將檢測窗口劃分成大小相同的單元格(cell),在每個單元格中分別提取相應(yīng)的梯度直方圖,將相鄰的單元格組合成相互有重疊的塊(block),利用有效的重疊邊緣信息,進行整塊的直方圖特征統(tǒng)計,并進行歸一化,最后對整個窗口收集所有塊的HOG特征,并以特征向量的形式來表示整個目標窗口的HOG。該特征提取的全部流程如下圖:Figure4HOGfeatureextractionprocess圖4HOG特征提取流程基于HOG特征的面包車HOG特征提取實現(xiàn)根據(jù)上述HOG提取流程圖可知,其主要步驟如下:1.標準化gamma空間及顏色空間為減少外界因素對HOG特征的影響,首先圖像進行標準化。在圖像的紋理強度中,因為局部的表層曝光奉獻的比重較大,所以這種壓縮處理方式能夠有效地降低圖像局部的陰影和光照等外界因素變化,通常先轉(zhuǎn)化為灰度圖。Gamma壓縮公式:〔2.4〕比方可以取Gamma=1/2。2.計算梯度計算圖像的一階梯度。求導(dǎo)操作不僅能夠捕獲輪廓,人影和一些紋理信息,還能進一步弱化光照的影響。梯度大小:〔2.5〕梯度方向:〔2.6〕3.單元格梯度投影主要目的為局部圖像區(qū)域提供一個良好的編碼,能保持對圖像中運動車運動姿勢和外觀弱敏感性。先把圖像窗口分成假設(shè)干個小區(qū)域,稱這個區(qū)域被稱為“單元格〞。然后將每個單元格中所有象素的一維梯度直方圖累加到其中,最后按照根本的方向直方圖映射到特定角度上,構(gòu)成了最終的特征。4.塊內(nèi)歸一化梯度直方圖比照度進行歸一化,能夠進一步將對光照、陰影和邊緣進行壓縮。通常每個單元格由多個不同的塊共享,歸一化根本原理是基于不同塊的,導(dǎo)致計算結(jié)果各不相同。因此,一個單元格的特征會以不同的結(jié)果形式出現(xiàn)在最后的向量中。我們將歸一化之后的塊描述符就稱之為HOG描述符。5.收集HOG特征最將所用將檢重疊的塊進行HOG特征的收集,由計算出它們共同合成總的特征向量供輸入到分類進一步處理。例如對于一個80*80的訓練圖片,單元格=16*16像素,塊=4*4單元格塊,每次滑動一個單元格為,那么特征維數(shù)=8*8*〔4*4*9〕=576維。為了方便給可以看出各種車輛HOG特征的差異,在此分別提取128*128車輛圖片的HOG特征進行比照,如圖5所示:taxi’sHOGfeatureextraction(a)出租車的HOG特征提取〔b〕Jeep’sHOGfeatureextraction(b)Jeep車的HOG特征提取〔c〕Van’sHOGfeatureextraction(c)面包車的HOG特征提取Figure5HOGfeaturecomparisonofdifferentvehicles圖5不同車輛HOG特征比照如下圖,可以很明顯的看出,面包車輛的HOG特征與其他車輛的HOG特征的區(qū)別,因此將HOG特征作為面包車輛的識別特征是可行的。本章小結(jié)通過對各種車輛檢測算法的學習分析,最后選取HOG特征算法,作為面包車輛的特征進行提取,為后續(xù)的識別做準備。同時通過實驗比擬分析可知,各種車輛的HOG特征存在差異性,所以將HOG算法運用到車輛檢測是合理有效的。基于SVM的面包車分類識別識別〔分類〕主要任務(wù)就是對特征空間進行一種合理的劃分。分類器就是用標記為類別的決策區(qū)域表征特征空間,理想適宜且唯一的分類結(jié)果是,這些決策區(qū)域完全覆蓋整個特征空間且任意兩個決策區(qū)域互不相交,對特征矢量分類就是為其找到適宜的決策區(qū)域且不同屬于其他決策區(qū)域。運用特征提取的方法對車輛存在的區(qū)域提取統(tǒng)計特征以構(gòu)造分類器,從而在車輛識別過程中應(yīng)用訓練好的分類器實現(xiàn)對車輛和背景的分類識別。車輛識別常用的分類器介紹一般模式識別問題可以描述如下:對某一類樣本的收集整理,并對收集到的樣本集合訓練,很明顯此時訓練樣本明確知道所屬類別的。將訓練樣本按照如圖6(a)所示的訓練過程進行分類器的訓練過程,就得出分類器的判決表示。然后將待測樣本按照經(jīng)過訓練得到的分類器進行分類識別,此過程如圖6(b)所示。(a)Trainingprocess〔a〕訓練過程(b)Classificationprocess〔b〕分類識別過程Figure6Trainingandclassificationprocess圖6訓練和分類識別過程現(xiàn)階段常用的分類器有人工神經(jīng)網(wǎng)絡(luò)、K-近鄰分類器、貝葉斯網(wǎng)絡(luò)、AdaBoost分類器和〔SupportVectorMachine〕SVM,文章就對這幾種方法進行詳盡的介紹。人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)〔ArtificalNeuralNetworks,ANN〕工作原理是基于考人腦的大腦神經(jīng)元網(wǎng)絡(luò)及神經(jīng)元決策原理根底上建立的,只是借鑒了人腦反射工作方式原理而不是人腦組織結(jié)構(gòu)真實模擬反響。因此換一種說法就是人工神經(jīng)元模型是對生物神經(jīng)元模擬及抽象出來的數(shù)學描述,其模擬神經(jīng)元根本組成局部包括:的細胞體、樹突、軸突、突觸。如圖7所示:Figure7Artificialneuronmodel圖7人工神經(jīng)元模型它采用感知算法對決策區(qū)域進行分類,在這種模型中,分類決策知識被隱式地存儲在連接的權(quán)值上,權(quán)值向量運用迭代算法來確定,當通過網(wǎng)絡(luò)的輸出判別為正確時,權(quán)值向量保持不變,反之,當輸出為錯誤時,權(quán)值向量做增加或降低的調(diào)整,因此這種算法也稱為獎懲法。通常情況下,神經(jīng)網(wǎng)絡(luò)分類法由訓練局部和測試局部組成,將樣本的特征項構(gòu)造輸入神經(jīng)元,特征項的數(shù)量即為該神經(jīng)網(wǎng)絡(luò)輸入神經(jīng)元的數(shù)量,至于隱含層數(shù)量和該層神經(jīng)元的數(shù)目要以實際情況而定。在訓練局部需要通過對大量的訓練樣本的訓練,以便得到訓練樣本輸入與輸出之間存在確實定關(guān)系,即在不斷的訓練中通過迭代算法,調(diào)整過程中得到連接權(quán)值矩陣,從而得到最適宜的連接權(quán)值矩陣;測試局部那么是主要針對用戶輸入的待測樣本的特征得到相應(yīng)輸出值,即該樣本所屬類別。K-最近鄰分類器最近鄰分類方法以獨特簡單的性質(zhì)優(yōu)點在目前模式識別及類別推理方面中仍占有一席之地。如今在各種人工智能的問題上也廣泛運用到最近鄰規(guī)那么,如模式識別,數(shù)據(jù)挖掘,后驗概率的估計,基于相似性的分類,計算機視覺和生物信息學等領(lǐng)域。最近鄰算法的開展涵蓋多方面,不僅在算法提出創(chuàng)新、對理論深入研究分析,而且還有跟可視化的結(jié)合。K-最近鄰分類算法〔k-NearestNeighbour,KNN〕,從字意上的簡單理解就是,在給定新樣本后,在訓練樣本集中只尋找與該新樣本距離最近(最相似)的K個樣本,忽略其他相距較遠的樣本,由這K個樣本所屬類別就可以確定新樣本所屬類別。具體說就是:在N個己知訓練樣本集中找出待測樣本x的k個近鄰,如圖8所示。設(shè)這N個己經(jīng)訓練樣本中,來自ω1的樣本有Nl個,來自ω2的樣本有N2個,……,來自ωc的樣本有Nc個,假設(shè)kl,k2,……,kc分別是k個近鄰中屬于ω1,ω2,……,ωc類的樣本數(shù),那么我們可以定義判別函數(shù)為,i=1,2,……,c。決策規(guī)那么為:假設(shè),那么決策。在N足夠大且貝葉斯理論誤差足夠小前提下,K-最近鄰分類算法和貝葉斯分類器的性能及其相當。只有N取值足夠大條件下,新樣本x附近范圍內(nèi),含k個樣本數(shù)的超球面半徑(歐幾里德距離)都趨于無窮小時,此時樣本空間認為是致密填充的。當x與k之間距離會非常小及k足夠大時,可以用(假設(shè)是連續(xù)的)來表示為x附近超球面所以范圍內(nèi)條件概率。那么x附近超球面內(nèi)為最大條件概率相應(yīng)類大多數(shù)點。因此,K最近鄰分類器趨向于貝葉斯分類器,誠然,所有這些都是漸進于真值的。K-最近鄰分類算法在定類決策上,只利用了訓練樣本空間的個數(shù)信息,而沒有利用其他距離信息等,即只與少量的鄰近的訓練樣本有關(guān)。這種投票機制使得KNN有一個主要的缺乏:當訓練樣本不均衡時,比方某些類的樣本容量很大,而只有少量的其余類樣本時,在待測樣本的k個近鄰中非常有可能大容量類的樣本數(shù)量多于其它類樣本,從而導(dǎo)致誤分類的情況;另外,KNN只利用了訓練樣本空間的個數(shù)信息,而忽略了其他距離信息等,從而使得識別率不高。Figure8KNNdecision-makingprocess圖8KNN的決策過程貝葉斯網(wǎng)絡(luò)貝葉斯網(wǎng)絡(luò)〔BayesianNetworks,BNs〕是近年來人工智能學科最活潑的領(lǐng)域之一。以有向圖來對事件間因果關(guān)系直觀表達方式。利用貝葉斯概率描述事件發(fā)生可能性的程度大小。貝葉斯網(wǎng)絡(luò)信息特征主要包括定量及定性兩方面:1〕定性方面通過條件信息獨立網(wǎng)絡(luò)結(jié)構(gòu)G相互連接,可用結(jié)構(gòu)點描述為某領(lǐng)域中具體量,結(jié)構(gòu)點連接方式〔有向弧〕表示變量間相關(guān)性大小來表達的;2〕定量方面是通過節(jié)點間及相關(guān)節(jié)點變量間條件概率及分布函數(shù)〔條件概率表〕來表達的。由此可見貝葉斯網(wǎng)絡(luò)通過統(tǒng)計節(jié)點參數(shù)以及結(jié)構(gòu)知識獲得,具有標準性、數(shù)字化優(yōu)點。實際應(yīng)用過程中需要假設(shè)屬性間條件為互補影響的,在此條件下貝葉斯分類器星形結(jié)構(gòu)可由如圖9所示。Figure9ThestarstructureofBayesianclassifier圖9貝葉斯分類器星形結(jié)構(gòu)其中Xi表示屬性結(jié)點,C表示類結(jié)點。屬性之間沒有直接相連的邊,表示屬性之間條件獨立。貝葉斯分類主要特征:1〕貝葉斯分類是通過比擬對象概率值的方式確定屬于那一種對象類,因此對應(yīng)最大概率類就是該對象所屬類;2〕每個對象屬性都提供奉獻值,即所有對象屬性都參與分類;3〕貝葉斯分類對象的屬性形式?jīng)]有統(tǒng)一要求可為:離散的、連續(xù)的及混合的。主要目的提供最小化誤差的最優(yōu)解決方法來分類和預(yù)測。實際工程應(yīng)用中,貝葉斯分類主要依據(jù)某類分布概率來描述對象屬性所示不能直接被利用,實際當中很多情況下都無法準確求出證據(jù)的概率分布。因此通過對分類方法提出某種假來逼近貝葉斯定理使用條件。AdaBoost分類器AdaBoost算法具有能夠顯著改善子分類器預(yù)測精度,不需要先驗知識,理論扎實等優(yōu)點[30],一經(jīng)提出就受到不同領(lǐng)域研究人員的關(guān)注,在解決各行業(yè)應(yīng)用問題中都獲得了極大的成功。在更好地了解Adaboost方法之前,先了解一下Boosting方法。對一個是與否的問題作出判斷,隨機猜想有50%的正確率,如果一種方法能夠使準確率稍微高于50%的正確率,那么可以稱得到這個方法的過程為弱學習;如果一種方法能夠使準確率顯著提高,那么稱獲取該方法的過程為強學習。1994年,Kearns和Valiant證明,在Valiant的PAC〔ProbablyApproximatelyCorrect〕模型中,只要數(shù)據(jù)足夠多,就完全有可能將弱學習算法通過不斷地學習的方式提高到任意精度,從而獲得強學習算法。實際上,1990年,Schapire就首先構(gòu)造出一種多項式級的算法,將弱學習算法提升為強學習算法,就是最初的Boosting算法。Boosting意思為提升、加強,現(xiàn)在一般指將弱學習提升為強學習的一類算法。1993年,Drucker和Schapire首次提出將神經(jīng)網(wǎng)絡(luò)作為弱學習器,利用Boosting算法解決實際問題。1994年Kearns和Valiant[31證明將弱學習算法通過集成學習的方式可以提高到任意精度;雖然Boosting方法在1990年已經(jīng)提出,但其理論的真正成熟,也是在1994年之后才開始的。1995年,F(xiàn)reund提出了一種效率更高的Boosting算法。1995年,F(xiàn)reund和Schapire提出了Adaboost算法,這是對Boosting算法理論一次質(zhì)的飛躍。Adaboost是Boosting家族的代表算法之一[31],全稱為AdaptiveBoosting。主要依據(jù)弱學習反響對假設(shè)錯誤率相應(yīng)調(diào)整,因此Adaboost主要特點:不對錯誤率下限有什么依賴,對任何弱學習器先驗知識都沒要求,而具有和Boosting算法具有同樣好的效率,為此得到廣泛應(yīng)用。Adaboost是一種由級聯(lián)分類模型構(gòu)成的分類器。級聯(lián)分類模型如圖10表示,其主要特征;由多個弱分類器組成且每一級結(jié)構(gòu)復(fù)雜性逐漸遞增。每一級分類器具有通正例阻負例的共性。因此這樣檢測好處在于每一級逐漸遞減,減少大量非檢測量,進而增強了目標檢測速度。Figure10AdaBoostcascademodel圖10AdaBoost級聯(lián)模型其次,Adaboost是一種迭代算法[32]。初始時,所有訓練樣本的權(quán)重都被設(shè)為相等,在此樣本分布下訓練出一個弱分類器。在第i〔i=1,2,3,…T,T為迭代次數(shù)〕次迭代中,樣本的權(quán)重由第i-1次迭代的結(jié)果而定。在每次迭代的最后,都有一個權(quán)重的調(diào)整過程,在此過程分類錯誤的樣本的權(quán)重將會增加,這樣錯分的樣本將被突出表現(xiàn)出來,得到一個新的樣本分布。首先在新樣本分布條件下,每次對樣本進行訓練,可獲得一個弱分類器。以循環(huán)的方式進行T次,就可得到一系列T個弱分類器,然后在把這T個弱分類器通過一定的權(quán)重從新疊加,最終可獲得強分類器。AdaBoost算法的重要意義在于為研究和實際問題的解決帶來了新的思想,在絕大多數(shù)集成學習算法通關(guān)構(gòu)造越來越復(fù)雜的分類器來提高預(yù)測精度時,AdaBoost主要特色:以最簡單方式,通過在功能上實現(xiàn)比隨機猜想略好分類器從弱到強方法,AdaBoost在訓練子分類器思想方法中進行改革:在打破已有樣本分布根底上,使分類器注意力主要集中于難學習樣本上。在算法使用上,僅需要指定迭代次數(shù),不需要任何先驗知識,一切運行過程中的參數(shù)由算法自適應(yīng)地調(diào)整,因此被評價為最接近“拿來即用〞[33]的算法。與此同時,AdaBoost算法也存在缺點以及一些尚未解決的問題:例如提高算法抗噪聲能力、停止迭代條件確實定是不可防止的問題、增加子分類器多樣性。SVM分類器支持向量機〔supportvectormachine,SVM〕屬于一種解決二分類問題的模型,如圖11所示,是定義在輸入樣本的特征空間上的間隔最大化的分類器,間隔最大化優(yōu)化方法使支持向量機與感知機之間〔perceptron〕有所區(qū)別[34],也成為支持向量機的理論根底之一。(c)(c)Figure11Withthetwo-dimensionalfeaturevectorclassificationexamplefigure圖11具有二維特征向量的二分類例如圖隨著模式識別技術(shù)的開展,支持向量機得到廣泛應(yīng)用,逐漸被用在機器學習數(shù)據(jù)挖掘方面,使理論研究及實際應(yīng)用方面得到快速開展。因為支持向量機能夠很好解決復(fù)雜線性回歸及復(fù)雜識別中分類等諸多問題,還經(jīng)常應(yīng)用預(yù)測和綜合評價等領(lǐng)域[35][36]。支持向量機實現(xiàn)原理為:首先把某種事非線性輸入向量x轉(zhuǎn)化到高維特征空間映射Z,并在該空間尋找到最優(yōu)分類超平面[37]。SVM主要采用行非線性變換方式,對輸入量進行處理,通過策規(guī)那么集合的超平面權(quán)值合成結(jié)構(gòu),再從結(jié)構(gòu)中選擇最好元素及該元素最好函數(shù),實現(xiàn)最小化錯誤率最低,進而進一步保證結(jié)構(gòu)風險最小化原那么??紤]到SVM分類器在解決小樣本學習、非線性以及高維模式識別等問題中表現(xiàn)出的良好分類性能,因此本文的研究使用SVM作為分類器?;赟VM的面包車分類器支持向量機的實現(xiàn)原理是:通過某種事先選擇的非線性映射(核函數(shù))將輸入向量映射到一個高維特征空間,然后在這個新空間中求取最優(yōu)線性分類面[38],而這種非線性變換是通過定義適當?shù)膬?nèi)積函數(shù)實現(xiàn)的。SVM分類器原理為了說明SVM是怎么的一個分類器,首先給出一個簡單的線性可分的分類問題.所謂數(shù)據(jù)集線性可分是指,給定一個特征空間上的訓練數(shù)據(jù)集〔3.1〕其中:;——表示第i個數(shù)據(jù)的特征向量;——為的類標記,當時,表示為正例;當時,表示為負例,稱為樣本。如果存在某個超平面S使得〔3.2〕能夠?qū)?shù)據(jù)集的正實例點和負實例點完全正確地劃分到超平面的兩側(cè),即對所有的的實例,有,對所有的的實例,有,那么稱數(shù)據(jù)集T為線性可分數(shù)據(jù)集;否那么稱數(shù)據(jù)集T線性不可分[34]。線性可分的支持向量機是定義在線性可分的數(shù)據(jù)集的根底之上的。例如對圖11〔a〕中黑點和白點所呈現(xiàn)的就是一個線性可分的數(shù)據(jù)集,需要用一條直線,將圖11〔a〕中黑色的點和白色的點完美的分割開,很顯然,圖上的這條直線就是要求的直線之一。而這個分類問題中所有的樣本點剛好可以用一條直線完全正確的別離開來,這種假設(shè)下建立的支持向量機稱之為線性可分的支持向量機。假設(shè)令黑色的點記為-1,白色的點記為+1,直線,這里的x、w都是向量,這種形式等價于〔3.3〕其中:;。前者表示的是構(gòu)建的模型參數(shù)〔例如局部可形變目標檢測模型的參數(shù)〕,后者表示的是輸入模式〔例如目標檢測中的圖像〕的特征向量,n表示的是特征向量的維數(shù),是一個實數(shù),表示的是特征向量的第i個元素。當向量x的維度n=2的時候,在二維空間中f(x)表示一條直線,當n=3的時候,在三維空間中f(x)表示一個平面,當n>3時,表示n維空間中的n維超平面。令白色黑色兩類的點分別為+1,-1,當對一個新樣本點x做預(yù)測分類時,用符號函數(shù)就可以進行預(yù)測。當f(x)>0的時候,,當f(x)<0的時候,之后令。最優(yōu)分類超平面支持向量機進行訓練的目的主要是在輸入的特征空間中找到一個超平面,該超平面能將實例〔圖11中的黑點和白點〕分到不同的類別中去。超平面對應(yīng)于方程為,它由法向量w和截距b決定,可用〔w,b〕來表示。超平面將特征空間劃分為兩個局部,一局部為正類,即,一局部為負類,即。法向量w指向的一側(cè)為正類,另一側(cè)為負類。而問題在于,當訓練數(shù)據(jù)集線性可分時,存在無窮個超平面可將兩類數(shù)據(jù)正確分開。例如能將圖11〔a〕中黑點和白點分開的直線有無數(shù)條,如圖11〔b〕所示的直線根本都能滿足要求,怎樣才能得到一個最優(yōu)的劃分直線f(x)。感知機利用了誤分類數(shù)最小的優(yōu)化策略,求得所需的超平面,不過這時的超平面有無窮多個。線性可分支持向量機采用了一個叫做間隔最大化的理論求取最優(yōu)超平面,這樣做時,能保證解是唯一的。在圖11〔c〕中,有A,B,C三個點,表示3個樣本實例,它們均在超平面+1類一側(cè),在預(yù)測它們屬于哪一類時,點A距離超平面較遠,假設(shè)預(yù)測該點為+1類,就能比擬確信預(yù)測是正確的;點C距離超平面較近,假設(shè)預(yù)測該點為+1類就不那么確信;點B介于點A與C之間,預(yù)測其為屬于+1類確實信度也在A與C之間。一般來說,一個點距離超平面的遠近可以代表分類預(yù)測確實信度。在超平面確定的情況下,〔3.4〕可以表示點x離超平面距離值大小,利用及類標記y符號一致性判定分類正確性。因此采用y〔〕描述分類的正確性及確信度大小,這種說法稱為間隔〔functionalmargin〕。可以理解為間隔最大化的直線具有特征:在黑白兩類點正確分開前提下,兩類點中不但滿足最近原那么還要離直線之間距離最大。在數(shù)據(jù)集線性條件下具有直線唯一性。Figure12SVMoptimalseparatinghyperplane圖12SVM最優(yōu)分類超平面使用間隔最大化的前提是正確分類,對于一個點x,在正確分類時,離直線的距離可以表示為,其中,由于y和f(x)始終同號,所以g(x)始終為正。此時,容易注意到,對于上式的決策函數(shù),權(quán)值和b同時放大或者縮小相同的倍數(shù)都不會影響樣本到分類面的距離,因此上面定義的最優(yōu)分類面沒有唯一解,而是有無數(shù)個等價的解。為了使著個問題有唯一解,就需要把和b的尺寸定下來。一種解決方法就是令離分類面最近的樣本點到分類面的距離為1,這樣,對所有的樣本點,有。由于在分類面兩側(cè)各有這樣的樣本點,因此間隔最大化就可描述成:,約束條件是〔3.5〕等價的描述是:,約束條件是〔3.6〕這樣,就構(gòu)建了能得到最優(yōu)化直線或者超平面的數(shù)學表達,通過優(yōu)化這個式子,就能得到間隔最大化理論下的最優(yōu)化的結(jié)果,這個式子稱之為目標函數(shù)。使用SVM對不能使用線性分類的分類工作的過程:第一步,運用預(yù)先選定的非線性映射將輸入空間映射到高維特征空間,使得輸入訓練樣本可以在高維屬性空間中有可能實現(xiàn)超平面的分割,從而防止了在原輸入空間中進行非線性曲面分割計算。SVM通過訓練得出的分類函數(shù)具有這樣的性質(zhì):它是一組以SV為參數(shù)的非線性函數(shù)的線性組合,因此分類函數(shù)的表達式僅和SV的數(shù)量有關(guān)[39],而獨立于空間的維度。非線性可分模型映射到高維空間以后,分類的示意圖為:Figure13SVMclassificationmodelinhigh-dimensionaldiagram圖13SVM高維分類模型圖支持向量機求得的分類函數(shù)形式上類似于一個神經(jīng)網(wǎng)絡(luò),其輸出時假設(shè)干個中間層節(jié)點的線性組合,而每一個中間層節(jié)點對應(yīng)于輸入樣本與一個支持向量的內(nèi)積,因此也叫做支持向量網(wǎng)絡(luò)[40],如圖14所示。Figure14SupportVectorMachineSchematic圖14支持向量機示意圖內(nèi)積函數(shù)采用適當?shù)牡膬?nèi)積函數(shù)就可以獲得滿足需要的支持向量機,運用不同的內(nèi)積函數(shù)將導(dǎo)致不同的支持向量機算法;目前得到研究的內(nèi)積函數(shù)形式主要有以下幾類[41],在以下幾式中x表示測試樣本,xi表示訓練樣本:采用線性關(guān)系表示的最簡單內(nèi)積函數(shù),即〔3.7〕內(nèi)積函數(shù)選擇利用多項式進行描述為:〔3.8〕計算結(jié)果為具有q階多項式的分類器。(3)利用核函數(shù)表示內(nèi)積函數(shù)的表達式為:〔3.9〕可得到徑向基函數(shù)分類器是支持向量機,基函數(shù)中心與支持向量具有相對應(yīng),算法自動獲得輸出權(quán)值起著決定作用。(4)利用S形函數(shù)描述內(nèi)積函數(shù)表達式為:〔3.10〕此刻該表達式結(jié)果為具有兩層的多層感知器神經(jīng)網(wǎng)絡(luò)的支持向量機,不但能輸出網(wǎng)絡(luò)的權(quán)值,而且還能得出網(wǎng)絡(luò)的隱層節(jié)點具體數(shù)目。車輛庫的建立車輛標準庫是車型正確分類的關(guān)鍵。先建立標準模板庫,然后根據(jù)Hog特征表達式,計算得到車標特征庫。顯然,這種基于特征的匹配識別算法,可以降低模版庫對存儲空間的要求,相比儲存一副圖像,只儲存局部數(shù)據(jù)還能夠極大提高匹配的識別速度。車輛特征庫的建立,一般常用的方法有兩種方法:一種是從大量的訓練樣本中,提取識別效果最理想的一個來進行特征計算,并作為模板的特征值,這種方法操作簡單,但比擬依賴人的主觀判斷;另一種方法是對多個樣本逐一進行特征計算,通過求平均值得出模板特征值。這種方法效果比擬好,能降低采集過程中的人為因素的影響,但是實現(xiàn)較為復(fù)雜。由于受環(huán)境影響,所以采集車形計算特征量需要先對車輛樣本預(yù)處理。車輛標準特征庫的建立流程如圖15所示:Figure15Theflowchartsofvanlibrariescreate圖15面包車庫建立流程圖在實驗中,我們從收集到的大量圖片中選擇不同型號、大小、光照等,盡可能的是樣式涵蓋最全的圖片作為模板樣本,局部的正樣本圖像如圖16〔a〕;局部負樣本,如圖16〔b〕所示:〔a〕Positivesamplespictures〔a〕正樣本圖片(b)Negativesampleimage〔b〕負樣本圖片F(xiàn)igure16Somesamplespictures圖16局部樣本圖片在算法一定的情況下,樣本庫的大小和典型性共同決定著SVM分類器的準確性。所以本次設(shè)計在構(gòu)建訓練樣本庫的過程中投入了大量的時間,一共找到了正樣本負樣本各550多張,總共樣本1100多張,這也為SVM分類器的準確性奠定了根底。通過種種渠道,我找到了交通監(jiān)控錄像,為樣本的真實性,多樣性提供了保障。為了方便SVM的訓練,統(tǒng)一將圖片的尺寸調(diào)整到64╳128。從上述樣本可以看出,樣本的選擇具有了全面型,典型性,包含了各種車型,各種天氣。正是這樣全面的樣本庫,使得SVM分類器的準確性得到了保證。SVM分類器的訓練在進行SVM分類器訓練之前,需要做好各種準備工作,最重要的就是正負樣本的HOG特征提取,之后將獲取到的HOG特征數(shù)據(jù)庫即車輛特征庫送入SVM中進行分類訓練,從而獲得用于識別面包車的SVM分類器。其具體訓練過程如下:〔1〕將所有車輛圖片分為數(shù)量相等的正負樣本:在實際獲取收集到的車輛圖片中,都比提取特征的圖片要大且大小不統(tǒng)一,首先將所有照片統(tǒng)一到一樣的尺寸并符合實驗需求的大小64╳128,選取各種情況下的各種型號面包車的圖片作為訓練的正樣本;用和正樣本相等數(shù)量的其他車輛、和面包車不相關(guān)的圖片作為負樣本;〔2〕提取正負樣本的HOG特征:在OpenCV中實現(xiàn)HOG特征的提取;〔3〕將在上一步中提取到的HOG特征投入到SVM中訓練,得到初始分類器;〔4〕利用上一步獲取到的初始分類器的支持向量和對應(yīng)的權(quán)值加權(quán)得到檢測面包車的檢測子,再加上一維的偏移。但是,這個初始檢測子,檢測效果很不理想,有很多錯檢的結(jié)果,由于錯檢太多,需要對分類器繼續(xù)訓練加以完善;〔5〕利用這個初始的檢測子對負樣本的原圖進行檢測,這次需要對尺度不統(tǒng)一的圖片進行檢測,此時可以使用cv-HOG的多尺度檢測方法,獲得hardexample區(qū)域;〔6〕將第5步中hardexample區(qū)域分割出來,之后提取該局部的的HOG特征;〔7〕將在hardexample提取到的HOG特征和第2步中正負樣本的HOG特征綜合起來,再重新訓練SVM分類器,這樣得到的SVM分類器的分類效果得以改善。如果效果不理想,可以從第〔5〕步開始繼續(xù)重復(fù)訓練。基于SVM的面包車分類識別實驗對上一章節(jié)獲取到的SVM分類器進行分類識別實驗,驗證該分類器的真實可用性,具體驗證流程如圖17所示:Figure17TheprocessofvanidentificationwiththeSVMclassifier圖17用SVM分類器識別面包車流程其具體實驗結(jié)果如圖18所示,有實驗結(jié)果可以看出,通過此方法獲得的SVM分類器對面包車的識別率根本可以滿足實際需求。Figure18VanidentifieswiththeSVMclassifier圖18用SVM分類器對面包車的識別本章小結(jié)本章主要針對面包車分類識別中分類器的建立做了分析介紹,首先將目前在圖像分類識別上廣泛使用的分類器做一簡單了解認識,在比擬各分類算法的優(yōu)缺點之后,針對本文的研究對象,選用SVM分類器;其次,對SVM分類器做了深入的研究認識,并對其算法認真學習,最后通過MATLAB將其實現(xiàn);最后,為了獲得關(guān)于面包車輛的SVM分類器,建立車輛特征庫,并對其進行分類訓練,將獲得SVM分類器進行實驗,實驗結(jié)果較為理想?;陬伾?HOG的面包車檢測識別顏色信息作為檢測目標、檢測道路非常有用的檢測方法,很多監(jiān)控系統(tǒng)運用顏色信息來實現(xiàn)道路險跟蹤、車輛分割等的有用信息。顏色特征是一個全局特征,所以目標或目標所在區(qū)域的外表性質(zhì)可以用顏色特征加以描述。因此面包車的顏色特征也是區(qū)別其他車輛的重要信息。通常情況下,顏色特征是基于像素點的特征,所有屬于圖像或圖像區(qū)域的像素對圖像的整體特征都有各自的奉獻,由于顏色對圖像或圖像區(qū)域的方向、大小等變化不敏感,因此顏色特征更能很好的刻畫對象的整體特征。車輛顏色信息也是運動車輛識別系統(tǒng)中一個重要輔助特征,它由車身的主要顏色成分確定。面包車的顏色一般是純色,無需對局部環(huán)節(jié)進行區(qū)別,只是確定特征區(qū)域的分布就可,所以,在顏色空間中計算的HOG特征更有利于面包車的識別。顏色特征彩色圖像在圖像的眾多特征中,顏色特征可以直觀、清晰的表達出來,是圖像視覺重要的感知特性之一。其不僅表征出圖像中目標對象和周邊環(huán)境的關(guān)系,而且對圖像自身的尺寸、方向、視角的依賴性較小,因此基于顏色特征的圖像查詢在圖像檢索中最根本和最重要的方法[42]。經(jīng)過大量的理論研究和實踐證明,人類已經(jīng)根本掌握了顏色的物理本質(zhì)。詳細的實驗研究數(shù)據(jù)說明,人眼錐狀細胞是接受彩色視覺信息的主要細胞,人眼中大概擁有六七百萬錐狀細胞,其中可將其分為三個主要的彩色信息感知類別。分別是紅、綠、藍,其中大約65%的細胞對紅色光源敏感,33%對綠色光源敏感,只有2%對藍色光源敏感[43],眼睛對紅、綠、藍吸收的平均實驗曲線如圖19所示。由于人眼對光源信息的吸收特性,所以通常認為被眼睛看到的彩色是由三種原色,紅〔red〕、綠〔green〕和藍〔blue〕通過眼睛接收量的多少組合得到。Figure19Thefunctionofconeseyesabsorbthered,green,andbluewavelengths圖19人眼中錐狀細胞對紅、綠、藍三色的波長吸收函數(shù)T.Young在1802年提出三色原理,其根本內(nèi)容是:任何顏色都可以用3種不同的根本顏色按照不同比例混合得到,即〔4.1〕式中:C1、C2、C3——為三種原色〔又稱為三基色〕,a、b、c≥0,為3種原色的權(quán)值或者比例,通過改變a、b、c即可得到不同的色彩。三原色原理在色度學中占有重要地位,是其他原理的根底。為了統(tǒng)一標準,1931年,國際照明委員會〔CIE〕規(guī)定各種顏色用紅、綠、藍三原色按照比例混合得到,其配色方程為:〔4.2〕其中:C為任意一種顏色,R代表紅色,G代表綠色,B代表藍色,a、b、c≥0,為3種原色的權(quán)值或者比例。三原色原理的應(yīng)用,同時國際標準的推出,各種顏色用統(tǒng)一標準的表示,使得彩色圖像的獲取、表示、傳輸和復(fù)制不再是空想。經(jīng)常使用亮度、色調(diào)和飽和度來區(qū)分顏色。如無彩色圖像就只有亮度一個特性量的變化;色調(diào)主要表現(xiàn)光波混合中,和主波長相關(guān)的屬性,表示觀察者觀察到的主要顏色;色調(diào)的純度的對飽和度有一定的影響,當完全飽和時代表著純光譜色的,隨著白光的不斷參加飽和度逐漸減少。色調(diào)和飽和度合稱為彩色,因此,顏色用亮度和彩色表征。面包車的顏色特征從視覺上區(qū)分一件物體時,多數(shù)情況下從兩方面入手,首先,先從其外觀,從外表確定其大概屬于什么類,進行粗劃分之后,再進行仔細的劃分,例如顏色、環(huán)境、聲音等等特點。在現(xiàn)有的車輛中,車輛輪廓和車輛顏色都是描述一輛車的主要特征。就以面包車為例,在輪廓有稍微的變化的情況下,還有一個顯著特征:顏色。隨著三原色原理的提出,彩色空間的運用成為現(xiàn)實,通過監(jiān)視器獲得畫面不再是單純的黑白兩色,而是展現(xiàn)出一個多姿多彩的畫面,從而從顏色特征上區(qū)分車輛也不再是空想。由第三章中的車輛庫中的各類面包車的圖片可以得出,面包車外表顏色相對固定、車輛類型相對單一,這也是區(qū)別其他車輛的重要特征。面包車都是以某種純色為主,很少有混合色。同時可以看到,有一局部的面包車的車型和現(xiàn)在比擬流行的SUV外形輪廓很是相似,但是SUV的顏色較為龐雜,有純色、混合色等,相對顏色大多是乳白色或銀灰色的面包車,用顏色特征將會更好的識別面包車。基于顏色特征的檢測識別預(yù)處理常用的顏色特征提取方法有:顏色直方圖顏色直方圖可以描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像色彩分布中各自所占的比例;對于無法自動分割的圖像和無需考慮物體空間位置的圖像非常適用[45],該方法存在著缺點,即很難確定圖像局部局部的顏色分布及每種色彩所在的圖像位置。在日常生活中及圖像處理中,常用的顏色空間主要有以下幾種:RGB顏色空間、HSV顏色空間、HSI顏色空間等。顏色集顏色集是類似于顏色直方圖的一種方法。首先,將圖像從RGB顏色空間轉(zhuǎn)化到視覺均衡的顏色空間〔如HSI空間〕,并將顏色空間用假設(shè)干個區(qū)間〔bin〕加以量化;然后,用色彩自動分割技術(shù)對圖像進行分割,將其分為假設(shè)干區(qū)域,在對每個區(qū)域中的某個顏色分量量化作為該局部顏色空間的索引[44],從而可以用一個二進制的顏色索引集來表示圖像。顏色矩顏色矩是在數(shù)學方法上建立的,顏色的分布用矩來描述。圖像中任何顏色的分布均可以用它的矩來表示。顏色矩可以直接在RGB顏色空間計算,由于顏色分布信息主要集中在低階矩。因此,僅采用顏色的一階矩、二階矩和三階矩就足以表達圖像的顏色分布[45],它們的定義分別為:〔4.3〕〔4.4〕〔4.5〕其中:Pij——是第j個像素的第i個顏色分量;N——是像素集。事實上,一階矩i表征每個顏色分量的平均強度[44],二階和三階矩分別表征了顏色分量的方差和偏斜度。彩色空間彩色空間〔也稱彩色模型或彩色系統(tǒng)〕的用途主要是在某些標準下,或圖像處理要求上用通??山邮芑蚶趫D像處理的方式簡化彩色標準。事實上,彩色空間就是坐標系統(tǒng)和子空間的標準[46],位于系統(tǒng)中任意顏色都由坐標系統(tǒng)中的某個點來表示?,F(xiàn)在所用的大多數(shù)彩色空間都是為了更好地滿足硬件或?qū)嶋H應(yīng)用需求,RGB〔紅、綠、藍〕空間是最通用的面向硬件的彩色空間,主要用于彩色監(jiān)視器或彩色視頻攝像機;CMY〔青、深紅、黃〕、CMYK〔青、深紅、黃、黑〕空間主要用于彩色打印機;HSI〔色調(diào)、飽和度、亮度〕空間符合人類對彩色信息的描述和顏色的解釋方式,用彩色信息和亮度信息兩局部來描述圖像;CIE顏色空間〔CIELuv、CIELab〕是另一種符合人類描述和解釋顏色的方式;由于彩色科學涉及到的應(yīng)用領(lǐng)域很寬廣,所以還有很多應(yīng)用的彩色空間,但在此只對以下幾種作簡要介紹:RGB彩色空間RGB顏色空間作為最常用的色度空間,廣泛運用在計算圖形學、數(shù)字圖像處理中。該顏色空間模型是基于笛卡爾坐標系統(tǒng)建立的,用一個RGB彩色立方體對模型以圖解展示[47],如圖20所示,這個立方體的各頂點分別代表光的原色〔紅、綠、藍〕和三種典型合成色〔青、品紅、黃〕。Figure20RGBcolorspacemodel圖20RGB顏色空間模型在RGB彩色空間中,每一幅圖像都由三個圖像分量組成,即每幅圖像可以向三個原色面進行投影,每一個面的投影獲得一個圖像分量,每一個分量圖像代表著該圖像在該原色面上的分布,用像素深度表示每一像素的比特[46];在這個彩色空間中,每幅圖像可以用三個圖像分量表示,所以,在此空間中可以用一個mn3的矩陣來表示一幅mn〔m,n為正整數(shù),分別表示圖像的高度和寬帶〕的RGB彩色圖像。可以用紅、綠、藍三個分量組成的三元組表示圖像中的每一個像素點;三個分量不僅含有色彩和亮度的信息,而且三個分量之間存在著很大的相關(guān)性[48]。HSI彩色空間HIS彩色空間是基于人的視覺系統(tǒng)建立的,用色調(diào)〔Hue〕、飽和度〔Saturation〕和亮度〔Intensity〕共同來描述色彩。HIS顏色空間由兩局部組成:一個垂直的亮度軸和與此軸垂直的一個平面上的彩色點的軌跡,平面沿著亮度軸上下移動,那么由平面和立方體外表相交形成的邊界有可能是三角形,也有可能是六邊形,甚至也有可能是圓形。假設(shè)從立方體的亮度軸看去,如圖21〔a〕所示,在這個平面上,各原色之間都相隔120,合成色與原色相關(guān)60,合成色之間的角度也是120。圖21〔b〕顯示了六邊形和一個任意的彩色點,這個點的色調(diào)是由其和參考點的連線與,參考點和紅色軸連線之間的夾角決定,即定義參考點與平面和紅色軸的交點之間的夾角為0,求彩色點與參考點之間的夾角,夾角從0逆向增加;飽和度指的是該點到亮度軸的距離,也就是從原點到該點的向量的模長,原點即為該彩色平面與垂直亮度軸的交點;亮度即為該彩色平面在亮度軸上的位置。所以,HSI彩色空間主要包括垂直亮度軸、到彩色點的向量長度以及該向量與紅色軸之間的夾角三個分量[49],因此用六邊形或者三角形〔如圖21〔c〕〕、圓形〔如圖21〔d〕〕,來定義一個HSI平面是可以的,選擇哪種形狀是不重要的,因為任意兩種形狀都可以相互轉(zhuǎn)換。(a)Coloredhexagons〔a〕彩色六邊形〔b〕〔c〕
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園衛(wèi)生應(yīng)急工作制度
- 里公共場所衛(wèi)生制度
- 衛(wèi)生院內(nèi)科管理制度
- 衛(wèi)生院職稱職聘工作制度
- 美容師衛(wèi)生工作制度
- 鄉(xiāng)鎮(zhèn)衛(wèi)生院會議工作制度
- 衛(wèi)生部標本管理制度
- 學生會檢查衛(wèi)生制度
- 儀器室衛(wèi)生管理制度
- 鎮(zhèn)衛(wèi)生院中醫(yī)科制度
- 失業(yè)金領(lǐng)取委托書模板
- 貝雷橋吊裝專項方案(危大工程吊裝方案)
- (完整版)新概念英語第一冊單詞表(打印版)
- 糖皮質(zhì)激素在兒科疾病中的合理應(yīng)用3
- 無人機制造裝配工藝智能優(yōu)化
- GB/T 1965-2023多孔陶瓷室溫彎曲強度試驗方法
- 六年級語文非連續(xù)性文本專項訓練
- 梨樹溝礦區(qū)金礦2022年度礦山地質(zhì)環(huán)境治理計劃書
- 師德規(guī)范關(guān)愛學生
- 太陽能光伏發(fā)電裝置的開發(fā)與推廣商業(yè)計劃書
- 海水淡化用閥門
評論
0/150
提交評論