版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
基于MATLAB的人流量監(jiān)測系統(tǒng)設計目錄206251緒論 緒論研究的目的及意義科學技術的發(fā)展給我們的生活帶來了許許多多的改變,網(wǎng)絡在我們的生活中越來越普及。最近這幾年來,隨著信息時代的發(fā)展,視頻監(jiān)控系統(tǒng)數(shù)字化和網(wǎng)絡化的優(yōu)勢也愈發(fā)的的明顯[4]。該系統(tǒng)有著極高的靈活性、開放性和集成性,為社會的信息話發(fā)展提供了良好的基礎[5]。在目前這個社會,一個完善的行人監(jiān)測系統(tǒng)在國家公共安全,社會安全和商業(yè)領域我們帶來巨大的幫助。例如:1.1刑偵破案當遇到重大刑事案件時,嫌疑人逃跑公安機關并未及時獲取得到其中一名犯罪嫌疑人的照片時,目擊者就會將其中一名犯罪嫌疑人的臉部生理特征詳細地向相關專業(yè)技術人員進行了描述,繪制犯罪嫌疑人的速寫然后在公安機關的系統(tǒng)中進行比對找到犯罪嫌疑人,并且可以通過一些重要的樞紐的監(jiān)控重點關注犯罪嫌疑人。可以大幅度提升犯罪嫌疑人的落網(wǎng)概率,為相關單位帶來便利[6]。1.2證件驗證在目前的社會中有許多時候需要進行身份驗證,而我們一般都有攜帶例如身份證駕駛證學生證一類的物品。然而這類物品上一般都有照片,可以交由機器作為驗證以達到節(jié)約人力和自動化管理.1.3入口管理在機場、港口等幾十個出入境點,由于工作人手數(shù)量有限,需要通過對關鍵的出入口實施視頻監(jiān)測。一旦被警察發(fā)現(xiàn)是恐怖主義分子或者違法人員進入了視頻監(jiān)測的范圍,安全工作人員就會立即采取措施逮捕或者制裁他們[7]。1.4人流管理在今年的疫情情況下,人流量監(jiān)測系統(tǒng)可以做到實時得到每個人的大致出行路徑,大約接觸的人群,假如疫情爆發(fā)需要做到隔離目標人物以及目標人物最近一段時間接觸過得人群時可以準確無誤的做到高效,快速。一般上下班的時候都是人流的高峰期,這也就導致大部分地區(qū)的都十分擁堵。而人流量監(jiān)測系統(tǒng)可以第一時間知道擁堵路段以及暢通路段,可以讓人們及時更改出行路線,以及公安機關及時派遣工作人員前往疏通[8]。1.2國內外研究現(xiàn)狀行人檢測技術在現(xiàn)代計算機的應用場景中有著十分廣泛的應用,比如汽車輔助自動駕駛系統(tǒng)、智能視頻監(jiān)測、機器人、航拍影像、人機交互系統(tǒng)、移動數(shù)據(jù)分析等。近年來我國在智能自動化車輛領域的研究中成為備受重視和關注的一個前沿發(fā)展方向,一些新型自動化汽車制造廠商、高校和研發(fā)機構陸續(xù)開始對行人檢查技術進行研究[9]。行人檢測技術作為汽車現(xiàn)代化和無人駕駛電動汽車應用領域的兩大先驅創(chuàng)新技術之一,行人事故檢測用的監(jiān)控雷達系統(tǒng)在近幾年也已經(jīng)逐漸發(fā)展成為汽車技術應用研發(fā)的一個熱點,它通常被直接集成或者直接融入在無到駕駛汽車與人碰撞后的事故預防控制系統(tǒng)當中,利用監(jiān)控雷達倒車攝像頭和速度傳感器等技術來自動實現(xiàn)對被撞行人的實時檢測,并及時地啟動減速緊急制動或者緊急剎車從而大大降低對交通事故的直接傷害[10]。沃爾沃、豐田等各大汽車制造公司目前己經(jīng)率先成功引進了先進的電動汽車車輛行人安全自動檢測管理系統(tǒng),而福特還已經(jīng)引進了先進的電動汽車車輛行人安全自動檢測管理系統(tǒng),能夠準確地實時識別路上的每個汽車行人并對其行為進行實時動態(tài)的數(shù)據(jù)分析,預測他們以后隨時是否還有可能會再次駕車闖入自己所要進行駕駛的汽車路線[11]。除了一些較為傳統(tǒng)的智能汽車制造企業(yè)外,許多傳統(tǒng)互聯(lián)網(wǎng)汽車企業(yè)也都正在努力探究研發(fā)一種能夠用于汽車行人安全檢查的監(jiān)控系統(tǒng),以期更好地能夠實現(xiàn)自己的汽車智能自動駕駛。所以,行人安全檢查監(jiān)控技術在推動智慧軌道交通等各個領域也日益來越得到廣泛性的重視[12]。1.3本文的主要研究內容本文中的圖像識別系統(tǒng)的整個總體工作流程主要分為以下兩個步驟。圖1-1人流監(jiān)測系統(tǒng)圖其中圖像的預先處理流程如下。圖1-2圖像預處理流程圖神經(jīng)網(wǎng)絡識別流程如下。圖1-3神經(jīng)網(wǎng)絡數(shù)字識別1)圖像預處理階段在獲取原始數(shù)字圖像過程中,由于光照、背景紋理、鏡頭分辨率、拍攝角度等原因,不可避免會造成畫面的圖像失真和帶有噪音[13]。因為系統(tǒng)中具有這些噪聲原因,采集得到的圖像直接進行處理的結果往往無法達到預期的標準,所以在獲取原始數(shù)字圖像后,需要對圖像進行預處理。對于字符識別的預處理過程一般包括:二值化、去噪聲、數(shù)字分割、歸一化處理、圖像細化。經(jīng)過預處理后的圖片不僅能夠有效濾除噪聲,并且能夠將不同的大小字符進行歸一化到一個固定大小,對大量數(shù)據(jù)進行壓縮處理。預處理階段在該系統(tǒng)中是一個很重要的階段。預處理效果的好壞會直接影響到整個系統(tǒng)的性能。2)特征提取階段由于原始數(shù)字圖像數(shù)據(jù)量大,冗余信息較多,一般不進行直接識別,而是進行提取有效特征數(shù)據(jù)、壓縮數(shù)據(jù),然后再進行識別。換句話說特征提取是為了去除圖像信息中對分類沒有幫助的部分,將圖像信息集中到幾個有代表性的特征上來的過程。3)數(shù)字識別階段我們會把提取得來的特性數(shù)據(jù)值輸入給已經(jīng)準備好的神經(jīng)網(wǎng)絡人員去進行分類和識別[14]。2行人流量圖像識別中預處理技術2.1圖像灰度值在人臉圖像預處理模塊中,有許多諸如光補償、圖像灰度化、高斯平滑、均衡化直方形圖、對比度提高等小型模塊,并且每一個小型模塊都是對應著自己所需要的算法。下面為大家詳細介紹一下在該系統(tǒng)的設計過程中所使用的算法。圖像的灰度化:簡而言之就是把彩色的影像變成了灰色。在本次流程管理系統(tǒng)設計過程中主要采用了如下圖所示的流程:圖2-1算法處理流程2.2圖像二值化經(jīng)過數(shù)次的更新灰度處理后,改圖像中的每個灰度像素都有一個新的灰度像素值,即該每個灰度像素的平均圖像灰度。其值的大小直接關系決定著一個像素的色彩清晰度和明暗。為了更方便地可以實現(xiàn)這些后續(xù)的數(shù)字圖像數(shù)據(jù)處理計算操作,還需要可以對計算出來的圖像灰度值進行二維度的數(shù)字化圖像處理。主要目的是將一張矩形圖像上的每個像素按照某些國際標準將其劃分成兩個不同的顏色。在對影像的處理中,二值變量起著重要的用處。這是因為,一方面影像本身都是采用了二進制。另一方面,即便圖像本身在某些條件下被視為灰度,它們會被轉變成二維價值的圖像后重新處理。方便我們通過增加對圖像處理的時間,增加處理的速度。把它們的轉換默認為僅限于使用二個二維數(shù)值符號來分別表示圖層前景以及背景層的顏色。圖像的二值化還可以根據(jù)閾值來處理:假設一幅圖像的象素值p(i,j)的取值范圍為[0,m],那么設有其閾值為T=t,0<t<m,則映射成新的二值圖像的象素值p′(i,j)為[15]:(2-1)基于灰度分布的二值化閾值T二進制映射的過程,和分割影響效果的最終關鍵在于如何選擇閾值T。目前,許多專家學者已經(jīng)對此問題進行了較為詳細的討論,并在實踐中提出了許多閾值選擇算法,這些算法大體上可以劃分為三種類型:全局閾值選擇法、局部閾值法和動態(tài)閾值法。在上述三種二值化算法中,動態(tài)閾值法由于其復雜性和實現(xiàn)的時間相對比較長,難以完全滿足數(shù)據(jù)庫識別實時性要求,在數(shù)據(jù)庫識別的應用中很少得到運用,所以總體閾值法來區(qū)分背景與目標。這套控制系統(tǒng)是采用全局閾值方法。1)整體閾值法(又稱全局閾值法)只是以一個象素點(i,j)的總體灰度確定值p(i,j)函數(shù)來作為確定灰度閾值的一種選擇的方法,又被廣泛統(tǒng)稱稱其為基于總體灰度閾值值的選擇。典型的顏色閾度偏值分割選取法的算法主要類型有直角形方圖法,熵法和閾值分割法,大多情況下,如果單個圖像數(shù)據(jù)中的顏色灰度直方形視圖的點呈現(xiàn)雙峰,或者單個圖像數(shù)據(jù)中的圖片背景顏色灰度和圖像目標背景灰度之間的點呈明顯的閾值分離狀,整體采用閾值選取法對多個圖像數(shù)據(jù)進行閾值分割組合處理使得效果良好且排除計算錯誤速度快。2.3圖像反色彩色圖像的R、G、B顏色分量的反技術主要是對圖像的顏色進行反處理,在二值圖像中各個連通部分的選擇中非常重要。如果一個物體的兩個連通域都使用了黑色來表示,物體兩個連通域的二值圖像為白色,背景為黑色,則我們就需要用戶手動進行選擇兩個圖像的對反色進行處理,或者該程序將會根據(jù)背景的兩種圖像中顏色個數(shù)與另一個對象的連接域的數(shù)量之間的比率可以自動選擇他們是否進行了反色處理。而圖像顏色逆時針旋轉只是方便地進行了圖像處理。反色只是把黑色(一個像素的值為0)會變成一個白色(另外一個像素的值為1),白色(一個像素的值為1)會變成一個黑色(另外一個像素的值為0)。2.4圖像去噪2.4.1圖像噪聲分類圖像噪聲的來源大致可以分為一下兩類。第一類是由光和電的基本特性引起的內部噪聲。第二類也就是噪音指射頻系統(tǒng)在正常工作時不會受到以高頻電磁波束的形式直接發(fā)出的外部噪音干擾或者經(jīng)由使用電源而直接產生的外部干擾噪音。多數(shù)常見的圖像噪聲主要包含有由于圖像經(jīng)由傳感器、數(shù)據(jù)線及傳輸器的路徑、解碼器及處理等而成所產生的黑白、明暗的圖像噪聲。2.4.2圖像去噪分類(1)均值濾波去噪均值像素濾波是用現(xiàn)有像素鄰域內每個現(xiàn)有像素的平均值來替換一個新像素。這樣的圖像處理效果方法不僅可以大幅降低整個圖像區(qū)域發(fā)生急劇亮度改變的可能概率。典型的隨機噪聲的特點是圖像變化迅速,因此可以采用平均濾波對圖像進行去噪。但是圖像的邊緣和細節(jié)也是由尖銳的變化組成的,所以平均濾波會使圖像的邊緣和細節(jié)模糊,這是由均值濾波的性質決定的[16]。(2)中值濾波去噪中值濾波采用統(tǒng)計排序理論,將以目標像素為中心的8鄰域像素值進行排序,利用中間值替換原始像素,使其變化與周圍像素有很大不同,從而消除孤立的噪聲點。(3)小波變換閾值去噪小波分析方法的基礎設計思想與傅里葉變換相似,信號主要由一組信號投射到一組基函數(shù)組合而構成的空間上。小波變換的主要優(yōu)點:傅里葉變換只能描述信號的頻域和時域特性,不能描述信號的時域特點。小波變換相對于傅里葉變換來說更為強大,它們可以實現(xiàn)信號在頻域和時域內拉伸、移位的操作。小波變換閾值去噪大致可以分為兩個步驟:首先,用小波變換對二維信號進行分解;其次,選取閾值,將各層大小的系數(shù)與閾值進行比較,判斷這些小波的系數(shù)是由噪聲或信號引起的。去掉由噪音引起的系數(shù),保留由信號引起的系數(shù)。最后,對濾波后參數(shù)進行了小波反變換的重構[17]。2.5人流量監(jiān)測圖像分割系統(tǒng)在讀進來的圖像中一般會含有多個數(shù)字,識別的時候只能根據(jù)每個字符的特征來進行判斷,所以還要進行字符分割的工作。這一步工作就是把圖像中的字符獨立的分割出來。具體算法如下:第一步,先從下往上對整個圖像中的各個行分別進行了詳細的掃描,直至我們遇到第一個是白色的灰象點。記錄。然后再從上到下分別對圖像的各個行程都進行了詳細的掃描,直至再次在圖像中遇到第一個是白色的象素,這樣就可以找到了圖像的大致高度和范圍。第二步,在這個整張圖像象素高度的白色范圍之內在從左往右對每一列中的圖像象素進行詳細的分割掃描,遇到第一個不是白色的圖像象素時在首擬我們可以認為它應該是整個整張圖像這次分割的一個象素起始和終點和它所在于的地位,然后我們再次開始繼續(xù)重新進行這次掃描,直至我們再次遇到只有一列中不知道包含什么白色的一個象素,則我們可以認為這個整張圖像的這次分割掃描過程已經(jīng)完全結束,然后我們再次開始繼續(xù)重新進行這次掃描,按照上述的掃描方法一直繼續(xù)掃描到整個整張圖像的最左和右端。這樣你就可以直接得到各個曲線圖形的比較準確的曲線寬度和長區(qū)間。第三步,在我們已知的每個文本中字符都是在比較準確的大致寬度區(qū)間范圍內,按照第一步的順序,分別由上向下和由下往上地對每一行文本進行了詳細的掃描以便于獲取每一行文本的大致高度區(qū)間。2.6歸一化2.6.1圖像歸一化原因Matlab里圖像數(shù)據(jù)有時候必須是浮點型才能處理,而圖像數(shù)據(jù)本身是0-255的UNIT型數(shù)據(jù)所以需要歸一化,轉換到0-1之間。歸一化法則也是一種用于簡化純量計算的數(shù)學方法,即將一個屬于有量綱的整數(shù)表達式,經(jīng)過整數(shù)變換,化為一個屬于無量有性綱的整數(shù)表達式,成為一個新的純量。目的主要也就是為了:(1)盡量避免與那些具有不同的神經(jīng)物理學基本意義和量綱概念相關的不同輸入輸出變量之間不能平等地相互使用;(2)在bp神經(jīng)網(wǎng)絡中常以sigmoid轉移函數(shù)模型作為輸入轉移時的函數(shù),歸一化后的轉移函數(shù)模型能夠有效地盡量防止由于凈給出輸入的變量絕對值太大而導致引起的整個神經(jīng)元的凈輸出變量飽和。(3)需要確保在隨機輸出的幾個數(shù)據(jù)中,其中一個數(shù)值較小的數(shù)據(jù)不會被其他數(shù)據(jù)給吃掉;2.6.2圖像歸一化方法歸一化主要進行位置和大小的歸一化。具體算法:先計算得到一張原本圖像的高度,跟系統(tǒng)所要求的高度做一個對比,計算可以得出所需要進行變換的系數(shù)大小,然后再根據(jù)計算得到的系數(shù)計算可以得出所需變換后的相對寬度。再計算得到一定的寬度之后,把新的圖像里面每一點都按照插值方法反復地映射到原來的圖像中。2.7圖像細化圖像運算精確度上的細化(ImageThinning),一般認為是用于指二維數(shù)值波形圖像的邏輯骨架性細化(ImageSkeletonization)的一種圖像計算和邏輯操作上的運算。我們常說所謂的精心結構細化也就是經(jīng)過一層層的精細分割和層層剝離,雖然小節(jié)點可以從原始的結構圖中移除,但依然可能需要我們繼續(xù)一直保持原始的圖像形態(tài),直到我們完全能夠直接得到整個原始圖像的基本結構骨架。骨架可以看作是圖像的中軸。其中:非迭加替代優(yōu)化算法:一次就完成可以直接產生多個骨架,如基于游程時間點和距離順序變換的梯度計算優(yōu)化方法、游程時間長度的順序編碼和梯度細化。替換算法:通過多次重復替換去掉寬帶圖像的多個邊緣以及去除滿足某種特殊替換條件的單個像素,最終可以形成單個特殊像素的虛擬寬帶圖像骨架。串行替代算法:該算法是被重新刪除的像素在每次迭代的整個實際算法執(zhí)行過程中都可能是不具有固定處理時間和執(zhí)行順序的,它不僅主要的是取決于算法前次迭替替代的執(zhí)行結果,也主要的是取決于本次迭替替代中所有算法處理的分布像素和節(jié)點以及數(shù)量和不同分布像素狀態(tài)的變化情況。并行算法:像素點的數(shù)值刪除和否與其他兩個像素點的數(shù)值在并行圖像處理中的出現(xiàn)時間和轉換順序密切相關,僅至少取決于經(jīng)過前次迭加替代后的計算結果。本文采用了像素領域分析法的細化算法,在速度和保留結構信息的準確性上較佳。其算法如下:1)將一張圖像以每3×3的大小來劃分一個子網(wǎng)格,對每一個子網(wǎng)格分別做兩次操作,其中每個3×3子網(wǎng)格都需要滿足一種矩陣的形式:(2-2)2)在第一次操作時,當且僅當條件G1,G2和G3被全部滿足時,則刪除中心像素p(即讓p=0)。3)在第二次操作時,當且僅當條件G1,G2和G4被全部滿足時,則刪除中心像素p(即讓p=0)。條件G1為:,其中,(2-3)(2-4)其中,為圍繞p點的8領域的映射值。條件G2為:,其中,(2-5)(2-6)條件G3為:(2-7)條件G4為:(2-8)對于一個像素圖像的每個像素字符的所有像素,上述像素操作已經(jīng)累進一次,這被認為完成了一個像素細化操作,然后重復執(zhí)行這個細化操作,直到像素圖像不出現(xiàn)任何變化,此時,計算結果得到的整個像素圖像中所有象素都可以轉換為單個圖像像素的象素節(jié)點,可以很好、準確地保留所有像素字符的節(jié)點結構和像素形狀信息。3行人流量圖像特征提取3.1特征值概述模式識別是通過特征來識、區(qū)分不同類型的識別方法,故特征提取系統(tǒng)成為了一個模式識別系統(tǒng)設計中不可或缺的構成。特征提取法的實現(xiàn)目的就是為了能夠找到某種特征變換,將n維或者n×n維的模型類別空間直接轉換成為一個維數(shù)略小的特征空間,并同步保存和處理大部分信息。利用特征的提取,模式分類這一方法可以在比維數(shù)很低的空間上直接實現(xiàn),進而減小了計算難度。對特征提取用于給定訓練樣品后,能得到比較正確的分類函數(shù)形式和描述,以及構造更可靠的分類法則。模式化的特征對于分類來說是十分重要的,數(shù)字化識別的根本關鍵就是找出的有效特點是否準確。具體來說,特征的準確性就是指對于不同類別的樣品,特征值都應該是有相對差異較大的值,這樣不同類別的特征樣品之間才能夠得到明顯的區(qū)分開;特征的穩(wěn)定性主要是指針對與它們屬于相同的類別樣本,而其對應必須具有穩(wěn)定性,這樣同一類別的樣本才能夠被判別成為同一種類別而不致被誤判;特征的獨立性主要是指不同特征之間得到的信息是相互獨立的,這樣就可以減少信息的冗余性;特征的多少數(shù)量就要小,是指特征的多少就越容易符合前面的三個原則,處理的速度就會得到相應地提高。模式識別系統(tǒng)的復雜程度將隨著特征量的擴展而快速地增大。更重要的一點就是,訓練分類器和判斷一個分類器的優(yōu)劣和好壞需要考慮到的數(shù)量也將會隨著使用到的特殊量數(shù)目而呈現(xiàn)一個指數(shù)程度的增長。一個完整的模式識別技術系統(tǒng)力,特征提取和分析選擇的識別方法主要夾在介于特征分類器的特征對象識別特征分析數(shù)據(jù)采集與特征分類模式識別,其特征抽取和分析選擇的樣品特征數(shù)據(jù)質量以及他的性能優(yōu)劣,直接關系到特征分類器系統(tǒng)結構設計和它的系統(tǒng)性能。在一個樣品的設計數(shù)量并不是非常多的實際場合,用很多種不同類型的高維特征計算來直接進行典型分類器的進行設計,無論從其特征計算的技術復雜度還是從其分類器的使用性能等諸多方面角度來看均認為是不恰當?shù)?因此深入分析研究怎樣設計將高維特征的計算空間壓縮成為低維的特征計算空間,快捷的進行設計制造出來的分類器就會成為主要的技術課題,這也是模式識別過程中的一個重要技術問題。特征提取應用技術如何選擇到一種正確的識別方法就是一個難題。但是一個有效的問題解決辦法就是通過算法尋找各種變量數(shù)據(jù)共同的功能特點,或者直接簡稱它們?yōu)椴煌淖兞?。另一方?對于一個有限的高度訓練型特征數(shù)據(jù)集,如果我們需要同時使用的工具是一個基于統(tǒng)計學的特征分類器,則屬于該類的特征集必須被設定保持在一個合理小的特征數(shù)目內。傳統(tǒng)的人流監(jiān)測圖像特征識別而言,在發(fā)展過程中,怎樣做到準確的選擇對應的特征提取識別方法,主要還是依賴于其數(shù)字識別的重要作用。我們必須仔細地認真考慮我們得到的有待正確辨認的各種數(shù)字文件是否已經(jīng)具備了固定的物體運動速度方向與其值的大小,是否為印刷體電子文件還是一種手寫體,以及它們之間或者是否可能有不同的數(shù)字書寫表達形式,以及它們之間或者是否可能存在著一些缺損,程度怎么樣。這些都可以有利于大大減少典型特征的分析提取和特征選擇處理工作的復雜難度及大大提升了特征辨認率。雖然,在一定的科學意義上特征提取和其他高維中的特征性質選擇都被普遍認為都只是因為它們需要盡快實現(xiàn)達到或者減少特征降維的主要目標,只是由于其所指的特征提取的選擇途徑大相徑庭,特征提取主要是通過一種特定可以改變或不可替代的提取方式用來組合原始的一組高維基本特征,獲得另外一組低維的新基本特征,而這樣的高維特征性質選擇主要目的是根據(jù)某些學術界知名專家的特征理論性和經(jīng)驗分析知識或根據(jù)某種特征評估指標準則的預測結果分析來自動挑選出并得出那些特別具有對于特征分類最優(yōu)化和影響力的高維特征,并且自動優(yōu)化生成新的特征性質。有時它們可能并非完全并且截然地可以分開。例如我們現(xiàn)在可以首先將原始的一個特征函數(shù)空間直接將它映射到成為一個原始維數(shù)比較低的特征空間,在這里我們再次對它進行一個選擇,以便進一步盡量減少其中的維數(shù)。當然也有的就是我們通??梢韵冉?jīng)過多次映射選擇,去掉那些沒有被明確分類為重要信息的數(shù)據(jù)特點,再對其信息進行多次映射,以大大減少映射維數(shù)。同樣針對于手寫式字符進行識別,特征提取也可以減少字符的信息量。去除了無用的冗余數(shù)據(jù)、提升了識別系統(tǒng)的性能。圖像的人像細小的的變化稍微有點敏感,識別效率不佳。統(tǒng)計學的特征對于噪聲完全敏感,具有非常不錯精度和穩(wěn)定性,但對于圖像細節(jié)上的小小差異不敏感,在與待識別的字符物形狀更為相似時容易發(fā)生數(shù)據(jù)準確性的錯誤。所以,統(tǒng)計學的特征與結構性的特征彼此之間應該具有某種共同或者更多的互補。3.2特征提取方法HOG特征即目標邊緣密度直方圖的特征,它是一種通過根據(jù)目標邊緣密度分布的公式來對目標形態(tài)進行表征和描述的特殊物理算子,被廣泛應用在計算機視覺和影像處理中.HOG特征提取的方式是依次提取目標局域特征再進行串聯(lián),所有的提取工作只在目標局部區(qū)域進行,避免了光照和圖像幾何形變的影響.因此,HOG特征具有良好的幾何不變性和光照不變性.此外,HOG特征通過串聯(lián)局部信息描述目標整體形狀的方式對目標姿態(tài)的變化具有很好的寬容度.在行人檢測中,只要人體姿態(tài)大致不變,小幅度的肢體動作,不會影響檢測效果。因此,HOG特征特別適用于行人檢測[19]。HOG具有特征的細胞基本單位為一個細胞像素單元(cell),每個點的細胞像素單元由個別的像素單元組成,個別的細胞像素單元可以組成一個塊(block)具體特征提取過程如圖1所示.HOG特征的提取以block尺寸的滑動窗口為掩碼,進行滑窗掃描提取,具體步驟為圖3-1HOG特征流程1)將彩色影像直接轉換成灰度影像,使用Gamma校正法對影像進行歸一化的處理,計算經(jīng)Gamma校正后的圖像中像素的水平和垂直梯度;2)其次梯度方向劃分為九個區(qū)間,建立一個梯度直方圖來統(tǒng)計在每一個區(qū)間的梯度幅值分布情況,生成的9維特征矢量可以作為該特征描述子;3)將block內所有關于cell的一個特征元素描述子都統(tǒng)一串聯(lián)了組合起來并對其元素進行歸一化分析處理,生成了這個關于block的所有特征描述子;4)把所有關于block的輸入特征向量描述子都完全串聯(lián)在一起時所得到的結果是一個輸入特征圖像中的bhogh和特征向量中的f。4神經(jīng)網(wǎng)絡分類器4.1概述人工神經(jīng)網(wǎng)絡(ArtificialNeuralNetwork,ANN)。在理解和抽象了人腦結構和外界刺激響應機制后,以網(wǎng)絡拓撲知識為理論基礎,再以基于生物學中神經(jīng)網(wǎng)絡的基本原理并且模擬大腦對復雜信息的處理方法后的一種模型。該模型以高容錯性、智能化等技術能力作為其特點,信息的處理和存儲是緊密結合的[20]。由于其獨特的知識表示方式和智能的自適應學習能力,引起了各相關學科研究領域的廣泛關注。它是由大量簡單的邏輯元素相互組合、相互連接而成的復雜邏輯網(wǎng)絡。它是復雜邏輯運算和非線性邏輯關系交互作用下可以獨立實現(xiàn)的網(wǎng)絡系統(tǒng)。神經(jīng)網(wǎng)絡模型就是一種典型計算機神經(jīng)運算網(wǎng)絡模型。由許多網(wǎng)絡節(jié)點(或者我們叫做網(wǎng)絡神經(jīng)元)之間的相互連接所結合組成。每一個數(shù)據(jù)節(jié)點都可以代表某一種特殊的數(shù)據(jù)輸入輸出函數(shù)。被人們稱為文件啟動器或激活(activationfunction)。每兩個連接節(jié)點之間的信號連接均加權代表了一個對于在此連接時段內通過這個節(jié)點連接的所有信號所同時做出的信號加權。我們把它叫做百度權重(weight)。神經(jīng)網(wǎng)絡系統(tǒng)正是通過此種大腦模擬記憶方法對正常人類進行記憶的。網(wǎng)絡的輸出主要由網(wǎng)絡結構、網(wǎng)絡連接方式、權值及其激活函數(shù)組成。而且,網(wǎng)絡本身在本質上通常近似于某種算法或函數(shù)。有句話說是一種思維邏輯的行為表達。構建神經(jīng)網(wǎng)絡的主要思想是人們受到生物神經(jīng)網(wǎng)絡運行的啟發(fā)。所以對生物神經(jīng)網(wǎng)絡理解及其應用就是人工神經(jīng)網(wǎng)絡,并將其應用于數(shù)學統(tǒng)計模型中。通過數(shù)理統(tǒng)計,使神經(jīng)網(wǎng)絡技術能夠同時執(zhí)行各種類似人類行為方式。因為神經(jīng)元處理單位可以用來代表各種物體和器件。比如語言的特點、字母、觀念?;蚴且恍┚哂幸饬x的抽象模型。將無線網(wǎng)絡中各個點的處理單元類別按類型不同可以詳細劃分大致為三種:一是輸入處理單元,輸出處理單元及其他隱藏的處理單元。輸入信息單位一般可以用來接受外部系統(tǒng)世界的各種輸入信號和信息數(shù)據(jù);這種輸出信息單元一般可以直接用來隱藏實現(xiàn)對系統(tǒng)世界進行信息處理后所能得到的信息結果;這種隱藏的單元一般指的也就是一個處于信息輸入或者信息輸出兩個單元之間,無法由整個系統(tǒng)外部世界觀測的信息單元。神經(jīng)元之間的主要連接信息權值直觀地直接反映著各個神經(jīng)單元之間的信息連接權值強度,信息的形式顯示及信息處理方式如今,它們直接構成了神經(jīng)網(wǎng)絡信息處理各個神經(jīng)單元之間的主要連接權值關系。人工神經(jīng)網(wǎng)絡處理是一種能夠具有非凡的程序化、適宜性、頭腦思維樣式的人工信息處理。它的技術本質就是通過神經(jīng)網(wǎng)絡的動態(tài)變換以及系統(tǒng)動力學的各種行為過程獲得了一種并行的、分布式的人腦信息處理系統(tǒng)功能,并在不同的文化程度和知識層次上對其進行相互模仿,從而基本實現(xiàn)了對人腦以及神經(jīng)網(wǎng)絡系統(tǒng)的各種信息處理。神經(jīng)網(wǎng)絡是一種實際應用與大腦中的神經(jīng)突觸鏈接結構相似而且可以進行信息處理的數(shù)學模型。它主要是在對人體與自身腦細胞組織的結合與其思維機制的認知和了解基礎上進行模擬研究而產生的,它主要是一門根植于人體的神經(jīng)科學、數(shù)據(jù)庫、思維科學、人工智能、統(tǒng)計學、物理科學、計算機科學以及project科學中的一門新興技術。4.2BP神經(jīng)網(wǎng)絡概述人類鏈路和鏈式連接網(wǎng)絡模型通常被稱為人工神經(jīng)網(wǎng)絡(ANNs),它是一種模擬動物神經(jīng)網(wǎng)絡行為特征,進行分布式并行信息處理的算法數(shù)學模型。它依靠網(wǎng)絡系統(tǒng)的內部高度網(wǎng)絡復雜性,通過自動調節(jié)大量的網(wǎng)絡節(jié)點相互間的聯(lián)系從而建立統(tǒng)一起來。圖4-1BP神經(jīng)網(wǎng)絡4.3本文的神經(jīng)網(wǎng)絡結構設計(1)確認神經(jīng)網(wǎng)絡由于選在了該人流量識別方式,所以選擇bp神經(jīng)網(wǎng)絡。神經(jīng)網(wǎng)絡的構成在一定要求的應用場景這種情況下,應該盡量選擇較少的網(wǎng)絡隱含點在層進行層次,對于更為復雜的網(wǎng)絡映射生成關系,可以考慮直接通過網(wǎng)絡增加一些隱含點在層中的層次,保障這些關系能夠得到正確地實現(xiàn)。一般來說兩個層的隱藏層就已經(jīng)完全能夠很好地解決這種類似形式的連續(xù)神經(jīng)網(wǎng)絡映射分類方法所產生的問題。但基本上大多數(shù)連續(xù)的分類的函數(shù)都可以直接利用三層的bp神經(jīng)網(wǎng)絡來進行函數(shù)逼近。所以本文選擇采用三層bp神經(jīng)網(wǎng)絡(1個讀出輸入隱藏層、1個輸出隱藏層、1個讀入輸出隱藏層)。由與前文中所提到的進入輸出輸進層輸入節(jié)點特征向量大約應該有24個,因此,我們需要從神經(jīng)網(wǎng)絡中提取的輸入和輸出層字符節(jié)點的特征數(shù)量一般應該是24。輸出輸入層根據(jù)每個節(jié)點的節(jié)點數(shù)而定。對于節(jié)點輸出輸入層的每個節(jié)點根據(jù)數(shù),由于目前傳統(tǒng)的模擬數(shù)字節(jié)點識別僅僅包含有10類,2的4次方就已經(jīng)完全可以用來代替其中10類,因此本文主要研究采用的方法是模擬神經(jīng)網(wǎng)絡中各個節(jié)點輸出輸入層中各節(jié)點的根據(jù)數(shù)目分別為4。經(jīng)過資料查詢的得到大多用戶都會通過參考下列的公式對其進行分層設計:(4-1)是隱含層的節(jié)點數(shù),是輸入節(jié)點的個數(shù),是輸出節(jié)點的個數(shù),大多數(shù)情況下取1~10間的常數(shù)。因此如果選擇α=9,則我們可以通過上式來計算求出本文中所采用的隱含層節(jié)點的個數(shù)為14個。(3)計算輸出層值由上可得本文中所采用的各個輸出層節(jié)點總和均為4。然而由于對目標的向量如果采取了大于1以上的值,就可能會導致該算法無法得到結果,所以在本文中選擇了0~0.99中一個目標的向量“0.01”來分別表示1。確定傳遞函數(shù)在每個層之間的選取一個恰當?shù)膫鬟f函數(shù)對于實現(xiàn)這一目標是非常重要的。本文通過對多種類型的傳遞函數(shù)進行了測試,最終可以確定各層的傳遞函數(shù)分別為:第二層:采用logsin傳遞函數(shù),即對數(shù)S型傳遞函數(shù)。第三層:采用purelin傳遞函數(shù),即線性傳遞函數(shù)。函數(shù)的進一步選擇一個優(yōu)秀的訓練函數(shù)和學習函數(shù)既能較好地避免神經(jīng)網(wǎng)絡中深度地陷入一個局部最優(yōu)化的理解,有可以提升訓練的準確性。所以本文中采用的學習函數(shù)則是采用learngdm函數(shù),訓練函數(shù)是traingdx函數(shù)。確定參數(shù)在本次過程中,我們還需要依據(jù)實際情況進行提前分析以達到確定每個錯誤的臨界值。誤差大小邊界值的選取完全通過一種計算模型老對其收斂的計算速率誤差大小及對具體實驗樣品的機器學習結果精準程度進行分析決定。例如,當一個Emin值的收斂選取概率比較小時,學習效果良好,但是由于這個收斂的概率值的變化緩慢,訓練的學習次數(shù)可能會隨之有所增加。若Emin值選取的數(shù)量比較大時就可能會有人發(fā)現(xiàn)你的訓練時間缺失。通常如果選擇了一個神經(jīng)網(wǎng)絡的計算誤差使其邊界值e<Emin在0.0001~0.01之間,即在迭替換代時的計算誤差值大于e<Emin時,則被人們視為機器學習已經(jīng)基本完成,停止了迭代計算,輸出了新結果。有點細節(jié)部分,訓練的持續(xù)次數(shù)往往特別多,多到讓人無法及時對它進行收斂。所以我們認為應該對bp處理網(wǎng)絡信息分類設置一個最大連續(xù)訓練運行次數(shù)的時間極限長度Ntmin,當這個最大訓練時的次數(shù)極限Ntmin還未完全收斂或者得到最大次數(shù)emin時,可以對它做一個連續(xù)放棄或者一個連續(xù)暫停,本文中對bp神經(jīng)網(wǎng)絡進行分類器時可以設置最大Emin=0.001,最大連續(xù)訓練時的次數(shù)可以設置為極限Ntmin=5000。
參考文獻[1]聞新,周露,李翔,張寶偉.mtalab神經(jīng)網(wǎng)絡仿真與應用.北京:科學出版社.2003[2]王正林,劉明.精通matlab7.0.北京:電子工業(yè)出版社.2006[3]飛思科技產品研發(fā)中心.matlab6.5輔助圖像處理.北京:電子工業(yè)出版社.2003[4]孫兆林.matlab6.x圖像處理.北京:清華大學出版社.2002[5]LiX,LiuG,GuoM,etal.ACircuitModuleandCPLDLaserGroundControllerBasedonRS485[C]//Computer&ComputingTechnologiesinAgricultureIv-ifipTc12Conference.DBLP,2017(5):43-46.[6]薛曉軍.觸摸屏控制器設計及手寫字符識別技術研究[D].浙江大學,2008.[7]畢思娟.基于圖像處理的車牌自動識別系統(tǒng)關鍵算法研究[D].山東大學,2008.[8]王崇國,石剛,陳田希,劉丹妮,王志遠,周司宇.基于OpenCV的人流量監(jiān)測系統(tǒng)[J].電腦知識與技術,2021,17(07):235-236+241.[9]杜路泉.基于Matlab的圖像信號降噪分析[J].湖南工業(yè)職業(yè)技術學院學報,2020,20(05):12-14.[10]劉付桂蘭.基于MATLAB圖像處理技術及應用[J].科學技術創(chuàng)新,2020(35):64-67.[11]閆洪波,王夢薇,徐洋,趙蓬勃,劉霈.基于MatlabGUI的醫(yī)學圖像處理仿真系統(tǒng)設計[J].計算機應用,2020,40(S1):226-230.[12]國剛,王毅.應用BP神經(jīng)網(wǎng)絡進行手寫體字母數(shù)字識別電腦知識與技術.Vol.4,No.6,November2008,pp.1459-1460,1465[13]XiaLiuFujimura,K.,"Handgesturerecognitionusingdepthdata",ProceedingsoftheSixthIEEEInternationalConferenceonAutomaticFaceandGestureRecognition,May17–19,2004pages529-534,ISBN0-7695-2122-3,doi10.1109/AFGR.2004.1301587.[14]馬向長.字符識別系統(tǒng)中圖像預處理方法的研究.碩士學位論文.北京:北京科技大學,2002[15]周開利,康耀紅.神經(jīng)網(wǎng)絡模型及其matlab仿真程序設計.北京:清華大學出版社.2005[16]陳柏丞.基于多神經(jīng)網(wǎng)絡集成的手寫數(shù)字識別[D].西南財經(jīng)大學,2008.[17]柳亞楠,孫濤.基于MATLAB的掌靜脈圖像去噪算法研究[J].科技風,2020(03):31.[18]黃巧巧.基于BP神經(jīng)網(wǎng)絡的手寫數(shù)字識別系統(tǒng)研究[D].華中師范大學,2009.[19]李文書,韓洋,阮夢慧,王志驍.改進的基于增強型HOG的行人檢測算法[J].計算機系統(tǒng)應用,2020,29(10):199-204.[20]劉海芹.基于GIS與人工神經(jīng)網(wǎng)絡的經(jīng)濟型酒店選址研究[D].中國礦業(yè)大學,2017.
附錄classdefpeopledetect<matlab.apps.AppBase%Propertiesthatcorrespondtoappcomponentsproperties(Access=public)UIFigurematlab.ui.FigureLabel_4matlab.ui.control.LabelLabel_3matlab.ui.control.LabelLabel_2matlab.ui.control.LabelButton_4matlab.ui.control.ButtonButton_3matlab.ui.control.ButtonLampmatlab.ui.control.LampLabelmatlab.ui.control.LabelUIAxesmatlab.ui.control.UIAxesendproperties(Access=private)bbImage=[];end%Callbacksthathandlecomponenteventsmethods(Access=private)%Buttonpushedfunction:Button_3functionButton_3Pushed(app,event)[file,path]=uigetfile({'*.jpg;*.jpeg;*.png;*.bmp;*.tif',...'圖片文件(*.jpg,*.jpeg,*.png,*.bmp,*.tif)'},'選擇一張圖片');ifisequal(file,0)%若文件不存在set(app.Label_2,'Text','圖片未選中');elseset(app.Label_2,'Text','視頻未選中');endset(app.Lamp,'Color',[0,1,0]);detector=load('AcfCaltech+Detector.mat');detector=detector.detector;fileName=fullfile(path,file);%選擇的圖片絕對路徑I=imread(fileName);bbs=acfDetect(I,detector);I=bbApply('embed',I,bbs);imshow(I,"Parent",app.UIAxes);num_detect=size(bbs,1);set(app.Label_4,'Text',num2str(num_detect));end%Buttonpushedfunction:Button_4functionButton_4Pushed(app,event)%彈出文件選擇框,選擇一張圖片[file,path]=uigetfile({'*.mp4;*.avi',...'視頻文件(*.mp4,*.avi)'},'選擇一個視頻');ifisequal(file,0)%若文件不存在set(app.Label_2,'Text','視頻未選中');elseset(app.Label_2,'Text','圖片未選中');endfileName=fullfile(path,file);%選擇的圖片絕對路徑set(app.Lamp,'Color',[0,1,0]);set(app.Label_2,'Text','監(jiān)測中')v=VideoReader(fileName);detector=load('AcfCaltech+Detector.mat');detector=detector.detector;whilehasFrame(v)video=readFrame(v);bbs=acfDetect(video,detector);video=bbApply('embed',video,bbs);imshow(video,"Parent",app.UIAxes);pause(0.15);num_detect=size(bbs,1);set(app.Label_4,'Text',num2str(num_detect));endendend%Componentinitializationmethods(Access=private)%CreateUIFigureandcomponentsfunctioncreateComponents(app)%CreateUIFigureandhideuntilallcomponentsarecreatedapp.UIFigure=uifigure('Visible','off');app.UIFigure.Position=[100100920686];app.UIFigure.Name='MATLABApp';app.UIFigure.Resize='off';%CreateUIAxesapp.UIAxes=uiaxes(app.UIFigure);app.UIAxes.XTick=[];app.UIAxes.YTick=[];app.UIAxes.BoxStyle='full';app.UIAxes.GridColor=[111];app.UIAxes.MinorGridColor=[111];app.UIAxes.Position=[3084886514];%CreateLabelapp.Label=uilabel(app.UIFigure);app.Label.BackgroundColor=[0.3020.74510.9333];app.Label.HorizontalAlignment='center';app.Label.FontName='微軟雅黑';app.Label.FontSize=30;app.Label.FontWeight='bold';app.Label.FontColor=[111];app.Label.Position=[163992047];app.Label.Text='行人流量監(jiān)測';%CreateLam
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高頻電子企業(yè)面試題及答案
- 病歷書寫考試題附答案
- n1叉車考試試題及答案
- 影城員工考試題及答案
- 電大經(jīng)濟法律試題及答案
- 大一上西方經(jīng)濟學試題及答案
- 2026黑龍江大慶市大同區(qū)城市建設投資開發(fā)有限公司招聘勞務派遣人員12人參考題庫附答案
- 中共廣安市廣安區(qū)肖溪鎮(zhèn)紀律檢查委員會選用2名片區(qū)紀檢監(jiān)督員的參考題庫必考題
- 中央統(tǒng)戰(zhàn)部直屬事業(yè)單位2026年度應屆高校畢業(yè)生招聘34人備考題庫必考題
- 北京市懷柔區(qū)政務服務和數(shù)據(jù)管理局招聘行政輔助人員3人備考題庫必考題
- 2025年證券市場交易操作與規(guī)范指南
- 2025-2026學年北京市西城區(qū)高三(上期)期末考試生物試卷(含答案)
- 2026廣西北部灣大學公開招聘高層次人才76人筆試參考題庫及答案解析
- 2026屆湖北省襄陽第四中學數(shù)學高一上期末考試模擬試題含解析
- 2025年時事政治必考試題庫完整參考答案及參考答案詳解
- 2026年常州工業(yè)職業(yè)技術學院單招職業(yè)技能測試題庫含答案詳解
- 2026年安徽糧食工程職業(yè)學院單招綜合素質考試題庫含答案詳解
- 混凝土施工作業(yè)環(huán)境管理方案
- 2025貴州黔西南州安龍縣選聘城市社區(qū)工作者工作61人備考題庫完整答案詳解
- 工廠裝修吊頂施工實施方案
- 墓碑銷售合同范本
評論
0/150
提交評論