CN114170570B 一種適用于擁擠場景下的行人檢測方法及系統(tǒng) (寬泛科技(江蘇)有限公司)_第1頁
CN114170570B 一種適用于擁擠場景下的行人檢測方法及系統(tǒng) (寬泛科技(江蘇)有限公司)_第2頁
CN114170570B 一種適用于擁擠場景下的行人檢測方法及系統(tǒng) (寬泛科技(江蘇)有限公司)_第3頁
CN114170570B 一種適用于擁擠場景下的行人檢測方法及系統(tǒng) (寬泛科技(江蘇)有限公司)_第4頁
CN114170570B 一種適用于擁擠場景下的行人檢測方法及系統(tǒng) (寬泛科技(江蘇)有限公司)_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

(19)國家知識產(chǎn)權局(12)發(fā)明專利(10)授權公告號CN114170570B(65)同一申請的已公布的文獻號(73)專利權人寬泛科技(江蘇)有限公司金洋路15號B5幢202室(74)專利代理機構(gòu)南京縱橫知識產(chǎn)權代理有限公司32224專利代理師董建林凱.基于改進MaskRCNN的電力檢修違規(guī)操作檢測.計算機系統(tǒng)應用.2020,(第08期),第3.2-3.3一種適用于擁擠場景下的行人檢測方法及系統(tǒng)本發(fā)明公開了一種適用于擁擠場景下的行人檢測方法,所述方法包括:獲取擁擠場景下的待檢測圖像;將獲取到的待檢測圖像輸入預先訓練的改進模型進行檢測,得到行人預測框、實例分割圖和每個行人的人體關鍵點數(shù)量;根據(jù)每個行人的人體關鍵點數(shù)量計算待檢測圖像的行人可見度,可見度小于預設閾值的圖像存在行人間彼此遮擋的現(xiàn)象,根據(jù)實例分割圖在待檢測圖像上構(gòu)造掩膜;將構(gòu)造了掩膜的待檢測圖像輸入預先訓練的改進模型進行檢測,得到被遮擋行人的預測框;合并行人預測框和被遮擋行人的預測框,輸出行人檢測結(jié)果。本發(fā)明能夠解決擁擠場景下行人特征提取困難以及NMS閾值設置困難的獲取擁擠場景下的待檢測圖像將獲取到的待檢測圖像輸入預先訓練的改進模型進行檢測,得到行人預測框、實例分割圖和每個行人的人體關鍵點數(shù)量根據(jù)每個行人的人體關鍵點數(shù)量計算待檢測圖像的行人可見度,可見度小于預設閾值的圖像存在行人間彼此遮擋的現(xiàn)象,根據(jù)實例分割圖在待檢測圖像上構(gòu)造掩膜將構(gòu)造了掩膜的待檢測圖像輸入預先訓練的改進模型進行檢測,得到被遮擋行人的預測框21.一種適用于擁擠場景下的行人檢測方法,其特征在于,包括:獲取擁擠場景下的待檢測圖像;將獲取到的待檢測圖像輸入預先訓練的改進模型進行檢測,得到行人預測框、實例分割圖和每個行人的人體關鍵點數(shù)量;其中,改進模型包括:在MaskR-CNN模型中添加SFPN模所述SFPN模塊用于得到待測圖像的特征圖和語義分割圖;所述MKFRCNN模塊用于根據(jù)建議框,得到行人預測框和對應的實例分割圖、每個行人的人體關鍵點;所述MaskR-CNN模型為掩碼區(qū)域卷積神經(jīng)網(wǎng)絡,所述SFPN模塊為添加了語義分割分支的特征金字塔網(wǎng)絡模塊,所述MKFRCNN模塊為掩碼與關鍵點快速區(qū)域卷積神經(jīng)網(wǎng)絡模塊;根據(jù)每個行人的人體關鍵點數(shù)量計算待檢測圖像的行人可見度,可見度小于預設閾值的圖像存在行人間彼此遮擋的現(xiàn)象,根據(jù)實例分割圖在待檢測圖像上構(gòu)造掩膜;其中,計算每個行人的可見度,通過下式進行計算:式(4)中,N表示檢測出來的行人數(shù)量;k;表示第j個行人檢測出來的人體關鍵點數(shù)量;K表示用于訓練人體關鍵點的數(shù)據(jù)集中對人體關鍵點的標注數(shù)量;a表示每個行人的可見度,檢測結(jié)果為每個關鍵點的得分,若某關鍵點得分大于0則該關鍵點檢測成功,不同用于訓練人體關鍵點的數(shù)據(jù)集中對人體關鍵點的標注數(shù)量不同;將構(gòu)造了掩膜的待檢測圖像輸入預先訓練的改進模型進行檢測,得到被遮擋行人的預測框;合并行人預測框和被遮擋行人的預測框,輸出行人檢測結(jié)果。2.根據(jù)權利要求1所述的適用于擁擠場景下的行人檢測方法,其特征在于,所述改進模型,通過以下步驟進行訓練:獲取已標注的擁擠場景下行人數(shù)據(jù)集,根據(jù)行人數(shù)據(jù)集中的頭部標注框信息和行人可見部位標注框信息構(gòu)造偽實例分割標注;將已標注的擁擠場景下的圖像輸入預先構(gòu)建的改進模型,得到預測訓練結(jié)果;計算預測訓練結(jié)果與偽實例分割標注之間的損失函數(shù),利用反向傳播算法計算梯度,更新預先構(gòu)建的改進模型的參數(shù);當損失函數(shù)值不再繼續(xù)下降時訓練完成,得到預先訓練的改進模型。3.根據(jù)權利要求2所述的適用于擁擠場景下的行人檢測方法,其特征在于,還包括:訓練所述改進模型前,使用COCO人體關鍵點數(shù)據(jù)集對所述改進模型進行預訓練,使得所述改進模型具備檢測人體關鍵點的能力。MKFRCNN模塊在訓練改進模型時不輸出每個行人的人體關鍵點。5.根據(jù)權利要求2所述的適用于擁擠場景下的行人檢測方法,其特征在于,所述損失函數(shù)為多任務損失函數(shù),通過下式表示:3測框的定位損失,Lask為每個預測框的實例分割損失,Lseg為語義分割損失;i是建議框的索引;p,是建議框?qū)念A測框為行人的預測概率,若建議框標記為正,p為1,否則為0;t;是建議框相對于真實框的偏移量,t;是建議框?qū)念A測框相對于真實框的偏移量,真實框指數(shù)據(jù)集中行人的位置標注框,pi為建議框為行人的預測概率。6.一種適用于擁擠場景下的行人檢測系統(tǒng),其特征在于,包括:獲取模塊:用于獲取擁擠場景下的待檢測圖像;第一預測模塊:用于將獲取到的待檢測圖像輸入預先訓練的改進模型進行檢測,得到行人預測框、實例分割圖和每個行人的人體關鍵點數(shù)量;其中,改進模型包括:在MaskR-所述SFPN模塊用于得到待測圖像的特征圖和語義分割圖;人體關鍵點;所述MaskR-CNN模型為掩碼區(qū)域卷積神經(jīng)網(wǎng)絡,所述SFPN模塊為添加了語義分割分支處理模塊:用于根據(jù)每個行人的人體關鍵點數(shù)量計算待檢測圖像的行人可見度,可見度小于預設閾值的圖像存在行人間彼此遮擋的現(xiàn)象,根據(jù)實例分割圖在待檢測圖像上構(gòu)造式(4)中,N表示檢測出來的行人數(shù)量;k;表示第j個行人檢測出來的人體關鍵點數(shù)量;K表示用于訓練人體關鍵點的數(shù)據(jù)集中對人體關鍵點的標注數(shù)量;a表示每個行人的可見度,檢測結(jié)果為每個關鍵點的得分,若某關鍵點得分大于0則該關鍵點檢測成功,不同用于訓練人體關鍵點的數(shù)據(jù)集中對人體關鍵點的標注數(shù)量不同;第二預測模塊:將構(gòu)造了掩膜的待檢測圖像輸入預先訓練的改進模型進行檢測,得到被遮擋行人的預測框;輸出模塊:用于合并行人預測框和被遮擋行人的預測框,輸出行人檢測結(jié)果。所述存儲介質(zhì)用于存儲指令;所述處理器用于根據(jù)所述指令進行操作以執(zhí)行權利要求1~5任一項所述方法的步驟。4CN114170570B8.計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)權利要求1~5任一項所述的方法。5[0002]行人檢測是計算機視覺領域的一個經(jīng)典問題,其特點是應用范圍廣泛如無人駕HOG(HistogramofOrientedGradient)提取行人特征再用SVM(SupportVector深度學習的目標檢測模型注重提取整體特征,這樣會導致模型很難區(qū)分高度重疊的行人。在特征圖上進行采樣從而生成密集的預測框,對于大量的預測框都是采用NMS(Non-膜對這些行人進行覆蓋,然后通過S-RCNN檢測剩下的擁擠目標(P-RCNN和S-RCNN都以Faster-RCNN為基礎結(jié)構(gòu)),通過構(gòu)造掩膜迫使模型注意擁擠目標,但對所有檢測圖像都構(gòu)[0006]SongtaoLiu等人在2019年的《ProceedingsoftheIEEEpedestriandetectioninacrowd”中在檢測網(wǎng)絡中添加一個分支來預測每一個框的密難以及密度是否能代表最佳NMS閾值設置仍存疑,而且預測框往往與真實框并不是完全匹6測方法及系統(tǒng),能夠解決擁擠場景下行人特征提取困難以及NMS閾值設置困難的問題,有效降低了擁擠場景下行人檢測的漏檢率。為達到上述目的,本發(fā)明是采用下述技術方案實現(xiàn)[0008]第一方面,本發(fā)明提供了一種適用于擁擠場景下的行人檢測方法,所述方法包括:[0009]獲取擁擠場景下的待檢測圖像;[0010]將獲取到的待檢測圖像輸入預先訓練的改進模型進行檢測,得到行人預測框、實例分割圖和每個行人的人體關鍵點數(shù)量;[0011]根據(jù)每個行人的人體關鍵點數(shù)量計算待檢測圖像的行人可見度,可見度小于預設閾值的圖像存在行人間彼此遮擋的現(xiàn)象,根據(jù)實例分割圖在待檢測圖像上構(gòu)造掩膜;[0012]將構(gòu)造了掩膜的待檢測圖像輸入預先訓練的改進模型進行檢測,得到被遮擋行人的預測框;[0013]合并行人預測框和被遮擋行人的預測框,輸出行人檢測結(jié)果。[0015]獲取已標注的擁擠場景下行人數(shù)據(jù)集,根據(jù)行人數(shù)據(jù)集中的頭部標注框信息和行人可見部位標注框信息構(gòu)造偽實例分割標注;[0016]將已標注的擁擠場景下的圖像輸入預先構(gòu)建的改進模型,得到預測訓練結(jié)果;[0017]計算預測訓練結(jié)果與偽實例分割標注之間的損失函數(shù),利用反向傳播算法計算梯度,更新預先構(gòu)建的改進模型的參數(shù);[0018]當損失函數(shù)值不再繼續(xù)下降時訓練完成,得到預先訓練的改進模型。[0019]結(jié)合第一方面,進一步地,還包括:訓練據(jù)集對所述改進模型進行預訓練,使得所述改進模型具備檢測人體關鍵點的能力。[0020]結(jié)合第一方面,進一步地,所述[0021]所述SFPN模塊的用于得到待測圖像的特征圖和語義分割圖;個行人的人體關鍵點。人體關鍵點。的索引;p是建議框?qū)念A測框為行人的預測概率,若建議框標記為正,pi為1,否則為70;t;*是建議框相對于真實框的偏移量,t,是建議框?qū)念A測框相對于真實框的偏移量,真實框指數(shù)據(jù)集中行人的位置標注框。[0031]式(4)中,N表示檢測出來的行人數(shù)量;k;表示第j個行人檢測出來的人體關鍵點數(shù)量;K表示用于訓練人體關鍵點的數(shù)據(jù)集中對人體關鍵點的標注數(shù)量;a表示每個行人的可見度,檢測結(jié)果為每個關鍵點的得分,若某關鍵點得分大于0則該關鍵點檢測成功,不同用于訓練人體關鍵點的數(shù)據(jù)集中對人體關鍵點的標注數(shù)量不同。[0032]第二方面,本發(fā)明提供了一種適用于[0034]第一預測模塊:用于將獲取到的待檢測圖像輸入預先訓練的改進模型進行檢測,得到行人預測框、實例分割圖和每個行人的人體關鍵點數(shù)量;[0035]處理模塊:用于根據(jù)每個行人的人體關鍵點數(shù)量計算待檢測圖像的行人可見度,可見度小于預設閾值的圖像存在行人間彼此遮擋的現(xiàn)象,根據(jù)實例分割圖在待檢測圖像上構(gòu)造掩膜;[0036]第二預測模塊:將構(gòu)造了掩膜的待檢測圖像輸入預先訓練的改進模型進行檢測,得到被遮擋行人的預測框;[0037]輸出模塊:用于合并行人預測框和被遮擋行人的預測框,輸出行人檢測結(jié)果。[0039]所述存儲介質(zhì)用于存儲指令;[0040]所述處理器用于根據(jù)所述指令進行操作以執(zhí)行第一方面所述方法的步驟。[0041]第四方面,本發(fā)明提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)第一方面所述方法的步驟。[0042]與現(xiàn)有技術相比,本發(fā)明實施例所提供的一種適用于擁擠場景下的行人檢測方法及系統(tǒng)所達到的有益效果包括:[0043]本發(fā)明獲取擁擠場景下的待檢測圖像;將獲取到的待檢測圖像輸入預先訓練的改進模型進行檢測,得到行人預測框、實例分割圖和每個行人的人體關鍵點數(shù)量;根據(jù)每個行人的人體關鍵點數(shù)量計算待檢測圖像的行人可見度,可見度小于預設閾值的圖像存在行人間彼此遮擋的現(xiàn)象,根據(jù)實例分割圖在待檢測圖像上構(gòu)造掩膜;將構(gòu)造了掩膜的待檢測圖像輸入預先訓練的改進模型進行檢測,得到被遮擋行人的預測框;本發(fā)明構(gòu)造掩膜后再次被過濾掉的行人,顯著降低在擁擠人群中檢測的漏檢率;本發(fā)明根據(jù)實例分割圖對部分圖像構(gòu)造掩膜,與對所有圖像構(gòu)造掩膜相比,能夠大幅降低檢測時間;[0044]合并行人預測框和被遮擋行人的預測框,輸出行人檢測結(jié)果;本發(fā)明加強對擁擠8附圖說明[0045]圖1是本發(fā)明實施例一提供的一種適用于擁擠場景下的行人檢測方法的流程圖;[0046]圖2是本發(fā)明實施例一提供的一種適用于擁擠場景下的行人檢測方法中改進模型整體示意圖;[0047]圖3是本發(fā)明實施例一提供的一種適用于擁擠場景下的行人檢測方法的偽實例分割標注示意圖;[0048]圖4是本發(fā)明實施例一提供的一種適用于擁擠場景下的行人檢測方法的SFPN模塊的示意圖;[0049]圖5是本發(fā)明實施例一提供的一種適用于擁擠場景下的行人檢測方法的MKFRCNN模塊的示意圖。具體實施方式[0050]下面結(jié)合附圖對本發(fā)明作進一步描述。以下實施例僅用于更加清楚地說明本發(fā)明的技術方案,而不能以此來限制本發(fā)明的保護范圍。[0051]實施例一:[0052]如圖1,本發(fā)明實施例提供了一種適用于擁擠場景下的行人檢測方法,包括:改進模型的訓練和改進模型的應用。[0053]改進模型的訓練發(fā)生在改進模型的應用之前,作用是通過反向傳播算法迭代訓練改進模型,加強改進模型對擁擠場景下行人特征的提取能力。[0055]獲取已標注的擁擠場景下行人數(shù)據(jù)集,根據(jù)行人數(shù)據(jù)集中的頭部標注框信息和行人可見部位標注框信息構(gòu)造偽實例分割標注;[0056]將已標注的擁擠場景下的圖像輸入預先構(gòu)建的改進模型,得到預測訓練結(jié)果;[0057]計算預測訓練結(jié)果與偽實例分割標注之間的損失函數(shù),利用反向傳播算法計算梯度,更新預先構(gòu)建的改進模型的參數(shù);[0058]當損失函數(shù)值不再繼續(xù)下降時訓練完成,得到預先訓練的改進模型。[0060]步驟1:獲取已標注的擁擠場景下行人數(shù)據(jù)集,根據(jù)行人數(shù)據(jù)集中的頭部標注框信息和行人可見部位標注框信息構(gòu)造偽實例分割標注。[0061]由于擁擠行人數(shù)據(jù)集中不存在人體關鍵點標注,為了使模型具備檢測人體關鍵點的能力,先使用COC0人體關鍵點數(shù)據(jù)集對所述改進模型進行預訓練使,使得所述改進模型具備檢測人體關鍵點的能力。[0062]已標注的擁擠場景下行人數(shù)據(jù)集可以為CrowdHuman數(shù)據(jù)集。[0063]如圖3所示為偽實例分割標注示意圖,由于用于訓練的行人數(shù)據(jù)集不存在像素級別的標注,而且像素級別標注成本大,所以通過結(jié)合行人的頭部標注框信息和行人身體可見部位標注框信息構(gòu)建偽實例分割標注,可以顯著降低標注成本,并且也能提升模型對行人邊緣特征的提取能力。[0064]構(gòu)造偽實例分割標注,包括:假設某行人的頭部標注框的左上角坐標和長寬分別為(X?,Y),(W?,H?),行人身體可見部位標注框的左上角坐標和長寬分別為(X?,Y?),(W?,H?)。9通過這四個坐標構(gòu)建八個坐標用來構(gòu)建的多邊形即為偽實例分割標注,橫縱坐標分別用P,[0066]需要說明的是,在標注好偽實例分割圖后,同樣能得到偽語義分割圖,區(qū)別在于分割部分的像素值不同,實例分割對每一個實例賦予不同的像素值,語義分割對屬于某類別的目標賦予相同的像素值。[0067]步驟2:將已標注的擁擠場景下的圖像輸入預先構(gòu)建的改進模型,得到預測訓練結(jié)[0069]如圖4所示為SFPN模塊,用于提取行人特征得到待測圖像的特征圖和生成語義分[0070]SFPN的具體含義為添加了語義分割分支的特征金字塔網(wǎng)絡,是對17年提出的FPN的擴展,由于FPN結(jié)構(gòu)類似經(jīng)典語義分割網(wǎng)絡U-Net的編解碼結(jié)構(gòu),故能方便的擴展語義分割分支。[0071]如圖4所示,圖4中每條柱形圖上方的數(shù)字為通道數(shù)。首先選取在ImageNet數(shù)據(jù)集上預訓練過的ResNet50作為基礎網(wǎng)絡結(jié)構(gòu),將經(jīng)過conv17×7卷積得到的特征圖以及經(jīng)過conv2,conv3.conv4,conv5每一層最后一組殘差塊輸出的特征圖提取出來,分別命名為C1,C2,C3,C4,C5,然后先對C5進行1×1卷積得到M5,將M5上采樣(采用雙線性插值法)成與C4相同的分辨率后加上經(jīng)過1×1卷積的C4得到M4,依此類推得到M3,M2,然后將M5,M4,M3,M2都經(jīng)過3×3的卷積得到P5,P4,P3,P2特征圖,特征圖用于在RPN(RegionProposal生成建議框。RPN為15年提出的區(qū)域建議網(wǎng)絡,可以以端到端的形式生產(chǎn)建議框。而語義分割分支的建立從P2開始,先將P2經(jīng)過上采樣得到S1,接著將S1進行3×3卷積后再通過Relu激活函數(shù)得到與C1通道數(shù)相同的S2,引入Relu激活函數(shù)增加模型的非線性擬合能力并加快模型收斂,再將S2加上C1后通過1×1卷積進行特征聚合得到S3,最后通過Sigmoid函數(shù)得到概率分布圖。這里并不先對C1進行1×1卷積將通道數(shù)擴展為256后加上S1,是因為該方法在反向傳播計算梯度的過程中要占據(jù)更多顯存,并且不能明顯提高檢測性能,本發(fā)明結(jié)構(gòu)可以減少顯存使用量節(jié)省計算資源。[0072]如圖5所示為MKFRCNN模塊,用于根據(jù)所述建議框,得到行人預測框和對應的實例測行人的位置、實例分割圖和人體關鍵點,其中正方形圖案內(nèi)的數(shù)字表示分辨率和通道數(shù)如7×7×256表示特征圖分辨率為7×7,通道數(shù)為256,矩形圖案內(nèi)的數(shù)字表示全連接層的節(jié)點數(shù)。箭頭上的數(shù)字表示卷積核的大小和卷積次數(shù),比如4×3要檢測的人體關鍵點數(shù)量,由預訓練的數(shù)據(jù)集標注決定。在訓練時只開啟Box和Mask分支,在測試時三個分支都要開啟,但構(gòu)造二值掩膜后需要關閉Mask和Keypoint分支以提高檢測速度。[0074]本發(fā)明對MKFRCNN的實例分割分支進行了改進,將實例分割分支中上采樣方式由原本的轉(zhuǎn)置卷積更改為先進行雙線性插值,然后再通過卷積進行特征聚合,這是由于用于訓練的偽實例分割標注的模式相對固定,采用轉(zhuǎn)置卷積可能造成過擬合從而影響檢測性能,通過雙線性插值法更容易保留目標的空間結(jié)構(gòu)。[0075]步驟3:計算預測訓練結(jié)果與偽實例分割標注之間的損失函數(shù),利用反向傳播算法計算梯度,更新預先構(gòu)建的改進模型的參數(shù)。[0076]損失函數(shù)由分類損失,邊界框回歸損失,實例分割損失和語義分割損失構(gòu)成,其中分類損失,實例分割損失和語義分割損失都使用交叉熵損失函數(shù),不同之處在于計算損失的對象分別為圖片類別得分和像素類別得分。損失函數(shù)為多任務損失函數(shù),通過下式表示:[0077]Loss=L(p,,p)+pLo+p.Lmask+Ls(2)的索引;p是建議框?qū)念A測框為行人的預測概率,若建議框標記為正,pi為1,否則為0;t;*是建議框相對于真實框的偏移量,t,是建議框?qū)念A測框相對于真實框的偏移量,真實框指數(shù)據(jù)集中行人的位置標注框。[0081]步驟5:當損失函數(shù)值不再繼續(xù)下降時訓練完成,得到預先訓練的改進模型。[0083]獲取擁擠場景下的待檢測圖像;[0084]將獲取到的待檢測圖像輸入預先訓練的改進模型進行檢測,得到行人預測框、實例分割圖和每個行人的人體關鍵點數(shù)量;[0085]根據(jù)每個行人的人體關鍵點數(shù)量計算待檢測圖像的行人可見度,可見度小于預設閾值的圖像存在行人間彼此遮擋的現(xiàn)象,根據(jù)實例分割圖在待檢測圖像上構(gòu)造掩膜;[0086]將構(gòu)造了掩膜的待檢測圖像輸入預先訓練的改進模型進行檢測,得到被遮擋行人的預測框;[0087]合并行人預測框和被遮擋行人的預測框,輸出行人檢測結(jié)果。[0090]式(5)中,N表示檢測出來的行人數(shù)量;k;表示第j個行人檢測出來的人體關鍵點數(shù)量;K表示用于訓練人體關鍵點的數(shù)據(jù)集中對人體關鍵點的標注數(shù)量;a表示每個行人的可見度,檢測結(jié)果為每個關鍵點的得分,若某關鍵點得分大于0則該關鍵點檢測成功,不同用于訓練人體關鍵點的數(shù)據(jù)集中對人體關鍵點的標注數(shù)量不同。11體關鍵點估計圖像中行人身體可見度的規(guī)則篩選行人密度較高的圖像,從而可以添加二值掩膜后再次輸入檢測網(wǎng)絡檢測出被遮擋或者由于不符合NMS閾值而被過濾掉的行人,顯著降低在擁擠人群中檢測的漏檢率。[0093]本發(fā)明實施例提供了一種適用于擁擠場景下的行人檢測系統(tǒng),包括:[0094]獲取模塊:用于獲取擁擠場景下的待檢測圖像;[0095]第一預測模塊:用于將獲取到的待檢測圖像輸入預先訓練的改進模型進行檢測,得到行人預測框、實例分割圖和每個行人的人體關鍵點數(shù)量;[0096]處理模塊:用于根據(jù)每個行人的人體關鍵點數(shù)量計算待檢測圖像的行人可見度,可見度小于預設閾值的圖像存在行人間彼此遮擋的現(xiàn)象,根據(jù)實例分割圖在待檢測圖像上構(gòu)造掩膜;[0097]第二預測模塊:將構(gòu)造了掩膜的待檢測圖像輸入預先訓練的改進模型進行檢測,得到被遮擋行人的預測框;[0098]輸出模塊:用于合并行人預測框和被遮擋行人的預測框,輸出行人檢測結(jié)果。[0100]本發(fā)明實施例提供了一種計算機設備,包括處理器及存儲介質(zhì);[0101]所述存儲介質(zhì)用于存儲指令;[0102]所述處理器用于根據(jù)所述指令進行操作以執(zhí)行實施例一所述方法的步驟。[0104]本發(fā)明實施例還提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)實施例一所述方法的步驟。[0105]本領域內(nèi)的技術人員應明白,本申請的實施例可提供為方法、系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論