基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)_第1頁
基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)_第2頁
基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)_第3頁
基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)_第4頁
基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

目錄

1、引言...........................................................................................................................................1

1.1項(xiàng)目背景...............................................................................................................................1

1.2開發(fā)環(huán)境與工具..................................................................................................................2

1.2.1Python簡介....................................................................................................................2

1.2.2pytorch簡介...................................................................................................................2

1.2.3pycharm簡介.................................................................................................................3

1.2.4Python第三方庫簡介....................................................................................................4

2、需求分析...................................................................................................................................4

2.1可行性需求分析..................................................................................................................4

2.2數(shù)據(jù)采集功能分析..............................................................................................................5

2.3關(guān)鍵技術(shù)分析......................................................................................................................6

2.3.1目標(biāo)檢測(cè)........................................................................................................................6

2.3.2YOLOv5算法.................................................................................................................7

3、系統(tǒng)實(shí)現(xiàn)...................................................................................................................................9

3.1圖像采集...............................................................................................................................9

3.2圖像預(yù)處理.........................................................................................................................10

3.2.1彩色直方圖均衡..........................................................................................................10

3.2.2灰度處理......................................................................................................................11

3.2.3平滑處理......................................................................................................................12

3.3圖像標(biāo)注.............................................................................................................................13

4、模型構(gòu)建及評(píng)估分析.............................................................................................................14

5、模型應(yīng)用.................................................................................................................................19

6、總結(jié).........................................................................................................................................20

參考文獻(xiàn).......................................................................................................................................22

I

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)

1、引言

1.1項(xiàng)目背景

隨著現(xiàn)代化的發(fā)展,人們生活節(jié)奏越來越快,可以通過圖像進(jìn)行交流。從用戶的角度

來看,圖像不受當(dāng)?shù)卣Z言等因素的限制,能夠更好地表達(dá)和傳達(dá)人們的情感信息,可以作

為快速表達(dá)的載體。對(duì)我們來說,編輯文本是很容易的,但是圖像中傳遞的內(nèi)容和信息非

常大。因此,如何方便、有效地找到關(guān)鍵信息并利用圖像成為圖像處理領(lǐng)域的一個(gè)關(guān)鍵研

究問題。近年來,由于其在場(chǎng)景中的廣泛應(yīng)用,圖像識(shí)別成為圖像研究領(lǐng)域的一個(gè)熱點(diǎn)。

在畜牧業(yè)中,我們可以通過監(jiān)測(cè)牲畜的生長狀況、活樁的形狀和形狀來判斷,定期定量喂

養(yǎng)牲畜,監(jiān)測(cè)其生長發(fā)育情況。在工業(yè)上,關(guān)鍵問題可以通過圖像識(shí)別來解決。在醫(yī)學(xué)上,

高清圖像可以用來掃描身體的各個(gè)部位。此外,圖像在日常活動(dòng)中也起著至關(guān)重要的作用,

如高速列車安檢中的人臉識(shí)別,以及機(jī)上乘客的身份信息;平日停車時(shí),采用車牌識(shí)別技

術(shù)進(jìn)入停車場(chǎng);申請(qǐng)身份證時(shí),每個(gè)公民都會(huì)輸入自己的指紋信息,以便將來進(jìn)行安全驗(yàn)

證??傊?,圖像在我們的日常生活中是不可或缺的。利用傳統(tǒng)方法或深度學(xué)習(xí)方法快速有

效地識(shí)別圖像和提取顏色特征信息具有重要意義。

在機(jī)器視覺中,圖像識(shí)別是一個(gè)關(guān)鍵問題。圖像識(shí)別的精度主要取決于圖像關(guān)鍵部位

的定位精度。首先,圖像處理是圖像預(yù)處理。經(jīng)過預(yù)處理后的圖像特征提取算法有sift、LBP

和Haar。通過一系列的步驟,我們可以準(zhǔn)確地識(shí)別圖像的內(nèi)容。獲取圖像的方法有很多種,

但我們必須利用攝影工具將采集到的圖像數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫中以備不時(shí)之需,而對(duì)受損圖

像的處理就是對(duì)圖像中我們需要的圖像進(jìn)行切割,以確定其統(tǒng)一的格式和大小。對(duì)于圖像

質(zhì)量較差的圖像,可以對(duì)圖像進(jìn)行去噪、增強(qiáng)和一系列的預(yù)處理,以方便以后的使用。獲

取完整的特征信息是反映用戶需求、服務(wù)于整個(gè)行業(yè)的關(guān)鍵,因此這一步是圖像識(shí)別的基

礎(chǔ)過程,細(xì)化來說就是先要提取需要去識(shí)別的圖像的特征,然后再利用分類器來把相同特

征的歸為一類,實(shí)現(xiàn)分組,從而實(shí)現(xiàn)對(duì)圖像的識(shí)別。

人工智能和機(jī)器學(xué)習(xí)的發(fā)展也為圖像識(shí)別提供了極好的資源。機(jī)器學(xué)習(xí)就是讓機(jī)器擁

有與人類相同的大腦,使機(jī)器能夠獨(dú)立地學(xué)習(xí)和分析問題。人類知識(shí)的獲得是一個(gè)漫長而

反復(fù)的過程。在人類進(jìn)化的過程中,人們通過學(xué)習(xí)和理解知識(shí)來理解自己需要獲得的東西。

通過不斷的實(shí)踐,人們可以獲得相關(guān)的技能,并分析和總結(jié)在這個(gè)過程中獲得的經(jīng)驗(yàn)。機(jī)

器學(xué)習(xí)類似于人腦的學(xué)習(xí),使機(jī)器學(xué)習(xí)不再是科幻電影的場(chǎng)景。人類通過眼睛捕捉周圍的

所有信息,并將視網(wǎng)膜成像傳輸?shù)酱竽X,獲得相關(guān)的圖像特征。機(jī)器視覺就是通過各種設(shè)

備獲取相關(guān)的圖像。經(jīng)過特征提取,機(jī)器可以通過學(xué)習(xí)識(shí)別相關(guān)對(duì)象,并通過計(jì)算機(jī)或音

頻設(shè)備顯示學(xué)習(xí)的內(nèi)容。分類器訓(xùn)練是機(jī)器學(xué)習(xí)的關(guān)鍵。通過不斷的訓(xùn)練并對(duì)分類器進(jìn)行

1

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

調(diào)整,得到分類器模型,對(duì)誤差范圍較小的目標(biāo)進(jìn)行識(shí)別。機(jī)器學(xué)習(xí)包括無監(jiān)督學(xué)習(xí)、有

監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)。

而我們清楚的是人臉識(shí)別無論是數(shù)字圖像的處理方面還是在于計(jì)算機(jī)視覺領(lǐng)域的方

面,其地位都是很高的,它能利用攝像機(jī)采集信息,并對(duì)其進(jìn)行檢測(cè),還能快速識(shí)別出口

罩佩戴情況,所以說該項(xiàng)技術(shù)對(duì)于當(dāng)下疫情控制的意義是非常高的,在該方面的投入也是

非常有必要的有價(jià)值的。面對(duì)突如其來的新一輪肺炎疫情,人們的生活秩序被嚴(yán)重?cái)_亂。

與普通流感不同,這種流行病可以通過人類唾液傳播,并具有很強(qiáng)的感染他人的能力。最

近,面對(duì)疫情,市面上的口罩越來越少。新型冠狀病毒肺炎對(duì)該病的流行尤為重要。能有

效阻斷新型冠狀肺炎病毒的傳播。它能直接從源頭檢查,將人體唾液和氣流從第一道屏障

中隔離出來,有效保護(hù)自己和他人,不傳播病毒。在中國的公共場(chǎng)所必須戴口罩。然而,

在商場(chǎng)、餐廳、地鐵等人員密集場(chǎng)所,應(yīng)對(duì)客流高峰期的措施往往讓人發(fā)自內(nèi)心。一些人

外出時(shí)不愛戴口罩,這給病毒提供了可乘之機(jī),給自己和他人的生命帶來重大安全隱患。

如果有一套系統(tǒng),通過對(duì)數(shù)字圖像的采集和識(shí)別,識(shí)別出是否戴口罩的人,并做出相應(yīng)的

預(yù)警和報(bào)警就顯得尤為重要和迫切。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,基于圖像的面具識(shí)別迅

速引起人們的關(guān)注。

1.2開發(fā)環(huán)境與工具

1.2.1Python簡介

Python由荷蘭數(shù)學(xué)和計(jì)算機(jī)科學(xué)研究學(xué)會(huì)的吉多·范羅蘇姆于1990年代初設(shè)計(jì),作為

一門叫做ABC語言的替代品。Python提供了高效的高級(jí)數(shù)據(jù)結(jié)構(gòu),還能簡單有效地面向

對(duì)象編程。Python語法和動(dòng)態(tài)類型,以及解釋型語言的本質(zhì),使它成為多數(shù)平臺(tái)上寫腳本

和快速開發(fā)應(yīng)用的編程語言,隨著版本的不斷更新和語言新功能的添加,逐漸被用于獨(dú)

立的、大型項(xiàng)目的開發(fā)。

Python解釋器易于擴(kuò)展,可以使用C語言或C++(或者其他可以通過C調(diào)用的語言)

擴(kuò)展新的功能和數(shù)據(jù)類型。Python也可用于可定制化軟件中的擴(kuò)展程序語言。Python豐富

的標(biāo)準(zhǔn)庫,提供了適用于各個(gè)主要系統(tǒng)平臺(tái)的源碼或機(jī)器碼。

1.2.2pytorch簡介

是一個(gè)基于Python的開源機(jī)器學(xué)習(xí)框架,由Facebook的人工智能研究團(tuán)隊(duì)開發(fā)和維

護(hù)。它提供了豐富的工具和庫,用于構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型和進(jìn)行機(jī)器學(xué)習(xí)任務(wù)。

的設(shè)計(jì)理念是動(dòng)態(tài)計(jì)算圖,這意味著你可以使用自然的方式定義和執(zhí)行計(jì)算圖,而不

需要預(yù)先定義靜態(tài)計(jì)算圖的結(jié)構(gòu)。這種靈活性使得模型構(gòu)建和調(diào)試變得更加直觀和方便,的

主要特點(diǎn)包括:

1.動(dòng)態(tài)計(jì)算圖:允許用戶在運(yùn)行時(shí)動(dòng)態(tài)地構(gòu)建、修改和執(zhí)行計(jì)算圖,使得模型構(gòu)建和

調(diào)試更加靈活和直觀。

2

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

2.自動(dòng)求導(dǎo):能夠自動(dòng)計(jì)算張量的梯度,大大簡化了反向傳播算法的實(shí)現(xiàn)。這使得模

型訓(xùn)練過程更加便捷和高效。

3.強(qiáng)大的GPU加速支持:針對(duì)GPU進(jìn)行了優(yōu)化,可以充分利用GPU的并行計(jì)算能

力,加速深度學(xué)習(xí)任務(wù)的訓(xùn)練和推理。

4.大型社區(qū)支持:擁有龐大的開源社區(qū),提供了豐富的文檔、教程和示例代碼。這使

得學(xué)習(xí)和使用變得更加容易,同時(shí)也能夠從社區(qū)中獲取支持和解決問題。

5.兼容性和可擴(kuò)展性:與其他Python庫(如NumPy)和常見的機(jī)器學(xué)習(xí)庫(如SciPy

和Scikit-learn)兼容性良好。此外,還提供了豐富的擴(kuò)展庫和工具,可以滿足不同任務(wù)和

需求的擴(kuò)展性需求。

總的來說,是一個(gè)功能強(qiáng)大、易用且靈活的機(jī)器學(xué)習(xí)框架,廣泛應(yīng)用于學(xué)術(shù)界和工業(yè)

界。它的設(shè)計(jì)理念和特點(diǎn)使得模型構(gòu)建和調(diào)試更加直觀和高效,為深度學(xué)習(xí)任務(wù)提供了便

利和優(yōu)化的解決方案。

1.2.3pycharm簡介

PyCharm是一款由JetBrains開發(fā)的集成開發(fā)環(huán)境(IDE),專門用于Python開發(fā)。它

提供了許多強(qiáng)大的功能和工具,旨在提高開發(fā)者的生產(chǎn)力和代碼質(zhì)量,以下是PyCharm的

一些主要特點(diǎn)和功能:

1.代碼編輯和智能感知:PyCharm具有強(qiáng)大的代碼編輯功能,包括語法高亮、代碼補(bǔ)

全、自動(dòng)縮進(jìn)和錯(cuò)誤檢查等。它還提供了智能感知功能,可以根據(jù)上下文提供代碼建議和

自動(dòng)完成。

2.調(diào)試和測(cè)試:PyCharm內(nèi)置了強(qiáng)大的調(diào)試器,可以幫助開發(fā)者定位和修復(fù)代碼中的

問題。它還支持單元測(cè)試和集成測(cè)試,可以方便地編寫、運(yùn)行和分析測(cè)試用例。

3.項(xiàng)目管理:PyCharm支持多個(gè)項(xiàng)目的管理,可以輕松切換和管理不同的Python項(xiàng)

目。它提供了項(xiàng)目導(dǎo)航、版本控制集成和依賴管理等功能,使得項(xiàng)目開發(fā)更加便捷。

4.版本控制:PyCharm與常見的版本控制系統(tǒng)(如Git、SVN和Mercurial)集成緊密,

可以直接在IDE中進(jìn)行版本控制操作,如提交、拉取和合并代碼等

5.代碼重構(gòu)和分析:PyCharm提供了豐富的代碼重構(gòu)工具,可以幫助開發(fā)者進(jìn)行代碼

重構(gòu)和優(yōu)化,提高代碼的可讀性和維護(hù)性。它還提供了靜態(tài)代碼分析功能,可以幫助檢測(cè)

潛在的錯(cuò)誤和優(yōu)化建議。

6.插件和擴(kuò)展性:PyCharm支持大量的插件和擴(kuò)展,可以根據(jù)需要添加額外的功能和

工具,以滿足特定項(xiàng)目或開發(fā)需求。

總的來說,PyCharm是一個(gè)功能強(qiáng)大、易用且高度可定制的Python開發(fā)環(huán)境,適用于

各種規(guī)模的項(xiàng)目和開發(fā)者。它提供了豐富的功能和工具,幫助開發(fā)者提高開發(fā)效率、減少

錯(cuò)誤,并保持代碼質(zhì)量。

3

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

1.2.4Python第三方庫簡介

Python是一種非常受歡迎的編程語言,因?yàn)樗子趯W(xué)習(xí)、使用和擴(kuò)展。Python擁有

大量的第三方庫,這些庫可以幫助開發(fā)人員快速、輕松地實(shí)現(xiàn)各種任務(wù)。以下是幾個(gè)重要

的Python第三方庫簡介:

NumPy:NumPy是Python的一個(gè)科學(xué)計(jì)算庫,它提供了高效的多維數(shù)組對(duì)象、各種

派生對(duì)象、快速的數(shù)組操作方法以及大量的工具。

Pandas:Pandas是Python的一個(gè)數(shù)據(jù)處理庫,它提供了靈活和高效的數(shù)據(jù)結(jié)構(gòu),包

括數(shù)據(jù)幀和面向行和列的數(shù)據(jù)選擇、操作和分組方法。

Matplotlib:Matplotlib是Python的一個(gè)繪圖庫,它提供了創(chuàng)建各種類型圖表和可視

化的工具,包括條形圖、散點(diǎn)圖、區(qū)域圖和等高線圖等。

Scikit-learn:Scikit-learn是Python的一個(gè)機(jī)器學(xué)習(xí)庫,它包含了大量的基本算法和

模型,可以用于分類、回歸和聚類等任務(wù)。

Pytorch:Pytorch是一個(gè)開源的機(jī)器學(xué)習(xí)框架,它由Google開發(fā),是用于構(gòu)建人工

智能模型的重要工具之一。

Django:Django是Python的一個(gè)Web框架,它提供了一套完整的MVC架構(gòu)、

ORM和模板語言,可以幫助開發(fā)人員快速構(gòu)建復(fù)雜web應(yīng)用程序。

Flask:Flask是Python的另一個(gè)微型Web框架,它提供了一個(gè)靈活的、易于擴(kuò)展

的架構(gòu),可以用于搭建小型Web應(yīng)用程序和API。

這些Python第三方庫提供了很多功能和工具,可以幫助開發(fā)人員更輕松、高效地進(jìn)

行編程任務(wù)。使用這些庫可以大大提升Python在數(shù)據(jù)處理、科學(xué)計(jì)算、機(jī)器學(xué)習(xí)、Web

開發(fā)等方面的能力。

2、需求分析

2.1可行性需求分析

1.功能需求

2020年新冠肺炎席卷全球,佩戴口罩能夠有效切斷新冠肺炎病毒的傳播途徑,是預(yù)防

感染的有效措施。隨著疫情影響的逐步擴(kuò)大,國內(nèi)公眾場(chǎng)合要求人們需要佩戴口罩,但是

也總有一些人因?yàn)樘厥馇闆r未能佩戴口罩,這有可能會(huì)對(duì)周圍人群的安全造成隱患。特別

是商場(chǎng)、餐飲、地鐵、車站等人員密集型的場(chǎng)所,由工作人員人工檢測(cè)體溫與監(jiān)督乘客口

罩佩戴情況,在人流量高峰時(shí)段的檢測(cè)往往應(yīng)接不暇,經(jīng)常會(huì)出現(xiàn)大量人力的浪費(fèi),并且

吃力不討好,效率仍然低下。

隨著時(shí)代的快速發(fā)展,計(jì)算機(jī)視覺技術(shù)使得我們攝像機(jī)與計(jì)算機(jī)合而為一,一體化的

分析處理,快速高效的實(shí)現(xiàn)對(duì)人員來往是否佩戴口罩的檢測(cè)。本系統(tǒng)可以自動(dòng)準(zhǔn)確且快速

4

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

地識(shí)別圖片或視頻中人物是否佩戴口罩,有著重要的應(yīng)用場(chǎng)景和市場(chǎng)前景。

2.性能需求

(1)系統(tǒng)在因特網(wǎng)正常狀況下全天候提供服務(wù),用戶可以隨時(shí)使用該系統(tǒng)進(jìn)行檢測(cè)。

(2)檢測(cè)速度要盡可能的快并且檢測(cè)結(jié)果盡可能準(zhǔn)確。

(3)系統(tǒng)的安全性、可操作性、可維護(hù)性要較為完善。

3.運(yùn)行需求

本系統(tǒng)采用了YOLOv5模型,Darknet深度學(xué)習(xí)框架,操作系統(tǒng)為Windows10,環(huán)境

為。這些技術(shù)目前都已經(jīng)很成熟,而且技術(shù)含量很高,使用起來很方便,安全性也有較大

保障。目前高性能的網(wǎng)絡(luò)組建大量涌現(xiàn),他們速度快、用量大、可靠性高、價(jià)格低,完全

可以滿足本系統(tǒng)的需要。

2.2數(shù)據(jù)采集功能分析

在使用本系統(tǒng)時(shí),用戶首先需要選擇本地圖片或視頻并傳入系統(tǒng),系統(tǒng)對(duì)圖片進(jìn)行

預(yù)處理后再對(duì)目標(biāo)人臉的區(qū)域進(jìn)行定位,然后對(duì)定位后的人臉區(qū)域進(jìn)行是否佩戴口罩的

識(shí)別,最后將識(shí)別結(jié)果輸出。

根據(jù)上述描述,本系統(tǒng)應(yīng)具備以下四個(gè)功能:

(1)圖片選擇:提供從本地文件夾中選擇待識(shí)別圖片的功能。用戶可以從本地文件

夾中獲取想要識(shí)別的圖片并傳入系統(tǒng)。

(2)圖像預(yù)處理:提供對(duì)傳入的圖片進(jìn)行預(yù)處理的功能。該功能可以對(duì)傳入的圖片

進(jìn)行灰度校正和平滑處理,為之后對(duì)圖像進(jìn)行進(jìn)一步分析和識(shí)別做準(zhǔn)備。

(3)圖像識(shí)別:該功能是對(duì)已經(jīng)預(yù)計(jì)處理的圖像進(jìn)行再一次進(jìn)一步的分析,并通過

如此方式對(duì)于圖像特征提取,對(duì)于目標(biāo)進(jìn)行定位以及預(yù)處理之后的圖像進(jìn)行進(jìn)一步分析,

對(duì)圖像進(jìn)行特征提取、目標(biāo)定位和目標(biāo)識(shí)別。

(4)結(jié)果輸出:該功能可以將已經(jīng)完成識(shí)別的圖像的結(jié)果進(jìn)行輸出。

5

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖2-1系統(tǒng)功能結(jié)構(gòu)圖

2.3關(guān)鍵技術(shù)分析

2.3.1目標(biāo)檢測(cè)

1.目標(biāo)檢測(cè)的概念

目標(biāo)檢測(cè)又被我們叫做目標(biāo)提取,這是一種基于目標(biāo)的幾何還有統(tǒng)計(jì)特征的圖像分割

方法。

它的作用在于,將原本需要兩步的目標(biāo)分割還有識(shí)別合二為一,所以其以準(zhǔn)確以及實(shí)

時(shí)著稱,特別是在許多復(fù)雜的場(chǎng)景之中,因?yàn)槲覀冃枰瑫r(shí)對(duì)多個(gè)目標(biāo)進(jìn)行相應(yīng)的檢測(cè)處

理,它所具備的自動(dòng)提取目標(biāo)以及自動(dòng)識(shí)別格外重要。在對(duì)國內(nèi)外諸多成果的研究中,

我們將目標(biāo)檢測(cè)的算法通常分為兩類,第一種是較為傳統(tǒng)的目標(biāo)檢測(cè)算法,第二種就是我

們要介紹到的基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法,目前后者的用途十分廣泛該算法又分為One-

Stage目標(biāo)檢測(cè)算法和Two-Stage目標(biāo)檢測(cè)算法。

2.傳統(tǒng)目標(biāo)檢測(cè)算法

(1)對(duì)于傳統(tǒng)的目標(biāo)檢測(cè)方法,一般工作流程分為三個(gè)階段:即首先給定圖像選取

候選區(qū)域,選擇過后再提取相應(yīng)特征,之后再用以及訓(xùn)練好的分類器來對(duì)于各個(gè)數(shù)據(jù)進(jìn)行

分類。這三個(gè)階段細(xì)化來說如下。

區(qū)域選擇:即定位,我們?cè)诜治鎏幚碇笆紫葢?yīng)該確定位置,因?yàn)槟繕?biāo)可能出現(xiàn)于任

何位置,且形狀比例會(huì)相應(yīng)的產(chǎn)生一些變化,所以我們采用滑動(dòng)窗口來保證將圖像所有位

置都有觀測(cè)到,簡單來說,就是窮舉法,這種方法可以完成任務(wù),但是這種方法效率不高,

且時(shí)間浪費(fèi)的太多,且多了許多不必要的的多于窗口,這對(duì)于后續(xù)工作的進(jìn)行產(chǎn)生了影響,

6

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

也導(dǎo)致了整體系統(tǒng)的效率被拖慢。

(2)特征提?。阂?yàn)橛^測(cè)目標(biāo)不會(huì)相同,多種多樣,并且位置角度都有變化,所以

一個(gè)完美程序是特別困難的。但是對(duì)于目標(biāo)特征的提取又是至關(guān)重要的,它直接決定系統(tǒng)

的結(jié)果是否準(zhǔn)確,所以重要程度不言而喻。其中,SIFT、HOG等是這個(gè)階段常用的特征。

(3)分類:即根據(jù)第二步所提取出來具有相似特征的目標(biāo)歸為一類,實(shí)現(xiàn)對(duì)數(shù)據(jù)的

分類。目前市面上的分類器主要包括SVM,AdaBoost等。

2.3.2YOLOv5算法

YOLOv5是一種高性能實(shí)時(shí)目標(biāo)檢測(cè)算法,是YOLO系列(YouOnlyLookOnce)的

最新版本。它是由Ultralytics團(tuán)隊(duì)開發(fā)的,旨在提供更快速、更準(zhǔn)確的目標(biāo)檢測(cè)能力。

與之前的版本相比,YOLOv5在模型結(jié)構(gòu)和訓(xùn)練策略上進(jìn)行了一些改進(jìn)和優(yōu)化,以提

高檢測(cè)性能。下面是YOLOv5的一些特點(diǎn):

1.網(wǎng)絡(luò)結(jié)構(gòu):YOLOv5采用了一種輕量級(jí)的網(wǎng)絡(luò)結(jié)構(gòu),由卷積層和池化層組成,通過

多個(gè)不同尺度的特征圖進(jìn)行目標(biāo)檢測(cè)。這種結(jié)構(gòu)能夠在保持準(zhǔn)確性的同時(shí)提供較快的推理

速度。

2.強(qiáng)大的檢測(cè)能力:YOLOv5能夠同時(shí)檢測(cè)多個(gè)目標(biāo)類別,并輸出它們的邊界框和類

別概率。它具有較高的準(zhǔn)確性和召回率,能夠有效地處理復(fù)雜場(chǎng)景下的目標(biāo)檢測(cè)任務(wù)。

3.多尺度訓(xùn)練:YOLOv5采用了一種多尺度訓(xùn)練策略,通過在不同尺度下訓(xùn)練模型,

提高了模型對(duì)不同大小目標(biāo)的檢測(cè)能力。這使得模型在處理大尺度和小尺度目標(biāo)時(shí)都能取

得較好的效果。

4.數(shù)據(jù)增強(qiáng)和數(shù)據(jù)集增強(qiáng):YOLOv5使用了多種數(shù)據(jù)增強(qiáng)技術(shù),如隨機(jī)裁剪、色彩擾

動(dòng)和圖像翻轉(zhuǎn)等,以增加訓(xùn)練數(shù)據(jù)的多樣性和數(shù)量。此外,還提供了數(shù)據(jù)集增強(qiáng)工具,可

以通過合成數(shù)據(jù)增加訓(xùn)練樣本的豐富性。

5.高度可定制:YOLOv5提供了豐富的配置選項(xiàng),可以根據(jù)任務(wù)需求進(jìn)行靈活的模型

設(shè)置和訓(xùn)練。用戶可以選擇不同的網(wǎng)絡(luò)尺寸、訓(xùn)練參數(shù)和推理設(shè)置,以滿足特定的目標(biāo)檢

測(cè)需求。

總的來說,YOLOv5是一種高性能的實(shí)時(shí)目標(biāo)檢測(cè)算法,具有較快的推理速度和較高

的檢測(cè)準(zhǔn)確性。它在多尺度訓(xùn)練、數(shù)據(jù)增強(qiáng)和模型定制等方面提供了更多的靈活性和優(yōu)化

選項(xiàng),適用于各種實(shí)際場(chǎng)景中的目標(biāo)檢測(cè)任務(wù)。

7

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

YOLO網(wǎng)絡(luò)基于回歸算法,在很復(fù)雜的運(yùn)算數(shù)據(jù)面前也能發(fā)揮很好的效果,實(shí)際運(yùn)

用效果也是如此,該算法去的了不小的成就,獲得了可觀的效果。一般情況下YOLO網(wǎng)

絡(luò)將輸入的圖片劃分成大小為32*32的網(wǎng)格,檢測(cè)目標(biāo)口罩,只要口罩的中心位置落入

某個(gè)網(wǎng)格中,則立即由該網(wǎng)格負(fù)責(zé)檢測(cè)目標(biāo)。同樣的檢測(cè)地點(diǎn)檢測(cè)對(duì)象,該算法比較其

它任何算法都要更具優(yōu)勢(shì),優(yōu)勢(shì)就在于其多尺度預(yù)測(cè)算法,特別是實(shí)時(shí)性方面,更加凸

現(xiàn)了該中算法的強(qiáng)大,更好地滿足人流量較大的需要。

Yolov5算法是在原有YOLO目標(biāo)檢測(cè)架構(gòu)的基礎(chǔ)上,采用了近些年CNN領(lǐng)域中最

優(yōu)秀的優(yōu)化策略,從數(shù)據(jù)處理、主干網(wǎng)絡(luò)、網(wǎng)絡(luò)訓(xùn)練、激活函數(shù)、損失函數(shù)等各個(gè)方面

都有著不同程度的優(yōu)化。

(1)Yolov5的貢獻(xiàn)

①開發(fā)了一個(gè)高效而強(qiáng)大的模型,使得任何人都可以使用一張1080Ti或者2080Ti

GPU去訓(xùn)練一個(gè)超級(jí)快速和精確的目標(biāo)檢測(cè)器。

②驗(yàn)證了一系列state-of-the-art的目標(biāo)檢測(cè)器訓(xùn)練方法的影響。

③修改了state-of-the-art方法,使得他們?cè)谑褂脝蝹€(gè)GPU進(jìn)行訓(xùn)練時(shí)更加有效和適

配,包括CBN,PAN,SAM等。

(2)Yolov5的訓(xùn)練方法

①Bagoffreebies:只改變訓(xùn)練策略或者只增加訓(xùn)練成本,比如數(shù)據(jù)增強(qiáng)。

②Bagofspecials:插件模塊和后處理方法,它們僅僅增加一點(diǎn)推理成本,但是可以

極大地提升目標(biāo)檢測(cè)的精度。

(3)Yolov5的網(wǎng)絡(luò)結(jié)構(gòu)

Yolov5目標(biāo)檢測(cè)算法作為該算法的第四代,相比第三代,在網(wǎng)絡(luò)結(jié)構(gòu)上比更復(fù)雜,

因?yàn)槠鋬?nèi)部使用了極多的訓(xùn)練模式來提升整體神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率,Yolov5通過引入

Mosaic數(shù)據(jù)增強(qiáng)方法,并選擇最優(yōu)超參數(shù),使用GA算法,進(jìn)而對(duì)現(xiàn)有的方法進(jìn)行改

進(jìn),并對(duì)其不斷進(jìn)行訓(xùn)練,使得其具有更為低的訓(xùn)練門檻,使其下限更低,更好上手,

能夠在GPU資源有限的條件下盡可能的得到更加好的結(jié)果。在運(yùn)算過程中Mosaic數(shù)據(jù)增

強(qiáng)方法每次隨機(jī)讀取四張圖片,并對(duì)這四張張照片進(jìn)行一系列操作,翻轉(zhuǎn)、縮放等操

作,實(shí)現(xiàn)將四張圖合四為一,這種將四張圖片組合為一張圖片的方法可以更加豐富檢測(cè)

物體的背景。Yolov5的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,主干網(wǎng)絡(luò)為CSPDarknet53,附加模塊設(shè)

置為SPPNeck,另外特征融合模塊使用PANet,使用第三代即,YOLOv3作為Head。在這

里面的Darknet53包含了5個(gè)大殘差塊,這5個(gè)大殘差塊包含的小殘差單元個(gè)數(shù)分別為

1、2、8、8、4。CSPDarknet53在Darknet53的每個(gè)大殘差塊上加上了CSPNet(Cross

StagePartialNetwork),并在后面通過梯度的變化,集成到特征圖中,同時(shí)將特征圖一分

為二,一部分進(jìn)行卷積操作,另一部分與上一次的卷積結(jié)果進(jìn)行結(jié)合。最后在目標(biāo)檢測(cè)

8

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

問題中,CSP可以有效提升CNN的學(xué)習(xí)能力,同時(shí)減少計(jì)算量。PANet充分利用了特

征融合,Yolov5中還將融合的方法由加法改為乘法,使該網(wǎng)絡(luò)能夠得到更加精確的目標(biāo)

檢測(cè)能力。

圖2-2Yolov5網(wǎng)絡(luò)結(jié)構(gòu)圖

3、系統(tǒng)實(shí)現(xiàn)

3.1圖像采集

本系統(tǒng)共爬取了大約5000張圖片作為口罩佩戴檢測(cè)數(shù)據(jù)集,其中佩戴口罩和未佩戴

口罩的圖片數(shù)量基本持平。對(duì)于樣品的圖像,我們進(jìn)行兩類標(biāo)注,一類有口罩,一類未

戴口罩,一共訓(xùn)練集有2200張不同的圖片,驗(yàn)證集是訓(xùn)練集的百分之十。在每一次同時(shí)

數(shù)據(jù)之中,存在著許許多多的不同,口罩角度,顏色各不相同,這樣的訓(xùn)練有利于提升

我們的檢測(cè)佩戴情況的準(zhǔn)確性。

9

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖3-1部分圖片展示

圖3-2部分圖片展示

3.2圖像預(yù)處理

圖像預(yù)處理的主要作用包括改善圖像質(zhì)量、突出特征、去除噪聲、調(diào)整尺寸、歸一化

和數(shù)據(jù)增強(qiáng)等。其中,彩色直方圖均衡用于增強(qiáng)對(duì)比度和改善圖像質(zhì)量,灰度處理可以降

低計(jì)算復(fù)雜度并提取圖像特征,平滑處理可以去除圖像中的噪聲。這些預(yù)處理技術(shù)都有助

于提高圖像處理和圖像識(shí)別的準(zhǔn)確性和性能。

3.2.1彩色直方圖均衡

彩色直方圖均衡是一種圖像處理技術(shù),通過調(diào)整彩色圖像中每個(gè)顏色通道的像素值

分布,實(shí)現(xiàn)對(duì)比度增強(qiáng)、圖像質(zhì)量改善、視覺感知提升和圖像特征增強(qiáng)的效果。它能夠

10

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

使圖像亮度范圍更均勻地覆蓋整個(gè)范圍,突出細(xì)節(jié),使識(shí)別圖像的邊緣更清晰、自然、

生動(dòng),提高計(jì)算機(jī)對(duì)圖像的感知和識(shí)別能力。

圖3-3直方圖均衡代碼

圖3-4均衡化后圖片

使用圖片均衡化亮度均衡,口罩邊緣更清晰,更容易被計(jì)算機(jī)識(shí)別。

3.2.2灰度處理

在圖像處理中,處理三個(gè)通道的數(shù)據(jù)會(huì)比較復(fù)雜,因此需要先將圖像變灰,也就是

對(duì)圖像進(jìn)行灰度處理,因?yàn)榛一蟮恼掌梢员M可能的減少原始圖像的數(shù)據(jù),這樣便可

以減少計(jì)算量,增加計(jì)算精度,灰度處理,簡單來說,就是將各個(gè)像素點(diǎn)的RGB值統(tǒng)一

成同一個(gè)值,從而失去顏色,變?yōu)榛疑?,?jīng)過灰度處理后的圖像將由三通道變?yōu)閱瓮?/p>

道,而單通道的數(shù)據(jù),處理計(jì)算起來將會(huì)得到極大的簡便。

灰度處理后的圖像可以通過閾值變換轉(zhuǎn)換成黑白二值的圖像信息,也正是通過對(duì)于

灰度圖像二值化處理,所需目標(biāo)的輪廓便可以得到凸出。

灰度閾值變換的基本公式為:

0xT

f(x)

255xT

11

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

其中T為指定的閾值。

類似于符號(hào)函數(shù),將灰度大于閾值的部分設(shè)置為最大灰度,灰度小于閾值的部分設(shè)

置為最小灰度。經(jīng)過閥值化的灰度值僅有兩個(gè)取值,最小值0與最大值255。閾值變換將

圖像內(nèi)容劃分為關(guān)心與不關(guān)心的2個(gè)部分,從復(fù)雜背景中可直接提取出感興趣的,主要

用于對(duì)圖像的分割。

二值化處理的灰度圖像,即就是將像素點(diǎn)閾值變換,講灰度設(shè)置到0或255,這樣的

設(shè)置,也就可以使整個(gè)圖像會(huì)出現(xiàn)明顯的黑白效果,也就是將256個(gè)亮度等級(jí)的灰度圖

像,通過適當(dāng)?shù)拈撝颠x取,得到可以明顯顯出所需物體的二值化圖像,同時(shí)在數(shù)字化處

理之中,二值化圖像的圖像整體,以及局部特征,我們都知道,二值圖像在數(shù)字處理中

的的地位是很高的,特別是實(shí)用的圖像處理,在當(dāng)下的生產(chǎn)生活,通過二值化圖像來處

理信息是很廣泛的,但要進(jìn)行二值化處理,我們就需要先將灰度圖像二值化,得到二值

化圖像,因?yàn)槎祷瘓D像才能進(jìn)行二值化處理,因?yàn)閳D像性質(zhì)只與灰度閾值點(diǎn)位置有

關(guān),不涉及像素多級(jí)值,這就使的對(duì)于圖像的處理變得簡單,,并且壓縮量少,占據(jù)空

間更小,而我們要得到滿足條件的理想型二值化圖像,我們通常都是采用封閉,以及聯(lián)

通的邊界定義不重合的區(qū)域,所有的灰度大于或等于閾值的物體,即為我們所需要的特

定物體,即將其灰度值表示為225,除此之外的的像素點(diǎn)都被排除在外,灰度值即為零,

表示為區(qū)域值之外是背景等區(qū)域,但如果特定物體內(nèi)部有著均勻的灰度值,并且處于一

個(gè)具有其他等級(jí)灰度值的均勻背景,使用閾值法就可以得到明顯的分割成果,如果物體

與背景灰度差值較大,即可以之間轉(zhuǎn)化為灰度的差值,利用灰度閾值選取分割,動(dòng)態(tài)閾

值調(diào)節(jié)來幫助觀測(cè)。

而對(duì)于經(jīng)過處理的灰度圖像,是沒有固定的算法的,根據(jù)圖像區(qū)域之中的不同目標(biāo)

有著不同算法,在實(shí)際之中的操作中,根據(jù)不同灰度我們能進(jìn)行舍入處理,必須選擇為

灰度閾值中值等,但是這種處理的范圍過于寬廣,因?yàn)闆]有根基圖像,所以效果不是很

理想。

3.2.3平滑處理

圖像在生成、獲取、傳輸?shù)冗^程中,由于受到光照、成像系統(tǒng)功能和噪聲等許多因

素的影響,往往會(huì)造成對(duì)比度偏低、清晰度下降以及產(chǎn)生干擾噪聲等結(jié)果。為了改善圖

像質(zhì)量,需要利用圖像增強(qiáng)技術(shù)獲得更便于后續(xù)分析和識(shí)別的圖像。圖像的平滑處理是

在盡量保留圖像原有信息的情況下,過濾圖像內(nèi)部的噪聲。通過圖像平滑處理,可以有

效過濾掉圖像內(nèi)的噪聲信息。

圖像平滑處理的基本原理是對(duì)圖像中與周圍像素點(diǎn)的像素差異值較大的像素點(diǎn)進(jìn)行

處理,將其值調(diào)整為周圍像素點(diǎn)像素值的近似值。

12

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖像平滑處理的方法包括均值濾波、方框?yàn)V波、高斯濾波、中值濾波、雙邊濾波和

2D濾波等。

在該系統(tǒng)的均值處理方法之中,我們采取均值濾波方法方法來對(duì)圖像進(jìn)行平滑處

理。均值濾波指的是當(dāng)前像素點(diǎn)的周圍N*N個(gè)像素值的均值來代替當(dāng)前像素點(diǎn),而通過

這樣的方法來歷遍每一個(gè)像素點(diǎn),這樣窮舉之后,即可以完成對(duì)于整個(gè)圖像的均值濾

波。

而在于數(shù)據(jù)處理之前,我們有必要先去考慮對(duì)于周圍的多少個(gè)像素點(diǎn)去研究,因?yàn)?/p>

我們需要去取平均值,然后當(dāng)做中心點(diǎn),對(duì)行數(shù)還有列數(shù)具有像素點(diǎn)取平均值,而對(duì)于

邊緣的像素點(diǎn)可以只取圖像內(nèi)存的領(lǐng)域點(diǎn)像素均值。

3.3圖像標(biāo)注

本文使用LabelImg為yolov5算法構(gòu)建圖像數(shù)據(jù)集,保存格式為yolov5算法可供識(shí)別

的txt文本格。在標(biāo)注過程中,需要注意的是要確保準(zhǔn)確地標(biāo)注口罩目標(biāo)的邊界框,并為

每個(gè)目標(biāo)制定正確的類別,本次標(biāo)準(zhǔn)將數(shù)據(jù)集分為兩類,分別是mask和nomask,具體操

作如圖所示:

圖3-5LabelImg操作窗口

打開LabelImg操作窗口后,以上是具體的操作模塊功能介紹,本文需要對(duì)口罩?jǐn)?shù)據(jù)集

進(jìn)行標(biāo)注,打開數(shù)據(jù)集文件夾,導(dǎo)入圖片,直接按W鍵可以直接產(chǎn)生標(biāo)注框,彈窗中填上

信息,如圖3-6所示,標(biāo)注信息為mask:

13

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖3-6LabelImg標(biāo)注

4、模型構(gòu)建及評(píng)估分析

本章將會(huì)從模型的選擇,到模型參數(shù)調(diào)整以及訓(xùn)練過程注意展示,最開始需要在github

中下載yolov5模型,如圖4-7所示:

圖4-1模型下載

Yolov5的項(xiàng)目目錄結(jié)構(gòu)主要需要修改的是data文件夾、utils文件夾以及models文件夾,

其中voc.yaml中可以修改nc類別參數(shù),指定識(shí)別標(biāo)記,detect.py文件夾可修改運(yùn)行數(shù)據(jù)

集、weight等,部分目錄結(jié)構(gòu)如圖4-8所示:

圖4-2模型結(jié)構(gòu)

下載完成后,在anaconda中安裝運(yùn)行環(huán)境,環(huán)境如圖3-9所示:

14

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖4-3運(yùn)行環(huán)境

運(yùn)行環(huán)境搭建好后,在yolov5中調(diào)整模型配置文件,打開voc.yaml,其中定義了模型

的結(jié)構(gòu)和超參數(shù)。根據(jù)數(shù)據(jù)種類和錨框大小進(jìn)行調(diào)整,以下是參數(shù)詳解:

(1)nc參數(shù):指定目標(biāo)類別的數(shù)量,包括佩戴口罩和不佩戴口罩的人臉。

(2)anchors參數(shù):YOLOv5使用錨框(anchorbox)來檢測(cè)不同尺寸的物體。你可

以根據(jù)口罩的大小調(diào)整錨框的尺寸,以便更好地適應(yīng)口罩的檢測(cè)。

(3)weights參數(shù):指定預(yù)訓(xùn)練模型的權(quán)重文件路徑。從預(yù)訓(xùn)練的YOLOv5模型中

加載權(quán)重,然后在該基礎(chǔ)上進(jìn)行微調(diào)。

如圖3-10所示調(diào)整識(shí)別的nc值,制定目標(biāo)識(shí)別種類和對(duì)應(yīng)的標(biāo)記。

圖4-4類別調(diào)整

如圖3-11所示,修改detect.py文件中的weights參數(shù),將模型指定為yolov5模型,修改data

參數(shù)為mask數(shù)據(jù)集。

圖4-5模型、數(shù)據(jù)集更改

其中activations.py中定義了模型的激活函數(shù),如圖所示定義了Silu和mish激活函

數(shù),使用mish激活函數(shù),是由于它有一種具有連續(xù)可導(dǎo)特性的非線性函數(shù)。與傳統(tǒng)的

ReLU激活函數(shù)相比,mish激活函數(shù)具有更寬的“平臺(tái)”區(qū)域,這意味著它可以更好地保

留輸入的絕對(duì)值較大的特征信息,對(duì)于口罩識(shí)別而言,可以隨著目標(biāo)的位置、大小和形

15

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

狀等特征的不同尺度發(fā)生變化,引入激活函數(shù)可以使yolov5模型具有更強(qiáng)的非線性擬合

能力,部分代碼如圖4-12所示:

圖4-6激活參數(shù)修改

使用pycharm直接對(duì)yolov5模型進(jìn)行訓(xùn)練,為了確保模型可以在訓(xùn)練之后仍保持校

準(zhǔn)的檢測(cè)性,所以本系統(tǒng)的檢測(cè)我們選取真實(shí)人臉作為訓(xùn)練樣本,通過對(duì)收集到的圖片

進(jìn)行分類,標(biāo)注時(shí)對(duì)人臉進(jìn)行框選標(biāo)注,講標(biāo)注分為戴口罩和不戴口罩兩種類型,并規(guī)

定在本次訓(xùn)練中模型訓(xùn)練集和訓(xùn)練圖片數(shù)量四比一,因此在選取的四千張照片之中,

3200張為訓(xùn)練集,800張為測(cè)試集。

圖4-7劃分?jǐn)?shù)據(jù)集

在對(duì)模型調(diào)整,數(shù)據(jù)集劃分完畢后,設(shè)置提取特征的訓(xùn)練參數(shù)。該模型共訓(xùn)練100

次,分為兩部分進(jìn)行訓(xùn)練。前期凍結(jié)主干網(wǎng)絡(luò)訓(xùn)練50次,不訓(xùn)練主干網(wǎng)絡(luò)只訓(xùn)練后面檢

16

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

測(cè)層,主干網(wǎng)絡(luò)是用來提取特征,凍結(jié)主干網(wǎng)絡(luò)進(jìn)行訓(xùn)練可以加快訓(xùn)練速度,后期50次

包括主干網(wǎng)絡(luò)全部訓(xùn)練。

訓(xùn)練前期50次設(shè)置學(xué)習(xí)率為0.001,動(dòng)因子為0.95,每學(xué)習(xí)一次學(xué)習(xí)率衰減0.95,

學(xué)習(xí)率逐漸下降有利于進(jìn)行收斂。

對(duì)口罩是否佩戴識(shí)別要分為兩步,分類與定位,分類就是利用算法遍歷圖片,判斷

其中的對(duì)象是不是包含我們要找的人臉。進(jìn)而將一張圖片到多層卷積神經(jīng)網(wǎng)絡(luò),之后會(huì)

得到一個(gè)結(jié)果即特征向量,同時(shí)反饋給softmax模塊,來對(duì)于圖片類型做一預(yù)測(cè)。

判斷出圖片類型之后就要對(duì)圖片中的目標(biāo)人臉進(jìn)行定位。在口罩佩戴檢測(cè)問題中,

一張圖片可以含有多個(gè)目標(biāo),并且單張圖片中可能會(huì)有多個(gè)不同分類的目標(biāo)。

對(duì)于數(shù)據(jù)的處理之中,可以讓神經(jīng)網(wǎng)絡(luò)再次多輸出幾個(gè),形成多重結(jié)果,首先輸出

一個(gè)邊界框,(xmin,ymin)和(xmax,ymax),圖片中的每個(gè)人臉都分別對(duì)應(yīng)著是兩個(gè)

坐標(biāo),這樣就可以判斷出每張圖片中目標(biāo)人臉的數(shù)量然后對(duì)其進(jìn)行定位。

圖4-8前期訓(xùn)練設(shè)置

訓(xùn)練后期50次設(shè)置學(xué)習(xí)率為0.0001,動(dòng)因子為0.95,每學(xué)習(xí)一次學(xué)習(xí)率衰減0.95。

17

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖4-9后期訓(xùn)練設(shè)置

圖4-10模型訓(xùn)練過程

如圖4-11為模型訓(xùn)練過程,每張圖片的識(shí)別速度平均為0.2s,識(shí)別速度較快,在模

型訓(xùn)練完畢后模型run文件夾下自動(dòng)生成了loss、map和ap曲線的數(shù)據(jù)圖,以下將解釋

數(shù)據(jù)圖的具體含義。

圖4-11訓(xùn)練和驗(yàn)證的loss曲線

如上圖loss曲線是訓(xùn)練過程中損失函數(shù)的變化情況的可視化表現(xiàn),上圖中測(cè)試集和

驗(yàn)證集的損失都較小,可以看到準(zhǔn)確率逐漸提高并基本達(dá)到穩(wěn)定。

18

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖4-12測(cè)試集的map曲線

AP曲線是衡量訓(xùn)練出來的網(wǎng)絡(luò)模型在每個(gè)類別上的好與壞,這兩個(gè)AP曲線分別表

示每次測(cè)試中單個(gè)類別NoMask和Mask的正確率,是選取該模型中最好的模型繪制出來

的曲線圖。

圖4-13NoMask的AP曲線

map是衡量訓(xùn)練之后的網(wǎng)絡(luò)模型在所有類別上的好與壞,兩個(gè)AP取平均值即為該模

型測(cè)試的正確率map??梢钥吹剑?jīng)過訓(xùn)練之后該模型的正確率已經(jīng)可以達(dá)到91.35%。

圖4-14模型的map值

5、模型應(yīng)用

在進(jìn)行了最終的實(shí)驗(yàn)過后實(shí)現(xiàn)效果如圖所示,對(duì)于佩戴了口罩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論