基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)

上傳人：1*** IP屬地：浙江上傳時(shí)間：2024-12-09 格式：PDF 頁數(shù)：23 大?。?.16MB 積分：11 舉報(bào) 版權(quán)申訴

基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)_第2頁

基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)_第3頁

基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)_第4頁

基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)_第5頁

已閱讀5頁，還剩18頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

1、引言...........................................................................................................................................1

1.1項(xiàng)目背景...............................................................................................................................1

1.2開發(fā)環(huán)境與工具..................................................................................................................2

1.2.1Python簡介....................................................................................................................2

1.2.2pytorch簡介...................................................................................................................2

1.2.3pycharm簡介.................................................................................................................3

1.2.4Python第三方庫簡介....................................................................................................4

2、需求分析...................................................................................................................................4

2.1可行性需求分析..................................................................................................................4

2.2數(shù)據(jù)采集功能分析..............................................................................................................5

2.3關(guān)鍵技術(shù)分析......................................................................................................................6

2.3.1目標(biāo)檢測(cè)........................................................................................................................6

2.3.2YOLOv5算法.................................................................................................................7

3、系統(tǒng)實(shí)現(xiàn)...................................................................................................................................9

3.1圖像采集...............................................................................................................................9

3.2圖像預(yù)處理.........................................................................................................................10

3.2.1彩色直方圖均衡..........................................................................................................10

3.2.2灰度處理......................................................................................................................11

3.2.3平滑處理......................................................................................................................12

3.3圖像標(biāo)注.............................................................................................................................13

4、模型構(gòu)建及評(píng)估分析.............................................................................................................14

5、模型應(yīng)用.................................................................................................................................19

6、總結(jié).........................................................................................................................................20

參考文獻(xiàn).......................................................................................................................................22

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)

1、引言

1.1項(xiàng)目背景

隨著現(xiàn)代化的發(fā)展，人們生活節(jié)奏越來越快，可以通過圖像進(jìn)行交流。從用戶的角度

來看，圖像不受當(dāng)?shù)卣Z言等因素的限制，能夠更好地表達(dá)和傳達(dá)人們的情感信息，可以作

為快速表達(dá)的載體。對(duì)我們來說，編輯文本是很容易的，但是圖像中傳遞的內(nèi)容和信息非

常大。因此，如何方便、有效地找到關(guān)鍵信息并利用圖像成為圖像處理領(lǐng)域的一個(gè)關(guān)鍵研

究問題。近年來，由于其在場(chǎng)景中的廣泛應(yīng)用，圖像識(shí)別成為圖像研究領(lǐng)域的一個(gè)熱點(diǎn)。

在畜牧業(yè)中，我們可以通過監(jiān)測(cè)牲畜的生長狀況、活樁的形狀和形狀來判斷，定期定量喂

養(yǎng)牲畜，監(jiān)測(cè)其生長發(fā)育情況。在工業(yè)上，關(guān)鍵問題可以通過圖像識(shí)別來解決。在醫(yī)學(xué)上，

高清圖像可以用來掃描身體的各個(gè)部位。此外，圖像在日常活動(dòng)中也起著至關(guān)重要的作用，

如高速列車安檢中的人臉識(shí)別，以及機(jī)上乘客的身份信息；平日停車時(shí)，采用車牌識(shí)別技

術(shù)進(jìn)入停車場(chǎng)；申請(qǐng)身份證時(shí)，每個(gè)公民都會(huì)輸入自己的指紋信息，以便將來進(jìn)行安全驗(yàn)

證?？傊?，圖像在我們的日常生活中是不可或缺的。利用傳統(tǒng)方法或深度學(xué)習(xí)方法快速有

效地識(shí)別圖像和提取顏色特征信息具有重要意義。

在機(jī)器視覺中，圖像識(shí)別是一個(gè)關(guān)鍵問題。圖像識(shí)別的精度主要取決于圖像關(guān)鍵部位

的定位精度。首先，圖像處理是圖像預(yù)處理。經(jīng)過預(yù)處理后的圖像特征提取算法有sift、LBP

和Haar。通過一系列的步驟，我們可以準(zhǔn)確地識(shí)別圖像的內(nèi)容。獲取圖像的方法有很多種，

但我們必須利用攝影工具將采集到的圖像數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫中以備不時(shí)之需，而對(duì)受損圖

像的處理就是對(duì)圖像中我們需要的圖像進(jìn)行切割，以確定其統(tǒng)一的格式和大小。對(duì)于圖像

質(zhì)量較差的圖像，可以對(duì)圖像進(jìn)行去噪、增強(qiáng)和一系列的預(yù)處理，以方便以后的使用。獲

取完整的特征信息是反映用戶需求、服務(wù)于整個(gè)行業(yè)的關(guān)鍵，因此這一步是圖像識(shí)別的基

礎(chǔ)過程，細(xì)化來說就是先要提取需要去識(shí)別的圖像的特征，然后再利用分類器來把相同特

征的歸為一類，實(shí)現(xiàn)分組，從而實(shí)現(xiàn)對(duì)圖像的識(shí)別。

人工智能和機(jī)器學(xué)習(xí)的發(fā)展也為圖像識(shí)別提供了極好的資源。機(jī)器學(xué)習(xí)就是讓機(jī)器擁

有與人類相同的大腦，使機(jī)器能夠獨(dú)立地學(xué)習(xí)和分析問題。人類知識(shí)的獲得是一個(gè)漫長而

反復(fù)的過程。在人類進(jìn)化的過程中，人們通過學(xué)習(xí)和理解知識(shí)來理解自己需要獲得的東西。

通過不斷的實(shí)踐，人們可以獲得相關(guān)的技能，并分析和總結(jié)在這個(gè)過程中獲得的經(jīng)驗(yàn)。機(jī)

器學(xué)習(xí)類似于人腦的學(xué)習(xí)，使機(jī)器學(xué)習(xí)不再是科幻電影的場(chǎng)景。人類通過眼睛捕捉周圍的

所有信息，并將視網(wǎng)膜成像傳輸?shù)酱竽X，獲得相關(guān)的圖像特征。機(jī)器視覺就是通過各種設(shè)

備獲取相關(guān)的圖像。經(jīng)過特征提取，機(jī)器可以通過學(xué)習(xí)識(shí)別相關(guān)對(duì)象，并通過計(jì)算機(jī)或音

頻設(shè)備顯示學(xué)習(xí)的內(nèi)容。分類器訓(xùn)練是機(jī)器學(xué)習(xí)的關(guān)鍵。通過不斷的訓(xùn)練并對(duì)分類器進(jìn)行

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

調(diào)整，得到分類器模型，對(duì)誤差范圍較小的目標(biāo)進(jìn)行識(shí)別。機(jī)器學(xué)習(xí)包括無監(jiān)督學(xué)習(xí)、有

監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)。

而我們清楚的是人臉識(shí)別無論是數(shù)字圖像的處理方面還是在于計(jì)算機(jī)視覺領(lǐng)域的方

面，其地位都是很高的，它能利用攝像機(jī)采集信息，并對(duì)其進(jìn)行檢測(cè)，還能快速識(shí)別出口

罩佩戴情況，所以說該項(xiàng)技術(shù)對(duì)于當(dāng)下疫情控制的意義是非常高的，在該方面的投入也是

非常有必要的有價(jià)值的。面對(duì)突如其來的新一輪肺炎疫情，人們的生活秩序被嚴(yán)重?cái)_亂。

與普通流感不同，這種流行病可以通過人類唾液傳播，并具有很強(qiáng)的感染他人的能力。最

近，面對(duì)疫情，市面上的口罩越來越少。新型冠狀病毒肺炎對(duì)該病的流行尤為重要。能有

效阻斷新型冠狀肺炎病毒的傳播。它能直接從源頭檢查，將人體唾液和氣流從第一道屏障

中隔離出來，有效保護(hù)自己和他人，不傳播病毒。在中國的公共場(chǎng)所必須戴口罩。然而，

在商場(chǎng)、餐廳、地鐵等人員密集場(chǎng)所，應(yīng)對(duì)客流高峰期的措施往往讓人發(fā)自內(nèi)心。一些人

外出時(shí)不愛戴口罩，這給病毒提供了可乘之機(jī)，給自己和他人的生命帶來重大安全隱患。

如果有一套系統(tǒng)，通過對(duì)數(shù)字圖像的采集和識(shí)別，識(shí)別出是否戴口罩的人，并做出相應(yīng)的

預(yù)警和報(bào)警就顯得尤為重要和迫切。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展，基于圖像的面具識(shí)別迅

速引起人們的關(guān)注。

1.2開發(fā)環(huán)境與工具

1.2.1Python簡介

Python由荷蘭數(shù)學(xué)和計(jì)算機(jī)科學(xué)研究學(xué)會(huì)的吉多·范羅蘇姆于1990年代初設(shè)計(jì)，作為

一門叫做ABC語言的替代品。Python提供了高效的高級(jí)數(shù)據(jù)結(jié)構(gòu)，還能簡單有效地面向

對(duì)象編程。Python語法和動(dòng)態(tài)類型，以及解釋型語言的本質(zhì)，使它成為多數(shù)平臺(tái)上寫腳本

和快速開發(fā)應(yīng)用的編程語言，隨著版本的不斷更新和語言新功能的添加，逐漸被用于獨(dú)

立的、大型項(xiàng)目的開發(fā)。

Python解釋器易于擴(kuò)展，可以使用C語言或C++（或者其他可以通過C調(diào)用的語言）

擴(kuò)展新的功能和數(shù)據(jù)類型。Python也可用于可定制化軟件中的擴(kuò)展程序語言。Python豐富

的標(biāo)準(zhǔn)庫，提供了適用于各個(gè)主要系統(tǒng)平臺(tái)的源碼或機(jī)器碼。

1.2.2pytorch簡介

是一個(gè)基于Python的開源機(jī)器學(xué)習(xí)框架，由Facebook的人工智能研究團(tuán)隊(duì)開發(fā)和維

護(hù)。它提供了豐富的工具和庫，用于構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型和進(jìn)行機(jī)器學(xué)習(xí)任務(wù)。

的設(shè)計(jì)理念是動(dòng)態(tài)計(jì)算圖，這意味著你可以使用自然的方式定義和執(zhí)行計(jì)算圖，而不

需要預(yù)先定義靜態(tài)計(jì)算圖的結(jié)構(gòu)。這種靈活性使得模型構(gòu)建和調(diào)試變得更加直觀和方便,的

主要特點(diǎn)包括：

1.動(dòng)態(tài)計(jì)算圖：允許用戶在運(yùn)行時(shí)動(dòng)態(tài)地構(gòu)建、修改和執(zhí)行計(jì)算圖，使得模型構(gòu)建和

調(diào)試更加靈活和直觀。

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

2.自動(dòng)求導(dǎo)：能夠自動(dòng)計(jì)算張量的梯度，大大簡化了反向傳播算法的實(shí)現(xiàn)。這使得模

型訓(xùn)練過程更加便捷和高效。

3.強(qiáng)大的GPU加速支持：針對(duì)GPU進(jìn)行了優(yōu)化，可以充分利用GPU的并行計(jì)算能

力，加速深度學(xué)習(xí)任務(wù)的訓(xùn)練和推理。

4.大型社區(qū)支持：擁有龐大的開源社區(qū)，提供了豐富的文檔、教程和示例代碼。這使

得學(xué)習(xí)和使用變得更加容易，同時(shí)也能夠從社區(qū)中獲取支持和解決問題。

5.兼容性和可擴(kuò)展性：與其他Python庫（如NumPy）和常見的機(jī)器學(xué)習(xí)庫（如SciPy

和Scikit-learn）兼容性良好。此外，還提供了豐富的擴(kuò)展庫和工具，可以滿足不同任務(wù)和

需求的擴(kuò)展性需求。

總的來說，是一個(gè)功能強(qiáng)大、易用且靈活的機(jī)器學(xué)習(xí)框架，廣泛應(yīng)用于學(xué)術(shù)界和工業(yè)

界。它的設(shè)計(jì)理念和特點(diǎn)使得模型構(gòu)建和調(diào)試更加直觀和高效，為深度學(xué)習(xí)任務(wù)提供了便

利和優(yōu)化的解決方案。

1.2.3pycharm簡介

PyCharm是一款由JetBrains開發(fā)的集成開發(fā)環(huán)境（IDE），專門用于Python開發(fā)。它

提供了許多強(qiáng)大的功能和工具，旨在提高開發(fā)者的生產(chǎn)力和代碼質(zhì)量，以下是PyCharm的

一些主要特點(diǎn)和功能：

1.代碼編輯和智能感知：PyCharm具有強(qiáng)大的代碼編輯功能，包括語法高亮、代碼補(bǔ)

全、自動(dòng)縮進(jìn)和錯(cuò)誤檢查等。它還提供了智能感知功能，可以根據(jù)上下文提供代碼建議和

自動(dòng)完成。

2.調(diào)試和測(cè)試：PyCharm內(nèi)置了強(qiáng)大的調(diào)試器，可以幫助開發(fā)者定位和修復(fù)代碼中的

問題。它還支持單元測(cè)試和集成測(cè)試，可以方便地編寫、運(yùn)行和分析測(cè)試用例。

3.項(xiàng)目管理：PyCharm支持多個(gè)項(xiàng)目的管理，可以輕松切換和管理不同的Python項(xiàng)

目。它提供了項(xiàng)目導(dǎo)航、版本控制集成和依賴管理等功能，使得項(xiàng)目開發(fā)更加便捷。

4.版本控制：PyCharm與常見的版本控制系統(tǒng)（如Git、SVN和Mercurial）集成緊密，

可以直接在IDE中進(jìn)行版本控制操作，如提交、拉取和合并代碼等

5.代碼重構(gòu)和分析：PyCharm提供了豐富的代碼重構(gòu)工具，可以幫助開發(fā)者進(jìn)行代碼

重構(gòu)和優(yōu)化，提高代碼的可讀性和維護(hù)性。它還提供了靜態(tài)代碼分析功能，可以幫助檢測(cè)

潛在的錯(cuò)誤和優(yōu)化建議。

6.插件和擴(kuò)展性：PyCharm支持大量的插件和擴(kuò)展，可以根據(jù)需要添加額外的功能和

工具，以滿足特定項(xiàng)目或開發(fā)需求。

總的來說，PyCharm是一個(gè)功能強(qiáng)大、易用且高度可定制的Python開發(fā)環(huán)境，適用于

各種規(guī)模的項(xiàng)目和開發(fā)者。它提供了豐富的功能和工具，幫助開發(fā)者提高開發(fā)效率、減少

錯(cuò)誤，并保持代碼質(zhì)量。

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

1.2.4Python第三方庫簡介

Python是一種非常受歡迎的編程語言，因?yàn)樗子趯W(xué)習(xí)、使用和擴(kuò)展。Python擁有

大量的第三方庫，這些庫可以幫助開發(fā)人員快速、輕松地實(shí)現(xiàn)各種任務(wù)。以下是幾個(gè)重要

的Python第三方庫簡介：

NumPy：NumPy是Python的一個(gè)科學(xué)計(jì)算庫，它提供了高效的多維數(shù)組對(duì)象、各種

派生對(duì)象、快速的數(shù)組操作方法以及大量的工具。

Pandas：Pandas是Python的一個(gè)數(shù)據(jù)處理庫，它提供了靈活和高效的數(shù)據(jù)結(jié)構(gòu)，包

括數(shù)據(jù)幀和面向行和列的數(shù)據(jù)選擇、操作和分組方法。

Matplotlib：Matplotlib是Python的一個(gè)繪圖庫，它提供了創(chuàng)建各種類型圖表和可視

化的工具，包括條形圖、散點(diǎn)圖、區(qū)域圖和等高線圖等。

Scikit-learn：Scikit-learn是Python的一個(gè)機(jī)器學(xué)習(xí)庫，它包含了大量的基本算法和

模型，可以用于分類、回歸和聚類等任務(wù)。

Pytorch：Pytorch是一個(gè)開源的機(jī)器學(xué)習(xí)框架，它由Google開發(fā)，是用于構(gòu)建人工

智能模型的重要工具之一。

Django：Django是Python的一個(gè)Web框架，它提供了一套完整的MVC架構(gòu)、

ORM和模板語言，可以幫助開發(fā)人員快速構(gòu)建復(fù)雜web應(yīng)用程序。

Flask：Flask是Python的另一個(gè)微型Web框架，它提供了一個(gè)靈活的、易于擴(kuò)展

的架構(gòu)，可以用于搭建小型Web應(yīng)用程序和API。

這些Python第三方庫提供了很多功能和工具，可以幫助開發(fā)人員更輕松、高效地進(jìn)

行編程任務(wù)。使用這些庫可以大大提升Python在數(shù)據(jù)處理、科學(xué)計(jì)算、機(jī)器學(xué)習(xí)、Web

開發(fā)等方面的能力。

2、需求分析

2.1可行性需求分析

1.功能需求

2020年新冠肺炎席卷全球，佩戴口罩能夠有效切斷新冠肺炎病毒的傳播途徑，是預(yù)防

感染的有效措施。隨著疫情影響的逐步擴(kuò)大，國內(nèi)公眾場(chǎng)合要求人們需要佩戴口罩，但是

也總有一些人因?yàn)樘厥馇闆r未能佩戴口罩，這有可能會(huì)對(duì)周圍人群的安全造成隱患。特別

是商場(chǎng)、餐飲、地鐵、車站等人員密集型的場(chǎng)所，由工作人員人工檢測(cè)體溫與監(jiān)督乘客口

罩佩戴情況，在人流量高峰時(shí)段的檢測(cè)往往應(yīng)接不暇，經(jīng)常會(huì)出現(xiàn)大量人力的浪費(fèi)，并且

吃力不討好，效率仍然低下。

隨著時(shí)代的快速發(fā)展，計(jì)算機(jī)視覺技術(shù)使得我們攝像機(jī)與計(jì)算機(jī)合而為一，一體化的

分析處理，快速高效的實(shí)現(xiàn)對(duì)人員來往是否佩戴口罩的檢測(cè)。本系統(tǒng)可以自動(dòng)準(zhǔn)確且快速

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

地識(shí)別圖片或視頻中人物是否佩戴口罩，有著重要的應(yīng)用場(chǎng)景和市場(chǎng)前景。

2.性能需求

（1）系統(tǒng)在因特網(wǎng)正常狀況下全天候提供服務(wù)，用戶可以隨時(shí)使用該系統(tǒng)進(jìn)行檢測(cè)。

（2）檢測(cè)速度要盡可能的快并且檢測(cè)結(jié)果盡可能準(zhǔn)確。

（3）系統(tǒng)的安全性、可操作性、可維護(hù)性要較為完善。

3.運(yùn)行需求

本系統(tǒng)采用了YOLOv5模型，Darknet深度學(xué)習(xí)框架，操作系統(tǒng)為Windows10，環(huán)境

為。這些技術(shù)目前都已經(jīng)很成熟，而且技術(shù)含量很高，使用起來很方便，安全性也有較大

保障。目前高性能的網(wǎng)絡(luò)組建大量涌現(xiàn)，他們速度快、用量大、可靠性高、價(jià)格低，完全

可以滿足本系統(tǒng)的需要。

2.2數(shù)據(jù)采集功能分析

在使用本系統(tǒng)時(shí)，用戶首先需要選擇本地圖片或視頻并傳入系統(tǒng)，系統(tǒng)對(duì)圖片進(jìn)行

預(yù)處理后再對(duì)目標(biāo)人臉的區(qū)域進(jìn)行定位，然后對(duì)定位后的人臉區(qū)域進(jìn)行是否佩戴口罩的

識(shí)別，最后將識(shí)別結(jié)果輸出。

根據(jù)上述描述，本系統(tǒng)應(yīng)具備以下四個(gè)功能：

（1）圖片選擇：提供從本地文件夾中選擇待識(shí)別圖片的功能。用戶可以從本地文件

夾中獲取想要識(shí)別的圖片并傳入系統(tǒng)。

（2）圖像預(yù)處理：提供對(duì)傳入的圖片進(jìn)行預(yù)處理的功能。該功能可以對(duì)傳入的圖片

進(jìn)行灰度校正和平滑處理，為之后對(duì)圖像進(jìn)行進(jìn)一步分析和識(shí)別做準(zhǔn)備。

（3）圖像識(shí)別：該功能是對(duì)已經(jīng)預(yù)計(jì)處理的圖像進(jìn)行再一次進(jìn)一步的分析，并通過

如此方式對(duì)于圖像特征提取，對(duì)于目標(biāo)進(jìn)行定位以及預(yù)處理之后的圖像進(jìn)行進(jìn)一步分析，

對(duì)圖像進(jìn)行特征提取、目標(biāo)定位和目標(biāo)識(shí)別。

（4）結(jié)果輸出：該功能可以將已經(jīng)完成識(shí)別的圖像的結(jié)果進(jìn)行輸出。

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖2-1系統(tǒng)功能結(jié)構(gòu)圖

2.3關(guān)鍵技術(shù)分析

2.3.1目標(biāo)檢測(cè)

1.目標(biāo)檢測(cè)的概念

目標(biāo)檢測(cè)又被我們叫做目標(biāo)提取，這是一種基于目標(biāo)的幾何還有統(tǒng)計(jì)特征的圖像分割

方法。

它的作用在于，將原本需要兩步的目標(biāo)分割還有識(shí)別合二為一，所以其以準(zhǔn)確以及實(shí)

時(shí)著稱，特別是在許多復(fù)雜的場(chǎng)景之中，因?yàn)槲覀冃枰瑫r(shí)對(duì)多個(gè)目標(biāo)進(jìn)行相應(yīng)的檢測(cè)處

理，它所具備的自動(dòng)提取目標(biāo)以及自動(dòng)識(shí)別格外重要。在對(duì)國內(nèi)外諸多成果的研究中，

我們將目標(biāo)檢測(cè)的算法通常分為兩類，第一種是較為傳統(tǒng)的目標(biāo)檢測(cè)算法，第二種就是我

們要介紹到的基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法，目前后者的用途十分廣泛該算法又分為One-

Stage目標(biāo)檢測(cè)算法和Two-Stage目標(biāo)檢測(cè)算法。

2.傳統(tǒng)目標(biāo)檢測(cè)算法

（1）對(duì)于傳統(tǒng)的目標(biāo)檢測(cè)方法，一般工作流程分為三個(gè)階段：即首先給定圖像選取

候選區(qū)域，選擇過后再提取相應(yīng)特征，之后再用以及訓(xùn)練好的分類器來對(duì)于各個(gè)數(shù)據(jù)進(jìn)行

分類。這三個(gè)階段細(xì)化來說如下。

區(qū)域選擇：即定位，我們?cè)诜治鎏幚碇笆紫葢?yīng)該確定位置，因?yàn)槟繕?biāo)可能出現(xiàn)于任

何位置，且形狀比例會(huì)相應(yīng)的產(chǎn)生一些變化，所以我們采用滑動(dòng)窗口來保證將圖像所有位

置都有觀測(cè)到，簡單來說，就是窮舉法，這種方法可以完成任務(wù)，但是這種方法效率不高，

且時(shí)間浪費(fèi)的太多，且多了許多不必要的的多于窗口，這對(duì)于后續(xù)工作的進(jìn)行產(chǎn)生了影響，

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

也導(dǎo)致了整體系統(tǒng)的效率被拖慢。

（2）特征提?。阂?yàn)橛^測(cè)目標(biāo)不會(huì)相同，多種多樣，并且位置角度都有變化，所以

一個(gè)完美程序是特別困難的。但是對(duì)于目標(biāo)特征的提取又是至關(guān)重要的，它直接決定系統(tǒng)

的結(jié)果是否準(zhǔn)確，所以重要程度不言而喻。其中，SIFT、HOG等是這個(gè)階段常用的特征。

（3）分類：即根據(jù)第二步所提取出來具有相似特征的目標(biāo)歸為一類，實(shí)現(xiàn)對(duì)數(shù)據(jù)的

分類。目前市面上的分類器主要包括SVM，AdaBoost等。

2.3.2YOLOv5算法

YOLOv5是一種高性能實(shí)時(shí)目標(biāo)檢測(cè)算法，是YOLO系列（YouOnlyLookOnce）的

最新版本。它是由Ultralytics團(tuán)隊(duì)開發(fā)的，旨在提供更快速、更準(zhǔn)確的目標(biāo)檢測(cè)能力。

與之前的版本相比，YOLOv5在模型結(jié)構(gòu)和訓(xùn)練策略上進(jìn)行了一些改進(jìn)和優(yōu)化，以提

高檢測(cè)性能。下面是YOLOv5的一些特點(diǎn)：

1.網(wǎng)絡(luò)結(jié)構(gòu)：YOLOv5采用了一種輕量級(jí)的網(wǎng)絡(luò)結(jié)構(gòu)，由卷積層和池化層組成，通過

多個(gè)不同尺度的特征圖進(jìn)行目標(biāo)檢測(cè)。這種結(jié)構(gòu)能夠在保持準(zhǔn)確性的同時(shí)提供較快的推理

速度。

2.強(qiáng)大的檢測(cè)能力：YOLOv5能夠同時(shí)檢測(cè)多個(gè)目標(biāo)類別，并輸出它們的邊界框和類

別概率。它具有較高的準(zhǔn)確性和召回率，能夠有效地處理復(fù)雜場(chǎng)景下的目標(biāo)檢測(cè)任務(wù)。

3.多尺度訓(xùn)練：YOLOv5采用了一種多尺度訓(xùn)練策略，通過在不同尺度下訓(xùn)練模型，

提高了模型對(duì)不同大小目標(biāo)的檢測(cè)能力。這使得模型在處理大尺度和小尺度目標(biāo)時(shí)都能取

得較好的效果。

4.數(shù)據(jù)增強(qiáng)和數(shù)據(jù)集增強(qiáng)：YOLOv5使用了多種數(shù)據(jù)增強(qiáng)技術(shù)，如隨機(jī)裁剪、色彩擾

動(dòng)和圖像翻轉(zhuǎn)等，以增加訓(xùn)練數(shù)據(jù)的多樣性和數(shù)量。此外，還提供了數(shù)據(jù)集增強(qiáng)工具，可

以通過合成數(shù)據(jù)增加訓(xùn)練樣本的豐富性。

5.高度可定制：YOLOv5提供了豐富的配置選項(xiàng)，可以根據(jù)任務(wù)需求進(jìn)行靈活的模型

設(shè)置和訓(xùn)練。用戶可以選擇不同的網(wǎng)絡(luò)尺寸、訓(xùn)練參數(shù)和推理設(shè)置，以滿足特定的目標(biāo)檢

測(cè)需求。

總的來說，YOLOv5是一種高性能的實(shí)時(shí)目標(biāo)檢測(cè)算法，具有較快的推理速度和較高

的檢測(cè)準(zhǔn)確性。它在多尺度訓(xùn)練、數(shù)據(jù)增強(qiáng)和模型定制等方面提供了更多的靈活性和優(yōu)化

選項(xiàng)，適用于各種實(shí)際場(chǎng)景中的目標(biāo)檢測(cè)任務(wù)。

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

YOLO網(wǎng)絡(luò)基于回歸算法，在很復(fù)雜的運(yùn)算數(shù)據(jù)面前也能發(fā)揮很好的效果，實(shí)際運(yùn)

用效果也是如此，該算法去的了不小的成就，獲得了可觀的效果。一般情況下YOLO網(wǎng)

絡(luò)將輸入的圖片劃分成大小為32*32的網(wǎng)格，檢測(cè)目標(biāo)口罩，只要口罩的中心位置落入

某個(gè)網(wǎng)格中，則立即由該網(wǎng)格負(fù)責(zé)檢測(cè)目標(biāo)。同樣的檢測(cè)地點(diǎn)檢測(cè)對(duì)象，該算法比較其

它任何算法都要更具優(yōu)勢(shì)，優(yōu)勢(shì)就在于其多尺度預(yù)測(cè)算法，特別是實(shí)時(shí)性方面，更加凸

現(xiàn)了該中算法的強(qiáng)大，更好地滿足人流量較大的需要。

Yolov5算法是在原有YOLO目標(biāo)檢測(cè)架構(gòu)的基礎(chǔ)上，采用了近些年CNN領(lǐng)域中最

優(yōu)秀的優(yōu)化策略，從數(shù)據(jù)處理、主干網(wǎng)絡(luò)、網(wǎng)絡(luò)訓(xùn)練、激活函數(shù)、損失函數(shù)等各個(gè)方面

都有著不同程度的優(yōu)化。

（1）Yolov5的貢獻(xiàn)

①開發(fā)了一個(gè)高效而強(qiáng)大的模型，使得任何人都可以使用一張1080Ti或者2080Ti

GPU去訓(xùn)練一個(gè)超級(jí)快速和精確的目標(biāo)檢測(cè)器。

②驗(yàn)證了一系列state-of-the-art的目標(biāo)檢測(cè)器訓(xùn)練方法的影響。

③修改了state-of-the-art方法，使得他們?cè)谑褂脝蝹€(gè)GPU進(jìn)行訓(xùn)練時(shí)更加有效和適

配，包括CBN，PAN，SAM等。

（2）Yolov5的訓(xùn)練方法

①Bagoffreebies：只改變訓(xùn)練策略或者只增加訓(xùn)練成本，比如數(shù)據(jù)增強(qiáng)。

②Bagofspecials：插件模塊和后處理方法，它們僅僅增加一點(diǎn)推理成本，但是可以

極大地提升目標(biāo)檢測(cè)的精度。

（3）Yolov5的網(wǎng)絡(luò)結(jié)構(gòu)

Yolov5目標(biāo)檢測(cè)算法作為該算法的第四代，相比第三代，在網(wǎng)絡(luò)結(jié)構(gòu)上比更復(fù)雜，

因?yàn)槠鋬?nèi)部使用了極多的訓(xùn)練模式來提升整體神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率，Yolov5通過引入

Mosaic數(shù)據(jù)增強(qiáng)方法，并選擇最優(yōu)超參數(shù)，使用GA算法，進(jìn)而對(duì)現(xiàn)有的方法進(jìn)行改

進(jìn)，并對(duì)其不斷進(jìn)行訓(xùn)練，使得其具有更為低的訓(xùn)練門檻，使其下限更低，更好上手，

能夠在GPU資源有限的條件下盡可能的得到更加好的結(jié)果。在運(yùn)算過程中Mosaic數(shù)據(jù)增

強(qiáng)方法每次隨機(jī)讀取四張圖片，并對(duì)這四張張照片進(jìn)行一系列操作，翻轉(zhuǎn)、縮放等操

作，實(shí)現(xiàn)將四張圖合四為一，這種將四張圖片組合為一張圖片的方法可以更加豐富檢測(cè)

物體的背景。Yolov5的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示，主干網(wǎng)絡(luò)為CSPDarknet53，附加模塊設(shè)

置為SPPNeck，另外特征融合模塊使用PANet，使用第三代即,YOLOv3作為Head。在這

里面的Darknet53包含了5個(gè)大殘差塊，這5個(gè)大殘差塊包含的小殘差單元個(gè)數(shù)分別為

1、2、8、8、4。CSPDarknet53在Darknet53的每個(gè)大殘差塊上加上了CSPNet（Cross

StagePartialNetwork），并在后面通過梯度的變化，集成到特征圖中，同時(shí)將特征圖一分

為二，一部分進(jìn)行卷積操作，另一部分與上一次的卷積結(jié)果進(jìn)行結(jié)合。最后在目標(biāo)檢測(cè)

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

問題中，CSP可以有效提升CNN的學(xué)習(xí)能力，同時(shí)減少計(jì)算量。PANet充分利用了特

征融合，Yolov5中還將融合的方法由加法改為乘法，使該網(wǎng)絡(luò)能夠得到更加精確的目標(biāo)

檢測(cè)能力。

圖2-2Yolov5網(wǎng)絡(luò)結(jié)構(gòu)圖

3、系統(tǒng)實(shí)現(xiàn)

3.1圖像采集

本系統(tǒng)共爬取了大約5000張圖片作為口罩佩戴檢測(cè)數(shù)據(jù)集，其中佩戴口罩和未佩戴

口罩的圖片數(shù)量基本持平。對(duì)于樣品的圖像，我們進(jìn)行兩類標(biāo)注，一類有口罩，一類未

戴口罩，一共訓(xùn)練集有2200張不同的圖片，驗(yàn)證集是訓(xùn)練集的百分之十。在每一次同時(shí)

數(shù)據(jù)之中，存在著許許多多的不同，口罩角度，顏色各不相同，這樣的訓(xùn)練有利于提升

我們的檢測(cè)佩戴情況的準(zhǔn)確性。

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖3-1部分圖片展示

圖3-2部分圖片展示

3.2圖像預(yù)處理

圖像預(yù)處理的主要作用包括改善圖像質(zhì)量、突出特征、去除噪聲、調(diào)整尺寸、歸一化

和數(shù)據(jù)增強(qiáng)等。其中，彩色直方圖均衡用于增強(qiáng)對(duì)比度和改善圖像質(zhì)量，灰度處理可以降

低計(jì)算復(fù)雜度并提取圖像特征，平滑處理可以去除圖像中的噪聲。這些預(yù)處理技術(shù)都有助

于提高圖像處理和圖像識(shí)別的準(zhǔn)確性和性能。

3.2.1彩色直方圖均衡

彩色直方圖均衡是一種圖像處理技術(shù)，通過調(diào)整彩色圖像中每個(gè)顏色通道的像素值

分布，實(shí)現(xiàn)對(duì)比度增強(qiáng)、圖像質(zhì)量改善、視覺感知提升和圖像特征增強(qiáng)的效果。它能夠

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

使圖像亮度范圍更均勻地覆蓋整個(gè)范圍，突出細(xì)節(jié)，使識(shí)別圖像的邊緣更清晰、自然、

生動(dòng)，提高計(jì)算機(jī)對(duì)圖像的感知和識(shí)別能力。

圖3-3直方圖均衡代碼

圖3-4均衡化后圖片

使用圖片均衡化亮度均衡，口罩邊緣更清晰，更容易被計(jì)算機(jī)識(shí)別。

3.2.2灰度處理

在圖像處理中，處理三個(gè)通道的數(shù)據(jù)會(huì)比較復(fù)雜，因此需要先將圖像變灰，也就是

對(duì)圖像進(jìn)行灰度處理，因?yàn)榛一蟮恼掌梢员M可能的減少原始圖像的數(shù)據(jù)，這樣便可

以減少計(jì)算量，增加計(jì)算精度，灰度處理，簡單來說，就是將各個(gè)像素點(diǎn)的RGB值統(tǒng)一

成同一個(gè)值，從而失去顏色，變?yōu)榛疑?，?jīng)過灰度處理后的圖像將由三通道變?yōu)閱瓮?/p>

道，而單通道的數(shù)據(jù)，處理計(jì)算起來將會(huì)得到極大的簡便。

灰度處理后的圖像可以通過閾值變換轉(zhuǎn)換成黑白二值的圖像信息，也正是通過對(duì)于

灰度圖像二值化處理，所需目標(biāo)的輪廓便可以得到凸出。

灰度閾值變換的基本公式為：

0xT

f(x)

255xT

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

其中T為指定的閾值。

類似于符號(hào)函數(shù)，將灰度大于閾值的部分設(shè)置為最大灰度，灰度小于閾值的部分設(shè)

置為最小灰度。經(jīng)過閥值化的灰度值僅有兩個(gè)取值，最小值0與最大值255。閾值變換將

圖像內(nèi)容劃分為關(guān)心與不關(guān)心的2個(gè)部分，從復(fù)雜背景中可直接提取出感興趣的，主要

用于對(duì)圖像的分割。

二值化處理的灰度圖像，即就是將像素點(diǎn)閾值變換，講灰度設(shè)置到0或255，這樣的

設(shè)置，也就可以使整個(gè)圖像會(huì)出現(xiàn)明顯的黑白效果，也就是將256個(gè)亮度等級(jí)的灰度圖

像，通過適當(dāng)?shù)拈撝颠x取，得到可以明顯顯出所需物體的二值化圖像，同時(shí)在數(shù)字化處

理之中，二值化圖像的圖像整體，以及局部特征，我們都知道，二值圖像在數(shù)字處理中

的的地位是很高的，特別是實(shí)用的圖像處理，在當(dāng)下的生產(chǎn)生活，通過二值化圖像來處

理信息是很廣泛的，但要進(jìn)行二值化處理，我們就需要先將灰度圖像二值化，得到二值

化圖像，因?yàn)槎祷瘓D像才能進(jìn)行二值化處理，因?yàn)閳D像性質(zhì)只與灰度閾值點(diǎn)位置有

關(guān)，不涉及像素多級(jí)值，這就使的對(duì)于圖像的處理變得簡單，，并且壓縮量少，占據(jù)空

間更小，而我們要得到滿足條件的理想型二值化圖像，我們通常都是采用封閉，以及聯(lián)

通的邊界定義不重合的區(qū)域，所有的灰度大于或等于閾值的物體，即為我們所需要的特

定物體，即將其灰度值表示為225，除此之外的的像素點(diǎn)都被排除在外，灰度值即為零，

表示為區(qū)域值之外是背景等區(qū)域，但如果特定物體內(nèi)部有著均勻的灰度值，并且處于一

個(gè)具有其他等級(jí)灰度值的均勻背景，使用閾值法就可以得到明顯的分割成果，如果物體

與背景灰度差值較大，即可以之間轉(zhuǎn)化為灰度的差值，利用灰度閾值選取分割，動(dòng)態(tài)閾

值調(diào)節(jié)來幫助觀測(cè)。

而對(duì)于經(jīng)過處理的灰度圖像，是沒有固定的算法的，根據(jù)圖像區(qū)域之中的不同目標(biāo)

有著不同算法，在實(shí)際之中的操作中，根據(jù)不同灰度我們能進(jìn)行舍入處理，必須選擇為

灰度閾值中值等，但是這種處理的范圍過于寬廣，因?yàn)闆]有根基圖像，所以效果不是很

理想。

3.2.3平滑處理

圖像在生成、獲取、傳輸?shù)冗^程中，由于受到光照、成像系統(tǒng)功能和噪聲等許多因

素的影響，往往會(huì)造成對(duì)比度偏低、清晰度下降以及產(chǎn)生干擾噪聲等結(jié)果。為了改善圖

像質(zhì)量，需要利用圖像增強(qiáng)技術(shù)獲得更便于后續(xù)分析和識(shí)別的圖像。圖像的平滑處理是

在盡量保留圖像原有信息的情況下，過濾圖像內(nèi)部的噪聲。通過圖像平滑處理，可以有

效過濾掉圖像內(nèi)的噪聲信息。

圖像平滑處理的基本原理是對(duì)圖像中與周圍像素點(diǎn)的像素差異值較大的像素點(diǎn)進(jìn)行

處理，將其值調(diào)整為周圍像素點(diǎn)像素值的近似值。

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖像平滑處理的方法包括均值濾波、方框?yàn)V波、高斯濾波、中值濾波、雙邊濾波和

2D濾波等。

在該系統(tǒng)的均值處理方法之中，我們采取均值濾波方法方法來對(duì)圖像進(jìn)行平滑處

理。均值濾波指的是當(dāng)前像素點(diǎn)的周圍N*N個(gè)像素值的均值來代替當(dāng)前像素點(diǎn)，而通過

這樣的方法來歷遍每一個(gè)像素點(diǎn)，這樣窮舉之后，即可以完成對(duì)于整個(gè)圖像的均值濾

波。

而在于數(shù)據(jù)處理之前，我們有必要先去考慮對(duì)于周圍的多少個(gè)像素點(diǎn)去研究，因?yàn)?/p>

我們需要去取平均值，然后當(dāng)做中心點(diǎn)，對(duì)行數(shù)還有列數(shù)具有像素點(diǎn)取平均值，而對(duì)于

邊緣的像素點(diǎn)可以只取圖像內(nèi)存的領(lǐng)域點(diǎn)像素均值。

3.3圖像標(biāo)注

本文使用LabelImg為yolov5算法構(gòu)建圖像數(shù)據(jù)集，保存格式為yolov5算法可供識(shí)別

的txt文本格。在標(biāo)注過程中，需要注意的是要確保準(zhǔn)確地標(biāo)注口罩目標(biāo)的邊界框，并為

每個(gè)目標(biāo)制定正確的類別，本次標(biāo)準(zhǔn)將數(shù)據(jù)集分為兩類，分別是mask和nomask，具體操

作如圖所示：

圖3-5LabelImg操作窗口

打開LabelImg操作窗口后，以上是具體的操作模塊功能介紹，本文需要對(duì)口罩?jǐn)?shù)據(jù)集

進(jìn)行標(biāo)注，打開數(shù)據(jù)集文件夾，導(dǎo)入圖片，直接按W鍵可以直接產(chǎn)生標(biāo)注框，彈窗中填上

信息，如圖3-6所示，標(biāo)注信息為mask：

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖3-6LabelImg標(biāo)注

4、模型構(gòu)建及評(píng)估分析

本章將會(huì)從模型的選擇，到模型參數(shù)調(diào)整以及訓(xùn)練過程注意展示，最開始需要在github

中下載yolov5模型，如圖4-7所示：

圖4-1模型下載

Yolov5的項(xiàng)目目錄結(jié)構(gòu)主要需要修改的是data文件夾、utils文件夾以及models文件夾，

其中voc.yaml中可以修改nc類別參數(shù)，指定識(shí)別標(biāo)記，detect.py文件夾可修改運(yùn)行數(shù)據(jù)

集、weight等，部分目錄結(jié)構(gòu)如圖4-8所示：

圖4-2模型結(jié)構(gòu)

下載完成后，在anaconda中安裝運(yùn)行環(huán)境，環(huán)境如圖3-9所示：

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖4-3運(yùn)行環(huán)境

運(yùn)行環(huán)境搭建好后，在yolov5中調(diào)整模型配置文件，打開voc.yaml，其中定義了模型

的結(jié)構(gòu)和超參數(shù)。根據(jù)數(shù)據(jù)種類和錨框大小進(jìn)行調(diào)整，以下是參數(shù)詳解：

（1）nc參數(shù)：指定目標(biāo)類別的數(shù)量，包括佩戴口罩和不佩戴口罩的人臉。

（2）anchors參數(shù)：YOLOv5使用錨框（anchorbox）來檢測(cè)不同尺寸的物體。你可

以根據(jù)口罩的大小調(diào)整錨框的尺寸，以便更好地適應(yīng)口罩的檢測(cè)。

（3）weights參數(shù)：指定預(yù)訓(xùn)練模型的權(quán)重文件路徑。從預(yù)訓(xùn)練的YOLOv5模型中

加載權(quán)重，然后在該基礎(chǔ)上進(jìn)行微調(diào)。

如圖3-10所示調(diào)整識(shí)別的nc值，制定目標(biāo)識(shí)別種類和對(duì)應(yīng)的標(biāo)記。

圖4-4類別調(diào)整

如圖3-11所示，修改detect.py文件中的weights參數(shù)，將模型指定為yolov5模型，修改data

參數(shù)為mask數(shù)據(jù)集。

圖4-5模型、數(shù)據(jù)集更改

其中activations.py中定義了模型的激活函數(shù)，如圖所示定義了Silu和mish激活函

數(shù)，使用mish激活函數(shù)，是由于它有一種具有連續(xù)可導(dǎo)特性的非線性函數(shù)。與傳統(tǒng)的

ReLU激活函數(shù)相比，mish激活函數(shù)具有更寬的“平臺(tái)”區(qū)域，這意味著它可以更好地保

留輸入的絕對(duì)值較大的特征信息，對(duì)于口罩識(shí)別而言，可以隨著目標(biāo)的位置、大小和形

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

狀等特征的不同尺度發(fā)生變化，引入激活函數(shù)可以使yolov5模型具有更強(qiáng)的非線性擬合

能力，部分代碼如圖4-12所示：

圖4-6激活參數(shù)修改

使用pycharm直接對(duì)yolov5模型進(jìn)行訓(xùn)練，為了確保模型可以在訓(xùn)練之后仍保持校

準(zhǔn)的檢測(cè)性，所以本系統(tǒng)的檢測(cè)我們選取真實(shí)人臉作為訓(xùn)練樣本，通過對(duì)收集到的圖片

進(jìn)行分類，標(biāo)注時(shí)對(duì)人臉進(jìn)行框選標(biāo)注，講標(biāo)注分為戴口罩和不戴口罩兩種類型，并規(guī)

定在本次訓(xùn)練中模型訓(xùn)練集和訓(xùn)練圖片數(shù)量四比一，因此在選取的四千張照片之中，

3200張為訓(xùn)練集，800張為測(cè)試集。

圖4-7劃分?jǐn)?shù)據(jù)集

在對(duì)模型調(diào)整，數(shù)據(jù)集劃分完畢后，設(shè)置提取特征的訓(xùn)練參數(shù)。該模型共訓(xùn)練100

次，分為兩部分進(jìn)行訓(xùn)練。前期凍結(jié)主干網(wǎng)絡(luò)訓(xùn)練50次，不訓(xùn)練主干網(wǎng)絡(luò)只訓(xùn)練后面檢

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

測(cè)層，主干網(wǎng)絡(luò)是用來提取特征，凍結(jié)主干網(wǎng)絡(luò)進(jìn)行訓(xùn)練可以加快訓(xùn)練速度，后期50次

包括主干網(wǎng)絡(luò)全部訓(xùn)練。

訓(xùn)練前期50次設(shè)置學(xué)習(xí)率為0.001，動(dòng)因子為0.95，每學(xué)習(xí)一次學(xué)習(xí)率衰減0.95，

學(xué)習(xí)率逐漸下降有利于進(jìn)行收斂。

對(duì)口罩是否佩戴識(shí)別要分為兩步，分類與定位，分類就是利用算法遍歷圖片，判斷

其中的對(duì)象是不是包含我們要找的人臉。進(jìn)而將一張圖片到多層卷積神經(jīng)網(wǎng)絡(luò)，之后會(huì)

得到一個(gè)結(jié)果即特征向量，同時(shí)反饋給softmax模塊，來對(duì)于圖片類型做一預(yù)測(cè)。

判斷出圖片類型之后就要對(duì)圖片中的目標(biāo)人臉進(jìn)行定位。在口罩佩戴檢測(cè)問題中，

一張圖片可以含有多個(gè)目標(biāo)，并且單張圖片中可能會(huì)有多個(gè)不同分類的目標(biāo)。

對(duì)于數(shù)據(jù)的處理之中，可以讓神經(jīng)網(wǎng)絡(luò)再次多輸出幾個(gè)，形成多重結(jié)果，首先輸出

一個(gè)邊界框，（xmin,ymin）和（xmax,ymax），圖片中的每個(gè)人臉都分別對(duì)應(yīng)著是兩個(gè)

坐標(biāo)，這樣就可以判斷出每張圖片中目標(biāo)人臉的數(shù)量然后對(duì)其進(jìn)行定位。

圖4-8前期訓(xùn)練設(shè)置

訓(xùn)練后期50次設(shè)置學(xué)習(xí)率為0.0001，動(dòng)因子為0.95，每學(xué)習(xí)一次學(xué)習(xí)率衰減0.95。

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖4-9后期訓(xùn)練設(shè)置

圖4-10模型訓(xùn)練過程

如圖4-11為模型訓(xùn)練過程，每張圖片的識(shí)別速度平均為0.2s，識(shí)別速度較快，在模

型訓(xùn)練完畢后模型run文件夾下自動(dòng)生成了loss、map和ap曲線的數(shù)據(jù)圖，以下將解釋

數(shù)據(jù)圖的具體含義。

圖4-11訓(xùn)練和驗(yàn)證的loss曲線

如上圖loss曲線是訓(xùn)練過程中損失函數(shù)的變化情況的可視化表現(xiàn)，上圖中測(cè)試集和

驗(yàn)證集的損失都較小，可以看到準(zhǔn)確率逐漸提高并基本達(dá)到穩(wěn)定。

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖4-12測(cè)試集的map曲線

AP曲線是衡量訓(xùn)練出來的網(wǎng)絡(luò)模型在每個(gè)類別上的好與壞，這兩個(gè)AP曲線分別表

示每次測(cè)試中單個(gè)類別NoMask和Mask的正確率，是選取該模型中最好的模型繪制出來

的曲線圖。

圖4-13NoMask的AP曲線

map是衡量訓(xùn)練之后的網(wǎng)絡(luò)模型在所有類別上的好與壞，兩個(gè)AP取平均值即為該模

型測(cè)試的正確率map?？梢钥吹剑?jīng)過訓(xùn)練之后該模型的正確率已經(jīng)可以達(dá)到91.35%。

圖4-14模型的map值

5、模型應(yīng)用

在進(jìn)行了最終的實(shí)驗(yàn)過后實(shí)現(xiàn)效果如圖所示，對(duì)于佩戴了口罩

人人文庫> 全部分類> 專業(yè)文獻(xiàn) > 工程機(jī)械

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)

文檔簡介

溫馨提示

最新文檔

評(píng)論

基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔