版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
目錄
1、引言...........................................................................................................................................1
1.1項(xiàng)目背景...............................................................................................................................1
1.2開發(fā)環(huán)境與工具..................................................................................................................2
1.2.1Python簡介....................................................................................................................2
1.2.2pytorch簡介...................................................................................................................2
1.2.3pycharm簡介.................................................................................................................3
1.2.4Python第三方庫簡介....................................................................................................4
2、需求分析...................................................................................................................................4
2.1可行性需求分析..................................................................................................................4
2.2數(shù)據(jù)采集功能分析..............................................................................................................5
2.3關(guān)鍵技術(shù)分析......................................................................................................................6
2.3.1目標(biāo)檢測(cè)........................................................................................................................6
2.3.2YOLOv5算法.................................................................................................................7
3、系統(tǒng)實(shí)現(xiàn)...................................................................................................................................9
3.1圖像采集...............................................................................................................................9
3.2圖像預(yù)處理.........................................................................................................................10
3.2.1彩色直方圖均衡..........................................................................................................10
3.2.2灰度處理......................................................................................................................11
3.2.3平滑處理......................................................................................................................12
3.3圖像標(biāo)注.............................................................................................................................13
4、模型構(gòu)建及評(píng)估分析.............................................................................................................14
5、模型應(yīng)用.................................................................................................................................19
6、總結(jié).........................................................................................................................................20
參考文獻(xiàn).......................................................................................................................................22
I
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
基于深度學(xué)習(xí)yolo模型的口罩識(shí)別方法設(shè)計(jì)
1、引言
1.1項(xiàng)目背景
隨著現(xiàn)代化的發(fā)展,人們生活節(jié)奏越來越快,可以通過圖像進(jìn)行交流。從用戶的角度
來看,圖像不受當(dāng)?shù)卣Z言等因素的限制,能夠更好地表達(dá)和傳達(dá)人們的情感信息,可以作
為快速表達(dá)的載體。對(duì)我們來說,編輯文本是很容易的,但是圖像中傳遞的內(nèi)容和信息非
常大。因此,如何方便、有效地找到關(guān)鍵信息并利用圖像成為圖像處理領(lǐng)域的一個(gè)關(guān)鍵研
究問題。近年來,由于其在場(chǎng)景中的廣泛應(yīng)用,圖像識(shí)別成為圖像研究領(lǐng)域的一個(gè)熱點(diǎn)。
在畜牧業(yè)中,我們可以通過監(jiān)測(cè)牲畜的生長狀況、活樁的形狀和形狀來判斷,定期定量喂
養(yǎng)牲畜,監(jiān)測(cè)其生長發(fā)育情況。在工業(yè)上,關(guān)鍵問題可以通過圖像識(shí)別來解決。在醫(yī)學(xué)上,
高清圖像可以用來掃描身體的各個(gè)部位。此外,圖像在日常活動(dòng)中也起著至關(guān)重要的作用,
如高速列車安檢中的人臉識(shí)別,以及機(jī)上乘客的身份信息;平日停車時(shí),采用車牌識(shí)別技
術(shù)進(jìn)入停車場(chǎng);申請(qǐng)身份證時(shí),每個(gè)公民都會(huì)輸入自己的指紋信息,以便將來進(jìn)行安全驗(yàn)
證??傊?,圖像在我們的日常生活中是不可或缺的。利用傳統(tǒng)方法或深度學(xué)習(xí)方法快速有
效地識(shí)別圖像和提取顏色特征信息具有重要意義。
在機(jī)器視覺中,圖像識(shí)別是一個(gè)關(guān)鍵問題。圖像識(shí)別的精度主要取決于圖像關(guān)鍵部位
的定位精度。首先,圖像處理是圖像預(yù)處理。經(jīng)過預(yù)處理后的圖像特征提取算法有sift、LBP
和Haar。通過一系列的步驟,我們可以準(zhǔn)確地識(shí)別圖像的內(nèi)容。獲取圖像的方法有很多種,
但我們必須利用攝影工具將采集到的圖像數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫中以備不時(shí)之需,而對(duì)受損圖
像的處理就是對(duì)圖像中我們需要的圖像進(jìn)行切割,以確定其統(tǒng)一的格式和大小。對(duì)于圖像
質(zhì)量較差的圖像,可以對(duì)圖像進(jìn)行去噪、增強(qiáng)和一系列的預(yù)處理,以方便以后的使用。獲
取完整的特征信息是反映用戶需求、服務(wù)于整個(gè)行業(yè)的關(guān)鍵,因此這一步是圖像識(shí)別的基
礎(chǔ)過程,細(xì)化來說就是先要提取需要去識(shí)別的圖像的特征,然后再利用分類器來把相同特
征的歸為一類,實(shí)現(xiàn)分組,從而實(shí)現(xiàn)對(duì)圖像的識(shí)別。
人工智能和機(jī)器學(xué)習(xí)的發(fā)展也為圖像識(shí)別提供了極好的資源。機(jī)器學(xué)習(xí)就是讓機(jī)器擁
有與人類相同的大腦,使機(jī)器能夠獨(dú)立地學(xué)習(xí)和分析問題。人類知識(shí)的獲得是一個(gè)漫長而
反復(fù)的過程。在人類進(jìn)化的過程中,人們通過學(xué)習(xí)和理解知識(shí)來理解自己需要獲得的東西。
通過不斷的實(shí)踐,人們可以獲得相關(guān)的技能,并分析和總結(jié)在這個(gè)過程中獲得的經(jīng)驗(yàn)。機(jī)
器學(xué)習(xí)類似于人腦的學(xué)習(xí),使機(jī)器學(xué)習(xí)不再是科幻電影的場(chǎng)景。人類通過眼睛捕捉周圍的
所有信息,并將視網(wǎng)膜成像傳輸?shù)酱竽X,獲得相關(guān)的圖像特征。機(jī)器視覺就是通過各種設(shè)
備獲取相關(guān)的圖像。經(jīng)過特征提取,機(jī)器可以通過學(xué)習(xí)識(shí)別相關(guān)對(duì)象,并通過計(jì)算機(jī)或音
頻設(shè)備顯示學(xué)習(xí)的內(nèi)容。分類器訓(xùn)練是機(jī)器學(xué)習(xí)的關(guān)鍵。通過不斷的訓(xùn)練并對(duì)分類器進(jìn)行
1
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
調(diào)整,得到分類器模型,對(duì)誤差范圍較小的目標(biāo)進(jìn)行識(shí)別。機(jī)器學(xué)習(xí)包括無監(jiān)督學(xué)習(xí)、有
監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)。
而我們清楚的是人臉識(shí)別無論是數(shù)字圖像的處理方面還是在于計(jì)算機(jī)視覺領(lǐng)域的方
面,其地位都是很高的,它能利用攝像機(jī)采集信息,并對(duì)其進(jìn)行檢測(cè),還能快速識(shí)別出口
罩佩戴情況,所以說該項(xiàng)技術(shù)對(duì)于當(dāng)下疫情控制的意義是非常高的,在該方面的投入也是
非常有必要的有價(jià)值的。面對(duì)突如其來的新一輪肺炎疫情,人們的生活秩序被嚴(yán)重?cái)_亂。
與普通流感不同,這種流行病可以通過人類唾液傳播,并具有很強(qiáng)的感染他人的能力。最
近,面對(duì)疫情,市面上的口罩越來越少。新型冠狀病毒肺炎對(duì)該病的流行尤為重要。能有
效阻斷新型冠狀肺炎病毒的傳播。它能直接從源頭檢查,將人體唾液和氣流從第一道屏障
中隔離出來,有效保護(hù)自己和他人,不傳播病毒。在中國的公共場(chǎng)所必須戴口罩。然而,
在商場(chǎng)、餐廳、地鐵等人員密集場(chǎng)所,應(yīng)對(duì)客流高峰期的措施往往讓人發(fā)自內(nèi)心。一些人
外出時(shí)不愛戴口罩,這給病毒提供了可乘之機(jī),給自己和他人的生命帶來重大安全隱患。
如果有一套系統(tǒng),通過對(duì)數(shù)字圖像的采集和識(shí)別,識(shí)別出是否戴口罩的人,并做出相應(yīng)的
預(yù)警和報(bào)警就顯得尤為重要和迫切。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,基于圖像的面具識(shí)別迅
速引起人們的關(guān)注。
1.2開發(fā)環(huán)境與工具
1.2.1Python簡介
Python由荷蘭數(shù)學(xué)和計(jì)算機(jī)科學(xué)研究學(xué)會(huì)的吉多·范羅蘇姆于1990年代初設(shè)計(jì),作為
一門叫做ABC語言的替代品。Python提供了高效的高級(jí)數(shù)據(jù)結(jié)構(gòu),還能簡單有效地面向
對(duì)象編程。Python語法和動(dòng)態(tài)類型,以及解釋型語言的本質(zhì),使它成為多數(shù)平臺(tái)上寫腳本
和快速開發(fā)應(yīng)用的編程語言,隨著版本的不斷更新和語言新功能的添加,逐漸被用于獨(dú)
立的、大型項(xiàng)目的開發(fā)。
Python解釋器易于擴(kuò)展,可以使用C語言或C++(或者其他可以通過C調(diào)用的語言)
擴(kuò)展新的功能和數(shù)據(jù)類型。Python也可用于可定制化軟件中的擴(kuò)展程序語言。Python豐富
的標(biāo)準(zhǔn)庫,提供了適用于各個(gè)主要系統(tǒng)平臺(tái)的源碼或機(jī)器碼。
1.2.2pytorch簡介
是一個(gè)基于Python的開源機(jī)器學(xué)習(xí)框架,由Facebook的人工智能研究團(tuán)隊(duì)開發(fā)和維
護(hù)。它提供了豐富的工具和庫,用于構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型和進(jìn)行機(jī)器學(xué)習(xí)任務(wù)。
的設(shè)計(jì)理念是動(dòng)態(tài)計(jì)算圖,這意味著你可以使用自然的方式定義和執(zhí)行計(jì)算圖,而不
需要預(yù)先定義靜態(tài)計(jì)算圖的結(jié)構(gòu)。這種靈活性使得模型構(gòu)建和調(diào)試變得更加直觀和方便,的
主要特點(diǎn)包括:
1.動(dòng)態(tài)計(jì)算圖:允許用戶在運(yùn)行時(shí)動(dòng)態(tài)地構(gòu)建、修改和執(zhí)行計(jì)算圖,使得模型構(gòu)建和
調(diào)試更加靈活和直觀。
2
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
2.自動(dòng)求導(dǎo):能夠自動(dòng)計(jì)算張量的梯度,大大簡化了反向傳播算法的實(shí)現(xiàn)。這使得模
型訓(xùn)練過程更加便捷和高效。
3.強(qiáng)大的GPU加速支持:針對(duì)GPU進(jìn)行了優(yōu)化,可以充分利用GPU的并行計(jì)算能
力,加速深度學(xué)習(xí)任務(wù)的訓(xùn)練和推理。
4.大型社區(qū)支持:擁有龐大的開源社區(qū),提供了豐富的文檔、教程和示例代碼。這使
得學(xué)習(xí)和使用變得更加容易,同時(shí)也能夠從社區(qū)中獲取支持和解決問題。
5.兼容性和可擴(kuò)展性:與其他Python庫(如NumPy)和常見的機(jī)器學(xué)習(xí)庫(如SciPy
和Scikit-learn)兼容性良好。此外,還提供了豐富的擴(kuò)展庫和工具,可以滿足不同任務(wù)和
需求的擴(kuò)展性需求。
總的來說,是一個(gè)功能強(qiáng)大、易用且靈活的機(jī)器學(xué)習(xí)框架,廣泛應(yīng)用于學(xué)術(shù)界和工業(yè)
界。它的設(shè)計(jì)理念和特點(diǎn)使得模型構(gòu)建和調(diào)試更加直觀和高效,為深度學(xué)習(xí)任務(wù)提供了便
利和優(yōu)化的解決方案。
1.2.3pycharm簡介
PyCharm是一款由JetBrains開發(fā)的集成開發(fā)環(huán)境(IDE),專門用于Python開發(fā)。它
提供了許多強(qiáng)大的功能和工具,旨在提高開發(fā)者的生產(chǎn)力和代碼質(zhì)量,以下是PyCharm的
一些主要特點(diǎn)和功能:
1.代碼編輯和智能感知:PyCharm具有強(qiáng)大的代碼編輯功能,包括語法高亮、代碼補(bǔ)
全、自動(dòng)縮進(jìn)和錯(cuò)誤檢查等。它還提供了智能感知功能,可以根據(jù)上下文提供代碼建議和
自動(dòng)完成。
2.調(diào)試和測(cè)試:PyCharm內(nèi)置了強(qiáng)大的調(diào)試器,可以幫助開發(fā)者定位和修復(fù)代碼中的
問題。它還支持單元測(cè)試和集成測(cè)試,可以方便地編寫、運(yùn)行和分析測(cè)試用例。
3.項(xiàng)目管理:PyCharm支持多個(gè)項(xiàng)目的管理,可以輕松切換和管理不同的Python項(xiàng)
目。它提供了項(xiàng)目導(dǎo)航、版本控制集成和依賴管理等功能,使得項(xiàng)目開發(fā)更加便捷。
4.版本控制:PyCharm與常見的版本控制系統(tǒng)(如Git、SVN和Mercurial)集成緊密,
可以直接在IDE中進(jìn)行版本控制操作,如提交、拉取和合并代碼等
5.代碼重構(gòu)和分析:PyCharm提供了豐富的代碼重構(gòu)工具,可以幫助開發(fā)者進(jìn)行代碼
重構(gòu)和優(yōu)化,提高代碼的可讀性和維護(hù)性。它還提供了靜態(tài)代碼分析功能,可以幫助檢測(cè)
潛在的錯(cuò)誤和優(yōu)化建議。
6.插件和擴(kuò)展性:PyCharm支持大量的插件和擴(kuò)展,可以根據(jù)需要添加額外的功能和
工具,以滿足特定項(xiàng)目或開發(fā)需求。
總的來說,PyCharm是一個(gè)功能強(qiáng)大、易用且高度可定制的Python開發(fā)環(huán)境,適用于
各種規(guī)模的項(xiàng)目和開發(fā)者。它提供了豐富的功能和工具,幫助開發(fā)者提高開發(fā)效率、減少
錯(cuò)誤,并保持代碼質(zhì)量。
3
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
1.2.4Python第三方庫簡介
Python是一種非常受歡迎的編程語言,因?yàn)樗子趯W(xué)習(xí)、使用和擴(kuò)展。Python擁有
大量的第三方庫,這些庫可以幫助開發(fā)人員快速、輕松地實(shí)現(xiàn)各種任務(wù)。以下是幾個(gè)重要
的Python第三方庫簡介:
NumPy:NumPy是Python的一個(gè)科學(xué)計(jì)算庫,它提供了高效的多維數(shù)組對(duì)象、各種
派生對(duì)象、快速的數(shù)組操作方法以及大量的工具。
Pandas:Pandas是Python的一個(gè)數(shù)據(jù)處理庫,它提供了靈活和高效的數(shù)據(jù)結(jié)構(gòu),包
括數(shù)據(jù)幀和面向行和列的數(shù)據(jù)選擇、操作和分組方法。
Matplotlib:Matplotlib是Python的一個(gè)繪圖庫,它提供了創(chuàng)建各種類型圖表和可視
化的工具,包括條形圖、散點(diǎn)圖、區(qū)域圖和等高線圖等。
Scikit-learn:Scikit-learn是Python的一個(gè)機(jī)器學(xué)習(xí)庫,它包含了大量的基本算法和
模型,可以用于分類、回歸和聚類等任務(wù)。
Pytorch:Pytorch是一個(gè)開源的機(jī)器學(xué)習(xí)框架,它由Google開發(fā),是用于構(gòu)建人工
智能模型的重要工具之一。
Django:Django是Python的一個(gè)Web框架,它提供了一套完整的MVC架構(gòu)、
ORM和模板語言,可以幫助開發(fā)人員快速構(gòu)建復(fù)雜web應(yīng)用程序。
Flask:Flask是Python的另一個(gè)微型Web框架,它提供了一個(gè)靈活的、易于擴(kuò)展
的架構(gòu),可以用于搭建小型Web應(yīng)用程序和API。
這些Python第三方庫提供了很多功能和工具,可以幫助開發(fā)人員更輕松、高效地進(jìn)
行編程任務(wù)。使用這些庫可以大大提升Python在數(shù)據(jù)處理、科學(xué)計(jì)算、機(jī)器學(xué)習(xí)、Web
開發(fā)等方面的能力。
2、需求分析
2.1可行性需求分析
1.功能需求
2020年新冠肺炎席卷全球,佩戴口罩能夠有效切斷新冠肺炎病毒的傳播途徑,是預(yù)防
感染的有效措施。隨著疫情影響的逐步擴(kuò)大,國內(nèi)公眾場(chǎng)合要求人們需要佩戴口罩,但是
也總有一些人因?yàn)樘厥馇闆r未能佩戴口罩,這有可能會(huì)對(duì)周圍人群的安全造成隱患。特別
是商場(chǎng)、餐飲、地鐵、車站等人員密集型的場(chǎng)所,由工作人員人工檢測(cè)體溫與監(jiān)督乘客口
罩佩戴情況,在人流量高峰時(shí)段的檢測(cè)往往應(yīng)接不暇,經(jīng)常會(huì)出現(xiàn)大量人力的浪費(fèi),并且
吃力不討好,效率仍然低下。
隨著時(shí)代的快速發(fā)展,計(jì)算機(jī)視覺技術(shù)使得我們攝像機(jī)與計(jì)算機(jī)合而為一,一體化的
分析處理,快速高效的實(shí)現(xiàn)對(duì)人員來往是否佩戴口罩的檢測(cè)。本系統(tǒng)可以自動(dòng)準(zhǔn)確且快速
4
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
地識(shí)別圖片或視頻中人物是否佩戴口罩,有著重要的應(yīng)用場(chǎng)景和市場(chǎng)前景。
2.性能需求
(1)系統(tǒng)在因特網(wǎng)正常狀況下全天候提供服務(wù),用戶可以隨時(shí)使用該系統(tǒng)進(jìn)行檢測(cè)。
(2)檢測(cè)速度要盡可能的快并且檢測(cè)結(jié)果盡可能準(zhǔn)確。
(3)系統(tǒng)的安全性、可操作性、可維護(hù)性要較為完善。
3.運(yùn)行需求
本系統(tǒng)采用了YOLOv5模型,Darknet深度學(xué)習(xí)框架,操作系統(tǒng)為Windows10,環(huán)境
為。這些技術(shù)目前都已經(jīng)很成熟,而且技術(shù)含量很高,使用起來很方便,安全性也有較大
保障。目前高性能的網(wǎng)絡(luò)組建大量涌現(xiàn),他們速度快、用量大、可靠性高、價(jià)格低,完全
可以滿足本系統(tǒng)的需要。
2.2數(shù)據(jù)采集功能分析
在使用本系統(tǒng)時(shí),用戶首先需要選擇本地圖片或視頻并傳入系統(tǒng),系統(tǒng)對(duì)圖片進(jìn)行
預(yù)處理后再對(duì)目標(biāo)人臉的區(qū)域進(jìn)行定位,然后對(duì)定位后的人臉區(qū)域進(jìn)行是否佩戴口罩的
識(shí)別,最后將識(shí)別結(jié)果輸出。
根據(jù)上述描述,本系統(tǒng)應(yīng)具備以下四個(gè)功能:
(1)圖片選擇:提供從本地文件夾中選擇待識(shí)別圖片的功能。用戶可以從本地文件
夾中獲取想要識(shí)別的圖片并傳入系統(tǒng)。
(2)圖像預(yù)處理:提供對(duì)傳入的圖片進(jìn)行預(yù)處理的功能。該功能可以對(duì)傳入的圖片
進(jìn)行灰度校正和平滑處理,為之后對(duì)圖像進(jìn)行進(jìn)一步分析和識(shí)別做準(zhǔn)備。
(3)圖像識(shí)別:該功能是對(duì)已經(jīng)預(yù)計(jì)處理的圖像進(jìn)行再一次進(jìn)一步的分析,并通過
如此方式對(duì)于圖像特征提取,對(duì)于目標(biāo)進(jìn)行定位以及預(yù)處理之后的圖像進(jìn)行進(jìn)一步分析,
對(duì)圖像進(jìn)行特征提取、目標(biāo)定位和目標(biāo)識(shí)別。
(4)結(jié)果輸出:該功能可以將已經(jīng)完成識(shí)別的圖像的結(jié)果進(jìn)行輸出。
5
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
圖2-1系統(tǒng)功能結(jié)構(gòu)圖
2.3關(guān)鍵技術(shù)分析
2.3.1目標(biāo)檢測(cè)
1.目標(biāo)檢測(cè)的概念
目標(biāo)檢測(cè)又被我們叫做目標(biāo)提取,這是一種基于目標(biāo)的幾何還有統(tǒng)計(jì)特征的圖像分割
方法。
它的作用在于,將原本需要兩步的目標(biāo)分割還有識(shí)別合二為一,所以其以準(zhǔn)確以及實(shí)
時(shí)著稱,特別是在許多復(fù)雜的場(chǎng)景之中,因?yàn)槲覀冃枰瑫r(shí)對(duì)多個(gè)目標(biāo)進(jìn)行相應(yīng)的檢測(cè)處
理,它所具備的自動(dòng)提取目標(biāo)以及自動(dòng)識(shí)別格外重要。在對(duì)國內(nèi)外諸多成果的研究中,
我們將目標(biāo)檢測(cè)的算法通常分為兩類,第一種是較為傳統(tǒng)的目標(biāo)檢測(cè)算法,第二種就是我
們要介紹到的基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法,目前后者的用途十分廣泛該算法又分為One-
Stage目標(biāo)檢測(cè)算法和Two-Stage目標(biāo)檢測(cè)算法。
2.傳統(tǒng)目標(biāo)檢測(cè)算法
(1)對(duì)于傳統(tǒng)的目標(biāo)檢測(cè)方法,一般工作流程分為三個(gè)階段:即首先給定圖像選取
候選區(qū)域,選擇過后再提取相應(yīng)特征,之后再用以及訓(xùn)練好的分類器來對(duì)于各個(gè)數(shù)據(jù)進(jìn)行
分類。這三個(gè)階段細(xì)化來說如下。
區(qū)域選擇:即定位,我們?cè)诜治鎏幚碇笆紫葢?yīng)該確定位置,因?yàn)槟繕?biāo)可能出現(xiàn)于任
何位置,且形狀比例會(huì)相應(yīng)的產(chǎn)生一些變化,所以我們采用滑動(dòng)窗口來保證將圖像所有位
置都有觀測(cè)到,簡單來說,就是窮舉法,這種方法可以完成任務(wù),但是這種方法效率不高,
且時(shí)間浪費(fèi)的太多,且多了許多不必要的的多于窗口,這對(duì)于后續(xù)工作的進(jìn)行產(chǎn)生了影響,
6
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
也導(dǎo)致了整體系統(tǒng)的效率被拖慢。
(2)特征提?。阂?yàn)橛^測(cè)目標(biāo)不會(huì)相同,多種多樣,并且位置角度都有變化,所以
一個(gè)完美程序是特別困難的。但是對(duì)于目標(biāo)特征的提取又是至關(guān)重要的,它直接決定系統(tǒng)
的結(jié)果是否準(zhǔn)確,所以重要程度不言而喻。其中,SIFT、HOG等是這個(gè)階段常用的特征。
(3)分類:即根據(jù)第二步所提取出來具有相似特征的目標(biāo)歸為一類,實(shí)現(xiàn)對(duì)數(shù)據(jù)的
分類。目前市面上的分類器主要包括SVM,AdaBoost等。
2.3.2YOLOv5算法
YOLOv5是一種高性能實(shí)時(shí)目標(biāo)檢測(cè)算法,是YOLO系列(YouOnlyLookOnce)的
最新版本。它是由Ultralytics團(tuán)隊(duì)開發(fā)的,旨在提供更快速、更準(zhǔn)確的目標(biāo)檢測(cè)能力。
與之前的版本相比,YOLOv5在模型結(jié)構(gòu)和訓(xùn)練策略上進(jìn)行了一些改進(jìn)和優(yōu)化,以提
高檢測(cè)性能。下面是YOLOv5的一些特點(diǎn):
1.網(wǎng)絡(luò)結(jié)構(gòu):YOLOv5采用了一種輕量級(jí)的網(wǎng)絡(luò)結(jié)構(gòu),由卷積層和池化層組成,通過
多個(gè)不同尺度的特征圖進(jìn)行目標(biāo)檢測(cè)。這種結(jié)構(gòu)能夠在保持準(zhǔn)確性的同時(shí)提供較快的推理
速度。
2.強(qiáng)大的檢測(cè)能力:YOLOv5能夠同時(shí)檢測(cè)多個(gè)目標(biāo)類別,并輸出它們的邊界框和類
別概率。它具有較高的準(zhǔn)確性和召回率,能夠有效地處理復(fù)雜場(chǎng)景下的目標(biāo)檢測(cè)任務(wù)。
3.多尺度訓(xùn)練:YOLOv5采用了一種多尺度訓(xùn)練策略,通過在不同尺度下訓(xùn)練模型,
提高了模型對(duì)不同大小目標(biāo)的檢測(cè)能力。這使得模型在處理大尺度和小尺度目標(biāo)時(shí)都能取
得較好的效果。
4.數(shù)據(jù)增強(qiáng)和數(shù)據(jù)集增強(qiáng):YOLOv5使用了多種數(shù)據(jù)增強(qiáng)技術(shù),如隨機(jī)裁剪、色彩擾
動(dòng)和圖像翻轉(zhuǎn)等,以增加訓(xùn)練數(shù)據(jù)的多樣性和數(shù)量。此外,還提供了數(shù)據(jù)集增強(qiáng)工具,可
以通過合成數(shù)據(jù)增加訓(xùn)練樣本的豐富性。
5.高度可定制:YOLOv5提供了豐富的配置選項(xiàng),可以根據(jù)任務(wù)需求進(jìn)行靈活的模型
設(shè)置和訓(xùn)練。用戶可以選擇不同的網(wǎng)絡(luò)尺寸、訓(xùn)練參數(shù)和推理設(shè)置,以滿足特定的目標(biāo)檢
測(cè)需求。
總的來說,YOLOv5是一種高性能的實(shí)時(shí)目標(biāo)檢測(cè)算法,具有較快的推理速度和較高
的檢測(cè)準(zhǔn)確性。它在多尺度訓(xùn)練、數(shù)據(jù)增強(qiáng)和模型定制等方面提供了更多的靈活性和優(yōu)化
選項(xiàng),適用于各種實(shí)際場(chǎng)景中的目標(biāo)檢測(cè)任務(wù)。
7
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
YOLO網(wǎng)絡(luò)基于回歸算法,在很復(fù)雜的運(yùn)算數(shù)據(jù)面前也能發(fā)揮很好的效果,實(shí)際運(yùn)
用效果也是如此,該算法去的了不小的成就,獲得了可觀的效果。一般情況下YOLO網(wǎng)
絡(luò)將輸入的圖片劃分成大小為32*32的網(wǎng)格,檢測(cè)目標(biāo)口罩,只要口罩的中心位置落入
某個(gè)網(wǎng)格中,則立即由該網(wǎng)格負(fù)責(zé)檢測(cè)目標(biāo)。同樣的檢測(cè)地點(diǎn)檢測(cè)對(duì)象,該算法比較其
它任何算法都要更具優(yōu)勢(shì),優(yōu)勢(shì)就在于其多尺度預(yù)測(cè)算法,特別是實(shí)時(shí)性方面,更加凸
現(xiàn)了該中算法的強(qiáng)大,更好地滿足人流量較大的需要。
Yolov5算法是在原有YOLO目標(biāo)檢測(cè)架構(gòu)的基礎(chǔ)上,采用了近些年CNN領(lǐng)域中最
優(yōu)秀的優(yōu)化策略,從數(shù)據(jù)處理、主干網(wǎng)絡(luò)、網(wǎng)絡(luò)訓(xùn)練、激活函數(shù)、損失函數(shù)等各個(gè)方面
都有著不同程度的優(yōu)化。
(1)Yolov5的貢獻(xiàn)
①開發(fā)了一個(gè)高效而強(qiáng)大的模型,使得任何人都可以使用一張1080Ti或者2080Ti
GPU去訓(xùn)練一個(gè)超級(jí)快速和精確的目標(biāo)檢測(cè)器。
②驗(yàn)證了一系列state-of-the-art的目標(biāo)檢測(cè)器訓(xùn)練方法的影響。
③修改了state-of-the-art方法,使得他們?cè)谑褂脝蝹€(gè)GPU進(jìn)行訓(xùn)練時(shí)更加有效和適
配,包括CBN,PAN,SAM等。
(2)Yolov5的訓(xùn)練方法
①Bagoffreebies:只改變訓(xùn)練策略或者只增加訓(xùn)練成本,比如數(shù)據(jù)增強(qiáng)。
②Bagofspecials:插件模塊和后處理方法,它們僅僅增加一點(diǎn)推理成本,但是可以
極大地提升目標(biāo)檢測(cè)的精度。
(3)Yolov5的網(wǎng)絡(luò)結(jié)構(gòu)
Yolov5目標(biāo)檢測(cè)算法作為該算法的第四代,相比第三代,在網(wǎng)絡(luò)結(jié)構(gòu)上比更復(fù)雜,
因?yàn)槠鋬?nèi)部使用了極多的訓(xùn)練模式來提升整體神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率,Yolov5通過引入
Mosaic數(shù)據(jù)增強(qiáng)方法,并選擇最優(yōu)超參數(shù),使用GA算法,進(jìn)而對(duì)現(xiàn)有的方法進(jìn)行改
進(jìn),并對(duì)其不斷進(jìn)行訓(xùn)練,使得其具有更為低的訓(xùn)練門檻,使其下限更低,更好上手,
能夠在GPU資源有限的條件下盡可能的得到更加好的結(jié)果。在運(yùn)算過程中Mosaic數(shù)據(jù)增
強(qiáng)方法每次隨機(jī)讀取四張圖片,并對(duì)這四張張照片進(jìn)行一系列操作,翻轉(zhuǎn)、縮放等操
作,實(shí)現(xiàn)將四張圖合四為一,這種將四張圖片組合為一張圖片的方法可以更加豐富檢測(cè)
物體的背景。Yolov5的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,主干網(wǎng)絡(luò)為CSPDarknet53,附加模塊設(shè)
置為SPPNeck,另外特征融合模塊使用PANet,使用第三代即,YOLOv3作為Head。在這
里面的Darknet53包含了5個(gè)大殘差塊,這5個(gè)大殘差塊包含的小殘差單元個(gè)數(shù)分別為
1、2、8、8、4。CSPDarknet53在Darknet53的每個(gè)大殘差塊上加上了CSPNet(Cross
StagePartialNetwork),并在后面通過梯度的變化,集成到特征圖中,同時(shí)將特征圖一分
為二,一部分進(jìn)行卷積操作,另一部分與上一次的卷積結(jié)果進(jìn)行結(jié)合。最后在目標(biāo)檢測(cè)
8
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
問題中,CSP可以有效提升CNN的學(xué)習(xí)能力,同時(shí)減少計(jì)算量。PANet充分利用了特
征融合,Yolov5中還將融合的方法由加法改為乘法,使該網(wǎng)絡(luò)能夠得到更加精確的目標(biāo)
檢測(cè)能力。
圖2-2Yolov5網(wǎng)絡(luò)結(jié)構(gòu)圖
3、系統(tǒng)實(shí)現(xiàn)
3.1圖像采集
本系統(tǒng)共爬取了大約5000張圖片作為口罩佩戴檢測(cè)數(shù)據(jù)集,其中佩戴口罩和未佩戴
口罩的圖片數(shù)量基本持平。對(duì)于樣品的圖像,我們進(jìn)行兩類標(biāo)注,一類有口罩,一類未
戴口罩,一共訓(xùn)練集有2200張不同的圖片,驗(yàn)證集是訓(xùn)練集的百分之十。在每一次同時(shí)
數(shù)據(jù)之中,存在著許許多多的不同,口罩角度,顏色各不相同,這樣的訓(xùn)練有利于提升
我們的檢測(cè)佩戴情況的準(zhǔn)確性。
9
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
圖3-1部分圖片展示
圖3-2部分圖片展示
3.2圖像預(yù)處理
圖像預(yù)處理的主要作用包括改善圖像質(zhì)量、突出特征、去除噪聲、調(diào)整尺寸、歸一化
和數(shù)據(jù)增強(qiáng)等。其中,彩色直方圖均衡用于增強(qiáng)對(duì)比度和改善圖像質(zhì)量,灰度處理可以降
低計(jì)算復(fù)雜度并提取圖像特征,平滑處理可以去除圖像中的噪聲。這些預(yù)處理技術(shù)都有助
于提高圖像處理和圖像識(shí)別的準(zhǔn)確性和性能。
3.2.1彩色直方圖均衡
彩色直方圖均衡是一種圖像處理技術(shù),通過調(diào)整彩色圖像中每個(gè)顏色通道的像素值
分布,實(shí)現(xiàn)對(duì)比度增強(qiáng)、圖像質(zhì)量改善、視覺感知提升和圖像特征增強(qiáng)的效果。它能夠
10
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
使圖像亮度范圍更均勻地覆蓋整個(gè)范圍,突出細(xì)節(jié),使識(shí)別圖像的邊緣更清晰、自然、
生動(dòng),提高計(jì)算機(jī)對(duì)圖像的感知和識(shí)別能力。
圖3-3直方圖均衡代碼
圖3-4均衡化后圖片
使用圖片均衡化亮度均衡,口罩邊緣更清晰,更容易被計(jì)算機(jī)識(shí)別。
3.2.2灰度處理
在圖像處理中,處理三個(gè)通道的數(shù)據(jù)會(huì)比較復(fù)雜,因此需要先將圖像變灰,也就是
對(duì)圖像進(jìn)行灰度處理,因?yàn)榛一蟮恼掌梢员M可能的減少原始圖像的數(shù)據(jù),這樣便可
以減少計(jì)算量,增加計(jì)算精度,灰度處理,簡單來說,就是將各個(gè)像素點(diǎn)的RGB值統(tǒng)一
成同一個(gè)值,從而失去顏色,變?yōu)榛疑?,?jīng)過灰度處理后的圖像將由三通道變?yōu)閱瓮?/p>
道,而單通道的數(shù)據(jù),處理計(jì)算起來將會(huì)得到極大的簡便。
灰度處理后的圖像可以通過閾值變換轉(zhuǎn)換成黑白二值的圖像信息,也正是通過對(duì)于
灰度圖像二值化處理,所需目標(biāo)的輪廓便可以得到凸出。
灰度閾值變換的基本公式為:
0xT
f(x)
255xT
11
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
其中T為指定的閾值。
類似于符號(hào)函數(shù),將灰度大于閾值的部分設(shè)置為最大灰度,灰度小于閾值的部分設(shè)
置為最小灰度。經(jīng)過閥值化的灰度值僅有兩個(gè)取值,最小值0與最大值255。閾值變換將
圖像內(nèi)容劃分為關(guān)心與不關(guān)心的2個(gè)部分,從復(fù)雜背景中可直接提取出感興趣的,主要
用于對(duì)圖像的分割。
二值化處理的灰度圖像,即就是將像素點(diǎn)閾值變換,講灰度設(shè)置到0或255,這樣的
設(shè)置,也就可以使整個(gè)圖像會(huì)出現(xiàn)明顯的黑白效果,也就是將256個(gè)亮度等級(jí)的灰度圖
像,通過適當(dāng)?shù)拈撝颠x取,得到可以明顯顯出所需物體的二值化圖像,同時(shí)在數(shù)字化處
理之中,二值化圖像的圖像整體,以及局部特征,我們都知道,二值圖像在數(shù)字處理中
的的地位是很高的,特別是實(shí)用的圖像處理,在當(dāng)下的生產(chǎn)生活,通過二值化圖像來處
理信息是很廣泛的,但要進(jìn)行二值化處理,我們就需要先將灰度圖像二值化,得到二值
化圖像,因?yàn)槎祷瘓D像才能進(jìn)行二值化處理,因?yàn)閳D像性質(zhì)只與灰度閾值點(diǎn)位置有
關(guān),不涉及像素多級(jí)值,這就使的對(duì)于圖像的處理變得簡單,,并且壓縮量少,占據(jù)空
間更小,而我們要得到滿足條件的理想型二值化圖像,我們通常都是采用封閉,以及聯(lián)
通的邊界定義不重合的區(qū)域,所有的灰度大于或等于閾值的物體,即為我們所需要的特
定物體,即將其灰度值表示為225,除此之外的的像素點(diǎn)都被排除在外,灰度值即為零,
表示為區(qū)域值之外是背景等區(qū)域,但如果特定物體內(nèi)部有著均勻的灰度值,并且處于一
個(gè)具有其他等級(jí)灰度值的均勻背景,使用閾值法就可以得到明顯的分割成果,如果物體
與背景灰度差值較大,即可以之間轉(zhuǎn)化為灰度的差值,利用灰度閾值選取分割,動(dòng)態(tài)閾
值調(diào)節(jié)來幫助觀測(cè)。
而對(duì)于經(jīng)過處理的灰度圖像,是沒有固定的算法的,根據(jù)圖像區(qū)域之中的不同目標(biāo)
有著不同算法,在實(shí)際之中的操作中,根據(jù)不同灰度我們能進(jìn)行舍入處理,必須選擇為
灰度閾值中值等,但是這種處理的范圍過于寬廣,因?yàn)闆]有根基圖像,所以效果不是很
理想。
3.2.3平滑處理
圖像在生成、獲取、傳輸?shù)冗^程中,由于受到光照、成像系統(tǒng)功能和噪聲等許多因
素的影響,往往會(huì)造成對(duì)比度偏低、清晰度下降以及產(chǎn)生干擾噪聲等結(jié)果。為了改善圖
像質(zhì)量,需要利用圖像增強(qiáng)技術(shù)獲得更便于后續(xù)分析和識(shí)別的圖像。圖像的平滑處理是
在盡量保留圖像原有信息的情況下,過濾圖像內(nèi)部的噪聲。通過圖像平滑處理,可以有
效過濾掉圖像內(nèi)的噪聲信息。
圖像平滑處理的基本原理是對(duì)圖像中與周圍像素點(diǎn)的像素差異值較大的像素點(diǎn)進(jìn)行
處理,將其值調(diào)整為周圍像素點(diǎn)像素值的近似值。
12
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
圖像平滑處理的方法包括均值濾波、方框?yàn)V波、高斯濾波、中值濾波、雙邊濾波和
2D濾波等。
在該系統(tǒng)的均值處理方法之中,我們采取均值濾波方法方法來對(duì)圖像進(jìn)行平滑處
理。均值濾波指的是當(dāng)前像素點(diǎn)的周圍N*N個(gè)像素值的均值來代替當(dāng)前像素點(diǎn),而通過
這樣的方法來歷遍每一個(gè)像素點(diǎn),這樣窮舉之后,即可以完成對(duì)于整個(gè)圖像的均值濾
波。
而在于數(shù)據(jù)處理之前,我們有必要先去考慮對(duì)于周圍的多少個(gè)像素點(diǎn)去研究,因?yàn)?/p>
我們需要去取平均值,然后當(dāng)做中心點(diǎn),對(duì)行數(shù)還有列數(shù)具有像素點(diǎn)取平均值,而對(duì)于
邊緣的像素點(diǎn)可以只取圖像內(nèi)存的領(lǐng)域點(diǎn)像素均值。
3.3圖像標(biāo)注
本文使用LabelImg為yolov5算法構(gòu)建圖像數(shù)據(jù)集,保存格式為yolov5算法可供識(shí)別
的txt文本格。在標(biāo)注過程中,需要注意的是要確保準(zhǔn)確地標(biāo)注口罩目標(biāo)的邊界框,并為
每個(gè)目標(biāo)制定正確的類別,本次標(biāo)準(zhǔn)將數(shù)據(jù)集分為兩類,分別是mask和nomask,具體操
作如圖所示:
圖3-5LabelImg操作窗口
打開LabelImg操作窗口后,以上是具體的操作模塊功能介紹,本文需要對(duì)口罩?jǐn)?shù)據(jù)集
進(jìn)行標(biāo)注,打開數(shù)據(jù)集文件夾,導(dǎo)入圖片,直接按W鍵可以直接產(chǎn)生標(biāo)注框,彈窗中填上
信息,如圖3-6所示,標(biāo)注信息為mask:
13
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
圖3-6LabelImg標(biāo)注
4、模型構(gòu)建及評(píng)估分析
本章將會(huì)從模型的選擇,到模型參數(shù)調(diào)整以及訓(xùn)練過程注意展示,最開始需要在github
中下載yolov5模型,如圖4-7所示:
圖4-1模型下載
Yolov5的項(xiàng)目目錄結(jié)構(gòu)主要需要修改的是data文件夾、utils文件夾以及models文件夾,
其中voc.yaml中可以修改nc類別參數(shù),指定識(shí)別標(biāo)記,detect.py文件夾可修改運(yùn)行數(shù)據(jù)
集、weight等,部分目錄結(jié)構(gòu)如圖4-8所示:
圖4-2模型結(jié)構(gòu)
下載完成后,在anaconda中安裝運(yùn)行環(huán)境,環(huán)境如圖3-9所示:
14
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
圖4-3運(yùn)行環(huán)境
運(yùn)行環(huán)境搭建好后,在yolov5中調(diào)整模型配置文件,打開voc.yaml,其中定義了模型
的結(jié)構(gòu)和超參數(shù)。根據(jù)數(shù)據(jù)種類和錨框大小進(jìn)行調(diào)整,以下是參數(shù)詳解:
(1)nc參數(shù):指定目標(biāo)類別的數(shù)量,包括佩戴口罩和不佩戴口罩的人臉。
(2)anchors參數(shù):YOLOv5使用錨框(anchorbox)來檢測(cè)不同尺寸的物體。你可
以根據(jù)口罩的大小調(diào)整錨框的尺寸,以便更好地適應(yīng)口罩的檢測(cè)。
(3)weights參數(shù):指定預(yù)訓(xùn)練模型的權(quán)重文件路徑。從預(yù)訓(xùn)練的YOLOv5模型中
加載權(quán)重,然后在該基礎(chǔ)上進(jìn)行微調(diào)。
如圖3-10所示調(diào)整識(shí)別的nc值,制定目標(biāo)識(shí)別種類和對(duì)應(yīng)的標(biāo)記。
圖4-4類別調(diào)整
如圖3-11所示,修改detect.py文件中的weights參數(shù),將模型指定為yolov5模型,修改data
參數(shù)為mask數(shù)據(jù)集。
圖4-5模型、數(shù)據(jù)集更改
其中activations.py中定義了模型的激活函數(shù),如圖所示定義了Silu和mish激活函
數(shù),使用mish激活函數(shù),是由于它有一種具有連續(xù)可導(dǎo)特性的非線性函數(shù)。與傳統(tǒng)的
ReLU激活函數(shù)相比,mish激活函數(shù)具有更寬的“平臺(tái)”區(qū)域,這意味著它可以更好地保
留輸入的絕對(duì)值較大的特征信息,對(duì)于口罩識(shí)別而言,可以隨著目標(biāo)的位置、大小和形
15
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
狀等特征的不同尺度發(fā)生變化,引入激活函數(shù)可以使yolov5模型具有更強(qiáng)的非線性擬合
能力,部分代碼如圖4-12所示:
圖4-6激活參數(shù)修改
使用pycharm直接對(duì)yolov5模型進(jìn)行訓(xùn)練,為了確保模型可以在訓(xùn)練之后仍保持校
準(zhǔn)的檢測(cè)性,所以本系統(tǒng)的檢測(cè)我們選取真實(shí)人臉作為訓(xùn)練樣本,通過對(duì)收集到的圖片
進(jìn)行分類,標(biāo)注時(shí)對(duì)人臉進(jìn)行框選標(biāo)注,講標(biāo)注分為戴口罩和不戴口罩兩種類型,并規(guī)
定在本次訓(xùn)練中模型訓(xùn)練集和訓(xùn)練圖片數(shù)量四比一,因此在選取的四千張照片之中,
3200張為訓(xùn)練集,800張為測(cè)試集。
圖4-7劃分?jǐn)?shù)據(jù)集
在對(duì)模型調(diào)整,數(shù)據(jù)集劃分完畢后,設(shè)置提取特征的訓(xùn)練參數(shù)。該模型共訓(xùn)練100
次,分為兩部分進(jìn)行訓(xùn)練。前期凍結(jié)主干網(wǎng)絡(luò)訓(xùn)練50次,不訓(xùn)練主干網(wǎng)絡(luò)只訓(xùn)練后面檢
16
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
測(cè)層,主干網(wǎng)絡(luò)是用來提取特征,凍結(jié)主干網(wǎng)絡(luò)進(jìn)行訓(xùn)練可以加快訓(xùn)練速度,后期50次
包括主干網(wǎng)絡(luò)全部訓(xùn)練。
訓(xùn)練前期50次設(shè)置學(xué)習(xí)率為0.001,動(dòng)因子為0.95,每學(xué)習(xí)一次學(xué)習(xí)率衰減0.95,
學(xué)習(xí)率逐漸下降有利于進(jìn)行收斂。
對(duì)口罩是否佩戴識(shí)別要分為兩步,分類與定位,分類就是利用算法遍歷圖片,判斷
其中的對(duì)象是不是包含我們要找的人臉。進(jìn)而將一張圖片到多層卷積神經(jīng)網(wǎng)絡(luò),之后會(huì)
得到一個(gè)結(jié)果即特征向量,同時(shí)反饋給softmax模塊,來對(duì)于圖片類型做一預(yù)測(cè)。
判斷出圖片類型之后就要對(duì)圖片中的目標(biāo)人臉進(jìn)行定位。在口罩佩戴檢測(cè)問題中,
一張圖片可以含有多個(gè)目標(biāo),并且單張圖片中可能會(huì)有多個(gè)不同分類的目標(biāo)。
對(duì)于數(shù)據(jù)的處理之中,可以讓神經(jīng)網(wǎng)絡(luò)再次多輸出幾個(gè),形成多重結(jié)果,首先輸出
一個(gè)邊界框,(xmin,ymin)和(xmax,ymax),圖片中的每個(gè)人臉都分別對(duì)應(yīng)著是兩個(gè)
坐標(biāo),這樣就可以判斷出每張圖片中目標(biāo)人臉的數(shù)量然后對(duì)其進(jìn)行定位。
圖4-8前期訓(xùn)練設(shè)置
訓(xùn)練后期50次設(shè)置學(xué)習(xí)率為0.0001,動(dòng)因子為0.95,每學(xué)習(xí)一次學(xué)習(xí)率衰減0.95。
17
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
圖4-9后期訓(xùn)練設(shè)置
圖4-10模型訓(xùn)練過程
如圖4-11為模型訓(xùn)練過程,每張圖片的識(shí)別速度平均為0.2s,識(shí)別速度較快,在模
型訓(xùn)練完畢后模型run文件夾下自動(dòng)生成了loss、map和ap曲線的數(shù)據(jù)圖,以下將解釋
數(shù)據(jù)圖的具體含義。
圖4-11訓(xùn)練和驗(yàn)證的loss曲線
如上圖loss曲線是訓(xùn)練過程中損失函數(shù)的變化情況的可視化表現(xiàn),上圖中測(cè)試集和
驗(yàn)證集的損失都較小,可以看到準(zhǔn)確率逐漸提高并基本達(dá)到穩(wěn)定。
18
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
圖4-12測(cè)試集的map曲線
AP曲線是衡量訓(xùn)練出來的網(wǎng)絡(luò)模型在每個(gè)類別上的好與壞,這兩個(gè)AP曲線分別表
示每次測(cè)試中單個(gè)類別NoMask和Mask的正確率,是選取該模型中最好的模型繪制出來
的曲線圖。
圖4-13NoMask的AP曲線
map是衡量訓(xùn)練之后的網(wǎng)絡(luò)模型在所有類別上的好與壞,兩個(gè)AP取平均值即為該模
型測(cè)試的正確率map??梢钥吹剑?jīng)過訓(xùn)練之后該模型的正確率已經(jīng)可以達(dá)到91.35%。
圖4-14模型的map值
5、模型應(yīng)用
在進(jìn)行了最終的實(shí)驗(yàn)過后實(shí)現(xiàn)效果如圖所示,對(duì)于佩戴了口罩
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中醫(yī)護(hù)理學(xué)基礎(chǔ)課件
- 心電圖護(hù)理中的虛擬現(xiàn)實(shí)技術(shù)應(yīng)用
- 護(hù)理管理與實(shí)踐領(lǐng)導(dǎo)力
- 痔瘡護(hù)理中的飲食禁忌
- 土壤養(yǎng)分傳感技術(shù)
- 2025年電池管理系統(tǒng)通信容錯(cuò)機(jī)制
- 在線商務(wù)咨詢行業(yè)的競(jìng)爭(zhēng)格局
- 幾何基礎(chǔ)導(dǎo)數(shù)題目及答案
- 2026 年中職經(jīng)濟(jì)與管理基礎(chǔ)(經(jīng)濟(jì)學(xué)原理)試題及答案
- 辦公隔斷裝修合同協(xié)議2025年
- 2025房屋買賣合同公證書范文
- 氣管切開患者的管理與康復(fù)治療
- 《中國急性腎損傷臨床實(shí)踐指南(2023版)》解讀
- 2025高考化學(xué)專項(xiàng)復(fù)習(xí):60個(gè)高中化學(xué)??紝?shí)驗(yàn)
- 江蘇自考現(xiàn)代企業(yè)經(jīng)營管理-練習(xí)題(附答案)27875
- 場(chǎng)地空地出租合同范本
- 大學(xué)體育與科學(xué)健身智慧樹知到期末考試答案2024年
- 月子中心員工禮儀培訓(xùn)方案
- 電鍍制造成本預(yù)估表
- 2023大型新能源集控中心建設(shè)項(xiàng)目技術(shù)方案
- 2023年研究生類社會(huì)工作碩士(MSW)考試題庫
評(píng)論
0/150
提交評(píng)論