版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
目錄
1引言............................................................................................................................1
1.1項目背景......................................................................................................1
1.2Python簡介.....................................................................................................2
1.2.1AlexNet簡介.........................................................................................2
1.2.2PyCharm簡介........................................................................................3
1.2.3Python第三方庫簡介...........................................................................3
2需求分析....................................................................................................................5
2.1項目可行性..................................................................................................5
2.2關(guān)鍵技術(shù)分析..............................................................................................5
2.2.1數(shù)據(jù)采集技術(shù).......................................................................................5
2.2.2數(shù)據(jù)集可視化技術(shù)...............................................................................6
2.2.3AlexNet模型.........................................................................................6
3數(shù)據(jù)采集....................................................................................................................7
3.1運動鞋數(shù)據(jù)采集..........................................................................................7
3.2數(shù)據(jù)集獲取分析..........................................................................................7
3.3編程實現(xiàn)......................................................................................................8
4數(shù)據(jù)集預(yù)處理與數(shù)據(jù)可視化....................................................................................8
4.1數(shù)據(jù)集預(yù)處理..................................................................................................8
4.2數(shù)據(jù)可視化..................................................................................................9
4.3切分數(shù)據(jù)集................................................................................................10
5模型構(gòu)建及評估分析..............................................................................................10
5.1模型構(gòu)建....................................................................................................10
5.2模型編譯....................................................................................................12
5.3結(jié)果分析....................................................................................................13
6小結(jié)..........................................................................................................................13
參考資料.........................................................................................................................15
I
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
基于AlexNet模型的運動鞋品牌識別方法設(shè)計
1引言
近年來,深度學(xué)習(xí)技術(shù)在計算機視覺領(lǐng)域得到了廣泛應(yīng)用。其中,卷積神
經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)是一種常用的模型,具有良好
的特征提取能力和分類性能。AlexNet是第一個應(yīng)用于圖像分類比賽(ImageNet
LargeScaleVisualRecognitionChallenge,ILSVRC)的CNN模型,具有較高的
準確率和速度,成為了深度學(xué)習(xí)研究的一個里程碑。
運動鞋是現(xiàn)代時尚文化中不可或缺的元素之一,其品牌眾多、款式復(fù)雜,
因此如何對不同品牌的運動鞋進行自動化識別成為了一個具有挑戰(zhàn)性的問題。
傳統(tǒng)的基于圖像特征的分類方法需要人工定義特征并選擇合適的分類器,效果
受限。而基于深度學(xué)習(xí)的分類方法可以自動學(xué)習(xí)特征,并獲得更好的分類性能。
因此,本文提出了一種基于深度學(xué)習(xí)AlexNet模型的運動鞋品牌識別方法,
通過構(gòu)建AlexNet模型訓(xùn)練數(shù)據(jù)集,利用訓(xùn)練好的模型對測試數(shù)據(jù)進行預(yù)測,
并評估分類性能。實驗結(jié)果表明,該方法在運動鞋品牌識別方面具有很高的準
確率和魯棒性,能夠應(yīng)用于實際場景中的運動鞋分類問題。
1.1項目背景
隨著時尚文化的不斷發(fā)展和人們生活水平的提高,運動鞋成為了現(xiàn)代時尚
文化中的重要元素之一。市面上有大量的運動鞋品牌,每個品牌還有多個款式
和系列,這給消費者選購帶來了困難。同時,在電商、物流等領(lǐng)域,快速準確
地識別運動鞋品牌也是非常關(guān)鍵的問題。
傳統(tǒng)的基于圖像特征的分類方法需要人工定義特征并選擇合適的分類器,
效果受限。而深度學(xué)習(xí)技術(shù)具有自動學(xué)習(xí)特征的能力,可以更好地解決圖像分
類問題。AlexNet是第一個在ImageNet比賽中取得優(yōu)異成績的CNN模型,具有
較高的準確率和速度,因此被廣泛應(yīng)用于圖像分類和物體識別任務(wù)中。
本項目旨在設(shè)計一種基于深度學(xué)習(xí)AlexNet模型的運動鞋品牌識別方法,
通過構(gòu)建數(shù)據(jù)集、訓(xùn)練模型和評估性能,實現(xiàn)對不同品牌運動鞋的自動化識別。
該方法可以應(yīng)用于電商、物流等領(lǐng)域,提高工作效率和準確性,為用戶提供更
好的服務(wù)體驗。
1
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
1.2Python簡介
Python是由GuidoRossum于1989年誕生。2005-2012年,Google大量應(yīng)
用python,引起廣泛關(guān)注,促進了python的發(fā)展。2012年云計算興起,其中
最主要的OpenStack框架由python開發(fā),使得python火了一把。2014年AI興
起,AI中大量關(guān)鍵算法都是由python開發(fā),因為python中含有很好的第三方
庫特別適合做算法,加上入門低、開發(fā)效率高,這樣又進一步促使python的火
爆。2017年python走進大眾視野(指非IT人士),走進學(xué)科教育。
如今已經(jīng)發(fā)展成一門廣泛使用的高級編程語言。它可應(yīng)用于網(wǎng)絡(luò)爬蟲、機
器學(xué)習(xí)、數(shù)據(jù)分析和可視化等多種領(lǐng)域。它的特點是開源(免費)、豐富的庫、
簡單易學(xué)、支持跨平臺而且可移植性強。
1.2.1AlexNet簡介
AlexNet是Hinton和他的學(xué)生AlexKrizhevsky在2012年ImageNet挑戰(zhàn)
賽中使用的模型結(jié)構(gòu),刷新ImageClassification的錯誤率,從此深度學(xué)習(xí)方
法在Image這塊開始一次次超過state-of-art,甚至于搭到打敗人類的地步,
看這邊文章的過程中,發(fā)現(xiàn)了很多以前零零散散看到的一些優(yōu)化技術(shù),但是很
多沒有深入了解。
AlexNet中包含了幾個比較新的技術(shù)點,也首次在CNN中成功應(yīng)用了ReLU、
Dropout和LRN等Trick。同時AlexNet也使用了GPU進行運算加速。
AlexNet將LeNet的思想發(fā)揚光大,把CNN的基本原理應(yīng)用到了很深很寬的
網(wǎng)絡(luò)中。AlexNet主要使用到的新技術(shù)點如下。
(1)成功使用ReLU作為CNN的激活函數(shù),并驗證其效果在較深的網(wǎng)絡(luò)超
過了Sigmoid,成功解決了Sigmoid在網(wǎng)絡(luò)較深時的梯度彌散問題。雖然ReLU
激活函數(shù)在很久之前就被提出了,但是直到AlexNet的出現(xiàn)才將其發(fā)揚光大。
(2)訓(xùn)練時使用Dropout隨機忽略一部分神經(jīng)元,以避免模型過擬合。
Dropout雖有單獨的論述,但是AlexNet將其實用化,通過實踐證實了它的效果。
在AlexNet中主要是最后幾個全連接層使用了Dropout。
(3)在CNN中使用重疊的最大池化。此前CNN中普遍使用平均池化,
AlexNet全部使用最大池化,避免平均池化的模糊化效果。并且AlexNet中提出
讓步長比池化核的尺寸小,這樣池化層的輸出之間會有重疊和覆蓋,提升了特
征的豐富性。
(4)提出了LRN層,對局部神經(jīng)元的活動創(chuàng)建競爭機制,使得其中響應(yīng)比
2
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
較大的值變得相對更大,并抑制其他反饋較小的神經(jīng)元,增強了模型的泛化能
力。
(5)使用CUDA加速深度卷積網(wǎng)絡(luò)的訓(xùn)練,利用GPU強大的并行計算能力,
處理神經(jīng)網(wǎng)絡(luò)訓(xùn)練時大量的矩陣運算。AlexNet使用了兩塊GTX580GPU進行訓(xùn)
練,單個GTX580只有3GB顯存,這限制了可訓(xùn)練的網(wǎng)絡(luò)的最大規(guī)模。因此作者
將AlexNet分布在兩個GPU上,在每個GPU的顯存中儲存一半的神經(jīng)元的參數(shù)。
因為GPU之間通信方便,可以互相訪問顯存,而不需要通過主機內(nèi)存,所以同
時使用多塊GPU也是非常高效的。同時,AlexNet的設(shè)計讓GPU之間的通信只在
網(wǎng)絡(luò)的某些層進行,控制了通信的性能損耗。
(6)數(shù)據(jù)增強,隨機地從256*256的原始圖像中截取224*224大小的區(qū)域
(以及水平翻轉(zhuǎn)的鏡像),相當于增加了2*(256-224)^2=2048倍的數(shù)據(jù)量。如
果沒有數(shù)據(jù)增強,僅靠原始的數(shù)據(jù)量,參數(shù)眾多的CNN會陷入過擬合中,使用
了數(shù)據(jù)增強后可以大大減輕過擬合,提升泛化能力。進行預(yù)測時,則是取圖片
的四個角加中間共5個位置,并進行左右翻轉(zhuǎn),一共獲得10張圖片,對他們進
行預(yù)測并對10次結(jié)果求均值。同時,AlexNet中提到了會對圖像的RGB數(shù)據(jù)進
行PCA處理,并對主成分做一個標準差為0.1的高斯擾動,增加一些噪聲,這
個Trick可以讓錯誤率再下降1%。
1.2.2PyCharm簡介
PyCharm是一種PythonIDE(集成開發(fā)環(huán)境),帶有一整套可以幫助用戶
在使用Python語言開發(fā)時提高其效率的工具,比如調(diào)試、語法高亮、項目管理、
代碼跳轉(zhuǎn)、智能提示、自動完成、單元測試、版本控制。此外,該IDE提供了
一些高級功能,以用于支持Django框架下的專業(yè)Web開發(fā)。本設(shè)計的代碼統(tǒng)一
用PyCharm來運行和展示。
1.2.3Python第三方庫簡介
Keras:數(shù)式模型接口是用戶定義多輸出模型、非循環(huán)有向模型或具有共享
層的模型等復(fù)雜模型的途徑。一句話,只要你的模型不是類似VGG一樣一條路
走到黑的模型,或者你的模型需要多于一個的輸出,那么你總應(yīng)該選擇函數(shù)式
模型。
Matplotlib:一個用Python實現(xiàn)的繪圖庫?,F(xiàn)在很多機器學(xué)習(xí),深度學(xué)習(xí)
教學(xué)資料中都用它來繪制函數(shù)圖形。在學(xué)習(xí)算法過程中,Matplotlib是一個非
常趁手的工具。
3
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
NumPy:常與SciPy(ScientificPython)和Matplotlib(繪圖庫)一起
使用。這種組合廣泛用于替代MatLab,是一個流行的技術(shù)計算平臺。但是,
Python作為MatLab的替代方案,現(xiàn)在被視為一種更加現(xiàn)代和完整的編程語言。
Pandas:一個免費、開源的第三方Python庫,是Python數(shù)據(jù)分析必不可
少的工具之一。其基于numPy庫開發(fā)而來,提供了兩種數(shù)據(jù)結(jié)構(gòu),Series(一
維數(shù)組結(jié)構(gòu))與DataFrame(二維數(shù)組結(jié)構(gòu)),這兩種數(shù)據(jù)結(jié)構(gòu)極大地增強的了
Pandas的數(shù)據(jù)分析能力。
Seaborn:基于matplotlib的圖形可視化python包。它提供了一種高度交
互式界面,便于用戶能夠做出各種有吸引力的統(tǒng)計圖表。
Sklearn:稱scikit-learn,是python中的機器學(xué)習(xí)庫,建立在numpy、
scipy、matplotlib等數(shù)據(jù)科學(xué)包的基礎(chǔ)之上,涵蓋了機器學(xué)習(xí)中的樣例數(shù)據(jù)、
數(shù)據(jù)預(yù)處理、模型驗證、特征選擇、分類、回歸、聚類、降維等幾乎所有環(huán)節(jié),
功能十分強大,目前sklearn版本是0.23。與深度學(xué)習(xí)庫存在pytorch、
TensorFlow等多種框架可選不同,sklearn是python中傳統(tǒng)機器學(xué)習(xí)的首選庫,
不存在其他競爭者。
TensorFlow:采用數(shù)據(jù)流圖(dataflowgraphs)來計算,所以首先我們得
創(chuàng)建一個數(shù)據(jù)流流圖,然后再將我們的數(shù)據(jù)(數(shù)據(jù)以張量(tensor)的形式存在)
放在數(shù)據(jù)流圖中計算.節(jié)點(Nodes)在圖中表示數(shù)學(xué)操作,圖中的邊(edges)
則表示在節(jié)點間相互聯(lián)系的多維數(shù)據(jù)數(shù)組,即張量(tensor)。訓(xùn)練模型時
tensor會不斷的從數(shù)據(jù)流圖中的一個節(jié)點flow到另一節(jié)點,這就是
TensorFlow名字的由來。
Keras:數(shù)式模型接口是用戶定義多輸出模型、非循環(huán)有向模型或具有共享
層的模型等復(fù)雜模型的途徑。一句話,只要你的模型不是類似VGG一樣一條路
走到黑的模型,或者你的模型需要多于一個的輸出,那么你總應(yīng)該選擇函數(shù)式
模型。
函數(shù)式模型是最廣泛的一類模型,序貫?zāi)P停⊿equential)只是它的一種
特殊情況。使用通用模型,首先要使用Input函數(shù)將輸入轉(zhuǎn)化為一個tensor,
然后將每一層用變量存儲后,作為下一層的參數(shù),最后使用Model類將輸入和
輸出作為參數(shù)即可搭建模型。
4
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
2需求分析
2.1項目可行性
基于深度學(xué)習(xí)AlexNet模型的運動鞋品牌識別方法在技術(shù)上是可行的。以
下是幾方面說明:
數(shù)據(jù)集構(gòu)建:數(shù)據(jù)集的數(shù)量和質(zhì)量對于深度學(xué)習(xí)模型的訓(xùn)練至關(guān)重要。在
運動鞋品牌識別任務(wù)中,可以通過網(wǎng)絡(luò)爬蟲、手工采集等方式獲取大量具有代
表性的圖像進行構(gòu)建。同時,采用數(shù)據(jù)增強技術(shù)可以增加數(shù)據(jù)集的多樣性和數(shù)
量,提高模型的泛化能力。
AlexNet模型應(yīng)用:AlexNet是第一個成功應(yīng)用于ImageNet比賽并取得優(yōu)
異成績的CNN模型,其具有較好的特征提取性能和分類性能。在本項目中,可
以利用預(yù)訓(xùn)練的AlexNet模型作為基礎(chǔ)模型,并使用遷移學(xué)習(xí)的方法對模型進
行微調(diào),以適應(yīng)運動鞋品牌識別任務(wù)。
模型評估:模型的評估方法主要包括準確率、召回率、F1值等指標??梢?/p>
將構(gòu)建好的數(shù)據(jù)集分為訓(xùn)練集和測試集,在訓(xùn)練集上訓(xùn)練模型,在測試集上進
行測試和評估,得到模型的性能指標。
實時性要求:模型的實時性要求取決于具體應(yīng)用場景。在一些應(yīng)用場景中,
如物流、電商等領(lǐng)域,需要對圖像進行快速準確的識別,因此需要對模型進行
優(yōu)化和加速??梢圆捎蒙疃葘W(xué)習(xí)框架提供的GPU加速、模型壓縮等方法來滿足
實時性要求。
綜上所述,基于深度學(xué)習(xí)AlexNet模型的運動鞋品牌識別方法在技術(shù)上是
可行的,可以通過數(shù)據(jù)集構(gòu)建、AlexNet模型應(yīng)用、模型評估和實時性優(yōu)化等方
面來實現(xiàn)。
2.2關(guān)鍵技術(shù)分析
2.2.1數(shù)據(jù)采集技術(shù)
網(wǎng)絡(luò)爬蟲也叫網(wǎng)絡(luò)機器人,顧名思義就是代替人類手工,利用程序或腳本
來自動穿梭互聯(lián)網(wǎng),并進行數(shù)據(jù)信息的采集。網(wǎng)絡(luò)爬蟲按照實現(xiàn)的技術(shù)和結(jié)構(gòu)
可以分為通用網(wǎng)絡(luò)爬蟲、聚焦網(wǎng)絡(luò)爬蟲、增量式網(wǎng)絡(luò)爬蟲、深層網(wǎng)絡(luò)爬蟲等類
型。
通用網(wǎng)絡(luò)爬蟲:主要由初始URL集合、URL隊列、頁面爬行模塊、頁面分析
5
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
模塊、頁面數(shù)據(jù)庫、鏈接過濾模塊等構(gòu)成。
聚焦網(wǎng)絡(luò)爬蟲:主要由初始URL集合、URL隊列、頁面爬行模塊、頁面分析
模塊、頁面數(shù)據(jù)庫、鏈接過濾模塊、內(nèi)容評價模塊、鏈接評價模塊等構(gòu)成。
增量式網(wǎng)絡(luò)爬蟲:用來爬取新產(chǎn)生的網(wǎng)頁或者內(nèi)容被更新的網(wǎng)頁數(shù)據(jù),這
樣可以有效地減少網(wǎng)頁的下載量,減少訪問時間和存儲空間的耗費,但是增加
了網(wǎng)頁抓取算法的復(fù)雜度和實現(xiàn)難度,所以主要用在有更新需求的數(shù)據(jù)。
深層網(wǎng)絡(luò)爬蟲:主要由URL列表、LVS列表(LVS指的是標簽/數(shù)值集合,
即填充表單的數(shù)據(jù)源)、爬行控制器、解析器、LVS控制器、表單分析器、表單
處理器、響應(yīng)分析器等部分構(gòu)成。
本篇的需求來說,我們選取的是聚焦網(wǎng)絡(luò)爬蟲。聚焦網(wǎng)絡(luò)爬蟲的基本工作
流程:
先獲取初始的URL、根據(jù)初始的URL爬取頁面,并從中選取新的目標URL,
從新的URL中過濾掉與爬取目標無關(guān)的鏈接;再將過濾后的鏈接放到URL隊列
中,對新URL進行爬??;直至爬取到所需數(shù)據(jù)時停止爬行;最后對數(shù)據(jù)進行處
理后存儲。
2.2.2數(shù)據(jù)集可視化技術(shù)
數(shù)據(jù)可視化,是關(guān)于數(shù)據(jù)視覺表現(xiàn)形式的科學(xué)技術(shù)研究。其中,這種數(shù)據(jù)
的視覺表現(xiàn)形式被定義為,一種以某種概要形式抽提出來的信息,包括相應(yīng)信
息單位的各種屬性和變量。
數(shù)據(jù)可視化主要旨在借助于圖形化手段,清晰有效地傳達與溝通信息。而
本篇主要利用簡單的數(shù)據(jù)可視化技術(shù),來展示獲取不同品牌鞋子的共性或差異
等信息,有助于指導(dǎo)后續(xù)的數(shù)據(jù)采集和模型優(yōu)化。
2.2.3AlexNet模型
AlexNet模型包含五個卷積層和三個全連接層,最后一層輸出每個類別的概
率分布。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,AlexNet使用ReLU(rectifiedlinear
unit)作為激活函數(shù),大大加速了訓(xùn)練速度。此外,AlexNet還使用了Dropout
技術(shù)來防止過擬合。
AlexNet模型結(jié)構(gòu)如下圖所示。
6
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖2-1模型結(jié)構(gòu)
lexNet的創(chuàng)新之處在于它將深度學(xué)習(xí)方法應(yīng)用于圖像分類任務(wù),并且證明
了深度卷積神經(jīng)網(wǎng)絡(luò)可以取得非常好的性能。
3數(shù)據(jù)采集
3.1運動鞋數(shù)據(jù)采集
從網(wǎng)絡(luò)上收集運動鞋圖片,可以選取一些已知的網(wǎng)站,例如淘寶、京東、
天貓。如圖所示。
圖3-1數(shù)據(jù)集
3.2數(shù)據(jù)集獲取分析
1.數(shù)據(jù)收集:需要從不同的運動鞋品牌中收集圖像數(shù)據(jù),以覆蓋多個品牌、
型號和顏色等不同特征??梢栽诨ヂ?lián)網(wǎng)上搜索、采集或購買相關(guān)數(shù)據(jù),也可以
通過自行拍攝等方式進行收集。
2.數(shù)據(jù)清洗:對于收集到的圖像數(shù)據(jù),需要進行清洗,去除模糊、重疊、
異常、重復(fù)等無用數(shù)據(jù),確保數(shù)據(jù)的準確性和可用性。同時需要對每個圖像進
行標注,即給每個圖像打上標簽、標注品牌、型號等信息。
3.數(shù)據(jù)劃分:將數(shù)據(jù)集劃分為訓(xùn)練集、驗證集和測試集。通??梢詫?shù)據(jù)
集的80%用于訓(xùn)練集,10%用于驗證集和測試集。訓(xùn)練集用于模型訓(xùn)練,驗證集
用于模型選擇和調(diào)優(yōu),測試集是最終評估模型性能的關(guān)鍵。
7
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
4.數(shù)據(jù)增強:通過數(shù)據(jù)增強技術(shù),將已有的圖像數(shù)據(jù)進行多樣化處理,以
增加數(shù)據(jù)集的多樣性和復(fù)雜性??梢允褂眯D(zhuǎn)、翻轉(zhuǎn)、剪裁、縮放、亮度、對
比度、顏色等方式進行數(shù)據(jù)增強。
5.數(shù)據(jù)預(yù)處理:在將數(shù)據(jù)輸入到AlexNet模型之前,需要進行一系列的預(yù)
處理操作,包括圖像歸一化(將圖像大小、像素值、顏色等進行統(tǒng)一化)、縮
放、裁剪、標準化等操作。
基于以上數(shù)據(jù)集分析,可以構(gòu)建適合于AlexNet模型運動鞋品牌識別的數(shù)
據(jù)集,并進行深度學(xué)習(xí)模型的訓(xùn)練和評估。
3.3編程實現(xiàn)
創(chuàng)建train.py進行解析,代碼如下圖所示。
圖3-2數(shù)據(jù)集解析代碼
4數(shù)據(jù)集預(yù)處理與數(shù)據(jù)可視化
4.1數(shù)據(jù)集預(yù)處理
數(shù)據(jù)可視化技術(shù)的基本思想是將數(shù)據(jù)庫中每一個數(shù)據(jù)項作為單個圖元元素
8
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
表示,大量的數(shù)據(jù)集構(gòu)成數(shù)據(jù)圖像,同時將數(shù)據(jù)的各個屬性值以多維數(shù)據(jù)的形
式表示,可以從不同的維度觀察數(shù)據(jù),從而對數(shù)據(jù)進行更深入的觀察和分析。
為了更直觀的展示數(shù)據(jù)集,以便于后續(xù)對模型的改進與評估,本篇用餅圖和詞
云圖來進行數(shù)據(jù)可視化。
數(shù)據(jù)預(yù)處理(datapreprocessing)是指在主要的處理以前對數(shù)據(jù)進行的一
些處理。為了更好的訓(xùn)練效果要將數(shù)據(jù)集切分成訓(xùn)練集、測試集和驗證集。
4.2數(shù)據(jù)可視化
為了直觀的看見我們可以將訓(xùn)練好的模型中的參數(shù)可視化出來,以了解每
個權(quán)重和偏置的取值范圍、分布情況等信息。具體代碼如下所示。
圖4-1數(shù)據(jù)集可視化代碼
運行代碼main.py后查看,得到如下效果。
9
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖4-2數(shù)據(jù)集可視化效果
4.3切分數(shù)據(jù)集
為了更好的訓(xùn)練、測試、優(yōu)化、評估模型,需要對準備的數(shù)據(jù)集進行切分。
數(shù)據(jù)集一般會被切分為三種:訓(xùn)練集、測試集和驗證集。
1、訓(xùn)練集(trainset):用于訓(xùn)練模型以及確定參數(shù)。
2、驗證集(validationset):用于確定網(wǎng)絡(luò)結(jié)構(gòu)以及調(diào)整模型的超參數(shù)。
3、測試集(testset):用于檢驗?zāi)P偷姆夯芰Α?/p>
本次數(shù)據(jù)切分采用分層切分數(shù)據(jù)集的方法。下面是具體的代碼。
圖4-3數(shù)據(jù)集切分
5模型構(gòu)建及評估分析
5.1模型構(gòu)建
數(shù)據(jù)集準備,收集足夠數(shù)量的各品牌的運動鞋圖片,并進行數(shù)據(jù)預(yù)處理,
如圖像大小調(diào)整、色彩空間轉(zhuǎn)換等。
10
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖5-1數(shù)據(jù)集準備代碼
模型構(gòu)建,使用AlexNet作為基礎(chǔ)模型,一般包括五個卷積層和三個全連
接層,通過修改AlexNet最后的輸出層,訓(xùn)練出適用于運動鞋品牌識別的模型。
其中ConvolutionalNeuralNetworks(CNNs)通常表現(xiàn)優(yōu)異,最后一層可根據(jù)具
體問題設(shè)定,可以是softmax函數(shù)或者sigmoid函數(shù)。
圖5-2模型構(gòu)建代碼
訓(xùn)練模型:使用已經(jīng)準備好的數(shù)據(jù)集對模型進行訓(xùn)練,通常采用隨機梯度
下降(StochasticGradientDescent)和反向傳播算法(BackPropagation
Algorithm)進行優(yōu)化,使得模型能夠較好地識別不同品牌的運動鞋。
11
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖5-3模型訓(xùn)練代碼
模型測試:將預(yù)先保留的測試集數(shù)據(jù)輸入到訓(xùn)練好的模型中,以評估模型
的性能表現(xiàn)。
模型優(yōu)化:根據(jù)實驗結(jié)果調(diào)整模型參數(shù),重新訓(xùn)練模型,提高模型性能。
5.2模型編譯
為了能夠使用基于深度學(xué)習(xí)AlexNet模型的運動鞋品牌識別方法,需要先
定義輸入數(shù)據(jù)的形狀和類別數(shù),然后搭建AlexNet模型結(jié)構(gòu),并對其進行編譯。
圖5-4模型編譯代碼
在編譯時,通常需要指定損失函數(shù)、優(yōu)化器和評估指標等參數(shù),以便在訓(xùn)
練過程中可以得到合適的反饋信息。本次采用交叉熵損失函數(shù)
categorical_crossentropy、隨機梯度下降優(yōu)化器(SGD)和準確率評估指標等
參數(shù),同時還需要注意設(shè)置學(xué)習(xí)率、動量等超參數(shù),以保證模型能夠快速收斂
到較好的精度。
最后,還需要使用model.summary()輸出模型的結(jié)構(gòu)和參數(shù)信息,以便更好
地觀察模型的特點和性能表現(xiàn)。整個模型編譯的流程包括模型構(gòu)建、模型編譯
12
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
和模型結(jié)構(gòu)輸出三個步驟,這些步驟都需要仔細調(diào)試和優(yōu)化,以獲得最佳的模
型性能。
5.3結(jié)果分析
為了評估模型的性能表現(xiàn),我們使用測試集數(shù)據(jù)進行驗證,并計算出分類
精度等相關(guān)指標。在本次實驗中,我們將準確率作為主要評估指標,計算出正
確分類的樣本數(shù)占總樣本數(shù)的比例,以此來評估模型的性能表現(xiàn)。具體地,我
們使用測試集數(shù)據(jù)輸入到訓(xùn)練好的模型中,獲取測試損失值和測試精度。測試
精度即為分類精度,表示模型對測試集數(shù)據(jù)進行分類時,正確分類的數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 靜脈治療安全管理制度
- 2025河北邢臺市人民醫(yī)院招聘編外工作人員41人考試筆試備考題庫及答案解析
- 2025福建省能源石化集團有限責(zé)任公司秋季招聘416人筆試考試備考題庫及答案解析
- 預(yù)防動脈硬化宣教
- 2025年黑河市愛輝區(qū)花園社區(qū)衛(wèi)生服務(wù)中心招聘編制外工作人員5人筆試考試參考題庫及答案解析
- 2025版癲癇發(fā)作常見癥狀及護理禁忌
- 酒店客房實訓(xùn)總結(jié)
- 智能家電產(chǎn)品介紹
- 星空之謎梵高水粉課件
- 中建安全實訓(xùn)答辯
- 數(shù)據(jù)庫應(yīng)用技術(shù)-004-國開機考復(fù)習(xí)資料
- 手衛(wèi)生執(zhí)行率PDCA案例實施分析
- 病理學(xué)考試練習(xí)題庫及答案
- 2025年新高考1卷(新課標Ⅰ卷)語文試卷
- 2025-2030中國女鞋行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 2025至2030中國物理氣相沉積(PVD)設(shè)備行業(yè)行情監(jiān)測與發(fā)展動向追蹤報告
- 2025年中國EP級蓖麻油行業(yè)市場前景預(yù)測及投資價值評估分析報告
- 散酒采購合同協(xié)議
- 工控網(wǎng)管理制度
- 大學(xué)英語四級考試2024年12月真題(第一套)Part II Listening Comprehension
- 測量年終工作總結(jié)
評論
0/150
提交評論