TensorFlow2深度學習實戰(zhàn)(第2版)(微課版) 課件 項目4-8 基于CNN的彩色圖像分類-基于TipDM大數(shù)據(jù)挖掘建模平臺的彩色圖像分類_第1頁
TensorFlow2深度學習實戰(zhàn)(第2版)(微課版) 課件 項目4-8 基于CNN的彩色圖像分類-基于TipDM大數(shù)據(jù)挖掘建模平臺的彩色圖像分類_第2頁
TensorFlow2深度學習實戰(zhàn)(第2版)(微課版) 課件 項目4-8 基于CNN的彩色圖像分類-基于TipDM大數(shù)據(jù)挖掘建模平臺的彩色圖像分類_第3頁
TensorFlow2深度學習實戰(zhàn)(第2版)(微課版) 課件 項目4-8 基于CNN的彩色圖像分類-基于TipDM大數(shù)據(jù)挖掘建模平臺的彩色圖像分類_第4頁
TensorFlow2深度學習實戰(zhàn)(第2版)(微課版) 課件 項目4-8 基于CNN的彩色圖像分類-基于TipDM大數(shù)據(jù)挖掘建模平臺的彩色圖像分類_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

基于CNN的彩色圖像分類了解彩色圖像分類數(shù)據(jù)讀取與預處理構(gòu)建與訓練卷積神經(jīng)網(wǎng)絡模型評價了解背景圖像分類圖像分類是一種使計算機能夠根據(jù)圖像內(nèi)容將其分為預定義類別的計算機視覺技術(shù),在多個領域發(fā)揮著至關(guān)重要的作用。醫(yī)療影像分析自動駕駛電商推薦系統(tǒng)數(shù)據(jù)說明

CIFAR-10數(shù)據(jù)集是計算機視覺領域中廣泛使用的基準數(shù)據(jù)集,CIFAR-10數(shù)據(jù)集由10個類別的總計60000張尺寸為32×32的彩色圖像組成。飛機(Airplane)鳥(Bird)汽車(Automobile)貓(Cat)卡車(Truck)鹿(Deer)船(Ship)狗(Dog)馬(Horse)蛙(Frog)設計彩色圖像分類的流程與步驟①讀取CIFAR-10數(shù)據(jù)集(訓練集為50000個樣本,測試集為10000個樣本)③構(gòu)建和編譯卷積神經(jīng)網(wǎng)絡對模型進行性能評估,并使用保存好的模型對testimages文件下的15個新樣本進行預測④訓練卷積神經(jīng)網(wǎng)絡并保存模型②對CIFAR-10數(shù)據(jù)集進行歸一化處理了解彩色圖像分類數(shù)據(jù)讀取與預處理構(gòu)建與訓練卷積神經(jīng)網(wǎng)絡模型評價數(shù)據(jù)讀取與預處理任務描述獲取數(shù)據(jù)集并預覽CIFAR-10數(shù)據(jù)集的維度和類別,然后使用TensorFlow框架對圖像數(shù)據(jù)進行歸一化,以便后續(xù)的模型訓練和評估。任務分析獲取CIFAR-10數(shù)據(jù)集并將圖像數(shù)據(jù)和標簽數(shù)據(jù)轉(zhuǎn)換為NumPy數(shù)組格式。對CIFAR-10數(shù)據(jù)集的部分圖像進行可視化。對訓練集和測試集的圖像進行歸一化處理并將數(shù)據(jù)保存。了解彩色圖像分類數(shù)據(jù)讀取與預處理構(gòu)建與訓練卷積神經(jīng)網(wǎng)絡模型評價構(gòu)建與訓練卷積神經(jīng)網(wǎng)絡任務描述構(gòu)建卷積神經(jīng)網(wǎng)絡,使用預處理后的數(shù)據(jù)集來訓練卷積神經(jīng)網(wǎng)絡,并在訓練完成后將模型保存在指定路徑。任務分析構(gòu)建和編譯圖像分類卷積神經(jīng)網(wǎng)絡。訓練卷積神經(jīng)網(wǎng)絡并保存訓練好的模型。構(gòu)建與訓練卷積神經(jīng)網(wǎng)絡①定義1個輸入層,用于接收數(shù)據(jù)③定義1個Flatten層將三維特征向量展平為一維特征向量使用adam優(yōu)化器和稀疏分類交叉熵損失函數(shù)進行編譯卷積神經(jīng)網(wǎng)絡④定義1個全連接層進行特征的非線性組合、1個50%的Dropout層防止過擬合和1個輸出層②定義3個連續(xù)的卷積塊,每個卷積塊都包含2個3×3卷積層、1個2×2最大池化層和1個25%Dropout層了解彩色圖像分類數(shù)據(jù)讀取與預處理構(gòu)建與訓練卷積神經(jīng)網(wǎng)絡模型評價模型評價任務描述加載模型并使用測試集的數(shù)據(jù)來評估模型的性能,輸出模型在測試集上的準確率和損失值,并使用訓練好的模型對新圖像進行預測。任務分析加載已保存的模型并使用測試集數(shù)據(jù)對模型進行性能評估。加載訓練好的CNN模型實現(xiàn)圖像分類,并輸出需要預測的圖像和對應的預測結(jié)果。項目小結(jié)本章詳細闡述了使用卷積神經(jīng)網(wǎng)絡對CIFAR-10數(shù)據(jù)集進行圖像分類的完整流程,主要流程包括數(shù)據(jù)加載、數(shù)據(jù)預處理、構(gòu)建網(wǎng)絡、編譯網(wǎng)絡、訓練網(wǎng)絡、性能評價、模型的保存以及使用模型對新圖像進行預測。通過這一流程,可以學習到對圖片的處理方法以及CNN模型的構(gòu)建過程,包括選擇合適的卷積層、池化層和全連接層來構(gòu)建網(wǎng)絡架構(gòu)?;贑NN的門牌號識別目標分析數(shù)據(jù)預處理構(gòu)建網(wǎng)絡模型評估了解背景自動識別現(xiàn)實世界中的阿拉伯數(shù)字的技術(shù)已得到廣泛應用,如門牌號識別、車牌號碼識別等,但真實場景拍攝的圖像中所包含的字符存在磨損、傾斜、遮擋等情況對目標的識別的影響仍較大。通過實現(xiàn)自然場景圖像識別問題中一個存在局限性的實例:從街景圖像中的門牌上讀取數(shù)字,以進一步學習自然場景圖像識別問題。數(shù)據(jù)說明SVHN數(shù)據(jù)集由從真實世界的街景門牌圖像中提取出的門牌號圖像組成,共有10類,訓練集中的圖像共有33402幅,測試集中的圖像共有13068幅,且訓練集與測試集中的圖像沒有交集。SVHN數(shù)據(jù)集中的部分樣本帶有邊界框的SVHN數(shù)據(jù)集中的部分樣本設計門牌號識別流程與步驟①讀取SVHN數(shù)據(jù)集。③構(gòu)建卷積神經(jīng)網(wǎng)絡,設置網(wǎng)絡的激活函數(shù)和分類器等。對模型的性能進行評估,并讀取保存的模型對門牌號進行識別。④訓練網(wǎng)絡并保存模型。②提取數(shù)據(jù)集中的目標數(shù)據(jù)與背景數(shù)據(jù);提取數(shù)據(jù)的HOG特征,并使用支持向量機分類器查看提取的特征是否為數(shù)字。目標分析數(shù)據(jù)預處理構(gòu)建網(wǎng)絡模型評估了解HOG特征HOG特征是一種在計算機視覺和圖像處理中用來進行物體檢測的特征描述子。它通過計算和統(tǒng)計圖像局部區(qū)域的HOG來構(gòu)成特征。其主要思想是在一幅圖像中,局部目標的表象和形狀能夠被梯度或邊緣的方向密度分布很好地描述。采用伽馬校正法對圖像的RGB顏色空間進行標準化。采用灰度化法實現(xiàn)圖像彩色向灰色的轉(zhuǎn)換。計算圖像水平和垂直方向的梯度。計算網(wǎng)格方向梯度的權(quán)重并繪制梯度直方圖。計算塊描述子,將特征向量歸一化。伽馬校正伽馬校正是用來實現(xiàn)圖像增強的,其提升了暗部細節(jié)。伽馬校正通過非線性變換,讓圖像對曝光強度的線性響應更接近人眼感受到的響應。歸一化預補償反歸一化數(shù)據(jù)預處理任務描述原始數(shù)據(jù)中的圖像信息和邊界框信息存儲于不同形式的數(shù)據(jù)集中,無法直接對其進行建模分析,需要對數(shù)據(jù)進行預處理,包括數(shù)據(jù)獲取、HOG特征提取和目標檢測3個步驟。任務分析獲取目標與背景數(shù)據(jù)。提取圖像的HOG特征,并使用SVM分類器進行特征識別,對目標數(shù)字進行定位。目標分析數(shù)據(jù)預處理構(gòu)建網(wǎng)絡模型評估任務描述本任務需要構(gòu)建的卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)示意圖如下圖。其中卷積層、池化層、Flatten層和全連接層是卷積神經(jīng)網(wǎng)絡的核心模塊。任務分析讀取用于訓練卷積神經(jīng)網(wǎng)絡的數(shù)字圖像訓練集和數(shù)字圖像測試集。構(gòu)建卷積神經(jīng)網(wǎng)絡包括二維卷積層Conv2D、二維最大池化層MaxPool2D、Flatten層、全連接層Dense等。對構(gòu)建好的卷積神經(jīng)網(wǎng)絡進行訓練并保存訓練好的模型。目標分析數(shù)據(jù)預處理構(gòu)建網(wǎng)絡模型評估模型評估任務描述對訓練好的模型進行性能評估,查看模型的泛化和識別能力,最后通過加載保存的模型實現(xiàn)對門牌號的識別。任務分析使用測試集數(shù)據(jù)對模型進行性能評估使用訓練好的HOG+SVM數(shù)字目標檢測器和CNN模型識別測試集中門牌圖像的數(shù)字。項目小結(jié)本章使用卷積神經(jīng)網(wǎng)絡實現(xiàn)對街景門牌號的識別。提取數(shù)據(jù)集中的目標數(shù)據(jù)和背景數(shù)據(jù)。重點介紹了實現(xiàn)基于HOG特征提取和SsVM分類器的目標檢測的過程,并實現(xiàn)街景門牌圖像中目標數(shù)字的提取。通過卷積神經(jīng)網(wǎng)絡實現(xiàn)對數(shù)字的識別,通過調(diào)整網(wǎng)絡的參數(shù)提高模型的識別精度,并保存訓練完畢的模型方便下次調(diào)用。對模型識別門牌號的能力進行測試?;贚STM網(wǎng)絡的語音識別目標分析數(shù)據(jù)預處理構(gòu)建網(wǎng)絡訓練網(wǎng)絡模型評估了解背景語音識別技術(shù)的目標是將一段語音轉(zhuǎn)換成對應的文本信息。目前語音識別的研究已經(jīng)取得了顯著的成果,在通信、交通、自動化等領域都可以看見它的身影。智能語音助手數(shù)據(jù)說明選取18個人用英語朗讀的3900條數(shù)字語音。訓練集中的部分語音數(shù)據(jù)測試集中的語音數(shù)據(jù)設計語音識別流程與步驟選取18個人用英語朗讀的3900條數(shù)字語音。①讀取數(shù)字語音數(shù)據(jù)。③基于LSTM網(wǎng)絡構(gòu)建語音識別網(wǎng)絡,設置網(wǎng)絡超參數(shù)。對模型進行泛化能力的測試,并對訓練結(jié)果進行評估。④編譯網(wǎng)絡,訓練并保存訓練好的模型,調(diào)整模型的超參數(shù)使得模型能夠達到較好的性能。②將數(shù)據(jù)集劃分為訓練集和測試集,提取數(shù)據(jù)集中的MFCC特征,并標準化數(shù)據(jù)。目標分析數(shù)據(jù)預處理構(gòu)建網(wǎng)絡訓練網(wǎng)絡模型評估提取MFCC特征梅爾頻率倒譜系數(shù)特征,是基于人的聽覺系統(tǒng)建立的倒譜系數(shù)。人的聽覺系統(tǒng)是一個特殊的非線性系統(tǒng),它響應不同頻率信號的靈敏度是不同的,通常是一個對數(shù)關(guān)系。數(shù)據(jù)預處理任務描述使用的語音數(shù)據(jù)為WAV文件,但LSTM網(wǎng)絡要求輸入的是數(shù)值型數(shù)據(jù),因此需要對語音數(shù)據(jù)進行特征提取以及標準化處理。任務分析將數(shù)據(jù)集劃分為訓練集、驗證集和測試集。對語音數(shù)據(jù)進行特征提取并繪制原始語音的波形圖和MFCC特征熱力圖。對數(shù)據(jù)進行標準化處理并存儲。目標分析數(shù)據(jù)預處理構(gòu)建網(wǎng)絡訓練網(wǎng)絡模型評估任務描述原始的RNN可以用于序列建模,但是在長序列建模中,為了捕獲長序列中的語義,需要在多個時間步長運行RNN,此時RNN會因為層次的加深導致梯度消失和爆炸。在LSTM網(wǎng)絡中,每個神經(jīng)元都有要記住的內(nèi)容和要忘記的內(nèi)容,以及使用門來更新存儲器。LSTM網(wǎng)絡的使用如下圖。本任務選用LSTM網(wǎng)絡實現(xiàn)語音識別,設置網(wǎng)絡的超參數(shù)并構(gòu)建網(wǎng)絡層的結(jié)構(gòu)。任務分析設置網(wǎng)絡超參數(shù)。構(gòu)建網(wǎng)絡層包括LSTM層、全連接層、丟棄層、輸出層,并在輸出層采用Softmax激活函數(shù)。目標分析數(shù)據(jù)預處理構(gòu)建網(wǎng)絡訓練網(wǎng)絡模型評估訓練網(wǎng)絡任務描述保存訓練好的模型,并用于新的語音數(shù)據(jù)集的識別。通過不斷改變模型的參數(shù),最終獲得效果較好的模型。任務分析使用Adam優(yōu)化器編譯網(wǎng)絡。讀取數(shù)據(jù)訓練構(gòu)建好的模型并保存。調(diào)整模型的參數(shù)以提高模型的性能。目標分析數(shù)據(jù)預處理構(gòu)建網(wǎng)絡訓練網(wǎng)絡模型評估模型評估任務描述對已保存的模型進行泛化測試,調(diào)用模型對語音數(shù)據(jù)進行預測,并分析預測的結(jié)果。任務分析對模型進行泛化測試以評估模型。分析預測結(jié)果。項目小結(jié)本章通過LSTM網(wǎng)絡實現(xiàn)對語音數(shù)據(jù)的識別,重點介紹了MFCC特征提取的過程,并對提取的特征數(shù)據(jù)進行標準化,使其可以滿足網(wǎng)絡的輸入要求。通過改變網(wǎng)絡的參數(shù),提高模型的精度,保存訓練完畢的模型,方便下次調(diào)用,并對模型的泛化能力進行測試,對模型的結(jié)果進行分析?;贑ycleGAN的圖像風格轉(zhuǎn)換目標分析讀取數(shù)據(jù)數(shù)據(jù)預處理構(gòu)建網(wǎng)絡訓練網(wǎng)絡結(jié)果分析了解背景指利用算法學習一幅圖像的風格,然后把這種風格應用到另外一幅圖像上的技術(shù),是一類視覺和圖形問題,其目標是獲得輸入圖像和輸出圖像之間的映射??ㄍV鏡圖像修復設計圖像風格轉(zhuǎn)換流程與步驟①加載油畫與現(xiàn)實風景圖像數(shù)據(jù)集③構(gòu)建CycleGAN,即構(gòu)建生成器與判別器對訓練結(jié)果進行分析④訓練網(wǎng)絡,包括定義損失函數(shù)、定義優(yōu)化器、定義圖像生成函數(shù)和定義訓練函數(shù)等②數(shù)據(jù)預處理,包括隨機抖動、歸一化處理、對所有圖像做批處理并打亂和建立迭代器目標分析讀取數(shù)據(jù)數(shù)據(jù)預處理構(gòu)建網(wǎng)絡訓練網(wǎng)絡結(jié)果分析讀取數(shù)據(jù)任務描述將油畫與現(xiàn)實風景圖像數(shù)據(jù)集轉(zhuǎn)換為張量格式。任務分析讀取圖像數(shù)據(jù)。將數(shù)據(jù)轉(zhuǎn)換成TensorFlow框架所需要的格式,即張量格式。目標分析讀取數(shù)據(jù)數(shù)據(jù)預處理構(gòu)建網(wǎng)絡訓練網(wǎng)絡結(jié)果分析數(shù)據(jù)預處理任務描述原始圖像數(shù)據(jù)進行數(shù)據(jù)預處理,包括隨機抖動、歸一化處理圖像、對所有圖像做批處理并打亂,以及建立迭代器。任務分析利用隨機抖動的方法進行數(shù)據(jù)擴充。歸一化處理圖像。分別對訓練集與測試集圖像做批處理并打亂。建立迭代器使每次迭代僅取出一幅圖像作為結(jié)果輸出。目標分析讀取數(shù)據(jù)數(shù)據(jù)預處理構(gòu)建網(wǎng)絡訓練網(wǎng)絡結(jié)果分析任務描述本任務需要構(gòu)建CycleGAN網(wǎng)絡,CycleGAN需要兩個生成器—G和F,兩個判別器—Dx和Dy,其網(wǎng)絡結(jié)構(gòu)如下圖。兩個生成器與兩個判別器的作用如下。生成器G將圖像X轉(zhuǎn)換為Y(G:X→Y)。生成器F將圖像Y轉(zhuǎn)換為X(F:Y→X)。判別器Dx區(qū)分圖像X與生成的圖像X。判別器Dy區(qū)分圖像Y與生成的圖像Y。任務分析安裝tensorflow_examples庫。將本書配套的tensorflow_examples文件夾放入對應的Python路徑中,默認路徑為“C:\Users\用戶名\Anaconda3\Lib\site-packages”。tensorflow_examples中包含功能完整的Pix2Pix網(wǎng)絡項目。Pix2Pix網(wǎng)絡是GAN的變種之一,主體結(jié)構(gòu)同樣是生成器和判別器,構(gòu)建網(wǎng)絡時直接調(diào)用即可,能有效減小代碼篇幅,看起來簡潔明了。從tensorflow_examples中調(diào)用Pix2Pix網(wǎng)絡的生成器與判別器來構(gòu)建兩個生成器與兩個判別器,歸一化層選擇實例歸一化層。目標分析讀取數(shù)據(jù)數(shù)據(jù)預處理構(gòu)建網(wǎng)絡訓練網(wǎng)絡結(jié)果分析訓練網(wǎng)絡任務描述本任務需要訓練構(gòu)建的CycleGAN網(wǎng)絡,包括定義損失函數(shù)、定義優(yōu)化器、定義圖像生成函數(shù)和定義訓練函數(shù)等。任務實現(xiàn)定義損失函數(shù)。定義優(yōu)化器。定義圖像生成函數(shù)。定義訓練函數(shù)包括獲取預測、計算損失值、使用反向傳播計算損失值和將梯度應用于優(yōu)化器。訓練網(wǎng)絡。目標分析讀取數(shù)據(jù)數(shù)據(jù)預處理構(gòu)建網(wǎng)絡訓練網(wǎng)絡結(jié)果分析結(jié)果分析本任務將以“將現(xiàn)實風景圖像的風格轉(zhuǎn)換為油畫風格”這一條風格轉(zhuǎn)換路線來做結(jié)果分析,觀察一定次數(shù)的迭代之后生成的圖像并總結(jié)其特點。對比分析經(jīng)歷不同次數(shù)迭代后網(wǎng)絡生成的圖像所發(fā)生的變化。任務實現(xiàn)當epoch=0時,即網(wǎng)絡第1次迭代后,生成的轉(zhuǎn)換圖像基本沒有變化,如下圖。任務實現(xiàn)當epoch=9時,即網(wǎng)絡第10次迭代后,已經(jīng)能夠生成具有簡單色彩的圖像,如下圖。任務實現(xiàn)當epoch=19時,即網(wǎng)絡第20次迭代后,現(xiàn)實風景圖像已經(jīng)具有了油畫風格,如下圖。項目小結(jié)本章主要實現(xiàn)了基于CycleGAN將現(xiàn)實風景圖像的風格轉(zhuǎn)換成油畫風格。讀取數(shù)據(jù),對圖像進行數(shù)據(jù)預處理。構(gòu)建生成器與判別器。訓練CycleGAN,包括定義損失函數(shù)、定義優(yōu)化器、定義圖像生成函數(shù)和定義訓練函數(shù)等。對轉(zhuǎn)換的結(jié)果進行分析?;赥ipDM大數(shù)據(jù)挖掘建模平臺的彩色圖像分類使用平臺配置彩色圖像分類案例的步驟和流程在TipDM大數(shù)據(jù)挖掘建模平臺上配置彩色圖像分類項目的總體流程如下圖。使用平臺配置彩色圖像分類案例的步驟和流程在平臺上進行配置的總體流程如右圖。配置數(shù)據(jù)源流程與步驟(1)配置數(shù)據(jù)源。(2)數(shù)據(jù)預處理。(3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論