版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
I第1章緒論1.1研究背景及意義我國作為世界上的人口大國,隨著國家的發(fā)展和提高,人們逐漸關(guān)注自身健康問題,在當(dāng)今社會對人體健康最主要的影響莫過于胸部疾病,胸部有著人體眾多重要器官,也是患病的高發(fā)區(qū),且疾病種類繁多。而現(xiàn)在全世界每年受胸部疾病的人數(shù)高達4.5億而常見胸部疾病的種類有很多如:肺炎、肺結(jié)節(jié)、等等,所以胸部疾病的早期檢測,預(yù)防和診斷已經(jīng)成為在新時代的重要研究方向,然而在我國對于這方面研究的專業(yè)人員的培養(yǎng)時間成本和金錢成本過高,導(dǎo)致專家稀少,工作強度高等問題,目前,我國醫(yī)療領(lǐng)域主要是運用醫(yī)療影像來輔助醫(yī)生對于疾病的診斷,因為醫(yī)療影像檢測相對于其他檢查方式來說,它可以達到無創(chuàng)檢測,對人體的傷害最小的方法找到病灶,而且可以對病灶進行定位和初步形態(tài)特征的確定,所以醫(yī)療影像是在現(xiàn)階段,協(xié)助醫(yī)生進行前期診斷的重要工具,也是醫(yī)學(xué)領(lǐng)域檢查胸部各種疾病的主要方法。當(dāng)前來說胸部疾病的影像檢測方法一般是胸部X光片和胸部CT(ComputedTomography)圖像等,當(dāng)中胸部X光片檢測是全部胸部疾病前期初查的首選方法,他的優(yōu)點在于價格低,保存時間長、操作簡單,對于絕大多數(shù)胸部疾病診斷的問題都可以解決。據(jù)數(shù)據(jù)顯示胸部X光片診斷準(zhǔn)確率可以達到驚人的85%以上。而胸部CT優(yōu)點有突出的密度分辨能力與極高的敏感度,對于細(xì)微的病灶檢測更為準(zhǔn)確。更大的一個問題卻是對于一名合格的放射科醫(yī)生的培育難度大,專業(yè)人員少,偏遠(yuǎn)的確的醫(yī)生水平低下等問題也一直存在。而且在高強度的工作后,醫(yī)生對于胸部疾病的診斷效率和準(zhǔn)確度都會有所下降,因此對于胸部疾病的判斷分析非常重要,有著很強的實用價值。隨著現(xiàn)代科技的發(fā)展,計算機輔助診斷(CAD,ComputerAidedDiagnosis)逐漸在醫(yī)療領(lǐng)域上出現(xiàn)在人們的視眼中,它可以在一定程度上幫助醫(yī)生在對于疾病的診斷上提供幫助,可以有效的提升放射科醫(yī)生診斷的效率和診斷的準(zhǔn)確率,但是它只是一個輔助工具幫助醫(yī)生的診斷,不能夠代替醫(yī)生診斷。目前機器學(xué)習(xí)在計算機領(lǐng)域大展拳腳,應(yīng)用十分廣泛。這也推動了醫(yī)學(xué)影像處理領(lǐng)域的快速發(fā)展。綜上所述,研究針對于胸部疾病分類模型和算法的研究,在現(xiàn)在的社會發(fā)展和提升社會幸福指數(shù)都有著前所未有的幫助,而對于放射科的醫(yī)生來說減輕了工作量還提高了醫(yī)生診斷的效率和準(zhǔn)確率,對于醫(yī)生的診斷有著非同尋常的意義。1.2國內(nèi)外研究現(xiàn)狀自1982年Fukushima等人首次將卷積層網(wǎng)絡(luò)應(yīng)用于圖像分析后,越來越多的學(xué)者開始采用這一方法,并隨著計算設(shè)備的快速發(fā)展和深度學(xué)習(xí)方法的出現(xiàn),很多學(xué)者提出了性能更為優(yōu)秀的算法模型。例如,2014年Girshick等人提出的RCNN(RegionConvolutionalNeuralNetwork)能夠識別圖像中感興趣的區(qū)域,并使用卷積神經(jīng)網(wǎng)絡(luò)來提取區(qū)域特征;2015年,Girshick提出的fast-RCNN取代了RCNN;2017年Ren等人提出的faster-RCNN簡化了流程,移除了SVM支持向量機分類,在性能和速度上均超越前者;同年,用于圖像分割任務(wù)的MaskR-CNN問世;2016年Redmon等人提出的YOLO目標(biāo)識別算法采用了一階段方法來檢測目標(biāo),具有快速檢測速度等特點。此后,YOLOv2,YOLOv3和YOLOv4相較于之前版本在速度和精度等方面都有顯著提升。近幾年在國內(nèi)得以快速發(fā)展,并且已經(jīng)在圖像識別、自然語言處理、圖像分割、圖像等多個領(lǐng)域取得顯著的成果。羅宇提出基于YOLOv5改進的目標(biāo)檢測網(wǎng)絡(luò)REF_Ref1621\r\h[1]。為解決醫(yī)學(xué)影像中病變特征的低分辨率和特征提取困難的問題,對YOLOv5進行了一系列改進,旨在提升網(wǎng)絡(luò)的特征提取能力。這些改進包括基于非銳化掩蔽的圖像增強算法、使用動態(tài)卷積和非對稱卷積對特征提取網(wǎng)絡(luò)進行改進,以及引入了基于深度多模態(tài)特征融合的注意力機制。曹世爽在2022年基于ResUnet網(wǎng)絡(luò)改進肺部分割網(wǎng)絡(luò)模型,優(yōu)化分割網(wǎng)絡(luò)的有效性。還基于于改進DenseNet12的肺炎分類模型,網(wǎng)絡(luò)模型分類性能的有效性。邵凌云在2022年提出一種基于密集連接網(wǎng)絡(luò)和高效通道注意力機制的CXR圖像分類方法(EfficientChannelAttentionNetworkBasedonDenseNet,ECA-DenseNet)REF_Ref4407\r\h[2],在數(shù)據(jù)集ChestX-ray15上進行訓(xùn)練,針對數(shù)據(jù)集中的15種胸部疾病的CXR圖像有較好的分類表現(xiàn),平均AUC值可達0.8245,對單一疾病分類的AUC值最高可達0.9122。陳小勇在2023年提出了一種基于YOLOv5s算法模型改進的OS-RFB-YOLOv5s模型REF_Ref4531\r\h[3]。在研究中,作者對比了原YOLOv5s模型、對照模型SS-YOLOv5s以及改進的模型OS-YOLOv5s,它們的mAP值分別為77.4%、80.4%、81.7%。針對頸部網(wǎng)絡(luò)的改進模型RFB-YOLOv5s的mAP值為80.5%;在對損失函數(shù)進行優(yōu)化后,模型的mAP值為78.5%。研究中提出的改進模型OS-RFB-YOLOv5s獲得了83.3%的mAP和90.4的FPS值。相對于原始模型YOLOv5s,改進模型的mAP提高了5.9%,F(xiàn)PS提高了15。1.3本文主要工作本文主要探討基于機器學(xué)習(xí)的胸部CT疾病分類方法。在對現(xiàn)有的胸部疾病數(shù)據(jù)集圖像進行研究。然后使用YOLOv5算法和ResNet18算法對胸部CT圖片進行分類,并對于模型的準(zhǔn)確度進行對比,找到準(zhǔn)確度更高的算法,后使用更優(yōu)的算法進行分類識別。主要研究有:數(shù)據(jù)集的收集與預(yù)處理本文計劃將胸部CT圖像數(shù)據(jù)集作為研究對象,所以首先在網(wǎng)上尋找合適的數(shù)據(jù)集將找到的數(shù)據(jù)集進行整合分類。然后對圖像進行大小統(tǒng)一化和數(shù)據(jù)增強等處理。胸部疾病CT圖像分類算法使用YOLOv5算法和ResNet18算法對胸部CT圖片進行分類,將進行過預(yù)處理的數(shù)據(jù)集進行分類,并對二個算法進行對比。胸部疾病CT的分類識別在實驗結(jié)束后,將實驗數(shù)據(jù)準(zhǔn)確度進行對比,并且整理模型訓(xùn)練的準(zhǔn)確度和檢測精度,使用跟優(yōu)秀模型進行胸部CT圖像的分類檢測。為胸部疾病檢測提供技術(shù)支持。相關(guān)知識與理論基礎(chǔ)2.1胸部疾病的分類識別胸部疾病分類是一張胸部X光片上識別所有病灶并確定其所屬疾病類別。在對于胸部CT中,單一疾病的檢測通常能夠取得良好的效果。然而,在實際應(yīng)用中,胸部疾病表現(xiàn)為多樣性與多發(fā)性的特點,且許多疾病患者樣本稀少,不易被發(fā)現(xiàn)。當(dāng)醫(yī)生需要在一次X光片檢查中獲得所有潛在疾病的診斷時,任務(wù)就變得復(fù)雜,需要進行多標(biāo)簽分類。這會導(dǎo)致分類準(zhǔn)確率明顯的降低。而在多標(biāo)簽的圖像分類當(dāng)中,最開始需要明確的二個概念是多類分類(Multiclass)與多標(biāo)簽分類(Multilabel)。多類分類表示在分類任務(wù)中需要將樣本區(qū)分為多個不同的類別,每個樣本僅屬于一個類別。在這種分類任務(wù)中,每個樣本只能被歸類為一個類別。而多標(biāo)簽分類指的是每個樣本在樣本集中都有多個標(biāo)簽的情況。例如,一張胸部CT圖像中可能同時存在氣胸和積液。在這種情況下,對于這類圖像的分類,我們應(yīng)該需要檢測出來一個含有多個類別的集合。然而胸部是人身體上比較容易犯病的部位之一,包括腺癌、大細(xì)胞癌、鱗狀細(xì)胞癌甚至近年流行的新型冠狀(COVID-19)等引發(fā)的各種胸部疾病,對人體健康構(gòu)成巨大威脅。為了能夠及時檢測出這些胸部疾病、能夠盡早實施針對治療,降低死亡率,早期篩查和診斷變得至關(guān)重要。正如前文所述,胸部CT成為目前最常用的疾病篩查工具,因其于突出的密度分辨能力和高敏感度、對于病灶檢測更為準(zhǔn)確、設(shè)備普及等優(yōu)勢。然而,要從胸部CT中識別病變,由于CT掃描圖像的復(fù)雜性和數(shù)量龐大,需要經(jīng)驗豐富的醫(yī)生進行觀察花費大量的時間來準(zhǔn)確診斷。目前我國放射科醫(yī)生相對稀缺,工作量大,醫(yī)生疲勞可能導(dǎo)致誤診、漏診等問題頻繁出現(xiàn)。CT掃描廣泛用于診斷各種器官和部位的疾病。。利用CNN的相關(guān)模型,醫(yī)生可以快速識別圖像中的異常,如肺結(jié)節(jié)、肝臟腫瘤、腦卒中等,并對患者進行更快更準(zhǔn)確的診斷,因此,利用計算機輔助醫(yī)生進行診療具有重要意義。由于在一張胸部CT圖中,可能存在多種病灶。如果能夠運用計算機輔助診療直接得到CT圖片中所存在的多種病灶,并能準(zhǔn)確的指出疾病的具體位置。這方法將顯著減輕醫(yī)生的工作負(fù)擔(dān),提高診斷和治療效率。因此,近年來臨床對自動、精準(zhǔn)的胸部疾病分類的模型算法和病灶定位檢測的模型算法的需求與日俱增。2.2卷積神經(jīng)網(wǎng)絡(luò)概述卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)在AI機器學(xué)習(xí)領(lǐng)域是一項非常重要的研究技術(shù),也是代表技術(shù)之一。隨著社會的發(fā)展和科技的進步,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)成為機器學(xué)習(xí)的主流。它是在圖像領(lǐng)域研究過程中,是由LeCun等人于1994年提出了LeNet5模型,當(dāng)時由于計算機資源的限制等原因,卷積神經(jīng)網(wǎng)絡(luò)沒有很快地發(fā)展起來。直到21世紀(jì)AlexNet誕生,由Hinton等人開發(fā)的卷積神經(jīng)網(wǎng)絡(luò)在ImageNet競賽算法比傳統(tǒng)算法具有更低的錯誤率,卷積神經(jīng)網(wǎng)絡(luò)隨之受到人們的關(guān)注,揭開了卷積模型的新篇章。在隨后的發(fā)展中,涌現(xiàn)出了一批知名網(wǎng)絡(luò)模型,比如VGGNet模型、GoogleNet模型、ResNet模型等。首先神經(jīng)網(wǎng)絡(luò)是由生物學(xué)的腦部神經(jīng)模型所產(chǎn)生的一種數(shù)字化的模型,一般由節(jié)點、神經(jīng)元和突觸所構(gòu)成。根據(jù)卷積神經(jīng)網(wǎng)絡(luò)的概念就可以得到如圖2.1的數(shù)學(xué)模型。圖2.1數(shù)學(xué)模型圖該模型被稱為感知器,是較為簡單的卷積神經(jīng)網(wǎng)絡(luò),而一般在現(xiàn)實生活中會用到多重的卷積神經(jīng)網(wǎng)絡(luò)模型來解決復(fù)雜的現(xiàn)實問題,所以我們一般把卷積神經(jīng)網(wǎng)絡(luò)當(dāng)成多重感知器。如圖2.2是一個簡單卷積神經(jīng)網(wǎng)絡(luò)示意圖,其中包括輸入層、隱含層、輸出層組成。其中,隱含層又包含卷積層、池化層等內(nèi)容。圖2.2卷積神經(jīng)網(wǎng)絡(luò)模型2.2.1卷積層在一般的神經(jīng)網(wǎng)路中,輸入層與隱藏層都是完全連通的。但是,該方法只能用于小規(guī)模的影像,而對大規(guī)模的影像,則難以利用此方法來學(xué)習(xí)影像的特征。但是,卷積神經(jīng)網(wǎng)絡(luò)中的每一個隱層都只與一個輸入單元相連,因此,各隱層之間所連接的輸入?yún)^(qū)就是神經(jīng)元的感知場。在卷積操作中,感知域的概念是非常重要的。在機器學(xué)習(xí)領(lǐng)域,卷積操作實質(zhì)上是交叉關(guān)聯(lián)操作。例如,在2維數(shù)據(jù)中,如果不考慮圖象的信道數(shù)目,則假定輸入為3×3的2維張量,而卷積核心的尺寸是2×2圖2.3卷積層示意圖卷積神經(jīng)網(wǎng)絡(luò)采用卷積運算,將卷積核的權(quán)值與圖象中各象素的數(shù)值相加,得到一幅圖象的特征映射值。卷積神經(jīng)網(wǎng)絡(luò)采用卷積核函數(shù)對原始圖像的覆蓋區(qū)進行加權(quán)相加,也可以對前一層的特征圖做卷積運算,從而實現(xiàn)對原圖的有效覆蓋。在此基礎(chǔ)上,采用逐次逐次搜索整幅圖像中各像素點的方法,求出各像素的特征值,形成一張新的特征圖。卷積操作的表達式如下:F(2.1)2.2.2池化層沉淀通常發(fā)生在卷積后,沉淀的實質(zhì)就是取樣。池化技術(shù)是在給定的特征圖上選取一種維數(shù)較低的方法,從而提高了計算效率。池化技術(shù)也能有效地降低數(shù)據(jù)庫中的數(shù)據(jù)量,有效地節(jié)省了系統(tǒng)的資源,并有效地降低了過學(xué)習(xí)的次數(shù)。根據(jù)特征圖的不同,采用最大值和平均值兩種方法,以滑動步長為一個單元,遍歷各象素點,得到相應(yīng)的特征圖。池化層的一些參數(shù)與卷積層相似,包括浮動和靜止。在這里,fliter是用池化層的卷積窗的尺寸,stride是用步長來表達的,input是輸入圖的大小,輸出就是output。就像卷積層的步驟一樣。該方法通過對輸入的特征圖的大小、步長以及給定的輸入特征圖的大小輸入,來計算其大小輸出。計算公式為:output(2.2)池化層中的滑動窗口一般不含任何參數(shù),它的主要功能是抽取矩陣的重要特征。在平均池算法中,對滑動窗附近的鄰域特征點進行平均值,從而得到池化結(jié)果。該算法具有較好的背景保持能力,但同時也存在著模糊問題。與此相反,最大池化層以滑動窗內(nèi)特征點的極大值為池化效果,使圖像的紋理特性得到較好的保存。2.2.3激活函數(shù)在卷積神經(jīng)網(wǎng)絡(luò)(CNN)中,在多次迭代之后,輸入數(shù)據(jù)仍保持線性。但是,如果輸入的信號超出某個臨界值,激活函數(shù)被激活并引發(fā)神經(jīng)元的響應(yīng),導(dǎo)致相關(guān)神經(jīng)元進入活躍狀態(tài)。這一過程模擬了生物神經(jīng)元的工作方式,旨在通過引入非線性建模能力來增強神經(jīng)網(wǎng)絡(luò)的非線性擬合能力。其中四種激活函數(shù)及其導(dǎo)函數(shù)的曲線,分別是Sigmoid激活函數(shù)、ReLU激活函數(shù)、Tanh激活函數(shù)、PReLU激活函數(shù)。其不同激活函數(shù)及其導(dǎo)函數(shù)曲線對比圖如下圖2.4激活函數(shù)示意圖2.2.4全連接層在卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型中,其中,完整連通層的功能是將從卷積神經(jīng)網(wǎng)絡(luò)中抽取出來的特征集合在一起,從而完成對對象的分類判定。盡管完全連通層與卷積網(wǎng)絡(luò)都是從整體上進行特征抽取的,但是兩者之間還是有細(xì)微差別的。首先,全連通層和卷積層采取了一種新的聯(lián)系模式,其中全連通層采用了全連通層,也就是每一個神經(jīng)元都和上一層的神經(jīng)元相連接,而卷積層則采用局部連接方式,如圖所示。此外,兩者之間的權(quán)值共享方式也不同,全連接層中每條線代表一個權(quán)值,而在卷積神經(jīng)層中,同一層中的權(quán)值是共享的,這可以顯著減少模型中需要訓(xùn)練的參數(shù)數(shù)量。全連接層通過整合或采樣卷積層提取的特征,提取其中具有區(qū)分性的特征,以實現(xiàn)分類的目的。圖2.5全連接層示意圖根據(jù)卷積神經(jīng)層和全連接層之間的區(qū)別,可以觀察到隨著層數(shù)增加,全連接層的參數(shù)數(shù)量呈幾何級增長,導(dǎo)致網(wǎng)絡(luò)的復(fù)雜度也隨之增加。因此,為了降低模型的復(fù)雜度,在一些復(fù)雜的網(wǎng)絡(luò)模型中通常會減少全連接層甚至不設(shè)置全連接層。2.3評價指標(biāo)準(zhǔn)確率(AccuracyA(2.3)精確率(precision)關(guān)注的是所有被模型預(yù)測為正類別的樣本中,實際上確實正類別的比例。它測量了在正類別下模型的預(yù)測精度。precision=(2.4)召回率(Recall)是在所有正類別樣本中,被模型正確預(yù)測為正類別的比例的多少R(2.5)TP表示模型正確預(yù)測為正類樣本數(shù)量,TN模型正確預(yù)測為負(fù)類樣本數(shù)量,F(xiàn)P表示模型錯誤預(yù)測為正類樣本數(shù)量,F(xiàn)N表示模型錯誤預(yù)測為負(fù)類樣本數(shù)量。2.4數(shù)據(jù)集介紹胸部CT是在全球范圍內(nèi)對于胸部疾病判斷最受歡迎的一種醫(yī)療檢查,它利用X射線和計算機技術(shù)來生成胸部內(nèi)部結(jié)構(gòu)的詳細(xì)圖像。這種成像技術(shù)對于診斷多種胸部疾病非常有用,包括肺癌、肺炎、肺氣腫、胸膜炎等。為了深入理解和研究胸部CT圖像,研究人員和醫(yī)療專業(yè)人員經(jīng)常使用特定的數(shù)據(jù)集來訓(xùn)練和測試他們的算法和模型。而本文訓(xùn)練所用的數(shù)據(jù)集是來自Kaggle()和飛漿(/)。數(shù)據(jù)集的構(gòu)成就是來源于各種公開的數(shù)據(jù)集,將這些數(shù)據(jù)集進行收集和整理。一共有2410張圖片組成的6個類別的胸部疾病。分別有大細(xì)胞癌、肺部腫瘤、肺炎、鱗狀細(xì)胞癌、腺癌和正常細(xì)胞。數(shù)據(jù)集中的6種類別如圖大細(xì)胞癌肺部腫瘤肺炎鱗狀細(xì)胞癌腺癌正常細(xì)胞圖2.6疾病類別第3章算法原理與搭建3.1YOLOV5算法原理YOLO是一種計算機視覺算法。該算法旨在使計算機視覺系統(tǒng)能夠一次注視圖像,并立即返回所有在圖像中出現(xiàn)的目標(biāo)。這個概念最早由KarenLoader和CedricBeijbom在2017年提出,他們的主要目的是創(chuàng)建一種能夠大大提高目標(biāo)檢測速度的目標(biāo)檢測算法。后來,許多研究者對YOLO算法進行了改進和擴展,使其性能得到了顯著提高。逐漸的發(fā)展出了多個衍生模型如:YOLOv2、YOLOv3、YOLOv4、YOLOv5、YOLOv8等高質(zhì)量的模型在深度學(xué)習(xí)層面都有自己所擅長的板塊。YOLO算法是首次將目標(biāo)檢測問題統(tǒng)一為一個單一的回歸問題,是通過單個CNN模型實現(xiàn)對目標(biāo)的快速檢測。這種端到端的方式簡化了目標(biāo)檢測流程,減少了復(fù)雜度,并且讓模型能夠直接從原始圖像像素中獲取目標(biāo)信息。然而YOLOv5使用了CSPDarknet53作為其骨干網(wǎng)絡(luò),這是由Ultralytics團隊提出的一種輕量級和高效的網(wǎng)絡(luò)結(jié)構(gòu)。CSPDarknet53通過跨階段連接(CrossStagePartial)和殘差連接,減少了計算量,同時保持了良好的性能。Focus模塊是YOLOv5中引入的一種新的特征提取模塊,它通過對輸入的特征圖進行空間維度上的變換,強化了特征表達能力,有助于提升檢測精度。在分類任務(wù)中,通常使用Logits損失函數(shù)和二元交叉熵?fù)p失函數(shù)來訓(xùn)練YOLOv5模型。二元交叉熵?fù)p失函數(shù)一般是測量模型預(yù)測和真實標(biāo)簽的差異,特別適用于分類問題。當(dāng)模型的預(yù)測與實際標(biāo)簽不一致時,該損失函數(shù)將計算它們之間的差異,并返回一個損失值。這個損失值可被用來作為模型優(yōu)化的目標(biāo),有助于調(diào)整模型參數(shù),使其更接近真實標(biāo)簽。此外,二元交叉熵?fù)p失函數(shù)還被用于評估分類模型的性能。通過在實際數(shù)據(jù)集上計算損失值,可以評估模型的準(zhǔn)確性和泛化能力。其函數(shù)公式如下(3.1)然而Logits損失函數(shù)是一種用于分類問題的損失函數(shù),尤其適用于二元分類問題。在二元分類問題中,我們通常有兩個類別,真實標(biāo)簽是真實的類別標(biāo)簽(例如,0或1),而預(yù)測標(biāo)簽是模型對某個樣本的預(yù)測結(jié)果當(dāng)模型對某個樣本的預(yù)測結(jié)果與真實標(biāo)簽不一致時,Logits損失函數(shù)會考慮預(yù)測概率與實際概率之間的差異,并返回一個損失值。這個損失值可以被用作模型優(yōu)化的目標(biāo),用于調(diào)整模型的參數(shù),使得模型的預(yù)測概率更接近實際概率。不同于二元交叉熵?fù)p失函數(shù)的是它不僅考慮了預(yù)測值與真實值之間的差異,還考慮了模型預(yù)測的概率分布與實際概率分布之間的差異。其函數(shù)公式如下logit(p)(3.2)3.2YOLOV5模型搭建作為當(dāng)前廣泛應(yīng)用的目標(biāo)檢測網(wǎng)絡(luò)之一,YOLOv5以其高精度的檢測和快速推理的特點在各個領(lǐng)域取得了顯著的成績?;谏疃葘W(xué)習(xí)的單級目標(biāo)檢測和分類算法的YOLOv5算法,具備強大的魯棒性和優(yōu)異的泛化能力。、高精度的檢測以及快速的推理速度。YOLOv5系列中有YOLOv5m、YOLOv5l、YOLOv5x和YOLOv5s。這些版本中,YOLOv5s作為YOLOv5最輕量級版本,僅有14M的大小,更適合于圖像分類任務(wù),所以本文使用YOLOV5s預(yù)訓(xùn)練模型進行訓(xùn)練。YOLOv5模型一般由這些體系結(jié)構(gòu)組成:輸入端(Input)、骨干網(wǎng)絡(luò)(Backbone)、多尺度特征融合模塊(Neck)和預(yù)測端(Prediction)。Input結(jié)構(gòu)用于對原始數(shù)據(jù)進行數(shù)據(jù)增強、錨框選定和圖片自適應(yīng)放縮等一系列基礎(chǔ)數(shù)據(jù)處理操作。Backbone和Neck中改進了CSP模塊,消除每個瓶頸結(jié)構(gòu)中的一個卷積并減少網(wǎng)絡(luò)尺寸,從而使運算速度更快。通過使用Focus模塊減少卷積成本并增加channel維度,F(xiàn)LOPs得以減少,從而提高了速度。Neck結(jié)構(gòu)使用PANet特征金字塔網(wǎng)絡(luò),對特征進行聚合,并傳輸給Head結(jié)構(gòu)進行預(yù)測;而Head結(jié)構(gòu)是在基于Neck結(jié)構(gòu)傳遞的信息的基礎(chǔ)上進行預(yù)測,用于圖形對象檢測。一般在YOLOv5網(wǎng)絡(luò)訓(xùn)練過程中,采用了sigmoid函數(shù)與leakyrelu函數(shù),SGD和ADAM作為優(yōu)化器選項,圖3.1YOLOv5網(wǎng)絡(luò)模型結(jié)構(gòu)3.3ResNet算法原理ResNet(ResidualNetwork)是一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的架構(gòu),由微軟的研究人員在2015年提出。主要用于處理圖像識別任務(wù),尤其在大型數(shù)據(jù)集(如ImageNet)上取得了顯著的成功。ResNet的基本思想是引入了殘差網(wǎng)絡(luò)結(jié)構(gòu),即通過將輸入特征圖與預(yù)先計算出的恒等映射的特征圖相加,使得網(wǎng)絡(luò)可以更好地學(xué)習(xí)到更深層次的特征。這種結(jié)構(gòu)能夠幫助神經(jīng)網(wǎng)絡(luò)中的退化和梯度消失問題,使得網(wǎng)絡(luò)可以更深、更寬。具體來說,在傳統(tǒng)的CNN中,卷積操作會逐漸損失低頻信息,導(dǎo)致深度增加時網(wǎng)絡(luò)性能下降。而ResNet通過引入殘差連接(residualconnection)和快捷鏈接(shortcutconnection),可以在任意深度的網(wǎng)絡(luò)仍然能夠保持特征的連續(xù)性。這樣,即使網(wǎng)絡(luò)深度增加,也能保持較高的特征表達能力。此外,ResNet還采用了跳躍連接(skipconnection)的思想,即在殘差連接的基礎(chǔ)上,將淺層特征圖直接傳遞給深層特征圖,這樣可以加快網(wǎng)絡(luò)的學(xué)習(xí)速度,同時避免過擬合問題。在訓(xùn)練過程中,ResNet使用了一種名為“BatchNorm”的技術(shù)來加速收斂和穩(wěn)定訓(xùn)練過程。此外,ResNet還采用了殘差塊的結(jié)構(gòu),每個殘差塊由多個3x3卷積層和shortcut連接組成。這種結(jié)構(gòu)可以避免梯度爆炸問題,并提高網(wǎng)絡(luò)的泛化能力??偟膩碚f,ResNet通過引入殘差連接、跳躍連接、BatchNorm等技術(shù),解決了傳統(tǒng)CNN中存在的問題,使得網(wǎng)絡(luò)可以更深、更寬、更快地學(xué)習(xí)圖像特征,從而在圖像分類任務(wù)中取得了顯著的成功。ResNet所使用的損失函數(shù)主要是交叉熵?fù)p失函數(shù)(CrossEntropyLoss)在機器學(xué)習(xí)和深度學(xué)習(xí)中是一種常用的損失函數(shù),主要用于分類問題。它的主要作用是衡量預(yù)測值與真實值之間的差異。通過計算模型預(yù)測的概率分布與真實概率分布之間的差異,來衡量模型的性能。它特別適用于多類別分類問題,可以將每個類別的預(yù)測概率與真實概率進行比較,并計算出誤差,從而指導(dǎo)模型進行參數(shù)調(diào)整,使得模型的預(yù)測結(jié)果更接近真實標(biāo)簽。其函數(shù)公式如下(3.3)殘差結(jié)構(gòu)示意圖bottleneck殘差單元結(jié)構(gòu)圖3.23.4ResNet模型搭建在ResNet網(wǎng)絡(luò)模型中,殘差塊(ResidualBlocks)是其主要結(jié)構(gòu),同時也構(gòu)成了ResNet網(wǎng)絡(luò)模型的基礎(chǔ)。與之前的網(wǎng)絡(luò)不同,殘差網(wǎng)絡(luò)在信息傳遞過程中并非直接將上一層的完整特征圖作為下一層的輸入。相反,殘差網(wǎng)絡(luò)首先引入了一個恒等映射,以確保有用的特征信息不會因為層間的某些操作而丟失。此外,殘差網(wǎng)絡(luò)的關(guān)注重點并非是尋找上一層完整輸出的映射,而是尋找輸入和輸出之間的差異。相對于之前的卷積神經(jīng)網(wǎng)絡(luò)對整個輸入進行擬合,殘差網(wǎng)絡(luò)僅對殘差進行擬合和映射,這使得網(wǎng)絡(luò)的訓(xùn)練更加簡單。此外,由于輸入輸出的殘差值相比整個輸入更小,使得網(wǎng)絡(luò)對輸入輸出的變化更加敏感。這種對微小波動的敏感性特性使得在訓(xùn)練過程中,即使是淺層網(wǎng)絡(luò)的權(quán)重也能夠獲得更大的梯度,促使權(quán)重更新。圖3.3ResNet網(wǎng)絡(luò)模型第4章數(shù)據(jù)集預(yù)處理與模型訓(xùn)練4.1數(shù)據(jù)預(yù)處理通常,在將數(shù)據(jù)集輸入網(wǎng)絡(luò)之前,為了增加數(shù)據(jù)集的多樣性并強化學(xué)習(xí)能力,通常會進行數(shù)據(jù)集的預(yù)處理操作。由于本文所使用的數(shù)據(jù)集是從多個不同網(wǎng)站下載而來,其中的圖片格式和質(zhì)量存在一定差異,因此需要進行一些數(shù)據(jù)預(yù)處理來提高數(shù)據(jù)的適用性、質(zhì)量和可靠性,還可以提高數(shù)據(jù)量。4.1.1隨機旋轉(zhuǎn)(RandomFlipping)旋轉(zhuǎn)是圖像增強中的一種常見技術(shù),它通過對圖像進行不同角度的旋轉(zhuǎn)來增加數(shù)據(jù)的多樣性,是一種簡單但有效的圖像增強技術(shù),它可以幫助模型學(xué)習(xí)到更加豐富和魯棒的特征表示,提高模型的泛化能力和魯棒性。在訓(xùn)練的過程中,胸部CT圖片被隨機的進行圖片旋轉(zhuǎn)對于模型增強特征學(xué)習(xí)非常有效果,可以進一步優(yōu)化模型。(a)原圖(b)旋轉(zhuǎn)圖圖4.1隨機旋轉(zhuǎn)示意圖4.1.2隨機噪聲(RandomNoise)高斯模糊是一種非常有用的圖像增強技術(shù),是一種圖像處理技術(shù),用于平滑圖像中的噪聲和細(xì)節(jié),同時保留邊緣和形狀,它可以改善圖像質(zhì)量,減少噪聲,增強邊緣特征,從而提高模型的性能。實現(xiàn)更好的圖像增強效果。需要注意的是,高斯模糊的程度會影響圖像的模糊程度和效果。過大的模糊半徑可能導(dǎo)致圖像變得過于模糊,從而丟失重要的特征和信息。因此,在使用高斯模糊進行圖像增強時,需要根據(jù)具體的任務(wù)和需求來選擇合適的模糊半徑。(a)原圖(b)模糊圖圖4.2隨機噪聲示意圖4.1.3HSV變換(Randomcolortransformation)HSV變換是圖像數(shù)據(jù)增強中的一個重要技術(shù),通過改變圖像的特征來增加數(shù)據(jù)的多樣性和復(fù)雜性。HSV變換方法包括曝光調(diào)整、色調(diào)變換、飽和度調(diào)整等,這些方法可以單獨應(yīng)用或組合使用,以實現(xiàn)更佳的數(shù)據(jù)增強效果。通過HSV變換,可以生成更豐富和魯邦的訓(xùn)練數(shù)據(jù),從而提升模型的性能、泛化能力、增加視覺多樣性、模擬環(huán)境變化等。(a)原圖(b)HXV變換圖圖4.3HXV變換示意圖4.2實驗環(huán)境配置配置詳情CPUAMDRyzen73750HwithRadeonVegaMobileGfx2.30GHzGPUNVIDIAGeForce16504G內(nèi)存16GBRAM,頻率2400MHz操作系統(tǒng)Windows10Python版本Python3.8PyCharm版本2022.2圖4.4實驗配置本文對模型訓(xùn)練過程中的損失和精確度等數(shù)據(jù)進行了保存和繪制,并且使用excel進行了繪制,便于可視化的理解模型訓(xùn)練的過程,針對相應(yīng)的指標(biāo)進行對比分析。4.3實驗結(jié)果損失函數(shù)在模型訓(xùn)練中起到衡量模型預(yù)測與實際結(jié)果之間差距的作用,幫助評估模型性能。作用于我們分析模型訓(xùn)練過程中需要改進的方向,即哪些方面需要調(diào)整以更好地擬合數(shù)據(jù)。在模型對比中,通常會用兩個模型對同一批數(shù)據(jù)進行預(yù)測,然后比較它們的預(yù)測結(jié)果。為了評估兩個模型的性能,我們需要一個能夠量化預(yù)測結(jié)果差異的指標(biāo),而損失函數(shù)正是這樣一種指標(biāo)。它有助于比較兩個模型的預(yù)測結(jié)果,判斷哪個表現(xiàn)更好。常見的損失函數(shù)包括均方誤差(MSE)和交叉熵?fù)p失。通過比較不同模型在不同損失函數(shù)下的表現(xiàn),可以更好地了解各自的優(yōu)勢和不足,為后續(xù)模型優(yōu)化提供依據(jù)。在實驗中觀察兩個模型的損失值變化也是很有意義的。如圖4.4,在經(jīng)歷了100次epoch后YOLOv5模型的損失率趨于穩(wěn)定,雖然訓(xùn)練集和驗證集都在第20次訓(xùn)練中損失率有點震蕩,但很快趨于平衡分別趨于1.18和0.42。如圖4.5,也是經(jīng)歷了100次epoch后ResNet模型的損失率,訓(xùn)練集剛開始訓(xùn)練損失率就是0.03左右后續(xù)的訓(xùn)練雖然有起伏但都是在一個合理的區(qū)間內(nèi)。而驗證集起伏就有點大最高到達過0.6最低0.11,隨著迭代次數(shù)增加震蕩的幅度變小。圖4.4YOLOv5損失函數(shù)圖4.5ResNet損失函數(shù)準(zhǔn)確度是評估模型性能的重要指標(biāo)。準(zhǔn)確度通常用來衡量模型在測試數(shù)據(jù)集上的預(yù)測結(jié)果與實際結(jié)果之間的匹配程度。高準(zhǔn)確度的模型能夠更準(zhǔn)確地識別出實際存在的和實際不存在的數(shù)據(jù),高準(zhǔn)確度的模型意味著它在大多數(shù)情況下都能正確地識別出數(shù)據(jù)的類別或特征,從而能夠更好地適應(yīng)實際應(yīng)用場景,還可以通過比較不同深度學(xué)習(xí)模型在相同數(shù)據(jù)集上的準(zhǔn)確度,可以評估它們之間的優(yōu)劣因此在實際應(yīng)用中更有價值。它能夠幫助我們了解模型的優(yōu)劣和選擇最優(yōu)的優(yōu)化方法。通過比較不同優(yōu)化方法的優(yōu)缺點,可以選擇最優(yōu)的優(yōu)化方法來提高模型的準(zhǔn)確度。如圖4.6,是YOLOv5模型的驗證top1的平均準(zhǔn)確度達到了0.825,而top5的平均準(zhǔn)確率搞達0.973,準(zhǔn)確度還是非常高的,而后將隨機CT圖片導(dǎo)入模型檢測的類型在左上角顯示疾病的概率,如圖4.7。如圖4.8,ResNet模型訓(xùn)練集的準(zhǔn)確度變化幅度小,且準(zhǔn)確率平均都在98.2%以上,而驗證集的準(zhǔn)確度變化幅度較大,且準(zhǔn)確率平均在91%上下。圖4.6YOLOv5準(zhǔn)確率圖4.7驗證圖圖4.8ResNet準(zhǔn)確率
第4章總結(jié)與展望4.1總結(jié)本論文研究的是基于機器學(xué)習(xí)的胸部疾病的分類。在科技的飛速進步與公眾健康意識日益增強的背景下,胸部疾病的早期篩查與診斷受到了廣泛關(guān)注,成為研究熱點。所以為了解決現(xiàn)在放射科醫(yī)生的不足,也為了減輕現(xiàn)有醫(yī)生的壓力,提高醫(yī)生診斷的效率和準(zhǔn)確率。本文主要進行的工作有:介紹基于CT的胸部疾病的分類領(lǐng)域的研究背景及意義,并介紹了國內(nèi)外研究現(xiàn)狀,闡述了本文的主要工作與內(nèi)容結(jié)構(gòu)安排。對本文所涉及的專業(yè)知識進行介紹,如胸部疾病的分類識別、卷積神經(jīng)網(wǎng)絡(luò)概述、評價指標(biāo)和數(shù)據(jù)集介紹。搭建實驗所需模型并解釋算法原理和搭建結(jié)構(gòu)。用數(shù)據(jù)集進行預(yù)處理所得到的圖像進行實驗,通過實驗將本文所設(shè)計模型進行對比,并將實驗結(jié)果展示。從而得出對應(yīng)實驗結(jié)果。總的來說,本文研究不同算法模型下對于胸部疾病分類準(zhǔn)確度的變化,篩選更為適合胸部疾病分類的算法模型,而經(jīng)過本文研究發(fā)現(xiàn)在胸部CT圖像疾病分類中,YOLOv5模型更為優(yōu)秀準(zhǔn)確率高達97.3%,可以在醫(yī)學(xué)圖像領(lǐng)域為放射科醫(yī)生減輕負(fù)擔(dān)。然而,當(dāng)前實驗還是有著一定的缺陷和瑕疵。如訓(xùn)練數(shù)據(jù)的擬合程度過高,導(dǎo)致其泛化能力下降的現(xiàn)象、數(shù)據(jù)量較少等問題。希望未來能夠使用更為先進模型和算法。為胸部疾病分類提供強有力的支持和突破。4.2展望本文對于胸部疾病分類的研究,還是有一些不足需要完善。醫(yī)學(xué)關(guān)于胸部CT圖像數(shù)據(jù)集類別,在現(xiàn)在醫(yī)學(xué)領(lǐng)域,常見的診斷方式還有X光影像,而且相對于CT圖像來說它價格更加惠民,而且X光的數(shù)據(jù)庫也是一個非常大且可以使用的數(shù)據(jù)類別,如果可以在一定條件下結(jié)合X光數(shù)據(jù)庫的圖像樣本能夠增加數(shù)據(jù)解決數(shù)據(jù)集中由于樣本不足或樣本不平衡出現(xiàn)的問題,作用于圖像分類模型的優(yōu)化,各類指標(biāo)都會有一定的提升。本文得到的數(shù)據(jù)集在模型的準(zhǔn)確率有著不錯的效果。但是缺少病灶的位置信息和定位數(shù)據(jù)。如果能夠得到胸部疾病CT圖的定位數(shù)據(jù)集。那么對于放射科醫(yī)生的診斷起到很大的幫助。而且,在未來醫(yī)生對于胸部疾病的診斷上,醫(yī)務(wù)人員很難一次性得出結(jié)論,如果可以整合一個大型的數(shù)據(jù)集,在做檢查的時候可以查詢歷史醫(yī)療圖像和診斷結(jié)果。將會大大提高對于疾病的判斷。參考文獻羅宇.基于深度學(xué)習(xí)的胸腔病變檢測診斷方法研究[D].三峽大學(xué),2023.DOI:10.27270/ki.gsxau.2022.000116.邵凌云.基于卷積神經(jīng)網(wǎng)絡(luò)的胸部X光片疾病分類算法研究[D].天津:天津大學(xué),2022.陳小勇.基于改進YOLOv5s的路面破損實測圖像分類識別研究[D].長安大學(xué),2023.DOI:10.26976/ki.gchau.2023.001561.王俊達.基于神經(jīng)網(wǎng)絡(luò)的乳腺癌腫瘤檢測與肺癌亞型分類研究[D].北方民族大學(xué),2023.DOI:10.27754/ki.gbfmz.2023.000043.吳珍.基于數(shù)據(jù)分析的疾病標(biāo)志物識別及腫瘤進展階段分類研究[D].西南大學(xué),2021.DOI:10.27684/ki.gxndx.2020.0031
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 守護骨骼健康行動
- 《GBT 2972-2016 鍍鋅鋼絲鋅層硫酸銅試驗方法》專題研究報告
- 2026年無錫商業(yè)職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性考試題庫及答案詳解一套
- 冷鏈物流項目建設(shè)借款擔(dān)保協(xié)議
- 中藥材行業(yè)中藥材質(zhì)量檢測工程師崗位招聘考試試卷及答案
- 2026年度醫(yī)院感染防控工作計劃
- 2025交通勸導(dǎo)面試題目及答案
- 教師培訓(xùn)工作計劃2026范文4篇
- 2026年唯實小學(xué)黨支部工作計劃
- 2025年特種用途鋼絲及鋼絲繩項目合作計劃書
- 2025年云南省人民檢察院聘用制書記員招聘(22人)備考筆試題庫及答案解析
- 2026屆四川涼山州高三高考一模數(shù)學(xué)試卷試題(含答案詳解)
- 銀行黨支部書記2025年抓基層黨建工作述職報告
- 腫瘤標(biāo)志物的分類
- 2025山西忻州市原平市招聘社區(qū)專職工作人員50人考試歷年真題匯編附答案解析
- 中藥煎煮知識與服用方法
- 2026東莞銀行秋季校園招聘備考題庫及答案詳解(基礎(chǔ)+提升)
- 消防水泵房管理制度及操作規(guī)程
- 野戰(zhàn)軍生存課件
- 《民航概論》期末考試復(fù)習(xí)題庫(附答案)
- 2025年學(xué)校工會工作總結(jié)范文(5篇)
評論
0/150
提交評論