版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
基于紋理特征與EML的肝癌精準(zhǔn)識(shí)別方法研究與實(shí)踐一、引言1.1研究背景與意義肝癌,作為全球范圍內(nèi)嚴(yán)重威脅人類健康的重大疾病,其發(fā)病率與死亡率一直居高不下。據(jù)世界衛(wèi)生組織國際癌癥研究機(jī)構(gòu)(IARC)發(fā)布的2020年全球癌癥負(fù)擔(dān)數(shù)據(jù)顯示,肝癌的新增病例數(shù)達(dá)90.6萬,死亡病例數(shù)為83萬,分別位居全球癌癥發(fā)病和死亡的第6位與第3位。在中國,肝癌的形勢更為嚴(yán)峻,每年新發(fā)病例和死亡病例均約占全球的一半,成為導(dǎo)致癌癥相關(guān)死亡的主要原因之一。肝癌具有惡性程度高、進(jìn)展迅速、預(yù)后差等特點(diǎn),早期癥狀隱匿,多數(shù)患者確診時(shí)已處于中晚期,錯(cuò)失了最佳的手術(shù)治療時(shí)機(jī),5年生存率極低。目前,肝癌的診斷方法主要包括血清標(biāo)志物檢測、影像學(xué)檢查和組織病理學(xué)檢查等。血清標(biāo)志物檢測中,甲胎蛋白(AFP)是最常用的指標(biāo),但僅有約60%的肝癌患者AFP會(huì)升高,單獨(dú)使用該指標(biāo)進(jìn)行篩查會(huì)導(dǎo)致至少40%的早期肝癌患者漏診。影像學(xué)檢查如超聲、CT、MRI等,雖然能夠提供肝臟的形態(tài)和結(jié)構(gòu)信息,但對于早期微小肝癌的診斷仍存在一定的局限性,且檢查結(jié)果受醫(yī)生經(jīng)驗(yàn)、儀器設(shè)備等因素的影響較大。組織病理學(xué)檢查是肝癌診斷的“金標(biāo)準(zhǔn)”,但其屬于有創(chuàng)檢查,存在出血、感染等風(fēng)險(xiǎn),且難以進(jìn)行大規(guī)模的篩查。因此,開發(fā)一種準(zhǔn)確、高效、無創(chuàng)或微創(chuàng)的肝癌診斷方法,對于提高肝癌的早期診斷率、改善患者的預(yù)后具有重要的臨床意義。隨著計(jì)算機(jī)技術(shù)和圖像處理技術(shù)的飛速發(fā)展,基于醫(yī)學(xué)圖像紋理特征分析的肝癌識(shí)別方法逐漸成為研究熱點(diǎn)。紋理是圖像中一種重要的視覺特征,它反映了圖像中像素灰度的分布和變化規(guī)律,能夠提供關(guān)于組織和器官的結(jié)構(gòu)、功能等信息。肝癌組織與正常肝組織在細(xì)胞形態(tài)、排列方式、血管分布等方面存在差異,這些差異會(huì)導(dǎo)致其超聲、CT、MRI等醫(yī)學(xué)圖像的紋理特征不同。通過對醫(yī)學(xué)圖像的紋理特征進(jìn)行提取和分析,可以實(shí)現(xiàn)對肝癌的自動(dòng)識(shí)別和診斷,為臨床醫(yī)生提供客觀、準(zhǔn)確的診斷依據(jù)。同時(shí),機(jī)器學(xué)習(xí)技術(shù)的不斷進(jìn)步也為肝癌的診斷提供了新的思路和方法。極限學(xué)習(xí)機(jī)(ExtremeLearningMachine,ELM)作為一種新型的單隱層前饋神經(jīng)網(wǎng)絡(luò),具有學(xué)習(xí)速度快、泛化性能好等優(yōu)點(diǎn),在模式識(shí)別、數(shù)據(jù)分類等領(lǐng)域得到了廣泛的應(yīng)用。將紋理特征分析與ELM相結(jié)合,構(gòu)建基于紋理特征與ELM的肝癌識(shí)別模型,有望提高肝癌診斷的準(zhǔn)確率和效率。綜上所述,本研究旨在通過對肝癌醫(yī)學(xué)圖像的紋理特征進(jìn)行深入分析,結(jié)合ELM算法,建立一種高效、準(zhǔn)確的肝癌識(shí)別方法,為肝癌的早期診斷和治療提供新的技術(shù)手段。這不僅有助于提高肝癌患者的生存率和生活質(zhì)量,減輕患者家庭和社會(huì)的經(jīng)濟(jì)負(fù)擔(dān),還將對推動(dòng)醫(yī)學(xué)影像技術(shù)和人工智能技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用和發(fā)展具有重要的理論意義和實(shí)際價(jià)值。1.2國內(nèi)外研究現(xiàn)狀在肝癌紋理特征提取的研究方面,國內(nèi)外學(xué)者均取得了豐富的成果。國外,早在20世紀(jì)90年代,就有學(xué)者開始利用灰度共生矩陣(GLCM)對肝癌的CT圖像紋理特征進(jìn)行提取,通過分析圖像中不同灰度級(jí)像素對的空間分布關(guān)系,獲取了諸如對比度、相關(guān)性、能量和熵等紋理特征,為肝癌的診斷提供了量化依據(jù)。此后,基于小波變換的紋理特征提取方法逐漸興起,它能夠?qū)D像分解到不同的頻率子帶,從而提取出多尺度的紋理信息,對肝癌組織的微觀結(jié)構(gòu)變化更為敏感。近年來,局部二值模式(LBP)及其變體在肝癌紋理分析中得到了廣泛應(yīng)用,該方法通過對圖像局部鄰域像素的灰度值進(jìn)行比較,生成具有旋轉(zhuǎn)不變性和灰度不變性的紋理描述子,有效提高了對肝癌圖像紋理特征的表征能力。國內(nèi)在肝癌紋理特征提取領(lǐng)域也緊跟國際步伐,取得了一系列具有創(chuàng)新性的成果。有研究團(tuán)隊(duì)提出了基于多尺度局部二值模式與灰度共生矩陣融合的紋理特征提取方法,綜合利用了兩種方法在局部和全局紋理分析上的優(yōu)勢,顯著提高了對肝癌不同亞型的區(qū)分能力。此外,分形理論在肝癌紋理分析中的應(yīng)用也成為研究熱點(diǎn),通過計(jì)算圖像的分形維數(shù),能夠定量描述肝癌組織紋理的復(fù)雜程度和不規(guī)則性,為肝癌的診斷和預(yù)后評估提供了新的視角。在基于ELM的肝癌研究方面,國外學(xué)者率先將ELM應(yīng)用于肝癌的診斷分類,通過對大量肝癌患者的臨床數(shù)據(jù)和影像數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練,構(gòu)建了基于ELM的肝癌診斷模型,取得了較高的診斷準(zhǔn)確率。同時(shí),為了進(jìn)一步提高ELM模型的性能,一些改進(jìn)算法被提出,如正則化極限學(xué)習(xí)機(jī)(RELM),通過引入正則化項(xiàng),有效解決了ELM在小樣本數(shù)據(jù)集上容易出現(xiàn)過擬合的問題。國內(nèi)學(xué)者在這一領(lǐng)域也進(jìn)行了深入研究,提出了基于粒子群優(yōu)化(PSO)算法優(yōu)化ELM參數(shù)的肝癌診斷方法,利用PSO算法的全局搜索能力,自動(dòng)尋找ELM模型的最優(yōu)參數(shù),提高了模型的泛化能力和穩(wěn)定性。此外,還有研究將ELM與深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)相結(jié)合,構(gòu)建了混合模型,充分發(fā)揮了ELM的快速學(xué)習(xí)能力和CNN強(qiáng)大的特征提取能力,在肝癌的診斷和分期預(yù)測中取得了良好的效果。在將紋理特征與ELM相結(jié)合用于肝癌識(shí)別的研究方面,國外有研究團(tuán)隊(duì)首先開展了相關(guān)工作,他們提取肝癌MRI圖像的紋理特征作為ELM模型的輸入,實(shí)現(xiàn)了對肝癌與正常肝組織的自動(dòng)識(shí)別,實(shí)驗(yàn)結(jié)果表明該方法在一定程度上提高了肝癌診斷的準(zhǔn)確性。隨后,更多的研究開始關(guān)注如何優(yōu)化紋理特征的選擇和ELM模型的訓(xùn)練,以提高肝癌識(shí)別的性能。國內(nèi)學(xué)者在這一方向也取得了重要進(jìn)展,有研究提出了基于主成分分析(PCA)降維的紋理特征與ELM相結(jié)合的肝癌識(shí)別方法,利用PCA對提取的高維紋理特征進(jìn)行降維處理,去除冗余信息,減少計(jì)算量,同時(shí)提高了ELM模型的訓(xùn)練速度和分類精度。此外,還有研究通過構(gòu)建多模態(tài)紋理特征融合的ELM模型,綜合利用肝癌超聲、CT和MRI圖像的紋理信息,進(jìn)一步提高了肝癌識(shí)別的準(zhǔn)確率和可靠性。綜上所述,國內(nèi)外在肝癌紋理特征提取、基于ELM的肝癌研究以及兩者結(jié)合的肝癌識(shí)別方法等方面都取得了顯著的研究進(jìn)展。然而,目前的研究仍存在一些不足之處,如紋理特征的提取方法還不夠完善,對肝癌組織細(xì)微紋理變化的表征能力有待提高;基于ELM的模型在處理復(fù)雜數(shù)據(jù)時(shí)的泛化能力和穩(wěn)定性還需進(jìn)一步增強(qiáng);在紋理特征與ELM結(jié)合的研究中,如何更好地融合多模態(tài)紋理信息,提高模型的性能,仍是需要深入研究的問題。1.3研究內(nèi)容與創(chuàng)新點(diǎn)本研究圍繞基于紋理特征與ELM的肝癌識(shí)別方法展開,涵蓋紋理特征提取、EML技術(shù)應(yīng)用、模型構(gòu)建與驗(yàn)證等關(guān)鍵環(huán)節(jié)。在紋理特征提取方面,對多種經(jīng)典紋理特征提取方法進(jìn)行深入研究,包括灰度共生矩陣(GLCM)、局部二值模式(LBP)及其變體、小波變換等。針對現(xiàn)有方法在表征肝癌組織細(xì)微紋理變化方面的不足,提出一種基于多尺度多方向局部特征融合的紋理特征提取方法。該方法在多個(gè)尺度和方向上對圖像進(jìn)行分析,能夠更全面地捕捉肝癌組織紋理的局部特征,有效提高對肝癌組織紋理特征的表征能力。在EML技術(shù)應(yīng)用上,深入研究ELM算法的原理和特性,針對ELM在處理小樣本、高維數(shù)據(jù)時(shí)容易出現(xiàn)過擬合和泛化能力不足的問題,提出一種基于改進(jìn)正則化極限學(xué)習(xí)機(jī)(MRELM)的肝癌識(shí)別算法。通過引入自適應(yīng)正則化參數(shù)和改進(jìn)的核函數(shù),MRELM能夠根據(jù)數(shù)據(jù)的特點(diǎn)自動(dòng)調(diào)整正則化強(qiáng)度,增強(qiáng)模型對復(fù)雜數(shù)據(jù)的適應(yīng)性,提高模型的泛化能力和穩(wěn)定性。在模型構(gòu)建與驗(yàn)證環(huán)節(jié),將提取的紋理特征作為MRELM模型的輸入,構(gòu)建基于紋理特征與MRELM的肝癌識(shí)別模型。收集大量的肝癌患者和正常人群的超聲、CT、MRI等醫(yī)學(xué)圖像數(shù)據(jù),對模型進(jìn)行訓(xùn)練和驗(yàn)證。采用交叉驗(yàn)證、準(zhǔn)確率、召回率、F1值等多種評價(jià)指標(biāo),全面評估模型的性能,并與其他傳統(tǒng)的肝癌診斷方法進(jìn)行對比分析,驗(yàn)證本研究方法的優(yōu)越性。本研究的創(chuàng)新點(diǎn)主要體現(xiàn)在以下幾個(gè)方面:一是提出了一種新的基于多尺度多方向局部特征融合的紋理特征提取方法,該方法能夠更全面、準(zhǔn)確地表征肝癌組織的紋理特征,為肝癌的識(shí)別提供了更有效的特征信息;二是改進(jìn)了正則化極限學(xué)習(xí)機(jī)算法,通過引入自適應(yīng)正則化參數(shù)和改進(jìn)的核函數(shù),提高了模型在處理小樣本、高維數(shù)據(jù)時(shí)的泛化能力和穩(wěn)定性,使其更適用于肝癌識(shí)別的復(fù)雜任務(wù);三是構(gòu)建了基于紋理特征與改進(jìn)ELM算法的肝癌識(shí)別模型,充分發(fā)揮了紋理特征分析和機(jī)器學(xué)習(xí)算法的優(yōu)勢,實(shí)現(xiàn)了肝癌的自動(dòng)識(shí)別和診斷,為肝癌的早期診斷提供了新的技術(shù)手段。二、相關(guān)理論與技術(shù)基礎(chǔ)2.1肝癌相關(guān)知識(shí)肝癌,作為一種嚴(yán)重威脅人類生命健康的惡性腫瘤,根據(jù)其起源主要可分為肝細(xì)胞癌、膽管細(xì)胞癌和混合型肝癌三種類型。肝細(xì)胞癌最為常見,主要由肝細(xì)胞發(fā)生癌變引發(fā),慢性乙型肝炎、丙型肝炎病毒感染、長期酗酒、非酒精性脂肪性肝病等因素是其主要誘因。這些因素致使肝細(xì)胞反復(fù)受損與修復(fù),極大地增加了細(xì)胞癌變的風(fēng)險(xiǎn)。膽管細(xì)胞癌起源于膽管上皮細(xì)胞,發(fā)病原因與膽管結(jié)石、膽管炎、原發(fā)性硬化性膽管炎等膽道疾病相關(guān),同時(shí)也可能受到某些遺傳因素和環(huán)境因素的影響。混合型肝癌則同時(shí)具備肝細(xì)胞癌和膽管細(xì)胞癌兩種成分,其發(fā)病機(jī)制目前尚未完全明確,可能與肝細(xì)胞和膽管上皮細(xì)胞的共同起源以及遺傳因素等有關(guān)。肝癌的發(fā)病原因較為復(fù)雜,是多種因素共同作用的結(jié)果。除了上述提到的病毒感染、不良生活習(xí)慣和膽道疾病等因素外,黃曲霉素等化學(xué)致癌物質(zhì)的攝入、水污染、遺傳因素以及某些代謝性疾病等也與肝癌的發(fā)生密切相關(guān)。黃曲霉素是一種由黃曲霉和寄生曲霉產(chǎn)生的毒性極強(qiáng)的天然化合物,常見于霉變的糧食和堅(jiān)果中,具有強(qiáng)烈的致癌性,長期攝入可導(dǎo)致肝細(xì)胞DNA損傷,引發(fā)基因突變,從而誘發(fā)肝癌。水污染中的某些有害物質(zhì),如重金屬、有機(jī)污染物等,也可能通過影響肝臟的正常代謝和解毒功能,增加肝癌的發(fā)病風(fēng)險(xiǎn)。遺傳因素在肝癌的發(fā)生中也起著重要作用,一些家族遺傳性疾病,如遺傳性血色病、α1-抗胰蛋白酶缺乏癥等,會(huì)使患者患肝癌的風(fēng)險(xiǎn)顯著增加。此外,肥胖、糖尿病等代謝性疾病也與肝癌的發(fā)生存在一定的關(guān)聯(lián),這些疾病可能通過影響胰島素抵抗、脂肪代謝等機(jī)制,促進(jìn)肝癌的發(fā)生發(fā)展。肝癌的癥狀表現(xiàn)因病情的發(fā)展階段而異。在早期,肝癌通常缺乏明顯的特異性癥狀,患者可能僅出現(xiàn)一些非特異性的全身癥狀,如乏力、消瘦、食欲減退等,這些癥狀往往容易被忽視。隨著病情的進(jìn)展,患者會(huì)出現(xiàn)肝區(qū)疼痛,這是肝癌最常見的癥狀之一,多呈持續(xù)性脹痛或鈍痛,疼痛的原因主要是腫瘤迅速生長,使肝包膜張力增加所致。如果癌結(jié)節(jié)破裂,患者會(huì)突然出現(xiàn)劇烈的腹痛,同時(shí)伴有腹膜刺激征等急腹癥表現(xiàn)。此外,患者還可能出現(xiàn)腹脹、黃疸、腹水等癥狀。腹脹主要是由于腫瘤增大壓迫胃腸道或腹水形成所致;黃疸是由于肝細(xì)胞受損或膽管受壓,導(dǎo)致膽紅素代謝障礙,血液中膽紅素水平升高引起的,表現(xiàn)為皮膚和鞏膜黃染;腹水的形成則與門靜脈高壓、低蛋白血癥、肝淋巴液生成過多等因素有關(guān)。在肝癌的診斷方面,目前主要采用血清標(biāo)志物檢測、影像學(xué)檢查和組織病理學(xué)檢查等方法。血清標(biāo)志物檢測中,甲胎蛋白(AFP)是臨床上最常用的指標(biāo)之一,它對肝細(xì)胞癌的診斷具有相對較高的特異性。然而,僅有約60%的肝癌患者AFP會(huì)升高,這意味著單獨(dú)使用AFP進(jìn)行篩查,至少會(huì)導(dǎo)致40%的早期肝癌患者漏診。影像學(xué)檢查包括超聲、CT、MRI等。超聲檢查具有操作簡便、價(jià)格低廉、無輻射等優(yōu)點(diǎn),是肝癌篩查的首選方法,能夠發(fā)現(xiàn)直徑1.0cm左右的微小癌灶。但超聲檢查的結(jié)果受操作者經(jīng)驗(yàn)和患者體型等因素的影響較大,且對于一些位置較深或被氣體遮擋的病灶容易漏診。CT檢查能夠提供更詳細(xì)的肝臟解剖結(jié)構(gòu)信息,可檢出微小癌灶,對于肝癌的定位、定性診斷具有重要價(jià)值。不過,CT檢查存在一定的輻射劑量,且在鑒別肝癌與其他肝臟良性病變時(shí),有時(shí)會(huì)存在困難。MRI檢查對軟組織的分辨能力優(yōu)于CT,能夠多方位、多參數(shù)成像,對于肝癌與血管瘤等良性病變的鑒別具有獨(dú)特的優(yōu)勢,還可清晰顯示血管和膽道內(nèi)有無癌栓。但其檢查時(shí)間較長,費(fèi)用較高,且對患者的配合度要求較高。組織病理學(xué)檢查是肝癌診斷的“金標(biāo)準(zhǔn)”,通過對肝臟組織進(jìn)行穿刺活檢,獲取病理標(biāo)本,在顯微鏡下觀察細(xì)胞形態(tài)和組織結(jié)構(gòu),能夠明確腫瘤的類型、分化程度等信息。然而,該方法屬于有創(chuàng)檢查,存在出血、感染、腫瘤種植轉(zhuǎn)移等風(fēng)險(xiǎn),且對于一些微小病灶或位置特殊的病灶,穿刺活檢的難度較大,難以獲取足夠的組織標(biāo)本,從而影響診斷的準(zhǔn)確性。現(xiàn)有肝癌診斷方法存在一定的局限性。血清標(biāo)志物檢測的準(zhǔn)確性有限,容易出現(xiàn)假陽性和假陰性結(jié)果;影像學(xué)檢查雖然能夠提供肝臟的形態(tài)和結(jié)構(gòu)信息,但對于早期微小肝癌的診斷仍存在一定的困難,且不同檢查方法之間的互補(bǔ)性不足;組織病理學(xué)檢查雖然是診斷的金標(biāo)準(zhǔn),但由于其有創(chuàng)性和操作難度,難以廣泛應(yīng)用于大規(guī)模的篩查和早期診斷。因此,開發(fā)一種更加準(zhǔn)確、高效、無創(chuàng)或微創(chuàng)的肝癌診斷方法迫在眉睫。2.2紋理特征分析基礎(chǔ)紋理作為圖像中一種重要的視覺特征,廣泛存在于自然界和人造物體的表面,它能夠反映物體表面的結(jié)構(gòu)組織排列屬性以及與周圍環(huán)境的關(guān)系。在計(jì)算機(jī)視覺和圖像處理領(lǐng)域,紋理被定義為圖像中像素灰度值的空間分布模式。例如,木材的紋理表現(xiàn)為其纖維的走向和排列方式,不同種類的木材具有獨(dú)特的紋理特征,橡木的紋理通常較為粗糙,呈現(xiàn)出明顯的年輪和紋理走向;而松木的紋理則相對較細(xì),年輪之間的間隔較為均勻。在醫(yī)學(xué)圖像中,肝癌組織的紋理與正常肝組織的紋理存在顯著差異,肝癌組織的紋理可能表現(xiàn)為更加雜亂、不均勻,灰度值的變化更為劇烈,這些紋理特征的差異為基于紋理分析的肝癌識(shí)別提供了重要的依據(jù)。紋理具有多個(gè)重要特性。粗糙度是紋理的一個(gè)顯著特性,它描述了紋理表面的光滑或粗糙程度。在圖像中,粗糙度可以通過像素灰度值的變化頻率和幅度來體現(xiàn),變化頻率高、幅度大的紋理通常被認(rèn)為是粗糙的,反之則是光滑的。如砂紙的紋理,其表面的顆粒分布不均勻,導(dǎo)致像素灰度值變化頻繁且幅度較大,給人一種粗糙的視覺感受;而絲綢的紋理則相對光滑,像素灰度值變化較為平緩。方向性也是紋理的重要特性之一,許多紋理具有明顯的方向性,如木材的紋理沿著纖維方向延伸,織物的紋理在編織方向上呈現(xiàn)出特定的排列規(guī)律。在圖像中,方向性可以通過分析像素灰度值在不同方向上的變化趨勢來確定,例如,通過計(jì)算灰度共生矩陣在不同方向上的特征值,能夠有效地提取紋理的方向性信息。重復(fù)性是紋理的另一個(gè)關(guān)鍵特性,它指的是紋理模式在一定區(qū)域內(nèi)的重復(fù)出現(xiàn)。像磚墻的紋理,磚塊以規(guī)則的方式排列,形成了周期性重復(fù)的紋理模式;而樹葉的紋理雖然看似復(fù)雜,但在一定程度上也具有局部的重復(fù)性,葉脈的分布在葉片的不同部位呈現(xiàn)出相似的結(jié)構(gòu)。在圖像分析中,重復(fù)性可以通過統(tǒng)計(jì)紋理模式的周期和重復(fù)次數(shù)來量化,這對于識(shí)別和分類具有重復(fù)性紋理的物體具有重要意義。根據(jù)紋理的結(jié)構(gòu)和生成方式,紋理可分為周期性紋理和隨機(jī)紋理。周期性紋理,也被稱為規(guī)則紋理,其具有明確的周期性結(jié)構(gòu),由基本紋理單元按照一定的規(guī)律重復(fù)排列而成。如紡織品中的條紋圖案、方格圖案,它們的紋理單元在水平和垂直方向上以固定的間隔重復(fù)出現(xiàn),形成了規(guī)則的紋理結(jié)構(gòu)。周期性紋理的特點(diǎn)是具有較高的規(guī)律性和可預(yù)測性,通過分析其紋理單元的特征和排列規(guī)律,可以準(zhǔn)確地描述和識(shí)別這類紋理。隨機(jī)紋理,又稱為非周期性紋理,是由隨機(jī)過程生成的,其紋理模式?jīng)]有明顯的周期性和規(guī)律性。像自然景觀中的草地、山脈、云層等,它們的紋理表現(xiàn)出高度的隨機(jī)性和復(fù)雜性。隨機(jī)紋理的像素灰度值變化是隨機(jī)的,但在統(tǒng)計(jì)意義上仍然具有一定的特征,如通過統(tǒng)計(jì)分析紋理的灰度分布、自相關(guān)函數(shù)等,可以提取出隨機(jī)紋理的特征信息,用于圖像的分析和處理。紋理描述方法是提取和表示紋理特征的關(guān)鍵技術(shù),不同的紋理描述方法適用于不同類型的紋理和應(yīng)用場景。統(tǒng)計(jì)法是一種常用的紋理描述方法,它基于像素及其鄰域的灰度屬性,研究紋理區(qū)域中的統(tǒng)計(jì)特性?;叶裙采仃嚕℅LCM)是統(tǒng)計(jì)法的典型代表,它通過計(jì)算圖像中不同灰度級(jí)像素對在不同空間位置關(guān)系下的出現(xiàn)頻率,來描述紋理的特征。例如,GLCM可以計(jì)算出對比度、相關(guān)性、能量和熵等紋理特征,對比度反映了紋理中灰度變化的劇烈程度,相關(guān)性表示紋理中像素灰度的線性相關(guān)程度,能量體現(xiàn)了紋理的均勻性,熵則衡量了紋理的復(fù)雜性。通過分析這些特征,可以有效地識(shí)別和分類不同紋理的圖像。頻譜法是從頻域角度分析紋理特征的方法,它基于傅里葉變換等頻域變換技術(shù),將圖像從空間域轉(zhuǎn)換到頻域,通過分析頻域中的能量分布和頻率成分來描述紋理。傅里葉頻譜可以根據(jù)峰值所占的能量比例將圖像分類,通過計(jì)算峰值處的面積、峰值處的相位、峰值與原點(diǎn)的距離平方、兩個(gè)峰值間的相角差等手段,提取出紋理的頻率特征。對于具有明顯周期性或方向性的紋理,頻譜法能夠有效地分析其頻率特性,提供有價(jià)值的紋理信息。模型法假設(shè)紋理是以某種參數(shù)控制的分布模型方式形成的,通過從紋理圖像中估計(jì)計(jì)算模型參數(shù),以參數(shù)為特征進(jìn)行圖像分析和分類。馬爾可夫隨機(jī)場(MRF)模型是模型法中的一種典型方法,它通過定義像素之間的局部依賴關(guān)系,構(gòu)建紋理的概率模型。在MRF模型中,每個(gè)像素的狀態(tài)不僅取決于自身的灰度值,還與鄰域像素的狀態(tài)相關(guān),通過估計(jì)模型的參數(shù),如轉(zhuǎn)移概率、勢函數(shù)等,可以描述紋理的統(tǒng)計(jì)特性,實(shí)現(xiàn)對紋理圖像的分割和分類。結(jié)構(gòu)法認(rèn)為紋理是由紋理基元的類型和數(shù)目以及基元之間的“重復(fù)性”空間組織結(jié)構(gòu)和排列規(guī)則來描述。該方法假設(shè)紋理圖像的基元可以分離出來,通過分析基元的特征和排列規(guī)則進(jìn)行紋理分割。例如,句法紋理描述算法通過定義紋理基元的語法規(guī)則,來描述紋理的結(jié)構(gòu),對于具有規(guī)則結(jié)構(gòu)的人造紋理,如建筑圖案、編織物紋理等,結(jié)構(gòu)法能夠有效地分析其紋理結(jié)構(gòu),實(shí)現(xiàn)紋理的識(shí)別和分類。在實(shí)際應(yīng)用中,單一的紋理描述方法往往難以全面準(zhǔn)確地描述復(fù)雜的紋理特征,因此,結(jié)構(gòu)與統(tǒng)計(jì)相結(jié)合的方法應(yīng)運(yùn)而生。這種方法綜合利用了結(jié)構(gòu)法和統(tǒng)計(jì)法的優(yōu)勢,既考慮了紋理的局部結(jié)構(gòu)信息,又兼顧了紋理的全局統(tǒng)計(jì)特性。例如,先通過結(jié)構(gòu)法提取紋理的基元信息,確定紋理的基本結(jié)構(gòu)單元,然后利用統(tǒng)計(jì)法對基元之間的關(guān)系進(jìn)行統(tǒng)計(jì)分析,從而更全面地描述紋理特征。在分析自然紋理時(shí),這種結(jié)合的方法能夠更好地處理紋理的復(fù)雜性和多樣性,提高紋理分析的準(zhǔn)確性和可靠性。2.3EML(極限學(xué)習(xí)機(jī))算法原理前饋型神經(jīng)網(wǎng)絡(luò)是一種廣泛應(yīng)用的神經(jīng)網(wǎng)絡(luò)模型,其結(jié)構(gòu)包含輸入層、隱藏層和輸出層。輸入層負(fù)責(zé)接收外部輸入的數(shù)據(jù),將其傳遞給隱藏層。隱藏層可以有一層或多層,每一層中的神經(jīng)元僅與相鄰層的神經(jīng)元相連,接收前一層的輸出,并通過激活函數(shù)對輸入進(jìn)行非線性變換,然后將變換后的結(jié)果輸出給下一層。輸出層則接收隱藏層的輸出,并產(chǎn)生最終的輸出結(jié)果。在圖像分類任務(wù)中,輸入層接收圖像的像素?cái)?shù)據(jù),隱藏層通過一系列的非線性變換提取圖像的特征,輸出層根據(jù)這些特征判斷圖像所屬的類別。前饋型神經(jīng)網(wǎng)絡(luò)的信息傳遞是單向的,從輸入層流向輸出層,不存在反饋連接。這種結(jié)構(gòu)使得前饋型神經(jīng)網(wǎng)絡(luò)在處理靜態(tài)數(shù)據(jù)時(shí)表現(xiàn)出色,能夠通過多層神經(jīng)元的傳遞,學(xué)習(xí)到輸入數(shù)據(jù)的復(fù)雜特征。然而,傳統(tǒng)的前饋型神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中,通常采用梯度下降等迭代算法來調(diào)整神經(jīng)元之間的連接權(quán)重,這種訓(xùn)練方式計(jì)算復(fù)雜、耗時(shí)較長,且容易陷入局部最優(yōu)解。極限學(xué)習(xí)機(jī)(ELM)作為一種新型的單隱層前饋神經(jīng)網(wǎng)絡(luò),由黃廣斌等人于2004年首次提出。ELM的基本原理是在訓(xùn)練過程中,隨機(jī)初始化輸入層與隱藏層之間的連接權(quán)重以及隱藏層神經(jīng)元的閾值,然后通過求解一個(gè)線性方程組來確定隱藏層與輸出層之間的連接權(quán)重。具體來說,對于一個(gè)具有N個(gè)樣本的訓(xùn)練集\{(x_i,t_i)\}_{i=1}^N,其中x_i是輸入向量,t_i是對應(yīng)的目標(biāo)輸出向量。假設(shè)ELM的隱藏層有L個(gè)神經(jīng)元,激活函數(shù)為g(x)。首先,隨機(jī)生成輸入層與隱藏層之間的連接權(quán)重矩陣W和隱藏層神經(jīng)元的閾值向量b,則隱藏層的輸出矩陣H可以表示為:H=\begin{bmatrix}g(W_1x_1+b_1)&g(W_2x_1+b_2)&\cdots&g(W_Lx_1+b_L)\\g(W_1x_2+b_1)&g(W_2x_2+b_2)&\cdots&g(W_Lx_2+b_L)\\\vdots&\vdots&\ddots&\vdots\\g(W_1x_N+b_1)&g(W_2x_N+b_2)&\cdots&g(W_Lx_N+b_L)\end{bmatrix}其中,W_j是連接權(quán)重矩陣W的第j列向量,b_j是閾值向量b的第j個(gè)元素。然后,通過求解以下線性方程組來確定隱藏層與輸出層之間的連接權(quán)重矩陣\beta:H\beta=T其中,T=\begin{bmatrix}t_1^T\\t_2^T\\\vdots\\t_N^T\end{bmatrix}是目標(biāo)輸出矩陣。當(dāng)隱藏層的輸出矩陣H滿秩時(shí),可以通過最小二乘法求解得到\beta=H^+T,其中H^+是H的Moore-Penrose廣義逆。通過這種方式,ELM將傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的復(fù)雜迭代訓(xùn)練過程轉(zhuǎn)化為一個(gè)簡單的線性求解問題,大大提高了學(xué)習(xí)速度。ELM與支持向量機(jī)(SVM)都是常用的機(jī)器學(xué)習(xí)算法,在模式識(shí)別和數(shù)據(jù)分類領(lǐng)域有著廣泛的應(yīng)用,但它們在多個(gè)方面存在差異。從算法原理上看,ELM是一種基于單隱層前饋神經(jīng)網(wǎng)絡(luò)的算法,通過隨機(jī)初始化輸入層與隱藏層之間的參數(shù),將訓(xùn)練問題轉(zhuǎn)化為線性方程組的求解,屬于神經(jīng)網(wǎng)絡(luò)范疇;而SVM是基于統(tǒng)計(jì)學(xué)習(xí)理論的算法,其核心思想是在高維空間中尋找一個(gè)最優(yōu)的分離超平面,使得不同類別的樣本之間的間隔最大化,屬于統(tǒng)計(jì)學(xué)習(xí)范疇。在訓(xùn)練速度方面,ELM由于采用了非迭代的訓(xùn)練方式,只需隨機(jī)初始化隱藏層參數(shù)后直接求解輸出層權(quán)重,訓(xùn)練過程簡單快速,尤其在處理大規(guī)模數(shù)據(jù)集時(shí),能夠顯著節(jié)省訓(xùn)練時(shí)間;SVM在訓(xùn)練過程中需要求解一個(gè)復(fù)雜的凸優(yōu)化問題,當(dāng)數(shù)據(jù)集較大時(shí),計(jì)算量和內(nèi)存需求都會(huì)顯著增加,導(dǎo)致訓(xùn)練速度較慢。以一個(gè)包含10000個(gè)樣本的圖像分類數(shù)據(jù)集為例,使用ELM進(jìn)行訓(xùn)練可能只需要幾分鐘,而使用SVM可能需要數(shù)小時(shí)甚至更長時(shí)間。在泛化性能上,ELM通過隨機(jī)初始化隱藏層參數(shù),具有一定的隨機(jī)性,在一些情況下能夠避免陷入局部最優(yōu)解,從而具有較好的泛化能力;SVM基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,通過最大化分類間隔來提高模型的泛化性能,在小樣本數(shù)據(jù)集上表現(xiàn)出色。然而,當(dāng)數(shù)據(jù)分布復(fù)雜或存在噪聲時(shí),SVM的泛化性能可能會(huì)受到影響,而ELM對噪聲和異常數(shù)據(jù)具有一定的魯棒性。在可擴(kuò)展性方面,ELM的非迭代訓(xùn)練方式使其在處理大規(guī)模數(shù)據(jù)時(shí)具有較好的可擴(kuò)展性,能夠方便地應(yīng)用于大數(shù)據(jù)場景;SVM在處理大規(guī)模數(shù)據(jù)時(shí),由于計(jì)算復(fù)雜度較高,可能需要采用一些近似算法或分布式計(jì)算技術(shù)來提高可擴(kuò)展性。三、基于紋理特征的肝癌圖像分析3.1圖像采集與預(yù)處理本研究中的肝癌圖像主要來源于某大型三甲醫(yī)院的影像數(shù)據(jù)庫,該數(shù)據(jù)庫存儲(chǔ)了大量經(jīng)臨床確診的肝癌患者和正常人群的醫(yī)學(xué)影像資料,涵蓋了多種成像模態(tài),包括超聲、CT和MRI圖像。圖像采集設(shè)備均為國際知名品牌的高端醫(yī)學(xué)影像設(shè)備,超聲圖像采用飛利浦iU22超聲診斷儀采集,其配備了先進(jìn)的寬頻探頭,能夠提供高分辨率的肝臟超聲圖像,頻率范圍為2-5MHz,可清晰顯示肝臟的細(xì)微結(jié)構(gòu)和病變情況;CT圖像使用西門子SOMATOMDefinitionFlash雙源CT掃描儀獲取,該設(shè)備具有高掃描速度和高空間分辨率的特點(diǎn),能夠在短時(shí)間內(nèi)完成肝臟的掃描,生成高質(zhì)量的斷層圖像,掃描層厚為1-5mm,可根據(jù)臨床需求進(jìn)行調(diào)整;MRI圖像則通過GESignaHDxt3.0T磁共振成像系統(tǒng)采集,其具備強(qiáng)大的軟組織分辨能力,能夠提供多方位、多參數(shù)的圖像信息,掃描序列包括T1WI、T2WI、DWI等,可滿足不同的診斷需求。在圖像采集過程中,嚴(yán)格遵循臨床操作規(guī)范和影像設(shè)備的使用說明,確保圖像的質(zhì)量和一致性。對于每一位患者,均在空腹?fàn)顟B(tài)下進(jìn)行檢查,以減少胃腸道氣體和食物對肝臟成像的影響。同時(shí),根據(jù)患者的具體情況和臨床需求,合理調(diào)整掃描參數(shù),如掃描范圍、層厚、矩陣等,以獲取最清晰、最準(zhǔn)確的肝臟圖像。由于醫(yī)學(xué)圖像在采集、傳輸和存儲(chǔ)過程中,容易受到各種因素的干擾,如電子噪聲、設(shè)備固有噪聲、患者的生理運(yùn)動(dòng)等,導(dǎo)致圖像中存在噪聲、模糊、對比度低等問題,這些問題會(huì)嚴(yán)重影響圖像的質(zhì)量和后續(xù)的分析處理。因此,在對肝癌圖像進(jìn)行紋理特征提取之前,需要對圖像進(jìn)行預(yù)處理,以提高圖像的質(zhì)量,為后續(xù)的分析提供可靠的數(shù)據(jù)基礎(chǔ)。去噪是圖像預(yù)處理的重要環(huán)節(jié),其目的是去除圖像中的噪聲,提高圖像的信噪比。本研究采用雙邊濾波算法對肝癌圖像進(jìn)行去噪處理。雙邊濾波是一種非線性的濾波方法,它在考慮像素空間距離的同時(shí),還考慮了像素的灰度差異,能夠在去除噪聲的同時(shí)較好地保留圖像的邊緣和細(xì)節(jié)信息。其基本原理是通過一個(gè)加權(quán)函數(shù)對鄰域內(nèi)的像素進(jìn)行加權(quán)平均,權(quán)重由空間距離權(quán)重和灰度相似性權(quán)重兩部分組成。空間距離權(quán)重保證了濾波過程中對鄰域像素的選擇,使得濾波后的圖像在空間上保持平滑;灰度相似性權(quán)重則根據(jù)像素之間的灰度差異來調(diào)整權(quán)重,當(dāng)像素灰度差異較大時(shí),權(quán)重較小,從而避免了對邊緣和細(xì)節(jié)的過度平滑。對于一幅含有噪聲的肝癌圖像,雙邊濾波算法能夠有效地去除噪聲,同時(shí)保留肝臟組織的邊緣和紋理細(xì)節(jié),為后續(xù)的紋理特征提取提供清晰的圖像。平滑處理是為了消除圖像中的局部起伏,使圖像更加平滑。采用高斯平滑算法對圖像進(jìn)行處理。高斯平滑是基于高斯函數(shù)的一種線性平滑濾波方法,它通過對圖像中的每個(gè)像素與其鄰域內(nèi)的像素進(jìn)行加權(quán)平均來實(shí)現(xiàn)平滑效果。高斯函數(shù)的特點(diǎn)是在中心位置具有最大值,隨著距離中心的增加,權(quán)重逐漸減小,這種特性使得高斯平滑能夠在平滑圖像的同時(shí),對圖像的邊緣和細(xì)節(jié)有一定的保護(hù)作用。在對肝癌圖像進(jìn)行高斯平滑時(shí),通過調(diào)整高斯核的大小和標(biāo)準(zhǔn)差,可以控制平滑的程度,以達(dá)到最佳的平滑效果。圖像增強(qiáng)旨在提高圖像的對比度和清晰度,突出圖像中的感興趣區(qū)域。本研究運(yùn)用直方圖均衡化算法對肝癌圖像進(jìn)行增強(qiáng)處理。直方圖均衡化是一種通過對圖像的灰度直方圖進(jìn)行調(diào)整,來增強(qiáng)圖像對比度的方法。它的基本思想是將圖像的灰度分布進(jìn)行重新分配,使得圖像的灰度值在整個(gè)灰度范圍內(nèi)更加均勻地分布,從而增強(qiáng)圖像的對比度。對于肝癌圖像,由于肝臟組織和病變區(qū)域的灰度差異可能較小,通過直方圖均衡化,可以有效地增強(qiáng)這種差異,使肝臟病變區(qū)域更加明顯,便于后續(xù)的觀察和分析。歸一化處理是將圖像的灰度值映射到一個(gè)固定的范圍內(nèi),如[0,1]或[-1,1],以消除不同圖像之間的灰度差異,保證后續(xù)處理的一致性。采用線性歸一化方法對肝癌圖像進(jìn)行歸一化處理。線性歸一化的計(jì)算公式為:I_{norm}(x,y)=\frac{I(x,y)-I_{min}}{I_{max}-I_{min}}其中,I(x,y)是原始圖像在坐標(biāo)(x,y)處的灰度值,I_{min}和I_{max}分別是原始圖像的最小灰度值和最大灰度值,I_{norm}(x,y)是歸一化后圖像在坐標(biāo)(x,y)處的灰度值。通過線性歸一化,將不同肝癌圖像的灰度值統(tǒng)一映射到[0,1]范圍內(nèi),使得不同圖像在后續(xù)的紋理特征提取和分析過程中具有相同的尺度和范圍,避免了灰度差異對分析結(jié)果的影響。3.2紋理特征提取方法分形維數(shù)是分形理論中的一個(gè)關(guān)鍵概念,用于定量描述分形對象的復(fù)雜程度和不規(guī)則性。分形理論由曼德布羅特(B.B.Mandelbrot)于20世紀(jì)70年代提出,它打破了傳統(tǒng)歐幾里得幾何對規(guī)則形狀的局限,為研究自然界中復(fù)雜的、不規(guī)則的形態(tài)提供了有力的工具。在數(shù)學(xué)上,分形維數(shù)通常不是整數(shù),而是介于整數(shù)之間的分?jǐn)?shù),這是分形對象區(qū)別于傳統(tǒng)幾何對象的重要特征之一。例如,經(jīng)典的科赫曲線(Kochcurve),它是一種典型的分形圖形,其分形維數(shù)約為1.26,大于線段的維數(shù)1,小于平面的維數(shù)2,反映了科赫曲線比線段更復(fù)雜,但又尚未占據(jù)整個(gè)平面的特性。在肝癌圖像紋理分析中,分形維數(shù)能夠有效地描述肝癌組織紋理的復(fù)雜程度和不規(guī)則性。正常肝組織的細(xì)胞排列規(guī)則,組織結(jié)構(gòu)相對均勻,其超聲、CT、MRI等醫(yī)學(xué)圖像的紋理也較為規(guī)則,分形維數(shù)較??;而肝癌組織由于癌細(xì)胞的異常增殖和浸潤,細(xì)胞排列紊亂,組織結(jié)構(gòu)遭到破壞,反映在圖像上的紋理變得復(fù)雜且不規(guī)則,分形維數(shù)較大。通過計(jì)算肝癌圖像的分形維數(shù),可以為肝癌的診斷和鑒別診斷提供有價(jià)值的信息。計(jì)算分形維數(shù)的方法有多種,其中盒子維數(shù)是一種常用的方法。對于一個(gè)二維的肝癌圖像,假設(shè)圖像的大小為M\timesN,將圖像劃分為大小為\epsilon\times\epsilon的盒子,統(tǒng)計(jì)覆蓋圖像中所有非零像素所需的盒子數(shù)量N(\epsilon)。隨著盒子尺寸\epsilon的不斷減小,N(\epsilon)會(huì)不斷增加,當(dāng)\epsilon趨于0時(shí),盒子維數(shù)D_B可以通過以下公式計(jì)算:D_B=\lim_{\epsilon\to0}\frac{\logN(\epsilon)}{\log(1/\epsilon)}在實(shí)際計(jì)算中,通常選取一系列不同大小的盒子尺寸\epsilon_1,\epsilon_2,\cdots,\epsilon_n,計(jì)算對應(yīng)的N(\epsilon_1),N(\epsilon_2),\cdots,N(\epsilon_n),然后通過對數(shù)線性擬合的方法,得到D_B的估計(jì)值。例如,在對肝癌超聲圖像進(jìn)行分形維數(shù)計(jì)算時(shí),首先將圖像讀入程序,然后從最小盒子尺寸開始,逐步增大盒子尺寸,統(tǒng)計(jì)每個(gè)盒子尺寸下覆蓋圖像中肝臟區(qū)域所需的盒子數(shù)量,最后利用這些數(shù)據(jù)進(jìn)行對數(shù)線性擬合,得到該肝癌超聲圖像的盒子維數(shù)。多重分形是分形理論的進(jìn)一步拓展,它能夠更細(xì)致地描述分形對象的局部特性和奇異性分布。在肝癌圖像紋理分析中,多重分形可以考慮圖像中不同灰度區(qū)域的分形特性,從而更全面地反映肝癌組織的紋理特征。傳統(tǒng)的分形維數(shù)方法通常只能給出一個(gè)整體的分形維數(shù)值,無法區(qū)分圖像中不同區(qū)域的分形差異;而多重分形通過引入多重分形譜,能夠描述不同奇異程度的分形子集的分布情況。多重分形譜中的參數(shù),如廣義維數(shù)D_q、奇異指數(shù)\alpha和多重分形譜函數(shù)f(\alpha)等,可以提供關(guān)于肝癌圖像紋理的豐富信息。廣義維數(shù)D_q反映了圖像中不同灰度區(qū)域的分形特性在不同權(quán)重下的綜合表現(xiàn),當(dāng)q=0時(shí),D_0即為盒子維數(shù);奇異指數(shù)\alpha描述了分形子集的局部奇異性程度,不同的\alpha值對應(yīng)著圖像中不同奇異程度的區(qū)域;多重分形譜函數(shù)f(\alpha)則表示具有奇異指數(shù)\alpha的分形子集的維數(shù)。通過分析多重分形譜,可以發(fā)現(xiàn)肝癌圖像中不同區(qū)域的紋理復(fù)雜程度和奇異性分布的差異,從而為肝癌的診斷和分析提供更深入的依據(jù)。例如,在對肝癌CT圖像進(jìn)行多重分形分析時(shí),可以計(jì)算圖像不同區(qū)域的多重分形譜,發(fā)現(xiàn)肝癌病灶區(qū)域的多重分形譜與正常肝組織區(qū)域存在明顯差異,病灶區(qū)域的奇異指數(shù)分布范圍更廣,多重分形譜函數(shù)的形態(tài)也更為復(fù)雜,這表明肝癌病灶區(qū)域的紋理具有更高的復(fù)雜性和異質(zhì)性。灰度共生矩陣(Gray-LevelCo-occurrenceMatrix,GLCM)由Haralick等人于1973年提出,是一種基于統(tǒng)計(jì)方法的紋理分析工具,用于描述圖像中灰度級(jí)的空間相關(guān)性。其基本原理是通過統(tǒng)計(jì)圖像中在特定方向上、相隔一定距離的兩個(gè)像素點(diǎn)的灰度組合出現(xiàn)的頻率,來構(gòu)建一個(gè)矩陣,從而反映圖像的紋理特征。具體來說,對于一幅灰度圖像,首先確定兩個(gè)參數(shù):距離d和方向\theta。常見的方向有0°、45°、90°和135°。然后,對于圖像中的每個(gè)像素點(diǎn)(x,y),統(tǒng)計(jì)其與在方向\theta上距離為d的像素點(diǎn)(x+\Deltax,y+\Deltay)的灰度值分別為i和j的出現(xiàn)次數(shù),其中\(zhòng)Deltax和\Deltay根據(jù)方向\theta和距離d確定。將這些統(tǒng)計(jì)結(jié)果歸一化后,得到灰度共生矩陣P(i,j,d,\theta),其元素P(i,j,d,\theta)表示從灰度為i的像素點(diǎn)出發(fā),在方向\theta上距離為d的點(diǎn)灰度為j的概率?;诨叶裙采仃嚕梢蕴崛《鄠€(gè)能夠反映圖像紋理特征的參量。角二階矩(AngularSecondMoment,ASM),又稱為能量,用于衡量圖像灰度分布的均勻性和紋理的粗細(xì)程度。其計(jì)算公式為:ASM=\sum_{i=0}^{L-1}\sum_{j=0}^{L-1}P(i,j,d,\theta)^2其中,L為圖像的灰度級(jí)數(shù)。當(dāng)圖像的紋理較為均勻、規(guī)則時(shí),灰度共生矩陣中的元素值相對集中,角二階矩的值較大;反之,當(dāng)圖像的紋理變化復(fù)雜、不均勻時(shí),角二階矩的值較小。例如,對于一幅正常肝組織的超聲圖像,其紋理相對均勻,灰度共生矩陣的元素值較為集中,計(jì)算得到的角二階矩值較大;而肝癌組織的超聲圖像紋理復(fù)雜,灰度共生矩陣的元素值分布較為分散,角二階矩值較小。對比度(Contrast)用于度量圖像中局部灰度變化的程度,反映了圖像的清晰度和紋理的溝紋深淺。其計(jì)算公式為:Contrast=\sum_{i=0}^{L-1}\sum_{j=0}^{L-1}(i-j)^2P(i,j,d,\theta)對比度越大,說明圖像中灰度變化越劇烈,紋理的溝紋越深,圖像越清晰;對比度越小,紋理的溝紋越淺,圖像越模糊。在肝癌圖像中,肝癌組織與正常肝組織的對比度差異明顯,肝癌組織的紋理變化較大,對比度值較高,而正常肝組織的對比度值相對較低。相關(guān)性(Correlation)用于衡量圖像灰度級(jí)在行或列方向上的相似程度,反映了圖像中局部灰度的相關(guān)性。其計(jì)算公式為:Correlation=\frac{\sum_{i=0}^{L-1}\sum_{j=0}^{L-1}(i-\mu_i)(j-\mu_j)P(i,j,d,\theta)}{\sigma_i\sigma_j}其中,\mu_i和\mu_j分別是灰度值i和j的均值,\sigma_i和\sigma_j分別是灰度值i和j的標(biāo)準(zhǔn)差。相關(guān)性越大,說明圖像中灰度級(jí)在行或列方向上的相似性越高,局部灰度的相關(guān)性越強(qiáng);相關(guān)性越小,說明灰度級(jí)的相似性越低。在分析肝癌圖像時(shí),正常肝組織的紋理具有一定的規(guī)律性,相關(guān)性較高;而肝癌組織的紋理雜亂無章,相關(guān)性較低。倒數(shù)差分矩(InverseDifferenceMoment,IDM),也稱為逆差距或同質(zhì)性,用于反映圖像紋理局部變化的大小。其計(jì)算公式為:IDM=\sum_{i=0}^{L-1}\sum_{j=0}^{L-1}\frac{P(i,j,d,\theta)}{1+(i-j)^2}當(dāng)圖像紋理的不同區(qū)域間變化緩慢、較為均勻時(shí),倒數(shù)差分矩的值較大;當(dāng)紋理變化劇烈、不均勻時(shí),倒數(shù)差分矩的值較小。在肝癌圖像中,正常肝組織的倒數(shù)差分矩值相對較大,表明其紋理較為均勻;肝癌組織的倒數(shù)差分矩值較小,說明其紋理變化較大。熵(Entropy)用于度量圖像中包含信息量的隨機(jī)性和不確定性。其計(jì)算公式為:Entropy=-\sum_{i=0}^{L-1}\sum_{j=0}^{L-1}P(i,j,d,\theta)\logP(i,j,d,\theta)當(dāng)灰度共生矩陣中所有元素值相等或者像素值表現(xiàn)出最大的隨機(jī)性時(shí),熵達(dá)到最大值;熵值越大,說明圖像灰度分布越復(fù)雜,包含的信息量越多。在肝癌圖像分析中,肝癌組織的熵值通常大于正常肝組織,這是因?yàn)楦伟┙M織的紋理更加復(fù)雜,灰度分布的隨機(jī)性更強(qiáng)。灰度行程矩陣(Gray-LevelRun-LengthMatrix,GLRLM),也稱為灰度游程矩陣,是另一種用于紋理分析的方法,它通過統(tǒng)計(jì)圖像中具有相同灰度值的連續(xù)像素的長度和分布情況,來描述圖像的紋理特征。對于一幅灰度圖像,首先確定方向\theta,常見的方向同樣有0°、45°、90°和135°。然后,在指定方向上,統(tǒng)計(jì)連續(xù)的、共線的且具有相同灰度級(jí)(或?qū)儆谕换叶榷危┑南袼攸c(diǎn)的長度,即灰度行程長度。例如,在水平方向(0°)上,對于圖像中的某一行像素,從左到右依次檢查像素的灰度值,當(dāng)遇到連續(xù)的具有相同灰度值的像素時(shí),統(tǒng)計(jì)其長度,直到灰度值發(fā)生變化。將這些統(tǒng)計(jì)結(jié)果整理成矩陣形式,得到灰度行程矩陣M(g,r,\theta),其中g(shù)表示灰度值,r表示灰度行程長度,\theta表示方向,M(g,r,\theta)表示在方向\theta上,灰度為g、長度為r的灰度行程出現(xiàn)的總次數(shù)?;诨叶刃谐叹仃?,可以提取多個(gè)能夠反映圖像紋理特征的參量。短行程優(yōu)勢(Short-RunEmphasis,SRE)用于衡量圖像中短灰度行程的相對重要性。其計(jì)算公式為:SRE=\frac{\sum_{g=0}^{L-1}\sum_{r=1}^{R}\frac{M(g,r,\theta)}{r^2}}{\sum_{g=0}^{L-1}\sum_{r=1}^{R}M(g,r,\theta)}其中,L為圖像的灰度級(jí)數(shù),R為最大灰度行程長度。短行程優(yōu)勢越大,說明圖像中短灰度行程出現(xiàn)的頻率相對較高,紋理較為細(xì)致;短行程優(yōu)勢越小,說明長灰度行程相對較多,紋理較為粗糙。在肝癌圖像中,正常肝組織的短行程優(yōu)勢相對較大,表明其紋理相對細(xì)致;而肝癌組織的短行程優(yōu)勢較小,紋理相對粗糙。長行程優(yōu)勢(Long-RunEmphasis,LRE)用于衡量圖像中長灰度行程的相對重要性。其計(jì)算公式為:LRE=\frac{\sum_{g=0}^{L-1}\sum_{r=1}^{R}r^2M(g,r,\theta)}{\sum_{g=0}^{L-1}\sum_{r=1}^{R}M(g,r,\theta)}長行程優(yōu)勢越大,說明圖像中長灰度行程出現(xiàn)的頻率相對較高,紋理較為粗糙;長行程優(yōu)勢越小,說明短灰度行程相對較多,紋理較為細(xì)致。與短行程優(yōu)勢相反,肝癌組織的長行程優(yōu)勢通常大于正常肝組織,反映了肝癌組織紋理的粗糙程度?;叶炔痪鶆蛐远攘浚℅ray-LevelNon-Uniformity,GLNU)用于衡量圖像中灰度分布的均勻程度。其計(jì)算公式為:GLNU=\frac{\sum_{g=0}^{L-1}(\sum_{r=1}^{R}M(g,r,\theta))^2}{\sum_{g=0}^{L-1}\sum_{r=1}^{R}M(g,r,\theta)}灰度不均勻性度量值越大,說明圖像中不同灰度值的行程分布越不均勻,灰度分布的差異較大;灰度不均勻性度量值越小,說明灰度分布相對均勻。在肝癌圖像中,肝癌組織的灰度不均勻性度量值通常大于正常肝組織,表明肝癌組織的灰度分布更加不均勻。行程長度的不均勻性度量(Run-LengthNon-Uniformity,RLNU)用于衡量圖像中灰度行程長度分布的均勻程度。其計(jì)算公式為:RLNU=\frac{\sum_{r=1}^{R}(\sum_{g=0}^{L-1}M(g,r,\theta))^2}{\sum_{g=0}^{L-1}\sum_{r=1}^{R}M(g,r,\theta)}行程長度的不均勻性度量值越大,說明圖像中不同長度的灰度行程分布越不均勻,行程長度的差異較大;行程長度的不均勻性度量值越小,說明行程長度分布相對均勻。肝癌組織的行程長度的不均勻性度量值往往大于正常肝組織,體現(xiàn)了肝癌組織紋理中灰度行程長度分布的不均勻性。行程總數(shù)的百分率(RunPercentage,RP)用于表示圖像中灰度行程總數(shù)占總像素?cái)?shù)的比例。其計(jì)算公式為:RP=\frac{\sum_{g=0}^{L-1}\sum_{r=1}^{R}M(g,r,\theta)}{N}其中,N為圖像的總像素?cái)?shù)。行程總數(shù)的百分率反映了圖像中紋理的復(fù)雜程度,百分率越高,說明圖像中紋理的變化越頻繁,紋理越復(fù)雜;百分率越低,說明紋理相對簡單。在肝癌圖像分析中,肝癌組織的行程總數(shù)的百分率通常高于正常肝組織,表明肝癌組織的紋理更為復(fù)雜。局部二值模式(LocalBinaryPattern,LBP)由Ojala等人于1994年提出,是一種用于描述圖像局部紋理特征的方法,具有計(jì)算簡單、對光照變化不敏感、旋轉(zhuǎn)不變性等優(yōu)點(diǎn),在計(jì)算機(jī)視覺和圖像處理領(lǐng)域得到了廣泛的應(yīng)用。其基本原理是通過比較圖像中每個(gè)像素與其鄰域像素的灰度值,生成一個(gè)二進(jìn)制編碼,以此來表示該像素的局部紋理特征。對于一個(gè)中心像素p_c,其鄰域像素為p_0,p_1,\cdots,p_{n-1},通常取n=8,即8鄰域。首先計(jì)算鄰域像素與中心像素的灰度差值:d_i=p_i-p_c,\quadi=0,1,\cdots,n-1然后根據(jù)灰度差值生成二進(jìn)制編碼:LBP_{P,R}=\sum_{i=0}^{n-1}s(d_i)2^i其中,s(d_i)為符號(hào)函數(shù),當(dāng)d_i\geq0時(shí),s(d_i)=1;當(dāng)d_i\lt0時(shí),s(d_i)=0。P表示鄰域像素的個(gè)數(shù),R表示鄰域半徑。通過這種方式,每個(gè)像素都可以得到一個(gè)對應(yīng)的LBP編碼,該編碼反映了其鄰域像素的灰度分布情況,從而描述了圖像的局部紋理特征。為了進(jìn)一步提高LBP的性能,研究者們提出了多種擴(kuò)展算法。旋轉(zhuǎn)不變局部二值模式(Rotation-InvariantLocalBinaryPattern,RI-LBP)通過對LBP編碼進(jìn)行旋轉(zhuǎn)操作,取其中最小的編碼值作為最終的LBP特征,從而實(shí)現(xiàn)了旋轉(zhuǎn)不變性。例如,對于一個(gè)8鄰域的LBP編碼,將其進(jìn)行8次旋轉(zhuǎn),得到8個(gè)不同的編碼,然后取其中最小的編碼作為該像素的RI-LBP特征,這樣無論圖像如何旋轉(zhuǎn),該像素的RI-LBP特征都保持不變。均勻局部二值模式(UniformLocalBinaryPattern,U-LBP)則是對LBP編碼中0和1的跳變次數(shù)進(jìn)行限制,只保留跳變次數(shù)小于等于2的編碼,將其他編碼歸為一類。這樣可以減少編碼的種類,降低計(jì)算復(fù)雜度,同時(shí)突出圖像中紋理變化較為規(guī)則的區(qū)域。例如,對于一個(gè)8鄰域的LBP編碼,其0和1的跳變次數(shù)最多為8次,當(dāng)跳變次數(shù)小于等于2時(shí),認(rèn)為該編碼是均勻的,將其作為U-LBP特征的一種;當(dāng)跳變次數(shù)大于2時(shí),將其歸為非均勻類,統(tǒng)一用一個(gè)固定的編碼表示。在肝癌圖像紋理特征提取中,LBP及其擴(kuò)展算法能夠有效地捕捉肝癌組織紋理的局部特征。肝癌組織的細(xì)胞形態(tài)和排列與正常肝組織存在差異,這些差異會(huì)導(dǎo)致其圖像的局部紋理特征不同。通過計(jì)算肝癌圖像的LBP特征,可以發(fā)現(xiàn)肝癌組織區(qū)域的LBP編碼分布與正常肝組織區(qū)域有明顯區(qū)別。例如,肝癌組織區(qū)域的LBP編碼3.3特征選擇與優(yōu)化在基于紋理特征的肝癌圖像分析中,特征選擇與優(yōu)化是提高肝癌識(shí)別準(zhǔn)確性和效率的關(guān)鍵環(huán)節(jié)。從肝癌圖像中提取的紋理特征數(shù)量眾多,這些特征之間可能存在相關(guān)性和冗余性,直接將所有特征輸入到分類模型中,不僅會(huì)增加計(jì)算量,還可能導(dǎo)致模型過擬合,降低模型的泛化能力。因此,需要通過特征選擇方法篩選出對肝癌識(shí)別最具代表性和區(qū)分性的有效紋理特征,并采用降維算法對特征進(jìn)行優(yōu)化,降低數(shù)據(jù)維度,提高模型的性能。相關(guān)性分析是一種常用的特征選擇方法,它通過計(jì)算紋理特征與肝癌類別之間的相關(guān)系數(shù),來衡量特征與目標(biāo)變量之間的線性相關(guān)程度。相關(guān)系數(shù)的取值范圍在-1到1之間,絕對值越接近1,說明特征與肝癌類別之間的相關(guān)性越強(qiáng);絕對值越接近0,說明相關(guān)性越弱。在對肝癌CT圖像的紋理特征進(jìn)行相關(guān)性分析時(shí),發(fā)現(xiàn)灰度共生矩陣中的對比度特征與肝癌的相關(guān)性較高,相關(guān)系數(shù)達(dá)到了0.7,這表明對比度特征能夠較好地反映肝癌組織與正常肝組織之間的紋理差異,對肝癌的識(shí)別具有重要作用;而某些分形維數(shù)特征與肝癌類別的相關(guān)系數(shù)僅為0.2,說明這些特征與肝癌的相關(guān)性較弱,可能是冗余特征,可以考慮剔除。通過相關(guān)性分析,可以初步篩選出與肝癌相關(guān)性較強(qiáng)的紋理特征,為后續(xù)的分析和模型訓(xùn)練提供更有價(jià)值的信息。方差分析(AnalysisofVariance,ANOVA)也是一種有效的特征選擇方法,它通過比較不同類別樣本中紋理特征的均值差異,來判斷特征對分類的貢獻(xiàn)程度。方差分析的基本思想是將總變異分解為組間變異和組內(nèi)變異,通過計(jì)算F值來檢驗(yàn)組間變異是否顯著大于組內(nèi)變異。如果F值大于臨界值,說明不同類別樣本中特征的均值存在顯著差異,該特征對分類有較大的貢獻(xiàn);反之,如果F值小于臨界值,說明特征的均值在不同類別樣本中沒有顯著差異,該特征可能是冗余特征。以肝癌超聲圖像的紋理特征為例,對灰度行程矩陣中的短行程優(yōu)勢和長行程優(yōu)勢特征進(jìn)行方差分析,發(fā)現(xiàn)短行程優(yōu)勢特征在肝癌樣本和正常樣本中的均值差異顯著,F(xiàn)值遠(yuǎn)大于臨界值,說明短行程優(yōu)勢特征能夠有效地區(qū)分肝癌組織和正常肝組織,對肝癌的識(shí)別具有重要意義;而對于某些紋理特征,其在不同類別樣本中的均值差異不顯著,F(xiàn)值較小,通過方差分析可以將這些特征剔除,從而減少特征數(shù)量,提高模型的訓(xùn)練效率。t檢驗(yàn)是一種用于檢驗(yàn)兩個(gè)總體均值是否存在顯著差異的統(tǒng)計(jì)方法,在紋理特征選擇中,它可以用于判斷某個(gè)紋理特征在肝癌樣本和正常樣本中的均值是否有顯著不同,從而確定該特征是否對肝癌的識(shí)別有幫助。t檢驗(yàn)分為單樣本t檢驗(yàn)、獨(dú)立樣本t檢驗(yàn)和配對樣本t檢驗(yàn),在肝癌紋理特征選擇中,常用的是獨(dú)立樣本t檢驗(yàn)。對于獨(dú)立樣本t檢驗(yàn),首先需要假設(shè)兩個(gè)樣本來自具有相同方差的正態(tài)分布總體,然后計(jì)算t統(tǒng)計(jì)量:t=\frac{\bar{X_1}-\bar{X_2}}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}其中,\bar{X_1}和\bar{X_2}分別是肝癌樣本和正常樣本中某個(gè)紋理特征的均值,s_1^2和s_2^2分別是兩個(gè)樣本的方差,n_1和n_2分別是兩個(gè)樣本的數(shù)量。根據(jù)計(jì)算得到的t值和自由度,查找t分布表,得到對應(yīng)的p值。如果p值小于設(shè)定的顯著性水平(通常為0.05),則拒絕原假設(shè),認(rèn)為該紋理特征在肝癌樣本和正常樣本中的均值存在顯著差異,該特征對肝癌的識(shí)別有重要作用;反之,如果p值大于顯著性水平,則接受原假設(shè),認(rèn)為該特征在兩個(gè)樣本中的均值沒有顯著差異,可能是冗余特征,可以考慮剔除。例如,在對肝癌MRI圖像的局部二值模式(LBP)特征進(jìn)行t檢驗(yàn)時(shí),發(fā)現(xiàn)某些LBP特征的p值小于0.05,說明這些特征在肝癌樣本和正常樣本中的均值存在顯著差異,能夠有效地區(qū)分肝癌組織和正常肝組織,是有效的紋理特征;而對于一些p值大于0.05的LBP特征,通過t檢驗(yàn)可以將其從特征集中去除,從而優(yōu)化特征集合,提高模型的性能。主成分分析(PrincipalComponentAnalysis,PCA)是一種常用的降維算法,它通過線性變換將原始的高維數(shù)據(jù)轉(zhuǎn)換為一組線性無關(guān)的低維數(shù)據(jù),這些低維數(shù)據(jù)被稱為主成分。PCA的主要思想是尋找數(shù)據(jù)的最大方差方向,將數(shù)據(jù)投影到這些方向上,從而實(shí)現(xiàn)數(shù)據(jù)的降維。具體來說,對于一個(gè)具有n個(gè)樣本、m個(gè)特征的數(shù)據(jù)集X,首先計(jì)算數(shù)據(jù)集的協(xié)方差矩陣C:C=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})(x_i-\bar{x})^T其中,x_i是第i個(gè)樣本的特征向量,\bar{x}是所有樣本特征向量的均值。然后對協(xié)方差矩陣C進(jìn)行特征值分解,得到特征值\lambda_1\geq\lambda_2\geq\cdots\geq\lambda_m和對應(yīng)的特征向量e_1,e_2,\cdots,e_m。選擇前k個(gè)最大特征值對應(yīng)的特征向量e_1,e_2,\cdots,e_k,組成變換矩陣W。最后,將原始數(shù)據(jù)X與變換矩陣W相乘,得到降維后的低維數(shù)據(jù)Y:Y=XW在肝癌紋理特征優(yōu)化中,假設(shè)原始的紋理特征向量維度為m=50,通過PCA分析,計(jì)算得到協(xié)方差矩陣的特征值和特征向量。根據(jù)特征值的大小排序,選擇前k=10個(gè)最大特征值對應(yīng)的特征向量組成變換矩陣W。將原始的50維紋理特征向量與變換矩陣W相乘,得到10維的主成分向量。這樣,通過PCA降維,不僅降低了數(shù)據(jù)的維度,減少了計(jì)算量,還保留了數(shù)據(jù)的主要特征信息。經(jīng)過PCA降維后的紋理特征,能夠更有效地反映肝癌組織和正常肝組織之間的差異,提高肝癌識(shí)別模型的訓(xùn)練速度和分類精度。線性判別分析(LinearDiscriminantAnalysis,LDA)也是一種常用的降維算法,它與PCA不同,LDA是一種有監(jiān)督的降維方法,其目的是尋找一個(gè)投影方向,使得投影后的數(shù)據(jù)在不同類別之間的距離盡可能大,而在同一類別內(nèi)部的距離盡可能小,從而實(shí)現(xiàn)數(shù)據(jù)的降維。LDA的基本步驟如下:首先,計(jì)算各類別樣本的均值向量\mu_i和總體均值向量\mu;然后,計(jì)算類內(nèi)散度矩陣S_W和類間散度矩陣S_B:S_W=\sum_{i=1}^{c}\sum_{x\inX_i}(x-\mu_i)(x-\mu_i)^TS_B=\sum_{i=1}^{c}n_i(\mu_i-\mu)(\mu_i-\mu)^T其中,c是類別數(shù),X_i是第i類樣本的集合,n_i是第i類樣本的數(shù)量。接著,求解廣義特征值問題:S_Bw=\lambdaS_Ww得到特征值\lambda_1\geq\lambda_2\geq\cdots\geq\lambda_{c-1}和對應(yīng)的特征向量w_1,w_2,\cdots,w_{c-1}。選擇前k個(gè)最大特征值對應(yīng)的特征向量w_1,w_2,\cdots,w_k,組成投影矩陣W。最后,將原始數(shù)據(jù)X與投影矩陣W相乘,得到降維后的低維數(shù)據(jù)Y:Y=XW在肝癌紋理特征降維中,假設(shè)有肝癌樣本和正常樣本兩類數(shù)據(jù),首先計(jì)算肝癌樣本和正常樣本的均值向量,以及類內(nèi)散度矩陣和類間散度矩陣。通過求解廣義特征值問題,得到特征值和特征向量。選擇前k=5個(gè)最大特征值對應(yīng)的特征向量組成投影矩陣W。將原始的高維紋理特征向量與投影矩陣W相乘,得到5維的低維特征向量。通過LDA降維,使得降維后的紋理特征在不同類別之間具有更好的可分性,有利于提高肝癌識(shí)別模型的分類性能。與PCA相比,LDA利用了樣本的類別信息,在分類任務(wù)中通常能夠取得更好的效果。四、基于EML的肝癌識(shí)別模型構(gòu)建4.1EML算法改進(jìn)傳統(tǒng)的極限學(xué)習(xí)機(jī)(ELM)算法雖然具有學(xué)習(xí)速度快的優(yōu)勢,但在實(shí)際應(yīng)用中,尤其是在肝癌識(shí)別這類復(fù)雜任務(wù)中,暴露出了一些問題,對初始值敏感和容易陷入局部最優(yōu)是其較為突出的缺陷。ELM算法在訓(xùn)練過程中,輸入層與隱藏層之間的連接權(quán)重以及隱藏層神經(jīng)元的閾值是隨機(jī)初始化的。不同的初始值會(huì)導(dǎo)致最終的模型參數(shù)不同,從而影響模型的性能。在對肝癌圖像進(jìn)行識(shí)別時(shí),由于肝癌圖像的紋理特征復(fù)雜多樣,不同的初始值可能使模型對這些特征的學(xué)習(xí)和理解產(chǎn)生偏差,進(jìn)而導(dǎo)致識(shí)別準(zhǔn)確率的波動(dòng)。若初始值選擇不當(dāng),模型可能無法準(zhǔn)確捕捉肝癌組織與正常肝組織紋理特征的差異,將肝癌圖像誤判為正常圖像,或者將正常圖像誤判為肝癌圖像,這對于肝癌的早期診斷和治療是極為不利的。ELM容易陷入局部最優(yōu)解,當(dāng)訓(xùn)練數(shù)據(jù)的分布較為復(fù)雜,存在多個(gè)局部最優(yōu)解時(shí),ELM算法可能會(huì)收斂到其中一個(gè)局部最優(yōu)解,而不是全局最優(yōu)解。在肝癌識(shí)別中,由于肝癌的發(fā)病機(jī)制復(fù)雜,醫(yī)學(xué)圖像中包含的信息豐富且具有多樣性,使得模型在學(xué)習(xí)過程中容易陷入局部最優(yōu)。一旦模型陷入局部最優(yōu),就無法找到能夠最佳區(qū)分肝癌組織和正常肝組織的模型參數(shù),導(dǎo)致模型的泛化能力下降,在面對新的測試數(shù)據(jù)時(shí),無法準(zhǔn)確地進(jìn)行分類,影響肝癌診斷的準(zhǔn)確性和可靠性。為了解決傳統(tǒng)ELM算法存在的問題,本研究提出了一系列改進(jìn)策略,其中引入差分進(jìn)化算法和粒子群優(yōu)化算法對ELM的參數(shù)進(jìn)行優(yōu)化是重要的改進(jìn)方向。差分進(jìn)化(DifferentialEvolution,DE)算法是一種基于群體智能的全局優(yōu)化算法,由Storn和Price于1995年提出。該算法通過模擬生物進(jìn)化過程中的變異、交叉和選擇操作,在解空間中進(jìn)行搜索,以尋找最優(yōu)解。在將差分進(jìn)化算法應(yīng)用于ELM參數(shù)優(yōu)化時(shí),首先將ELM的輸入層與隱藏層之間的連接權(quán)重以及隱藏層神經(jīng)元的閾值作為差分進(jìn)化算法中的個(gè)體。然后,通過變異操作,對個(gè)體進(jìn)行擾動(dòng),生成新的個(gè)體。變異操作的公式為:v_{i,G+1}=x_{r1,G}+F\times(x_{r2,G}-x_{r3,G})其中,v_{i,G+1}是第G+1代的變異個(gè)體,x_{r1,G}、x_{r2,G}和x_{r3,G}是從第G代種群中隨機(jī)選擇的三個(gè)不同個(gè)體,F(xiàn)是變異因子,控制變異的步長。通過調(diào)整變異因子F的值,可以控制變異的程度,使算法在搜索過程中能夠更好地平衡全局搜索和局部搜索能力。接著,進(jìn)行交叉操作,將變異個(gè)體與原個(gè)體進(jìn)行交叉組合,生成試驗(yàn)個(gè)體。交叉操作的公式為:u_{i,j,G+1}=\begin{cases}v_{i,j,G+1}&\text{if}(rand_j(0,1)\leqCR)\text{or}(j=j_{rand})\\x_{i,j,G}&\text{otherwise}\end{cases}其中,u_{i,j,G+1}是第G+1代的試驗(yàn)個(gè)體,rand_j(0,1)是在[0,1]區(qū)間內(nèi)生成的隨機(jī)數(shù),CR是交叉率,控制交叉操作的概率,j_{rand}是在[1,D]范圍內(nèi)隨機(jī)選擇的一個(gè)維度,D是個(gè)體的維度。通過調(diào)整交叉率CR的值,可以控制交叉操作的頻繁程度,影響算法的搜索效率和收斂速度。最后,進(jìn)行選擇操作,根據(jù)適應(yīng)度函數(shù)的值,從試驗(yàn)個(gè)體和原個(gè)體中選擇更優(yōu)的個(gè)體進(jìn)入下一代種群。適應(yīng)度函數(shù)通常選擇ELM模型在訓(xùn)練集上的分類準(zhǔn)確率或均方誤差等指標(biāo)。在肝癌識(shí)別中,以ELM模型對肝癌圖像和正常肝圖像的分類準(zhǔn)確率作為適應(yīng)度函數(shù),通過不斷迭代,使差分進(jìn)化算法能夠找到一組最優(yōu)的ELM參數(shù),從而提高ELM模型對肝癌圖像的識(shí)別能力。粒子群優(yōu)化(ParticleSwarmOptimization,PSO)算法是一種模擬鳥群覓食行為的優(yōu)化算法,由Kennedy和Eberhart于1995年提出。該算法將優(yōu)化問題的解看作是搜索空間中的粒子,每個(gè)粒子都有自己的位置和速度,粒子通過不斷調(diào)整自己的位置和速度,在搜索空間中尋找最優(yōu)解。在利用粒子群優(yōu)化算法優(yōu)化ELM參數(shù)時(shí),將ELM的參數(shù)(連接權(quán)重和閾值)看作是粒子的位置。每個(gè)粒子的速度決定了其在搜索空間中的移動(dòng)方向和步長。粒子的速度和位置更新公式如下:v_{i,d}^{k+1}=w\timesv_{i,d}^k+c_1\timesr_1\times(p_{i,d}^k-x_{i,d}^k)+c_2\timesr_2\times(g_d^k-x_{i,d}^k)x_{i,d}^{k+1}=x_{i,d}^k+v_{i,d}^{k+1}其中,v_{i,d}^{k+1}是第k+1次迭代時(shí)粒子i在維度d上的速度,w是慣性權(quán)重,控制粒子對當(dāng)前速度的繼承程度,c_1和c_2是學(xué)習(xí)因子,分別表示粒子向自身歷史最優(yōu)位置和全局最優(yōu)位置學(xué)習(xí)的程度,r_1和r_2是在[0,1]區(qū)間內(nèi)生成的隨機(jī)數(shù),p_{i,d}^k是粒子i在第k次迭代時(shí)的歷史最優(yōu)位置,g_d^k是整個(gè)粒子群在第k次迭代時(shí)的全局最優(yōu)位置,x_{i,d}^{k+1}是第k+1次迭代時(shí)粒子i在維度d上的位置。在肝癌識(shí)別任務(wù)中,通過不斷迭代更新粒子的速度和位置,使粒子群能夠找到最優(yōu)的ELM參數(shù),從而提升ELM模型對肝癌圖像紋理特征的學(xué)習(xí)能力和分類性能。慣性權(quán)重w在算法的不同階段可以進(jìn)行動(dòng)態(tài)調(diào)整,在算法初期,較大的慣性權(quán)重有利于粒子進(jìn)行全局搜索,快速探索解空間;在算法后期,較小的慣性權(quán)重有利于粒子進(jìn)行局部搜索,提高算法的收斂精度。學(xué)習(xí)因子c_1和c_2的取值也會(huì)影響算法的性能,合適的取值能夠使粒子在向自身歷史最優(yōu)位置和全局最優(yōu)位置學(xué)習(xí)時(shí)達(dá)到較好的平衡,避免算法陷入局部最優(yōu)。4.2模型訓(xùn)練與驗(yàn)證將經(jīng)過預(yù)處理和特征提取的肝癌圖像數(shù)據(jù)集按照70%、15%、15%的比例劃分為訓(xùn)練集、驗(yàn)證集和測試集。這種劃分比例是基于大量實(shí)驗(yàn)和經(jīng)驗(yàn)得出的,在保證訓(xùn)練集有足夠樣本用于模型學(xué)習(xí)的同時(shí),也為驗(yàn)證集和測試集提供了合理的樣本數(shù)量,以評估模型的性能。訓(xùn)練集用于對改進(jìn)后的ELM模型進(jìn)行訓(xùn)練,使其學(xué)習(xí)到肝癌圖像紋理特征與肝癌類別之間的映射關(guān)系;驗(yàn)證集用于在訓(xùn)練過程中監(jiān)控模型的性能,防止模型過擬合;測試集則用于評估訓(xùn)練好的模型在未知數(shù)據(jù)上的泛化能力。在模型訓(xùn)練過程中,利用訓(xùn)練集對改進(jìn)后的ELM模型進(jìn)行訓(xùn)練。設(shè)置模型的初始參數(shù),如隱藏層神經(jīng)元的個(gè)數(shù)、激活函數(shù)的類型等。隱藏層神經(jīng)元個(gè)數(shù)的選擇對模型的性能有重要影響,若神經(jīng)元個(gè)數(shù)過少,模型的學(xué)習(xí)能力有限,可能無法充分學(xué)習(xí)到數(shù)據(jù)的特征;若神經(jīng)元個(gè)數(shù)過多,模型可能會(huì)過擬合,對訓(xùn)練數(shù)據(jù)的依賴性過強(qiáng),而對新數(shù)據(jù)的適應(yīng)性變差。因此,通過多次實(shí)驗(yàn),根據(jù)驗(yàn)證集的性能表現(xiàn)來確定最優(yōu)的隱藏層神經(jīng)元個(gè)數(shù)。激活函數(shù)的類型也會(huì)影響模型的非線性映射能力,常用的激活函數(shù)有Sigmoid函數(shù)、ReLU函數(shù)等。Sigmoid函數(shù)能夠?qū)⑤斎胗成涞?到1之間,具有平滑的曲線,但其在輸入較大或較小時(shí)容易出現(xiàn)梯度消失的問題;ReLU函數(shù)則能夠有效解決梯度消失問題,計(jì)算簡單,在深度學(xué)習(xí)中得到了廣泛應(yīng)用。在本研究中,經(jīng)過對比實(shí)驗(yàn),選擇了ReLU函數(shù)作為ELM模型的激活函數(shù)。在訓(xùn)練過程中,不斷調(diào)整模型參數(shù),以提高模型的性能。利用差分進(jìn)化算法和粒子群優(yōu)化算法對ELM模型的參數(shù)進(jìn)行優(yōu)化,通過多次迭代,尋找最優(yōu)的參數(shù)組合。在每次迭代中,根據(jù)適應(yīng)度函數(shù)的值來評估當(dāng)前參數(shù)組合的優(yōu)劣。適應(yīng)度函數(shù)通常選擇模型在訓(xùn)練集上的分類準(zhǔn)確率或均方誤差等指標(biāo)。在肝癌識(shí)別任務(wù)中,以分類準(zhǔn)確率作為適應(yīng)度函數(shù),即模型正確分類的樣本數(shù)占總樣本數(shù)的比例。通過不斷優(yōu)化參數(shù),使模型在訓(xùn)練集上的分類準(zhǔn)確率不斷提高。同時(shí),利用驗(yàn)證集對訓(xùn)練過程進(jìn)行監(jiān)控。在每一輪訓(xùn)練結(jié)束后,使用驗(yàn)證集對模型進(jìn)行評估,計(jì)算模型在驗(yàn)證集上的準(zhǔn)確率、召回率、F1值等指標(biāo)。準(zhǔn)確率是指模型正確分類的樣本數(shù)占總樣本數(shù)的比例,反映了模型的分類準(zhǔn)確性;召回率是指正確預(yù)測為正類的樣本數(shù)占實(shí)際正類樣本數(shù)的比例,衡量了模型對正類樣本的覆蓋程度;F1值則是綜合考慮準(zhǔn)確率和召回率的指標(biāo),它是準(zhǔn)確率和召回率的調(diào)和平均數(shù),能夠更全面地評估模型的性能。如果模型在驗(yàn)證集上的性能開始下降,如準(zhǔn)確率不再提高或出現(xiàn)下降趨勢,召回率和F1值也隨之降低,說明模型可能出現(xiàn)了過擬合現(xiàn)象。此時(shí),停止訓(xùn)練,選擇在驗(yàn)證集上性能最佳的模型參數(shù)作為最終的模型參數(shù)。當(dāng)模型訓(xùn)練完成后,使用測試集對訓(xùn)練好的模型進(jìn)行性能評估。計(jì)算模型在測試集上的準(zhǔn)確率、召回率、F1值等指標(biāo),以評估模型在未知數(shù)據(jù)上的泛化能力。假設(shè)在測試集中,共有100個(gè)樣本,其中肝癌樣本40個(gè),正常樣本60個(gè)。模型正確分類了35個(gè)肝癌樣本和55個(gè)正常樣本,則模型在測試集上的準(zhǔn)確率為(35+55)/100=90%;召回率為35/40=87.5%;F1值為2*(0.9*0.875)/(0.9+0.875)≈88.7%。通過這些指標(biāo)的計(jì)算,可以全面了解模型在肝癌識(shí)別任務(wù)中的性能表現(xiàn),判斷模型是否能夠準(zhǔn)確地識(shí)別肝癌圖像,為臨床診斷提供可靠的支持。4.3模型性能評估為了全面評估改進(jìn)后的ELM模型在肝癌識(shí)別任務(wù)中的性能,本研究對比了改進(jìn)前后ELM模型的性能表現(xiàn),并將ELM模型與其他機(jī)器學(xué)習(xí)模型,如支持向量機(jī)(SVM)、決策樹(DecisionTree)、隨機(jī)森林(RandomForest)等,在相同的肝癌圖像數(shù)據(jù)集上進(jìn)行了對比實(shí)驗(yàn)。在改進(jìn)前后ELM模型性能對比方面,實(shí)驗(yàn)結(jié)果顯示,改進(jìn)后的ELM模型在準(zhǔn)確率、召回率和F1值等指標(biāo)上均有顯著提升。改進(jìn)前的ELM模型在測試集上的準(zhǔn)確率為75%,召回率為70%,F(xiàn)1值為72.4%;而改進(jìn)后的ELM模型在測試集上的準(zhǔn)確率達(dá)到了85%,召回率提高到了80%,F(xiàn)1值提升至82.4%。這表明引入差分進(jìn)化算法和粒子群優(yōu)化算法對ELM的參數(shù)進(jìn)行優(yōu)化后,有效地提高了模型對肝癌圖像紋理特征的學(xué)習(xí)能力和分類性能,使模型能夠更準(zhǔn)確地識(shí)別肝癌圖像,減少了誤判的情況。通過對實(shí)驗(yàn)結(jié)果的進(jìn)一步分析發(fā)現(xiàn),改進(jìn)后的ELM模型在對肝癌圖像的分類過程中,能夠更準(zhǔn)確地捕捉到肝癌組織與正常肝組織紋理特征的細(xì)微差異,從而做出更準(zhǔn)確的判斷。在對一些紋理特征較為復(fù)雜的肝癌圖像進(jìn)行識(shí)別時(shí),改進(jìn)前的ELM模型容易出現(xiàn)誤判,將肝癌圖像誤判為正常圖像或其他類型的肝臟疾病圖像;而改進(jìn)后的ELM模型則能夠更好地處理這些復(fù)雜的紋理特征,準(zhǔn)確地識(shí)別出肝癌圖像。這說明改進(jìn)策略有效地提高了ELM模型的性能,增強(qiáng)了模型對復(fù)雜數(shù)據(jù)的適應(yīng)性和泛化能力。將ELM模型與其他機(jī)器學(xué)習(xí)模型進(jìn)行對比時(shí),實(shí)驗(yàn)結(jié)果表明,在肝癌識(shí)別任務(wù)中,改進(jìn)后的ELM模型在性能上具有明顯優(yōu)勢。支持向量機(jī)(SVM)模型在測試集上的準(zhǔn)確率為80%,召回率為75%,F(xiàn)1值為77.4%;決策樹(DecisionTree)模型的準(zhǔn)確率為70%,召回率為65%,F(xiàn)1值為67.4%;隨機(jī)森林(RandomForest)模型的準(zhǔn)確率為82%,召回率為78%,F(xiàn)1值為80%。與這些模型相比,改進(jìn)后的ELM模型的準(zhǔn)確率、召回率和F1值均最高。在處理高維的肝癌紋理特征數(shù)據(jù)時(shí),SVM模型由于需要求解復(fù)雜的二次規(guī)劃問題,計(jì)算量較大,訓(xùn)練時(shí)間較長,且在面對非線性可分的數(shù)據(jù)時(shí),需要選擇合適的核函數(shù),參數(shù)調(diào)整較為復(fù)雜;決策樹模型容易出現(xiàn)過擬合現(xiàn)象,對訓(xùn)練數(shù)據(jù)的依賴性較強(qiáng),泛化能力較差,在測試集上的表現(xiàn)不如在訓(xùn)練集上;隨機(jī)森林模型雖然在一定程度上改善了決策樹模型的過擬合問題,但模型的復(fù)雜度較高,計(jì)算資源消耗較大。而改進(jìn)后的ELM模型通過隨機(jī)初始化輸入層與隱藏層之間的參數(shù),將訓(xùn)練問題轉(zhuǎn)化為線性方程組的求解,大大提高了訓(xùn)練速度,同時(shí)利用差分進(jìn)化算法和粒子群優(yōu)化算法對參數(shù)進(jìn)行優(yōu)化,有效地提高了模型的泛化能力和分類性能,在肝癌識(shí)別任務(wù)中表現(xiàn)出了更好的性能。綜上所述,改進(jìn)后的ELM模型在肝癌識(shí)別任務(wù)中具有更高的準(zhǔn)確率、召回率和F1值,能夠更準(zhǔn)確地識(shí)別肝癌圖像,減少誤診和漏診的發(fā)生。與其他機(jī)器學(xué)習(xí)模型相比,改進(jìn)后的ELM模型在訓(xùn)練速度、泛化能力和分類性能等方面具有明顯優(yōu)勢,為肝癌的早期診斷提供了一種更有效的技術(shù)手段。五、案例分析與結(jié)果討論5.1實(shí)際病例應(yīng)用本研究選取了來自某三甲醫(yī)院的50例實(shí)際肝癌病例,其中男性30例,女性20例,年齡范圍在35-75歲之間,平均年齡為55歲。這些病例均經(jīng)臨床病理確診為肝癌,包括肝細(xì)胞癌40例,膽管細(xì)胞癌8例,混合型肝癌2例。同時(shí),選取了30例年齡、性別匹配的正常肝臟病例作為對照。所有病例的超聲、CT和MRI圖像均由該醫(yī)院的專業(yè)影像設(shè)備采集,確保了圖像的質(zhì)量和一致性。應(yīng)用基于紋理特征與ELM的肝癌識(shí)別方法對上述病例進(jìn)行診斷。首先,對所有圖像進(jìn)行預(yù)處理,包括去噪、平滑、增強(qiáng)和歸一化等操作,以提高圖像的質(zhì)量,為后續(xù)的紋理特征提取提供可靠的數(shù)據(jù)基礎(chǔ)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025云南昭通永善縣水務(wù)局招聘公益性崗位人員2人考試核心試題及答案解析
- 2025天津市西青經(jīng)開區(qū)投資促進(jìn)有限公司面向全國公開招聘招商管理人員4人考試重點(diǎn)試題及答案解析
- 2025年佛山市順德區(qū)均安社區(qū)衛(wèi)生服務(wù)中心招聘編外B超醫(yī)生備考題庫及答案詳解1套
- 寧德人民醫(yī)院2025年編外人員招聘備考題庫(七)完整參考答案詳解
- 2025年北京郵電大學(xué)體育部教師招聘備考題庫及參考答案詳解
- 2025年貴州銅仁數(shù)據(jù)職業(yè)學(xué)院第二學(xué)期教師招聘11人備考題庫及答案詳解參考
- 2025年湖北環(huán)宇工程建設(shè)監(jiān)理有限公司外包員工招聘備考題庫及答案詳解參考
- 2025年西安交通大學(xué)口腔醫(yī)院醫(yī)護(hù)人員常年招聘備考題庫及答案詳解參考
- 2025年林區(qū)實(shí)驗(yàn)小學(xué)附屬幼兒園食堂員工及保育員招聘備考題庫及參考答案詳解
- 2025山東濱州市無棣縣中政土地產(chǎn)業(yè)集團(tuán)有限公司及權(quán)屬公司招聘遞補(bǔ)考試核心試題及答案解析
- 視屏號(hào)認(rèn)證授權(quán)書
- 建材行業(yè)銷售代表工作報(bào)告
- DG-TJ 08-2048-2024 民用建筑電氣防火設(shè)計(jì)標(biāo)準(zhǔn)
- 腸內(nèi)腸外營養(yǎng)臨床指南
- 預(yù)包裝食品食品安全管理制度
- 《馬克思主義政治經(jīng)濟(jì)學(xué)》教案
- 一例脊髓損傷患者個(gè)案護(hù)理匯報(bào)
- 思想道德與法治智慧樹知到期末考試答案章節(jié)答案2024年山東農(nóng)業(yè)大學(xué)
- 村衛(wèi)生室業(yè)務(wù)指導(dǎo)計(jì)劃
- 神經(jīng)遞質(zhì)乙酰膽堿的發(fā)現(xiàn)
- 小小小廚師幼兒健康食譜烹飪
評論
0/150
提交評論