一種改進的樹突狀細胞算法及其性能穩(wěn)定性實驗_第1頁
一種改進的樹突狀細胞算法及其性能穩(wěn)定性實驗_第2頁
一種改進的樹突狀細胞算法及其性能穩(wěn)定性實驗_第3頁
一種改進的樹突狀細胞算法及其性能穩(wěn)定性實驗_第4頁
一種改進的樹突狀細胞算法及其性能穩(wěn)定性實驗_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

_種改進的樹突狀細胞算法及其性能穩(wěn)定性實驗張偉;田玉玲【摘要】AimingattheproblemsoforiginalDendriticCellAlgorithm(DCA)thatithasmisclassificationswhenthecontextchanges,anditserrorrateisproportionaltothetimesofstatechanges,weimproveitbasedontheoriginalalgorithmbythestrategiessuchassettingdynamicthreshold,addingtheevaluationfactorofsubsequentantigenoncurrentsamplingantigenandtheinflammationsignalwiththefunctionofamplifyingtheeffectsofothersignals,etc.ThenweapplythemodifiedalgorithmtothestandarddatasetBreastCancer.ExperimentalresultshowsthatcomparedwithoriginalDCA,thisalgorithmhasameliorationinbothstabilityandrecognitionrate.%針對原有樹突狀細胞算法DCA(DendriticCellAlgorithm)在環(huán)境狀態(tài)轉變時存在誤分類,且隨著狀態(tài)轉變的次數(shù)越多錯誤率越高的問題,在原算法的基礎上通過設置動態(tài)閾值,加入后續(xù)抗原對當前采樣抗原的評價因子,以及具有放大其他信號功能的發(fā)炎信號等策略對其進行改進,將改進算法應用于標準數(shù)據(jù)集BreastCancer。實驗結果表明,與原DCA算法相比,該算法的穩(wěn)定性和識別率都有一定改善。【期刊名稱】《計算機應用與軟件》【年(卷),期】2013(000)010【總頁數(shù)】4頁(P147-150)【關鍵詞】樹突細胞算法;動態(tài)閾值;評價因子;穩(wěn)定性【作者】張偉;田玉玲【作者單位】太原理工大學計算機科學與技術學院山西太原030024;太原理工大學計算機科學與技術學院山西太原030024【正文語種】中文【中圖分類】TP301傳統(tǒng)免疫學認為人體免疫系統(tǒng)根據(jù)自我一非我SNS(selfnonself)理論來保護機體免受外部入侵,但是很多現(xiàn)象都不能以傳統(tǒng)的免疫學理論解釋,例如人體沒有對所吃的食物與腸道的細菌發(fā)生免疫反應。PollyMatzinger在1994提出了生物免疫危險理論模式,認為人體免疫應答是由危險信號所引發(fā),并不是由非我觸發(fā)。免疫系統(tǒng)并不是抵制一切外來物質,即對非我物質的抵制也是有針對性的,凡是誘發(fā)危險信號的非我才會引發(fā)人體免疫應答[1]。英國諾丁漢大學的Aickelin教授等人首次將危險理論引入到人工免疫系統(tǒng)[2],JulieGreensmith在其基礎上于2005年首次提出基于危險理論的樹突狀細胞算法DCA[3],目前,該算法已應用于靜態(tài)機器學習數(shù)據(jù)集的分類[3],離線條件下的小規(guī)模網絡端口掃描檢測[5]。DCA代表了人工免疫系統(tǒng)領域研究重點的轉變,由完全基于適應性免疫系統(tǒng)功能逐漸聚焦于先天性免疫系統(tǒng)機理[4]。傳統(tǒng)免疫學依賴于模式系統(tǒng)來識別病原體,然而,DCA并不依靠否定選擇算法中使用的模式匹配來識別抗原,因此,DCA比傳統(tǒng)免疫算法具有更好的擴展性。DCA是一種基于群體的系統(tǒng),使用樹突狀細胞作為代理,每個細胞攝取組織中的抗原,同時接收環(huán)境中與抗原相關的信號。DC融合收集的抗原以及輸入的信號,通過加工計算得到輸出信號,根據(jù)評價得到抗原所處環(huán)境的危險程度進而采取相應的措施[6]。與傳統(tǒng)SNS算法相比較,DCA算法不需要大量訓練樣本,具有簡單、快速的特點。但是,DCA中DC的成熟策略對抗原的評價計算具有滯后性,導致抗原環(huán)境發(fā)生轉變時誤檢率較高,檢測率降低。針對此問題,文獻[7]提出一種改進的DCA算法,在算法中加入〃時間窗”以及衰減因子等機制,有效降低了算法的誤檢率,然而算法的穩(wěn)定性以及動態(tài)適應性不太理想。本文綜合考慮識別性能、穩(wěn)定性和誤檢率等多種因素對算法的影響,對DCA算法改進優(yōu)化。1.1DC生物機理DC是一種白細胞,在機體組織和器官中扮演巨噬細胞的作用在二級淋巴器官中作為一種抗原提呈的運載工具。所謂抗原提呈,是指抗原被抗原提呈細胞(M中,DC等)攝取,加工后以免疫性肽的形式呈現(xiàn)于提呈細胞表面,最終被免疫活性細胞識別的過程,它是免疫反應的起始階段,由此發(fā)動免疫應答過程。本質上,DC的功能就是在組織中攝取各種抗原和蛋白質碎片,并將抗原樣本呈遞給淋巴結中的原態(tài)丁細胞。根據(jù)周圍組織液中內源性和外源性信號的不同,DC可以有以下三種不同的形態(tài):Immature。。,簡稱iDCiDC是DC的初始狀態(tài),駐留在組織中,首要功能是收集和移除組織液中的各種碎片并對其加工處理(這些碎片可能是自體細胞分子,也可能是外來物質)iDC需要MHC(majorhistocompatibilitycomplex)分子的配合,才能將抗原提呈給T細胞。但是,iDC并不表達炎性細胞因子,無法激活T細胞,因此,當iDC與T細胞相遇時會令T細胞失活。Mature。。,簡稱mDCmDC可以提呈抗原并表達炎性細胞因子來激活T細胞°iDC在機體組織中收集抗原,當其周圍的危險信號和PAMP(pathogenassociatedmolecularpattern)達到一定濃度時就會從組織遷移到引流淋巴結中,在淋巴結中的T細胞與DC提呈的抗原高概率的匹配,激活T細胞引起免疫應答°iDC在遷移過程中轉變成mDC并產生促炎性細胞因子(IL-12)和協(xié)同刺激分子CSM(costimulatorymolecule)。Semi-Mature。。,簡稱smDC細胞正常死亡時會釋放凋亡細胞因子(如:TNF-a因子),當其濃度達到一定程度時,iDC就會轉變成smDC并從機體組織遷移到淋巴結中,smDC釋放協(xié)同刺激分子CSM并將收集的抗原提呈給T細胞,但是smDC釋放抗炎性細胞因子(IL-10)抑制抗原與T細胞匹配,從而使機體對該抗原耐受。1.2DCA設計通過仔細研究DC的生物機理功能和角色,Greensmith對DC行為進行建模,設計實現(xiàn)了DCA,并將其用于BreastCancer數(shù)據(jù)集分類和網絡端口掃描檢測仿真實驗,實驗結果表明DCA具有較高的檢測率。DCA是基于DC群體的算法,對抗原和抽象信號形式的數(shù)據(jù)流進行相關檢測,輸出信息表明抗原的異常程度。群體中每個DC執(zhí)行抗原和信號采集。DC存儲采集的抗原,并將輸入信號轉換為輸出信號[8]??乖漠惓3潭扔帽惶岢蕿槌墒飙h(huán)境抗原次數(shù)占此類抗原被提呈總次數(shù)的百分比表示,即成熟環(huán)境抗原值MCAV(MatureContextAntigenValue)。DCA算法框圖如圖1所示。DCA輸入信號包括危險信號DS(DangerSignal),PAMP(PathogenAssociatedMolecularPattern),安全信號SS(SafeSignal)和發(fā)炎信號IS(InflammationSignal)oDC對輸入的4種信號進行處理,產生3種輸出信號:協(xié)同刺激信號csm,半成熟信號semi和成熟信號mat。這里發(fā)炎信號IS對于DC成熟和抗原提呈不是必須的,但是他可以增強其它信號的作用。DCA根據(jù)輸入信號計算輸出信號表示為:其中,CX表示輸入信號的濃度,WX表示相應信號的權值,信號權值矩陣如表1所示。DCA算法偽代碼如下:通過分析Greensmith提出的DCA算法對BreastCancer數(shù)據(jù)集進行仿真實驗的結果,DCA算法對于該數(shù)據(jù)集的誤分類主要出現(xiàn)在正常數(shù)據(jù)與異常數(shù)據(jù)的過渡階段,這是因為每一個iDC在初始時期會收集大量抗原,iDC根據(jù)周圍信號的不同分化為不同的形態(tài),如果分化為smDC,那么由iDC收集的抗原都會被提呈為正常數(shù)據(jù)。同理,分化為mDC之后所有收集的抗原就會被提呈為異常數(shù)據(jù)。由此可知,處于過渡階段的數(shù)據(jù)隨著算法的運行必然出現(xiàn)誤分類。另外,對數(shù)據(jù)集的邊界數(shù)據(jù)由于算法運行一遍可能無法使DC成熟,導致無法評價數(shù)據(jù),需要進行多次迭代。針對原有DCA算法以上這些不足,本文對該算法進行了改進優(yōu)化。定義1抗原提呈群體DCs。DCi={3〔3=<Ag_list,input,output,context,threshold〉,Ag_listeV},i=1,2,...,n。其中,V表示一維抗原向量,Ag_list為DC采樣過的抗原列表,input為輸入信號濃度inpute{CP,CDS,CSS},output為輸出信號濃度outputs{Ccsm,Csemi,Cmat},context為該DC的成熟狀態(tài)contexts{semi,mature},threshold為DC的遷移閾值。定義2輸入抗原群體Ags。Agj={C|C=<Attb,semi,mat>,semieN,mateN},i=1,2,_,mo其中:Attb為抗原可以被DC采樣的各個屬性值用<Attbl,Attb2,…,Attbl>表示,semi為該抗原被smDC提呈為〃安全”的總次數(shù),mat為該抗原被mDC提呈為〃危險”的總次數(shù)。定義3后續(xù)抗原與當前抗原之間的相似性Aff為:定義4成熟環(huán)境抗原值MCAV為:本文在Greensmith提出的DCA算法基礎上做了如下改進:(1)設置動態(tài)遷移閾值Dthreshold。在算法運行過程中通過控制iDC的遷移閾值,加速或者減緩iDC的分化成熟。(2)保留未成熟DC集合。將參與上一個抗原采樣但是未能成熟的DC繼續(xù)參與下一個抗原的采樣,增加DC的成熟速率,提高算法的運行效率。(3)加入后續(xù)抗原對當前抗原的評價因子a。從當前抗原向后延伸k個,計算每個后續(xù)抗原與當前抗原的相似性值Aff,評價因子a定義為:(4)加入發(fā)炎細胞因子IS。Greensmith提出的DCA算法中介紹了發(fā)炎細胞因子的作用,但是在對BreastCancer數(shù)據(jù)集的實際算法應用中并沒有用到,生物中IS有放大其他信號的作用,這里將IS作為一種調節(jié)因子,與評價因子a—起共同調節(jié)DC的遷移狀態(tài)。評價因子a越小說明后續(xù)抗原與當前抗原越具有相似的致病性,應下調IS、上調Dthreshold,以減緩iDC的成熟,使該iDC繼續(xù)采樣后續(xù)的抗原。新的遷移閾值和發(fā)炎因子分別表示為:a越大,則后續(xù)抗原與當前抗原致病性不同,應上調IS、下調Dthreshold,加速iDC成熟,防止其采樣到后續(xù)抗原,從而有效降低數(shù)據(jù)誤分類的可能。新的遷移閾值和發(fā)炎因子分別表示為:其中,At(a)和At^a)是與a有關的增量。改進DCA算法的流程如下:Stepl初始化DC池,產生100個iDC;Step2對于每個抗原數(shù)據(jù),從DC池中隨機抽取n個iDC對該抗原采樣,抽象出輸入信號濃度CP,CDS和CSS;Step3計算后續(xù)k個抗原對當前抗原的評價因子a,據(jù)此調整發(fā)炎信號IS和動態(tài)遷移閾值Dthreshold;Step4根據(jù)輸入信號濃度以及發(fā)炎信號IS計算輸出信號濃度Ccsm,Csemi和Cmat;Step5將Ccsm與Dthreshold對比,若Ccsm>Dthreshold則當前iDC成熟遷移出DC池,剩余未成熟iDC直接參與下次抗原采樣,并將采樣iDC補充至n個;Step6計算MCAV值,并對當前采樣抗原進行評價;Step7若還有新抗原,則轉Step2,否則轉Step8;Step8算法終止。3.1實驗方案本文選用文獻[3]中使用的標準UCIWisconsinBreastCancer數(shù)據(jù)集作為實驗數(shù)據(jù),該數(shù)據(jù)集包含700條數(shù)據(jù),正常數(shù)據(jù)有460條異常數(shù)據(jù)有240條,每條數(shù)據(jù)有10個屬性,其中前9個屬性代表一個潛在癌變細胞的各種特征,第10個屬性是一個分類標簽,將數(shù)據(jù)分類為正常與異常。實驗將9個數(shù)據(jù)屬性中的細胞大小、細胞形狀、裸核和正常核仁屬性作為危險信號DS的來源:對于這四個屬性,先求出所有正常數(shù)據(jù)中每個屬性的平均值,針對每個數(shù)據(jù),計算出相應屬性數(shù)據(jù)值與平均值的絕對差,四個屬性對應絕對差的平均值即為危險數(shù)據(jù)值。將簇大小屬性作為安全信號SS和PAMP信號的來源。首先得出所有數(shù)據(jù)的簇大小屬性的中位數(shù),針對每個數(shù)據(jù),將簇大小屬性值與該中位數(shù)進行對比,若屬性值大于中位數(shù),則將安全信號設為屬性值與中位數(shù)的絕對差,將PAMP設為0;反之,將PAMA設為屬性值與中位數(shù)的絕對差,將安全信號設為0。舉例如表2和表3所示。若不考慮發(fā)炎信號,對該樣本數(shù)據(jù)根據(jù)式(1)計算Ccsm為:實驗1按正向+反向數(shù)據(jù)的順序使算法經歷一次環(huán)境狀態(tài)轉變,如取100條正向數(shù)據(jù)后跟100條反向數(shù)據(jù)。實驗2按正向+反向+正向+反向數(shù)據(jù)的順序使算法經歷三次環(huán)境狀態(tài)轉變。實驗3按正向+反向+正向+反向+正向+反向數(shù)據(jù)的順序使算法經歷五次環(huán)境狀態(tài)轉變。參數(shù)設置將Dthreshold初始化為4,MCAV設為0.65,每次從DC池中隨機抽取10個iDC對當前抗原進行采樣,向后選取10個后續(xù)抗原對當前抗原進行評價,算法運行10遍。3.2實驗結果三次實驗檢測率對比關系如圖2、圖3和圖4所示。3.3結果分析從圖2可以看出,讓算法經歷一次環(huán)境狀態(tài)轉變原有DCA算法和改進后的算法對比檢測率都較高,差異不是很大,但從曲線的分布來看改進后算法的檢測率要高于原有算法。圖3是算法經歷三次環(huán)境狀態(tài)轉變新老算法的檢測率對比關系,從圖中可以看出來,原有DCA算法的檢測率要明顯低于新算法。圖4是算法經歷五次環(huán)境狀態(tài)轉變檢測率對比關系,可以看出原DCA算法的檢測率有明顯的波動。對比而言,改進后的算法整體檢測率都高于原DCA算法,且穩(wěn)定性較好。上述實驗的結果也證實了原有DCA算法在正向數(shù)據(jù)與反向數(shù)據(jù)的過渡階段存在誤分類,且隨著過渡次數(shù)的增加錯誤率越高的現(xiàn)象,從而導致算法的整體檢測率降低。文獻[7]在原有DCA算法的基礎上加入〃時間窗”以及衰減因子等機制對算法進行改進,有效提高了算法的檢測率,但是從實驗的結果來看正反向數(shù)據(jù)過渡階段的分類效果仍不理想,且動態(tài)適應性不高,隨著過渡階段的增加仍會暴露出較高的誤檢率。本文提出的改進DCA算法,由于加入了后續(xù)抗原對采樣抗原的評價因子以及發(fā)炎信號,并且隨著算法的運行動態(tài)的調整DC的遷移閾值有效的調整DC的成熟策略,從而使算法能更好地適應數(shù)據(jù)環(huán)境的狀態(tài)轉變,在過渡階段仍能保持較高的檢測率。本文首先對DCA算法進行了簡單的介紹,包括生物機理以及算法設計實現(xiàn)。探討了原有DCA算法存在的不足,并提出了自己的改進優(yōu)化措施:在原DCA算法的基礎上加入后續(xù)抗原對采樣抗原的評價因子,并根據(jù)計算結果動態(tài)的變換iDC的遷移閾值,使算法能根據(jù)當前所處環(huán)境的狀態(tài)有針對性地對數(shù)據(jù)進行分類。同時,還加入了具有放大其他信號作用的發(fā)炎信號,從而使算法能快速對環(huán)境的變化作出響應。最后將改進算法用于標準數(shù)據(jù)集BreastCancer與原有DCA算法進行對比。實驗結果表明,改進后的算法無論是在穩(wěn)定性還是檢測率方面都有較明顯的改善?!鞠嚓P文獻】[1]MatzingerP.Friendlyanddangeroussignals:isthetissueincontrol?[J].NatureImmunology,2007,8(1)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論