基于關(guān)聯(lián)規(guī)則的入侵檢測算法綜述_第1頁
基于關(guān)聯(lián)規(guī)則的入侵檢測算法綜述_第2頁
基于關(guān)聯(lián)規(guī)則的入侵檢測算法綜述_第3頁
基于關(guān)聯(lián)規(guī)則的入侵檢測算法綜述_第4頁
基于關(guān)聯(lián)規(guī)則的入侵檢測算法綜述_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

-.z基于關(guān)聯(lián)規(guī)則的入侵檢測算法綜述武玉剛1,2秦勇2宋繼光2,3楊忠明2(1.**科技大學(xué)計(jì)算機(jī)與信息工程學(xué)院,****212003;2.**學(xué)院信息與網(wǎng)絡(luò)中心,****525000;3.**理工大學(xué)計(jì)算機(jī)與軟件學(xué)院,****030024〕摘要:關(guān)聯(lián)規(guī)則是一種新型的數(shù)據(jù)挖掘方法。根據(jù)目前國內(nèi)國際的研究情況,針對關(guān)聯(lián)規(guī)則的特點(diǎn),首先對關(guān)聯(lián)規(guī)則進(jìn)展了介紹,并對經(jīng)典Apriori算法做了描述。之后針對該算法的缺點(diǎn),介紹了一些改良算法。針對入侵檢測算法的缺點(diǎn)及其在入侵檢測方面的研究分別進(jìn)展了分析綜述,并對其改良闡述。最后,指出了在該領(lǐng)域需要進(jìn)一步研究的熱點(diǎn)問題。關(guān)鍵字:關(guān)聯(lián)規(guī)則;入侵檢測;數(shù)據(jù)挖掘TheOverviewofIntrusionDetectionAlgorithmsBasedonAssociationrulesWUYu-gang1,2QINYong2SONGJi-guang2,3YANGZhong-ming2(1.Dept.puter&InformationEngineering,JiangSuUniversityofScience&Technology,Zhenjiang,Jiangsu212003;2Centerofinformation&networksMaominguniversity,Maoming,Guangdong525000;3Dept.puterScience,TaiYuanUniversityofTechnology,Taiyuan,Abstract:Associationruleisanewdataminingmethod.Underthecurrentsituationofdomesticandinternationalresearchforthecharacteristicsofassociationrules,firstofallpairsofassociationruleswereintroduced,andmadetheclassicApriorialgorithmaredescribed.Aftertheaddresstheshortingsofthealgorithm,introducedsomeimprovingalgorithms.Thedisadvantagesfortheintrusiondetectionalgorithmanditsapplicationinintrusiondetectionresearchsynthesiswereanalyzed,anditimprovementsaredescribed.Finally,pointedouttheneedforfurtherresearchinthisarea,ahotissue.KeyWords:associationrules;intrusiondetection;datamining中國:TP393引言網(wǎng)絡(luò)平安,已經(jīng)變得至關(guān)重要。作為傳統(tǒng)網(wǎng)絡(luò)平安技術(shù)的補(bǔ)充,入侵檢測受到更多的重視?;谀J狡ヅ?、統(tǒng)計(jì)分析和完整性分析的傳統(tǒng)入侵檢測方法,逐漸不能適應(yīng)快速開展的網(wǎng)絡(luò)平安技術(shù)。將關(guān)聯(lián)規(guī)則引入到入侵檢測中,可以適應(yīng)快速開展的網(wǎng)絡(luò)技術(shù)并提高入侵檢測的檢測效率。關(guān)聯(lián)規(guī)則介紹關(guān)聯(lián)規(guī)則根本定義定義1〔關(guān)聯(lián)規(guī)則〕關(guān)聯(lián)規(guī)則〔associationrule〕是由Agrawal[1]等人首先提出的一個重要KDD研究課題,它反映了大量數(shù)據(jù)中工程集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。定義2〔項(xiàng)〕設(shè)I=是二進(jìn)制文字的集合,其中的元素稱為項(xiàng)(item)。定義3〔支持度〕記D為交易〔transaction)T的集合,交易T是項(xiàng)的集合,并且TI。,其中〔1〕定義4〔置信度〕,其中〔2〕定義5〔強(qiáng)關(guān)聯(lián)規(guī)則〕是指挖掘出支持度和可信度分別大于用戶給定的最小支持度(min_supp)和最小可信度(min_conf)的關(guān)聯(lián)規(guī)則。定義6〔頻繁項(xiàng)集〕如果項(xiàng)集的出現(xiàn)頻率大于或等于min_supp與D中事務(wù)總數(shù)的乘積,則稱它為頻繁項(xiàng)集。定義7〔興趣度〕[2]規(guī)定R的興趣度為,〔3〕其中為,=。Apriori算法Agrawal等于1993年首先提出了挖掘顧客交易數(shù)據(jù)庫中項(xiàng)集間的關(guān)聯(lián)規(guī)則,并設(shè)計(jì)了一個根本算法,其核心是基于頻集理論的遞推方法,即基于兩階段頻集思想的方法,將關(guān)聯(lián)規(guī)則的設(shè)計(jì)分解為兩個子問題:發(fā)現(xiàn)頻集。這個子問題是最重要的,開銷最大,因此,各種算法主要致力于提高發(fā)現(xiàn)頻集的效率。根據(jù)所獲得的頻繁項(xiàng)集,產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。根據(jù)定義這些規(guī)則必須滿足信任度閾值。由于步驟2中的操作極為簡單,因此挖掘關(guān)聯(lián)規(guī)則的整個性能就由步驟1中的操作處理所決定。挖掘關(guān)聯(lián)規(guī)則的總體性能由第一步?jīng)Q定,第二步相對容易實(shí)現(xiàn)。首先產(chǎn)生頻繁1-項(xiàng)集L1,然后是頻繁2-項(xiàng)集L2,直到有*個r值使得Lr為空,這時算法停頓。這里在第k次循環(huán)中,過程先產(chǎn)生候選k-項(xiàng)集的集合Ck,Ck中的每一個項(xiàng)集是對兩個只有一個項(xiàng)不同的屬于Lk-1的頻集做一個(k-2)-連接來產(chǎn)生的。Ck中的項(xiàng)集是用來產(chǎn)生頻集的候選集,最后的頻集Lk必須是Ck的一個子集。Ck中的每個元素需在交易數(shù)據(jù)庫中進(jìn)展驗(yàn)證來決定其是否參加Lk,這里的驗(yàn)證過程是算法性能的一個瓶頸。可能產(chǎn)生大量的候選集,以及可能需要重復(fù)掃描數(shù)據(jù)庫,是Apriori算法的兩大缺點(diǎn)。1.4Apriori算法改良關(guān)聯(lián)規(guī)則分類精簡,分類名稱,分類依據(jù),按照不同情況,關(guān)聯(lián)規(guī)則可以進(jìn)展分類如下:基于規(guī)則中處理的變量的類別,關(guān)聯(lián)規(guī)則可以分為布爾型和數(shù)值型。布爾型關(guān)聯(lián)規(guī)則處理的值都是離散的、種類化的,它顯示了這些變量之間的關(guān)系;而數(shù)值型關(guān)聯(lián)規(guī)則可以和多維關(guān)聯(lián)或多層關(guān)聯(lián)規(guī)則結(jié)合起來,對數(shù)值型字段進(jìn)展處理,將其進(jìn)展動態(tài)的分割,或者直接對原始的數(shù)據(jù)進(jìn)展處理,當(dāng)然數(shù)值型關(guān)聯(lián)規(guī)則中也可以包含種類變量?;谝?guī)則中數(shù)據(jù)的抽象層次,可以分為單層關(guān)聯(lián)規(guī)則和多層關(guān)聯(lián)規(guī)則。在單層的關(guān)聯(lián)規(guī)則中,所有的變量都沒有考慮到現(xiàn)實(shí)的數(shù)據(jù)是具有多個不同的層次的;而在多層的關(guān)聯(lián)規(guī)則中,對數(shù)據(jù)的多層性已經(jīng)進(jìn)展了充分的考慮?;谝?guī)則中涉及到的數(shù)據(jù)的維數(shù),關(guān)聯(lián)規(guī)則可以分為單維的和多維的。在單維的關(guān)聯(lián)規(guī)則中,只涉及到數(shù)據(jù)的一個維;而在多維的關(guān)聯(lián)規(guī)則中,要處理的數(shù)據(jù)將會涉及多個維。換成另一句話,單維關(guān)聯(lián)規(guī)則是處理單個屬性中的一些關(guān)系;多維關(guān)聯(lián)規(guī)則是處理各個屬性之間的*些關(guān)系。針對Apriori算法,國內(nèi)外許多研究人員提出了一些技術(shù)對其修改。這些技術(shù)包括散列、事務(wù)壓縮、雜湊、劃分、選樣、動態(tài)項(xiàng)集技術(shù)和FP-樹頻集算法。如表1-1所示。表1-1Apriori算法改良名稱方法解決問題未解決問題Apriori算法兩階段頻集遞推算法顧客交易數(shù)據(jù)庫中間項(xiàng)的關(guān)聯(lián)規(guī)則挖掘可能產(chǎn)生大量的候選集;需要重復(fù)掃描數(shù)據(jù)庫Hash算法引入hash技術(shù)改良產(chǎn)生頻繁2項(xiàng)集壓縮了2項(xiàng)集同上事務(wù)壓縮對事務(wù)壓縮壓縮了2項(xiàng)集同上雜湊引入雜湊技術(shù)改良了產(chǎn)生2項(xiàng)集的方法重復(fù)掃描數(shù)據(jù)庫選樣掃描一個子集,再對剩余數(shù)據(jù)庫進(jìn)展驗(yàn)證產(chǎn)生大量候選集產(chǎn)生結(jié)果不正確劃分將數(shù)據(jù)庫拆分,單獨(dú)生成頻集,然后合并,再計(jì)算支持度重復(fù)掃描數(shù)據(jù)庫算法執(zhí)行時間和算法的正確性動態(tài)項(xiàng)集計(jì)數(shù)將數(shù)據(jù)庫劃分為標(biāo)記開場點(diǎn)的塊,動態(tài)添加候選集項(xiàng)減少了掃描數(shù)據(jù)庫次數(shù)可能產(chǎn)生大量的候選集FP-growth分而治之產(chǎn)生候選挖掘頻繁項(xiàng)集基于內(nèi)存,數(shù)據(jù)庫較大時不合用由表1-1,可以看出,雖然上述幾種改良算法在一定程度上解決了問題,在解決問題的同時,也產(chǎn)生了許多問題。主要存在對數(shù)據(jù)庫屢次掃描,產(chǎn)生龐大的2項(xiàng)集,對此,許多人做了研究。楊凱等[3]提出了基于屬性分組的高效挖掘關(guān)聯(lián)規(guī)則算法,用矩陣來存儲數(shù)據(jù)庫屬性間的信息并提取頻繁項(xiàng)集而且不產(chǎn)生候選項(xiàng)集,試驗(yàn)證明該算法對大型數(shù)據(jù)庫有效,同時數(shù)據(jù)存儲量低,執(zhí)行效率快。[4]等探索了最大頻繁項(xiàng)和最小非頻繁項(xiàng)的關(guān)系,提出了FlipFlop算法,該算法可以明顯的降低Apriori算法帶來的I/O問題??梢钥吹皆跀?shù)據(jù)庫中尋找令用戶感興趣的關(guān)聯(lián)規(guī)則時,有這樣幾個著眼點(diǎn):數(shù)據(jù)庫的處理技術(shù)。如整個數(shù)據(jù)庫的采樣、有效的剪枝策略、減少搜索空間、數(shù)據(jù)庫分片〔并行處理〕、對數(shù)據(jù)庫進(jìn)展壓縮〔內(nèi)存中處理〕、多處理器搜索數(shù)據(jù)庫等。搜索策略。如深度優(yōu)先廣度優(yōu)先自底向上自頂向下等。支撐度、信任度的計(jì)算方法。Hash法、標(biāo)號集法、頻度法等。關(guān)聯(lián)規(guī)則新的研究方法2.1模糊集模糊集由Zadeh,A.于1965年創(chuàng)立。其主要創(chuàng)新是把經(jīng)典集合里特征函數(shù)的取值函數(shù)由二值域{0,1}擴(kuò)展到閉區(qū)間[0,1],并給出了模糊集的定義:一個定義在論域U上的模糊集合F由隸屬函數(shù)μF:Uv[0,1]表征,其中μF表示在模糊集合F上的隸屬度。模糊集主要用于提高關(guān)聯(lián)規(guī)則的有趣度和可理解性。彭暉,莊鎮(zhèn)泉,李斌等[5]提出了基于模糊關(guān)聯(lián)規(guī)則挖掘的模糊入侵檢測,利用該算法從網(wǎng)絡(luò)數(shù)據(jù)集中提取出具有較高可信性和完備性的模糊規(guī)則,并利用這些規(guī)則設(shè)計(jì)和實(shí)現(xiàn)用于入侵檢測的模糊分類器。同時,針對模糊關(guān)聯(lián)規(guī)則挖掘算法,利用K-means聚類算法建立屬性的模糊集和模糊隸屬函數(shù),并提出了一種雙置信度算法以增加模糊規(guī)則的有效性和完備性。GermanFlorez[6]等提出了一個基于Borgelt前綴樹的模糊關(guān)聯(lián)規(guī)則算法,修改了支持度和信任度的計(jì)算方法,通過計(jì)算新方法模糊規(guī)則集和特征選擇,來提高入侵檢測的準(zhǔn)確率和效率。Didier

Dubois[7]等將數(shù)據(jù)以固定規(guī)則分區(qū),可以更加快速的分析關(guān)聯(lián)規(guī)則。2.2概念格在形式概念分析中,概念的外延表示這個概念的所有對象的集合,而內(nèi)涵表示所有對象共有的屬性集合。以此將概念的哲學(xué)理解形式化。概念格(conceptlattice)是形式概念分析中的核心數(shù)據(jù)構(gòu)造,概念格的結(jié)點(diǎn)關(guān)系表達(dá)了概念之間的泛化和實(shí)例化關(guān)系,因此非常適合用來挖掘規(guī)則型知識。*泉清[8]等對經(jīng)典Apriori算法的優(yōu)、缺點(diǎn)進(jìn)展了剖析,在實(shí)際應(yīng)用工程中,提出了一種基于概念格的關(guān)聯(lián)規(guī)則算法ACL。在該算法中,引入了概念格和等價(jià)關(guān)系等概念,利用粗糙集相關(guān)方面的理論,計(jì)算得到頻繁2項(xiàng)集。苗茹[9]等針對普通關(guān)聯(lián)規(guī)則算法易產(chǎn)生冗余關(guān)聯(lián)規(guī)則,提出了概念格上無冗余關(guān)聯(lián)規(guī)則的提取算法NARG,該算法可以得到最小的無冗余的關(guān)聯(lián)規(guī)則集,而且不喪失任何信息,可有效提高關(guān)聯(lián)規(guī)則生成的效率。李云[10]等也對基于概念格提取簡潔關(guān)聯(lián)規(guī)則進(jìn)展了研究。Keyun

Hu[11]等結(jié)合分類和關(guān)聯(lián)規(guī)則,將其應(yīng)用到概念格中,并提出了一種新快速算法。Arianna

Gallo[12]等針對產(chǎn)生頻繁項(xiàng)的規(guī)則不嚴(yán)格而易產(chǎn)生冗余問題,將概念格應(yīng)用到關(guān)聯(lián)規(guī)則中,這能夠有效加快執(zhí)行速度。2.3粗糙集粗糙集由波蘭數(shù)學(xué)家Pawlak,Z.于1982年創(chuàng)新。粗糙集強(qiáng)調(diào)數(shù)據(jù)的不可辨(indiscernibility)與模棱兩可(ambiguity),研究不同類中的對象組成的集合間的關(guān)系。因此粗糙集在關(guān)聯(lián)規(guī)則中的應(yīng)用主要是規(guī)則挖掘前的數(shù)據(jù)約簡和降維等預(yù)處理。李闖[13]等針對不完備信息系統(tǒng),提出了基于粗糙集理論的快速ORD關(guān)聯(lián)規(guī)則挖掘算法。該算法首先采用基于粗糙集理論的屬性約簡算法進(jìn)展屬性約簡,然后采用快速、高效的冗余項(xiàng)集和冗余規(guī)則修剪算法獲取關(guān)聯(lián)規(guī)則,從而能更快、更優(yōu)地找到其感興趣的規(guī)則。王旭仁[14]等針對冗余關(guān)聯(lián)規(guī)則,結(jié)合粗糙集和關(guān)聯(lián)規(guī)則進(jìn)展了研究和應(yīng)用。Jiye

Li[15]等將粗糙集應(yīng)用到關(guān)聯(lián)規(guī)則,可以選出更加有效、重要的規(guī)則。Ma

Yu-liang[16]等通過刪除最小支持度的規(guī)則的規(guī)約方法來提高檢測速率。2.4遺傳算法基于生物遺傳算法的關(guān)聯(lián)規(guī)則發(fā)現(xiàn)方法,利用遺傳算法的自適應(yīng)尋優(yōu)及智能搜索技術(shù)獲取與客觀事實(shí)相容的關(guān)聯(lián)規(guī)則。生物遺傳算法需要首先確定染色體編碼方案,然后確定適應(yīng)度函數(shù),最后確定遺傳操作。通過遺傳算子(如選擇,穿插(重組)和變異等)來產(chǎn)生一群新的更適應(yīng)環(huán)境的染色體,形成新的種群。Y.Dhanalakshmi[17]等將遺傳算法結(jié)合關(guān)聯(lián)規(guī)則應(yīng)用到入侵檢測中。方德洲[18]等提出了一種利用半空間模型和遺傳算法(GA)對關(guān)聯(lián)規(guī)則進(jìn)展快速挖掘的方法,該方法解決了傳統(tǒng)方法在數(shù)據(jù)類型、關(guān)聯(lián)規(guī)則的實(shí)際意義等約束,可以挖掘出用戶感興趣的規(guī)則。武兆慧[19]等提出一種新的基于改良的模擬退火遺傳算法的關(guān)聯(lián)規(guī)則挖掘算法,并在該算法中,采用自適應(yīng)方式動態(tài)選取穿插和變異概率,有效地抑制了早熟收斂現(xiàn)象,實(shí)驗(yàn)結(jié)果顯示該方法能高效地解決關(guān)聯(lián)規(guī)則挖掘問題。K.

R.

Venugopal[20]等提出了DMARG算法,該算法可大大提高檢測大規(guī)模交易數(shù)據(jù)的速度。Bilal

Alata?[21]等將遺傳算法同時應(yīng)用于正負(fù)關(guān)聯(lián)規(guī)則,試驗(yàn)說明了該方法的可行性。2.5加權(quán)基于加權(quán)的關(guān)聯(lián)規(guī)則算法,利用加權(quán)關(guān)聯(lián)規(guī)則可從各種各樣的審計(jì)數(shù)據(jù)中更加容易且更有效地發(fā)現(xiàn)有用信息。因此,加權(quán)關(guān)聯(lián)規(guī)則技術(shù)比關(guān)聯(lián)規(guī)則技術(shù)更加適合于構(gòu)建入侵檢測系統(tǒng)的入侵模塊數(shù)據(jù)庫。段軍[22]等提出了基于多支持度的挖掘關(guān)聯(lián)規(guī)則算法AMWARMS,提出了允許用戶設(shè)定多個最小支持度、給定數(shù)據(jù)各項(xiàng)的權(quán)重來解決設(shè)置最小支持度過小導(dǎo)致頻繁項(xiàng)相互組合爆炸問題。歐陽繼紅[23]等提出了具有動態(tài)加權(quán)特性的關(guān)聯(lián)規(guī)則算法,該算法把事務(wù)數(shù)據(jù)庫中的工程按其重要程度劃分為5個等級;運(yùn)用層次分析(AHP)算法構(gòu)造判斷矩陣,計(jì)算特征量;將得到的向量作為權(quán)值,與工程在事務(wù)數(shù)據(jù)庫中出現(xiàn)的次數(shù)綜合考慮作為衡量重要程度的標(biāo)準(zhǔn),生成FP_tree;最后得到頻繁工程集和關(guān)聯(lián)規(guī)則。該算法在運(yùn)行初期就大量剔除了那些權(quán)重小的無用工程集,大大提高了算法的運(yùn)行效率。黃名選[24]等提出一種面向查詢擴(kuò)展的矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘算法,給出與其相關(guān)的定理及其證明過程。Wei

Wang[25]等應(yīng)用先產(chǎn)生頻繁項(xiàng)集,再在產(chǎn)生規(guī)則時引入加權(quán),該方法支持批模式和交互模式。M.Sulaiman

Khan[26]等解決了加權(quán)關(guān)聯(lián)規(guī)則挖掘的向下封閉性〔DCP〕的失效問題。2.6有向圖基于有向圖的關(guān)聯(lián)規(guī)則算法,采用位矢量技術(shù)構(gòu)造有向圖表示項(xiàng)與項(xiàng)之間的頻繁關(guān)系,并在有向圖的根底上遞歸產(chǎn)生頻繁項(xiàng)集,從而只需掃描數(shù)據(jù)庫次,不產(chǎn)生候選集,從而大大提高了關(guān)聯(lián)規(guī)則挖掘算法的效率。唐德權(quán)[27]等提出了一種基于有向圖的頻繁工程集挖掘算法DGBFIG。*玲霞[28]等提出了一種基于有向圖的關(guān)聯(lián)規(guī)則挖掘算法,采用了垂直二進(jìn)制位圖映射數(shù)據(jù)庫,根據(jù)垂直二進(jìn)制位圖來生成有向圖,將頻繁項(xiàng)的二進(jìn)制位串作為有向圖的權(quán)值,通過分析有向圖生成最大頻繁項(xiàng)集,并給出了最大頻繁項(xiàng)集挖掘算法的優(yōu)勢。ZhiboRen[29]等提出了基于有向圖的最大頻繁項(xiàng)挖掘算法MFIMiner,該算法用有向圖表示頻繁2項(xiàng)集,最大頻繁項(xiàng)搜索在有向圖中完成,該算法適合密集數(shù)據(jù)和稀疏數(shù)據(jù)。入侵檢測自從Anderson在1980年給出了入侵的定義以來,入侵檢測技術(shù)有了很大開展。入侵檢測分為濫用檢測和異常檢測,通常是搜索主機(jī)信息和采集來自網(wǎng)絡(luò)流的解碼信息,比對檢測規(guī)則,當(dāng)符合時認(rèn)為發(fā)生入侵。然而,這些規(guī)則,需要經(jīng)歷豐富的專家來給出,耗時,同時響應(yīng)較慢。將數(shù)據(jù)挖掘應(yīng)用到入侵檢測中,可以使用關(guān)聯(lián)規(guī)則技術(shù)動態(tài)的產(chǎn)生檢測規(guī)則,防止了傳統(tǒng)的入侵檢測障礙。郭山清[30]等提出了入侵檢測在線規(guī)則生成模型,解決了當(dāng)前主流關(guān)聯(lián)規(guī)則生成算法應(yīng)用到入侵檢測結(jié)果集的過程中所存在的多遍掃描(至少兩遍)、攻擊數(shù)據(jù)的非均衡分布所帶來的大量無效規(guī)則的產(chǎn)生和兩階段規(guī)則生成方法,使得在第一階段產(chǎn)生了眾多與最后生成的規(guī)則集無關(guān)的頻繁集等問題。Y.Dhanalakshmi[17]等驗(yàn)證了模糊邏輯和遺傳算法同關(guān)聯(lián)規(guī)則結(jié)合在入侵檢測中的應(yīng)用的可靠性。3.1誤報(bào)率與漏報(bào)率的改良入侵檢測分為濫用檢測和異常檢測,其中濫用檢測具有誤報(bào)率低,漏報(bào)率高的特點(diǎn),而異常檢測具有誤報(bào)率搞,漏報(bào)率低的特點(diǎn)。胡亮[31]等就數(shù)據(jù)挖掘方法同傳統(tǒng)方法在異常檢測中的應(yīng)用做了實(shí)驗(yàn)比照,證明基于數(shù)據(jù)挖掘的方法可以提高攻擊檢測率,并有效降低誤報(bào)率。*曉亮[32]等提出一種基于數(shù)據(jù)挖掘的無指導(dǎo)自適應(yīng)入侵檢測系統(tǒng)。系統(tǒng)通過有效結(jié)合聚類、關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法,自動進(jìn)展檢測規(guī)則的提取。該方法經(jīng)實(shí)驗(yàn)說明,具有較好的檢測率、誤報(bào)率。Ya-Liding[33]等提出了基于Apriori算法的神經(jīng)特征搜索算法,該算法可有效提高檢測效率。Ming-YangSu[34]等將模糊關(guān)聯(lián)規(guī)則應(yīng)用到實(shí)時入侵檢測中,通過比擬在線規(guī)則集和無入侵訓(xùn)練包,快速得到規(guī)則集,大大降低了漏報(bào)率。MahmoodHossain[35]等針對在入侵檢測時動態(tài)日志問題,提出了適應(yīng)性模型。AlyEl–Semary[36]等也針對動態(tài)日志問題,結(jié)合Apriori算法和Kuok算法,動態(tài)產(chǎn)生模糊邏輯規(guī)則。AndrzejChmielewski[37]等提出了基于樹構(gòu)造的V檢測算法,該算法可以提高檢測速度。開展趨勢盡管目前對關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘的研究取得了許多顯著的成功,但仍然還有許多問題值得進(jìn)一步的研究與探討。關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘的研究與開展方向主要表達(dá)在以下方面:設(shè)計(jì)更高效的可擴(kuò)展的挖掘算法為了從海量數(shù)據(jù)庫中有效地抽取信息,挖掘算法的效率顯得尤為重要。單純從計(jì)算機(jī)的角度對算法的研究已趨于飽和,有必要加強(qiáng)結(jié)合領(lǐng)域知識的理解,以提取與挖掘任務(wù)有關(guān)的數(shù)據(jù),有效地減少問題的復(fù)雜度,提高算法的效率。在這方面,基于受限的關(guān)聯(lián)規(guī)則挖掘有廣闊的開展前景。研制更為合理有效的規(guī)則評價(jià)標(biāo)準(zhǔn)在許多實(shí)際應(yīng)用中,如果僅憑支持度和置信度這兩個評價(jià)關(guān)聯(lián)規(guī)則的標(biāo)準(zhǔn),可能會發(fā)現(xiàn)大量冗余、虛假或非有趣的規(guī)則,因而研制一些新的評價(jià)標(biāo)準(zhǔn)很有必要,但這可能要視具體情況而定。并行關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘數(shù)據(jù)量的不斷增長,維數(shù)的越來越高,數(shù)據(jù)的不對稱性,動態(tài)負(fù)載的平衡,并行的數(shù)據(jù)庫管理系統(tǒng)與文件系統(tǒng)等,所有這些都是目前在并行數(shù)據(jù)挖掘**需要解決的問題。隨著大規(guī)模并行計(jì)算在數(shù)據(jù)挖掘中的應(yīng)用,由于挖掘系統(tǒng)本身的原因,并行數(shù)據(jù)挖掘無法實(shí)現(xiàn)任意程度的并行。對更多類型的數(shù)據(jù)源的挖掘目前大多挖掘算法都是對關(guān)系型數(shù)據(jù)庫的挖掘。由于應(yīng)用領(lǐng)域的不同,所挖掘的數(shù)據(jù)的類型也不同,如構(gòu)造化數(shù)據(jù)、超文本數(shù)據(jù)、多媒體數(shù)據(jù)、空間數(shù)據(jù)、面向?qū)ο髷?shù)據(jù)、多維數(shù)據(jù)、數(shù)據(jù)倉庫、Web數(shù)據(jù)等,研究對這些類型數(shù)據(jù)庫的關(guān)聯(lián)規(guī)則挖掘也將是很迫切的工作??梢暬诰蛴捎跀?shù)據(jù)挖掘算法本身的復(fù)雜性,所以使得一般用戶難以理解和承受。關(guān)聯(lián)規(guī)則挖掘的可視化主要是通過可視化技術(shù)的直觀性來彌補(bǔ)數(shù)據(jù)挖掘算法復(fù)雜性的缺陷,使用戶與挖掘系統(tǒng)有效的交互,加強(qiáng)與領(lǐng)域?qū)<业暮献鳌Ec數(shù)據(jù)倉庫和OLAP的結(jié)合數(shù)據(jù)挖掘需要的數(shù)據(jù)是一些經(jīng)過凈化、集成處理的數(shù)據(jù),通常這種預(yù)處理過程也是昂貴的,而數(shù)據(jù)倉庫作為OLAP的數(shù)據(jù)源,存儲的就是這樣的數(shù)據(jù)。它能為OLAP提供數(shù)據(jù),當(dāng)然也可以為數(shù)據(jù)挖掘提供數(shù)據(jù)。OLAM將二者結(jié)合起來,開展一種建立在OLAP和數(shù)據(jù)倉庫根底上的新的挖掘技術(shù),它兼有OLAP多維分析的在線性、靈活性和數(shù)據(jù)挖掘?qū)?shù)據(jù)處理的深入性,是數(shù)據(jù)庫應(yīng)用工具未來開展的方向之一。隱私保護(hù)及數(shù)據(jù)平安當(dāng)數(shù)據(jù)能從不同角度及不同抽象層查看時,嚴(yán)重地威脅了保護(hù)數(shù)據(jù)平安及制止侵犯隱私的目標(biāo)。知識發(fā)現(xiàn)何時可能導(dǎo)致侵犯隱私及為了保護(hù)敏感信息而開發(fā)何種平安措施,這些研究工作都是非常重要的。參考文獻(xiàn)HanJW,KamberM.DataMining:ConceptsandTechniques[M].MorganKaufmann,2000.馬建慶,鐘亦平,*世永.基于興趣度的關(guān)聯(lián)規(guī)則挖掘算法[J].計(jì)算機(jī)工程,2006(32),121-123.楊凱,*小平,馬垣.基于屬性分組的高效挖掘關(guān)聯(lián)規(guī)則算法[J].計(jì)算機(jī)工程與應(yīng)用,2005(31),157-159.K.K.Loo,Chi-LapYip,BenKao.E*ploitingtheDualityofMa*imalFrequentItemsetsandMinimalInfrequentItemsetsforI/OEfficientAssociationRuleMining[C].SpringerBerlin,LectureNotesinputerScience,2000〔1873〕,710-719.彭暉,莊鎮(zhèn)泉,李斌等.基于模糊關(guān)聯(lián)規(guī)則挖掘的模糊入侵檢測[J].計(jì)算機(jī)工程與應(yīng)用,2004(31),152-155.GermanFlorez,SusanM.Bridges,andRayfordB.Vaughn.AnImprovedAlgorithmforFuzzyDataMiningforIntrusionDetection[Z]Didier

Dubois,Eyke

Hüllermeier,Henri

Prade.Asystematicapproachtotheassessmentoffuzzyassociationrules[C].SpringerNetherlands,DataMiningandKnowledgeDiscovery,2006(13),167-192.*泉清,朱玉文,*萬春.基于概念格的關(guān)聯(lián)規(guī)則算法[J],計(jì)算機(jī)應(yīng)用,2005(25),1586-1588.苗茹,沈夏炯,胡小華.概念格上無冗余關(guān)聯(lián)規(guī)則的提取算法NARG[J].計(jì)算機(jī)工程,2009(35),74-76.李云,李拓,蔡俊杰等.基于概念格提取簡潔關(guān)聯(lián)規(guī)則[J].**郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2007(27),44-47.Keyun

Hu,Yuchang

Lu,Lizhu

Zhou.IntegratingClassificationandAssociationRuleMining:AConceptLatticeFramework[C].SpringerBerlin,LectureNotesinputerScience,2004(1711),443-447.Arianna

Gallo,Rosa

Meo.UsingaReinforcedConceptLatticetoIncrementallyMineAssociationRulesfromClosedItemsets[C].SpringerBerlinLectureNotesinputerScience,200794747),97-115.李闖,楊勝,謝凱等.基于粗糙集理論的ORD關(guān)聯(lián)規(guī)則挖掘算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2008(29),3666-3668.王旭仁,許榕生.基于粗糙集理論的關(guān)聯(lián)規(guī)則挖掘研究及應(yīng)用[J].計(jì)算機(jī)工程,2005(31),90-92.Jiye

Li,Nick

Cercone.ARoughSetBasedModeltoRanktheImportanceofAssociationRules[C].SpringerBerlin,LectureNotesinputerScience,2005(3642),109-118.Ma

Yu-liag,Yan

Wen-jun.Valuereductionalgorithminroughsetsbasedonassociationrulessupport[J].JournalofZhejiangUniversity-ScienceA,2006(7),219-222.Y.Dhanalakshmi,Dr.I.RameshBabu.IntrusionDetectionUsingDataMiningAlongFuzzyLogicandGeneticAlgorithms[C].InternationalJournalofputerScienceandNetworkSecurity,2008(8),27-32.方德洲,李淼.基于半空間和GA的關(guān)聯(lián)規(guī)則快速挖掘算法[J].計(jì)算機(jī)工程與應(yīng)用,2007(43),193-195.武兆慧,*桂娟,*希玉.基于模擬退火遺傳算法的關(guān)聯(lián)規(guī)則挖掘[J].計(jì)算機(jī)應(yīng)用,2005(25),1009-1011.K.

R.

Venugopal,K.

G.

Srinivasa,L.

M.

Patnaik.DynamicAssociationRuleMiningUsingGeneticAlgorithms[J].IntelligentDataAnalysis,2009(190),439-453.Bilal

Alata?,Erhan

Akin.Anefficientgeneticalgorithmforautomatedminingofbothpositiveandnegativequantitativeassociationrules[J].Softputing-AFusionofFoundations,MethodologiesandApplications,2006(10),230-237.段軍,戴居豐.基于多支持度的挖掘關(guān)聯(lián)規(guī)則算法[J].**大學(xué)學(xué)報(bào),2006(39),114-118.歐陽繼紅,王仲佳,*大有.具有動態(tài)加權(quán)特性的關(guān)聯(lián)規(guī)則算法[J].**大學(xué)學(xué)報(bào)(理學(xué)版),2005(43),314-319.黃名選,嚴(yán)小衛(wèi),*師超.基于矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘的偽相關(guān)反應(yīng)查詢擴(kuò)展[J].軟件學(xué)報(bào),2009(20),1854-1865.Wei

Wang,Jiong

Yang,Philip

Yu.WAR:WeightedAssociationRulesforItemIntensities[J].KnowledgeandInformationSystems,2004(6),203-229.M.

Sulaiman

Khan,Maybin

Muyeba,F(xiàn)rans

Coenen.WeightedAssociationRuleMiningfromBinaryandFuzzyData[C].LectureNotesinputerScience,2008(5077),200-212.唐德權(quán),夏耀穗,朱林立等.基于有向圖的關(guān)聯(lián)規(guī)則挖掘算法研究[J].**大學(xué)學(xué)報(bào)〔自然版〕,2006(28),119-121.*玲霞,李大學(xué),馬萬里.基于有向圖的關(guān)聯(lián)規(guī)則算法[J].**郵電學(xué)院學(xué)報(bào)(自然科學(xué)版),2005(17),495-498.ZhiboRen;QiangZhang;*iujuanMa.EfficientlyMiningMa*imalFrequentItemsetsBasedonDigraph[C].FuzzySystemsandKnowledgeDiscovery,2007.FSKD2007.FourthInternationalConference,2007(2),140-143.郭山清,謝立,曾英佩.入侵檢測在線規(guī)則生成模型[J].計(jì)算機(jī)學(xué)報(bào),2006(29),1523-1532.胡亮,金剛,于漫等.基于異常檢測的入侵檢測技術(shù)[J].**大學(xué)學(xué)報(bào)(理學(xué)版),2009(47),1264-1270.*曉亮,李家濱.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論