CN114117299B 一種網(wǎng)站入侵篡改檢測方法、裝置、設(shè)備及存儲介質(zhì) (恒安嘉新(北京)科技股份公司)_第1頁
CN114117299B 一種網(wǎng)站入侵篡改檢測方法、裝置、設(shè)備及存儲介質(zhì) (恒安嘉新(北京)科技股份公司)_第2頁
CN114117299B 一種網(wǎng)站入侵篡改檢測方法、裝置、設(shè)備及存儲介質(zhì) (恒安嘉新(北京)科技股份公司)_第3頁
CN114117299B 一種網(wǎng)站入侵篡改檢測方法、裝置、設(shè)備及存儲介質(zhì) (恒安嘉新(北京)科技股份公司)_第4頁
CN114117299B 一種網(wǎng)站入侵篡改檢測方法、裝置、設(shè)備及存儲介質(zhì) (恒安嘉新(北京)科技股份公司)_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

(19)國家知識產(chǎn)權(quán)局(12)發(fā)明專利(10)授權(quán)公告號CN114117299B(21)申請?zhí)?02111361696.7(22)申請日2021.11.17(65)同一申請的已公布的文獻(xiàn)號申請公布號CN114117299A(43)申請公布日2022.03.01(73)專利權(quán)人恒安嘉新(北京)科技股份公司號27號樓五層5002室(56)對比文件王杰楊滿智金紅陳曉光(74)專利代理機(jī)構(gòu)北京品源專利代理有限公司GO6F16/958(2019.01)權(quán)利要求書3頁說明書13頁附圖4頁(54)發(fā)明名稱一種網(wǎng)站入侵篡改檢測方法、裝置、設(shè)備及存儲介質(zhì)(57)摘要本發(fā)明實(shí)施例公開了一種網(wǎng)站入侵篡改檢測方法、裝置、設(shè)備及存儲介質(zhì),該方法包括:獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,所述網(wǎng)頁信息集合至少包括以下至少一種網(wǎng)頁信息:網(wǎng)頁源碼、網(wǎng)頁域名、網(wǎng)頁圖片和網(wǎng)頁文本信息;從所述網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,并確定篡改檢測結(jié)果。通過獲取網(wǎng)頁信息集合,對網(wǎng)頁信息集合中的待檢測網(wǎng)頁信息進(jìn)行入侵篡改檢測,保證待檢測網(wǎng)站的安全性。根據(jù)待檢測網(wǎng)頁信息的信息類型選擇合適的檢測2獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,所述網(wǎng)頁信息集合至少包括以下至少一種網(wǎng)頁信從所述網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,確定篡改檢測結(jié)果;其中,當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁域名時(shí),確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方獲取網(wǎng)頁源碼并進(jìn)行分析,確定網(wǎng)頁超鏈接集合;根據(jù)所述網(wǎng)頁超鏈接集合和網(wǎng)頁域名確定目標(biāo)二級域名;統(tǒng)計(jì)所述目標(biāo)二級域名的數(shù)量;判斷所述數(shù)量是否大于第一預(yù)設(shè)數(shù)量閾值,若是,確定篡改檢測結(jié)果為泛二級域名篡2.根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁源碼時(shí),確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,確定篡改檢測結(jié)果,包括:獲取預(yù)確定的正則表達(dá)式集合;根據(jù)所述正則表達(dá)式集合中的正則表達(dá)式對所述網(wǎng)頁源碼進(jìn)行字符串匹配檢測,確定篡改檢測結(jié)果。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述網(wǎng)頁超鏈接集合和網(wǎng)頁域名對所述網(wǎng)頁超鏈接集合中的網(wǎng)頁超鏈接提取二級域名,得到至少一個(gè)超鏈接二級域?qū)λ鼍W(wǎng)頁域名提取二級域名,得到網(wǎng)頁二級域名;將各所述超鏈接二級域名分別與網(wǎng)頁二級域名比較;將比較結(jié)果為不同的超鏈接二級域名確定為目標(biāo)二級域名。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁域名時(shí),確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,確定篡改檢測結(jié)果,包括:將所述網(wǎng)頁域名通過預(yù)設(shè)的網(wǎng)頁安全接口輸出到域名檢測平臺;接收所述域名檢測平臺返回的域名檢測結(jié)果;對所述域名檢測結(jié)果進(jìn)行分析,確定篡改檢測結(jié)果。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁圖片時(shí),確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,確定篡改檢測結(jié)果,包括:將所述網(wǎng)頁圖片輸入到預(yù)確定的圖片檢測網(wǎng)絡(luò)模型中,所述圖片檢測網(wǎng)絡(luò)模型根據(jù)檢測數(shù)據(jù)集和分類數(shù)據(jù)集進(jìn)行訓(xùn)練得到;根據(jù)所述圖片檢測網(wǎng)絡(luò)模型的輸出結(jié)果確定目標(biāo)對象;對所述目標(biāo)對象中的待檢測文字進(jìn)行異常檢測,根據(jù)異常檢測結(jié)果確定篡改檢測結(jié)6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述圖片檢測網(wǎng)絡(luò)模型的訓(xùn)練步驟包括:獲取檢測數(shù)據(jù)集和分類數(shù)據(jù)集,所述檢測數(shù)據(jù)集和分類數(shù)據(jù)集中的待訓(xùn)練圖片對應(yīng)關(guān)聯(lián)標(biāo)準(zhǔn)信息,所述標(biāo)準(zhǔn)信息包括標(biāo)準(zhǔn)位置信息和標(biāo)準(zhǔn)類別信息;3將當(dāng)前迭代下對應(yīng)的待訓(xùn)練圖片輸入到當(dāng)前的待訓(xùn)練網(wǎng)絡(luò)模型中,得到預(yù)測信息,所述預(yù)測信息包括預(yù)測位置信息和預(yù)測類別信息;采用給定的損失函數(shù)表達(dá)式,結(jié)合所述標(biāo)準(zhǔn)信息和預(yù)測信息,獲得相應(yīng)的損失函數(shù);基于所述損失函數(shù)對所述待訓(xùn)練網(wǎng)絡(luò)模型進(jìn)行反向傳播,得到用于下一迭代的待訓(xùn)練7.根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁文本信息時(shí),確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,確定篡改檢測結(jié)果,獲取網(wǎng)頁源碼,并確定所述網(wǎng)頁源碼中的文本標(biāo)簽;根據(jù)各所述文本標(biāo)簽和網(wǎng)頁文本信息確定目標(biāo)文本;對各所述目標(biāo)文本進(jìn)行異常檢測,確定異常文本;判斷所述異常文本的數(shù)量是否大于第二預(yù)設(shè)數(shù)量閾值,若是,確定篡改檢測結(jié)果為網(wǎng)8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述根據(jù)各所述文本標(biāo)簽和網(wǎng)頁文本信息確定各所述文本標(biāo)簽在網(wǎng)頁文本信息中所對應(yīng)文本的文本長度;確定各所述文本長度中滿足預(yù)設(shè)長度條件的目標(biāo)文本長度;將所述目標(biāo)文本長度對應(yīng)的文本確定為目標(biāo)文本。9.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述對各所述目標(biāo)文本進(jìn)行異常檢測,確針對每個(gè)目標(biāo)文本,確定所述目標(biāo)文本和預(yù)確定的異常文字信息庫的編輯距離;統(tǒng)計(jì)所述編輯距離滿足預(yù)設(shè)距離條件的異常詞數(shù)量;當(dāng)異常詞數(shù)量大于第三預(yù)設(shè)數(shù)量閾值時(shí),確定所述目標(biāo)文本為異常文本。10.根據(jù)權(quán)利要求1-9任一項(xiàng)所述的方法,其特征在于,還包括:根據(jù)至少一個(gè)篡改檢測結(jié)果生成預(yù)警工單,并發(fā)送至對應(yīng)的用戶。信息集獲取模塊,用于獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,所述網(wǎng)頁信息集合至少包括檢測模塊,用于從所述網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,并確定篡改檢測結(jié)果;其中,當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁域名時(shí),檢超鏈接確定單元,用于獲取網(wǎng)頁源碼并進(jìn)行分析,確定網(wǎng)頁超鏈接集合;二級域名確定單元,用于根據(jù)所述網(wǎng)頁超鏈接集合和網(wǎng)頁域名確定目標(biāo)二級域名;數(shù)量確定單元,用于統(tǒng)計(jì)所述目標(biāo)二級域名的數(shù)量;二級域名檢測單元,用于判斷所述數(shù)量是否大于第一預(yù)設(shè)數(shù)量閾值,若是,確定篡改檢測結(jié)果為泛二級域名篡改;否則,確定篡改檢測結(jié)果為未發(fā)生篡改。一個(gè)或多個(gè)處理器;存儲器,用于存儲一個(gè)或多個(gè)程序,45技術(shù)領(lǐng)域[0001]本發(fā)明實(shí)施例涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種網(wǎng)站入侵篡改檢測方法、裝置、設(shè)備及存儲介質(zhì)。背景技術(shù)娛樂及人們的工作和生活產(chǎn)生了深遠(yuǎn)的影響,許多傳統(tǒng)的信息正在被移植到互聯(lián)網(wǎng)上。網(wǎng)站作為電子政務(wù)、電子商務(wù)的重要平臺,一旦被黑客攻破,重要信息和數(shù)據(jù)會被獲取、破壞或篡改,同時(shí)也會造成重大的經(jīng)濟(jì)損失和惡劣的社會影響。因此,如何對網(wǎng)站是否發(fā)生入侵篡改進(jìn)行檢測變得尤為重要。發(fā)明內(nèi)容[0003]本發(fā)明提供一種網(wǎng)站入侵篡改檢測方法、裝置、設(shè)備及存儲介質(zhì),以實(shí)現(xiàn)對網(wǎng)站發(fā)生入侵篡改的準(zhǔn)確檢測。[0004]第一方面,本發(fā)明實(shí)施例提供了一種網(wǎng)站入侵篡改檢測方法,所述方法包括:[0005]獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,所述網(wǎng)頁信息集合至少包括以下至少一種網(wǎng)頁[0006]從所述網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,確定篡改檢測結(jié)果。[0007]第二方面,本發(fā)明實(shí)施例還提供了一種網(wǎng)站入侵篡改檢測裝置,該裝置包括:[0008]信息集獲取模塊,用于獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,所述網(wǎng)頁信息集合至少[0009]檢測模塊,用于從所述網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,并確定篡改檢測結(jié)果。[0010]第三方面,本發(fā)明實(shí)施例還提供了一種計(jì)算機(jī)設(shè)備,該設(shè)備包括:[0012]存儲器,用于存儲一個(gè)或[0013]當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如本發(fā)明實(shí)施例中任一所述的一種網(wǎng)站入侵篡改檢測方法。[0014]第四方面,本發(fā)明實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本發(fā)明實(shí)施例中任一所述的一種網(wǎng)站入侵篡改檢測動方法。[0015]本發(fā)明實(shí)施例提供了一種網(wǎng)站入侵篡改檢測方法、裝置、設(shè)備及存儲介質(zhì),通過獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,所述網(wǎng)頁信息集合至少包括以下至少一種網(wǎng)頁信息:網(wǎng)頁源碼、網(wǎng)頁域名、網(wǎng)頁圖片和網(wǎng)頁文本信息;從所述網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,并確定篡改檢測結(jié)果。6通過獲取網(wǎng)頁信息集合,對網(wǎng)頁信息集合中的待檢測網(wǎng)頁信息進(jìn)行入侵篡改檢測,保證待檢測網(wǎng)站的安全性。根據(jù)待檢測網(wǎng)頁信息的信息類型選擇合適的檢測方式,對待檢測網(wǎng)站進(jìn)行不同角度的檢測,提高檢測結(jié)果的準(zhǔn)確性。附圖說明[0016]圖1是本發(fā)明實(shí)施例一中的一種網(wǎng)站入侵篡改檢測方法的流程圖;[0017]圖2是本發(fā)明實(shí)施例一中的一種網(wǎng)站入侵篡改檢測系統(tǒng)的架構(gòu)示意圖;[0018]圖3是本發(fā)明實(shí)施例二中的一種網(wǎng)站入侵篡改檢測方法的流程圖;[0019]圖4是本發(fā)明實(shí)施例二中的一種網(wǎng)站入侵篡改檢測方法的實(shí)現(xiàn)示例圖;[0020]圖5是本發(fā)明實(shí)施例三中的一種網(wǎng)站入侵篡改檢測裝置的結(jié)構(gòu)示意圖;[0021]圖6是本發(fā)明實(shí)施例四中的一種計(jì)算機(jī)設(shè)備的結(jié)構(gòu)示意圖。具體實(shí)施方式[0022]為使本申請的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本申請實(shí)施例方式作進(jìn)一步地詳細(xì)描述。應(yīng)當(dāng)明確,所描述的實(shí)施例僅僅是本申請一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾堉械膶?shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其它實(shí)施例,都屬于本申請保護(hù)的范圍。[0023]下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本申請相一致的所有實(shí)施方式。相反,它們僅是如所附權(quán)利要求書中所詳述的、本申請的一些方面相一致的裝置和方法的例子。似的對象,而不必用于描述特定的順序或先后次序,也不能理解為指示或暗示相對重要性。對于本領(lǐng)域的普通技術(shù)人員而言,可以根據(jù)具體情況理解上述術(shù)語在本申請中的具體含聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨(dú)存在A,同時(shí)存[0025]實(shí)施例一[0026]圖1給出了本申請實(shí)施例一提供的一種網(wǎng)站入侵篡改檢測方法的流程圖,該方法適用于檢測網(wǎng)站是否發(fā)生入侵及篡改的情況。該方法可以由計(jì)算機(jī)設(shè)備執(zhí)行,該計(jì)算機(jī)設(shè)備可以是兩個(gè)或多個(gè)物理實(shí)體構(gòu)成,也可以是一個(gè)物理實(shí)體構(gòu)成。一般而言,計(jì)算機(jī)設(shè)備可以是筆記本、臺式計(jì)算機(jī)以及智能平板等。[0027]圖2為本實(shí)施例提供的一種網(wǎng)站入侵篡改檢測系統(tǒng)的架構(gòu)示意圖,該系統(tǒng)包括數(shù)接口15和入侵篡改檢測分析模塊16.其中,數(shù)據(jù)源接入模塊11用于獲取待檢測網(wǎng)站111的數(shù)據(jù),待檢測網(wǎng)站可以是重點(diǎn)網(wǎng)站、備案網(wǎng)站等。元數(shù)據(jù)篩選模塊12對數(shù)據(jù)進(jìn)行篩選,數(shù)據(jù)篩選包括數(shù)據(jù)格式篩選、數(shù)據(jù)有效性篩選和數(shù)據(jù)格式解析。高性能檢測引擎13實(shí)現(xiàn)數(shù)據(jù)檢測,數(shù)據(jù)檢測包括植入暗鏈檢測、網(wǎng)頁圖片檢測和網(wǎng)頁文本信息檢測,得到篡改檢測結(jié)果。通過輕量級消息隊(duì)列14對數(shù)據(jù)進(jìn)行處理,輕量級消息隊(duì)列14包括消息數(shù)據(jù)生產(chǎn)者Producer,消7息、數(shù)據(jù)消費(fèi)者Consumers,消息隊(duì)列Message。通過開放的RESTFUL_API接口15將檢測得到的篡改檢測結(jié)果發(fā)送給入侵篡改檢測分析模塊16,進(jìn)行檢測結(jié)果分析。[0028]如圖1所示,本實(shí)施例一提供的一種網(wǎng)站入侵篡改檢測方法,具體包括如下步驟:[0029]S101、獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,網(wǎng)頁信息集合至少包括以下至少一種網(wǎng)[0030]在本實(shí)施例中,待檢測網(wǎng)站具體可以理解為具有檢測是否被入侵篡改需求的網(wǎng)站,本申請中的待檢測網(wǎng)站可以是任意網(wǎng)站。待檢測網(wǎng)站可以預(yù)先設(shè)置,根據(jù)不同網(wǎng)站的重要程度預(yù)設(shè)設(shè)置,當(dāng)待檢測網(wǎng)站的數(shù)量不止一個(gè)時(shí),對于每個(gè)待檢測網(wǎng)站均采用同樣的方式進(jìn)行入侵篡改檢測。網(wǎng)頁信息集合具體可以理解為由不同類型的網(wǎng)頁信息構(gòu)成的數(shù)據(jù)集。網(wǎng)頁圖片具體可以理解為網(wǎng)頁中展示的圖片;網(wǎng)頁文本信息具體可以理解為網(wǎng)頁中的頁域名、網(wǎng)頁圖片或網(wǎng)頁文本信息。獲取待檢測網(wǎng)站的網(wǎng)頁信息的方式可以是通過爬蟲采集。其中,網(wǎng)頁域名從MD5.txt文件中提取,網(wǎng)頁文本信息從MD5.txt和MD5.html文件中獲取。[0031]S102、從網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,并確定篡改檢測結(jié)果。[0032]在本實(shí)施例中,待檢測網(wǎng)頁信息具體可以理解為具有檢測需求的網(wǎng)頁信息,由于網(wǎng)頁信息的類型有多種,不同的網(wǎng)頁信息需要通過不同的方式進(jìn)行檢測。篡改檢測結(jié)果具體可以理解為進(jìn)行入侵篡改檢測后得到的檢測結(jié)果,可以是發(fā)生篡改,未發(fā)生篡改;在篡改檢測結(jié)果為發(fā)生篡改時(shí),篡改檢測結(jié)果可以直接通過篡改類型表示。[0033]具體的,從網(wǎng)頁信息集合中選定一種網(wǎng)頁信息作為待檢測網(wǎng)頁信息,進(jìn)行檢測。在進(jìn)行檢測時(shí),對網(wǎng)頁信息集合中的網(wǎng)頁信息可以僅選擇其中一項(xiàng)進(jìn)行檢測,也可以選擇多項(xiàng)網(wǎng)頁信息進(jìn)行檢測。當(dāng)需要對多種類型的網(wǎng)頁信息均進(jìn)行檢測時(shí),可以首先選擇一種網(wǎng)頁信息作為待檢測網(wǎng)頁信息,在完成此待檢測網(wǎng)頁信息的檢測后,再次從網(wǎng)頁信息集合中選擇一種網(wǎng)頁信息作為新的待檢測網(wǎng)頁信息,并選擇合適的檢測方式進(jìn)行檢測。當(dāng)待檢測網(wǎng)頁信息為網(wǎng)頁源碼或網(wǎng)頁域名時(shí),進(jìn)行植入鏈檢測,植入鏈檢測包括正則表達(dá)式檢測、泛二級域名檢測、網(wǎng)站檢測。當(dāng)待檢測網(wǎng)頁信息為網(wǎng)頁圖片或網(wǎng)頁文本信息時(shí),通過機(jī)器學(xué)習(xí)或神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行內(nèi)容檢測,例如,檢測網(wǎng)頁圖片或網(wǎng)頁文本信息中是否包含負(fù)面信息[0034]本發(fā)明實(shí)施例提供了一種網(wǎng)站入侵篡改檢測方法,通過獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,所述網(wǎng)頁信息集合至少包括以下至少一種網(wǎng)頁信息:網(wǎng)頁源碼、網(wǎng)頁域名、網(wǎng)頁圖片和網(wǎng)頁文本信息;從所述網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,并確定篡改檢測結(jié)果。通過獲取網(wǎng)頁信息集合,對網(wǎng)頁信息集合中的待檢測網(wǎng)頁信息進(jìn)行入侵篡改檢測,保證待檢測網(wǎng)站的安全性。根據(jù)待檢測網(wǎng)頁信息的信息類型選擇合適的檢測方式,對待檢測網(wǎng)站進(jìn)行不同角度的檢測,提高檢測結(jié)果的準(zhǔn)確性。[0036]圖3為本發(fā)明實(shí)施例二提供的一種網(wǎng)站入侵篡改檢測方法的流程圖。本實(shí)施例的技術(shù)方案在上述技術(shù)方案的基礎(chǔ)上進(jìn)一步細(xì)化,具體主要包括如下步驟:8[0037]S201、獲取待檢測網(wǎng)站的網(wǎng)頁信息集合。[0038]當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁源碼時(shí),執(zhí)行S202-S203,確定篡改檢測結(jié)果。[0039]S202、獲取預(yù)確定的正則表達(dá)式集合。[0040]在本實(shí)施例中,正則表達(dá)式集合具體可以理解為由一個(gè)或者多個(gè)正則表達(dá)式構(gòu)成的數(shù)據(jù)集。[0041]需要知道的是,在網(wǎng)頁源碼進(jìn)行檢測時(shí),其原理是通過對網(wǎng)頁源碼分析,檢測其中的暗鏈(即hiddenlinks,是黑帽SEO的作弊手法之一)。為了檢測網(wǎng)頁源碼結(jié)構(gòu)是否被惡意修改(使內(nèi)容不可見),針對黑帽SEO常用收發(fā)“暗鏈”進(jìn)行檢測,實(shí)現(xiàn)對網(wǎng)頁源碼結(jié)構(gòu)是否被篡改的檢測。[0042]暗鏈常見類型有3類:設(shè)置標(biāo)簽的屬性不同的暗鏈類型,通過設(shè)置相應(yīng)的正則表達(dá)式進(jìn)行檢測。預(yù)先確定檢測不同類型暗鏈所需的正則表達(dá)式,根據(jù)各正則表達(dá)式形成正則表達(dá)式集合并存儲。在對網(wǎng)頁源碼進(jìn)行入侵篡改檢測時(shí),直接獲取正則表達(dá)式集合。[0043]S203、根據(jù)正則表達(dá)式集合中的正則表達(dá)式對網(wǎng)頁源碼進(jìn)行字符串匹配檢測,確定篡改檢測結(jié)果。[0044]依次通過正則表達(dá)式集合中的正則表達(dá)式對網(wǎng)頁源碼進(jìn)行字符串匹配,若匹配成[0045]當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁域名時(shí),執(zhí)行S204-S207或執(zhí)行S208-S210確定,篡改檢測結(jié)果。[0047]在本實(shí)施例中,網(wǎng)頁超鏈接集合具體可以理解為網(wǎng)頁的所有超鏈接構(gòu)成的數(shù)據(jù)集合,即所有外鏈集合。如果待檢測網(wǎng)頁信息為網(wǎng)頁域名,此時(shí)進(jìn)行的入侵篡改檢測可以是泛二級域名檢測,也可以是網(wǎng)站域名是否被篡改檢測,對于兩種不同類型的檢測,采用不同的方式進(jìn)行檢測。進(jìn)行泛二級域名檢測,通過S204-S209步驟進(jìn)行檢測;進(jìn)行網(wǎng)站域名是否被[0048]具體的,當(dāng)對網(wǎng)頁域名進(jìn)行泛二級域名檢測時(shí),獲取網(wǎng)頁源碼,并對網(wǎng)頁源碼進(jìn)行分析,得到一個(gè)或者多個(gè)網(wǎng)頁超鏈接,由一個(gè)或者多個(gè)網(wǎng)頁超鏈接構(gòu)成網(wǎng)頁超鏈接集合。[0049]S205、根據(jù)網(wǎng)頁超鏈接集合和網(wǎng)頁域名確定目標(biāo)二級域名。[0050]在本實(shí)施例中,目標(biāo)二級域名具體可以理解為與網(wǎng)頁域名的二級域名不匹配的網(wǎng)頁超鏈接的二級域名。[0051]具體的,分別對網(wǎng)頁超鏈接集合中的網(wǎng)頁超鏈接和網(wǎng)頁域名提取二級域名,并將網(wǎng)頁超鏈接集合和網(wǎng)頁域名的二級域名進(jìn)行循環(huán)匹配,根據(jù)匹配結(jié)果確定目標(biāo)二級域名。[0052]作為本實(shí)施例的一個(gè)可選實(shí)施例,本可選實(shí)施例進(jìn)一步將根據(jù)網(wǎng)頁超鏈接集合和網(wǎng)頁域名確定目標(biāo)二級域名優(yōu)化為:[0053]A1、對網(wǎng)頁超鏈接集合中的網(wǎng)頁超鏈接提取二級域名,得到至少一個(gè)超鏈接二級域名。[0054]在本實(shí)施例中,超鏈接二級域名具體可以理解為網(wǎng)頁超鏈接的二級域名。對網(wǎng)頁超鏈接集合中的每個(gè)網(wǎng)頁超鏈接分別提取二級域名,得到超鏈接二級域名。9[0056]在本實(shí)施例中,網(wǎng)頁二級域名具體可以理解為網(wǎng)頁域名對應(yīng)的二級域名。提取網(wǎng)頁域名的二級域名,得到網(wǎng)頁二級域名。[0057]A3、將各超鏈接二級域名分別與網(wǎng)頁二級域名比較。[0058]對于每個(gè)超鏈接二級域名,分別將其余網(wǎng)頁二級域名進(jìn)行匹配比較,確定超鏈接二級域名與網(wǎng)頁二級域名是否相同。[0059]A4、將比較結(jié)果為不同的超鏈接二級域名確定為目標(biāo)二級域名。[0060]確定比較結(jié)果為不同的超鏈接二級域名,將此部分超鏈接二級域名確定為目標(biāo)二級域名。[0061]S206、統(tǒng)計(jì)目標(biāo)二級域名的數(shù)量。[0063]S208、確定篡改檢測結(jié)果為泛二級域名篡改。[0064]S209、確定篡改檢測結(jié)果為未發(fā)生篡改。[0065]在本實(shí)施例中,第一預(yù)設(shè)數(shù)量閾值具體可以理解為判斷目標(biāo)二級域名的數(shù)量是否在正常范圍內(nèi)的邊界值。第一預(yù)設(shè)數(shù)量閾值可以根據(jù)需求設(shè)置。比較數(shù)量和第一預(yù)設(shè)數(shù)量閾值的大小,當(dāng)數(shù)量大于第一預(yù)設(shè)數(shù)量閾值時(shí),確定篡改檢測結(jié)果為泛二級域名篡改;當(dāng)數(shù)量小于或等于第一預(yù)設(shè)數(shù)量閾值時(shí),確定篡改檢測結(jié)果為未發(fā)生篡改。[0066]S210、將網(wǎng)頁域名通過預(yù)設(shè)的網(wǎng)頁安全接口輸出到域名檢測平臺。[0067]在本實(shí)施例中,網(wǎng)頁安全接口具體可以理解為進(jìn)行網(wǎng)頁入侵篡改檢查,保證網(wǎng)頁安全的接口。域名檢測平臺具體可以進(jìn)行網(wǎng)頁域名是否為篡改檢測的平臺,域名檢測平臺還可以驗(yàn)證網(wǎng)站的其他功能是否準(zhǔn)確。通過網(wǎng)頁安全接口將網(wǎng)頁域名輸出到域名檢測平臺,以使域名檢測平臺進(jìn)行域名檢測。[0068]S211、接收域名檢測平臺返回的域名檢測結(jié)果。[0069]在本實(shí)施例中,域名檢測結(jié)果可以是域名正?;蛴蛎惓?。域名檢測平臺對網(wǎng)頁域名進(jìn)行檢測,驗(yàn)證網(wǎng)頁域名是否正常。[0071]當(dāng)域名檢測結(jié)果為正常時(shí),篡改檢測結(jié)果為未發(fā)生篡改;當(dāng)域名檢測結(jié)果為異常時(shí),篡改檢測結(jié)果為發(fā)生網(wǎng)站域名篡改。[0072]當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁圖片時(shí),執(zhí)行S213-S215,確定篡改檢測結(jié)果。[0073]S213、將網(wǎng)頁圖片輸入到預(yù)確定的圖片檢測網(wǎng)絡(luò)模型中,圖片檢測網(wǎng)絡(luò)模型根據(jù)檢測數(shù)據(jù)集和分類數(shù)據(jù)集進(jìn)行訓(xùn)練得到。[0074]在本實(shí)施例中,圖片檢測網(wǎng)絡(luò)模型具體可以理解為用于識別圖片中存在的對象的神經(jīng)網(wǎng)絡(luò)模型。檢測數(shù)據(jù)集(DetectionDatasets)有很多限制,分類標(biāo)簽的信息太少的數(shù)量小于分類數(shù)據(jù)集(ClassificationDatasets),而且檢測數(shù)據(jù)集的成本太高,使其無法當(dāng)作分類數(shù)據(jù)集進(jìn)行使用。而分類數(shù)據(jù)集卻有著大量的圖片和十分豐富分類信息。本申請?zhí)岢隽艘环N新的訓(xùn)練方法-聯(lián)合訓(xùn)練算法,通過把這檢測數(shù)據(jù)集和分類數(shù)據(jù)集的數(shù)據(jù)混合到一起,使用一種分層的觀點(diǎn)對物體進(jìn)行分類,用巨量的分類數(shù)據(jù)集數(shù)據(jù)來擴(kuò)充檢測數(shù)據(jù)集,從而把兩種不同的數(shù)據(jù)集混合起來。在檢測數(shù)據(jù)集和分類數(shù)據(jù)集上訓(xùn)練物體檢測器(ObjectDetectors),用檢測數(shù)據(jù)集的數(shù)據(jù)學(xué)習(xí)物體的準(zhǔn)確位置,用分類數(shù)據(jù)集的數(shù)據(jù)來增加分類的類別量、提升模型的健壯性。通過檢測數(shù)據(jù)集和分類數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行訓(xùn)練得到圖片檢測網(wǎng)絡(luò)模型,將網(wǎng)頁圖片輸入到圖片檢測網(wǎng)絡(luò)模型中,圖片檢測網(wǎng)絡(luò)模型根據(jù)學(xué)習(xí)到的經(jīng)驗(yàn)對網(wǎng)頁圖片進(jìn)行預(yù)測處理。[0075]作為本實(shí)施例的一個(gè)可選實(shí)施例,本可選實(shí)施例進(jìn)一步優(yōu)化包括了圖片檢測網(wǎng)絡(luò)模型的訓(xùn)練,圖片檢測網(wǎng)絡(luò)模型的訓(xùn)練步驟包括:[0076]B1、獲取檢測數(shù)據(jù)集和分類數(shù)據(jù)集,檢測數(shù)據(jù)集和分類數(shù)據(jù)集中的待訓(xùn)練圖片對應(yīng)關(guān)聯(lián)標(biāo)準(zhǔn)信息,標(biāo)準(zhǔn)信息包括標(biāo)準(zhǔn)位置信息和標(biāo)準(zhǔn)類別信息。[0077]在本實(shí)施例中,待訓(xùn)練圖片具體可以理解為用于進(jìn)行模型訓(xùn)練的圖片;標(biāo)準(zhǔn)信息具體可以理解為待訓(xùn)練圖片中目標(biāo)進(jìn)行標(biāo)注的信息,例如,待訓(xùn)練圖片中包括一只貓、一個(gè)即為標(biāo)準(zhǔn)類別信息;橫坐標(biāo)為30-50像素點(diǎn),縱坐標(biāo)為40-70像素點(diǎn),為標(biāo)準(zhǔn)位置信息。標(biāo)準(zhǔn)位置信息還可以通過其他方式表示,例如,左頂點(diǎn)的坐標(biāo),以及長、寬,由此可以確定矩陣框,矩形框的位置即為目標(biāo)的位置。檢測數(shù)據(jù)集和分類數(shù)據(jù)集中的待訓(xùn)練圖片預(yù)先進(jìn)行標(biāo)[0078]B2、將當(dāng)前迭代下對應(yīng)的待訓(xùn)練圖片輸入到當(dāng)前的待訓(xùn)練網(wǎng)絡(luò)模型中,得到預(yù)測信息,預(yù)測信息包括預(yù)測位置信息和預(yù)測類別信息。[0079]在本實(shí)施例中,待訓(xùn)練網(wǎng)絡(luò)模型具體可以理解為未完成訓(xùn)練的、基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型。預(yù)測信息具體可以理解為模型預(yù)測得到信息,預(yù)測信息包括預(yù)測位置信息進(jìn)而預(yù)測類別信息。[0080]具體的,將當(dāng)前迭代下對應(yīng)的待訓(xùn)練圖片輸入至當(dāng)前的待訓(xùn)練網(wǎng)絡(luò)模型中,待訓(xùn)練網(wǎng)絡(luò)模型根據(jù)當(dāng)前的網(wǎng)絡(luò)參數(shù)進(jìn)行預(yù)測,得到待訓(xùn)練圖片中各目標(biāo)對應(yīng)的預(yù)測位置信息和預(yù)測類別信息。[0081]B3、采用給定的損失函數(shù)表達(dá)式,結(jié)合標(biāo)準(zhǔn)信息和預(yù)測信息,獲得相應(yīng)的損失函[0082]在本實(shí)施例中,損失函數(shù)表達(dá)式可以理解為計(jì)算損失函數(shù)的表達(dá)式,在對待訓(xùn)練網(wǎng)絡(luò)模型進(jìn)行反向傳播時(shí),需要通過損失函數(shù)調(diào)整模型的參數(shù)。損失函數(shù)可以是GAN損失函[0083]具體的,對于每個(gè)待訓(xùn)練圖片,根據(jù)其對應(yīng)的標(biāo)準(zhǔn)信息和預(yù)測信息,采用損失函數(shù)表達(dá)式進(jìn)行計(jì)算,得到對應(yīng)的損失函數(shù)。當(dāng)一個(gè)圖片中有多個(gè)目標(biāo)時(shí),由于每個(gè)目標(biāo)均對應(yīng)標(biāo)準(zhǔn)信息和預(yù)測信息,可以依次計(jì)算每個(gè)目標(biāo)對應(yīng)的損失函數(shù),得到多個(gè)損失函數(shù)后,根據(jù)多個(gè)損失函數(shù)進(jìn)行計(jì)算,得到最終的損失函數(shù),作為此次迭代的損失函數(shù)。[0084]B4、基于損失函數(shù)對待訓(xùn)練網(wǎng)絡(luò)模型進(jìn)行反向傳播,得到用于下一迭代的待訓(xùn)練[0085]在神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過程中,通過反向傳播方法不斷更新調(diào)整模型,直至模型的輸出與目標(biāo)趨于一致。在確定了損失函數(shù)后,利用該損失函數(shù)對待訓(xùn)練網(wǎng)絡(luò)模型進(jìn)行反向傳播,得到滿足收斂條件的圖片檢測網(wǎng)絡(luò)模型。本發(fā)明實(shí)施例對具體的反向傳播過程不做限定,可根據(jù)具體情況進(jìn)行設(shè)置。模型訓(xùn)練完成后,就可以通過圖片檢測網(wǎng)絡(luò)模型實(shí)現(xiàn)對圖片中對象進(jìn)行類別和位置的預(yù)測。[0086]S214、根據(jù)圖片檢測網(wǎng)絡(luò)模型的輸出結(jié)果確定目標(biāo)對象。[0087]在本實(shí)施例中,目標(biāo)對象具體可以理解為網(wǎng)頁圖片中的對象。網(wǎng)頁圖片輸入到圖11片檢測網(wǎng)絡(luò)模型中后,圖片檢測網(wǎng)絡(luò)模型根據(jù)網(wǎng)絡(luò)參數(shù)對網(wǎng)頁圖片進(jìn)行預(yù)測處理,得到存在目標(biāo)對象的位置,以及目標(biāo)對象的類別。[0088]S215、對目標(biāo)對象中的待檢測文字進(jìn)行異常檢測,根據(jù)異常檢測結(jié)果確定篡改檢測結(jié)果。[0089]在本實(shí)施例中,待檢測文字具體可以理解為目標(biāo)對象中包含的文字,例如,目標(biāo)對象為印章,印章中的文字即為待檢測文字。異常檢測結(jié)果可以是文字異常、文字正常。目標(biāo)對象中可能存在待檢測文字,待檢測文字可能是異常文字,例如,包含了負(fù)面信息、不當(dāng)言論等,對待檢測文字進(jìn)行文字是否異常的檢測,根據(jù)異常檢測結(jié)果確定篡改檢測結(jié)果,例[0090]當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁文本信息時(shí),執(zhí)行S216-S219。[0092]在本實(shí)施例中,文本標(biāo)簽為通過HTML設(shè)計(jì)網(wǎng)頁頁面時(shí)的文本標(biāo)簽。在檢測網(wǎng)頁文本信息是否發(fā)生了入侵篡改時(shí),需要獲取網(wǎng)頁源碼,根據(jù)網(wǎng)頁源碼對網(wǎng)頁文本信息進(jìn)行入侵篡改檢測。直接獲取網(wǎng)頁源碼,對網(wǎng)頁源碼進(jìn)行分析,得到網(wǎng)頁源碼中的所有文本標(biāo)簽。[0093]S217、根據(jù)各文本標(biāo)簽和網(wǎng)頁文本信息確定目標(biāo)文本。[0094]在本實(shí)施例中,目標(biāo)文本具體可以理解為從網(wǎng)頁文本信息中篩選出的文本。根據(jù)文本標(biāo)簽確定網(wǎng)頁文本信息中的文本,進(jìn)而對文本的長度進(jìn)行篩選,得到滿足條件的目標(biāo)[0095]作為本實(shí)施例的一個(gè)可選實(shí)施例,本可選實(shí)施例進(jìn)一步將根據(jù)各文本標(biāo)簽和網(wǎng)頁文本信息確定目標(biāo)文本優(yōu)化為:[0096]C1、確定各文本標(biāo)簽在網(wǎng)頁文本信息中所對應(yīng)文本的文本長度。[0097]在本實(shí)施例中,文本長度具體可以理解為文本中所包括數(shù)據(jù)的長度。查找每個(gè)文本標(biāo)簽在網(wǎng)頁文本信息中對應(yīng)的文本,確定各文本的文本長度。[0098]C2、確定各文本長度中滿足預(yù)設(shè)長度條件的目標(biāo)文本長度。[0099]在本實(shí)施例中,預(yù)設(shè)長度條件為預(yù)先設(shè)置的長度范圍,例如2-20。依次判斷每個(gè)文本長度是否滿足預(yù)設(shè)長度條件,若是,確定此文本長度為目標(biāo)文本長度。[0100]C3、將目標(biāo)文本長度對應(yīng)的文本確定為目標(biāo)文本。[0101]確定各目標(biāo)文本長度對應(yīng)的文本,將此部分文本確定為目標(biāo)文本。[0103]在本實(shí)施例中,異常文本具體可以理解為包含異常文字、信息的文本。對各目標(biāo)文本進(jìn)行分析,確定異常文本中的信息是否異常,例如,目標(biāo)文本信息中是否包含過多的敏感[0104]作為本實(shí)施例的一個(gè)可選實(shí)施例,本可選實(shí)施例進(jìn)一步將對各目標(biāo)文本進(jìn)行異常[0105]D1、針對每個(gè)目標(biāo)文本,確定目標(biāo)文本和預(yù)確定的異常文字信息庫的編輯距離。[0106]在本實(shí)施例中,異常文本信息庫具體可以理解為由異常詞、異常句子構(gòu)成的信息庫。編輯距離具體可以理解為由一個(gè)字串轉(zhuǎn)成另一個(gè)字串所需的最少編輯操作次數(shù)。許可的編輯操作包括將一個(gè)字符替換成另一個(gè)字符,插入一個(gè)字符,刪除一個(gè)字符。對于每個(gè)目標(biāo)文本,通過序列比對等方式計(jì)算此目標(biāo)文本中各詞或句子與異常文字信息庫的編輯距離。計(jì)算編輯距離的方式可通過機(jī)器學(xué)習(xí)建模進(jìn)行計(jì)算。[0107]D2、統(tǒng)計(jì)編輯距離滿足預(yù)設(shè)距離條件的異常詞數(shù)量。[0108]在本實(shí)施例中,異常詞數(shù)量具體可以理解為異常詞的數(shù)量。預(yù)設(shè)距離條件具體可以理解為預(yù)先設(shè)定的距離范圍條件,例如,大于0.75.比較目標(biāo)文本中每個(gè)詞或句子對應(yīng)的編輯距離與預(yù)設(shè)距離條件,確定滿足預(yù)設(shè)距離條件的編輯距離,此部分編輯距離對應(yīng)的詞或句子為異常詞,統(tǒng)計(jì)異常詞的數(shù)量得到異常詞數(shù)量。[0109]D3、當(dāng)異常詞數(shù)量大于第三預(yù)設(shè)數(shù)量閾值時(shí),確定目標(biāo)文本為異常文本。[0110]在本實(shí)施例中,第三預(yù)設(shè)數(shù)量閾值具體可以理解為用于判斷目標(biāo)文本是否異常的數(shù)量閾值,可根據(jù)需求預(yù)先設(shè)置。比較異常詞數(shù)量與第三預(yù)設(shè)數(shù)量閾值的大小,當(dāng)異常詞數(shù)量大于第三預(yù)設(shè)數(shù)量閾值時(shí),確定目標(biāo)文本為異常文本,可能發(fā)生篡改;異常詞數(shù)量小于或等于第三預(yù)設(shè)數(shù)量閾值時(shí),確定目標(biāo)文本為正常文本,未發(fā)生篡改。[0112]S220、確定篡改檢測結(jié)果為網(wǎng)頁篡改。[0113]S221、確定篡改檢測結(jié)果為未發(fā)[0114]在本實(shí)施例中,第二預(yù)設(shè)數(shù)量閾值具體可以理解為判斷異常文本的數(shù)量是否符合要求的閾值。本申請中的第一預(yù)設(shè)數(shù)量閾值、第二預(yù)設(shè)數(shù)量閾值和第三預(yù)設(shè)數(shù)量閾值的取值可以相同,也可以不同,在實(shí)際應(yīng)用中根據(jù)需求設(shè)置即可。統(tǒng)計(jì)異常文本的數(shù)量,并比較異常文本的數(shù)量和第二預(yù)設(shè)數(shù)量閾值的大小。當(dāng)異常文本的數(shù)量大于第二預(yù)設(shè)數(shù)量閾值時(shí),確定篡改檢測結(jié)果為網(wǎng)頁篡改。[0115]通過對常見文字篡改行為進(jìn)行分析,提取被篡改文本的特征,形成異常文字信息庫。利用機(jī)器學(xué)習(xí)技術(shù)對網(wǎng)頁文字內(nèi)容進(jìn)行建模,自動判斷文本是否被惡意篡改。并且可設(shè)置預(yù)警方式,在網(wǎng)頁文本信息發(fā)生篡改后進(jìn)行預(yù)警,輸出篡改信息及危險(xiǎn)度評分。對文字的篡改可能發(fā)生在頁面的任何地方,被篡改的形式也多種多樣,本申請實(shí)施例能夠自動檢測多種文字被篡改的形式。[0116]作為本實(shí)施例的一個(gè)可選實(shí)施例,本可選實(shí)施例進(jìn)一步優(yōu)化包括:根據(jù)至少一個(gè)篡改檢測結(jié)果生成預(yù)警工單,并發(fā)送至對應(yīng)的用戶。[0117]在本實(shí)施例中,預(yù)警工單具體可以理解為對用戶進(jìn)行預(yù)警的工單,用于提醒用戶網(wǎng)站已經(jīng)被篡改,及時(shí)處理以保證網(wǎng)站安全。本申請實(shí)施例中的用戶可以是待檢測網(wǎng)站對應(yīng)的管理人員、維護(hù)人員等。預(yù)先選擇待檢測網(wǎng)站對應(yīng)關(guān)聯(lián)的用戶。當(dāng)至少有一個(gè)或超過預(yù)設(shè)數(shù)量的篡改檢測結(jié)果為發(fā)生篡改時(shí),生成預(yù)警工單下發(fā)給對應(yīng)的用戶。預(yù)警工單中可以包括發(fā)生篡改的類型,例如,泛二級域名發(fā)生篡改,以便用戶可以及時(shí)確定篡改類型,執(zhí)行相應(yīng)的處理。發(fā)送的方式可以設(shè)置為發(fā)送至郵箱、通過短信發(fā)送至手機(jī)、或者通過作業(yè)系統(tǒng)發(fā)送給對應(yīng)的賬號。同時(shí),根據(jù)篡改檢測結(jié)果還可以生成運(yùn)營報(bào)告。[0118]進(jìn)一步地,圖4為本申請實(shí)施例提供的一種網(wǎng)站入侵篡改檢測方法的實(shí)現(xiàn)示例圖。[0121]采集網(wǎng)絡(luò)數(shù)據(jù)的方式可以是通過爬蟲的方式進(jìn)行采集。[0122]S303、從網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)頁數(shù)據(jù)文件。CN114117299B[0123]S304、從網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)頁源碼文件。[0124]S305、從網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)頁截圖文件。[0125]S306、根據(jù)網(wǎng)頁源碼文件和網(wǎng)頁數(shù)據(jù)文件可以得到網(wǎng)頁URL、網(wǎng)頁域名、網(wǎng)頁標(biāo)簽、網(wǎng)頁關(guān)鍵字、網(wǎng)頁描述、網(wǎng)頁短文本、短文本超鏈接、網(wǎng)頁文本集合、網(wǎng)頁鏈接集合,即包括了網(wǎng)頁源碼、網(wǎng)頁域名和網(wǎng)頁文本信息。[0126]S307、根據(jù)網(wǎng)頁URL、網(wǎng)頁域名、網(wǎng)頁標(biāo)簽、網(wǎng)頁關(guān)鍵字、網(wǎng)頁描述、網(wǎng)頁短文本、短文本超鏈接、網(wǎng)頁文本集合、網(wǎng)頁鏈接集合,得到網(wǎng)頁URL、網(wǎng)頁域名和網(wǎng)頁鏈接集合。[0128]S309、丟棄數(shù)據(jù)。[0129]S310、進(jìn)行植入鏈檢測。植入鏈檢測包括:網(wǎng)站檢測、泛二級域名檢測和正則表達(dá)式檢測,并執(zhí)行S322。[0130]其中,網(wǎng)站檢測即為通過域名檢測平臺對網(wǎng)頁域名進(jìn)行檢測,得到檢測結(jié)果。泛二級域名檢測即為通過網(wǎng)頁超鏈接集合和網(wǎng)頁域名確定二級域名進(jìn)行檢測,得到檢測結(jié)果。正則表達(dá)式檢測即為通過正則表達(dá)式對網(wǎng)頁源碼進(jìn)行檢測,得到檢測結(jié)果。[0131]S311、根據(jù)網(wǎng)頁URL、網(wǎng)頁域名、網(wǎng)頁標(biāo)簽、網(wǎng)頁關(guān)鍵字、網(wǎng)頁描述、網(wǎng)頁短文本、短文本超鏈接、網(wǎng)頁文本集合、網(wǎng)頁鏈接集合,得到網(wǎng)頁短文本、短文本超鏈接。[0132]S312、判斷網(wǎng)頁短文本、短文本超鏈接是否包含中文,若是,執(zhí)行S313;否則,執(zhí)行[0133]在網(wǎng)頁短文本、短文本超鏈接包含中文的情況下,確定文本標(biāo)簽在網(wǎng)頁文本信息中所對應(yīng)文本的文本長度。[0134]S313、判斷文本長度是否滿足預(yù)設(shè)長度條件,若否,執(zhí)行S314;否則,執(zhí)行S315。[0135]確定文本長度滿足預(yù)設(shè)長度條件的目標(biāo)文本長度,并將目標(biāo)文本長度對應(yīng)的文本確定為目標(biāo)文本。[0136]S314、丟棄數(shù)據(jù)。[0137]S315、對目標(biāo)文本進(jìn)行異常檢測,確定異常文本。[0138]S316、對異常文本的數(shù)量與第二預(yù)設(shè)數(shù)量閾值進(jìn)行比較,得到篡改檢測結(jié)果,并執(zhí)行S322。[0139]S317、根據(jù)網(wǎng)頁截圖文件獲取網(wǎng)頁圖片。[0140]S318、判斷網(wǎng)頁圖片是否有效,若否,執(zhí)行S319;否則,執(zhí)行S320。[0141]S319、丟棄數(shù)據(jù)。[0142]S320、對網(wǎng)頁圖片進(jìn)行檢測。[0143]對網(wǎng)頁圖片進(jìn)行檢測的方式可以是通過圖片檢測網(wǎng)絡(luò)模型進(jìn)行檢測。[0144]S321、得到篡改檢測結(jié)果,并執(zhí)行S322。[0145]S322、對篡改檢測結(jié)果進(jìn)行匯總。[0146]S323、輸出檢測結(jié)果,分別執(zhí)行S324和S325。[0147]S324、生成運(yùn)營報(bào)告。[0148]S325、生成預(yù)警工單并下發(fā)。[0150]本發(fā)明實(shí)施例提供了一種網(wǎng)站入侵篡改檢測方法,通過獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,所述網(wǎng)頁信息集合至少包括以下至少一種網(wǎng)頁信息:網(wǎng)頁源碼、網(wǎng)頁域名、網(wǎng)頁圖片和網(wǎng)頁文本信息;從所述網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,并確定篡改檢測結(jié)果。通過獲取網(wǎng)頁信息集合,對網(wǎng)頁信息集合中的待檢測網(wǎng)頁信息進(jìn)行入侵篡改檢測,保證待檢測網(wǎng)站的安全性。根據(jù)待檢測網(wǎng)頁信息的信息類型選擇合適的檢測方式,對待檢測網(wǎng)站進(jìn)行不同角度的檢測,提高檢測結(jié)果的準(zhǔn)確性。并且檢測過程中通過檢測數(shù)據(jù)集合分類數(shù)據(jù)集訓(xùn)練得到圖片潔廁網(wǎng)絡(luò)模型,既保證位置預(yù)測的準(zhǔn)確性,又可以增加分類的類別量,提升模型的健壯性,從而提高入侵篡改檢測的準(zhǔn)確性。[0151]實(shí)施例三[0152]圖5為本發(fā)明實(shí)施例三提供的一種網(wǎng)站入侵篡改檢測裝置的結(jié)構(gòu)示意圖,該裝置包括:信息集獲取模塊41和檢測模塊42。[0153]其中,信息集獲取模塊41,用于獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,所述網(wǎng)頁信息集合至少包括以下至少一種網(wǎng)頁信息:網(wǎng)頁源碼、網(wǎng)[0154]檢測模塊42,用于從所述網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,并確定篡改檢測結(jié)果。[0155]本發(fā)明實(shí)施例提供了一種網(wǎng)站入侵篡改檢測裝置,通過獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,所述網(wǎng)頁信息集合至少包括以下至少一種網(wǎng)頁片和網(wǎng)頁文本信息;從所述網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,并確定篡改檢測結(jié)果。通過獲取網(wǎng)頁信息集合,對網(wǎng)頁信息集合中的待檢測網(wǎng)頁信息進(jìn)行入侵篡改檢測,保證待檢測網(wǎng)站的安全性。根據(jù)待檢測網(wǎng)頁信息的信息類型選擇合適的檢測方式,對待檢測網(wǎng)站進(jìn)行不同角度的檢測,提高檢測結(jié)果的準(zhǔn)確性。[0157]表達(dá)式獲取單元,用于獲取預(yù)確定的正則表達(dá)式集合;[0158]匹配檢測單元,用于根據(jù)所述正則表達(dá)式集合中的正則表達(dá)式對所述網(wǎng)頁源碼進(jìn)行字符串匹配檢測,確定篡改檢測結(jié)果。[0159]進(jìn)一步地,當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁域名時(shí),檢測模塊42包括:[0161]二級域名確定單元,用于根據(jù)所述網(wǎng)頁超鏈接集合和網(wǎng)頁域名確定目標(biāo)二級域[0162]數(shù)量確定單元,用于統(tǒng)計(jì)所述目標(biāo)二級域名的[0163]二級域名檢測單元,用于判斷所述數(shù)量是否大于第一預(yù)設(shè)數(shù)量閾值時(shí),若是篡改檢測結(jié)果為泛二級域名篡改;否則,確定篡改檢測結(jié)果為未發(fā)生篡改。[0164]進(jìn)一步地,二級域名確定單元,具體用于對所述網(wǎng)頁超鏈接集合中的網(wǎng)頁超鏈接提取二級域名,得到至少一個(gè)超鏈接二級域名;對所述網(wǎng)頁域名提取二級域名,得到網(wǎng)頁二級域名;將各所述超鏈接二級域名分別與網(wǎng)頁二級域名比較;將比較結(jié)果為不同的超鏈接二級域名確定為目標(biāo)二級域名。[0166]域名輸出單元,用于將所述網(wǎng)頁域名通過預(yù)設(shè)的網(wǎng)頁安全接口輸出到域名檢測平[0167]檢測結(jié)果接收單元,用于接收所述域名檢測平臺返回的域名檢測結(jié)果;[0168]檢測結(jié)果分析單元,用于對所述域名檢測結(jié)果進(jìn)行分析,確定篡改檢測結(jié)果。[0169]進(jìn)一步地,當(dāng)所述待檢測網(wǎng)頁信息為網(wǎng)頁圖片時(shí),檢測模塊42包括:[0170]模型輸入單元,用于將所述網(wǎng)頁圖片輸入到預(yù)確定的圖片檢測網(wǎng)絡(luò)模型中,所述圖片檢測網(wǎng)絡(luò)模型根據(jù)檢測數(shù)據(jù)集和分類數(shù)據(jù)集進(jìn)行訓(xùn)練得到;[0171]模型輸出單元,用于根據(jù)所述圖片檢測網(wǎng)絡(luò)模型的輸出結(jié)果確定目標(biāo)對象;[0172]異常檢測單元,用于對所述目標(biāo)對象中的待檢測文字進(jìn)行異常檢測,根據(jù)異常檢測結(jié)果確定篡改檢測結(jié)果。[0174]數(shù)據(jù)集獲取模塊,用于獲取檢測數(shù)據(jù)集和分類數(shù)據(jù)集,所述檢測數(shù)據(jù)集和分類數(shù)據(jù)集中的待訓(xùn)練圖片對應(yīng)關(guān)聯(lián)標(biāo)準(zhǔn)信息,所述標(biāo)準(zhǔn)信息包括標(biāo)準(zhǔn)位置信息和標(biāo)準(zhǔn)類別信[0175]預(yù)測信息確定模塊,用于將當(dāng)前迭代下對應(yīng)的待訓(xùn)練圖片輸入到當(dāng)前的待訓(xùn)練網(wǎng)絡(luò)模型中,得到預(yù)測信息,所述預(yù)測信息包括預(yù)測位置信息和預(yù)測類別信息;[0176]損失函數(shù)確定模塊,用于采用給定的損失函數(shù)表達(dá)式,結(jié)合所述標(biāo)準(zhǔn)信息和預(yù)測[0177]反向傳播模塊,用于基于所述損失函數(shù)對所述待訓(xùn)練網(wǎng)絡(luò)模型進(jìn)行反向傳播,得到用于下一迭代的待訓(xùn)練網(wǎng)絡(luò)模型,直至滿足迭代收斂條件,得到圖片檢測網(wǎng)絡(luò)模型。[0180]目標(biāo)文本確定單元,用于根據(jù)各所述文本標(biāo)簽和網(wǎng)頁文本信息確定目標(biāo)文本;[0181]異常文本確定單元,用于對各所述目標(biāo)文本進(jìn)行異常檢測,確定異常文本;[0182]篡改檢測單元,用于判斷所述異常文本的數(shù)量是否大于第二預(yù)設(shè)數(shù)量閾值,若是,確定篡改檢測結(jié)果為網(wǎng)頁篡改;否則,確定篡改檢測結(jié)果為未發(fā)生篡改。[0183]進(jìn)一步地,目標(biāo)文本確定單元,具體用于確定各所述文本標(biāo)簽在網(wǎng)頁文本信息中所對應(yīng)文本的文本長度;確定各所述文本長度中滿足預(yù)設(shè)長度條件的目標(biāo)文本長度;將所述目標(biāo)文本長度對應(yīng)的文本確定為目標(biāo)文本。[0184]進(jìn)一步地,異常文本確定單元,具體用于針對每個(gè)目標(biāo)文本,確定所述目標(biāo)文本和預(yù)確定的異常文字信息庫的編輯距離;統(tǒng)計(jì)所述編輯距離滿足預(yù)設(shè)距離條件的異常詞數(shù)量;當(dāng)異常詞數(shù)量大于第三預(yù)設(shè)數(shù)量閾值時(shí),確定所述目標(biāo)文本為異常文本。[0186]工單發(fā)送模塊,用于根據(jù)至少一個(gè)篡改檢測結(jié)果生成預(yù)警工單,并發(fā)送至對應(yīng)的[0187]本發(fā)明實(shí)施例所提供的網(wǎng)站入侵篡改檢測裝置可執(zhí)行本發(fā)明任意實(shí)施例所提供的網(wǎng)站入侵篡改檢測方法,具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。[0188]實(shí)施例四[0189]圖6為本發(fā)明實(shí)施例四提供的一種計(jì)算機(jī)設(shè)備的結(jié)構(gòu)示意圖,如圖6所示,該設(shè)備包括處理器50、存儲器51、輸入裝置52和輸出裝置53;設(shè)備中處理器50的數(shù)量可以是一個(gè)或多個(gè),圖6中以一個(gè)處理器50為例;設(shè)備中的處理器5可以通過總線或其他方式連接,圖6中以通過總線連接為例。[0190]存儲器51作為一種計(jì)算機(jī)可讀存儲介質(zhì),可用于存儲軟件程序、計(jì)算機(jī)可執(zhí)行程序以及模塊,如本發(fā)明實(shí)施例中的網(wǎng)站入侵篡改檢測方法對應(yīng)的程序指令/模塊(例如,網(wǎng)站入侵篡改檢測裝置中的信息集獲取模塊41和檢測模塊42)。處理器50通過運(yùn)行存儲在存儲器51中的軟件程序、指令以及模塊,從而執(zhí)行設(shè)備的各種功能應(yīng)用以及數(shù)據(jù)處理,即實(shí)現(xiàn)上述的網(wǎng)站入侵篡改檢測方法。[0191]存儲器51可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個(gè)功能所需的應(yīng)用程序;存儲數(shù)據(jù)區(qū)可存儲根據(jù)終端的使用所創(chuàng)建的數(shù)據(jù)等。此外,存儲器51可以包括高速隨機(jī)存取存儲器,還可以包括非易失性存儲器,例如至少一個(gè)磁盤存儲器件、閃存器件、或其他非易失性固態(tài)存儲器件。在一些實(shí)例中,存儲器51可進(jìn)一步包括相對于處理器50遠(yuǎn)程設(shè)置的存儲器,這些遠(yuǎn)程存儲器可以通過網(wǎng)絡(luò)連接至設(shè)備。上述[0192]輸入裝置52可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與設(shè)備的用戶設(shè)置以及功能控制有關(guān)的鍵信號輸入。輸出裝置53可包括顯示屏等顯示設(shè)備。[0193]實(shí)施例五[0194]本發(fā)明實(shí)施例五還提供一種包含計(jì)算機(jī)可執(zhí)行指令的存儲介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令在由計(jì)算機(jī)處理器執(zhí)行時(shí)用于執(zhí)行一種網(wǎng)站入侵篡改檢測方法,該方法包括:[0195]獲取待檢測網(wǎng)站的網(wǎng)頁信息集合,所述網(wǎng)頁信息集合至少包括以下至少一種網(wǎng)頁[0196]從所述網(wǎng)頁信息集合中選擇待檢測網(wǎng)頁信息,確定所述待檢測網(wǎng)頁信息對應(yīng)的檢測方式并進(jìn)行相應(yīng)的篡改檢測,確定篡改檢測結(jié)果。[0197]當(dāng)然,本發(fā)明實(shí)施例所提供的一種包含計(jì)算機(jī)可執(zhí)行指令的存儲介質(zhì),其計(jì)算機(jī)可執(zhí)行指令不限于如上所述的方法操作,還可以執(zhí)行本發(fā)明任意實(shí)施例所提供的網(wǎng)站入侵篡改檢測方法中的相關(guān)操作。[0198]通過以上關(guān)于實(shí)施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,本發(fā)明可借助軟

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論