版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
(19)國(guó)家知識(shí)產(chǎn)權(quán)局(12)發(fā)明專利(10)授權(quán)公告號(hào)CN115564456B(65)同一申請(qǐng)的已公布的文獻(xiàn)號(hào)(73)專利權(quán)人山西大學(xué)地址030006山西省太原市塢城路92號(hào)(72)發(fā)明人杜航原曹振武王文劍白亮梁吉業(yè)(74)專利代理機(jī)構(gòu)太原申立德知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙)14115專利代理師郭海燕GO6N3/0455(2023.01)杜航原.融合知識(shí)的多視圖屬性網(wǎng)絡(luò)異常檢測(cè)模型.自動(dòng)化學(xué)報(bào).2023,第49卷(第8期),全曹振武.基于知識(shí)融合的網(wǎng)絡(luò)異常檢測(cè)方法研究.碩士電子期刊出版.2024,全文.審查員張力(54)發(fā)明名稱一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法及系統(tǒng)本發(fā)明涉及互聯(lián)網(wǎng)電商領(lǐng)域,為了提高異常產(chǎn)品檢測(cè)的有效性和可靠性,公開了一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法及系統(tǒng)。所述方法包括領(lǐng)域知識(shí)圖譜數(shù)據(jù)預(yù)處理環(huán)節(jié)、電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型構(gòu)建及優(yōu)化環(huán)節(jié)和電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)結(jié)果輸出及處理環(huán)節(jié)。本發(fā)明結(jié)合TransR模型獲得的領(lǐng)域知識(shí)圖譜中產(chǎn)品的知識(shí)和電商網(wǎng)絡(luò)拓?fù)錁?gòu)造其孿生網(wǎng)絡(luò),在多視圖編碼器分別對(duì)電商網(wǎng)絡(luò)和孿生網(wǎng)絡(luò)進(jìn)行編碼后,通過聚合器實(shí)現(xiàn)了對(duì)產(chǎn)品領(lǐng)域知識(shí)的有效融合,最終,依據(jù)解碼的誤差為每個(gè)產(chǎn)品計(jì)算一個(gè)異常分?jǐn)?shù)來(lái)評(píng)估其異常程度,進(jìn)而完成異常產(chǎn)品的檢測(cè)和識(shí)別。本能。電商網(wǎng)絡(luò)領(lǐng)域知識(shí)電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜數(shù)據(jù)構(gòu)建電商網(wǎng)絡(luò)的李構(gòu)建電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型求解電商網(wǎng)絡(luò)異常產(chǎn)品結(jié)果輸出電商網(wǎng)絡(luò)數(shù)據(jù)流程方向21.一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法,其特征在于,包括以下步驟:S10、面向電商網(wǎng)絡(luò)中的產(chǎn)品采集所有相關(guān)三元組,并進(jìn)行數(shù)據(jù)清洗以構(gòu)成領(lǐng)域知識(shí)圖S20、對(duì)步驟S10獲取的知識(shí)圖譜應(yīng)用TransR模型,獲得產(chǎn)品領(lǐng)域知識(shí)的嵌入向量,并依據(jù)電商網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)構(gòu)造其孿生網(wǎng)絡(luò);S30、基于步驟S20中獲得的孿生網(wǎng)絡(luò),利用圖自編碼器和圖注意力網(wǎng)絡(luò)構(gòu)建電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型;S40、對(duì)于步驟S30構(gòu)建的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型,通過迭代計(jì)算方式對(duì)模型進(jìn)行S50、利用步驟S30構(gòu)建的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型,以及步驟S40確定的模型參數(shù),將異常產(chǎn)品檢測(cè)結(jié)果進(jìn)行輸出,并對(duì)異常產(chǎn)品進(jìn)行處理;所述步驟S20包括以下具體步驟:S21、將電商網(wǎng)絡(luò)數(shù)據(jù)表示為屬性網(wǎng)絡(luò)G=(V,E,X),電商網(wǎng)絡(luò)中的產(chǎn)品表示為屬性網(wǎng)絡(luò)中產(chǎn)品節(jié)點(diǎn),產(chǎn)品之間的共同購(gòu)買關(guān)系表示為產(chǎn)品節(jié)點(diǎn)之間的邊;其中,V={v;li=1,2,...,n}表示網(wǎng)絡(luò)中n個(gè)產(chǎn)品節(jié)點(diǎn)構(gòu)成的集合,v;表示第i個(gè)產(chǎn)品對(duì)應(yīng)的節(jié)點(diǎn),每個(gè)產(chǎn)品節(jié)點(diǎn)具有d絡(luò)中所有邊構(gòu)成的集合,e(i,j)為產(chǎn)品節(jié)點(diǎn)v和v;之間的邊,表示有用戶同時(shí)購(gòu)買了這兩個(gè)節(jié)點(diǎn)代表的產(chǎn)品,屬性網(wǎng)絡(luò)共包含|E|=m條邊;X∈R”d為所有產(chǎn)品節(jié)點(diǎn)的屬性向量組成的=1,否則A?=0;S22、對(duì)于S13獲得的領(lǐng)域知識(shí)圖譜中的每個(gè)三元組(h,r,t),將其頭實(shí)體與尾實(shí)體的嵌入分別記作h和t,令r表示實(shí)體間關(guān)系的嵌入,并對(duì)關(guān)系r設(shè)置一個(gè)映射矩陣M將實(shí)體從實(shí)體空間投影到相應(yīng)的關(guān)系空間,分別獲得頭實(shí)體投影向量h和尾實(shí)體投影向量t,如式(1)S23、進(jìn)一步地,在投影實(shí)體之間建立轉(zhuǎn)換,通過式(3)(3)的得分函數(shù)計(jì)算頭、尾實(shí)體投影向量之間的距離,以此來(lái)衡量事實(shí)成立的可能性:其中,f(h,t)表示頭實(shí)體h和尾實(shí)體t之間的距離得分;S24、通過迭代步驟S22和S23對(duì)三元組的嵌入不斷更新,并從嵌入結(jié)果中抽取電商網(wǎng)絡(luò)中產(chǎn)品對(duì)應(yīng)實(shí)體的知識(shí)嵌入,構(gòu)建屬性網(wǎng)絡(luò)的領(lǐng)域知識(shí)矩陣,記作K∈R,其中k∈K表示產(chǎn)品節(jié)點(diǎn)v的知識(shí)特征;S25、基于屬性網(wǎng)絡(luò)9=(V,E,X)的拓?fù)浣Y(jié)構(gòu)A和領(lǐng)域知識(shí)矩陣K構(gòu)造屬性網(wǎng)絡(luò)的孿生網(wǎng)2.根據(jù)權(quán)利要求1所述的一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法,其特征在于,該方法所述步驟S10包含以下具體步驟:3S11、對(duì)于電商網(wǎng)絡(luò)中的每個(gè)產(chǎn)品,使用SPARQL語(yǔ)句從DBpedia知識(shí)圖譜中依據(jù)頭實(shí)體或尾實(shí)體進(jìn)行匹配,為該產(chǎn)品抽取所有相關(guān)三元組;S12、對(duì)步驟S11獲得的三元組進(jìn)行清洗,剔除頭實(shí)體或尾實(shí)體為圖片鏈接、其他語(yǔ)種表示的同義實(shí)體或者為文本信息的三元組,降低由于三元組的冗余和噪聲對(duì)檢測(cè)結(jié)果可能造成的影響;S13、使用步驟S12預(yù)處理后三元組構(gòu)成領(lǐng)域知識(shí)圖譜,記作T=(N,R,T),其中,N為實(shí)體的集合,R為關(guān)系的集合,R中的關(guān)系連接兩個(gè)實(shí)體構(gòu)成三元組(h,r,t)∈T,h∈N為頭實(shí)體,t∈N為尾實(shí)體,r為實(shí)體間關(guān)系,T表示三元組的集合,每個(gè)三元組分別描述現(xiàn)實(shí)世界中關(guān)于產(chǎn)品的一條知識(shí)。3.根據(jù)權(quán)利要求2所述的一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法,其特征在于,該方法所述步驟S30中的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型包含由屬性編碼器和知識(shí)編碼器組成的多視圖編碼1)屬性編碼器由兩個(gè)注意力層堆疊而成,在屬性視圖下將屬性網(wǎng)絡(luò)9=(V,E,X)編碼為隱空間中的產(chǎn)品節(jié)點(diǎn)低維嵌入;其中,第一層使用多頭注意力機(jī)制,第二層使用單頭注意力機(jī)制,編碼過程的形式化表示如式(4)所示:式中,Zg∈R”為屬性編碼器輸出的隱空間中產(chǎn)品節(jié)點(diǎn)低維嵌入,h′為產(chǎn)品節(jié)點(diǎn)嵌入的力層,在對(duì)屬性網(wǎng)絡(luò)中產(chǎn)品節(jié)點(diǎn)的鄰域信息進(jìn)行聚合的過程中,圖注意力機(jī)制對(duì)鄰域內(nèi)各產(chǎn)品節(jié)點(diǎn)賦予了不同的注意力系數(shù);產(chǎn)品節(jié)點(diǎn)v?與其鄰居之間的注意力系數(shù)由式(5)計(jì)算:產(chǎn)品節(jié)點(diǎn)v的一階鄰居節(jié)點(diǎn)集合;WaER“×是作用到每個(gè)產(chǎn)品節(jié)點(diǎn)上的可學(xué)習(xí)權(quán)重矩陣,I表示拼接操作,c∈R2為權(quán)重向量;LeakyReLU(·)函數(shù)如式(6)定義:為了使產(chǎn)品節(jié)點(diǎn)之間的注意力系數(shù)易于比較,接下來(lái)通過式(7)對(duì)注意力系數(shù)進(jìn)行歸一化:數(shù)與鄰居產(chǎn)品節(jié)點(diǎn)輸入特征的線性組合得到產(chǎn)品節(jié)點(diǎn)v;在單頭注意力圖注意力層的輸出其中,x;'表示單頭注意力下的圖注意力層輸出的產(chǎn)品節(jié)點(diǎn)v?的嵌入,σ(·)為激活函4以上步驟通過單頭注意力機(jī)制聚合鄰域信息對(duì)產(chǎn)品節(jié)點(diǎn)嵌入進(jìn)行了更新;進(jìn)一步地,為了增強(qiáng)模型泛化能力,在圖注意力層中引入多頭注意力機(jī)制,通過多個(gè)相互獨(dú)立的單頭注意力網(wǎng)絡(luò)分別計(jì)算出一組注意力系數(shù),再通過式(9)將多個(gè)嵌入結(jié)果進(jìn)行拼接,得到產(chǎn)品節(jié)點(diǎn)v;在多頭注意力圖注意力層的輸出特征:其中,x,"為具有多頭注意力的圖注意力層輸出的產(chǎn)品節(jié)點(diǎn)v;的嵌入;P表示單頭注意力網(wǎng)絡(luò)的數(shù)量,α”表示第p個(gè)注意力網(wǎng)絡(luò)計(jì)算得到的注意力系數(shù),W表示第p個(gè)注意力網(wǎng)絡(luò)的權(quán)重矩陣;G′=(V,E,K)編碼為隱空間中產(chǎn)品節(jié)點(diǎn)的低維嵌入,其構(gòu)成如式(10)所示:其中,Zg,∈R為知識(shí)編碼器輸出的產(chǎn)品節(jié)點(diǎn)在隱空間中的低維嵌入,函數(shù)g?(·,·)和3)聚合器對(duì)不同視圖下的網(wǎng)絡(luò)嵌入進(jìn)行融合,進(jìn)而獲得網(wǎng)絡(luò)中產(chǎn)品節(jié)點(diǎn)的多視圖統(tǒng)一嵌入;可以采用兩種視圖聚合策略中的任一種,具體如下:(1)拼接聚合器:對(duì)兩個(gè)視圖的產(chǎn)品節(jié)點(diǎn)嵌入進(jìn)行縱向拼接,形成一個(gè)維度更高的向U=concat(Zg,Zg)(11)其中,concat(·)表示縱向拼接操作,U∈RM(2)表示拼接聚合后形成的多視圖統(tǒng)一嵌(2)加和聚合器:將兩個(gè)視圖的嵌入按照對(duì)應(yīng)位置相加的方式,獲得一個(gè)同維度的新向式中,U∈R×為使用加和聚合器獲得的多視圖統(tǒng)一嵌入;4)解碼器包括結(jié)構(gòu)解碼器和特征解碼器,其中:結(jié)構(gòu)解碼器通過計(jì)算產(chǎn)品節(jié)點(diǎn)統(tǒng)一嵌入間的內(nèi)積實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)拓?fù)涞闹貥?gòu),如式(13)所其中,A為結(jié)構(gòu)解碼器輸出的重構(gòu)后的網(wǎng)絡(luò)鄰接矩陣,U為采用任一種聚合器獲得的產(chǎn)品節(jié)點(diǎn)的多視圖統(tǒng)一嵌入,sigmoid(·)函數(shù)如式(14)定義:特征解碼器使用兩層全連接網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)產(chǎn)品節(jié)點(diǎn)特征的重構(gòu),如式(15)所示:其中,X為重構(gòu)后的產(chǎn)品節(jié)點(diǎn)的特征信息,W和b(1分別表示第1個(gè)全連接層的參數(shù)矩5陣和偏置向量,1∈{1,2};該解碼器輸出的產(chǎn)品節(jié)點(diǎn)特征是對(duì)屬性信息和領(lǐng)域知識(shí)兩部分信息在同一特征空間中的重構(gòu);5)檢測(cè)器利用產(chǎn)品節(jié)點(diǎn)在結(jié)構(gòu)和特征兩個(gè)維度的重構(gòu)誤差作為評(píng)價(jià)產(chǎn)品異常分?jǐn)?shù)的重要依據(jù),具體異常評(píng)分函數(shù)如式(16)所示:式中,score(v;)為產(chǎn)品節(jié)點(diǎn)v;的異常分?jǐn)?shù),用于反映第i個(gè)產(chǎn)品的異常程度,其取值越大表明產(chǎn)品的異常程度越高;a表示產(chǎn)品節(jié)點(diǎn)v在屬性網(wǎng)絡(luò)中的拓?fù)浣Y(jié)構(gòu),和@分別為解征和拓?fù)浣Y(jié)構(gòu)兩部分重構(gòu)誤差在異常分?jǐn)?shù)中的比重。4.根據(jù)權(quán)利要求3所述的一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法,其特征在于,該方法所述步驟S40包括以下具體步驟:S41、為S30建立的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型建立式(17)所示的聯(lián)合目標(biāo)函數(shù):由于解碼器的輸入為經(jīng)聚合器融合后的統(tǒng)一嵌入,因此在計(jì)算特征重構(gòu)誤差時(shí)將屬性網(wǎng)絡(luò)與孿生網(wǎng)絡(luò)中的屬性作為共同參照;C為結(jié)構(gòu)重構(gòu)誤差,由式(19)定義:S42、對(duì)步驟S30中的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型進(jìn)行初始化,初始化編碼器參數(shù)Wenc和c,解碼器參數(shù)W.ec和b,隱藏層嵌入維度dim,注意力頭數(shù)nheads,平衡系數(shù)λ,迭代次數(shù)epoch和學(xué)習(xí)率learningrate;迭代執(zhí)行步驟S43~S48,直到達(dá)到迭代次數(shù),完成對(duì)電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型的訓(xùn)S43、將S13獲取的領(lǐng)域知識(shí)圖譜T作為輸入,按式(1)、式(2)和式(3)學(xué)習(xí)實(shí)體的知識(shí)嵌入,抽取電商網(wǎng)絡(luò)中產(chǎn)品對(duì)應(yīng)的實(shí)體知識(shí)向量組成領(lǐng)域知識(shí)矩陣K,并結(jié)合屬性網(wǎng)絡(luò)G=(V,E,X)的拓?fù)浣Y(jié)構(gòu)構(gòu)造孿生網(wǎng)絡(luò)9′=(V,E,K);S44、利用式(4)屬性編碼器和式(10)知識(shí)編碼器分別獲得屬性網(wǎng)絡(luò)的產(chǎn)品節(jié)點(diǎn)低維嵌入Zg和孿生網(wǎng)絡(luò)的產(chǎn)品節(jié)點(diǎn)低維嵌入Zg;S45、利用式(11)或(12)對(duì)兩個(gè)網(wǎng)絡(luò)的嵌入進(jìn)行聚合,獲得產(chǎn)品節(jié)點(diǎn)的統(tǒng)一嵌入U(xiǎn);S46、利用(13)和(15)對(duì)產(chǎn)品節(jié)點(diǎn)特征和結(jié)構(gòu)進(jìn)行解碼重構(gòu)得到A和文;S47、采用隨機(jī)梯度下降法,通過優(yōu)化式(17)中的聯(lián)合目標(biāo)函數(shù)C,完成反向傳播,實(shí)現(xiàn)對(duì)編碼器權(quán)重矩陣Wnc和權(quán)重向量c,解碼器權(quán)重矩陣Wdec和偏置向量b的更新;S48、利用式(16)檢測(cè)器對(duì)電商網(wǎng)絡(luò)中的每個(gè)產(chǎn)品計(jì)算其異常分?jǐn)?shù)score(v;)。5.根據(jù)權(quán)利要求4所述的一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法,其特征在于,該方法所述步驟S50包含以下具體步驟:6S51、通過迭代執(zhí)行步驟S43~S48的訓(xùn)練過程獲得電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型的最優(yōu)參數(shù)后,將最后一次訓(xùn)練中獲取的異常檢測(cè)結(jié)果作為最終的檢測(cè)結(jié)果;S52、將異常產(chǎn)品檢測(cè)結(jié)果輸出至電商平臺(tái)的運(yùn)營(yíng)和監(jiān)管人員,提升其異常產(chǎn)品檢測(cè)的效率和可靠性,并針對(duì)異常產(chǎn)品的危害程度及風(fēng)險(xiǎn)影響進(jìn)行進(jìn)一步針對(duì)性處理。6.一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)系統(tǒng),其特征在于:用于實(shí)現(xiàn)權(quán)利要求1-5任一項(xiàng)所述的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法,包括計(jì)算機(jī)處理器和內(nèi)存、電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜數(shù)據(jù)預(yù)處理單元、電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型訓(xùn)練單元和電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)結(jié)果輸出單元;所述電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜數(shù)據(jù)預(yù)處理單元執(zhí)行步驟S10,對(duì)采集到的電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜數(shù)據(jù)進(jìn)行預(yù)處理,并加載到計(jì)算機(jī)內(nèi)存中;電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型訓(xùn)練單元根據(jù)電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜數(shù)據(jù)預(yù)處理單元產(chǎn)生的電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜執(zhí)行步驟S20~S40,構(gòu)建電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型,通過迭代計(jì)算確定模型中參數(shù)的最優(yōu)值;電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)結(jié)果輸出單元執(zhí)行步驟S50,將電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)結(jié)果輸出至相關(guān)工作人員或科研人員,用于各電商平臺(tái)的異常產(chǎn)品檢測(cè),網(wǎng)絡(luò)安全檢測(cè)類相關(guān)任務(wù);所有單元中具體的數(shù)據(jù)處理和計(jì)算工作由所述計(jì)算機(jī)處理器完成,且所有單元都與所述計(jì)算機(jī)內(nèi)存數(shù)據(jù)交7一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法及系統(tǒng)技術(shù)領(lǐng)域[0001]本發(fā)明涉及互聯(lián)網(wǎng)電商領(lǐng)域,特別涉及一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法及系統(tǒng)。背景技術(shù)[0002]近年來(lái),電商網(wǎng)絡(luò)因其不受時(shí)間和空間限制、商品資源豐富齊全和交易方式高效可靠等特點(diǎn),逐漸成為人們生活中的重要組成部分。電商網(wǎng)絡(luò)在給人們生活帶來(lái)方便快捷的同時(shí),也充滿了各種欺詐和異常風(fēng)險(xiǎn)。許多不良商家聯(lián)合大量欺詐用戶通過惡意刷單等方式將劣質(zhì)產(chǎn)品偽裝成良品混入合格產(chǎn)品的共同購(gòu)買網(wǎng)絡(luò)中,以此來(lái)騙取消費(fèi)者的信任和購(gòu)買,并獲取不正當(dāng)?shù)睦?。這些產(chǎn)品的存在嚴(yán)重威脅著電商網(wǎng)絡(luò)的安全健康,也嚴(yán)重?fù)p害了消費(fèi)者的利益。[0003]為了識(shí)別網(wǎng)絡(luò)中的異常產(chǎn)品,學(xué)術(shù)界和工業(yè)界提出了大量異常檢測(cè)方法,例如基于社區(qū)分析或測(cè)量自我中心網(wǎng)絡(luò)的方法、基于特征子空間選擇的方法、基于殘差分析的方法和基于深度學(xué)習(xí)的方法。從表現(xiàn)形式上來(lái)看,異常產(chǎn)品具有與正常產(chǎn)品相近的產(chǎn)品屬性,因此,僅僅依靠電商網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和產(chǎn)品屬性往往難以對(duì)網(wǎng)絡(luò)中的異常產(chǎn)品做出準(zhǔn)確可靠的描述,導(dǎo)致其對(duì)決策生成的引導(dǎo)和支撐不充分,一定程度上限制了模型的異常檢測(cè)能力。事實(shí)上,電商網(wǎng)絡(luò)中的產(chǎn)品除了具有屬性信息外,還以其他形式存在著關(guān)于產(chǎn)品的領(lǐng)域知識(shí)描述。其中,知識(shí)圖譜作為一種廣泛且易于獲取的重要知識(shí)來(lái)源,通過圖的形式描述和存儲(chǔ)現(xiàn)實(shí)世界中的各類知識(shí),能夠?yàn)楝F(xiàn)實(shí)中的實(shí)體提供豐富的背景領(lǐng)域知識(shí)。產(chǎn)品的知識(shí)和屬性是對(duì)同一對(duì)象在不同視角下的描述和刻畫,它們共同為決策生成提供了有力依據(jù)。因此,如何在檢測(cè)模型中融入領(lǐng)域知識(shí),進(jìn)而提高異常檢測(cè)的可靠性,對(duì)電商網(wǎng)絡(luò)異常檢測(cè)技術(shù)的研究和應(yīng)用具有重要意義。發(fā)明內(nèi)容[0004]本發(fā)明要解決的技術(shù)問題是:設(shè)計(jì)一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法及系統(tǒng),通過融入產(chǎn)品的領(lǐng)域知識(shí),對(duì)電商平臺(tái)網(wǎng)絡(luò)中的異常產(chǎn)品進(jìn)行有效可靠的檢測(cè)。[0005]為了達(dá)到上述目的,本發(fā)明采用了下列技術(shù)方案:[0006]本發(fā)明提供一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法,該方法包含三個(gè)主要環(huán)節(jié),步驟S10為電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜數(shù)據(jù)預(yù)處理環(huán)節(jié),步驟S20~S40為電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型構(gòu)建及優(yōu)化環(huán)節(jié),步驟S50為電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)結(jié)果輸出及處理環(huán)節(jié)。具體步驟如下:[0007]S10、面向電商網(wǎng)絡(luò)中的產(chǎn)品采集所有相關(guān)三元組,并進(jìn)行數(shù)據(jù)清洗以構(gòu)成領(lǐng)域知識(shí)圖譜,降低噪聲對(duì)檢測(cè)結(jié)果的影響;[0008]S20、對(duì)步驟S10獲取的知識(shí)圖譜應(yīng)用TransR模型,獲得產(chǎn)品領(lǐng)域知識(shí)的嵌入向量,并依據(jù)電商網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)構(gòu)造其孿生網(wǎng)絡(luò);[0009]S30、基于步驟S20中獲得的孿生網(wǎng)絡(luò),利用圖自編碼器和圖注意力網(wǎng)絡(luò)構(gòu)建電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型;[0010]S40、對(duì)于步驟S30構(gòu)建的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型,通過迭代計(jì)算方式對(duì)模型8進(jìn)行訓(xùn)練,確定模型中的待定參數(shù);[0011]S50、利用步驟S30構(gòu)建的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型,以及步驟S40確定的模型參數(shù),將異常產(chǎn)品檢測(cè)結(jié)果進(jìn)行輸出,并對(duì)異常產(chǎn)品進(jìn)行處理。[0012]進(jìn)一步,該方法所述步驟S10包含以下具體步驟:[0013]S11、對(duì)于電商網(wǎng)絡(luò)中的每個(gè)產(chǎn)品,使用SPARQL語(yǔ)句從DBpedia知識(shí)圖譜中依據(jù)頭實(shí)體或尾實(shí)體進(jìn)行匹配,為該產(chǎn)品抽取所有相關(guān)三元組;[0014]S12、對(duì)步驟S11獲得的三元組進(jìn)行清洗,剔除頭實(shí)體或尾實(shí)體為圖片鏈接、其他語(yǔ)種表示的同義實(shí)體或者為文本信息的三元組,降低由于三元組的冗余和噪聲對(duì)檢測(cè)結(jié)果可能造成的影響;[0015]S13、使用步驟S12預(yù)處理后三元組構(gòu)成領(lǐng)域知識(shí)圖譜,記作T=(N,R,T),其中,N為實(shí)體的集合,R為關(guān)系的集合,R中的關(guān)系連接兩個(gè)實(shí)體構(gòu)成三元組(h,r,t)∈T,h∈N為頭實(shí)體,t∈N為尾實(shí)體,r為實(shí)體間關(guān)系,T表示三元組的集合,每個(gè)三元組分別描述現(xiàn)實(shí)世界中關(guān)于產(chǎn)品的一條知識(shí)。[0016]進(jìn)一步,該方法所述步驟S20包含以下具體步驟:[0017]S21、將電商網(wǎng)絡(luò)數(shù)據(jù)表示為屬性網(wǎng)絡(luò)G=(V,E,X),電商網(wǎng)絡(luò)中的產(chǎn)品表示為屬性的嵌入分別記作h和t,令r表示實(shí)體間關(guān)系的嵌入,并對(duì)關(guān)系r設(shè)置一個(gè)映射矩陣M將實(shí)體從實(shí)體空間投影到相應(yīng)的關(guān)系空間,分別獲得頭實(shí)體投影向量h和尾實(shí)體投影向量t,如式(1)和(2)所示:[0021]S23、進(jìn)一步地,在投影實(shí)體之間建立轉(zhuǎn)換,通過式(3)的得分函數(shù)計(jì)算頭、尾實(shí)體投影向量之間的距離,以此來(lái)衡量事實(shí)成立的可能性:[0023]其中,f(h,t)表示頭實(shí)體h和尾實(shí)體t之間的距離得分;網(wǎng)絡(luò)中產(chǎn)品對(duì)應(yīng)實(shí)體的知識(shí)嵌入,構(gòu)建屬性網(wǎng)絡(luò)的領(lǐng)域知識(shí)矩陣,記作K∈R”xd,其中k;∈K表示產(chǎn)品節(jié)點(diǎn)v;的知識(shí)特征;[0026]進(jìn)一步,所述步驟S30中的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型包含由屬性編碼器和知識(shí)9[0027]1)屬性編碼器由兩個(gè)注意力層堆疊而成,在屬性視圖下將屬性網(wǎng)絡(luò)9=(V,E,X)編[0029]式中,Zg∈R"×為屬性編碼器輸出的隱空間中產(chǎn)品節(jié)點(diǎn)低維嵌入,h′為產(chǎn)品節(jié)點(diǎn)域內(nèi)各產(chǎn)品節(jié)點(diǎn)賦予了不同的注意力系數(shù);產(chǎn)品節(jié)點(diǎn)v與其鄰居之間的注意力系數(shù)由式N為產(chǎn)品節(jié)點(diǎn)v的一階鄰居節(jié)點(diǎn)集合;Wem∈RY×是作用到每個(gè)產(chǎn)品節(jié)點(diǎn)上的可學(xué)習(xí)權(quán)重[0034]為了使產(chǎn)品節(jié)點(diǎn)之間的注意力系數(shù)易于比較,接下來(lái)通過式(7)對(duì)注意力系數(shù)進(jìn)意力系數(shù)與鄰居產(chǎn)品節(jié)點(diǎn)輸入特征的線性組合得到產(chǎn)品節(jié)點(diǎn)v;在單頭注意力圖注意力層個(gè)相互獨(dú)立的單頭注意力網(wǎng)絡(luò)分別計(jì)算出一組注意力系數(shù),再通過式(9)將多個(gè)嵌入結(jié)果[0043]2)知識(shí)編碼器具有和屬性編碼器完全相同的結(jié)構(gòu),在知識(shí)視圖下將孿生網(wǎng)絡(luò)[0045]其中,Zg∈R"為知識(shí)編碼器輸出的產(chǎn)品節(jié)點(diǎn)在隱空間中的低維嵌入,函數(shù)g1[0054]結(jié)構(gòu)解碼器通過計(jì)算產(chǎn)品節(jié)點(diǎn)統(tǒng)一嵌入間的內(nèi)積實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)拓?fù)涞闹貥?gòu),如式數(shù)矩陣和偏置向量,1∈{1,2};該解碼器輸出的產(chǎn)品節(jié)點(diǎn)特征是對(duì)屬性信息和領(lǐng)域知識(shí)兩[0061]5)檢測(cè)器利用產(chǎn)品節(jié)點(diǎn)在結(jié)構(gòu)和特征兩個(gè)維度的重構(gòu)誤差作為評(píng)價(jià)產(chǎn)品異常分11的特征和拓?fù)浣Y(jié)構(gòu)兩部分重構(gòu)誤差在異常分?jǐn)?shù)中的比重。[0064]進(jìn)一步,該方法所述步驟S40包含以下具體步驟:[0065]S41、為S30建立的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型建立式(17)所示的聯(lián)合目標(biāo)函數(shù):[0069]由于解碼器的輸入為經(jīng)聚合器融合后的統(tǒng)一嵌入,因此在計(jì)算特征重構(gòu)誤差時(shí)將屬性網(wǎng)絡(luò)與孿生網(wǎng)絡(luò)中的屬性作為共同參照;C為結(jié)構(gòu)重構(gòu)誤差,由式(19)定義:[0072]S42、對(duì)步驟S30中的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型進(jìn)行初始化,初始化編碼器參數(shù)epoch和學(xué)習(xí)率learningrate;[0073]迭代執(zhí)行步驟S43~S48,直到達(dá)到迭代次數(shù),完成對(duì)電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型[0074]S43、將S13獲取的領(lǐng)域知識(shí)圖譜T作為輸入,按式(1)、式(2)和式(3)學(xué)習(xí)實(shí)體的知識(shí)嵌入,抽取電商網(wǎng)絡(luò)中產(chǎn)品對(duì)應(yīng)的實(shí)體知識(shí)向量組成領(lǐng)域知識(shí)矩陣K,并結(jié)合屬性網(wǎng)絡(luò)G=(V,E,X)的拓?fù)浣Y(jié)構(gòu)構(gòu)造孿生網(wǎng)絡(luò)G'=(V,E,K);[0075]S44、利用式(4)屬性編碼器和式(10)知識(shí)編碼器分別獲得屬性網(wǎng)絡(luò)的產(chǎn)品節(jié)點(diǎn)低維嵌入Zg和孿生網(wǎng)絡(luò)的產(chǎn)品節(jié)點(diǎn)低維嵌入Zg;[0076]S45、利用式(11)或(12)對(duì)兩個(gè)網(wǎng)絡(luò)的嵌入進(jìn)行聚合,獲得產(chǎn)品節(jié)點(diǎn)的統(tǒng)一嵌入U(xiǎn);[0077]S46、利用式(13)和(15)對(duì)產(chǎn)品節(jié)點(diǎn)特征和結(jié)構(gòu)進(jìn)行解碼重構(gòu)得到A和X;[0078]S47、采用隨機(jī)梯度下降法,通過優(yōu)化式(17)中的聯(lián)合目標(biāo)函數(shù)C,完成反向傳播,實(shí)現(xiàn)對(duì)編碼器權(quán)重矩陣Wnc和權(quán)重向量c,解碼器權(quán)重矩陣Wde和偏置向量b的更新;[0079]S48、利用式(16)檢測(cè)器對(duì)電商網(wǎng)絡(luò)中的每個(gè)產(chǎn)品計(jì)算其異常分?jǐn)?shù)score(v;)。[0080]進(jìn)一步,該方法所述步驟S50包含以下具體步驟:[0081]S51、通過迭代執(zhí)行步驟S43~S48的訓(xùn)練過程獲得電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型的最優(yōu)參數(shù)后,將最后一次訓(xùn)練中獲取的異常檢測(cè)結(jié)果作為最終的檢測(cè)結(jié)果;[0082]S52、將異常產(chǎn)品檢測(cè)結(jié)果輸出至電商平臺(tái)的運(yùn)營(yíng)和監(jiān)管人員,提升其異常產(chǎn)品檢測(cè)的效率和可靠性,并針對(duì)異常產(chǎn)品的危害程度及風(fēng)險(xiǎn)影響進(jìn)行進(jìn)一步針對(duì)性處理。[0083]本發(fā)明還提供一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)系統(tǒng),用于實(shí)現(xiàn)上述的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法,包括計(jì)算機(jī)處理器和內(nèi)存、電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜數(shù)據(jù)預(yù)處理單元、電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型訓(xùn)練單元和電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)結(jié)果輸出單元;所述電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜數(shù)據(jù)預(yù)處理單元執(zhí)行步驟S10,對(duì)采集到的電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜數(shù)據(jù)進(jìn)行預(yù)處理,并加載到計(jì)算機(jī)內(nèi)存中;電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型訓(xùn)練單元根據(jù)電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜數(shù)據(jù)預(yù)處理單元產(chǎn)生的電商網(wǎng)絡(luò)領(lǐng)域知識(shí)圖譜執(zhí)行步驟S20~S40,構(gòu)建電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型,通過迭代計(jì)算確定模型中參數(shù)的最優(yōu)值;電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)結(jié)果輸出單元執(zhí)行步驟S50,將電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)結(jié)果輸出至相關(guān)工作人員或科研人員,用于各電商平臺(tái)的異常產(chǎn)品檢測(cè),網(wǎng)絡(luò)安全檢測(cè)類相關(guān)任務(wù);所有單元中具體的數(shù)據(jù)處理和計(jì)算工作由所述計(jì)算機(jī)處理器完成,且所有單元都與所述計(jì)算機(jī)內(nèi)存數(shù)據(jù)交互。[0084]與現(xiàn)有技術(shù)相比本發(fā)明具有以下優(yōu)點(diǎn):[0085]1、本發(fā)明的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法,通過結(jié)合領(lǐng)域知識(shí)構(gòu)建孿生網(wǎng)絡(luò),從另一個(gè)視角下對(duì)產(chǎn)品進(jìn)行描述和刻畫,有助于增強(qiáng)模型魯棒性和有效性,有助于獲得更可靠的異常產(chǎn)品檢測(cè)結(jié)果。[0086]2、本發(fā)明的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法,利用圖自編碼器、圖注意力網(wǎng)絡(luò)和領(lǐng)域知識(shí)描述建立電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型,使模型具有高效的無(wú)監(jiān)督學(xué)習(xí)能力,能夠建立對(duì)網(wǎng)絡(luò)中異常產(chǎn)品的可靠描述,有效提升了模型的檢測(cè)性能。附圖說明[0087]圖1為本發(fā)明所述步驟S30中的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型結(jié)構(gòu)圖;[0088]圖2為本發(fā)明所述一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)系統(tǒng)的系統(tǒng)結(jié)構(gòu)圖;[0089]圖3為本發(fā)明所述一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法的流程圖。具體實(shí)施方式[0090]為了進(jìn)一步闡述本發(fā)明的技術(shù)方案,下面結(jié)合附圖及實(shí)施例對(duì)本發(fā)明進(jìn)行進(jìn)一步說明。[0091]本發(fā)明所述的一種電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)方法通過計(jì)算機(jī)程序?qū)嵤旅鎸凑請(qǐng)D3所示流程詳述本發(fā)明提出的技術(shù)方案的具體實(shí)施方式。通過本發(fā)明的技術(shù)方案,對(duì)亞馬遜電商平臺(tái)共同購(gòu)買網(wǎng)絡(luò)Disney數(shù)據(jù)集進(jìn)行異常產(chǎn)品檢測(cè)。該數(shù)據(jù)集由124個(gè)電影產(chǎn)品構(gòu)成,每個(gè)產(chǎn)品具有28個(gè)屬性,這些產(chǎn)品之間由335條共同購(gòu)買關(guān)系連接在一起,網(wǎng)絡(luò)中包含若干異常電影產(chǎn)品。[0092]實(shí)施方式主要包含以下關(guān)鍵內(nèi)容:[0093]S10、面向電商網(wǎng)絡(luò)中的產(chǎn)品采集所有相關(guān)三元組,并進(jìn)行數(shù)據(jù)清洗以構(gòu)成領(lǐng)域知識(shí)圖譜,降低噪聲對(duì)檢測(cè)結(jié)果的影響,包含[0094]S11、對(duì)于電商網(wǎng)絡(luò)中的每個(gè)產(chǎn)品,使用SPARQL語(yǔ)句從DBpe實(shí)體或尾實(shí)體進(jìn)行匹配,為該產(chǎn)品抽取所有相關(guān)三元組;[0095]S12、對(duì)步驟S11獲得的三元組進(jìn)行清洗,剔除頭實(shí)體或尾實(shí)體為圖片鏈接、其他語(yǔ)種表示的同義實(shí)體或者為文本信息的三元組,降低由于三元組的冗余和噪聲對(duì)檢測(cè)結(jié)果可能造成的影響;[0096]S13、使用步驟S12預(yù)處理后三元組構(gòu)成領(lǐng)域知識(shí)圖譜,記作T=(N,R,實(shí)體的集合,包含29517個(gè)實(shí)體,R為關(guān)系的集合,包含331種關(guān)系,R中的關(guān)系連接兩個(gè)實(shí)體構(gòu)成三元組(h,r,t)∈T,h∈N為頭實(shí)體,t∈N為尾實(shí)體,r合,共53429個(gè)三元組,每個(gè)三元組分別描述現(xiàn)實(shí)世界中關(guān)于產(chǎn)品的一條知識(shí)。[0097]S20、對(duì)步驟S10獲取的知識(shí)圖譜應(yīng)用TransR模型,獲得產(chǎn)品領(lǐng)域知識(shí)的嵌入向量,并依據(jù)電商網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)構(gòu)造其孿生網(wǎng)絡(luò),包括以下具體步驟:[0098]S21、將Disney電商網(wǎng)絡(luò)數(shù)據(jù)集表示為屬性網(wǎng)絡(luò)G=(V,E,X),電商網(wǎng)絡(luò)中的產(chǎn)品表示為屬性網(wǎng)絡(luò)中產(chǎn)品節(jié)點(diǎn),產(chǎn)品之間的共同購(gòu)買關(guān)系表示為產(chǎn)品節(jié)點(diǎn)之間的邊;其中,V={v;li=1,2,...,n}表示網(wǎng)絡(luò)中n=124個(gè)產(chǎn)品節(jié)點(diǎn)構(gòu)成的集合,v;表示第i個(gè)產(chǎn)品對(duì)應(yīng)的節(jié)示有用戶同時(shí)購(gòu)買了這兩個(gè)節(jié)點(diǎn)代表的產(chǎn)品,屬性網(wǎng)絡(luò)共包含|E|=m=335條邊;X∈R”為[0099]S22、對(duì)于S13獲得的領(lǐng)域知識(shí)圖譜中的每個(gè)三元組(h,r,t),將其頭實(shí)體與尾實(shí)體的嵌入分別記作h和t,令r表示實(shí)體間關(guān)系的嵌入,并對(duì)關(guān)系r設(shè)置一個(gè)映射矩陣M將實(shí)體從實(shí)體空間投影到相應(yīng)的關(guān)系空間,分別獲得頭實(shí)體投影向量h和尾實(shí)體投影向量t,如式(1)和(2)所示:[0102]S23、進(jìn)一步地,在投影實(shí)體之間建立轉(zhuǎn)換,通過式(3)的得分函數(shù)計(jì)算頭、尾實(shí)體投影向量之間的距離,以此來(lái)衡量事實(shí)成立的可能性:[0104]其中,f(h,t)表示頭實(shí)體h和尾實(shí)體t之間的距離得分;[0105]S24、通過迭代步驟S22和S23對(duì)三元組的嵌入不斷更新,并從嵌入結(jié)果中抽取電商網(wǎng)絡(luò)中產(chǎn)品對(duì)應(yīng)實(shí)體的知識(shí)嵌入,構(gòu)建屬性網(wǎng)絡(luò)的領(lǐng)域知識(shí)矩陣,記作K∈R”,其中k∈K表示產(chǎn)品節(jié)點(diǎn)v的知識(shí)特征;[0106]S25、基于屬性網(wǎng)絡(luò)9=(V,E,X)的拓?fù)浣Y(jié)構(gòu)A和領(lǐng)域知識(shí)矩陣K構(gòu)造屬性網(wǎng)絡(luò)的孿生[0107]S30、基于步驟S20中獲得的孿生網(wǎng)絡(luò),利用圖自編碼器和圖注意力網(wǎng)絡(luò)構(gòu)建電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型,該模型包含由屬性編碼器和知識(shí)編碼器組成的多視圖編碼器、聚[0108]1)屬性編碼器由兩個(gè)注意力層堆疊而成,在屬性視圖下將屬性網(wǎng)絡(luò)9=(V,E,X)編碼為隱空間中的產(chǎn)品節(jié)點(diǎn)低維嵌入;其中,第一層使用多頭注意力機(jī)制,第二層使用單頭注意力機(jī)制,編碼過程的形式化表示如式(4)所示:節(jié)點(diǎn)嵌入的維度,函數(shù)f?(·,·)和f?(·,·)分別表示第一個(gè)和第二個(gè)圖注意力層;對(duì)于每一個(gè)圖注意力層,在對(duì)屬性網(wǎng)絡(luò)中產(chǎn)品節(jié)點(diǎn)的鄰域信息進(jìn)行聚合的過程中,圖注意力機(jī)制對(duì)鄰域內(nèi)各產(chǎn)品節(jié)點(diǎn)賦予了不同的注意力系數(shù);產(chǎn)品節(jié)點(diǎn)v?與其鄰居之間的注意力系數(shù)由式(5)計(jì)算:N,為產(chǎn)品節(jié)點(diǎn)v的一階鄰居節(jié)點(diǎn)集合;WmER×是作用到每個(gè)產(chǎn)品節(jié)點(diǎn)上的可學(xué)習(xí)權(quán)重矩[0114]其中,α=0.2值控制負(fù)數(shù)部分線性函數(shù)的梯度大小。[0115]為了使產(chǎn)品節(jié)點(diǎn)之間的注意力系數(shù)易于比較,接下來(lái)通過式(7)對(duì)注意力系數(shù)進(jìn)行歸一化:[0117]其中,α;為產(chǎn)品節(jié)點(diǎn)v;和v;之間注意力系數(shù)歸一化后的結(jié)果;利用歸一化后的注意力系數(shù)與鄰居產(chǎn)品節(jié)點(diǎn)輸入特征的線性組合得到產(chǎn)品節(jié)點(diǎn)v;在單頭注意力圖注意力層的輸出特征:[0120]以上步驟通過單頭注意力機(jī)制聚合鄰域信息對(duì)產(chǎn)品節(jié)點(diǎn)嵌入進(jìn)行了更新;[0121]進(jìn)一步地,為了增強(qiáng)模型泛化能力,在圖注意力層中引入多頭注意力機(jī)制,通過多個(gè)相互獨(dú)立的單頭注意力網(wǎng)絡(luò)分別計(jì)算出一組注意力系數(shù),再通過式(9)將多個(gè)嵌入結(jié)果進(jìn)行拼接,得到產(chǎn)品節(jié)點(diǎn)v;在多頭注意力圖注意力層的輸出特征:[0123]其中,x;"為具有多頭注意力的圖注意力層輸出的產(chǎn)品節(jié)點(diǎn)v;的嵌入;P=3表示單頭注意力網(wǎng)絡(luò)的數(shù)量,α表示第p個(gè)注意力網(wǎng)絡(luò)計(jì)算得到的注意力系數(shù),W表示第p個(gè)注意力網(wǎng)絡(luò)的權(quán)重矩陣;[0124]2)知識(shí)編碼器具有和屬性編碼器完全相同的結(jié)構(gòu),在知識(shí)視圖下將孿生網(wǎng)絡(luò)G'=(V,E,K)編碼為隱空間中產(chǎn)品節(jié)點(diǎn)的低維嵌入,其構(gòu)成如式(10)所示:[0126]其中,Zg∈R"為知識(shí)編碼器輸出的產(chǎn)品節(jié)點(diǎn)在隱空間中的低維嵌入,函數(shù)g1[0127]3)聚合器對(duì)不同視圖下的網(wǎng)絡(luò)嵌入進(jìn)行融合,進(jìn)而獲得網(wǎng)絡(luò)中產(chǎn)品節(jié)點(diǎn)的多視圖統(tǒng)一嵌入;可以采用兩種視圖聚合策略中的任一種,具體如下:[0128](1)拼接聚合器:對(duì)兩個(gè)視圖的產(chǎn)品節(jié)點(diǎn)嵌入進(jìn)行縱向拼接,形成一個(gè)維度更高的一嵌入;[0131](2)加和聚合器:將兩個(gè)視圖的嵌入按照對(duì)應(yīng)位置相加的方式,獲得一個(gè)同維度的[0133]式中,U∈R"為使用加和聚合器獲得的多視圖統(tǒng)一嵌入;[0134]4)解碼器包括結(jié)構(gòu)解碼器和特征解碼器,其中:[0135]結(jié)構(gòu)解碼器通過計(jì)算產(chǎn)品節(jié)點(diǎn)統(tǒng)一嵌入間的內(nèi)積實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)拓?fù)涞闹貥?gòu),如式[0137]其中,A為結(jié)構(gòu)解碼器輸出的重構(gòu)后的網(wǎng)絡(luò)鄰接矩陣,U為采用任一種聚合器獲得[0139]特征解碼器使用兩層全連接網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)產(chǎn)品節(jié)點(diǎn)特征的重構(gòu),如式(15)所示:[0141]其中,x為重構(gòu)后的產(chǎn)品節(jié)點(diǎn)的特征信息,W(和b(①)分別表示第1個(gè)全連接層的參數(shù)矩陣和偏置向量,1∈{1,2};該解碼器輸出的產(chǎn)品節(jié)點(diǎn)特征是對(duì)屬性信息和領(lǐng)域知識(shí)兩部分信息在同一特征空間中的重構(gòu);[0142]5)檢測(cè)器利用產(chǎn)品節(jié)點(diǎn)在結(jié)構(gòu)和特征兩個(gè)維度的重構(gòu)誤差作為評(píng)價(jià)產(chǎn)品異常分?jǐn)?shù)的重要依據(jù),具體異常評(píng)分函數(shù)如式(16)所示:[0144]式中,score(v;)為產(chǎn)品節(jié)點(diǎn)v的異常分?jǐn)?shù),用于反映第i個(gè)產(chǎn)品的異常程度,其取值越大表明產(chǎn)品的異常程度越高;a表示產(chǎn)品節(jié)點(diǎn)v;在屬性網(wǎng)絡(luò)中的拓?fù)浣Y(jié)構(gòu),x和@分別為解碼器重構(gòu)后產(chǎn)品節(jié)點(diǎn)v的特征和拓?fù)浣Y(jié)構(gòu);λ∈[0,1]為平衡系數(shù),用于平衡產(chǎn)品節(jié)點(diǎn)v的特征和拓?fù)浣Y(jié)構(gòu)兩部分重構(gòu)誤差在異常分?jǐn)?shù)中的比重。[0145]S40、對(duì)于步驟S30構(gòu)建的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型,通過迭代計(jì)算方式對(duì)模型[0146]S41、為S30建立的電商網(wǎng)絡(luò)異常產(chǎn)品檢測(cè)模型建立式(17)所示的聯(lián)合目標(biāo)函數(shù):[0150]
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026新疆阿合奇縣公益性崗位(鄉(xiāng)村振興專干)招聘44人考試參考試題及答案解析
- 2026浙江大學(xué)醫(yī)學(xué)院附屬第一醫(yī)院臺(tái)州醫(yī)院(籌)招聘高層次衛(wèi)技人員150人考試參考試題及答案解析
- 2026貴州峰鑫建設(shè)投資(集團(tuán))有限公司招聘14人考試參考題庫(kù)及答案解析
- 2026年安徽電子信息職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考題庫(kù)帶答案解析
- 2026浙江省應(yīng)急管理科學(xué)研究院編外招聘10人考試備考試題及答案解析
- 2026安徽省面向華東師范大學(xué)選調(diào)生招錄考試備考試題及答案解析
- 2026江西省某國(guó)企招聘勞務(wù)派遣工程師4人考試參考試題及答案解析
- 2026年山東管理學(xué)院招聘工作人員考試參考題庫(kù)及答案解析
- 2026湖北省面向中央民族大學(xué)普通選調(diào)生招錄考試備考試題及答案解析
- 2026年度江西銅業(yè)鑫瑞科技有限公司第二批次校園招聘3人筆試備考試題及答案解析
- 器官移植術(shù)后排斥反應(yīng)的風(fēng)險(xiǎn)分層管理
- 事業(yè)單位清算及財(cái)務(wù)報(bào)告編寫范本
- 護(hù)坡綠化勞務(wù)合同范本
- 臨床績(jī)效的DRG與CMI雙指標(biāo)調(diào)控
- 2026年湛江日?qǐng)?bào)社公開招聘事業(yè)編制工作人員備考題庫(kù)及完整答案詳解
- 2025-2026學(xué)年人教版數(shù)學(xué)三年級(jí)上學(xué)期期末仿真模擬試卷一(含答案)
- 2025年涼山教師業(yè)務(wù)素質(zhì)測(cè)試題及答案
- 2026年昭通市威信縣公安局第一季度輔警招聘(14人)筆試模擬試題及答案解析
- 氫能技術(shù)研發(fā)協(xié)議
- 2025交管12123學(xué)法減分整套試題帶答案解析(全國(guó)適用)
- 經(jīng)皮內(nèi)鏡下胃造瘺術(shù)護(hù)理配合
評(píng)論
0/150
提交評(píng)論