版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
(72)發(fā)明人于彥偉何一鳴李享齊建鵬董軍宇有限公司11615GO6NGO6N一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)00自監(jiān)督對(duì)比學(xué)習(xí)優(yōu)化模塊自適應(yīng)頻域增強(qiáng)特征建模模塊多層圖卷積網(wǎng)絡(luò)編碼模塊離散動(dòng)態(tài)圖快照節(jié)點(diǎn)活躍度一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路節(jié)點(diǎn)活躍度評(píng)分機(jī)制用以衡量用戶節(jié)點(diǎn)在不同基于節(jié)點(diǎn)活躍度的自監(jiān)督時(shí)間掩碼機(jī)制以降低基于自監(jiān)督結(jié)構(gòu)重建的鏈路預(yù)測(cè)優(yōu)化機(jī)制進(jìn)行快速收斂,具備良好的工業(yè)可部署性與擴(kuò)展能2其中,參數(shù)入用于調(diào)節(jié)節(jié)點(diǎn)動(dòng)態(tài)評(píng)分的敏感性,節(jié)點(diǎn)Vi在t-1時(shí)刻的度數(shù)35.根據(jù)權(quán)利要求4所述的一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法,其特征在于,所述構(gòu)建基于節(jié)點(diǎn)活躍度的自監(jiān)督時(shí)間掩碼機(jī)制以降低動(dòng)態(tài)圖中冗余邊干擾,當(dāng)前時(shí)間步t中,任意兩個(gè)節(jié)點(diǎn)vi、Yj之間存在邊ej,則該邊的初始掩碼概率]6.根據(jù)權(quán)利要求5所述的一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法,其建模,設(shè)時(shí)間步t上第l-1層的節(jié)點(diǎn)表示為,則第l層的結(jié)構(gòu)特征更新形式表示47.根據(jù)權(quán)利要求6所述的一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法,其8.根據(jù)權(quán)利要求7所述的一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法,其神經(jīng)網(wǎng)絡(luò)提取的節(jié)點(diǎn)特征嵌入輸入至多層感知器MLP,用于預(yù)測(cè)任意節(jié)點(diǎn)對(duì)在未來可能形9.根據(jù)權(quán)利要求8所述的一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法,其態(tài)圖整體結(jié)構(gòu)的理解;第二項(xiàng)計(jì)算保留邊E的損失,以保證模型準(zhǔn)確學(xué)習(xí)已有的關(guān)鍵邊信特征模塊,被配置為,利用動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行基于頻學(xué)習(xí);5優(yōu)化模塊,被配置為,利用基于自監(jiān)督結(jié)構(gòu)重建的鏈路預(yù)測(cè)優(yōu)化機(jī)制進(jìn)行模型優(yōu)化;6一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法及系統(tǒng)技術(shù)領(lǐng)域[0001]本發(fā)明涉及鏈路預(yù)測(cè)技術(shù)領(lǐng)域,尤其是涉及一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法及系統(tǒng)。背景技術(shù)[0002]隨著社交平臺(tái)用戶數(shù)量和交互行為的持續(xù)增長(zhǎng),社交網(wǎng)絡(luò)中的結(jié)構(gòu)演化日益頻繁和復(fù)雜。用戶之間的關(guān)系不斷建立、消失或演變,形成典型的動(dòng)態(tài)圖結(jié)構(gòu)。如何在此類動(dòng)態(tài)環(huán)境中有效建模用戶關(guān)系,并預(yù)測(cè)潛在的社交鏈接,已成為當(dāng)前圖計(jì)算與人工智能領(lǐng)域的研究熱點(diǎn)。為此,動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)(DynamicGraphNeuralNetwork,DGNN)技術(shù)應(yīng)運(yùn)而生,廣泛用于捕捉社交網(wǎng)絡(luò)中節(jié)點(diǎn)與邊隨時(shí)間演化的行為模式。[0003]在社交網(wǎng)絡(luò)建模中,鏈路預(yù)測(cè)任務(wù)尤為關(guān)鍵,其目標(biāo)是在給定用戶歷史交互數(shù)據(jù)的基礎(chǔ)上,預(yù)測(cè)未來可能新增的關(guān)系邊,如好友推薦、關(guān)注建議等。這一任務(wù)不僅直接影響社交平臺(tái)的推薦質(zhì)量與用戶活躍度,也對(duì)信息傳播分析、社群結(jié)構(gòu)演化建模等下游任務(wù)具有重要意義。因此,提升動(dòng)態(tài)圖鏈路預(yù)測(cè)的準(zhǔn)確性、魯棒性與實(shí)時(shí)響應(yīng)能力,是當(dāng)前學(xué)術(shù)界與工業(yè)界的核心訴求。[0004]目前主流的動(dòng)態(tài)圖建模方法可分為兩類:一類為連續(xù)時(shí)間建模方法,通過構(gòu)建時(shí)間序列表示節(jié)點(diǎn)狀態(tài),并引入時(shí)序編碼器(如循環(huán)網(wǎng)絡(luò)、Transformer等)學(xué)習(xí)圖結(jié)構(gòu)的連續(xù)演化過程。該類方法能夠捕捉細(xì)粒度的時(shí)間變化,但因需維護(hù)完整歷史序列,計(jì)算復(fù)雜度較高,難以在大規(guī)模社交圖或低延遲推薦任務(wù)中高效部署。另一類為離散時(shí)間建模方法,通過將交互行為劃分為多個(gè)時(shí)間窗口,在每個(gè)時(shí)間步構(gòu)建快照?qǐng)D結(jié)構(gòu),再通過圖序列建模演化過程。該類方法計(jì)算效率高,更適合實(shí)時(shí)處理和工程落地,成為當(dāng)前在社交網(wǎng)絡(luò)鏈路預(yù)測(cè)任務(wù)中的主流方案。[0005]盡管離散動(dòng)態(tài)圖建模方法取得了一定進(jìn)展,但在實(shí)際社交網(wǎng)絡(luò)中仍存在以下突出技術(shù)難題:1)冗余結(jié)構(gòu)信息干擾嚴(yán)重,缺乏有效篩選機(jī)制。社交網(wǎng)絡(luò)具有高度稀疏性與局部穩(wěn)定性特征,部分低活躍用戶或關(guān)系變化緩慢區(qū)域長(zhǎng)期存在冗余邊結(jié)構(gòu),若不加篩選地輸入模型,會(huì)削弱對(duì)關(guān)鍵社交行為的建模能力,影響鏈路預(yù)測(cè)精度。[0006]2)結(jié)構(gòu)演化存在顯著分布漂移,模型缺乏動(dòng)態(tài)適應(yīng)能力。在熱點(diǎn)事件、輿情爆發(fā)或用戶興趣突變等情境下,社交網(wǎng)絡(luò)結(jié)構(gòu)可能在短時(shí)間內(nèi)發(fā)生劇烈變化,現(xiàn)有方法多數(shù)假設(shè)圖分布平穩(wěn),難以及時(shí)調(diào)整建模策略,應(yīng)對(duì)突發(fā)結(jié)構(gòu)變動(dòng)。[0007]3)計(jì)算資源開銷大,缺乏適應(yīng)高頻預(yù)測(cè)場(chǎng)景的部署能力。隨著平臺(tái)用戶規(guī)模增長(zhǎng)和推薦頻率提高,傳統(tǒng)動(dòng)態(tài)圖模型基于全圖訓(xùn)練的方式在資源消耗和響應(yīng)延遲方面難以支撐實(shí)時(shí)推薦系統(tǒng)需求,限制了在工程環(huán)境中的廣泛應(yīng)用。[0008]因此,針對(duì)上述技術(shù)瓶頸,亟需設(shè)計(jì)一種支持離散時(shí)間建模、具備冗余信息抑制能力、能適應(yīng)結(jié)構(gòu)突變并具備高部署效率的動(dòng)態(tài)圖鏈路預(yù)測(cè)方法。特別是結(jié)合掩碼機(jī)制與結(jié)7構(gòu)重建策略的動(dòng)態(tài)圖建??蚣?,有望從根本上緩解冗余干擾、提升模型對(duì)結(jié)構(gòu)變化的敏感性與泛化能力,推動(dòng)社交網(wǎng)絡(luò)鏈路預(yù)測(cè)技術(shù)向更高效、更智能的方向發(fā)展。發(fā)明內(nèi)容[0009]為了解決上述提到現(xiàn)有動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)在鏈路預(yù)測(cè)任務(wù)中存在的問題,本發(fā)明提供一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法及系統(tǒng)。通過使用離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò),結(jié)合自監(jiān)督掩碼機(jī)制與頻域增強(qiáng)模塊,對(duì)動(dòng)態(tài)圖中高價(jià)值交互進(jìn)行建模,顯著提升了推薦系統(tǒng)的準(zhǔn)確性、魯棒性與效率。[0010]第一方面,本發(fā)明提供的一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法,包括:獲取用戶交互日志數(shù)據(jù)集;構(gòu)建基于掩碼機(jī)制的動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)模型,其中,包括基于用戶交互日志數(shù)據(jù)集構(gòu)建離散時(shí)間動(dòng)態(tài)圖快照序列,引入節(jié)點(diǎn)活躍度評(píng)分機(jī)制用以衡量用戶節(jié)點(diǎn)在不同時(shí)間步圖中的交互活躍程度與結(jié)構(gòu)重要性;構(gòu)建基于節(jié)點(diǎn)活躍度的自監(jiān)督時(shí)間掩碼機(jī)制以降低動(dòng)態(tài)圖中冗余邊干擾;利用動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行基于頻域增強(qiáng)的動(dòng)態(tài)圖特征表示學(xué)習(xí);利用基于自監(jiān)督結(jié)構(gòu)重建的鏈路預(yù)測(cè)優(yōu)化機(jī)制進(jìn)行模型優(yōu)化;利用優(yōu)化后的模型進(jìn)行鏈路預(yù)測(cè)。[0011]進(jìn)一步地,所述基于用戶交互日志數(shù)據(jù)集構(gòu)建離散時(shí)間動(dòng)態(tài)圖快照序列,包括輸入包含時(shí)間戳的交互日志數(shù)據(jù)集H,并按時(shí)間戳劃分為T個(gè)離散時(shí)間窗口:{(to,t?),(t?,t?),…,(tT-1,tT)},每個(gè)時(shí)間窗口(ti-1,t;)對(duì)應(yīng)一個(gè)圖快照G1=(Vi,εi),其中,u;與v;表示在時(shí)間t;發(fā)生交互的兩個(gè)節(jié)點(diǎn),Xu?,Xv?分別為對(duì)應(yīng)節(jié)點(diǎn)的靜態(tài)屬性和統(tǒng)計(jì)特征向量,N為交互總數(shù)量;在每個(gè)時(shí)間窗口i∈{1,…,T}中,抽取發(fā)生于該時(shí)間段內(nèi)的交互對(duì)(u,v),將其構(gòu)建為邊集合ε,節(jié)點(diǎn)集合Vi由所有發(fā)生交互的用戶組成,進(jìn)而構(gòu)建鄰接矩陣并為每個(gè)節(jié)點(diǎn)構(gòu)造節(jié)點(diǎn)特征矩陣。[0012]進(jìn)一步地,所述引入節(jié)點(diǎn)活躍度評(píng)分機(jī)制用以衡量用戶節(jié)點(diǎn)在不同時(shí)間步圖中的交互活躍程度與結(jié)構(gòu)重要性,包括為分?jǐn)?shù),兩者每個(gè)時(shí)間步t中的節(jié)點(diǎn)vi∈V定義一個(gè)活躍度分?jǐn)?shù),該分?jǐn)?shù)由兩個(gè)部分組成:節(jié)點(diǎn)動(dòng)態(tài)變化分?jǐn)?shù)與節(jié)點(diǎn)重要性按權(quán)重比例進(jìn)行融合,其中,利用節(jié)點(diǎn)動(dòng)態(tài)變化分?jǐn)?shù)刻畫用戶在時(shí)間序列中鄰居結(jié)構(gòu)的變動(dòng)情8其中,參數(shù)入用于調(diào)節(jié)節(jié)點(diǎn)動(dòng)態(tài)評(píng)分的敏感性,節(jié)點(diǎn)Vi在t-1時(shí)刻的度數(shù)deg(v;)-1表征節(jié)點(diǎn)過去交互活躍度的基礎(chǔ)水平,1和Y分別用于避免計(jì)算過程中分母為交互活躍程度與結(jié)構(gòu)重要性,還包括利用節(jié)點(diǎn)重要性分?jǐn)?shù)S衡量節(jié)點(diǎn)在圖結(jié)構(gòu)中的整體其中,A,與A分別為節(jié)點(diǎn)Vi和Vj在時(shí)間步t上的活躍度評(píng)分,函數(shù)Mean()表示取二者的平均值,并計(jì)算修正后的所有邊的掩碼概率,基于修正后的掩9構(gòu)編碼階段引入基于譜域近似的圖卷積機(jī)制,用于建模節(jié)括引入自監(jiān)督重建損失函數(shù),將Em中的邊作為正樣本,用于優(yōu)化模型的邊預(yù)測(cè)能力,包括將圖神經(jīng)網(wǎng)絡(luò)提取的節(jié)點(diǎn)特征嵌入輸入至多層感知器MLP,用于預(yù)測(cè)任意節(jié)點(diǎn)對(duì)在未果。對(duì)動(dòng)態(tài)圖整體結(jié)構(gòu)的理解;第二項(xiàng)計(jì)算保留邊E的損失,以保證模型準(zhǔn)確學(xué)習(xí)已有的關(guān)鍵邊信息;第三項(xiàng)為負(fù)樣本邊Eneg的損失,用于使模型區(qū)分不存在的邊信息。模型構(gòu)建模塊,被配置為,構(gòu)建基于掩碼機(jī)制的動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)模型,其中,包括基于用戶交互日志數(shù)據(jù)集構(gòu)建離散時(shí)間動(dòng)態(tài)圖快照序列,引入節(jié)點(diǎn)活躍度評(píng)分機(jī)制用以衡量用戶節(jié)點(diǎn)在不同時(shí)間步圖中的交互活躍程度與結(jié)構(gòu)重要性;構(gòu)建基于節(jié)點(diǎn)活躍度的自監(jiān)督時(shí)間掩碼機(jī)制以降低動(dòng)態(tài)圖中冗余邊干擾;特征模塊,被配置為,利用動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行基于頻域增強(qiáng)的動(dòng)態(tài)圖特征優(yōu)化模塊,被配置為,利用基于自監(jiān)督結(jié)構(gòu)重建的鏈路預(yù)測(cè)優(yōu)化機(jī)制進(jìn)行模型優(yōu)[0020]第三方面,本發(fā)明提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中存儲(chǔ)有多條指令,所述指令適于由終端設(shè)備的處理器加載并執(zhí)行所述的一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法。[0021]第四方面,本發(fā)明提供一種終端設(shè)備,包括處理器和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),處理器用于實(shí)現(xiàn)各指令;計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)用于存儲(chǔ)多條指令,所述指令適于由處理器加載并執(zhí)行所述的一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法。[0023]現(xiàn)有方法普遍對(duì)社交圖中所有歷史邊結(jié)構(gòu)一視同仁,未能有效識(shí)別低活躍用戶之間冗余連接或短時(shí)無效交互,易引發(fā)噪聲干擾。本發(fā)明提出的節(jié)點(diǎn)活躍度驅(qū)動(dòng)掩碼機(jī)制,結(jié)合結(jié)構(gòu)變化頻率與節(jié)點(diǎn)重要性評(píng)分,自適應(yīng)篩除冗余社交邊結(jié)構(gòu)。在實(shí)際社交網(wǎng)絡(luò)數(shù)據(jù)集中(如UCI-Message、MOOC等),該機(jī)制平均可過濾掉約20%~40%的冗余邊,減少訓(xùn)練圖規(guī)模30%左右,從而有效提升模型聚焦高質(zhì)量交互關(guān)系的能力,增強(qiáng)對(duì)潛在好友關(guān)系和高活躍用戶連接的學(xué)習(xí)效果。[0025]社交網(wǎng)絡(luò)中用戶興趣與行為模式具有明顯的時(shí)間非平穩(wěn)性,例如因熱點(diǎn)事件、興趣轉(zhuǎn)移或周期性社交節(jié)奏導(dǎo)致結(jié)構(gòu)突變。本發(fā)明引入頻域增強(qiáng)模塊,通過傅里葉變換提取節(jié)點(diǎn)行為在時(shí)間維度上的頻率響應(yīng),并利用可學(xué)習(xí)濾波器突出關(guān)鍵變化頻段,使模型具備周期模式感知與突變行為響應(yīng)能力。在Bitcoin-Alpha和Bitcoin-OTC等具有強(qiáng)波動(dòng)性的交易網(wǎng)絡(luò)數(shù)據(jù)集中,本發(fā)明的頻域機(jī)制使模型在結(jié)構(gòu)變化劇烈階段的預(yù)測(cè)精度平均提升5%~6%,展現(xiàn)出在非平穩(wěn)動(dòng)態(tài)環(huán)境下的出色魯棒性與泛化性能。[0026](3)提升結(jié)構(gòu)還原能力,緩解真實(shí)數(shù)據(jù)中[0027]在社交平臺(tái)中,由于信息不完全或交互未被觀測(cè),圖結(jié)構(gòu)常存在缺失。本發(fā)明通過引入自監(jiān)督結(jié)構(gòu)重建機(jī)制,將掩蓋邊作為正樣本參與預(yù)測(cè)目標(biāo),使模型在訓(xùn)練過程中補(bǔ)足結(jié)構(gòu)信息空白,從而增強(qiáng)對(duì)潛在好友關(guān)系或未現(xiàn)交互行為的識(shí)別能力。實(shí)驗(yàn)表明,在多個(gè)鏈路預(yù)測(cè)任務(wù)中,重建機(jī)制使Recall@10平均提升約7.3%,顯著增強(qiáng)了模型對(duì)不完全社交圖結(jié)構(gòu)的理解與補(bǔ)全能力。[0029]傳統(tǒng)動(dòng)態(tài)圖建模方法常依賴全圖參與訓(xùn)練,計(jì)算資源消耗大,難以在大型社交平臺(tái)上實(shí)時(shí)部署。本發(fā)明結(jié)合掩碼機(jī)制與頻域建模策略,顯著降低了輸入圖的邊規(guī)模與計(jì)算遍歷次數(shù)。在Wiki-Talk等百萬節(jié)點(diǎn)級(jí)別的大型社交協(xié)作網(wǎng)絡(luò)中,主流方法常因資源瓶頸出現(xiàn)00M(內(nèi)存溢出)問題,而本發(fā)明可穩(wěn)定運(yùn)行,并在不犧牲精度的前提下實(shí)現(xiàn)快速收斂,具備良好的工業(yè)可部署性與擴(kuò)展能力。[0030]綜上所述,本發(fā)明所提出的基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法,圍繞冗余信息控制、行為演化適應(yīng)、結(jié)構(gòu)重建補(bǔ)全與系統(tǒng)部署效率等關(guān)鍵問題,提供了一套結(jié)構(gòu)合理、機(jī)制完備、性能優(yōu)越的系統(tǒng)性建模方案,適用于多種社交圖建模與關(guān)系預(yù)測(cè)場(chǎng)景,具有良好的實(shí)際應(yīng)用前景與工程部署價(jià)值。附圖說明[0031]圖1為本發(fā)明的總體框架圖;圖2為動(dòng)態(tài)掩碼框架圖;圖3為頻域增強(qiáng)動(dòng)態(tài)圖特征表示學(xué)習(xí)框架圖;圖4為自監(jiān)督結(jié)構(gòu)重建框架圖。具體實(shí)施方式[0032]以下結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)說明。[0033]實(shí)施例1參照?qǐng)D1,本實(shí)施例的一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)方法,包獲取用戶交互日志數(shù)據(jù)集;構(gòu)建基于掩碼機(jī)制的動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)模型,其中,包括基于用戶交互日志數(shù)據(jù)集構(gòu)建離散時(shí)間動(dòng)態(tài)圖快照序列,引入節(jié)點(diǎn)活躍度評(píng)分機(jī)制用以衡量用戶節(jié)點(diǎn)在不同時(shí)間步圖中的交互活躍程度與結(jié)構(gòu)重要性;構(gòu)建基于節(jié)點(diǎn)活躍度的自監(jiān)督時(shí)間掩碼機(jī)制以降低動(dòng)態(tài)圖中冗余邊干擾;利用動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行基于頻域增強(qiáng)的動(dòng)態(tài)圖特征表示學(xué)習(xí);利用基于自監(jiān)督結(jié)構(gòu)重建的鏈路預(yù)測(cè)優(yōu)化機(jī)制進(jìn)行模型優(yōu)化;利用優(yōu)化后的模型進(jìn)行鏈路預(yù)測(cè)。步驟1:構(gòu)建離散時(shí)間動(dòng)態(tài)圖快照序列,1.1本發(fā)明的第一步是構(gòu)建離散時(shí)間動(dòng)態(tài)圖快照序列,旨在將連續(xù)時(shí)間的用戶交互行為轉(zhuǎn)化為結(jié)構(gòu)化的圖數(shù)據(jù)輸入,以便后續(xù)圖神經(jīng)網(wǎng)絡(luò)模型能夠有效學(xué)習(xí)圖的時(shí)間演化其中,參數(shù)入用于調(diào)節(jié)節(jié)點(diǎn)動(dòng)態(tài)評(píng)分的敏感性,節(jié)點(diǎn)Vi在t-1時(shí)刻的度數(shù)其中,d為阻尼系數(shù)(一般設(shè)為0.85),N表示節(jié)點(diǎn)總數(shù),第一項(xiàng)表示隨機(jī)跳轉(zhuǎn)到升結(jié)構(gòu)建模的聚焦性與準(zhǔn)確性,本發(fā)明設(shè)計(jì)了一種基于節(jié)點(diǎn)活躍度的自監(jiān)督時(shí)間掩碼機(jī)而提高鏈路預(yù)測(cè)的學(xué)習(xí)效率和泛化能力,尤其適用于社交網(wǎng)絡(luò)中用戶關(guān)系演化的建模任其中,分別為節(jié)點(diǎn)Vi和j在時(shí)間步t上的活躍度評(píng)分,取值范圍為[0045]3.2為保證全局掩碼比例的穩(wěn)定性和可控性,本發(fā)明進(jìn)一步對(duì)所有邊的初始掩碼過于松散而失效。在實(shí)際設(shè)置中,我們通常將P設(shè)定為10%至40%之間,例如在UCI-Message社交網(wǎng)絡(luò)數(shù)據(jù)集上設(shè)為20%,在Wiki-Talk大規(guī)模社交網(wǎng)絡(luò)數(shù)據(jù)集上設(shè)為40%,[0046]隨后,本發(fā)明基于修正后的掩碼概率Pe?j,通過伯努利采樣(Bernoulli其中,Mask(e)=1表示[0050]4.1為提取每個(gè)時(shí)間步保留子圖的結(jié)構(gòu)特征表示,本發(fā)明在圖結(jié)構(gòu)編碼階段引入[0051]4.2為提升模型對(duì)節(jié)點(diǎn)行為隨時(shí)間演化趨勢(shì)的建模能力,本發(fā)明在圖結(jié)構(gòu)特征提{hv,t-L+1,hv,t-L+2…,h,t},通過設(shè)定窗口長(zhǎng)度W與滑動(dòng)步長(zhǎng)S,構(gòu)造出M段重本發(fā)明對(duì)每段滑動(dòng)窗口序列Sm(V)執(zhí)行一維快速傅里葉變換(FFT),將其映射至為建模節(jié)點(diǎn)在不同頻率通道上的周期性偏好,計(jì)算第j個(gè)頻率通道的能量歸一化Em(v)=[Em(v),Em(v),…,Em(vFm(v)=Fm(v)·diag(Softmaxhv,t=ReLU(IFFT(F(v)))該機(jī)制在保持計(jì)算效率的同時(shí),通過滑動(dòng)窗口提升了模型對(duì)節(jié)點(diǎn)行為動(dòng)態(tài)的感知能力。重疊窗口設(shè)計(jì)可緩解時(shí)間邊界信息缺失的問題,指標(biāo)上均提升約4.7%~6.2%,并在結(jié)構(gòu)變化劇烈的時(shí)間區(qū)段表現(xiàn)出更強(qiáng)的穩(wěn)定性與魯棒性。針對(duì)現(xiàn)有動(dòng)態(tài)圖鏈路預(yù)測(cè)方法在訓(xùn)練過程中存在的重要結(jié)構(gòu)信息被掩蓋后直接劃分為兩個(gè)互補(bǔ)子圖:被掩蓋的邊構(gòu)成的子圖集合Gm={Gm,Gm…,Gm},以及未被掩模能力。[0060]5.2為進(jìn)一步完成鏈路預(yù)測(cè)任務(wù),本發(fā)明將圖神經(jīng)網(wǎng)絡(luò)提取的節(jié)點(diǎn)特征嵌入輸入式中,和分別表示節(jié)點(diǎn)u和節(jié)點(diǎn)v在時(shí)間步t的特征表示,,為預(yù)測(cè)結(jié)對(duì)動(dòng)態(tài)圖整體結(jié)構(gòu)的理解;第二項(xiàng)計(jì)算保留邊E的損失,以保證模型準(zhǔn)確學(xué)習(xí)已有的關(guān)鍵預(yù)測(cè)精度的同時(shí),增強(qiáng)了模型在真實(shí)圖結(jié)構(gòu)不完整場(chǎng)景下的魯棒性與泛化能力。在UCI-基于用戶歷史交互行為和圖結(jié)構(gòu)演化趨勢(shì),預(yù)測(cè)未來時(shí)間片中用戶之間可能新增的交互UCI-Message是一個(gè)收集自加州大學(xué)歐文分校的私信社交網(wǎng)絡(luò)數(shù)據(jù)集,包含1899個(gè)用戶節(jié)點(diǎn)與59835條時(shí)間戳邊,劃分為28個(gè)時(shí)間快照,反映用戶之間的私信行交互趨勢(shì)的精準(zhǔn)建模。相較于最優(yōu)基線模型平均提升約7.6%,顯著增強(qiáng)了潛在通信關(guān)系的MOOC數(shù)據(jù)集記錄了7144名用戶與97個(gè)課程目標(biāo)之間的課程行為軌跡,包括總邊數(shù)達(dá)411,749條,劃分為30個(gè)時(shí)間快照。用戶在該平臺(tái)中的活躍度差異大,行為變過度建模造成模型泛化能力下降。同時(shí),頻域增強(qiáng)模塊有效捕捉了用戶行為的課程周期性變化特征。在預(yù)測(cè)未來學(xué)習(xí)行為(如是否繼續(xù)交互)方面,本模型在Accuracy、AUC、MRR和Recall@10四個(gè)指標(biāo)上均達(dá)到最優(yōu),特別是在準(zhǔn)確率Accuracy相較于最優(yōu)基線模型提升約9.5%,說明模型對(duì)教育平臺(tái)中用戶興趣演化趨勢(shì)具有極強(qiáng)的建模能力。[0068](3)WikiWiki-Talk是維基百科用戶之間通過編輯討論頁形成的超大規(guī)模社交協(xié)作網(wǎng)絡(luò),包含超過114萬個(gè)用戶節(jié)點(diǎn)與780萬條時(shí)間戳邊,跨度2320天,劃分為73個(gè)快照。該網(wǎng)絡(luò)結(jié)構(gòu)[0069]面對(duì)該類大規(guī)模、高稀疏圖數(shù)據(jù),傳統(tǒng)動(dòng)態(tài)圖模型易出現(xiàn)內(nèi)存溢出(00M)等運(yùn)行瓶頸。而本發(fā)明通過活躍度掩碼策略顯著壓縮了輸入圖結(jié)構(gòu),邊數(shù)平均減少約30%-40%,確保了訓(xùn)練過程的穩(wěn)定性與可擴(kuò)展性。頻域增強(qiáng)模塊幫助模型聚焦于長(zhǎng)期行為節(jié)奏,緩解了時(shí)間跨度大、分布漂移強(qiáng)的問題。最終在Wiki-Talk數(shù)據(jù)集上,本發(fā)明實(shí)現(xiàn)了94.31%的準(zhǔn)確率Accuracy和63.4%的Recall@10,有效應(yīng)對(duì)了超大規(guī)模社交網(wǎng)絡(luò)中的關(guān)系預(yù)測(cè)任務(wù)。本實(shí)施例提供一種基于掩碼機(jī)制的離散動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)鏈路預(yù)測(cè)系統(tǒng),包括:本發(fā)明的動(dòng)態(tài)圖鏈路預(yù)測(cè)方法整體由六個(gè)主要功能模塊組成,包括離散動(dòng)態(tài)圖快照構(gòu)建模塊101、節(jié)點(diǎn)活躍度分?jǐn)?shù)計(jì)算模塊102、基于活躍度的動(dòng)態(tài)掩碼模塊105、多層圖卷積網(wǎng)絡(luò)編碼模塊106、自適應(yīng)頻域增強(qiáng)特征建模模塊107、自監(jiān)督對(duì)比學(xué)習(xí)優(yōu)化模塊108和鏈路預(yù)測(cè)下游應(yīng)用模塊109,其系統(tǒng)結(jié)構(gòu)如圖1所示。以下對(duì)各模塊進(jìn)行詳細(xì)說明:離散動(dòng)態(tài)圖快照構(gòu)建模塊101:本模塊依據(jù)步驟1中所述方法,將連續(xù)時(shí)間戳的交互日志劃分為若干離散時(shí)間窗口,并在每個(gè)時(shí)間步生成對(duì)應(yīng)的圖快照,包括鄰接矩陣和節(jié)點(diǎn)特征矩陣。該構(gòu)建方式完整保留了節(jié)點(diǎn)交互的時(shí)間演化模式,為后續(xù)動(dòng)態(tài)圖建模提供基礎(chǔ)結(jié)構(gòu)輸入。[0071]節(jié)點(diǎn)活躍度分?jǐn)?shù)計(jì)算模塊102:本模塊根據(jù)步驟2中提出的方法,分別計(jì)算節(jié)點(diǎn)的動(dòng)態(tài)變化分?jǐn)?shù)(局部鄰域結(jié)構(gòu)變化強(qiáng)度)與節(jié)點(diǎn)重要性分?jǐn)?shù)(全局圖結(jié)構(gòu)影響力),并加權(quán)融合為最終節(jié)點(diǎn)活躍度評(píng)分,為掩碼策略提供重要依據(jù)。[0072]基于活躍度的動(dòng)態(tài)掩碼模塊105:本模塊基于步驟3提出的自監(jiān)督時(shí)間掩碼機(jī)制,使用節(jié)點(diǎn)活躍度信息自適應(yīng)確定邊的掩蓋概率,并通過全局歸一化調(diào)控掩碼比例,最終劃分為掩碼邊集合與保留邊集合,以供后續(xù)模塊使用。其中被掩蓋邊將不參與圖結(jié)構(gòu)編碼,但仍作為正樣本輸入至結(jié)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 課件的數(shù)目教學(xué)課件
- 醫(yī)用超聲設(shè)備在婦產(chǎn)領(lǐng)域的應(yīng)用
- 2026年情緒消費(fèi)金融服務(wù)項(xiàng)目營(yíng)銷方案
- 2026年碳纖維隨身錢包項(xiàng)目營(yíng)銷方案
- 醫(yī)用耗材產(chǎn)業(yè)鏈上下游分析及市場(chǎng)前景展望及挑戰(zhàn)
- 再生醫(yī)學(xué)在臨床應(yīng)用中的挑戰(zhàn)
- 柴油現(xiàn)場(chǎng)加油安全培訓(xùn)課件
- 中醫(yī)治療慢性疲勞綜合癥策略講座分享
- 課件的使用評(píng)價(jià)
- 醫(yī)療教育改革與發(fā)展
- 書黃筌畫雀文言文課件
- 基于數(shù)字孿生的深海石油鉆井裝備制造過程優(yōu)化-洞察及研究
- 陪診師醫(yī)學(xué)知識(shí)培訓(xùn)總結(jié)課件
- 項(xiàng)目驗(yàn)收過程標(biāo)準(zhǔn)化手冊(cè)
- 土地復(fù)墾項(xiàng)目施工組織設(shè)計(jì)方案書
- 民航旅客運(yùn)輸(第二版) 課件 模塊3-國(guó)際航空旅客運(yùn)價(jià)基礎(chǔ)
- 五臟與五味的課件
- 高職院校五年一貫制人才培養(yǎng)模式研究
- JJF(石化)003-2023膩?zhàn)幽と犴g性測(cè)定儀校準(zhǔn)規(guī)范
- 主題活動(dòng)三“鏟屎官”的煩惱說課稿-2025-2026學(xué)年小學(xué)綜合實(shí)踐活動(dòng)蘇少版新疆專用2024四年級(jí)上冊(cè)-蘇少版(新疆專用2024)
- 浙江東海新材料科技股份有限公司新建年產(chǎn)15000噸TDM項(xiàng)目環(huán)評(píng)報(bào)告
評(píng)論
0/150
提交評(píng)論