CN114037550B 一種動(dòng)態(tài)社交網(wǎng)絡(luò)表示學(xué)習(xí)方法(成都博智云創(chuàng)科技有限公司)_第1頁
CN114037550B 一種動(dòng)態(tài)社交網(wǎng)絡(luò)表示學(xué)習(xí)方法(成都博智云創(chuàng)科技有限公司)_第2頁
CN114037550B 一種動(dòng)態(tài)社交網(wǎng)絡(luò)表示學(xué)習(xí)方法(成都博智云創(chuàng)科技有限公司)_第3頁
CN114037550B 一種動(dòng)態(tài)社交網(wǎng)絡(luò)表示學(xué)習(xí)方法(成都博智云創(chuàng)科技有限公司)_第4頁
CN114037550B 一種動(dòng)態(tài)社交網(wǎng)絡(luò)表示學(xué)習(xí)方法(成都博智云創(chuàng)科技有限公司)_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

(19)國家知識產(chǎn)權(quán)局(12)發(fā)明專利楊澤鵬.基于演化特征深度學(xué)習(xí)的鏈路預(yù)測方法研究.中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫.2022,全文.審查員張小霞道中段1800號移動(dòng)互聯(lián)創(chuàng)業(yè)大廈G1-有限公司51230專利代理師朱丹本發(fā)明公開了一種動(dòng)態(tài)社交網(wǎng)絡(luò)表示學(xué)習(xí)在學(xué)習(xí)同時(shí)保留真實(shí)社交網(wǎng)絡(luò)的演化模式和社社區(qū)結(jié)構(gòu)這些社交網(wǎng)絡(luò)的重要因素共同建模社時(shí)保留節(jié)點(diǎn)的網(wǎng)絡(luò)結(jié)構(gòu)和動(dòng)態(tài)特征學(xué)習(xí)節(jié)點(diǎn)的世文網(wǎng)地三(2步驟1:構(gòu)建動(dòng)態(tài)網(wǎng)絡(luò)序列,基于給定的一組時(shí)間步{1,2,…,T},對于其中某一時(shí)間步個(gè)序列G={G(1),G(2),…,GT)};步驟2:社區(qū)劃分,根據(jù)網(wǎng)絡(luò)的結(jié)構(gòu),并標(biāo)記每個(gè)節(jié)點(diǎn)所處的社區(qū);由于動(dòng)態(tài)網(wǎng)絡(luò)隨時(shí)間演化,因此需要對每一時(shí)間步的網(wǎng)絡(luò)進(jìn)行社區(qū)劃分成一個(gè)開放三元組(V;,V;,Vk):用戶Vi和Vj互相不認(rèn)識,但他們有一個(gè)共同好友Vk;共同好友Vk會決定是否在下一時(shí)間步介紹Vi和Vj步驟4:基于同質(zhì)性和社區(qū)結(jié)構(gòu)保留網(wǎng)絡(luò)結(jié)構(gòu)特征,依步驟6:結(jié)合網(wǎng)絡(luò)演化特征和結(jié)構(gòu)特征進(jìn)行嵌入得到每個(gè)節(jié)點(diǎn)的特征表示;對三個(gè)損失體優(yōu)化問題為:其中,是歸一化項(xiàng),設(shè)置潛在空間維數(shù)為d,點(diǎn)嵌入表示U={U(1),u(2,…,U(T)3和社會策略參數(shù)θ;表示保留同質(zhì)性和社3Vi和Vj在下一時(shí)間步認(rèn)識并建立聯(lián)系的概率相對較??;社區(qū)結(jié)構(gòu):相比Vi和Vj屬于同一社區(qū)的情況,Vk介紹屬于不同社區(qū)的這兩個(gè)朋友需3.根據(jù)權(quán)利要求1所述的一種動(dòng)態(tài)社交網(wǎng)絡(luò)表示學(xué)習(xí)方法,其特征在于,Vk做出決定其中,嵌入向量,分別表示節(jié)點(diǎn)V;和V;在α?xí)r間步的嵌入向量;表示指示社區(qū)由于Vi和V;在網(wǎng)絡(luò)中可能有多個(gè)共同好友,通過進(jìn)一步假設(shè)每個(gè)共同朋友對Vi和Vj4率率集合sa)=〔(i,jIeij?E(a)nei∈E(a+1)}表示用戶Vi和Vj在a+1時(shí)間步成功值,定義g(a)(i,j)指示α?xí)r間步節(jié)點(diǎn)對的連接關(guān)系,表示當(dāng)5CN114037550B權(quán)利要求書:屬于不同社區(qū)且沒有鏈接的頂點(diǎn)對。6一種動(dòng)態(tài)社交網(wǎng)絡(luò)表示學(xué)習(xí)方法技術(shù)領(lǐng)域[0001]本發(fā)明涉及網(wǎng)絡(luò)表示學(xué)習(xí)領(lǐng)域,具體涉及一種動(dòng)態(tài)社交網(wǎng)絡(luò)表示學(xué)習(xí)方法。背景技術(shù)[0002]互聯(lián)網(wǎng)時(shí)代的來臨誕生了許多種類繁多的社交網(wǎng)絡(luò)服務(wù)平臺,極大地提高了人們的生活水平。這類平臺我們也稱作在線社會網(wǎng)絡(luò)(OnlineSocialNetwork,OSN),如國內(nèi)的與分析具有較高的商業(yè)價(jià)值和學(xué)術(shù)價(jià)值,吸引了大批國內(nèi)外學(xué)者進(jìn)行研究。例如,對社交網(wǎng)絡(luò)中信息擴(kuò)散問題的研究可以應(yīng)用于謠言檢測、輿情引導(dǎo)和影響力最大化等場景。但當(dāng)今在線社交網(wǎng)絡(luò)不斷累積的海量豐富數(shù)據(jù),給社交網(wǎng)絡(luò)分析帶來了新的機(jī)遇與挑戰(zhàn)。[0003]網(wǎng)絡(luò)表示學(xué)習(xí)(NetworkRepresentationLearning,NRL),又可以稱作“網(wǎng)絡(luò)嵌入(Networkembedding,NE)”,是社交網(wǎng)絡(luò)分析任務(wù)中的一個(gè)基礎(chǔ)與關(guān)鍵問題,旨在將社交網(wǎng)絡(luò)映射到一個(gè)低維向量空間,同時(shí)最大化保留網(wǎng)絡(luò)中節(jié)點(diǎn)的屬性特征。機(jī)器學(xué)習(xí)算法的性能很大程度上取決于所應(yīng)用的數(shù)據(jù)表示形式或特征的選擇。而網(wǎng)絡(luò)表示學(xué)習(xí)通過將輸入數(shù)據(jù)轉(zhuǎn)換為有效的特征表示,可以提高算法的性能。因此深度學(xué)習(xí)技術(shù)與網(wǎng)絡(luò)表示學(xué)習(xí)結(jié)合來解決實(shí)際問題取得了顯著的效果。伴隨著深度學(xué)習(xí)技術(shù)的發(fā)展,對社交網(wǎng)絡(luò)的表示學(xué)習(xí)研究工作目前仍處于高速發(fā)展時(shí)期,各類方法層出不窮,成為了當(dāng)下研究的熱點(diǎn)。[0004]早期的社交網(wǎng)絡(luò)表示學(xué)習(xí)主要基于靜態(tài)社交網(wǎng)絡(luò)進(jìn)行研究,解決方案是通過一些降維方法(如矩陣分解、深度自編碼器、深度學(xué)習(xí)等)將靜態(tài)網(wǎng)絡(luò)的高維結(jié)構(gòu)嵌入到一個(gè)低維的表示空間中。其主要思想是網(wǎng)絡(luò)中相似的節(jié)點(diǎn)在嵌入式表示空間中應(yīng)該更接近。這些方法有以下兩個(gè)顯著缺點(diǎn):[0005]1.難以反映社交網(wǎng)絡(luò)隨時(shí)間演化的動(dòng)態(tài)特性。真實(shí)世界的社交網(wǎng)絡(luò)并非一成不變的,而是隨著時(shí)間不斷演化。例如,在線社交平臺中不斷有新的用戶加入,而用戶間也不斷有新的好友關(guān)系產(chǎn)生,這些會導(dǎo)致網(wǎng)絡(luò)中出現(xiàn)新的節(jié)點(diǎn)和連邊。因此,傳統(tǒng)方法只對靜態(tài)網(wǎng)絡(luò)中固定的節(jié)點(diǎn)和連邊進(jìn)行研究,而不考慮網(wǎng)絡(luò)信息的更新,學(xué)習(xí)到的特征表示難以保持真實(shí)網(wǎng)絡(luò)的動(dòng)態(tài)特性。并且,盡管最近提出了少量的對動(dòng)態(tài)社交網(wǎng)絡(luò)表示學(xué)習(xí)的研究,但難以捕獲社交網(wǎng)絡(luò)中不同節(jié)點(diǎn)演化模式的差異。在社交網(wǎng)絡(luò)演化的過程中,具有相似網(wǎng)絡(luò)結(jié)構(gòu)的節(jié)點(diǎn)可能采取不同的演化模式,如是否在未來與他人建立新的聯(lián)系。這反映了不同用戶的性格特征和社交策略等隱含信息,而這些重要的信息無法通過網(wǎng)絡(luò)結(jié)構(gòu)直接獲得。因此,傳統(tǒng)方法無法基于動(dòng)態(tài)社交網(wǎng)絡(luò)演化的基本機(jī)制,衡量網(wǎng)絡(luò)中的多種影響因素并構(gòu)建準(zhǔn)確的演化模型,進(jìn)而難以準(zhǔn)確刻畫網(wǎng)絡(luò)中節(jié)點(diǎn)的不同演化趨勢。[0006]2.難以反映社交網(wǎng)絡(luò)的重要網(wǎng)絡(luò)屬性——社區(qū)結(jié)構(gòu)?,F(xiàn)有的網(wǎng)絡(luò)嵌入方法大多著眼于保持節(jié)點(diǎn)間的局部鄰近性,即依據(jù)同質(zhì)性,高度相連的節(jié)點(diǎn)應(yīng)該緊密地嵌入到潛在的表示空間中。而社區(qū)結(jié)構(gòu)作為社交網(wǎng)絡(luò)最重要的特征之一,能夠揭示復(fù)雜網(wǎng)絡(luò)的隱藏特征,卻在很大程度上被忽略了。例如,在當(dāng)前時(shí)刻的社交網(wǎng)絡(luò)中,兩個(gè)節(jié)點(diǎn)沒有直接相連。如果僅依據(jù)節(jié)點(diǎn)對的連接關(guān)系,則二者的相似度會趨于很小。然而,動(dòng)態(tài)網(wǎng)絡(luò)中的社區(qū)是由功能7[0010]步驟1:構(gòu)建動(dòng)態(tài)網(wǎng)絡(luò)序列,基于給定的一組時(shí)間步{1,2時(shí)間步的子圖構(gòu)成的一個(gè)序列G={G1),G(2時(shí)間演化,因此需要對每一時(shí)間步的網(wǎng)絡(luò)進(jìn)行社區(qū)劃分,a∈[0013]步驟3:基于三元閉包過程保留網(wǎng)絡(luò)演化特征;對Ga,其中三個(gè)滿足以下關(guān)系的用好友v會決定是否在下一時(shí)間步介紹v,和v;認(rèn)識使得開放三元組閉合;在這一過程中影響驟中完全重建,而是隨著時(shí)間的推移平穩(wěn)地演化。為了保持動(dòng)態(tài)網(wǎng)絡(luò)在a時(shí)間步的平滑演三個(gè)損失函數(shù)進(jìn)行優(yōu)化;我們將全局結(jié)構(gòu)損失函數(shù)L)權(quán)重參數(shù)設(shè)為1,采用T,整體優(yōu)化問題為8[0019]其中歸一化項(xiàng),而正則化目標(biāo)在訓(xùn)練中由歸一化技術(shù)處理時(shí)被[0024]用戶相似度:當(dāng)v與v和v,相似時(shí),更傾向于介紹v?和v,在下一時(shí)間步認(rèn)識并建立9附圖說明[0053]圖2是本發(fā)明fb-messages、ia-facebook、ia-contacts和ia-retweet四個(gè)網(wǎng)絡(luò)中[0054]圖3是本發(fā)明fb-messages、ia-facebook、ia-contacts時(shí)間演化,因此需要對每—時(shí)間步的網(wǎng)絡(luò)進(jìn)行社區(qū)劃分cca)={c{a),ca),.…..},a∈{1,好友v會決定是否在下一時(shí)間步介紹v,和v;認(rèn)識使得開放三元組閉合;在這一過程中影響失函數(shù)L如下:[0070]本發(fā)明的工作原理/工作過程為:動(dòng)態(tài)網(wǎng)絡(luò)表示學(xué)習(xí)問題在學(xué)術(shù)界有比較廣泛的[0083]但是本方案與上述6項(xiàng)技術(shù)完全不同,本方案能夠?qū)W習(xí)同時(shí)保留真實(shí)社交網(wǎng)絡(luò)的[0085]本實(shí)例為四個(gè)真實(shí)社交網(wǎng)絡(luò)數(shù)據(jù)集,包括fb-messages、ia-facebook、ia-社交網(wǎng)絡(luò)步數(shù)697n26[0088]步驟1:對于每一個(gè)數(shù)據(jù)集,我們首先構(gòu)建相應(yīng)的動(dòng)態(tài)網(wǎng)絡(luò)序列G={G①),G(2),…,G①},然后通過本發(fā)明學(xué)習(xí)各個(gè)節(jié)點(diǎn)在不同時(shí)間步的低維向量U={U①,U2),…,U①}。[0089]步驟2:為了驗(yàn)證提出方法的性能,本實(shí)例選取五種經(jīng)典的網(wǎng)絡(luò)表示學(xué)習(xí)方法作對是靜態(tài)網(wǎng)絡(luò)表示學(xué)習(xí)模型,而DynamicTriad和TNE是動(dòng)態(tài)網(wǎng)絡(luò)表示學(xué)習(xí)模型。權(quán)衡計(jì)算復(fù)雜度和計(jì)算性能后,我們采用維數(shù)d=48進(jìn)行性能比較。[0090]步驟3:本實(shí)例采用所有的方法獲得節(jié)點(diǎn)的嵌入向量,利用學(xué)習(xí)到的節(jié)點(diǎn)的嵌入向量來構(gòu)造網(wǎng)絡(luò)中邊的特征表示。對每條邊,e=lu-u;|,其中定義絕對值符號表示對相減后的向量的每個(gè)分量執(zhí)行作絕對值運(yùn)算。再將得到的邊的特征表示作為輸入,應(yīng)用于四個(gè)社會網(wǎng)絡(luò)具體任務(wù):鏈路重建、鏈路預(yù)測、改變的鏈路重建和改變的鏈路預(yù)測。然后從不同的時(shí)間步收集所有的正負(fù)樣本,并使用logistic回歸模型作為分類器。最后,在收集的樣本集上重復(fù)10次5倍交叉驗(yàn)證,并比較平均性能。權(quán)衡計(jì)算復(fù)雜度和性能后,對于所有的模型,網(wǎng)絡(luò)節(jié)點(diǎn)表示向量的維度設(shè)為48維。[0091]步驟4:本實(shí)例采用F1-score指標(biāo)來評估所提出方法的性能。對于每條鏈接,實(shí)驗(yàn)[0092]表2混淆矩陣真實(shí)類預(yù)測類別別例例正例負(fù)例[0095]F1-score指標(biāo)的計(jì)算公式為:[0099]步驟5:在實(shí)驗(yàn)中,我們對每個(gè)方法進(jìn)行5次隨機(jī)重復(fù)實(shí)驗(yàn),并取平均值作為最后結(jié)果。圖2和圖3分別為本發(fā)明fb-messages、ia-facebook、ia-contacts和ia-retweet四個(gè)網(wǎng)絡(luò)中應(yīng)用于鏈路重建和鏈路預(yù)測的F1-score值結(jié)果對比。實(shí)驗(yàn)結(jié)果表明本發(fā)明相比經(jīng)典算法具有顯著優(yōu)越性。[0101](1)本發(fā)明基于動(dòng)態(tài)網(wǎng)絡(luò)進(jìn)行表示學(xué)習(xí),性能明顯優(yōu)于另外三種靜態(tài)網(wǎng)絡(luò)表示學(xué)的演化更符合真實(shí)網(wǎng)絡(luò)的特性,網(wǎng)絡(luò)演化模式提供了更豐富的信息。[0102](2)與動(dòng)態(tài)網(wǎng)絡(luò)表示學(xué)習(xí)方法TNE相比,本發(fā)明的性能更優(yōu),說明通過建模分析三元閉包來作為網(wǎng)絡(luò)演化機(jī)制能夠捕獲社交網(wǎng)絡(luò)中不同節(jié)點(diǎn)演化模式的差異,學(xué)習(xí)到的低維表示更具判別性。[0103](3)與動(dòng)態(tài)網(wǎng)絡(luò)表示學(xué)習(xí)方法DynamicTriad相比,本發(fā)明由于使用了三種社交網(wǎng)絡(luò)的重要因素來增強(qiáng)三元閉包過程,并且在網(wǎng)絡(luò)節(jié)點(diǎn)表示中結(jié)合社區(qū)結(jié)構(gòu)提供有效且豐富的信息來補(bǔ)充局部結(jié)構(gòu),因此也得到了性能上的提升。[

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論