CN115293437B 一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方法 (重慶郵電大學)_第1頁
CN115293437B 一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方法 (重慶郵電大學)_第2頁
CN115293437B 一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方法 (重慶郵電大學)_第3頁
CN115293437B 一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方法 (重慶郵電大學)_第4頁
CN115293437B 一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方法 (重慶郵電大學)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

(12)發(fā)明專利(22)申請日2022.08.15(43)申請公布日2022.11.04路2號(56)對比文件Wei,SH(Wei,Shihong);W(Wang,Liangyu);Wu,HJ(WuMG(Zhou,Minguo);Li,Q(Li,QiaYP(Xiao,Yunpeng).LinkpredictionmethodhierarchicalandprogressiveuserTT2veeHP2S3.通過交互信息構(gòu)建分層遞進式用戶交互矩陣序列,將其與文本特征表示進行卷積S7.重復步驟S5-S6得到社交網(wǎng)絡中每個用戶節(jié)點的新特征,2.根據(jù)權利要求1所述的一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方法,其特征在S211.通過分詞器處理文本信息構(gòu)建各用戶的用戶詞典,并對用戶詞典中的每個詞進S212.一條內(nèi)容中所有詞對應的詞向量構(gòu)成一個詞序列;根據(jù)原創(chuàng)內(nèi)容和轉(zhuǎn)發(fā)內(nèi)容的S213.選取用戶i的s個原創(chuàng)詞序列或s個轉(zhuǎn)發(fā)詞序列,按照時間順序構(gòu)成用戶i的時序3Ci={C…cis},C{表示第i個用戶在t時刻的時序文本序列,表示第i個用戶在t時刻3.根據(jù)權利要求1所述的一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方法,其特征在4.根據(jù)權利要求1所述的一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方法,其特征在4一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方法技術領域[0001]本發(fā)明涉及社交網(wǎng)絡關系預測領域,具體涉及一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方法。背景技術[0002]社交網(wǎng)絡中的關系預測是指利用已經(jīng)存在的鏈接預測用戶之間未來產(chǎn)生交互,并建立鏈接的可能性。建立鏈接在社交網(wǎng)絡鄰域代表的其實就是用戶之間產(chǎn)生的交互行為,也即社交行為。傳統(tǒng)上,人與人之間的交往通常都是發(fā)生在某個確定的時間以及空間,兩個等社交網(wǎng)絡的興起,人們摒棄了傳統(tǒng)社交的距離限制,可以通過在線社交平臺與相隔萬里的人成為朋友,這對人們生活的各個方面都有重要意義。隨著在線社交平臺的發(fā)展速度,為了幫助社交平臺留住用戶,進行更準確的好友推薦,鏈接預測成為了社交網(wǎng)絡中的重要研究方向。在傳統(tǒng)鏈接預測的研究中,并未考慮交互行為之間存在的隱藏信息對于整個社交網(wǎng)絡演化的影響。因此,開展對不同的交互行為,以及交互行為之間隱藏信息的研究,對社交網(wǎng)絡信息挖掘和預測具有重要作用。每個快照上套用靜態(tài)圖的方法更高效。DDNE用GRU作為編碼器來捕獲動態(tài)網(wǎng)絡中的時間信息,從而在動態(tài)網(wǎng)絡中進行鏈接預測?;趎ode2vec靜態(tài)網(wǎng)絡表示學習模型,它利用隨機游走來捕獲網(wǎng)絡中的鄰近性,并將所有節(jié)點映射到一個保持鄰近性的低維表示空間中。GCN構(gòu)建了一個半監(jiān)督的節(jié)點嵌入模型,通過對網(wǎng)絡拓撲結(jié)構(gòu)和網(wǎng)絡節(jié)點特征進行編碼,從而得到了含有豐富信息的節(jié)點表示。雖然眾多學者在動態(tài)網(wǎng)絡鏈接預測這一領域已經(jīng)做的很好了,但是在交互規(guī)律這一塊,卻還沒有人通過構(gòu)建分層遞進式交互網(wǎng)絡去捕捉這種潛在的特征,即使構(gòu)建圖快照,也僅是考慮時間的因素,沒有考慮到交互行為之間的遞進順序,本文針對人類潛移默化的社交規(guī)律進行了深度研究。發(fā)明內(nèi)容[0004]為解決上述問題,本發(fā)明提供了一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方[0005]S1.在線獲取用戶數(shù)據(jù),其包括用戶在社交網(wǎng)絡中的交互信息和文本信息;[0006]S2.采用負采樣模型對文本信息進行處理得到詞序列,通過詞序列構(gòu)建文本序列,將文本序列輸入LSTM網(wǎng)絡得到文本特征表示;[0007]S3.通過交互信息構(gòu)建分層遞進式用戶交互矩陣序列,將其與文本特征表示進行卷積得到分層遞進式的用戶文本交互快照圖序列,將用戶文本交互快照圖序列輸入LSTM網(wǎng)絡得到交互網(wǎng)絡結(jié)構(gòu)特征表示;5[0014]S211.通過分詞器處理文本信息構(gòu)建各用戶的用戶詞典,并對用戶[0015]S212.一條內(nèi)容中所有詞對應的詞向量構(gòu)成一個詞序列;根據(jù)原創(chuàng)內(nèi)容和轉(zhuǎn)發(fā)內(nèi)[0016]S213.選取用戶i的s個原創(chuàng)詞序時序文本序列C{;N個用戶的時序文本序列組成一個文本向量矩[0018]其中,Ct=[C?,…,C{,…,Ct]為N個用戶的時序文本序列組成的文本向量矩陣,Ct={c…cis},C{表示第i個用戶在t時刻的時序文本序列,表示第i個用戶在t時刻6[0029]其中,Sim(u;,UjeN;)表示用戶節(jié)點u?和u;間的相關性,Gu;表示用戶節(jié)點u的強[0034]本發(fā)明提出了一種基于社交網(wǎng)絡動態(tài)交互的關系預測方法,將交互行為之間的潛在關系引入進來,不僅可以更準確的進行社交網(wǎng)絡鏈接預測,還可以分析出用戶之間所建立鏈接的類型。主要通過構(gòu)建分層遞進式交互矩陣的方式對交互網(wǎng)絡中人類遵循的交往規(guī)律進行提取,以前大多數(shù)學者,都是通過構(gòu)建時序鏈路預測模型對社交網(wǎng)絡的動態(tài)特征提取,本發(fā)明將所有變化記錄在一張圖上,然后通過多種交互行為,對一張圖進行分割,提取出不同行為的網(wǎng)絡結(jié)構(gòu)圖,具體地,在實施例中采用微博數(shù)據(jù)進行試驗測試,一個月內(nèi)28天,將前27天的所有數(shù)據(jù)記錄在一張圖上,然后通過多種交互行為,對一張圖進行分割,提取出不同行為的網(wǎng)絡結(jié)構(gòu)圖,從而進行后續(xù)預測;考慮到交互行為的遞進關系,又對這種鄰接矩陣進行向前求和處理,使得經(jīng)過LSTM網(wǎng)絡后能夠多的提取出更加重要的交互特征。為了增強本發(fā)明中用戶節(jié)點的表示,本發(fā)明使用強相關用戶組和注意力網(wǎng)絡重新構(gòu)建了節(jié)點附圖說明[0035]圖1為本發(fā)明實施例的流程圖;[0036]圖2為本發(fā)明實施例的TT2vec算法表示隱藏信息示意圖;[0037]圖3為本發(fā)明實施例的HPIN2vec示意圖;[0038]圖4為本發(fā)明實施例的鏈接預測模型圖。具體實施方式[0039]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。7[0040]在一實施例中,如圖1、圖4所示,一種基于社交網(wǎng)絡平臺動態(tài)交互的關系預測方[0041]S1.在線獲取用戶數(shù)據(jù):[0042]獲取用戶數(shù)據(jù)的方式不局限于一種,其可以從公開的數(shù)據(jù)網(wǎng)站獲取,也可以利用成熟的社交網(wǎng)絡公共API進行獲取。這里需要獲取的是用戶轉(zhuǎn)發(fā)和原創(chuàng)的文本數(shù)據(jù)(文本信息),以及在不同的交互行為下形成的網(wǎng)絡結(jié)構(gòu)數(shù)據(jù),也即歷史行為數(shù)據(jù)(交互信息)。文本數(shù)據(jù)需要得到文本發(fā)布或者轉(zhuǎn)發(fā)的時間,以便后續(xù)TT2vec的時序文本處理。[0043]具體地,獲取原始的用戶數(shù)據(jù)后對其進行數(shù)據(jù)清洗,通常獲取的原始數(shù)據(jù)都是非結(jié)構(gòu)化的,不能直接用于數(shù)據(jù)分析。通過簡單的數(shù)據(jù)清洗可以使大部分非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化,使得異常值或空值不再出現(xiàn),減少對于后續(xù)計算帶來的不便。采用數(shù)據(jù)庫存儲清洗后的用戶數(shù)據(jù),通過表結(jié)構(gòu)使數(shù)據(jù)進一步的規(guī)范化,同時提高數(shù)據(jù)的檢索效率和表間關系的映[0044]S2.獲取用戶興趣發(fā)現(xiàn)和社交規(guī)律發(fā)現(xiàn):[0045]對于用戶興趣發(fā)現(xiàn),本實施例從用戶在社交網(wǎng)絡發(fā)布以及轉(zhuǎn)發(fā)的文本信息中動態(tài)提取影響用戶建立鏈接的興趣因素,通過設計TT2vec(TimingTexttovector)算法來發(fā)現(xiàn)用戶和發(fā)布的文本間隱藏的動態(tài)信息,計算文本信息網(wǎng)絡,分析用戶當前以及接下來的興趣偏好信息;[0046]對于社交規(guī)律發(fā)現(xiàn),本實施例引入分層遞進式用戶交互矩陣,構(gòu)建基于文本特征[0047]在一實施例中,設計TT2vec算法來構(gòu)建用戶和所屬文本間的隱藏信息,從而計算文本信息網(wǎng)絡,實現(xiàn)用戶興趣發(fā)現(xiàn),如圖2所示,包括:采用負采得到詞序列,通過詞序列構(gòu)建時序文本序列,將時序文本序列輸入LSTM網(wǎng)絡得到文本特征表示(文本信息網(wǎng)絡)。[0049]S210.獲取N個用戶的文本信息,即每個用戶最近一個月內(nèi)在微博社交網(wǎng)絡上發(fā)布的所有原創(chuàng)微博和轉(zhuǎn)發(fā)微博的文本;[0050]S211.通過分詞器處理文本信息構(gòu)建各用戶的用戶詞典,通過index-word、word-index以及one-hot對用戶詞典中的每個詞進行編碼;將編碼后的詞輸入負采樣模型得到該詞的詞向量,詞向量的維度為1;[0051]具體地,本實施例采用的負采樣模型是基于負采樣的skip-gram模型,為了降低與輸入詞(本實施例中指編碼后的詞)不相關的其他噪聲詞對輸出(本實施例中指用戶詞典中的每個詞的詞向量)的影響和計算復雜度,其目標函數(shù)表示為:[0053]其中,M,neg分別表示用戶詞典中的單詞總數(shù)和負采樣單詞總數(shù),σ(·)表示sigmoid函數(shù),c表示用戶詞典中第i個單詞w的輸入向量(編碼后的單詞w),o,ow表示上下文輸出向量和噪聲詞輸出向量。8[0054]S212.一條微博的文本中所有詞對應的詞向量構(gòu)成一個詞序列;交互矩陣序列,將其與文本特征表示進行卷積得到分層遞進式的用戶文本交互快照圖序[0065]S221.每一種交互行為構(gòu)建一個鄰接矩陣,將鄰接矩陣根據(jù)交互行為產(chǎn)生關系鏈9層遞進式用戶交互矩陣序列中第n層的遞進交互矩陣,M={M?,M?,…,M}。[0070]S223.為了進一步處理用戶自身信息之外的交互特征以及構(gòu)建統(tǒng)一化的表達矩陣,為了只獲取交互行為的特征,不會對用戶自身信息特征造成衰減,去除圖卷積網(wǎng)絡中的作為圖卷積網(wǎng)絡模型的輸入,將其分別與分層遞進式用戶交互矩陣序列M={M?,M?,…,M}中的遞進交互矩陣做卷積運算,獲得分層遞進式的用戶文本交互快照圖序列,簡單表示為:[0072]G?表示用戶文本交互快照圖序列中的第一個卷積結(jié)果,是由M?與C+1卷積得到的;[0073]S224.為了獲得網(wǎng)絡結(jié)構(gòu)的演變信息,將用戶文本交互快照圖序列輸入LSTM網(wǎng)絡[0075]S3.將文本特征表示與交互網(wǎng)絡結(jié)構(gòu)特征表示融合,得到用戶特征表示:點u的初步特征向量。[0078]S4.計算用戶特征表示中用戶節(jié)點u;與其余用戶節(jié)點的相關性,并進行降序排列,從序列中選取前k個相關性對應的用戶節(jié)點構(gòu)成用戶節(jié)點u的強相關用戶組Gui。[0079]通過計算節(jié)點向量間的相似度來獲得用戶之間的相關性,節(jié)點間的相似度越高,相關性也就越強。[0082]其中,ux、u,為用戶特征表示中的步特征向量的維度。[0083]S5.將用戶節(jié)點u的強相關用戶組輸入圖注意力模型GAT,得到用戶節(jié)點u的新特征V(u)'。表示得到強相關用戶組后的用戶節(jié)點u?的特征向量,V(u,)表示用戶節(jié)點u的強相關用戶[0094]關系預測模型最終的輸出值表示用戶u;和其鄰居之間建立連接的鏈接強度等級,示預測的鏈接強度等級為1,用戶節(jié)點u和u;間可能建立點贊鏈接關系;Y=2表示預測的鏈為3,用戶節(jié)點u和u;間可能建立轉(zhuǎn)發(fā)鏈接關系;Y=4表示11點u和u;間可能建立關注鏈接關系,U、L、C、Fd、Fw為超參數(shù)[0097]具體地,在關系預測模型的訓練過程使用損失函數(shù)計算損失,其表示為:[0099]其中,P,表示用戶在不同連接類型下的相似概率,Y表示預測的鏈接強度等級。“旋轉(zhuǎn)”等術語應做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或成一體;可以是機械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連,可以是兩個元件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論