CN114201683B 一種基于多級匹配的興趣激活新聞推 薦方法及系統(tǒng)(齊魯工業(yè)大學(xué)(山東省科學(xué)院))_第1頁
CN114201683B 一種基于多級匹配的興趣激活新聞推 薦方法及系統(tǒng)(齊魯工業(yè)大學(xué)(山東省科學(xué)院))_第2頁
CN114201683B 一種基于多級匹配的興趣激活新聞推 薦方法及系統(tǒng)(齊魯工業(yè)大學(xué)(山東省科學(xué)院))_第3頁
CN114201683B 一種基于多級匹配的興趣激活新聞推 薦方法及系統(tǒng)(齊魯工業(yè)大學(xué)(山東省科學(xué)院))_第4頁
CN114201683B 一種基于多級匹配的興趣激活新聞推 薦方法及系統(tǒng)(齊魯工業(yè)大學(xué)(山東省科學(xué)院))_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

(19)國家知識產(chǎn)權(quán)局(12)發(fā)明專利審查員蔡秀梅3501號公司37221專利代理師楊琪一種基于多級匹配的興趣激活新聞推薦方本發(fā)明提供了一種基于多級匹配的興趣激點擊新聞的不同相似度下的局部興趣匹配排名新聞的概率,基于預(yù)測概率向用戶推薦候選新C解過8出目21.一種基于多級匹配的興趣激活新聞推薦方法,其特征在于,包括:獲取候選新聞和用戶歷史點擊新聞,分別進行新聞編碼,得到候選新聞表示和用戶歷史點擊新聞表示;基于用戶歷史點擊新聞表示,采用個性化注意力機制,獲得用戶全局興趣特征;所述用戶全局興趣特征為用戶歷史點擊新聞表示的加權(quán)和;基于候選新聞表示和用戶歷史點擊新聞表示,采用目標注意力機制來計算每個用戶歷史點擊新聞和每個候選新聞之間的注意力得分,使用注意力得分對用戶歷史點擊新聞進行加權(quán)計算,獲得用戶動態(tài)興趣特征;基于候選新聞表示和用戶歷史點擊新聞表示,在多個不同的相似度水平上捕捉被點擊新聞和候選新聞在語義上的相關(guān)性,獲得不同層次的每個候選新聞與用戶歷史點擊新聞的局部興趣匹配排名特征;所述局部興趣匹配排名特征的獲取步驟為:基于候選新聞表示和用戶歷史點擊新聞表示,計算關(guān)聯(lián)矩陣;將關(guān)聯(lián)矩陣使用高斯核函數(shù)池化,將關(guān)聯(lián)矩陣中的單詞交互轉(zhuǎn)換成候選新聞的初步匹配排名特征;基于候選新聞的初步匹配排名特征,應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)與最大池化函數(shù)得到每個候選新聞與用戶歷史點擊新聞的局部興趣匹配排聯(lián)合用戶全局興趣特征、動態(tài)興趣特征和局部興趣匹配排名特征,預(yù)測用戶瀏覽每個候選新聞的概率,基于預(yù)測概率向用戶推薦候選新聞。2.如權(quán)利要求1所述的一種基于多級匹配的興趣激活新聞推薦方法,其特征在于,所述新聞編碼的具體步驟為:獲取新聞的標題;使用新聞標題構(gòu)建向量表示,得到新聞標題的單詞向量序列;將新聞標題單詞向量序列輸入卷積神經(jīng)網(wǎng)絡(luò),得到上下文單詞表示向量的序列;將上下文單詞表示向量的序列輸入單詞級注意力網(wǎng)絡(luò),得到新聞的最終表示。3.如權(quán)利要求1所述的一種基于多級匹配的興趣激活新聞推薦方法,其特征在于,所述預(yù)測用戶瀏覽每個候選新聞的概率的具體步驟為:基于所述用戶全局興趣特征、動態(tài)興趣特征和候選新聞表示,計算基于用戶全局興趣的匹配分數(shù)和基于動態(tài)興趣的匹配分數(shù);基于所述局部興趣匹配排名特征,計算局部興趣匹配分數(shù);聯(lián)合基于用戶全局興趣的匹配分數(shù)、基于動態(tài)興趣的匹配分數(shù)和局部興趣匹配分數(shù),計算用戶瀏覽每個候選新聞的概率。4.如權(quán)利要求3所述的一種基于多級匹配的興趣激活新聞推薦方法,其特征在于,所述基于用戶全局興趣的匹配分數(shù)為所述用戶全局興趣特征和候選新聞表示的內(nèi)積。5.如權(quán)利要求3所述的一種基于多級匹配的興趣激活新聞推薦方法,其特征在于,所述基于動態(tài)興趣的匹配分數(shù)為所述動態(tài)興趣特征和候選新聞表示的內(nèi)積。6.一種基于多級匹配的興趣激活新聞推薦系統(tǒng),其特征在于,包括:新聞編碼模塊,其被配置為:獲取候選新聞和用戶歷史點擊新聞,分別進行新聞編碼,得到候選新聞表示和用戶歷史點擊新聞表示;用戶編碼模塊,其被配置為:基于用戶歷史點擊新聞表示,采用個性化注意力機制,獲得用戶全局興趣特征;所述用戶全局興趣特征為用戶歷史點擊新聞表示的加權(quán)和;3目標感知興趣激活模塊,其被配置為:基于候選新聞表示和用戶歷史點擊新聞表示,采用目標注意力機制來計算每個用戶歷史點擊新聞和每個候選新聞之間的注意力得分,使用注意力得分對用戶歷史點擊新聞進行加權(quán)計算,獲得用戶動態(tài)興趣特征;多級匹配交互模塊,其被配置為:基于候選新聞表示和用戶歷史點擊新聞表示,在多個不同的相似度水平上捕捉被點擊新聞和候選新聞在語義上的相關(guān)性,獲得不同層次的每個候選新聞與用戶歷史點擊新聞的局部興趣匹配排名特征;所述局部興趣匹配排名特征的獲取步驟為:基于候選新聞表示和用戶歷史點擊新聞表示,計算關(guān)聯(lián)矩陣;將關(guān)聯(lián)矩陣使用高斯核函數(shù)池化,將關(guān)聯(lián)矩陣中的單詞交互轉(zhuǎn)換成候選新聞的初步匹配排名特征;基于候選新聞的初步匹配排名特征,應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)與最大池化函數(shù)得到每個候選新聞與用戶歷史點擊新聞的局部興趣匹配排名特征;概率預(yù)測模塊,其被配置為:聯(lián)合用戶全局興趣特征、動態(tài)興趣特征和局部興趣匹配排名特征,預(yù)測用戶瀏覽每個候選新聞的概率,基于預(yù)測概率向用戶推薦候選新聞。7.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-5中任一項所述的一種基于多級匹配的興趣激活新聞推薦方法中的步驟。8.一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)如權(quán)利要求1-5中任一項所述的一種基于多級匹配的興趣激活新聞推薦方法中的步驟。4技術(shù)領(lǐng)域[0001]本發(fā)明屬于新聞的個性化推薦技術(shù)領(lǐng)域,尤其涉及一種基于多級匹配的興趣激活新聞推薦方法及系統(tǒng)。背景技術(shù)[0002]本部分的陳述僅僅是提供了與本發(fā)明相關(guān)的背景技術(shù)信息,不必然構(gòu)成在先技術(shù)。[0003]新聞推薦作為推薦系統(tǒng)研究領(lǐng)域的一個重要分支,旨在通過新聞內(nèi)容和用戶信息盡可能多的幫助用戶找到與用戶興趣偏好相匹配的新聞。個性化的新聞推薦對幫助用戶找到自己感興趣的新聞、緩解信息過載至關(guān)重要。隨著基于人工神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)取得了巨大的進步,人們開始嘗試利用經(jīng)典的神經(jīng)網(wǎng)絡(luò)架構(gòu)處理新聞推薦問題。它們通常對每條新聞進行詞嵌入獲得新聞的表示,然后通過整合用戶瀏覽過的歷史新聞來學(xué)習(xí)每個用戶的綜合興趣表示,最后,將該綜合向量表示與候選新聞向量匹配來執(zhí)行推薦。[0004]雖然基于深度學(xué)習(xí)的方法在新聞推薦上取得了一定的成功,但是,也存在著一定的問題。由于新聞的重要語義特征隱含在不同粒度的文本片段中,然而現(xiàn)有的一些深度學(xué)習(xí)方法,將學(xué)習(xí)到的固定用戶特征表示只有在最后一步才能與候選新聞匹配,缺乏文本對詞語之間的交互,造成的信息損失難以衡量。此外,固定的向量也不能充分表達用戶的不同發(fā)明內(nèi)容[0005]為了解決上述背景技術(shù)中存在的技術(shù)問題,本發(fā)明提供一種基于多級匹配的興趣激活新聞推薦方法及系統(tǒng),在考慮候選新聞的情況下,依據(jù)候選新聞的不同來推導(dǎo)用戶興趣的動態(tài)特征向量,進一步加強用戶的興趣表示,增強了預(yù)測用戶瀏覽每個候選新聞的概率的魯棒性和可解釋性。[0006]為了實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:[0007]本發(fā)明的第一個方面提供一種基于多級匹配的興趣激活新聞推薦方法,其包括:[0008]獲取候選新聞和用戶歷史點擊新聞,分別進行新聞編碼,得到候選新聞表示和用戶歷史點擊新聞表示;[0009]基于用戶歷史點擊新聞表示,獲得用戶全局興趣特征;[0010]基于候選新聞表示和用戶歷史點擊新聞表示,采用目標注意力機制來計算每個用戶歷史點擊新聞和每個候選新聞之間的注意力得分,使用注意力得分對用戶歷史點擊新聞進行加權(quán)計算,獲得用戶動態(tài)興趣特征;[0011]基于候選新聞表示和用戶歷史點擊新聞表示,在多個不同的相似度水平上捕捉被點擊新聞和候選新聞在語義上的相關(guān)性,獲得不同層次的每個候選新聞與用戶歷史點擊新聞的局部興趣匹配排名特征;[0012]聯(lián)合用戶全局興趣特征、動態(tài)興趣特征和局部興趣匹配排名特征,預(yù)測用戶瀏覽5每個候選新聞的概率,基于預(yù)測概率向用戶推薦候選新聞。[0013]進一步的,所述新聞編碼的具體步驟為:[0014]獲取新聞的標題;[0015]使用新聞標題構(gòu)建向量表示,得到新聞標題的單詞向量序列;[0016]將新聞標題單詞向量序列輸入卷積神經(jīng)網(wǎng)絡(luò),得到上下文單詞表示向量的序列;[0017]將上下文單詞表示向量的序列輸入單詞級注意力網(wǎng)絡(luò),得到新聞的最終表示。[0018]進一步的,所述局部興趣匹配排名特征的獲取步驟為:[0019]基于候選新聞表示和用戶歷史點擊新聞表示,計算關(guān)聯(lián)矩陣;[0020]將關(guān)聯(lián)矩陣使用高斯核函數(shù)池化,將關(guān)聯(lián)矩陣中的單詞交互轉(zhuǎn)換成候選新聞的初步匹配排名特征;[0021]基于候選新聞的初步匹配排名特征,應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)與最大池化函數(shù)得到每個候選新聞與用戶歷史點擊新聞的局部興趣匹配排名特征。[0022]進一步的,所述預(yù)測用戶瀏覽每個候選新聞的概率的具體步驟為:[0023]基于所述用戶全局興趣特征、動態(tài)興趣特征和候選新聞表示,計算基于用戶全局興趣的匹配分數(shù)和基于動態(tài)興趣的匹配分數(shù);[0024]基于所述局部興趣匹配排名特征,計算局部興趣匹配分數(shù);[0025]聯(lián)合基于用戶全局興趣的匹配分數(shù)、基于動態(tài)興趣的匹配分數(shù)和局部興趣匹配分數(shù),計算用戶瀏覽每個候選新聞的概率。[0026]進一步的,所述基于用戶全局興趣的匹配分數(shù)為所述用戶全局興趣特征和候選新聞表示的內(nèi)積。[0027]進一步的,所述基于動態(tài)興趣的匹配分數(shù)為所述動態(tài)興趣特征和候選新聞表示的內(nèi)積。[0028]進一步的,所述用戶全局興趣特征為用戶歷史點擊新聞表示的加權(quán)和。[0029]本發(fā)明的第二個方面提供一種基于多級匹配的興趣激活新聞推薦系統(tǒng),其包括:[0030]新聞編碼模塊,其被配置為:獲取候選新聞和用戶歷史點擊新聞,分別進行新聞編碼,得到候選新聞表示和用戶歷史點擊新聞表示;[0031]用戶編碼模塊,其被配置為:基于用戶歷史點擊新聞表示,獲得用戶全局興趣特[0032]目標感知興趣激活模塊,其被配置為:基于候選新聞表示和用戶歷史點擊新聞表示,采用目標注意力機制來計算每個用戶歷史點擊新聞和每個候選新聞之間的注意力得分,使用注意力得分對用戶歷史點擊新聞進行加權(quán)計算,獲得用戶動態(tài)興趣特征;[0033]多級匹配交互模塊,其被配置為:基于候選新聞表示和用戶歷史點擊新聞表示,在多個不同的相似度水平上捕捉被點擊新聞和候選新聞在語義上的相關(guān)性,獲得不同層次的每個候選新聞與用戶歷史點擊新聞的局部興趣匹配排名特征;[0034]概率預(yù)測模塊,其被配置為:聯(lián)合用戶全局興趣特征、動態(tài)興趣特征和局部興趣匹配排名特征,預(yù)測用戶瀏覽每個候選新聞的概率,基于預(yù)測概率向用戶推薦候選新聞。[0035]本發(fā)明的第三個方面提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)如上述所述的一種基于多級匹配的興趣激活新聞推薦方法中的步驟。6[0036]本發(fā)明的第四個方面提供一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)如上述所述的一種基于多級匹配的興趣激活新聞推薦方法中的步驟。[0038]本發(fā)明提供了一種基于多級匹配的興趣激活新聞推薦方法,其通過多級匹配交互,保留文本的細粒度信息。從多個不同的相似度水平上對文本詞對進行建模,使得編碼表達的用戶興趣信息更加豐富。[0039]本發(fā)明提供了一種基于多級匹配的興趣激活新聞推薦方法,其提出基于候選新聞的注意力網(wǎng)絡(luò)機制,能夠自適應(yīng)地激活不同用戶對不同候選新聞的興趣,依據(jù)候選新聞的不同來推導(dǎo)用戶興趣的動態(tài)特征向量,進一步加強了用戶的興趣表示,大大提高了模型的表現(xiàn)力。[0040]本發(fā)明提供了一種基于多級匹配的興趣激活新聞推薦方法,其有效分配每個模塊得分的權(quán)重,有效的融合基于用戶全局興趣的匹配分數(shù)、基于動態(tài)興趣的匹配分數(shù)、不同相似度水平的興趣匹配分數(shù),使模型能夠更好的進行融合,從而在準確性和速度之間提供了改進的折衷。附圖說明[0041]構(gòu)成本發(fā)明的一部分的說明書附圖用來提供對本發(fā)明的進一步理解,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當限定。[0042]圖1是本發(fā)明實施例一的一種基于多級匹配的興趣激活新聞推薦方法流程圖;[0043]圖2是本發(fā)明實施例一的一個用戶新聞的閱讀行為的示例圖;[0044]圖3是本發(fā)明實施例一的全局用戶興趣編碼示意圖;[0045]圖4是本發(fā)明實施例一的目標感知動態(tài)興趣激活示意圖;[0046]圖5是本發(fā)明實施例一的高斯徑向基函數(shù)核的變化情況圖。具體實施方式[0047]下面結(jié)合附圖與實施例對本發(fā)明作進一步說明。[0048]應(yīng)該指出,以下詳細說明都是例示性的,旨在對本發(fā)明提供進一步的說明。除非另有指明,本發(fā)明使用的所有技術(shù)和科學(xué)術(shù)語具有與本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員通常理解的相同含義。[0049]需要注意的是,這里所使用的術(shù)語僅是為了描述具體實施方式,而非意圖限制根據(jù)本發(fā)明的示例性實施方式。如在這里所使用的,除非上下文另外明確指出,否則單數(shù)形式也意圖包括復(fù)數(shù)形式,此外,還應(yīng)當理解的是,當在本說明[0050]實施例一[0051]如圖1所示,本實施例提供了一種基于多級匹配的興趣激活新聞推薦方法,提出一種基于多級匹配的興趣激活新聞推薦模型MIAR,將獲取的候選新聞和用戶歷史點擊新聞輸入到該模型中,可以得到用戶瀏覽每個候選新聞的概率,以解決新聞推薦點擊預(yù)測問題。與先前工作將用戶興趣建模成單一固定的向量匹配候選新聞不同,本發(fā)明意識到用戶的興趣7通常是多樣化和多粒度的,靜態(tài)向量并不能充分表達出用戶的興趣;此外,融合成的用戶興趣向量會丟失文本細節(jié)的匹配信息;于是,通過目標感知注意網(wǎng)絡(luò)機制,在考慮候選新聞的情況下,依據(jù)候選新聞的不同來推導(dǎo)用戶興趣的動態(tài)特征向量,進一步豐富用戶的興趣表示;此外,通過多級匹配交互模塊,在多個不同的相似度水平上對文本詞對進行建模,獲取不同相似度水平的興趣匹配信息;然后,通過卷積神經(jīng)網(wǎng)絡(luò)識分配不同模塊的得分的權(quán)重,使模型能夠更好的進行融合,從而在準確性和速度之間提供了改進的折衷。本發(fā)明在MIND真實的新聞數(shù)據(jù)集上進行了廣泛的實驗,結(jié)果表明與基線模型相比,MIAR模型在性能指標取得了實質(zhì)性的提高,驗證了該模型在新聞推薦方面的有效性。[0052]如圖2所示,為一個用戶新聞的閱讀行為的例子,物、電器安全、體育問題,其中,粗體顯示的文本片段聞可以揭示用戶對不同主題或事件的興趣。D?和D?歷史新聞的主題分別是與“寵物狗”和“減肥”相關(guān)。自然的,它們提供了關(guān)鍵線索來選擇候選新聞C?和C?但是,它們之間的文本匹配與用戶興趣相關(guān)的信息對提高用戶興趣多樣性特征至關(guān)重要。從相關(guān)性匹配的角度考慮,D?歷史點擊新聞應(yīng)該匹配候選新聞C?,它們是非常相關(guān)的,都反映了冬天設(shè)備的安全使用問題。如果將用戶之前點擊的不同歷史新聞聚合成一個用戶向量進行匹配,這種方法可能會造成文本詞對間的軟匹配信號丟失。即丟失了不同水平相似度的文本詞對匹配信息。如“handwarmers”—"Thelittlesun”之間的匹配。除此之外,用戶很豐富,用戶的興趣多種多樣。若用一個固定大小的嵌入向量來表示用戶的綜合興趣特征,固定大小的向量雖代表單個用戶的所有興趣,但是無法動態(tài)表達用戶的不同興趣。這會一定程度上限制推薦模型的表達能力。若是擴大該固定長度向量的維度來提高興趣特征,可能會引起過度擬合的風(fēng)險并降低模型的性能。然而,本發(fā)明觀察到?jīng)]有必要將所有用戶興趣嵌入到一個向量中,比如用戶閱讀的歷史新聞中存在與以下語義線索相關(guān)的新聞(梅西,寵物狗,減肥),如果向用戶推薦的新聞中出現(xiàn)金毛犬的線索,本發(fā)明會關(guān)注用戶對寵物狗的興趣,而不是減肥。因此,用戶的不同興趣可以在給出候選項目的情況下被具體激活。[0053]如圖1所述,本發(fā)明的一種基于多級匹配的興趣激活新聞推薦方法,主要有兩部分組成:局部表示匹配部分(左)與分布式匹配部分(右),該方法含有的兩個部分包含以下幾個主要的步驟,新聞編碼、用戶編碼、目標感知興趣激活、多級匹配交互以及計算用戶點擊候選新聞的概率的預(yù)測。[0054]步驟1、如圖1所示的新聞編碼模塊,獲取候選新聞和用戶的點擊新聞,進行新聞編碼。[0055]步驟101、標題編碼:獲取用戶的點擊新聞以及候選新聞的標題,使用新聞標題構(gòu)建向量表示,得到新聞標題單詞向量序列。[0056](1)使用預(yù)先訓(xùn)練好的Glove嵌入,用M個單詞來表示新聞標題,得到新聞標題單詞[0057](2)通過一個詞嵌入查找表We∈R×°,將新聞標題單詞序列轉(zhuǎn)換成單詞向量序[0058]步驟102、將新聞標題單詞向量序列輸入卷積神經(jīng)網(wǎng)絡(luò)CNN,得到上下文單詞表示8fake”。其中“apple”和“fake”這兩個詞的組合對理解該蘋果為蘋果手機而非水果非常重[0061]其中,e(i-K):(i+K)是從位置i-k到i+k的單詞嵌入的連接,F(xiàn)?∈RN×2k+D和表示?;⒁饬C制,得到新聞標題中的每個單詞的嵌入權(quán)重α,這些權(quán)重可以體現(xiàn)用戶對每個[0067]將新聞編碼器應(yīng)用于用戶所有的點擊新聞,得到用戶的點擊新聞的表示[r?,9[0074]用戶的全局興趣特征為S,用戶全局興趣特征為用戶歷史點擊新聞表示的加權(quán)[0076]步驟3、目標感知興趣激活:基于候選新聞的表示和用戶的歷史點擊新聞的表示,采用目標注意力機制來計算每個用戶歷史點擊新聞和每個候選新聞之間的注意力得分,使用注意力得分對用戶歷史點擊新聞進行加權(quán)計算,獲得用戶的動態(tài)興趣特征。[0077]用戶瀏覽過的歷史新聞壓縮成一個固定的表示向量會一定程度上限制用戶的興趣特征。簡單來說,用戶興趣通常是多粒度的,固定大小的向量代表單個用戶的所有興趣,并不能動態(tài)表達不同的用戶興趣。此外,先前的工作僅使用用戶點擊的歷史序列來捕獲用戶的興趣,并沒有考慮與候選新聞之間的聯(lián)系。據(jù)此,本發(fā)明設(shè)計了一種基于候選新聞的注意力機制,該機制能夠自適應(yīng)地激活不同用戶對不同候選新聞的興趣,依據(jù)候選新聞的不同來推導(dǎo)用戶興趣的動態(tài)特征向量,進一步加強用戶的興趣表示,大大提高了模型的表現(xiàn)[0078]如圖4所示,當?shù)玫矫總€候選新聞的嵌入向量,就開始構(gòu)建候選目標嵌入,以自適應(yīng)地考慮與候選新聞相關(guān)的用戶興趣。這里,將目標嵌入定義為所有要預(yù)測的候選新聞。通常,給定推薦的候選新聞只匹配用戶的一部分興趣。為了模擬這一過程,設(shè)計了一種新的目標注意力機制來計算用戶歷史點擊新聞相對于每個候選新聞的軟注意力分數(shù)。因此,引入了一個目標注意力機制來計算所有歷史點擊新聞r;和每個候選新聞r′之間的注意力得分。[0079]首先,將由一個參數(shù)共享的權(quán)重矩陣W∈R~×N非線性變換應(yīng)用于每個歷史點擊-候選新聞對;[0084]所獲得的用戶動態(tài)興趣特征因候選新聞嵌入的不同而不同。[0085]步驟4:多級匹配交互:基于候選新聞表示和用戶歷史點擊新聞表示,獲得每個候選新聞與用戶歷史點擊新聞的在不同的相似度下的局部興趣匹配排名特征。具體的,基于候選新聞表示和用戶歷史點擊新聞表示,在多個不同的相似度水平上捕捉被點擊新聞和候選新聞在語義上的相關(guān)性,獲得不同層次的每個候選新聞與用戶歷史點擊新聞的局部興趣匹配排名特征。矩陣。[0090]其中,是第k個候選新聞標題的第i個詞嵌入,是題的第j個詞嵌入。[0096]其中,K(M;)將k個核應(yīng)用于關(guān)聯(lián)矩陣的候選新聞的每一個單詞對應(yīng)的行,將其匯總成一個k維特征向量。每個候選新聞詞的特征向量的對數(shù)和形成候選新聞排序特征向(極限)和1(當MK,N=μ的時候)之間。K通過計算單詞對的相似性越較大時,此時向量M?K,N-μ之間距離的變化對指數(shù)整體數(shù)值的影響就會變小,曲線比較平別計算新聞標題內(nèi)各個詞的軟詞頻(Soft-TF),之后將各詞的軟詞頻加和得到用于排序的特征。新聞匹配的較強顯著信號作為用戶和候選新聞之間的最終匹配向量。經(jīng)過卷積之后的第k個候選新聞與歷史點擊新聞的不同相似度下的局部興趣匹配排名特征表示為,其計算用戶全局興趣的匹配分數(shù)30ba和基于候選新聞激活的動態(tài)興趣匹配分數(shù)arge,公式如局部表示匹配中,推薦是基于根據(jù)候選新聞文章在印象中候選新聞與歷史點擊新聞匹配形成詞語之間的關(guān)聯(lián)矩陣。在關(guān)聯(lián)矩陣上應(yīng)用多級匹配交條新聞應(yīng)用負采樣技術(shù)預(yù)測點擊評分。即新聞由一個用戶的正樣本和隨機選擇的一的負樣本組成。之后,共同預(yù)測正面新聞和[,?,…,k]個負面新聞。[0119]本發(fā)明考慮到候選新聞的廣泛性和用戶的興趣的多樣性,單一的固定向量很難精確建模并且限制了推薦模型的表示能力。與先前工作將用戶點擊的歷史新聞抽象成固定用戶興趣向量匹配候選新聞不同,本發(fā)明的模型聯(lián)合了多級匹配交互,保留文本的細粒度信息。從多個不同的相似度水平上對文本詞對進行建模,使得編碼表達的用戶興趣信息更加[0120]此外,本發(fā)明意識到用戶不同階段的瀏覽新聞序列可以體現(xiàn)用戶的興趣變化,靜態(tài)向量并不能充分表達出用戶的興趣。據(jù)此,設(shè)計了一種基于候選新聞的注意力網(wǎng)絡(luò),能夠自適應(yīng)地激活不同用戶對不同候選新聞的興趣,依據(jù)候選新聞的不同來推導(dǎo)用戶興趣的動態(tài)特征向量,進一步加強用戶的興趣表示,大大提高了模型的表現(xiàn)力。最后,有效的融合不同模塊的得分的權(quán)重,從而在準確性和速度之間提供了改進的折衷。實驗結(jié)果表明,在MIND真實的新聞數(shù)據(jù)集上的進行了實驗,驗證了本發(fā)明的模型的有效性。此外,通過案例分析,目標注意力網(wǎng)絡(luò)模塊還增強了點擊預(yù)測的魯棒性和可解釋性。[0122]本實施例提供了一種基于多級匹配的興趣激活新聞推薦系統(tǒng),其具體包括如下模[0123]本發(fā)明的一種基于多級匹配的興趣激活新聞推薦系統(tǒng),主要有兩部分組成:局部表示匹配模塊與分布式匹配模塊,該系統(tǒng)含有的兩個核心模塊包含以下幾個主要的組件:新聞編碼模塊、用戶編碼模塊、目標感知興趣激活模塊、多級匹配交互模塊以及計算用戶點擊候選新聞的概率的預(yù)測模塊。[0124]新聞編碼模塊,其被配置為:獲取候選新聞和用戶歷史點擊新聞,分別進行新聞編碼,得到候選新聞表示和用戶歷史點擊新聞表示;[0125]用戶編碼模塊,其被配置為:基于用戶歷史點擊新聞表示,獲得用戶全局興趣特[0126]目標感知興趣激活模塊,其被配置為:基于候選新聞表示和用戶歷史點擊新聞表示,采用目標注意力機制來計算每個用戶歷史點擊新聞和每個候選新聞之間的注意力得分,使用注意力得分對用戶歷史點擊新聞進行加權(quán)計算,獲得用戶動態(tài)興趣特征;[0127]多級匹配交互模塊,其被配置為:基于候選新聞表示和用戶歷史點擊新聞表示,在多個不同的相似度水平上捕捉被點擊新聞和候選新聞在語義上的相關(guān)性,獲得不同層次的每個候選新聞與用戶歷史點擊新聞的局部興趣匹配排名特征;[0128]概率預(yù)測模塊,其被配置為:聯(lián)合用戶全局興趣特征、動態(tài)興趣特征和局部興趣匹配排名特征,預(yù)測用戶瀏覽每個候選新聞的概率,基于預(yù)測概率向用戶推薦候選新聞。[0129]此處需要說明的是,本實施例中的各個模塊與實施例一中的各個步驟一一對應(yīng),其具體實施過程相同,此處不再累述。[0130]實施例三[0131]本實施例提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)如上述實施例一所述的一種基于多級匹配的興趣激活新聞推薦方法中的[0133]本實施例提供了一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)如上述實施例一所述的一種基于多級匹配的興趣激活新聞推薦方法中的步驟。[0134]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用硬件實施例、軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論