全文預(yù)覽已結(jié)束
付費(fèi)下載
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
個(gè)性化推薦系統(tǒng)中一種基于層次的任度計(jì)算模型 本文檔格式為 WORD,感謝你的閱讀。 引言:計(jì)算機(jī)系統(tǒng)中的信任問題長期以來都倍受國家、學(xué)術(shù)界和企業(yè)界的關(guān)注。本文參考社會(huì)學(xué)和心理學(xué)將人與人之間信任的產(chǎn)生來源分為三個(gè)方面:外部來源、交互來源和內(nèi)部來源,并提出一種層次化的信任度計(jì)算模型,該模型可以根據(jù)不同類型的用戶調(diào)整不同來源的信任在整個(gè)模型中所占的比例。最后,利用 Epinions 網(wǎng)站的相關(guān)數(shù)據(jù)對(duì)模型進(jìn)行了驗(yàn)證。 本文參考社會(huì)學(xué)和心理學(xué)將人們之間 信任的產(chǎn)生來源分為三個(gè)方面:外部來源、交互來源和內(nèi)部信任,如圖 1.1所示。外部信任是由于當(dāng)前用戶在公共環(huán)境中的聲譽(yù)而使得其他用戶對(duì)其產(chǎn)生的信任,它是一種全局信任,獨(dú)立于單個(gè)用戶。交互信任是系統(tǒng)中用戶之間的交互所產(chǎn)生的信任關(guān)系,這是一種本地信任度。內(nèi)部信任,是由于兩個(gè)人之間內(nèi)在的相似性(如愛好等)產(chǎn)生的信任關(guān)系。 圖 1.1 分層信任模型示意圖 1 基于層次的信任度計(jì)算模型 本文提出基于層次的信任度計(jì)算模型如( 1.1)所,其中 Reputation 表示外部信任, InteractiveTrust 表示交互信任, Similarity 表示內(nèi)部信任。 a, b, c 是加權(quán)平均系數(shù),滿足 a+b+c=1。這三個(gè)系數(shù)分別應(yīng)對(duì)不同類型的用戶:冷啟動(dòng)用戶、常規(guī)用戶,爭議用戶。 ( 1.1) 在本文接下來的篇幅中將詳細(xì)介紹三種信任的計(jì)算方法以及 a, b, c 三個(gè)參數(shù)對(duì)于不同用戶的取值情況。 1.1 外部信任 本文使用的 PageRank 算法來計(jì)算外部信任。 PageRank將指向一個(gè)網(wǎng)頁的鏈接看成是對(duì)于這個(gè)網(wǎng)頁的投票,本文將這種鏈接稱之為回指鏈接,而將一個(gè)網(wǎng)頁指向其他網(wǎng)頁的鏈接稱 之為外向鏈接。例如在圖 2.1 中,將用戶看作是網(wǎng)絡(luò)中的結(jié)點(diǎn),將用戶之間的信任關(guān)系看做他們之間的信任,對(duì)于用戶 A 來說,從其他用戶到用戶 A 的鏈接如( B-A)等都是用戶 A 的回指鏈接;而從用戶 A 到其他用戶的鏈接如( A-B)等都是用戶 A 的外向鏈接。 圖 2.1 信任網(wǎng)絡(luò)初始狀態(tài)示意圖 PageRank 在計(jì)算網(wǎng)頁排名的時(shí)候不單單考慮了網(wǎng)頁的回指鏈接的數(shù)量,更重要的是它還考慮了回指鏈接源網(wǎng)頁的價(jià)值。也就是說,一個(gè)高等級(jí)的頁面可以讓它所指向的低等級(jí)的頁面的等級(jí)提升。 PageRank 中,一個(gè)頁面的重要 性是由鏈向它的所有頁面的重要性經(jīng)過遞歸算法得到的,如等式( 2.2)所示是 RageRank 的數(shù)學(xué)表達(dá)式: ( 2.2) Reputation( u)表示用戶 u 的信譽(yù)度, Bu表示指向用戶 u 的所有用戶的集合, Nv 表示以用戶 v 為源用戶的所有鏈接的數(shù)目,也就是用戶 v 的外向鏈接數(shù)。 1.2 交互信任 本文使用 MoleTrust 來作為度量交互信任值的算法,之所以選擇 MoleTrust 有兩個(gè)原因: 1. 它具有省時(shí)高效的特點(diǎn); 2. 該算法對(duì)信任的計(jì)算是按照層次順序進(jìn)行的,這與我們的社交習(xí)慣 非常類似。接下來將詳細(xì)介紹 MoleTrust 的計(jì)算過程及其缺點(diǎn)以及對(duì) MoleTrust 的改進(jìn)措施。 1.2.1 MoleTrust MoleTrust 的整個(gè)計(jì)算過程可以分為兩步完成: 1.從源節(jié)點(diǎn)出發(fā)遍歷整個(gè)信任網(wǎng)絡(luò),去除網(wǎng)絡(luò)中多余的信息和循環(huán)信任,構(gòu)造一個(gè)單向無循環(huán)的信任網(wǎng)絡(luò); 2.在第一步的基礎(chǔ)上,從源節(jié)點(diǎn)出發(fā)開始傳播信任值,計(jì)算當(dāng)前用戶對(duì)于網(wǎng)絡(luò)中其他用戶的信任。如 Step 1 和 Step 2 所示,是 MoleTrust的具體運(yùn)算過程: MoleTrust 的 Step 1 過程有一個(gè)非 常重要的參數(shù):trust_propagation_distance,該參數(shù)用來控制信任傳播的距離。圖 2.1 經(jīng)過 MoleTrust 的 Step 1 階段后得到圖 2.2所示信任網(wǎng)絡(luò)。將該信任網(wǎng)絡(luò)視為一個(gè)有向圖,在圖的第 0層是當(dāng)前用戶 A,第 1 層,為用戶 A 的直接朋友,以此類推。 圖 2.2 經(jīng) MoleTrust 的 Step 1 后的信任網(wǎng)絡(luò) 在 MoleTrust 的 Step 2 階段,同樣有一個(gè)非常重要的參數(shù): trust_threshold。只有信任值大于 trust_threshod的用戶才會(huì)被加入到信 任網(wǎng)絡(luò)中,該策略可以有效防止惡意用戶對(duì)于推薦系統(tǒng)的影響。 1.2.2 Modified MoleTrust MoleTrust 在計(jì)算信任值的過程中存在一個(gè)很大的漏洞,如 Tr( A, G) =7,但這和我們的直覺是相悖的,因?yàn)?G的上層用戶 C 的信任值只有 3。為了彌補(bǔ)上述漏洞,本文提出一種修正的 MoleTrust: Modified-MoleTrust。本文在在MoleTrust 的 Step 2 階段引入一個(gè)遞減因子 ,其計(jì)算方式如等式( 2.5)所示。 1.3 內(nèi)部信任 本文認(rèn)為用戶對(duì) 項(xiàng)目的評(píng)分是用戶內(nèi)部屬性的綜合體現(xiàn),所以本文選擇用戶對(duì)項(xiàng)目的評(píng)分矩陣來作為內(nèi)部信任的計(jì)算依據(jù)。有學(xué)者證明了在眾多衡量用戶相似性的指標(biāo)中,Person 相關(guān)系數(shù)的綜合表現(xiàn)最好,所以本文選擇 Person 相關(guān)系數(shù)作為內(nèi)部信任的衡量指標(biāo)。 Person 相關(guān)系數(shù)的取值范圍是 -1, 1,若 Person 相關(guān)系數(shù)的取值為正,則說明兩個(gè)用戶之間存在著相似性,反之當(dāng)其取為負(fù)時(shí)說明兩個(gè)人之間的興趣可能是相悖的。Person 相關(guān)系數(shù)的計(jì)算公式如等式( 2.6)所示。其中 n 表示用戶 A 和用戶 W 共同評(píng)分的項(xiàng)目數(shù), r( K, i)表示 用戶 K 對(duì)項(xiàng)目 i 的評(píng)分。 2 實(shí)驗(yàn)結(jié)果說明 本文利用 Epinions 網(wǎng)站的數(shù)據(jù)和 Apache 的 Mahout 平臺(tái)對(duì)所提出的模型進(jìn)行了驗(yàn)證。面對(duì)不同類型的用戶,對(duì)參數(shù)進(jìn)行調(diào)整后,該模型總能得到較為理想的推薦準(zhǔn)確度和覆蓋率,具體數(shù) 3 結(jié)束語 本文提出了一種基于層次的信任度計(jì)算模型,并做了相應(yīng)的實(shí)證研究,該模型能在很大程度上改善用戶的體驗(yàn)。我們
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年山西單招基礎(chǔ)薄弱生提分寶典含答案經(jīng)典題模擬解析三合一
- 2026年黑龍江單招財(cái)經(jīng)商貿(mào)類職業(yè)適應(yīng)性測試模擬卷機(jī)考版
- 2026年青海單招現(xiàn)代殯葬技術(shù)與管理專業(yè)適應(yīng)性測試卷含答案
- 2026年江西單招交通運(yùn)輸類職業(yè)適應(yīng)性高頻題含答案含鐵道常識(shí)
- 2026年重慶單招醫(yī)衛(wèi)類普高生職業(yè)適應(yīng)性測試題庫含答案含醫(yī)學(xué)常識(shí)
- 2026年四川單招鄉(xiāng)村醫(yī)生定向培養(yǎng)專業(yè)考試經(jīng)典題集含答案
- 2026年內(nèi)蒙古單招醫(yī)衛(wèi)大類考前密卷含答案預(yù)測率80
- 2026年廣東單招錯(cuò)題集含答案語數(shù)英高頻錯(cuò)題解析
- 2026年廣西單招文化素質(zhì)省統(tǒng)考經(jīng)典題含答案2023-2025年精校版
- 2026年遼寧單招專業(yè)技能無人機(jī)操控編程模擬題庫含答案含操作規(guī)范
- 2025年尋甸縣功山鎮(zhèn)中心衛(wèi)生院鄉(xiāng)村醫(yī)生招聘備考題庫及答案詳解參考
- 2025西部機(jī)場集團(tuán)航空物流有限公司招聘筆試備考重點(diǎn)試題及答案解析
- 2025年健康科普大賽試題及答案
- 2025年1月黑龍江省普通高中學(xué)業(yè)水平合格性考試語文試卷(含答案)
- 衛(wèi)健系統(tǒng)2025年上半年安全生產(chǎn)工作總結(jié)
- 四川省成都市2024-2025學(xué)年高一上學(xué)期期末教學(xué)質(zhì)量監(jiān)測生物試卷(含答案)
- 2026屆安徽省皖南八校高三第二次大聯(lián)考化學(xué)試卷
- 元旦聯(lián)歡會(huì):瘋狂動(dòng)物城
- 數(shù)據(jù)資產(chǎn)管理實(shí)踐指南8.0
- GB/T 46490-2025生物技術(shù)分析方法細(xì)胞治療產(chǎn)品的試驗(yàn)和表征的一般要求和考慮
- 貝加爾湖畔簡譜課件
評(píng)論
0/150
提交評(píng)論