版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、塑造用戶(hù)畫(huà)像的一個(gè)重要方向?用戶(hù)行為數(shù)據(jù):顯性反饋行為:評(píng)分,評(píng)論等無(wú)上下文信息的隱性反饋數(shù)據(jù)集:每一條記錄包含用戶(hù)ID,物品ID無(wú)上下文信息的顯性反饋數(shù)據(jù)集:用戶(hù)ID,物品ID,評(píng)分隱形反饋行為:瀏覽網(wǎng)頁(yè)等有上下文信息的隱性反饋數(shù)據(jù)集:用戶(hù)ID,物品ID,用戶(hù)對(duì)物品產(chǎn)生行為的時(shí)間戳有上下文信息的顯性反饋數(shù)據(jù)集:用戶(hù)ID,物品ID,評(píng)分,評(píng)分發(fā)生的時(shí)間戳當(dāng)前采用的比較多的推薦模式?協(xié)同過(guò)濾:僅僅基于用戶(hù)的行為數(shù)據(jù)(應(yīng)用得最廣泛的是基于領(lǐng)域的算法,即:基于用戶(hù)的協(xié)同過(guò)濾算法1找到目標(biāo)用戶(hù)興趣相似的用戶(hù)集合2找到這個(gè)集合的用戶(hù)喜歡的,且目標(biāo)用戶(hù)沒(méi)有聽(tīng)說(shuō)過(guò)的物品推薦給目標(biāo)用戶(hù)基于物品的協(xié)同過(guò)濾算法同
2、理,找到目標(biāo)用戶(hù)感興趣的物品相似的物品,推薦給目標(biāo)用戶(hù))推薦的步驟可以簡(jiǎn)單地歸納為:構(gòu)造數(shù)據(jù)集(設(shè)計(jì)用戶(hù),物品的數(shù)據(jù)結(jié)構(gòu))2確定相似算法,計(jì)算相似度(Jaccard,余弦相似度,歐幾里得,皮爾遜等)排名(可能涉及到通過(guò)相似度推算出用戶(hù)對(duì)自己沒(méi)有進(jìn)行過(guò)行為的商品的喜好程度),推薦通過(guò)經(jīng)典的MovieLens實(shí)驗(yàn)來(lái)理解:基于用戶(hù):1數(shù)據(jù)集結(jié)構(gòu):critics=A用戶(hù):a物品:分?jǐn)?shù),b物品:分?jǐn)?shù),,B用戶(hù):a物品:分?jǐn)?shù),b物品:分?jǐn)?shù),,在這里用戶(hù)即為對(duì)電影評(píng)分的用戶(hù),物品即為電影,示例井一個(gè)涉及彫評(píng)者及其時(shí)幾部影片評(píng)分情況的字典critics=LisaRaser:1LadyintheWater:2.
3、5,1SnakesonaPlanef:3.5,RJustMyLuck1:3.0,1SupermanReturnsR:3.5,1You,MeandDupree1:2.5,1TheNightListener:3.0,GeneSeymour*:LadyintheWater;3.0,hSnakesonaPlane:3,5,1JuseKyLuck:1,5,1SupermanReturns:5.0,1TheNightListenerr;3*0,1You,MeandDupree1:3.5),MichaelPhillips1:(1LadyintheWater;2,S,1SnakesonaPlane1:3.0,
4、1SupermanReturns1:3.5,1TheNightListener:4.0,ClaudiaPuig:rSnakesonaPlane:3.5,rJustMyLuck1:3*0,HTheNightListenerr:4+5SupermanReturns:4.0,You,MeandDupree1:2,5,1ickLaSalle1:(1LadyintheWater1:3*0SnakesonaPlane1:4.0,1JustMyLuck1:2.0rSupermanReturns*:3.0,TheNightListener*:3.0,You,MeandDupree:2.0,1JackMatth
5、ews1:1LadyintheWaterf:3.0,SnakesonaPlane1:4.0ffTheNightListener:3.0,SupermanReturns1:5.0,You,MeandDupree1:3.5,Toby1:(1SnakesonaPlan1:4*5,rYou,MeandDupree:l,0,SupermanReturns:4.0評(píng)分采用0-5分的范圍,有的采用0-1相似度的度量(1)歐幾里得距離:在偏好空間中距離越近越相似,例相似度=1/(1+兩用戶(hù)距離)范圍01,值越大越相似(2)皮爾遜針對(duì)用戶(hù)打分習(xí)慣不一樣,有的給分普遍偏高,有的則低(避免評(píng)分習(xí)慣造成的誤差)引入“
6、最佳擬合線(xiàn)”(盡可能靠近地圖上的所有坐標(biāo)點(diǎn))eneSeniiirMkkLaS|teJ2-2;在散點(diǎn)圖上比較兩位影評(píng)者的評(píng)分結(jié)果范圍01,越大越相似,例如(系數(shù)為0.75):2-3:具有較高相關(guān)度評(píng)價(jià)值的兩位評(píng)論者LiuftiKe4知出?*臻rman3H聯(lián)険諂JDupreea*Lady.A-i.:;:.2起;:,我、-:竝s._:y-:.-.遐曲心罷住敘w弧浚;上1疇譏必護(hù)-J1kiLltI|11111L12jjJBLMIMttnCWS相似度排名返回結(jié)果:reload(reconmandations)rcttnftandation*.topMatohas(re3)(0.9912407071619
7、2991,LisaRose1)y(0.924473451641904B6,rMickLaSalle*)(0.89340514744156474,ClaudiaPuig1)補(bǔ)充:1.給定用戶(hù)u和用戶(hù)v,N(u)表示用戶(hù)u曾經(jīng)有過(guò)正反饋的物品集合,N(v)為用戶(hù)v曾經(jīng)有過(guò)正反饋的物品集合,計(jì)算兩個(gè)用戶(hù)的興趣相似度wuz:.N(u)nV)|%=血)UMJaccard公式:例:余弦相似度:險(xiǎn))rw)|訓(xùn)|皿訓(xùn)圖2北用戶(hù)行為記錄舉例可理.我們可以計(jì)算出用戶(hù)A和用戶(hù)匚D的相似度:TOC o 1-5 h z|偽b,d仃紡胡|1VI.1=人=r麻麗TT両晶Is上同仃&乩罰I1w.,=JL=lt詔同3推薦推算用
8、戶(hù)對(duì)沒(méi)看過(guò)電影的評(píng)分,即用相似度與其他用戶(hù)對(duì)該電影的評(píng)分乘積加權(quán)求均值例:表22為T(mén)oby提供推薦iii平艸網(wǎng)?潮:聲說(shuō)憐:燃:憑X::Si2戀Rose0.993.02.972.52.483.02.97Seymour0.383.01.143,01.141.50.57Puig0.894.54.023.02.68LaSalle0.923.02.773.02,T7:2.0reload(reccnoienda七文ohm)_.i七*qmMiwnrtAeioM.calculataSijnilarltMk*(recHmmindntions-critioa)Itwim1LadyintheWaterr:(0.4
9、0000000000000002,fYoufMeandDupree1),(0.2357142857142&57,TheNightListener),SnakesonaPlane1:(0.22222222222222221,LadyintheWaterr),0.181&181&181818182,TheNightListener1.etc*后面同理。我們還需要做什么?算法評(píng)測(cè)1將用戶(hù)行為數(shù)據(jù)集按照均勻分布隨機(jī)分為M份,1份作為測(cè)試集,剩下的(M-1)份作為訓(xùn)練集。進(jìn)行M次實(shí)驗(yàn),,每次都使用不同的測(cè)試集,將M次實(shí)驗(yàn)測(cè)出的評(píng)測(cè)指標(biāo)(準(zhǔn)確率或者召回率)的平均值最為最后的評(píng)測(cè)指標(biāo)。2對(duì)u用戶(hù)推薦N個(gè)物品(記為R(u),用戶(hù)u在測(cè)試集上喜歡的物品集合為T(mén)(u),Precis
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年橋梁新技術(shù)在耐久性評(píng)估中的應(yīng)用探討
- 2026年建筑中的智能化設(shè)備與自動(dòng)化設(shè)計(jì)
- 2026年橋梁施工過(guò)程中如何保持材料質(zhì)量
- 2026年模塊化建筑在工地的應(yīng)用策略
- 2026春招:西部航空心理測(cè)試題及答案
- 貨運(yùn)場(chǎng)站安全培訓(xùn)資料課件
- 基于人工智能的醫(yī)學(xué)圖像識(shí)別
- 醫(yī)療機(jī)器人與輔助手術(shù)技術(shù)
- 心電圖室工作亮點(diǎn)總結(jié)
- 2026年廣東江門(mén)中醫(yī)藥職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能筆試參考題庫(kù)帶答案解析
- 水冷精密空調(diào)培訓(xùn)課件
- 大型機(jī)械設(shè)備安全操作培訓(xùn)教材
- 室外給排水管道施工技術(shù)交底范本
- 移動(dòng)電源生產(chǎn)工藝流程
- 動(dòng)靜脈內(nèi)瘺術(shù)后護(hù)理查房規(guī)范
- 核安全事故培訓(xùn)課件
- 碼頭泊位改造試運(yùn)行方案
- 2025年中考英語(yǔ)真題分類(lèi)匯編(全國(guó))專(zhuān)題04 時(shí)態(tài)、語(yǔ)態(tài)、三大從句及常識(shí)和情景交際(原卷版)
- 【語(yǔ)文】北京市朝陽(yáng)外語(yǔ)小學(xué)小學(xué)二年級(jí)上冊(cè)期末試卷(含答案)
- 追女生的聊天技巧
- 藥物配置錯(cuò)誤不良事件
評(píng)論
0/150
提交評(píng)論