版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
周超58同城NLP資深算法工程師01業(yè)務(wù)背景03圖譜在招聘推薦中的應(yīng)用02招聘知識圖譜的構(gòu)建04業(yè)務(wù)展望01介紹-行業(yè)背景021020019018017016中國城鎮(zhèn)新增就業(yè)人數(shù)(萬)4全國高校畢業(yè)人數(shù)(萬) 765795821834874909201620172018201920202021中國網(wǎng)絡(luò)招聘市場規(guī)模(億)116.5107108.269.647.96201620172018201920202021QueryQuery簡歷職位面試入職無法追蹤行為行為介紹-業(yè)務(wù)模式QueryQuery簡歷職位面試入職無法追蹤行為行為男男班族1、單邊的推薦模式2、強(qiáng)表達(dá)弱相關(guān)的場景女女一線城市美妝達(dá)人雙雙1、雙邊的連接關(guān)系3、領(lǐng)域?qū)傩暂^強(qiáng)介紹-難點(diǎn)難點(diǎn):招聘推薦是一個(gè)雙邊匹配的模式,需要同時(shí)契合BC雙邊的訴求雙介紹-難點(diǎn)難點(diǎn):招聘推薦是一個(gè)雙邊匹配的模式,需要同時(shí)契合BC雙邊的訴求雙邊匹配領(lǐng)域?qū)傩詮?qiáng)冷啟動(dòng)&稀疏性難點(diǎn):招聘具有很強(qiáng)的領(lǐng)域?qū)傩?,不同的領(lǐng)域?qū)τ谇舐氄叩乃刭|(zhì)、企業(yè)的訴求或許天差地別,而這些差異正是推薦效果提升的關(guān)鍵難點(diǎn):新用戶進(jìn)入平臺(tái)后,行為數(shù)據(jù)少,簡歷、職位信息簡單粗糙找工作或者找人是一個(gè)短時(shí)間連續(xù)的稀疏行為譜:作為一種富信息知識體系,額外引入一些輔助信息,這些輔助信息可以有效地彌補(bǔ)交互信息的稀疏或缺失。難點(diǎn):有許多的用戶對訴求的表達(dá)不清楚或者對職位的認(rèn)知深度不夠|介紹-主要的業(yè)務(wù)應(yīng)用場景推薦內(nèi)容:職位推薦簡歷推薦標(biāo)簽推薦。。。推薦場景:app主頁為你推薦場景搜索推薦場景用戶最近關(guān)注推薦場景。。。02招聘知識圖譜的構(gòu)建95label司機(jī)10000-15000歲ID駕照行業(yè)薪資保險(xiǎn)期望薪資label駕照金50-99規(guī)模enterpriseage運(yùn)輸距離補(bǔ)貼男期望職位sex崗位spu.005運(yùn)輸貨物吃住地址狀態(tài)資本休期望工作地做休法人市房山區(qū)閆村鎮(zhèn)小十三2幢1保險(xiǎn)547857437834住續(xù)500w金is_subinstance_of95label司機(jī)10000-15000歲ID駕照行業(yè)薪資保險(xiǎn)期望薪資label駕照金50-99規(guī)模enterpriseage運(yùn)輸距離補(bǔ)貼男期望職位sex崗位spu.005運(yùn)輸貨物吃住地址狀態(tài)資本休期望工作地做休法人市房山區(qū)閆村鎮(zhèn)小十三2幢1保險(xiǎn)547857437834住續(xù)500w金is_subinstance_of崗位spu.001label90求職者道北運(yùn)輸有限公司9986756649495交通交通/運(yùn)輸/物流招招聘補(bǔ)貼補(bǔ)貼三大任務(wù):標(biāo)簽體系的構(gòu)建標(biāo)簽的挖掘關(guān)系構(gòu)建標(biāo)簽體系的構(gòu)建目的:標(biāo)簽體系作為底層的基礎(chǔ)數(shù)據(jù),滿足:多維度對BC雙邊流量全方面的的刻畫通用維度-薪資、福利、年齡等領(lǐng)域特有的屬性-證書、技能、經(jīng)驗(yàn)等要為上層的雙邊連接提供更多層次更多維度的信息匹配多層級不同的應(yīng)用方,不同的場景,對流量的組織粒度要求不一樣層次化可以使流量的組織更靈活汽車零部件管理科長汽車零部件管理科長標(biāo)簽挖掘:認(rèn)知不統(tǒng)一、專業(yè)性強(qiáng),導(dǎo)致標(biāo)注成本高汽車零部件管理科長汽車零部件管理科長認(rèn)知不統(tǒng)一:??專業(yè)性強(qiáng):{“新款春秋季服裝試衣可新”}{“五險(xiǎn)一金{“新款春秋季服裝試衣可新”}服裝試衣-試衣模特-職位DBA-服裝試衣-試衣模特-職位富士康/nt直招/prefix_jbn質(zhì)檢員/n18歲以上質(zhì)檢員eg:未來影視城急聘查票員未來影視城急聘檢票員eg:美團(tuán)直招黃騎士騎手,不收取任何押金費(fèi)用餓了么急聘黃騎士騎手,不收取任何押金費(fèi)用eg:年齡18-45周歲,男女不限,學(xué)歷不限學(xué)歷不限,男女不限,年齡18-45周歲上下文關(guān)鍵詞同義詞替換短句子隨機(jī)替換。。。。同同類型標(biāo)簽同義詞替換EDAEDAOOOOB-JBNI-JBNE-JBNOB-SEXI-SEXI-SEXE-SEX高薪誠聘服務(wù)員,性別不限高薪誠聘B-JBN服I-JBN務(wù)E-JBN員,B-SEX性I-SEX別I-SEX不E-SEX限多樣性:會(huì)生成新的實(shí)體會(huì)生成更豐富的實(shí)體上下文可以有效利用未標(biāo)注數(shù)據(jù)標(biāo)簽挖掘-數(shù)據(jù)增廣datad3k5k7kall73.1179.5683.4587.23raw+bootstrap76.8782.3384.1588.05aweda75.2380.3684.2588.68raw+daga76.7781.7984.0288.12raw+bootstrap+eda77.0182.7884.6388.9raw+bootstrap+daga75.8782.8584.2988.76raw+eda+daga75.4681.0584.3788.79raw+bootstrap+eda+daga77.5982.9185.1289.23LR*100combin_embeddingtokenembeddingpositiontopicembeddingembedding不同的數(shù)據(jù)塊有不同的標(biāo)簽偏好,如年齡,大概率會(huì)出現(xiàn)在崗位要求中 每個(gè)職位都有一個(gè)層次體系,每個(gè)層次體系都是一個(gè)topic標(biāo)簽挖掘關(guān)鍵技術(shù)LR*100combin_embeddingtokenembeddingpositiontopicembeddingembedding不同的數(shù)據(jù)塊有不同的標(biāo)簽偏好,如年齡,大概率會(huì)出現(xiàn)在崗位要求中 每個(gè)職位都有一個(gè)層次體系,每個(gè)層次體系都是一個(gè)topicB-JBNI-JBNE-JBNOO...I-JBNE-LOCOI-LOCB-LOC...BB-LOCB-JBNE-JBNI-JBNO...B-JBNI-LOCOI-LOCB-LOC... CRFCRFX1X2X..X1|Tag0Tag1Tag2....崗位福利品牌要求標(biāo)題職責(zé)描述要求保證線上耗時(shí):利用公司平臺(tái),使用TensorRT加速深度學(xué)習(xí)推理算法層面的優(yōu)化,知識蒸餾SOFTMAXa2ana3a1123n132TE....[cls]token2tokenembeddingtokenThhhhhhhhTag0Tag1Tag2....崗位福利品牌要求標(biāo)題職責(zé)描述要求保證線上耗時(shí):利用公司平臺(tái),使用TensorRT加速深度學(xué)習(xí)推理算法層面的優(yōu)化,知識蒸餾SOFTMAXa2ana3a1123n132TE....[cls]token2tokenembeddingtokenThhhhhhhh標(biāo)簽挖掘關(guān)鍵技術(shù)行業(yè)1行業(yè)2行業(yè)3行業(yè)3司機(jī)會(huì)計(jì)證電焊技術(shù)五險(xiǎn)TTagTSOFTMAXa2a1a2a1annn Topicattention&Positionattentiontokentoken1|北京五險(xiǎn)一金屬性:地址屬性:保險(xiǎn)廚師:9644787538470483屬性:作休infoid_id:4384屬性:薪資屬性:北京五險(xiǎn)一金屬性:地址屬性:保險(xiǎn)廚師:9644787538470483屬性:作休infoid_id:4384屬性:薪資屬性:技能川菜包吃住月薪12000-15000品牌吃住示例品牌吃住保險(xiǎn)"predicate":"保險(xiǎn)","predicate":"吃住"predicate":"保險(xiǎn)","predicate":"吃住","subject":"送餐員","object":"五險(xiǎn)一金""subject":"送餐員","object":"提供住宿""subject":"送餐員","object":"美團(tuán)"華華陽酒店月月休4天Soft-Attention層關(guān)系抽取-piplineSoft-Attention層將實(shí)體抽取與關(guān)系抽取分為兩個(gè)獨(dú)立的過程,關(guān)系抽取依賴實(shí)體抽取的結(jié)果softmax+l2輸入層:傳統(tǒng)的輸入-tokenEmbedding+PositionEmbedding領(lǐng)域的先驗(yàn)知識:實(shí)體所屬的域及層級關(guān)系關(guān)系抽取-pipline路線缺點(diǎn):特別依賴實(shí)體抽取的結(jié)果,若是實(shí)體抽取錯(cuò)誤,易造成誤差累積無法處理復(fù)雜語境下的關(guān)系抽取“送餐員”這個(gè)實(shí)體出現(xiàn)在了多個(gè)關(guān)系中要要解決復(fù)雜語境下的關(guān)抽取任務(wù)當(dāng)作一個(gè)每個(gè)關(guān)系互斥的多分類任務(wù),而是看作每個(gè)關(guān)系獨(dú)立的多個(gè)二分類任務(wù)關(guān)系抽取-joint路線spspo思路:借鑒了seq2seq的概率圖思路,對于三元組(s,o,p),其抽取過程可以建模為p(s,p,o)=p(s)p(o|s)p(p|s,o)緩解重疊情況帶來的問題采用了MRC中常用的指針網(wǎng)絡(luò)的抽取方法,即僅抽取答案的開始和結(jié)束位置把預(yù)測開始和結(jié)束位置的任務(wù)轉(zhuǎn)化為了預(yù)測每一個(gè)位置是否為開始位置或結(jié)束位置(將softmx換成sigmoid)pipline路線VSjoint路線METHOD優(yōu)點(diǎn)F1累積實(shí)體識別的誤差不能處理復(fù)雜語境下的關(guān)系抽取沒有誤差累積可以處理復(fù)雜語境下的關(guān)系抽取模型復(fù)雜,預(yù)測耗時(shí)長03圖譜在推薦中的應(yīng)用騎手配送+2.5%+4%知識圖譜重新定義了招聘推薦流量的組織方式騎手配送+2.5%+4%場景:針對用戶不同的求職、人才偏好,為了提升雙邊匹配的效率,靈活的組織滿足該用戶的流量對于招聘高峰季,以個(gè)性化的專題去組織流量多維度個(gè)性化專題多維度個(gè)性化專題組織-傳統(tǒng)的推薦模式下,是以單個(gè)標(biāo)簽或者割裂式多標(biāo)簽堆疊的方式組織流量-基于知識圖譜的推薦模式下,從關(guān)系的角度去串聯(lián)標(biāo)簽,組織流量-維度多、精準(zhǔn)、可解釋性高具體的某具體的某個(gè)場景如企業(yè)cvr115%面邀率承載流量面邀率承載流量知識圖譜賦能推薦中供求關(guān)系的平衡平臺(tái) 求職者招聘求職者求職行為是一個(gè)短時(shí)間連續(xù)行為,滿足了就不存在了B端職位是有限的資源,尤其是特定領(lǐng)域的崗位求職者也是一個(gè)有限的資源,尤其是特定領(lǐng)域的人才供求關(guān)系不平衡時(shí)怎么處理?-傳統(tǒng)的推薦方式會(huì)基于熱門的職位、簡歷去做補(bǔ)充-基于知識圖譜推薦的方式:利用圖計(jì)算技術(shù),發(fā)現(xiàn)一些相似的職位利用知識圖譜中屬性相關(guān),發(fā)現(xiàn)一些相關(guān)職位利用用戶的背景職位關(guān)系、行為序列關(guān)系發(fā)現(xiàn)一些同背景的職位+1.6%%752%75供供求不匹配的場景雙邊連接率日新增點(diǎn)擊點(diǎn)擊“商場保安”相似職位、相關(guān)標(biāo)簽引導(dǎo)關(guān)注職位推薦中基于知識圖譜的智能引導(dǎo)點(diǎn)擊“商場保安”相似職位、相關(guān)標(biāo)簽引導(dǎo)關(guān)注職位通過相關(guān)實(shí)體逐步引導(dǎo)用戶更明確自己的需求,提高雙邊連接率通過通過多次引導(dǎo)完成求職繼續(xù)引導(dǎo)智能標(biāo)簽的引導(dǎo)為后續(xù)的雙邊連接率帶來+5%的相對提升智能推薦+創(chuàng)意標(biāo)題知識認(rèn)知時(shí)間自由雙休學(xué)歷不限送餐員知識圖譜輔助認(rèn)知推薦智能推薦+創(chuàng)意標(biāo)題知識認(rèn)知時(shí)間自由雙休學(xué)歷不限
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鎮(zhèn)中心小學(xué)財(cái)務(wù)制度
- 安全管理財(cái)務(wù)制度
- 義工團(tuán)隊(duì)財(cái)務(wù)制度
- 資產(chǎn)管理子公司財(cái)務(wù)制度
- 奶制品工廠財(cái)務(wù)制度
- 分行業(yè)企業(yè)財(cái)務(wù)制度
- 農(nóng)村幸福院無糾紛調(diào)處制度
- 關(guān)于嚴(yán)格執(zhí)行招標(biāo)投標(biāo)法規(guī)制度
- 公司安保巡邏制度
- 機(jī)構(gòu)銷售策劃活動(dòng)方案(3篇)
- 小美滿合唱五線譜總譜
- 《陸上風(fēng)電場工程設(shè)計(jì)概算編制規(guī)定及費(fèi)用標(biāo)準(zhǔn)》(NB-T 31011-2019)
- 介入導(dǎo)管室有關(guān)知識課件
- 騰訊云智慧機(jī)場建設(shè)方案
- 2024年黑龍江哈爾濱“丁香人才周”哈爾濱市生態(tài)環(huán)境局所屬事業(yè)單位招聘筆試沖刺題
- 鑄牢中華民族共同體意識課件
- 推廣經(jīng)理半年工作計(jì)劃
- 110kV線路運(yùn)維方案
- 智能化弱電工程常見質(zhì)量通病的避免方法
- 屋頂光伏安全專項(xiàng)施工方案
- 醫(yī)療器械拓展性臨床試驗(yàn)管理規(guī)定(試行)YY/T-0292.1-2020《醫(yī)用診斷X射線輻射防護(hù)器具》
評論
0/150
提交評論