計(jì)算機(jī)專業(yè)畢業(yè)生應(yīng)聘和畢設(shè)分享_第1頁
計(jì)算機(jī)專業(yè)畢業(yè)生應(yīng)聘和畢設(shè)分享_第2頁
計(jì)算機(jī)專業(yè)畢業(yè)生應(yīng)聘和畢設(shè)分享_第3頁
計(jì)算機(jī)專業(yè)畢業(yè)生應(yīng)聘和畢設(shè)分享_第4頁
計(jì)算機(jī)專業(yè)畢業(yè)生應(yīng)聘和畢設(shè)分享_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

xx20xx/xx/xx計(jì)算機(jī)專業(yè)畢業(yè)生應(yīng)聘和畢設(shè)分享2就業(yè)形勢變化互聯(lián)網(wǎng)經(jīng)濟(jì)下行,大廠裁員縮招,但是更多非計(jì)算機(jī)專業(yè)的開始轉(zhuǎn)碼越來越多的人選擇制造業(yè)(新能源汽車,手機(jī)廠,機(jī)器人)外企縮招或者不招非互聯(lián)網(wǎng)一線大廠可能開出更高的工資(得物,榮耀)銀行國企運(yùn)營商開始成為趨之若鶩的香餑餑考公成為一種潮流高學(xué)歷成為敲門磚結(jié)果沒有太多試錯的機(jī)會盡早確定自己的目標(biāo)和方向關(guān)于就業(yè)選擇:沒有哪個選項(xiàng)一定更好,只有哪個更適合自己,學(xué)會取舍選擇安逸同時也失去了抗風(fēng)險的能力,選擇奮斗失去了豐富業(yè)務(wù)生活甚至損失一定的身體健康新形勢下的就業(yè)選擇1/24/20263找工作時間線時間點(diǎn):-2月:準(zhǔn)備八股,項(xiàng)目,刷題,打磨簡歷2-5月:各個企業(yè)的實(shí)習(xí)招聘,開題6-8月:實(shí)習(xí)7-8月:秋招提前批8-10月:秋招10-11月:銀行筆面試,國企筆面試11月-3月:公務(wù)員考試,面試建議:早確定自己的就業(yè)目標(biāo),早做準(zhǔn)備根據(jù)自己的目標(biāo)合理規(guī)劃時間,安排學(xué)習(xí)計(jì)劃簡歷制作項(xiàng)目經(jīng)歷最好和崗位匹配針對不同公司不同崗位對簡歷進(jìn)行調(diào)整:國企:多加入榮譽(yù),學(xué)生工作,社會實(shí)踐互聯(lián)網(wǎng)企業(yè):多介紹技能,項(xiàng)目,不用仔細(xì)介紹學(xué)生工作經(jīng)歷項(xiàng)目最好兩到三個:科研項(xiàng)目課設(shè)項(xiàng)目有個人博客和GitHub地址是加分項(xiàng)1/24/20264項(xiàng)目經(jīng)驗(yàn)要點(diǎn)項(xiàng)目創(chuàng)新性:不要爛大街的項(xiàng)目(秒殺系統(tǒng)、電商項(xiàng)目)開源項(xiàng)目,學(xué)校里的真實(shí)項(xiàng)目項(xiàng)目亮點(diǎn)設(shè)計(jì):代碼質(zhì)量:項(xiàng)目測試,用例覆蓋測試,開源測試框架項(xiàng)目上線:展示項(xiàng)目的運(yùn)行情況壓力測試:qps,用開源框架進(jìn)行壓測,找到性能瓶頸,并進(jìn)行提升1/24/20265項(xiàng)目難點(diǎn):FGC或者CPU飆升問題排查:內(nèi)存泄露的bug死鎖問題:死鎖排查,并發(fā)集合流量問題:限流系統(tǒng)優(yōu)化實(shí)習(xí)分享實(shí)習(xí)時間:5.8-8.15實(shí)習(xí)內(nèi)容:美團(tuán)廣告平臺展示廣告系統(tǒng)開發(fā)工作時間:朝10晚8,中午休息兩小時,晚飯1小時(隱性要求11小時)實(shí)習(xí)體驗(yàn):部門氛圍不錯,但是工作強(qiáng)度比較大;人員流動不大,核心技術(shù)掌握在老員工手里;晉升空間有限,晉升的名額緊縮建議:多讀文檔,閱讀源代碼寫好文檔,記錄自己的工作內(nèi)容搞懂一些核心需求,以后面試用表現(xiàn)得很想留下來后期不要太專注于工作,多關(guān)注秋招情況,早投簡歷,抽空參加筆試面試6秋招越早開始越好,抓住提前批的機(jī)會面試記錄并復(fù)盤,針對自己回答不好的內(nèi)容及時進(jìn)行強(qiáng)化看別人的面經(jīng),查漏補(bǔ)缺海投可以,但是要有針對性地選擇幾個意向公司沖刺三方慎重簽?zāi)壳昂芏喙径家?-6月份才能毀約學(xué)院也只能1月之后才能毀約1/24/20267基于語義對齊的代碼搜索方法研究1/24/20268代碼搜索給定自然語言查詢,返回代碼庫中最符合查詢語義的代碼片段挑戰(zhàn)對自然語言查詢和代碼語義的深度理解和匹配研究現(xiàn)狀基于信息檢索的代碼搜索方法基于深度學(xué)習(xí)(RNN、CNN、LSTM)基于Transformer多模態(tài)預(yù)訓(xùn)練語言模型1/24/2026東南大學(xué)軟件學(xué)院9研究背景和現(xiàn)狀基于Transformer多模態(tài)預(yù)訓(xùn)練語言模型的代碼搜索?輸入預(yù)訓(xùn)練CodeBERT?代碼代碼-文檔對Maskedlanguagemodeling?Replacetokendetection?GraphCodeBERT?代碼文檔對數(shù)據(jù)流圖Maskedlanguagemodeling?Edgeprediction?Nodealignment?UniXcoder?文檔ASTMaskedlanguagemodeling(Encoder)?UnidirectionalLanguageModeling(Decoder)?DenoisingObjective(encode-decoder)?模型能夠同時接受多種輸入(自然語言查詢和代碼片段),組合成一個輸入送入模型計(jì)算語義相似度代碼結(jié)構(gòu)Token序列1/24/2026東南大學(xué)軟件學(xué)院10研究背景和現(xiàn)狀缺陷目前的代碼搜索模型只能夠接受原始的英文自然語言輸入,不支持中文自然語言輸入目前的代碼搜索和代碼表示學(xué)習(xí)的數(shù)據(jù)集都是英文的,沒有包含中文文檔的數(shù)據(jù)集目前的大模型在代碼搜索上的搜索響應(yīng)時間較長,不具備很好的應(yīng)用前景市場上的代碼搜索工具大多是基于信息檢索,基于語義理解的代碼搜索模型還不夠成熟研究目標(biāo)探索基于語義對齊的支持中英文語言的自然語言代碼搜索方法研究內(nèi)容構(gòu)建包含中文和英文文檔的預(yù)訓(xùn)練數(shù)據(jù)集構(gòu)建包含中文和英文自然語言查詢的代碼搜索數(shù)據(jù)集代碼表示學(xué)習(xí)模型預(yù)訓(xùn)練三個預(yù)訓(xùn)練任務(wù)自然語言代碼搜索方法的研究1/24/2026111/24/202611數(shù)據(jù)集構(gòu)建——中文和英文文檔的預(yù)訓(xùn)練數(shù)據(jù)集數(shù)據(jù)源開放源代碼平臺如github、gitee等平臺上clone了10w+涵蓋了多種編程語言的代碼倉庫數(shù)據(jù)格式文檔:中文、英文代碼:函數(shù)(C++、java、Python、JS)label:0/1生成規(guī)則限制倉庫star數(shù)量保證代碼質(zhì)量限制代碼和文檔長度只截取文檔的第一個自然段函數(shù)名不能在黑名單列表中提取去文檔之后要將文檔從函數(shù)中剔除1/24/202612數(shù)據(jù)集構(gòu)建——中文和英文查詢的代碼搜索數(shù)據(jù)集數(shù)據(jù)源技術(shù)問答網(wǎng)站如CSDN、Segmentfault、Stackoverflow等數(shù)據(jù)格式查詢:中文、英文代碼:函數(shù)(C++、java、Python、JS)label:0/1問:如何將駝峰式字符串轉(zhuǎn)為蛇形?def

camel_to_snake(camel_case):

#將所有大寫字母前面加上下劃線,然后將字符串全部轉(zhuǎn)為小寫

snake_case=re.sub(r'(?<!^)(?=[A-Z])','_',camel_case).lower()

returnsnake_case

1/24/202613代碼表示學(xué)習(xí)模型基于transformer編碼器6層transformer層隱藏向量768輸入:

代碼表示學(xué)習(xí)模型預(yù)訓(xùn)練任務(wù)1——MLM(掩碼語言模型)隨機(jī)選15%token[MASK]隨機(jī)token保持不變80%replaced10%10%

Transformer1/24/202615代碼表示學(xué)習(xí)模型預(yù)訓(xùn)練任務(wù)2——代碼文檔匹配代碼和文檔語義對齊二分類任務(wù):預(yù)測代碼和文檔是否匹配,輸出0,1標(biāo)簽

1/24/202616代碼表示學(xué)習(xí)模型預(yù)訓(xùn)練任務(wù)3——語義節(jié)點(diǎn)對齊將代碼和文檔中的關(guān)鍵語義信息節(jié)點(diǎn)進(jìn)行對齊人工標(biāo)注:標(biāo)注文檔和代碼中的關(guān)鍵節(jié)點(diǎn)對每條數(shù)據(jù)中可以標(biāo)注多對1/24/202617代碼表示學(xué)習(xí)模型預(yù)訓(xùn)練任務(wù)3——語義節(jié)點(diǎn)對齊注意力控制Mask矩陣,白色可見,黑色不可見?

001000模型輸入輸出1/24/202618代碼搜索實(shí)驗(yàn)級聯(lián)快慢搜索模型快模型:提前將代碼編碼成向量,利用向量聚類縮小候選集提高響應(yīng)速度慢模型:將代碼和查詢組合輸入模型計(jì)算語義相似度提高搜索效果返回相似度得分最高的代碼片段實(shí)驗(yàn)設(shè)置:給定一個查詢-代碼對,將正確答案混淆到999個干擾項(xiàng)中1/24/202619代碼搜索實(shí)驗(yàn)數(shù)據(jù)集:CodeSearchNet,自建的代碼搜索數(shù)據(jù)集

對比模型:RobertaCodeBERT、GraphCodeBERT、UnixCoderchatGPT等大模型

函數(shù)數(shù)量

帶文檔

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論