下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
研發(fā)工程師科技公司實(shí)習(xí)報(bào)告一、摘要
2023年7月1日至2023年8月31日,我在一家專(zhuān)注于人工智能技術(shù)的科技公司擔(dān)任研發(fā)工程師實(shí)習(xí)生。核心工作成果包括參與開(kāi)發(fā)智能推薦算法模塊,通過(guò)優(yōu)化模型參數(shù),將系統(tǒng)響應(yīng)時(shí)間縮短至0.3秒,用戶(hù)點(diǎn)擊率提升12%。運(yùn)用Python和TensorFlow實(shí)現(xiàn)數(shù)據(jù)預(yù)處理流程,處理約5TB用戶(hù)行為數(shù)據(jù),準(zhǔn)確率達(dá)89%。在項(xiàng)目中應(yīng)用敏捷開(kāi)發(fā)方法論,結(jié)合Git進(jìn)行版本控制,推動(dòng)團(tuán)隊(duì)協(xié)作效率提升30%。提煉出的特征工程優(yōu)化策略可復(fù)用于提升相似度計(jì)算模型的效率。
二、實(shí)習(xí)內(nèi)容及過(guò)程
2023年7月1日至2023年8月31日,我在一家做智能推薦系統(tǒng)的公司實(shí)習(xí),崗位是研發(fā)工程師。剛?cè)ツ菚?huì)兒,主要是熟悉業(yè)務(wù)和團(tuán)隊(duì)項(xiàng)目。我們團(tuán)隊(duì)在優(yōu)化用戶(hù)畫(huà)像構(gòu)建模塊,我接手了特征工程這塊兒。原始數(shù)據(jù)有5TB,維度特別多,直接喂給模型效果差得很,準(zhǔn)確率也就75%,用戶(hù)點(diǎn)擊率也上不去。那段時(shí)間挺撓頭的,感覺(jué)方案試來(lái)試去都不對(duì)路。后來(lái)導(dǎo)師建議我從日志里挖掘更細(xì)的行為特征,用PCA降維,再加點(diǎn)LDA主題模型,跑了幾輪實(shí)驗(yàn),最終把特征數(shù)量壓縮到200個(gè),準(zhǔn)確率飆到了89%,響應(yīng)時(shí)間也快了,從2秒降到0.3秒。這個(gè)項(xiàng)目讓我直觀點(diǎn)了模型調(diào)參不是瞎改參數(shù)那么簡(jiǎn)單,得懂?dāng)?shù)據(jù)分布,還得會(huì)踩坑。
團(tuán)隊(duì)用的是敏捷開(kāi)發(fā),需求變更特別頻繁,有時(shí)候前一天還確定的技術(shù)方案,第二天得改。有好幾次我寫(xiě)的接口被推翻重來(lái),挺挫敗的。但這也逼我學(xué)會(huì)快速學(xué)習(xí),比如用Jira跟蹤需求,每天站會(huì)匯報(bào)進(jìn)度,晚上回去補(bǔ)補(bǔ)SpringCloud微服務(wù)架構(gòu)這塊兒短板。有個(gè)挑戰(zhàn)是分布式環(huán)境下數(shù)據(jù)一致性問(wèn)題,我們用Redis做緩存,但并發(fā)大的時(shí)候會(huì)出現(xiàn)超賣(mài)。當(dāng)時(shí)我提了個(gè)方案用分布式鎖,但實(shí)現(xiàn)起來(lái)復(fù)雜,最后團(tuán)隊(duì)選了本地緩存+定時(shí)同步的折中方案,效果還行,但心里還是覺(jué)得自己的方案可能更好。不過(guò)轉(zhuǎn)念想,公司這規(guī)模,能按時(shí)上線(xiàn)比啥都強(qiáng)。
我還參與了模型部署流程,用Docker打包鏡像,推到Kubernetes集群上,第一次接觸這些挺新鮮,但也踩了不少小坑,比如容器網(wǎng)絡(luò)配置不對(duì),模型就起不來(lái)。這段經(jīng)歷讓我明白,做研發(fā)不光得懂算法,還得懂工程化。公司技術(shù)棧挺新的,但培訓(xùn)機(jī)制有點(diǎn)弱,很多東西得自己摸索。比如有次想學(xué)他們的MLOps平臺(tái),翻半天文檔都沒(méi)找到完整教程,最后還是問(wèn)師兄才搞定。我覺(jué)得他們可以搞個(gè)內(nèi)部Wiki,把常用操作都錄個(gè)視頻,或者搞個(gè)新人培養(yǎng)計(jì)劃,指定個(gè)老員工帶,效率肯定能高不少。崗位匹配度上,我主要做后端開(kāi)發(fā)和模型部署,但感覺(jué)對(duì)業(yè)務(wù)理解不夠深,有時(shí)候需求理解有偏差,導(dǎo)致返工。下次實(shí)習(xí)我得主動(dòng)多跟產(chǎn)品經(jīng)理聊,早點(diǎn)摸透業(yè)務(wù)邏輯。這段經(jīng)歷讓我意識(shí)到,技術(shù)好只是基礎(chǔ),得會(huì)跟人打交道,項(xiàng)目才能順利。
三、總結(jié)與體會(huì)
這8周,從2023年7月到8月,在公司的經(jīng)歷像給理論課上了場(chǎng)硬核實(shí)踐課。以前覺(jué)得算法跑通就行,現(xiàn)在明白落地得考慮成本、穩(wěn)定性,比如那個(gè)用戶(hù)畫(huà)像項(xiàng)目,最終選的方案在準(zhǔn)確率和延遲間做了取舍,這跟學(xué)校里不計(jì)代價(jià)追求最優(yōu)解完全不一樣。數(shù)據(jù)量從5TB處理到200維特征,每一步都得有數(shù),看著準(zhǔn)確率從75%爬升到89%,點(diǎn)擊率跟著漲,才真切感受到技術(shù)能帶來(lái)的改變,這比單純看論文有意思多了。
團(tuán)隊(duì)那套敏捷開(kāi)發(fā)流程,需求隨時(shí)變,一開(kāi)始挺不適應(yīng),但后來(lái)發(fā)現(xiàn)這逼著人快速學(xué)習(xí),比如為了跟上版本迭代,硬著頭皮把SpringCloud和Docker學(xué)了個(gè)七七八八。最深的體會(huì)是,學(xué)校教的基礎(chǔ)是骨架,公司里學(xué)的是血肉,怎么把理論用在實(shí)際場(chǎng)景里,怎么跟人協(xié)作把東西做出來(lái),是最大的收獲。導(dǎo)師常說(shuō)“對(duì)結(jié)果負(fù)責(zé)”,這句話(huà)我現(xiàn)在理解了,不再是做完就行,而是要確保用戶(hù)能用上、用得好。這種責(zé)任感是以前沒(méi)體會(huì)過(guò)的。
看著部署在Kubernetes上的服務(wù)穩(wěn)定運(yùn)行,處理著真實(shí)用戶(hù)的請(qǐng)求,突然就清晰了未來(lái)的路。這個(gè)行業(yè)對(duì)MLOps、分布式系統(tǒng)的需求越來(lái)越明顯,這也提醒我,接下來(lái)得往這個(gè)方向深耕。學(xué)校那套學(xué)習(xí)路徑太寬了,這次實(shí)習(xí)讓我知道,得挑重點(diǎn)攻。比如想轉(zhuǎn)全棧,那后端這塊就得補(bǔ)強(qiáng),計(jì)劃下學(xué)期就把那個(gè)微服務(wù)認(rèn)證課補(bǔ)上,順便考個(gè)AWS或者K8s的證,增加點(diǎn)競(jìng)爭(zhēng)力。行業(yè)里感覺(jué)AI落地是趨勢(shì),怎么把算法用好、用大,怎么解決工程難題,這才是真本事。這次經(jīng)歷像開(kāi)了扇窗,讓我看清了想成為有用的人,還得持續(xù)學(xué)習(xí),不斷給自己加壓。從學(xué)生到準(zhǔn)職場(chǎng)人,心態(tài)變了,肩上的事也重了,但心里踏實(shí)多了。
四、致謝
感謝公司給我這次實(shí)習(xí)機(jī)會(huì),讓我接觸到了真實(shí)的研發(fā)環(huán)境。感謝導(dǎo)師悉心指導(dǎo),尤其是在特征工程和模型調(diào)優(yōu)上給我的建議,幫助
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年通信協(xié)議與網(wǎng)絡(luò)協(xié)議進(jìn)階題集
- 2026年解釋針對(duì)職場(chǎng)溝通技巧和禮儀的考核題目
- 2026年金融投資安全試題解析投資風(fēng)險(xiǎn)與防范策略
- 2026年系統(tǒng)架構(gòu)師面試復(fù)雜算法題的解決思路
- 2026年企業(yè)內(nèi)部培訓(xùn)資料CNAS企業(yè)質(zhì)量認(rèn)證標(biāo)準(zhǔn)相關(guān)試題
- 2026年能源工程項(xiàng)目收尾技術(shù)要點(diǎn)題解
- 2026年政府政策與法律解讀公務(wù)員筆試實(shí)務(wù)模擬題
- 2026年財(cái)務(wù)管理與財(cái)務(wù)分析考試寶典
- 2026年審計(jì)從業(yè)者易混淆知識(shí)點(diǎn)錯(cuò)題集
- 2026年程序員進(jìn)階考試題庫(kù)代碼與算法全解析
- 2026年山東省煙草專(zhuān)賣(mài)局(公司)高校畢業(yè)生招聘流程筆試備考試題及答案解析
- 附圖武陵源風(fēng)景名勝區(qū)總體規(guī)劃總平面和功能分區(qū)圖樣本
- 八年級(jí)下冊(cè)《昆蟲(chóng)記》核心閱讀思考題(附答案解析)
- 煤礦復(fù)產(chǎn)安全培訓(xùn)課件
- 2025年中職藝術(shù)設(shè)計(jì)(設(shè)計(jì)理論)試題及答案
- 2026屆高考?xì)v史二輪突破復(fù)習(xí):高考中外歷史綱要(上下兩冊(cè))必考??贾R(shí)點(diǎn)
- 鐵路交通法律法規(guī)課件
- 2025年體育行業(yè)專(zhuān)家聘用合同范本
- 對(duì)于尼龍件用水煮的原因分析
- ECMO患者血糖控制與胰島素泵管理方案
- 消防安全操作規(guī)程操作規(guī)程
評(píng)論
0/150
提交評(píng)論