下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
互聯(lián)網(wǎng)金融平臺(tái)數(shù)據(jù)分析師實(shí)習(xí)報(bào)告一、摘要
2023年7月1日至2023年8月31日,我在一家互聯(lián)網(wǎng)金融平臺(tái)擔(dān)任數(shù)據(jù)分析師實(shí)習(xí)生。核心工作成果包括完成用戶行為分析報(bào)告,通過(guò)處理平臺(tái)內(nèi)30萬(wàn)用戶近兩個(gè)月的數(shù)據(jù),識(shí)別出3個(gè)關(guān)鍵用戶流失風(fēng)險(xiǎn)因子,并構(gòu)建了基于邏輯回歸的風(fēng)險(xiǎn)預(yù)測(cè)模型,準(zhǔn)確率達(dá)82%。運(yùn)用SQL對(duì)海量數(shù)據(jù)進(jìn)行高效提取,使用Python進(jìn)行數(shù)據(jù)清洗和可視化,輸出10份可視化報(bào)表,直接支持業(yè)務(wù)部門(mén)優(yōu)化產(chǎn)品策略。提煉出的可復(fù)用方法論包括:利用漏斗分析模型系統(tǒng)性評(píng)估用戶轉(zhuǎn)化路徑,采用A/B測(cè)試設(shè)計(jì)科學(xué)驗(yàn)證假設(shè),這些方法在實(shí)習(xí)期間被團(tuán)隊(duì)采納并應(yīng)用于后續(xù)項(xiàng)目中。
二、實(shí)習(xí)內(nèi)容及過(guò)程
2023年7月1日到8月31日,我在一家做線上信貸業(yè)務(wù)的公司實(shí)習(xí),崗位是數(shù)據(jù)分析師。剛開(kāi)始主要是熟悉業(yè)務(wù)和內(nèi)部系統(tǒng),公司給我安排了前輩帶,但感覺(jué)系統(tǒng)挺復(fù)雜的,尤其是數(shù)據(jù)看板上的指標(biāo)定義不太統(tǒng)一,有時(shí)候要花老半天才能搞明白。第一個(gè)挑戰(zhàn)是做用戶活躍度分析,數(shù)據(jù)量有200萬(wàn)條,直接在Excel里處理卡得不行,還錯(cuò)了好幾次。后來(lái)我鼓搗著用了Python的Pandas庫(kù),把數(shù)據(jù)分塊處理,再結(jié)合JupyterNotebook跑代碼,效率高多了,最后生成的用戶活躍趨勢(shì)圖幫助運(yùn)營(yíng)那邊發(fā)現(xiàn)了幾個(gè)異常波動(dòng)的時(shí)段。
實(shí)習(xí)期間參與了一個(gè)項(xiàng)目,是分析新用戶的注冊(cè)轉(zhuǎn)化漏斗。我們收集了上周新增的1.5萬(wàn)用戶的注冊(cè)、實(shí)名認(rèn)證、提交申請(qǐng)、放款這幾個(gè)環(huán)節(jié)的數(shù)據(jù),發(fā)現(xiàn)從提交申請(qǐng)到放款的轉(zhuǎn)化率只有15%,比之前低5個(gè)百分點(diǎn)。我通過(guò)細(xì)分用戶來(lái)源渠道,發(fā)現(xiàn)第三方導(dǎo)流用戶的轉(zhuǎn)化率特別低,只有8%,而直接搜索來(lái)的用戶轉(zhuǎn)化率接近25%。這個(gè)發(fā)現(xiàn)挺關(guān)鍵的,因?yàn)闃I(yè)務(wù)部門(mén)之前沒(méi)太關(guān)注渠道差異。后來(lái)我們建議對(duì)不同渠道的用戶推送不同的營(yíng)銷話術(shù),測(cè)試了兩周后,導(dǎo)流用戶的轉(zhuǎn)化率提升到了18%,雖然不算翻天覆地,但已經(jīng)能看到效果了。
做這些分析的時(shí)候,最頭疼的是數(shù)據(jù)質(zhì)量差。有時(shí)候數(shù)據(jù)庫(kù)里的年齡填得亂七八糟,有人填123,有人填次臥,還得手動(dòng)爬取一些公開(kāi)數(shù)據(jù)補(bǔ)充。有一次做模型驗(yàn)證,數(shù)據(jù)抽樣的時(shí)候發(fā)現(xiàn)樣本分布嚴(yán)重傾斜,有些群體的數(shù)據(jù)量不到1%,直接用原始數(shù)據(jù)跑模型肯定不準(zhǔn)。我就用了分層抽樣法,按照用戶年齡、收入這些維度重新分配權(quán)重,最后模型效果好了不少,AUC從0.75提升到了0.82。前輩說(shuō)我這個(gè)處理方式挺專業(yè)的,以后遇到樣本偏差問(wèn)題可以直接用。
公司的培訓(xùn)機(jī)制其實(shí)一般,就給我發(fā)了幾本產(chǎn)品手冊(cè),沒(méi)太系統(tǒng)教什么分析工具的高級(jí)用法。有時(shí)候遇到復(fù)雜的SQL查詢,要問(wèn)好幾遍同事。崗位匹配度上,我學(xué)的是偏學(xué)術(shù)的分析方法,但實(shí)際工作更看重快速找到數(shù)據(jù)、用Excel或者BI工具現(xiàn)成的功能解決業(yè)務(wù)問(wèn)題。我花了挺多時(shí)間研究Tableau,把一些常用圖表模板做成了模板庫(kù),之后做報(bào)表的時(shí)候效率高了不少。
實(shí)習(xí)期間也發(fā)現(xiàn)了一些問(wèn)題,比如公司內(nèi)部數(shù)據(jù)權(quán)限控制得有點(diǎn)死,有時(shí)候需要分析跨部門(mén)的數(shù)據(jù)要跑好幾個(gè)流程審批。而且數(shù)據(jù)倉(cāng)庫(kù)里的字段定義不統(tǒng)一,同一個(gè)概念在不同系統(tǒng)里叫法不一樣,整合數(shù)據(jù)的時(shí)候老出錯(cuò)誤。我琢磨著能不能搞個(gè)數(shù)據(jù)字典文檔,把各個(gè)系統(tǒng)的字段對(duì)應(yīng)關(guān)系都列清楚,但這個(gè)建議沒(méi)被采納,估計(jì)是覺(jué)得麻煩。
對(duì)我職業(yè)規(guī)劃挺有啟發(fā)的,以前覺(jué)得數(shù)據(jù)分析就是搞搞模型、畫(huà)畫(huà)圖表,現(xiàn)在明白跟業(yè)務(wù)結(jié)合有多重要。比如這次用戶轉(zhuǎn)化分析,如果光看模型本身,可能不會(huì)注意到渠道差異這種問(wèn)題。以后想多接觸行業(yè)知識(shí),尤其是信貸風(fēng)控這塊,感覺(jué)能用到的東西特別多。雖然實(shí)習(xí)里遇到不少坑,但確實(shí)學(xué)到不少東西,比如怎么快速處理海量數(shù)據(jù),怎么跟業(yè)務(wù)部門(mén)溝通需求,這些在學(xué)校里根本學(xué)不到。
三、總結(jié)與體會(huì)
這8周,從2023年7月到8月,在互聯(lián)網(wǎng)金融平臺(tái)的數(shù)據(jù)分析師實(shí)習(xí),感覺(jué)像是把書(shū)本知識(shí)和實(shí)際工作擰在了一起,收獲挺大的。剛開(kāi)始去的時(shí)候,心里挺沒(méi)底的,畢竟學(xué)校里做的項(xiàng)目規(guī)模小,這里動(dòng)不動(dòng)就幾萬(wàn)、幾十萬(wàn)的數(shù)據(jù)量。記得第一次獨(dú)立負(fù)責(zé)用戶行為分析報(bào)告,面對(duì)30萬(wàn)用戶的近兩個(gè)月數(shù)據(jù),頭兩天是真有點(diǎn)懵,不知道從哪兒下手。后來(lái)慢慢摸索,學(xué)會(huì)了怎么用SQL精確提取數(shù)據(jù),用Python處理異常值,用Tableau畫(huà)透用戶流失的漏斗圖,最終報(bào)告里的三個(gè)關(guān)鍵流失風(fēng)險(xiǎn)因子(分別是提交資料不完整、首次登錄間隔過(guò)長(zhǎng)、近期查詢次數(shù)異常)直接被業(yè)務(wù)部門(mén)采納,用來(lái)優(yōu)化了新用戶引導(dǎo)流程。這讓我覺(jué)得,數(shù)據(jù)分析真不是玩玩代碼那么簡(jiǎn)單,得懂業(yè)務(wù),得能讓數(shù)據(jù)說(shuō)話,幫到實(shí)際工作。這段經(jīng)歷讓我明白,做數(shù)據(jù)分析師不光要有技術(shù),還得有責(zé)任心,有時(shí)候一個(gè)小的數(shù)據(jù)處理失誤就可能讓整個(gè)分析結(jié)果失真,這個(gè)責(zé)任真的挺重的。
這次實(shí)習(xí)也讓我更清楚自己以后想干嘛。之前覺(jué)得數(shù)據(jù)分析就是個(gè)技術(shù)活,現(xiàn)在發(fā)現(xiàn)跟業(yè)務(wù)結(jié)合得這么緊密。比如,我發(fā)現(xiàn)自己特別擅長(zhǎng)通過(guò)數(shù)據(jù)挖掘用戶行為模式,這個(gè)能力在信貸風(fēng)控領(lǐng)域應(yīng)該很有用,以后想往這塊深挖。實(shí)習(xí)中接觸到的很多行業(yè)術(shù)語(yǔ),像用戶生命周期價(jià)值(LTV)、風(fēng)險(xiǎn)評(píng)分卡這些,現(xiàn)在理解得更深了。我覺(jué)得這幾個(gè)月的經(jīng)歷,讓我在簡(jiǎn)歷上絕對(duì)是個(gè)加分項(xiàng),至少能證明我不是只會(huì)紙上談兵。接下來(lái)打算好好學(xué)學(xué)機(jī)器學(xué)習(xí)相關(guān)的知識(shí),看看能不能考個(gè)相關(guān)的證書(shū),比如PMP或者某個(gè)數(shù)據(jù)分析師的認(rèn)證,給自己再添點(diǎn)砝碼。
從學(xué)生到職場(chǎng)人的心態(tài)轉(zhuǎn)變也挺明顯的。以前做項(xiàng)目,完不成任務(wù)就找老師溝通,現(xiàn)在發(fā)現(xiàn)問(wèn)題了,得自己先想辦法解決,比如數(shù)據(jù)質(zhì)量差我就去研究怎么清洗,模型跑不通我就去查資料學(xué)新算法。這種獨(dú)立解決問(wèn)題的能力,感覺(jué)比單純會(huì)做幾個(gè)模型更重要。而且抗壓能力也強(qiáng)了不少,以前做論文能熬幾天,現(xiàn)在面對(duì)老板催進(jìn)度、數(shù)據(jù)總出錯(cuò)的情況,也能穩(wěn)住了心態(tài),有條不紊地處理。
回看整個(gè)實(shí)習(xí)過(guò)程,感覺(jué)就像建了一個(gè)知識(shí)閉環(huán):學(xué)校學(xué)理論,實(shí)習(xí)用理論,遇到問(wèn)題再學(xué)新知識(shí),最后解決實(shí)際問(wèn)題,形成了一個(gè)正向反饋。現(xiàn)在對(duì)行業(yè)也更有感覺(jué)了,互聯(lián)網(wǎng)金融這塊數(shù)據(jù)真的海量,但怎么從中提煉價(jià)值,怎么用數(shù)據(jù)真正影響業(yè)務(wù)決策,還有很大的空間。未來(lái)不管去哪個(gè)行業(yè),這種數(shù)據(jù)驅(qū)動(dòng)思維、解決問(wèn)題的能力都是通用的。這次實(shí)習(xí)最大的體會(huì)就是,數(shù)據(jù)分析師不是純粹的程序員或者統(tǒng)計(jì)師,得是個(gè)懂業(yè)務(wù)、懂技術(shù)、還能跟人打交道的復(fù)合型人才。
四、致謝
感謝在實(shí)習(xí)期間給予指導(dǎo)和幫助的部門(mén)領(lǐng)導(dǎo),讓我有機(jī)會(huì)接觸真實(shí)的數(shù)據(jù)分析項(xiàng)目。特別感謝我的導(dǎo)師,在數(shù)據(jù)工具使用和業(yè)務(wù)理解上給了我很多啟
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 光伏屋頂運(yùn)營(yíng)公司制度
- 高速運(yùn)營(yíng)一崗雙責(zé)制度
- 燒鵝店運(yùn)營(yíng)管理制度
- 蘇寧小店運(yùn)營(yíng)管理制度
- 小紅書(shū)獲客運(yùn)營(yíng)提成制度
- 文化運(yùn)營(yíng)管理制度匯編
- 運(yùn)營(yíng)期維護(hù)制度
- 資本運(yùn)營(yíng)與總督制度
- 平臺(tái)運(yùn)營(yíng)維護(hù)管理制度
- 市場(chǎng)運(yùn)營(yíng)機(jī)械化管理制度
- 厚型防火涂料施工規(guī)范及操作流程
- 醫(yī)院行政管理體系介紹
- (新版)液氯安全標(biāo)簽
- 南昌地鐵保護(hù)管理辦法
- QC/T 476-2025客車(chē)防雨密封性要求及試驗(yàn)方法
- 2025+CACA子宮內(nèi)膜癌診療指南解讀
- 2022變壓器油枕技術(shù)培訓(xùn)
- 電力工程施工規(guī)范
- 配套課件-《中文版AutoCAD-2017基礎(chǔ)教程》
- DL∕T 1522-2016 發(fā)電機(jī)定子繞組內(nèi)冷水系統(tǒng)水流量 超聲波測(cè)量方法及評(píng)定導(dǎo)則
- 意識(shí)障礙的判斷及護(hù)理
評(píng)論
0/150
提交評(píng)論