版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
算法工程師轉正答辯
不同企業(yè)轉正答辯題目如下:
1.網易郵件事業(yè)部數(shù)據(jù)挖掘工程師
整數(shù)翻轉,如何處壬里越界問題;C++多態(tài),靜態(tài)聯(lián)編和動態(tài)聯(lián)編,虛函數(shù)
表;GMM原理,增大數(shù)據(jù)量是否會更好;模型融合如何做;股票買賣問題,一
次買賣和兩次買賣;提升樹的思想,隨機森林和提升樹的區(qū)別;EM算法數(shù)學原
理;SVM推導,對偶性的作用,核函數(shù)有哪些,有什么區(qū)別;分布式計算框架
了解哪些。
2.百度商業(yè)平臺部數(shù)據(jù)挖掘工程師
python兩個每行都是數(shù)字的文件合并,去重;shell編程,編輯文件;進程
與線程的區(qū)別;卷積神經網絡介紹;SVM的推導;大文件求交集,如何解決哈
希之后小文件還是放不進內存;堆排序代碼;連續(xù)和最大問題,如何證明;3sum
問題,時間復雜度;最短路問題,第K條最短路,
3.vivo人工智能工程師
bp算法介紹,梯度彌散問題;svm介紹,優(yōu)缺點是什么,lr介紹,區(qū)別是
什么;卜與線性回歸的區(qū)別;如果要預測房價,用什么模型;如果要預測房價,
并且知道一個房間的房型信息,如何構建模型;sigmoid函數(shù)的應用有哪些,
為什么;列舉十種常用的神經網絡模型;語音識別模型有哪些;如何識別一個人
在喝酒,需要幾個模型。
4.蘇寧算法工程師
卷積神經網絡中卷積如何實現(xiàn),激活函數(shù)的意義,損失函數(shù)有哪些,初始化
參數(shù)如何選擇;用過哪些深度學習框架,TensorFlow中的session是什么,
1
session和interactivesession的區(qū)別;如何實現(xiàn)卷積層權值共享;如何保存模
型,讀取已有的模型;用過哪些深度學習模型,區(qū)別是什么;了解哪些尋優(yōu)算法;
softmax損失函數(shù)是什么;C++的const,static作用;new,delete原理;
強制類型轉換cast之間的區(qū)別。
5.騰訊IEG應用研究
svm推導,核函數(shù)的體現(xiàn),常用的核函數(shù)有哪些;alexnet介紹;過擬合的
原因,有哪些避免過擬合的trick;1G的文本統(tǒng)計詞頻,輸出頻率最高的1000
個詞;手寫topk的代碼,快排。代碼還能如何優(yōu)化,如果要上線的話還需要做
哪些處理如果分類樣本的標簽只有一定的概率可信如何處理過擬合的原因,
有哪些防止過擬合的方法;mysql查詢一段時間中某個用戶的數(shù)據(jù)。
6.三星電子中國研究院機器學習研發(fā)工程師
筆試:水管工之類的算法題,求最大深度;模型評價如何做,其中存在哪些
問題;決策樹算法有哪些,隨機森林和GBDT的區(qū)別;降維方法,PCA原理;
哈夫曼樹在機器學習中的應用;文本挖掘算法了解哪些;人流量預測系統(tǒng)如何設
計。
profession筆試:最優(yōu)的進程調度算法(至少用多少個cpu);
英語自我介紹。
7.聯(lián)想研究院模式識別研究員
EM算法數(shù)學推導,如何證明算法收斂性;異常值的影響,如何消除;所有
了解的機器學習算法有哪些,框架性講述;梯度下降算法了解哪些,優(yōu)劣勢是什
么;二叉樹中序遍歷,遞歸和非遞歸;linux操作指令了解哪些,文本處理指令
有哪些;一億個數(shù)的文件,如何分成兩個文件a,b,使得a文件的數(shù)都小于b,
2
同時文件大小要差不多。
8.拼多多算法工程師
均勻分布如何生成正態(tài)分布;SVM原理,支撐向量越多越好還是越少越好;
二叉樹深度遍歷,時間復雜度和空間復雜度;二維排序矩陣搜索;項目中的長時
間推廣問題,如何考慮樣本之間非獨立的影響;編程題,矩陣中的最短路,有門
有鑰匙。動態(tài)規(guī)劃加狀態(tài)向量;貝葉斯公式,實際如何計算,如何解決精度問題。
9.五八集團算法工程師
字符串轉數(shù)字;svm核函數(shù)有哪些,如何選取,手寫表達式;降維方法介
紹;c的虛函數(shù),虛函數(shù)指針和虛函數(shù)表存在哪;Linux文件權限修改,參數(shù)介
紹;模型的比較如何做;隨機森林和提升樹;卷積神經網絡原理;如何避免網絡
的過擬合;如何網絡調優(yōu)。
10.獵聘算法工程師
Python的數(shù)據(jù)結構有哪些;tuple和set的區(qū)別,set的底層實現(xiàn);
hash表的算法有哪些;svm推導,一直到序列最小化求解。核函數(shù)如何體
現(xiàn),有哪些類型;構建分類器的整個流程是什么;數(shù)據(jù)清洗方法,缺失值處理方
法,降維方法;pea原理推導;決策樹算法的介紹;二維排序數(shù)組搜索;如何構
建欺詐交易識別的模型;不均衡的數(shù)據(jù)如何分類。
11.新浪移動數(shù)據(jù)挖掘工程師
歸并排序,二維排序數(shù)組搜索,中序遍歷重構二叉樹;svm推導,為什么
要用拉格朗日乘數(shù)法,對偶問題是什么;KKT條件都有什么,如何求解svm的
最優(yōu)化問題數(shù)據(jù)不均衡如何解決抽樣得到的分類準確率如何轉換為原準確率;
邏輯回歸原理,推導求解方法;為什么選用對數(shù)極大似然函數(shù)作為優(yōu)化目標,用
3
的入職了字節(jié)跳動的產品研發(fā)和工程架構部,感謝洪堂把我招進來提供給我一個
學習和展示自我的機會,感謝我的導師行云和郭洋以及組內很多同事的幫助和指
導,三個多月的時間在TOP項目組學到了很多,也收獲了很多。接下來我對這
段時間的工作做一個總結。
自入職以來,一直在做TOP(ToutiaoOperationPlatform)項目相關的
工作,TOP是一個給整個頭條所有業(yè)務線(UGC、PGC、西瓜等等)提供一個
統(tǒng)一的運營CRM后臺的項目,通過這個統(tǒng)一的CRM后臺來沉淀好的運營方法
論,實現(xiàn)快速支持多業(yè)務的通用運營需求,提升運營工作效率。TOP項目分為
很多個功能模塊,我主要參與過的是大盤分析,內容運營和作者運營模塊,參與
了這些模塊的功能迭代,那么在業(yè)務中就會有一些通用的場景我們可以抽離成組
件,所以團隊就開發(fā)了一套適合Top業(yè)務使用的組件庫top-rc,使用時只需要
引入這個包,進行簡單的屬性賦值就可以實現(xiàn)功能,大大的提升了開發(fā)效率,為
了在開發(fā)中省去編譯耗費的時間,團隊開發(fā)了CMS建站工具,引入了一些渲染
器,把top-rc中的組件遷移至CMS,通過寫JSON渲染頁面,直接在CMS開
發(fā)自定義頁面,簡單的需求或者改動節(jié)省了很多時間,縮短迭代周期。我用CMS
獨立開發(fā)了流量工具要聞后臺這個模塊之后也深芍感觸。
我想把我的工作分為三個階段來講,第一階段就是top-rc組件庫的建設,
第二階段就是參與TOP項目的一些功能迭代和細節(jié)優(yōu)化,第三階段是獨立開發(fā)
了TOP流量工具-要聞后臺模塊。
top-rc組件庫我共輸出了10多個組件,其中有展示類組件,InfoCard,展
示員工信息在設計這個組件的時候最開始是跟doc里面顯示的信息卡對齊的,
當時做完感覺很逼真,但后來考慮到如果我們想展示更多的信息呢?如果獲取不
5
到用戶頭像呢?如果網絡不好信息卡不能立即展示出來呢?在考慮到這些邊界
性情形之后就進一步去完善組件,可以配置頭像信息,下面的詳細信息可以通過
傳入一個數(shù)組進行循環(huán)渲染,label對應于Team、Manager,value對應于后
面的值,在沒有頭像時就是純信息展示,信息卡在未完全加載時顯示骨架屏。這
個InfoCard組件在后面的previewEmployee的組件里面使用,傳入一個Uid
就可以實現(xiàn)類似于doc里面預覽員工信息的功能。MetaCard是一個三元信息
展示,avatar,title,desc配置實現(xiàn)一個簡單地信息展示,可用在select篩選
框里,分為有無頭像,有無描述信息等幾種情況;Video和PreviewVideo通過
傳入gid屬性就可以預覽視頻信息,還可以配置寬度和高度以及是否自動播放等
信息。然后就是一些表單類組件,SelcetCity組件主要是遷移的antd里面的
cascader組件,主要遇到的問題就是城市數(shù)據(jù)的獲取與處理,編寫程序把統(tǒng)計
局網站上面拿到的數(shù)據(jù),城市編號和城市名稱處理成
labelzvalue,children
的格式,把最后生成的json文件傳到tos,前端通過api獲取并加緩存。
Uploadimage上傳圖片組件,需要從用戶角度考慮上傳圖片支持可裁剪,配置
可裁剪時可配置默認裁剪比例也可以拖動實現(xiàn)自定義裁剪大小,不配置可裁剪時
直接上傳,上傳完有預頗口刪除功能,支持uri和url,一次上傳多張圖片等。
還有一些簡單地交互類的業(yè)務中常見的場景,做成了組件,比如ArticleTitle,
表格里面經常見到,標題長度太長截斷展示點點點,鼠標hover展示全部,之
前需要自己用Tooltip寫,現(xiàn)在傳入一個gid屬性就可以實現(xiàn),還有TextCopy
和OuterAuthor通過簡單地屬性傳入就可以實現(xiàn)文本復制和監(jiān)專站外的功能,
所以開發(fā)這些組件我的一個感受就是我們要站在用戶的角度去設計,確定出需要
抽象出來的屬性,再一個就是屬性透傳問題,以及一些邊界情形的考慮。
6
最后輸出了一個頁面級的組件,layout,也是經過簡單的配置搭建出一個頁
面,左側菜單通過sideNavSettings來配置,最開始是用三元表達式判斷做到
了支持三級菜單可通過Json配置渲染展示,作為優(yōu)化點,如果想支持n級呢,
后來用遞歸的方法做了優(yōu)化,可支持n級菜單的渲染,頭部導航可以通過
配置,支持配置搜索框,以及右
headNavSettingstooltipzlink,popover,
側的個人中心,為提升交互體驗,搜索框未點擊時是一個icon,點擊icon,搜
索框過渡展開,失焦后過渡收縮,可通過onsearch屬性配置搜索內容。這里有
點難的點是處理url與selectedKey和openKey的雙向性,根據(jù)url確定要展
開的項和要選中的項,以及反過來選中某一項時將路由追加到url上。
第一個階段主要就是學習react框架,Typescript,以及antd,學習過程
中輸出了十多個常用的業(yè)務組件,之前這些都沒芍學過,git的使用也不熟練,
踩了一些坑,后來就周末花時間去整理了一下git相關的內容,學習了一下部分
原理,比如git是怎么進行存儲的,以及git的三個分區(qū)和變更歷史的形成,幾
組常見的git操作命令的對比,輸出了文檔并在周二的技術分享周會上并給團隊
做了一個分享。
第二階段做了一些具體的業(yè)務方面的工作,主要就是對于現(xiàn)有TOP項目中
一些可優(yōu)化的點進行改進,然后參與了幾個頁面的功能迭代。
關于TOP項目中的一些細節(jié)優(yōu)化,解決的主要有三個問題,第一個就是大
盤看板之前是iframe方式嵌入的/frame方式嵌入還有個弊端是背景顏色不可
以改變,我們的背景主題色是白色,而iframe顏色是灰色的,頁面不一致,所
以統(tǒng)一改為SDK的方式嵌入,可以修改背景顏色,又可以控制標題是否展示。
由于不同的看板寬高不同,前端獲取不到其高度,只能在前端寫死一個高度,在
7
iframe框內滾動展示,就導致可視空間太小,用戶體驗不好,為了和其他頁面
保持一致性,跟產品溝通之后最終解決方案是把頁面footer去掉,與其他頁面
視覺上保持一致,同時增加了全屏查看按鈕,使每一個看板都可以全屏展示解
決的第二個問題就是,負責維護大盤看板模塊時,發(fā)現(xiàn)大部分的需求都是往里面
增加看板,其實需求很簡單,配置appid,dashboardld注意好要展示的業(yè)務
線就可以了,但是這種簡單地需求也需要經過提mr,編譯部署到boe,再編譯
部署到線上這一系列耗時的操作,所以就對菜單進行優(yōu)化,在TCC動態(tài)配置中
心配置菜單項,前端通過接口引入,再有增加或者調整看板的需求時,很快就搞
定了。那次,正在做別的需求,產品經理wenxia在大盤看板迭代群里面艾特我
增加看板,插空五分鐘就給搞定了,產品很驚訝,以至于后來團建的時候見到我
第一句話就說需求支持很快。解決的第三個問題是像一些鏈接的跳轉啊,日期快
捷篩選這些,很多個頁面要用到的,之前是每一處都是單獨寫的,后面我改成了
統(tǒng)一變量管理,之后就可以一鍵修改。
除了一些細節(jié)優(yōu)化,我還參與了幾次內容列表與作者列表的功能迭代,比如
針對于之前內容列表里面的排序是內容總VV值,不同篩選條件時,列表的搜索
結果變化不大,導致運營者沒辦法看到指定內容在目標用戶群體的VV值,或者
按照目標用戶群的VV進行排序,當任意一個目標用戶篩選條件有值時,都要必
須填入VV占比,否則不能查詢。另外為了更明確當前選擇的產品,需要在特定
的字段后面加上括號,括號里面顯示產品名稱。作者分類之前是按一級分類和二
級分類這樣篩選的,后來改成了一級二級合并成起來分級展示,按頭條作者分類
和西瓜作者分類篩選,所有的這些篩選項需要綁定在URL上,帶參數(shù)分享,這
里當時是遇到了一點難題,總結起來是因為對里面的業(yè)務邏輯沒有很熟悉導致的,
8
因為代碼里面是拆分成了組件filter,table,contentMining,要理清楚里面的
傳值邏輯,以及各自維護的狀態(tài)有哪些,需要在哪一步進行urlquerybind,處
理參數(shù)回顯比如日期范圍W占比這種區(qū)間類的值的回顯。這個需求提測之后感
覺對這個頁面代碼很熟悉了,提測之后發(fā)現(xiàn)了一個之前遺留的bug,由于沒有
加篩選項時列表展示的頁數(shù)都比較多,問題就沒有暴露出來,也就是比如現(xiàn)在篩
選的有四頁,再加個篩選條件查詢結果是一頁,但是傳到服務端的值還是4,所
以需要在每次查詢時都要把當前頁數(shù)置為1,這個當時很快就改出來了,處理思
路跟在表格里括號加上產品類似。
之后又做了內容調整標簽整合到一列,增加字段,可見度文案調整之類的需
求,就都很快完成了。主要就是業(yè)務邏輯的實現(xiàn),然后前后端聯(lián)調,還有ppe
環(huán)境的部署。
在第二個階段,通過對業(yè)務代碼的接觸,熟悉了業(yè)務代碼的一整個開發(fā)流程,
包括前期的跟產品還有服務端的需求溝通,排期安排,自己對前端功能的開發(fā),
到按期提測,環(huán)境部署,上線這一整套流程。還有就是養(yǎng)成良好的開發(fā)習慣,寫
的代碼要具有較好的可維護性,寫完之后要去思考有沒有可以優(yōu)化的地方,不能
想著功能實現(xiàn)了就完事了,因為之后別人可能在你的代碼上改,盡量做到清晰易
讀。
那在接觸了一段時間業(yè)別弋碼之后,對開發(fā)流程也有了一定的認識。
第三階段我就開始負責獨立開發(fā)一個單獨的模塊,流量工具要聞后臺,這個
模塊我們是采用CMS建站工具開發(fā)的,跟之前不太一樣,所以也具有一些挑戰(zhàn)
性。
這個模塊我開發(fā)下來,主要就是經歷了以下這些過程吧,前期就是先理清楚
9
需求,看一下有沒有不合理的點,比如之前這個要聞位置是在篩選項下面展示成
兩個tab,但是發(fā)現(xiàn)tab里面的內容是一樣的,所以把它做成篩選性是一樣的效
果,前端實現(xiàn)起來也更容易一些,就去跟產品溝通,然后也溝通了一下其他不太
清楚的點,對清楚需求之后就開始制定開發(fā)方案,因為CMS里面有一些交互開
發(fā)樣例,可以直接使用,然后就開始搭建頁面,看哪些沒有覆蓋到,列出清單,
再想辦法解決,比如兩個典型一些的就是想在一列里面展示標簽和標題,使用多
個變量,在react里面就可以直接使用record獲取值,使用antd的組件寫個
tag和a標簽,那使用cms用json語句怎么寫呢,不能直接使用antd,寫js
語句也不方便,當時討論了很多種方法,但實現(xiàn)的效果都不是很理想,最后用
containermap找到了最佳方案,并把這些處理思路都總結了出來。然后就是
操作記錄需要展示時間軸,但是cms里面還沒有支持時間軸,就找了組內CMS
相關同學溝通了時間軸的需求,最后也得到了很好的實現(xiàn),還有權限控制之類的。
前端頁面開發(fā)完了之后,服務端那邊還沒有開發(fā)完,又因為這次是cms搭建,
對返回數(shù)據(jù)格式有一定的要求,所以我就又負責寫了api層的代碼,之前沒有開
發(fā)過api層的代碼,寫第一個接口的時候遇到了一些問題,向同事尋求了一些幫
助,整個流程就很清晰了,后面的接口就開發(fā)的很快了,api層代碼開發(fā)完服務
端同學也寫完了接著就是聯(lián)調,我們自己先進行了充分的測試,然后提測上線,
這里有點小插曲,就是我和服務端同學都是新人,我對api層部署還有CMS部
署這些也是剛接觸,所以提測上線這個流程不是特別順利,再T就是上線順序
的問題要溝通好,安排好時間節(jié)奏。
這里是具體的一些細節(jié),涉及到的交互就是,查詢,下架,修改時間,操作
記錄這些。修改時間的邏輯處理范圍限制以及輸入不合法的日期要提示用戶,下
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 肝纖維化患者營養(yǎng)支持方案優(yōu)化
- 公文辦理與公文處理課件
- 體育基本知識課件
- 公安課件教學課件
- 中藥飲片驗收培訓
- 公安機關政治建警課件
- 2026年禁毒知識培訓試卷及答案(共三套)
- 偽裝防護知識
- 公安人員培訓
- 職業(yè)性鉛中毒兒童遠期健康科普教育模式
- 2026年張家界航空工業(yè)職業(yè)技術學院高職單招職業(yè)適應性測試參考題庫含答案解析
- 氮氣安全技術說明書
- 繪本講師培訓課件
- 廣東生地會考試題及答案
- 2025年品質經理年度工作總結及2026年度工作計劃
- 2025中國胸痛中心診療指南
- 藥品抽檢應急預案(3篇)
- ADC藥物首次人體試驗劑量遞推
- 醫(yī)藥行業(yè)2026年度醫(yī)療器械策略報告耗材IVD篇:創(chuàng)新引領國際布局后集采時代醫(yī)療器械的價值重構
- 2024集中式光伏電站場區(qū)典型設計手冊
- 收購酒店合同怎么寫模板(3篇)
評論
0/150
提交評論