版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2026年IT行業(yè)軟件開發(fā)數(shù)據(jù)分析師面試題集一、編程基礎(chǔ)與算法題(共5題,每題10分,總分50分)題目1(10分)請用Python實現(xiàn)一個函數(shù),該函數(shù)接收一個字符串作為輸入,返回一個字典,字典的鍵為字符串中出現(xiàn)的所有字符,值為該字符出現(xiàn)的次數(shù)。要求不區(qū)分大小寫,空格不統(tǒng)計。示例輸入:`"HelloWorld!"`示例輸出:`{'h':1,'e':1,'l':3,'o':2,'w':1,'r':1,'d':1}`題目2(10分)給定一個整數(shù)數(shù)組,請實現(xiàn)一個函數(shù),找出數(shù)組中第三大的數(shù)。如果數(shù)組中沒有第三大的數(shù),返回最大的數(shù)。假設(shè)數(shù)組至少有兩個不同的數(shù)。示例輸入:`[1,2,2,5,3,5]`示例輸出:`2`題目3(10分)請用Java實現(xiàn)快速排序算法。要求不使用遞歸,使用迭代的方式實現(xiàn)。題目4(10分)請設(shè)計一個數(shù)據(jù)結(jié)構(gòu),支持以下操作:1.`add(val)`:添加一個數(shù)值2.`findTarget(target)`:如果數(shù)組中存在兩個數(shù)相加等于target,返回true,否則返回false要求所有操作的平均時間復(fù)雜度為O(1)。題目5(10分)請用C++實現(xiàn)一個單鏈表,包含以下功能:1.添加節(jié)點到鏈表尾部2.刪除鏈表中的所有重復(fù)元素,使每個元素只出現(xiàn)一次3.返回鏈表的中間節(jié)點二、數(shù)據(jù)庫與SQL題(共4題,每題12分,總分48分)題目6(12分)假設(shè)有一個電商訂單表`orders`,包含字段:`order_id`(訂單ID),`user_id`(用戶ID),`order_date`(訂單日期),`total_amount`(訂單總金額)。請寫SQL查詢語句:1.查詢2025年每個用戶的總消費(fèi)金額,按消費(fèi)金額降序排列2.查詢每個用戶最近一個月的訂單數(shù)量題目7(12分)有一個商品表`products`,包含字段:`product_id`(商品ID),`category`(商品類別),`price`(價格),`stock`(庫存)。請寫SQL查詢:1.查詢每個類別的平均價格和最高庫存2.查詢價格高于平均價格的所有商品信息題目8(12分)假設(shè)有一個用戶表`users`和訂單表`orders`,關(guān)系為:一個用戶可以有多個訂單。請寫SQL查詢:1.查找訂單數(shù)量少于3個的用戶ID2.查詢訂單總金額最多的用戶ID及其金額題目9(12分)請寫一個SQL查詢,找出所有訂單金額超過同類別平均金額的商品,要求結(jié)果包含商品ID、類別和訂單金額。三、數(shù)據(jù)結(jié)構(gòu)與系統(tǒng)設(shè)計題(共3題,每題16分,總分48分)題目10(16分)設(shè)計一個簡單的內(nèi)存緩存系統(tǒng),要求:1.支持添加鍵值對2.當(dāng)緩存滿時,使用LRU(最近最少使用)策略刪除最久未使用的項3.實現(xiàn)get和put操作的時間復(fù)雜度為O(1)請描述數(shù)據(jù)結(jié)構(gòu)和算法思路。題目11(16分)設(shè)計一個微博系統(tǒng)的用戶關(guān)注功能:1.支持用戶A關(guān)注用戶B2.支持用戶A取消關(guān)注用戶B3.支持查詢用戶A的所有粉絲4.支持查詢用戶A關(guān)注的所有用戶請說明數(shù)據(jù)結(jié)構(gòu)選擇和主要算法。題目12(16分)設(shè)計一個短鏈接生成服務(wù):1.用戶訪問`/XXXX`時,應(yīng)重定向到指定的長鏈接2.支持自定義短鏈接前綴(可選)3.系統(tǒng)應(yīng)能處理高并發(fā)請求請說明系統(tǒng)架構(gòu)和主要技術(shù)選型。四、數(shù)據(jù)分析與業(yè)務(wù)題(共4題,每題12分,總分48分)題目13(12分)某電商平臺A和B在2025年同期用戶增長數(shù)據(jù)如下:-電商平臺A:1月用戶數(shù)100萬,每月增長20%-電商平臺B:1月用戶數(shù)50萬,每月增長30%請計算兩家平臺在2025年底的用戶總數(shù),哪家平臺最終用戶更多?題目14(12分)某APP有5萬日活躍用戶,留存率如下:-第1天留存率:40%-第2天留存率:30%-第3天留存率:20%-后續(xù)每天留存率:10%請計算7天留存率和30天留存率。題目15(12分)某電商網(wǎng)站A和B的轉(zhuǎn)化率數(shù)據(jù):-電商平臺A:訪問量100萬,轉(zhuǎn)化量5%-電商平臺B:訪問量80萬,轉(zhuǎn)化量6%請計算兩家平臺的轉(zhuǎn)化率差異,并說明可能的影響因素。題目16(12分)假設(shè)你是一家電商公司的數(shù)據(jù)分析師,領(lǐng)導(dǎo)要求你分析用戶購買行為,并提出至少3個有價值的業(yè)務(wù)建議。請描述你的分析思路和具體建議。五、系統(tǒng)運(yùn)維與監(jiān)控題(共2題,每題12分,總分24分)題目17(12分)設(shè)計一個監(jiān)控系統(tǒng),監(jiān)控一個電商網(wǎng)站的主要性能指標(biāo),請說明:1.需要監(jiān)控的關(guān)鍵指標(biāo)有哪些2.如何實現(xiàn)這些指標(biāo)的實時監(jiān)控3.當(dāng)指標(biāo)異常時如何告警題目18(12分)假設(shè)你的電商網(wǎng)站數(shù)據(jù)庫突然響應(yīng)變慢,作為數(shù)據(jù)分析師,你會如何排查問題?請列出排查步驟和方法。答案與解析編程基礎(chǔ)與算法題答案題目1答案(Python)pythondefcount_chars(s):count={}forcharins.lower():ifchar!='':count[char]=count.get(char,0)+1returncount測試print(count_chars("HelloWorld!"))解析:通過遍歷字符串,將每個字符轉(zhuǎn)為小寫,忽略空格,并使用字典記錄字符出現(xiàn)次數(shù)。時間復(fù)雜度O(n)。題目2答案(Python)pythondefthird_largest(nums):first,second,third=float('-inf'),float('-inf'),float('-inf')fornuminnums:ifnum>first:third,second,first=second,first,numeliffirst>num>second:third,second=second,numelifsecond>num>third:third=numreturnfirstifthird==float('-inf')elsethird測試print(third_largest([1,2,2,5,3,5]))解析:維護(hù)三個變量記錄最大、第二大、第三大的數(shù)。遍歷數(shù)組時更新這三個變量。時間復(fù)雜度O(n)。題目3答案(Java)javaclassQuickSortIterative{publicvoidquickSort(int[]arr){if(arr==null||arr.length<=1)return;int[]stack=newint[arr.length];inttop=-1;stack[++top]=0;stack[++top]=arr.length-1;while(top>=0){intend=stack[top--];intstart=stack[top--];intpivot=arr[end];inti=start-1;for(intj=start;j<end;j++){if(arr[j]<=pivot){i++;swap(arr,i,j);}}swap(arr,i+1,end);intp=i+1;if(p-1>start){stack[++top]=start;stack[++top]=p-1;}if(p+1<end){stack[++top]=p+1;stack[++top]=end;}}}privatevoidswap(int[]arr,inti,intj){inttemp=arr[i];arr[i]=arr[j];arr[j]=temp;}}解析:使用棧模擬遞歸調(diào)用棧,實現(xiàn)快速排序的非遞歸版本。時間復(fù)雜度O(nlogn)。題目4答案(Java)javaclassTwoSum{privateMap<Integer,Integer>map;publicTwoSum(){map=newHashMap<>();}publicvoidadd(intval){map.put(val,map.getOrDefault(val,0)+1);}publicbooleanfindTarget(inttarget){for(intnum:map.keySet()){intcomplement=target-num;if(map.containsKey(complement)&&(complement!=num||map.get(num)>1)){returntrue;}}returnfalse;}}解析:使用哈希表記錄每個數(shù)的出現(xiàn)次數(shù)。對于每個數(shù),檢查其補(bǔ)數(shù)是否在哈希表中。時間復(fù)雜度O(1)。題目5答案(C++)cppinclude<iostream>usingnamespacestd;structListNode{intval;ListNodenext;ListNode(intx):val(x),next(NULL){}};classSolution{public:ListNodemiddleNode(ListNodehead){ListNodeslow=head;ListNodefast=head;while(fast&&fast->next){slow=slow->next;fast=fast->next->next;}returnslow;}ListNodedeleteDuplicates(ListNodehead){if(!head)returnNULL;ListNodedummy=newListNode(0);dummy->next=head;ListNodecur=dummy;while(cur->next&&cur->next->next){if(cur->next->val==cur->next->next->val){intval=cur->next->val;while(cur->next&&cur->next->val==val){ListNodetemp=cur->next;cur->next=cur->next->next;deletetemp;}}else{cur=cur->next;}}ListNodemid=middleNode(head);returndummy->next;}};解析:使用快慢指針找到中間節(jié)點,使用dummy節(jié)點處理重復(fù)元素。時間復(fù)雜度O(n)。數(shù)據(jù)庫與SQL題答案題目6答案sql--1.查詢2025年每個用戶的總消費(fèi)金額SELECTuser_id,SUM(total_amount)AStotal_spentFROMordersWHEREYEAR(order_date)=2025GROUPBYuser_idORDERBYtotal_spentDESC;--2.查詢每個用戶最近一個月的訂單數(shù)量SELECTuser_id,COUNT()ASorders_last_monthFROMordersWHEREorder_date>=DATE_SUB(CURDATE(),INTERVAL1MONTH)GROUPBYuser_id;題目7答案sql--1.查詢每個類別的平均價格和最高庫存SELECTcategory,AVG(price)ASavg_price,MAX(stock)ASmax_stockFROMproductsGROUPBYcategory;--2.查詢價格高于平均價格的所有商品信息SELECTFROMproductspWHEREp.price>(SELECTAVG(price)FROMproducts);題目8答案sql--1.查找訂單數(shù)量少于3個的用戶IDSELECTuser_idFROMordersGROUPBYuser_idHAVINGCOUNT()<3;--2.查詢訂單總金額最多的用戶ID及其金額SELECTuser_id,SUM(total_amount)AStotal_amountFROMordersGROUPBYuser_idORDERBYtotal_amountDESCLIMIT1;題目9答案sqlSELECTduct_id,p.category,o.total_amountFROMproductspJOIN(SELECTorder_id,SUM(total_amount)AStotal_amountFROMordersGROUPBYorder_id)oONduct_idIN(SELECTproduct_idFROMordersWHEREorder_id=o.order_id)WHEREo.total_amount>(SELECTAVG(total_amount)FROMordersWHEREproduct_id=duct_id)GROUPBYduct_id,p.category,o.total_amount;數(shù)據(jù)結(jié)構(gòu)與系統(tǒng)設(shè)計題答案題目10答案數(shù)據(jù)結(jié)構(gòu):使用雙向鏈表+哈希表實現(xiàn)LRU緩存-哈希表:key->Node(key,value)-雙向鏈表:頭部是最近使用,尾部是最久未使用算法:-get(key):在哈希表中查找,如果找到則移動到鏈表頭部,返回value;否則返回-1-put(key,value):如果key存在,更新value并移動到頭部;否則:-如果緩存已滿,刪除鏈表尾部節(jié)點(哈希表中也刪除)-新建節(jié)點,添加到鏈表頭部,哈希表中添加key題目11答案數(shù)據(jù)結(jié)構(gòu):-用戶表:user_id,followers_count,following_count-關(guān)注關(guān)系表:follower_id,followee_id算法:-關(guān)注:向關(guān)注關(guān)系表中插入一條(follower_id,followee_id)記錄-取消關(guān)注:向關(guān)注關(guān)系表中刪除一條(follower_id,followee_id)記錄-查詢粉絲:掃描關(guān)注關(guān)系表,查找所有followee_id等于當(dāng)前用戶ID的記錄-查詢關(guān)注:掃描關(guān)注關(guān)系表,查找所有follower_id等于當(dāng)前用戶ID的記錄題目12答案系統(tǒng)架構(gòu):1.前端:接收用戶請求,生成短鏈接2.后端:處理請求,生成唯一ID,存儲映射關(guān)系3.緩存:存儲熱點短鏈接映射,加速查詢4.數(shù)據(jù)庫:持久化存儲所有映射關(guān)系技術(shù)選型:-短鏈接生成:Base62編碼(a-z,A-Z,0-9)-高并發(fā)處理:使用消息隊列處理請求,負(fù)載均衡-緩存:Redis或Memcached-數(shù)據(jù)庫:MySQL或PostgreSQL數(shù)據(jù)分析與業(yè)務(wù)題答案題目13答案電商平臺A:1月:100萬2月:100萬×1.2=120萬3月:120萬×1.2=144萬...12月:100萬×1.2^11≈8.95億電商平臺B:1月:50萬2月:50萬×1.3=65萬3月:65萬×1.3=84.5萬...12月:50萬×1.3^11≈4.42億結(jié)論:電商平臺A最終用戶更多(8.95億vs4.42億)。題目14答案7天留存率=40%×30%×20%×10%=2.4%30天留存率=40%×30%×20%×10%×10%=0.24%更準(zhǔn)確計算:7天留存率=40%×30%×20%×10%=2.4%30天留存率=40%×30%×20%×10%×10%=0.24%修正:實際應(yīng)為7天留存率=40%×30%×20%=2.4%30天留存率=40%×30%×20%×10%=0.24%題目15答案電商平臺A:轉(zhuǎn)化率=5/100萬=0.005=0.5%電商平臺B:轉(zhuǎn)化率=6/80萬=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 汽車鑄造生產(chǎn)線操作工誠信考核試卷含答案
- 氣體分離工班組安全競賽考核試卷含答案
- 剪紙工安全生產(chǎn)知識測試考核試卷含答案
- 危險貨物運(yùn)輸作業(yè)員安全意識強(qiáng)化測試考核試卷含答案
- 口腔修復(fù)體制作師安全防護(hù)測試考核試卷含答案
- 2025年WS-1紙張濕強(qiáng)劑合作協(xié)議書
- 2024-2030年中國中水回用行業(yè)前景展望及發(fā)展規(guī)劃研究
- 2026年物聯(lián)網(wǎng)端側(cè)智能芯片項目建議書
- 2025年山東省東營市中考化學(xué)真題卷含答案解析
- 2025年臨床醫(yī)學(xué)之兒科學(xué)小兒口腔疾病題庫及答案
- GB/T 4074.1-2024繞組線試驗方法第1部分:一般規(guī)定
- 不確定度評定(壓力表-)
- 復(fù)方蒲公英注射液抗腫瘤作用研究
- 物資、百貨、五金采購 投標(biāo)方案(技術(shù)方案)
- 菌種鑒定報告文檔
- 成都市水功能區(qū)名錄表
- Jira工具操作手冊
- DL/T 5097-2014 火力發(fā)電廠貯灰場巖土工程勘測技術(shù)規(guī)程
- 能源費(fèi)用托管型合同能源管理項目
- 山西焦煤集團(tuán)正仁煤業(yè)有限公司礦產(chǎn)資源開發(fā)利用、地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案
- 新生兒疾病診療規(guī)范診療指南診療常規(guī)2022版
評論
0/150
提交評論