大數(shù)據(jù)分析師(互聯(lián)網(wǎng)行業(yè))崗位招聘考試試卷及答案_第1頁(yè)
大數(shù)據(jù)分析師(互聯(lián)網(wǎng)行業(yè))崗位招聘考試試卷及答案_第2頁(yè)
大數(shù)據(jù)分析師(互聯(lián)網(wǎng)行業(yè))崗位招聘考試試卷及答案_第3頁(yè)
大數(shù)據(jù)分析師(互聯(lián)網(wǎng)行業(yè))崗位招聘考試試卷及答案_第4頁(yè)
大數(shù)據(jù)分析師(互聯(lián)網(wǎng)行業(yè))崗位招聘考試試卷及答案_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)分析師(互聯(lián)網(wǎng)行業(yè))崗位招聘考試試卷及答案填空題(10題,每題1分)1.Hadoop分布式文件系統(tǒng)的英文縮寫(xiě)是______。2.SQL中用于計(jì)算分組內(nèi)排名的窗口函數(shù)是______(寫(xiě)出一個(gè)即可)。3.互聯(lián)網(wǎng)行業(yè)中,每日活躍用戶(hù)的英文縮寫(xiě)是______。4.Spark的核心不可變分布式數(shù)據(jù)集抽象是______。5.ETL過(guò)程中,從源系統(tǒng)抽取數(shù)據(jù)的環(huán)節(jié)是______。6.描述用戶(hù)屬性、行為的標(biāo)簽集合稱(chēng)為_(kāi)_____。7.A/B測(cè)試中用戶(hù)分配的核心原則是______。8.Python中常用的數(shù)據(jù)可視化庫(kù)是______(寫(xiě)出一個(gè)即可)。9.機(jī)器學(xué)習(xí)分類(lèi)任務(wù)的經(jīng)典算法是______(寫(xiě)出一個(gè)即可)。10.數(shù)據(jù)倉(cāng)庫(kù)的核心特性之一是______(面向主題/集成/非易失/時(shí)變)。答案:1.HDFS;2.RANK();3.DAU;4.RDD;5.抽??;6.用戶(hù)畫(huà)像;7.隨機(jī)化;8.Matplotlib;9.邏輯回歸;10.面向主題單項(xiàng)選擇題(10題,每題2分)1.HDFS默認(rèn)文件塊大小是()A.64MBB.128MBC.256MBD.512MB答案:B2.Spark資源調(diào)度組件是()A.DriverB.ExecutorC.ClusterManagerD.Worker答案:C3.SQL計(jì)算總和的函數(shù)是()A.COUNT()B.SUM()C.AVG()D.MAX()答案:B4.互聯(lián)網(wǎng)轉(zhuǎn)化率公式中,分母是()A.訪(fǎng)問(wèn)用戶(hù)數(shù)B.下單用戶(hù)數(shù)C.支付用戶(hù)數(shù)D.注冊(cè)用戶(hù)數(shù)答案:A5.數(shù)據(jù)倉(cāng)庫(kù)最底層是()A.ODSB.DWDC.DWSD.ADS答案:A6.A/B測(cè)試樣本量不足會(huì)導(dǎo)致()A.統(tǒng)計(jì)顯著性降低B.結(jié)果更準(zhǔn)確C.周期縮短D.無(wú)影響答案:A7.用戶(hù)生命周期價(jià)值(LTV)指()A.單次消費(fèi)B.終身總價(jià)值C.注冊(cè)時(shí)長(zhǎng)D.復(fù)購(gòu)次數(shù)答案:B8.處理缺失值屬于數(shù)據(jù)清洗的()A.抽取B.轉(zhuǎn)換C.預(yù)處理D.加載答案:C9.MapReduce不包含的階段是()A.MapB.ShuffleC.ReduceD.SparkSQL答案:D10.實(shí)時(shí)流處理框架是()A.FlinkB.HiveC.HBaseD.MySQL答案:A多項(xiàng)選擇題(10題,每題2分)1.Hadoop生態(tài)組件包括()A.HDFSB.MapReduceC.SparkD.YARN答案:ABD2.SQL窗口函數(shù)有()A.RANK()B.SUM()OVER()C.GROUPBYD.PARTITIONBY答案:AB3.互聯(lián)網(wǎng)核心指標(biāo)包括()A.DAUB.MAUC.GMVD.CTR答案:ABCD4.數(shù)據(jù)倉(cāng)庫(kù)分層有()A.ODSB.DWDC.DWSD.ADS答案:ABCD5.實(shí)時(shí)計(jì)算框架有()A.FlinkB.StormC.SparkStreamingD.Hive答案:ABC6.用戶(hù)畫(huà)像標(biāo)簽類(lèi)型包括()A.靜態(tài)標(biāo)簽B.行為標(biāo)簽C.偏好標(biāo)簽D.實(shí)時(shí)標(biāo)簽答案:ABCD7.A/B測(cè)試注意事項(xiàng)()A.隨機(jī)分配B.單一變量C.樣本足夠D.避免偏差答案:ABCD8.數(shù)據(jù)可視化工具()A.TableauB.PowerBIC.MatplotlibD.Excel答案:ABCD9.機(jī)器學(xué)習(xí)分類(lèi)算法()A.邏輯回歸B.決策樹(shù)C.隨機(jī)森林D.K-Means答案:ABC10.ETL工具包括()A.SqoopB.DataXC.FlumeD.SparkSQL答案:ABC判斷題(10題,每題2分)1.HDFS默認(rèn)副本數(shù)是3。()答案:對(duì)2.SparkRDD是可變的。()答案:錯(cuò)3.GROUPBY后只能用分組字段+聚合函數(shù)。()答案:對(duì)4.GMV等于實(shí)際收入。()答案:錯(cuò)5.A/B測(cè)試需隨機(jī)分配用戶(hù)。()答案:對(duì)6.數(shù)據(jù)倉(cāng)庫(kù)面向主題、集成。()答案:對(duì)7.用戶(hù)畫(huà)像標(biāo)簽靜態(tài)不變。()答案:錯(cuò)8.實(shí)時(shí)計(jì)算核心是低延遲。()答案:對(duì)9.MapReduce適合實(shí)時(shí)處理。()答案:錯(cuò)10.LTV越高用戶(hù)價(jià)值越大。()答案:對(duì)簡(jiǎn)答題(4題,每題5分)1.簡(jiǎn)述Hadoop核心組件及作用答案:Hadoop核心組件含HDFS、MapReduce、YARN。HDFS是分布式文件系統(tǒng),分塊存儲(chǔ)海量數(shù)據(jù),副本機(jī)制保障可靠性;MapReduce是批處理框架,拆分任務(wù)為Map(映射)和Reduce(歸約),實(shí)現(xiàn)并行計(jì)算;YARN是資源調(diào)度器,統(tǒng)一管理集群CPU、內(nèi)存,為應(yīng)用分配資源。三者協(xié)同支撐海量數(shù)據(jù)存儲(chǔ)與計(jì)算。2.DAU與MAU的區(qū)別及業(yè)務(wù)意義答案:DAU是單日活躍用戶(hù),MAU是月內(nèi)活躍用戶(hù)。區(qū)別:DAU反映短期活躍度,MAU反映長(zhǎng)期規(guī)模。意義:DAU觀(guān)察日級(jí)運(yùn)營(yíng)效果(如活動(dòng)引流),MAU評(píng)估市場(chǎng)滲透;DAU/MAU比值(活躍度)衡量用戶(hù)粘性,比值越高粘性越強(qiáng)。3.數(shù)據(jù)倉(cāng)庫(kù)分層的目的及結(jié)構(gòu)答案:目的:解耦數(shù)據(jù)與業(yè)務(wù),提升復(fù)用性;減少冗余,降低維護(hù)成本;隔離原始與分析數(shù)據(jù),保障安全。結(jié)構(gòu):①ODS(原始層):存儲(chǔ)源系統(tǒng)數(shù)據(jù);②DWD(明細(xì)層):清洗整合后的明細(xì);③DWS(匯總層):主題匯總寬表;④ADS(應(yīng)用層):面向業(yè)務(wù)的結(jié)果數(shù)據(jù)(報(bào)表、看板)。4.A/B測(cè)試基本流程答案:①明確目標(biāo):確定測(cè)試指標(biāo)(如轉(zhuǎn)化率);②設(shè)計(jì)方案:生成實(shí)驗(yàn)組(新策略)和對(duì)照組(原策略);③隨機(jī)分配:用戶(hù)分組保證同質(zhì)性;④執(zhí)行實(shí)驗(yàn):收集行為數(shù)據(jù);⑤統(tǒng)計(jì)分析:驗(yàn)證指標(biāo)差異的顯著性;⑥決策落地:效果顯著則全量上線(xiàn),否則迭代。討論題(2題,每題5分)1.如何通過(guò)用戶(hù)數(shù)據(jù)提升產(chǎn)品留存率?答案:①用戶(hù)分層:按行為(登錄頻率、時(shí)長(zhǎng))分為新用戶(hù)、活躍用戶(hù)、流失風(fēng)險(xiǎn)用戶(hù),針對(duì)性運(yùn)營(yíng)(新用戶(hù)引導(dǎo)、活躍用戶(hù)激勵(lì));②個(gè)性化運(yùn)營(yíng):基于用戶(hù)畫(huà)像(偏好、行為標(biāo)簽)推送定制內(nèi)容(如電商推薦、資訊個(gè)性化);③流失預(yù)警:分析流失特征(近期未活躍),提前觸達(dá)(短信提醒、專(zhuān)屬福利)挽回高價(jià)值用戶(hù);④A/B測(cè)試驗(yàn)證策略效果,持續(xù)優(yōu)化。2.大數(shù)據(jù)分析在電商推薦系統(tǒng)中的價(jià)值答案:①精

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論