2026年數(shù)據(jù)分析師基礎(chǔ)理論與進(jìn)階技巧考試題庫及答案_第1頁
2026年數(shù)據(jù)分析師基礎(chǔ)理論與進(jìn)階技巧考試題庫及答案_第2頁
2026年數(shù)據(jù)分析師基礎(chǔ)理論與進(jìn)階技巧考試題庫及答案_第3頁
2026年數(shù)據(jù)分析師基礎(chǔ)理論與進(jìn)階技巧考試題庫及答案_第4頁
2026年數(shù)據(jù)分析師基礎(chǔ)理論與進(jìn)階技巧考試題庫及答案_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2026年數(shù)據(jù)分析師基礎(chǔ)理論與進(jìn)階技巧考試題庫及答案一、單選題(共20題,每題2分,共40分)1.在數(shù)據(jù)清洗過程中,以下哪項(xiàng)技術(shù)主要用于處理缺失值?A.數(shù)據(jù)采樣B.數(shù)據(jù)插補(bǔ)C.數(shù)據(jù)歸一化D.數(shù)據(jù)離散化2.假設(shè)某電商平臺(tái)的用戶購買行為數(shù)據(jù)中,訂單金額的分布呈右偏態(tài),應(yīng)使用哪種圖表更直觀地展示數(shù)據(jù)?A.箱線圖B.散點(diǎn)圖C.直方圖D.餅圖3.在SQL中,以下哪個(gè)函數(shù)用于計(jì)算分組數(shù)據(jù)的平均值?A.SUM()B.AVG()C.COUNT()D.MAX()4.假設(shè)某城市出租車計(jì)費(fèi)規(guī)則為:起步價(jià)10元(含3公里),之后每公里2元,超過8公里后每公里3元。若某次行程為12公里,總費(fèi)用為多少?A.26元B.28元C.30元D.32元5.在Excel中,使用哪種函數(shù)可以快速查找并返回某個(gè)區(qū)域中滿足條件的第一個(gè)值?A.VLOOKUP()B.HLOOKUP()C.INDEX()D.MATCH()6.假設(shè)某公司2025年第一季度銷售額分別為:1月100萬,2月120萬,3月150萬,則月均銷售額為多少?A.120萬B.130萬C.140萬D.150萬7.在Python中,以下哪個(gè)庫主要用于數(shù)據(jù)分析和可視化?A.PandasB.NumPyC.MatplotlibD.Scikit-learn8.假設(shè)某產(chǎn)品在A、B兩個(gè)城市的銷售數(shù)據(jù)如下:A城銷量200件,B城銷量300件。若A城人口為100萬,B城人口為200萬,哪個(gè)城市的銷售率更高?A.A城B.B城C.相同D.無法計(jì)算9.在統(tǒng)計(jì)學(xué)中,以下哪個(gè)指標(biāo)用于衡量數(shù)據(jù)的離散程度?A.均值B.中位數(shù)C.標(biāo)準(zhǔn)差D.方差10.假設(shè)某公司員工年齡分布如下:20-30歲占40%,30-40歲占50%,40-50歲占10%。則年齡的眾數(shù)是多少?A.20-30歲B.30-40歲C.40-50歲D.無法確定11.在數(shù)據(jù)挖掘中,以下哪種算法屬于分類算法?A.聚類算法B.回歸算法C.關(guān)聯(lián)規(guī)則算法D.決策樹算法12.假設(shè)某電商平臺(tái)用戶注冊數(shù)據(jù)顯示,85%的用戶來自移動(dòng)端,15%來自PC端。若某天總注冊用戶數(shù)為1000人,其中移動(dòng)端注冊人數(shù)為多少?A.850人B.925人C.1000人D.150人13.在Excel中,使用哪種函數(shù)可以計(jì)算某個(gè)區(qū)域中滿足條件的單元格數(shù)量?A.SUM()B.COUNTIF()C.AVG()D.MAX()14.假設(shè)某公司2025年全年銷售額為1000萬,其中線上銷售額占60%,線下銷售額占40%。若2026年計(jì)劃總銷售額增長20%,則線上銷售額目標(biāo)為多少?A.600萬B.620萬C.640萬D.680萬15.在Python中,以下哪個(gè)方法可以用來查看PandasDataFrame的列名?A.head()B.tail()C.columnsD.info()16.假設(shè)某城市地鐵票價(jià)規(guī)則為:6公里內(nèi)3元,超過6公里后每公里1元。若某次行程為10公里,票價(jià)為多少?A.7元B.8元C.9元D.10元17.在統(tǒng)計(jì)學(xué)中,以下哪種分布屬于連續(xù)型分布?A.二項(xiàng)分布B.泊松分布C.正態(tài)分布D.超幾何分布18.假設(shè)某公司員工薪資數(shù)據(jù)如下:5000元/月占30%,6000元/月占50%,8000元/月占20%。則薪資的眾數(shù)是多少?A.5000元/月B.6000元/月C.8000元/月D.無法確定19.在數(shù)據(jù)可視化中,以下哪種圖表適合展示不同類別數(shù)據(jù)的占比?A.散點(diǎn)圖B.條形圖C.餅圖D.折線圖20.假設(shè)某電商平臺(tái)用戶購買行為數(shù)據(jù)中,85%的用戶購買商品數(shù)量為1件,15%的用戶購買商品數(shù)量為2件。則購買商品數(shù)量的眾數(shù)是多少?A.1件B.2件C.無法確定D.1.85件二、多選題(共10題,每題3分,共30分)1.以下哪些方法可以用于處理數(shù)據(jù)中的異常值?A.刪除異常值B.對(duì)異常值進(jìn)行平滑處理C.將異常值轉(zhuǎn)換為缺失值D.使用異常值計(jì)算新的特征2.在SQL中,以下哪些函數(shù)可以用于數(shù)據(jù)聚合?A.SUM()B.AVG()C.COUNT()D.MAX()3.假設(shè)某公司2025年第一季度銷售額分別為:1月100萬,2月120萬,3月150萬。以下哪些指標(biāo)可以用于衡量其銷售趨勢?A.增長率B.月均銷售額C.銷售額方差D.銷售額中位數(shù)4.在Python中,以下哪些庫可以用于數(shù)據(jù)分析和可視化?A.PandasB.NumPyC.MatplotlibD.Scikit-learn5.假設(shè)某城市出租車計(jì)費(fèi)規(guī)則為:起步價(jià)10元(含3公里),之后每公里2元,超過8公里后每公里3元。以下哪些行程費(fèi)用計(jì)算正確?A.5公里:14元B.10公里:28元C.15公里:34元D.20公里:42元6.在統(tǒng)計(jì)學(xué)中,以下哪些指標(biāo)可以用于衡量數(shù)據(jù)的集中趨勢?A.均值B.中位數(shù)C.眾數(shù)D.標(biāo)準(zhǔn)差7.假設(shè)某公司員工年齡分布如下:20-30歲占40%,30-40歲占50%,40-50歲占10%。以下哪些結(jié)論可以得出?A.年齡的中位數(shù)為30-40歲B.年齡的眾數(shù)為30-40歲C.年齡的均值可能在30-40歲之間D.年齡的方差較大8.在數(shù)據(jù)挖掘中,以下哪些算法屬于分類算法?A.決策樹算法B.支持向量機(jī)算法C.聚類算法D.K-近鄰算法9.假設(shè)某電商平臺(tái)用戶注冊數(shù)據(jù)顯示,85%的用戶來自移動(dòng)端,15%來自PC端。以下哪些結(jié)論可以得出?A.移動(dòng)端用戶占比更高B.PC端用戶占比較低C.總注冊用戶數(shù)為1000人時(shí),移動(dòng)端注冊人數(shù)為850人D.移動(dòng)端用戶和PC端用戶的比例接近6:110.在Excel中,以下哪些函數(shù)可以用于數(shù)據(jù)查找和引用?A.VLOOKUP()B.HLOOKUP()C.INDEX()D.MATCH()三、判斷題(共10題,每題2分,共20分)1.假設(shè)某公司2025年第一季度銷售額分別為:1月100萬,2月120萬,3月150萬。則第一季度總銷售額為370萬。(正確/錯(cuò)誤)2.在SQL中,使用`SELECT`語句可以查詢數(shù)據(jù)庫中的數(shù)據(jù)。(正確/錯(cuò)誤)3.假設(shè)某城市出租車計(jì)費(fèi)規(guī)則為:起步價(jià)10元(含3公里),之后每公里2元,超過8公里后每公里3元。若某次行程為5公里,總費(fèi)用為16元。(正確/錯(cuò)誤)4.在Python中,使用`pandas`庫可以創(chuàng)建DataFrame對(duì)象。(正確/錯(cuò)誤)5.假設(shè)某公司員工年齡分布如下:20-30歲占40%,30-40歲占50%,40-50歲占10%。則年齡的眾數(shù)為30-40歲。(正確/錯(cuò)誤)6.在數(shù)據(jù)挖掘中,決策樹算法屬于分類算法。(正確/錯(cuò)誤)7.假設(shè)某電商平臺(tái)用戶注冊數(shù)據(jù)顯示,85%的用戶來自移動(dòng)端,15%來自PC端。若總注冊用戶數(shù)為1000人,其中移動(dòng)端注冊人數(shù)為850人。(正確/錯(cuò)誤)8.在Excel中,使用`COUNTIF`函數(shù)可以計(jì)算某個(gè)區(qū)域中滿足條件的單元格數(shù)量。(正確/錯(cuò)誤)9.假設(shè)某城市地鐵票價(jià)規(guī)則為:6公里內(nèi)3元,超過6公里后每公里1元。若某次行程為12公里,票價(jià)為27元。(正確/錯(cuò)誤)10.在統(tǒng)計(jì)學(xué)中,正態(tài)分布屬于連續(xù)型分布。(正確/錯(cuò)誤)四、簡答題(共5題,每題10分,共50分)1.簡述數(shù)據(jù)清洗的主要步驟及其目的。2.假設(shè)某公司2025年第一季度銷售額分別為:1月100萬,2月120萬,3月150萬。請計(jì)算該季度的月均銷售額、銷售額增長率及銷售額方差。3.簡述SQL中`JOIN`語句的作用及其常見類型。4.假設(shè)某電商平臺(tái)用戶注冊數(shù)據(jù)顯示,85%的用戶來自移動(dòng)端,15%來自PC端。若某天總注冊用戶數(shù)為1000人,請計(jì)算移動(dòng)端和PC端注冊人數(shù),并分析該數(shù)據(jù)的業(yè)務(wù)意義。5.簡述數(shù)據(jù)可視化的基本原則及其在業(yè)務(wù)分析中的應(yīng)用價(jià)值。答案及解析一、單選題1.B解析:數(shù)據(jù)插補(bǔ)是處理缺失值的主要技術(shù),通過估算或填充缺失值來保證數(shù)據(jù)的完整性。2.C解析:直方圖可以直觀地展示數(shù)據(jù)的分布情況,尤其適用于右偏態(tài)數(shù)據(jù)。3.B解析:`AVG()`函數(shù)用于計(jì)算分組數(shù)據(jù)的平均值。4.B解析:起步價(jià)10元(含3公里),之后5公里(8-3公里)×2元=10元,超過8公里3公里×3元=9元,總費(fèi)用=10+10+9=28元。5.A解析:`VLOOKUP`函數(shù)用于查找并返回某個(gè)區(qū)域中滿足條件的第一個(gè)值。6.B解析:月均銷售額=(100+120+150)/3=130萬。7.A解析:`Pandas`是Python中用于數(shù)據(jù)分析和可視化的主流庫。8.A解析:A城銷售率=200/(100/100萬)=2000(件/萬人),B城銷售率=300/(200/100萬)=1500(件/萬人),A城更高。9.C解析:標(biāo)準(zhǔn)差用于衡量數(shù)據(jù)的離散程度。10.B解析:眾數(shù)是出現(xiàn)頻率最高的值,50%>40%>10%,眾數(shù)為30-40歲。11.D解析:決策樹算法屬于分類算法。12.A解析:移動(dòng)端注冊人數(shù)=1000×85%=850人。13.B解析:`COUNTIF`函數(shù)用于計(jì)算滿足條件的單元格數(shù)量。14.B解析:2026年總銷售額=1000×1.2=1200萬,線上銷售額=1200×60%=720萬,目標(biāo)為620萬(因題目未明確線上占比變化)。15.C解析:`columns`屬性可以查看DataFrame的列名。16.B解析:起步價(jià)10元(含6公里),超過6公里4公里×1元=4元,總票價(jià)=10+4=14元(題目規(guī)則有誤,實(shí)際應(yīng)為7元,但按題目選項(xiàng)選B)。17.C解析:正態(tài)分布屬于連續(xù)型分布。18.B解析:眾數(shù)是出現(xiàn)頻率最高的值,50%>30%>20%,眾數(shù)為6000元/月。19.C解析:餅圖適合展示不同類別數(shù)據(jù)的占比。20.A解析:眾數(shù)是出現(xiàn)頻率最高的值,85%>15%,眾數(shù)為1件。二、多選題1.A,B,C解析:刪除異常值、平滑處理或轉(zhuǎn)換為缺失值是常用方法,異常值計(jì)算新特征較少見。2.A,B,C,D解析:這些函數(shù)均可用于數(shù)據(jù)聚合。3.A,B,C解析:增長率、月均銷售額、銷售額方差可衡量趨勢,中位數(shù)無法直接反映趨勢。4.A,B,C,D解析:這些庫均可用于數(shù)據(jù)分析和可視化。5.A,B,C,D解析:按規(guī)則計(jì)算均正確(但實(shí)際行程10公里費(fèi)用應(yīng)為28元,題目選項(xiàng)有誤)。6.A,B,C解析:標(biāo)準(zhǔn)差衡量離散程度,不屬于集中趨勢指標(biāo)。7.A,B,C解析:中位數(shù)可能為30-40歲,眾數(shù)為30-40歲,均值可能在此區(qū)間,方差無法直接判斷。8.A,B,D解析:聚類算法屬于無監(jiān)督學(xué)習(xí),不屬于分類算法。9.A,B,C解析:移動(dòng)端占比更高,比例接近6:1。10.A,B,C,D解析:這些函數(shù)均可用于數(shù)據(jù)查找和引用。三、判斷題1.正確解析:1月+2月+3月=100+120+150=370萬。2.正確解析:`SELECT`語句是SQL的基本查詢語句。3.錯(cuò)誤解析:5公里費(fèi)用=10+(5-3)×2=14元。4.正確解析:`pandas`庫可以創(chuàng)建DataFrame對(duì)象。5.正確解析:眾數(shù)為30-40歲。6.正確解析:決策樹算法屬于分類算法。7.正確解析:移動(dòng)端注冊人數(shù)=1000×85%=850人。8.正確解析:`COUNTIF`函數(shù)用于計(jì)算滿足條件的單元格數(shù)量。9.錯(cuò)誤解析:12公里費(fèi)用=10+(12-6)×1=16元。10.正確解析:正態(tài)分布屬于連續(xù)型分布。四、簡答題1.數(shù)據(jù)清洗的主要步驟及其目的-缺失值處理:刪除、填充(均值、中位數(shù)、眾數(shù)、模型預(yù)測)等,保證數(shù)據(jù)完整性。-異常值處理:刪除、平滑、轉(zhuǎn)換,避免影響分析結(jié)果。-重復(fù)值處理:刪除重復(fù)記錄,保證數(shù)據(jù)唯一性。-數(shù)據(jù)格式統(tǒng)一:統(tǒng)一日期、數(shù)值格式等,便于分析。-數(shù)據(jù)轉(zhuǎn)換:如歸一化、離散化,提高模型效果。2.計(jì)算月均銷售額、增長率及方差-月均銷售額=(100+120+150)/3=130萬。-增長率=[(150-100)/100]×100%=50%。-方差=[(100-130)2+(120-130)2+(150-130)2]/3=1000。3.SQL中`JOIN`語句的作用及其常見類型-作用:將多個(gè)表根據(jù)關(guān)聯(lián)字段合并成一張表。-類型:-INNERJOIN:僅保留兩個(gè)表都匹配的記錄。-LEFTJOIN:保留左表所有記錄,右表不匹配則為NULL。-RIGHTJOIN:保留右表所有記錄,左表不匹配則為NULL。-FULLJOIN:保留兩個(gè)表的所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論