版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2026年P(guān)ython數(shù)據(jù)分析師面試題及代碼實(shí)例含答案一、選擇題(每題2分,共10題)說明:以下題目主要考察Python基礎(chǔ)、數(shù)據(jù)分析常用庫及數(shù)據(jù)處理能力。1.以下哪個庫最適合用于數(shù)據(jù)清洗和預(yù)處理?A.MatplotlibB.PandasC.NumPyD.Scikit-learn2.在Pandas中,如何快速篩選出DataFrame中某列值大于10的所有行?A.`df[df['column']>10]`B.`df.query('column>10')`C.`df.filter(lambdax:x['column']>10)`D.以上都正確3.以下哪個函數(shù)可以用來計算NumPy數(shù)組中所有元素的平均值?A.`sum(arr)/len(arr)`B.`np.mean(arr)`C.`np.average(arr)`D.B和C都正確4.在Pandas中,如何對DataFrame進(jìn)行按行排序?A.`df.sort_values(by='column',ascending=False)`B.`df.sort_index(axis=0)`C.`df.rank(columns='column')`D.A和B都正確5.以下哪個庫主要用于數(shù)據(jù)可視化?A.PandasB.MatplotlibC.NumPyD.Scikit-learn答案與解析:1.B-解析:Pandas是專門為數(shù)據(jù)分析設(shè)計的庫,提供強(qiáng)大的數(shù)據(jù)清洗、過濾、分組等功能。Matplotlib和NumPy主要用于計算和可視化,Scikit-learn用于機(jī)器學(xué)習(xí)。2.D-解析:選項(xiàng)A和B都可以實(shí)現(xiàn)篩選,選項(xiàng)C的寫法不正確。Pandas支持多種篩選方式,A和B是常用方法。3.D-解析:`np.mean()`和`np.average()`都可以計算平均值,但`np.mean()`更常用。`sum(arr)/len(arr)`是手動計算,效率較低。4.A-解析:`sort_values()`按列值排序,`sort_index()`按索引排序。`rank()`用于計算排名,不是排序。A是按值排序的正確方式。5.B-解析:Matplotlib是Python中最常用的數(shù)據(jù)可視化庫,Pandas也有簡單的可視化功能,但Matplotlib更全面。NumPy和Scikit-learn不直接用于可視化。二、填空題(每空1分,共5題)說明:補(bǔ)全代碼或解釋。6.在Pandas中,使用______函數(shù)可以快速查看DataFrame的前5行數(shù)據(jù)。7.NumPy中,`np.array([1,2,3])`的類型是______。8.在Pandas中,使用______方法可以計算DataFrame的描述性統(tǒng)計(均值、標(biāo)準(zhǔn)差等)。9.Matplotlib中,`plt.plot(x,y)`繪制的是______圖。10.使用`df.groupby('column').sum()`可以按______分組并計算總和。答案與解析:6.`head()`-解析:`head()`默認(rèn)返回前5行,可指定參數(shù)調(diào)整行數(shù)。7.`ndarray`-解析:NumPy數(shù)組類型為`ndarray`,是Python中的基本數(shù)據(jù)結(jié)構(gòu)。8.`describe()`-解析:`describe()`自動計算統(tǒng)計量,如均值、標(biāo)準(zhǔn)差、分位數(shù)等。9.線性-解析:`plt.plot()`默認(rèn)繪制折線圖,也可通過參數(shù)改為散點(diǎn)圖等。10.`column`-解析:`groupby()`按指定列分組,然后對分組結(jié)果執(zhí)行聚合操作(如`sum()`)。三、簡答題(每題5分,共3題)說明:解釋或說明。11.簡述Pandas中`merge()`和`join()`的區(qū)別。12.解釋NumPy的廣播機(jī)制是什么,并舉例說明。13.如何使用Matplotlib繪制一個帶有誤差線的散點(diǎn)圖?答案與解析:11.-Pandas中`merge()`和`join()`的區(qū)別:-`merge()`:基于鍵(key)合并兩個DataFrame,類似于SQL中的`JOIN`操作,支持多種合并方式(內(nèi)連接、外連接等)。-`join()`:按索引合并,默認(rèn)左連接,類似于`merge(left_index=True)`,更簡單但功能有限。-示例:pythonimportpandasaspddf1=pd.DataFrame({'key':['A','B'],'value1':[1,2]})df2=pd.DataFrame({'key':['A','B'],'value2':[3,4]})mergeresult=pd.merge(df1,df2,on='key',how='inner')joinresult=df1.join(df2.set_index('key'),on='key',how='inner')12.-NumPy廣播機(jī)制:-廣播是NumPy自動擴(kuò)展數(shù)組維度以適配不同形狀數(shù)組進(jìn)行計算的功能,避免顯式復(fù)制數(shù)據(jù),提高效率。-規(guī)則:1.若兩個數(shù)組形狀相同,直接計算;2.若形狀不同,沿維度擴(kuò)展較短的數(shù)組至較長數(shù)組的形狀;3.若一個數(shù)組在某個維度為1,則在該維度上廣播。-示例:pythonimportnumpyasnpa=np.array([1,2,3])#(3,)b=np.array([4])#(1,)廣播后:a擴(kuò)展為(3,1),b擴(kuò)展為(1,3),結(jié)果為(3,3)result=a+bprint(result)#[[567][678][789]]13.-繪制帶有誤差線的散點(diǎn)圖:-使用`plt.errorbar()`函數(shù),可傳入x、y值及誤差數(shù)據(jù)(`yerr`)。-示例:pythonimportmatplotlib.pyplotaspltx=[1,2,3,4]y=[10,8,12,6]yerr=[0.5,1,0.3,0.7]plt.errorbar(x,y,yerr=yerr,fmt='o',ecolor='red',capsize=5)plt.xlabel('X軸')plt.ylabel('Y軸')plt.title('帶誤差線的散點(diǎn)圖')plt.show()四、代碼實(shí)現(xiàn)題(每題10分,共2題)說明:完成指定功能。14.任務(wù):-讀取CSV文件`sales.csv`(包含`date`,`product`,`sales`列),篩選出2023年銷售額大于10000的記錄,按`product`分組并計算總銷售額。-要求:使用Pandas,輸出結(jié)果按銷售額降序排列。示例代碼:pythonimportpandasaspd代碼實(shí)現(xiàn)15.任務(wù):-生成一個包含100個隨機(jī)數(shù)的NumPy數(shù)組(范圍0-1),計算其均值和標(biāo)準(zhǔn)差,并繪制直方圖(bins=20)。-要求:使用Matplotlib和NumPy,標(biāo)題包含均值和標(biāo)準(zhǔn)差。示例代碼:pythonimportnumpyasnpimportmatplotlib.pyplotasplt代碼實(shí)現(xiàn)答案與解析:14.pythonimportpandasaspddf=pd.read_csv('sales.csv')篩選2023年銷售額>10000df['date']=pd.to_datetime(df['date'])filtered=df[(df['date'].dt.year==2023)&(df['sales']>10000)]按product分組并計算總銷售額result=filtered.groupby('product')['sales'].sum().sort_values(ascending=False)print(result)-解析:-使用`pd.to_datetime()`確保`date`列是日期格式;-篩選條件為`year==2023`和`sales>10000`;-`groupby()`按`product`分組,`sum()`計算總和,`sort_values()`降序排列。15.pythonimportnumpyasnpimportmatplotlib.pyplotasplt生成隨機(jī)數(shù)data=np.random.rand(100)計算均值和標(biāo)準(zhǔn)差mean=np.mean(data)std=np.std(data)繪制直方圖plt.hist(data,bins=20,edgecolor='black')plt.title(f'隨機(jī)數(shù)分布\n均值={mean:.2f},標(biāo)準(zhǔn)差={std:.2f}')plt.xlabel('值')plt.ylabel('頻數(shù)')plt.show()-解析:-`np.random.rand(100)`生成100個0-1的隨機(jī)數(shù);-`np.mean()`和`np.std()`計算統(tǒng)計量;-`plt.hist()`繪制直方圖,`bins=20`設(shè)置bins數(shù)量,`edgecolor`美化。五、綜合應(yīng)用題(15分)說明:結(jié)合實(shí)際場景解決問題。16.任務(wù):-讀取CSV文件`customer.csv`(包含`age`,`gender`,`purchase`列),完成以下分析:1.計算各年齡段的平均購買金額;2.繪制性別與平均購買金額的條形圖;3.篩選出購買金額最高的10%客戶,并按性別分組統(tǒng)計數(shù)量。示例代碼:pythonimportpandasaspdimportmatplotlib.pyplotasplt代碼實(shí)現(xiàn)答案與解析:16.pythonimportpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_csv('customer.csv')1.計算各年齡段的平均購買金額age_mean=df.groupby('age')['purchase'].mean().sort_index()print("各年齡段平均購買金額:\n",age_mean)2.繪制性別與平均購買金額的條形圖gender_mean=df.groupby('gender')['purchase'].mean()plt.bar(gender_mean.index,gender_mean.values)plt.title('性別與平均購買金額')plt.xlabel('性別')plt.ylabel('平均購買金額')plt.show()3.篩選出購買金額最高的10%客戶top_10=df.nlargest(int(len(df)0.1),'purchase')gender_count=top_10.groupby('gender').size()pr
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026中國水利水電第十二工程局有限公司社會招聘16人備考題庫有答案詳解
- 2026云南臨滄市住房和城鄉(xiāng)建設(shè)局招聘公益性崗位人員4人備考題庫及1套完整答案詳解
- 2026年上半年浙江杭州市五云山醫(yī)院高層次人才招聘6人備考題庫及參考答案詳解
- 2026中俄數(shù)字經(jīng)濟(jì)研究中心(廈門市人工智能創(chuàng)新中心)多崗位招聘備考題庫及參考答案詳解一套
- 2026四川自貢市第三人民醫(yī)院第一批編外人員招聘17人備考題庫及一套參考答案詳解
- 業(yè)務(wù)場景營銷方案策劃書模版
- 環(huán)境質(zhì)量監(jiān)測系統(tǒng)構(gòu)建合作承諾書3篇范文
- 市場營銷策略分析報告模板行業(yè)適用
- 協(xié)作協(xié)議誠信經(jīng)營履行承諾書7篇
- 工程建筑質(zhì)量長期保證承諾書4篇
- 機(jī)器人實(shí)訓(xùn)室規(guī)劃建設(shè)方案
- 綜合布線辦公樓布線方案
- 鞍鋼檢驗(yàn)報告
- 河南省信陽市2023-2024學(xué)年高二上學(xué)期期末教學(xué)質(zhì)量檢測數(shù)學(xué)試題(含答案解析)
- 北師大版七年級上冊數(shù)學(xué) 期末復(fù)習(xí)講義
- 2023年初級經(jīng)濟(jì)師《初級人力資源專業(yè)知識與實(shí)務(wù)》歷年真題匯編(共270題)
- 赤峰南臺子金礦有限公司金礦2022年度礦山地質(zhì)環(huán)境治理計劃書
- 氣穴現(xiàn)象和液壓沖擊
- 公民健康素養(yǎng)知識講座課件
- 銷軸連接(-自編)
- GB/T 15623.2-2003液壓傳動電調(diào)制液壓控制閥第2部分:三通方向流量控制閥試驗(yàn)方法
評論
0/150
提交評論