2025年P(guān)ython數(shù)據(jù)處理二級考試沖刺押題試卷_第1頁
2025年P(guān)ython數(shù)據(jù)處理二級考試沖刺押題試卷_第2頁
2025年P(guān)ython數(shù)據(jù)處理二級考試沖刺押題試卷_第3頁
2025年P(guān)ython數(shù)據(jù)處理二級考試沖刺押題試卷_第4頁
2025年P(guān)ython數(shù)據(jù)處理二級考試沖刺押題試卷_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2025年P(guān)ython數(shù)據(jù)處理二級考試沖刺押題試卷考試時間:______分鐘總分:______分姓名:______一、選擇題(每題2分,共20分)1.下列哪個不是Python內(nèi)置的數(shù)據(jù)類型?A.intB.floatC.listD.numpy.array2.在Pandas中,用于處理數(shù)據(jù)中缺失值的函數(shù)是?A.dropB.fillC.bothAandBD.remove3.下列關(guān)于NumPy數(shù)組的描述,錯誤的是?A.NumPy數(shù)組是同質(zhì)的,即數(shù)組中所有元素的類型必須相同。B.NumPy數(shù)組支持高效的向量化運(yùn)算。C.NumPy數(shù)組的大小是動態(tài)可變的。D.NumPy數(shù)組的內(nèi)存是連續(xù)分配的。4.以下哪個Pandas對象表示一個單一列的數(shù)據(jù)?A.DataFrameB.SeriesC.IndexD.Array5.在Pandas中,`df.groupby('col1')['col2'].sum()`這段代碼的主要功能是?A.對`col1`進(jìn)行排序。B.根據(jù)`col1`的值對DataFrame進(jìn)行分組,并對每個組的`col2`列求和。C.選擇`col1`和`col2`兩列。D.將`col1`和`col2`合并成一列。6.讀取CSV文件到PandasDataFrame對象的標(biāo)準(zhǔn)函數(shù)是?A.read_excelB.read_csvC.loadtxtD.read_table7.下列哪個方法可以用來去除PandasDataFrame中重復(fù)的行?A.dropnaB.drop_duplicatesC.uniqueD.deduplicate8.在Pandas中,`df.loc[rows,cols]`和`df.iloc[rows,cols]`的主要區(qū)別在于?A.`loc`只能用于行索引,`iloc`只能用于列索引。B.`loc`基于標(biāo)簽索引,`iloc`基于整數(shù)位置索引。C.`loc`比`iloc`執(zhí)行速度更快。D.兩者沒有區(qū)別,完全等價。9.以下哪個不是Matplotlib庫常用的圖表類型?A.折線圖B.散點(diǎn)圖C.熱力圖D.樹狀圖10.關(guān)于Python列表推導(dǎo)式,下列說法錯誤的是?A.列表推導(dǎo)式可以簡化列表的創(chuàng)建過程。B.列表推導(dǎo)式必須包含if語句。C.列表推導(dǎo)式可以包含for循環(huán)。D.列表推導(dǎo)式通常比等價的for循環(huán)語句更高效。二、填空題(每空2分,共20分)1.Python中用于輸入用戶數(shù)據(jù)的內(nèi)置函數(shù)是________。2.在NumPy中,創(chuàng)建一個3x3全零矩陣的函數(shù)是________。3.在Pandas中,用于選擇DataFrame中特定行和列的索引方式是________和________。4.當(dāng)PandasDataFrame中存在缺失數(shù)據(jù)時,可以使用________方法將其填充為特定值。5.函數(shù)在Python中是一段具有特定功能的可重用代碼塊,通過________關(guān)鍵字來定義。6.讀取Excel文件到PandasDataFrame對象的標(biāo)準(zhǔn)函數(shù)是________。7.`df.columns`屬性用于獲取PandasDataFrame的________。8.作用域指的是變量的可見范圍,局部變量在函數(shù)________執(zhí)行完畢后消失。9.Pandas中的`melt`函數(shù)可以將寬格式數(shù)據(jù)轉(zhuǎn)換為長格式數(shù)據(jù),其`id_vars`參數(shù)指定需要保留的________列。10.在Pandas中,`astype`函數(shù)用于轉(zhuǎn)換數(shù)據(jù)的________。三、編程題(共60分)1.(15分)編寫Python代碼,完成以下任務(wù):a.使用NumPy創(chuàng)建一個形狀為(5,4)的數(shù)組,元素從1開始,步長為2,類型為整數(shù)。b.使用切片操作取出該數(shù)組的第2行到第4行,第1列到第3列的子數(shù)組。c.計算該子數(shù)組的所有元素的平均值(使用NumPy函數(shù))。2.(20分)假設(shè)你已經(jīng)通過`importpandasaspd`導(dǎo)入了Pandas庫,并且有一個名為`df`的DataFrame,包含以下列:`'Name'`,`'Age'`,`'City'`,`'Salary'`。請編寫Pandas代碼完成以下任務(wù):a.查看DataFrame的前5行數(shù)據(jù)。b.將所有`Salary`列的值增加10%。c.篩選出`Age`大于30且`City`為"北京"的行。d.對DataFrame按`Salary`列降序排序。e.計算`Age`列的平均值,并將結(jié)果存儲在一個名為`avg_age`的變量中。3.(25分)假設(shè)有一個CSV文件`data.csv`,其內(nèi)容結(jié)構(gòu)如下(無標(biāo)題行,列依次為:姓名,部門,入職日期,銷售額):張三,技術(shù)部,2021-05-01,15000李四,市場部,2020-08-15,12000王五,技術(shù)部,2022-01-10,18000趙六,銷售部,2021-11-22,25000孫七,市場部,2020-03-08,11000...(更多數(shù)據(jù))請編寫Python代碼(假設(shè)Pandas庫已導(dǎo)入為`pd`)完成以下任務(wù):a.讀取`data.csv`文件到名為`df`的DataFrame。b.將`入職日期`列的數(shù)據(jù)類型轉(zhuǎn)換為Pandas的`datetime`類型。c.添加一列`年份`,其值為`入職日期`列的年份。d.計算每個部門的平均銷售額,并將結(jié)果按平均銷售額降序排列,輸出結(jié)果。e.找出銷售額最高的前2名員工的信息(姓名、部門、銷售額)。---試卷答案一、選擇題1.D2.C3.C4.B5.B6.B7.B8.B9.D10.B二、填空題1.input2.zeros3.loc,iloc4.fillna5.def6.read_excel7.列名8.內(nèi)部9.標(biāo)識10.類型三、編程題1.代碼及解析:```pythonimportnumpyasnp#a.創(chuàng)建(5,4)形狀,元素從1開始,步長為2,類型為整數(shù)arr=np.arange(1,1+5*4,2).reshape(5,4).astype(int)#解析:np.arange生成1到1+20-1=20的等差數(shù)列,步長為2。reshape將其重塑為5x4矩陣。astype確保類型為int。#b.切片取第2行到第4行,第1列到第3列sub_arr=arr[1:4,0:3]#解析:行索引從0開始,[1:4]取第2行(索引1)到第3行(索引2)。列索引[0:3]取第1列(索引0)到第2列(索引1)。#c.計算子數(shù)組的平均值mean_value=np.mean(sub_arr)#解析:np.mean計算數(shù)組中所有元素的平均值。```2.代碼及解析:```pythonimportpandasaspd#假設(shè)df已存在,以下為操作代碼#a.查看前5行print(df.head())#解析:df.head()默認(rèn)顯示前5行數(shù)據(jù)。#b.Salary列增加10%df['Salary']=df['Salary']*1.1#解析:將Salary列的每個值乘以1.1,實(shí)現(xiàn)增加10%。#c.篩選Age>30且City為"北京"的行filtered_df=df[(df['Age']>30)&(df['City']=="北京")]#解析:使用布爾索引,(df['Age']>30)生成一個布爾Series,(df['City']=="北京")也生成一個布爾Series,#兩者與(&)運(yùn)算選出同時滿足兩個條件的行。#d.按Salary列降序排序df_sorted=df.sort_values(by='Salary',ascending=False)#解析:sort_values按指定列排序,by='Salary'指定排序列,ascending=False指定降序。#e.計算Age列平均值并存儲avg_age=df['Age'].mean()#解析:mean()計算平均值,結(jié)果賦值給變量avg_age。```3.代碼及解析:```pythonimportpandasaspd#a.讀取CSV文件df=pd.read_csv('data.csv')#解析:pd.read_csv標(biāo)準(zhǔn)函數(shù)用于讀取CSV文件到DataFrame。#b.轉(zhuǎn)換入職日期類型df['入職日期']=pd.to_datetime(df['入職日期'])#解析:pd.to_datetime將字符串轉(zhuǎn)換為Pandas的datetime類型。#c.添加年份列df['年份']=df['入職日期'].dt.year#解析:dt.year訪問datetime對象的年份部分。#d.計算各部門平均銷售額并降序輸出result=df.groupby('部門')['銷售額'].mean().sort_values(ascending=False)#

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論