版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
一、單選題(共10題)1.以下哪個函數用于讀取Excel文件?A.pd.read_csv()B.pd.read_excel()C.np.loadtxt()D.plt.read()答案:B2.在NumPy中,創(chuàng)建一個3x3的全零數組應使用:A.np.ones((3,3))B.np.zeros((3,3))C.np.empty((3,3))D.np.eye(3)答案:B3.在Pandas中,查看DataFrame的前幾行數據使用:A.df.tail()B.df.head()C.()D.df.describe()答案:B4.Matplotlib中繪制折線圖使用:A.plt.scatter()B.plt.plot()C.plt.bar()D.plt.pie()答案:B5.以下哪個方法可以刪除DataFrame中的重復行?A.df.dropna()B.df.drop_duplicates()C.df.fillna()D.df.replace()答案:B6.在NumPy中,數組切片arr[1:3,0:2]表示:A.第1到第3行,第0到第2列B.第1行到第2行,第0列到第1列C.第1到第3列,第0到第2行D.第0到第2行,第1到第3列答案:B7.以下哪個函數可以將多個數組合并成一個?A.np.split()B.np.stack()C.np.reshape()D.np.flatten()答案:B8.在Pandas中,刪除列應使用:A.df.drop(columns=['列名'])B.df.remove('列名')C.df.delete('列名')D.df.pop('列名')答案:A9.以下哪個圖適合展示分類數據的占比?A.折線圖B.散點圖C.餅圖D.柱形圖答案:C10.RFM模型中,F代表:A.頻率(Frequency)B.金額(Financial)C.反饋(Feedback)D.首次購買時間(First)答案:A11.在Pandas中,要把字符串類型的日期列轉換為datetime類型,應使用:A.pd.to_numeric()B.pd.to_datetime()C.pd.to_string()D.pd.convert()答案:B12.使用NumPy生成5個服從標準正態(tài)分布的隨機數,應調用:A.np.random.rand(5)B.np.random.randn(5)C.np.random.randint(5)D.np.random.normal(5)答案:B13.在DataFrame中按“銷售額”升序排序,正確寫法是:A.df.sort_values('銷售額',ascending=False)B.df.sort('銷售額')C.df.sort_values('銷售額')D.df.order('銷售額')答案:C14.若想查看DataFrame各列缺失值占比,下列哪段代碼最簡潔?A.df.isnull().sum()/len(df)B.df.isnull().mean()C.df.missing().ratio()D.df.count()/len(df)答案:B15.Matplotlib中設置x軸標簽的函數是:A.plt.title()B.plt.xlabel()C.plt.xticks()D.plt.text()答案:B16.在NumPy里,將數組按列方向堆疊應使用:A.np.vstack()B.np.hstack()C.np.column_stack()D.np.dstack()答案:C17.對類別變量進行獨熱編碼,Pandas提供的便捷方法是:A.pd.get_dummies()B.pd.one_hot()C.pd.encode()D.pd.categorical()答案:A18.以下哪個參數可在plt.bar()中控制柱形寬度?A.heightB.widthC.bottomD.align答案:B19.使用groupby()聚合后,想取消多級索引變?yōu)槠胀?,應調用:A.reset_index()B.reindex()C.set_index()D.flatten()答案:A20.在Pandas中,要把“20251111”這種純數字轉換為日期,最佳做法是:A.df['date'].astype('datetime64')B.pd.to_datetime(df['date'],format='%Y%m%d')C.df['date'].apply(str)D.df['date'].map(pd.Timestamp)答案:B二、多選題(共10題)21.以下哪些是Pandas支持讀取的文件格式?A.CSVB.ExcelC.JSOND.TXT答案:A、B、C、D22.NumPy數組的切片特點包括:A.支持布爾索引B.支持多維切片C.切片是原數組的視圖D.切片會復制數據答案:A、B、C23.以下哪些屬于數據清洗的內容?A.缺失值處理B.異常值處理C.格式轉換D.數據可視化答案:A、B、C24.Matplotlib中繪制子圖可以使用:A.plt.subplot()B.plt.subplots()C.plt.figure()D.plt.add_subplot()答案:A、B、D25.以下哪些方法可以處理缺失值?A.fillna()B.dropna()C.replace()D.isnull()答案:A、B26.以下哪些是NumPy創(chuàng)建數組的方式?A.np.array()B.np.arange()C.np.linspace()D.np.random.rand()答案:A、B、C、D27.以下哪些圖適合展示兩個連續(xù)變量之間的關系?A.折線圖B.散點圖C.柱形圖D.熱力圖答案:B、D28.以下哪些操作可以保存DataFrame為文件?A.to_csv()B.to_excel()C.save()D.write()答案:A、B29.以下哪些是RFM模型的指標?A.最近購買時間(Recency)B.購買頻率(Frequency)C.購買金額(Monetary)D.客戶滿意度(Satisfaction)答案:A、B、C30.以下哪些屬于異常值檢測方法?A.箱線圖B.3σ原則C.Z-scoreD.均值填充答案:A、B、C三、判斷題(共10題)31.pd.read_csv()可以讀取Excel文件。(×)32.NumPy數組一旦創(chuàng)建,形狀不可改變。(×)33.plt.show()是顯示圖像的必要步驟。(√)34.df.dropna()默認刪除包含任何缺失值的行。(√)35.np.hstack()是用于水平堆疊數組。(√)36.RFM模型只能用于電商行業(yè)。(×)37.()可以查看每列的數據類型和非空值數量。(√)38.Matplotlib不支持中文字符顯示。(×)39.df.duplicated()可以判斷是否有重復行。(√)40.plt.pie()可以用于展示分類數據的占比。(√)41.np.concatenate()只能合并形狀完全相同的數組。(×)42.df.astype()可以用來批量轉換DataFrame的列數據類型。(√)43.Matplotlib的plt.legend()必須在plt.show()之后調用才會生效。(×)44.在Pandas中,value_counts()默認會忽略缺失值。(√)45.np.eye(3,k=1)會生成3×3的單位矩陣。(×)四、簡答題(共4題)31.簡述如何使用Pandas讀取和保存Excel文件。答:讀?。簆d.read_excel('文件路徑.xlsx')保存:df.to_excel('保存路徑.xlsx',index=False)32.簡述NumPy中數組切片的三種常見方式。答:*(1)基本切片:通過“起始:結束”方式截取數組的一部分,返回的是原數組的視圖,常用于獲取連續(xù)的行或列。
(2)布爾索引:利用布爾數組作為下標,提取滿足條件的元素,例如取出所有大于零的數,方便按條件過濾數據。
(3)花式索引:使用整數數組或列表作為下標,一次性提取多個不連續(xù)位置的元素,適用于按指定順序或位置獲取數據。舉例:-基本切片:arr[1:3,0:2]-布爾索引:arr[arr>5]-花式索引:arr[[0,2,4]]33.簡述數據清洗中處理缺失值的三種方法。答:-刪除:df.dropna()-填充:df.fillna(值)-插值:erpolate()34.簡述RFM模型的三個指標及其含義。答:-R(Recency):最近一次購買時間-F(Frequency):購買頻率-M(Monetary):購買金額35.請用文字說明在Pandas中如何向已有的DataFrame添加一列新數據,并給出兩種常見做法。答:
第一種做法是給DataFrame直接賦一個新列名,例如df['新列名']=Series或標量,Pandas會把該列自動對齊到現有索引并追加到表中;
第二種做法是用insert()方法,在指定位置插入新列,例如df.insert(loc=2,column='新列名',value=Series),可精確控制列的順序,適合需要把新列放在特定位置的場景。五、編程題1.假設提供直通車費用支出和店鋪銷售額數據,都涵蓋在data.csv里,編程輸出線性回歸方程"""需求:根據直通車費用支出與店鋪銷售額數據,輸出線性回歸方程依賴:pandas+scikit-learn用法:把數據路徑填進去即可"""importpandasaspdfromsklearn.linear_modelimportLinearRegressionfromsklearn.preprocessingimportStandardScaler#1.讀數據(支持csv或xlsx)file='data.csv'#改成你的文件名iffile.endswith('.csv'):df=pd.read_csv(file)else:df=pd.read_excel(file)#2.自動找到“費用”列和“銷售額”列(模糊匹配)cost_col=[cforcindf.columnsif'費用'incor'支出'inc][0]sales_col=[cforcindf.columnsif'銷售額'incor'營收'inc][0]X=df[[cost_col]]#二維特征矩陣y=df[sales_col]#一維目標變量#3.建模model=LinearRegression()model.fit(X,y)#4.取出參數k=model.coef_[0]b=ercept_#5.輸出方程(保留4位小數,可按需改)print(f'線性回歸方程:銷售額={k:.4f}×直通車費用+{b:.4f}')#6.可選:打印R2print(f'R2={model.score(X,y):.4f}')2.假設提供1年12個月的的銷售額數據和1年12個月的訪客流量數據,都涵蓋在data.csv里,編程輸出二者的關系折線圖"""需求:用12個月的銷售額&訪客流量畫雙軸折線圖,直觀展示二者關系依賴:pandas+matplotlib數據要求:12行,包含“銷售額”和“訪客流量”兩列即可"""importpandasaspdimportmatplotlib.pyplotasplt#1.讀數據(csv或xlsx)file='data.xlsx'#改成你的文件名iffile.endswith('.csv'):df=pd.read_csv(file)else:df=pd.read_excel(file)#2.自動識別列(模糊匹配)sales_col=[cforcindf.columnsif'銷售額'inc][0]uv_col=[cforcindf.columnsif'訪客'incor'流量'inc][0]#3.生成1–12月作為橫坐標months=list(range(1,13))#4.畫圖plt.rcParams['font.sa
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安裝公司規(guī)范制度
- 繪畫培訓機構員工制度
- 發(fā)電廠應急培訓考核制度
- 安全教育培訓教育制度
- 開發(fā)區(qū)培訓規(guī)章制度
- 護工培訓考試考核制度
- 基層檢察院培訓制度
- 技術培訓考核制度
- 2025重慶兩江新區(qū)燃氣有限責任公司外包崗位招聘5人筆試歷年參考題庫附帶答案詳解
- 2025遼寧沈陽綜保區(qū)陸港建設有限公司招聘2人筆試歷年參考題庫附帶答案詳解
- 2025年度精神科護士述職報告
- 上海市徐匯區(qū)2026屆初三一模物理試題(含答案)
- 2026陜西省森林資源管理局局屬企業(yè)招聘(55人)參考題庫及答案1套
- 2026年遼寧機電職業(yè)技術學院單招職業(yè)技能考試題庫附答案解析
- 春節(jié)前安全教育培訓課件
- 免疫治療相關甲狀腺功能亢進的分級
- 工業(yè)AI《2025年》機器視覺應用測試題
- 2024-2025學年七上期末數學試卷(原卷版)
- new共青團中央所屬單位2026年度高校畢業(yè)生公開招聘66人備考題庫及完整答案詳解
- 江蘇省蘇州市2024-2025學年高三上學期期末學業(yè)質量陽光指標調研物理試題(含答案)
- 2025-2026學年蘇教版五年級上冊數學期末必考題檢測卷(含答案)
評論
0/150
提交評論