2025 年大學人工智能(特征工程基礎(chǔ))上學期期末測試卷_第1頁
2025 年大學人工智能(特征工程基礎(chǔ))上學期期末測試卷_第2頁
2025 年大學人工智能(特征工程基礎(chǔ))上學期期末測試卷_第3頁
2025 年大學人工智能(特征工程基礎(chǔ))上學期期末測試卷_第4頁
2025 年大學人工智能(特征工程基礎(chǔ))上學期期末測試卷_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2025年大學人工智能(特征工程基礎(chǔ))上學期期末測試卷

(考試時間:90分鐘滿分100分)班級______姓名______一、選擇題(總共10題,每題4分,在每小題給出的四個選項中,只有一項是符合題目要求的)1.以下關(guān)于特征工程的說法,錯誤的是()A.特征工程是將原始數(shù)據(jù)轉(zhuǎn)換為更能代表預測模型的潛在問題的特征的過程B.好的特征工程能提升模型的性能和效果C.特征工程只需要關(guān)注數(shù)據(jù)的準確性,無需考慮數(shù)據(jù)的規(guī)模D.特征工程包括特征提取、特征選擇、特征構(gòu)建等環(huán)節(jié)2.在特征選擇中,以下哪種方法不屬于基于模型的方法()A.決策樹B.支持向量機C.信息增益D.隨機森林3.對于高維稀疏數(shù)據(jù),以下哪種特征提取方法比較合適()A.主成分分析B.奇異值分解C.線性判別分析D.局部線性嵌入4.特征構(gòu)建的目的是()A.從原始數(shù)據(jù)中提取新的特征B.去除無關(guān)特征C.選擇最重要的特征D.對特征進行歸一化處理5.以下關(guān)于特征縮放的說法,正確的是()A.特征縮放能使模型更快收斂B.所有特征都需要進行相同的縮放方式C.特征縮放會改變數(shù)據(jù)的分布D.特征縮放只對數(shù)值型特征有效6.在處理文本數(shù)據(jù)時,常用的特征提取方法不包括()A.詞袋模型B.TF-IDFC.詞向量模型D.線性回歸7.對于類別型特征,以下哪種編碼方式是最常用的()A.獨熱編碼B.序數(shù)編碼C.二進制編碼D.哈希編碼8.特征工程中,數(shù)據(jù)清洗的主要目的不包括()A.去除重復數(shù)據(jù)B.處理缺失值C.增加數(shù)據(jù)維度D.糾正錯誤數(shù)據(jù)9.以下哪種情況適合使用特征選擇()A.數(shù)據(jù)維度較低B.模型性能已經(jīng)很好C.存在大量冗余特征D.數(shù)據(jù)量很少10.在特征工程中,以下哪種方法可以用于特征降維()A.增加特征數(shù)量B.特征交叉C.聚類算法D.以上都不對二、多項選擇題(總共5題,每題6分,在每小題給出的四個選項中,有多項是符合題目要求的,錯選、多選、少選均不得分)1.特征工程的主要步驟包括()A.數(shù)據(jù)收集B.特征提取C.特征選擇D.模型評估2.以下屬于特征選擇的方法有()A.方差選擇法B.相關(guān)系數(shù)法C.決策樹重要性D.LASSO回歸3.對于特征提取,以下說法正確的是()A.可以將原始數(shù)據(jù)轉(zhuǎn)換為更有意義的特征B.能降低數(shù)據(jù)的維度C.不同的特征提取方法適用于不同類型的數(shù)據(jù)D.特征提取后的數(shù)據(jù)更易于模型處理4.特征工程中,處理缺失值的方法有()A.刪除含有缺失值的樣本B.用均值填充C.用中位數(shù)填充D.用模型預測值填充5.以下哪些屬于類別型特征的編碼方式()A.獨熱編碼B.標簽編碼C.頻率編碼D.目標編碼三、判斷題(總共10題,每題3分,判斷下列說法的正誤)1.特征工程對模型的性能沒有太大影響。()2.基于統(tǒng)計的特征選擇方法比基于模型的方法更準確。()3.主成分分析可以用于特征提取和降維。()4.特征構(gòu)建只能基于現(xiàn)有特征進行簡單組合。()5.特征縮放會影響模型的預測結(jié)果。()6.文本數(shù)據(jù)不需要進行特征工程。()7.獨熱編碼適用于所有類別型特征。()8.數(shù)據(jù)清洗是特征工程的重要環(huán)節(jié)之一。()9.特征選擇可以去除所有無關(guān)特征。()10.特征工程只在模型訓練前進行,訓練后不需要再考慮。()四、簡答題(總共3題,每題10分,簡要回答問題)1.簡述特征工程中特征提取的常用方法及適用場景。2.說明特征選擇的重要性以及常用的特征選擇方法。3.舉例說明如何進行特征構(gòu)建,并闡述其意義。五、綜合題(總共1題,每題20分,結(jié)合實際案例進行分析)假設(shè)你正在處理一個預測客戶是否會購買某種產(chǎn)品的數(shù)據(jù)集,其中包含客戶的年齡、性別、收入、購買歷史等特征。請描述你將如何進行特征工程,包括數(shù)據(jù)清洗、特征提取、特征選擇、特征構(gòu)建等步驟,并說明理由。答案:一、選擇題1.C2.C3.B4.A5.A6.D7.A8.C9.C10.C二、多項選擇題1.ABC2.ABCD3.ABCD4.ABCD5.ABCD三、判斷題1.×2.×3.√4.×5.√6.×7.×8.√9.×10.×四、簡答題1.常用方法:主成分分析適用于數(shù)據(jù)維度高且存在相關(guān)性的情況,可提取主成分降維;奇異值分解用于高維數(shù)據(jù)處理;線性判別分析用于數(shù)據(jù)分類且有監(jiān)督的情況。適用場景:根據(jù)數(shù)據(jù)特點和分析目的選擇,如降維選主成分分析,處理高維稀疏數(shù)據(jù)選奇異值分解等。2.重要性:去除無關(guān)特征,減少噪聲,提高模型訓練效率和準確性,降低計算成本。常用方法:方差選擇法、相關(guān)系數(shù)法、決策樹重要性、LASSO回歸等。3.例如將客戶購買頻率和平均購買金額構(gòu)建為新特征“購買活躍度”。意義:能更全面反映客戶購買行為,為模型提供更有價值信息,有助于提升模型對客戶購買傾向的預測能力。五、綜合題數(shù)據(jù)清洗:檢查缺失值,用均值或中位數(shù)填充年齡、收入的缺失值;檢查異常值,對年齡等特征進行截斷處理。特征提?。簩δ挲g、收入進行標準化處理;將性別進行獨熱編碼。特征選擇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論