云南工商學(xué)院《數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)(ICT 數(shù)據(jù)分析)》2024-2025 學(xué)年第一學(xué)期期末試卷_第1頁(yè)
云南工商學(xué)院《數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)(ICT 數(shù)據(jù)分析)》2024-2025 學(xué)年第一學(xué)期期末試卷_第2頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

班級(jí)學(xué)班級(jí)學(xué)號(hào)姓名本科..............................密..............................封..............................線..............................試卷說(shuō)明:1、試卷滿分100分,120分鐘完成試卷;2、鋼筆或圓珠筆直接答在試題中(除題目有特殊規(guī)定外);3、答卷前將密封線內(nèi)的項(xiàng)目填寫(xiě)清楚。題號(hào)一二三四五總分合分人復(fù)核人滿分100得分一、精心選一選(本大題總共15小題,每題2分,共30分)1.以下哪種數(shù)據(jù)類(lèi)型不屬于數(shù)值型數(shù)據(jù)?A.整數(shù)B.小數(shù)C.字符串D.浮點(diǎn)數(shù)2.在數(shù)據(jù)清洗中,處理缺失值的方法不包括以下哪種?A.刪除含有缺失值的記錄B.用均值填充C.用中位數(shù)填充D.直接忽略3.對(duì)于線性回歸模型,以下說(shuō)法正確的是?A.只能處理線性關(guān)系的數(shù)據(jù)B.可以處理非線性關(guān)系的數(shù)據(jù)C.對(duì)異常值不敏感D.不需要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化4.以下哪個(gè)是常用的數(shù)據(jù)分析工具?A.WordB.ExcelC.PhotoshopD.PowerPoint5.數(shù)據(jù)可視化的主要目的是?A.使數(shù)據(jù)更美觀B.更好地理解和展示數(shù)據(jù)C.隱藏?cái)?shù)據(jù)細(xì)節(jié)D.增加數(shù)據(jù)量6.以下哪種抽樣方法是等概率抽樣?A.簡(jiǎn)單隨機(jī)抽樣B.分層抽樣C.整群抽樣D.系統(tǒng)抽樣7.在數(shù)據(jù)分析流程中,數(shù)據(jù)探索性分析階段不包括以下哪項(xiàng)?A.數(shù)據(jù)可視化B.計(jì)算統(tǒng)計(jì)量C.建立預(yù)測(cè)模型D.發(fā)現(xiàn)數(shù)據(jù)模式8.對(duì)于分類(lèi)問(wèn)題,以下哪種算法常用于二分類(lèi)?A.決策樹(shù)B.線性回歸C.聚類(lèi)算法D.關(guān)聯(lián)規(guī)則挖掘9.數(shù)據(jù)挖掘中的頻繁項(xiàng)集挖掘主要用于發(fā)現(xiàn)?A.數(shù)據(jù)中的最大值B.經(jīng)常同時(shí)出現(xiàn)的項(xiàng)集C.數(shù)據(jù)的平均值D.數(shù)據(jù)的中位數(shù)10.以下哪種數(shù)據(jù)結(jié)構(gòu)適合存儲(chǔ)有序數(shù)據(jù)?A.列表B.字典C.集合D.元組11.在數(shù)據(jù)分析中,數(shù)據(jù)標(biāo)準(zhǔn)化的作用不包括?A.消除量綱影響B(tài).加快模型收斂速度C.提高模型精度D.改變數(shù)據(jù)分布12.對(duì)于時(shí)間序列數(shù)據(jù),常用的分析方法不包括?A.移動(dòng)平均法B.指數(shù)平滑法C.主成分分析D.趨勢(shì)分析13.以下哪種數(shù)據(jù)庫(kù)管理系統(tǒng)屬于關(guān)系型數(shù)據(jù)庫(kù)?A.MySQLB.MongoDBC.RedisD.Cassandra14.在數(shù)據(jù)分析報(bào)告中,結(jié)論部分應(yīng)該?A.詳細(xì)描述分析過(guò)程B.列出所有數(shù)據(jù)C.總結(jié)分析結(jié)果并提出建議D.展示可視化圖表15.數(shù)據(jù)質(zhì)量管理的目標(biāo)不包括?A.提高數(shù)據(jù)準(zhǔn)確性B.增加數(shù)據(jù)冗余C.保證數(shù)據(jù)完整性D.提升數(shù)據(jù)一致性二、準(zhǔn)確填一填(本大題總共5題,每題4分,共20分)1.數(shù)據(jù)科學(xué)的核心領(lǐng)域包括數(shù)據(jù)____、數(shù)據(jù)____、數(shù)據(jù)____和數(shù)據(jù)____。2.常見(jiàn)的數(shù)據(jù)預(yù)處理操作有數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)____和數(shù)據(jù)____。3.監(jiān)督學(xué)習(xí)中,根據(jù)輸出變量的類(lèi)型,可分為_(kāi)___學(xué)習(xí)和____學(xué)習(xí)。4.聚類(lèi)算法將數(shù)據(jù)對(duì)象劃分為不同的組,這些組稱(chēng)為_(kāi)___。5.數(shù)據(jù)可視化的圖表類(lèi)型有____、____、____等。三、合理判一判(本大題總共6題,每題4分,共24分)1.所有數(shù)據(jù)挖掘算法都適用于任何類(lèi)型的數(shù)據(jù)。()2.數(shù)據(jù)清洗只能處理缺失值,不能處理重復(fù)值。()3.線性回歸模型的目標(biāo)是最小化預(yù)測(cè)值與真實(shí)值之間的平方誤差。()4.分類(lèi)算法的評(píng)估指標(biāo)只有準(zhǔn)確率。()5.數(shù)據(jù)可視化時(shí),顏色的選擇對(duì)數(shù)據(jù)展示效果沒(méi)有影響。()6.大數(shù)據(jù)的特點(diǎn)是數(shù)據(jù)量巨大、類(lèi)型多樣、處理速度快、價(jià)值密度高。()四、深度析一析(本大題總共2題,每題6分,共12分)1.請(qǐng)簡(jiǎn)要闡述數(shù)據(jù)探索性分析的主要步驟和目的。2.說(shuō)明在數(shù)據(jù)分析中,如何選擇合適的算法來(lái)解決分類(lèi)問(wèn)題。五、綜合用一用(14分)某電商平臺(tái)收集了

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論