2025年公需科目《大數(shù)據(jù)》完整考試題庫(含參考答案)_第1頁
2025年公需科目《大數(shù)據(jù)》完整考試題庫(含參考答案)_第2頁
2025年公需科目《大數(shù)據(jù)》完整考試題庫(含參考答案)_第3頁
2025年公需科目《大數(shù)據(jù)》完整考試題庫(含參考答案)_第4頁
2025年公需科目《大數(shù)據(jù)》完整考試題庫(含參考答案)_第5頁
已閱讀5頁,還剩12頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2025年公需科目《大數(shù)據(jù)》完整考試題庫(含參考答案)一、單項(xiàng)選擇題(每題2分,共40分)1.大數(shù)據(jù)的4V特征中,“Variety”指的是()。A.數(shù)據(jù)量巨大B.數(shù)據(jù)類型多樣C.數(shù)據(jù)增長速度快D.數(shù)據(jù)價(jià)值密度低答案:B2.以下不屬于大數(shù)據(jù)采集工具的是()。A.FlumeB.KafkaC.HBaseD.Sqoop答案:C(解析:HBase是分布式列式數(shù)據(jù)庫,屬于存儲層工具)3.分布式文件系統(tǒng)HDFS的默認(rèn)塊大小是()。A.32MBB.64MBC.128MBD.256MB答案:C4.Spark的計(jì)算模型是()。A.批處理B.流處理C.迭代計(jì)算D.以上都是答案:D(解析:Spark支持批處理(RDD)、流處理(SparkStreaming)和迭代計(jì)算(MLlib))5.數(shù)據(jù)湖(DataLake)與數(shù)據(jù)倉庫(DataWarehouse)的核心區(qū)別在于()。A.數(shù)據(jù)存儲量B.數(shù)據(jù)結(jié)構(gòu)化程度C.數(shù)據(jù)處理速度D.數(shù)據(jù)來源數(shù)量答案:B(解析:數(shù)據(jù)湖存儲原始、多類型數(shù)據(jù),數(shù)據(jù)倉庫存儲結(jié)構(gòu)化、清洗后的數(shù)據(jù))6.隱私計(jì)算中,“聯(lián)邦學(xué)習(xí)”的主要目標(biāo)是()。A.提高數(shù)據(jù)計(jì)算速度B.在不共享原始數(shù)據(jù)的前提下聯(lián)合建模C.增強(qiáng)數(shù)據(jù)存儲安全性D.減少數(shù)據(jù)存儲空間答案:B7.以下屬于非關(guān)系型數(shù)據(jù)庫(NoSQL)的是()。A.MySQLB.OracleC.MongoDBD.SQLServer答案:C8.大數(shù)據(jù)分析中,“關(guān)聯(lián)分析”常用于()。A.預(yù)測未來趨勢B.發(fā)現(xiàn)數(shù)據(jù)間隱含關(guān)系C.分類數(shù)據(jù)特征D.降低數(shù)據(jù)維度答案:B(解析:典型應(yīng)用如“啤酒與尿布”關(guān)聯(lián)規(guī)則挖掘)9.邊緣計(jì)算與大數(shù)據(jù)結(jié)合的主要優(yōu)勢是()。A.減少數(shù)據(jù)傳輸延遲B.提高云端存儲能力C.降低邊緣設(shè)備成本D.簡化數(shù)據(jù)處理邏輯答案:A10.以下哪項(xiàng)不屬于大數(shù)據(jù)安全的核心問題?()A.數(shù)據(jù)泄露B.數(shù)據(jù)篡改C.數(shù)據(jù)冗余D.數(shù)據(jù)越權(quán)訪問答案:C11.分布式計(jì)算框架MapReduce的核心步驟是()。A.拆分與合并B.映射與歸約C.存儲與計(jì)算D.輸入與輸出答案:B(解析:Map(映射)和Reduce(歸約)是核心操作)12.數(shù)據(jù)可視化工具Tableau的主要功能是()。A.數(shù)據(jù)清洗B.數(shù)據(jù)存儲C.交互式圖表展示D.分布式計(jì)算答案:C13.以下屬于實(shí)時(shí)流處理框架的是()。A.HadoopB.SparkC.FlinkD.Hive答案:C(解析:Flink是典型的實(shí)時(shí)流處理引擎)14.大數(shù)據(jù)倫理的核心原則不包括()。A.數(shù)據(jù)隱私保護(hù)B.算法公平性C.數(shù)據(jù)免費(fèi)共享D.責(zé)任可追溯答案:C15.數(shù)據(jù)脫敏技術(shù)中,“匿名化”主要用于()。A.防止數(shù)據(jù)重復(fù)B.隱藏敏感信息C.壓縮數(shù)據(jù)體積D.加速數(shù)據(jù)查詢答案:B16.以下哪項(xiàng)是大數(shù)據(jù)價(jià)值挖掘的關(guān)鍵步驟?()A.數(shù)據(jù)采集B.數(shù)據(jù)存儲C.數(shù)據(jù)清洗D.數(shù)據(jù)建模分析答案:D17.區(qū)塊鏈與大數(shù)據(jù)結(jié)合的典型應(yīng)用是()。A.提升數(shù)據(jù)計(jì)算速度B.確保數(shù)據(jù)不可篡改C.擴(kuò)大數(shù)據(jù)存儲容量D.簡化數(shù)據(jù)處理流程答案:B18.大數(shù)據(jù)平臺的分層架構(gòu)中,“計(jì)算層”主要負(fù)責(zé)()。A.數(shù)據(jù)采集與傳輸B.數(shù)據(jù)存儲與管理C.數(shù)據(jù)處理與分析D.數(shù)據(jù)展示與應(yīng)用答案:C19.以下不屬于大數(shù)據(jù)應(yīng)用場景的是()。A.智慧城市交通優(yōu)化B.醫(yī)療影像輔助診斷C.個(gè)人手寫筆記記錄D.電商精準(zhǔn)推薦答案:C20.數(shù)據(jù)生命周期管理的最后階段是()。A.數(shù)據(jù)采集B.數(shù)據(jù)歸檔/刪除C.數(shù)據(jù)處理D.數(shù)據(jù)分析答案:B二、多項(xiàng)選擇題(每題3分,共30分)1.大數(shù)據(jù)的“4V”特征包括()。A.Volume(大量)B.Velocity(高速)C.Variety(多樣)D.Value(低價(jià)值密度)答案:ABCD2.以下屬于Hadoop生態(tài)系統(tǒng)組件的有()。A.HDFSB.MapReduceC.YARND.Hive答案:ABCD3.數(shù)據(jù)清洗的主要任務(wù)包括()。A.處理缺失值B.糾正錯(cuò)誤數(shù)據(jù)C.去除重復(fù)數(shù)據(jù)D.轉(zhuǎn)換數(shù)據(jù)格式答案:ABCD4.隱私計(jì)算的主要技術(shù)包括()。A.聯(lián)邦學(xué)習(xí)B.多方安全計(jì)算C.同態(tài)加密D.數(shù)據(jù)脫敏答案:ABC(解析:數(shù)據(jù)脫敏屬于隱私保護(hù)技術(shù),非計(jì)算技術(shù))5.大數(shù)據(jù)在醫(yī)療領(lǐng)域的應(yīng)用包括()。A.疾病預(yù)測模型B.藥物研發(fā)數(shù)據(jù)分析C.電子病歷管理D.醫(yī)院后勤調(diào)度優(yōu)化答案:ABCD6.分布式存儲的優(yōu)勢有()。A.高可靠性B.可擴(kuò)展性C.低成本D.單節(jié)點(diǎn)故障不影響整體答案:ABD(解析:分布式存儲成本通常高于集中式)7.以下屬于流處理框架的是()。A.ApacheFlinkB.ApacheKafkaStreamsC.SparkStreamingD.HBase答案:ABC8.大數(shù)據(jù)倫理需關(guān)注的問題包括()。A.算法歧視B.數(shù)據(jù)壟斷C.隱私侵犯D.數(shù)據(jù)主權(quán)答案:ABCD9.數(shù)據(jù)湖的特點(diǎn)包括()。A.存儲原始數(shù)據(jù)B.支持多類型數(shù)據(jù)C.結(jié)構(gòu)化程度高D.適合實(shí)時(shí)分析答案:ABD(解析:數(shù)據(jù)湖存儲非結(jié)構(gòu)化/半結(jié)構(gòu)化數(shù)據(jù))10.大數(shù)據(jù)分析的主要方法包括()。A.描述性分析B.預(yù)測性分析C.規(guī)范性分析D.驗(yàn)證性分析答案:ABC三、判斷題(每題2分,共20分)1.大數(shù)據(jù)的核心是“數(shù)據(jù)量大”,只要數(shù)據(jù)足夠多就能挖掘價(jià)值。()答案:×(解析:數(shù)據(jù)質(zhì)量、分析方法同樣關(guān)鍵)2.HDFS適合存儲小文件,因?yàn)槠鋲K大小設(shè)計(jì)靈活。()答案:×(解析:HDFS存儲小文件會(huì)導(dǎo)致NameNode內(nèi)存壓力大,不適合)3.數(shù)據(jù)倉庫主要用于支持OLTP(在線事務(wù)處理)。()答案:×(解析:數(shù)據(jù)倉庫支持OLAP(在線分析處理))4.流處理強(qiáng)調(diào)對實(shí)時(shí)產(chǎn)生的數(shù)據(jù)進(jìn)行即時(shí)分析。()答案:√5.聯(lián)邦學(xué)習(xí)可以在多個(gè)參與方不共享原始數(shù)據(jù)的情況下聯(lián)合訓(xùn)練模型。()答案:√6.NoSQL數(shù)據(jù)庫完全替代了關(guān)系型數(shù)據(jù)庫。()答案:×(解析:兩者適用場景不同,互補(bǔ)而非替代)7.數(shù)據(jù)可視化的目的僅是讓數(shù)據(jù)“看起來好看”。()答案:×(解析:核心是幫助用戶快速理解數(shù)據(jù)規(guī)律)8.大數(shù)據(jù)安全只需關(guān)注技術(shù)防護(hù),無需考慮管理流程。()答案:×(解析:需技術(shù)與管理結(jié)合)9.邊緣計(jì)算將數(shù)據(jù)處理移至數(shù)據(jù)源附近,減少了云端壓力。()答案:√10.數(shù)據(jù)生命周期管理僅涉及數(shù)據(jù)存儲階段。()答案:×(解析:覆蓋采集、存儲、處理、分析、歸檔/刪除全流程)四、簡答題(每題5分,共10分)1.簡述大數(shù)據(jù)技術(shù)棧的主要分層及各層的核心功能。答案:大數(shù)據(jù)技術(shù)棧通常分為五層:(1)數(shù)據(jù)采集層:通過Flume、Kafka等工具收集多源數(shù)據(jù);(2)數(shù)據(jù)存儲層:使用HDFS(分布式文件系統(tǒng))、HBase(列式存儲)、關(guān)系型數(shù)據(jù)庫等存儲數(shù)據(jù);(3)數(shù)據(jù)處理層:通過MapReduce(批處理)、Flink(流處理)、Spark(內(nèi)存計(jì)算)進(jìn)行清洗、轉(zhuǎn)換;(4)數(shù)據(jù)分析層:利用Hive(類SQL分析)、MLlib(機(jī)器學(xué)習(xí))、圖計(jì)算等挖掘價(jià)值;(5)數(shù)據(jù)應(yīng)用層:通過Tableau、PowerBI等工具可視化,或直接輸出業(yè)務(wù)決策。2.列舉三種大數(shù)據(jù)隱私保護(hù)技術(shù),并說明其核心原理。答案:(1)數(shù)據(jù)脫敏:對敏感信息(如姓名、身份證號)進(jìn)行替換(如“張”)或變形(如哈希),保留數(shù)據(jù)可用性;(2)聯(lián)邦學(xué)習(xí):各參與方在本地訓(xùn)練模型,僅交換模型參數(shù)(非原始數(shù)據(jù)),聯(lián)合優(yōu)化全局模型;(3)同態(tài)加密:允許在加密數(shù)據(jù)上直接進(jìn)行計(jì)算,結(jié)果解密后與明文計(jì)算一致,保護(hù)數(shù)據(jù)隱私。五、案例分析題(共20分)某電商平臺計(jì)劃通過大數(shù)據(jù)優(yōu)化用戶購物體驗(yàn),具體需求包括:實(shí)時(shí)監(jiān)控用戶點(diǎn)擊流數(shù)據(jù),分析商品偏好;預(yù)測用戶復(fù)購概率;防范虛假交易(如刷單)。問題:1.該平臺需搭建哪些大數(shù)據(jù)組件?請說明各組件的作用。2.針對“實(shí)時(shí)監(jiān)控用戶點(diǎn)擊流數(shù)據(jù)”,應(yīng)選擇哪種處理框架?為什么?3.預(yù)測用戶復(fù)購概率可能涉及哪些分析方法?答案:1.需搭建組件及作用:(1)數(shù)據(jù)采集:使用Flume(日志采集)、Kafka(消息隊(duì)列,緩存實(shí)時(shí)點(diǎn)擊流數(shù)據(jù));(2)數(shù)據(jù)存儲:HDFS(存儲歷史交易數(shù)據(jù))、HBase(存儲實(shí)時(shí)用戶行為數(shù)據(jù),支持快速查詢);(3)實(shí)時(shí)處理:Flink(處理實(shí)時(shí)點(diǎn)擊流,分析用戶實(shí)時(shí)行為);(4)批處理:Spark(分析歷史數(shù)據(jù),訓(xùn)練復(fù)購預(yù)測模型);(5)機(jī)器學(xué)習(xí):MLlib或TensorFlow(構(gòu)建復(fù)購預(yù)測模型、刷單檢測模型);(6)可視化:Tableau(展示用戶偏好、復(fù)購率等指標(biāo))。2.應(yīng)選擇Flink作為實(shí)時(shí)處理框架。原因:Flink支持毫秒級低延遲、精確一次(exactly-once)語義,適合處理高并發(fā)的用戶點(diǎn)擊流

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論