大數(shù)據(jù)開發(fā)技術(shù) 試卷A_第1頁
大數(shù)據(jù)開發(fā)技術(shù) 試卷A_第2頁
大數(shù)據(jù)開發(fā)技術(shù) 試卷A_第3頁
大數(shù)據(jù)開發(fā)技術(shù) 試卷A_第4頁
大數(shù)據(jù)開發(fā)技術(shù) 試卷A_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PAGE1PAGE《大數(shù)據(jù)開發(fā)技術(shù)》課程配套考試題__A卷一、單選題(20題,每題1分,共20分)默認(rèn)的MapReduce輸入格式是()。

A.TextInputFormat

B.KeyValueTextInputFormat

C.NLineInputFormat

D.SequenceFileInputFormat下列哪個程序通常與NameNode在一個節(jié)點(diǎn)啟動()。SecondaryNameNode

B.DataNode

C.TaskTracker

D.SequenceFileInputFormatNamenode在啟動時自動進(jìn)入安全模式,在安全模式階段,說法錯誤的是()。A.安全模式目的是在系統(tǒng)啟動時檢查各個DataNode上數(shù)據(jù)塊的有效性

B.根據(jù)策略對數(shù)據(jù)塊進(jìn)行必要的復(fù)制或刪除

C.當(dāng)數(shù)據(jù)塊最小百分比數(shù)滿足的最小副本數(shù)條件時,會自動退出安全模式

D.文件系統(tǒng)允許有修改下列關(guān)于HDFS的描述正確的是()。A.如果NameNode宕機(jī),SecondaryNameNode會接替它使集群繼續(xù)工作

B.HDFS集群支持?jǐn)?shù)據(jù)的隨機(jī)讀寫

C.NameNode磁盤元數(shù)據(jù)不保存Block的位置信息

D.DataNode通過長連接與NameNode保持通信YARN中資源抽象用什么表示()。內(nèi)存

B.CPU

C.Container

D.磁盤空間Loader作業(yè)運(yùn)行前后,需要保證哪些節(jié)點(diǎn)與外部數(shù)據(jù)源通訊?()。Loader進(jìn)程所在的節(jié)點(diǎn)

B.運(yùn)行MapReduce作業(yè)的節(jié)點(diǎn)

C.前面兩個都需要

D.前面兩個都不需要關(guān)于Hive與Hadoop其他組件的關(guān)系,描述錯誤的是?()。HIVE最終將數(shù)據(jù)存儲在HDFS中

B.HiveSQL其本質(zhì)是執(zhí)行的MapReduce任務(wù)

C.Hive是Hadoop平臺的數(shù)據(jù)倉庫工具

D.Hive對HBase有強(qiáng)依賴Hadoop的MapReduce組件擅長處理哪些場景的計(jì)算任務(wù)?()。迭代計(jì)算

B.離線計(jì)算

C.實(shí)時交互計(jì)算

D.流式計(jì)算哪兒模塊負(fù)責(zé)HDFS數(shù)據(jù)存儲?()。NameNode

B.DateNode

C.ZooKeeper

D.JobTrackerHadoop平臺中,要查看YARN服務(wù)中一個application的信息,通常需要使用什么命令?()。container

B.applicationattempt

C.jar

D.application啟用日志聚集功能,需要配置哪個參數(shù)()。A.yarn.nodemanager.local-dirs

B.yarn.nodemanager.log-dirs

C.yarn.acl.enable

D.yarn.log-aggregation-enableYARN中的調(diào)度器匹配資源申請的順序,哪一個正確()。A.任意機(jī)器>同機(jī)架>本地資源

B.任意機(jī)器>本地資源>同機(jī)架

C.本地資源>同機(jī)架>任意機(jī)架

D.同機(jī)架>任意機(jī)器>本地資源與其他幾項(xiàng)不同的是()。A.Mesos

B.Mongodb

C.Corona

D.YARNhadoop2.x采用什么技術(shù)構(gòu)建源代碼()。A.ant

B.ivy

C.maven

D.makefile以下哪種不是hadoop對于小文件的處理方式()。A.SequenceFile

B.CombinedInputFormat

D.MapFile

C.ByteBuffer關(guān)系型數(shù)據(jù)庫與HDFS之間相互數(shù)據(jù)遷移的工具是()。A.distcp

B.fsck

C.fastcopy

D.sqoophadoop處在云計(jì)算三層模型中哪一層()。PaaS

B.SaaS

C.IasS

D.介于IaaS和PaaS之間DistributedFileSystem調(diào)用create方法后的返回類型是()。FSDataOutputStream

B.DataOutputStream

C.DFSOutputStream

D.FSDataInputStreamSecondaryNamenode的作用是()。監(jiān)控Namenode

B.管理Datanode

C.合并fsimage和editlogs

D.支持NamenodeHA為銷售報(bào)表展示開發(fā)一個MapReduce作業(yè),Mapper輸入數(shù)據(jù)的Key是年份(IntWritable),Value表示商品標(biāo)識(Text)。下列哪一項(xiàng)決定該Mapper的數(shù)據(jù)類型()。A.JobConf.setMapInputKeyClass與JobConf.setMapInputValuesClass

B.HADOOP_MAP_DATATYPES環(huán)境變量

C.隨作業(yè)一起提交的mapper-specification.xml文件

D.InputFormat格式類二、多選題(10題,每題2分,共20分)下列關(guān)于hadoop集群啟動中的所有進(jìn)程及其作用,正確的有?()A.Namenode管理集群,記錄namenode文件信息B.Secondname可以做備份,對一定范圍內(nèi)的數(shù)據(jù)做快照C.Datanode存儲數(shù)據(jù)D.Jobtarcker管理任務(wù),分配任務(wù)YARN作為Hadoop的資源管理器,它的引入為集群帶來了哪些好處?()A.主備節(jié)點(diǎn)協(xié)調(diào)機(jī)制B.資源利用率高C.運(yùn)維成本降低D.數(shù)據(jù)共享方便關(guān)于“zookeeper”在Hadoop集群中的作用,下列描述正確的有?()管理跨節(jié)點(diǎn)配置

B.實(shí)現(xiàn)可靠的消息傳遞

C.實(shí)現(xiàn)冗余服務(wù)

D.異步流程執(zhí)行下面哪些是“MapReduce的”計(jì)劃的主要配置參數(shù)?()A.在分布式文件系統(tǒng)作業(yè)的輸入位置

B.輸入格式

C.包含“map”功能類

D.包含“reduce”功能類下面對HBase的描述哪些是正確的?()A.不是開源的B.是面向列的C.是分布式的D.是一種NoSQL數(shù)據(jù)庫MapReduce與HBase的關(guān)系,哪些描述是正確的?()A.兩者不可或缺,MapReduce是HBase可以正常運(yùn)行的保證B.兩者不是強(qiáng)關(guān)聯(lián)關(guān)系,沒有MapReduce,HBase可以正常運(yùn)行C.MapReduce可以直接訪問HBaseD.它們之間沒有任何關(guān)系下面哪些選項(xiàng)正確描述了HBase的特性?()A.高可靠性B.高性能C.面向列D.可伸縮以下哪些是HDFS的守護(hù)進(jìn)程?()secondarynamenode

B.datanode

C.mrappmaster/yarnchild

D.namenode以下描述錯誤的是?()A.輸入分片InputSplit其實(shí)是對數(shù)據(jù)的引用B.MultipleInputs可以設(shè)置多個數(shù)據(jù)源以及它們對應(yīng)的輸入格式C.可以通過重載isSplitable()方法來避免文件分片D.ReduceTask需要等到所有的map輸出都復(fù)制完才進(jìn)行Merge以下描述正確的是?()A.SequenceFile可以用來作為小文件的合并存儲容器B.TextInputFormat的key是LongWritable類型的C.CombineFileInputFormat是抽象類D.TextInputFormat的key是指該記錄在文件中的行號三、判斷題(10題,每題2分,共20分)1.Hadoop是Java開發(fā)的,所以MapReduce只支持Java語言編寫。()2.NameNode負(fù)責(zé)管理metadata,client端每次讀寫請求,它都會從磁盤中讀取或則會寫入metadata信息并反饋client端。()3.Yarn只能支持MapReduce框架。()4.NameNode本地磁盤保存了Block的位置信息。()5.Hadoop默認(rèn)調(diào)度器策略為FIFO。()6.HDFSClient寫入文件時,Client會隨機(jī)選取本機(jī)架的DataNode存儲。()7.HDFS采用多副本機(jī)制,數(shù)據(jù)的讀寫操作都遵從就近原則。()8.HDFS適用于高吞吐量的實(shí)時數(shù)據(jù)讀取()9.因?yàn)镠DFS有多個副本,所以NameNode是不存在單點(diǎn)問題的。()10.Mapreduce的inputsplit就是一個block。()四、簡答題(4題,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論