（新版）《hadoop基礎(chǔ)練習(xí)》考試（重點(diǎn)）題庫300題（含答案）

上傳人：r*** IP屬地：山東上傳時(shí)間：2025-11-28 格式：DOCX 頁數(shù)：88 大?。?9.43KB 積分：15 舉報(bào) 版權(quán)申訴

（新版）《hadoop基礎(chǔ)練習(xí)》考試（重點(diǎn)）題庫300題（含答案）_第2頁

（新版）《hadoop基礎(chǔ)練習(xí)》考試（重點(diǎn)）題庫300題（含答案）_第3頁

（新版）《hadoop基礎(chǔ)練習(xí)》考試（重點(diǎn)）題庫300題（含答案）_第4頁

（新版）《hadoop基礎(chǔ)練習(xí)》考試（重點(diǎn)）題庫300題（含答案）_第5頁

已閱讀5頁，還剩83頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE1一、單選題1.Hive查詢語言和SQL的一個(gè)不同之處在于（）操作A、GroupbyB、JoinC、PartitionD、Union答案：C2.在Python中，一個(gè)事務(wù)是一個(gè)不可分割的工作單位，事務(wù)中包括的諸操作要么都做，要么都不做說的是事務(wù)的哪個(gè)特性？A、持久性B、隔離性C、一致性D、原子性答案：D3.以下哪一項(xiàng)不屬于Hadoop可以運(yùn)行的模式（）A、單機(jī)（本地）模式B、偽分布式C、互聯(lián)網(wǎng)模式D、分布式模式答案：C4.寫入數(shù)據(jù)到HDFS的Sink組件是（）。A、HiveSinkB、HBaseSinkC、HDFSSinkD、HadoopSink答案：C5.在Hadoop配置文件中，以下屬于core-site.xml文件主要內(nèi)容的是（）A、用于定義系統(tǒng)級(jí)別的參數(shù)，如HDFSURL、Hadoop的臨時(shí)目錄等。B、名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)的存放位置、文件副本的個(gè)數(shù)文件讀取權(quán)限等。C、配置ResourceManager，NodeManager的通信端口，web監(jiān)控端口等。D、包括JobHistoryServer和應(yīng)用程序參數(shù)兩部分，如reduce任務(wù)的默認(rèn)個(gè)數(shù)、任務(wù)所能夠使用內(nèi)存的默認(rèn)上下限等。答案：A6.下面哪個(gè)不屬于YARN的架構(gòu)的組成部分？A、JobTrackerB、ResourceManagerC、NodeManagerD、ApplicationMaster答案：A7.下列選項(xiàng)中不是大數(shù)據(jù)計(jì)算體系的基本層次的一項(xiàng)為______。A、數(shù)據(jù)應(yīng)用系統(tǒng)B、數(shù)據(jù)開發(fā)系統(tǒng)C、數(shù)據(jù)處理系統(tǒng)D、數(shù)據(jù)存儲(chǔ)系統(tǒng)答案：B8.關(guān)于Flume的三大組件以下說法正確的是（）。A、channel可以和任意數(shù)量的source和sink鏈接。B、channel只能鏈接單一的source和sink。C、sink在三大組件之間起著橋梁的作用。D、sink從channel消費(fèi)數(shù)據(jù)并將其傳遞給目標(biāo)地，目標(biāo)地只能是hdfs。答案：A9.在Java中，獲取主機(jī)名可以使用下面哪個(gè)方法A、getHostName（）B、getLocalHost（）C、getByName（）D、getHostAddress（）答案：A10.在Java中，線程通過（）方法可以休眠一段時(shí)間，然后恢復(fù)運(yùn)行。A、runB、setProrityC、yieldD、sleep答案：D11.HDFS默認(rèn)備份數(shù)量是多少？（）A、0B、1C、2D、3答案：D12.下列選項(xiàng)中，哪一個(gè)不屬于Zookeeper應(yīng)用？（）A、數(shù)據(jù)發(fā)布和訂閱B、負(fù)載均衡C、配置管理D、數(shù)據(jù)倉庫答案：D13.HDFS退出安全模式使用的命令是？A、hadoopdfsadmin-saftmodewaitB、hadoopdfsadmin-saftmodeleaveC、hadoopdfsadmin-saftmodeenterD、以上都不正確答案：B14.下面有關(guān)NameNode安全模式（safemode）說法錯(cuò)誤的是（）A、namespace處于安全模式時(shí)只能被讀取B、NameNode啟動(dòng)時(shí)自動(dòng)進(jìn)入安全模式C、調(diào)用setSafeMode（）函數(shù)能夠打開或關(guān)閉安全模式D、安全模式下不能夠復(fù)制或刪除文件中的數(shù)據(jù)塊答案：B15.目前，Hadoop的最高版本是哪個(gè)？A、Hadoop3.xB、Hadoop2.xC、Hadoop4.xD、Hadoop1.x答案：A16.HBase是分布式列式存儲(chǔ)系統(tǒng)，記錄按什么集中存放A、列B、列族C、行D、不確定答案：B17.數(shù)據(jù)清洗的方法不包括A、缺失值處理B、B.噪聲數(shù)據(jù)清除C、C.一致性檢查D、D.重復(fù)數(shù)據(jù)記錄處理答案：D18.在Python中，下列表達(dá)式的值為True的是A、5+4＜=2B、2＜5||3>2C、2!=2D、3==2答案：B19.關(guān)閉集群的順序?yàn)椋˙）。①stop-dfs.sh、②stop-yarn.sh、③mr-jobhistory-daemon.shstophistoryserverA、①②③B、②①③C、③②①D、①③②答案：B20.在Java中，一個(gè)Java程序運(yùn)行后，在系統(tǒng)中這個(gè)程序便可以作為一個(gè)A、線程B、進(jìn)程C、進(jìn)程或線程D、不可預(yù)知答案：B21.HBase架構(gòu)的四大組件中，_______HBase集群的主控服務(wù)器。A、ZookeeperB、MasterC、RegionServerD、Client答案：B22.下列關(guān)于HDFS的描述正確的是?A、DataNode通過長連接與NameNode保持通信B、NameNode磁盤元數(shù)據(jù)不保存Block的位置信息C、HDFS集群支持?jǐn)?shù)據(jù)的隨機(jī)讀寫D、如果NameNode宕機(jī),SecondaryNameNode會(huì)接替它使集群繼續(xù)工作答案：B23.在Java中，下面關(guān)于線程優(yōu)先級(jí)的說法中，正確的是A、線程的優(yōu)先級(jí)是不能改變的B、優(yōu)先級(jí)高的線程只是在執(zhí)行時(shí)優(yōu)先的概率比較大，不是一定的C、優(yōu)先級(jí)越高的線程運(yùn)行速度比優(yōu)先級(jí)低的執(zhí)行更快，占用資源更少D、優(yōu)先級(jí)高的線程一定是優(yōu)先執(zhí)行的答案：B24.下面哪一個(gè)不是數(shù)據(jù)集成組件？A、ApacheB、FlumeC、SqoopD、Hbase答案：D25.HDFS默認(rèn)的當(dāng)前工作目錄是/user/$USER，的值需要在哪個(gè)配置文件內(nèi)說明A、mapred-site.xmlB、core-site.xmlC、hdfs-site.xmlD、以上均不是答案：B26.以下情況除哪項(xiàng)發(fā)生時(shí)balancer便會(huì)自動(dòng)退出（）A、集群平衡或者沒有數(shù)據(jù)塊可以移動(dòng)B、在連續(xù)三次迭代中沒有塊移動(dòng)C、與namenode傳輸時(shí)發(fā)生異常D、另一個(gè)balancer在運(yùn)行答案：A27.在Python中，看代碼,說結(jié)果：classSinger:name=""area=""def__init__（self,name,area）:=nameself.area=areasinger1=Singer（"陳奕迅","香港"）print（"歌手：%s\t地區(qū)：%s"%（,singer1.area））singer2=Singer（"張杰","中國"）print（"歌手：%s\t地區(qū)：%s"%（,singer2.area））A、不能運(yùn)行B、歌手：陳奕迅地區(qū)：香港歌手：張杰地區(qū)：中國C、歌手：張杰地區(qū)：中國歌手：陳奕迅地區(qū)：香港D、歌手：陳奕迅地區(qū)：香港歌手：張杰地區(qū)：中國答案：D28.在Linux中，以下代碼哪個(gè)可以獲取arr={1，2，3，4}數(shù)組的長度：A、arr_length=^（#arr[*]）$B、arr_length=${#arr[*]}C、arr_length=（#arr[*]）D、arr_length=arr.length答案：B29.主節(jié)點(diǎn)程序__________。A、NameNodeB、DataNodeC、SecondaryNameNodeD、Jobtracker答案：A30.克隆虛擬機(jī)之后需要修改（）文件。①/etc/udev/rules.d/70-persistent-net.rules、②/ete/sysconfig/network-scriptd/ifcf-eth0、③/etc/sysconfig/networkA、①②B、①②③C、②③D、①③答案：B31.Shufile階段中哪一步是可選的？（）A、排序B、分區(qū)C、分組D、規(guī)約答案：D32.在驅(qū)動(dòng)類中，（）設(shè)置輸入數(shù)據(jù)的格式。A、使用方法setOutputFormatB、使用方法setOutputKeyValueC、使用方法setInputFormatD、使用方法setJarByClass答案：C33.關(guān)于mapreduce框架中一個(gè)作業(yè)的reduce任務(wù)的數(shù)目，下列說法正確的是（）A、由自定義的Partitioner來確定B、是分塊的總數(shù)目一半C、可以由用戶來自定義，通過JobConf.setNumReducetTask（int）來設(shè)定一個(gè)作業(yè)中reduce的任務(wù)數(shù)目D、由MapReduce隨機(jī)確定其數(shù)目答案：C34.如沒有配置hadoop.tmp.dir參數(shù)，此時(shí)系統(tǒng)默認(rèn)的臨時(shí)目錄為（）A、/tmp/hadoop-hadoopB、/usr/hadoop-hadoopC、/usr/local/hadoop-hadoopD、/usr/local/src/hadoop-hadoop答案：A35.OSI網(wǎng)絡(luò)模型有幾層結(jié)構(gòu)？A、六層B、七層C、八層D、九層答案：B36.在Java中，下面的哪一個(gè)關(guān)鍵字通常用來對(duì)對(duì)象的加鎖，從而使得對(duì)對(duì)象的訪問是排他的A、PrivateB、transientC、synchronizedD、static答案：C37.HDFS是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的，具有高容錯(cuò)、高可靠性、高可擴(kuò)展性、高吞吐率等特征，適合的讀寫任務(wù)是?A、一次寫入，少次讀B、多次寫入，少次讀C、多次寫入，多次讀D、一次寫入，多次讀答案：D38.HDFS的是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的，默認(rèn)的最基本的存儲(chǔ)單位是64M，具有高容錯(cuò)、高可靠性、高可擴(kuò)展性、高吞吐率等特征，適合的讀寫任務(wù)是A、一次寫入，少次讀寫B(tài)、多次寫入，少次讀寫C、一次寫入，多次讀寫D、多次寫入，多次讀寫答案：C39.在Java網(wǎng)絡(luò)編程中，下列包含IP地址的類的對(duì)象是A、AppletB、DatagramSocketC、InetAddressD、ServerSocket答案：C40.分片默認(rèn)（）MA、127B、128C、129D、130答案：B41.在Java中，F(xiàn)ile類提供的方法中，哪個(gè)方法可以獲取一個(gè)目錄下所有子文件對(duì)象A、list（）B、getChildren（）C、getFiles（）D、listFiles（）答案：D42.在Hadoop項(xiàng)目結(jié)構(gòu)中，MapReduce指的是什么？A、分布式并行編程模型B、流計(jì)算框架C、Hadoop上的工作流管理系統(tǒng)D、提供分布式協(xié)調(diào)一致性服務(wù)答案：A43.在Python中，下列不屬于Flask的Request對(duì)象的常用屬性的是（）A、formB、argsC、cookiesD、infos答案：D44.HBase與下列哪個(gè)選項(xiàng)屬于同一種類型的數(shù)據(jù)庫（）A、MongoDBB、MariaDBC、MySQLD、Oracle答案：A45.MapReduce基本數(shù)據(jù)類型不包括（）A、BooleanWritableB、ByteWritableC、CharWritableD、IntWritable答案：C46.下列哪一種命令格式是不正確的（）A、get表行健列族B、scan表時(shí)間戳起始行健結(jié)束行健C、alter表列族D、put表行鍵列族:列值答案：B47.HBase架構(gòu)的四大組件中，_______包含訪問HBase的接口。A、ZookeeperB、MasterC、RegionServerD、Client答案：D48.在Job類中對(duì)輸出鍵值對(duì)格式進(jìn)行設(shè)置時(shí)，如果Mapper的輸出格式與Reducer的輸出格式一樣，那么可以省略下列（）設(shè)置。A、job.setOutputKeyClass（）與job.setOutputValueClass（）B、job.setMapOutputKeyClass（）與job.setMapOutputValueClass（）C、job.setReduceOutputKeyClass（）與job.setReduceOutputValueClass（）D、以上都不能省略答案：B49.為銷售報(bào)表展示開發(fā)一個(gè)MapReduce作業(yè)，Mapper輸入數(shù)據(jù)的Key是年份（IntWritable），Value表示商品標(biāo)識(shí)（Text）。下列哪一項(xiàng)決定該Mapper的數(shù)據(jù)類型?A、JobConf.setMapInputKeyClass與JobConf.setMapInputValuesClassB、HADOOP_MAP_DATATYPES環(huán)境變量C、隨作業(yè)一起提交的mapper-specification.xml文件D、InputFormat格式類答案：D50.啟動(dòng)ZooKeeper服務(wù)的命令是什么？A、zk.shB、zkServer-all.shC、zkServer.shD、zkServer.shstart答案：D51.在Linux中，文件測試運(yùn)算符用于檢測Linux文件的各種屬性，以下那個(gè)是檢測文件是否是普通文件A、[-bfile]B、[-ffile]C、[-cfile]D、[-dfile]答案：B52.MapReduce框架提供了一種序列化機(jī)制，支持這種序列化的類能夠在Map和Reduce過程中充當(dāng)鍵或值，以下說法錯(cuò)誤的是？A、實(shí)現(xiàn)Writable接口的類是值B、實(shí)現(xiàn)WritableComparable＜T>接口的類可以是值或鍵C、鍵和值的數(shù)據(jù)類型可以超出Hadoop自身支持的基本類型D、Hadoop的基本類型Text并不實(shí)現(xiàn)WritableComparable＜T>接口答案：D53.在Python中，F(xiàn)lask內(nèi)部自帶的WSGI服務(wù)器的默認(rèn)端口是？（）A、80B、21C、8000D、5000答案：D54.下面關(guān)于Hive的描述錯(cuò)誤的是：A、Hive是一個(gè)構(gòu)建在Hadoop之上的數(shù)據(jù)倉庫工具B、Hive是由Facebook公司開發(fā)的C、Hive在某種程度上可以看作是用戶編程接口，其本身并不存儲(chǔ)和處理數(shù)據(jù)D、Hive定義了簡單的類似SQL的查詢語言--HiveQL，它與大部分SQL語法無法兼容答案：D55.云計(jì)算平臺(tái)層（PaaS）指的是什么？A、操作系統(tǒng)和圍繞特定應(yīng)用的必需的服務(wù)B、將基礎(chǔ)設(shè)施（計(jì)算資源和存儲(chǔ)）作為服務(wù)出租C、從一個(gè)集中的系統(tǒng)部署軟件，使之在一臺(tái)本地計(jì)算機(jī)上（或從云中遠(yuǎn)程地）運(yùn)行的一個(gè)模型D、提供硬件、軟件、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施以及提供咨詢、規(guī)劃和系統(tǒng)集成服務(wù)答案：A56.在Python中，面向?qū)ο笾械奶厥獬蓡T以及應(yīng)用場景描述不正確的是：A、__hash__:判斷hash值是否相等的時(shí)候依賴__hash__方法B、set的去重機(jī)制其實(shí)就是根據(jù)__hash__和__eq__方法實(shí)現(xiàn)的C、__str__：和str（）print（）%s都是息息相關(guān)的，返回值一定是字符串類型D、__str__：和str（）print（）%s都是息息相關(guān)的，返回值不一定是字符串類型答案：D57.在安裝配置好Hadoop集群后，查看Namenode節(jié)點(diǎn)的端口是以下哪個(gè)（）A、50030B、50070C、60010D、60030答案：B58.下列關(guān)于Hadoop和Spark說法錯(cuò)誤的是（）。A、二者都支持流式計(jì)算B、二者都支持批量計(jì)算C、二者都支持機(jī)器學(xué)習(xí)D、二者都支持SQL語句查詢答案：A59.下面對(duì)Shuffle過程Combiner描述正確的是（）A、是將環(huán)形緩沖區(qū)中相同的key的value合并。B、默認(rèn)情況下MapTask階段的環(huán)形緩沖區(qū)就設(shè)置有Combiner可執(zhí)行。C、是在執(zhí)行溢寫之前就執(zhí)行Combiner操作D、Combiner的作用反而降低效率答案：A60.下列描述中，哪項(xiàng)不屬于Sqoop的缺點(diǎn)（）A、無法控制任務(wù)的并發(fā)度B、格式緊耦合C、安全機(jī)制不夠完善D、connector必須符合JDBC模型答案：A61.下列選項(xiàng)中，哪一個(gè)命令不可以用于查看文件內(nèi)容？A、hadoopB、hadoopC、hadoopD、hadoop答案：A62.YARN的調(diào)度器不包括以下哪種？A、FIFOSchedulerB、FairSchedulerC、CapacitySchedulerD、StackScheduler答案：D63.在Linux中，添加新用戶賬號(hào)的命令是（）A、useraddB、usernewC、adduserD、newuser答案：A64.針對(duì)每行數(shù)據(jù)內(nèi)容為”TimestampUrl”的數(shù)據(jù)文件，在用JobConf對(duì)象conf設(shè)置conf.setInputFormat（WhichInputFormat.class）來讀取這個(gè)文件時(shí)，WhichInputFormat應(yīng)該為以下的（）A、TextInputFormatB、KeyValueTextInputFormatC、SequenceFileInputFormatD、NLineInputFormat答案：B65.下面就Zookeeper的配置文件zoo.cfg的一部分，tickTime=2000initLimit=10syncLimit=5，請(qǐng)問initLimit表示的含義是？A、Leader-Follower初始通信時(shí)限B、Leader-Follower同步通信時(shí)限C、Client-Server通信心跳時(shí)間D、Client-Server初始通信時(shí)限答案：A66.在確認(rèn)客戶需求，進(jìn)行確認(rèn)需求調(diào)研的時(shí)候，以下說法正確的是（）。A、．按計(jì)劃有步驟的確定客戶需求調(diào)研。B、先了解細(xì)節(jié)需求，再了解宏觀需求C、將客戶的想法記錄下來，就能解決客戶的實(shí)際問題D、確定客戶需求調(diào)研的過程中，不可避免的會(huì)出現(xiàn)客戶提出一些現(xiàn)有條件下根本無法實(shí)現(xiàn)或者即使實(shí)現(xiàn)也非常困難的要求，我們要無條件去滿足客戶的需求。答案：A67.shuffle環(huán)形內(nèi)存緩沖區(qū)達(dá)到（）溢寫A、60MB、70MC、80MD、90M答案：C68.當(dāng)討論hdfs通信的時(shí)候，通信發(fā)生在以下服務(wù)之間，下列說法正確的是。A、Client-NameNode之間，其中NameNode是客戶端B、Client-DataNode之間，其中DataNode是客戶端C、DataNode-NameNode之間，其中NameNode是服務(wù)端D、DataNode-DataNode之間，其中DataNode都是客戶端答案：C69.以下選項(xiàng)哪個(gè)命令可以生成公鑰（）A、ssh-keygenB、ifupteam0C、nmclidevD、nmcliconsh答案：A70.在Python中，classabc:def__init__（self,age）:self.age=agedef__add__（self,obj）:returnself.age+obj.agea1=abc（18）a2=abc（20）print（a1+a2）閱讀代碼，選擇執(zhí)行結(jié)果：A、38B、1820C、2018D、沒有結(jié)果答案：A71.下面關(guān)于MapReduce模型中Map函數(shù)與Reduce函數(shù)的描述正確的是A、一個(gè)Map函數(shù)就是對(duì)一部分原始數(shù)據(jù)進(jìn)行指定的操作。B、一個(gè)Map操作就是對(duì)每個(gè)Reduce所產(chǎn)生的一部分中間結(jié)果進(jìn)行合并操作。C、Map與Map之間不是相互獨(dú)立的。D、Reducee與Reduce之間不是相互獨(dú)立的。答案：A72.關(guān)于SecondaryNameNode哪項(xiàng)是正確的？A、它對(duì)目的是幫助NameNode合并編輯日志，減少NameNode的負(fù)擔(dān)和冷啟動(dòng)時(shí)的加載時(shí)間B、它是NameNode的熱備C、它對(duì)內(nèi)存沒有要求D、SecondaryNameNode應(yīng)與NameNode部署到一個(gè)節(jié)點(diǎn)答案：A73.哪個(gè)目錄存放用戶密碼信息：A、/bootB、B./etcC、C./varD、D./dev答案：B74.下列選項(xiàng)中那些是Hadoop2.x版本獨(dú)有的進(jìn)程（）A、JobTrackerB、TaskTrackerC、NodeManagerD、NameNode答案：C75.在Python中，關(guān)于execute（）說法正確的是A、只能用來執(zhí)行刪、改語句B、不能用來一次插入多條記錄C、可以用來執(zhí)行插入語句D、只能用來執(zhí)行增、改語句答案：C76.Hadoop安裝在一臺(tái)計(jì)算機(jī)上，需修改相應(yīng)的配置文件，用一臺(tái)計(jì)算機(jī)模擬多臺(tái)主機(jī)的集群是（）模式。A、全分布模式B、偽分布模式C、單機(jī)模式D、全分布HA模式答案：B77.下列數(shù)據(jù)換算正確的一項(xiàng)為（）。A、1YB=1024EBB、1TB=1024MBC、1PB==1024EBD、1024ZB=1EB答案：B78.在Linux下安裝NTP服務(wù)的命令是（）。A、yuminstallntpB、yumremoventpC、yumupdatentpD、yumlist答案：A79.在執(zhí)行MapReduce過程中用哪個(gè)方法提交作業(yè)（）A、Job.addCacheFile（）B、Job.waitForCompletion（）C、Job.setMapperClass（）D、Job.setJarByClass（）答案：B80.下列選項(xiàng)中，哪一個(gè)命令用于刪除文件？A、hadoopB、hadoopC、hadoopD、hadoop答案：B81.HBase的Region組成中，必須要有以下哪一項(xiàng)。A、StoreFileB、HFileC、MetaStoreD、MemStore答案：D82.yarn-site.xml中參數(shù)和解釋不能對(duì)應(yīng)的是（）A、yarn.nodemanager.resource.memory-mb：定義在節(jié)點(diǎn)管理器總的可用資源，以提供給運(yùn)行容器B、yarn.nodemanager.local-dirs:多條存儲(chǔ)路徑可以提高磁盤的讀寫速度C、Yarn.nodemanager.remote-app-log-dir-suffix:匯聚日志的地方，目錄路徑，HDFS系統(tǒng)D、yarn.nodemanager.aux-services:需要設(shè)置的MapReduce的應(yīng)用程序服務(wù)答案：C83.在HBase的組件中,哪一個(gè)負(fù)責(zé)日志記錄（）A、HRegionB、HFileC、MemStoreD、WAL答案：D84.在Java中，非靜態(tài)同步方法的鎖對(duì)象是A、不確定B、thisC、所屬類的類類型D、Object對(duì)象答案：B85.下列關(guān)于使用MapReduce編程模型實(shí)現(xiàn)SQL中的join操作錯(cuò)誤的是？A、ReduceJoin可以實(shí)現(xiàn)內(nèi)鏈接，也能實(shí)現(xiàn)各種外連接B、ReduceJoin的join操作是在MapReduce程序中的reducer階段完成的C、MapJoin不會(huì)產(chǎn)生數(shù)據(jù)傾斜D、MapJoin也適合各種join場景，也能實(shí)現(xiàn)內(nèi)連接和各種外鏈接答案：D86.在Java中，一個(gè)線程如果調(diào)用了sleep（）方法，能喚醒它的方法是A、notify（）B、resume（）C、run（）D、以上都不是，時(shí)間到了會(huì)自動(dòng)繼續(xù)執(zhí)行答案：D87.在Linux中，usermod命令無法實(shí)現(xiàn)的操作是（）A、賬戶重命名B、刪除指定的賬戶和對(duì)應(yīng)的主目錄C、鎖定和解鎖用戶賬戶D、對(duì)用戶密碼進(jìn)行鎖定或解鎖答案：B88.下列關(guān)于zookeeper描述正確的是：A、無論客戶端連接的是哪個(gè)Zookeeper服務(wù)器，其看到的服務(wù)端數(shù)據(jù)模型都是一致的B、從同一個(gè)客戶端發(fā)起的事務(wù)請(qǐng)求，最終將會(huì)嚴(yán)格按照其發(fā)起順序被應(yīng)用到zookeeper中C、在一個(gè)5個(gè)節(jié)點(diǎn)組成的Zookeeper集群中，如果同時(shí)有3臺(tái)機(jī)器宕機(jī)，服務(wù)不受影響D、如果客戶端連接到Zookeeper集群中的那臺(tái)機(jī)器突然宕機(jī)，客戶端會(huì)自動(dòng)切換連接到集群其他機(jī)器答案：A89.以下對(duì)定時(shí)調(diào)度器描述正確的是（）A、定時(shí)調(diào)度器負(fù)責(zé)向應(yīng)用程序分配資源，它負(fù)責(zé)監(jiān)控和應(yīng)用程序的狀態(tài)跟蹤，并且不能夠保證重啟由于應(yīng)用程序本身或硬件出錯(cuò)而執(zhí)行失敗的應(yīng)用程序B、定時(shí)調(diào)度器負(fù)責(zé)向應(yīng)用程序分配資源，它負(fù)責(zé)監(jiān)控和應(yīng)用程序的狀態(tài)跟蹤，并且能夠保證重啟由于應(yīng)用程序本身或硬件出錯(cuò)而執(zhí)行失敗的應(yīng)用程序C、定時(shí)調(diào)度器負(fù)責(zé)向應(yīng)用程序分配資源，它不負(fù)責(zé)監(jiān)控和應(yīng)用程序的狀態(tài)跟蹤，并且不能夠保證重啟由于應(yīng)用程序本身或硬件出錯(cuò)而執(zhí)行失敗的應(yīng)用程序D、定時(shí)調(diào)度器負(fù)責(zé)向應(yīng)用程序分配資源，它不負(fù)責(zé)監(jiān)控和應(yīng)用程序的狀態(tài)跟蹤，并且能夠保證重啟由于應(yīng)用程序本身或硬件出錯(cuò)而執(zhí)行失敗的應(yīng)用程序答案：C90.HBase虛擬分布式模式需要（）個(gè)節(jié)點(diǎn)？A、1B、2C、3D、最少3個(gè)答案：A91.大數(shù)據(jù)存儲(chǔ)是指用存儲(chǔ)器，以（）的形式，存儲(chǔ)采集到數(shù)據(jù)的過程。A、數(shù)據(jù)庫/數(shù)據(jù)倉庫B、集群C、文件系統(tǒng)D、信息系統(tǒng)答案：A92.大數(shù)據(jù)平臺(tái)Hadoop的組件中，提供分布式協(xié)作服務(wù)的組件是（）A、HBaseB、ZooKeeperC、SqoopD、Hive答案：B93.在MapReduce程序中，Reducer類中包括的函數(shù)有（）。A、startup、reduce、endB、setup、reduce、cleanupC、start、run、reduce、endD、startup、run、end答案：B94.在Java中，下面不是單例模式要點(diǎn)的是A、單例類只能一個(gè)人使用。B、單例類必須自行創(chuàng)建唯一的實(shí)例。C、單例類的構(gòu)造方法可以是public的。D、單例模式會(huì)阻止其他對(duì)象實(shí)例化其自己的單例對(duì)象的副本。答案：D95.關(guān)于HDFS的文件寫入，正確的是（）。A、支持多用戶對(duì)同一文件的寫操作B、用戶可以在文件任意位置進(jìn)行修改C、默認(rèn)將文件塊復(fù)制成三份存放D、復(fù)制的文件塊默認(rèn)都存在同一機(jī)架上答案：C96.在Mapper類的setup函數(shù)里，下列（）方式可以用來獲取參數(shù)值。A、Context.get（"argName"）B、Configuration.get（"argName"）C、context.getConfiguration.getInt（"argName"）D、context.getConfiguration.get（"argName"）答案：D97.在Hadoop配置文件中，以下屬于core-site.xml文件主要內(nèi)容的是（）A、用于定義系統(tǒng)級(jí)別的參數(shù)，如HDFSURL、Hadoop的臨時(shí)目錄等。B、名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)的存放位置、文件副本的個(gè)數(shù)、文件讀取權(quán)限等。C、配置ResourceManager，NodeManager的通信端口，web監(jiān)控端口等。D、包括JobHistoryServer和應(yīng)用程序參數(shù)兩部分，如reduce任務(wù)的默認(rèn)個(gè)數(shù)、任務(wù)所能夠使用內(nèi)存的默認(rèn)上下限等。答案：A98.在ZooKeeper中有三種角色，下列選項(xiàng)中不屬于ZooKeeper中的角色（）A、ObserverB、LeaderC、ObeyerD、Follower答案：C99.下列哪項(xiàng)通常是集群的最主要瓶頸A、磁盤B、CPUC、網(wǎng)絡(luò)D、內(nèi)存答案：A100.在Python中，Python程序使用自帶的哪個(gè)模塊操作目錄A、OS模塊B、IO模塊C、file模塊D、dir模塊答案：A101.大數(shù)據(jù)的分布式計(jì)算使用下面哪項(xiàng)技術(shù)？（）A、HDFSB、MapReduceC、NutchD、Hive答案：B102.在Python中，OS模塊返回指定目錄下的所有文件和目錄名的函數(shù)是A、os.remove（）B、os.listdir（）C、os.path.isfile（）D、os.getcwd（）答案：B103.調(diào)用Zookeeper對(duì)象創(chuàng)建的節(jié)點(diǎn)，不包括（）。A、持久節(jié)點(diǎn)B、臨時(shí)節(jié)點(diǎn)C、持久順序節(jié)點(diǎn)D、DataNode節(jié)點(diǎn)答案：D104.HDFS默認(rèn)備份數(shù)量?（）A、0B、1C、2D、3答案：D105.以下關(guān)于QJM原理的描述正確的是。A、節(jié)點(diǎn)一般是由偶數(shù)個(gè)構(gòu)成。B、JouralNode不對(duì)外提供rpc接口。C、每個(gè)JouralNode對(duì)外有一個(gè)簡易的rpc接口。D、當(dāng)寫Editlog時(shí)，NameNode會(huì)向指定節(jié)點(diǎn)寫文件。答案：C106.以下選項(xiàng)哪個(gè)是YARN中動(dòng)態(tài)創(chuàng)建的資源容器（）A、ResourceManagerB、NodeManagerC、ApplicationMasterD、Container答案：D107.HBase來源于哪一項(xiàng)？A、TheGoogleFileSystemB、MapReduceC、BigTableD、Chubby答案：C108.以下哪一項(xiàng)不屬于Hadoop可以運(yùn)行的模式_____。A、單機(jī)（本地）模式B、偽分布式模式C、互聯(lián)模式D、分布式模式答案：C109.在Java中，閱讀下列文件定入的Java代碼，共有（）處錯(cuò)誤＆#x000D;importjava.io.*;＆#x000D;publicclassTestIO{＆#x000D;publicstaticvoidmain（String[]args）{＆#x000D;Stringstr="文件寫入練習(xí)";＆#x000D;FileWriterfw=null;//1＆#x000D;try{＆#x000D;fw=newFileWriter（"c:\mytext.txt"）;//2＆#x000D;fw.writerToEnd（str）;//3＆#x000D;}catch（IOExceptionex）{＆#x000D;ex.printStackTrace（）;＆#x000D;}＆#x000D;}＆#x000D;}A、0B、1C、2D、3答案：C110.下列哪些不是ZooKeeper的特點(diǎn)（）A、順序一致性B、原子性C、多樣系統(tǒng)映像D、可靠性答案：C111.在Linux中，”./”在Linux系統(tǒng)中是什么意思？A、在當(dāng)前目錄中找B、在環(huán)境變量中找C、在PATH中找D、沒有任何意義答案：A112.默認(rèn)端口50070的作用是（）。A、查看HDFS監(jiān)控B、查看YARN監(jiān)控C、查看日志監(jiān)控D、不確定答案：A113.在Linux中，列出所有分區(qū)信息的命令是（）A、fdisk-bB、fdisk-sC、fdisk-lD、fdisk-v答案：C114.大數(shù)據(jù)的4V特征是指?A、數(shù)據(jù)量大（Volume）、類型繁多（Variety）、價(jià)值密度低（Value）、處理速度快（Velocity）B、數(shù)據(jù)量大（Volume）、類型繁多（Variety）、價(jià)值密度低（Value）、技術(shù)發(fā)展速度快（Velocity）C、數(shù)據(jù)量大（Volume）、類型繁多（Variety）、價(jià)值密度高（Value）、數(shù)據(jù)產(chǎn)生速度快（Velocity）D、數(shù)據(jù)量大（Volume）、類型繁多（Variety）、價(jià)值密度低（Value）、數(shù)據(jù)變化速度快（Velocity）答案：A115.在Linux中，將文字內(nèi)容打印到屏幕，使用下面那個(gè)命令A(yù)、echoB、catC、fileD、find答案：A116.在Linux中，查看已啟動(dòng)的服務(wù)列表的命令是A、systemctllist-unit-files|grepenabledB、systemctlis-enabledfirewalldC、systemctldisablefirewalldD、systemctlenablefirewalld答案：A117.在Linux中，查看被掛起的進(jìn)程使用的命令是A、fgB、jobsC、bgD、renice答案：B118.下面哪個(gè)選項(xiàng)中的Daemon總是運(yùn)行在同一臺(tái)主機(jī)上？A、NameNode＆JobTrackerB、SecondaryNameNode＆JobTrackerC、NameNode＆SecondaryNameNodeD、DataNode＆TaskTracker答案：D119.關(guān)于ZooKeeper臨時(shí)節(jié)點(diǎn)的說法正確的是？A、創(chuàng)建臨時(shí)節(jié)點(diǎn)的命令為：create-s/tmpmyvalueB、一旦會(huì)話結(jié)束，臨時(shí)節(jié)點(diǎn)將被自動(dòng)刪除C、臨時(shí)節(jié)點(diǎn)不能手動(dòng)刪除D、臨時(shí)節(jié)點(diǎn)允許有子節(jié)點(diǎn)答案：B120.一個(gè)MapReduce程序中的MapTask的個(gè)數(shù)由（）決定的。A、輸入的總文件數(shù)B、客戶端程序設(shè)置的mapTask的個(gè)數(shù)C、FileInputFormat.getSplits（JobContextjob）計(jì)算出的邏輯切片的數(shù)量D、輸入的總文件大小/數(shù)據(jù)塊大小答案：C二、多選題1.以下哪個(gè)命令不能將普通用戶轉(zhuǎn)換成超級(jí)用戶：A、superB、B.passwdC、C.tarD、D.su答案：ABC2.下列哪一項(xiàng)不屬于Hadoop的特性？A、較低可擴(kuò)展性B、只支持java語言C、成本低D、運(yùn)行在Linux平臺(tái)上答案：AB3.下面說法選項(xiàng)錯(cuò)誤的是（）A、在一個(gè)Agent中,同一個(gè)source可以有多個(gè)channelB、在一個(gè)Agent中,同一個(gè)sink可以有多個(gè)channelC、在一個(gè)Agent中,同一個(gè)source只能多1個(gè)channelD、在一個(gè)Agent中,同一個(gè)sink只能有1個(gè)channel答案：AD4.下列選項(xiàng)哪些是ZooKeeper的應(yīng)用場景？A、Master選舉B、分布式鎖C、數(shù)據(jù)發(fā)布與訂閱D、心跳檢測NameNode答案：ABCD5.HBase官方版本可以安裝在什么操作系統(tǒng)上？A、CentOSB、UbuntuC、RedHatD、Windows答案：ABC6.下列選項(xiàng)中，屬于Hive數(shù)據(jù)模式的是（）。A、表B、分區(qū)C、桶D、外部表答案：ABCD7.在Python中，python中關(guān)于導(dǎo)入模塊或模塊中的函數(shù)以下說法正確的是：【選兩項(xiàng)】A、使用”import模塊名”方式導(dǎo)入模塊。B、使用”from模塊名import函數(shù)名1”方式導(dǎo)入模塊中的函數(shù)。C、使用“import模塊名函數(shù)名1”方式導(dǎo)入模塊或模塊中的函數(shù)。D、使用”import函數(shù)名”方式導(dǎo)入函數(shù)。答案：AB8.Hadoop集群的整體性能主要受到什么因素影響？A、CPU性能B、內(nèi)存C、網(wǎng)絡(luò)D、存儲(chǔ)容量答案：ABCD9.下列關(guān)于RawComparatorClass描述正確的有（）A、Hadoop為序列化提供了優(yōu)化，類型的比較對(duì)M/R而言至關(guān)重要，Key和Key的比較也是在排序階段完成的，hadoop提供了原生的比較器接口RawComparator＜T>用于序列化字節(jié)間的比較。B、允許其實(shí)現(xiàn)直接比較數(shù)據(jù)流中的記錄，無需反序列化為對(duì)象，RawComparator是一個(gè)原生的優(yōu)化接口類，它只是簡單的提供了用于數(shù)據(jù)流中簡單的數(shù)據(jù)對(duì)比方法，從而提供優(yōu)化。C、該類僅有一個(gè)衍生類所實(shí)現(xiàn)D、類似于一個(gè)注冊(cè)表，里面記錄了所有Comparator類的集合，Comparators成員用一張Hash表記錄Key=Class，value=WritableComprator的注冊(cè)信息。答案：ABD10.在Java中，下面哪些選項(xiàng)屬于線程生命周期中的狀態(tài)【選三項(xiàng)】A、阻塞B、運(yùn)行C、冰凍D、新建答案：ABD11.下列關(guān)于SparkStreaming與Storm的描述，哪些是正確的的？A、SparkStreaming無法實(shí)現(xiàn)毫秒級(jí)的流計(jì)算B、Storm可以實(shí)現(xiàn)毫秒級(jí)響應(yīng)件C、Storm無法用于實(shí)時(shí)計(jì)算D、SparkStreaming采用的小批量處理的方式使得它可以同時(shí)兼容批量和實(shí)時(shí)數(shù)據(jù)處理的邏輯和算法答案：ABD12.下列關(guān)于Storm框架，描述正確的有？A、worker:每個(gè)worker進(jìn)程都屬于一個(gè)特定的TopologyB、executor：executor是產(chǎn)生于worker進(jìn)程內(nèi)部的線程C、task:實(shí)際的數(shù)據(jù)處理由task完成D、在Topology的生命周期中，每個(gè)組件的task數(shù)目是不會(huì)發(fā)生變化的，而executor的數(shù)目卻不一定答案：ABCD13.在實(shí)際應(yīng)用中，大數(shù)據(jù)處理主要包括以下哪三個(gè)類型？A、復(fù)雜的批量數(shù)據(jù)處理：通常時(shí)間跨度在數(shù)十分鐘到數(shù)小時(shí)之間B、基于歷史數(shù)據(jù)的交互式查詢：通常時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間C、基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理：通常時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間D、基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理：通常時(shí)間跨度在數(shù)百毫秒到數(shù)秒之間答案：ABD14.SecondaryNameNode的喚醒（wakeup）是根據(jù)控制檢查點(diǎn)的參數(shù)來決定的?？刂茩z查點(diǎn)參數(shù)有兩個(gè)，分別是（）和（）。【選兩項(xiàng)】A、fs.checkpoint.periodB、fs.checkpoint.dirC、fs.checkpoint.sizeD、fsimage答案：AC15.Linux系統(tǒng)的優(yōu)勢有（）【選兩項(xiàng)】A、多用戶多任務(wù)，使用者與群組的規(guī)劃B、穩(wěn)定、高效和安全C、實(shí)時(shí)操作系統(tǒng)D、高游戲支持度答案：AB16.在vi編輯器里，以下哪些是保存退出編輯的命令A(yù)、:wqB、B.:xC、C.:wD、D.:qw答案：AB17.HDFS的命名空間包含什么？A、磁盤B、文件C、塊D、目錄答案：BCD18.輸入egrep-c'（vmx|svm）'/proc/cpuinfo，以下哪些返回值表示支持kvm虛擬化A、0B、B.1C、C.8D、D.16答案：BCD19.傳統(tǒng)關(guān)系型數(shù)據(jù)庫是指對(duì)應(yīng)于一個(gè)關(guān)系模型的所有關(guān)系的集合。下列關(guān)于傳統(tǒng)關(guān)系型數(shù)據(jù)庫的特點(diǎn)描述正確的是（）。A、容易理解B、使用方便C、易于維護(hù)D、支持SQL答案：ABCD20.MapReduce的作業(yè)主要包括什么？A、從磁盤或從網(wǎng)絡(luò)讀取數(shù)據(jù)，即IO密集工作B、計(jì)算數(shù)據(jù)，即CPU密集工作C、針對(duì)不同的工作節(jié)點(diǎn)選擇合適硬件類型D、負(fù)責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲(chǔ)答案：AB21.Cloudera提供哪幾種安裝CDH的方法A、ClouderaB、TarC、YumD、Rpm答案：ABCD解析：：22.在Python中，使用Flask搭建Web項(xiàng)目的方式有哪些？（）【選兩項(xiàng)】A、創(chuàng)建PurePython項(xiàng)目B、創(chuàng)建mvc項(xiàng)目C、創(chuàng)建Flask項(xiàng)目D、創(chuàng)建API項(xiàng)目答案：AC23.Scala具有以下哪幾個(gè)主要特點(diǎn)？A、Scala的優(yōu)勢是提供了REPL（Read-Eval-PrintLoop，交互式解釋器），提高程序開發(fā)效率B、Scala兼容Java，運(yùn)行速度快，且能融合到Hadoop生態(tài)圈中C、Scala具備強(qiáng)大的并發(fā)性，支持函數(shù)式編程D、Scala可以更好地支持分布式系統(tǒng)答案：ABCD24.在Linux中，SSH登錄提供的兩種認(rèn)證方式【選兩項(xiàng)】A、用戶名認(rèn)證B、授權(quán)認(rèn)證C、密碼認(rèn)證D、密鑰認(rèn)證答案：CD25.在Java中，下列說法中正確的有【選三項(xiàng)】A、線程就是程序B、線程是一個(gè)程序的單個(gè)執(zhí)行流C、線程是指一個(gè)程序的多個(gè)執(zhí)行流D、線程用于實(shí)現(xiàn)并發(fā)答案：BCD26.下列哪些是可以用在hdfs上的指令【選三項(xiàng)】A、catB、-getC、-rmD、-put答案：BCD27.在Java中，下面屬于創(chuàng)建型模式的有【選三項(xiàng)】A、工廠模式B、抽象工廠模式C、單例模式D、代理模式答案：ABC28.對(duì)于一個(gè)流計(jì)算系統(tǒng)來說，它應(yīng)達(dá)到以下哪些需求？A、高性能：處理大數(shù)據(jù)的基本要求，如每秒處理幾十萬條數(shù)據(jù)B、實(shí)時(shí)性：保證較低的延遲時(shí)間，達(dá)到秒級(jí)別，甚至是毫秒級(jí)別C、分布式：支持大數(shù)據(jù)的基本架構(gòu)，必須能夠平滑擴(kuò)展D、可靠性：能可靠地處理流數(shù)據(jù)答案：ABCD29.與HadoopMapReduce計(jì)算框架相比，Spark所采用的Executor具有哪些優(yōu)點(diǎn)？A、利用多線程來執(zhí)行具體的任務(wù)，減少任務(wù)的啟動(dòng)開銷B、Executor中有一個(gè)BlockManager存儲(chǔ)模塊，有效減少IO開銷C、提供了一種高度受限的共享內(nèi)存模型D、不同場景之間輸入輸出數(shù)據(jù)能做到無縫共享答案：AB30.YARN的調(diào)度算法包括以下哪些選項(xiàng)？（）A、FIFOSchedulerB、FairSchedulerC、CapacitySchedulerD、StackScheduler答案：ABC31.云計(jì)算的服務(wù)模式和類型主要包括哪三類？A、軟件即服務(wù)（SaaS）B、平臺(tái)即服務(wù)（PaaS）C、基礎(chǔ)設(shè)施即服務(wù)（IaaS）D、數(shù)據(jù)采集即服務(wù)（DaaS）答案：ABC32.HBase構(gòu)建二級(jí)索引的實(shí)現(xiàn)方式有哪些？A、MapReduceB、CoprocessorC、BloomFilterD、Filter答案：AB33.（）是大數(shù)據(jù)運(yùn)用的基礎(chǔ)A、有用的數(shù)據(jù)B、覆蓋率C、隱私問題D、數(shù)據(jù)統(tǒng)計(jì)有效性答案：ABCD34.下列關(guān)于批量計(jì)算和實(shí)時(shí)計(jì)算的說法，正確的有？A、批量計(jì)算：充裕時(shí)間處理靜態(tài)數(shù)據(jù)，如HadoopB、靜態(tài)數(shù)據(jù)不適合采用批量計(jì)算，因?yàn)樗贿m合用傳統(tǒng)的關(guān)系模型建模C、流數(shù)據(jù)必須采用實(shí)時(shí)計(jì)算D、流數(shù)據(jù)的響應(yīng)時(shí)間一般為秒級(jí)，甚至需要毫秒級(jí)答案：ACD35.在Python中，下列哪些運(yùn)算符為成員運(yùn)算符【選兩項(xiàng)】A、isB、isnotC、inD、notin答案：CD36.在Python中，下列屬于python算術(shù)運(yùn)算符的是【選兩項(xiàng)】A、**B、++C、//D、--答案：AC37.大數(shù)據(jù)的兩個(gè)核心技術(shù)是什么？A、分布式存儲(chǔ)B、分布式應(yīng)用C、分布式處理D、集中式存儲(chǔ)答案：AC38.大數(shù)據(jù)關(guān)鍵技術(shù)包括哪些?A、大數(shù)據(jù)預(yù)處理B、大數(shù)據(jù)存儲(chǔ)C、大數(shù)據(jù)采集D、大數(shù)據(jù)分析挖掘答案：ABCD39.云計(jì)算關(guān)鍵技術(shù)包括什么？A、分布式存儲(chǔ)B、虛擬化C、分布式計(jì)算D、多租戶答案：ABCD40.Rowkey設(shè)計(jì)的原則，下列哪些選項(xiàng)的描述是正確的？A、盡量保證越短越好B、可以使用漢字C、可以使用字符串D、本身是無序的答案：ABC41.Linux中重啟系統(tǒng)的命令有（）【選兩項(xiàng)】A、init0B、init1C、shutdown-rnowD、reboot答案：CD42.下列對(duì)應(yīng)解釋正確的有（）A、ByteWritable：單字節(jié)數(shù)值B、FloatWritable：浮點(diǎn)數(shù)C、DoubleWritable：雙字節(jié)數(shù)值D、IntWritable：整型數(shù)答案：ABCD43.以下關(guān)于序列化Writable的說法正確的是？A、反序列化也稱反串行化，它是指將字節(jié)流轉(zhuǎn)回結(jié)構(gòu)化對(duì)象的逆過程。B、Hadoop中使用自己開發(fā)的類：IntWritable、FloatWritable、Text等，都是Writable的實(shí)現(xiàn)類。C、序列化和反序列化在分布式數(shù)據(jù)處理中，主要于進(jìn)程間通信和永久存儲(chǔ)兩個(gè)領(lǐng)域。D、Writable接口是一個(gè)序列化對(duì)象的接口，能夠?qū)?shù)據(jù)寫入流或者從流中讀出。答案：ABCD44.客戶端上傳文件的時(shí)候哪項(xiàng)是正確的？（）A、數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、客戶端端將文件切分為多個(gè)Block，依次上傳C、客戶端只上傳數(shù)據(jù)到一臺(tái)DataNode，然后由NameNode負(fù)責(zé)Block復(fù)制工作D、客戶端發(fā)起文件上傳請(qǐng)求，通過RPC與NameNode建立通訊。答案：BD45.對(duì)reducer基類描述正確的是（）A、獲取map（）方法輸出的中間結(jié)果B、將中間結(jié)果中的Value按照Key劃分組（group），而group按照Key排序，形成了＜key,（collectionofvalues）>的結(jié)構(gòu)，此時(shí)Key是唯一的。C、處理group中的所有Value，相同Key的Value組合。最終Key對(duì)應(yīng)的Value唯一，＜key,value>序?qū)π纬?。D、Reduce不能對(duì)數(shù)據(jù)進(jìn)行合并處理答案：ABC46.以下說法不正確的是（）【選三項(xiàng)】A、因?yàn)镠DFS有多個(gè)副本，所以NameNode是不存在單點(diǎn)問題的。B、Slave節(jié)點(diǎn)要存儲(chǔ)數(shù)據(jù)，所以它的磁盤越大越好。C、BlockSize是可以修改的。D、如果NameNode意外終止，SecondaryNameNode會(huì)接替它使集群繼續(xù)工作。答案：ABD47.信息科技為大數(shù)據(jù)時(shí)代提供哪些技術(shù)支撐？A、存儲(chǔ)設(shè)備容量不斷增加B、網(wǎng)絡(luò)帶寬不斷增加C、CPU處理能力大幅提升D、數(shù)據(jù)量不斷增大答案：ABC48.對(duì)mapper基類描述正確的是（）A、setup（）:對(duì)MapTask進(jìn)行一些預(yù)處理B、map（）:每次接受一個(gè)Key-Value對(duì)并對(duì)其進(jìn)行處理，再分發(fā)處理C、cleanup（）:對(duì)MapTask進(jìn)行一些處理后的工作D、Mapper基類中一般用最常用的是斷言語法答案：ABC49.HDFS架構(gòu)是由哪些組件組成？A、NameNodeB、DataNodeC、ClientD、SecondaryNode答案：ABCD50.HDFS只設(shè)置唯一一個(gè)名稱節(jié)點(diǎn)，這樣做雖然大大簡化了系統(tǒng)設(shè)計(jì)，但也帶來了哪些明顯的局限性？A、命名空間的限制B、性能的瓶頸C、隔離問題D、集群的可用性答案：ABCD51.以下選項(xiàng)中屬于數(shù)據(jù)的作用是（）A、溝通B、驗(yàn)證假設(shè)C、建立信心D、欣賞答案：ABC52.RPC是分布計(jì)算中C/S模型的一個(gè)應(yīng)用實(shí)例，對(duì)于好hadoop而言，它有以下哪些特點(diǎn)（）【選三項(xiàng)】A、重用性，由于hadoop的特點(diǎn)rpc可以一直使用。B、透明性，遠(yuǎn)程調(diào)用其他機(jī)器上的程序，對(duì)用戶來說就像調(diào)用本地的方法一樣C、高性能，rpcserver能夠處理多個(gè)來自client的請(qǐng)求。D、可控性，hadooprpc實(shí)現(xiàn)了自定義的rpc框架。答案：BCD53.GFS中主服務(wù)器節(jié)點(diǎn)存儲(chǔ)的元數(shù)據(jù)包含這些信息（）A、文件副本的位置信息B、命名空間C、Chunk與文件名的映射D、Chunk副本的位置信息答案：BCD54.HDFS副本技術(shù)是分布式計(jì)算的重要組成部分，下列關(guān)于副本技術(shù)描述正確的有（）。A、降低訪問效率B、負(fù)載均衡C、提高系統(tǒng)可靠性D、避免HDFS發(fā)生故障答案：BCD55.對(duì)Rowkey設(shè)計(jì)原則，描述正確的是（）A、盡量保證越短越好B、可以使用漢字C、可以使用字符串D、本身是無序的答案：ABC56.MapReduce集群中的節(jié)點(diǎn)硬件有那些？【選三項(xiàng)】A、光驅(qū)B、主機(jī)C、磁盤D、內(nèi)存答案：BCD57.客戶端上傳文件的時(shí)候哪項(xiàng)是正確的?（）（）A、數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、客戶端端將文件切分為多個(gè)Block,依次上傳C、客戶端只上傳數(shù)據(jù)到一臺(tái)DataNode,然后由NameNode負(fù)責(zé)Block復(fù)制工作D、客戶端發(fā)起文件上傳請(qǐng)求,通過RPC與NameNode建立通訊。答案：BD58.配置Hadoop集群時(shí)，下列哪個(gè)Hadoop配置文件需要進(jìn)行修改？（）（）A、hadoop-env.shB、profileC、core-site.xmlD、ifcfg-eth0答案：AC59.YARN服務(wù)組件包括哪些？【選三項(xiàng)】A、NameManagerB、ApplicationMasteC、ContainerD、ResourceManager答案：BCD60.關(guān)于Hive與傳統(tǒng)關(guān)系數(shù)據(jù)庫的對(duì)比分析，下面描述正確的是：A、在數(shù)據(jù)存儲(chǔ)方面，Hive一般依賴于分布式文件系統(tǒng)HDFS，而傳統(tǒng)數(shù)據(jù)庫則依賴于本地文件系統(tǒng)B、在索引方面，傳統(tǒng)的關(guān)系數(shù)據(jù)庫可以針對(duì)多個(gè)列構(gòu)建復(fù)雜的索引，大幅度提升數(shù)據(jù)查詢性能，而Hive不像傳統(tǒng)的關(guān)系型數(shù)據(jù)庫那樣有鍵的概念，它只能提供有限的索引功能C、在分區(qū)方面，傳統(tǒng)的數(shù)據(jù)庫提供分區(qū)功能來改善大型表以及具有各種訪問模式的表的可伸縮性、可管理性，以及提高數(shù)據(jù)庫效率；Hive不支持分區(qū)功能D、在執(zhí)行引擎方面，傳統(tǒng)的關(guān)系數(shù)據(jù)庫依賴自身的執(zhí)行引擎，而Hive則依賴于MapReduce、Tez和Spark等執(zhí)行引擎答案：ABD61.下列關(guān)于數(shù)據(jù)模型的描述，哪些是正確的？A、HBase采用表來組織數(shù)據(jù)，表由行和列組成，列劃分為若干個(gè)列族B、每個(gè)HBase表都由若干行組成，每個(gè)行由行鍵（rowkey）來標(biāo)識(shí)C、列族里的數(shù)據(jù)通過列限定符（或列）來定位D、每個(gè)單元格都保存著同一份數(shù)據(jù)的多個(gè)版本，這些版本采用時(shí)間戳進(jìn)行索引答案：ABCD62.以下關(guān)于MapReduce缺點(diǎn)描述錯(cuò)誤的有（）。A、不適合實(shí)時(shí)計(jì)算B、不適合流式計(jì)算C、不易于編程D、容錯(cuò)性較差答案：CD63.下面對(duì)Combiner描述正確的是（）A、Combiner的作用提高程序執(zhí)行效率B、Combiner的作用減少對(duì)本地磁盤的訪問次數(shù)。C、Combiner過程設(shè)置則執(zhí)行，否則不執(zhí)行D、以上都不正確答案：ABC64.HDNF的作用是負(fù)責(zé)對(duì)數(shù)據(jù)的分布式儲(chǔ)存，其內(nèi)部對(duì)象包括（）【選三項(xiàng)】A、ClientB、NameNodeC、DataBasesD、SecondaryNameNode答案：ABD65.HDFS文件訪問方式有哪些A、HDFSshellB、JavaAPIC、RESTAPID、thrift實(shí)現(xiàn)的Python、PHP等語言訪問答案：AB66.在Python中，關(guān)于break語句的說法中，以下選項(xiàng)中正確的是【選三項(xiàng)】A、break作為中斷處理語句，只能在while和for循環(huán)結(jié)構(gòu)中。B、通常和條件語句一起執(zhí)行。C、當(dāng)滿足一定條件時(shí)，使程序立即退出當(dāng)前語句結(jié)構(gòu)，轉(zhuǎn)而執(zhí)行該語句結(jié)構(gòu)之后的語句D、當(dāng)滿足一定條件時(shí)，終止本次循環(huán)，跳轉(zhuǎn)至下一次循環(huán)。答案：ABC67.下列選項(xiàng)中，哪些命令可以用于查看文件內(nèi)容？（）A、hadoopfs-ls/hello.txtB、hadoopfs-text/hello.txtC、hadoopfs-cat/hello.txtD、hadoopfs-tail/hello.txt答案：BCD68.文件系統(tǒng)是提供解決“如何在磁盤上組織文件”的一系列方法和數(shù)據(jù)結(jié)構(gòu)。傳統(tǒng)的分布式文件系統(tǒng)在使用的過程中有哪些弊端？A、單機(jī)負(fù)載極高B、數(shù)據(jù)不安全C、文件整理困難D、存儲(chǔ)能力受限答案：ABC69.關(guān)系數(shù)據(jù)庫已經(jīng)無法滿足Web2.0的需求，主要表現(xiàn)在以下幾個(gè)方面？A、無法滿足海量數(shù)據(jù)的管理需求B、無法滿足數(shù)據(jù)高并發(fā)的需求C、無法滿足高可擴(kuò)展性和高可用性的需求D、使用難度高答案：ABC70.關(guān)于mapreduce自定義數(shù)據(jù)類型正確的是（）A、write（）方法實(shí)現(xiàn)反序列化B、readFields（）方法實(shí)現(xiàn)序列化C、write（）序列化屬性順序和readFields（）方法反序列化屬性順序必須一致。D、可以自定義toString（）方法答案：CD71.在Python中，pymysql連接數(shù)據(jù)庫進(jìn)行封裝的好處是？【選三項(xiàng)】A、減少代碼量B、提高可維護(hù)性C、可以減少代碼錯(cuò)誤D、安全答案：ABD72.Cloudera提供哪幾種安裝CDH的方法？A、ClouderamanagerB、TarballC、YumD、Rpm答案：ABCD73.下面哪些概念是Hbase框架中使用的（）A、HDFSB、GridFSC、ZookeeperD、EXT3答案：AC74.下面對(duì)HBase的描述哪些是正確的？A、不是開源的B、是面向列的C、是分布式的D、是一種NoSQL數(shù)據(jù)庫答案：BCD75.數(shù)據(jù)化最早的根基是什么（）A、計(jì)量B、數(shù)字化C、記錄D、阿拉伯?dāng)?shù)字答案：AC76.常用的HDFSAPI有哪些?A、rename（）B、copyFromLocalFile（）C、mkdirs（）D、delete（）答案：ABCD77.下列關(guān)于MapReduce的體系結(jié)構(gòu)的描述，說法正確的有？A、用戶編寫的MapReduce程序通過Client提交到JobTracker端B、JobTracker負(fù)責(zé)資源監(jiān)控和作業(yè)調(diào)度C、TaskTracker監(jiān)控所有TaskTracker與Job的健康狀況D、TaskTracker使用“slot”等量劃分本節(jié)點(diǎn)上的資源量（CPU、內(nèi)存等）答案：ABD78.當(dāng)采用MapReduce作為Hive的執(zhí)行引擎時(shí)，下面描述正確的是：A、當(dāng)用戶向Hive輸入一段命令或查詢（即HiveQL語句）時(shí)，Hive需要與Hadoop交互工作來完成該操作B、命令或查詢首先進(jìn)入到驅(qū)動(dòng)模塊，由驅(qū)動(dòng)模塊中的編譯器進(jìn)行解析編譯，并由優(yōu)化器對(duì)該操作進(jìn)行優(yōu)化計(jì)算，然后交給執(zhí)行器去執(zhí)行C、執(zhí)行器通常的任務(wù)是啟動(dòng)一個(gè)或多個(gè)MapReduce任務(wù)，有時(shí)也不需要啟動(dòng)MapReduce任務(wù)D、執(zhí)行器通常的任務(wù)一定會(huì)包含Map和Reduce操作答案：ABC79.在Python中，Python網(wǎng)絡(luò)框架可以省去開發(fā)者處理網(wǎng)絡(luò)應(yīng)用底層的（）【選三項(xiàng)】A、協(xié)議B、線程C、邏輯D、進(jìn)程答案：ABD80.當(dāng)處理CAP的問題時(shí)，可以有哪幾個(gè)明顯的選擇？A、CA：也就是強(qiáng)調(diào)一致性（C）和可用性（A），放棄分區(qū)容忍性（P）B、CP：也就是強(qiáng)調(diào)一致性（C）和分區(qū)容忍性（P），放棄可用性（A）C、AP：也就是強(qiáng)調(diào)可用性（A）和分區(qū)容忍性（P），放棄一致性（C）D、CAP：也就是同時(shí)兼顧可用性（A）、分區(qū)容忍性（P）和一致性（C），當(dāng)時(shí)系統(tǒng)性能會(huì)下降很多答案：ABC三、判斷題1.Slaves由主機(jī)的列表組成，每臺(tái)1行，用于說明數(shù)據(jù)節(jié)點(diǎn)（）A、正確B、錯(cuò)誤答案：A2.多用戶的情況下，F(xiàn)airScheduler可以最大化集群的吞吐和利用率A、正確B、錯(cuò)誤答案：B3.大數(shù)據(jù)的數(shù)據(jù)類型豐富，包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。A、正確B、錯(cuò)誤答案：A4.Hadoop2.0，F(xiàn)IFOScheduler是YARN中默認(rèn)的資源調(diào)度器A、正確B、錯(cuò)誤答案：B5.Sqoop是hadoop生態(tài)圈上的數(shù)據(jù)傳輸工具A、正確B、錯(cuò)誤答案：A6.Hadoop存在多個(gè)副本，且默認(rèn)備份數(shù)量是3。（）A、正確B、錯(cuò)誤答案：A7.datanode負(fù)責(zé)存儲(chǔ)數(shù)據(jù)A、正確B、錯(cuò)誤答案：A8.NodeManager是每個(gè)節(jié)點(diǎn)上的資源和任務(wù)管理器。（）A、正確B、錯(cuò)誤答案：A9.Hive相比于關(guān)系型數(shù)據(jù)庫，有較低的延遲。A、正確B、錯(cuò)誤答案：B10.安裝Hadoop時(shí)，配置項(xiàng)”dfs.replication”是配置在文件core-site.xmlA、正確B、錯(cuò)誤答案：B11.Windows上可以運(yùn)行Hadoop（）A、正確B、錯(cuò)誤答案：A12.每個(gè)map槽就是一個(gè)線程。（）A、正確B、錯(cuò)誤答案：B13.HDFS的采用了“分而治之”的思想。A、正確B、錯(cuò)誤答案：B14.可以使用Partitioner定義輸出的文件名（）。A、正確B、錯(cuò)誤答案：A15.數(shù)據(jù)的完整性包括數(shù)據(jù)傳輸?shù)耐暾院蛿?shù)據(jù)存儲(chǔ)的完整性。A、正確B、錯(cuò)誤答案：A16.HDFS文件系統(tǒng)上的數(shù)據(jù)是不可以進(jìn)行更改的。A、正確B、錯(cuò)誤答案：A17.Elasticsearch是一個(gè)分布式的開源搜索和分析引擎,適用于所有類型的數(shù)據(jù),包括文本、數(shù)字、地理空間、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。A、正確B、錯(cuò)誤答案：A18.NameNode負(fù)責(zé)管理元數(shù)據(jù)，客戶端每次讀寫請(qǐng)求時(shí)，都會(huì)從磁盤中讀取或?qū)懭朐獢?shù)據(jù)信息并反饋給客戶端。。A、正確B、錯(cuò)誤答案：A19.Hive相比于關(guān)系型數(shù)據(jù)庫，有較低的延遲。（）A、正確B、錯(cuò)誤答案：B20.Slave節(jié)點(diǎn)要存儲(chǔ)數(shù)據(jù)，所以它的磁盤越大越好。（）A、正確B、錯(cuò)誤答案：B21.Map任務(wù)和Reduce任務(wù)都具有數(shù)據(jù)本地化的特性。A、正確B、錯(cuò)誤答案：B22.HDFS的設(shè)計(jì)初衷就是為將來的海量數(shù)據(jù)的分布式計(jì)算做鋪墊的，所以HDFS是一次寫入，多次讀出的場景A、正確B、錯(cuò)誤答案：A23.Jobtracker通常與NameNode在一個(gè)節(jié)點(diǎn)啟動(dòng)。（）A、正確B、錯(cuò)誤答案：A24.NameNode負(fù)責(zé)管理metadata，client端每次讀寫請(qǐng)求，它都會(huì)從磁盤中讀取或則會(huì)寫入metadata信息并反饋client端。（）A、正確B、錯(cuò)誤答案：B25.DataNode是文件存儲(chǔ)的基本單元，它將Block存儲(chǔ)在本地文件系統(tǒng)中。A、正確B、錯(cuò)誤答案：A26.如何從表中導(dǎo)出數(shù)據(jù)？如果數(shù)據(jù)文件恰好是用戶需要的格式，那么只需要簡單地拷貝文件夾或者文件就可以了。A、正確B、錯(cuò)誤答案：A27.Hadoop是Java開發(fā)的，所以MapReduce只支持Java語言編寫。A、正確B、錯(cuò)誤答案：B28.vi編輯器中，編輯文本內(nèi)容后使用:q退出vi編輯器A、正確B、錯(cuò)誤答案：B29.Ganglia不僅可以進(jìn)行監(jiān)控，也可以進(jìn)行告警。（）A、正確B、錯(cuò)誤答案：B30.HDFS為海量的數(shù)據(jù)提供了存儲(chǔ),而MapReduce為海量的數(shù)據(jù)提供了計(jì)算。A、正確B、錯(cuò)誤答案：A31.ClouderaCDH是需要付費(fèi)使用的。（）A、正確B、錯(cuò)誤答案：B32.啟動(dòng)Hadoop集群服務(wù)之前需要格式化文件系統(tǒng)（第一次）A、正確B、錯(cuò)誤答案：A33.Nagios不可以監(jiān)控Hadoop集群，因?yàn)樗惶峁〩adoop支持A、正確B、錯(cuò)誤答案：B34.Zookeeper集群宕機(jī)數(shù)超過集群數(shù)一半，則Zookeeper服務(wù)失效。（）A、正確B、錯(cuò)誤答案：A35.防火墻策略也稱為防火墻的安全規(guī)則，它是防火墻實(shí)施網(wǎng)絡(luò)保護(hù)的重要依據(jù)。A、正確B、錯(cuò)誤答案：A36.ClouderaCDH是需要免費(fèi)使用的。A、正確B、錯(cuò)誤答案：A37.我們?cè)陂_發(fā)分布式計(jì)算job的時(shí)候，可以去掉reduce階段A、正確B、錯(cuò)誤答案：A38.每個(gè)map槽（進(jìn)程）就是一個(gè)線程。A、正確B、錯(cuò)誤答案：B39.job.setReducerClass（TxtReducer.class）;功能是設(shè)置Reduce類（）A、正確B、錯(cuò)誤答案：B40.Hive默認(rèn)不支持動(dòng)態(tài)分區(qū)功能，需要手動(dòng)設(shè)置動(dòng)態(tài)分區(qū)參數(shù)開啟功能。A、正確B、錯(cuò)誤答案：A41.在MapReduce程序中，必須開發(fā)Map和Reduce相應(yīng)的業(yè)務(wù)代碼才能執(zhí)行程序。（）A、正確B、錯(cuò)誤答案：B42.hadoopdfsadmin-report命令用于檢測HDFS損壞塊A、正確B、錯(cuò)誤答案：B43.如果一個(gè)機(jī)架出問題，不會(huì)影響數(shù)據(jù)讀寫A、正確B、錯(cuò)誤答案：A44.在大數(shù)據(jù)框架中,批處理系統(tǒng)一般不適用于對(duì)延時(shí)要示較高的場景A、正確B、錯(cuò)誤答案：A45.Masters同樣是主機(jī)的列表組成，每臺(tái)一行，用于說明第二Namenode服務(wù)器（）A、正確B、錯(cuò)誤答案：A46.combiner合并過程的作用是減少對(duì)本地磁盤的訪問次數(shù)（）。A、正確B、錯(cuò)誤答案：A47.NameNode負(fù)責(zé)管理元數(shù)據(jù)，客戶端每次讀寫請(qǐng)

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

（新版）《hadoop基礎(chǔ)練習(xí)》考試（重點(diǎn)）題庫300題（含答案）

文檔簡介

溫馨提示

最新文檔

評(píng)論

（新版）《hadoop基礎(chǔ)練習(xí)》考試（重點(diǎn)）題庫300題（含答案）

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔