(新版)《hadoop基礎(chǔ)練習(xí)》考試(重點(diǎn))題庫300題(含答案)_第1頁
(新版)《hadoop基礎(chǔ)練習(xí)》考試(重點(diǎn))題庫300題(含答案)_第2頁
(新版)《hadoop基礎(chǔ)練習(xí)》考試(重點(diǎn))題庫300題(含答案)_第3頁
(新版)《hadoop基礎(chǔ)練習(xí)》考試(重點(diǎn))題庫300題(含答案)_第4頁
(新版)《hadoop基礎(chǔ)練習(xí)》考試(重點(diǎn))題庫300題(含答案)_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE1一、單選題1.Hive查詢語言和SQL的一個(gè)不同之處在于()操作A、GroupbyB、JoinC、PartitionD、Union答案:C2.在Python中,一個(gè)事務(wù)是一個(gè)不可分割的工作單位,事務(wù)中包括的諸操作要么都做,要么都不做說的是事務(wù)的哪個(gè)特性?A、持久性B、隔離性C、一致性D、原子性答案:D3.以下哪一項(xiàng)不屬于Hadoop可以運(yùn)行的模式()A、單機(jī)(本地)模式B、偽分布式C、互聯(lián)網(wǎng)模式D、分布式模式答案:C4.寫入數(shù)據(jù)到HDFS的Sink組件是()。A、HiveSinkB、HBaseSinkC、HDFSSinkD、HadoopSink答案:C5.在Hadoop配置文件中,以下屬于core-site.xml文件主要內(nèi)容的是()A、用于定義系統(tǒng)級(jí)別的參數(shù),如HDFSURL、Hadoop的臨時(shí)目錄等。B、名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)的存放位置、文件副本的個(gè)數(shù)文件讀取權(quán)限等。C、配置ResourceManager,NodeManager的通信端口,web監(jiān)控端口等。D、包括JobHistoryServer和應(yīng)用程序參數(shù)兩部分,如reduce任務(wù)的默認(rèn)個(gè)數(shù)、任務(wù)所能夠使用內(nèi)存的默認(rèn)上下限等。答案:A6.下面哪個(gè)不屬于YARN的架構(gòu)的組成部分?A、JobTrackerB、ResourceManagerC、NodeManagerD、ApplicationMaster答案:A7.下列選項(xiàng)中不是大數(shù)據(jù)計(jì)算體系的基本層次的一項(xiàng)為______。A、數(shù)據(jù)應(yīng)用系統(tǒng)B、數(shù)據(jù)開發(fā)系統(tǒng)C、數(shù)據(jù)處理系統(tǒng)D、數(shù)據(jù)存儲(chǔ)系統(tǒng)答案:B8.關(guān)于Flume的三大組件以下說法正確的是()。A、channel可以和任意數(shù)量的source和sink鏈接。B、channel只能鏈接單一的source和sink。C、sink在三大組件之間起著橋梁的作用。D、sink從channel消費(fèi)數(shù)據(jù)并將其傳遞給目標(biāo)地,目標(biāo)地只能是hdfs。答案:A9.在Java中,獲取主機(jī)名可以使用下面哪個(gè)方法A、getHostName()B、getLocalHost()C、getByName()D、getHostAddress()答案:A10.在Java中,線程通過()方法可以休眠一段時(shí)間,然后恢復(fù)運(yùn)行。A、runB、setProrityC、yieldD、sleep答案:D11.HDFS默認(rèn)備份數(shù)量是多少?()A、0B、1C、2D、3答案:D12.下列選項(xiàng)中,哪一個(gè)不屬于Zookeeper應(yīng)用?()A、數(shù)據(jù)發(fā)布和訂閱B、負(fù)載均衡C、配置管理D、數(shù)據(jù)倉庫答案:D13.HDFS退出安全模式使用的命令是?A、hadoopdfsadmin-saftmodewaitB、hadoopdfsadmin-saftmodeleaveC、hadoopdfsadmin-saftmodeenterD、以上都不正確答案:B14.下面有關(guān)NameNode安全模式(safemode)說法錯(cuò)誤的是()A、namespace處于安全模式時(shí)只能被讀取B、NameNode啟動(dòng)時(shí)自動(dòng)進(jìn)入安全模式C、調(diào)用setSafeMode()函數(shù)能夠打開或關(guān)閉安全模式D、安全模式下不能夠復(fù)制或刪除文件中的數(shù)據(jù)塊答案:B15.目前,Hadoop的最高版本是哪個(gè)?A、Hadoop3.xB、Hadoop2.xC、Hadoop4.xD、Hadoop1.x答案:A16.HBase是分布式列式存儲(chǔ)系統(tǒng),記錄按什么集中存放A、列B、列族C、行D、不確定答案:B17.數(shù)據(jù)清洗的方法不包括A、缺失值處理B、B.噪聲數(shù)據(jù)清除C、C.一致性檢查D、D.重復(fù)數(shù)據(jù)記錄處理答案:D18.在Python中,下列表達(dá)式的值為True的是A、5+4<=2B、2<5||3>2C、2!=2D、3==2答案:B19.關(guān)閉集群的順序?yàn)椋˙)。①stop-dfs.sh、②stop-yarn.sh、③mr-jobhistory-daemon.shstophistoryserverA、①②③B、②①③C、③②①D、①③②答案:B20.在Java中,一個(gè)Java程序運(yùn)行后,在系統(tǒng)中這個(gè)程序便可以作為一個(gè)A、線程B、進(jìn)程C、進(jìn)程或線程D、不可預(yù)知答案:B21.HBase架構(gòu)的四大組件中,_______HBase集群的主控服務(wù)器。A、ZookeeperB、MasterC、RegionServerD、Client答案:B22.下列關(guān)于HDFS的描述正確的是?A、DataNode通過長連接與NameNode保持通信B、NameNode磁盤元數(shù)據(jù)不保存Block的位置信息C、HDFS集群支持?jǐn)?shù)據(jù)的隨機(jī)讀寫D、如果NameNode宕機(jī),SecondaryNameNode會(huì)接替它使集群繼續(xù)工作答案:B23.在Java中,下面關(guān)于線程優(yōu)先級(jí)的說法中,正確的是A、線程的優(yōu)先級(jí)是不能改變的B、優(yōu)先級(jí)高的線程只是在執(zhí)行時(shí)優(yōu)先的概率比較大,不是一定的C、優(yōu)先級(jí)越高的線程運(yùn)行速度比優(yōu)先級(jí)低的執(zhí)行更快,占用資源更少D、優(yōu)先級(jí)高的線程一定是優(yōu)先執(zhí)行的答案:B24.下面哪一個(gè)不是數(shù)據(jù)集成組件?A、ApacheB、FlumeC、SqoopD、Hbase答案:D25.HDFS默認(rèn)的當(dāng)前工作目錄是/user/$USER,的值需要在哪個(gè)配置文件內(nèi)說明A、mapred-site.xmlB、core-site.xmlC、hdfs-site.xmlD、以上均不是答案:B26.以下情況除哪項(xiàng)發(fā)生時(shí)balancer便會(huì)自動(dòng)退出()A、集群平衡或者沒有數(shù)據(jù)塊可以移動(dòng)B、在連續(xù)三次迭代中沒有塊移動(dòng)C、與namenode傳輸時(shí)發(fā)生異常D、另一個(gè)balancer在運(yùn)行答案:A27.在Python中,看代碼,說結(jié)果:classSinger:name=""area=""def__init__(self,name,area):=nameself.area=areasinger1=Singer("陳奕迅","香港")print("歌手:%s\t地區(qū):%s"%(,singer1.area))singer2=Singer("張杰","中國")print("歌手:%s\t地區(qū):%s"%(,singer2.area))A、不能運(yùn)行B、歌手:陳奕迅地區(qū):香港歌手:張杰地區(qū):中國C、歌手:張杰地區(qū):中國歌手:陳奕迅地區(qū):香港D、歌手:陳奕迅地區(qū):香港歌手:張杰地區(qū):中國答案:D28.在Linux中,以下代碼哪個(gè)可以獲取arr={1,2,3,4}數(shù)組的長度:A、arr_length=^(#arr[*])$B、arr_length=${#arr[*]}C、arr_length=(#arr[*])D、arr_length=arr.length答案:B29.主節(jié)點(diǎn)程序__________。A、NameNodeB、DataNodeC、SecondaryNameNodeD、Jobtracker答案:A30.克隆虛擬機(jī)之后需要修改()文件。①/etc/udev/rules.d/70-persistent-net.rules、②/ete/sysconfig/network-scriptd/ifcf-eth0、③/etc/sysconfig/networkA、①②B、①②③C、②③D、①③答案:B31.Shufile階段中哪一步是可選的?()A、排序B、分區(qū)C、分組D、規(guī)約答案:D32.在驅(qū)動(dòng)類中,()設(shè)置輸入數(shù)據(jù)的格式。A、使用方法setOutputFormatB、使用方法setOutputKeyValueC、使用方法setInputFormatD、使用方法setJarByClass答案:C33.關(guān)于mapreduce框架中一個(gè)作業(yè)的reduce任務(wù)的數(shù)目,下列說法正確的是()A、由自定義的Partitioner來確定B、是分塊的總數(shù)目一半C、可以由用戶來自定義,通過JobConf.setNumReducetTask(int)來設(shè)定一個(gè)作業(yè)中reduce的任務(wù)數(shù)目D、由MapReduce隨機(jī)確定其數(shù)目答案:C34.如沒有配置hadoop.tmp.dir參數(shù),此時(shí)系統(tǒng)默認(rèn)的臨時(shí)目錄為()A、/tmp/hadoop-hadoopB、/usr/hadoop-hadoopC、/usr/local/hadoop-hadoopD、/usr/local/src/hadoop-hadoop答案:A35.OSI網(wǎng)絡(luò)模型有幾層結(jié)構(gòu)?A、六層B、七層C、八層D、九層答案:B36.在Java中,下面的哪一個(gè)關(guān)鍵字通常用來對(duì)對(duì)象的加鎖,從而使得對(duì)對(duì)象的訪問是排他的A、PrivateB、transientC、synchronizedD、static答案:C37.HDFS是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,具有高容錯(cuò)、高可靠性、高可擴(kuò)展性、高吞吐率等特征,適合的讀寫任務(wù)是?A、一次寫入,少次讀B、多次寫入,少次讀C、多次寫入,多次讀D、一次寫入,多次讀答案:D38.HDFS的是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,默認(rèn)的最基本的存儲(chǔ)單位是64M,具有高容錯(cuò)、高可靠性、高可擴(kuò)展性、高吞吐率等特征,適合的讀寫任務(wù)是A、一次寫入,少次讀寫B(tài)、多次寫入,少次讀寫C、一次寫入,多次讀寫D、多次寫入,多次讀寫答案:C39.在Java網(wǎng)絡(luò)編程中,下列包含IP地址的類的對(duì)象是A、AppletB、DatagramSocketC、InetAddressD、ServerSocket答案:C40.分片默認(rèn)()MA、127B、128C、129D、130答案:B41.在Java中,F(xiàn)ile類提供的方法中,哪個(gè)方法可以獲取一個(gè)目錄下所有子文件對(duì)象A、list()B、getChildren()C、getFiles()D、listFiles()答案:D42.在Hadoop項(xiàng)目結(jié)構(gòu)中,MapReduce指的是什么?A、分布式并行編程模型B、流計(jì)算框架C、Hadoop上的工作流管理系統(tǒng)D、提供分布式協(xié)調(diào)一致性服務(wù)答案:A43.在Python中,下列不屬于Flask的Request對(duì)象的常用屬性的是()A、formB、argsC、cookiesD、infos答案:D44.HBase與下列哪個(gè)選項(xiàng)屬于同一種類型的數(shù)據(jù)庫()A、MongoDBB、MariaDBC、MySQLD、Oracle答案:A45.MapReduce基本數(shù)據(jù)類型不包括()A、BooleanWritableB、ByteWritableC、CharWritableD、IntWritable答案:C46.下列哪一種命令格式是不正確的()A、get表行健列族B、scan表時(shí)間戳起始行健結(jié)束行健C、alter表列族D、put表行鍵列族:列值答案:B47.HBase架構(gòu)的四大組件中,_______包含訪問HBase的接口。A、ZookeeperB、MasterC、RegionServerD、Client答案:D48.在Job類中對(duì)輸出鍵值對(duì)格式進(jìn)行設(shè)置時(shí),如果Mapper的輸出格式與Reducer的輸出格式一樣,那么可以省略下列()設(shè)置。A、job.setOutputKeyClass()與job.setOutputValueClass()B、job.setMapOutputKeyClass()與job.setMapOutputValueClass()C、job.setReduceOutputKeyClass()與job.setReduceOutputValueClass()D、以上都不能省略答案:B49.為銷售報(bào)表展示開發(fā)一個(gè)MapReduce作業(yè),Mapper輸入數(shù)據(jù)的Key是年份(IntWritable),Value表示商品標(biāo)識(shí)(Text)。下列哪一項(xiàng)決定該Mapper的數(shù)據(jù)類型?A、JobConf.setMapInputKeyClass與JobConf.setMapInputValuesClassB、HADOOP_MAP_DATATYPES環(huán)境變量C、隨作業(yè)一起提交的mapper-specification.xml文件D、InputFormat格式類答案:D50.啟動(dòng)ZooKeeper服務(wù)的命令是什么?A、zk.shB、zkServer-all.shC、zkServer.shD、zkServer.shstart答案:D51.在Linux中,文件測試運(yùn)算符用于檢測Linux文件的各種屬性,以下那個(gè)是檢測文件是否是普通文件A、[-bfile]B、[-ffile]C、[-cfile]D、[-dfile]答案:B52.MapReduce框架提供了一種序列化機(jī)制,支持這種序列化的類能夠在Map和Reduce過程中充當(dāng)鍵或值,以下說法錯(cuò)誤的是?A、實(shí)現(xiàn)Writable接口的類是值B、實(shí)現(xiàn)WritableComparable<T>接口的類可以是值或鍵C、鍵和值的數(shù)據(jù)類型可以超出Hadoop自身支持的基本類型D、Hadoop的基本類型Text并不實(shí)現(xiàn)WritableComparable<T>接口答案:D53.在Python中,F(xiàn)lask內(nèi)部自帶的WSGI服務(wù)器的默認(rèn)端口是?()A、80B、21C、8000D、5000答案:D54.下面關(guān)于Hive的描述錯(cuò)誤的是:A、Hive是一個(gè)構(gòu)建在Hadoop之上的數(shù)據(jù)倉庫工具B、Hive是由Facebook公司開發(fā)的C、Hive在某種程度上可以看作是用戶編程接口,其本身并不存儲(chǔ)和處理數(shù)據(jù)D、Hive定義了簡單的類似SQL的查詢語言--HiveQL,它與大部分SQL語法無法兼容答案:D55.云計(jì)算平臺(tái)層(PaaS)指的是什么?A、操作系統(tǒng)和圍繞特定應(yīng)用的必需的服務(wù)B、將基礎(chǔ)設(shè)施(計(jì)算資源和存儲(chǔ))作為服務(wù)出租C、從一個(gè)集中的系統(tǒng)部署軟件,使之在一臺(tái)本地計(jì)算機(jī)上(或從云中遠(yuǎn)程地)運(yùn)行的一個(gè)模型D、提供硬件、軟件、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施以及提供咨詢、規(guī)劃和系統(tǒng)集成服務(wù)答案:A56.在Python中,面向?qū)ο笾械奶厥獬蓡T以及應(yīng)用場景描述不正確的是:A、__hash__:判斷hash值是否相等的時(shí)候依賴__hash__方法B、set的去重機(jī)制其實(shí)就是根據(jù)__hash__和__eq__方法實(shí)現(xiàn)的C、__str__:和str()print()%s都是息息相關(guān)的,返回值一定是字符串類型D、__str__:和str()print()%s都是息息相關(guān)的,返回值不一定是字符串類型答案:D57.在安裝配置好Hadoop集群后,查看Namenode節(jié)點(diǎn)的端口是以下哪個(gè)()A、50030B、50070C、60010D、60030答案:B58.下列關(guān)于Hadoop和Spark說法錯(cuò)誤的是()。A、二者都支持流式計(jì)算B、二者都支持批量計(jì)算C、二者都支持機(jī)器學(xué)習(xí)D、二者都支持SQL語句查詢答案:A59.下面對(duì)Shuffle過程Combiner描述正確的是()A、是將環(huán)形緩沖區(qū)中相同的key的value合并。B、默認(rèn)情況下MapTask階段的環(huán)形緩沖區(qū)就設(shè)置有Combiner可執(zhí)行。C、是在執(zhí)行溢寫之前就執(zhí)行Combiner操作D、Combiner的作用反而降低效率答案:A60.下列描述中,哪項(xiàng)不屬于Sqoop的缺點(diǎn)()A、無法控制任務(wù)的并發(fā)度B、格式緊耦合C、安全機(jī)制不夠完善D、connector必須符合JDBC模型答案:A61.下列選項(xiàng)中,哪一個(gè)命令不可以用于查看文件內(nèi)容?A、hadoopB、hadoopC、hadoopD、hadoop答案:A62.YARN的調(diào)度器不包括以下哪種?A、FIFOSchedulerB、FairSchedulerC、CapacitySchedulerD、StackScheduler答案:D63.在Linux中,添加新用戶賬號(hào)的命令是()A、useraddB、usernewC、adduserD、newuser答案:A64.針對(duì)每行數(shù)據(jù)內(nèi)容為”TimestampUrl”的數(shù)據(jù)文件,在用JobConf對(duì)象conf設(shè)置conf.setInputFormat(WhichInputFormat.class)來讀取這個(gè)文件時(shí),WhichInputFormat應(yīng)該為以下的()A、TextInputFormatB、KeyValueTextInputFormatC、SequenceFileInputFormatD、NLineInputFormat答案:B65.下面就Zookeeper的配置文件zoo.cfg的一部分,tickTime=2000initLimit=10syncLimit=5,請(qǐng)問initLimit表示的含義是?A、Leader-Follower初始通信時(shí)限B、Leader-Follower同步通信時(shí)限C、Client-Server通信心跳時(shí)間D、Client-Server初始通信時(shí)限答案:A66.在確認(rèn)客戶需求,進(jìn)行確認(rèn)需求調(diào)研的時(shí)候,以下說法正確的是()。A、.按計(jì)劃有步驟的確定客戶需求調(diào)研。B、先了解細(xì)節(jié)需求,再了解宏觀需求C、將客戶的想法記錄下來,就能解決客戶的實(shí)際問題D、確定客戶需求調(diào)研的過程中,不可避免的會(huì)出現(xiàn)客戶提出一些現(xiàn)有條件下根本無法實(shí)現(xiàn)或者即使實(shí)現(xiàn)也非常困難的要求,我們要無條件去滿足客戶的需求。答案:A67.shuffle環(huán)形內(nèi)存緩沖區(qū)達(dá)到()溢寫A、60MB、70MC、80MD、90M答案:C68.當(dāng)討論hdfs通信的時(shí)候,通信發(fā)生在以下服務(wù)之間,下列說法正確的是。A、Client-NameNode之間,其中NameNode是客戶端B、Client-DataNode之間,其中DataNode是客戶端C、DataNode-NameNode之間,其中NameNode是服務(wù)端D、DataNode-DataNode之間,其中DataNode都是客戶端答案:C69.以下選項(xiàng)哪個(gè)命令可以生成公鑰()A、ssh-keygenB、ifupteam0C、nmclidevD、nmcliconsh答案:A70.在Python中,classabc:def__init__(self,age):self.age=agedef__add__(self,obj):returnself.age+obj.agea1=abc(18)a2=abc(20)print(a1+a2)閱讀代碼,選擇執(zhí)行結(jié)果:A、38B、1820C、2018D、沒有結(jié)果答案:A71.下面關(guān)于MapReduce模型中Map函數(shù)與Reduce函數(shù)的描述正確的是A、一個(gè)Map函數(shù)就是對(duì)一部分原始數(shù)據(jù)進(jìn)行指定的操作。B、一個(gè)Map操作就是對(duì)每個(gè)Reduce所產(chǎn)生的一部分中間結(jié)果進(jìn)行合并操作。C、Map與Map之間不是相互獨(dú)立的。D、Reducee與Reduce之間不是相互獨(dú)立的。答案:A72.關(guān)于SecondaryNameNode哪項(xiàng)是正確的?A、它對(duì)目的是幫助NameNode合并編輯日志,減少NameNode的負(fù)擔(dān)和冷啟動(dòng)時(shí)的加載時(shí)間B、它是NameNode的熱備C、它對(duì)內(nèi)存沒有要求D、SecondaryNameNode應(yīng)與NameNode部署到一個(gè)節(jié)點(diǎn)答案:A73.哪個(gè)目錄存放用戶密碼信息:A、/bootB、B./etcC、C./varD、D./dev答案:B74.下列選項(xiàng)中那些是Hadoop2.x版本獨(dú)有的進(jìn)程()A、JobTrackerB、TaskTrackerC、NodeManagerD、NameNode答案:C75.在Python中,關(guān)于execute()說法正確的是A、只能用來執(zhí)行刪、改語句B、不能用來一次插入多條記錄C、可以用來執(zhí)行插入語句D、只能用來執(zhí)行增、改語句答案:C76.Hadoop安裝在一臺(tái)計(jì)算機(jī)上,需修改相應(yīng)的配置文件,用一臺(tái)計(jì)算機(jī)模擬多臺(tái)主機(jī)的集群是()模式。A、全分布模式B、偽分布模式C、單機(jī)模式D、全分布HA模式答案:B77.下列數(shù)據(jù)換算正確的一項(xiàng)為()。A、1YB=1024EBB、1TB=1024MBC、1PB==1024EBD、1024ZB=1EB答案:B78.在Linux下安裝NTP服務(wù)的命令是()。A、yuminstallntpB、yumremoventpC、yumupdatentpD、yumlist答案:A79.在執(zhí)行MapReduce過程中用哪個(gè)方法提交作業(yè)()A、Job.addCacheFile()B、Job.waitForCompletion()C、Job.setMapperClass()D、Job.setJarByClass()答案:B80.下列選項(xiàng)中,哪一個(gè)命令用于刪除文件?A、hadoopB、hadoopC、hadoopD、hadoop答案:B81.HBase的Region組成中,必須要有以下哪一項(xiàng)。A、StoreFileB、HFileC、MetaStoreD、MemStore答案:D82.yarn-site.xml中參數(shù)和解釋不能對(duì)應(yīng)的是()A、yarn.nodemanager.resource.memory-mb:定義在節(jié)點(diǎn)管理器總的可用資源,以提供給運(yùn)行容器B、yarn.nodemanager.local-dirs:多條存儲(chǔ)路徑可以提高磁盤的讀寫速度C、Yarn.nodemanager.remote-app-log-dir-suffix:匯聚日志的地方,目錄路徑,HDFS系統(tǒng)D、yarn.nodemanager.aux-services:需要設(shè)置的MapReduce的應(yīng)用程序服務(wù)答案:C83.在HBase的組件中,哪一個(gè)負(fù)責(zé)日志記錄()A、HRegionB、HFileC、MemStoreD、WAL答案:D84.在Java中,非靜態(tài)同步方法的鎖對(duì)象是A、不確定B、thisC、所屬類的類類型D、Object對(duì)象答案:B85.下列關(guān)于使用MapReduce編程模型實(shí)現(xiàn)SQL中的join操作錯(cuò)誤的是?A、ReduceJoin可以實(shí)現(xiàn)內(nèi)鏈接,也能實(shí)現(xiàn)各種外連接B、ReduceJoin的join操作是在MapReduce程序中的reducer階段完成的C、MapJoin不會(huì)產(chǎn)生數(shù)據(jù)傾斜D、MapJoin也適合各種join場景,也能實(shí)現(xiàn)內(nèi)連接和各種外鏈接答案:D86.在Java中,一個(gè)線程如果調(diào)用了sleep()方法,能喚醒它的方法是A、notify()B、resume()C、run()D、以上都不是,時(shí)間到了會(huì)自動(dòng)繼續(xù)執(zhí)行答案:D87.在Linux中,usermod命令無法實(shí)現(xiàn)的操作是()A、賬戶重命名B、刪除指定的賬戶和對(duì)應(yīng)的主目錄C、鎖定和解鎖用戶賬戶D、對(duì)用戶密碼進(jìn)行鎖定或解鎖答案:B88.下列關(guān)于zookeeper描述正確的是:A、無論客戶端連接的是哪個(gè)Zookeeper服務(wù)器,其看到的服務(wù)端數(shù)據(jù)模型都是一致的B、從同一個(gè)客戶端發(fā)起的事務(wù)請(qǐng)求,最終將會(huì)嚴(yán)格按照其發(fā)起順序被應(yīng)用到zookeeper中C、在一個(gè)5個(gè)節(jié)點(diǎn)組成的Zookeeper集群中,如果同時(shí)有3臺(tái)機(jī)器宕機(jī),服務(wù)不受影響D、如果客戶端連接到Zookeeper集群中的那臺(tái)機(jī)器突然宕機(jī),客戶端會(huì)自動(dòng)切換連接到集群其他機(jī)器答案:A89.以下對(duì)定時(shí)調(diào)度器描述正確的是()A、定時(shí)調(diào)度器負(fù)責(zé)向應(yīng)用程序分配資源,它負(fù)責(zé)監(jiān)控和應(yīng)用程序的狀態(tài)跟蹤,并且不能夠保證重啟由于應(yīng)用程序本身或硬件出錯(cuò)而執(zhí)行失敗的應(yīng)用程序B、定時(shí)調(diào)度器負(fù)責(zé)向應(yīng)用程序分配資源,它負(fù)責(zé)監(jiān)控和應(yīng)用程序的狀態(tài)跟蹤,并且能夠保證重啟由于應(yīng)用程序本身或硬件出錯(cuò)而執(zhí)行失敗的應(yīng)用程序C、定時(shí)調(diào)度器負(fù)責(zé)向應(yīng)用程序分配資源,它不負(fù)責(zé)監(jiān)控和應(yīng)用程序的狀態(tài)跟蹤,并且不能夠保證重啟由于應(yīng)用程序本身或硬件出錯(cuò)而執(zhí)行失敗的應(yīng)用程序D、定時(shí)調(diào)度器負(fù)責(zé)向應(yīng)用程序分配資源,它不負(fù)責(zé)監(jiān)控和應(yīng)用程序的狀態(tài)跟蹤,并且能夠保證重啟由于應(yīng)用程序本身或硬件出錯(cuò)而執(zhí)行失敗的應(yīng)用程序答案:C90.HBase虛擬分布式模式需要()個(gè)節(jié)點(diǎn)?A、1B、2C、3D、最少3個(gè)答案:A91.大數(shù)據(jù)存儲(chǔ)是指用存儲(chǔ)器,以()的形式,存儲(chǔ)采集到數(shù)據(jù)的過程。A、數(shù)據(jù)庫/數(shù)據(jù)倉庫B、集群C、文件系統(tǒng)D、信息系統(tǒng)答案:A92.大數(shù)據(jù)平臺(tái)Hadoop的組件中,提供分布式協(xié)作服務(wù)的組件是()A、HBaseB、ZooKeeperC、SqoopD、Hive答案:B93.在MapReduce程序中,Reducer類中包括的函數(shù)有()。A、startup、reduce、endB、setup、reduce、cleanupC、start、run、reduce、endD、startup、run、end答案:B94.在Java中,下面不是單例模式要點(diǎn)的是A、單例類只能一個(gè)人使用。B、單例類必須自行創(chuàng)建唯一的實(shí)例。C、單例類的構(gòu)造方法可以是public的。D、單例模式會(huì)阻止其他對(duì)象實(shí)例化其自己的單例對(duì)象的副本。答案:D95.關(guān)于HDFS的文件寫入,正確的是()。A、支持多用戶對(duì)同一文件的寫操作B、用戶可以在文件任意位置進(jìn)行修改C、默認(rèn)將文件塊復(fù)制成三份存放D、復(fù)制的文件塊默認(rèn)都存在同一機(jī)架上答案:C96.在Mapper類的setup函數(shù)里,下列()方式可以用來獲取參數(shù)值。A、Context.get("argName")B、Configuration.get("argName")C、context.getConfiguration.getInt("argName")D、context.getConfiguration.get("argName")答案:D97.在Hadoop配置文件中,以下屬于core-site.xml文件主要內(nèi)容的是()A、用于定義系統(tǒng)級(jí)別的參數(shù),如HDFSURL、Hadoop的臨時(shí)目錄等。B、名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)的存放位置、文件副本的個(gè)數(shù)、文件讀取權(quán)限等。C、配置ResourceManager,NodeManager的通信端口,web監(jiān)控端口等。D、包括JobHistoryServer和應(yīng)用程序參數(shù)兩部分,如reduce任務(wù)的默認(rèn)個(gè)數(shù)、任務(wù)所能夠使用內(nèi)存的默認(rèn)上下限等。答案:A98.在ZooKeeper中有三種角色,下列選項(xiàng)中不屬于ZooKeeper中的角色()A、ObserverB、LeaderC、ObeyerD、Follower答案:C99.下列哪項(xiàng)通常是集群的最主要瓶頸A、磁盤B、CPUC、網(wǎng)絡(luò)D、內(nèi)存答案:A100.在Python中,Python程序使用自帶的哪個(gè)模塊操作目錄A、OS模塊B、IO模塊C、file模塊D、dir模塊答案:A101.大數(shù)據(jù)的分布式計(jì)算使用下面哪項(xiàng)技術(shù)?()A、HDFSB、MapReduceC、NutchD、Hive答案:B102.在Python中,OS模塊返回指定目錄下的所有文件和目錄名的函數(shù)是A、os.remove()B、os.listdir()C、os.path.isfile()D、os.getcwd()答案:B103.調(diào)用Zookeeper對(duì)象創(chuàng)建的節(jié)點(diǎn),不包括()。A、持久節(jié)點(diǎn)B、臨時(shí)節(jié)點(diǎn)C、持久順序節(jié)點(diǎn)D、DataNode節(jié)點(diǎn)答案:D104.HDFS默認(rèn)備份數(shù)量?()A、0B、1C、2D、3答案:D105.以下關(guān)于QJM原理的描述正確的是。A、節(jié)點(diǎn)一般是由偶數(shù)個(gè)構(gòu)成。B、JouralNode不對(duì)外提供rpc接口。C、每個(gè)JouralNode對(duì)外有一個(gè)簡易的rpc接口。D、當(dāng)寫Editlog時(shí),NameNode會(huì)向指定節(jié)點(diǎn)寫文件。答案:C106.以下選項(xiàng)哪個(gè)是YARN中動(dòng)態(tài)創(chuàng)建的資源容器()A、ResourceManagerB、NodeManagerC、ApplicationMasterD、Container答案:D107.HBase來源于哪一項(xiàng)?A、TheGoogleFileSystemB、MapReduceC、BigTableD、Chubby答案:C108.以下哪一項(xiàng)不屬于Hadoop可以運(yùn)行的模式_____。A、單機(jī)(本地)模式B、偽分布式模式C、互聯(lián)模式D、分布式模式答案:C109.在Java中,閱讀下列文件定入的Java代碼,共有()處錯(cuò)誤
importjava.io.*;
publicclassTestIO{
publicstaticvoidmain(String[]args){
Stringstr="文件寫入練習(xí)";
FileWriterfw=null;//1
try{
fw=newFileWriter("c:\mytext.txt");//2
fw.writerToEnd(str);//3
}catch(IOExceptionex){
ex.printStackTrace();
}
}
}A、0B、1C、2D、3答案:C110.下列哪些不是ZooKeeper的特點(diǎn)()A、順序一致性B、原子性C、多樣系統(tǒng)映像D、可靠性答案:C111.在Linux中,”./”在Linux系統(tǒng)中是什么意思?A、在當(dāng)前目錄中找B、在環(huán)境變量中找C、在PATH中找D、沒有任何意義答案:A112.默認(rèn)端口50070的作用是()。A、查看HDFS監(jiān)控B、查看YARN監(jiān)控C、查看日志監(jiān)控D、不確定答案:A113.在Linux中,列出所有分區(qū)信息的命令是()A、fdisk-bB、fdisk-sC、fdisk-lD、fdisk-v答案:C114.大數(shù)據(jù)的4V特征是指?A、數(shù)據(jù)量大(Volume)、類型繁多(Variety)、價(jià)值密度低(Value)、處理速度快(Velocity)B、數(shù)據(jù)量大(Volume)、類型繁多(Variety)、價(jià)值密度低(Value)、技術(shù)發(fā)展速度快(Velocity)C、數(shù)據(jù)量大(Volume)、類型繁多(Variety)、價(jià)值密度高(Value)、數(shù)據(jù)產(chǎn)生速度快(Velocity)D、數(shù)據(jù)量大(Volume)、類型繁多(Variety)、價(jià)值密度低(Value)、數(shù)據(jù)變化速度快(Velocity)答案:A115.在Linux中,將文字內(nèi)容打印到屏幕,使用下面那個(gè)命令A(yù)、echoB、catC、fileD、find答案:A116.在Linux中,查看已啟動(dòng)的服務(wù)列表的命令是A、systemctllist-unit-files|grepenabledB、systemctlis-enabledfirewalldC、systemctldisablefirewalldD、systemctlenablefirewalld答案:A117.在Linux中,查看被掛起的進(jìn)程使用的命令是A、fgB、jobsC、bgD、renice答案:B118.下面哪個(gè)選項(xiàng)中的Daemon總是運(yùn)行在同一臺(tái)主機(jī)上?A、NameNode&JobTrackerB、SecondaryNameNode&JobTrackerC、NameNode&SecondaryNameNodeD、DataNode&TaskTracker答案:D119.關(guān)于ZooKeeper臨時(shí)節(jié)點(diǎn)的說法正確的是?A、創(chuàng)建臨時(shí)節(jié)點(diǎn)的命令為:create-s/tmpmyvalueB、一旦會(huì)話結(jié)束,臨時(shí)節(jié)點(diǎn)將被自動(dòng)刪除C、臨時(shí)節(jié)點(diǎn)不能手動(dòng)刪除D、臨時(shí)節(jié)點(diǎn)允許有子節(jié)點(diǎn)答案:B120.一個(gè)MapReduce程序中的MapTask的個(gè)數(shù)由()決定的。A、輸入的總文件數(shù)B、客戶端程序設(shè)置的mapTask的個(gè)數(shù)C、FileInputFormat.getSplits(JobContextjob)計(jì)算出的邏輯切片的數(shù)量D、輸入的總文件大小/數(shù)據(jù)塊大小答案:C二、多選題1.以下哪個(gè)命令不能將普通用戶轉(zhuǎn)換成超級(jí)用戶:A、superB、B.passwdC、C.tarD、D.su答案:ABC2.下列哪一項(xiàng)不屬于Hadoop的特性?A、較低可擴(kuò)展性B、只支持java語言C、成本低D、運(yùn)行在Linux平臺(tái)上答案:AB3.下面說法選項(xiàng)錯(cuò)誤的是()A、在一個(gè)Agent中,同一個(gè)source可以有多個(gè)channelB、在一個(gè)Agent中,同一個(gè)sink可以有多個(gè)channelC、在一個(gè)Agent中,同一個(gè)source只能多1個(gè)channelD、在一個(gè)Agent中,同一個(gè)sink只能有1個(gè)channel答案:AD4.下列選項(xiàng)哪些是ZooKeeper的應(yīng)用場景?A、Master選舉B、分布式鎖C、數(shù)據(jù)發(fā)布與訂閱D、心跳檢測NameNode答案:ABCD5.HBase官方版本可以安裝在什么操作系統(tǒng)上?A、CentOSB、UbuntuC、RedHatD、Windows答案:ABC6.下列選項(xiàng)中,屬于Hive數(shù)據(jù)模式的是()。A、表B、分區(qū)C、桶D、外部表答案:ABCD7.在Python中,python中關(guān)于導(dǎo)入模塊或模塊中的函數(shù)以下說法正確的是:【選兩項(xiàng)】A、使用”import模塊名”方式導(dǎo)入模塊。B、使用”from模塊名import函數(shù)名1”方式導(dǎo)入模塊中的函數(shù)。C、使用“import模塊名函數(shù)名1”方式導(dǎo)入模塊或模塊中的函數(shù)。D、使用”import函數(shù)名”方式導(dǎo)入函數(shù)。答案:AB8.Hadoop集群的整體性能主要受到什么因素影響?A、CPU性能B、內(nèi)存C、網(wǎng)絡(luò)D、存儲(chǔ)容量答案:ABCD9.下列關(guān)于RawComparatorClass描述正確的有()A、Hadoop為序列化提供了優(yōu)化,類型的比較對(duì)M/R而言至關(guān)重要,Key和Key的比較也是在排序階段完成的,hadoop提供了原生的比較器接口RawComparator<T>用于序列化字節(jié)間的比較。B、允許其實(shí)現(xiàn)直接比較數(shù)據(jù)流中的記錄,無需反序列化為對(duì)象,RawComparator是一個(gè)原生的優(yōu)化接口類,它只是簡單的提供了用于數(shù)據(jù)流中簡單的數(shù)據(jù)對(duì)比方法,從而提供優(yōu)化。C、該類僅有一個(gè)衍生類所實(shí)現(xiàn)D、類似于一個(gè)注冊(cè)表,里面記錄了所有Comparator類的集合,Comparators成員用一張Hash表記錄Key=Class,value=WritableComprator的注冊(cè)信息。答案:ABD10.在Java中,下面哪些選項(xiàng)屬于線程生命周期中的狀態(tài)【選三項(xiàng)】A、阻塞B、運(yùn)行C、冰凍D、新建答案:ABD11.下列關(guān)于SparkStreaming與Storm的描述,哪些是正確的的?A、SparkStreaming無法實(shí)現(xiàn)毫秒級(jí)的流計(jì)算B、Storm可以實(shí)現(xiàn)毫秒級(jí)響應(yīng)件C、Storm無法用于實(shí)時(shí)計(jì)算D、SparkStreaming采用的小批量處理的方式使得它可以同時(shí)兼容批量和實(shí)時(shí)數(shù)據(jù)處理的邏輯和算法答案:ABD12.下列關(guān)于Storm框架,描述正確的有?A、worker:每個(gè)worker進(jìn)程都屬于一個(gè)特定的TopologyB、executor:executor是產(chǎn)生于worker進(jìn)程內(nèi)部的線程C、task:實(shí)際的數(shù)據(jù)處理由task完成D、在Topology的生命周期中,每個(gè)組件的task數(shù)目是不會(huì)發(fā)生變化的,而executor的數(shù)目卻不一定答案:ABCD13.在實(shí)際應(yīng)用中,大數(shù)據(jù)處理主要包括以下哪三個(gè)類型?A、復(fù)雜的批量數(shù)據(jù)處理:通常時(shí)間跨度在數(shù)十分鐘到數(shù)小時(shí)之間B、基于歷史數(shù)據(jù)的交互式查詢:通常時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間C、基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理:通常時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間D、基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理:通常時(shí)間跨度在數(shù)百毫秒到數(shù)秒之間答案:ABD14.SecondaryNameNode的喚醒(wakeup)是根據(jù)控制檢查點(diǎn)的參數(shù)來決定的??刂茩z查點(diǎn)參數(shù)有兩個(gè),分別是()和()。【選兩項(xiàng)】A、fs.checkpoint.periodB、fs.checkpoint.dirC、fs.checkpoint.sizeD、fsimage答案:AC15.Linux系統(tǒng)的優(yōu)勢有()【選兩項(xiàng)】A、多用戶多任務(wù),使用者與群組的規(guī)劃B、穩(wěn)定、高效和安全C、實(shí)時(shí)操作系統(tǒng)D、高游戲支持度答案:AB16.在vi編輯器里,以下哪些是保存退出編輯的命令A(yù)、:wqB、B.:xC、C.:wD、D.:qw答案:AB17.HDFS的命名空間包含什么?A、磁盤B、文件C、塊D、目錄答案:BCD18.輸入egrep-c'(vmx|svm)'/proc/cpuinfo,以下哪些返回值表示支持kvm虛擬化A、0B、B.1C、C.8D、D.16答案:BCD19.傳統(tǒng)關(guān)系型數(shù)據(jù)庫是指對(duì)應(yīng)于一個(gè)關(guān)系模型的所有關(guān)系的集合。下列關(guān)于傳統(tǒng)關(guān)系型數(shù)據(jù)庫的特點(diǎn)描述正確的是()。A、容易理解B、使用方便C、易于維護(hù)D、支持SQL答案:ABCD20.MapReduce的作業(yè)主要包括什么?A、從磁盤或從網(wǎng)絡(luò)讀取數(shù)據(jù),即IO密集工作B、計(jì)算數(shù)據(jù),即CPU密集工作C、針對(duì)不同的工作節(jié)點(diǎn)選擇合適硬件類型D、負(fù)責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲(chǔ)答案:AB21.Cloudera提供哪幾種安裝CDH的方法A、ClouderaB、TarC、YumD、Rpm答案:ABCD解析::22.在Python中,使用Flask搭建Web項(xiàng)目的方式有哪些?()【選兩項(xiàng)】A、創(chuàng)建PurePython項(xiàng)目B、創(chuàng)建mvc項(xiàng)目C、創(chuàng)建Flask項(xiàng)目D、創(chuàng)建API項(xiàng)目答案:AC23.Scala具有以下哪幾個(gè)主要特點(diǎn)?A、Scala的優(yōu)勢是提供了REPL(Read-Eval-PrintLoop,交互式解釋器),提高程序開發(fā)效率B、Scala兼容Java,運(yùn)行速度快,且能融合到Hadoop生態(tài)圈中C、Scala具備強(qiáng)大的并發(fā)性,支持函數(shù)式編程D、Scala可以更好地支持分布式系統(tǒng)答案:ABCD24.在Linux中,SSH登錄提供的兩種認(rèn)證方式【選兩項(xiàng)】A、用戶名認(rèn)證B、授權(quán)認(rèn)證C、密碼認(rèn)證D、密鑰認(rèn)證答案:CD25.在Java中,下列說法中正確的有【選三項(xiàng)】A、線程就是程序B、線程是一個(gè)程序的單個(gè)執(zhí)行流C、線程是指一個(gè)程序的多個(gè)執(zhí)行流D、線程用于實(shí)現(xiàn)并發(fā)答案:BCD26.下列哪些是可以用在hdfs上的指令【選三項(xiàng)】A、catB、-getC、-rmD、-put答案:BCD27.在Java中,下面屬于創(chuàng)建型模式的有【選三項(xiàng)】A、工廠模式B、抽象工廠模式C、單例模式D、代理模式答案:ABC28.對(duì)于一個(gè)流計(jì)算系統(tǒng)來說,它應(yīng)達(dá)到以下哪些需求?A、高性能:處理大數(shù)據(jù)的基本要求,如每秒處理幾十萬條數(shù)據(jù)B、實(shí)時(shí)性:保證較低的延遲時(shí)間,達(dá)到秒級(jí)別,甚至是毫秒級(jí)別C、分布式:支持大數(shù)據(jù)的基本架構(gòu),必須能夠平滑擴(kuò)展D、可靠性:能可靠地處理流數(shù)據(jù)答案:ABCD29.與HadoopMapReduce計(jì)算框架相比,Spark所采用的Executor具有哪些優(yōu)點(diǎn)?A、利用多線程來執(zhí)行具體的任務(wù),減少任務(wù)的啟動(dòng)開銷B、Executor中有一個(gè)BlockManager存儲(chǔ)模塊,有效減少IO開銷C、提供了一種高度受限的共享內(nèi)存模型D、不同場景之間輸入輸出數(shù)據(jù)能做到無縫共享答案:AB30.YARN的調(diào)度算法包括以下哪些選項(xiàng)?()A、FIFOSchedulerB、FairSchedulerC、CapacitySchedulerD、StackScheduler答案:ABC31.云計(jì)算的服務(wù)模式和類型主要包括哪三類?A、軟件即服務(wù)(SaaS)B、平臺(tái)即服務(wù)(PaaS)C、基礎(chǔ)設(shè)施即服務(wù)(IaaS)D、數(shù)據(jù)采集即服務(wù)(DaaS)答案:ABC32.HBase構(gòu)建二級(jí)索引的實(shí)現(xiàn)方式有哪些?A、MapReduceB、CoprocessorC、BloomFilterD、Filter答案:AB33.()是大數(shù)據(jù)運(yùn)用的基礎(chǔ)A、有用的數(shù)據(jù)B、覆蓋率C、隱私問題D、數(shù)據(jù)統(tǒng)計(jì)有效性答案:ABCD34.下列關(guān)于批量計(jì)算和實(shí)時(shí)計(jì)算的說法,正確的有?A、批量計(jì)算:充裕時(shí)間處理靜態(tài)數(shù)據(jù),如HadoopB、靜態(tài)數(shù)據(jù)不適合采用批量計(jì)算,因?yàn)樗贿m合用傳統(tǒng)的關(guān)系模型建模C、流數(shù)據(jù)必須采用實(shí)時(shí)計(jì)算D、流數(shù)據(jù)的響應(yīng)時(shí)間一般為秒級(jí),甚至需要毫秒級(jí)答案:ACD35.在Python中,下列哪些運(yùn)算符為成員運(yùn)算符【選兩項(xiàng)】A、isB、isnotC、inD、notin答案:CD36.在Python中,下列屬于python算術(shù)運(yùn)算符的是【選兩項(xiàng)】A、**B、++C、//D、--答案:AC37.大數(shù)據(jù)的兩個(gè)核心技術(shù)是什么?A、分布式存儲(chǔ)B、分布式應(yīng)用C、分布式處理D、集中式存儲(chǔ)答案:AC38.大數(shù)據(jù)關(guān)鍵技術(shù)包括哪些?A、大數(shù)據(jù)預(yù)處理B、大數(shù)據(jù)存儲(chǔ)C、大數(shù)據(jù)采集D、大數(shù)據(jù)分析挖掘答案:ABCD39.云計(jì)算關(guān)鍵技術(shù)包括什么?A、分布式存儲(chǔ)B、虛擬化C、分布式計(jì)算D、多租戶答案:ABCD40.Rowkey設(shè)計(jì)的原則,下列哪些選項(xiàng)的描述是正確的?A、盡量保證越短越好B、可以使用漢字C、可以使用字符串D、本身是無序的答案:ABC41.Linux中重啟系統(tǒng)的命令有()【選兩項(xiàng)】A、init0B、init1C、shutdown-rnowD、reboot答案:CD42.下列對(duì)應(yīng)解釋正確的有()A、ByteWritable:單字節(jié)數(shù)值B、FloatWritable:浮點(diǎn)數(shù)C、DoubleWritable:雙字節(jié)數(shù)值D、IntWritable:整型數(shù)答案:ABCD43.以下關(guān)于序列化Writable的說法正確的是?A、反序列化也稱反串行化,它是指將字節(jié)流轉(zhuǎn)回結(jié)構(gòu)化對(duì)象的逆過程。B、Hadoop中使用自己開發(fā)的類:IntWritable、FloatWritable、Text等,都是Writable的實(shí)現(xiàn)類。C、序列化和反序列化在分布式數(shù)據(jù)處理中,主要于進(jìn)程間通信和永久存儲(chǔ)兩個(gè)領(lǐng)域。D、Writable接口是一個(gè)序列化對(duì)象的接口,能夠?qū)?shù)據(jù)寫入流或者從流中讀出。答案:ABCD44.客戶端上傳文件的時(shí)候哪項(xiàng)是正確的?()A、數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、客戶端端將文件切分為多個(gè)Block,依次上傳C、客戶端只上傳數(shù)據(jù)到一臺(tái)DataNode,然后由NameNode負(fù)責(zé)Block復(fù)制工作D、客戶端發(fā)起文件上傳請(qǐng)求,通過RPC與NameNode建立通訊。答案:BD45.對(duì)reducer基類描述正確的是()A、獲取map()方法輸出的中間結(jié)果B、將中間結(jié)果中的Value按照Key劃分組(group),而group按照Key排序,形成了<key,(collectionofvalues)>的結(jié)構(gòu),此時(shí)Key是唯一的。C、處理group中的所有Value,相同Key的Value組合。最終Key對(duì)應(yīng)的Value唯一,<key,value>序?qū)π纬?。D、Reduce不能對(duì)數(shù)據(jù)進(jìn)行合并處理答案:ABC46.以下說法不正確的是()【選三項(xiàng)】A、因?yàn)镠DFS有多個(gè)副本,所以NameNode是不存在單點(diǎn)問題的。B、Slave節(jié)點(diǎn)要存儲(chǔ)數(shù)據(jù),所以它的磁盤越大越好。C、BlockSize是可以修改的。D、如果NameNode意外終止,SecondaryNameNode會(huì)接替它使集群繼續(xù)工作。答案:ABD47.信息科技為大數(shù)據(jù)時(shí)代提供哪些技術(shù)支撐?A、存儲(chǔ)設(shè)備容量不斷增加B、網(wǎng)絡(luò)帶寬不斷增加C、CPU處理能力大幅提升D、數(shù)據(jù)量不斷增大答案:ABC48.對(duì)mapper基類描述正確的是()A、setup():對(duì)MapTask進(jìn)行一些預(yù)處理B、map():每次接受一個(gè)Key-Value對(duì)并對(duì)其進(jìn)行處理,再分發(fā)處理C、cleanup():對(duì)MapTask進(jìn)行一些處理后的工作D、Mapper基類中一般用最常用的是斷言語法答案:ABC49.HDFS架構(gòu)是由哪些組件組成?A、NameNodeB、DataNodeC、ClientD、SecondaryNode答案:ABCD50.HDFS只設(shè)置唯一一個(gè)名稱節(jié)點(diǎn),這樣做雖然大大簡化了系統(tǒng)設(shè)計(jì),但也帶來了哪些明顯的局限性?A、命名空間的限制B、性能的瓶頸C、隔離問題D、集群的可用性答案:ABCD51.以下選項(xiàng)中屬于數(shù)據(jù)的作用是()A、溝通B、驗(yàn)證假設(shè)C、建立信心D、欣賞答案:ABC52.RPC是分布計(jì)算中C/S模型的一個(gè)應(yīng)用實(shí)例,對(duì)于好hadoop而言,它有以下哪些特點(diǎn)()【選三項(xiàng)】A、重用性,由于hadoop的特點(diǎn)rpc可以一直使用。B、透明性,遠(yuǎn)程調(diào)用其他機(jī)器上的程序,對(duì)用戶來說就像調(diào)用本地的方法一樣C、高性能,rpcserver能夠處理多個(gè)來自client的請(qǐng)求。D、可控性,hadooprpc實(shí)現(xiàn)了自定義的rpc框架。答案:BCD53.GFS中主服務(wù)器節(jié)點(diǎn)存儲(chǔ)的元數(shù)據(jù)包含這些信息()A、文件副本的位置信息B、命名空間C、Chunk與文件名的映射D、Chunk副本的位置信息答案:BCD54.HDFS副本技術(shù)是分布式計(jì)算的重要組成部分,下列關(guān)于副本技術(shù)描述正確的有()。A、降低訪問效率B、負(fù)載均衡C、提高系統(tǒng)可靠性D、避免HDFS發(fā)生故障答案:BCD55.對(duì)Rowkey設(shè)計(jì)原則,描述正確的是()A、盡量保證越短越好B、可以使用漢字C、可以使用字符串D、本身是無序的答案:ABC56.MapReduce集群中的節(jié)點(diǎn)硬件有那些?【選三項(xiàng)】A、光驅(qū)B、主機(jī)C、磁盤D、內(nèi)存答案:BCD57.客戶端上傳文件的時(shí)候哪項(xiàng)是正確的?()()A、數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、客戶端端將文件切分為多個(gè)Block,依次上傳C、客戶端只上傳數(shù)據(jù)到一臺(tái)DataNode,然后由NameNode負(fù)責(zé)Block復(fù)制工作D、客戶端發(fā)起文件上傳請(qǐng)求,通過RPC與NameNode建立通訊。答案:BD58.配置Hadoop集群時(shí),下列哪個(gè)Hadoop配置文件需要進(jìn)行修改?()()A、hadoop-env.shB、profileC、core-site.xmlD、ifcfg-eth0答案:AC59.YARN服務(wù)組件包括哪些?【選三項(xiàng)】A、NameManagerB、ApplicationMasteC、ContainerD、ResourceManager答案:BCD60.關(guān)于Hive與傳統(tǒng)關(guān)系數(shù)據(jù)庫的對(duì)比分析,下面描述正確的是:A、在數(shù)據(jù)存儲(chǔ)方面,Hive一般依賴于分布式文件系統(tǒng)HDFS,而傳統(tǒng)數(shù)據(jù)庫則依賴于本地文件系統(tǒng)B、在索引方面,傳統(tǒng)的關(guān)系數(shù)據(jù)庫可以針對(duì)多個(gè)列構(gòu)建復(fù)雜的索引,大幅度提升數(shù)據(jù)查詢性能,而Hive不像傳統(tǒng)的關(guān)系型數(shù)據(jù)庫那樣有鍵的概念,它只能提供有限的索引功能C、在分區(qū)方面,傳統(tǒng)的數(shù)據(jù)庫提供分區(qū)功能來改善大型表以及具有各種訪問模式的表的可伸縮性、可管理性,以及提高數(shù)據(jù)庫效率;Hive不支持分區(qū)功能D、在執(zhí)行引擎方面,傳統(tǒng)的關(guān)系數(shù)據(jù)庫依賴自身的執(zhí)行引擎,而Hive則依賴于MapReduce、Tez和Spark等執(zhí)行引擎答案:ABD61.下列關(guān)于數(shù)據(jù)模型的描述,哪些是正確的?A、HBase采用表來組織數(shù)據(jù),表由行和列組成,列劃分為若干個(gè)列族B、每個(gè)HBase表都由若干行組成,每個(gè)行由行鍵(rowkey)來標(biāo)識(shí)C、列族里的數(shù)據(jù)通過列限定符(或列)來定位D、每個(gè)單元格都保存著同一份數(shù)據(jù)的多個(gè)版本,這些版本采用時(shí)間戳進(jìn)行索引答案:ABCD62.以下關(guān)于MapReduce缺點(diǎn)描述錯(cuò)誤的有()。A、不適合實(shí)時(shí)計(jì)算B、不適合流式計(jì)算C、不易于編程D、容錯(cuò)性較差答案:CD63.下面對(duì)Combiner描述正確的是()A、Combiner的作用提高程序執(zhí)行效率B、Combiner的作用減少對(duì)本地磁盤的訪問次數(shù)。C、Combiner過程設(shè)置則執(zhí)行,否則不執(zhí)行D、以上都不正確答案:ABC64.HDNF的作用是負(fù)責(zé)對(duì)數(shù)據(jù)的分布式儲(chǔ)存,其內(nèi)部對(duì)象包括()【選三項(xiàng)】A、ClientB、NameNodeC、DataBasesD、SecondaryNameNode答案:ABD65.HDFS文件訪問方式有哪些A、HDFSshellB、JavaAPIC、RESTAPID、thrift實(shí)現(xiàn)的Python、PHP等語言訪問答案:AB66.在Python中,關(guān)于break語句的說法中,以下選項(xiàng)中正確的是【選三項(xiàng)】A、break作為中斷處理語句,只能在while和for循環(huán)結(jié)構(gòu)中。B、通常和條件語句一起執(zhí)行。C、當(dāng)滿足一定條件時(shí),使程序立即退出當(dāng)前語句結(jié)構(gòu),轉(zhuǎn)而執(zhí)行該語句結(jié)構(gòu)之后的語句D、當(dāng)滿足一定條件時(shí),終止本次循環(huán),跳轉(zhuǎn)至下一次循環(huán)。答案:ABC67.下列選項(xiàng)中,哪些命令可以用于查看文件內(nèi)容?()A、hadoopfs-ls/hello.txtB、hadoopfs-text/hello.txtC、hadoopfs-cat/hello.txtD、hadoopfs-tail/hello.txt答案:BCD68.文件系統(tǒng)是提供解決“如何在磁盤上組織文件”的一系列方法和數(shù)據(jù)結(jié)構(gòu)。傳統(tǒng)的分布式文件系統(tǒng)在使用的過程中有哪些弊端?A、單機(jī)負(fù)載極高B、數(shù)據(jù)不安全C、文件整理困難D、存儲(chǔ)能力受限答案:ABC69.關(guān)系數(shù)據(jù)庫已經(jīng)無法滿足Web2.0的需求,主要表現(xiàn)在以下幾個(gè)方面?A、無法滿足海量數(shù)據(jù)的管理需求B、無法滿足數(shù)據(jù)高并發(fā)的需求C、無法滿足高可擴(kuò)展性和高可用性的需求D、使用難度高答案:ABC70.關(guān)于mapreduce自定義數(shù)據(jù)類型正確的是()A、write()方法實(shí)現(xiàn)反序列化B、readFields()方法實(shí)現(xiàn)序列化C、write()序列化屬性順序和readFields()方法反序列化屬性順序必須一致。D、可以自定義toString()方法答案:CD71.在Python中,pymysql連接數(shù)據(jù)庫進(jìn)行封裝的好處是?【選三項(xiàng)】A、減少代碼量B、提高可維護(hù)性C、可以減少代碼錯(cuò)誤D、安全答案:ABD72.Cloudera提供哪幾種安裝CDH的方法?A、ClouderamanagerB、TarballC、YumD、Rpm答案:ABCD73.下面哪些概念是Hbase框架中使用的()A、HDFSB、GridFSC、ZookeeperD、EXT3答案:AC74.下面對(duì)HBase的描述哪些是正確的?A、不是開源的B、是面向列的C、是分布式的D、是一種NoSQL數(shù)據(jù)庫答案:BCD75.數(shù)據(jù)化最早的根基是什么()A、計(jì)量B、數(shù)字化C、記錄D、阿拉伯?dāng)?shù)字答案:AC76.常用的HDFSAPI有哪些?A、rename()B、copyFromLocalFile()C、mkdirs()D、delete()答案:ABCD77.下列關(guān)于MapReduce的體系結(jié)構(gòu)的描述,說法正確的有?A、用戶編寫的MapReduce程序通過Client提交到JobTracker端B、JobTracker負(fù)責(zé)資源監(jiān)控和作業(yè)調(diào)度C、TaskTracker監(jiān)控所有TaskTracker與Job的健康狀況D、TaskTracker使用“slot”等量劃分本節(jié)點(diǎn)上的資源量(CPU、內(nèi)存等)答案:ABD78.當(dāng)采用MapReduce作為Hive的執(zhí)行引擎時(shí),下面描述正確的是:A、當(dāng)用戶向Hive輸入一段命令或查詢(即HiveQL語句)時(shí),Hive需要與Hadoop交互工作來完成該操作B、命令或查詢首先進(jìn)入到驅(qū)動(dòng)模塊,由驅(qū)動(dòng)模塊中的編譯器進(jìn)行解析編譯,并由優(yōu)化器對(duì)該操作進(jìn)行優(yōu)化計(jì)算,然后交給執(zhí)行器去執(zhí)行C、執(zhí)行器通常的任務(wù)是啟動(dòng)一個(gè)或多個(gè)MapReduce任務(wù),有時(shí)也不需要啟動(dòng)MapReduce任務(wù)D、執(zhí)行器通常的任務(wù)一定會(huì)包含Map和Reduce操作答案:ABC79.在Python中,Python網(wǎng)絡(luò)框架可以省去開發(fā)者處理網(wǎng)絡(luò)應(yīng)用底層的()【選三項(xiàng)】A、協(xié)議B、線程C、邏輯D、進(jìn)程答案:ABD80.當(dāng)處理CAP的問題時(shí),可以有哪幾個(gè)明顯的選擇?A、CA:也就是強(qiáng)調(diào)一致性(C)和可用性(A),放棄分區(qū)容忍性(P)B、CP:也就是強(qiáng)調(diào)一致性(C)和分區(qū)容忍性(P),放棄可用性(A)C、AP:也就是強(qiáng)調(diào)可用性(A)和分區(qū)容忍性(P),放棄一致性(C)D、CAP:也就是同時(shí)兼顧可用性(A)、分區(qū)容忍性(P)和一致性(C),當(dāng)時(shí)系統(tǒng)性能會(huì)下降很多答案:ABC三、判斷題1.Slaves由主機(jī)的列表組成,每臺(tái)1行,用于說明數(shù)據(jù)節(jié)點(diǎn)()A、正確B、錯(cuò)誤答案:A2.多用戶的情況下,F(xiàn)airScheduler可以最大化集群的吞吐和利用率A、正確B、錯(cuò)誤答案:B3.大數(shù)據(jù)的數(shù)據(jù)類型豐富,包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。A、正確B、錯(cuò)誤答案:A4.Hadoop2.0,F(xiàn)IFOScheduler是YARN中默認(rèn)的資源調(diào)度器A、正確B、錯(cuò)誤答案:B5.Sqoop是hadoop生態(tài)圈上的數(shù)據(jù)傳輸工具A、正確B、錯(cuò)誤答案:A6.Hadoop存在多個(gè)副本,且默認(rèn)備份數(shù)量是3。()A、正確B、錯(cuò)誤答案:A7.datanode負(fù)責(zé)存儲(chǔ)數(shù)據(jù)A、正確B、錯(cuò)誤答案:A8.NodeManager是每個(gè)節(jié)點(diǎn)上的資源和任務(wù)管理器。()A、正確B、錯(cuò)誤答案:A9.Hive相比于關(guān)系型數(shù)據(jù)庫,有較低的延遲。A、正確B、錯(cuò)誤答案:B10.安裝Hadoop時(shí),配置項(xiàng)”dfs.replication”是配置在文件core-site.xmlA、正確B、錯(cuò)誤答案:B11.Windows上可以運(yùn)行Hadoop()A、正確B、錯(cuò)誤答案:A12.每個(gè)map槽就是一個(gè)線程。()A、正確B、錯(cuò)誤答案:B13.HDFS的采用了“分而治之”的思想。A、正確B、錯(cuò)誤答案:B14.可以使用Partitioner定義輸出的文件名()。A、正確B、錯(cuò)誤答案:A15.數(shù)據(jù)的完整性包括數(shù)據(jù)傳輸?shù)耐暾院蛿?shù)據(jù)存儲(chǔ)的完整性。A、正確B、錯(cuò)誤答案:A16.HDFS文件系統(tǒng)上的數(shù)據(jù)是不可以進(jìn)行更改的。A、正確B、錯(cuò)誤答案:A17.Elasticsearch是一個(gè)分布式的開源搜索和分析引擎,適用于所有類型的數(shù)據(jù),包括文本、數(shù)字、地理空間、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。A、正確B、錯(cuò)誤答案:A18.NameNode負(fù)責(zé)管理元數(shù)據(jù),客戶端每次讀寫請(qǐng)求時(shí),都會(huì)從磁盤中讀取或?qū)懭朐獢?shù)據(jù)信息并反饋給客戶端。。A、正確B、錯(cuò)誤答案:A19.Hive相比于關(guān)系型數(shù)據(jù)庫,有較低的延遲。()A、正確B、錯(cuò)誤答案:B20.Slave節(jié)點(diǎn)要存儲(chǔ)數(shù)據(jù),所以它的磁盤越大越好。()A、正確B、錯(cuò)誤答案:B21.Map任務(wù)和Reduce任務(wù)都具有數(shù)據(jù)本地化的特性。A、正確B、錯(cuò)誤答案:B22.HDFS的設(shè)計(jì)初衷就是為將來的海量數(shù)據(jù)的分布式計(jì)算做鋪墊的,所以HDFS是一次寫入,多次讀出的場景A、正確B、錯(cuò)誤答案:A23.Jobtracker通常與NameNode在一個(gè)節(jié)點(diǎn)啟動(dòng)。()A、正確B、錯(cuò)誤答案:A24.NameNode負(fù)責(zé)管理metadata,client端每次讀寫請(qǐng)求,它都會(huì)從磁盤中讀取或則會(huì)寫入metadata信息并反饋client端。()A、正確B、錯(cuò)誤答案:B25.DataNode是文件存儲(chǔ)的基本單元,它將Block存儲(chǔ)在本地文件系統(tǒng)中。A、正確B、錯(cuò)誤答案:A26.如何從表中導(dǎo)出數(shù)據(jù)?如果數(shù)據(jù)文件恰好是用戶需要的格式,那么只需要簡單地拷貝文件夾或者文件就可以了。A、正確B、錯(cuò)誤答案:A27.Hadoop是Java開發(fā)的,所以MapReduce只支持Java語言編寫。A、正確B、錯(cuò)誤答案:B28.vi編輯器中,編輯文本內(nèi)容后使用:q退出vi編輯器A、正確B、錯(cuò)誤答案:B29.Ganglia不僅可以進(jìn)行監(jiān)控,也可以進(jìn)行告警。()A、正確B、錯(cuò)誤答案:B30.HDFS為海量的數(shù)據(jù)提供了存儲(chǔ),而MapReduce為海量的數(shù)據(jù)提供了計(jì)算。A、正確B、錯(cuò)誤答案:A31.ClouderaCDH是需要付費(fèi)使用的。()A、正確B、錯(cuò)誤答案:B32.啟動(dòng)Hadoop集群服務(wù)之前需要格式化文件系統(tǒng)(第一次)A、正確B、錯(cuò)誤答案:A33.Nagios不可以監(jiān)控Hadoop集群,因?yàn)樗惶峁〩adoop支持A、正確B、錯(cuò)誤答案:B34.Zookeeper集群宕機(jī)數(shù)超過集群數(shù)一半,則Zookeeper服務(wù)失效。()A、正確B、錯(cuò)誤答案:A35.防火墻策略也稱為防火墻的安全規(guī)則,它是防火墻實(shí)施網(wǎng)絡(luò)保護(hù)的重要依據(jù)。A、正確B、錯(cuò)誤答案:A36.ClouderaCDH是需要免費(fèi)使用的。A、正確B、錯(cuò)誤答案:A37.我們?cè)陂_發(fā)分布式計(jì)算job的時(shí)候,可以去掉reduce階段A、正確B、錯(cuò)誤答案:A38.每個(gè)map槽(進(jìn)程)就是一個(gè)線程。A、正確B、錯(cuò)誤答案:B39.job.setReducerClass(TxtReducer.class);功能是設(shè)置Reduce類()A、正確B、錯(cuò)誤答案:B40.Hive默認(rèn)不支持動(dòng)態(tài)分區(qū)功能,需要手動(dòng)設(shè)置動(dòng)態(tài)分區(qū)參數(shù)開啟功能。A、正確B、錯(cuò)誤答案:A41.在MapReduce程序中,必須開發(fā)Map和Reduce相應(yīng)的業(yè)務(wù)代碼才能執(zhí)行程序。()A、正確B、錯(cuò)誤答案:B42.hadoopdfsadmin-report命令用于檢測HDFS損壞塊A、正確B、錯(cuò)誤答案:B43.如果一個(gè)機(jī)架出問題,不會(huì)影響數(shù)據(jù)讀寫A、正確B、錯(cuò)誤答案:A44.在大數(shù)據(jù)框架中,批處理系統(tǒng)一般不適用于對(duì)延時(shí)要示較高的場景A、正確B、錯(cuò)誤答案:A45.Masters同樣是主機(jī)的列表組成,每臺(tái)一行,用于說明第二Namenode服務(wù)器()A、正確B、錯(cuò)誤答案:A46.combiner合并過程的作用是減少對(duì)本地磁盤的訪問次數(shù)()。A、正確B、錯(cuò)誤答案:A47.NameNode負(fù)責(zé)管理元數(shù)據(jù),客戶端每次讀寫請(qǐng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論