《大數(shù)據(jù)計(jì)算原理與技術(shù)》課程考試復(fù)習(xí)題庫(附答案)_第1頁
《大數(shù)據(jù)計(jì)算原理與技術(shù)》課程考試復(fù)習(xí)題庫(附答案)_第2頁
《大數(shù)據(jù)計(jì)算原理與技術(shù)》課程考試復(fù)習(xí)題庫(附答案)_第3頁
《大數(shù)據(jù)計(jì)算原理與技術(shù)》課程考試復(fù)習(xí)題庫(附答案)_第4頁
《大數(shù)據(jù)計(jì)算原理與技術(shù)》課程考試復(fù)習(xí)題庫(附答案)_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《大數(shù)據(jù)計(jì)算原理與技術(shù)》課程考試復(fù)習(xí)題庫(附答案)單選題1.針對(duì)每行數(shù)據(jù)內(nèi)容為”TimestUrl”的數(shù)據(jù)文件,在用JobConf對(duì)象conf設(shè)置conf.setInputFormat(WhichInputFormat.class)來讀取這個(gè)文件時(shí),WhichInputFormat應(yīng)該為以下的A、TextInputFormatB、KeyValueTextInputFormatC、SequenceFileInputFormatD、NLineInputFormat參考答案:B2.在配置Linux網(wǎng)絡(luò)參數(shù)時(shí),固定IP地址是將路由協(xié)議配置為A、staticB、dynamicC、dhcpD、variable參考答案:A3.在高階數(shù)據(jù)處理中,往往無法把整個(gè)流程寫在單個(gè)MapReduce作業(yè)中,下列關(guān)于鏈接MapReduce作業(yè)的說法,不正確的是A、Job和JobControl類可以管理非線性作業(yè)之間的依賴B、ChainMapper和ChainReducer類可以用來簡(jiǎn)化數(shù)據(jù)預(yù)處理和后處理的構(gòu)成C、使用ChainReducer時(shí),每個(gè)mapper和reducer對(duì)象都有一個(gè)本地JobConf對(duì)象D、ChainReducer.addMapper()方法中,一般對(duì)鍵/值對(duì)發(fā)送設(shè)置成值傳遞,性能好且安全性高參考答案:D4.在安裝Hadoop集群時(shí),jdk是配置在下面哪個(gè)文件中A、mapred-site.xmlB、yarn-site.xmlC、hadoop-env.shD、hdfs-site.xml參考答案:C5.在NameNode高可用(HA)中,當(dāng)活動(dòng)節(jié)點(diǎn)失效時(shí),哪個(gè)節(jié)點(diǎn)將成為活動(dòng)節(jié)點(diǎn)A、SecondaryNameNodeB、ackupnodeC、StandbynodeD、Checkpointnode參考答案:C6.在MapReduce中,下面哪個(gè)數(shù)據(jù)流的順序是正確的a.InputFormatb.Mapperc.Combinerd.Reducere.Partitionerf.OutputFormatg.GroupingA、ebcgdfB、abecgdfC、aebcgcfD、abcdegf參考答案:B7.在Linux系統(tǒng)中,用于關(guān)閉防火墻開機(jī)自啟動(dòng)的指令是A、chkconfigiptablesoffB、serviceiptablesstopC、stop-all.shD、stop-dfs.sh參考答案:A8.在Hadoop中每個(gè)應(yīng)用程序被表示成一個(gè)作業(yè),將作業(yè)的名稱設(shè)置為zhangyu,用JAVA代碼編寫,以下正確的是A、Job.SetJarName(‘zhangyu’);B、Job.SetMapName(‘zhangyu’);C、Job.SetJobName(‘zhangyu’);D、Job.SetInputName(‘zhangyu’);參考答案:C9.在Hadoop中負(fù)責(zé)運(yùn)算的組件是A、HDFSB、YARNC、MapReduceD、以上均是參考答案:C10.在Hadoop的解壓目錄下,通過執(zhí)行哪一項(xiàng)指令可以查看Hadoop的目錄結(jié)構(gòu)A、jpsB、llC、tarD、find參考答案:B11.在Centos7中,如果想要查看本機(jī)的主機(jī)名可以使用下面哪個(gè)命令A(yù)、rebootB、hostnameC、pwdD、tail參考答案:B12.有關(guān)MapReduce的輸入輸出,說法錯(cuò)誤的是A、鏈接多個(gè)MapReduce作業(yè)時(shí),序列文件是首選格式B、FileInputFormat中實(shí)現(xiàn)的getSplits()可以把輸入數(shù)據(jù)劃分為分片,分片數(shù)目和大小任意定義C、想完全禁止輸出,可以使用NullOutputFormatD、每個(gè)reduce需將它的輸出寫入自己的文件中,輸出無需分片參考答案:B13.以下選項(xiàng)中,哪種類型間的轉(zhuǎn)換是不被Hive查詢語言所支持的A、Double—NumberB、igInt—DoubleC、Int—BigIntD、String—Double參考答案:A14.以下四個(gè)Hadoop預(yù)定義的Mapper實(shí)現(xiàn)類的描述錯(cuò)誤的是A、IdentityMapper<K,V>實(shí)現(xiàn)Mapper<K,V,K,V>,將輸入直接映射到輸出B、InverseMapper<K,V>實(shí)現(xiàn)Mapper<K,V,K,V>,反轉(zhuǎn)鍵/值對(duì)C、RegexMapper<K>實(shí)現(xiàn)Mapper<K,Text,Text,LongWritable>,為每個(gè)常規(guī)表達(dá)式的匹配項(xiàng)生成一個(gè)(match,1)對(duì)D、TokenCountMapper<K>實(shí)現(xiàn)Mapper<K,Text,Text,LongWritable>,當(dāng)輸入的值為分詞時(shí),生成(taken,1)對(duì)參考答案:B15.以下哪個(gè)組件負(fù)責(zé)HDFS元數(shù)據(jù)的存儲(chǔ)和管理A、ClientB、NamenodeC、DatanodeD、Secondarynamenode參考答案:B16.以下哪個(gè)不屬于大數(shù)據(jù)主要解決的問題A、海量數(shù)據(jù)存儲(chǔ)B、日常業(yè)務(wù)數(shù)據(jù)處理C、海量數(shù)據(jù)計(jì)算D、通過數(shù)據(jù)分析以提供決策支持參考答案:B17.以下哪個(gè)不是HDFS的守護(hù)進(jìn)程A、SecondaryNameNodeB、NameNodeC、MrappMaster/YarnChildD、ataNode參考答案:C18.以下關(guān)于NameNode說法正確的是A、NameNode既可以存儲(chǔ)具體的文件數(shù)據(jù),也可以存儲(chǔ)元數(shù)據(jù)B、可以使用NameNode高可用機(jī)制來橫向擴(kuò)展其內(nèi)存空間C、NameNode存儲(chǔ)大文件和小文件的元數(shù)據(jù)所占的空間是不一樣的D、對(duì)于單節(jié)點(diǎn)集群來講,NameNode一旦掛掉,整個(gè)HDFS集群將不能工作參考答案:D19.以下關(guān)于HDFS描述錯(cuò)誤是A、HDFS在存儲(chǔ)大文件時(shí)會(huì)將文件進(jìn)行切分B、HDFS可以通過副本機(jī)制來解決數(shù)據(jù)丟失問題C、HDFS也適合存儲(chǔ)小文件D、HDFS在單節(jié)點(diǎn)模式下,NameNode一旦宕機(jī),則整個(gè)HDFS將不能工作參考答案:C20.以下關(guān)于HDFS讀寫操作描述錯(cuò)誤的是A、HDFS在讀取數(shù)據(jù)時(shí)不需要NameNode參與B、HDFS只支持追加寫入,不支持對(duì)文件內(nèi)容的隨機(jī)修改C、HDFS執(zhí)行具體的寫操作時(shí),需要Client和DataNode之間進(jìn)行數(shù)據(jù)傳輸D、HDFS在讀取數(shù)據(jù)時(shí),一個(gè)文件的多個(gè)BLOCK可以并行讀取參考答案:A21.以下關(guān)于Hadoop框架說法錯(cuò)誤的是A、Hadoop包含HDFS、MapReduce、Yarn三大核心組件B、Hadoop的版本分為開源社區(qū)版和商業(yè)版C、Hadoop的運(yùn)行必須依賴JDKD、Hadoop的核心配置文件所在目錄是在$HADOOOP_HOME/conf目錄參考答案:D22.一個(gè)gzip文件大小75MB,客戶端設(shè)置Block大小為64MB,請(qǐng)問其占用幾個(gè)BlockA、3B、2C、4D、1參考答案:B23.下面與HDFS類似的框架是A、NTFSB、FAT32C、GFSD、EXT3參考答案:C24.下面哪個(gè)是Hadoop組件A、yarnB、hdfsC、mapreduceD、以上都是參考答案:D25.下面哪個(gè)是Hadoop配置文件A、core-site.xmlB、hdfs-site.xmlC、yarn-site.xmlD、以上均是參考答案:D26.下面哪個(gè)配置是在mapred-site.xml中配置的A、block塊的副本數(shù)B、Java環(huán)境變量C、存儲(chǔ)hdfs文件的目錄名D、運(yùn)行MapReduce作業(yè)的主機(jī)和端口參考答案:D27.下面哪個(gè)目錄保存了Hadoop集群的命令(比如啟動(dòng)Hadoop)A、binB、sbinC、etcD、share參考答案:B28.下面哪個(gè)程序負(fù)責(zé)HDFS數(shù)據(jù)存儲(chǔ)。A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNode參考答案:C29.下面哪個(gè)不是Hadoop進(jìn)程A、NameNodeB、HMasterC、DataNodeD、NodeManager參考答案:B30.下面陳述的內(nèi)容哪些是NameNode節(jié)點(diǎn)的功能A、負(fù)責(zé)數(shù)據(jù)的計(jì)算B、調(diào)度客戶端對(duì)文件的訪問C、存儲(chǔ)真實(shí)數(shù)據(jù)D、以上均正確參考答案:B31.下列語句中,描述錯(cuò)誤的是A、可以通過CLI方式、JavaAPI方式調(diào)用Sqoop。B、Sqoop底層會(huì)將Sqoop命令轉(zhuǎn)換為MapReduce任務(wù),并通過Sqoop連接器進(jìn)行數(shù)據(jù)的導(dǎo)入導(dǎo)出操作。C、Sqoop是獨(dú)立的數(shù)據(jù)遷移工具,可以在任何系統(tǒng)上執(zhí)行。D、如果在Hadoop分布式集群環(huán)境下,連接MySQL服務(wù)器參數(shù)不能是localhos或。參考答案:C32.下列語句描述錯(cuò)誤的是()A、可以通過CLI方式、JavaAPI方式調(diào)用SqoopB、Sqoop底層會(huì)將Sqoop命令轉(zhuǎn)換為MapReduce任務(wù),并通過Sqoop連接器進(jìn)行數(shù)據(jù)的導(dǎo)入導(dǎo)出操作。C、Sqoop是獨(dú)立的數(shù)據(jù)遷移工具,可以在任何系統(tǒng)上執(zhí)行。D、如果在Hadoop分布式集群環(huán)境下,連接MySQL服務(wù)器參數(shù)不能是localhost或。參考答案:C33.下列選項(xiàng)中哪一門技術(shù)屬于大數(shù)據(jù)平臺(tái)A、TomcatB、HadoopC、ASP.NETD、Apache參考答案:B34.下列選項(xiàng)中,最早提出“大數(shù)據(jù)”這一概念的是A、貝恩B、麥肯錫C、吉拉德D、杰弗遜參考答案:B35.下列選項(xiàng)中,主要用于決定整個(gè)MapReduce程序性能高低的階段是A、MapTaskB、ReduceTaskC、分片、格式化數(shù)據(jù)源D、Shuffle參考答案:D36.下列選項(xiàng)中,用于刪除HDFS上文件夾的方法是A、delete()B、rename()C、mkdirs()D、copyToLocalFile()參考答案:A37.下列選項(xiàng)中,用于存放部署Hadoop集群服務(wù)器的是A、namenodeB、datanodeC、rackD、metadata參考答案:C38.下列選項(xiàng)中,若是哪個(gè)節(jié)點(diǎn)關(guān)閉了,就無法訪問Hadoop集群A、namenodeB、datanodeC、secondarynamenodeD、yarn參考答案:A39.下列選項(xiàng)中,哪一項(xiàng)是研究大數(shù)據(jù)最重要的意義A、分析B、統(tǒng)計(jì)C、測(cè)試D、預(yù)測(cè)參考答案:D40.下列選項(xiàng)中,哪一項(xiàng)是可以進(jìn)行重啟引導(dǎo)系統(tǒng)A、OKB、CancelC、RebootD、Apply參考答案:C41.下列選項(xiàng)中,哪一個(gè)可以對(duì)hadoop集群進(jìn)行格式化A、hadoopnamenode-formatB、hadoopnamenode-lsC、hdfsdatanode-lsD、hdfsdatanode-format參考答案:A42.下列選項(xiàng)中,哪項(xiàng)不是Hive系統(tǒng)架構(gòu)的組成部分A、用戶接口B、跨語言服務(wù)C、HDFSD、底層驅(qū)動(dòng)引擎參考答案:C43.下列選項(xiàng)中,關(guān)于SSH服務(wù)說法正確的是A、SSH服務(wù)是一種傳輸協(xié)議B、SSH服務(wù)是一種通信協(xié)議C、SSH服務(wù)是一種數(shù)據(jù)包協(xié)議D、SSH服務(wù)是一種網(wǎng)絡(luò)安全協(xié)議參考答案:D44.下列選項(xiàng)中,關(guān)于HDFS說法錯(cuò)誤的是A、HDFS是Hadoop的核心之一B、HDFS源于Google的GFS論文C、HDFS用于存儲(chǔ)海量大數(shù)據(jù)D、HDFS是用于計(jì)算海量大數(shù)據(jù)參考答案:D45.下列選項(xiàng)中,關(guān)于HDFS的架構(gòu)說法正確的是A、HDFS采用的是主備架構(gòu)B、HDFS采用的是主從架構(gòu)C、HDFS采用的是從備架構(gòu)D、以上說法均錯(cuò)誤參考答案:B46.下列選項(xiàng)中,存放Hadoop配置文件的目錄是A、includeB、inC、libexecD、etc參考答案:D47.下列選項(xiàng)中,Hadoop2.x版本獨(dú)有的進(jìn)程是A、JobTrackerB、TaskTrackerC、NodeManagerD、NameNode參考答案:C48.下列說法中,關(guān)于客戶端從HDFS中讀取數(shù)據(jù)的說法錯(cuò)誤的是A、客戶端會(huì)選取排序靠前的DataNode來依次讀取Block塊B、客戶端會(huì)把最終讀取出來所有的Block塊合并成一個(gè)完整的最終文件C、客戶端會(huì)選取排序靠后的DataNode來依讀取Block塊D、如果客戶端本身就是DataNode,那么將從本地直接獲取數(shù)據(jù)參考答案:C49.下列說法不正確的是?A、數(shù)據(jù)源是數(shù)據(jù)倉庫的基礎(chǔ),通常包含企業(yè)的各種內(nèi)部信息和外部信息B、數(shù)據(jù)存儲(chǔ)及管理是整個(gè)數(shù)據(jù)倉庫的核心。C、OLAP服務(wù)器對(duì)需要分析的數(shù)據(jù)按照多維數(shù)據(jù)模型進(jìn)行重組、分析,發(fā)現(xiàn)數(shù)據(jù)規(guī)律和趨勢(shì)。D、前端工具主要功能是將數(shù)據(jù)可視化展示在前端頁面中參考答案:D50.下列哪些操作可以設(shè)置一個(gè)監(jiān)聽器Watcher()A、getDataB、getChildrenC、existsD、setData參考答案:D51.下列哪項(xiàng)通常是集群的最主要瓶頸A、CPUB、網(wǎng)絡(luò)C、磁盤IOD、內(nèi)存參考答案:C52.下列哪項(xiàng)通常是集群的最主要的性能瓶頸A、CPUB、網(wǎng)絡(luò)C、磁盤D、內(nèi)存參考答案:C53.下列哪個(gè)屬性是mapred-site.xml中的配置?A、dfs.replicationB、fs.fsdefaultFSC、D、yarn.resourcemanager.address參考答案:C54.下列哪個(gè)程序通常與NameNode在同一個(gè)節(jié)點(diǎn)啟動(dòng)A、TaskTrackerB、DataNodeC、SecondaryNameNodeD、ResourceManager參考答案:D55.下列哪個(gè)shell命令可以用于HDFS系統(tǒng)之間文件的移動(dòng)A、hadoopfsmvB、hadoopfs-mvC、hadoopfs-cutD、hadoopfs-move參考答案:B56.下列哪個(gè)shell命令可以用于HDFS系統(tǒng)之間文件的復(fù)制A、hadoopfscpB、hadoopfs-copyC、hadoopfs-copyFileD、hdfsfs-cp參考答案:C57.下列描述中不符合Map/Reduce的是A、Map結(jié)束后,Partitioner會(huì)將相同Key分到同一個(gè)組交給Reduce進(jìn)程B、Map/Reduce是函數(shù)式的設(shè)計(jì)思想C、Map是將數(shù)據(jù)映射成Key/Value再交給ReduceD、Reduce先運(yùn)行,然后運(yùn)行Map參考答案:D58.下列描述說法錯(cuò)誤的是?A、SecureCRT是一款支持SSH的終端仿真程序,它能夠在Windows操作系統(tǒng)上遠(yuǎn)程連接Linux服務(wù)器執(zhí)行操作。B、Hadoop是一個(gè)用于處理大數(shù)據(jù)的分布式集群架構(gòu),支持在GNU/Linux系統(tǒng)以及Windows系統(tǒng)上進(jìn)行安裝使用。C、VMwareWorkstation是一款虛擬計(jì)算機(jī)的軟件,用戶可以在單一的桌面上同時(shí)操作不同的操作系統(tǒng)。D、SSH是一個(gè)軟件,專為遠(yuǎn)程登錄會(huì)話和其他網(wǎng)絡(luò)服務(wù)提供安全性功能的軟件。參考答案:D59.下列關(guān)于HDFS的描述正確的是?A、NameNode磁盤元數(shù)據(jù)不保存Block的位置信息B、DataNode通過長(zhǎng)連接與NameNode保持通信C、HDFS集群支持?jǐn)?shù)據(jù)的隨機(jī)讀寫D、如果NameNode宕機(jī),SecondaryNameNode會(huì)接替它使集群繼續(xù)工作參考答案:A60.下列關(guān)于HadoopAPI的說法錯(cuò)誤的是A、Hadoop的文件API不是通用的,只用于HDFS文件系統(tǒng)B、Configuration類的默認(rèn)實(shí)例化方法是以HDFS系統(tǒng)的資源配置為基礎(chǔ)的C、FileStatus對(duì)象存儲(chǔ)文件和目錄的元數(shù)據(jù)D、FSDataInputStream是java.io.DataInputStream的子類參考答案:A61.下列不是FileSystem的常見方法的是A、getDefaultPort()B、getScheme()C、getStatus()D、Path()參考答案:D62.使用下面哪個(gè)命令可以將HDFS目錄中的文件下載到本地A、hadoopfs-putB、hadoopfs-catC、hadoopfs-getD、hadoopfs-rm參考答案:C63.生成秘鑰的命令是A、ssh-keygenB、ssh-addC、ssh-copy-idD、ssh參考答案:A64.如果想要修改集群的備份數(shù)量,可以修改下面哪個(gè)配置文件?A、mapred-site.xmlB、core-site.xmlC、hdfs-site.xmlD、hadoop-env.sh參考答案:C65.配置機(jī)架感知的下面哪項(xiàng)正確A、MapReduce會(huì)根據(jù)機(jī)架獲取離自己比較近的網(wǎng)絡(luò)數(shù)據(jù)B、寫入數(shù)據(jù)的時(shí)候會(huì)寫到不同機(jī)架的DataNodeC、都正確D、如果一個(gè)機(jī)架出問題,不會(huì)影響數(shù)據(jù)讀寫參考答案:C66.目前,Hadoop的最高版本是哪個(gè)A、Hadoop3.xB、Hadoop2.xC、Hadoop1.xD、Hadoop4.x參考答案:A67.每個(gè)Map任務(wù)都有一個(gè)內(nèi)存緩沖區(qū),默認(rèn)大小是A、128MB、64MC、100MD、32M參考答案:C68.關(guān)于大數(shù)據(jù)的主要特征理解和描述錯(cuò)誤的是A、來源多,格式多B、增長(zhǎng)速度快,處理速度快C、存儲(chǔ)量大計(jì)算量大D、數(shù)據(jù)價(jià)值密度很高參考答案:D69.關(guān)于大數(shù)據(jù)的價(jià)值密度描述正確的是以下哪個(gè)?A、大數(shù)據(jù)由于其數(shù)據(jù)量大,所以其價(jià)值密度低。B、大數(shù)據(jù)由于其數(shù)據(jù)量大,所以其價(jià)值也大。C、大數(shù)據(jù)的價(jià)值密度是指其數(shù)據(jù)類型多且復(fù)雜。D、大數(shù)據(jù)由于其數(shù)據(jù)量大,所以其價(jià)值密度高參考答案:A70.關(guān)于SecondaryNameNode下面哪項(xiàng)是正確的A、它是NameNode的熱備B、它對(duì)內(nèi)存沒有要求C、它的目的是幫助NameNode合并編輯日志,減少NameNode啟動(dòng)時(shí)間D、SecondaryNameNode應(yīng)與NameNode部署到一個(gè)節(jié)點(diǎn)參考答案:C71.關(guān)于SecondaryNameNode哪項(xiàng)是正確?A、它是NameNode的熱備B、它對(duì)內(nèi)存沒有要求C、它的目的是幫助NameNode合并編輯日志,減少NameNode啟動(dòng)時(shí)間D、SecondaryNameNode應(yīng)與NameNode部署到一個(gè)節(jié)點(diǎn)參考答案:C72.關(guān)于MapReduce的描述錯(cuò)的是A、MapReduce默認(rèn)只能按照Key進(jìn)行排序B、MapReduce在運(yùn)行時(shí)可以沒有CombinerC、MapReduce在指定多分區(qū)之后一般需要指定Reduce個(gè)數(shù)D、MapReduce中自定義的JavaBean可以不用序列化參考答案:D73.關(guān)于HDFS寫數(shù)據(jù)流程,下面說法錯(cuò)誤的是A、寫數(shù)據(jù)首先需要找NN確定寫的位置B、如果pipeline一個(gè)節(jié)點(diǎn)寫失敗則重新申請(qǐng)DN節(jié)點(diǎn)再寫C、寫數(shù)據(jù)是以packet為大小進(jìn)行的,默認(rèn)64KD、pipeline反方向會(huì)進(jìn)行數(shù)據(jù)的ack檢驗(yàn)參考答案:B74.關(guān)于HDFS的文件寫入,正確的是A、支持多用戶對(duì)同一文件的寫操作B、用戶可以在文件任意位置進(jìn)行修改C、默認(rèn)將文件塊復(fù)制成三份存放D、復(fù)制的文件塊默認(rèn)都存在同一機(jī)架上參考答案:C75.關(guān)于Haoop體系架構(gòu)說法不正確的是?A、NameNode管理文件系統(tǒng)的命名空間B、HDFS集群有兩類節(jié)點(diǎn)以管理者和工作者模式運(yùn)行C、HDFS上的文件也被分為塊大小的多個(gè)塊文件作為獨(dú)立的存儲(chǔ)單元D、NameNode永久保存記錄著每個(gè)文件中各個(gè)塊所在的數(shù)據(jù)節(jié)點(diǎn)和位置信息參考答案:D76.關(guān)于Hadoop單機(jī)模式和偽分布式模式的說法,正確的是A、兩者都起守護(hù)進(jìn)程,且守護(hù)進(jìn)程運(yùn)行在一臺(tái)機(jī)器上B、單機(jī)模式不使用HDFS,但加載守護(hù)進(jìn)程C、兩者都不與守護(hù)進(jìn)程交互,避免復(fù)雜性D、后者比前者增加了HDFS輸入輸出以及可檢查內(nèi)存使用情況參考答案:D77.關(guān)于Hadoop單擊模式和偽分布模式的說法正確的是?A、后者比前者增加的HDFS的輸入輸出以及可檢查內(nèi)存的使用情況B、兩者都不與守護(hù)進(jìn)程交互,避免復(fù)雜性C、單機(jī)模式不使用HDFS,但加載守護(hù)進(jìn)程D、兩者都啟動(dòng)守護(hù)進(jìn)程,且守護(hù)進(jìn)程運(yùn)行在一臺(tái)機(jī)器上參考答案:A78.關(guān)于HadoopFileSystem的說法不正確的是A、FileSystem中有很多方法,跟File中的方法一致,如exists,delete,mkdir,create等等一些常用的文件操作方法B、FileStatus中有一系列的方法,可以得到文件的信息。如:getLen()得到文件的長(zhǎng)度,以字節(jié)的形式C、globStatus()方法返回于其路徑匹配的所有文件的FileStatus隊(duì)形數(shù)據(jù),并按路徑排序。D、FileStatus對(duì)象存儲(chǔ)文件和目錄的元數(shù)據(jù)參考答案:A79.關(guān)于checkpoint,說法正確的是A、checkpoint可通過元數(shù)據(jù)文件的大小進(jìn)行控制B、secondarynamenode會(huì)將合并好的元數(shù)據(jù)移動(dòng)到namenodeC、SecondaryNameNode會(huì)將edits文件和fsimage復(fù)制到本地(HTTPGET方式)D、合并元數(shù)據(jù)需要大量的磁盤進(jìn)行文件的合并操作參考答案:C80.關(guān)系型數(shù)據(jù)庫與HDFS之間相互數(shù)據(jù)遷移的工具是A、distcpB、fsckC、fastcopyD、sqoop參考答案:D81.端口50070默認(rèn)是Hadoop哪個(gè)服務(wù)的端口?A、NameNodeB、DataNodeC、SecondaryNameNodeD、Yarn參考答案:A82.大數(shù)據(jù)至少為以下哪種存儲(chǔ)量級(jí)?A、EBB、PBC、TBD、ZB參考答案:B83.把本地文件放到集群里,可以使用下面哪個(gè)hadoopshell的命令A(yù)、hadoopfs-putB、hadoopfs–push/C、hadoopfs–put/D、hadoop-push/參考答案:C84.按粒度大小的順序,Hive數(shù)據(jù)被分為:數(shù)據(jù)庫、數(shù)據(jù)表、()、桶。A、元祖B、欄C、分區(qū)D、行參考答案:C85.安裝Hadoop時(shí),發(fā)現(xiàn)50070對(duì)應(yīng)的頁面無法打開,可以通過下面哪個(gè)命令查看某個(gè)端口(TCP或UDP)是否在監(jiān)聽A、psB、netstatC、pingD、ifconfig參考答案:B86.安裝Hadoop集群時(shí),是在哪個(gè)文件指定哪些機(jī)器作為集群的從機(jī)?A、datanodeB、slavesC、yarn-site.xmlD、core-site.xml參考答案:B87.Ubuntu下,采用用戶user1安裝hadoop偽分布式時(shí),解壓hadoop安裝包采用下面命令A(yù)、chownuser1:user1hadoop-2.7.5B、chown-Ruser1:user1hadoop-2.7.5C、hmod-R777hadoop-2.7.5D、sudochown-Ruser1:user1hadoop-2.7.5參考答案:D88.SecondaryNamenode的作用是A、監(jiān)控NamenodeB、管理DatanodeC、合并fsimage和editlogsD、支持NamenodeHA參考答案:C89.Namenode在啟動(dòng)時(shí)自動(dòng)進(jìn)入安全模式,在安全模式階段,說法錯(cuò)誤的是A、安全模式目的是在系統(tǒng)啟動(dòng)時(shí)檢查各個(gè)DataNode上數(shù)據(jù)塊的有效性B、根據(jù)策略對(duì)數(shù)據(jù)塊進(jìn)行必要的復(fù)制或刪除C、當(dāng)數(shù)據(jù)塊最小百分比數(shù)滿足的最小副本數(shù)條件時(shí),會(huì)自動(dòng)退出安全模式D、文件系統(tǒng)允許有修改參考答案:D90.MapReduce框架提供了一種序列化鍵/值對(duì)的方法,支持這種序列化的類能夠在Map和Reduce過程中充當(dāng)鍵或值,以下說法錯(cuò)誤的是A、實(shí)現(xiàn)Writable接口的類是值B、實(shí)現(xiàn)WritableComparable<T>接口的類可以是值或鍵C、Hadoop的基本類型Text并不實(shí)現(xiàn)WritableComparable<T>接口D、鍵和值的數(shù)據(jù)類型可以超出Hadoop自身支持的基本類型參考答案:C91.MapReduce的Shuffle過程以下中哪個(gè)操作是最后做的?A、排序B、合并C、分區(qū)D、溢寫參考答案:B92.MapReduce處理數(shù)據(jù)的工作流程大致分為()步A、2B、3C、4D、5參考答案:D93.map()函數(shù)接收的數(shù)據(jù)格式是A、字符串B、整型C、LongD、鍵值對(duì)參考答案:D94.HDfS中的block默認(rèn)保存幾份A、3B、2C、1D、不確定參考答案:A95.HDFS無法高效存儲(chǔ)大量小文件,想讓它能處理好小文件,比較可行的改進(jìn)策略不包括A、利用SequenceFile、MapFile、Har等方式歸檔小文件B、多Master設(shè)計(jì)C、Block大小適當(dāng)調(diào)小D、調(diào)大namenode內(nèi)存或?qū)⑽募到y(tǒng)元數(shù)據(jù)存到硬盤里參考答案:D96.HDFS是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,具有高容錯(cuò)、高可靠性、高可擴(kuò)展性、高吞吐率等特征,適合的讀寫任務(wù)是A、一次寫入,少次讀B、多次寫入,少次讀C、多次寫入,多次讀D、一次寫入,多次讀參考答案:D97.HDFS默認(rèn)的當(dāng)前工作目錄是/user/$USER,的值需要在哪個(gè)配置文件內(nèi)說明A、mapred-site.xmlB、core-site.xmlC、hdfs-site.xmlD、以上均不是參考答案:B98.HDFS的是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,具有高容錯(cuò)、高可靠性、高可擴(kuò)展性、高吞吐率等特征,適合的讀寫任務(wù)是A、一次寫入,少次讀取B、多次寫入,少次讀取C、一次寫入,多次讀取D、多次寫入,多次讀取參考答案:C99.HDFS的NameNode負(fù)責(zé)管理文件系統(tǒng)的命名空間,將所有的文件和文件夾的元數(shù)據(jù)保存在一個(gè)文件系統(tǒng)樹中,這些信息也會(huì)在硬盤上保存成以下文件A、日志B、命名空間鏡像C、兩者都是D、都不是參考答案:C100.Hadoop作者A、MartinFowlerB、KentBeckC、DougcuttingD、JamesGosling參考答案:C101.Hadoop完全分布模式配置免密登錄是要A、實(shí)現(xiàn)主節(jié)點(diǎn)到其他節(jié)點(diǎn)免密登錄B、實(shí)現(xiàn)從節(jié)點(diǎn)到主節(jié)點(diǎn)的免密登錄C、主節(jié)點(diǎn)和從節(jié)點(diǎn)任意兩個(gè)節(jié)點(diǎn)之間免密登錄D、以上都不是參考答案:C102.Hadoop起始于以下哪個(gè)階段A、2004年,Nutch的開發(fā)者開發(fā)了NDFSB、2004年,Google發(fā)表了關(guān)于MapReduce的論文C、2003年,Google發(fā)布了GFS論文D、2002年,Apach項(xiàng)目的Nutch參考答案:D103.Hadoop配置文件中,hadoop-site.xml顯示覆蓋hadoop-default.xml里的內(nèi)容。在版本0.20中,hadoop-site.xml被分離成三個(gè)XML文件,不包括A、conf-site.xmlB、mapred-site.xmlC、ore-site.xmlD、hdfs-site.xml參考答案:A104.Hadoopfs中的-get和-put命令操作對(duì)象是A、文件B、目錄C、兩者都是D、都不是參考答案:C105.hadoop2.x采用什么技術(shù)構(gòu)建源代碼A、ntB、ivyC、mavenD、makefile參考答案:C106.Hadoop2.x版本中的數(shù)據(jù)塊大小默認(rèn)是多少?A、64MB、128MC、256MD、512M參考答案:B107.hadoop2.X版本默認(rèn)BlockSize的大小是A、32MB、64MC、128MD、256M參考答案:C108.Hadoop2.0集群服務(wù)啟動(dòng)進(jìn)程中,下列選項(xiàng)不包含的是A、NameNodeB、JobTrackerC、DataNodeD、ResourceManager參考答案:B109.hadoop1.X版本默認(rèn)BlockSize的大小是A、32MB、64MC、128MD、256M參考答案:B110.Hadoop1.0中,Hadoop內(nèi)核的主要組成是A、HDFS和MapReduceB、HDFS和YarnC、YarnD、MapReduce和Yarn參考答案:A111.DougCutting所創(chuàng)立的項(xiàng)目的名稱都受到其家人的啟發(fā),以下項(xiàng)目不是由他創(chuàng)立的項(xiàng)目是A、HadoopB、NutchC、LuceneD、Solr參考答案:D112.Client在HDFS上進(jìn)行文件寫入時(shí),namenode根據(jù)文件大小和配置情況,返回部分datanode信息,誰負(fù)責(zé)將文件劃分為多個(gè)Block,根據(jù)DataNode的地址信息,按順序?qū)懭氲矫恳粋€(gè)DataNode塊A、ClientB、NamenodeC、DatanodeD、Secondarynamenode參考答案:A113.Client端上傳文件的時(shí)候下列哪項(xiàng)正確?A、數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、Client端將文件切分為Block,依次上傳C、lient只上傳數(shù)據(jù)到一臺(tái)DataNode,然后由NameNode負(fù)責(zé)Block復(fù)制工作D、以上都不正確參考答案:B多選題1.以下哪些說法是錯(cuò)誤的A、Zookeeper集群一般用來實(shí)現(xiàn)大數(shù)據(jù)存儲(chǔ)B、HDFS集群在第一次啟動(dòng)之前必須對(duì)NameNode格式化C、MapReduce中map任務(wù)的個(gè)數(shù)一定是由文件的block數(shù)來決定D、MapReduce的Shuffle階段組件的順序是:Partitioner、Sort、Combiner、Grouping參考答案:AC2.以下哪些工具屬于Hadoop生態(tài)系統(tǒng)的開源工具A、HiveB、HBaseC、ZookerperD、Mysql參考答案:ABC3.以下哪個(gè)不是HDFS的組件A、NameNodeB、ResouceMangerC、NodeManagerD、SecondaryNameNode參考答案:BC4.以下關(guān)于序列化Writable的說法正確的是?A、反序列化也稱反串行化,它是指將字節(jié)流轉(zhuǎn)回結(jié)構(gòu)化對(duì)象的逆過程。B、Hadoop中使用自己開發(fā)的類:IntWritable、FloatWritable、Text等,都是Writable的實(shí)現(xiàn)類。C、序列化和反序列化在分布式數(shù)據(jù)處理中,主要于進(jìn)程間通信和永久存儲(chǔ)兩個(gè)領(lǐng)域。D、Writable接口是一個(gè)序列化對(duì)象的接口,能夠?qū)?shù)據(jù)寫入流或者從流中讀出。參考答案:ABCD5.以下關(guān)于文件塊的說法正確的是?A、文件的所有Block為了容錯(cuò)都會(huì)被冗余復(fù)制。B、除了最后一個(gè)Block,所有的Block都是同樣的大小。C、每個(gè)文件的Block大小和復(fù)制(Replication)因子都是可配置的。D、HDFS將文件存儲(chǔ)成塊序列。參考答案:ABCD6.以下關(guān)于大數(shù)據(jù)特點(diǎn)的描述中,不正確的是()。A、巨大的數(shù)據(jù)量B、多結(jié)構(gòu)化數(shù)據(jù)C、增長(zhǎng)速度快D、價(jià)值密度高參考答案:ABC7.以下關(guān)于SSH免密碼配置的描述正確的選項(xiàng)有哪個(gè)?A、SSH專為遠(yuǎn)程登錄會(huì)話和其他網(wǎng)絡(luò)服務(wù)提供安全性的協(xié)議。B、SSH是SecureShell的縮寫,則IETF的網(wǎng)絡(luò)工作小組制定。C、SSH是建立在應(yīng)用層和傳輸導(dǎo)上的安全協(xié)議。D、使用SSH公鑰登錄可以解決Hadoop集群節(jié)點(diǎn)之前的通信略掉需要輸入密碼才能登錄的步驟。參考答案:ABCD8.以下關(guān)于HDFS體系結(jié)構(gòu)的描述正確的有哪幾項(xiàng)?A、以下關(guān)于HDFS體系結(jié)構(gòu)的描述正確的有哪幾項(xiàng)?B、DataNode作為從結(jié)點(diǎn),用來管理存儲(chǔ)的數(shù)據(jù)。C、HDFS采用主從結(jié)構(gòu)模型。D、一個(gè)HDFS集群是由一個(gè)NameNode和若干個(gè)DataNode組成的。參考答案:ABCD9.下面說法選項(xiàng)錯(cuò)誤的是A、在一個(gè)Agent中,同一個(gè)source可以有多個(gè)channelB、在一個(gè)Agent中,同一個(gè)sink可以有多個(gè)channelC、在一個(gè)Agent中,同一個(gè)source只能多1個(gè)channelD、在一個(gè)Agent中,同一個(gè)sink只能有1個(gè)channel參考答案:AD10.下面哪個(gè)組件可以在Hadoop集群中代替MR做一些計(jì)算?A、SparkB、SqoopC、HiveD、Avro參考答案:AC11.下列有關(guān)Hadoop的說法正確的是()。A、Hadoop最早起源于NutchB、Hadoop中HDFS的理念來源于谷歌發(fā)表的分布式文件系統(tǒng)(GFS)的論文C、Hadoop中MapReduce的思想來源于谷歌分布式計(jì)算框架MapReduce的論文D、Hadoop是在分布式服務(wù)器集群上存儲(chǔ)海量數(shù)據(jù)并運(yùn)行分布式分析應(yīng)用的一個(gè)開源的軟件框架參考答案:ABCD12.下列選項(xiàng)中,在Reducer類的run()方法中定義的三個(gè)方法有A、setup()B、reduce()C、leanup()D、map()參考答案:ABC13.下列選項(xiàng)中,說法錯(cuò)誤的是A、在一個(gè)Agent中,同一個(gè)source可以有多個(gè)channelB、在一個(gè)Agent中,同一個(gè)sink可以有多個(gè)channelC、在一個(gè)Agent中,同一個(gè)source只能多1個(gè)channelD、在一個(gè)Agent中,同一個(gè)sink只能有1個(gè)channel參考答案:AD14.下列選項(xiàng)中,屬于Google提出的處理大數(shù)據(jù)的技術(shù)手段有A、MapReduceB、MySQLC、BigTableD、GFS參考答案:ACD15.下列選項(xiàng)中,關(guān)于數(shù)據(jù)塊說法正確的是A、磁盤進(jìn)行數(shù)據(jù)讀/寫的最大單位B、磁盤進(jìn)行數(shù)據(jù)讀/寫的最小單位C、數(shù)據(jù)塊是抽象的塊D、ataNode是按block對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)。參考答案:BCD16.下列選項(xiàng)中,關(guān)于Metadata元數(shù)據(jù)說法正確的是A、元數(shù)據(jù)維護(hù)HDFS文件系統(tǒng)中文件和目錄的信息B、元數(shù)據(jù)記錄與文件內(nèi)容存儲(chǔ)相關(guān)的信息C、元數(shù)據(jù)用來記錄HDFS中所有DataNode的信息D、元數(shù)據(jù)用于維護(hù)文件系統(tǒng)名稱并管理客戶端對(duì)文件的訪問參考答案:ABC17.下列選項(xiàng)中,關(guān)于Hadoop集群說法正確的是A、Hadoop集群包含Worker節(jié)點(diǎn)B、Hadoop集群包含Master節(jié)點(diǎn)C、Hadoop集群包含Slave節(jié)點(diǎn)D、Hadoop集群包含HMaster節(jié)點(diǎn)參考答案:BC18.下列說法中,關(guān)于使用JavaAPI操作HDFS說法正確的是A、需要引入hadoop-common依賴B、需要引入hadoop-hdfs依賴C、需要引入hadoop-client依賴D、以上說法均錯(cuò)誤參考答案:ABC19.下列說法中,關(guān)于配置參數(shù)說法錯(cuò)誤的是A、1.sources.r1.channels=c1B、a1.sinks.k1.channel=c1C、a1.source.r1.channels=c1D、a1.sinks.k1.channels=c1參考答案:CD20.下列說法中,關(guān)于zoo.cfg配置文件中的參數(shù)server.1=hadoop01:2888:3888說法正確的是A、1表示服務(wù)器的編號(hào)B、hadoop01表示這個(gè)服務(wù)器的IP地址C、2888表示表示Zookeeper服務(wù)器之間的通信心跳號(hào)D、3888表示Leader選舉的端口號(hào)參考答案:AB21.下列說法中,關(guān)于MapReduce性能調(diào)優(yōu)說法正確的是A、在數(shù)據(jù)輸入階段,采用CombineTextInputFormat來作為輸入,可以解決輸入端大量的小文件場(chǎng)景B、在Map階段,減少溢寫次數(shù),可以減少磁盤IOC、在Map階段,減少合并次數(shù),可以縮短MapReduce處理的時(shí)間D、在Shuffle階段,盡量給Shuffle提供更多的內(nèi)存空間,以防止出現(xiàn)內(nèi)存溢出現(xiàn)象參考答案:ABCD22.下列說法中,關(guān)于InputFormat接口定義的getSplits()方法說法正確的是A、用來從分片中讀取數(shù)據(jù)B、負(fù)責(zé)創(chuàng)建RecordReader對(duì)象C、實(shí)現(xiàn)了邏輯切片機(jī)制D、getSplits()方法的切片大小splitSize是由minSize、maxSize和blockSize的值確定的參考答案:CD23.配置Hadoop集群時(shí),下列哪個(gè)Hadoop配置文件需要進(jìn)行修改?A、hadoop-env.shB、profileC、ore-site.xmlD、ifcfg-eth0參考答案:AC24.客戶端上傳文件的時(shí)候哪項(xiàng)是正確的?A、數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、客戶端端將文件切分為多個(gè)Block,依次上傳C、客戶端只上傳數(shù)據(jù)到一臺(tái)DataNode,然后由NameNode負(fù)責(zé)Block復(fù)制工作D、客戶端發(fā)起文件上傳請(qǐng)求,通過RPC與NameNode建立通訊。參考答案:BD25.關(guān)于數(shù)據(jù)副本的存放策略正確的有些?A、第三個(gè)副本:與第一個(gè)副本相同機(jī)架的其他節(jié)點(diǎn)上;B、更多副本:隨機(jī)節(jié)點(diǎn)。C、第一個(gè)副本,放置在上傳文件的數(shù)據(jù)節(jié)點(diǎn);D、第二個(gè)副本,放置在與第一個(gè)副本不同的機(jī)架的節(jié)點(diǎn)上;參考答案:ABCD26.大數(shù)據(jù)中常見的類型有哪些?A、視頻B、圖片C、音頻D、日志參考答案:ABCD27.大數(shù)據(jù)技術(shù)方案為了簡(jiǎn)化并行分布式計(jì)算,采用()軟件模塊進(jìn)行處理A、JavaB、MapC、SQLD、Reduce參考答案:BD28.大數(shù)據(jù)關(guān)鍵技術(shù)包括哪些?A、大數(shù)據(jù)存儲(chǔ)B、大數(shù)據(jù)預(yù)處理C、大數(shù)據(jù)采集D、大數(shù)據(jù)分析挖掘參考答案:ABCD29.大數(shù)據(jù)的計(jì)算模式主要有哪些?A、圖計(jì)算模式B、流計(jì)算模式C、查詢分析計(jì)算模式D、批處理計(jì)算模式參考答案:ABC30.大數(shù)據(jù)采集中面臨的主要問題有以下哪些?A、如何避免重復(fù)數(shù)據(jù)B、數(shù)據(jù)源多種多樣,數(shù)據(jù)量大、變化快C、如何保證數(shù)據(jù)的質(zhì)量D、如何保證數(shù)據(jù)采集的可靠性參考答案:ABCD31.常用的HDFSAPI有哪些?A、rename()B、copyFromLocalFile()C、mkdirs()D、elete()參考答案:ABCD32.VMware提供了哪幾種工作模式?A、host-only僅主機(jī)模式B、NAT模式C、自定義除以上3種其他模式D、橋接(bridged)模式參考答案:ABD33.MapRecue的優(yōu)點(diǎn)有哪些?A、可擴(kuò)展性強(qiáng)計(jì)算機(jī)性能高B、容錯(cuò)性強(qiáng)C、開發(fā)簡(jiǎn)單D、計(jì)算機(jī)性能高參考答案:BC34.Hive數(shù)據(jù)表插入數(shù)據(jù)時(shí),insert()table……,括號(hào)中可使哪些關(guān)鍵字?A、intoB、appendC、overwriteD、add參考答案:AC35.HDFS中常用命令有下面哪些?A、hadoopfs–rmB、hadoopfs–lsC、hadoopfs–putD、hadoopfs–mv參考答案:ABCD36.Hadoop提供的自定義配置時(shí)編輯的配置文件中,包含A、core-site.xmlB、hdfs-site.xmlC、mapred-site.xmlD、yarn-site.xml參考答案:ABCD37.Hadoop生態(tài)系統(tǒng)的優(yōu)勢(shì)包含A、高擴(kuò)展B、低成本C、開源工具成熟D、型關(guān)系數(shù)據(jù)庫系統(tǒng)參考答案:ABC38.Hadoop集群具有以下哪個(gè)優(yōu)點(diǎn)?A、高容錯(cuò)性B、高成本性C、高可靠性D、高擴(kuò)展性參考答案:ACD39.Hadoop核心組成部份包含A、HDFS存儲(chǔ)系統(tǒng)B、Hive數(shù)據(jù)倉庫C、MapReduce運(yùn)算框架D、HBase分布式數(shù)據(jù)庫參考答案:AC40.Hadoop的三種安裝模式包括以下哪種?A、兩分布式模式B、完全分布式模式C、偽分布模式D、單機(jī)模式參考答案:BCD41.HadoopMapReduce對(duì)外提供了5個(gè)可編程組件,以下哪對(duì)中的方法或任務(wù)不全在這5個(gè)編程組件中A、Partitioner和CombinerB、Split和SortC、InputFormat和OutputFormatD、Mapper和Reducer參考答案:AB判斷題1.執(zhí)行“vi/etc/sysconfig/network”命令,可以配置主機(jī)名。A、正確B、錯(cuò)誤參考答案:A2.執(zhí)行“start-all.sh”指令,可以一鍵啟動(dòng)整個(gè)Hadoop集群的服務(wù)A、正確B、錯(cuò)誤參考答案:A3.在整個(gè)數(shù)據(jù)傳輸?shù)倪^程中,Flume將流動(dòng)的數(shù)據(jù)封裝到一個(gè)event(事件)中,它是Flume內(nèi)部數(shù)據(jù)傳輸?shù)幕締卧、正確B、錯(cuò)誤參考答案:A4.在大數(shù)據(jù)框架中,批處理系統(tǒng)一般不適用于對(duì)延時(shí)要示較高的場(chǎng)景。A、正確B、錯(cuò)誤參考答案:A5.在采集數(shù)據(jù)的過程中,通過在滾動(dòng)完文件的名稱后添加一個(gè)標(biāo)識(shí)的策略,不能避免因日志文件過大而導(dǎo)致上傳效率低的問題。A、正確B、錯(cuò)誤參考答案:B6.在安裝配置windows平臺(tái)hadoop,配置后直接運(yùn)行是沒有問題的A、正確B、錯(cuò)誤參考答案:B7.在安裝部署Hadoop集群之前,不需要提前安裝并配置好JDK。A、正確B、錯(cuò)誤參考答案:B8.在Windows平臺(tái)開發(fā)HDFS項(xiàng)目時(shí),若不設(shè)置Hadoop開發(fā)環(huán)境,也是沒問題的A、正確B、錯(cuò)誤參考答案:B9.在MapReduce程序中,只有Map階段涉及到Shuffle機(jī)制。A、正確B、錯(cuò)誤參考答案:B10.在Linux中,mkdir命令主要用于在指定路徑下創(chuàng)建子目錄。A、正確B、錯(cuò)誤參考答案:A11.在HDFS中,namenode用于決定數(shù)據(jù)存儲(chǔ)到哪一個(gè)datanode節(jié)點(diǎn)上。A、正確B、錯(cuò)誤參考答案:A12.在Hadoop2.x版本下,Block數(shù)據(jù)塊的默認(rèn)大小是64MA、正確B、錯(cuò)誤參考答案:B13.在/etc/hosts文件映射ip和主機(jī)名稱A、正確B、錯(cuò)誤參考答案:A14.再創(chuàng)建外部表的同時(shí)要加載數(shù)據(jù)文件,數(shù)據(jù)文件會(huì)移動(dòng)到數(shù)據(jù)倉庫指定的目錄下。A、正確B、錯(cuò)誤參考答案:B15.由于Zookeeper集群的運(yùn)行不需要Java環(huán)境支持,所以不需要提前安裝JDK。A、正確B、錯(cuò)誤參考答案:B16.由于Hive系統(tǒng)架構(gòu)中由跨語言服務(wù)ThriftServe組成,它能夠讓不同的編程語言調(diào)用Hive的接口。A、正確B、錯(cuò)誤參考答案:A17.由于Hadoop是使用Java語言編寫的,因此可以使用JavaAPI操作Hadoop文件系統(tǒng)。A、正確B、錯(cuò)誤參考答案:A18.由于Combiner組件不允許改變業(yè)務(wù)邏輯,所以無論調(diào)用多少次Combiner,Reduce的輸出結(jié)果都是一樣的。A、正確B、錯(cuò)誤參考答案:A19.因?yàn)镠DFS有多個(gè)副本,所以NameNode是不存在單點(diǎn)問題的A、正確B、錯(cuò)誤參考答案:B20.雪花模型需要關(guān)聯(lián)多層維度表,這與結(jié)構(gòu)簡(jiǎn)單的星型模型相比性能較低,所以通常不使用。A、正確B、錯(cuò)誤參考答案:A21.修改~/.bashrc文件保存后,修改的內(nèi)容能立即生效A、正確B、錯(cuò)誤參考答案:B22.寫入數(shù)據(jù)的時(shí)候會(huì)寫到不同機(jī)架的DataNode中A、正確B、錯(cuò)誤參考答案:A23.偽分布式模式下的Hadoop功能與完全分布式模式下的Hadoop功能相同A、正確B、錯(cuò)誤參考答案:B24.偽分布式模式下的Hadoop功能與完全分布式模式下的Hadoop功能相同。A、正確B、錯(cuò)誤參考答案:A25.通過使用虛擬機(jī)軟件(如VMwareWorkstation),可以在同一臺(tái)電腦上構(gòu)建多個(gè)Linux虛擬機(jī)環(huán)境A、正確B、錯(cuò)誤參考答案:A26.通過擴(kuò)容的方式,解決不了傳統(tǒng)文件系統(tǒng)遇到存儲(chǔ)瓶頸的問題。A、正確B、錯(cuò)誤參考答案:B27.數(shù)據(jù)倉庫可以作為實(shí)時(shí)查詢系統(tǒng)的數(shù)據(jù)庫使用,為決策分析提供數(shù)據(jù)。A、正確B、錯(cuò)誤參考答案:B28.使用內(nèi)嵌的Derby數(shù)據(jù)庫存儲(chǔ)元數(shù)據(jù),這種方式是Hive的默認(rèn)安裝方式,配置簡(jiǎn)單,但是一次只能連接一個(gè)客戶端,適合用來測(cè)試,不適合生產(chǎn)環(huán)境A、正確B、錯(cuò)誤參考答案:A29.使用–create-hive-table指令導(dǎo)入數(shù)據(jù)時(shí),Hive數(shù)據(jù)倉庫中必須存在指定表。A、正確B、錯(cuò)誤參考答案:B30.設(shè)置免密登錄需要先用ssh-keygen生成一對(duì)密鑰A、正確B、錯(cuò)誤參考答案:A31.設(shè)計(jì)Flume采集系統(tǒng)架構(gòu)時(shí),Sink組件數(shù)據(jù)可以流向一個(gè)新的Agent的Source組件。A、正確B、錯(cuò)誤參考答案:A32.如果一個(gè)機(jī)架出問題,Hadoop集群服務(wù)不會(huì)影響數(shù)據(jù)讀寫功能A、正確B、錯(cuò)誤參考答案:A33.如果沒有指定“–num-mappers1”(或-m1,即map任務(wù)個(gè)數(shù)為1),那么在指令中必須還要添加“–split-by”參數(shù)A、正確B、錯(cuò)誤參考答案:A34.如果NameNode意外終止,SecondaryNameNode會(huì)接替它使集群繼續(xù)工作。A、正確B、錯(cuò)誤參考答案:B35.啟動(dòng)Zookeeper服務(wù)的命令是“zkServer.shstart”A、正確B、錯(cuò)誤參考答案:A36.啟動(dòng)Hadoop所有進(jìn)程的命令是start-all.shA、正確B、錯(cuò)誤參考答案:A37.啟動(dòng)Hadoop集群時(shí),可能出現(xiàn)NodeManager進(jìn)程無法啟動(dòng)或者啟動(dòng)后自動(dòng)關(guān)閉情況,這是由于系統(tǒng)內(nèi)存和資源分配不足導(dǎo)致的A、正確B、錯(cuò)誤參考答案:A38.啟動(dòng)Hadoop集群服務(wù)之前需要格式化文件系統(tǒng)。A、正確B、錯(cuò)誤參考答案:A39.啟動(dòng)Hadoop集群,只能有一種方式啟動(dòng),即單節(jié)點(diǎn)逐個(gè)啟動(dòng)A、正確B、錯(cuò)誤參考答案:B40.配置Hadoop集群只需要修改core-site.xml配置文件就可以。A、正確B、錯(cuò)誤參考答案:B41.命名服務(wù)是分布式系統(tǒng)中比較常見的一類場(chǎng)景,發(fā)布者將需要全局統(tǒng)一管理的數(shù)據(jù)發(fā)布到Zookeeper節(jié)點(diǎn)上,供訂閱者動(dòng)態(tài)獲取數(shù)據(jù),實(shí)現(xiàn)配置信息的集中式管理和動(dòng)態(tài)更新。A、正確B、錯(cuò)誤參考答案:B42.每次啟動(dòng)Hadoop都要格式化文件系統(tǒng)A、正確B、錯(cuò)誤參考答案:B43.臨時(shí)節(jié)點(diǎn)允許擁有子節(jié)點(diǎn)。A、正確B、錯(cuò)誤參考答案:B44.鏈?zhǔn)組apReduce計(jì)算中,對(duì)任意一個(gè)MapReduce作業(yè),Map和Reduce階段可以有無限個(gè)Mapper,但Reducer只能有一個(gè)A、正確B、錯(cuò)誤參考答案:A45.客戶端上傳文件的時(shí)候會(huì)先將文件切分為多個(gè)Block,依次上傳。A、正確B、錯(cuò)誤參考答案:A46.簡(jiǎn)述ZooKeeper的功能及其在Hadoop高可用中起到的作用。A、正確B、錯(cuò)誤參考答案:A47.關(guān)于hdfs元數(shù)據(jù),Edits編輯日志中記錄了文件系統(tǒng)的所有操作A、正確B、錯(cuò)誤參考答案:B48.關(guān)于hadoopha說法,每一個(gè)集群只有一個(gè)活躍的NNA、正確B、錯(cuò)誤參考答案:A49.分區(qū)表時(shí)Hive數(shù)據(jù)模型的最小單元,在Hive存儲(chǔ)上的體現(xiàn)就是在表的主目錄下的一個(gè)子文件夾。A、正確B、錯(cuò)誤參考答案:B50.非全新集群選舉時(shí)是優(yōu)中選優(yōu),保證Leader是Zookeeper集群中數(shù)據(jù)最完整、最可靠的一臺(tái)服務(wù)器。A、正確B、錯(cuò)誤參考答案:A51.對(duì)于MapReduce任務(wù)來說,一定需要Reduce過程。A、正確B、錯(cuò)誤參考答案:B52.當(dāng)我們完成Hadoop集群的安裝和配置后,就可以直接啟動(dòng)集群。A、正確B、錯(cuò)誤參考答案:B53.當(dāng)我們配置好虛擬機(jī)的主機(jī)名和IP映射,就可以正常使用虛擬機(jī)。A、正確B、錯(cuò)誤參考答案:B54.帶有倒排索引的文件我們稱為倒排索引文件,簡(jiǎn)稱倒排文件。A、正確B、錯(cuò)誤參考答案:A55.大數(shù)據(jù)在醫(yī)療行業(yè)中可以有效控制疾病的發(fā)生。A、正確B、錯(cuò)誤參考答案:B56.大數(shù)據(jù)提供的是一些描述性的信息,而創(chuàng)新還是需要人類自己實(shí)現(xiàn)。A、正確B、錯(cuò)誤參考答案:A57.創(chuàng)建項(xiàng)目時(shí),創(chuàng)建者將自動(dòng)在項(xiàng)目上給予admin狀態(tài)。允許創(chuàng)建者查看,上傳,更改作業(yè),運(yùn)行流程,刪除并向項(xiàng)目添加用戶權(quán)限。A、正確B、錯(cuò)誤參考答案:A58.創(chuàng)建外部表的同時(shí)要加載數(shù)據(jù)文件,數(shù)據(jù)文件會(huì)移動(dòng)到數(shù)據(jù)倉庫指定的目錄下。A、正確B、錯(cuò)誤參考答案:B59.查看Linuxip的命令是ifconfigA、正確B、錯(cuò)誤參考答案:A60.采集方案中的sources、channels、sinks是在具體編寫時(shí)根據(jù)業(yè)務(wù)需求進(jìn)行配置的,可以隨意設(shè)置。A、正確B、錯(cuò)誤參考答案:B61.安裝Hadoop時(shí),配置項(xiàng)”dfs.replication”是配置在文件core-site.xmlA、正確B、錯(cuò)誤參考答案:B62.Zookeeper提供的getChildren()方法可以用于獲取指定節(jié)點(diǎn)下的所有子節(jié)點(diǎn)列表。A、正確B、錯(cuò)誤參考答案:A63.Zookeeper數(shù)據(jù)模型中的每個(gè)Znode都是由三部分組成,分別是stat、data和children。A、正確B、錯(cuò)誤參考答案:A64.Zookeeper的選舉機(jī)制,實(shí)際上是采用算法FastLeaderElection,投票數(shù)大于半數(shù)則勝出的機(jī)制。A、正確B、錯(cuò)誤參考答案:A65.target-dir參數(shù)是指定HDFS目標(biāo)目錄地址,因此需要提前創(chuàng)建目標(biāo)文件。A、正確B、錯(cuò)誤參考答案:B66.TaildirSource用于觀察指定的文件,可以實(shí)時(shí)監(jiān)測(cè)到添加到每個(gè)文件的新行,如果文件正在寫入新行,則此采集器將重試采集它們以等待寫入完成。A、正確B、錯(cuò)誤參考答案:A67.SpoolingDirectorySource對(duì)指定磁盤上的文件目錄進(jìn)行監(jiān)控并提取數(shù)據(jù),但是不能查看新增文件數(shù)據(jù)A、正確B、錯(cuò)誤參考答案:B68.sortby關(guān)鍵字的作用是保證全局有序A、正確B、錯(cuò)誤參考答案:A69.Slave節(jié)點(diǎn)要存儲(chǔ)數(shù)據(jù),所以它的磁盤越大越好。A、正確B、錯(cuò)誤參考答案:B70.SecureCRT是一款支持SSH的終端仿真程序,它能夠在Windows操作系統(tǒng)上遠(yuǎn)程連接Linux服務(wù)器執(zhí)行操作。A、正確B、錯(cuò)誤參考答案:A71.SecondaryNameNode應(yīng)與NameNode部署到一個(gè)節(jié)點(diǎn)A、正確B、錯(cuò)誤參考答案:B72.SecondaryNameNode是NameNode的熱備份A、正確B、錯(cuò)誤參考答案:B73.SecondaryNameNode是NameNode的備份,可以有效解決Hadoop集群?jiǎn)吸c(diǎn)故障問題。A、正確B、錯(cuò)誤參考答案:B74.SecondaryNameNode可以有效縮短Hadoop集群的啟動(dòng)時(shí)間。A、正確B、錯(cuò)誤參考答案:A75.Secondarynamenode就是namenode出現(xiàn)問題時(shí)的備用節(jié)點(diǎn)A、正確B、錯(cuò)誤參考答案:B76.rop內(nèi)部表時(shí),會(huì)刪除hdfs上的文件夾和元數(shù)據(jù)。A、正確B、錯(cuò)誤參考答案:A77.ResourceManager負(fù)責(zé)監(jiān)控ApplicationMaster,并在ApplicationMaster運(yùn)行失敗的時(shí)候重啟它,因此ResouceManager負(fù)責(zé)ApplicationMaster內(nèi)部任務(wù)的容錯(cuò)A、正確B、錯(cuò)誤參考答案:B78.ReduceTask作為MapReduce工作流程的后半部分,主要經(jīng)歷了Copy階段、Merge階段、Sort階段、Reduce階段和Write階段。A、正確B、錯(cuò)誤參考答案:A79.reduce()函數(shù)會(huì)將map()函數(shù)輸出的鍵值對(duì)作為輸入,把相同key值的value進(jìn)行匯總,輸出新的鍵值對(duì)A、正確B、錯(cuò)誤參考答案:A80.processor.backoff屬性默認(rèn)值為true,表示sink處理器會(huì)將失敗的sink列入黑名單。A、正確B、錯(cuò)誤參考答案:B81.NodeManager是每個(gè)節(jié)點(diǎn)上的資源和任務(wù)管理器。A、正確B、錯(cuò)誤參考答案:A82.NameNode負(fù)責(zé)管理元數(shù)據(jù)信息metadata,client端每次讀寫請(qǐng)求,它都會(huì)從磁盤中讀取或會(huì)寫入metadata信息并反饋給client端A、正確B、錯(cuò)誤參考答案:B83.NameNode負(fù)責(zé)管理元數(shù)據(jù),客戶端每次讀寫請(qǐng)求時(shí),都會(huì)從磁盤中讀取或?qū)懭朐獢?shù)據(jù)信息并反饋給客戶端。A、正確B、錯(cuò)誤參考答案:A84.NameNode的WebUI端口是50030,它通過jetty啟動(dòng)的Web服務(wù)A、正確B、錯(cuò)誤參考答案:B85.NameNode本地磁盤保存了數(shù)據(jù)塊的位置信息。A、正確B、錯(cuò)誤參考答案:B86.NameNode本地磁盤保存了Block的位置信息A、正確B、錯(cuò)誤參考答案:B87.NameNode本地磁盤保存了Block的位置信息。A、正確B、錯(cuò)誤參考答案:A88.Map階段處理數(shù)據(jù)時(shí),是按照Key的哈希值與ReduceTask數(shù)量取模進(jìn)行分區(qū)的規(guī)則。A、正確B、錯(cuò)誤參考答案:A89.MapTask作為MapReduce工作流程的前半部分,它主要經(jīng)歷Read階段、Map階段、Collect階段、Spill階段和Shuffle階段。A、正確B、錯(cuò)誤參考答案:B90.MapReduce適于PB級(jí)別以上的海量數(shù)據(jù)在線處理A、正確B、錯(cuò)誤參考答案:B91.MapReduce是Hadoop系統(tǒng)核心組件之一,它是一種可用于大數(shù)據(jù)并行處理的計(jì)算模型、框架和平臺(tái)對(duì)A、正確B、錯(cuò)誤參考答案:A92.MapReduce任務(wù)會(huì)根據(jù)機(jī)架獲取離自己比較近的網(wǎng)絡(luò)數(shù)據(jù)。A、正確B、錯(cuò)誤參考答案:A93.MapReduce計(jì)算過程中,相同的key默認(rèn)會(huì)被發(fā)送到同一個(gè)reducetask處理A、正確B、錯(cuò)誤參考答案:A94.MapReduce的數(shù)據(jù)流模型可能只有Map過程,由Map產(chǎn)生的數(shù)據(jù)直接被寫入HDFS中。A、正確B、錯(cuò)誤參考答案:A95.MapReduce的inputsplit一定是一個(gè)blockA、正確B、錯(cuò)誤參考答案:B96.MapReduce編程模型借鑒了面向過程的編程語言的設(shè)計(jì)思想。A、正確B、錯(cuò)誤參考答案:B97.MapRecue在shuffle階段基于排序的方法會(huì)將key相同的數(shù)據(jù)聚集在一起。A、正確B、錯(cuò)誤參考答案:A98.LoggerSink通常用于調(diào)試,LoggerSink接收器的不同處是它不需要在記錄原始數(shù)據(jù)部分中說明額外的配置。A、正確B、錯(cuò)誤參考答案:A99.Hive使用MySQL作為存儲(chǔ)元數(shù)據(jù)的數(shù)據(jù)庫時(shí),在安裝時(shí)需要將MySQL連接驅(qū)動(dòng)Jar包拷貝到lib目錄中。A、正確B、錯(cuò)誤參考答案:A100.Hive使用length()函數(shù)可以求出輸出的數(shù)量。A、正確B、錯(cuò)誤參考答案:B101.Hive默認(rèn)不支持動(dòng)態(tài)分區(qū)功能,需要手動(dòng)設(shè)置動(dòng)態(tài)分區(qū)參數(shù)開啟功能。A、正確B、錯(cuò)誤參考答案:A102.Hive分區(qū)字段不能與已存在字段重復(fù),且分區(qū)字段是一個(gè)虛擬的字段,它不存放任何數(shù)據(jù),該數(shù)據(jù)來源于裝載分區(qū)表時(shí)所指定的數(shù)據(jù)文。A、正確B、錯(cuò)誤參考答案:A103.Hive的復(fù)雜數(shù)據(jù)類型中,Map是有序鍵值對(duì)類型,Key值必須為原始類型,Value可以為任意類型。A、正確B、錯(cuò)誤參考答案:B104.Hive的String類型相當(dāng)于MySQL數(shù)據(jù)庫的varchar類型,該類型是一個(gè)可變長(zhǎng)度的字符串,理論上可以存儲(chǔ)2GB的字符數(shù)。A、正確B、錯(cuò)誤參考答案:A105.HDFS中提供SecondaryNameNode節(jié)點(diǎn),是為了取代掉NameNode節(jié)點(diǎn)。A、正確B、錯(cuò)誤參考答案:B106.HDFS適用于低延遲數(shù)據(jù)訪問的場(chǎng)景,例如毫秒級(jí)實(shí)時(shí)查詢。A、正確B、錯(cuò)誤參考答案:B107.HDFS上傳時(shí),數(shù)據(jù)會(huì)經(jīng)過NameNode然后再傳遞給DataNode。A、正確B、錯(cuò)誤參考答案:B108.HDFS目前不支持并發(fā)多用戶的寫操作,寫操作只能在文件末尾追加數(shù)據(jù)。A、正確B、錯(cuò)誤參考答案:A109.HDFS既適合超大數(shù)據(jù)集存儲(chǔ),也適合小數(shù)據(jù)集的存儲(chǔ)。A、正確B、錯(cuò)誤參考答案:B110.HDFS的namenode保存了一個(gè)文件包括哪些數(shù)據(jù)塊,分布在哪些數(shù)據(jù)節(jié)點(diǎn)上,這些信息也存儲(chǔ)在硬盤上A、正確B、錯(cuò)誤參考答案:B111.HDFS的namenode保存了一個(gè)文件包括哪些數(shù)據(jù)塊,分布在哪些數(shù)據(jù)節(jié)點(diǎn)上,這些信息也存儲(chǔ)在硬盤上。A、正確B、錯(cuò)誤參考答案:B112.Hadoop自身具有嚴(yán)格的權(quán)限管理和安全措施保障集群正常運(yùn)行。A、正確B、錯(cuò)誤參考答案:B113.Hadoop支持?jǐn)?shù)據(jù)的隨機(jī)讀寫A、正確B、錯(cuò)誤參考答案:B114.Hadoop在設(shè)計(jì)時(shí)考慮到數(shù)據(jù)的安全與高效,數(shù)據(jù)文件默認(rèn)在HDFS上存放一份。A、正確B、錯(cuò)誤參考答案:B115.Hadoop下使用MapRecue。用戶只要繼承MapReduceBase,提供分別實(shí)現(xiàn)Map和Reduce的兩個(gè)類,并注冊(cè)Job即可自動(dòng)分布式運(yùn)行。A、正確B、錯(cuò)誤參考答案:A116.Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架,能夠處理PB級(jí)數(shù)據(jù)A、正確B、錯(cuò)誤參考答案:A117.Hadoop是Java語言開發(fā)的,因此在搭建Hadoop集群時(shí),需要為集群安裝JDK環(huán)境變量。A、正確B、錯(cuò)誤參考答案:A118.Hadoop是IBM公司開發(fā)的一款商用大數(shù)據(jù)軟件A、正確B、錯(cuò)誤參考答案:B119.Hadoop是Apache頂級(jí)的開源項(xiàng)目A、正確B、錯(cuò)誤參考答案:A120.Hadoop實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng),簡(jiǎn)稱HDFS。A、正確B、錯(cuò)誤參考答案:A121.Hadoop集群執(zhí)行完MapReduce程序后,會(huì)輸出_SUCCESS和part-r-00000結(jié)果文件。A、正確B、錯(cuò)誤參考答案:A122.Hadoop的框架最核心的設(shè)計(jì)就是:HDFS和MapReduceA、正確B、錯(cuò)誤參考答案:A123.Hadoop的開源社區(qū)版比較著名的是Cloudera公司的CDH版本。A、正確B、錯(cuò)誤參考答案:B124.Hadoop存在多個(gè)副本,且默認(rèn)備份數(shù)量是3。A、正確B、錯(cuò)誤參考答案:A125.HadoopHA是兩臺(tái)NameNode同時(shí)執(zhí)行NameNode角色的工作。A、正確B、錯(cuò)誤參考答案:B126.HadoopHA是集群中啟動(dòng)兩臺(tái)或兩臺(tái)以上機(jī)器充當(dāng)NameNode,避免一臺(tái)NameNode節(jié)點(diǎn)發(fā)生故障導(dǎo)致整個(gè)集群不可用的情況。A、正確B、錯(cuò)誤參考答案:A127.HadoopHA集群中,存在SecondaryNameNode進(jìn)程,協(xié)調(diào)NameNode并保持同步狀態(tài)。A、正確B、錯(cuò)誤參考答案:B128.hadoopdfsadmin–report命令用于檢測(cè)HDFS損壞塊。A、正確B、錯(cuò)誤參考答案:B129.Hadoop1.x版本中,可以搭建高可用集群,解決單點(diǎn)故障問題。A、正確B、錯(cuò)誤參考答案:B130.Flume將流動(dòng)的數(shù)據(jù)封裝到一個(gè)event(事件)中,它是Flume內(nèi)部數(shù)據(jù)傳輸?shù)幕締卧?。A、正確B、錯(cuò)誤參考答案:A131.Flume負(fù)載均衡接收器處理器能夠在多個(gè)Sink上進(jìn)行均衡流量的功能。A、正確B、錯(cuò)誤參考答案:A132.Flume采集方案的名稱、位置、以及sources、channels、sinks參數(shù)配置信息可以隨定義。A、正確B、錯(cuò)誤參考答案:B133.Flume采集方案的名稱、位置、以及sources、channels、sinks參數(shù)配置信息可以任意定義A、正確B、錯(cuò)誤參考答案:A134.Flume-og與Flume-ng兩個(gè)版本基本相同,開發(fā)者可以使用任意一款工具。A、正確B、錯(cuò)誤參考答案:B135.FlumeAgent是一個(gè)JVM進(jìn)程,它承載著數(shù)據(jù)從外部源流向下一個(gè)目標(biāo)的三個(gè)核心組件是Source、Channel和Sink。A、正確B、錯(cuò)誤參考答案:A136.DataNode在客戶端或者NameNode的調(diào)度下,存儲(chǔ)并檢索數(shù)據(jù)塊,對(duì)數(shù)據(jù)塊進(jìn)行創(chuàng)建、刪除等操作。A、正確B、錯(cuò)誤參考答案:A137.DataNode是HDFS集群的主節(jié)點(diǎn),NameNode是HDFS集群的從節(jié)點(diǎn)。A、正確B、錯(cuò)誤參考答案:B138.datanode負(fù)責(zé)存儲(chǔ)數(shù)據(jù)A、正確B、錯(cuò)誤參考答案:A139.Combiner組件可以讓Map對(duì)Key進(jìn)行分區(qū),從而可以根據(jù)不同的key分發(fā)到不同的Reduce中去處理。A、正確B、錯(cuò)誤參考答案:A140.ClouderaCDH是需要付費(fèi)使用的A、正確B、錯(cuò)誤參考答案:B141.Channel組件對(duì)采集到的數(shù)據(jù)進(jìn)行緩存,可以存放在Memory或File中。A、正確B、錯(cuò)誤參考答案:A142.–append參數(shù)是將數(shù)據(jù)追加到HDFS上一個(gè)已存在的數(shù)據(jù)集上A、正確B、錯(cuò)誤參考答案:A143.“–where“city=‘sec-bad’””指令表示篩選出MySQL數(shù)據(jù)庫表字段為city=sec-bad的數(shù)據(jù)。A、正確B、錯(cuò)誤參考答案:A144.“–target-dir”參數(shù)是指定HDFS目標(biāo)目錄地址,因此需要提前創(chuàng)建目標(biāo)文件。A、正確B、錯(cuò)誤參考答案:B145.“–query”參數(shù)后的查詢語句中,如果已經(jīng)使用了WHERE關(guān)鍵字,那么在連接CONDITIONS占位符前必須使用AND關(guān)鍵字;否則,就必須使用WHERE關(guān)鍵字連接。A、正確B、錯(cuò)誤參考答案:A填空題1.在Zookeeper的選舉機(jī)制中,服務(wù)器的編號(hào)越大,則在FastLeaderElection算法中的()越大。答:權(quán)重;2.在NameNode內(nèi)部是以元數(shù)據(jù)的形式,維護(hù)著兩個(gè)文件,分別是FsImage鏡像文件和()文件答:EditLog日志;3.在MapTask的Split階段,將數(shù)據(jù)寫入本地磁盤前,要對(duì)數(shù)據(jù)進(jìn)行一次(),并在必要時(shí)對(duì)數(shù)據(jù)進(jìn)行合并、壓縮等操作。答:排序;4.在HDFS中,通過執(zhí)行()命令查看HDFS根目錄下的所有文件及文件夾。答:hadoopfs-ls;5.在HDFS寫數(shù)據(jù)的流程中,數(shù)據(jù)是以()的形式進(jìn)行發(fā)送。答:數(shù)據(jù)包;6.由于NameNode宕機(jī),導(dǎo)致無法對(duì)外提供服務(wù),可通過搭建()來解決。答:HDFSHA;7.由于HDFS存儲(chǔ)數(shù)據(jù)量過大,導(dǎo)致NameNode內(nèi)存不足,可以通過搭建()來解決。答:聯(lián)邦;8.要想使用Flume系統(tǒng),需要在當(dāng)前操作系統(tǒng)中安裝()環(huán)境變量答:JDK;9.數(shù)據(jù)倉庫是面向()、()、()和時(shí)變的數(shù)據(jù)集合,用于支持管理決策。答:主題的;集成的;非易失的;10.客戶端從HDFS中查找數(shù)據(jù),即為()數(shù)據(jù);Client從HDFS中存儲(chǔ)數(shù)據(jù),即為Write(寫)數(shù)據(jù)答:Read(讀);11.解壓Flume后,需要在()配置文件中添加JDK環(huán)境變量參數(shù)。答:flume-env.sh;12.腳本一鍵啟動(dòng)Hadoop集群服務(wù)命令是()答:start-all.sh;13.加載環(huán)境變量配置文件需要使用()命令答:source/etc/profile;14.關(guān)于hdfs元數(shù)據(jù),()維護(hù)整個(gè)文件系統(tǒng)元數(shù)據(jù)答:NameNode;15.當(dāng)Map任務(wù)寫入內(nèi)存緩存區(qū)的數(shù)據(jù)到達(dá)閥值()時(shí),會(huì)啟動(dòng)一個(gè)線程將內(nèi)存中的溢出數(shù)據(jù)寫入磁盤答:80M;16.單獨(dú)啟動(dòng)ResourceManager節(jié)點(diǎn)的命令是()答:yarn-daemon.shstartresouremanager;17.單獨(dú)啟動(dòng)NodeManager節(jié)點(diǎn)的命令是()答:yarn-daemon.shstartnodemanager;18.單獨(dú)啟動(dòng)NameNode節(jié)點(diǎn)的命令是()答:hadoop-daemon.shstartNameNode;19.單獨(dú)啟動(dòng)DateNode節(jié)點(diǎn)的命令是()答:hadoop-daemon.shstartDateNode;20.大數(shù)據(jù)的分為()、非結(jié)構(gòu)話數(shù)據(jù)和()答:結(jié)構(gòu)化數(shù)據(jù)|半結(jié)構(gòu)化數(shù)據(jù);21.大數(shù)據(jù)的5V特征包括()、()、()、()、()答:大量|高速性|多樣性|價(jià)值|真實(shí)性;22.從數(shù)據(jù)庫導(dǎo)入HDFS時(shí),指定以制表符作為字段分隔符參數(shù)是()。答:--fields-terminated-by'\t';23.Znode有兩種節(jié)點(diǎn),分別是()、()。答:永久節(jié)點(diǎn);臨時(shí)節(jié)點(diǎn);24.ResourceManager內(nèi)部包含了兩個(gè)組件,分別是調(diào)度器和()答:應(yīng)用程序管理器;25.Partitioner組件目的是()()。答:將key均勻分布在ReduceTask上;26.NameNode與DataNode通過()機(jī)制互相通信。答:心跳監(jiān)測(cè);27.NameNode以元數(shù)據(jù)形式維護(hù)著()、()_文件。答:fsimage;EditLog;28.NameNode和DataNode通過(),可以檢測(cè)DataNode是否工作。答:心跳檢測(cè)機(jī)制;29.MapReduce核心思想是()答:分而治之;30.Hive默認(rèn)元數(shù)據(jù)存儲(chǔ)在()數(shù)據(jù)庫中。答:Derby;31.HDFS在hadoop2默認(rèn)BlockSize是()答:128M;32.Hadoop集群中的節(jié)點(diǎn)()負(fù)責(zé)HDFS的數(shù)據(jù)存儲(chǔ)。答:DataNode;33.Hadoop集群中的()程序通常與NameNode在一個(gè)節(jié)點(diǎn)啟動(dòng)。答:Jobtracker;34.Hadoop集群搭建中常用的4個(gè)配置文件有()、()、()和()。答:hadoop-env.sh|core-site,xml|mapred-site,.xml|yarn-site.xml;35.Hadoop集群部署方式分別是()、()和()答:獨(dú)立模式;偽分布式模式;完全分布式模式;36.Hadoop的運(yùn)行模式有()、()和()。答:獨(dú)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論