《hadoop基礎(chǔ)練習(xí)》近年考試真題（附答案）

上傳人：服*** IP屬地：四川上傳時間：2025-12-15 格式：DOC 頁數(shù)：78 大?。?93.55KB 積分：9.6 舉報 版權(quán)申訴

已閱讀5頁，還剩73頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

《hadoop基礎(chǔ)練習(xí)》近年考試真題（附答案）單選題1.在實驗集群的master節(jié)點使用jps命令查看進(jìn)程時，終端出現(xiàn)以下哪項能說明Hadoop主節(jié)點啟動成功？A、Namenode，JobTracker，secondaryNameNodeB、Namenode，Datanode，TaskTrackerC、Namenode，Datanode，secondaryNameNodeD、Namenode，Datanode，HMaster參考答案：A2.在大數(shù)據(jù)項目規(guī)劃階段中，（）階段確認(rèn)大數(shù)據(jù)項目范圍和建設(shè)目標(biāo)。A、需求調(diào)研B、業(yè)務(wù)調(diào)研C、數(shù)據(jù)需求D、項目規(guī)劃參考答案：A3.在詞頻統(tǒng)計（WordCount）的執(zhí)行過程中，（）模塊負(fù)責(zé)進(jìn)行單詞的拆分與映射。A、MapperB、ReducerC、DriverD、Main參考答案：A4.在Python中，以下選項中能夠?qū)崿F(xiàn)Python循壞結(jié)構(gòu)的是A、loopB、do...forC、whileD、if參考答案：C5.在Python中，一個事務(wù)是一個不可分割的工作單位，事務(wù)中包括的諸操作要么都做，要么都不做說的是事務(wù)的哪個特性？A、持久性B、隔離性C、一致性D、原子性參考答案：D6.在Python中，一個事務(wù)的執(zhí)行不能被其他事務(wù)干擾，并發(fā)執(zhí)行的各個事務(wù)不互相干擾說的是事務(wù)的哪個特性？A、持久性B、隔離性C、一致性D、原子性參考答案：B7.在Python中，下面代碼的輸出結(jié)果是foriinrange（1，10，2）:print（i，end="，"）A、4B、，1.4C、7參考答案：C8.在Python中，網(wǎng)絡(luò)框架Flask是（）A、支持快速建站的框架B、企業(yè)級開發(fā)框架C、高并發(fā)處理框架D、以上全都不是參考答案：A9.在Python中，利用SAX解析XML文檔，說法錯誤的是A、包含解析器和事件處理器兩個部分B、不需要先引入任何函數(shù)或模塊C、要先引入xml.sax中的parse函數(shù)D、要先引入xml.sax.handler中的ContentHandler參考答案：B10.在Python中，利用DOM方式解析XML文檔，說法錯誤的是A、可以讀取B、可以修改C、只能讀取，不能修改D、使用xml.dom.minidom模塊來解析xml文件參考答案：C11.在Python中，可以采用“模塊”的方式來組織代碼，以下描述正確的是：A、使用模塊可能導(dǎo)致函數(shù)名和變量名沖突。B、相同名字的函數(shù)和變量完全可以分別存在不同的模塊中。C、相同名字的函數(shù)和變量完全可以存在相同同的模塊中。D、不同名字的函數(shù)和變量必須分別存在不同的模塊中。參考答案：B12.在Python中，Python程序中關(guān)于異常說法錯誤的是A、異常會影響程序的正常執(zhí)行B、異常是Python對象，表示一個錯誤C、不可以自己出發(fā)異常D、需要捕獲處理它，否則程序會終止執(zhí)行參考答案：C13.在Python中，F(xiàn)lask默認(rèn)使用的模板引擎是（）A、Jinja2B、ClickC、WerkzeugD、MarkupSafe參考答案：A14.在Python語言中語句塊的標(biāo)記是A、分號B、逗號C、縮進(jìn)D、/參考答案：C15.在Linux中，在使用匿名登錄ftp時，用戶名為（）A、GuestB、userC、rootD、anonymous參考答案：D16.在Linux中，用FTP一次上傳多個文件可以用命令（）A、getB、putC、mgetD、mput參考答案：D17.在Linux中，以下可以切換登錄賬號的命令是（）A、superB、passwdC、tarD、su參考答案：D18.在Linux中，需要統(tǒng)計test.txt文件的行數(shù)，使用的命令是A、wc-ltest.txtB、who＆gt;test.txtC、echo“helloworld”＆gt;test.txtD、echo“hello:world”＆gt;＆gt;test.txt參考答案：A19.在Linux中，假設(shè)變量a為10，變量b為20，以下表達(dá)式返回為false的是：A、[$$a-ne$$b]B、[$$a-le$$b]C、[!false]D、[$$a-gt$$b]參考答案：D20.在Linux中，徹底終止進(jìn)程123456，輸入的命令是A、kill123456B、kill-9123456C、kill-HUPpidD、kill-l參考答案：B21.在Linux中，查看啟動失敗的服務(wù)列表，命令如下A、systemctlis-enabledfirewalldB、systemctlenablefirewalldC、systemctl--failedD、systemctllist-unit-files|grepenabled參考答案：C22.在Job類中對輸出鍵值對格式進(jìn)行設(shè)置時，如果Mapper的輸出格式與Reducer的輸出格式一樣，那么可以省略下列（）設(shè)置。A、job.setOutputKeyClass（）與job.setOutputValueClass（）B、job.setMapOutputKeyClass（）與job.setMapOutputValueClass（）C、job.setReduceOutputKeyClass（）與job.setReduceOutputValueClass（）D、以上都不能省略參考答案：B23.在Java中，以下哪個不是Xml文檔的節(jié)點類型A、ElementB、BlankC、AttributeD、Text參考答案：B24.在Java中，以下方法用于定義線程任務(wù)代碼的是A、start（）B、init（）C、run（）D、main（）參考答案：C25.在Java中，下面讓線程休眠1分鐘的正確方法是A、sleep（1）B、sleep（60）C、sleep（1000）D、sleep（60000）參考答案：D26.在Java中，下面哪個類使用了緩沖技術(shù)A、BufferedOutputStreamB、FileInputStreamC、ObjectOutputStreamD、FileReader參考答案：A27.在Java中，如果在關(guān)閉socket時發(fā)生一個I/O錯誤，會拋出A、IOExceptionB、UnknownHostExceptionC、SocketExceptionD、MalformedURLException參考答案：A28.在Java中，關(guān)于同步方法描述錯誤的是A、同步方法比同步代碼塊更容易控制同步范圍B、非靜態(tài)同步方法的鎖對象就是this當(dāng)前對象本身C、靜態(tài)同步方法的鎖對象是所屬類的類類型（字節(jié)碼文件）D、同步方法和同步代碼塊使相同的關(guān)鍵字來修飾參考答案：A29.在Java中，多線程具備的優(yōu)點不包括下列A、可以使某個功能執(zhí)行效率更高B、解決同時訪問并發(fā)問題C、避免某個操作太耗時造成卡死狀況D、可以提升系統(tǒng)的可維護(hù)可擴展性參考答案：D30.在Java中，InetAddress類中哪個方法可以獲取主機IP地址A、isReachable（）B、getHostAddress（）C、getHostName（）D、getByName（）參考答案：B31.在Java中，F(xiàn)ile類中哪個方法可以判斷文件是否存在？A、exists（）B、isFile（）C、isDirectory（）D、isHidden（）參考答案：A32.在HDFS文件系統(tǒng)根目錄下創(chuàng)建一個名為mydir的文件夾的命令是（）。A、hdfs.create（newPath（“hdfs:/mydir”））B、hdfs.open（newPath（“hdfs:/mydir”））C、hdfs.mkdirs（“hdfs:/mydir”）D、hdfs.mkdirs（newPath（“hdfs:/mydir”））參考答案：D33.與Hadoop1.x相比，Hadoop2.x采用全新的架構(gòu)，最明顯的變化就是增加了哪個組件？A、MapReduceB、PigC、HBaseD、Yarn參考答案：D34.有關(guān)MapReduce的輸入輸出，說法錯誤的是A、鏈接多個MapReduce作業(yè)時，序列文件是首選格式B、FileInputFormat中實現(xiàn)的getSplits（）可以把輸入數(shù)據(jù)劃分為分片，分片數(shù)目和大小任意定義C、想完全禁止輸出，可以使用NullOutputFormatD、每個reduce需將它的輸出寫入自己的文件中，輸出無需分片參考答案：B35.用什么命令可以將ZooKeeper文件遠(yuǎn)程拷貝到其他機器？A、spcB、scpC、sendD、post參考答案：B36.以下選項哪個是MapReduce正確的運行模型（）A、Reduce-Map-ShuffleB、Shuffle-Map-ReduceC、Map-Shuffle-ReduceD、Map-Reduce-Shuffle參考答案：C37.以下說法不正確的是A、HadoopStreaming使用Unix中的流與程序交互B、HadoopStreaming允許我們使用任何可執(zhí)行腳本語言處理數(shù)據(jù)流C、采用腳本語言時必須遵從UNIX的標(biāo)準(zhǔn)輸入STDIN，并輸出到STDOUTD、Reduce沒有設(shè)定，上述命令運行會出現(xiàn)問題參考答案：D38.以下哪一項不屬于Hadoop可以運行的模式（）。A、單機（本地）模式B、偽分布式模式C、互聯(lián)模式D、分布式模式參考答案：C39.以下哪個不是HDFS的進(jìn)程（）A、SecondaryNodeB、NameNodeC、ResourceManagerD、DataNode參考答案：C40.以下對Combiner描述錯誤的是（）A、Combiner的作用提高程序執(zhí)行效率B、Combiner的作用減少對本地磁盤的訪問次數(shù)。C、Combiner過程設(shè)置則執(zhí)行，否則不執(zhí)行D、Combiner過程對job意義。參考答案：D41.以下（）文件中主要用來配置ResourceManager，NodeManager的通信端口，web監(jiān)控端口等。A、core-site.xmlB、mapred-site.xmlC、hdfs-site.xmlD、yarn-site.xml參考答案：D42.下面與Zookeeper類似的框架是？A、ProtobufB、JavaC、KafkaD、Chubby參考答案：D43.下面有關(guān)NameNode和DataNode之間的Hearbeat說法錯誤的是（）A、DataNode通過發(fā)送Heartbeat告訴NameNode自己還"活著"，并且工作正常B、HeatBeat包含DataNode狀態(tài)相關(guān)信息C、NameNode回復(fù)HeartBeat一些DatanodeCommandD、如果NameNode在某一固定時間內(nèi)沒有收到Datanode的Heatbeat，那么它會要求DataNode發(fā)送Heartbeat參考答案：D44.下面那個不是MapReduce的特點?（）A、易于編程B、良好的擴展性C、低容錯性D、適合PB級以上海量數(shù)據(jù)的離線處理參考答案：C45.下面哪一項不是MapReduce體系結(jié)構(gòu)主要部分？A、ClientB、JobTrackerC、TaskTracker以及TaskD、Job參考答案：A46.下面哪個命令是用來定義shell的全局變量：A、exportfsB、B.aliasC、C.exportsD、D.export參考答案：D47.下面哪個程序負(fù)責(zé)HDFS數(shù)據(jù)存儲。A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNode參考答案：C48.下面關(guān)于Shuffle過程描述正確的是（）A、Job作業(yè)必須要實現(xiàn)Combiner過程。B、分組操作發(fā)生在溢寫過程C、分組的目的是提高Job執(zhí)行效率。D、壓縮目的是提高效率。參考答案：D49.下面對FsImage的描述，哪個是錯誤的？A、FsImage文件沒有記錄每個塊存儲在哪個數(shù)據(jù)節(jié)點B、FsImage文件包含文件系統(tǒng)中所有目錄和文件inode的序列化形式C、FsImage用于維護(hù)文件系統(tǒng)樹以及文件樹中所有的文件和文件夾的元數(shù)據(jù)D、FsImage文件記錄了每個塊具體被存儲在哪個數(shù)據(jù)節(jié)點參考答案：D50.下列選項中，哪一個命令用于刪除文件？A、hadoopB、hadoopC、hadoopD、hadoop參考答案：B51.下列選項中，哪一個不屬于Zookeeper應(yīng)用？（）A、數(shù)據(jù)發(fā)布和訂閱B、負(fù)載均衡C、配置管理D、數(shù)據(jù)倉庫參考答案：D52.下列選項中，關(guān)于HBase和BigTable的底層技術(shù)對應(yīng)關(guān)系，哪個是錯誤的？A、GFS與HDFS相對應(yīng)B、GFS與Zookeeper相對應(yīng)C、MapReduce與HadoopMapReduce相對應(yīng)D、Chubby與Zookeeper相對應(yīng)參考答案：B53.下列選項描述錯誤的是？（）A、HadoopHA即集群中包含SecondaryNameNode作為備份節(jié)點存在。B、ResourceManager負(fù)責(zé)的是整個Yarn集群資源的監(jiān)控、分配和管理工作C、NodeManager負(fù)責(zé)定時的向ResourceManager匯報所在節(jié)點的資源使用情況以及接收并處理來自ApplicationMaster的啟動停止容器（Container）的各種請求。D、初次啟動HadoopHA集群時，需要將格式化文件系統(tǒng)后的目錄拷貝至另外一臺NameNode節(jié)點上。參考答案：A54.下列說法錯誤的是（）A、MapReduce中maperconbinerreducer缺一不可B、在JobConf中InputFormat參數(shù)可以不設(shè)C、在JobConf中MapperClass參數(shù)可以不設(shè)D、在JobConf中OutputKeyComparator參數(shù)可以不設(shè)參考答案：A55.下列哪一個不屬于大數(shù)據(jù)產(chǎn)業(yè)的產(chǎn)業(yè)鏈環(huán)節(jié)？A、數(shù)據(jù)循環(huán)層B、數(shù)據(jù)源層C、數(shù)據(jù)分析層D、數(shù)據(jù)應(yīng)用層參考答案：A56.下列哪些操作可以設(shè)置一個監(jiān)聽器WatcherA、getDataB、getChildrenC、existsD、setData參考答案：D57.下列哪項通常是集群的最主要瓶頸（）。A、CPUB、網(wǎng)絡(luò)C、磁盤IOD、內(nèi)存參考答案：C58.下列哪項通常是集群的最主要的性能瓶頸？（）A、CPUB、網(wǎng)絡(luò)C、磁盤D、內(nèi)存參考答案：C59.下列哪項是Hadoop生態(tài)系統(tǒng)中Spark的功能？A、處理大規(guī)模數(shù)據(jù)的腳本語言B、工作流和協(xié)作服務(wù)引擎，協(xié)調(diào)Hadoop上運行的不同任務(wù)C、不支持DAG作業(yè)的計算框架D、基于內(nèi)存的分布式并行編程框架，具有較高的實時性，并且較好支持迭代計算參考答案：D60.下列哪個程序通常與NameNode在一個節(jié)點啟動？A、SecondaryNameNodeB、DataNodeC、TaskTrackerD、Jobtracker參考答案：D61.下列命令中（在zookeeper安裝文件夾的bin目錄下執(zhí)行），哪項是停止ZooKeeper的正確命令（）A、start-all.shB、start-stop.shC、zkServer.shstopD、zkServer.shstart參考答案：C62.下列關(guān)于流計算的說法，哪項是錯誤的？A、實時獲取來自不同數(shù)據(jù)源的海量數(shù)據(jù)，經(jīng)過實時分析處理，獲得有價值的信息B、流計算秉承一個基本理念，即數(shù)據(jù)的價值隨著時間的流逝而降低C、對于一個流計算系統(tǒng)來說，它應(yīng)該支持TB級甚至是PB級的數(shù)據(jù)規(guī)模D、流計算只需要保證較低的延遲時間，即只達(dá)到秒級別即可處理一切問題參考答案：D63.下列關(guān)于Storm和Hadoop架構(gòu)組件功能對應(yīng)關(guān)系，哪個是錯誤的？A、HadoopJob對應(yīng)StormTopologyB、HadoopTaskTracker對應(yīng)StormSupervisorC、HadoopJobTracker對應(yīng)StormSpoutD、HadoopReduce對應(yīng)StormBolt參考答案：C64.下列關(guān)于MPI敘述不正確的一項是（）。A、MPI是一個信息傳遞應(yīng)用程序的接口B、MPI程序經(jīng)常在共享內(nèi)存的機器上使用C、MPI并行計算增加高層并行編程模型D、MPI缺少統(tǒng)一的計算框架支持參考答案：C65.下列關(guān)于MapReduce的說法，哪個描述是錯誤的？A、MapReduce具有廣泛的應(yīng)用，比如關(guān)系代數(shù)運算、分組與聚合運算等B、MapReduce將復(fù)雜的、運行于大規(guī)模集群上的并行計算過程高度地抽象到了兩個函數(shù)C、編程人員在不會分布式并行編程的情況下，也可以很容易將自己的程序運行在分布式系統(tǒng)上，完成海量數(shù)據(jù)集的計算D、不同的Map任務(wù)之間可以進(jìn)行通信參考答案：D66.下列關(guān)于MapReduce的基本思想敘述不正確的一項是（）。A、對相互間具有計算機以來關(guān)系的大數(shù)據(jù)進(jìn)行分而治之。B、用Map和Reduce兩個函數(shù)提供了高層并行編程抽象模型。C、提供了同一框架D、為程序員隱藏系統(tǒng)細(xì)節(jié)參考答案：A67.下列關(guān)于HBase系統(tǒng)分層架構(gòu)敘述不正確的一項為（）。A、HDFS提供了HBase的頂層物理存儲結(jié)構(gòu)B、Hadoop平臺提供了存儲基礎(chǔ)結(jié)構(gòu)：Hadoop集群及系統(tǒng)軟件C、客戶端：提供了數(shù)據(jù)庫訪問接口D、RegionServer：管理多個regions并提供數(shù)據(jù)訪問服務(wù)參考答案：A68.下列大數(shù)據(jù)特點中錯誤的是（）。A、數(shù)據(jù)體量大B、數(shù)據(jù)種類多C、處理速度快D、價值密度高參考答案：D69.下列（）命令可以顯示出HDFS目錄/user/root中的內(nèi)容。A、hdfsdfs-dir/user/root/B、hdfsdfs-report/user/root/C、hdfsdfs-ls/user/root/D、hdfsdfs-display/user/root/參考答案：C70.調(diào)用Zookeeper對象創(chuàng)建的節(jié)點，不包括（）。A、持久節(jié)點B、臨時節(jié)點C、持久順序節(jié)點D、DataNode節(jié)點參考答案：D71.數(shù)據(jù)建模中，（）模型，主要基于用戶的數(shù)據(jù)功能需求產(chǎn)生。A、概念B、數(shù)據(jù)C、邏輯D、物理參考答案：A72.屬于Hadoop各組件之間通信協(xié)議（）A、ServerProtocolB、DatanodeProtocolC、NameProtocolD、SecondaryProtocol參考答案：B73.使用jar操作運行Hadoop中自帶的jar進(jìn)行單詞的統(tǒng)計（）A、cd-jarhadoop/share/hadoop/mapreduce/B、cdhadoop/share/hadoop/mapreduce/C、cdjar/hadoop/share/hadoop/mapreduce/D、cd/hadoop/share/hadoop/mapreduce/參考答案：B74.如何禁用reduce階段（）A、設(shè)置conf.setNumreduceTasks（0）B、設(shè)置job.setNumreduceTasks（0）C、設(shè)置job.setNumreduceTasks（1）D、設(shè)置job.setNumreduceTasks（）=0參考答案：B75.啟動集群的順序為（）。①start-dfs.sh、②start-yarn.sh、③mr-jobhistory-daemon.shstarthistoryserverA、①②③B、②①③C、③②①D、③①②參考答案：A76.配置主機名和IP地址映射的文件位置是（）A、/home/hostsB、/usr/local/hostsC、/etc/hostD、/etc/hosts參考答案：D77.配置Hadoop文件參數(shù)時，配置項“dfs.replication”應(yīng)該配置在哪個文件？（）A、core-site.xmlB、hdfs-site.xmlC、mapred-site.xmlD、yarn-site.xml參考答案：B78.默認(rèn)端口50070的作用是（）。A、查看HDFS監(jiān)控B、查看YARN監(jiān)控C、查看日志監(jiān)控D、不確定參考答案：A79.將數(shù)據(jù)更新寫入（），只有其寫入完成后，commit（）才返回給客戶端。A、ZookeeperB、HMasterC、RegionServerD、HLog參考答案：D80.關(guān)于文檔數(shù)據(jù)庫的說法，下列哪一項是錯誤的？A、數(shù)據(jù)是規(guī)則的B、性能好（高并發(fā)）C、缺乏統(tǒng)一的查詢語法D、復(fù)雜性低題參考答案：A81.關(guān)于基于Hadoop的MapReduce編程的環(huán)境配置，下面哪一步是不必要的（）A、安裝linux或者在Windows下安裝CgywinB、安裝javaC、安裝MapReduceD、配置Hadoop參數(shù)參考答案：C82.關(guān)于SecondaryNameNode哪項是正確的？（）A、它是NameNode的熱備B、它的目的是幫助NameNode合并編輯日志，減少NameNode啟動時間C、它對內(nèi)存沒有要求D、SecondaryNameNode應(yīng)與NameNode部署到一個節(jié)點參考答案：B83.關(guān)于MapReducejavaAPI說法錯誤的是？A、新的API傾向于使用接口，而不是抽象類B、新的API實現(xiàn)了配置的統(tǒng)一C、新的API傾向于使用抽象類，而不是接口D、新的API充分使用上下文對象context，允許用戶能與MapReduce系統(tǒng)通信參考答案：A84.關(guān)于MapReduce1和YARN的對比錯誤的是？A、MapReduce1由JobTracker負(fù)責(zé)作業(yè)調(diào)度與任務(wù)監(jiān)控B、YARN的作業(yè)調(diào)度和任務(wù)監(jiān)控都是由ResourceManager組件完成C、MapReduce1的任務(wù)節(jié)點叫做TaskTracker，而Yarn的任務(wù)節(jié)點為NodeManagerD、MapReduce1的資源調(diào)配單元為Slot，而Yarn的資源調(diào)配單元為Container參考答案：B85.關(guān)于Hadoop單機模式和偽分布式模式的說法，正確的是A、兩者都起守護(hù)進(jìn)程，且守護(hù)進(jìn)程運行在一臺機器上B、單機模式不使用HDFS，但加載守護(hù)進(jìn)程C、兩者都不與守護(hù)進(jìn)程交互，避免復(fù)雜性D、后者比前者增加了HDFS輸入輸出以及可檢查內(nèi)存使用情況參考答案：D86.對于mapper類中的setup方法不正確的是？A、此方法被MapReduce框架僅且執(zhí)行一次B、在執(zhí)行map任務(wù)前，進(jìn)行相關(guān)變量或者資源的集中初始化工作C、在執(zhí)行map任務(wù)后，進(jìn)行相關(guān)變量或者資源的集中初始化工作D、將資源初始化工作放在map方法中，導(dǎo)致程序運行效率降低參考答案：C87.對Client/Server系統(tǒng)而言，（）的吞吐率是指對單個客戶而言服務(wù)器在單位時間內(nèi)完成的該客戶提交的任務(wù)數(shù)目。A、服務(wù)器端B、客戶端C、系統(tǒng)端D、管理員端參考答案：B88.典型的NoSQL數(shù)據(jù)庫是（）A、HiveB、MySQLC、HbaseD、Oracle參考答案：C89.當(dāng)啟動一個SparkShell時，SparkShell已經(jīng)預(yù)先創(chuàng)建好一個SparkContext對象，其變量名為（）A、scB、ccC、snD、nc參考答案：A90.當(dāng)客戶端需要讀取HDFS中存儲的文件時，首先向（）發(fā)起讀請求。A、DataNodeB、NameNodeC、YarnD、Zookeeper參考答案：B91.大數(shù)據(jù)的特點不包括（）。A、數(shù)量大B、類型少C、速度快D、價值高參考答案：B92.大數(shù)據(jù)的分布式計算使用下面哪項技術(shù)？（）A、HDFSB、MapReduceC、NutchD、Hive參考答案：B93.大數(shù)據(jù)產(chǎn)業(yè)指什么？A、一切與支撐大數(shù)據(jù)組織管理和價值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟(jì)活動的集合B、提供智能交通、智慧醫(yī)療、智能物流、智能電網(wǎng)等行業(yè)應(yīng)用的企業(yè)C、提供數(shù)據(jù)分享平臺、數(shù)據(jù)分析平臺、數(shù)據(jù)租售平臺等服務(wù)的企業(yè)D、提供分布式計算、數(shù)據(jù)挖掘、統(tǒng)計分析等服務(wù)的各類企業(yè)參考答案：A94.Zookeeper啟動時會最多監(jiān)聽幾個端口A、1B、2C、3D、4參考答案：B95.ZooKeeper集群的機器數(shù)量一般有什么要求？A、一般為單數(shù)臺機器B、一般為雙數(shù)臺機器C、一般沒有要求D、有要求，但要求不高參考答案：A96.YARN的調(diào)度器不包括以下哪種？A、FIFOSchedulerB、FairSchedulerC、CapacitySchedulerD、StackScheduler參考答案：D97.Sqoop工具接收到命令后通過任務(wù)翻譯器，將命令轉(zhuǎn)換為（）A、MapReduce任務(wù)B、Translate任務(wù)C、Map任務(wù)D、Reduce任務(wù)參考答案：A98.NameNode節(jié)點主要工作是（）A、存儲大量的數(shù)據(jù)B、元數(shù)據(jù)的管理C、NameNode節(jié)點和DataNode節(jié)點主要負(fù)責(zé)的工作一樣D、以上都正確參考答案：C99.MapReduce中哪一種文件輸入格式可以自動切割并合并小文件?（）A、NLinelmputFormatB、TextInputFormatC、CombineFileInputFormatD、KeyValueTextInputFormat參考答案：C100.MapReduce中可能引起負(fù)載問題的原因有哪些？（）A、MapReduce需要處理的數(shù)據(jù)量過大B、數(shù)據(jù)本身的格式問題，例如：文檔格式混亂C、DataNode節(jié)點與Map節(jié)點不在一起D、Map中Key值選取和設(shè)定問題，導(dǎo)致Key值過于集中參考答案：D101.MapReduce框架提供了一種序列化鍵/值對的方法，支持這種序列化的類能夠在Map和Reduce過程中充當(dāng)鍵或值，以下說法錯誤的是A、實現(xiàn)Writable接口的類是值B、實現(xiàn)WritableComparable接口的類可以是值或鍵C、Hadoop的基本類型Text并不實現(xiàn)WritableComparable接口D、鍵和值的數(shù)據(jù)類型可以超出Hadoop自身支持的基本類型參考答案：C102.MapReduce框架的核心步驟主要是（）A、MapB、ShuffleC、ReduceD、Map和Reduce參考答案：D103.MapReduce將整個并行計算過程抽象到那兩個函數(shù)（）A、mapsreduceB、mapreduceC、mapreducesD、mapsreduces參考答案：B104.MapReduce處理流程中Reduce如何獲取Map端結(jié)果（）A、Map端發(fā)送B、Reduce端獲取C、Map端發(fā)送到中間管理節(jié)點，Reduce統(tǒng)一獲取D、隨機發(fā)送參考答案：B105.Linux和Unix之間的關(guān)系是A、Linux是一種類Unix系統(tǒng)，Linux是由Unix衍生來的B、Linux和Unix之間不存在關(guān)聯(lián)C、Linux是Unix的前生，Unix包含Linux的功能D、相比于Linux，Unix最大的創(chuàng)新點是開源免費參考答案：A106.Hive包括（）中連接模式。A、二B、四C、三D、五參考答案：C107.HDFS中的block默認(rèn)保存幾個備份。A、1B、2C、3D、4參考答案：C108.HDfS中的block默認(rèn)保存幾份？答案A默認(rèn)3分A、3份B、2份C、1份D、不確定參考答案：A109.HDFS是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的，默認(rèn)的最基本的存儲單位是64M，具有高容錯、高可靠性、高擴展性、高吞吐率等特征，適合的讀寫任務(wù)是A、一次寫入，少次讀寫B(tài)、多次寫入，少次讀寫C、一次寫入，多次讀寫D、多次寫入，多次讀寫參考答案：C110.HDFS默認(rèn)BlockSize的大小是（）。A、32MBB、64MBC、128MBD、256M參考答案：B111.HBase在新建表的時候必須指定表名和（），不需要指定列，所有的列在后續(xù)添加數(shù)據(jù)的時候動態(tài)添加。A、行B、單元格C、時間戳D、列族參考答案：D112.Hadoop實現(xiàn)了什么樣的系統(tǒng)A、操作系統(tǒng)B、數(shù)據(jù)管理系統(tǒng)C、數(shù)據(jù)整合系統(tǒng)D、分布式文件系統(tǒng)參考答案：D113.Hadoop集群的關(guān)閉命令是？（）A、stop-dfs.shB、stop-yarn.shC、stop-all.shD、stop-hadoop.sh參考答案：C114.Hadoop的作者是哪一位（）A、MartinFowlerB、DougCuttingC、KentBeckD、GraceHopper參考答案：B115.Hadoop2的計算框架叫什么？（）A、MppB、Map/ReduceC、ARMD、Spark參考答案：B116.Hadoop2.0中HDFS默認(rèn)BlockSizeA、32MBB、64MBC、128MBD、256MB參考答案：C117.DougCutting所創(chuàng)立的項目的名稱都受到其家人的啟發(fā)，以下項目不是由他創(chuàng)立的項目是A、HadoopB、NutchC、LuceneD、Solr參考答案：D118.Client端上傳文件到HDFS上的時候下列正確的是（）A、數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、數(shù)據(jù)副本將以管道的方式依次傳遞C、Client將數(shù)據(jù)寫到一臺DataNode上，并由Client負(fù)責(zé)完成Block復(fù)制工作D、當(dāng)某個DataNode失敗，客戶端不會繼續(xù)傳給其它的DataNode參考答案：B119.（）模式：hadoop安裝時的默認(rèn)模式，不對配置文件進(jìn)行修改。A、聯(lián)機B、單機C、虛擬分布D、完全分布參考答案：B多選題1.資源共享池中資源類型包括（）A、存儲量B、處理能力C、內(nèi)存量D、網(wǎng)絡(luò)帶寬參考答案：ABCD2.在YARN體系結(jié)構(gòu)中，ApplicationMaster主要功能包括哪些？A、當(dāng)用戶作業(yè)提交時，ApplicationMaster與ResourceManager協(xié)商獲取資源，ResourceManager會以容器的形式為ApplicationMaster分配資源B、把獲得的資源進(jìn)一步分配給內(nèi)部的各個任務(wù)（Map任務(wù)或Reduce任務(wù)），實現(xiàn)資源的“二次分配”C、定時向ResourceManager發(fā)送“心跳”消息，報告資源的使用情況和應(yīng)用的進(jìn)度信息D、向ResourceManager匯報作業(yè)的資源使用情況和每個容器的運行狀態(tài)參考答案：ABC3.在Python中，Python網(wǎng)絡(luò)框架可以省去開發(fā)者處理網(wǎng)絡(luò)應(yīng)用底層的（）A、協(xié)議B、線程C、邏輯D、進(jìn)程參考答案：ABD4.在Python中，pymysql連接數(shù)據(jù)庫進(jìn)行封裝的好處是？A、減少代碼量B、提高可維護(hù)性C、可以減少代碼錯誤D、安全參考答案：ABD5.在Python中，F(xiàn)lask框架的安裝方式有哪些？（）A、使用PyCharmB、命令行C、使用InstallerD、使用nmp參考答案：AB6.在Linux系統(tǒng)中，用戶組操作的常用命令有（）A、groupaddB、groupmodC、newgrpD、groupdelete參考答案：ABC7.在Java中，以下哪些方法是線程類Thread提供的方法A、wait（）B、sleep（）C、yield（）D、join（）參考答案：BCD8.在Java中，對單例模式優(yōu)點描述正確的是A、單例模式在內(nèi)存中只有一個實例，減少了內(nèi)存開支。B、單例模式只生成一個實例，所以減少了系統(tǒng)的性能開銷。C、單例模式可以避免對資源的多重占用。D、單例模式在開發(fā)中很容易擴展。參考答案：ABC9.在Hadoop的分區(qū)階段，不是默認(rèn)的Partitioner是（）A、HashParB、PartitionerC、HashPartitionerD、Hmapper參考答案：ACD10.在CentoOS中，一般用什么命令來查看IP地址A、ipaB、B.ipaddrC、C.winipcfgD、D.ifconfig參考答案：ABD11.以下那些是HDFS的設(shè)計特點？A、超大文件B、流式數(shù)據(jù)訪問C、不能處理低時間延遲的數(shù)據(jù)訪問D、存放大量小文件參考答案：ABC12.以下哪些軟件可以對HBase進(jìn)行性能監(jiān)視？A、Master-status（自帶）B、GangliaC、OpenTSDBD、Ambari參考答案：ABCD13.以下關(guān)于序列化Writable的說法正確的是？A、反序列化也稱反串行化，它是指將字節(jié)流轉(zhuǎn)回結(jié)構(gòu)化對象的逆過程。B、Hadoop中使用自己開發(fā)的類：IntWritable、FloatWritable、Text等，都是Writable的實現(xiàn)類。C、序列化和反序列化在分布式數(shù)據(jù)處理中，主要于進(jìn)程間通信和永久存儲兩個領(lǐng)域。D、Writable接口是一個序列化對象的接口，能夠?qū)?shù)據(jù)寫入流或者從流中讀出。參考答案：ABCD14.以下關(guān)于文件塊的說法正確的是?A、文件的所有Block為了容錯都會被冗余復(fù)制。B、除了最后一個Block，所有的Block都是同樣的大小。C、每個文件的Block大小和復(fù)制（Replication）因子都是可配置的。D、HDFS將文件存儲成塊序列。參考答案：ABCD15.以下關(guān)于MapReduce組件缺點描述錯誤的有（）。A、不適合實時計算B、不適合流式計算C、不易于編程D、容錯性較差參考答案：CD16.下面哪幾個屬于Reducer階段（）A、ShuffleB、SortC、MapD、Reduce參考答案：ABD17.下面哪個屬于大數(shù)據(jù)的應(yīng)用領(lǐng)域？A、智能醫(yī)療研發(fā)B、監(jiān)控身體情況C、實時掌握交通狀況D、金融交易參考答案：ABCD18.下面哪個屬于不斷完善的Hadoop生態(tài)系統(tǒng)中的組件？A、PigB、TezC、KafkaD、DN8參考答案：ABC19.下面關(guān)于Shuffle過程中節(jié)點本地磁盤描述正確的是（）A、節(jié)點的本地磁盤可以有多個map輸出的最終文件B、節(jié)點的本地磁盤文件可能來自多個環(huán)形緩沖區(qū)的溢寫文件C、其它節(jié)點可以到當(dāng)前節(jié)點拷貝map輸出的文件D、其它節(jié)點到當(dāng)前節(jié)點拷貝map輸出文件使用的協(xié)議是HTTP參考答案：ABCD20.下面關(guān)于NoSQL與關(guān)系數(shù)據(jù)庫的比較，哪些是正確的？A、關(guān)系數(shù)據(jù)庫以完善的關(guān)系代數(shù)理論作為基礎(chǔ)，有嚴(yán)格的標(biāo)準(zhǔn)B、關(guān)系數(shù)據(jù)庫可擴展性較差，無法較好支持海量數(shù)據(jù)存儲C、NoSQL可以支持超大規(guī)模數(shù)據(jù)存儲D、NoSQL數(shù)據(jù)庫缺乏數(shù)學(xué)理論基礎(chǔ)，復(fù)雜查詢性能不高參考答案：ABCD21.下面對HBase的描述哪些是正確的？A、不是開源的B、是面向列的C、是分布式的D、是一種NoSQL數(shù)據(jù)庫參考答案：BCD22.下列選項中，屬于MapReduce優(yōu)點的是（）。A、易于編程B、適合實時計算C、有良好的擴展性D、有較高的容錯性參考答案：ACD23.下列選項中，哪些命令可以用于查看文件內(nèi)容？（）A、hadoopB、hadoopC、hadoopD、hadoop參考答案：BCD24.下列選項哪些是ZooKeeper的應(yīng)用場景？A、Master選舉B、分布式鎖C、數(shù)據(jù)發(fā)布與訂閱D、心跳檢測NameNode參考答案：ABCD25.下列選項參數(shù)是Sqoop指令的是?（）A、importB、outputC、inputD、export參考答案：AD26.下列說法正確的是（）A、Reducer基類中沒有run（）方法。B、Map中的run（）:相當(dāng)于MapTask的驅(qū)動。C、Map中的run（）首先調(diào)用setup（）方法進(jìn)行初始化操作.D、Map中的run（）方法提供了setup（）-->map（）-->cleanup（）的執(zhí)行模板參考答案：BCD27.下列說法不正確的是（）A、map階段不可對數(shù)據(jù)分組后的數(shù)據(jù)進(jìn)行歸約。B、Map和reduce一般不搭配使用。C、Shuffle的大概意思是打亂數(shù)據(jù)。D、Mapreduce程序不經(jīng)過shffule階段。參考答案：AB28.下列哪一項不屬于Hadoop的特性？A、較低可擴展性B、只支持java語言C、成本低D、運行在Linux平臺上參考答案：AB29.下列哪些是可以用在hdfs上的指令A(yù)、catB、-getC、-rmD、-put參考答案：BCD30.下列描述正確的有（）A、NullWritable：當(dāng)＜key，value>中的key或value為空時使用B、Text：使用UTF8格式存儲的文本C、Text類型需要用.toString（）方法才能轉(zhuǎn)換為java的String類型。D、NullWritable和java中的不需要做任何操作就是java中null。參考答案：ABC31.下列描述錯誤的是（）A、write（）是把每個對象反序列化到輸出流。B、readFields（）是把輸入流字節(jié)序列化。C、重寫hashCode（）、equals（）方法是為咯java對象比較。D、重寫compareTo（）是為咯java對象的比較。參考答案：AB32.下列關(guān)于HLog工作原理的描述，哪些是正確的？A、分布式環(huán)境必須要考慮系統(tǒng)出錯。HBase采用HLog保證B、HBase系統(tǒng)為每個Region服務(wù)器配置了一個HLog文件C、Zookeeper會實時監(jiān)測每個Region服務(wù)器的狀態(tài)D、Master首先會處理該故障Region服務(wù)器上面遺留的HLog文件參考答案：ABCD33.下列關(guān)于Hive和關(guān)系型數(shù)據(jù)庫說法錯誤是（）。A、Hive的執(zhí)行延遲高于關(guān)系型數(shù)據(jù)庫B、二者都支持索引，但Hive支持較弱C、二者都支持?jǐn)?shù)據(jù)更新D、Hive的可擴性高于關(guān)系型數(shù)據(jù)庫參考答案：BC34.通常消息通信可以分為哪兩種（）A、單工通信B、雙工通信C、同步通信D、異步通信參考答案：CD35.數(shù)據(jù)化最早的根基是什么（）A、計量B、數(shù)字化C、記錄D、阿拉伯?dāng)?shù)字參考答案：AC36.啟動YARN后，jps能看到哪些守護(hù)進(jìn)程？A、DataNodeB、NodeManagerC、ResourceManagerD、NameNode參考答案：BC37.配置Hadoop集群時，下列哪個Hadoop配置文件需要進(jìn)行修改?（）A、hadoop-env.shB、profileC、core-site.xmlD、ifcfg-eth0參考答案：AC38.每次格式化Hadoop的文件系統(tǒng)都會刪除哪兩個文件中的數(shù)據(jù)（）A、.dirB、.dirC、dfs.datanode.data.dirD、node.data.dir參考答案：AC39.流數(shù)據(jù)具有以下哪些特征？A、數(shù)據(jù)快速持續(xù)到達(dá)，潛在大小也許是無窮無盡的B、數(shù)據(jù)來源眾多，格式復(fù)雜C、注重數(shù)據(jù)的整體價值，不過分關(guān)注個別數(shù)據(jù)D、系統(tǒng)可以控制將要處理的新到達(dá)的數(shù)據(jù)元素的順序參考答案：ABC40.客戶端上傳文件的時候哪項是正確的?（）A、數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、客戶端端將文件切分為多個Block，依次上傳C、客戶端只上傳數(shù)據(jù)到一臺DataNode，然后由NameNode負(fù)責(zé)Block復(fù)制工作D、客戶端發(fā)起文件上傳請求，通過RPC與NameNode建立通訊。參考答案：BD41.關(guān)于數(shù)據(jù)創(chuàng)新包含（）A、數(shù)據(jù)的再利用B、重組數(shù)組C、可擴展數(shù)據(jù)D、數(shù)據(jù)的折舊值參考答案：ABCD42.關(guān)于Hive中count函數(shù)描述不正確的是（）A、count（id）如果該列的值為null時，改行不計入count統(tǒng)計的總行數(shù)中.B、count（*）將表中所有行都算進(jìn)來包括為null行.C、count（1）將表中所有行都算進(jìn)來包括為null行.D、count（*）和count（1）都不算為為null行.參考答案：BCD43.關(guān)于Hive與傳統(tǒng)關(guān)系數(shù)據(jù)庫的對比分析，下面描述正確的是：A、在數(shù)據(jù)存儲方面，Hive一般依賴于分布式文件系統(tǒng)HDFS，而傳統(tǒng)數(shù)據(jù)庫則依賴于本地文件系統(tǒng)B、在索引方面，傳統(tǒng)的關(guān)系數(shù)據(jù)庫可以針對多個列構(gòu)建復(fù)雜的索引，大幅度提升數(shù)據(jù)查詢性能，而Hive不像傳統(tǒng)的關(guān)系型數(shù)據(jù)庫那樣有鍵的概念，它只能提供有限的索引功能C、在分區(qū)方面，傳統(tǒng)的數(shù)據(jù)庫提供分區(qū)功能來改善大型表以及具有各種訪問模式的表的可伸縮性、可管理性，以及提高數(shù)據(jù)庫效率；Hive不支持分區(qū)功能D、在執(zhí)行引擎方面，傳統(tǒng)的關(guān)系數(shù)據(jù)庫依賴自身的執(zhí)行引擎，而Hive則依賴于MapReduce、Tez和Spark等執(zhí)行引擎參考答案：ABD44.關(guān)于HBase二級索引的描述，哪些是正確的？A、核心是倒排表B、二級索引概念是對應(yīng)Rowkey這個“一級”索引C、二級索引使用平衡二叉樹D、二級索引使用LSM結(jié)構(gòu)參考答案：AB45.對MapReduce框架描述正確的是（）A、包括MapTask和ReduceTaskB、有Shuffle過程C、可以只有MapTask階段D、MapReduce是對在線數(shù)據(jù)的計算參考答案：ABC46.第三次信息化浪潮的標(biāo)志是哪些技術(shù)的興起？A、個人計算機B、物聯(lián)網(wǎng)C、云計算D、大數(shù)據(jù)參考答案：BCD47.當(dāng)處理CAP的問題時，可以有哪幾個明顯的選擇？A、CA：也就是強調(diào)一致性（C）和可用性（A），放棄分區(qū)容忍性（P）B、CP：也就是強調(diào)一致性（C）和分區(qū)容忍性（P），放棄可用性（A）C、AP：也就是強調(diào)可用性（A）和分區(qū)容忍性（P），放棄一致性（C）D、CAP：也就是同時兼顧可用性（A）、分區(qū)容忍性（P）和一致性（C），當(dāng)時系統(tǒng)性能會下降很多參考答案：ABC48.大數(shù)據(jù)有哪些特性？A、數(shù)據(jù)量大B、數(shù)據(jù)種類繁多C、計算速度快D、價值密度低參考答案：ABCD49.大數(shù)據(jù)具有哪些特點？A、數(shù)據(jù)的“大量化”B、數(shù)據(jù)的“快速化”C、數(shù)據(jù)的“多樣化”D、數(shù)據(jù)的“價值密度比較低”參考答案：ABCD50.常用的HDFSAPI有哪些?A、rename（）B、copyFromLocalFile（）C、mkdirs（）D、delete（）參考答案：ABCD51.操作HDFS有哪幾種方式？A、JAVAAPIB、B.WebUIC、C.ShellD、D.VNC參考答案：ABC52.YARN的調(diào)度算法包括以下哪些選項？（）A、FIFOSchedulerB、FairSchedulerC、CapacitySchedulerD、StackScheduler參考答案：ABC53.Storm具有以下哪些特點？A、整合性：Storm可方便地與隊列系統(tǒng)和數(shù)據(jù)庫系統(tǒng)進(jìn)行整合B、簡易的API：Storm的API在使用上即簡單又方便C、容錯性：Storm可自動進(jìn)行故障節(jié)點的重啟、任務(wù)的重新分配D、可擴展性：Storm的并行特性使其可以運行在分布式集群中參考答案：ABCD54.Shuffle中的溢寫過程包括（）A、合并B、分組C、排序D、分區(qū)參考答案：ABC55.Shuffle過程中的merge的三種形式分別是（）A、內(nèi)存到內(nèi)存B、內(nèi)存到磁盤C、磁盤到磁盤D、A、B選項不對參考答案：ABC56.SELinux有幾種狀態(tài)A、EnforcingB、B.PermissivegC、C.DisabledD、D.enable參考答案：ABC57.SecureCRT是一款用于連接運行的工具，支持的協(xié)議有A、SSHB、B.telnetC、C.httpD、D.ntp參考答案：AB58.Scala具有以下哪幾個主要特點？A、Scala的優(yōu)勢是提供了REPL（Read-Eval-PrintLoop，交互式解釋器），提高程序開發(fā)效率B、Scala兼容Java，運行速度快，且能融合到Hadoop生態(tài)圈中C、Scala具備強大的并發(fā)性，支持函數(shù)式編程D、Scala可以更好地支持分布式系統(tǒng)參考答案：ABCD59.MapReduce集群中的節(jié)點硬件有那些？A、光驅(qū)B、主機C、磁盤D、內(nèi)存參考答案：BCD60.MapReduce的具體應(yīng)用包括哪些？A、關(guān)系代數(shù)運算（選擇、投影、并、交、差、連接）B、分組與聚合運算C、矩陣-向量乘法D、矩陣乘法參考答案：ABCD61.MapRecue的優(yōu)點有哪些？A、可擴展性強B、計算機性能高C、容錯性強D、開發(fā)簡單參考答案：ACD62.Linux中重啟系統(tǒng)的命令有（）A、init0B、init1C、shutdown-rnowD、reboot參考答案：CD63.JobTracker主要包括哪三大功能？A、資源管理B、任務(wù)調(diào)度C、任務(wù)監(jiān)控D、數(shù)據(jù)即服務(wù)參考答案：ABC64.Hive主要由哪三個模塊組成：A、用戶接口模塊B、用戶查詢模塊C、驅(qū)動模塊D、元數(shù)據(jù)存儲模塊參考答案：ABD65.HDNF的作用是負(fù)責(zé)對數(shù)據(jù)的分布式儲存，其內(nèi)部對象包括（）A、ClientB、NameNodeC、DataBasesD、SecondaryNameNode參考答案：ABD66.HDFS文件訪問方式有哪些A、HDFSshellB、JavaAPIC、RESTAPID、thrift實現(xiàn)的Python、PHP等語言訪問參考答案：AB67.HDFS特殊的設(shè)計，在實現(xiàn)優(yōu)良特性的同時，也使得自身具有一些應(yīng)用局限性，主要包括以下哪幾個方面？A、較差的跨平臺兼容性B、無法高效存儲大量小文件C、不支持多用戶寫入及任意修改文件D、不適合低延遲數(shù)據(jù)訪問參考答案：BCD68.HDFS具有較高的容錯性，設(shè)計了哪些相應(yīng)的機制檢測數(shù)據(jù)錯誤和進(jìn)行自動恢復(fù)？A、數(shù)據(jù)源太大B、數(shù)據(jù)節(jié)點出錯C、數(shù)據(jù)出錯D、名稱節(jié)點出錯參考答案：BCD69.HDFS的命名空間包含什么？A、磁盤B、文件C、塊D、目錄參考答案：BCD70.HDFS采用抽象的塊概念可以帶來以下哪幾個明顯的好處？A、支持大規(guī)模文件存儲B、支持小規(guī)模文件存儲C、適合數(shù)據(jù)備份D、簡化系統(tǒng)設(shè)計參考答案：ACD71.HDFSFederation相對于HDFS1.0的優(yōu)勢主要體現(xiàn)在哪里？A、能夠解決單點故障問題B、HDFS集群擴展性C、性能更高效D、良好的隔離性參考答案：BCD72.HDFS1.0主要存在哪些問題？A、單點故障問題B、不可以水平擴展C、單個名稱節(jié)點難以提供不同程序之間的隔離性D、系統(tǒng)整體性能受限于單個名稱節(jié)點的吞吐量參考答案：ACD73.HBase性能優(yōu)化包含下面的哪些選項？A、讀優(yōu)化B、寫優(yōu)化C、配置優(yōu)化D、JVM優(yōu)化參考答案：ABCD74.Hadoop的優(yōu)化與發(fā)展主要體現(xiàn)在哪幾個方面？A、Hadoop自身核心組件MapReduce的架構(gòu)設(shè)計改進(jìn)B、Hadoop自身核心組件HDFS的架構(gòu)設(shè)計改進(jìn)C、Hadoop生態(tài)系統(tǒng)其它組件的不斷豐富D、Hadoop生態(tài)系統(tǒng)減少不必要的組件，整合系統(tǒng)參考答案：ABC75.Hadoop大數(shù)據(jù)有哪兩大核心技術(shù)？A、分布式存儲B、數(shù)據(jù)采集C、可視化D、分布式處理參考答案：AD76.hadoop創(chuàng)建多級目錄（如：/a/b/c）的命令為（）A、hadoopfs-mkdir-p/a/b/cB、hadoopfs-mkdir/a/b/cC、hdfsfs-mkdir-p/a/b/cD、hdfsfs-mkdir/a/b/c參考答案：AC77.Hadoop2.x有哪些核心組件組成。A、HDFＳB、YARNC、MAPREDUCED、Hive參考答案：ABC78.Hadoop2.0之前，MapReduce是由（）所組成。A、客戶端B、作業(yè)管理器C、任務(wù)管理器D、任務(wù)參考答案：ABCD79.Cloudera提供哪幾種安裝CDH的方法A、ClouderaB、TarC、YumD、Rpm參考答案：ABCD判斷題1.只有當(dāng)客戶端明確要刪除臨時節(jié)點時才會被真正刪除。A、正確B、錯誤參考答案：B2.臟頁是linux內(nèi)核中的概念，因為硬盤的讀寫速度遠(yuǎn)趕不上內(nèi)存的速度，系統(tǒng)就把讀寫比較頻繁的數(shù)據(jù)事先放到內(nèi)存中，以提高讀寫速度，稱之為高速緩存。A、正確B、錯誤參考答案：A3.在數(shù)據(jù)傳輸前后生成兩個校驗和，如果不相同則說明數(shù)據(jù)一定存在錯誤。A、正確B、錯誤參考答案：A4.在大數(shù)據(jù)框架中，批處理系統(tǒng)一般不適用于對延時要示較高的場景A、正確B、錯誤參考答案：A5.在Map階段的分組部分，相同key的若干value會被放入一個組里。A、正確B、錯誤參考答案：A6.在Linux的安裝過程中不可以進(jìn)行網(wǎng)絡(luò)配置。A、正確B、錯誤參考答案：B7.在internet網(wǎng)絡(luò)中，tcp/ip網(wǎng)絡(luò)協(xié)議只能提供面向無連接服務(wù)A、正確B、錯誤參考答案：B8.在Hadoop1.x版本中，MapReduce程序是運行在Yarn集群之上。A、正確B、錯誤參考答案：B9.一個簡單的MapReduce程序只需要指定:map、reduce、input、output剩下的事由框架完成。A、正確B、錯誤參考答案：A10.我們在開發(fā)分布式計算job的時候，可以去掉reduce階段A、正確B、錯誤參考答案：A11.偽分布式模式下的Hadoop功能與完全分布式模式下的Hadoop功能相同。A、正確B、錯誤參考答案：A12.數(shù)據(jù)整合是指數(shù)據(jù)創(chuàng)建的副本A、正確B、錯誤參考答案：B13.數(shù)據(jù)存檔是指將長期不用的數(shù)據(jù)提取出來保存到其他數(shù)據(jù)庫的過程A、正確B、錯誤參考答案：A14.使用loaddata加載數(shù)據(jù)時如果有overwrite關(guān)鍵字會把表中原有的數(shù)據(jù)刪除。A、正確B、錯誤參考答案：A15.軟件啟動之后JobTracker接收J(rèn)ob，但是不會去負(fù)責(zé)調(diào)度Job的每一個子任務(wù)。A、正確B、錯誤參考答案：B16.如果NameNode意外終止，SecondaryNameNode會接替它使集群繼續(xù)工作。A、正確B、錯誤參考答案：B17.容器調(diào)度器在多用戶的情況下，可以最大化集群的吞吐和利用率A、正確B、錯誤參考答案：A18.配置Hadoop集群只需要修改core-site、xml配置文件就可以。A、正確B、錯誤參考答案：B19.命令hadoopfs-safemodeget-查看安全模式狀態(tài)A、正確B、錯誤參考答案：A20.每個map槽就是一個線程。A、正確B、錯誤參考答案：B21.每個MapTask可以對應(yīng)多個環(huán)形緩沖區(qū)A、正確B、錯誤參考答案：A22.每次啟動Hadoop都要格式化文件系統(tǒng)A、正確B、錯誤參考答案：B23.可以在Map任務(wù)結(jié)束時會對文件進(jìn)行合并，減少網(wǎng)絡(luò)的傳輸量。命令hadoopfs-safemodeget用于查看安全模式狀態(tài)。A、正確B、錯誤參考答案：A24.計算架構(gòu)：抽象架構(gòu)+軟件設(shè)計+實現(xiàn)方法。A、正確B、錯誤參考答案：A25.集群內(nèi)每個節(jié)點都應(yīng)該配RAID，這樣避免單磁盤損壞，影響整個節(jié)點運行。A、正確B、錯誤參考答案：B26.公平調(diào)度器是所有隊列中的所有任務(wù)公平的得到相同資源A、正確B、錯誤參考答案：B27.分區(qū)數(shù)量是ReduceTask的數(shù)量。A、正確B、錯誤參考答案：A28.反序列化時如果有一個字符串的類型，不用UTFA、正確B、錯誤參考答案：B29.查看Linuxip的命令是ifconfigA、正確B、錯誤參考答案：A30.Zookeeper可以作為文件存儲系統(tǒng)，因此可以將大規(guī)模數(shù)據(jù)文件存在該系統(tǒng)中。A、正確B、錯誤參考答案：B31.Zookeeper集群宕機數(shù)超過集群數(shù)一半，則Zookeeper服務(wù)失效。A、正確B、錯誤參考答案：A32.WebMagic的是一個無須配置、便于二次開發(fā)的爬蟲框架，它提供簡單靈活的APIA、正確B、錯誤參考答案：A33.TaildirSource用于觀察指定的文件，可以實時監(jiān)測到添加到每個文件的新行，如果文件正在寫入新行，則此采集器將重試采集它們以等待寫入完成。A、正確B、錯誤參考答案：A34.Storm的計算機體系采用了主從（Master/Slave）架構(gòu)。A、正確B、錯誤參考答案：A35.Sqoop是hadoop生態(tài)圈上的數(shù)據(jù)傳輸工具A、正確B、錯誤參考答案：A36.Sqoop導(dǎo)入指的是將數(shù)據(jù)從HDFS遷移到關(guān)系型數(shù)據(jù)庫。A、正確B、錯誤參考答案：B37.SecondaryNameNode是NameNode的備份，可以有效解決Hadoop集群單點故障問題。A、正確B、錯誤參考答案：B38.Secondarynamenode就是namenode出現(xiàn)問題時的備用節(jié)點A、正確B、錯誤參考答案：B39.rhadoop是用R語言開發(fā)的，MapReduce可以使用其他語言開發(fā)。A、正確B、錯誤參考答案：A40.Reduce（化簡歸約）對一些獨立元素組成的列表的每一個元素進(jìn)行指定的操作，可以高度并行。A、正確B、錯誤參考答案：B41.NameNode是HDFS系統(tǒng)中的管理局節(jié)點，它管理文件系統(tǒng)的命名空間，記錄每個文件數(shù)據(jù)塊在DataNode上的位置和副本信息、協(xié)調(diào)客戶端對文件的訪問、記錄命名空間內(nèi)的改動和空間本身屬性的改動。A、正確B、錯誤參考答案：B42.NameNode負(fù)責(zé)管理metadata，client端每次讀寫請求，它都會從磁盤中讀取或則會寫入metadata信息并反饋client端。A、正確B、錯誤參考答

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《hadoop基礎(chǔ)練習(xí)》近年考試真題（附答案）

文檔簡介

溫馨提示

最新文檔

評論

《hadoop基礎(chǔ)練習(xí)》近年考試真題（附答案）

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔