《hadoop基礎(chǔ)練習(xí)》近年考試真題(附答案)_第1頁
《hadoop基礎(chǔ)練習(xí)》近年考試真題(附答案)_第2頁
《hadoop基礎(chǔ)練習(xí)》近年考試真題(附答案)_第3頁
《hadoop基礎(chǔ)練習(xí)》近年考試真題(附答案)_第4頁
《hadoop基礎(chǔ)練習(xí)》近年考試真題(附答案)_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

《hadoop基礎(chǔ)練習(xí)》近年考試真題(附答案)單選題1.在實驗集群的master節(jié)點使用jps命令查看進(jìn)程時,終端出現(xiàn)以下哪項能說明Hadoop主節(jié)點啟動成功?A、Namenode,JobTracker,secondaryNameNodeB、Namenode,Datanode,TaskTrackerC、Namenode,Datanode,secondaryNameNodeD、Namenode,Datanode,HMaster參考答案:A2.在大數(shù)據(jù)項目規(guī)劃階段中,()階段確認(rèn)大數(shù)據(jù)項目范圍和建設(shè)目標(biāo)。A、需求調(diào)研B、業(yè)務(wù)調(diào)研C、數(shù)據(jù)需求D、項目規(guī)劃參考答案:A3.在詞頻統(tǒng)計(WordCount)的執(zhí)行過程中,()模塊負(fù)責(zé)進(jìn)行單詞的拆分與映射。A、MapperB、ReducerC、DriverD、Main參考答案:A4.在Python中,以下選項中能夠?qū)崿F(xiàn)Python循壞結(jié)構(gòu)的是A、loopB、do...forC、whileD、if參考答案:C5.在Python中,一個事務(wù)是一個不可分割的工作單位,事務(wù)中包括的諸操作要么都做,要么都不做說的是事務(wù)的哪個特性?A、持久性B、隔離性C、一致性D、原子性參考答案:D6.在Python中,一個事務(wù)的執(zhí)行不能被其他事務(wù)干擾,并發(fā)執(zhí)行的各個事務(wù)不互相干擾說的是事務(wù)的哪個特性?A、持久性B、隔離性C、一致性D、原子性參考答案:B7.在Python中,下面代碼的輸出結(jié)果是foriinrange(1,10,2):print(i,end=",")A、4B、,1.4C、7參考答案:C8.在Python中,網(wǎng)絡(luò)框架Flask是()A、支持快速建站的框架B、企業(yè)級開發(fā)框架C、高并發(fā)處理框架D、以上全都不是參考答案:A9.在Python中,利用SAX解析XML文檔,說法錯誤的是A、包含解析器和事件處理器兩個部分B、不需要先引入任何函數(shù)或模塊C、要先引入xml.sax中的parse函數(shù)D、要先引入xml.sax.handler中的ContentHandler參考答案:B10.在Python中,利用DOM方式解析XML文檔,說法錯誤的是A、可以讀取B、可以修改C、只能讀取,不能修改D、使用xml.dom.minidom模塊來解析xml文件參考答案:C11.在Python中,可以采用“模塊”的方式來組織代碼,以下描述正確的是:A、使用模塊可能導(dǎo)致函數(shù)名和變量名沖突。B、相同名字的函數(shù)和變量完全可以分別存在不同的模塊中。C、相同名字的函數(shù)和變量完全可以存在相同同的模塊中。D、不同名字的函數(shù)和變量必須分別存在不同的模塊中。參考答案:B12.在Python中,Python程序中關(guān)于異常說法錯誤的是A、異常會影響程序的正常執(zhí)行B、異常是Python對象,表示一個錯誤C、不可以自己出發(fā)異常D、需要捕獲處理它,否則程序會終止執(zhí)行參考答案:C13.在Python中,F(xiàn)lask默認(rèn)使用的模板引擎是()A、Jinja2B、ClickC、WerkzeugD、MarkupSafe參考答案:A14.在Python語言中語句塊的標(biāo)記是A、分號B、逗號C、縮進(jìn)D、/參考答案:C15.在Linux中,在使用匿名登錄ftp時,用戶名為()A、GuestB、userC、rootD、anonymous參考答案:D16.在Linux中,用FTP一次上傳多個文件可以用命令()A、getB、putC、mgetD、mput參考答案:D17.在Linux中,以下可以切換登錄賬號的命令是()A、superB、passwdC、tarD、su參考答案:D18.在Linux中,需要統(tǒng)計test.txt文件的行數(shù),使用的命令是A、wc-ltest.txtB、who>test.txtC、echo“helloworld”>test.txtD、echo“hello:world”>>test.txt參考答案:A19.在Linux中,假設(shè)變量a為10,變量b為20,以下表達(dá)式返回為false的是:A、[$$a-ne$$b]B、[$$a-le$$b]C、[!false]D、[$$a-gt$$b]參考答案:D20.在Linux中,徹底終止進(jìn)程123456,輸入的命令是A、kill123456B、kill-9123456C、kill-HUPpidD、kill-l參考答案:B21.在Linux中,查看啟動失敗的服務(wù)列表,命令如下A、systemctlis-enabledfirewalldB、systemctlenablefirewalldC、systemctl--failedD、systemctllist-unit-files|grepenabled參考答案:C22.在Job類中對輸出鍵值對格式進(jìn)行設(shè)置時,如果Mapper的輸出格式與Reducer的輸出格式一樣,那么可以省略下列()設(shè)置。A、job.setOutputKeyClass()與job.setOutputValueClass()B、job.setMapOutputKeyClass()與job.setMapOutputValueClass()C、job.setReduceOutputKeyClass()與job.setReduceOutputValueClass()D、以上都不能省略參考答案:B23.在Java中,以下哪個不是Xml文檔的節(jié)點類型A、ElementB、BlankC、AttributeD、Text參考答案:B24.在Java中,以下方法用于定義線程任務(wù)代碼的是A、start()B、init()C、run()D、main()參考答案:C25.在Java中,下面讓線程休眠1分鐘的正確方法是A、sleep(1)B、sleep(60)C、sleep(1000)D、sleep(60000)參考答案:D26.在Java中,下面哪個類使用了緩沖技術(shù)A、BufferedOutputStreamB、FileInputStreamC、ObjectOutputStreamD、FileReader參考答案:A27.在Java中,如果在關(guān)閉socket時發(fā)生一個I/O錯誤,會拋出A、IOExceptionB、UnknownHostExceptionC、SocketExceptionD、MalformedURLException參考答案:A28.在Java中,關(guān)于同步方法描述錯誤的是A、同步方法比同步代碼塊更容易控制同步范圍B、非靜態(tài)同步方法的鎖對象就是this當(dāng)前對象本身C、靜態(tài)同步方法的鎖對象是所屬類的類類型(字節(jié)碼文件)D、同步方法和同步代碼塊使相同的關(guān)鍵字來修飾參考答案:A29.在Java中,多線程具備的優(yōu)點不包括下列A、可以使某個功能執(zhí)行效率更高B、解決同時訪問并發(fā)問題C、避免某個操作太耗時造成卡死狀況D、可以提升系統(tǒng)的可維護(hù)可擴展性參考答案:D30.在Java中,InetAddress類中哪個方法可以獲取主機IP地址A、isReachable()B、getHostAddress()C、getHostName()D、getByName()參考答案:B31.在Java中,F(xiàn)ile類中哪個方法可以判斷文件是否存在?A、exists()B、isFile()C、isDirectory()D、isHidden()參考答案:A32.在HDFS文件系統(tǒng)根目錄下創(chuàng)建一個名為mydir的文件夾的命令是()。A、hdfs.create(newPath(“hdfs:/mydir”))B、hdfs.open(newPath(“hdfs:/mydir”))C、hdfs.mkdirs(“hdfs:/mydir”)D、hdfs.mkdirs(newPath(“hdfs:/mydir”))參考答案:D33.與Hadoop1.x相比,Hadoop2.x采用全新的架構(gòu),最明顯的變化就是增加了哪個組件?A、MapReduceB、PigC、HBaseD、Yarn參考答案:D34.有關(guān)MapReduce的輸入輸出,說法錯誤的是A、鏈接多個MapReduce作業(yè)時,序列文件是首選格式B、FileInputFormat中實現(xiàn)的getSplits()可以把輸入數(shù)據(jù)劃分為分片,分片數(shù)目和大小任意定義C、想完全禁止輸出,可以使用NullOutputFormatD、每個reduce需將它的輸出寫入自己的文件中,輸出無需分片參考答案:B35.用什么命令可以將ZooKeeper文件遠(yuǎn)程拷貝到其他機器?A、spcB、scpC、sendD、post參考答案:B36.以下選項哪個是MapReduce正確的運行模型()A、Reduce-Map-ShuffleB、Shuffle-Map-ReduceC、Map-Shuffle-ReduceD、Map-Reduce-Shuffle參考答案:C37.以下說法不正確的是A、HadoopStreaming使用Unix中的流與程序交互B、HadoopStreaming允許我們使用任何可執(zhí)行腳本語言處理數(shù)據(jù)流C、采用腳本語言時必須遵從UNIX的標(biāo)準(zhǔn)輸入STDIN,并輸出到STDOUTD、Reduce沒有設(shè)定,上述命令運行會出現(xiàn)問題參考答案:D38.以下哪一項不屬于Hadoop可以運行的模式()。A、單機(本地)模式B、偽分布式模式C、互聯(lián)模式D、分布式模式參考答案:C39.以下哪個不是HDFS的進(jìn)程()A、SecondaryNodeB、NameNodeC、ResourceManagerD、DataNode參考答案:C40.以下對Combiner描述錯誤的是()A、Combiner的作用提高程序執(zhí)行效率B、Combiner的作用減少對本地磁盤的訪問次數(shù)。C、Combiner過程設(shè)置則執(zhí)行,否則不執(zhí)行D、Combiner過程對job意義。參考答案:D41.以下()文件中主要用來配置ResourceManager,NodeManager的通信端口,web監(jiān)控端口等。A、core-site.xmlB、mapred-site.xmlC、hdfs-site.xmlD、yarn-site.xml參考答案:D42.下面與Zookeeper類似的框架是?A、ProtobufB、JavaC、KafkaD、Chubby參考答案:D43.下面有關(guān)NameNode和DataNode之間的Hearbeat說法錯誤的是()A、DataNode通過發(fā)送Heartbeat告訴NameNode自己還"活著",并且工作正常B、HeatBeat包含DataNode狀態(tài)相關(guān)信息C、NameNode回復(fù)HeartBeat一些DatanodeCommandD、如果NameNode在某一固定時間內(nèi)沒有收到Datanode的Heatbeat,那么它會要求DataNode發(fā)送Heartbeat參考答案:D44.下面那個不是MapReduce的特點?()A、易于編程B、良好的擴展性C、低容錯性D、適合PB級以上海量數(shù)據(jù)的離線處理參考答案:C45.下面哪一項不是MapReduce體系結(jié)構(gòu)主要部分?A、ClientB、JobTrackerC、TaskTracker以及TaskD、Job參考答案:A46.下面哪個命令是用來定義shell的全局變量:A、exportfsB、B.aliasC、C.exportsD、D.export參考答案:D47.下面哪個程序負(fù)責(zé)HDFS數(shù)據(jù)存儲。A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNode參考答案:C48.下面關(guān)于Shuffle過程描述正確的是()A、Job作業(yè)必須要實現(xiàn)Combiner過程。B、分組操作發(fā)生在溢寫過程C、分組的目的是提高Job執(zhí)行效率。D、壓縮目的是提高效率。參考答案:D49.下面對FsImage的描述,哪個是錯誤的?A、FsImage文件沒有記錄每個塊存儲在哪個數(shù)據(jù)節(jié)點B、FsImage文件包含文件系統(tǒng)中所有目錄和文件inode的序列化形式C、FsImage用于維護(hù)文件系統(tǒng)樹以及文件樹中所有的文件和文件夾的元數(shù)據(jù)D、FsImage文件記錄了每個塊具體被存儲在哪個數(shù)據(jù)節(jié)點參考答案:D50.下列選項中,哪一個命令用于刪除文件?A、hadoopB、hadoopC、hadoopD、hadoop參考答案:B51.下列選項中,哪一個不屬于Zookeeper應(yīng)用?()A、數(shù)據(jù)發(fā)布和訂閱B、負(fù)載均衡C、配置管理D、數(shù)據(jù)倉庫參考答案:D52.下列選項中,關(guān)于HBase和BigTable的底層技術(shù)對應(yīng)關(guān)系,哪個是錯誤的?A、GFS與HDFS相對應(yīng)B、GFS與Zookeeper相對應(yīng)C、MapReduce與HadoopMapReduce相對應(yīng)D、Chubby與Zookeeper相對應(yīng)參考答案:B53.下列選項描述錯誤的是?()A、HadoopHA即集群中包含SecondaryNameNode作為備份節(jié)點存在。B、ResourceManager負(fù)責(zé)的是整個Yarn集群資源的監(jiān)控、分配和管理工作C、NodeManager負(fù)責(zé)定時的向ResourceManager匯報所在節(jié)點的資源使用情況以及接收并處理來自ApplicationMaster的啟動停止容器(Container)的各種請求。D、初次啟動HadoopHA集群時,需要將格式化文件系統(tǒng)后的目錄拷貝至另外一臺NameNode節(jié)點上。參考答案:A54.下列說法錯誤的是()A、MapReduce中maperconbinerreducer缺一不可B、在JobConf中InputFormat參數(shù)可以不設(shè)C、在JobConf中MapperClass參數(shù)可以不設(shè)D、在JobConf中OutputKeyComparator參數(shù)可以不設(shè)參考答案:A55.下列哪一個不屬于大數(shù)據(jù)產(chǎn)業(yè)的產(chǎn)業(yè)鏈環(huán)節(jié)?A、數(shù)據(jù)循環(huán)層B、數(shù)據(jù)源層C、數(shù)據(jù)分析層D、數(shù)據(jù)應(yīng)用層參考答案:A56.下列哪些操作可以設(shè)置一個監(jiān)聽器WatcherA、getDataB、getChildrenC、existsD、setData參考答案:D57.下列哪項通常是集群的最主要瓶頸()。A、CPUB、網(wǎng)絡(luò)C、磁盤IOD、內(nèi)存參考答案:C58.下列哪項通常是集群的最主要的性能瓶頸?()A、CPUB、網(wǎng)絡(luò)C、磁盤D、內(nèi)存參考答案:C59.下列哪項是Hadoop生態(tài)系統(tǒng)中Spark的功能?A、處理大規(guī)模數(shù)據(jù)的腳本語言B、工作流和協(xié)作服務(wù)引擎,協(xié)調(diào)Hadoop上運行的不同任務(wù)C、不支持DAG作業(yè)的計算框架D、基于內(nèi)存的分布式并行編程框架,具有較高的實時性,并且較好支持迭代計算參考答案:D60.下列哪個程序通常與NameNode在一個節(jié)點啟動?A、SecondaryNameNodeB、DataNodeC、TaskTrackerD、Jobtracker參考答案:D61.下列命令中(在zookeeper安裝文件夾的bin目錄下執(zhí)行),哪項是停止ZooKeeper的正確命令()A、start-all.shB、start-stop.shC、zkServer.shstopD、zkServer.shstart參考答案:C62.下列關(guān)于流計算的說法,哪項是錯誤的?A、實時獲取來自不同數(shù)據(jù)源的海量數(shù)據(jù),經(jīng)過實時分析處理,獲得有價值的信息B、流計算秉承一個基本理念,即數(shù)據(jù)的價值隨著時間的流逝而降低C、對于一個流計算系統(tǒng)來說,它應(yīng)該支持TB級甚至是PB級的數(shù)據(jù)規(guī)模D、流計算只需要保證較低的延遲時間,即只達(dá)到秒級別即可處理一切問題參考答案:D63.下列關(guān)于Storm和Hadoop架構(gòu)組件功能對應(yīng)關(guān)系,哪個是錯誤的?A、HadoopJob對應(yīng)StormTopologyB、HadoopTaskTracker對應(yīng)StormSupervisorC、HadoopJobTracker對應(yīng)StormSpoutD、HadoopReduce對應(yīng)StormBolt參考答案:C64.下列關(guān)于MPI敘述不正確的一項是()。A、MPI是一個信息傳遞應(yīng)用程序的接口B、MPI程序經(jīng)常在共享內(nèi)存的機器上使用C、MPI并行計算增加高層并行編程模型D、MPI缺少統(tǒng)一的計算框架支持參考答案:C65.下列關(guān)于MapReduce的說法,哪個描述是錯誤的?A、MapReduce具有廣泛的應(yīng)用,比如關(guān)系代數(shù)運算、分組與聚合運算等B、MapReduce將復(fù)雜的、運行于大規(guī)模集群上的并行計算過程高度地抽象到了兩個函數(shù)C、編程人員在不會分布式并行編程的情況下,也可以很容易將自己的程序運行在分布式系統(tǒng)上,完成海量數(shù)據(jù)集的計算D、不同的Map任務(wù)之間可以進(jìn)行通信參考答案:D66.下列關(guān)于MapReduce的基本思想敘述不正確的一項是()。A、對相互間具有計算機以來關(guān)系的大數(shù)據(jù)進(jìn)行分而治之。B、用Map和Reduce兩個函數(shù)提供了高層并行編程抽象模型。C、提供了同一框架D、為程序員隱藏系統(tǒng)細(xì)節(jié)參考答案:A67.下列關(guān)于HBase系統(tǒng)分層架構(gòu)敘述不正確的一項為()。A、HDFS提供了HBase的頂層物理存儲結(jié)構(gòu)B、Hadoop平臺提供了存儲基礎(chǔ)結(jié)構(gòu):Hadoop集群及系統(tǒng)軟件C、客戶端:提供了數(shù)據(jù)庫訪問接口D、RegionServer:管理多個regions并提供數(shù)據(jù)訪問服務(wù)參考答案:A68.下列大數(shù)據(jù)特點中錯誤的是()。A、數(shù)據(jù)體量大B、數(shù)據(jù)種類多C、處理速度快D、價值密度高參考答案:D69.下列()命令可以顯示出HDFS目錄/user/root中的內(nèi)容。A、hdfsdfs-dir/user/root/B、hdfsdfs-report/user/root/C、hdfsdfs-ls/user/root/D、hdfsdfs-display/user/root/參考答案:C70.調(diào)用Zookeeper對象創(chuàng)建的節(jié)點,不包括()。A、持久節(jié)點B、臨時節(jié)點C、持久順序節(jié)點D、DataNode節(jié)點參考答案:D71.數(shù)據(jù)建模中,()模型,主要基于用戶的數(shù)據(jù)功能需求產(chǎn)生。A、概念B、數(shù)據(jù)C、邏輯D、物理參考答案:A72.屬于Hadoop各組件之間通信協(xié)議()A、ServerProtocolB、DatanodeProtocolC、NameProtocolD、SecondaryProtocol參考答案:B73.使用jar操作運行Hadoop中自帶的jar進(jìn)行單詞的統(tǒng)計()A、cd-jarhadoop/share/hadoop/mapreduce/B、cdhadoop/share/hadoop/mapreduce/C、cdjar/hadoop/share/hadoop/mapreduce/D、cd/hadoop/share/hadoop/mapreduce/參考答案:B74.如何禁用reduce階段()A、設(shè)置conf.setNumreduceTasks(0)B、設(shè)置job.setNumreduceTasks(0)C、設(shè)置job.setNumreduceTasks(1)D、設(shè)置job.setNumreduceTasks()=0參考答案:B75.啟動集群的順序為()。①start-dfs.sh、②start-yarn.sh、③mr-jobhistory-daemon.shstarthistoryserverA、①②③B、②①③C、③②①D、③①②參考答案:A76.配置主機名和IP地址映射的文件位置是()A、/home/hostsB、/usr/local/hostsC、/etc/hostD、/etc/hosts參考答案:D77.配置Hadoop文件參數(shù)時,配置項“dfs.replication”應(yīng)該配置在哪個文件?()A、core-site.xmlB、hdfs-site.xmlC、mapred-site.xmlD、yarn-site.xml參考答案:B78.默認(rèn)端口50070的作用是()。A、查看HDFS監(jiān)控B、查看YARN監(jiān)控C、查看日志監(jiān)控D、不確定參考答案:A79.將數(shù)據(jù)更新寫入(),只有其寫入完成后,commit()才返回給客戶端。A、ZookeeperB、HMasterC、RegionServerD、HLog參考答案:D80.關(guān)于文檔數(shù)據(jù)庫的說法,下列哪一項是錯誤的?A、數(shù)據(jù)是規(guī)則的B、性能好(高并發(fā))C、缺乏統(tǒng)一的查詢語法D、復(fù)雜性低題參考答案:A81.關(guān)于基于Hadoop的MapReduce編程的環(huán)境配置,下面哪一步是不必要的()A、安裝linux或者在Windows下安裝CgywinB、安裝javaC、安裝MapReduceD、配置Hadoop參數(shù)參考答案:C82.關(guān)于SecondaryNameNode哪項是正確的?()A、它是NameNode的熱備B、它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間C、它對內(nèi)存沒有要求D、SecondaryNameNode應(yīng)與NameNode部署到一個節(jié)點參考答案:B83.關(guān)于MapReducejavaAPI說法錯誤的是?A、新的API傾向于使用接口,而不是抽象類B、新的API實現(xiàn)了配置的統(tǒng)一C、新的API傾向于使用抽象類,而不是接口D、新的API充分使用上下文對象context,允許用戶能與MapReduce系統(tǒng)通信參考答案:A84.關(guān)于MapReduce1和YARN的對比錯誤的是?A、MapReduce1由JobTracker負(fù)責(zé)作業(yè)調(diào)度與任務(wù)監(jiān)控B、YARN的作業(yè)調(diào)度和任務(wù)監(jiān)控都是由ResourceManager組件完成C、MapReduce1的任務(wù)節(jié)點叫做TaskTracker,而Yarn的任務(wù)節(jié)點為NodeManagerD、MapReduce1的資源調(diào)配單元為Slot,而Yarn的資源調(diào)配單元為Container參考答案:B85.關(guān)于Hadoop單機模式和偽分布式模式的說法,正確的是A、兩者都起守護(hù)進(jìn)程,且守護(hù)進(jìn)程運行在一臺機器上B、單機模式不使用HDFS,但加載守護(hù)進(jìn)程C、兩者都不與守護(hù)進(jìn)程交互,避免復(fù)雜性D、后者比前者增加了HDFS輸入輸出以及可檢查內(nèi)存使用情況參考答案:D86.對于mapper類中的setup方法不正確的是?A、此方法被MapReduce框架僅且執(zhí)行一次B、在執(zhí)行map任務(wù)前,進(jìn)行相關(guān)變量或者資源的集中初始化工作C、在執(zhí)行map任務(wù)后,進(jìn)行相關(guān)變量或者資源的集中初始化工作D、將資源初始化工作放在map方法中,導(dǎo)致程序運行效率降低參考答案:C87.對Client/Server系統(tǒng)而言,()的吞吐率是指對單個客戶而言服務(wù)器在單位時間內(nèi)完成的該客戶提交的任務(wù)數(shù)目。A、服務(wù)器端B、客戶端C、系統(tǒng)端D、管理員端參考答案:B88.典型的NoSQL數(shù)據(jù)庫是()A、HiveB、MySQLC、HbaseD、Oracle參考答案:C89.當(dāng)啟動一個SparkShell時,SparkShell已經(jīng)預(yù)先創(chuàng)建好一個SparkContext對象,其變量名為()A、scB、ccC、snD、nc參考答案:A90.當(dāng)客戶端需要讀取HDFS中存儲的文件時,首先向()發(fā)起讀請求。A、DataNodeB、NameNodeC、YarnD、Zookeeper參考答案:B91.大數(shù)據(jù)的特點不包括()。A、數(shù)量大B、類型少C、速度快D、價值高參考答案:B92.大數(shù)據(jù)的分布式計算使用下面哪項技術(shù)?()A、HDFSB、MapReduceC、NutchD、Hive參考答案:B93.大數(shù)據(jù)產(chǎn)業(yè)指什么?A、一切與支撐大數(shù)據(jù)組織管理和價值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟(jì)活動的集合B、提供智能交通、智慧醫(yī)療、智能物流、智能電網(wǎng)等行業(yè)應(yīng)用的企業(yè)C、提供數(shù)據(jù)分享平臺、數(shù)據(jù)分析平臺、數(shù)據(jù)租售平臺等服務(wù)的企業(yè)D、提供分布式計算、數(shù)據(jù)挖掘、統(tǒng)計分析等服務(wù)的各類企業(yè)參考答案:A94.Zookeeper啟動時會最多監(jiān)聽幾個端口A、1B、2C、3D、4參考答案:B95.ZooKeeper集群的機器數(shù)量一般有什么要求?A、一般為單數(shù)臺機器B、一般為雙數(shù)臺機器C、一般沒有要求D、有要求,但要求不高參考答案:A96.YARN的調(diào)度器不包括以下哪種?A、FIFOSchedulerB、FairSchedulerC、CapacitySchedulerD、StackScheduler參考答案:D97.Sqoop工具接收到命令后通過任務(wù)翻譯器,將命令轉(zhuǎn)換為()A、MapReduce任務(wù)B、Translate任務(wù)C、Map任務(wù)D、Reduce任務(wù)參考答案:A98.NameNode節(jié)點主要工作是()A、存儲大量的數(shù)據(jù)B、元數(shù)據(jù)的管理C、NameNode節(jié)點和DataNode節(jié)點主要負(fù)責(zé)的工作一樣D、以上都正確參考答案:C99.MapReduce中哪一種文件輸入格式可以自動切割并合并小文件?()A、NLinelmputFormatB、TextInputFormatC、CombineFileInputFormatD、KeyValueTextInputFormat參考答案:C100.MapReduce中可能引起負(fù)載問題的原因有哪些?()A、MapReduce需要處理的數(shù)據(jù)量過大B、數(shù)據(jù)本身的格式問題,例如:文檔格式混亂C、DataNode節(jié)點與Map節(jié)點不在一起D、Map中Key值選取和設(shè)定問題,導(dǎo)致Key值過于集中參考答案:D101.MapReduce框架提供了一種序列化鍵/值對的方法,支持這種序列化的類能夠在Map和Reduce過程中充當(dāng)鍵或值,以下說法錯誤的是A、實現(xiàn)Writable接口的類是值B、實現(xiàn)WritableComparable接口的類可以是值或鍵C、Hadoop的基本類型Text并不實現(xiàn)WritableComparable接口D、鍵和值的數(shù)據(jù)類型可以超出Hadoop自身支持的基本類型參考答案:C102.MapReduce框架的核心步驟主要是()A、MapB、ShuffleC、ReduceD、Map和Reduce參考答案:D103.MapReduce將整個并行計算過程抽象到那兩個函數(shù)()A、mapsreduceB、mapreduceC、mapreducesD、mapsreduces參考答案:B104.MapReduce處理流程中Reduce如何獲取Map端結(jié)果()A、Map端發(fā)送B、Reduce端獲取C、Map端發(fā)送到中間管理節(jié)點,Reduce統(tǒng)一獲取D、隨機發(fā)送參考答案:B105.Linux和Unix之間的關(guān)系是A、Linux是一種類Unix系統(tǒng),Linux是由Unix衍生來的B、Linux和Unix之間不存在關(guān)聯(lián)C、Linux是Unix的前生,Unix包含Linux的功能D、相比于Linux,Unix最大的創(chuàng)新點是開源免費參考答案:A106.Hive包括()中連接模式。A、二B、四C、三D、五參考答案:C107.HDFS中的block默認(rèn)保存幾個備份。A、1B、2C、3D、4參考答案:C108.HDfS中的block默認(rèn)保存幾份?答案A默認(rèn)3分A、3份B、2份C、1份D、不確定參考答案:A109.HDFS是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,默認(rèn)的最基本的存儲單位是64M,具有高容錯、高可靠性、高擴展性、高吞吐率等特征,適合的讀寫任務(wù)是A、一次寫入,少次讀寫B(tài)、多次寫入,少次讀寫C、一次寫入,多次讀寫D、多次寫入,多次讀寫參考答案:C110.HDFS默認(rèn)BlockSize的大小是()。A、32MBB、64MBC、128MBD、256M參考答案:B111.HBase在新建表的時候必須指定表名和(),不需要指定列,所有的列在后續(xù)添加數(shù)據(jù)的時候動態(tài)添加。A、行B、單元格C、時間戳D、列族參考答案:D112.Hadoop實現(xiàn)了什么樣的系統(tǒng)A、操作系統(tǒng)B、數(shù)據(jù)管理系統(tǒng)C、數(shù)據(jù)整合系統(tǒng)D、分布式文件系統(tǒng)參考答案:D113.Hadoop集群的關(guān)閉命令是?()A、stop-dfs.shB、stop-yarn.shC、stop-all.shD、stop-hadoop.sh參考答案:C114.Hadoop的作者是哪一位()A、MartinFowlerB、DougCuttingC、KentBeckD、GraceHopper參考答案:B115.Hadoop2的計算框架叫什么?()A、MppB、Map/ReduceC、ARMD、Spark參考答案:B116.Hadoop2.0中HDFS默認(rèn)BlockSizeA、32MBB、64MBC、128MBD、256MB參考答案:C117.DougCutting所創(chuàng)立的項目的名稱都受到其家人的啟發(fā),以下項目不是由他創(chuàng)立的項目是A、HadoopB、NutchC、LuceneD、Solr參考答案:D118.Client端上傳文件到HDFS上的時候下列正確的是()A、數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、數(shù)據(jù)副本將以管道的方式依次傳遞C、Client將數(shù)據(jù)寫到一臺DataNode上,并由Client負(fù)責(zé)完成Block復(fù)制工作D、當(dāng)某個DataNode失敗,客戶端不會繼續(xù)傳給其它的DataNode參考答案:B119.()模式:hadoop安裝時的默認(rèn)模式,不對配置文件進(jìn)行修改。A、聯(lián)機B、單機C、虛擬分布D、完全分布參考答案:B多選題1.資源共享池中資源類型包括()A、存儲量B、處理能力C、內(nèi)存量D、網(wǎng)絡(luò)帶寬參考答案:ABCD2.在YARN體系結(jié)構(gòu)中,ApplicationMaster主要功能包括哪些?A、當(dāng)用戶作業(yè)提交時,ApplicationMaster與ResourceManager協(xié)商獲取資源,ResourceManager會以容器的形式為ApplicationMaster分配資源B、把獲得的資源進(jìn)一步分配給內(nèi)部的各個任務(wù)(Map任務(wù)或Reduce任務(wù)),實現(xiàn)資源的“二次分配”C、定時向ResourceManager發(fā)送“心跳”消息,報告資源的使用情況和應(yīng)用的進(jìn)度信息D、向ResourceManager匯報作業(yè)的資源使用情況和每個容器的運行狀態(tài)參考答案:ABC3.在Python中,Python網(wǎng)絡(luò)框架可以省去開發(fā)者處理網(wǎng)絡(luò)應(yīng)用底層的()A、協(xié)議B、線程C、邏輯D、進(jìn)程參考答案:ABD4.在Python中,pymysql連接數(shù)據(jù)庫進(jìn)行封裝的好處是?A、減少代碼量B、提高可維護(hù)性C、可以減少代碼錯誤D、安全參考答案:ABD5.在Python中,F(xiàn)lask框架的安裝方式有哪些?()A、使用PyCharmB、命令行C、使用InstallerD、使用nmp參考答案:AB6.在Linux系統(tǒng)中,用戶組操作的常用命令有()A、groupaddB、groupmodC、newgrpD、groupdelete參考答案:ABC7.在Java中,以下哪些方法是線程類Thread提供的方法A、wait()B、sleep()C、yield()D、join()參考答案:BCD8.在Java中,對單例模式優(yōu)點描述正確的是A、單例模式在內(nèi)存中只有一個實例,減少了內(nèi)存開支。B、單例模式只生成一個實例,所以減少了系統(tǒng)的性能開銷。C、單例模式可以避免對資源的多重占用。D、單例模式在開發(fā)中很容易擴展。參考答案:ABC9.在Hadoop的分區(qū)階段,不是默認(rèn)的Partitioner是()A、HashParB、PartitionerC、HashPartitionerD、Hmapper參考答案:ACD10.在CentoOS中,一般用什么命令來查看IP地址A、ipaB、B.ipaddrC、C.winipcfgD、D.ifconfig參考答案:ABD11.以下那些是HDFS的設(shè)計特點?A、超大文件B、流式數(shù)據(jù)訪問C、不能處理低時間延遲的數(shù)據(jù)訪問D、存放大量小文件參考答案:ABC12.以下哪些軟件可以對HBase進(jìn)行性能監(jiān)視?A、Master-status(自帶)B、GangliaC、OpenTSDBD、Ambari參考答案:ABCD13.以下關(guān)于序列化Writable的說法正確的是?A、反序列化也稱反串行化,它是指將字節(jié)流轉(zhuǎn)回結(jié)構(gòu)化對象的逆過程。B、Hadoop中使用自己開發(fā)的類:IntWritable、FloatWritable、Text等,都是Writable的實現(xiàn)類。C、序列化和反序列化在分布式數(shù)據(jù)處理中,主要于進(jìn)程間通信和永久存儲兩個領(lǐng)域。D、Writable接口是一個序列化對象的接口,能夠?qū)?shù)據(jù)寫入流或者從流中讀出。參考答案:ABCD14.以下關(guān)于文件塊的說法正確的是?A、文件的所有Block為了容錯都會被冗余復(fù)制。B、除了最后一個Block,所有的Block都是同樣的大小。C、每個文件的Block大小和復(fù)制(Replication)因子都是可配置的。D、HDFS將文件存儲成塊序列。參考答案:ABCD15.以下關(guān)于MapReduce組件缺點描述錯誤的有()。A、不適合實時計算B、不適合流式計算C、不易于編程D、容錯性較差參考答案:CD16.下面哪幾個屬于Reducer階段()A、ShuffleB、SortC、MapD、Reduce參考答案:ABD17.下面哪個屬于大數(shù)據(jù)的應(yīng)用領(lǐng)域?A、智能醫(yī)療研發(fā)B、監(jiān)控身體情況C、實時掌握交通狀況D、金融交易參考答案:ABCD18.下面哪個屬于不斷完善的Hadoop生態(tài)系統(tǒng)中的組件?A、PigB、TezC、KafkaD、DN8參考答案:ABC19.下面關(guān)于Shuffle過程中節(jié)點本地磁盤描述正確的是()A、節(jié)點的本地磁盤可以有多個map輸出的最終文件B、節(jié)點的本地磁盤文件可能來自多個環(huán)形緩沖區(qū)的溢寫文件C、其它節(jié)點可以到當(dāng)前節(jié)點拷貝map輸出的文件D、其它節(jié)點到當(dāng)前節(jié)點拷貝map輸出文件使用的協(xié)議是HTTP參考答案:ABCD20.下面關(guān)于NoSQL與關(guān)系數(shù)據(jù)庫的比較,哪些是正確的?A、關(guān)系數(shù)據(jù)庫以完善的關(guān)系代數(shù)理論作為基礎(chǔ),有嚴(yán)格的標(biāo)準(zhǔn)B、關(guān)系數(shù)據(jù)庫可擴展性較差,無法較好支持海量數(shù)據(jù)存儲C、NoSQL可以支持超大規(guī)模數(shù)據(jù)存儲D、NoSQL數(shù)據(jù)庫缺乏數(shù)學(xué)理論基礎(chǔ),復(fù)雜查詢性能不高參考答案:ABCD21.下面對HBase的描述哪些是正確的?A、不是開源的B、是面向列的C、是分布式的D、是一種NoSQL數(shù)據(jù)庫參考答案:BCD22.下列選項中,屬于MapReduce優(yōu)點的是()。A、易于編程B、適合實時計算C、有良好的擴展性D、有較高的容錯性參考答案:ACD23.下列選項中,哪些命令可以用于查看文件內(nèi)容?()A、hadoopB、hadoopC、hadoopD、hadoop參考答案:BCD24.下列選項哪些是ZooKeeper的應(yīng)用場景?A、Master選舉B、分布式鎖C、數(shù)據(jù)發(fā)布與訂閱D、心跳檢測NameNode參考答案:ABCD25.下列選項參數(shù)是Sqoop指令的是?()A、importB、outputC、inputD、export參考答案:AD26.下列說法正確的是()A、Reducer基類中沒有run()方法。B、Map中的run():相當(dāng)于MapTask的驅(qū)動。C、Map中的run()首先調(diào)用setup()方法進(jìn)行初始化操作.D、Map中的run()方法提供了setup()-->map()-->cleanup()的執(zhí)行模板參考答案:BCD27.下列說法不正確的是()A、map階段不可對數(shù)據(jù)分組后的數(shù)據(jù)進(jìn)行歸約。B、Map和reduce一般不搭配使用。C、Shuffle的大概意思是打亂數(shù)據(jù)。D、Mapreduce程序不經(jīng)過shffule階段。參考答案:AB28.下列哪一項不屬于Hadoop的特性?A、較低可擴展性B、只支持java語言C、成本低D、運行在Linux平臺上參考答案:AB29.下列哪些是可以用在hdfs上的指令A(yù)、catB、-getC、-rmD、-put參考答案:BCD30.下列描述正確的有()A、NullWritable:當(dāng)<key,value>中的key或value為空時使用B、Text:使用UTF8格式存儲的文本C、Text類型需要用.toString()方法才能轉(zhuǎn)換為java的String類型。D、NullWritable和java中的不需要做任何操作就是java中null。參考答案:ABC31.下列描述錯誤的是()A、write()是把每個對象反序列化到輸出流。B、readFields()是把輸入流字節(jié)序列化。C、重寫hashCode()、equals()方法是為咯java對象比較。D、重寫compareTo()是為咯java對象的比較。參考答案:AB32.下列關(guān)于HLog工作原理的描述,哪些是正確的?A、分布式環(huán)境必須要考慮系統(tǒng)出錯。HBase采用HLog保證B、HBase系統(tǒng)為每個Region服務(wù)器配置了一個HLog文件C、Zookeeper會實時監(jiān)測每個Region服務(wù)器的狀態(tài)D、Master首先會處理該故障Region服務(wù)器上面遺留的HLog文件參考答案:ABCD33.下列關(guān)于Hive和關(guān)系型數(shù)據(jù)庫說法錯誤是()。A、Hive的執(zhí)行延遲高于關(guān)系型數(shù)據(jù)庫B、二者都支持索引,但Hive支持較弱C、二者都支持?jǐn)?shù)據(jù)更新D、Hive的可擴性高于關(guān)系型數(shù)據(jù)庫參考答案:BC34.通常消息通信可以分為哪兩種()A、單工通信B、雙工通信C、同步通信D、異步通信參考答案:CD35.數(shù)據(jù)化最早的根基是什么()A、計量B、數(shù)字化C、記錄D、阿拉伯?dāng)?shù)字參考答案:AC36.啟動YARN后,jps能看到哪些守護(hù)進(jìn)程?A、DataNodeB、NodeManagerC、ResourceManagerD、NameNode參考答案:BC37.配置Hadoop集群時,下列哪個Hadoop配置文件需要進(jìn)行修改?()A、hadoop-env.shB、profileC、core-site.xmlD、ifcfg-eth0參考答案:AC38.每次格式化Hadoop的文件系統(tǒng)都會刪除哪兩個文件中的數(shù)據(jù)()A、.dirB、.dirC、dfs.datanode.data.dirD、node.data.dir參考答案:AC39.流數(shù)據(jù)具有以下哪些特征?A、數(shù)據(jù)快速持續(xù)到達(dá),潛在大小也許是無窮無盡的B、數(shù)據(jù)來源眾多,格式復(fù)雜C、注重數(shù)據(jù)的整體價值,不過分關(guān)注個別數(shù)據(jù)D、系統(tǒng)可以控制將要處理的新到達(dá)的數(shù)據(jù)元素的順序參考答案:ABC40.客戶端上傳文件的時候哪項是正確的?()A、數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、客戶端端將文件切分為多個Block,依次上傳C、客戶端只上傳數(shù)據(jù)到一臺DataNode,然后由NameNode負(fù)責(zé)Block復(fù)制工作D、客戶端發(fā)起文件上傳請求,通過RPC與NameNode建立通訊。參考答案:BD41.關(guān)于數(shù)據(jù)創(chuàng)新包含()A、數(shù)據(jù)的再利用B、重組數(shù)組C、可擴展數(shù)據(jù)D、數(shù)據(jù)的折舊值參考答案:ABCD42.關(guān)于Hive中count函數(shù)描述不正確的是()A、count(id)如果該列的值為null時,改行不計入count統(tǒng)計的總行數(shù)中.B、count(*)將表中所有行都算進(jìn)來包括為null行.C、count(1)將表中所有行都算進(jìn)來包括為null行.D、count(*)和count(1)都不算為為null行.參考答案:BCD43.關(guān)于Hive與傳統(tǒng)關(guān)系數(shù)據(jù)庫的對比分析,下面描述正確的是:A、在數(shù)據(jù)存儲方面,Hive一般依賴于分布式文件系統(tǒng)HDFS,而傳統(tǒng)數(shù)據(jù)庫則依賴于本地文件系統(tǒng)B、在索引方面,傳統(tǒng)的關(guān)系數(shù)據(jù)庫可以針對多個列構(gòu)建復(fù)雜的索引,大幅度提升數(shù)據(jù)查詢性能,而Hive不像傳統(tǒng)的關(guān)系型數(shù)據(jù)庫那樣有鍵的概念,它只能提供有限的索引功能C、在分區(qū)方面,傳統(tǒng)的數(shù)據(jù)庫提供分區(qū)功能來改善大型表以及具有各種訪問模式的表的可伸縮性、可管理性,以及提高數(shù)據(jù)庫效率;Hive不支持分區(qū)功能D、在執(zhí)行引擎方面,傳統(tǒng)的關(guān)系數(shù)據(jù)庫依賴自身的執(zhí)行引擎,而Hive則依賴于MapReduce、Tez和Spark等執(zhí)行引擎參考答案:ABD44.關(guān)于HBase二級索引的描述,哪些是正確的?A、核心是倒排表B、二級索引概念是對應(yīng)Rowkey這個“一級”索引C、二級索引使用平衡二叉樹D、二級索引使用LSM結(jié)構(gòu)參考答案:AB45.對MapReduce框架描述正確的是()A、包括MapTask和ReduceTaskB、有Shuffle過程C、可以只有MapTask階段D、MapReduce是對在線數(shù)據(jù)的計算參考答案:ABC46.第三次信息化浪潮的標(biāo)志是哪些技術(shù)的興起?A、個人計算機B、物聯(lián)網(wǎng)C、云計算D、大數(shù)據(jù)參考答案:BCD47.當(dāng)處理CAP的問題時,可以有哪幾個明顯的選擇?A、CA:也就是強調(diào)一致性(C)和可用性(A),放棄分區(qū)容忍性(P)B、CP:也就是強調(diào)一致性(C)和分區(qū)容忍性(P),放棄可用性(A)C、AP:也就是強調(diào)可用性(A)和分區(qū)容忍性(P),放棄一致性(C)D、CAP:也就是同時兼顧可用性(A)、分區(qū)容忍性(P)和一致性(C),當(dāng)時系統(tǒng)性能會下降很多參考答案:ABC48.大數(shù)據(jù)有哪些特性?A、數(shù)據(jù)量大B、數(shù)據(jù)種類繁多C、計算速度快D、價值密度低參考答案:ABCD49.大數(shù)據(jù)具有哪些特點?A、數(shù)據(jù)的“大量化”B、數(shù)據(jù)的“快速化”C、數(shù)據(jù)的“多樣化”D、數(shù)據(jù)的“價值密度比較低”參考答案:ABCD50.常用的HDFSAPI有哪些?A、rename()B、copyFromLocalFile()C、mkdirs()D、delete()參考答案:ABCD51.操作HDFS有哪幾種方式?A、JAVAAPIB、B.WebUIC、C.ShellD、D.VNC參考答案:ABC52.YARN的調(diào)度算法包括以下哪些選項?()A、FIFOSchedulerB、FairSchedulerC、CapacitySchedulerD、StackScheduler參考答案:ABC53.Storm具有以下哪些特點?A、整合性:Storm可方便地與隊列系統(tǒng)和數(shù)據(jù)庫系統(tǒng)進(jìn)行整合B、簡易的API:Storm的API在使用上即簡單又方便C、容錯性:Storm可自動進(jìn)行故障節(jié)點的重啟、任務(wù)的重新分配D、可擴展性:Storm的并行特性使其可以運行在分布式集群中參考答案:ABCD54.Shuffle中的溢寫過程包括()A、合并B、分組C、排序D、分區(qū)參考答案:ABC55.Shuffle過程中的merge的三種形式分別是()A、內(nèi)存到內(nèi)存B、內(nèi)存到磁盤C、磁盤到磁盤D、A、B選項不對參考答案:ABC56.SELinux有幾種狀態(tài)A、EnforcingB、B.PermissivegC、C.DisabledD、D.enable參考答案:ABC57.SecureCRT是一款用于連接運行的工具,支持的協(xié)議有A、SSHB、B.telnetC、C.httpD、D.ntp參考答案:AB58.Scala具有以下哪幾個主要特點?A、Scala的優(yōu)勢是提供了REPL(Read-Eval-PrintLoop,交互式解釋器),提高程序開發(fā)效率B、Scala兼容Java,運行速度快,且能融合到Hadoop生態(tài)圈中C、Scala具備強大的并發(fā)性,支持函數(shù)式編程D、Scala可以更好地支持分布式系統(tǒng)參考答案:ABCD59.MapReduce集群中的節(jié)點硬件有那些?A、光驅(qū)B、主機C、磁盤D、內(nèi)存參考答案:BCD60.MapReduce的具體應(yīng)用包括哪些?A、關(guān)系代數(shù)運算(選擇、投影、并、交、差、連接)B、分組與聚合運算C、矩陣-向量乘法D、矩陣乘法參考答案:ABCD61.MapRecue的優(yōu)點有哪些?A、可擴展性強B、計算機性能高C、容錯性強D、開發(fā)簡單參考答案:ACD62.Linux中重啟系統(tǒng)的命令有()A、init0B、init1C、shutdown-rnowD、reboot參考答案:CD63.JobTracker主要包括哪三大功能?A、資源管理B、任務(wù)調(diào)度C、任務(wù)監(jiān)控D、數(shù)據(jù)即服務(wù)參考答案:ABC64.Hive主要由哪三個模塊組成:A、用戶接口模塊B、用戶查詢模塊C、驅(qū)動模塊D、元數(shù)據(jù)存儲模塊參考答案:ABD65.HDNF的作用是負(fù)責(zé)對數(shù)據(jù)的分布式儲存,其內(nèi)部對象包括()A、ClientB、NameNodeC、DataBasesD、SecondaryNameNode參考答案:ABD66.HDFS文件訪問方式有哪些A、HDFSshellB、JavaAPIC、RESTAPID、thrift實現(xiàn)的Python、PHP等語言訪問參考答案:AB67.HDFS特殊的設(shè)計,在實現(xiàn)優(yōu)良特性的同時,也使得自身具有一些應(yīng)用局限性,主要包括以下哪幾個方面?A、較差的跨平臺兼容性B、無法高效存儲大量小文件C、不支持多用戶寫入及任意修改文件D、不適合低延遲數(shù)據(jù)訪問參考答案:BCD68.HDFS具有較高的容錯性,設(shè)計了哪些相應(yīng)的機制檢測數(shù)據(jù)錯誤和進(jìn)行自動恢復(fù)?A、數(shù)據(jù)源太大B、數(shù)據(jù)節(jié)點出錯C、數(shù)據(jù)出錯D、名稱節(jié)點出錯參考答案:BCD69.HDFS的命名空間包含什么?A、磁盤B、文件C、塊D、目錄參考答案:BCD70.HDFS采用抽象的塊概念可以帶來以下哪幾個明顯的好處?A、支持大規(guī)模文件存儲B、支持小規(guī)模文件存儲C、適合數(shù)據(jù)備份D、簡化系統(tǒng)設(shè)計參考答案:ACD71.HDFSFederation相對于HDFS1.0的優(yōu)勢主要體現(xiàn)在哪里?A、能夠解決單點故障問題B、HDFS集群擴展性C、性能更高效D、良好的隔離性參考答案:BCD72.HDFS1.0主要存在哪些問題?A、單點故障問題B、不可以水平擴展C、單個名稱節(jié)點難以提供不同程序之間的隔離性D、系統(tǒng)整體性能受限于單個名稱節(jié)點的吞吐量參考答案:ACD73.HBase性能優(yōu)化包含下面的哪些選項?A、讀優(yōu)化B、寫優(yōu)化C、配置優(yōu)化D、JVM優(yōu)化參考答案:ABCD74.Hadoop的優(yōu)化與發(fā)展主要體現(xiàn)在哪幾個方面?A、Hadoop自身核心組件MapReduce的架構(gòu)設(shè)計改進(jìn)B、Hadoop自身核心組件HDFS的架構(gòu)設(shè)計改進(jìn)C、Hadoop生態(tài)系統(tǒng)其它組件的不斷豐富D、Hadoop生態(tài)系統(tǒng)減少不必要的組件,整合系統(tǒng)參考答案:ABC75.Hadoop大數(shù)據(jù)有哪兩大核心技術(shù)?A、分布式存儲B、數(shù)據(jù)采集C、可視化D、分布式處理參考答案:AD76.hadoop創(chuàng)建多級目錄(如:/a/b/c)的命令為()A、hadoopfs-mkdir-p/a/b/cB、hadoopfs-mkdir/a/b/cC、hdfsfs-mkdir-p/a/b/cD、hdfsfs-mkdir/a/b/c參考答案:AC77.Hadoop2.x有哪些核心組件組成。A、HDFSB、YARNC、MAPREDUCED、Hive參考答案:ABC78.Hadoop2.0之前,MapReduce是由()所組成。A、客戶端B、作業(yè)管理器C、任務(wù)管理器D、任務(wù)參考答案:ABCD79.Cloudera提供哪幾種安裝CDH的方法A、ClouderaB、TarC、YumD、Rpm參考答案:ABCD判斷題1.只有當(dāng)客戶端明確要刪除臨時節(jié)點時才會被真正刪除。A、正確B、錯誤參考答案:B2.臟頁是linux內(nèi)核中的概念,因為硬盤的讀寫速度遠(yuǎn)趕不上內(nèi)存的速度,系統(tǒng)就把讀寫比較頻繁的數(shù)據(jù)事先放到內(nèi)存中,以提高讀寫速度,稱之為高速緩存。A、正確B、錯誤參考答案:A3.在數(shù)據(jù)傳輸前后生成兩個校驗和,如果不相同則說明數(shù)據(jù)一定存在錯誤。A、正確B、錯誤參考答案:A4.在大數(shù)據(jù)框架中,批處理系統(tǒng)一般不適用于對延時要示較高的場景A、正確B、錯誤參考答案:A5.在Map階段的分組部分,相同key的若干value會被放入一個組里。A、正確B、錯誤參考答案:A6.在Linux的安裝過程中不可以進(jìn)行網(wǎng)絡(luò)配置。A、正確B、錯誤參考答案:B7.在internet網(wǎng)絡(luò)中,tcp/ip網(wǎng)絡(luò)協(xié)議只能提供面向無連接服務(wù)A、正確B、錯誤參考答案:B8.在Hadoop1.x版本中,MapReduce程序是運行在Yarn集群之上。A、正確B、錯誤參考答案:B9.一個簡單的MapReduce程序只需要指定:map、reduce、input、output剩下的事由框架完成。A、正確B、錯誤參考答案:A10.我們在開發(fā)分布式計算job的時候,可以去掉reduce階段A、正確B、錯誤參考答案:A11.偽分布式模式下的Hadoop功能與完全分布式模式下的Hadoop功能相同。A、正確B、錯誤參考答案:A12.數(shù)據(jù)整合是指數(shù)據(jù)創(chuàng)建的副本A、正確B、錯誤參考答案:B13.數(shù)據(jù)存檔是指將長期不用的數(shù)據(jù)提取出來保存到其他數(shù)據(jù)庫的過程A、正確B、錯誤參考答案:A14.使用loaddata加載數(shù)據(jù)時如果有overwrite關(guān)鍵字會把表中原有的數(shù)據(jù)刪除。A、正確B、錯誤參考答案:A15.軟件啟動之后JobTracker接收J(rèn)ob,但是不會去負(fù)責(zé)調(diào)度Job的每一個子任務(wù)。A、正確B、錯誤參考答案:B16.如果NameNode意外終止,SecondaryNameNode會接替它使集群繼續(xù)工作。A、正確B、錯誤參考答案:B17.容器調(diào)度器在多用戶的情況下,可以最大化集群的吞吐和利用率A、正確B、錯誤參考答案:A18.配置Hadoop集群只需要修改core-site、xml配置文件就可以。A、正確B、錯誤參考答案:B19.命令hadoopfs-safemodeget-查看安全模式狀態(tài)A、正確B、錯誤參考答案:A20.每個map槽就是一個線程。A、正確B、錯誤參考答案:B21.每個MapTask可以對應(yīng)多個環(huán)形緩沖區(qū)A、正確B、錯誤參考答案:A22.每次啟動Hadoop都要格式化文件系統(tǒng)A、正確B、錯誤參考答案:B23.可以在Map任務(wù)結(jié)束時會對文件進(jìn)行合并,減少網(wǎng)絡(luò)的傳輸量。命令hadoopfs-safemodeget用于查看安全模式狀態(tài)。A、正確B、錯誤參考答案:A24.計算架構(gòu):抽象架構(gòu)+軟件設(shè)計+實現(xiàn)方法。A、正確B、錯誤參考答案:A25.集群內(nèi)每個節(jié)點都應(yīng)該配RAID,這樣避免單磁盤損壞,影響整個節(jié)點運行。A、正確B、錯誤參考答案:B26.公平調(diào)度器是所有隊列中的所有任務(wù)公平的得到相同資源A、正確B、錯誤參考答案:B27.分區(qū)數(shù)量是ReduceTask的數(shù)量。A、正確B、錯誤參考答案:A28.反序列化時如果有一個字符串的類型,不用UTFA、正確B、錯誤參考答案:B29.查看Linuxip的命令是ifconfigA、正確B、錯誤參考答案:A30.Zookeeper可以作為文件存儲系統(tǒng),因此可以將大規(guī)模數(shù)據(jù)文件存在該系統(tǒng)中。A、正確B、錯誤參考答案:B31.Zookeeper集群宕機數(shù)超過集群數(shù)一半,則Zookeeper服務(wù)失效。A、正確B、錯誤參考答案:A32.WebMagic的是一個無須配置、便于二次開發(fā)的爬蟲框架,它提供簡單靈活的APIA、正確B、錯誤參考答案:A33.TaildirSource用于觀察指定的文件,可以實時監(jiān)測到添加到每個文件的新行,如果文件正在寫入新行,則此采集器將重試采集它們以等待寫入完成。A、正確B、錯誤參考答案:A34.Storm的計算機體系采用了主從(Master/Slave)架構(gòu)。A、正確B、錯誤參考答案:A35.Sqoop是hadoop生態(tài)圈上的數(shù)據(jù)傳輸工具A、正確B、錯誤參考答案:A36.Sqoop導(dǎo)入指的是將數(shù)據(jù)從HDFS遷移到關(guān)系型數(shù)據(jù)庫。A、正確B、錯誤參考答案:B37.SecondaryNameNode是NameNode的備份,可以有效解決Hadoop集群單點故障問題。A、正確B、錯誤參考答案:B38.Secondarynamenode就是namenode出現(xiàn)問題時的備用節(jié)點A、正確B、錯誤參考答案:B39.rhadoop是用R語言開發(fā)的,MapReduce可以使用其他語言開發(fā)。A、正確B、錯誤參考答案:A40.Reduce(化簡歸約)對一些獨立元素組成的列表的每一個元素進(jìn)行指定的操作,可以高度并行。A、正確B、錯誤參考答案:B41.NameNode是HDFS系統(tǒng)中的管理局節(jié)點,它管理文件系統(tǒng)的命名空間,記錄每個文件數(shù)據(jù)塊在DataNode上的位置和副本信息、協(xié)調(diào)客戶端對文件的訪問、記錄命名空間內(nèi)的改動和空間本身屬性的改動。A、正確B、錯誤參考答案:B42.NameNode負(fù)責(zé)管理metadata,client端每次讀寫請求,它都會從磁盤中讀取或則會寫入metadata信息并反饋client端。A、正確B、錯誤參考答

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論