《大數(shù)據技術原理與操作應用》習題解答(一)_第1頁
《大數(shù)據技術原理與操作應用》習題解答(一)_第2頁
《大數(shù)據技術原理與操作應用》習題解答(一)_第3頁
《大數(shù)據技術原理與操作應用》習題解答(一)_第4頁
《大數(shù)據技術原理與操作應用》習題解答(一)_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

《大數(shù)據技術原理與操作應用》習題解答(一)

第一章

一、單選題

1、下列選項中,最早提出''大數(shù)據"這一概念的是OO

?A、貝恩

?B、麥肯錫

?C、吉拉德

?D、杰弗遜

參考答案:B

2、下列選項中,哪一項是研究大數(shù)據最重要的意義Oo

?A、分析

?B、統(tǒng)計

?C、測試

?D、預測

參考答案:D

答案解析:研究大數(shù)據,最重要的意義是預測。

3、Hadoopl.O中,Hadoop內核的主要組成是()。

?A、HDFS和MapReduce

?B、HDFS和Yarn

?C、Yarn

?D、MapReduce和Yarn

參考答案:A

答案解析:Hadoopl.O中,Hadoop內核的主要是由HDFS和MapReduce兩個系統(tǒng)

組成。

4、在HDFS中,用于保存數(shù)據的節(jié)點是()。

?A、namenode

?B、datanode

?C^secondaryNode

?D、yarn

參考答案:B

二、多選題

1、下列選項中,屬于Google提出的處理大數(shù)據的技術手段有()。

?A、MapReduce

?B、MySQL

?C、BigTable

?D、GFS

參考答案:A,C,D

答案解析:Google提出了三個處理大數(shù)據的技術手段,分別是MapReduce、

BigTable和GFS。

2、下列選項中,屬于Hadoop優(yōu)勢的有()。

?A、擴容能力強

?B、可靠性

?C、低效率

?D、高容錯性

參考答案:A,B,D

答案解析:Hadoop具有擴展能力強、成本低、高效率、可靠性、高容錯性的優(yōu)勢。

3、下列選項中,屬于Hadoop版本系列的有。。

?A、Hadoop4

?B、Hadoop2

?C、Hadoopl

?D、Hadoop3

參考答案:B,C,D

答案解析:Hadoop主要分為Hadoopl、Hadoop2、Hadoop3三個系歹(J的多個版

本。

三、判斷題

1、大數(shù)據提供的是一些描述性的信息,而創(chuàng)新還是需要人類自己實現(xiàn)。

?對

?錯

參考答案:對

2、JobTracker只負責執(zhí)行TaskTracker分配的計算任務。

?對

?錯

參考答案:錯

答案解析:TaskTracker只負責執(zhí)行JobTracker分配的計算任務。

3、大數(shù)據在醫(yī)療行業(yè)中可以有效控制疾病的發(fā)生。

?對

?錯

參考答案:錯

答案解析:在醫(yī)療行業(yè)中,大數(shù)據可以有效預防預測疾病。

4、在HDFS中,namenode用于決定數(shù)據存儲到哪一個datanode節(jié)點上。

?對

?錯

參考答案:對

5、Hadoop是Apache頂級的開源項目。

?對

?錯

參考答案:對

6、Hadoop的開源社區(qū)版比較著名的是Cloudera公司的CDH版本。

?對

.錯

參考答案:錯

答案解析:Hadoop的商業(yè)版比較著名的是Cloudera公司的CDH版本。

四、填空題

1、馬云曾經說過未來的時代將不是工T時代,而是【】時代。

參考答案:【DT】

2、【】中引入了資源管理框架Yarn。

參考答案:[Hadoop2.x]

3、大數(shù)據的四大特征是體量大(Volume)、【】、速度快(Velocity)和。

參考答案:【多樣(Varity)]【價值(Value)]

4、在Hadoopl.x版本中,MapReduce是由一個[]和多個TaskTracker組成。

參考答案:[JobTracker]

5、大數(shù)據在金融行業(yè)中的具體表現(xiàn)為【】、【】、決策支持、服務創(chuàng)新以及產品創(chuàng)

新。

參考答案:【精準營銷】【風險管控】

6、大數(shù)據的分為【】、非結構話數(shù)據和【】。

參考答案:【結構化數(shù)據】【半結構化數(shù)據】

答案解析:大數(shù)據的分為結構化數(shù)據、非結構話數(shù)據以及半結構化數(shù)據。

五、簡答題

1、簡述大數(shù)據在零售行業(yè)應用的具體表現(xiàn)。

參考答案:大數(shù)據在零售行業(yè)的具體表現(xiàn)有三個,分別是精準定位零售行業(yè)市場、支

撐行業(yè)收益管理以及挖掘零售業(yè)新需求。

2、簡述Hadoop生態(tài)體系常見的子系統(tǒng)。

參考答案:Hadoop生態(tài)體系中常見的子系統(tǒng)有HDFS分布式文件系統(tǒng)、MapReduce

分布式計算框架、Yarn資源管理框架、Sqoop數(shù)據遷移工具、Mahout數(shù)據挖掘算法

庫、HBase分布式存儲系統(tǒng)、Zookeeper分布式協(xié)作服務、Hive基于Hadoop的數(shù)

據倉庫以及Flume日志收集工具。

第2章課后習題答案

一、單選題

1.下列選項中,哪個配置文件可以配置HDFS地址、端口號以及臨時文件目錄()。

A.core-site,xmlB.hdfs-site.xml

C.mapred-site.xmlD.yarn-site,xml

參考答案:A

2.Hadoop集群啟動成功后,用于監(jiān)控HDFS集群的端口是(

A.50010B.50075C.8485D.50070

參考答案:D

3.下列選項中,可以進行重啟引導系統(tǒng)的是()。

A.OKB.CancelC.RebootD.Apply

參考答案:C

4.下列選項中,關于SSH服務說法正確的是()。

A.SSH服務是一種傳輸協(xié)議B.SSH服務是一種通信協(xié)議

C.SSH服務是一種數(shù)據包協(xié)議D.SSH服務是一種網絡安全協(xié)議

參考答案:D

5.下列選項中,一鍵啟動HDFS集群的命令是()。

A.start-namenode.shB.start-datanode.sh

C.start-dfs.shD.start-slave,sh

參考答案:C

6.在Hadoop的解壓目錄下,可以查看Hadoop的目錄結構的命令是()。

A.jpsB.11C.tarD.find

參考答案:B

7.下列選項中,存放Hadoop配置文件的目錄是()

A.includeB.binC.libexeD.etc

參考答案:D

8.在配置Linux網絡參數(shù)時,固定IP地址是將路由協(xié)議配置為()。

A.staticB.dynamicC.immutableD.variable

參考答案:A

9.下列選項中,可以對Hadoop集群進行格式化的是(

A.hadoopnamenode-formatB.hadoopnamenode-Is

C.hdfsdatanode-IsD.hdfsdatanode-format

參考答案:A

10.下列選項中,查看Linux系統(tǒng)的IP配置的命令是()。

A.ipconfigB.findC.ifconfigD.arp-a

參考答案:C

二、多選題

1.下列選項中,關于Hadoop集群說法正確的是()

A.Hadoop集群包含Worker節(jié)點B.Hadoop集群包含Master節(jié)點

C.Hadoop集群包含Slave節(jié)點D.Hadoop集群包含HMaster節(jié)點

參考答案:BC

2.Hadoop提供的自定義配置時編輯的配置文件中,包含()。

A.core-site,xmlB.hdfs-site.xmlC.mapred-site.xmlD.yarn-site,xml

參考答案:ABCD

三、判斷題

1.偽分布式模式下的Hadoop功能與完全分布式模式下的Hadoop功能相同。。

參考答案:錯

2.啟動Hadoop集群時,可能出現(xiàn)NodeManager進程無法啟動或者啟動后自動關閉情

況,這是由于系統(tǒng)內存和資源分配不足導致的。()

參考答案:對

3.執(zhí)行“start-all.sh”命令,可以一鍵啟動整個Hadoop集群的服務。()

參考答案:對

4.“yarn-env.sh”配置文件是用來保證Hadoop系統(tǒng)能夠正常執(zhí)行HDFS的守護進

程NameNode、SecondaryNameNode和DataNode。()

參考答案:錯

5.通過執(zhí)行命令"serviceiptablesstatus''可以關閉Linux系統(tǒng)的防火墻。(

參考答案:錯

6.Hadoop集群執(zhí)行完MapReduce程序后,會輸出“.SUCCESS”和“part-r-00000”

結果文件。()

參考答案:對

7.通過使用虛擬機軟件(如VMwareWorkstation),可以在同一臺電腦上構建多個

Linux虛擬機環(huán)境。()

參考答案:對

8.當完成Hadoop集群的安裝和配置后,就可以直接啟動集群。()

參考答案:錯

9.當配置好虛擬機的主機名和IP映射后,就可以正常使用虛擬機。()

參考答案:錯

10.啟動Hadoop集群,只能有一種方式啟動,即單節(jié)點逐個啟動。()

參考答案:錯

11.在Hadoop的解壓目錄下的bin目錄中,存放的是Hadoop的配置文件。()

參考答案:錯

12.在“hdfs-site.xml”配置文件中,可以配置HDFS數(shù)據塊的副本數(shù)量。()

參考答案:對

13.在安裝部署Hadoop集群之前,不需要提前安裝并配置好JDKo()

參考答案:錯

四、填空題

1.當出現(xiàn)時,說明Hadoop集群已經被格式化成功。

參考答案:successfullyformatted

2.Hadoop集群啟動成功后,通過端口____________監(jiān)控YARN集群。

參考答案:8088

3.Hadoop的解壓目錄下目錄存放的是Hadoop管理腳本,包含HDFS和

YARN中各類服務的啟動或關閉腳本。

參考答案:sbin

4.通過執(zhí)行命令,可以使得配置的環(huán)境變量文件生效。

參考答案:source/etc/profile

5.“hadoop-mapreduce-examples-2.7.7.jar"包中有計算和pi值

的功能。

參考答案:單詞個數(shù)

6.在Hadoop集群執(zhí)行完MapReduce程序后,輸出的結果文件表示此次

任務成功執(zhí)行。

參考答案:_SUCCESS

7.Hadoop支持在系統(tǒng)和Windows系統(tǒng)上進行安裝使用。

參考答案:Linux

8.Hadoop提供的和yarn-env.sh配置文件是用來指定Hadoop和YARN

所需的運行環(huán)境。

參考答案:hadoop-env.sh

9.一鍵啟動YARN集群的命令是o

參考答案:s

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論