雨課堂學堂在線學堂云大數(shù)據(jù)技術原理與應用湖北科技學院單元測試考核答案_第1頁
雨課堂學堂在線學堂云大數(shù)據(jù)技術原理與應用湖北科技學院單元測試考核答案_第2頁
雨課堂學堂在線學堂云大數(shù)據(jù)技術原理與應用湖北科技學院單元測試考核答案_第3頁
雨課堂學堂在線學堂云大數(shù)據(jù)技術原理與應用湖北科技學院單元測試考核答案_第4頁
雨課堂學堂在線學堂云大數(shù)據(jù)技術原理與應用湖北科技學院單元測試考核答案_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

注:不含主觀題第1題萬維網(wǎng)之父是()。A彼得·德魯克B舍恩伯格C蒂姆·伯納斯-李D斯科特·布朗第2題下列關于大數(shù)據(jù)的分析理念的說法中,錯誤的是()。A在數(shù)據(jù)基礎上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B在分析方法上更注重相關分析而不是因果分析C在分析效果上更追究效率而不是絕對精確D在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)第3題下列國家的大數(shù)據(jù)發(fā)展行動中,集中體現(xiàn)“重視基礎、首都先行”的國家是(

)。A美國B日本C中國D韓國第4題大數(shù)據(jù)的最顯著特征是(

)。A數(shù)據(jù)規(guī)模大B數(shù)據(jù)類型多樣C數(shù)據(jù)處理速度快D數(shù)據(jù)價值密度高第5題下列關于聚類挖掘技術的說法中,錯誤的是(

)。A不預先設定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別B要求同類數(shù)據(jù)的內(nèi)容相似度盡可能小C要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能小第6題下列關于計算機存儲容量單位的說法中,錯誤的是(

)。A1KB<1MB<1GBB基本單位是字節(jié)(Byte)C一個漢字需要一個字節(jié)的存儲空間D一個字節(jié)能夠容納一個英文字符,第7題下列關于網(wǎng)絡用戶行為的說法中,錯誤的是()。

A網(wǎng)絡公司能夠捕捉到用戶在其網(wǎng)站上的所有行為B用戶離散的交互痕跡能夠為企業(yè)提升服務質(zhì)量提供參考C數(shù)字軌跡用完即自動刪除D用戶的隱私安全很難得以規(guī)范保護第8題在數(shù)據(jù)生命周期管理實踐中,()是A數(shù)據(jù)存儲和備份規(guī)范B數(shù)據(jù)管理和維護C數(shù)據(jù)價值發(fā)覺和利用D數(shù)據(jù)應用開發(fā)和管理第9題

美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標明了大風與洋流可能發(fā)生的地點。這體現(xiàn)了大數(shù)據(jù)分析理念中的(

)。A在數(shù)據(jù)基礎上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B在分析方法上更注重相關分析而不是因果分析C在分析效果上更追究效率而不是絕對精確D在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)第10題當前社會中,最為突出的大數(shù)據(jù)環(huán)境是()A互聯(lián)網(wǎng)B物聯(lián)網(wǎng)C綜合國力D自然資源第11題下列關于舍恩伯格對大數(shù)據(jù)特點的說法中,錯誤的是()。A數(shù)據(jù)規(guī)模大B數(shù)據(jù)類型多樣C數(shù)據(jù)處理速度快D數(shù)據(jù)價值密度高第12題大數(shù)據(jù)的最顯著特征是()。A數(shù)據(jù)規(guī)模大B數(shù)據(jù)類型多樣C數(shù)據(jù)處理速度快D數(shù)據(jù)價值密度高第13題智慧城市的構建,不包含()。A數(shù)字城市B物聯(lián)網(wǎng)C聯(lián)網(wǎng)監(jiān)控D云計算第14題下列關于數(shù)據(jù)重組的說法中,錯誤的是()A數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集B數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒C數(shù)據(jù)重組實現(xiàn)的關鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成D數(shù)據(jù)重組有利于實現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新第15題智能健康手環(huán)的應用開發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術的應用。

A統(tǒng)計報表B網(wǎng)絡爬蟲CAPI接口D傳感器第16題()反映數(shù)據(jù)的精細化程度,越細化的數(shù)據(jù),價值越高。A規(guī)模B活性C關聯(lián)度D顆粒度第17題數(shù)據(jù)清洗的方法不包括()。A缺失值處理B噪聲數(shù)據(jù)清除C一致性檢查D重復數(shù)據(jù)記錄處理第18題根據(jù)不同的業(yè)務需求來建立數(shù)據(jù)模型,抽取最有意義的向量,決定選取哪種方法的數(shù)據(jù)分析角色人員是A數(shù)據(jù)管理人員B數(shù)據(jù)分析員C研究科學家D軟件開發(fā)工程師第19題大數(shù)據(jù)的起源是A金融B電信C互聯(lián)網(wǎng)D公共管理第20題當前大數(shù)據(jù)技術的基礎是由()首先提出的。A微軟B百度C谷歌D阿里巴巴章節(jié)測驗第1題以下哪一項不屬于Hadoop可以運行的模式A單機(本地)模式B偽分布式模式C互聯(lián)模式D分布式模式第2題

Hadoop的作者是下面哪一位AMartinFowlerBDougcutting

CKentBeck

DGraceHopper

第3題下列哪個程序通常與NameNode在同一個節(jié)點啟動ATaskTrackerBDataNode

CSecondaryNameNode

DJobtracker第4題下列哪項通常是集群的最主要瓶頸A

CPUB網(wǎng)絡C磁盤IO

D內(nèi)存第5題DougCutting所創(chuàng)立的項目的名稱都受到其家人的啟發(fā),以下項目不是由他創(chuàng)立的項目是

A

HadoopBNutchC

Lucene

DSolr

第6題配置Hadoop時,JAVA_HOME包含在哪一個配置文件中A

hadoop-default.xml

B

hadoop-env.shChadoop-site.xmlD

configuration.xsl

第7題

Hadoop配置文件中,hadoop-site.xml顯示覆蓋hadoop-default.xml里的內(nèi)容。在版本0.20中,hadoop-site.xml被分離成三個XML文件,不包括

Aconf-site.xml

Bmapred-site.xml

Ccore-site.xml

D

hdfs-site.xml

第8題關于Hadoop單機模式和偽分布式模式的說法,正確的是A兩者都起守護進程,且守護進程運行在一臺機器上B單機模式不使用HDFS,但加載守護進程

C兩者都不與守護進程交互,避免復雜性D后者比前者增加了HDFS輸入輸出以及可檢查內(nèi)存使用情況

第9題下列關于HadoopAPI的說法錯誤的是AHadoop的文件API不是通用的,只用于HDFS文件系統(tǒng)

BConfiguration類的默認實例化方法是以HDFS系統(tǒng)的資源配置為基礎的

CFileStatus對象存儲文件和目錄的元數(shù)據(jù)

第10題Hadoopfs中的-get和-put命令操作對象是A文件

B目錄C兩者都是第11題以下說法不正確的是

A

HadoopStreaming使用Unix中的流與程序交互

BHadoopStreaming允許我們使用任何可執(zhí)行腳本語言處理數(shù)據(jù)流

C采用腳本語言時必須遵從UNIX的標準輸入STDIN,并輸出到STDOUT

DReduce沒有設定,上述命令運行會出現(xiàn)問題

第12題Hadoop作者AMartinFowlerBKentBeckCDougcutting第13題下列哪項可以作為集群的管理?APuppet

BPdsh

CClouderaManagerDZookeeper正確答案:DAB第14題配置機架感知的下面哪項正確:A如果一個機架出問題,不會影響數(shù)據(jù)讀寫B(tài)寫入數(shù)據(jù)的時候會寫到不同機架的DataNode中CMapReduce會根據(jù)機架獲取離自己比較近的網(wǎng)絡數(shù)據(jù)正確答案:CBA第15題下列哪個是Hadoop運行的模式A單機版B偽分布式C分布式正確答案:ABC第16題Ganglia不僅可以進行監(jiān)控,也可以進行告警第17題BlockSize是不可以修改的。第18題Nagios不可以監(jiān)控Hadoop集群,因為它不提供Hadoop支持。第19題如果

NameNode意外終止,SecondaryNameNode會接替它使集群繼續(xù)工作。第20題ClouderaCDH是需要付費使用的。第21題Hadoop是Java開發(fā)的,所以MapReduce只支持Java語言編寫。第22題

Hadoop支持數(shù)據(jù)的隨機讀寫第23題Hadoop自身具有嚴格的權限管理和安全措施保障集群正常運行第24題hadoopdfsadmin–report命令用于檢測HDFS損壞塊。第25題10.Hadoop默認調(diào)度器策略為FIFO第26題集群內(nèi)每個節(jié)點都應該配RAID,這樣避免單磁盤損壞,影響整個節(jié)點運行。第27題

Hadoop環(huán)境變量中的HADOOP_HEAPSIZE用于設置所有Hadoop守護線程的內(nèi)存。它默認是200GB。章節(jié)測試第1題關于SecndaryNameNode哪項是正確的?A它是NameNode的熱備份B它對內(nèi)存沒有要求C它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間DSecndaryNameNde應與NameNde部署到一個節(jié)點一致性第2題下列哪項通常是集群的最主要瓶頸()ACPUB網(wǎng)絡C磁盤IOD內(nèi)存第3題下面哪個角色負責HDFS數(shù)據(jù)存儲()ANameNodeBDataNodeCSecndaryNameNodeD

tasktracker第4題

HDFS中的block默認保存幾份?()A3份B2份C1份D不確定第5題

HDFS默認BlockSize是()A32MBB64MB(2.7.2版本,本地模式)C128MB(2.7.2版本,分布式模式)D不定第6題

Client端上傳文件的時候下列哪項正確?(

)A數(shù)據(jù)經(jīng)過NameNode傳遞DataNodeBClient端將文件切分為Block,依次上傳C

Client只上傳數(shù)據(jù)到一臺DataNode,然后由NameNode負責Block復制工作DBC都正確第7題下列哪個程序通常與NameNode在一個節(jié)點啟動?()A

SecondaryNameNodeB

DataNodeCTaskTrackerD

JobTracker第8題配置機架感知的下面哪項正確(

)A如果一個機架出問題,不會影響數(shù)據(jù)讀寫B(tài)寫入數(shù)據(jù)的時候會寫到不同機架的DataNode中

CMapReduce會根據(jù)機架獲取離自己比較近的網(wǎng)絡數(shù)據(jù)D都正確第9題下列哪項可以不可作為集群的管理()APuppetBPdshCClouderaManagerDZookeeper

第10題hadoop一鍵閉全部包括hdfs和yarn集群的腳本命令是什么?(

)Astart-all.shBstart-yarn.shCstop-all.shDstop-yarn.sh第11題BlockSize是不可以修改的。第12題如果NameNode意外終止,SecondaryNameNode會接替它使集群繼續(xù)工作。第13題

NameNode負責管理metadata,client端每次讀寫請求,它都會從磁盤中讀取或則會寫入metadata信息并反饋client端。第14題

NameNode本地磁盤保存了Block的位置信息。第15題

DataNode通過長連接與NameNode保持通信。第16題Slave節(jié)點要存儲數(shù)據(jù),所以它的磁盤越大越好。第17題hadoopdfsadmin–report命令用于檢測HDFS損壞塊第18題

因為HDFS有多個副本,所以NameNode是不存在單點問題的。第19題NameNode的WebUI端口是50030,它通過jetty啟動的Web服務第20題HDFS分布式文件系統(tǒng)集群的角色主要有NameNode、DataNode、SecondaryNameNode。章節(jié)測試第1題HDFS默認BlockSize的大小是A32MBB64MBC128MBD256M第2題下列哪項通常是集群的最主要瓶頸___ACPUB網(wǎng)絡C磁盤IOD內(nèi)存

第3題HDFS文件系統(tǒng)中一個gzip文件大小75MB,客戶端設置Block的大小為默認,請問此文件占用幾個Block___A1

B2

C3

D4第4題HDFS是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,具有高容錯、高可靠性、高可擴展性、高吞吐率等特征,適合的讀寫任務是__A一次寫入,少次讀B多次寫入,少次讀C多次寫入,多次讀D一次寫入,多次讀第5題

HBase依靠______存儲底層數(shù)據(jù)。AHDFS

BHadoop

CMemoryDMapReduce第6題HBase依賴______提供強大的計算能力。AZookeeper

BChubby

C

RPCDMapReduce第7題HBase依賴______提供消息通信機制A

Zookeeper

BChubbyCRPC

DSocket第8題下面與HDFS類似的框架是___ANTFS

BFAT32CGFSDEXT3第9題關于SecondaryNameNode下面哪項是正確的___A它是NameNode的熱備B它對內(nèi)存沒有要求C它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間D

SecondaryNameNode應與NameNode部署到一個節(jié)點第10題大數(shù)據(jù)的特點不包括下面哪一項___A巨大的數(shù)據(jù)量B多結構化數(shù)據(jù)C增長速度快D價值密度高第11題第12題

HBase依靠HDFS存儲底層數(shù)據(jù)(

)第13題下面哪些選項正確描述了HBase的特性?A高可靠性B高性能C面向列D

可伸縮正確答案:DCBA第14題下面哪些概念是HBase框架中使用的?AHDFSBGridFSCZookeeperDEXT3正確答案:CA第15題下面對LSM結構描述正確的是?A順序存儲B直接寫硬盤C需要將數(shù)據(jù)Flush到磁盤D是一種搜索平衡樹正確答案:CA章節(jié)測試第1題Hadoop框架是用Java語言實現(xiàn)的,因此,MapReduce應用程序則一定也要用Java來編寫。(

)第2題1.

MapReduce編程模型的其中一個設計理念,就是“計算向數(shù)據(jù)靠攏”,而不是“數(shù)據(jù)向計算靠攏”。(

)第3題1.

MapReduce適宜計算密集型應用。(?)第4題1.

Mapreduce的input?split就是一個block。(?)第5題1.

每個map槽就是一個線程。(

)第6題1.

不同的Map任務之間不會進行通信。(

?)第7題不同的Reduce任務之間,則可能會發(fā)生信息交換。(?)第8題1.

InputSplit是MapReduce對文件進行處理和運算的輸入單位,需要對文件進行物理切分。(

?)第9題有關MapReduce,下面哪個說法是正確的()

A它提供了資源管理能力

B它是開源數(shù)據(jù)倉庫系統(tǒng),用于查詢和分析存儲在Hadoop中的大型數(shù)據(jù)集C它是Hadoop數(shù)據(jù)處理層

第10題在MapReduce中,如果將reducer數(shù)設置為0會發(fā)生怎樣的情形(

A僅有Reduce作業(yè)發(fā)生B僅有Map作業(yè)發(fā)生CReduce輸出會成為最終輸出第11題在MapReduce中,下面哪個會將輸入鍵值對處理成中間鍵值對(

AMapperBReducerCMapper和Reducer第12題在MapReduce中,Map數(shù)取決于(

)的總量

A任務數(shù)B輸入數(shù)據(jù)C輸出數(shù)據(jù)第13題在Hadoop的分區(qū)階段,默認的Partitioner是(

AHashParB

PartitionerC

HashPartitioner第14題下面哪個是一種編程模型,它將大規(guī)模的數(shù)據(jù)處理工作拆分成互相獨立的任務然后并行處理(

AMapReduceBHDFSCPig第15題在Hadoop中,下面哪個是默認的InputFormat類型,它將每行內(nèi)容作為新值,而將字節(jié)偏移量作為key(

)AFileInputFormatBTextInputFormatC

KeyValueTextInputFormat第16題在MapReduce中,對于map輸出的中間結果,負責按key進行分區(qū)的是(

A

RecordReaderBCombinerC

Partitioner第17題在MapReduce中,下面哪個階段是并行進行的(

AShuffle和MapBShuffle和SortCReduce和Sort第18題

關于MapReduce中的鍵值對,下面陳述正確的是(

AKey類必須實現(xiàn)WritableBKey類必須實現(xiàn)WritableComparableCValue類必須實現(xiàn)WritableComparableDValue類必須繼承WritableComparable第19題在HDFS中,put命令用于(

A將文件或從本地文件系統(tǒng)拷貝到HDFS

B將文件或者目錄從本地文件系統(tǒng)拷貝到HDFS

C將文件從HDFS拷貝到本地文件系統(tǒng)D將文件或者目錄從HDFS拷貝到本地文件系統(tǒng)第20題在Hadoop中,下面哪一個是默認的OutputFormat(

ASquenceFileOutputFormatBLazyOutputFormatCDBOutputFormat

DTextOutputFormat第21題

下面哪個不是Hadoop的輸入格式(

AByteInputFormatBTextInputFormatCSquenceFileInputFormatDKeyValueInputFormat第22題在MapReduce中,下面哪個數(shù)據(jù)流的順序是正確的()Aabcdfe

Babcedf

Cacdefb

D

abcdef第23題下面哪個不屬于Reducer階段(

AShuffle

BSortCMapDReduce第24題下面關于MapReduce模型中Map函數(shù)與Reduce函數(shù)的描述正確的是(

)A一個Map函數(shù)就是對一部分原始數(shù)據(jù)進行指定的操作。B一個Map操作就是對每個Reduce所產(chǎn)生的一部分中間結果進行合并操作。CMap與Map之間不是相互獨立的。DReduce與Reduce之間不是相互獨立的。第25題如何禁用reduce階段(

A設置conf.setNumreduceTasks(0)B設置job.setNumreduceTasks(0)C設置job.setNumreduceTasks()=0第26題

shuffle和sort輸出的key實現(xiàn)了下面哪個接口(

AWritableBWritableComparableC

ConfigurableD

ComparableWritable第27題在MapReduce編程時,如下階段的順序是(

)AMapperPartitionerShuffle/SortCombinerBMapperPartitionerCombinerShuffle/SortCMapperShuffle/SortCombinerPartitioner

DMapperCombinerPartitionerShuffle/Sort第28題下面生成中間鍵值對的是(

AReducer

BMapperC

CombinerDPartitioner第29題第30題第31題第32題第33題第34題章節(jié)測試第1題關于數(shù)據(jù)及軟件架構的CAP理論不包括下面哪些A可用性B一致性C分區(qū)容忍性D分布性第2題下列關于spark中的RDD描述正確的有ARDD(ResilientDistributedDataset)叫做彈性分布式數(shù)據(jù)集,是spark中最基本的數(shù)據(jù)抽象BResilient:表示彈性的,彈性表示CDestributed:分布式,可以并行在集群計算DDataset:就是一個集合,用于存放數(shù)據(jù)的正確答案:DCBA第3題下列哪些是面向?qū)ο蠹夹g的特征A封裝B繼承C多態(tài)D分布性正確答案:CBA第4題下列描述正確的是A進程(Process)是程序的一次執(zhí)行過程B線程(Thread)是比進程更小的執(zhí)行單位C

線程不可共享相同的內(nèi)存單元D在同一個應用程序中可以有多個線程同時執(zhí)行正確答案:DBA第5題

下面哪些是spark比Mapreduce計算快的原因A基于內(nèi)存的計算B基于DAG的調(diào)度框架C基于Lineage的容錯機制D基于分布式計算的框架正確答案:CBA第6題下面哪個操作是窄依賴?Ajoin

Bfilter

Cgroup

Dsort

第7題.下面哪個操作肯定是寬依賴

A

map

BflatMap

CreduceByKey

D

sample第8題最早是Cloudera提供的日志收集系統(tǒng),目前是Apache下的一個孵化項目,支持在日志系統(tǒng)中定制各類數(shù)據(jù)發(fā)送方,用于收集數(shù)據(jù)的工具是AFlumeBZookeeperCStormDSparkstreaming第9題一個分布式應用程序協(xié)調(diào)服務,分布式應用程序可以基于它實現(xiàn)同步服務,配置維護和命名服務等的工具有AFlumeBZookeeperCStormDSparkstreaming第10題作為分布式消息隊列,既有非常優(yōu)秀的吞吐量,又有較高的可靠性和擴展性,同時接受Sp

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論