大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷43)_第1頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷43)_第2頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷43)_第3頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷43)_第4頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷43)_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷43)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共57題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.以下關(guān)于數(shù)據(jù)收集工具的描述,不準(zhǔn)確的是?A)Loader提供了本集群內(nèi)部HDFS和HBase之間的數(shù)據(jù)導(dǎo)入或?qū)С觥)Loader是實(shí)現(xiàn)PusionInsightHD與關(guān)系型數(shù)據(jù)庫(kù)、文件系統(tǒng)之間交換數(shù)據(jù)和文件的數(shù)據(jù)加載工具C)Sqoop是一款開源的工具,主要用于在Hive與傳統(tǒng)的數(shù)據(jù)庫(kù)間進(jìn)行數(shù)據(jù)的傳遞,可以將關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)導(dǎo)入到Hadoop的HDFS中,也出可將HDFS的數(shù)據(jù)導(dǎo)出到關(guān)系型數(shù)據(jù)庫(kù)中D)Kettle是一款國(guó)外開源的ETL工具,純java編寫,目前僅可以在Linux上運(yùn)行。數(shù)據(jù)抽取高效穩(wěn)定答案:D解析:[單選題]2.參數(shù)估計(jì)又可分為()和區(qū)間估計(jì)。A)線型估計(jì)B)點(diǎn)估計(jì)C)回歸估計(jì)D)二維分析答案:B解析:參數(shù)估計(jì)是根據(jù)從總體中抽取的隨機(jī)樣本來估計(jì)總體分布中未知參數(shù)的過程。從估計(jì)形式看,區(qū)分為點(diǎn)估計(jì)與區(qū)間估計(jì)。[單選題]3.關(guān)于Hive與傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的對(duì)比,下列描述錯(cuò)誤的是:()。A)Hive元數(shù)據(jù)存儲(chǔ)獨(dú)立于數(shù)據(jù)存儲(chǔ)之外,從而解耦合元數(shù)據(jù)和數(shù)據(jù),靈活性高,二傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)應(yīng)用單一,靈活性低B)Hive基于HDFS存儲(chǔ),理論上存儲(chǔ)可以無限擴(kuò)容,而傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)量有上限C)由于Hive的數(shù)據(jù)存儲(chǔ)在HDFS上,所以可以保證數(shù)據(jù)的高容錯(cuò),高可靠D)由于Hive基于大數(shù)據(jù)平臺(tái),所以查詢效率比傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)快答案:D解析:[單選題]4.要得到最后一句SELECT查詢到的總行數(shù),可以使用的函數(shù)是()A)FOUND_ROWSB)LAST_ROWSC)ROW_COUNTD)LAST_INSERT_ID答案:A解析:[單選題]5.()是指理解挖掘項(xiàng)日的目標(biāo)業(yè)務(wù)需求。A)業(yè)務(wù)理解B)數(shù)據(jù)理解C)數(shù)據(jù)準(zhǔn)備D)數(shù)據(jù)建模答案:A解析:[單選題]6.下列哪個(gè)組件可以實(shí)現(xiàn)數(shù)據(jù)庫(kù)的導(dǎo)入導(dǎo)出()。A)MahoutB)ZookeeperC)FlumeD)Sqoop答案:D解析:[單選題]7.DAYU批量數(shù)據(jù)遷移(CloudDataMigration)提供()數(shù)據(jù)源之間批量數(shù)據(jù)遷移服務(wù),幫助您實(shí)現(xiàn)數(shù)據(jù)自由流動(dòng)。A)同構(gòu)B)異構(gòu)C)同構(gòu)/異構(gòu)D)架構(gòu)答案:C解析:[單選題]8.字符串中,成員資格判斷使用的關(guān)鍵字是()A)limitB)toC)inD)len答案:C解析:[單選題]9.云計(jì)算是對(duì)()技術(shù)的應(yīng)用和發(fā)展?A)并行計(jì)算B)網(wǎng)格計(jì)算C)分布式計(jì)算D)以上三項(xiàng)都是答案:D解析:[單選題]10.進(jìn)行專家系統(tǒng)的開發(fā)通常采用的方法是()。A)逐步求精B)實(shí)驗(yàn)法C)原型法D)遞推法答案:C解析:[單選題]11.下列不屬于可視化視覺下的數(shù)據(jù)類型的是()。A)定類數(shù)據(jù)B)定序數(shù)據(jù)C)定寬數(shù)據(jù)D)定比數(shù)據(jù)答案:C解析:從可視化處理視角看,可以將數(shù)據(jù)分為定類數(shù)據(jù)、定序數(shù)據(jù)、定距數(shù)據(jù)和定比數(shù)據(jù)4個(gè)類型,并采用不同的視覺映射方法。在可視化領(lǐng)域,對(duì)數(shù)據(jù)進(jìn)行分類分析是由于不同類型的數(shù)據(jù)可支持的操作類型不同。[單選題]12.通過KMeans算法進(jìn)行聚類分析后得出的聚類結(jié)果的特征是()A)同一聚類中的對(duì)象間相似度高,不同聚類中的對(duì)象間相似度高B)同一聚類中的對(duì)象間相似度高,不同聚類中的對(duì)象間相似皮低C)同一聚類中的對(duì)象間相似度低,不同聚類中的對(duì)象間相似度低D)同一聚類中的對(duì)象間相似度低,不同聚類中的對(duì)象間相似度高答案:B解析:[單選題]13.以下關(guān)于Zookeeper關(guān)鍵特性中的原子性說法正確的是:()。A)客戶端發(fā)送的更新會(huì)按照他們發(fā)送的順序進(jìn)行應(yīng)用B)鞥新只能全部完成或失敗,不會(huì)部分完成C)一條消息被一個(gè)server接受,將會(huì)被所有的server接受D)集群中無論那臺(tái)服務(wù)器,對(duì)外展示的均是統(tǒng)一視圖答案:B解析:[單選題]14.Flume的應(yīng)用中,如果要保證sink的負(fù)載均衡,需要使用以下哪一個(gè)組件?A)StaticInterceptorB)DefaultSinkProcessorC)ReplicatingChannelSelectorD)FailoverSinkProcessor答案:C解析:[單選題]15.邏輯回歸是輸出結(jié)果落在[0,1]區(qū)間內(nèi),下列哪個(gè)函數(shù)用于轉(zhuǎn)換概率,使其落入[0,1]?A)SigmoidB)ModeC)SquareD)Probit答案:A解析:[單選題]16.下列哪些不屬于詞袋模型的應(yīng)用?A)文檔分類B)提取文章主題C)文本向量化D)統(tǒng)計(jì)詞頻答案:D解析:[單選題]17.txt=open(filename)返回的是()。A)變量B)常數(shù)C)文件內(nèi)容D)文件對(duì)象答案:D解析:[單選題]18.關(guān)于數(shù)獵云中的數(shù)據(jù)落地操作,不正確說法的是()A)落地表名只能是字母、數(shù)字、點(diǎn)、下劃線的組合,且只能字母開頭B)創(chuàng)建落地對(duì)象是由系統(tǒng)創(chuàng)建可用于存儲(chǔ)落地?cái)?shù)據(jù)的表對(duì)象C)創(chuàng)建落地對(duì)象時(shí),若彈出已經(jīng)存在落地表,說明數(shù)據(jù)庫(kù)中已經(jīng)存在與所設(shè)置的落地表名一致的表D)數(shù)獵云中不能設(shè)置批量落地,只能逐個(gè)創(chuàng)建落地對(duì)象答案:D解析:[單選題]19.在Hadoop中,下面哪個(gè)是默認(rèn)的InputFormat類型,它將每行內(nèi)容作為新值,而將字節(jié)偏移量作為key()A)FileInputFormatB)TextInputFormatC)KeyValueTextInputFormatD)CombineTextInputFormat答案:B解析:[單選題]20.在SELECT語句中,使用關(guān)鍵字()可以把重復(fù)行屏蔽A)TOPB)ALLC)UNIOND)DISTINCT答案:D解析:[單選題]21.通常,()主要指的是關(guān)系數(shù)據(jù)庫(kù)中存儲(chǔ)、計(jì)算和管理的數(shù)據(jù)。A)結(jié)構(gòu)化數(shù)據(jù)B)海量數(shù)據(jù)C)半結(jié)構(gòu)化數(shù)據(jù)D)非結(jié)構(gòu)化數(shù)據(jù)答案:A解析:通常,結(jié)構(gòu)化數(shù)據(jù)是指直接可以用傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)、計(jì)算和管理的數(shù)據(jù)。[單選題]22.以下說法對(duì)的是:()A)當(dāng)前云公司提供的公有云存儲(chǔ)只能通過互聯(lián)網(wǎng)訪問B)對(duì)象存儲(chǔ)不可以在客戶機(jī)房建設(shè)C)對(duì)象存儲(chǔ)可以存儲(chǔ)數(shù)據(jù)庫(kù)數(shù)據(jù)D)客戶數(shù)據(jù)傳輸慢與客戶開通的資源池帶寬大小有關(guān)系答案:A解析:[單選題]23.下面語句正確的是?A)b+1=aB)a=a+1C)a=b;D)b++=a答案:B解析:[單選題]24.執(zhí)行np.concatenate([[[123][234]],[[345]]],axis=0)得到的結(jié)果是?A)[[123][234][345]]B)[[123345][234]]C)[[123][234345]]D)[[123][234]]答案:A解析:[單選題]25.如果想獲取一個(gè)序列內(nèi)最大數(shù)字會(huì)使用內(nèi)置函數(shù)A)minB)maxC)lenD)for答案:B解析:[單選題]26.HFile數(shù)據(jù)格式中的Data字段用于()。A)存儲(chǔ)實(shí)際的KeyValue數(shù)據(jù)B)存儲(chǔ)數(shù)據(jù)的起點(diǎn)C)指定字段的長(zhǎng)度D)存儲(chǔ)數(shù)據(jù)塊的起點(diǎn)答案:A解析:記住即可。畢竟Data字段用來存儲(chǔ)數(shù)據(jù)?[單選題]27.下列關(guān)于神經(jīng)網(wǎng)絡(luò)的說法中:①增加神經(jīng)網(wǎng)絡(luò)層數(shù),可能會(huì)增加測(cè)試數(shù)據(jù)集的分類錯(cuò)誤率;②減少神經(jīng)網(wǎng)絡(luò)層數(shù),總是能減小測(cè)試數(shù)據(jù)集的分類錯(cuò)誤率;③增加神經(jīng)網(wǎng)絡(luò)層數(shù),總是能減小訓(xùn)練數(shù)據(jù)集的分類錯(cuò)誤率,正確的是()A)①B)①③C)①②D)②答案:A解析:[單選題]28.通過電腦病毒甚至可以對(duì)核電站、水電站進(jìn)行攻擊導(dǎo)致其無法正常運(yùn)轉(zhuǎn),對(duì)這一說法你認(rèn)為以下哪個(gè)選項(xiàng)是準(zhǔn)確的?()A)絕對(duì)可行,已有在現(xiàn)實(shí)中實(shí)際發(fā)生的案例B)不認(rèn)為能做到,危言聳聽C)病毒只能對(duì)電腦攻擊,無法對(duì)物理環(huán)境造成影響D)理論上可行,但沒有實(shí)際發(fā)生過答案:A解析:[單選題]29.定義類如下classHello():def__init__(self,name)=namedefshowInfo(self)print()下面代碼能正常執(zhí)行的A)h=Helloh.showInfo()B)h=Hello()h.showInfo(?張三?)C)h=Hello(?張三?)h.showInfo()D)h=Hello(?admin?)showInfo答案:C解析:[單選題]30.下面在python3中合法的語句為()。A)a=xrange(8)B)a=xrange(0,8)C)a=xrange(1,8)D)a=range(8)答案:D解析:[單選題]31.Hadoop2.x版本中的數(shù)據(jù)塊大小默認(rèn)是多少?()A)64MB)128MC)256MD)512M答案:B解析:[單選題]32.以下為數(shù)據(jù)表重命名錯(cuò)誤的是()。--A)ALTERTABLEt1RENAMEre_testB)ALTERTABLEt1RENAMEASre_testC)RENAMETABLEt1re_testD)RENAMETABLEt1TOre_test答案:C解析:[單選題]33.HBase與Hadoop均由()編寫A)JavaB)CC)C#D)PHP答案:A解析:[單選題]34.()的主要目標(biāo)是提供可擴(kuò)展的機(jī)器學(xué)習(xí)算法及其實(shí)現(xiàn),旨在幫助開發(fā)人員更加方便快捷地創(chuàng)建智能應(yīng)用程序。A)MahoutB)FlumeC)SqoopD)HBase答案:A解析:[單選題]35.Yam中()角色是管理單個(gè)節(jié)點(diǎn)資源(CPU/Memory)的。A)NodeManagerB)ResourceManagerC)DataNodeD)NameNode答案:A解析:[單選題]36.泛在電力物聯(lián)網(wǎng)建設(shè)堅(jiān)持頂層設(shè)計(jì)和()相結(jié)合,鼓勵(lì)基層單位因地制宜,先行先試。A)基層創(chuàng)新B)集約建設(shè)C)共建共享D)繼承發(fā)展答案:A解析:[單選題]37.SaaS是()的簡(jiǎn)稱A)軟件即服務(wù)B)平臺(tái)即服務(wù)C)基礎(chǔ)設(shè)施即服務(wù)D)硬件即服務(wù)答案:A解析:[單選題]38.英文如何分詞?()A)、利用空格對(duì)句子分詞B)、利用逗號(hào)分詞C)、根據(jù)英文短語分詞D)、根據(jù)詞性分詞答案:A解析:[單選題]39.下列關(guān)于Flinkbarrier描述錯(cuò)誤的是:()。A)barrier周期性的插入到數(shù)據(jù)流中,并作為數(shù)據(jù)流的一部分隨之流動(dòng)B)barrier是Flink快照的核心C)一個(gè)barrier將本周期快照的數(shù)據(jù)與下一周期快照的數(shù)據(jù)分隔開來D)在插入barrier的時(shí)候,會(huì)暫時(shí)阻斷數(shù)據(jù)答案:D解析:[單選題]40.下面哪個(gè)選項(xiàng)屬于大數(shù)據(jù)技術(shù)的?數(shù)據(jù)存儲(chǔ)和管理?技術(shù)層面的功能?A)利用分布式文件系統(tǒng)、數(shù)據(jù)倉(cāng)庫(kù)、關(guān)系數(shù)據(jù)庫(kù)等實(shí)現(xiàn)對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化海量數(shù)據(jù)的存儲(chǔ)和管理B)利用分布式并行編程模型和計(jì)算框架,結(jié)合機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法,實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的處理和分析C)構(gòu)建隱私數(shù)據(jù)保護(hù)體系和數(shù)據(jù)安全體系,有效保護(hù)個(gè)人隱私和數(shù)據(jù)安全D)把實(shí)時(shí)采集的數(shù)據(jù)作為流計(jì)算系統(tǒng)的輸入,進(jìn)行實(shí)時(shí)處理分析答案:A解析:[單選題]41.建立一個(gè)模型,通過這個(gè)模型根據(jù)已知的變量值來預(yù)測(cè)其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)?A)根據(jù)內(nèi)容檢索B)建模描述C)預(yù)測(cè)建模D)尋找模式和規(guī)則答案:C解析:[單選題]42.完全不考慮程序的內(nèi)部結(jié)構(gòu)和內(nèi)部特征,而只是根據(jù)程序功能導(dǎo)出測(cè)試用例的測(cè)試方法是A)錯(cuò)誤推測(cè)法B)白箱測(cè)試法C)黑箱測(cè)試法D)安裝測(cè)試法答案:C解析:[單選題]43.下列關(guān)于誤差的說法,正確的是()。A)訓(xùn)練樣本容量增加,泛化誤差也會(huì)增加B)過擬合指數(shù)據(jù)在訓(xùn)練集上的誤差過大C)過擬合可以通過減少模型參數(shù)數(shù)量解決D)交叉驗(yàn)證不重復(fù)使用數(shù)據(jù)答案:C解析:解決過擬合的兩條主線:一是增大數(shù)據(jù)集;二是降低模型的復(fù)雜度(根據(jù)VC維理論可知),如減少模型參數(shù)數(shù)量。[單選題]44.下列哪個(gè)命令是從HDFS下載目錄/文件到本地的?A)dfs-putB)dfs-catC)dfs-getD)dfs-mkdir答案:C解析:[單選題]45.職工數(shù)據(jù)表中有一個(gè)反映職工受教育程度的特征列,其特征值包括:研究生、大學(xué)、高中、職高、其他。在預(yù)測(cè)職工離職率時(shí)要使用此特征列的數(shù)據(jù),并且需將其值先轉(zhuǎn)換為1(研究生)、2(大學(xué))、3(高中)、4(職高)、5(其他),則此轉(zhuǎn)換的實(shí)現(xiàn)步驟應(yīng)該是()(1)右鍵連接上個(gè)節(jié)點(diǎn)到當(dāng)前轉(zhuǎn)換節(jié)點(diǎn)(2)添加轉(zhuǎn)換節(jié)點(diǎn)(3)在當(dāng)前轉(zhuǎn)換節(jié)點(diǎn)的數(shù)據(jù)轉(zhuǎn)換面板中,添加一個(gè)Choice、5個(gè)Constant(4)右鍵連接5個(gè)Constant到Choice(5)分別設(shè)置5個(gè)Constant的值為int型的1、2、3、4、5,保存設(shè)置結(jié)果(6)在左側(cè)的轉(zhuǎn)換結(jié)果中新增一個(gè)列,重命名該列,設(shè)置好數(shù)據(jù)類型,并將設(shè)置好的Choice連接到該列(7)在Choice中按題設(shè)要求進(jìn)行轉(zhuǎn)換設(shè)置A)(4)(5)(1)(2)(3)(6)(7)B)(1)(2)(7)(4)(5)(3)(6)C)(2)(1)(3)(5)(4)(7)(6)D)(2)(1)(3)(4)(5)(7)(6)答案:C解析:[單選題]46.preprocessing.normalize()函數(shù)中的norm參數(shù)代表(__)。A)需要正則化的對(duì)象B)正則化的方式C)對(duì)象的大小D)返回值的維度答案:B解析:[單選題]47.業(yè)務(wù)部門梳理本專業(yè)(),制定數(shù)據(jù)轉(zhuǎn)換需求,提高數(shù)據(jù)可讀性,豐富完善一手?jǐn)?shù)據(jù)資源。A)原始數(shù)據(jù)B)結(jié)構(gòu)化數(shù)據(jù)C)非結(jié)構(gòu)化數(shù)據(jù)D)所有數(shù)據(jù)答案:C解析:[單選題]48.下列關(guān)于餅圖缺點(diǎn)的說法中,錯(cuò)誤的是()A)當(dāng)餅圖中組成部分比例接近時(shí),人眼很難準(zhǔn)確判別B)數(shù)據(jù)項(xiàng)中不能有負(fù)值C)餅圖不太適用于分類特別多的數(shù)據(jù)集,因?yàn)闀?huì)使每個(gè)組成部分占比極小,不具有直觀效果D)餅圖展示的效果雖然直觀,但不夠簡(jiǎn)單答案:D解析:餅圖負(fù)值不顯示[單選題]49.HDFS中當(dāng)前block大小為64M,如果當(dāng)前要上傳到HDFS中的文件大小為150M,那么在存儲(chǔ)時(shí)會(huì)分配()個(gè)block進(jìn)行存儲(chǔ)。A)1B)2C)3D)4答案:D解析:[單選題]50.下列不屬于HBase基本元素的一項(xiàng)是()。A)表B)記錄C)行鍵D)單元格答案:B解析:[單選題]51.Hive是基于Hadoop的數(shù)據(jù)倉(cāng)庫(kù)軟件,最大可以查詢和管理()級(jí)別的分布式數(shù)據(jù)。A)TBB)GBC)PBD)MB答案:C解析:[單選題]52.OGG是一種基于日志的結(jié)構(gòu)化數(shù)據(jù)()軟件。A)存儲(chǔ)B)查詢C)復(fù)制D)更新答案:C解析:[單選題]53.下列論據(jù)中,能夠支撐?大數(shù)據(jù)無所不能?的觀點(diǎn)的是()。A)互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為B)大數(shù)據(jù)存在泡沫C)大數(shù)據(jù)具有非常高的成本D)個(gè)人隱私泄露與信息安全擔(dān)憂答案:A解析:[單選題]54.下列說法正確的是()A)數(shù)據(jù)轉(zhuǎn)化器均不能生成新的列B)數(shù)據(jù)轉(zhuǎn)化器均能生成新的列C)部分?jǐn)?shù)據(jù)轉(zhuǎn)化器能生成新的列D)以上說法均不對(duì)答案:B解析:第2部分:多項(xiàng)選擇題,共23題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.SparkonYARN有兩種模式,分別是()A)yarn-client模式B)yarn-local模式C)yarn-cluster模式D)yarn-application模式答案:AC解析:[多選題]56.下列不屬于無監(jiān)督學(xué)習(xí)的是:()A)kmeansB)svmC)最大熵D)crf答案:BCD解析:[多選題]57.關(guān)于游標(biāo),下列說法正確的是()A)聲明后必須打開游標(biāo)以供使用B)結(jié)束游標(biāo)使用時(shí),必須閉游標(biāo)C)使用游標(biāo)前必須聲明它D)游標(biāo)只能用于存儲(chǔ)過程和函數(shù)答案:ABCD解析:[多選題]58.NoSQL數(shù)據(jù)庫(kù)常用的數(shù)據(jù)模型包括()。A)Key-ValueB)Key-DocumentC)Key-ColumnD)圖存儲(chǔ)答案:ABCD解析:NoSQL數(shù)據(jù)庫(kù)常用的數(shù)據(jù)模型包括Key-Value、Key-Document、Key-Column、圖存儲(chǔ)。[多選題]59.Hadoop的MapReduce的缺點(diǎn)包括:()A)表達(dá)能力有限B)磁盤IO開銷大C)延遲高D)中間結(jié)果多答案:ABC解析:[多選題]60.下面哪些是spark比Mapreduce計(jì)算快的原因()A)基于內(nèi)存的計(jì)算B)基于DAG的調(diào)度框架C)基于Lineage的容錯(cuò)機(jī)制D)基于分布式計(jì)算的框架答案:ABC解析:[多選題]61.np數(shù)組算術(shù)運(yùn)算包含(__)。A)+B)-C)*D)/答案:ABCD解析:[多選題]62.下列有關(guān)RDBMS的描述正確的是()。A)數(shù)據(jù)以表的形式出現(xiàn)B)每行為各種記錄名稱C)每列為記錄名稱所對(duì)應(yīng)的的數(shù)據(jù)域D)許多的行和列組成一張表單答案:ABCD解析:[多選題]63.對(duì)MRS的HBase性能描述正確的是()。A)最大支持512節(jié)點(diǎn),10P級(jí)數(shù)據(jù)B)支持存儲(chǔ)海量小文件C)rowkey實(shí)時(shí)查詢延遲可達(dá)16msD)BulkLoad增強(qiáng)答案:ACD解析:[多選題]64.下列為傳統(tǒng)RDBMS缺點(diǎn)的有()。A)表結(jié)構(gòu)schema擴(kuò)展不方便B)全文搜索功能較弱C)大數(shù)據(jù)場(chǎng)景下I/O較高D)存儲(chǔ)和處理復(fù)雜關(guān)系型數(shù)據(jù)功能較弱答案:ABCD解析:傳統(tǒng)RDBMS的缺點(diǎn)包括表結(jié)構(gòu)schema擴(kuò)展不方便、全文搜索功能較弱、大數(shù)據(jù)場(chǎng)景下I/O較高、存儲(chǔ)和處理復(fù)雜關(guān)系型數(shù)據(jù)功能較弱。[多選題]65.回歸模型評(píng)估指標(biāo)包括(___)A)平均絕對(duì)值誤差B)F1-ScoreC)均方誤差D)R平方值答案:ACD解析:[多選題]66.下列選項(xiàng)對(duì)ElasticSearchreplicas的描述正確的是?A)提高檢索效率B)壓縮引大小C)代表索引副本D)提高系統(tǒng)容錯(cuò)性答案:CD解析:[多選題]67.公司涉及國(guó)家網(wǎng)絡(luò)意識(shí)形態(tài)安全相關(guān)事項(xiàng)主要是指,涉及公司各級(jí)單位開設(shè)的(),以及的成員、規(guī)模和內(nèi)容等。A)網(wǎng)站和業(yè)務(wù)系統(tǒng)(含移動(dòng)應(yīng)用)B)微博客C)微信公眾號(hào)D)互聯(lián)網(wǎng)通信群組(包括微信群、QQ群等即時(shí)通信工具群組和論壇、社區(qū)等非即時(shí)通信類群紐)答案:ABCD解析:[多選題]68.您需要顯示從2009年1月1日到2009年12月31日雇傭的所有職員的姓名和雇傭日期。職員信息表tblEmployees包含列Name和列HireDate,下面哪些語句能完成該功能()A)SELECTName,HireDateFROMtblEmployeesB)SELECTName,HireDateFROMtblEmployeesWHEREHireDate=?2009-01-01?OR?2009-12-31?C)SELECTName,HireDateFROMtblEmployeesWHEREHireDateBETWEEN?2008-12-31?AND?2010-01-01?D)SELECTName,HireDateFROMtblEmployeesWHEREsubstring(HireDate,1,4)=2009;答案:CD解析:[多選題]69.下列關(guān)于情感分析的說法正確的是?A)簡(jiǎn)單而言,是對(duì)帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過程B)情感分析的發(fā)展得益于社交媒體的興起C)按照處理文本的粒度不同,情感分析大致可分為詞語級(jí),句子級(jí)、篇章級(jí)三個(gè)D)情感分析可以應(yīng)用于文本挖掘答案:ABCD解析:[多選題]70.以下有關(guān)特征數(shù)據(jù)歸一化的說法,正確的是()。A)特征數(shù)據(jù)歸一化加速梯度下降優(yōu)化的速度B)特征數(shù)據(jù)歸一化有可能提高模型的精度C)線性歸一化適用于特征數(shù)值分化比較大的情況D)概率模型不需要做歸一化處理答案:ABD解析:歸一化方法比較適用在數(shù)值比較集中的情況。這種方法的缺陷是如果max和min不穩(wěn)定,很容易使得歸一化結(jié)果不穩(wěn)定,使得后續(xù)使用效果也不穩(wěn)定。實(shí)際使用中可以用經(jīng)驗(yàn)常量值來替代max和min。非線性歸一化經(jīng)常用在數(shù)據(jù)分化比較大的場(chǎng)景,有些數(shù)值很大,有些很小。[多選題]71.下列屬于工作流節(jié)點(diǎn)的有()A)線性回歸B)抽樣C)轉(zhuǎn)換D)標(biāo)準(zhǔn)化答案:ABCD解析:[多選題]72.Hive執(zhí)行查詢的時(shí)候會(huì)調(diào)用哪些模塊?A)executorB)metaStoreC)complierD)optimizer答案:AB解析:[多選題]73.根據(jù)《泛在電力物聯(lián)網(wǎng)2019年建設(shè)方案》,按照分類別、分等級(jí)、分區(qū)域的原則,綜合示范任務(wù)四大類包括省級(jí)綜合示范及()等。A)園區(qū)級(jí)綜合示范B)地市級(jí)綜合示范C)國(guó)家級(jí)綜合示范D)縣級(jí)綜合示范答案:ABD解析:[多選題]74.下列哪些情況下SQL自診斷可以識(shí)別,并上報(bào)告警信息?A)大表BroadcastB)SQL語句不下推。C)數(shù)據(jù)傾斜。D)HashJoin中大表做內(nèi)表答案:ABCD解析:[多選題]75.下面哪些選項(xiàng)正確描述了HBase的特性?A)高可靠性B)高性能C)面向列D)可伸縮答案:ABCD解析:Hbase是一個(gè)高可靠性、高性能、列存儲(chǔ)、可伸縮、實(shí)時(shí)讀寫的分布式數(shù)據(jù)庫(kù)系統(tǒng)[多選題]76.目前,機(jī)器學(xué)習(xí)領(lǐng)域所面臨的主要挑戰(zhàn)包括().A)過擬合B)維度災(zāi)難C)特征工程D)算法的可擴(kuò)展性答案:ABCD解析:[多選題]77.下面說法正確的選項(xiàng)有()。A)正確的縮進(jìn)對(duì)Python程序是非常重要的B)在表達(dá)式中圓括號(hào)可以改變運(yùn)算順序C)在Python3x中可以使用中文做變量名D)Python程序中的空格和空行可有可無,但是適當(dāng)?shù)脑黾涌崭窈涂招锌梢蕴岣叽a的可讀性答案:ABC解析:第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.TEXT和BLOB類型數(shù)據(jù)都根據(jù)二進(jìn)制編碼進(jìn)行比較和排序。--A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]79.只有Python擴(kuò)展庫(kù)才需要導(dǎo)入以后才能使用其中的對(duì)象,Python標(biāo)準(zhǔn)庫(kù)不需要導(dǎo)入即可使用其中的所有對(duì)象和方法。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]80.線性回歸不是用來預(yù)測(cè)數(shù)據(jù)的方法。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]81.縮進(jìn)對(duì)于Python代碼至關(guān)重要。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]82.在循環(huán)中break語句的作用是結(jié)束該語句所在的循環(huán)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.print("tianjin">"beijing")的運(yùn)行結(jié)果為True。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.表達(dá)式{}==None的值為True。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]85.()xbetweenyandz等同于x>y&&x<z。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]86.谷歌流感趨勢(shì)預(yù)測(cè)依賴于對(duì)隨機(jī)抽樣的分析A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]87.包含yield語句的函數(shù)一般成為生成器函數(shù),可以用來創(chuàng)建生成器對(duì)象。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]88.沿負(fù)梯度下降的方向一定是最優(yōu)的方向。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]89.表達(dá)式'aaasdf'A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]90.在Hadoop1、x版本中,MapReduce程序是運(yùn)行在Yarn集群之上。()A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]91.數(shù)學(xué)建模:是數(shù)學(xué)的一個(gè)分支,理論上是根據(jù)實(shí)際問題來建立數(shù)學(xué)模型,對(duì)數(shù)學(xué)模型來進(jìn)行求解,然后根據(jù)結(jié)果去解決實(shí)際問題。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]92.Redis每個(gè)數(shù)據(jù)庫(kù)對(duì)外都是以一個(gè)從0開始的遞增數(shù)字命名,支持自定義。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]93.在派生類中可以通過?基類名A)正確B)錯(cuò)誤答案:對(duì)解析:第4部分:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論