版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試卷科目:大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷10)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共145題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,企業(yè)名稱與企業(yè)統(tǒng)一社會(huì)信用代碼校驗(yàn)?zāi)K,若客戶類型屬于(),系統(tǒng)會(huì)自動(dòng)校驗(yàn)客戶名稱與統(tǒng)一社會(huì)信用代碼是否匹配。A)工商注冊(cè)企業(yè)(企業(yè)客戶類型為:法人企業(yè))B)非工商注冊(cè)企業(yè)(企業(yè)客戶類型為:非法人企業(yè)、事業(yè)單位、社會(huì)團(tuán)體、黨政機(jī)關(guān)、其他)C)以上都不對(duì)[單選題]2.(__)實(shí)現(xiàn)了采用留一法進(jìn)行交叉驗(yàn)證。A)kf=KFold(n_splits=2)B)kf=RepeatedKFold(n_splits=2,n_repeats=2,random_state=0)C)lpo=LeavePOut(p=2)D)loo=LeaveOneOut()[單選題]3.HDFS尋求幫助的命令格式是什么?A)$hadoopfs-h命令名B)$hadoopfs-help命令名C)$hadoopfsh命令名D)$hadoopfshelp命令名[單選題]4.下列不屬于MaxCompute項(xiàng)目空間的對(duì)象類型為:()。A)表B)Jar包C)實(shí)例D)資源[單選題]5.大數(shù)據(jù)計(jì)算服務(wù)項(xiàng)目空間prj1中存在表t1,其中包含一列名字為id,owner打開(kāi)LabelSecurity設(shè)置后,執(zhí)行如下命令:SETLABEL1TOTABLEt1;SETLABEL2TOTABLEt1(id);SETLABEL3TOTABLEt1;此時(shí),t1表中的id列的敏感等級(jí)標(biāo)簽()。A)1級(jí)B)3級(jí)C)2級(jí)D)0級(jí)[單選題]6.jieba分詞包含的分詞模式是()。A)精確模式B)全模式C)搜索引擎模式D)以上都對(duì)[單選題]7.下列關(guān)于hadoop的描述哪個(gè)是正確的:A)Hadoop的圖標(biāo)是一個(gè)黃色小鴨子;B)Hadoop是由韓國(guó)人研發(fā)的;C)CDH是hadoop的其中一個(gè)發(fā)行版本;D)所有的Hadoop發(fā)行版本都是免費(fèi)的。[單選題]8.與SaaS不同的,這種?云?計(jì)算形式把開(kāi)發(fā)環(huán)境或者運(yùn)行平臺(tái)也作為一種服務(wù)給用戶提供。A)基于平臺(tái)服務(wù)B)軟件即服務(wù)C)基于WEB服務(wù)D)基于管理服務(wù)[單選題]9.以下哪個(gè)不是HDFS的進(jìn)程()A)SecondaryNodeB)NameNodeC)ResourceManagerD)DataNode[單選題]10.HBase的哪個(gè)進(jìn)程負(fù)責(zé)處理用戶的讀寫(xiě)請(qǐng)求?A)HMasterB)RegionServerC)ThriftServerD)Region[單選題]11.()不是RDD的緩存方法。A)persistB)cacheC)memoryD)以上答案都正確[單選題]12.Redis不適用于以下哪個(gè)應(yīng)用場(chǎng)景?A)獲取PB級(jí)Value數(shù)據(jù)B)獲取TOPN操作C)獲取手機(jī)驗(yàn)證碼D)獲取最新N個(gè)數(shù)據(jù)的操作[單選題]13.對(duì)于信息增益,決策樹(shù)分裂節(jié)點(diǎn),下面說(shuō)法正確的是()1純度高的節(jié)點(diǎn)需要更多的信息去區(qū)分2信息增益可以用?1比特-熵?獲得3如果選擇一個(gè)屬性具有許多歸類值,那么這個(gè)信息增益是有偏差的A)1B)2C)2和3D)所有以上[單選題]14.以下不是NoSQL常用數(shù)據(jù)模型的是()A)Key-ValueB)Key-ColumC)圖存儲(chǔ)D)關(guān)系數(shù)據(jù)模型[單選題]15.以下關(guān)于Zookeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請(qǐng)求后的讀寫(xiě)流程說(shuō)法正確的是?A)僅寫(xiě)入內(nèi)存B)同時(shí)寫(xiě)入磁盤(pán)和內(nèi)存C)先寫(xiě)入內(nèi)存再寫(xiě)入磁盤(pán)D)先寫(xiě)磁盤(pán)再寫(xiě)內(nèi)存[單選題]16.下列關(guān)于MapReduce說(shuō)法不正確的是______。A)MapReduce是一種計(jì)算框架B)MapReduce來(lái)源于google的學(xué)術(shù)論文C)MapReduce程序只能用java語(yǔ)言編寫(xiě)D)MapReduce隱藏了并行計(jì)算的細(xì)節(jié),方便使用[單選題]17.Hadoop的哪個(gè)包的功能是表示層,將各種數(shù)據(jù)編碼/解碼,方便在網(wǎng)絡(luò)上傳輸()A)fsB)ipcC)ioD)net[單選題]18.matplotlib中調(diào)用直方圖的函數(shù)是A)plot()B)scatter()C)bar()D)hist()[單選題]19.下面代碼運(yùn)行后,a、b、c、d四個(gè)變量的值,描述錯(cuò)誤的是()。importcopya=[1,2,3,4,['a','b']]b=ac=copy.copy(a)d=copy.deepcopy(a)a.append(5)a[4].append('c')A)a==[1,2,3,4,['a','b','c'],5]B)b==[1,2,3,4,['a','b','c'],5]C)c==[1,2,3,4,['a','b','c']]D)d==[1,2,3,4,['a','b',?c?]][單選題]20.正則表達(dá)式的轉(zhuǎn)義符是()A)\\B)\C);D)$$[單選題]21.為了提高Kafka的容錯(cuò)性,Kafka支持Partition的復(fù)制策略,以下關(guān)于LeaderPartition和FollowerPartition的描述錯(cuò)誤的是A)Kafka針對(duì)Partition的復(fù)制需要選出一個(gè)Leader。由該Leader負(fù)責(zé)Partition的讀寫(xiě)操作。其他的副本節(jié)點(diǎn)只是負(fù)責(zé)數(shù)據(jù)同步B)由于LeaderServer承載了全部的請(qǐng)求壓力。因此從集群的整體考慮,Kafka會(huì)將Leader均衡的分散在每個(gè)實(shí)例上,來(lái)確保數(shù)據(jù)均衡C)一個(gè)Kafka集群各個(gè)節(jié)點(diǎn)間不可能互為L(zhǎng)eader和FlowerD)如果Leader失效。那么將會(huì)有其他follower來(lái)接管答案:成為新的Leader[單選題]22.()的主要目的是提升數(shù)據(jù)質(zhì)量,將數(shù)據(jù)形態(tài)更加符合某一算法需求,進(jìn)而提升數(shù)據(jù)計(jì)算的效果和降低其復(fù)雜度。A)數(shù)據(jù)加工B)數(shù)據(jù)分析C)數(shù)據(jù)挖掘D)數(shù)據(jù)處理[單選題]23.DBSCAN算法的MinPts參數(shù)的意義是()A)數(shù)據(jù)點(diǎn)的鄰域半徑B)密度閩值C)高密度點(diǎn)距離闡值D)低密度點(diǎn)距離闡值[單選題]24.?for?是一種常用的循環(huán)語(yǔ)句。下列語(yǔ)句運(yùn)行后,變量sum的值為()sum=0foriinrange(10):sum=sum+iA)55B)10C)11D)45[單選題]25.numpy中實(shí)現(xiàn)豎直軸分割數(shù)組的函數(shù)是什么?A)np.vsplitB)np.hsplitC)np.dsplitD)np.split[單選題]26.大數(shù)據(jù)對(duì)推動(dòng)經(jīng)濟(jì)的重要意義不包括()。A)大數(shù)據(jù)成為推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型發(fā)展的新動(dòng)力B)大數(shù)據(jù)成為重塑國(guó)家競(jìng)爭(zhēng)優(yōu)勢(shì)的新機(jī)遇C)大數(shù)據(jù)成為企業(yè)轉(zhuǎn)型升級(jí)的新常態(tài)D)大數(shù)據(jù)成為提升政府治理能力的新途徑[單選題]27.數(shù)據(jù)的可用性取決于()。A)數(shù)據(jù)分析B)數(shù)據(jù)集采C)數(shù)據(jù)質(zhì)量D)數(shù)據(jù)需求[單選題]28.arr=np.arange(9).reshape(3,3),使數(shù)組arr交換列1和列2的操作是()。A)arr[:,[1,0,2]]B)arr[:,[1,0,3]]C)arr[:,[1,0,1]]D)arr[:,[1,0]][單選題]29.阿里巴巴旗下的數(shù)據(jù)管理平臺(tái),被稱為:A)達(dá)摩盤(pán)B)支付寶C)螞蟻花唄D)招財(cái)寶[單選題]30.Hadoop中,如果將yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percent設(shè)置為50,下面說(shuō)法錯(cuò)誤的是?A)一個(gè)用戶提交任務(wù),可以使用QueueA的100%的資源B)QueueA中的每個(gè)用戶最多只能獲得50%的資源C)如果QueueA中已經(jīng)有2個(gè)用戶的任務(wù)運(yùn)行,這時(shí)第3個(gè)用戶提交的任務(wù)需要等待釋放資源D)QueueA中必須保障每個(gè)用戶至少得到50%的資源[單選題]31.下列不屬于python特點(diǎn)的是()。A)面向?qū)ο驜)運(yùn)行效率高C)可移植性D)免費(fèi)和開(kāi)源[單選題]32.要從文件對(duì)象infile中讀取文件的余下行,我們使用()。A)infile.read(2)B)infile.read()C)infile.readline()D)infile.readlines()[單選題]33.()不是HDFS的設(shè)計(jì)目標(biāo)。A)流式數(shù)據(jù)訪問(wèn)B)大規(guī)模數(shù)據(jù)集C)移動(dòng)計(jì)算D)"多次寫(xiě)入,多次讀取"的文件訪問(wèn)模型[單選題]34.以下說(shuō)法中正確的是有A)SVM對(duì)噪聲(如來(lái)自其他分布的噪聲樣本)魯棒B)在AdaBoost算法中,所有被分錯(cuò)的樣本的權(quán)重不再更新C)Boosting和Bagging都是組合多個(gè)分類器投票的方法,二者都是根據(jù)單個(gè)分類器的正確率決定其權(quán)重D)給定n個(gè)數(shù)據(jù)點(diǎn),如果其中一半用于訓(xùn)練,一般用于測(cè)試,則訓(xùn)練誤差和測(cè)試誤差之間的差別會(huì)隨著n的增加而減少[單選題]35.數(shù)據(jù)全大鏈路處理工作流程一般包括六個(gè)步驟。下列排序正確的是()A)數(shù)據(jù)源、數(shù)據(jù)湖、數(shù)據(jù)匯集、數(shù)據(jù)加工、分析挖掘、數(shù)據(jù)可視化B)數(shù)據(jù)源、數(shù)據(jù)匯集、數(shù)據(jù)湖、數(shù)據(jù)加工、分析挖掘、數(shù)據(jù)可視化C)數(shù)據(jù)源、數(shù)據(jù)湖、數(shù)據(jù)匯集、分析挖掘、數(shù)據(jù)加工、數(shù)據(jù)可視化D)數(shù)據(jù)源、數(shù)據(jù)匯集、數(shù)據(jù)湖、分析挖掘、數(shù)據(jù)加工、數(shù)據(jù)可視化[單選題]36.RDBMS是建立在()基礎(chǔ)上的數(shù)據(jù)庫(kù),用來(lái)存儲(chǔ)和管理大量數(shù)據(jù)。A)關(guān)系模型B)層次模型C)網(wǎng)狀模型D)概念模型[單選題]37.彩色圖片(3通道圖片)經(jīng)過(guò)一層卷積層后,通道數(shù)一般會(huì)產(chǎn)生怎么的變化(等于什么值)?()A)batchsizeB)需要根據(jù)卷積的設(shè)置進(jìn)行判斷C)1D)依然會(huì)是3[單選題]38.一個(gè)MaxcomputeSQL中最多使用()窗口函數(shù)。A)不限制B)1個(gè)C)5個(gè)D)10個(gè)[單選題]39.()是指過(guò)濾器在圖像上滑動(dòng)的距離。A)卷積核大小B)卷積步長(zhǎng)C)過(guò)濾器大小D)圖像大小[單選題]40.下列關(guān)于GaussDB200的Explain命令描述正確的是?()A)Explain命令主要顯示SQL的執(zhí)行計(jì)劃,對(duì)SQL調(diào)優(yōu)用處不大。B)Explain主要關(guān)注語(yǔ)句的預(yù)計(jì)執(zhí)行開(kāi)銷。C)通過(guò)設(shè)置GUC參數(shù)explain_perfmode,可以顯示不同格式的執(zhí)行計(jì)劃。D)Explain可以完成對(duì)SQL的優(yōu)化,其余優(yōu)化不關(guān)鍵。[單選題]41.下面有關(guān)NameNode和secondaryNameNode通信協(xié)議說(shuō)法錯(cuò)誤的是()A)secondaryNameNode使用NamenodeProtocol協(xié)議與NameNode進(jìn)行通信B)如果文件系統(tǒng)處于安全模式,那么關(guān)閉當(dāng)前日志并打開(kāi)新的日志操作會(huì)失敗C)如果舊的編輯日志丟失了,那么滾動(dòng)fsImage日志會(huì)失敗D)secondaryNameNode可以從NameNode中得到任何datanode的塊及其位置[單選題]42.以下()組件負(fù)責(zé)控制系統(tǒng)資源的分配,防止過(guò)量業(yè)務(wù)負(fù)載對(duì)系統(tǒng)的沖擊而導(dǎo)致業(yè)務(wù)擁塞。A)GTMB)WLMC)CND)DN[單選題]43.1104報(bào)表系統(tǒng)是向那個(gè)部門(mén)報(bào)送的行業(yè)監(jiān)管平臺(tái)A)中國(guó)人民銀行B)國(guó)家外匯管理局C)省聯(lián)社D)銀監(jiān)會(huì)[單選題]44.規(guī)模巨大且復(fù)雜,用現(xiàn)有的數(shù)據(jù)處理工具難以獲取、整理、管理以及處理的數(shù)據(jù),這指的是()。A)大數(shù)據(jù)B)貧數(shù)據(jù)C)富數(shù)據(jù)D)繁數(shù)據(jù)[單選題]45.()提供的支撐技術(shù),有效的解決了大數(shù)據(jù)分析、研發(fā)的問(wèn)題,比如:虛擬化技術(shù)、并行計(jì)算、海量存儲(chǔ)及管理等。A)點(diǎn)計(jì)算B)云計(jì)算C)面計(jì)算D)線計(jì)算[單選題]46.下列關(guān)于數(shù)據(jù)標(biāo)準(zhǔn)化的說(shuō)法中,不正確的是()A)Z-Score標(biāo)準(zhǔn)化適用于特征最大值和最小值未知,數(shù)據(jù)較分散的情況B)聚類算法要求數(shù)據(jù)集無(wú)量綱化C)Logistic標(biāo)準(zhǔn)化函數(shù)σ(x)滿足σ(0)=1D)Min-Max標(biāo)準(zhǔn)化易受離群值影響[單選題]47.Namenode在啟動(dòng)時(shí)自動(dòng)進(jìn)入安全模式,在安全模式階段,說(shuō)法錯(cuò)誤的是A)安全模式目的是在系統(tǒng)啟動(dòng)時(shí)檢查各個(gè)DataNode上數(shù)據(jù)塊的有效性B)根據(jù)策略對(duì)數(shù)據(jù)塊進(jìn)行必要的復(fù)制或刪除C)當(dāng)數(shù)據(jù)塊最小百分比數(shù)滿足的最小副本數(shù)條件時(shí),會(huì)自動(dòng)退出安全模式D)文件系統(tǒng)允許有修改[單選題]48.以下不是數(shù)據(jù)庫(kù)事務(wù)特性的是()A)原子性B)一致性C)隔離性D)通用性[單選題]49.關(guān)于Flume的三大組件以下說(shuō)法正確的是()。A)channel可以和任意數(shù)量的source和sink鏈接。B)channel只能鏈接單一的source和sink。C)sink在三大組件之間起著橋梁的作用。D)sink從channel消費(fèi)數(shù)據(jù)并將其傳遞給目標(biāo)地,目標(biāo)地只能是hdfs。[單選題]50.圖像與灰度直方圖的對(duì)應(yīng)關(guān)系為A)一一對(duì)應(yīng)B)一對(duì)多C)多對(duì)一D)以上情況都存在[單選題]51.下列方法中不屬于情感分析評(píng)測(cè)的是()。A)COAE評(píng)測(cè)B)Cifar10數(shù)據(jù)集評(píng)測(cè)C)CCFTCCI評(píng)測(cè)D)TAC評(píng)測(cè)[單選題]52.下列語(yǔ)句會(huì)無(wú)限循環(huán)下去的是()。A)forainrange(10):timesleep(10)B)whilei<10:Timesleep(10)C)whileTrue:BreakD)a=[3,-1,',']Foriina[:]:ifnota:Break[單選題]53.程序代碼片段:a=int(input("請(qǐng)輸入數(shù)值"))b=int(input("請(qǐng)輸入數(shù)值"))c=int(input("請(qǐng)輸入數(shù)值"))If(a>b):a=belse(a>c):a=cprint(a)在這個(gè)程序運(yùn)行過(guò)程中,若從鍵盤(pán)上輸入a、b、c的值分別是4、5、6,則最后一個(gè)語(yǔ)句在文本窗口中輸出顯示的是()A)4B)5C)6D)7[單選題]54.哪個(gè)是實(shí)時(shí)檢索解決方案的數(shù)據(jù)源?A)流數(shù)據(jù)B)以上都是C)文件數(shù)據(jù)D)圖數(shù)據(jù)[單選題]55.SolrCloud模式是集群模式,在此模式下Solr服務(wù)依賴于以下哪個(gè)服務(wù)A)HBaseB)HDFSC)ZookeeperD)Yarn[單選題]56.ODS數(shù)據(jù)包含多少類表信息:()A)10B)12C)14D)16[單選題]57.Redis中相對(duì)于AOF持久化,對(duì)RDB持久化描述正確的是()。A)會(huì)丟失最后一次持久化以后的數(shù)據(jù)B)內(nèi)存占用過(guò)多,持久化文件尺寸較大C)占用較多的磁盤(pán)I0開(kāi)支D)恢復(fù)數(shù)度相對(duì)較慢,寫(xiě)入數(shù)據(jù)相對(duì)較快[單選題]58.在Hadoop項(xiàng)目結(jié)構(gòu)中,HDFS指的是什么?A)分布式文件系統(tǒng)B)分布式并行編程模型C)資源管理和調(diào)度器D)Hadoop上的數(shù)據(jù)倉(cāng)庫(kù)[單選題]59.當(dāng)try子句中沒(méi)有任何錯(cuò)誤時(shí),一定不會(huì)執(zhí)行()語(yǔ)句。A)tryB)slseC)exceptD)?nally[單選題]60.某大數(shù)據(jù)業(yè)務(wù)人員對(duì)某些數(shù)據(jù)創(chuàng)建Hive表結(jié)構(gòu),其中某個(gè)數(shù)據(jù)為時(shí)間類型yyyyMMdd,那么可以使用以下哪一項(xiàng)作為字段類型?A)varcahrB)stringC)doubleD)int[單選題]61.數(shù)據(jù)庫(kù)設(shè)計(jì)中,反映用戶對(duì)數(shù)據(jù)要求的模式是A)內(nèi)模式B)外模式C)設(shè)計(jì)模式D)概念模式[單選題]62.AI的英文縮寫(xiě)是()A)AutomaticIntelligenceB)ArtificalIntelligenceC)AutomaticeInformationD)ArtificalInformation[單選題]63.關(guān)于Sqoop的說(shuō)法,不正確的是()。A)主要設(shè)計(jì)目的是在Hadoop與傳統(tǒng)數(shù)據(jù)庫(kù)之間進(jìn)行數(shù)據(jù)的ETL操作B)數(shù)據(jù)導(dǎo)入導(dǎo)出通過(guò)MapReduce完成C)Sqoop具備MapReduce的并行化和容錯(cuò)性D)Sqoop的Reduce操作速度是快[單選題]64.一監(jiān)獄人臉識(shí)別準(zhǔn)入系統(tǒng)用來(lái)識(shí)別待進(jìn)入人員的身份,此系統(tǒng)一共包括識(shí)別4種不同的人員:獄警,小偷,送餐員,其他。下面哪種學(xué)習(xí)方法最適合此種應(yīng)用需求:A)二分類問(wèn)題B)多分類問(wèn)題C)層次聚類問(wèn)題D)回歸問(wèn)題[單選題]65.數(shù)據(jù)產(chǎn)品開(kāi)發(fā)的關(guān)鍵環(huán)節(jié)是(__)。A)數(shù)據(jù)加工B)數(shù)據(jù)柔術(shù)C)數(shù)據(jù)歸約D)數(shù)據(jù)清洗[單選題]66.查找表結(jié)構(gòu)用以下哪一項(xiàng)()A)FINDB)SELETEC)ALTERD)DESC[單選題]67.下面不屬于后臺(tái)自動(dòng)化的有(__)。A)hyperscienceB)datafoxC)aptricityD)appzen[單選題]68.()參數(shù)的增加可能會(huì)造成隨機(jī)森林?jǐn)?shù)據(jù)過(guò)擬合。A)樹(shù)的數(shù)量B)樹(shù)的深度C)樣本數(shù)據(jù)份數(shù)D)葉數(shù)據(jù)尺寸[單選題]69.有以下兩個(gè)程序。程序一:x=[1,2,3]deff(x):x=x+[4]f(x)print(x)程序二:x=[1,2,3]deff(x):x+=[4]f(x)print(x)下列說(shuō)法正確的是()A)兩個(gè)程序均能正確運(yùn)行,但結(jié)果不同B)兩個(gè)程序的運(yùn)行結(jié)果相同C)程序一能正確運(yùn)行,程序二不能D)程序一不能正確運(yùn)行,程序二能[單選題]70.下列哪些不屬于詞袋模型的應(yīng)用?A)文檔分類B)提取文章主題C)文本向量化D)統(tǒng)計(jì)詞頻[單選題]71.貝葉斯決策論是在(__)框架下實(shí)施決策的基本方法。A)模型B)條件C)概率D)分類器[單選題]72.位運(yùn)算符運(yùn)算結(jié)果的數(shù)據(jù)類型是()。--A)INTB)TINYINTC)BIGINTD)CHAR[單選題]73.一曲線的方向鏈碼為12345,則曲線長(zhǎng)度為()。A)5B)4C)5.83D)6.24[單選題]74.Python中對(duì)變量描述錯(cuò)誤的選項(xiàng)是:A)Python不需要顯式聲明變量類型,在第一次變量賦值時(shí)由值決定變量的類型B)變量通過(guò)變量名訪問(wèn)C)變量必須在創(chuàng)建和賦值后使用D)變量PI與變量Pi被看作相同的變量[單選題]75.下列關(guān)于HDFS的描述,哪個(gè)不正確?DA)HDFS還采用了相應(yīng)的數(shù)據(jù)存放、數(shù)據(jù)讀取和數(shù)據(jù)復(fù)制策略,來(lái)提升系統(tǒng)整體讀寫(xiě)響應(yīng)性能B)HDFS采用了主從(Master/Slave)結(jié)構(gòu)模型C)HDFS采用了冗余數(shù)據(jù)存儲(chǔ),增強(qiáng)了數(shù)據(jù)可靠性D)HDFS采用塊的概念,使得系統(tǒng)的設(shè)計(jì)變得更加復(fù)雜[單選題]76.以下C類繼承A類和B類的格式中,正確的是()。A)classCA,B:B)classC(A:B):C)classC(A,B):D)classCAandB:[單選題]77.下列業(yè)務(wù)場(chǎng)景中,不能直接使用Reducer充當(dāng)Combiner的是()。A)sum求和B)max求最大值C)count求計(jì)數(shù)D)avg求平均[單選題]78.防火墻、漏洞掃描、病毒防范和系統(tǒng)加固等服務(wù)屬于()A)安全增值服務(wù)B)代理代維服務(wù)C)優(yōu)化類服務(wù)D)容災(zāi)服務(wù)[單選題]79.ApacheKylin是通過(guò)什么方式來(lái)提高OLAP性能的?A)預(yù)計(jì)算B)列式存儲(chǔ)C)內(nèi)存存儲(chǔ)D)硬件加速[單選題]80.(__)是一門(mén)以可視化交互為基礎(chǔ),綜合運(yùn)用圖形學(xué)、數(shù)據(jù)挖掘和人機(jī)交互等多個(gè)領(lǐng)域的知識(shí),以實(shí)現(xiàn)人機(jī)協(xié)同完成可視化任務(wù)為主要目的的分析推理性學(xué)科。A)信息可視化B)科學(xué)可視化C)可視分析學(xué)D)數(shù)據(jù)可視化[單選題]81.下列選項(xiàng)中,使用名稱為cursor_student的游標(biāo),將查詢出的信息存入s_name和s_gender,寫(xiě)法正確的是()。--A)FETCHcursor_studentTOs_name,s_gender;B)SETcursor_studentINTOs_name,s_gender;C)FETCHcursor_studentINTOs_name,s_gender;D)SETcursor_studentTOs_name,s_gender;[單選題]82.有關(guān)激活函數(shù)錯(cuò)誤的說(shuō)法是?()A)激活函數(shù)會(huì)影響神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程,因此會(huì)影響神經(jīng)網(wǎng)絡(luò)模型的質(zhì)量。B)在修正權(quán)重的過(guò)程中,靠近多層神經(jīng)網(wǎng)絡(luò)輸出層的神經(jīng)元的權(quán)重修改一般比較小,容易出現(xiàn)梯度消失。C)激活函數(shù)是神經(jīng)元的輸入和輸出映射函數(shù)。D)當(dāng)神經(jīng)元的輸入比較大時(shí),Sigmoid函數(shù)的偏導(dǎo)數(shù)比較小,因此容易產(chǎn)生梯度飽和。[單選題]83.視圖是一種常用的數(shù)據(jù)對(duì)象,它是提供()和()數(shù)據(jù)的另一種途徑,可以簡(jiǎn)化數(shù)據(jù)庫(kù)操作A)插入,更新B)查看,檢索C)查看,存放D)檢索,插入[單選題]84.關(guān)于分組表、交叉表、明細(xì)表、柱形圖這四個(gè)圖表類型,以下說(shuō)法中錯(cuò)誤的是()A)分組表由一個(gè)維度、至少一個(gè)指標(biāo)組成,可以清晰地展示出不同維度對(duì)應(yīng)的數(shù)據(jù)B)交叉表由一個(gè)維度、至少兩個(gè)指標(biāo)組成C)明細(xì)表展示的數(shù)據(jù)較為靈活,展示的結(jié)果可以擴(kuò)展多列D)柱形圖是較為傳統(tǒng)、普遍的可視化方案的選擇,其可以衍生出分區(qū)柱形圖、堆積柱形圖、多系列柱形圖、對(duì)比柱形圖等[單選題]85.下列選項(xiàng)中,哪一項(xiàng)是研究大數(shù)據(jù)最重要的意義()A)分析B)統(tǒng)計(jì)C)測(cè)試D)預(yù)測(cè)[單選題]86.python語(yǔ)句s={?a?,1,?b?,2};print(s[?b?])的運(yùn)行結(jié)果是。()A)語(yǔ)法錯(cuò)B)?b?C)1D)2[單選題]87.彈性云主機(jī)的可用性為()A)0.99B)0.995C)0.999D)0.9995[單選題]88.Flink的Checkpoint機(jī)制繪制的流應(yīng)用快照不能被保存在以下哪個(gè)位置?A)LocalB)HDFSC)TaskManager的內(nèi)存D)Joblanager的內(nèi)存[單選題]89.對(duì)比分析,當(dāng)統(tǒng)計(jì)項(xiàng)(度量)差異較大時(shí),如億級(jí)數(shù)據(jù)與百分比數(shù)據(jù),選中那類圖表比較合適?()A)柱狀圖B)條形圖C)折線圖D)雙軸圖[單選題]90.將屬性縮放到一個(gè)指定的最大和最小值之間,這種預(yù)處理方法的好處是(__)。A)對(duì)于方差非常小的屬性可以增強(qiáng)其穩(wěn)定性B)維持稀疏矩陣中為0的條目C)便于理解D)以上都是[單選題]91.以下程序的輸出結(jié)果是:ss=list(set("jzzszyj"))ss.sort()print(ss)A)['z','j','s','y']B)['j','s','y','z']C)['j','z','z','s','z','y','j']D)['j','j','s','y','z','z','z'][單選題]92.關(guān)于HBase的RegionSplit,以下描述中錯(cuò)誤的是哪一項(xiàng)?A)RegionSplit過(guò)程不需要HMasteri進(jìn)行管理B)在建表時(shí)可以預(yù)先創(chuàng)建多個(gè)RegionC)將大表分裂出多個(gè)Region有助于提高數(shù)據(jù)的讀寫(xiě)效率D)RegionSpliti速度很快,因?yàn)椴](méi)有真正拆分?jǐn)?shù)據(jù)[單選題]93.下面關(guān)于機(jī)械思維的核心思想,描述錯(cuò)誤的是:()A)世界變化的規(guī)律是確定的B)lit界變化的規(guī)律是無(wú)法確定的C)規(guī)律不僅是可以被認(rèn)識(shí)的,而且可以用簡(jiǎn)單的公式或者語(yǔ)言描述清楚D)這些規(guī)律應(yīng)該是放之四海而皆準(zhǔn)的.可以應(yīng)用到各種未知領(lǐng)域指導(dǎo)實(shí)踐[單選題]94.如果需要從Maxcompute同步一張表到ADS,則該表的訪問(wèn)權(quán)限需要授予Maxcompute中的()用戶。A)aliyun$gurada_build@B)aliyun$gurada_data@C)aliyun$gurada_ads@D)aliyun$ads_data@[單選題]95.卷積神經(jīng)網(wǎng)絡(luò)(convolutiona1neuralnetwork,CNN)是一種專門(mén)用來(lái)處理具有類似()的數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)A)網(wǎng)格結(jié)構(gòu)B)數(shù)組結(jié)構(gòu)C)序列結(jié)構(gòu)D)表格結(jié)構(gòu)[單選題]96.關(guān)于批量處理數(shù)據(jù)組件的描述不正確的時(shí)?A)SparkSql,新型SQL批處理引擎,用于處理SQL類批處理作業(yè),適合海量數(shù)據(jù),處理速度高效。B)Spark新型批處理引擎,可以用于處理非SQL類,尤其是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)批處理作業(yè),適合海量數(shù)據(jù),樹(shù)立速度高效。C)MapReduce,傳統(tǒng)批處理引擎,用于處理非SQL類,尤其是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)批處理作業(yè),使用廣泛,海量數(shù)據(jù)下表現(xiàn)不穩(wěn)定,但是處理速度較快。D)Hive,傳統(tǒng)SQL批處理引擎,用于處理SQL類批處理作業(yè),使用廣泛海量數(shù)據(jù)下表現(xiàn)穩(wěn)定,但是處理速度較慢。[單選題]97.與以下代碼段foriinrange(1,101):ifint(i*0.5)==i*0.5:print(i)等效的列表描述()。A)[iforiinrange(1,100)ifint(i*0.5)==(i*0.5)]B)[iforiinrange(1,101)ifint(i*0.5)==(i*0.5)]C)[iforiinrange(1,101)ifint(i*0.5)=(i*0.5)]D)[iforiinrange(1,100)ifint(i*0.5)=(i*0.5)][單選題]98.采用多副本冗余存儲(chǔ)的優(yōu)勢(shì)不包含()。A)保證數(shù)據(jù)可靠性B)容易檢查數(shù)據(jù)錯(cuò)誤C)加快數(shù)據(jù)傳輸速度D)節(jié)約存儲(chǔ)空間[單選題]99.在DIKW金字塔中屬于未來(lái)的是()。A)信息B)數(shù)據(jù)C)知識(shí)D)智慧[單選題]100.OGG軟件是一種基于()的結(jié)構(gòu)化數(shù)據(jù)復(fù)制軟件。A)數(shù)據(jù)流B)配置文件C)交互D)日志[單選題]101.下列字符串表示plot線條顏色、點(diǎn)的形狀和類型為紅色五角星點(diǎn)短虛線的是()。A)'bs-'B)'go-.'C)'r+-.'D)'r*-.'[單選題]102.下列選項(xiàng)中,關(guān)于dropna()方法描述正確的是()A)dropna()方法只會(huì)刪除值為NaN的數(shù)據(jù)B)dropna()方法不會(huì)刪除值為None的數(shù)據(jù)C)dropna()方法會(huì)刪除值為None和NaN的數(shù)據(jù)D)dropna()方法只會(huì)檢測(cè)缺失數(shù)據(jù)和空值[單選題]103.下列代碼中繪制散點(diǎn)圖的是()。A)plt.scatter(x,y)B)plt.plot(x,y)C)plt.legend('upperleft)D)plt.xlabel(散點(diǎn)圖")[單選題]104.如果想把Redis的Key中存儲(chǔ)的數(shù)字值減1,該使用下列哪一個(gè)命令?A)decrB)incrC)incrbyD)decrby[單選題]105.HBase依靠()存儲(chǔ)底層數(shù)據(jù)。A)HDFSB)HadoopC)MemoryD)MapReduce[單選題]106.RNN不同于其它神經(jīng)網(wǎng)絡(luò)的地方在于()。A)、實(shí)現(xiàn)了記憶功能B)、速度快C)、精度高D)、易于搭建[單選題]107.專家系統(tǒng)是一個(gè)復(fù)雜的智能軟件,它處理的對(duì)象是用符號(hào)表示的知識(shí),處理的過(guò)程是()的過(guò)程。A)思維B)思考C)推理D)遞推[單選題]108.根據(jù)不同的業(yè)務(wù)需求來(lái)建立數(shù)據(jù)模型,抽取最有意義的向量,決定選取哪種方法的數(shù)據(jù)分析角色人員是()。A)數(shù)據(jù)管理人員B)數(shù)據(jù)分析員C)研究科學(xué)家D)軟件開(kāi)發(fā)工程師[單選題]109.執(zhí)行以下代碼段時(shí)s1={2,3}s2={1,4}s3=set()i=0j=0foriins1:forjins2:s3.add((i,j))i+=1j+=1print(s3)時(shí),輸出為()。A){(3,1),(3,4),(4,4),(2,1)}B){(3,4),(2,1)}C){(3,1),(3,4),(2,1)}D){(2,1),(3,1),(3,5),(4,5)}[單選題]110.某企業(yè)使用ADS分析數(shù)據(jù),其中企業(yè)商品庫(kù)存表(stock_detail)為一張超過(guò)20億條紀(jì)錄的事實(shí)表,描述了企業(yè)目前為止的庫(kù)存情況,事實(shí)列僅包含庫(kù)存數(shù)一列。商品信息表(time_detail)描述了商品的具體信息,包括商品信息標(biāo)識(shí)、商品基本信息標(biāo)識(shí)、商品通用信息屬性等等20個(gè)屬性信息,紀(jì)錄條數(shù)在10萬(wàn)條左右,本表中的商品基本信息標(biāo)識(shí)引用用另一張存在多個(gè)層級(jí)維度的維表商品基本信息表(basic_detail,包含30個(gè)屬性)。以下設(shè)計(jì)方案中,綜合成本和性能兩個(gè)角度來(lái)看,()是不合理的。A)企業(yè)商品庫(kù)存表設(shè)計(jì)為分區(qū)事實(shí)表,分區(qū)數(shù)選擇100個(gè)B)將商品信息表打平到企業(yè)商品庫(kù)存表,形成一張寬表,使用時(shí)可以減少joinC)商品信息表適合做成維度表,數(shù)據(jù)小,不需要建分區(qū)表D)將商品信息表和商品基本信息表關(guān)聯(lián)取得相關(guān)信息后,打平為單張寬維度表解釋:/document_detail/26425.html[單選題]111.()算法是決策樹(shù)學(xué)習(xí)的基本算法,其他多數(shù)決策樹(shù)學(xué)習(xí)方法都是它的變體A)Find-SB)KNNC)概念D)ID3[單選題]112.在Zookeeper中,路徑由()字符串構(gòu)成。A)UnicodeB)UTF-8C)GBKD)ASCII[單選題]113.分布式文件系統(tǒng)HDFS采用了主從結(jié)構(gòu)模型,由計(jì)算機(jī)集群中的多個(gè)節(jié)點(diǎn)構(gòu)成的,這些節(jié)點(diǎn)分為兩類,一類存儲(chǔ)元數(shù)據(jù)叫(),另一類存儲(chǔ)具體數(shù)據(jù)叫().A)名稱節(jié)點(diǎn),主節(jié)點(diǎn)B)從節(jié)點(diǎn),主節(jié)點(diǎn)C)名稱節(jié)點(diǎn),數(shù)據(jù)節(jié)點(diǎn)D)數(shù)據(jù)節(jié)點(diǎn),名稱節(jié)點(diǎn)[單選題]114.Kafka消息默認(rèn)保存時(shí)間為多少天?A)14天B)30天C)1天D)7天[單選題]115.ClusterManager是()A)主節(jié)點(diǎn)B)從節(jié)點(diǎn)C)執(zhí)行器D)上下文[單選題]116.以下哪項(xiàng)不屬于批量數(shù)據(jù)采集工具?A)SqoopB)FlumeC)其他ETL工具D)MapReduce[單選題]117.數(shù)據(jù)倉(cāng)庫(kù)所存儲(chǔ)的數(shù)據(jù),通常具有一定特點(diǎn),下列哪些不屬于其特點(diǎn)的()。A)面向特定主題B)數(shù)據(jù)大都反應(yīng)歷史C)數(shù)據(jù)來(lái)源多樣D)經(jīng)常修改數(shù)據(jù)項(xiàng)的值[單選題]118.使用Pig語(yǔ)句對(duì)表中的數(shù)據(jù)進(jìn)行排序,下列語(yǔ)句正確的是()。A)SELECT*FROMtmp_tableORDERBYage;B)tmp_table_order=ORDERtmp_tableBYageASC;DUMPtmp_table_order;C)DUMPtmp_tableORDERBYageASC;D)ORDERtmp_tableBYageASC;[單選題]119.下列對(duì)MapReduce中的公平調(diào)度器描述正確的是()。A)公平調(diào)度器的目標(biāo)是讓每個(gè)用戶公平獨(dú)享集群能力B)如果只有一個(gè)作業(yè)在運(yùn)行,就會(huì)得到集群的所有資源C)提交作業(yè)數(shù)較多的用戶,會(huì)獲得更多的集群資源D)公平調(diào)度器不支持搶占機(jī)制[單選題]120.在Hadoop生態(tài)系統(tǒng)中,()建立在MapReduce之上,主要用來(lái)彌補(bǔ)MapReduce編程的復(fù)雜性。A)HbaseB)FlumeC)PigD)Sqoop[單選題]121.以下哪項(xiàng)不屬于大數(shù)據(jù)在城市管理中的應(yīng)用:()A)智能交通B)環(huán)保監(jiān)測(cè)C)城市規(guī)劃D)比賽預(yù)測(cè)[單選題]122.定義類如下:classA():defa():print(?a?)classB():defb():print(?b?)classC():defc():print(c)classD(A,C):defd():print(?d?)d=D()d.a()d.b()d.d()以下程序能執(zhí)行的結(jié)果是A)a,b,dB)a,dC)d,aD)執(zhí)行會(huì)報(bào)錯(cuò)[單選題]123.Centos中修改文件或目錄的訪問(wèn)權(quán)限()命令A(yù))chownB)passwdC)chmodD)clear[單選題]124.下列哪些語(yǔ)句對(duì)主鍵的說(shuō)明正確()A)主鍵可重復(fù)B)主鍵不唯一C)在數(shù)據(jù)表中的唯一索引D)主鍵用foreignkey修飾[單選題]125.整形變量x中存放了一個(gè)兩位數(shù),要將這個(gè)兩位數(shù)的個(gè)位數(shù)字和十位數(shù)字變換位子,例如,13變成31,正確的python表達(dá)式為。()A)(x%10)*10+x//10B)(x%10)//10+x//10C)(x/10)%10+x//10D)(x%10)*10+x%10[單選題]126.在大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)中,使用MapReduce開(kāi)發(fā)一個(gè)分詞程序,即輸入為保存在表中的多篇文章(每篇文章一行紀(jì)錄),參考一個(gè)字典文件(該文件會(huì)經(jīng)常更新)進(jìn)行分詞。簡(jiǎn)而言之,在執(zhí)行該程序的時(shí)候,既需要輸入待分詞的文章(已經(jīng)保存在表中了),又需要輸入字典(為經(jīng)常變動(dòng)的本地文件),以下最合理的解決方案為:()。A)將這個(gè)字典與源代碼一起進(jìn)行打包,直接執(zhí)行即可B)每次都將字典文件作為資源上傳到大數(shù)據(jù)計(jì)算服務(wù)上,然后MR中通過(guò)資源的方式來(lái)訪問(wèn)C)將字典打包jar包,使用jar命令執(zhí)行MR程序時(shí),通過(guò)resources參數(shù)指定該jar包D)將字典文件保存在本地,在MR中通過(guò)訪問(wèn)本地最新的字典文件實(shí)現(xiàn)[單選題]127.DWSDN的高可用架構(gòu)是:()。A)主備從架構(gòu)B)一主多備架構(gòu)C)兩者兼有D)其他[單選題]128.表達(dá)式int('101',2)的值為()。A)5B)6C)"10"D)3[單選題]129.(__)在劃分屬性時(shí)是在當(dāng)前結(jié)點(diǎn)的屬性集合中選擇一個(gè)最優(yōu)屬性。A)AdaBoostB)RFC)BaggingD)傳統(tǒng)決策樹(shù)[單選題]130.Hive表的數(shù)據(jù)默認(rèn)存儲(chǔ)與數(shù)據(jù)倉(cāng)庫(kù)目錄()中。A)/user/hive/warehouseB)/opt/hive/warehouseC)/opt/softwares/warehouseD)/modules/hive/warehouse[單選題]131.()是指幾組不同的數(shù)據(jù)中均存在一種趨勢(shì),但當(dāng)這些數(shù)據(jù)組組合在一起后,這種趨勢(shì)將消失或反轉(zhuǎn)。A)辛普森悖論B)大數(shù)據(jù)悖論C)大數(shù)據(jù)偏見(jiàn)D)幸存者偏差[單選題]132.以下關(guān)于break,continue說(shuō)法正確的是()A)continue語(yǔ)句被用來(lái)告訴Python跳過(guò)當(dāng)前循環(huán)塊中的剩余語(yǔ)句,然后繼續(xù)進(jìn)行下一輪循環(huán).在循環(huán)中break的作用是終止當(dāng)前循環(huán)結(jié)構(gòu)的后續(xù)操作,一旦程序運(yùn)行了break,循環(huán)也就終止了!B)break語(yǔ)句被用來(lái)告訴Python跳過(guò)當(dāng)前循環(huán)塊中的剩余語(yǔ)句,然后繼續(xù)進(jìn)行下一輪循環(huán),在循環(huán)中continue的作用是終止當(dāng)前循環(huán)結(jié)構(gòu)的后續(xù)操作,一旦程序運(yùn)行了continue,循環(huán)也就終止了!C)break,continue語(yǔ)句被用來(lái)告訴Python跳過(guò)當(dāng)前循環(huán)塊中的剩余語(yǔ)句,然后繼續(xù)進(jìn)行下一輪循環(huán).D)在循環(huán)中break,continue的作用是終止當(dāng)前循環(huán)結(jié)構(gòu)的后續(xù)操作,一旦程序運(yùn)行了break循環(huán)也就終止了![單選題]133.Zookeeper啟動(dòng)時(shí)會(huì)最多監(jiān)聽(tīng)?zhēng)讉€(gè)端口()A)1B)2C)3D)4[單選題]134.設(shè)a={1,1,1,1,1,2,3,4,5,5,5,5},則print(len(a))的顯示結(jié)果為()。A)5B)12C)3D)Error[單選題]135.下列關(guān)于推薦系統(tǒng)的描述,哪一項(xiàng)是錯(cuò)誤的?()A)推薦系統(tǒng)是大數(shù)據(jù)在互聯(lián)網(wǎng)領(lǐng)域的典型應(yīng)用B)推薦系統(tǒng)是自動(dòng)聯(lián)系用戶和物品的一種工具C)推薦系統(tǒng)可以創(chuàng)造全新的商業(yè)和經(jīng)濟(jì)模式,幫助實(shí)現(xiàn)長(zhǎng)尾商品的銷售D)推薦系統(tǒng)分為基于物品的協(xié)同過(guò)濾和基于商家的協(xié)同過(guò)濾[單選題]136.數(shù)學(xué)關(guān)系式2A)2B)2C)2D)x>2orx[單選題]137.條件?BETWEEN20AND30?表示年齡在20到30之間,且()A)包括20歲不包括30歲B)不包括20歲包括30歲C)不包括20歲和30歲D)包括20歲和30歲[單選題]138.DougCutting所創(chuàng)立的項(xiàng)目的名稱都受到其家人的啟發(fā),以下項(xiàng)目不是由他創(chuàng)立的項(xiàng)目是A)HadoopB)NutchC)LuceneD)Solr[單選題]139.()不可以直接來(lái)對(duì)文本分類。A)K-meansB)決策樹(shù)C)支持向量機(jī)D)KNN[單選題]140.以下關(guān)于增益率說(shuō)法正確的是(___)A)ID3算法使用增益率選擇最優(yōu)劃分屬性B)增益率準(zhǔn)則對(duì)可取值數(shù)目較多的屬性有所偏好C)屬性a的可能取值數(shù)目越多,IV(a)的值通常越大D)C4.5算法先從候選劃分屬性中找出信息增益低于平均水平的屬性,再?gòu)闹羞x擇增益率最高的[單選題]141.使用HBase客戶端批量寫(xiě)入10條數(shù)據(jù),某個(gè)HRegionServer節(jié)點(diǎn)上包含該表的2個(gè)Region,分別為A和B,10條數(shù)據(jù)中有6條屬于A,4條屬于B,請(qǐng)問(wèn)寫(xiě)入這10條數(shù)據(jù)需要向該HRegionServer發(fā)送幾次RPC請(qǐng)求?A)10B)6C)2D)1[單選題]142.某公司營(yíng)銷總監(jiān)在年度報(bào)告中,需要直觀地展示出最近五年公司某產(chǎn)品的銷售額變化趨勢(shì),以下可視化圖表中,最適合他的是()A)明細(xì)表B)熱力點(diǎn)圖C)線形圖D)漏斗圖[單選題]143.大數(shù)據(jù)的特點(diǎn)不包括下面哪一項(xiàng)______。A)巨大的數(shù)據(jù)量B)多結(jié)構(gòu)化數(shù)據(jù)C)增長(zhǎng)速度快D)價(jià)值密度高[單選題]144.完全不使用填充的方法稱為()A)任意填充B)全填充C)半填充D)有效填充第2部分:多項(xiàng)選擇題,共62題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]145.下列關(guān)于大數(shù)據(jù)的說(shuō)法中,錯(cuò)誤的是()A)大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時(shí)效性強(qiáng)的特征B)處理大數(shù)據(jù)需采用新型計(jì)算架構(gòu)和智能算法等新技術(shù)C)大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析D)大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析[多選題]146.下列關(guān)于隨機(jī)變量及其概率分布的說(shuō)法正確的有()。A)隨機(jī)變量可以分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量B)隨機(jī)變量的概率分布指的是一個(gè)隨機(jī)變量所有取值的可能性C)扔5次硬幣,正面朝上次數(shù)的可能取值是0、1、2、3、4、5,其中正面朝上次數(shù)為0與正面朝上次數(shù)為5的概率是一樣的D)扔5次硬幣,正面朝上次數(shù)的可能取值是0、1、2、3、4、5,其中正面朝上次數(shù)為5的概率是最大的[多選題]147.ElasticSearch在部署時(shí),對(duì)Linux的設(shè)置有哪些優(yōu)化方法?A)關(guān)閉緩存swapB)堆內(nèi)存設(shè)置為:MinC)線程池+隊(duì)列大小根據(jù)業(yè)務(wù)需要做調(diào)整D)設(shè)置最大文件句柄數(shù)[多選題]148.關(guān)于MaxCompute的視圖的描述,下列正確的是:()。A)視圖可以引用視圖,包括自身B)創(chuàng)建視圖時(shí),必須對(duì)引用表有讀權(quán)限C)如果想保存當(dāng)前視圖中的數(shù)據(jù),可以插入一張表或者使用物化視圖D)視圖只能包含一個(gè)有效的select語(yǔ)句[多選題]149.HBase讀寫(xiě)用戶表數(shù)據(jù)時(shí)需要下列哪些角色參與?A)RegionB)HMasterC)ZookeeperD)RegionServer[多選題]150.當(dāng)閔可夫斯基距離公式中的系數(shù)p值為1時(shí),可得到(__)的公式。A)歐氏距離B)曼哈頓距離C)街區(qū)距離D)切比雪夫距離[多選題]151.能源互聯(lián)網(wǎng)生態(tài)圈建設(shè),重點(diǎn)構(gòu)建()等七個(gè)生態(tài)圈A)電動(dòng)汽車服務(wù)B)綜合能效服務(wù)C)數(shù)據(jù)商業(yè)化服務(wù)D)電力探索服務(wù)[多選題]152.下列描述機(jī)器學(xué)習(xí)中L1正則化和L2正則化說(shuō)法正確的是?(___)A)使用L1可以得到稀疏的權(quán)值,使用L2可以得到平滑的權(quán)值B)L1范數(shù)和L2范數(shù)正則化都有助于降低過(guò)擬合風(fēng)險(xiǎn)C)采用L2范數(shù)時(shí)平方誤差項(xiàng)等值線與正則化項(xiàng)等值線交點(diǎn)常出現(xiàn)在某個(gè)象限中D)L1正則化問(wèn)題求解可使用近端梯度下降算法[多選題]153.Analytics1.0的主要特點(diǎn)有()。A)分析活動(dòng)滯后于數(shù)據(jù)的生成B)重視結(jié)構(gòu)化數(shù)據(jù)的分析C)以對(duì)歷史數(shù)據(jù)的理解為主要目的D)注重描述性分析[多選題]154.泛在電力物聯(lián)網(wǎng)能源生態(tài)包括()A)電動(dòng)汽車服務(wù)生態(tài)圈B)電工裝備服務(wù)生態(tài)圈C)能源電商服務(wù)生態(tài)圈D)綜合能效服務(wù)生態(tài)圈[多選題]155.關(guān)于政府?dāng)?shù)據(jù)開(kāi)放的意義,下面描述正確的是:()A)政府開(kāi)放數(shù)據(jù)有利于促進(jìn)開(kāi)放透明政府的形成B)政府開(kāi)放數(shù)據(jù)有利于創(chuàng)新創(chuàng)業(yè)和經(jīng)濟(jì)增長(zhǎng)C)政府開(kāi)放數(shù)據(jù)有利于社會(huì)治理創(chuàng)新D)政府開(kāi)放數(shù)據(jù)將會(huì)對(duì)政府正常運(yùn)作產(chǎn)生威脅[多選題]156.Flume中以下哪些選項(xiàng)屬于Sinkprocessor的類型?A)BlankSinkprocessorB)DefaultSinkProcessorC)LoadbalancingSinkProcessorD)FailoverSinkProcessor[多選題]157.以下哪些選項(xiàng)是容易造成Hive數(shù)據(jù)傾斜的原因?A)distinctcountB)droptableC)joinD)droupby[多選題]158.觸發(fā)器是響應(yīng)以下任意語(yǔ)句而自動(dòng)執(zhí)行的一條或一組MYSQL語(yǔ)句()A)UPDATEB)INSERTC)SELECTD)DELETE[多選題]159.下列哪些屬于TF-IDF的應(yīng)用?A)搜索引擎B)關(guān)鍵詞提取C)文本相似性D)數(shù)據(jù)降維[多選題]160.行存表相比于列存表的區(qū)別是(?A)同樣的教據(jù),采用行存表存儲(chǔ)比列存儲(chǔ)所耗的時(shí)間更少。B)行存表適合數(shù)據(jù)更新,列存表適合做數(shù)據(jù)聚合。C)行存表面向百萬(wàn)級(jí)以下數(shù)據(jù)量,列存表面向千萬(wàn)級(jí)以上數(shù)據(jù)量D)行存表按行存儲(chǔ)數(shù)據(jù),列存表按列存儲(chǔ)教據(jù)[多選題]161.Hadoop的HBase主要特點(diǎn)有哪些?A)高可靠性B)高性能C)面向列D)可伸縮[多選題]162.云數(shù)據(jù)中心的特征A)高設(shè)備利用率B)高可用性C)綠色節(jié)能D)人工化管理[多選題]163.若在消息處理過(guò)程中允許部分信息丟失,關(guān)閉消息可靠性處理機(jī)制的方式有以下哪些?A)將參數(shù)Config.Topology_ACKKRS設(shè)置為0B)將參數(shù)Config.Topology_ACKKRS設(shè)置為FalseC)Spout發(fā)送消息時(shí),使用不指定消息messageID的接口進(jìn)行發(fā)送D)Bolt發(fā)送消息時(shí)使用Unanchor方式發(fā)送[多選題]164.下列圖表中,使用到折線的有()A)分區(qū)折線圖B)多系列折線圖C)折現(xiàn)雷達(dá)圖D)組合圖[多選題]165.智能終端研發(fā)部署應(yīng)充分考慮其他專業(yè)需求,實(shí)現(xiàn)配用電側(cè)()跨專業(yè)復(fù)用,推動(dòng)各專業(yè)共建共享A)采集裝置B)通信資源C)邊緣計(jì)算D)數(shù)據(jù)資源[多選題]166.以下屬于NoSQL的有A)CassandraB)CouchDBC)BigTableD)MySQL[多選題]167.在比特幣區(qū)塊鏈中關(guān)于如何爭(zhēng)奪記賬權(quán)的問(wèn)題,下面描述正確的是:()A)釆用的是POW機(jī)制,也就是?工作量證明機(jī)制?B)記賬節(jié)點(diǎn)通過(guò)計(jì)算數(shù)學(xué)題,來(lái)爭(zhēng)奪記賬權(quán)C)對(duì)于數(shù)學(xué)公式的計(jì)算.除了從零開(kāi)始遍歷隨機(jī)數(shù)碰運(yùn)氣以外,沒(méi)有其他辦法D)解題的過(guò)程,又叫?挖礦?,記賬節(jié)點(diǎn)被稱為礦工。誰(shuí)先解對(duì),誰(shuí)就獲記賬權(quán)[多選題]168.Flink可以基于以下哪些窗口進(jìn)行統(tǒng)計(jì)?A)時(shí)間窗口B)滑動(dòng)窗口C)會(huì)話窗口D)countWindow[多選題]169.下面哪個(gè)是Hadoop進(jìn)程()A)NameNodeB)NodemanagerC)DataNodeD)ResourceManager[多選題]170.以下哪些選項(xiàng)屬于決策樹(shù)分析的步驟?A)確定分析維度B)跑決策樹(shù)分析C)修剪決策樹(shù)D)收集數(shù)據(jù)[多選題]171.RDD具有()特征。A)可容錯(cuò)性B)簡(jiǎn)潔性C)并行數(shù)據(jù)結(jié)構(gòu)D)結(jié)構(gòu)化[多選題]172.泛在電力物聯(lián)網(wǎng)總體架構(gòu)中的外部客戶分為()等A)能源供應(yīng)商B)設(shè)備制造商C)生態(tài)客戶D)政府部門(mén)[多選題]173.以下哪些是Spark服務(wù)的常駐進(jìn)程A)JobHistoryB)JDBCServerC)SparkResourceD)NodeManger[多選題]174.Python中數(shù)組切片操作非常方便,若l=np.arange(100),以下返回的哪些不是空數(shù)組()A)l[0:-3]B)l[-2:13]C)l[::3]D)l[2-3:][多選題]175.Flink支持的時(shí)間操作類型包括以下哪些選項(xiàng)?A)結(jié)束時(shí)間B)處理時(shí)間C)采集時(shí)間D)事件時(shí)間[多選題]176.關(guān)系數(shù)據(jù)模型哪些優(yōu)點(diǎn)?()A)結(jié)構(gòu)簡(jiǎn)單B)有標(biāo)準(zhǔn)語(yǔ)言C)適用于集合操作D)可表示復(fù)雜的語(yǔ)義[多選題]177.常用的規(guī)范化處理方法包括:()A)Min-Max規(guī)范化B)Z-Score規(guī)范化C)曲面規(guī)范化D)小數(shù)定標(biāo)規(guī)范化[多選題]178.下面哪些選項(xiàng)正確描述了HBase的特性?A)高可靠性B)高性能C)面向列D)可伸縮[多選題]179.數(shù)據(jù)挖掘算法的組件包括()。A)模型或模型結(jié)構(gòu)B)評(píng)分函數(shù)C)優(yōu)化和搜索方法D)數(shù)據(jù)管理策略[多選題]180.?大數(shù)據(jù)財(cái)務(wù)分析?可視化模塊中,我們可以為指標(biāo)設(shè)置匯總方式,這些匯總方式包括()A)求和B)求平均C)求最大值D)求中位數(shù)[多選題]181.下列對(duì)python描述正確的是()A)面向?qū)ο笳Z(yǔ)言B)高級(jí)語(yǔ)言C)腳本語(yǔ)言D)編譯型語(yǔ)言[多選題]182.企業(yè)中臺(tái)的建設(shè)原則是()A)堅(jiān)持企業(yè)級(jí)建設(shè)B)堅(jiān)持以用戶為中心C)堅(jiān)持以應(yīng)用為導(dǎo)向D)堅(jiān)持統(tǒng)一創(chuàng)新結(jié)合[多選題]183.以下哪些函數(shù)屬于Python的內(nèi)置函數(shù)?A)int()B)print()C)S()D)input()[多選題]184.以下可以作為數(shù)據(jù)倉(cāng)庫(kù)業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)來(lái)源的選項(xiàng)有()【選三項(xiàng)】A)Oracle、MySQL和SQLServer等關(guān)系數(shù)據(jù)庫(kù)里的結(jié)果化數(shù)據(jù)B)視頻、音頻文件C)HTML、XML等自描敘的半結(jié)構(gòu)化數(shù)據(jù)D)Word或Excel文檔中的非結(jié)構(gòu)化數(shù)據(jù)[多選題]185.以下關(guān)于L1范數(shù)和L2范數(shù)正則化的描述中正確的是()。A)L1正則化容易增加欠擬合風(fēng)險(xiǎn)B)L2正則化容易增加過(guò)擬合風(fēng)險(xiǎn)C)L1比L2更易于獲得稀疏解D)兩者都有助于降低過(guò)擬合風(fēng)險(xiǎn)[多選題]186.EDA(探索性數(shù)據(jù)分析)方法與傳統(tǒng)統(tǒng)計(jì)學(xué)的驗(yàn)證性分析方法的區(qū)別有()。A)EDA需要事先提出假設(shè),而驗(yàn)證性分析不需要B)EDA中采用的方法往往比驗(yàn)證性分析簡(jiǎn)單C)在一般數(shù)據(jù)科學(xué)項(xiàng)目中,探索性分析在先,驗(yàn)證性分析在后D)EDA更為簡(jiǎn)單、易學(xué)和易用[多選題]187.下面哪些概念是HBase框架中使用的?A)HDFSB)GridFSC)ZookeeperD)EXT3[多選題]188.FusionInsightManager可以對(duì)哪些項(xiàng)目進(jìn)行健康檢查?A)角色B)主機(jī)C)服務(wù)D)實(shí)例[多選題]189.StructuredStreaming中OutPut定義的存儲(chǔ)方式包含以下哪幾種?A)ModifyModeB)AppendModeC)UpdateMode.D)CompleteMode[多選題]190.下列不是Python語(yǔ)言保留字的有()。A)doB)passC)exceptD)until[多選題]191.Hive支持的文件存儲(chǔ)格式有()【選三項(xiàng)】A)ISO文件B)SEQUENCEFILEC)RCFILED)ORCFILE[多選題]192.大數(shù)據(jù)計(jì)算服務(wù)中關(guān)于tunnel命令行工具的說(shuō)法,正確的是:()。A)tunnel上傳到分區(qū)表時(shí),會(huì)把數(shù)據(jù)直接上傳到指定的分區(qū)中去,不保證業(yè)務(wù)邏輯B)tunnel命令上傳文件時(shí),不能進(jìn)行壓縮C)tunnel上傳的數(shù)據(jù)是先寫(xiě)到臨時(shí)目錄,最后確定成功后才寫(xiě)到結(jié)果目錄D)tunnel上傳過(guò)程中不加密,數(shù)據(jù)以明文方式在網(wǎng)絡(luò)中傳輸[多選題]193.目前進(jìn)行數(shù)據(jù)交易的形式主要包括哪凡種:()A)大數(shù)據(jù)交易公司B)數(shù)據(jù)交易所C)API模式D)PPT模式[多選題]194.下列有關(guān)Hive中分區(qū)表理解正確的有()【選三項(xiàng)】A)分區(qū)表實(shí)際就是對(duì)應(yīng)HDFS文件系統(tǒng)上的的獨(dú)立的文件夾,該文件夾下是該分區(qū)所有數(shù)據(jù)文件B)分區(qū)可以理解為分類,通過(guò)分類把不同類型的數(shù)據(jù)放到不同的目錄下C)分區(qū)表的意義在于優(yōu)化查詢,查詢時(shí)盡量利用分區(qū)字段D)如果使用分區(qū)字段,系統(tǒng)就掃描全部數(shù)據(jù)[多選題]195.kafka中刪除消息的閾值有幾種?A)硬盤(pán)總空間大小B)分區(qū)總?cè)罩敬笮)數(shù)據(jù)使用的頻軍D)數(shù)據(jù)產(chǎn)生的時(shí)間[多選題]196.下列哪種數(shù)據(jù)結(jié)構(gòu)可以傳遞給下一個(gè)數(shù)組(__)。A)冒號(hào)B)數(shù)組C)標(biāo)量D)代碼[多選題]197.在華為大數(shù)據(jù)解決方案中,hadoop底層包含以下那些組件?A)finkB)hiveC)minerD)spark[多選題]198.()可以做LSTM學(xué)習(xí)。A)MATLABB)tensorflowC)kreasD)word[多選題]199.下列哪些是詞語(yǔ)情感分析的方法?A)基于網(wǎng)絡(luò)的分析方法B)基于word-embedding的分析方法C)基于詞典的分析方法D)基于詞頻的分析方法[多選題]200.確定圖像分割的閾值的方法有(__)。A)可變閾值法B)判別分析法C)中值濾波D)p尾法[多選題]201.大數(shù)據(jù)的核心是洞察,洞察有以下哪些特色?A)洞察工作重點(diǎn)B)洞察調(diào)度奧妙C)洞察管理規(guī)律D)洞察未來(lái)趨勢(shì)[多選題]202.EDA(探索性數(shù)據(jù)分析)方法與傳統(tǒng)統(tǒng)計(jì)學(xué)的驗(yàn)證性分析方法的區(qū)別有()。A)EDA需要事先提出假設(shè),而驗(yàn)證性分析不需要B)EDA中采用的方法往往比驗(yàn)證性分析簡(jiǎn)單C)在一般數(shù)據(jù)科學(xué)項(xiàng)目中,探索性分析在先,驗(yàn)證性分析在后D)EDA更為簡(jiǎn)單、易學(xué)和易用[多選題]203.QuickBI在阿里云大數(shù)據(jù)解決方案中扮演了很重要的角色,可以提供包括:()等在內(nèi)的多種功能。A)報(bào)表展示B)即席查詢C)門(mén)戶集成D)數(shù)據(jù)采集[多選題]204.數(shù)據(jù)科學(xué)的基本流程包含(__)。A)數(shù)據(jù)化B)探索性分析C)數(shù)據(jù)分析D)數(shù)據(jù)存儲(chǔ)[多選題]205.根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,財(cái)務(wù)智能分析中的財(cái)務(wù)科目異動(dòng)分析模塊,文字部分描述頁(yè)面右側(cè)表格中()的重點(diǎn)科目數(shù)值、增額、增幅情況,描述的文字內(nèi)容隨表格內(nèi)容變動(dòng)而變動(dòng)。A)小幅異動(dòng)B)有所異動(dòng)C)大幅異動(dòng)D)以上都不對(duì)[多選題]206.常見(jiàn)的核函數(shù)主要包括()。A)多項(xiàng)式核B)高斯核C)線性核D)拉普拉斯核E)Sigmoid核第3部分:判斷題,共42題,請(qǐng)判斷題目是否正確。[判斷題]207.使用內(nèi)置函數(shù)open()且以?w?模式打開(kāi)的文件,文件指針默認(rèn)指向文件尾。A)正確B)錯(cuò)誤[判斷題]208.啤酒與尿布的經(jīng)典案例,充分體現(xiàn)了實(shí)驗(yàn)思維在大數(shù)據(jù)分析理念中的重要性。A)正確B)錯(cuò)誤[判斷題]209.不同版本的Python不能安裝到同一臺(tái)計(jì)算機(jī)上。A)正確B)錯(cuò)誤[判斷題]210.刪除Hive外部表時(shí),表數(shù)據(jù)也會(huì)刪除。()A)正確B)錯(cuò)誤[判斷題]211.表達(dá)式'aaaassddf'A)正確B)錯(cuò)誤[判斷題]212.卷權(quán)神經(jīng)網(wǎng)絡(luò)可以對(duì)一個(gè)輸人進(jìn)行多種變換(旋轉(zhuǎn)、平移、縮放)A)正確B)錯(cuò)誤[判斷題]213.定量屬性可以是整數(shù)值或者是連續(xù)值A(chǔ))正確B)錯(cuò)誤[判斷題]214.當(dāng)一個(gè)用戶被從某個(gè)MaxCompute項(xiàng)目空間移除后,Policy授權(quán)仍然會(huì)被保留,一旦該用戶以后被再添加到該項(xiàng)目空間時(shí),該用戶的歷史的ACL授權(quán)訪問(wèn)權(quán)限將被重新激活。A)正確B)錯(cuò)誤[判斷題]215.物聯(lián)網(wǎng)是收集大數(shù)據(jù)的唯一途徑A)正確B)錯(cuò)誤[判斷題]216.支持?jǐn)?shù)據(jù)的隨機(jī)寫(xiě)。()A)正確B)錯(cuò)誤[判斷題]217.數(shù)據(jù)采集與接入的范圍包括一級(jí)部署業(yè)務(wù)系統(tǒng)、二級(jí)部署業(yè)務(wù)系統(tǒng)(含自建)和外部系統(tǒng)一手?jǐn)?shù)據(jù)接入,滿足大數(shù)據(jù)平臺(tái)一手?jǐn)?shù)據(jù)"全"的要求。A)正確B)錯(cuò)誤[判斷題]218.DataNode首次加入cluster的時(shí)候,如果log中報(bào)告不兼容文件版本,那需要NameNode執(zhí)行?Hadoopnamenode-format?操作格式化磁盤(pán)。A)正確B)錯(cuò)誤[判斷題]219.正則表達(dá)式模塊re的match()方法是從字符串的開(kāi)始匹配特定模式,而search()方法是在整個(gè)字符串中尋找模式,這兩個(gè)方法如果匹配成功則返回match對(duì)象,匹配失敗則返回空值None。A)正確B)錯(cuò)誤[判斷題]220.Flume不支持多級(jí)聯(lián)操作。A)正確B)錯(cuò)誤[判斷題]221.FusionlnsightHD的Hive中,用戶自定義的UDF可以和Hive內(nèi)置的UDF重名,這種情況下,將使用用戶自定義的UDF。A)正確B)錯(cuò)誤[判斷題]222.可視化是指將不可見(jiàn)或難以直接顯示的數(shù)據(jù)轉(zhuǎn)化為可感知的圖形、符號(hào)、顏色、紋理等,增強(qiáng)數(shù)據(jù)識(shí)別效率,傳遞有效信息。()A)正確B)錯(cuò)誤[判斷題]223.GraphBase既支持分布式部署也支持單機(jī)部署。A)正確B)錯(cuò)誤[判斷題]224.在MySQL5.7中分組后只有使用聚合函數(shù)才能獲取非分組字段信息。--A)正確B)錯(cuò)誤[判斷題]225.DESC語(yǔ)句可以查看表結(jié)構(gòu)中的COMMENT注釋字段。--A)正確B)錯(cuò)誤[判斷題]226.預(yù)測(cè)腫瘤細(xì)胞是良性還是惡性屬于回歸問(wèn)題。A)正確B)錯(cuò)誤[判斷題]227.以追加模式打開(kāi)文件時(shí),文件指針指向文件尾。A)正確B)錯(cuò)誤[判斷題]228.數(shù)據(jù)預(yù)處理在實(shí)際的數(shù)據(jù)挖掘項(xiàng)目中是花費(fèi)時(shí)間最長(zhǎng)也是最為繁瑣的步驟。()A)正確B)錯(cuò)誤[判斷題]229.子類中不能重新實(shí)現(xiàn)從父類繼承的方法。()A)正確B)錯(cuò)誤[判斷題]230.可以使用del刪除集合中的部分元素。A)正確B)錯(cuò)誤[判斷題]231.在阿里云MaxCompute中,在一個(gè)multiinsert中:對(duì)于未分區(qū)表,該表不能出現(xiàn)多次。A)正確B)錯(cuò)誤[判斷題]232.字符串編碼格式GBK使用_2個(gè)字節(jié)表示一個(gè)漢字。A)正確B)錯(cuò)誤[判斷題]233.內(nèi)模式的修改會(huì)影響其概念模式和外模式。--A)正確B)錯(cuò)誤[判斷題]234.NOTEXISTS關(guān)鍵字判斷子查詢結(jié)果為空時(shí)返回0。--A)正確B)錯(cuò)誤[判斷題]235.根據(jù)案例?2009年7月29日,老河口市第二期經(jīng)濟(jì)適用住房計(jì)算機(jī)搖號(hào)確定購(gòu)買人儀式舉行。在市公證處公證人員的監(jiān)督下,該市領(lǐng)導(dǎo)、群眾代表和操作人員分別點(diǎn)擊,通過(guò)計(jì)算機(jī)搖號(hào),從1138戶具有購(gòu)房資格的申請(qǐng)者中,確定了514戶購(gòu)房者。當(dāng)天18時(shí)許,?今日老河口?網(wǎng)站公布了購(gòu)買人名單,網(wǎng)民很快就發(fā)現(xiàn),其中有14戶資格證編號(hào)相連。?分析可知,其結(jié)果肯定是存在問(wèn)題的。A)正確B)錯(cuò)誤[判斷題]236.對(duì)遺漏數(shù)據(jù)的處理方法主要有忽略該條記錄;手工填補(bǔ)遺漏值;利用默認(rèn)值填補(bǔ)遺漏值;利用均值填補(bǔ)遺漏值;利用同類別均值填補(bǔ)遺漏值;利用最可能的值填充遺漏值。()A)正確B)錯(cuò)誤[判斷題]237.正則表達(dá)式元字符?\d?用來(lái)匹配任意數(shù)字字符。A)正確B)錯(cuò)誤[判斷題]238.牛頓的方法論就是機(jī)械思維A)正確B)錯(cuò)誤[判斷題]239.表達(dá)式''A)正確B)錯(cuò)誤[判斷題]240.如果沒(méi)有明確地指明數(shù)組中元素的類型,則默認(rèn)為float64。()A)正確B)錯(cuò)誤[判斷題]241.支撐大數(shù)據(jù)業(yè)務(wù)的基礎(chǔ)是數(shù)據(jù)應(yīng)用。A)正確B)錯(cuò)誤[判斷題]242.復(fù)數(shù)類型的實(shí)數(shù)部分可以為0。()A)正確B)錯(cuò)誤[判斷題]243.k近鄰學(xué)習(xí)是一種常用的無(wú)監(jiān)督學(xué)習(xí)方法,其工作機(jī)制為給定測(cè)試樣本,基于某種距離度量找出訓(xùn)練集中與其最靠近的k個(gè)訓(xùn)練樣本,然后基于這k個(gè)鄰居的信息來(lái)進(jìn)行預(yù)測(cè)。()A)正確B)錯(cuò)誤[判斷題]244.邏輯回歸不能處理三分類問(wèn)題A)正確B)錯(cuò)誤[判斷題]245.只能通過(guò)切片訪問(wèn)列表中的元素,不能使用切片修改列表中的元素A)正確B)錯(cuò)誤[判斷題]246.函數(shù)中的return語(yǔ)句一定能夠得到執(zhí)行。A)正確B)錯(cuò)誤[判斷題]247.個(gè)變量相關(guān),它們的相關(guān)系數(shù)r可能為0這句話()A)正確B)錯(cuò)誤$;[判斷題]248.在創(chuàng)建存儲(chǔ)過(guò)程前需要先選擇數(shù)據(jù)庫(kù)。--A)正確B)錯(cuò)誤第4部分:?jiǎn)柎痤},共11題,請(qǐng)?jiān)诳瞻滋幪顚?xiě)正確答案。[問(wèn)答題]249.假如Namenode中沒(méi)有數(shù)據(jù)會(huì)怎么樣?[問(wèn)答題]250.簡(jiǎn)述什么是層次化索引。[問(wèn)答題]251.MapReduce中Master服務(wù)器負(fù)責(zé)將一個(gè)Map任務(wù)分派給()。[問(wèn)答題]252.簡(jiǎn)述while和for語(yǔ)句的區(qū)別[問(wèn)答題]253.Hadoop發(fā)行版本分為()()[問(wèn)答題]254.HBase利用(HadoopHDFS)作為其文件存儲(chǔ)系統(tǒng),利用(HadoopMapReduce)來(lái)處理HBase中的海量數(shù)據(jù),利用()作為協(xié)同服務(wù)。[問(wèn)答題]255.SSH中的注意點(diǎn)還包括?[問(wèn)答題]256.Master文件是否提供了多個(gè)入口?[問(wèn)答題]257.利用python語(yǔ)言,編寫(xiě)實(shí)現(xiàn)以下功能:輸入三個(gè)整數(shù),把這三個(gè)數(shù)由小到大輸出[問(wèn)答題]258.在MapTask的Spill階段,將數(shù)據(jù)寫(xiě)入本地磁盤(pán)前,要對(duì)數(shù)據(jù)進(jìn)行一次()并在必要時(shí)對(duì)數(shù)據(jù)進(jìn)行合并、壓縮等操作。[問(wèn)答題]259.大數(shù)據(jù)產(chǎn)業(yè)是指一切與支撐大數(shù)據(jù)組織管理和價(jià)值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟(jì)活動(dòng)的集合。以下哪些屬于大數(shù)據(jù)產(chǎn)業(yè)的某個(gè)環(huán)節(jié)(ABCD):IT基礎(chǔ)設(shè)施層數(shù)據(jù)源層數(shù)據(jù)管理層數(shù)據(jù)分析層第2章大數(shù)據(jù)與其他新興技術(shù)之間的關(guān)系早期的云計(jì)算產(chǎn)品AWS是由哪家企業(yè)提出的:()IBM微軟亞馬遜谷歌云計(jì)算包括3種類型。面向所有用戶提供服務(wù),只要是注冊(cè)付費(fèi)的用戶都可以使用,這種云計(jì)算屬于:()公有云私有云混合云獨(dú)立云云計(jì)算包括3種類型。只為特定用戶提供服務(wù),比如大型企業(yè)出于安全考慮自建的云環(huán)境,只為企業(yè)內(nèi)部提供服務(wù),這種云計(jì)算屬于:()公有云私有云混合云獨(dú)立云以下關(guān)于大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)的區(qū)別,描述錯(cuò)誤的是:()大數(shù)據(jù)側(cè)重于對(duì)海量數(shù)據(jù)的存儲(chǔ)、處理與分析,從海量數(shù)據(jù)中發(fā)現(xiàn)價(jià)值,服務(wù)于生產(chǎn)和生活云計(jì)算本質(zhì)上旨在整合和優(yōu)化各種IT資源并通過(guò)網(wǎng)絡(luò)以服務(wù)的方式,廉價(jià)地提供給用戶云計(jì)算旨在從海量數(shù)據(jù)中發(fā)現(xiàn)價(jià)值,服務(wù)于生產(chǎn)和生活物聯(lián)網(wǎng)的發(fā)展目標(biāo)是實(shí)現(xiàn)物物相連,應(yīng)用創(chuàng)新是物聯(lián)網(wǎng)發(fā)展的核心以下關(guān)于機(jī)器學(xué)習(xí),描述錯(cuò)誤的是:()是一門(mén)涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識(shí)、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能機(jī)器學(xué)習(xí)強(qiáng)調(diào)三個(gè)關(guān)鍵詞:算法、模型、訓(xùn)練基于數(shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方法之一[單選題]260.ID、F采用了IWF的幾次平方?()A)、一次B)、二次C)、三次D)、四次1.答案:A解析:2.答案:D解析:3.答案:B解析:4.答案:B解析:5.答案:C解析:6.答案:D解析:jieba中文分詞支持的三種分詞模式包括:①精確模式,試圖將句子最精確地切開(kāi),適合文本分析;②全模式,把句子中所有的可以成詞的詞語(yǔ)都掃描出來(lái),速度非??欤遣荒芙鉀Q歧義問(wèn)題;③搜索引擎模式,在精確模式的基礎(chǔ)上,對(duì)長(zhǎng)詞再次切分,提高召回率,適合用于搜索引擎分詞。7.答案:C解析:8.答案:A解析:9.答案:C解析:10.答案:B解析:11.答案:C解析:12.答案:A解析:13.答案:C解析:14.答案:D解析:15.答案:D解析:16.答案:C解析:C項(xiàng)rhadoop是用R語(yǔ)言開(kāi)發(fā)的,MapReduce是一個(gè)框架,可以理解是一種思想,可以使用其他語(yǔ)言開(kāi)發(fā)。17.答案:C解析:A、fs【抽象文件系統(tǒng),提供統(tǒng)一訪問(wèn)接口】B、ipc【節(jié)點(diǎn)間通信】C、io【表現(xiàn)層,將數(shù)據(jù)編碼、解碼,序列化】D、net【網(wǎng)絡(luò)功能】/frady-p-2704658.html18.答案:D解析:19.答案:D解析:20.答案:A解析:21.答案:C解析:22.答案:A解析:23.答案:B解析:24.答案:D解析:25.答案:A解析:26.答案:C解析:27.答案:C解析:28.答案:A解析:交換前兩列相當(dāng)于依次選取2、1、3列。29.答案:A解析:30.答案:B解析:31.答案:B解析:Python是免費(fèi)開(kāi)源的面向?qū)ο缶幊陶Z(yǔ)言,方便移植,以解釋方式逐條執(zhí)行語(yǔ)句,相比C++等語(yǔ)言運(yùn)行效率較低。32.答案:D解析:33.答案:D解析:HDFS的設(shè)計(jì)以"一次寫(xiě)入,多次讀取"為主要應(yīng)用場(chǎng)景,因此D錯(cuò)。34.答案:D解析:35.答案:B解析:36.答案:A解析:37.答案:B解析:38.答案:C解析:39.答案:B解析:40.答案:B解析:41.答案:D解析:SecondaryNameNode不同于NameNode,它不接受或者記錄任何實(shí)時(shí)的數(shù)據(jù)變化,但是,它會(huì)與NameNode進(jìn)行通信,以便定期地保存HDFS元數(shù)據(jù)的快照42.答案:B解析:43.答案:D解析:44.答案:A解析:45.答案:B解析:46.答案:C解析:47.答案:D解析:HDFS安全模式安全模式是NameNode的一種狀態(tài),在這個(gè)階段,文件系統(tǒng)不允許有任何修改48.答案:D解析:49.答案:A解析:50.答案:C解析:51.答案:B解析:Cifar10數(shù)據(jù)集Cifar-10由60000張32×32的RGB彩色圖片構(gòu)成,這個(gè)數(shù)據(jù)集最大的特點(diǎn)在于將識(shí)別遷移到了普適物體,而且應(yīng)用于多分類,不屬于情感分析評(píng)測(cè)。52.答案:B解析:B中條件1<10恒成立。53.答案:A解析:54.答案:B解析:55.答案:C解析:56.答案:B解析:57.答案:A解析:58.答案:A解析:59.答案:C解析:except是當(dāng)try語(yǔ)句錯(cuò)誤才運(yùn)行。60.答案:B解析:61.答案:B解析:62.答案:B解析:63.答案:D解析:64.答案:B解析:65.答案:A解析:66.答案:D解析:67.答案:B解析:68.答案:B解析:69.答案:A解析:70.答案:D解析:71.答案:C解析:72.答案:C解析:73.答案:D解析:74.答案:D解析:75.答案:D解析:76.答案:C解析:77.答案:D解析:求平均需要對(duì)全部數(shù)據(jù)進(jìn)行計(jì)算而非部分?jǐn)?shù)據(jù),在不更改業(yè)務(wù)邏輯的情況,使用Reducer充當(dāng)Combiner,最終會(huì)造成業(yè)務(wù)結(jié)果不正確。78.答案:A解析:79.答案:A解析:80.答案:C解析:81.答案:C解析:82.答案:B解析:83.答案:C解析:84.答案:B解析:交叉表由兩個(gè)維度(行維度、列維度),至少一個(gè)指標(biāo)組成。85.答案:D解析:研究大數(shù)據(jù),最重要的意義是預(yù)測(cè)86.答案:A解析:87.答案:D解析:88.答案:C解析:89.答案:D解析:90.答案:D解析:91.答案:B解析:92.答案:A解析:93.答案:B解析:94.答案:A解析:95.答案:A解析:96.答案:C解析:97.答案:B解析:98.答案:D解析:99.答案:D解析:100.答案:D解析:101.答案:D解析:102.答案:C解析:103.答案:A解析:104.答案:A解析:105.答案:D解析:106.答案:A解析:107.答案:C解析:108.答案:C解析:109.答案:A解析:110.答案:B解析:111.答案:D解析:112.答案:A解析:113.答案:C解析:114.答案:D解析:115.答案:A解析:116.答案:D解析:117.答案:D解析:118.答案:B解析:119.答案:B解析:120.答案:C解析:Pig是對(duì)MapReduce編程復(fù)雜性的抽象,Pig平臺(tái)包含用于分析Hadoop數(shù)據(jù)集的執(zhí)行環(huán)境和腳本語(yǔ)言(PigLatin)。121.答案:D解析:122.答案:D解析:123.答案:C解析:124.答案:C解析:125.答案:A解析:126.答案:B解析:127.答案:A解析:128.答案:A解析:二進(jìn)制101等于十進(jìn)制5。129.答案:D解析:130.答案:A解析:131.答案:A解析:132.答案:A解析:133.答案:B解析:134.答案:A解析:135.答案:D
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 華苑園林面試題庫(kù)及答案
- 中醫(yī)診斷學(xué)習(xí)題(附參考答案)
- 教育教學(xué)理論考試試題與答案
- 中醫(yī)學(xué)臨床題庫(kù)及答案
- 公務(wù)員考試(時(shí)事熱點(diǎn))經(jīng)典試題及答案(湖南省懷化市2025年)
- 漢中市西鄉(xiāng)縣輔警考試公安基礎(chǔ)知識(shí)考試真題庫(kù)及參考答案
- 大學(xué)醫(yī)藥考試試題及答案
- 《職業(yè)衛(wèi)生》模擬考試題與參考答案
- 法律常識(shí)題庫(kù)及答案
- 2025年黨建工作知識(shí)競(jìng)賽測(cè)試題庫(kù)附答案
- 計(jì)算機(jī)高級(jí)技師專業(yè)技術(shù)及理論知識(shí)試題庫(kù)與答案(共500題)
- 鍋爐房清潔衛(wèi)生制度模版(3篇)
- 踝關(guān)節(jié)骨折教學(xué)查房
- 食材配送消防安全應(yīng)急預(yù)案
- 《跨境直播運(yùn)營(yíng)》課件-跨境電商交易平臺(tái)直播
- 《公園體系規(guī)劃導(dǎo)則》
- 煙草物理檢驗(yàn)競(jìng)賽考試題庫(kù)及答案附有答案
- 人教部編版統(tǒng)編版八年級(jí)歷史上冊(cè)期末復(fù)習(xí)資料(復(fù)習(xí)提綱+思維導(dǎo)圖)講義
- 無(wú)人機(jī)系統(tǒng)數(shù)據(jù)鏈
- GB/T 4100-2015陶瓷磚
- GB/T 31120-2014糖果術(shù)語(yǔ)
評(píng)論
0/150
提交評(píng)論