版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試卷科目:大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷14)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共57題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.下面()函數(shù)不是字符串處理函數(shù)。A)TRUNCB)TO_CHARC)SUBSTRD)丨NSTR答案:A解析:[單選題]2.基于Boosting的集成學(xué)習(xí)代表算法不包含()A)AdaboostB)GBDTC)XGBOOSTD)隨機(jī)森林答案:D解析:[單選題]3.一切皆可試,大數(shù)據(jù)分析的效果好壞,可以通過(guò)模擬仿真或者實(shí)際運(yùn)行來(lái)驗(yàn)證,這體現(xiàn)了大數(shù)據(jù)思維維度中的()。A)相關(guān)思維B)因果思維C)定量思維D)實(shí)驗(yàn)思維答案:D解析:[單選題]4.關(guān)于?三型兩網(wǎng)?,以下()說(shuō)法不正確:A)建設(shè)樞紐型企業(yè)是立足公司的產(chǎn)業(yè)屬性。B)建設(shè)平臺(tái)型企業(yè)是立足公司的社會(huì)屬性。C)建設(shè)共享型企業(yè)是立足公司的社會(huì)屬性。D)堅(jiān)強(qiáng)智能電網(wǎng)是以特高壓、超高壓為骨干網(wǎng)架。答案:B解析:[單選題]5.scipy.stats模塊中隨機(jī)變量的概率密度函數(shù)是()。A)statsB)?tC)pdfD)ppf答案:C解析:pdf是概率密度函數(shù)(probabilitydensityfunction)。[單選題]6.發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法通常要經(jīng)過(guò)以下三個(gè)步驟:連接數(shù)據(jù),作數(shù)據(jù)準(zhǔn)備;給定最小支持度和(),利用數(shù)據(jù)挖掘工具提供的算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則;可視化顯示、理解、評(píng)估關(guān)聯(lián)規(guī)則。A)最小興趣度B)最小置信度C)最大支持度D)最小可信度答案:D解析:[單選題]7.假設(shè)屬性的取值范圍是-957~924,當(dāng)屬性的值為426時(shí),采用小數(shù)定標(biāo)規(guī)范化方法對(duì)應(yīng)的轉(zhuǎn)換結(jié)果是:()A)0.421B)0.433C)0.426D)0.489答案:C解析:二、多選題[單選題]8.下面有關(guān)機(jī)器學(xué)習(xí)的認(rèn)識(shí)是錯(cuò)誤的?()A)高質(zhì)量的數(shù)據(jù)、算力和算法對(duì)一個(gè)機(jī)器學(xué)習(xí)項(xiàng)目是必不可少的。B)機(jī)器學(xué)習(xí)算法很多,后期出現(xiàn)的算法比早期出現(xiàn)的算法性能好。C)機(jī)器學(xué)習(xí)可以在一定程度上模仿人的學(xué)習(xí),并能輔助人的決策能力。D)深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一類高級(jí)算法,可以處理圖像、聲音和文本等復(fù)雜的數(shù)據(jù)。答案:B解析:[單選題]9.Flume傳輸?shù)幕締卧?)。A)數(shù)據(jù)流B)源C)塊D)Flume事件答案:D解析:[單選題]10.CSV是一種通用的、相對(duì)簡(jiǎn)單的文件格式,被用戶、商業(yè)和科學(xué)廣泛應(yīng)用。現(xiàn)在需要在DEEP平臺(tái)中將多個(gè)字符串拼接成CSV格式的字符串。請(qǐng)選擇適用的數(shù)值轉(zhuǎn)換器:A)CeilingB)CsvAssembleC)CsnToStringD)TermExtract答案:B解析:[單選題]11.請(qǐng)閱讀下面一段程序:arr_2d=np.array([[11,20,13],[14,25,16],[27,18,9]])print(arr_2d[1,:1])執(zhí)行上述程序后,最終輸出的結(jié)果為()A)[14]B)[25]C)[14,25]D)[20,25]答案:A解析:[單選題]12.關(guān)于欠擬合(under-fitting),正確的是()。A)訓(xùn)練誤差較大,測(cè)試誤差較小B)訓(xùn)練誤差較小,測(cè)試誤差較大C)訓(xùn)練誤差較大,測(cè)試誤差較大D)訓(xùn)練誤差較小,測(cè)試誤差較小答案:C解析:欠擬合是指對(duì)訓(xùn)練樣本的一般性質(zhì)尚未學(xué)好,因此訓(xùn)練誤差和測(cè)試誤差均較大[單選題]13.下列關(guān)于大數(shù)據(jù)的說(shuō)法中,錯(cuò)誤的是()A)大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時(shí)效性強(qiáng)的特征B)處理大數(shù)據(jù)需采用新型計(jì)算架構(gòu)和智能算法等新技術(shù)C)大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析D)大數(shù)據(jù)的目的在于發(fā)現(xiàn)新的知識(shí)與洞察并進(jìn)行科學(xué)決策答案:A解析:[單選題]14.下列哪部分不是專家系統(tǒng)的組成部分()A)用戶B)綜合數(shù)據(jù)庫(kù)C)推理機(jī)D)知識(shí)庫(kù)答案:A解析:[單選題]15.面向用戶提供大數(shù)據(jù)一站式部署方案,包括數(shù)據(jù)中心和服務(wù)器等硬件.數(shù)據(jù)分析應(yīng)用軟件及技術(shù)運(yùn)維支持等多方面內(nèi)容的大數(shù)據(jù)商業(yè)模式是()A)大數(shù)據(jù)解決方案模式B)大數(shù)據(jù)信息分類模式C)大數(shù)據(jù)處理服務(wù)模式D)大數(shù)據(jù)資源提供模式答案:A解析:[單選題]16.下列對(duì)大數(shù)據(jù)4V特征的說(shuō)法中,錯(cuò)誤的是A)數(shù)據(jù)規(guī)模大B)數(shù)據(jù)價(jià)值密度高C)數(shù)據(jù)類型多樣D)數(shù)據(jù)處理速度快答案:B解析:[單選題]17.按照姓名降序排列()A)ORDERBYDESCNAMEB)ORDERBYNAMEDESCC)ORDERBYNAMEASCD)ORDERBYASCNAME答案:B解析:[單選題]18.在其它條件不變的前提下,以下哪種做法容易引起機(jī)器學(xué)習(xí)中的過(guò)擬合問(wèn)題A)增加訓(xùn)練集數(shù)量B)減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)數(shù)C)刪除稀疏的特征D)SVM算法中使用高斯核/RBF核代替答案:D解析:[單選題]19.下面關(guān)于?priceBETWEEN0AND、59?描述錯(cuò)誤的是()。--A)判斷的范圍包括0B)BETWEEN...AND用于設(shè)置比較區(qū)間C)判斷的范圍包括59D)以上說(shuō)法都不正確答案:D解析:[單選題]20.返回當(dāng)前日期的函數(shù)是()A)curtime()B)adddate()C)curnow()D)curdate()答案:D解析:[單選題]21.np.full()的作用是(__)。A)創(chuàng)建全零矩陣B)根據(jù)給定的形狀創(chuàng)建指定數(shù)值的矩陣C)創(chuàng)建對(duì)角矩陣D)顯示矩陣答案:B解析:[單選題]22.()以滿足消費(fèi)者在互聯(lián)網(wǎng)中的消費(fèi)需求為主要目標(biāo),其商業(yè)模式以眼球經(jīng)濟(jì)為主。A)產(chǎn)業(yè)互聯(lián)網(wǎng)B)消費(fèi)互聯(lián)網(wǎng)C)移動(dòng)互聯(lián)網(wǎng)D)桌面互聯(lián)網(wǎng)答案:B解析:[單選題]23.亞馬遜AWS提供的云計(jì)算服務(wù)類型是()A)IaaSB)PaaSC)SaaSD)三個(gè)選項(xiàng)都是答案:D解析:[單選題]24.在線性回歸中,(__)試圖找到一條直線,使所有樣本到直線上的歐氏距離之和最小。A)最小二乘法B)拉格朗日乘子法C)歐氏距離D)均方誤差答案:A解析:[單選題]25.以下變量名中錯(cuò)誤的是()。A)my_string_1B)1st_stringC)fooD)_答案:B解析:[單選題]26.()屬于淺層學(xué)習(xí)模型A)DBNB)CNNC)SVMD)RNN答案:C解析:[單選題]27.下面python循環(huán)體執(zhí)行的次數(shù)與其他不同的是。()A)i=0while(iB)i=10while(i>0):print(i)i=i-1C)forIinrange(10):Print(i)D)forIinrange(10,0,-1):print(i)答案:A解析:[單選題]28.不屬于Mayer-Sch?nbergerV和CukierK.在其著名論著《BigData:ARevolutionThatWillTransformHowWeLive,Work,andThink》中提出了大數(shù)據(jù)時(shí)代統(tǒng)計(jì)的思維變革的是()。A)不是隨機(jī)樣本,而是全體數(shù)據(jù)B)不是精確性,而是混雜性C)不是描述性分析,而是預(yù)測(cè)性分析D)不是因果關(guān)系,而是相關(guān)關(guān)系答案:C解析:Mayer-Sch?nbergerV和CukierK.在其著名論著《BigData:ARevolutionThatWillTransformHowWeLive,Work,andThink》中提出了大數(shù)據(jù)時(shí)代統(tǒng)計(jì)的思維變革:①不是隨機(jī)樣本,而是全體數(shù)據(jù);大數(shù)據(jù)時(shí)代應(yīng)遵循"樣本=總體"的理念,需要分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量的數(shù)據(jù)樣本。②不是精確性,而是混雜性;大數(shù)據(jù)時(shí)代應(yīng)承認(rèn)數(shù)據(jù)的復(fù)雜性,數(shù)據(jù)分析目的不應(yīng)追求精確性,數(shù)據(jù)分析的主要瓶頸是如何提升效率而不是保證分析結(jié)果的精確度。③不是因果關(guān)系,而是相關(guān)關(guān)系:大數(shù)據(jù)時(shí)代的思想方式應(yīng)轉(zhuǎn)變--不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。[單選題]29.下列哪一項(xiàng)在神經(jīng)網(wǎng)絡(luò)中引入了非線性A)隨機(jī)梯度下降B)修正線性單元(ReLU)C)卷積函數(shù)D)以上都不正確答案:B解析:[單選題]30.()不是Hive支持的數(shù)據(jù)類型。A)StructB)IntC)MapD)Long答案:D解析:[單選題]31.jieba分詞包含的分詞模式是()。A)精確模式B)全模式C)搜索引擎模式D)以上都對(duì)答案:D解析:jieba中文分詞支持的三種分詞模式包括:①精確模式,試圖將句子最精確地切開(kāi),適合文本分析;②全模式,把句子中所有的可以成詞的詞語(yǔ)都掃描出來(lái),速度非??欤遣荒芙鉀Q歧義問(wèn)題;③搜索引擎模式,在精確模式的基礎(chǔ)上,對(duì)長(zhǎng)詞再次切分,提高召回率,適合用于搜索引擎分詞。[單選題]32.創(chuàng)建Loader作業(yè)中,可以在以下哪個(gè)步驟中設(shè)置過(guò)濾器類型?A)輸入設(shè)置B)轉(zhuǎn)換C)基本信息D)輸出答案:B解析:[單選題]33.查看HDFS的報(bào)告命令是()A)bin/hdfsdfsadmin-reportB)bin/hdfs-reportC)bin/hdfsdeadmin-reportD)bin/hdfsdfs-report答案:A解析:[單選題]34.相對(duì)于HadoopMapReducel.0,Spark的特點(diǎn)不包括()。A)速度快B)并發(fā)多C)通用性D)易用性答案:B解析:[單選題]35.某公司營(yíng)銷總監(jiān)在年度報(bào)告中,需要直觀地展示出最近五年公司某產(chǎn)品的銷售額變化趨勢(shì),以下可視化圖表中,最適合他的是()A)明細(xì)表B)熱力點(diǎn)圖C)線形圖D)漏斗圖答案:C解析:[單選題]36.()負(fù)責(zé)從源端數(shù)據(jù)表或日志中捕獲數(shù)據(jù)。A)ManagerB)ExtractC)PumpD)Replicat答案:B解析:[單選題]37.以下有關(guān)計(jì)算機(jī)編程語(yǔ)言說(shuō)法錯(cuò)誤的是?A)編程語(yǔ)言是用于書寫計(jì)算機(jī)程序的語(yǔ)言B)計(jì)算機(jī)語(yǔ)言可分為機(jī)器語(yǔ)言、匯編語(yǔ)言、高級(jí)語(yǔ)言C)計(jì)算機(jī)能識(shí)別和執(zhí)行所有編程語(yǔ)言寫的程序D)C/C++、pascal、javpython都屬于高級(jí)編程語(yǔ)言答案:C解析:[單選題]38.在數(shù)據(jù)科學(xué)中,通??梢圆捎?)有效避免數(shù)據(jù)加工和數(shù)據(jù)備份的偏見(jiàn)。A)A/B測(cè)試B)訓(xùn)練集和測(cè)試集的劃分C)測(cè)試集和驗(yàn)證集的劃分D)圖靈測(cè)試答案:A解析:[單選題]39.Python語(yǔ)句print(type(()))的結(jié)果是。()A)class'dict'B)class'tuple'C)class'set'D)class'list'答案:B解析:[單選題]40.下列關(guān)于Sigmoid函數(shù)的說(shuō)法錯(cuò)誤的是()。A)存在梯度爆炸的問(wèn)題B)不是關(guān)于原點(diǎn)對(duì)稱C)計(jì)算exp比較耗時(shí)D)存在梯度消失的問(wèn)題答案:A解析:對(duì)于Sigmoid函數(shù),S型函數(shù)圖像向兩邊的斜率逼近0,因此隨著網(wǎng)絡(luò)層增加,梯度消失比梯度爆炸更容易發(fā)生得多。[單選題]41.在Spark中()是工作節(jié)點(diǎn)上運(yùn)行的一組計(jì)算進(jìn)程。A)DAGSchedulerB)TaskSchedulerC)ExecutorD)ClusterManager答案:C解析:[單選題]42.執(zhí)行以下代碼段importrandomprint(random.choice('sun'))時(shí),輸出為()。A)sunB)s或u或nC)除了s、u、n的任一字符D)s答案:B解析:[單選題]43.Python標(biāo)示注釋使用符號(hào)是以下哪個(gè)?A)@B)&C)#D)0答案:C解析:[單選題]44.在Flink的運(yùn)行過(guò)程中,負(fù)責(zé)申請(qǐng)資源的角色是:()。A)ResourceManagerB)JobManagerC)ClientD)TaskManager答案:B解析:[單選題]45.以下對(duì)大數(shù)據(jù)4V特性描述不正確的是()。A)在大數(shù)據(jù)中,價(jià)值與數(shù)據(jù)總量的大小不存在線性關(guān)系B)數(shù)據(jù)量大是相對(duì)計(jì)算與存儲(chǔ)能力而定的C)Volume是指數(shù)據(jù)大D)大數(shù)據(jù)中所說(shuō)的?速度?包括兩種:增長(zhǎng)速度和處理速度答案:C解析:[單選題]46.下列關(guān)于支持向量的說(shuō)法,正確的是()。A)到分類超平面的距離最近的且滿足一定條件的幾個(gè)訓(xùn)練樣本點(diǎn)是支持向量B)訓(xùn)練集中的所有樣本點(diǎn)都是支持向量C)每一類樣本集中都分別只有一個(gè)支持向量D)支持向量的個(gè)數(shù)越多越好答案:A解析:在支持向量機(jī)中,距離超平面最近的且滿足一定條件的幾,個(gè)訓(xùn)練樣本點(diǎn)被稱為支持向量。一般情況下,支持向量的個(gè)數(shù)等于訓(xùn)練樣本數(shù)目,并不是越多越好。[單選題]47.什么關(guān)于TF-IDF模型描述錯(cuò)誤的是?A)TF意思是詞頻B)IDF是逆文本頻率C)該模型基于概率圖模型方法D)是一種信息檢索和數(shù)據(jù)挖掘常用加權(quán)技術(shù)答案:C解析:[單選題]48.圖像平滑從信號(hào)處理的角度看就是去除其中的(__)。A)高頻信息B)低頻信息C)噪聲D)亮度信息答案:A解析:[單選題]49.閱讀下面程序:set_01={'a','c','b','a'}set_01.add('d')print(len(set_01))運(yùn)行程序,輸出結(jié)果是()。A)5B)3C)4D)2答案:C解析:[單選題]50.下列對(duì)于ADS中表和表組的描述正確的是()。A)維度表在創(chuàng)建時(shí)不需要指定表組,但是需要配置分區(qū)信息B)維度表可以和除維度表組外的任意表組中的表關(guān)聯(lián)C)批量插入的表如果只有一級(jí)分區(qū),每次導(dǎo)入數(shù)據(jù)是會(huì)覆蓋掉已有數(shù)據(jù)D)維度表組有且只有一個(gè),用戶可以修改表組屬性,但是不能刪除答案:C解析:[單選題]51.異常檢測(cè)過(guò)程查找基于()組標(biāo)準(zhǔn)值偏差的異常個(gè)案。A)單體B)分類C)聚類D)回歸答案:C解析:異常檢測(cè)過(guò)程查找基于聚類組標(biāo)準(zhǔn)值偏差的異常個(gè)案。該過(guò)程設(shè)計(jì)為在探索性數(shù)據(jù)分析步驟中,快速檢測(cè)到用于數(shù)據(jù)審核的異常個(gè)案,并優(yōu)先于任何推論性數(shù)據(jù)分析。[單選題]52.數(shù)據(jù)中臺(tái)在匯聚生產(chǎn)庫(kù)的結(jié)構(gòu)化數(shù)據(jù)時(shí),最多的數(shù)據(jù)處理操作是:()。A)統(tǒng)計(jì)B)刪除C)新增D)修改答案:C解析:[單選題]53.根據(jù)泛在電力物聯(lián)網(wǎng)建設(shè)戰(zhàn)略安排,第一個(gè)階段是到()年,初步建成泛在電力物聯(lián)網(wǎng)。A)2020B)2021C)2024D)2025答案:B解析:[單選題]54.()定義了輸入到單個(gè)Map任務(wù)的輸入數(shù)據(jù)A)數(shù)據(jù)塊B)鍵值對(duì)C)InputSplitD)文件答案:C解析:第2部分:多項(xiàng)選擇題,共23題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.使用MySQL客戶端連接ADS時(shí),()信息是必須的。A)端口B)服務(wù)器地址C)數(shù)據(jù)庫(kù)名稱D)AccountID答案:ABC解析:[多選題]56.商業(yè)銀行在選擇數(shù)據(jù)中心的地理位置時(shí),應(yīng)充分考慮的環(huán)境威脅包括是否接近()A)自然災(zāi)害多發(fā)B)危險(xiǎn)或有害設(shè)C)繁忙或主要公路D)風(fēng)景區(qū)答案:ABC解析:[多選題]57.關(guān)系數(shù)據(jù)庫(kù)已經(jīng)流行很多年,并且Hadoop已經(jīng)有了HDFS和MapReduce,為什么需要HBase?A)Hadoop可以很好地解決大規(guī)模數(shù)據(jù)的離線批量處理問(wèn)題,但是,受限于HadoopMapReduce編程框架的高延遲數(shù)據(jù)處理機(jī)制,使得Hadoop無(wú)法滿足大規(guī)模數(shù)據(jù)實(shí)時(shí)處理應(yīng)用的需求上B)HDFS面向批量訪問(wèn)模式,不是隨機(jī)訪問(wèn)模式C)傳統(tǒng)的通用關(guān)系型數(shù)據(jù)庫(kù)無(wú)法應(yīng)對(duì)在數(shù)據(jù)規(guī)模劇增時(shí)導(dǎo)致的系統(tǒng)擴(kuò)展性和性能問(wèn)題D)傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)在數(shù)據(jù)結(jié)構(gòu)變化時(shí)一般需要停機(jī)維護(hù);空列浪費(fèi)存儲(chǔ)空間答案:ABCD解析:[多選題]58.下列關(guān)于EM算法描述正確的是()A)EM算法是常用的估計(jì)參數(shù)隱變量的利器B)EM算法即是期望最大化算法C)EM算法常被用來(lái)學(xué)習(xí)高斯混合模型的參數(shù)D)EM算法是一種追代式的方法答案:ABCD解析:[多選題]59.層次聚類試圖在不同層次對(duì)數(shù)據(jù)集進(jìn)行劃分。這里數(shù)據(jù)集的劃分可采用(__)或(__)策略。A)自頂向下B)自底向上C)自左至右D)自右至左答案:AB解析:[多選題]60.ADS的數(shù)據(jù)導(dǎo)人job提交后,可以通過(guò):()方法查詢當(dāng)前的導(dǎo)入狀態(tài)。A)使用log命令:logB)使用命令:showstatusforC)使用SQL:selectstatefrominformation_schema.current_jobwherejob_id=D)使用DMS,通過(guò)菜單項(xiàng)查看:導(dǎo)入導(dǎo)出=>導(dǎo)入狀態(tài)答案:CD解析:[多選題]61.下列哪項(xiàng)可以作為集群的管理工具A)PuppetB)PdshC)ClouderaManagerD)Rsync+ssh+scp答案:ABCD解析:全選就完事了[多選題]62.下列關(guān)于AUC面積的描述正確的有()。A)AUC被定義為ROC曲線下與坐標(biāo)軸圍成的面積B)AUC面積的值大于1C)AUC面積的值等于0.5時(shí),真實(shí)性最低,無(wú)應(yīng)用價(jià)值D)AUC面積的值越接近1.0,檢測(cè)方法真實(shí)性越高答案:ACD解析:AUC面積的值不大于1。[多選題]63.大數(shù)據(jù)離線批處理場(chǎng)景中常見(jiàn)的數(shù)據(jù)源包括?A)數(shù)據(jù)庫(kù)B)批量文件數(shù)據(jù)C)流式數(shù)據(jù)Socket流D)網(wǎng)頁(yè)日志流答案:ABC解析:[多選題]64.下面對(duì)LSM結(jié)構(gòu)描述正確的是?A)順序存儲(chǔ)B)直接寫硬盤C)需要將數(shù)據(jù)Flush到磁盤D)是一種搜索平衡樹(shù)答案:AC解析:B項(xiàng)LSMtree持久化到硬盤;不能直接寫(我猜的)D項(xiàng)LSM樹(shù)是一個(gè)橫跨內(nèi)存和磁盤的,包含多顆"子樹(shù)"的一個(gè)森林[多選題]65.對(duì)于主成分分析方法,確定降維后低維空間的維數(shù)d的方法有()。A)由用戶事先指定B)通過(guò)在d值不同的低維空間中對(duì)開(kāi)銷較小的學(xué)習(xí)器進(jìn)行交叉驗(yàn)證來(lái)選取C)可從重構(gòu)的角度設(shè)置一個(gè)重構(gòu)閾值,選取使得特定公式成立的最小值D)隨機(jī)設(shè)置答案:ABC解析:降維后低維空間的維數(shù)通常是由用戶事先指定,或通過(guò)在d值不同的低維空間中對(duì)k近鄰分類器(或其他開(kāi)銷較小的學(xué)習(xí)器)進(jìn)行交叉驗(yàn)證來(lái)選取較好的d值。還可從重構(gòu)的角度設(shè)置一個(gè)重構(gòu)閾值,選取使得特定公式成立的最小值。[多選題]66.確定圖像分割的閾值的方法有(__)。A)可變閾值法B)判別分析法C)中值濾波D)p尾法答案:ABD解析:[多選題]67.在金融領(lǐng)域的大數(shù)據(jù)批量離線處理平臺(tái)中,以下描述準(zhǔn)確的選項(xiàng)是。A)金融領(lǐng)域的數(shù)據(jù)應(yīng)用層面均是面向金融機(jī)構(gòu)內(nèi)部的,如監(jiān)管報(bào)表系統(tǒng),精準(zhǔn)營(yíng)銷、B應(yīng)用等,完全不對(duì)外或?qū)ζ渌挛輽C(jī)構(gòu)開(kāi)放。B)金融領(lǐng)域的外部數(shù)據(jù)來(lái)源可以是征信信息、社交網(wǎng)絡(luò)和電商等。C)金融領(lǐng)域的內(nèi)部數(shù)據(jù)來(lái)源均是結(jié)構(gòu)化數(shù)據(jù),包括信貸數(shù)據(jù)、信用卡數(shù)據(jù)和收單數(shù)據(jù)等。D)在數(shù)據(jù)集成模塊,可以分為數(shù)據(jù)采集、數(shù)據(jù)操控和數(shù)據(jù)加載3個(gè)階段。答案:ABC解析:[多選題]68.獲得采樣數(shù)據(jù)的常用方式有()【選三項(xiàng)】A)隨機(jī)抽樣B)桶表抽樣C)數(shù)據(jù)塊抽樣D)順序抽樣答案:ABC解析:[多選題]69.以下布爾表達(dá)式在邏輯上等同的是哪幾個(gè)()?A)1==1and2==1B)1==1or2!=1C)1!=0and2==1D)"test"==1答案:ACD解析:[多選題]70.數(shù)據(jù)使用環(huán)節(jié)主要內(nèi)容包括()。A)落實(shí)公司業(yè)務(wù)授權(quán)及賬號(hào)權(quán)限管理要求,合理分配數(shù)據(jù)訪問(wèn)權(quán)限,強(qiáng)化數(shù)據(jù)訪問(wèn)控制B)排查整改業(yè)務(wù)邏輯缺陷和漏洞,防止失泄密事件C)加快數(shù)據(jù)脫敏等用戶敏感數(shù)據(jù)保護(hù)措施建設(shè)D)健全數(shù)據(jù)安全日志審計(jì)、監(jiān)測(cè)預(yù)警、態(tài)勢(shì)感知機(jī)制答案:ABCD解析:[多選題]71.數(shù)據(jù)科學(xué)的基本流程主要包括()A)數(shù)據(jù)化,即獲取零次數(shù)據(jù)B)數(shù)據(jù)加工,且將3C精神融入其中C)驗(yàn)證性分析,且事先提出假設(shè)D)數(shù)據(jù)產(chǎn)品的提供,且僅提供最終產(chǎn)品答案:AB解析:[多選題]72.大數(shù)據(jù)計(jì)算框架Flink的支持以下哪些資源調(diào)度方式?A)MesosB)DockerC)YARND)Standalone答案:ACD解析:[多選題]73.在st.rvs()函數(shù)中可以指定(__)。A)大小B)分布的形狀C)是否是整數(shù)D)縮放比例答案:ABCD解析:[多選題]74.Pandas的數(shù)據(jù)結(jié)構(gòu)有()A)SeriesB)DataFrameC)NumPyD)Vector答案:AB解析:[多選題]75.以下哪些分類方法不能避免樣本的不平衡問(wèn)題()A)KNNB)SVMC)BayesD)神經(jīng)網(wǎng)絡(luò)答案:BCD解析:[多選題]76.以下描述中屬于Analytics2.0的主要特點(diǎn)的是()。A)側(cè)重嵌入式分析B)重視非結(jié)構(gòu)化數(shù)據(jù)的分析C)以決策支持為主要目的D)注重解釋性分析和預(yù)測(cè)性分析答案:BCD解析:著名管理學(xué)家Thomas·H·Davernport于2013年在《哈佛商業(yè)論壇(HarvardBusinessReview)》上發(fā)表一篇題為《第三代分析學(xué)(Analytics3.0)》的論文,將數(shù)據(jù)分析的方法、技術(shù)和工具--分析學(xué)(Analytics)分為三個(gè)不同時(shí)代--商務(wù)智能時(shí)代、大數(shù)據(jù)時(shí)代和數(shù)據(jù)富足供給時(shí)代,即Analytics1.0、Analytics2.0和Analytics3.0。其中,Analytics2.0的主要特點(diǎn)有分析活動(dòng)與數(shù)據(jù)的生成幾乎同步,強(qiáng)調(diào)數(shù)據(jù)分析的實(shí)時(shí)性;重視非結(jié)構(gòu)化數(shù)據(jù)的分析;以決策支持為主要目的;注重解釋性分析和預(yù)測(cè)性分析。[多選題]77.下列關(guān)于AUC面積的描述,正確的是()。A)AUC被定義為ROC曲線下與坐標(biāo)軸圍成的面積B)AUC面積的值大于1C)AUC等于0.5時(shí),則真實(shí)性最低,無(wú)應(yīng)用價(jià)值D)AUC越接近1.0,檢測(cè)方法真實(shí)性越高答案:ACD解析:AUC面積的值小于等于1。第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.已知x='a234b123c',并且re模塊已導(dǎo)入,則表達(dá)式reA)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]79.多行或多列中存在多個(gè)最大值或最小值時(shí),idxmax()與idxmin()返回匹配到值的所有Index。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]80.正則表達(dá)式元字符?^?一般用來(lái)表示從字符串開(kāi)始處進(jìn)行匹配,用在一對(duì)方括號(hào)中的時(shí)候則表示反向匹配,不匹配方括號(hào)中的字符A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]81.在關(guān)聯(lián)兩個(gè)表時(shí),連接是指將兩個(gè)表橫向合并,即連接結(jié)果由第一個(gè)表的列和第二個(gè)表的列共同組成。()A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]82.數(shù)據(jù)挖掘的日的是發(fā)現(xiàn)數(shù)據(jù)集中的模式或規(guī)律,數(shù)據(jù)挖掘有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)兩種方式。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.計(jì)算機(jī)在人工管理階段沒(méi)有操作系統(tǒng)和管理數(shù)據(jù)的軟件。--A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.Pandas所有數(shù)據(jù)結(jié)構(gòu)的值都是可變的,但數(shù)據(jù)結(jié)構(gòu)的大小并非都是可變的,比如,Series的長(zhǎng)度不可改變,但DataFrame里就可以插入列。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]85.匿名用戶表示登錄MySQL服務(wù)器時(shí)不需要輸入用戶名和密碼。--A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]86.一張數(shù)據(jù)表中最多只允許包含一個(gè)主鍵約束。--A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]87.DSS主要是基于數(shù)據(jù)倉(cāng)庫(kù).聯(lián)機(jī)數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)的應(yīng)用A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]88.邏輯或的操作數(shù)中只要有一個(gè)為真,則結(jié)果就為真。--A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]89.使用pickle進(jìn)行序列化得到的二進(jìn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)老院入住老人突發(fā)疾病應(yīng)急處理制度
- 企業(yè)質(zhì)量管理體系制度
- 2025年臨汾市體育運(yùn)動(dòng)學(xué)校招聘考試真題
- 變壓器線圈制造工安全應(yīng)急評(píng)優(yōu)考核試卷含答案
- 鋁電解操作工復(fù)試模擬考核試卷含答案
- 我國(guó)上市公司社會(huì)責(zé)任報(bào)告質(zhì)量評(píng)價(jià):體系構(gòu)建與實(shí)證分析
- 我國(guó)上市公司技術(shù)創(chuàng)新的雙輪驅(qū)動(dòng):股票流動(dòng)性與股權(quán)集中度的協(xié)同效應(yīng)
- 我國(guó)上市公司定向增發(fā)股價(jià)效應(yīng)及其影響因素:基于多維度視角的剖析
- 我國(guó)上市公司內(nèi)部治理與公司競(jìng)爭(zhēng)力關(guān)系的實(shí)證剖析:基于多維度視角
- 橋梁工崗前技術(shù)應(yīng)用考核試卷含答案
- 宗族團(tuán)年活動(dòng)方案
- 2025至2030中國(guó)碳納米管行業(yè)市場(chǎng)發(fā)展分析及風(fēng)險(xiǎn)與對(duì)策報(bào)告
- 車企核心用戶(KOC)分層運(yùn)營(yíng)指南
- 兒童課件小學(xué)生講繪本成語(yǔ)故事《69狐假虎威》課件
- 湖北中煙2025年招聘綜合測(cè)試
- 不銹鋼管道酸洗鈍化方案
- 2025年高考時(shí)事政治高頻考點(diǎn)(107條)
- O2O商業(yè)模式研究-全面剖析
- 企業(yè)成本管理分析
- ISO14001-2015環(huán)境管理體系風(fēng)險(xiǎn)和機(jī)遇識(shí)別評(píng)價(jià)分析及應(yīng)對(duì)措施表(包含氣候變化)
- 2024-2025學(xué)年山西省太原市高一上冊(cè)期末數(shù)學(xué)檢測(cè)試題(附解析)
評(píng)論
0/150
提交評(píng)論