版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試卷科目:大數(shù)據(jù)CDA考試大數(shù)據(jù)CDA考試(習(xí)題卷2)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)CDA考試第1部分:?jiǎn)雾?xiàng)選擇題,共47題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.下列國家的大數(shù)據(jù)發(fā)展行動(dòng)中,集中體現(xiàn)?重視基礎(chǔ)、首都先行?的國家是(1。A)美國B)日本C)中國D)韓國答案:D解析:[單選題]2.YARN中設(shè)置隊(duì)列Queue的最大使用資源里,需要配置哪個(gè)參數(shù)?A)yarn.scheduler.capacity.root.QueueA.user-limit-factorB)yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC)yarn.scheduler.capacity.root.QueueA.stateD)yarn.scheduler.capacity.root.QueueA.maxirnum-capacity答案:D解析:[單選題]3.對(duì)于不平穩(wěn)的序列,如果仍想進(jìn)行時(shí)間序列分析,我們可以()A)差分B)微分C)積分D)不能使用答案:A解析:如果序列本身是非平穩(wěn)的,通常我們有兩種處理方式,一是進(jìn)行差分,二是進(jìn)行對(duì)數(shù)變換。[單選題]4.某公司的總會(huì)計(jì)師決定用決策模型應(yīng)對(duì)不確定性問題。目前,公司有兩種方案可供選擇,與另一跨國公司聯(lián)合投資或不聯(lián)合投資??倳?huì)計(jì)師提供了以下信息:方案1:聯(lián)合投資的結(jié)果和概率:成功概率為60%,投資成本為1200萬元,投資成功的現(xiàn)金流為2000萬元,投資不成功的現(xiàn)金流為200萬元,其他成本為0元,至此時(shí)已發(fā)生的成本為120萬元。方案2:不聯(lián)合投資的結(jié)果和概率;至此時(shí)已發(fā)生的成本為120萬元,其他成本為500000元。下列哪項(xiàng)分別正確地反映了聯(lián)合投資與不聯(lián)合投資的期望值?0A)800000元和-1700000元B)-700000元和-500000元C)800000元和-500000元D)-700000元和-1700000元答案:C解析:[單選題]5.萬維網(wǎng)之父是()。A)彼得·德魯克B)舍恩伯格C)蒂姆·伯納斯-李D)斯科特·布朗答案:A解析:[單選題]6.實(shí)際應(yīng)用中,關(guān)于主成分?jǐn)?shù)量K的取值,下列說法錯(cuò)誤的是()A)可以基于碎石圖進(jìn)行判斷B)特征根從大到小排序,通常要求前K個(gè)特征根都大于1C)通常要求K個(gè)主成分的累積方差比超過80%D)各個(gè)主成分之間的方向夾角需要盡可能的小答案:D解析:主成分?jǐn)?shù)量的選取可以依賴于碎石圖,也需要特征根大于1,并累積方差超過80%(通常)。但是各個(gè)主成分需要是正交的,即方向是垂直的。[單選題]7.Flink的數(shù)據(jù)轉(zhuǎn)換操作在以下哪些環(huán)節(jié)中完成()?A)channelB)TransformationC)sinkD)source答案:B解析:[單選題]8.在fusionlnsigh產(chǎn)品中關(guān)于kafka的topic.以下描述不正確的層A)topic的partition數(shù)量可以創(chuàng)建時(shí)配置B)每個(gè)topic只能被分成一個(gè)partition區(qū)C)每條發(fā)布到kafka的消息都有一個(gè)類別,這個(gè)類別被稱為topic.也可以理解為一個(gè)存儲(chǔ)消息的隊(duì)列D)每個(gè)partition在存儲(chǔ)層面對(duì)應(yīng)一個(gè)10g文件,10g文件中記錄了所有的消息數(shù)據(jù)答案:B解析:[單選題]9.使用SQLAIchemy完成指定規(guī)則過濾記錄的方法是A)filter()B)group0C)limit(D)order_by(答案:A解析:[單選題]10.分類算法就是按照某種標(biāo)準(zhǔn)給對(duì)象貼標(biāo)簽,再根據(jù)標(biāo)簽來歸類,以下屬于分類算法的是【)。A)DBSCANB)C4.5C)K-MeanD)EM答案:B解析:[單選題]11.下面的數(shù)據(jù)是一家電商企業(yè)的網(wǎng)頁瀏覽量與銷售量之間的相關(guān)性描述,根據(jù)表格信息,下列選項(xiàng)中正確的是()A)提高瀏覽量是提高銷售量的直接原因B)瀏覽量與銷售量存在顯著相關(guān)性C)瀏覽量每增加1個(gè)單位,銷售量增加0.008個(gè)單位D)提高銷售量是提高瀏覽量的直接原因答案:B解析:P值很小,所以很顯著。關(guān)系不等于因果。[單選題]12.偏自相關(guān)函數(shù)ACF在n階之后迅速趨近于零,我們稱ACF具有n階()A)長(zhǎng)尾性B)短尾性C)截尾性D)拖尾性答案:C解析:如果偏自相關(guān)函數(shù)ACF在n階之后迅速趨近于零,我們稱ACF具有n階截尾性。[單選題]13.已知a={a,b,d)是滿足最小支持度的頻繁項(xiàng)集,若不考慮置信度,由a可產(chǎn)生關(guān)聯(lián)規(guī)則的數(shù)量為()。A)3B)4C)5D)6答案:D解析:[單選題]14.以下關(guān)于Zookeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請(qǐng)求后的讀寫流程說法正確的是?A)僅寫入內(nèi)存B)同時(shí)寫入磁盤和內(nèi)存C)先寫入內(nèi)存再寫入磁盤D)先寫磁盤再寫內(nèi)存答案:D解析:[單選題]15.()盒須圖()中,Q1到其最近的內(nèi)限距離為()。A)IQRB)1、5IQRC)0、5D)0、75答案:B解析:根據(jù)定義。[單選題]16.以下關(guān)于Flink關(guān)鍵特性描述不正確的是?A)Sparkstreaming與Flink相比,時(shí)延更低B)F1ink流式處理引擎能夠同時(shí)提供支持流處理和批處理應(yīng)用的功能C)與FusioninghtHD中的Streaming相比,Flink具有更高的吞吐量D)checkpoint實(shí)現(xiàn)了Flink的容錯(cuò)答案:A解析:[單選題]17.在Fusioninsight產(chǎn)品中,關(guān)于創(chuàng)建Kafka的Topic,以下哪些描述是正確的?A)在創(chuàng)建Kafka的Topic時(shí),必須設(shè)置Partition個(gè)數(shù)B)在創(chuàng)建Kafka的topic時(shí),必須設(shè)置Partition副本個(gè)數(shù)C)設(shè)置多副本可以增強(qiáng)Kafka服務(wù)的容災(zāi)能力D)以上全都正確答案:C解析:[單選題]18.Javaapplication中的主類需包含main方法,main方法的返回類型是什么?A)intB)floatC)doubleD)void答案:D解析:[單選題]19.以下更新HBase表中數(shù)據(jù)的語法,輸寫正確的是()。A)updateuser.xiaoming'setinfo.age=1B)update'users','xiaoming'info,age','29C)putusers'xiaoming',infoageD)put'users','xiaoming''infoage','29答案:D解析:[單選題]20.馬斯洛需求理論將人的需求從低到高依次排序是()。A)生理需求安全需求社交需求自我實(shí)現(xiàn)需求尊重需求B)生理需求安全需求尊重需求社交需求自我實(shí)現(xiàn)需求C)安全需求生理需求尊重需求自我實(shí)現(xiàn)需求社交需求D)生理需求安全需求社交需求尊重需求自我實(shí)現(xiàn)需求答案:D解析:[單選題]21.以下有關(guān)聚類算法中K-means和DBSCAN說法錯(cuò)誤的是()。A)K均值會(huì)丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCAN一般聚類所有對(duì)象。B)K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。C)K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀的簇。D)K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會(huì)合并有重疊的簇答案:A解析:[單選題]22.對(duì)下列情況的總體、總體參數(shù)描述正確的是()?①你在A保險(xiǎn)公司工作,公司要求你確定在追尾車禍?zhǔn)鹿手?,?duì)受害者賠付的平均金額。這時(shí)候的總體包含所有追尾事故的已經(jīng)拿到保險(xiǎn)金的受害者。相關(guān)的總體參數(shù)是對(duì)受害者賠付的平均金額。②當(dāng)你被B快餐廳錄用,確定每月用于炸薯?xiàng)l的土豆的用量。這時(shí)候的總體包括每月送來的用于炸薯?xiàng)l的土豆重量。相關(guān)的總體參數(shù)是每月送來的土豆的平均重量,以及其重量的差異。③你是C公司下屬的商業(yè)記者,正在調(diào)查一種抗癌新藥對(duì)兒童骨癌治療是否有效。這時(shí)候的總體包含所有兒童骨癌病人。其中重要的總體參數(shù)是沒有用新藥治療就痊愈的兒童百分比及用新藥治療后痊愈的兒童百分比。A)①②③B)①②C)①③D)②③答案:A解析:[單選題]23.如果對(duì)HBase表的添加數(shù)據(jù)記錄,可以使用()命令進(jìn)行操作。A)createB)getC)putD)scan答案:C解析:[單選題]24.以下哪個(gè)是分布式計(jì)算框架?A)HDFSB)SparkC)HBaseD)MLlib答案:B解析:[單選題]25.下面對(duì)Streaming中基礎(chǔ)概念說法不正確的是()?A)Topology是streaming中運(yùn)行的一個(gè)實(shí)時(shí)應(yīng)用程序B)Nimbus負(fù)責(zé)資源分配和任務(wù)調(diào)度C)Spout是在一個(gè)topology中接受數(shù)據(jù)然后執(zhí)行處理的組件D)Worker運(yùn)行具體處理組件邏輯的進(jìn)程答案:C解析:[單選題]26.對(duì)于HDFS的組成描述正確的是()。A)HDFS的文件系統(tǒng)主分為管理節(jié)點(diǎn)和工作節(jié)點(diǎn)。B)NameNode管理元數(shù)據(jù)信息C)DataNode保存真正的數(shù)據(jù)。D)DataNode保存真正的數(shù)據(jù)。答案:D解析:[單選題]27.編譯Java程序的命令是:A)appletviewerB)javacC)javaD)javadoc答案:B解析:[單選題]28.在Spark生態(tài)組件中,那個(gè)產(chǎn)品可用于復(fù)雜的批量數(shù)據(jù)處理。()A)SparkCoreB)SparkSqlC)SparkStreamingD)MLlib答案:A解析:[單選題]29.在Java中,一個(gè)類可同時(shí)定義許多同名的方法,這些方法的形式參個(gè)數(shù)、類型或順序各不相同,傳回的值也可以不相同。這種面向?qū)ο蟪绦虻奶匦苑Q為A)隱藏B)覆蓋C)重載D)Java不支持此特性答案:C解析:[單選題]30.Hadoop中MapReduce組件擅長(zhǎng)處理哪種場(chǎng)景的計(jì)算任務(wù)?A)迭代計(jì)算B)離線計(jì)算C)實(shí)時(shí)交互計(jì)算D)流式計(jì)算答案:B解析:[單選題]31.Hbase的Region是由個(gè)服務(wù)進(jìn)程來管理的?()A)HRegionserverB)ZookeeperC)HMasterD)DataNode答案:A解析:[單選題]32.ZooKeeper特點(diǎn)包括(】。A)最終一致性B)可靠性C)實(shí)時(shí)性D)實(shí)時(shí)性答案:D解析:[單選題]33.Java中關(guān)于父子類描述正確的是A)一個(gè)子類可以有多個(gè)父類,一個(gè)父類也可以有多個(gè)子類B)一個(gè)子類可以有多個(gè)父類,但一個(gè)父類只可以有一個(gè)子類C)一個(gè)子類可以有一個(gè)父類,但一個(gè)父類可以有多個(gè)子類D)上述說法都不對(duì)答案:C解析:[單選題]34.下列關(guān)于for循環(huán)和while循環(huán)的說法中哪個(gè)是正確的?()A)while循環(huán)能實(shí)現(xiàn)的操作,for循環(huán)也都能實(shí)現(xiàn)B)while循環(huán)判斷條件一般是程序結(jié)果,for循環(huán)判斷條件一般是非程序結(jié)果C)兩種循環(huán)任何時(shí)候都可替換D)兩種循環(huán)結(jié)構(gòu)中都必須有循環(huán)體,循環(huán)體不能為空答案:B解析:[單選題]35.以下哪些是制作條形圖時(shí)的錯(cuò)誤做法()。A)不要讓直條太窄,否則會(huì)讓讀者的視線集中在兩直條間大片的空白處,直條的寬度應(yīng)當(dāng)約為條間距的兩倍B)不要用太粗的網(wǎng)格線和三維透視圖,這樣會(huì)遮掩數(shù)據(jù)并轉(zhuǎn)移讀者對(duì)數(shù)據(jù)的注意力C)進(jìn)行比較時(shí),不要用刻度線和網(wǎng)格線,這樣會(huì)使水平直條的相對(duì)長(zhǎng)度更加難以辨別D)直條應(yīng)當(dāng)由最大值排到最小值,特定的直條可用不同的透明度予以強(qiáng)調(diào)。答案:D解析:[單選題]36.下列哪一項(xiàng)方法對(duì)于發(fā)現(xiàn)異常值沒有幫助()A)均值加減標(biāo)準(zhǔn)差法B)百分分?jǐn)?shù)法C)聚類法D)梯度下降法答案:D解析:D是加速收斂的方法[單選題]37.在研究數(shù)據(jù)中,有一個(gè)變量?飲料類型?有4個(gè)水平?果汁?、?碳酸飲料?、?能量飲料?和?其他?,由于該變量的少量數(shù)據(jù)缺失,那么缺失值用哪種填充方式會(huì)比較好?A)均值B)中位數(shù)C)眾數(shù)D)調(diào)和平均數(shù)答案:C解析:這是分類數(shù)據(jù),只能用?眾數(shù)?。[單選題]38.下列選項(xiàng)中,哪個(gè)是對(duì)分類器效果驗(yàn)證指標(biāo)中準(zhǔn)確率的正確表述。)A)預(yù)測(cè)為正的數(shù)據(jù)在總數(shù)據(jù)中的比例B)預(yù)測(cè)正確的數(shù)據(jù)在總數(shù)據(jù)中的比例C)預(yù)測(cè)為正的數(shù)據(jù)中實(shí)際為正的數(shù)據(jù)所占比例D)實(shí)際為正的數(shù)據(jù)中被預(yù)測(cè)為正的數(shù)據(jù)所占比例答案:C解析:[單選題]39.小王養(yǎng)了一頭豬和一只雞,一天,豬問雞:?主人去哪里了?,豬含淚答道:"去買粉條了?。雞很同情的說;?老弟,來世再見。?以上對(duì)話體現(xiàn)了數(shù)據(jù)分析方法中的()。A)關(guān)聯(lián)B)自然語言處理C)聚類D)文本挖掘答案:A解析:[單選題]40.關(guān)于中位數(shù)描述錯(cuò)誤的是()。A)在有極端數(shù)值出現(xiàn)時(shí),中位數(shù)作為分析現(xiàn)象中集中趨勢(shì)的數(shù)值,比平均數(shù)更有代表性B)主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)C)各變量值與中位數(shù)的離差絕對(duì)值之和最小D)中位數(shù)一般與算數(shù)平均值接近答案:D解析:[單選題]41.在下表中查詢員工人數(shù)大于1人的部門以及該部門的平均績(jī)效成績(jī)表名:績(jī)效成績(jī)A)selectB)selectC)selectD)select答案:C解析:本題考查groupby與having的用法,having作為查詢的限定條件后邊要使用聚合函數(shù),與groupby一起使用。A沒有按照部門分組,B的having后邊沒有跟聚合函數(shù),D用where限定條件,后邊不能跟聚合函數(shù)。所以正確答案為C。[單選題]42.以下哪類數(shù)據(jù)不屬于半結(jié)構(gòu)化數(shù)據(jù)?A)HTMLB)XMLC)二維表D)JSON答案:C解析:[單選題]43.一個(gè)一元線性回歸模型的判定系數(shù)R2=0.8,那么下列解釋中錯(cuò)誤的是()A)因變量的變差中,有80%可以由自變量與因變量之間的線性關(guān)系來解釋B)在因變量的變動(dòng)中,有80%是由自變量所決定的C)自變量與因變量之間有著較強(qiáng)的線性關(guān)系D)在訓(xùn)練集中,因變量的估計(jì)精度上限為80%答案:D解析:根據(jù)判定系數(shù)的定義。[單選題]44.如果我們現(xiàn)有一個(gè)安裝2.6.5版本的hadoop集群,在不修改默認(rèn)配置的情況下存儲(chǔ)200個(gè)每個(gè)200M的文本文件,請(qǐng)問最終會(huì)在集群中產(chǎn)生多少個(gè)數(shù)據(jù)塊(包括副本)A)200B)40000C)400D)1200答案:D解析:[單選題]45.在以下語句中,哪個(gè)語句可以用來查詢<績(jī)效成績(jī)>表中?員工id?字段以?b?開頭的記錄A)selectB)selectC)selectD)select答案:B解析:本題考查SQL語句中正則表達(dá)式的使用方法。A與C沒有使用regexp關(guān)鍵字,D使用的模式字符?.?代表字符串中的任意一個(gè)字符而非匹配字符串開始的部分,所以只有B能夠正確查詢以?b?開頭的記錄,所以答案為B。[單選題]46.以下哪項(xiàng)不是描述數(shù)據(jù)離散趨勢(shì)的常見指標(biāo)。)A)極差B)都是C)四分位數(shù)間距D)變異系數(shù)答案:B解析:[單選題]47.在對(duì)某個(gè)多元線性回歸模型的分析中,如果某自變量的VIF=1,這說明()A)此自變量與因變量不存在線性相關(guān)性B)此自變量與其他自變量不存在線性相關(guān)性C)此模型存在非常嚴(yán)重的共線性D)此多元回歸模型的R2=0答案:B解析:VIF是共線性檢驗(yàn)指標(biāo),最小為1。注意此題的D選項(xiàng)為干擾選項(xiàng),VIF值的計(jì)算公式中的R2不是指模型本身的R2。第2部分:多項(xiàng)選擇題,共29題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]48.數(shù)據(jù)分析級(jí)別包括以下哪幾種()A)即席查詢B)多維分析(又稱為鉆取或者OLAP)C)統(tǒng)計(jì)分析與警報(bào)D)與業(yè)務(wù)人員協(xié)商知識(shí)點(diǎn)答案:ABC解析:考察數(shù)據(jù)分析的八個(gè)層次,需要在理解的基礎(chǔ)上加以記憶。[多選題]49.常用的數(shù)據(jù)挖掘編程工具有()。A)SASB)StataC)MatLaBD)R答案:ABCD解析:[多選題]50.可向頂點(diǎn)著色器(VertexShader)傳遞數(shù)據(jù)的方式?A)uniform變量B)attribute變量C)varying變量D)vertex變量答案:ABCD解析:[多選題]51.Hadoop通過ResourceManager對(duì)集群資源進(jìn)行管理,它的主要功能有?A)集群資源調(diào)度B)應(yīng)用程序管理C)集群資源管理D)日志管理答案:ABC解析:[多選題]52.數(shù)據(jù)再利用的意義在于()。A)挖掘數(shù)據(jù)的潛在價(jià)值B)實(shí)現(xiàn)數(shù)據(jù)重組的創(chuàng)新價(jià)值C)利用數(shù)據(jù)可擴(kuò)展性拓寬業(yè)務(wù)領(lǐng)域D)優(yōu)化存儲(chǔ)設(shè)備,降低設(shè)備成本答案:ABC解析:[多選題]53.調(diào)用Zookeeper客戶端命委中包含哪些信息?A)Ip地址B)端口號(hào)C)服務(wù)器名稱D)用戶名答案:ABCD解析:[多選題]54.MapReduce與HBase的關(guān)系,哪些描述是正確的()。A)兩者不可或缺,MapReduce是HBase可以正常運(yùn)行的保證B)兩者不是強(qiáng)關(guān)聯(lián)關(guān)系,沒有MapReduce,HBase可以正常運(yùn)行C)MapReduce可以直接訪問HBaseD)它們之間沒有任何關(guān)系答案:BC解析:[多選題]55.MLlib可以實(shí)現(xiàn)哪些數(shù)據(jù)分析操作?A)分類B)回歸C)聚類D)降維答案:ABCD解析:[多選題]56.可以用于分類指標(biāo)呈現(xiàn)的方式有以下哪些。()A)混淆矩陣B)ROC曲線C)氣泡圖D)增益圖答案:ABD解析:[多選題]57.下面哪些概念是HBase框架中使用的?A)HDFSB)GridFSC)ZookeeperD)EXT3答案:AC解析:[多選題]58.以下哪些數(shù)據(jù)源可以通過Loader實(shí)現(xiàn)與FusionlnghtHD的數(shù)據(jù)交換?()A)NoSQLB)FTPServerC)SFTPServerD)MySQL答案:ABCD解析:[多選題]59.HFile數(shù)據(jù)格式中的KeyValue數(shù)據(jù)格式,下列選項(xiàng)描述正確的是()。A)是byte[]數(shù)組B)沒有固定的結(jié)構(gòu)C)數(shù)據(jù)的大小是定長(zhǎng)的D)有固定的結(jié)構(gòu)答案:AD解析:[多選題]60.Flume適用于以下哪些場(chǎng)景的數(shù)據(jù)收集?()A)Thrift,Avro,Syslog,Kafka等數(shù)據(jù)源上收集數(shù)據(jù)B)本地文件數(shù)據(jù)采集C)應(yīng)用系統(tǒng)產(chǎn)生的日志采集D)大量數(shù)據(jù)的實(shí)時(shí)數(shù)據(jù)采集答案:ABC解析:[多選題]61.下面哪個(gè)組件可以在Hadoop集群中代替MR一些計(jì)算?A)SparkB)SqoopC)HiveD)Avro答案:AC解析:[多選題]62.若在消息處理過程中允并部分信息丟失,關(guān)閉消息可靠性處理機(jī)制的方式有以下哪些?A)將參數(shù)Config.Topology_ACKKRS設(shè)置為0B)將參數(shù)Config.Topology_ACKKRS設(shè)置為FalseC)Spout發(fā)送消息時(shí),使用不指定消息messageid的接口進(jìn)行發(fā)D)Bolt發(fā)送消息時(shí)使用Unanchor方式發(fā)送答案:ACD解析:[多選題]63.隨機(jī)森林指的是利用多棵樹對(duì)樣本進(jìn)行訓(xùn)練并預(yù)測(cè)的一種分類器,以下針對(duì)隨機(jī)森林算法的表述,錯(cuò)誤的是()。A)隨機(jī)森林算法的分類精度會(huì)隨著決策樹數(shù)量的增加而提高。B)隨機(jī)森林算法對(duì)異常值和缺失值不敏感。C)隨機(jī)森林算法不需要考慮過擬合問題。D)決策樹之間相關(guān)系數(shù)越低、每棵決策樹分類精度越高的隨機(jī)森林模型的分類效果越好。答案:AC解析:[多選題]64.以下哪些是MatLab軟件的特點(diǎn)。()A)高效的數(shù)值計(jì)算及符號(hào)計(jì)算功能,能使用戶從繁雜的數(shù)學(xué)運(yùn)算分析中解脫出來B)具有完備的圖形處理功能實(shí)現(xiàn)計(jì)算結(jié)果和編程的可視化C)友好的用戶界面及接近數(shù)學(xué)表達(dá)式的自然化語言,使學(xué)者易于學(xué)習(xí)和掌握D)功能豐富的應(yīng)用工具箱(如信號(hào)處理工具箱、通信工具箱等),為用戶提供了大量方便實(shí)用的處理工具答案:ABCD解析:[多選題]65.以下關(guān)于對(duì)應(yīng)分析的表述,正確的是()A)對(duì)應(yīng)分析的實(shí)質(zhì)是通過降維投射,把列聯(lián)表中的信息在低維圖中進(jìn)行展示B)對(duì)應(yīng)分析是一種在主成分分析基礎(chǔ)上發(fā)展而來的多元統(tǒng)計(jì)分析方法C)對(duì)應(yīng)分析更關(guān)心行與列之間關(guān)系的發(fā)現(xiàn)D)在進(jìn)行對(duì)應(yīng)分析時(shí),一般情況下信息的保留程度不應(yīng)該低于80%答案:ABCD解析:[多選題]66.以下敘述正確的有()。A)兩變量獨(dú)立,兩者的皮爾森相關(guān)系數(shù)必然等于0B)兩變量皮爾森相關(guān)系數(shù)不等于0.兩者必然不獨(dú)立C)皮爾森相關(guān)系數(shù)是否等于零,不能指明兩變量是否獨(dú)立D)兩變量不獨(dú)立,兩者的皮爾森相關(guān)系數(shù)必然不等于0答案:AB解析:[多選題]67.以下選項(xiàng)中,屬于HDFS架構(gòu)關(guān)鍵特性的是?()A)HA高可靠性B)健壯機(jī)制C)元數(shù)據(jù)持久化機(jī)制D)多方式訪問機(jī)制答案:ABCD解析:[多選題]68.合并單元發(fā)送數(shù)據(jù)給間隔層設(shè)備同步原則()A)點(diǎn)對(duì)點(diǎn)-光纖直連-誰使用誰同步B)點(diǎn)對(duì)點(diǎn)-光纖直連-誰發(fā)送誰同步C)組網(wǎng)-經(jīng)過交換機(jī)-誰發(fā)送誰同步D)組網(wǎng)-經(jīng)過交換機(jī)-誰使用誰同步答案:AC解析:[多選題]69.審核回收的調(diào)研數(shù)據(jù)需要做以下哪些數(shù)據(jù)清洗。()A)補(bǔ)充缺失值B)剔除異常值C)剔除數(shù)據(jù)重復(fù)D)調(diào)整不一致的數(shù)據(jù)答案:ABCD解析:[多選題]70.常見的數(shù)據(jù)污染有(0A)數(shù)據(jù)不完整B)噪聲數(shù)據(jù)C)數(shù)據(jù)不一致D)數(shù)據(jù)冗余答案:ABC解析:[多選題]71.下列屬于描述性統(tǒng)計(jì)中集中趨勢(shì)度量的有()。A)均值B)眾數(shù)C)四分位差D)極差答案:AB解析:CD都是描述數(shù)據(jù)的離散程度[多選題]72.主成分分析中確定主成份個(gè)數(shù)是關(guān)鍵步驟,其大致原則包括()。A)特征根值大于B)特征根值大于0.8C)累積特征根值加總占總特征根值的80%以上D)累積特征根值加總占總特征根值的90%以上答案:AC解析:[多選題]73.以下算法中對(duì)缺失值不敏感的是()。A)Logistic回歸B)CART決策樹C)SVM算法D)樸素貝葉斯答案:BD解析:[多選題]74.下列關(guān)于臟數(shù)據(jù)的說法中,正確的是()A)格式不規(guī)范B)編碼不統(tǒng)C)意義不明確D)與實(shí)際業(yè)務(wù)關(guān)系不大答案:ABCD解析:[多選題]75.下面屬于遺傳算法的特點(diǎn)有()。A)求得全局最優(yōu)解B)算法并行化C)自適應(yīng)和自學(xué)習(xí)性D)對(duì)未來的預(yù)測(cè)答案:ABC解析:[多選題]76.Hive中的這條命令""SELECTa.salary,b.addressFROMemployeeaJOIN(SELECTaddressFROIemployeeinfowhereprovince=zhejiang)bONa:?"是個(gè)什么類型的操作?A)導(dǎo)入數(shù)據(jù)B)join查詢C)創(chuàng)建表D)子查詢答案:BD解析:第3部分:判斷題,共24題,請(qǐng)判斷題目是否正確。[判斷題]77.神經(jīng)網(wǎng)絡(luò)算法可以使權(quán)值收效到某個(gè)值,但并不保證具為誤差平面的全局最小值A(chǔ))正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]78.FP-growth算法是一種于分類預(yù)算方法。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]79.HDFS支持大文件存儲(chǔ),同時(shí)支持多個(gè)用戶對(duì)同一個(gè)文件的寫操作,以及在文件任意位置進(jìn)行修改A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]80.標(biāo)識(shí)符中的字母區(qū)分大小寫A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]81.落在置信區(qū)間外的點(diǎn)通常被認(rèn)為是離群點(diǎn)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]82.在Flask中定義路由時(shí),默認(rèn)監(jiān)聽的HTTP方式是GET()。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.在分類的過程中,用訓(xùn)練集訓(xùn)練數(shù)據(jù),再用訓(xùn)練集評(píng)估模型的性能,得出模型性能很好的結(jié)果,則分類模型構(gòu)建成功。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]84.Flume的數(shù)據(jù)流可以根據(jù)headers的信息發(fā)送到不同的channel中。()A)正確B)錯(cuò)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)老院入住老人突發(fā)疾病應(yīng)急處理制度
- 企業(yè)質(zhì)量管理體系制度
- 2025年臨汾市體育運(yùn)動(dòng)學(xué)校招聘考試真題
- 變壓器線圈制造工安全應(yīng)急評(píng)優(yōu)考核試卷含答案
- 鋁電解操作工復(fù)試模擬考核試卷含答案
- 我國上市公司社會(huì)責(zé)任報(bào)告質(zhì)量評(píng)價(jià):體系構(gòu)建與實(shí)證分析
- 我國上市公司技術(shù)創(chuàng)新的雙輪驅(qū)動(dòng):股票流動(dòng)性與股權(quán)集中度的協(xié)同效應(yīng)
- 我國上市公司定向增發(fā)股價(jià)效應(yīng)及其影響因素:基于多維度視角的剖析
- 我國上市公司內(nèi)部治理與公司競(jìng)爭(zhēng)力關(guān)系的實(shí)證剖析:基于多維度視角
- 橋梁工崗前技術(shù)應(yīng)用考核試卷含答案
- 宗族團(tuán)年活動(dòng)方案
- 2025至2030中國碳納米管行業(yè)市場(chǎng)發(fā)展分析及風(fēng)險(xiǎn)與對(duì)策報(bào)告
- 車企核心用戶(KOC)分層運(yùn)營指南
- 兒童課件小學(xué)生講繪本成語故事《69狐假虎威》課件
- 湖北中煙2025年招聘綜合測(cè)試
- 不銹鋼管道酸洗鈍化方案
- 2025年高考時(shí)事政治高頻考點(diǎn)(107條)
- O2O商業(yè)模式研究-全面剖析
- 企業(yè)成本管理分析
- ISO14001-2015環(huán)境管理體系風(fēng)險(xiǎn)和機(jī)遇識(shí)別評(píng)價(jià)分析及應(yīng)對(duì)措施表(包含氣候變化)
- 2024-2025學(xué)年山西省太原市高一上冊(cè)期末數(shù)學(xué)檢測(cè)試題(附解析)
評(píng)論
0/150
提交評(píng)論