版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
【MOOC】大數(shù)據(jù)技術(shù)導(dǎo)論-北京理工大學(xué)中國(guó)大學(xué)慕課MOOC答案第1章單元測(cè)驗(yàn)1、【單選題】大數(shù)據(jù)是一個(gè)什么領(lǐng)域的問(wèn)題()。本題答案:【多學(xué)科綜合領(lǐng)域】2、【單選題】科學(xué)研究第四范式數(shù)據(jù)思維采用()。本題答案:【關(guān)聯(lián)分析】3、【多選題】大數(shù)據(jù)的優(yōu)勢(shì)包括()。本題答案:【數(shù)據(jù)體量大#收集時(shí)間短#數(shù)據(jù)類(lèi)型豐富】4、【多選題】大數(shù)據(jù)處理框架之批處理框架()。本題答案:【hadoop#Spark#Flink】5、【多選題】大數(shù)據(jù)處理框架之流計(jì)算框架()。本題答案:【Sparkstreaming#Flink#STORM】6、【填空題】系統(tǒng)的控制方式一般分為模型驅(qū)動(dòng)和_____________。本題答案:【數(shù)據(jù)驅(qū)動(dòng)】7、【填空題】4V特征:數(shù)據(jù)規(guī)模大、_________、數(shù)據(jù)處理速度快、價(jià)值密度低。本題答案:【數(shù)據(jù)類(lèi)型多】8、【填空題】大數(shù)據(jù)的處理過(guò)程:數(shù)據(jù)獲取與管理、數(shù)據(jù)存儲(chǔ)與處理、數(shù)據(jù)分析與______、結(jié)合領(lǐng)域的大數(shù)據(jù)應(yīng)用。本題答案:【理解】9、【填空題】科學(xué)研究的第三范式計(jì)算思維-______。本題答案:【仿真模擬】10、【填空題】大數(shù)據(jù)領(lǐng)域的職業(yè)包括首席數(shù)據(jù)官、系統(tǒng)架構(gòu)師、___________、領(lǐng)域科學(xué)家。本題答案:【數(shù)據(jù)分析師】第2章單元測(cè)驗(yàn)1、【單選題】本題答案:【M1-M2-M5-M8-M6-M3-S7-S4】2、【單選題】下面科學(xué)研究的四個(gè)范式順序正確的是()。本題答案:【經(jīng)驗(yàn)范式-理論范式-模擬范式-數(shù)據(jù)密集型范式】3、【單選題】以數(shù)據(jù)考察為基礎(chǔ),聯(lián)合理論、實(shí)驗(yàn)和模擬一體的數(shù)據(jù)密集計(jì)算的范式是以下哪個(gè)范式()。本題答案:【數(shù)據(jù)密集型范式】4、【單選題】在大數(shù)據(jù)生命周期的各個(gè)階段中,工作最多的是哪個(gè)階段()。本題答案:【數(shù)據(jù)收集和整理】5、【單選題】在增量抽取方法中,需要計(jì)算MD5校驗(yàn)碼的是哪種增量抽取方法()。本題答案:【全表對(duì)比】6、【單選題】在網(wǎng)絡(luò)爬蟲(chóng)策略中需要根據(jù)鏈接計(jì)算網(wǎng)頁(yè)重要性的是以下哪個(gè)算法()。本題答案:【局部PageRank策略】7、【多選題】大數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)包括()。本題答案:【圖像#文本#語(yǔ)音#視頻】8、【多選題】大數(shù)據(jù)中的半結(jié)構(gòu)化數(shù)據(jù)包括()。本題答案:【電子郵件#XML#HTML】9、【多選題】常見(jiàn)的分布式網(wǎng)絡(luò)爬蟲(chóng)架構(gòu)有()。本題答案:【Master-slave#peer-peer#Mixed】10、【多選題】以下哪些內(nèi)容屬于深網(wǎng)內(nèi)容()。本題答案:【W(wǎng)eb上可訪問(wèn)的非網(wǎng)頁(yè)文件,比如圖片文件,Pdf和word文檔等#通過(guò)填寫(xiě)表單形成對(duì)后臺(tái)在線數(shù)據(jù)庫(kù)的查詢(xún)而得到的動(dòng)態(tài)頁(yè)面#需要注冊(cè)或其他限制才能訪問(wèn)的內(nèi)容】第3章單元測(cè)驗(yàn)1、【單選題】HBase依靠()存儲(chǔ)底層數(shù)據(jù)。本題答案:【HDFS】2、【單選題】下列選項(xiàng)中哪些不是NoSQL數(shù)據(jù)庫(kù)的特點(diǎn)()。本題答案:【動(dòng)態(tài)的數(shù)據(jù)遷移】3、【單選題】HDFS中文件塊默認(rèn)保存幾份()。本題答案:【3份】4、【單選題】下面與HDFS類(lèi)似的框架是()。本題答案:【GFS】5、【多選題】分布式文件系統(tǒng)改變了數(shù)據(jù)存儲(chǔ)和管理方式,相對(duì)于本地文件系統(tǒng)具有哪些優(yōu)勢(shì)()。本題答案:【低成本#易擴(kuò)展#強(qiáng)可靠#高可用】6、【多選題】下面對(duì)HBase的描述哪些是正確的()。本題答案:【是面向列的#是分布式的#是一種NoSQL數(shù)據(jù)庫(kù)】7、【多選題】Hadoop的框架最核心的設(shè)計(jì)是()。本題答案:【HDFS#MapReduce】8、【多選題】HBase的實(shí)現(xiàn)包括哪幾個(gè)主要的功能組件()。本題答案:【庫(kù)函數(shù)#一個(gè)Master主服務(wù)器#許多個(gè)Region服務(wù)器】9、【多選題】HDFS專(zhuān)為解決大數(shù)據(jù)存儲(chǔ)問(wèn)題而產(chǎn)生的,其具備了以下哪些特點(diǎn)()。本題答案:【兼容廉價(jià)的硬件設(shè)備#流數(shù)據(jù)讀寫(xiě)#大數(shù)據(jù)集#強(qiáng)大的跨平臺(tái)兼容性】10、【多選題】NoSQL數(shù)據(jù)庫(kù)的明顯優(yōu)勢(shì)在于()。本題答案:【支持超大規(guī)模數(shù)據(jù)存儲(chǔ)#靈活的數(shù)據(jù)模型可以很好的支持Web2.0應(yīng)用#具有強(qiáng)大的橫向擴(kuò)展能力】第4章單元測(cè)驗(yàn)1、【單選題】大數(shù)據(jù)可視化分析有效融合計(jì)算機(jī)的______和人的_____,以獲得對(duì)于大規(guī)模復(fù)雜數(shù)據(jù)集的洞察力。本題答案:【計(jì)算能力、認(rèn)知能力】2、【單選題】下列關(guān)于數(shù)據(jù)可視化的介紹,不正確的是()。本題答案:【雷達(dá)圖不適用于多維數(shù)據(jù)?!?、【單選題】以下哪個(gè)不是數(shù)據(jù)可視化方法和技術(shù)?本題答案:【混合建模技術(shù)】4、【多選題】關(guān)于數(shù)據(jù)挖掘任務(wù),下列說(shuō)法正確的是()本題答案:【聚類(lèi)是描述性任務(wù)。#分類(lèi)屬于預(yù)測(cè)性任務(wù)#聚類(lèi)屬于無(wú)監(jiān)督范疇?!?、【多選題】下列可以用于多維數(shù)據(jù)可視化的方法有()本題答案:【平行坐標(biāo)系#雷達(dá)圖#散點(diǎn)圖矩陣】6、【多選題】設(shè)X是非空集合,對(duì)于X中任意的兩個(gè)元素x與y,按某一法則都對(duì)應(yīng)唯一的實(shí)數(shù)d(x,y),而且滿(mǎn)足下述()性質(zhì),則稱(chēng)d(x,y)為x與y的距離。本題答案:【非負(fù)性d(x,y)≥0#Bd(x,y)=d(y,x)#對(duì)于任意的x,y,z∈X,有d(x,y)≤d(x,z)+d(z,y)】7、【多選題】以下哪些是數(shù)據(jù)可視化的作用()本題答案:【協(xié)助思考#探索數(shù)據(jù)#作為大量工作記憶的外界輔助#理解信息】8、【判斷題】預(yù)測(cè)任務(wù)的目標(biāo)是導(dǎo)出和概括數(shù)據(jù)中有潛在聯(lián)系的模式(相關(guān)、趨勢(shì)、聚類(lèi)、軌跡和異常)本題答案:【錯(cuò)誤】9、【判斷題】文本是大數(shù)據(jù)時(shí)代結(jié)構(gòu)數(shù)據(jù)類(lèi)型的典型代表。本題答案:【錯(cuò)誤】10、【判斷題】PCA是一種有監(jiān)督的降維方法。本題答案:【錯(cuò)誤】11、【判斷題】Textflow用河流的運(yùn)動(dòng)表達(dá)了文本主題的誕生、發(fā)展、合并、分裂、消亡的過(guò)程。導(dǎo)致主題演變的原因往往是主題關(guān)鍵詞的變化。本題答案:【正確】12、【判斷題】聚類(lèi)是在沒(méi)有先驗(yàn)知識(shí)的情況下進(jìn)行的。本題答案:【正確】13、【填空題】將收入在范圍$12,000至$98,000內(nèi)的收入規(guī)范化到區(qū)間[0.0,1.0],$73,600將被規(guī)范為:(保留兩位小數(shù))本題答案:【0.72】14、【填空題】?jī)蓚€(gè)向量的方向差異可以表示為兩個(gè)向量夾角的。本題答案:【余弦】15、【填空題】圖的簡(jiǎn)化中,技術(shù)會(huì)將相似形狀的邊連接線集中在一起構(gòu)成約束,降低視覺(jué)復(fù)雜度,使節(jié)點(diǎn)間的連接關(guān)系更加清楚。本題答案:【邊邦定】第5章單元測(cè)驗(yàn)1、【單選題】在Spark運(yùn)行時(shí),()為程序構(gòu)建基本運(yùn)行環(huán)境Sparkcontext對(duì)象(應(yīng)用管家),向資源管理器進(jìn)行資源申請(qǐng),任務(wù)分配與監(jiān)控。本題答案:【Driverprogram】2、【單選題】Spark的組件中,用于做查詢(xún)分析的是()。本題答案:【SparkSQL】3、【多選題】以下屬于Spark的特點(diǎn)的有()。本題答案:【Speed#Concise#In-memoryprocessing#LazyEvaluation】4、【多選題】MapReduce執(zhí)行的全過(guò)程包括以下幾個(gè)主要階段()。本題答案:【從分布式文件系統(tǒng)讀入數(shù)據(jù)#執(zhí)行Map任務(wù)輸出中間結(jié)果#通過(guò)Shuffle階段把中間結(jié)果分區(qū)排序整理后發(fā)送給Reduce任務(wù)#執(zhí)行Reduce任務(wù)得到最終結(jié)果并寫(xiě)入分布式系統(tǒng)文件】5、【多選題】RDD的兩種主要操作類(lèi)型是()。本題答案:【Transform#Action】6、【多選題】關(guān)于RDD論述正確的是()。本題答案:【RDD提供一種高度受限的共享內(nèi)存模型,是一個(gè)彈性分布式數(shù)據(jù)集#RDD是只讀存儲(chǔ)】7、【多選題】Spark支持的開(kāi)發(fā)語(yǔ)言有()。本題答案:【Java#Python#Scala】8、【多選題】Apache軟件基金會(huì)最重要的三大分布式計(jì)算系統(tǒng)開(kāi)源項(xiàng)目包括()。本題答案:【Hadoop#Spark#Storm】9、【判斷題】Shuffle過(guò)程分為Map端的操作和Reduce端的操作。()本題答案:【正確】10、【判斷題】Hadoop擅長(zhǎng)批處理,不適合流計(jì)算。()本題答案:【正確】11、【判斷題】MapReduce設(shè)計(jì)的一個(gè)理念是“數(shù)據(jù)向計(jì)算靠攏”,并采用“分而治之”的策略。()本題答案:【錯(cuò)誤】12、【判斷題】Shuffle過(guò)程是指對(duì)Map輸出結(jié)果進(jìn)行分區(qū)、排序、合并等處理并交給Reduce的過(guò)程。()本題答案:【正確】第六章習(xí)題1、【單選題】數(shù)據(jù)匿名化的原因有哪些本題答案:【實(shí)現(xiàn)數(shù)據(jù)共享發(fā)布,而不泄漏用戶(hù)的隱私】2、【多選題】下列哪些信息可能會(huì)侵犯用戶(hù)的隱私本題答案:【搜索引擎的搜索記錄#瀏覽器的訪問(wèn)痕跡#電商平臺(tái)的購(gòu)物記錄#地圖應(yīng)用的搜索記錄】3、【多選題】下列哪些方法可以實(shí)現(xiàn)匿名化本題答案:【元組抑制#屬性泛化#屬性置換#屬性擾亂】4、【多選題】關(guān)于隱私保護(hù)技術(shù),以下描述正確的包括本題答案:【K-匿名的局限性是容易遭受同質(zhì)性攻擊#L-多樣性的局限性是容易遭受相似性攻擊#T-相近比K-匿名和L-多樣性有更強(qiáng)的隱私保護(hù)性能#K-匿名無(wú)法保證敏感值缺乏多樣性】5、【多選題】計(jì)算k-匿名的算法分類(lèi)包括本題答案:【基于泛化和基于元組抑制的算法#基于全局和基于局部記錄的算法#基于層次和基于劃分的算法】6、【判斷題】K-匿名規(guī)則滿(mǎn)足子集屬性和泛化屬性本題答案:【正確】7、【判斷題】蒙德里安算法是一種基于劃分的算法本題答案:【正確】8、【判斷題】極小全域泛化的集合構(gòu)成一個(gè)反鏈本題答案:【正確】9、【判斷題】熵l-多樣性滿(mǎn)足子集屬性和泛化屬性本題答案:【正確】10、【判斷題】遞歸(c,l)-多樣性不滿(mǎn)足泛化屬性本題答案:【錯(cuò)誤】第6章單元測(cè)驗(yàn)1、【單選題】數(shù)據(jù)匿名化的原因有哪些本題答案:【實(shí)現(xiàn)數(shù)據(jù)共享發(fā)布,而不泄漏用戶(hù)的隱私】2、【多選題】下列哪些信息可能會(huì)侵犯用戶(hù)的隱私本題答案:【搜索引擎的搜索記錄#瀏覽器的訪問(wèn)痕跡#電商平臺(tái)的購(gòu)物記錄#地圖應(yīng)用的搜索記錄】3、【多選題】下列哪些方法可以實(shí)現(xiàn)匿名化本題答案:【元組抑制#屬性泛化#屬性置換#屬性擾亂】4、【多選題】關(guān)于隱私保護(hù)技術(shù),以下描述正確的包括本題答案:【K-匿名的局限性是容易遭受同質(zhì)性攻擊#L-多樣性的局限性是容易遭受相似性攻擊#T-相近比K-匿名和L-多樣性有更強(qiáng)的隱私保護(hù)性能#K-匿名無(wú)法保證敏感值缺乏多樣性】5、【多選題】計(jì)算k-匿名的算法分類(lèi)包括本題答案:【基于泛化和基于元組抑制的算法#基于全局和基于局部記錄的算法#基于層次和基于劃分的算法】6、【判斷題】K-匿名規(guī)則滿(mǎn)足子集屬性和泛化屬性本題答案:【正確】7、【判斷題】蒙德里安算法是一種基于劃分的算法本題答案:【正確】8、【判斷題】極小全域泛化的集合構(gòu)成一個(gè)反鏈本題答案:【正確】9、【判斷題】熵l-多樣性滿(mǎn)足子集屬性和泛化屬性本題答案:【正確】10、【判斷題】遞歸(c,l)-多樣性不滿(mǎn)足泛化屬性本題答案:【錯(cuò)誤】第7章單元測(cè)驗(yàn)1、【單選題】在“看不見(jiàn)的動(dòng)機(jī)中”由于數(shù)據(jù)使用者和數(shù)據(jù)生成機(jī)構(gòu)都是()的生產(chǎn)大數(shù)據(jù),忽略了人們行為背后趨利避害的動(dòng)機(jī)的大數(shù)據(jù)統(tǒng)計(jì)分析。本題答案:【無(wú)意識(shí)】2、【多選題】小數(shù)據(jù)強(qiáng)調(diào)采樣,精確以及因果關(guān)系,大數(shù)據(jù)強(qiáng)調(diào)()。本題答案:【全樣#非精確#相關(guān)關(guān)系】3、【多選題】大數(shù)據(jù)面臨的挑戰(zhàn)包括()。本題答案:【大數(shù)據(jù)自大#算法演化#看不見(jiàn)的動(dòng)機(jī)】4、【填空題】數(shù)據(jù)收集過(guò)程的性質(zhì)發(fā)生了變化,大數(shù)據(jù)不再只是被動(dòng)記錄使用者的決策,而是通過(guò)______,積極參與到使用者的行為決策中。本題答案:【算法演化】5、【填空題】夜光遙感挖掘是通過(guò)在遙感圖像中提取________數(shù)據(jù)進(jìn)行繪制和分析。本題答案:【燈光】6、【填空題】“大數(shù)據(jù)自大(bigdatahubris)”的傾向,即認(rèn)為_(kāi)______,這里的關(guān)鍵是,企業(yè)或者機(jī)構(gòu)擁有的這個(gè)稱(chēng)為總體的數(shù)據(jù)和研究問(wèn)題關(guān)心的總體是否相同.本題答案:【自己擁有的數(shù)據(jù)是總體】7、【填空題】在大數(shù)據(jù)分析中只關(guān)心________而不關(guān)注因果關(guān)系。本題答案:【相關(guān)關(guān)系】8、【填空題】熱力圖是通過(guò)__________數(shù)據(jù)進(jìn)行繪制和分析。本題答案:【位置】9、【填空題】谷歌通過(guò)__________來(lái)預(yù)測(cè)流感發(fā)病率。本題答案:【搜索關(guān)鍵詞】10、【填空題】_______未卜先知的故事,常被看做大數(shù)據(jù)分析優(yōu)勢(shì)的明證。本題答案:【谷歌流感預(yù)測(cè)】大數(shù)據(jù)技術(shù)導(dǎo)論期末試題1、【單選題】大數(shù)據(jù)是一個(gè)什么領(lǐng)域的問(wèn)題?本題答案:【多學(xué)科綜合領(lǐng)域】2、【單選題】以下哪種技術(shù)對(duì)大數(shù)據(jù)技術(shù)的發(fā)展起了最重要基礎(chǔ)支撐作用?本題答案:【云計(jì)算技術(shù)】3、【單選題】科學(xué)研究的第三范式是計(jì)算思維-()本題答案:【仿真模擬】4、【單選題】與大數(shù)據(jù)直接相關(guān)的職業(yè)不包括本題答案:【首席執(zhí)行官】5、【單選題】下面科學(xué)研究的四個(gè)范式順序正確的是()本題答案:【經(jīng)驗(yàn)范式-理論范式-模擬范式-數(shù)據(jù)密集型范式】6、【單選題】在大數(shù)據(jù)生命周期的各個(gè)階段中,工作最多的是哪個(gè)階段()本題答案:【數(shù)據(jù)收集和整理】7、【單選題】在網(wǎng)絡(luò)爬蟲(chóng)策略中需要根據(jù)鏈接計(jì)算網(wǎng)頁(yè)重要性的是以下哪個(gè)算法()本題答案:【局部PageRank策略】8、【單選題】常見(jiàn)的分布式網(wǎng)絡(luò)爬蟲(chóng)架構(gòu)不包含()本題答案:【Master-worker】9、【單選題】以下哪項(xiàng)不是傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的弱點(diǎn)?本題答案:【無(wú)法滿(mǎn)足數(shù)據(jù)一致性和完整性的需求】10、【單選題】下列對(duì)HBase數(shù)據(jù)模型的描述錯(cuò)誤的是本題答案:【HBase中執(zhí)行更新操作時(shí),會(huì)刪除數(shù)據(jù)舊的版本,并生成一個(gè)新的版本】11、【單選題】HBase是一種()數(shù)據(jù)庫(kù)本題答案:【列式數(shù)據(jù)庫(kù)】12、【單選題】訪問(wèn)HBase表中的行,不可以用以下哪種方式本題答案:【通過(guò)某列的值區(qū)間】13、【單選題】分布式文件系統(tǒng)HDFS采用了主從結(jié)構(gòu)模型,由計(jì)算機(jī)集群中的多個(gè)節(jié)點(diǎn)構(gòu)成的,這些節(jié)點(diǎn)分為兩類(lèi),一類(lèi)存儲(chǔ)元數(shù)據(jù)叫(),另一類(lèi)存儲(chǔ)具體數(shù)據(jù)叫()本題答案:【名稱(chēng)節(jié)點(diǎn),數(shù)據(jù)節(jié)點(diǎn)】14、【單選題】HDFS中文件塊默認(rèn)保存幾份()本題答案:【3份】15、【單選題】下面與HDFS類(lèi)似的框架是()本題答案:【GFS】16、【單選題】下列關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系型數(shù)據(jù)庫(kù)的比較,不正確的是本題答案:【NoSQL數(shù)據(jù)庫(kù)很容易實(shí)現(xiàn)數(shù)據(jù)完整性,關(guān)系型數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性】17、【單選題】下列數(shù)據(jù)庫(kù)屬于文檔數(shù)據(jù)庫(kù)的是本題答案:【MongoDB】18、【單選題】NoSQL數(shù)據(jù)庫(kù)的CAP不包含()本題答案:【持久性】19、【單選題】NoSQL數(shù)據(jù)庫(kù)的BASE不包含()本題答案:【持續(xù)性】20、【單選題】關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù),下列說(shuō)法不正確的是:本題答案:【NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)各有優(yōu)缺點(diǎn),但隨著NoSQL的發(fā)展,終將取代關(guān)系數(shù)據(jù)庫(kù)】21、【單選題】NoSQL數(shù)據(jù)庫(kù)的明顯優(yōu)勢(shì)不包含()本題答案:【實(shí)現(xiàn)數(shù)據(jù)完整性】22、【單選題】下列關(guān)于數(shù)據(jù)可視化的介紹,不正確的是()本題答案:【雷達(dá)圖不適用于多維數(shù)據(jù)】23、【單選題】關(guān)于數(shù)據(jù)挖掘任務(wù),下列說(shuō)法不正確的是()本題答案:【回歸分析屬于描述性任務(wù)】24、【單選題】下列不可以用于多維數(shù)據(jù)可視化的方法有()本題答案:【GMap】25、【單選題】數(shù)據(jù)度量的常用方法不包括:本題答案:【聚類(lèi)系數(shù)】26、【單選題】Spark的組件中,用于做查詢(xún)分析的是()本題答案:【SparkSQL】27、【單選題】關(guān)于MapReduce,下列說(shuō)法錯(cuò)誤的是本題答案:【Hadoop框架是用Java實(shí)現(xiàn)的,MapReduce應(yīng)用程序則一定要用Java來(lái)寫(xiě)】28、【單選題】傳統(tǒng)并行計(jì)算框架(比如MPI)和MapReduce并行計(jì)算框架相比較的特點(diǎn)不包含本題答案:【前者相比后者學(xué)習(xí)起來(lái)更容易】29、【單選題】關(guān)于RDD論述正確的是()本題答案:【RDD提供一種高度受限的共享內(nèi)存模型,是一個(gè)彈性分布式數(shù)據(jù)集】30、【單選題】Apache軟件基金會(huì)最重要的三大分布式計(jì)算系統(tǒng)開(kāi)源項(xiàng)目不包括()本題答案:【MapReduce】31、【單選題】利用大數(shù)據(jù)特性進(jìn)行隱私保護(hù)的方式不包含:本題答案:【數(shù)據(jù)加密傳輸技術(shù)】32、【單選題】以下哪項(xiàng)對(duì)數(shù)據(jù)隱私問(wèn)題的影響相對(duì)最小本題答案:【政府和企業(yè)成立安全聯(lián)盟】33、【單選題】大數(shù)據(jù)分析的挑戰(zhàn)不包括()本題答案:【無(wú)處不在的數(shù)據(jù)】34、【判斷題】科學(xué)研究的第一到第四范式數(shù)據(jù)思維依次分別采用:仿真模擬、模型推演、關(guān)聯(lián)分析、科學(xué)歸納本題答案:【錯(cuò)誤】35、【判斷題】大數(shù)據(jù)的優(yōu)勢(shì)包含:數(shù)據(jù)體量大,數(shù)據(jù)類(lèi)型豐富,價(jià)值密度高,收集時(shí)間短本題答案:【錯(cuò)誤】36、【判斷題】大數(shù)據(jù)處理中的批處理框架包含F(xiàn)link、hadoop、jvm、Spark本題答案:【錯(cuò)誤】37、【判斷題】大數(shù)據(jù)處理中的流計(jì)算框架包含F(xiàn)link、Sparkstreaming、STORM本題答案:【正確】38、【判斷題】大數(shù)據(jù)處理中批流融合計(jì)算很難,目前業(yè)界關(guān)于此類(lèi)研究處于空白狀態(tài)本題答案:【錯(cuò)誤】39、【判斷題】系統(tǒng)的控制方式一般分為模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)本題答案:【正確】40、【判斷題】4V特征包含:數(shù)據(jù)規(guī)模大、數(shù)據(jù)密度低、數(shù)據(jù)處理速度快、價(jià)值密度低本題答案:【錯(cuò)誤】41、【判斷題】大數(shù)據(jù)的處理過(guò)程包含,數(shù)據(jù)獲取與管理、數(shù)據(jù)存儲(chǔ)與處理、數(shù)據(jù)分析與理解、結(jié)合領(lǐng)域的大數(shù)據(jù)應(yīng)用本題答案:【正確】42、【判斷題】模擬范式是以數(shù)據(jù)考察為基礎(chǔ),聯(lián)合理論、實(shí)驗(yàn)和模擬一體的數(shù)據(jù)密集計(jì)算的范式本題答案:【錯(cuò)誤】43、【判斷題】全表對(duì)比是一種需要計(jì)算MD5校驗(yàn)碼的非增量抽取方法本題答案:【錯(cuò)誤】44、【判斷題】大數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)包括視頻、圖像、語(yǔ)音、文本本題答案:【正確】45、【判斷題】電子表格Excel、網(wǎng)頁(yè)HTML均屬于結(jié)構(gòu)化數(shù)據(jù)本題答案:【錯(cuò)誤】46、【判斷題】通過(guò)使用詞組查詢(xún)搜索引擎搜索得到的結(jié)果、通過(guò)填寫(xiě)表單形成對(duì)后臺(tái)在線數(shù)據(jù)庫(kù)的查詢(xún)而得到的動(dòng)態(tài)頁(yè)面、需要注冊(cè)或其他限制才能訪問(wèn)的內(nèi)容都屬于深網(wǎng)內(nèi)容本題答案:【錯(cuò)誤】47、【判斷題】HBase依靠Hadoop存儲(chǔ)底層數(shù)據(jù)本題答案:【錯(cuò)誤】48、【判斷題】NoSQL的數(shù)據(jù)特點(diǎn)包含與云計(jì)算緊密融合,靈活的可擴(kuò)展性,動(dòng)態(tài)的數(shù)據(jù)遷移、靈活的數(shù)據(jù)模型本題答案:【錯(cuò)誤】49、【判斷題】HDFS只設(shè)置唯一一個(gè)名稱(chēng)節(jié)點(diǎn)帶來(lái)的局限性主要包括集群的可用性、命名空間的限制、隔離問(wèn)題以及性能的瓶頸本題答案:【正確】50、【判斷題】在分布式文件系統(tǒng)中,采用采用多副本冗余存儲(chǔ)可以節(jié)約存儲(chǔ)空間、保證數(shù)據(jù)可靠性、更容易檢查數(shù)據(jù)錯(cuò)誤并加快數(shù)據(jù)傳輸速度本題答案:【錯(cuò)誤】51、【判斷題】分布式文件系統(tǒng)改變了數(shù)據(jù)存儲(chǔ)和管理方式,相對(duì)于本地文件系統(tǒng)具有易擴(kuò)展、低成本、強(qiáng)可靠、高可用的優(yōu)勢(shì)本題答案:【正確】52、【判斷題】HBase是一種開(kāi)源的,是面向行的、分布式的NoSQL數(shù)據(jù)庫(kù)本題答案:【錯(cuò)誤】53、【判斷題】Hadoop的框架最核心的設(shè)計(jì)是HDFS和MapReduce本題答案:【正確】54、【判斷題】HBase的實(shí)現(xiàn)主要包含許多個(gè)Master主服務(wù)器、Region服務(wù)器及庫(kù)函數(shù)本題答案:【錯(cuò)誤】55、【判斷題】HDFS專(zhuān)為解決大數(shù)據(jù)存儲(chǔ)問(wèn)題而產(chǎn)生的,其具備了強(qiáng)大的跨平臺(tái)兼容性,支持批和流數(shù)據(jù)讀寫(xiě),實(shí)現(xiàn)了低延時(shí)數(shù)據(jù)訪問(wèn),并兼容廉價(jià)的硬件設(shè)備本題答案:【錯(cuò)誤】56、【判斷題】NoSQL數(shù)據(jù)庫(kù)的三大理論基石包括BASE、CAP和最終一致性本題答案:【正確】57、【判斷題】目前,NoSQL的含義是“NotonlySQL”,而不是“NoSQL”。本題答案:【正確】58、【判斷題】一個(gè)數(shù)據(jù)庫(kù)事務(wù)具有ACID是指:原子性,一致性,持久性,隔離性。本題答案:【正確】59、【判斷題】數(shù)據(jù)可視化方法和技術(shù)包含多維數(shù)據(jù)可視化技術(shù)、圖可視化技術(shù)、時(shí)空數(shù)據(jù)可視化技術(shù)以及混合建模技術(shù)本題答案:【錯(cuò)誤】60、【判斷題】數(shù)據(jù)可視化可以理解信息、探索數(shù)據(jù)、協(xié)助思考,并作為大量工作記憶的外界輔助本題答案:【正確】61、【判斷題】預(yù)測(cè)任務(wù)的目標(biāo)是導(dǎo)出和概括數(shù)據(jù)中有潛在聯(lián)系的模式(相關(guān)、趨勢(shì)、聚類(lèi)、軌跡和異常)本題答案:【錯(cuò)誤】62、【判斷題】PCA是一種無(wú)監(jiān)督的降維方法本題答案:【正確】63、【判斷題】Textflow用河流的運(yùn)動(dòng)表達(dá)了文本主題的誕生、發(fā)展、合并、分裂、消亡的過(guò)程導(dǎo)致主題演變的原因往往是主題關(guān)鍵詞的變化本題答案:【正確】64、【判斷題】聚類(lèi)是在沒(méi)有先驗(yàn)知識(shí)的情況下進(jìn)行的本題答案:【正確】65、【判斷題】Spark擁有HadoopMapReduce所具有的優(yōu)點(diǎn);但不同于MapReduce的是Job中間輸出結(jié)果可以保存在內(nèi)存中,從而不再需要讀寫(xiě)HDFS本題答案:【正確】66、【判斷題】在Spark運(yùn)行時(shí),TaskSchedul
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 山西省運(yùn)城市聞喜縣部分學(xué)校2025-2026學(xué)年七年級(jí)上學(xué)期期末測(cè)試生物試卷(含答案)
- 2025跨年元旦新年春節(jié)煙花市集(請(qǐng)你看煙花)活動(dòng)策劃方案
- 餐廳人員介紹
- 12月十大金股:十二月策略和十大金股
- 飛機(jī)配送員培訓(xùn)課件大全
- 2026年濱州陽(yáng)信縣事業(yè)單位公開(kāi)招聘人員(30人)備考考試試題及答案解析
- 2026年上半年黑龍江事業(yè)單位聯(lián)考省科學(xué)院招聘24人備考考試試題及答案解析
- 食品安全管理人員制度
- 2026山東事業(yè)單位統(tǒng)考濱州市東平縣初級(jí)綜合類(lèi)崗位招聘78人備考考試試題及答案解析
- 食品公司營(yíng)銷(xiāo)管理制度(3篇)
- 2020海灣消防GST-DJ-N500-GST-DJ-N900 消防設(shè)備電源狀態(tài)監(jiān)控器安裝使用說(shuō)明書(shū)
- 河北省滄州市青縣2024-2025學(xué)年七年級(jí)上學(xué)期期末生物試卷
- 淮安市2022-2023學(xué)年七年級(jí)上學(xué)期期末地理試題
- 2024屆高考語(yǔ)文二輪復(fù)習(xí)專(zhuān)題-文言文閱讀(上海專(zhuān)用)(解析版)
- 2024可打印的離婚協(xié)議書(shū)模板
- EPC項(xiàng)目組織架構(gòu)圖
- 《房顫的藥物治療》課件
- 租賃手機(jī)籌資計(jì)劃書(shū)
- 疾病產(chǎn)生分子基礎(chǔ)概論
- 演示文稿第十五章文化中心轉(zhuǎn)移
- 醫(yī)療設(shè)備購(gòu)置論證評(píng)審表
評(píng)論
0/150
提交評(píng)論