版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
大數(shù)據(jù)發(fā)展戰(zhàn)略及特性等相關(guān)知識(shí)測(cè)試試卷《大數(shù)據(jù)導(dǎo)論》
教材配套習(xí)題和答案
2020年4月第1章大數(shù)據(jù)概述[填空題]*_________________________________單選題[單選題]*下面關(guān)于數(shù)據(jù)的說(shuō)法,錯(cuò)誤的是:(B)(正確答案)數(shù)據(jù)的根本價(jià)值在于可以為人們找出答案[單選題]*數(shù)據(jù)的價(jià)值會(huì)因?yàn)椴粩嗍褂枚鳒p(正確答案)數(shù)據(jù)的價(jià)值會(huì)因?yàn)椴粩嘀亟M而產(chǎn)生更大的價(jià)值目前階段,數(shù)據(jù)的產(chǎn)生不以人的意志為轉(zhuǎn)移第3次信息化浪潮的標(biāo)志是:(C)[填空題]*_________________________________個(gè)人計(jì)算機(jī)的普及[單選題]*互聯(lián)網(wǎng)的普及(正確答案)云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù)的普及人工智能的普及物聯(lián)網(wǎng)的發(fā)展最終導(dǎo)致了人類(lèi)社會(huì)數(shù)據(jù)量的第三次躍升,使得數(shù)據(jù)產(chǎn)生方式進(jìn)入了:(D)[填空題]*_________________________________手工創(chuàng)建階段[單選題]*運(yùn)營(yíng)式系統(tǒng)階段(正確答案)用戶原創(chuàng)內(nèi)容階段感知式系統(tǒng)階段英國(guó)的大數(shù)據(jù)發(fā)展戰(zhàn)略是:()[單選題]*A.穩(wěn)步實(shí)施“三步走”戰(zhàn)略,打造面向未來(lái)的大數(shù)據(jù)創(chuàng)新生態(tài)B.通過(guò)發(fā)展創(chuàng)新性解決方案并應(yīng)用于實(shí)踐來(lái)促進(jìn)大數(shù)據(jù)發(fā)展C.以大數(shù)據(jù)等技術(shù)為核心應(yīng)對(duì)第四次工業(yè)革命D.緊抓大數(shù)據(jù)產(chǎn)業(yè)機(jī)遇,應(yīng)對(duì)脫歐后的經(jīng)濟(jì)挑戰(zhàn)(正確答案)5.以下哪個(gè)不是大數(shù)據(jù)的“4V”特性:(D)[填空題]*_________________________________數(shù)據(jù)量大[單選題]*數(shù)據(jù)類(lèi)型繁多(正確答案)處理速度快價(jià)值密度高多選題[填空題]*_________________________________數(shù)據(jù)的類(lèi)型主要包括:(ABCD)[填空題]*_________________________________文本[單選題]*圖片(正確答案)音頻視頻計(jì)算機(jī)系統(tǒng)中的數(shù)據(jù)組織形式主要有兩種,分別是:(AD)[填空題]*_________________________________文件[單選題]*視頻(正確答案)音頻數(shù)據(jù)庫(kù)為了讓數(shù)據(jù)變得可用,需要對(duì)數(shù)據(jù)進(jìn)行三個(gè)步驟的處理,分別是:(ACD)[填空題]*_________________________________數(shù)據(jù)清洗[單選題]*數(shù)據(jù)抽樣(正確答案)數(shù)據(jù)管理數(shù)據(jù)分析信息科技為大數(shù)據(jù)時(shí)代提供技術(shù)支撐,主要體現(xiàn)在哪三個(gè)方面:(ABD)[填空題]*_________________________________存儲(chǔ)設(shè)備容量不斷增加[單選題]*CPU處理能力大幅提升(正確答案)量子計(jì)算機(jī)全面普及網(wǎng)絡(luò)帶寬不斷增加5、人類(lèi)社會(huì)的數(shù)據(jù)產(chǎn)生方式大致經(jīng)歷了哪三個(gè)階段:(BCD)[填空題]*_________________________________手工生產(chǎn)階段[單選題]*運(yùn)營(yíng)式系統(tǒng)階段(正確答案)用戶原創(chuàng)內(nèi)容階段感知式系統(tǒng)階段6、關(guān)于“大數(shù)據(jù)摩爾定律”,以下說(shuō)法正確的是:(ABC)[填空題]*_________________________________人類(lèi)社會(huì)產(chǎn)生的數(shù)據(jù)一直都在以每年50%的速度增長(zhǎng)[單選題]*人類(lèi)社會(huì)的數(shù)據(jù)量大約每?jī)赡昃驮黾右槐?正確答案)人類(lèi)在最近兩年產(chǎn)生的數(shù)據(jù)量相當(dāng)于之前產(chǎn)生的全部數(shù)據(jù)量之和人類(lèi)社會(huì)的數(shù)據(jù)量以每年10%的速度增長(zhǎng)7、人類(lèi)自古以來(lái)在科學(xué)研究上先后歷經(jīng)了哪幾種范式:(ABCD)[填空題]*_________________________________實(shí)驗(yàn)科學(xué)[單選題]*理論科學(xué)(正確答案)計(jì)算科學(xué)數(shù)據(jù)密集型科學(xué)8、大數(shù)據(jù)將會(huì)對(duì)社會(huì)發(fā)展產(chǎn)生深遠(yuǎn)的影響,具體表現(xiàn)在以下哪幾個(gè)方面:(ABCD)[填空題]*_________________________________大數(shù)據(jù)決策成為一種新的決策方式[單選題]*大數(shù)據(jù)成為提升國(guó)家治理能力的新途徑(正確答案)大數(shù)據(jù)應(yīng)用促進(jìn)信息技術(shù)與各行業(yè)的深度融合大數(shù)據(jù)開(kāi)發(fā)推動(dòng)新技術(shù)和新應(yīng)用的不斷涌現(xiàn)9、大數(shù)據(jù)產(chǎn)業(yè)是指一切與支撐大數(shù)據(jù)組織管理和價(jià)值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟(jì)活動(dòng)的集合。以下哪些屬于大數(shù)據(jù)產(chǎn)業(yè)的某個(gè)環(huán)節(jié)(ABCD):[填空題]*_________________________________IT基礎(chǔ)設(shè)施層[單選題]*數(shù)據(jù)源層(正確答案)數(shù)據(jù)管理層數(shù)據(jù)分析層第2章大數(shù)據(jù)與其他新興技術(shù)之間的關(guān)系[填空題]*_________________________________單選題[單選題]*早期的云計(jì)算產(chǎn)品AWS是由哪家企業(yè)提出的:(C)(正確答案)IBM[單選題]*微軟(正確答案)亞馬遜谷歌云計(jì)算包括3種類(lèi)型。面向所有用戶提供服務(wù),只要是注冊(cè)付費(fèi)的用戶都可以使用,這種云計(jì)算屬于:(A)[填空題]*_________________________________公有云[單選題]*私有云(正確答案)混合云獨(dú)立云云計(jì)算包括3種類(lèi)型。只為特定用戶提供服務(wù),比如大型企業(yè)出于安全考慮自建的云環(huán)境,只為企業(yè)內(nèi)部提供服務(wù),這種云計(jì)算屬于:(B)[填空題]*_________________________________公有云[單選題]*私有云(正確答案)混合云獨(dú)立云以下關(guān)于大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)的區(qū)別,描述錯(cuò)誤的是:(C)[填空題]*_________________________________大數(shù)據(jù)側(cè)重于對(duì)海量數(shù)據(jù)的存儲(chǔ)、處理與分析,從海量數(shù)據(jù)中發(fā)現(xiàn)價(jià)值,服務(wù)于生產(chǎn)和生活[單選題]*云計(jì)算本質(zhì)上旨在整合和優(yōu)化各種IT資源并通過(guò)網(wǎng)絡(luò)以服務(wù)的方式,廉價(jià)地提供給用戶(正確答案)云計(jì)算旨在從海量數(shù)據(jù)中發(fā)現(xiàn)價(jià)值,服務(wù)于生產(chǎn)和生活物聯(lián)網(wǎng)的發(fā)展目標(biāo)是實(shí)現(xiàn)物物相連,應(yīng)用創(chuàng)新是物聯(lián)網(wǎng)發(fā)展的核心以下關(guān)于機(jī)器學(xué)習(xí),描述錯(cuò)誤的是:(C)[填空題]*_________________________________是一門(mén)涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識(shí)、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科[單選題]*研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為,以獲取新的知識(shí)或技能(正確答案)機(jī)器學(xué)習(xí)強(qiáng)調(diào)三個(gè)關(guān)鍵詞:算法、模型、訓(xùn)練基于數(shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方法之一6、以下關(guān)于知識(shí)圖譜,描述錯(cuò)誤的是:(C)[填空題]*_________________________________又稱(chēng)為科學(xué)知識(shí)圖譜[單選題]*在圖書(shū)情報(bào)界稱(chēng)為知識(shí)域可視化或知識(shí)領(lǐng)域映射地圖(正確答案)知識(shí)圖譜屬于密碼學(xué)研究范疇知識(shí)圖譜可用于反欺詐、不一致性驗(yàn)證、組團(tuán)欺詐等公共安全保障領(lǐng)域7、以下關(guān)于人機(jī)交互,描述錯(cuò)誤的是:(B)[填空題]*_________________________________人機(jī)交互是一門(mén)研究系統(tǒng)與用戶之間的交互關(guān)系的學(xué)科[單選題]*人機(jī)交互界面通常是指用戶不可見(jiàn)的部分(正確答案)系統(tǒng)可以是各種各樣的機(jī)器,也可以是計(jì)算機(jī)化的系統(tǒng)和軟件用戶通過(guò)人機(jī)交互界面與系統(tǒng)交流,并進(jìn)行操作8、以下關(guān)于計(jì)算機(jī)視覺(jué),描述錯(cuò)誤的是:(D)[填空題]*_________________________________計(jì)算機(jī)視覺(jué)是一門(mén)研究如何使機(jī)器“看”的科學(xué)[單選題]*是指用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量的機(jī)器視覺(jué)(正確答案)計(jì)算機(jī)視覺(jué)是一門(mén)綜合性的學(xué)科語(yǔ)音識(shí)別屬于計(jì)算機(jī)視覺(jué)的典型應(yīng)用9、關(guān)于大數(shù)據(jù)與區(qū)塊鏈的聯(lián)系,下面描述錯(cuò)誤的是:()[單選題]*A.區(qū)塊鏈?zhǔn)勾髷?shù)據(jù)極大降低信用成本B.區(qū)塊鏈?zhǔn)菢?gòu)建大數(shù)據(jù)時(shí)代的信任基石C.區(qū)塊鏈?zhǔn)谴龠M(jìn)大數(shù)據(jù)價(jià)值流通的管道D.區(qū)塊鏈會(huì)提升大數(shù)據(jù)的信用成本(正確答案)二、多選題[填空題]*_________________________________傳統(tǒng)的IT資源獲取方式的主要缺點(diǎn)是:(ABC)[填空題]*_________________________________初期成本高,建設(shè)周期長(zhǎng)
后期需要自己維護(hù),使用成本高[單選題]*IT資源供應(yīng)量有限(正確答案)IT資源供應(yīng)量無(wú)限云計(jì)算的主要優(yōu)點(diǎn)是:(BCD)[填空題]*_________________________________初期投入大,需要用戶自己維護(hù)[單選題]*初期零成本,瞬時(shí)可獲得(正確答案)后期免維護(hù),使用成本低在供應(yīng)IT資源量方面“予取予求”云計(jì)算包括哪3種典型的服務(wù)模式:(ABD)[填空題]*_________________________________IaaS(基礎(chǔ)設(shè)施即服務(wù))[單選題]*PaaS(平臺(tái)即服務(wù))(正確答案)MaaS(機(jī)器即服務(wù))SaaS(軟件即服務(wù))云計(jì)算包括哪3種類(lèi)型:(ACD)[填空題]*_________________________________公有云[單選題]*獨(dú)立云(正確答案)私有云混合云5、從技術(shù)架構(gòu)上看,物聯(lián)網(wǎng)主要包括哪幾層:(ABCD)[填空題]*_________________________________感知層[單選題]*網(wǎng)絡(luò)層(正確答案)處理層應(yīng)用層以下關(guān)于大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)的聯(lián)系,描述正確的是:(ABCD)[填空題]*_________________________________從整體上看,大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)這三者是相輔相成的[單選題]*大數(shù)據(jù)根植于云計(jì)算,大數(shù)據(jù)分析的很多技術(shù)都來(lái)自于云計(jì)算(正確答案)大數(shù)據(jù)為云計(jì)算提供了“用武之地”物聯(lián)網(wǎng)需要借助于云計(jì)算和大數(shù)據(jù)技術(shù),實(shí)現(xiàn)物聯(lián)網(wǎng)大數(shù)據(jù)的存儲(chǔ)、分析和處理以下關(guān)于大數(shù)據(jù)與人工智能的聯(lián)系,描述正確的是:(ABCD)[填空題]*_________________________________人工智能需要數(shù)據(jù)來(lái)建立其智能,特別是機(jī)器學(xué)習(xí)[單選題]*人工智能應(yīng)用的數(shù)據(jù)越多,其獲得的結(jié)果就越準(zhǔn)確(正確答案)大數(shù)據(jù)為人工智能提供了海量的數(shù)據(jù),使得人工智能技術(shù)有了長(zhǎng)足的發(fā)展大數(shù)據(jù)技術(shù)為人工智能提供了強(qiáng)大的存儲(chǔ)能力和計(jì)算能力7、下面關(guān)于比特幣和區(qū)塊鏈之間關(guān)系的描述,正確的是:()*A.比特幣和區(qū)塊鏈沒(méi)有任何關(guān)系B.區(qū)塊鏈?zhǔn)潜忍貛诺牡讓蛹夹g(shù)(正確答案)C.比特幣是區(qū)塊鏈的一種應(yīng)用(正確答案)D.比特幣是比區(qū)塊鏈更先進(jìn)的一種技術(shù)8、比特幣要解決的兩個(gè)核心問(wèn)題是:()*A.防篡改(正確答案)B.防丟失C.防貶值D.去中心化記賬(正確答案)9、在比特幣區(qū)塊鏈中關(guān)于如何爭(zhēng)奪記賬權(quán)的問(wèn)題,下面描述正確的是:()*A.采用的是POW機(jī)制,也就是“工作量證明機(jī)制”(正確答案)B.記賬節(jié)點(diǎn)通過(guò)計(jì)算數(shù)學(xué)題,來(lái)爭(zhēng)奪記賬權(quán)(正確答案)C.對(duì)于數(shù)學(xué)公式的計(jì)算,除了從零開(kāi)始遍歷隨機(jī)數(shù)碰運(yùn)氣以外,沒(méi)有其他辦法(正確答案)D.解題的過(guò)程,又叫“挖礦”,記賬節(jié)點(diǎn)被稱(chēng)為礦工。誰(shuí)先解對(duì),誰(shuí)就獲得記賬權(quán)(正確答案)10、區(qū)塊鏈的三要素是:()*A.交易(正確答案)B.區(qū)塊(正確答案)C.鏈(正確答案)D.比特幣第3章大數(shù)據(jù)基礎(chǔ)知識(shí)[填空題]*_________________________________單選題[填空題]*_________________________________1、下面關(guān)于大數(shù)據(jù)安全問(wèn)題,描述錯(cuò)誤的是:(D)[填空題]*_________________________________大數(shù)據(jù)的價(jià)值并不單純地來(lái)源于它的用途,而更多地源自其二次利用[單選題]*對(duì)大數(shù)據(jù)的收集、處理、保存不當(dāng),會(huì)加劇數(shù)據(jù)信息泄露的風(fēng)險(xiǎn)(正確答案)大數(shù)據(jù)成為國(guó)家之間博弈的新戰(zhàn)場(chǎng)大數(shù)據(jù)對(duì)于國(guó)家安全沒(méi)有產(chǎn)生影響2、下面關(guān)于棱鏡門(mén)事件描述錯(cuò)誤的是:(C)[填空題]*_________________________________棱鏡計(jì)劃(PRISM)是一項(xiàng)由美國(guó)國(guó)家安全局(NSA)自2007年起開(kāi)始實(shí)施的絕密電子監(jiān)聽(tīng)計(jì)劃[單選題]*在該計(jì)劃中,美國(guó)國(guó)家安全局和聯(lián)邦調(diào)查局利用平臺(tái)和技術(shù)上的優(yōu)勢(shì),開(kāi)展全球范圍內(nèi)的監(jiān)聽(tīng)活動(dòng)(正確答案)該計(jì)劃的目的是為了促進(jìn)世界和平與發(fā)展該計(jì)劃對(duì)全世界重點(diǎn)地區(qū)、部門(mén)、公司甚至個(gè)人進(jìn)行布控3、下面關(guān)于手機(jī)軟件采集個(gè)人信息的描述錯(cuò)誤的是:(C)[填空題]*_________________________________在我們的日常生活中,部分手機(jī)APP往往會(huì)“私自竊密”[單選題]*有的APP在提供服務(wù)時(shí),采取特殊方式來(lái)獲得用戶授權(quán),這本質(zhì)上仍屬“未經(jīng)同意”(正確答案)在微信朋友圈廣泛傳播的各種測(cè)試小程序是安全的,不會(huì)竊取用戶個(gè)人信息手機(jī)APP過(guò)度采集個(gè)人信息呈現(xiàn)普遍趨勢(shì),最突出的是在非必要的情況下獲取位置信息和訪問(wèn)聯(lián)系人權(quán)限4、下面描述錯(cuò)誤的是:(D)[填空題]*_________________________________A.“探針盒子”就是一款自動(dòng)收集用戶隱私的產(chǎn)品[單選題]*B.許多顧客在使用WiFi之后會(huì)收到大量的廣告信息,甚至自己的手機(jī)號(hào)碼也會(huì)被當(dāng)做信息進(jìn)行多次買(mǎi)賣(mài)(正確答案)C.在免費(fèi)上網(wǎng)的背后,其實(shí)也存在著不小的信息安全風(fēng)險(xiǎn),或許一不小心,就落入了電腦黑客們?cè)O(shè)計(jì)的WiFi陷阱之中D.免費(fèi)WIFI都是安全的,可以放心使用5、下面關(guān)于機(jī)械思維的核心思想,描述錯(cuò)誤的是:(B)[填空題]*_________________________________世界變化的規(guī)律是確定的[單選題]*世界變化的規(guī)律是無(wú)法確定的(正確答案)規(guī)律不僅是可以被認(rèn)識(shí)的,而且可以用簡(jiǎn)單的公式或者語(yǔ)言描述清楚這些規(guī)律應(yīng)該是放之四海而皆準(zhǔn)的,可以應(yīng)用到各種未知領(lǐng)域指導(dǎo)實(shí)踐6、我們?cè)谑褂弥悄苁謾C(jī)進(jìn)行導(dǎo)航來(lái)避開(kāi)城市擁堵路段時(shí),體現(xiàn)了哪種大數(shù)據(jù)思維方式:(A)[填空題]*_________________________________我為人人,人人為我[單選題]*全樣而非抽樣(正確答案)效率而非精確相關(guān)而非因果谷歌采用搜索引擎大數(shù)據(jù)進(jìn)行流感趨勢(shì)預(yù)測(cè),體現(xiàn)了哪種大數(shù)據(jù)思維方式:(B)[填空題]*_________________________________我為人人,人人為我[單選題]*全樣而非抽樣(正確答案)效率而非精確相關(guān)而非因果8、“啤酒與尿布”的故事,體現(xiàn)了哪種大數(shù)據(jù)思維方式:(D)[填空題]*_________________________________我為人人,人人為我[單選題]*全樣而非抽樣(正確答案)效率而非精確相關(guān)而非因果9、大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效,體現(xiàn)了哪種大數(shù)據(jù)思維方式:(A)[填空題]*_________________________________以數(shù)據(jù)為中心[單選題]*全樣而非抽樣(正確答案)效率而非精確相關(guān)而非因果10、迪士尼MagicBand手環(huán),體現(xiàn)了哪種大數(shù)據(jù)思維方式:(A)[填空題]*_________________________________我為人人,人人為我[單選題]*全樣而非抽樣(正確答案)效率而非精確相關(guān)而非因果11、下面關(guān)于大數(shù)據(jù)倫理的描述,錯(cuò)誤的是:(D)[填空題]*_________________________________大數(shù)據(jù)倫理屬于科技倫理的范疇[單選題]*大數(shù)據(jù)倫理問(wèn)題是指由于大數(shù)據(jù)技術(shù)的產(chǎn)生和使用而引發(fā)的社會(huì)問(wèn)題(正確答案)作為一種新的技術(shù),大數(shù)據(jù)技術(shù)像其他所有技術(shù)一樣,其本身是無(wú)所謂好壞的,而它的“善”與“惡”全然在于對(duì)大數(shù)據(jù)技術(shù)的使用者大數(shù)據(jù)技術(shù)本身就存在“善”和“惡”的區(qū)分12、現(xiàn)在的互聯(lián)網(wǎng),基于大數(shù)據(jù)和人工智能的推薦應(yīng)用越來(lái)越多,越來(lái)越深入,我們一直被“喂食著”經(jīng)過(guò)智能化篩選推薦的信息,久而久之,會(huì)導(dǎo)致什么問(wèn)題:(A)[填空題]*_________________________________信息繭房問(wèn)題[單選題]*隱形偏差問(wèn)題(正確答案)大數(shù)據(jù)殺熟問(wèn)題隱私泄露問(wèn)題下面哪一個(gè)不屬于大數(shù)據(jù)倫理問(wèn)題:(D)[填空題]*_________________________________隱私泄露問(wèn)題[單選題]*數(shù)據(jù)安全問(wèn)題(正確答案)數(shù)字鴻溝問(wèn)題數(shù)據(jù)冗余問(wèn)題14、下面關(guān)于政府?dāng)?shù)據(jù)孤島描述錯(cuò)誤的是:(D)[填空題]*_________________________________有些政府部門(mén)錯(cuò)誤地將數(shù)據(jù)資源等同于一般資源,認(rèn)為占有就是財(cái)富,熱衷于搜集,但不愿共享[單選題]*有些部門(mén)只盯著自己的數(shù)據(jù)服務(wù)系統(tǒng),結(jié)果因?yàn)閿?shù)據(jù)標(biāo)準(zhǔn)、系統(tǒng)接口等技術(shù)原因,無(wú)法與外單位、外部門(mén)聯(lián)通(正確答案)有些地方,對(duì)大數(shù)據(jù)缺乏頂層設(shè)計(jì),導(dǎo)致各條線、各部門(mén)固有的本位主義作祟,壁壘林立,數(shù)據(jù)無(wú)法流動(dòng)即使涉及到工作機(jī)密、商業(yè)機(jī)密,政府也應(yīng)該毫不保留地共享數(shù)據(jù)15、關(guān)于推進(jìn)數(shù)據(jù)共享開(kāi)放的描述,錯(cuò)誤的是:(D)[填空題]*_________________________________要改變政府職能部門(mén)“數(shù)據(jù)孤島”現(xiàn)象,立足于數(shù)據(jù)資源的共享互換,設(shè)定相對(duì)明確的數(shù)據(jù)標(biāo)準(zhǔn),實(shí)現(xiàn)部門(mén)之間的數(shù)據(jù)對(duì)接與共享[單選題]*要使不同省區(qū)市之間的數(shù)據(jù)實(shí)現(xiàn)對(duì)接與共享,解決數(shù)據(jù)“畫(huà)地為牢”的問(wèn)題,實(shí)現(xiàn)數(shù)據(jù)共享共用(正確答案)在企業(yè)內(nèi)部,破除“數(shù)據(jù)孤島”,推進(jìn)數(shù)據(jù)融合不同企業(yè)之間,為了保護(hù)各自商業(yè)利益,不宜實(shí)現(xiàn)數(shù)據(jù)共享16、下面關(guān)于數(shù)據(jù)權(quán)的描述,錯(cuò)誤的是:(D)[填空題]*_________________________________數(shù)據(jù)權(quán)的概念發(fā)起于英國(guó),主要將其視為信息社會(huì)的一項(xiàng)基本公民權(quán)利[單選題]*數(shù)據(jù)權(quán)包括兩個(gè)方面:數(shù)據(jù)主權(quán)和數(shù)據(jù)權(quán)利(正確答案)數(shù)據(jù)主權(quán)的主體是國(guó)家,是一個(gè)國(guó)家獨(dú)立自主對(duì)本國(guó)數(shù)據(jù)進(jìn)行管理和利用的權(quán)力數(shù)據(jù)主權(quán)的主體是公民,是相對(duì)應(yīng)于公民數(shù)據(jù)采集義務(wù)而形成的對(duì)數(shù)據(jù)利用的權(quán)利17、下面關(guān)于政府信息公開(kāi)與政府?dāng)?shù)據(jù)開(kāi)放的描述,錯(cuò)誤的是:(B)[填空題]*_________________________________政府信息公開(kāi)與政府?dāng)?shù)據(jù)開(kāi)放是一對(duì)既相互區(qū)別又相互聯(lián)系的概念[單選題]*信息是沒(méi)有經(jīng)過(guò)任何加工與解讀的原始記錄,沒(méi)有明確的含義,而數(shù)據(jù)則是經(jīng)過(guò)加工處理并被賦予一定含義的(正確答案)政府信息公開(kāi)主要是為了對(duì)公眾知情權(quán)的滿足而出現(xiàn)的政府?dāng)?shù)據(jù)開(kāi)放強(qiáng)調(diào)的是數(shù)據(jù)的再利用,公眾可以分享數(shù)據(jù)利用創(chuàng)造的經(jīng)濟(jì)和社會(huì)價(jià)值18、關(guān)于公民的隱私權(quán),下面描述錯(cuò)誤的是:(A)[填空題]*_________________________________修改權(quán)是隱私權(quán)利人具有的依法了解自身信息資料是否被行政主體利用的權(quán)利[單選題]*支配權(quán)是隱私權(quán)利人的基本權(quán)利之一,隱私權(quán)利人對(duì)自己的個(gè)人信息的收集、儲(chǔ)存、傳播、使用、開(kāi)放等享有支配權(quán)(正確答案)保障權(quán)是指公民有權(quán)要求政府在數(shù)據(jù)開(kāi)放的過(guò)程中保障涉及其個(gè)人隱私的信息資料不被開(kāi)放、不被濫用和不被泄露救濟(jì)權(quán)是公民在自身的合法權(quán)益受到侵害時(shí),按照法定程序采取法律手段維護(hù)自身權(quán)益的權(quán)利19、關(guān)于大數(shù)據(jù)交易在發(fā)展過(guò)程中遇到的問(wèn)題,下面描述錯(cuò)誤的是:(D)[填空題]*_________________________________互聯(lián)網(wǎng)數(shù)據(jù)馬太效應(yīng)顯現(xiàn)[單選題]*市場(chǎng)信用體系缺失、監(jiān)管有待加強(qiáng)(正確答案)大數(shù)據(jù)交易規(guī)則和標(biāo)準(zhǔn)缺乏數(shù)據(jù)質(zhì)量評(píng)價(jià)與估值定價(jià)已經(jīng)很完善20、目前大數(shù)據(jù)交易市場(chǎng)上存在很多種定價(jià)機(jī)制,但是不包括以下哪項(xiàng):(D)[填空題]*_________________________________平臺(tái)預(yù)定價(jià)[單選題]*自動(dòng)計(jì)價(jià)(正確答案)拍賣(mài)式定價(jià)隨機(jī)性定價(jià)21、我國(guó)首家大數(shù)據(jù)交易所是:(A)[填空題]*_________________________________貴陽(yáng)大數(shù)據(jù)交易所[單選題]*上海數(shù)據(jù)交易中心(正確答案)華東江蘇大數(shù)據(jù)交易中心浙江大數(shù)據(jù)交易中心二、多選題[單選題]*1、傳統(tǒng)的數(shù)據(jù)安全的威脅主要包括:(ABC)(正確答案)計(jì)算機(jī)病毒[單選題]*黑客攻擊(正確答案)數(shù)據(jù)信息存儲(chǔ)介質(zhì)的損壞數(shù)據(jù)復(fù)制2、大數(shù)據(jù)安全表現(xiàn)出與傳統(tǒng)數(shù)據(jù)安全不同的特征,具體來(lái)說(shuō)包括哪幾個(gè)方面:(ABCD)[填空題]*_________________________________大數(shù)據(jù)成為網(wǎng)絡(luò)攻擊的顯著目標(biāo)[單選題]*大數(shù)據(jù)加大隱私泄露風(fēng)險(xiǎn)(正確答案)大數(shù)據(jù)技術(shù)被應(yīng)用到攻擊手段中大數(shù)據(jù)成為高級(jí)可持續(xù)攻擊(APT)的載體3、舍恩伯格在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書(shū)中明確指出,大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是思維方式的3種轉(zhuǎn)變,具體包括:(ABC)[填空題]*_________________________________全樣而非抽樣[單選題]*效率而非精確(正確答案)相關(guān)而非因果務(wù)實(shí)而非務(wù)虛4、下面關(guān)于搜索引擎“點(diǎn)擊模型”的描述正確的是:(ABCD)[填空題]*_________________________________隨著數(shù)據(jù)量的積累,點(diǎn)擊模型對(duì)搜索結(jié)果排名的預(yù)測(cè)越來(lái)越準(zhǔn)確,它的重要性也越來(lái)越大[單選題]*點(diǎn)擊模型的準(zhǔn)確性取決于數(shù)據(jù)量的大小(正確答案)一個(gè)搜索引擎使用的時(shí)間越長(zhǎng),數(shù)據(jù)的積累就越充分,對(duì)于長(zhǎng)尾搜索就做得越準(zhǔn)確[單選題]*當(dāng)整個(gè)搜索行業(yè)都意識(shí)到點(diǎn)擊數(shù)據(jù)的重要性后,這個(gè)市場(chǎng)上的競(jìng)爭(zhēng)就從技術(shù)競(jìng)爭(zhēng)變成了數(shù)據(jù)競(jìng)爭(zhēng)(正確答案)5、下面關(guān)于隱私泄露問(wèn)題的描述,正確的是:(ABCD)[填空題]*_________________________________大數(shù)據(jù)時(shí)代下的隱私與傳統(tǒng)隱私的最大區(qū)別在于隱私的數(shù)據(jù)化,即隱私主要以“個(gè)人數(shù)據(jù)”的形式出現(xiàn)[單選題]*用戶在使用搜索引擎時(shí),搜索引擎可以精確地刻畫(huà)出該用戶的“數(shù)字肖像”(正確答案)通過(guò)數(shù)據(jù)預(yù)測(cè),可以預(yù)測(cè)個(gè)體“未來(lái)的隱私”“數(shù)據(jù)痕跡”往往永遠(yuǎn)無(wú)法徹底消除,會(huì)被永久保留記錄6、下面關(guān)于數(shù)字鴻溝問(wèn)題的描述,正確的是:(ACD)[填空題]*_________________________________數(shù)字鴻溝被認(rèn)為是信息時(shí)代的“馬太效應(yīng)”,即先進(jìn)技術(shù)的成果不能為人公正分享,于是造成“富者越富、窮者越窮”的情況[單選題]*數(shù)字鴻溝因?yàn)榇髷?shù)據(jù)技術(shù)的誕生而趨向彌合(正確答案)數(shù)字鴻溝是一個(gè)涉及公平公正的問(wèn)題在我國(guó),東中西部地區(qū)、城鄉(xiāng)之間等都可以明顯感受到數(shù)字鴻溝的存在7、下面關(guān)于數(shù)據(jù)獨(dú)裁的描述,正確的是:(ABCD)[填空題]*_________________________________所謂的“數(shù)據(jù)獨(dú)裁”是指在大數(shù)據(jù)時(shí)代,由于數(shù)據(jù)量的爆炸式增長(zhǎng),導(dǎo)致做出判斷和選擇的難度徒增,迫使人們必須完全依賴(lài)數(shù)據(jù)的預(yù)測(cè)和結(jié)論才能做出最終的決策[單選題]*從某個(gè)角度來(lái)講,數(shù)據(jù)獨(dú)裁就是讓數(shù)據(jù)統(tǒng)治人類(lèi),使人類(lèi)徹底走向唯數(shù)據(jù)主義(正確答案)數(shù)據(jù)獨(dú)裁最終將導(dǎo)致人類(lèi)思維被“空心化”,進(jìn)而是創(chuàng)新意識(shí)的喪失數(shù)據(jù)獨(dú)裁還可能使人們喪失了人的自主意識(shí)、反思和批判的能力,最終淪為數(shù)據(jù)的奴隸因數(shù)據(jù)而產(chǎn)生的壟斷問(wèn)題,主要包括哪幾種類(lèi)型:(ABCD)[填空題]*_________________________________數(shù)據(jù)可能造成進(jìn)入壁壘或擴(kuò)張壁壘[單選題]*擁有大數(shù)據(jù)形成市場(chǎng)支配地位并濫用(正確答案)因數(shù)據(jù)產(chǎn)品而形成市場(chǎng)支配地位并濫用涉及數(shù)據(jù)方面的壟斷協(xié)議9、企業(yè)數(shù)據(jù)孤島產(chǎn)生的原因主要包括哪兩個(gè)方面:(AB)[填空題]*_________________________________以功能為標(biāo)準(zhǔn)的部門(mén)劃分導(dǎo)致數(shù)據(jù)孤島[單選題]*不同類(lèi)型、不同版本的信息化管理系統(tǒng)導(dǎo)致數(shù)據(jù)孤島(正確答案)機(jī)構(gòu)設(shè)置不合理各個(gè)部門(mén)責(zé)權(quán)利不清晰10、消除數(shù)據(jù)孤島對(duì)于政府具有哪些重要的意義:(ABCD)[填空題]*_________________________________有助于提升資源利用率[單選題]*有助于推動(dòng)政府轉(zhuǎn)型(正確答案)有助于提高行政效率有助于促進(jìn)跨部門(mén)合作11、消除數(shù)據(jù)孤島對(duì)于企業(yè)具有哪些重要的意義:(ABC)[填空題]*_________________________________有助于企業(yè)做出有利于生產(chǎn)要素組合優(yōu)化的決策,使企業(yè)能夠合理配置資源,實(shí)現(xiàn)企業(yè)利益最大化[單選題]*有利于企業(yè)獲得更好的經(jīng)營(yíng)發(fā)展能力(正確答案)企業(yè)信息的增多可以增加做出正確選擇的能力,從而提高經(jīng)濟(jì)效率不利于企業(yè)長(zhǎng)遠(yuǎn)的發(fā)展12、實(shí)現(xiàn)數(shù)據(jù)共享,在政府層面面臨的挑戰(zhàn)包括:(ABCD)[填空題]*_________________________________不愿共享開(kāi)放[單選題]*不敢共享開(kāi)放(正確答案)不會(huì)共享開(kāi)放數(shù)據(jù)中心共享開(kāi)放作用不強(qiáng)實(shí)現(xiàn)數(shù)據(jù)共享,在企業(yè)層面面臨的挑戰(zhàn)包括:(ABC)[填空題]*_________________________________系統(tǒng)孤島挑戰(zhàn)[單選題]*組織架構(gòu)挑戰(zhàn)(正確答案)數(shù)據(jù)合作挑戰(zhàn)利潤(rùn)風(fēng)險(xiǎn)挑戰(zhàn)14、關(guān)于政府?dāng)?shù)據(jù)開(kāi)放的意義,下面描述正確的是:(ABC)[填空題]*_________________________________政府開(kāi)放數(shù)據(jù)有利于促進(jìn)開(kāi)放透明政府的形成[單選題]*政府開(kāi)放數(shù)據(jù)有利于創(chuàng)新創(chuàng)業(yè)和經(jīng)濟(jì)增長(zhǎng)(正確答案)政府開(kāi)放數(shù)據(jù)有利于社會(huì)治理創(chuàng)新政府開(kāi)放數(shù)據(jù)將會(huì)對(duì)政府正常運(yùn)作產(chǎn)生威脅15、目前進(jìn)行數(shù)據(jù)交易的形式主要包括哪幾種:(ABC)[填空題]*_________________________________大數(shù)據(jù)交易公司
數(shù)據(jù)交易所[單選題]*API模式(正確答案)PPT模式16、大數(shù)據(jù)交易平臺(tái)的類(lèi)型主要包括哪兩種:(AD)[填空題]*_________________________________綜合數(shù)據(jù)服務(wù)平臺(tái)[單選題]*實(shí)時(shí)數(shù)據(jù)交易平時(shí)(正確答案)零散數(shù)據(jù)交易平臺(tái)第三方數(shù)據(jù)交易平臺(tái)17、交易數(shù)據(jù)的來(lái)源主要包括哪些:(ABCD)[填空題]*_________________________________政府公開(kāi)數(shù)據(jù)[單選題]*企業(yè)內(nèi)部數(shù)據(jù)(正確答案)數(shù)據(jù)供應(yīng)方數(shù)據(jù)網(wǎng)頁(yè)爬蟲(chóng)數(shù)據(jù)18、交易產(chǎn)品的類(lèi)型主要包括哪幾種:(ABCD)[填空題]*_________________________________API[單選題]*數(shù)據(jù)包(正確答案)云服務(wù)解決方案19、大數(shù)據(jù)交易平臺(tái)的運(yùn)營(yíng)模式主要包括哪兩種:(BC)[填空題]*_________________________________具有交易實(shí)時(shí)顯示功能的交易平臺(tái)[單選題]*兼具中介和數(shù)據(jù)處理加工功能的交易平臺(tái)(正確答案)只具備中介功能的交易平臺(tái)只具備數(shù)據(jù)處理加工功能的交易平臺(tái)20、可以從哪些維度評(píng)價(jià)數(shù)據(jù)價(jià)值:(ABCD)[填空題]*_________________________________數(shù)據(jù)樣本量[單選題]*數(shù)據(jù)品種(正確答案)數(shù)據(jù)完整性數(shù)據(jù)實(shí)時(shí)性第4章大數(shù)據(jù)應(yīng)用[單選題]*一、單選題(正確答案)1、下面關(guān)于推薦系統(tǒng)的描述錯(cuò)誤的是:(D)推薦系統(tǒng)是自動(dòng)聯(lián)系用戶和物品的一種工具[單選題]*和搜索引擎相比,推薦系統(tǒng)通過(guò)研究用戶的興趣偏好,進(jìn)行個(gè)性化計(jì)算(正確答案)推薦系統(tǒng)可發(fā)現(xiàn)用戶的興趣點(diǎn),幫助用戶從海量信息中去發(fā)掘自己潛在的需求推薦系統(tǒng)是一種只能通過(guò)專(zhuān)家進(jìn)行人工推薦的系統(tǒng)2、以下推薦方法中,哪一個(gè)是基于內(nèi)容的推薦:(C)[填空題]*_________________________________由資深的專(zhuān)業(yè)人士來(lái)進(jìn)行物品的篩選和推薦[單選題]*基于統(tǒng)計(jì)信息進(jìn)行推薦(正確答案)通過(guò)機(jī)器學(xué)習(xí)的方法去描述內(nèi)容的特征,并基于內(nèi)容的特征來(lái)發(fā)現(xiàn)與之相似的內(nèi)容對(duì)多種推薦算法進(jìn)行有機(jī)組合,然后給出推薦結(jié)果3、以下哪項(xiàng)不屬于大數(shù)據(jù)在城市管理中的應(yīng)用:(D)[填空題]*_________________________________智能交通[單選題]*環(huán)保監(jiān)測(cè)(正確答案)城市規(guī)劃比賽預(yù)測(cè)4、以下哪項(xiàng)不屬于大數(shù)據(jù)在零售領(lǐng)域的應(yīng)用:(A)[填空題]*_________________________________大數(shù)據(jù)征信[單選題]*發(fā)現(xiàn)關(guān)聯(lián)購(gòu)物行為(正確答案)客戶群體劃分供應(yīng)鏈管理二、多選題[單選題]*1、一個(gè)完整的推薦系統(tǒng)通常包括哪3個(gè)組成模塊:(ABC)(正確答案)用戶建模模塊[單選題]*推薦對(duì)象建模模塊(正確答案)推薦算法模塊可視化模塊2、智慧醫(yī)療具有哪些優(yōu)點(diǎn):(ABCD)[填空題]*_________________________________促進(jìn)優(yōu)質(zhì)醫(yī)療資源的共享[單選題]*避免患者重復(fù)檢查(正確答案)促進(jìn)醫(yī)療智能化有助于實(shí)現(xiàn)全民免費(fèi)醫(yī)療3、下面關(guān)于智能物流的描述,正確的是:ABCD[填空題]*_________________________________又稱(chēng)智慧物流,是利用智能化技術(shù),使物流系統(tǒng)能模仿人的智能,具有思維、感知、學(xué)習(xí)、推理判斷和自行解決物流中某些問(wèn)題的能力[單選題]*可以幫助實(shí)現(xiàn)物流資源優(yōu)化調(diào)度和有效配置,并且提升物流系統(tǒng)效率(正確答案)智能物流概念源自2010年IBM發(fā)布的研究報(bào)告《智慧的未來(lái)供應(yīng)鏈》智能物流概念經(jīng)歷了自動(dòng)化、信息化、網(wǎng)絡(luò)化3個(gè)發(fā)展階段4、智能物流具有哪幾個(gè)方面的重要作用:(ABC)[填空題]*_________________________________提高物流的信息化和智能化水平[單選題]*降低物流成本和提高物流效率(正確答案)提高物流活動(dòng)的一體化提高了物流的復(fù)雜性5、大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用主要包括:(ABCD)[填空題]*_________________________________高頻交易[單選題]*市場(chǎng)情緒分析(正確答案)信貸風(fēng)險(xiǎn)分析大數(shù)據(jù)征信6、大數(shù)據(jù)在餐飲行業(yè)的應(yīng)用主要包括:(ABCD)[填空題]*_________________________________大數(shù)據(jù)驅(qū)動(dòng)的團(tuán)購(gòu)模式[單選題]*利用大數(shù)據(jù)為用戶推薦消費(fèi)內(nèi)容(正確答案)利用大數(shù)據(jù)調(diào)整線下門(mén)店布局利用大數(shù)據(jù)控制店內(nèi)人流量第5章數(shù)據(jù)采集與預(yù)處理[填空題]*_________________________________單選題[填空題]*_________________________________以下哪個(gè)步驟不屬于數(shù)據(jù)的采集與預(yù)處理:(D)[填空題]*_________________________________利用ETL工具將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù),抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中[單選題]*利用日志采集工具把實(shí)時(shí)采集的數(shù)據(jù)作為流計(jì)算系統(tǒng)的輸入,進(jìn)行實(shí)時(shí)處理分析(正確答案)利用網(wǎng)頁(yè)爬蟲(chóng)程序到互聯(lián)網(wǎng)網(wǎng)站中爬取數(shù)據(jù)D、對(duì)分析結(jié)果進(jìn)行可視化呈現(xiàn),幫助人們更好地理解數(shù)據(jù)、分析數(shù)據(jù)以下哪項(xiàng)不屬于數(shù)據(jù)清洗的內(nèi)容:(B)[填空題]*_________________________________一致性檢查[單選題]*精確度校驗(yàn)(正確答案)無(wú)效值和缺失值的處理成對(duì)刪除3、以下哪個(gè)不是Flume的核心組件:()[單選題]*A.?dāng)?shù)據(jù)塊(Block)(正確答案)B.?dāng)?shù)據(jù)源(Source)C.?dāng)?shù)據(jù)通道(Channel)D.?dāng)?shù)據(jù)槽(Sink)6、下面關(guān)于網(wǎng)絡(luò)爬蟲(chóng)的描述錯(cuò)誤的是:()[單選題]*A.網(wǎng)絡(luò)爬蟲(chóng)是一個(gè)自動(dòng)提取網(wǎng)頁(yè)的程序B.為搜索引擎從萬(wàn)維網(wǎng)上下載網(wǎng)頁(yè),是搜索引擎的重要組成部分C.爬蟲(chóng)從一個(gè)或若干個(gè)初始網(wǎng)頁(yè)的URL開(kāi)始,獲得初始網(wǎng)頁(yè)上的URL,在抓取網(wǎng)頁(yè)的過(guò)程中,不斷從當(dāng)前頁(yè)面上抽取新的URL放入隊(duì)列,直到滿足系統(tǒng)的一定停止條件D.網(wǎng)絡(luò)爬蟲(chóng)的行為和人們?cè)L問(wèn)網(wǎng)站的行為是完全不同的(正確答案)7、下面關(guān)于網(wǎng)絡(luò)爬蟲(chóng)的描述正確的是:()[單選題]*A.網(wǎng)絡(luò)爬蟲(chóng)由控制節(jié)點(diǎn)、爬蟲(chóng)節(jié)點(diǎn)和資源庫(kù)構(gòu)成B.網(wǎng)絡(luò)爬蟲(chóng)中可以有多個(gè)控制節(jié)點(diǎn),每個(gè)控制節(jié)點(diǎn)下可以有多個(gè)爬蟲(chóng)節(jié)點(diǎn)C.控制節(jié)點(diǎn)之間可以互相通信,控制節(jié)點(diǎn)和其下的各爬蟲(chóng)節(jié)點(diǎn)之間也可以進(jìn)行互相通信D.屬于同一個(gè)控制節(jié)點(diǎn)下的各爬蟲(chóng)節(jié)點(diǎn)間不可以互相通信(正確答案)8、以下哪個(gè)不是Scrapy體系架構(gòu)的組成部分:()[單選題]*A.Scrapy引擎(Engine)B.爬蟲(chóng)(Spiders)C.支持者(Support)(正確答案)D.下載器(Downloader)9、下面關(guān)于反爬機(jī)制描述錯(cuò)誤的是:()[單選題]*A.簡(jiǎn)單低級(jí)的網(wǎng)絡(luò)爬蟲(chóng),數(shù)據(jù)采集速度快,偽裝度低,如果沒(méi)有反爬機(jī)制,它們可以很快地抓取大量數(shù)據(jù),甚至因?yàn)檎?qǐng)求過(guò)多,造成網(wǎng)站服務(wù)器不能正常工作,影響了企業(yè)的業(yè)務(wù)開(kāi)展B.反爬機(jī)制也是一把雙刃劍,一方面可以保護(hù)企業(yè)網(wǎng)站和網(wǎng)站數(shù)據(jù),但是,另一方面,如果反爬機(jī)制過(guò)于嚴(yán)格,可能會(huì)誤傷到真正的用戶請(qǐng)求C.如果既要和“網(wǎng)絡(luò)爬蟲(chóng)”死磕,又要保證很低的誤傷率,那么又會(huì)增加網(wǎng)站研發(fā)的成本D.反爬機(jī)制不利于信息的自由流通,不利于網(wǎng)站發(fā)展,應(yīng)該堅(jiān)決取消(正確答案)10、假設(shè)有一個(gè)數(shù)據(jù)集X={4,8,15,21,21,24,25,28,34},這里采用基于平均值的等高分箱方法對(duì)其進(jìn)行平滑處理,則分箱處理結(jié)果是:()[單選題]*A.{8,8,8,22,22,22,29,29,29}B.{9,9,9,22,22,22,29,29,29}(正確答案)C.{9,9,9,21,21,21,29,29,29}D.{9,9,9,22,22,22,28,28,28}11、假設(shè)屬性的最大值和最小值分別是87000元和11000元,現(xiàn)在需要利用Min-Max規(guī)范化方法,將“顧客收入”屬性的值映射到0~1的范圍內(nèi),則“顧客收入”屬性的值為72400元時(shí),對(duì)應(yīng)的轉(zhuǎn)換結(jié)果是:()[單選題]*A.0.808(正確答案)B.0.837C.0.769D.0.98712、假設(shè)A班級(jí)的平均分是80,標(biāo)準(zhǔn)差是10,A考了90分;B班的平均分是400,標(biāo)準(zhǔn)差是100,B考了600分。采用Z-Score規(guī)范化以后,二者誰(shuí)的成績(jī)更加優(yōu)秀:()[單選題]*A.A的成績(jī)更為優(yōu)秀B.B的成績(jī)更為優(yōu)秀(正確答案)C.二者一樣優(yōu)秀D.無(wú)法比較13、假設(shè)屬性的取值范圍是-957~924,當(dāng)屬性的值為426時(shí),采用小數(shù)定標(biāo)規(guī)范化方法對(duì)應(yīng)的轉(zhuǎn)換結(jié)果是:()[單選題]*A.0.421B.0.433C.0.426(正確答案)D.0.489二、多選題[單選題]*1、數(shù)據(jù)采集的三大要點(diǎn)是:(ABC)(正確答案)全面性[單選題]*多維性(正確答案)高效性D.精確性2、數(shù)據(jù)采集的主要數(shù)據(jù)源包括:(ABCD)[填空題]*_________________________________傳感器數(shù)據(jù)[單選題]*互聯(lián)網(wǎng)數(shù)據(jù)(正確答案)日志文件企業(yè)業(yè)務(wù)系統(tǒng)數(shù)據(jù)3、需要清洗的數(shù)據(jù)的主要類(lèi)型包括:(ACD)*殘缺數(shù)據(jù)(正確答案)干凈數(shù)據(jù)錯(cuò)誤數(shù)據(jù)重復(fù)數(shù)據(jù)4、典型的數(shù)據(jù)采集方法包括:()*A.系統(tǒng)日志采集(正確答案)B.分布式消息訂閱分發(fā)(正確答案)C.ETL(正確答案)D.網(wǎng)絡(luò)數(shù)據(jù)采集(正確答案)5、Kafka的架構(gòu)包括哪些組件:()*A.話題(Topic)(正確答案)B.生產(chǎn)者(Producer)(正確答案)C.服務(wù)代理(Broker)(正確答案)D.消費(fèi)者(Consumer)(正確答案)6、網(wǎng)絡(luò)爬蟲(chóng)的類(lèi)型主要包括:()[單選題]*A.通用網(wǎng)絡(luò)爬蟲(chóng)(正確答案)B.聚焦網(wǎng)絡(luò)爬蟲(chóng)C.增量式網(wǎng)絡(luò)爬蟲(chóng)D.深層網(wǎng)絡(luò)爬蟲(chóng)7、常見(jiàn)的數(shù)據(jù)轉(zhuǎn)換策略包括:()*A.平滑處理(正確答案)B.聚集處理(正確答案)C.?dāng)?shù)據(jù)泛化處理(正確答案)D.規(guī)范化處理(正確答案)8、常用的規(guī)范化處理方法包括:()*A.Min-Max規(guī)范化(正確答案)B.Z-Score規(guī)范化(正確答案)C.曲面規(guī)范化D.小數(shù)定標(biāo)規(guī)范化(正確答案)9、數(shù)據(jù)脫敏的主要原則包括:()*A.保持原有數(shù)據(jù)特征(正確答案)B.保持?jǐn)?shù)據(jù)之間的一致性(正確答案)C.保持業(yè)務(wù)規(guī)則的關(guān)聯(lián)性(正確答案)D.多次脫敏之間的數(shù)據(jù)一致性(正確答案)10、數(shù)據(jù)脫敏的方法主要包括:()*A.數(shù)據(jù)替換(正確答案)B.無(wú)效化(正確答案)C.隨機(jī)化(正確答案)D.偏移和取整(正確答案)第6章數(shù)據(jù)存儲(chǔ)與管理[填空題]*_________________________________單選題[填空題]*_________________________________1、以下哪項(xiàng)不屬于傳統(tǒng)的數(shù)據(jù)存儲(chǔ)和管理技術(shù):(A)[填空題]*_________________________________NoSQL數(shù)據(jù)庫(kù)[單選題]*文件系統(tǒng)(正確答案)關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)2、以下關(guān)于分布式文件系統(tǒng),描述錯(cuò)誤的是:(B)[填空題]*_________________________________是一種通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)文件在多臺(tái)主機(jī)上進(jìn)行分布式存儲(chǔ)的文件系統(tǒng)[單選題]*所有的分布式文件系統(tǒng)的設(shè)計(jì)都是采用“客戶機(jī)/服務(wù)器”(Client/Server)模式(正確答案)谷歌開(kāi)發(fā)了分布式文件系統(tǒng)GFSHadoop分布式文件系統(tǒng)(HadoopDistributedFileSystem,HDFS)是針對(duì)GFS的開(kāi)源實(shí)現(xiàn)3、以下描述錯(cuò)誤的是:(D)[填空題]*_________________________________傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)可以較好地支持結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)和管理[單選題]*Web2.0的迅猛發(fā)展以及大數(shù)據(jù)時(shí)代的到來(lái),使關(guān)系數(shù)據(jù)庫(kù)的發(fā)展越來(lái)越力不從心(正確答案)傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)由于數(shù)據(jù)模型不靈活、水平擴(kuò)展能力較差等局限性,已經(jīng)無(wú)法滿足各種類(lèi)型的非結(jié)構(gòu)化數(shù)據(jù)的大規(guī)模存儲(chǔ)需求傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)引以為豪的一些關(guān)鍵特性,如事務(wù)機(jī)制和支持復(fù)雜查詢(xún),在Web2.0時(shí)代成為不可或缺的核心特性4、以下關(guān)于NoSQL數(shù)據(jù)庫(kù)描述錯(cuò)誤的是:(C)[填空題]*_________________________________NoSQL是一種不同于關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)管理系統(tǒng)設(shè)計(jì)方式,是對(duì)非關(guān)系型數(shù)據(jù)庫(kù)的統(tǒng)稱(chēng)[單選題]*NoSQL所采用的數(shù)據(jù)模型并非傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的關(guān)系模型,而是類(lèi)似鍵/值、列族、文檔等非關(guān)系模型(正確答案)NoSQL數(shù)據(jù)庫(kù)有固定的表結(jié)構(gòu),通常存在較多連接操作D、與關(guān)系數(shù)據(jù)庫(kù)相比,NoSQL具有靈活的水平可擴(kuò)展性,可以支持海量數(shù)據(jù)存儲(chǔ)5、在數(shù)據(jù)庫(kù)的發(fā)展歷史上,先后出現(xiàn)過(guò)多種數(shù)據(jù)庫(kù)類(lèi)型,但是,不包括:()[單選題]*A.網(wǎng)狀數(shù)據(jù)庫(kù)B.球形數(shù)據(jù)庫(kù)(正確答案)C.層次數(shù)據(jù)庫(kù)D.關(guān)系數(shù)據(jù)庫(kù)6、下面關(guān)于關(guān)系數(shù)據(jù)庫(kù)特點(diǎn)的描述,錯(cuò)誤的是:()[單選題]*A.采用表格的儲(chǔ)存方式,數(shù)據(jù)以行和列的方式進(jìn)行存儲(chǔ),要讀取和查詢(xún)都十分方便B.為了規(guī)范化數(shù)據(jù)、減少重復(fù)數(shù)據(jù)以及充分利用好存儲(chǔ)空間,把數(shù)據(jù)按照最小關(guān)系表的形式進(jìn)行存儲(chǔ)C.由于關(guān)系數(shù)據(jù)庫(kù)將數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)表中,數(shù)據(jù)操作的瓶頸出現(xiàn)在多張數(shù)據(jù)表的操作中,而且數(shù)據(jù)表越多這個(gè)問(wèn)題越嚴(yán)重D.關(guān)系數(shù)據(jù)庫(kù)采用非結(jié)構(gòu)化查詢(xún)語(yǔ)言來(lái)對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢(xún)(正確答案)7、下面關(guān)于NewSQL數(shù)據(jù)庫(kù)的描述,錯(cuò)誤的是:()[單選題]*A.NewSQL數(shù)據(jù)庫(kù)保持了傳統(tǒng)數(shù)據(jù)庫(kù)支持ACID和SQL等特性B.不同的NewSQL數(shù)據(jù)庫(kù)的內(nèi)部結(jié)構(gòu)基本相同(正確答案)C.都支持關(guān)系數(shù)據(jù)模型D.都使用SQL作為其主要的接口8、下面關(guān)于Hadoop的描述錯(cuò)誤的是:()[單選題]*A.Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架B.作為并行分布式計(jì)算平臺(tái),Hadoop采用分布式存儲(chǔ)和分布式處理兩大核心技術(shù),能夠高效地處理PB級(jí)數(shù)據(jù)C.Hadoop只支持Java編程語(yǔ)言(正確答案)D.Hadoop可以高效穩(wěn)定地運(yùn)行在廉價(jià)的計(jì)算機(jī)集群上,可以擴(kuò)展到數(shù)以千計(jì)的計(jì)算機(jī)節(jié)點(diǎn)上9、下面哪個(gè)不是Hadoop生態(tài)系統(tǒng)的組件:()[單選題]*A.HDFSB.SQLServer(正確答案)C.MapReduceD.HBase10、下面組件哪個(gè)是負(fù)責(zé)在Hadoop和關(guān)系數(shù)據(jù)庫(kù)之間實(shí)現(xiàn)數(shù)據(jù)導(dǎo)入導(dǎo)出的:()[單選題]*A.MySQLB.HDFSC.Sqoop(正確答案)D.Flume11、下面組件哪個(gè)是負(fù)責(zé)分布式資源調(diào)度與管理的:()[單選題]*A.YARN(正確答案)B.FlumeC.ZookeeperD.Kafka12、下面組件哪個(gè)是數(shù)據(jù)挖掘庫(kù):()[單選題]*A.ZookeeperB.Mahout(正確答案)C.MySQLD.HBase13、下面組件哪個(gè)是負(fù)責(zé)日志收集的:()[單選題]*A.AmbariB.ZookeeperC.HDFSD.Flume(正確答案)14、下面組件哪個(gè)是負(fù)責(zé)Hadoop集群的安裝、部署、配置和管理的:()[單選題]*A.KafkaB.YARNC.Ambari(正確答案)D.Flume15、下列哪一項(xiàng)不屬于NoSQL的四大類(lèi)型:()[單選題]*A.文檔數(shù)據(jù)庫(kù)B.圖數(shù)據(jù)庫(kù)C.列族數(shù)據(jù)庫(kù)D.時(shí)間戳數(shù)據(jù)庫(kù)(正確答案)16、下列關(guān)于鍵值數(shù)據(jù)庫(kù)的描述,哪一項(xiàng)是錯(cuò)誤的:()[單選題]*A.擴(kuò)展性好,靈活性好B.大量寫(xiě)操作時(shí)性能高C.無(wú)法存儲(chǔ)結(jié)構(gòu)化信息D.條件查詢(xún)效率高(正確答案)17、下列關(guān)于列族數(shù)據(jù)庫(kù)的描述,哪一項(xiàng)是錯(cuò)誤的:()[單選題]*A.查找速度慢,可擴(kuò)展性差(正確答案)B.功能較少,大都不支持強(qiáng)事務(wù)一致性C.容易進(jìn)行分布式擴(kuò)展D.復(fù)雜性低18、關(guān)于文檔數(shù)據(jù)庫(kù)的說(shuō)法,下列哪一項(xiàng)是錯(cuò)誤的:()[單選題]*A數(shù)據(jù)是規(guī)則的(正確答案)B.性能好(高并發(fā))C.缺乏統(tǒng)一的查詢(xún)語(yǔ)法D.復(fù)雜性低19、下列關(guān)于云數(shù)據(jù)庫(kù)的描述,哪個(gè)是錯(cuò)誤的?()[單選題]*A.云數(shù)據(jù)庫(kù)是部署和虛擬化在云計(jì)算環(huán)境中的數(shù)據(jù)庫(kù)B.云數(shù)據(jù)庫(kù)是在云計(jì)算的大背景下發(fā)展起來(lái)的一種新興的共享基礎(chǔ)架構(gòu)的方法C.云數(shù)據(jù)庫(kù)價(jià)格不菲,維護(hù)費(fèi)用極其昂貴(正確答案)D.云數(shù)據(jù)庫(kù)具有高可擴(kuò)展性、高可用性、采用多租形式和支持資源有效分發(fā)等特點(diǎn)20、下列哪一個(gè)不屬于云數(shù)據(jù)庫(kù)產(chǎn)品?()[單選題]*A.本地安裝MySQL(正確答案)B.阿里云RDSC.OracleCloudD.百度云數(shù)據(jù)庫(kù)21、下面哪一項(xiàng)不是云數(shù)據(jù)庫(kù)的特性?()[單選題]*A.動(dòng)態(tài)可擴(kuò)展B.高成本(正確答案)C.易用性D.大規(guī)模并行處理22、下列關(guān)于BigTable的描述,哪個(gè)是錯(cuò)誤的?()[單選題]*A.爬蟲(chóng)持續(xù)不斷地抓取新頁(yè)面,這些頁(yè)面每隔一段時(shí)間地存儲(chǔ)到BigTable里(正確答案)B.BigTable是一個(gè)分布式存儲(chǔ)系統(tǒng)C.BigTable起初用于解決典型的互聯(lián)網(wǎng)搜索問(wèn)題D.網(wǎng)絡(luò)搜索應(yīng)用查詢(xún)建立好的索引,從BigTable得到網(wǎng)頁(yè)多選題[填空題]*_________________________________1、數(shù)據(jù)倉(cāng)庫(kù)的特性包括:(ABCD)[填空題]*_________________________________面向主題的[單選題]*集成的(正確答案)相對(duì)穩(wěn)定的反映歷史變化的2、NoSQL數(shù)據(jù)庫(kù)具有以下幾個(gè)特點(diǎn):(ABC)[填空題]*_________________________________靈活的可擴(kuò)展性[單選題]*靈活的數(shù)據(jù)模型(正確答案)與云計(jì)算緊密融合數(shù)據(jù)模型比較死板3、一個(gè)典型的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)通常包含哪幾個(gè)組成部分:()*A.數(shù)據(jù)源(正確答案)B.數(shù)據(jù)存儲(chǔ)和管理(正確答案)C.OLAP服務(wù)器(正確答案)D.前端工具和應(yīng)用(正確答案)4、下面關(guān)于并行數(shù)據(jù)庫(kù)的描述正確的是:()*A.并行數(shù)據(jù)庫(kù)是指那些在無(wú)共享的體系結(jié)構(gòu)中進(jìn)行數(shù)據(jù)操作的數(shù)據(jù)庫(kù)系統(tǒng)(正確答案)B.大部分采用了關(guān)系數(shù)據(jù)模型并且支持SQL語(yǔ)句查詢(xún)(正確答案)C.并行數(shù)據(jù)庫(kù)系統(tǒng)具有較好的彈性D.并行數(shù)據(jù)庫(kù)的另一個(gè)問(wèn)題就是系統(tǒng)的容錯(cuò)性較差(正確答案)5、Hadoop的特性主要包括:()*A.高可靠性(正確答案)B.高可擴(kuò)展性(正確答案)C.高容錯(cuò)性(正確答案)D.成本高6、HDFS要實(shí)現(xiàn)哪些設(shè)計(jì)目標(biāo):()*A.復(fù)雜的文件模型B.兼容廉價(jià)的硬件設(shè)備(正確答案)C.流數(shù)據(jù)讀寫(xiě)(正確答案)D.強(qiáng)大的跨平臺(tái)兼容性(正確答案)7、HDFS的局限性包括:()*A.不適合低延遲數(shù)據(jù)訪問(wèn)(正確答案)B.無(wú)法用于大規(guī)模數(shù)據(jù)存儲(chǔ)C.無(wú)法高效存儲(chǔ)大量小文件(正確答案)D.不支持多用戶寫(xiě)入及任意修改文件(正確答案)8、下面關(guān)于HDFS的體系結(jié)構(gòu)描述正確的是:()*A.HDFS采用了主從(Master/Slave)結(jié)構(gòu)模型,一個(gè)HDFS集群包括一個(gè)名稱(chēng)節(jié)點(diǎn)和若干個(gè)數(shù)據(jù)節(jié)點(diǎn)(正確答案)B.名稱(chēng)節(jié)點(diǎn)作為中心服務(wù)器,負(fù)責(zé)管理文件系統(tǒng)的命名空間及客戶端對(duì)文件的訪問(wèn)(正確答案)C.集群中的數(shù)據(jù)節(jié)點(diǎn)一般是一個(gè)節(jié)點(diǎn)運(yùn)行一個(gè)數(shù)據(jù)節(jié)點(diǎn)進(jìn)程,負(fù)責(zé)處理文件系統(tǒng)客戶端的讀/寫(xiě)請(qǐng)求(正確答案)D.名稱(chēng)節(jié)點(diǎn)會(huì)周期性地向數(shù)據(jù)節(jié)點(diǎn)發(fā)送“心跳”信息,報(bào)告自己的狀態(tài)9、下列關(guān)于文檔數(shù)據(jù)庫(kù)的描述,哪些是正確的?()*A.性能好(高并發(fā)),靈活性高(正確答案)B.具備統(tǒng)一的查詢(xún)語(yǔ)法C.文檔數(shù)據(jù)庫(kù)支持文檔間的事務(wù)D.復(fù)雜性低,數(shù)據(jù)結(jié)構(gòu)靈活(正確答案)10、下列關(guān)于圖數(shù)據(jù)庫(kù)的描述,哪些是正確的?()*A.專(zhuān)門(mén)用于處理具有高度相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)(正確答案)B.比較適合于社交網(wǎng)絡(luò)、模式識(shí)別、依賴(lài)分析、推薦系統(tǒng)以及路徑尋找等問(wèn)題(正確答案)C.靈活性高,支持復(fù)雜的圖算法(正確答案)D.復(fù)雜性高,只能支持一定的數(shù)據(jù)規(guī)模(正確答案)11、下列關(guān)于數(shù)據(jù)模型的描述,哪些是正確的?()*A.HBase采用表來(lái)組織數(shù)據(jù),表由行和列組成,列劃分為若干個(gè)列族(正確答案)B.每個(gè)HBase表都由若干行組成,每個(gè)行由行鍵(rowkey)來(lái)標(biāo)識(shí)(正確答案)C.列族里的數(shù)據(jù)通過(guò)列限定符(或列)來(lái)定位(正確答案)D.每個(gè)單元格都保存著同一份數(shù)據(jù)的多個(gè)版本,這些版本采用時(shí)間戳進(jìn)行索引(正確答案)12、HBase的系統(tǒng)架構(gòu)包括哪幾個(gè)組成部分:()*A.客戶端(正確答案)B.Zookeeper服務(wù)器(正確答案)C.Master主服務(wù)器(正確答案)D.Region服務(wù)器(正確答案)13、下面關(guān)于GoogleSpanner的描述正確的是:()*A.Spanner是一個(gè)可擴(kuò)展的、全球分布式的數(shù)據(jù)庫(kù)(正確答案)B.在最高抽象層面,Spanner就是一個(gè)數(shù)據(jù)庫(kù),把數(shù)據(jù)分片存儲(chǔ)在許多Paxos狀態(tài)機(jī)上,這些機(jī)器位于遍布全球的數(shù)據(jù)中心內(nèi)(正確答案)C.隨著數(shù)據(jù)的變化和服務(wù)器的變化,Spanner會(huì)自動(dòng)把數(shù)據(jù)進(jìn)行重新分片,從而有效應(yīng)對(duì)負(fù)載變化和處理失敗(正確答案)D.Spanner被設(shè)計(jì)成可以擴(kuò)展到幾百萬(wàn)個(gè)機(jī)器節(jié)點(diǎn),跨越成百上千個(gè)數(shù)據(jù)中心,具備幾萬(wàn)億數(shù)據(jù)庫(kù)行的規(guī)模(正確答案)第7章數(shù)據(jù)處理與分析[填空題]*_________________________________一、單選題
1、下面描述錯(cuò)誤的是:()[單選題]*A.數(shù)據(jù)分析可以分為廣義的數(shù)據(jù)分析和狹義的數(shù)據(jù)分析B.廣義的數(shù)據(jù)分析就包括狹義的數(shù)據(jù)分析和數(shù)據(jù)挖掘。C.數(shù)據(jù)挖掘就是指狹義的數(shù)據(jù)分析(正確答案)D.數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中挖掘出未知的、且有價(jià)值的信息和知識(shí)的過(guò)程2、下面描述錯(cuò)誤的是:()[單選題]*A.數(shù)據(jù)挖掘的目標(biāo)明確,先做假設(shè),然后通過(guò)數(shù)據(jù)分析來(lái)驗(yàn)證假設(shè)是否正確,從而得到相應(yīng)的結(jié)論(正確答案)B.數(shù)據(jù)挖掘的重點(diǎn)在尋找未知的模式與規(guī)律C.數(shù)據(jù)分析一般都是得到一個(gè)指標(biāo)統(tǒng)計(jì)量結(jié)果,如總和、平均值等D.數(shù)據(jù)挖掘則是輸出模型或規(guī)則,并且可相應(yīng)得到模型得分或標(biāo)簽3、下面關(guān)于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的描述錯(cuò)誤的是:()[單選題]*A.機(jī)器學(xué)習(xí)是一門(mén)多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門(mén)學(xué)科B.數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中通過(guò)算法搜索隱藏于其中信息的過(guò)程。C.數(shù)據(jù)挖掘可以視為機(jī)器學(xué)習(xí)與數(shù)據(jù)庫(kù)的交叉D.數(shù)據(jù)挖掘是機(jī)器學(xué)習(xí)的底層技術(shù)(正確答案)4、以下哪個(gè)不是典型的分類(lèi)方法:()[單選題]*A.決策樹(shù)B.樸素貝葉斯C.K-Means(正確答案)D.人工神經(jīng)網(wǎng)絡(luò)5、以下哪個(gè)不是聚類(lèi)方法:()[單選題]*A.GMMB.LDAC.DBSCAND.TPLINK(正確答案)6、聚類(lèi)分析的常見(jiàn)應(yīng)用場(chǎng)景不包括:()[單選題]*A.發(fā)現(xiàn)關(guān)聯(lián)購(gòu)買(mǎi)行為(正確答案)B.目標(biāo)用戶的群體分類(lèi)C.不同產(chǎn)品的價(jià)值組合D.探測(cè)發(fā)現(xiàn)離群點(diǎn)和異常值7、下面關(guān)于回歸分析的描述錯(cuò)誤的是:()[單選題]*A.是確定兩種或兩種以上變量間相互依賴(lài)的定量關(guān)系的一種統(tǒng)計(jì)分析方法B.回歸分析按照涉及的變量的多少,分為一元回歸和多元回歸分析C.按照因變量的多少,可分為線性回歸分析和非線性回歸分析(正確答案)D.在大數(shù)據(jù)分析中,回歸分析是一種預(yù)測(cè)性的建模技術(shù)8、下面關(guān)于協(xié)同過(guò)濾算法的描述錯(cuò)誤的是:()[單選題]*A.基于用戶的協(xié)同過(guò)濾算法(簡(jiǎn)稱(chēng)UserCF算法)是推薦系統(tǒng)中最古老的算法,可以說(shuō),UserCF的誕生標(biāo)志著推薦系統(tǒng)的誕生B.基于物品的協(xié)同過(guò)濾算法(簡(jiǎn)稱(chēng)ItemCF算法)是目前業(yè)界應(yīng)用最多的算法C.基于模型的協(xié)同過(guò)濾算法(ModelCF)是通過(guò)已經(jīng)觀察到的所有用戶給產(chǎn)品的打分,來(lái)推斷每個(gè)用戶的喜好并向用戶推薦適合的產(chǎn)品D.UserCF算法是給目標(biāo)用戶推薦那些和他們之前喜歡的物品相似的物品。(正確答案)9、下面屬于批處理技術(shù)的是:(A)[填空題]*_________________________________A.MapReduce[單選題]*B.Storm(正確答案)C.SparkStreamingD.GraphX10、下面屬于流計(jì)算技術(shù)的是:(C)[填空題]*_________________________________A.SparkMLLib[單選題]*B.GraphX(正確答案)C.S4D.Hive11、下面屬于圖計(jì)算技術(shù)的是:(A)[填空題]*_________________________________A.Pregel[單選題]*B.Dremel(正確答案)C.ImpalaD.DStream12、下面屬于查詢(xún)分析計(jì)算技術(shù)的是:(C)[填空題]*_________________________________A.SparkStreaming[單選題]*B.Storm(正確答案)C.HiveD.Pregel13、下列關(guān)于流計(jì)算的說(shuō)法,哪項(xiàng)是錯(cuò)誤的?()[單選題]*A.實(shí)時(shí)獲取來(lái)自不同數(shù)據(jù)源的海量數(shù)據(jù),經(jīng)過(guò)實(shí)時(shí)分析處理,獲得有價(jià)值的信息B.流計(jì)算秉承一個(gè)基本理念,即數(shù)據(jù)的價(jià)值隨著時(shí)間的流逝而降低C.對(duì)于一個(gè)流計(jì)算系統(tǒng)來(lái)說(shuō),它應(yīng)該支持TB級(jí)甚至是PB級(jí)的數(shù)據(jù)規(guī)模D.流計(jì)算只需要保證較低的延遲時(shí)間,即只達(dá)到秒級(jí)別即可處理一切問(wèn)題(正確答案)14.下列關(guān)于數(shù)據(jù)處理流程,說(shuō)法有誤的是?()[單選題]*A.在傳統(tǒng)的數(shù)據(jù)處理流程中,存儲(chǔ)的數(shù)據(jù)是舊的B.在傳統(tǒng)的數(shù)據(jù)處理流程中,需要用戶主動(dòng)發(fā)出查詢(xún)來(lái)獲取結(jié)果C.傳統(tǒng)的數(shù)據(jù)處理流程,需要先采集數(shù)據(jù)并存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)等數(shù)據(jù)管理系統(tǒng)中D.流計(jì)算的處理流程一般包含三個(gè)階段:數(shù)據(jù)實(shí)時(shí)采集、數(shù)據(jù)批量計(jì)算、實(shí)時(shí)查詢(xún)服務(wù)(正確答案)15、下面哪個(gè)屬于圖數(shù)據(jù)庫(kù):()[單選題]*A.Neo4j(正確答案)B.MySQLC.HBaseD.Oracle16、下列關(guān)于MapReduce模型的描述,錯(cuò)誤的是哪一項(xiàng)?()[單選題]*A.MapReduce采用“分而治之”策略B.MapReduce設(shè)計(jì)的一個(gè)理念就是“計(jì)算向數(shù)據(jù)靠攏”C.MapReduce框架采用了Master/Slave架構(gòu)D.MapReduce應(yīng)用程序只能用Java來(lái)寫(xiě)(正確答案)17、關(guān)于數(shù)據(jù)倉(cāng)庫(kù)Impala的描述錯(cuò)誤的是:()[單選題]*A.Impala作為開(kāi)源大數(shù)據(jù)分析引擎,支持實(shí)時(shí)計(jì)算,它提供了與Hive類(lèi)似的功能,并在性能上比Hive高出3~30倍B.Impala是由Cloudera公司開(kāi)發(fā)的查詢(xún)系統(tǒng)C.Impala提供了SQL語(yǔ)義,能查詢(xún)存儲(chǔ)在Hadoop的HDFS和HBase上的PB級(jí)別海量數(shù)據(jù)D.Impala最初是參照MySQL系統(tǒng)進(jìn)行設(shè)計(jì)的(正確答案)18、下面關(guān)于Spark和Hadoop的關(guān)系,描述錯(cuò)誤的是:()[單選題]*A.Spark和Hadoop一樣,既包含了存儲(chǔ)的組件,也包含了計(jì)算的組件B.Spark作為計(jì)算框架,只能解決數(shù)據(jù)計(jì)算問(wèn)題,無(wú)法解決數(shù)據(jù)存儲(chǔ)問(wèn)題C.Spark只是取代了Hadoop生態(tài)系統(tǒng)中的計(jì)算框架MapReduce,而Hadoop中的其他組件依然在企業(yè)大數(shù)據(jù)系統(tǒng)中發(fā)揮著重要的作用D.越來(lái)越多的企業(yè)放棄MapReduce,轉(zhuǎn)而使用Spark開(kāi)發(fā)企業(yè)應(yīng)用(正確答案)19、以下哪個(gè)不是Spark的生態(tài)系統(tǒng)的組件:()[單選題]*A.SparkStreamingB.StructuredStreamingC.Zookeeper(正確答案)D.GraphX20、以下哪個(gè)組件是Spark中的機(jī)器學(xué)習(xí)算法庫(kù):()[單選題]*A.MLlib(正確答案)B.SparkCoreC.MachineLeaningD.SparkSQL21、以下哪個(gè)組件是Spark中用于結(jié)構(gòu)化數(shù)據(jù)處理的組件:()[單選題]*A.SparkSQL(正確答案)B.SparkCoreC.SparkStreamingD.StructuredStreaming22、Shark與SparkSQL的關(guān)系是:()[單選題]*A.二者沒(méi)有任何關(guān)系B.Shark是SparkSQL的前身(正確答案)C.SparkSQL是Shark的前身D.二者是一個(gè)軟件的兩個(gè)不同名稱(chēng),本質(zhì)上是一個(gè)東西23、下面關(guān)于TensorFlow和TensorFlowOnSpark的描述錯(cuò)誤的是:()[單選題]*A.TensorFlow是一個(gè)采用數(shù)據(jù)流圖(DataFlowGraph)、用于數(shù)值計(jì)算的開(kāi)源軟件庫(kù)B.TensorFlow是一個(gè)開(kāi)源的、基于Java的機(jī)器學(xué)習(xí)框架(正確答案)C.TensorFlowOnSpark項(xiàng)目是由Yahoo開(kāi)源的一個(gè)軟件包,能將TensorFlow與Spark結(jié)合在一起使用D.TensorFlowOnSpark為ApacheHadoop和ApacheSpark集群帶來(lái)可擴(kuò)展的深度學(xué)習(xí)功能24、以下哪個(gè)不是Storm的特點(diǎn):()[單選題]*A.可擴(kuò)展性B.可靠的消息處理C.支持各種編程語(yǔ)言D.復(fù)雜的API(正確答案)25、下面關(guān)于SparkStreaming和Storm的描述錯(cuò)誤的是:()[單選題]*A.SparkStreaming可以實(shí)現(xiàn)毫秒級(jí)的流計(jì)算(正確答案)B.Storm可以實(shí)現(xiàn)毫秒級(jí)響應(yīng)C.SparkStreaming構(gòu)建在SparkCore之上D.SparkStreaming可以同時(shí)兼容批量和實(shí)時(shí)數(shù)據(jù)處理的邏輯和算法26、下面關(guān)于Flink的描述錯(cuò)誤的是:()[單選題]*A.Flink是一個(gè)針對(duì)流數(shù)據(jù)和批數(shù)據(jù)的分布式計(jì)算框架B.Flink的設(shè)計(jì)思想主要來(lái)源于Hadoop、MPP數(shù)據(jù)庫(kù)、流計(jì)算系統(tǒng)等C.Flink主要是由Python代碼實(shí)現(xiàn)的(正確答案)D.Flink所要處理的主要場(chǎng)景是流數(shù)據(jù),批數(shù)據(jù)只是流數(shù)據(jù)的一個(gè)特例而已二、多選題[填空題]*_________________________________1、數(shù)據(jù)分析主要實(shí)現(xiàn)哪三大作用:()*A.誤差分析B.現(xiàn)狀分析(正確答案)C.原因分析(正確答案)D.預(yù)測(cè)分析(正確答案)2、數(shù)據(jù)挖掘主要側(cè)重解決哪幾類(lèi)問(wèn)題:()*A.分類(lèi)(正確答案)B.聚類(lèi)(正確答案)C.關(guān)聯(lián)(正確答案)D.預(yù)測(cè)(正確答案)3、下面關(guān)于數(shù)據(jù)分析與數(shù)據(jù)處理的描述,正確的是:()*A.數(shù)據(jù)分析過(guò)程通常會(huì)伴隨著發(fā)生數(shù)據(jù)處理(或者說(shuō)伴隨著大量數(shù)據(jù)計(jì)算)(正確答案)B.數(shù)據(jù)分析和數(shù)據(jù)處理不存在緊密的關(guān)聯(lián)關(guān)系C.二者是融合在一起的,很難割裂開(kāi)來(lái)(正確答案)D.當(dāng)用戶在進(jìn)行數(shù)據(jù)分析的時(shí)候,底層的計(jì)算機(jī)系統(tǒng)會(huì)根據(jù)數(shù)據(jù)分析任務(wù)的要求,使用程序進(jìn)行大量的數(shù)據(jù)處理(正確答案)4、下面關(guān)于大數(shù)據(jù)處理與分析的描述,正確的是:()*A.在理論層面,數(shù)據(jù)分析需要統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等知識(shí)(正確答案)B.在技術(shù)層面,包括單機(jī)分析工具(比如SPSS、SAS等)或單機(jī)編程語(yǔ)言(比如Python、R),以及大數(shù)據(jù)處理與分析技術(shù)(比如MapReduce、Spark、Hive等)(正確答案)C.在大數(shù)據(jù)時(shí)代到來(lái)之前,數(shù)據(jù)分析主要以小規(guī)模的抽樣數(shù)據(jù)為主,一般使用單機(jī)分析工具(比如SPSS和SAS)或者單機(jī)編程(比如Python、R)的方式來(lái)實(shí)現(xiàn)分析程序(正確答案)D.到了大數(shù)據(jù)時(shí)代,數(shù)據(jù)量爆炸式地增長(zhǎng),數(shù)據(jù)分析就需要采用分布式實(shí)現(xiàn)技術(shù),比如使用MapReduce、Spark或Flink編寫(xiě)分布式分析程序,借助于集群的多臺(tái)機(jī)器進(jìn)行并行數(shù)據(jù)處理分析(正確答案)5、常見(jiàn)的關(guān)聯(lián)規(guī)則挖掘算法包括:()*A.MP-Growth算法B.FP-Growth算法(正確答案)C.Apriori算法(正確答案)D.Bpriori算法6、協(xié)同過(guò)濾主要包括:()*A.基于用戶的協(xié)同過(guò)濾(正確答案)B.基于物品的協(xié)同過(guò)濾(正確答案)C.基于模型的協(xié)同過(guò)濾(正確答案)D.基于分類(lèi)的協(xié)同過(guò)濾7、大數(shù)據(jù)處理分析技術(shù)主要包括哪幾種類(lèi)型:()*A.批處理計(jì)算(正確答案)B.流計(jì)算(正確答案)C.圖計(jì)算(正確答案)D.查詢(xún)分析計(jì)算(正確答案)8、一次BSP計(jì)算過(guò)程包括一系列全局超步(超步就是指計(jì)算中的一次迭代),每個(gè)超步主要包括哪幾個(gè)組件:()*A.局部計(jì)算(正確答案)B.中間計(jì)算C.通信(正確答案)D.柵欄同步(正確答案)9、下面關(guān)于MapReduce工作流程的描述,正確的是:()*A.一個(gè)大的MapReduce作業(yè),會(huì)被拆分成許多個(gè)Map任務(wù)在多臺(tái)機(jī)器上并行執(zhí)行(正確答案)B.每個(gè)Map任務(wù)通常運(yùn)行在數(shù)據(jù)存儲(chǔ)的節(jié)點(diǎn)上(正確答案)C.當(dāng)Map任務(wù)結(jié)束后,會(huì)生成以<key,value-list>形式表示的許多中間結(jié)果D.Reduce任務(wù)會(huì)對(duì)中間結(jié)果進(jìn)行匯總計(jì)算得到最后結(jié)果(正確答案)10、Hadoop的MapReduce的缺點(diǎn)包括:()*A.表達(dá)能力有限(正確答案)B.磁盤(pán)IO開(kāi)銷(xiāo)大(正確答案)C.延遲高(正確答案)D.中間結(jié)果多11、Hive底層所依賴(lài)的計(jì)算引擎可以是:()*A.FlinkB.MapReduce(正確答案)C.Tez(正確答案)D.Spark(正確答案)12、下面關(guān)于Hive的描述正確的是:()*A.Hive是一個(gè)基于Hadoop的數(shù)據(jù)倉(cāng)庫(kù)工具,可以用于對(duì)存儲(chǔ)在Hadoop文件中的數(shù)據(jù)集進(jìn)行數(shù)據(jù)整理、特殊查詢(xún)和分析處理(正確答案)B.Hive的學(xué)習(xí)門(mén)檻比較低,因?yàn)樗峁┝祟?lèi)似于關(guān)系數(shù)據(jù)庫(kù)SQL語(yǔ)言的查詢(xún)語(yǔ)言——HiveQL(正確答案)C.當(dāng)采用MapReduce作為執(zhí)行引擎時(shí),Hive可以通過(guò)HiveQL語(yǔ)句快速實(shí)現(xiàn)簡(jiǎn)單的MapReduce統(tǒng)計(jì),Hive自身可以將HiveQL語(yǔ)句快速轉(zhuǎn)換成MapReduce任務(wù)進(jìn)行運(yùn)行(正確答案)D.Hive在某種程度上可以看作是用戶編程接口,其本身并不存儲(chǔ)和處理數(shù)據(jù)(正確答案)13、關(guān)于Hive與Hadoop生態(tài)系統(tǒng)中其他組件的關(guān)系,下面描述正確的是:()*A.HDFS作為高可靠的底層存儲(chǔ),用來(lái)存儲(chǔ)海量數(shù)據(jù)(正確答案)B.MapReduce對(duì)這些海量數(shù)據(jù)進(jìn)行批處理,實(shí)現(xiàn)高性能計(jì)算(正確答案)C.用HiveQL語(yǔ)句編寫(xiě)的處理邏輯,最終都要轉(zhuǎn)化為MapReduce任務(wù)來(lái)運(yùn)行(正確答案)D.Hive的目標(biāo)是取代HBase14、Hive的系統(tǒng)架構(gòu)主要包括哪幾個(gè)模塊:()*A.探查模塊B.驅(qū)動(dòng)模塊(正確答案)C.元數(shù)據(jù)存儲(chǔ)模塊(正確答案)D.用戶接口模塊(正確答案)15、關(guān)于數(shù)據(jù)倉(cāng)庫(kù)Impala的描述正確的是:()*A.Impala是由Oracle公司開(kāi)發(fā)的查詢(xún)系統(tǒng)B.與Hive類(lèi)似,Impala也可以直接與HDFS和HBase進(jìn)行交互(正確答案)C.Impala采用了與商用MPP并行關(guān)系數(shù)據(jù)庫(kù)類(lèi)似的分布式查詢(xún)引擎,可以直接從HDFS或者HBase中用SQL語(yǔ)句查詢(xún)數(shù)據(jù),而不需要把SQL語(yǔ)句轉(zhuǎn)化成MapReduce任務(wù)來(lái)執(zhí)行(正確答案)D.Impala和Hive采用了不同的SQL語(yǔ)法、ODBC驅(qū)動(dòng)程序和用戶接口16、Spark的特點(diǎn)主要包括:()*A.運(yùn)行速度快(正確答案)B.容易使用(正確答案)C.通用性(正確答案)D.運(yùn)行模式單一17、Spark相對(duì)于MapReduce的優(yōu)點(diǎn)包括:()*A.Spark的計(jì)算模式也屬于MapReduce,但不局限于Map和Reduce操作,還提供了多種數(shù)據(jù)集操作類(lèi)型,編程模型比MapReduce更靈活(正確答案)B.Spark提供了內(nèi)存計(jì)算,中間結(jié)果直接放到內(nèi)存中,帶來(lái)了更高的迭代運(yùn)算效率(正確答案)C.Spark同時(shí)提供了存儲(chǔ)功能,而MapReduce不支持存儲(chǔ)D.Spark基于DAG的任務(wù)調(diào)度執(zhí)行機(jī)制,要優(yōu)于MapReduce的迭代執(zhí)行機(jī)制(正確答案)18、不同的計(jì)算框架統(tǒng)一運(yùn)行在YARN中,可以帶來(lái)哪些好處:()*A.減少了所使用的編程語(yǔ)言的種類(lèi)B.計(jì)算資源按需伸縮(正確答案)C.不用負(fù)載應(yīng)用混搭,集群利用率高(正確答案)D.共享底層存儲(chǔ),避免數(shù)據(jù)跨集群遷移(正確答案)19、在實(shí)際應(yīng)用中,大數(shù)據(jù)處理主要包括哪幾種類(lèi)型:()*A.復(fù)雜的批量數(shù)據(jù)處理:時(shí)間跨度通常在數(shù)十分鐘到數(shù)小時(shí)之間(正確答案)B.基于歷史數(shù)據(jù)的交互式查詢(xún):時(shí)間跨度通常在數(shù)十秒到數(shù)分鐘之間(正確答案)C.基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理:時(shí)間跨度通常在數(shù)百毫秒到數(shù)秒之間(正確答案)D.基于歷史數(shù)據(jù)的流查詢(xún):時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間20、下面關(guān)于Spark的運(yùn)行架構(gòu)的描述,正確的是:()*A.Spark運(yùn)行架構(gòu)包括ClusterManager、WorkerNode、DriverProgram和Executor(正確答案)B.Spark集群資源管理器可以是Spark自帶的資源管理器,也可以是YARN或Mesos等資源管理框架(正確答案)C.Spark采用“P2P架構(gòu)”D.Spark利用多線程來(lái)執(zhí)行具體的任務(wù)(正確答案)21下面關(guān)于RDD的描述正確的是:()*A.一個(gè)RDD就是一個(gè)分布式對(duì)象集合(正確答案)B.一個(gè)RDD本質(zhì)上是一個(gè)只讀的分區(qū)記錄集合(正確答案)C.RDD提供了一組豐富的操作以支持常見(jiàn)的數(shù)據(jù)運(yùn)算,分為“行動(dòng)”(Action)和“轉(zhuǎn)換”(Transformation)兩種類(lèi)型(正確答案)D.RDD不適合對(duì)于數(shù)據(jù)集中元素執(zhí)行相同操作的批處理式應(yīng)用,而比較適合用于需要異步、細(xì)粒度狀態(tài)的應(yīng)用22、Spark的集群部署方式包括:()*A.SparkonMesos模式(正確答案)B.SparkonYARN模式(正確答案)C.SparkonKubernetes模式(正確答案)D.Local模式23、下面關(guān)于SparkSQL的描述正確的是:()*A.SparkSQL在Hive兼容層面僅依賴(lài)HiveQL解析和Hive元數(shù)據(jù)(正確答案)B.SparkSQL目前支持Scala、Java編程語(yǔ)言,暫時(shí)不支持Python語(yǔ)言C.SparkSQL執(zhí)行計(jì)劃生成和優(yōu)化都由Catalyst(函數(shù)式關(guān)系查詢(xún)優(yōu)化框架)負(fù)責(zé)(正確答案)D.SparkSQL增加了DataFrame(即帶有Schema信息的RDD),使用戶可以在SparkSQL中執(zhí)行SQL語(yǔ)句(正確答案)24、下面關(guān)于SparkStreaming的描述正確的是:()*A.SparkStreaming是構(gòu)建在SparkCore上的實(shí)時(shí)計(jì)算框架,它擴(kuò)展了Spark處理大規(guī)模流式數(shù)據(jù)的能力(正確答案)B.SparkStreaming可結(jié)合批處理和交互查詢(xún),適合一些需要對(duì)歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)進(jìn)行結(jié)合分析的應(yīng)用場(chǎng)景(正確答案)C.SparkStreaming可整合多種輸入數(shù)據(jù)源,如Kafka、Flume、HDFS,甚至是普通的TCP套接字(正確答案)D.SparkStreaming實(shí)際上是以一系列微小批處理來(lái)模擬流計(jì)算(正確答案)25、StructuredStreaming包括哪兩種處理模型:()*A.微批處理(正確答案)B.高階處理C.分層處理D.持續(xù)處理(正確答案)26、關(guān)于StructuredStreaming、SparkSQL、SparkStre
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- ICU進(jìn)修專(zhuān)業(yè)知識(shí)分享
- 跨境電商2025年商品清關(guān)代理服務(wù)協(xié)議
- 成都初一學(xué)業(yè)考試試題及答案
- 青峰藥業(yè)考試題及答案
- 2025-2026五年級(jí)體育上學(xué)期期末卷
- 2025-2026二上語(yǔ)文期末測(cè)試卷
- 2025-20262025-2026高一地理上學(xué)期期末測(cè)試卷
- 其他衛(wèi)生制度制度
- 經(jīng)營(yíng)場(chǎng)所平衛(wèi)生管理制度
- 衛(wèi)生院收入管理制度
- 南京航空航天大學(xué)飛行器制造工程考試試題及答案
- 注塑模具調(diào)試員聘用協(xié)議
- 2026年工程監(jiān)理招聘面試常見(jiàn)問(wèn)題集
- 航運(yùn)電子商務(wù)行業(yè)發(fā)展前景分析及物流配送體系創(chuàng)新與商業(yè)模式研究
- 2025年陜西中考語(yǔ)文試卷副題及答案
- 腦癱兒童護(hù)理中的職業(yè)治療
- 心理治療方案在消化系統(tǒng)疾病患者中的應(yīng)用
- 篩分設(shè)備安裝施工詳細(xì)方案
- 2025年低空經(jīng)濟(jì)行業(yè)災(zāi)害應(yīng)急演練與評(píng)估報(bào)告
- 醫(yī)美院感知識(shí)培訓(xùn)課件
- 綠色交通系統(tǒng)1000輛新能源公交車(chē)推廣可行性研究報(bào)告
評(píng)論
0/150
提交評(píng)論