（必刷）《大數(shù)據(jù)挖掘技術(shù)》考點(diǎn)精粹必做題（附答案）

上傳人：服*** IP屬地：四川上傳時(shí)間：2025-12-15 格式：DOC 頁數(shù)：83 大?。?97.05KB 積分：9.6 舉報(bào) 版權(quán)申訴

（必刷）《大數(shù)據(jù)挖掘技術(shù)》考點(diǎn)精粹必做題（附答案）_第2頁

（必刷）《大數(shù)據(jù)挖掘技術(shù)》考點(diǎn)精粹必做題（附答案）_第3頁

（必刷）《大數(shù)據(jù)挖掘技術(shù)》考點(diǎn)精粹必做題（附答案）_第4頁

（必刷）《大數(shù)據(jù)挖掘技術(shù)》考點(diǎn)精粹必做題（附答案）_第5頁

已閱讀5頁，還剩78頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

（必刷）《大數(shù)據(jù)挖掘技術(shù)》考點(diǎn)精粹必做題（附答案）單選題1.在一元線性回歸模型中，變量顯著性檢驗(yàn)與方程顯著性檢驗(yàn)都要進(jìn)行，不能相互替代。A、FB、T參考答案：A2.在無線數(shù)據(jù)端到端指標(biāo)體系中，4G網(wǎng)絡(luò)HTTP下載速率的指標(biāo)定義是？A、HTTP話單的上傳下載數(shù)據(jù)總量除以上傳下載總傳輸時(shí)長（限制500KB以上文件大?。〣、HTTP話單的總下載數(shù)據(jù)量除以總下載傳輸時(shí)長（限制1024KB以上文件大?。〤、HTTP話單的總下載數(shù)據(jù)量除以總下載傳輸時(shí)長（限制500KB以上文件大?。﹨⒖即鸢福篊3.在哪里能下載到hadoop軟件A、apache網(wǎng)站或者捐獻(xiàn)給apache使用的公開服務(wù)器B、oracle官網(wǎng)C、hadoop公司官網(wǎng)D、linux官網(wǎng)參考答案：A4.在進(jìn)行VOLTE端到端八元六階定界時(shí)，下列哪個(gè)不屬于六階A、附著B、TAUC、eSRVCC切換D、語音質(zhì)量參考答案：B5.在集團(tuán)公司四維十輪網(wǎng)絡(luò)質(zhì)量評估體系中，下列哪項(xiàng)不是評估家庭業(yè)務(wù)感知的指標(biāo)：A、家寬網(wǎng)頁打開成功率（%）B、139郵箱web登錄成功率（%）C、家寬網(wǎng)頁平均首屏?xí)r延（s）D、家寬視頻首幀顯示時(shí)長（s）參考答案：B6.在基于規(guī)則分類器的中，依據(jù)規(guī)則質(zhì)量的某種度量對規(guī)則排序，保證每一個(gè)測試記錄都是由覆蓋它的“最好的”規(guī)格來分類，這種方案稱為（）A、基于類的排序方案B、基于規(guī)則的排序方案C、基于度量的排序方案D、基于規(guī)格的排序方案。參考答案：B7.在多元線性回歸模型中，變量顯著性檢驗(yàn)與方程顯著性檢驗(yàn)都要進(jìn)行，不能相互替代。A、FB、T參考答案：B8.在多層次關(guān)聯(lián)規(guī)則分析中，如果將商品進(jìn)行歸類，每一商品類別的支持度會（）其包含的每個(gè)商品的支持度，從而有利于發(fā)現(xiàn)一些有意義的頻繁模式或關(guān)聯(lián)規(guī)則。A、小于B、等于C、大于D、不確定參考答案：C9.在抽樣方法中，當(dāng)合適的樣本容量很難確定時(shí)，可以使用的抽樣方法是:A、有放回的簡單隨機(jī)抽樣B、無放回的簡單隨機(jī)抽樣C、分層抽樣D、漸進(jìn)抽樣參考答案：D10.在SQLServer提供的EM聚類算法中，敘述正確的是（）A、必須要設(shè)置聚類的分類數(shù)B、不必指定聚類的分類數(shù)C、可以不指定聚類的分類數(shù)，此時(shí)采用默認(rèn)值D、以上都不對參考答案：C11.在sklearn中，下面哪個(gè)類或方法，位于preprocessing模塊（）A、train_test_splitB、LabelEncoderC、accuracy_scoreD、DecisionTreeClassifier參考答案：B12.在SELECT語句中，用來指定查詢所用的表的子句是（）。A、WHEREB、GROUPBYC、ORDERBYD、FROM參考答案：D13.在Requests庫的get（）方法中，能夠定制向服務(wù)器提交HTTP請求頭的參數(shù)是什么？A、dataB、jsonC、cookiesD、headers參考答案：D14.在Python中有S=['a'，'b']S.append（[1，2]）S.insert（1，7）;執(zhí)行以上代碼后，s值為（）A、‘a(chǎn)'，7，‘b'，1，2]B、[[1，2]，7，‘a(chǎn)'，‘b’]C、[1，2，‘a(chǎn)’，7’，‘b’]D、[‘a(chǎn)'，7，‘b’，[1，2]]參考答案：D15.有關(guān)數(shù)據(jù)倉庫建模的敘述中正確的是（）。A、因?yàn)樾枨蠓治鲋幸呀?jīng)考慮主題，建模時(shí)不再需要確定主題域B、因?yàn)樾枨蠓治鲋幸呀?jīng)確定項(xiàng)目的所有功能，沒有必要再進(jìn)行數(shù)據(jù)倉庫建模工作C、數(shù)據(jù)倉庫建模是設(shè)計(jì)概念模型，繼而導(dǎo)出邏輯模型D、數(shù)據(jù)倉庫建模是設(shè)計(jì)物理模型參考答案：C16.用戶有一種感興趣的模式并且希望在數(shù)據(jù)集中找到相似的模式，屬于數(shù)據(jù)挖掘哪一類任務(wù)（）A、根據(jù)內(nèi)容檢索B、建模描述C、預(yù)測建模D、尋找模式和規(guī)則參考答案：A17.以下哪種情況對Kmeans模型的影響較?。ǎ?。A、給定錯(cuò)誤聚類個(gè)數(shù)B、簇的大小分布不均衡C、不同簇的方差相差較大D、數(shù)據(jù)有各向異性分布參考答案：B18.以下哪項(xiàng)關(guān)于決策樹的說法是錯(cuò)誤的（）A、冗余屬性不會對決策樹的準(zhǔn)確率造成不利的影響B(tài)、子樹可能在決策樹中重復(fù)多次C、決策樹算法對于噪聲的干擾非常敏感D、尋找最佳決策樹是NP完全問題參考答案：C19.以下哪項(xiàng)不是集團(tuán)要求各省集中性能平臺必須包含的VoLTE指標(biāo)？（）A、注冊成功率B、VoLTE呼叫接通率C、VoLTE掉話率D、MOS3.0以上占比參考答案：D20.以下哪個(gè)是回歸模型評判的指標(biāo)？（）A、mean_squared_errorB、準(zhǔn)確率C、召回率D、輪廓系數(shù)參考答案：A21.以下哪個(gè)聚類算法不是屬于基于原型的聚類A、CLIQUEB、模糊C均值C、EM算法D、SOM參考答案：A22.以下哪個(gè)聚類算法不是屬于基于原型的聚類（）。A、模糊c均值B、EM算法C、SOMD、CLIQUE參考答案：D23.以下哪個(gè)不是數(shù)據(jù)清理的方法（）A、填充缺失值B、光滑噪聲C、識別離群點(diǎn)D、數(shù)據(jù)變換參考答案：D24.以下關(guān)于字符串.strip（）方法功能說明正確的是：A、連接兩個(gè)字符串序列B、替換字符串中特定字符C、按照指定字符分割字符串為數(shù)組D、去掉字符串兩側(cè)指定字符參考答案：D25.以下關(guān)于大數(shù)據(jù)應(yīng)用說法錯(cuò)誤的是（）。A、大數(shù)據(jù)起源互聯(lián)網(wǎng)，目前處于成熟期;B、目前金融、電信、零售、公共服務(wù)等領(lǐng)域在積極的探索和應(yīng)用大數(shù)據(jù);C、互聯(lián)網(wǎng)是大數(shù)據(jù)的發(fā)源地;D、互聯(lián)網(wǎng)上形成了多種相對成熟的應(yīng)用模式。參考答案：A26.以下關(guān)于OLAP和OLTP的敘述中錯(cuò)誤的是（）A、OLTP事務(wù)量大，但事務(wù)內(nèi)容比較簡單且重復(fù)率高B、OLAP的最終數(shù)據(jù)來源與OLTP是完全不一樣的C、OLAP面對的是決策人員和高層管理人員D、OLTP以應(yīng)用為核心，是應(yīng)用驅(qū)動(dòng)的參考答案：B27.以下（）數(shù)據(jù)挖掘方法能夠幫助市場分析人員將購買商品的顧客進(jìn)行分類劃分A、分類B、預(yù)測C、關(guān)聯(lián)分析D、聚類參考答案：A28.已知x=[1，2，3]，那么x*3的值為？A、6B、18C、[3，6，9]D、[1，2，3，1，2，3，1，2，3]參考答案：D29.一所大學(xué)內(nèi)的各年紀(jì)人數(shù)分別為：一年級200人，二年級160人，三年級130人，四年級110人。則年級屬性的眾數(shù)是：A、一年級B、二年級C、三年級D、四年級參考答案：A30.一個(gè)對象的離群點(diǎn)得分是該對象周圍密度的逆。這是基于（）的離群點(diǎn)定義。A、概率B、鄰近度C、密度D、聚類參考答案：C31.研究顧客購買手機(jī)價(jià)格與年齡，性別，收入和工作地點(diǎn)的關(guān)系可以使用（）A、回歸方法B、分類方法C、聚類方法D、關(guān)聯(lián)分析參考答案：A32.信令監(jiān)測系統(tǒng)在架構(gòu)上分為哪三層？A、采集層、共享層、應(yīng)用層B、采集層、解碼層、識別層C、物理層、網(wǎng)絡(luò)層、應(yīng)用層D、接入層、匯聚層、核心層參考答案：A33.協(xié)同過濾分析用戶興趣，在用戶群中找到指定用戶的相似（興趣）用戶，綜合這些用戶對某一信息的評價(jià)，形成系統(tǒng)對該指定用戶對此信息的喜好程度（），并將這些用戶喜歡的項(xiàng)推薦給有相似興趣的用戶。A、相似B、相同C、推薦D、預(yù)測參考答案：D34.下面哪項(xiàng)是集中性能管理面向客服專題（）A、2/3G高流量小區(qū)遷移B、終端在網(wǎng)質(zhì)量評估分析C、客戶投訴溯源分析D、4G終端投放支撐參考答案：C35.下面哪個(gè)屬于映射數(shù)據(jù)到新的空間的方法？A、傅立葉變換B、特征加權(quán)C、漸進(jìn)抽樣D、維歸約參考答案：A36.下面哪個(gè)是用來定義類的關(guān)鍵字？A、continueB、classC、defD、yield參考答案：B37.下面哪個(gè)關(guān)鍵字用來定義函數(shù)？A、defB、defineC、functionD、class參考答案：A38.下面哪個(gè)不是網(wǎng)絡(luò)爬蟲帶來的負(fù)面問題？A、法律風(fēng)險(xiǎn)B、商業(yè)利益C、隱私泄露D、性能騷擾參考答案：B39.下面哪個(gè)不是Python合法得標(biāo)識浮（）A、int32B、40XLC、selfD、_name_參考答案：B40.下面關(guān)于數(shù)據(jù)粒度的描述不正確的是:（）A、粒度是指數(shù)據(jù)倉庫小數(shù)據(jù)單元的詳細(xì)程度和級別;B、數(shù)據(jù)越詳細(xì)，粒度就越小，級別也就越高;C、數(shù)據(jù)綜合度越高，粒度也就越大，級別也就越高;D、粒度的具體劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量.參考答案：C41.下面關(guān)于聚類分析說法錯(cuò)誤的是（）A、一定存在一個(gè)最優(yōu)的分類B、聚類分析是無監(jiān)督學(xué)習(xí)C、聚類分析可以用于判斷異常值D、聚類分析即:物以類聚，人以群分參考答案：A42.下面關(guān)于Jarvis－Patrick（JP）聚類算法的說法不正確的是（）A、JP聚類擅長處理噪聲和離群點(diǎn)，并且能夠處理不同大小、形狀和密度的簇。B、JP算法對高維數(shù)據(jù)效果良好，尤其擅長發(fā)現(xiàn)強(qiáng)相關(guān)對象的緊致簇。C、JP聚類是基于SNN相似度的概念。D、JP聚類的基本時(shí)間復(fù)雜度為O（m）。參考答案：D43.下面不屬于人工智能研究基本內(nèi)容是（）A、機(jī)器感知B、機(jī)器學(xué)習(xí)C、自動(dòng)化D、機(jī)器思維參考答案：C44.下面不屬于創(chuàng)建新屬性的相關(guān)方法的是：A、特征提取B、特征修改C、映射數(shù)據(jù)到新的空間D、特征構(gòu)造參考答案：B45.下列選項(xiàng)中，屬于結(jié)構(gòu)化數(shù)據(jù)的是（）。A、圖像B、文本C、辦公文檔D、JSON參考答案：D46.下列選項(xiàng)中，不屬于請求報(bào)頭的是（）。A、User-AgentB、CookieC、RefererD、Content-Type參考答案：D47.下列哪個(gè)不是專門用于可視化時(shí)間空間數(shù)據(jù)的技術(shù)：（）A、等高線圖B、餅圖C、曲面圖D、矢量場圖參考答案：B48.下列解析技術(shù)中，用于解析JSON文檔的是（）。A、XPathB、JSONPathC、BeautifulSoupD、正則表達(dá)式參考答案：B49.下列關(guān)于頁面顯示總時(shí)長說法正確的是？A、TRANS_RSP_CODE＜400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為0，最后一個(gè)HTTP內(nèi)容包的時(shí)延（MS）B、TRANS_RSP_CODE＜400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為1，最后一個(gè)HTTP內(nèi)容包的時(shí)延（MS）C、TRANS_RSP_CODE>400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為1，最后一個(gè)HTTP內(nèi)容包的時(shí)延（MS）D、TRANS_RSP_CODE>400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為0，最后一個(gè)HTTP內(nèi)容包的時(shí)延（MS）參考答案：A50.下列對學(xué)生相關(guān)屬性描述中，不是標(biāo)稱屬性的是（）A、學(xué)號B、婚姻狀況C、身高D、衣服顏色參考答案：C51.下列度量不具有反演性的是A、系數(shù)B、幾率C、Cohen度量D、興趣因子參考答案：D52.下列代碼作用為（）Net_in=np.array（[0，0，-1]）Out_in=np.array（[0，0，0，0，-1]）A、輸出層權(quán)值變化量B、中間層權(quán)值變化量C、中間層神經(jīng)元輸入和輸出層神經(jīng)元輸入D、輸出連接權(quán)值和閾值參考答案：C53.下列（）不是將主觀信息加入到模式發(fā)現(xiàn)任務(wù)中的方法。A、與同一時(shí)期其他數(shù)據(jù)對比B、可視化C、基于模板的方法D、主觀興趣度量參考答案：A54.網(wǎng)管側(cè)從愛立信MME取走統(tǒng)計(jì)的路徑是A、/Tmp/log/OSS_filesB、/Tmp/OSS_filesC、/Core/log/OSS_filesD、/log/OSS_files參考答案：C55.推薦系統(tǒng)為客戶推薦商品，自動(dòng)完成個(gè)性化選擇商品的過程，滿足客戶的個(gè)性化需求，推薦基于網(wǎng)站最熱賣商品、客戶所處城市、（），推測客戶將來可能的購買行為。A、客戶的朋友B、客戶的個(gè)人信息C、客戶的興趣愛好D、客戶過去的購買行為和購買記錄參考答案：D56.統(tǒng)計(jì)檔案表中學(xué)生來自多少個(gè)城市，下面SQL語句正確的是（）。A、SELCETSUM（DISTINCT家庭住址）FROM檔案表;B、SELCETDISTINCT家庭住址FROM檔案表;C、SELCETCOUNT（家庭住址）FROM檔案表;D、SELCETCOUNT（DISTINCT家庭住址）FROM檔案表;參考答案：D57.通過建立一個(gè)模型來實(shí)現(xiàn)已知變量值來預(yù)測其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪類任務(wù)A、內(nèi)容檢索B、建模描述C、預(yù)測建模D、尋找模式和規(guī)則參考答案：C58.所謂高維數(shù)據(jù)，指的是A、數(shù)據(jù)對象很多B、數(shù)據(jù)屬性很多C、以上都正確D、以上都錯(cuò)誤參考答案：B59.數(shù)據(jù)在規(guī)定的時(shí)間前和頻度周期內(nèi)接入系統(tǒng)的比例稱為（）A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;B、指標(biāo)數(shù)據(jù)接入率C、指標(biāo)數(shù)據(jù)接入及時(shí)率;D、指標(biāo)數(shù)據(jù)完整率參考答案：C60.數(shù)據(jù)預(yù)處理的任務(wù)不包括（）。A、數(shù)據(jù)清洗B、數(shù)據(jù)規(guī)范化和離散化C、數(shù)據(jù)分類D、特征提取與特征選擇參考答案：C61.數(shù)據(jù)挖掘的英文簡寫是（）A、DKDB、KDDC、DMD、DA參考答案：C62.實(shí)際接入的指標(biāo)數(shù)占應(yīng)接指標(biāo)總數(shù)的比例，統(tǒng)計(jì)時(shí)又分線上和線下接入率稱為（）A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;B、指標(biāo)數(shù)據(jù)接入率C、指標(biāo)數(shù)據(jù)接入及時(shí)率;D、指標(biāo)數(shù)據(jù)完整率參考答案：B63.時(shí)間序列的類型分為（）。A、平穩(wěn)序列和非平穩(wěn)序列B、大序列和小序列C、有趨勢序列和無趨勢序列D、隨機(jī)序列和非隨機(jī)序列參考答案：A64.什么是KDD？（）A、數(shù)據(jù)挖掘與知識發(fā)現(xiàn)B、領(lǐng)域知識發(fā)現(xiàn)C、文檔知識發(fā)現(xiàn)D、動(dòng)態(tài)知識發(fā)現(xiàn)參考答案：A65.設(shè)置hadoop啟動(dòng)環(huán)境變量的文件是？A、core-site.xmlB、hdfs-site.xmlC、mapred-site.xmlD、hadoop-env.sh參考答案：D66.設(shè)X={a，b，c}是一個(gè)頻繁項(xiàng)集，則最多可由X產(chǎn)生（）個(gè)關(guān)聯(lián)規(guī)則。A、4B、5C、6D、7參考答案：C67.若MySQL數(shù)據(jù)表中有姓名為“李建華”的記錄，下列無法查出“李建華”的表達(dá)式是（）。A、Like"華"B、Like"%華"C、Like"%華%"D、Like"__華"參考答案：A68.若I={a，b，c，d}，D中含有10個(gè)事務(wù)，（a，b}和{a，c}是一個(gè)頻繁項(xiàng)集，則以下敘述中正確的是（）。A、{a，b，d}一定是頻繁項(xiàng)集B、{a，b，c}一定是頻繁項(xiàng)集C、{b，c}一定是頻繁項(xiàng)集D、以上都不對參考答案：D69.如下哪些不是最近鄰分類器的特點(diǎn)，（）A、它使用具體的訓(xùn)練實(shí)例進(jìn)行預(yù)測，不必維護(hù)源自數(shù)據(jù)的模型B、分類一個(gè)測試樣例開銷很大C、最近鄰分類器基于全局信息進(jìn)行預(yù)測D、可以生產(chǎn)任意形狀的決策邊界參考答案：C70.如下表所示，交易號（D）商品（tems）1beer，diaper，nuts2beer，biscuit，diaper3bread，butter，cheese4beer，cheese，diaper，nuts5beer，butter，cheese，nuts2）X={butter，cheese}，Y={beer}，則置信度confidence（X→Y）=（）。A、2/5B、1/2C、1/3D、1/4參考答案：B71.如下表所示，X={butter，cheese}，則支持度support（X）=（）。交易號（TID）商品（Items）1beer，diaper，nuts2beer，biscuit，diaper3bread，butter，cheese4beer，cheese，diaper，nuts5beer，butter，cheese，nutsA、2/5B、4/5C、1/5D、3/5參考答案：A72.如果規(guī)則集中的規(guī)則按照優(yōu)先級降序排列，則稱規(guī)則集是A、無序規(guī)則B、窮舉規(guī)則C、互斥規(guī)則D、有序規(guī)則參考答案：D73.人工智能復(fù)活之路上經(jīng)歷了（）次熱潮A、1B、2C、3D、4參考答案：C74.請問以下何者屬于時(shí)間序列的問題?A、信用卡發(fā)卡銀行偵測潛在的卡奴B、基金經(jīng)理人針對個(gè)股做出未來價(jià)格預(yù)測C、電信公司將人戶區(qū)分為數(shù)個(gè)群體D、以上均不是參考答案：B75.蘋果公司對IPHONE的降價(jià)行為屬于（）A、地域性差別定價(jià)B、時(shí)間性差別定價(jià)C、非線性定價(jià)或數(shù)量折扣定價(jià)D、其他形式的定價(jià)參考答案：B76.評估完模型之后，發(fā)現(xiàn)模型存在高偏差（highbias），應(yīng)該如何解決？（）A、減少模型的特征數(shù)量B、增加模型的特征數(shù)量C、增加樣本數(shù)量D、以上說法都正確參考答案：B77.每次從指定的文件中讀取一行的方法是：A、read（）B、readline（）C、readlines（）D、reads（）參考答案：B78.利用tree.DecisionTreeClassifier（）訓(xùn)練模型時(shí)調(diào)用.fit（）方法需要傳遞的第一個(gè)參數(shù)是（）。A、樣本特征XB、樣本標(biāo)簽YC、設(shè)置結(jié)點(diǎn)的最小樣本數(shù)量D、判斷標(biāo)準(zhǔn)參考答案：A79.利用tree.DecisionTreeClassifier（）訓(xùn)練模型時(shí)調(diào)用.fit（）方法需要傳遞的第二個(gè)參數(shù)是（）。A、樣本特征XB、樣本標(biāo)簽YC、判斷標(biāo)準(zhǔn)D、設(shè)置結(jié)點(diǎn)的最小樣本數(shù)量參考答案：B80.可以最全面反映整個(gè)網(wǎng)絡(luò)缺省EPS承載的建立成功率的指標(biāo)是A、PDN連接建立成功率B、缺省承載激活成功率C、MME建立缺省S5S8承載成功率D、位置更新的成功率參考答案：A81.可以對按季度匯總的銷售數(shù)據(jù)進(jìn)行（），來觀察按月匯總的數(shù)據(jù)。A、上卷B、下鉆C、切片D、切塊參考答案：B82.可以對按城市匯總的銷售數(shù)據(jù)進(jìn)行（），來觀察按國家總的數(shù)據(jù)。A、上卷B、下鉆C、切片D、切塊參考答案：A83.考慮值集{1、2、3、4、5、90}，其截?cái)嗑担╬=20%）是A、2B、3C、3.5D、5參考答案：C84.考慮這么一種情況：一個(gè)對象碰巧與另一個(gè)對象相對接近，但屬于不同的類，因?yàn)檫@兩個(gè)對象一般不會共享許多近鄰，所以應(yīng)該選擇（）的相似度計(jì)算方法。A、平方歐幾里德距離B、余弦距離C、直接相似度D、共享最近鄰參考答案：D85.考慮下面的頻繁3-項(xiàng)集的集合:{1，2，3}，{1，2，4}，{1，2，5}，{1，3，4}，{1，3，5}，{2，3，4}，{2，3，5}，{3，4，5}假定數(shù)據(jù)集中只有5個(gè)項(xiàng)，采用合并策略，由候選產(chǎn)生過程得到4-項(xiàng)集不包含A、1，2，3，4B、1，2，3，5C、1，2，4，5D、1，3，4，5參考答案：C86.考慮兩隊(duì)之間的足球比賽：隊(duì)0和隊(duì)1。假設(shè)65%的比賽隊(duì)0勝出，剩余的比賽隊(duì)1獲勝。隊(duì)0獲勝的比賽中只有30%是在隊(duì)1的主場，而隊(duì)1取勝的比賽中75%是主場獲勝。如果下一場比賽在隊(duì)1的主場進(jìn)行隊(duì)1獲勝的概率為A、0.75B、0.35C、0.4678D、0.5738參考答案：C87.建立一個(gè)模型，通過這個(gè)模型根據(jù)已知的變量值來預(yù)測其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)A、根據(jù)內(nèi)容檢索B、建模描述C、預(yù)測建模D、尋找模式和規(guī)則參考答案：C88.簡單地將數(shù)據(jù)對象集劃分成不重疊的子集，使得每個(gè)數(shù)據(jù)對象恰在一個(gè)子集中，這種聚類類型稱作（）A、層次聚類B、劃分聚類C、非互斥聚類D、模糊聚類參考答案：B89.檢查異常值常用的統(tǒng)計(jì)圖形是（）A、柱狀圖B、箱線圖C、帕累托圖D、氣泡圖參考答案：B90.假設(shè)屬性income的最大最小值分別是12000元和98000元。利用最大-最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對屬性income的73600元將被轉(zhuǎn)化為（）A、0.751B、0.163C、0.457D、0.716參考答案：D91.假設(shè)12個(gè)銷售價(jià)格記錄組已經(jīng)排序如下:5，10，11，13，15，35，50，55，72，92，204，215使用等寬劃分（寬度為50）方法將它們劃分成四個(gè)箱，求15在哪個(gè)箱子?（）A、第1個(gè)B、第2個(gè)C、第3個(gè)D、第4個(gè)參考答案：A92.基于輸入的用戶信息，通過模型的訓(xùn)練學(xué)習(xí)，找出數(shù)據(jù)中的規(guī)律和趨勢，以確定未來目標(biāo)數(shù)據(jù)的預(yù)測值（）A、聚類B、分類C、預(yù)測D、關(guān)聯(lián)參考答案：C93.關(guān)于混合模型聚類算法的優(yōu)缺點(diǎn)，下面說法正確的是（）A、當(dāng)簇只包含少量數(shù)據(jù)點(diǎn)，或者數(shù)據(jù)點(diǎn)近似協(xié)線性時(shí)，混合模型也能很好地處理。B、混合模型比K均值或模糊C均值更一般，因?yàn)樗梢允褂酶鞣N類型的分布。C、混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇。D、混合模型在有噪聲和離群點(diǎn)時(shí)不會存在問題。參考答案：B94.關(guān)于OLAP和OLTP的區(qū)別描述，不正確的是:（）A、OLAP主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù).它與OTAP應(yīng)用程序不同B、與OLAP應(yīng)用程序不同，OLTP應(yīng)用程序包含大量相對簡單的事務(wù)C、OLAP的特點(diǎn)在于事務(wù)量大，但事務(wù)內(nèi)容比較簡單且重復(fù)率高D、OLAP是以數(shù)據(jù)倉庫為基礎(chǔ)的，但其最終數(shù)據(jù)來源與OLTP一樣均來自底層的數(shù)據(jù)庫系統(tǒng)，兩者面對的用戶是相同的參考答案：C95.發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法通常要經(jīng)過以下三個(gè)步驟：連接數(shù)據(jù)，作數(shù)據(jù)準(zhǔn)備；給定最小支持度和（D），利用數(shù)據(jù)挖掘工具提供的算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則；可視化顯示、理解、評估關(guān)聯(lián)規(guī)則A、最小興趣度B、最小置信度C、最大支持度D、最小可信度參考答案：D96.當(dāng)新業(yè)務(wù)、行為出現(xiàn)或目標(biāo)跟蹤業(yè)務(wù)出現(xiàn)新版本時(shí)，DPI設(shè)備應(yīng)能在（）周之內(nèi)具備新業(yè)務(wù)或新版本的識別能力。A、1B、2C、3D、4參考答案：A97.大數(shù)據(jù)科學(xué)關(guān)注大數(shù)據(jù)網(wǎng)絡(luò)發(fā)展和運(yùn)營過程中（）大數(shù)據(jù)的規(guī)律及其與自然和社會活動(dòng)之間的關(guān)系。A、大數(shù)據(jù)網(wǎng)絡(luò)發(fā)展和運(yùn)營過程B、規(guī)劃建設(shè)運(yùn)營管理C、規(guī)律和驗(yàn)證D、發(fā)現(xiàn)和驗(yàn)證參考答案：D98.從研究現(xiàn)狀上看，下面不屬于云計(jì)算特點(diǎn)的是（）A、超大規(guī)模B、虛擬化C、私有化D、高可靠性參考答案：C99.VOLTE業(yè)務(wù)評估體系中，VOLTE語音掉線率屬于哪一類指標(biāo)？A、保持性B、接入性C、完整性D、移動(dòng)性參考答案：A100.TCP/IP協(xié)議按照從底層到高層的順序，除了應(yīng)用層之外，每一層都有與其相對應(yīng)的PDU（ProtocolDataUnit，協(xié)議數(shù)據(jù)單元），依次為（）A、Bit、Segment、Packet、FrameB、Bit、Frame、Packet、SegmentC、Packet、Bit、Frame、SegmentD、Bit、Packet、Frame、Segment參考答案：B101.SELECT命令中用于返回非重復(fù)記錄的關(guān)鍵字是（）。A、TOPB、GROUPC、DISTINCTD、ORDER參考答案：C102.SAEGateway的功能包括？A、數(shù)據(jù)的路由和傳播、用戶面數(shù)據(jù)的加密B、數(shù)據(jù)的路由和傳播、用戶面數(shù)據(jù)的加密、尋呼消息的發(fā)送C、用戶面數(shù)據(jù)的加密、尋呼消息的發(fā)送、NAC層信令的加密參考答案：A103.Requests庫中，下面哪個(gè)是檢查Response對象返回是否成功的狀態(tài)屬性？A、raise_for_statusB、headersC、status_codeD、status參考答案：C104.OLAP技術(shù)的核心是（）A、在線性B、對用戶的快速響應(yīng)C、互操作性D、多維分析參考答案：D105.OLAP的含義是（）A、面向?qū)ο蠓治鎏幚鞡、面向過程分析處理C、聯(lián)機(jī)事務(wù)處理D、聯(lián)機(jī)分析處理參考答案：D106.NLTK最適用于哪種類型的任務(wù)A、語言處理B、圖像處理C、聲音處理D、文字處理參考答案：A107.MGW與RNC的連接介質(zhì)采用A、IP傳輸B、PCM傳輸C、ATM傳輸參考答案：C108.MapReduce是典型的（）算法。A、聚類B、搜索C、預(yù)測D、迭代參考答案：B109.lr.fit（X_train，y_train）語句的目的為（）A、建立LR模型B、導(dǎo)入數(shù)據(jù)并觀察C、查看數(shù)據(jù)框D、用處理好的數(shù)據(jù)訓(xùn)練模型參考答案：D110.Logistic回歸是在商業(yè)領(lǐng)域上使用最廣泛的預(yù)測模型，常用于（）分類變量預(yù)測和概率預(yù)測。A、四值B、三值C、二值D、一值參考答案：C111.KNN的英文全寫為（）A、k-NearerNeighborB、k-NearestNeighborC、k-NearNeighborsD、k-NearestNeighbors參考答案：B112.Hive是基于Hadoop的一個(gè)數(shù)據(jù)（）工具A、分析;B、倉庫C、制圖D、可視化參考答案：B113.Hadoop是一個(gè)開發(fā)和運(yùn)行處理大規(guī)模數(shù)據(jù)的軟件平臺，是Appach的一個(gè)用（）語言實(shí)現(xiàn)開源軟件框架。A、javaB、C.++C、R語言參考答案：A114.eNodeB對哪種類型的數(shù)據(jù)進(jìn)行完整性保護(hù)（）A、RRCsignallingB、NASsignallingC、UserplanedataD、SystemInformation參考答案：C115.CRISP-DM是跨行業(yè)數(shù)據(jù)挖掘過程標(biāo)準(zhǔn)，下述哪項(xiàng)工作是在datapreperation階段完成A、數(shù)據(jù)收集B、數(shù)據(jù)清洗C、建立模型D、數(shù)據(jù)理解參考答案：B116.《個(gè)人信息保護(hù)法》對于企業(yè)的影響不包括（）A、需要強(qiáng)化個(gè)人信息處理這主體責(zé)任B、明確了可以量化的中國版執(zhí)行罰則C、需要設(shè)立負(fù)責(zé)處理個(gè)人信息保護(hù)相關(guān)事務(wù)的專門機(jī)構(gòu)和指定代表D、收集和處理數(shù)據(jù)時(shí)可以不遵循“最小化”原則參考答案：D117.“點(diǎn)擊率問題”是這樣一個(gè)預(yù)測問題，99%的人是不會點(diǎn)擊的，而1%的人是會點(diǎn)擊進(jìn)去的，所以這是一個(gè)非常不平衡的數(shù)據(jù)集.假設(shè)，現(xiàn)在我們已經(jīng)建了一個(gè)模型來分類，而且有了99%的預(yù)測準(zhǔn)確率，我們可以下的結(jié)論是（）A、模型預(yù)測準(zhǔn)確率已經(jīng)很高了，我們不需要做什么了B、模型預(yù)測準(zhǔn)確率不高，我們需要做點(diǎn)什么改進(jìn)模型C、無法下結(jié)論D、以上都不對參考答案：C118.（）數(shù)據(jù)挖掘方法能夠幫助市場分析人員找出顧客購買的商品之間的關(guān)聯(lián)關(guān)系A(chǔ)、分類B、預(yù)測C、關(guān)聯(lián)分析D、聚類參考答案：C119.（）是一類機(jī)器學(xué)習(xí)技術(shù)，在學(xué)習(xí)模型時(shí)，它使用標(biāo)記的和未標(biāo)記的實(shí)例。A、監(jiān)督學(xué)習(xí)B、無監(jiān)督學(xué)習(xí)C、半監(jiān)督學(xué)習(xí)D、主動(dòng)學(xué)習(xí)參考答案：C120.（）是一個(gè)觀測值，它與其他觀測值的差別如此之大，以至于懷疑它是由不同的機(jī)制產(chǎn)生的A、邊界點(diǎn)B、質(zhì)心C、離群點(diǎn)D、核心點(diǎn)參考答案：C多選題1.作為VoLTE語音方案中關(guān)鍵的信令和語音承載通道，以下那個(gè)網(wǎng)絡(luò)為用戶的語音業(yè)務(wù)實(shí)現(xiàn)端到端的QoS質(zhì)量保障？A、EPCB、TDSCDMAC、IMSD、GSM參考答案：AC2.自動(dòng)駕駛技術(shù)在以下（）領(lǐng)域?qū)崿F(xiàn)A、大型客機(jī)B、戰(zhàn)斗機(jī)C、高鐵列車D、民用汽車參考答案：ABCD3.主成分分析計(jì)算選擇相關(guān)系數(shù)計(jì)算法時(shí)，確定主成分個(gè)數(shù)的致原則包括（）A、特征根值大于1B、特征根值大于3C、累積特征根值加總占總特征根值的80%以上D、累積特征根值加總占總特征根值的90%以上參考答案：AC4.智能手機(jī)市場10年混戰(zhàn)之后，僅剩下（）陣營A、蘋果IOSB、谷歌AndroidC、微軟D、聯(lián)想?yún)⒖即鸢福篈B5.噪聲數(shù)據(jù)的產(chǎn)生原因主要有：（）A、數(shù)據(jù)采集設(shè)備有問題B、在數(shù)據(jù)錄入過程中發(fā)生了人為或計(jì)算機(jī)錯(cuò)誤C、數(shù)據(jù)傳輸過程中發(fā)生錯(cuò)誤D、由于命名規(guī)則或數(shù)據(jù)代碼不同而引起的不一致參考答案：ABCD6.在作邏輯回歸時(shí)，如果區(qū)域這個(gè)變量，當(dāng)Region=A時(shí)Y取值均為1，無法確定是否出現(xiàn)的是哪個(gè)問題?A、共線性B、異常值C、擬完全分離（Quasi-completeseparation）D、缺失值參考答案：ABD7.在有關(guān)數(shù)據(jù)倉庫測試，下列說法中正確的是（）A、在完成數(shù)據(jù)倉庫的實(shí)施過程中，需要對數(shù)據(jù)倉庫進(jìn)行各種測試.測試工作中要包括單元測試和系統(tǒng)測試B、當(dāng)數(shù)據(jù)倉庫的每個(gè)單獨(dú)組件完成后，就需要對他們進(jìn)行單元測試C、系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進(jìn)行大量的功能測試和回歸測試D、在測試之前可以不制定詳細(xì)的測試計(jì)劃，測試過程中實(shí)時(shí)調(diào)整。參考答案：ABC8.在以下不同的場景中，使用的分析方法正確的有（）A、根據(jù)商家最近一年的經(jīng)營及服務(wù)數(shù)據(jù)，用聚類算法判斷出天貓商家在各自主營類目下所屬的商家層級B、根據(jù)商家近幾年的成交數(shù)據(jù)，用聚類算法擬合出用戶未來一個(gè)月可能的消費(fèi)金額公式C、用關(guān)聯(lián)規(guī)則算法分析出購買了汽車坐墊的買家，是否適合推薦汽車腳墊D、根據(jù)用戶最近購買的商品信息，用決策樹算法識別出淘寶買家可能是男還是女參考答案：ACD9.在探索性數(shù)據(jù)分析中，認(rèn)為最有代表性，最能反映數(shù)據(jù)重要特征的五數(shù)概括，包括:A、中位數(shù)Q2B、四分位數(shù)Q3C、最小值D、最大值參考答案：ABCD10.在全面調(diào)查和抽樣調(diào)查中都存在的誤差是（）A、系統(tǒng)誤差B、登記性誤差C、責(zé)任心誤差D、技術(shù)性誤差參考答案：BCD11.在評價(jià)不平衡類問題分類的度量方法有如下幾種，A、F1度量B、召回率（recall）C、精度（precision）D、真正率（turepositiverate，TPR）參考答案：ABCD12.在聚類分析當(dāng)中，（）等技術(shù)可以處理任意形狀的簇。A、MIN（單鏈）B、MAX（全鏈）C、組平均D、Chameleon參考答案：AD13.預(yù)處理的任務(wù)有哪些（）。A、特征提取與特征選擇B、數(shù)據(jù)清洗C、數(shù)據(jù)規(guī)范化D、數(shù)據(jù)離散化參考答案：ABCD14.預(yù)測性能的優(yōu)劣需要一定的度量來衡量，常用的度量是（）。A、RAE（相對絕對誤差）B、MAE（平均絕對誤差）C、MSE（均方誤差）D、RSE（相對平方誤差）參考答案：ABCD15.影響聚類算法結(jié)果的主要因素有（）A、特征選取B、已知類別的樣本質(zhì)量C、模式相似性測度D、分類準(zhǔn)則參考答案：ACD16.影響基本K-均值算法的主要因素包括（）A、初始類中心的選取B、樣本相似性的度量C、樣本輸入順序D、K值的設(shè)定參考答案：ABD17.以下屬于聚類算法的是（）A、K均值B、DBSCANC、AprioriD、knn參考答案：AB18.以下屬于聚類算法的是（）A、K均值B、DBSCANC、AprioriD、k-medoids參考答案：ABD19.以下屬于聚類算法的是（）A、K均值B、DBSCANC、AprioriD、arvis-Patrick參考答案：ABD20.以下屬于聚類算法的是（）。A、K均值B、DBSCANC、AprioriD、Jarvis-Patrick（JP）參考答案：ABD21.以下屬于分類器評價(jià)或比較尺度的有:A、預(yù)測準(zhǔn)確度B、召回率C、模型描述的簡潔度D、計(jì)算復(fù)雜度參考答案：ACD22.以下哪些指標(biāo)屬于網(wǎng)頁瀏覽類KQI？（）A、流媒體停頓占比B、頁面顯示時(shí)長C、頁面下載速率D、頁面響應(yīng)成功率參考答案：BCD23.以下哪些學(xué)科和數(shù)據(jù)挖掘有密切聯(lián)系？（）A、統(tǒng)計(jì)B、計(jì)算機(jī)組成原理C、礦產(chǎn)挖掘D、人工智能參考答案：AD24.以下哪個(gè)聚類算法屬于基于原型的聚類A、模糊C均值B、EM算法C、SOMD、CLIQUE參考答案：ABC25.以下哪個(gè)聚類分析的方法是利用統(tǒng)計(jì)學(xué)定義的距離進(jìn)行度量（）A、層次聚類法B、快速聚類法（K-Means）C、基于密度的聚類法D、基于網(wǎng)格的聚類法參考答案：AB26.以下關(guān)于皮爾森相關(guān)分析敘述正確的是（）A、兩變量獨(dú)立，兩者的皮爾森相關(guān)系數(shù)必然等于0B、兩變量皮爾森相關(guān)系數(shù)不等于0，兩者必然不獨(dú)立C、皮爾森相關(guān)系數(shù)是否等于零，不能指明兩變量是否獨(dú)立D、兩變量不獨(dú)立，兩者的皮爾森相關(guān)系數(shù)必然不等于0參考答案：AB27.以下關(guān)于非頻繁模式說法，正確的是（）A、其支持度小于閾值B、都是不讓人感興趣的C、包含負(fù)模式和負(fù)相關(guān)模式D、對異常數(shù)據(jù)項(xiàng)敏感參考答案：AD28.以下各項(xiàng)均是針正確數(shù)據(jù)倉庫的不同說法，你認(rèn)為正確的有（）。A、數(shù)據(jù)倉庫就是數(shù)據(jù)庫B、數(shù)據(jù)倉庫是一切商業(yè)智能系統(tǒng)的基礎(chǔ)C、數(shù)據(jù)倉庫是面向業(yè)務(wù)的，支持聯(lián)機(jī)事務(wù)處理（OLTP）D、數(shù)據(jù)倉庫支持決策而非事務(wù)處理E、數(shù)據(jù)倉庫的主要目標(biāo)就是幫助分析，做長期性的戰(zhàn)略制定參考答案：BCDE29.尋找數(shù)據(jù)集中的關(guān)系是為了尋找精確、方便并且有價(jià)值地總結(jié)了數(shù)據(jù)的某一特征的表示，這個(gè)過程包括了以下哪些步驟（）A、決定要使用的表示的特征和結(jié)構(gòu)B、決定如何量化和比較不同表示擬合數(shù)據(jù)的好壞C、選擇一個(gè)算法過程使評分函數(shù)最優(yōu)D、決定用什么樣的數(shù)據(jù)管理原則以高效地實(shí)現(xiàn)算法。參考答案：ABCD30.尋呼響應(yīng)成功次數(shù)為統(tǒng)計(jì)一定的時(shí)間粒度及網(wǎng)元粒度下，滿足以下哪兩個(gè)條件（）的S1-MME接口XDR的個(gè)數(shù)A、ProcedureType=4B、ProcedureStatus=0C、ProcedureType=1D、ProcedureStatus=1參考答案：AB31.相關(guān)分析的任務(wù)有（）A、判定現(xiàn)象之間有無關(guān)系B、判定現(xiàn)象之間關(guān)系的方向C、判定相關(guān)關(guān)系的緊密程度D、說明現(xiàn)象之間聯(lián)系的具體形式參考答案：ABCD32.線性模型基本形式特點(diǎn)有（）A、形式簡單，易于建模B、蘊(yùn)含機(jī)器學(xué)習(xí)的基本思想C、是其他非線性模型的基礎(chǔ)D、權(quán)重體現(xiàn)出各屬性重要性，可解釋性強(qiáng)參考答案：ABCD33.下面哪些網(wǎng)元會產(chǎn)生CDR話單？（）A、MMEB、PGWC、SGWD、GGSN參考答案：BCD34.下列指標(biāo)受終端性能影響的有（）A、無線掉線率B、4G用戶附著成功率C、視頻緩沖時(shí)長D、http響應(yīng)時(shí)延參考答案：ABC35.下列關(guān)于統(tǒng)計(jì)量的表述中，正確的有（）A、估計(jì)同一個(gè)總體參數(shù)可以用多個(gè)不同的統(tǒng)計(jì)量B、統(tǒng)計(jì)量是樣本的函數(shù)C、統(tǒng)計(jì)量不含有總體的參數(shù)D、統(tǒng)計(jì)量是隨機(jī)變量參考答案：ABD36.下列公式正確的是（）A、流動(dòng)資金=流動(dòng)資產(chǎn)-流動(dòng)負(fù)債B、流動(dòng)資產(chǎn)=應(yīng)收賬款+存貨C、流動(dòng)負(fù)債=應(yīng)付賬款+預(yù)收賬款D、流動(dòng)資金本年增加額=本年流動(dòng)資金-上年流動(dòng)資金參考答案：ACD37.下表是一個(gè)購物籃，假定支持度閾值為40%，其中（）是頻繁閉項(xiàng)集A、abcB、abcdC、bceD、acde參考答案：AD38.物聯(lián)網(wǎng)端到端定界分析“七元四階”法中四階包括（）A、網(wǎng)絡(luò)接入B、業(yè)務(wù)接入C、網(wǎng)絡(luò)切換D、業(yè)務(wù)使用質(zhì)量參考答案：ABCD39.偽分布模式中的注意點(diǎn)？A、偽分布式適用于開發(fā)和測試環(huán)境B、所有守護(hù)進(jìn)程都在同一臺機(jī)器上運(yùn)行C、守護(hù)進(jìn)程在不同的機(jī)器上運(yùn)行D、偽分布模式不能用于開發(fā)分布式代碼參考答案：AB40.隨機(jī)抽樣方法有（）A、等距隨機(jī)抽樣B、綜合隨機(jī)抽樣C、簡單隨機(jī)抽樣D、分群隨機(jī)抽樣參考答案：ACD41.數(shù)據(jù)挖掘算法的組件包括？A、模型或模型結(jié)構(gòu)B、評分函數(shù)C、優(yōu)化和搜索方法D、數(shù)據(jù)管理策略參考答案：ABCD42.數(shù)據(jù)挖掘算法的組件包括：（）A、模型或模型結(jié)構(gòu)B、評分函數(shù)C、優(yōu)化和搜索方法D、數(shù)據(jù)管理策略參考答案：ABCD43.數(shù)據(jù)挖掘匯聚了許多學(xué)科的知識，其主要的挖掘技術(shù)包括A、統(tǒng)計(jì)方法B、機(jī)器學(xué)習(xí)方法C、數(shù)據(jù)庫方法D、神經(jīng)網(wǎng)絡(luò)方法參考答案：ABCD44.數(shù)據(jù)挖掘工具R語言，其核心計(jì)算模塊采用什么語言編寫A、CB、C++C、FortranD、Python參考答案：ABC45.數(shù)據(jù)倉庫在技術(shù)上的工作過程是：（）A、數(shù)據(jù)的抽取B、存儲和管理C、數(shù)據(jù)的表現(xiàn)D、數(shù)據(jù)倉庫設(shè)計(jì)E、數(shù)據(jù)的表現(xiàn)參考答案：ABCD46.視頻文件格式主流的有如下哪幾種文件格式（）A、flvB、3gpC、mp4D、ts參考答案：ABCD47.市場需求分析包含幾個(gè)要素A、產(chǎn)品定位B、市場需求C、目標(biāo)人群D、推廣策略參考答案：ABCD48.人工網(wǎng)絡(luò)學(xué)習(xí)的兩個(gè)相似的算法：（）A、梯度下降法則B、感知器訓(xùn)練法則C、遺傳算法D、連接分析參考答案：AB49.全分布模式有什么注意點(diǎn)？A、全分布模式通常被用于生產(chǎn)環(huán)境B、在生產(chǎn)環(huán)境里我們使用N臺主機(jī)組成一個(gè)Hadoop集群C、這里會存在單獨(dú)的Namenode運(yùn)行的主機(jī)D、這里會存在單獨(dú)的Datanode運(yùn)行的主機(jī)參考答案：ABCD50.區(qū)塊鏈特征包含有（）A、分布式是區(qū)塊鏈技術(shù)區(qū)別于其他技術(shù)的核心要點(diǎn)，數(shù)據(jù)由系統(tǒng)中維護(hù)功能的節(jié)點(diǎn)共同維護(hù)B、區(qū)塊鏈技術(shù)通過數(shù)字加密算法進(jìn)行編排，節(jié)點(diǎn)相互聯(lián)系，沒有一個(gè)中心節(jié)點(diǎn)可以被打擊和篡改，穩(wěn)定性和安全性更高C、公有區(qū)塊鏈系統(tǒng)是對所有人開放的，任何人均可以通過端口進(jìn)行查詢和開發(fā)，系統(tǒng)是公開透明的，從而也更容易形成共識D、區(qū)塊鏈技術(shù)節(jié)點(diǎn)之間交換遵循一定的算法，通過程序規(guī)則自行判斷，并形成一種信任，即使是在匿名的情況下，也會對對方產(chǎn)生基本的信任參考答案：ABCD51.聯(lián)機(jī)分析處理包括（）基本分析功能。A、聚類B、切片C、轉(zhuǎn)軸D、切塊參考答案：BCD52.利用中文文本繪制詞云時(shí)，需要在anaoncda的基礎(chǔ)上安裝哪些工具包（）。A、MatplotlibB、WordcloudC、Scikit-learnD、Jieba參考答案：BD53.可以用神經(jīng)網(wǎng)絡(luò)構(gòu)建的算法包括A、KNN最近鄰算法B、線性回歸C、邏輯回歸D、最小二乘法參考答案：BCD54.決策樹算法很容易出現(xiàn)過擬合，我們通常會使用一些剪枝手段來改善這一現(xiàn)象。對于sklearn.tree.DecisionTreeClassifier模型，下面這些參數(shù)哪些能起到剪枝的作用（）A、criterionB、max_depthC、min_samples_splitD、min_impurity_split參考答案：BCD55.經(jīng)常與子查詢一起使用的運(yùn)算符有（）。A、INB、EXISTSC、ANYD、ALL參考答案：ABCD56.行業(yè)分析數(shù)據(jù)采集方法有（）。A、一手資料B、實(shí)地考察法C、專家訪談法D、收集媒體信息參考答案：ABCD57.根據(jù)集中性能管理應(yīng)用《物聯(lián)網(wǎng)端到端業(yè)務(wù)質(zhì)量分析》落地手冊，物聯(lián)網(wǎng)端到端定界的分析方法包括？（）A、關(guān)聯(lián)分析B、回溯分析C、聚類分析D、根因分析參考答案：ABCD58.根據(jù)分析內(nèi)容和側(cè)重面不同，風(fēng)險(xiǎn)分析的方法有（）A、敏感性分析B、概率分析C、經(jīng)濟(jì)效益分析D、盈虧平衡分析參考答案：ABD59.根據(jù)《終端分芯片版本精細(xì)化分析落地手冊》，終端分析呈現(xiàn)的指標(biāo)維度可以包括A、終端級B、版本級C、芯片級D、地市級參考答案：ABCD60.根據(jù)《中國移動(dòng)大數(shù)據(jù)安全管控分類分級實(shí)施指南》，以下哪些屬于敏感級數(shù)據(jù)A、實(shí)體身份證明B、自然人身份標(biāo)識C、網(wǎng)絡(luò)身份標(biāo)識D、終端設(shè)備標(biāo)識參考答案：BC61.打點(diǎn)模型把視頻業(yè)務(wù)分為接入階段與播放階段。其中接入階段又被細(xì)分為（）A、初始緩沖準(zhǔn)備階段B、初始緩沖階段C、播放階段D、播放準(zhǔn)備階段參考答案：AB62.簇有效性的面向相似性的度量包括（）。A、精度B、Rand統(tǒng)計(jì)量C、Jaccard系數(shù)D、召回率參考答案：BC63.從復(fù)雜度及價(jià)值高低兩個(gè)維度，可以將數(shù)據(jù)分析分為（）A、描述性分析（DescriptiveAnalytics）B、診斷性分析（DiagnosticAnalytics）C、預(yù)測性分析（PredictiveAnalytics）D、規(guī)范性分析（PrescriptiveAnalytics）參考答案：ABCD64.常用的非線性函數(shù)除了多項(xiàng)式函數(shù)之外，還包括（）。A、冪函數(shù)B、對數(shù)函數(shù)C、雙曲函數(shù)D、指數(shù)函數(shù)參考答案：ABCD65.常見的評估方法有（）A、留出法B、交叉驗(yàn)證法C、采樣法D、自助法參考答案：ABD66.Weka是著名的開源機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘軟件，高級用戶可以通過哪些方式調(diào)用其分析組件A、Java編程B、命令行C、智能客服D、遠(yuǎn)程接口參考答案：AB67.TD-LTE室內(nèi)覆蓋面臨的挑戰(zhàn)（）A、覆蓋場景復(fù)雜多樣B、信號頻段較高，覆蓋能力差C、雙流模式對室分系統(tǒng)工程改造要求較高D、與WLAN系統(tǒng)存在復(fù)雜的互干擾問題參考答案：ABCD68.S-GW的功能包括A、尋呼消息的發(fā)送B、數(shù)據(jù)的路由和傳播C、用戶面數(shù)據(jù)的加密D、NAC層信令的加密參考答案：BC69.S1接口支持的功能包括A、SGW承載業(yè)務(wù)管理B、NAS信令傳輸功能C、網(wǎng)絡(luò)共享功能D、LTE_ACTIVE態(tài)的UE在LTE系統(tǒng)內(nèi)移動(dòng)性管理功能參考答案：ABC70.LTE中常用的集中動(dòng)態(tài)資源調(diào)度算法A、輪詢調(diào)度算法RRB、最大載干比調(diào)度算法MaxC/IC、比例公平算法PFD、半持續(xù)調(diào)度算法SPS參考答案：ABC71.K-Means算法的缺點(diǎn)主要包括（）A、初始點(diǎn)的選擇可能會影響最終的結(jié)果B、不能解決非凸數(shù)據(jù)問題C、容易受到噪聲點(diǎn)的影響D、K值很難確定參考答案：ABCD72.Hive數(shù)據(jù)倉庫有什么特點(diǎn)？A、hive能夠使用類SQL語言完成一定的數(shù)據(jù)分析需求B、hive的元數(shù)據(jù)可以存儲在mysql中C、hive的數(shù)據(jù)存儲在hdfs上能夠利用分布式存儲的優(yōu)勢D、hive支持隨機(jī)查詢參考答案：ABC73.hbase有哪些特點(diǎn)？A、hbase支持隨機(jī)查詢B、hbase支持?jǐn)?shù)據(jù)修改C、hbase支持多表鏈接D、hbase支持多master參考答案：ABD74.for變量in序列:執(zhí)行語句塊中序列可以是（）A、數(shù)組B、列表C、元組D、字典參考答案：ABCD75.Attach成功率的指標(biāo)來源可能是A、網(wǎng)管系統(tǒng)B、網(wǎng)優(yōu)平臺C、集中性能平臺D、大數(shù)據(jù)平臺參考答案：ABCD76.Apriori算法的計(jì)算復(fù)雜度受（）影響A、支持度閥值B、項(xiàng)數(shù)（維度）C、事務(wù)數(shù)D、事務(wù)平均寬度參考答案：ABCD77.Apriori算法的計(jì)算復(fù)雜度受（）影響。A、支持度閥值B、項(xiàng)數(shù)（維度）C、事務(wù)數(shù)D、事務(wù)平均寬度參考答案：ABCD78.（）這些數(shù)據(jù)特性都是對聚類分析具有很強(qiáng)影響的A、高維性B、規(guī)模C、稀疏性D、噪聲和離群點(diǎn)參考答案：ABCD79.（）這些數(shù)據(jù)特性都是對聚類分析具有很強(qiáng)影響的。A、高維性B、規(guī)模C、稀疏性D、噪聲和離群點(diǎn)參考答案：ABCD判斷題1.字典的“鍵”必須是不可變的。A、正確B、錯(cuò)誤參考答案：A2.自動(dòng)適應(yīng)商務(wù)不斷變化的要求。A、正確B、錯(cuò)誤參考答案：A3.正則表達(dá)式中，字符“+”表示前面字符的零個(gè)或者無限個(gè)。A、正確B、錯(cuò)誤參考答案：B4.正則表達(dá)式模塊re的match（）方法是從字符串的開始匹配特定模式，而search（）方法是在整個(gè)字符串中尋找模式，這兩個(gè)方法如果匹配成功則返回match對象，匹配失敗則返回空值None。A、正確B、錯(cuò)誤參考答案：A5.噪聲和偽像是數(shù)據(jù)錯(cuò)誤這一相同表述的兩種叫法。A、正確B、錯(cuò)誤參考答案：B6.噪聲和偽像是數(shù)據(jù)錯(cuò)誤這一相同表述的兩種叫法。（）A、正確B、錯(cuò)誤參考答案：B7.在主成分分析中，每個(gè)主成分都是原始變量的線性組合，且各個(gè)主成分之間互不相關(guān)。A、正確B、錯(cuò)誤參考答案：A8.在一元回歸分析中，用r表示因變量對自變量的相關(guān)系數(shù)，當(dāng)|r|接近1時(shí)，用回歸直線來表達(dá)因變量與自變量之間的線性關(guān)系就不準(zhǔn)確。A、正確B、錯(cuò)誤參考答案：B9.在模型樹的構(gòu)建過程中，分裂屬性的選擇以分裂后的各個(gè)子數(shù)據(jù)集中目標(biāo)屬性取值的標(biāo)準(zhǔn)差為依據(jù)，將標(biāo)準(zhǔn)差作為一種誤差度量，將分裂前后標(biāo)準(zhǔn)差的減少量作為誤差的期望減少，稱為SDR。A、正確B、錯(cuò)誤參考答案：A10.在決策樹中，隨著樹中結(jié)點(diǎn)數(shù)變得太大，即使模型的訓(xùn)練誤差還在繼續(xù)減低，但是檢驗(yàn)誤差開始增大，這是出現(xiàn)了模型擬合不足的問題。A、正確B、錯(cuò)誤參考答案：B11.在決策樹中，隨著樹中結(jié)點(diǎn)數(shù)變得太大，即使模型的訓(xùn)練誤差還在繼續(xù)減低，但是檢驗(yàn)誤差開始增大，這是出現(xiàn)了模型擬合不足的問題。（）A、正確B、錯(cuò)誤參考答案：B12.在聚類分析當(dāng)中，簇內(nèi)的相似性越大，簇間的差別越大，聚類的效果就越差。（）A、正確B、錯(cuò)誤參考答案：B13.在結(jié)構(gòu)化數(shù)據(jù)中進(jìn)行關(guān)聯(lián)分析發(fā)現(xiàn)其中的頻繁模式和關(guān)聯(lián)規(guī)則。于取值連續(xù)的屬性，首先將其離散化，然后將每個(gè)取值區(qū)間作為一個(gè)值，繼而轉(zhuǎn)化為“屬性=值”的形式。A、正確B、錯(cuò)誤參考答案：A14.在多元線性回歸模型中，變量顯著性檢驗(yàn)與方程顯著性檢驗(yàn)都要進(jìn)行，不能相互替代。A、正確B、錯(cuò)誤參考答案：A15.在Python中元組的值是不可變的，因此，已知x=（[1]，[2]），那么語句x[0].append（3）是無法正常執(zhí)行的。A、正確B、錯(cuò)誤參考答案：B16.在GBK和CP936編碼中一個(gè)漢字需要2個(gè)字節(jié)。A、正確B、錯(cuò)誤參考答案：A17.元組是不可變的，不支持列表對象的inset（）、remove（）等方法，也不支持del命令刪除其中的元素，但可以使用del命令刪除整個(gè)元組對象。A、正確B、錯(cuò)誤參考答案：A18.用最小二乘法求回歸方程，首先要求因變量與自變量之間存在線性相關(guān)關(guān)系。A、正確B、錯(cuò)誤參考答案：B19.已知列表x中包含超過5個(gè)以上的元素，那么語句x=x[:5]+x[5:]的作用是將列表x中的元素循環(huán)左移5位。A、正確B、錯(cuò)誤參考答案：B20.已知x是一個(gè)列表，那么x=x[3:]+x[:3]可以實(shí)現(xiàn)把列表x中的所有元素循環(huán)左移3位。A、正確B、錯(cuò)誤參考答案：A21.已知x=‘Python是一種非常好的編程語言’.encode（），那么表達(dá)式x.decode（‘gbk’）的值為’Python是一種非常好的編程語言’。A、正確B、錯(cuò)誤參考答案：B22.一種簡單的填補(bǔ)缺失值的方法為，將屬于同一類的對象的該屬性值的均值賦予此缺失值。A、正確B、錯(cuò)誤參考答案：A23.一元線性回歸的步驟：構(gòu)建包含因變量和自變量的訓(xùn)練集；通過散點(diǎn)圖確認(rèn)因變量和自變量之前的近似線性關(guān)系；計(jì)算系數(shù)和構(gòu)建模型；模型檢驗(yàn)；利用模型進(jìn)行預(yù)測。A、正確B、錯(cuò)誤參考答案：A24.一個(gè)時(shí)間序列中包含長期趨勢、季節(jié)變動(dòng)、循環(huán)變動(dòng)和不規(guī)則變動(dòng)，一般將四個(gè)因素一一分解之后進(jìn)行分析。A、正確B、錯(cuò)誤參考答案：B25.一般而言，定量預(yù)測方法在滿足下列三個(gè)條件時(shí)才能使用:一是能夠知道待測變量的過去值，二是信息可以量化，三是過去的變動(dòng)形式將持續(xù)到未來是一個(gè)合理的假設(shè)。A、正確B、錯(cuò)誤參考答案：A26.尋找模式和規(guī)則主要是對數(shù)據(jù)進(jìn)行干擾，使其符合某種規(guī)則以及模式。A、正確B、錯(cuò)誤參考答案：B27.序列數(shù)據(jù)沒有時(shí)間戳。（）A、正確B、錯(cuò)誤參考答案：A28.信息熵給出了一種度量不確定性的方式，是用來衡量隨機(jī)變量不確定性的，熵就是信息的期望值。A、正確B、錯(cuò)誤參考答案：A29.小項(xiàng)目集的任一非空子集可能是小的也可能是大的A、正確B、錯(cuò)誤參考答案：A30.現(xiàn)實(shí)意義中的數(shù)據(jù)挖掘分析對象是真實(shí)的海量數(shù)據(jù);這些數(shù)據(jù)之間存在一定的邏輯關(guān)系;數(shù)據(jù)大多是模糊的、隨機(jī)的、不完整的、無意義的噪聲數(shù)據(jù)（）A、正確B、錯(cuò)誤參考答案：B31.下列robots.txt文件中，User-agent后面跟的是爬蟲的名稱，Disallow后面跟著可以爬蟲的網(wǎng)頁A、正確B、錯(cuò)誤參考答案：B32.文件打開之后可以不關(guān)閉，因?yàn)槌绦驁?zhí)行完成后可以自動(dòng)關(guān)閉文件。A、正確B、錯(cuò)誤參考答案：B33.統(tǒng)計(jì)選修各門課程人數(shù)的SELECT語句為:SELECT課程號，SUM（學(xué)號）FROM成績GROUPBY課程號;。A、正確B、錯(cuò)誤參考答案：B34.通過數(shù)據(jù)離散化，可以實(shí)現(xiàn)縮減數(shù)據(jù)量的效果。A、正確B、錯(cuò)誤參考答案：A35.通過requests庫發(fā)送的HTTP請求，返回一個(gè)response對象。A、正確B、錯(cuò)誤參考答案：A36.特征提取技術(shù)并不依賴于特定的領(lǐng)域。（）A、正確B、錯(cuò)誤參考答案：B37.數(shù)據(jù)挖掘主要構(gòu)建四大類模型包括:分類、聚類、預(yù)測和關(guān)聯(lián)（）A、正確B、錯(cuò)誤參考答案：A38.數(shù)據(jù)庫類型是按照數(shù)據(jù)存取的方法來劃分的。A、正確B、錯(cuò)誤參考答案：B39.數(shù)據(jù)可視化可以便于人們對數(shù)據(jù)的理解。（）A、正確B、錯(cuò)誤參考答案：A40.屬性A的熵值H（X，A）是為了獲取樣本關(guān)于屬性A的信息所需要付出的代價(jià)。A、正確B、錯(cuò)誤參考答案：A41.使用內(nèi)置函數(shù)open（）打開文件時(shí)，只要文件路徑正確就總是可以正確打開的。A、正確B、錯(cuò)誤參考答案：B42.使用del命令或者列表對象的remove（）方法刪除列表中元素時(shí)會影響列表中部分元素的索引。A、正確B、錯(cuò)誤參考答案：A43.商業(yè)智能系統(tǒng)與一般交易系統(tǒng)之間在系統(tǒng)設(shè)計(jì)上的主要區(qū)別在于：后者把結(jié)構(gòu)強(qiáng)加于商務(wù)之上，一旦系統(tǒng)設(shè)計(jì)完畢，其程序和規(guī)則不會輕易改變；而前者則是一個(gè)學(xué)習(xí)型系統(tǒng)，能自動(dòng)適應(yīng)商務(wù)不斷變化的要求。A、正確B、錯(cuò)誤參考答案：A44.如果一個(gè)正確象不強(qiáng)屬于任何簇，那么該正確象是基于聚類的離群點(diǎn)。A、正確B、錯(cuò)誤參考答案：A45.如果一個(gè)對象不強(qiáng)屬于任何簇，那么該對象是基于聚類的離群點(diǎn)。（）A、正確B、錯(cuò)誤參考答案：A46.如果某產(chǎn)品的生產(chǎn)和銷售正處于市場成長期，其營銷重點(diǎn)應(yīng)該是延長產(chǎn)品壽命。A、正確B、錯(cuò)誤參考答案：B47.如果規(guī)則不滿足置信度閾值，則形如的規(guī)則一定也不滿足置信度閾值，其中是X的子集。A、正確B、錯(cuò)誤參考答案：A48.如果對象p到q是關(guān)于Eps和MinPts密度相連的，則對象q到p是關(guān)于Eps和MinPts密度相連的。A、正確B、錯(cuò)誤參考答案：A49.樸素貝葉斯分類基于貝葉斯定理的一種分類方法。A、正確B、錯(cuò)誤參考答案：A50.爬蟲是手動(dòng)請求萬維網(wǎng)網(wǎng)站且提取網(wǎng)頁數(shù)據(jù)的程序。A、正確B、錯(cuò)誤參考答案：B51.凝聚層次聚類法中每次簇的合并可以更改。A、正確B、錯(cuò)誤參考答案：B52.模型樹構(gòu)建之后，為了避免過度擬合，需要對模型樹進(jìn)行剪枝。A、正確B、錯(cuò)誤參考答案：A53.模型的具體化就是預(yù)測公式，公式可以產(chǎn)生與觀察值有相似結(jié)構(gòu)的輸出，這就是預(yù)測值。（）A、正確B、錯(cuò)誤參考答案：A54.模式為對數(shù)據(jù)集的全局性總結(jié)，它對整個(gè)測量空間的每一點(diǎn)做出描述；模型則對變量變化空間的一個(gè)有限區(qū)域做出描述。（）A、正確B、錯(cuò)誤參考答案：B55.模糊查詢使用運(yùn)算符LIKE結(jié)合“%”和“_”實(shí)現(xiàn)。A、正確B、錯(cuò)誤參考答案：A56.邏輯回歸模型是用來解決回歸問題的。A、正確B、錯(cuò)誤參考答案：B57.離群點(diǎn)是一個(gè)實(shí)際觀測值，它與其他觀測值的差別如此之大，以至于懷疑它是由不同的機(jī)制產(chǎn)生的。A、正確B、錯(cuò)誤參考答案：A58.可以使用del刪除集合中的部分元素。A、正確B、錯(cuò)誤參考答案：B59.決策樹算法易于理解好實(shí)現(xiàn)，且對缺失值、異常值和共線性都不敏感，是做分類預(yù)測的首選算法。A、正確B、錯(cuò)誤參考答案：B

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

（必刷）《大數(shù)據(jù)挖掘技術(shù)》考點(diǎn)精粹必做題（附答案）

文檔簡介

溫馨提示

最新文檔

評論

（必刷）《大數(shù)據(jù)挖掘技術(shù)》考點(diǎn)精粹必做題（附答案）

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔