《大數(shù)據(jù)挖掘技術(shù)》核心考點速記速練題（附答案）

上傳人：服*** IP屬地：四川上傳時間：2025-12-12 格式：DOC 頁數(shù)：131 大?。?66.55KB 積分：12 舉報 版權(quán)申訴

《大數(shù)據(jù)挖掘技術(shù)》核心考點速記速練題（附答案）_第2頁

《大數(shù)據(jù)挖掘技術(shù)》核心考點速記速練題（附答案）_第3頁

《大數(shù)據(jù)挖掘技術(shù)》核心考點速記速練題（附答案）_第4頁

《大數(shù)據(jù)挖掘技術(shù)》核心考點速記速練題（附答案）_第5頁

已閱讀5頁，還剩126頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

《大數(shù)據(jù)挖掘技術(shù)》核心考點速記速練題（附答案）單選題1.最小-最大法中，假設(shè)需要映射到目標區(qū)間為[L，R]，原來的取值范圍為[l，r]。一個值x映射到新區(qū)間后的值v的計算方法是（）。A、v＝（ｒ－ｌ）／（ｘ－ｌ）＊（Ｒ－Ｌ）＋ＬB、v＝（ｘ－ｌ）／（ｒ－ｌ）＊（Ｒ－Ｌ）＋ＬC、v＝（ｒ－ｌ）／（ｘ－ｌ）＊（ｘ－Ｌ）＋ＬD、v＝（ｘ－ｌ）／（ｒ－ｌ）＊（ｘ－Ｌ）＋Ｌ參考答案：B2.字符串是一個字符序列，給字符串s，以下表示s從右側(cè)向左第三個字符的是：A、s[-3]B、s[:-3]C、s[3]D、s[0:-3]參考答案：A3.字符串是一個連續(xù)的字符序列，哪個選項可以實現(xiàn)打印字符信息的換行？A、使用\nB、使用轉(zhuǎn)義符\\C、使用空格D、使用“\換行”參考答案：A4.字典對象的（）方法返回字典的“值”列表A、keys（）B、key（）C、values（）D、items（）參考答案：C5.字典的（）方法返回字典的“鍵”列表A、keys（）B、key（）C、values（）D、items（）參考答案：A6.自動化高級分析實驗室，實現(xiàn)與統(tǒng)一數(shù)據(jù)資源庫互聯(lián)，實現(xiàn)數(shù)據(jù)的自助組表、自助分析功能，滿足不同層級、不同水平的用戶需求的是（）A、初級分析;B、綜合分析C、典型分析D、高級分析參考答案：D7.只有非零值才重要的二元屬性被稱作：（）A、計數(shù)屬性B、離散屬性C、非對稱的二元屬性D、對稱屬性參考答案：C8.支持向量機是一種二分類模型，其基本模型定義為特征空間上的間隔最大的線性分類器，其學(xué)習(xí)策略便是（），最終可轉(zhuǎn)化為一個凸二次規(guī)劃問題的求解。A、間隔最小化B、間隔最大化C、間隔不變化D、分類最大化參考答案：B9.在中移動的集中性能管理應(yīng)用落地-居民區(qū)4G＆寬帶網(wǎng)絡(luò)能力全景分析手冊中，感知差居民區(qū)的定義是：A、4G感知質(zhì)差用戶占比>5%或4G駐留比＜95%B、4G感知優(yōu)良用戶占比＜80%或4G駐留比＜90%C、4G感知優(yōu)良用戶占比＜80%且4G駐留比＜90%D、4G感知質(zhì)差用戶占比>5%且4G駐留比＜95%參考答案：A10.在有關(guān)數(shù)據(jù)倉庫測試，下列說法不正確的是（）A、在完成數(shù)據(jù)倉庫的實施過程中，需要對數(shù)據(jù)倉庫進行各種測試.測試工作中要包括單元測試和系統(tǒng)測試B、當(dāng)數(shù)據(jù)倉庫的每個單獨組件完成后，就需要對他們進行單元測試C、系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進行大量的功能測試和回歸測試D、在測試之前沒必要制定詳細的測試計劃參考答案：D11.在用SQL查詢時，用WHERE子句指出的是（）。A、查詢結(jié)果B、查詢條件C、查詢視圖D、查詢目標參考答案：B12.在一元回歸分析中，回歸平方和占總平方和的比例稱為模型的擬合優(yōu)度，擬合優(yōu)度越接近1，因變量與自變量之間的線性關(guān)系就越明顯。A、FB、T參考答案：B13.在一元回歸分析中，回歸平方和占總平方和的比例稱為模型的擬合優(yōu)度，擬合優(yōu)度越接近0，因變量與自變量之間的線性關(guān)系越明顯。A、FB、T參考答案：A14.在線性不可分的情況下，支持向量機首先在低維空間中完成計算，然后通過（）將輸入空間映射到高維特征空間，最終在高維特征空間中構(gòu)造出最優(yōu)分離超平面，從而把平面上本身不好分的非線性數(shù)據(jù)分開。A、線性函數(shù)B、回歸函數(shù)C、核函數(shù)D、卡方函數(shù)參考答案：C15.在無線網(wǎng)絡(luò)覆蓋指標體系中，4G用戶4G流量駐留比的指標定義是？A、4G活躍用戶群產(chǎn)生的4G上網(wǎng)流量/（4G活躍用戶群產(chǎn)生的移動互聯(lián)網(wǎng)上網(wǎng)總流量）B、4G活躍用戶群產(chǎn)生的4G上網(wǎng)流量/（2G+3G+4G活躍用戶群產(chǎn)生的移動互聯(lián)網(wǎng)上網(wǎng)總流量）C、4G活躍用戶群產(chǎn)生的移動互聯(lián)網(wǎng)上網(wǎng)流量/（2G+3G+4G活躍用戶群產(chǎn)生的移動互聯(lián)網(wǎng)上網(wǎng)總流量）參考答案：A16.在圖集合中發(fā)現(xiàn)一組公共子結(jié)構(gòu)，這樣的任務(wù)稱為A、頻繁子集挖掘B、頻繁子圖挖掘C、頻繁數(shù)據(jù)項挖掘D、頻繁模式挖掘參考答案：B17.在數(shù)據(jù)預(yù)處理中，將錯誤的、不一致的數(shù)據(jù)予以更正或刪除，以免影響挖掘結(jié)果的正確性，這一過程稱為（）A、數(shù)據(jù)提取B、數(shù)據(jù)轉(zhuǎn)換C、數(shù)據(jù)清理D、數(shù)據(jù)加載參考答案：C18.在數(shù)據(jù)挖掘過程中，（）可以看作是承載數(shù)據(jù)和挖掘算法的基礎(chǔ)設(shè)施。A、云平臺B、物聯(lián)網(wǎng)C、SPSSD、WEKA參考答案：A19.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴展強、數(shù)據(jù)挖掘能力強等特點的分析工具是（）。A、WekaB、SPSSC、SASD、R參考答案：D20.在上網(wǎng)業(yè)務(wù)問題診斷中，以下哪一種錯誤現(xiàn)象需要進一步定位用戶側(cè)問題？A、發(fā)送SNY_ack后用戶端無ackB、附著失敗返回#96C、DNS解析失敗返回#3D、HTTP失敗返回#400-500參考答案：A21.在上題中，屬于定量的屬性類型是：A、標稱B、序數(shù)C、區(qū)間D、相異參考答案：C22.在利用sklearn.cluster.AgglomerativeClustering進行凝聚聚類時，使用的默認距離度量是（）。A、曼哈頓距離B、馬氏距離C、余弦距離D、歐氏距離參考答案：D23.在利用linear_model.LinearRegression（）構(gòu)造的reg對象訓(xùn)練模型后，可以通過以下哪行代碼查看回歸模型系數(shù)（）。A、reg._coefB、reg._coefficientC、reg.coefficient_D、reg.coef_參考答案：D24.在進行數(shù)據(jù)挖掘任務(wù)的時候，通常面臨樣本數(shù)據(jù)特征過多的情況，我們可以通過Filter過濾法選擇那些對我們分析任務(wù)更有幫助的特征，下列方法哪個不是用來做特征過濾的（）A、卡方檢驗B、F檢驗C、互信息法D、奇異值分解參考答案：D25.在集團公司四維十輪網(wǎng)絡(luò)質(zhì)量評估體系中，下列哪項不是評估移動業(yè)務(wù)感知的指標：A、重點保障場景VoLTE接通率（%）B、4G客戶網(wǎng)絡(luò)質(zhì)量滿意度C、HTTP下載速率（Mbps）D、家庭寬帶網(wǎng)絡(luò)質(zhì)量滿意度參考答案：D26.在基于圖的簇評估度量表里面，如果簇度量為proximity（Ci，C），簇權(quán)值為mi，那么它的類型是（）。A、基于圖的凝聚度B、基于原型的凝聚度C、基于原型的分離度D、基于圖的凝聚度和分離度參考答案：C27.在基于規(guī)則分類器的中，依據(jù)規(guī)則質(zhì)量的某種度量對規(guī)則排序，保證每一個測試記錄都是由覆蓋它的“最好的”規(guī)格來分類，這種方案稱為A、基于類的排序方案B、基于規(guī)則的排序方案C、基于度量的排序方案D、基于規(guī)格的排序方案。參考答案：B28.在基本K均值算法里，當(dāng)鄰近度函數(shù)采用（）的時候，合適的質(zhì)心是簇中各點的中位數(shù)。A、曼哈頓距離B、平方歐幾里德距離C、余弦距離D、Bregman散度參考答案：A29.在多元線性回歸模型中，變量顯著性檢驗（t檢驗）與方程顯著性檢驗（F檢驗）是一致的。A、FB、T參考答案：A30.在抽樣方法中，當(dāng)合適的樣本容量很難確定時，可以使用的抽樣方法是：（）A、有放回的簡單隨機抽樣B、無放回的簡單隨機抽樣C、分層抽樣D、漸進抽樣參考答案：D31.在SQLServer提供的EM聚類算法中，敘述正確的是（）A、必須要設(shè)置聚類的分類數(shù)B、不必指定聚類的分類數(shù)C、可以不指定聚類的分類數(shù)，此時采用默認值D、以上都不對參考答案：C32.在Requests庫的get（）方法中，能夠定制向服務(wù)器提交HTTP請求頭的參數(shù)是什么？A、dataB、jsonC、cookiesD、headers參考答案：D33.在MySQL中，對于字段值為空值（NULL）敘述正確的是（）。A、空值等同于空字符串B、空值表示字段還沒有確定值C、不支持字段值為空值D、空值等同于數(shù)值0參考答案：B34.在Bigtable中，（）主要用來存儲子表數(shù)據(jù)以及一些日志文件A、GFSB、ChubbyC、SSTableD、MapReduce二、（共40題）參考答案：A35.運行以下代碼Fromsklearn.datasetsimportload_irisIris_data=load_iris（）Iris_data.data.shape輸出結(jié)果為（150，4）。則表示iris數(shù)據(jù)集包括樣本個數(shù)為（）。A、150B、154C、600D、4參考答案：C36.運行以下代碼”importmatplotlib.pyplotasplt”引入plt后，要繪制餅狀圖，需要利用的函數(shù)為（）。A、plt.hist（）B、plt.pie（）C、plt.plot（）D、plt.bar（）參考答案：B37.原始的樸素貝葉斯只能處理離散數(shù)據(jù)，當(dāng)x1，…，xn是連續(xù)變量時，我們可以使用（）完成分類任務(wù)A、貝葉斯定理B、半樸素貝葉斯C、拉普拉斯平滑處理D、高斯樸素貝葉斯參考答案：D38.語音識別的突破在（）A、用人類思維去做，讓機器認識每個音節(jié)音素，然后通過音節(jié)音素去分辨字和單詞B、研發(fā)過程中，計算機工程師與科學(xué)家圍繞著語言學(xué)家進行工作C、開創(chuàng)了統(tǒng)計學(xué)的模式，拋棄了模仿人類思維方式，不再通過總結(jié)思維規(guī)則的老路，研發(fā)過程中極少語言學(xué)家的參與，更多是計算機科學(xué)家與數(shù)學(xué)家的合作D、圖靈測試參考答案：C39.與大數(shù)據(jù)密切相關(guān)的技術(shù)是（）。A、藍牙;B、云計算C、Wi-FiD、博弈論參考答案：B40.有些數(shù)據(jù)挖掘算法，要求數(shù)據(jù)屬性是標稱類別，當(dāng)數(shù)據(jù)中包含數(shù)值屬性時，為了使用這些算法需要將數(shù)值屬性轉(zhuǎn)換成標稱屬性。通過采取各種方法將數(shù)值屬性的值域劃分成一些小的區(qū)間，并將這連續(xù)的小區(qū)間與離散的值關(guān)聯(lián)起來，每個區(qū)間看作一個類別。例如，某個問題中的年齡屬性一種可能的劃分成類別操作是：[0…11]→兒童，[12…17]→青少年，[18…44]→青年，[45…69]→中年，[69…∞]→老年。這種將連續(xù)變量劃分成不同類別的過程通常稱為（）。A、特征化B、優(yōu)化C、標準化D、離散化參考答案：D41.有如下的數(shù)據(jù)表:部門（部門號，部門名稱），職工（部門號，職工號，姓名，基本工資）。檢索有職工的基本工資大于或等于“11”部門中任意一名職工工資的“部門號”，正確的語句是（）。A、SELECTDISTINCT部門號FROM職工WHERE基本工資>=ANY（SELECT基本工資FROM職工WHERE部門號='11'）;B、SELECTDISTINCT部門號FROM職工WHERE基本工資>=ALL（SELECT基本工資FROM職工WHERE部門號='11'）;C、SELECTDISTINCT部門號FROM職工WHERE基本工資>=ANY（SELECTMAX（基本工資）FROM職工WHERE部門號='11'）;D、SELECTDISTINCT部門號FROM職工WHERE基本工資>=ALL（SELECTMIN（基本工資）FROM職工WHERE部門號='11'）;參考答案：A42.有關(guān)數(shù)據(jù)倉庫物理模型設(shè)計的敘述中正確的是（）。A、存儲結(jié)構(gòu)中不能存在任何數(shù)據(jù)冗余B、盡可能多地建立索引C、盡可能把在邏輯上關(guān)聯(lián)的數(shù)據(jù)放在一個表中D、以上都不對參考答案：D43.有關(guān)數(shù)據(jù)倉庫建模的敘述中正確的是（）。A、因為需求分析中已經(jīng)考慮主題，建模時不再需要確定主題域B、因為需求分析中已經(jīng)確定項目的所有功能，沒有必要再進行數(shù)據(jù)倉庫建模工作C、數(shù)據(jù)倉庫建模是設(shè)計概念模型，繼而導(dǎo)出邏輯模型D、數(shù)據(jù)倉庫建模是設(shè)計物理模型參考答案：C44.有關(guān)數(shù)據(jù)倉庫分割策略的敘述中正確的是（）A、分割越細越好B、分割策略與數(shù)據(jù)量大小和速度等因素有關(guān)C、分割越粗越好D、以上都不對參考答案：B45.有關(guān)數(shù)據(jù)倉庫的開發(fā)特點，不正確的描述是:A、數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā);B、數(shù)據(jù)倉庫使用的需求在開發(fā)出去就要明確;C、數(shù)據(jù)倉庫的開發(fā)是一個不斷循環(huán)的過程，是啟發(fā)式的開發(fā);D、在數(shù)據(jù)倉庫環(huán)境中，并不存在操作型環(huán)境中所固定的和較確切的處理流，數(shù)據(jù)倉庫中數(shù)據(jù)參考答案：A46.有關(guān)樸素貝葉斯分類算法的敘述中正確的是（）A、樸素貝葉斯分類算法是一種精確的分類算法B、采用樸素貝葉斯分類算法將一個樣本分到某個類別中，表示它100%屬于該類別C、樸素貝葉斯分類算法是一種基于概率的分類算法D、以上都不對參考答案：C47.有關(guān)頻繁項集的敘述中正確的是（）。A、頻繁項集是滿足最小支持度閾值和最小置信度閾值的項集B、頻繁項集是滿足最小支持度閾值的項集C、頻繁項集是滿足最小置信度閾值的項集D、頻繁項集是任何項集參考答案：B48.用于將Python程序打包成可執(zhí)行文件的工具是（）A、Panda3DB、cocos2dC、pipD、PyInstaller參考答案：D49.用于分類與回歸應(yīng)用的主要算法有:（）A、Apriori算法、HotSpot算法B、RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹C、K均值法、SOM神經(jīng)網(wǎng)絡(luò)D、決策樹、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯參考答案：D50.用簡單隨機重復(fù)抽樣方法抽取樣本單位，如果要使抽樣平均誤差降低50%，則樣本容量需要擴大到原來的（）A、2倍B、3倍C、4倍D、5倍參考答案：C51.用戶有一種感興趣的模式并且希望在數(shù)據(jù)集中找到相似的模式，屬于數(shù)據(jù)挖掘哪一類任務(wù)？A、根據(jù)內(nèi)容檢索B、建模描述C、預(yù)測建模D、尋找模式和規(guī)則參考答案：A52.以下有關(guān)回歸分析與時間序列分析的敘述中正確的是（）A、時間序列分析方法明確強調(diào)變量值順序的重要性，而回歸分析方法不是B、時間序列各觀測值之間存在一定的依存關(guān)系，而回歸分析一般要求每一變量各自獨立C、時間序列是一組隨機變量的一次樣本實現(xiàn)，而回歸分析的樣本值一般是對同一隨機變量進行多次獨立重復(fù)實驗的結(jié)果D、以上都是正確的參考答案：D53.以下敘述中正確的是（）A、OLAP是針對特定事務(wù)聯(lián)機數(shù)據(jù)訪問B、如果一個維是多層次的，那么該維的維成員就是相同維層次的取值的組合C、OLTP存儲的是歷史數(shù)據(jù)，不可更新，但可周期性地刷新D、OLAP的特點是能夠?qū)Χ嗑S信息進行快速分析參考答案：D54.以下哪種方法不屬于特征選擇的標準方法：A、嵌入B、過濾C、包裝D、抽樣參考答案：D55.以下哪一點不是PCI規(guī)劃需要重點關(guān)注的A、頻率B、RS位置C、小區(qū)位置關(guān)系D、TA歸屬參考答案：D56.以下哪些指標可以通過網(wǎng)優(yōu)平臺獲??？（）A、無線接通率B、eSRVCC切換成功率C、TCH話務(wù)量D、E-RAB建立成功率參考答案：B57.以下哪些學(xué)科和數(shù)據(jù)挖掘沒有密切聯(lián)系？（）A、統(tǒng)計學(xué)B、計算機組成原理C、機器學(xué)習(xí)D、人工智能參考答案：B58.以下哪些網(wǎng)元不是VoLTE特有網(wǎng)元A、MGCFB、S-CSCFC、MMED、SBC參考答案：C59.以下哪些算法是基于規(guī)則的分類器（）A、C4.5B、KNNC、NaiveD、ANN參考答案：A60.以下哪些算法是分類算法，（）A、DBSCANB、C4.5C、K-MeanD、EM參考答案：B61.以下哪些分類方法可以較好地避免樣本的不平衡問題?（）A、KNNB、SVMC、BayesD、神經(jīng)網(wǎng)絡(luò)參考答案：A62.以下哪些不是業(yè)務(wù)質(zhì)量指標KQIA、頁面響應(yīng)成功率B、視頻下載速率C、及時通信接入時延D、Attach成功率參考答案：D63.以下哪項關(guān)于決策樹的說法是錯誤的（）A、冗余屬性不會對決策樹的準確率造成不利的影響B(tài)、子樹可能在決策樹中重復(fù)多次C、決策樹算法對于噪聲的干擾非常敏感D、尋找最佳決策樹是NP完全問題參考答案：C64.以下哪個指標不能用于線性回歸中的模型比較（）A、R方B、調(diào)整R方C、AICD、BIC參考答案：A65.以下哪個聚類算法不屬于基于網(wǎng)格的聚類算法（）。A、STINGB、WaveClusterC、MAFIAD、BIRCH參考答案：D66.以下哪個變量可以反映客戶的忠誠度?（）A、購買頻次B、購買金額C、最后一次購買時間D、購買金額波動率參考答案：A67.以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)（ANN）的描述錯誤的有（）A、神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒B、可以處理冗余特征C、訓(xùn)練ANN是一個很耗時的過程D、至少含有一個隱藏層的多層神經(jīng)網(wǎng)絡(luò)參考答案：A68.以下關(guān)于前饋神經(jīng)網(wǎng)絡(luò)的敘述中正確的是（）A、前饋神經(jīng)網(wǎng)絡(luò)只能有3層B、前饋神經(jīng)網(wǎng)絡(luò)中存在反饋C、前饋神經(jīng)網(wǎng)絡(luò)中每一層只接受來自前一層單元的輸入D、以上都是正確的參考答案：C69.以下不屬于聚類算法的是：A、K均值B、DBSCANC、AprioriD、Jarvis-Patrick（JP）參考答案：C70.以下不是Python語言合法命名的是：A、5MyGodB、_MyGod_C、MyGod5D、MyGod參考答案：A71.以下不可以用來分類的模型是A、線性回歸模型B、神經(jīng)網(wǎng)絡(luò)模型C、邏輯回歸模型D、支持向量機參考答案：A72.以下OLAP操作中（）的作用是改變維的層次，變換分析的粒度。A、切塊B、平移C、鉆取D、切片參考答案：C73.以下（）不是影響時間序列變化的要素。A、長期趨勢B、季節(jié)變動C、循環(huán)波動D、有規(guī)則變化參考答案：D74.已知事件A的概率P（A）=0.6，U為必然事件，則P（A+U）=1，P（AU）=A、0.4B、0.6C、0D、1參考答案：B75.已知x=[1，2，3]，執(zhí)行語句x.append（4）之后，x的值是（）A、[1，2，3，4]B、[4]C、[1，2，3]D、4參考答案：A76.已知x=[1，2，3，4，5，6，7]，那么x.pop（）的結(jié)果是？A、1B、4C、7D、5參考答案：C77.一組N個觀測值按數(shù)值大小排列，分成100份，處于X%位置的值稱第X個百分位數(shù)稱為（）。A、分位數(shù)B、中位數(shù)C、眾數(shù)參考答案：A78.一所大學(xué)內(nèi)的各年紀人數(shù)分別為：一年級200人，二年級160人，三年級130人，四年級110人。則年級屬性的眾數(shù)是：（）A、一年級B、二年級C、三年級D、四年級參考答案：A79.一個神經(jīng)元接收輸人信號為x（1＜i＜n），權(quán)值為w;（1≤i＜n），輸出為y=f（net），其中f稱為激活函數(shù)或激勵函數(shù)，通常net的取值是（）。<imgsrc="/220586/8947890/1669541655518.png">A、AB、BC、CD、D參考答案：B80.要求滿足連接條件的記錄，以及連接條件左側(cè)表中的記錄都包含在結(jié)果中，應(yīng)使用（）。A、左連接B、右連接C、內(nèi)部連接D、完全連接參考答案：A81.研究顧客是否想購買手機與年齡，性別，收入和工作地點的關(guān)系可以使用（）A、回歸方法B、分類方法C、聚類方法D、關(guān)聯(lián)分析參考答案：B82.尋呼過程是（）接口過程，MME通過向eNODEB發(fā)送尋呼消息來發(fā)起尋呼過程的。A、IubB、UuC、S1D、X2參考答案：C83.下述哪個參數(shù)用于UE從GSM/UMTS網(wǎng)絡(luò)重選到LTE網(wǎng)絡(luò)過程中的位置更新請求A、GUTIB、OldGUTIC、PTMSI/RAID、OldPTMSI/RAI參考答案：A84.下面選項中t不是s的子序列的是（）A、S=＜{2，4}，{3，5，6}，{8}>t=＜{2}，{3，6}，{8}>B、S=＜{2，4}，{3，5，6}，{8}>t=＜{2}，{8}>C、S=＜{1，2}，{3，4}>t=＜{1}，{2}>D、S=＜{2，4}，{2，4}>t=＜{2}，{4}>參考答案：C85.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法？（）A、變量代換B、離散化C、聚集D、估計遺漏值參考答案：D86.下面哪個業(yè)務(wù)不屬于即時通信類業(yè)務(wù)？A、微信B、QQC、陌陌D、淘寶參考答案：D87.下面哪個不是Python合法得標識?。ǎ〢、int32B、40XLC、selfD、_name_參考答案：B88.下面關(guān)于構(gòu)建模型樹的說法中，錯誤的是（）。A、如果當(dāng)前結(jié)點t所關(guān)聯(lián)的數(shù)據(jù)集Dt中樣本個數(shù)小于給定閾值或者Dt中樣本的目標屬性取值的標準差小于給定閾值，則將該結(jié)點標記為葉子節(jié)點B、創(chuàng)建一個結(jié)點t，與結(jié)點t關(guān)聯(lián)的數(shù)據(jù)集記為DtC、在選擇分類屬性時，應(yīng)選擇時SDR值最小的屬性D、SDR代表誤差的期望減少參考答案：C89.下面關(guān)于time庫引用不正確的是（）A、from*importtimeB、importtimeC、fromtimeimport*D、fromtimeimportstrftime參考答案：A90.下面購物籃能夠提取的3-項集的最大數(shù)量是多少ID購買項1牛奶，啤酒，尿布2面包，黃油，牛奶3牛奶，尿布，餅干4面包，黃油，餅干5啤酒，餅干，尿布6牛奶，尿布，面包，黃油7面包，黃油，尿布8啤酒，尿布9牛奶，尿布，面包，黃油10啤酒，餅干A、1B、2C、3D、4參考答案：C91.下列選項中錯誤的是（）。A、MSE=SSE/dfEB、MST=SST/dfTC、SSR=SST+SSED、MSR=SSR/dfR參考答案：C92.下列算法中，不屬于外推法的是（）。A、移動平均法B、回歸分析法C、指數(shù)平滑法D、季節(jié)指數(shù)法參考答案：B93.下列四項中，不屬于數(shù)據(jù)庫特點的是（）A、數(shù)據(jù)共享B、數(shù)據(jù)完整性C、數(shù)據(jù)冗余很高D、數(shù)據(jù)獨立性高參考答案：C94.下列說法不正確的是（）A、歸納是從特殊到一般的“泛化”，演繹是從一般到特殊的“特化”B、對于西瓜來說，若色澤、根蒂、敲聲皆有3種取值，加上某種屬性什么都不取和沒有好瓜這個概念，則好瓜的假設(shè)空間共有4X4X4+1=65種假設(shè)（規(guī)則）C、與訓(xùn)練集一致的假設(shè)的集合稱為“版本空間”D、對新樣本，不同假設(shè)可能輸出不同結(jié)果，在正確假設(shè)的選取上，模型（學(xué)習(xí)器）不一定需要偏好，學(xué)習(xí)算法和歸納偏好也可有可無參考答案：D95.下列屬于維歸約常用的線性代數(shù)技術(shù)的有（）A、主成分分析B、特征提取C、特征加權(quán)D、離散化參考答案：A96.下列屬于數(shù)據(jù)挖掘任務(wù)的是（）。A、根據(jù)年齡對顧客進行分組B、統(tǒng)計每個學(xué)生的平均成績C、協(xié)調(diào)公司各部門工作D、利用歷史記錄預(yù)測公司的未來股價參考答案：D97.下列哪種調(diào)制方式抗干擾能力最強A、BPSKB、QPSKC、16QAMD、64QAM參考答案：A98.下列哪項最恰當(dāng)?shù)孛枋隽私CP連接時“第一次握手”所做的工作A、“連接發(fā)起方”向“接收方”發(fā)送一個SYN-ACK段B、“接收方”向“連接發(fā)起方”發(fā)送一個SYN-ACK段C、“連接發(fā)起方”向目標主機的TCP進程發(fā)送一個SYN段D、“接收方”向源主機的TCP進程發(fā)送一個SYN段作為應(yīng)答參考答案：C99.下列基本術(shù)語描述錯誤的是（）A、學(xué)習(xí)（訓(xùn)練）：從數(shù)據(jù)中學(xué)得模型的過程B、測試：學(xué)得模型后，使用其樣本進行預(yù)測的過程C、分類：輸出結(jié)果是連續(xù)值D、回歸：輸出結(jié)果是連續(xù)值參考答案：C100.下列關(guān)于計算機存儲容量單位的說法中，錯誤的是（）A、1KB＜1MB＜1GBB、基本單位是字節(jié)（Byte）C、一個漢字需要一個字節(jié)的存儲空間D、一個字節(jié)能夠容納一個英文字符參考答案：C101.下列方法中，用于對傳遞的URL進行編碼和解碼的是（）。A、urldecode，urlencodeB、unquote，urlencodeC、urlencode，urldecodeD、urlencode，unquote參考答案：D102.下列對學(xué)生相關(guān)屬性描述中，不是標稱屬性的是（）A、身高B、頭發(fā)顏色C、學(xué)號D、婚姻狀況參考答案：A103.下列度量不具有反演性的是A、系數(shù)B、幾率C、Cohen度量D、興趣因子參考答案：D104.下列錯誤的是（）A、查準率／準確率（precision）：P=TP/（TP-FP）B、查準率（precision）：被認定為正例的里面，判斷正確的比例C、查全率／召回率／靈敏度（recall）：R=TP/（TP+FN）D、查全率（recall）：真實正例里，被判斷出為正例的比例參考答案：A105.下列不屬于序數(shù)屬性的是（）。A、顧客滿意度B、礦石硬度C、軍銜D、郵政編碼參考答案：D106.下列不屬于數(shù)據(jù)變換策略的是（）。A、光滑B、聚集C、規(guī)范化D、集成參考答案：D107.下列不屬于瀏覽器開發(fā)者模式面板的為（）A、ElementsB、ConsoleC、SourcesD、headers參考答案：D108.下列不屬于標稱屬性的是（）。A、眼球顏色B、性別C、溫度D、郵政編碼參考答案：C109.下列不是智能的特征的是（）A、具有儲存空間B、具有學(xué)習(xí)能力C、具有記憶與思維的能力D、具有自適應(yīng)能力參考答案：A110.下列selenium庫的方法中，通過元素名稱進行單元素定位的是（）A、find_element_by_nameB、find_elements_by_nameC、find_elements_by_idD、find_elements_by_class_name參考答案：A111.下列（）不是將主觀信息加入到模式發(fā)現(xiàn)任務(wù)中的方法。A、與同一時期其他數(shù)據(jù)對比B、可視化C、基于模板的方法D、主觀興趣度量參考答案：A112.下列（）不屬于人工智能新突破取得的產(chǎn)品A、科大訊飛的翻譯器、記錄儀B、天貓精靈等智能AI音箱C、佳能相機D、某酒店通過人臉識別認證身份信息參考答案：C113.下列（）不是將主觀信息加入到模式發(fā)現(xiàn)任務(wù)中的方法。A、與同一時期其他數(shù)據(jù)對比B、可視化C、基于模板的方法D、主觀興趣度參考答案：A114.無線網(wǎng)性能劣化可能導(dǎo)致以下哪個指標出現(xiàn)問題？（）A、小區(qū)RTT下行時延B、TCP一二次握手時延C、服務(wù)器側(cè)下行RTTD、小區(qū)RTT上行時延參考答案：A115.為數(shù)據(jù)的總體分布建模；把多維空間劃分成組等問題屬于數(shù)據(jù)挖掘的哪一類任務(wù)？（）A、探索性數(shù)據(jù)分析B、建模描述C、預(yù)測建模D、尋找模式和規(guī)則參考答案：B116.網(wǎng)優(yōu)平臺中可以查詢的PRB利用率指標統(tǒng)計的最小粒度是A、15分鐘B、30分鐘C、60分鐘D、5分鐘參考答案：A117.網(wǎng)管側(cè)從愛立信MME取走統(tǒng)計的路徑是A、/Tmp/log/OSS_filesB、/Tmp/OSS_filesC、/Core/log/OSS_filesD、/log/OSS_files參考答案：C118.推薦系統(tǒng)為客戶推薦商品，自動完成個性化選擇商品的過程，滿足客戶的個性化需求，推薦基于網(wǎng)站最熱賣商品、客戶所處城市、（），推測客戶將來可能的購買行為。A、客戶的朋友B、客戶的個人信息C、客戶的興趣愛好D、客戶過去的購買行為和購買記錄參考答案：D119.通用人工智能面對大型即時策略游戲，面臨很多亟待解決的問題，不包括（）A、通用人工智能需要平衡價值目標和策略目標，價值目標服務(wù)于長期目標，策略目標服務(wù)于短期目標。這就需要通用人工智能，掌握博弈論的精髓B、通用人工智能，需要能夠主動挖掘游戲情報，并通過局部信息或不完美的信息做出游戲決策C、像許多現(xiàn)實世界的問題一樣，因果關(guān)系不是即時的。這意味著游戲早期采取的行動可能無法在很長一段時間內(nèi)獲得回報。這就需要通用人工智能，具有長期規(guī)劃能力D、智能匹配隊友參考答案：D120.通過加入特定的（），可以將爬蟲發(fā)出的請求偽裝成瀏覽器。A、RequestB、openerC、HeadersD、User_Agent參考答案：C121.通過代碼”fromsklearnimportlinear_model”引入線性模型模塊，并通過代碼“reg=linear_model.LinearRegression（）”構(gòu)造回歸器對象后，在訓(xùn)練后做預(yù)測時要調(diào)用的方法是（）。A、reg.train（）B、reg.fit（）C、reg.learn（）D、reg.predict（）參考答案：D122.通過代碼“fromsklearnimporttree”引入決策樹模塊，并通過代碼“clf=tree.DecisionTreeClassifier（）”構(gòu)造分類器對象后，訓(xùn)練時要調(diào)用的方法是（）。A、clf.learn（）B、clf.fit（）C、clf.predict（）D、clf.train（）參考答案：B123.通常，我們可通過實驗測試來對學(xué)習(xí)器的泛化誤差進行評估并進而做出選擇。為此，需使用一個（）來測試學(xué)習(xí)期對新樣本的判別能力A、數(shù)據(jù)集B、測試集C、模型集D、訓(xùn)練集參考答案：B124.所謂高維數(shù)據(jù)，指的是A、數(shù)據(jù)對象很多B、數(shù)據(jù)屬性很多C、以上都正確D、以上都錯誤參考答案：B125.數(shù)據(jù)中心側(cè)的數(shù)據(jù)流轉(zhuǎn)方式未為（）A、D.XP;B、E.SPC、OGGD、E.TL參考答案：D126.數(shù)據(jù)正規(guī)化（DataNormalization）是在知識發(fā)掘處理（KnowledgeDiscoveryProcess）中的哪一個階段進行?A、數(shù)據(jù)清洗B、數(shù)據(jù)選擇C、數(shù)據(jù)編碼D、數(shù)據(jù)擴充參考答案：C127.數(shù)據(jù)在規(guī)定的時間前和頻度周期內(nèi)接入系統(tǒng)的比例稱為（）A、指標數(shù)據(jù)自動采集率;B、指標數(shù)據(jù)接入率C、指標數(shù)據(jù)接入及時率;D、指標數(shù)據(jù)完整率參考答案：C128.數(shù)據(jù)預(yù)處理目前常用的異常數(shù)據(jù)識別方法包括業(yè)務(wù)判別法、（）、箱線圖判別法、統(tǒng)計判別法A、聚類判別法;B、回歸判別法C、抽樣判別法參考答案：A129.數(shù)據(jù)挖掘是從數(shù)據(jù)中發(fā)掘知識的過程，在這個過程中（）可以作為挖掘工具，數(shù)據(jù)可以被看作是土壤，云平臺可以看作是承載數(shù)據(jù)和挖掘算法的基礎(chǔ)設(shè)施。A、鋤頭B、數(shù)據(jù)庫服務(wù)器C、聚類分析D、人工智能和數(shù)據(jù)庫技術(shù)參考答案：D130.數(shù)據(jù)記錄內(nèi)容完整比例，包括指標單位維度、業(yè)務(wù)維度組合記錄條數(shù)完整，指標字段值完整稱為（）A、指標數(shù)據(jù)自動采集率;B、指標數(shù)據(jù)接入率C、指標數(shù)據(jù)接入及時率;D、指標數(shù)據(jù)完整率參考答案：D131.數(shù)據(jù)的多重共線性導(dǎo)致我們無法使用最小二乘法求解線性回歸問題，以下哪個算法從根本上解決了這一點（）A、Ridge回歸B、Lasso回歸C、邏輯回歸D、多項式回歸參考答案：A132.數(shù)據(jù)倉庫是隨著時間變化的，下面的描述不正確的是（）A、數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容;B、捕捉到的新數(shù)據(jù)會覆蓋原來的快照;C、數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容;D、數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù)，這些綜合數(shù)據(jù)會隨著時間的變化不斷地進行重新綜合.參考答案：C133.數(shù)據(jù)倉庫的模式中，最基本的是（）。A、事實星座模型B、雪花模型C、星形模型D、以上都不對參考答案：C134.視頻業(yè)務(wù)流程可以分為播放準備階段和播放階段，其中屬于播放階段KQI指標有（）A、停頓次數(shù)B、視頻播放等待時長C、初始緩沖成功率D、初始緩沖時長參考答案：A135.視頻業(yè)務(wù)端到端問題定界的關(guān)鍵點在于（）A、查找KQI對應(yīng)的相關(guān)異常KPI指標B、不同維度的對比定位分析C、進行HTTP錯誤碼分析D、進行接口以上以下分析參考答案：A136.使用交互式的和可視化的技術(shù)，對數(shù)據(jù)進行探索屬于數(shù)據(jù)挖掘的哪一類任務(wù)?A、探索性數(shù)據(jù)分析B、建模描述C、預(yù)測建模D、尋找模式和規(guī)則參考答案：A137.使用requests庫發(fā)送請求后，返回response對象的屬性中，表示網(wǎng)頁內(nèi)容的是（）A、status_codeB、encondingC、apprence_encondingD、text參考答案：D138.使用python處理缺失值的方法中敘述錯誤的是（）。A、isnull（）判斷缺失值B、dropna（）刪除缺失值C、interpolate（）使用中位數(shù)填充缺失值D、fillna（）填充缺失值參考答案：C139.實現(xiàn)多項式回歸時，數(shù)據(jù)需要進行多項式轉(zhuǎn)換，其目的是（）A、數(shù)據(jù)進行升維B、數(shù)據(jù)進行降維C、數(shù)據(jù)有噪音D、數(shù)據(jù)不夠平滑參考答案：A140.設(shè)有如下所示的某商場購物記錄集合，每個購物籃中包含若干商品：現(xiàn)在要基于該數(shù)據(jù)集進行關(guān)聯(lián)規(guī)則挖掘。如果設(shè)置最小支持度為60％，則如下頻繁項集中，符合條件的是（）<imgsrc="/220586/8947890/1669541671699.png">A、雞蛋，尿布B、面包，尿布，牛奶C、面包，牛奶D、面包，啤酒，尿布參考答案：C141.設(shè)X={1，2，3}是頻繁項集，則可由X產(chǎn)生（）個關(guān)聯(lián)規(guī)則。A、4B、5C、6D、7參考答案：C142.上題中，等寬劃分時（寬度為50），15又在哪個箱子里？（）A、第一個B、第二個C、第三個D、第四個參考答案：A143.若P（H）==0.5，P（X）==0.8，P（X|H）=0.7.則P（H|X）為（）。A、0.475B、0.57C、0.4375D、0.5參考答案：C144.若I={a，b，c，d}，D中含有10個事務(wù)，{a，b，c}是一個頻繁項集，則以下敘述中錯誤的是（）A、{a，b，c，d}一定是頻繁項集B、{a，b}一定是頻繁項集C、{a，c}一定是頻繁項集D、一定是頻繁項集參考答案：A145.如下哪些不是最近鄰分類器的特點（）A、它使用具體的訓(xùn)練實例進行預(yù)測，不必維護源自數(shù)據(jù)的模型B、分類一個測試樣例開銷很大C、最近鄰分類器基于全局信息進行預(yù)測D、可以生產(chǎn)任意形狀的決策邊界參考答案：C146.如下表所示，交易號（D）商品（tems）1beer，diaper，nuts2beer，biscuit，diaper3bread，butter，cheese4beer，cheese，diaper，nuts5beer，butter，cheese，nuts2）X={butter，cheese}，Y={beer}，則置信度confidence（X→Y）=（）。A、2/5B、1/2C、1/3D、1/4參考答案：B147.如何啟動Namenode？A、start-dfs.shB、start-hdfs.shC、start-yarn.shD、start-yan.sh參考答案：A148.如果允許一條記錄觸發(fā)多條分類規(guī)則，把每條被觸發(fā)規(guī)則的后件看作是對相應(yīng)類的一次投票，然后計票確定測試記錄的類標號，稱為（）A、無序規(guī)則B、窮舉規(guī)則C、互斥規(guī)則D、有序規(guī)則參考答案：A149.如果我使用數(shù)據(jù)集的全部特征并且能夠達到100%的準確率，但在測試集上僅能達到70%左右，這說明（）A、欠擬合B、模型很棒C、過擬合D、算法不好參考答案：C150.如果懷疑GPS跑偏，哪些說法是不對的？A、當(dāng)UE工作在故障基站時，其測量得到的鄰小區(qū)的PCCPCHRSCP都比實際值低很多；UE在正常站測故障站的PCCPCHRSCP值也比實際值低。B、當(dāng)故障GPS前偏時，周圍基站與故障站主頻點相同頻點的UpPTS時隙都受到比較大的干擾C、可以通過進行站點的切換統(tǒng)計進行定位，對于故障站點，其特征是基站內(nèi)部各小區(qū)之間切換正常，但是UE無法從該基站的小區(qū)切換到其它基站所屬的小區(qū)上，也無法從其他基站的小區(qū)切換到故障基站包含的小區(qū)上。D、通過將OMC-R統(tǒng)計的ISCP值導(dǎo)入MAPINFO地圖，進行排查參考答案：B151.如果規(guī)則集中的規(guī)則按照優(yōu)先級降序排列，則稱規(guī)則集是A、無序規(guī)則B、窮舉規(guī)則C、互斥規(guī)則D、有序規(guī)則參考答案：D152.人們購買制冷用空調(diào)主要是為了在夏天獲得涼爽空氣，這屬于空調(diào)產(chǎn)品整體概念中的（）A、有形產(chǎn)品B、直接產(chǎn)品C、核心產(chǎn)品D、主要產(chǎn)品參考答案：C153.人工智能是一種（）A、讓人覺得不可思議的計算機程序B、與人類思考方式相似、行為相似的計算機程序C、會學(xué)習(xí)的計算機程序D、根據(jù)對環(huán)境的感知，做出合理的行動，并獲得最大收益的計算機程序參考答案：D154.人工智能的目的是讓機器能夠（）A、具有完全的智能B、完全和人腦一樣考慮問題C、完全替代人D、模擬、延伸和擴展人的智能參考答案：D155.請問以下何者屬于時間序列的問題?A、信用卡發(fā)卡銀行偵測潛在的卡奴B、基金經(jīng)理人針對個股做出未來價格預(yù)測C、電信公司將人戶區(qū)分為數(shù)個群體D、以上均不是參考答案：B156.樸素貝葉斯分類中得到條件概率的方法錯誤的是（）。A、對于定量屬性，將取值離散化變?yōu)閰^(qū)間，再當(dāng)做定性屬性處理B、對于定性屬性，將轉(zhuǎn)化為定量屬性，再計算相應(yīng)的概率C、對于定量屬性，假設(shè)變量服從某種概率分布，通過訓(xùn)練數(shù)據(jù)集估計分布的參數(shù)D、對于定性屬性，計算某一類別的樣本中某種屬性取該值的樣本所占比例來近似參考答案：B157.樸素貝葉斯分類算法是基于（）假設(shè)的A、使用的描述屬性是相關(guān)的B、使用的描述屬性是獨立的C、描述屬性和類別屬性是獨立的D、以上都不對參考答案：B158.皮爾森相關(guān)系數(shù)取值為（）時說明兩個對象最不相似。A、-1B、0.05C、1D、0參考答案：A159.哪個選項是Python語言%運算符的含義？A、x與y的整數(shù)商B、x與y之商C、x與y之商的余數(shù)D、x的y次冪參考答案：C160.目前網(wǎng)絡(luò)，DPI統(tǒng)計的全網(wǎng)HTTP下載速率大致在什么范疇A、3-6MbpsB、10-20MbpsC、3-50MbpsD、3-100Mbps參考答案：A161.某文本分類需求，存在一定的數(shù)據(jù)缺失情況且數(shù)據(jù)規(guī)模較小，能做增量式訓(xùn)練要求的是哪種算法A、貝葉斯B、決策樹C、SVMD、邏輯回歸參考答案：A162.某超市研究銷售紀錄數(shù)據(jù)后發(fā)現(xiàn)，買啤酒的人很大概率也會購買尿布，這種屬于數(shù)據(jù)挖掘的哪類問題？（）A、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)B、聚類C、分類D、自然語言處理參考答案：A163.模型樹的葉子結(jié)點對應(yīng)（）。A、一個數(shù)值B、以上都可以C、一個線性回歸方程D、某個類別參考答案：C164.兩臺路由器成為OSPF鄰居關(guān)系的必要條件不包括A、兩臺路由器的Hello時間一致B、兩臺路由器的Dead時間一致C、兩臺路由器的RouterID一致D、兩臺路由器所屬區(qū)域一致參考答案：C165.利用tree.DecisionTreeClassifier（）訓(xùn)練模型時調(diào)用.fit（）方法需要傳遞的第二個參數(shù)是（）。A、樣本特征XB、樣本標簽YC、判斷標準D、設(shè)置結(jié)點的最小樣本數(shù)量參考答案：B166.利用“l(fā)inear_model.LinearRegression（）”訓(xùn)練模型時調(diào)用.fit（）方法需要傳遞的第一個參數(shù)是（）。A、是否考慮計算截距B、樣本權(quán)重C、樣本特征XD、樣本標簽Y參考答案：C167.快速實現(xiàn)簡單的MapReduce統(tǒng)計，不必開發(fā)專門的MapReduce應(yīng)用，十分適合數(shù)據(jù)倉庫的統(tǒng)計分析的是（）。A、Map;B、ReduceC、H.iveD、SQL語句參考答案：D168.考慮兩隊之間的足球比賽：隊0和隊1。假設(shè)65%的比賽隊0勝出，剩余的比賽隊1獲勝。隊0獲勝的比賽中只有30%是在隊1的主場，而隊1取勝的比賽中75%是主場獲勝。如果下一場比賽在隊1的主場進行隊1獲勝的概率為（）A、0.75B、0.35C、0.4678D、0.5738參考答案：C169.開始將N個樣品各自作為一類，將規(guī)定樣品之間的距離和類與類之間的距離，然后將距離最近的兩類合并成一個新類，計算新類與其他類的距離，重復(fù)進行兩個最近類的合并，每次減少一類，直至所有的樣品合并為一類，此種聚類方法是（）A、K-meansB、SOM聚類C、系統(tǒng)聚類D、有序聚類參考答案：C170.決策樹中不包含以下哪種結(jié)點（）。A、根結(jié)點B、葉結(jié)點C、外部結(jié)點D、內(nèi)部結(jié)點參考答案：C171.決策樹分類方法中，CART算法使用的分裂準則是：（）A、信息增益B、增益比率C、基尼指數(shù)D、分類錯誤率參考答案：C172.矩估計的基本原理是（）A、用樣本矩估計總體矩B、使得似然函數(shù)達到最大C、使得似然函數(shù)達到最小D、小概率事件在一次試驗中是不可能發(fā)生的參考答案：A173.將數(shù)據(jù)轉(zhuǎn)換為可視化的形式，便于直觀快速發(fā)現(xiàn)數(shù)據(jù)規(guī)律。的數(shù)據(jù)探索方法是（）。A、匯總統(tǒng)計法B、概率統(tǒng)計法C、可視化法參考答案：C174.將兩個簇的鄰近度定義為不同簇的所有點對的平均逐對鄰近度，它是一種凝聚層次聚類技術(shù)。A、MIN（單鏈）B、MAX（全鏈）C、組平均D、Ward方法參考答案：C175.將多個指標轉(zhuǎn)化為少數(shù)幾個指標的一種統(tǒng)計分析方法是（）。A、數(shù)據(jù)預(yù)處理;B、數(shù)據(jù)降維C、主成分分析D、假設(shè)檢驗參考答案：C176.建立一個模型，通過這個模型根據(jù)已知的變量值來預(yù)測其他某個變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)（）A、根據(jù)內(nèi)容檢索B、建模描述C、預(yù)測建模D、尋找模式和規(guī)則參考答案：C177.簡單地將數(shù)據(jù)對象集劃分成不重疊的子集，使得每個數(shù)據(jù)對象恰在一個子集中，這種聚類類型稱作A、層次聚類B、劃分聚類C、非互斥聚類D、模糊聚類參考答案：B178.檢查異常值常用的統(tǒng)計圖形是（）A、柱狀圖B、箱線圖C、帕累托圖D、氣泡圖參考答案：B179.檢查省公司統(tǒng)一DPI系統(tǒng)設(shè)備4A登錄使用率情況，4A登錄使用率應(yīng)不低于（）A、80%B、90%C、95%D、99%參考答案：C180.假設(shè)文件不存在，如果使用open方法打開文件會報錯，那么該文件的打開方式是下列哪種模式？（）A、rB、wC、aD、w+參考答案：A181.假設(shè)Python中data=pd.Series（["1"，"2"，"3"，"4"]），則data.loc[2:]的職是A、3B、234C、34D、12參考答案：C182.假設(shè)12個銷售價格記錄組已經(jīng)排序如下：5，10，11，13，15，35，50，55，72，92，204，215使用如下每種方法將它們劃分成四個箱。等頻（等深）劃分時，15在第幾個箱子內(nèi)？（）A、第一個B、第二個C、第三個D、第四個參考答案：B183.假設(shè)12個數(shù)字已經(jīng)排序如下：5，10，11，13，15，35，50，55，72，92，204，215，使用等高分箱，則第一個分箱序列為:A、5，10，11，13B、5，10，11，13，15，35，50，55，72C、5，10，11，13，15參考答案：A184.基于《中國移動DPI識別能力規(guī)范》新浪微博屬于哪一類業(yè)務(wù)（）A、微博社區(qū)B、即時通信C、社交D、網(wǎng)頁瀏覽參考答案：A185.回歸分析主要確定變量之間是否存在相關(guān)關(guān)系，而相關(guān)關(guān)系是一種確定性的關(guān)系。A、FB、T參考答案：A186.規(guī)則I->j，“有可能”，等于所有包含I的購物籃中同時包含J的購物籃的比例，為（）。A、置信度B、可信度C、興趣度D、支持度參考答案：B187.關(guān)于主成分數(shù)目的選取，正確的是（）A、保留多少個主成分取決于累計方差在方差總和中所占百分比B、一般選擇50%以上C、選擇前兩個就可以D、選擇的數(shù)目和變量的個數(shù)一致參考答案：A188.關(guān)于隨機森林，錯誤的是（）A、隨機森林是一個包含多個決策樹的分類器，并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定B、隨機森林應(yīng)用非常廣泛，根據(jù)目標變量的取值類型大致可分為分類和回歸兩類C、隨機森林優(yōu)點：可以產(chǎn)生高準確度的分類器D、隨機森林在bagging基礎(chǔ)上做了修改，先從樣本集中用bagging采樣選出n個樣本參考答案：D189.關(guān)于列表的說法，描述錯誤的是：A、list是一個有序集合，沒有固定大小B、list可以存放Python中任意類型的數(shù)據(jù)C、使用list時其下標可以是負數(shù)D、list是不可變數(shù)據(jù)類型參考答案：D190.關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指:A、基本元數(shù)據(jù)與數(shù)據(jù)源，數(shù)據(jù)倉庫，數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息;B、基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息;C、基本元數(shù)據(jù)包括日志文件和簡歷執(zhí)行處理的時序調(diào)度信息;D、基本元數(shù)據(jù)包括關(guān)于裝載和更新處理，分析處理以及管理方面的信息.參考答案：D191.關(guān)于混合模型聚類算法的優(yōu)缺點，下面說法正確的是（）。A、當(dāng)簇只包含少量數(shù)據(jù)點，或者數(shù)據(jù)點近似協(xié)線性時，混合模型也能很好地處理。B、混合模型比K均值或模糊c均值更一般，因為它可以使用各種類型的分布。C、混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇。D、混合模型在有噪聲和離群點時不會存在問題。參考答案：B192.關(guān)于回歸分析，下列說法中錯誤的是（）A、作回歸分析的變量之間要有實際意義，不能把毫無關(guān)聯(lián)的兩種現(xiàn)象隨意進行回歸分析，要結(jié)合專業(yè)知識對兩事物之間是否存在因果關(guān)系作出合理解釋和結(jié)論。B、在進行線性回歸分析進行的數(shù)據(jù)準備的時候，要求因變量y和自變量x都是符合總體正態(tài)的隨機變量。C、回歸直線不要隨意外延D、所有非線性回歸都可以轉(zhuǎn)化為線性回歸參考答案：D193.關(guān)于Tableau的特點，以下說法錯誤的是（）A、學(xué)習(xí)成本低，簡單易用;B、圖表精美;C、開發(fā)快速，分享便捷;D、需要IT大量人員參與參考答案：D194.關(guān)于SQLServer分析服務(wù)的敘述中正確的是（）A、SQLServer分析服務(wù)是關(guān)系數(shù)據(jù)庫開發(fā)工具限B、SQLServer分析服務(wù)可以用于OLAPC、SQLServer分析服務(wù)是操作型數(shù)據(jù)庫系統(tǒng)開發(fā)工具D、以上都不對參考答案：B195.關(guān)聯(lián)規(guī)則的評價指標是：（）。A、均方誤差、均方根誤差B、Kappa統(tǒng)計、顯著性檢驗C、支持度、置信度D、平均絕對誤差、相對誤差參考答案：C196.分類器效果檢驗中的準確率是指（）A、預(yù)測正確的數(shù)據(jù)在總數(shù)據(jù)中的比例B、預(yù)測為正的數(shù)據(jù)在總數(shù)據(jù)中的比例C、預(yù)測為正的數(shù)據(jù)中實際為正的數(shù)據(jù)所占比例D、實際為正的數(shù)據(jù)中被預(yù)測為正的數(shù)據(jù)所占比例參考答案：C197.分布式存儲框架的配置信息在哪個文件中A、core-site.xmlB、hdfs-site.xmlC、mapred-site.xmlD、hadoop-env.sh參考答案：B198.發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法通常要經(jīng)過以下三個步驟：連接數(shù)據(jù)，作數(shù)據(jù)準備；給定最小支持度和（），利用數(shù)據(jù)挖掘工具提供的算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則；可視化顯示、理解、評估關(guān)聯(lián)規(guī)則A、最小興趣度B、最小置信度C、最大支持度D、最小可信度參考答案：D199.對于雙路的室分系統(tǒng)來說，影響性能的因素有那些（）A、雙路功率的平衡度B、雙路天線間距C、A＆BD、以上都不影響參考答案：C200.對于人工智能認知錯誤的是（）A、人工智能應(yīng)該是人類用來改造世界的技術(shù)手段，是輔助性的工具，而不是對人類進行了替代B、目前人工智能還處于初級階段，算是弱人工智能，AI技術(shù)還是離不開大數(shù)據(jù)C、人工智能在計算方面，超過人類。在部分感識方面，可與人類相媲美。但在認知方面，人工智能還處于幾乎空白階段，而這恰恰是我們?nèi)祟惖淖畲髢?yōu)勢D、人工智能會毀滅人類參考答案：D201.對于企業(yè)來說，數(shù)據(jù)使用的關(guān)鍵是（）A、數(shù)據(jù)收集B、數(shù)據(jù)存儲C、數(shù)據(jù)分析D、數(shù)據(jù)再利用參考答案：D202.對于LTE系統(tǒng)KPI性能指標描述錯誤的是（D）A、覆蓋類指標主要關(guān)注RSRP、RS-CINR、覆蓋率B、呼叫建立和保持類主要關(guān)注RRC連接建立成功率、E-RAB建立成功率、無線接通率、E-RAB建立阻塞率、RRC連接異常掉話率C、移動性管理類主要包括eNB內(nèi)切換成功率、X2口切換成移動性管理類主要包括eNB內(nèi)切換成功率、X2口切換成功率、S1口切換成功率、系統(tǒng)間切換成功率（包含與GSM/WCDMA/TD/CDMA等系統(tǒng)的切換）、E-RAB掉話率D、系統(tǒng)資源類指標主要關(guān)注上下行誤塊率、上下行MAC層重傳率等參考答案：C203.對相同的數(shù)據(jù)集，k-均值算法和EM算法的聚類結(jié)果（）。A、可能相同，也可能不相同B、一定相同C、一定不相同D、以上都不對參考答案：A204.對回歸問題和分類問題的評價最常用的指標是A、準確率B、召回率C、誤差D、方差參考答案：C205.第三次人工智能浪潮區(qū)別前兩次在于（）A、理論的革新B、思維的轉(zhuǎn)變C、人工智能戰(zhàn)勝了人類國際象棋世界冠軍D、人工智能的產(chǎn)品打破了人們的預(yù)期，真正做到了在識別方面比人類本身更智能更高效，是真正可以用的東西參考答案：D206.當(dāng)時間序列的環(huán)比增長速度大體相同時，適宜擬合（）A、指數(shù)曲線B、拋物線C、直線D、對數(shù)曲線參考答案：A207.大數(shù)據(jù)最明顯的特點是（）A、數(shù)據(jù)類型多樣B、數(shù)據(jù)規(guī)模大C、數(shù)據(jù)價值密度高D、數(shù)據(jù)處理速度快參考答案：B208.大數(shù)據(jù)起源是（）A、金融B、電信C、互聯(lián)網(wǎng)D、公共管理參考答案：C209.貝葉斯信念網(wǎng)絡(luò)由兩部分組成，分別是網(wǎng)絡(luò)結(jié)構(gòu)和（）。A、條件概率B、先驗概率C、后驗概率D、條件概率表參考答案：D210.貝葉斯決策是根據(jù)（）進行決策的一種方法。A、極大似然概率B、先驗概率C、邊際概率D、后驗概率參考答案：D211.VoLTE始呼接續(xù)時長統(tǒng)計點為（）A、從主叫側(cè)CSCF收到VoLTE語音或視頻的Invite始呼請求開始，到主叫側(cè)CSCF向主叫用戶成功轉(zhuǎn)發(fā)180響應(yīng)消息B、從主叫側(cè)SBC收到VoLTE語音或視頻的Invite始呼請求開始，到主叫側(cè)SBC向主叫用戶成功轉(zhuǎn)發(fā)180響應(yīng)消息C、從主叫側(cè)SBC收到VoLTE語音或視頻的Invite始呼請求開始，到主叫側(cè)SBC向主叫用戶成功轉(zhuǎn)發(fā)200響應(yīng)消息D、從主叫側(cè)CSCF收到VoLTE語音或視頻的Invite始呼請求開始，到主叫側(cè)CSCF向主叫用戶成功轉(zhuǎn)發(fā)200響應(yīng)消息參考答案：B212.VOLTE的語音靜默期是（）A、20msB、80msC、160msD、40ms參考答案：C213.TAU請求次數(shù)為統(tǒng)計一定的時間粒度及網(wǎng)元粒度下，ProcedureType為（）的S1-MME接口XDR的個數(shù)A、2B、3C、4D、5參考答案：D214.Tableau在處理離線地圖時，需要將標記設(shè)置為（）。A、路徑;B、區(qū)域C、邊形D、已填充地圖參考答案：A215.Tableau能夠?qū)?shù)據(jù)進行處理包括（）。A、將多個數(shù)據(jù)源數(shù)據(jù)拼接為一個寬表;B、修改、刪除、新增數(shù)據(jù)行;C、對數(shù)據(jù)進行行列轉(zhuǎn)換、重命名、格式修改;D、對數(shù)據(jù)進行計算、合并生成新的數(shù)據(jù)列參考答案：A216.SQL語言中，刪除一個表中所有數(shù)據(jù)，但保留表結(jié)構(gòu)的命令是（）A、DELETEB、DROPC、CLEARD、REMORE參考答案：A217.SQL語言的核心是（）。A、數(shù)據(jù)操縱B、數(shù)據(jù)定義C、數(shù)據(jù)查詢D、數(shù)據(jù)控制參考答案：C218.sklearn庫中提供（）實現(xiàn)KNN算法A、k-NearerNeighborClassifierB、KNeighborsClassifierC、KNeighborClassifierD、k-NearestNeighborsClassifier參考答案：B219.SELECT語句中的JOIN用來實現(xiàn)多個表的連接查詢，JOIN應(yīng)放在下列哪個短語之后（）。A、FROMB、WHEREC、OND、GROUPBY參考答案：A220.SELECT語句中“GROUPBY學(xué)號”表示（）。A、修改學(xué)號B、過濾學(xué)號C、對學(xué)號排序D、對學(xué)號分組參考答案：D221.selectright（'長江長城黃山黃河'，2）返回的是（）。A、長江B、長城C、黃山D、黃河參考答案：D222.selectreplace（'長江長城黃山黃河'，'長'，'黃'）返回的是（）。A、長江長城黃山黃河B、黃江長城黃山黃河C、黃江黃城黃山黃河D、長江長城長山長河參考答案：C223.S6a接口基于以下哪個協(xié)議A、GTPB、SCTPC、DiameterD、S1-AP參考答案：C224.ROC曲線凸向哪個角，代表模型越理想?A、左上角B、右上角C、左下角D、右下角參考答案：A225.Requests庫中的get（）方法最常用，下面哪個說法正確？A、網(wǎng)絡(luò)爬蟲主要進行信息獲取，所以，get（）方法最常用。B、服務(wù)器因為安全原因?qū)ζ渌椒ㄟM行限制，所以，get（）方法最常用。C、get（）方法是其它方法的基礎(chǔ)，所以最常用。D、HTTP協(xié)議中GET方法應(yīng)用最廣泛，所以，get（）方法最常用。參考答案：B226.Requests庫中，下面哪個屬性代表了從服務(wù)器返回HTTP協(xié)議頭所推薦的編碼方式？A、headersB、apparent_encodingC、textD、encoding參考答案：D227.Requests庫中，下面哪個是由于DNS查詢失敗造成的獲取URL異常？A、requests.TimeoutB、requests.HTTPErrorC、requests.URLRequiredD、requests.ConnectionError參考答案：D228.Python在調(diào)用efficient-apriori包中的apriori函數(shù)進行挖掘關(guān)聯(lián)規(guī)則時，第二個返回值是（）。A、最小支持度B、關(guān)聯(lián)規(guī)則C、頻繁項集D、最小置信度參考答案：B229.Python文件讀取方法read（size）的含義是A、從頭到尾讀取文件所有內(nèi)容B、從文件中讀取一行數(shù)據(jù)C、從文件中讀取多行數(shù)據(jù)D、從文件中讀取指定size大小的數(shù)據(jù)，如果size為負數(shù)或者空，則讀取到文件結(jié)束。參考答案：D230.Pandas處理缺失值的函數(shù)有（）A、fillnaB、ilocC、fitD、transform參考答案：A231.P（22，1，42，10），Q（20，0，36，8）為兩個向量對象，這兩個對象的歐幾里得距離是（）。A、11B、√45C、6D、?233參考答案：B232.P（22，1，42，10），Q（20，0，36，8）為兩個向量對象，這兩個對象的曼哈頓距離是（）。A、6B、三次根號下233C、根號下45D、11參考答案：D233.OnRetDW系統(tǒng)建模采用的是（）。A、星形模型B、雪花模型C、事實星座模型D、關(guān)系數(shù)據(jù)庫模型參考答案：A234.NaveBayes是一種特殊的Bayes分類器，特征變量是X，類別標簽是C，它的一個假定是（）A、各類別的先驗概率P（C）是相等的B、以0為均值.sqr（2）/2為標準差的正態(tài)分布C、特征變量X的各個維度是類別條件獨立隨機變量D、P（X|C）是高斯分布參考答案：C235.NaiveBayes是屬于數(shù)據(jù)挖掘中的什么方法?A、聚類B、分類C、時間序列D、關(guān)聯(lián)規(guī)則參考答案：B236.MySQL中，刪除視圖su_view的命令是（）。A、deletesu_viewB、droptablesu_viewC、dropviewsu_viewD、dropsu_view參考答案：C237.MR數(shù)據(jù)引入對基站建設(shè)規(guī)劃的主要增益在于A、弱覆蓋區(qū)域識別B、網(wǎng)速慢區(qū)域識別C、高干擾區(qū)域識別D、高價值區(qū)域識別參考答案：A238.MME具備以下功能A、只有控制面功能B、只有用戶面管理功能C、同時有控制面和用戶面管理功能D、用戶面和控制面功能都不具備參考答案：A239.Mapreduce適用于（）A、任意應(yīng)用程序B、任意可在windowsservet2008上運行的程序C、可以串行處理的應(yīng)用程序D、可以并行處理的應(yīng)用程序參考答案：D240.MapReduce的Map函數(shù)產(chǎn)生很多的A、keyB、valueC、＜key，value>D、Hash參考答案：C241.LTE系統(tǒng)網(wǎng)絡(luò)架構(gòu)EPS系統(tǒng)是由什么組成的？A、EPCB、eNodeBC、UED、以上都正確參考答案：D242.LTE為了解決深度覆蓋的問題，以下哪些措施是不可取的A、降低LTE工作頻點，采用低頻段組網(wǎng)B、采用分層組網(wǎng)C、增加LTE系統(tǒng)帶寬D、采用家庭基站等新型設(shè)備參考答案：C243.KNIME數(shù)據(jù)處理過程不包括A、提取B、轉(zhuǎn)換C、加載D、計算參考答案：D244.Hbase是哪種數(shù)據(jù)庫？A、關(guān)系型數(shù)據(jù)庫B、Nosql數(shù)據(jù)庫C、網(wǎng)狀數(shù)據(jù)庫D、層次數(shù)據(jù)庫參考答案：B245.Hadoop框架中兩大核心是:（）和MapReducEA、H.CFS;B、H.DFSC、H.EFSD、H.FFS參考答案：B246.FTP服務(wù)器使用的熟知端口是（）A、20B、21C、22D、23參考答案：A247.DPI采集中，需要獲取LTE切換信息，不需要采集的接口是（）A、S1-MMEB、X2C、S11D、S6a參考答案：D248.DBSCAN在最壞情況下的時間復(fù)雜度是（）。A、O（m）B、O（m2）C、O（logD、O（m*log參考答案：B249.C4.5算法以（）作為分類選擇的依據(jù)。A、信息熵最大B、條件熵最大C、信息增益最大D、信息增益率最大參考答案：D250.BP神經(jīng)網(wǎng)絡(luò)是一種按照（）訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)，是應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)A、誤差逆向傳播算法B、粒子群算法C、決策樹D、聚類分析參考答案：A251.bootstrap數(shù)據(jù)是指A、從總共M個特征中有放回地抽樣m個特征B、從總共M個特征中無放回地抽樣m個特征C、從總共N個樣本中有放回地抽樣n個樣本D、從總共N個樣本中無放回地抽樣n個樣本參考答案：C252.Apriori算法是最基本的一種關(guān)聯(lián)規(guī)則算法，它采用布爾關(guān)聯(lián)規(guī)則的挖掘頻繁項集的算法，利用（）搜索的方法挖掘頻繁項集。A、逐層B、逐級C、自底向上D、自上而下參考答案：A253.《數(shù)據(jù)安全法》發(fā)布執(zhí)行時間（）。A、2021年9月1日;B、2021年10月1日;C、2021年11月1日D、2021年12月1日參考答案：A254.《實時業(yè)務(wù)質(zhì)量監(jiān)控保障》落地手冊中，基于開源框架的流數(shù)據(jù)處理架構(gòu)的計算步驟是怎樣的？（1）將篩選、清洗、轉(zhuǎn)換后的數(shù)據(jù)發(fā)送至Kafka集群。（2）由Storm集群完成實時1分鐘粒度指標計算。（3）基于ETL模塊，對入庫的XDR數(shù)據(jù)進行針對性的事件、字段篩選，以及數(shù)據(jù)轉(zhuǎn)換、加載，最大程度的減少傳輸、計算數(shù)據(jù)量。（4）歷史1分鐘粒度指標計算結(jié)果同步至Hbase數(shù)據(jù)庫，實現(xiàn)歷史數(shù)據(jù)持久化。（5）從XDR數(shù)據(jù)源系統(tǒng)（例如統(tǒng)一DPI）以SDTP接口的形式實時接收XDR數(shù)據(jù)流，完成數(shù)據(jù)入庫。（6）將指標計算結(jié)果寫入Redis集群，并對上層應(yīng)用開放實時數(shù)據(jù)查詢接口。A、531264B、532146C、541326D、561423參考答案：A255.“大數(shù)據(jù)+云計算”將會帶來信息產(chǎn)業(yè)革命的第（）個高峰A、一B、二C、三D、四參考答案：C256.“jps”命令的用處？A、查看操作系統(tǒng)的版本B、查看hadoop的版本C、查看java平臺的版本D、查看進程的狀態(tài)參考答案：D257.當(dāng)不知道數(shù)據(jù)所帶標簽時，可以使用哪種技術(shù)促使帶同類標簽的數(shù)據(jù)與帶其他標簽的數(shù)據(jù)相分離?A、分類B、聚類C、關(guān)聯(lián)分析D、隱馬爾可夫鏈參考答案：B258.（）是一種松散耦合的服務(wù)和應(yīng)用之間標準的集成方式。A、E.SB;B、D.MC、ODSD、E.TL參考答案：A259.（）是一類機器學(xué)習(xí)技術(shù)，在學(xué)習(xí)模型時，它使用標記的和未標記的實例。A、監(jiān)督學(xué)習(xí)B、無監(jiān)督學(xué)習(xí)C、半監(jiān)督學(xué)習(xí)D、主動學(xué)習(xí)參考答案：C260.（）是一個觀測值，它與其他觀測值的差別如此之大，以至于懷疑它是由不同的機制產(chǎn)生的。A、邊界點B、質(zhì)心C、離群點D、核心點參考答案：C261.（）是研究一種或者多種因素的變化對試驗結(jié)果的觀測值是否有顯著影響的統(tǒng)計方法。A、因子分析;B、數(shù)據(jù)降維C、方差分析D、假設(shè)檢驗參考答案：C262.（）是Google提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的并行運算的軟件架構(gòu)。A、GFSB、MapReduceC、ChubbyD、BitTable參考答案：B263.（）將兩個簇的鄰近度定義為不同簇的所有點對的平均逐對鄰近度，它是一種凝聚層次聚類技術(shù)。A、MIN（單鏈）B、MAX（全鏈）C、組平均D、Ward方法參考答案：C264.（）被譽為機器學(xué)習(xí)之父A、阿瑟·薩繆爾B、圖靈C、加里·卡斯帕羅夫D、李世石參考答案：A265.以下關(guān)于Python語言中“縮進”說法正確的是：A、縮進統(tǒng)一為4個空格B、縮進在程序中長度統(tǒng)一且強制使用C、縮進是非強制的，僅為了提高代碼可讀性D、縮進可以用在任何語句之后，表示語句間的包含關(guān)系參考答案：B多選題1.主成分分析計算選擇相關(guān)系數(shù)計算法時,確定主成分個數(shù)的致原則包括（）A、特征根值大于1B、特征根值大于3C、累積特征根值加總占總特征根值的80%以上D、累積特征根值加總占總特征根值的90%以上參考答案：AC2.智能手機市場10年混戰(zhàn)之后，僅剩下（）陣營A、蘋果IOSB、谷歌AndroidC、微軟D、聯(lián)想?yún)⒖即鸢福篈B3.支持向量機中的非線性映射可以通過核函數(shù)來實現(xiàn),常用的核函數(shù)包括（）A、高斯核函數(shù)B、多項式核函數(shù)C、S形核函數(shù)D、線性核參考答案：ABC4.針對涉及多張表的取數(shù)需求，SQL查詢中至少因包含的關(guān)鍵字為A、selectB、joinC、createD、format參考答案：AB5.針對咪咕游戲業(yè)務(wù)提供市場營銷支撐，可以從哪些維度入手分析A、游戲用戶識別B、熱點游戲識別C、質(zhì)差用戶識別D、價值區(qū)域識別參考答案：ABD6.噪聲數(shù)據(jù)的產(chǎn)生原因主要有：（）A、數(shù)據(jù)采集設(shè)備有問題B、在數(shù)據(jù)錄入過程中發(fā)生了人為或計算機錯誤C、數(shù)據(jù)傳輸過程中發(fā)生錯誤D、由于命名規(guī)則或數(shù)據(jù)代碼不同而引起的不一致參考答案：ABCD7.噪聲數(shù)據(jù)處理的方法主要有：（）A、分箱B、聚類C、關(guān)聯(lián)分析D、回歸參考答案：ABD8.在探索性數(shù)據(jù)分析中,認為最有代表性,最能反映數(shù)據(jù)重要特征的五數(shù)概括,包括:A、中位數(shù)Q2B、四分位數(shù)Q3C、最小值D、最大值參考答案：ABCD9.在假設(shè)檢驗中,當(dāng)我們做出拒絕原假設(shè)而接受備擇假設(shè)的結(jié)論時,表示（）A、有充足的理由否定原假設(shè)B、原假設(shè)必定是錯誤的C、犯錯誤的概率不大于aD、犯錯誤的概率不大于bE、在H。成立的情況下發(fā)生了小概率事件參考答案：ACE10.在集團公司四維十輪網(wǎng)絡(luò)質(zhì)量評估體系中，新業(yè)務(wù)包括：A、統(tǒng)一認證B、咪咕音樂C、共享單車D、和交通參考答案：ABC11.在集團公司四維十輪網(wǎng)絡(luò)質(zhì)量評估體系中，評估咪咕視頻業(yè)務(wù)感知的主要指標包括：A、咪咕視頻在線播放成功率（%）B、咪咕視頻下載速率（kbps）C、咪咕視頻首幀響應(yīng)時長（ms）D、咪咕視頻卡頓時長占比（%）參考答案：ACD12.在PTN構(gòu)建的承載網(wǎng)絡(luò)中，經(jīng)常會用到鏈路聚合技術(shù)來實現(xiàn)對端口的保護和擴大鏈路帶寬。使用U2000網(wǎng)管進行監(jiān)控工作時，經(jīng)常會發(fā)現(xiàn)有LAG_MEMBER_DOWN告警上報，則觸發(fā)該告警上報的原因有A、端口的物理連接不可用B、聚合組端口運行了LACP，但LACP報文收發(fā)不正常C、端口誤碼越限D(zhuǎn)、聚合組端口有環(huán)回設(shè)置參考答案：ABCD13.影響基本K-均值算法的主要因素包括（）A、初始類中心的選取B、樣本相似性的度量C、樣本輸入順序D、K值的設(shè)定參考答案：ABD14.以下說法正確的有（）A、OMC采用服務(wù)器-客戶端模式B、OMC與eNodeB通信的單元為NMA，其完成協(xié)議和數(shù)據(jù)模型的轉(zhuǎn)換，是O接口的接口單元和處理單元C、可利用OMC集成的快配工具完成鄰區(qū)的快速和批量配置D、每個OMC機房都應(yīng)配置2臺冷備份的交換機和2臺熱備份的CE或路由器參考答案：ACD15.以下屬于數(shù)據(jù)預(yù)處理的是（）A、缺失值填充B、噪聲數(shù)據(jù)剔除C、異常值識別D、數(shù)據(jù)可視化參考答案：ABC16.以下屬于聚類算法的是（）A、K均值B、DBSCANC、AprioriD、Jarvis-Patrick（JP）參考答案：ABD17.以下屬于分類器評價或比較尺度的有:（）A、預(yù)測準確度B、召回率C、模型描述的簡潔度D、計算復(fù)雜度參考答案：ACD18.以下哪些指標可以通過網(wǎng)優(yōu)平臺獲取？（）A、無線接通率B、IMS初始注冊成功率C、空口上下行流量D、E-RAB建立成功率參考答案：ACD19.以下哪些數(shù)據(jù)挖掘工具是開源的（）A、KNIMEB、SPSSC、WEKAD、Orange參考答案：ACD20.以下哪些方法可以用于分類模型的特征選擇（）A、chi2B、f_classifC、mutual_info_classifD、f_regression參考答案：ABC21.以下哪些地址是9/28子網(wǎng)內(nèi)的主機可用地址？A、4B、9C、6D、1E、Noneoftheabove參考答案：AC22.以下哪個聚類算法屬于基于原型的聚類A、模糊C均值B、EM算法C、SOMD、CLIQUE參考答案：ABC23.移動網(wǎng)信令XDR包括以下哪些內(nèi)容A、移動網(wǎng)通用信息B、公共信息C、信令信息D、通用業(yè)務(wù)信息參考答案：BC24.尋找數(shù)據(jù)集中的關(guān)系是為了尋找精確、方便并且有價值地總結(jié)了數(shù)據(jù)的某一特征的表示，這個過程包括了以下哪些步驟（）A、決定要使用的表示的特征和結(jié)構(gòu)B、決定如何量化和比較不同表示擬合數(shù)據(jù)的好壞C、選擇一個算法過程使評分函數(shù)最優(yōu)D、決定用什么樣的數(shù)據(jù)管理原則以高效地實現(xiàn)算法。參考答案：ABCD25.相關(guān)分析的任務(wù)有（）A、判定現(xiàn)象之間有無關(guān)系B、判定現(xiàn)象之間關(guān)系的方向C、判定相關(guān)關(guān)系的緊密程度D、說明現(xiàn)象之間聯(lián)系的具體形式參考答案：ABCD26.下面屬于數(shù)據(jù)集的一般特性的有A、連續(xù)性B、維度C、稀疏性D、分辨率E、相異性參考答案：BCD27.下面哪些聚類方法易于發(fā)現(xiàn)特殊形狀的簇?A、k均值聚類B、層次聚類C、基于密度的聚類方法D、DBSCAN參考答案：CD28.下面哪些函數(shù)是神經(jīng)網(wǎng)絡(luò)中常用的激活函數(shù)（）A、ReLuB、SoftmaxC、SigmoidD、Maxout參考答案：ABCD29.下面關(guān)于季度模型的敘述,不正確的是（）A、季度模型以季度數(shù)據(jù)為樣本B、季度模型主要用于季度預(yù)測C、季度模型注重長期行為的描述D、季度模型一般規(guī)模較大參考答案：AB30.下面給出的t檢驗的結(jié)果,（）表明接受原假設(shè),顯著性水平為0.05。A、0.000B、0.039C、0.092D、0.124參考答案：CD31.下列指標受終端性能影響的有（）A、無線掉線率B、4G用戶附著成功率C、視頻緩沖時長D、http響應(yīng)時延參考答案：ABC32.下列屬于互聯(lián)網(wǎng)金融的是（）A、百度金融B、螞蟻金服C、騰訊金融D、京東金融參考答案：ABCD33.下列屬于不同的有序數(shù)據(jù)的有：（）A、時序數(shù)據(jù)B、序列數(shù)據(jù)C、時間序列數(shù)據(jù)D、事務(wù)數(shù)據(jù)E、空間數(shù)據(jù)參考答案：ABCD34.下列哪些（）算法可以用來資源占有預(yù)測、離網(wǎng)預(yù)測A、線性回歸B、非線性回歸C、邏輯回歸D、K-means參考答案：ABC35.下列何種算法可以幫助我們做數(shù)值的預(yù)測（Prediction）?A、AprioriB、DecisionTreeC、NaiveBayesD、LinearRegression參考答案：BD36.下邊屬于數(shù)據(jù)基本類型的是:A、數(shù)值B、字符串C、字典D、集合參考答案：AB37.文本挖掘的工具有A、IBMDB2intelligentMinerB、SASTextMinerC、SPSSTextMiningD、SPPTextMining參考答案：ABC38.偽分布模式中的注意點？A、偽分布式適用于開發(fā)和測試環(huán)境B、所有守護進程都在同一臺機器上運行C、守護進程在不同的機器上運行D、偽分布模式不能用于開發(fā)分布式代碼參考

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《大數(shù)據(jù)挖掘技術(shù)》核心考點速記速練題（附答案）

文檔簡介

溫馨提示

最新文檔

評論

《大數(shù)據(jù)挖掘技術(shù)》核心考點速記速練題（附答案）

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔