版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
(必刷)《大數(shù)據(jù)挖掘技術(shù)》考點(diǎn)精粹必做題(附答案)單選題1.在一元線性回歸模型中,變量顯著性檢驗(yàn)與方程顯著性檢驗(yàn)都要進(jìn)行,不能相互替代。A、FB、T參考答案:A2.在無線數(shù)據(jù)端到端指標(biāo)體系中,4G網(wǎng)絡(luò)HTTP下載速率的指標(biāo)定義是?A、HTTP話單的上傳下載數(shù)據(jù)總量除以上傳下載總傳輸時(shí)長(限制500KB以上文件大?。〣、HTTP話單的總下載數(shù)據(jù)量除以總下載傳輸時(shí)長(限制1024KB以上文件大?。〤、HTTP話單的總下載數(shù)據(jù)量除以總下載傳輸時(shí)長(限制500KB以上文件大?。﹨⒖即鸢福篊3.在哪里能下載到hadoop軟件A、apache網(wǎng)站或者捐獻(xiàn)給apache使用的公開服務(wù)器B、oracle官網(wǎng)C、hadoop公司官網(wǎng)D、linux官網(wǎng)參考答案:A4.在進(jìn)行VOLTE端到端八元六階定界時(shí),下列哪個(gè)不屬于六階A、附著B、TAUC、eSRVCC切換D、語音質(zhì)量參考答案:B5.在集團(tuán)公司四維十輪網(wǎng)絡(luò)質(zhì)量評估體系中,下列哪項(xiàng)不是評估家庭業(yè)務(wù)感知的指標(biāo):A、家寬網(wǎng)頁打開成功率(%)B、139郵箱web登錄成功率(%)C、家寬網(wǎng)頁平均首屏?xí)r延(s)D、家寬視頻首幀顯示時(shí)長(s)參考答案:B6.在基于規(guī)則分類器的中,依據(jù)規(guī)則質(zhì)量的某種度量對規(guī)則排序,保證每一個(gè)測試記錄都是由覆蓋它的“最好的”規(guī)格來分類,這種方案稱為()A、基于類的排序方案B、基于規(guī)則的排序方案C、基于度量的排序方案D、基于規(guī)格的排序方案。參考答案:B7.在多元線性回歸模型中,變量顯著性檢驗(yàn)與方程顯著性檢驗(yàn)都要進(jìn)行,不能相互替代。A、FB、T參考答案:B8.在多層次關(guān)聯(lián)規(guī)則分析中,如果將商品進(jìn)行歸類,每一商品類別的支持度會()其包含的每個(gè)商品的支持度,從而有利于發(fā)現(xiàn)一些有意義的頻繁模式或關(guān)聯(lián)規(guī)則。A、小于B、等于C、大于D、不確定參考答案:C9.在抽樣方法中,當(dāng)合適的樣本容量很難確定時(shí),可以使用的抽樣方法是:A、有放回的簡單隨機(jī)抽樣B、無放回的簡單隨機(jī)抽樣C、分層抽樣D、漸進(jìn)抽樣參考答案:D10.在SQLServer提供的EM聚類算法中,敘述正確的是()A、必須要設(shè)置聚類的分類數(shù)B、不必指定聚類的分類數(shù)C、可以不指定聚類的分類數(shù),此時(shí)采用默認(rèn)值D、以上都不對參考答案:C11.在sklearn中,下面哪個(gè)類或方法,位于preprocessing模塊()A、train_test_splitB、LabelEncoderC、accuracy_scoreD、DecisionTreeClassifier參考答案:B12.在SELECT語句中,用來指定查詢所用的表的子句是()。A、WHEREB、GROUPBYC、ORDERBYD、FROM參考答案:D13.在Requests庫的get()方法中,能夠定制向服務(wù)器提交HTTP請求頭的參數(shù)是什么?A、dataB、jsonC、cookiesD、headers參考答案:D14.在Python中有S=['a','b']S.append([1,2])S.insert(1,7);執(zhí)行以上代碼后,s值為()A、‘a(chǎn)',7,‘b',1,2]B、[[1,2],7,‘a(chǎn)',‘b’]C、[1,2,‘a(chǎn)’,7’,‘b’]D、[‘a(chǎn)',7,‘b’,[1,2]]參考答案:D15.有關(guān)數(shù)據(jù)倉庫建模的敘述中正確的是()。A、因?yàn)樾枨蠓治鲋幸呀?jīng)考慮主題,建模時(shí)不再需要確定主題域B、因?yàn)樾枨蠓治鲋幸呀?jīng)確定項(xiàng)目的所有功能,沒有必要再進(jìn)行數(shù)據(jù)倉庫建模工作C、數(shù)據(jù)倉庫建模是設(shè)計(jì)概念模型,繼而導(dǎo)出邏輯模型D、數(shù)據(jù)倉庫建模是設(shè)計(jì)物理模型參考答案:C16.用戶有一種感興趣的模式并且希望在數(shù)據(jù)集中找到相似的模式,屬于數(shù)據(jù)挖掘哪一類任務(wù)()A、根據(jù)內(nèi)容檢索B、建模描述C、預(yù)測建模D、尋找模式和規(guī)則參考答案:A17.以下哪種情況對Kmeans模型的影響較?。ǎ?。A、給定錯(cuò)誤聚類個(gè)數(shù)B、簇的大小分布不均衡C、不同簇的方差相差較大D、數(shù)據(jù)有各向異性分布參考答案:B18.以下哪項(xiàng)關(guān)于決策樹的說法是錯(cuò)誤的()A、冗余屬性不會對決策樹的準(zhǔn)確率造成不利的影響B(tài)、子樹可能在決策樹中重復(fù)多次C、決策樹算法對于噪聲的干擾非常敏感D、尋找最佳決策樹是NP完全問題參考答案:C19.以下哪項(xiàng)不是集團(tuán)要求各省集中性能平臺必須包含的VoLTE指標(biāo)?()A、注冊成功率B、VoLTE呼叫接通率C、VoLTE掉話率D、MOS3.0以上占比參考答案:D20.以下哪個(gè)是回歸模型評判的指標(biāo)?()A、mean_squared_errorB、準(zhǔn)確率C、召回率D、輪廓系數(shù)參考答案:A21.以下哪個(gè)聚類算法不是屬于基于原型的聚類A、CLIQUEB、模糊C均值C、EM算法D、SOM參考答案:A22.以下哪個(gè)聚類算法不是屬于基于原型的聚類()。A、模糊c均值B、EM算法C、SOMD、CLIQUE參考答案:D23.以下哪個(gè)不是數(shù)據(jù)清理的方法()A、填充缺失值B、光滑噪聲C、識別離群點(diǎn)D、數(shù)據(jù)變換參考答案:D24.以下關(guān)于字符串.strip()方法功能說明正確的是:A、連接兩個(gè)字符串序列B、替換字符串中特定字符C、按照指定字符分割字符串為數(shù)組D、去掉字符串兩側(cè)指定字符參考答案:D25.以下關(guān)于大數(shù)據(jù)應(yīng)用說法錯(cuò)誤的是()。A、大數(shù)據(jù)起源互聯(lián)網(wǎng),目前處于成熟期;B、目前金融、電信、零售、公共服務(wù)等領(lǐng)域在積極的探索和應(yīng)用大數(shù)據(jù);C、互聯(lián)網(wǎng)是大數(shù)據(jù)的發(fā)源地;D、互聯(lián)網(wǎng)上形成了多種相對成熟的應(yīng)用模式。參考答案:A26.以下關(guān)于OLAP和OLTP的敘述中錯(cuò)誤的是()A、OLTP事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高B、OLAP的最終數(shù)據(jù)來源與OLTP是完全不一樣的C、OLAP面對的是決策人員和高層管理人員D、OLTP以應(yīng)用為核心,是應(yīng)用驅(qū)動(dòng)的參考答案:B27.以下()數(shù)據(jù)挖掘方法能夠幫助市場分析人員將購買商品的顧客進(jìn)行分類劃分A、分類B、預(yù)測C、關(guān)聯(lián)分析D、聚類參考答案:A28.已知x=[1,2,3],那么x*3的值為?A、6B、18C、[3,6,9]D、[1,2,3,1,2,3,1,2,3]參考答案:D29.一所大學(xué)內(nèi)的各年紀(jì)人數(shù)分別為:一年級200人,二年級160人,三年級130人,四年級110人。則年級屬性的眾數(shù)是:A、一年級B、二年級C、三年級D、四年級參考答案:A30.一個(gè)對象的離群點(diǎn)得分是該對象周圍密度的逆。這是基于()的離群點(diǎn)定義。A、概率B、鄰近度C、密度D、聚類參考答案:C31.研究顧客購買手機(jī)價(jià)格與年齡,性別,收入和工作地點(diǎn)的關(guān)系可以使用()A、回歸方法B、分類方法C、聚類方法D、關(guān)聯(lián)分析參考答案:A32.信令監(jiān)測系統(tǒng)在架構(gòu)上分為哪三層?A、采集層、共享層、應(yīng)用層B、采集層、解碼層、識別層C、物理層、網(wǎng)絡(luò)層、應(yīng)用層D、接入層、匯聚層、核心層參考答案:A33.協(xié)同過濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些用戶對某一信息的評價(jià),形成系統(tǒng)對該指定用戶對此信息的喜好程度(),并將這些用戶喜歡的項(xiàng)推薦給有相似興趣的用戶。A、相似B、相同C、推薦D、預(yù)測參考答案:D34.下面哪項(xiàng)是集中性能管理面向客服專題()A、2/3G高流量小區(qū)遷移B、終端在網(wǎng)質(zhì)量評估分析C、客戶投訴溯源分析D、4G終端投放支撐參考答案:C35.下面哪個(gè)屬于映射數(shù)據(jù)到新的空間的方法?A、傅立葉變換B、特征加權(quán)C、漸進(jìn)抽樣D、維歸約參考答案:A36.下面哪個(gè)是用來定義類的關(guān)鍵字?A、continueB、classC、defD、yield參考答案:B37.下面哪個(gè)關(guān)鍵字用來定義函數(shù)?A、defB、defineC、functionD、class參考答案:A38.下面哪個(gè)不是網(wǎng)絡(luò)爬蟲帶來的負(fù)面問題?A、法律風(fēng)險(xiǎn)B、商業(yè)利益C、隱私泄露D、性能騷擾參考答案:B39.下面哪個(gè)不是Python合法得標(biāo)識浮()A、int32B、40XLC、selfD、_name_參考答案:B40.下面關(guān)于數(shù)據(jù)粒度的描述不正確的是:()A、粒度是指數(shù)據(jù)倉庫小數(shù)據(jù)單元的詳細(xì)程度和級別;B、數(shù)據(jù)越詳細(xì),粒度就越小,級別也就越高;C、數(shù)據(jù)綜合度越高,粒度也就越大,級別也就越高;D、粒度的具體劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量.參考答案:C41.下面關(guān)于聚類分析說法錯(cuò)誤的是()A、一定存在一個(gè)最優(yōu)的分類B、聚類分析是無監(jiān)督學(xué)習(xí)C、聚類分析可以用于判斷異常值D、聚類分析即:物以類聚,人以群分參考答案:A42.下面關(guān)于Jarvis-Patrick(JP)聚類算法的說法不正確的是()A、JP聚類擅長處理噪聲和離群點(diǎn),并且能夠處理不同大小、形狀和密度的簇。B、JP算法對高維數(shù)據(jù)效果良好,尤其擅長發(fā)現(xiàn)強(qiáng)相關(guān)對象的緊致簇。C、JP聚類是基于SNN相似度的概念。D、JP聚類的基本時(shí)間復(fù)雜度為O(m)。參考答案:D43.下面不屬于人工智能研究基本內(nèi)容是()A、機(jī)器感知B、機(jī)器學(xué)習(xí)C、自動(dòng)化D、機(jī)器思維參考答案:C44.下面不屬于創(chuàng)建新屬性的相關(guān)方法的是:A、特征提取B、特征修改C、映射數(shù)據(jù)到新的空間D、特征構(gòu)造參考答案:B45.下列選項(xiàng)中,屬于結(jié)構(gòu)化數(shù)據(jù)的是()。A、圖像B、文本C、辦公文檔D、JSON參考答案:D46.下列選項(xiàng)中,不屬于請求報(bào)頭的是()。A、User-AgentB、CookieC、RefererD、Content-Type參考答案:D47.下列哪個(gè)不是專門用于可視化時(shí)間空間數(shù)據(jù)的技術(shù):()A、等高線圖B、餅圖C、曲面圖D、矢量場圖參考答案:B48.下列解析技術(shù)中,用于解析JSON文檔的是()。A、XPathB、JSONPathC、BeautifulSoupD、正則表達(dá)式參考答案:B49.下列關(guān)于頁面顯示總時(shí)長說法正確的是?A、TRANS_RSP_CODE<400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為0,最后一個(gè)HTTP內(nèi)容包的時(shí)延(MS)B、TRANS_RSP_CODE<400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為1,最后一個(gè)HTTP內(nèi)容包的時(shí)延(MS)C、TRANS_RSP_CODE>400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為1,最后一個(gè)HTTP內(nèi)容包的時(shí)延(MS)D、TRANS_RSP_CODE>400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為0,最后一個(gè)HTTP內(nèi)容包的時(shí)延(MS)參考答案:A50.下列對學(xué)生相關(guān)屬性描述中,不是標(biāo)稱屬性的是()A、學(xué)號B、婚姻狀況C、身高D、衣服顏色參考答案:C51.下列度量不具有反演性的是A、系數(shù)B、幾率C、Cohen度量D、興趣因子參考答案:D52.下列代碼作用為()Net_in=np.array([0,0,-1])Out_in=np.array([0,0,0,0,-1])A、輸出層權(quán)值變化量B、中間層權(quán)值變化量C、中間層神經(jīng)元輸入和輸出層神經(jīng)元輸入D、輸出連接權(quán)值和閾值參考答案:C53.下列()不是將主觀信息加入到模式發(fā)現(xiàn)任務(wù)中的方法。A、與同一時(shí)期其他數(shù)據(jù)對比B、可視化C、基于模板的方法D、主觀興趣度量參考答案:A54.網(wǎng)管側(cè)從愛立信MME取走統(tǒng)計(jì)的路徑是A、/Tmp/log/OSS_filesB、/Tmp/OSS_filesC、/Core/log/OSS_filesD、/log/OSS_files參考答案:C55.推薦系統(tǒng)為客戶推薦商品,自動(dòng)完成個(gè)性化選擇商品的過程,滿足客戶的個(gè)性化需求,推薦基于網(wǎng)站最熱賣商品、客戶所處城市、(),推測客戶將來可能的購買行為。A、客戶的朋友B、客戶的個(gè)人信息C、客戶的興趣愛好D、客戶過去的購買行為和購買記錄參考答案:D56.統(tǒng)計(jì)檔案表中學(xué)生來自多少個(gè)城市,下面SQL語句正確的是()。A、SELCETSUM(DISTINCT家庭住址)FROM檔案表;B、SELCETDISTINCT家庭住址FROM檔案表;C、SELCETCOUNT(家庭住址)FROM檔案表;D、SELCETCOUNT(DISTINCT家庭住址)FROM檔案表;參考答案:D57.通過建立一個(gè)模型來實(shí)現(xiàn)已知變量值來預(yù)測其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪類任務(wù)A、內(nèi)容檢索B、建模描述C、預(yù)測建模D、尋找模式和規(guī)則參考答案:C58.所謂高維數(shù)據(jù),指的是A、數(shù)據(jù)對象很多B、數(shù)據(jù)屬性很多C、以上都正確D、以上都錯(cuò)誤參考答案:B59.數(shù)據(jù)在規(guī)定的時(shí)間前和頻度周期內(nèi)接入系統(tǒng)的比例稱為()A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;B、指標(biāo)數(shù)據(jù)接入率C、指標(biāo)數(shù)據(jù)接入及時(shí)率;D、指標(biāo)數(shù)據(jù)完整率參考答案:C60.數(shù)據(jù)預(yù)處理的任務(wù)不包括()。A、數(shù)據(jù)清洗B、數(shù)據(jù)規(guī)范化和離散化C、數(shù)據(jù)分類D、特征提取與特征選擇參考答案:C61.數(shù)據(jù)挖掘的英文簡寫是()A、DKDB、KDDC、DMD、DA參考答案:C62.實(shí)際接入的指標(biāo)數(shù)占應(yīng)接指標(biāo)總數(shù)的比例,統(tǒng)計(jì)時(shí)又分線上和線下接入率稱為()A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;B、指標(biāo)數(shù)據(jù)接入率C、指標(biāo)數(shù)據(jù)接入及時(shí)率;D、指標(biāo)數(shù)據(jù)完整率參考答案:B63.時(shí)間序列的類型分為()。A、平穩(wěn)序列和非平穩(wěn)序列B、大序列和小序列C、有趨勢序列和無趨勢序列D、隨機(jī)序列和非隨機(jī)序列參考答案:A64.什么是KDD?()A、數(shù)據(jù)挖掘與知識發(fā)現(xiàn)B、領(lǐng)域知識發(fā)現(xiàn)C、文檔知識發(fā)現(xiàn)D、動(dòng)態(tài)知識發(fā)現(xiàn)參考答案:A65.設(shè)置hadoop啟動(dòng)環(huán)境變量的文件是?A、core-site.xmlB、hdfs-site.xmlC、mapred-site.xmlD、hadoop-env.sh參考答案:D66.設(shè)X={a,b,c}是一個(gè)頻繁項(xiàng)集,則最多可由X產(chǎn)生()個(gè)關(guān)聯(lián)規(guī)則。A、4B、5C、6D、7參考答案:C67.若MySQL數(shù)據(jù)表中有姓名為“李建華”的記錄,下列無法查出“李建華”的表達(dá)式是()。A、Like"華"B、Like"%華"C、Like"%華%"D、Like"__華"參考答案:A68.若I={a,b,c,d},D中含有10個(gè)事務(wù),(a,b}和{a,c}是一個(gè)頻繁項(xiàng)集,則以下敘述中正確的是()。A、{a,b,d}一定是頻繁項(xiàng)集B、{a,b,c}一定是頻繁項(xiàng)集C、{b,c}一定是頻繁項(xiàng)集D、以上都不對參考答案:D69.如下哪些不是最近鄰分類器的特點(diǎn),()A、它使用具體的訓(xùn)練實(shí)例進(jìn)行預(yù)測,不必維護(hù)源自數(shù)據(jù)的模型B、分類一個(gè)測試樣例開銷很大C、最近鄰分類器基于全局信息進(jìn)行預(yù)測D、可以生產(chǎn)任意形狀的決策邊界參考答案:C70.如下表所示,交易號(D)商品(tems)1beer,diaper,nuts2beer,biscuit,diaper3bread,butter,cheese4beer,cheese,diaper,nuts5beer,butter,cheese,nuts2)X={butter,cheese},Y={beer},則置信度confidence(X→Y)=()。A、2/5B、1/2C、1/3D、1/4參考答案:B71.如下表所示,X={butter,cheese},則支持度support(X)=()。交易號(TID)商品(Items)1beer,diaper,nuts2beer,biscuit,diaper3bread,butter,cheese4beer,cheese,diaper,nuts5beer,butter,cheese,nutsA、2/5B、4/5C、1/5D、3/5參考答案:A72.如果規(guī)則集中的規(guī)則按照優(yōu)先級降序排列,則稱規(guī)則集是A、無序規(guī)則B、窮舉規(guī)則C、互斥規(guī)則D、有序規(guī)則參考答案:D73.人工智能復(fù)活之路上經(jīng)歷了()次熱潮A、1B、2C、3D、4參考答案:C74.請問以下何者屬于時(shí)間序列的問題?A、信用卡發(fā)卡銀行偵測潛在的卡奴B、基金經(jīng)理人針對個(gè)股做出未來價(jià)格預(yù)測C、電信公司將人戶區(qū)分為數(shù)個(gè)群體D、以上均不是參考答案:B75.蘋果公司對IPHONE的降價(jià)行為屬于()A、地域性差別定價(jià)B、時(shí)間性差別定價(jià)C、非線性定價(jià)或數(shù)量折扣定價(jià)D、其他形式的定價(jià)參考答案:B76.評估完模型之后,發(fā)現(xiàn)模型存在高偏差(highbias),應(yīng)該如何解決?()A、減少模型的特征數(shù)量B、增加模型的特征數(shù)量C、增加樣本數(shù)量D、以上說法都正確參考答案:B77.每次從指定的文件中讀取一行的方法是:A、read()B、readline()C、readlines()D、reads()參考答案:B78.利用tree.DecisionTreeClassifier()訓(xùn)練模型時(shí)調(diào)用.fit()方法需要傳遞的第一個(gè)參數(shù)是()。A、樣本特征XB、樣本標(biāo)簽YC、設(shè)置結(jié)點(diǎn)的最小樣本數(shù)量D、判斷標(biāo)準(zhǔn)參考答案:A79.利用tree.DecisionTreeClassifier()訓(xùn)練模型時(shí)調(diào)用.fit()方法需要傳遞的第二個(gè)參數(shù)是()。A、樣本特征XB、樣本標(biāo)簽YC、判斷標(biāo)準(zhǔn)D、設(shè)置結(jié)點(diǎn)的最小樣本數(shù)量參考答案:B80.可以最全面反映整個(gè)網(wǎng)絡(luò)缺省EPS承載的建立成功率的指標(biāo)是A、PDN連接建立成功率B、缺省承載激活成功率C、MME建立缺省S5S8承載成功率D、位置更新的成功率參考答案:A81.可以對按季度匯總的銷售數(shù)據(jù)進(jìn)行(),來觀察按月匯總的數(shù)據(jù)。A、上卷B、下鉆C、切片D、切塊參考答案:B82.可以對按城市匯總的銷售數(shù)據(jù)進(jìn)行(),來觀察按國家總的數(shù)據(jù)。A、上卷B、下鉆C、切片D、切塊參考答案:A83.考慮值集{1、2、3、4、5、90},其截?cái)嗑担╬=20%)是A、2B、3C、3.5D、5參考答案:C84.考慮這么一種情況:一個(gè)對象碰巧與另一個(gè)對象相對接近,但屬于不同的類,因?yàn)檫@兩個(gè)對象一般不會共享許多近鄰,所以應(yīng)該選擇()的相似度計(jì)算方法。A、平方歐幾里德距離B、余弦距離C、直接相似度D、共享最近鄰參考答案:D85.考慮下面的頻繁3-項(xiàng)集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定數(shù)據(jù)集中只有5個(gè)項(xiàng),采用合并策略,由候選產(chǎn)生過程得到4-項(xiàng)集不包含A、1,2,3,4B、1,2,3,5C、1,2,4,5D、1,3,4,5參考答案:C86.考慮兩隊(duì)之間的足球比賽:隊(duì)0和隊(duì)1。假設(shè)65%的比賽隊(duì)0勝出,剩余的比賽隊(duì)1獲勝。隊(duì)0獲勝的比賽中只有30%是在隊(duì)1的主場,而隊(duì)1取勝的比賽中75%是主場獲勝。如果下一場比賽在隊(duì)1的主場進(jìn)行隊(duì)1獲勝的概率為A、0.75B、0.35C、0.4678D、0.5738參考答案:C87.建立一個(gè)模型,通過這個(gè)模型根據(jù)已知的變量值來預(yù)測其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)A、根據(jù)內(nèi)容檢索B、建模描述C、預(yù)測建模D、尋找模式和規(guī)則參考答案:C88.簡單地將數(shù)據(jù)對象集劃分成不重疊的子集,使得每個(gè)數(shù)據(jù)對象恰在一個(gè)子集中,這種聚類類型稱作()A、層次聚類B、劃分聚類C、非互斥聚類D、模糊聚類參考答案:B89.檢查異常值常用的統(tǒng)計(jì)圖形是()A、柱狀圖B、箱線圖C、帕累托圖D、氣泡圖參考答案:B90.假設(shè)屬性income的最大最小值分別是12000元和98000元。利用最大-最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對屬性income的73600元將被轉(zhuǎn)化為()A、0.751B、0.163C、0.457D、0.716參考答案:D91.假設(shè)12個(gè)銷售價(jià)格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用等寬劃分(寬度為50)方法將它們劃分成四個(gè)箱,求15在哪個(gè)箱子?()A、第1個(gè)B、第2個(gè)C、第3個(gè)D、第4個(gè)參考答案:A92.基于輸入的用戶信息,通過模型的訓(xùn)練學(xué)習(xí),找出數(shù)據(jù)中的規(guī)律和趨勢,以確定未來目標(biāo)數(shù)據(jù)的預(yù)測值()A、聚類B、分類C、預(yù)測D、關(guān)聯(lián)參考答案:C93.關(guān)于混合模型聚類算法的優(yōu)缺點(diǎn),下面說法正確的是()A、當(dāng)簇只包含少量數(shù)據(jù)點(diǎn),或者數(shù)據(jù)點(diǎn)近似協(xié)線性時(shí),混合模型也能很好地處理。B、混合模型比K均值或模糊C均值更一般,因?yàn)樗梢允褂酶鞣N類型的分布。C、混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇。D、混合模型在有噪聲和離群點(diǎn)時(shí)不會存在問題。參考答案:B94.關(guān)于OLAP和OLTP的區(qū)別描述,不正確的是:()A、OLAP主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù).它與OTAP應(yīng)用程序不同B、與OLAP應(yīng)用程序不同,OLTP應(yīng)用程序包含大量相對簡單的事務(wù)C、OLAP的特點(diǎn)在于事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高D、OLAP是以數(shù)據(jù)倉庫為基礎(chǔ)的,但其最終數(shù)據(jù)來源與OLTP一樣均來自底層的數(shù)據(jù)庫系統(tǒng),兩者面對的用戶是相同的參考答案:C95.發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法通常要經(jīng)過以下三個(gè)步驟:連接數(shù)據(jù),作數(shù)據(jù)準(zhǔn)備;給定最小支持度和(D),利用數(shù)據(jù)挖掘工具提供的算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則;可視化顯示、理解、評估關(guān)聯(lián)規(guī)則A、最小興趣度B、最小置信度C、最大支持度D、最小可信度參考答案:D96.當(dāng)新業(yè)務(wù)、行為出現(xiàn)或目標(biāo)跟蹤業(yè)務(wù)出現(xiàn)新版本時(shí),DPI設(shè)備應(yīng)能在()周之內(nèi)具備新業(yè)務(wù)或新版本的識別能力。A、1B、2C、3D、4參考答案:A97.大數(shù)據(jù)科學(xué)關(guān)注大數(shù)據(jù)網(wǎng)絡(luò)發(fā)展和運(yùn)營過程中()大數(shù)據(jù)的規(guī)律及其與自然和社會活動(dòng)之間的關(guān)系。A、大數(shù)據(jù)網(wǎng)絡(luò)發(fā)展和運(yùn)營過程B、規(guī)劃建設(shè)運(yùn)營管理C、規(guī)律和驗(yàn)證D、發(fā)現(xiàn)和驗(yàn)證參考答案:D98.從研究現(xiàn)狀上看,下面不屬于云計(jì)算特點(diǎn)的是()A、超大規(guī)模B、虛擬化C、私有化D、高可靠性參考答案:C99.VOLTE業(yè)務(wù)評估體系中,VOLTE語音掉線率屬于哪一類指標(biāo)?A、保持性B、接入性C、完整性D、移動(dòng)性參考答案:A100.TCP/IP協(xié)議按照從底層到高層的順序,除了應(yīng)用層之外,每一層都有與其相對應(yīng)的PDU(ProtocolDataUnit,協(xié)議數(shù)據(jù)單元),依次為()A、Bit、Segment、Packet、FrameB、Bit、Frame、Packet、SegmentC、Packet、Bit、Frame、SegmentD、Bit、Packet、Frame、Segment參考答案:B101.SELECT命令中用于返回非重復(fù)記錄的關(guān)鍵字是()。A、TOPB、GROUPC、DISTINCTD、ORDER參考答案:C102.SAEGateway的功能包括?A、數(shù)據(jù)的路由和傳播、用戶面數(shù)據(jù)的加密B、數(shù)據(jù)的路由和傳播、用戶面數(shù)據(jù)的加密、尋呼消息的發(fā)送C、用戶面數(shù)據(jù)的加密、尋呼消息的發(fā)送、NAC層信令的加密參考答案:A103.Requests庫中,下面哪個(gè)是檢查Response對象返回是否成功的狀態(tài)屬性?A、raise_for_statusB、headersC、status_codeD、status參考答案:C104.OLAP技術(shù)的核心是()A、在線性B、對用戶的快速響應(yīng)C、互操作性D、多維分析參考答案:D105.OLAP的含義是()A、面向?qū)ο蠓治鎏幚鞡、面向過程分析處理C、聯(lián)機(jī)事務(wù)處理D、聯(lián)機(jī)分析處理參考答案:D106.NLTK最適用于哪種類型的任務(wù)A、語言處理B、圖像處理C、聲音處理D、文字處理參考答案:A107.MGW與RNC的連接介質(zhì)采用A、IP傳輸B、PCM傳輸C、ATM傳輸參考答案:C108.MapReduce是典型的()算法。A、聚類B、搜索C、預(yù)測D、迭代參考答案:B109.lr.fit(X_train,y_train)語句的目的為()A、建立LR模型B、導(dǎo)入數(shù)據(jù)并觀察C、查看數(shù)據(jù)框D、用處理好的數(shù)據(jù)訓(xùn)練模型參考答案:D110.Logistic回歸是在商業(yè)領(lǐng)域上使用最廣泛的預(yù)測模型,常用于()分類變量預(yù)測和概率預(yù)測。A、四值B、三值C、二值D、一值參考答案:C111.KNN的英文全寫為()A、k-NearerNeighborB、k-NearestNeighborC、k-NearNeighborsD、k-NearestNeighbors參考答案:B112.Hive是基于Hadoop的一個(gè)數(shù)據(jù)()工具A、分析;B、倉庫C、制圖D、可視化參考答案:B113.Hadoop是一個(gè)開發(fā)和運(yùn)行處理大規(guī)模數(shù)據(jù)的軟件平臺,是Appach的一個(gè)用()語言實(shí)現(xiàn)開源軟件框架。A、javaB、C.++C、R語言參考答案:A114.eNodeB對哪種類型的數(shù)據(jù)進(jìn)行完整性保護(hù)()A、RRCsignallingB、NASsignallingC、UserplanedataD、SystemInformation參考答案:C115.CRISP-DM是跨行業(yè)數(shù)據(jù)挖掘過程標(biāo)準(zhǔn),下述哪項(xiàng)工作是在datapreperation階段完成A、數(shù)據(jù)收集B、數(shù)據(jù)清洗C、建立模型D、數(shù)據(jù)理解參考答案:B116.《個(gè)人信息保護(hù)法》對于企業(yè)的影響不包括()A、需要強(qiáng)化個(gè)人信息處理這主體責(zé)任B、明確了可以量化的中國版執(zhí)行罰則C、需要設(shè)立負(fù)責(zé)處理個(gè)人信息保護(hù)相關(guān)事務(wù)的專門機(jī)構(gòu)和指定代表D、收集和處理數(shù)據(jù)時(shí)可以不遵循“最小化”原則參考答案:D117.“點(diǎn)擊率問題”是這樣一個(gè)預(yù)測問題,99%的人是不會點(diǎn)擊的,而1%的人是會點(diǎn)擊進(jìn)去的,所以這是一個(gè)非常不平衡的數(shù)據(jù)集.假設(shè),現(xiàn)在我們已經(jīng)建了一個(gè)模型來分類,而且有了99%的預(yù)測準(zhǔn)確率,我們可以下的結(jié)論是()A、模型預(yù)測準(zhǔn)確率已經(jīng)很高了,我們不需要做什么了B、模型預(yù)測準(zhǔn)確率不高,我們需要做點(diǎn)什么改進(jìn)模型C、無法下結(jié)論D、以上都不對參考答案:C118.()數(shù)據(jù)挖掘方法能夠幫助市場分析人員找出顧客購買的商品之間的關(guān)聯(lián)關(guān)系A(chǔ)、分類B、預(yù)測C、關(guān)聯(lián)分析D、聚類參考答案:C119.()是一類機(jī)器學(xué)習(xí)技術(shù),在學(xué)習(xí)模型時(shí),它使用標(biāo)記的和未標(biāo)記的實(shí)例。A、監(jiān)督學(xué)習(xí)B、無監(jiān)督學(xué)習(xí)C、半監(jiān)督學(xué)習(xí)D、主動(dòng)學(xué)習(xí)參考答案:C120.()是一個(gè)觀測值,它與其他觀測值的差別如此之大,以至于懷疑它是由不同的機(jī)制產(chǎn)生的A、邊界點(diǎn)B、質(zhì)心C、離群點(diǎn)D、核心點(diǎn)參考答案:C多選題1.作為VoLTE語音方案中關(guān)鍵的信令和語音承載通道,以下那個(gè)網(wǎng)絡(luò)為用戶的語音業(yè)務(wù)實(shí)現(xiàn)端到端的QoS質(zhì)量保障?A、EPCB、TDSCDMAC、IMSD、GSM參考答案:AC2.自動(dòng)駕駛技術(shù)在以下()領(lǐng)域?qū)崿F(xiàn)A、大型客機(jī)B、戰(zhàn)斗機(jī)C、高鐵列車D、民用汽車參考答案:ABCD3.主成分分析計(jì)算選擇相關(guān)系數(shù)計(jì)算法時(shí),確定主成分個(gè)數(shù)的致原則包括()A、特征根值大于1B、特征根值大于3C、累積特征根值加總占總特征根值的80%以上D、累積特征根值加總占總特征根值的90%以上參考答案:AC4.智能手機(jī)市場10年混戰(zhàn)之后,僅剩下()陣營A、蘋果IOSB、谷歌AndroidC、微軟D、聯(lián)想?yún)⒖即鸢福篈B5.噪聲數(shù)據(jù)的產(chǎn)生原因主要有:()A、數(shù)據(jù)采集設(shè)備有問題B、在數(shù)據(jù)錄入過程中發(fā)生了人為或計(jì)算機(jī)錯(cuò)誤C、數(shù)據(jù)傳輸過程中發(fā)生錯(cuò)誤D、由于命名規(guī)則或數(shù)據(jù)代碼不同而引起的不一致參考答案:ABCD6.在作邏輯回歸時(shí),如果區(qū)域這個(gè)變量,當(dāng)Region=A時(shí)Y取值均為1,無法確定是否出現(xiàn)的是哪個(gè)問題?A、共線性B、異常值C、擬完全分離(Quasi-completeseparation)D、缺失值參考答案:ABD7.在有關(guān)數(shù)據(jù)倉庫測試,下列說法中正確的是()A、在完成數(shù)據(jù)倉庫的實(shí)施過程中,需要對數(shù)據(jù)倉庫進(jìn)行各種測試.測試工作中要包括單元測試和系統(tǒng)測試B、當(dāng)數(shù)據(jù)倉庫的每個(gè)單獨(dú)組件完成后,就需要對他們進(jìn)行單元測試C、系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進(jìn)行大量的功能測試和回歸測試D、在測試之前可以不制定詳細(xì)的測試計(jì)劃,測試過程中實(shí)時(shí)調(diào)整。參考答案:ABC8.在以下不同的場景中,使用的分析方法正確的有()A、根據(jù)商家最近一年的經(jīng)營及服務(wù)數(shù)據(jù),用聚類算法判斷出天貓商家在各自主營類目下所屬的商家層級B、根據(jù)商家近幾年的成交數(shù)據(jù),用聚類算法擬合出用戶未來一個(gè)月可能的消費(fèi)金額公式C、用關(guān)聯(lián)規(guī)則算法分析出購買了汽車坐墊的買家,是否適合推薦汽車腳墊D、根據(jù)用戶最近購買的商品信息,用決策樹算法識別出淘寶買家可能是男還是女參考答案:ACD9.在探索性數(shù)據(jù)分析中,認(rèn)為最有代表性,最能反映數(shù)據(jù)重要特征的五數(shù)概括,包括:A、中位數(shù)Q2B、四分位數(shù)Q3C、最小值D、最大值參考答案:ABCD10.在全面調(diào)查和抽樣調(diào)查中都存在的誤差是()A、系統(tǒng)誤差B、登記性誤差C、責(zé)任心誤差D、技術(shù)性誤差參考答案:BCD11.在評價(jià)不平衡類問題分類的度量方法有如下幾種,A、F1度量B、召回率(recall)C、精度(precision)D、真正率(turepositiverate,TPR)參考答案:ABCD12.在聚類分析當(dāng)中,()等技術(shù)可以處理任意形狀的簇。A、MIN(單鏈)B、MAX(全鏈)C、組平均D、Chameleon參考答案:AD13.預(yù)處理的任務(wù)有哪些()。A、特征提取與特征選擇B、數(shù)據(jù)清洗C、數(shù)據(jù)規(guī)范化D、數(shù)據(jù)離散化參考答案:ABCD14.預(yù)測性能的優(yōu)劣需要一定的度量來衡量,常用的度量是()。A、RAE(相對絕對誤差)B、MAE(平均絕對誤差)C、MSE(均方誤差)D、RSE(相對平方誤差)參考答案:ABCD15.影響聚類算法結(jié)果的主要因素有()A、特征選取B、已知類別的樣本質(zhì)量C、模式相似性測度D、分類準(zhǔn)則參考答案:ACD16.影響基本K-均值算法的主要因素包括()A、初始類中心的選取B、樣本相似性的度量C、樣本輸入順序D、K值的設(shè)定參考答案:ABD17.以下屬于聚類算法的是()A、K均值B、DBSCANC、AprioriD、knn參考答案:AB18.以下屬于聚類算法的是()A、K均值B、DBSCANC、AprioriD、k-medoids參考答案:ABD19.以下屬于聚類算法的是()A、K均值B、DBSCANC、AprioriD、arvis-Patrick參考答案:ABD20.以下屬于聚類算法的是()。A、K均值B、DBSCANC、AprioriD、Jarvis-Patrick(JP)參考答案:ABD21.以下屬于分類器評價(jià)或比較尺度的有:A、預(yù)測準(zhǔn)確度B、召回率C、模型描述的簡潔度D、計(jì)算復(fù)雜度參考答案:ACD22.以下哪些指標(biāo)屬于網(wǎng)頁瀏覽類KQI?()A、流媒體停頓占比B、頁面顯示時(shí)長C、頁面下載速率D、頁面響應(yīng)成功率參考答案:BCD23.以下哪些學(xué)科和數(shù)據(jù)挖掘有密切聯(lián)系?()A、統(tǒng)計(jì)B、計(jì)算機(jī)組成原理C、礦產(chǎn)挖掘D、人工智能參考答案:AD24.以下哪個(gè)聚類算法屬于基于原型的聚類A、模糊C均值B、EM算法C、SOMD、CLIQUE參考答案:ABC25.以下哪個(gè)聚類分析的方法是利用統(tǒng)計(jì)學(xué)定義的距離進(jìn)行度量()A、層次聚類法B、快速聚類法(K-Means)C、基于密度的聚類法D、基于網(wǎng)格的聚類法參考答案:AB26.以下關(guān)于皮爾森相關(guān)分析敘述正確的是()A、兩變量獨(dú)立,兩者的皮爾森相關(guān)系數(shù)必然等于0B、兩變量皮爾森相關(guān)系數(shù)不等于0,兩者必然不獨(dú)立C、皮爾森相關(guān)系數(shù)是否等于零,不能指明兩變量是否獨(dú)立D、兩變量不獨(dú)立,兩者的皮爾森相關(guān)系數(shù)必然不等于0參考答案:AB27.以下關(guān)于非頻繁模式說法,正確的是()A、其支持度小于閾值B、都是不讓人感興趣的C、包含負(fù)模式和負(fù)相關(guān)模式D、對異常數(shù)據(jù)項(xiàng)敏感參考答案:AD28.以下各項(xiàng)均是針正確數(shù)據(jù)倉庫的不同說法,你認(rèn)為正確的有()。A、數(shù)據(jù)倉庫就是數(shù)據(jù)庫B、數(shù)據(jù)倉庫是一切商業(yè)智能系統(tǒng)的基礎(chǔ)C、數(shù)據(jù)倉庫是面向業(yè)務(wù)的,支持聯(lián)機(jī)事務(wù)處理(OLTP)D、數(shù)據(jù)倉庫支持決策而非事務(wù)處理E、數(shù)據(jù)倉庫的主要目標(biāo)就是幫助分析,做長期性的戰(zhàn)略制定參考答案:BCDE29.尋找數(shù)據(jù)集中的關(guān)系是為了尋找精確、方便并且有價(jià)值地總結(jié)了數(shù)據(jù)的某一特征的表示,這個(gè)過程包括了以下哪些步驟()A、決定要使用的表示的特征和結(jié)構(gòu)B、決定如何量化和比較不同表示擬合數(shù)據(jù)的好壞C、選擇一個(gè)算法過程使評分函數(shù)最優(yōu)D、決定用什么樣的數(shù)據(jù)管理原則以高效地實(shí)現(xiàn)算法。參考答案:ABCD30.尋呼響應(yīng)成功次數(shù)為統(tǒng)計(jì)一定的時(shí)間粒度及網(wǎng)元粒度下,滿足以下哪兩個(gè)條件()的S1-MME接口XDR的個(gè)數(shù)A、ProcedureType=4B、ProcedureStatus=0C、ProcedureType=1D、ProcedureStatus=1參考答案:AB31.相關(guān)分析的任務(wù)有()A、判定現(xiàn)象之間有無關(guān)系B、判定現(xiàn)象之間關(guān)系的方向C、判定相關(guān)關(guān)系的緊密程度D、說明現(xiàn)象之間聯(lián)系的具體形式參考答案:ABCD32.線性模型基本形式特點(diǎn)有()A、形式簡單,易于建模B、蘊(yùn)含機(jī)器學(xué)習(xí)的基本思想C、是其他非線性模型的基礎(chǔ)D、權(quán)重體現(xiàn)出各屬性重要性,可解釋性強(qiáng)參考答案:ABCD33.下面哪些網(wǎng)元會產(chǎn)生CDR話單?()A、MMEB、PGWC、SGWD、GGSN參考答案:BCD34.下列指標(biāo)受終端性能影響的有()A、無線掉線率B、4G用戶附著成功率C、視頻緩沖時(shí)長D、http響應(yīng)時(shí)延參考答案:ABC35.下列關(guān)于統(tǒng)計(jì)量的表述中,正確的有()A、估計(jì)同一個(gè)總體參數(shù)可以用多個(gè)不同的統(tǒng)計(jì)量B、統(tǒng)計(jì)量是樣本的函數(shù)C、統(tǒng)計(jì)量不含有總體的參數(shù)D、統(tǒng)計(jì)量是隨機(jī)變量參考答案:ABD36.下列公式正確的是()A、流動(dòng)資金=流動(dòng)資產(chǎn)-流動(dòng)負(fù)債B、流動(dòng)資產(chǎn)=應(yīng)收賬款+存貨C、流動(dòng)負(fù)債=應(yīng)付賬款+預(yù)收賬款D、流動(dòng)資金本年增加額=本年流動(dòng)資金-上年流動(dòng)資金參考答案:ACD37.下表是一個(gè)購物籃,假定支持度閾值為40%,其中()是頻繁閉項(xiàng)集A、abcB、abcdC、bceD、acde參考答案:AD38.物聯(lián)網(wǎng)端到端定界分析“七元四階”法中四階包括()A、網(wǎng)絡(luò)接入B、業(yè)務(wù)接入C、網(wǎng)絡(luò)切換D、業(yè)務(wù)使用質(zhì)量參考答案:ABCD39.偽分布模式中的注意點(diǎn)?A、偽分布式適用于開發(fā)和測試環(huán)境B、所有守護(hù)進(jìn)程都在同一臺機(jī)器上運(yùn)行C、守護(hù)進(jìn)程在不同的機(jī)器上運(yùn)行D、偽分布模式不能用于開發(fā)分布式代碼參考答案:AB40.隨機(jī)抽樣方法有()A、等距隨機(jī)抽樣B、綜合隨機(jī)抽樣C、簡單隨機(jī)抽樣D、分群隨機(jī)抽樣參考答案:ACD41.數(shù)據(jù)挖掘算法的組件包括?A、模型或模型結(jié)構(gòu)B、評分函數(shù)C、優(yōu)化和搜索方法D、數(shù)據(jù)管理策略參考答案:ABCD42.數(shù)據(jù)挖掘算法的組件包括:()A、模型或模型結(jié)構(gòu)B、評分函數(shù)C、優(yōu)化和搜索方法D、數(shù)據(jù)管理策略參考答案:ABCD43.數(shù)據(jù)挖掘匯聚了許多學(xué)科的知識,其主要的挖掘技術(shù)包括A、統(tǒng)計(jì)方法B、機(jī)器學(xué)習(xí)方法C、數(shù)據(jù)庫方法D、神經(jīng)網(wǎng)絡(luò)方法參考答案:ABCD44.數(shù)據(jù)挖掘工具R語言,其核心計(jì)算模塊采用什么語言編寫A、CB、C++C、FortranD、Python參考答案:ABC45.數(shù)據(jù)倉庫在技術(shù)上的工作過程是:()A、數(shù)據(jù)的抽取B、存儲和管理C、數(shù)據(jù)的表現(xiàn)D、數(shù)據(jù)倉庫設(shè)計(jì)E、數(shù)據(jù)的表現(xiàn)參考答案:ABCD46.視頻文件格式主流的有如下哪幾種文件格式()A、flvB、3gpC、mp4D、ts參考答案:ABCD47.市場需求分析包含幾個(gè)要素A、產(chǎn)品定位B、市場需求C、目標(biāo)人群D、推廣策略參考答案:ABCD48.人工網(wǎng)絡(luò)學(xué)習(xí)的兩個(gè)相似的算法:()A、梯度下降法則B、感知器訓(xùn)練法則C、遺傳算法D、連接分析參考答案:AB49.全分布模式有什么注意點(diǎn)?A、全分布模式通常被用于生產(chǎn)環(huán)境B、在生產(chǎn)環(huán)境里我們使用N臺主機(jī)組成一個(gè)Hadoop集群C、這里會存在單獨(dú)的Namenode運(yùn)行的主機(jī)D、這里會存在單獨(dú)的Datanode運(yùn)行的主機(jī)參考答案:ABCD50.區(qū)塊鏈特征包含有()A、分布式是區(qū)塊鏈技術(shù)區(qū)別于其他技術(shù)的核心要點(diǎn),數(shù)據(jù)由系統(tǒng)中維護(hù)功能的節(jié)點(diǎn)共同維護(hù)B、區(qū)塊鏈技術(shù)通過數(shù)字加密算法進(jìn)行編排,節(jié)點(diǎn)相互聯(lián)系,沒有一個(gè)中心節(jié)點(diǎn)可以被打擊和篡改,穩(wěn)定性和安全性更高C、公有區(qū)塊鏈系統(tǒng)是對所有人開放的,任何人均可以通過端口進(jìn)行查詢和開發(fā),系統(tǒng)是公開透明的,從而也更容易形成共識D、區(qū)塊鏈技術(shù)節(jié)點(diǎn)之間交換遵循一定的算法,通過程序規(guī)則自行判斷,并形成一種信任,即使是在匿名的情況下,也會對對方產(chǎn)生基本的信任參考答案:ABCD51.聯(lián)機(jī)分析處理包括()基本分析功能。A、聚類B、切片C、轉(zhuǎn)軸D、切塊參考答案:BCD52.利用中文文本繪制詞云時(shí),需要在anaoncda的基礎(chǔ)上安裝哪些工具包()。A、MatplotlibB、WordcloudC、Scikit-learnD、Jieba參考答案:BD53.可以用神經(jīng)網(wǎng)絡(luò)構(gòu)建的算法包括A、KNN最近鄰算法B、線性回歸C、邏輯回歸D、最小二乘法參考答案:BCD54.決策樹算法很容易出現(xiàn)過擬合,我們通常會使用一些剪枝手段來改善這一現(xiàn)象。對于sklearn.tree.DecisionTreeClassifier模型,下面這些參數(shù)哪些能起到剪枝的作用()A、criterionB、max_depthC、min_samples_splitD、min_impurity_split參考答案:BCD55.經(jīng)常與子查詢一起使用的運(yùn)算符有()。A、INB、EXISTSC、ANYD、ALL參考答案:ABCD56.行業(yè)分析數(shù)據(jù)采集方法有()。A、一手資料B、實(shí)地考察法C、專家訪談法D、收集媒體信息參考答案:ABCD57.根據(jù)集中性能管理應(yīng)用《物聯(lián)網(wǎng)端到端業(yè)務(wù)質(zhì)量分析》落地手冊,物聯(lián)網(wǎng)端到端定界的分析方法包括?()A、關(guān)聯(lián)分析B、回溯分析C、聚類分析D、根因分析參考答案:ABCD58.根據(jù)分析內(nèi)容和側(cè)重面不同,風(fēng)險(xiǎn)分析的方法有()A、敏感性分析B、概率分析C、經(jīng)濟(jì)效益分析D、盈虧平衡分析參考答案:ABD59.根據(jù)《終端分芯片版本精細(xì)化分析落地手冊》,終端分析呈現(xiàn)的指標(biāo)維度可以包括A、終端級B、版本級C、芯片級D、地市級參考答案:ABCD60.根據(jù)《中國移動(dòng)大數(shù)據(jù)安全管控分類分級實(shí)施指南》,以下哪些屬于敏感級數(shù)據(jù)A、實(shí)體身份證明B、自然人身份標(biāo)識C、網(wǎng)絡(luò)身份標(biāo)識D、終端設(shè)備標(biāo)識參考答案:BC61.打點(diǎn)模型把視頻業(yè)務(wù)分為接入階段與播放階段。其中接入階段又被細(xì)分為()A、初始緩沖準(zhǔn)備階段B、初始緩沖階段C、播放階段D、播放準(zhǔn)備階段參考答案:AB62.簇有效性的面向相似性的度量包括()。A、精度B、Rand統(tǒng)計(jì)量C、Jaccard系數(shù)D、召回率參考答案:BC63.從復(fù)雜度及價(jià)值高低兩個(gè)維度,可以將數(shù)據(jù)分析分為()A、描述性分析(DescriptiveAnalytics)B、診斷性分析(DiagnosticAnalytics)C、預(yù)測性分析(PredictiveAnalytics)D、規(guī)范性分析(PrescriptiveAnalytics)參考答案:ABCD64.常用的非線性函數(shù)除了多項(xiàng)式函數(shù)之外,還包括()。A、冪函數(shù)B、對數(shù)函數(shù)C、雙曲函數(shù)D、指數(shù)函數(shù)參考答案:ABCD65.常見的評估方法有()A、留出法B、交叉驗(yàn)證法C、采樣法D、自助法參考答案:ABD66.Weka是著名的開源機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘軟件,高級用戶可以通過哪些方式調(diào)用其分析組件A、Java編程B、命令行C、智能客服D、遠(yuǎn)程接口參考答案:AB67.TD-LTE室內(nèi)覆蓋面臨的挑戰(zhàn)()A、覆蓋場景復(fù)雜多樣B、信號頻段較高,覆蓋能力差C、雙流模式對室分系統(tǒng)工程改造要求較高D、與WLAN系統(tǒng)存在復(fù)雜的互干擾問題參考答案:ABCD68.S-GW的功能包括A、尋呼消息的發(fā)送B、數(shù)據(jù)的路由和傳播C、用戶面數(shù)據(jù)的加密D、NAC層信令的加密參考答案:BC69.S1接口支持的功能包括A、SGW承載業(yè)務(wù)管理B、NAS信令傳輸功能C、網(wǎng)絡(luò)共享功能D、LTE_ACTIVE態(tài)的UE在LTE系統(tǒng)內(nèi)移動(dòng)性管理功能參考答案:ABC70.LTE中常用的集中動(dòng)態(tài)資源調(diào)度算法A、輪詢調(diào)度算法RRB、最大載干比調(diào)度算法MaxC/IC、比例公平算法PFD、半持續(xù)調(diào)度算法SPS參考答案:ABC71.K-Means算法的缺點(diǎn)主要包括()A、初始點(diǎn)的選擇可能會影響最終的結(jié)果B、不能解決非凸數(shù)據(jù)問題C、容易受到噪聲點(diǎn)的影響D、K值很難確定參考答案:ABCD72.Hive數(shù)據(jù)倉庫有什么特點(diǎn)?A、hive能夠使用類SQL語言完成一定的數(shù)據(jù)分析需求B、hive的元數(shù)據(jù)可以存儲在mysql中C、hive的數(shù)據(jù)存儲在hdfs上能夠利用分布式存儲的優(yōu)勢D、hive支持隨機(jī)查詢參考答案:ABC73.hbase有哪些特點(diǎn)?A、hbase支持隨機(jī)查詢B、hbase支持?jǐn)?shù)據(jù)修改C、hbase支持多表鏈接D、hbase支持多master參考答案:ABD74.for變量in序列:執(zhí)行語句塊中序列可以是()A、數(shù)組B、列表C、元組D、字典參考答案:ABCD75.Attach成功率的指標(biāo)來源可能是A、網(wǎng)管系統(tǒng)B、網(wǎng)優(yōu)平臺C、集中性能平臺D、大數(shù)據(jù)平臺參考答案:ABCD76.Apriori算法的計(jì)算復(fù)雜度受()影響A、支持度閥值B、項(xiàng)數(shù)(維度)C、事務(wù)數(shù)D、事務(wù)平均寬度參考答案:ABCD77.Apriori算法的計(jì)算復(fù)雜度受()影響。A、支持度閥值B、項(xiàng)數(shù)(維度)C、事務(wù)數(shù)D、事務(wù)平均寬度參考答案:ABCD78.()這些數(shù)據(jù)特性都是對聚類分析具有很強(qiáng)影響的A、高維性B、規(guī)模C、稀疏性D、噪聲和離群點(diǎn)參考答案:ABCD79.()這些數(shù)據(jù)特性都是對聚類分析具有很強(qiáng)影響的。A、高維性B、規(guī)模C、稀疏性D、噪聲和離群點(diǎn)參考答案:ABCD判斷題1.字典的“鍵”必須是不可變的。A、正確B、錯(cuò)誤參考答案:A2.自動(dòng)適應(yīng)商務(wù)不斷變化的要求。A、正確B、錯(cuò)誤參考答案:A3.正則表達(dá)式中,字符“+”表示前面字符的零個(gè)或者無限個(gè)。A、正確B、錯(cuò)誤參考答案:B4.正則表達(dá)式模塊re的match()方法是從字符串的開始匹配特定模式,而search()方法是在整個(gè)字符串中尋找模式,這兩個(gè)方法如果匹配成功則返回match對象,匹配失敗則返回空值None。A、正確B、錯(cuò)誤參考答案:A5.噪聲和偽像是數(shù)據(jù)錯(cuò)誤這一相同表述的兩種叫法。A、正確B、錯(cuò)誤參考答案:B6.噪聲和偽像是數(shù)據(jù)錯(cuò)誤這一相同表述的兩種叫法。()A、正確B、錯(cuò)誤參考答案:B7.在主成分分析中,每個(gè)主成分都是原始變量的線性組合,且各個(gè)主成分之間互不相關(guān)。A、正確B、錯(cuò)誤參考答案:A8.在一元回歸分析中,用r表示因變量對自變量的相關(guān)系數(shù),當(dāng)|r|接近1時(shí),用回歸直線來表達(dá)因變量與自變量之間的線性關(guān)系就不準(zhǔn)確。A、正確B、錯(cuò)誤參考答案:B9.在模型樹的構(gòu)建過程中,分裂屬性的選擇以分裂后的各個(gè)子數(shù)據(jù)集中目標(biāo)屬性取值的標(biāo)準(zhǔn)差為依據(jù),將標(biāo)準(zhǔn)差作為一種誤差度量,將分裂前后標(biāo)準(zhǔn)差的減少量作為誤差的期望減少,稱為SDR。A、正確B、錯(cuò)誤參考答案:A10.在決策樹中,隨著樹中結(jié)點(diǎn)數(shù)變得太大,即使模型的訓(xùn)練誤差還在繼續(xù)減低,但是檢驗(yàn)誤差開始增大,這是出現(xiàn)了模型擬合不足的問題。A、正確B、錯(cuò)誤參考答案:B11.在決策樹中,隨著樹中結(jié)點(diǎn)數(shù)變得太大,即使模型的訓(xùn)練誤差還在繼續(xù)減低,但是檢驗(yàn)誤差開始增大,這是出現(xiàn)了模型擬合不足的問題。()A、正確B、錯(cuò)誤參考答案:B12.在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果就越差。()A、正確B、錯(cuò)誤參考答案:B13.在結(jié)構(gòu)化數(shù)據(jù)中進(jìn)行關(guān)聯(lián)分析發(fā)現(xiàn)其中的頻繁模式和關(guān)聯(lián)規(guī)則。于取值連續(xù)的屬性,首先將其離散化,然后將每個(gè)取值區(qū)間作為一個(gè)值,繼而轉(zhuǎn)化為“屬性=值”的形式。A、正確B、錯(cuò)誤參考答案:A14.在多元線性回歸模型中,變量顯著性檢驗(yàn)與方程顯著性檢驗(yàn)都要進(jìn)行,不能相互替代。A、正確B、錯(cuò)誤參考答案:A15.在Python中元組的值是不可變的,因此,已知x=([1],[2]),那么語句x[0].append(3)是無法正常執(zhí)行的。A、正確B、錯(cuò)誤參考答案:B16.在GBK和CP936編碼中一個(gè)漢字需要2個(gè)字節(jié)。A、正確B、錯(cuò)誤參考答案:A17.元組是不可變的,不支持列表對象的inset()、remove()等方法,也不支持del命令刪除其中的元素,但可以使用del命令刪除整個(gè)元組對象。A、正確B、錯(cuò)誤參考答案:A18.用最小二乘法求回歸方程,首先要求因變量與自變量之間存在線性相關(guān)關(guān)系。A、正確B、錯(cuò)誤參考答案:B19.已知列表x中包含超過5個(gè)以上的元素,那么語句x=x[:5]+x[5:]的作用是將列表x中的元素循環(huán)左移5位。A、正確B、錯(cuò)誤參考答案:B20.已知x是一個(gè)列表,那么x=x[3:]+x[:3]可以實(shí)現(xiàn)把列表x中的所有元素循環(huán)左移3位。A、正確B、錯(cuò)誤參考答案:A21.已知x=‘Python是一種非常好的編程語言’.encode(),那么表達(dá)式x.decode(‘gbk’)的值為’Python是一種非常好的編程語言’。A、正確B、錯(cuò)誤參考答案:B22.一種簡單的填補(bǔ)缺失值的方法為,將屬于同一類的對象的該屬性值的均值賦予此缺失值。A、正確B、錯(cuò)誤參考答案:A23.一元線性回歸的步驟:構(gòu)建包含因變量和自變量的訓(xùn)練集;通過散點(diǎn)圖確認(rèn)因變量和自變量之前的近似線性關(guān)系;計(jì)算系數(shù)和構(gòu)建模型;模型檢驗(yàn);利用模型進(jìn)行預(yù)測。A、正確B、錯(cuò)誤參考答案:A24.一個(gè)時(shí)間序列中包含長期趨勢、季節(jié)變動(dòng)、循環(huán)變動(dòng)和不規(guī)則變動(dòng),一般將四個(gè)因素一一分解之后進(jìn)行分析。A、正確B、錯(cuò)誤參考答案:B25.一般而言,定量預(yù)測方法在滿足下列三個(gè)條件時(shí)才能使用:一是能夠知道待測變量的過去值,二是信息可以量化,三是過去的變動(dòng)形式將持續(xù)到未來是一個(gè)合理的假設(shè)。A、正確B、錯(cuò)誤參考答案:A26.尋找模式和規(guī)則主要是對數(shù)據(jù)進(jìn)行干擾,使其符合某種規(guī)則以及模式。A、正確B、錯(cuò)誤參考答案:B27.序列數(shù)據(jù)沒有時(shí)間戳。()A、正確B、錯(cuò)誤參考答案:A28.信息熵給出了一種度量不確定性的方式,是用來衡量隨機(jī)變量不確定性的,熵就是信息的期望值。A、正確B、錯(cuò)誤參考答案:A29.小項(xiàng)目集的任一非空子集可能是小的也可能是大的A、正確B、錯(cuò)誤參考答案:A30.現(xiàn)實(shí)意義中的數(shù)據(jù)挖掘分析對象是真實(shí)的海量數(shù)據(jù);這些數(shù)據(jù)之間存在一定的邏輯關(guān)系;數(shù)據(jù)大多是模糊的、隨機(jī)的、不完整的、無意義的噪聲數(shù)據(jù)()A、正確B、錯(cuò)誤參考答案:B31.下列robots.txt文件中,User-agent后面跟的是爬蟲的名稱,Disallow后面跟著可以爬蟲的網(wǎng)頁A、正確B、錯(cuò)誤參考答案:B32.文件打開之后可以不關(guān)閉,因?yàn)槌绦驁?zhí)行完成后可以自動(dòng)關(guān)閉文件。A、正確B、錯(cuò)誤參考答案:B33.統(tǒng)計(jì)選修各門課程人數(shù)的SELECT語句為:SELECT課程號,SUM(學(xué)號)FROM成績GROUPBY課程號;。A、正確B、錯(cuò)誤參考答案:B34.通過數(shù)據(jù)離散化,可以實(shí)現(xiàn)縮減數(shù)據(jù)量的效果。A、正確B、錯(cuò)誤參考答案:A35.通過requests庫發(fā)送的HTTP請求,返回一個(gè)response對象。A、正確B、錯(cuò)誤參考答案:A36.特征提取技術(shù)并不依賴于特定的領(lǐng)域。()A、正確B、錯(cuò)誤參考答案:B37.數(shù)據(jù)挖掘主要構(gòu)建四大類模型包括:分類、聚類、預(yù)測和關(guān)聯(lián)()A、正確B、錯(cuò)誤參考答案:A38.數(shù)據(jù)庫類型是按照數(shù)據(jù)存取的方法來劃分的。A、正確B、錯(cuò)誤參考答案:B39.數(shù)據(jù)可視化可以便于人們對數(shù)據(jù)的理解。()A、正確B、錯(cuò)誤參考答案:A40.屬性A的熵值H(X,A)是為了獲取樣本關(guān)于屬性A的信息所需要付出的代價(jià)。A、正確B、錯(cuò)誤參考答案:A41.使用內(nèi)置函數(shù)open()打開文件時(shí),只要文件路徑正確就總是可以正確打開的。A、正確B、錯(cuò)誤參考答案:B42.使用del命令或者列表對象的remove()方法刪除列表中元素時(shí)會影響列表中部分元素的索引。A、正確B、錯(cuò)誤參考答案:A43.商業(yè)智能系統(tǒng)與一般交易系統(tǒng)之間在系統(tǒng)設(shè)計(jì)上的主要區(qū)別在于:后者把結(jié)構(gòu)強(qiáng)加于商務(wù)之上,一旦系統(tǒng)設(shè)計(jì)完畢,其程序和規(guī)則不會輕易改變;而前者則是一個(gè)學(xué)習(xí)型系統(tǒng),能自動(dòng)適應(yīng)商務(wù)不斷變化的要求。A、正確B、錯(cuò)誤參考答案:A44.如果一個(gè)正確象不強(qiáng)屬于任何簇,那么該正確象是基于聚類的離群點(diǎn)。A、正確B、錯(cuò)誤參考答案:A45.如果一個(gè)對象不強(qiáng)屬于任何簇,那么該對象是基于聚類的離群點(diǎn)。()A、正確B、錯(cuò)誤參考答案:A46.如果某產(chǎn)品的生產(chǎn)和銷售正處于市場成長期,其營銷重點(diǎn)應(yīng)該是延長產(chǎn)品壽命。A、正確B、錯(cuò)誤參考答案:B47.如果規(guī)則不滿足置信度閾值,則形如的規(guī)則一定也不滿足置信度閾值,其中是X的子集。A、正確B、錯(cuò)誤參考答案:A48.如果對象p到q是關(guān)于Eps和MinPts密度相連的,則對象q到p是關(guān)于Eps和MinPts密度相連的。A、正確B、錯(cuò)誤參考答案:A49.樸素貝葉斯分類基于貝葉斯定理的一種分類方法。A、正確B、錯(cuò)誤參考答案:A50.爬蟲是手動(dòng)請求萬維網(wǎng)網(wǎng)站且提取網(wǎng)頁數(shù)據(jù)的程序。A、正確B、錯(cuò)誤參考答案:B51.凝聚層次聚類法中每次簇的合并可以更改。A、正確B、錯(cuò)誤參考答案:B52.模型樹構(gòu)建之后,為了避免過度擬合,需要對模型樹進(jìn)行剪枝。A、正確B、錯(cuò)誤參考答案:A53.模型的具體化就是預(yù)測公式,公式可以產(chǎn)生與觀察值有相似結(jié)構(gòu)的輸出,這就是預(yù)測值。()A、正確B、錯(cuò)誤參考答案:A54.模式為對數(shù)據(jù)集的全局性總結(jié),它對整個(gè)測量空間的每一點(diǎn)做出描述;模型則對變量變化空間的一個(gè)有限區(qū)域做出描述。()A、正確B、錯(cuò)誤參考答案:B55.模糊查詢使用運(yùn)算符LIKE結(jié)合“%”和“_”實(shí)現(xiàn)。A、正確B、錯(cuò)誤參考答案:A56.邏輯回歸模型是用來解決回歸問題的。A、正確B、錯(cuò)誤參考答案:B57.離群點(diǎn)是一個(gè)實(shí)際觀測值,它與其他觀測值的差別如此之大,以至于懷疑它是由不同的機(jī)制產(chǎn)生的。A、正確B、錯(cuò)誤參考答案:A58.可以使用del刪除集合中的部分元素。A、正確B、錯(cuò)誤參考答案:B59.決策樹算法易于理解好實(shí)現(xiàn),且對缺失值、異常值和共線性都不敏感,是做分類預(yù)測的首選算法。A、正確B、錯(cuò)誤參考答案:B
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- (新教材)2026年滬科版八年級下冊數(shù)學(xué) 18.1 勾股定理 課件
- 崇義中學(xué)高一下學(xué)期第一次月考數(shù)學(xué)試題
- DB5107-T 137.1-2023 國家食品安全示范城市細(xì)胞工程建設(shè)規(guī)范 第1部分:食品生產(chǎn)行業(yè)典范企業(yè)
- 2025年辦公樓宇屋面防水協(xié)議
- 切割設(shè)備維護(hù)保養(yǎng)規(guī)范
- 基因編輯抗性機(jī)制
- 2025年AI心理咨詢的情感分析工具開發(fā) 共情對話技術(shù)支撐
- 2025年容錯(cuò)糾錯(cuò)機(jī)制建設(shè)研究
- 2025年高考化學(xué)有機(jī)推斷題真題深度剖析
- 專題03智慧養(yǎng)老-沖刺2025年高考地理熱點(diǎn)梳理情境對點(diǎn)練
- 2025年黨員黨的基本理論應(yīng)知應(yīng)會知識100題及答案
- 《汽車發(fā)動(dòng)機(jī)構(gòu)造(雙語課程)》習(xí)題(按項(xiàng)目列出)
- 婚慶公司發(fā)布會策劃方案
- 松陵一中分班試卷及答案
- 《小米廣告宣傳冊》課件
- 勞務(wù)派遣公司工作方案
- 物理趣味題目試題及答案
- 華師大版數(shù)學(xué)七年級上冊《4.3 立體圖形的表面展開圖》聽評課記錄
- 2023-2024學(xué)年四川省成都市高二上學(xué)期期末調(diào)研考試地理試題(解析版)
- 陜西單招數(shù)學(xué)試題及答案
- 應(yīng)收賬款債權(quán)轉(zhuǎn)讓協(xié)議
評論
0/150
提交評論