版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
試題說明
本套試題共包括1套試卷
答案和解析在每套試卷后
大數據開發(fā)基礎練習題及答案7(500題)
大數據開發(fā)基礎練習題及答案7
L[單選題]Hadoop作者
A)MartinFowler
B)KentBeck
C)Dougcutting
2.[單選題]()算法假設聚類結構能通過樣本分布的緊密程度確定
A)原型聚類
B)密度聚類
C)層次聚類
3.[單選題]下列關于在回歸分析中解釋變量與非解釋變量的說法正確的是()。
A)解釋變量和被解釋變量都是隨機變量
B)解釋變量為非隨機變量,被解釋變量為隨機變量
C)解釋變量和被解釋變量都為非隨機變量
D)解釋變量為隨機變量,被解釋變量為非隨機變量
4.[單選題]在有監(jiān)督學習中,我們如何使用聚類方法?
A)我們可以先創(chuàng)建聚類類別,然后在每個類別上用監(jiān)督學習分別進行學習
B)我們可以使用聚類“類別id”作為一個新的特征項,然后再用無監(jiān)督學習分別進行學習
C)在進行監(jiān)督學習之前,我們不能新建聚類類別
D)我們不可以使用聚類“類別id”作為一個新的特征項,然后再用監(jiān)督學習分別進行學習
5.[單選題]下列不屬于視覺通道表現力評價指標的是()。
A)精確性
B)可辨認性
C)可分離性
D)可轉換性
6.[單選題]下列關于Bagging的說法錯誤的是()。
A)各基分類器之間有較強依賴,不可以進行并行訓練
B)最著名的算法之一是基于決策樹基分類器的隨機森林
C)當訓練樣本數量較少時,子集之間可能有重疊
D)為了讓基分類器之間互相獨立,需要將訓練集分為若干子集
7.[單選題]()是一個觀測值,它與其他觀測值的差別如此之大,以至于懷疑它是由不同的機制產
生的。
A)邊界點
B)質心
C)離群點
D)核心點
8.[單選題]已知一組數據的協方差矩陣P,下面關于主分量說法錯誤的是()。
A)主分量分析的最佳準則是對一組數據進行按一組正交基分解,在只取相同數量分量的條件下,以均
方誤差計算截尾誤差最小
B)在經主分量分解后,協方差矩陣成為對角矩陣
C)主分量分析就是K-L變換
D)主分量是通過求協方差矩陣的特征值得到
9.[單選題]由于大數據要處理大量、非結構化的數據,所以在各處理環(huán)節(jié)中都可以采用()處理
A)串行
B)并行
C)邏輯
D)科學
10.[單選題]條件“IN(20,30,40)”表示()
A)年齡在20到40之間
B)年齡在20到30之間
C)年齡是20或30或40
D)年齡在30到40之間
IL[單選題]當合適的樣本容量很難確定時,可以使用的抽樣方法是()
A)有放回的簡單隨機抽樣
B)無放回的簡單隨機抽樣
C)分層抽樣
D)漸進抽樣
12.[單選題]條件年齡BETWEEN15AND35表示年齡在15至35之間,且()
A)不包括15歲和35歲
B)包括15歲但不包括35歲
C)包括15歲和35歲
D)包括35歲但不包括15歲
13.[單選題](_)由兩層神經元組成。
A)M-P模型
B)神經網絡
C)神經元
D)感知機
14.[單選題]神經網絡研究屬于下列()學派
A)符號主義
B)連接主義
C)行為主義
D)都不是
15.[單選題]若a=np.array([[7,2,3],[8,5,6]]),則Print(np.sort(a,1))的結果為(_)。
A)[[723][856]]
B)[[237][568]]
C)[235678]
D)[[235][678]]
16.[單選題]卷積神經網絡能通過卷積以及池化等操作將不同種類的鳥歸為一類,下列關于卷積神經
網絡能達到該效果的原因的描述不正確的是()。
A)同樣模式的內容(如鳥嘴)在圖像不同位置可能出現
B)池化之后的圖像主體內容基本不變
C)不同種類鳥的相同部位(如鳥嘴)形狀相似
D)池化作用能使不同種類鳥變得相似
17.[單選題]下面哪個不是HadoOP生態(tài)系統(tǒng)的組件:()
A)HDFS
B)SQLServer
OMapReduce
D)HBase
18.[單選題]以下哪個不是FIUme的核心組件:()
A)數據塊(BloCk)
B)數據源(Source)
C)數據通道(Channel)
D)數據槽(Sink)
19.[單選題]print()是通過參數(一)來設定以什么結尾。
A)objects
B)sep
C)end
D)file
20.[單選題]后剪枝是先從訓練集生成一顆完整的決策樹,然后()對非葉結點進行考察
A)自上而下
B)在劃分前
C)禁止分支展開
D)自底向上
21.[單選題]輸入圖像為32x32,經過步長為1,不進行Padding,卷在只核為5x5的卷積層后,得到的
特征圖尺寸是()
A)28x28
B)27x27
C)29x29
D)32x32
22.[單選題]檢測一元正態(tài)分布中的離群點,屬于異常檢測中的基于()的離群點檢測。
A)統(tǒng)計方法
B)鄰近度
C)密度
D)機器學習技術
23.[單選題]若要表示“1(XX
A)x25
B)x>10orX
C)x>10andx
D)x>10andx>25
24.[單選題]關于boosting下列說法錯誤的是()
A)Boosting方法的主要思想是迭代式學習
B)訓練基分類器時采用并行的方式
C)測試時,根據各層分類器的結果的加權得到最終結果
D)基分類器層層疊加,每一層在訓練時,對前一層基分類器分錯的樣本給予更高的權值
25.[單選題]執(zhí)行以下代碼段IiStl=[1,5,9]Print(SUm(IiStI))時,輸出為()。
A)l
B)5
09
D)15
26.[單選題]第一個提出大數據概念的公司是()。
A)微軟公司
B)谷歌公司
C)臉譜公司
D)麥肯錫公司
27.[單選題]下列算法中屬于圖像平滑處理的是()。
A)梯度銳化
B)直方圖均衡化
C)中值濾波
D)LaPlaCian增強
28.[單選題]關于“三型兩網”建設,以下()說法不正確:
A)以建設泛在電力物聯網為主攻方向
B)進一步改造提升傳統(tǒng)業(yè)務
C)發(fā)揮電網企業(yè)的平臺和資源優(yōu)勢,著力拓展新市場、開辟新領域、打造新業(yè)務
D)大力開拓互聯網經濟這一巨大藍海市場
29.[單選題]下列關于數據可視化的描述,哪個是錯誤的?()
A)數據可視化是指將大型數據集中的數據以圖形圖像形式表示
B)利用數據分析和開發(fā)工具發(fā)現其中未知信息的處理過程
C)數據可視化技術的基本思想是將數據庫中每一個數據項作為單個圖元素表示
D)將數據的各個屬性值以一維數據的形式表示
30.[單選題]若采用留出法將數據集D劃分為訓練集S和測試集T,其中D包含1300個樣本,S包含700個
樣本,模型在T上有60個樣本分類錯誤,那么該模型的精度為(—)。
A)95.40%
B)90%
010%
D)4.90%
31.[單選題]input()函數的返回值是?
A)數值型數據
B)字符型數據
C)邏輯型數據
D)日期型數據
32.[單選題]統(tǒng)籌感知層、()和平臺層關鍵技術攻關,協同輸變電物聯網、配電物聯網等相關建
設任務,聯合打造全面感知、高效處理、應用靈活的企業(yè)級智慧物聯體系
A)網絡層
B)數據層
C)應用層
D)科技層
33.[單選題]開發(fā)人員在使用大數據計算服務的圖計算時,主要的輸入數據在表中,另外還有一些非
結構化的配置信息存在一個本地文件中,則可以采用()方式使得這些配置信息在圖計算過程中可
用。
A)將這個配置信息做為resource上傳到大數據計算服務中,在圖計算過程中可以讀取resource中的
數據
B)輸入輸出只能是TabIe,必須要把這部分數據放到表中
C)在group程序中直接讀取本地的文件信息
D)輸入只能是一張表,因此無法滿足這個場景
34.[單選題]下列關于SparkStreaming和Streaming比較說法不正確的是?
A)SparkStreaming是一個微批處理框架,事件需要積累到一定量時才進行處理
B)Streaming的執(zhí)行邏輯是即時啟動,運行完后再回收
C)SparkStreaming的吞吐量大約是Streaming的2-5倍
D)SparkStreaming事件處理時延比Streaming更高
35.[單選題]在WebHCat架構中,用戶能夠通過安全的HTTPS協議執(zhí)行以下()操作。
A)執(zhí)行HiVeDDL操作
B)運行MaPRedUCe任務
C)運行HiVeSQL任務
D)以上全部正確
36.[單選題]在MaPRedUCe的應用程序開發(fā)中,下列()JAVA類負責管理和運行一個計算任務。
A)lob
B)Context
OFileSystem
D)Configuration
37.[單選題]在全文本搜索的函數中,用于指定被搜索的列的是()
A)MATCHO
B)AGAINST()
OFULLTEXTO
D)REGEXP()
38.[單選題]關于循環(huán)神經網絡設計的敘述中,錯誤的是()
A)能處理可變長皮的序列
B)基于圍展開思想
C)基于參數共享思想
D)循環(huán)神經網絡不可應用于圖像數據
39.[單選題]()不是長短時記憶神經網絡三個門中的一個門。
A)輸入門
B)輸出門
C)遺忘門
D)進化門
40.[單選題]下面屬于圖計算技術的是:()
A)Pregel
B)Dremel
C)Impala
D)DStream
41.[單選題]下列語句描述錯誤的是。
A)可以通過CLl方式、Java
B)SqoOP底層會將SqOoP命令轉換為MaPRedUCe任務,并通過SqooP連接器進行數據的導入導出操作。
C)SqoOP是獨立的數據遷移工具,可以在任何系統(tǒng)上執(zhí)行。
D)如果在HadoOP分布式集群環(huán)境下,連接MySQL服務器參數不能是IOCalhoSt或127.0.0.Io
42.[單選題]在Python中可以通過調用random庫來產生隨機數。語a=random.randint(1,99),并賦值
給變量a
A)隨機產生一個1~99的小數
B)隨機產生一個「99的整數
C)產生一個值為99的整數
D)隨機產生一個「99的無理數
43.[單選題]以下哪一項不屬于HadooP可以運行的模式()。
A)單機(本地)模式
B)偽分布式模式
C)互聯模式
D)分布式模式
44.[單選題]根據《大數據風控平臺項目操作手冊》,()頁面分為客戶基礎信息、投資信息、法人
關聯、涉訴信息、輿情信息、稅務信息、環(huán)保信息、受限資產、行政處罰、風險名單、資質信息、
招投標信息、財務智能分析、企業(yè)信用智能分析報告、貸后預警信號模塊。
A)全景風險視圖
B)B.擔保圈鏈
C)C.集團圖譜
D)D.最終受益人
45.[單選題]留出法直接將數據集劃分為()個互斥的集合。
A)一
B)二
C)三
D)四
46.[單選題]HDFS中的主備仲裁,是由:()組件控制的。
A)ZookeeperFailoverController
B)NodeManager
C)ResourceManager
D)HDFSClient
47.[單選題]請閱讀下面的代碼:defmanyparam(numone,numtwo,*args):
print(args)many_param(11,22,33,44,55)運行代碼,輸出結果為()。
A)(11,22,33)
B)(22,33,44)
C)(33,44,55)
D)(11,22)
48.[單選題]以下哪個不屬于Hadoop中MaPRedUCe組件的特點?
A)高容錯
B)良好的擴展性
C)實時計算
D)易于編程
49.[單選題]Zookeeper啟動時會最多監(jiān)聽幾個端口()
A)l
B)2
03
D)4
50.[單選題]下列算法中屬于圖像平滑處理的是()。
A)、梯度銳化
B)、直方圖均衡化
C)、中值濾波
D)、LA、plA?C、iA、n增強
51.[單選題]下列關于Python的說法中,錯誤的是()
A)Python是從ABC發(fā)展起來的
B)Python是一門高級的計算機語言
C)Python是一門只面向對象的語言
D)Python是一種代表簡單主義思想的語言
52.[單選題]python解釋器的提示符為。O
A)>
B)?
C)>>>
D)#
53.[單選題]下列關于分類算法描述正確的是Oo
A)分類算法的標簽和回歸算法完全相同
B)分類算法和聚類算法-樣都沒有標簽
C)分類算法的評價需要參考真實標簽
D)分類算法評價可以用均方誤差來判斷
54.[單選題]在Hadoop生態(tài)系統(tǒng)中,()主要解決的是日志類數據的收集和處理問題。
A)Mahout
B)Flume
C)Sqoop
D)HBase
55.[單選題]數據清洗的方法不包括()。
A)缺失值處理
B)噪聲數據清除
C)一致性檢查
D)重復數據記錄處理
56.[單選題]下面關于機械思維的核心思想,描述錯誤的是:()
A)世界變化的規(guī)律是確定的
B)世界變化的規(guī)律是無法確定的
C)規(guī)律不僅是可以被認識的,而且可以用簡單的公式或者語言描述清楚
D)這些規(guī)律應該是放之四海而皆準的,可以應用到各種未知領域指導實踐
57.[單選題]關于HiVe自定義UDF描述錯誤的是?
A)永久函數,可以在多個會話中使用,不需要每次創(chuàng)建
B)用戶定義表生成函數UDTF,用于接受多個輸入數據行,并產生一個輸入數據行
C)臨時函數,只能在當會話使用,重啟會話后需要重新創(chuàng)建
D)普通的UDF,用于操作單個數據行,且產主一個數據行為輸出
58.[單選題]有關MaPRedUce,下面哪個說法是正確的()
A)它提供了資源管理能力
B)它是開源數據倉庫系統(tǒng),用于查詢和分析存儲在HadooP中的大型數據集
C)它是HadoOP數據處理層
D)它是一個理想的數據處理框架,難以實現
59.[單選題]有N個樣本,一般用于訓練,一般用于測試若N增大,則訓練誤差和測試誤差之間的差距
會()
A)增大
B)減小
C)無法確定
D)無明顯變化
60.[單選題]假設擁有一個已完成訓練的、用來解決車輛檢測問題的深度神經網絡模型,訓練所用的
數據集由汽車和卡車的照片構成,而訓練目標是檢測出每種車輛的名稱(車輛共有10種類型)。
現在想要使用這個模型來解決另外一個問題,問題數據集中僅包含一種車(福特野馬)而目標變?yōu)?/p>
定位車輛在照片中的位置,則應采取的方法是()。
A)除去神經網絡中的最后一層,凍結所有層然后重新訓練
B)對神經網絡中的最后幾層進行微調,同時將最后一層(分類層)更改為回歸層
C)使用新的數據集重新訓練模型
D)所有答案均不對
61.[單選題]數據加工的本質是O
A)、探索數據分析
B)、將低層次數據轉換為高層次數據
0、處理數據
D)、生成新的數據
62.[單選題]在分布式環(huán)境系統(tǒng)中,引入()可以防止內存數據就會丟失
A)HLog
B)HRegion
C)ZooKeeper
D)Server
63.[單選題]下列關于LSTM的說法錯誤的是()。
A)LSTM中存在sigmoid函數
B)LSTM中存在tanh函數
OLSTM又稱長短時記憶網絡
D)RNN是LSTM的變種
64.[單選題]()是Spark中的抽象數據模型。
A)RDD
B)Scheduler
C)Storage
D)Shuffle
65.[單選題]查找表結構用以下哪一項()
A)FIND
B)SELETE
OALTER
D)DESC
66.[單選題]在ZOOkeePer中,路徑由()字符串構成。
A)Unicode
B)UTF-8
OGBK
D)ASCII
67.[單選題]在有N個節(jié)點FusionInsightHD集群中部署HBase時,推薦部署答案:個HMaster
進程,
()個RegionSerVer進程?
A)3,N
B)N,N
02,N
D)2,2
68.[單選題]若b=np.array([l,2,3,4]),則b.shape的輸出結果為(—)。
A)4
B)[4,]
0(4,1)
D)(4,)
69.[單選題]np.full_like()的作用是(一)。
A)創(chuàng)建形狀一樣但指定數值的矩陣
B)創(chuàng)建全1矩陣
C)創(chuàng)建對角矩陣
D)復制矩陣
70.[單選題]如果線性回歸模型中的隨機誤差存在異方差性,那么參數的OLS估計量是
A)無偏的,有效的
B)無偏的,非有效的
C)有偏的,有效的
D)有偏的,非有效的
71.[單選題]下列關于線性回歸分析中的殘差說法正確的是()。
A)殘差均值總是為零
B)殘差均值總是約等于零
C)殘差均值總是大于本
D)以上答案都不正確
72.[單選題]圖像的形態(tài)學處理方法包括()。
A)圖像增強
B)圖像銳化
C)圖像分割
D)腐蝕
73.[單選題]根據《大數據風控平臺項目操作手冊》,貸后預警處置,是基于O維度對目標客戶的
同一批次貸后預警信號一并處置,并非是基于信號維度,逐一對信號進行處置。
A)客戶
B)B.信號
C)C.支行
D)D?分行
74.[單選題]以下哪個不屬于數據治理內容的是()。
A)理解自己的數據
B)行為規(guī)范的制定
C)崗位職責的定義
D)獲得更多的數據
75.[單選題]下面關于“領域務實知識”相關描述不正確的有(_)。
A)”領域務實知識”是對數據科學家的特殊要求
B)領域務實知識具有顯著的面向領域性
C)領域務實知識是數據科學的理論基礎
D)在組建團隊時,不需重視領域專家的參與
76.[單選題]以下選項描述錯誤的是()。一
A)等值連接的關系需要具有數目相等且可比的屬性組
B)自然連接的結果是等值連接去除重復的屬性組
C)除法可看作是笛卡爾積的逆運算
D)以上說法都不正確
77.[單選題]下面關于機器學習相關描述不正確的有(_)。
A)機器學習的主要議題是如何實現和優(yōu)化機器的自我學習
B)機器學習的基本思路是以訓練集為輸入,通過機器學習算法讓機器學習到能夠處理更多數據的能
力
C)AIPhaGo的核心技術是深度學習與增強學習
D)機器學習的只能是預定義的
78.[單選題]對數組中的某個元素進行修改時,計算機對其的操作是(_)。
A)復制該數組后再修改
B)直接在原數組中修改
C)修改該數組后再復制
D)刪除該數組后,重新創(chuàng)建
79.[單選題]下列關于MaPRedUCe計算原理敘述不正確的一項是()。
A)將大數據集劃分為小數據集,小數據集劃分為更小數據集
B)將最終劃分的小數據分發(fā)布到集群節(jié)點上
C)以串行的方式完成計算處理
D)將計算結果遞歸融匯,得到最后的結果
80.[單選題]以下對VolUme相關描述不正確的是()。
A)VOIUme是指數據量大
B)就目前而言,當數據量達到拍字節(jié)以上時,一般稱為大數據
C)大數據時間分布是均勻的
D)數據量大是相對計算與存儲能力而定的
81.[單選題]()算法是決策樹學習的基本算法,其他多數決策樹學習方法都是它的變體
A)Find-S
B)KNN
C)概念
D)ID3
82.[單選題]MapJoin適用于()的連接情況。
A)有一份數據比較小
B)兩份數據都比較小
C)兩份數據都比較大
D)沒有嚴格的規(guī)定
83.[單選題]緩解過擬合的一個辦法是允許支持向量機在一些樣本上出錯,()形式適合這種方法
O
A)硬間隔支持向量機
B)軟間隔支持向量機
C)線性核函數支持向量機
D)多項式核函數支持向量機
84.[單選題]Python安裝擴展庫常用的是()工具。
A)pyinstall
B)pip
C)pop
D)post
85.[單選題]以下內容符合物體識別任務的是Oo
A)不能對圖像進行壓縮或剪裁
B)遵守誤差最小準則和最佳近似準則
C)可以不指定分類的類別數量
D)事先給定樣本的分布特征
86.[單選題]使用MaXCOmPUteSQL更新數據時,以下說法中不正確的是:()。
A)使用動態(tài)分區(qū)插入數據時,需在語句中指定分區(qū)值,且只要出現在SeleCt子句中最后一個位置即
可,也可為該值指定一個易于識別的別名
B)進行insert更新數據操作時,源表與目標表的對應關系依賴于在SeIeCt子句中列的順序,而不是
表與表之間列名的對應關系
0向某個具體的分區(qū)插入數據時,分區(qū)列不允許出現在SeleCt列表中
D)支持在一個語句中實現讀取一次寫入多個目標表的操作
87.[單選題]可以對大數據進行深度分析的工具是()。
A)淺層神經網絡
B)Scala
C)深度學習
D)MapReduce
88.[單選題]下列表達式的值為TrUe的是
A)5+4j>2-3j
B)3>2>2
C)3>=3
D),abc,>xyz,
89.[單選題]Kafka中數據從PrOdUCer到BrOker和BrOker到ConSUnIer分別是那種傳遞方式
A)pullpush
B)pullpull
C)pushpush
D)pushpull
90.[單選題]當try語句中沒有任何錯誤信息時,一定不會執(zhí)行O語句。
A)try
B)else
C)finally
D)except
91.[單選題]數據資產應用以安全可控為前提,按照()的原則,落實安全與保密責任。
A)誰經手,誰使用,誰負責
B)誰主管,誰負責
C)誰使用,誰主管,誰負責
D)誰錄入,誰使用,誰負責
92.[單選題]下列不屬于決策樹常見算法的是()
A)ID3
B)CART
C)C4.5
D)FPGrowth
93.[單選題]下列關于bootstrap說法正確的是(___)o
A)從總的M個特征中,有放回地抽取m個特征(m<;M)
B)從總的M個特征中,無放回地抽取m個特征(m<;M)
C)從總的N個樣本中,有放回地抽取n個樣本(n<;N)
D)從總的N個樣本中,無放回地抽取n個樣本(n<;N)
94.[單選題]在hadoop配置中yarn-site.xml作用是()
A)用于定義系統(tǒng)級別的參數
B)用于名稱節(jié)點和數據節(jié)點的存放位置
C)用于配置
D)配置
95.[單選題]假設一種基因同時導致兩件事情:一是使人喜歡抽煙,二是使這個人患肺癌。這句話種
基因與抽煙.肺癌之間是()關系,而吸煙和肺癌則是()關系。
A)因果;相關
B)相關;因果
C)并列;相關
D)因果;并列
96.[單選題]運用機器學習的相關技術對詞語的情感進行分類。機器學習的方法通常需要先讓分類模
型學習訓練數據中的規(guī)律,然后用訓練好的模型對測試數據進行預測。以上描述屬于哪種類型的詞
語級情感分析
A)基于詞典的分析方法
B)基于網絡的分析方法
C)基于語料庫的分析方法
D)其他
97.[單選題]假設有個keyvalue為ID:name,按先后順序寫入四個
keyvalue:OOl:li,001:mary,001:delete,001:lily,請問SCan"ttt”{versions〉=2}會返
回哪幾條數據?
A)A001:Lily
B)B001:delete,001:Lily
C)C001:mary,001:delete,001:lily
D)D001:mary,001:lily
98.[單選題]數據科學家可能會同時使用多個算法(模型)進行預測,并且把這些算法的結果集成起
來進行最后的預測(集成學習),下列關于集成學習的說法正確的是()。
A)單個模型之間具有高相關性
B)單個模型之間具有低相關性
C)在集成學習中使用平均權重而不是投票會比較好
D)單個模型都用同一個算法
99.[單選題]下列哪一個選項不是StrUCtUredStreaming支持的SOUrCe數據源?
A)Socket
B)Kafka
OHDFS
D)Hive
100.[單選題]下列哪種業(yè)務場景中,不能直接使用Reducer充當Combiner使用()
A)sum求和
B)max求最大值
C)count求計數
D)avg求平均
101.[單選題]Hive在處理數據時,默認的分隔map元素的key和VaIUe的分隔符是()
A)^A
B)^B
C)^C
D)?n
102.[單選題]為了應對大數據時代的信息安全問題,下列措施中不恰當的做法是OO
A)遵循歷史經驗
B)事前主動預防
C)事中即時應對
D)事后總結改進
103.[單選題]()是Spark的核心數據結構。
A)彈性分布式數據集
B)列表
C)元組
D)字典
104.[單選題]安全設備中的安全日志必須存放()個月以上,以備審計時使用。
A)l
B)2
03
D)6
105.[單選題]卷積的過程是讓過濾器在圖像上()。
A)縮放
B)剪切
C)鏡像對稱
D)窗口滑動
106.[單選題]請選擇計算231-1的Python表達式:
A)power(2,31)-1
B)2^31-l
C)231-l
D)2(31)-l
107.[單選題]下面哪個FIUme功能可以給EVent添加Header信息。
A)數倉與大數據的并行架構
B)低成本高擴震性的傳統(tǒng)數倉架構
C)以數倉為核心,大數據平臺為延伸的融合架構
D)大數據平臺為核心的架構
108.[單選題]數據管理成熟度模型中成熟度等級最高的是()。
A)已優(yōu)化級
B)已測量級
C)已定義級
D)已管理級
109.[單選題]數據安全管理是通過制定和實施相關安全策略和措施,確保數據在收集、傳輸、存儲
、處理、使用和O各環(huán)節(jié)的安全。
A)歸檔
B)發(fā)布
C)推廣
D)銷毀
110.[單選題]若a=np.array([5,1,2,3]),a.sort(),則數組a的結果是()。
A)[5,1,2,3]
B)[1,2,3,5]
O[3,2,1,5]
D)ll
IlL[單選題]因業(yè)務需要,確需向境外提供數據的,應當按照國家有關部門制定的辦法進行
O,并經公司保密辦與業(yè)務主管部門審批,視情況向國家有關部門報備。
A)安全評估
B)規(guī)模評估
C)質量鑒定
D)分類處理
112.[單選題[StructuredStreaming不支持以下哪種計算時間?
A)處理時間
B)事件時間
C)結束時間
D)注入時間
113.[單選題]以下哪項方法不屬于漢語分詞方法?()
A)、雙向掃描法
B)、正向最大匹配法
C)、逐詞遍歷法
D)、詞向量匹配法
114.[單選題]Hadoop環(huán)境下HDFS系統(tǒng)中的NameNode實現的功能是()。
A)管理文件系統(tǒng)的命名空間
B)管理存儲空間
C)分配算力
D)調控算法
115.[單選題]根據《大數據風控平臺項目操作手冊》,財務智能分析中的國資委行業(yè)標準值比對模
塊,僅支持企業(yè)O與國資委績效標準值的比對。
A)年報
B)B.半年報
C)C.季報
D)D.月報
116.[單選題]下列關于支持向量機優(yōu)化性問題的形式說法正確的是(_)。
A)它是一個凸二次規(guī)劃問題
B)它是一個凸一次規(guī)劃問題
C)它是一個凹二次規(guī)劃問題
D)它是一個凹一次規(guī)劃問題
117.[單選題]關于MaXComPUte用戶和權限,說法正確的是:()。
A)每一個項目空間在創(chuàng)建后,需要手工創(chuàng)建一個admin的角色,并且為該角色授予了確定的權限
B)admin角色可以將admin權限指派給用戶
C)Admin可以設定項目空間的安全配置,但是不能修改項目空間的鑒權模型
D)MaXCOmPUte目前不支持在項目空間中徹底移除一個用戶及其所有權限數據。
118.[單選題]在能源互聯網產業(yè)生態(tài)架構中,O將不僅作為能源傳輸、轉換的樞紐,更是承載各
種服務,連接各方利益,實現信息交互、共享,支撐各種交易的平臺。
A)電能
B)電網
C)電廠
D)電力設備制造企業(yè)
119.[單選題]下列關于DMM(數據管理成熟度模型)中已管理級基本特點的描述正確的是()。
A)組織機構的數據管理關鍵活動能夠根據結構自身的反饋以及外部環(huán)境的變革進行不斷優(yōu)化
B)組織機構已用定量化的方式管理其關鍵過程的執(zhí)行過程
C)組織機構只在項目管理過程中執(zhí)行了DM給出的關鍵過程,而缺乏機構層次的統(tǒng)籌與管理
D)組織機構的數據管理工作超出了項目管理的范疇,由組織機構統(tǒng)一管理其數據管理關鍵過程
120.[單選題]數據科學項目應遵循一般項目管理的原則和方法,涉及()。
A)整體、范圍、時間、成本、質量、溝通、風險、宣傳、消費
B)整體、范圍、時間、成本、質量、人力資源、溝通、風險、采購
C)整體、范圍、時間、成本、質量、人力資源、運維、采購、宣傳
D)整體、范圍、時間、成本、質量、人力資源、采購、宣傳、運維
121.[單選題]下列不屬于數據科學與統(tǒng)計學區(qū)別的是()。
A)數據科學中的數據不僅僅是數值
B)數據科學關注的不僅僅是“單一學科”問題,超出了數學、統(tǒng)計學、計算機科學等單一學科的范
疇
C)數據科學不僅僅是理論研究,也不是純領域實務知識,它關注和強調的是二者的結合
D)數據科學和統(tǒng)計學中的計算一樣,僅僅是加減乘除
122.[單選題]ADS創(chuàng)建表組時,可以指定表組的副本數,關于副本數的說法,以下()是正確的。
A)表組的副本數越多,可以一定程度的增加ADS的最大承受的QPS
B)表組的副本數為1時,寫入數據會最快,相比副本較多的情況,在數據導入時不可用時間會更短
C)表組的副本數最小值為2
D)表組的副本數越少,表組的可用性會越高
123.[單選題]1104報表系統(tǒng)是向那個部門報送的行業(yè)監(jiān)管平臺
A)中國人民銀行
B)國家外匯管理局
C)省聯社
D)銀監(jiān)會
124.[單選題]Apriori算法的核心思想是()。
A)通過頻繁項集生成和情節(jié)的向下封閉檢測兩個階段來挖掘候選集
B)通過候選集生成和情節(jié)的向下封閉檢測兩個階段來挖掘頻繁項集
C)數據集中包含該項集的數據所占數據集的比例,度量一個集合在原始數據中出現的頻率
D)若某條規(guī)則不滿足最小置信度要求,則該規(guī)則的所有子集也不滿足最小置信度要求
125.[單選題]劃分聚類算法是一種簡單的較為基本的重要聚類方法它的主要思想是通過將數據點集
分為()個劃分,并使用重復的控制策略使某個準則最優(yōu)化,以達到最終的結果
A)D
B)K
C)E
D)F
126.[單選題]黑客通過一臺聯網的筆記本電腦就可以控制一架客機,這反映出OO
A)筆記本電腦的網絡攻擊功能越來越強
B)大數據環(huán)境下信息安全威脅無處不在
C)大型客機的信息安全防御能力變弱
D)飛行中的大型客機應該斷開一切通信
127.[單選題]以下關于不帶參數的函數的格式書寫正確的是()
A)defcheck
B)defIcheck()
C)defcheck():
D)defcheck()
128.[單選題]令N為數據集的大?。圩?設訓練樣本(xi,yi),N即訓練樣本個數],d是輸入空間的維數
(注:d即向量Xi的維數)。硬間隔SVM問題的原始形式[即在不等式約束(yi(wTxi+b)21)下最小化
(1/2)wTw]在沒有轉化為拉格朗日對偶問題之前,是()。
A)一個含N個變量的二次規(guī)劃問題
B)一個含N+1個變量的二次規(guī)劃問題
C)一個含d個變量的二次規(guī)劃問題
D)一個含d+1個變量的二次規(guī)劃問題
129.[單選題]把圖像分割問題與圖的最小割(mincut)問題相關聯的方法是()。
A)基于圖論的分割方法
B)分水嶺算法
OSLIC算法
D)基于閾值的方法
130.[單選題]loader頁面是基于開源()的圖形化數據遷移工具。
A)Hue
B)Sqoop
C)Kettle
D)Hadoop
131.[單選題]在HBaSe的專用過濾器中,單列排除過濾器是()
Λ)SinglevalueExcludeFilter
B)SinglecolumnExcludeFilter
C)SinglecolumnvalueExcludeFilter
D)ColumnvalueExcludeFilter
132.[單選題]在LogiStiCRegression中,如果同時加入LI和L2范數,不會產生什么效果
A)以做特征選擇,并在一定程度上防止過擬合
B)能解決維度災難問題
C)能加快計算速度
D)可以獲得更準確的結果
133.[單選題]商品的()用于在搜索和瀏覽列表時更準確的找到該商品。~
A)關鍵詞
B)描述
C)提示
D)詳情
134.[單選題]用決策樹法訓練大量數據集時,()最節(jié)約時間
A)增加樹的深度
B)增加學習率
C)減少數的深度
D)減少樹的個數
135.[單選題]關于準確率,精確率與召回率,下列說法錯誤的是:
A)準確率=所有預測正確的樣本/總的樣本
B)精確率=將正類預測為正類/所有預測為正類
C)召回率=將正類預測為正類/所有正真的正類
D)F值=精確率*召回率/(正確率+召回率)
136.[單選題]關于ADS的聚集列,下列說法不正確的是:()。
A)如果用戶的查詢QUery的條件中會指定聚集列的內容或范圍,那么這樣的查詢性能便會有較大的提
升
B)聚集列可以在建表后進行修改,修改后DB會在后臺自動刷新數據
C)一個分區(qū)內聚集列內容相同的數據會盡可能的分布在同樣的區(qū)塊內存
D)創(chuàng)建表時可以指定一列或者若干列作為聚集列
137.[單選題]在k近鄰學習算法中,隨著k的增加,上界將逐漸降低,當k區(qū)域無窮大時,上界和下界
碰到一起,k近鄰法就達到了()
A)貝葉斯錯誤率
B)漸進錯誤率
C)最優(yōu)值
D)上界
138.[單選題]輸人圖像已被轉換為大小為28x28的矩陣和大小為7x7的步幅為1的核心/濾波十器卷和
提陣的大小是()
A)22x22
B)21x21
028x28
D)7x7
139.[單選題]下列敘述正確的是()。
A)continue語句的作用是結束整個循環(huán)的執(zhí)行
B)只能在循環(huán)體內使用break語句
C)在循環(huán)體內使用break語句或continue語句的作用相同
D)從多層循環(huán)嵌套中退出時,只能使用goto語句
252
140.[單選題]當前社會中,最為突出的大數據環(huán)境是()。
A)互聯網
B)物聯網
C)綜合國力
D)自然資源
141.[單選題]根據《大數據風控平臺項目操作手冊》,在征信報告頁面,點擊底部【打印報告】按
鈕,彈出打印機選擇頁面。用戶在彈出的打印機選擇頁面,選擇O項,點擊【打印】按鈕,選擇
保存路徑,即可保存PDF版本征信報告文件到指定路徑。
A)Fax
B)B.MicrosoftprinttoPDF
C)C.MicrosoftXPSDocumentWriter
D)D.OneNote
142.[單選題]下列關于大數據的分析理念的說法中,錯誤的是()。
A)在數據基礎上傾向于全體數據而不是抽樣數據
B)在分析方法上是注重相關分析而不是因果分析
C)在分析效果上更追求效率而不是絕對精確
D)在數據規(guī),模上強調相對數據而不是絕對數據
143.[單選題]執(zhí)行以下代碼段Print("D",end=')print("C",end=')print("B",end="
')print("A",end='')時,輸出為(____.)o
A)D,C,B,A
B)DCBΛ
ODCBA
D)DCBΛ
144.[單選題]HadoopMapReduce2.0中,()負責資源的管理和調度。
A)JobTracker
B)YARN
C)TaskTracker
D)ApplicationMaster
145.[單選題]關于MaPRedUCe中的鍵值對,下面陳述正確的是。
A)Key類必須實現Writable
B)Key類必須實現WritabIeConIParabIe
C)ValUe類必須實現WritableeOmParable
D)ValUe類必須繼承WritableComparab1e
146.[單選題]以下不屬于數據庫的是
A)MongoDB
B)Spark
OMySQL
D)HBase
147.[單選題]執(zhí)行以下代碼段defget_formatted_name(first_name,last_name):full_name=
first_name+''+last_namereturnfull_name.titleOmusician=
,,,
get-formatted-name(jimi,'hendrix)print(musician)時,輸出為()。
A)Jimi
B)Hendrix
C)JimiHendrix
D)jimihendrix
148.[單選題]()不是HDFS的守護進程。
A)SecondaryNameNode
B)DataNode
C)MRAppMasterZYarnChild
D)NameNode
149.[單選題]下列哪個選項可以來判斷HbaSe表是否存在?
A)table.ContainskeyCtableName)
B)admin.getTable(TableName)
C)adminTableExists(TableNamevalueOf(tabIeName))
D)adminTableExists(tableName)
150.[單選題]在配置LinUX網絡參數時,固定IP地址是將路由協議配置為()。
A)static
B)dynamic
C)immutable
D)variable
151.[單選題]下列關于使用MaPRedUCe編程模型實現SQL中的join操作錯誤的是?
A)RedUCeJOin可以實現內鏈接,也能實現各種外連接
B)RedUCeJoin的join操作是在MaPRedUCe程序中的reducer階段完成的
C)MaPJOin也適合各種join場景,也能實現內連接和各種外鏈接
D)MaPJOin不會產生數據傾斜
152.[單選題]SQL語言的數據操縱語句包括SELECT、INSERT、UPDATE、DELETE等。其中最重要的,也
是使用最頻繁的語句是()。
A)UPDATE
B)SELECT
C)DELETE
D)INSERT
153.[單選題]我們常見的二維碼標簽屬于物聯網架構中的哪一層?
A)感知層
B)網絡層
C)處理層
D)應用層
154.[單選題]()可以為遠程客戶端提供執(zhí)行HiVe查詢服務。
A)Metastore
B)HiveServer2
C)Beeline
D)MySQL
155.[單選題]關于HBaSe的三層結構中各層次的名稱和作用的說法,哪個是錯誤的?
A)ZookeePer文件記錄了用戶數據表的RegiOn位置信息
B)-ROOT-表記錄了.META.表的Region位置信息
C)META.表保存了HBaSe中所有用戶數據表的Region位置信息
D)ZookeePer文件記錄了-RooT-表的位置信息
156.[單選題]假設你在卷積神經網絡的第一層中有5個卷積核,每個卷積核尺寸為7x7,具有零填充
且步幅為1該層的輸入圖片的維度是224x224x3那么該層輸出的維度是()
A)217x217x3
B)217x217x8
0218x218x5
D)220x220x7
157.[單選題]執(zhí)行以下代碼段Print("www","google","com",sep="-")時,輸出為()。
A)www
B)WWWgOOgleCOm
C)www,google,com
D)www-google-com
158.[單選題]程序片段:x="foo"y=2print(x+y)執(zhí)行以上三句指令后將會顯示:
A)foo
B)foo2
C)foofoo
D)Can11convert'int'objecttostrimplicitly
159.[單選題]下列關于數據重組的說法中,錯誤的是()。
A)數據重組是數據的重新生產和重新采集
B)數據重組能夠使數據煥發(fā)新的光芒
C)數據重組實現的關鍵在于多源數據融合和數據集成
D)數據重組有利于實現新穎的數據模式創(chuàng)新
160.[單選題]關于ADS的ECU,說法正確的是:()。
A)可以通過DDL語句alterdatabasesetecu_count=N來修改ECU的個數
B)可以動態(tài)的擴容或者縮容,兩者都是瞬間的同步操作
C)可通過查詢表InformatiOn_schema.resourcerequest獲取目前的ECU的狀態(tài)
D)通過參數設置,可以使同一個ADS的庫同時使用兩種類型的ECU
161.[單選題]()是Spark的核心數據結構。
A)彈性分布式數據集
B)列表
C)元組
D)字典
162.[單選題]假設給定一個長度為n的不完整單詞序列,希望預測下一個字母是什么,如輸入是
Predictio(9個字母組成),希望預測第十個字母是什么。適用于解決這個工作的是
()。
A)循環(huán)神經網絡
B)全連接神經網絡
C)受限波爾茲曼機
D)卷積神經網絡
163.[單選題]RNN的全稱是()o
A)卷積神經網絡
B)長短時記憶
C)區(qū)域神經網絡
D)循環(huán)神經網絡
164.[單選題]Hadoop生態(tài)系統(tǒng)中,()主要解決的是日志類數據的收集和處理問題。
A)Mahout
B)Flume
C)Sqoop
D)HBase
165.[單選題]在支持向量機中,()允許支持向量機在一些樣本上出錯。
A)硬間隔
B)軟間隔
C)核函數
D)拉格朗日乘子法
166.[單選題]采樣分析的精確性隨著采樣隨機性的增加而(),但與樣本數量的增加關系不大
A)降低
B)不變
C)提高
D)無關
167.[單選題]()是利用樣本的實際資料計算統(tǒng)計量的取值,并引來以檢驗事先對總體某些數量特
征的假設是否可信作為決策取舍依據的一種統(tǒng)計分析方法。
A)假設檢驗
B)邏輯分析
C)方差分析
D)回歸分析
168.[單選題]DAGScheduler的作用是()
A)負責分配任務
B)負責調度Worker的運行
C)負責創(chuàng)建執(zhí)行計劃
D)負責清理執(zhí)行完畢的任務
169.[單選題]在HiVe中,以下那一個查詢語句可以將2個或多個表集合進行合并()
A)unionfull
B)unionall
C)unionfor
D)unionon
170.[單選題]某超市研究銷售記錄數據后發(fā)現,買面包的人很大概率會購買啤酒,這種屬于數據挖
掘的哪類問題?()
A)關聯規(guī)則發(fā)現
B)聚類
C)分類
D)自然語言處理
171.[單選題]LSM的讀操作和寫操作是獨立的?
A)是
B)否
C)LSM并不區(qū)分讀和寫
D)LSM中讀寫是同一種操作
172.[單選題]下列關于餅圖的說法中,錯誤的是()
A)餅圖的數據項中允許有負值
B)在設計餅圖時,往往需要維護不同半徑對應的標簽以使不同半徑數值直觀化
C)餅圖通常適用于統(tǒng)計不同指標數據占比的情形
D)餅圖也被稱為扇形統(tǒng)計圖
173.[單選題]大數據公司的多樣性表明了O
A)數據作用的體現
B)數據價值的轉移
C)數據思維的創(chuàng)新
D)數據技術的發(fā)展
174.[單選題]數據使用環(huán)節(jié)的安全技術措施除防火墻、()、防病毒、防DDOS、漏洞檢測等網絡
安全防護技術措施外,還需實現以下安全技術能力:賬號權限管理、數據安全域、數據脫敏、日志
管理和審計、異常行為實時監(jiān)控和終端數據防泄漏。
A)入侵檢測
B)病毒檢測
C)程序檢測
D)進程檢測
175.[單選題]大數據環(huán)境下的隱私擔憂,主要表現為()
A)個人信息的被識別與暴露
B)用戶畫像的生成
C)惡意廣告的推送
D)病毒入侵
176.[單選題]相比依賴于小數據和精確性的時代,大數據更強調數據的
A)安全性
B)完整性
C)混雜性
D)完整性和混雜性
177.[單選題]下列說法錯誤的是()。
A)當目標函數是凸函數時,梯度下降算法的解一般就是全局最優(yōu)解
B)進行PCA降維時,需要計算協方差矩陣
C)沿負梯度的方向一定是最優(yōu)的方向
D)利用拉格朗日函數能解帶約束的優(yōu)化問題
178.[單選題]機器學習算法在學習過程中對某種類型假設的偏好,稱為(—)。
A)訓練偏好
B)歸納偏好
C)分析偏好
D)假設偏好
179.[單選題]下列哪個不屬于常用的文本分類的特征選擇算法?
A)卡方檢驗值
B)互信息
C)信息增益
D)主成分分析
180.[單選題]構建一個神經網絡,將前一層的輸出和它自身作為輸入,則有反饋連接的是()。
A)循環(huán)神經網絡
B)卷積神經網絡
C)限制玻爾茲曼機
D)都不是
181.[單選題]大數據在電信中的應用不包括下列哪項?O
A)基于用戶、業(yè)務及流量的分級的多維管控機制
B)精準的客戶分析及營銷
C)利用位置和軌跡信息服務社會
D)基礎設施建設優(yōu)化和網絡運營管理和優(yōu)化
182.[單選題]sciPy中模塊COnStantS的作用是什么?
A)向量計算
B)物理和數學常量
C)程序輸入輸出
D)信號處理
183.[單選題]執(zhí)行以下代碼段requested_toppings=['mushrooms','greenpeppers','extra
cheese']forrequestedtoppinginrequested_toppings:print("Adding"+
requested_topping+".")時,輸出為()。
A)Addingmushrooms.Addinggreenpeppers.Addingextracheese.
B)Addingmushrooms.
C)Addinggreenpeppers.
D)Addingextracheese.
184.[單選題]MaxCompute數據表的默認生命周期是:()。
A)I天
B)7天
C)30天
D)無期限
185.[單選題]如果要將讀寫位置移動到文件開頭,需要使用的命令是()。
A)close
B)seek(0)
C)truncate
D)write(1stuff')
186.[單選題]假定你現在訓練了一個線性SVM并推斷出這個模型出現了欠擬合現象,在下一次訓練時
,應該采取的措施是0。
A)增加數據點
B)減少數據點
C)增加特征
D)減少特征
187.[單選題]假設在卷積神經網絡的第一層中有5個卷積核,每個卷積核尺寸為7X7,具有零填
充且步幅為1,該層的輸入圖片的維度是224X224X3,那么該層輸出的維度是()。
A)217×217×3
B)217×217×8
C)218×218×5
D)220×220×7
188.[單選題]DAYU批量數據遷移(CloudDataMigration)提供()數據源之間批量數據遷移服
務,幫助您實現數據自由流動。
A)同構
B)異構
C)同構/異構
D)架構
189.[單選題]Python程序文件的擴展名是(一)0
A)python
B)pyt
C)Pt
D)py
190.[單選題]Hadoop工程文件使用哪個擴展名O
A)hrh
B)har
C)hrc
D)hraf
191.[單選題]下列關于traintestsplit函數的說法正確的是()。
A)train_test_split能夠將數據集劃分為訓練集、驗證集和測試集
B)生成的訓練集和測試集在賦值的時候可以調換位置,系統(tǒng)能夠自動識別
C)train_test_spl.it每次的劃分結果不同,無法解決
D)train_test_split函數可以自行決定訓練集和測試集的占比
192.[單選題]在HiVe的條件語句中,如果A等于B則返回true,反之返回false的表達式為()
A)A=B
B)A==B
C)A!=B
D)A!==B
193.[單選題]在HiVe中,如果是要條件查詢后才連接,應該把查詢條件置于on()
A)后
B)前
C)前后都可以
D)以上都不對
194.[單選題]在HDFS文件系統(tǒng)根目錄下創(chuàng)建一個名為mydir的文件夾的命令是()。
A)hdfs.create(new
B)hdfs.open(new
C)hdfs.mkdirs(rthdfs:/mydirw)
D)hdfs.mkdirs(new
195.[單選題]下列關于儀表盤圖的說法中,錯誤的是0
A)儀表盤圖可以直觀地表現出某個指標的進度或實際情況
B)一個可視化組建中只能創(chuàng)建多個儀表盤
C)儀表盤中的儀表板最小值為目標值
D)儀表盤中指針指向的位置為指針值,即當前值
196.[單選題]以下選項中,不是建立字典的方式是
?)d={[1,21:1,[3,41:3}
B)d={(1,2):1,(3,4):3)
Od={'張三':1,'李四':2}
D)d={1:[1,2],3:[3,4]]
197.[單選題]在MaPRedUCe計算架構中,。組件運行在NameNode節(jié)點上,提供集群資源的分配和工
作調度管理。
A)Client
B)JobTracker
C)TaskTracker
D)Task
198.[單選題]大數據計算服務中,日志表OdS_Order是一張非分區(qū)表,結構如下:createtable
ods_order(order_idstring,order_datestring,orderamtdecimal);fact_order是一張按日
期分區(qū)的表,結構如下:createtablefact_order(order_idstring,order_amtdecimal)
partitionedby(orderdtstring);現在需要將數據從OdS_Order加載到factOrder表中,并且按
照OrdeJdate進行分區(qū),執(zhí)行了以下SQL:insertoverwritetablefact_order
partition(order_dt)selectorder_id,orderamt,order_dateasorder_dtfromodsorder;
OdS_order表中的OrdeJdate有部分記錄取值為NULL,對執(zhí)行結果描述正確的是:()。
A)語句可以正常執(zhí)行,其中OrdeJdate為NULL的記錄會被放入Orderdt='BAD,的分區(qū)
B)語句可以正常執(zhí)行,在提交時會報語句錯誤
C)語句可以正常執(zhí)行,其中的Orderdate為NULL值的記錄會被丟棄
D)語句無法正常執(zhí)行,系統(tǒng)會拋異常
199.[單選題]在HBaSe系統(tǒng)架構中,HBaSe存儲的核心是()
A)Region
B)HRegionServer
OHStore
D)Client
200.[單選題]閱讀下面程序W=float(input('水果的重量:'))if(w<10):total=(w*8)else
:total=(w*7)print("重量:",w,"金額:",total)假如我輸入水果重量是8,金額顯示是
A)64
B)56
08
D)以上都不對
201.[單選題]以下組合中與主鍵約束功能相同的是()。-
A)默認約束與非空約束
B)默認約束與唯一約束
C)唯一約束與非空約束
D)以上答案都不正確
202.[單選題]互聯網思維核心O
A)用戶思維
B)迭代思維
C)流量思維
D)平臺思維
203.[單選題]若變量X的值為987,則表達式X//10%10的值為?
A)0
B)9
08
D)7
204.[單選題]a="Iwantto",如想得到I,則需要O
A)aL8:]
B)a[0:1]
C)aL7:]
D)a[9:]
205.[單選題]下面()函數不是字符串處理函數。
A)TRUNC
B)TOCHAR
C)SUBSTR
D)]NSTR
206.[單選題]在SPark中,()是指RDD的每個分區(qū)都只被子RDD的一個分區(qū)所依賴。
A)子分區(qū)
B)父分區(qū)
C)寬依賴
D)窄依賴
207.[單選題]以下程序的輸出結果是:imgl=[12,34,56,78]img2=[1,2,3,4,5]defdispl():
print(imgl)defmodi():imgl=img2modiOdispl()
A)[1,2,3,4,5]
B)([12,34,56,78])
C)([1,2,3,4,5])
D)[12,34,56,78]
208.[單選題]以下()屬于NoSQL數據庫中Key-Value的缺點。
A)不記錄結構信息
B)查詢性能不高,缺乏統(tǒng)一查詢語法
C)功能相對有限
D)功能相對有限,不易于做分布式集群
209.[單選題]print(53)運行的結果
A)53
B)15
C)出錯
D)以上都不是
210.[單選題]為了提高系統(tǒng)性能,Spark采取"惰性計算模式",具體為()。
A)執(zhí)行TranSformation操作時不會提交,只有執(zhí)行Action操作時才會被提交到集群中開始被執(zhí)
行
B)執(zhí)行Action操作時不會提交,只有執(zhí)行TranSfOrmation操作時才會被提交到集群中開始被執(zhí)
行
C)只有執(zhí)行完Action操作和TranSformation操作時,所有操作才會被提交到集群中開始被執(zhí)行
D)執(zhí)行完Action操作或TranSformatiOn操作時都不會提交到集
211.[單選題]下列對于錯誤率的公式,解釋正確的是。
A)統(tǒng)計分類器預測出來的結果與真實結果不相同的個數,然后除以總的樣例集D的個數。
B)先統(tǒng)計分類正確的樣本數,然后除以總的樣例集D的個數。
C)預測為正的樣例中有多少是真正的正樣例
D)樣本中的正例有多少被預測正確
212.[單選題]通過電腦病毒甚至可以對核電站、水電站進行攻擊導致其無法正常運轉,對這一說法
你認為以下哪個選項是準確的?()
A)絕對可行,已有在現實中實際發(fā)生的案例
B)不認為能做到,危言聳聽
C)病毒只能對電腦攻擊,無法對物理環(huán)境造成影響
D)理論上可行,但沒有實際發(fā)生過
213.[單選題]下列哪個不是情感分析的應用場景?
A)數據挖掘
B)信息檢索
C)文本分詞
D)市場營銷
214.[單選題]大數據計算服務(MaxCompute,原ODPS)中客戶信息表的建表語句如下:create
tablecustomer(cust_idbigint,provincestring,addrstring,full_addrstring);其中
fulladdr字段需要根據源表中的ProVinCe和addr拼成一個完整的地址,源表中的一條記錄的
ProVinCe值為空(NULL),addr為'文一西路969號',
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年西安市浐灞絲路學校招聘總務處干事備考題庫及答案詳解一套
- 2026年沈陽大學和沈陽開放大學面向社會公開招聘急需緊缺事業(yè)單位工作人員21人備考題庫完整答案詳解
- 養(yǎng)老院安全防范與應急處理制度
- 第四章電磁振蕩與電磁波 單元練習(含答案)
- 2026年通化縣供銷聯社公開招聘備考題庫及參考答案詳解
- 2026年葫蘆島市總工會面向社會公開招聘工會社會工作者5人備考題庫及參考答案詳解一套
- 2026年病人服務中心陪檢員招聘備考題庫及參考答案詳解1套
- 2026年紹興市文化市場執(zhí)法指導中心招聘編制外工作人員備考題庫及答案詳解參考
- 2026年某物業(yè)國企單位招聘外包制人員備考題庫有答案詳解
- 2026年通號工程局集團有限公司天津分公司招聘備考題庫含答案詳解
- 胃支架置入術的護理配合
- 基于機器學習的天線優(yōu)化與設計研究
- 雄激素源性禿發(fā)診療指南專家共識
- 浙江省金華市婺城區(qū)2024-2025學年九年級上學期期末數學試卷(含答案)
- 靜脈用藥調配中心建設與管理指南(2021試行版)解讀
- 六年級上冊數學教案-總復習 專題一 數與代數|北師大版
- 工業(yè)互聯網標準體系(版本3.0)
- 培養(yǎng)小學生的實驗操作能力
- 氣動回路圖與氣動元件課件
- 《念奴嬌 赤壁懷古》《永遇樂 京口北固亭懷古》《聲聲慢》默寫練習 統(tǒng)編版高中語文必修上冊
- 婦產科病史采集臨床思維
評論
0/150
提交評論