大數(shù)據(jù)理論試題及答案_第1頁(yè)
大數(shù)據(jù)理論試題及答案_第2頁(yè)
大數(shù)據(jù)理論試題及答案_第3頁(yè)
大數(shù)據(jù)理論試題及答案_第4頁(yè)
大數(shù)據(jù)理論試題及答案_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)理論試題及答案一、單項(xiàng)選擇題(本大題共5小題,每小題2分,共10分)以下選項(xiàng)中,通常用于表示各項(xiàng)大小與各項(xiàng)總和比例的是()。A.餅圖(正確答案)B.柱形圖C.線性圖D..熱力點(diǎn)圖以下選項(xiàng)中,不屬于主鍵約束的特點(diǎn)的是()。A.一個(gè)表只能設(shè)置一個(gè)主鍵列B.允許存在Null值(正確答案)C.一個(gè)表必須有一個(gè)列作為主鍵列D.不能重復(fù)NumericToString是文本函數(shù)的一種,它的功能是()。A.把一個(gè)字符串轉(zhuǎn)換為數(shù)值B.把二進(jìn)制轉(zhuǎn)換為字符串C.把一個(gè)CSN序列轉(zhuǎn)換成字符串D.把一個(gè)數(shù)值數(shù)據(jù)轉(zhuǎn)換為字符串(正確答案)()是從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本的抽樣方法。每個(gè)單位被抽中的概率是相等的,屬于“等概率抽樣”。A.方便抽樣B.分層抽樣C.整群抽樣D.簡(jiǎn)單隨機(jī)抽樣(正確答案)對(duì)同一個(gè)用戶,可以打上很多個(gè)標(biāo)簽。所以標(biāo)簽不同于傳統(tǒng)意義上的分類,它也被稱為“開(kāi)放分類”。這屬于標(biāo)簽的()。A.廣泛應(yīng)用性B.指向明確性C.可重復(fù)標(biāo)記性(正確答案)D.隨機(jī)性為了返回組中所有值的和,應(yīng)使用的聚合函數(shù)為()。A.AVGB.SUM√(正確答案)C.COUNTD.DISTINCTSQL語(yǔ)法中內(nèi)部關(guān)聯(lián)的關(guān)鍵字是()。A.INNERJOIN(正確答案)B.LEFTJOINC.FULLJOIND.CROSSJOIN()函數(shù)的功能是使用訓(xùn)練完成的模型給出輸入數(shù)據(jù)的預(yù)測(cè)值。A.CsvAssembleB.TokenizationC.NumAssembleD.Predict(正確答案)()也稱為非空約束,是為了給一列數(shù)據(jù)設(shè)置一個(gè)區(qū)間或者取值集合或設(shè)置不能是空值。A.默認(rèn)值約束B(niǎo).檢查約束(正確答案)C.唯一性約束D.外鍵約束以下哪個(gè)數(shù)據(jù)轉(zhuǎn)換器常用于空值替換,作用為“如果v1為null,則輸出v2,否則輸出v1”。()A.ConstantB.ChoiceC.Nvl(正確答案)D.NumericCast下圖為某校學(xué)生成績(jī)表預(yù)覽,為獲取元數(shù)據(jù),其標(biāo)題行號(hào)及起始數(shù)據(jù)行號(hào)分為應(yīng)為()。A.1,2(正確答案)B.0,0C.0,1D.1,1()又稱范圍誤差或全距,表示最大值與最小值之間的差距,即最大值減最小值。A.標(biāo)準(zhǔn)差B.極差(正確答案)C.方差D.均方差將用戶的上班距離{0-1Miles,1-2Miles,2-5Miles,5-10Miles,10-20Miles},通過(guò)數(shù)據(jù)加工轉(zhuǎn)換為{0.0,0.25,0.5,0.75,1.0},這屬于對(duì)數(shù)據(jù)進(jìn)行()。A.篩選B.離散化C.標(biāo)準(zhǔn)化D.量化(正確答案)自行車用戶信息表中收集了用戶的各類信息,包括用戶的出生日期及用戶第一次購(gòu)買自行車的日期。為了得到用戶第一次購(gòu)買自行車的年齡,應(yīng)使用()函數(shù)。A.DateDiff(正確答案)B.DatePartC.DatetimeToStringD.FormatDate()可以進(jìn)行排序,生成序列號(hào)等一般的聚合函數(shù)無(wú)法實(shí)現(xiàn)的高級(jí)操作。A.集合函數(shù)B.聚合函數(shù)C.窗口函數(shù)(正確答案)D.文本函數(shù)在實(shí)際的問(wèn)題中我們遇到的數(shù)據(jù)量往往是巨大的。為了保證我們所用的方法能夠在原始數(shù)據(jù)的支持下得以實(shí)現(xiàn),我們必須要對(duì)數(shù)據(jù)進(jìn)行()。A.篩選(正確答案)B.離散化C.標(biāo)準(zhǔn)化D.量化在對(duì)抽取數(shù)據(jù)進(jìn)行過(guò)濾篩選時(shí),可以使用邊角運(yùn)算符進(jìn)行過(guò)濾篩選。運(yùn)算符“!>”的含義是()。A.用于測(cè)試兩個(gè)表達(dá)式彼此不相等的條件的運(yùn)算符B.用于測(cè)試一個(gè)表達(dá)式是否不大于另一個(gè)表達(dá)式的運(yùn)算符(正確答案)C.用于測(cè)試一個(gè)表達(dá)式是否小于或等于另一個(gè)表達(dá)式的運(yùn)算符D.用于測(cè)試一個(gè)表達(dá)式是否大于另一個(gè)表達(dá)式的運(yùn)算符如下圖所示,為(B)的計(jì)算公式。()A.算術(shù)平均值B.加權(quán)平均值(正確答案)C.幾何平均數(shù)D.以上均不正確下圖為某公司差旅費(fèi)用可視化的部分截圖,該圖屬于(C)。()A.氣泡圖B.面積圖(正確答案)C.雷達(dá)圖D.熱力點(diǎn)圖CsvAssemble數(shù)據(jù)轉(zhuǎn)換器的作用是()。A.數(shù)值組裝B.把文本按照分詞規(guī)則轉(zhuǎn)化為CSNC.把多個(gè)字符串拼接成CSV格式的字符串(正確答案)D.逆標(biāo)準(zhǔn)化二、多項(xiàng)選擇題(本大題共3小題,每小題10分,共30分)關(guān)系模型的要素包括()。A.數(shù)據(jù)結(jié)構(gòu)(正確答案)B.數(shù)據(jù)管理C.數(shù)據(jù)操作(正確答案)D.完整性約束(正確答案)關(guān)系型數(shù)據(jù)庫(kù)的事務(wù)和現(xiàn)實(shí)世界中的交易很類似,它有如下()原則,簡(jiǎn)稱ACID原則。A.原子性(正確答案)B.一致性(正確答案)C.隔離性(正確答案)D.持久性(正確答案)以下屬于日期函數(shù)的是()A.DateDiff(正確答案)B.DatetimeToString(正確答案)C.NumericCastD.Constant常用的抽樣方法有兩大類,以下屬于概率抽樣的有()A.方便抽樣B.分層抽樣(正確答案)C.判斷抽樣D.簡(jiǎn)單隨機(jī)抽樣(正確答案)缺失值是指粗糙數(shù)據(jù)中由于缺少信息而造成的數(shù)據(jù)的聚類、分組、刪失或截?cái)?。?duì)于缺失值的處理方法包括()。A.復(fù)制元B.刪除元組(正確答案)C.缺值補(bǔ)齊(正確答案)D.不處理(正確答案)聯(lián)接可將水平方向上合并兩個(gè)數(shù)據(jù)集合,并產(chǎn)生一個(gè)新的結(jié)果集合。聯(lián)接可分為()。A.內(nèi)部聯(lián)接(正確答案)B.外部聯(lián)接(正確答案)C.順序聯(lián)接D.交叉聯(lián)接(正確答案)缺失值從缺失的分布來(lái)講可以分為()。A.完全隨機(jī)缺失(正確答案)B.完全非隨機(jī)缺失(正確答案)C.任意缺失D.隨機(jī)缺失(正確答案)數(shù)據(jù)集中趨勢(shì)在統(tǒng)計(jì)學(xué)中是指一組數(shù)據(jù)向某一中心值靠攏的程度,它反映了一組數(shù)據(jù)中心點(diǎn)的所在位置。以下選項(xiàng)中用于描述數(shù)據(jù)集中程度的變量有()。A.平均值(正確答案)B.中位數(shù)(正確答案)C.眾數(shù)(正確答案)D.總數(shù)數(shù)據(jù)加工是對(duì)原始數(shù)據(jù)按照需求進(jìn)行各種各樣的變換處理,最終形成簡(jiǎn)潔、規(guī)范、清晰、易于分析的數(shù)據(jù)。在實(shí)際業(yè)務(wù)處理中,數(shù)據(jù)通常是臟數(shù)據(jù)。以下情況中屬于臟數(shù)據(jù)的有()A.數(shù)據(jù)缺失(正確答案)B.數(shù)據(jù)冗余(正確答案)C.數(shù)據(jù)噪聲(正確答案)D.數(shù)據(jù)冗余vCalculation函數(shù)用以進(jìn)行數(shù)學(xué)四則運(yùn)算,當(dāng)運(yùn)算符為()時(shí)輸入?yún)?shù)的順序存在邏輯關(guān)系。A.加B.減(正確答案)C.乘D.除(正確答案)合并操作與連接相似,因?yàn)樗麄兌际菍蓚€(gè)表合并起來(lái)形成另一個(gè)表的方法。但它們的合并方法有本質(zhì)上的不同。以下選項(xiàng)中說(shuō)法正確的有()A.在合并中,兩個(gè)表源列的數(shù)量與數(shù)據(jù)類型可以不相同B.在合并中,兩個(gè)表源列的數(shù)量與數(shù)據(jù)類型必須相同(正確答案)C.在聯(lián)接中,行的最大數(shù)量是兩個(gè)表行的“和”D.在聯(lián)接中,行的最大數(shù)量是它們的“乘積”(正確答案)定量變量就是通常所說(shuō)的連續(xù)量,它們是由測(cè)量或計(jì)數(shù)、統(tǒng)計(jì)所得到的量,這些變量具有數(shù)值特征,以下屬于定量變量的有()。A.性別B.長(zhǎng)度(正確答案)C.產(chǎn)量(正確答案)D.職業(yè)下列關(guān)于標(biāo)簽的說(shuō)法,正確的有()。A.對(duì)同一個(gè)用戶,可以打上很多個(gè)標(biāo)簽(正確答案)B.每個(gè)標(biāo)簽都指向用戶的一類屬性或行為(正確答案)C.標(biāo)簽在在精準(zhǔn)營(yíng)銷方面能夠發(fā)揮了獨(dú)特的效用(正確答案)D.標(biāo)簽可以更好的顯示和突出搜索的關(guān)鍵詞條(正確答案)在數(shù)列云平臺(tái)抽取數(shù)據(jù)時(shí),以下哪些選項(xiàng)需要連接到課程數(shù)據(jù)庫(kù)()A.targetmail(用戶信息表)(正確答案)B.student_info(學(xué)生信息表)C.grade_score.csv(學(xué)生成績(jī)表)D.student.csv(學(xué)生信息表)(正確答案)對(duì)文本類型的數(shù)據(jù)進(jìn)行轉(zhuǎn)換加工,以下選項(xiàng)中哪些文本函數(shù)處理的對(duì)象是一個(gè)文本字符串,處理完的輸出結(jié)果也是一個(gè)文本字符串()。A.ConcatenatB.Left(正確答案)C.Upper(正確答案)D.Replace(正確答案)三、判斷題(本大題共2小題,每小題10分,共20分)在指定的字段或表達(dá)式中,主索引的關(guān)鍵字可以有重復(fù)值。()A.正確B.錯(cuò)誤(正確答案)數(shù)據(jù)量化就是將一些不具體,模糊的定性數(shù)據(jù)用具體的數(shù)據(jù)來(lái)表示,從而達(dá)到便于分析比較的目的。()A.正確(正確答案)B.錯(cuò)誤從數(shù)據(jù)提取維度來(lái)看,標(biāo)簽可分為:靜態(tài)屬性標(biāo)簽和動(dòng)態(tài)屬性標(biāo)簽。()A.正確B.錯(cuò)誤(正確答案)COUNT聚合是對(duì)指定的集求值,刪除該集中的重復(fù)元組,然后返回結(jié)果集。()A.正確B.錯(cuò)誤(正確答案)離散化是把無(wú)限空間中有限個(gè)體映射到有限空間中去,以此提高算法的時(shí)空效率。()A.正確(正確答案)B.錯(cuò)誤數(shù)據(jù)篩選的目的是為了提高之前收集存儲(chǔ)的相關(guān)數(shù)據(jù)的可用性,更利于后期數(shù)據(jù)分析。()A.正確(正確答案)B.錯(cuò)誤任何時(shí)候使用一組特定的輸入值調(diào)用聚合所得到的結(jié)果是相同的。(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論