大數(shù)據(jù)建模練習(xí)(習(xí)題卷1)_第1頁
大數(shù)據(jù)建模練習(xí)(習(xí)題卷1)_第2頁
大數(shù)據(jù)建模練習(xí)(習(xí)題卷1)_第3頁
大數(shù)據(jù)建模練習(xí)(習(xí)題卷1)_第4頁
大數(shù)據(jù)建模練習(xí)(習(xí)題卷1)_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目:大數(shù)據(jù)建模練習(xí)大數(shù)據(jù)建模練習(xí)(習(xí)題卷1)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)建模練習(xí)第1部分:?jiǎn)雾?xiàng)選擇題,共134題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.以下哪個(gè)函數(shù)可以生成一個(gè)指定范圍的隨機(jī)數(shù)組?A)randint()B)rand()C)random()[單選題]2.出入境模型中,要過濾出來自東南亞地區(qū)的人員,可以對(duì)?來自國家地區(qū)代碼?字段進(jìn)行過濾,并按照國際設(shè)置多個(gè)過濾條件,請(qǐng)問多過濾條件之間是什么關(guān)系A(chǔ))邏輯與B)邏輯或C)邏輯非[單選題]3.()表示一個(gè)新的事務(wù)處理塊的開始A)STARTTRANSACTIONB)BEGINTRANSACTIONC)BEGINCOMMITD)STARTCOMMIT[單選題]4.在數(shù)據(jù)結(jié)構(gòu)中的非線性結(jié)構(gòu)中,()中的結(jié)點(diǎn)之間,存在一對(duì)多的關(guān)系,每個(gè)結(jié)點(diǎn)最多只有一個(gè)前驅(qū),但可以有多個(gè)后繼,可以有多個(gè)終端結(jié)點(diǎn)。A)網(wǎng)狀結(jié)構(gòu)B)樹狀結(jié)構(gòu)C)圖狀結(jié)構(gòu)D)集合[單選題]5.以下關(guān)于turtle庫的描述,正確的是:A)在importturtle之后就可以用circle()語句,來畫一個(gè)圓圈B)要用fromturtleimportturtle來導(dǎo)入所有的庫函數(shù)C)home()函數(shù)設(shè)置當(dāng)前畫筆位置到原點(diǎn),朝向東D)seth(x)是setheading(x)函數(shù)的別名,讓畫筆向前移動(dòng)x[單選題]6.統(tǒng)計(jì)每個(gè)部門中人數(shù)()A)SELECTSUM(ID)FROMEMPGROUPBYDEPTNO;B)SELECTSUM(ID)FROMEMPORDERBYDEPTNO;C)SELECTCOUNT(ID)FROMEMPORDERBYDEPTNO;D)SELECTCOUNT(ID)FROMEMPGROUPBYDEPTNO;[單選題]7.在天算建模平臺(tái)中,經(jīng)常需要對(duì)原始數(shù)據(jù)表結(jié)構(gòu)進(jìn)行處理,包括調(diào)整字段間的順序、對(duì)字段進(jìn)行重命名(修改中文名和英文名)、選擇模型需要的輸出字段、更改字段類型(字符串、日期時(shí)間、數(shù)值等)。請(qǐng)問以下哪個(gè)算子能實(shí)現(xiàn)該功能。A)數(shù)據(jù)處理B)添加字段C)表結(jié)構(gòu)處理D)文本提取[單選題]8.下列()不屬于連接種類A)左外連接B)內(nèi)連接C)中間連接D)交叉連接[單選題]9.若要在基本表S中增加一列CN(課程名),可用()A)ADDTABLESALTER(CNCHAR(8))B)ALTERTABLESADD(CNCHAR(8))C)ADDTABLES(CNCHAR(8))D)ALTERTABLES(ADDCNCHAR(8))[單選題]10.在黑盒測(cè)試方法中,設(shè)計(jì)測(cè)試用例的主要根據(jù)是A)程序流程圖B)程序內(nèi)部邏輯C)程序外部功能D)程序數(shù)據(jù)結(jié)構(gòu)[單選題]11.連接算子用于把兩張(或兩張以上)表按照內(nèi)連接和外連接(左連接、右連接、全連接)這四種邏輯連接起來。只返回兩個(gè)標(biāo)準(zhǔn)連接字段相等的行,取兩表的交集是其中的A)內(nèi)連接B)全連接C)左連接D)右連接[單選題]12.下列有關(guān)數(shù)據(jù)庫的描述,正確的是A)數(shù)據(jù)庫是一個(gè)關(guān)系B)數(shù)據(jù)庫是一個(gè)DBF文件C)數(shù)據(jù)庫是一個(gè)結(jié)構(gòu)化的數(shù)據(jù)集合D)數(shù)據(jù)庫是一組文件[單選題]13.關(guān)于數(shù)據(jù)組織的維度描述正確的是A)二維數(shù)據(jù)由對(duì)等關(guān)系的有序或無序數(shù)據(jù)構(gòu)成B)高維數(shù)據(jù)由關(guān)聯(lián)關(guān)系數(shù)據(jù)構(gòu)成C)CSV是一維數(shù)據(jù)D)一維數(shù)據(jù)采用線性方式存儲(chǔ)[單選題]14.可以創(chuàng)建3*3單位矩陣的命令是:A)A=np.zeros(3)B)A=np.eye(3)C)A=np.ones(3)D)A=np.full(3,3)[單選題]15.有三個(gè)表,它們的記錄行數(shù)分別是10行、2行和6行,三個(gè)表進(jìn)行交叉連接后,結(jié)果集中共有()行數(shù)據(jù)A)18B)26C)不確定D)120[單選題]16.Jupyternotebook的記事本文件擴(kuò)展名為:A)mB)pyC)pycD)ipynb[單選題]17.R是用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R是一個(gè)自由、免費(fèi)、源代碼開放的軟件,它是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。以下哪個(gè)不是R語言的優(yōu)點(diǎn)?A)完整的程序設(shè)計(jì)語言B)開源軟件C)運(yùn)行速度快D)擴(kuò)展包多[單選題]18.修改數(shù)據(jù)庫表結(jié)構(gòu)用以下哪一項(xiàng)()A)UPDATEB)CREATEC)UPDATEDD)ALTER[單選題]19.下列說法錯(cuò)誤的是()A)GROUPBY子句用來分組WHERE子句的輸出B)WHERE子句用來篩選FROM子句中指定的操作所產(chǎn)生的行。C)聚合函數(shù)需要和groupby一起使用D)HAVING子句用來從FROM的結(jié)果中篩選行[單選題]20.以下關(guān)于文件的描述,錯(cuò)誤的是:A)二進(jìn)制文件和文本文件的操作步驟都是?打開-操作-關(guān)閉?B)open()打開文件之后,文件的內(nèi)容并沒有在內(nèi)存中C)open()只能打開一個(gè)已經(jīng)存在的文件D)文件讀寫之后,要調(diào)用close()才能確保文件被保存在磁盤中了[單選題]21.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?A)變量代換B)離散化C)聚集D)估計(jì)遺漏值[單選題]22.通常用于對(duì)特定字段,按照使用者所需,對(duì)大量數(shù)據(jù)進(jìn)行?分類?,進(jìn)而得到一些統(tǒng)計(jì)結(jié)果。實(shí)現(xiàn)這個(gè)功能的算子是A)過濾B)連接C)聚合D)去重[單選題]23.給出如下代碼:DictColor={"seashell":"海貝色","gold":"金色","pink":"粉紅色","brown":"棕色","purple":"紫色","tomato":"西紅柿色"}以下選項(xiàng)中能輸出?海貝色?的是A)print(DictColor.keys())B)print(DictColor["海貝色"])C)print(DictColor.values())D)print(DictColor["seashell"])[單選題]24.在搭建同住人員模型時(shí),在住宿信息表中,入住時(shí)間字段都是日期時(shí)間類型,需要計(jì)算同住宿人前后入住的時(shí)間差,可以使用列計(jì)算算子實(shí)現(xiàn)。前提是需要先將入住時(shí)間的字段類型進(jìn)行轉(zhuǎn)換成那種類型才能計(jì)算時(shí)間差。A)字符串型B)時(shí)間日期型C)數(shù)值型D)文本型[單選題]25.?2022-1-31?可以用什么算子轉(zhuǎn)換成?2022-01-31?格式A)值映射B)字段值替換C)缺失值處理D)類型轉(zhuǎn)換[單選題]26.以下關(guān)于python內(nèi)置函數(shù)的描述,錯(cuò)誤的是:A)id()返回一個(gè)變量的一個(gè)編號(hào),是其在內(nèi)存中的地址B)all(ls)返回True,如果ls的每個(gè)元素都是TrueC)type()返回一個(gè)對(duì)象的類型D)sorted()對(duì)一個(gè)序列類型數(shù)據(jù)進(jìn)行排序,將排序后的結(jié)果寫回到該變量中[單選題]27.以下關(guān)于字典類型的描述,正確的是:A)字典類型可迭代,即字典的值還可以是字典類型的對(duì)象B)表達(dá)式forxind:中,假設(shè)d是字典,則x是字典中的鍵值對(duì)C)字典類型的值可以是任意數(shù)據(jù)類型的對(duì)象D)字典類型的鍵可以是列表和其他數(shù)據(jù)類型[單選題]28.關(guān)于Python語言的注釋,以下選項(xiàng)中描述錯(cuò)誤的是:A)python語言有兩種注釋方式:單行注釋和多行注釋B)python語言的單行注釋以#開頭C)python語言的單行注釋以單引號(hào)開頭D)Python語言的多行注釋以???(三個(gè)單引號(hào))開頭和結(jié)尾[單選題]29.按某種邏輯關(guān)系組織起來的一批數(shù)據(jù),按一定的映象方式把它存放在計(jì)算機(jī)的存儲(chǔ)器中,并在這些數(shù)據(jù)上定義了一個(gè)運(yùn)算的集合,就叫做()。A)運(yùn)算結(jié)構(gòu)B)關(guān)系結(jié)構(gòu)C)數(shù)據(jù)結(jié)構(gòu)D)數(shù)據(jù)庫[單選題]30.數(shù)據(jù)處理前不了解數(shù)據(jù)各類格式情況,需要把實(shí)際數(shù)據(jù)中的各類格式探查清楚,然后再進(jìn)行有效處理,可以實(shí)現(xiàn)這個(gè)功能的是A)字段值清洗B)數(shù)據(jù)格式探查C)要素提取D)數(shù)據(jù)對(duì)標(biāo)[單選題]31.在全文本搜索的函數(shù)中,用于指定被搜索的列的是()A)MATCH()B)AGAINST()C)FULLTEXT()D)REGEXP()[單選題]32.創(chuàng)建視圖的命令是()A)alterviewB)altertableC)createtableD)createview[單選題]33.某二叉樹共有12個(gè)結(jié)點(diǎn),其中葉子結(jié)點(diǎn)只有1個(gè)。則該二叉樹的深度為(根結(jié)點(diǎn)在第1層)___________。A)8B)12C)6D)3[單選題]34.目前來說,國內(nèi)在互聯(lián)網(wǎng)個(gè)人信息安全的保護(hù)措施上,主要利用法律途徑來實(shí)現(xiàn),旨在通過相關(guān)法律條例的制定來加強(qiáng)對(duì)網(wǎng)絡(luò)環(huán)境的監(jiān)管。最為常見的安全隱患則是安全信息的泄露,下面哪項(xiàng)不是泄露的方式。A)部分運(yùn)營商在管理疏漏的情況下對(duì)用戶信息保護(hù)不當(dāng)B)用戶在進(jìn)行第三方溝通時(shí),消息被竊聽者偷取C)用戶通過合法合規(guī)渠道獲取信息D)用戶在瀏覽部分網(wǎng)站的時(shí)候,造成個(gè)人信息的流失[單選題]35.在SQL語言中的視圖VIEW是數(shù)據(jù)庫的()A)外模式B)存儲(chǔ)模式C)模式D)內(nèi)模式[單選題]36.以下屬于PythonWeb開發(fā)框架第三方庫的是:A)DjangoB)WheelC)PygameD)WeRoBot[單選題]37.以下關(guān)于random庫的描述,正確的是:A)設(shè)定相同種子,每次調(diào)用隨機(jī)函數(shù)生成的隨機(jī)數(shù)不相同B)通過fromrandomimport*引入random隨機(jī)庫的部分函數(shù)C)uniform(0,1)與uniform(0.0,1.0)的輸出結(jié)果不同,前者輸出隨機(jī)整數(shù),后者輸出隨機(jī)小數(shù)D)randint(a,b)是生成一個(gè)[a,b]之間的整數(shù)[單選題]38.Python中對(duì)變量描述錯(cuò)誤的選項(xiàng)是:A)Python不需要顯式聲明變量類型,在第一次變量賦值時(shí)由值決定變量的類型B)變量通過變量名訪問C)變量必須在創(chuàng)建和賦值后使用D)變量PI與變量Pi被看作相同的變量[單選題]39.以下插入記錄正確的()A)insertintoemp(ename,hiredate,sal)values(value1,value2,value3);B)insertintoemp(ename,sal)values(value1,value2,value3);C)insertintoemp(ename)values(value1,value2,value3);D)insertintoemp(ename,hiredate,sal)values(value1,value2);[單選題]40.按照姓名升序序排列()A)ORDERBYNAMEASCB)ORDERBYASCNAMEC)ORDERBYNAMEDESCD)ORDERBYDESCNAME[單選題]41.SELECTCOUNT(SAL)FROMEMPGROUPBYDEPTNO;意思是()A)求每個(gè)部門中的工資B)求每個(gè)部門中工資的大小C)求每個(gè)部門中工資的綜合D)求每個(gè)部門中工資的個(gè)數(shù)[單選題]42.requests庫的get()函數(shù)執(zhí)行后會(huì)返回一個(gè)Response類型的對(duì)象,其text屬性以()形式存儲(chǔ)響應(yīng)內(nèi)容A)網(wǎng)頁B)字符串C)整數(shù)D)文本[單選題]43.天算建模平臺(tái)支持發(fā)布模型、發(fā)布模型算子、和數(shù)據(jù)資源的審批,管理員權(quán)限賬戶可查看待審批對(duì)象申請(qǐng)?jiān)?、申?qǐng)人、申請(qǐng)時(shí)間,并完成審批、批量審批操作。請(qǐng)問以上功能是在哪個(gè)模塊實(shí)現(xiàn)的。A)審批管理B)算子管理C)數(shù)據(jù)權(quán)限管理D)廣場(chǎng)管理[單選題]44.存儲(chǔ)過程是一組預(yù)先定義并()的Transact-SQL語句A)保存B)編寫C)編譯D)解釋[單選題]45.數(shù)據(jù)挖掘標(biāo)準(zhǔn)是指挖掘從大量數(shù)據(jù)中發(fā)現(xiàn)隱藏的、先前未知且可用的相互關(guān)系的數(shù)據(jù)過程規(guī)范。數(shù)據(jù)挖掘標(biāo)準(zhǔn)提出并規(guī)范了目前廣泛接受應(yīng)用的四種數(shù)據(jù)挖掘技術(shù),這四種常用的數(shù)據(jù)挖掘技術(shù)方法不包括()A)分類B)比對(duì)C)聚類D)預(yù)測(cè)[單選題]46.表達(dá)式print("{:.2f}".format(20-2**3+10/3**2*5))的結(jié)果是:A)55B)56C)22D)17.56[單選題]47.如果要回滾一個(gè)事務(wù),則要使用()語句。A)committransactionB)begintransactionC)revokeD)rollbacktransaction[單選題]48.對(duì)比分析,當(dāng)統(tǒng)計(jì)項(xiàng)(度量)差異較大時(shí),如億級(jí)數(shù)據(jù)與百分比數(shù)據(jù),選中那類圖表比較合適?()A)柱狀圖B)條形圖C)折線圖D)雙軸圖[單選題]49.耦合性和內(nèi)聚性是對(duì)模塊獨(dú)立性度量的兩個(gè)標(biāo)準(zhǔn)。下面敘述中正確的是A)降低耦合性提高內(nèi)聚性有利于提高模塊的獨(dú)立性B)耦合性是指一個(gè)模塊內(nèi)部個(gè)元素間彼此結(jié)合的緊密程度C)提高耦合性降低內(nèi)聚性有利于提高模塊的獨(dú)立性D)內(nèi)聚性是模塊間相互連接的緊密程度[單選題]50.用戶輸入整數(shù)的時(shí)候不合規(guī)導(dǎo)致程序出錯(cuò),為了不讓程序異常中斷,需要用到的語句是:A)if語句B)eval語句C)try-except語句D)循環(huán)語句[單選題]51.以下選項(xiàng)中,不是pip工具進(jìn)行第三方庫安裝的作用的是:A)安裝一個(gè)庫B)卸載一個(gè)已經(jīng)安裝的第三方庫C)列出當(dāng)前系統(tǒng)已經(jīng)安裝的第三方庫D)腳本程序轉(zhuǎn)變?yōu)榭蓤?zhí)行程序[單選題]52.可以在創(chuàng)建表時(shí)用()來創(chuàng)建唯一索引,也可以用()來創(chuàng)建唯一索引A)Createtable,CreateindexB)設(shè)置主鍵約束,設(shè)置唯一約束C)設(shè)置主鍵約束,CreateindexD)以上都可以[單選題]53.在數(shù)據(jù)結(jié)構(gòu)中,()的結(jié)點(diǎn)之間存在一對(duì)一的關(guān)系,它的特點(diǎn)是開始結(jié)點(diǎn)和終端結(jié)點(diǎn)都是惟一的,除了開始結(jié)點(diǎn)和終端結(jié)點(diǎn)以外,其余結(jié)點(diǎn)都有且僅有一個(gè)前驅(qū)結(jié)點(diǎn),有且僅有一個(gè)后繼結(jié)點(diǎn)。A)線性結(jié)構(gòu)B)非線性結(jié)構(gòu)C)存儲(chǔ)結(jié)構(gòu)D)邏輯結(jié)構(gòu)[單選題]54.文件book.txt在當(dāng)前程序所在目錄內(nèi),其內(nèi)容是一段文本:book,下面代碼的輸出結(jié)果是:txt=open("book.txt","r")print(txt)txt.close()A)book.txtB)txtC)bookD)以上答案都不對(duì)[單選題]55.圖表中對(duì)已有字段信息進(jìn)行重新分組的功能是?()A)新增分組字段B)新增計(jì)算字段C)篩選器D)條件樣式[單選題]56.下列的SQL語句中,()不是數(shù)據(jù)定義語句。A)CREATETABLEB)GRANTC)CREATEVIEWD)DROPVIEW[單選題]57.視圖是一種常用的數(shù)據(jù)對(duì)象,它是提供()和()數(shù)據(jù)的另一種途徑,可以簡(jiǎn)化數(shù)據(jù)庫操作A)插入,更新B)查看,檢索C)查看,存放D)檢索,插入[單選題]58.數(shù)據(jù)庫服務(wù)器、數(shù)據(jù)庫和表的關(guān)系,正確的說法是()A)一個(gè)數(shù)據(jù)庫服務(wù)器只能管理一個(gè)數(shù)據(jù)庫,一個(gè)數(shù)據(jù)庫只能包含一個(gè)表B)一個(gè)數(shù)據(jù)庫服務(wù)器可以管理多個(gè)數(shù)據(jù)庫,一個(gè)數(shù)據(jù)庫可以包含多個(gè)表C)一個(gè)數(shù)據(jù)庫服務(wù)器只能管理一個(gè)數(shù)據(jù)庫,一個(gè)數(shù)據(jù)庫可以包含多個(gè)表D)一個(gè)數(shù)據(jù)庫服務(wù)器可以管理多個(gè)數(shù)據(jù)庫,一個(gè)數(shù)據(jù)庫只能包含一個(gè)表[單選題]59.多用于結(jié)構(gòu)分析場(chǎng)景,以樹枝狀形式展示數(shù)據(jù)構(gòu)成或內(nèi)在邏輯關(guān)系的圖表是?()A)雷達(dá)圖B)漏斗圖C)瀑布圖D)樹圖[單選題]60.當(dāng)用戶輸入abc時(shí),下面代碼的輸出結(jié)果是:try:n=0n=input("請(qǐng)輸入一個(gè)整數(shù):")defpow10(n):returnn**10except:print("程序執(zhí)行錯(cuò)誤")A)輸出:abcB)程序沒有任何輸出C)輸出:0D)輸出:程序執(zhí)行錯(cuò)誤[單選題]61.個(gè)棧的初始狀態(tài)為空?,F(xiàn)將元素1、2、3、4、5、A、B、C、D、E依次入棧,然后再依次出棧,則元素出棧的順序是A)12345ABCDEB)EDCBA54321C)54321EDCBAD)ABCDE12345[單選題]62.根據(jù)需求做完數(shù)據(jù)分析后需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)簽標(biāo)記,以下不能實(shí)現(xiàn)該需求的是A)缺失值處理B)添加字段C)字段值替換D)值映射[單選題]63.在關(guān)系數(shù)據(jù)庫中,用來表示實(shí)體之間聯(lián)系的是___________。A)網(wǎng)結(jié)構(gòu)B)二維表C)線性表D)樹結(jié)構(gòu)[單選題]64.請(qǐng)問,()是?按照數(shù)據(jù)結(jié)構(gòu)來組織、存儲(chǔ)和管理數(shù)據(jù)的倉庫?,是一個(gè)長(zhǎng)期存儲(chǔ)在計(jì)算機(jī)內(nèi)的、有組織的、可共享的、統(tǒng)一管理的大量數(shù)據(jù)的集合。A)數(shù)據(jù)表B)數(shù)據(jù)沼澤C)數(shù)據(jù)中臺(tái)D)數(shù)據(jù)庫[單選題]65.向數(shù)據(jù)表中插入一條記錄用以下哪一項(xiàng)()A)CREATEB)INSERTC)SAVED)UPDATE[單選題]66.在matplotlib子圖繪制中,若執(zhí)行plt.subplot(3,2,4),則當(dāng)前的繪圖子區(qū)域索引號(hào)是()A)2B)3C)4D)6[單選題]67.用Pyinstall工具把Python源文件打包成一個(gè)獨(dú)立的可執(zhí)行文件,使用的參數(shù)是:A)-DB)-LC)-iD)-F[單選題]68.下面代碼的輸出結(jié)果是:x=12.34print(type(x))A)<class'int'>B)<class'float'>C)<class'bool'>D)<class'complex'>[單選題]69.以下哪項(xiàng)用來排序()A)ORDEREDBYB)ORDERBYC)GROUPBYD)GROUPEDBY[單選題]70.以下程序輸出到文件text.csv里的結(jié)果是:fo=open("text.csv",'w')x=[90,87,93]fo.write(",".join(str(x)))fo.close()A)[90,87,93]B)90,87,93C),9,0,,,,8,7,,,,9,3,D)[,9,0,,,,8,7,,,,9,3,][單選題]71.在建模過程中,身份證號(hào)字段有10個(gè)數(shù)據(jù),其中6個(gè)是規(guī)范化的數(shù)據(jù),4個(gè)是臟數(shù)據(jù),可通過()算子清洗出符合規(guī)則的6個(gè)數(shù)據(jù),也可以根據(jù)實(shí)際需要清洗出不符合規(guī)則的4個(gè)臟數(shù)據(jù)進(jìn)行補(bǔ)全。A)過濾B)無效數(shù)據(jù)過濾C)添加字段D)值映射[單選題]72.要得到最后一句SELECT查詢到的總行數(shù),可以使用的函數(shù)是()A)FOUND_ROWSB)LAST_ROWSC)ROW_COUNTD)LAST_INSERT_ID[單選題]73.軟件開發(fā)的結(jié)構(gòu)化生命周期方法將軟件生命周期劃分成A)定義、開發(fā)、運(yùn)行維護(hù)B)設(shè)計(jì)階段、編程階段、測(cè)試階段C)總體設(shè)計(jì)、詳細(xì)設(shè)計(jì)、編程調(diào)試D)需求分析、功能定義、系統(tǒng)設(shè)計(jì)[單選題]74.以下哪種操作能夠?qū)崿F(xiàn)實(shí)體完整性()A)設(shè)置唯一鍵B)設(shè)置外鍵C)減少數(shù)據(jù)冗余D)設(shè)置主鍵[單選題]75.連接算子用于把兩張(或兩張以上)表按照內(nèi)連接和外連接(左連接、右連接、全連接)這四種邏輯連接起來。以左表為準(zhǔn),查詢出左表的所有數(shù)據(jù)是其中的A)內(nèi)連接B)全連接C)左連接D)右連接[單選題]76.按照姓名降序排列()A)ORDERBYDESCNAMEB)ORDERBYNAMEDESCC)ORDERBYNAMEASCD)ORDERBYASCNAME[單選題]77.?2022/1/31?可以用什么算子轉(zhuǎn)換成?2022-1-31?格式A)值映射B)字段值替換C)缺失值處理D)類型轉(zhuǎn)換[單選題]78.以下哪項(xiàng)用于左連接()A)JOINB)RIGHTJOINC)LEFTJOIND)INNERJOIN[單選題]79.以下表示可變長(zhǎng)度字符串的數(shù)據(jù)類型是()A)TEXTB)CHARC)VARCHARD)EMUM[單選題]80.通過線條起伏展示數(shù)據(jù)變化,并通過面積渲染引起對(duì)總值關(guān)注的圖表是?()A)折線圖B)面積圖C)雙軸圖D)瀑布圖[單選題]81.下列哪一種不屬于BI工具數(shù)據(jù)集的數(shù)據(jù)字段類型?()A)文本B)數(shù)值C)日期D)整型[單選題]82.進(jìn)入要操作的數(shù)據(jù)庫TEST用以下哪一項(xiàng)()A)INTESTB)SHOWTESTC)USERTESTD)USETEST[單選題]83.過濾算子可以配置不同的條件,模糊匹配,篩選出任意位置沒有輸入字符的記錄的條件是A)包含B)不包含C)在列表中D)等于[單選題]84.有一個(gè)文件記錄了1000個(gè)人的高考成績(jī)總分,每一行信息長(zhǎng)度是20個(gè)字節(jié),要想只讀取最后10行的內(nèi)容,不可能用到的函數(shù)是:A)seek()B)read()C)open()D)readline()[單選題]85.以下程序的輸出結(jié)果是:ss=list(set("jzzszyj"))ss.sort()print(ss)A)['z','j','s','y']B)['j','s','y','z']C)['j','z','z','s','z','y','j']D)['j','j','s','y','z','z','z'][單選題]86.以下關(guān)于列表操作的描述,錯(cuò)誤的是:A)通過append方法可以向列表添加元素B)通過extend方法可以將另一個(gè)列表中的元素逐一添加到列表中C)通過insert(index,object)方法在指定位置index前插入元素objectD)通過add方法可以向列表添加元素[單選題]87.正則表達(dá)式的轉(zhuǎn)義符是()A)\\B)\C);D)$$[單選題]88.這里有兩張表,xx省職業(yè)學(xué)生登記信息(未發(fā)達(dá)地市),xx省職業(yè)學(xué)生登記信息(發(fā)達(dá)地市),現(xiàn)要對(duì)兩張表進(jìn)行合并,但是希望保留數(shù)據(jù)來源。所以在并集之前對(duì)兩張表先進(jìn)行()操作增加?數(shù)據(jù)來源?字段,錄入數(shù)據(jù)未發(fā)達(dá)地市和發(fā)達(dá)地市,再進(jìn)行合并。A)過濾B)連接C)聚合D)添加字段[單選題]89.如果要統(tǒng)計(jì)某家店鋪當(dāng)天的收益總和,需要按照日期分組,且對(duì)收益的統(tǒng)計(jì)方式是A)最大B)最小C)總數(shù)D)總和[單選題]90.以下哪項(xiàng)不屬于數(shù)據(jù)模型()A)關(guān)系模型B)網(wǎng)狀模型C)層次模型D)網(wǎng)絡(luò)模型[單選題]91.在制作圖表時(shí),為了實(shí)現(xiàn)在單個(gè)圖表中的穿透,可以通過增加()實(shí)現(xiàn)A)圖層B)篩選器C)維度D)度量[單選題]92.以下說法錯(cuò)誤的是()A)SELECTmax(sal),deptno,jobFROMEMPgroupbysal;B)SELECTmax(sal),deptno,jobFROMEMPgroupbydeptno;C)SELECTmax(sal),deptno,jobFROMEMP;D)SELECTmax(sal),deptno,jobFROMEMPgroupbyjob;[單選題]93.條件?IN(20,30,40)?表示()A)年齡在20到40之間B)年齡在20到30之間C)年齡是20或30或40D)年齡在30到40之間[單選題]94.下面哪個(gè)屬于映射數(shù)據(jù)到新的空間的方法?A)傅立葉變換B)特征加權(quán)C)漸進(jìn)抽樣D)維歸約[單選題]95.已知數(shù)據(jù)中時(shí)間字段的格式為2021-01-0100:00:00,如果使用過濾算子,過濾出2021年5月1日以來的數(shù)據(jù),以下哪個(gè)是正確的設(shè)置A)大于2021-05-0100:00:00B)小于2021-05-0100:00:00C)大于等于2021-05-0100:00:00D)小于等于2021-05-0100:00:00[單選題]96.查找表結(jié)構(gòu)用以下哪一項(xiàng)()A)FINDB)SELETEC)ALTERD)DESC[單選題]97.可以用一組屬性描述其定義、標(biāo)識(shí)、表示和允許值的數(shù)據(jù)單元,在一定語境下,通常用于構(gòu)建一個(gè)正確、獨(dú)立且無歧義的特定概念語義的信息單元,可以理解為數(shù)據(jù)的基本單元。請(qǐng)問該基本單元是指?A)字段B)數(shù)據(jù)元C)元數(shù)據(jù)D)數(shù)值[單選題]98.下列哪一項(xiàng)不屬于儀表板的布局模式()A)標(biāo)準(zhǔn)模式B)自由模式C)標(biāo)準(zhǔn)模式(分頁)D)自由模式(分頁)[單選題]99.觸發(fā)器不是響應(yīng)以下哪一語句而自動(dòng)執(zhí)行的Mysql語句A)selectB)insertC)deleteD)update[單選題]100.第一次啟動(dòng)Hadoop需要初始化(初始化后不要多次初始化,多次初始化需要?jiǎng)h除),初始化成功后,可以在某個(gè)目錄下(該路徑在hdfs-site.xml文件中進(jìn)行了相應(yīng)配置,并新建了該文件夾)新增文件。Hadoop啟動(dòng)的命令是?A)/bin/start-dfs.shB)/sbin/start-dfs.shC)/etc/start-dfs.shD)/sbin/stop-dfs.sh[單選題]101.數(shù)據(jù)對(duì)賬主要是針對(duì)數(shù)據(jù)治理過程中,數(shù)據(jù)提供方與數(shù)據(jù)治理方的數(shù)據(jù)賬單的一致性對(duì)賬,以確保數(shù)據(jù)在治理過程中的完整性。數(shù)據(jù)對(duì)賬主要是對(duì)數(shù)據(jù)的多個(gè)維度進(jìn)行校驗(yàn),以下選項(xiàng)不屬于校驗(yàn)維度的是?A)唯一性B)完整性C)實(shí)時(shí)性D)正確性[單選題]102.查找數(shù)據(jù)庫中所有的數(shù)據(jù)表用以下哪一項(xiàng)()A)SHOWDATABASEB)SHOWTABLESC)SHOWDATABASESD)SHOWTABLE[單選題]103.下面關(guān)于數(shù)據(jù)粒度的描述不正確的是:A)粒度是指數(shù)據(jù)倉庫小數(shù)據(jù)單元的詳細(xì)程度和級(jí)別B)數(shù)據(jù)越詳細(xì),粒度就越小,級(jí)別也就越高C)數(shù)據(jù)綜合度越高,粒度也就越大,級(jí)別也就越高D)粒度的具體劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量[單選題]104.例如數(shù)據(jù)庫中有A表,包括學(xué)生,學(xué)科,成績(jī)?nèi)齻€(gè)字段,數(shù)據(jù)庫結(jié)構(gòu)為學(xué)生學(xué)科成績(jī)張三語文80張三數(shù)學(xué)100李四語文70李四數(shù)學(xué)80李四英語80如何統(tǒng)計(jì)每個(gè)學(xué)科的最高分()A)select學(xué)生,max(成績(jī))fromAgroupby學(xué)生;B)select學(xué)生,max(成績(jī))fromAgroupby學(xué)科;C)select學(xué)生,max(成績(jī))fromAorderby學(xué)生;D)select學(xué)生,max(成績(jī))fromAgroupby成績(jī);[單選題]105.在數(shù)據(jù)庫的發(fā)展歷史上,數(shù)據(jù)庫先后經(jīng)歷了層次數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫和()數(shù)據(jù)庫等各個(gè)階段的發(fā)展,信息化使得數(shù)據(jù)庫技術(shù)呈跨越式變革。A)關(guān)系B)結(jié)構(gòu)C)分布式D)文檔[單選題]106.在建模過程中需要獲取前科人員的鐵路行程情況,可將前科人員數(shù)據(jù)表與鐵路訂票數(shù)據(jù)表進(jìn)行()操作實(shí)現(xiàn)。A)交集B)并集C)差集D)自連接[單選題]107.儀表板中的多個(gè)圖表,可以設(shè)置統(tǒng)一的篩選器,在BI工具中可以通過()功能實(shí)現(xiàn)A)全局設(shè)置B)聯(lián)動(dòng)設(shè)置C)篩選器D)布局設(shè)置[單選題]108.圖表中可定義字段與字段間計(jì)算規(guī)則的功能是?()A)新增分組字段B)新增計(jì)算字段C)篩選器D)條件樣式[單選題]109.從旅客住宿信息表中,通過關(guān)聯(lián)可以找出同住人員,在挖掘犯罪人員團(tuán)伙和在疫情防控中都很有效。以下哪個(gè)算子可以實(shí)現(xiàn)同住條件關(guān)聯(lián)A)并集B)過濾C)差集D)自連接[單選題]110.在SELECT語句中,使用關(guān)鍵字()可以把重復(fù)行屏蔽A)TOPB)ALLC)UNIOND)DISTINCT[單選題]111.BI工具采用哪種分析方式?()A)自助式探索B)圖表展示C)查詢搜索D)人工互助[單選題]112.以下關(guān)于函數(shù)的描述,錯(cuò)誤的是:A)函數(shù)是一種功能抽象B)使用函數(shù)的目的只是為了增加代碼復(fù)用C)函數(shù)名可以是任何有效的Python標(biāo)識(shí)符D)使用函數(shù)后,代碼的維護(hù)難度降低了[單選題]113.查找條件為:姓名為NULL的記錄()A)WHERENAMENULLB)\WHERENAMEISNULLC)WHERENAME=NULLD)\WHERENAME==NULL[單選題]114.刪除經(jīng)銷商1018的數(shù)據(jù)記錄的代碼為()fromdistributorswheredistri_num=1018A)droptableB)delete*C)dropcolumnD)delete[單選題]115.關(guān)系數(shù)據(jù)庫中,主鍵是()A)創(chuàng)建唯一的索引,允許空值B)只允許以表中第一字段建立C)允許有多個(gè)主鍵的D)為標(biāo)識(shí)表中唯一的實(shí)體[單選題]116.以下聚合函數(shù)求數(shù)據(jù)總和的是()A)MAXB)SUMC)COUNTD)AVG[單選題]117.從GROUPBY分組的結(jié)果集中再次用條件表達(dá)式進(jìn)行篩選的子句是()A)FROMB)ORDERBYC)HAVINGD)WHERE[單選題]118.以下刪除數(shù)據(jù)庫emp正確的()A)Delete*fromempB)DropdatabaseempC)Drop*fromempD)deletedatabaseemp[單選題]119.結(jié)構(gòu)化程序設(shè)計(jì)中,下面對(duì)goto語句使用描述正確的是___________。A)禁止使用goto語句B)應(yīng)避免濫用goto語句C)goto語句最好用,不容易造成結(jié)構(gòu)體程序混亂D)使用goto語句程序效率高[單選題]120.以下關(guān)于函數(shù)參數(shù)和返回值的描述,正確的是:A)采用名稱傳參的時(shí)候,實(shí)參的順序需要和形參的順序一致B)可選參數(shù)傳遞指的是沒有傳入對(duì)應(yīng)參數(shù)值的時(shí)候,就不使用該參數(shù)C)函數(shù)能同時(shí)返回多個(gè)參數(shù)值,需要形成一個(gè)列表來返回D)Python支持按照位置傳參也支持名稱傳參,但不支持地址傳參[單選題]121.?中國寶鋼集團(tuán)與上海天律信息技術(shù)有限公司合作,采用數(shù)據(jù)挖掘技術(shù)對(duì)鋼材生產(chǎn)的全流程進(jìn)行質(zhì)量監(jiān)控和分析,構(gòu)建故障地圖,實(shí)時(shí)分析產(chǎn)品出現(xiàn)瑕疵的原因,有效提高了產(chǎn)品的優(yōu)良率?這個(gè)案例屬于()的應(yīng)用A)分類B)聚類C)規(guī)則發(fā)現(xiàn)D)預(yù)測(cè)[單選題]122.UNIQUE惟一索引的作用是()A)保證各行在該索引上的值都不得重復(fù)B)保證各行在該索引上的值不得為NULLC)保證參加惟一索引的各列,不得再參加其他的索引D)保證惟一索引不能被刪除[單選題]123.關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指:A)基本元數(shù)據(jù)與數(shù)據(jù)源,數(shù)據(jù)倉庫,數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息B)基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息C)基本元數(shù)據(jù)包括日志文件和簡(jiǎn)歷執(zhí)行處理的時(shí)序調(diào)度信息D)基本元數(shù)據(jù)包括關(guān)于裝載和更新處理,分析處理以及管理方面的信息[單選題]124.用于將事務(wù)處理寫到數(shù)據(jù)庫的命令是()A)insertB)rollbackC)commitD)savepoint[單選題]125.例如數(shù)據(jù)庫中有A表,包括學(xué)生,學(xué)科,成績(jī)?nèi)齻€(gè)字段,數(shù)據(jù)庫結(jié)構(gòu)為學(xué)生學(xué)科成績(jī)張三語文60張三數(shù)學(xué)100李四語文70李四數(shù)學(xué)80李四英語80如何統(tǒng)計(jì)最高分>80的學(xué)科()A)SELECTMAX(成績(jī))FROMAGROUPBY學(xué)科HAVINGMAX(成績(jī))>80;B)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVING成績(jī)>80;C)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVINGMAX(成績(jī))>80;D)SELECT學(xué)科FROMAGROUPBY學(xué)科WHEREMAX(成績(jī))>80;[單選題]126.以下程序不可能的輸出結(jié)果是:fromrandomimport*x=[30,45,50,90]print(choice(x))A)30B)45C)55D)90[單選題]127.Python內(nèi)置函數(shù)()可以返回列表、元組、字典、集合、字符串以及range對(duì)象中元素個(gè)數(shù)A)dimB)lenC)setD)compute[單選題]128.可以用()來聲明游標(biāo)A)CREATECURSORB)ALTERCURSORC)SETCURSORD)DECLARECURSOR[單選題]129.以下匹配'1ton'和'2ton'及'3ton'的正則表達(dá)式是()A)'123ton'B)'1,2,3ton'C)'[123]ton'D)'1|2|3ton'[單選題]130.以下語句不正確的是()A)select*fromemp;B)selectename,hiredate,salfromemp;C)select*fromemporderdeptno;D)select*fromwheredeptno=1andsal<300;[單選題]131.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?A)分類B)聚類C)關(guān)聯(lián)分析D)隱馬爾可夫鏈[單選題]132.一個(gè)簡(jiǎn)單的Series是由()的數(shù)據(jù)組成的A)兩個(gè)數(shù)組B)三個(gè)數(shù)組C)一個(gè)數(shù)組D)四個(gè)數(shù)組[單選題]133.返回當(dāng)前日期的函數(shù)是()A)curtime()B)adddate()C)curnow()D)curdate()[單選題]134.NumPy框架中數(shù)組的運(yùn)算是元素級(jí)的,數(shù)組相乘的結(jié)果是各對(duì)應(yīng)元素的積組成的數(shù)組,而對(duì)于矩陣而言,需要求的是點(diǎn)積,在NumPy中利用哪個(gè)函數(shù)進(jìn)行矩陣的點(diǎn)乘運(yùn)算?A)dotB)arrayC)readD)show第2部分:多項(xiàng)選擇題,共97題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]135.線性回歸中,我們可以使用正規(guī)方程(NormalEquation)來求解系數(shù)。下列關(guān)于正規(guī)方程說法正確的是?()A)不需要選擇學(xué)習(xí)因子B)當(dāng)特征數(shù)目很多的時(shí)候,運(yùn)算速度會(huì)很慢C)不需要迭代訓(xùn)練[多選題]136.下列是MYSQL比較運(yùn)算符的是()A)!=B)<>C)==D)>=[多選題]137.觸發(fā)器是響應(yīng)以下任意語句而自動(dòng)執(zhí)行的一條或一組MYSQL語句()A)UPDATEB)INSERTC)SELECTD)DELETE[多選題]138.下列關(guān)于sigmoid函數(shù)描述正確的是()A)取值范圍為(0,1),他可以將一個(gè)實(shí)數(shù)映射到(0,1)的區(qū)間,看做概率值B)只能做二分類C)閾值一般設(shè)置在0.5,大于該值的概率表示正例D)只有該函數(shù)能將實(shí)數(shù)映射到(0,1)區(qū)間[多選題]139.在數(shù)據(jù)庫管理系統(tǒng)中,有不同種類的存儲(chǔ)特定信息并支持特定功能的數(shù)據(jù)庫對(duì)象。數(shù)據(jù)庫對(duì)象主要包括()和索引、約束、存儲(chǔ)過程、觸發(fā)器等。A)表B)查詢C)視圖D)頁[多選題]140.機(jī)器學(xué)習(xí)中做特征選擇時(shí),可能用到的方法有?()A)卡方B)信息增益C)平均互信息D)期待交叉熵[多選題]141.云計(jì)算的服務(wù)方式有()A)IaaSB)RaaSC)PaaSD)SaaS[多選題]142.關(guān)于神經(jīng)網(wǎng)絡(luò),下列說法正確的是?()A)增加網(wǎng)絡(luò)層數(shù),可能會(huì)增加測(cè)試集分類錯(cuò)誤率B)增加網(wǎng)絡(luò)層數(shù),一定會(huì)增加訓(xùn)練集分類錯(cuò)誤率C)減少網(wǎng)絡(luò)層數(shù),可能會(huì)減少測(cè)試集分類錯(cuò)誤率D)減少網(wǎng)絡(luò)層數(shù),一定會(huì)減少訓(xùn)練集分類錯(cuò)誤率[多選題]143.下列哪些假設(shè)是我們推導(dǎo)線性回歸參數(shù)時(shí)遵循的()?A)X與Y有線性關(guān)系(多項(xiàng)式關(guān)系)B)模型誤差在統(tǒng)計(jì)學(xué)上是獨(dú)立的C)誤差一般服從0均值和固定標(biāo)準(zhǔn)差的正態(tài)分布D)X是非隨機(jī)且測(cè)量沒有誤差的[多選題]144.Apriori算法的計(jì)算復(fù)雜度受()影響A)支持度閥值B)項(xiàng)數(shù)(維度)C)事務(wù)數(shù)D)事務(wù)平均寬度[多選題]145.下面關(guān)于使用UPDATE語句,正確的是()A)被定義為NOTNULL的列不可以被更新為NULLB)不能在一個(gè)子查詢中更新一個(gè)表,同時(shí)從同一個(gè)表中選擇C)不能把ORDERBY或LIMIT與多表語法的UPDATE語句同時(shí)使用D)如果把一列設(shè)置為其當(dāng)前含有的值,則該列不會(huì)更新[多選題]146.一幅6×6維黑白圖像輸入CNN網(wǎng)絡(luò),經(jīng)過一個(gè)3×3維filter,則filter輸出描述正確的是()A)一個(gè)4×4維特征矩陣B)一個(gè)6×6維特征矩陣C)zeropadstheinputintoa8×8維圖像,得到一個(gè)6×6維特征矩陣D)zeropadstheinputintoa8×8維圖像,得到一個(gè)8×8維特征矩陣[多選題]147.以下哪些方法屬于特征選擇的標(biāo)準(zhǔn)方法:()A)嵌入B)過濾C)包裝D)抽樣[多選題]148.關(guān)于游標(biāo),下列說法正確的是()A)聲明后必須打開游標(biāo)以供使用B)結(jié)束游標(biāo)使用時(shí),必須閉游標(biāo)C)使用游標(biāo)前必須聲明它D)游標(biāo)只能用于存儲(chǔ)過程和函數(shù)[多選題]149.下列哪種方法可以用來減小過擬合?()A)更多的訓(xùn)練數(shù)據(jù)B)L1正則化C)L2正則化D)減小模型的復(fù)雜度[多選題]150.()這些數(shù)據(jù)特性都是對(duì)聚類分析具有很強(qiáng)影響的A)高維性B)規(guī)模C)稀疏性D)噪聲和離群點(diǎn)[多選題]151.從旅客住宿信息表中通過關(guān)聯(lián)可以找出和某個(gè)人一同進(jìn)入某個(gè)賓館住宿的人身份證號(hào),在挖掘犯罪人員團(tuán)伙和在疫情期間追蹤同住人員都很有效。關(guān)聯(lián)時(shí)用到的配置是?A)證件號(hào)碼不等于證件號(hào)碼B)證件號(hào)碼等于證件號(hào)碼C)旅店編碼不等于旅店編碼D)旅店編碼等于旅店編碼[多選題]152.下面語句中,表示過慮條件是vend_id=1002或vend_id=1003的是()A)select*fromproductswherevend_id=1002orvend_id=1003B)select*fromproductswherevend_idin(1002,1003);C)select*fromproductswherevend_idnotin(1004,1005);D)select*fromproductswherevend_id=1002andvend_id=1003[多選題]153.下面數(shù)據(jù)庫名稱合法的是()A)db1/studentB)db1.studentC)db1_studentD)db1&student[多選題]154.關(guān)于GBDT算法,下列說法正確的是()?A)增加用于分割的最小樣本數(shù)量,有助于避免過擬合B)增加用于分割的最小樣本數(shù)量,容易造成過擬合C)減小每個(gè)基本樹的樣本比例,有助于減小方差D)減小每個(gè)基本樹的樣本比例,有助于減小偏差[多選題]155.在mysql提示符下可以輸入一個(gè)SQL語句,并以()結(jié)尾,然后按回車執(zhí)行該語句()A)?\G?B)?。?C)?\g?D)?;?[多選題]156.語句select*fromproductswhereprod_namelike'%se%'結(jié)果集包括()A)檢索products表中prod_name字段以'se'結(jié)尾的數(shù)據(jù)B)檢索products表中prod_name字段以'se'開關(guān)的數(shù)據(jù)C)檢索products表中prod_name字段包含'se'的數(shù)據(jù)D)檢索products表中prod_name字段不包含'se'的數(shù)據(jù)[多選題]157.關(guān)于K均值和DBSCAN的比較,以下說法正確的是()A)K均值丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCAN一般聚類所有對(duì)象B)K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念C)K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀的簇D)K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會(huì)合并有重疊的簇[多選題]158.數(shù)據(jù)挖掘的預(yù)測(cè)建模任務(wù)主要包括哪幾大類問題?:()A)分類B)回歸C)模式發(fā)現(xiàn)D)模式匹配[多選題]159.非頻繁模式()A)其支持度小于閾值B)都是不讓人感興趣的C)包含負(fù)模式和負(fù)相關(guān)模式D)對(duì)異常數(shù)據(jù)項(xiàng)敏感[多選題]160.尋找數(shù)據(jù)集中的關(guān)系是為了尋找精確、方便并且有價(jià)值地總結(jié)出數(shù)據(jù)的某一特征的表示,這個(gè)過程包括了以下哪些步驟?()A)選擇一個(gè)算法過程使評(píng)分函數(shù)最優(yōu)B)決定如何量化和比較不同表示擬合數(shù)據(jù)的好壞C)決定要使用的表示的特征和結(jié)構(gòu)D)決定用什么樣的數(shù)據(jù)管理原則以高效地實(shí)現(xiàn)算法[多選題]161.視圖一般不用于下列哪些語句()A)DELETEB)SELECTC)INSERTD)UPDATE[多選題]162.與傳統(tǒng)的分布式程序設(shè)計(jì)相比,Mapreduce封裝了()等細(xì)節(jié),還提供了一個(gè)簡(jiǎn)單而強(qiáng)大的接口A)并行處理B)容錯(cuò)處理C)本地化計(jì)算D)負(fù)載均衡[多選題]163.以下哪些分類方法不能避免樣本的不平衡問題()A)KNNB)SVMC)BayesD)神經(jīng)網(wǎng)絡(luò)[多選題]164.數(shù)據(jù)從結(jié)構(gòu)上劃分,涉及多種類型,如各類數(shù)據(jù)庫表、XML文件、各類辦公文件、文本、音頻、視頻、圖片等。數(shù)據(jù)的結(jié)構(gòu)一般有哪幾種形態(tài)?A)結(jié)構(gòu)化B)半結(jié)構(gòu)化C)非結(jié)構(gòu)化D)多結(jié)構(gòu)化[多選題]165.有關(guān)數(shù)據(jù)倉庫的開發(fā)特點(diǎn),正確的描述是:()A)數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)B)數(shù)據(jù)倉庫使用的需求在開發(fā)出去就要明確C)數(shù)據(jù)倉庫的開發(fā)是一個(gè)不斷循環(huán)的過程,是啟發(fā)式的開發(fā)D)在數(shù)據(jù)倉庫環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉庫中數(shù)據(jù)分析和處理更靈活,且沒有固定的模式[多選題]166.在字符串比較中,下列哪些是不正確的()A)所有標(biāo)點(diǎn)符號(hào)比數(shù)字大B)所有數(shù)字都比漢字大C)所有英文比數(shù)字小D)所有英文字母都比漢字小[多選題]167.大數(shù)據(jù)時(shí)代,如何確保網(wǎng)絡(luò)數(shù)據(jù)的完整性、可用性和保密性,不受到信息泄漏和非法篡改的安全威脅影響,已成為政府機(jī)構(gòu)、事業(yè)單位信息化健康發(fā)展所要考慮的核心問題。大數(shù)據(jù)安全的防護(hù)技術(shù)包括?A)數(shù)據(jù)資產(chǎn)梳理(敏感數(shù)據(jù)、數(shù)據(jù)庫等進(jìn)行梳理)B)數(shù)據(jù)庫加密(核心數(shù)據(jù)存儲(chǔ)加密)C)數(shù)據(jù)脫敏(敏感數(shù)據(jù)匿名化)D)數(shù)據(jù)庫漏掃(數(shù)據(jù)安全脆弱性檢測(cè))[多選題]168.標(biāo)準(zhǔn)差與方差的關(guān)系是()A)標(biāo)準(zhǔn)差是方差的算術(shù)平方根B)標(biāo)準(zhǔn)差可以反映離散程度,也可以反映出樣本的量綱C)方差只能反映離散程度D)標(biāo)準(zhǔn)差的平方是方差[多選題]169.以下哪些不是常見的時(shí)間序列算法模型?()A)RSIB)MACDC)ARMAD)KDJ[多選題]170.以下哪些學(xué)科和數(shù)據(jù)挖掘有密切聯(lián)系?()A)統(tǒng)計(jì)B)計(jì)算機(jī)組成原理C)礦產(chǎn)挖掘D)人工智能[多選題]171.您需要顯示從2009年1月1日到2009年12月31日雇傭的所有職員的姓名和雇傭日期。職員信息表tblEmployees包含列Name和列HireDate,下面哪些語句能完成該功能()A)SELECTName,HireDateFROMtblEmployeesB)SELECTName,HireDateFROMtblEmployeesWHEREHireDate=?2009-01-01?OR?2009-12-31?C)SELECTName,HireDateFROMtblEmployeesWHEREHireDateBETWEEN?2008-12-31?AND?2010-01-01?D)SELECTName,HireDateFROMtblEmployeesWHEREsubstring(HireDate,1,4)=2009;[多選題]172.在天算建模平臺(tái)中,當(dāng)數(shù)據(jù)資源目錄、公共資源數(shù)據(jù)資源無法滿足建模情況時(shí),可以使用?個(gè)人數(shù)據(jù)?功能,將自己的文件導(dǎo)入/接入到平臺(tái)中,為建模使用。以下哪些文件類型是目前平臺(tái)支持的格式。A)docB)txtC)csvD)excel[多選題]173.下面的選項(xiàng)是關(guān)系數(shù)據(jù)庫基本特征的是()。A)與列的次序無關(guān)B)不同的列應(yīng)有不同的數(shù)據(jù)類型C)不同的列應(yīng)有不同的列名D)與行的次序無關(guān)[多選題]174.下列是SVM核函數(shù)的是:()A)多項(xiàng)式核函數(shù)B)logistic核函數(shù)C)徑向基核函數(shù)D)Sigmoid核函數(shù)[多選題]175.以下哪些選項(xiàng)關(guān)于決策樹的說法是正確的()A)冗余屬性不會(huì)對(duì)決策樹的準(zhǔn)確率造成不利的影響B(tài))子樹可能在決策樹中重復(fù)多次C)決策樹算法對(duì)于噪聲的干擾非常敏感D)尋找最佳決策樹是NP完全問題[多選題]176.下列哪些數(shù)據(jù)是字符型數(shù)據(jù)。()A)中國B)?1+2?C)?can?t?D)?張三-李四?[多選題]177.IF函數(shù)是Excel中最常用的函數(shù)之一,可用于計(jì)算()不僅可以檢查一項(xiàng)內(nèi)容是否等于另一項(xiàng)內(nèi)容并返回單個(gè)結(jié)果,而且還可以根據(jù)需要使用數(shù)學(xué)運(yùn)算符并執(zhí)行其他計(jì)算。A)文本B)數(shù)值C)錯(cuò)誤D)圖片[多選題]178.文本挖掘的工具有()A)SPPTextMiningB)IBMDB2intelligentMinerC)SASTextMinerD)SPSSTextMining[多選題]179.數(shù)據(jù)預(yù)處理方法主要有()A)數(shù)據(jù)清洗B)數(shù)據(jù)集成C)數(shù)據(jù)變換D)數(shù)據(jù)歸約[多選題]180.數(shù)據(jù)資源目錄是指按照統(tǒng)一的標(biāo)準(zhǔn)規(guī)范實(shí)現(xiàn)對(duì)數(shù)據(jù)資源梳理、元數(shù)據(jù)采集、描述、編目、分類目錄管理和可視化應(yīng)用展現(xiàn),以解決數(shù)據(jù)資源的哪些問題?A)有什么數(shù)據(jù)B)數(shù)據(jù)在哪里C)數(shù)據(jù)怎么用D)數(shù)據(jù)是什么[多選題]181.下列語句錯(cuò)誤的是()A)select*fromorderswhereordernameisnotnull;B)select*fromorderswhereordername<>null;C)select*fromorderswhereordernameisnull;D)select*fromorderswhereordernamenotisnull;[多選題]182.?showdatabaseslike?student%??命令可以顯示出以下數(shù)據(jù)庫()A)student_myB)studentyC)mystudentD)student[多選題]183.下面屬于訓(xùn)練集(Trainingdataset)和測(cè)試集(Testingdataset)區(qū)別表述的是()A)Testingdataset用于測(cè)試尋找到的函數(shù)的效果B)Trainingdataset用于尋找函數(shù)C)Trainingdataset用于挑選模D)Trainingdataset用于構(gòu)建模型[多選題]184.下面屬于維歸約常用的線性代數(shù)技術(shù)的有:()A)主成分分析B)特征提取C)奇異值分解D)特征加權(quán)[多選題]185.以下哪些是mySQL數(shù)據(jù)類型()A)BIGINTB)TINYINTC)INTEGERD)INT[多選題]186.L-BFGS的描述中,正確的是()A)適合大規(guī)模的數(shù)值計(jì)算B)具備牛頓法收斂速度快的特點(diǎn)C)不需要存儲(chǔ)Hesse矩陣D)空間消耗相對(duì)于BFGS小[多選題]187.數(shù)據(jù)庫信息的運(yùn)行安全采取的主措施有()。A)備份與恢復(fù)B)應(yīng)急C)風(fēng)險(xiǎn)分析D)審計(jì)跟蹤[多選題]188.以下哪個(gè)聚類算法是屬于基于原型的聚類()A)模糊C均值B)EM算法C)SOMD)CLIQUE[多選題]189.進(jìn)入大數(shù)據(jù)時(shí)代,大量的信息泄露事件接踵而至,中國2000萬顧客酒店開房信息泄露并被19萬次下載,圓通速遞近百萬條快遞單個(gè)人信息不僅網(wǎng)上有售,且單號(hào)數(shù)據(jù)信息還能24小時(shí)更新。因此,大數(shù)據(jù)的最顯著特征是?A)數(shù)據(jù)規(guī)模大B)數(shù)據(jù)類型多樣C)數(shù)據(jù)處理速度快D)數(shù)據(jù)價(jià)值密度高[多選題]190.在挖掘同住人員時(shí)往往需要計(jì)算同住宿人前后入住的時(shí)間差,如已將時(shí)間轉(zhuǎn)換成時(shí)間戳,要計(jì)算兩列時(shí)間戳?xí)r間差的計(jì)算可以使用A)添加字段B)時(shí)間處理C)列計(jì)算D)缺失值處理[多選題]191.以下哪些方法可以直接來對(duì)文本分類?()A)KmeansB)決策樹C)支持向量機(jī)D)KNN[多選題]192.關(guān)于CREATE語句下列說法正確的是()A)createtable表名(字段名1字段類型,字段名2字段類型,)B)createtables表名(字段類型,字段名1字段類型,字段名2)C)createtables表名(字段名1字段類型,字段名2字段類型,)D)createtable表名(字段類型,字段名1字段類型,字段名2)[多選題]193.下面隸屬CNN架構(gòu)的是:()A)Convolutionallayer+MaxPooling循環(huán)數(shù)次B)Convolutionallayer重復(fù)數(shù)次+MaxPooling重復(fù)數(shù)次C)FlattenD)FullyConnectedFeedforwardnetwork[多選題]194.下列哪些指標(biāo)可以用來評(píng)估線性回歸模型()?A)R-squaredB)AdjustedR-SquaredC)FStatisticsD)RMSE/MSE/MAE[多選題]195.Web內(nèi)容挖掘?qū)崿F(xiàn)技術(shù)()A)文本總結(jié)B)文本分類C)文本聚類D)關(guān)聯(lián)規(guī)則[多選題]196.數(shù)據(jù)表本身會(huì)出現(xiàn)不夠干凈的現(xiàn)象,由于人工錄入,接口接入等多方面因素,會(huì)導(dǎo)致有重復(fù)數(shù)據(jù)。要去除這些重復(fù)數(shù)據(jù)我們可以使用A)過濾B)差集C)去重D)自定義SQL算子使用Distinct[多選題]197.噪聲數(shù)據(jù)處理的方法主要有:()A)分箱B)聚類C)關(guān)聯(lián)分析D)回歸[多選題]198.關(guān)于groupby以下語句正確的是()A)SELECTstore_nameFROMStore_InformationGROUPBYstore_nameB)SELECTSUM(sales)FROMStore_InformationGROUPBYsalesC)SELECTstore_name,priceSUM(sales)FROMStore_InformationGROUPBYstore_name,priceD)SELECTstore_name,SUM(sales)FROMStore_InformationGROUPBYstore_name[多選題]199.關(guān)于主鍵下列說法正確的是()A)可以是表中的一個(gè)字段,B)是確定數(shù)據(jù)庫中的表的記錄的唯一標(biāo)識(shí)字段,C)該字段不可為空也不可以重復(fù)D)可以是表中的多個(gè)字段組成的。[多選題]200.ApacheHadoop具有良好的生態(tài)圈系統(tǒng),在Hadoop的生態(tài)圈中包含了許許多多的組件,以下組件哪些屬于Hadoop生態(tài)圈中的組件A)HDFSB)YarnC)HbaseD)Sqoop[多選題]201.影響基本K-均值算法的主要因素有()A)樣本輸入順序B)模式相似性測(cè)度C)聚類準(zhǔn)則D)初始類中心的選取[多選題]202.對(duì)于刪除操作以下說法正確的是()A)dropdatabase數(shù)據(jù)庫名:刪除數(shù)據(jù)庫B)deletefrom表名;刪除表中所有記錄條C)deletefrom表名where字段名=值;刪除符合條件的記錄條D)droptable表名;刪除表[多選題]203.下面哪些方方法不屬于映射數(shù)據(jù)到新的空間?()A)傅立葉變換B)特征加權(quán)C)漸進(jìn)抽樣D)漸進(jìn)抽樣[多選題]204.23關(guān)系數(shù)據(jù)模型哪些優(yōu)點(diǎn)?()A)A)結(jié)構(gòu)簡(jiǎn)單B)C)有標(biāo)準(zhǔn)語言C)B)適用于集合操作D)D)可表示復(fù)雜的語義[多選題]205.在算術(shù)運(yùn)算符、比較運(yùn)算符、邏輯運(yùn)算符,這三種符號(hào)中,它們的優(yōu)先級(jí)排列不正確的是()A)算術(shù)/邏輯/比較B)比較/邏輯/算術(shù)C)比較/算術(shù)/邏輯D)算術(shù)/比較/邏輯[多選題]206.網(wǎng)絡(luò)安全(CyberSecurity)是指網(wǎng)絡(luò)系統(tǒng)的()、()及其系統(tǒng)中的()受到保護(hù),不因偶然的或者惡意的原因而遭受到破壞、更改、泄露,系統(tǒng)連續(xù)可靠正常地運(yùn)行,網(wǎng)絡(luò)服務(wù)不中斷。A)硬件B)軟件C)數(shù)據(jù)D)設(shè)備[多選題]207.關(guān)于insert語句下列說法正確的是()A)insertinto表名values(字段名1對(duì)應(yīng)的值);B)insertinto表名values(字段名1對(duì)應(yīng)的值,字段名2對(duì)應(yīng)值);C)insertinto表名(字段名1)value(字段名1對(duì)應(yīng)的值);D)insertinto表名(字段名1,字段名2)values(字段名1對(duì)應(yīng)的值,字段名2對(duì)應(yīng)值);[多選題]208.數(shù)據(jù)比對(duì)是指按照規(guī)則將輸入的查詢數(shù)據(jù)與處理的數(shù)據(jù)進(jìn)行相同比較或相似度計(jì)算,并支持按要求將匹配中標(biāo)的數(shù)據(jù)返回。數(shù)據(jù)比對(duì)主要有哪幾種數(shù)據(jù)比對(duì)方式?A)結(jié)構(gòu)化比對(duì)B)非結(jié)構(gòu)化比對(duì)C)結(jié)構(gòu)化和非結(jié)構(gòu)化融合比對(duì)D)多結(jié)構(gòu)化比對(duì)[多選題]209.正則表達(dá)式中,重復(fù)元字符?*?表示()A)無匹配B)只匹配1個(gè)C)0個(gè)匹配D)多個(gè)匹配[多選題]210.Excel中有關(guān)數(shù)據(jù)庫內(nèi)容,描述正確的有()。A)每一個(gè)Excel數(shù)據(jù)庫對(duì)應(yīng)一個(gè)工作簿文件B)一列為一個(gè)字段,描述實(shí)體對(duì)象的屬性C)Excel數(shù)據(jù)庫屬于?關(guān)系數(shù)據(jù)模型?,又稱為關(guān)系型數(shù)據(jù)庫D)一行為一個(gè)記錄,描述某個(gè)實(shí)體對(duì)象[多選題]211.在工作表中以列或行的形式排列的數(shù)據(jù)可以繪制為面積圖。面積圖可用于繪制隨時(shí)間發(fā)生的變化量,用于引起人們對(duì)總值趨勢(shì)的關(guān)注。通過顯示所繪制的值的總和,面積圖還可以顯示部分與整體的關(guān)系。A)堆積面積圖B)三維堆積面積C)圖百分比堆積面積圖D)三維百分比堆積面積圖[多選題]212.在mysql提示符下,輸入____命令,可以查看由mysql自己解釋的命令()A)\?B)?C)helpD)\h[多選題]213.SQL語言集幾個(gè)功能模塊為一體,其中包括()A)C.DCLB)DMLC)D.DNLD)A.DDL[多選題]214.下列關(guān)于PCA說法正確的是()?A)在使用PCA之前,我們必須標(biāo)準(zhǔn)化數(shù)據(jù)B)應(yīng)該選擇具有最大方差的主成分C)應(yīng)該選擇具有最小方差的主成分D)可以使用PCA在低維空間中可視化數(shù)據(jù)[多選題]215.下面不屬于機(jī)器學(xué)習(xí)的先天本能是?()A)人們依據(jù)現(xiàn)有數(shù)據(jù)抽象出來的數(shù)學(xué)模型B)學(xué)習(xí)trainingdataset中輸入輸出數(shù)據(jù)間的關(guān)系C)舉一反三學(xué)習(xí)trainingdataset中數(shù)據(jù)D)優(yōu)化輸入數(shù)據(jù)和輸出數(shù)據(jù)的映射關(guān)系/函數(shù)好壞的評(píng)價(jià)函數(shù)[多選題]216.創(chuàng)建數(shù)據(jù)表時(shí),下列哪些列類型的寬度是可以省略的。()A)DATEB)INTC)CHARD)TEXT[多選題]217.Pandas是數(shù)據(jù)分析的三大劍客之一,是Python的核心數(shù)據(jù)分析庫,它提供了快速、靈活、明確的數(shù)據(jù)結(jié)構(gòu),能夠簡(jiǎn)單、直觀、快速地處理各種類型的數(shù)據(jù),那Pandas能處理什么樣的數(shù)據(jù)?A)與SQL或Excel表類似的數(shù)據(jù)B)有序和無序(非固定頻率)的時(shí)間序列數(shù)據(jù)C)帶行列標(biāo)簽的矩陣數(shù)據(jù)D)任意其他形式的觀測(cè)、統(tǒng)計(jì)數(shù)據(jù)集[多選題]218.數(shù)據(jù)邏輯結(jié)構(gòu)是指反映數(shù)據(jù)元素之間的邏輯關(guān)系的數(shù)據(jù)結(jié)構(gòu),其中的邏輯關(guān)系是指數(shù)據(jù)元素之間的前后間關(guān)系,而與他們?cè)谟?jì)算機(jī)中的存儲(chǔ)位置無關(guān),數(shù)據(jù)邏輯結(jié)構(gòu)包括()。A)集合B)線性結(jié)構(gòu)C)樹形結(jié)構(gòu)D)圖形結(jié)構(gòu)[多選題]219.下面關(guān)于CNNMaxPooling功能描述正確的是:()A)SubsamplingthepixelswillnotchangetheobjectB)對(duì)Convolutionallayer提取的特征進(jìn)一步降維C)AlphaGoCNN中沒有包含MaxPoolingD)同一特征的強(qiáng)度信息丟失[多選題]220.如需在出入境表中,分性別統(tǒng)計(jì)出入境的人數(shù),需要用到的算子和聚合函數(shù)是A)過濾B)聚合C)總數(shù)D)總和[多選題]221.按照單位各中心的KPI分值進(jìn)行統(tǒng)計(jì),可以求出最高分值和最低的分值。統(tǒng)計(jì)時(shí)的聚合函數(shù)應(yīng)選擇A)最大B)最小C)總數(shù)D)去重總數(shù)[多選題]222.以下說法正確的是()A)一個(gè)服務(wù)器只能有一個(gè)數(shù)據(jù)庫B)一個(gè)服務(wù)器可以有多個(gè)數(shù)據(jù)庫C)一個(gè)數(shù)據(jù)庫只能建立一張數(shù)據(jù)表D)一個(gè)數(shù)據(jù)庫可以建立多張數(shù)據(jù)表[多選題]223.關(guān)于語句limit5,5,說法正確的是A)表示檢索出第5行開始的5條記錄B)表示檢索出行6開始的5條記錄C)表示檢索出第6行開始的5條記錄D)表示檢索出行5開始的5條記錄[多選題]224.數(shù)據(jù)挖掘標(biāo)準(zhǔn)是指挖掘從大量數(shù)據(jù)中發(fā)現(xiàn)隱藏的、先前未知且可用的相互關(guān)系的數(shù)據(jù)過程規(guī)范;數(shù)據(jù)挖掘標(biāo)準(zhǔn)提出并規(guī)范了目前廣泛接受應(yīng)用的四種數(shù)據(jù)挖掘技術(shù),分別為分類、聚類、()、(),可視的機(jī)器學(xué)習(xí)模式是不斷優(yōu)化而來的A)比對(duì)B)規(guī)則發(fā)現(xiàn)C)預(yù)測(cè)D)離散[多選題]225.在疫情防控階段,經(jīng)常通過建模來分析對(duì)象的通行和同住行為?,F(xiàn)要對(duì)旅客住宿數(shù)據(jù)表進(jìn)行建模,找出同住人員,可能需要用到以下哪些字段A)入住時(shí)間B)場(chǎng)所編碼C)房間號(hào)D)證件號(hào)碼[多選題]226.邏輯回歸的優(yōu)點(diǎn)有哪些?()A)形式簡(jiǎn)單B)模型效果不錯(cuò)C)訓(xùn)練速度快D)方便輸出結(jié)果調(diào)整[多選題]227.聯(lián)機(jī)分析處理包括以下哪些基本分析功能?()A)聚類B)切片C)轉(zhuǎn)軸D)切塊E)分類[多選題]228.下列方法中,可以用于特征降維的方法包括?()A)主成分分析PCAB)線性判別分析LDAC)AutoEncoderD)矩陣奇異值分解SVDE)最小二乘法LeastSquares[多選題]229.在現(xiàn)實(shí)世界的數(shù)據(jù)中,元組在某些屬性上缺少值是常有的。描述處理該問題的各種方法有:()A)忽略元組B)使用屬性的平均值填充空缺值C)使用一個(gè)全局常量填充空缺值D)使用與給定元組屬同一類的所有樣本的平均值E)使用最可能的值填充空缺值[多選題]230.下面哪些屬于可視化高維數(shù)據(jù)技術(shù)()A)矩陣B)平行坐標(biāo)系C)星形坐標(biāo)D)散布圖E)Chernoff臉[多選題]231.當(dāng)數(shù)據(jù)集中樣本類別不均衡時(shí),常采用哪些方法來解決?()A)降采樣B)升采樣C)人造數(shù)據(jù)D)更換分類算法E)以上都不是第3部分:判斷題,共29題,請(qǐng)判斷題目是否正確。[判斷題]232.()LTRIM、RTRIM、TRIM函數(shù)既能去除半角空格,又能去除全角空格。A)正確B)錯(cuò)誤[判斷題]233.兩個(gè)變量的Pearson相關(guān)性系數(shù)為零,但這兩個(gè)變量的值同樣可以相關(guān)A)正確B)錯(cuò)誤[判斷題]234.()結(jié)構(gòu)化查詢語言只涉及查詢數(shù)據(jù)的語句,并不包括修改和刪除數(shù)據(jù)的語句。A)正確B)錯(cuò)誤[判斷題]235.回歸任務(wù)是預(yù)測(cè)連續(xù)值A(chǔ))正確B)錯(cuò)誤[判斷題]236.BI工具數(shù)據(jù)集支持添加、刪除字段操作()A)正確B)錯(cuò)誤[判斷題]237.定義類時(shí)實(shí)現(xiàn)了__pow__()方法,該類對(duì)象即可支持運(yùn)算符**A)正確B)錯(cuò)誤[判斷題]238.列表可以作為字典的?鍵?A)正確B)錯(cuò)誤[判斷題]239.數(shù)據(jù)規(guī)范化指將數(shù)據(jù)按比例縮放(如更換大單位),使之落入一個(gè)特定的區(qū)域(如0-1)以提高數(shù)據(jù)挖掘效率的方法。規(guī)范化的常用方法有:最大-最小規(guī)范化、零-均值規(guī)范化、小數(shù)定標(biāo)規(guī)范化A)正確B)錯(cuò)誤[判斷題]240.離群點(diǎn)可以是合法的數(shù)據(jù)對(duì)象或者值。A)正確B)錯(cuò)誤[判斷題]241.分類算法的召回率是指檢索出的相關(guān)文檔數(shù)和文檔庫中所有的相關(guān)文檔數(shù)的比率,衡量的是檢索系統(tǒng)的查全率A)正確B)錯(cuò)誤[判斷題]242.假設(shè)random模塊已導(dǎo)入,那么表達(dá)式random.sample(range(10),7)的作用是生成7個(gè)不重復(fù)的整數(shù)A)正確B)錯(cuò)誤[判斷題]243.數(shù)據(jù)挖掘的目標(biāo)不在于數(shù)據(jù)采集策略,而在于對(duì)于已經(jīng)存在的數(shù)據(jù)進(jìn)行模式的發(fā)掘。A)正確B)錯(cuò)誤[判斷題]244.給定由兩次運(yùn)行K均值產(chǎn)生的兩個(gè)不同的簇集,誤差的平方和最大的那個(gè)應(yīng)該被視為較優(yōu)A)正確B)錯(cuò)誤[判斷題]245.數(shù)據(jù)分析是有組織有目的地收集數(shù)據(jù)、分析數(shù)據(jù),使之成為信息的過程,目的是把隱藏在一大批看起來雜亂無章的數(shù)據(jù)中的信息集中和提煉出來,從而找出所研究對(duì)象的內(nèi)在規(guī)律()A)正確B)錯(cuò)誤[判斷題]246.在同行同住模型中,常用連接算子配置連接條件時(shí),會(huì)設(shè)置?證件號(hào)碼≠證件號(hào)碼?(即兩張表的證件號(hào)碼不相等條件),是為了避免兩張表?自己?跟?自己?連接的情況A)正確B)錯(cuò)誤[判斷題]247.()UPDATE語句可以有WHERE子句和LIMIT子句。A)正確B)錯(cuò)誤[判斷題]248.聚類(clustering)是這樣的過程:它找出描述并區(qū)分?jǐn)?shù)據(jù)類或概念的模型(或函數(shù)),以便能夠使用模型預(yù)測(cè)類標(biāo)記未知的對(duì)象類。A)正確B)錯(cuò)誤[判斷題]249.正則表達(dá)式元字符?^?一般用來表示從字符串開始處進(jìn)行匹配,用在一對(duì)方括號(hào)中的時(shí)候則表示反向匹配,不匹配方括號(hào)中的字符A)正確B)錯(cuò)誤[判斷題]250.對(duì)于SVM分類算法,待分樣本集中的大部分樣本不是支持向量,移去或者減少這些樣本對(duì)分類結(jié)果沒有影響A)正確B)錯(cuò)誤[判斷題]251.邏輯回歸不能處理三分類問題A)正確B)錯(cuò)誤[判斷題]252.對(duì)于PCA處理后的特征,其樸素貝葉斯特征相互獨(dú)立的假設(shè)一定成立,因?yàn)樗兄鞒煞侄际钦坏?,所以不相關(guān)A)正確B)錯(cuò)誤[判斷題]253.只可以動(dòng)態(tài)為對(duì)象增加數(shù)據(jù)成員,而不能為對(duì)象動(dòng)態(tài)增加成員方法A)正確B)錯(cuò)誤[判斷題]254.假設(shè)有非空列表x,那么x.append(3)、x=x+[3]與x.insert(0,3)在執(zhí)行時(shí)間上基本沒有太大區(qū)別A)正確B)錯(cuò)誤[判斷題]255.數(shù)據(jù)倉庫系統(tǒng)的組成部分包括數(shù)據(jù)倉庫,倉庫管理,數(shù)據(jù)抽取,分析工具等四個(gè)部分A)正確B)錯(cuò)誤[判斷題]256.DBSCAN是相對(duì)抗噪聲的,并且能夠處理任意形狀和大小的簇A)正確B)錯(cuò)誤[判斷題]257.()UNION中ALL關(guān)鍵字的作用是在結(jié)果集中所有行全部列出,不管是否有重復(fù)行。A)正確B)錯(cuò)誤[判斷題]258.如果需要連接大量字符串成為一個(gè)字符串,那么使用字符串對(duì)象的join()方法比運(yùn)算符+具有更高的效率A)正確B)錯(cuò)誤[判斷題]259.列表對(duì)象的extend()方法屬于原地操作,調(diào)用前后列表對(duì)象的地址不變A)正確B)錯(cuò)誤[判斷題]260.大數(shù)據(jù)的價(jià)值是通過數(shù)據(jù)共享、算法共享后獲取最大的數(shù)據(jù)價(jià)值A(chǔ))正確B)錯(cuò)誤1.答案:A解析:2.答案:B解析:3.答案:A解析:4.答案:B解析:5.答案:C解析:6.答案:D解析:7.答案:C解析:8.答案:C解析:9.答案:B解析:10.答案:C解析:11.答案:A解析:12.答案:C解析:13.答案:D解析:14.答

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論