阿里巴巴2022數(shù)據(jù)挖掘工程師真題_第1頁
阿里巴巴2022數(shù)據(jù)挖掘工程師真題_第2頁
阿里巴巴2022數(shù)據(jù)挖掘工程師真題_第3頁
阿里巴巴2022數(shù)據(jù)挖掘工程師真題_第4頁
阿里巴巴2022數(shù)據(jù)挖掘工程師真題_第5頁
全文預(yù)覽已結(jié)束

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

精品文檔-下載后可編輯阿里巴巴2022數(shù)據(jù)挖掘工程師真題阿里巴巴2022數(shù)據(jù)挖掘工程師真題

1.【單選題】5分|想要了解上海市小學(xué)生的身高,需要抽取500個(gè)樣本,這項(xiàng)調(diào)查中的樣本是?

A從中抽取的500名學(xué)生的身高

B上海市全部小學(xué)生的身高

C從中抽取的500名小學(xué)生

D上海市全部小學(xué)生

2.【單選題】5分|以下對k-means聚類算法解釋正確的是

A能自動識別類的個(gè)數(shù),隨即挑選初始點(diǎn)為中心點(diǎn)計(jì)算

B能自動識別類的個(gè)數(shù),不是隨即挑選初始點(diǎn)為中心點(diǎn)計(jì)算

C不能自動識別類的個(gè)數(shù),隨即挑選初始點(diǎn)為中心點(diǎn)計(jì)算

D不能自動識別類的個(gè)數(shù),不是隨即挑選初始點(diǎn)為中心點(diǎn)計(jì)算

3.【單選題】5分|以下哪個(gè)是常見的時(shí)間序列算法模型

ARSI

BMACD

CARMA

DKDJ

4.【單選題】5分|有個(gè)袋子裝有2個(gè)紅球,2個(gè)藍(lán)球,1個(gè)黃球,取出球以后不再放回,請問取兩次出來的球是相同顏色的概率是多少

A0.3333

B0.25

C0.2

D0.1667

5.【單選題】5分|65,8,50,15,37,24,()。括號中的數(shù)字是()

A25

B26

C22

D27

6.【單選題】5分|一組數(shù)據(jù),均值中位數(shù)眾數(shù),問這組數(shù)據(jù)

A左偏

B右偏

C鐘型

D對稱

7.【單選題】5分|SQL語言允許使用通配符進(jìn)行字符串匹配的操作,其中‘%’可以表示

A零個(gè)字符

B1個(gè)字符

C多個(gè)字符

D以上都可以

8.【單選題】5分|關(guān)于正態(tài)分布,下列說法錯(cuò)誤的是:

A正態(tài)分布具有集中性和對稱性

B正態(tài)分布的均值和方差能夠決定正態(tài)分布的位置和形態(tài)

C正態(tài)分布的偏度為0,峰度為1

D標(biāo)準(zhǔn)正態(tài)分布的均值為0,方差為1

9.【單選題】5分|在以下不同的場景中,使用的分析方法不正確的有

A根據(jù)商家最近一年的經(jīng)營及服務(wù)數(shù)據(jù),用聚類算法判斷出天貓商家在各自主營類目下所屬的商家層級

B根據(jù)商家近幾年的成交數(shù)據(jù),用聚類算法擬合出用戶未來一個(gè)月可能的消費(fèi)金額公式

C用關(guān)聯(lián)規(guī)則算法分析出購買了汽車坐墊的買家,是否適合推薦汽車腳墊

D根據(jù)用戶最近購買的商品信息,用決策樹算法識別出淘寶買家可能是男還是女

10.【單選題】5分|下列時(shí)間序列模型中,哪一個(gè)模型可以較好地?cái)M合波動性的分析和預(yù)測

AAR模型

BMA模型

CARMA模型

DGARCH模型

11.【多選題】10分|excel工作簿a中有兩列id、age,工作簿b中有一列id,需要找到工作薄b中id對應(yīng)的age,可用的函數(shù)包括

Aindex+match

Bvlookup

Chlookup

Dfind

12.【多選題】10分|現(xiàn)在有M個(gè)桶,每桶都有N個(gè)乒乓球,乒乓球的顏色有K種,并且假設(shè)第i個(gè)桶第j種顏色的球個(gè)數(shù)為Cij,比例為Rij=Cij/N,現(xiàn)在要評估哪個(gè)桶的乒乓球顏色純度最高,下列哪種算法和描述是合理的?

A∑(1-Rij*Rij)越小越純

B∑(1-Rij)*(1-Rij)越小越純

C∑(1-Rij)^2越小越純

D-∑Rij*LOG(Rij)越小越純

13.【多選題】10分|關(guān)于相關(guān)系數(shù),下列描述中正確的有:

A相關(guān)系數(shù)為0.8時(shí),說明兩個(gè)變量之間呈正相關(guān)關(guān)系

B相關(guān)系數(shù)等于1相較于相關(guān)系數(shù)等于-1,前者的相關(guān)性更強(qiáng)

C相關(guān)性等于1相較于相關(guān)系數(shù)等于0,前者的相關(guān)性更強(qiáng)

DSpearman相關(guān)系數(shù)可以衡量兩個(gè)定序變量之間的相關(guān)程度

14.【多選題】10分|關(guān)于線性回歸的描述,以下正確的有:

A基本假設(shè)包括隨機(jī)干擾項(xiàng)是均值為0,方差為1的標(biāo)準(zhǔn)正態(tài)分布

B基本假設(shè)包括隨機(jī)干擾下是均值為0的同方差正態(tài)分布

C在違背基本假設(shè)時(shí),普通最小二乘法估計(jì)量不再是最佳線性無偏估計(jì)量

D可以用DW檢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論