數(shù)據(jù)倉庫工程師崗位招聘考試試卷及答案_第1頁
數(shù)據(jù)倉庫工程師崗位招聘考試試卷及答案_第2頁
數(shù)據(jù)倉庫工程師崗位招聘考試試卷及答案_第3頁
數(shù)據(jù)倉庫工程師崗位招聘考試試卷及答案_第4頁
數(shù)據(jù)倉庫工程師崗位招聘考試試卷及答案_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)倉庫工程師崗位招聘考試試卷及答案數(shù)據(jù)倉庫工程師崗位招聘考試試卷一、填空題(10題,每題1分)1.數(shù)據(jù)倉庫的核心特征包括面向主題、集成性、非易失性和______。2.ETL過程中,從源系統(tǒng)抽取數(shù)據(jù)的階段稱為______。3.星型模型中,圍繞中心事實表的是______表。4.Hive中用于定義表結(jié)構(gòu)的語句是______。5.維度建模的四個步驟是選擇維度、定義粒度、確定事實和______。6.數(shù)據(jù)倉庫中,用于分析歷史數(shù)據(jù)趨勢的常用聚合函數(shù)是______(舉1例)。7.Flink中用于處理實時數(shù)據(jù)流的核心組件是______。8.雪花模型是星型模型的擴展,維度表之間存在______關(guān)系。9.數(shù)倉分層中,ODS層的全稱是______。10.數(shù)據(jù)質(zhì)量的核心指標(biāo)包括準(zhǔn)確性、完整性、一致性和______。二、單項選擇題(10題,每題2分)1.以下哪項不屬于數(shù)據(jù)倉庫的特征?A.面向主題B.實時事務(wù)處理C.非易失性D.集成性2.ETL中的“L”代表什么?A.LoadB.LinkC.LayerD.List3.星型模型與雪花模型的主要區(qū)別是?A.事實表數(shù)量B.維度表層級C.分區(qū)方式D.存儲引擎4.Hive中,哪種表適合存儲半結(jié)構(gòu)化數(shù)據(jù)(如JSON)?A.外部表B.內(nèi)部表C.分區(qū)表D.分桶表5.以下哪種數(shù)倉模型屬于維度建模?A.第三范式B.星型模型C.關(guān)系模型D.實體-關(guān)系模型6.SparkSQL中,用于執(zhí)行SQL查詢的組件是?A.SparkCoreB.SparkStreamingC.SparkSQLD.SparkMLlib7.數(shù)倉分層中,最貼近業(yè)務(wù)報表的分析層是?A.ODSB.DWDC.DWSD.ADS8.Flink的窗口類型中,基于固定時間間隔的窗口是?A.TumblingWindowB.SlidingWindowC.SessionWindowD.GlobalWindow9.以下哪項屬于數(shù)據(jù)質(zhì)量問題?A.數(shù)據(jù)重復(fù)B.數(shù)據(jù)類型正確C.數(shù)據(jù)及時更新D.數(shù)據(jù)完整10.湖倉一體的核心優(yōu)勢是?A.只支持結(jié)構(gòu)化數(shù)據(jù)B.無法實時處理C.統(tǒng)一存儲與計算D.成本更高三、多項選擇題(10題,每題2分)1.數(shù)據(jù)倉庫的常見分層包括?A.ODSB.DWDC.DWSD.ADS2.以下屬于ETL工具的是?A.TalendB.InformaticaC.SparkD.Flink3.維度建模的事實表類型包括?A.事務(wù)事實表B.周期快照事實表C.累積快照事實表D.維度事實表4.Hive的常用存儲格式包括?A.ORCB.ParquetC.CSVD.JSON5.數(shù)據(jù)倉庫與數(shù)據(jù)庫的區(qū)別包括?A.用途(分析vs事務(wù))B.數(shù)據(jù)模型(維度vs關(guān)系)C.實時性(低vs高)D.數(shù)據(jù)量(大vs小)6.Spark的核心組件包括?A.SparkCoreB.SparkSQLC.SparkStreamingD.SparkMLlib7.湖倉一體的關(guān)鍵技術(shù)包括?A.統(tǒng)一元數(shù)據(jù)B.統(tǒng)一計算引擎C.分層存儲D.實時處理8.數(shù)據(jù)質(zhì)量控制方法包括?A.數(shù)據(jù)清洗B.數(shù)據(jù)校驗C.數(shù)據(jù)監(jiān)控D.數(shù)據(jù)歸檔9.星型模型的特點包括?A.事實表單一B.維度表扁平C.查詢性能高D.存儲冗余大10.以下屬于OLAP操作的是?A.切片B.切塊C.鉆取D.旋轉(zhuǎn)四、判斷題(10題,每題2分)1.數(shù)據(jù)倉庫支持高頻實時事務(wù)處理。()2.ETL的轉(zhuǎn)換階段負(fù)責(zé)清洗、格式轉(zhuǎn)換等數(shù)據(jù)加工。()3.雪花模型的查詢性能比星型模型高。()4.Hive內(nèi)部表刪除時會同步刪除數(shù)據(jù)文件。()5.維度建模嚴(yán)格遵循第三范式。()6.SparkStreaming和Flink均支持實時數(shù)據(jù)流處理。()7.ODS層存儲的是已清洗的結(jié)構(gòu)化數(shù)據(jù)。()8.湖倉一體可同時處理結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。()9.數(shù)據(jù)質(zhì)量的“及時性”指數(shù)據(jù)在業(yè)務(wù)需求時間內(nèi)可用。()10.事實表存儲的是維度屬性信息。()五、簡答題(4題,每題5分)1.簡述數(shù)據(jù)倉庫分層的核心目的。2.星型模型與雪花模型的主要差異是什么?3.簡述ETL三個核心階段的作用。4.什么是湖倉一體?它解決了哪些傳統(tǒng)數(shù)倉的問題?六、討論題(2題,每題5分)1.設(shè)計電商場景下的數(shù)倉分層架構(gòu),說明各層作用及數(shù)據(jù)流轉(zhuǎn)邏輯。2.如何建立數(shù)據(jù)倉庫的數(shù)據(jù)質(zhì)量保障體系?---參考答案一、填空題1.時變性2.抽取(Extract)3.維度4.CREATETABLE5.存儲維度屬性6.SUM(或COUNT、AVG等)7.DataStreamAPI8.層級(父子)9.操作數(shù)據(jù)存儲(OperationalDataStore)10.及時性二、單項選擇題1.B2.A3.B4.A5.B6.C7.D8.A9.A10.C三、多項選擇題1.ABCD2.ABCD3.ABC4.ABCD5.ABCD6.ABCD7.ABCD8.ABC9.ABCD10.ABCD四、判斷題1.×2.√3.×4.√5.×6.√7.×8.√9.√10.×五、簡答題1.分層目的:①解耦業(yè)務(wù)與技術(shù),降低耦合度;②提升數(shù)據(jù)復(fù)用性,避免重復(fù)開發(fā);③分層清洗加工,保障數(shù)據(jù)質(zhì)量;④優(yōu)化查詢性能,適配不同分析場景;⑤清晰數(shù)據(jù)流轉(zhuǎn),便于管理維護(hù)。2.差異:星型模型中心是事實表,維度表直接關(guān)聯(lián)且無層級,查詢性能高但存儲冗余;雪花模型維度表存在層級(如地區(qū)→省份→城市),存儲冗余小但查詢需多表join,性能稍低。3.ETL階段:①抽?。簭脑聪到y(tǒng)提取原始數(shù)據(jù);②轉(zhuǎn)換:清洗(去重、補全)、轉(zhuǎn)換(格式/類型)、整合(多源關(guān)聯(lián));③加載:將加工后的數(shù)據(jù)寫入目標(biāo)數(shù)倉/湖。轉(zhuǎn)換是核心環(huán)節(jié)。4.湖倉一體:整合數(shù)據(jù)湖(存儲原始多源數(shù)據(jù))與數(shù)據(jù)倉庫(結(jié)構(gòu)化分析)的架構(gòu)。解決問題:①避免湖倉數(shù)據(jù)孤島;②統(tǒng)一計算引擎,支持多數(shù)據(jù)類型分析;③提升數(shù)據(jù)流轉(zhuǎn)效率,無需多次轉(zhuǎn)換;④支持實時+離線混合處理。六、討論題1.電商數(shù)倉分層:①ODS層:存儲原始數(shù)據(jù)(訂單、用戶、商品日志等),輕度清洗;②DWD層(明細(xì)):按業(yè)務(wù)域拆分(訂單/用戶明細(xì)),原子粒度;③DWS層(匯總):按主題匯總(日訂單/用戶行為),日/周粒度;④ADS層(應(yīng)用):面向業(yè)務(wù)報表(銷售額/留存),支撐業(yè)務(wù)分析。流轉(zhuǎn):ODS→DWD(清洗)→DWS(匯總)→ADS(報表),各層解耦復(fù)用。2.質(zhì)量保障體系:①事

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論