2025年大數(shù)據(jù)庫試題及答案_第1頁
2025年大數(shù)據(jù)庫試題及答案_第2頁
2025年大數(shù)據(jù)庫試題及答案_第3頁
2025年大數(shù)據(jù)庫試題及答案_第4頁
2025年大數(shù)據(jù)庫試題及答案_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2025年大數(shù)據(jù)庫試題及答案一、單項選擇題(每題2分,共20分)1.以下關(guān)于關(guān)系模型中候選鍵的描述,正確的是()。A.候選鍵是表中可以唯一標(biāo)識元組的一個屬性B.候選鍵一定是主鍵C.一個關(guān)系中可以有多個候選鍵D.候選鍵不能包含多個屬性2.在SQL中,若要查詢“學(xué)生表”中年齡在20到25歲之間(包含20和25)的學(xué)生,正確的WHERE子句是()。A.WHERE年齡BETWEEN20OR25B.WHERE年齡BETWEEN20AND25C.WHERE年齡>=20OR年齡<=25D.WHERE年齡IN(20,25)3.下列關(guān)于B+樹索引的說法,錯誤的是()。A.所有葉子節(jié)點通過指針連接,便于范圍查詢B.非葉子節(jié)點僅存儲索引鍵和子節(jié)點指針C.適合頻繁的插入、刪除操作D.索引的高度通常比B樹更低4.事務(wù)的ACID特性中,“隔離性”(Isolation)的作用是()。A.確保事務(wù)執(zhí)行后數(shù)據(jù)保持一致性狀態(tài)B.保證事務(wù)的所有操作要么全部完成,要么全部不執(zhí)行C.防止事務(wù)執(zhí)行過程中因系統(tǒng)故障導(dǎo)致數(shù)據(jù)丟失D.確保多個并發(fā)事務(wù)的執(zhí)行結(jié)果與按某種順序串行執(zhí)行的結(jié)果一致5.某關(guān)系模式R(A,B,C,D),函數(shù)依賴為A→B,B→C,C→D,則R的最高范式是()。A.1NFB.2NFC.3NFD.BCNF6.分布式數(shù)據(jù)庫中,“CAP定理”指的是()。A.一致性、可用性、分區(qū)容忍性不可同時滿足B.完整性、原子性、持久性不可同時滿足C.并發(fā)性、安全性、可靠性不可同時滿足D.可擴(kuò)展性、高吞吐量、低延遲不可同時滿足7.數(shù)據(jù)倉庫的核心特性是()。A.支持實時事務(wù)處理(OLTP)B.面向主題、集成、穩(wěn)定、隨時間變化C.強(qiáng)調(diào)數(shù)據(jù)的實時性和原子性D.僅存儲當(dāng)前最新數(shù)據(jù)8.以下SQL語句中,用于修改表結(jié)構(gòu)的是()。A.UPDATEB.ALTERC.INSERTD.DELETE9.在Hive中,用于將結(jié)構(gòu)化數(shù)據(jù)文件映射為數(shù)據(jù)庫表的語句是()。A.CREATETABLEB.LOADDATAC.INSERTINTOD.SELECT10.關(guān)于數(shù)據(jù)庫索引的優(yōu)化,以下說法正確的是()。A.為所有列添加索引可以提高查詢效率B.覆蓋索引可以避免回表操作C.主鍵自動創(chuàng)建的是非聚簇索引D.索引越多,寫入操作的性能越高二、填空題(每空2分,共20分)1.關(guān)系數(shù)據(jù)庫中,關(guān)系的完整性約束包括實體完整性、參照完整性和__________。2.SQL中,用于返回查詢結(jié)果前10行的子句是__________(假設(shè)數(shù)據(jù)庫支持標(biāo)準(zhǔn)語法)。3.事務(wù)的隔離級別中,允許“臟讀”但能避免“不可重復(fù)讀”的是__________。4.數(shù)據(jù)倉庫的ETL過程指的是__________、轉(zhuǎn)換、加載。5.分布式數(shù)據(jù)庫中,解決數(shù)據(jù)分片問題的常見策略包括水平分片、垂直分片和__________。6.在關(guān)系代數(shù)中,π(投影)操作的作用是__________。7.數(shù)據(jù)庫恢復(fù)技術(shù)的基礎(chǔ)是__________,其記錄了數(shù)據(jù)庫中所有更新操作。8.HBase的存儲模型基于__________,數(shù)據(jù)按行鍵排序存儲。9.若事務(wù)T1對數(shù)據(jù)A加了共享鎖(S鎖),則事務(wù)T2對數(shù)據(jù)A可以加__________鎖(填“共享”或“排他”)。10.第三范式(3NF)要求關(guān)系模式中不存在非主屬性對__________的傳遞函數(shù)依賴。三、簡答題(每題8分,共40分)1.簡述聚簇索引與非聚簇索引的區(qū)別,并說明各自的適用場景。2.解釋“死鎖”的概念,并說明數(shù)據(jù)庫管理系統(tǒng)(DBMS)處理死鎖的常用方法。3.對比OLTP(聯(lián)機(jī)事務(wù)處理)與OLAP(聯(lián)機(jī)分析處理)的主要差異(至少列出4點)。4.簡述數(shù)據(jù)庫設(shè)計中“邏輯設(shè)計”階段的主要任務(wù),并說明如何將E-R模型轉(zhuǎn)換為關(guān)系模式。5.大數(shù)據(jù)場景下,傳統(tǒng)關(guān)系型數(shù)據(jù)庫(如MySQL)的局限性有哪些?分布式數(shù)據(jù)庫(如TiDB)是如何解決這些問題的?四、設(shè)計題(每題10分,共20分)1.某高校需設(shè)計“學(xué)生選課管理系統(tǒng)”數(shù)據(jù)庫,涉及的實體有:學(xué)生(學(xué)號,姓名,性別,年齡)、課程(課程號,課程名,學(xué)分)、教師(工號,姓名,職稱)。其中,學(xué)生與課程之間存在“選課”關(guān)系(包含選課時間),教師與課程之間存在“授課”關(guān)系(包含授課學(xué)期)。要求:(1)畫出E-R圖(需標(biāo)注實體屬性、聯(lián)系類型及聯(lián)系屬性);(2)將E-R圖轉(zhuǎn)換為關(guān)系模式(需標(biāo)注主鍵和外鍵)。2.某電商平臺需優(yōu)化“訂單表”的查詢性能,已知高頻查詢場景包括:-根據(jù)用戶ID查詢最近3個月的訂單(用戶ID,下單時間);-根據(jù)訂單狀態(tài)(如“待支付”“已發(fā)貨”)統(tǒng)計各狀態(tài)的訂單數(shù)量;-根據(jù)商品ID查詢關(guān)聯(lián)的訂單詳情(商品ID,訂單金額)。請設(shè)計合理的索引策略(需說明索引類型、列順序及原因)。五、編程題(共30分)1.(10分)使用SQL語句完成以下操作:(1)創(chuàng)建“員工表”(employee),包含字段:員工ID(emp_id,主鍵,INT類型)、姓名(emp_name,VARCHAR(50))、部門ID(dept_id,INT類型,外鍵關(guān)聯(lián)部門表dept的dept_id)、入職日期(hire_date,DATE類型)、月薪(salary,DECIMAL(10,2));(2)向員工表中插入一條記錄:emp_id=1001,emp_name='張三',dept_id=20,hire_date='2023-01-15',salary=15000.00;(3)查詢部門ID為20的所有員工中,月薪高于部門平均月薪的員工姓名和月薪(要求使用子查詢)。2.(10分)某公司“銷售表”(sales)包含字段:銷售ID(sale_id)、產(chǎn)品ID(prod_id)、銷售日期(sale_date)、銷售數(shù)量(qty)。請編寫SQL語句:(1)按產(chǎn)品ID分組,查詢每個產(chǎn)品2024年各季度的總銷售數(shù)量(季度字段命名為quarter,總數(shù)量命名為total_qty);(2)使用窗口函數(shù),計算每個產(chǎn)品的累計銷售數(shù)量(按銷售日期升序排列)。3.(10分)編寫一個存儲過程(存儲過程名為get_dept_salary),輸入?yún)?shù)為部門ID(dept_id),輸出該部門員工的最高月薪、最低月薪和平均月薪。答案一、單項選擇題1.C(候選鍵是能唯一標(biāo)識元組的屬性或?qū)傩越M,一個關(guān)系可有多候選鍵,主鍵是選中的一個候選鍵)2.B(BETWEEN...AND...表示閉區(qū)間)3.C(B+樹的結(jié)構(gòu)更適合范圍查詢,但頻繁插入刪除可能導(dǎo)致頁分裂,性能不如哈希索引)4.D(隔離性確保并發(fā)事務(wù)互不干擾,結(jié)果等價于串行執(zhí)行)5.B(存在傳遞依賴A→C,A→D,不滿足3NF)6.A(CAP定理指出一致性、可用性、分區(qū)容忍性三者不可全選)7.B(數(shù)據(jù)倉庫面向主題,集成多源數(shù)據(jù),長期存儲歷史數(shù)據(jù))8.B(ALTER用于修改表結(jié)構(gòu),如添加列、修改約束)9.A(Hive通過CREATETABLE定義外部表或內(nèi)部表,映射存儲路徑)10.B(覆蓋索引包含查詢所需所有列,無需回表)二、填空題1.用戶定義完整性2.LIMIT103.讀已提交(ReadCommitted)4.抽?。‥xtract)5.混合分片6.從關(guān)系中選取若干屬性列組成新關(guān)系7.日志(或日志文件、事務(wù)日志)8.列族(ColumnFamily)9.共享10.候選鍵三、簡答題1.區(qū)別:聚簇索引的存儲順序與數(shù)據(jù)行的物理存儲順序一致,一個表只能有一個聚簇索引;非聚簇索引的存儲順序與物理順序無關(guān),一個表可有多非聚簇索引。適用場景:聚簇索引適合主鍵查詢或范圍查詢(如按時間排序的訂單表);非聚簇索引適合頻繁查詢的非主鍵列(如用戶表的手機(jī)號查詢)。2.死鎖:兩個或多個事務(wù)因爭奪資源而相互等待,導(dǎo)致無法繼續(xù)執(zhí)行的狀態(tài)。處理方法:-死鎖檢測:DBMS定期檢查事務(wù)等待圖,發(fā)現(xiàn)環(huán)則選擇代價最小的事務(wù)回滾;-死鎖預(yù)防:通過順序加鎖、超時機(jī)制(如事務(wù)等待超時則回滾)避免死鎖發(fā)生。3.差異:-目標(biāo):OLTP支持日常事務(wù)處理(如訂單提交),OLAP支持決策分析(如銷售統(tǒng)計);-數(shù)據(jù)量:OLTP數(shù)據(jù)量較小(實時更新),OLAP數(shù)據(jù)量極大(歷史數(shù)據(jù));-操作類型:OLTP以增刪改(DML)為主,OLAP以查詢(SELECT)為主;-響應(yīng)時間:OLTP要求毫秒級響應(yīng),OLAP允許秒級或分鐘級響應(yīng)。4.邏輯設(shè)計任務(wù):將概念模型(E-R圖)轉(zhuǎn)換為數(shù)據(jù)庫管理系統(tǒng)支持的邏輯模型(如關(guān)系模型),并優(yōu)化關(guān)系模式(如消除冗余、滿足范式)。E-R轉(zhuǎn)換規(guī)則:-實體轉(zhuǎn)換為關(guān)系模式,屬性為列,主鍵為實體標(biāo)識符;-1:1聯(lián)系可合并到任一實體或獨立成表;-1:n聯(lián)系合并到n端實體(添加1端主鍵作為外鍵);-m:n聯(lián)系獨立成表(包含兩端主鍵及聯(lián)系屬性,組合主鍵)。5.傳統(tǒng)數(shù)據(jù)庫局限性:-擴(kuò)展性差:單節(jié)點存儲和計算能力有限,無法處理PB級數(shù)據(jù);-并發(fā)性能低:高并發(fā)寫入時鎖競爭激烈;-容錯性弱:單點故障導(dǎo)致服務(wù)中斷。分布式數(shù)據(jù)庫解決方式:-數(shù)據(jù)分片:將數(shù)據(jù)分散到多個節(jié)點,支持水平擴(kuò)展;-分布式事務(wù):通過兩階段提交(2PC)或TCC(補(bǔ)償事務(wù))保證一致性;-多副本機(jī)制:通過Raft或Paxos協(xié)議實現(xiàn)數(shù)據(jù)冗余,提高容錯性。四、設(shè)計題1.(1)E-R圖(文字描述):-實體“學(xué)生”屬性:學(xué)號(主鍵)、姓名、性別、年齡;-實體“課程”屬性:課程號(主鍵)、課程名、學(xué)分;-實體“教師”屬性:工號(主鍵)、姓名、職稱;-聯(lián)系“選課”(學(xué)生-課程,m:n)屬性:選課時間;-聯(lián)系“授課”(教師-課程,1:n)屬性:授課學(xué)期。(2)關(guān)系模式:-學(xué)生(學(xué)號,姓名,性別,年齡)主鍵:學(xué)號;-課程(課程號,課程名,學(xué)分)主鍵:課程號;-教師(工號,姓名,職稱)主鍵:工號;-選課(學(xué)號,課程號,選課時間)主鍵:(學(xué)號,課程號),外鍵:學(xué)號→學(xué)生.學(xué)號,課程號→課程.課程號;-授課(工號,課程號,授課學(xué)期)主鍵:(工號,課程號),外鍵:工號→教師.工號,課程號→課程.課程號。2.索引策略:-用戶ID+下單時間的復(fù)合索引(B樹索引):用戶ID為前導(dǎo)列,下單時間為第二列,支持“用戶ID查詢最近3個月訂單”的范圍查詢(WHEREuser_id=?ANDorder_timeBETWEEN...);-訂單狀態(tài)的單列索引(B樹索引):統(tǒng)計各狀態(tài)訂單數(shù)量時,索引可快速定位不同狀態(tài)的記錄;-商品ID的覆蓋索引(包含商品ID、訂單金額):查詢商品關(guān)聯(lián)訂單詳情時,索引直接返回所需數(shù)據(jù),避免回表。五、編程題1.(1)```sqlCREATETABLEemployee(emp_idINTPRIMARYKEY,emp_nameVARCHAR(50)NOTNULL,dept_idINT,hire_dateDATE,salaryDECIMAL(10,2),FOREIGNKEY(dept_id)REFERENCESdept(dept_id));```(2)```sqlINSERTINTOemployee(emp_id,emp_name,dept_id,hire_date,salary)VALUES(1001,'張三',20,'2023-01-15',15000.00);```(3)```sqlSELECTemp_name,salaryFROMemployeeWHEREdept_id=20ANDsalary>(SELECTAVG(salary)FROMemployeeWHEREdept_id=20);```2.(1)```sqlSELECTprod_id,QUARTER(sale_date)ASquarter,SUM(qty)AStotal_qtyFROMsalesWHEREsale_dateBETWEEN'2024-01-01'AND'2024-12-31'GROUPBYprod_id,QUARTER(sale_date);```(2)```

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論