版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2025年數(shù)據(jù)庫設(shè)計(jì)試題及答案一、單項(xiàng)選擇題(每題2分,共20分)1.某電商平臺(tái)訂單表需支持高頻查詢“用戶近30天訂單”,同時(shí)需保證歷史訂單(超過1年)的歸檔效率。以下設(shè)計(jì)中最合理的是()A.為訂單表添加用戶ID和下單時(shí)間的聯(lián)合主鍵B.按用戶ID分庫,訂單表按下單時(shí)間做范圍分區(qū)C.在訂單表上創(chuàng)建用戶ID的哈希索引D.將歷史訂單定期遷移至列式存儲(chǔ)數(shù)據(jù)庫2.關(guān)系模式R(A,B,C,D),函數(shù)依賴集F={AB→C,C→D,D→A},則R的主碼是()A.ABB.BCC.CDD.BD3.分布式數(shù)據(jù)庫中,若某事務(wù)需更新北京、上海兩個(gè)節(jié)點(diǎn)的用戶余額,為保證原子性,最適合的協(xié)議是()A.兩階段鎖協(xié)議(2PL)B.時(shí)間戳排序協(xié)議(TSO)C.三階段提交協(xié)議(3PC)D.樂觀并發(fā)控制協(xié)議4.某銀行核心系統(tǒng)要求“同一賬戶的轉(zhuǎn)賬操作必須在100ms內(nèi)完成,且任何網(wǎng)絡(luò)中斷后數(shù)據(jù)不丟失”,需重點(diǎn)滿足的事務(wù)特性是()A.原子性(Atomicity)與持久性(Durability)B.一致性(Consistency)與隔離性(Isolation)C.原子性與隔離性D.一致性與持久性5.設(shè)計(jì)醫(yī)療影像數(shù)據(jù)庫時(shí),需存儲(chǔ)DICOM格式的影像文件(平均50MB),并支持按患者ID、檢查類型快速檢索。以下方案最優(yōu)的是()A.將影像文件直接存儲(chǔ)在關(guān)系型數(shù)據(jù)庫的BLOB字段中B.影像文件存儲(chǔ)于對象存儲(chǔ)(如S3),數(shù)據(jù)庫存儲(chǔ)元數(shù)據(jù)(患者ID、檢查時(shí)間、文件路徑)C.使用列式數(shù)據(jù)庫存儲(chǔ)影像的二進(jìn)制數(shù)據(jù),按患者ID分塊D.將影像文件壓縮后存儲(chǔ)在文檔數(shù)據(jù)庫(如MongoDB)的二進(jìn)制字段中6.某社交平臺(tái)用戶表(用戶ID,姓名,手機(jī)號,注冊時(shí)間,最后登錄時(shí)間)需支持“按手機(jī)號快速查找用戶”和“統(tǒng)計(jì)每日新增用戶數(shù)”,應(yīng)創(chuàng)建的索引是()A.手機(jī)號的唯一索引,注冊時(shí)間的普通索引B.手機(jī)號的哈希索引,注冊時(shí)間的聚簇索引C.手機(jī)號的B+樹索引,注冊時(shí)間的B+樹索引D.手機(jī)號的覆蓋索引,注冊時(shí)間的復(fù)合索引7.以下關(guān)于數(shù)據(jù)倉庫設(shè)計(jì)的描述中,錯(cuò)誤的是()A.事實(shí)表通常包含大量度量值和外鍵B.維度表需定期更新以反映業(yè)務(wù)變化(如地區(qū)劃分調(diào)整)C.星型模型比雪花模型更適合復(fù)雜查詢D.需考慮慢變化維(SCD)的處理(如用戶地址變更)8.某物聯(lián)網(wǎng)平臺(tái)需存儲(chǔ)傳感器實(shí)時(shí)數(shù)據(jù)(每秒10萬條,每條包含設(shè)備ID、時(shí)間戳、溫度、濕度),要求支持“按設(shè)備ID查詢近7天的分鐘級溫度均值”,最合理的存儲(chǔ)方案是()A.使用關(guān)系型數(shù)據(jù)庫,按設(shè)備ID分表,時(shí)間戳為主鍵B.使用時(shí)序數(shù)據(jù)庫(如InfluxDB),以設(shè)備ID和時(shí)間戳為標(biāo)簽C.使用文檔數(shù)據(jù)庫(如MongoDB),每條記錄存儲(chǔ)設(shè)備ID和時(shí)間序列數(shù)據(jù)數(shù)組D.使用列存數(shù)據(jù)庫(如ClickHouse),按設(shè)備ID分區(qū),時(shí)間戳排序9.為防止“臟讀”,數(shù)據(jù)庫的隔離級別至少需設(shè)置為()A.讀未提交(ReadUncommitted)B.讀已提交(ReadCommitted)C.可重復(fù)讀(RepeatableRead)D.串行化(Serializable)10.設(shè)計(jì)分布式數(shù)據(jù)庫的分片策略時(shí),若需保證“同一用戶的所有數(shù)據(jù)存儲(chǔ)在同一分片”,應(yīng)采用的分片鍵是()A.隨機(jī)哈希分片B.范圍分片(如按用戶ID范圍)C.基于用戶ID的哈希分片D.基于時(shí)間戳的范圍分片二、簡答題(每題6分,共30分)1.簡述第三范式(3NF)與BCNF的區(qū)別,并舉例說明一個(gè)滿足3NF但不滿足BCNF的關(guān)系模式。2.說明聚簇索引與非聚簇索引的核心差異,分別列舉一個(gè)適合使用聚簇索引和非聚簇索引的場景。3.分布式事務(wù)中,為何“網(wǎng)絡(luò)分區(qū)”會(huì)破壞CAP定理中的一致性(Consistency)?請結(jié)合具體場景解釋。4.數(shù)據(jù)倉庫設(shè)計(jì)中,“事實(shí)表”與“維度表”的作用分別是什么?說明星型模型與雪花模型的主要區(qū)別。5.數(shù)據(jù)庫備份策略中,“全量備份+增量備份”與“全量備份+日志備份”的適用場景有何不同?三、設(shè)計(jì)題(20分)某在線教育平臺(tái)需設(shè)計(jì)數(shù)據(jù)庫,核心業(yè)務(wù)包括:用戶(學(xué)生、教師)注冊與登錄(需存儲(chǔ)姓名、手機(jī)號、郵箱、角色);課程發(fā)布(教師創(chuàng)建課程,包含課程名稱、簡介、開課時(shí)間、結(jié)束時(shí)間、最大人數(shù));學(xué)生選課(記錄選課時(shí)間,需支持退課);作業(yè)提交(教師發(fā)布作業(yè),學(xué)生提交作業(yè)文件,記錄提交時(shí)間、得分);課程評價(jià)(學(xué)生結(jié)課后對課程評分,存儲(chǔ)評分(1-5分)和文字評價(jià))。要求:(1)繪制核心實(shí)體-關(guān)系(ER)圖(需標(biāo)注實(shí)體屬性、聯(lián)系類型及約束);(2)將ER圖轉(zhuǎn)換為關(guān)系模式,標(biāo)注主鍵(PK)和外鍵(FK);(3)分析關(guān)系模式是否滿足3NF,若不滿足需說明原因并優(yōu)化;(4)設(shè)計(jì)關(guān)鍵索引(至少3個(gè)),并說明理由;(5)針對“同時(shí)有10萬學(xué)生選課”的高并發(fā)場景,提出2條數(shù)據(jù)庫優(yōu)化策略。四、綜合應(yīng)用題(30分)某醫(yī)療健康數(shù)據(jù)平臺(tái)需整合醫(yī)院HIS系統(tǒng)、體檢中心、可穿戴設(shè)備(如智能手表)的多源數(shù)據(jù),支持以下業(yè)務(wù):患者全生命周期健康數(shù)據(jù)查詢(包括診斷記錄、檢查報(bào)告、體檢指標(biāo)、心率/血壓等實(shí)時(shí)監(jiān)測數(shù)據(jù));醫(yī)生對患者的跨院診療協(xié)作(需更新患者的用藥記錄、手術(shù)計(jì)劃);基于歷史數(shù)據(jù)的疾病預(yù)測分析(如糖尿病風(fēng)險(xiǎn)評估);符合GDPR/《個(gè)人信息保護(hù)法》的隱私保護(hù)(需支持?jǐn)?shù)據(jù)去標(biāo)識化、權(quán)限控制)。要求:(1)設(shè)計(jì)概念模型(ER圖或UML類圖),說明主要實(shí)體(至少5個(gè))及其屬性、實(shí)體間聯(lián)系;(2)設(shè)計(jì)邏輯模型(關(guān)系模式),考慮多源數(shù)據(jù)的整合方式(如異構(gòu)數(shù)據(jù)清洗、主數(shù)據(jù)管理);(3)針對實(shí)時(shí)監(jiān)測數(shù)據(jù)(如每5秒采集一次的心率),設(shè)計(jì)存儲(chǔ)方案(包括數(shù)據(jù)庫類型選擇、表結(jié)構(gòu)、索引策略);(4)設(shè)計(jì)分布式事務(wù)方案(如醫(yī)生跨院更新患者用藥記錄),需考慮網(wǎng)絡(luò)延遲和節(jié)點(diǎn)故障;(5)提出3項(xiàng)隱私保護(hù)技術(shù)措施,并說明如何與數(shù)據(jù)庫設(shè)計(jì)結(jié)合。答案--一、單項(xiàng)選擇題1.B(按用戶ID分庫減少跨庫查詢,時(shí)間范圍分區(qū)便于歸檔)2.B(推導(dǎo):BC→B→AB→C→D→A,故BC能決定所有屬性)3.C(3PC比2PC更能應(yīng)對網(wǎng)絡(luò)分區(qū),減少阻塞)4.A(100ms內(nèi)完成強(qiáng)調(diào)原子性,數(shù)據(jù)不丟失強(qiáng)調(diào)持久性)5.B(對象存儲(chǔ)適合大文件,數(shù)據(jù)庫存儲(chǔ)元數(shù)據(jù)便于檢索)6.C(手機(jī)號需精確查找用B+樹,注冊時(shí)間需范圍查詢用B+樹)7.C(雪花模型通過維度表分層支持更復(fù)雜查詢)8.B(時(shí)序數(shù)據(jù)庫優(yōu)化時(shí)間序列存儲(chǔ),支持標(biāo)簽查詢和聚合)9.B(讀已提交避免臟讀)10.C(用戶ID哈希分片保證數(shù)據(jù)局部性)二、簡答題1.區(qū)別:3NF要求非主屬性不傳遞依賴于主碼,BCNF要求所有決定因素(包括主屬性)都包含候選碼。例:關(guān)系模式R(S,T,J),函數(shù)依賴{S→T,T→J,J→S},候選碼為S、T、J。所有屬性都是主屬性,無傳遞依賴(滿足3NF),但存在T→J(T不是候選碼),故不滿足BCNF。2.核心差異:聚簇索引決定數(shù)據(jù)物理存儲(chǔ)順序,一個(gè)表僅一個(gè);非聚簇索引存儲(chǔ)索引鍵和行指針,可多個(gè)。場景:聚簇索引適合經(jīng)常按范圍查詢的表(如訂單表按時(shí)間排序);非聚簇索引適合頻繁按非主鍵字段查詢(如用戶表按手機(jī)號查詢)。3.網(wǎng)絡(luò)分區(qū)時(shí),分布式系統(tǒng)被分割為多個(gè)獨(dú)立子系統(tǒng)。若要求一致性(所有節(jié)點(diǎn)數(shù)據(jù)相同),則子系統(tǒng)間無法通信時(shí)需拒絕寫操作(犧牲可用性);若允許子系統(tǒng)獨(dú)立寫(保持可用性),則數(shù)據(jù)會(huì)不一致(犧牲一致性)。例:銀行系統(tǒng)北京、上海節(jié)點(diǎn)因網(wǎng)絡(luò)中斷,北京節(jié)點(diǎn)扣減用戶A余額后,上海節(jié)點(diǎn)無法同步,導(dǎo)致數(shù)據(jù)不一致。4.事實(shí)表:存儲(chǔ)業(yè)務(wù)事件的度量值(如銷售額)和外鍵(關(guān)聯(lián)維度);維度表:描述業(yè)務(wù)上下文(如時(shí)間、地區(qū)、產(chǎn)品)。星型模型:事實(shí)表直接關(guān)聯(lián)維度表(維度表不進(jìn)一步分層);雪花模型:維度表可進(jìn)一步分解為子維度表(如地區(qū)→國家→省份→城市)。5.全量+增量:適合數(shù)據(jù)修改頻繁但備份空間有限的場景(如日志系統(tǒng)),恢復(fù)時(shí)需按順序應(yīng)用全量+所有增量;全量+日志:適合需要精確恢復(fù)到某時(shí)間點(diǎn)的場景(如核心交易系統(tǒng)),恢復(fù)時(shí)用全量+日志重放至目標(biāo)時(shí)間。三、設(shè)計(jì)題(1)ER圖:實(shí)體:用戶(用戶ID,姓名,手機(jī)號,郵箱,角色);課程(課程ID,名稱,簡介,開課時(shí)間,結(jié)束時(shí)間,最大人數(shù),教師ID);選課記錄(記錄ID,用戶ID,課程ID,選課時(shí)間,退課時(shí)間);作業(yè)(作業(yè)ID,課程ID,教師ID,發(fā)布時(shí)間);作業(yè)提交(提交ID,作業(yè)ID,用戶ID,提交時(shí)間,文件路徑,得分);課程評價(jià)(評價(jià)ID,用戶ID,課程ID,評分,評價(jià)內(nèi)容,評價(jià)時(shí)間)。聯(lián)系:教師(用戶角色=教師)發(fā)布課程(1:N);學(xué)生(用戶角色=學(xué)生)選課(N:M,選課記錄為聯(lián)系實(shí)體);教師發(fā)布作業(yè)(1:N,作業(yè)→課程);學(xué)生提交作業(yè)(N:M,作業(yè)提交為聯(lián)系實(shí)體);學(xué)生評價(jià)課程(N:M,課程評價(jià)為聯(lián)系實(shí)體)。(2)關(guān)系模式:用戶(用戶ID(PK),姓名,手機(jī)號(唯一),郵箱(唯一),角色)課程(課程ID(PK),名稱,簡介,開課時(shí)間,結(jié)束時(shí)間,最大人數(shù),教師ID(FK→用戶.用戶ID))選課記錄(記錄ID(PK),用戶ID(FK→用戶.用戶ID),課程ID(FK→課程.課程ID),選課時(shí)間,退課時(shí)間(允許空))作業(yè)(作業(yè)ID(PK),課程ID(FK→課程.課程ID),教師ID(FK→用戶.用戶ID),發(fā)布時(shí)間)作業(yè)提交(提交ID(PK),作業(yè)ID(FK→作業(yè).作業(yè)ID),用戶ID(FK→用戶.用戶ID),提交時(shí)間,文件路徑,得分(允許空))課程評價(jià)(評價(jià)ID(PK),用戶ID(FK→用戶.用戶ID),課程ID(FK→課程.課程ID),評分(1-5),評價(jià)內(nèi)容,評價(jià)時(shí)間)(3)3NF分析:所有非主屬性均直接依賴于主碼,無傳遞依賴(如課程的教師ID直接依賴課程ID,用戶的角色直接依賴用戶ID),滿足3NF。(4)關(guān)鍵索引:用戶表(手機(jī)號):唯一索引,支持快速登錄驗(yàn)證;課程表(教師ID,開課時(shí)間):復(fù)合索引,支持教師查詢自己發(fā)布的課程;選課記錄(課程ID,選課時(shí)間):索引,支持課程的選課人數(shù)統(tǒng)計(jì)和截止時(shí)間控制;作業(yè)提交(作業(yè)ID,用戶ID):復(fù)合唯一索引,防止同一學(xué)生重復(fù)提交同一作業(yè)。(5)高并發(fā)優(yōu)化策略:分庫分表:按用戶ID哈希分庫,選課記錄按課程ID分表,減少單庫壓力;分布式事務(wù):使用Seata等框架實(shí)現(xiàn)選課的原子性(扣減課程剩余名額+插入選課記錄);緩存預(yù)熱:課程詳情頁緩存至Redis,減少數(shù)據(jù)庫查詢;異步處理:退課操作通過消息隊(duì)列(如Kafka)異步處理,避免阻塞主流程。四、綜合應(yīng)用題(1)概念模型(ER圖):實(shí)體:患者(患者ID,姓名,身份證號(脫敏),出生日期);醫(yī)療機(jī)構(gòu)(機(jī)構(gòu)ID,名稱,類型(醫(yī)院/體檢中心));診療記錄(記錄ID,患者ID,機(jī)構(gòu)ID,診斷時(shí)間,診斷結(jié)果,醫(yī)生ID);檢查報(bào)告(報(bào)告ID,患者ID,檢查類型(CT/血檢),檢查時(shí)間,結(jié)果文件路徑);監(jiān)測數(shù)據(jù)(數(shù)據(jù)ID,患者ID,設(shè)備ID,采集時(shí)間,心率,血壓);醫(yī)生(醫(yī)生ID,姓名,所屬機(jī)構(gòu)ID)。聯(lián)系:患者在醫(yī)療機(jī)構(gòu)就診(N:M,診療記錄為聯(lián)系實(shí)體);患者有檢查報(bào)告(1:N);患者通過設(shè)備提供監(jiān)測數(shù)據(jù)(1:N);醫(yī)生屬于醫(yī)療機(jī)構(gòu)(N:1);醫(yī)生創(chuàng)建診療記錄(N:1)。(2)邏輯模型:患者(患者ID(PK),匿名ID(哈希身份證號),姓名,出生日期)醫(yī)療機(jī)構(gòu)(機(jī)構(gòu)ID(PK),名稱,類型)醫(yī)生(醫(yī)生ID(PK),姓名,機(jī)構(gòu)ID(FK→醫(yī)療機(jī)構(gòu).機(jī)構(gòu)ID))診療記錄(記錄ID(PK),患者ID(FK→患者.患者ID),機(jī)構(gòu)ID(FK→醫(yī)療機(jī)構(gòu).機(jī)構(gòu)ID),醫(yī)生ID(FK→醫(yī)生.醫(yī)生ID),診斷時(shí)間,診斷結(jié)果)檢查報(bào)告(報(bào)告ID(PK),患者ID(FK→患者.患者ID),檢查類型,檢查時(shí)間,結(jié)果路徑(指向?qū)ο蟠鎯?chǔ)))監(jiān)測數(shù)據(jù)(數(shù)據(jù)ID(PK),患者ID(FK→患者.患者ID),設(shè)備ID,采集時(shí)間,心率,血壓)主數(shù)據(jù)表(源系統(tǒng)標(biāo)識,源ID,患者ID,同步時(shí)間):用于多源數(shù)據(jù)整合(如HIS系統(tǒng)的患者ID與可穿戴設(shè)備的用戶ID映射)。(3)實(shí)時(shí)監(jiān)測數(shù)據(jù)存儲(chǔ)方案:數(shù)據(jù)庫類型:選擇時(shí)序數(shù)據(jù)庫(如TimescaleDB),優(yōu)化時(shí)間序列數(shù)據(jù)的寫入和聚合查詢;表結(jié)構(gòu):監(jiān)測數(shù)據(jù)(患者ID,設(shè)備ID,采集時(shí)間(PK),心率,血壓);索引策略:按患者ID和設(shè)備ID分區(qū)(減少跨分區(qū)查詢),按采集時(shí)間創(chuàng)建聚簇索引(支持“近7天數(shù)據(jù)”的快速范圍查詢);數(shù)據(jù)保留:設(shè)置自動(dòng)過期策略(如保留2年數(shù)據(jù),舊數(shù)據(jù)歸檔至對象存儲(chǔ))。(4)分布式事務(wù)方案(跨院更新用藥記錄):采用TCC(Try-Confirm-Cancel)模式:Try階段:北京醫(yī)院鎖定患者用藥記錄(標(biāo)記為“更新中”),上海醫(yī)院檢查患者存在性并鎖定;Confirm階段:北京醫(yī)院提交用藥變更,上海醫(yī)院同步更新;Cancel階段:任一節(jié)點(diǎn)失敗時(shí),回滾鎖定并恢復(fù)原數(shù)據(jù);引入分布
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年社區(qū)冰雹災(zāi)害應(yīng)急演練方案
- 電氣設(shè)備消防管理制度
- 2026年人工智能醫(yī)療大數(shù)據(jù)分析報(bào)告
- 2026天津職業(yè)技術(shù)師范大學(xué)第二批招聘方案(博士或高級專業(yè)技術(shù)職務(wù)崗位)36人備考題庫帶答案詳解
- 2026四川成都市雙流區(qū)空港第五幼兒園招聘2人備考題庫及完整答案詳解1套
- 2026廣西百色市平果市政協(xié)辦公益性崗位人員招聘1人備考題庫及答案詳解1套
- 2025云南昆明發(fā)展投資集團(tuán)有限公司下屬公司招聘2人備考題庫及答案詳解(奪冠系列)
- 2025東風(fēng)汽車貿(mào)易有限公司招聘備考題庫參考答案詳解
- 2026新疆博州賽里木湖信息科技服務(wù)有限責(zé)任公司招聘4人備考題庫有答案詳解
- 企業(yè)溝通平臺(tái)建設(shè)方案團(tuán)隊(duì)協(xié)同與信息共享
- 智能與AI安全培訓(xùn)課件
- 如何做部門管理和運(yùn)營匯報(bào)
- 2025年發(fā)酵飲料行業(yè)研究報(bào)告及未來行業(yè)發(fā)展趨勢預(yù)測
- 2025-2030中國建筑行業(yè)專利技術(shù)布局與創(chuàng)新成果轉(zhuǎn)化研究
- 合同變更協(xié)議(收款賬戶變更)
- 2025年馬口鐵包裝容器行業(yè)當(dāng)前市場規(guī)模及未來五到十年發(fā)展趨勢報(bào)告
- 2024版電網(wǎng)典型設(shè)計(jì)10kV配電站房分冊
- 《SPSS與AMOS在中介效應(yīng)與調(diào)節(jié)效應(yīng)分析中的應(yīng)用》
- 家屬院停車管理暫行辦法
- 錫圓電子科技有限公司高端半導(dǎo)體封測項(xiàng)目環(huán)評資料環(huán)境影響
- T/CGAS 031-2024城鎮(zhèn)燃?xì)饧映艏夹g(shù)要求
評論
0/150
提交評論