版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2025四川九洲光電科技股份有限公司招聘軟件工程師(數(shù)據(jù)模型方向)擬錄用人員筆試歷年典型考點(diǎn)題庫(kù)附帶答案詳解(第1套)一、單項(xiàng)選擇題下列各題只有一個(gè)正確答案,請(qǐng)選出最恰當(dāng)?shù)倪x項(xiàng)(共25題)1、在關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)中,第三范式(3NF)要求消除哪種依賴?A.非主屬性對(duì)碼的部分函數(shù)依賴B.非主屬性對(duì)碼的傳遞函數(shù)依賴C.主屬性對(duì)碼的部分函數(shù)依賴D.主屬性對(duì)碼的傳遞函數(shù)依賴2、在數(shù)據(jù)建模中,星型模型(StarSchema)與雪花模型(SnowflakeSchema)的主要區(qū)別在于?A.星型模型不包含事實(shí)表B.雪花模型對(duì)維度表進(jìn)行了規(guī)范化C.星型模型查詢性能通常低于雪花模型D.雪花模型不支持多維分析3、在機(jī)器學(xué)習(xí)中,以下哪種方法主要用于處理類(lèi)別不平衡問(wèn)題?A.增加學(xué)習(xí)率B.使用準(zhǔn)確率(Accuracy)作為評(píng)估指標(biāo)C.對(duì)少數(shù)類(lèi)進(jìn)行過(guò)采樣(如SMOTE)D.減少訓(xùn)練輪數(shù)4、在SQL中,以下哪個(gè)子句用于對(duì)分組后的結(jié)果進(jìn)行條件篩選?A.WHEREB.HAVINGC.GROUPBYD.ORDERBY5、在數(shù)據(jù)庫(kù)事務(wù)的ACID特性中,“隔離性”主要解決什么問(wèn)題?A.保證事務(wù)執(zhí)行前后數(shù)據(jù)總量不變B.確保事務(wù)一旦提交,其結(jié)果永久保存C.防止多個(gè)并發(fā)事務(wù)相互干擾導(dǎo)致數(shù)據(jù)不一致D.保證事務(wù)中的所有操作要么全部成功,要么全部失敗6、在關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)中,第三范式(3NF)要求消除哪種依賴?A.部分函數(shù)依賴B.傳遞函數(shù)依賴C.多值依賴D.連接依賴7、在數(shù)據(jù)建模中,以下哪種模型最常用于描述現(xiàn)實(shí)世界中的實(shí)體及其關(guān)系?A.層次模型B.網(wǎng)狀模型C.關(guān)系模型D.實(shí)體-聯(lián)系模型(ER模型)8、在SQL語(yǔ)言中,以下哪個(gè)語(yǔ)句用于撤銷(xiāo)已授予用戶的權(quán)限?A.DELETEB.REMOVEC.REVOKED.DENY9、在數(shù)據(jù)倉(cāng)庫(kù)中,星型模型的核心組成部分是什么?A.事實(shí)表和維度表B.主表和從表C.主鍵表和外鍵表D.匯總表和明細(xì)表10、在數(shù)據(jù)庫(kù)事務(wù)的ACID特性中,“一致性”指的是什么?A.事務(wù)必須是原子的,不可分割B.事務(wù)執(zhí)行前后,數(shù)據(jù)庫(kù)必須保持約束一致的狀態(tài)C.事務(wù)的中間狀態(tài)對(duì)外不可見(jiàn)D.事務(wù)一旦提交,其結(jié)果永久保存11、在解決哈希表沖突時(shí),哪種方法通過(guò)在哈希表外建立一個(gè)公共的溢出區(qū)來(lái)存放沖突的元素?A.開(kāi)放尋址法B.鏈地址法C.再哈希法D.建立公共溢出區(qū)12、對(duì)于二叉樹(shù)的遍歷,哪種方式能確保在訪問(wèn)根節(jié)點(diǎn)之前先訪問(wèn)完其所有左子樹(shù)節(jié)點(diǎn)?A.層序遍歷B.前序遍歷C.中序遍歷D.后序遍歷13、動(dòng)態(tài)規(guī)劃求解問(wèn)題時(shí),狀態(tài)轉(zhuǎn)移方程的核心作用是什么?A.定義初始邊界條件B.確定數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)C.描述當(dāng)前狀態(tài)如何由先前狀態(tài)推導(dǎo)而來(lái)D.計(jì)算算法的時(shí)間復(fù)雜度14、在二叉樹(shù)的遍歷中,哪種遍歷方式最適合用于復(fù)制一棵完整的二叉樹(shù)結(jié)構(gòu)?A.中序遍歷B.后序遍歷C.層序遍歷D.前序遍歷15、下列關(guān)于哈希表中鏈地址法的描述,哪一項(xiàng)是其主要優(yōu)點(diǎn)?A.不會(huì)產(chǎn)生堆積現(xiàn)象,平均查找長(zhǎng)度較短B.實(shí)現(xiàn)簡(jiǎn)單,無(wú)需額外空間C.對(duì)哈希函數(shù)質(zhì)量要求極低D.刪除操作時(shí)間復(fù)雜度為O(1)16、在關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)中,若一個(gè)關(guān)系模式R已滿足第二范式(2NF),則將其進(jìn)一步規(guī)范化為第三范式(3NF)的主要目的是消除什么?A.非主屬性對(duì)候選鍵的部分函數(shù)依賴B.主屬性對(duì)候選鍵的部分函數(shù)依賴C.非主屬性對(duì)候選鍵的傳遞函數(shù)依賴D.主屬性對(duì)候選鍵的傳遞函數(shù)依賴17、在采用線性探測(cè)法解決沖突的哈希表中,影響查找成功時(shí)平均查找長(zhǎng)度(ASL)的關(guān)鍵因素不包括以下哪一項(xiàng)?A.裝填因子B.散列函數(shù)的選擇C.關(guān)鍵字的原始順序D.沖突解決策略18、在標(biāo)準(zhǔn)SQL查詢中,以下子句的邏輯執(zhí)行順序正確的是?A.SELECT→FROM→WHERE→GROUPBY→HAVING→ORDERBYB.FROM→WHERE→GROUPBY→HAVING→SELECT→ORDERBYC.FROM→GROUPBY→WHERE→HAVING→SELECT→ORDERBYD.WHERE→FROM→GROUPBY→SELECT→HAVING→ORDERBY19、在虛擬存儲(chǔ)系統(tǒng)中,采用“最佳置換算法(OPT)”時(shí),其核心策略是選擇哪一個(gè)頁(yè)面進(jìn)行淘汰?A.最早進(jìn)入內(nèi)存的頁(yè)面B.最近最久未被訪問(wèn)的頁(yè)面C.未來(lái)最長(zhǎng)時(shí)間內(nèi)不再被訪問(wèn)的頁(yè)面D.當(dāng)前訪問(wèn)頻次最低的頁(yè)面20、在TCP擁塞控制機(jī)制中,當(dāng)發(fā)送方收到三個(gè)重復(fù)的ACK時(shí),將觸發(fā)哪種算法,并將慢開(kāi)始門(mén)限(ssthresh)設(shè)置為當(dāng)前擁塞窗口(cwnd)的多少?A.快重傳,ssthresh=cwndB.快恢復(fù),ssthresh=cwnd/2C.擁塞避免,ssthresh=cwnd+3D.慢開(kāi)始,ssthresh=cwnd21、在關(guān)系數(shù)據(jù)庫(kù)規(guī)范化理論中,第三范式(3NF)的核心要求是消除哪種類(lèi)型的依賴?A.非主屬性對(duì)候選鍵的部分函數(shù)依賴B.非主屬性對(duì)候選鍵的傳遞函數(shù)依賴C.主屬性對(duì)候選鍵的部分函數(shù)依賴D.主屬性對(duì)候選鍵的傳遞函數(shù)依賴22、在ApacheSpark中,當(dāng)RDD的持久化策略設(shè)置為MEMORY_AND_DISK時(shí),如果內(nèi)存不足以容納全部分區(qū)數(shù)據(jù),Spark將如何處理?A.拋出內(nèi)存溢出(OOM)異常B.將無(wú)法存入內(nèi)存的分區(qū)數(shù)據(jù)序列化后寫(xiě)入磁盤(pán)C.僅將部分分區(qū)數(shù)據(jù)存入內(nèi)存,其余分區(qū)在需要時(shí)重新計(jì)算D.自動(dòng)降級(jí)為MEMORY_ONLY_SER策略23、在機(jī)器學(xué)習(xí)模型訓(xùn)練中,如果模型在訓(xùn)練集上表現(xiàn)很差(高誤差),同時(shí)在驗(yàn)證集上表現(xiàn)也很差,這最可能是什么現(xiàn)象?A.欠擬合B.過(guò)擬合C.數(shù)據(jù)泄露D.維度災(zāi)難24、TCP協(xié)議建立連接時(shí)的“三次握手”過(guò)程,其主要目的是什么?A.確認(rèn)雙方應(yīng)用層數(shù)據(jù)傳輸完畢B.同步雙方的初始序列號(hào)并確認(rèn)連接建立C.協(xié)商數(shù)據(jù)傳輸過(guò)程中的加密算法D.交換雙方的IP地址和端口號(hào)25、在ApacheKafka中,要保證某類(lèi)特定消息(例如,同一個(gè)用戶ID的所有操作)的全局嚴(yán)格順序,最核心的設(shè)計(jì)機(jī)制是什么?A.啟用消息壓縮功能B.為T(mén)opic設(shè)置多個(gè)副本C.利用自定義分區(qū)器,確保同類(lèi)消息發(fā)送到同一分區(qū)D.將Topic的分區(qū)數(shù)量設(shè)置為1二、多項(xiàng)選擇題下列各題有多個(gè)正確答案,請(qǐng)選出所有正確選項(xiàng)(共15題)26、在關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)中,關(guān)于第三范式(3NF)的描述,以下哪些說(shuō)法是正確的?A.每個(gè)非主屬性完全函數(shù)依賴于候選鍵B.不存在非主屬性對(duì)候選鍵的傳遞函數(shù)依賴C.允許存在部分函數(shù)依賴D.所有屬性都必須是原子的27、關(guān)于數(shù)據(jù)倉(cāng)庫(kù)中的維度建模,以下哪些描述是正確的?A.星型模型包含一個(gè)事實(shí)表和多個(gè)維度表B.雪花模型是對(duì)維度表進(jìn)一步規(guī)范化后的結(jié)構(gòu)C.事實(shí)表通常存儲(chǔ)描述性屬性D.維度表通常包含業(yè)務(wù)過(guò)程的度量值28、在SQL中,以下哪些操作會(huì)觸發(fā)事務(wù)的隱式提交?A.CREATETABLEB.SELECTC.ALTERDATABASED.INSERT29、關(guān)于JSON數(shù)據(jù)格式,以下哪些說(shuō)法是正確的?A.JSON支持?jǐn)?shù)組和對(duì)象兩種復(fù)合數(shù)據(jù)結(jié)構(gòu)B.JSON中的字符串必須使用雙引號(hào)C.JSON可包含注釋D.JSON支持日期類(lèi)型作為原生數(shù)據(jù)類(lèi)型30、在數(shù)據(jù)建模中,關(guān)于實(shí)體-關(guān)系模型(ER模型)的下列說(shuō)法,哪些是正確的?A.弱實(shí)體必須依賴于強(qiáng)實(shí)體存在B.多值屬性不能直接在關(guān)系模型中表示C.聯(lián)系(Relationship)只能存在于兩個(gè)實(shí)體之間D.主鍵用于唯一標(biāo)識(shí)實(shí)體的每個(gè)實(shí)例31、下列關(guān)于數(shù)據(jù)庫(kù)范式的描述,哪些是正確的?A.第三范式(3NF)要求消除非主屬性對(duì)候選鍵的傳遞函數(shù)依賴。B.BCNF(鮑依斯-科德范式)要求每個(gè)決定因素都必須包含候選鍵。C.滿足BCNF的數(shù)據(jù)庫(kù)表一定也滿足第三范式(3NF)。D.第一范式(1NF)要求表中的每一列都必須是原子的,不可再分。32、關(guān)于數(shù)據(jù)庫(kù)事務(wù)的ACID特性,下列說(shuō)法正確的是?A.原子性(Atomicity)指事務(wù)中的所有操作要么全部成功,要么全部失敗。B.一致性(Consistency)指事務(wù)執(zhí)行前后,數(shù)據(jù)庫(kù)必須保持一致的狀態(tài)。C.隔離性(Isolation)確保并發(fā)事務(wù)的執(zhí)行互不干擾。D.持久性(Durability)指事務(wù)一旦提交,其結(jié)果將永久保存。33、在數(shù)據(jù)結(jié)構(gòu)中,關(guān)于樹(shù)的描述,哪些是準(zhǔn)確的?A.樹(shù)是一種非線性數(shù)據(jù)結(jié)構(gòu),用于表示具有“一對(duì)多”關(guān)系的數(shù)據(jù)集合。B.二叉樹(shù)是每個(gè)節(jié)點(diǎn)最多有兩個(gè)子節(jié)點(diǎn)的樹(shù)結(jié)構(gòu)。C.在完全二叉樹(shù)中,所有葉子節(jié)點(diǎn)都集中在最底層。D.樹(shù)的深度定義為從根節(jié)點(diǎn)到任意節(jié)點(diǎn)的路徑長(zhǎng)度。34、下列哪些是SQL查詢優(yōu)化的常見(jiàn)策略?A.在查詢條件中頻繁使用的列上創(chuàng)建索引。B.盡量避免使用SELECT*,僅選擇需要的字段。C.對(duì)索引列進(jìn)行函數(shù)運(yùn)算以提高查詢效率。D.使用EXPLAIN分析查詢執(zhí)行計(jì)劃以識(shí)別性能瓶頸。35、下列關(guān)于圖論基本概念的描述,哪些是正確的?A.有向圖中的邊具有方向性。B.無(wú)向圖中任意兩點(diǎn)間的路徑是雙向的。C.鄰接矩陣適用于存儲(chǔ)稀疏圖,因?yàn)樗?jié)省空間。D.深度優(yōu)先搜索(DFS)和廣度優(yōu)先搜索(BFS)是圖遍歷的常用算法。36、在數(shù)據(jù)庫(kù)設(shè)計(jì)中,關(guān)于關(guān)系模型的范式理論,以下哪些說(shuō)法是正確的?A.第一范式(1NF)要求表中的每一列都是不可再分的基本數(shù)據(jù)項(xiàng)B.滿足第二范式(2NF)的表一定也滿足第一范式(1NF)C.第三范式(3NF)要求消除所有非主屬性對(duì)候選鍵的傳遞函數(shù)依賴D.BCNF范式能完全消除數(shù)據(jù)冗余和更新異常37、關(guān)于數(shù)據(jù)庫(kù)索引,下列哪些描述是準(zhǔn)確的?A.索引的主要目的是提高數(shù)據(jù)查詢的效率B.B+樹(shù)是關(guān)系型數(shù)據(jù)庫(kù)中最常用的索引數(shù)據(jù)結(jié)構(gòu)C.為表中所有列都創(chuàng)建索引可以最大化查詢性能D.在WHERE子句中對(duì)索引列使用函數(shù)操作可能導(dǎo)致索引失效38、在實(shí)體-關(guān)系(E-R)模型中,以下哪些是其基本構(gòu)成要素?A.實(shí)體B.屬性C.關(guān)系D.視圖39、關(guān)于數(shù)據(jù)庫(kù)事務(wù)的ACID特性,下列哪些說(shuō)法是正確的?A.原子性(Atomicity)確保事務(wù)中的所有操作要么全部成功,要么全部失敗B.一致性(Consistency)保證事務(wù)執(zhí)行前后,數(shù)據(jù)庫(kù)從一個(gè)合法狀態(tài)轉(zhuǎn)換到另一個(gè)合法狀態(tài)C.隔離性(Isolation)確保并發(fā)執(zhí)行的事務(wù)不會(huì)相互干擾D.持久性(Durability)意味著事務(wù)一旦提交,其結(jié)果將永久保存,即使系統(tǒng)崩潰40、在數(shù)據(jù)倉(cāng)庫(kù)的維度建模中,下列關(guān)于事實(shí)表和維度表的描述,哪些是正確的?A.事實(shí)表存儲(chǔ)可度量的數(shù)值型數(shù)據(jù),如銷(xiāo)售額、數(shù)量B.維度表包含描述性信息,用于對(duì)事實(shí)進(jìn)行分析和過(guò)濾C.事實(shí)表的主鍵通常是復(fù)合主鍵,由所有維度表的外鍵組成D.維度表通常比事實(shí)表的數(shù)據(jù)量更大三、判斷題判斷下列說(shuō)法是否正確(共10題)41、在關(guān)系型數(shù)據(jù)庫(kù)中,第三范式(3NF)要求消除傳遞依賴。A.正確B.錯(cuò)誤42、JSON是一種輕量級(jí)的數(shù)據(jù)交換格式,其語(yǔ)法是JavaScript對(duì)象表示法的子集。A.正確B.錯(cuò)誤43、在UML類(lèi)圖中,聚合關(guān)系用實(shí)心菱形箭頭表示。A.正確B.錯(cuò)誤44、在數(shù)據(jù)建模中,星型模型由一個(gè)事實(shí)表和多個(gè)維度表組成。A.正確B.錯(cuò)誤45、主成分分析(PCA)是一種用于降維的無(wú)監(jiān)督學(xué)習(xí)方法。A.正確B.錯(cuò)誤46、在關(guān)系數(shù)據(jù)庫(kù)中,第三范式(3NF)要求消除非主屬性對(duì)候選鍵的傳遞函數(shù)依賴。A.正確B.錯(cuò)誤47、決策樹(shù)算法屬于判別模型而非生成模型。A.正確B.錯(cuò)誤48、在Hadoop生態(tài)系統(tǒng)中,HDFS適用于低延遲的數(shù)據(jù)訪問(wèn)場(chǎng)景。A.正確B.錯(cuò)誤49、動(dòng)態(tài)規(guī)劃的核心思想是將復(fù)雜問(wèn)題分解為重疊子問(wèn)題,并通過(guò)存儲(chǔ)子問(wèn)題的解避免重復(fù)計(jì)算。A.正確B.錯(cuò)誤50、在SQL中,使用LEFTJOIN時(shí),若右表無(wú)匹配行,則結(jié)果集中右表對(duì)應(yīng)字段將顯示為NULL。A.正確B.錯(cuò)誤
參考答案及解析1.【參考答案】B【解析】第三范式(3NF)是在滿足第二范式(2NF)的基礎(chǔ)上,進(jìn)一步消除非主屬性對(duì)候選碼的傳遞函數(shù)依賴。這意味著所有非主屬性必須直接依賴于候選碼,而不能通過(guò)其他非主屬性間接依賴。這是規(guī)范化理論中控制數(shù)據(jù)冗余和更新異常的重要步驟。2.【參考答案】B【解析】星型模型將所有維度信息存儲(chǔ)在非規(guī)范化的維度表中,結(jié)構(gòu)簡(jiǎn)單、查詢效率高;而雪花模型對(duì)維度表進(jìn)一步規(guī)范化,形成層次結(jié)構(gòu),節(jié)省存儲(chǔ)空間但可能增加查詢復(fù)雜度。兩者都包含事實(shí)表,且都支持多維分析(OLAP)。3.【參考答案】C【解析】類(lèi)別不平衡時(shí),準(zhǔn)確率會(huì)失真。SMOTE(SyntheticMinorityOver-samplingTechnique)通過(guò)對(duì)少數(shù)類(lèi)生成合成樣本進(jìn)行過(guò)采樣,有效緩解不平衡問(wèn)題。其它選項(xiàng)如調(diào)整學(xué)習(xí)率或訓(xùn)練輪數(shù)并不能直接解決類(lèi)別分布不均的問(wèn)題。4.【參考答案】B【解析】WHERE用于對(duì)原始行進(jìn)行篩選,不能使用聚合函數(shù);HAVING則用于對(duì)GROUPBY分組后的結(jié)果進(jìn)行過(guò)濾,可包含聚合函數(shù)(如COUNT、SUM等)。執(zhí)行順序?yàn)椋篧HERE→GROUPBY→HAVING→ORDERBY。5.【參考答案】C【解析】隔離性(Isolation)確保并發(fā)執(zhí)行的多個(gè)事務(wù)彼此隔離,如同串行執(zhí)行一樣,避免臟讀、不可重復(fù)讀和幻讀等問(wèn)題。A對(duì)應(yīng)一致性(Consistency),B對(duì)應(yīng)持久性(Durability),D對(duì)應(yīng)原子性(Atomicity)。6.【參考答案】B【解析】第三范式(3NF)是在滿足第二范式(2NF)的基礎(chǔ)上,進(jìn)一步消除非主屬性對(duì)候選鍵的傳遞函數(shù)依賴。即若X→Y,Y→Z,且Y不函數(shù)決定X,則Z對(duì)X的依賴為傳遞依賴,3NF要求消除此類(lèi)依賴,以減少數(shù)據(jù)冗余和更新異常。7.【參考答案】D【解析】實(shí)體-聯(lián)系模型(ER模型)是概念數(shù)據(jù)建模的核心工具,用于直觀地表示實(shí)體、屬性及實(shí)體間的聯(lián)系,常用于數(shù)據(jù)庫(kù)設(shè)計(jì)的初期階段。關(guān)系模型則是邏輯模型,用于具體實(shí)現(xiàn)。8.【參考答案】C【解析】REVOKE是SQL標(biāo)準(zhǔn)中用于撤銷(xiāo)先前通過(guò)GRANT語(yǔ)句授予用戶或角色的權(quán)限的命令。DELETE用于刪除數(shù)據(jù),REMOVE和DENY不是標(biāo)準(zhǔn)SQL中用于權(quán)限管理的關(guān)鍵字(DENY常見(jiàn)于某些數(shù)據(jù)庫(kù)如SQLServer,但非通用)。9.【參考答案】A【解析】星型模型是數(shù)據(jù)倉(cāng)庫(kù)中常用的多維數(shù)據(jù)模型,由一個(gè)中心的事實(shí)表(存儲(chǔ)度量值)和多個(gè)圍繞它的維度表(描述業(yè)務(wù)上下文)組成,結(jié)構(gòu)形似星星,有利于高效查詢和分析。10.【參考答案】B【解析】一致性(Consistency)確保事務(wù)執(zhí)行前后,數(shù)據(jù)庫(kù)從一個(gè)合法狀態(tài)轉(zhuǎn)換到另一個(gè)合法狀態(tài),即所有完整性約束(如主鍵、外鍵、檢查約束等)始終被滿足。這是ACID四大特性之一。11.【參考答案】D【解析】建立公共溢出區(qū)是解決哈希沖突的一種方法,它將所有發(fā)生沖突的元素統(tǒng)一存放到一個(gè)額外的溢出區(qū)中,而不是在原哈希表內(nèi)尋找其他位置或使用鏈表連接[[35]]。12.【參考答案】C【解析】中序遍歷遵循“左-根-右”的順序,即在訪問(wèn)當(dāng)前節(jié)點(diǎn)(根)之前,會(huì)先遞歸地遍歷其整個(gè)左子樹(shù)[[44]]。13.【參考答案】C【解析】狀態(tài)轉(zhuǎn)移方程是動(dòng)態(tài)規(guī)劃的核心,它定義了當(dāng)前階段的狀態(tài)如何根據(jù)前一階段的狀態(tài)和決策進(jìn)行演變,是實(shí)現(xiàn)遞推的關(guān)鍵[[22]]。14.【參考答案】D【解析】前序遍歷首先訪問(wèn)根節(jié)點(diǎn),然后是左子樹(shù),最后是右子樹(shù),這種“根-左-右”的順序非常適合于先創(chuàng)建根節(jié)點(diǎn),再遞歸復(fù)制左右子樹(shù),從而完整重建樹(shù)結(jié)構(gòu)[[42]]。15.【參考答案】A【解析】鏈地址法通過(guò)鏈表處理沖突,不同鍵的沖突不會(huì)相互影響,避免了開(kāi)放尋址法中的堆積問(wèn)題,因此平均查找長(zhǎng)度通常較短[[31]]。16.【參考答案】C【解析】第三范式(3NF)是2NF的進(jìn)一步約束,其核心要求是:每一個(gè)非主屬性既不部分依賴、也不傳遞依賴于任何一個(gè)候選鍵[[13]]。2NF已消除了非主屬性對(duì)候選鍵的部分依賴,因此3NF主要針對(duì)的是非主屬性對(duì)候選鍵的傳遞依賴。例如,若存在A→B,B→C且B不→A,則A→C是傳遞依賴,3NF要求消除此類(lèi)情形[[15]]。17.【參考答案】C【解析】查找成功的平均查找長(zhǎng)度(ASL)主要受裝填因子(表中元素個(gè)數(shù)與表長(zhǎng)之比)、散列函數(shù)的均勻性以及所采用的沖突解決策略(如線性探測(cè)、鏈地址法)影響[[21]]。而關(guān)鍵字的原始輸入順序,在等概率查找假設(shè)下,不影響理論上的平均查找長(zhǎng)度,因?yàn)楣1淼男阅芊治龌诮y(tǒng)計(jì)平均,而非特定輸入序列[[24]]。18.【參考答案】B【解析】SQL語(yǔ)句的書(shū)寫(xiě)順序與實(shí)際執(zhí)行順序不同。數(shù)據(jù)庫(kù)引擎首先確定數(shù)據(jù)源(FROM),然后進(jìn)行行篩選(WHERE),接著分組(GROUPBY),再對(duì)分組結(jié)果篩選(HAVING),之后才是選擇輸出列(SELECT),最后進(jìn)行排序(ORDERBY)[[29]]。理解此順序?qū)φ_使用列別名、聚合函數(shù)至關(guān)重要,例如HAVING中不能使用SELECT中定義的別名[[32]]。19.【參考答案】C【解析】最佳置換算法(OPT)是一種理想化的算法,它在發(fā)生缺頁(yè)時(shí),選擇在未來(lái)最長(zhǎng)時(shí)間內(nèi)不再被訪問(wèn)、或永不被訪問(wèn)的頁(yè)面予以淘汰[[41]]。該策略可保證理論上的最低缺頁(yè)率,但由于需要預(yù)知未來(lái)的頁(yè)面訪問(wèn)序列,在實(shí)際系統(tǒng)中無(wú)法實(shí)現(xiàn),主要用于作為衡量其他算法性能的理論基準(zhǔn)[[38]]。20.【參考答案】B【解析】當(dāng)收到三個(gè)重復(fù)ACK時(shí),TCP首先執(zhí)行快重傳(立即重傳丟失報(bào)文),隨后進(jìn)入快恢復(fù)階段。此時(shí),慢開(kāi)始門(mén)限被設(shè)置為當(dāng)前擁塞窗口的一半(ssthresh=cwnd/2),同時(shí)將cwnd設(shè)為ssthresh+3(或直接設(shè)為ssthresh),然后執(zhí)行擁塞避免算法,而非重新慢啟動(dòng)[[56]]。這避免了因單個(gè)報(bào)文丟失而導(dǎo)致傳輸速率急劇下降[[47]]。21.【參考答案】B【解析】第三范式(3NF)建立在第二范式(2NF)的基礎(chǔ)上,其核心要求是消除非主屬性對(duì)候選鍵的傳遞函數(shù)依賴。即,如果存在A→B,B→C,且B不完全函數(shù)依賴于A(B不是候選鍵),那么C對(duì)A的依賴就是傳遞依賴,3NF要求這種依賴不存在[[14]]。22.【參考答案】B【解析】MEMORY_AND_DISK策略會(huì)首先嘗試將數(shù)據(jù)以反序列化的Java對(duì)象形式放入內(nèi)存。當(dāng)內(nèi)存不足時(shí),無(wú)法存入內(nèi)存的分區(qū)會(huì)被寫(xiě)入磁盤(pán),并在后續(xù)需要時(shí)從磁盤(pán)讀取,從而避免了重新計(jì)算的開(kāi)銷(xiāo)[[20]]。23.【參考答案】A【解析】欠擬合是指模型過(guò)于簡(jiǎn)單,無(wú)法學(xué)習(xí)到數(shù)據(jù)中的基本模式和規(guī)律,導(dǎo)致其在訓(xùn)練集和驗(yàn)證集上都表現(xiàn)不佳(高偏差)。解決方法通常包括增加模型復(fù)雜度、進(jìn)行更有效的特征工程或減少正則化強(qiáng)度[[28]]。24.【參考答案】B【解析】三次握手的核心目的是讓通信雙方同步彼此的初始序列號(hào)(ISN),并確認(rèn)雙方的發(fā)送和接收能力均正常,從而為后續(xù)可靠的數(shù)據(jù)傳輸建立基礎(chǔ)。其過(guò)程包括SYN、SYN-ACK、ACK三個(gè)報(bào)文的交互[[38]]。25.【參考答案】C【解析】Kafka僅保證單個(gè)分區(qū)內(nèi)(Partition)的消息順序。因此,要保證特定業(yè)務(wù)鍵(如用戶ID)的全局順序,必須通過(guò)自定義分區(qū)器(Partitioner),將具有相同鍵值的消息路由到同一個(gè)分區(qū)內(nèi),從而利用分區(qū)內(nèi)的天然有序性[[49]][[57]]。26.【參考答案】ABD【解析】第三范式要求滿足第二范式(即消除部分函數(shù)依賴),且不存在非主屬性對(duì)候選鍵的傳遞函數(shù)依賴。同時(shí),所有范式都默認(rèn)屬性是原子的(即滿足第一范式)。C項(xiàng)錯(cuò)誤,因?yàn)?NF不允許部分函數(shù)依賴,那是1NF到2NF要解決的問(wèn)題。27.【參考答案】AB【解析】星型模型由一個(gè)中心事實(shí)表和多個(gè)直接關(guān)聯(lián)的維度表構(gòu)成;雪花模型在此基礎(chǔ)上對(duì)維度表進(jìn)行規(guī)范化。事實(shí)表存儲(chǔ)度量值(如銷(xiāo)售額),維度表存儲(chǔ)描述性信息(如時(shí)間、地點(diǎn))。C和D將兩者功能混淆,故錯(cuò)誤。28.【參考答案】AC【解析】DDL(數(shù)據(jù)定義語(yǔ)言)語(yǔ)句如CREATE、ALTER、DROP通常會(huì)自動(dòng)提交當(dāng)前事務(wù)。而DML語(yǔ)句(如INSERT、UPDATE、DELETE)和SELECT不會(huì)自動(dòng)提交,需顯式使用COMMIT。因此A和C正確,B和D錯(cuò)誤。29.【參考答案】AB【解析】JSON標(biāo)準(zhǔn)規(guī)定字符串必須用雙引號(hào),支持對(duì)象(鍵值對(duì))和數(shù)組。但JSON不支持注釋,也不原生支持日期類(lèi)型(通常以字符串形式表示)。因此C和D不符合標(biāo)準(zhǔn)JSON規(guī)范。30.【參考答案】ABD【解析】弱實(shí)體依賴強(qiáng)實(shí)體,多值屬性需通過(guò)新建關(guān)系表實(shí)現(xiàn),主鍵確實(shí)用于唯一標(biāo)識(shí)實(shí)體實(shí)例。但聯(lián)系可以是一元、二元甚至多元(多個(gè)實(shí)體間),故C錯(cuò)誤。31.【參考答案】A,B,C,D【解析】數(shù)據(jù)庫(kù)范式是規(guī)范化設(shè)計(jì)的核心。第一范式確保列的原子性[[15]],第二范式要求所有非主屬性完全依賴主鍵,第三范式消除了非主屬性對(duì)主鍵的傳遞依賴[[14]]。BCNF是比3NF更嚴(yán)格的范式,要求所有函數(shù)依賴的決定因素都必須是候選鍵[[23]],因此滿足BCNF的表必然滿足3NF[[19]]。32.【參考答案】A,B,C,D【解析】ACID是事務(wù)的四大核心特性。原子性保證事務(wù)的不可分割性[[30]],一致性確保數(shù)據(jù)庫(kù)從一個(gè)有效狀態(tài)轉(zhuǎn)換到另一個(gè)有效狀態(tài)[[28]],隔離性防止并發(fā)事務(wù)相互影響[[31]],持久性保證已提交事務(wù)的結(jié)果不會(huì)因系統(tǒng)故障而丟失[[32]]。這四項(xiàng)共同保障了數(shù)據(jù)的可靠性。33.【參考答案】A,B,C【解析】樹(shù)是典型的非線性結(jié)構(gòu),用于建模層級(jí)關(guān)系[[43]]。二叉樹(shù)定義為每個(gè)節(jié)點(diǎn)至多有兩個(gè)子節(jié)點(diǎn)[[39]]。完全二叉樹(shù)要求除最后一層外,其他層節(jié)點(diǎn)數(shù)達(dá)到最大,且最后一層節(jié)點(diǎn)從左到右連續(xù)排列[[39]]。樹(shù)的深度是指從根節(jié)點(diǎn)到該節(jié)點(diǎn)的路徑上邊的數(shù)目,而非長(zhǎng)度,選項(xiàng)D表述不嚴(yán)謹(jǐn),故不選。34.【參考答案】A,B,D【解析】?jī)?yōu)化策略包括為高頻查詢列建立索引[[48]],避免SELECT*以減少數(shù)據(jù)傳輸[[53]],以及使用EXPLAIN工具分析執(zhí)行計(jì)劃[[51]]。在索引列上使用函數(shù)會(huì)導(dǎo)致索引失效,無(wú)法利用索引加速查詢,因此C是錯(cuò)誤的[[52]]。35.【參考答案】A,B,D【解析】有向圖的邊有明確起點(diǎn)和終點(diǎn)[[45]],無(wú)向圖的邊可雙向通行[[45]]。深度優(yōu)先搜索(DFS)和廣度優(yōu)先搜索(BFS)是基礎(chǔ)遍歷算法[[38]]。鄰接矩陣在稠密圖中更高效,稀疏圖通常用鄰接表存儲(chǔ)以節(jié)省空間,因此C錯(cuò)誤。36.【參考答案】A,B,C【解析】第一范式要求屬性原子性[[15]],第二范式在第一范式基礎(chǔ)上要求非主屬性完全依賴候選鍵[[15]],第三范式進(jìn)一步要求消除傳遞依賴[[15]]。BCNF雖能解決部分函數(shù)依賴問(wèn)題,但無(wú)法完全消除所有冗余和異常,例如多值依賴導(dǎo)致的問(wèn)題[[14]]。37.【參考答案】A,B,D【解析】索引通過(guò)排序結(jié)構(gòu)加速數(shù)據(jù)檢索[[19]],B+樹(shù)是主流索引結(jié)構(gòu)[[24]]。過(guò)度索引會(huì)降低寫(xiě)入性能并占用額外空間[[21]]。對(duì)索引列進(jìn)行函數(shù)操作(如`WHEREYEAR(date_col)=2023`)會(huì)破壞索引的有序性,導(dǎo)致索引失效[[27]]。38.【參考答案】A,B,C【解析】E-R模型是概念數(shù)據(jù)模型,用于描述現(xiàn)實(shí)世界中的實(shí)體、實(shí)體的屬性以及實(shí)體間的聯(lián)系[[30]]。視圖是數(shù)據(jù)庫(kù)的邏輯對(duì)象,屬于物理模型或邏輯模型的產(chǎn)物,并非E-R模型的原始構(gòu)成要素[[36]]。39.【參考答案】A,B,C,D【解析】ACID是事務(wù)的四大核心特性:原子性保證操作的不可分割性[[40]],一致性確保數(shù)據(jù)完整性約束不被破壞[[41]],隔離性處理并發(fā)控制[[42]],持久性保障提交結(jié)果的永久性[[44]]。40.【參考答案】A,B,C【解析】事實(shí)表記錄業(yè)務(wù)過(guò)程的度量值[[48]],維度表提供分析上下文[[56]]。事實(shí)表主鍵由關(guān)聯(lián)的維度表外鍵構(gòu)成[[57]]。事實(shí)表通常包含海量交易記錄,數(shù)據(jù)量遠(yuǎn)超維度表,因此D選項(xiàng)錯(cuò)誤。41.【參考答案】A【解析】第三范式(3NF)的定義是:在滿足第二范式(2NF)的基礎(chǔ)上,所有非主屬性都不傳遞依賴于候選鍵。也就是說(shuō),非主屬性之間不能存在依賴關(guān)系,必須直接依賴于主鍵。因此該說(shuō)法正確。42.【參考答案】A【解析】JSON(JavaScriptObjectNotation)確實(shí)源自JavaScript語(yǔ)言的對(duì)象字面量語(yǔ)法,但已被廣泛用作獨(dú)立于語(yǔ)言的數(shù)據(jù)格式。它支持字符串、數(shù)值、布爾值、數(shù)組、對(duì)象和null,不支持函數(shù)或undefined,因此是JavaScript對(duì)象表示法的一個(gè)嚴(yán)格子集。43.【參考答案】B【解析】在UML中,聚合關(guān)系用空心菱形箭頭表示,表示“整體-部分”關(guān)系但部分可獨(dú)立存在;而組合關(guān)系(更強(qiáng)的依賴)才使用實(shí)心菱形箭頭,表示部分不能脫離整體而存在。因此該說(shuō)法錯(cuò)誤。44.【參考答案】A【解析】星型模型是數(shù)據(jù)倉(cāng)庫(kù)中常用的一種多維數(shù)據(jù)模型,其結(jié)構(gòu)中心是一個(gè)事實(shí)表(存儲(chǔ)度量數(shù)據(jù)),周?chē)B接多個(gè)維度表(描述性屬性),形似星形,因此得名。該描述準(zhǔn)確無(wú)誤。45.【參考答案】A【解析】主成分分析(PCA)通過(guò)線性變換將原始高維數(shù)據(jù)投影到低維空間,保留最大方差方向,從而實(shí)現(xiàn)降維。其過(guò)程不需要標(biāo)簽信息,屬于典型的無(wú)監(jiān)督學(xué)習(xí)方法,常用于數(shù)據(jù)預(yù)處理和可視化。46.【參考答案】A【解析】第三范式(3NF)的定義是:關(guān)系模式R中的每一個(gè)非主屬性既不部分依賴于候選鍵,也不傳遞依賴于候選鍵。也就是說(shuō),在滿足第二范式的基礎(chǔ)上,還需消除非主屬性對(duì)候選鍵的傳遞函數(shù)依賴。因此該說(shuō)法正確。47.【參考答案】A【解析】判別模型直接學(xué)習(xí)輸入與輸出之間的映射關(guān)系(如決策函數(shù)或條件概率P(Y|X)),而生成模型則學(xué)習(xí)聯(lián)合概率分布P(X,Y)。決策樹(shù)通過(guò)學(xué)習(xí)規(guī)則直接進(jìn)行分類(lèi),不建模數(shù)據(jù)的生成過(guò)程,因此屬于判別模型[[2]]。48.【參考答案】B【解析】HDFS(HadoopDistributedFileSystem)設(shè)計(jì)用于高吞吐量、批量處理的大文件存儲(chǔ),其架構(gòu)不適合低延遲(如毫秒級(jí))訪問(wèn)場(chǎng)景。對(duì)于低延遲需求,通常采用HBase等系統(tǒng)。因此該說(shuō)法錯(cuò)誤[[4]]。49.【參考答案】A【解析】動(dòng)態(tài)規(guī)劃通過(guò)記憶化(Memoization)或自底向上填表的方式,高效解決具有最優(yōu)子結(jié)構(gòu)和重疊子問(wèn)題性質(zhì)的問(wèn)題,如最長(zhǎng)公共子序列、背包問(wèn)題等。該描述準(zhǔn)確,故正確[[6]]。50.【參考答案】A【解析】LEFTJOIN(左外連接)會(huì)返回左表所有記錄,即使右表沒(méi)有匹配項(xiàng)。對(duì)于右表無(wú)匹配的行,其字段在結(jié)果集中以NULL填充。這是SQL標(biāo)準(zhǔn)行為,因此該說(shuō)法正確。
2025四川九洲光電科技股份有限公司招聘軟件工程師(數(shù)據(jù)模型方向)擬錄用人員筆試歷年典型考點(diǎn)題庫(kù)附帶答案詳解(第2套)一、單項(xiàng)選擇題下列各題只有一個(gè)正確答案,請(qǐng)選出最恰當(dāng)?shù)倪x項(xiàng)(共25題)1、在關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)中,第三范式(3NF)要求消除以下哪類(lèi)依賴?A.非主屬性對(duì)主鍵的部分函數(shù)依賴B.非主屬性對(duì)主鍵的傳遞函數(shù)依賴C.主屬性對(duì)主鍵的部分函數(shù)依賴D.所有非平凡函數(shù)依賴2、在機(jī)器學(xué)習(xí)中,以下哪種方法主要用于處理過(guò)擬合問(wèn)題?A.增加訓(xùn)練數(shù)據(jù)量B.使用更高階的多項(xiàng)式特征C.提高模型復(fù)雜度D.減少驗(yàn)證集大小3、在SQL語(yǔ)言中,以下哪個(gè)關(guān)鍵字用于從多個(gè)表中組合數(shù)據(jù)?A.UNIONB.JOINC.GROUPBYD.HAVING4、在UML類(lèi)圖中,聚合關(guān)系通常用哪種圖形符號(hào)表示?A.實(shí)線空心三角箭頭B.虛線空心三角箭頭C.實(shí)線空心菱形D.實(shí)線實(shí)心菱形5、在數(shù)據(jù)建模中,星型模型與雪花模型的主要區(qū)別在于?A.事實(shí)表的數(shù)量B.維度表是否規(guī)范化C.是否支持OLTP系統(tǒng)D.主鍵的設(shè)計(jì)方式6、在數(shù)據(jù)庫(kù)設(shè)計(jì)中,若一個(gè)關(guān)系模式滿足第三范式(3NF),則它必然也滿足以下哪個(gè)范式?A.BCNFB.第四范式(4NF)C.第二范式(2NF)D.第五范式(5NF)7、下列哪一項(xiàng)是第一范式(1NF)的核心要求?A.消除非主屬性對(duì)候選碼的部分函數(shù)依賴B.消除非主屬性對(duì)候選碼的傳遞函數(shù)依賴C.確保所有屬性都是不可再分的基本數(shù)據(jù)項(xiàng)D.消除主屬性對(duì)候選碼子集的依賴8、BCNF(巴斯-科德范式)相較于第三范式(3NF)的主要改進(jìn)在于解決了什么問(wèn)題?A.消除非主屬性對(duì)候選碼的部分函數(shù)依賴B.消除非主屬性對(duì)候選碼的傳遞函數(shù)依賴C.消除主屬性對(duì)候選碼子集的函數(shù)依賴D.消除多值依賴9、在關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)中,為了減少數(shù)據(jù)冗余并提高數(shù)據(jù)一致性,通常會(huì)遵循范式理論。以下哪項(xiàng)最能概括范式的主要目的?A.增加數(shù)據(jù)存儲(chǔ)容量B.提高數(shù)據(jù)庫(kù)查詢速度C.減少數(shù)據(jù)冗余,提高數(shù)據(jù)一致性D.簡(jiǎn)化數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)的開(kāi)發(fā)10、判斷一個(gè)關(guān)系模式是否符合第二范式(2NF),首先需要確定什么?A.所有非主屬性B.所有候選碼C.所有外鍵D.所有主屬性11、在關(guān)系型數(shù)據(jù)庫(kù)中,若一個(gè)表的每個(gè)屬性都不可再分,且每個(gè)記錄都是唯一的,則該表滿足哪一范式?A.第一范式(1NF)B.第二范式(2NF)C.第三范式(3NF)D.巴斯-科德范式(BCNF)12、在SQL查詢中,要獲取兩個(gè)表中所有匹配的記錄,應(yīng)使用哪種連接類(lèi)型?A.LEFTJOINB.RIGHTJOINC.INNERJOIND.FULLOUTERJOIN13、以下哪項(xiàng)描述了數(shù)據(jù)庫(kù)事務(wù)的“原子性”特性?A.事務(wù)執(zhí)行后,數(shù)據(jù)庫(kù)從一個(gè)一致?tīng)顟B(tài)變?yōu)榱硪粋€(gè)一致?tīng)顟B(tài)B.多個(gè)事務(wù)并發(fā)執(zhí)行時(shí),其結(jié)果應(yīng)與串行執(zhí)行結(jié)果一致C.事務(wù)對(duì)數(shù)據(jù)的修改是永久的,即使系統(tǒng)故障也不會(huì)丟失D.事務(wù)中的所有操作要么全部成功執(zhí)行,要么全部不執(zhí)行14、在關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)中,若一個(gè)非主屬性依賴于另一個(gè)非主屬性,而非直接依賴于主鍵,則違反了哪一范式?A.第一范式(1NF)B.第二范式(2NF)C.第三范式(3NF)D.BCNF15、在SQL中,LEFTJOIN(左連接)會(huì)返回什么結(jié)果?A.只返回兩個(gè)表中連接字段相等的記錄B.返回左表的所有記錄,以及右表中匹配的記錄C.返回右表的所有記錄,以及左表中匹配的記錄D.返回兩個(gè)表中的所有記錄16、在數(shù)據(jù)庫(kù)設(shè)計(jì)中,第一范式(1NF)要求關(guān)系表中的每個(gè)屬性必須滿足什么條件?A.屬性值必須是數(shù)值類(lèi)型B.每一屬性都是不可再分的基本數(shù)據(jù)項(xiàng)C.必須包含主鍵和外鍵D.所有屬性值都必須唯一17、數(shù)據(jù)流圖(DFD)主要用于描述系統(tǒng)的哪個(gè)方面?A.系統(tǒng)的控制流程和決策邏輯B.系統(tǒng)中數(shù)據(jù)的傳遞和加工過(guò)程C.用戶界面的交互設(shè)計(jì)D.數(shù)據(jù)庫(kù)的物理存儲(chǔ)結(jié)構(gòu)18、下列哪項(xiàng)是實(shí)體-關(guān)系圖(E-R圖)的核心組成要素?A.處理過(guò)程、數(shù)據(jù)流、數(shù)據(jù)存儲(chǔ)、外部實(shí)體B.實(shí)體、屬性、聯(lián)系C.模塊、接口、調(diào)用關(guān)系D.類(lèi)、對(duì)象、繼承19、將數(shù)據(jù)流圖(DFD)轉(zhuǎn)換為實(shí)體關(guān)系圖(ER圖)的主要目的是什么?A.將系統(tǒng)的動(dòng)態(tài)流程轉(zhuǎn)換為靜態(tài)的數(shù)據(jù)模型B.優(yōu)化程序的執(zhí)行效率C.設(shè)計(jì)用戶友好的界面D.增加系統(tǒng)的安全防護(hù)20、關(guān)于數(shù)據(jù)流圖(DFD),以下說(shuō)法正確的是?A.數(shù)據(jù)流圖中的箭頭代表控制流B.數(shù)據(jù)流圖與傳統(tǒng)的流程圖或框圖完全相同C.數(shù)據(jù)流圖是從數(shù)據(jù)的角度來(lái)描述系統(tǒng)D.數(shù)據(jù)流圖主要用于描述程序的算法邏輯21、在關(guān)系數(shù)據(jù)庫(kù)中,用于確保表中每一行數(shù)據(jù)唯一性的約束是?A.外鍵約束B(niǎo).非空約束C.唯一約束D.主鍵約束22、以下哪種數(shù)據(jù)模型屬于概念數(shù)據(jù)模型?A.層次模型B.網(wǎng)狀模型C.實(shí)體-聯(lián)系模型D.關(guān)系模型23、在SQL中,用于從多個(gè)表中合并結(jié)果集但自動(dòng)去除重復(fù)行的操作符是?A.JOINB.UNIONC.UNIONALLD.INTERSECT24、以下關(guān)于數(shù)據(jù)庫(kù)范式的描述,正確的是?A.第二范式要求消除非主屬性對(duì)候選鍵的部分函數(shù)依賴B.第三范式允許傳遞函數(shù)依賴存在C.第一范式不要求屬性原子性D.BCNF比第三范式要求更寬松25、在數(shù)據(jù)建模中,將一個(gè)實(shí)體類(lèi)型的屬性劃分為多個(gè)子實(shí)體類(lèi)型的過(guò)程稱為?A.聚合B.泛化C.分解D.特化二、多項(xiàng)選擇題下列各題有多個(gè)正確答案,請(qǐng)選出所有正確選項(xiàng)(共15題)26、在關(guān)系型數(shù)據(jù)庫(kù)設(shè)計(jì)中,關(guān)于范式(NormalForm)的描述,以下哪些是正確的?A.第一范式要求每個(gè)屬性都是不可再分的原子值B.第二范式要求消除非主屬性對(duì)候選鍵的部分函數(shù)依賴C.第三范式要求消除非主屬性對(duì)候選鍵的傳遞函數(shù)依賴D.BCNF范式比第三范式更嚴(yán)格,要求所有函數(shù)依賴的決定因素都必須是超鍵27、關(guān)于數(shù)據(jù)倉(cāng)庫(kù)中的維度建模,以下說(shuō)法正確的是?A.星型模型由一個(gè)事實(shí)表和多個(gè)維度表組成B.雪花模型是對(duì)維度表進(jìn)行規(guī)范化后的星型模型C.事實(shí)表通常存儲(chǔ)度量值和外鍵D.維度表通常包含大量重復(fù)的數(shù)值型數(shù)據(jù)28、在使用SQL進(jìn)行數(shù)據(jù)查詢時(shí),以下哪些操作可用于處理重復(fù)數(shù)據(jù)?A.使用DISTINCT關(guān)鍵字B.使用GROUPBY子句C.使用UNION操作符D.使用WHERE子句過(guò)濾29、關(guān)于ETL(Extract,Transform,Load)過(guò)程,以下描述正確的是?A.Extract階段從多個(gè)源系統(tǒng)中抽取數(shù)據(jù)B.Transform階段可能包括數(shù)據(jù)清洗、格式轉(zhuǎn)換和聚合C.Load階段將處理后的數(shù)據(jù)加載到目標(biāo)數(shù)據(jù)倉(cāng)庫(kù)D.ETL過(guò)程通常在事務(wù)處理系統(tǒng)(OLTP)中執(zhí)行30、在機(jī)器學(xué)習(xí)中,關(guān)于過(guò)擬合(Overfitting)現(xiàn)象,以下哪些說(shuō)法是正確的?A.模型在訓(xùn)練集上表現(xiàn)很好,但在測(cè)試集上表現(xiàn)差B.可通過(guò)增加正則化項(xiàng)緩解C.增加訓(xùn)練數(shù)據(jù)有助于減輕過(guò)擬合D.使用更復(fù)雜的模型結(jié)構(gòu)一定導(dǎo)致過(guò)擬合31、在關(guān)系型數(shù)據(jù)庫(kù)設(shè)計(jì)中,關(guān)于第三范式(3NF)的描述,以下哪些是正確的?A.消除了非主屬性對(duì)候選鍵的部分函數(shù)依賴B.消除了非主屬性對(duì)候選鍵的傳遞函數(shù)依賴C.要求所有屬性都必須是原子的D.允許存在主屬性對(duì)候選鍵的傳遞依賴32、以下哪些算法可用于處理高維稀疏數(shù)據(jù)的相似度計(jì)算?A.余弦相似度B.歐氏距離C.杰卡德相似系數(shù)D.曼哈頓距離33、關(guān)于數(shù)據(jù)倉(cāng)庫(kù)的星型模型與雪花模型,以下說(shuō)法正確的是?A.星型模型的維度表是規(guī)范化的B.雪花模型通過(guò)進(jìn)一步規(guī)范化維度表減少冗余C.星型模型查詢性能通常優(yōu)于雪花模型D.雪花模型更易于理解和維護(hù)34、在構(gòu)建機(jī)器學(xué)習(xí)模型時(shí),以下哪些做法有助于緩解過(guò)擬合問(wèn)題?A.增加訓(xùn)練數(shù)據(jù)量B.使用正則化技術(shù)(如L1/L2)C.提高模型復(fù)雜度D.采用早停策略(EarlyStopping)35、關(guān)于SQL中的JOIN操作,以下哪些說(shuō)法是正確的?A.INNERJOIN只返回兩個(gè)表中匹配的記錄B.LEFTJOIN會(huì)保留左表所有記錄,右表無(wú)匹配則填充N(xiāo)ULLC.FULLOUTERJOIN在所有數(shù)據(jù)庫(kù)系統(tǒng)中都支持D.CROSSJOIN會(huì)產(chǎn)生笛卡爾積36、在關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)中,關(guān)于范式理論,以下說(shuō)法正確的是?A.第一范式(1NF)要求關(guān)系中的每個(gè)屬性都是不可再分的原子值B.第二范式(2NF)要求消除非主屬性對(duì)候選鍵的部分函數(shù)依賴C.第三范式(3NF)允許存在傳遞函數(shù)依賴D.BCNF(Boyce-Codd范式)比第三范式更嚴(yán)格37、關(guān)于數(shù)據(jù)倉(cāng)庫(kù)中的維度建模,以下描述正確的是?A.星型模型由一個(gè)事實(shí)表和多個(gè)維度表組成B.雪花模型是對(duì)星型模型的規(guī)范化,維度表可進(jìn)一步分解C.事實(shí)表通常存儲(chǔ)描述性屬性D.維度表通常包含可度量的數(shù)值型數(shù)據(jù)38、在Python中,關(guān)于Pandas庫(kù)的DataFrame操作,以下說(shuō)法正確的是?A.使用dropna()可刪除包含缺失值的行或列B.groupby()方法用于對(duì)數(shù)據(jù)進(jìn)行分組聚合C.merge()函數(shù)只能實(shí)現(xiàn)內(nèi)連接(innerjoin)D.iloc是基于標(biāo)簽的索引方式39、關(guān)于數(shù)據(jù)庫(kù)事務(wù)的ACID特性,以下理解正確的是?A.原子性(Atomicity)指事務(wù)中的操作要么全部成功,要么全部失敗B.一致性(Consistency)確保事務(wù)執(zhí)行前后數(shù)據(jù)庫(kù)從一個(gè)有效狀態(tài)轉(zhuǎn)換到另一個(gè)有效狀態(tài)C.隔離性(Isolation)要求多個(gè)事務(wù)不能并發(fā)執(zhí)行D.持久性(Durability)指事務(wù)一旦提交,其結(jié)果將永久保存40、在機(jī)器學(xué)習(xí)中,關(guān)于過(guò)擬合(Overfitting)現(xiàn)象,以下說(shuō)法正確的是?A.模型在訓(xùn)練集上表現(xiàn)很好,但在測(cè)試集上表現(xiàn)較差B.增加訓(xùn)練數(shù)據(jù)量有助于緩解過(guò)擬合C.使用正則化技術(shù)(如L1、L2)可降低模型復(fù)雜度D.決策樹(shù)深度越小越容易發(fā)生過(guò)擬合三、判斷題判斷下列說(shuō)法是否正確(共10題)41、在關(guān)系型數(shù)據(jù)庫(kù)中,主鍵約束確保了表中每一行數(shù)據(jù)的唯一性。A.正確B.錯(cuò)誤42、數(shù)據(jù)模型中的實(shí)體-關(guān)系(E-R)模型主要用于描述系統(tǒng)的動(dòng)態(tài)行為。A.正確B.錯(cuò)誤43、在數(shù)據(jù)挖掘中,聚類(lèi)分析是一種無(wú)監(jiān)督學(xué)習(xí)方法。A.正確B.錯(cuò)誤44、SQL語(yǔ)句中的GROUPBY子句必須與聚合函數(shù)(如COUNT,SUM)配合使用。A.正確B.錯(cuò)誤45、在軟件開(kāi)發(fā)中,數(shù)據(jù)模型的設(shè)計(jì)應(yīng)優(yōu)先考慮數(shù)據(jù)的存儲(chǔ)效率,而非業(yè)務(wù)邏輯的清晰性。A.正確B.錯(cuò)誤46、在關(guān)系數(shù)據(jù)庫(kù)中,第三范式(3NF)要求不存在非主屬性對(duì)候選鍵的傳遞函數(shù)依賴。A.正確B.錯(cuò)誤47、在機(jī)器學(xué)習(xí)中,過(guò)擬合通常表現(xiàn)為模型在訓(xùn)練集上表現(xiàn)很好,但在測(cè)試集上表現(xiàn)較差。A.正確B.錯(cuò)誤48、K-means聚類(lèi)算法對(duì)初始聚類(lèi)中心的選擇不敏感,總能收斂到全局最優(yōu)解。A.正確B.錯(cuò)誤49、在數(shù)據(jù)建模中,ER圖(實(shí)體-關(guān)系圖)主要用于描述系統(tǒng)的邏輯結(jié)構(gòu)而非物理存儲(chǔ)結(jié)構(gòu)。A.正確B.錯(cuò)誤50、主成分分析(PCA)是一種無(wú)監(jiān)督的線性降維方法,其目標(biāo)是最大化投影后數(shù)據(jù)的方差。A.正確B.錯(cuò)誤
參考答案及解析1.【參考答案】B【解析】第三范式在滿足第二范式的基礎(chǔ)上,進(jìn)一步要求消除非主屬性對(duì)主鍵的傳遞函數(shù)依賴,即非主屬性不能通過(guò)其他非主屬性間接依賴于主鍵。這有助于減少數(shù)據(jù)冗余和更新異常。2.【參考答案】A【解析】過(guò)擬合通常由于模型在訓(xùn)練集上過(guò)于復(fù)雜或訓(xùn)練數(shù)據(jù)不足導(dǎo)致。增加訓(xùn)練數(shù)據(jù)量能有效提升模型泛化能力,是應(yīng)對(duì)過(guò)擬合的常用策略之一;而提高模型復(fù)雜度會(huì)加劇過(guò)擬合[[1]]。3.【參考答案】B【解析】JOIN用于根據(jù)指定條件將兩個(gè)或多個(gè)表中的行連接起來(lái),實(shí)現(xiàn)多表數(shù)據(jù)組合查詢;UNION用于合并多個(gè)SELECT結(jié)果集,但要求列結(jié)構(gòu)一致,且不涉及表間關(guān)聯(lián)邏輯。4.【參考答案】C【解析】UML中,聚合關(guān)系表示“整體-部分”關(guān)系中部分可獨(dú)立存在,用實(shí)線連接并以空心菱形指向整體;組合關(guān)系則用實(shí)心菱形,表示部分不能脫離整體存在。5.【參考答案】B【解析】星型模型的維度表是非規(guī)范化的,結(jié)構(gòu)扁平;雪花模型則對(duì)維度表進(jìn)行規(guī)范化,形成多層結(jié)構(gòu)。雪花模型節(jié)省存儲(chǔ)但查詢復(fù)雜,星型模型更適用于數(shù)據(jù)倉(cāng)庫(kù)的快速分析場(chǎng)景。6.【參考答案】C【解析】數(shù)據(jù)庫(kù)范式具有層級(jí)關(guān)系,滿足高一級(jí)范式必然滿足所有低一級(jí)范式[[12]]。第三范式(3NF)是在第二范式(2NF)的基礎(chǔ)上消除非主屬性對(duì)候選碼的傳遞函數(shù)依賴[[32]]。因此,滿足3NF的關(guān)系模式一定先滿足了2NF的要求[[11]]。7.【參考答案】C【解析】第一范式(1NF)是數(shù)據(jù)庫(kù)設(shè)計(jì)的最基本要求,其核心是確保表中的每一列(屬性)都是不可分割的基本數(shù)據(jù)項(xiàng),即保證數(shù)據(jù)的原子性,不允許同一列中存在多個(gè)值[[1]]。8.【參考答案】C【解析】BCNF是在3NF基礎(chǔ)上提出的更嚴(yán)格的范式,它主要解決了3NF中可能存在的、由主屬性(而非非主屬性)對(duì)候選碼子集的依賴所引起的冗余和異常問(wèn)題[[29]]。3NF關(guān)注的是非主屬性,而B(niǎo)CNF將約束擴(kuò)展到了所有屬性[[20]]。9.【參考答案】C【解析】數(shù)據(jù)庫(kù)范式(如1NF、2NF、3NF)的核心目標(biāo)是通過(guò)規(guī)范化數(shù)據(jù)結(jié)構(gòu),消除不必要的數(shù)據(jù)冗余,從而減少數(shù)據(jù)不一致和更新異常的風(fēng)險(xiǎn),確保數(shù)據(jù)的一致性和完整性[[7]]。10.【參考答案】B【解析】第二范式(2NF)要求消除非主屬性對(duì)候選碼的部分函數(shù)依賴。因此,判斷是否符合2NF的第一步是確定該關(guān)系模式的所有候選碼[[31]]。只有明確了候選碼,才能分析非主屬性是否完全依賴于整個(gè)候選碼。11.【參考答案】A【解析】第一范式(1NF)要求數(shù)據(jù)庫(kù)表的每一列都是不可分割的原子值[[35]]。這是數(shù)據(jù)庫(kù)規(guī)范化的基礎(chǔ),確保了數(shù)據(jù)項(xiàng)的最小化,是滿足更高范式(如2NF、3NF)的前提[[30]]。12.【參考答案】C【解析】INNERJOIN(內(nèi)連接)僅返回兩個(gè)表中連接字段值相等的行[[20]]。它用于查找兩個(gè)表之間的交集,是獲取匹配記錄的標(biāo)準(zhǔn)方法[[26]]。13.【參考答案】D【解析】原子性(Atomicity)指事務(wù)作為一個(gè)不可分割的最小工作單元,其包含的所有操作必須全部成功完成,或者全部失敗回滾,不允許部分成功[[40]]。這保證了數(shù)據(jù)的完整性[[44]]。14.【參考答案】C【解析】第三范式(3NF)要求所有非主屬性都必須直接依賴于主鍵,不能存在對(duì)其他非主屬性的傳遞依賴[[32]]。違反此規(guī)則會(huì)導(dǎo)致數(shù)據(jù)冗余和更新異常[[29]]。15.【參考答案】B【解析】LEFTJOIN(左外連接)會(huì)返回左表中的所有記錄,對(duì)于右表中沒(méi)有匹配的記錄,其對(duì)應(yīng)字段將顯示為NULL[[21]]。這確保了左表數(shù)據(jù)的完整性[[23]]。16.【參考答案】B【解析】第一范式(1NF)是數(shù)據(jù)庫(kù)規(guī)范化的基本要求,它規(guī)定關(guān)系表中的每個(gè)屬性都必須是不可再分的基本數(shù)據(jù)項(xiàng),即不允許出現(xiàn)重復(fù)的屬性或一個(gè)屬性包含多個(gè)值[[9]]。17.【參考答案】B【解析】數(shù)據(jù)流圖(DFD)是一種結(jié)構(gòu)化系統(tǒng)分析工具,它從數(shù)據(jù)傳遞和加工的角度,以圖形方式描述邏輯輸入如何經(jīng)過(guò)系統(tǒng)處理轉(zhuǎn)化為邏輯輸出,關(guān)注的是數(shù)據(jù)流而非控制流[[3]]。18.【參考答案】B【解析】實(shí)體-關(guān)系圖(E-R圖)是概念數(shù)據(jù)模型的常用表示方法,其核心組成要素包括實(shí)體(Entity)、描述實(shí)體特征的屬性(Attribute)以及實(shí)體之間的聯(lián)系(Relationship)[[1]]。19.【參考答案】A【解析】將數(shù)據(jù)流圖(DFD)轉(zhuǎn)換為實(shí)體關(guān)系圖(ER圖)是系統(tǒng)設(shè)計(jì)中的重要步驟,其目的是將描述系統(tǒng)動(dòng)態(tài)數(shù)據(jù)流動(dòng)過(guò)程的DFD,轉(zhuǎn)換為描述系統(tǒng)靜態(tài)數(shù)據(jù)結(jié)構(gòu)的ER圖,以便進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì)[[2]]。20.【參考答案】C【解析】數(shù)據(jù)流圖(DFD)是從數(shù)據(jù)的角度來(lái)描述一個(gè)系統(tǒng),展示信息流和數(shù)據(jù)從輸入到輸出的變化過(guò)程,它與傳統(tǒng)的流程圖或框圖不同,后者更側(cè)重于控制流或處理人員視角[[6]]。21.【參考答案】D【解析】主鍵約束(PrimaryKeyConstraint)用于唯一標(biāo)識(shí)表中的每一行記錄,其值不能為NULL且必須唯一。唯一約束雖也保證唯一性,但允許NULL值;而主鍵不允許重復(fù)且不能為空,是唯一標(biāo)識(shí)記錄的標(biāo)準(zhǔn)方式。22.【參考答案】C【解析】實(shí)體-聯(lián)系模型(E-R模型)是用于描述現(xiàn)實(shí)世界中實(shí)體及其關(guān)系的概念模型,常用于數(shù)據(jù)庫(kù)設(shè)計(jì)初期。而層次、網(wǎng)狀和關(guān)系模型屬于邏輯或物理數(shù)據(jù)模型,用于具體實(shí)現(xiàn)。23.【參考答案】B【解析】UNION用于合并兩個(gè)或多個(gè)SELECT語(yǔ)句的結(jié)果集,并自動(dòng)去除重復(fù)行;UNIONALL則保留所有重復(fù)行。JOIN用于連接表,INTERSECT返回兩個(gè)查詢共有的行。24.【參考答案】A【解析】第二范式(2NF)確實(shí)要求消除非主屬性對(duì)候選鍵的部分函數(shù)依賴;第三范式(3NF)要求消除傳遞依賴;第一范式要求屬性不可再分(原子性);BCNF是比3NF更強(qiáng)的范式。25.【參考答案】D【解析】特化(Specialization)是指從一個(gè)通用實(shí)體類(lèi)型派生出一個(gè)或多個(gè)子類(lèi)型,每個(gè)子類(lèi)型繼承父類(lèi)型的屬性并可增加特有屬性。泛化則是從多個(gè)子類(lèi)型抽象出共同父類(lèi)型,方向相反。26.【參考答案】ABCD【解析】四個(gè)選項(xiàng)均正確。第一范式(1NF)強(qiáng)調(diào)原子性;第二范式(2NF)在1NF基礎(chǔ)上消除部分依賴;第三范式(3NF)進(jìn)一步消除傳遞依賴;BCNF是3NF的加強(qiáng)版,要求每個(gè)決定因素都是超鍵,確保無(wú)冗余依賴。27.【參考答案】ABC【解析】星型模型結(jié)構(gòu)簡(jiǎn)潔,事實(shí)表連接多個(gè)維度表;雪花模型對(duì)維度表進(jìn)一步規(guī)范化,減少冗余;事實(shí)表存儲(chǔ)度量和外鍵;維度表主要存儲(chǔ)描述性屬性(如文本),而非大量重復(fù)數(shù)值,故D錯(cuò)誤。28.【參考答案】ABC【解析】DISTINCT可去重;GROUPBY按字段分組,常用于聚合去重;UNION默認(rèn)去重(UNIONALL不去重);WHERE用于條件篩選,不能直接處理重復(fù)行,故D不選。29.【參考答案】ABC【解析】ETL用于數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建,包含抽取、轉(zhuǎn)換、加載三步;A、B、
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年河南鋼鐵集團(tuán)數(shù)字應(yīng)用研究院招聘?jìng)淇碱}庫(kù)及參考答案詳解一套
- 2025年現(xiàn)代中藥制劑教育部重點(diǎn)實(shí)驗(yàn)室科研助理招聘補(bǔ)報(bào)通知備考題庫(kù)完整參考答案詳解
- 機(jī)器人輔助外科虛擬手術(shù)仿真系統(tǒng)開(kāi)發(fā)
- 2025年南寧市西鄉(xiāng)塘區(qū)人民法院招聘司法輔助人員的備考題庫(kù)及1套完整答案詳解
- 2025年贛江新區(qū)儒樂(lè)湖第一幼兒園公開(kāi)招聘管理崗位備考題庫(kù)及1套參考答案詳解
- 云南省阜外心血管病醫(yī)院開(kāi)展2026年校園招聘19人備考題庫(kù)及1套完整答案詳解
- 2025年文山州檢驗(yàn)檢測(cè)認(rèn)證院事業(yè)單位緊缺崗位招聘?jìng)淇碱}庫(kù)完整答案詳解
- 2025年深圳市南山區(qū)科技第二幼兒園招聘機(jī)動(dòng)教師1名備考題庫(kù)及參考答案詳解
- 2025年無(wú)錫某醫(yī)院招聘?jìng)淇碱}庫(kù)及一套完整答案詳解
- 粵規(guī)科技2026頂尖校園人才招聘?jìng)淇碱}庫(kù)及參考答案詳解一套
- 山東省委黨校在職研究生法學(xué)理論考試真題(附答案)
- GJB2460A-2020軍用夾布橡膠軟管規(guī)范
- 公路概論考試試題及答案
- 《創(chuàng)新創(chuàng)業(yè)基礎(chǔ)》 課件 第4章 創(chuàng)業(yè)團(tuán)隊(duì)
- 2025年版《煤礦安全規(guī)程》考試題庫(kù)附答案(含各題型)
- 2025云南溫泉山谷康養(yǎng)度假運(yùn)營(yíng)開(kāi)發(fā)(集團(tuán))有限公司社會(huì)招聘19人筆試參考題庫(kù)附帶答案詳解
- 食品加工工藝技術(shù)課件
- 數(shù)據(jù)資產(chǎn)會(huì)計(jì)核算的現(xiàn)狀與問(wèn)題研究
- 監(jiān)理履約考核管理辦法
- 艾梅乙培訓(xùn)課件
- 智能施工升降機(jī)安全管理培訓(xùn)
評(píng)論
0/150
提交評(píng)論