版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2025江蘇省數(shù)據(jù)交易所有限公司夏季招聘筆試歷年典型考點(diǎn)題庫附帶答案詳解(第1套)一、單項(xiàng)選擇題下列各題只有一個(gè)正確答案,請(qǐng)選出最恰當(dāng)?shù)倪x項(xiàng)(共30題)1、在數(shù)據(jù)交易過程中,確保數(shù)據(jù)提供方與使用方身份真實(shí)可信的核心技術(shù)手段是?A.?dāng)?shù)據(jù)脫敏
B.?dāng)?shù)字簽名
C.?dāng)?shù)據(jù)加密
D.訪問控制2、下列哪項(xiàng)最能體現(xiàn)數(shù)據(jù)資產(chǎn)的“可計(jì)量性”特征?A.?dāng)?shù)據(jù)可被存儲(chǔ)在分布式數(shù)據(jù)庫中
B.?dāng)?shù)據(jù)可被清洗和標(biāo)準(zhǔn)化處理
C.?dāng)?shù)據(jù)可通過模型評(píng)估其市場(chǎng)價(jià)值
D.?dāng)?shù)據(jù)可被多個(gè)用戶同時(shí)使用3、在構(gòu)建數(shù)據(jù)交易平臺(tái)的權(quán)限管理體系時(shí),最適宜采用的模型是?A.自主訪問控制(DAC)
B.強(qiáng)制訪問控制(MAC)
C.基于角色的訪問控制(RBAC)
D.基于屬性的訪問控制(ABAC)4、下列哪項(xiàng)技術(shù)最適用于實(shí)現(xiàn)跨機(jī)構(gòu)數(shù)據(jù)“可用不可見”的共享目標(biāo)?A.區(qū)塊鏈
B.聯(lián)邦學(xué)習(xí)
C.?dāng)?shù)據(jù)鏡像
D.API接口調(diào)用5、數(shù)據(jù)交易中,對(duì)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估時(shí),以下哪項(xiàng)指標(biāo)最能反映數(shù)據(jù)的“一致性”?A.?dāng)?shù)據(jù)記錄中缺失值的比例
B.同一實(shí)體在不同數(shù)據(jù)源中的屬性值是否沖突
C.?dāng)?shù)據(jù)更新是否及時(shí)反映現(xiàn)實(shí)變化
D.?dāng)?shù)據(jù)格式是否符合預(yù)定義標(biāo)準(zhǔn)6、在關(guān)系型數(shù)據(jù)庫設(shè)計(jì)中,若要確保某字段的值在指定范圍內(nèi),最適宜采用的約束類型是:A.主鍵約束(PRIMARYKEY)B.外鍵約束(FOREIGNKEY)C.檢查約束(CHECK)D.唯一約束(UNIQUE)7、在數(shù)據(jù)清洗過程中,發(fā)現(xiàn)某數(shù)值型字段存在大量“-1”或“999”等異常標(biāo)記值,最合理的處理方式是:A.直接刪除所有含異常值的記錄B.將異常值統(tǒng)一替換為0C.分析其出現(xiàn)原因,結(jié)合業(yè)務(wù)邏輯決定處理方式D.保留原值,不影響后續(xù)分析8、在Python中,以下哪種數(shù)據(jù)結(jié)構(gòu)最適合實(shí)現(xiàn)“鍵值對(duì)”存儲(chǔ)且支持快速查找?A.列表(list)B.元組(tuple)C.集合(set)D.字典(dict)9、在數(shù)據(jù)可視化中,若要展示某地區(qū)連續(xù)12個(gè)月的銷售額變化趨勢(shì),最合適的圖表類型是:A.餅圖B.柱狀圖C.折線圖D.散點(diǎn)圖10、以下關(guān)于數(shù)據(jù)脫敏的說法,錯(cuò)誤的是:A.數(shù)據(jù)脫敏可防止敏感信息泄露B.脫敏后的數(shù)據(jù)應(yīng)保持原有格式和可用性C.加密是數(shù)據(jù)脫敏的唯一方式D.脫敏常用于測(cè)試和開發(fā)環(huán)境11、在數(shù)據(jù)交易過程中,為確保數(shù)據(jù)資產(chǎn)的合法流通,以下哪項(xiàng)是數(shù)據(jù)確權(quán)的核心依據(jù)?A.數(shù)據(jù)存儲(chǔ)位置B.數(shù)據(jù)采集時(shí)間C.數(shù)據(jù)來源合法性與授權(quán)鏈條D.數(shù)據(jù)格式標(biāo)準(zhǔn)化程度12、在關(guān)系型數(shù)據(jù)庫設(shè)計(jì)中,為減少數(shù)據(jù)冗余并提升一致性,通常需要進(jìn)行規(guī)范化處理。第三范式(3NF)要求滿足的條件是?A.消除重復(fù)組,確保原子性B.消除非主屬性對(duì)候選鍵的部分函數(shù)依賴C.消除非主屬性對(duì)候選鍵的傳遞函數(shù)依賴D.所有屬性都依賴于組合主鍵13、在數(shù)據(jù)安全保護(hù)中,以下哪種技術(shù)主要用于實(shí)現(xiàn)數(shù)據(jù)在傳輸過程中的機(jī)密性?A.數(shù)字簽名B.哈希算法C.對(duì)稱加密D.數(shù)據(jù)脫敏14、在數(shù)據(jù)交易定價(jià)模型中,成本法的主要計(jì)算依據(jù)是?A.數(shù)據(jù)的市場(chǎng)需求與稀缺性B.數(shù)據(jù)的歷史成交價(jià)格C.數(shù)據(jù)采集、處理與維護(hù)的成本D.數(shù)據(jù)使用帶來的預(yù)期收益15、下列哪項(xiàng)是數(shù)據(jù)治理框架中的核心組成部分?A.數(shù)據(jù)可視化工具B.數(shù)據(jù)標(biāo)準(zhǔn)與元數(shù)據(jù)管理C.服務(wù)器硬件配置D.員工績(jī)效考核制度16、在數(shù)據(jù)庫系統(tǒng)中,用于保證事務(wù)原子性與一致性的關(guān)鍵技術(shù)是:A.索引技術(shù)
B.視圖機(jī)制
C.日志與恢復(fù)機(jī)制
D.觸發(fā)器17、在數(shù)據(jù)清洗過程中,處理缺失值的常用方法中,哪一種適用于數(shù)值型變量且可能引入偏差較???A.直接刪除含缺失值的記錄
B.用眾數(shù)填充
C.用中位數(shù)填充
D.用固定值如0填充18、下列關(guān)于數(shù)據(jù)標(biāo)準(zhǔn)化(Z-score標(biāo)準(zhǔn)化)的描述,正確的是:A.將數(shù)據(jù)縮放到[0,1]區(qū)間
B.僅適用于分類變量
C.變換后數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1
D.會(huì)改變數(shù)據(jù)的原始排序19、在數(shù)據(jù)交易場(chǎng)景中,以下哪項(xiàng)最能體現(xiàn)數(shù)據(jù)資產(chǎn)的確權(quán)原則?A.?dāng)?shù)據(jù)可被多次復(fù)制使用
B.?dāng)?shù)據(jù)使用需獲得合法授權(quán)
C.?dāng)?shù)據(jù)存儲(chǔ)于云端服務(wù)器
D.?dāng)?shù)據(jù)格式符合通用標(biāo)準(zhǔn)20、某數(shù)據(jù)平臺(tái)采用SHA-256算法對(duì)用戶密碼進(jìn)行加密存儲(chǔ),其主要目的是保障數(shù)據(jù)的:A.可用性
B.完整性
C.機(jī)密性
D.不可否認(rèn)性21、在關(guān)系型數(shù)據(jù)庫設(shè)計(jì)中,若要確保每一行數(shù)據(jù)的唯一性,最常使用的約束是?A.CHECK約束B.DEFAULT約束C.PRIMARYKEY約束D.FOREIGNKEY約束22、下列哪種算法屬于監(jiān)督學(xué)習(xí)的典型代表?A.K-means聚類B.主成分分析(PCA)C.決策樹D.DBSCAN23、在數(shù)據(jù)清洗過程中,處理缺失值的常見方法不包括?A.刪除含有缺失值的記錄B.使用均值/中位數(shù)填充C.使用模型預(yù)測(cè)缺失值D.增加新數(shù)據(jù)以覆蓋缺失24、下列關(guān)于SQL中JOIN操作的描述,正確的是?A.INNERJOIN返回左表所有行及右表匹配行B.LEFTJOIN僅返回兩表匹配的記錄C.RIGHTJOIN返回右表所有行及左表匹配行D.FULLJOIN等價(jià)于UNION操作25、在數(shù)據(jù)安全領(lǐng)域,對(duì)數(shù)據(jù)進(jìn)行加密存儲(chǔ)主要保障的是?A.可用性B.完整性C.機(jī)密性D.可追溯性26、在數(shù)據(jù)交易過程中,確保數(shù)據(jù)提供方與使用方身份真實(shí)可信的關(guān)鍵技術(shù)機(jī)制是:A.?dāng)?shù)據(jù)脫敏
B.訪問控制
C.?dāng)?shù)字簽名
D.?dāng)?shù)據(jù)加密27、下列哪種數(shù)據(jù)庫模型最適合處理具有復(fù)雜關(guān)聯(lián)關(guān)系的數(shù)據(jù)交易日志?A.層次模型
B.網(wǎng)狀模型
C.關(guān)系模型
D.圖數(shù)據(jù)庫模型28、在數(shù)據(jù)資產(chǎn)估值中,以下哪種方法側(cè)重于數(shù)據(jù)在未來業(yè)務(wù)場(chǎng)景中可能帶來的收益?A.成本法
B.市場(chǎng)法
C.收益法
D.重置法29、以下哪項(xiàng)是實(shí)現(xiàn)數(shù)據(jù)交易平臺(tái)中“可用不可見”核心理念的主要技術(shù)手段?A.區(qū)塊鏈
B.聯(lián)邦學(xué)習(xí)
C.?dāng)?shù)據(jù)備份
D.日志審計(jì)30、數(shù)據(jù)交易合規(guī)審查中,判斷數(shù)據(jù)是否屬于“個(gè)人信息”的關(guān)鍵標(biāo)準(zhǔn)是:A.?dāng)?shù)據(jù)是否經(jīng)過加密
B.?dāng)?shù)據(jù)是否由個(gè)人生成
C.是否可單獨(dú)或結(jié)合其他信息識(shí)別特定自然人
D.?dāng)?shù)據(jù)采集方式是否合法二、多項(xiàng)選擇題下列各題有多個(gè)正確答案,請(qǐng)選出所有正確選項(xiàng)(共15題)31、在數(shù)據(jù)治理框架中,以下哪些屬于核心組成部分?A.數(shù)據(jù)質(zhì)量管理B.數(shù)據(jù)安全管理C.數(shù)據(jù)存儲(chǔ)容量規(guī)劃D.元數(shù)據(jù)管理32、在大數(shù)據(jù)平臺(tái)架構(gòu)中,以下哪些技術(shù)常用于實(shí)現(xiàn)分布式數(shù)據(jù)存儲(chǔ)?A.HDFSB.KafkaC.HBaseD.Redis33、以下關(guān)于數(shù)據(jù)標(biāo)準(zhǔn)化的描述,哪些是正確的?A.有助于提升數(shù)據(jù)共享效率B.可降低系統(tǒng)集成成本C.能完全消除數(shù)據(jù)冗余D.需要統(tǒng)一數(shù)據(jù)命名與格式規(guī)范34、在數(shù)據(jù)交易平臺(tái)中,以下哪些措施可用于保障數(shù)據(jù)交易的安全性?A.數(shù)據(jù)脫敏處理B.區(qū)塊鏈存證技術(shù)C.用戶身份認(rèn)證機(jī)制D.數(shù)據(jù)價(jià)值動(dòng)態(tài)評(píng)估模型35、下列關(guān)于數(shù)據(jù)資產(chǎn)目錄的描述,哪些是正確的?A.提供組織內(nèi)數(shù)據(jù)資源的全景視圖B.支持?jǐn)?shù)據(jù)血緣追蹤C(jī).是數(shù)據(jù)庫物理存儲(chǔ)結(jié)構(gòu)的映射D.有助于提升數(shù)據(jù)發(fā)現(xiàn)與使用效率36、在數(shù)據(jù)治理框架中,以下哪些屬于核心組成部分?A.數(shù)據(jù)標(biāo)準(zhǔn)管理B.數(shù)據(jù)質(zhì)量管理C.數(shù)據(jù)安全管理D.數(shù)據(jù)存儲(chǔ)硬件選型37、下列關(guān)于數(shù)據(jù)資產(chǎn)化過程的描述,正確的是?A.數(shù)據(jù)確權(quán)是實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)化的前提B.數(shù)據(jù)資產(chǎn)可以像實(shí)物資產(chǎn)一樣直接折舊C.數(shù)據(jù)價(jià)值評(píng)估可采用成本法、收益法或市場(chǎng)法D.數(shù)據(jù)資產(chǎn)登記有助于提升交易透明度38、在數(shù)據(jù)交易過程中,以下哪些技術(shù)可用于保障隱私安全?A.聯(lián)邦學(xué)習(xí)B.數(shù)據(jù)脫敏C.區(qū)塊鏈D.數(shù)據(jù)鏡像備份39、數(shù)據(jù)交易平臺(tái)常見的運(yùn)營(yíng)模式包括?A.經(jīng)紀(jì)模式B.交易所模式C.點(diǎn)對(duì)點(diǎn)撮合模式D.全員免費(fèi)共享模式40、下列關(guān)于數(shù)據(jù)分類分級(jí)的說法,正確的是?A.分類依據(jù)數(shù)據(jù)的業(yè)務(wù)屬性,分級(jí)依據(jù)數(shù)據(jù)的重要性與敏感度B.所有數(shù)據(jù)都應(yīng)統(tǒng)一按照最高安全等級(jí)管理以確保安全C.分級(jí)結(jié)果應(yīng)動(dòng)態(tài)調(diào)整以適應(yīng)業(yè)務(wù)變化D.分類分級(jí)是數(shù)據(jù)權(quán)限管理的基礎(chǔ)41、在數(shù)據(jù)治理框架中,以下哪些屬于數(shù)據(jù)質(zhì)量管理的核心維度?A.數(shù)據(jù)完整性B.數(shù)據(jù)時(shí)效性C.數(shù)據(jù)可讀性D.數(shù)據(jù)一致性42、下列關(guān)于數(shù)據(jù)脫敏技術(shù)的描述,哪些是正確的?A.靜態(tài)脫敏適用于測(cè)試環(huán)境數(shù)據(jù)準(zhǔn)備B.動(dòng)態(tài)脫敏在數(shù)據(jù)訪問時(shí)實(shí)時(shí)處理C.脫敏后數(shù)據(jù)必須保持原始格式與業(yè)務(wù)可用性D.加密可完全替代脫敏功能43、在數(shù)據(jù)交易平臺(tái)中,數(shù)據(jù)資產(chǎn)定價(jià)常采用哪些方法?A.成本法B.市場(chǎng)法C.收益法D.隨機(jī)估價(jià)法44、下列哪些是數(shù)據(jù)共享過程中必須滿足的安全合規(guī)要求?A.明確數(shù)據(jù)使用目的與范圍B.獲得數(shù)據(jù)主體授權(quán)C.采用匿名化或去標(biāo)識(shí)化技術(shù)D.公開所有原始數(shù)據(jù)字段45、數(shù)據(jù)目錄在數(shù)據(jù)管理中的主要功能包括哪些?A.提供數(shù)據(jù)資產(chǎn)全景視圖B.支持?jǐn)?shù)據(jù)血緣追蹤C(jī).實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)清洗D.提升數(shù)據(jù)發(fā)現(xiàn)與檢索效率三、判斷題判斷下列說法是否正確(共10題)46、數(shù)據(jù)清洗過程中,缺失值的處理只能通過刪除含有缺失值的記錄來實(shí)現(xiàn)。A.正確B.錯(cuò)誤47、在關(guān)系型數(shù)據(jù)庫中,主鍵(PrimaryKey)允許存在空值(NULL)。A.正確B.錯(cuò)誤48、數(shù)據(jù)可視化時(shí),使用3D柱狀圖能更有效地展示數(shù)據(jù)趨勢(shì),優(yōu)于2D圖表。A.正確B.錯(cuò)誤49、數(shù)據(jù)脫敏的主要目的是在保留數(shù)據(jù)可用性的前提下,保護(hù)敏感信息不被泄露。A.正確B.錯(cuò)誤50、在數(shù)據(jù)倉(cāng)庫建模中,星型模型比雪花模型具有更高的數(shù)據(jù)冗余度。A.正確B.錯(cuò)誤51、數(shù)據(jù)資產(chǎn)在企業(yè)資產(chǎn)負(fù)債表中通常被列為無形資產(chǎn)。A.正確B.錯(cuò)誤52、在數(shù)據(jù)交易過程中,數(shù)據(jù)提供方必須確保所交易數(shù)據(jù)已獲得所有相關(guān)主體的授權(quán)同意。A.正確B.錯(cuò)誤53、數(shù)據(jù)清洗的主要目的是提升數(shù)據(jù)的存儲(chǔ)效率。A.正確B.錯(cuò)誤54、區(qū)塊鏈技術(shù)可用于增強(qiáng)數(shù)據(jù)交易的可追溯性和防篡改能力。A.正確B.錯(cuò)誤55、數(shù)據(jù)脫敏處理后的信息不再屬于個(gè)人信息范疇。A.正確B.錯(cuò)誤
參考答案及解析1.【參考答案】B【解析】數(shù)字簽名通過非對(duì)稱加密技術(shù)驗(yàn)證數(shù)據(jù)來源和完整性,確保交易雙方身份真實(shí)且信息未被篡改,是建立數(shù)據(jù)交易信任機(jī)制的關(guān)鍵技術(shù)。數(shù)據(jù)脫敏和加密主要用于保護(hù)數(shù)據(jù)內(nèi)容,訪問控制則管理權(quán)限,均不直接驗(yàn)證身份真實(shí)性。2.【參考答案】C【解析】可計(jì)量性指數(shù)據(jù)資產(chǎn)的價(jià)值能夠通過定量方法進(jìn)行評(píng)估,如成本法、收益法或市場(chǎng)法。選項(xiàng)C明確體現(xiàn)價(jià)值評(píng)估過程,是數(shù)據(jù)作為資產(chǎn)入表和交易定價(jià)的基礎(chǔ)。其他選項(xiàng)描述的是技術(shù)存儲(chǔ)、處理或共享特性,不直接關(guān)聯(lián)價(jià)值計(jì)量。3.【參考答案】D【解析】ABAC模型結(jié)合用戶屬性、資源屬性和環(huán)境條件進(jìn)行動(dòng)態(tài)授權(quán),適用于數(shù)據(jù)交易場(chǎng)景中復(fù)雜、多變的訪問需求。RBAC靈活性不足,MAC過于嚴(yán)格,DAC安全性弱。ABAC支持細(xì)粒度控制,符合數(shù)據(jù)交易對(duì)安全與靈活性的雙重要求。4.【參考答案】B【解析】聯(lián)邦學(xué)習(xí)允許多方在不共享原始數(shù)據(jù)的前提下協(xié)同訓(xùn)練模型,數(shù)據(jù)始終保留在本地,僅交換加密的模型參數(shù),實(shí)現(xiàn)“數(shù)據(jù)不動(dòng)模型動(dòng)”,滿足隱私保護(hù)與價(jià)值挖掘的雙重需求。區(qū)塊鏈用于存證,API和鏡像仍涉及數(shù)據(jù)傳輸,難以保障“不可見”。5.【參考答案】B【解析】一致性指數(shù)據(jù)在不同系統(tǒng)或來源中邏輯統(tǒng)一、無矛盾。選項(xiàng)B直接體現(xiàn)多源數(shù)據(jù)對(duì)同一實(shí)體描述的匹配程度。A反映完整性,C反映時(shí)效性,D反映規(guī)范性。一致性是數(shù)據(jù)融合和交易可信的基礎(chǔ)前提。6.【參考答案】C【解析】檢查約束(CHECK)用于限制字段的取值范圍,確保插入或更新的數(shù)據(jù)滿足設(shè)定的邏輯條件。例如,規(guī)定年齡字段值在18至65之間,即可使用CHECK約束。主鍵約束用于唯一標(biāo)識(shí)記錄,外鍵用于維護(hù)表間引用完整性,唯一約束確保字段值不重復(fù),但均不直接限制數(shù)值區(qū)間。因此,實(shí)現(xiàn)取值范圍控制應(yīng)選用檢查約束。7.【參考答案】C【解析】異常值處理需結(jié)合業(yè)務(wù)背景。如“-1”可能代表“未知”或“未填寫”,直接刪除或替換可能導(dǎo)致信息偏差。應(yīng)先識(shí)別異常值成因,判斷其是否為缺失值的替代標(biāo)記,再?zèng)Q定采用填補(bǔ)、刪除或單獨(dú)編碼等方式??茖W(xué)的數(shù)據(jù)清洗強(qiáng)調(diào)分析先行,避免盲目操作,確保數(shù)據(jù)質(zhì)量與分析結(jié)果的可靠性。8.【參考答案】D【解析】字典(dict)是Python中基于哈希表實(shí)現(xiàn)的無序鍵值對(duì)集合,支持O(1)平均時(shí)間復(fù)雜度的鍵查找、插入和刪除操作,適用于高效存取鍵值數(shù)據(jù)。列表和元組為順序結(jié)構(gòu),查找需遍歷,時(shí)間復(fù)雜度為O(n);集合僅存儲(chǔ)唯一元素,不支持鍵值映射。因此,實(shí)現(xiàn)快速鍵值查找應(yīng)選用字典。9.【參考答案】C【解析】折線圖擅長(zhǎng)展示數(shù)據(jù)隨時(shí)間變化的趨勢(shì),通過連接數(shù)據(jù)點(diǎn)的線段直觀反映增減走勢(shì),適用于連續(xù)時(shí)間序列數(shù)據(jù)。柱狀圖也可表示每月銷售額,但更強(qiáng)調(diào)比較而非趨勢(shì);餅圖用于展示比例分布,不適合時(shí)間序列;散點(diǎn)圖用于觀察變量間相關(guān)性。因此,表現(xiàn)趨勢(shì)變化首選折線圖。10.【參考答案】C【解析】數(shù)據(jù)脫敏旨在保護(hù)敏感信息,通過掩碼、替換、截?cái)嗟确绞诫[藏真實(shí)數(shù)據(jù),而非僅依賴加密。加密可逆,脫敏通常不可逆,且更強(qiáng)調(diào)數(shù)據(jù)可用性與格式一致性。脫敏廣泛應(yīng)用于非生產(chǎn)環(huán)境,以保障數(shù)據(jù)安全同時(shí)支持業(yè)務(wù)測(cè)試。因此,“加密是唯一方式”的說法錯(cuò)誤。11.【參考答案】C【解析】數(shù)據(jù)確權(quán)是數(shù)據(jù)交易的前提,核心在于明確數(shù)據(jù)的歸屬與使用權(quán)。數(shù)據(jù)來源的合法性以及完整的授權(quán)鏈條能夠證明數(shù)據(jù)采集、使用和交易的合規(guī)性,是確權(quán)的關(guān)鍵依據(jù)。存儲(chǔ)位置、采集時(shí)間或格式標(biāo)準(zhǔn)化雖影響數(shù)據(jù)管理,但不構(gòu)成確權(quán)的根本依據(jù)。因此,C選項(xiàng)正確。12.【參考答案】C【解析】第三范式要求關(guān)系模式滿足第二范式(已消除部分依賴),且不存在非主屬性對(duì)候選鍵的傳遞函數(shù)依賴。例如,若A→B,B→C,則A→C為傳遞依賴,需拆分以符合3NF。A為第一范式,B為第二范式,D描述不準(zhǔn)確。因此,C為正確答案。13.【參考答案】C【解析】對(duì)稱加密(如AES)通過加密算法和密鑰保障數(shù)據(jù)在傳輸中不被竊取,確保機(jī)密性。數(shù)字簽名用于身份認(rèn)證與完整性驗(yàn)證,哈希算法用于生成數(shù)據(jù)指紋,數(shù)據(jù)脫敏用于靜態(tài)數(shù)據(jù)保護(hù)。傳輸過程中的加密主要依賴加密技術(shù)。因此,C正確。14.【參考答案】C【解析】成本法基于數(shù)據(jù)生命周期中的投入成本進(jìn)行定價(jià),包括采集、清洗、存儲(chǔ)、安全維護(hù)等直接與間接支出,適用于缺乏市場(chǎng)參考的初期定價(jià)。A、D分別對(duì)應(yīng)市場(chǎng)法與收益法,B屬于參考信息而非核心依據(jù)。因此,C為正確選項(xiàng)。15.【參考答案】B【解析】數(shù)據(jù)治理旨在提升數(shù)據(jù)質(zhì)量、安全與可用性,其核心包括數(shù)據(jù)標(biāo)準(zhǔn)制定與元數(shù)據(jù)管理,用以統(tǒng)一數(shù)據(jù)定義、來源和使用規(guī)則。可視化工具為應(yīng)用層技術(shù),硬件配置屬基礎(chǔ)設(shè)施,績(jī)效考核非治理內(nèi)容。因此,B是治理框架的基礎(chǔ)環(huán)節(jié)。16.【參考答案】C【解析】事務(wù)的ACID特性中,原子性指事務(wù)的所有操作要么全部執(zhí)行,要么全部不執(zhí)行;一致性指事務(wù)執(zhí)行前后數(shù)據(jù)庫狀態(tài)保持合法。日志與恢復(fù)機(jī)制通過記錄事務(wù)操作日志,在系統(tǒng)故障時(shí)實(shí)現(xiàn)事務(wù)回滾或重做,確保未完成事務(wù)不破壞數(shù)據(jù)一致性,已完成事務(wù)不丟失結(jié)果。索引用于提升查詢效率,視圖用于數(shù)據(jù)抽象,觸發(fā)器用于自動(dòng)響應(yīng)數(shù)據(jù)變更,均不直接保障原子性與一致性。因此,正確答案為C。17.【參考答案】C【解析】缺失值處理需根據(jù)數(shù)據(jù)類型和分布選擇策略。數(shù)值型變量中,中位數(shù)對(duì)異常值不敏感,能較好反映數(shù)據(jù)集中趨勢(shì),填充后對(duì)整體分布影響較小。眾數(shù)適用于分類變量;用0填充可能嚴(yán)重扭曲數(shù)據(jù)分布;直接刪除數(shù)據(jù)可能導(dǎo)致樣本量減少和選擇偏差。因此,中位數(shù)填充在保持?jǐn)?shù)據(jù)代表性方面表現(xiàn)較優(yōu),是合理選擇,故答案為C。18.【參考答案】C【解析】Z-score標(biāo)準(zhǔn)化公式為(x-μ)/σ,其中μ為均值,σ為標(biāo)準(zhǔn)差。經(jīng)此變換后,數(shù)據(jù)服從均值為0、標(biāo)準(zhǔn)差為1的分布,適用于消除量綱影響,常用于聚類、回歸等算法。而[0,1]縮放是Min-Max標(biāo)準(zhǔn)化的特點(diǎn);分類變量無需標(biāo)準(zhǔn)化;標(biāo)準(zhǔn)化是線性變換,不改變數(shù)據(jù)排序。因此,正確描述為C。19.【參考答案】B【解析】數(shù)據(jù)確權(quán)是指明確數(shù)據(jù)的歸屬權(quán)、使用權(quán)和收益權(quán)。在數(shù)據(jù)交易中,合法授權(quán)是體現(xiàn)權(quán)利歸屬的關(guān)鍵,只有經(jīng)授權(quán)的使用才符合確權(quán)要求。數(shù)據(jù)可復(fù)制性是其特性,但不體現(xiàn)權(quán)屬;存儲(chǔ)位置和格式標(biāo)準(zhǔn)化涉及技術(shù)實(shí)現(xiàn),與權(quán)屬無關(guān)。因此,通過授權(quán)機(jī)制保障使用合法性,是確權(quán)的核心體現(xiàn),答案為B。20.【參考答案】B【解析】SHA-256是一種哈希算法,用于生成數(shù)據(jù)的唯一指紋。在密碼存儲(chǔ)中,系統(tǒng)存儲(chǔ)密碼的哈希值而非明文,即使數(shù)據(jù)庫泄露,攻擊者難以逆推原始密碼。這主要防止密碼被篡改或冒用,確保密碼數(shù)據(jù)未被非法修改,體現(xiàn)完整性保護(hù)。機(jī)密性通常通過加密算法(如AES)實(shí)現(xiàn);可用性指系統(tǒng)可訪問;不可否認(rèn)性依賴數(shù)字簽名。因此,正確答案為B。21.【參考答案】C【解析】PRIMARYKEY(主鍵)約束用于唯一標(biāo)識(shí)表中的每一行數(shù)據(jù),確保其值非空且唯一。CHECK用于限制列的取值范圍,DEFAULT設(shè)置默認(rèn)值,F(xiàn)OREIGNKEY用于維護(hù)表間引用完整性。因此,保證行唯一性的最核心機(jī)制是PRIMARYKEY約束,廣泛應(yīng)用于數(shù)據(jù)庫規(guī)范化設(shè)計(jì)中。22.【參考答案】C【解析】監(jiān)督學(xué)習(xí)通過帶標(biāo)簽的數(shù)據(jù)訓(xùn)練模型,用于分類或回歸任務(wù)。決策樹可在分類問題中使用標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練,屬于監(jiān)督學(xué)習(xí)。K-means、DBSCAN為無監(jiān)督聚類算法,PCA是無監(jiān)督的降維方法。因此,僅有決策樹依賴輸入輸出對(duì)進(jìn)行學(xué)習(xí),符合監(jiān)督學(xué)習(xí)定義。23.【參考答案】D【解析】處理缺失值的標(biāo)準(zhǔn)方法包括刪除記錄、統(tǒng)計(jì)值填充(如均值)、插值法或模型預(yù)測(cè)(如回歸、KNN)。而“增加新數(shù)據(jù)”不屬于清洗范疇,既不可控也不科學(xué),可能引入偏差。數(shù)據(jù)清洗強(qiáng)調(diào)在現(xiàn)有數(shù)據(jù)基礎(chǔ)上修正問題,而非外部補(bǔ)充,故D項(xiàng)不符合常規(guī)操作流程。24.【參考答案】C【解析】RIGHTJOIN返回右表全部記錄,并匹配左表對(duì)應(yīng)數(shù)據(jù),無匹配則補(bǔ)NULL。INNERJOIN只返回兩表匹配行;LEFTJOIN保留左表全部記錄;FULLJOIN返回兩表所有行,匹配則合并,不匹配補(bǔ)NULL,與UNION不同(后者是行堆疊,不區(qū)分來源關(guān)聯(lián))。因此C項(xiàng)描述準(zhǔn)確。25.【參考答案】C【解析】加密技術(shù)通過將明文轉(zhuǎn)換為密文,防止未授權(quán)訪問,核心目標(biāo)是保障數(shù)據(jù)的機(jī)密性。可用性指系統(tǒng)正常運(yùn)行、數(shù)據(jù)可訪問;完整性確保數(shù)據(jù)未被篡改;可追溯性涉及操作日志追蹤。加密不直接影響這些屬性,其首要作用是保護(hù)敏感信息不被泄露,屬于信息安全三要素之一。26.【參考答案】C【解析】數(shù)字簽名通過非對(duì)稱加密技術(shù)驗(yàn)證數(shù)據(jù)來源和發(fā)送者身份,確保信息完整性與不可否認(rèn)性,廣泛應(yīng)用于數(shù)據(jù)交易的身份認(rèn)證環(huán)節(jié)。數(shù)據(jù)脫敏用于保護(hù)敏感信息,訪問控制管理權(quán)限,數(shù)據(jù)加密保障傳輸存儲(chǔ)安全,但身份驗(yàn)證的核心在于數(shù)字簽名技術(shù)。27.【參考答案】D【解析】圖數(shù)據(jù)庫模型以節(jié)點(diǎn)和邊表示實(shí)體及其關(guān)系,擅長(zhǎng)處理高度連接的數(shù)據(jù),如交易鏈路、用戶行為路徑等。關(guān)系模型雖通用,但在多層關(guān)聯(lián)查詢時(shí)性能下降。圖數(shù)據(jù)庫在社交網(wǎng)絡(luò)、金融風(fēng)控等領(lǐng)域已廣泛應(yīng)用,更適合數(shù)據(jù)交易所中復(fù)雜關(guān)聯(lián)分析需求。28.【參考答案】C【解析】收益法通過預(yù)測(cè)數(shù)據(jù)資產(chǎn)未來產(chǎn)生的現(xiàn)金流并折現(xiàn)計(jì)算其當(dāng)前價(jià)值,體現(xiàn)數(shù)據(jù)的潛在商業(yè)價(jià)值。成本法基于獲取成本,市場(chǎng)法參考同類交易價(jià)格,均未充分反映數(shù)據(jù)的增值潛力。收益法更適用于高成長(zhǎng)性數(shù)據(jù)產(chǎn)品的估值場(chǎng)景。29.【參考答案】B【解析】聯(lián)邦學(xué)習(xí)允許多方在不共享原始數(shù)據(jù)的前提下協(xié)同建模,保障數(shù)據(jù)隱私的同時(shí)釋放數(shù)據(jù)價(jià)值,是“可用不可見”的關(guān)鍵技術(shù)路徑。區(qū)塊鏈用于存證追溯,數(shù)據(jù)備份保障可用性,日志審計(jì)支持合規(guī)監(jiān)控,但均不直接實(shí)現(xiàn)隱私計(jì)算功能。30.【參考答案】C【解析】根據(jù)《個(gè)人信息保護(hù)法》,個(gè)人信息的核心定義是“能夠單獨(dú)或與其他信息結(jié)合識(shí)別特定自然人的各種信息”,如姓名、身份證號(hào)、生物特征等。是否由個(gè)人生成或采集方式合法影響處理合規(guī)性,但不決定信息性質(zhì)。識(shí)別性是判定基準(zhǔn)。31.【參考答案】A、B、D【解析】數(shù)據(jù)治理的核心包括數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全管理和元數(shù)據(jù)管理。數(shù)據(jù)質(zhì)量確保數(shù)據(jù)的準(zhǔn)確性與一致性;數(shù)據(jù)安全管理保障數(shù)據(jù)的訪問控制與合規(guī)使用;元數(shù)據(jù)管理提供數(shù)據(jù)的上下文信息,支持?jǐn)?shù)據(jù)理解與追蹤。存儲(chǔ)容量規(guī)劃屬于基礎(chǔ)設(shè)施管理范疇,非治理核心內(nèi)容。32.【參考答案】A、C【解析】HDFS是Hadoop分布式文件系統(tǒng),專為大規(guī)模數(shù)據(jù)存儲(chǔ)設(shè)計(jì);HBase是構(gòu)建在HDFS之上的分布式列式數(shù)據(jù)庫,適用于海量結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)。Kafka是消息隊(duì)列系統(tǒng),用于流數(shù)據(jù)傳輸;Redis是內(nèi)存數(shù)據(jù)庫,主要用于緩存。兩者不承擔(dān)主要分布式存儲(chǔ)職能。33.【參考答案】A、B、D【解析】數(shù)據(jù)標(biāo)準(zhǔn)化通過統(tǒng)一命名、格式和編碼規(guī)則,促進(jìn)系統(tǒng)間數(shù)據(jù)互通,提升共享效率并降低集成復(fù)雜度。但無法完全消除冗余,因業(yè)務(wù)需求或備份機(jī)制仍可能導(dǎo)致重復(fù)數(shù)據(jù)存在。34.【參考答案】A、B、C【解析】數(shù)據(jù)脫敏保護(hù)敏感信息,防止泄露;區(qū)塊鏈確保交易記錄不可篡改;身份認(rèn)證控制訪問權(quán)限。這三項(xiàng)直接提升安全性。數(shù)據(jù)價(jià)值評(píng)估用于定價(jià),不涉及安全防護(hù)機(jī)制。35.【參考答案】A、B、D【解析】數(shù)據(jù)資產(chǎn)目錄整合組織內(nèi)數(shù)據(jù)資源信息,提供可檢索的元數(shù)據(jù)視圖,支持?jǐn)?shù)據(jù)溯源與發(fā)現(xiàn)。它基于邏輯結(jié)構(gòu)而非物理存儲(chǔ),是對(duì)數(shù)據(jù)資產(chǎn)的邏輯組織與描述,非數(shù)據(jù)庫物理映射。36.【參考答案】A、B、C【解析】數(shù)據(jù)治理的核心在于確保數(shù)據(jù)的可用性、一致性和安全性。數(shù)據(jù)標(biāo)準(zhǔn)管理統(tǒng)一數(shù)據(jù)定義,數(shù)據(jù)質(zhì)量管理提升數(shù)據(jù)準(zhǔn)確性與完整性,數(shù)據(jù)安全管理保障數(shù)據(jù)訪問與使用的合規(guī)性。而數(shù)據(jù)存儲(chǔ)硬件選型屬于基礎(chǔ)設(shè)施層面,不直接構(gòu)成治理框架的核心內(nèi)容,故D不選。37.【參考答案】A、C、D【解析】數(shù)據(jù)資產(chǎn)化需明確權(quán)屬(確權(quán)),通過評(píng)估確定價(jià)值,并通過登記實(shí)現(xiàn)規(guī)范化管理。數(shù)據(jù)不具備實(shí)物形態(tài),不能直接套用傳統(tǒng)折舊方式,故B錯(cuò)誤。成本法、收益法和市場(chǎng)法是常見的數(shù)據(jù)價(jià)值評(píng)估方法,登記制度有助于交易合規(guī)與信任建立。38.【參考答案】A、B、C【解析】聯(lián)邦學(xué)習(xí)實(shí)現(xiàn)“數(shù)據(jù)不動(dòng)模型動(dòng)”,保護(hù)原始數(shù)據(jù);數(shù)據(jù)脫敏通過泛化、加密等方式隱藏敏感信息;區(qū)塊鏈可確保交易記錄不可篡改,增強(qiáng)可信性。數(shù)據(jù)鏡像備份主要用于容災(zāi)恢復(fù),不直接涉及隱私保護(hù)機(jī)制,故D不選。39.【參考答案】A、B、C【解析】經(jīng)紀(jì)模式由平臺(tái)代理撮合交易,交易所模式強(qiáng)調(diào)標(biāo)準(zhǔn)化與監(jiān)管合規(guī),點(diǎn)對(duì)點(diǎn)模式通過平臺(tái)直連供需方。而全員免費(fèi)共享不符合市場(chǎng)化運(yùn)營(yíng)邏輯,易導(dǎo)致數(shù)據(jù)濫用與激勵(lì)缺失,現(xiàn)實(shí)中難以持續(xù),故D不選。40.【參考答案】A、C、D【解析】數(shù)據(jù)分類體現(xiàn)業(yè)務(wù)維度(如客戶、財(cái)務(wù)),分級(jí)則反映敏感性與影響程度。統(tǒng)一按最高級(jí)管理成本過高,應(yīng)實(shí)施差異化管控。分級(jí)需隨業(yè)務(wù)發(fā)展動(dòng)態(tài)更新,且為訪問控制、權(quán)限分配提供依據(jù),故B錯(cuò)誤,其余正確。41.【參考答案】A、B、D【解析】數(shù)據(jù)質(zhì)量管理核心維度包括完整性(數(shù)據(jù)無缺失)、時(shí)效性(數(shù)據(jù)及時(shí)更新)和一致性(跨系統(tǒng)數(shù)據(jù)統(tǒng)一)??勺x性雖重要,但屬于數(shù)據(jù)呈現(xiàn)層面,非質(zhì)量評(píng)估核心維度,故不選C。42.【參考答案】A、B、C【解析】靜態(tài)脫敏用于非生產(chǎn)環(huán)境,動(dòng)態(tài)脫敏保障實(shí)時(shí)訪問安全;脫敏需保留數(shù)據(jù)格式以支持業(yè)務(wù)測(cè)試。加密保護(hù)傳輸存儲(chǔ),但無法實(shí)現(xiàn)使用中的隱私屏蔽,不能替代脫敏,故D錯(cuò)誤。43.【參考答案】A、B、C【解析】成本法基于采集處理成本,市場(chǎng)法參考同類交易價(jià)格,收益法預(yù)測(cè)未來收益折現(xiàn),均為常用定價(jià)模型。隨機(jī)估價(jià)無科學(xué)依據(jù),不屬于正式方法,故D錯(cuò)誤。44.【參考答案】A、B、C【解析】數(shù)據(jù)共享需遵循最小必要原則,明確用途、獲取授權(quán),并通過技術(shù)手段降低泄露風(fēng)險(xiǎn)。公開全部原始字段違反隱私保護(hù)要求,故D錯(cuò)誤。45.【參考答案】A、B、D【解析】數(shù)據(jù)目錄用于記錄元數(shù)據(jù),實(shí)現(xiàn)資產(chǎn)可視化、血緣分析和高效檢索。數(shù)據(jù)清洗屬于ETL流程,非目錄功能,故C錯(cuò)誤。46.【參考答案】B【解析】錯(cuò)誤。數(shù)據(jù)清洗中處理缺失值的方法多樣,除刪除記錄外,還可采用均值/中位數(shù)填充、插值法、模型預(yù)測(cè)填充或標(biāo)記為特殊值等方法。選擇何種方式需結(jié)合數(shù)據(jù)分布、缺失機(jī)制及分析目標(biāo)綜合判斷,直接刪除可能導(dǎo)致信息丟失,影響分析結(jié)果的代表性。47.【參考答案】B【解析】錯(cuò)誤。主鍵用于唯一標(biāo)識(shí)表中每一條記錄,其核心特性包括唯一性和非空性。根據(jù)SQL標(biāo)準(zhǔn),主鍵列不允許出現(xiàn)NULL值,否則將破壞數(shù)據(jù)完整性與實(shí)體識(shí)別的準(zhǔn)確性,因此在定義主鍵時(shí)系統(tǒng)會(huì)自動(dòng)強(qiáng)制約束非空。48.【參考答案】B【解析】錯(cuò)誤。3D圖表雖具視覺沖擊力,但會(huì)因透視變形導(dǎo)致數(shù)據(jù)比例失真,影響讀數(shù)準(zhǔn)確性。2D圖表更清晰、直觀,利于精確比較與趨勢(shì)識(shí)別。專業(yè)數(shù)據(jù)可視化強(qiáng)調(diào)簡(jiǎn)潔、準(zhǔn)確,通常推薦使用2D形式,避免誤導(dǎo)性表達(dá)。49.【參考答案】A【解析】正確。數(shù)據(jù)脫敏通過加密、掩碼、泛化等方式對(duì)敏感字段進(jìn)行處理,使數(shù)據(jù)在測(cè)試、分析或共享過程中無法識(shí)別真實(shí)信息,從而防范隱私泄露風(fēng)險(xiǎn),同時(shí)確保數(shù)據(jù)在業(yè)務(wù)邏輯和統(tǒng)計(jì)分析中的使用價(jià)值不受顯著影響。50.【參考答案】A【解析】正確。星型模型將維度表非規(guī)范化,導(dǎo)致維度數(shù)據(jù)存在重復(fù);而雪花模型對(duì)維度表進(jìn)一步規(guī)范化,減少冗余。盡管星型模型冗余較高,但結(jié)構(gòu)簡(jiǎn)單、查詢效率高,適合多數(shù)OLAP場(chǎng)景,是數(shù)據(jù)倉(cāng)庫常用建模方式之一。51.【參考答案】A【解析】根據(jù)會(huì)計(jì)準(zhǔn)則,數(shù)據(jù)資產(chǎn)若滿足可辨認(rèn)性、由企業(yè)控制且能帶來未來經(jīng)濟(jì)利益的條件,可確認(rèn)為無形資產(chǎn)。隨著數(shù)據(jù)要素市場(chǎng)化推進(jìn),企業(yè)在合規(guī)前提下采集、處理并具有商業(yè)價(jià)值的數(shù)據(jù)資源,經(jīng)評(píng)估后可納入無形資產(chǎn)核算。近年來,部分上市公司已在年報(bào)中披露數(shù)據(jù)類資產(chǎn)的確認(rèn)情況,體現(xiàn)了會(huì)計(jì)實(shí)踐的演進(jìn)。52.【參考答案】A【解析】依據(jù)《個(gè)人信息保護(hù)法》及數(shù)據(jù)要素流通相關(guān)規(guī)定,涉及個(gè)人信息或敏感數(shù)據(jù)的交易,必須取得數(shù)據(jù)主體的明確授權(quán)。即便為非個(gè)人信息,若數(shù)據(jù)源于用戶行為或第三方系統(tǒng),也需確保原始采集過程合法合規(guī)。數(shù)據(jù)交易所通常要求提供授權(quán)鏈證明,以保障交易合法性與風(fēng)險(xiǎn)可控。53.【參考答案】B【解析】數(shù)據(jù)清洗的核心目標(biāo)是提高數(shù)據(jù)質(zhì)量,包括處理缺失值、糾正錯(cuò)誤、去除重復(fù)記錄、統(tǒng)一格式等,為后續(xù)分析和交易提供準(zhǔn)確、一致的數(shù)據(jù)基礎(chǔ)。雖然清洗后數(shù)據(jù)可能更緊湊,但提升存儲(chǔ)效率并非主要目的,而是數(shù)據(jù)質(zhì)量管理的關(guān)鍵環(huán)節(jié)。54.【參考答案】A【解析】區(qū)塊鏈通過分布式賬本和哈希鏈結(jié)構(gòu),能夠記錄數(shù)據(jù)交易的全過程,確保每一筆操作不可篡改且可追溯。在數(shù)據(jù)交易平臺(tái)中,利用區(qū)塊鏈可驗(yàn)證數(shù)據(jù)來源、交易時(shí)間與權(quán)屬變更,增強(qiáng)交易透明度與信任,已被多個(gè)數(shù)據(jù)交易所試點(diǎn)應(yīng)用。55.【參考答案】B【解析】數(shù)據(jù)脫敏是否使信息脫離“個(gè)人信息”范疇,取決于是否實(shí)現(xiàn)“不可識(shí)別”且“不可復(fù)原”。若脫敏不徹底,仍可通過關(guān)聯(lián)分析識(shí)別特定自然人,則仍屬個(gè)人信息,需受相關(guān)法律約束。只有經(jīng)過匿名化處理的數(shù)據(jù),才不再適用個(gè)人信息保護(hù)規(guī)則。
2025江蘇省數(shù)據(jù)交易所有限公司夏季招聘筆試歷年典型考點(diǎn)題庫附帶答案詳解(第2套)一、單項(xiàng)選擇題下列各題只有一個(gè)正確答案,請(qǐng)選出最恰當(dāng)?shù)倪x項(xiàng)(共30題)1、在數(shù)據(jù)治理框架中,下列哪項(xiàng)是確保數(shù)據(jù)質(zhì)量的核心環(huán)節(jié)?A.?dāng)?shù)據(jù)存儲(chǔ)優(yōu)化
B.元數(shù)據(jù)管理
C.?dāng)?shù)據(jù)清洗與標(biāo)準(zhǔn)化
D.?dāng)?shù)據(jù)可視化設(shè)計(jì)2、在關(guān)系型數(shù)據(jù)庫中,實(shí)現(xiàn)兩個(gè)表之間引用完整性的約束機(jī)制是?A.主鍵約束
B.唯一約束
C.外鍵約束
D.檢查約束3、下列哪項(xiàng)技術(shù)最適用于實(shí)現(xiàn)大規(guī)模數(shù)據(jù)的分布式批處理?A.ApacheKafka
B.ApacheSpark
C.Redis
D.Nginx4、在數(shù)據(jù)脫敏過程中,下列哪種方法適用于對(duì)身份證號(hào)碼進(jìn)行安全處理?A.哈希加密
B.?dāng)?shù)據(jù)掩碼
C.?dāng)?shù)據(jù)交換
D.隨機(jī)加噪5、以下關(guān)于數(shù)據(jù)倉(cāng)庫與數(shù)據(jù)庫的描述,正確的是?A.?dāng)?shù)據(jù)庫主要用于支持聯(lián)機(jī)分析處理(OLAP)
B.?dāng)?shù)據(jù)倉(cāng)庫的數(shù)據(jù)通常來自多個(gè)異構(gòu)系統(tǒng)
C.?dāng)?shù)據(jù)庫適合存儲(chǔ)歷史數(shù)據(jù)并支持復(fù)雜查詢
D.?dāng)?shù)據(jù)倉(cāng)庫強(qiáng)調(diào)高并發(fā)事務(wù)處理能力6、在關(guān)系型數(shù)據(jù)庫設(shè)計(jì)中,若要確保數(shù)據(jù)表中某一列的值不重復(fù)且不能為空,應(yīng)使用下列哪種約束?A.UNIQUEB.PRIMARYKEYC.FOREIGNKEYD.CHECK7、在Python中,以下哪個(gè)方法可以用于從列表中刪除并返回最后一個(gè)元素?A.remove()B.pop()C.del()D.clear()8、在Excel中,若要實(shí)現(xiàn)根據(jù)多個(gè)條件進(jìn)行數(shù)據(jù)求和,應(yīng)優(yōu)先使用下列哪個(gè)函數(shù)?A.SUM()B.SUMIF()C.SUMIFS()D.COUNTIFS()9、下列哪項(xiàng)是數(shù)據(jù)清洗過程中常見的操作?A.數(shù)據(jù)可視化B.數(shù)據(jù)歸一化C.刪除重復(fù)記錄D.構(gòu)建回歸模型10、在TCP/IP協(xié)議棧中,負(fù)責(zé)將數(shù)據(jù)封裝成數(shù)據(jù)包并進(jìn)行路由選擇的是哪一層?A.應(yīng)用層B.傳輸層C.網(wǎng)絡(luò)層D.數(shù)據(jù)鏈路層11、在數(shù)據(jù)庫系統(tǒng)中,用于保證事務(wù)原子性、一致性、隔離性和持久性的機(jī)制統(tǒng)稱為?A.?dāng)?shù)據(jù)冗余控制
B.事務(wù)日志管理
C.ACID特性保障
D.索引優(yōu)化策略12、某數(shù)據(jù)交易平臺(tái)需對(duì)用戶訪問行為進(jìn)行實(shí)時(shí)分析,以下哪種技術(shù)最適合處理高并發(fā)、低延遲的流式數(shù)據(jù)?A.HadoopMapReduce
B.MySQL觸發(fā)器
C.ApacheKafka+Flink
D.Oracle存儲(chǔ)過程13、在數(shù)據(jù)資產(chǎn)定價(jià)模型中,下列哪項(xiàng)不屬于常見的定價(jià)方法?A.成本法
B.市場(chǎng)法
C.收益法
D.熵值法14、下列關(guān)于數(shù)據(jù)脫敏的描述,正確的是?A.脫敏后的數(shù)據(jù)必須保持原始格式和統(tǒng)計(jì)特征
B.脫敏主要用于提升數(shù)據(jù)查詢效率
C.脫敏可完全替代數(shù)據(jù)加密
D.脫敏后的數(shù)據(jù)仍可用于原始身份識(shí)別15、在數(shù)據(jù)治理框架中,元數(shù)據(jù)管理的主要作用是?A.提升數(shù)據(jù)庫存儲(chǔ)容量
B.記錄數(shù)據(jù)的來源、結(jié)構(gòu)與用途
C.自動(dòng)清洗異常數(shù)據(jù)
D.限制用戶訪問權(quán)限16、在大數(shù)據(jù)處理架構(gòu)中,以下哪種組件主要用于分布式存儲(chǔ)海量結(jié)構(gòu)化數(shù)據(jù),具有高可靠性和高可擴(kuò)展性特點(diǎn)?A.Kafka
B.HBase
C.Flume
D.ZooKeeper17、在數(shù)據(jù)清洗過程中,處理缺失值的常見方法不包括以下哪項(xiàng)?A.刪除含有缺失值的記錄
B.使用均值或中位數(shù)填補(bǔ)
C.使用模型預(yù)測(cè)缺失值
D.將缺失值統(tǒng)一替換為最大值18、下列關(guān)于數(shù)據(jù)標(biāo)準(zhǔn)化的描述,正確的是哪一項(xiàng)?A.標(biāo)準(zhǔn)化會(huì)改變數(shù)據(jù)的原始排序
B.標(biāo)準(zhǔn)化后的數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1
C.標(biāo)準(zhǔn)化只能用于分類變量
D.標(biāo)準(zhǔn)化會(huì)放大異常值的影響19、在SQL查詢中,以下哪個(gè)子句用于對(duì)分組后的數(shù)據(jù)進(jìn)行條件篩選?A.WHERE
B.ORDERBY
C.HAVING
D.LIMIT20、下列哪項(xiàng)指標(biāo)最適用于評(píng)估分類模型在不平衡數(shù)據(jù)集上的性能?A.準(zhǔn)確率(Accuracy)
B.F1分?jǐn)?shù)(F1-Score)
C.均方誤差(MSE)
D.R221、在關(guān)系型數(shù)據(jù)庫設(shè)計(jì)中,符合第三范式(3NF)的關(guān)系模式必須滿足的條件是:
A.不存在非主屬性對(duì)碼的部分函數(shù)依賴
B.不存在非主屬性對(duì)碼的傳遞函數(shù)依賴
C.消除了主屬性對(duì)碼的部分和傳遞函數(shù)依賴
D.不存在非主屬性對(duì)碼的部分函數(shù)依賴和傳遞函數(shù)依賴22、在Python中,以下關(guān)于深拷貝與淺拷貝的說法正確的是:
A.淺拷貝會(huì)遞歸復(fù)制對(duì)象中的所有嵌套對(duì)象
B.使用copy.copy()可實(shí)現(xiàn)深拷貝
C.深拷貝創(chuàng)建新對(duì)象,且嵌套對(duì)象也均為新對(duì)象
D.淺拷貝修改嵌套對(duì)象時(shí),原對(duì)象不會(huì)受到影響23、下列關(guān)于TCP與UDP協(xié)議的描述,正確的是:
A.UDP提供可靠傳輸,通過確認(rèn)機(jī)制保障數(shù)據(jù)不丟失
B.TCP具有連接建立過程,采用三次握手機(jī)制
C.UDP常用于對(duì)傳輸延遲敏感但可容忍丟包的應(yīng)用,如視頻會(huì)議
D.TCP不提供流量控制,依賴上層協(xié)議處理擁塞24、在數(shù)據(jù)清洗過程中,處理缺失值的合理方法不包括:
A.使用均值、中位數(shù)或眾數(shù)填充數(shù)值型變量
B.直接刪除含有缺失值的所有記錄
C.使用回歸模型預(yù)測(cè)缺失值并填充
D.將缺失值作為新類別用于分類變量25、在Excel中,若要實(shí)現(xiàn)根據(jù)多個(gè)條件進(jìn)行數(shù)據(jù)匯總,最合適的函數(shù)是:
A.SUM()
B.COUNTIF()
C.SUMIFS()
D.VLOOKUP()26、在數(shù)據(jù)交易過程中,以下哪項(xiàng)最能體現(xiàn)數(shù)據(jù)資產(chǎn)的確權(quán)原則?A.?dāng)?shù)據(jù)存儲(chǔ)位置的物理安全性
B.?dāng)?shù)據(jù)采集時(shí)間的先后順序
C.?dāng)?shù)據(jù)來源的合法性及授權(quán)鏈條完整
D.?dāng)?shù)據(jù)處理所使用的算法復(fù)雜度27、在關(guān)系型數(shù)據(jù)庫設(shè)計(jì)中,實(shí)現(xiàn)“用戶只能查看自己提交的數(shù)據(jù)”這一需求,主要依賴于哪種機(jī)制?A.主鍵約束
B.視圖與權(quán)限控制
C.索引優(yōu)化
D.觸發(fā)器日志記錄28、下列哪種數(shù)據(jù)脫敏方法最適合在測(cè)試環(huán)境中保留數(shù)據(jù)的統(tǒng)計(jì)分布特征?A.?dāng)?shù)據(jù)刪除
B.固定值替換
C.隨機(jī)擾動(dòng)
D.加密脫敏29、在數(shù)據(jù)交易服務(wù)平臺(tái)中,以下哪項(xiàng)技術(shù)最有助于實(shí)現(xiàn)數(shù)據(jù)流通的可追溯性?A.?dāng)?shù)據(jù)壓縮技術(shù)
B.分布式賬本技術(shù)
C.?dāng)?shù)據(jù)庫備份機(jī)制
D.緩存加速技術(shù)30、某數(shù)據(jù)交易平臺(tái)采用API接口對(duì)外提供數(shù)據(jù)服務(wù),以下哪項(xiàng)措施最能有效防止接口被惡意高頻調(diào)用?A.增加服務(wù)器內(nèi)存容量
B.啟用接口調(diào)用頻率限制
C.使用HTTPS加密傳輸
D.優(yōu)化數(shù)據(jù)庫查詢語句二、多項(xiàng)選擇題下列各題有多個(gè)正確答案,請(qǐng)選出所有正確選項(xiàng)(共15題)31、在數(shù)據(jù)治理框架中,以下哪些屬于數(shù)據(jù)質(zhì)量管理的核心維度?A.數(shù)據(jù)完整性B.數(shù)據(jù)時(shí)效性C.數(shù)據(jù)可訪問性D.數(shù)據(jù)一致性32、在數(shù)據(jù)庫系統(tǒng)中,以下關(guān)于事務(wù)ACID特性的描述,正確的有哪些?A.原子性指事務(wù)中的操作要么全部完成,要么全部不執(zhí)行B.一致性確保事務(wù)前后數(shù)據(jù)庫狀態(tài)始終保持合法C.隔離性允許事務(wù)并發(fā)執(zhí)行而不互相干擾D.持久性指事務(wù)一旦提交,其結(jié)果永久保存33、下列哪些技術(shù)常用于大數(shù)據(jù)處理中的數(shù)據(jù)清洗環(huán)節(jié)?A.正則表達(dá)式匹配B.缺失值插補(bǔ)C.主成分分析D.異常值檢測(cè)34、在數(shù)據(jù)安全防護(hù)體系中,以下哪些措施可有效防范數(shù)據(jù)泄露?A.數(shù)據(jù)脫敏B.訪問權(quán)限控制C.數(shù)據(jù)加密存儲(chǔ)D.日志審計(jì)追蹤35、以下關(guān)于數(shù)據(jù)標(biāo)準(zhǔn)化與數(shù)據(jù)集成的關(guān)系描述,正確的有哪些?A.數(shù)據(jù)標(biāo)準(zhǔn)化有助于消除數(shù)據(jù)語義沖突B.數(shù)據(jù)集成前通常需進(jìn)行標(biāo)準(zhǔn)化處理C.標(biāo)準(zhǔn)化能提升集成后數(shù)據(jù)的一致性D.數(shù)據(jù)集成是標(biāo)準(zhǔn)化的前提條件36、在數(shù)據(jù)治理體系中,以下哪些屬于數(shù)據(jù)質(zhì)量管理的關(guān)鍵維度?A.數(shù)據(jù)完整性B.數(shù)據(jù)時(shí)效性C.數(shù)據(jù)可訪問性D.數(shù)據(jù)一致性37、下列關(guān)于數(shù)據(jù)資產(chǎn)化的描述,哪些是正確的?A.數(shù)據(jù)資產(chǎn)化需具備可計(jì)量性和可控制性B.所有原始數(shù)據(jù)均可直接確認(rèn)為會(huì)計(jì)意義上的資產(chǎn)C.數(shù)據(jù)確權(quán)是實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)化的前提條件之一D.數(shù)據(jù)資產(chǎn)化有助于提升企業(yè)數(shù)據(jù)資源的利用效率38、在數(shù)據(jù)交易過程中,以下哪些技術(shù)可用于保障數(shù)據(jù)隱私?A.數(shù)據(jù)脫敏B.聯(lián)邦學(xué)習(xí)C.區(qū)塊鏈存證D.數(shù)據(jù)加密39、以下哪些是數(shù)據(jù)中臺(tái)的核心功能?A.數(shù)據(jù)集成與清洗B.數(shù)據(jù)資產(chǎn)統(tǒng)一管理C.實(shí)時(shí)交易撮合D.數(shù)據(jù)服務(wù)API化40、在設(shè)計(jì)數(shù)據(jù)交易平臺(tái)的信用評(píng)價(jià)體系時(shí),應(yīng)考慮哪些因素?A.數(shù)據(jù)提供方的歷史交易履約率B.數(shù)據(jù)產(chǎn)品的更新頻率C.數(shù)據(jù)合規(guī)性審核結(jié)果D.平臺(tái)服務(wù)器的響應(yīng)速度41、在數(shù)據(jù)治理框架中,以下哪些屬于數(shù)據(jù)質(zhì)量管理的核心維度?A.數(shù)據(jù)完整性B.數(shù)據(jù)時(shí)效性C.數(shù)據(jù)可視化D.數(shù)據(jù)一致性42、下列關(guān)于數(shù)據(jù)脫敏技術(shù)的描述,正確的是哪些?A.靜態(tài)脫敏適用于測(cè)試環(huán)境數(shù)據(jù)準(zhǔn)備B.動(dòng)態(tài)脫敏在數(shù)據(jù)訪問時(shí)實(shí)時(shí)處理C.脫敏可完全替代數(shù)據(jù)加密D.脫敏后的數(shù)據(jù)應(yīng)保留業(yè)務(wù)可用性43、在數(shù)據(jù)交易平臺(tái)中,以下哪些是保障數(shù)據(jù)安全的關(guān)鍵技術(shù)手段?A.訪問控制機(jī)制B.數(shù)據(jù)水印技術(shù)C.區(qū)塊鏈存證D.數(shù)據(jù)聚合分析44、數(shù)據(jù)資產(chǎn)入表過程中,需滿足哪些基本條件?A.企業(yè)擁有數(shù)據(jù)的控制權(quán)B.數(shù)據(jù)能帶來未來經(jīng)濟(jì)利益C.數(shù)據(jù)必須存儲(chǔ)在本地服務(wù)器D.數(shù)據(jù)成本或價(jià)值可可靠計(jì)量45、下列哪些屬于數(shù)據(jù)交易中的典型合規(guī)要求?A.獲取數(shù)據(jù)主體授權(quán)B.完成數(shù)據(jù)安全影響評(píng)估C.公開所有交易數(shù)據(jù)內(nèi)容D.落實(shí)分級(jí)分類管理三、判斷題判斷下列說法是否正確(共10題)46、數(shù)據(jù)清洗過程中,處理缺失值的常用方法包括刪除含有缺失值的記錄和使用均值、中位數(shù)等進(jìn)行填充。A.正確B.錯(cuò)誤47、在關(guān)系型數(shù)據(jù)庫中,主鍵(PrimaryKey)可以允許存在空值(NULL),但不能重復(fù)。A.正確B.錯(cuò)誤48、區(qū)塊鏈技術(shù)因其去中心化和不可篡改的特性,常被應(yīng)用于數(shù)據(jù)交易中的確權(quán)與溯源場(chǎng)景。A.正確B.錯(cuò)誤49、在SQL查詢語句中,HAVING子句通常用于對(duì)分組后的結(jié)果進(jìn)行條件篩選。A.正確B.錯(cuò)誤50、數(shù)據(jù)脫敏的主要目的是在不影響數(shù)據(jù)分析結(jié)果的前提下,降低數(shù)據(jù)泄露帶來的安全風(fēng)險(xiǎn)。A.正確B.錯(cuò)誤51、在關(guān)系數(shù)據(jù)庫中,主鍵(PrimaryKey)的值可以為空(NULL)。A.正確B.錯(cuò)誤52、在Python中,列表(list)和元組(tuple)的主要區(qū)別在于是否可變,列表是可變對(duì)象,而元組是不可變對(duì)象。A.正確B.錯(cuò)誤53、數(shù)據(jù)清洗過程中,處理缺失值的唯一合理方式是直接刪除含有缺失值的記錄。A.正確B.錯(cuò)誤54、在Excel中,使用VLOOKUP函數(shù)時(shí),查找值必須位于查找區(qū)域的第一列,否則函數(shù)無法正確返回結(jié)果。A.正確B.錯(cuò)誤55、在統(tǒng)計(jì)學(xué)中,樣本均值的抽樣分布隨著樣本量的增大,趨向于正態(tài)分布,這一定理稱為中心極限定理。A.正確B.錯(cuò)誤
參考答案及解析1.【參考答案】C【解析】數(shù)據(jù)質(zhì)量的保障依賴于數(shù)據(jù)在采集、處理過程中的準(zhǔn)確性與一致性。數(shù)據(jù)清洗與標(biāo)準(zhǔn)化能夠識(shí)別并修正錯(cuò)誤數(shù)據(jù)、缺失值和格式不一致問題,是提升數(shù)據(jù)可用性的關(guān)鍵步驟。元數(shù)據(jù)管理雖有助于理解數(shù)據(jù)結(jié)構(gòu),但不直接處理數(shù)據(jù)質(zhì)量問題。數(shù)據(jù)存儲(chǔ)與可視化更多涉及后續(xù)環(huán)節(jié),非質(zhì)量控制核心。因此,C為正確選項(xiàng)。2.【參考答案】C【解析】外鍵約束用于建立和強(qiáng)制兩個(gè)表之間的邏輯聯(lián)系,確保一個(gè)表中的外鍵值必須在另一個(gè)表的主鍵中存在,從而維護(hù)引用完整性。主鍵約束確保本表記錄唯一,唯一約束防止重復(fù)值,檢查約束限制字段取值范圍,但均不直接實(shí)現(xiàn)表間關(guān)聯(lián)。因此,外鍵約束是實(shí)現(xiàn)引用完整性的核心機(jī)制,選C。3.【參考答案】B【解析】ApacheSpark是專為大規(guī)模數(shù)據(jù)處理設(shè)計(jì)的分布式計(jì)算框架,支持內(nèi)存計(jì)算,適用于批處理和流處理任務(wù)。Kafka是消息隊(duì)列系統(tǒng),主要用于實(shí)時(shí)數(shù)據(jù)管道;Redis是內(nèi)存數(shù)據(jù)庫,用于緩存和快速讀寫;Nginx是Web服務(wù)器與反向代理,不參與數(shù)據(jù)計(jì)算。因此,Spark是批處理場(chǎng)景的最優(yōu)選擇,答案為B。4.【參考答案】B【解析】數(shù)據(jù)脫敏旨在保護(hù)敏感信息的同時(shí)保留數(shù)據(jù)格式與可用性。身份證號(hào)脫敏常采用數(shù)據(jù)掩碼,如將中間幾位替換為“*”,既隱藏真實(shí)信息又便于識(shí)別數(shù)據(jù)類型。哈希加密不可逆,無法保留格式;隨機(jī)加噪適用于數(shù)值型統(tǒng)計(jì)數(shù)據(jù);數(shù)據(jù)交換可能泄露關(guān)聯(lián)信息。掩碼法在安全與實(shí)用性間平衡最佳,故選B。5.【參考答案】B【解析】數(shù)據(jù)倉(cāng)庫用于集成來自不同業(yè)務(wù)系統(tǒng)的數(shù)據(jù),支持決策分析,其數(shù)據(jù)通常來源于多個(gè)異構(gòu)的操作型數(shù)據(jù)庫。而數(shù)據(jù)庫主要用于聯(lián)機(jī)事務(wù)處理(OLTP),強(qiáng)調(diào)高并發(fā)、快速響應(yīng)和事務(wù)一致性。數(shù)據(jù)倉(cāng)庫面向OLAP,擅長(zhǎng)復(fù)雜查詢與歷史數(shù)據(jù)分析,但不追求高并發(fā)寫入。因此,B項(xiàng)描述準(zhǔn)確,其他選項(xiàng)混淆了兩者定位。6.【參考答案】B【解析】PRIMARYKEY約束用于唯一標(biāo)識(shí)表中的每一行數(shù)據(jù),其本質(zhì)是唯一性(UNIQUE)和非空(NOTNULL)的組合。UNIQUE雖可保證值不重復(fù),但允許有一個(gè)NULL值(視數(shù)據(jù)庫系統(tǒng)而定),不符合“不能為空”的要求;FOREIGNKEY用于建立表間關(guān)聯(lián);CHECK用于限制列中的值范圍。因此,同時(shí)滿足“不重復(fù)”和“不能為空”的只有PRIMARYKEY。7.【參考答案】B【解析】pop()方法默認(rèn)移除并返回列表中最后一個(gè)元素,也可指定索引刪除特定元素。remove()按值刪除第一個(gè)匹配項(xiàng),不返回值;del是語句而非方法,用于刪除指定索引或切片,不返回元素;clear()清空整個(gè)列表,不返回任何值。因此,唯一能“刪除并返回”元素的是pop()。8.【參考答案】C【解析】SUMIFS()函數(shù)專用于多條件求和,語法為SUMIFS(求和區(qū)域,條件區(qū)域1,條件1,條件區(qū)域2,條件2,...),支持多個(gè)邏輯判斷。SUM()僅求和;SUMIF()僅支持單一條件;COUNTIFS()用于多條件計(jì)數(shù)而非求和。因此,多條件求和應(yīng)選擇SUMIFS()。9.【參考答案】C【解析】數(shù)據(jù)清洗主要解決數(shù)據(jù)中的錯(cuò)誤、缺失、異常和重復(fù)問題。刪除重復(fù)記錄是典型清洗步驟。數(shù)據(jù)可視化屬于分析階段;數(shù)據(jù)歸一化屬于特征預(yù)處理;構(gòu)建回歸模型屬于建模階段,均不屬于清洗范疇。因此,正確答案為刪除重復(fù)記錄。10.【參考答案】C【解析】網(wǎng)絡(luò)層(如IP協(xié)議)主要負(fù)責(zé)邏輯尋址、路由選擇和數(shù)據(jù)包的封裝與轉(zhuǎn)發(fā)。應(yīng)用層處理用戶請(qǐng)求;傳輸層(如TCP/UDP)負(fù)責(zé)端到端通信和分段;數(shù)據(jù)鏈路層負(fù)責(zé)物理地址(MAC)和幀的傳輸。因此,實(shí)現(xiàn)路由選擇和數(shù)據(jù)包封裝的是網(wǎng)絡(luò)層。11.【參考答案】C【解析】數(shù)據(jù)庫事務(wù)的四大特性簡(jiǎn)稱ACID,即原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)和持久性(Durability)。這些特性由數(shù)據(jù)庫管理系統(tǒng)通過鎖機(jī)制、日志記錄、恢復(fù)機(jī)制等技術(shù)共同保障。選項(xiàng)C準(zhǔn)確概括了這一體系,是數(shù)據(jù)庫事務(wù)處理的核心原則。其他選項(xiàng)雖與數(shù)據(jù)庫相關(guān),但不全面表述事務(wù)保障機(jī)制。12.【參考答案】C【解析】ApacheKafka是分布式消息隊(duì)列系統(tǒng),擅長(zhǎng)高吞吐數(shù)據(jù)采集;Flink是流式計(jì)算引擎,支持低延遲、高并發(fā)的實(shí)時(shí)處理。二者結(jié)合廣泛用于實(shí)時(shí)數(shù)據(jù)分析場(chǎng)景。而MapReduce適用于批處理,延遲高;MySQL和Oracle的觸發(fā)器不適合大規(guī)模流數(shù)據(jù)處理。因此C為最優(yōu)解。13.【參考答案】D【解析】數(shù)據(jù)資產(chǎn)定價(jià)常用方法包括成本法(基于采集存儲(chǔ)成本)、市場(chǎng)法(參考同類交易價(jià)格)和收益法(預(yù)測(cè)未來收益折現(xiàn))。熵值法是用于衡量數(shù)據(jù)不確定性或信息量的數(shù)學(xué)方法,常用于特征選擇或權(quán)重計(jì)算,不直接用于定價(jià)。故D不屬于典型定價(jià)方法。14.【參考答案】A【解析】數(shù)據(jù)脫敏旨在保護(hù)敏感信息,通過變形、屏蔽等方式處理數(shù)據(jù),同時(shí)盡可能保留其格式和統(tǒng)計(jì)特性,以支持測(cè)試或分析使用。脫敏不提升查詢效率,也不能替代加密(因傳輸中仍需加密保護(hù)),且合格脫敏應(yīng)防止身份還原。故A正確,D錯(cuò)誤。15.【參考答案】B【解析】元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”,包括數(shù)據(jù)的定義、來源、格式、更新頻率、業(yè)務(wù)含義等。元數(shù)據(jù)管理有助于提升數(shù)據(jù)可發(fā)現(xiàn)性、理解性和一致性,是數(shù)據(jù)治理的核心組件。它不直接涉及存儲(chǔ)擴(kuò)容、異常清洗或權(quán)限控制,故B為正確答案。16.【參考答案】B【解析】HBase是一個(gè)基于Hadoop的分布式列式數(shù)據(jù)庫,適用于海量結(jié)構(gòu)化數(shù)據(jù)的實(shí)時(shí)讀寫訪問,具備高可靠性和橫向擴(kuò)展能力。Kafka是消息隊(duì)列系統(tǒng),主要用于日志收集和流數(shù)據(jù)傳輸;Flume專注于日志數(shù)據(jù)采集;ZooKeeper用于分布式協(xié)調(diào)服務(wù),不存儲(chǔ)業(yè)務(wù)數(shù)據(jù)。因此,正確答案為B。17.【參考答案】D【解析】處理缺失值的常用方法包括刪除記錄、均值/中位數(shù)/眾數(shù)填補(bǔ)、模型預(yù)測(cè)(如回歸、KNN)等。將缺失值替換為最大值會(huì)嚴(yán)重扭曲數(shù)據(jù)分布,導(dǎo)致分析結(jié)果失真,屬于不合理操作。因此,D項(xiàng)不屬于合理處理方法,為正確答案。18.【參考答案】B【解析】標(biāo)準(zhǔn)化(Z-score標(biāo)準(zhǔn)化)通過公式(x-μ)/σ將數(shù)據(jù)轉(zhuǎn)換為均值為0、標(biāo)準(zhǔn)差為1的分布,適用于連續(xù)數(shù)值型變量。它不改變數(shù)據(jù)排序,且有助于消除量綱影響。雖然異常值在標(biāo)準(zhǔn)化后仍存在,但不會(huì)被放大。分類變量無需標(biāo)準(zhǔn)化。因此B正確。19.【參考答案】C【解析】WHERE用于分組前的行級(jí)條件過濾,HAVING則用于對(duì)GROUPBY后的聚合結(jié)果進(jìn)行篩選。例如,查詢平均工資大于5000的部門,需使用HAVINGAVG(salary)>5000。ORDERBY用于排序,LIMIT限制返回行數(shù)。因此,正確答案為C。20.【參考答案】B【解析】在類別不平衡場(chǎng)景下,準(zhǔn)確率可能虛高(如99%樣本為負(fù)類,模型全判負(fù)類即可得99%準(zhǔn)確率)。F1分?jǐn)?shù)是精確率與召回率的調(diào)和平均,能綜合反映模型對(duì)少數(shù)類的識(shí)別能力。MSE和R2用于回歸任務(wù),不適用于分類。因此,B為最佳選擇。21.【參考答案】D【解析】第三范式要求關(guān)系模式首先滿足第二范式(即消除非主屬性對(duì)碼的部分函數(shù)依賴),同時(shí)進(jìn)一步消除非主屬性對(duì)碼的傳遞函數(shù)依賴。選項(xiàng)A僅滿足2NF,B只強(qiáng)調(diào)傳遞依賴但忽略部分依賴,C涉及主屬性,超出了3NF的定義范圍。因此,D正確,它完整涵蓋了3NF的兩個(gè)核心條件。22.【參考答案】C【解析】淺拷貝僅復(fù)制對(duì)象本身,不復(fù)制其嵌套對(duì)象,因此修改嵌套對(duì)象會(huì)影響原對(duì)象;深拷貝則遞歸復(fù)制所有層次的對(duì)象,彼此完全獨(dú)立。A錯(cuò)誤,描述的是深拷貝;B錯(cuò)誤,copy.copy()是淺拷貝;D錯(cuò)誤,淺拷貝下嵌套對(duì)象共享。C正確描述了深拷貝的本質(zhì)特性。23.【參考答案】C【解析】UDP是無連接、不可靠協(xié)議,不保證傳輸可靠性,但開銷小、延遲低,適用于實(shí)時(shí)性要求高的場(chǎng)景。A錯(cuò)誤,UDP無確認(rèn)機(jī)制;B雖正確但非最優(yōu)選項(xiàng);D錯(cuò)誤,TCP通過滑動(dòng)窗口實(shí)現(xiàn)流量與擁塞控制。C準(zhǔn)確描述了UDP的典型應(yīng)用場(chǎng)景,符合實(shí)際網(wǎng)絡(luò)設(shè)計(jì)原則。24.【參考答案】B【解析】雖然刪除含缺失值記錄(即“刪除法”)操作簡(jiǎn)單,但可能造成數(shù)據(jù)大量丟失,尤其在缺失比例高或樣本有限時(shí)嚴(yán)重影響模型性能,因此并非普遍合理的方法。A、C、D均為常見且科學(xué)的填充策略:A適用于簡(jiǎn)單填補(bǔ),C利用相關(guān)變量預(yù)測(cè),D適用于分類特征。B過于粗暴,故為“不包括”的合理選擇。25.【參考答案】C【解析】SUMIFS()函數(shù)專門用于對(duì)滿足多個(gè)條件的單元格進(jìn)行求和,支持多條件判斷,是多維匯總的核心工具。A僅求和,無條件判斷;B只能統(tǒng)計(jì)滿足單一條件的數(shù)量;D用于查找匹配值,非匯總功能。C不僅功能匹配,且在數(shù)據(jù)處理中廣泛應(yīng)用于財(cái)務(wù)、運(yùn)營(yíng)等多條件統(tǒng)計(jì)場(chǎng)景,是正確選擇。26.【參考答案】C【解析】數(shù)據(jù)確權(quán)是數(shù)據(jù)交易的核心前提,關(guān)鍵在于明確數(shù)據(jù)的歸屬和使用權(quán)。只有在數(shù)據(jù)來源合法、且擁有完整授權(quán)鏈條的情況下,才能認(rèn)定某一方對(duì)數(shù)據(jù)享有可交易的權(quán)利。物理安全、采集時(shí)間或算法復(fù)雜度均不直接決定權(quán)利歸屬。因此,C項(xiàng)體現(xiàn)了數(shù)據(jù)確權(quán)的法律與合規(guī)基礎(chǔ),符合數(shù)據(jù)要素市場(chǎng)化配置的基本要求。27.【參考答案】B【解析】實(shí)現(xiàn)數(shù)據(jù)訪問的行級(jí)或用戶級(jí)隔離,需通過數(shù)據(jù)庫的視圖結(jié)合用戶權(quán)限控制來完成。視圖可封裝查詢邏輯,限制用戶僅訪問特定條件的數(shù)據(jù)(如user_id=當(dāng)前用戶),再通過GRANT等權(quán)限語句授權(quán)訪問。主鍵用于唯一標(biāo)識(shí)記錄,索引用于提升查詢效率,觸發(fā)器用于自動(dòng)執(zhí)行邏輯,均不直接實(shí)現(xiàn)訪問控制。因此,B為最準(zhǔn)確答案。28.【參考答案】C【解析】隨機(jī)擾動(dòng)通過在原始數(shù)據(jù)上添加可控噪聲,既保護(hù)了敏感信息,又盡可能保留了數(shù)據(jù)的統(tǒng)計(jì)特性(如均值、方差),適用于需要模擬真實(shí)數(shù)據(jù)分析的測(cè)試場(chǎng)景。數(shù)據(jù)刪除和固定值替換會(huì)破壞數(shù)據(jù)分布,加密脫敏雖安全但需解密才能使用,不適用于開放測(cè)試環(huán)境。因此,C項(xiàng)最符合要求。29.【參考答案】B【解析】分布式賬本技術(shù)(如區(qū)塊鏈)具有去中心化、不可篡改和可追溯的特性,能完整記錄數(shù)據(jù)交易的全過程,包括交易雙方、時(shí)間、數(shù)據(jù)版本等信息,確保數(shù)據(jù)流轉(zhuǎn)路徑清晰可查。數(shù)據(jù)壓縮、緩存和備份雖有助于性能或安全,但不具備天然的追溯機(jī)制。因此,B是實(shí)現(xiàn)數(shù)據(jù)流通溯源的最優(yōu)技術(shù)選擇。30.【參考答案】B【解析】接口調(diào)用頻率限制(如限流算法:令牌桶、漏桶)可有效控制單位時(shí)間內(nèi)單個(gè)用戶或IP的請(qǐng)求次數(shù),防止資源被耗盡或遭受DDoS攻擊。增加內(nèi)存、優(yōu)化查詢或使用HTTPS雖提升性能或安全性,但不能阻止高頻訪問行為。因此,B是針對(duì)性最強(qiáng)的防護(hù)措施。31.【參考答案】A、B、D【解析】數(shù)據(jù)質(zhì)量管理關(guān)注數(shù)據(jù)的準(zhǔn)確性和可用性。完整性指數(shù)據(jù)無缺失,時(shí)效性指數(shù)據(jù)在有效期內(nèi)及時(shí)更新,一致性指同一數(shù)據(jù)在不同系統(tǒng)中保持統(tǒng)一。可訪問性屬于數(shù)據(jù)安全管理范疇,而非質(zhì)量核心維度,因此不選C。32.【參考答案】A、B、C、D【解析】ACID是事務(wù)處理的四大特性:原子性(Atomicity)保障操作不可分割;一致性(Consistency)維護(hù)數(shù)據(jù)規(guī)則;隔離性(Isolation)控制并發(fā)沖突;持久性(Durability)確保數(shù)據(jù)不因系統(tǒng)故障丟失。四項(xiàng)均正確。33.【參考答案】A、B、D【解析】數(shù)據(jù)清洗旨在提高數(shù)據(jù)質(zhì)量。正則表達(dá)式用于格式標(biāo)準(zhǔn)化,缺失值插補(bǔ)處理空值,異常值檢測(cè)識(shí)別偏離數(shù)據(jù)。主成分分析屬于降維技術(shù),用于建模階段,不屬于清洗環(huán)節(jié),故C不選。34.【參考答案】A、B、C、D【解析】數(shù)據(jù)脫敏保護(hù)敏感信息,權(quán)限控制限制非法訪問,加密存儲(chǔ)防止數(shù)據(jù)竊取,日志審計(jì)實(shí)現(xiàn)行為追溯。這四項(xiàng)均為數(shù)據(jù)安全防護(hù)的關(guān)鍵手段,共同構(gòu)建縱深防御體系,全部正確。35.【參考答案】A、B、C【解析】數(shù)據(jù)標(biāo)準(zhǔn)化統(tǒng)一格式與命名規(guī)則,消除語義歧義,為集成提供基礎(chǔ),提升一致性。集成依賴標(biāo)準(zhǔn)化,而非相反,因此D錯(cuò)誤。A、B、C均正確反映二者邏輯關(guān)系。36.【參考答案】A、B、D【解析】數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年智能按摩靠墊項(xiàng)目可行性研究報(bào)告
- 未來五年米糠毛油企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略分析研究報(bào)告
- 未來五年檢驗(yàn)檢測(cè)認(rèn)證服務(wù)企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級(jí)戰(zhàn)略分析研究報(bào)告
- 未來五年輻射污染治理服務(wù)企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略分析研究報(bào)告
- 未來五年生產(chǎn)性測(cè)繪服務(wù)企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略分析研究報(bào)告
- 小學(xué)語文教學(xué):社區(qū)寵物糞便處理與小學(xué)生道德素養(yǎng)培養(yǎng)教學(xué)研究課題報(bào)告
- 2025至2030中國(guó)肉禽行業(yè)價(jià)格傳導(dǎo)機(jī)制與利潤(rùn)分配研究報(bào)告
- 小學(xué)英語口語教學(xué)中學(xué)生交際策略與跨文化理解能力培養(yǎng)研究教學(xué)研究課題報(bào)告
- 高中數(shù)學(xué)概率教學(xué)中數(shù)據(jù)分析能力的實(shí)踐研究課題報(bào)告教學(xué)研究課題報(bào)告
- 2025至2030金融租賃行業(yè)客戶畫像與精準(zhǔn)營(yíng)銷策略研究報(bào)告
- 2026屆湖南雅禮中學(xué)高一上數(shù)學(xué)期末聯(lián)考模擬試題含解析
- (2025年)電網(wǎng)調(diào)度自動(dòng)化廠站端調(diào)試檢修員??荚囶}(含答案)
- 湖北省武漢市漢陽區(qū)2024-2025學(xué)年上學(xué)期元調(diào)九年級(jí)物理試題(含標(biāo)答)
- 2024年佛山市高三一模普通高中教學(xué)質(zhì)量檢測(cè)(一) 物理試卷
- 三年級(jí)教師數(shù)字化教學(xué)能力提升計(jì)劃
- 聯(lián)營(yíng)餐廳合作協(xié)議
- 2023年重慶市公安局招聘輔警筆試真題
- 高速公路項(xiàng)目竣工決算審計(jì)服務(wù)投標(biāo)方案(技術(shù)方案)
- DB34∕T 3469-2019 高延性混凝土應(yīng)用技術(shù)規(guī)程
- 地面清潔劑產(chǎn)品市場(chǎng)環(huán)境與對(duì)策分析
- 混凝土外加劑試驗(yàn)原始記錄
評(píng)論
0/150
提交評(píng)論