2025年cct一級題庫及答案_第1頁
2025年cct一級題庫及答案_第2頁
2025年cct一級題庫及答案_第3頁
2025年cct一級題庫及答案_第4頁
2025年cct一級題庫及答案_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2025年cct一級題庫及答案一、單項選擇題(每題2分,共20分)1.以下哪項不屬于數(shù)據(jù)分類的常見維度?A.敏感程度B.存儲介質(zhì)C.業(yè)務(wù)用途D.更新頻率答案:B解析:數(shù)據(jù)分類通常基于業(yè)務(wù)屬性(如用途、部門)、安全屬性(如敏感程度)、時間屬性(如更新頻率),存儲介質(zhì)屬于物理存儲特征,不直接作為分類維度。2.電子文檔轉(zhuǎn)換為PDF/A格式時,最關(guān)鍵的技術(shù)要求是?A.保留所有元數(shù)據(jù)B.壓縮文件大小至10MB以內(nèi)C.嵌入字體并禁用編輯功能D.確保長期可讀取性答案:D解析:PDF/A是檔案級PDF格式,核心目標(biāo)是保證文檔在未來數(shù)十年內(nèi)無需依賴特定軟件即可準(zhǔn)確顯示,因此長期可讀取性是關(guān)鍵要求。3.信息檢索中,“精確匹配”與“模糊匹配”的主要區(qū)別在于?A.檢索速度快慢B.對關(guān)鍵詞完整性的要求C.支持的數(shù)據(jù)庫類型D.是否返回相關(guān)度排序結(jié)果答案:B解析:精確匹配要求檢索詞與目標(biāo)內(nèi)容完全一致(如“人工智能”必須完整出現(xiàn)),模糊匹配允許部分匹配(如“人工智”或“智能”),核心區(qū)別是關(guān)鍵詞完整性。4.以下哪項不符合電子文件歸檔的“四性檢測”要求?A.完整性:檢查文件大小與元數(shù)據(jù)是否缺失B.可讀性:驗(yàn)證文件能否在主流軟件中正常打開C.安全性:確認(rèn)文件未被惡意篡改D.可用性:評估文件對業(yè)務(wù)的支持價值答案:D解析:四性檢測指完整性(內(nèi)容與元數(shù)據(jù)無缺失)、可讀性(可正常讀?。踩裕ㄎ幢淮鄹模?、真實(shí)性(來源可靠),可用性屬于價值評估范疇,非檢測項。5.在數(shù)據(jù)清洗過程中,處理“不一致數(shù)據(jù)”的典型方法是?A.直接刪除重復(fù)記錄B.統(tǒng)一數(shù)據(jù)格式(如日期格式Y(jié)YYY-MM-DD)C.用均值填充缺失值D.標(biāo)記異常值并隔離答案:B解析:不一致數(shù)據(jù)指同一屬性存在多種表達(dá)(如“2024/3/15”與“2024-03-15”),需通過格式統(tǒng)一解決;刪除重復(fù)、填充缺失、標(biāo)記異常分別對應(yīng)重復(fù)數(shù)據(jù)、缺失數(shù)據(jù)、異常數(shù)據(jù)的處理。6.以下哪種場景最適合使用OCR技術(shù)?A.提取加密PDF中的文本內(nèi)容B.識別掃描件中的手寫簽名C.轉(zhuǎn)換Word文檔為純文本格式D.分析結(jié)構(gòu)化表格中的數(shù)值數(shù)據(jù)答案:B解析:OCR(光學(xué)字符識別)主要用于將圖像中的文字(包括印刷體、手寫體)轉(zhuǎn)換為可編輯文本,掃描件中的手寫簽名需通過OCR識別;加密PDF需先解密,Word轉(zhuǎn)文本無需OCR,結(jié)構(gòu)化表格分析可用數(shù)據(jù)提取工具。7.信息安全管理中,“最小權(quán)限原則”的核心要求是?A.用戶僅獲得完成工作所需的最低權(quán)限B.所有操作需經(jīng)過管理員二次確認(rèn)C.定期更換系統(tǒng)登錄密碼D.對敏感數(shù)據(jù)實(shí)施加密存儲答案:A解析:最小權(quán)限原則指用戶或程序僅被授予完成特定任務(wù)所需的最小權(quán)限集合,以降低越權(quán)操作風(fēng)險,其他選項屬于補(bǔ)充措施。8.電子檔案長期保存時,“遷移策略”與“仿真策略”的主要區(qū)別是?A.遷移需轉(zhuǎn)換文件格式,仿真需保留原環(huán)境B.遷移適用于小數(shù)據(jù)量,仿真適用于大數(shù)據(jù)量C.遷移成本更低,仿真可靠性更高D.遷移由系統(tǒng)自動完成,仿真需人工干預(yù)答案:A解析:遷移策略通過將文件轉(zhuǎn)換為新格式(如從TIF轉(zhuǎn)PDF/A)適應(yīng)新環(huán)境;仿真策略通過模擬舊系統(tǒng)運(yùn)行環(huán)境(如虛擬機(jī))保持原格式可讀取,核心區(qū)別是是否改變文件格式。9.以下哪項屬于非結(jié)構(gòu)化數(shù)據(jù)?A.Excel表格中的銷售數(shù)據(jù)B.數(shù)據(jù)庫中的用戶信息表C.企業(yè)內(nèi)部的會議錄音D.ERP系統(tǒng)中的訂單記錄答案:C解析:非結(jié)構(gòu)化數(shù)據(jù)無固定格式(如文本、音頻、視頻),會議錄音屬于音頻文件;Excel、數(shù)據(jù)庫表、ERP記錄均為結(jié)構(gòu)化數(shù)據(jù)(有預(yù)定義字段)。10.數(shù)據(jù)備份方案設(shè)計中,“增量備份”與“差異備份”的主要差異是?A.增量備份僅備份上次全備后變化的數(shù)據(jù),差異備份備份上次全備后所有變化的數(shù)據(jù)B.增量備份速度更快,差異備份恢復(fù)更簡單C.增量備份占用空間更小,差異備份可靠性更高D.增量備份支持云存儲,差異備份僅支持本地存儲答案:B解析:增量備份備份上次備份(全備或增量)后變化的數(shù)據(jù),差異備份備份上次全備后所有變化的數(shù)據(jù);因此增量備份速度快(數(shù)據(jù)量?。?,但恢復(fù)時需按順序恢復(fù)全備+所有增量;差異備份恢復(fù)時只需全備+最后一次差異,更簡單。二、多項選擇題(每題3分,共30分)1.數(shù)據(jù)預(yù)處理的主要步驟包括?A.數(shù)據(jù)清洗B.數(shù)據(jù)集成C.數(shù)據(jù)變換D.數(shù)據(jù)規(guī)約答案:ABCD解析:數(shù)據(jù)預(yù)處理是數(shù)據(jù)分析前的準(zhǔn)備工作,包括清洗(處理錯誤/缺失)、集成(合并多源數(shù)據(jù))、變換(標(biāo)準(zhǔn)化/歸一化)、規(guī)約(降維/抽樣)。2.電子文件管理系統(tǒng)需具備的核心功能有?A.元數(shù)據(jù)自動捕獲B.文件版本控制C.在線審批流程D.長期保存格式轉(zhuǎn)換答案:ABD解析:核心功能包括元數(shù)據(jù)管理(自動捕獲)、版本控制(記錄修改歷史)、格式轉(zhuǎn)換(支持長期保存);在線審批屬于業(yè)務(wù)流程功能,非文件管理系統(tǒng)必需。3.信息檢索效果的評價指標(biāo)包括?A.查全率(召回率)B.查準(zhǔn)率(精確率)C.響應(yīng)時間D.系統(tǒng)吞吐量答案:ABC解析:查全率(相關(guān)結(jié)果被檢索到的比例)、查準(zhǔn)率(檢索結(jié)果中相關(guān)的比例)是核心指標(biāo);響應(yīng)時間反映檢索效率,也是評價維度;系統(tǒng)吞吐量屬于性能指標(biāo),非效果指標(biāo)。4.以下哪些操作可能破壞電子檔案的真實(shí)性?A.修改文件創(chuàng)建時間元數(shù)據(jù)B.使用OCR糾正掃描件中的文字錯誤C.對電子簽名進(jìn)行驗(yàn)簽操作D.在未授權(quán)情況下刪除原始文件答案:ABD解析:真實(shí)性指文件內(nèi)容、元數(shù)據(jù)與形成時一致,修改創(chuàng)建時間、OCR修改原文、未授權(quán)刪除原始文件均破壞真實(shí)性;驗(yàn)簽是驗(yàn)證真實(shí)性的手段。5.數(shù)據(jù)安全防護(hù)的技術(shù)措施包括?A.訪問控制(ACL)B.數(shù)據(jù)脫敏(如手機(jī)號打碼)C.定期安全培訓(xùn)D.加密傳輸(如HTTPS)答案:ABD解析:技術(shù)措施包括訪問控制、脫敏、加密傳輸;安全培訓(xùn)屬于管理措施。6.電子文檔長期保存需考慮的環(huán)境因素有?A.存儲介質(zhì)的壽命(如硬盤vs磁帶)B.操作系統(tǒng)的兼容性C.軟件廠商的持續(xù)支持D.數(shù)據(jù)備份的頻率答案:ABC解析:環(huán)境因素包括存儲介質(zhì)(物理壽命)、系統(tǒng)兼容性(能否讀取)、軟件支持(是否有可用工具);備份頻率屬于管理策略,非環(huán)境因素。7.以下哪些屬于OCR技術(shù)的應(yīng)用場景?A.銀行票據(jù)信息自動錄入B.古籍掃描件文字識別C.視頻中字幕內(nèi)容提取D.加密文檔的解密處理答案:ABC解析:OCR用于圖像文字識別,票據(jù)錄入、古籍識別、視頻字幕提取均屬此類;加密文檔解密需密碼或密鑰,與OCR無關(guān)。8.數(shù)據(jù)質(zhì)量的評估維度包括?A.準(zhǔn)確性(數(shù)據(jù)與實(shí)際一致)B.完整性(無缺失字段)C.一致性(同一數(shù)據(jù)多源一致)D.時效性(數(shù)據(jù)更新及時)答案:ABCD解析:數(shù)據(jù)質(zhì)量通常從準(zhǔn)確性、完整性、一致性、時效性、唯一性等維度評估。9.電子檔案移交時,需同步移交的材料包括?A.檔案目錄數(shù)據(jù)(如Excel清單)B.元數(shù)據(jù)信息(如創(chuàng)建者、時間)C.遷移轉(zhuǎn)換記錄(格式變更日志)D.檔案利用權(quán)限說明答案:ABC解析:移交需包括檔案本體、目錄、元數(shù)據(jù)及相關(guān)處理記錄(如格式轉(zhuǎn)換日志);利用權(quán)限屬于管理要求,非必移交材料。10.信息系統(tǒng)日志管理的關(guān)鍵要求有?A.日志內(nèi)容需包含操作時間、用戶、行為B.日志存儲需滿足一定時間保留期(如6個月)C.日志需加密存儲防止篡改D.日志分析需實(shí)時提供報表答案:ABC解析:日志管理要求內(nèi)容完整(時間、用戶、行為)、存儲安全(加密、長期保存)、防篡改;實(shí)時報表屬于分析需求,非關(guān)鍵要求。三、判斷題(每題1分,共10分)1.數(shù)據(jù)去重時,所有重復(fù)記錄都應(yīng)直接刪除。()答案:×解析:需區(qū)分“完全重復(fù)”(可刪除)和“邏輯重復(fù)”(如同一實(shí)體不同來源記錄,需合并而非刪除)。2.PDF/X格式主要用于印刷出版,PDF/A格式用于長期歸檔。()答案:√解析:PDF/X是印刷專用格式(約束顏色模式等),PDF/A是檔案專用格式(確保長期可讀)。3.信息檢索中,布爾邏輯“AND”會擴(kuò)大檢索結(jié)果范圍。()答案:×解析:“AND”要求同時滿足多個關(guān)鍵詞,會縮小結(jié)果范圍;“OR”擴(kuò)大范圍。4.電子文件的“雙套制”指同時保存紙質(zhì)文件和電子文件。()答案:√解析:雙套制是紙質(zhì)與電子文件并行保存的制度,適用于重要文件。5.OCR識別率受字體、字號、掃描分辨率影響。()答案:√解析:字體潦草、字號過小、掃描分辨率低(如<300dpi)會降低OCR識別準(zhǔn)確率。6.數(shù)據(jù)備份中,“全備份+增量備份”組合比“全備份+差異備份”占用更少存儲空間。()答案:√解析:增量備份僅備份上次備份后變化的數(shù)據(jù),差異備份備份上次全備后所有變化的數(shù)據(jù),因此前者存儲空間更小。7.元數(shù)據(jù)可以分為技術(shù)元數(shù)據(jù)(如文件大小)和業(yè)務(wù)元數(shù)據(jù)(如項目編號)。()答案:√解析:技術(shù)元數(shù)據(jù)描述文件技術(shù)屬性(大小、格式),業(yè)務(wù)元數(shù)據(jù)描述業(yè)務(wù)屬性(項目編號、責(zé)任人)。8.信息安全中,“防篡改”主要通過加密技術(shù)實(shí)現(xiàn)。()答案:×解析:防篡改主要通過哈希校驗(yàn)(如MD5、SHA-256)實(shí)現(xiàn),加密是防止未授權(quán)讀取。9.電子檔案的“四性檢測”應(yīng)在歸檔前完成,移交后無需重復(fù)檢測。()答案:×解析:因存儲環(huán)境變化(如介質(zhì)老化),移交后需定期重新檢測四性(完整性、可讀性、安全性、真實(shí)性)。10.非結(jié)構(gòu)化數(shù)據(jù)無法進(jìn)行數(shù)據(jù)分析,需轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)后處理。()答案:×解析:非結(jié)構(gòu)化數(shù)據(jù)(如文本、音頻)可通過自然語言處理(NLP)、語音識別等技術(shù)直接分析,無需完全結(jié)構(gòu)化。四、簡答題(每題6分,共30分)1.簡述數(shù)據(jù)清洗的主要內(nèi)容及常用方法。答案:數(shù)據(jù)清洗針對數(shù)據(jù)中的錯誤、缺失、重復(fù)、不一致等問題,主要內(nèi)容包括:(1)處理缺失值:方法有刪除記錄(缺失比例高)、均值/中位數(shù)填充(數(shù)值型)、眾數(shù)填充(分類型)、插值法(時間序列);(2)處理異常值:方法有Z-score法(超過3σ視為異常)、IQR法(超出四分位距1.5倍)、標(biāo)記后保留(需業(yè)務(wù)確認(rèn));(3)處理重復(fù)值:識別完全重復(fù)(刪除)或邏輯重復(fù)(合并);(4)處理不一致數(shù)據(jù):統(tǒng)一格式(如日期“2024/3/15”轉(zhuǎn)“2024-03-15”)、標(biāo)準(zhǔn)化單位(如“5kg”轉(zhuǎn)“5000g”)。2.電子文件歸檔時,為何需要同時保存元數(shù)據(jù)?請列舉至少5類元數(shù)據(jù)。答案:元數(shù)據(jù)是描述文件特征的信息,歸檔時保存元數(shù)據(jù)的原因:(1)保證文件真實(shí)性(如創(chuàng)建者、時間證明來源);(2)支持文件檢索(如主題、分類便于查找);(3)記錄管理過程(如修改次數(shù)、歸檔時間反映生命周期)。常見元數(shù)據(jù)類型:文件格式、創(chuàng)建時間、創(chuàng)建者、文件大小、主題詞、密級、關(guān)聯(lián)文件、修改次數(shù)、歸檔時間、保管期限。3.信息檢索中,“關(guān)鍵詞擴(kuò)展”的作用是什么?請舉例說明常用擴(kuò)展方法。答案:關(guān)鍵詞擴(kuò)展用于提高查全率,避免因用戶輸入單一關(guān)鍵詞導(dǎo)致漏檢。常用方法:(1)同義詞擴(kuò)展:如檢索“人工智能”時擴(kuò)展“AI”“機(jī)器學(xué)習(xí)”;(2)上位詞/下位詞擴(kuò)展:如檢索“蘋果”時擴(kuò)展上位詞“水果”,下位詞“紅富士”;(3)拼寫變體擴(kuò)展:如“e-mail”與“email”;(4)縮寫與全稱擴(kuò)展:如“WTO”擴(kuò)展“世界貿(mào)易組織”。例:用戶檢索“新冠疫苗”,擴(kuò)展“COVID-19疫苗”“冠狀病毒疫苗”可覆蓋更多相關(guān)文獻(xiàn)。4.簡述電子檔案長期保存的“雙套制”與“雙軌制”的區(qū)別。答案:(1)定義不同:雙套制指同一文件同時保存紙質(zhì)與電子版本;雙軌制指文件形成階段紙質(zhì)與電子版本并行管理(如審批時同時流轉(zhuǎn)紙質(zhì)表單和電子流程)。(2)實(shí)施階段不同:雙套制在歸檔后執(zhí)行(保存階段);雙軌制在文件生命周期前期執(zhí)行(形成、辦理階段)。(3)目的不同:雙套制主要應(yīng)對電子文件的技術(shù)風(fēng)險(如格式過時);雙軌制主要解決電子文件法律有效性問題(如簽名認(rèn)可)。5.數(shù)據(jù)安全防護(hù)中,“脫敏處理”的常用技術(shù)有哪些?請分別說明適用場景。答案:脫敏技術(shù)通過對敏感數(shù)據(jù)變形保護(hù)隱私,常用技術(shù)及場景:(1)替換(Masking):用固定符號替換部分字符(如手機(jī)號→“1385678”),適用于顯示場景(如界面展示);(2)隨機(jī)化(Randomization):將數(shù)據(jù)替換為同類型隨機(jī)值(如年齡“30”→“25-35”隨機(jī)數(shù)),適用于統(tǒng)計分析(保留分布特征);(3)加密(Encryption):用算法對數(shù)據(jù)加密(如AES加密身份證號),適用于存儲/傳輸場景(需密鑰解密);(4)截斷(Truncation):刪除部分?jǐn)?shù)據(jù)(如地址“北京市朝陽區(qū)XX路123號”→“北京市朝陽區(qū)”),適用于不需要精確信息的場景;(5)匿名化(Anonymization):移除可識別信息(如刪除姓名、身份證號),適用于數(shù)據(jù)共享(如對外提供統(tǒng)計數(shù)據(jù))。五、案例分析題(每題10分,共20分)案例1:某企業(yè)財務(wù)部門需將2023年所有電子憑證(格式包括JPG掃描件、Excel表格、PDF報告)歸檔保存,要求滿足長期可讀取性、真實(shí)性和完整性。請設(shè)計具體的歸檔方案,包括格式轉(zhuǎn)換、元數(shù)據(jù)管理、檢測驗(yàn)證步驟。答案:(1)格式轉(zhuǎn)換:JPG掃描件:轉(zhuǎn)換為PDF/A-3格式(支持嵌入附件,保留原始圖像),確保字體嵌入、無加密;Excel表格:轉(zhuǎn)換為PDF/A-2格式(支持結(jié)構(gòu)化數(shù)據(jù)),或保留原始XLSX格式但需遷移至開放文檔格式(ODS)作為長期保存格式;PDF檢查是否為PDF/A格式,非歸檔格式的需用專業(yè)工具(如AdobeAcrobat)轉(zhuǎn)換為PDF/A-1b。(2)元數(shù)據(jù)管理:捕獲技術(shù)元數(shù)據(jù):文件格式、大小、分辨率(掃描件)、創(chuàng)建時間、修改時間;捕獲業(yè)務(wù)元數(shù)據(jù):憑證編號、業(yè)務(wù)類型(如報銷/收入)、金額、制單人、審核人;捕獲管理元數(shù)據(jù):歸檔時間、保管期限(如30年)、密級(如內(nèi)部公開);元數(shù)據(jù)存儲:采用XML格式與電子文件關(guān)聯(lián)保存,或嵌入PDF/A元數(shù)據(jù)字段(如XMP元數(shù)據(jù))。(3)檢測驗(yàn)證:完整性檢測:通過哈希值(如SHA-256)校驗(yàn)文件內(nèi)容與元數(shù)據(jù)是否匹配;可讀性檢測:用至少2種主流軟件(如AdobeReader、福昕閱讀器)測試打開,確認(rèn)無亂碼、圖像丟失;真實(shí)性檢測:驗(yàn)證電子簽名(如Excel的數(shù)字簽名、PDF的簽名域)是否有效,無簽名的需補(bǔ)充紙質(zhì)簽字掃描件作為憑證;四性檢測提供包含檢測結(jié)果的日志文件,與歸檔文件一同保存。案例2:某電商平臺用戶數(shù)據(jù)庫發(fā)生數(shù)據(jù)泄露,泄露數(shù)據(jù)包括用戶姓名、手機(jī)號、收

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論