2025年征信數(shù)據(jù)質(zhì)量控制與信用評(píng)估試題庫(kù)_第1頁(yè)
2025年征信數(shù)據(jù)質(zhì)量控制與信用評(píng)估試題庫(kù)_第2頁(yè)
2025年征信數(shù)據(jù)質(zhì)量控制與信用評(píng)估試題庫(kù)_第3頁(yè)
2025年征信數(shù)據(jù)質(zhì)量控制與信用評(píng)估試題庫(kù)_第4頁(yè)
2025年征信數(shù)據(jù)質(zhì)量控制與信用評(píng)估試題庫(kù)_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025年征信數(shù)據(jù)質(zhì)量控制與信用評(píng)估試題庫(kù)考試時(shí)間:______分鐘總分:______分姓名:______一、單項(xiàng)選擇題(本大題共20小題,每小題1分,共20分。在每小題列出的四個(gè)選項(xiàng)中,只有一項(xiàng)是符合題目要求的,請(qǐng)將正確選項(xiàng)的字母填在題后的括號(hào)內(nèi)。)1.征信數(shù)據(jù)采集過(guò)程中,以下哪項(xiàng)不屬于關(guān)鍵質(zhì)量控制環(huán)節(jié)?()A.數(shù)據(jù)來(lái)源的合法性驗(yàn)證B.數(shù)據(jù)格式的一致性檢查C.數(shù)據(jù)傳輸?shù)募用鼙Wo(hù)D.數(shù)據(jù)錄入的隨機(jī)抽查2.信用評(píng)估模型中,邏輯回歸模型的主要優(yōu)勢(shì)在于?()A.能夠處理非線性關(guān)系B.模型解釋性強(qiáng)C.計(jì)算效率高D.適用于小樣本數(shù)據(jù)3.在征信數(shù)據(jù)清洗過(guò)程中,以下哪項(xiàng)不屬于異常值處理方法?()A.箱線圖法B.標(biāo)準(zhǔn)差法C.聚類分析D.均值替換法4.征信數(shù)據(jù)報(bào)送過(guò)程中,以下哪項(xiàng)不屬于數(shù)據(jù)完整性校驗(yàn)的內(nèi)容?()A.數(shù)據(jù)項(xiàng)是否缺失B.數(shù)據(jù)格式是否正確C.數(shù)據(jù)值是否在合理范圍內(nèi)D.數(shù)據(jù)報(bào)送時(shí)間是否延遲5.信用評(píng)分卡模型中,以下哪項(xiàng)不是常用的變量篩選方法?()A.卡方檢驗(yàn)B.相關(guān)性分析C.逐步回歸D.主成分分析6.征信數(shù)據(jù)安全保護(hù)中,以下哪項(xiàng)不屬于數(shù)據(jù)加密技術(shù)?()A.對(duì)稱加密B.非對(duì)稱加密C.哈希加密D.數(shù)據(jù)脫敏7.信用評(píng)估模型中,以下哪項(xiàng)不是常用的模型評(píng)估指標(biāo)?()A.準(zhǔn)確率B.召回率C.F1分?jǐn)?shù)D.相關(guān)系數(shù)8.在征信數(shù)據(jù)采集過(guò)程中,以下哪項(xiàng)不屬于數(shù)據(jù)來(lái)源的合法性驗(yàn)證內(nèi)容?()A.數(shù)據(jù)提供者的資質(zhì)審查B.數(shù)據(jù)采集協(xié)議的簽訂C.數(shù)據(jù)使用范圍的明確D.數(shù)據(jù)采集頻率的設(shè)定9.信用評(píng)分卡模型中,以下哪項(xiàng)不是常用的變量轉(zhuǎn)換方法?()A.標(biāo)準(zhǔn)化B.縮放化C.對(duì)數(shù)變換D.邏輯變換10.征信數(shù)據(jù)報(bào)送過(guò)程中,以下哪項(xiàng)不屬于數(shù)據(jù)一致性校驗(yàn)的內(nèi)容?()A.數(shù)據(jù)項(xiàng)的命名是否一致B.數(shù)據(jù)值的單位是否一致C.數(shù)據(jù)格式是否一致D.數(shù)據(jù)報(bào)送時(shí)間是否一致11.信用評(píng)估模型中,以下哪項(xiàng)不是常用的模型優(yōu)化方法?()A.參數(shù)調(diào)整B.特征工程C.模型集成D.數(shù)據(jù)重采樣12.在征信數(shù)據(jù)清洗過(guò)程中,以下哪項(xiàng)不屬于重復(fù)數(shù)據(jù)處理方法?()A.基于唯一標(biāo)識(shí)符的去重B.基于相似度算法的去重C.基于時(shí)間戳的去重D.基于均值替換的去重13.征信數(shù)據(jù)報(bào)送過(guò)程中,以下哪項(xiàng)不屬于數(shù)據(jù)完整性校驗(yàn)的內(nèi)容?()A.數(shù)據(jù)項(xiàng)是否缺失B.數(shù)據(jù)格式是否正確C.數(shù)據(jù)值是否在合理范圍內(nèi)D.數(shù)據(jù)報(bào)送時(shí)間是否延遲14.信用評(píng)分卡模型中,以下哪項(xiàng)不是常用的變量篩選方法?()A.卡方檢驗(yàn)B.相關(guān)性分析C.逐步回歸D.主成分分析15.征信數(shù)據(jù)安全保護(hù)中,以下哪項(xiàng)不屬于數(shù)據(jù)加密技術(shù)?()A.對(duì)稱加密B.非對(duì)稱加密C.哈希加密D.數(shù)據(jù)脫敏16.信用評(píng)估模型中,以下哪項(xiàng)不是常用的模型評(píng)估指標(biāo)?()A.準(zhǔn)確率B.召回率C.F1分?jǐn)?shù)D.相關(guān)系數(shù)17.在征信數(shù)據(jù)采集過(guò)程中,以下哪項(xiàng)不屬于數(shù)據(jù)來(lái)源的合法性驗(yàn)證內(nèi)容?()A.數(shù)據(jù)提供者的資質(zhì)審查B.數(shù)據(jù)采集協(xié)議的簽訂C.數(shù)據(jù)使用范圍的明確D.數(shù)據(jù)采集頻率的設(shè)定18.信用評(píng)分卡模型中,以下哪項(xiàng)不是常用的變量轉(zhuǎn)換方法?()A.標(biāo)準(zhǔn)化B.縮放化C.對(duì)數(shù)變換D.邏輯變換19.征信數(shù)據(jù)報(bào)送過(guò)程中,以下哪項(xiàng)不屬于數(shù)據(jù)一致性校驗(yàn)的內(nèi)容?()A.數(shù)據(jù)項(xiàng)的命名是否一致B.數(shù)據(jù)值的單位是否一致C.數(shù)據(jù)格式是否一致D.數(shù)據(jù)報(bào)送時(shí)間是否一致20.信用評(píng)估模型中,以下哪項(xiàng)不是常用的模型優(yōu)化方法?()A.參數(shù)調(diào)整B.特征工程C.模型集成D.數(shù)據(jù)重采樣二、多項(xiàng)選擇題(本大題共10小題,每小題2分,共20分。在每小題列出的五個(gè)選項(xiàng)中,有多項(xiàng)是符合題目要求的,請(qǐng)將正確選項(xiàng)的字母填在題后的括號(hào)內(nèi)。)1.征信數(shù)據(jù)質(zhì)量控制中,以下哪些屬于常見(jiàn)的數(shù)據(jù)清洗方法?()A.缺失值處理B.異常值處理C.重復(fù)數(shù)據(jù)處理D.數(shù)據(jù)格式轉(zhuǎn)換E.數(shù)據(jù)標(biāo)準(zhǔn)化2.信用評(píng)估模型中,以下哪些屬于常用的變量篩選方法?()A.卡方檢驗(yàn)B.相關(guān)性分析C.逐步回歸D.主成分分析E.聚類分析3.征信數(shù)據(jù)安全保護(hù)中,以下哪些屬于常見(jiàn)的數(shù)據(jù)加密技術(shù)?()A.對(duì)稱加密B.非對(duì)稱加密C.哈希加密D.數(shù)據(jù)脫敏E.數(shù)據(jù)壓縮4.信用評(píng)分卡模型中,以下哪些屬于常用的變量轉(zhuǎn)換方法?()A.標(biāo)準(zhǔn)化B.縮放化C.對(duì)數(shù)變換D.邏輯變換E.數(shù)據(jù)離散化5.征信數(shù)據(jù)報(bào)送過(guò)程中,以下哪些屬于數(shù)據(jù)完整性校驗(yàn)的內(nèi)容?()A.數(shù)據(jù)項(xiàng)是否缺失B.數(shù)據(jù)格式是否正確C.數(shù)據(jù)值是否在合理范圍內(nèi)D.數(shù)據(jù)報(bào)送時(shí)間是否延遲E.數(shù)據(jù)報(bào)送頻率是否一致6.信用評(píng)估模型中,以下哪些屬于常用的模型評(píng)估指標(biāo)?()A.準(zhǔn)確率B.召回率C.F1分?jǐn)?shù)D.AUC值E.相關(guān)系數(shù)7.在征信數(shù)據(jù)采集過(guò)程中,以下哪些屬于數(shù)據(jù)來(lái)源的合法性驗(yàn)證內(nèi)容?()A.數(shù)據(jù)提供者的資質(zhì)審查B.數(shù)據(jù)采集協(xié)議的簽訂C.數(shù)據(jù)使用范圍的明確D.數(shù)據(jù)采集頻率的設(shè)定E.數(shù)據(jù)采集成本的核算8.信用評(píng)分卡模型中,以下哪些屬于常用的模型優(yōu)化方法?()A.參數(shù)調(diào)整B.特征工程C.模型集成D.數(shù)據(jù)重采樣E.模型驗(yàn)證9.征信數(shù)據(jù)報(bào)送過(guò)程中,以下哪些屬于數(shù)據(jù)一致性校驗(yàn)的內(nèi)容?()A.數(shù)據(jù)項(xiàng)的命名是否一致B.數(shù)據(jù)值的單位是否一致C.數(shù)據(jù)格式是否一致D.數(shù)據(jù)報(bào)送時(shí)間是否一致E.數(shù)據(jù)報(bào)送頻率是否一致10.信用評(píng)估模型中,以下哪些屬于常見(jiàn)的模型解釋方法?()A.決策樹(shù)可視化B.特征重要性排序C.LIME解釋D.SHAP值解釋E.相關(guān)性分析三、判斷題(本大題共10小題,每小題1分,共10分。請(qǐng)判斷下列各題的說(shuō)法是否正確,正確的填“√”,錯(cuò)誤的填“×”。)1.征信數(shù)據(jù)清洗過(guò)程中,所有缺失值都應(yīng)該被刪除,因?yàn)槿笔е禃?huì)影響模型的準(zhǔn)確性。(×)2.信用評(píng)分卡模型中,變量篩選的主要目的是為了減少模型的復(fù)雜度,提高模型的泛化能力。(√)3.征信數(shù)據(jù)安全保護(hù)中,數(shù)據(jù)加密技術(shù)可以完全防止數(shù)據(jù)泄露。(×)4.信用評(píng)估模型中,模型評(píng)估指標(biāo)的選擇應(yīng)該根據(jù)具體的業(yè)務(wù)場(chǎng)景和需求來(lái)確定。(√)5.在征信數(shù)據(jù)采集過(guò)程中,數(shù)據(jù)提供者的資質(zhì)審查是確保數(shù)據(jù)合法性的重要環(huán)節(jié)。(√)6.信用評(píng)分卡模型中,變量轉(zhuǎn)換的主要目的是為了提高模型的解釋性。(×)7.征信數(shù)據(jù)報(bào)送過(guò)程中,數(shù)據(jù)完整性校驗(yàn)的主要目的是為了確保數(shù)據(jù)的完整性。(√)8.信用評(píng)估模型中,模型優(yōu)化方法的主要目的是為了提高模型的預(yù)測(cè)準(zhǔn)確性。(√)9.在征信數(shù)據(jù)采集過(guò)程中,數(shù)據(jù)采集頻率的設(shè)定應(yīng)該根據(jù)具體的業(yè)務(wù)需求來(lái)確定。(√)10.征信數(shù)據(jù)安全保護(hù)中,數(shù)據(jù)脫敏技術(shù)可以完全隱藏?cái)?shù)據(jù)中的敏感信息。(×)四、簡(jiǎn)答題(本大題共5小題,每小題4分,共20分。請(qǐng)根據(jù)題目要求,簡(jiǎn)要回答問(wèn)題。)1.簡(jiǎn)述征信數(shù)據(jù)質(zhì)量控制中,缺失值處理的主要方法有哪些?答:征信數(shù)據(jù)質(zhì)量控制中,缺失值處理的主要方法包括刪除法、插補(bǔ)法等。刪除法包括完全刪除含有缺失值的記錄和刪除缺失值所在的列。插補(bǔ)法包括均值插補(bǔ)、中位數(shù)插補(bǔ)、眾數(shù)插補(bǔ)、回歸插補(bǔ)、K最近鄰插補(bǔ)等。2.簡(jiǎn)述信用評(píng)分卡模型中,變量篩選的主要方法有哪些?答:信用評(píng)分卡模型中,變量篩選的主要方法包括卡方檢驗(yàn)、相關(guān)性分析、逐步回歸、Lasso回歸等??ǚ綑z驗(yàn)主要用于分類變量篩選,相關(guān)性分析用于衡量變量之間的線性關(guān)系,逐步回歸通過(guò)統(tǒng)計(jì)檢驗(yàn)自動(dòng)選擇最優(yōu)變量子集,Lasso回歸通過(guò)L1正則化實(shí)現(xiàn)變量選擇。3.簡(jiǎn)述征信數(shù)據(jù)安全保護(hù)中,數(shù)據(jù)加密技術(shù)的主要類型有哪些?答:征信數(shù)據(jù)安全保護(hù)中,數(shù)據(jù)加密技術(shù)的主要類型包括對(duì)稱加密、非對(duì)稱加密和哈希加密。對(duì)稱加密使用相同的密鑰進(jìn)行加密和解密,非對(duì)稱加密使用公鑰和私鑰進(jìn)行加密和解密,哈希加密將數(shù)據(jù)轉(zhuǎn)換為固定長(zhǎng)度的哈希值,具有單向性和抗碰撞性。4.簡(jiǎn)述信用評(píng)估模型中,模型評(píng)估的主要指標(biāo)有哪些?答:信用評(píng)估模型中,模型評(píng)估的主要指標(biāo)包括準(zhǔn)確率、召回率、F1分?jǐn)?shù)、AUC值等。準(zhǔn)確率表示模型預(yù)測(cè)正確的比例,召回率表示模型正確識(shí)別正例的比例,F(xiàn)1分?jǐn)?shù)是準(zhǔn)確率和召回率的調(diào)和平均值,AUC值表示模型區(qū)分正負(fù)例的能力。5.簡(jiǎn)述征信數(shù)據(jù)報(bào)送過(guò)程中,數(shù)據(jù)一致性校驗(yàn)的主要內(nèi)容有哪些?答:征信數(shù)據(jù)報(bào)送過(guò)程中,數(shù)據(jù)一致性校驗(yàn)的主要內(nèi)容包括數(shù)據(jù)項(xiàng)的命名是否一致、數(shù)據(jù)值的單位是否一致、數(shù)據(jù)格式是否一致、數(shù)據(jù)報(bào)送時(shí)間是否一致等。通過(guò)這些校驗(yàn),可以確保數(shù)據(jù)在報(bào)送過(guò)程中的準(zhǔn)確性和一致性,避免數(shù)據(jù)錯(cuò)誤和歧義。本次試卷答案如下一、單項(xiàng)選擇題答案及解析1.D解析:數(shù)據(jù)錄入的隨機(jī)抽查不屬于關(guān)鍵質(zhì)量控制環(huán)節(jié)。關(guān)鍵環(huán)節(jié)應(yīng)聚焦于源頭、傳輸和格式的一致性。2.C解析:邏輯回歸模型的優(yōu)勢(shì)在于計(jì)算效率高,適合大規(guī)模數(shù)據(jù)。解釋性強(qiáng)是線性回歸的特點(diǎn)。3.C解析:聚類分析是數(shù)據(jù)挖掘技術(shù),用于發(fā)現(xiàn)數(shù)據(jù)分組,不屬于異常值處理方法。其余均為常用方法。4.D解析:數(shù)據(jù)完整性校驗(yàn)主要關(guān)注數(shù)據(jù)是否完整,不包括報(bào)送時(shí)間是否延遲。其余均為完整性校驗(yàn)內(nèi)容。5.D解析:主成分分析是降維技術(shù),不屬于變量篩選方法。其余均為常用篩選方法。6.D解析:數(shù)據(jù)脫敏是數(shù)據(jù)匿名化技術(shù),不屬于加密技術(shù)。其余均為加密技術(shù)。7.D解析:相關(guān)系數(shù)是衡量線性相關(guān)性的指標(biāo),不屬于模型評(píng)估指標(biāo)。其余均為常用評(píng)估指標(biāo)。8.E解析:數(shù)據(jù)采集頻率的設(shè)定不屬于合法性驗(yàn)證內(nèi)容。其余均為合法性驗(yàn)證內(nèi)容。9.D解析:邏輯變換不是變量轉(zhuǎn)換方法。其余均為常用轉(zhuǎn)換方法。10.D解析:數(shù)據(jù)報(bào)送時(shí)間是否一致屬于數(shù)據(jù)一致性校驗(yàn)內(nèi)容。其余均為一致性校驗(yàn)內(nèi)容。11.D解析:數(shù)據(jù)重采樣不是模型優(yōu)化方法。其余均為常用優(yōu)化方法。12.D解析:均值替換是缺失值處理方法,不是重復(fù)數(shù)據(jù)處理方法。其余均為重復(fù)數(shù)據(jù)處理方法。13.D解析:數(shù)據(jù)報(bào)送時(shí)間是否延遲屬于數(shù)據(jù)完整性校驗(yàn)內(nèi)容。其余均為完整性校驗(yàn)內(nèi)容。14.D解析:主成分分析是降維技術(shù),不屬于變量篩選方法。其余均為常用篩選方法。15.D解析:數(shù)據(jù)脫敏是數(shù)據(jù)匿名化技術(shù),不屬于加密技術(shù)。其余均為加密技術(shù)。16.D解析:相關(guān)系數(shù)是衡量線性相關(guān)性的指標(biāo),不屬于模型評(píng)估指標(biāo)。其余均為常用評(píng)估指標(biāo)。17.E解析:數(shù)據(jù)采集成本的核算不屬于合法性驗(yàn)證內(nèi)容。其余均為合法性驗(yàn)證內(nèi)容。18.D解析:邏輯變換不是變量轉(zhuǎn)換方法。其余均為常用轉(zhuǎn)換方法。19.D解析:數(shù)據(jù)報(bào)送時(shí)間是否一致屬于數(shù)據(jù)一致性校驗(yàn)內(nèi)容。其余均為一致性校驗(yàn)內(nèi)容。20.D解析:數(shù)據(jù)重采樣不是模型優(yōu)化方法。其余均為常用優(yōu)化方法。二、多項(xiàng)選擇題答案及解析1.ABCD解析:數(shù)據(jù)清洗方法包括缺失值處理、異常值處理、重復(fù)數(shù)據(jù)處理和數(shù)據(jù)格式轉(zhuǎn)換。數(shù)據(jù)標(biāo)準(zhǔn)化屬于數(shù)據(jù)預(yù)處理,不屬于清洗方法。2.ABCD解析:變量篩選方法包括卡方檢驗(yàn)、相關(guān)性分析、逐步回歸和主成分分析。聚類分析屬于數(shù)據(jù)挖掘技術(shù),不屬于變量篩選方法。3.ABC解析:數(shù)據(jù)加密技術(shù)包括對(duì)稱加密、非對(duì)稱加密和哈希加密。數(shù)據(jù)脫敏屬于數(shù)據(jù)匿名化技術(shù),不屬于加密技術(shù)。4.ABCD解析:變量轉(zhuǎn)換方法包括標(biāo)準(zhǔn)化、縮放化、對(duì)數(shù)變換和邏輯變換。數(shù)據(jù)離散化屬于數(shù)據(jù)預(yù)處理,不屬于轉(zhuǎn)換方法。5.ABCD解析:數(shù)據(jù)完整性校驗(yàn)包括數(shù)據(jù)項(xiàng)是否缺失、數(shù)據(jù)格式是否正確、數(shù)據(jù)值是否在合理范圍內(nèi)、數(shù)據(jù)報(bào)送時(shí)間是否延遲。數(shù)據(jù)報(bào)送頻率是否一致不屬于完整性校驗(yàn)內(nèi)容。6.ABCD解析:模型評(píng)估指標(biāo)包括準(zhǔn)確率、召回率、F1分?jǐn)?shù)和AUC值。相關(guān)系數(shù)是衡量線性相關(guān)性的指標(biāo),不屬于模型評(píng)估指標(biāo)。7.ABC解析:數(shù)據(jù)來(lái)源的合法性驗(yàn)證包括數(shù)據(jù)提供者的資質(zhì)審查、數(shù)據(jù)采集協(xié)議的簽訂和數(shù)據(jù)使用范圍的明確。數(shù)據(jù)采集成本的核算不屬于合法性驗(yàn)證內(nèi)容。8.ABCD解析:模型優(yōu)化方法包括參數(shù)調(diào)整、特征工程、模型集成和數(shù)據(jù)重采樣。模型驗(yàn)證是模型評(píng)估環(huán)節(jié),不屬于優(yōu)化方法。9.ABCD解析:數(shù)據(jù)一致性校驗(yàn)包括數(shù)據(jù)項(xiàng)的命名是否一致、數(shù)據(jù)值的單位是否一致、數(shù)據(jù)格式是否一致、數(shù)據(jù)報(bào)送時(shí)間是否一致。數(shù)據(jù)報(bào)送頻率是否一致不屬于一致性校驗(yàn)內(nèi)容。10.ABCD解析:模型解釋方法包括決策樹(shù)可視化、特征重要性排序、LIME解釋和SHAP值解釋。相關(guān)性分析是數(shù)據(jù)探索技術(shù),不屬于模型解釋方法。三、判斷題答案及解析1.×解析:缺失值處理應(yīng)根據(jù)具體情況選擇方法,并非所有缺失值都應(yīng)刪除。插補(bǔ)法可以保留數(shù)據(jù)量。2.√解析:變量篩選的目的是減少冗余變量,提高模型泛化能力,避免過(guò)擬合。3.×解析:數(shù)據(jù)加密技術(shù)可以提高數(shù)據(jù)安全性,但不能完全防止數(shù)據(jù)泄露。還需結(jié)合訪問(wèn)控制等安全措施。4.√解析:不同業(yè)務(wù)場(chǎng)景對(duì)模型評(píng)估指標(biāo)的要求不同,應(yīng)根據(jù)實(shí)際需求選擇合適的指標(biāo)。5.√解析:數(shù)據(jù)提供者資質(zhì)審查是確保數(shù)據(jù)合法性的重要環(huán)節(jié),可以避免數(shù)據(jù)來(lái)源問(wèn)題。6.×解析:變量轉(zhuǎn)換的主要目的是為了提高模型預(yù)測(cè)能力,解釋性是次要目的。7.√解析:數(shù)據(jù)完整性校驗(yàn)的主要目的是確保數(shù)據(jù)的完整性和準(zhǔn)確性,避免數(shù)據(jù)錯(cuò)誤。8.√解析:模型優(yōu)化方法的主要目的是提高模型的預(yù)測(cè)準(zhǔn)確性,使其更適用于實(shí)際業(yè)務(wù)。9.√解析:數(shù)據(jù)采集頻率應(yīng)根據(jù)業(yè)務(wù)需求確定,過(guò)高或過(guò)低都會(huì)影響數(shù)據(jù)效用。10.×解析:數(shù)據(jù)脫敏可以隱藏部分敏感信息,但不能完全隱藏。還需結(jié)合其他安全措施。四、簡(jiǎn)答題答案及解析1.答:缺失值處理的主要方法包括刪除法、插補(bǔ)法等。刪除法包括完全刪除含有缺失值的記錄和刪除缺失值所在的列。插補(bǔ)法包括均值插補(bǔ)、中位數(shù)插補(bǔ)、眾數(shù)插補(bǔ)、回歸插補(bǔ)、K最近鄰插補(bǔ)等。解析:缺失值處理是數(shù)據(jù)預(yù)處理的重要環(huán)節(jié),刪除法簡(jiǎn)單但可能導(dǎo)致數(shù)據(jù)損失,插補(bǔ)法可以保留數(shù)據(jù)量但需注意插補(bǔ)方法的合理性。選擇方法應(yīng)考慮缺失比例、數(shù)據(jù)類型和業(yè)務(wù)特點(diǎn)。2.答:變量篩選的主要方法包括卡方檢驗(yàn)、相關(guān)性分析、逐步回歸、Lasso回歸等。卡方檢驗(yàn)主要用于分類變量篩選,相關(guān)性分析用于衡量變量之間的線性關(guān)系,逐步回歸通過(guò)統(tǒng)計(jì)檢驗(yàn)自動(dòng)選擇最優(yōu)變量子集,Lasso

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論