2025年征信考試題庫(kù)(征信數(shù)據(jù)分析挖掘)專(zhuān)業(yè)知識(shí)測(cè)試_第1頁(yè)
2025年征信考試題庫(kù)(征信數(shù)據(jù)分析挖掘)專(zhuān)業(yè)知識(shí)測(cè)試_第2頁(yè)
2025年征信考試題庫(kù)(征信數(shù)據(jù)分析挖掘)專(zhuān)業(yè)知識(shí)測(cè)試_第3頁(yè)
2025年征信考試題庫(kù)(征信數(shù)據(jù)分析挖掘)專(zhuān)業(yè)知識(shí)測(cè)試_第4頁(yè)
2025年征信考試題庫(kù)(征信數(shù)據(jù)分析挖掘)專(zhuān)業(yè)知識(shí)測(cè)試_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025年征信考試題庫(kù)(征信數(shù)據(jù)分析挖掘)專(zhuān)業(yè)知識(shí)測(cè)試考試時(shí)間:______分鐘總分:______分姓名:______一、單項(xiàng)選擇題(本部分共25題,每題1分,共25分。每題只有一個(gè)正確答案,請(qǐng)將正確答案的序號(hào)填在題后的括號(hào)內(nèi)。)1.在征信數(shù)據(jù)分析中,下列哪項(xiàng)指標(biāo)最能反映個(gè)人的長(zhǎng)期償債能力?()A.流動(dòng)比率B.速動(dòng)比率C.資產(chǎn)負(fù)債率D.利息保障倍數(shù)2.當(dāng)征信數(shù)據(jù)中出現(xiàn)大量缺失值時(shí),以下哪種處理方法最為常見(jiàn)且有效?()A.直接刪除含有缺失值的樣本B.使用均值或中位數(shù)填補(bǔ)缺失值C.采用K近鄰(KNN)算法填補(bǔ)缺失值D.將缺失值視為一個(gè)獨(dú)立類(lèi)別進(jìn)行處理3.在征信評(píng)分模型中,邏輯回歸模型的主要優(yōu)勢(shì)是什么?()A.能夠處理非線性關(guān)系B.模型解釋性強(qiáng),易于理解C.計(jì)算效率高,適合大規(guī)模數(shù)據(jù)D.對(duì)異常值不敏感4.下列哪項(xiàng)指標(biāo)通常被用來(lái)衡量征信數(shù)據(jù)的質(zhì)量?()A.相關(guān)系數(shù)B.卡方檢驗(yàn)C.Kappa系數(shù)D.信噪比5.在征信數(shù)據(jù)分析中,如何處理時(shí)間序列數(shù)據(jù)中的季節(jié)性波動(dòng)?()A.使用移動(dòng)平均法B.采用差分法C.通過(guò)季節(jié)性分解法D.以上都是6.征信數(shù)據(jù)中的“五級(jí)分類(lèi)”(正常、關(guān)注、次級(jí)、可疑、損失)屬于哪種數(shù)據(jù)類(lèi)型?()A.數(shù)值型數(shù)據(jù)B.順序型數(shù)據(jù)C.名義型數(shù)據(jù)D.時(shí)間序列數(shù)據(jù)7.在構(gòu)建征信評(píng)分模型時(shí),以下哪項(xiàng)是過(guò)擬合的典型表現(xiàn)?()A.模型在訓(xùn)練集上的表現(xiàn)好,但在測(cè)試集上表現(xiàn)差B.模型在訓(xùn)練集和測(cè)試集上的表現(xiàn)都差C.模型訓(xùn)練時(shí)間過(guò)長(zhǎng)D.模型參數(shù)過(guò)多8.征信數(shù)據(jù)中的“逾期天數(shù)”通常屬于哪種數(shù)據(jù)分布?()A.正態(tài)分布B.指數(shù)分布C.泊松分布D.威布爾分布9.在征信數(shù)據(jù)分析中,以下哪項(xiàng)技術(shù)可以用來(lái)識(shí)別異常值?()A.獨(dú)立成分分析(ICA)B.主成分分析(PCA)C.線性判別分析(LDA)D.基于密度的異常值檢測(cè)(DBSCAN)10.征信數(shù)據(jù)中的“月收入”屬于哪種變量類(lèi)型?()A.分類(lèi)變量B.連續(xù)變量C.時(shí)間序列變量D.布爾變量11.在征信數(shù)據(jù)分析中,如何處理數(shù)據(jù)中的多重共線性問(wèn)題?()A.增加樣本量B.使用嶺回歸或Lasso回歸C.對(duì)變量進(jìn)行標(biāo)準(zhǔn)化D.刪除相關(guān)性較高的變量12.征信數(shù)據(jù)中的“查詢次數(shù)”通常與哪個(gè)指標(biāo)相關(guān)?()A.信用評(píng)分B.逾期概率C.貸款金額D.還款能力13.在征信數(shù)據(jù)分析中,以下哪項(xiàng)指標(biāo)可以用來(lái)衡量模型的魯棒性?()A.AUC(ROC曲線下面積)B.RMSE(均方根誤差)C.MAE(平均絕對(duì)誤差)D.Kappa系數(shù)14.征信數(shù)據(jù)中的“擔(dān)保情況”屬于哪種數(shù)據(jù)類(lèi)型?()A.數(shù)值型數(shù)據(jù)B.順序型數(shù)據(jù)C.名義型數(shù)據(jù)D.時(shí)間序列數(shù)據(jù)15.在構(gòu)建征信評(píng)分模型時(shí),以下哪項(xiàng)是欠擬合的典型表現(xiàn)?()A.模型在訓(xùn)練集和測(cè)試集上的表現(xiàn)都差B.模型在訓(xùn)練集上的表現(xiàn)好,但在測(cè)試集上表現(xiàn)差C.模型訓(xùn)練時(shí)間過(guò)長(zhǎng)D.模型參數(shù)過(guò)少16.征信數(shù)據(jù)中的“負(fù)債比率”通常屬于哪種數(shù)據(jù)類(lèi)型?()A.分類(lèi)變量B.連續(xù)變量C.時(shí)間序列變量D.布爾變量17.在征信數(shù)據(jù)分析中,如何處理數(shù)據(jù)中的不平衡問(wèn)題?()A.增加樣本量B.使用過(guò)采樣或欠采樣技術(shù)C.對(duì)變量進(jìn)行標(biāo)準(zhǔn)化D.刪除不平衡的樣本18.征信數(shù)據(jù)中的“信用額度”通常與哪個(gè)指標(biāo)相關(guān)?()A.信用評(píng)分B.逾期概率C.貸款金額D.還款能力19.在征信數(shù)據(jù)分析中,以下哪項(xiàng)技術(shù)可以用來(lái)進(jìn)行特征選擇?()A.決策樹(shù)B.Lasso回歸C.線性回歸D.神經(jīng)網(wǎng)絡(luò)20.征信數(shù)據(jù)中的“還款記錄”屬于哪種數(shù)據(jù)類(lèi)型?()A.數(shù)值型數(shù)據(jù)B.順序型數(shù)據(jù)C.名義型數(shù)據(jù)D.時(shí)間序列數(shù)據(jù)21.在構(gòu)建征信評(píng)分模型時(shí),以下哪項(xiàng)是模型過(guò)擬合的典型表現(xiàn)?()A.模型在訓(xùn)練集上的表現(xiàn)好,但在測(cè)試集上表現(xiàn)差B.模型在訓(xùn)練集和測(cè)試集上的表現(xiàn)都差C.模型訓(xùn)練時(shí)間過(guò)長(zhǎng)D.模型參數(shù)過(guò)少22.征信數(shù)據(jù)中的“查詢次數(shù)”通常與哪個(gè)指標(biāo)相關(guān)?()A.信用評(píng)分B.逾期概率C.貸款金額D.還款能力23.在征信數(shù)據(jù)分析中,如何處理數(shù)據(jù)中的多重共線性問(wèn)題?()A.增加樣本量B.使用嶺回歸或Lasso回歸C.對(duì)變量進(jìn)行標(biāo)準(zhǔn)化D.刪除相關(guān)性較高的變量24.征信數(shù)據(jù)中的“擔(dān)保情況”屬于哪種數(shù)據(jù)類(lèi)型?()A.數(shù)值型數(shù)據(jù)B.順序型數(shù)據(jù)C.名義型數(shù)據(jù)D.時(shí)間序列數(shù)據(jù)25.在征信數(shù)據(jù)分析中,以下哪項(xiàng)技術(shù)可以用來(lái)進(jìn)行異常值檢測(cè)?()A.獨(dú)立成分分析(ICA)B.主成分分析(PCA)C.線性判別分析(LDA)D.基于密度的異常值檢測(cè)(DBSCAN)二、多項(xiàng)選擇題(本部分共15題,每題2分,共30分。每題有多個(gè)正確答案,請(qǐng)將正確答案的序號(hào)填在題后的括號(hào)內(nèi)。)1.在征信數(shù)據(jù)分析中,以下哪些指標(biāo)可以用來(lái)衡量個(gè)人的償債能力?()A.流動(dòng)比率B.速動(dòng)比率C.資產(chǎn)負(fù)債率D.利息保障倍數(shù)2.征信數(shù)據(jù)中的缺失值處理方法包括哪些?()A.直接刪除含有缺失值的樣本B.使用均值或中位數(shù)填補(bǔ)缺失值C.采用K近鄰(KNN)算法填補(bǔ)缺失值D.將缺失值視為一個(gè)獨(dú)立類(lèi)別進(jìn)行處理3.邏輯回歸模型的優(yōu)勢(shì)包括哪些?()A.能夠處理非線性關(guān)系B.模型解釋性強(qiáng),易于理解C.計(jì)算效率高,適合大規(guī)模數(shù)據(jù)D.對(duì)異常值不敏感4.征信數(shù)據(jù)的質(zhì)量衡量指標(biāo)包括哪些?()A.相關(guān)系數(shù)B.卡方檢驗(yàn)C.Kappa系數(shù)D.信噪比5.在處理時(shí)間序列數(shù)據(jù)中的季節(jié)性波動(dòng)時(shí),可以采用哪些方法?()A.使用移動(dòng)平均法B.采用差分法C.通過(guò)季節(jié)性分解法D.以上都是6.征信數(shù)據(jù)中的“五級(jí)分類(lèi)”(正常、關(guān)注、次級(jí)、可疑、損失)屬于哪些數(shù)據(jù)類(lèi)型?()A.數(shù)值型數(shù)據(jù)B.順序型數(shù)據(jù)C.名義型數(shù)據(jù)D.時(shí)間序列數(shù)據(jù)7.構(gòu)建征信評(píng)分模型時(shí),過(guò)擬合的典型表現(xiàn)有哪些?()A.模型在訓(xùn)練集上的表現(xiàn)好,但在測(cè)試集上表現(xiàn)差B.模型在訓(xùn)練集和測(cè)試集上的表現(xiàn)都差C.模型訓(xùn)練時(shí)間過(guò)長(zhǎng)D.模型參數(shù)過(guò)多8.征信數(shù)據(jù)中的“逾期天數(shù)”通常屬于哪些數(shù)據(jù)分布?()A.正態(tài)分布B.指數(shù)分布C.泊松分布D.威布爾分布9.征信數(shù)據(jù)分析中,可以用來(lái)識(shí)別異常值的技術(shù)有哪些?()A.獨(dú)立成分分析(ICA)B.主成分分析(PCA)C.線性判別分析(LDA)D.基于密度的異常值檢測(cè)(DBSCAN)10.征信數(shù)據(jù)中的“月收入”屬于哪些變量類(lèi)型?()A.分類(lèi)變量B.連續(xù)變量C.時(shí)間序列變量D.布爾變量11.征信數(shù)據(jù)分析中,處理數(shù)據(jù)中的多重共線性問(wèn)題的方法有哪些?()A.增加樣本量B.使用嶺回歸或Lasso回歸C.對(duì)變量進(jìn)行標(biāo)準(zhǔn)化D.刪除相關(guān)性較高的變量12.征信數(shù)據(jù)中的“查詢次數(shù)”通常與哪些指標(biāo)相關(guān)?()A.信用評(píng)分B.逾期概率C.貸款金額D.還款能力13.征信數(shù)據(jù)分析中,可以用來(lái)衡量模型魯棒性的指標(biāo)有哪些?()A.AUC(ROC曲線下面積)B.RMSE(均方根誤差)C.MAE(平均絕對(duì)誤差)D.Kappa系數(shù)14.征信數(shù)據(jù)中的“擔(dān)保情況”屬于哪些數(shù)據(jù)類(lèi)型?()A.數(shù)值型數(shù)據(jù)B.順序型數(shù)據(jù)C.名義型數(shù)據(jù)D.時(shí)間序列數(shù)據(jù)15.征信數(shù)據(jù)分析中,可以用來(lái)進(jìn)行異常值檢測(cè)的技術(shù)有哪些?()A.獨(dú)立成分分析(ICA)B.主成分分析(PCA)C.線性判別分析(LDA)D.基于密度的異常值檢測(cè)(DBSCAN)三、判斷題(本部分共20題,每題1分,共20分。請(qǐng)將判斷結(jié)果填在題后的括號(hào)內(nèi),正確的填“√”,錯(cuò)誤的填“×”。)1.在征信數(shù)據(jù)分析中,流動(dòng)比率越高,個(gè)人的短期償債能力越強(qiáng)。()2.征信數(shù)據(jù)中的缺失值處理方法包括直接刪除、均值填補(bǔ)、中位數(shù)填補(bǔ)等。()3.邏輯回歸模型是一種非線性模型,適用于處理復(fù)雜關(guān)系。()4.征信數(shù)據(jù)的質(zhì)量衡量指標(biāo)包括信噪比、卡方檢驗(yàn)等。()5.在處理時(shí)間序列數(shù)據(jù)中的季節(jié)性波動(dòng)時(shí),可以使用季節(jié)性分解法。()6.征信數(shù)據(jù)中的“五級(jí)分類(lèi)”(正常、關(guān)注、次級(jí)、可疑、損失)屬于順序型數(shù)據(jù)。()7.構(gòu)建征信評(píng)分模型時(shí),過(guò)擬合的典型表現(xiàn)是模型在訓(xùn)練集上的表現(xiàn)好,但在測(cè)試集上表現(xiàn)差。()8.征信數(shù)據(jù)中的“逾期天數(shù)”通常屬于正態(tài)分布。()9.征信數(shù)據(jù)分析中,可以用來(lái)識(shí)別異常值的技術(shù)包括DBSCAN。()10.征信數(shù)據(jù)中的“月收入”屬于連續(xù)變量。()11.征信數(shù)據(jù)分析中,處理數(shù)據(jù)中的多重共線性問(wèn)題的方法包括使用嶺回歸。()12.征信數(shù)據(jù)中的“查詢次數(shù)”通常與信用評(píng)分相關(guān)。()13.征信數(shù)據(jù)分析中,可以用來(lái)衡量模型魯棒性的指標(biāo)包括AUC。()14.征信數(shù)據(jù)中的“擔(dān)保情況”屬于名義型數(shù)據(jù)。()15.征信數(shù)據(jù)分析中,可以用來(lái)進(jìn)行異常值檢測(cè)的技術(shù)包括PCA。()16.在征信數(shù)據(jù)分析中,使用過(guò)采樣技術(shù)可以解決數(shù)據(jù)不平衡問(wèn)題。()17.征信數(shù)據(jù)中的“負(fù)債比率”通常屬于連續(xù)變量。()18.在構(gòu)建征信評(píng)分模型時(shí),欠擬合的典型表現(xiàn)是模型在訓(xùn)練集和測(cè)試集上的表現(xiàn)都差。()19.征信數(shù)據(jù)中的“還款記錄”屬于順序型數(shù)據(jù)。()20.征信數(shù)據(jù)分析中,使用移動(dòng)平均法可以處理時(shí)間序列數(shù)據(jù)中的季節(jié)性波動(dòng)。()四、簡(jiǎn)答題(本部分共5題,每題4分,共20分。請(qǐng)根據(jù)題目要求進(jìn)行簡(jiǎn)答。)1.簡(jiǎn)述征信數(shù)據(jù)分析中,如何處理數(shù)據(jù)中的缺失值。()2.解釋征信評(píng)分模型中,過(guò)擬合和欠擬合的區(qū)別。()3.描述征信數(shù)據(jù)分析中,如何處理時(shí)間序列數(shù)據(jù)中的季節(jié)性波動(dòng)。()4.說(shuō)明征信數(shù)據(jù)中的“五級(jí)分類(lèi)”(正常、關(guān)注、次級(jí)、可疑、損失)屬于哪種數(shù)據(jù)類(lèi)型,并解釋原因。()5.列舉征信數(shù)據(jù)分析中,可以用來(lái)識(shí)別異常值的技術(shù),并簡(jiǎn)要說(shuō)明其原理。()本次試卷答案如下一、單項(xiàng)選擇題答案及解析1.C資產(chǎn)負(fù)債率最能反映個(gè)人的長(zhǎng)期償債能力。解析:資產(chǎn)負(fù)債率是總負(fù)債除以總資產(chǎn),反映了個(gè)人的長(zhǎng)期負(fù)債水平,比率越高,長(zhǎng)期償債能力越弱。流動(dòng)比率和速動(dòng)比率主要反映短期償債能力,利息保障倍數(shù)反映的是利息支付能力,但資產(chǎn)負(fù)債率更能體現(xiàn)長(zhǎng)期負(fù)債負(fù)擔(dān)。2.B使用均值或中位數(shù)填補(bǔ)缺失值是最常見(jiàn)且有效的方法。解析:直接刪除樣本會(huì)導(dǎo)致數(shù)據(jù)量減少,影響模型效果。均值和中位數(shù)填補(bǔ)簡(jiǎn)單易行,能有效保留數(shù)據(jù)信息。KNN填補(bǔ)需要計(jì)算距離,計(jì)算量大。將缺失值視為獨(dú)立類(lèi)別處理適用于分類(lèi)問(wèn)題,但不適用于數(shù)值型數(shù)據(jù)。3.B邏輯回歸模型的主要優(yōu)勢(shì)是模型解釋性強(qiáng),易于理解。解析:邏輯回歸模型輸出結(jié)果可以直接解釋為概率,系數(shù)可以解釋為對(duì)數(shù)幾率變化。雖然它不能處理復(fù)雜的非線性關(guān)系,但解釋性強(qiáng)是主要優(yōu)勢(shì)。計(jì)算效率高不是其主要優(yōu)勢(shì),對(duì)異常值敏感是其缺點(diǎn)。4.D信噪比通常被用來(lái)衡量征信數(shù)據(jù)的質(zhì)量。解析:信噪比是信號(hào)功率與噪聲功率的比值,可以反映數(shù)據(jù)的純凈程度。相關(guān)系數(shù)反映變量間關(guān)系,卡方檢驗(yàn)用于分類(lèi)數(shù)據(jù)獨(dú)立性檢驗(yàn),Kappa系數(shù)用于衡量一致性,都不適用于衡量數(shù)據(jù)質(zhì)量。5.D以上都是。解析:移動(dòng)平均法可以平滑短期波動(dòng),差分法可以消除趨勢(shì)和季節(jié)性,季節(jié)性分解法可以直接分離季節(jié)成分,都是處理季節(jié)性波動(dòng)的常用方法。6.B“五級(jí)分類(lèi)”(正常、關(guān)注、次級(jí)、可疑、損失)屬于順序型數(shù)據(jù)。解析:這些類(lèi)別有明確的順序關(guān)系,但類(lèi)別間差值無(wú)實(shí)際意義,屬于順序型數(shù)據(jù)。名義型數(shù)據(jù)沒(méi)有順序關(guān)系,數(shù)值型數(shù)據(jù)有實(shí)際數(shù)值意義,時(shí)間序列數(shù)據(jù)按時(shí)間排列。7.A模型在訓(xùn)練集上的表現(xiàn)好,但在測(cè)試集上表現(xiàn)差是過(guò)擬合的典型表現(xiàn)。解析:過(guò)擬合是模型對(duì)訓(xùn)練數(shù)據(jù)擬合過(guò)度,學(xué)習(xí)到了噪聲,導(dǎo)致泛化能力差。其他選項(xiàng)不是過(guò)擬合的表現(xiàn),過(guò)擬合與模型復(fù)雜度有關(guān),與訓(xùn)練時(shí)間無(wú)關(guān)。8.B“逾期天數(shù)”通常屬于指數(shù)分布。解析:逾期天數(shù)通常集中在較小值,符合指數(shù)分布特征。正態(tài)分布對(duì)稱(chēng),泊松分布適用于計(jì)數(shù),威布爾分布適用于壽命分析,都不符合逾期天數(shù)的特征。9.D基于密度的異常值檢測(cè)(DBSCAN)可以用來(lái)識(shí)別異常值。解析:DBSCAN根據(jù)密度區(qū)分核心點(diǎn)、邊界點(diǎn)和噪聲點(diǎn),能有效識(shí)別異常值。ICA和PCA主要用于降維,LDA用于分類(lèi),不適用于異常值檢測(cè)。10.B“月收入”屬于連續(xù)變量。解析:月收入可以是任意實(shí)數(shù),屬于連續(xù)變量。分類(lèi)變量是離散的,時(shí)間序列變量按時(shí)間排列,布爾變量只有true/false。11.B使用嶺回歸或Lasso回歸可以處理數(shù)據(jù)中的多重共線性問(wèn)題。解析:嶺回歸和Lasso回歸通過(guò)添加懲罰項(xiàng),可以收縮系數(shù),減少共線性影響。增加樣本量和標(biāo)準(zhǔn)化對(duì)共線性影響不大,刪除變量可能丟失信息。12.A“查詢次數(shù)”通常與信用評(píng)分相關(guān)。解析:查詢次數(shù)多可能意味著信用需求大,影響信用評(píng)分。逾期概率與還款歷史更相關(guān),貸款金額與收入相關(guān),還款能力綜合多種因素。13.AAUC(ROC曲線下面積)可以用來(lái)衡量模型的魯棒性。解析:AUC反映模型區(qū)分正負(fù)樣本的能力,值越高越魯棒。RMSE和MAE是損失函數(shù),Kappa系數(shù)衡量一致性,不適用于衡量魯棒性。14.C“擔(dān)保情況”屬于名義型數(shù)據(jù)。解析:擔(dān)保情況是離散的分類(lèi),沒(méi)有順序關(guān)系,屬于名義型數(shù)據(jù)。數(shù)值型數(shù)據(jù)有實(shí)際數(shù)值,順序型數(shù)據(jù)有順序關(guān)系,時(shí)間序列數(shù)據(jù)按時(shí)間排列。15.A模型在訓(xùn)練集上的表現(xiàn)好,但在測(cè)試集上表現(xiàn)差是過(guò)擬合的典型表現(xiàn)。解析:過(guò)擬合是模型對(duì)訓(xùn)練數(shù)據(jù)擬合過(guò)度,學(xué)習(xí)到了噪聲,導(dǎo)致泛化能力差。其他選項(xiàng)不是過(guò)擬合的表現(xiàn),過(guò)擬合與模型復(fù)雜度有關(guān),與訓(xùn)練時(shí)間無(wú)關(guān)。16.B“負(fù)債比率”通常屬于連續(xù)變量。解析:負(fù)債比率是兩個(gè)數(shù)值的比值,可以是任意實(shí)數(shù),屬于連續(xù)變量。分類(lèi)變量是離散的,時(shí)間序列變量按時(shí)間排列,布爾變量只有true/false。17.B使用過(guò)采樣或欠采樣技術(shù)可以處理數(shù)據(jù)中的不平衡問(wèn)題。解析:過(guò)采樣增加少數(shù)類(lèi)樣本,欠采樣減少多數(shù)類(lèi)樣本,都是解決不平衡的常用方法。增加樣本量和標(biāo)準(zhǔn)化不適用于解決不平衡,刪除不平衡樣本會(huì)丟失信息。18.A“信用額度”通常與信用評(píng)分相關(guān)。解析:信用額度與個(gè)人信用評(píng)分密切相關(guān),評(píng)分高通常額度高。逾期概率與還款歷史更相關(guān),貸款金額與收入相關(guān),還款能力綜合多種因素。19.BLasso回歸可以用來(lái)進(jìn)行特征選擇。解析:Lasso回歸通過(guò)添加L1懲罰項(xiàng),可以將一些系數(shù)壓縮為0,實(shí)現(xiàn)特征選擇。決策樹(shù)可以處理非線性,線性回歸不能特征選擇,神經(jīng)網(wǎng)絡(luò)適用于復(fù)雜模式。20.B“還款記錄”屬于順序型數(shù)據(jù)。解析:還款記錄有正常、逾期等順序關(guān)系,但類(lèi)別間差值無(wú)實(shí)際意義,屬于順序型數(shù)據(jù)。名義型數(shù)據(jù)沒(méi)有順序關(guān)系,數(shù)值型數(shù)據(jù)有實(shí)際數(shù)值意義,時(shí)間序列數(shù)據(jù)按時(shí)間排列。21.A模型在訓(xùn)練集上的表現(xiàn)好,但在測(cè)試集上表現(xiàn)差是過(guò)擬合的典型表現(xiàn)。解析:過(guò)擬合是模型對(duì)訓(xùn)練數(shù)據(jù)擬合過(guò)度,學(xué)習(xí)到了噪聲,導(dǎo)致泛化能力差。其他選項(xiàng)不是過(guò)擬合的表現(xiàn),過(guò)擬合與模型復(fù)雜度有關(guān),與訓(xùn)練時(shí)間無(wú)關(guān)。22.A“查詢次數(shù)”通常與信用評(píng)分相關(guān)。解析:查詢次數(shù)多可能意味著信用需求大,影響信用評(píng)分。逾期概率與還款歷史更相關(guān),貸款金額與收入相關(guān),還款能力綜合多種因素。23.B使用嶺回歸或Lasso回歸可以處理數(shù)據(jù)中的多重共線性問(wèn)題。解析:嶺回歸和Lasso回歸通過(guò)添加懲罰項(xiàng),可以收縮系數(shù),減少共線性影響。增加樣本量和標(biāo)準(zhǔn)化對(duì)共線性影響不大,刪除變量可能丟失信息。24.C“擔(dān)保情況”屬于名義型數(shù)據(jù)。解析:擔(dān)保情況是離散的分類(lèi),沒(méi)有順序關(guān)系,屬于名義型數(shù)據(jù)。數(shù)值型數(shù)據(jù)有實(shí)際數(shù)值意義,順序型數(shù)據(jù)有順序關(guān)系,時(shí)間序列數(shù)據(jù)按時(shí)間排列。25.D基于密度的異常值檢測(cè)(DBSCAN)可以用來(lái)進(jìn)行異常值檢測(cè)。解析:DBSCAN根據(jù)密度區(qū)分核心點(diǎn)、邊界點(diǎn)和噪聲點(diǎn),能有效識(shí)別異常值。ICA和PCA主要用于降維,LDA用于分類(lèi),不適用于異常值檢測(cè)。二、多項(xiàng)選擇題答案及解析1.A、B、C、D流動(dòng)比率、速動(dòng)比率、資產(chǎn)負(fù)債率、利息保障倍數(shù)都可以用來(lái)衡量個(gè)人的償債能力。解析:流動(dòng)比率和速動(dòng)比率反映短期償債能力,資產(chǎn)負(fù)債率反映長(zhǎng)期償債能力,利息保障倍數(shù)反映利息支付能力,都是償債能力的指標(biāo)。2.A、B、C、D直接刪除、均值填補(bǔ)、中位數(shù)填補(bǔ)、將缺失值視為獨(dú)立類(lèi)別處理都是缺失值處理方法。解析:直接刪除簡(jiǎn)單但可能丟失信息,均值和中位數(shù)填補(bǔ)常用,KNN填補(bǔ)效果好但計(jì)算量大,將缺失值視為類(lèi)別適用于分類(lèi)問(wèn)題。3.B、C、D模型解釋性強(qiáng),計(jì)算效率高,適合大規(guī)模數(shù)據(jù)是邏輯回歸模型的優(yōu)勢(shì)。解析:邏輯回歸模型簡(jiǎn)單,解釋性強(qiáng),計(jì)算效率高,但處理非線性能力弱,對(duì)異常值敏感,不能處理復(fù)雜關(guān)系。4.A、C、D信噪比、卡方檢驗(yàn)、Kappa系數(shù)都是數(shù)據(jù)質(zhì)量衡量指標(biāo)。解析:信噪比反映數(shù)據(jù)純凈度,卡方檢驗(yàn)用于分類(lèi)數(shù)據(jù)獨(dú)立性檢驗(yàn),Kappa系數(shù)衡量一致性,都是衡量數(shù)據(jù)質(zhì)量的指標(biāo)。相關(guān)系數(shù)反映變量間關(guān)系,不適用于衡量數(shù)據(jù)質(zhì)量。5.A、B、C使用移動(dòng)平均法、差分法、季節(jié)性分解法都可以處理時(shí)間序列數(shù)據(jù)中的季節(jié)性波動(dòng)。解析:移動(dòng)平均法平滑短期波動(dòng),差分法消除趨勢(shì)和季節(jié)性,季節(jié)性分解法直接分離季節(jié)成分,都是處理季節(jié)性波動(dòng)的常用方法。6.B、C“五級(jí)分類(lèi)”(正常、關(guān)注、次級(jí)、可疑、損失)屬于順序型數(shù)據(jù)。解析:這些類(lèi)別有明確的順序關(guān)系,但類(lèi)別間差值無(wú)實(shí)際意義,屬于順序型數(shù)據(jù)。名義型數(shù)據(jù)沒(méi)有順序關(guān)系,數(shù)值型數(shù)據(jù)有實(shí)際數(shù)值意義,時(shí)間序列數(shù)據(jù)按時(shí)間排列。7.A模型在訓(xùn)練集上的表現(xiàn)好,但在測(cè)試集上表現(xiàn)差是過(guò)擬合的典型表現(xiàn)。解析:過(guò)擬合是模型對(duì)訓(xùn)練數(shù)據(jù)擬合過(guò)度,學(xué)習(xí)到了噪聲,導(dǎo)致泛化能力差。其他選項(xiàng)不是過(guò)擬合的表現(xiàn),過(guò)擬合與模型復(fù)雜度有關(guān),與訓(xùn)練時(shí)間無(wú)關(guān)。8.A、B、C、D正態(tài)分布、指數(shù)分布、泊松分布、威布爾分布都可能適用于“逾期天數(shù)”。解析:逾期天數(shù)通常集中在較小值,符合指數(shù)分布特征。正態(tài)分布對(duì)稱(chēng),泊松分布適用于計(jì)數(shù),威布爾分布適用于壽命分析,都有可能適用。9.C、D線性判別分析(LDA)和基于密度的異常值檢測(cè)(DBSCAN)可以用來(lái)識(shí)別異常值。解析:LDA用于分類(lèi),不適用于異常值檢測(cè)。DBSCAN根據(jù)密度區(qū)分核心點(diǎn)、邊界點(diǎn)和噪聲點(diǎn),能有效識(shí)別異常值。ICA和PCA主要用于降維。10.B、C“月收入”屬于連續(xù)變量。解析:月收入可以是任意實(shí)數(shù),屬于連續(xù)變量。分類(lèi)變量是離散的,時(shí)間序列變量按時(shí)間排列,布爾變量只有true/false。11.B、C、D使用嶺回歸或Lasso回歸、對(duì)變量進(jìn)行標(biāo)準(zhǔn)化、刪除相關(guān)性較高的變量都可以處理數(shù)據(jù)中的多重共線性問(wèn)題。解析:嶺回歸和Lasso回歸通過(guò)添加懲罰項(xiàng),可以收縮系數(shù),減少共線性影響。標(biāo)準(zhǔn)化對(duì)共線性影響不大,刪除變量可能丟失信息。12.A、B、C“查詢次數(shù)”通常與信用評(píng)分、逾期概率、貸款金額相關(guān)。解析:查詢次數(shù)多可能意味著信用需求大,影響信用評(píng)分。逾期概率與還款歷史更相關(guān),貸款金額與收入相關(guān),還款能力綜合多種因素。13.A、DAUC(ROC曲線下面積)和Kappa系數(shù)可以用來(lái)衡量模型的魯棒性。解析:AUC反映模型區(qū)分正負(fù)樣本的能力,值越高越魯棒。Kappa系數(shù)衡量一致性,也反映魯棒性。RMSE和MAE是損失函數(shù),不適用于衡量魯棒性。14.B、C“擔(dān)保情況”屬于順序型數(shù)據(jù)。解析:擔(dān)保情況有正常、逾期等順序關(guān)系,但類(lèi)別間差值無(wú)實(shí)際意義,屬于順序型數(shù)據(jù)。名義型數(shù)據(jù)沒(méi)有順序關(guān)系,數(shù)值型數(shù)據(jù)有實(shí)際數(shù)值意義,時(shí)間序列數(shù)據(jù)按時(shí)間排列。15.B、D主成分分析(PCA)和基于密度的異常值檢測(cè)(DBSCAN)可以用來(lái)進(jìn)行異常值檢測(cè)。解析:PCA用于降維,不適用于異常值檢測(cè)。DBSCAN根據(jù)密度區(qū)分核心點(diǎn)、邊界點(diǎn)和噪聲點(diǎn),能有效識(shí)別異常值。ICA和LDA不適用于異常值檢測(cè)。三、判斷題答案及解析1.√流動(dòng)比率越高,個(gè)人的短期償債能力越強(qiáng)。解析:流動(dòng)比率是流動(dòng)資產(chǎn)除以流動(dòng)負(fù)債,比率越高,短期償債能力越強(qiáng)。2.√征信數(shù)據(jù)中的缺失值處理方法包括直接刪除、均值填補(bǔ)、中位數(shù)填補(bǔ)等。解析:直接刪除簡(jiǎn)單但可能丟失信息,均值和中位數(shù)填補(bǔ)常用,KNN填補(bǔ)效果好但計(jì)算量大,將缺失值視為類(lèi)別適用于分類(lèi)問(wèn)題。3.×邏輯回歸模型是一種線性模型,適用于處理線性關(guān)系。解析:邏輯回歸模型是線性模型,不能處理復(fù)雜的非線性關(guān)系。決策樹(shù)可以處理非線性,Lasso回歸可以處理非線性關(guān)系,但邏輯回歸本身是線性的。4.√信噪比通常被用來(lái)衡量征信數(shù)據(jù)的質(zhì)量。解析:信噪比是信號(hào)功率與噪聲功率的比值,可以反映數(shù)據(jù)的純凈程度。相關(guān)系數(shù)反映變量間關(guān)系,卡方檢驗(yàn)用于分類(lèi)數(shù)據(jù)獨(dú)立性檢驗(yàn),Kappa系數(shù)用于衡量一致性,都不適用于衡量數(shù)據(jù)質(zhì)量。5.√在處理時(shí)間序列數(shù)據(jù)中的季節(jié)性波動(dòng)時(shí),可以使用季節(jié)性分解法。解析:季節(jié)性分解法可以直接分離季節(jié)成分,是處理季節(jié)性波動(dòng)的常用方法。移動(dòng)平均法和差分法也可以處理,但季節(jié)性分解法更直接。6.√“五級(jí)分類(lèi)”(正常、關(guān)注、次級(jí)、可疑、損失)屬于順序型數(shù)據(jù)。解析:這些類(lèi)別有明確的順序關(guān)系,但類(lèi)別間差值無(wú)實(shí)際意義,屬于順序型數(shù)據(jù)。名義型數(shù)據(jù)沒(méi)有順序關(guān)系,數(shù)值型數(shù)據(jù)有實(shí)際數(shù)值意義,時(shí)間序列數(shù)據(jù)按時(shí)間排列。7.√模型在訓(xùn)練集上的表現(xiàn)好,但在測(cè)試集上表現(xiàn)差是過(guò)擬合的典型表現(xiàn)。解析:過(guò)擬合是模型對(duì)訓(xùn)練數(shù)據(jù)擬合過(guò)度,學(xué)習(xí)到了噪聲,導(dǎo)致泛化能力差。其他選項(xiàng)不是過(guò)擬合的表現(xiàn),過(guò)擬合與模型復(fù)雜度有關(guān),與訓(xùn)練時(shí)間無(wú)關(guān)。8.ד逾期天數(shù)”通常屬于指數(shù)分布。解析:逾期天數(shù)通常集中在較小值,符合指數(shù)分布特征。正態(tài)分布對(duì)稱(chēng),泊松分布適用于計(jì)數(shù),威布爾分布適用于壽命分析,都不符合逾期天數(shù)的特征。9.√征信數(shù)據(jù)分析中,可以用來(lái)識(shí)別異常值的技術(shù)包括DBSCAN。解析:DBSCAN根據(jù)密度區(qū)分核心點(diǎn)、邊界點(diǎn)和噪聲點(diǎn),能有效識(shí)別異常值。ICA和PCA主要用于降維,LDA用于分類(lèi),不適用于異常值檢測(cè)。10.√征信數(shù)據(jù)中的“月收入”屬于連續(xù)變量。解析:月收入可以是任意實(shí)數(shù),屬于連續(xù)變量。分類(lèi)變量是離散的,時(shí)間序列變量按時(shí)間排列,布爾變量只有true/false。11.√征信數(shù)據(jù)分析中,處理數(shù)據(jù)中的多重共線性問(wèn)題的方法包括使用嶺回歸。解析:嶺回歸通過(guò)添加懲罰項(xiàng),可以收縮系數(shù),減少共線性影響。增加樣本量和標(biāo)準(zhǔn)化對(duì)共線性影響不大,刪除變量可能丟失信

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論