2025年統(tǒng)計(jì)學(xué)期末考試題庫(kù):統(tǒng)計(jì)與決策機(jī)器學(xué)習(xí)試題_第1頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試題庫(kù):統(tǒng)計(jì)與決策機(jī)器學(xué)習(xí)試題_第2頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試題庫(kù):統(tǒng)計(jì)與決策機(jī)器學(xué)習(xí)試題_第3頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試題庫(kù):統(tǒng)計(jì)與決策機(jī)器學(xué)習(xí)試題_第4頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試題庫(kù):統(tǒng)計(jì)與決策機(jī)器學(xué)習(xí)試題_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025年統(tǒng)計(jì)學(xué)期末考試題庫(kù):統(tǒng)計(jì)與決策機(jī)器學(xué)習(xí)試題考試時(shí)間:______分鐘總分:______分姓名:______一、選擇題1.設(shè)總體服從正態(tài)分布\(N(\mu,\sigma^2)\),其中\(zhòng)(\sigma^2\)未知,若從該總體中抽取樣本容量為\(n\)的樣本,則\(\mu\)的\(100(1-\alpha)\%\)置信區(qū)間為()。A.\(\left(\bar{X}-t_{\alpha/2,n-1}\frac{s}{\sqrt{n}},\bar{X}+t_{\alpha/2,n-1}\frac{s}{\sqrt{n}}\right)\)B.\(\left(\bar{X}-z_{\alpha/2}\frac{\sigma}{\sqrt{n}},\bar{X}+z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right)\)C.\(\left(\bar{X}-z_{\alpha/2}\frac{s}{\sqrt{n}},\bar{X}+z_{\alpha/2}\frac{s}{\sqrt{n}}\right)\)D.\(\left(\bar{X}-t_{\alpha/2,n-1}\frac{\sigma}{\sqrt{n}},\bar{X}+t_{\alpha/2,n-1}\frac{\sigma}{\sqrt{n}}\right)\)2.在假設(shè)檢驗(yàn)中,犯第一類(lèi)錯(cuò)誤是指()。A.\(H_0\)為真,接受\(H_0\)B.\(H_0\)為假,拒絕\(H_0\)C.\(H_0\)為真,拒絕\(H_0\)D.\(H_0\)為假,接受\(H_0\)3.設(shè)\(X_1,X_2,\ldots,X_n\)是來(lái)自總體\(X\)的樣本,若\(X\)服從泊松分布\(\text{Poisson}(\lambda)\),則樣本均值\(\bar{X}\)的期望和方差分別為()。A.\(\lambda,\frac{\lambda}{n}\)B.\(\lambda,\lambda\)C.\(n\lambda,\frac{\lambda}{n}\)D.\(n\lambda,n\lambda\)4.在多元線性回歸模型\(Y=\beta_0+\beta_1X_1+\beta_2X_2+\cdots+\beta_pX_p+\epsilon\)中,若\(R^2=0.8\),則模型解釋了因變量\(Y\)變化的()。A.10%B.20%C.80%D.100%5.下列關(guān)于線性回歸模型的說(shuō)法錯(cuò)誤的是()。A.線性回歸模型假設(shè)誤差項(xiàng)\(\epsilon\)服從正態(tài)分布B.線性回歸模型假設(shè)自變量\(X_i\)是隨機(jī)變量C.線性回歸模型假設(shè)自變量之間不存在多重共線性D.線性回歸模型可以通過(guò)最小二乘法估計(jì)參數(shù)6.下列算法中,屬于監(jiān)督學(xué)習(xí)算法的是()。A.K-means聚類(lèi)算法B.主成分分析C.決策樹(shù)D.神經(jīng)網(wǎng)絡(luò)7.在機(jī)器學(xué)習(xí)中,過(guò)擬合現(xiàn)象指的是()。A.模型對(duì)訓(xùn)練數(shù)據(jù)擬合得很好,但對(duì)測(cè)試數(shù)據(jù)擬合較差B.模型對(duì)訓(xùn)練數(shù)據(jù)擬合較差,但對(duì)測(cè)試數(shù)據(jù)擬合較好C.模型對(duì)訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)都擬合得很好D.模型對(duì)訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)都擬合較差8.決策樹(shù)算法中,常用的分裂標(biāo)準(zhǔn)包括()。A.信息增益B.Gini不純度C.交叉熵D.以上都是9.支持向量機(jī)(SVM)的基本思想是通過(guò)找到一個(gè)超平面,使得樣本數(shù)據(jù)被正確分類(lèi),并且()。A.超平面到每個(gè)樣本點(diǎn)的距離相等B.超平面到最近樣本點(diǎn)的距離最大C.超平面將樣本點(diǎn)分成多個(gè)簇D.超平面通過(guò)所有樣本點(diǎn)10.下列關(guān)于交叉驗(yàn)證的說(shuō)法錯(cuò)誤的是()。A.交叉驗(yàn)證是一種模型評(píng)估方法B.交叉驗(yàn)證可以有效防止過(guò)擬合C.交叉驗(yàn)證需要將數(shù)據(jù)集分成多個(gè)子集D.交叉驗(yàn)證適用于所有類(lèi)型的機(jī)器學(xué)習(xí)模型二、填空題1.設(shè)總體服從二項(xiàng)分布\(B(n,p)\),其中\(zhòng)(n\)已知,\(p\)未知,若從該總體中抽取樣本容量為\(n\)的樣本,則\(p\)的\(100(1-\alpha)\%\)置信區(qū)間為()。2.假設(shè)檢驗(yàn)的零假設(shè)\(H_0\)通常表示()。3.設(shè)\(X_1,X_2,\ldots,X_n\)是來(lái)自總體\(X\)的樣本,若\(X\)服從均勻分布\(U(0,\theta)\),則\(\theta\)的最大似然估計(jì)量為()。4.在多元線性回歸模型中,調(diào)整后的決定系數(shù)\(R^2_{\text{adj}}\)考慮了()。5.決策樹(shù)算法中,常用的剪枝方法包括()和()。三、簡(jiǎn)答題1.簡(jiǎn)述假設(shè)檢驗(yàn)的基本步驟。2.解釋什么是多重共線性,并簡(jiǎn)述其危害。3.比較決策樹(shù)、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)三種算法的優(yōu)缺點(diǎn)。四、計(jì)算題1.設(shè)總體服從正態(tài)分布\(N(\mu,4)\),從中抽取樣本容量為16的樣本,樣本均值為10。檢驗(yàn)假設(shè)\(H_0:\mu=9\)對(duì)\(H_1:\mu>9\),顯著性水平\(\alpha=0.05\)。請(qǐng)寫(xiě)出檢驗(yàn)統(tǒng)計(jì)量,并判斷是否拒絕\(H_0\)。2.某研究欲探究自變量\(X_1\)和\(X_2\)對(duì)因變量\(Y\)的影響,收集了25組數(shù)據(jù),得到的多元線性回歸方程為\(\hat{Y}=5+2X_1+3X_2\)。計(jì)算當(dāng)\(X_1=2\),\(X_2=1\)時(shí),\(Y\)的預(yù)測(cè)值,并解釋該預(yù)測(cè)值的含義。五、綜合應(yīng)用題某公司希望利用機(jī)器學(xué)習(xí)方法預(yù)測(cè)產(chǎn)品的銷(xiāo)量。收集了歷史銷(xiāo)售數(shù)據(jù),包括產(chǎn)品價(jià)格、廣告投入、季節(jié)等因素。請(qǐng)簡(jiǎn)述如何利用這些數(shù)據(jù)構(gòu)建一個(gè)預(yù)測(cè)模型,并說(shuō)明在構(gòu)建模型過(guò)程中需要注意哪些問(wèn)題。試卷答案一、選擇題1.A解析:由于總體方差未知,應(yīng)使用t分布構(gòu)建置信區(qū)間。2.C解析:犯第一類(lèi)錯(cuò)誤是指原假設(shè)\(H_0\)為真時(shí),錯(cuò)誤地拒絕了\(H_0\)。3.A解析:泊松分布的期望和方差均為\(\lambda\),樣本均值的期望為\(\lambda\),方差為\(\frac{\lambda}{n}\)。4.C解析:\(R^2\)表示模型解釋了因變量變化的百分比,\(R^2=0.8\)表示模型解釋了80%的變化。5.B解析:線性回歸模型假設(shè)自變量\(X_i\)是固定變量,而非隨機(jī)變量。6.C解析:決策樹(shù)是一種監(jiān)督學(xué)習(xí)算法,用于分類(lèi)和回歸任務(wù)。7.A解析:過(guò)擬合是指模型對(duì)訓(xùn)練數(shù)據(jù)擬合得很好,但對(duì)測(cè)試數(shù)據(jù)擬合較差的現(xiàn)象。8.D解析:信息增益、Gini不純度和交叉熵都是常用的決策樹(shù)分裂標(biāo)準(zhǔn)。9.B解析:支持向量機(jī)通過(guò)找到一個(gè)超平面,使得樣本數(shù)據(jù)被正確分類(lèi),并且超平面到最近樣本點(diǎn)的距離最大。10.D解析:交叉驗(yàn)證適用于大多數(shù)機(jī)器學(xué)習(xí)模型,但并非所有模型。二、填空題1.\(\left(\frac{\sum_{i=1}^nX_i}{n+np(1-\alpha)}-\frac{z_{\alpha/2}}{\sqrt{n}}\sqrt{\frac{np(1-p)}{n+np(1-\alpha)}},\frac{\sum_{i=1}^nX_i}{n+np(1-\alpha)}+\frac{z_{\alpha/2}}{\sqrt{n}}\sqrt{\frac{np(1-p)}{n+np(1-\alpha)}}\right)\)2.原假設(shè)通常表示沒(méi)有效應(yīng)或沒(méi)有差異。3.\(\frac{\max(X_1,X_2,\ldots,X_n)}{n}\)4.模型中自變量的數(shù)量。5.剪枝預(yù)排序,剪枝后剪三、簡(jiǎn)答題1.假設(shè)檢驗(yàn)的基本步驟:a.提出原假設(shè)\(H_0\)和備擇假設(shè)\(H_1\)。b.選擇檢驗(yàn)統(tǒng)計(jì)量,并確定其分布。c.確定顯著性水平\(\alpha\),并找到拒絕域。d.計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值,并判斷是否落入拒絕域。e.根據(jù)判斷結(jié)果,做出拒絕或接受\(H_0\)的結(jié)論。2.多重共線性是指模型中的自變量之間存在高度線性相關(guān)關(guān)系。其危害包括:a.參數(shù)估計(jì)不穩(wěn)定,方差增大。b.難以解釋單個(gè)自變量的影響。c.模型預(yù)測(cè)精度下降。3.決策樹(shù)、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)三種算法的優(yōu)缺點(diǎn):決策樹(shù):優(yōu)點(diǎn):易于理解和解釋,可以處理混合類(lèi)型數(shù)據(jù)。缺點(diǎn):容易過(guò)擬合,對(duì)數(shù)據(jù)噪聲敏感。支持向量機(jī):優(yōu)點(diǎn):可以有效處理高維數(shù)據(jù),泛化能力強(qiáng)。缺點(diǎn):對(duì)參數(shù)選擇敏感,計(jì)算復(fù)雜度較高。神經(jīng)網(wǎng)絡(luò):優(yōu)點(diǎn):具有強(qiáng)大的學(xué)習(xí)能力,可以處理復(fù)雜模式。缺點(diǎn):需要大量數(shù)據(jù),參數(shù)調(diào)整復(fù)雜,模型解釋性差。四、計(jì)算題1.檢驗(yàn)統(tǒng)計(jì)量:\(Z=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}=\frac{10-9}{2/\sqrt{16}}=2\)由于\(Z=2>z_{0.05}=1.645\),拒絕\(H_0\)。2.\(Y\)的預(yù)測(cè)值:\(\hat{Y}=5+2\times2+3\times1=11\)該預(yù)測(cè)值表示當(dāng)\(X_1=2\),\(X_2=1\)時(shí),\(Y\)的平均預(yù)測(cè)值為11。五、綜合應(yīng)用題構(gòu)建預(yù)測(cè)模型的步驟:1.數(shù)據(jù)預(yù)處理:清洗數(shù)據(jù),處理缺失值,轉(zhuǎn)換數(shù)據(jù)類(lèi)型。2.特征工程:選擇相關(guān)特征,創(chuàng)建新特征,特征縮放。3.模型選擇:選擇合適的機(jī)器學(xué)習(xí)算法,如線性回歸、決策樹(shù)、支持向量機(jī)等

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論