2025年大數(shù)據(jù)數(shù)學(xué)考試題及答案_第1頁
2025年大數(shù)據(jù)數(shù)學(xué)考試題及答案_第2頁
2025年大數(shù)據(jù)數(shù)學(xué)考試題及答案_第3頁
2025年大數(shù)據(jù)數(shù)學(xué)考試題及答案_第4頁
2025年大數(shù)據(jù)數(shù)學(xué)考試題及答案_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2025年大數(shù)據(jù)數(shù)學(xué)考試題及答案一、選擇題(每題5分,共30分)1.設(shè)數(shù)據(jù)集$D=\{3,5,7,9,11\}$,則該數(shù)據(jù)集的均值為()A.7B.8C.9D.10答案:A解析:均值(平均數(shù))的計算公式為$\bar{x}=\frac{\sum_{i=1}^{n}x_{i}}{n}$,其中$n$是數(shù)據(jù)的個數(shù),$x_{i}$是第$i$個數(shù)據(jù)。對于數(shù)據(jù)集$D=\{3,5,7,9,11\}$,$n=5$,$\sum_{i=1}^{5}x_{i}=3+5+7+9+11=35$,則均值$\bar{x}=\frac{35}{5}=7$。2.已知兩個事件$A$和$B$,$P(A)=0.4$,$P(B)=0.5$,若$A$和$B$相互獨立,則$P(A\cupB)$等于()A.0.2B.0.7C.0.8D.0.9答案:B解析:若兩個事件$A$和$B$相互獨立,則$P(A\capB)=P(A)\timesP(B)$。已知$P(A)=0.4$,$P(B)=0.5$,所以$P(A\capB)=0.4\times0.5=0.2$。根據(jù)概率的加法公式$P(A\cupB)=P(A)+P(B)-P(A\capB)$,將$P(A)=0.4$,$P(B)=0.5$,$P(A\capB)=0.2$代入可得$P(A\cupB)=0.4+0.5-0.2=0.7$。3.在線性回歸方程$\hat{y}=\hat{\beta}_{0}+\hat{\beta}_{1}x$中,$\hat{\beta}_{1}$表示()A.當(dāng)$x$每增加一個單位時,$y$的平均變化量B.當(dāng)$y$每增加一個單位時,$x$的平均變化量C.回歸直線在$y$軸上的截距D.回歸直線的斜率答案:D解析:在線性回歸方程$\hat{y}=\hat{\beta}_{0}+\hat{\beta}_{1}x$中,$\hat{\beta}_{1}$是回歸直線的斜率,它表示當(dāng)$x$每增加一個單位時,$\hat{y}$(預(yù)測值)的平均變化量;$\hat{\beta}_{0}$是回歸直線在$y$軸上的截距。所以本題選D。4.已知矩陣$A=\begin{bmatrix}1&2\\3&4\end{bmatrix}$,則矩陣$A$的行列式$|A|$的值為()A.-2B.2C.10D.-10答案:A解析:對于二階矩陣$A=\begin{bmatrix}a&b\\c&d\end{bmatrix}$,其行列式$|A|=ad-bc$。已知矩陣$A=\begin{bmatrix}1&2\\3&4\end{bmatrix}$,則$|A|=1\times4-2\times3=4-6=-2$。5.設(shè)隨機變量$X\simN(2,4)$,則$P(X\lt4)$的值為(已知$\varPhi(1)=0.8413$)()A.0.8413B.0.1587C.0.6826D.0.3413答案:A解析:若隨機變量$X\simN(\mu,\sigma^{2})$,則$Z=\frac{X-\mu}{\sigma}\simN(0,1)$。已知$X\simN(2,4)$,則$\mu=2$,$\sigma=2$。$P(X\lt4)=P\left(\frac{X-2}{2}\lt\frac{4-2}{2}\right)=P(Z\lt1)$,因為標(biāo)準(zhǔn)正態(tài)分布函數(shù)$\varPhi(z)=P(Z\ltz)$,且已知$\varPhi(1)=0.8413$,所以$P(X\lt4)=0.8413$。6.在一個包含100個樣本的數(shù)據(jù)集里,某個特征值出現(xiàn)的頻數(shù)為20,則該特征值的頻率為()A.0.2B.0.5C.0.8D.20答案:A解析:頻率的計算公式為$f=\frac{n}{N}$,其中$n$是某個特征值出現(xiàn)的頻數(shù),$N$是樣本總數(shù)。已知$n=20$,$N=100$,則頻率$f=\frac{20}{100}=0.2$。二、填空題(每題5分,共20分)1.已知向量$\vec{a}=(1,2)$,$\vec=(3,-1)$,則$\vec{a}\cdot\vec=$______。答案:1解析:對于兩個向量$\vec{a}=(x_{1},y_{1})$,$\vec=(x_{2},y_{2})$,它們的數(shù)量積$\vec{a}\cdot\vec=x_{1}x_{2}+y_{1}y_{2}$。已知$\vec{a}=(1,2)$,$\vec=(3,-1)$,則$\vec{a}\cdot\vec=1\times3+2\times(-1)=3-2=1$。2.若數(shù)據(jù)$x_{1},x_{2},\cdots,x_{n}$的方差為4,則數(shù)據(jù)$3x_{1}+2,3x_{2}+2,\cdots,3x_{n}+2$的方差為______。答案:36解析:設(shè)數(shù)據(jù)$x_{1},x_{2},\cdots,x_{n}$的平均數(shù)為$\bar{x}$,方差為$s^{2}$,則$\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}$,$s^{2}=\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}=4$。對于數(shù)據(jù)$y_{i}=3x_{i}+2$,$i=1,2,\cdots,n$,其平均數(shù)$\bar{y}=\frac{1}{n}\sum_{i=1}^{n}(3x_{i}+2)=3\times\frac{1}{n}\sum_{i=1}^{n}x_{i}+2=3\bar{x}+2$。方差$s_{y}^{2}=\frac{1}{n}\sum_{i=1}^{n}[(3x_{i}+2)-(3\bar{x}+2)]^{2}=\frac{1}{n}\sum_{i=1}^{n}(3x_{i}-3\bar{x})^{2}=\frac{1}{n}\sum_{i=1}^{n}9(x_{i}-\bar{x})^{2}=9\times\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}=9s^{2}$。因為$s^{2}=4$,所以$s_{y}^{2}=9\times4=36$。3.已知函數(shù)$f(x)=x^{3}-3x^{2}+2$,則函數(shù)$f(x)$的極大值為______。答案:2解析:首先對函數(shù)$f(x)=x^{3}-3x^{2}+2$求導(dǎo),$f^\prime(x)=3x^{2}-6x=3x(x-2)$。令$f^\prime(x)=0$,即$3x(x-2)=0$,解得$x=0$或$x=2$。當(dāng)$x\lt0$時,$f^\prime(x)=3x(x-2)\gt0$,函數(shù)$f(x)$單調(diào)遞增;當(dāng)$0\ltx\lt2$時,$f^\prime(x)=3x(x-2)\lt0$,函數(shù)$f(x)$單調(diào)遞減;當(dāng)$x\gt2$時,$f^\prime(x)=3x(x-2)\gt0$,函數(shù)$f(x)$單調(diào)遞增。所以$x=0$是函數(shù)$f(x)$的極大值點,將$x=0$代入$f(x)$可得$f(0)=0^{3}-3\times0^{2}+2=2$,即函數(shù)$f(x)$的極大值為2。4.在抽樣調(diào)查中,從500個總體中抽取50個樣本,若采用系統(tǒng)抽樣的方法,則抽樣間隔為______。答案:10解析:系統(tǒng)抽樣的抽樣間隔$k=\frac{N}{n}$,其中$N$是總體個數(shù),$n$是樣本容量。已知$N=500$,$n=50$,則抽樣間隔$k=\frac{500}{50}=10$。三、解答題(共50分)1.(10分)某公司記錄了過去10個月的銷售額(單位:萬元)如下:30,32,35,33,36,34,37,35,38,36。(1)求這組數(shù)據(jù)的中位數(shù);(2)求這組數(shù)據(jù)的標(biāo)準(zhǔn)差(結(jié)果保留兩位小數(shù))。解:(1)將數(shù)據(jù)從小到大排列:30,32,33,34,35,35,36,36,37,38。因為數(shù)據(jù)個數(shù)$n=10$為偶數(shù),所以中位數(shù)是中間兩個數(shù)的平均值,即第5個數(shù)和第6個數(shù)的平均值。中位數(shù)$M=\frac{35+35}{2}=35$(萬元)。(2)首先求這組數(shù)據(jù)的均值$\bar{x}$:$\bar{x}=\frac{30+32+33+34+35+35+36+36+37+38}{10}=\frac{346}{10}=34.6$(萬元)。然后求方差$s^{2}$:\[\begin{align}s^{2}&=\frac{1}{10}\sum_{i=1}^{10}(x_{i}-\bar{x})^{2}\\&=\frac{1}{10}[(30-34.6)^{2}+(32-34.6)^{2}+(33-34.6)^{2}+(34-34.6)^{2}+(35-34.6)^{2}+(35-34.6)^{2}+(36-34.6)^{2}+(36-34.6)^{2}+(37-34.6)^{2}+(38-34.6)^{2}]\\&=\frac{1}{10}[(-4.6)^{2}+(-2.6)^{2}+(-1.6)^{2}+(-0.6)^{2}+0.4^{2}+0.4^{2}+1.4^{2}+1.4^{2}+2.4^{2}+3.4^{2}]\\&=\frac{1}{10}(21.16+6.76+2.56+0.36+0.16+0.16+1.96+1.96+5.76+11.56)\\&=\frac{1}{10}\times52.4\\&=5.24\end{align}\]標(biāo)準(zhǔn)差$s=\sqrt{s^{2}}=\sqrt{5.24}\approx2.29$(萬元)。2.(12分)設(shè)隨機變量$X$的概率分布為:|$X$|-1|0|1||----|----|----|----||$P$|0.2|0.5|0.3|(1)求$E(X)$和$D(X)$;(2)設(shè)$Y=2X+1$,求$E(Y)$和$D(Y)$。解:(1)根據(jù)期望和方差的定義公式:期望$E(X)=\sum_{i}x_{i}P(X=x_{i})$,則$E(X)=(-1)\times0.2+0\times0.5+1\times0.3=-0.2+0+0.3=0.1$。方差$D(X)=\sum_{i}(x_{i}-E(X))^{2}P(X=x_{i})$,$D(X)=(-1-0.1)^{2}\times0.2+(0-0.1)^{2}\times0.5+(1-0.1)^{2}\times0.3$$=(-1.1)^{2}\times0.2+(-0.1)^{2}\times0.5+(0.9)^{2}\times0.3$$=1.21\times0.2+0.01\times0.5+0.81\times0.3$$=0.242+0.005+0.243$$=0.49$。(2)根據(jù)期望和方差的性質(zhì):若$Y=aX+b$($a$,$b$為常數(shù)),則$E(Y)=aE(X)+b$,$D(Y)=a^{2}D(X)$。已知$Y=2X+1$,$a=2$,$b=1$,$E(X)=0.1$,$D(X)=0.49$。$E(Y)=2E(X)+1=2\times0.1+1=1.2$。$D(Y)=2^{2}D(X)=4\times0.49=1.96$。3.(14分)已知線性回歸模型$y=\beta_{0}+\beta_{1}x+\varepsilon$,其中$\varepsilon\simN(0,\sigma^{2})$,通過最小二乘法得到樣本數(shù)據(jù)$(x_{1},y_{1}),(x_{2},y_{2}),\cdots,(x_{n},y_{n})$的回歸方程為$\hat{y}=\hat{\beta}_{0}+\hat{\beta}_{1}x$。(1)推導(dǎo)$\hat{\beta}_{1}$和$\hat{\beta}_{0}$的計算公式;(2)若已知一組樣本數(shù)據(jù):$x=[1,2,3,4,5]$,$y=[2,4,6,8,10]$,求回歸方程$\hat{y}=\hat{\beta}_{0}+\hat{\beta}_{1}x$。解:(1)設(shè)$Q(\beta_{0},\beta_{1})=\sum_{i=1}^{n}(y_{i}-\beta_{0}-\beta_{1}x_{i})^{2}$,要使$Q(\beta_{0},\beta_{1})$達(dá)到最小,分別對$\beta_{0}$和$\beta_{1}$求偏導(dǎo)數(shù)并令其為0。$\frac{\partialQ}{\partial\beta_{0}}=-2\sum_{i=1}^{n}(y_{i}-\beta_{0}-\beta_{1}x_{i})=0$,即$\sum_{i=1}^{n}(y_{i}-\beta_{0}-\beta_{1}x_{i})=0$,$\sum_{i=1}^{n}y_{i}-n\beta_{0}-\beta_{1}\sum_{i=1}^{n}x_{i}=0$,可得$\beta_{0}=\bar{y}-\beta_{1}\bar{x}$,其中$\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}$,$\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_{i}$。$\frac{\partialQ}{\partial\beta_{1}}=-2\sum_{i=1}^{n}(y_{i}-\beta_{0}-\beta_{1}x_{i})x_{i}=0$,將$\beta_{0}=\bar{y}-\beta_{1}\bar{x}$代入可得:\[\begin{align}\sum_{i=1}^{n}(y_{i}-\bar{y}+\beta_{1}\bar{x}-\beta_{1}x_{i})x_{i}&=0\\\sum_{i=1}^{n}(y_{i}-\bar{y})x_{i}-\beta_{1}\sum_{i=1}^{n}(x_{i}-\bar{x})x_{i}&=0\\\beta_{1}&=\frac{\sum_{i=1}^{n}(x_{i}-\bar{x})(y_{i}-\bar{y})}{\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}}\end{align}\](2)首先計算$\bar{x}$和$\bar{y}$:$\bar{x}=\frac{1+2+3+4+5}{5}=3$,$\bar{y}=\frac{2+4+6+8+10}{5}=6$。$\sum_{i=1}^{5}(x_{i}-\bar{x})(y_{i}-\bar{y})=(1-3)\times(2-6)+(2-3)\times(4-6)+(3-3)\times(6-6)+(4-3)\times(8-6)+(5-3)\times(10-6)$$=(-2)\times(-4)+(-1)\times(-2)+0\times0+1\times2+2\times4$$=8+2+0+2+8=20$。$\sum_{i=1}^{5}(x_{i}-\bar{x})^{2}=(1-3)^{2}+(2-3)^{2}+(3-3)^{2}+(4-3)^{2}+(5-3)^{2}$$=(-2)^{2}+(-1)^{2}+0^{2}+1^{2}+2^{2}=4+1+0+1+4=10$。則$\hat{\beta}_{1}=\frac{\sum_{i=1}^{5}(x_{i}-\bar{x})(y_{i}-\bar{y})}{\sum_{i=1}^{5}(x_{i}-\bar{x})^{2}}=\frac{20}{10}=2$。$\hat{\beta}_{0}=\bar{y}-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論