2025年大學(xué)《數(shù)學(xué)與應(yīng)用數(shù)學(xué)》專業(yè)題庫(kù)- 數(shù)據(jù)科學(xué)中的統(tǒng)計(jì)學(xué)方法_第1頁(yè)
2025年大學(xué)《數(shù)學(xué)與應(yīng)用數(shù)學(xué)》專業(yè)題庫(kù)- 數(shù)據(jù)科學(xué)中的統(tǒng)計(jì)學(xué)方法_第2頁(yè)
2025年大學(xué)《數(shù)學(xué)與應(yīng)用數(shù)學(xué)》專業(yè)題庫(kù)- 數(shù)據(jù)科學(xué)中的統(tǒng)計(jì)學(xué)方法_第3頁(yè)
2025年大學(xué)《數(shù)學(xué)與應(yīng)用數(shù)學(xué)》專業(yè)題庫(kù)- 數(shù)據(jù)科學(xué)中的統(tǒng)計(jì)學(xué)方法_第4頁(yè)
2025年大學(xué)《數(shù)學(xué)與應(yīng)用數(shù)學(xué)》專業(yè)題庫(kù)- 數(shù)據(jù)科學(xué)中的統(tǒng)計(jì)學(xué)方法_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025年大學(xué)《數(shù)學(xué)與應(yīng)用數(shù)學(xué)》專業(yè)題庫(kù)——數(shù)據(jù)科學(xué)中的統(tǒng)計(jì)學(xué)方法考試時(shí)間:______分鐘總分:______分姓名:______一、選擇題(本大題共5小題,每小題3分,共15分。在每小題給出的四個(gè)選項(xiàng)中,只有一項(xiàng)是符合題目要求的。)1.已知總體X服從參數(shù)為λ的泊松分布,X1,X2,...,Xn是來(lái)自X的樣本,則樣本均值\(\bar{X}\)的數(shù)學(xué)期望和方差分別為:A.λ,λB.λ,λ/nC.nλ,λD.nλ,λ/n2.設(shè)總體X的均值E(X)=μ,方差Var(X)=σ2,X1,X2,...,Xn是來(lái)自X的樣本。樣本方差S2定義為\(\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X})^2\),其中\(zhòng)(\bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i\)。則S2是:A.μ的矩估計(jì)量B.σ2的無(wú)偏估計(jì)量C.σ2的極大似然估計(jì)量D.E(X)的無(wú)偏估計(jì)量3.在假設(shè)檢驗(yàn)H?:μ=μ?vsH?:μ≠μ?中,若選顯著性水平α,則犯第一類錯(cuò)誤的概率為:A.μ/μ?B.1-βC.αD.β4.設(shè)變量X和Y的皮爾遜相關(guān)系數(shù)r=0.8,則X和Y之間:A.相關(guān)性不顯著B.線性關(guān)系較弱C.線性關(guān)系較強(qiáng)D.可能存在非線性關(guān)系5.在簡(jiǎn)單線性回歸模型Y=β?+β?X+ε中,若變量X增加一個(gè)單位,則Y的期望值:A.增加1單位B.減少1單位C.增加β?單位D.減少β?單位二、填空題(本大題共5小題,每小題3分,共15分。)6.若一組樣本數(shù)據(jù)為5,3,7,2,9,則該樣本的樣本容量為,樣本均值記為\(\bar{x}\),則\(\sum_{i=1}^{5}(x_i-\bar{x})=\)。7.設(shè)事件A和事件B相互獨(dú)立,P(A)=0.6,P(B)=0.3,則P(A∪B)=。8.設(shè)總體X服從正態(tài)分布N(μ,16),其中μ未知。從總體中抽取樣本容量為n的樣本,要檢驗(yàn)H?:μ=20vsH?:μ<20,應(yīng)選用檢驗(yàn)統(tǒng)計(jì)量,并使用分布。9.設(shè)變量X和Y的協(xié)方差Cov(X,Y)=4,X的方差Var(X)=9,Y的方差Var(Y)=16,則X和Y的皮爾遜相關(guān)系數(shù)r=。10.在多元線性回歸模型中,F(xiàn)檢驗(yàn)的目的是檢驗(yàn)。三、計(jì)算題(本大題共4小題,共60分。)11.(10分)設(shè)總體X的概率密度函數(shù)為f(x)=\(\begin{cases}2x,&0<x<1\\0,&其他\end{cases}\)。從中抽取樣本容量為n的樣本X1,X2,...,Xn。(1)求樣本均值\(\bar{X}\)的數(shù)學(xué)期望E(\(\bar{X}\))和方差Var(\(\bar{X}\))。(2)若n=25,求P(0.9<\(\bar{X}\)<1.0)。(可利用中心極限定理)12.(15分)為了檢驗(yàn)?zāi)乘幬锏寞熜?,隨機(jī)抽取10名病人服用該藥物后,測(cè)量其血壓變化(單位:mmHg),數(shù)據(jù)如下:-5,10,12,8,6,9,15,11,5,8。假設(shè)血壓變化X服從正態(tài)分布N(μ,σ2)。(1)求樣本均值\(\bar{x}\)和樣本標(biāo)準(zhǔn)差s。(2)在顯著性水平α=0.05下,檢驗(yàn)假設(shè)H?:μ=0vsH?:μ≠0。(寫出檢驗(yàn)步驟)13.(15分)隨機(jī)抽取了15對(duì)父子,測(cè)量其身高(單位:cm),父親身高X和兒子身高Y的數(shù)據(jù)如下(部分?jǐn)?shù)據(jù)省略,假設(shè)X和Y均服從正態(tài)分布,且方差相等但未知)。(1)求X和Y的樣本相關(guān)系數(shù)r。(給出計(jì)算公式和結(jié)果)(2)建立Y對(duì)X的簡(jiǎn)單線性回歸方程\(\hat{Y}=\hat{β?}+\hat{β?}X\)。(3)當(dāng)父親身高為180cm時(shí),預(yù)測(cè)兒子身高的點(diǎn)估計(jì)值(寫出公式)。14.(20分)某研究想探究廣告投入(單位:萬(wàn)元)X與產(chǎn)品銷量(單位:件)Y之間的關(guān)系,收集了10組數(shù)據(jù)。假設(shè)Y對(duì)X的回歸模型為Y=β?+β?X+ε,ε服從N(0,σ2)。(1)解釋回歸系數(shù)β?的實(shí)際意義。(2)給出檢驗(yàn)回歸系數(shù)β?是否顯著異于0的檢驗(yàn)統(tǒng)計(jì)量及其分布。(3)若已計(jì)算出回歸平方和SSR=1500,殘差平方和SSE=250,樣本容量n=10,請(qǐng)計(jì)算回歸系數(shù)β?的檢驗(yàn)統(tǒng)計(jì)量的值,并在α=0.05水平下,判斷廣告投入對(duì)產(chǎn)品銷量是否有顯著影響。(需給出F值或t值,并說(shuō)明結(jié)論)試卷答案一、選擇題1.B2.B3.C4.C5.C二、填空題6.5;07.0.548.\(\frac{\bar{X}-20}{\frac{4}{\sqrt{n}}}\);t(n-1)9.\(\frac{2}{3}\)10.回歸模型的整體顯著性,即所有自變量聯(lián)合起來(lái)對(duì)因變量的線性影響是否顯著三、計(jì)算題11.(1)E(X)=\(\int_0^1x\cdot2x\,dx=\frac{2}{3}\)。E(\(\bar{X}\))=E(X)=\(\frac{2}{3}\)。Var(\(\bar{X}\))=\(\frac{Var(X)}{n}=\frac{E(X^2)-[E(X)]^2}{n}\)。E(X^2)=\(\int_0^1x^2\cdot2x\,dx=\frac{1}{2}\)。Var(X)=\(\frac{1}{2}-(\frac{2}{3})^2=\frac{1}{18}\)。Var(\(\bar{X}\))=\(\frac{1}{18n}\)。(2)由中心極限定理,\(\bar{X}\)近似服從N(\(\frac{2}{3}\),\(\frac{1}{18\cdot25}\))。標(biāo)準(zhǔn)化:P(0.9<\(\bar{X}\)<1.0)≈P(\(\frac{0.9-\frac{2}{3}}{\frac{1}{\sqrt{18\cdot25}}}<Z<\frac{1.0-\frac{2}{3}}{\frac{1}{\sqrt{18\cdot25}}}\))。計(jì)算Z值后查標(biāo)準(zhǔn)正態(tài)分布表得概率。12.(1)\(\bar{x}=\frac{1}{10}\sumx_i=8.2\)。s2=\(\frac{1}{9}\sum(x_i-\bar{x})^2=\frac{1}{9}\sumx_i^2-\bar{x}^2=\frac{1}{9}\times578-8.2^2=12.02\)。s≈3.438。(2)檢驗(yàn)步驟:①提出假設(shè)H?:μ=0,H?:μ≠0。②選擇檢驗(yàn)方法:t檢驗(yàn)(因σ2未知且小樣本)。③確定顯著性水平α=0.05,自由度df=10-1=9。④查t分布表得臨界值t?.025,9≈2.262。⑤計(jì)算檢驗(yàn)統(tǒng)計(jì)量t=\(\frac{\bar{x}-0}{s/\sqrt{n}}=\frac{8.2}{3.438/\sqrt{10}}\approx7.55\)。⑥判斷:|t|=7.55>2.262,拒絕H?。結(jié)論:在α=0.05水平下,有充分證據(jù)認(rèn)為該藥物使血壓顯著變化。13.(1)r=\(\frac{\sum(x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\sum(x_i-\bar{x})^2}\sqrt{\sum(y_i-\bar{y})^2}}\)。計(jì)算分子(協(xié)方差乘以n-1)和分母(兩個(gè)變量的樣本方差乘以n-1的平方根),得到r的值。(假設(shè)已計(jì)算出r=0.85)(2)\(\hat{β?}=r\frac{s_y}{s_x}\),\(\hat{β?}=\bar{y}-\hat{β?}\bar{x}\)。(假設(shè)已計(jì)算出\(\hat{β?}=1.2\),\(\hat{β?}=50\))回歸方程為\(\hat{Y}=50+1.2X\)。(3)點(diǎn)估計(jì)值\(\hat{Y}_0=\hat{β?}+\hat{β?}x_0=50+1.2\times180=286\)。14.(1)β?表示在其他因素不變的情況下,廣告投入X每增加一個(gè)單位(萬(wàn)元),產(chǎn)品銷量Y預(yù)計(jì)平均增加β?個(gè)單位(件)。(2)檢驗(yàn)統(tǒng)計(jì)量F=\(\frac{SSR/n-1}{SSE/n-2}\)服從F分布(df?=n-1,df?=n-2)。或者檢驗(yàn)統(tǒng)計(jì)量t=\(\frac{\hat{β?}}{s_{\hat{β?}}}\)服從t分布(df=n-2),其中\(zhòng)(s_{\hat{β?}}=\sqrt{\frac{SSE}{n-2}\cdot\frac{1}{\sum(x_i-\bar{x})^2}}\)。(3)計(jì)算F值:F=\(\frac{1500/8}{250/7}=\frac{1500\times7}{250\times8}=6.6\)。或者計(jì)算t值:s2_e=\(\frac{250}{8}=31.25\)。\(SSE=\sume_i^2=\sum(y_i-\hat{y}_i)^2=250\)。t=\(\frac{\hat{β?}}{s_{\hat{β?}}}\)。需要\(\hat{β?}\),\(\sum(x_i-\bar{x})^2\)。假設(shè)已計(jì)算\(\hat{β?}=15\),\(\sum(x_i-\bar{x})^2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論