2026年數(shù)理統(tǒng)計(jì)與數(shù)據(jù)分析考試試題及答案_第1頁(yè)
2026年數(shù)理統(tǒng)計(jì)與數(shù)據(jù)分析考試試題及答案_第2頁(yè)
2026年數(shù)理統(tǒng)計(jì)與數(shù)據(jù)分析考試試題及答案_第3頁(yè)
2026年數(shù)理統(tǒng)計(jì)與數(shù)據(jù)分析考試試題及答案_第4頁(yè)
2026年數(shù)理統(tǒng)計(jì)與數(shù)據(jù)分析考試試題及答案_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2026年數(shù)理統(tǒng)計(jì)與數(shù)據(jù)分析考試試題及答案1.(單選)設(shè)X?,…,X?i.i.d.~N(μ,σ2),σ2未知。若檢驗(yàn)H?:μ=μ?對(duì)H?:μ≠μ?,取拒絕域|X??μ?|/(S/√n)>c,則當(dāng)顯著性水平α=0.05時(shí),c的值為A.t?.???(n?1)?B.t?.??(n?1)?C.z?.????D.z?.??答案:A解析:σ2未知,用樣本標(biāo)準(zhǔn)差S,統(tǒng)計(jì)量服從t(n?1)分布,雙側(cè)檢驗(yàn)取α/2分位數(shù),故c=t?.???(n?1)。2.(單選)對(duì)同一組數(shù)據(jù)分別用矩估計(jì)與最大似然估計(jì)擬合Gamma(α,β)模型,若樣本偏度顯著大于0,則A.矩估計(jì)α?_MLE>α?_MM?B.矩估計(jì)α?_MLE<α?_MM?C.兩者相等?D.無(wú)法確定答案:B解析:Gamma偏度=2/√α,樣本偏度大?α小。矩估計(jì)把樣本三階中心矩直接代入,受極端值影響更大,得到的α?_MM偏??;MLE通過(guò)似然迭代更穩(wěn)健,α?_MLE相對(duì)較大,故α?_MLE>α?_MM不成立,反方向成立。3.(單選)在線性模型Y=Xβ+ε,ε~N(0,σ2I)中,若設(shè)計(jì)矩陣X的列向量正交,則Cov(β?)A.為對(duì)角陣?B.為單位陣?C.與X′X無(wú)關(guān)?D.為奇異陣答案:A解析:Cov(β?)=σ2(X′X)?1,X列正交?X′X對(duì)角?逆亦對(duì)角。4.(單選)對(duì)p維多元正態(tài)N?(μ,Σ),若Σ為對(duì)角陣,則樣本均值X?與樣本協(xié)方差SA.獨(dú)立?B.不獨(dú)立但無(wú)關(guān)?C.僅當(dāng)p=1獨(dú)立?D.僅當(dāng)μ=0獨(dú)立答案:A解析:多元正態(tài)下,Σ對(duì)角?分量獨(dú)立,由Basu定理,完全充分統(tǒng)計(jì)量(X?,S)與參數(shù)無(wú)關(guān)部分獨(dú)立,故X?與S獨(dú)立。5.(單選)設(shè)X~Bin(n,p),若采用Jeffreys先驗(yàn)π(p)∝p?1/2(1?p)?1/2,則后驗(yàn)均值E[p|X]為A.(X+1/2)/(n+1)?B.X/n?C.(X+1)/(n+2)?D.(X+2)/(n+4)答案:A解析:后驗(yàn)為Beta(X+1/2,n?X+1/2),其均值為(X+1/2)/(n+1)。6.(單選)對(duì)泊松過(guò)程N(yùn)(t)~Poisson(λt),記錄到第r次事件的時(shí)間T_r,則Var(T_r)A.r/λ2?B.rλ?C.λ/r?D.1/(rλ2)答案:A解析:T_r~Gamma(r,λ),方差r/λ2。7.(單選)若隨機(jī)變量X的矩母函數(shù)M_X(t)=exp{λ(e^t?1)+μt},則X的分布為A.泊松+正態(tài)混合?B.泊松平移?C.正態(tài)+泊松卷積?D.泊松與正態(tài)獨(dú)立和答案:B解析:MGF可分解為Poisson(λ)與退化μ之和,即X=Y+μ,Y~Poisson(λ)。8.(單選)在Bootstrap置信區(qū)間構(gòu)造中,若采用BCa方法,其加速系數(shù)a的估計(jì)基于A.刀切法影響函數(shù)?B.經(jīng)驗(yàn)似然?C.密度核估計(jì)?D.經(jīng)驗(yàn)分布分位數(shù)答案:A解析:BCa中的a由刀切法估計(jì)影響函數(shù)第三矩得到。9.(單選)對(duì)高維回歸p?n,若設(shè)計(jì)矩陣滿足RestrictedEigenvalue條件,則Lasso估計(jì)的??誤差界速率在σ已知時(shí)為A.σ√(slogp/n)?B.σslogp/n?C.σ√(logp/n)?D.σp/n答案:A解析:經(jīng)典結(jié)果,s為非零系數(shù)個(gè)數(shù),速率σ√(slogp/n)。10.(單選)若X?,…,X?i.i.d.~Uniform(0,θ),則P(X_(n)≤θ≤X_(n)/α^{1/n})的置信水平為A.1?α?B.α?C.1?α/2?D.α/2答案:A解析:P(θ≥X_(n))=1,P(θ≤X_(n)/α^{1/n})=P(X_(n)≥θα^{1/n})=1?α,故區(qū)間覆蓋概率1?α。11.(填空)設(shè)X~N(0,1),Y~χ2(k)且獨(dú)立,則T=X/√(Y/k)的密度函數(shù)在t=0處的值為________。答案:Γ((k+1)/2)/(√(kπ)Γ(k/2))解析:t分布密度f(wàn)(t)=Γ((k+1)/2)/(√(kπ)Γ(k/2))(1+t2/k)^{-(k+1)/2},代入t=0即得。12.(填空)對(duì)線性模型Y=Xβ+ε,若采用嶺估計(jì)β?_λ=(X′X+λI)?1X′Y,則當(dāng)λ→∞時(shí),β?_λ的極限方向?yàn)開_______。答案:0向量解析:λ→∞?(X′X+λI)?1≈(λI)?1→0,故β?_λ→0。13.(填空)若X?,…,X?i.i.d.~Exp(λ),則P(X?+?+X?≤t)的表達(dá)式為________。答案:1?e^{-λt}∑_{k=0}^{n?1}(λt)^k/k!解析:和為Gamma(n,λ),其CDF為不完全伽馬函數(shù),化簡(jiǎn)即得。14.(填空)對(duì)二維正態(tài)(X,Y)′~N?(0,0,1,1,ρ),則E[max(X,Y)]=________。答案:√((1?ρ)/π)解析:利用max(x,y)=(x+y+|x?y|)/2及正態(tài)絕對(duì)值期望公式。15.(填空)若樣本k階中心矩m_k=1/n∑(X_i?X?)^k,則對(duì)正態(tài)樣本m?的期望為________。答案:3(n?1)σ?/n解析:正態(tài)四階中心矩3σ?,經(jīng)樣本修正得。16.(解答)設(shè)X?,…,X?i.i.d.~f(x;θ)=θx^{θ?1},0<x<1,θ>0。(a)求θ的矩估計(jì)θ?_MM;(b)求θ的最大似然估計(jì)θ?_MLE;(c)比較兩者漸近方差并說(shuō)明優(yōu)劣。答案:(a)EX=θ/(θ+1),令X?=θ/(θ+1)?θ?_MM=X?/(1?X?)。(b)似然L=θ?∏x_i^{θ?1},logL=nlogθ+(θ?1)∑logx_i,令導(dǎo)數(shù)為0得θ?_MLE=?n/∑logx_i。(c)計(jì)算Fisher信息I(θ)=n/θ2,MLE漸近方差θ2/n。矩估計(jì)需Delta方法,Var(θ?_MM)≈[θ/(θ+1)2]2Var(X?)=[θ/(θ+1)2]2θ2/[n(θ+2)]=θ?/[n(θ+1)?(θ+2)]。比較得Var(θ?_MLE)=θ2/n<θ?/[n(θ+1)?(θ+2)]=Var(θ?_MM)對(duì)所有θ>0成立,故MLE更有效。17.(解答)某電商平臺(tái)記錄每日訂單量Y_t,t=1,…,365。假設(shè)Y_t=β?+β?t+β?sin(2πt/7)+ε_(tái)t,ε_(tái)t~N(0,σ2)獨(dú)立。(a)寫出設(shè)計(jì)矩陣X的維度與第t行;(b)給出β?的表達(dá)式;(c)若σ2未知,給出其無(wú)偏估計(jì);(d)構(gòu)造β?的95%置信區(qū)間;(e)若實(shí)際數(shù)據(jù)出現(xiàn)異方差Var(ε_(tái)t)=σ2w_t,提出一種可行加權(quán)最小二乘步驟。答案:(a)X為365×3,第t行(1,t,sin(2πt/7))。(b)β?=(X′X)?1X′Y。(c)σ?2=(Y?Xβ?)′(Y?Xβ?)/(365?3)。(d)令se=σ?√[(X′X)?1_{22}],區(qū)間β??±t?.???(362)se。(e)步驟:1.先用OLS得殘差e_t;2.回歸loge_t2對(duì)t與三角項(xiàng)得方差估計(jì)w?_t=exp(fitted);3.權(quán)重W=diag(1/w?_t);4.加權(quán)最小二乘β?_WLS=(X′WX)?1X′WY。18.(解答)設(shè)(X,Y)聯(lián)合密度f(wàn)(x,y)=2θ^{-2}exp{?(x+y)/θ},0<x<y<∞。(a)求X的邊緣密度;(b)求E[Y|X=x];(c)求θ的充分統(tǒng)計(jì)量;(d)給出θ的UMVUE。答案:(a)f_X(x)=∫_x^∞2θ^{-2}e^{?(x+y)/θ}dy=2θ^{-1}e^{-2x/θ},x>0,即Exp(θ/2)。(b)E[Y|X=x]=∫_x^∞yf(y|x)dy,其中f(y|x)=θ^{-1}e^{?(y?x)/θ},y>x,故E[Y|X=x]=x+θ。(c)聯(lián)合密度可寫為2θ^{-2}exp{?(x+y)/θ}I(x<y),由因子分解定理,T=X+Y為充分統(tǒng)計(jì)量。(d)令Z=X+Y,則Z~Gamma(2,θ),E[Z]=2θ,故θ?=Z/2為無(wú)偏,且為充分完全統(tǒng)計(jì)量的函數(shù),因此是UMVUE。19.(解答)某實(shí)驗(yàn)室對(duì)新型電池進(jìn)行壽命測(cè)試,記錄n=20支電池壽命(千小時(shí)):2.3,3.1,4.0,2.8,3.5,3.9,4.2,5.1,3.7,4.4,4.8,3.3,3.6,4.5,5.0,4.1,3.8,4.3,4.6,4.7。假設(shè)壽命服從Weibull(λ,k),密度f(wàn)(t)=kλ^kt^{k?1}exp{?(λt)^k}。(a)寫出對(duì)數(shù)似然函數(shù);(b)給出λ,k的得分方程;(c)用Newton-Raphson求k的MLE(迭代兩步,初值k?=2);(d)檢驗(yàn)H?:k=1對(duì)H?:k≠1(似然比檢驗(yàn),α=0.05)。答案:(a)?=nlogk+nklogλ+(k?1)∑logt_i?λ^k∑t_i^k。(b)??/?λ=nk/λ?kλ^{k?1}∑t_i^k=0?λ=(n/∑t_i^k)^{1/k};??/?k=n/k+nlogλ+∑logt_i?λ^k∑t_i^klog(λt_i)=0。(c)代入數(shù)據(jù),初值k?=2,得λ?=(20/∑t_i2)^{1/2}=0.221。計(jì)算得分與二階導(dǎo),第一步k?=2.38,第二步k?=2.41,收斂至k?=2.41。(d)全空間?_max=?20(logk?+k?logλ?)+(k??1)∑logt_i?λ?^{k?}∑t_i^{k?}=?38.42;H?下k=1,λ??=1/(∑t_i/20)=0.256,??=?42.15。似然比統(tǒng)計(jì)量Λ=2(?_max???)=7.46>χ2?.??(1)=3.84,拒絕H?,認(rèn)為k≠1,非指數(shù)分布。20.(解答)考慮高維分類問(wèn)題,樣本(X_i,y_i),X_i∈?^p,y_i∈{?1,+1},p=5000,n=100。采用L2正則邏輯回歸:min_{β}1/n∑log(1+exp(?y_iX_i′β))+λ‖β‖2。(a)寫出目標(biāo)函數(shù)的梯度;(b)給出坐標(biāo)下降更新公式;c)若采用十折交叉驗(yàn)證選擇λ,描述一種并行化方案;(d)若測(cè)試集上發(fā)現(xiàn)預(yù)測(cè)概率校準(zhǔn)不足,提出一種后處理校正方法并給出步驟。答案:(a)令p_i=1/(1+exp(?y_iX_i′β)),梯度=?1/n∑(y_iX_i(1?p_i))+2λβ。(b)對(duì)第j坐標(biāo),固定其余,更新β_j^(new)=S(1/n∑y_iX_{ij}(1?p_i^{(?j)}),λ)/(2λ+1/n∑X_{ij}^2p_i^{(?j)}(1?p_i^{(?j)}),其中S為軟閾值。(c)方案:將數(shù)據(jù)均分10份,每輪訓(xùn)練與驗(yàn)證任務(wù)獨(dú)立,映射到10核CPU或GPU流,每核輸出驗(yàn)證誤差,主進(jìn)程匯總平均誤差選λ。(d)采用Platt縮放:1.在驗(yàn)證集上得原始預(yù)測(cè)得分s_i=X_i′β?;2.擬合邏輯模型P(y=1|s)=1/(1+exp(As+B)),得A,B;3.測(cè)試集上校正概率p?_corr=1/(1+exp(As_test+B)),可提升校準(zhǔn)。21.(綜合)某城市地鐵刷卡數(shù)據(jù)給出工作日早高峰7:00–9:00期間進(jìn)站人數(shù)N_t每5分鐘統(tǒng)計(jì),t=1,…,24。觀測(cè)值顯示過(guò)度離散,擬合負(fù)二項(xiàng)NB(μ_t,?),其中l(wèi)ogμ_t=β?+β?t+β?cos(2πt/24)+β?sin(2πt/24)。(a)寫出負(fù)二項(xiàng)對(duì)數(shù)似然;(b)給出β,?的得分;(c)若檢驗(yàn)過(guò)度離散H?:?→∞對(duì)H?:?<∞,構(gòu)造Score檢驗(yàn)統(tǒng)計(jì)量;(d)實(shí)際數(shù)據(jù)n=200個(gè)5分鐘段,得Score統(tǒng)計(jì)量S=4.72,求p值并結(jié)論;(e)給出預(yù)測(cè)間隔t=25時(shí)μ_{25}的95%區(qū)間。答案:(a)?=∑[logΓ(?+N_t)?logΓ(?)?logΓ(N_t+1)+?log(?/(?+μ_t))+N_tlog(μ_t/(?+μ_t))]。(b)??/?β=∑(N_t?μ_t)/(?+μ_t)X_t,X_t=(1,t,cos,sin)′;??/??=∑[ψ(?+N_t)?ψ(?)+log(?/(?+μ_t))+(μ_t?N_t)/(?+μ_t)],ψ為digamma。(c)Score檢驗(yàn)在?→∞下,統(tǒng)計(jì)量S=(∑(N_t?μ?_t)2?μ?_t)/(√(2∑μ?_t2)),μ?_t為泊松MLE。(d)S=4.72,近似標(biāo)準(zhǔn)正態(tài),p=1?Φ(4.72)<0.0001,強(qiáng)烈拒絕H?,存在過(guò)度離散。(e)用Delta方法,logμ?_{25}方差=X_{25}′Cov(β?)X_{25},得se=0.12,區(qū)間exp(logμ?_{25}±1.96se),即(μ?_{25}e^{-0.235},μ?_{25}e^{0.235})。22.(證明)設(shè)X?,…,X?i.i.d.~f(x;θ)=θx^{θ?1},0<x<1,θ>0。證明T=?∑logX_i為完全充分統(tǒng)計(jì)量,并求θ的UMVUE。答案:聯(lián)合密度θ?exp{(θ?1)∑logx_i}=θ?exp{?(θ?1)T},由指數(shù)族形式,T為充分統(tǒng)計(jì)量。對(duì)任意可測(cè)函數(shù)g,若E[g(T)]=0?θ,則∫g(t)θ?e^{?(θ?1)t}dt=0?g(t)=0a.e.,故T完全。E[T]=n/θ,令θ?=(n?1)/T,則E[θ?]=θ,且為T的函數(shù),因此是UMVUE。23.(證明)對(duì)線性模型Y=Xβ+ε,ε~N(0,σ2I),證明Cov(β?,e)=0,其中β?=(X′X)?1X′Y,e=Y?Xβ?。答案:Cov(β?,e)=Cov((X′X)?1X′Y,(I?H)Y)=(X′X)?1X′Cov(Y,Y)(I?H)′=σ2(X

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論