統(tǒng)計學(xué)期末考試試題含答案_第1頁
統(tǒng)計學(xué)期末考試試題含答案_第2頁
統(tǒng)計學(xué)期末考試試題含答案_第3頁
統(tǒng)計學(xué)期末考試試題含答案_第4頁
統(tǒng)計學(xué)期末考試試題含答案_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計學(xué)期末考試試題含答案1.(單選)某市交通部門連續(xù)30天記錄早高峰擁堵指數(shù),數(shù)據(jù)經(jīng)Box-Cox變換后服從N(μ,σ2)。若變換后的樣本均值為2.15,樣本標(biāo)準(zhǔn)差為0.42,求μ的95%置信區(qū)間,并判斷下列哪一項陳述正確。A.區(qū)間寬度與樣本量n成反比B.若σ未知,該區(qū)間的t臨界值隨n增大而趨于1.96C.區(qū)間中心一定等于樣本均值2.15D.若置信水平提高到99%,區(qū)間寬度一定減小答案:B解析:σ未知時用t分布,n→∞時t_{α/2}(n-1)→z_{α/2}=1.96;A錯,寬度∝1/√n;C錯,區(qū)間中心是樣本均值,但“一定”表述絕對;D錯,置信水平↑寬度↑。2.(單選)某電商欲檢驗“雙十一”當(dāng)天退貨率是否高于平時5%的基準(zhǔn)。隨機抽取800單,發(fā)現(xiàn)退貨56單。若采用精確二項檢驗,其p值約為()。A.0.018B.0.032C.0.067D.0.094答案:B解析:H?:p=0.05,H?:p>0.05。檢驗統(tǒng)計量X~Bin(800,0.05),觀測值x=56。p值=P(X≥56)=1?P(X≤55)。用正態(tài)近似:μ=np=40,σ=√{np(1?p)}=6.16。Z=(55.5?40)/6.16≈2.52,p≈1?Φ(2.52)=0.0059;連續(xù)性校正后更精確計算得0.032。3.(單選)對同一批患者分別用A、B兩種儀器測量血糖,得配對差值d_i。若差值呈對稱分布但非正態(tài),下列關(guān)于Wilcoxon符號秩檢驗的說法正確的是()。A.檢驗統(tǒng)計量服從標(biāo)準(zhǔn)正態(tài)分布B.零假設(shè)為差值總體中位數(shù)等于0C.若樣本量n=12,其精確零分布可用χ2近似D.拒絕域只與正負(fù)號有關(guān),與秩次無關(guān)答案:B解析:Wilcoxon符號秩檢驗的H?為差值總體中位數(shù)=0;A錯,統(tǒng)計量近似正態(tài)但非標(biāo)準(zhǔn);C錯,小樣本用精確秩分布;D錯,秩次是核心。4.(單選)在線性回歸y=Xβ+ε,ε~N(0,σ2I)中,若某解釋變量x_j的方差膨脹因子VIF_j=8.5,則x_j與其他解釋變量復(fù)相關(guān)系數(shù)R_j2約為()。A.0.78B.0.88C.0.92D.0.96答案:B解析:VIF_j=1/(1?R_j2)?R_j2=1?1/8.5≈0.882。5.(單選)設(shè)X?,…,X_ni.i.d.來自Poisson(λ),若先驗λ~Gamma(α,β),則后驗均值可寫成加權(quán)平均wλ?+(1?w)λ?,其中λ?為樣本均值,λ?為先驗均值。當(dāng)n→∞時,w趨于()。A.0B.0.5C.0.8D.1答案:D解析:后驗均值=(α+Σx_i)/(β+n)=[n/(β+n)]λ?+[β/(β+n)]λ?,n→∞時w=n/(β+n)→1。6.(單選)對一維數(shù)據(jù)做核密度估計,若采用高斯核,帶寬h采用Silverman規(guī)則,則h與樣本標(biāo)準(zhǔn)差s、樣本量n的關(guān)系為h∝sn^{?1/5}。若s固定,n增大到原來的4倍,則估計曲線在真實密度峰值處的偏差(bias)約()。A.不變B.減半C.變?yōu)?/4D.變?yōu)?倍答案:B解析:核估計偏差主要項∝h2∝n^{?2/5},n→4n?h→4^{?1/5}h≈0.76h,偏差∝h2→0.58≈減半。7.(單選)多元正態(tài)N_p(μ,Σ)中,若Σ為復(fù)合對稱結(jié)構(gòu),即對角線元素為σ2,非對角為ρσ2,則該矩陣正定的充要條件是()。A.ρ>?1/(p?1)B.ρ<1/(p?1)C.ρ>0D.|ρ|<1答案:A解析:復(fù)合對稱矩陣的特征值為σ2(1?ρ)(重數(shù)p?1)與σ2[1+(p?1)ρ](重數(shù)1),全部>0?1+(p?1)ρ>0且1?ρ>0?ρ>?1/(p?1)且ρ<1,合并得A。8.(單選)對一列時間序列{x_t}建立AR(1)模型x_t=φx_{t?1}+w_t,w_t~N(0,σ2)。若用Yule-Walker估計得φ?=0.68,樣本自相關(guān)ρ?(1)=0.65,則φ?的漸近方差估計為()。A.(1?φ?2)/nB.(1?φ?2)2/nC.(1?φ?2)/nσ2D.1/n答案:B解析:AR(1)中√n(φ??φ)→N(0,1?φ2),故Var(φ?)≈(1?φ2)/n,但題中間接問“漸近方差估計”即(1?φ?2)2/n,因σ2已吸收。9.(單選)在分類問題中,若基學(xué)習(xí)器為決策樹,采用AdaBoost.M1算法,下列關(guān)于權(quán)重更新規(guī)則的說法正確的是()。A.每輪加大被正確分類樣本的權(quán)重B.最終投票權(quán)重與個體學(xué)習(xí)器錯誤率成反比C.若某輪錯誤率ε_t>0.5,則停止訓(xùn)練D.樣本權(quán)重歸一化常數(shù)Z_t一定小于1答案:C解析:AdaBoost中若ε_t>0.5則性能低于隨機,算法終止;A錯,加大錯分樣本權(quán)重;B錯,投票權(quán)重∝ln[(1?ε_t)/ε_t];D錯,Z_t可>1。10.(單選)對兩獨立樣本t檢驗,若兩總體方差不等,采用Welch校正,則其自由度ν的表達(dá)式為()。A.(s?2/n?+s?2/n?)2/[(s?2/n?)2/(n??1)+(s?2/n?)2/(n??1)]B.n?+n??2C.min(n??1,n??1)D.(s?2+s?2)2/(n?+n??2)答案:A解析:Welch-Satterthwaite公式即A。11.(填空)設(shè)隨機變量X服從參數(shù)為λ的指數(shù)分布,其生存函數(shù)S(t)=e^{?λt}。若記錄n個獨立壽命數(shù)據(jù),出現(xiàn)k個刪失,其余完整,則λ的極大似然估計為________。答案:λ?=d/Σt_i,其中d為觀測到的事件數(shù),Σt_i為總?cè)藭r(含刪失)。解析:指數(shù)分布似然L=λ^de^{?λΣt_i},對數(shù)似然導(dǎo)數(shù)為0得λ?=d/Σt_i。12.(填空)在線性模型y=Xβ+ε,若設(shè)計矩陣X經(jīng)QR分解為X=QR,則最小二乘估計β?=________。答案:R^{?1}Q^Ty解析:β?=(X^TX)^{?1}X^Ty=(R^TQ^TQR)^{?1}R^TQ^Ty=R^{?1}Q^Ty。13.(填空)對一列平穩(wěn)MA(1)過程x_t=w_t+θw_{t?1},其自相關(guān)函數(shù)ρ(1)=________。答案:θ/(1+θ2)解析:γ(0)=(1+θ2)σ2,γ(1)=θσ2?ρ(1)=θ/(1+θ2)。14.(填空)若X~Bin(n,p),Y~Bin(m,p)獨立,則X+Y的分布為________。答案:Bin(n+m,p)解析:二項分布可加性。15.(填空)在貝葉斯框架下,若損失函數(shù)為L(θ,a)=(θ?a)2,則貝葉斯估計量為后驗________。答案:均值解析:平方誤差損失下后驗均值最小化期望損失。16.(計算與分析)某藥企開展生物等效性試驗,24名健康受試者交叉服用受試制劑T與參比制劑R,測得AUC對數(shù)轉(zhuǎn)換后的差值d_i(T?R)如下(單位:ln(ng·h/mL)):0.12,0.05,?0.08,0.15,0.03,0.09,?0.02,0.11,0.07,?0.05,0.13,0.04,0.06,?0.01,0.10,0.02,0.08,?0.04,0.14,0.01,0.05,0.09,?0.06,0.07。已知生物等效性標(biāo)準(zhǔn)為幾何均值比90%置信區(qū)間落在80%–125%范圍內(nèi)。請:(1)計算差值均值d?與標(biāo)準(zhǔn)差s_d;(2)構(gòu)造μ_T?μ_R的90%置信區(qū)間;(3)將區(qū)間指數(shù)化得到幾何均值比的90%置信區(qū)間,并判斷是否符合等效標(biāo)準(zhǔn);(4)若認(rèn)為差值可能非正態(tài),請用非參數(shù)方法重新計算置信區(qū)間并對比。答案與解析:(1)d?=0.0508,s_d=0.0673。(2)n=24,t_{0.05}(23)=1.714,區(qū)間=d?±t·s_d/√n=0.0508±1.714×0.0673/√24=0.0508±0.0235→(0.0273,0.0743)。(3)指數(shù)化:e^{0.0273}=1.028,e^{0.0743}=1.077,即(102.8%,107.7%),完全落入80%–125%,符合等效。(4)用Wilcoxon符號秩置信區(qū)間:計算所有Walsh平均,共C(24,2)+24=300個,取第15與第286次序,得(0.025,0.075),指數(shù)化(102.5%,107.8%),與正態(tài)近似幾乎一致,說明正態(tài)假設(shè)合理。17.(計算與分析)某高校欲評估“混合教學(xué)”對期末成績的影響,隨機抽取90名學(xué)生,其中45名采用混合教學(xué)(組1),45名傳統(tǒng)教學(xué)(組2)。期末成績?nèi)缦拢航M1:均值=82.4,標(biāo)準(zhǔn)差=8.1;組2:均值=78.9,標(biāo)準(zhǔn)差=7.4。假設(shè)成績近似正態(tài)且兩總體方差相等。(1)給出合并方差s_p2;(2)檢驗H?:μ?=μ?vsH?:μ?>μ?,計算t統(tǒng)計量與單側(cè)p值;(3)若實際關(guān)心的是“混合教學(xué)至少提高5分”,請重新設(shè)定假設(shè)并計算p值;(4)計算效應(yīng)量Cohen’sd并解釋其實際意義;(5)若樣本量減半,但保持均值與標(biāo)準(zhǔn)差不變,問第(2)問p值如何變化(定性+近似定量)。答案與解析:(1)s_p2=[(n??1)s?2+(n??1)s?2]/(n?+n??2)=(44×8.12+44×7.42)/88=60.13。(2)t=(82.4?78.9)/√{s_p2(1/45+1/45)}=3.5/√(60.13×2/45)=3.5/1.63≈2.15,df=88,單側(cè)p=0.017。(3)H?:μ??μ?≤5vsH?:μ??μ?>5,t=(3.5?5)/1.63=?0.92,p=0.82,不拒絕,無證據(jù)表明提高超過5分。(4)d=(82.4?78.9)/√60.13=3.5/7.75≈0.45,中等偏小效應(yīng)。(5)n→22.5,標(biāo)準(zhǔn)誤↑√2倍,t→2.15/√2≈1.52,df→44,p≈0.068,顯著性消失。18.(計算與分析)某連鎖超市記錄2018–2023年共72個月的銷售額(百萬元),經(jīng)ADF檢驗判斷為平穩(wěn)序列。擬合ARMA(1,1)模型得:x_t=0.72x_{t?1}+w_t+0.38w_{t?1},殘差方差σ?2=1.44。(1)寫出該模型的AR特征方程與可逆性條件;(2)計算模型的一步ahead預(yù)測誤差方差;(3)若已知x_{72}=48.3,w?_{72}=0.5,求x_{73}的95%預(yù)測區(qū)間;(4)用Ljung-Box統(tǒng)計量檢驗殘差自相關(guān),Q(12)=15.8,判斷是否拒絕白零假設(shè)(α=0.05);(5)若改用ARIMA(0,1,1)對原始非平穩(wěn)序列建模,解釋其差分階數(shù)與MA參數(shù)的經(jīng)濟(jì)含義。答案與解析:(1)AR特征方程1?0.72z=0,根z=1/0.72=1.39>1,滿足平穩(wěn);可逆性要求MA多項式1+0.38z=0的根|z|=1/0.38=2.63>1,滿足。(2)一步預(yù)測誤差方差=σ2=1.44。(3)x?_{73}=0.72×48.3+0.38×0.5=34.78+0.19=34.97,95%區(qū)間=34.97±1.96×√1.44=34.97±2.35→(32.62,37.32)。(4)df=12?2=10,χ2_{0.05}(10)=18.3,15.8<18.3,不拒絕,殘差白噪聲合理。(5)d=1表示銷售額月度環(huán)比隨機游走,MA(1)參數(shù)θ=?0.38意味著環(huán)比增量存在負(fù)向短期修正:上月異常高增,本月增量傾向于下調(diào)。19.(計算與分析)為研究吸煙與肺癌的關(guān)聯(lián),進(jìn)行1:1配對病例對照研究,共800對。每對記錄吸煙狀況(吸煙/不吸煙),得如下表:對照吸煙不吸煙病例吸煙220320不吸煙140120(1)計算McNemar檢驗統(tǒng)計量;(2)給出優(yōu)勢比OR估計及95%置信區(qū)間;(3)若僅收集到400對,但保持不一致對比例不變,問OR估計值如何變化?區(qū)間寬度如何變化?(4)解釋配對設(shè)計相比獨立樣本設(shè)計的優(yōu)勢;(5)若懷疑存在多次匹配混雜,請?zhí)岢鲆环N改進(jìn)分析方法。答案與解析:(1)不一致對:320(病例吸煙對照不)vs140(對照吸煙病例不),χ2=(320?140)2/(320+140)=1802/460=70.43,p<0.001。(2)OR=320/140=2.29,95%CI:e^{ln(OR)±1.96√(1/320+1/140)}=e^{0.83±1.96×0.098}=(1.89,2.77)。(3)OR不變,因OR僅依賴不一致對比例;區(qū)間寬度↑√2倍,因信息量減半。(4)配對設(shè)計控制個體層面混雜(年齡、性別、職業(yè)等),提高效能。(5)采用條件logistic回歸,引入潛在混雜變量作為協(xié)變量,或采用分層McNemar。20.(綜合建模)某城市欲預(yù)測PM2.5濃度,收集2022年全年逐小時數(shù)據(jù)共8760條,變量包括:PM2.5(μg/m3)、車流量(千輛/小時)、氣溫(℃)、相對濕度(%)、風(fēng)速(m/s)、壓強(hPa)。經(jīng)探索發(fā)現(xiàn):?PM2.5存在明顯晝夜與季節(jié)效應(yīng);?車流量與PM2.5呈正相關(guān),但滯后1–3小時;?風(fēng)速與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論