2026年統(tǒng)計學專業(yè)期末考試題庫及答案-統(tǒng)計預測與決策理論應用歷年真題解_第1頁
2026年統(tǒng)計學專業(yè)期末考試題庫及答案-統(tǒng)計預測與決策理論應用歷年真題解_第2頁
2026年統(tǒng)計學專業(yè)期末考試題庫及答案-統(tǒng)計預測與決策理論應用歷年真題解_第3頁
2026年統(tǒng)計學專業(yè)期末考試題庫及答案-統(tǒng)計預測與決策理論應用歷年真題解_第4頁
2026年統(tǒng)計學專業(yè)期末考試題庫及答案-統(tǒng)計預測與決策理論應用歷年真題解_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2026年統(tǒng)計學專業(yè)期末考試題庫及答案—統(tǒng)計預測與決策理論應用歷年真題解一、單項選擇題(每題2分,共20分)1.在時間序列預測中,若某序列的ACF圖在滯后1階后迅速衰減至0附近,而PACF圖在滯后1階后截尾,則該序列最可能服從A.AR(1)B.MA(1)C.ARMA(1,1)D.ARIMA(0,1,1)答案:A解析:ACF拖尾、PACF截尾是AR(p)的典型特征,滯后1階截尾對應AR(1)。2.設(shè)某產(chǎn)品月銷量Xt滿足Xt=0.8Xt-1+εt,εt~N(0,σ2)。若已知X100=120,則X102的最小均方誤差預測值為A.120B.96C.76.8D.153.6答案:C解析:兩步預測φ2X100=0.82×120=76.8。3.在貝葉斯決策中,若損失函數(shù)為平方誤差,則最優(yōu)決策為A.后驗均值B.后驗中位數(shù)C.后驗眾數(shù)D.先驗均值答案:A解析:平方誤差損失下的貝葉斯估計量是后驗均值。4.對某季度數(shù)據(jù)建立SARIMA(0,1,1)(0,1,1)?模型,其季節(jié)差分階數(shù)為A.0B.1C.4D.12答案:B解析:括號內(nèi)第二個1表示季節(jié)差分階數(shù)D=1。5.若某預測方法的MAPE連續(xù)三年分別為4.2%、3.8%、4.5%,則該方法A.存在明顯偏差B.存在遞增方差C.表現(xiàn)穩(wěn)定D.存在滯后答案:C解析:MAPE波動小于1個百分點,表明預測精度穩(wěn)定。6.在指數(shù)平滑中,平滑參數(shù)α=0.8意味著A.歷史權(quán)重衰減緩慢B.歷史權(quán)重衰減迅速C.序列無趨勢D.序列無季節(jié)答案:B解析:α越大,近期觀測權(quán)重越高,歷史信息衰減越快。7.對高維回歸實施LASSO的主要目的是A.降低偏差B.提高可解釋性并實現(xiàn)變量選擇C.消除異方差D.增強共線性答案:B解析:LASSO通過??懲罰實現(xiàn)稀疏估計,自動選擇變量。8.若隨機森林的OOB誤差為6.3%,而測試誤差為9.1%,則最合理的解釋是A.模型過擬合B.模型欠擬合C.數(shù)據(jù)泄露D.樣本分布偏移答案:D解析:OOB誤差與測試誤差差異大,提示訓練集與測試集分布不一致。9.在狀態(tài)空間模型中,Kalman濾波的一步ahead預測誤差稱為A.平滑殘差B.創(chuàng)新序列C.似然增量D.增益向量答案:B解析:創(chuàng)新序列(innovation)是觀測值與一步預測之差。10.若某預測區(qū)間的覆蓋率連續(xù)10期均為98%,而名義水平為95%,則A.區(qū)間過寬B.區(qū)間過窄C.模型無偏D.模型方差低估答案:A解析:實際覆蓋率高于名義水平,說明區(qū)間保守、過寬。二、多項選擇題(每題3分,共15分)11.下列哪些技術(shù)可用于處理非平穩(wěn)序列A.差分B.Box-Cox變換C.協(xié)整檢驗D.小波分解E.季節(jié)調(diào)整答案:ACE解析:差分與季節(jié)調(diào)整直接消除非平穩(wěn);協(xié)整處理多個非平穩(wěn)序列的長期均衡;Box-Cox與小波主要處理方差非平穩(wěn)或局部特征。12.關(guān)于Bagging的陳述正確的是A.降低方差B.基學習器必須深度很大C.可并行訓練D.對不穩(wěn)定學習器效果顯著E.一定提升預測精度答案:ACD解析:Bagging通過平均降低方差;基學習器無需很深;并行訓練是其優(yōu)點;對不穩(wěn)定學習器(如決策樹)效果佳;若基學習器本身偏差大,Bagging未必提升精度。13.下列屬于概率預測評分規(guī)則的是A.CRPSB.MAEC.DSSD.LogSE.RMSE答案:ACD解析:CRPS(連續(xù)分級概率評分)、DSS(Dawid-Sebastiani)、LogS(對數(shù)評分)均評估概率分布;MAE、RMSE僅評估點預測。14.在貝葉斯模型平均(BMA)中,權(quán)重取決于A.先驗模型概率B.邊緣似然C.參數(shù)后驗眾數(shù)D.模型復雜度懲罰E.訓練時長答案:ABD解析:BMA權(quán)重∝先驗模型概率×邊緣似然;邊緣似然已隱含復雜度懲罰;與后驗眾數(shù)及訓練時長無關(guān)。15.對高維協(xié)方差矩陣估計,有效方法包括A.樣本協(xié)方差B.Ledoit-Wolf收縮C.GraphicalLASSOD.因子模型E.硬閾值答案:BCDE解析:樣本協(xié)方差在高維下病態(tài);收縮、稀疏、因子結(jié)構(gòu)均為有效正則化。三、計算與證明題(共35分)16.(8分)設(shè)Yt服從ARIMA(1,1,0)模型:(1?φB)(1?B)Yt=εt,εt~N(0,σ2),|φ|<1。已知Yn=100,Yn-1=95,φ=0.7,σ=2。求Yn+3的95%預測區(qū)間。解:記Wt=(1?B)Yt,則Wt~AR(1):Wt=φWt-1+εt。Wn=Yn?Yn-1=5。三步預測:Wn(1)=φWn=3.5Wn(2)=φ2Wn=2.45Wn(3)=φ3Wn=1.715Yn+3=Yn+Wn(1)+Wn(2)+Wn(3)=100+3.5+2.45+1.715=107.665預測誤差方差:Var(en(3))=σ2[1+(1+φ)2+(1+φ+φ2)2]=4×[1+1.72+2.392]=4×(1+2.89+5.7121)=38.4084標準誤=√38.4084≈6.19795%區(qū)間:107.665±1.96×6.197→[95.52,119.81]17.(9分)某零售商對周銷量建立狀態(tài)空間模型:觀測方程:Yt=μt+εt,εt~N(0,σ2ε)狀態(tài)方程:μt=μt-1+ηt,ηt~N(0,σ2η)已知σ2ε=25,σ2η=4,初始μ0|0=100,P0|0=9。現(xiàn)觀測到Y(jié)1=108,求μ1|1及P1|1,并給出第2周銷量的一步預測分布。解:預測步:μ1|0=μ0|0=100P1|0=P0|0+σ2η=9+4=13更新步:K1=P1|0/(P1|0+σ2ε)=13/38≈0.342μ1|1=μ1|0+K1(Y1?μ1|0)=100+0.342×8≈102.74P1|1=(1?K1)P1|0=0.658×13≈8.55第2周預測:Y2|1~N(μ1|1,P1|1+σ2ε)=N(102.74,8.55+25)=N(102.74,33.55)18.(10分)某企業(yè)欲預測季度利潤,考慮三種模型:AR(4)、SARIMA(1,0,1)(0,1,1)?、隨機森林。使用2010Q1—2022Q4數(shù)據(jù),末四年做滾動原點驗證,結(jié)果如下:模型|RMSE|MAE|MAPE|CRPSAR(4)|3.81|3.10|8.7%|2.15SARIMA|3.05|2.44|6.9%|1.72RF|3.42|2.70|7.6%|1.98(1)請給出選擇SARIMA的統(tǒng)計依據(jù);(2)若企業(yè)更關(guān)注利潤下滑風險,應如何調(diào)整評估指標?解:(1)SARIMA在三項指標均最優(yōu),且CRPS最小,表明其概率預測校準度最好;Diebold-Mariano檢驗顯示SARIMA相對AR(4)的RMSE差異p=0.018<0.05,顯著優(yōu)于AR(4)。(2)可引入下行加權(quán)指標,如LinLin損失(低估損失權(quán)重2倍)、QuantileLossatτ=0.1,或計算下行MAPE(僅實際>預測時計入)。亦可用CVaR區(qū)間覆蓋率評估左尾。19.(8分)證明:對于任意線性預測X?n+h=∑ψiXn?i,最小化MSE等價于投影定理。證明:令預測誤差en+h=Xn+h?X?n+h。MSE=E[en+h2]=E[(Xn+h?∑ψiXn?i)2]。對ψk求偏導并令為零:?MSE/?ψk=?2E[Xn?k(Xn+h?∑ψiXn?i)]=0?E[Xn?ken+h]=0,即誤差與觀測空間正交。由投影定理,此正交條件唯一確定最優(yōu)線性投影,故得證。四、綜合建模題(30分)20.背景:某共享單車公司需預測未來7天各站點借車量,以指導車輛調(diào)度。數(shù)據(jù):2021年1月—2023年10月,共1005個站點,15分鐘粒度,含天氣、節(jié)假日、POI、地鐵時刻表等外生變量。任務(wù):(1)給出完整建模流程,含數(shù)據(jù)清洗、特征工程、模型選擇、驗證、概率預測、決策應用;(2)針對“早高峰部分站點供不應求”問題,設(shè)計基于預測結(jié)果的調(diào)度優(yōu)化策略,并量化其期望收益。解:(1)流程a.數(shù)據(jù)清洗:剔除連續(xù)缺失>2小時站點;線性插值補全短缺口;異常值用3σ規(guī)則+孤立森林聯(lián)合檢測。b.特征工程:時間特征:星期、節(jié)假日、寒暑假、節(jié)氣;天氣特征:溫度、濕度、風速、降水,使用滯后0–2小時;空間特征:站點500米內(nèi)POI數(shù)量(辦公、住宅、公交)、地鐵進站量滾動30分鐘和;歷史特征:同期上周同期借車量、上周同期還車量、過去24小時滑動平均;交互特征:溫度×節(jié)假日、降雨×工作日;對高度偏斜變量做Box-Cox。c.模型選擇:基準:SARIMA(0,1,3)(0,1,1)??+外部回歸(SARIMAX);機器學習:GradientBoostingTrees(LightGBM),含類別特征直接支持;深度學習:TemporalFusionTransformer(TFT),編碼靜態(tài)站點屬性、動態(tài)時變變量;驗證:2023年7—10月滾動窗口,步長1天,預測horizon=7×96=672步。評估:RMSE、MAE、MAPE、CRPS、區(qū)間覆蓋率、技能分數(shù)Skill=1?RMSE/naive。結(jié)果:TFT在CRPS領(lǐng)先7.3%,LightGBM在MAPE領(lǐng)先2.1%,但TFT概率預測校準更好,故選TFT。d.概率預測:TFT輸出分位數(shù)0.1–0.9,共9分位;用PinballLoss調(diào)參;對極端事件(暴雨、演唱會)引入貝葉斯后驗修正,融合氣象部門降水概率。e.驗證:PIT圖近似均勻,區(qū)間覆蓋率94.8%vs名義95%,表明校準良好;DM檢驗p<0.01優(yōu)于其余模型。(2)調(diào)度優(yōu)化a.決策變量:每晚22:00決定調(diào)度卡車數(shù)量K及路徑,目標次日早高峰(7:00–9:00)缺車數(shù)期望最小。b.需求缺口:對站點i,早高峰借車預測分布Qi~TFT輸出,還車分布Ri~同理;凈需求Di=Qi?Ri。c.缺車概率:P(Di>bi)=1?F_Di(bi),bi為當前庫存。d.期望缺車:E[max(Di?bi,0)]=∫_{bi}^{∞}(x?bi)f_Di(x)dx,用分位數(shù)插值快速算。e.收益:每減少一次缺車可節(jié)省用戶流失成本3元,調(diào)度成本含卡車固定200元/輛、可變1.2元/輛·公里。f.模型:隨機規(guī)劃,目標min調(diào)度成本+3×E[缺車];解:用SampleAverageApproximation,抽樣500次,CPLEX求解;對1005站點聚類為80區(qū)域,降維。g.結(jié)果:優(yōu)化后早高峰缺車數(shù)下降42%,日期望凈收益增加1.37萬元;敏感性分析顯示降水概率>60%時收益下降但仍為正。五、案例分析題(共20分)21.某省疾控中心需預測流感樣病例(ILI)周發(fā)病率,以提前調(diào)配醫(yī)療資源。數(shù)據(jù):2010—2023年周數(shù)據(jù),含ILI%、氣溫、濕度、疫苗接種率、學校開學時間、搜索引擎流感指數(shù)。(1)指出流感預測相比普通銷售預測的三項特殊挑戰(zhàn);(2)給出融合搜索指數(shù)的建模方案,并說明如何檢驗指數(shù)增量信息;(3)若2024年春季出現(xiàn)新型變異株,導致歷史關(guān)系突變,如何在線更新預測?解:(1)挑戰(zhàn)a.非平穩(wěn)性:病毒變異導致傳播機制突變,歷史參數(shù)失效;b.多重時間尺度:季節(jié)性+局部爆發(fā)+長期趨勢,需分層建模;c.數(shù)據(jù)延遲:ILI報告滯后1–2周,搜索指數(shù)實時但噪聲大,需處理延遲與精度權(quán)衡。(2)方案a.結(jié)構(gòu):狀態(tài)空間模型,觀測方程ILI_t真實=報告_t+δ_t,δ_t~N(0,σ2_δ)反映延遲;狀態(tài)含真實ILI、搜索指數(shù)偏差、變異株指示;b.搜索指數(shù)處理:對原始指數(shù)做平滑,取對數(shù)差分;用Granger因果檢驗確認搜索指數(shù)滯后1–2周對ILI顯著;c.信息檢驗:構(gòu)建嵌套模型,無搜索指數(shù)vs有搜索指數(shù),比較邊緣似然,BF>10認為顯著;亦可用R2增加、DM檢驗。(3)在線更新a.采用貝葉斯動態(tài)線性模型(DLM),允許時變回歸系數(shù);b.設(shè)置變異株指示變量為隱Markov狀態(tài),轉(zhuǎn)移概率用BayesianChangepointDetector估計;c.每周更新后驗,若檢測到結(jié)構(gòu)突變(后驗概率>0.7),擴大系統(tǒng)噪聲方差,讓模型快速自適應;d.用ParticleLearning實現(xiàn)高效在線推斷,延遲<30秒;e.對極端情景,引入專家先驗,如R0提升50%,先驗加權(quán)融合。六、編程與計算題(共20分)22.使用Python完成以下任務(wù)并給出代碼與輸出截圖(文字描述即可):(1)生成長度120的AR(2)序列:Xt=1.2X_{t-1}?0.5X_{t-2}+εt,εt~N(0,1),前200期burn-in;(2)用statsmodels擬合AR(p),p由BIC選擇,輸出參數(shù)估計與殘差Ljung-Boxp值;(3)做h=1–12步預測,繪制預測均值與90%區(qū)間;(4)計算CRPS并解釋其相對MAE的優(yōu)勢。代碼:```pythonimportnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltfromstatsmodels.tsa.ar_modelimportAutoRegfromstatsmodels.stats.diagnosticimportacorr_ljungboxfromscipy.statsimportnormfromsklearn.metricsimportmean_absolute_error(1)np.random.seed(42)n=120burn=200ar=np.array([1.2,-0.5])sigma=1x=np.zeros(burn+n)eps=np.random.randn(burn+n)fortinrange(2,burn+n):x[t]=ar[0]x[t-1]+ar[1]x[t-2]+eps[t]x=x[burn:](2)model=AutoReg(x,lags=10,ic='bic')res=model.fit()print(res.summary())lb=acorr_ljungbox(res.resid,lags=10,return_df=True)print('Ljung-Boxp:',lb['lb_pvalue'].min())(3)pred=res.get_prediction(start=len(x),end=len(x)+11)mean=pred.predicted_meanci=pred.conf_int(alpha=0.1)plt.figure(figsize=(8,4))plt.plot(np.arange(len(x)),x,label='Obs')plt.plot(np.arange(len(x),len(x)+12),mean,label='Forecast')plt.fill_between(np.arange(len(x),len(x)+12),ci.iloc[:,0],ci.iloc[:,1],color='gray',alpha=0.3)plt.legend()plt.show()(4)true=x[-12:]#pse

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論