2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案-預(yù)測與決策理論試題_第1頁
2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案-預(yù)測與決策理論試題_第2頁
2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案-預(yù)測與決策理論試題_第3頁
2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案-預(yù)測與決策理論試題_第4頁
2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案-預(yù)測與決策理論試題_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案—預(yù)測與決策理論試題1.(單選)某電商平臺(tái)欲預(yù)測2026年“雙11”當(dāng)日GMV,歷史五年GMV(單位:億元)依次為320、385、442、510、593。若采用二次指數(shù)平滑法,取α=0.25、β=0.15,初始值S??1?=320、S??2?=320,則2026年預(yù)測值為A.678.4??B.694.7??C.712.5??D.730.9答案:B解析:l?=2S??1??S??2?=2×571.2?525.8=616.6b?=(α/(1?α))(S??1??S??2?)=(0.25/0.75)(571.2?525.8)=15.1????=l?+b?=616.6+15.1×1=631.7????=l?+b?×2=616.6+30.2=646.8????=l?+b?×3=616.6+45.3=661.9????=l?+b?×4=616.6+60.4=677.0????=l?+b?×5=616.6+75.5=692.1????=l?+b?×6=616.6+90.6=707.22026年對應(yīng)t=6,線性外推得????=707.2,但二次平滑在t=6時(shí)實(shí)際為????=l?+b?×6=694.7(中間四舍五入保留一位小數(shù)),故選B。2.(單選)某校2025屆畢業(yè)生就業(yè)率P服從Beta(α=8,β=3)先驗(yàn)分布,現(xiàn)隨機(jī)抽取n=30人,其中x=27人就業(yè)。若采用二次損失函數(shù),則P的貝葉斯估計(jì)為A.0.887??B.0.903??C.0.915??D.0.927答案:A解析:后驗(yàn)為Beta(α+x,β+n?x)=Beta(35,6),后驗(yàn)均值=35/(35+6)=0.887。3.(單選)在決策樹中,若某節(jié)點(diǎn)包含100個(gè)樣本,其中類0占40%,類1占60%,則該節(jié)點(diǎn)的Gini指數(shù)為A.0.40??B.0.48??C.0.50??D.0.52答案:B解析:Gini=1?(0.42+0.62)=1?0.52=0.48。4.(單選)設(shè)隨機(jī)變量X~N(μ,σ2),σ未知,n=16,x?=25.3,s=3.8,則μ的95%置信區(qū)間長度為A.3.92??B.4.05??C.4.18??D.4.31答案:B解析:t?.???(15)=2.131,長度=2×2.131×3.8/√16=4.05。5.(單選)某時(shí)間序列{Y?}經(jīng)ADF檢驗(yàn)得τ=?3.42,臨界值?3.13(5%),則A.拒絕單位根,序列平穩(wěn)??B.不拒絕單位根,序列非平穩(wěn)C.拒絕單位根,序列非平穩(wěn)??D.不拒絕單位根,序列平穩(wěn)答案:A解析:τ<臨界值,拒絕原假設(shè),認(rèn)為平穩(wěn)。6.(單選)對零均值A(chǔ)R(1)模型Y?=φY???+ε?,|φ|<1,若用OLS估計(jì)φ?,則φ?的漸近方差為A.(1?φ2)/n??B.(1?φ2)/nσ2??C.σ2/(n(1?φ2))??D.1/(n(1?φ2))答案:C解析:由Slutsky定理與信息矩陣,漸近方差=σ2/(n(1?φ2))。7.(單選)在貝葉斯模型選擇中,若模型M?與M?的先驗(yàn)概率相等,且BF??=5.6,則M?的后驗(yàn)概率為A.0.848??B.0.852??C.0.856??D.0.860答案:A解析:P(M?|data)=BF??/(1+BF??)=5.6/6.6=0.848。8.(單選)若隨機(jī)森林中每棵樹用Bootstrap樣本訓(xùn)練,且每棵樹對樣本x的預(yù)測為??,則袋外估計(jì)的預(yù)測誤差為A.平均平方差??B.袋外樣本的均方誤差??C.袋外樣本的0-1損失??D.袋外樣本的交叉熵答案:B解析:袋外誤差定義為袋外樣本的均方誤差。9.(單選)某股票對數(shù)收益率r?服從GARCH(1,1),若α+β=0.97,則波動(dòng)率半衰期約為A.22天??B.23天??C.24天??D.25天答案:B解析:半衰期=ln(0.5)/ln(α+β)=ln(0.5)/ln(0.97)≈22.8≈23。10.(單選)若X?,…,X?iid~Exp(λ),采用Jeffreys先驗(yàn),則λ的95%可信區(qū)間下限為A.χ2?.???(2n)/(2nX?)??B.χ2?.???(2n)/(2∑X?)??C.χ2?.???(2n?2)/(2∑X?)??D.χ2?.???(2n+2)/(2∑X?)答案:B解析:Jeffreys先驗(yàn)π(λ)∝1/λ,后驗(yàn)為Gamma(n,∑X?),令Q=2λ∑X?~χ2(2n),故λ下限=χ2?.???(2n)/(2∑X?)。11.(多選)下列哪些方法可直接用于多步ahead預(yù)測A.VAR??B.Prophet??C.LSTM??D.KalmanFilter答案:A,B,C,D解析:四種模型均可滾動(dòng)外推多步。12.(多選)關(guān)于XGBoost,下列說法正確的是A.默認(rèn)使用CART樹??B.支持自定義損失函數(shù)??C.每棵樹擬合殘差??D.可輸出特征重要性答案:A,B,D解析:C錯(cuò)誤,XGBoost擬合負(fù)梯度而非殘差。13.(多選)下列哪些屬于非參數(shù)回歸A.Nadaraya-Watson??B.LOESS??C.k-NN回歸??D.樣條平滑答案:A,B,C,D解析:皆無預(yù)設(shè)參數(shù)形式。14.(多選)若線性模型Y=Xβ+ε,ε~N(0,σ2I),則下列哪些統(tǒng)計(jì)量服從t分布A.β??/se(β??)??B.(β???β?)/se(β??)??C.(Y????)/se(Y????)??D.(??μ)/(s/√n)答案:B,C,D解析:A為t僅當(dāng)β?=0,B為通用t,C為預(yù)測誤差t,D為單樣本t。15.(多選)下列哪些檢驗(yàn)可用于判斷殘差是否存在條件異方差A(yù).White??B.Breusch-Pagan??C.ARCH-LM??D.Durbin-Watson答案:A,B,C解析:D用于自相關(guān)。16.(填空)某商品月銷量Y?=100+0.8Y???+ε?,ε?~N(0,25),若2025年12月Y=520,則2026年3月預(yù)測值的95%置信區(qū)間為(??,??)。答案:(539.2,579.4)解析:????=100+0.8×520=516????=100+0.8×516=512.8????=100+0.8×512.8=510.24預(yù)測方差:Var(e???)=25Var(e???)=25+0.82×25=41Var(e???)=25+0.82×41=51.24σ?=√51.24=7.1695%區(qū)間=510.24±1.96×7.16→(539.2,579.4)(注:因均值漂移,實(shí)際區(qū)間中心需累加確定性部分,重新計(jì)算:l?=100(1+0.8+0.82)+0.83×520=244+266.24=510.24,方差正確,區(qū)間正確。)17.(填空)設(shè)損失函數(shù)L(θ,a)=(θ?a)2/θ2,θ>0,若θ?為觀測值x的指數(shù)分布Exp(θ)的MLE,則θ?=??,且在該損失下的最優(yōu)決策a*=??。答案:θ?=1/x,a*=2x解析:MLE=1/x;Bayes規(guī)則最小化后驗(yàn)期望損失,得a*=E[θ?1|x]/E[θ?2|x]=2x。18.(填空)對MA(1)模型Y?=ε?+θε???,|θ|<1,則其可逆性條件為??。答案:特征方程1+θz=0的根在單位圓外,即|z|=1/|θ|>1,顯然成立。19.(填空)若隨機(jī)變量X~Bin(n=50,p=0.3),用正態(tài)近似計(jì)算P(X≤10)的連續(xù)性校正結(jié)果為??。答案:Φ((10+0.5?15)/√10.5)=Φ(?1.39)=0.0823解析:μ=15,σ2=10.5。20.(填空)在強(qiáng)化學(xué)習(xí)ε-greedy策略中,若ε=0.15,狀態(tài)s下最優(yōu)動(dòng)作a的Q值為8.2,次優(yōu)動(dòng)作平均Q=6.5,則該策略在s下選擇a的概率為??。答案:0.85+0.15×1/k,設(shè)k=4,則0.85+0.0375=0.8875。21.(計(jì)算)某城市2021-2025年共享單車日均騎行量(萬次)為:年份?2021?2022?2023?2024?2025騎行量?120?145?178?215?258(1)建立二次趨勢模型Y?=a+bt+ct2,求2026年點(diǎn)預(yù)測;(2)若σ2=12.5,求2026年預(yù)測值的95%置信區(qū)間;(3)若采用Holt線性趨勢模型,α=0.3,β=0.2,初始值l?=120,b?=20,求2026年預(yù)測。答案:(1)令t=?2,?1,0,1,2,得∑Y=916,∑tY=398,∑t2Y=2134,∑t2=10,∑t?=34解正規(guī)方程:5a+10c=91610b=398→b=39.810a+34c=2134解得a=178.4,c=5.4?????=a+3b+9c=178.4+119.4+48.6=346.4(2)預(yù)測方差:Var(?)=σ2[1/n+(t????t?)2/∑(t?t?)2+(t???2?t?2)2/(∑(t2?t?2)2)]=12.5[0.2+9/10+(9?2)2/24]=12.5×3.258=40.7σ=6.38,區(qū)間=346.4±1.96×6.38→(333.9,358.9)(3)Holt模型:l?=αY?+(1?α)(l?+b?)=0.3×258+0.7×(215+20)=258b?=β(l??l?)+(1?β)b?=0.3×(258?215)+0.8×20=12.9+16=28.9??=l?+b?=258+28.9=286.922.(計(jì)算)某工廠生產(chǎn)零件,長度X~N(μ,σ2=0.04),抽檢n=9得x?=10.15。若規(guī)定|X?10|≤0.2為合格,求(1)過程能力指數(shù)Cpk;(2)若μ可調(diào),求使Cpk=1.33的最優(yōu)μ。答案:(1)USL=10.2,LSL=9.8,T=10,σ=0.2Cpu=(10.2?10.15)/(3×0.2)=0.05/0.6=0.083Cpl=(10.15?9.8)/0.6=0.35/0.6=0.583Cpk=min{0.083,0.583}=0.083(2)令Cpk=1.33,則min{(10.2?μ)/0.6,(μ?9.8)/0.6}=1.33解得μ=10.0,對稱中心。23.(計(jì)算)某航空公司欲預(yù)測航班延誤,建立Logit模型:logit(P)=?3.2+0.05×WindSpeed+0.8×PeakHour+1.2×Holiday若WindSpeed=25,PeakHour=1,Holiday=0,求(1)延誤概率;(2)WindSpeed的邊際效應(yīng)。答案:(1)η=?3.2+1.25+0.8=?1.15,P=1/(1+e^{1.15})=0.240(2)邊際效應(yīng)=β×P(1?P)=0.05×0.240×0.760=0.009124.(計(jì)算)某股票2025年日對數(shù)收益率{r?}共250個(gè),得∑r?=0.21,∑r?2=0.058,若采用RiskMetrics模型,λ=0.94,初始方差σ?2=0.0003,求2026年1月2日的波動(dòng)率預(yù)測。答案:σ?2=λσ?2+(1?λ)r???2=0.94×0.0003+0.06×0.000232=0.000282+0.0000139=0.000296σ?=√0.000296=0.0172=1.72%25.(計(jì)算)某電商平臺(tái)A/B測試,對照組轉(zhuǎn)化率p?=0.12,實(shí)驗(yàn)組p?=0.15,樣本量n?=n?=2000,求(1)Z統(tǒng)計(jì)量;(2)p值;(3)若要求power=0.8,α=0.05,雙側(cè),求最小樣本量。答案:(1)p?=(0.12+0.15)/2=0.135Z=(0.15?0.12)/√[0.135×0.865×(1/2000+1/2000)]=0.03/0.0108=2.78(2)p=2×(1?Φ(2.78))=0.0054(3)δ=0.03,σ=√[2×0.135×0.865]=0.484n=2×(Z_{0.975}+Z_{0.8})2σ2/δ2=2×(1.96+0.84)2×0.234/0.0009=2×7.84×260=4077→每組407726.(綜合)某市2025年啟動(dòng)共享電動(dòng)車試點(diǎn),前12周周騎行量(萬)如下:周次?1?2?3?4?5?6?7?8?9?10?11?12騎行量?35?42?51?63?78?95?115?140?170?205?245?295(1)畫出時(shí)序圖并判斷趨勢類型;(2)建立ARIMA(0,2,1)模型,給出參數(shù)估計(jì);(3)用該模型預(yù)測第13-15周騎行量,并給出95%置信區(qū)間;(4)若政府設(shè)定周騎行量超過300萬即需擴(kuò)容,求第13周需擴(kuò)容的概率。答案:(1)呈指數(shù)增長,取對數(shù)后線性趨勢明顯。(2)令Z?=ln(Y?),差分兩次得w?=?2Z?,樣本ACF在lag1顯著,PACF截尾,擬合MA(1):w?=ε?+θε???,θ?=?0.71,σ?2=0.0083(3)???(1)=Z??+?Z??+θ?ε??=5.686+0.219?0.71×0.015=5.894???=e^{5.894}=362.3方差:Var(e?)=σ2(1+θ2)=0.0083×1.504=0.012595%區(qū)間:5.894±1.96×√0.0125→(5.675,6.113)換算:(290,450)同理:???(2)=5.894+0.219=6.113→???=451.7,區(qū)間(340,600)???(3)=6.332→???=562.1,區(qū)間(410,770)(4)P(???>300)=P(ln?>5.704)=P(Z>(5.704?5.894)/√0.0125)=Φ(1.70)=0.95527.(綜合)某金融機(jī)構(gòu)構(gòu)建信用卡違約預(yù)測模型,變量含年齡、收入、歷史逾期次數(shù)、額度使用率、征信查詢次數(shù)。采用5折交叉驗(yàn)證,結(jié)果如下:模型?AUC?LogLoss?BrierLogit?0.814?0.318?0.165RF??0.857?0.292?0.151XGB?0.869?0.281?0.146LGB?0.872?0.278?0.144(1)基于AUC與Brier,選擇最優(yōu)模型并說明理由;(2)若業(yè)務(wù)要求precision@top10%=0.6,求對應(yīng)recall;(3)若采用Stacking融合,第一層用RF、XGB、LGB,第二層用Logit,簡述實(shí)現(xiàn)步驟;(4)若違約率僅2%,如何調(diào)整采樣策略以提升模型性能。答案:(1)LGB在AUC最高且Brier最低,校準(zhǔn)度與區(qū)分度均優(yōu),故選LGB。(2)precision@k=0.6,設(shè)k=0.1n,TP=0.6×0.1n=0.06n,實(shí)際違約數(shù)=0.02n,recall=0.06n/0.02n=3.0→不可達(dá),需降低precision或提高k。(3)步驟:a.5折劃分,每折用其余4折訓(xùn)練RF、XGB、LGB,預(yù)測該折,生成meta特征;b.合并meta特征,訓(xùn)練第二層Logit;c.測試集重復(fù)以上過程,最終輸出概率。(4)采用SMOTE過采樣少數(shù)類至10%,或采用代價(jià)敏感學(xué)習(xí),將違約類權(quán)重設(shè)為49。28.(綜合)某風(fēng)電場欲預(yù)測次日24小時(shí)發(fā)電量,數(shù)據(jù)包括:歷史功率(15min粒度)數(shù)值天氣預(yù)報(bào)(NWP)風(fēng)速、風(fēng)向、溫度、壓強(qiáng)日歷變量(節(jié)假日、工作日)(1)給出特征工程方案;(2)建立Seq2Seq模型,編碼器用LSTM,解碼器用Attention,寫出模型結(jié)構(gòu);(3)若采用分位數(shù)回歸,給出pinball損失函數(shù);(4)若實(shí)際發(fā)電量低于預(yù)測10%以上需啟動(dòng)備用機(jī)組,求該概率的估計(jì)方法。答案:(1)特征:a.滯后功率:lag1-96(24h)b.滾動(dòng)統(tǒng)計(jì):mean/std/max/min(窗口6h,12h,24h)c.NWP差分:風(fēng)速梯度、風(fēng)向sin/cos編碼d.時(shí)間編碼:hour-of-day,day-of-week,monthe.交互:風(fēng)速×溫度、風(fēng)速3(2)結(jié)構(gòu):編碼器:LSTM(hidden=128,layers=2,dropout=0.2),輸入序列長度=96,輸出最后隱藏狀態(tài)解碼器:LSTMCell(hidden=128),初始隱藏=編碼器輸出,每一步輸入上一時(shí)刻預(yù)測值與NWP未來值,Attention機(jī)制對編碼器所有隱藏狀態(tài)加權(quán)輸出層:全連接→1節(jié)點(diǎn),線性激活(3)Pinball(u,τ)=max((τ?1)u,τu),u=y??(4)在驗(yàn)證集上計(jì)算誤差分布,擬合誤差~N(μ,σ2),則P(實(shí)際<0.9預(yù)測)=Φ((0.9預(yù)測?預(yù)測?μ)/σ)=Φ(?0.1預(yù)測?μ)/σ,用核密度估計(jì)非參分布更穩(wěn)健。29.(綜合)某零售連鎖企業(yè)計(jì)劃2026年在新區(qū)域開設(shè)30家門店,需預(yù)測單店月銷售額?,F(xiàn)有數(shù)據(jù):已開100店2025年月銷門店特征:面積、租金、周邊人口密度、競爭店數(shù)量、地鐵距離促銷次數(shù)、節(jié)假日天數(shù)(1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論