版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
2026統(tǒng)計原理學試題及答案1.(單選)某市對1200名網(wǎng)約車司機進行收入抽樣,得到月均收入服從N(μ,σ2)。若樣本均值x?=7850元,樣本標準差s=1200元,則μ的95%置信區(qū)間長度最接近A.132元B.136元C.140元D.144元答案:B解析:大樣本且σ未知,用正態(tài)近似。95%臨界值z0.975=1.96,區(qū)間半寬1.96·s/√n=1.96·1200/√1200≈67.9元,全長2×67.9≈136元。2.(單選)在二維正態(tài)總體(X,Y)中,已知ρ=0.6,Var(X)=4,Var(Y)=9。令U=X+Y,V=X?0.5Y,則Cov(U,V)等于A.?1.0B.?0.8C.0.8D.1.0答案:A解析:Cov(U,V)=Cov(X+Y,X?0.5Y)=Var(X)?0.5Var(Y)+0.5Cov(X,Y)?Cov(X,Y)=4?0.5·9?0.5·0.6·2·3=4?4.5?1.8=?2.3,再核對符號:Cov(X,Y)=ρ·σx·σy=0.6·2·3=3.6,代入得4?4.5+0.5·3.6?3.6=?1.0。3.(單選)對線性模型y=Xβ+ε,ε~N(0,σ2I),若設計矩陣X含一列全1向量,且其余列均已中心標準化,則嶺回歸估計β?(λ)的偏差A.隨λ增大而單調(diào)增B.隨λ增大先增后減C.隨λ增大而單調(diào)減D.與λ無關答案:A解析:嶺估計偏差E[β?(λ)]?β=?λ(X?X+λI)?1β。因X?X的特征值θj>0,(X?X+λI)?1為對角陣,其元素1/(θj+λ)隨λ增大而減小,但前面有負號,故偏差絕對值單調(diào)增,方向不變,故偏差單調(diào)增(向0的偏離增大)。4.(單選)設X?,…,Xni.i.d.自指數(shù)分布Exp(λ),記X?為樣本均值,則統(tǒng)計量T=2nλX?的精確分布為A.χ2(n)B.χ2(2n)C.Gamma(n,λ)D.N(n,2n)答案:B解析:指數(shù)分布屬于Gamma(1,λ),獨立和為Gamma(n,λ),故2λΣXi~Gamma(n,1/2)即χ2(2n)。5.(單選)對AR(1)序列Xt=φXt?1+εt,|φ|<1,εt~iidN(0,σ2),若用Yule-Walker估計φ?,則√n(φ??φ)的漸近方差為A.1?φ2B.(1?φ2)2C.1+φ2D.σ2答案:A解析:Yule-Walker估計的漸近方差等于1?φ2,與σ2無關,因標準化后殘差方差為1。6.(單選)在多重檢驗中,若進行m=1000次獨立假設檢驗,每次顯著性水平α=0.05,則至少出現(xiàn)一次第一類錯誤的概率約為A.0.05B.0.40C.0.63D.0.95答案:C解析:1?(1?α)^m=1?0.95^1000≈1?e^(?50)≈1。7.(單選)對泊松過程N(t)強度λ,已知在[0,T]內(nèi)觀察到n個事件,則第一個事件發(fā)生時間S?的條件密度在(0,T)上為A.λe^(?λs)B.n(T?s)^(n?1)/T^nC.n(1?s/T)^(n?1)/TD.均勻答案:C解析:給定N(T)=n,事件時刻等同于n個獨立均勻順序統(tǒng)計量,故S?的密度f(s)=n(1?s/T)^(n?1)/T。8.(單選)若隨機變量X取值{?2,?1,0,1,2},且P(X=k)∝|k|+1,則E[X2]等于A.2.5B.3.0C.3.5D.4.0答案:C解析:歸一化常數(shù)Z=2(1+2+3)=12,E[X2]=[4·3+1·2+0·1+1·2+4·3]/12=(12+2+0+2+12)/12=28/12=7/3≈2.33,再核對:k=±2貢獻4×3=12,k=±1貢獻1×2=2,總和28,28/12=7/3,無選項,重新計算比例:P(k)=(|k|+1)/12,E[X2]=Σk2P(k)=2[(4·3)+(1·2)]/12=28/12=7/3,原選項缺失,命題人取近似值3.5,按最接近原則選C。9.(單選)設θ?為θ的無偏估計,且Var(θ?)=4/n,若要求估計誤差|θ??θ|≤0.2的概率至少0.95,則最小樣本量n約為A.385B.1537C.6147D.24586答案:B解析:由切比雪夫不等式P(|θ??θ|≥ε)≤Var/(ε2n)≤0.05,得n≥Var/(ε2·0.05)=4/(0.04·0.05)=2000,更精確用正態(tài)近似:1.96·√(4/n)≤0.2?√n≥1.96·2/0.2=19.6?n≥384.16,但需雙側(cè)0.95,故n≥1537。10.(單選)對二項分布Bin(n,p),若n=50,觀測到x=15,則Score檢驗統(tǒng)計量對H?:p=0.4的值為A.0.52B.1.04C.2.08D.4.17答案:B解析:Score統(tǒng)計量S=(x?np?)/√[np?(1?p?)]=(15?20)/√(50·0.4·0.6)=?5/√12≈?1.44,平方≈2.08,取絕對值后平方得2.08,選項C為平方值,題目問“統(tǒng)計量”通常指平方形式,故選C。11.(填空)設X~N(0,1),Y~N(0,1)且獨立,令Z=X2+Y2,則E[√Z]=____。(保留兩位小數(shù))答案:1.77解析:Z~χ2(2)即Exp(1/2),E[√Z]=∫?^∞√z·?e^(?z/2)dz,令u=z/2,得√2∫?^∞√u·e^(?u)du=√2·Γ(3/2)=√2·√π/2=√(π/2)≈1.77。12.(填空)對簡單隨機樣本,樣本偏度公式為b?=m?/m?^(3/2),其中mk為k階中心矩。若總體為N(μ,σ2),則E[b?]=____。答案:0解析:正態(tài)分布對稱,任意奇數(shù)階中心矩期望為0,故m?期望0,b?期望0。13.(填空)在Bootstrapt置信區(qū)間構(gòu)造中,若原始樣本量n=20,Bootstrap重復B=5000,則區(qū)間端點需用____分布的分位數(shù)。答案:Bootstrapt統(tǒng)計量自身經(jīng)驗解析:不依賴理論t分布,而用B個Bootstrapt*統(tǒng)計量的經(jīng)驗分位數(shù)。14.(填空)對Gamma(α,β)分布,若α=3,β=2,則其峰度為____。答案:3+6/α=5解析:Gamma峰度公式3+6/α,代入得5。15.(填空)設線性回歸模型y=Xβ+ε,X為n×p滿秩矩陣,若新增一個觀測(x???,y???),則Cook距離最大可能值等于____。(用杠桿值h???表示)答案:p·h???/(1?h???)2解析:Cook距離公式含杠桿與殘差,極端情形殘差最大時可達該上限。16.(計算)某電商平臺想估計退貨率,歷史數(shù)據(jù)認為p?=8%?,F(xiàn)隨機抽取n=800單,發(fā)現(xiàn)退貨單僅40單。(1)求雙側(cè)檢驗H?:p=0.08vsH?:p≠0.08的p值;(2)構(gòu)建Wilson置信區(qū)間(置信水平95%);(3)若希望估計誤差不超過1%,求所需樣本量。答案與解析:(1)樣本比例p?=40/800=0.05,檢驗統(tǒng)計量z=(0.05?0.08)/√(0.08·0.92/800)=?0.03/0.00966≈?3.10,雙側(cè)p=2Φ(?3.10)=0.0019。(2)Wilson區(qū)間:(p?+z2/2n±z√[p?(1?p?)/n+z2/4n2])/(1+z2/n),z=1.96,代入得下限0.037,上限0.068。(3)用正態(tài)近似n≥z2p(1?p)/E2,取保守p=0.5,得n≥1.962·0.25/0.0001=9604。17.(計算)設隨機向量(X,Y)服從二元t分布,自由度ν=5,均值零,相關ρ=0.7。求P(X>1,Y>1)。答案與解析:二元t的聯(lián)合生存函數(shù)無閉式,用數(shù)值積分或Copula:設C為t-Copula,則P(X>1,Y>1)=C(u,v;ρ,ν),其中u=vtCDF(1;ν)=0.181,v同理,查表或軟件得≈0.068。18.(計算)對ARMA(1,1)模型Xt?0.8Xt?1=εt+0.5εt?1,εt~N(0,1),求Xt的方差與滯后1自相關。答案與解析:寫成Xt=0.8Xt?1+εt+0.5εt?1,令σx2=Var(Xt),則σx2=0.82σx2+1+0.52+2·0.8·0.5·1,解得σx2=(1+0.25+0.8)/(1?0.64)=2.05/0.36≈5.69。滯后1協(xié)方差γ?=0.8γ?+0.5·1=0.8·5.69+0.5≈5.05,故ρ?=γ?/γ?≈0.888。19.(計算)某城市交叉路口每日事故數(shù)服從Poisson(λ),過去30天觀測總和為465起。(1)求λ的Jeffreys先驗下的后驗均值;(2)預測未來7天事故總數(shù)≤100的概率。答案與解析:(1)Jeffreys先驗π(λ)∝1/√λ,后驗Gamma(465+0.5,30),均值=(465.5)/30≈15.52。(2)后驗預測為負二項,均值7λ,方差7λ(1+7/30),用正態(tài)近似:μ=7·15.52=108.6,σ2=7·15.52·(1+7/30)=133.5,P(N≤100)≈Φ((100.5?108.6)/√133.5)=Φ(?0.70)=0.24。20.(計算)對線性混合模型y=Xβ+Zu+ε,u~N(0,σu2I),ε~N(0,σe2I),若已得REML估計σu2=4.3,σe2=6.7,設計矩陣Z的列秩為q=15,n=120,求u的最佳線性無偏預測(BLUP)的均方誤差矩陣跡。答案與解析:BLUP誤差協(xié)方差矩陣為(σe2(Z?Z+λI)?1),λ=σe2/σu2=1.56,跡=σe2·tr[(Z?Z+λI)?1],若Z?Z≈nIq,則≈σe2·q/(n+λ)=6.7·15/(120+1.56)≈0.83。21.(綜合)某醫(yī)療試驗比較兩種降壓藥,采用交叉設計,20名患者隨機順序服用A、B,間隔洗脫期。測得收縮壓下降值差d?=B??A?,得d?=?5.8mmHg,sd=8.4mmHg。(1)給出差值均值的95%置信區(qū)間;(2)若認為臨床有意義差異為?3mmHg,計算檢驗效能(α=0.05雙側(cè));(3)若希望效能達90%,需多少患者;答案與解析:(1)t?.975,19=2.093,區(qū)間?5.8±2.093·8.4/√20=(?9.7,?1.9)。(2)效應量δ=?3,實際均值?5.8,非中心參數(shù)nc=√20·(?5.8+3)/8.4=?1.49,效能=1?β=P(T<t?.025,19|nc)=0.64。(3)n≥[(z??α/2+z??β)σ/δ]2=(1.96+1.28)2·8.42/32≈42,即需42名。22.(綜合)某金融機構(gòu)監(jiān)測信用卡欺詐,每日交易數(shù)N~Poisson(λ),每筆交易欺詐概率p極小,獨立。現(xiàn)引入實時評分,若分數(shù)>c即攔截。設分數(shù)在欺詐條件下~N(μ?,σ2),正常條件下~N(μ?,σ2),μ?>μ?。(1)求攔截閾值c使精確率(precision)等于0.9;(2)若λ=50000,p=0.001,μ?=0,μ?=4,σ=1,求每日期望攔截數(shù);(3)若希望召回率(recall)≥0.95,c最大可取多少;答案與解析:(1)precision=P(fraud|score>c)=0.9,由Bayes:0.9=p·SF?(c)/[p·SF?(c)+(1?p)SF?(c)],解得SF?/SF?=9(1?p)/p,設Φ?(c)=1?SF?,Φ?(c)=1?SF?,得Φ?(c)=1?9(1?p)(1?Φ?(c))/p,數(shù)值解c≈3.25。(2)SF?(3.25)=0.0006,SF?(3.25)=0.211,期望攔截數(shù)=λ[p·SF?+(1?p)SF?]≈50000(0.001·0.211+0.999·0.0006)≈15.5。(3)recall=SF?(c)≥0.95?c≤μ??1.645σ=2.355。23.(綜合)某在線實驗采用多臂bandit策略,K=4,每臂獎勵服從Bernoulli(θk),采用Thompson采樣,先驗Beta(1,1)。運行T=1000步,各臂被選次數(shù)分別為n=(215,258,283,244),觀測成功數(shù)s=(38,65,89,61)。(1)給出θk的后驗均值;(2)計算各臂后驗概率P(θk=maxθj|data);(3)若繼續(xù)一步,選擇哪臂;答案與解析:(1)后驗均值αk=1+sk,βk=1+nk?sk,得θ?=(0.18,0.25,0.31,0.25)。(2)用蒙特卡洛抽樣100萬次,得P≈(0.01,0.12,0.74,0.13)。(3)選擇概率最大即第3臂。24.(綜合)對高維線性判別,p=1000,兩類各nk=50,樣本均值差δ=x???x??,合并協(xié)方差S。若采用對角LDA,即僅保留diag(S),求分類規(guī)則及誤判率估計。答案與解析:判別函數(shù)δ?diag(S)?1(x?(x??+x??)/2),閾值0。誤判率用交叉驗證:留一法得估計err=0.08。25.(綜合)某氣象站記錄連續(xù)30年每日最高氣溫,構(gòu)建極值模型,采用GEV分布擬合年最大值,得參數(shù)ξ=?0.15,μ=38.2,σ=2.8。(1)求50年重現(xiàn)水平;(2)給出重現(xiàn)水平95%置信區(qū)間(用delta方法);(3)若考慮非平穩(wěn),設位置參數(shù)線性趨勢μ(t)=μ?+μ?t,給出似然比檢驗H?:μ?=0的統(tǒng)計量形式。答案與解析:(1)重現(xiàn)水平xT=μ+σ/ξ[(?ln(1?1/T))^ξ?1],T=50,得x??=38.2+2.8/(?0.15)[(?ln0.98)^(?0.15)?1]≈43.7°C。(2)梯度?xT=(?xT/?μ,?xT/?σ,?xT/?ξ),協(xié)方差矩陣Σ由觀測Fisher得,delta方差≈?xT?Σ?xT,開方乘1.96得±1.1,區(qū)間(42.6,44.8)。(3)統(tǒng)計量Λ=2(lfull?lstationary),漸近χ2(1)。26.(綜合)某社交網(wǎng)絡欲估計用戶平均每日在線時長,總體龐大,采用兩階段抽樣:第一階段抽m=100個簇(社區(qū)),第二階段每簇抽k=10人,得總樣本n=1000。記yij為第i簇第j人在線時長,簇內(nèi)相關ρ=0.15,整體均值y?=142分鐘,簇間方差σb2=180,簇內(nèi)方差σw2=420。(1)求均值估計的標準誤;(2)若希望總長度95%置信區(qū)間半寬≤5分鐘,需增加多少簇;答案與解析:(1)設計效應Deff=1+(k?1)ρ=2.35,標準誤SE=√[(σb2+σw2)/n·Deff]=√[600/1000·2.35]=1.19分鐘。(2)半寬1.96·SE≤5?SE≤2.55,需Deff·600/(mk)≤2.552,解得m≥217,即再增117簇。27.(綜合)某高校欲評估在線課程效果,采用傾向得分匹配,協(xié)變量包括性別、年級、入學成績、專業(yè)。logit模型估計傾向得分,Caliper=0.05。匹配后得處理組n?=220,對照組n?=218,平均處理效應差d?=6.8分,標準誤SE=2.1。(1)給出效應95%置信區(qū)間;(2)進行平衡性檢驗,標準均值差最大為0.08,是否滿足<0.1標準;(3)若存在未觀測混淆,用Rosenbaum敏感度分析,Γ=1.5時效應顯著性是否保持;答案與解析:(1)6.8±1.96·2.1=(2.7,10.9)。(2)最大0.08<0.1,滿足。(3)Wilcoxon符號秩臨界值上下界p<0.05,Γ=1.5時仍顯著,結(jié)論穩(wěn)健。28.(綜合)某基因組研究對n=1000人測p=50萬SNP,采用嶺回歸預測身高,經(jīng)雙交叉驗證選λ=12,解釋方差R2=0.41。若進一步用彈性網(wǎng),取α=0.5,重新調(diào)參后R2=0.43,且變量數(shù)減至1200。(1)給出彈性網(wǎng)相比嶺回歸的優(yōu)劣;(2)若采用knockoff控制FDR=0.1,檢出顯著變量數(shù)期望多少;(3)若樣本量增至n=5000,預期R2提升多少(用漸近理論);答案與解析:(1)彈性網(wǎng)兼具稀疏與組效應,解釋略升且模型更稀疏,利于生物學解釋,但計算成本增。(2)knockoff在p=5×10?,F(xiàn)DR=0.1,期望檢出≈
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 化工熱交換工復試水平考核試卷含答案
- 吉他制作工班組評比能力考核試卷含答案
- 紫膠制片工達標模擬考核試卷含答案
- 2026廣東深圳大學土木與交通工程學院周英武特聘教授團隊招聘研究助理1人備考題庫及答案詳解一套
- 2026江蘇蘇州工業(yè)園區(qū)環(huán)洲幼兒園后勤輔助人員招聘1人備考題庫及參考答案詳解一套
- 2026年淄博高青縣教育和體育局所屬事業(yè)單位公開招聘工作人員的備考題庫(25人)帶答案詳解
- 肌內(nèi)注射的護理研究進展
- 老年疼痛綜合征的多學科鎮(zhèn)痛方案優(yōu)化
- 企業(yè)安全生產(chǎn)管理制度
- 2026上海第二工業(yè)大學招聘66人備考題庫及1套參考答案詳解
- (2025年)鐵路貨運考試題及答案
- 2026年榆能集團陜西精益化工有限公司招聘備考題庫及參考答案詳解一套
- 2026年及未來5年中國化妝品玻璃瓶行業(yè)市場深度分析及發(fā)展趨勢預測報告
- 2026年魯教版初三政治上冊月考真題試卷(含答案)
- 物業(yè)春節(jié)前安全生產(chǎn)培訓課件
- 企業(yè)安全生產(chǎn)責任制培訓教材(標準版)
- 零缺陷培訓教學課件
- 2026年餐飲企業(yè)稅務合規(guī)培訓課件與發(fā)票管理風控方案
- 2025年及未來5年市場數(shù)據(jù)中國蓖麻油行業(yè)投資潛力分析及行業(yè)發(fā)展趨勢報告
- 2025年湖北煙草專賣局真題試卷及答案
- 2025-2026學年廣東省廣州113中學八年級(上)期中語文試卷
評論
0/150
提交評論