版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2026年統(tǒng)計學試題庫及參考答案1.單項選擇題(每題2分,共20分)1.1某市交通部門連續(xù)30天記錄早高峰擁堵指數(shù),數(shù)據(jù)分布右偏且存在3個明顯異常值。若希望用單一指標描述“典型擁堵水平”,下列統(tǒng)計量中最穩(wěn)健的是A.算術均值?B.中位數(shù)?C.幾何均值?D.上四分位數(shù)答案:B解析:右偏分布中均值會被極大值拉高,而中位數(shù)僅依賴排序位置,對異常值不敏感,因此穩(wěn)健性最高。1.2設隨機變量X~N(μ,σ2),若σ未知且樣本量n=16,則μ的95%置信區(qū)間應選用的臨界值為A.z?.????B.t?.???(15)?C.t?.???(16)?D.χ2?.???(15)答案:B解析:σ未知、小樣本下使用t分布,自由度=n?1=15。1.3在線性回歸y=β?+β?x+ε中,若解釋變量x的樣本方差增大而其他條件不變,則β?的估計量方差Var(β??)將A.增大?B.減小?C.不變?D.先增后減答案:B解析:Var(β??)=σ2/Σ(xi?x?)2,分母隨x波動增大而增大,故方差減小。1.4對二項分布B(n,p)進行假設檢驗H?:p=0.3,若n=100,樣本比例p?=0.36,則檢驗統(tǒng)計量z的觀測值約為A.1.28?B.1.43?C.1.65?D.1.96答案:B解析:z=(0.36?0.3)/√(0.3×0.7/100)=0.06/0.0419≈1.43。1.5在單因素方差分析中,若組間均方MSB=120,組內均方MSE=30,則F統(tǒng)計量值為A.3?B.4?C.5?D.6答案:B解析:F=MSB/MSE=120/30=4。1.6設X與Y的Pearson相關系數(shù)r=0.85,若將X的單位由“米”改為“厘米”,則新的相關系數(shù)A.0.0085?B.0.085?C.0.85?D.85答案:C解析:線性變換不改變相關系數(shù)。1.7對某時間序列建立ARIMA(1,1,1)模型,若經差分后序列的自相關圖在滯后1階后呈指數(shù)衰減,偏自相關圖在滯后1階后截尾,則模型參數(shù)特征為A.AR系數(shù)顯著,MA系數(shù)不顯著?B.兩者均顯著?C.僅MA顯著?D.無法判斷答案:B解析:ACF指數(shù)衰減提示MA成分,PACF截尾提示AR成分,故兩者均顯著。1.8在貝葉斯框架下,若先驗分布為Beta(2,2),似然為二項分布B(20,θ)且觀測到x=8,則后驗分布為A.Beta(10,14)?B.Beta(8,12)?C.Beta(10,12)?D.Beta(28,32)答案:A解析:Beta先驗共軛,后驗參數(shù)α=2+8=10,β=2+12=14。1.9對高維數(shù)據(jù)(p>n)進行變量選擇,下列方法中最不可能出現(xiàn)過擬合的是A.逐步回歸?B.Lasso?C.嶺回歸?D.主成分回歸答案:C解析:嶺回歸通過懲罰項收縮系數(shù)但不剔除變量,降低方差,過擬合風險最小。1.10若隨機向量X~N?(μ,Σ),則二次型(X?μ)?Σ?1(X?μ)服從A.χ2(p)?B.t(p)?C.F(p,n?p)?D.N(0,1)答案:A解析:多元正態(tài)理論標準結論。2.多項選擇題(每題3分,共15分,多選少選均不得分)2.1下列關于非參數(shù)檢驗的描述正確的有A.Kruskal-Wallis檢驗適用于多組獨立樣本B.Wilcoxon符號秩檢驗要求總體分布對稱C.Spearman秩相關系數(shù)可衡量單調關系D.符號檢驗比Wilcoxon符號秩檢驗功效更高E.游程檢驗可用于檢測隨機性答案:A、B、C、E解析:D錯誤,符號檢驗僅利用正負號,功效低于利用秩次的Wilcoxon。2.2在經典線性模型y=Xβ+ε,ε~N(0,σ2I)下,下列結論恒成立的有A.OLS估計量β?是無偏的B.σ?2=RSS/(n?p)是σ2的無偏估計C.β?的協(xié)方差陣為σ2(X?X)?1D.當X列滿秩時β?唯一E.R2隨解釋變量增加必然增大答案:A、B、C、D解析:E錯誤,調整R2可能下降。2.3關于主成分分析(PCA),正確的有A.主成分方向是協(xié)方差陣特征向量B.第k主成分方差等于第k大特征值C.主成分得分互不相關D.標準化與否不影響主成分順序E.主成分可解釋原始變量全部方差答案:A、B、C解析:D錯誤,標準化后量綱消失,特征值分布改變;E錯誤,通常只保留部分方差。2.4下列屬于時間序列平穩(wěn)性檢驗方法的有A.ADF檢驗?B.KPSS檢驗?C.Ljung-Box檢驗?D.PP檢驗?E.Durbin-Watson檢驗答案:A、B、D解析:C用于殘差白噪聲檢驗,E用于一階自相關。2.5在Bootstrap置信區(qū)間構造中,A.百分位區(qū)間不需要正態(tài)假設B.BCa區(qū)間可修正偏度與偏差C.重復抽樣次數(shù)B越大區(qū)間越窄D.自助樣本量必須與原始樣本量相同E.對極值量(如最大值)自助效果差答案:A、B、D、E解析:C錯誤,B增大降低蒙特卡洛誤差,但區(qū)間寬度由數(shù)據(jù)變異決定,不會無限變窄。3.填空題(每空2分,共20分)3.1設X?,…,X?為來自U(0,θ)的樣本,則θ的矩估計為________,最大似然估計為________。答案:2X?;max(X?)解析:矩估計由E(X)=θ/2反解;似然函數(shù)在θ≥max(X?)時單調減,故MLE為最大次序統(tǒng)計量。3.2在Poisson回歸中,常用________函數(shù)作為典則連接函數(shù),其形式為________。答案:對數(shù);log(μ)3.3若隨機變量T服從自由度為ν的t分布,則E(T)=________(ν>1),Var(T)=________(ν>2)。答案:0;ν/(ν?2)3.4對p維數(shù)據(jù)做聚類,若采用歐氏距離且變量量綱差異大,應先進行________處理,常用方法是________。答案:標準化;Z-score標準化3.5在控制圖應用中,若過程均值發(fā)生1.5σ偏移,則傳統(tǒng)3σ控制圖的平均運行長度ARL≈________。答案:14.0解析:通過正態(tài)分布計算P(out|shift)=0.0668,ARL=1/0.0668≈14.0。4.計算與證明題(共45分)4.1(8分)設X?,…,X?i.i.d.~Exp(λ),其pdf為f(x)=λe^(?λx),x>0。(1)求λ的矩估計λ?;(2)證明λ?是λ的相合估計。答案與解析:(1)E(X)=1/λ,令樣本均值X?=1/λ?,解得λ?=1/X?。(2)由大數(shù)定律X?→1/λa.s.,連續(xù)映射定理得1/X?→λa.s.,故λ?相合。4.2(10分)某電商平臺欲評估新版推薦算法是否提升轉化率。隨機抽取10000名用戶,均分兩組:對照組:5000人,轉化218人;實驗組:5000人,轉化256人。(1)建立假設檢驗并計算檢驗統(tǒng)計量;(2)求p值并給出結論(α=0.05);(3)計算兩組轉化率差值的95%置信區(qū)間。答案與解析:(1)H?:p?=p?,H?:p?≠p?。p??=218/5000=0.0436,p??=256/5000=0.0512,合并率p?=(218+256)/10000=0.0474,z=(0.0512?0.0436)/√[0.0474×0.9526×(1/5000+1/5000)]=0.0076/0.00426≈1.78。(2)雙側p=2×P(Z>1.78)=2×0.0375=0.075>0.05,不拒絕H?,尚不能認為新版顯著提升轉化率。(3)差值p???p??=0.0076,標準誤SE=√[p??(1?p??)/5000+p??(1?p??)/5000]=0.00428,95%CI:0.0076±1.96×0.00428=[?0.0008,0.0160],包含0,與檢驗結論一致。4.3(10分)已知隨機向量Z=[X,Y]?服從二元正態(tài),且μ=[2,3]?,Σ=[[4,2.4],[2.4,9]]。(1)求X與Y的相關系數(shù)ρ;(2)求條件分布Y|X=x的期望與方差;(3)若觀測到X=3,預測Y并給出95%預測區(qū)間。答案與解析:(1)ρ=2.4/√(4×9)=2.4/6=0.4。(2)條件期望E(Y|X=x)=μ_Y+ρσ_Y/σ_X(x?μ_X)=3+0.4×3/2(x?2)=3+0.6(x?2)=0.6x+1.8;條件方差Var(Y|X=x)=σ_Y2(1?ρ2)=9×(1?0.16)=7.56。(3)當x=3,?=0.6×3+1.8=3.6,95%區(qū)間:3.6±1.96×√7.56=3.6±5.39→[?1.79,8.99]。4.4(8分)設線性模型y=Xβ+ε,ε~N(0,σ2I),X為n×p列滿秩矩陣。記H=X(X?X)?1X?為帽子矩陣。(1)證明tr(H)=p;(2)證明殘差向量e=(I?H)y的協(xié)方差陣Cov(e)=σ2(I?H)。答案與解析:(1)tr(H)=tr[X(X?X)?1X?]=tr[(X?X)?1X?X]=tr(I_p)=p。(2)Cov(e)=Cov[(I?H)y]=(I?H)Cov(y)(I?H)?=σ2(I?H)2=σ2(I?H),因I?H冪等對稱。4.5(9分)某連鎖超市收集36個月銷售數(shù)據(jù)(單位:百萬元),建立如下趨勢+季節(jié)模型Y_t=T_t+S_t+ε_t,其中T_t=α+βt,季節(jié)因子S_t滿足ΣS_t=0,ε_t~N(0,σ2)。經最小二乘估計得α?=12.3,β?=0.45,季節(jié)因子估計值S??=?2.1,S??=?1.0,S??=1.4,S??=1.7(按季度循環(huán))。(1)預測2026年第三季度銷售額;(2)若σ?=1.2,給出該預測值的95%置信區(qū)間;(3)簡述如何檢驗“季節(jié)效應是否顯著”。答案與解析:(1)2026年第三季度對應t=37+2=39(假設2022Q1為t=1),T???=12.3+0.45×39=29.85,S??=1.4,預測值?=29.85+1.4=31.25(百萬元)。(2)預測標準誤=σ?=1.2,區(qū)間:31.25±1.96×1.2=[28.90,33.60]。(3)建立方差分析模型,將季節(jié)作為因子,檢驗H?:S?=S?=S?=S?=0,用F檢驗比較全模型與無季節(jié)模型的RSS差異,若p<α則季節(jié)效應顯著。5.綜合應用題(共40分)5.1(15分)某醫(yī)療研究機構開發(fā)新型血糖儀,需評估其測量誤差。招募50名志愿者,每人用新儀器與標準實驗室方法各測一次空腹血糖,數(shù)據(jù)如下(單位:mg/dL):(原始數(shù)據(jù)略,給出差值d?=新?標準,計算得d?=4.8,s_d=7.5)(1)給出差值描述性統(tǒng)計并繪制箱線圖要點;(2)檢驗新儀器是否存在系統(tǒng)偏差(α=0.05);(3)計算差值的95%容忍區(qū)間,要求覆蓋90%總體差值;(4)若臨床認為|差值|≤10mg/dL為可接受,請用等價性檢驗思路給出結論。答案與解析:(1)中位數(shù)約4.5,Q1=0.2,Q3=8.9,存在1個上界外異常值,箱線圖顯示右尾略長。(2)H?:μ_d=0,t=d?/(s_d/√n)=4.8/(7.5/√50)=4.8/1.06≈4.53,df=49,雙側p<0.001,拒絕H?,存在顯著正偏差。(3)容忍區(qū)間公式:d?±k×s_d,其中k為容忍因子,對(0.90,0.95)且n=50,查表得k≈2.382,區(qū)間:4.8±2.382×7.5=[?13.1,22.7],說明95%置信下90%總體差值落入此區(qū)間,范圍較寬。(4)等價界值Δ=10,建立兩個單側檢驗:H??:μ_d≤?10,H??:μ_d≥10,t?=(4.8+10)/1.06=14.0,t?=(4.8?10)/1.06=?4.9,對應p?<0.001,p?<0.001,均拒絕,故不能宣稱等價,新儀器偏差超出臨床可接受范圍。5.2(15分)某市政府統(tǒng)計部門欲利用手機信令數(shù)據(jù)估計夜間常住人口。以250m×250m網格為單元,抽取100個網格,記錄凌晨2點手機設備數(shù)(X)與同期普查人口(Y),建立對數(shù)線性模型log(Y)=β?+β?log(X)+ε?;貧w結果:β??=0.81,β??=0.92,R2=0.78,殘差標準誤σ?=0.15。(1)解釋β??=0.92的含義;(2)若某網格測得X=3200,預測Y及95%置信區(qū)間;(3)討論模型可能存在的內生性問題及改進思路;(4)給出基于模型推斷全市人口的步驟與注意事項。答案與解析:(1)手機設備數(shù)每增加1%,普查人口平均增加約0.92%,彈性接近1,提示兩者規(guī)模接近正比。(2)log(X?)=log(3200)=8.07,log(?)=0.81+0.92×8.07=8.23,?=exp(8.23)=3750,95%CI:log(?)±t?.???(98)×0.15×√[1/n+(logX?logX?)2/Sxx],假設logX?≈8.0,Sxx≈2.5,標準誤≈0.15×1.02=0.153,區(qū)間8.23±1.98×0.153→[7.93,8.53],反變換得Y∈[2770,5060],區(qū)間較寬,需擴大樣本或引入輔助變量。(3)內生性問題:①手機擁有率與年齡、收入相關,導致X與Y關系因網格人口結構不同而變化;②節(jié)假日或特殊事件使夜間手機分布偏離居住人口。改進:引入網格層面協(xié)變量(平均年齡、住房類型、商業(yè)設施密度),使用工具變量(如基站信號強度外生變化);采用分層抽樣或混合效應模型。(4)步驟:①將全市所有網格X輸入模型得?;②匯總得總人口估計;③用事后分層或比率估計校正系統(tǒng)性偏差;④通過Bootstrap或Jackknife評估估計方差;⑤與行政記錄比對驗證。注意事項:隱私脫敏、設備重復計數(shù)、游客剔除、模型外推不確定性。5.3(10分)某高校統(tǒng)計系開展“數(shù)據(jù)科學競賽”滿意度調查,采用分層抽樣:本科生層N?=3000,研究生層N?=1000,分別抽取n?=120,n?=80。滿意度得分(0?100)匯總如下:本科:x??=72,s?2=64;研究生:x??=78,s?2=49
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- CCAA - 2023年10月建筑施工領域專業(yè)答案及解析 - 詳解版(65題)
- 山東省煙臺市海陽市2025-2026學年八年級上學期期末生物學試題(含解析)
- 中學學生課外活動管理制度
- 【寒假專項】人教版六年級數(shù)學下冊《百分數(shù)(二)》應用題專項訓練(含答案)
- 養(yǎng)老院環(huán)境衛(wèi)生管理制度
- 企業(yè)薪酬管理制度
- 統(tǒng)編版(2024)七年級上冊歷史第四單元 三國兩晉南北朝時期:政權分立與民族交融(16-20課)素養(yǎng)提升教案
- 2025年山東省人民檢察院招聘聘用制書記員考試真題
- 稀土拋光粉工操作管理測試考核試卷含答案
- 鑿巖臺車司機創(chuàng)新方法考核試卷含答案
- 物業(yè)項目綜合服務方案
- 2025-2026學年北京市西城區(qū)初二(上期)期末考試物理試卷(含答案)
- 公路工程施工安全技術與管理課件 第09講 起重吊裝
- 企業(yè)管理 華為會議接待全流程手冊SOP
- 供水企業(yè)制度流程規(guī)范
- 河南省2025年普通高等學校對口招收中等職業(yè)學校畢業(yè)生考試語文試題 答案
- 馬口鐵印鐵制罐工藝流程詳解課件
- 狼蒲松齡原文及翻譯
- 2023初會職稱《經濟法基礎》習題庫及答案
- 預應力管樁-試樁施工方案
- GB/T 3500-1998粉末冶金術語
評論
0/150
提交評論