統(tǒng)計(jì)師考試試題及答案_第1頁
統(tǒng)計(jì)師考試試題及答案_第2頁
統(tǒng)計(jì)師考試試題及答案_第3頁
統(tǒng)計(jì)師考試試題及答案_第4頁
統(tǒng)計(jì)師考試試題及答案_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)師考試試題及答案1.單選題(每題2分,共30分)1.1某省調(diào)查總隊(duì)對(duì)120家規(guī)模以上工業(yè)企業(yè)進(jìn)行月度產(chǎn)值抽樣,采用與規(guī)模成比例的不放回PPS抽樣。若第i企業(yè)的產(chǎn)值為X_i,入樣概率為π_i,則下列關(guān)于Horvitz-Thompson估計(jì)量?_HT=Σ_{i∈s}Y_i/π_i的方差估計(jì)量v(?_HT)的說法,正確的是A.必須已知所有π_ij才能構(gòu)造無偏估計(jì)B.只要樣本量n≥2,即可用Yates-Grundy形式構(gòu)造無偏估計(jì)C.若采用Brewer抽樣方案,π_ij解析式不存在,故無法估計(jì)方差D.若采用Rao-Sampford抽樣方案,π_ij無解析式,但可用“去一”刀切法估計(jì)方差答案:B解析:Horvitz-Thompson估計(jì)量的方差可寫成V(?_HT)=ΣΣΔ_ijY_iY_j,其中Δ_ij=π_ij?π_iπ_j。Yates-Grundy形式v_YG=??ΣΣΔ_ij(Y_i/π_i?Y_j/π_j)^2僅需樣本內(nèi)π_ij即可計(jì)算,且對(duì)任意固定樣本量n≥2均給出無偏估計(jì)。Brewer與Rao-Sampford方案雖π_ij復(fù)雜,但仍可用刀切或bootstrap獲得一致方差估計(jì),故A、C錯(cuò);D雖可刀切,卻非“無法”解析,表述絕對(duì)化,故最優(yōu)選項(xiàng)為B。1.2對(duì)一組右偏的失業(yè)持續(xù)時(shí)間數(shù)據(jù)(單位:周),下列變換中,最能降低偏度且保持單調(diào)性的是A.ln(x)B.√xC.1/xD.x^2答案:A解析:右偏分布常用對(duì)數(shù)變換壓縮大值尾部,偏度下降最顯著且保持單調(diào)遞增。平方根變換效果次之,倒數(shù)與平方均破壞單調(diào)或加劇偏度。1.3在雙側(cè)檢驗(yàn)H0:μ=μ0vsH1:μ≠μ0中,若總體標(biāo)準(zhǔn)差σ已知,樣本量n=100,顯著性水平α=0.05,當(dāng)真實(shí)均值μ1=μ0+0.3σ時(shí),檢驗(yàn)功效約為A.0.50B.0.65C.0.80D.0.95答案:C解析:Z檢驗(yàn)功效函數(shù)Φ(?z_{α/2}+√nδ/σ)+Φ(?z_{α/2}?√nδ/σ),其中δ=0.3σ,√nδ/σ=3。z_{0.025}=1.96,故功效≈Φ(1.04)+Φ(?4.96)=0.8508+0≈0.85,最接近0.80。1.4對(duì)5×4列聯(lián)表進(jìn)行獨(dú)立性卡方檢驗(yàn),若最小期望頻數(shù)為3.2,則下列說法正確的是A.必須合并行或列才能使用χ2近似B.可用χ2近似,但需做連續(xù)性校正C.可直接使用Pearsonχ2,無需校正D.應(yīng)改用Fisher精確檢驗(yàn)答案:C解析:Cochran規(guī)則要求所有期望頻數(shù)≥1且<5的單元格比例不超過20%。本表最小期望3.2>1,且5×4=20個(gè)單元格中若僅少數(shù)<5,可直接使用Pearsonχ2。連續(xù)性校正僅用于2×2表,F(xiàn)isher精確在期望頻數(shù)極低時(shí)采用,故選C。1.5在簡單隨機(jī)抽樣中,若總體大小N=500,樣本量n=50,樣本均值?=12.4,樣本標(biāo)準(zhǔn)差s=3.2,則有限總體修正后的均值標(biāo)準(zhǔn)誤為A.3.2/√50B.3.2/√50×√(450/499)C.3.2/√50×√(499/450)D.3.2/√50×√(1?50/500)答案:B解析:有限總體修正fpc=√((N?n)/(N?1)),標(biāo)準(zhǔn)誤SE=s/√n×fpc=3.2/√50×√(450/499)。1.6對(duì)多元線性模型Y=Xβ+ε,ε~N(0,σ2I),若X含p=8列,n=120,RSS=360,則σ2的無偏估計(jì)為A.360/112B.360/119C.360/120D.360/8答案:B解析:σ2的無偏估計(jì)為RSS/(n?p)=360/(120?8)=360/112≈3.214。1.7在指數(shù)平滑中,若平滑參數(shù)α=0.15,則對(duì)無限歷史數(shù)據(jù),系數(shù)衰減至0.5^(k)所需的滯后階數(shù)k約為A.3B.5C.7D.9答案:B解析:指數(shù)平滑權(quán)重w_k=α(1?α)^{k?1},令α(1?α)^{k?1}=0.5^k,取對(duì)數(shù)解得k≈ln(α)/ln(0.5(1?α))≈4.6,取整5。1.8對(duì)AR(1)過程X_t=φX_{t?1}+Z_t,Z_t~WN(0,σ2),若樣本自相關(guān)ρ?1=0.68,n=200,則φ的Yule-Walker估計(jì)為A.0.68B.0.70C.0.72D.0.74答案:A解析:Yule-Walker方程直接給出φ?=ρ?1=0.68。1.9在貝葉斯框架下,若先驗(yàn)θ~N(0,1),似然x|θ~N(θ,1),觀測x=2,則θ的后驗(yàn)均值為A.0B.0.5C.1D.2答案:C解析:共軛正態(tài),后驗(yàn)均值=(1/(1+1))×0+(1/(1+1))×2=1。1.10對(duì)泊松計(jì)數(shù)數(shù)據(jù)y=12,使用Jeffreys先驗(yàn),則θ的95%等尾可信區(qū)間為A.6.2–18.8B.6.8–19.4C.7.0–19.8D.7.4–20.2答案:B解析:Jeffreys先驗(yàn)θ^{-?},后驗(yàn)為Gamma(12+?,1),即χ2(25)的2θ分布。95%區(qū)間對(duì)應(yīng)χ2分位數(shù)12.4–40.6,換算θ得6.2–20.3,最接近B。1.11在Bootstrap置信區(qū)間構(gòu)造中,若采用BCa方法,其加速系數(shù)a的估計(jì)基于A.經(jīng)驗(yàn)影響函數(shù)B.刀切偽值C.自助標(biāo)準(zhǔn)誤D.偏差校正因子答案:B解析:BCa的a由刀切偽值的三階矩估計(jì)獲得。1.12對(duì)高維回歸p>n,若使用Lasso,調(diào)節(jié)參數(shù)λ增大時(shí),下列說法正確的是A.偏差減小,方差增大B.偏差增大,方差減小C.偏差與方差均增大D.偏差與方差均減小答案:B解析:λ增大,懲罰加強(qiáng),模型更簡單,偏差增大,方差減小。1.13在系統(tǒng)聚類中,若采用Ward法,合并兩類后組內(nèi)平方和的增加量等于A.兩類的重心距離平方乘以合并樣本量倒數(shù)之和B.兩類間歐氏距離平方C.兩類間馬氏距離D.兩類方差之和答案:A解析:Ward準(zhǔn)則定義即為ΔESS=(n_An_B)/(n_A+n_B)‖x?_A?x?_B‖2。1.14對(duì)二分類邏輯回歸,若某連續(xù)預(yù)測變量x的系數(shù)β?=0.8,則x每增加1單位,優(yōu)勢比OR為A.0.8B.1.8C.2.2D.8.0答案:C解析:OR=e^β=e^{0.8}≈2.225。1.15在抽樣調(diào)查中,若設(shè)計(jì)效應(yīng)deff=2.3,則意味著A.復(fù)雜抽樣方差是簡單隨機(jī)抽樣的2.3倍B.樣本量需增至2.3倍才能達(dá)到SRS精度C.有效樣本量降至n/2.3D.以上均正確答案:D解析:設(shè)計(jì)效應(yīng)定義即復(fù)雜抽樣方差與SRS方差之比,故A、B、C均等價(jià)正確。2.多選題(每題3分,共30分,每題至少兩個(gè)正確答案,多選少選均不得分)2.1下列關(guān)于非參數(shù)核密度估計(jì)f?_h(x)=1/(nh)ΣK((x?X_i)/h)的敘述,正確的有A.當(dāng)h→0時(shí),估計(jì)方差趨于0B.當(dāng)nh→∞時(shí),估計(jì)偏差趨于0C.最優(yōu)h~n^{?1/5}使AMISE最小D.高斯核的AMISE收斂速度與Epanechnikov核相同階E.邊界修正可采用反射法答案:BCDE解析:h→0時(shí)方差→∞,A錯(cuò);其余均正確。2.2對(duì)隨機(jī)區(qū)組設(shè)計(jì),若區(qū)組數(shù)b=8,處理數(shù)t=5,每區(qū)組每處理1次觀測,則下列正確的有A.誤差自由度為28B.處理均方期望含σ2+5Στ_j2/(t?1)C.區(qū)組均方期望含σ2+tσ_b2D.若區(qū)組效應(yīng)隨機(jī),處理檢驗(yàn)分母為區(qū)組均方E.若區(qū)組效應(yīng)固定,處理檢驗(yàn)分母為誤差均方答案:ACE解析:總自由度39,區(qū)組7,處理4,誤差28,A對(duì);處理期望含σ2+bΣτ_j2/(t?1),B錯(cuò);區(qū)組期望σ2+tσ_b2,C對(duì);隨機(jī)區(qū)組下處理檢驗(yàn)仍用誤差均方,D錯(cuò);固定時(shí)用誤差,E對(duì)。2.3下列屬于廣義線性模型GLM必備要素的有A.隨機(jī)成分指定指數(shù)族分布B.系統(tǒng)成分指定線性預(yù)測器C.連接函數(shù)單調(diào)可微D.方差函數(shù)與均值無關(guān)E.偏差殘差平方和服從χ2答案:ABC解析:GLM三要素為指數(shù)族、線性預(yù)測器、連接函數(shù);方差函數(shù)可依賴均值,D錯(cuò);偏差殘差近似χ2但非“必備”,E錯(cuò)。2.4在生存分析中,關(guān)于Cox比例風(fēng)險(xiǎn)模型的假設(shè),正確的有A.基線風(fēng)險(xiǎn)h0(t)可為任意非負(fù)函數(shù)B.協(xié)變量效應(yīng)乘積于風(fēng)險(xiǎn)C.對(duì)時(shí)依協(xié)變量需構(gòu)造偏似然D.若比例風(fēng)險(xiǎn)不成立,可引入分層CoxE.偏回歸系數(shù)估計(jì)為偏似然得分方程解答案:ABDE解析:時(shí)依協(xié)變量仍可用標(biāo)準(zhǔn)偏似然,C表述“需構(gòu)造”易誤解,不選;其余正確。2.5對(duì)高維協(xié)方差矩陣估計(jì),下列方法中具備稀疏性的有A.硬閾值法B.圖形LassoC.Ledoit-Wolf收縮D.因子模型E.帶狀化估計(jì)答案:ABE解析:硬閾值、圖形Lasso、帶狀化均直接引入稀疏;Ledoit-Wolf收縮整體降特征值但非稀疏;因子模型降秩非稀疏。3.計(jì)算題(共40分)3.1(10分)某市欲估計(jì)2023年第四季度居民線上消費(fèi)總額。已知全市共有80萬戶,按簡單隨機(jī)抽樣抽取1600戶,調(diào)查得平均線上消費(fèi)?=4850元,樣本標(biāo)準(zhǔn)差s=2100元。(1)給出總體總量?的估計(jì)并計(jì)算其95%置信區(qū)間。(2)若要求估計(jì)相對(duì)誤差不超過5%,求所需樣本量(假定s不變)。解:(1)總量估計(jì)?=N?=800000×4850=3.88×1011元。標(biāo)準(zhǔn)誤SE=N·s/√n·√(1?n/N)=800000×2100/√1600×√(1?1600/800000)=800000×2100/40×√0.998≈4.2×10?×0.999≈4.196×10?。95%區(qū)間:?±1.96×SE=3.88×1011±8.23×10?,即[3.8792×1011,3.8808×1011]元。(2)相對(duì)誤差5%即絕對(duì)誤差0.05×4850=242.5元/戶。由d=z_{0.975}·s/√n·√(1?n/N),解n≥(z2s2)/(d2+s2z2/N)=(1.962×21002)/(242.52+1.962×21002/800000)≈(4×4.41×10?)/(5.88×10?+1.08×102)≈300。故需約300戶,原樣本已遠(yuǎn)超,滿足。3.2(10分)設(shè)X~Poisson(λ),欲檢驗(yàn)H0:λ=3vsH1:λ=5,取拒絕域{X≥c}。(1)求c使第一類錯(cuò)誤概率α≈0.05。(2)求該檢驗(yàn)在λ=5下的功效。(3)若觀測x=8,求p值。解:(1)P(X≥c|λ=3)=1?P(X≤c?1)。查Poisson(3)表:c=7時(shí)1?F(6)=1?0.966=0.034;c=6時(shí)1?F(5)=0.084。取c=7,α=0.034<0.05,最接近。(2)功效P(X≥7|λ=5)=1?F(6;5)=1?0.762=0.238。(3)p=P(X≥8|λ=3)=1?F(7;3)=1?0.988=0.012。3.3(10分)對(duì)線性模型Y=Xβ+ε,ε~N(0,σ2I),n=30,p=4,RSS=180。(1)給出σ2的無偏估計(jì)。(2)若新增一個(gè)預(yù)測變量,RSS降至160,求調(diào)整R2的變化方向與數(shù)值。(3)在(2)基礎(chǔ)上,用F檢驗(yàn)判斷新增變量是否顯著(α=0.05)。解:(1)σ?2=RSS/(n?p)=180/26≈6.923。(2)原R2=1?180/SST,新R2=1?160/SST,SST不變,R2增大。調(diào)整R2_adj=1?(RSS/(n?p))/(SST/(n?1))。原R2_adj=1?(180/26)/(SST/29),新R2_adj=1?(160/25)/(SST/29)。由于160/25=6.4<180/26≈6.923,故R2_adj增大。數(shù)值需SST,但方向明確向上。(3)F=((180?160)/1)/(160/25)=20/6.4=3.125,F(xiàn)_{0.95}(1,25)=4.24,3.125<4.24,不顯著。3.4(10分)某電商對(duì)15款商品進(jìn)行價(jià)格彈性實(shí)驗(yàn),記錄降價(jià)幅度x(%)與銷量增長y(%)。數(shù)據(jù)如下:x:51015202530354045505560657075y:61218232832353840414243444445(1)擬合簡單線性回歸y=β0+β1x,給出估計(jì)方程與R2。(2)檢驗(yàn)H0:β1=0.5vsH1:β1≠0.5(α=0.05)。(3)預(yù)測x=80時(shí)y的95%置信區(qū)間。解:(1)經(jīng)計(jì)算:Σx=600,Σy=478,Σx2=28750,Σy2=18204,Σxy=22840,n=15。Sxx=28750?6002/15=28750?24000=4750,Sxy=22840?600×478/15=22840?19120=3720,β?1=Sxy/Sxx=3720/4750≈0.783,β?0=??β?1x?=478/15?0.783×40≈31.867?31.32=0.547。方程:?=0.547+0.783x。SST=Σy2?n?2=18204?15×(31.867)2≈18204?15228=2976,SSR=β?1Sxy=0.783×3720≈2913,R2=SSR/SST≈2913/2976≈0.979。(2)σ?2=(SST?SSR)/(n?2)=(2976?2913)/13≈4.846,se(β?1)=√(σ?2/Sxx)=√(4.846/4750)≈0.032。t=(0.783?0.5)/0.032≈8.84,|t|>t_{0.975}(13)=2.160,拒絕H0。(3)x0=80,?0=0.547+0.783×80≈63.19。se(?0)=√σ?2(1/n+(x0?x?)2/Sxx)=√4.846(1/15+1600/4750)≈√4.846×0.403≈1.40。95%區(qū)間:63.19±2.160×1.40=[60.16,66.22]。4.綜合應(yīng)用題(共50分)4.1(25分)某健康研究院開展高血壓干預(yù)試驗(yàn),將8個(gè)社區(qū)隨機(jī)分為兩組(干預(yù)/對(duì)照),每社區(qū)隨機(jī)抽取30名成人,記錄6個(gè)月后收縮壓下降值(mmHg)。數(shù)據(jù):干預(yù)組:社區(qū)A–F平均下降8.2,9.1,7.5,8.8,9.5,7.9(每組n=30,組內(nèi)s2=4.5)對(duì)照組:社區(qū)G–H平均下降3.4,2.9(n=30,s2=4.0)(1)將社區(qū)作為隨機(jī)效應(yīng),擬合兩水平模型y_ij=β0+β1trt_i+u_i+ε_(tái)ij,其中u_i~N(0,σ_u2),ε_(tái)ij~N(0,σ2),給出β1的估計(jì)與標(biāo)準(zhǔn)誤。(2)檢驗(yàn)H0:β1=0。(3)估計(jì)社區(qū)內(nèi)相關(guān)系數(shù)ICC。(4)若忽略社區(qū)聚類,用兩獨(dú)立樣本t檢驗(yàn),求p值并比較(1)之結(jié)論。(5)討論設(shè)計(jì)效應(yīng)。解:(1)綜合干預(yù)組均值?_T=(8.2+9.1+7.5+8.8+9.5+7.9)/6=8.48,對(duì)照組?_C=(3.4+2.9)/2=3.15,β?1=8.48?3.15=5.33。方差:干預(yù)組內(nèi)均值方差Var(?_T)=σ_u2/6+σ2/180,對(duì)照組Var(?_C)=σ_u2/2+σ2/60。用組內(nèi)s2估計(jì)σ2≈4.3(加權(quán)平均),則Var(β?1)=Var(?_T)+Var(?_C)=σ_u2/6+4.3/180+σ_u2/2+4.3/60=(2/3)σ_u2+0.0956。需估計(jì)σ_u2:用社區(qū)間方差,干預(yù)組間樣本方差s_bT2=0.566,對(duì)照組s_bC2=0.125,綜合矩估計(jì)σ_u2≈0.45。故se(β?1)=√(2/3×0.45+0.0956)=√0.3956≈0.629。(2)t=5.33/0.629≈8.47,df用Satterthwaite得≈6,p<0.001,顯著。(3)ICC=σ_u2/(σ_u2+σ2)=0.45/(0.45+4.3)≈0.095。(4)忽略聚類:合并方差s_p2=4.3,se=√4.3(1/180+1/60)=0.302,t=5.33/0.302≈17.6,p<0.001,結(jié)論一致但標(biāo)準(zhǔn)誤嚴(yán)重低估。(5)設(shè)計(jì)效應(yīng)deff=1+(m?1)ICC≈1+(30?1)×0.095≈3.76,表明聚類使有效樣本量降至1/3.76,需增加樣本或采用多水平分析。4.2(25分)某銀行構(gòu)建信用卡違約預(yù)測模型,抽取10000條樣本,其中違約400條。采用邏輯回歸、隨機(jī)森林、XGBoost三種算法,5折交叉驗(yàn)證結(jié)果如下:模型|AUC|召回率@0.2|F1@0.2|---|---|---邏輯回歸|0.784|0.62|0.51隨機(jī)森林|0.812

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論