版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計(jì)學(xué)試題和答案1.單選題(每題4分,共40分)1.1某市交通部門連續(xù)30天記錄早高峰時(shí)段某路口的車流量(單位:輛/分鐘),數(shù)據(jù)經(jīng)箱線圖檢驗(yàn)后發(fā)現(xiàn)上須外僅出現(xiàn)一個(gè)點(diǎn)。下列說法正確的是A.該點(diǎn)一定是異常值,必須刪除B.該點(diǎn)可能是極端值,但刪除需結(jié)合業(yè)務(wù)背景C.箱線圖的異常值判定標(biāo)準(zhǔn)對(duì)樣本量不敏感D.若改用99%的Z分?jǐn)?shù)閾值,則該點(diǎn)一定被保留答案:B解析:箱線圖默認(rèn)用1.5×IQR規(guī)則標(biāo)記“潛在異常值”,但“異?!眱H相對(duì)于樣本分布形態(tài)而言,未必代表數(shù)據(jù)錯(cuò)誤;是否剔除需結(jié)合產(chǎn)生機(jī)制。Z分?jǐn)?shù)閾值隨置信水平變化,99%對(duì)應(yīng)約±2.58,未必保留該點(diǎn),故D錯(cuò)。1.2設(shè)隨機(jī)變量X服從參數(shù)為λ的泊松分布,若E(X2)=6,則λ=A.1B.2C.3D.4答案:B解析:泊松分布E(X)=λ,Var(X)=λ,故E(X2)=Var(X)+[E(X)]2=λ+λ2=6,解得λ=2。1.3對(duì)同一總體進(jìn)行兩次獨(dú)立抽樣,樣本容量分別為n?=100,n?=400,樣本均值分別為x??=50,x??=52。若總體方差已知為σ2=100,則合并兩樣本后,x?的抽樣分布標(biāo)準(zhǔn)誤為A.0.5B.0.4C.0.447D.0.316答案:C解析:合并均值x?=(n?x??+n?x??)/(n?+n?)=51.6,但其標(biāo)準(zhǔn)誤只與總樣本量有關(guān),σ/√(n?+n?)=10/√500≈0.447。1.4在線性回歸y=β?+β?x+ε中,若解釋變量x的樣本方差增大,其他條件不變,則β?的OLS估計(jì)量的方差將A.增大B.減小C.不變D.先增后減答案:B解析:Var(β??)=σ2/Σ(xi?x?)2,分母隨x方差增大而增大,故方差減小。1.5某假設(shè)檢驗(yàn)的p值為0.03,若顯著性水平α=0.05,則下列說法正確的是A.原假設(shè)錯(cuò)誤的概率為3%B.拒絕原假設(shè)后犯第一類錯(cuò)誤的概率為3%C.若重復(fù)實(shí)驗(yàn)100次,大約3次會(huì)得到|t|≥觀測值D.檢驗(yàn)功效等于97%答案:C解析:p值指“在原假設(shè)成立時(shí),得到當(dāng)前或更極端結(jié)果”的概率頻率解釋,C正確。A、B把p值當(dāng)成“假設(shè)為真的概率”或“錯(cuò)誤概率”,屬常見誤解。功效與備擇分布有關(guān),無法由p值直接推出。1.6對(duì)一組右偏數(shù)據(jù)取自然對(duì)數(shù)后,新數(shù)據(jù)的偏度A.一定為負(fù)B.一定為正C.更接近0D.不變答案:C解析:對(duì)數(shù)變換可壓縮右尾,降低偏度,但未必改變方向,故“更接近0”最嚴(yán)謹(jǐn)。1.7在單因素方差分析中,若組間均方MSB=120,組內(nèi)均方MSE=30,則F統(tǒng)計(jì)量的值為A.3B.4C.5D.6答案:B解析:F=MSB/MSE=120/30=4。1.8設(shè)X~N(0,1),Y~N(0,4)且獨(dú)立,令Z=X/Y,則Z的分布為A.標(biāo)準(zhǔn)正態(tài)B.柯西C.t(1)D.F(1,1)答案:B解析:柯西分布定義為兩個(gè)獨(dú)立正態(tài)變量之比,其中分母均值為0,故Z~Cauchy(0,1)。1.9對(duì)某二項(xiàng)分布B(n,p)進(jìn)行極大似然估計(jì),若觀測到k次成功,則p的MLE為A.k/nB.(k+1)/(n+1)C.(k+1)/(n+2)D.(k+2)/(n+4)答案:A解析:似然函數(shù)L(p)=C(n,k)p^k(1?p)^(n?k),對(duì)數(shù)求導(dǎo)得p?=k/n。1.10若事件A、B滿足P(A∪B)=0.7,P(A)=0.4,P(B)=0.5,則P(A∩B)=A.0.1B.0.2C.0.3D.0.4答案:B解析:由加法公式P(A∩B)=P(A)+P(B)?P(A∪B)=0.4+0.5?0.7=0.2。2.多選題(每題5分,共30分,每題至少有兩個(gè)正確答案,多選少選均不得分)2.1下列關(guān)于中心極限定理(CLT)的描述正確的有A.樣本量足夠大時(shí),樣本均值的分布趨近正態(tài)B.總體必須為正態(tài)分布CLT才成立C.若總體高度偏斜,所需樣本量更大D.樣本量固定時(shí),增大總體方差會(huì)減緩收斂速度E.CLT可推廣到樣本方差的分布答案:A、C、D解析:B錯(cuò),CLT核心在于“總體不必正態(tài)”;E錯(cuò),CLT針對(duì)樣本均值,樣本方差收斂到卡方分布需另依Delta方法或Slutsky定理。2.2在多元線性回歸中,若出現(xiàn)多重共線性,可能導(dǎo)致A.OLS估計(jì)量不再無偏B.個(gè)別系數(shù)顯著性下降C.系數(shù)符號(hào)與理論相反D.模型R2大幅降低E.方差膨脹因子VIF增大答案:B、C、E解析:多重共線性不破壞無偏性,A錯(cuò);R2可能仍高,D錯(cuò);VIF增大、標(biāo)準(zhǔn)誤膨脹導(dǎo)致t值下降,符號(hào)可能反轉(zhuǎn)。2.3關(guān)于Bootstrap置信區(qū)間,下列說法正確的有A.無需對(duì)總體分布作假設(shè)B.基本思想是“用樣本分布模擬抽樣分布”C.百分位法區(qū)間總是對(duì)稱D.樣本量很小時(shí),覆蓋率可能低于名義水平E.平滑Bootstrap可改善離散數(shù)據(jù)下的表現(xiàn)答案:A、B、D、E解析:C錯(cuò),百分位法區(qū)間形狀完全由重抽樣經(jīng)驗(yàn)分布決定,可不對(duì)稱。2.4以下哪些圖適合展示兩個(gè)數(shù)值型變量的相關(guān)性A.散點(diǎn)圖B.Q-Q圖C.熱力圖D.平行坐標(biāo)圖E.氣泡圖答案:A、C、E解析:Q-Q圖用于分布比較;平行坐標(biāo)圖適合高維,非專用于兩變量相關(guān)性。2.5貝葉斯推斷中,若先驗(yàn)分布為共軛先驗(yàn),則A.后驗(yàn)分布與先驗(yàn)屬于同一族B.計(jì)算后驗(yàn)期望更簡單C.必須采用無信息先驗(yàn)D.隨著樣本量增加,先驗(yàn)影響減弱E.后驗(yàn)分布的方差一定小于先驗(yàn)方差答案:A、B、D解析:C錯(cuò),共軛先驗(yàn)可信息豐富;E錯(cuò),若數(shù)據(jù)極離散,后驗(yàn)方差可能暫時(shí)更大。2.6下列屬于非參數(shù)檢驗(yàn)的方法有A.Wilcoxon符號(hào)秩檢驗(yàn)B.Kruskal-Wallis檢驗(yàn)C.Mann-WhitneyU檢驗(yàn)D.符號(hào)檢驗(yàn)E.卡方擬合優(yōu)度檢驗(yàn)答案:A、B、C、D解析:卡方檢驗(yàn)雖無嚴(yán)格分布假設(shè),但針對(duì)列聯(lián)表或分類數(shù)據(jù),通常歸為“分布自由”而非“非參數(shù)秩檢驗(yàn)”。3.填空題(每空3分,共30分)3.1設(shè)X~N(μ,9),抽取n=25的樣本,得x?=12,則μ的95%雙側(cè)置信區(qū)間為(11.824,____)。答案:12.176解析:σ=3,標(biāo)準(zhǔn)誤=3/5=0.6,z?.???=1.96,區(qū)間=12±1.96×0.6。3.2若隨機(jī)變量X的矩母函數(shù)為M_X(t)=exp(2t+3t2),則E(X)=____,Var(X)=____。答案:2;6解析:MGF形式對(duì)應(yīng)N(2,6),因MGF正態(tài)為exp(μt+σ2t2/2),對(duì)比得σ2=6。3.3在線性回歸中,若決定系數(shù)R2=0.81,則解釋變量與響應(yīng)變量的樣本相關(guān)系數(shù)r=____。答案:0.9或?0.9解析:簡單線性回歸R2=r2,r符號(hào)與回歸系數(shù)一致。3.4對(duì)某時(shí)間序列擬合ARIMA(1,1,1)模型,若經(jīng)差分后序列的自相關(guān)圖在滯后1階后截尾,則模型中的MA部分階數(shù)q=____。答案:1解析:ACF滯后1截尾提示MA(1)。3.5若X?,…,X_n獨(dú)立同分布于Exp(λ),則λ的矩估計(jì)量為____。答案:1/x?解析:E(X)=1/λ,令樣本均值等于期望得λ?=1/x?。3.6設(shè)X~Bin(10,0.2),則P(X≥2)=____(保留三位小數(shù))。答案:0.624解析:1?P(X=0)?P(X=1)=1?0.81??10×0.2×0.8?≈0.624。3.7在假設(shè)檢驗(yàn)中,若檢驗(yàn)統(tǒng)計(jì)量t=2.5,自由度df=20,雙側(cè)p值約為____(t分布表查得P(|T|≥2.5)=0.021)。答案:0.021解析:直接查表。3.8對(duì)某總體進(jìn)行分層抽樣,總樣本量n=100,兩層權(quán)重分別為W?=0.4,W?=0.6,若兩層樣本量按內(nèi)曼分配,且層標(biāo)準(zhǔn)差S?=5,S?=10,則n?=____。答案:25解析:n?=n×(W?S?)/(W?S?+W?S?)=100×2/(2+6)=25。3.9若X~Geo(p),則P(X>k)=____。答案:(1?p)^k解析:幾何分布無記憶性,尾部概率直接為(1?p)^k。3.10給定5個(gè)數(shù)據(jù)點(diǎn):3,5,7,9,11,其樣本中位數(shù)為____,四分位距IQR=____。答案:7;4解析:排序后中位數(shù)即第3點(diǎn);Q?=4,Q?=8,IQR=8?4=4。4.計(jì)算與證明題(共100分)4.1(15分)設(shè)X?,…,X_n獨(dú)立同分布于U(0,θ),θ>0未知。(1)求θ的矩估計(jì)量θ?_M;(2)求θ的極大似然估計(jì)量θ?_ML;(3)比較兩者的均方誤差MSE(提示:先求E(θ?_ML)與Var(θ?_ML))。答案與解析:(1)E(X)=θ/2,令x?=θ/2,得θ?_M=2x?。(2)似然函數(shù)L(θ)=θ^(?n)I_{x_(n)≤θ},其中x_(n)=max{X_i},顯然L在θ=x_(n)處取最大,故θ?_ML=x_(n)。(3)先求θ?_ML分布:P(x_(n)≤t)=(t/θ)^n,0<t<θ,密度f(t)=nt^(n?1)/θ^n。于是E(x_(n))=∫?^θt·nt^(n?1)/θ^ndt=nθ/(n+1),E(x_(n)2)=∫?^θt2·nt^(n?1)/θ^ndt=nθ2/(n+2),Var(x_(n))=nθ2/(n+2)?[nθ/(n+1)]2=nθ2/[(n+2)(n+1)2]。MSE(θ?_ML)=Var+(Bias)2=nθ2/[(n+2)(n+1)2]+[θ?nθ/(n+1)]2=2θ2/[(n+1)(n+2)]。對(duì)矩估計(jì):E(θ?_M)=2E(x?)=θ,無偏;Var(θ?_M)=4Var(x?)=4θ2/(12n)=θ2/(3n)。故MSE(θ?_M)=θ2/(3n)。比較:當(dāng)n≥2時(shí),2/[(n+1)(n+2)]<1/(3n)恒成立,因此θ?_ML的MSE更小,效率更高。4.2(15分)某電商平臺(tái)想評(píng)估新版頁面(B)是否提升轉(zhuǎn)化率。隨機(jī)抽取1000名用戶,其中600名進(jìn)入A組(舊版),400名進(jìn)入B組(新版)。結(jié)果A組成交90單,B組成交84單。(1)建立假設(shè)檢驗(yàn),判斷B是否顯著優(yōu)于A(α=0.05);(2)計(jì)算檢驗(yàn)p值,并給出業(yè)務(wù)建議;(3)若希望檢出比例提升2個(gè)百分點(diǎn)的功效達(dá)到80%,試估算所需樣本量(兩組等量分配)。答案與解析:(1)設(shè)p_A、p_B為兩組真實(shí)轉(zhuǎn)化率,H?:p_B≤p_A,H?:p_B>p_A(單側(cè))。樣本轉(zhuǎn)化率p?_A=90/600=0.15,p?_B=84/400=0.21。合并比例p?=(90+84)/1000=0.174。Z=(p?_B?p?_A)/√[p?(1?p?)(1/n_A+1/n_B)]=(0.06)/√[0.174×0.826×(1/600+1/400)]≈0.06/0.024≈2.50。臨界值z?.??=1.645,2.50>1.645,拒絕H?,認(rèn)為B顯著優(yōu)于A。(2)p值=P(Z≥2.50)=0.0062,遠(yuǎn)小于0.05,證據(jù)強(qiáng)。業(yè)務(wù)建議:新版頁面顯著提升轉(zhuǎn)化,可推廣全量,但需持續(xù)監(jiān)控長期效應(yīng)及用戶體驗(yàn)副作用。(3)功效計(jì)算:設(shè)p_A=0.15,p_B=0.17,Δ=0.02,α=0.05(單側(cè)),功效=0.8。用Lehr公式近似:n=[z_{1?α}√(2p?(1?p?))+z_{1?β}√(p_A(1?p_A)+p_B(1?p_B))]2/Δ2,其中p?=(0.15+0.17)/2=0.16,z?.??=1.645,z?.?=0.84,n≈[1.645√(2×0.16×0.84)+0.84√(0.15×0.85+0.17×0.83)]2/0.0004≈(1.645×0.519+0.84×0.522)2/0.0004≈(1.62)2/0.0004≈6560每組,總13120。結(jié)論:若要檢測2%小幅提升,需約1.3萬樣本,遠(yuǎn)高于當(dāng)前1000,說明小改進(jìn)需大流量。4.3(20分)某工廠生產(chǎn)鋼絲,其抗拉強(qiáng)度X~N(μ,σ2)?,F(xiàn)抽取n=25的樣本,得x?=260MPa,s=10MPa。(1)求μ的95%單側(cè)置信下限;(2)檢驗(yàn)σ是否顯著小于12MPa(α=0.05);(3)若實(shí)際σ=8MPa,求(2)中檢驗(yàn)的功效;(4)畫出σ的似然函數(shù)曲線(示意),并標(biāo)出MLE。答案與解析:(1)用t分布:μ_L=x??t?.??,??·s/√n=260?1.711×10/5=260?3.422=256.578MPa。(2)H?:σ≥12,H?:σ<12,檢驗(yàn)統(tǒng)計(jì)量χ2=(n?1)s2/σ?2=24×100/144=16.67,臨界值χ2?.??,??=13.848,16.67>13.848,不拒絕H?,無充分證據(jù)表明σ<12。(3)功效=P(χ2<13.848|σ=8),非中心參數(shù)無,直接計(jì)算:新統(tǒng)計(jì)量分布為(24×64)/144=10.67,功效=P(χ2<13.848|df=24,scale=64/144)=F_χ2(13.848;24)=約0.30(查表或軟件),即功效僅30%,檢驗(yàn)靈敏度低。(4)似然L(σ)∝σ^(?n)exp(?(n?1)s2/(2σ2)),在σ2=s2=100處取最大,MLE=10MPa。曲線在σ=10處峰最高,兩側(cè)快速下降,圖略。4.4(20分)考慮隨機(jī)向量X=(X?,X?)?服從二維正態(tài),均值μ=(0,0)?,協(xié)方差Σ=[[1,ρ],[ρ,1]],|ρ|<1。(1)求條件分布X?|X?=x?;(2)證明偏相關(guān)ρ_{12·3}在二維情況下等于ρ;(3)設(shè)ρ=0.8,生成1000組樣本,寫出估計(jì)ρ的兩種方法及R代碼片段;(4)若實(shí)際觀測到樣本相關(guān)系數(shù)r=0.75,求Fisherz變換后的95%置信區(qū)間。答案與解析:(1)多元正態(tài)條件分布公式:X?|X?=x?~N(μ?+Σ??Σ??^(?1)(x??μ?),Σ???Σ??Σ??^(?1)Σ??),代入得X?|X?=x?~N(ρx?,1?ρ2)。(2)二維情況下無第三個(gè)變量,偏相關(guān)即簡單相關(guān),故ρ_{12·3}=ρ。(3)方法一:直接樣本相關(guān)系數(shù)cor(x1,x2);方法二:基于MLE解方程r=ρ(數(shù)值優(yōu)化)。R代碼:```rlibrary(MASS)rho<0.8;Sigma<matrix(c(1,rho,rho,1),2,2)dat<mvrnorm(1000,c(0,0),Sigma)cor(dat)[1,2]#方法1方法2:MLE等價(jià)于樣本cor,故數(shù)值相同```(4)z=0.5·ln((1+r)/(1?r))≈0.973,標(biāo)準(zhǔn)誤=1/√(n?3)=1/√997≈0.0317,95%區(qū)間:z±1.96×0.0317→(0.911,1.035),反變換:r=(e^(2z)?1)/(e^(2z)+1),得(0.723,0.776)。4.5(15分)某城市出租車公司想預(yù)測日均訂單量Y(千單),收集連續(xù)30天的數(shù)據(jù),建立線性模型:Y=β?+β?X?+β?X?+ε,其中X?為平均氣溫(°C),X?為節(jié)假日dummy(1=節(jié)假日)。輸出如下表:|系數(shù)|估計(jì)|標(biāo)準(zhǔn)誤|t值|Pr(>|t|)||----|----|----|----|----||β?|10.2|1.1|9.27|<0.001||β?|0.40|0.08|5.00|<0.001||β?|3.5|0.9|3.89|<0.001|殘差標(biāo)準(zhǔn)誤=2.1,R2=0.72,F(xiàn)檢驗(yàn)p<0.001。(1)寫出回歸方程,并解釋系數(shù)含義;(2)預(yù)測氣溫30°C且為節(jié)假日時(shí)的訂單量及95%置信區(qū)間;(3)檢驗(yàn)β?是否顯著大于0.25(α=0.05,單側(cè));(4)若發(fā)現(xiàn)殘差呈現(xiàn)“周末效應(yīng)”波動(dòng),提出改進(jìn)模型方案。答案與解析:(1)?=10.2+0.40X?+3.5X?。β?:氣溫每升高1°C,訂單量平均增加0.4千單;β?:節(jié)假日比工作日多3.5千單。(2)點(diǎn)預(yù)測=10.2+0.4×30+3.5=25.7千單。標(biāo)準(zhǔn)誤:se_pred=√[σ?2·(1+n^(?1)+(x?x?)?(X?X)^(?1)(x?x?))],假設(shè)x??≈20,Var(β?)≈0.082,Cov忽略,近似se_pred≈2.1×√(1+1/30+(30?20)2·0.082/0.42)≈2.1×1.12≈2.35,95%區(qū)間:25.7±1.96×2.35→(21.1,30.3)千單。(3)t=(0.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 黑龍江2025年黑龍江省科學(xué)院智能制造研究所招聘博士科研人員筆試歷年參考題庫附帶答案詳解
- 職業(yè)健康與員工職業(yè)發(fā)展:醫(yī)療組織健康績效
- 菏澤2025年山東菏澤巨野縣中醫(yī)醫(yī)院招聘急需專業(yè)技術(shù)人員26人筆試歷年參考題庫附帶答案詳解
- 秦皇島2025年河北秦皇島市體育局招聘事業(yè)單位工作人員2人筆試歷年參考題庫附帶答案詳解
- 湛江廣東湛江市坡頭區(qū)財(cái)政局招聘三類編外人員筆試歷年參考題庫附帶答案詳解
- 海南2025年海南省第二衛(wèi)生學(xué)校招聘20人筆試歷年參考題庫附帶答案詳解
- 杭州浙江杭州市東潤外國語學(xué)校編外人員招聘4人筆試歷年參考題庫附帶答案詳解
- 成都2025年四川成都青羊區(qū)招聘社區(qū)工作者和黨建服務(wù)專員117人筆試歷年參考題庫附帶答案詳解
- 廣州廣東廣州市越秀區(qū)東山街招聘輔助人員筆試歷年參考題庫附帶答案詳解
- 天津2025年天津市市場監(jiān)督管理委員會(huì)所屬事業(yè)單位招聘13人筆試歷年參考題庫附帶答案詳解
- 癌癥患者生活質(zhì)量量表EORTC-QLQ-C30
- QCT55-2023汽車座椅舒適性試驗(yàn)方法
- 孕產(chǎn)婦妊娠風(fēng)險(xiǎn)評(píng)估表
- 消化系統(tǒng)疾病健康教育宣教
- 河南省洛陽市2023-2024學(xué)年九年級(jí)第一學(xué)期期末質(zhì)量檢測數(shù)學(xué)試卷(人教版 含答案)
- Unit-3-Reading-and-thinking課文詳解課件-高中英語人教版必修第二冊(cè)
- 新版出口報(bào)關(guān)單模板
- 14K118 空調(diào)通風(fēng)管道的加固
- 加油站財(cái)務(wù)管理制度細(xì)則
- 全過程工程咨詢服務(wù)技術(shù)方案
- YS/T 1152-2016粗氫氧化鈷
評(píng)論
0/150
提交評(píng)論