統(tǒng)計學(xué)試題庫含答案解析_第1頁
統(tǒng)計學(xué)試題庫含答案解析_第2頁
統(tǒng)計學(xué)試題庫含答案解析_第3頁
統(tǒng)計學(xué)試題庫含答案解析_第4頁
統(tǒng)計學(xué)試題庫含答案解析_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計學(xué)試題庫[含答案解析]1.單選題(每題4分,共20題)1.1某市交通部門連續(xù)30天記錄早高峰時段某路口通過的小汽車數(shù)量,數(shù)據(jù)經(jīng)箱線圖檢驗發(fā)現(xiàn)上須外存在3個“+”號標(biāo)記。下列說法最準(zhǔn)確的是A.數(shù)據(jù)存在3個異常大值,但未必是錯誤值B.箱線圖無法識別異常值,需改用直方圖C.異常值一定來自測量錯誤,應(yīng)直接刪除D.異常值數(shù)量超過5%即可視為總體分布非正態(tài)答案:A解析:箱線圖的“+”號通常表示1.5×IQR以外的個體,屬于潛在異常值,但異常值≠錯誤值,是否剔除需結(jié)合業(yè)務(wù)背景。1.2在簡單隨機放回抽樣中,樣本均值的方差與總體方差σ2的關(guān)系為A.σ2/nB.σ2C.σ2/(n?1)D.nσ2答案:A解析:放回抽樣下,樣本均值方差公式為Var(???)=σ2/n,與有限總體修正系數(shù)無關(guān)。1.3設(shè)X~N(μ,σ2),若將X進(jìn)行線性變換Y=aX+b,則Y的峰度系數(shù)κ?(Y)等于A.κ?(X)B.aκ?(X)C.0D.3答案:A解析:峰度為標(biāo)準(zhǔn)化四階中心矩,線性變換只改變尺度與位置,不改變形狀,故峰度不變。1.4對同一組數(shù)據(jù)分別計算Pearsonr與Spearmanρ,若|r|≈1而ρ≈0,最合理的解釋是A.數(shù)據(jù)存在嚴(yán)重離群點B.變量間存在非單調(diào)非線性關(guān)系C.樣本量過小導(dǎo)致秩次不穩(wěn)定D.計算過程出現(xiàn)溢出答案:B解析:Pearson僅度量線性相關(guān),Spearman度量單調(diào)相關(guān);|r|高而ρ低說明關(guān)系呈強烈非單調(diào)曲線。1.5在雙因素方差分析中,若A、B兩因素均固定,且交互效應(yīng)顯著,則下一步最應(yīng)A.直接報告主效應(yīng)顯著性B.進(jìn)行簡單效應(yīng)分析C.改用單因素模型D.增加樣本量再檢驗答案:B解析:交互顯著意味著一個因素的作用隨另一因素水平變化,需拆解為簡單效應(yīng)比較。1.6對0-1變量Y建立Logistic回歸,若某分類自變量X有k個水平,軟件輸出給出k?1個系數(shù),其參照組系數(shù)視為A.0B.1C.?1D.無法確定答案:A解析:為避免虛擬變量陷阱,參照組系數(shù)被約束為0,其余水平系數(shù)表示相對對數(shù)優(yōu)勢比。1.7設(shè)隨機變量X服從參數(shù)為λ的泊松分布,則E[X2]等于A.λB.λ2C.λ+λ2D.λ2?λ答案:C解析:泊松分布Var(X)=λ,E[X2]=Var(X)+[E(X)]2=λ+λ2。1.8在控制圖應(yīng)用中,若過程均值發(fā)生1.5σ偏移,則采用3σ控制限的X?圖平均運行長度ARL約為A.14B.44C.155D.370答案:B解析:標(biāo)準(zhǔn)正態(tài)下,1.5σ偏移使中心距限界為1.5,查ARL表得ARL≈44。1.9對同一總體采用不放回簡單隨機抽樣,樣本量n=50,總體量N=500,則樣本均值的方差為A.σ2/50B.σ2/50×(450/499)C.σ2/50×(499/450)D.σ2/50×(1?50/500)答案:B解析:有限總體修正系數(shù)為(N?n)/(N?1)=450/499。1.10若某檢驗的p值=0.027,顯著性水平α=0.05,則A.必然犯第一類錯誤B.必然不犯第一類錯誤C.有可能犯第一類錯誤D.檢驗功效一定大于0.95答案:C解析:p<α僅說明拒絕原假設(shè),拒絕后仍有α概率犯第一類錯誤。1.11在貝葉斯估計中,若先驗為Beta(2,2),似然為二項分布Bin(n=10,k=3),則后驗均值為A.3/10B.4/12C.5/14D.2/5答案:C解析:Beta先驗共軛,后驗為Beta(2+3,2+7)=Beta(5,9),均值=5/(5+9)=5/14。1.12對正態(tài)總體均值μ的雙側(cè)t檢驗,若樣本量n=16,樣本均值???=52,s=4,檢驗H?:μ=50,則t統(tǒng)計量為A.1B.2C.2.5D.4答案:B解析:t=(52?50)/(4/√16)=2/1=2。1.13在多元線性回歸中,若VIF=8,則對應(yīng)的容忍度為A.8B.0.8C.0.125D.1.25答案:C解析:容忍度TOL=1/VIF=1/8=0.125。1.14對同一數(shù)據(jù)分別用K-Means與層次聚類,若K-Means的Silhouette系數(shù)顯著高于層次聚類,則A.K-Means一定找到全局最優(yōu)B.數(shù)據(jù)可能存在球形簇C.層次聚類距離度量選錯D.必須采用密度聚類答案:B解析:Silhouette高說明簇內(nèi)緊、簇間疏,K-Means在球形簇表現(xiàn)好,但未必全局最優(yōu)。1.15若隨機變量X~Exp(λ),則P(X>t+s|X>s)等于A.P(X>t)B.P(X>s)C.P(X>t+s)D.1?P(X>t)答案:A解析:指數(shù)分布無記憶性,P(X>t+s|X>s)=P(X>t)。1.16在Bootstrap置信區(qū)間構(gòu)造中,采用百分位法,若B=2000次重抽樣,則第5百分位對應(yīng)次序統(tǒng)計量為A.第100個B.第99個C.第101個D.第50個答案:A解析:2000×0.05=100,取第100個次序統(tǒng)計量。1.17若兩獨立樣本t檢驗的Cohen’d=0.8,則可大致認(rèn)為效應(yīng)量為A.微小B.中等C.大D.無法判斷答案:C解析:Cohen’d=0.8通常視為大效應(yīng)。1.18在時間序列建模中,若PACF在滯后1階后截尾,ACF拖尾,則初步判定為A.AR(1)B.MA(1)C.ARMA(1,1)D.白噪聲答案:A解析:PACF截尾提示AR階數(shù),ACF拖尾與AR特征一致。1.19對列聯(lián)表采用Fisher精確檢驗,其零假設(shè)為A.兩變量獨立B.兩變量相關(guān)C.行合計相等D.列合計相等答案:A解析:Fisher檢驗的原假設(shè)即兩分類變量獨立。1.20若某統(tǒng)計量的抽樣分布右偏嚴(yán)重,則采用Bootstrapt法構(gòu)造置信區(qū)間時,通常A.需要對統(tǒng)計量進(jìn)行變換B.直接取對稱區(qū)間即可C.增加樣本量至n>1000D.改用正態(tài)近似答案:A解析:嚴(yán)重偏態(tài)下,對稱區(qū)間覆蓋率差,可對統(tǒng)計量取對數(shù)或采用BCa法。2.多選題(每題5分,共8題,每題至少兩個正確答案,多選少選均不得分)2.1下列關(guān)于中心極限定理(CLT)的描述正確的有A.要求總體服從正態(tài)分布B.樣本量足夠大時,樣本均值分布近似正態(tài)C.可推廣至樣本比例D.對任意總體分布均成立E.可推廣至樣本中位數(shù)答案:B、C、D解析:CLT不要求總體正態(tài),只要方差有限且樣本量足夠;樣本比例屬于均值特例;中位數(shù)需額外條件。2.2在多元正態(tài)假設(shè)下,下列統(tǒng)計量服從卡方分布的有A.(n?1)S2/σ2B.HotellingT2C.Mahalanobis距離(n?1)D2D.殘差平方和/σ2E.樣本偏度×√n答案:A、C解析:(n?1)S2/σ2~χ2(n?1);Mahalanobis距離經(jīng)適當(dāng)縮放后亦服從χ2;HotellingT2經(jīng)轉(zhuǎn)換后服從F;殘差平方和需除以σ2才近似χ2;偏度不服從χ2。2.3關(guān)于AIC與BIC的比較,正確的有A.AIC懲罰項系數(shù)小于BICB.樣本量n增大時,BIC更傾向于選擇簡約模型C.AIC漸近選擇模型具有一致性D.BIC懲罰項與ln(n)成正比E.在線性回歸中,AICc是對AIC的小樣本修正答案:A、B、D、E解析:AIC懲罰2k,BIC懲罰kln(n),故n大時BIC懲罰更重;AIC不具模型選擇一致性;AICc確為小樣本修正。2.4下列方法可用于檢驗正態(tài)性的有A.Jarque-BeraB.LillieforsC.Anderson-DarlingD.Kolmogorov-SmirnovE.Shapiro-Wilk答案:A、B、C、E解析:KS檢驗需完全指定參數(shù),Lilliefors為其均值方差未知修正;其余皆可檢驗正態(tài)。2.5在Logistic回歸中,若出現(xiàn)完全分離,則A.最大似然估計不存在B.系數(shù)估計絕對值趨于無窮C.可用Firth修正緩解D.標(biāo)準(zhǔn)誤趨于0E.預(yù)測準(zhǔn)確率一定100%答案:A、B、C解析:完全分離時似然無界,估計發(fā)散;Firth懲罰似然可緩解;預(yù)測準(zhǔn)確率未必100%,因存在閾值的選取問題。2.6關(guān)于主成分分析(PCA),正確的有A.主成分方向?qū)?yīng)協(xié)方差矩陣特征向量B.各主成分方差之和等于原始變量總方差C.主成分得分可用來降維D.主成分之間相關(guān)系數(shù)為0E.必須對變量標(biāo)準(zhǔn)化后方可進(jìn)行答案:A、B、C、D解析:PCA可在原始尺度或相關(guān)矩陣進(jìn)行,若變量量綱差異大才需標(biāo)準(zhǔn)化,非必須。2.7下列屬于非參數(shù)檢驗的有A.Wilcoxon符號秩B.Kruskal-WallisC.Mann-WhitneyD.FriedmanE.Welch答案:A、B、C、D解析:Welch檢驗仍屬參數(shù)t檢驗族,只是對方差不齊修正。2.8若隨機變量X,Y獨立,則A.E(XY)=E(X)E(Y)B.Var(X+Y)=Var(X)+Var(Y)C.Cov(X,Y)=0D.ρ(X,Y)=0E.X,Y一定服從聯(lián)合正態(tài)答案:A、B、C、D解析:獨立?不相關(guān),反之不成立;獨立不保證聯(lián)合正態(tài)。3.填空題(每題6分,共10題)3.1設(shè)X~Bin(20,0.3),則P(X=5)=_______(保留四位小數(shù))答案:0.1789解析:C(20,5)0.3?0.71?=15504×0.00243×0.00475≈0.1789。3.2若樣本量n=25,樣本標(biāo)準(zhǔn)差s=6,則總體方差σ2的95%置信區(qū)間為(_____,_____)(卡方臨界值取χ2?.???=12.40,χ2?.???=39.36)答案:(22.0,69.8)解析:[(n?1)s2/χ2?.???,(n?1)s2/χ2?.???]=[24×36/39.36,24×36/12.40]≈[22.0,69.8]。3.3在簡單線性回歸中,若決定系數(shù)R2=0.81,則相關(guān)系數(shù)r=_____(填絕對值)答案:0.9解析:R2=r2?|r|=√0.81=0.9。3.4若隨機變量X~N(0,1),則E[|X|]=_____(保留兩位小數(shù))答案:0.80解析:E[|X|]=√(2/π)≈0.7979≈0.80。3.5對泊松過程,若單位時間平均到達(dá)率λ=4,則第3次到達(dá)的等待時間期望為_____答案:0.75解析:Gamma(3,4)期望=3/4=0.75。3.6若兩變量秩相關(guān)系數(shù)ρ?=0.6,樣本量n=10,則檢驗H?:ρ?=0的t統(tǒng)計量為_____(保留兩位小數(shù))答案:2.12解析:t=ρ?√[(n?2)/(1?ρ?2)]=0.6√[8/0.64]=0.6×3.535≈2.12。3.7在23因子設(shè)計中,若ABC交互效應(yīng)估計值為?5,則其對照為(?1,1,1,?1,1,?1,?1,1)·y,若y=(12,10,8,14,11,9,13,15),則對照和=_____答案:?8解析:逐點相乘求和:?12+10+8?14+11?9?13+15=?8。3.8若某股票日對數(shù)收益率服從μ=0.0005,σ=0.02的正態(tài)分布,則20日累計收益分布的方差為_____答案:0.008解析:Var=20σ2=20×0.0004=0.008。3.9若樣本偏度g?=0.8,樣本量n=100,則Jarque-Bera統(tǒng)計量為_____(保留兩位小數(shù))答案:6.40解析:JB=n(g?2/6+(g?)2/24),峰度假設(shè)0,則JB=100×0.64/6≈6.40。3.10若某檢驗功效函數(shù)在μ=μ?+δ處為0.8,則第二類錯誤概率β=_____答案:0.2解析:功效=1?β?β=0.2。4.計算與證明題(共5題,每題18分)4.1設(shè)某工廠生產(chǎn)零件長度X~N(μ,σ2)?,F(xiàn)抽取n=16件,測得???=50.2mm,s=0.8mm。(1)求μ的95%單側(cè)置信上限;(2)若要求估計誤差不超過0.3mm,置信水平95%,問至少需抽取多少件?(z?.??=1.645)答案與解析:(1)單側(cè)上限???+t?.??(15)·s/√16=50.2+1.753×0.2=50.55mm。(2)誤差Δ=z?.???·σ/√n≤0.3,σ未知,用s=0.8近似,n≥(1.96×0.8/0.3)2≈27.4,故至少28件。4.2設(shè)隨機變量X的密度f(x)=θx^{θ?1},0<x<1,θ>0。(1)求θ的矩估計;(2)求θ的最大似然估計;(3)證明MLE為一致估計。答案與解析:(1)E[X]=∫?1θx^θdx=θ/(θ+1),令樣本均值???=θ/(θ+1)?θ?=???/(1????)。(2)L=∏θx_i^{θ?1},lnL=nlnθ+(θ?1)∑lnx_i,令導(dǎo)數(shù)0得θ?=?n/∑lnx_i。(3)由大數(shù)定律,?1/n∑lnx_i→E[?lnX]=1/θ,故θ?→θ,具一致性。4.3為比較兩種橡膠配方耐磨性,設(shè)計配對試驗,10對試塊磨損量差值d?=2.3mg,s_d=1.8mg。(1)檢驗H?:μ_d=0vsH?:μ_d≠0(α=0.05);(2)求μ_d的95%置信區(qū)間;(3)若認(rèn)為差值≥1.5mg才具實際意義,求檢驗功效。答案與解析:(1)t=2.3/(1.8/√10)=4.04>t?.???(9)=2.262,拒絕H?。(2)2.3±2.262×1.8/√10=(1.01,3.59)。(3)非中心參數(shù)δ=(2.3?1.5)/(1.8/√10)=1.41,查t分布功效表得功效≈0.65。4.4某電商平臺欲建模日銷量Y與價格X?、促銷dummyX?的交互模型:logY=β?+β?X?+β?X?+β?X?X?+ε?,F(xiàn)收集n=100天數(shù)據(jù),得β??=?0.08,se=0.025。(1)檢驗交互項是否顯著(α=0.01);(2)解釋β?實際含義;(3)若價格提升10%,求促銷期與非促銷期銷量百分比變化。答案與解析:(1)t=?0.08/0.025=?3.2,|t|>2.63,顯著。(2)β?表示價格彈性在促銷與非促銷狀態(tài)差異,負(fù)值說明促銷削弱了價格敏感性。(3)促銷期:ΔlogY=(β?+β?)×0.1,非促銷:β?×0.1;需知β??方可計算,假設(shè)β??=?0.5,則促銷期?0.58×0.1=?5.8%,非促銷?5%;即促銷期銷量下降幅度更大。4.5設(shè)X?,...,X_n來自Uniform(θ,θ+1),求θ的充分統(tǒng)計量,并構(gòu)造一個無偏估計。答案與解析:聯(lián)合密度f(x|θ)=I(θ≤x_(1))I(x_(n)≤θ+1),僅通過X_(1),X_(n)依賴θ,故T=(X_(1),X_(n))為充分統(tǒng)計量。令θ?=X_(1)?1/(n+1),可證E[θ?]=θ,無偏。5.綜合應(yīng)用題(共2題,每題20分)5.1某城市地鐵閘機每分鐘通過人數(shù)服從非齊次泊松過程,速率函數(shù)λ(t)=3+2sin(πt/30),t∈[0,60]分鐘。(1)求7:30-8:00(t∈[30,60])總?cè)藬?shù)的分布與期望;(2)若閘機上限為200人,求該時段超載概率;(3)建議一種實時預(yù)測方法并評估其誤差。答案與解析:(1)累積強度Λ=∫????(3+2sin(πt/30))dt=3×30+2×[?3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論