統(tǒng)計(jì)期末試題題庫(kù)(附答案)_第1頁(yè)
統(tǒng)計(jì)期末試題題庫(kù)(附答案)_第2頁(yè)
統(tǒng)計(jì)期末試題題庫(kù)(附答案)_第3頁(yè)
統(tǒng)計(jì)期末試題題庫(kù)(附答案)_第4頁(yè)
統(tǒng)計(jì)期末試題題庫(kù)(附答案)_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)期末試題題庫(kù)(附答案)1.(單選)某市調(diào)查1000名居民的月網(wǎng)購(gòu)支出,記錄“0元”“1–500元”“501–1000元”“1000元以上”四檔,該變量屬于A(yíng).數(shù)值型連續(xù)變量B.數(shù)值型離散變量C.有序分類(lèi)變量D.無(wú)序分類(lèi)變量答案:C解析:雖然原始金額是數(shù)值,但調(diào)查時(shí)進(jìn)行了分段并賦予順序,因此屬于有序分類(lèi)變量。2.(單選)為估計(jì)某高校學(xué)生平均每日刷手機(jī)時(shí)間,隨機(jī)抽取36人,得樣本均值200min,標(biāo)準(zhǔn)差60min。若要求95%置信區(qū)間寬度不超過(guò)20min,至少應(yīng)追加多少人?A.52B.139C.196D.554答案:B解析:寬度=2×z×s/√n≤20,z?.???=1.96,解得n≥(2×1.96×60/20)2≈138.3,向上取整139。3.(單選)下列關(guān)于p值的陳述正確的是A.p值是原假設(shè)為真的概率B.p值越小,樣本量一定越大C.p值<α?xí)r,拒絕原假設(shè)可能犯第一類(lèi)錯(cuò)誤D.p值與效應(yīng)量大小成正比答案:C解析:p值是“在原假設(shè)成立下獲得當(dāng)前或更極端結(jié)果”的概率;拒絕時(shí)可能犯第一類(lèi)錯(cuò)誤,其概率被α控制。4.(單選)對(duì)同一批數(shù)據(jù)分別做線(xiàn)性回歸y=β?+β?x與對(duì)數(shù)回歸lny=β?+β?x,若兩模型的R2分別為0.81與0.85,則A.可直接比較R2說(shuō)明對(duì)數(shù)模型更好B.需將對(duì)數(shù)模型R2換算為y尺度后再比較C.線(xiàn)性模型一定解釋力更高D.兩個(gè)R2含義相同答案:B解析:因變量尺度不同,R2不可直接比較,需用“換算后的y尺度R2”或交叉驗(yàn)證誤差。5.(單選)在單因素方差分析中,若F統(tǒng)計(jì)量=0,則A.組間平方和為0B.組內(nèi)平方和為0C.各組樣本均值相等D.各組總體均值相等答案:A解析:F=MSB/MSW,若F=0則MSB=0,即組間平方和為0,說(shuō)明樣本均值全相等。6.(單選)設(shè)X~N(μ,σ2),σ未知,n=16,檢驗(yàn)H?:μ=μ?,若采用t檢驗(yàn),顯著性水平α=0.05,則拒絕域?yàn)锳.|t|>1.753B.|t|>2.131C.|t|>2.602D.|t|>1.746答案:B解析:自由度15,雙側(cè)臨界值t?.???,15=2.131。7.(單選)對(duì)某2×2列聯(lián)表做卡方檢驗(yàn),得χ2=6.25,則Cramér’sV為A.0.25B.0.50C.0.177D.0.354答案:D解析:V=√(χ2/(n×min(r-1,c-1))),此處min=1,若n=50,則V=√(6.25/50)=0.354。8.(單選)在時(shí)間序列加法模型Y=T+S+C+I中,若采用移動(dòng)平均法估計(jì)T,則季節(jié)成分S一般用A.原始減TB.原始減T再平均C.原始減T再平均后做中心化處理D.原始除T答案:C解析:加法模型中S=Y?T?C?I,實(shí)際估計(jì)時(shí)先對(duì)Y?T按季節(jié)平均,再使各季節(jié)和為0。9.(單選)若隨機(jī)變量X的期望存在,則A.其方差一定存在B.其中位數(shù)一定等于期望C.其所有階矩都存在D.其方差不一定存在答案:D解析:期望存在僅要求一階絕對(duì)矩有限,方差涉及二階矩,可不存在,如柯西分布。10.(單選)Bootstrap置信區(qū)間的“百分位法”是指A.用正態(tài)近似求區(qū)間B.用bootstrap標(biāo)準(zhǔn)誤乘t臨界值C.直接用bootstrap抽樣分布的α/2與1?α/2分位數(shù)D.對(duì)bootstrap均值做偏差校正答案:C解析:百分位法直接取bootstrap統(tǒng)計(jì)量的經(jīng)驗(yàn)分位數(shù),無(wú)需正態(tài)假設(shè)。11.(單選)在多元線(xiàn)性回歸中,若某自變量x?的VIF=10,則A.該變量一定不顯著B(niǎo).該變量系數(shù)符號(hào)一定錯(cuò)誤C.存在嚴(yán)重多重共線(xiàn)性D.應(yīng)直接刪除該變量答案:C解析:VIF=10說(shuō)明1/(1?R2?)=10,即該變量與其他變量復(fù)相關(guān)R2=0.9,共線(xiàn)嚴(yán)重,但未必需刪除。12.(單選)對(duì)同一數(shù)據(jù)做K均值與層次聚類(lèi),若K均值SSE=120,層次聚類(lèi)SSE=150,則A.K均值結(jié)果一定更優(yōu)B.層次聚類(lèi)結(jié)果一定更優(yōu)C.僅說(shuō)明K均值在SSE準(zhǔn)則下更好D.SSE不可比較答案:C解析:SSE是K均值目標(biāo)函數(shù),層次聚類(lèi)不直接最小化SSE,不能直接比“優(yōu)劣”。13.(單選)設(shè)X?,…,X?i.i.d.來(lái)自U(0,θ),則θ的矩估計(jì)為A.2X?B.max(X?)C.min(X?)D.X?答案:A解析:E(X)=θ/2,令X?=θ?/2,得θ?=2X?。14.(單選)在貝葉斯框架中,若先驗(yàn)為Beta(2,2),似然為二項(xiàng)分布Bin(n=10,x=3),則后驗(yàn)均值為A.0.3B.0.333C.0.375D.0.4答案:C解析:后驗(yàn)Beta(2+3,2+7)=Beta(5,9),均值5/(5+9)=0.357≈0.375(四舍五入)。15.(單選)若某指數(shù)平滑模型α=0.8,則A.對(duì)歷史數(shù)據(jù)衰減較慢B.對(duì)最近觀(guān)測(cè)權(quán)重高C.等價(jià)于簡(jiǎn)單移動(dòng)平均D.平滑序列方差一定減小答案:B解析:α大則權(quán)重集中在最近,衰減快。16.(單選)在分類(lèi)問(wèn)題中,ROC曲線(xiàn)下面積AUC=0.85表示A.隨機(jī)抽一個(gè)正類(lèi)得分高于負(fù)類(lèi)的概率0.85B.準(zhǔn)確率85%C.召回率85%D.F1值0.85答案:A解析:AUC定義即為該概率。17.(單選)對(duì)泊松過(guò)程,單位時(shí)間事件數(shù)λ的MLE為A.樣本中位數(shù)B.樣本均值C.樣本眾數(shù)D.樣本方差答案:B解析:泊松均值=λ,MLE=樣本均值。18.(單選)若兩變量秩相關(guān)系數(shù)ρ?=0,則A.兩變量獨(dú)立B.兩變量無(wú)線(xiàn)性相關(guān)C.兩變量無(wú)單調(diào)關(guān)系D.兩變量無(wú)斯皮爾曼單調(diào)關(guān)系答案:D解析:ρ?=0僅說(shuō)明無(wú)單調(diào)關(guān)系,不排除非單調(diào)關(guān)聯(lián)。19.(單選)在正態(tài)總體方差已知時(shí),關(guān)于均值μ的檢驗(yàn),若n增大,則A.第二類(lèi)錯(cuò)誤概率一定增大B.檢驗(yàn)功效一定減小C.第一類(lèi)錯(cuò)誤概率不變D.置信區(qū)間寬度一定增大答案:C解析:α由研究者設(shè)定,不隨n變;功效增大,區(qū)間變窄。20.(單選)對(duì)某數(shù)據(jù)集做主成分分析,第一主成分方差貢獻(xiàn)率45%,第二主成分25%,則前兩個(gè)主成分累計(jì)貢獻(xiàn)率A.45%B.70%C.25%D.無(wú)法計(jì)算答案:B解析:45%+25%=70%。21.(多選)下列哪些方法可用于檢驗(yàn)正態(tài)性A.Shapiro-Wilk檢驗(yàn)B.Kolmogorov-Smirnov檢驗(yàn)C.Q-Q圖D.Anderson-Darling檢驗(yàn)E.Levene檢驗(yàn)答案:A,B,C,D解析:Levene檢驗(yàn)用于方差齊性,不檢驗(yàn)正態(tài)。22.(多選)關(guān)于多重比較校正,正確的有A.Bonferroni法控制族錯(cuò)誤率B.FDR法比Bonferroni更寬松C.TukeyHSD適用于所有兩兩比較D.Scheffe法可用于任意線(xiàn)性對(duì)比E.不校正時(shí)第一類(lèi)錯(cuò)誤率膨脹答案:A,B,C,D,E解析:全對(duì)。23.(多選)下列屬于非參數(shù)檢驗(yàn)的有A.Mann-WhitneyUB.Kruskal-WallisC.Wilcoxon符號(hào)秩D.符號(hào)檢驗(yàn)E.卡方獨(dú)立性檢驗(yàn)答案:A,B,C,D解析:卡方雖無(wú)分布假設(shè),但通常歸為列聯(lián)表方法,非嚴(yán)格非參數(shù)。24.(多選)若隨機(jī)變量X服從幾何分布,則A.具有無(wú)記憶性B.期望為1/pC.方差為(1?p)/p2D.屬于指數(shù)族E.其和服從負(fù)二項(xiàng)答案:A,B,C,D,E解析:幾何分布是負(fù)二項(xiàng)r=1特例,和即負(fù)二項(xiàng);屬指數(shù)族;無(wú)記憶;期望方差如上。25.(多選)在線(xiàn)性回歸中,若殘差呈現(xiàn)“漏斗形”,則A.存在異方差B.可用加權(quán)最小二乘C.可用對(duì)數(shù)變換D.標(biāo)準(zhǔn)誤估計(jì)有偏E.系數(shù)估計(jì)有偏答案:A,B,C,D解析:系數(shù)仍無(wú)偏,但標(biāo)準(zhǔn)誤錯(cuò),t檢驗(yàn)失效。26.(填空)設(shè)X~N(0,1),則E(|X|)=____。答案:√(2/π)解析:利用積分∫?^∞xφ(x)dx=1/√(2π)。27.(填空)若樣本偏度為0,峰度為3,則該分布最接近____分布。答案:正態(tài)解析:正態(tài)偏度0峰度3。28.(填空)對(duì)某AR(1)模型X?=0.7X???+ε?,其平穩(wěn)方差為_(kāi)___(ε?~iidN(0,1))。答案:1/(1?0.72)=1/0.51≈1.9608解析:Var(X)=σ2/(1?φ2)。29.(填空)若Logistic回歸系數(shù)β?=0.8,則x每增加1單位,優(yōu)勢(shì)比變?yōu)樵璤___倍。答案:e^0.8≈2.2255解析:OR=e^β。30.(填空)對(duì)某樣本n=100,樣本比例p?=0.15,則其99%置信區(qū)間半寬為_(kāi)___(保留三位小數(shù))。答案:2.576×√(0.15×0.85/100)=0.092解析:z?.???=2.576。31.(計(jì)算)某工廠(chǎng)兩臺(tái)機(jī)器生產(chǎn)同型號(hào)零件,分別抽取n?=50,n?=60,測(cè)得平均長(zhǎng)度120mm與122mm,樣本標(biāo)準(zhǔn)差分別為4mm與5mm。假定方差不相等,試在α=0.05下檢驗(yàn)兩臺(tái)機(jī)器是否顯著差異,并求均值差的95%置信區(qū)間。答案:t=(120?122)/√(42/50+52/60)=?2.309,df≈103.9,|t|>1.983,拒絕H?。差值?2±1.983×√(16/50+25/60)=?2±1.983×0.896=?2±1.777→(?3.777,?0.223)mm。32.(計(jì)算)對(duì)某完全隨機(jī)設(shè)計(jì),四組樣本量均為8,組均值分別為10,12,15,18,組內(nèi)平方和480,試完成方差分析表并給出結(jié)論(α=0.01)。答案:SSB=8×[(10?13.75)2+(12?13.75)2+(15?13.75)2+(18?13.75)2]=8×24.75=198,SST=198+480=678,dfB=3,dfW=28,MSB=66,MSW=17.14,F(xiàn)=3.85,F(xiàn)?.??,3,28≈4.57,3.85<4.57,不拒絕,尚不能認(rèn)為四組均值不同。33.(計(jì)算)某連鎖超市記錄10家門(mén)店促銷(xiāo)前后一周銷(xiāo)售額(萬(wàn)元)如下:門(mén)店:12345678910前:30283540293231333436后:33303842313534363739試用非參數(shù)方法檢驗(yàn)促銷(xiāo)是否有效(α=0.05)。答案:取差值:3,2,3,2,2,3,3,3,3,3,符號(hào)檢驗(yàn)正符號(hào)10/10,p=2×(0.5)^10=0.00195<0.05,拒絕,促銷(xiāo)顯著有效。34.(計(jì)算)設(shè)X?,…,X?來(lái)自密度f(wàn)(x)=θx^{θ?1},0<x<1,θ>0,求θ的MLE及其漸近方差。答案:L=θ?∏x?^{θ?1},lnL=nlnθ+(θ?1)∑lnx?,令導(dǎo)數(shù)得θ?=?n/∑lnx?,I(θ)=n/θ2,漸近方差θ2/n。35.(計(jì)算)對(duì)某2×3列聯(lián)表,卡方獨(dú)立性檢驗(yàn)得χ2=12.5,n=200,求列聯(lián)系數(shù)C與Cramér’sV,并解釋。答案:C=√(χ2/(n+χ2))=√(12.5/212.5)=0.242,V=√(12.5/(200×1))=0.25,二者均顯示中等強(qiáng)度關(guān)聯(lián)。36.(綜合)某電商想預(yù)測(cè)日銷(xiāo)量Y,收集30天數(shù)據(jù),變量:x?=廣告費(fèi)(萬(wàn)元),x?=周末虛擬(0/1),x?=促銷(xiāo)強(qiáng)度(1–5)。用最小二乘得:Y?=50+12x?+30x?+8x?,R2=0.75,殘差診斷:DW=1.8,殘差Q-Q圖基本直線(xiàn),但x?與x?相關(guān)系數(shù)0.85。(1)解釋系數(shù)12;(2)是否存在多重共線(xiàn)?如何改進(jìn)?(3)若廣告費(fèi)增加1萬(wàn)元,周末且促銷(xiāo)強(qiáng)度為4,銷(xiāo)量變化?(4)給出DW=1.8的結(jié)論。答案:(1)控制其他變量,廣告費(fèi)每增1萬(wàn)元,日銷(xiāo)量平均增12件。(2)x?與x?高相關(guān),VIF可能高,存在共線(xiàn);可中心化交互、主成分、嶺回歸或剔除一個(gè)。(3)ΔY=12×1+30×0+8×0=12件(僅廣告效應(yīng))。(4)DW≈2無(wú)自相關(guān),1.8接近2,尚不能認(rèn)為存在顯著自相關(guān)。37.(綜合)某醫(yī)學(xué)試驗(yàn)測(cè)量20名患者治療前后血壓,得平均差值?8mmHg,差值標(biāo)準(zhǔn)差10mmHg。(1)給出差值均值μd的95%置信區(qū)間;(2)若臨床認(rèn)為降低5mmHg才有效,請(qǐng)檢驗(yàn);(3)若n增至80,區(qū)間寬度如何變化?答案:(1)?8±2.093×10/√20=?8±4.68→(?12.68,?3.32);(2)H?:μd=?5,t=(?8+5)/(10/√20)=?1.34,|t|<2.093,不拒絕,尚不能認(rèn)為達(dá)到臨床有效;(3)寬度與√n成反比,n×4,寬度/2,新寬≈2.34。38.(綜合)設(shè)X~Exp(λ),Y~Exp(μ)獨(dú)立,求P(X<Y)。答案:P(X<Y)=∫?^∞∫x^∞λe^{?λx}μe^{?μy}dydx=λ/(λ+μ)。39.(綜合)對(duì)某數(shù)據(jù)集做K均值聚類(lèi),K從2到8,繪制“肘部圖”發(fā)現(xiàn)SSE下降緩慢,且silhouette均值在K=3時(shí)最大0.55,K=4時(shí)0.54,K=5時(shí)0.52,請(qǐng)給出建議并說(shuō)明理由。答案:選K=3;silhouette最高且肘部圖無(wú)顯著下降,兼顧解釋性與聚類(lèi)質(zhì)量。40.(綜合)某質(zhì)量控制圖設(shè)置X?圖,中心線(xiàn)50,標(biāo)準(zhǔn)差2,n=5,試計(jì)算3σ上下控制限,并說(shuō)明若連續(xù)7點(diǎn)同側(cè)是否報(bào)警。答案:UCL=50+3×2/√5=52.68,LCL=47.32;連續(xù)7點(diǎn)同側(cè)為典型“游程”準(zhǔn)則,應(yīng)報(bào)警,提示過(guò)程可能偏移。41.(證明)設(shè)X?,…,X?i.i.d.N(μ,σ2),證明樣本方差S2是σ2的無(wú)偏估計(jì)。答案:E(S2)=E(1/(n?1)∑(X??X?)2)=σ2,經(jīng)典結(jié)論,利用E(∑(X??X?)2)=(n?1)σ2。42.(證明)對(duì)簡(jiǎn)單線(xiàn)性回歸y?=β?+β?x?+ε?,證明β?的OLS估計(jì)可寫(xiě)為β??=∑(x??x?)(y???)/∑(x??x?)2。答案:最小化RSS,對(duì)β?求導(dǎo)并令0即得。43.(軟件應(yīng)用)用R語(yǔ)言寫(xiě)一段代碼:生成1000個(gè)服從N(3,4)的隨機(jī)數(shù),繪制直方圖并疊加密度曲線(xiàn),計(jì)算95%置信區(qū)間。答案:set.seed(123)x<-rnorm(1000,mean=3,sd=2)hist(x,freq=FALSE,col="skyblue",border="white")curve(dnorm(x,3,2),add=TRUE,col="red",lwd=2)t.test(x)$44.(軟件應(yīng)用)用Python完成:對(duì)iris數(shù)據(jù)做PCA,輸出解釋方差比,并繪制前兩個(gè)主成分散點(diǎn)圖,顏色按品種區(qū)分。答案:importseabornassnsfromsklearn.decompositionimportPCAimportmatplotlib.pyplotaspltiris=sns.load_dataset('iris')X=iris.drop('species',axis=1)pca=PCA(n_components=2)X2=pca.fit_transform(X)print(pca.explained_variance_ratio_)plt.scatter(X2[:,0],X2[:,1],c=iris.species.astype('category').cat.codes)plt.show()45.(案例)某市交通部門(mén)想評(píng)估限行政策對(duì)PM2.5的影響,收集政策前后各40天數(shù)據(jù),已知前后平均濃度差?5μg/m3,標(biāo)準(zhǔn)差差值12μg/m3,但數(shù)據(jù)呈右偏。(1)應(yīng)選t檢驗(yàn)還是非參數(shù)?(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論