統(tǒng)計(jì)知識(shí)考試題庫(kù)附答案_第1頁(yè)
統(tǒng)計(jì)知識(shí)考試題庫(kù)附答案_第2頁(yè)
統(tǒng)計(jì)知識(shí)考試題庫(kù)附答案_第3頁(yè)
統(tǒng)計(jì)知識(shí)考試題庫(kù)附答案_第4頁(yè)
統(tǒng)計(jì)知識(shí)考試題庫(kù)附答案_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)知識(shí)考試題庫(kù)附答案1.單選題某市交通部門(mén)想估計(jì)早高峰時(shí)段平均車(chē)速,隨機(jī)抽取100輛機(jī)動(dòng)車(chē),測(cè)得樣本均值28.4km/h,樣本標(biāo)準(zhǔn)差4.6km/h。若用t分布構(gòu)造95%置信區(qū)間,則區(qū)間半寬最接近下列哪一項(xiàng)?A.0.46km/hB.0.92km/hC.1.15km/hD.1.84km/h答案:B解析:自由度df=n?1=99,查t分布表得t0.975(99)≈1.984。半寬=t×s/√n=1.984×4.6/10≈0.913km/h,四舍五入0.92km/h。2.單選題在簡(jiǎn)單隨機(jī)抽樣下,樣本均值的標(biāo)準(zhǔn)誤差與總體標(biāo)準(zhǔn)差σ及樣本量n的關(guān)系是:A.σ/nB.σ/√nC.σ2/nD.σ2/√n答案:B解析:由中心極限定理,樣本均值抽樣分布標(biāo)準(zhǔn)差為σ/√n,即標(biāo)準(zhǔn)誤差。3.單選題某質(zhì)檢員每天從生產(chǎn)線上隨機(jī)抽取5件產(chǎn)品測(cè)重,連續(xù)20天共得100個(gè)數(shù)據(jù)。若欲建立X?-R控制圖,則R圖的中心線應(yīng)使用下列哪一項(xiàng)估計(jì)總體標(biāo)準(zhǔn)差?A.R?/d2B.R?/c4C.s?/c4D.s?/d2答案:A解析:R圖用極差估計(jì)σ,公式σ?=R?/d2,其中d2為與樣本量n=5有關(guān)的常數(shù)2.326。4.單選題對(duì)同一批數(shù)據(jù)做線性回歸,若將自變量x的單位由“米”改為“厘米”,則決定系數(shù)R2會(huì):A.增大100倍B.減小100倍C.不變D.變?yōu)樵瓉?lái)的1/10000答案:C解析:R2是比例,與變量量綱無(wú)關(guān),僅取決于變異解釋比例。5.單選題在假設(shè)檢驗(yàn)中,若顯著性水平α由0.05調(diào)整為0.01,則犯第一類(lèi)錯(cuò)誤的概率:A.增大B.減小C.不變D.可能增大也可能減小答案:B解析:第一類(lèi)錯(cuò)誤概率就是α,調(diào)小α直接降低拒真概率。6.單選題設(shè)X~N(μ,σ2),則P(|X?μ|≤1.96σ)約等于:A.90%B.95%C.97.5%D.99%答案:B解析:標(biāo)準(zhǔn)正態(tài)分布雙側(cè)95%臨界值為±1.96。7.單選題在列聯(lián)表χ2檢驗(yàn)中,若期望頻數(shù)小于5的單元格比例超過(guò)20%,合理的處理方式是:A.直接計(jì)算χ2值B.合并相鄰行或列C.改用t檢驗(yàn)D.增加α水平答案:B解析:χ2檢驗(yàn)要求期望頻數(shù)不宜過(guò)小,合并可提高期望頻數(shù)。8.單選題對(duì)0-1變量Y建立Logistic回歸,若某自變量系數(shù)估計(jì)為0.8,則其優(yōu)勢(shì)比OR為:A.0.8B.1.8C.2.23D.0.45答案:C解析:OR=e^β=e^0.8≈2.23。9.單選題在單因素方差分析中,若組間均方MSB顯著大于組內(nèi)均方MSE,可認(rèn)為:A.各組樣本量不等B.各組總體方差不等C.各組總體均值不全相等D.數(shù)據(jù)非正態(tài)答案:C解析:ANOVA原假設(shè)H0:μ1=μ2=…=μk,拒絕即意味著至少一對(duì)均值不等。10.單選題若隨機(jī)變量X服從參數(shù)λ=3的泊松分布,則E(X2)等于:A.3B.6C.9D.12答案:D解析:泊松分布E(X)=λ,Var(X)=λ,E(X2)=Var(X)+[E(X)]2=3+9=12。11.單選題對(duì)時(shí)間序列做一階差分的主要目的是:A.消除趨勢(shì)B.消除季節(jié)C.提高方差D.降低樣本量答案:A解析:差分可將非平穩(wěn)趨勢(shì)序列轉(zhuǎn)化為平穩(wěn)序列。12.單選題在Bootstrap估計(jì)中,若原始樣本量n=50,采用有放回重復(fù)抽樣1000次,則每次Bootstrap樣本量應(yīng)為:A.50B.1000C.任意D.50×1000答案:A解析:Bootstrap原則:每次重抽樣樣本量與原始樣本相同,即n。13.單選題若兩變量Pearson相關(guān)系數(shù)r=0,則下列一定成立的是:A.兩變量獨(dú)立B.兩變量無(wú)線性關(guān)系C.兩變量無(wú)曲線關(guān)系D.兩變量方差相等答案:B解析:r僅度量線性關(guān)系,r=0僅說(shuō)明不存在線性相關(guān),但可能有非線性關(guān)系。14.單選題在貝葉斯估計(jì)中,若先驗(yàn)分布為Beta(2,2),似然為二項(xiàng)分布Bin(n=10,k=7),則后驗(yàn)分布為:A.Beta(2,2)B.Beta(7,3)C.Beta(9,5)D.Beta(10,10)答案:C解析:Beta為二項(xiàng)共軛先驗(yàn),后驗(yàn)參數(shù)α'=α+k=2+7=9,β'=β+n?k=2+3=5。15.單選題當(dāng)多元線性回歸出現(xiàn)多重共線性時(shí),方差膨脹因子VIF會(huì):A.接近0B.接近1C.遠(yuǎn)大于1D.變?yōu)樨?fù)值答案:C解析:VIF>10通常視為嚴(yán)重共線,VIF越大說(shuō)明共線性越嚴(yán)重。16.單選題對(duì)同一數(shù)據(jù)分別用K-Means與層次聚類(lèi),若樣本量高達(dá)10萬(wàn),則一般更高效的算法是:A.K-MeansB.層次聚類(lèi)C.兩者一樣D.無(wú)法比較答案:A解析:K-Means時(shí)間復(fù)雜度約O(nkt),層次聚類(lèi)O(n2)或更高,大數(shù)據(jù)下K-Means更快。17.單選題若某檢驗(yàn)的p值為0.03,則當(dāng)α=0.05時(shí):A.拒絕原假設(shè)B.接受原假設(shè)C.無(wú)法判斷D.需增大樣本量答案:A解析:p<α拒絕H0。18.單選題在正態(tài)總體方差未知且小樣本下,關(guān)于均值μ的檢驗(yàn)應(yīng)采用:A.Z檢驗(yàn)B.χ2檢驗(yàn)C.t檢驗(yàn)D.F檢驗(yàn)答案:C解析:σ未知且n小,用t檢驗(yàn)。19.單選題若某模型AIC=310,BIC=350,另一模型AIC=315,BIC=330,則依據(jù)“越小越好”原則,綜合選擇:A.第一模型B.第二模型C.兩模型一樣好D.需交叉驗(yàn)證答案:B解析:AIC略遜但BIC顯著更優(yōu),BIC懲罰更大,應(yīng)選第二模型。20.單選題對(duì)二分類(lèi)問(wèn)題,若模型預(yù)測(cè)概率閾值為0.5,現(xiàn)將閾值提高到0.8,則召回率Recall一般會(huì):A.上升B.下降C.不變D.先升后降答案:B解析:閾值提高,預(yù)測(cè)正例減少,漏檢增多,召回率下降。21.多選題下列哪些統(tǒng)計(jì)量可用于檢驗(yàn)正態(tài)性?A.Shapiro-Wilk統(tǒng)計(jì)量B.Anderson-Darling統(tǒng)計(jì)量C.Kolmogorov-Smirnov統(tǒng)計(jì)量D.Durbin-Watson統(tǒng)計(jì)量答案:A、B、C解析:Durbin-Watson用于檢驗(yàn)殘差自相關(guān),與正態(tài)性無(wú)關(guān)。22.多選題關(guān)于置信區(qū)間,下列說(shuō)法正確的是:A.95%置信區(qū)間指參數(shù)有95%概率落入該區(qū)間B.區(qū)間越寬,置信水平越高C.增大樣本量可縮小區(qū)間寬度D.置信區(qū)間不包含點(diǎn)估計(jì)值的情況不可能出現(xiàn)答案:B、C解析:A錯(cuò)誤,頻率學(xué)派認(rèn)為參數(shù)固定,區(qū)間隨機(jī);D錯(cuò)誤,區(qū)間必含點(diǎn)估計(jì)。23.多選題下列哪些方法可用于處理缺失數(shù)據(jù)?A.多重插補(bǔ)B.刪除含缺失行C.均值插補(bǔ)D.期望最大化算法答案:A、B、C、D解析:四種皆為常用缺失處理技術(shù)。24.多選題在回歸診斷中,哪些圖可用于檢驗(yàn)同方差性?A.殘差vs擬合值圖B.Q-Q圖C.尺度-位置圖D.偏殘差圖答案:A、C解析:Q-Q圖檢驗(yàn)正態(tài)性,偏殘差圖檢驗(yàn)非線性。25.多選題下列哪些屬于非參數(shù)檢驗(yàn)?A.Mann-WhitneyU檢驗(yàn)B.Kruskal-Wallis檢驗(yàn)C.Wilcoxon符號(hào)秩檢驗(yàn)D.單樣本t檢驗(yàn)答案:A、B、C解析:t檢驗(yàn)屬參數(shù)檢驗(yàn),要求正態(tài)或樣本大。26.多選題若隨機(jī)變量X服從幾何分布,參數(shù)p=0.2,則:A.E(X)=5B.Var(X)=20C.P(X=3)=0.82×0.2D.無(wú)記憶性成立答案:A、C、D解析:幾何分布E(X)=1/p=5,Var(X)=(1?p)/p2=20,C為pmf正確表達(dá)式,D為幾何分布性質(zhì)。27.多選題下列哪些技術(shù)可用于降低模型過(guò)擬合?A.L2正則化B.早停C.DropoutD.增加特征多項(xiàng)式答案:A、B、C解析:增加特征會(huì)加劇過(guò)擬合。28.多選題在實(shí)驗(yàn)設(shè)計(jì)中,區(qū)組化目的包括:A.降低實(shí)驗(yàn)誤差方差B.提高處理比較精度C.增加處理數(shù)D.控制已知干擾變量答案:A、B、D解析:區(qū)組化不直接增加處理數(shù)。29.多選題下列哪些統(tǒng)計(jì)圖形適合展示兩連續(xù)變量關(guān)系?A.散點(diǎn)圖B.箱線圖C.熱力圖D.六邊形分箱圖答案:A、C、D解析:箱線圖用于展示單變量分布或多組比較。30.多選題若兩獨(dú)立樣本均來(lái)自正態(tài)總體,方差未知但假定相等,檢驗(yàn)均值差可用:A.合并方差t檢驗(yàn)B.Welcht檢驗(yàn)C.配對(duì)t檢驗(yàn)D.方差分析答案:A、B解析:配對(duì)t檢驗(yàn)用于相關(guān)樣本,ANOVA用于多組。31.填空題若X~N(10,4),則P(X>12)=________。(用標(biāo)準(zhǔn)正態(tài)累積分布函數(shù)Φ表示)答案:1?Φ(1)解析:Z=(12?10)/√4=1,故P(X>12)=P(Z>1)=1?Φ(1)。32.填空題在簡(jiǎn)單線性回歸中,若SST=100,SSE=25,則R2=________。答案:0.75解析:R2=1?SSE/SST=1?25/100=0.75。33.填空題設(shè)隨機(jī)變量T服從自由度為15的t分布,則其方差為_(kāi)_______。答案:15/13解析:t分布方差df/(df?2),df>2。34.填空題若某泊松過(guò)程平均每分鐘發(fā)生2次事件,則在3分鐘內(nèi)發(fā)生少于4次的概率為_(kāi)_______。(保留三位小數(shù))答案:0.151解析:λt=6,P(N<4)=P(N≤3)=e^(?6)(6^0/0!+…+6^3/3!)=0.1512。35.填空題對(duì)n=20的樣本,若樣本偏度為0,峰度為2,則Jarque-Bera統(tǒng)計(jì)量為_(kāi)_______。答案:2.5解析:JB=(n/6)(S2+(K?3)2/4)=(20/6)(0+(2?3)2/4)=20/6×0.25=2.5。36.填空題若兩變量秩相關(guān)系數(shù)ρ=0.6,樣本量n=10,則檢驗(yàn)H0:ρ=0的t統(tǒng)計(jì)量值為_(kāi)_______。(保留兩位小數(shù))答案:2.12解析:t=ρ√(n?2)/√(1?ρ2)=0.6×√8/√0.64=0.6×2.828/0.8≈2.12。37.填空題在2×3列聯(lián)表中,自由度為_(kāi)_______。答案:2解析:(r?1)(c?1)=1×2=2。38.填空題若Lasso回歸調(diào)參λ增大,則模型變量數(shù)將________。(填“增加”或“減少”)答案:減少解析:λ越大懲罰越強(qiáng),系數(shù)更易被壓縮至0。39.填空題若某AR(1)模型xt=0.3xt?1+εt,則其平穩(wěn)方差為_(kāi)_______。(設(shè)εt方差為1)答案:1/(1?0.32)=1/0.91≈1.099解析:平穩(wěn)方差σ2=σ_ε2/(1?φ2)。40.填空題在Bootstrap估計(jì)標(biāo)準(zhǔn)誤時(shí),重抽樣次數(shù)B一般建議不小于________。答案:1000解析:經(jīng)驗(yàn)上B≥1000可使標(biāo)準(zhǔn)誤估計(jì)穩(wěn)定。41.計(jì)算題某工廠生產(chǎn)鋼絲,其斷裂強(qiáng)度服從正態(tài)分布。隨機(jī)抽取25段,測(cè)得平均強(qiáng)度1850MPa,標(biāo)準(zhǔn)差80MPa。(1)求μ的95%置信區(qū)間。(2)若要求估計(jì)誤差不超過(guò)20MPa,置信水平95%,應(yīng)至少抽取多少段?答案與解析:(1)df=24,t0.975(24)=2.064,半寬=2.064×80/5=33.02,區(qū)間1850±33.02→(1816.98,1883.02)MPa。(2)誤差d=20,n≥(t×s/d)2,迭代初估用z=1.96,n0=(1.96×80/20)2=61.47,取62;再查t0.975(61)=2.00,n1=(2×80/20)2=64,收斂,故至少64段。42.計(jì)算題某電商對(duì)比兩種推薦算法,隨機(jī)分配200名用戶(hù),A組100人平均消費(fèi)320元,標(biāo)準(zhǔn)差60元;B組100人平均350元,標(biāo)準(zhǔn)差70元。假定方差不等,檢驗(yàn)兩算法是否顯著差異(α=0.05)。答案與解析:H0:μA=μB,H1:μA≠μB。Welch檢驗(yàn):t=(320?350)/√(602/100+702/100)=?30/√(36+49)=?30/√85≈?3.25,df=(36+49)2/(362/99+492/99)≈85,查t雙側(cè)臨界±1.99,|t|>1.99,拒絕H0,兩算法消費(fèi)差異顯著。43.計(jì)算題給出數(shù)據(jù)集{2,5,6,8,10,12,15},求:(1)中位數(shù);(2)四分位距IQR;(3)若從中隨機(jī)取3個(gè)數(shù)不放回,求樣本均值大于9的概率。答案與解析:(1)中位數(shù)=8。(2)Q1=位置2的值=5,Q3=位置6的值=12,IQR=12?5=7。(3)總體均值μ=8.57,欲樣本均值>9,即三數(shù)和>27。枚舉共C(7,3)=35種,滿(mǎn)足和>27的有{6,10,12}{6,10,15}{6,12,15}{8,10,12}{8,10,15}{8,12,15}{10,12,15}共7種,概率7/35=0.2。44.計(jì)算題某藥物有效率歷史值60%?,F(xiàn)試驗(yàn)120名患者,其中84人有效。(1)求新樣本比歷史提高的近似p值(單側(cè))。(2)若真實(shí)有效率已達(dá)70%,求該檢驗(yàn)功效(1?β)近似值。(α=0.05單側(cè))答案與解析:(1)H0:p=0.6,H1:p>0.6,z=(0.7?0.6)/√(0.6×0.4/120)=0.1/0.0447≈2.236,p=1?Φ(2.236)≈0.0127。(2)臨界值p?c=0.6+1.645×0.0447≈0.673,功效=P(p?>0.673|p=0.7),z=(0.673?0.7)/√(0.7×0.3/120)=?0.027/0.0416≈?0.65,功效=1?Φ(?0.65)=Φ(0.65)≈0.742。45.計(jì)算題設(shè)X,Y聯(lián)合密度f(wàn)(x,y)=2,0≤x≤y≤1,求Cov(X,Y)。答案與解析:先求邊緣與期望:E(X)=∫?1∫x12xdydx=∫?12x(1?x)dx=1/3,E(Y)=∫?1∫x12ydydx=∫?1(1?x2)dx=2/3,E(XY)=∫?1∫x12xydydx=∫?1x(1?x2)dx=1/2?1/4=1/4,Cov(X,Y)=E(XY)?E(X)E(Y)=1/4?(1/3)(2/3)=1/4?2/9=1/36。46.綜合題某城市出租車(chē)公司想預(yù)測(cè)每日訂單量Y(萬(wàn)單),收集連續(xù)60天數(shù)據(jù),含自變量:X1:平均氣溫(℃),X2:降雨量(mm),X3:周末虛擬變量(0/1),X4:大型活動(dòng)虛擬變量(0/1)。經(jīng)逐步回歸得模型:?=2.1+0.03X1?0.05X2+0.8X3+1.2X4,R2=0.65,調(diào)整R2=0.62,RMSE=0.42。(1)解釋X2系數(shù)含義。(2)若第61天預(yù)報(bào):氣溫28℃,降雨5mm,周六,無(wú)大型活動(dòng),求點(diǎn)預(yù)測(cè)及95%近似預(yù)測(cè)區(qū)間。(3)診斷發(fā)現(xiàn)殘差滯后1階自相關(guān)系數(shù)0.28,應(yīng)如何修正模型?答案與解析:(1)控制其他變量不變,降雨量每增加1mm,日訂單量平均減少0.05萬(wàn)單。(2)?=2.1+0.03×28?0.05×5+0.8×1+1.2×0=2.1+0.84?0.25+0.8=3.49萬(wàn)單。近似區(qū)間:3.49±1.96×0.42→(2.67,4.31)萬(wàn)單。(3)存在輕度自相關(guān),可引入AR(1)誤差項(xiàng)或增加滯后因變量yt?1作為新自變量,亦可使用Cochrane-Orcutt迭代估計(jì)消除自相關(guān)。47.綜合題某高校調(diào)研學(xué)生月生活費(fèi),假設(shè)總體標(biāo)準(zhǔn)差300元。(1)若希望99%置信水平下估計(jì)誤差不超過(guò)50元,求最小樣本量。(2)實(shí)際抽取200人,得平均1650元,求99%置信區(qū)間。(3)若總體實(shí)際右偏,樣本量仍200,上述區(qū)間是否仍有效?說(shuō)明理由。答案與解析:(1)n≥(z×σ/d)2,z0.995=2.576,n≥(2.576×300/50)2=2394.6,至少2395人。(2)1650±2.576×300/√200=1650±54.6→(1595.4,1704.6)元。(3)仍近似有效。n=200較大,中心極限定理保證樣本均值近似正態(tài),區(qū)間可靠性受偏度影響較小,但若偏態(tài)極強(qiáng),可考慮對(duì)數(shù)變換或Bootstrap法。48.綜合題某質(zhì)量工程師記錄連續(xù)30天產(chǎn)品缺陷數(shù):總計(jì)120個(gè)缺陷,每天產(chǎn)量固定500件。(1)建立c圖,求中心線及上下控制限。(2)若第31天發(fā)現(xiàn)7個(gè)缺陷,是否超出控制限?(3)若缺陷類(lèi)型分A、B、C三類(lèi),計(jì)數(shù)分別為60,40,20,用χ2檢驗(yàn)判斷三類(lèi)是否等比例(α=0.05)。答案與解析:(1)c?=120/30=4,UCL=c?+3√c?=4+6=10,LCL=4?6=?2,取0。(2)7∈[0,10],未超限。(3)H0:三類(lèi)比例1:1:1,期望頻數(shù)各40,χ2=(60?40)2/40+(40?40)2/40+(20?40)2/40=400/40+0+400/40=20,df=2,臨界5.99,20>5.99,拒絕H0,缺陷類(lèi)型不等比例。49.綜合題某連鎖超市對(duì)1000名會(huì)員隨機(jī)發(fā)送優(yōu)惠券(面額0元、5元、10元),記錄兩周內(nèi)消費(fèi)。得數(shù)據(jù):面額0元組300人,平均消費(fèi)180元,標(biāo)準(zhǔn)差60元;5元組350人,平均200元,標(biāo)準(zhǔn)差65元;10元組350人,平均220元,標(biāo)準(zhǔn)差70元。(1)用單因素ANOVA檢驗(yàn)優(yōu)惠券面額是否顯著影響消費(fèi)(α=0.05)。(2)若顯著,進(jìn)一步用Tukey法做多重比較,指出哪些組差異顯著。答案與解析:(1)總均值x?=(300×180+350×200+350×220)/1000=200.5,SSB=300(180?200.5)2+350(200?200.5)2+350(220?200.5)2=300×420.25+350×0.2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論