統(tǒng)計學(xué)基礎(chǔ)知識考核試題題庫及答案_第1頁
統(tǒng)計學(xué)基礎(chǔ)知識考核試題題庫及答案_第2頁
統(tǒng)計學(xué)基礎(chǔ)知識考核試題題庫及答案_第3頁
統(tǒng)計學(xué)基礎(chǔ)知識考核試題題庫及答案_第4頁
統(tǒng)計學(xué)基礎(chǔ)知識考核試題題庫及答案_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學(xué)基礎(chǔ)知識考核試題題庫及答案1.單選題1.1某校抽樣調(diào)查120名學(xué)生的每日手機使用時間,得到平均值為4.3小時,標準差為1.2小時。若將原始數(shù)據(jù)全部乘以0.5后再同時減去0.8小時,則新樣本的均值與標準差分別為A.1.35h,0.6hB.2.15h,0.6hC.1.35h,1.2hD.2.15h,1.2h答案:A解析:線性變換y=ax+b的均值μ_y=aμ_x+b,標準差σ_y=|a|σ_x。此處a=0.5,b=–0.8,故μ_y=0.5×4.3–0.8=1.35h,σ_y=0.5×1.2=0.6h。1.2設(shè)隨機變量X服從參數(shù)λ=3的泊松分布,則P(X=2)等于A.9e?3/2B.3e?3C.e?3D.4.5e?3答案:A解析:泊松概率質(zhì)量函數(shù)P(X=k)=λ^ke^{-λ}/k!,代入k=2得32e^{-3}/2!=9e^{-3}/2。1.3在簡單隨機抽樣中,樣本容量n增大時,樣本均值的抽樣分布A.偏度絕對值增大B.峰度絕對值增大C.標準誤減小D.方差增大答案:C解析:樣本均值的標準誤為σ/√n,n增大則標準誤減小,分布更集中于總體均值附近。1.4對同一總體進行兩次獨立抽樣,容量分別為10與40,測得樣本方差分別為s?2與s?2,則A.s?2一定是s?2的無偏估計B.s?2的抽樣波動小于s?2C.兩者均值為總體方差的無偏估計D.兩者合并方差一定大于s?2答案:B解析:樣本方差作為統(tǒng)計量本身具有隨機性,容量越大其抽樣分布越集中,波動越?。缓喜⒎讲钚杓訖?quán),未必大于s?2;無偏性針對期望而非單次觀測。1.5在線性回歸模型y=β?+β?x+ε中,若ε~N(0,σ2)且滿足高斯-馬爾可夫假定,則β?的最小二乘估計量β??的抽樣分布為A.t分布,自由度n–2B.正態(tài),均值為β?,方差σ2/SxxC.正態(tài),均值為β?,方差σ2/nD.卡方,自由度n–2答案:B解析:β??是y的線性組合,y正態(tài)則β??正態(tài);其方差為σ2/Sxx,其中Sxx=Σ(xi–x?)2。1.6設(shè)X~N(μ,9),抽取n=16的樣本,檢驗H?:μ=50vsH?:μ≠50,顯著性水平α=0.05,臨界值為A.±1.645B.±1.96C.±2.12D.±2.58答案:B解析:σ已知,使用Z檢驗,雙側(cè)0.05對應(yīng)±1.96。1.7在列聯(lián)表χ2獨立性檢驗中,若期望頻數(shù)小于5的單元格比例超過20%,應(yīng)優(yōu)先A.增大樣本量B.使用Fisher精確檢驗C.合并相鄰行或列D.直接報告χ2值答案:C解析:合并可提升期望頻數(shù),保持檢驗近似有效;若結(jié)構(gòu)不允許合并,再考慮Fisher或增大樣本。1.8對時間序列做一階差分后,序列的自相關(guān)函數(shù)迅速衰減至0,說明原序列A.存在線性趨勢B.為白噪聲C.為平穩(wěn)序列D.存在季節(jié)波動答案:A解析:差分可消除趨勢,差分后接近白噪聲則原序列含趨勢成分。1.9若隨機變量X的矩母函數(shù)M_X(t)=(1–2t)^{-4},t<1/2,則X的方差為A.8B.16C.32D.4答案:C解析:此為Gamma分布矩母函數(shù),形狀k=4,尺度θ=2,方差kθ2=4×4=32。1.10Bootstrap置信區(qū)間的“百分位法”直接采用A.樣本統(tǒng)計量的標準誤B.重抽樣統(tǒng)計量的α/2與1–α/2經(jīng)驗分位數(shù)C.t分布臨界值D.正態(tài)近似答案:B解析:百分位法以bootstrap分布的相應(yīng)分位數(shù)作為區(qū)間端點,無需正態(tài)或t假設(shè)。2.多選題2.1下列關(guān)于中心極限定理的描述正確的有A.要求總體必須正態(tài)B.樣本均值分布隨n增大趨于正態(tài)C.總體方差有限是充分條件之一D.適用于樣本比例E.要求樣本獨立同分布答案:BCDE解析:中心極限定理不要求總體正態(tài),但需iid、有限方差;樣本比例可看作均值特例。2.2在多元線性回歸中,多重共線性可能導(dǎo)致A.參數(shù)估計方差膨脹B.t檢驗顯著但模型整體F檢驗不顯著C.回歸系數(shù)符號與理論相反D.殘差平方和急劇下降E.VIF值大于10答案:ACE解析:共線性使信息重疊,方差增大、符號反轉(zhuǎn)、VIF升高;F檢驗仍可能顯著;殘差平方和不會因此急劇下降。2.3下列屬于非參數(shù)檢驗方法的有A.Mann-WhitneyU檢驗B.Kruskal-Wallis檢驗C.Wilcoxon符號秩檢驗D.符號檢驗E.Durbin-Watson檢驗答案:ABCD解析:Durbin-Watson用于檢驗自相關(guān),屬回歸診斷,非非參數(shù)檢驗。2.4關(guān)于貝葉斯估計,正確的有A.后驗分布∝似然×先驗B.損失函數(shù)為平方誤差時,后驗均值是Bayes估計C.隨著樣本量增加,先驗影響減弱D.必須采用無信息先驗E.可信區(qū)間頻率學(xué)派意義下的覆蓋概率等于置信水平答案:ABC解析:D錯,可采用有信息先驗;E錯,可信區(qū)間與置信區(qū)間哲學(xué)不同,覆蓋概率不保證等于名義水平。2.5下列指標可用于衡量分類模型性能的有A.ROC曲線下面積AUCB.F1分數(shù)C.對數(shù)損失D.平均絕對誤差MAEE.馬修斯相關(guān)系數(shù)MCC答案:ABCE解析:MAE用于回歸,余者均可評估分類性能。3.判斷題3.1若兩變量相關(guān)系數(shù)r=0,則它們一定獨立。答案:錯誤解析:r=0僅表示無線性相關(guān),非線性關(guān)系可能存在,獨立性更強。3.2在假設(shè)檢驗中,p值越大,拒絕原假設(shè)的證據(jù)越強。答案:錯誤解析:p值越小證據(jù)越強;p值大表明數(shù)據(jù)與原假設(shè)兼容。3.3對右偏總體,樣本均值的抽樣分布隨n增大趨于對稱。答案:正確解析:中心極限定理保證均值的抽樣分布趨近正態(tài),對稱性增強。3.4若回歸模型出現(xiàn)異方差,則最小二乘估計量不再無偏。答案:錯誤解析:異方差下OLS仍無偏,但不再有效,標準誤需修正。3.5在ARIMA(0,1,1)模型中,一階差分后序列服從MA(1)。答案:正確解析:ARIMA(0,1,1)即對原序列差分后得到MA(1)。4.填空題4.1設(shè)X~B(n=50,p=0.2),用正態(tài)近似計算P(X≤10)時,連續(xù)性校正后的標準化統(tǒng)計量為______。答案:Z=(10.5–50×0.2)/√(50×0.2×0.8)=0.5/√8≈0.177解析:均值np=10,方差np(1–p)=8;連續(xù)性校正加0.5。4.2在單因素方差分析中,組間均方MSB=120,組內(nèi)均方MSE=30,因素有4個水平,每水平樣本量8,則F統(tǒng)計量為______。答案:120/30=4解析:F=MSB/MSE。4.3若隨機變量X的密度函數(shù)f(x)=2x,0≤x≤1,則E(X)=______。答案:∫?1x·2xdx=2/3解析:直接求期望積分。4.4對某總體做無放回抽樣,總體容量N=500,樣本量n=50,總體比例p=0.1,則樣本比例的標準誤為______。答案:√[0.1×0.9/50×(500–50)/(500–1)]≈0.0387解析:有限總體修正因子√[(N–n)/(N–1)]。4.5在線性回歸中,決定系數(shù)R2=0.81,則因變量的變異中被模型解釋的比例為______%。答案:81解析:R2即解釋比例。5.計算題5.1某生產(chǎn)線袋裝食品標稱質(zhì)量500g。隨機抽取25袋測得平均495g,樣本標準差10g。假設(shè)質(zhì)量服從正態(tài)分布,檢驗是否顯著低于標稱值(α=0.05)。答案:H?:μ=500,H?:μ<500t=(495–500)/(10/√25)=–2.5自由度24,單側(cè)臨界值–1.711–2.5<–1.711,拒絕H?,認為平均質(zhì)量顯著低于500g。解析:總體標準差未知,用單樣本t檢驗。5.2為比較兩種化肥對小麥產(chǎn)量的影響,隨機區(qū)組設(shè)計,8個地塊分別施用A、B兩種肥料,得產(chǎn)量差值d(kg):4.5,3.2,–1.0,0.8,2.7,5.1,1.9,3.6。檢驗兩種肥料是否顯著差異(α=0.05)。答案:差值均值d?=2.6,差值標準差s_d≈1.96t=2.6/(1.96/√8)≈3.75,自由度7,雙側(cè)臨界±2.365|3.75|>2.365,拒絕H?,認為兩種肥料產(chǎn)量差異顯著。解析:配對t檢驗。5.3設(shè)X~N(μ,16),欲使μ的95%置信區(qū)間寬度不超過2,求最小樣本量。答案:寬度=2×z_{0.025}×σ/√n≤22×1.96×4/√n≤2?√n≥7.84?n≥61.47取整62。解析:寬度公式直接反解。5.4某電商網(wǎng)站點擊轉(zhuǎn)化率歷史值3%,現(xiàn)改版后1000次點擊轉(zhuǎn)化40次,檢驗是否顯著提高(α=0.05)。答案:H?:p=0.03,H?:p>0.03Z=(0.04–0.03)/√(0.03×0.97/1000)≈1.84單側(cè)臨界1.645,1.84>1.645,拒絕H?,認為轉(zhuǎn)化率顯著提高。解析:大樣本正態(tài)近似。5.5已知隨機變量X的密度f(x)=θx^{θ–1},0<x<1,θ>0?;跇颖緓?,…,x?,求θ的極大似然估計。答案:似然L=∏θx_i^{θ–1}=θ?(∏x_i)^{θ–1}對數(shù)似然lnL=nlnθ+(θ–1)Σlnx_i求導(dǎo)d/dθ=n/θ+Σlnx_i=0?θ?=–n/Σlnx_i解析:常規(guī)MLE推導(dǎo)。6.綜合應(yīng)用題6.1某城市地鐵公司記錄14個工作日早高峰乘車人數(shù)(萬人):28.3,27.9,29.1,28.7,29.8,30.2,29.5,28.9,29.0,29.3,28.6,29.4,30.0,29.7。(1)計算均值、標準差及中位數(shù);(2)使用Shapiro-Wilk檢驗正態(tài)性(α=0.05),給出結(jié)論;(3)若正態(tài),求平均乘車人數(shù)95%置信區(qū)間;(4)預(yù)測下一個工作日乘車人數(shù)90%預(yù)測區(qū)間。答案:(1)x?≈29.25,s≈0.684,中位數(shù)29.25(2)軟件得W=0.974,p值=0.91>0.05,不拒絕正態(tài)假設(shè)(3)置信區(qū)間:29.25±t_{0.025,13}×0.684/√14=29.25±0.39→(28.86,29.64)(4)預(yù)測區(qū)間:29.25±t_{0.05,13}×s√(1+1/14)=29.25±1.23→(28.02,30.48)解析:依次使用描述統(tǒng)計、正態(tài)檢驗、均值的置信區(qū)間及新觀測的預(yù)測區(qū)間公式。6.2研究人員建立Logistic回歸預(yù)測客戶違約,變量:x?為月收入(千元),x?為歷史逾期次數(shù),x?為是否擁有房產(chǎn)(1是0否)。擬合得:logit(p)=–3.2+0.02x?+0.45x?–0.8x?(1)解釋x?系數(shù)含義;(2)某客戶月收入12k,逾期2次,無房產(chǎn),求違約概率;(3)計算x?的邊際效應(yīng)(保持其余變量均值);(4)若樣本量1000,違約100人,求模型基線準確率與最大可能準確率。答案:(1)在收入與逾期次數(shù)相同情況下,擁有房產(chǎn)者違約對數(shù)優(yōu)勢降低0.8,優(yōu)勢比為e^{-0.8}≈0.45,即風(fēng)險降低55%(2)logit=–3.2+0.02×12+0.45×2–0=–2.06,p=1/(1+e^{2.06})≈0.113(3)邊際效應(yīng)=β?·p(1–p)≈0.45×0.113×0.887≈0.045,即逾期次數(shù)增加1,違約概率上升約4.5個百分點(4)基線準確率=max(違約率,1–違約率)=90%;最大可能準確率為100%解析:Logistic系數(shù)解釋、概率轉(zhuǎn)換、邊際效應(yīng)公式及基線定義。6.3某工廠質(zhì)檢抽取10批零件,每批50件,記錄不合格數(shù):2,3,1,4,2,5,3,2,1,3。(1)構(gòu)建p控制圖,計算中心線與上下控制限;(2)有點出界嗎?(3)若過程穩(wěn)定,估計過程平均不合格率;(4)若要求不合格率不超過2%,需至少抽檢多少件,才能以90%把握發(fā)現(xiàn)真實不合格率升至5%?答案:(1)總不合格26,總抽檢500,平均不合格率p?=0.052UCL=p?+3√[p?(1–p?)/50]=0.052+0.094=0.146LCL=0.052–0.094=–0.042→取0(2)各點不合格率:0.04,0.06,0.02,0.08,0.04,0.10,0.06,0.04,0.02,0.06,均在0–0.146內(nèi),無出界(3)過程平均不合格率估計5.2%(4)單樣本比例檢驗,H?:p=0.05,H?:p=0.02,單側(cè)Z_{0.9}=1.28n≥[1.28√(0.02×0.98)+1.28√(0.05×0.95)]2/(0.05–0.02)2≈203解析:控制圖公式、穩(wěn)定性判斷及樣本量計算。6.4為研究溫度對化學(xué)反應(yīng)產(chǎn)率的影響,實驗設(shè)置5個溫度梯度,每個溫度重復(fù)4次,得方差分析表:來源SSdfMSF溫度480412015誤差60154總計54019(1)完成上表;(2)溫度效應(yīng)是否顯著(α=0.01)?(3)計算溫度解釋的變異比例;(4)若第3溫度組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論