山西大學(xué)2026年《統(tǒng)計學(xué)導(dǎo)論》期末試題及答案_第1頁
山西大學(xué)2026年《統(tǒng)計學(xué)導(dǎo)論》期末試題及答案_第2頁
山西大學(xué)2026年《統(tǒng)計學(xué)導(dǎo)論》期末試題及答案_第3頁
山西大學(xué)2026年《統(tǒng)計學(xué)導(dǎo)論》期末試題及答案_第4頁
山西大學(xué)2026年《統(tǒng)計學(xué)導(dǎo)論》期末試題及答案_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

山西大學(xué)2026年《統(tǒng)計學(xué)導(dǎo)論》期末試題及答案一、單項選擇題(每題2分,共20分)1.某研究者想比較三種不同教學(xué)方法對學(xué)生成績的影響,最適合的統(tǒng)計方法是A.單樣本t檢驗??B.配對t檢驗??C.單因素方差分析??D.卡方檢驗答案:C解析:比較三個及以上獨(dú)立組的均值差異,應(yīng)使用單因素方差分析(One-wayANOVA)。t檢驗僅適用于兩組,卡方檢驗用于分類變量。2.若隨機(jī)變量X~N(μ,σ2),則P(μ-1.96σ≤X≤μ+1.96σ)約為A.90%??B.95%??C.99%??D.68%答案:B解析:標(biāo)準(zhǔn)正態(tài)分布在±1.96σ之間的面積約為0.95,即95%。3.在簡單線性回歸中,若決定系數(shù)R2=0.81,則相關(guān)系數(shù)r的絕對值為A.0.81??B.0.9??C.0.656??D.無法確定答案:B解析:R2=r2,故|r|=√0.81=0.9。4.下列哪項不是時間序列的構(gòu)成要素A.長期趨勢??B.季節(jié)變動??C.循環(huán)波動??D.抽樣誤差答案:D解析:抽樣誤差屬于抽樣調(diào)查概念,與時間序列分解無關(guān)。5.在假設(shè)檢驗中,增大樣本量會導(dǎo)致A.α一定減小??B.β一定減小??C.檢驗功效一定增大??D.臨界值一定增大答案:C解析:樣本量增大,標(biāo)準(zhǔn)誤減小,檢驗功效(1-β)提高;α由研究者事先設(shè)定,與樣本量無關(guān)。6.對同一總體進(jìn)行重復(fù)抽樣,樣本均值的分布稱為A.樣本分布??B.抽樣分布??C.總體分布??D.經(jīng)驗分布答案:B解析:樣本統(tǒng)計量的概率分布稱為抽樣分布。7.若兩變量完全負(fù)線性相關(guān),則其Pearson相關(guān)系數(shù)為A.0??B.1??C.-1??D.無法計算答案:C解析:完全負(fù)線性相關(guān)時,所有點落在一條斜率為負(fù)的直線上,r=-1。8.在列聯(lián)表檢驗中,當(dāng)期望頻數(shù)小于5的單元格比例超過20%時,應(yīng)A.增大樣本量??B.使用Fisher精確檢驗??C.合并行列??D.以上均可答案:D解析:卡方檢驗要求期望頻數(shù)不宜過小,可通過增大樣本、合并類別或改用精確方法解決。9.若某指數(shù)今年為120,去年為100,則今年相對于去年的增長速度為A.20%??B.120%??C.16.7%??D.1.2%答案:A解析:增長速度=(120-100)/100=20%。10.在Bootstrap估計中,重復(fù)抽樣的次數(shù)通常建議不少于A.100??B.500??C.1000??D.10000答案:C解析:為保證估計穩(wěn)定,Bootstrap重復(fù)次數(shù)一般≥1000。二、多項選擇題(每題3分,共15分,多選少選均不得分)11.下列屬于描述統(tǒng)計方法的有A.直方圖??B.箱線圖??C.假設(shè)檢驗??D.莖葉圖??E.散點圖答案:ABDE解析:假設(shè)檢驗屬于推斷統(tǒng)計,其余為描述統(tǒng)計。12.關(guān)于p值,正確的說法有A.p值越小,拒絕原假設(shè)的證據(jù)越強(qiáng)B.p值表示原假設(shè)為真的概率C.p值大于顯著性水平時,不能拒絕原假設(shè)D.p值與樣本量無關(guān)E.p值依賴于檢驗統(tǒng)計量的觀測值答案:ACE解析:p值是原假設(shè)成立下出現(xiàn)當(dāng)前或更極端結(jié)果的概率,非原假設(shè)本身概率;樣本量影響標(biāo)準(zhǔn)誤,從而間接影響p值。13.下列哪些情況可能導(dǎo)致“偽回歸”A.序列存在單位根且未協(xié)整B.遺漏重要解釋變量C.解釋變量與被解釋變量互為因果D.殘差存在異方差E.樣本量過小答案:ABC解析:單位根非平穩(wěn)且未協(xié)整時,t統(tǒng)計量分布扭曲;遺漏變量與雙向因果造成估計偏誤;異方差與小樣本影響效率而非偽回歸本質(zhì)。14.關(guān)于置信區(qū)間,正確的有A.95%置信區(qū)間指參數(shù)有95%概率落入該區(qū)間B.區(qū)間寬度與樣本量成反比C.置信水平越高,區(qū)間越寬D.重復(fù)抽樣構(gòu)造的區(qū)間中,約95%包含真值E.置信區(qū)間中心是樣本統(tǒng)計量答案:BCDE解析:參數(shù)是固定常數(shù),置信區(qū)間是隨機(jī)的,A表述錯誤。15.下列屬于非參數(shù)檢驗的有A.Wilcoxon符號秩檢驗??B.Kruskal-Wallis檢驗??C.Mann-WhitneyU檢驗??D.符號檢驗??E.單因素ANOVA答案:ABCD解析:E為參數(shù)檢驗,要求正態(tài)性與方差齊性。三、判斷題(每題1分,共10分,正確打“√”,錯誤打“×”)16.標(biāo)準(zhǔn)差一定小于均值。??答案:×解析:標(biāo)準(zhǔn)差與均值量綱相同,但數(shù)值大小無必然關(guān)系,如N(0,1)均值0,標(biāo)準(zhǔn)差1。17.若兩變量獨(dú)立,則其協(xié)方差一定為零。??答案:√解析:獨(dú)立?Cov(X,Y)=0;反之不成立,除非聯(lián)合正態(tài)。18.在泊松分布中,均值與方差相等。??答案:√解析:Poisson(λ)的期望與方差均為λ。19.增大顯著性水平α必然導(dǎo)致β減小。??答案:√解析:α與β呈反向關(guān)系,在樣本量固定時。20.決定系數(shù)R2可用來評價邏輯回歸模型的擬合優(yōu)度。??答案:×解析:邏輯回歸使用似然比、偽R2(如NagelkerkeR2),而非線性回歸的R2。21.峰度大于3表示分布比正態(tài)分布更尖峭。??答案:√解析:超額峰度=峰度-3,正值為尖峰。22.系統(tǒng)抽樣屬于概率抽樣。??答案:√解析:系統(tǒng)抽樣按固定間隔抽取,每個單元入樣概率已知。23.若殘差呈現(xiàn)漏斗形,說明存在多重共線性。??答案:×解析:漏斗形提示異方差,多重共線性表現(xiàn)為方差膨脹因子增大。24.中位數(shù)對極端值比均值更敏感。??答案:×解析:中位數(shù)是位置統(tǒng)計量,對極端值穩(wěn)健。25.在指數(shù)平滑中,平滑系數(shù)α越接近1,模型對歷史數(shù)據(jù)越依賴。??答案:×解析:α→1表示給予最新觀測值更大權(quán)重,對歷史衰減更快。四、填空題(每空2分,共20分)26.若X~B(n=100,p=0.2),則E(X)=____,Var(X)=____。答案:20;16解析:二項分布期望np,方差np(1-p)。27.在假設(shè)檢驗中,同時控制α與β的有效方法是____。答案:增大樣本量解析:樣本量增加可同時降低α與β。28.若樣本均值x?=50,s=10,n=25,則均值標(biāo)準(zhǔn)誤為____。答案:2解析:標(biāo)準(zhǔn)誤=s/√n=10/5=2。29.拉氏價格指數(shù)使用____期數(shù)量作為權(quán)重。答案:基解析:Laspeyres指數(shù)以基期數(shù)量為權(quán)。30.若隨機(jī)變量Z~N(0,1),則P(Z>1.645)=____。答案:0.05解析:單側(cè)5%臨界值。31.在聚類分析中,衡量樣本間距離的常用度量是____距離。答案:歐氏解析:Euclidean距離最常用。32.若回歸模型出現(xiàn)序列相關(guān),可采用____檢驗。答案:DW(Durbin-Watson)解析:DW檢驗檢測一階自相關(guān)。33.若樣本偏度為-0.8,則分布呈____偏。答案:左解析:負(fù)偏度表示左偏,長尾在左。34.在貝葉斯框架中,先驗與似然的乘積正比于____。答案:后驗解析:Bayes定理:后驗∝先驗×似然。35.若將5點李克特量表視為連續(xù)變量進(jìn)行Pearson相關(guān),需滿足____性假設(shè)。答案:近似正態(tài)解析:雖然有序,但大樣本下近似正態(tài)即可。五、簡答題(每題8分,共24分)36.說明中心極限定理的內(nèi)容及其在統(tǒng)計推斷中的作用。答案:中心極限定理(CLT)指出,從任意總體(均值為μ,方差為σ2有限)中抽取容量為n的隨機(jī)樣本,當(dāng)n足夠大時,樣本均值的分布近似服從N(μ,σ2/n)。作用:1.無需知道總體分布即可對均值進(jìn)行正態(tài)近似推斷;2.構(gòu)建置信區(qū)間:x?±zα/2·s/√n;3.進(jìn)行假設(shè)檢驗:t或z檢驗均依賴該近似;4.為大樣本理論奠定基礎(chǔ),如Bootstrap、漸近分布。37.比較分層抽樣與整群抽樣的優(yōu)缺點。答案:分層抽樣:優(yōu)點:1.層內(nèi)同質(zhì)、層間異質(zhì)可提高估計精度;2.可對各層分別估計,靈活;3.便于組織與管理。缺點:1.需完整抽樣框且分層變量已知;2.分層變量選擇不當(dāng)反降低精度;3.加權(quán)復(fù)雜。整群抽樣:優(yōu)點:1.僅需群框,無需個體框,成本低;2.現(xiàn)場調(diào)查集中,節(jié)省交通費(fèi)用;3.適合自然成群總體。缺點:1.群間差異大導(dǎo)致設(shè)計效應(yīng)高,精度低;2.樣本量相同時誤差大于簡單隨機(jī);3.統(tǒng)計分析需考慮群內(nèi)相關(guān),復(fù)雜。38.解釋多重共線性對回歸模型的影響及診斷方法。答案:影響:1.系數(shù)估計方差膨脹,t值不顯著;2.系數(shù)符號與理論相反;3.模型對樣本微小變化敏感,預(yù)測不穩(wěn)定;4.難以區(qū)分各自變量邊際貢獻(xiàn)。診斷:1.方差膨脹因子VIF>10為嚴(yán)重;2.特征值與條件指數(shù),>30提示問題;3.相關(guān)系數(shù)矩陣,|r|>0.9需警惕;4.系數(shù)符號與理論背離;5.剔除或合并變量、主成分、嶺回歸可緩解。六、計算與綜合題(共61分)39.(10分)某生產(chǎn)線袋裝面粉標(biāo)稱500g,隨機(jī)抽取16袋,測得x?=495g,s=8g。假定質(zhì)量服從正態(tài)分布,檢驗是否顯著不足(α=0.05)。答案:H0:μ=500;H1:μ<500t=(495-500)/(8/√16)=-5/2=-2.5臨界值t0.05,15=-1.753∵-2.5<-1.753,拒絕H0結(jié)論:袋裝面粉平均質(zhì)量顯著低于標(biāo)稱。解析:單側(cè)檢驗,使用t分布,自由度n-1=15。40.(12分)隨機(jī)調(diào)查200名本科生,記錄月消費(fèi)(元)與性別,得:男生n1=120,x?1=1800,s1=300;女生n2=80,x?2=1650,s2=250。(1)檢驗?zāi)信孪M(fèi)差異是否顯著(α=0.05);(2)求均值差μ1-μ2的95%置信區(qū)間。答案:(1)H0:μ1=μ2;H1:μ1≠μ2合并標(biāo)準(zhǔn)誤:Sp2=((119·3002+79·2502))/(198)=77525SE=√(Sp2(1/120+1/80))=√(77525·0.0208)=√1612.5≈40.16t=(1800-1650)/40.16≈3.73t0.025,198≈1.972|t|>1.972,拒絕H0,差異顯著。(2)置信區(qū)間:(1800-1650)±1.972·40.16=150±79.2=(70.8,229.2)元解析:方差齊性下用合并方差t檢驗;區(qū)間不含0,與檢驗一致。41.(12分)某市近12個月二手房均價(萬元/㎡)如下:3.2,3.3,3.5,3.4,3.6,3.8,3.7,3.9,4.0,4.1,4.2,4.3(1)用3期簡單移動平均預(yù)測第13個月價格;(2)計算指數(shù)平滑(α=0.3)第12期平滑值S12;(3)比較兩種方法哪種對本期誤差更小。答案:(1)F13=(4.1+4.2+4.3)/3=4.2(2)S1=3.2S2=0.3·3.3+0.7·3.2=3.23迭代至S12=3.89(3)實際第12期為4.3移動平均誤差:|4.2-4.3|=0.1平滑誤差:|3.89-4.3|=0.41∴移動平均更小。解析:指數(shù)平滑需遞推,α小則平滑度高,對近期變化反應(yīng)慢。42.(13分)為研究廣告投入x(萬元)對銷售額y(萬元)的影響,收集15個城市數(shù)據(jù),擬合得:?=20+1.5x,SST=1200,SSE=300(1)求決定系數(shù)R2并解釋;(2)檢驗x對y的線性關(guān)系是否顯著(α=0.01);(3)若x=10,求y的90%預(yù)測區(qū)間(x?=8,Σ(x-x?)2=200,s=√(300/13)=4.8)。答案:(1)R2=1-SSE/SST=1-300/1200=0.75,解釋75%銷售變動。(2)F=(SSR/1)/(SSE/(n-2))=(900/1)/(300/13)=39F0.01,1,13=9.0739>9.07,拒絕H0,關(guān)系顯著。(3)預(yù)測值:20+1.5·10=35標(biāo)準(zhǔn)誤預(yù)測:s_pred=4.8√(1+1/15+(10-8)2/200)=4.8√1.0867≈5.0t0.05,13=1.771區(qū)間:35±1.771·5.0=(26.1,43.9)萬元解析:預(yù)測區(qū)間含未來隨機(jī)誤差,比置信區(qū)間寬。43.(14分)某電商平臺想比較三種快遞包裝方案對破損率的影響,隨機(jī)分配90個訂單,每種30個,記錄破損情況:方案A:破損5件;B:破損3件;C:破損10件。(1)構(gòu)建3×2列聯(lián)表;(2)用卡方檢驗判斷破損率差異是否顯著(α=0.05);(3)若差異顯著,進(jìn)一步比較哪兩種方案差異主要來源。答案:(1)列聯(lián)表:方案?破損?完好?合計A??5??25??30B??3??27??30C??10??20??30合計?18??72??90(2)期望頻數(shù):A破損=18·30/90=6,同理B=6,C=6χ2=Σ(O-E)2/E=(5-6)2/6+(3-6)2/6+(10-6)2/6+(25-24)2/24+(27-24)2/24+(20-24)2/24=1/6+9/6+16/6+1/24+9/24+16/24=26/6+26/24=4.33+1.08=5.41df=(3-1)(2-1)=2χ20.05,2=5.995.41<5.99,不拒絕H0,差異不顯著。(3)因整體差異不顯著,無需事后比較。解析:期望頻數(shù)均>5,卡方近似有效;若顯著可用Bonferroni校正兩兩比較。七、軟件應(yīng)用題(共20分)44.使用R語言完成下列任務(wù),并寫出關(guān)鍵代碼與結(jié)果解讀。數(shù)據(jù)集:shauni.csv,包含變量height(cm)、weight(kg)、gender(M/F)、college(文理法醫(yī)工)。(1)讀取數(shù)據(jù)并計算男女平均身高差異的t檢驗(方差齊性);(2)繪制weight對height的散點圖,并添加回

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論