版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫——數(shù)據(jù)分析計(jì)算題解析與答案1.某高校隨機(jī)抽取120名本科生,記錄其每日平均學(xué)習(xí)時(shí)間(單位:分鐘)與期末GPA。已知:∑x=10800,∑y=384,∑x2=1080000,∑y2=1248,∑xy=35640。(1)計(jì)算樣本相關(guān)系數(shù)r,并檢驗(yàn)H?:ρ=0(α=0.05)。(2)建立GPA關(guān)于學(xué)習(xí)時(shí)間的簡單線性回歸方程,并解釋斜率含義。(3)若某生日均學(xué)習(xí)150min,預(yù)測其GPA并給出95%置信區(qū)間。(4)計(jì)算決定系數(shù)R2,并說明其意義。解:(1)x?=10800/120=90,?=384/120=3.2。Sxx=∑x2–nx?2=1080000–120×902=108000,Syy=∑y2–n?2=1248–120×3.22=19.2,Sxy=∑xy–nx??=35640–120×90×3.2=1080。r=Sxy/√(SxxSyy)=1080/√(108000×19.2)=0.750。檢驗(yàn)統(tǒng)計(jì)量t=r√(n–2)/√(1–r2)=0.750√118/√(1–0.752)=12.47。雙側(cè)臨界值t?.???,118≈1.98,|t|>1.98,拒絕H?,線性相關(guān)顯著。(2)β??=Sxy/Sxx=1080/108000=0.010,β??=?–β??x?=3.2–0.010×90=2.30。回歸方程?=2.30+0.010x。斜率0.010表示日均學(xué)習(xí)時(shí)間每增加1分鐘,GPA平均提高0.010分。(3)x?=150,??=2.30+0.010×150=3.80。殘差標(biāo)準(zhǔn)誤s=√[(Syy–β??Sxy)/(n–2)]=√[(19.2–0.010×1080)/118]=0.316。標(biāo)準(zhǔn)誤預(yù)測均值s?=s√[1/n+(x?–x?)2/Sxx]=0.316√[1/120+602/108000]=0.058。95%置信區(qū)間3.80±1.98×0.058=[3.69,3.91]。(4)R2=r2=0.7502=0.562,即56.2%的GPA變異可由學(xué)習(xí)時(shí)間解釋。2.某市交通部門記錄8個(gè)路口改造前后高峰小時(shí)車流量(輛/小時(shí)):改造前:420,380,450,390,410,370,400,430;改造后:380,360,420,370,390,350,380,410。假設(shè)差值服從正態(tài)分布,檢驗(yàn)改造是否顯著降低車流量(α=0.05),并計(jì)算平均減少量的95%置信區(qū)間。解:差值d=前–后:40,20,30,20,20,20,20,20。d?=23.75,s_d=7.07,n=8。t=d?/(s_d/√n)=23.75/(7.07/√8)=9.49。單側(cè)臨界值t?.??,7=1.895,t>1.895,拒絕H?,改造顯著降低流量。95%置信區(qū)間d?±t?.???,7×s_d/√n=23.75±2.365×7.07/√8=[17.8,29.7]輛/小時(shí)。3.某電商平臺(tái)隨機(jī)抽取15份訂單,記錄優(yōu)惠金額(元)與顧客評(píng)分(1–5星):優(yōu)惠額:0,5,10,15,20,25,30,35,40,45,50,55,60,65,70;評(píng)分:3.2,3.0,3.5,3.7,3.9,4.0,4.2,4.3,4.5,4.6,4.7,4.8,4.8,4.9,5.0。擬合二次模型Score=β?+β?Discount+β?Discount2+ε。(1)寫出設(shè)計(jì)矩陣X與響應(yīng)向量y。(2)用最小二乘求參數(shù)估計(jì)β?=(X?X)?1X?y。(3)檢驗(yàn)二次項(xiàng)是否顯著(α=0.05)。(4)計(jì)算優(yōu)惠38元時(shí)的預(yù)測評(píng)分及95%預(yù)測區(qū)間。解:(1)X為15×3矩陣,第1列全1,第2列為優(yōu)惠額,第3列為優(yōu)惠額平方;y=(3.2,3.0,…,5.0)?。(2)經(jīng)計(jì)算:X?X=?1552522750??525227501086375??22750108637556875000?,X?y=[63.9,2456.5,109637.5]?。求逆得(X?X)?1,乘得β?=[3.018,0.0412,–0.000355]?。擬合方程?=3.018+0.0412x–0.000355x2。(3)全模型SSE_full=0.0945,簡化模型(無二次項(xiàng))SSE_red=0.3184。F=[(0.3184–0.0945)/1]/(0.0945/12)=28.4>F?.??,1,12=4.75,二次項(xiàng)顯著。(4)x?=38,??=3.018+0.0412×38–0.000355×382=4.51。預(yù)測標(biāo)準(zhǔn)誤s_pred=√[MSE(1+x??(X?X)?1x?)]=0.128。95%預(yù)測區(qū)間4.51±2.179×0.128=[4.23,4.79]。4.某制藥公司比較三種降壓藥A、B、C的收縮壓降低值(mmHg),各藥隨機(jī)分配10名患者,數(shù)據(jù):A:12,15,9,10,8,13,14,11,12,10;B:18,16,20,17,19,21,15,18,17,19;C:14,16,13,15,17,12,14,15,16,14。單因素方差分析(α=0.05),若顯著則進(jìn)行Tukey多重比較。解:組均值x?_A=11.4,x?_B=18.0,x?_C=14.6,總均值=14.67。SSA=10[(11.4–14.67)2+(18.0–14.67)2+(14.6–14.67)2]=220.27,SSE=∑(x_ij–x?_i)2=34.4+30.0+22.4=86.8。F=(SSA/2)/(SSE/27)=110.13/3.21=34.3>F?.??,2,27=3.35,拒絕H?。TukeyHSD:q?.??,3,27=3.51,標(biāo)準(zhǔn)誤=√(MSE/n)=√(3.21/10)=0.566。HSD=3.51×0.566=1.99。均值差:B–A=6.6,C–A=3.2,B–C=3.4(表示顯著)。結(jié)論:B降壓效果最佳,C次之,A最差。5.某銀行審核1000份信用卡申請(qǐng),建立邏輯回歸預(yù)測違約(1=違約,0=正常),自變量:年齡、年收入(萬元)、負(fù)債比、信用卡張數(shù)。輸出部分結(jié)果:系數(shù)估計(jì):β?=–4.2,β_age=–0.05,β_income=–0.20,β_debt=2.1,β_cards=0.15。協(xié)變量矩陣(X?X)?1對(duì)角線:0.012,0.008,0.005,0.003,0.002。(1)寫出違約概率表達(dá)式。(2)計(jì)算30歲、年收入8萬元、負(fù)債比0.3、持卡2張的違約概率。(3)檢驗(yàn)負(fù)債比系數(shù)是否顯著(α=0.05)。(4)計(jì)算負(fù)債比OR的95%置信區(qū)間并解釋。解:(1)logit(p)=–4.2–0.05Age–0.20Income+2.1Debt+0.15Cards。(2)線性預(yù)測η=–4.2–0.05×30–0.20×8+2.1×0.3+0.15×2=–6.17。p=e^η/(1+e^η)=0.0021,即0.21%。(3)z=β_debt/SE=2.1/√0.005=29.7>1.96,顯著。(4)OR=e^{2.1}=8.17,95%CI:e^{2.1±1.96√0.005}=[7.35,9.08]。解釋:負(fù)債比每增加0.1,違約odds增加約8.17倍,置信區(qū)間不含1,效應(yīng)顯著。6.某氣象站記錄60年逐年降水量(mm),樣本均值580,標(biāo)準(zhǔn)差120。檢驗(yàn)H?:總體中位數(shù)=600,用符號(hào)檢驗(yàn)(α=0.05)。解:記X>600為“+”,X<600為“–”,觀測得34個(gè)“+”,26個(gè)“–”。在H?下,+號(hào)數(shù)~Binomial(n=60,p=0.5)。正態(tài)近似:z=(34–30)/√(60×0.5×0.5)=4/3.873=1.03。雙側(cè)p=2×P(Z>1.03)=0.30>0.05,不拒絕H?,無充分證據(jù)表明中位數(shù)偏離600mm。7.某連鎖超市20家門店,收集月銷售額y(萬元)、面積x?(百m2)、促銷費(fèi)x?(萬元)、距市中心距離x?(km)。擬合多元線性回歸,結(jié)果:β?=(5.2,1.30,0.75,–0.20)?,MSE=0.64,R2=0.83。(1)寫出回歸方程。(2)檢驗(yàn)整體顯著性(α=0.05)。(3)計(jì)算x?偏回歸系數(shù)的95%置信區(qū)間。(4)若某店面積3百m2、促銷費(fèi)2萬元、距離5km,預(yù)測銷售額并給出95%預(yù)測區(qū)間。解:(1)?=5.2+1.30x?+0.75x?–0.20x?。(2)F=(R2/k)/[(1–R2)/(n–k–1)]=(0.83/3)/(0.17/16)=26.0>F?.??,3,16=3.24,整體顯著。(3)需(X?X)??對(duì)應(yīng)元素,假設(shè)為0.018,則CI:1.30±2.12√(0.64×0.018)=[1.16,1.44]。(4)x?=(1,3,2,5),??=5.2+1.30×3+0.75×2–0.20×5=10.1。s_pred=√[MSE(1+x??(X?X)?1x?)]=0.92。95%預(yù)測區(qū)間10.1±2.12×0.92=[8.15,12.05]萬元。8.某工廠質(zhì)檢每隔半小時(shí)抽取5件產(chǎn)品,共20組,測得不合格品數(shù):3,2,4,1,2,0,3,2,1,2,3,4,2,1,0,2,3,2,1,2。構(gòu)建p控制圖,判斷過程是否受控(α=0.0027)。解:總不合格40件,總檢驗(yàn)100件,平均不合格率p?=0.40。UCL=p?+3√[p?(1–p?)/n]=0.40+3√(0.24/5)=1.06(取1因比例≤1),LCL=max(0,0.40–0.66)=0。所有點(diǎn)均在[0,1]內(nèi),無超出,過程受控。9.某高校調(diào)查400名畢業(yè)生,記錄性別與是否考研:男180人,考研108;女220人,考研154。檢驗(yàn)性別與考研是否獨(dú)立(α=0.05),并計(jì)算Cramér’sV。解:列聯(lián)表:考研不考合計(jì)男10872180女15466220合計(jì)262138400χ2=400(108×66–72×154)2/(180×220×262×138)=3.84。臨界值χ2?.??,1=3.84,p≈0.050,恰好處于邊界,謹(jǐn)慎認(rèn)為關(guān)聯(lián)微弱。Cramér’sV=√(χ2/n(min(r–1,c–1)))=√(3.84/400)=0.098,小效應(yīng)。10.某實(shí)驗(yàn)室測量反應(yīng)時(shí)間(秒)服從指數(shù)分布,隨機(jī)樣本n=25,∑x=50。檢驗(yàn)H?:λ=1(α=0.05),并計(jì)算λ的95%置信區(qū)間。解:指數(shù)分布均值μ=1/λ,樣本均值x?=2。似然比檢驗(yàn):Λ=2[25ln(1/2)–25+25×2]=2[–17.33–25+50]=15.34>χ2?.??,1=3.84,拒絕H?。置信區(qū)間基于χ2:2nx?/χ2?.???,2n=100/64.2=1.56,2nx?/χ2?.???,2n=100/39.4=2.54。故λ∈[0.39,0.64](因λ=1/μ)。11.某游戲公司A/B測試兩種登錄界面,舊界面1000用戶,三日留存420;新界面1200用戶,留存528。檢驗(yàn)新界面留存率是否更高(α=0.01),并計(jì)算差異的99%置信區(qū)間。解:p??=0.42,p??=0.44,合并p?=(420+528)/2200=0.431。z=(0.44–0.42)/√[0.431×0.569×(1/1000+1/1200)]=0.02/0.0208=0.96。單側(cè)p=0.17>0.01,不拒絕H?。99%CI:(0.44–0.42)±2.33×0.0208=[–0.028,0.068],含0,與檢驗(yàn)一致。12.某研究機(jī)構(gòu)測得12名志愿者攝入某營養(yǎng)素后血糖變化(mg/dL):5,8,–2,6,10,3,7,4,9,1,6,5。假設(shè)差值服從正態(tài)分布,檢驗(yàn)平均變化是否大于0(α=0.05),并計(jì)算功效(真實(shí)均值=4,σ=3)。解:d?=5.17,s=3.25,n=12。t=5.17/(3.25/√12)=5.50>t?.??,11=1.796,拒絕H?,顯著升高。功效:非中心參數(shù)δ=4/(3/√12)=4.62,臨界t=1.796,power=P(T’>1.796)≈0.98(查非中心t表)。13.某城市50個(gè)社區(qū)記錄年均PM2.5(μg/m3)與肺癌發(fā)病率(每萬人):r=0.68,x?=45,?=32,Sxx=2000,Syy=1100。(1)建立回歸方程預(yù)測發(fā)病率。(2)若某社區(qū)PM2.5為50,預(yù)測發(fā)病率及95%置信區(qū)間。(3)計(jì)算Spearman秩相關(guān),數(shù)據(jù)無結(jié),給出檢驗(yàn)結(jié)果。解:(1)β??=r√(Syy/Sxx)=0.68√(1100/2000)=0.503,β??=32–0.503×45=9.37。?=9.37+0.503x。(2)x?=50,??=9.37+0.503×50=34.5。s=√[(Syy–β??2Sxx)/(n–2)]=√(286/48)=2.44。s?=2.44√[1/50+(50–45)2/2000]=0.39。95%CI:34.5±2.01×0.39=[33.7,35.3]/萬人。(3)Spearmanrs=0.67,檢驗(yàn)z=rs√(n–1)=0.67×7=4.69>1.96,顯著。14.某電商平臺(tái)2025年1月至12月銷售額(百萬元):26,28,31,29,33,35,38,40,37,39,42,45。擬合線性趨勢y=β?+β?t+ε,t=1,…,12。(1)求β??,β??。(2)預(yù)測2026年4月銷售額并給出95%預(yù)測區(qū)間。(3)計(jì)算Durbin-Watson統(tǒng)計(jì)量并檢驗(yàn)自相關(guān)(α=0.05)。解:(1)t?=6.5,?=35.25,Stt=143,Sty=183.5。β??=183.5/143=1.28,β??=35.25–1.28×6.5=26.9。?=26.9+1.28t。(2)t?=16,??=26.9+1.28×16=47.4。s=√[(Syy–β??Sty)/(n–2)]=√(192.2–234.9)/10,修正SSE=42.7,s=2.07。s_pred=2.07√[1+1/12+(16–6.5)2/143]=2.68。95%預(yù)測區(qū)間47.4±2.228×2.68=[41.4,53.4]百萬元。(3)DW=∑(e_t–e_{t–1})2/∑e_t2=28.4/42.7=0.67。查表d_L=0.97,d_U=1.30,0.67<d_L,存在正自相關(guān)。15.某高校隨機(jī)調(diào)查300名本科生,記錄月生活費(fèi)y(元)、家庭收入x?(千元)、性別x?(1=男,0=女)。擬合交互模型y=β?+β?x?+β?x?+β?x?x?+ε,結(jié)果:β?=(800,120,–150,30)?,MSE=40000,n=300。(1)寫出男女各自的回歸方程。(2)檢驗(yàn)交互項(xiàng)是否顯著(α=0.05)。(3)計(jì)算家庭收入8千元時(shí)男女平均生活費(fèi)差異的95%置信區(qū)間。解:(1)男:x?=1,?=(800–150)+(120+30)x?=650+150x?;女:x?=0,?=800+120x?。(2)需(X?X)?1對(duì)應(yīng)元素,假設(shè)SE(β??)=12,則t=30/12=2.5>1.96,顯著。(3)差異=(650+150×8)–(800+120×8)=1850–1760=90元。Var(diff)=Var(β??+8β??)=Var(β??)+64Var(β??)+16Cov(β??,β??)。假設(shè)估算得SE=28,則95%CI:90±1.96×28=[35,145]元。16.某生物實(shí)驗(yàn)比較三種培養(yǎng)基對(duì)細(xì)胞增殖倍數(shù):基A:8次重復(fù),均值3.2,方差0.36;基B:10次,均值4.1,方差0.49;基C:9次,均值3.8,方差0.64。單因素ANOVA(α=0.05),若顯著用Bonferroni比較。解:總均值=(8×3.2+10×4.1+9×3.8)/27=3.73。SSA=8(3.2–3.73)2+10(4.1–3.73)2+9(3.8–3.73)2=3.46,SSE=7×0.36+9×0.49+8×0.64=13.79。F=(3.46/2)/(13.79/24)=3.01>F?.??,2,24=3.40,不顯著。Bonferroni無需進(jìn)行。17.某金融公司建立泊松回歸預(yù)測每日投訴電話數(shù),暴露變量為日交易量(萬筆),系數(shù)β?=0.008(SE=0.002)。(1)解釋系數(shù)含義。(2)檢驗(yàn)β>0(α=0.01)。(3)交易量500萬筆時(shí),預(yù)期投訴數(shù)及99%置信區(qū)間。解:(1)交易量每增加1萬
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年福建長泰國有投資集團(tuán)有限公司及權(quán)屬子公司招聘5人考試參考題庫及答案解析
- 2026年合肥市第四十五中學(xué)菱湖分校招聘編外聘用教師筆試模擬試題及答案解析
- 2026云南旅游職業(yè)學(xué)院招聘14人筆試模擬試題及答案解析
- 2026浙江杭州市西湖區(qū)農(nóng)業(yè)農(nóng)村局面向社會(huì)招聘編外人員1名筆試備考題庫及答案解析
- 2026年物業(yè)管理應(yīng)急處理方案
- 2026年精益供應(yīng)鏈協(xié)同培訓(xùn)
- 2026年沈陽體育學(xué)院公開招聘高層次和急需緊缺人才18人(第一批)筆試參考題庫及答案解析
- 2026上半年貴州事業(yè)單位聯(lián)考貴州省社會(huì)主義學(xué)院(貴州中華文化學(xué)院)招聘2人考試備考題庫及答案解析
- 2026年未來城市選擇與房地產(chǎn)市場趨勢比較
- 2026年生態(tài)修復(fù)工程實(shí)踐培訓(xùn)
- 植筋工程施工驗(yàn)收記錄表范例
- 2025至2030年中國冷凍食品行業(yè)市場調(diào)研及行業(yè)投資策略研究報(bào)告
- 壓空罐安全知識(shí)培訓(xùn)課件
- 2025年江蘇南京市建鄴區(qū)招聘第一批購崗人員5人筆試模擬試題及答案詳解1套
- 市場保潔管理方案(3篇)
- 醫(yī)院調(diào)料雜糧副食品采購項(xiàng)目方案投標(biāo)文件(技術(shù)方案)
- 靜脈給藥的安全管理
- 銀行從業(yè)者觀《榜樣》心得體會(huì)
- 農(nóng)村年底活動(dòng)方案
- 2024屆山東省威海市高三二模數(shù)學(xué)試題(解析版)
- 設(shè)備管理獎(jiǎng)罰管理制度
評(píng)論
0/150
提交評(píng)論