版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
2026多元統(tǒng)計期末試題及答案1.(25分)某市2026年1—12月空氣質(zhì)量指數(shù)(AQI)與同期PM2.5、SO?、NO?、O?、CO五項污染物濃度(單位:μg/m3,CO為mg/m3)的逐日數(shù)據(jù)已中心化。現(xiàn)抽取n=360條記錄,得到樣本協(xié)差陣S(×10?2):||AQI|PM2.5|SO?|NO?|O?|CO||--------|------|------|-----|-----|-----|-----||AQI|8.42|||||||PM2.5|6.31|5.88||||||SO?|2.04|1.93|1.76|||||NO?|3.27|2.85|1.12|2.45||||O?|-1.55|-1.42|-0.31|-0.68|3.20|||CO|4.18|3.76|1.45|2.01|-0.93|2.89|(1)計算AQI與PM2.5的偏相關(guān)(控制其余變量)并給出顯著性結(jié)論(α=0.01)。(2)以AQI為因變量,其余五項為自變量建立多元線性模型,給出回歸方程、R2、調(diào)整R2及整體F檢驗。(3)若某月PM2.5、SO?、NO?、O?、CO的均值依次比總體均值高1.2、0.5、0.8、-0.3、0.6個標(biāo)準(zhǔn)差,利用(2)中模型預(yù)測該月AQI偏離均值多少。(4)檢驗PM2.5與O?的回歸系數(shù)是否同時為零(α=0.05)。(5)計算所有自變量的方差膨脹因子VIF,并診斷多重共線性。答案與解析(1)記Y=AQI,X?=PM2.5,X?=(SO?,NO?,O?,CO)?。將S分塊:S_{YY}=8.42,S_{YX?}=6.31,S_{YX?}=(2.04,3.27,-1.55,4.18),S_{X?X?}=5.88,S_{X?X?}=(1.93,2.85,-1.42,3.76),S_{X?X?}=|1.761.12-0.311.45||1.122.45-0.682.01||-0.31-0.683.20-0.93||1.452.01-0.932.89|偏相關(guān)r_{YX?|X?}=(S_{YX?}-S_{YX?}S_{X?X?}^{-1}S_{X?X?})/√[(S_{YY}-S_{YX?}S_{X?X?}^{-1}S_{YX?})(S_{X?X?}-S_{X?X?}S_{X?X?}^{-1}S_{X?X?})].先求S_{X?X?}^{-1},用Cholesky分解得精確逆,代入算得分子=2.117,分母=√(3.884×1.973)=2.768,故r=0.765。自由度=n-p-1=360-5-1=354,檢驗統(tǒng)計量t=r√(354)/√(1-r2)=21.4,遠大于t_{0.005}(354)=2.59,拒絕原假設(shè),偏相關(guān)顯著。(2)由S可立刻得到β?=S_{XX}^{-1}S_{XY},其中S_{XX}為5×5子矩陣。計算得:β?=(0.712,0.238,0.451,-0.186,0.396)?,截距因中心化而為0?;貧w方程:AQ?I=0.712·PM2.5+0.238·SO?+0.451·NO?-0.186·O?+0.396·CO.R2=S_{YX}β?/S_{YY}=7.884/8.42=0.936,調(diào)整R2=1-(1-R2)(n-1)/(n-p-1)=0.935。整體F=(R2/p)/[(1-R2)/(n-p-1)]=995.3,F(xiàn)_{0.01}(5,354)=3.02,極顯著。(3)記Z=(1.2,0.5,0.8,-0.3,0.6)?,則預(yù)測偏離為β??Z=0.712×1.2+0.238×0.5+0.451×0.8-0.186×(-0.3)+0.396×0.6=1.396個標(biāo)準(zhǔn)差。(4)構(gòu)造子矩陣C=[01000;00010],檢驗H?:Cβ=0。F=[(RSS_H-RSS)/q]/[RSS/(n-p-1)],其中q=2,RSS=(1-R2)S_{YY}(n-1)=222.7,RSS_H需重新回歸剔除PM2.5與O?后計算得RSS_H=612.4,F(xiàn)=(612.4-222.7)/2/(222.7/354)=309.8,F(xiàn)_{0.05}(2,354)=3.00,拒絕,兩變量不能同時刪除。(5)VIF_j=1/(1-R_j2),R_j2為第j個變量對其余回歸的決定系數(shù)。計算得:VIF_{PM2.5}=4.32,VIF_{SO?}=2.11,VIF_{NO?}=2.78,VIF_{O?}=1.65,VIF_{CO}=3.05。最大VIF<5,共線性溫和,無需修正。2.(20分)對某電商2026年“6·18”大促期間1000名用戶的購物數(shù)據(jù),提取其瀏覽時長X?(分鐘)、加購件數(shù)X?、優(yōu)惠券使用張數(shù)X?、支付延遲X?(小時)及最終成交額Y(百元)。已做標(biāo)準(zhǔn)化,得到相關(guān)陣R:||X?|X?|X?|X?|Y||-----|-----|-----|-----|-----|-----||X?|1||||||X?|0.63|1|||||X?|0.41|0.55|1||||X?|-0.22|-0.31|-0.18|1|||Y|0.58|0.71|0.46|-0.37|1|(1)求Y對X?—X?的全模型最小二乘估計,并給出回歸平方和SSR與誤差平方和SSE。(2)采用逐步回歸(α進=0.05,α出=0.10),給出最終入選變量及回歸方程。(3)若某用戶X?=1.5,X?=0.8,X?=-0.6,X?=0.2,計算其95%置信區(qū)間與95%預(yù)測區(qū)間。(4)基于殘差分析,發(fā)現(xiàn)支付延遲X?的殘差圖呈明顯漏斗形,提出一種改進方案并給出新模型估計。答案與解析(1)標(biāo)準(zhǔn)化模型β?=R_{XX}^{-1}R_{XY},R_{XX}為4×4子陣,R_{XY}=(0.58,0.71,0.46,-0.37)?。求得β?=(0.204,0.512,0.093,-0.218)?。SSR=β??R_{XY}·n=0.204×0.58+…=0.618×1000=618,SSE=(1-R2)n=(1-0.618)×1000=382。(2)逐步回歸:Step0:僅截距,RSS=1000。Step1:引入X?,F(xiàn)=(0.712×1000)/1=504,p<0.001,入選。Step2:引入X?,偏F=(-0.372×1000)/(1-0.712)=228,p<0.001,入選。Step3:引入X?,偏F=0.2042×1000/(1-0.618)=108,p<0.001,入選。Step4:引入X?,偏F=0.0932×1000/(1-0.681)=12.1,p=0.0005,入選。Step5:嘗試剔除,最小X?的F=12.1>0.10,無剔除。最終變量:X?,X?,X?,X?,方程同(1)。(3)預(yù)測值?=β??x=0.204×1.5+0.512×0.8+0.093×(-0.6)-0.218×0.2=0.734。標(biāo)準(zhǔn)誤差σ?=√(SSE/(n-p-1))=√(382/995)=0.620。置信區(qū)間:?±t_{0.975}(995)·σ?·√(x?(X?X)^{-1}x)=0.734±1.96×0.620×0.089=[0.626,0.842]。預(yù)測區(qū)間:0.734±1.96×0.620×√(1+0.089)=[-0.548,2.016]。(4)漏斗形表明Var(ε)隨X?增大而增大,采用加權(quán)最小二乘,權(quán)w=1/X?2。重新估計得β?_WLS=(0.198,0.508,0.089,-0.201)?,R2提升至0.651,殘差圖明顯改善。3.(15分)某醫(yī)療團隊研究基因表達與癌癥分期,收集p=8個免疫相關(guān)基因在n=120例組織中的表達值。已做log2轉(zhuǎn)化并中心化,樣本協(xié)差陣S的特征值:λ?=3.42,λ?=1.85,λ?=0.97,λ?=0.63,λ?=0.41,λ?=0.28,λ?=0.24,λ?=0.20.(1)計算前兩個主成分對總方差的累計貢獻率。(2)給出檢驗“保留兩個主成分足夠”的Bartlett球形檢驗統(tǒng)計量及其近似p值。(3)若第一主成分得分PC1與癌癥分期Spearman相關(guān)系數(shù)ρ=0.68,檢驗其顯著性(α=0.01)。(4)第二主成分載荷向量γ?=(0.15,-0.22,0.38,0.41,-0.29,0.31,0.50,-0.46)?,解釋其生物學(xué)意義。答案與解析(1)累計貢獻=(λ?+λ?)/∑λ_i=(3.42+1.85)/7.00=0.752,即75.2%。(2)Bartlett統(tǒng)計量:χ2=-(n-1-(2p+5)/6)∑_{i=3}^8lnλ_i+(n-1)(p-k)ln(∑_{i=k+1}^pλ_i/(p-k)),k=2,代入得χ2=163.4,df=(p-k)(p-k+1)/2=15,χ2_{0.999}(15)=37.7,163.4>37.7,p≈0,拒絕,說明兩個主成分不夠,但臨床常視>70%即夠用,此處報告75.2%可接受。(3)H?:ρ=0,t=ρ√(n-2)/√(1-ρ2)=0.68√118/√(1-0.682)=10.47,t_{0.995}(118)=2.62,拒絕,極顯著。(4)γ?高載荷在基因3、4、7為正,基因8為負,對應(yīng)炎癥激活與細胞凋亡通路,可解釋為“炎癥-凋亡平衡軸”。4.(20分)為比較三種推薦算法(A/B/C)在2026年“雙11”期間的轉(zhuǎn)化效果,從9個品類中各隨機抽取若干店鋪,記錄轉(zhuǎn)化率(%),數(shù)據(jù)已滿足多元正態(tài),得到組間叉積陣H與組內(nèi)叉積陣E(df?=2,df?=24):H=|58.342.131.6||42.139.728.4||31.628.426.5|,E=|112.586.371.2||86.395.466.8||71.266.888.1|.(1)計算Wilks’Λ、Pillai跡、Hotelling-Lawley跡、Roy最大根。(2)基于Λ給出精確F統(tǒng)計量及p值,并判斷算法差異(α=0.05)。(3)若后續(xù)做單變量ANOVA,發(fā)現(xiàn)僅有品類3顯著,解釋為何與多元結(jié)果不一致。(4)給出三種算法在品類3上的95%同時置信區(qū)間(Tukey)。答案與解析(1)|H-λE|=0解得特征值λ?=0.842,λ?=0.315,λ?=0.073。Λ=∏1/(1+λ_i)=0.412,Pillai=∑λ_i/(1+λ_i)=1.385,Hotelling=∑λ_i=1.230,Roy=λ?=0.842。(2)RaoF=((1-Λ^{1/s})/Λ^{1/s})·(df?/df?),s=√(p2df?2-4)/(p2+df?2-5)=1,F(xiàn)=((1-0.412^{1/1})/0.412)·(24/2)=17.2,df?=2,df?=24,F(xiàn)_{0.95}(2,24)=3.40,17.2>3.40,p=0.00003,拒絕,算法差異顯著。(3)多元檢驗綜合9品類,單變量僅品類3顯著,說明差異主要集中該品類,其余品類噪聲大,導(dǎo)致多元整體仍顯著但單變量多數(shù)不顯著。(4)品類3均值:A=15.2,B=18.7,C=21.4,合并MS_E=88.1/24=3.67,n=9。Tukey臨界q_{0.05}(3,24)=3.53,SE=√(3.67/9)=0.639,同時區(qū)間:A-B:(15.2-18.7)±3.53×0.639×√2=[-6.7,-0.3],A-C:[-9.4,-3.0],B-C:[-5.9,0.5],僅B與C不顯著,A顯著低于B、C。5.(20分)為構(gòu)建用戶信用評分,收集n=2000樣本,p=18個變量含年齡、收入、歷史逾期、社交活躍度等。采用偏最小二乘PLS回歸,提取m=6個成分,得到交叉驗證RMSECV曲線在m=4處達最小0.187,m>4后持平。已知因變量Y為標(biāo)準(zhǔn)化違約概率。(1)給出m=4時,第一成分權(quán)重向量w?與第一成分得分t?的表達式。(2)計算變量重要性投影VIP_j,列出VIP>1的變量。(3)若將數(shù)據(jù)隨機拆為訓(xùn)練集1500與測試集500,重復(fù)100次,得測試集RMSEP分布:均值0.195,標(biāo)準(zhǔn)差0.012,求95%置信上限。(4)比較PLS與Lasso(通過10折CV調(diào)參)在測試集上的平均RMSE,若PLS=0.195,Lasso=0.203,給出統(tǒng)計檢驗結(jié)論(α=0.05)。答案與解析(1)w?為X?Y/‖X?Y‖,設(shè)X已標(biāo)準(zhǔn)化,得w?=(0.42,0.31,-0.38,0.15,…)?,t?=Xw?。(2)VIP_j=√(∑_{m=1}^4(w_{jm}^2·SSY_m))/∑SSY_m,其中SSY_m為第m成分解釋Y方差。計算得VIP
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 藥物管理與給藥途徑
- 口腔模擬試題含參考答案
- 手術(shù)室試題及答案大全
- 新安全生產(chǎn)法考試試題含答案
- 醫(yī)療國企考試題庫及答案
- 醫(yī)德醫(yī)風(fēng)培訓(xùn)試題與答案
- 食品企業(yè)三標(biāo)培訓(xùn)試題附答案
- 東安縣招聘協(xié)管員考試真題及答案
- N2級護理人員考核測試題及答案
- 2025年鐵路一級建造師考試試題及答案
- 房屋租賃用于經(jīng)營合同(2025版)
- DB5101∕T 161-2023 公園城市鄉(xiāng)村綠化景觀營建指南
- 2024-2025學(xué)年湖北省武漢市江漢區(qū)七年級(下)期末數(shù)學(xué)試卷
- 重慶市2025年高考真題化學(xué)試卷(含答案)
- 工地材料管理辦法措施
- 感術(shù)行動培訓(xùn)課件
- 建筑工程生產(chǎn)管理培訓(xùn)
- 膿毒癥集束化治療更新
- 臥床老人口腔護理規(guī)范
- 村黨支部換屆工作報告
- JG/T 154-2003電動伸縮圍墻大門
評論
0/150
提交評論