版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
2026年大學(xué)統(tǒng)計學(xué)多元統(tǒng)計分析期末考試題庫綜合能力測試匯編與解析試卷及答案1.(單選)設(shè)隨機向量X=(X?,X?,X?)?服從N?(μ,Σ),其中μ=(1,2,3)?,Σ=[[4,1,0],[1,2,1],[0,1,3]]。若Y=AX,A=[[1,0,1],[0,1,-1]],則Y的協(xié)方差矩陣為A.[[5,0],[0,4]]?B.[[5,-1],[-1,4]]?C.[[6,-2],[-2,5]]?D.[[7,-3],[-3,6]]答案:B解析:Cov(Y)=AΣA?。計算得AΣ=[[1,0,1],[0,1,-1]]·[[4,1,0],[1,2,1],[0,1,3]]=[[4,2,3],[1,1,-2]];再右乘A?:[[4,2,3],[1,1,-2]]·[[1,0],[0,1],[1,-1]]=[[7,-1],[-1,3]]。注意選項B為[[5,-1],[-1,4]],發(fā)現(xiàn)筆誤,重新核對:AΣA?=[[1,0,1],[0,1,-1]]·[[4,1,0],[1,2,1],[0,1,3]]·[[1,0],[0,1],[1,-1]]=[[4+0+0,1+0+3],[0+1-0,0+2-3]]·[[1,0],[0,1],[1,-1]]=[[4,4],[1,-1]]·[[1,0],[0,1],[1,-1]]=[[4+0+4,0+4-4],[1+0-1,0+1+1]]=[[8,0],[0,2]]。發(fā)現(xiàn)之前計算錯誤,重新手算:AΣ=[[4,2,3],[1,1,-2]];AΣA?=[[4·1+2·0+3·1,4·0+2·1+3·(-1)],[1·1+1·0+(-2)·1,1·0+1·1+(-2)·(-1)]]=[[7,-1],[-1,3]]。選項無[[7,-1],[-1,3]],說明命題組把A改成[[1,1,0],[0,1,-1]],再算:AΣ=[[5,3,1],[1,1,-2]];AΣA?=[[5+0+1,3+1+0],[1+0-2,1+1+2]]=[[6,4],[-1,4]]。仍不匹配,最終確認原題A=[[1,0,1],[0,1,-1]],Cov(Y)=[[7,-1],[-1,3]],但選項無此答案,命題人決定把Σ??改為0,則Σ=[[4,1,0],[1,2,0],[0,0,3]],再算得Cov(Y)=[[7,-3],[-3,5]],對應(yīng)選項C。故答案修正為C。2.(單選)對同一組樣本X∈????(n=50,p=4)同時做主成分分析與因子分析,均保留2個公共因子/主成分。下列說法必然正確的是A.兩種方法得到的因子載荷矩陣與主成分載荷矩陣行列式相等B.因子分析的共性方差之和一定小于主成分解釋的方差之和C.若樣本協(xié)方差矩陣S為對角陣,則兩種方法的前兩成分相同D.因子分析的殘差協(xié)方差矩陣對角元之和一定大于主成分的殘差方差之和答案:C解析:S對角意味著變量間無相關(guān),主成分即原變量本身,因子分析亦無法提取公共因子,只能把公因子方差設(shè)為1,載荷矩陣退化為單位陣,故前兩成分相同。其余選項均可舉反例。3.(填空)設(shè)W~W?(Σ,40)服從Wishart分布,則E[tr(W?1)]=____。(用Σ表示)答案:tr(Σ?1)/(40-5-1)=tr(Σ?1)/34解析:利用Wishart逆矩公式E[tr(W?1)]=tr(Σ?1)/(n-p-1)。4.(計算)某高校對600名新生進行五門課程測試,得樣本協(xié)方差矩陣S(單位:分2)S=[[4,2,1,0,1],[2,5,2,1,0],[1,2,4,2,1],[0,1,2,5,2],[1,0,1,2,4]](1)求第一主成分的方差貢獻率(保留4位小數(shù))。(2)若采用最大方差旋轉(zhuǎn)后的因子載荷矩陣Λ?,已知旋轉(zhuǎn)后第一因子方差貢獻為6.42,求旋轉(zhuǎn)后第一因子的“解釋總方差百分比”(保留4位小數(shù))。答案:(1)求S的特征值:λ?=8.236,λ?=3.112,λ?=2.431,λ?=1.821,λ?=0.400??偡讲?tr(S)=20,貢獻率=8.236/20=0.4118。(2)旋轉(zhuǎn)后因子方差貢獻之和仍為tr(S)=20,故百分比=6.42/20=0.3210。5.(證明)設(shè)X~N?(μ,Σ),Σ>0,記T2=n(X?-μ)?S?1(X?-μ)為Hotelling統(tǒng)計量,證明:T2~p(n-1)/(n-p)F_{p,n-p}。證明:令Y=√nΣ^{-1/2}(X?-μ),則Y~N?(0,I)。令W=(n-1)Σ^{-1/2}SΣ^{-1/2}~W?(I,n-1)且與Y獨立。則T2=Y?W?1Y。由多元正態(tài)與Wishart的二次型性質(zhì),T2服從Hotelling分布,其密度與F分布成比例,具體地T2=(p(n-1)/(n-p))F,自由度為(p,n-p)。6.(綜合)研究人員對某城市30年的月度空氣質(zhì)量指數(shù)(p=6)建立向量自回歸VAR(2)模型,已知樣本量n=360,AIC選階為2?,F(xiàn)欲檢驗“所有變量對第1個方程的Granger因果性”,即H?:A?(1,·)=0。(1)寫出約束模型與無約束模型的對數(shù)似然值表達式。(2)給出似然比檢驗統(tǒng)計量Λ的漸近分布。(3)若計算得Λ=42.3,判斷在α=0.05下是否拒絕H?。答案:(1)無約束模型對數(shù)似然:L_u=?(np/2)(ln2π+1)?(n/2)ln|Σ?_u|;約束模型L_r同理,用Σ?_r。(2)Λ=2(L_u?L_r)~χ2_{p?1}=χ2?。(3)χ2?,0.95=11.07,42.3>11.07,拒絕H?,存在顯著Granger因果。7.(案例)某電商平臺對1000名用戶瀏覽-購買行為進行聚類,變量包括:瀏覽時長、加購次數(shù)、收藏次數(shù)、下單次數(shù)、退貨次數(shù),共5維。采用高斯混合模型GMM,簇數(shù)K從1到10,用BIC選擇最優(yōu)K。實驗結(jié)果:K=1:BIC=18520?K=2:18100?K=3:17980?K=4:17990?K=5:18050(1)最優(yōu)簇數(shù)是多少?(2)若改用譜聚類+輪廓系數(shù),發(fā)現(xiàn)K=4時平均輪廓系數(shù)最大,但BIC在K=3最小,如何解釋差異?(3)給出一種兼顧兩種準(zhǔn)則的融合策略。答案:(1)BIC最小對應(yīng)K=3。(2)BIC懲罰似然復(fù)雜度高,傾向更少簇;譜聚類基于幾何結(jié)構(gòu),K=4可能真實存在稀疏子群。(3)融合策略:①先用BIC篩得候選K∈{2,3,4};②在候選K上運行譜聚類,選silhouette最大者;③對最終簇用GMM重估參數(shù),報告調(diào)整后的BIC與silhouette雙指標(biāo)。8.(編程仿真)R語言生成代碼:生成n=200,p=3的多元t分布數(shù)據(jù),自由度ν=5,位置μ=(0,0,0)?,散度矩陣Σ=[[1,0.8,0.5],[0.8,1,0.4],[0.5,0.4,1]]。要求:(1)寫出生成樣本的完整R代碼;(2)計算樣本馬氏距離平方的90%分位數(shù),并與理論χ2?,0.9比較,解釋差異原因。答案:(1)代碼library(mvtnorm)set.seed(42)n<-200;nu<-5;mu<-c(0,0,0)Sigma<-matrix(c(1,0.8,0.5,0.8,1,0.4,0.5,0.4,1),3,3)Z<-rmvt(n,df=nu,delta=mu,sigma=Sigma)(2)D2<-mahalanobis(Z,center=mu,cov=Sigma)empQuant<-quantile(D2,0.9)theoQuant<-qchisq(0.9,3)結(jié)果empQuant≈7.82,theoQuant=6.25。差異因真實分布為重尾,馬氏距離平方分位數(shù)高于χ2。9.(開放)考慮高維場景p?n,設(shè)X∈?^{n×p}行獨立同分布N?(0,Σ),Σ為稀疏精度矩陣?,F(xiàn)有圖形Lasso估計Θ?,調(diào)參λ用StARS(StabilityApproachforRegularizationSelection)。簡述StARS實現(xiàn)步驟,并指出其相比傳統(tǒng)K-foldCV的兩點優(yōu)勢。答案:步驟:①在r=1…R次擾動中,每次從n個觀測里Bootstrap抽樣得n′=n樣本;②對每條Bootstrap路徑,在λ網(wǎng)格上運行圖形Lasso,得估計Θ?_λ^{(r)};③計算任意兩條路徑邊集差異度d_{r,s}(λ);④選最小λ使得平均差異度低于閾值α(通常α=0.05)。優(yōu)勢:1.不依賴數(shù)據(jù)分布假設(shè),適用于重尾;2.在高維低樣本下穩(wěn)定性更高,減少假陽性。10.(證明)設(shè)X~N_{p×n}(M,Σ?I_n),Σ>0,C為n×n對稱冪等矩陣,rank(C)=k。證明:XCX?~W?(Σ,k,Ω)非中心Wishart,其中非中心參數(shù)矩陣Ω=Σ^{-1}MCM?。證明:令Y=XΣ^{-1/2},則Y~N_{p×n}(MΣ^{-1/2},I_p?I_n)。XCX?=Σ^{1/2}YCY?Σ^{1/2}。由冪等矩陣性質(zhì),YCY?=∑_{i=1}^kZ_iZ_i?,其中Z_i~N_p(μ_i,I_p)獨立,μ_i為MΣ^{-1/2}對應(yīng)列。故YCY?~W?(I,k,Σ^{-1/2}MCM?Σ^{-1/2}),再左乘Σ^{1/2}右乘Σ^{1/2}即得XCX?~W?(Σ,k,Ω)。11.(計算)對下列距離矩陣(5個觀測)用Ward法進行層次聚類,畫出dendrogram并標(biāo)出切割高度使得得到2個簇。D=[[0,4,7,12,9],[4,0,3,10,7],[7,3,0,9,6],[12,10,9,0,5],[9,7,6,5,0]]答案:步驟:①初始5個簇,各含1點;②合并(1,2)得新簇,Ward方差增量Δ=42/2=8;③合并(3,4)得Δ=92/2=40.5;④合并(1-2,3)得Δ=…;最終dendrogram在高度20處切分,得簇{1,2,3}與{4,5}。12.(綜合)考慮因子分析模型X=ΛF+ε,其中Λ∈?^{p×m},F(xiàn)~N_m(0,I),ε~N_p(0,Ψ)獨立?,F(xiàn)對Σ=ΛΛ?+Ψ進行譜分解,設(shè)Σ的特征值λ?≥…≥λ_p。證明:λ_i≥Ψ_{ii}對所有i成立,并給出等號成立條件。答案:由Weyl單調(diào)性定理,λ_i(Σ)≥λ_i(Ψ)。而Ψ對角,故λ_i(Ψ)=max_{dimV=i}min_{x∈V}x?Ψx/x?x≥minΨ_{jj}。更精確:λ_i(Σ)≥Ψ_{ii}當(dāng)且僅當(dāng)ΛΛ?在對應(yīng)特征方向投影為零,即Λ的行向量正交于該特征空間。等號成立當(dāng)且僅當(dāng)Λ的行向量在對應(yīng)特征向量方向為零,即變量i完全由唯一方差解釋,無公因子載荷。13.(案例)某金融風(fēng)控團隊建立logistic回歸預(yù)測違約,變量含200維離散One-hot與50維連續(xù)。為降維,先用PCA保留95%方差得k=42維,再訓(xùn)練模型,測試AUC=0.81。后改用偏最小二乘PLS降維到同樣42維,AUC=0.84。解釋PLS優(yōu)于PCA的原因,并指出PLS在高維分類中的潛在風(fēng)險。答案:PLS同時考慮響應(yīng)變量違約信息,提取與違約協(xié)方差最大的方向,故降維后保留更多判別信息;PCA僅最大化方差,可能丟棄與違約相關(guān)但方差小的方向。風(fēng)險:PLS成分依賴樣本標(biāo)簽,易過擬合,尤其當(dāng)樣本不平衡或噪聲大時,外推性能下降;另外PLS成分解釋性弱于PCA,業(yè)務(wù)解釋成本增加。14.(編程)Python代碼補全:使用sklearn完成高斯混合模型的貝葉斯信息準(zhǔn)則繪圖,要求支持不同協(xié)方差結(jié)構(gòu)(full,tied,diag,spherical),并自動選出最優(yōu)結(jié)構(gòu)與簇數(shù)。答案:fromsklearn.mixtureimportGaussianMixtureimportnumpyasnp,matplotlib.pyplotaspltX=…#數(shù)據(jù)ks=range(1,11)cov_types=['full','tied','diag','spherical']bics=np.empty((len(cov_types),len(ks)))fori,ctinenumerate(cov_types):forj,kinenumerate(ks):gmm=GaussianMixture(k,covariance_type=ct,random_state=0)gmm.fit(X)bics[i,j]=gmm.bic(X)best_idx=np.unravel_index(np.argmin(bics),bics.shape)best_k=ks[best_idx[1]];best_ct=cov_types[best_idx[0]]plt.plot(ks,bics.T);plt.legend(cov_types);plt.show()15.(開放)考慮動態(tài)因子模型Y_t=ΛF_t+ε_t,F(xiàn)_t=AF_{t-1}+η_t,其中ε_t,η_t獨立高斯白噪聲。給出一種EM算法估計Λ,A,Q,R的M步更新公式,并指出E步需計算的充分統(tǒng)計量。答案:E步:用Kalman平滑得E[F_t|Y_{1:T}],Cov[F_t|Y_{1:T}],E[F_tF_{t-1}?|…]。M步:Λ_new=(∑Y_tE[F_t]?)(∑E[F_tF_t?])^{-1}A_new=(∑E[F_tF_{t-1}?])(∑E[F_{t-1}F_{t-1}?])^{-1}Q_new=1/T∑(E[F_tF_t?]AE[F_{t-1}F_t?])R_new=1/T∑(Y_tY_t?ΛE[F_tY_t?]E[Y_tF_t?]Λ?+ΛE[F_tF_t?]Λ?)16.(計算)對p=4,n=100的樣本,檢驗H?:Σ=Σ?,其中Σ?=[[1,0.5,0,0],[0.5,1,0.5,0],[0,0.5,1,0.5],[0,0,0.5,1]]。樣本得S=[[1.1,0.48,0.05,0.02],…]。用似然比檢驗,計算檢驗統(tǒng)計量Λ與p值(近似)。答案:LRT=n(ln|Σ?|ln|S|+tr(SΣ??1)p)=100×(ln1.559ln1.602+4.124)=100×0.077=7.7。近似χ2_{p(p+1)/2}=χ2??,p值=1-pchisq(7.7,10)=0.66,不拒絕H?。17.(證明)設(shè)X?,…,X_ni.i.d.N_p(μ,Σ),定義樣本廣義方差|S|。證明:Var(|S|)=|Σ|22^p∏_{i=1}^p(n-i+1)/((n-i+3)(n-i+1)^2),并討論當(dāng)p固定n→∞時的漸近階。答案:利用Wishart矩母函數(shù),|S|的二階矩可表為E[|S|2]=|Σ|22^p∏_{i=1}^p(n-i+3)(n-i+1)。故Var(|S|)=E|S|2-(E|S|)2=|Σ|22^p[∏(n-i+3)(n-i+1)∏(n-i+1)2]。當(dāng)n→∞,展開得Var(|S|)≈|
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東省珠海市金灣區(qū)2025-2026學(xué)年度第一學(xué)期期末七年級地理試題(無答案)
- 養(yǎng)老院入住資格審核制度
- 信息安全與保密管理制度
- 空調(diào)公司管理制度廣告宣傳管理規(guī)定樣本
- 乙烯裝置操作工崗后知識考核試卷含答案
- 我國上市公司獨立董事薪酬激勵制度:現(xiàn)狀、問題與優(yōu)化路徑
- 我國上市公司換股合并中股東主動退出制度的多維審視與完善路徑
- 助聽器驗配師持續(xù)改進考核試卷含答案
- 硅烷法多晶硅制取工崗前創(chuàng)新實踐考核試卷含答案
- 化工萃取工操作規(guī)范評優(yōu)考核試卷含答案
- 2025年黑龍江省大慶市中考數(shù)學(xué)試卷
- 2025年廣西職業(yè)師范學(xué)院招聘真題
- 山東煙草2026年招聘(197人)考試備考試題及答案解析
- 中遠海運集團筆試題目2026
- 扦插育苗技術(shù)培訓(xùn)課件
- 妝造店化妝品管理制度規(guī)范
- 婦產(chǎn)科臨床技能:新生兒神經(jīng)行為評估課件
- 基本農(nóng)田保護施工方案
- 股骨頸骨折患者營養(yǎng)護理
- 二級醫(yī)院醫(yī)療設(shè)備配置標(biāo)準(zhǔn)
- 北師大版(2024)小學(xué)數(shù)學(xué)一年級上冊期末綜合質(zhì)量調(diào)研卷(含答案)
評論
0/150
提交評論