多元統(tǒng)計(jì)學(xué)多元統(tǒng)計(jì)分析試題A卷及答案_第1頁(yè)
多元統(tǒng)計(jì)學(xué)多元統(tǒng)計(jì)分析試題A卷及答案_第2頁(yè)
多元統(tǒng)計(jì)學(xué)多元統(tǒng)計(jì)分析試題A卷及答案_第3頁(yè)
多元統(tǒng)計(jì)學(xué)多元統(tǒng)計(jì)分析試題A卷及答案_第4頁(yè)
多元統(tǒng)計(jì)學(xué)多元統(tǒng)計(jì)分析試題A卷及答案_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

多元統(tǒng)計(jì)學(xué)多元統(tǒng)計(jì)分析試題A卷及答案一、單項(xiàng)選擇題(每題2分,共20分)1.在多元正態(tài)分布中,若隨機(jī)向量X~N?(μ,Σ),則下列哪一項(xiàng)最能刻畫其密度函數(shù)的核心結(jié)構(gòu)?A.(x?μ)?Σ?1(x?μ)B.|Σ|C.tr(Σ)D.Σ?1μ答案:A解析:多元正態(tài)密度指數(shù)部分為馬氏距離二次型(x?μ)?Σ?1(x?μ),它決定了等密度橢球面的形狀與方向。2.主成分分析中,第k主成分得分y?=a??x,若要求Var(y?)最大,則a?應(yīng)滿足:A.a?為Σ第k大特征值對(duì)應(yīng)特征向量B.a?為單位向量且與前面所有a?正交C.A與B同時(shí)成立D.只需a?為單位向量答案:C解析:主成分載荷向量需依次最大化方差且彼此正交,故必須同時(shí)滿足“單位長(zhǎng)度+正交+特征向量”三條件。3.設(shè)樣本協(xié)方差陣S的特征值為λ?≥λ?≥…≥λ?≥0,則累計(jì)貢獻(xiàn)率到第k個(gè)主成分定義為:A.Σ????λ?/Σ????λ?B.λ?/λ?C.Σ????λ?2D.λ?/tr(S)答案:A解析:累計(jì)貢獻(xiàn)率衡量前k個(gè)主成分解釋總方差的比例,用特征值之和比計(jì)算。4.在系統(tǒng)聚類中,類間距離采用“離差平方和增量”的是:A.最短距離法B.最長(zhǎng)距離法C.Ward法D.重心法答案:C解析:Ward準(zhǔn)則最小化合并后類內(nèi)平方和增量,等價(jià)于類間離差平方和。5.若對(duì)同一數(shù)據(jù)分別用k=3和k=5做k-means聚類,則一般而言:A.k=3的SSE更大B.k=3的SSE更小C.SSE與k無(wú)關(guān)D.無(wú)法比較答案:A解析:SSE隨聚類數(shù)k增加單調(diào)不增,k=3時(shí)SSE≥k=5時(shí)SSE。6.典型相關(guān)分析中,第一對(duì)典型變量(u?,v?)的相關(guān)系數(shù)ρ?滿足:A.ρ?=λ?,其中λ?為交叉協(xié)方差陣的最大奇異值B.ρ?=λ?2C.ρ?=tr(Σ??)D.ρ?=|Σ??Σ??|答案:A解析:典型相關(guān)系數(shù)即交叉協(xié)方差陣奇異值,第一對(duì)對(duì)應(yīng)最大奇異值。7.設(shè)X(n×p)為中心化數(shù)據(jù)矩陣,則樣本協(xié)方差陣S可表示為:A.X?X/(n?1)B.XX?/(n?1)C.X?X/nD.XX?/n答案:A解析:樣本協(xié)方差定義要求除以n?1,且X行向量為觀測(cè),故S=X?X/(n?1)。8.若判別分析中兩個(gè)總體協(xié)方差陣相等,則Bayes規(guī)則退化為:A.線性判別B.二次判別C.核密度判別D.最近鄰判別答案:A解析:等協(xié)方差陣時(shí)二次項(xiàng)抵消,判別函數(shù)呈線性。9.在多元方差分析MANOVA中,檢驗(yàn)統(tǒng)計(jì)量Λ=|E|/|E+H|稱為:A.WilksΛB.Pillai跡C.HotellingT2D.Roy最大根答案:A解析:WilksΛ為行列式比,用于檢驗(yàn)均值向量差異。10.若p=5,樣本量n=20,則樣本協(xié)方差陣S的自由度為:A.20B.19C.15D.95答案:B解析:樣本協(xié)方差自由度為n?1=19。二、填空題(每空3分,共30分)11.設(shè)x?,…,x?i.i.d.來(lái)自N?(μ,Σ),則μ的極大似然估計(jì)為________,Σ的極大似然估計(jì)為________。答案:x?=1/nΣx?;S?=1/nΣ(x??x?)(x??x?)?解析:MLE在多元正態(tài)下樣本均值與樣本協(xié)方差(除以n)為閉式解。12.主成分分析中,若前兩個(gè)主成分累計(jì)貢獻(xiàn)率達(dá)到85%,則可將原始p維數(shù)據(jù)降至________維,信息損失約________%。答案:2;15解析:貢獻(xiàn)率即保留方差比例,剩余15%視為信息損失。13.若兩個(gè)隨機(jī)向量X?,X?獨(dú)立,則Cov(X?,X?)=________。答案:零矩陣O解析:獨(dú)立必不相關(guān),故交叉協(xié)方差為零矩陣。14.在k-means算法中,目標(biāo)函數(shù)SSE=Σ????Σ????z??||x??m?||2,其中z??∈{0,1}為________變量,m?為第j類的________。答案:隸屬;均值向量(質(zhì)心)解析:z??指示樣本i是否屬于類j,m?為類j的均值。15.典型相關(guān)分析要求兩組變量分別做________變換,使得變換后變量方差為________。答案:線性;1解析:典型變量需標(biāo)準(zhǔn)化,故要求變換后單位方差。16.若Σ=diag(4,2,1),則馬氏距離(x?μ)?Σ?1(x?μ)=________當(dāng)x?μ=(1,1,1)?。答案:1/4+1/2+1=1.75解析:對(duì)角陣逆元為倒數(shù),直接代入即可。17.在Fisher線性判別中,最佳投影方向w∝________,其中B為類間散度陣,W為類內(nèi)散度陣。答案:W?1(μ??μ?)解析:Fisher準(zhǔn)則最大化(w?Bw)/(w?Ww),求導(dǎo)得解。18.若樣本協(xié)方差陣S的特征值為10,5,2,0.5,則條件數(shù)κ=________。答案:20解析:條件數(shù)=最大特征值/最小非零特征值=10/0.5=20。19.當(dāng)p>n時(shí),樣本協(xié)方差陣S必為________定矩陣,其逆________存在。答案:半正;不解析:秩≤n<p,故奇異,逆不存在。20.在多元回歸模型Y=XB+E中,若E~N?×?(0,I??Σ),則B的OLS估計(jì)B?=________,其vec(B?)的分布為________。答案:(X?X)?1X?Y;N(vec(B),(X?X)?1?Σ)解析:向量化后利用Kronecker積性質(zhì)。三、計(jì)算與證明題(共50分)21.(10分)給定二維數(shù)據(jù)矩陣X=[[2,1],[4,3],[6,5],[8,7]],(1)求樣本均值x?與樣本協(xié)方差S;(2)求第一主成分方向及方差貢獻(xiàn)率。解:(1)x?=1/4Σx?=[5,4]?中心化矩陣X_c=[[?3,?3],[?1,?1],[1,1],[3,3]]S=X_c?X_c/(4?1)=1/3[[20,20],[20,20]]=[[6.67,6.67],[6.67,6.67]](2)求S特征值:|S?λI|=0?λ(λ?13.33)=0?λ?=13.33,λ?=0對(duì)應(yīng)λ?特征向量a?∝[1,1]?,單位化得a?=[0.707,0.707]?貢獻(xiàn)率=λ?/(λ?+λ?)=100%答案:x?=[5,4]?;S=[[6.67,6.67],[6.67,6.67]];第一主成分方向[0.707,0.707]?,貢獻(xiàn)率100%。解析:數(shù)據(jù)完全共線,第二主成分方差為零。22.(10分)設(shè)兩個(gè)總體π?,π?分別服從N?(μ?,Σ),N?(μ?,Σ),其中μ?=[0,0]?,μ?=[2,2]?,Σ=[[1,0.5],[0.5,1]],先驗(yàn)概率相等,損失為0-1。(1)寫出Bayes線性判別函數(shù);(2)對(duì)觀測(cè)x=[1,1]?分類并求后驗(yàn)概率。解:(1)線性判別函數(shù)δ?(x)=x?Σ?1μ???μ??Σ?1μ?+logπ?Σ?1=1/(1?0.25)[[1,?0.5],[?0.5,1]]=4/3[[1,?0.5],[?0.5,1]]δ?(x)=0?0+log0.5=?0.693δ?(x)=x?Σ?1μ???μ??Σ?1μ?+log0.5=[1,1]·4/3[[1,?0.5],[?0.5,1]]·[2,2]???[2,2]·4/3[[1,?0.5],[?0.5,1]]·[2,2]??0.693=4/3(2?1+2?1)??·4/3(4?2+4?2)?0.693=8/3?8/3?0.693=?0.693兩函數(shù)值相等,判別邊界通過(guò)x=[1,1]?。(2)因x位于邊界,后驗(yàn)概率P(π?|x)=P(π?|x)=0.5答案:判別函數(shù)值均為?0.693;x=[1,1]?無(wú)法唯一分配,后驗(yàn)概率各0.5。解析:該點(diǎn)恰好落在判別超平面上。23.(10分)對(duì)三維數(shù)據(jù),已知樣本協(xié)方差陣S=[[4,2,0],[2,3,1],[0,1,2]],(1)求特征值與特征向量;(2)求第一主成分載荷及方差;(3)若只保留第一主成分,求重構(gòu)誤差(平方范數(shù))。解:(1)解|S?λI|=0:det[[4?λ,2,0],[2,3?λ,1],[0,1,2?λ]]=0展開得?λ3+9λ2?23λ+14=0?(λ?1)(λ?2)(λ?6)=0特征值λ?=6,λ?=2,λ?=1對(duì)應(yīng)單位特征向量:a?=[0.816,0.577,0.058]?a?=[?0.408,0.577,0.707]?a?=[0.408,?0.577,0.707]?(2)第一主成分載荷即a?,方差=λ?=6(3)重構(gòu)誤差=Σ???3λ?=2+1=3答案:特征值6,2,1;第一載荷[0.816,0.577,0.058]?,方差6;重構(gòu)誤差3。解析:重構(gòu)誤差等于被舍棄成分特征值之和。24.(10分)設(shè)隨機(jī)向量X=[X?,X?]?服從二元正態(tài),均值[0,0]?,協(xié)方差Σ=[[1,ρ],[ρ,1]]。(1)求X?+X?與X??X?的方差及相關(guān)系數(shù);(2)證明當(dāng)ρ=0.5時(shí),兩變量獨(dú)立。解:(1)Var(X?+X?)=Var(X?)+Var(X?)+2Cov=1+1+2ρ=2(1+ρ)Var(X??X?)=1+1?2ρ=2(1?ρ)Cov(X?+X?,X??X?)=Var(X?)?Var(X?)=0故相關(guān)系數(shù)ρ*=0(2)當(dāng)ρ=0.5時(shí),Cov=0,且二元正態(tài)下不相關(guān)等價(jià)于獨(dú)立,故X?+X?與X??X?獨(dú)立。答案:Var(X?+X?)=2(1+ρ),Var(X??X?)=2(1?ρ),相關(guān)系數(shù)0;ρ=0.5時(shí)獨(dú)立。解析:線性組合正態(tài)且協(xié)方差為零即獨(dú)立。25.(10分)對(duì)n=50、p=4的數(shù)據(jù)做Ward聚類,得到某步合并后類內(nèi)平方和增量Δ=12.3,已知兩合并類的樣本量分別為n?=10,n?=15,求兩類重心之間的歐氏距離d。解:Ward準(zhǔn)則Δ=(n?n?)/(n?+n?)·d2?d2=Δ·(n?+n?)/(n?n?)=12.3·25/150=2.05?d=√2.05≈1.432答案:1.432解析:利用Ward增量與重心距離平方的正比關(guān)系反推。四、綜合應(yīng)用題(共50分)26.(15分)某電商對(duì)1000名用戶記錄5項(xiàng)行為指標(biāo):瀏覽時(shí)長(zhǎng)X?、加購(gòu)次數(shù)X?、收藏次數(shù)X?、下單金額X?、復(fù)購(gòu)間隔X?。經(jīng)標(biāo)準(zhǔn)化后得樣本相關(guān)陣R:[[1,0.82,0.78,0.65,0.30],[0.82,1,0.80,0.63,0.28],[0.78,0.80,1,0.61,0.25],[0.65,0.63,0.61,1,0.20],[0.30,0.28,0.25,0.20,1]](1)用主成分法取m=2,求載荷矩陣A;(2)計(jì)算共性方差及特殊方差估計(jì);(3)對(duì)X?的共性方差進(jìn)行顯著性評(píng)述。解:(1)求R特征值:λ?=3.41,λ?=0.98,λ?=0.35,λ?=0.18,λ?=0.08前兩個(gè)特征向量(前兩項(xiàng)):a?=[0.45,0.45,0.44,0.41,0.46]?a?=[?0.20,?0.25,?0.30,0.85,?0.25]?載荷矩陣A=[√λ?a?,√λ?a?]=[[0.83,?0.20],[0.83,?0.25],[0.81,?0.30],[0.76,0.84],[0.85,?0.25]](2)共性方差h?2=Σ???2A??2得h2=[0.832+0.202,…]=[0.73,0.75,0.75,1.28,0.79]特殊方差ψ?=1?h?2注意X?的h?2>1,出現(xiàn)Heywood情形,需迭代調(diào)整。(3)X?共性方差0.73,說(shuō)明約73%的瀏覽時(shí)長(zhǎng)變異可由前兩公因子解釋,其余27%為獨(dú)特波動(dòng),表明指標(biāo)受潛在“活躍度”因子影響顯著,但仍存在未被建模的隨機(jī)因素。答案:載荷矩陣如上;共性方差0.73,0.75,0.75,1.28,0.79;X?解釋度較高。解析:Heywood案例提示需增加因子數(shù)或采用其他估計(jì)法。27.(15分)為研究城市空氣質(zhì)量與氣象關(guān)系,收集n=60天的數(shù)據(jù):Y=[PM2.5,O?]?為污染向量,X=[溫度,濕度,風(fēng)速]?為氣象向量。經(jīng)計(jì)算:Σ?_Y=[[120,45],[45,80]],Σ?_X=[[25,10,?5],[10,20,0],[?5,0,15]],Σ?_YX=[[30,20,?10],[25,15,?8]](1)求第一對(duì)典型變量(u?,v?)及典型相關(guān)系數(shù);(2)解釋u?,v?的實(shí)際含義;(3)若某日X=[25,70,2]?,預(yù)測(cè)對(duì)應(yīng)u?得分。解:(1)構(gòu)造M?=Σ?_Y?1Σ?_YXΣ?_X?1Σ?_YX?計(jì)算得最大特征值ρ?2=0.68?ρ?=0.825對(duì)應(yīng)左特征向量α?∝[0.72,0.69]?,標(biāo)準(zhǔn)化后α?=[0.72,0.69]?右特征向量β?∝Σ?_X?1Σ?_YX?α?,歸一化得β?=[0.35,0.28,?0.18]?故u?=α??Y=0.72PM2.5+0.69O?v?=β??X=0.35溫度+0.28濕度?0.18風(fēng)速(2)u?高值表示污染綜合水平高,v?高值反映高溫高濕低風(fēng)的氣象條件,兩者正相關(guān)0.825,說(shuō)明靜穩(wěn)悶熱天氣易致污染。(3)標(biāo)準(zhǔn)化X:先減均值再除標(biāo)準(zhǔn)差。設(shè)已中心標(biāo)準(zhǔn)化,則u?預(yù)測(cè)=v?·ρ?=[0.35,0.28,?0.18]·[25,70,2]?=0.35·25+0.28·70?0.18·2=8.75+19.6?0.36=27.99答案:典型相關(guān)系數(shù)0.825;u?=0.72PM2.5+0.69O?,v?=0.35溫度+0.28濕度?0.18風(fēng)速;預(yù)測(cè)u?≈28.0。解析:典型相關(guān)揭示兩組變量間最大相關(guān)結(jié)構(gòu)。28.(20分)某金融機(jī)構(gòu)構(gòu)建信用評(píng)分模型,對(duì)m=2總體:違約(π?,n?=200)與正常(π?,n?=800)。估計(jì)得:x??=[30,40]?,x??=[50,60]?S_pooled=[[25,15],[15,20]](1)建立Fisher線性判別函數(shù),并給出判別系數(shù);(2)求判別效率指標(biāo)Δ2=(μ??μ?)?Σ?1(μ??μ?)的估計(jì);(3)若新客戶的指標(biāo)x=[40,50]?,計(jì)算其判別得分及后驗(yàn)概率(先驗(yàn)按樣本比例);(4)評(píng)估該模型的預(yù)期誤判率。解:(1)w∝S_pooled?1(x???x??)S_pooled?1=1/(25·20?152)[[20,?15],[?15,25]]=1/175[[20,?15],[?15,25]]x???x??=[?20,?20]?w=1/175[[20,?15],[?15,25]]·[?20,?20]=1/175[?

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論