多元統(tǒng)計(jì)分析期末復(fù)習(xí)試題及答案_第1頁
多元統(tǒng)計(jì)分析期末復(fù)習(xí)試題及答案_第2頁
多元統(tǒng)計(jì)分析期末復(fù)習(xí)試題及答案_第3頁
多元統(tǒng)計(jì)分析期末復(fù)習(xí)試題及答案_第4頁
多元統(tǒng)計(jì)分析期末復(fù)習(xí)試題及答案_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多元統(tǒng)計(jì)分析期末復(fù)習(xí)試題及答案1.單選(每題2分,共20分)1.1在p維正態(tài)總體N_p(μ,Σ)中,若Σ已知,樣本容量n=36,檢驗(yàn)H_0:μ=μ_0,應(yīng)采用的統(tǒng)計(jì)量是A.T2=n(X??μ_0)?Σ?1(X??μ_0)B.T2=(n?1)(X??μ_0)?Σ?1(X??μ_0)C.T2=n(X??μ_0)?S?1(X??μ_0)D.T2=(n?p)(X??μ_0)?S?1(X??μ_0)答案:A解析:Σ已知時(shí)用HotellingT2=n(X??μ_0)?Σ?1(X??μ_0)~χ2(p)。B錯(cuò)在系數(shù),C、D把Σ換成S,屬于Σ未知情形。1.2對同一組n=50、p=4的數(shù)據(jù),若欲檢驗(yàn)協(xié)方差陣Σ是否等于給定的Σ_0,應(yīng)選用的檢驗(yàn)統(tǒng)計(jì)量服從A.χ2分布B.F分布C.似然比統(tǒng)計(jì)量?2lnΛ~χ2D.WilksΛ分布答案:C解析:Σ的檢驗(yàn)屬于似然比范疇,?2lnΛ在正則條件下漸近χ2,自由度為p(p+1)/2。1.3主成分分析中,第k主成分的方差貢獻(xiàn)率等于A.λ_k/(∑λ_i)B.λ_k/pC.λ_k/nD.λ_k/(∑λ_i2)答案:A解析:貢獻(xiàn)率定義為該特征值占全部特征值之和的比例。1.4若樣本協(xié)差陣S的特征值為8,3,1,0.2,則前兩個(gè)主成分的累計(jì)貢獻(xiàn)率為A.11/12.2B.8/12.2C.11/8D.8/11答案:A解析:(8+3)/(8+3+1+0.2)=11/12.2≈90.16%。1.5在典型相關(guān)分析中,若X為p維、Y為q維,則第一對典型變量(a??X,b??Y)的相關(guān)系數(shù)ρ?滿足A.ρ?=maxcorr(a?X,b?Y)B.ρ?=mincorr(a?X,b?Y)C.ρ?=maxvar(a?X)D.ρ?=maxcov(a?X,b?Y)答案:A解析:典型相關(guān)即最大化兩組變量的相關(guān)系數(shù)。1.6對n=30、p=5的數(shù)據(jù)做聚類,若采用Ward法,其合并準(zhǔn)則本質(zhì)上是A.組間平方和增量最小B.組內(nèi)平方和增量最小C.全linkage最大距離D.重心距離答案:B解析:Ward法最小化合并后組內(nèi)平方和的增量。1.7若判別分析中兩個(gè)總體的協(xié)差陣相等,則Fisher線性判別函數(shù)等價(jià)于A.距離判別B.Bayes判別C.主成分得分D.邏輯回歸答案:A解析:等協(xié)差陣時(shí),F(xiàn)isher、距離、Bayes(等先驗(yàn))三者等價(jià)。1.8對同一數(shù)據(jù),若逐步判別選入變量的準(zhǔn)則為WilksΛ最小化,則每一步實(shí)質(zhì)在做A.單變量t檢驗(yàn)B.多變量方差分析C.似然比檢驗(yàn)D.主成分提取答案:C解析:WilksΛ是多元方差分析的似然比統(tǒng)計(jì)量。1.9若樣本協(xié)差陣S奇異,則A.不能做主成分B.不能做因子分析C.不能求廣義逆D.不能求Mahalanobis距離答案:D解析:Mahalanobis距離需S?1,奇異時(shí)無通常逆;但可用廣義逆做PCA、FA。1.10在多維尺度分析(MDS)中,若選擇歐氏模型,則最終得到的坐標(biāo)矩陣X滿足A.XX?=ΔB.X?X=ΔC.XX?≈??JΔJD.X?X≈??JΔJ答案:C解析:經(jīng)典MDS對雙中心化后的距離矩陣做譜分解,XX?≈??JΔJ。2.多選(每題3分,共15分,多選少選均不得分)2.1下列哪些統(tǒng)計(jì)量可用來檢驗(yàn)多元正態(tài)性A.Mardia偏度B.Mardia峰度C.Royston’sHD.WilksΛE.Q-Q圖答案:ABCE解析:WilksΛ用于均值或協(xié)差檢驗(yàn),不直接檢驗(yàn)正態(tài)性。2.2關(guān)于主成分回歸(PCR),正確的是A.用全部主成分做回歸等價(jià)于最小二乘B.舍棄小特征值主成分可緩解多重共線C.主成分回歸系數(shù)可解釋回原變量D.PCR對樣本外預(yù)測一定優(yōu)于OLSE.PCR需標(biāo)準(zhǔn)化答案:ABCE解析:D錯(cuò),PCR未必總是優(yōu)于OLS,取決于舍棄信息是否含噪聲。2.3以下哪些方法屬于無監(jiān)督學(xué)習(xí)A.K-meansB.層次聚類C.DBSCAND.線性判別E.自組織映射答案:ABCE解析:D為監(jiān)督。2.4若因子分析模型X=ΛF+ε,滿足A.cov(F,ε)=0B.E(F)=0C.cov(ε)=對角D.Λ唯一E.F可觀測答案:ABC解析:Λ不唯一,F(xiàn)不可觀測。2.5關(guān)于Bayes判別,正確的是A.需先驗(yàn)概率B.需類條件密度C.最小化期望錯(cuò)判損失D.等價(jià)于Fisher當(dāng)協(xié)差陣相等且先驗(yàn)相等E.對異常值不敏感答案:ABCD解析:Bayes對異常值仍敏感。3.填空(每空2分,共20分)3.1若X~N_3(μ,Σ),Σ=[[4,2,1],[2,3,0],[1,0,2]],則X?與X?的偏相關(guān)系數(shù)ρ??|?=____。答案:2/√(3×3)=2/3解析:ρ??|?=σ??|?/√(σ??|?σ??|?),其中σ??|?=σ???σ??σ??/σ??=2?1×0/2=2,σ??|?=4?12/2=3.5,σ??|?=3?02/2=3,故ρ=2/√(3.5×3)≈0.617。3.2對n=100、p=6的樣本,檢驗(yàn)H_0:μ=μ_0,Σ未知,HotellingT2=25.3,則對應(yīng)的F統(tǒng)計(jì)量為____,自由度為____。答案:F=(n?p)/p(n?1)T2=(94/6)×25.3≈396.2,df1=6,df2=94解析:T2~p(n?1)/(n?p)F(p,n?p)。3.3若樣本相關(guān)陣R的特征值為3.5,1.2,0.8,0.3,0.2,則Kaiser準(zhǔn)則下應(yīng)保留____個(gè)主成分。答案:3解析:特征值>1。3.4在Q型聚類中,樣本間距離常用____距離;在R型聚類中,變量間距離常用____距離。答案:歐氏;1?|r|3.5若兩總體π?,π?的密度分別為f?,f?,先驗(yàn)π?=0.6,錯(cuò)判損失c(1|2)=5,c(2|1)=1,則Bayes判別規(guī)則為:若f?(x)/f?(x)____,則判x∈π?。答案:>(0.4×5)/(0.6×1)=10/33.6因子分析中,共性方差h_i2表示____。答案:第i個(gè)變量能被公因子解釋的部分方差。3.7若樣本協(xié)差陣S=[[5,2],[2,3]],則第一主成分的方向向量為____。答案:對應(yīng)最大特征值7.162的特征向量(0.923,0.385)?。3.8在多維尺度分析中,Stress-I公式為____。答案:√(∑(d_ij?d?_ij)2/∑d_ij2)3.9對n=200、p=10的數(shù)據(jù),若Bartlett檢驗(yàn)球形假設(shè)的χ2=450,df=45,則p值____0.05(填<或>)。答案:<解析:450遠(yuǎn)大于χ2_{0.95}(45)≈61.66。3.10若X~N_p(μ,Σ),則(X?μ)?Σ?1(X?μ)服從____分布。答案:χ2(p)4.判斷并改錯(cuò)(每題3分,共15分)4.1主成分分析要求變量間相互獨(dú)立。答案:錯(cuò)。改:主成分分析要求變量間存在相關(guān),否則無降維意義。4.2典型相關(guān)分析中,典型變量對之間一定正交。答案:錯(cuò)。改:同一組典型變量之間正交,不同組之間僅相關(guān)系數(shù)最大化,未必正交。4.3若S奇異,則無法做任何因子分析。答案:錯(cuò)。改:可用廣義逆或縮減變量做因子分析。4.4K-means算法對初始中心不敏感。答案:錯(cuò)。改:K-means對初始中心敏感,常用k-means++改進(jìn)。4.5判別分析中,當(dāng)總體非正態(tài)時(shí),F(xiàn)isher線性判別完全失效。答案:錯(cuò)。改:Fisher判別仍可用,但未必最優(yōu)。5.簡答(每題8分,共24分)5.1寫出多元線性回歸模型Y=XB+E的矩陣形式,并給出最小二乘估計(jì)及協(xié)差陣。答案:模型:Y_{n×m}=X_{n×(p+1)}B_{(p+1)×m}+E_{n×m},vec(E)~N(0,Σ?I_n)。最小二乘:B?=(X?X)?1X?Y。協(xié)差陣:cov(vec(B?))=Σ?(X?X)?1。5.2簡述WilksΛ分布與HotellingT2的關(guān)系。答案:當(dāng)m=1時(shí),WilksΛ=1/(1+T2/(n?1)),即T2可轉(zhuǎn)化為Λ,二者均檢驗(yàn)均值向量差異;m>1時(shí),Λ為廣義似然比,T2為其特例。5.3說明在聚類分析中,單鏈接可能產(chǎn)生“鏈?zhǔn)健爆F(xiàn)象的原因及改進(jìn)方法。答案:單鏈接以最近鄰距離為組間距離,易因中間點(diǎn)串聯(lián)遠(yuǎn)離簇,形成長鏈;改進(jìn)可用全鏈接、Ward法或DBSCAN密度方法。6.計(jì)算與綜合(共46分)6.1(10分)隨機(jī)抽取n=50名大學(xué)生,測得數(shù)學(xué)(X?)、物理(X?)、編程(X?)成績,樣本均值X?=(75,70,80)?,樣本協(xié)差陣S=[[100,40,60],[40,64,32],[60,32,144]]。(1)檢驗(yàn)H_0:μ=(80,80,80)?,α=0.05。(2)若拒絕,求μ的95%同時(shí)置信區(qū)間(Bonferroni)。答案:(1)T2=50(X??μ_0)?S?1(X??μ_0)=50×[?5,?10,0]S?1[?5,?10,0]?=50×3.125=156.25。臨界值T2_{0.05}=p(n?1)/(n?p)F_{0.05}(p,n?p)=3×49/47×2.81≈8.78。156.25>8.78,拒絕。(2)Bonferronit_{0.05/6}(49)=2.47,標(biāo)準(zhǔn)誤=√(S_ii/n),得μ?:75±2.47×√(100/50)=75±3.49→[71.51,78.49]μ?:70±2.47×√(64/50)=70±2.79→[67.21,72.79]μ?:80±2.47×√(144/50)=80±4.18→[75.82,84.18]6.2(12分)對同一數(shù)據(jù)做主成分分析,求載荷矩陣及前兩個(gè)主成分對總方差的貢獻(xiàn)率;若用前兩個(gè)主成分得分做后續(xù)回歸,解釋其優(yōu)缺點(diǎn)。答案:特征值:λ?=204.8,λ?=67.2,λ?=36.0。貢獻(xiàn)率:λ?/(λ?+λ?+λ?)=65.1%,前二累計(jì)86.5%。載荷:第一主成分a?=(0.68,0.48,0.55)?,解釋“綜合學(xué)業(yè)”;第二主成分a?=(?0.25,0.86,?0.44)?,解釋“文理差異”。優(yōu)點(diǎn):降維去噪、克服共線;缺點(diǎn):主成分可能難以解釋,且舍棄的13.5%方差或含重要信息。6.3(12分)設(shè)兩個(gè)多元正態(tài)總體π?,π?,μ?=(0,0)?,μ?=(2,2)?,Σ?=Σ?=I?,先驗(yàn)相等,損失c(1|2)=c(2|1)=1。(1)求Bayes判別函數(shù)及決策邊界。(2)若實(shí)測點(diǎn)x=(1,1)?,求后驗(yàn)概率及判類。答案:(1)判別函數(shù):δ_i(x)=x?μ_i??μ_i?μ_i,δ?=0,δ?=2x?+2x??4,決策邊界:δ?=δ??2x?+2x??4=0?x?+x?=2。(2)x=(1,1)在邊界上,后驗(yàn)相等,可隨機(jī)判;通常判樣本量大的類或任一類。6.4(12分)對某城市15個(gè)區(qū)縣測得8項(xiàng)經(jīng)濟(jì)指標(biāo),經(jīng)標(biāo)準(zhǔn)化后做因子分析,得共性方差h_i2均在0.75以上,前三個(gè)因子累計(jì)貢獻(xiàn)率82%,旋轉(zhuǎn)后因子載荷如下(節(jié)選):F1:工業(yè)產(chǎn)值0.91,固定資產(chǎn)投資0.85…F2:零售總額0.88,餐飲收入0.82…F3:專利申請0.79,高校數(shù)量0.75…(1)命名三個(gè)公因子。(2)計(jì)算第一因子得分系數(shù)(回歸法),已知相關(guān)陣R及Λ?。答案:(1)F1:工業(yè)投資因子;F2:消費(fèi)服務(wù)因子;F3:科技創(chuàng)新因子。(2)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論