多元統(tǒng)計(jì)分析及R語言建??荚囋嚲韄第1頁
多元統(tǒng)計(jì)分析及R語言建??荚囋嚲韄第2頁
多元統(tǒng)計(jì)分析及R語言建??荚囋嚲韄第3頁
多元統(tǒng)計(jì)分析及R語言建??荚囋嚲韄第4頁
多元統(tǒng)計(jì)分析及R語言建??荚囋嚲韄第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余6頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

精選文庫多元統(tǒng)計(jì)分析及R語言建??荚囋嚲斫處熖顚懻n程名稱:_多元統(tǒng)計(jì)分析 _授課教師姓名:_王斌會(huì)_ 考試時(shí)間:_ _年_月_日課程類別必修 選修 考試方式開卷 閉卷 試卷類別(A、B) A 共 8 頁考生填寫 學(xué)院(校) 專業(yè) 班(級(jí))姓名 學(xué)號(hào) 題 號(hào)一二三四五六七八九十總 分得 分得分評(píng)閱人一、簡(jiǎn)答題(共5小題,每小題6分,共30分)1. 常用的多元統(tǒng)計(jì)分析方法有哪些?(1)多元正態(tài)分布檢驗(yàn)(2)多元方差-協(xié)方差分析(3)聚類分析(4)判別分析(5)主成分分析(6)因子分析(7)對(duì)應(yīng)分析(8)典型相關(guān)性分析( 9)定性數(shù)據(jù)建模分析(10)路徑分析(又稱多重回歸、聯(lián)立方程) (11)結(jié)構(gòu)方程模型 (12)聯(lián)合分析 (13)多變量圖表示法(14)多維標(biāo)度法2. 簡(jiǎn)單相關(guān)分析、復(fù)相關(guān)分析和典型相關(guān)分析有何不同?并舉例說明之。簡(jiǎn)單相關(guān)分析:簡(jiǎn)單相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對(duì)具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計(jì)方法。例如,以X、Y分別記小學(xué)生的數(shù)學(xué)與語文成績(jī),感興趣的是二者的關(guān)系如何,而不在于由X去預(yù)測(cè)Y。復(fù)相關(guān)分析;研究一個(gè)變量 x0與另一組變量 (x1,x2,,xn)之間的相關(guān)程度。例如,職業(yè)聲望同時(shí)受到一系列因素(收入、文化、權(quán)力)的影響,那么這一系列因素的總和與職業(yè)聲望之間的關(guān)系,就是復(fù)相關(guān)。復(fù)相關(guān)系數(shù)R0.12n的測(cè)定,可先求出 x0對(duì)一組變量x1,x2,xn的回歸直線,再計(jì)算x0與用回歸直線估計(jì)值憫之間的簡(jiǎn)單直線回歸。復(fù)相關(guān)系數(shù)為R0.12n的取值范圍為0R0.12n1。復(fù)相關(guān)系數(shù)值愈大,變量間的關(guān)系愈密切。典型相關(guān)分析就是利用綜合變量對(duì)之間的相關(guān)關(guān)系來反映兩組指標(biāo)之間的整體相關(guān)性的多元統(tǒng)計(jì)分析方法。它的基本原理是:為了從總體上把握兩組指標(biāo)之間的相關(guān)關(guān)系,分別在兩組變量中提取有代表性的兩個(gè)綜合變量U1和V1(分別為兩個(gè)變量組中各變量的線性組合),利用這兩個(gè)綜合變量之間的相關(guān)關(guān)系來反映兩組指標(biāo)之間的整體相關(guān)性。3. 試說明主成分分析和因子分析不同點(diǎn)和相同之處。 主成分分析和因子分析的相同之處1.都可以降維、分析多個(gè)變量的基本結(jié)構(gòu)2.因子分析是主成分分析的進(jìn)一步推廣。主成分分析可被視為一種固定效應(yīng)的因子分析,是因子分析的特列3.都是利用變量之間的相關(guān)性將它們進(jìn)行分類4.主成分分析中,各個(gè)主成分之間互不相關(guān);因子分析中,公因子之間不相關(guān)、特殊因子之間不相關(guān)、公因子與特殊因子之間不相關(guān)主成分分析和因子分析的區(qū)別1、因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個(gè)變量的線性組合。2、主成分分析的重點(diǎn)在于解釋個(gè)變量的總方差,而因子分析則把重點(diǎn)放在解釋各變量之間的協(xié)方差。3、主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè)。因子分析的假設(shè)包括:各個(gè)共同因子之間不相關(guān),特殊因子(specificfactor)之間也不相關(guān),共同因子和特殊因子之間也不相關(guān)。4、主成分分析中,當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時(shí)候,的主成分一般是獨(dú)特的;而因子分析中因子不是獨(dú)特的,可以旋轉(zhuǎn)得到不同的因子。1、因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個(gè)變量的線性組合。4. 判別分析以及Fisher判別和Bayes判別的基本思想是什么?判別分析:根據(jù)判別中的組數(shù),可以分為兩組判別分析和多組判別分析;根據(jù)判別函數(shù)的形式,可以分為線性判別和非線性判別;根據(jù)判別式處理變量的方法不同,可以分為逐步判別、序貫判別等;根據(jù)判別標(biāo)準(zhǔn)不同,可以分為距離判別、Fisher判別、Bayes判別法等Fisher判別法;通過將多維數(shù)據(jù)投影到某一方向上,使得投影之后類與類之間盡可能分開,然后再尋找合適的判別準(zhǔn)則。Bayes判別法:假設(shè)已知對(duì)象的先驗(yàn)概率和“先驗(yàn)條件概率”,而后得到后驗(yàn)概率,由后驗(yàn)概率作出判別。5. 指出綜合評(píng)價(jià)中指標(biāo)的標(biāo)準(zhǔn)化方法及其優(yōu)缺點(diǎn)和有哪些綜合評(píng)價(jià)方法。標(biāo)準(zhǔn)化方法(1)主成分分析法。主成分分析是多元統(tǒng)計(jì)分析的一個(gè)分支。是將其分量相關(guān)的原隨機(jī)向量,借助于一個(gè)正交變換,轉(zhuǎn)化成其分量不相關(guān)的新隨機(jī)向量,并以方差作為信息量的測(cè)度,對(duì)新隨機(jī)向量進(jìn)行降維處理。再通過構(gòu)造適當(dāng)?shù)膬r(jià)值函數(shù),進(jìn)一步做系統(tǒng)轉(zhuǎn)化。(2)數(shù)據(jù)包絡(luò)分析法。它是創(chuàng)建人以其名字命名的DEA模型CR模型。DEA法不僅可對(duì)同一類型各決策單元的相對(duì)有效性做出評(píng)價(jià)與排序,而且還可進(jìn)一步分析各決策單元非DE有效的原因及其改進(jìn)方向,從而為決策者提供重要的管理決策信息。(3)模糊評(píng)價(jià)法。模糊評(píng)價(jià)法奠基于模糊數(shù)學(xué)。它不僅可對(duì)評(píng)價(jià)對(duì)象按綜合分值的大小進(jìn)行評(píng)價(jià)和排序,而且還可根據(jù)模糊評(píng)價(jià)集上的值按最大隸屬度原則去評(píng)定對(duì)象的等級(jí)。綜合評(píng)價(jià)方法1、計(jì)分法2、綜合指數(shù)法3、Topsis法 4、秩和比(RSR)法5、層次分析(AHP)法6、模糊評(píng)價(jià)方法7、多元統(tǒng)計(jì)分析方法8、灰色系統(tǒng)評(píng)價(jià)方法得分評(píng)閱人二、證明題(共1小題,共20分)設(shè) y = a1x1+ a2x2 +apxp a x,其中a = (a1,a2,ap),x = (x1,x2,xp),求主成分就是尋找x的線性函數(shù)a x使相應(yīng)的方差達(dá)到最大,即Var(a x) = a S a 達(dá)到最大,且a a =1,此處S為x的協(xié)方差陣。設(shè)的特征根為。試證明下面性質(zhì):(1)y=Ux,UU=I,這里U為x的協(xié)方差陣的特征向量(單位化的)組成的正交陣。(2)y的各分量之間是互不相關(guān)的。(3)y的p個(gè)分量是按方差大小、由大到小排列的。(4)y的協(xié)方差陣為對(duì)角陣。(5), 這里 S = (sii)pp(6)證明(1)(2)(3):設(shè)的特征向量為U= (u1,u2,up),則UU=I,即U為一正交陣,且S= UU= U diag()U=uiui因此a S a=a uiui a=(a ui) (aui)= (a ui)2于是a S a(a ui)2=(a U) (a U)= a UUa=a a=應(yīng)取時(shí),u1 S u1= u1 u1=故y1= u x就是第一主成分,其方差最大,Var(y1) = Var(u1 x) =同理,Var(yi) = Var(ui x) =另外,Cov(yi, yj)= Cov(ui x, uj x)= ui S uj= ui uj= ui uj=0,ij因此,有上述可得變量x的主成分是以S的特征向量為系數(shù)的線性組合,且主成分y之間互不相關(guān),y的p個(gè)分量是按方差大小、由大到小排列的。性質(zhì)(1)(2)(3)得證。性質(zhì)(4)可有(1)(2)(3)得到。證明性質(zhì)(5):由U=,則有S= UU于是=tr(S)=tr(UU)= tr(UU)= tr()=證明性質(zhì)(6):(6)由前面的證明得知令ej=()為單位向量,則xj= ejx,yi= ui x所以,Cov(yi, xj)= Cov(ui x, ejx)= ejD(x) ui= ejS ui= ej ui= uij故 性質(zhì)(6)得證得分評(píng)閱人三、運(yùn)算題(共3小題,共20分)下面左表為五個(gè)觀察值,兩個(gè)變量的數(shù)據(jù),右表為用歐氏距離計(jì)算的距離矩陣,x1x21572713324655661. (10分)寫出用R語言分析的命令 (1) 請(qǐng)將數(shù)據(jù)x1和x2寫入R向量中:x1=c(5,7,3,6,6);x1x2=c(7,1,2,5,6);x2 (2) 寫出繪制上面散點(diǎn)圖的R命令:x1=c(5,7,3,6,6);x1x2=c(7,1,2,5,6);x2plot(x1,x2) (3) 寫出繪制系統(tǒng)聚類圖的R命令: X=data.frame(x1,x2);XD=dist(X,diag=TRUE,upper=TRUE);Dhc=hclust(D,complete);hcplot(hc)2(5分) (1) 寫出計(jì)算下面絕對(duì)距離陣的R命令:x1=c(5,7,3,6,6)x2=c(7,1,2,5,6)X=data.frame(x1,x2);XD=dist(X,diag=TRUE,upper=TRUE,p=1);D1 2 3 4 51 0 8 7 3 22 8 0 5 5 63 7 5 0 6 74 3 5 6 0 15 2 6 7 1 0(2)試在圖中標(biāo)出這些距離3.(5分)試用最長(zhǎng)距離法對(duì)其進(jìn)行聚類分析,畫出聚類圖,并按二類、三類進(jìn)行分類第一步:計(jì)算距離陣X=data.frame(x1,x2);XD=dist(X,diag=TRUE,upper=TRUE);D第二步:進(jìn)行系統(tǒng)聚類(最長(zhǎng)距離法)hc=hclust(D,complete);hc第三步:畫出聚類圖(1)按二類進(jìn)行分類plot(hc); rect.hclust(hc,2)(2)按三類進(jìn)行分類plot(hc); rect.hclust(hc,3)得分評(píng)閱人四、案例分析題(共2小題,共30分)我們知道,財(cái)政收入與國(guó)民生產(chǎn)總值和稅收等經(jīng)濟(jì)指標(biāo)有密切的依存關(guān)系。今收集了我國(guó)改革開放以來財(cái)政收入(y:百億元),國(guó)民生產(chǎn)總值 (x1:百億元),稅收(x2:百億元),進(jìn)出口貿(mào)易總額(x3:百億元),經(jīng)濟(jì)活動(dòng)人口(x4:百萬人)的部分?jǐn)?shù)據(jù),見下表所示,分析財(cái)政收入和國(guó)民生產(chǎn)總值、稅收、進(jìn)出口貿(mào)易總額、 經(jīng)濟(jì)活動(dòng)人口之間的關(guān)系。表1 財(cái)政收入多因素分析數(shù)據(jù)yx1x2x3x4199131.4948216.62529.901772.258660.91199234.8337266.51932.969191.196667.82199343.4895345.60542.553112.710674.68199452.1810466.70051.2688203.819681.35199562.4220574.94960.3804234.999688.55199674.0799668.50569.0982241.338697.65199786.5114731.42782.3404269.672708.00199898.7595769.67292.628268.577720.871999114.4408805.794106.8258298.963727.912000133.9523882.281125.8151392.742739.922001163.8604943.464153.0138421.933744.322002189.03641203.327176.3645513.782753.602003217.15251358.228200.1731704.835760.752004263.96471598.783241.6568955.391768.232005316.49291832.174287.78541169.218778.772006387.60202119.235348.04351409.714782.442007513.21782495.299456.21971667.402786.452008613.30353006.700542.19621778.8983790.481. 基本統(tǒng)計(jì)分析和R語言命令(15分)(1) 如果將該數(shù)據(jù)存入到一個(gè)文本文件reg.txt中,寫出將該文本數(shù)據(jù)讀入數(shù)據(jù)框dat中的R命令:dat=read.table(reg.txt,header=T) (1分)(2) 如果將該數(shù)據(jù)拷貝到剪切板中,寫出將該數(shù)據(jù)讀入數(shù)據(jù)框dat中的R命令:dat=read.table(clipboard,header=T) (1分)(3) 寫出提取2000年數(shù)據(jù)的R命令: dat10, (1分)寫出提取稅收(x2)數(shù)據(jù)的R命令: dat,5 (1分)寫出提取2001年至2008年經(jīng)濟(jì)活動(dòng)人口(x4)數(shù)據(jù)的R命令:dat11:18,5 (1分)(4) 寫出計(jì)算財(cái)政收入統(tǒng)計(jì)量的R命令: summary(y) (2分) Min. 1st Qu. Median Mean 3rd Qu. Max. 31.49 65.34 124.20 188.70 252.30 613.30(5) 寫出計(jì)算下面相關(guān)陣R命令: cor(dat) (2分) y x1 x2 x3 x4y 1.0000 0.9924 0.9999 0.9874 0.8736x1 0.9924 1.0000 0.9938 0.9883 0.9126 x2 0.9999 0.9938 1.0000 0.9881 0.8811x3 0.9874 0.9883 0.9881 1.0000 0.8807x4 0.8736 0.9126 0.8811 0.8807 1.0000(6) 寫出計(jì)算下面回歸系數(shù)的R命令:fm=lm(yx1+x2+x3+x4,data=dat);fm (2分)Coefficients:(Intercept) x1 x2 x3 x4 84.62030 0.00207 1.16908 -0.00305 -0.13391(7) 寫出計(jì)算下面檢驗(yàn)的R命令: summary(fm) (2分)Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) 84.62030 12.74442 6.64 1.6e-05 *x1 0.00207 0.00491 0.42 0.68 x2 1.16908 0.02113 55.32 2e-16 *x3 -0.00305 0.00367 -0.83 0.42 x4 -0.13391 0.01969 -6.80 1.3e-05 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 1.18 on 13 degrees of freedomMultiple R-squared: 0.999, Adjusted R-squared: 0.998 F-statistic: 8.87e+04 on 4 and 13 DF, p-value: |t|) (Intercept) 82.10361 9.04442 9.078 1.76e-07 *x2 1.16768 0.00385 303.331 2e-16 *x4 -0.12945 0.01318 -9.818 6.36e-08 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 1.126 on 15 degrees of freedomMultiple R-squared: 1, Adjusted R-squared: 1 F-sta

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論