主成分分析法_第1頁
主成分分析法_第2頁
主成分分析法_第3頁
主成分分析法_第4頁
主成分分析法_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上2在matlab中提供了直接計算主成分的命令:(1).princomp    功能:主成分分析    格式:PC=princomp(X)          PC,SCORE,latent,tsquare=princomp(X)    說明:PC,SCORE,latent,tsquare=princomp(X)對數(shù)據(jù)矩陣X進(jìn)行主成分分析,給出各主成分(PC)、所謂的Z-得分(SCORE)、X的

2、方差矩陣的特征值(latent)和每個數(shù)據(jù)點的HotellingT2統(tǒng)計量(tsquare)。(2).pcacov    功能:運用協(xié)方差矩陣進(jìn)行主成分分析    格式:PC=pcacov(X)          PC,latent,explained=pcacov(X)    說明:PC,latent,explained=pcacov(X)通過協(xié)方差矩陣X進(jìn)行主成分分析,返回主成分(PC)、協(xié)方差矩陣X的特征值(l

3、atent)和每個特征向量表征在觀測量總方差中所占的百分?jǐn)?shù)(explained)。(3).pcares    功能:主成分分析的殘差    格式:residuals=pcares(X,ndim)    說明:pcares(X,ndim)返回保留X的ndim個主成分所獲的殘差。注意,ndim是一個標(biāo)量,必須小于X的列數(shù)。而且,X是數(shù)據(jù)矩陣,而不是協(xié)方差矩陣。主成分分析方法(舉例)(2008-04-26 21:41:50)標(biāo)簽:  分類:3. 主成分分析方法應(yīng)用實例1) 實例1: 流域系統(tǒng)的主成分分

4、析(張超,1984)表3.5.1(點擊顯示該表)給出了某流域系統(tǒng)57個流域盆地的9項變量指標(biāo)。其中,x1代表流域盆地總高度(m),x2代表流域盆地山口的海拔高度(m),x3代表流域盆地周長(m),x4代表河道總長度(m),x5代表河道總數(shù),x6代表平均分叉率,x7代表河谷最大坡度(度),x8代表河源數(shù), x9代表流域盆地面積(km2)。注:表中數(shù)據(jù)詳見書本87和88頁。(1) 分析過程: 將表3.5.1中的原始數(shù)據(jù)作標(biāo)準(zhǔn)化處理,然后將它們代入相關(guān)系數(shù)公式計算,得到相關(guān)系數(shù)矩陣(表3.5.2)。 由相關(guān)系數(shù)矩陣計算特征值,以及各個主成分的貢獻(xiàn)率與累計貢獻(xiàn)率(見表3.5.3)。由表3.5.3可知,

5、第一,第二,第三主成分的累計貢獻(xiàn)率已高達(dá)86.5%,故只需求出第一、第二、第三主成分z1,z2,z3即可。z3上的載荷(表3.5.4)。(2) 結(jié)果分析: 第一主成分z1與x1,x3,x4,x5,x8,x9有較大的正相關(guān),可以看作是流域盆地規(guī)模的代表; 第二主成分z2與x2有較大的正相關(guān),與x7有較大的負(fù)相關(guān),分可以看作是流域侵蝕狀況的代表; 第三主成分z3與x6有較大的正相關(guān),可以看作是河系形態(tài)的代表; 根據(jù)主成分載荷,該流域系統(tǒng)的9項要素可以被歸納為三類,即流域盆地的規(guī)模,流域侵蝕狀況和流域河系形態(tài)。如果選取其中相關(guān)系數(shù)絕對值最大者作為代表,則流域面積、流域盆地出口的海拔高度和分叉率可作為

6、這三類要素的代表。主成分分析法    主成分分析也稱主分量分析,旨在利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個綜合指標(biāo)。在實證問題研究中,為了全面、系統(tǒng)地分析問題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為指標(biāo),在多元統(tǒng)計分析中也稱為變量。因為每個變量都在不同程度上反映了所研究問題的某些信息,并且指標(biāo)之間彼此有一定的相關(guān)性,因而所得的統(tǒng)計數(shù)據(jù)反映的信息在一定程度上有重疊。在用統(tǒng)計方法研究多變量問題時,變量太多會增加計算量和增加分析問題的復(fù)雜性,人們希望在進(jìn)行定量分析的過程中,涉及的變量較少,得到的信息量較多。主成分分析正是適應(yīng)這一要求產(chǎn)生的,是解決這類題的理想工

7、具。主成分分析法是一種數(shù)學(xué)變換的方法, 它把給定的一組相關(guān)變量通過線性變換轉(zhuǎn)成另一組不相關(guān)的變量,這些新的變量按照方差依次遞減的順序排列。在數(shù)學(xué)變換中保持變量的總方差不變,使第一變量具有最大的方差,稱為第一主成分,第二變量的方差次大,并且和第一變量不相關(guān),稱為第二主成分。依次類推,I個變量就有I個主成分。1主成分分析的基本原理    主成分分析:把原來多個變量劃為少數(shù)幾個綜合指標(biāo)的一種統(tǒng)計分析方法,是一種降維處理技術(shù)。)記原來的變量指標(biāo)為x1,x2,xP,它們的綜合指標(biāo)新變量指標(biāo)為z1,z2,zm(mp),則z1,z2,zm分別稱為原變量指標(biāo)x1,x2,xP的第一

8、,第二,第m主成分,在實際問題的分析中,常挑選前幾個最大的主成分。 系數(shù)lij的確定原則(單擊展開顯示) zi與zj(ij;i,j=1,2,m)相互無關(guān); z1是x1,x2,xP的一切線性組合中方差最大者,z2是與z1不相關(guān)的x1,x2,xP的所有線性組合中方差最大者;zm是與z1,z2,zm1都不相關(guān)的x1,x2,xP的所有線性組合中方差最大者。  主成分分析的數(shù)學(xué)特征(單擊展開顯示)2. 主成分分析的計算步驟 計算相關(guān)系數(shù)矩陣 計算特征值與特征向量 計算主成分貢獻(xiàn)率及累計貢獻(xiàn)率 計算主成分載荷1 主成分分析法的數(shù)學(xué)原理 設(shè)有個原始指標(biāo):,用來評價個單位,則共有個數(shù)據(jù)。這個原始指標(biāo)

9、之間往往存在著一定的相關(guān)性,主成分分析的目的是要將這些原始指標(biāo)組合成新的不相關(guān)的指標(biāo):,以使各指標(biāo)在整個經(jīng)濟(jì)過程中的作用容易解釋,這些綜合指標(biāo)表現(xiàn)為原始指標(biāo)的線性函數(shù): 由于所組合成的新指標(biāo):彼此不相關(guān),就使我們有可能從中選擇主要成分,通過對主要成分的重點分析,達(dá)到綜合評價的目的。 通過數(shù)學(xué)計算可以將個原始指標(biāo):的總方差分解為新的不相關(guān)的指標(biāo):的方差之和,并使第一個綜合指標(biāo)方差達(dá)到最大(貢獻(xiàn)率最大),第二個綜合指標(biāo)方差達(dá)到次大,依此類推,一般前面幾個綜合指標(biāo)即可包含總方差中的絕大部分,也就是說,主成分分析可以使原始指標(biāo)的大部分方差“集中”于少數(shù)幾個主成分綜合指標(biāo)上,通過對這幾個主成分的分析來實

10、現(xiàn)對總體的綜合評價。2 主成分分析法的計算步驟 主成分分析可分為五個主要步驟: 第一步,列出原始指標(biāo)數(shù)值矩陣; 第二步,計算的相關(guān)矩陣; 第三步,計算相關(guān)矩陣的特征值和特征向量(即指標(biāo)的系數(shù)); 第四步,計算貢獻(xiàn)率和累計貢獻(xiàn)率,據(jù)以確定主成分的個數(shù),并建立主成分方程;每個主成分的貢獻(xiàn)率等于它的特征值除以原始指標(biāo)個數(shù),累計貢獻(xiàn)率等于各主成分的貢獻(xiàn)率順序相加,根據(jù)一定的選擇標(biāo)準(zhǔn),如果前個主成分的累計貢獻(xiàn)率大于或等于,則可選定這個主成分,根據(jù)特征向量建立這個主成分的線性方程:第五步,解釋各主成分的意義,并將各單位的原始指標(biāo)數(shù)值代入方程中計算綜合評價值進(jìn)行分析比較(在多指標(biāo)綜合評價中,一般只需取第一個主成分作為全面反映各指標(biāo)狀況的綜合指標(biāo),因為它綜合原始指標(biāo)信息的能力最強(qiáng))。3 主成分分析法的應(yīng)用實例 實例 南通隆盛機(jī)電集團(tuán)有限公司生產(chǎn)的一種新產(chǎn)品有20種型號,現(xiàn)通過4個技術(shù)指標(biāo)進(jìn)行綜合評價,原始指標(biāo)數(shù)值矩陣為: 應(yīng)用SPSS統(tǒng)計分析軟件可得: 的相關(guān)矩陣為:,相關(guān)矩陣的特征值、貢獻(xiàn)率、累計貢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論