版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第五章
主成分分析
什么是主成分分析主成分分析(PrincipalComponentsAnalysis)也稱(chēng)主分量分析是將多種指標(biāo),化為少數(shù)幾種不有關(guān)的綜合指標(biāo)的一種記錄措施。在綜合評(píng)價(jià)工業(yè)企業(yè)的經(jīng)濟(jì)效益中,考核指標(biāo)有:1每百元固定資產(chǎn)原值實(shí)現(xiàn)產(chǎn)值、2每百元固定資產(chǎn)原值實(shí)現(xiàn)利稅、3每百元資金實(shí)現(xiàn)利稅、4每百元工業(yè)總產(chǎn)值實(shí)現(xiàn)利稅、5每百元銷(xiāo)售收入實(shí)現(xiàn)利稅、6每噸原則煤實(shí)現(xiàn)工業(yè)產(chǎn)值、7每千瓦電力實(shí)現(xiàn)工業(yè)產(chǎn)值、8全員勞動(dòng)生產(chǎn)率、9每百元流動(dòng)資金實(shí)現(xiàn)的產(chǎn)值指標(biāo)間信息有重疊,指標(biāo)數(shù)量又多。通過(guò)主成分分析計(jì)算,最終確定選擇了2個(gè)主成分作為綜合評(píng)價(jià)工業(yè)企業(yè)經(jīng)濟(jì)效益的根據(jù),變量數(shù)由9個(gè)減少到2個(gè),這兩個(gè)主成分代表的信息達(dá)91.6%,使所研究的問(wèn)題簡(jiǎn)化。第一節(jié)主成分分析的幾何意義X1X2幾何意義:為了直觀(guān),先在二維空間中討論主成分的幾何意義。設(shè)對(duì)每個(gè)樣品觀(guān)測(cè)兩個(gè)變量X1和X2的數(shù)據(jù)如下X1123456X224681012
樣品點(diǎn)完全在同一條直線(xiàn)上。X1X2其散點(diǎn)圖如下θX1Y2X2Y1由于樣品點(diǎn)都在Y1軸上,Y1方向有離散性,Y2方向無(wú)離散性,也就無(wú)區(qū)別??梢杂肶1來(lái)描述這些樣品點(diǎn),,因此在新坐標(biāo)系中只需用Y1一種變量就可以描述本來(lái)需用兩個(gè)變量X1和X2描述的樣品。則Y1包括了本來(lái)變量X1和X2的100%的信息。在實(shí)際問(wèn)題中,這樣的狀況是很少見(jiàn)的。一般狀況下,例如有n個(gè)樣品,每個(gè)樣品有兩個(gè)變量值X1和X2,這n個(gè)樣品的散點(diǎn)圖如帶狀.由圖可見(jiàn)這n個(gè)樣品點(diǎn)無(wú)論是沿著X1軸方向或X2軸方向都具有較大的離散性,其離散的程度可以分別用觀(guān)測(cè)變量X1的方差和X2的方差定量地表達(dá)。X1X2
θ
X2Y2
Y1
X1
同樣我們將X1軸和X2軸同步按逆時(shí)針?lè)较蛐D(zhuǎn)θ角度,得到新坐標(biāo)軸Y1和Y2。Y1和Y2是兩個(gè)新變量。根據(jù)解析幾何中的坐標(biāo)旋轉(zhuǎn)變換公式:第二節(jié)主成分的求解
假設(shè)我們所討論的實(shí)際問(wèn)題中,有p個(gè)指標(biāo),我們把這p個(gè)指標(biāo)看作p個(gè)隨機(jī)變量,記為X1,X2,…,Xp主成分分析就是要把這p個(gè)指標(biāo)的問(wèn)題,轉(zhuǎn)變?yōu)橛懻損個(gè)指標(biāo)的線(xiàn)性組合的問(wèn)題
主成分分析一般的做法是,尋求原指標(biāo)的線(xiàn)性組合Yi。并且滿(mǎn)足:1(i=1,2,…P)*2不有關(guān)性,Yi與Yj不有關(guān)。3方差極大條件,主成分的求解:求系數(shù),而其正是觀(guān)測(cè)變量有關(guān)矩陣的單位特性向量。因此,通過(guò)求解的特性方程,得到P個(gè)特性根和P個(gè)單位特性向量,把P個(gè)特性根按從大到小的次序排列,記作λi(i=1,2,…,p),它們分別代表P個(gè)主成分所解釋的觀(guān)測(cè)變量的方差,即Var(Yi)=λi(i=1,2,…,p)。對(duì)應(yīng)的P個(gè)單位特性向量就是主成分的系數(shù)(i=1,2,…,p)。主成分Y=由的單位特性向量構(gòu)成U,即由|-λI|=0求出λ然后裔入(-λI)Z=0求出單位特性向量,構(gòu)成U變量的原則化:由于主成分是根據(jù)變量的離散度也即方差的大小來(lái)確定主成分的,這樣當(dāng)不一樣指標(biāo)的量綱不一樣步,不一樣指標(biāo)的方差大小差別很大,主成分會(huì)受到影響,例如:X1表年收入,從萬(wàn)元到百萬(wàn)元變化,X2表凈收入與總資產(chǎn)之比,從0.01到0.60變化,則X1的方差的絕對(duì)量將遠(yuǎn)遠(yuǎn)不小于X2的方差,這樣主成分會(huì)過(guò)于照顧方差大的變量,為使主成分能均等地看待每一種原變量,應(yīng)將原變量作原則化處理.原則化公式:(i=1,2,…P)這時(shí)有=因此求U時(shí)可用的特性向量。還可以證明=因此==在實(shí)際問(wèn)題中,運(yùn)用主成分的目的是為了減少變量的個(gè)數(shù),因此一般不用P個(gè)主成分,而是根據(jù)如下措施選用前K個(gè)主成分。定義為第i主成分Yi的方差奉獻(xiàn)率。這個(gè)值越大,闡明這個(gè)主成分Yi綜合原指標(biāo)信息的能力越強(qiáng)。主成分的方差奉獻(xiàn)率定義(K≤P)為主成分Yl,Y2,…,Yk的累積方差奉獻(xiàn)率。目前K個(gè)主成分的累積方差奉獻(xiàn)率到達(dá)85%以上時(shí),就取K個(gè)主成分。這樣K個(gè)主成分基本反應(yīng)了原指標(biāo)的信息,指標(biāo)數(shù)目由P個(gè)減少到K個(gè)。這種由討論多種指標(biāo)降為少數(shù)幾種綜合指標(biāo)的過(guò)程在數(shù)學(xué)上就叫做降維。(i=1,2,…P)對(duì)于原則化后的變量,則原始變量與主成分之間的有關(guān)系數(shù)主成分得分:當(dāng)選用了n個(gè)主成分后,把樣本數(shù)據(jù)代入各主成分體現(xiàn)式可得樣本的主成分得分。若主成分是由原始數(shù)據(jù)協(xié)方差陣計(jì)算的,則計(jì)算主成分得分時(shí),用原始數(shù)據(jù)。若主成分是由原則化數(shù)據(jù)計(jì)算,即由R計(jì)算,則計(jì)算主成分得分時(shí),一定要用原則化數(shù)據(jù),否則會(huì)出現(xiàn)錯(cuò)誤。主成分的綜合得分運(yùn)用主成分Yl,Y2,…,Yk作線(xiàn)性組合,并以每個(gè)主成分Yi的方差奉獻(xiàn)率作為權(quán)數(shù)構(gòu)造一種綜合函數(shù):Y=根據(jù)計(jì)算出的Y值大小進(jìn)行排序。主成分的計(jì)算環(huán)節(jié):原始數(shù)據(jù)矩陣1、原始數(shù)據(jù)原則化2、計(jì)算樣本協(xié)差陣或有關(guān)系數(shù)矩陣R3、求R的非零特性根及對(duì)應(yīng)的原則正交特性向量4、
求出主成分(i=1,2,…P)
根據(jù)合計(jì)方差奉獻(xiàn)率不小于等于80%,85%,90%等,確定選用主成分個(gè)數(shù)。結(jié)合專(zhuān)業(yè)知識(shí)將各主成分給出恰當(dāng)?shù)慕忉專(zhuān)⑦\(yùn)用其來(lái)判斷樣品的特性。例一應(yīng)收賬款是指企業(yè)因?qū)ν怃N(xiāo)售產(chǎn)品、材料、提供勞務(wù)及其他原因,應(yīng)向購(gòu)貨單位或接受勞務(wù)的單位收取的款項(xiàng)。出于擴(kuò)大銷(xiāo)售的競(jìng)爭(zhēng)需要,企業(yè)不得不以賒銷(xiāo)或其他優(yōu)惠的方式招攬顧客,由于銷(xiāo)售和收款的時(shí)間差,于是產(chǎn)生了應(yīng)收款項(xiàng)。應(yīng)收款賒銷(xiāo)的效果的好壞,不僅依賴(lài)于企業(yè)的信用政策,還依賴(lài)于顧客的信用程度。由此,評(píng)價(jià)顧客的信用等級(jí),理解顧客的綜合信用程度,對(duì)加強(qiáng)企業(yè)的應(yīng)收賬款管理大有協(xié)助。某企業(yè)為了理解其客戶(hù)的信用程度,采用西方銀行信用評(píng)估常用的5C措施,5C的目的是闡明顧客違約的也許性。1、品格(用X1表達(dá)),指顧客的信譽(yù),履行償還義務(wù)的也許性。企業(yè)可以通過(guò)過(guò)去的付款記錄得到此項(xiàng)。2、能力(用X2表達(dá)),指顧客的償還能力。即其流動(dòng)資產(chǎn)的數(shù)量和質(zhì)量以及流動(dòng)負(fù)載的比率。顧客的流動(dòng)資產(chǎn)越多,其轉(zhuǎn)化為現(xiàn)金支付款項(xiàng)的能力越強(qiáng)。同步,還應(yīng)注意顧客流動(dòng)資產(chǎn)的質(zhì)量,看其與否會(huì)出現(xiàn)存貨過(guò)多過(guò)時(shí)質(zhì)量下降,影響其變現(xiàn)能力和支付能力。3、資本(用X3表達(dá)),指顧客的財(cái)務(wù)勢(shì)力和財(cái)務(wù)狀況,表明顧客也許償還債務(wù)的背景。4、附帶的擔(dān)保品(用X4表達(dá)),指借款人以輕易發(fā)售的資產(chǎn)做抵押。5、環(huán)境條件(用X5表達(dá)),指企業(yè)的外部原因,即指非企業(yè)自身能控制或操縱的原因。首先抽取了10家俱有可比性的同類(lèi)企業(yè)作為樣本,又請(qǐng)8位專(zhuān)家分別給10個(gè)企業(yè)的5個(gè)指標(biāo)打分,然后分別計(jì)算企業(yè)5個(gè)指標(biāo)的平均值,如表。76.581.57675.871.78579.280.384.476.570.67367.668.178.5949487.589.59290.787.39181.58084.666.968.864.866.477.573.670.969.874.857.760.457.460.86585.668.57062.276.57069.271.764.968.9;第一主成分的奉獻(xiàn)率為84.6%,第一主成分Z1=0.469X1+0.485X2+0.473X3+0.462X4+0.329X5的各項(xiàng)系數(shù)大體相等,且均為正數(shù),是對(duì)所有指標(biāo)的一種綜合測(cè)度,可以作為綜合的信用等級(jí)指標(biāo)??梢杂脕?lái)排序。計(jì)算各企業(yè)的得分,并按分值大小排序:在對(duì)的評(píng)估了顧客的信用等級(jí)后,就能對(duì)的制定出對(duì)其的信用期、收帳政策等,這對(duì)于加強(qiáng)應(yīng)收帳款的管理大有協(xié)助。序號(hào)12345678910得分3.1613.6-9.0135.925.1-10.3-4.36-33.8-6.41-13.8排序43712851069例對(duì)全國(guó)30個(gè)省市自漢區(qū)經(jīng)濟(jì)發(fā)展基本狀況的八項(xiàng)指標(biāo)作主成分分析,原始數(shù)據(jù)如下:
GDPX1居民消費(fèi)水平X2固定資產(chǎn)投資X3職工平均工資X4貨物周轉(zhuǎn)
量X5居民消費(fèi)價(jià)格指數(shù)X6商品零售價(jià)格指數(shù)X7工業(yè)總產(chǎn)
值X8北京天津河北山西內(nèi)蒙遼寧吉林黑龍江上海江蘇浙江安徽福建江西山東河南湖北湖南廣東廣西海南四川貴州云南西藏陜西甘肅青海寧夏新疆1394.89920.112849.521092.18832.882793.371129.22014.532462.575155.253524.792003.582160.521205.115002.343002.712391.422195.75381.721606.15364.173534630.071206.6855.981000.03553.35165.31169.75843.5725052720125812501387269718722334534319262249125423201182152710341527140826991314181412619421261111012081007144513551469519.01345.46704.87290.9250.23387.99320.45435.73996.481434.951006.39474553.97282.841229.55670.35571.68422.611639.83382.59198.35822.54150.8433417.87300.27114.8147.7661.98376.95814465014839472141344911443041459279594366194609585742115145434446854797825051055340464544755149738243965493575350795348373.9342.82033.3717.3781.71371.1497.4824.8207.41025.5754.4908.3609.3411.71196.61574.48491011.8656.5556232.1902.3301.1310.44.2500.950761.6121.8339117.3115.2115.2116.9117.5116.1115.2116.1118.7115.8116.6114.8115.2116.8117.6116.5120119114118.4113.5118.5121.4121.3117.3119119.8118117.1119.7112.6110.6115.8115.6116.8114114.2114.3113114.3113.5112.7114.4115.9114.2114.9116.6115.5111.6116.4111.3117117.2118.1114.9117116.5116.3115.3116.7843.43582.511234.85697.25419.391840.55762.471240.371642.952026.64916.59824.14433.67571.842207.691367.921220.72843.831396.35554.9764.331431.81324.72716.655.57600.98468.79105.8114.4428.76第一步將原始數(shù)據(jù)原則化。第二步建立指標(biāo)之間的有關(guān)數(shù)陣R如下:
X1X2X3X4X5X6X7X8X1X2X3X4X5X6X7X81.000.267.951.191.617-.274-.264.874.2671.000.426.718-.151-.234-.593.363.951.426.1000.400.431-.282-.359.792.191.718.4001.000-.356-.134-.539-.104.617-.151.431-.3561.000-.255.022.659-.274-.234-.282-.134-.2551.000.760-.126-.264-.593-.359-.539.022.7601.000-1.92.874.363.792.104.659-.126-.1921.000第三步求R的特性值和特性向量。
從上表看,前3個(gè)特性值合計(jì)奉獻(xiàn)率已達(dá)89.564%,闡明前3個(gè)主成分基本包括了所有指標(biāo)具有的信息,我們?nèi)∏?個(gè)特性值,并計(jì)算出對(duì)應(yīng)的特性向量:主成分特征值方差貢獻(xiàn)率累計(jì)貢獻(xiàn)率123456783.7552.1951.214.403.213.1396.594E-021.462E-0246.94327.44315.1785.0332.6601.737.842.18346.94374.38689.56494.59697.25698.99399.817100.000從上表看,前3個(gè)特性值計(jì)合計(jì)奉獻(xiàn)率已達(dá)89.564%,闡明前3個(gè)主成分基本包括了所有指標(biāo)具有的信息,我們?nèi)∏?個(gè)特性值,并計(jì)算出對(duì)應(yīng)的特性向量:第一特征向量a1第二
特征向量a2第三特征向量a30.4567080.3132450.4706410.2404810.250802-0.262670-0.319440-0.4247120.258464-0.4035390.107995-0.4886800.4988010.1673920.4009310.2875360.1097730.2458560.1924100.332179-0.247770.7233510.3975250.19241因而前三個(gè)主成分為:第一主成分:F1=0.456708X1+0.312729X2+0.470641X3+0.240481X4+0.250802X5-0.26267X6-0.31944X7+0.424712X8第二主成分:F1=0.258512X1-0.40431X2+0.107995X3-0.48868X4+0.498801X5+0.167392X6+0.400931X7+0.287536X8第三主成分:F1=0.109819X1+0.24505X2+0.19241X3+0.332179X4-0.24777X5+0.723351X6+0.397525X7+0.19241X8假如一種主成分僅僅對(duì)某一種原始變量有作用,則稱(chēng)為特殊成分。假如一種主成分所有的原始變量都起作用,稱(chēng)為公共成分。選題參照:1、(我國(guó))房地產(chǎn)發(fā)展原因的主成分分析2、(全國(guó))工業(yè)企業(yè)市場(chǎng)競(jìng)爭(zhēng)力的主成分分析3、(各地區(qū))工業(yè)企業(yè)經(jīng)濟(jì)效益的主成分分析4、我國(guó)都市(農(nóng)村)居民消費(fèi)支出的主成分分析5、(各地區(qū))農(nóng)業(yè)發(fā)展?fàn)顩r的主成分分析6、我國(guó)各省市
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《FZT 80015-2022服裝CAD技術(shù)規(guī)范》專(zhuān)題研究報(bào)告
- 《GBT 9864-2008膠片、相紙、乳劑、定影液、污水、淤泥或殘留物的銀量測(cè)定方法》專(zhuān)題研究報(bào)告
- 《GBT 21630-2008危險(xiǎn)品 噴霧劑點(diǎn)燃距離試驗(yàn)方法》專(zhuān)題研究報(bào)告
- 《GBT 15043-2008白熾燈泡光電參數(shù)的測(cè)量方法》專(zhuān)題研究報(bào)告
- 《GB 18242-2008彈性體改性瀝青防水卷材》專(zhuān)題研究報(bào)告
- 道路安全實(shí)踐培訓(xùn)課件
- 道路圍欄知識(shí)培訓(xùn)課件
- 道路交通安全培訓(xùn)講義課件
- 迪慶州消防安全全員培訓(xùn)課件
- 達(dá)衣巖21秋培訓(xùn)課件
- 腰椎術(shù)后腦脊液漏護(hù)理課件
- 鋼結(jié)構(gòu)工程測(cè)量專(zhuān)項(xiàng)方案樣本
- 廣東省佛山市南海區(qū)2023-2024學(xué)年七年級(jí)上學(xué)期期末數(shù)學(xué)試卷+
- 基于區(qū)塊鏈的供應(yīng)鏈金融平臺(tái)實(shí)施方案
- 汽車(chē)修理廠(chǎng)維修結(jié)算清單
- 牛津版小學(xué)英語(yǔ)教材梳理
- 風(fēng)機(jī)安裝工程施工強(qiáng)制性條文執(zhí)行記錄表
- GB/T 1355-2021小麥粉
- GB 5135.11-2006自動(dòng)噴水滅火系統(tǒng)第11部分:溝槽式管接件
- (完整版)歐姆龍E3X-HD光纖放大器調(diào)試SOP
- 強(qiáng)夯地基工程技術(shù)標(biāo)
評(píng)論
0/150
提交評(píng)論