主成分分析與因子分析的優(yōu)缺點_第1頁
主成分分析與因子分析的優(yōu)缺點_第2頁
主成分分析與因子分析的優(yōu)缺點_第3頁
主成分分析與因子分析的優(yōu)缺點_第4頁
主成分分析與因子分析的優(yōu)缺點_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第第頁免責聲明:圖文來源于網(wǎng)絡(luò)搜集,版權(quán)歸原作者所以若侵犯了您的合法權(quán)益,請作者與本上傳人聯(lián)系,我們將及時更正刪除。 主成分分析與因子分析的優(yōu)缺點二、基本思想的異同

(一)共同點

主成分分析法和因子分析法都是用少數(shù)的幾個變量(因子)來綜合反映原始變量(因子)的主要信息,變量雖然較原始變量少,但所包含的信息量卻占原始信息的85%以上,所以即使用少數(shù)的幾個新變量,可信度也很高,也可以有效地解釋問題.并且新的變量彼此間互不相關(guān),消除了多重共線性.這兩種分析法得出的新變量,并不是原始變量篩選后剩余的變量.在主成分分析中,最終確定的新變量是原始變量的線性組合,如原始變量為x1,x2,...,x3,經(jīng)過坐標變換,將原有的p個相關(guān)變量xi作線性變換,每個主成分都是由原有p個變量線性組合得到.在諸多主成分zi中,z1在方差中占的比重最大,說明它綜合原有變量的能力最強,越往后主成分在方差中的比重也小,綜合原信息的能力越弱.因子分析是要利用少數(shù)幾個公共因子去解釋較多個要觀測變量中存在的復(fù)雜關(guān)系,它不是對原始變量的重新組合,而是對原始變量進行分解,分解為公共因子與特殊因子兩部分.公共因子是由所有變量共同具有的少數(shù)幾個因子;特殊因子是每個原始變量獨自具有的因子.對新產(chǎn)生的主成分變量及因子變量計算其得分,就可以將主成分得分或因子得分代替原始變量進行進一步的分析,因為主成分變量及因子變量比原始變量少了許多,所以起到了降維的作用,為我們處理數(shù)據(jù)降低了難度.聚類分析的基本思想是:采用多變量的統(tǒng)計值,定量地確定相互之間的親疏關(guān)系,考慮對象多因素的聯(lián)系和主導(dǎo)作用,按它們親疏差異程度,歸入不同的分類中一元,使分類更具客觀實際并能反映事物的內(nèi)在必然聯(lián)系.也就是說,聚類分析是把研究對象視作多維空間中的許多點,并合理地分成若干類,因此它是一種根據(jù)變量域之間的相似性而逐步歸群成類的方法,它能客觀地反映這些變量或區(qū)域之間的內(nèi)在組合關(guān)系[3].聚類分析是通過一個大的對稱矩陣來探索相關(guān)關(guān)系的一種數(shù)學(xué)分析方法,是多元統(tǒng)計分析方法,分析的結(jié)果為群集.對向量聚類后,我們對數(shù)據(jù)的處理難度也自然降低,所以從某種意義上說,聚類分析也起到了降維的作用.

(二)不同之處

主成分分析是研究如何通過少數(shù)幾個主成分來解釋多變量的方差一協(xié)方差結(jié)構(gòu)的分析方法,也就是求出少數(shù)幾個主成分(變量),使它們盡可能多地保留原始變量的信息,且彼此不相關(guān).它是一種數(shù)學(xué)變換方法,即把給定的一組變量通過線性變換,轉(zhuǎn)換為一組不相關(guān)的變量(兩兩相關(guān)系數(shù)為0,或樣本向量彼此相互垂直的隨機變量),在這種變換中,保持變量的總方差(方差之和)不變,同時具有最大方差,稱為第一主成分;具有次大方差,稱為第二主成分.依次類推.若共有p個變量,實際應(yīng)用中一般不是找p個主成分,而是找出m(m三、數(shù)據(jù)標準化的比較

主成分分析中為了消除量綱和數(shù)量級,通常需要將原始數(shù)據(jù)進行標準化,將其轉(zhuǎn)化為均值為0方差為1的無量綱數(shù)據(jù).而因子分析在這方面要求不是太高,因為在因子分析中可以通過主因子法、加權(quán)最小二乘法、不加權(quán)最小二乘法、重心法等很多解法來求因子變量,并且因子變量是每一個變量的內(nèi)部影響變量,它的求解與原始變量是否同量綱關(guān)系并不太大,當然在采用主成分法求因子變量時,仍需標準化.不過在實際應(yīng)用的過程中,為了盡量避免量綱或數(shù)量級的影響,建議在使用因子分析前還是要進行數(shù)據(jù)標準化.在構(gòu)造因子變量時采用的是主成分分析方法,主要將指標值先進行標準化處理得到協(xié)方差矩陣,即相關(guān)矩陣和對應(yīng)的特征值與特征向量,然后構(gòu)造綜合評價函數(shù)進行評價.聚類分析中如果參與聚類的變量的量綱不同會導(dǎo)致錯誤的聚類結(jié)果.因此在聚類過程進行之前必須對變量值進行標準化,即消除量綱的影響.不同方法進行標準化,會導(dǎo)致不同的聚類結(jié)果要注意變量的分布.如果是正態(tài)分布應(yīng)該采用z分數(shù)法.

四、應(yīng)用中的優(yōu)缺點比較

(一)主成分分析

1、優(yōu)點

首先它利用降維技術(shù)用少數(shù)幾個綜合變量來代替原始多個變量,這些綜合變量集中了原始變量的大部分信息.其次它通過計算綜合主成分函數(shù)得分,對客觀經(jīng)濟現(xiàn)象進行科學(xué)評價.再次它在應(yīng)用上側(cè)重于信息貢獻影響力綜合評價.

2、缺點

當主成分的因子負荷的符號有正有負時,綜合評價函數(shù)意義就不明確.命名清晰性低.

(二)因子分析

1、優(yōu)點

第一它不是對原有變量的取舍,而是根據(jù)原始變量的信息進行重新組合,找出影響變量的共同因子,化簡數(shù)據(jù);第二,它通過旋轉(zhuǎn)使得因子變量更具有可解釋性,命名清晰性高.

2、缺點

在計算因子得分時,采用的是最小二乘法,此法有時可能會失效.

(三)聚類分析

1、優(yōu)點

聚類分析模型的優(yōu)點就是直觀,結(jié)論形式簡明.

2、缺點

在樣本量較大時,要獲得聚類結(jié)論有一定困難.由于相似系數(shù)是根據(jù)被試的反映來建立反映被試間內(nèi)在聯(lián)系的指標,而實踐中有時盡管從被試反映所得出的數(shù)據(jù)中發(fā)現(xiàn)他們之間有緊密的關(guān)系,但事物之間卻無任何內(nèi)在聯(lián)系,此時,如果根據(jù)距離或相似系數(shù)得出聚類分析的結(jié)果,顯然是不適當?shù)?,但是,聚類分析模型本身卻無法識別這類錯誤.

第二篇:主成分分析與全成分分析區(qū)別主成分分析與全成分分析的區(qū)別

主成分分析。是把幾個綜合變量來代替原來眾多的變量,使這些綜合變量能盡可能地代表原來變量的信息量,而且彼此之間互不相關(guān)的一種數(shù)學(xué)降維的方法。

全成分分析。是將送檢樣品中的原材料、填料、助劑等進行定性定量分析。塑料原材料種類,填料種類、粒徑,助劑種類都能影響對產(chǎn)品的性能、壽命,通常是同一種原材料、同一種填料,因為助劑種類的不同,造成產(chǎn)品性能大不相同。

主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉(zhuǎn)化為少數(shù)幾個綜合指標。在實際問題研究中,為了全面、系統(tǒng)地分析問題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為指標,在多元統(tǒng)計分析中也稱為變量。因為每個變量都在不同程度上反映了所研究問題的某些信息,并且指標之間彼此有一定的相關(guān)性,因而所得的統(tǒng)計數(shù)據(jù)反映的信息在一定程度上有重疊。在用統(tǒng)計方法研究多變量問題時,變量太多會增加計算量和增加分析問題的復(fù)雜性,人們希望在進行定量分析的過程中,涉及的變量較少,得到的信息量較多。主要目的

是希望用較少的變量去解釋原來資料中的大部分變量,將我們手中許多相關(guān)性很高的變量轉(zhuǎn)化成彼此相互獨立或不相關(guān)的變量。通常是選出比原始變量個數(shù)少,能解釋大部分資料中變量的幾個新變量,即所謂主成分,并用以解釋資料的綜合性指標。由此可見,主成分分析實際上是一種降維方法。

分析步驟

數(shù)據(jù)標準化;

一、求相關(guān)系數(shù)矩陣;

二、一系列正交變換,使非對角線上的數(shù)置0,加到主對角上;

三、得特征根xi(即相應(yīng)那個主成分引起變異的方差),并按照從大到小的順序把特征根排列;

四、求各個特征根對應(yīng)的特征向量;

五、用下式計算每個特征根的貢獻率vi;

vi=xi/(x1+x2+)

六、根據(jù)特征根及其特征向量解釋主成分物理意義。

主成分分析的基本思想

主成分分析是設(shè)法將原來眾多具有一定相關(guān)性(比如p個指標),重新組合成一組新的互相無關(guān)的綜合指標來代替原來的指標。

主成分分析,是考察多個變量間相關(guān)性一種多元統(tǒng)計方法,研究如何通過少數(shù)幾個主成分來揭示多個變量間的內(nèi)部結(jié)構(gòu),即從原始變量中導(dǎo)出少數(shù)幾個主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關(guān).通常數(shù)學(xué)上的處理就是將原來p個指標作線性組合,作為新的綜合指標。

主成分分析是把幾個綜合變量來代替原來眾多的變量,使這些綜合變量能盡可能地代表原來變量的信息量,而且彼此之間互不相關(guān)的一種數(shù)學(xué)降維的方法。

第三篇:主成分分析法的優(yōu)點主成分分析法的優(yōu)點:

1、可消除評價指標之間的相關(guān)影響

因為主成分分析在對原指標變量進行變換后形成了彼此相互獨立的主成分,而且實踐證明指標之間相關(guān)程度越高,主成分分析效果越好。

2、可減少指標選擇的工作量

對于其它評價方法,由于難以消除評價指標間的相關(guān)影響,所以選擇指標時要花費不少精力,而主成分分析由于可以消除這種相關(guān)影響,所以在指標選擇上相對容易些。

3、當評級指標較多時還可以在保留絕大部分信息的情況下用少數(shù)幾個綜合指標代替原指標進行分析

主成分分析中各主成分是按方差大小依次排列順序的,在分析問題時,可以舍棄一部分主成分,只取前后方差較大的幾個主成分來代表原變量,從而減少了計算工作量。

4、在綜合評價函數(shù)中,各主成分的權(quán)數(shù)為其貢獻率,它反映了該主成分包含原始數(shù)據(jù)的信息量占全部信息量的比重,這樣確定權(quán)數(shù)是客觀的、合理的,它克服了某些評價方法中認為確定權(quán)數(shù)的缺陷。

5、這種方法的計算比較規(guī)范,便于在計算機上實現(xiàn),還可以利用專門的軟件。主成分分析法的缺點:

1、在主成分分析中,我們首先應(yīng)保證所提取的前幾個主成分的累計貢獻率達到一個較高的水平(即變量降維后的信息量須保持在一個較高水平上),其次對這些被提取的主成分必須都能夠給出符合實際背景和意義的解釋(否則主成分將空有信息量而無實際含義)。

2、主成分的解釋其含義一般多少帶有點模糊性,不像原始變量的含義那么清楚、確切,這是變量降維過程中不得不付出的代價。因此,提取的主成分個數(shù)m通常應(yīng)明顯小于原始變量個數(shù)p(除非p本身較?。?,否則維數(shù)降低的“利”可能抵不過主成分含義不如原始變量清楚的“弊”。

聚類分析法優(yōu)點:

聚類分析模型的優(yōu)點就是直觀,結(jié)論形式簡明

聚類分析法缺點:

在樣本量較大時,要獲得聚類結(jié)論有一定困難。由于相似系數(shù)是根據(jù)被試的反映來建立反映被試間內(nèi)在聯(lián)系的指標,而實踐中有時盡管從被試反映所得出的數(shù)據(jù)中發(fā)現(xiàn)他們之間有緊密的關(guān)系,但事物之間卻無任何內(nèi)在聯(lián)系,此時,如果根據(jù)距離或相似系數(shù)得出聚類分析的結(jié)果,顯然是不適當?shù)?,但是,聚類分析模型本身卻無法識別這類錯誤。

第四篇:因子分析方法因子分析法

1.因子分析(factoranalysis)

因子分析的基本目的就是用少數(shù)幾個因子去描述許多指標或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個變量歸在同一類中,每一類變量就成為一個因子(之所以稱其為因子,是因為它是不可觀測的,即不是具體的變量),以較少的幾個因子反映原資料的大部分信息。運用這種研究技術(shù),我們可以方便地找出影響消費者購買、消費以及滿意度的主要因素是哪些,以及它們的影響力(權(quán)重)運用這種研究技術(shù),我們還可以為市場細分做前期分析。

因子分析法與其他一些多元統(tǒng)計方法的區(qū)別:

2.主成分分析

主成分分析主要是作為一種探索性的技術(shù),在分析者進行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù),讓自己對數(shù)據(jù)有一個大致的了解是非常重要的。主成分分析一般很少單獨使用:a,了解數(shù)據(jù)。(screeningthedata),b,和clusteranalysis一起使用,c,和判別分析一起使用,比如當變量很多,個案數(shù)不多,直接使用判別分析可能無解,這時候可以使用主成份發(fā)對變量簡化。(reducedimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),還可以用來處理共線性。

1、因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個變量的線性組合。

2、主成分分析的重點在于解釋各變量的總方差,而因子分析則把重點放在解釋各變量之間的協(xié)方差。

3、主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè)。因子分析的假設(shè)包括:各個共同因子之間不相關(guān),特殊因子(specificfactor)之間也不相關(guān),共同因子和特殊因子之間也不相關(guān)。

4、主成分分析中,當給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時候,的主成分一般是獨特的;而因子分析中因子不是獨特的,可以旋轉(zhuǎn)得到不同的因子。

5、在因子分析中,因子個數(shù)需要分析者指定(spss根據(jù)一定的條件自動設(shè)定,只要是特征值大于1的因子進入分析),而指定的因子數(shù)量不同而結(jié)果不同。在主成分分析中,成分的數(shù)量是一定的,一般有幾個變量就有幾個主成分。和主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解釋方面更加有優(yōu)勢。大致說來,當需要尋找潛在的因子,并對這些因子進行解釋的時候,更加傾向于使用因子分析,并且借助旋轉(zhuǎn)技術(shù)幫助更好解釋。而如果想把現(xiàn)有的變量變成少數(shù)幾個新的變量(新的變量幾乎帶有原來所有變量的信息)來進入后續(xù)的分析,則可以使用主成分分析。當然,這種情況也可以使用因子得分做到。所以這種區(qū)分不是絕對的。

總得來說,主成分分析主要是作為一種探索性的技術(shù),在分析者進行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù),讓自己對數(shù)據(jù)有一個大致的了解是非常重要的。主成分分析一般很少單獨使用:a,了解數(shù)據(jù)。(screeningthedata),b,和clusteranalysis一起使用,c,和判別分析一起使用,比如當變量很多,個案數(shù)不多,直接使用判別分析可能無解,這時候可以使用主成份發(fā)對變量簡化。(reducedimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),還可以用來處理共線性。

在算法上,主成分分析和因子分析很類似,不過,在因子分析中所采用的協(xié)方差矩陣的對角元素不在是變量的方差,而是和變量對應(yīng)的共同度(變量方差中被各因子所解釋的部分)。

3.聚類分析(clusteranalysis)

聚類分析是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸入不同的類的分析技術(shù)。

在市場研究領(lǐng)域,聚類分析主要應(yīng)用方面是幫助我們尋找目標消費群體,運用這項研究技術(shù),我們可以劃分出產(chǎn)品的細分市場,并且可以描述出各細分市場的人群特征,以便于客戶可以有針對性的對目標消費群體施加影響,合理地開展工作。

4.判別分析(discriminatoryanalysis)

判別分析(discriminatoryanalysis)的任務(wù)是根據(jù)已掌握的1批分類明確的樣品,建立較好的判別函數(shù),使產(chǎn)生錯判的事例最少,進而對給定的1個新樣品,判斷它來自哪個總體。根據(jù)資料的性質(zhì),分為定性資料的判別分析和定量資料的判別分析;采用不同的判別準則,又有費歇、貝葉斯、距離等判別方法。

費歇(fisher)判別思想是投影,使多維問題簡化為一維問題來處理。選擇一個適當?shù)耐队拜S,使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要求是:使每一類內(nèi)的投影值所形成的類內(nèi)離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。貝葉斯(bayes)判別思想是根據(jù)先驗概率求出后驗概率,并依據(jù)后驗概率分布作出統(tǒng)計推斷。所謂先驗概率,就是用概率來描述人們事先對所研究的對象的認識的程度;所謂后驗概率,就是根據(jù)具體資料、先驗概率、特定的判別規(guī)則所計算出來的概率。它是對先驗概率修正后的結(jié)果。

距離判別思想是根據(jù)各樣品與各母體之間的距離遠近作出判別。即根據(jù)資料建立關(guān)于各母體的距離判別函數(shù)式,將各樣品數(shù)據(jù)逐一代入計算,得出各樣品與各母體之間的距離值,判樣品屬于距離值最小的那個母體。

5.對應(yīng)分析(correspondenceanalysis)

對應(yīng)分析是一種用來研究變量與變量之間聯(lián)系緊密程度的研究技術(shù)。

運用這種研究技術(shù),我們可以獲取有關(guān)消費者對產(chǎn)品品牌定位方面的圖形,從而幫助您及時調(diào)整營銷策略,以便使產(chǎn)品品牌在消費者中能樹立起正確的形象。

這種研究技術(shù)還可以用于檢驗廣告或市場推廣活動的效果,我們可以通過對比廣告播出前或市場推廣活動前與廣告播出后或市場推廣活動后消費者對產(chǎn)品的不同認知圖來看出廣告或市場推廣活動是否成功的向消費者傳達了需要傳達的信息。

6.典型相關(guān)分析

典型相關(guān)分析是分析兩組隨機變量間線性密切程度的統(tǒng)計方法,是兩變量間線性相關(guān)分析的拓廣。各組隨機變量中既可有定量隨機變量,也可有定性隨機變量(分析時須f6說明為定性變量)。本法還可以用于分析高維列聯(lián)表各邊際變量的線性關(guān)系。

注意:

1.嚴格地說,一個典型相關(guān)系數(shù)描述的只是一對典型變量之間的相關(guān),而不是兩個變量組之間的相關(guān)。而各對典型變量之間構(gòu)成的多維典型相關(guān)才共同揭示了兩個觀測變量組之間的相關(guān)形式。

2.典型相關(guān)模型的基本假設(shè)和數(shù)據(jù)要求

要求兩組變量之間為線性關(guān)系,即每對典型變量之間為線性關(guān)系;

每個典型變量與本組所有觀測變量的關(guān)系也是線性關(guān)系。如果不是線性關(guān)系,可先線性化:如經(jīng)濟水平和收入水平與其他一些社會發(fā)展水之間并不是線性關(guān)系,可先取對數(shù)。即log經(jīng)濟水平,log收入水平。

3.典型相關(guān)模型的基本假設(shè)和數(shù)據(jù)要求

所有觀測變量為定量數(shù)據(jù)。同時也可將定性數(shù)據(jù)按照一定形式設(shè)為虛擬變量后,再放入典型相關(guān)模型中進行分析。

7.多維尺度分析(multi-dimensionanalysis)

多維尺度分析(multi-dimensionanalysis)是市場研究的一種有力手段,它可以通過低維空間(通常是二維空間)展示多個研究對象(比如品牌)之間的聯(lián)系,利用平面距離來反映研究對象之間的相似程度。由于多維尺度分析法通常是基于研究對象之間的相似性(距離)的,只要獲得了兩個研究對象之間的距離矩陣,我們就可以通過相應(yīng)統(tǒng)計軟件做出他們的相似性知覺圖。

在實際應(yīng)用中,距離矩陣的獲得主要有兩種方法。一種是采用直接的相似性評價,先所有評價對象進行兩兩組合,然后要求被訪者所有的這些組合間進行直接相似性評價,這種方法我們稱之為直接評價法;另一種為間接評價法,由研究人員根據(jù)事先經(jīng)驗,找出影響人們評價研究對象相似性的主要屬性,然后對每個研究對象,讓被訪者對這些屬性進行逐一評價,最后將所有屬性作為多維空間的坐標,通過距離變換計算對象之間的距離。

多維尺度分析的主要思路是利用對被訪者對研究對象的分組,來反映被訪者對研究對象相似性的感知,這種方法具有一定直觀合理性。同時該方法實施方便,調(diào)查中被訪者負擔較小,很容易得到理解接受。當然,該方法的不足之處是犧牲了個體距離矩陣,由于每個被訪者個體的距離矩陣只包含1與0兩種取值,相對較為粗糙,個體距離矩陣的分析顯得比較勉強。但這一點是完全可以接受的,因為對大多數(shù)研究而言,我們并不需要知道每一個體的空間知覺圖。

多元統(tǒng)計分析是統(tǒng)計學(xué)中內(nèi)容十分豐富、應(yīng)用范圍極為廣泛的一個分支。在自然科學(xué)和社會科學(xué)的許多學(xué)科中,研究者都有可能需要分析處理有多個變量的數(shù)據(jù)的問題。能否從表面上看起來雜亂無章的數(shù)據(jù)中發(fā)現(xiàn)和提煉出規(guī)律性的結(jié)論,不僅對所研究的專業(yè)領(lǐng)域要有很好的訓(xùn)練,而且要掌握必要的統(tǒng)計分析工具。對實際領(lǐng)域中的研究者和高等院校的研究生來說,要學(xué)習(xí)掌握多元統(tǒng)計分析的各種模型和方法,手頭有一本好的、有長久價值的參考書是非常必要的。這樣一本書應(yīng)該滿足以下條件:首先,它應(yīng)該是“淺入深出”的,也就是說,既可供初學(xué)者入門,又能使有較深基礎(chǔ)的人受益。其次,它應(yīng)該是既側(cè)重于應(yīng)用,又兼顧必要的推理論證,使學(xué)習(xí)者既能學(xué)到“如何”做,而且在一定程度上了解“為什么”這樣做。最后,它應(yīng)該是內(nèi)涵豐富、全面的,不僅要基本包括各種在實際中常用的多元統(tǒng)計分析方法,而且還要對現(xiàn)代統(tǒng)計學(xué)的最新思想和進展有所介紹、交代。

因子分析的核心問題有兩個:

一是如何構(gòu)造因子變量;二是如何對因子變量進行命名解釋。因此,因子分析的基本步驟和解決思路就是圍繞這兩個核心問題展開的。

(i)因子分析常常有以下四個基本步驟:

(1)確認待分析的原變量是否適合作因子分析。

(2)構(gòu)造因子變量。

(3)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性。

(4)計算因子變量得分。

(ii)因子分析的計算過程:

(1)將原始數(shù)據(jù)標準化,以消除變量間在數(shù)量級和量綱上的不同。

(2)求標準化數(shù)據(jù)的相關(guān)系數(shù)矩陣;

(3)求相關(guān)矩陣的特征值和特征向量;

(4)計算方差貢獻率與累積方差貢獻率;

(5)確定因子:

設(shè)f1,f2,…,fp為p個因子,其中前m個因子包含的數(shù)據(jù)信息總量(即其累積貢獻率)不低于80%時,可取前m個因子來反映原評價指標;

(6)因子旋轉(zhuǎn):

若所得的m個因子無法確定或其實際意義不是很明顯,這時需將因子進行旋轉(zhuǎn)以獲得較為明顯的實際含義。

(7)用原指標的線性組合來求各因子得分:

采用回歸估計法,bartlett估計法或thomson估計法計算因子得分。

(8)綜合得分

以各因子的方差貢獻率為權(quán),由各因子的線性組合得到綜合評價指標函數(shù)。

f=(w1f1+w2f2+…+wmfm)/(w1+w2+…+wm)

此處wi為旋轉(zhuǎn)前或旋轉(zhuǎn)后因子的方差貢獻率。

(9)得分排序。利用綜合得分可以得到得分名次。

在采用多元統(tǒng)計分析技術(shù)進行數(shù)據(jù)處理、建立宏觀或微觀系統(tǒng)模型時,需要研究以下幾個方面的問題:

·簡化系統(tǒng)結(jié)構(gòu),探討系統(tǒng)內(nèi)核??刹捎弥鞒煞址治?、因子分析、對應(yīng)分析等方法,在眾多因素中找出各個變量最佳的子集合,從子集合所包含的信息描述多變量的系統(tǒng)結(jié)果及各個因子對系統(tǒng)的影響?!皬臉淠究瓷帧?,抓住主要矛盾,把握主要矛盾的主要方面,舍棄次要因素,以簡化系統(tǒng)的結(jié)構(gòu),認識系統(tǒng)的內(nèi)核。

·構(gòu)造預(yù)測模型,進行預(yù)報控制。在自然和社會科學(xué)領(lǐng)域的科研與生產(chǎn)中,探索多變量系統(tǒng)運動的客觀規(guī)律及其與外部環(huán)境的關(guān)系,進行預(yù)測預(yù)報,以實現(xiàn)對系統(tǒng)的最優(yōu)控制,是應(yīng)用多元統(tǒng)計分析技術(shù)的主要目的。在多元分析中,用于預(yù)報控制的模型有兩大類。一類是預(yù)測預(yù)報模型,通常采用多元線性回歸或逐步回歸分析、判別分析、雙重篩選逐步回歸分析等建模技術(shù)。另一類是描述性模型,通常采用聚類分析的建模技術(shù)。

·進行數(shù)值分類,構(gòu)造分類模式。在多變量系統(tǒng)的分析中,往往需要將系統(tǒng)性質(zhì)相似的事物或現(xiàn)象歸為一類。以便找出它們之間的聯(lián)系和內(nèi)在規(guī)律性。過去許多研究多是按單因素進行定性處理,以致處理結(jié)果反映不出系統(tǒng)的總的特征。進行數(shù)值分類,構(gòu)造分類模式一般采用聚類分析和判別分析技術(shù)。

如何選擇適當?shù)姆椒▉斫鉀Q實際問題,需要對問題進行綜合考慮。對一個問題可以綜合運用多種統(tǒng)計方法進行分析。例如一個預(yù)報模型的建立,可先根據(jù)有關(guān)生物學(xué)、生態(tài)學(xué)原理,確定理論模型和試驗設(shè)計;根據(jù)試驗結(jié)果,收集試驗資料;對資料進行初步提煉;然后應(yīng)用統(tǒng)計分析方法(如相關(guān)分析、逐步回歸分析、主成分分析等)研究各個變量之間的相關(guān)性,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論