版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第11章主成分分析與因子分析
在實(shí)際問(wèn)題中,我們?cè)O(shè)計(jì)調(diào)查表,收集到大量指標(biāo)(變量)數(shù)據(jù),但這些指標(biāo)間通常不是相互獨(dú)立,而是相關(guān)的。此時(shí),為了簡(jiǎn)化問(wèn)題,我們就可以運(yùn)用主成分分析法,在眾多的指標(biāo)中找出少數(shù)幾個(gè)綜合性指標(biāo),來(lái)反映原來(lái)指標(biāo)所反映的主要信息(即,絕大部分的方差),實(shí)現(xiàn)簡(jiǎn)化問(wèn)題的目的。例如,企業(yè)的利潤(rùn)、成本、市場(chǎng)占有率等是明顯相關(guān)的;某地區(qū)的企業(yè)數(shù)、GDP、物流量、信息量等也是明顯相關(guān)的;一組青年中人的年齡、身高、肺活量等指標(biāo)之間,通常也存在著相關(guān)性。對(duì)這些相關(guān)性較強(qiáng)的指標(biāo),可通過(guò)主成分分析法實(shí)現(xiàn)復(fù)雜問(wèn)題的簡(jiǎn)單化。一、主成分分析基本概念
主成分(Principalcomponents)分析是把給定的一組變量,通過(guò)線(xiàn)性變換,轉(zhuǎn)化為一組不相關(guān)的變量。在這種變量的轉(zhuǎn)化過(guò)程中,變量的總方差(的方差之和)保持不變。同時(shí),使具有最大方差,稱(chēng)為第一主成分;具有次大方差,稱(chēng)為第二主成分。依次類(lèi)推,原來(lái)有k個(gè)變量,就可以轉(zhuǎn)換出k個(gè)主成分。但在實(shí)際應(yīng)用中,為了簡(jiǎn)化問(wèn)題,通常不是找出k個(gè)主成分,而是找出q(q<k)個(gè)主成分就夠了,只要這q個(gè)主成分反映出原來(lái)k個(gè)變量的絕大部分的方差就行。
調(diào)查n個(gè)個(gè)體(樣本)在k個(gè)指標(biāo)下的數(shù)值(或者用
k個(gè)指標(biāo)來(lái)評(píng)價(jià)n個(gè)對(duì)象),就可得到數(shù)據(jù)矩陣:
統(tǒng)計(jì)描述現(xiàn)在的目的是要求解出,使得即簡(jiǎn)記為向量Y滿(mǎn)足如下條件:指標(biāo)
之間不相關(guān)。方差盡可能大,即對(duì)n
個(gè)對(duì)象的分辨率盡可能強(qiáng),信息損失盡可能的少。主成分分析小結(jié):(1)從相關(guān)的多個(gè)指標(biāo)中,求出相互獨(dú)立的多個(gè)指標(biāo)。(2)的方差信息不損失,盡可能等同于的方差。
X
與Y
的轉(zhuǎn)換關(guān)系為:幾何解釋
在下圖的坐標(biāo)中,散點(diǎn)大致為橢圓狀。經(jīng)過(guò)線(xiàn)性變換可以得到新的坐標(biāo)。在橢圓的長(zhǎng)軸上,反映出了散點(diǎn)在這個(gè)方向的最大方差。在橢圓的短軸上,反映出了散點(diǎn)在這個(gè)方向的方差。主成分的計(jì)算流程步驟一:對(duì)矩陣而言(它是k階的實(shí)對(duì)稱(chēng)矩陣),首先找到它的k個(gè)實(shí)特征根。步驟二:相應(yīng)的k個(gè)長(zhǎng)度為1的、相互正交的特征向量,
即特征向量矩陣為式中,,。
主成分的計(jì)算流程步驟三:按如下方法得到主成分:式中,。是相互正交的綜合變量。將k個(gè)主成分放到一起可得矩陣表達(dá)式:主成分的計(jì)算流程主成分更為明晰的表達(dá)式:
主成分的計(jì)算流程結(jié)語(yǔ):若從中只取q個(gè),就能使則,就是體現(xiàn)了原來(lái)多指標(biāo)下數(shù)據(jù)主要信息的少數(shù)幾個(gè)綜合性指標(biāo),就是我們要找的主成分。主成分分析實(shí)例例1:全國(guó)經(jīng)濟(jì)發(fā)展基本情況的指標(biāo)主要有八項(xiàng):GDP、居民消費(fèi)水平、固定資產(chǎn)投資、職工平均工資、貨物周轉(zhuǎn)量、居民消費(fèi)價(jià)格指數(shù)、商品零售價(jià)格指數(shù)、工業(yè)總產(chǎn)值,現(xiàn)收集有全國(guó)30個(gè)省市自治區(qū)的相關(guān)指標(biāo)(見(jiàn)例),請(qǐng)用主成分分析方法選出適當(dāng)?shù)闹笜?biāo)項(xiàng)。二、因子分析
方法概述
人們?cè)谘芯繉?shí)際問(wèn)題時(shí),往往希望盡可能多的收集相關(guān)變量,以期望對(duì)問(wèn)題有比較全面、完整的把握和認(rèn)識(shí)。為解決這些問(wèn)題,最簡(jiǎn)單和最直接的解決方案是減少變量數(shù)目,但這必然又會(huì)導(dǎo)致信息丟失或不完整等問(wèn)題。為此,人們希望探索一種有效的解決方法,它既能減少參與數(shù)據(jù)分析的變量個(gè)數(shù),同時(shí)也不會(huì)造成統(tǒng)計(jì)信息的大量浪費(fèi)和丟失。因子分析就是在盡可能不損失信息或者少損失信息的情況下,將多個(gè)變量減少為少數(shù)幾個(gè)因子的方法。這幾個(gè)因子可以高度概括大量數(shù)據(jù)中的信息,這樣,既減少了變量個(gè)數(shù),又同樣能再現(xiàn)變量之間的內(nèi)在聯(lián)系。
二、因子分析因子分析方法是利用各變量間存在一定的相關(guān)關(guān)系,用較少的綜合指標(biāo)分別綜合存在于各變量中的相關(guān)關(guān)系,而綜合指標(biāo)之間彼此不相關(guān),即各指標(biāo)代表的信息不重疊。代表各類(lèi)信息的綜合指標(biāo)就稱(chēng)為因子變量或公因子。這種方法能以較少的因子變量和最小的信息損失來(lái)解釋變量之間的結(jié)構(gòu)。因子分析概述因子變量的特點(diǎn):(1)因子變量的數(shù)量遠(yuǎn)少于原有變量的數(shù)量,對(duì)因子變量的分析可以減少分析中的計(jì)算工作量。(2)因子變量并不是原有變量簡(jiǎn)單的取舍,而是對(duì)原始變量的重新組構(gòu),他們能夠反映原始眾多變量的絕大部分信息,不會(huì)產(chǎn)生重要信息的丟失。(3)因子變量之間沒(méi)有線(xiàn)性相關(guān)關(guān)系,對(duì)因子變量的分析就能避開(kāi)原始變量的共線(xiàn)性問(wèn)題,使研究工作更加簡(jiǎn)便。(4)因子變量具有命名解釋性。因子變量的命名解釋性可以理解為某個(gè)因子變量是對(duì)某些原始變量的總和,它能夠反映這些原始變量的絕大部分信息。因此我們可以對(duì)因子變量根據(jù)專(zhuān)業(yè)知識(shí)和其所反映的獨(dú)特含義給予命名。因子分析概述因子分析的主要應(yīng)用有兩方面:一是尋求基本結(jié)構(gòu),簡(jiǎn)化觀測(cè)系統(tǒng),將具有錯(cuò)綜復(fù)雜關(guān)系的變量綜合為少數(shù)幾個(gè)因子(不可觀測(cè)的,相互獨(dú)立的隨機(jī)變量),以再現(xiàn)因子與原始變量之間的內(nèi)在聯(lián)系;二是用于分類(lèi),對(duì)p個(gè)變量或n個(gè)樣本進(jìn)行分類(lèi)。因子分析概述因子分析根據(jù)研究對(duì)象可以分為R型和Q型因子分析:R型因子分析研究變量之間的相關(guān)關(guān)系,通過(guò)對(duì)變量的相關(guān)陣或協(xié)差陣內(nèi)部結(jié)構(gòu)的研究,找出控制所有變量的幾個(gè)公共因子,用以對(duì)變量或樣本進(jìn)行分類(lèi)。Q型因子分析研究樣本之間的相關(guān)關(guān)系,通過(guò)對(duì)樣本的相似矩陣內(nèi)部結(jié)構(gòu)的研究找出控制所有樣本的幾個(gè)主因子。這兩種因子分析的處理方法一樣,只是出發(fā)點(diǎn)不同。R型從變量的相關(guān)陣出發(fā),Q型從樣本相似陣出發(fā)。因子分析實(shí)例為了了解青年對(duì)婚姻家庭的態(tài)度,隨機(jī)訪問(wèn)了100人,詢(xún)問(wèn)了30個(gè)問(wèn)題,把這些問(wèn)題歸結(jié)于不可測(cè)的因子變量,即對(duì)外型的重視、對(duì)孩子的教育觀點(diǎn)、對(duì)家庭的重視、對(duì)金錢(qián)的重視等其它方面,因子分析的目的就是要建立一個(gè)模型,用這些不可測(cè)的、所有原始變量共有的因子變量和一些每個(gè)原始變量所特有的特殊因子來(lái)描述可測(cè)的原始變量,進(jìn)而分析和解釋青年人對(duì)婚姻家庭的態(tài)度。因子模型描述如下:因子分析模型因子分析模型那么因子分析模型可以構(gòu)造成:因子分析模型則稱(chēng)上式為因子模型,它的矩陣形式為:其中矩陣是待估系數(shù)矩陣,稱(chēng)為因子載荷矩陣,系數(shù)a11稱(chēng)為變量X1在因子F1上的載荷。稱(chēng)F1,F(xiàn)2,…,F(xiàn)m為的公共因子,它一般對(duì)X每一個(gè)分量Xi都有作用;稱(chēng)為的X1特殊因子,它起著殘差的作用,只對(duì)X1起作用因子分析模型因子模型的四個(gè)關(guān)鍵性假設(shè):因子分析的基本步驟因子分析的標(biāo)準(zhǔn)分析步驟為:(1)根據(jù)具體問(wèn)題,判斷待分析的原始若干變量是否適合作因子分析,并采用某些檢驗(yàn)方法來(lái)判斷數(shù)據(jù)是否符合分析要求。(2)選擇提取公因子的方法,并按一定標(biāo)準(zhǔn)確定提取的公因子數(shù)目。(3)考察公因子的可解釋性,并在必要時(shí)進(jìn)行因子旋轉(zhuǎn),以尋求最佳的解釋方式。(4)計(jì)算出因子得分等中間指標(biāo)進(jìn)一步分析使用。1.判斷原始變量是否適合進(jìn)行因子分析因子分析有一個(gè)默認(rèn)的前提條件,就是原始各變量間必須有較強(qiáng)的相關(guān)性,否則根本無(wú)法從中綜合出能反映原始變量結(jié)構(gòu)的因子變量,這就是因子分析最為嚴(yán)格的前提要求,所以一般在進(jìn)行具體的因子分析前,需先對(duì)原始變量進(jìn)行相關(guān)分析。最簡(jiǎn)單的方法是計(jì)算變量之間的相關(guān)系數(shù)矩陣并進(jìn)行統(tǒng)計(jì)檢驗(yàn)。如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)都小于0.3且未通過(guò)統(tǒng)計(jì)檢驗(yàn),那么,這些變量就不適合作因子分析。除此之外,SPSS還提供了幾種幫助判斷變量是否適合作因子分析的統(tǒng)計(jì)檢驗(yàn)方法:1.判斷原始變量是否適合進(jìn)行因子分析(1)巴特利特球度檢驗(yàn)(Bartletttestofsphericity)巴特利特球度檢驗(yàn)原假設(shè)H0是:相關(guān)陣是單位陣,即各變量各自獨(dú)立。巴特利特球度檢驗(yàn)的統(tǒng)計(jì)量根據(jù)相關(guān)系數(shù)矩陣的行列式計(jì)算得到。如果該統(tǒng)計(jì)量值比較大,且其對(duì)應(yīng)的相伴概率值小于用戶(hù)心中的顯著性水平,則應(yīng)拒絕H0
,認(rèn)為相關(guān)系數(shù)矩陣不太可能是單位陣,適合作因子分析;相反,如果該統(tǒng)計(jì)量值比較小,且其對(duì)應(yīng)的相伴概率值大于用戶(hù)心中的顯著性水平,則不能拒絕H0
,可以認(rèn)為相關(guān)系數(shù)矩陣可能是單位陣,不適合作因子分析。1.判斷原始變量是否適合進(jìn)行因子分析(2)反映象相關(guān)矩陣(Anti-imagecorrelationmatrix)檢驗(yàn)反映象相關(guān)矩陣檢驗(yàn)是將偏相關(guān)系數(shù)矩陣的每個(gè)元素取反,得到反映象相關(guān)陣。如果變量之間確實(shí)存在較強(qiáng)的相互重疊傳遞影響,由于計(jì)算偏相關(guān)系數(shù)時(shí)是在控制其它變量對(duì)兩變量影響的條件下計(jì)算出來(lái)的凈相關(guān)系數(shù),因此如果變量中確實(shí)能夠提取出公共因子,那么偏相關(guān)系數(shù)必然很小,則反映象相關(guān)矩陣中的有些元素的絕對(duì)值比較大,則說(shuō)明這些變量可能不適合作因子分析。1.判斷原始變量是否適合進(jìn)行因子分析(3)KMO(Kaiser-Meyer-Olkin)檢驗(yàn)KMO統(tǒng)計(jì)量是比較各變量間簡(jiǎn)單相關(guān)系數(shù)和偏相關(guān)系數(shù)的大小。可見(jiàn),KMO統(tǒng)計(jì)量的取值在0和1之間,KMO統(tǒng)計(jì)量越接近1,則越適合作因子分析,KMO越小,則越不適合作因子分析。一般認(rèn)為,KMO值大于0.9就非常適合,0.7以上效果一般;0.6則不太適合,0.5以下不適合。2.提取公因子和確定公因子數(shù)目因子分析有許多提取公因子的方法,如主成分分析法,最大似然法,α因子提取法等,其中應(yīng)用最廣泛的是主成分分析法。主成份分析法的目的是從原始的多個(gè)變量取若干線(xiàn)性組合,使得能盡可能多地保留原始變量中的信息。主成分分析法是通過(guò)坐標(biāo)變換手段,將原始變量轉(zhuǎn)換到新變量,是一個(gè)正交變換(坐標(biāo)變換)。2.提取公因子和確定公因子數(shù)目該方程組要求:考慮它的線(xiàn)性變換:設(shè)有
是一個(gè)p維隨機(jī)變量2.提取公因子和確定公因子數(shù)目2.提取公因子和確定公因子數(shù)目分別將如上確定的成為原始數(shù)據(jù)的第一、第二、……第p主成分。在實(shí)際應(yīng)用中,我們往往只需要能反映原始數(shù)據(jù)絕大部分信息的少數(shù)幾個(gè)主成分即可,因此一般選取前面幾個(gè)方差最大的主成分。2.提取公因子和確定公因子數(shù)目基于上述基本原理,現(xiàn)將主成分模型的系數(shù)求解步驟歸納如下:(1)將原有變量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。(2)計(jì)算變量的簡(jiǎn)單相關(guān)系數(shù)矩陣。(3)求解協(xié)方差陣的特征根,并將特征值從大到小排序并重新編碼:2.提取公因子和確定公因子數(shù)目(4)按預(yù)先規(guī)定所取的P個(gè)公因子的累計(jì)方差貢獻(xiàn)率達(dá)到的百分比m%2.提取公因子和確定公因子數(shù)目(6)寫(xiě)出因子負(fù)荷陣2.提取公因子和確定公因子數(shù)目選定提取因子方法的同時(shí),還需確定所需提取的公因子的數(shù)目。其實(shí)在確定公因子數(shù)量的問(wèn)題上,并無(wú)統(tǒng)一的原則來(lái)遵循,也無(wú)統(tǒng)一的標(biāo)準(zhǔn)來(lái)確定所應(yīng)該有的公因子數(shù)目,一般來(lái)說(shuō),主要通過(guò)以下幾個(gè)方面來(lái)確定公因子數(shù)量。2.提取公因子和確定公因子數(shù)目(1)根據(jù)特征根來(lái)確定。特征根在某種程度上可以被看成是表示公因子影響力度大小的指標(biāo),如果特征根小于1,說(shuō)明該公因子的解釋力度還不如直接引入一個(gè)原變量的平均解釋力度大。因此在SPSS中默認(rèn)用特征根大于1作為納入標(biāo)準(zhǔn)。2.提取公因子和確定公因子數(shù)目(2)根據(jù)公因子的累積方差貢獻(xiàn)率來(lái)確定。其實(shí)公因子的累積方差貢獻(xiàn)率也就是前面在主成分分析中講到的主成分的累積貢獻(xiàn)率。一般來(lái)說(shuō),提取公因子的方差累積貢獻(xiàn)率達(dá)到85%-90%以上就比較滿(mǎn)意了,可以此決定需要提取多少個(gè)公因子。2.提取公因子和確定公因子數(shù)目大量的實(shí)踐表明,根據(jù)方差累積貢獻(xiàn)率確定公因子數(shù)往往較多,而用特征根來(lái)確定又往往偏低,許多時(shí)候應(yīng)當(dāng)將兩者結(jié)合起來(lái),以綜合確定合適的數(shù)量。其實(shí)在因子分析中,提取公因子數(shù)量的原則重點(diǎn)在于提取出的公因子的可解釋性上,如果有實(shí)際意義,即使貢獻(xiàn)率較小,也可以考慮保留。而如果特征根大于1,但是找不到合理的解釋?zhuān)瑒t也可考慮將該公因子去除。3.公因子的命名解釋某個(gè)原始變量xi同時(shí)與幾個(gè)公因子都有比較大的相關(guān)關(guān)系,即xi的信息要由若干個(gè)公因子共同解釋?zhuān)煌瑫r(shí),雖然一個(gè)公因子能夠解釋許多原始變量的信息,但它都只是解釋每一個(gè)原始變量的一部分信息,而不是任何一個(gè)變量的典型代表。這樣在按照默認(rèn)的分解方式,各因子可能難以找到所代表的實(shí)際意義3.公因子的命名解釋因子模型的一個(gè)特點(diǎn):因子載荷陣不唯一,則可以利用這一特點(diǎn)對(duì)因子載荷矩陣進(jìn)行適當(dāng)?shù)男D(zhuǎn),使公因子載荷系數(shù)向更大(向1)或更小(向0)方向變化,使得對(duì)公因子的命名和解釋變得更加容易,但保持因子載荷矩陣A各行的元素的平方和即變量X的共同度不變。實(shí)現(xiàn)以上目的是通過(guò)因子軸的旋轉(zhuǎn)進(jìn)行變換的。3.公因子的命名解釋設(shè)從公因子F旋轉(zhuǎn)到公因子G,則模型變?yōu)椋菏切D(zhuǎn)后的因子模型,其中b11仍稱(chēng)為因子載荷。由旋轉(zhuǎn)前后的模型比較可以看出旋轉(zhuǎn)并不會(huì)影響公因子的提取過(guò)程和結(jié)果,只會(huì)改變?cè)甲兞康男畔⒘吭诓煌蜃由系姆植?,即改變因子載荷陣。3.公因子的命名解釋常用的旋轉(zhuǎn)方法可分為正交和斜交兩大類(lèi)。在因子旋轉(zhuǎn)過(guò)程中如果因子軸仍相互正交,則稱(chēng)為正交旋轉(zhuǎn)。如果因子軸之間不是相互正交的,則是斜交旋轉(zhuǎn)。進(jìn)行正交變換可以保證變換后各因子仍正交,這是比較理想的情況。3.公因子的命名解釋常用的是方差最大化正交旋轉(zhuǎn)(Varimax),它旋轉(zhuǎn)的原則是各因子仍保持直角正交,但使得因子間方差的差異達(dá)到最大,即使得在每個(gè)因子具有較高載荷的變量個(gè)數(shù)最小化。這種方法一般能簡(jiǎn)化對(duì)因子的解釋。3.公因子的命名解釋但如果正交變換后對(duì)公因子仍然不易解釋?zhuān)部梢赃M(jìn)行斜交旋轉(zhuǎn),或許可以得到比較容易解釋的結(jié)果。斜交旋轉(zhuǎn)最常用的是傾斜旋轉(zhuǎn)(Promax),這種方法是在方差最大化正交旋轉(zhuǎn)的基礎(chǔ)上進(jìn)行斜交旋轉(zhuǎn),計(jì)算速度較快,旋轉(zhuǎn)后允許因子間存在相關(guān)(交角非直角)。3.公因子的命名解釋在對(duì)因子矩陣進(jìn)行旋轉(zhuǎn)以后,就必須給不同的因子進(jìn)行命名。因子命名有一些原則:(1)因子分析的命名必須簡(jiǎn)明、用盡量少的詞(2~3個(gè))去解釋因子。(2)必須要注重不同因子荷載高的變量之間的相似性(3)可以根據(jù)因子中包含什么樣的變量來(lái)給因子命名。4.計(jì)算因子得分在因子分析中,還可以將公因子表示為原始變量的線(xiàn)性組合,這樣就可以從原始變量的觀測(cè)值估計(jì)各個(gè)公因子的值,求出的此值就是因子得分。4.計(jì)算因子得分由此可以得到以下模型:稱(chēng)為因子得分模型,每一個(gè)式子都是因子得分函數(shù)。由它可計(jì)算出每個(gè)樣本的因子得分。SPSS在因子分析中的應(yīng)用
3、基本步驟總結(jié)(1)確認(rèn)待分析的原變量是否適合作因子分析因子分析的主要任務(wù)是將原有變量的信息重疊部分提取和綜合成因子,進(jìn)而最終實(shí)現(xiàn)減少變量個(gè)數(shù)的目的。故它要求原始變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。進(jìn)行因子分析前,通??梢圆扇∮?jì)算相關(guān)系數(shù)矩陣、巴特利特球度檢驗(yàn)和KMO檢驗(yàn)等方法來(lái)檢驗(yàn)候選數(shù)據(jù)是否適合采用因子分析。(2)構(gòu)造因子變量將原有變量綜合成少數(shù)幾個(gè)因子是因子分析的核心內(nèi)容。它的關(guān)鍵是根據(jù)樣本數(shù)據(jù)求解因子載荷陣。因子載荷陣的求解方法有基于主成分模型的主成分分析法、基于因子分析模型的主軸因子法、極大似然法等。SPSS在因子分析中的應(yīng)用
(3)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性將原有變量綜合為少數(shù)幾個(gè)因子后,如果因子的實(shí)際含義不清,則不利于后續(xù)分析。為解決這個(gè)問(wèn)題,可通過(guò)因子旋轉(zhuǎn)的方式使一個(gè)變量只在盡可能少的因子上有比較高的載荷,這樣使提取出的因子具有更好的解釋性。(4)計(jì)算因子變量得分實(shí)際中,當(dāng)因子確定以后,便可計(jì)算各因子在每個(gè)樣本上的具體數(shù)值,這些數(shù)值稱(chēng)為因子得分。于是,在以后的分析中就可以利用因子得分對(duì)樣本進(jìn)行分類(lèi)或評(píng)價(jià)等研究,進(jìn)而實(shí)現(xiàn)了降維和簡(jiǎn)化問(wèn)題的目標(biāo)。SPSS在因子分析中的應(yīng)用
根據(jù)上述步驟,可以得到進(jìn)行因子分析的詳細(xì)計(jì)算過(guò)程如下:①將原始數(shù)據(jù)標(biāo)準(zhǔn)化,以消除變量間在數(shù)量級(jí)和量綱上的不同。②求標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)矩陣。③求相關(guān)矩陣的特征值和特征向量。④計(jì)算方差貢獻(xiàn)率與累積方差貢獻(xiàn)率。⑤確定因子:設(shè)F1,F(xiàn)2,…,F(xiàn)p為p個(gè)因子,其中前m個(gè)因子包含的數(shù)據(jù)信息總量(即其累積貢獻(xiàn)率)不低于85%時(shí),可取前m個(gè)因子來(lái)反映原評(píng)價(jià)指標(biāo)。⑥因子旋轉(zhuǎn):若所得的m個(gè)因子無(wú)法確定或其實(shí)際意義不是很明顯,這時(shí)需將因子進(jìn)行旋轉(zhuǎn)以獲得較為明顯的實(shí)際含義。⑦用原指標(biāo)的線(xiàn)性組合來(lái)求各因子得分。⑧綜合得分:通常以各因子的方差貢獻(xiàn)率為權(quán),由各因子的線(xiàn)性組合得到綜合評(píng)價(jià)指標(biāo)函數(shù)。SPSS在因子分析中的應(yīng)用實(shí)例分析:居民消費(fèi)結(jié)構(gòu)的變動(dòng)1.實(shí)例內(nèi)容消費(fèi)結(jié)構(gòu)是指在消費(fèi)過(guò)程中各項(xiàng)消費(fèi)支出占居民總支出的比重。它是反映居民生活消費(fèi)水平、生活質(zhì)量變化狀況以及內(nèi)在過(guò)程合理化程度的重要標(biāo)志。而消費(fèi)結(jié)構(gòu)的變動(dòng)不僅是消費(fèi)領(lǐng)域的重要問(wèn)題,而且也關(guān)系到整個(gè)國(guó)民經(jīng)濟(jì)的發(fā)展。因?yàn)楹侠淼南M(fèi)結(jié)構(gòu)及消費(fèi)結(jié)構(gòu)的升級(jí)和優(yōu)化不僅反映了消費(fèi)的層次和質(zhì)量的提高,而且也為建立合理的產(chǎn)業(yè)結(jié)構(gòu)和產(chǎn)品結(jié)構(gòu)提供了重要的依據(jù)。表11-2是某市居民生活費(fèi)支出費(fèi)用,具體分為食品、衣著、家庭設(shè)備用品及服務(wù)、醫(yī)療保健、交通通訊、文教娛樂(lè)及服務(wù)、居住和雜項(xiàng)商品與服務(wù)等8個(gè)部分。請(qǐng)利用因子分析探討該市居民消費(fèi)結(jié)構(gòu),為產(chǎn)業(yè)政策的制定和宏觀經(jīng)濟(jì)的調(diào)控提供參考。SPSS在因子分析中的應(yīng)用2.實(shí)例操作
數(shù)據(jù)文件11-1.sav是某市居民在食品、衣著、醫(yī)療保健等八個(gè)方面的消費(fèi)數(shù)據(jù),這些指標(biāo)之間存在著不同強(qiáng)弱的相關(guān)性。如果單獨(dú)分析這些指標(biāo),無(wú)法能夠分析居民消費(fèi)結(jié)構(gòu)的特點(diǎn)。因此,可以考慮采用因子分析,將這八個(gè)指標(biāo)綜合為少數(shù)幾個(gè)因子,通過(guò)這些公共因子來(lái)反映居民消費(fèi)結(jié)構(gòu)的變動(dòng)情況。SPSS在因子分析中的應(yīng)用3.實(shí)例結(jié)果及分析(1)描述性統(tǒng)計(jì)表下表顯示了食品、衣著等這八個(gè)消費(fèi)支出指標(biāo)的描述統(tǒng)計(jì)量,例如均值、標(biāo)準(zhǔn)差等。這為后續(xù)的因子分析提供了一個(gè)直觀的分析結(jié)果。可以看到,食品支出消費(fèi)所占的比重最大,其均值等于39.4750%,其次是文化娛樂(lè)服務(wù)支出消費(fèi)和交通通信支出消費(fèi)。所有的消費(fèi)支出中,醫(yī)療保健消費(fèi)支出占的比重最低。SPSS在因子分析中的應(yīng)用SPSS在因子分析中的應(yīng)用(2)因子分析共同度
下表是因子分析的共同度,顯示了所有變量的共同度數(shù)據(jù)。第一列是因子分析初始解下的變量共同度。它表明,對(duì)原有八個(gè)變量如果采用主成分分析法提取所有八個(gè)特征根,那么原有變量的所有方差都可被解釋?zhuān)兞康墓餐染鶠?(原有變量標(biāo)準(zhǔn)化后的方差為1)。事實(shí)上,因子個(gè)數(shù)小于原有變量的個(gè)數(shù)才是因子分析的目的,所以不可能提取全部特征根。于是,第二列列出了按指定提取條件(這里為特征根大于1)提取特征根時(shí)的共同度??梢钥吹?,所有變量的絕大部分信息(全部都大于83%)可被因子解釋?zhuān)@些變量信息丟失較少。因此本次因子提取的總體效果理想。SPSS在因子分析中的應(yīng)用SPSS在因子分析中的應(yīng)用(3)因子分析的總方差解釋接著Spss軟件計(jì)算得到相關(guān)系數(shù)矩陣的特征值、方差貢獻(xiàn)率及累計(jì)方差貢獻(xiàn)率結(jié)果如下表所示。在下頁(yè)表中,第一列是因子編號(hào),以后三列組成一組,組中數(shù)據(jù)項(xiàng)的含義依次是特征根、方差貢獻(xiàn)率和累計(jì)貢獻(xiàn)率。第一組數(shù)據(jù)項(xiàng)(第二至第四列)描述了初始因子解的情況??梢钥吹剑谝粋€(gè)因子的特征根值為4.316,解釋了原有8個(gè)變量總方差的53.947%。前三個(gè)因子的累計(jì)方差貢獻(xiàn)率為94.196%,并且只有它們的取值大于1。說(shuō)明前3個(gè)公因子基本包含了全部變量的主要信息,因此選前3個(gè)因子為主因子即可。同時(shí),ExtractionSumsofSquaredLoadings和RotationSumsofSquaredLoadings部分列出了因子提取后和旋轉(zhuǎn)后的因子方差解釋情況。從表中看到,它們都支持選擇3個(gè)公共因子。SPSS在因子分析中的應(yīng)用因子分析的總方差解釋SPSS在因子分析中的應(yīng)用(4)因子碎石圖下圖為因子分析的碎石圖。橫坐標(biāo)為因子數(shù)目,縱坐標(biāo)為特征根??梢钥吹?,第一個(gè)因子的特征值很高,對(duì)解釋原有變量的貢獻(xiàn)最大;第三個(gè)以后的因子特征根都較小,取值都小于1,說(shuō)明它們對(duì)解釋原有變量的貢獻(xiàn)很小,稱(chēng)為可被忽略的“高山腳下的碎石”,因此提取前三個(gè)因子是合適的。SPSS在因子分析中的應(yīng)用SPSS在因子分析中的應(yīng)用(5)旋轉(zhuǎn)前的因子載荷矩陣下表中顯示了因子載荷矩陣,它是因子分析的核心內(nèi)容。通過(guò)載荷系數(shù)大小可以分析不同公共因子所反映的主要指標(biāo)的區(qū)別。從結(jié)果看,大部分因子解釋性較好,但是仍有少部分指標(biāo)解釋能力較差,例如“食品”指標(biāo)在三個(gè)因子的載荷系數(shù)區(qū)別不大。因此接著采用因子旋轉(zhuǎn)方法使得因子載荷系數(shù)向0或1兩極分化,使大的載荷更大,小的載荷更小。這樣結(jié)果更具可解釋性。SPSS在因子分析中的應(yīng)用旋轉(zhuǎn)前的因子載荷矩陣SPSS在因子分析中的應(yīng)用(6)旋轉(zhuǎn)后的因子載荷矩陣下表中顯示了實(shí)施因子旋轉(zhuǎn)后的載荷矩陣??梢钥吹剑谝恢饕蜃釉凇敖煌ê屯ㄐ拧焙汀搬t(yī)療保健”等五個(gè)指標(biāo)上具有較大的載荷系數(shù),第二主因子在“居住”和“衣著”指標(biāo)上系數(shù)較大,而第三主因子在“雜項(xiàng)商品與服務(wù)”上的系數(shù)最大。此時(shí),各個(gè)因子的含義更加突出。SPSS在因子分析中的應(yīng)用實(shí)施因子旋轉(zhuǎn)后
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 41771.10-2025現(xiàn)場(chǎng)設(shè)備集成第10部分:行規(guī)基金會(huì)現(xiàn)場(chǎng)總線(xiàn)HSE
- 晉城社工考試真題及答案
- 對(duì)國(guó)內(nèi)視頻網(wǎng)站盈利模式研究-以樂(lè)視為例
- 2025年高職餐飲(餐飲服務(wù)技能)試題及答案
- 高二地理(水循環(huán))2026年下學(xué)期期中測(cè)試卷
- 2025-2026年高二化學(xué)(有機(jī)化學(xué))上學(xué)期期末測(cè)試卷
- 2025年大學(xué)中醫(yī)學(xué)(中醫(yī)內(nèi)科學(xué))試題及答案
- 2025年大學(xué)林學(xué)(森林旅游學(xué))試題及答案
- 2026年學(xué)前教育(幼兒教育)考題及答案
- 中職第三學(xué)年(汽車(chē)美容與裝潢)汽車(chē)美容護(hù)理2026年階段測(cè)試題及答案
- 廣州數(shù)控GSK 980TDc車(chē)床CNC使用手冊(cè)
- 國(guó)家開(kāi)放大學(xué)《Web開(kāi)發(fā)基礎(chǔ)》形考任務(wù)實(shí)驗(yàn)1-5參考答案
- 輸變電工程施工質(zhì)量驗(yàn)收統(tǒng)一表式附件1:線(xiàn)路工程填寫(xiě)示例
- 2024年中班·《壁虎和尾巴》快跑體育活動(dòng)教案公開(kāi)課
- 車(chē)模玩具行業(yè)市場(chǎng)突圍建議書(shū)
- 三年級(jí)語(yǔ)文 習(xí)作:身邊那些有特點(diǎn)的人公開(kāi)課
- 腳手架搭、拆工程安全防護(hù)措施
- 急慢性鼻炎課件
- 大數(shù)據(jù)與法律檢索-湖南師范大學(xué)中國(guó)大學(xué)mooc課后章節(jié)答案期末考試題庫(kù)2023年
- 物業(yè)公司保潔工作檢查評(píng)分表
- GB/T 20624.2-2006色漆和清漆快速變形(耐沖擊性)試驗(yàn)第2部分:落錘試驗(yàn)(小面積沖頭)
評(píng)論
0/150
提交評(píng)論