版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1,第十三章 主成分分析和因子分析,在建立多元回歸模型時(shí),為了更準(zhǔn)確地反映事物的特征,人們經(jīng)常會在模型中包含較多相關(guān)解釋變量,這不僅使得問題分析變得復(fù)雜,而且變量之間可能存在多重共線性,使得數(shù)據(jù)提供的信息發(fā)生重疊,甚至?xí)⑹挛锏恼嬲卣?。為了解決這些問題,需要采用降維的思想,將所有指標(biāo)的信息通過少數(shù)幾個(gè)指標(biāo)來反映,在低維空間將信息分解為互不相關(guān)的部分以獲得更有意義的解釋。本章介紹的主成分分析和因子分析可用于解決這類問題。,2,主成分分析(principal components analysis,簡稱PCA)是由霍特林(Hotelling)于1933年首先提出的。它通過投影的方法,實(shí)現(xiàn)數(shù)據(jù)的
2、降維,在損失較少數(shù)據(jù)信息的基礎(chǔ)上把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)有代表意義的綜合指標(biāo)。,13.1 主成分分析,3,13.1.1 主成分分析的基本思想 假如對某一問題的研究涉及 p 個(gè)指標(biāo),記為X1,X2, , Xp,由這 p 個(gè)隨機(jī)變量構(gòu)成的隨機(jī)向量為X=(X1, X2, , Xp),設(shè) X 的均值向量為,協(xié)方差矩陣為。設(shè)Y=(Y1, Y2 , , Yp)為對 X 進(jìn)行線性變換得到的合成隨機(jī)向量,即 (13.1.1) 設(shè)i=(i1, i2 , , ip),( ), A=(1 , 2 , p),則有 (13.1.2),4,且 (13.1.3) 由式(13.1.1)和式(13.1.2)可以看出,可以對原始變量
3、進(jìn)行任意的線性變換,不同線性變換得到的合成變量Y的統(tǒng)計(jì)特征顯然是不一樣的。每個(gè)Yi 應(yīng)盡可能多地反映 p 個(gè)原始變量的信息,通常用方差來度量“信息”,Yi 的方差越大表示它所包含的信息越多。由式(13.1.3)可以看出將系數(shù)向量i 擴(kuò)大任意倍數(shù)會使Yi 的方差無限增大,為了消除這種不確定性,增加約束條件:,5,為了有效地反映原始變量的信息,Y的不同分量包含的信息不應(yīng)重疊。綜上所述,式(13.1.1)的線性變換需要滿足下面的約束: (1) ,即 ,i =1, 2, , p。 (2) Y1在滿足約束 (1) 即的情況下,方差最大;Y2是在滿足約束(1) ,且與Y1不相關(guān)的條件下,其方差達(dá)到最大;Y
4、p是在滿足約束(1) ,且與Y1,Y2,Y p-1不相關(guān)的條件下,在各種線性組合中方差達(dá)到最大者。 滿足上述約束得到的合成變量Y1, Y2, , Yp分別稱為原始變量的第一主成分、第二主成分、第 p 主成分,而且各成分方差在總方差中占的比重依次遞減。在實(shí)際研究工作中,僅挑選前幾個(gè)方差較大的主成分,以達(dá)到簡化系統(tǒng)結(jié)構(gòu)的目的。,6,13.1.2 總體主成分求解及其性質(zhì) 13.1.1節(jié)中提到主成分分析的基本思想是考慮合成變量的方差大小及其對原始變量波動(方差)的貢獻(xiàn)大小,而對于原始隨機(jī)變量X1,X2,Xp,其協(xié)方差矩陣或相關(guān)矩陣正是對各變量離散程度和相關(guān)程度的度量。在實(shí)際求解主成分時(shí),一般從原始變量
5、的協(xié)方差矩陣或相關(guān)矩陣的結(jié)構(gòu)分析出發(fā)。,7,1從協(xié)方差矩陣出發(fā)求解主成分 設(shè)1是任意 p1向量,求解主成份就是在約束條件 下,求 X 的線性函數(shù) 使其方差 達(dá)到最大,即達(dá)到最大,且 ,其中 是隨機(jī)變量向量X =(X1, X2, , Xp)的協(xié)方差矩陣。設(shè)1 2 p 0 為 的特征值,e1 , e2 , ep為 矩陣各特征值對應(yīng)的標(biāo)準(zhǔn)正交特征向量,則對于任意的ei 和 ej,有 (13.1.4) 且 (13.1.5),8,因此 (13.1.6) 當(dāng)1 = e1 時(shí)有 (13.1.7) 此時(shí) 達(dá)到最大值為1。同理有 并且 (13.1.8),9,由上述推導(dǎo)得 (13.1.9) 可見Y1, Y2, ,
6、 Yp 即為原始變量的 p 個(gè)主成份。因此,主成分的求解轉(zhuǎn)變?yōu)榍?X1, X2, , Xp 協(xié)方差矩陣 的特征值和特征向量的問題。,10,主成份的性質(zhì) 性質(zhì)1 Y的協(xié)方差矩陣為對角陣,即 (13.1.10) 性質(zhì)2 設(shè)=(ij)pp是隨機(jī)變量向量 X 的協(xié)方差矩陣,可得 即,11,由此可見,主成分分析是把 p 個(gè)隨機(jī)變量的總方差分解為 p 個(gè)不相關(guān)隨機(jī)變量的方差之和1 2 P,則總方差中屬于第 i 個(gè)主成分(被第 i 個(gè)主成分所解釋)的比例為 (13.1.12) 稱為第 i 個(gè)主成分的貢獻(xiàn)度。定義 (13.1.13) 稱為前 m 個(gè)主成分的累積貢獻(xiàn)度,衡量了前 m 個(gè)主成份對原始變量的解釋程度
7、。,12,性質(zhì)3記第k個(gè)主成分 Yk 與原始變量 Xi 的相關(guān)系數(shù)為r(Yk,Xi),稱為因子載荷,或者因子負(fù)荷量,則有 (13.1.14),13,3從相關(guān)矩陣出發(fā)求解主成分 在實(shí)際應(yīng)用時(shí),為了消除原始變量量綱的影響,通常將數(shù)據(jù)標(biāo)準(zhǔn)化。考慮下面的標(biāo)準(zhǔn)化變化,令 (13.1.15) 其中i,ii 分別表示隨機(jī)變量 Xi 的期望與方差,則,14,原始變量的相關(guān)矩陣就是原始變量標(biāo)準(zhǔn)化后的協(xié)方差矩陣,因此,由相關(guān)矩陣求主成分的過程與由協(xié)方差矩陣求主成分的過程是一致的。如果仍然采用(i ,ei)表示相關(guān)矩陣R對應(yīng)的特征值和標(biāo)準(zhǔn)正交特征向量,根據(jù)式(13.1.9)有: (13.1.17) 由相關(guān)矩陣求得的
8、主成分仍然滿足性質(zhì)13。性質(zhì)3可以進(jìn)一步表示為: (13.1.18),15,13.1.3 樣本的主成分 1樣本統(tǒng)計(jì)量 在實(shí)際工作中,我們通常無法獲得總體的協(xié)方差矩陣和相關(guān)矩陣R。因此,需要采用樣本數(shù)據(jù)來估計(jì)。設(shè)從均值向量為,協(xié)方差矩陣為 的 p 維總體中得到的 n 個(gè)樣本,且樣本數(shù)據(jù)矩陣為 (13.1.19),16,則樣本協(xié)方差矩陣為: (13.1.20) 其中: (13.1.21) 樣本相關(guān)矩陣為: (13.1.22) 樣本協(xié)方差矩陣 S 是總體協(xié)方差矩陣 的無偏估計(jì)量,樣本相關(guān)矩陣 是總體相關(guān)矩陣 R 的估計(jì)量。,17,2樣本主成份及其性質(zhì) 由于采用相關(guān)矩陣和協(xié)方差矩陣求解主成分的過程基本
9、一致,因此本節(jié)僅介紹基于樣本相關(guān)矩陣求解主成分的過程。設(shè)樣本相關(guān)矩陣 的特征值為 ,且 與特征值相對應(yīng)的標(biāo)準(zhǔn)正交特征向量為 ,根據(jù)式(13.1.17)第 i 個(gè)樣本主成分可表示為: (13.1.23) 而且 (13.1.24) (13.1.25),18,且由式(13.1.16)和性質(zhì)2可得 (13.1.26) 則第i個(gè)樣本主成分的貢獻(xiàn)度為 ,前m個(gè)樣本主成份的累計(jì)貢獻(xiàn)度為 另外 (13.1.27),19,3主成份個(gè)數(shù)的確定 主成分分析的目的之一是減少變量的個(gè)數(shù),但是對于應(yīng)保留多少個(gè)主成分沒有確切的回答。通常需要綜合考慮樣本總方差的量、特征值的相對大小以及各成分對現(xiàn)實(shí)的闡述。一般所取 m 使得累
10、積貢獻(xiàn)率達(dá)到85%以上為宜。 另一個(gè)比較常用的可視的方法是碎石圖,首先將特征值 按照從大到小的順序進(jìn)行排列,碎石圖是特征值與相應(yīng)序號i的(i, )圖形,其中橫軸表示序號,縱軸表示特征值 。為了確定主成分的合適個(gè)數(shù),選擇碎石圖斜率變化較大的拐彎點(diǎn),通常在此序號之后的特征值取值比較小,則此序號作為主成分的個(gè)數(shù)。例如,圖13.1所示的碎石圖在 i=2 處拐彎,則 m 選擇2。第三個(gè)經(jīng)驗(yàn)的判斷方法是只保留那些方差大于1的主成分。,20,例13.1 宏觀經(jīng)濟(jì)景氣波動的主成分分析,本例從一批對景氣變動敏感,有代表的指標(biāo)中篩選出5個(gè)反應(yīng)宏觀經(jīng)濟(jì)波動的一致指標(biāo)組:工業(yè)增加值增速(iva)、工業(yè)行業(yè)產(chǎn)品銷售收入
11、增速(sr)、固定資產(chǎn)投資增速(if)、發(fā)電量增速(elec)和貨幣供應(yīng)量M1增速(m1),樣本區(qū)間從1998年1月2006年12月,為了消除季節(jié)性因素和不規(guī)則因素,采用X-12方法進(jìn)行季節(jié)調(diào)整。常用的方法是美國商務(wù)部采用的計(jì)算合成指數(shù)CI的方法。特別的,本例利用主成分分析降維的思想,提取主成分(PCA),并與合成指數(shù)CI的結(jié)果進(jìn)行比較。,21,13.3.1 EViews軟件中主成分分析的計(jì)算,本節(jié)以例13.1的數(shù)據(jù)為例,介紹EViews軟件中主成分分析的實(shí)現(xiàn)過程。首先將所涉及的變量建成一個(gè)組(g1),選擇組菜單的View/Principal Components.,出現(xiàn)如圖13.6所示的窗口
12、。在窗口中有兩個(gè)切換鈕:第一個(gè)鈕標(biāo)著Components,第二個(gè)鈕標(biāo)著Calculation,控制著組中各序列離差矩陣的計(jì)算和估計(jì)。默認(rèn)的,EViews完成主成分分析使用普通的(Pearson)相關(guān)矩陣,也可以在這個(gè)菜單下重新設(shè)定主成分的計(jì)算。,22,1Components選擇紐 Components按鈕用于設(shè)定顯示主成分和保存方差的特征值和特征向量。在Display對話框中可以以表的形式顯示特征值和特征向量,或者按照特征值的大小以線性圖的形式顯示,或者是載荷、得分的散點(diǎn)圖,或者兩個(gè)都顯示(biplot)。選擇不同的顯示方式,對話框中其余的內(nèi)容也會發(fā)生相應(yīng)的改變。,23,圖13.6 主成分估計(jì)
13、對話框(1),24,25,表頭描述了觀測值的樣本區(qū)間、計(jì)算離差矩陣的方法以及保留成分的個(gè)數(shù)(在這個(gè)例子中顯示了所有的5個(gè)主成分)。 表的第一部分概括了特征值(Value)、相應(yīng)特征值與后一項(xiàng)的差(Difference)、對總方差的累積解釋比例(Cumulative Proportion)等等。由于上述結(jié)果的計(jì)算采用相關(guān)矩陣,所以5個(gè)特征值之和等于5。第一個(gè)成分占總方差的72.94%,第二個(gè)成分占總方差的19.22%。前兩個(gè)成分占總方差的92.16%。 表的第二部分描述了線性組合的系數(shù),第一個(gè)主成分(標(biāo)為“PC1”)大約等于所有5個(gè)一致指標(biāo)的線性組合,它可以解釋為一般的經(jīng)濟(jì)景氣指數(shù)。 輸出的第三
14、部分表示計(jì)算的相關(guān)矩陣。,26,表13.1 一致指標(biāo)組的主成分分析結(jié)果,27,由表13.1可以看出,第1主成分的貢獻(xiàn)率為72.1%,已能較好地反映5個(gè)一致指標(biāo)的總體變動情況,而且根據(jù)它們的特征值可以發(fā)現(xiàn)第2個(gè)特征值開始明顯變小(小于1),碎石圖出現(xiàn)明顯的拐彎,同時(shí)為了討論方便,僅選擇m=1,提取第一個(gè)主成分反映經(jīng)濟(jì)變動。表13.1中已經(jīng)給出對應(yīng)的特征向量,根據(jù)式(13.1.23)可以得到對應(yīng)的主成分序列。,28,圖13.7 主成分估計(jì)對話框(2),如果在主對話框的Display部分選擇Eigenvalues plots,則顯示按順序排列的特征值的線性圖(碎石圖)。在對話框的下面將發(fā)生改變,可以
15、選擇顯示特征值(碎石圖)、特征值的差、方差累積貢獻(xiàn)率其中之一,或是全部。如圖13.7所示可以選擇任意的復(fù)選框。默認(rèn)的EViews僅顯示特征值排序的碎石圖。,29,30,圖13.8 主成分估計(jì)對話框(3),變量載荷圖(Variable loadings plot)給出對應(yīng)主成分的變量載荷系數(shù),從圖中可以看出如何根據(jù)原始變量合成新的主成分;成分得分圖(Component scores plot)顯示對應(yīng)于樣本區(qū)間內(nèi)的觀測值成分的得分值;biplot (Biplots (scores & loadings)則表示在一個(gè)圖中同時(shí)顯示載荷系數(shù)和得分值。,31,32,圖13.10 計(jì)算得分序列的設(shè)置對話框
16、,2. Calculation選擇鈕 在Type下拉菜單中選擇使用相關(guān)(Correlation)還是協(xié)方差(Covariance)矩陣。在Method下拉菜單中選擇計(jì)算方法:Ordinary, Ordinary (uncentered), Spearman rank-order or Kendalls tau-a, or Kendalls tau-b。在該對話框中,還可以設(shè)定計(jì)算使用的觀測值樣本。,33,圖13.9 保存得分序列的對話框,3保存得分序列 如果想保存主成分得分序列,直接從組(Group)菜單中選擇Proc/Make Principal Components.,則出現(xiàn)圖13.9所示
17、的對話框。,34,第一個(gè)選項(xiàng)是Scaling,用于選擇得分序列和載荷計(jì)算的權(quán)重。有4個(gè)選項(xiàng): Normalize loadings,Normalize scores,Symmetric weights和User loading weight,默認(rèn)的Normalize loadings,表示標(biāo)準(zhǔn)化載荷,使得所有觀測值得分對特征值有標(biāo)準(zhǔn)的比例;選擇Normalize scores,所有變量標(biāo)準(zhǔn)化為1;選擇Symmetric weights,將會有對稱的權(quán)重;選擇User loading weight,可以用戶自己定義權(quán)重。 然后需要輸入得分序列的名稱,在例13.1中,我們輸入第一主成分的名字“PA
18、C1”,用于保存第一個(gè)主成分。也可以根據(jù)需要保存對應(yīng)得分的載荷、特征值和特征向量。,35,圖13.2中的實(shí)線給出了由主成分分析的第一主成分表示的一致景氣指數(shù)(PCA),虛線給出的是由國際上常用的美國商務(wù)部計(jì)算合成指數(shù)的方法給出的一致合成指數(shù)(CI),可以發(fā)現(xiàn)二者的變化趨勢和轉(zhuǎn)折點(diǎn)幾乎完全相同,只是波動的幅度略有差異。進(jìn)一步表明:PCA指數(shù)不僅能夠反映景氣波動的變化趨勢和峰谷的轉(zhuǎn)折點(diǎn),而且還能反映波動的幅度。,圖13.2 第一主成分 (PCA,左坐標(biāo)), 一致合成指數(shù)(CI,右坐標(biāo)),36,13.2 因子分析,因子分析(factor analysis,簡稱FA)是主成分分析的推廣,相對于主成分分
19、析,因子分析更側(cè)重于解釋被觀測變量之間的相關(guān)關(guān)系或協(xié)方差之間的結(jié)構(gòu)。因子分析的思想源于1904年查爾斯斯皮爾曼(Charles Spearman)對學(xué)生考試成績的研究。研究多指標(biāo)問題時(shí)常常會發(fā)現(xiàn),這些指標(biāo)相關(guān)性形成的背景原因是各種各樣的,其中共同的原因稱為公共因子;每一個(gè)變量也含有其特定的原因,成為特定(特殊)因子。因子分析的實(shí)質(zhì)就是用幾個(gè)潛在的但不能觀察的互不相關(guān)的隨機(jī)變量去描述許多變量之間的相關(guān)關(guān)系(或者協(xié)方差關(guān)系),這些隨機(jī)變量被稱為因子。為了使得這些因子能很好的替代原始數(shù)據(jù),需要對這些因子給出合理的解釋。同時(shí)為了使用這些因子,還需要對提取結(jié)果進(jìn)行評價(jià)。,37,因此,可以簡單將因子分析的
20、目標(biāo)概括為以下幾方面: (1)首先考慮是否存在較少的不相關(guān)的隨機(jī)變量可用于描述原始變量之間的關(guān)系; (2)如果存在公共因子,那么究竟應(yīng)該選擇幾個(gè); (3)對提取的公共因子的含義進(jìn)行解釋; (4)評價(jià)每一個(gè)原始變量與公共因子之間的關(guān)系; (5)可以將這些公共因子用于其他的統(tǒng)計(jì)分析。 本節(jié)將從這幾個(gè)角度給出詳細(xì)的介紹。需要注意的是因子分析從一系列高度相關(guān)的原始變量矩陣X=(X1, X2 , , Xp)中提取少數(shù)幾個(gè)不相關(guān)的因子,所以如果原始變量之間不相關(guān)則沒有必要進(jìn)行因子分析。在實(shí)際研究和應(yīng)用中,為了消除觀察值之間由于量綱的差異而造成的影響,需要將觀測值按照式(13.1.15)進(jìn)行標(biāo)準(zhǔn)化處理。本節(jié)
21、的討論都是基于標(biāo)準(zhǔn)化后的序列,為了方便,把標(biāo)準(zhǔn)化后的隨機(jī)變量矩陣仍記為Z = (Z1, Z 2, , Zp)。,38,13.2.1 基本的因子分析模型,假如對某一問題的研究涉及 p 個(gè)指標(biāo),且這 p 個(gè)指標(biāo)之間存在較強(qiáng)的相關(guān)性,則基本的因子模型可以表示為 (13.2.1) 稱式(13.2.1)中F1, F2, , Fm為公共因子,1, 2, , p 表示特殊因子,其中包含了隨機(jī)誤差, i 只與第 i 個(gè)變量 Zi 有關(guān), lij 稱為第 i 個(gè)變量 Zi 在第 j 個(gè)因子 Fj 上的載荷(因子載荷),由其構(gòu)成的矩陣 L 稱為因子載荷矩陣。,39,式(13.2.1)進(jìn)一步可以表示為下面的矩陣形式
22、 (13.2.2) 其中,F(xiàn) = (F1, F2 , , Fm); = (1, 2 , , p)。注意式(13.2.1)中的F1, F2 , , Fm 是不可觀測的隨機(jī)變量,因此,必須對隨機(jī)變量 F 和 做一些假定,使得模型具有特定的且能驗(yàn)證的協(xié)方差結(jié)構(gòu)。,40,假設(shè) (13.2.3) (13.2.4) 且 F 與 獨(dú)立,即 (13.2.5) 滿足式(13.2.3)式(13.2.5)假定的模型(13.2.1)(或(13.2.2)稱為正交因子模型。,41,13.2.2 正交因子模型的性質(zhì),1正交因子模型的協(xié)方差結(jié)構(gòu) 假定隨機(jī)變量Z的協(xié)方差矩陣為,則有 (13.2.6) (13.2.7),42,2
23、因子載荷 lij 的意義 由式(13.2.7)可得 (13.2.8) 由于假定 Zi 和 Fj 都是方差為1的隨機(jī)變量,因此 lij 即為變量 Zi 與因子Fj 的相關(guān)系數(shù)。,43,3共同度與公因子的方差貢獻(xiàn) 由式(13.2.6)可得 令 則有 (13.2.9) 其中 hi2 反映了公共因子對 Zi 方差的貢獻(xiàn),稱為共性方差,或者變量共同度。i 稱為特殊方差,或者剩余方差。,44,式(13.2.9)表明, hi2 接近1時(shí),i 接近 0,說明 Zi 包含的幾乎全部信息都可以被公因子解釋;當(dāng) hi2 接近 0 時(shí),表明公共因子對 的影響不大,主要由特殊因子描述。因此, hi2 也反映了變量 Zi
24、 對公共因子的依賴程度。與此類似,矩陣 L 的第 j 列元素反映了第 j 個(gè)因子 Fj 對所有變量 Z 的影響,記為 (13.2.10) 稱為公共因子Fj 對原始變量向量 Z 的方差貢獻(xiàn),是衡量公共因子相對重要性的一個(gè)尺度,其值越大反映 Fj 對原始變量向量 Z 的方差貢獻(xiàn)也越大。,45,13.2.3 因子載荷的估計(jì)方法,因子分析的首要步驟是先確定因子載荷,或估計(jì)得到因子載荷矩陣L,注意在式(13.2.1)和式(13.2.2)中的F1, F2, , Fm是不可觀測的隨機(jī)變量,因此因子載荷矩陣L的估計(jì)方法都比較復(fù)雜,常用的方法有極大似然法、主成分法、迭代主成分方法、最小二乘法、 因子提取法等。,
25、46,1極大似然法 如果假設(shè)公共因子 F 和特殊因子 服從正態(tài)分布,即F Nm(0, I), Np(0, ),X1, X2, , Xp 的均值為 = (1, 2 , , p) ,則觀測值 X1, X2, , Xp 為來自正態(tài)總體 Np(, ) 的樣本,可以采用極大似然法估計(jì)因子載荷矩陣和特殊方差,似然函數(shù)是 和 的函數(shù) L( , )。 由于 ,因此似然函數(shù)可以更清楚地表示為L( , L, ),記( , L, )的估計(jì)量為 ,則有 (13.2.11),47,2主成分方法 用主成分法確定因子載荷,就是對隨機(jī)變量進(jìn)行主成分分析,把前面幾個(gè)主成分作為原始公共因子。其具體過程如下,設(shè)有 p 個(gè)變量 Z
26、= (Z1, Z2 , , Zp),可以求得從大到小排序的 p 個(gè)主成分Y1,Y2,Yp,根據(jù)13.1節(jié)的內(nèi)容可知,原始變量與主成分之間存在如下的關(guān)系: (13.2.13),48,由于A =(1, , , p)= (e1, e2, , ep) 為正交矩陣,則有 (13.2.14) 如果在式(13.2.13)中僅取前m個(gè)主成分,把其余的 p-m 個(gè)主成分用特殊因子i 代替,則式(13.2.13)可以表示為 (13.2.15) 式(13.2.15)與式(13.2.1)的形式一致,Yi 表示主成分,因此相互獨(dú)立。,49,為了使 Yi 符合式(13.2.3)假設(shè)的公共因子,需要將主成分Yi 的方差轉(zhuǎn)變
27、為1。由13.1節(jié)的介紹可知,主成分方差為特征根 i,只需要將 Yi 除以標(biāo)準(zhǔn)差 即可,令 , (13.2.16) 則式(13.2.15)轉(zhuǎn)變?yōu)椋?(13.2.17) 式(13.2.15)已與式(13.2.1)不僅在形式上一致,而且完全符合式(13.2.3)式(13.2.5)的假設(shè)。由此就得到因子載荷矩陣和一組初始公共因子。,50,3迭代主成分方法(Iterated Principal Factors) 迭代主成分方法也叫主因子法,或主軸因子方法,是對主成分法的一種修正。首先對原始變量進(jìn)行標(biāo)準(zhǔn)化處理,其相關(guān)矩陣與協(xié)方差矩陣一致,使其因子模型滿足式(13.2.1),根據(jù)式(13.2.6)有 (1
28、3.2.18) 令 (13.2.19) 稱R*為調(diào)整相關(guān)矩陣,或約相關(guān)矩陣。不妨設(shè)特殊因子i 的方差的初始估計(jì)為i*,則有hi*2 = 1- i* ,且相應(yīng)的樣本相關(guān)矩陣為 ,則對應(yīng)的約相關(guān)矩陣為 (13.2.20),51,設(shè) 的前m個(gè)特征值依次為1* 2* m* 0,相應(yīng)的正交單位特征向量為e1* , e2*, em*,則對應(yīng)的因子載荷矩陣 L 的解為 (13.2.21) 根據(jù)式(13.2.21)和式(13.2.18),可以進(jìn)一步得到特殊因子方差的最終估計(jì)量為 , (13.2.22) 如果希望得到擬合程度更好的解,則可以采用迭代的方法,即利用式(13.2.22)得到的特殊因子方差估計(jì)量帶入式
29、(13.2.20)重復(fù)上述步驟,直到所求解比較穩(wěn)定為止。,52,下面介紹幾種求特殊因子方差和公共因子方差初始估計(jì)的幾種常用方法: (1)復(fù)合相關(guān)系數(shù)(squared multiple correlations,簡稱SMC)方法 SMC是比較常用的一種方法,令 ,其中rii是 的第i個(gè)對角元素,此時(shí)公共因子方差的估計(jì)值為 它表示 Xi 與其他 p-1 個(gè)解釋變量之間的復(fù)相關(guān)系數(shù)。 (2)最大相關(guān)系數(shù)方法(max absolute correlation) 最大相關(guān)系數(shù)方法是用第 i 個(gè)變量 Xi 與其他變量相關(guān)系數(shù)絕對值的最大值來估計(jì),即令 ,其中 rij 表示第 i 個(gè)變量 Xi 與第 j 個(gè)
30、變量 Xj 的相關(guān)系數(shù)。,53,(3)對角線比例方法(fraction of diagonals) 該方法使用相關(guān)矩陣(或協(xié)方差矩陣)對角線元素的固定比例 。特殊的可以取 =1,此時(shí)結(jié)果等同于主成分求解得到的結(jié)果。 (4)分塊的協(xié)方差矩陣估計(jì)方法(partitioned covariance,簡稱PACE) 由于第3種方法PACE的估計(jì)量是非迭代的,因此,比較適合為迭代估計(jì)方法提供初值。 (5)特殊的直接取 ,則 i*=0,此時(shí)得到的 也是一個(gè)主成分解。,54,13.2.4 因子數(shù)目的確定方法及檢驗(yàn) 上述求解過程中重要的是如何確定公因子數(shù)目m,這是因子分析中最重要的一步。本小節(jié)將列出其中幾種常
31、用的方法 1因子數(shù)目的確定方法 (1) 最小特征值(Kaiser-Guttman Minimum Eigenvalue) Kaiser-Guttman規(guī)則也叫做“特征值大于1”方法,是最常用的一種方法。只需要計(jì)算離差矩陣(相關(guān)矩陣、協(xié)方差矩陣)的特征值,特征值超過平均值的個(gè)數(shù)作為因子個(gè)數(shù)。特別地,對于相關(guān)矩陣,特征值的均值為1,所以通常取特征值大于1的數(shù)作為公因子數(shù)。,55,(2) 總方差比例(Fraction of Total Variance) 選擇公因子個(gè)數(shù)m使得前m個(gè)特征值的和超過公因子總方差的某一門限值。這種方法多用于主成分分析方法,比較典型的是這些成分構(gòu)成總方差的95%(Jacks
32、on, 1993)。 (3) MAP方法(Minimum Average Partial) Velicer (1976) 提出的最小平均偏相關(guān)(簡稱MAP)方法原理是:給定m個(gè)成分(m = 0,1,p-1),計(jì)算偏相關(guān)系數(shù)平方的平均值,應(yīng)保留因子的個(gè)數(shù)是使得平均值最小化的個(gè)數(shù),56,(4) 分割線段(Broken Stick) 分割線段模型的基本原理是:首先,計(jì)算離差矩陣中第j個(gè)最大特征值對方差的貢獻(xiàn)度,然后計(jì)算從分割線段分布得到的相應(yīng)的期望值 。當(dāng)前者超過后者時(shí),所對應(yīng)的j即為應(yīng)該保留的因子個(gè)數(shù)(Jackson, 1993)。 (5) 平行分析(Parallel Analysis) 平行分析
33、模擬使用的數(shù)據(jù)與原始數(shù)據(jù)有著相同方差和觀測值個(gè)數(shù),是由隨機(jī)生成器生成的獨(dú)立隨機(jī)變量數(shù)據(jù)集。計(jì)算模擬數(shù)據(jù)的Pearson協(xié)方差和相關(guān)矩陣及其特征值。只要原始數(shù)據(jù)的特征值超過模擬數(shù)據(jù)的對應(yīng)值,相應(yīng)的個(gè)數(shù)將作為保留因子數(shù),57,2公共因子個(gè)數(shù)的大樣本檢驗(yàn) 采用極大似然估計(jì)模型時(shí),假設(shè)公共因子和特殊因子均服從正態(tài)分布,而正態(tài)分布的假定,可以幫助我們構(gòu)造模型充分性的檢驗(yàn)。設(shè)提取m個(gè)公共因子的模型成立,則檢驗(yàn)m個(gè)公共因子的充分性等價(jià)于檢驗(yàn) (13.2.27) 對應(yīng)的備擇假設(shè) H1 為 是任意其他的正定矩陣。,58,在原假設(shè)成立的條件下可以構(gòu)造下面的似然比統(tǒng)計(jì)量 (13.2.28) 其中 Sn 表示協(xié)方差矩
34、陣的極大似然估計(jì); ,其中 和 分別表示 L 和 的極大似然估計(jì)量,而 是 的極大似然估計(jì)量。式(13.2.28)的統(tǒng)計(jì)量服從2分布。 特別的,Bartlett在1954年證明了-2ln抽樣分布的 2近似可以用多重因子(n-1- (2p+4m+5)/6)代替式(13.2.28)中的n。,59,利用Bartlett修正,只要n和n- p大,若 (13.2.29) 則在顯著性水平 下拒絕原假設(shè) H0,認(rèn)為 m 個(gè)因子是不充分的。式(13.2.29)表示的2統(tǒng)計(jì)量也稱為Bartlett2統(tǒng)計(jì)量。由于式(13.2.29)中的自由度必須大于0,進(jìn)一步化簡可以得到 (13.2.30) 在選擇 m 時(shí),必須
35、根據(jù)上述方法進(jìn)行判斷模型的充分性。,60,例13.2 紐約股票交易所股票收益率的因子分析(1),曾有學(xué)者研究了紐約票股交易所的5只股票(阿萊德化學(xué)(allied)、杜邦(dupont)、聯(lián)合碳化物(union)、??松?exxon)和德士古(texaco))從1975年1月到1976年12月期間周回報(bào)率之間的關(guān)系(數(shù)據(jù)見本章附錄)。周回報(bào)率定義為(本周五收盤價(jià)-上周五收盤價(jià))/上周五收盤價(jià),如有拆股或支付股息時(shí)進(jìn)行相應(yīng)調(diào)整。連續(xù)100周的觀測值表現(xiàn)出獨(dú)立同分布,但是各股之間的回報(bào)率受總體經(jīng)濟(jì)狀況的影響,也存在相關(guān)關(guān)系。表13.2給出各指標(biāo)的相關(guān)矩陣。,61,表13.2 各指標(biāo)的相關(guān)矩陣,從表1
36、3.2可以看出各股收益率之間存在一定的相關(guān)性,本例采用因子分析計(jì)算其因子載荷矩陣、公共方差、剩余方差以及相應(yīng)的貢獻(xiàn)度。,62,13.3.2 因子分析的實(shí)現(xiàn) EViews中因子分析的實(shí)現(xiàn)是通過因子對象完成的。從工作文件的窗口選擇Object/New Object,選中Factor;或者選中相應(yīng)的序列,單擊右鍵,選擇Open/as Factor.;或者打開一個(gè)已經(jīng)存在的組對象,選擇Proc/Make Factor.;或者在命令窗口輸入關(guān)鍵詞factor,都會彈出圖13.12所示的因子分析設(shè)定對話框。從圖中可以看出,因子設(shè)定對話框也包含兩個(gè)切換鈕:Data和Estimation。,63,圖13.12
37、 因子設(shè)定對話框,64,1Estimation 選擇鈕 Estimation標(biāo)簽用于控制主要的估計(jì)設(shè)置(圖13.11),其中主要包括估計(jì)方法、因子個(gè)數(shù)設(shè)定、初始貢獻(xiàn)率以及其他屬性4個(gè)方面的設(shè)置。 (1) 估計(jì)方法(Method) 在Method的下拉菜單中,EViews提供了多種估計(jì)方法:極大似然估計(jì)法、廣義最小二乘法、不加權(quán)最小二乘法、主成分分析法、迭代主成分分析法以及非迭代的分區(qū)協(xié)方差估計(jì)方法(PACE)。選擇不同的方法,在右邊的屬性部分將會顯示不同的設(shè)置。,65,(2) 因子數(shù)(Number of factors) EViews提供了很多的方法選擇因子數(shù),各種方法的簡要概括可參考13.2
38、.4節(jié)的介紹。默認(rèn)的,EViews使用Velicer的minimum average partial(MAP)方法。實(shí)證模擬結(jié)果表明:MAP和平行分析方法比起其他常用的方法來更精確。可以根據(jù)需要選擇不同的方法,但是頁面也會發(fā)生相應(yīng)的改變。 (3) 公共方差的初值 (Initial Communalities) 大部分估計(jì)方法都需要公共方差的原始估計(jì)。例如,對主成分估計(jì)方法,初始的公共方差是構(gòu)建估計(jì)的基礎(chǔ)。在EViews中可以從Initial communalities的下拉菜單中選擇不同的方法。,66,(4) 估計(jì)選項(xiàng)(Opition),估計(jì)屬性主要包括對迭代控制、scaling、隨機(jī)數(shù)生成器
39、以及Heywood情況的選擇和設(shè)置。選中Scale estimates to match observed variances復(fù)選框,可控制剩余方差和公共方差之和等于離差矩陣的對角元素。 在迭代主因子估計(jì)的過程中,可能會遇到被估計(jì)公因子方差暗含至少一個(gè)剩余方差小于等于0,這種情況就是通常所說的Heywood情況。當(dāng)EViews在計(jì)算中遇到Heywood情況時(shí),有幾種方法是可選擇的。默認(rèn)的,EViews將停止迭代,并給出最后的估計(jì)(Stop and report final),同時(shí)指出結(jié)果可能是不適合的;或者EViews報(bào)告前一次的迭代結(jié)果(Stop and report last);或者結(jié)果為
40、0,繼續(xù)(Set to zero, continue);或者忽略負(fù)的方差,繼續(xù)(Ignore and continue)。,67,2Data 選擇鈕,點(diǎn)擊Data按鈕,出現(xiàn)圖13.13所示的窗口,該窗口分為兩部分協(xié)方差設(shè)置和協(xié)方差屬性。,圖13.13 因子分析的數(shù)據(jù)設(shè)定對話框,68,(1) 類型(Type) 協(xié)方差設(shè)置的第一項(xiàng)是Type下拉菜單,主要用于確定因子分析是基于協(xié)方差矩陣還是相關(guān)矩陣,或者采用用戶已經(jīng)根據(jù)相關(guān)測量方法定義的矩陣(User-matrix) (2) 方法(Method) 可以用Method下拉菜單設(shè)定計(jì)算相關(guān)矩陣(或協(xié)方差矩陣)的方法:普通Pearson協(xié)方差、非中心協(xié)方
41、差、斯皮爾曼秩協(xié)方差(Spearman rank-order covariances)和Kendalls tau(肯德爾)相關(guān)測量。,69,(3) 變量(Variables) 在該框中應(yīng)列出用于因子分析的序列名稱,或包含這些序列的組名。 (4) 樣本(Sample) 該項(xiàng)主要用于設(shè)定用于分析的觀測值的樣本,同時(shí)表明是否希望樣本是均衡的。默認(rèn)的,如果遇到缺失數(shù)據(jù),EViews將刪除相關(guān)變量中的缺失數(shù)據(jù)。,70,(5) 偏相關(guān)或偏協(xié)方差(Partialing) 偏相關(guān)和偏協(xié)方差可用于一對變量的分析,只需在相應(yīng)的編輯框中列出變量名稱。偏協(xié)方差或偏相關(guān)的分析不支持因子得分的計(jì)算,在這種選擇下要計(jì)算因子
42、得分,同樣也需要使用用戶設(shè)定矩陣估計(jì)模型。 (6) 權(quán)重(Weighting) 當(dāng)選擇使用加權(quán)方法時(shí),將會提示需要輸入權(quán)重序列的名稱。有5種不同的權(quán)重選擇:頻率、方差、標(biāo)準(zhǔn)偏差、比例方差和比例標(biāo)準(zhǔn)偏差。 (7) 自由度修正 可以選擇使用極大似然估計(jì)量或者自由度修正規(guī)則計(jì)算協(xié)方差。默認(rèn)的,EViews計(jì)算(沒有自由度修正的)ML估計(jì)的協(xié)方差。,71,(8) 用戶設(shè)定矩陣 如果在Type下拉菜單中選擇User-matrix,對話框?qū)l(fā)生改變。依次輸入矩陣名稱,這個(gè)矩陣應(yīng)該是方陣,并且是對稱的,但是對稱不是必須的;然后輸入一個(gè)標(biāo)量表示觀測值的數(shù),或者一個(gè)矩陣,它包含表示觀測值數(shù)目的一對數(shù);最后,列
43、名(C)主要是為結(jié)果提供標(biāo)簽,如果不填寫此項(xiàng),變量將以“V1”, “V2”的形式顯示,不需要為所有的列提供名字,默認(rèn)地名字將按照提供的順序被替代。,72,下面給出例13.2采用主成分方法求解m=2時(shí)的結(jié)果,因子個(gè)數(shù)設(shè)置為2,其他選項(xiàng)都采用默認(rèn)設(shè)置,其結(jié)果如下:,公共方差 ,剩余方差 =1-0.50 =0.50。其它相對應(yīng)的公共方差和剩余方差以此類推。從表13.3中可以發(fā)現(xiàn)所有股票都高度依賴于F 1 ,且載荷都差不多相等,可稱之為市場因子,代表總的經(jīng)濟(jì)條件。而在因子F 2上,化學(xué)類股票在此因子上均有負(fù)載荷,石油類股票在此因子上有正的載荷,表明因子F2 將不同行業(yè)股票加以區(qū)分,稱為行
44、業(yè)因子。,73,同時(shí)比較極大似然估計(jì)和主成分估計(jì)的結(jié)果可以發(fā)現(xiàn):同樣在因子F1上有大的正的載荷,稱為市場因子;而因子F2的結(jié)果與主成分分析載荷的符號正好相反,同樣也是區(qū)分了行業(yè),因此也稱為行業(yè)因子。我們需要進(jìn)一步通過因子旋轉(zhuǎn)才能發(fā)現(xiàn)有用的因子模式。,例13.3 影響我國物價(jià)波動多因素的因子分析(1),隨著我國市場化程度的深化以及經(jīng)濟(jì)全球化進(jìn)程的加快,我國物價(jià)的波動不僅反映了國內(nèi)市場中總供給和總需求的矛盾,而且受國際經(jīng)濟(jì)的影響,尤其是國際市場價(jià)格的影響也越來越大。受國內(nèi)經(jīng)濟(jì)波動、居民收入及財(cái)富變化、生產(chǎn)成本價(jià)格上漲、國際石油、糧食等原材料價(jià)格的影響使得我國物價(jià)的波動變得極其復(fù)雜。由于物價(jià)的波動不
45、是取決于某一種因素,或某幾個(gè)指標(biāo),而是受多方面因素的影響,此時(shí)簡單的多元回歸分析已經(jīng)無法滿足分析的需要。 本例選擇15個(gè)經(jīng)濟(jì)變量,采用因子分析方法分析各因素對物價(jià)波動的影響,樣本區(qū)間為2000年1季度2008年3季度。采用主成分方法(Principal Factors)求解,按照特征根大于1的準(zhǔn)則,選取因子數(shù)目 m=4,求解結(jié)果如表13.5。,剩余 方差,表13.5 影響物價(jià)波動多因素的因子分析結(jié)果,從表13.5中可以看出:4個(gè)公因子對原始變量方差的累計(jì)貢獻(xiàn)率為85.89%,可見通過因子分析實(shí)現(xiàn)了將15維數(shù)據(jù)變量降至4維的目的。采用表13.5的信息還可以得到各變量對應(yīng)的公共方差和剩余方差,如對
46、于第一個(gè)變量, =1-0.91 =0.09。其它變量相對應(yīng)的公共方差和剩余方差以此類推。同時(shí),通過表13.5各公因子的載荷可以看出:代表成本因素的各上游價(jià)格指數(shù)在公因子F1上有較高的載荷,可稱為成本因子;而代表居民需求增長的兩個(gè)收入變量在公因子F3上有較高的載荷,可稱為需求因子;而表示貨幣因素的3個(gè)變量在公因子F2上有較高的載荷,可稱為貨幣因子;而代表財(cái)富變化的股票指數(shù)在公因子F4上有較高的載荷,稱為財(cái)富因子。但還有一些變量的載荷并不是很明確,我們可以通過因子旋轉(zhuǎn)得到實(shí)際意義更加明確的因子模式。,77,13.2.5 因子旋轉(zhuǎn),因子分析的目的不僅是求出公共因子,更重要的是知道每個(gè)公共因子的實(shí)際意
47、義,以便對所研究的問題作出進(jìn)一步的分析。公共因子是否容易解釋,很大程度上取決于因子載荷矩陣 L 的元素結(jié)構(gòu)。假設(shè)因子載荷矩陣 L 是基于相關(guān)矩陣得到的,則其所有元素均在 -1 到 1 之間,如果 L 的所有元素都接近 0 或1,公共因子的含義就容易解釋了,否則公因子含義將含糊不清。,78,設(shè)L是通過某種方法估計(jì)得到的因子載荷矩陣,令 且 (13.2.31) (13.2.32) 式(13.2.31)和式(13.2.32)表明因子載荷矩陣是不唯一的,對一任意正交陣 T, 也是一個(gè)因子載荷矩陣。因此,實(shí)際中求得一個(gè)載荷矩陣 之后,可通過右乘正交陣 T,使 更具有實(shí)際意義,這種變換載荷矩陣的方法稱為因
48、子軸旋轉(zhuǎn)。因子的旋轉(zhuǎn)方法有正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)。正交旋轉(zhuǎn)與斜交旋轉(zhuǎn)區(qū)別就在于:正交旋轉(zhuǎn)得到的新公共因子仍然是相互獨(dú)立的,但斜交旋轉(zhuǎn)則放寬了這一限制。,79,正交矩陣 T 的不同選取法構(gòu)成了正交旋轉(zhuǎn)的各種不同方法,如最大方差旋轉(zhuǎn)法(Varimax)、全體旋轉(zhuǎn)(變量和因子同時(shí)旋轉(zhuǎn),Equamax)、四分旋轉(zhuǎn)(Quartimax)等。最常采用的是最大方差旋轉(zhuǎn)法,其旋轉(zhuǎn)目的是使得因子載荷矩陣的元素取值盡可能地向兩極分化,部分元素取盡可能大的值,部分元素盡量接近零值。 本節(jié)主要介紹最大方差旋轉(zhuǎn)法,其基本思想如下:,80,先考慮兩個(gè)因子(m=2)的平面正交旋轉(zhuǎn),設(shè)因子載荷矩陣為 (13.2.33) 取正交矩
49、陣為 其中 表示坐標(biāo)平面上因子軸旋轉(zhuǎn)的角度,則 (13.2.34),81,當(dāng)公共因子個(gè)數(shù)大于2時(shí),可以逐次對每兩個(gè)進(jìn)行上述的旋轉(zhuǎn),如果存在m個(gè)公共因子,則需要進(jìn)行 次變換,這樣就完成一輪旋轉(zhuǎn)。如果旋轉(zhuǎn)完畢,并不能認(rèn)為已經(jīng)達(dá)到預(yù)期的效果,可以在第一輪所得結(jié)果基礎(chǔ)上繼續(xù)上述旋轉(zhuǎn)過程,可得第二輪旋轉(zhuǎn)結(jié)果。每一次旋轉(zhuǎn)以后,所得載荷矩陣各列平方的相對方差之和總會比上一次有所增加,而另一方面由于載荷矩陣每一個(gè)元素的絕對值均不大于1,因此,其方差最終一定會收斂于某一個(gè)極限。實(shí)際中,通常經(jīng)過若干次旋轉(zhuǎn)以后,如果總方差改變不大,則可以停止旋轉(zhuǎn)。,82,13.3.3 因子旋轉(zhuǎn)的操作,為了使得因子具有實(shí)際的意義,可
50、以對初始回歸的結(jié)果進(jìn)行因子旋轉(zhuǎn)。在EViews中簡單地點(diǎn)擊因子對象工具條中的Rotate按鈕,或者選擇Proc/Rotate.,都可以調(diào)用Factor Rotation對話框,如圖13.14。,圖13.14 因子旋轉(zhuǎn)設(shè)定對話框,83,Type和Method下拉菜單可用于設(shè)定基本的選轉(zhuǎn)類型和方法,其中的一些方法,可能需要輸入一些參數(shù)值。默認(rèn)的,在旋轉(zhuǎn)前,EViews不列出載荷權(quán)重。為了標(biāo)準(zhǔn)化數(shù)據(jù),可以點(diǎn)擊Row weight下拉菜單選擇Kaiser或者Cureton-Mulaik。 另外,如果沒有旋轉(zhuǎn)載荷,EViews自動使用單位矩陣作為旋轉(zhuǎn)迭代的初值。也可以在Starting values下拉
51、菜單中選擇合適的方式,如Random或User-specified。如果已經(jīng)完成一次旋轉(zhuǎn),也可以使用已經(jīng)存在的結(jié)果作為下一次旋轉(zhuǎn)的初值。 設(shè)置完畢單擊OK即可。EViews的估計(jì)結(jié)果將列出旋轉(zhuǎn)的載荷、因子相關(guān)關(guān)系、因子旋轉(zhuǎn)矩陣、旋轉(zhuǎn)后的載荷矩陣和旋轉(zhuǎn)目標(biāo)函數(shù)值。EViews會把結(jié)果保存在因子對象中,從因子對象中選擇View/Rotation Results,可以隨時(shí)查看旋轉(zhuǎn)結(jié)果的輸出表。,84,例13.4 紐約股票交易所股票收益率的因子分析(2),從因子旋轉(zhuǎn)后結(jié)果可以看出石油股票(德士古和??松┰谝蜃覨1有較高的載荷,而化學(xué)股票(阿萊德化學(xué)、杜邦、聯(lián)合碳化物)在因子 F2有較高的載荷。進(jìn)一步
52、表明正交化的因子旋轉(zhuǎn)將行業(yè)區(qū)分開,因子 F1 代表引起石油股票波動的獨(dú)特的經(jīng)濟(jì)力量,因子F2 代表引起化學(xué)股票波動的獨(dú)特的經(jīng)濟(jì)力量。在例13.3中表示一般市場因子的 F1被破壞了。,例13.5 影響我國物價(jià)波動多因素的因子分析(2),本例對例13.3的結(jié)果采用方差最大化的正交旋轉(zhuǎn)方法進(jìn)行因子旋轉(zhuǎn),希望得到更好的結(jié)果,本例進(jìn)行了兩次旋轉(zhuǎn)以后,總方差變化不大,結(jié)束旋轉(zhuǎn)。旋轉(zhuǎn)后的公共因子記為 (i=1,2,4),相應(yīng)的載荷記為 ,其結(jié)果如表13.7所示。,表13.7 影響物價(jià)波動多因素的因子分析旋轉(zhuǎn)后的結(jié)果,從表13.7旋轉(zhuǎn)后的各公因子的載荷可以看出各因子所代表的意義更明確:代表成本因素的各上游價(jià)格
53、指數(shù)和G7_ PPI的變化在公因子F1上有較高的載荷,可稱 F1為成本因子,同時(shí)也表明我國價(jià)格的變化,尤其是原材料類價(jià)格的變化和國際PPI的變化有較高的相關(guān)性;而代表居民需求增長的兩個(gè)收入變量在公因子F3上有最高的載荷,可稱 F3為需求因子;而表示包括GDP增長率在內(nèi)的貨幣因素在公因子F2上的載荷都是最大的,可稱 F2為貨幣因子;而代表財(cái)富變化的股票指數(shù)和表示國際經(jīng)濟(jì)形勢的G7_GDP指數(shù)同比增速在公因子F4上載荷最大,稱為財(cái)富因子和國際經(jīng)濟(jì)因子。通過觀察旋轉(zhuǎn)后的因子載荷,可以發(fā)現(xiàn)各因子所代表實(shí)際意義更明確。 本例主要考察物價(jià)波動,通過觀察可以發(fā)現(xiàn)CPI在各公因子的載荷分別為0.77、0.08
54、、0.54和0.12,可見代表成本和需求變動的因子和對CPI變化的解釋能力是最強(qiáng)。,88,13.2.6 因子得分,前面介紹了如何獲得公共因子和估計(jì)因子載荷矩陣,但有時(shí)候需要把公共因子表示成原始變量的線性組合,對每個(gè)樣本計(jì)算公共因子的估計(jì)值,也就是求因子得分,因子得分可以作為進(jìn)一步分析的原始數(shù)據(jù)。例如:對學(xué)生的各科成績進(jìn)行分析,可發(fā)現(xiàn)依賴于兩個(gè)因子全面智力和適應(yīng)開閉卷的能力,實(shí)際中我們不僅僅希望歸納出影響學(xué)生成績的因子,而且希望知道每一個(gè)學(xué)生對這兩種能力作出什么評價(jià),或者說他在這兩個(gè)公共因子上應(yīng)打多少分。這就需要求解個(gè)體在公共因子上的得分。下面介紹兩種常用的因子得分估計(jì)方法。,89,1加權(quán)最小二
55、乘法 對于因子模型 (13.2.40) 因子載荷矩陣L及特殊因子方差陣是已知的,可以假定特殊因子 是誤差。如果 var(i) = i 對于i = 1, 2, , p 不全相等,巴特萊特(Bartlett,1937)建議采用加權(quán)最小二乘法。采用誤差方差的倒數(shù)作為權(quán)系數(shù),則誤差平方的加權(quán)和可以表示為: (13.2.41),90,選擇F的估計(jì)值使得式(13.2.41)最小化,其解為: (13.2.42) 當(dāng)采用極大似然法求解因子載荷矩陣時(shí),需要滿足唯一性條件: L L是對角矩陣。若對原載荷矩陣改用旋轉(zhuǎn)后的載荷矩陣L*=LT,則相應(yīng)的因子得分可表示為 。 如果采用主成分分析方法估計(jì)因子載荷矩陣,習(xí)慣上
56、采用未加權(quán)的最小二乘過程生成因子得分,則因子得分為 (13.2.43),91,2回歸法 仍然考慮因子模型(13.2.2) (13.2.44) 假設(shè)原始變量已標(biāo)準(zhǔn)化。在因子模型中也可以反過來將公共因子表示為變量的線性組合,建立公因子 F 對變量 Z 的回歸方程: (13.2.45) 令 則 B 是需要估計(jì)的回歸系數(shù),但是 Fj 是不可觀測的。,92,由因子載荷的意義有: (13.2.46) 即 則有 ,其中R為樣本相關(guān)矩陣,于是公共因子的估計(jì)為: (13.2.47) 由樣本計(jì)算相關(guān)矩陣,并估計(jì)因子載荷矩陣即可求得因子得分的估計(jì)值。,93,3因子得分的評價(jià) 由于因子的不確定性,使得大量學(xué)者關(guān)注模型
57、估計(jì)結(jié)果評價(jià)的問題。Gorsuch (1983) 和 Grice(2001) 給出了關(guān)于下述測量方法的詳細(xì)討論。 (1)不確定性指標(biāo)(Indeterminacy Indices) 度量不確定性的指標(biāo)可以分為截然不同的兩類。第一類指標(biāo)測量每一個(gè)因子和被觀測變量之間的多元相關(guān)系數(shù)r和它的平方r2。多元相關(guān)系數(shù)的平方是矩陣P = -1L的對角線元素,其中 可觀測的離差矩陣。這些指標(biāo)的取值在0和1之間,數(shù)值越大越好。 第二類不確定性指標(biāo)給出可供選擇的因子得分之間的最小相關(guān)系數(shù)r*,r* = 2r2-1。最小相關(guān)系數(shù)取值范圍為-1 到1。較大的正值是比較滿意,因?yàn)樗砻鞑煌牡梅旨蠈a(chǎn)生相似的結(jié)果。,94,(2)有效性、單一性和相關(guān)精確性指標(biāo) 定義Rff 作為總體因子相關(guān)矩陣,Rss 作為因子得分相關(guān)矩陣,Rfs作為已知
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年蘇州托普信息職業(yè)技術(shù)學(xué)院馬克思主義基本原理概論期末考試題含答案解析(奪冠)
- 2025年景德鎮(zhèn)學(xué)院馬克思主義基本原理概論期末考試模擬題帶答案解析(必刷)
- 2025年浙江同濟(jì)科技職業(yè)學(xué)院單招職業(yè)傾向性測試題庫帶答案解析
- 2025年四川工商職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試題庫帶答案解析
- 四川省成都市郫都區(qū)2024-2025學(xué)年高三下學(xué)期階段性檢測(三)生物試題(解析版)
- 2025年射陽縣招教考試備考題庫帶答案解析(奪冠)
- 2025年昭平縣幼兒園教師招教考試備考題庫帶答案解析(奪冠)
- 2025年南京審計(jì)大學(xué)金審學(xué)院馬克思主義基本原理概論期末考試模擬題帶答案解析(奪冠)
- 2025年武寧縣招教考試備考題庫含答案解析(奪冠)
- 赤峰2025年內(nèi)蒙古赤峰市阿魯科爾沁旗醫(yī)院招聘19人筆試歷年參考題庫附帶答案詳解
- 尼帕病毒病的預(yù)防控制專題學(xué)習(xí)課件
- 2026年鋰電池項(xiàng)目投資計(jì)劃書
- 春節(jié)出行交通安全培訓(xùn)課件
- 2025ACCP實(shí)踐指南:危重患者血漿與血小板輸注指南解讀
- 【語文】遼寧省沈陽市沈河區(qū)文化路小學(xué)小學(xué)一年級下冊期末試卷(含答案)
- 新生兒紅臀PDCA課件
- 企業(yè)風(fēng)險(xiǎn)預(yù)警指標(biāo)體系設(shè)計(jì)與應(yīng)用
- 2025-2026學(xué)年江蘇省連云港市部分學(xué)校高三上學(xué)期10月月考?xì)v史試題(解析版)
- 《礦山壓力與巖層控制》教案
- 焊工焊接協(xié)議書(2篇)
- 蘇教版六年級數(shù)學(xué)上冊全套試卷
評論
0/150
提交評論