版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
關于因子分析方法第1頁,共21頁,2023年,2月20日,星期三因子分析的基本概念
因子分析的概念就是在盡可能不損失信息或少損失信息的情況下,將多個變量減少為少數(shù)幾個潛在的因子。也就是用少數(shù)幾個因子來描述許多指標或因素之間的聯(lián)系,以較少幾個因子來反映原資料的大部分信息的統(tǒng)計學分析方法主成分分析(Principalcomponentanalysis):是因子分析的一個特例,是使用最多的因子提取方法。它通過坐標變換手段,將原有的多個相關變量,做線性變化,轉(zhuǎn)換為另外一組不相關的變量。選取前面幾個方差最大的主成分,這樣達到了因子分析較少變量個數(shù)的目的,同時又能與較少的變量反映原有變量的絕大部分的信息。兩者關系:主成分分析(PCA)和因子分析(FA)是兩種把變量維數(shù)降低以便于描述、理解和分析的方法,而實際上主成分分析可以說是因子分析的一個特例第2頁,共21頁,2023年,2月20日,星期三因子分析的基本模型
因子分析模型中,假定每個原始變量由兩部分組成:共同因子和唯一因子。共同因子是各個原始變量所共有的因子,解釋變量之間的相關關系。唯一因子顧名思義是每個原始變量所特有的因子,表示該變量不能被共同因子解釋的部分。原始變量與因子分析時抽出的共同因子的相關關系用因子負荷表示。第3頁,共21頁,2023年,2月20日,星期三因子分析最常用的理論模式如下:(j=1,2,3…,n,n為原始變量總數(shù))(1)Zj為第j個變量的標準化分數(shù);(2)Fi(i=1,2,…,m)為共同因素;(3)m為所有變量共同因素的數(shù)目;(4)Uj為變量的唯一因素;(5)aij為因素負荷量。第4頁,共21頁,2023年,2月20日,星期三用矩陣的形式表示為Z=AF+UF稱為因子,由于它們出現(xiàn)在每個原始變量的線性表達式(原始變量可以用Xj表示,這里模型中實際上是以F線性表示各個原始變量的標準化分數(shù)Zj),因此又稱為公共因子.A稱為因子載荷矩陣,aji稱為因子載荷,是第j個原始變量在第i個因子上的負荷。U稱為特殊因子,表示了原有變量不能被因子解釋的部分,其均值為0,相當于多元線性回歸模型中的殘差。第5頁,共21頁,2023年,2月20日,星期三因子分析的特點(1)因子變量的數(shù)量遠少于原有的指標變量的數(shù)量,因而對因子變量的分析能夠減少分析中的工作量。(2)因子變量不是對原始變量的取舍,而是根據(jù)原始變量的信息進行重新組構(gòu),它能夠反映原有變量大部分的信息。(3)因子變量之間不存在顯著的線性相關關系,對變量的分析比較方便,但原始部分變量之間多存在較顯著的相關關系。(4)因子變量具有命名解釋性,即該變量是對某些原始變量信息的綜合和反映。第6頁,共21頁,2023年,2月20日,星期三因子分析數(shù)學模型中幾個相關概念
1、因子載荷(因素負荷量)因子載荷就是因素結(jié)構(gòu)中,原始變量與因素分析時抽取出共同因素的相關。在因子不相關的前提下,因子載荷aji是變量Zj和因子Fi的相關系數(shù),反映了變量Zj與因子Fi之間的相關程度。因子載荷值aji小于等于1,絕對值越接近1,表明因子Fi與變量Zj的相關性越強。同時,因子載荷aji也反映了因子Fi對解釋變量Zj的重要作用和程度。當要判斷一個因子的意義時,需要查看哪些變量的負荷達到了0.3或0.3以上第7頁,共21頁,2023年,2月20日,星期三2、變量共同度(共同性)一個因子解釋的是相關矩陣的方差,變量的方差由共同因子和唯一因子組成,可以表示成h+u2=1(h表示共同度,u2表示特殊因子的平方)。變量共同度就是指每個原始變量在每個共同因子的負荷量的平方和,是全部因子對變量方差解釋說明的比例。變量共同度h越接近1,說明因子全體解釋說明了變量Zj的較大部分方差,如果用因子全體刻畫變量,則變量的信息丟失較少;共同性的意義在于說明如果用共同因子替代原始變量后,原始變量的信息被保留的程度。特殊因子U的平方,反應了變量方差中不能由因子全體解釋說明的比例,越小則說明變量的信息丟失越少。因子分析數(shù)學模型中幾個相關概念
第8頁,共21頁,2023年,2月20日,星期三總之,變量的共同度刻畫了因子全體對變量信息解釋的程度,是評價變量信息丟失程度的重要指標。如果大多數(shù)原有變量的變量共同度均較高(如高于0.8),則說明提取的因子能夠反映原有變量的大部分信息(80%以上)信息,僅有較少的信息丟失,因子分析的效果較好。因子,變量共同度是衡量因子分析效果的重要依據(jù)。2、變量共同度(共同性)
第9頁,共21頁,2023年,2月20日,星期三3、因子的方差貢獻(特征值)因子的方差貢獻(特征值)的數(shù)學定義為:。該式表明,因子Fi的方差貢獻是因子載荷矩陣A中第i列元素的平方和。因子Fi的方差貢獻反映了因子Fi對原有變量總方差的解釋能力,(其解釋方差的大小成為因子的特征值)。該值越高,說明相應因子的重要性越高。因此,因子的方差貢獻和方差貢獻率是衡量因子重要性的關鍵指標。因子分析數(shù)學模型中幾個相關概念
第10頁,共21頁,2023年,2月20日,星期三舉例說明:因子分析數(shù)學模型中幾個相關概念
第11頁,共21頁,2023年,2月20日,星期三第12頁,共21頁,2023年,2月20日,星期三因子分析的五大基本步驟
第一步:因子分析的前提條件由于因子分析的主要任務之一是對原有變量進行濃縮,即將原有變量中的信息重疊部分提取和綜合成因子,進而最終實現(xiàn)減少變量個數(shù)的目的。因此它要求原有變量之間應存在較強的相關關系。否則,如果原有變量相互獨立,相關程度很低,不存在信息重疊,它們不可能有共同因子,那么也就無法將其綜合和濃縮,也就無需進行因子分析。本步驟正是希望通過各種方法分析原有變量是否存在相關關系,是否適合進行因子分析。第13頁,共21頁,2023年,2月20日,星期三第一步:因子分析的前提條件
三種方法判斷數(shù)據(jù)是否適合作因子分析:計算相關系數(shù)矩陣在進行提取因子等分析步驟之前,應對相關矩陣進行檢驗,如果相關矩陣中的大部分相關系數(shù)小于0.3,則不適合作因子分析;當原始變量個數(shù)較多時,一般不會采用此方法或即使采用了此方法,也不方便在結(jié)果匯報中給出原始分析報表。巴特利特球度檢驗Bartlett球體檢驗的目的是檢驗相關矩陣是否是單位矩陣,如果是單位矩陣,則認為因子模型不合適。。一般說來,顯著水平值越小(<0.05)表明原始變量之間越可能存在有意義的關系,如果顯著性水平很大(如0.10以上)可能表明數(shù)據(jù)不適宜于因子分析。第14頁,共21頁,2023年,2月20日,星期三KMOKMO測度的值越高(接近1.0時),表明變量間的共同因子越多,研究數(shù)據(jù)適合用因子分析。通常按以下標準解釋該指標值的大小:KMO值達到0.9以上為非常好,0.8~0.9為好,0.7~0.8為一般,0.6~0.7為差,0.5~0.6為很差。如果KMO測度的值低于0.5時,表明樣本偏小,需要擴大樣本。第一步:因子分析的前提條件三種方法判斷數(shù)據(jù)是否適合作因子分析:第15頁,共21頁,2023年,2月20日,星期三第二步:取共同因子,確定因子的數(shù)目和求因子解的方法
因子抽取的方法最常使用的是主成份分析法,進行主成份分析時,先要將每個變量的數(shù)值轉(zhuǎn)換成標準值。原則上,因子的數(shù)目與原始變量的數(shù)目相同,但抽取了主要的因子之后,如果剩余的方差很小,就可以放棄其余的因子,以達到簡化數(shù)據(jù)的目的。因子數(shù)目的確定常用的方法是借助一是特征值準則,二是碎石圖檢驗準則。特征值準則就是選取特征值大于或等于1的主成份作為初始因子,而放棄特征值小于1的主成份。散點曲線的特點是由高到低,先陡后平,最后幾乎成一條直線。曲線開始變平的前一個點被認為是提取的最大因子數(shù)。后面的散點類似于山腳下的碎石,可舍棄而不會丟失很多信息。第16頁,共21頁,2023年,2月20日,星期三第三步:使因子更具有命名可解釋性(因子旋轉(zhuǎn))
通常最初因素抽取后,對因素無法作有效的解釋。這時往往需要進行因子旋轉(zhuǎn),通過坐標變換使因子解的意義更容易解釋。轉(zhuǎn)軸的目的在于改變題項在各因素負荷量的大小,轉(zhuǎn)軸時根據(jù)題項與因素結(jié)構(gòu)關系的密切程度,調(diào)整各因素負荷量的大小,轉(zhuǎn)軸后,使得變量在每個因素的負荷量不是變大(接近1)就是變得更小(接近0),而非轉(zhuǎn)軸前在每個因素的負荷量大小均差不多,這就使對共同因子的命名和解釋變量變得更容易。轉(zhuǎn)軸后,每個共同因素的特征值會改變,但每個變量的共同性不會改變。第17頁,共21頁,2023年,2月20日,星期三因子旋轉(zhuǎn)的方法(1)方差最大正交旋轉(zhuǎn)(varimaxorthogonalrotation)基本思想:使公共因子的相對負荷(lij/hi2)的方差之和最大,且保持原公共因子的正交性和公共方差總和不變??墒姑總€因子上的具有最大載荷的變量數(shù)最小,因此可以簡化對因子的解釋。(2)斜交旋轉(zhuǎn)因子斜交旋轉(zhuǎn)后,各因子負荷發(fā)生了較大變化,出現(xiàn)了兩極分化。各因子間不再相互獨立,而彼此相關。各因子對各變量的貢獻的總和也發(fā)生了改變。適用于大數(shù)據(jù)集的因子分析。第三步:使因子更具有命名可解釋性(因子旋轉(zhuǎn))
第18頁,共21頁,2023年,2月20日,星期三第四步:決定因素與命名
轉(zhuǎn)軸后,要決定因素數(shù)目,選取較少因素層面,獲得較大的解釋量。在因素命名與結(jié)果解釋上,必要時可將因素計算后之分數(shù)存
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學衛(wèi)生宣教制度
- 衛(wèi)生室聯(lián)合用藥管理制度
- 鎮(zhèn)鄉(xiāng)中心校食品衛(wèi)生制度
- 小學德育衛(wèi)生制度
- 衛(wèi)生院信息反饋制度
- 衛(wèi)生站院感巡查制度
- 衛(wèi)生系統(tǒng)雙報告制度
- 鄉(xiāng)鎮(zhèn)衛(wèi)生院重精工作制度
- 熟制品衛(wèi)生管理制度
- 焊錫職衛(wèi)生管理制度
- 2023-2024學年廣東省茂名市高一(上)期末數(shù)學試卷(含答案)
- 《課堂管理的技巧》課件
- 醫(yī)院培訓課件:《頸椎病》
- 佛山市離婚協(xié)議書范本
- HG+20231-2014化學工業(yè)建設項目試車規(guī)范
- 工地春節(jié)停工復工計劃安排方案
- 連接員題庫(全)題庫(855道)
- 單元學習項目序列化-選擇性必修下冊第三單元為例(主題匯報課件)-統(tǒng)編高中語文教材單元項目式序列化研究
- 黑布林英語漁夫和他的靈魂
- 電站組件清洗措施及方案
- 冀教版五年級英語下冊全冊同步練習一課一練
評論
0/150
提交評論