版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
./第13章因子分析因子分析始于1904年CharsSpearman對(duì)學(xué)生成績(jī)的分析,在經(jīng)濟(jì)領(lǐng)域有著極為廣泛的用途。在多個(gè)變量的變化過(guò)程中,除了一些特定因素之外,還受到一些共同因素的影響。因此,每個(gè)變量可以拆分成兩部分,一是共同因素,二是特殊因素。這些共同因素稱為公因子,特殊因素稱為特殊因子。因子分析即是提出多個(gè)變量的公共影響因子的一種多元統(tǒng)計(jì)方法,它是主成分分析的推廣。因子分析主要解決兩類問(wèn)題:一是尋求基本結(jié)構(gòu),簡(jiǎn)化觀察系統(tǒng)。給定一組變量或觀察數(shù)據(jù),是否存在一個(gè)子集,特別是一個(gè)加權(quán)子集,來(lái)解釋整個(gè)問(wèn)題,即將為數(shù)眾多的變量減少為幾個(gè)新的因子,以再現(xiàn)它們之間的內(nèi)在聯(lián)系。二是用于分類,將變量或樣本進(jìn)行分類,根據(jù)因子得分值,在因子軸所構(gòu)成的空間中進(jìn)行分類處理。p個(gè)變量X的因子模型表達(dá)式為:f稱為公因子,稱為因子載荷。X的相關(guān)系數(shù)矩陣分解為:對(duì)于未旋轉(zhuǎn)的因子,。稱為特殊度,即每個(gè)變量中不屬于共性的部分。13.1因子估計(jì)Stata可以通過(guò)變量進(jìn)行因子分析,也可以通過(guò)矩陣進(jìn)行。命令為factor或factormat。webusebg2,cleardescribefactorbg2cost1-bg2cost6factorbg2cost1-bg2cost6,factors<2>*pf主因子方法,用復(fù)相關(guān)系數(shù)的平方作為因子載荷的估計(jì)量<默認(rèn)選項(xiàng)>factorbg2cost1-bg2cost6,factors<2>pcf*pcf主成分因子,假定共同度=1factorbg2cost1-bg2cost6,factors<2>ipf*ipf迭代主因子,重復(fù)估計(jì)共同度f(wàn)actorbg2cost1-bg2cost6,factors<2>ml*ml極大似然因子,假定變量〔至少3個(gè)服從多元正態(tài)分布,對(duì)偏相關(guān)矩陣的行列式進(jìn)行最優(yōu)化求解,等價(jià)于Rao的典型因子方法13.2預(yù)測(cè)Stata可以通過(guò)predict預(yù)測(cè)變量得分、擬合值和殘差等。webusebg2,clearfactorbg2cost1-bg2cost6predictf1f2*factor1factor2因子分得分predictstdpresiduals*預(yù)測(cè)標(biāo)準(zhǔn)差和殘差13.3EstatEatat給出了幾個(gè)非常有用的工具,包括KMO、SMC等指標(biāo)。webusebg2,clearfactorbg2cost1-bg2cost6estatantiestatkmoestatresidualsestatsmcestatsummarize13.4因子旋轉(zhuǎn)與作圖因子分析的旋轉(zhuǎn)方法以及碎石圖、得分圖、因子載荷圖與主成分分析的方法相同,請(qǐng)參見"主成分分析"一章。webusebg2,clearfactorbg2cost1-bg2cost6screeplot/*碎石圖*/scoreplot/*得分圖*/loadingplot/*因子載荷圖*/rotate/*旋轉(zhuǎn)*/例:利用20XX的數(shù)據(jù)對(duì)中國(guó)社會(huì)發(fā)展?fàn)顩r進(jìn)行綜合考察,原始數(shù)據(jù)如下表:省份人均GDP〔元新增固定資產(chǎn)〔億元城鎮(zhèn)居民人均年可支配收入〔元農(nóng)村居民家庭人均純收入〔元高等學(xué)校數(shù)〔所衛(wèi)生機(jī)構(gòu)數(shù)〔個(gè)areax1x2x3x4x5x6北京630292385.824724.8910661.92856497天津554731676.819422.537910.78552784河北232394734.213441.094795.4610515632山西203981772.613119.054097.24699431XX322143309.314432.554656.18397162遼寧312595056.714392.695576.4810414627吉林235143279.912829.454932.74559659XX217272405.411581.284855.59787928上海731242523.226674.911440.26662822江蘇396227645.918679.527356.4714613357浙江422143434.822726.669257.939815290安徽144852849.512990.354202.491047837福建301231768.317961.456196.07814478江西147812962.512866.444697.19828229山東330836852.516305.415641.4312514973河南19593641413231.114454.249411683湖北198603053.413152.864656.3811810305湖南175212478.213821.164512.4611514455廣東375895529.219732.866399.7912515819廣西14966141914146.043690.346810427海南17175230.212607.844389.97162220重慶180251381.914367.554126.21476265四川153782918.712633.384121.219020738貴州882490311758.762796.93455848云南12587155113250.223102.6599249西藏13861137.412481.513175.8261326陜西182462262.812857.893136.46888812甘肅12110575.210969.412723.793910534青海17389322.811640.433061.2491582寧夏17892403.912931.533681.42151629新疆198931162.911432.13502.9376739程序:clear*定義變量的標(biāo)簽labelvararea省份labelvarx1"人均GDP〔元"labelvarx2"新增固定資產(chǎn)〔億元"labelvarx3"城鎮(zhèn)居民人均年可支配收入〔元"labelvarx4"農(nóng)村居民家庭人均純收入〔元"labelvarx5"高等學(xué)校數(shù)〔所"labelvarx6"衛(wèi)生機(jī)構(gòu)數(shù)〔個(gè)"describefactorx1-x6screeplot/*碎石圖〔特征值等于1處的水平線標(biāo)示保留主成分的分界點(diǎn)*/*檢驗(yàn)estatkmo/*KMO檢驗(yàn),越高越好*/estatsmc/*SMC檢驗(yàn),值越高越好*/rotate/*旋轉(zhuǎn)*/loadingplot,yline<0>xline<0>/*載荷圖*/*預(yù)測(cè)predictscorefitresidualq/*預(yù)測(cè)變量得分、擬合值和殘差以及殘差的平方和*/predictf1f2labelvarf1收入因子labelvarf2"投資、社會(huì)因子"listareaf1f2summarizef1f2correlatef1f2scoreplot,xtitle<"收入因子">ytitle<"投資、社會(huì)因子">///mlabel<area>yline<0>xline<0>/*得分圖*/分析:首先通過(guò)主因子分析<factor>,得到主成分因子:Factoranalysis/correlationNumberofobs=31Method:principalfactorsRetainedfactors=3Rotation:<unrotated>Numberofparams=15Factor|EigenvalueDifferenceProportionCumulative+Factor1|3.281931.425440.65540.6554Factor2|1.856481.816770.37071.0261Factor3|0.039710.062440.00791.0341Factor4|-0.022720.03972-0.00451.0295Factor5|-0.062440.02293-0.01251.0170Factor6|-0.08538.-0.01701.0000LRtest:independentvs.saturated:chi2<15>=211.52Prob>chi2=0.0000Factorloadings<patternmatrix>anduniquevariancesVariable|Factor1Factor2Factor3|Uniqueness++x1_s|0.8609-0.4463-0.1125|0.0469x2_s|0.62740.6026-0.1061|0.2320x3_s|0.8800-0.39310.0998|0.0611x4_s|0.9120-0.36580.0365|0.0332x5_s|0.65080.65260.0349|0.1494x6_s|0.34270.76160.0572|0.2993從上面的分析可以看出,只有兩個(gè)成分大于1大于的特征值,同時(shí)兩個(gè)成分解釋了全部六個(gè)變量組合的方差還多。不重要的第2到6個(gè)主成分在隨后的分析中可以放心地省略去。運(yùn)行factor命令后,我們可以接著運(yùn)行screeplot命令畫出碎石圖。碎石圖中特征值等于1處的水平線標(biāo)示了保留主成分的常用分界點(diǎn),同時(shí)再次強(qiáng)調(diào)了本例中的成分3到成分6并不重要。碎石圖檢驗(yàn)的方法還是跟上一章的主成分分析一樣,由于我們都是選用實(shí)際的數(shù)據(jù)來(lái)進(jìn)行分析,所以在一般情況下,檢驗(yàn)都是通得過(guò)的,可以忽略,覺得有需要的再進(jìn)行檢驗(yàn)。旋轉(zhuǎn)會(huì)進(jìn)一步簡(jiǎn)化因子結(jié)構(gòu)。在提取因子之后,鍵入rotate命令進(jìn)行旋轉(zhuǎn)。Factoranalysis/correlationNumberofobs=31Method:principalfactorsRetainedfactors=3Rotation:orthogonalvarimax<Kaiseroff>Numberofparams=15Factor|VarianceDifferenceProportionCumulative+Factor1|2.904890.672140.58010.5801Factor2|2.232762.192280.44591.0260Factor3|0.04047.0.00811.0341LRtest:independentvs.saturated:chi2<15>=211.52Prob>chi2=0.0000Rotatedfactorloadings<patternmatrix>anduniquevariancesVariable|Factor1Factor2Factor3|Uniqueness++x1|0.96590.06010.1284|0.0469x2|0.22690.83990.1052|0.2320x3|0.95850.1143-0.0844|0.0611x4|0.97080.1546-0.0211|0.0332x5|0.22360.8940-0.0362|0.1494x6|-0.09620.8291-0.0635|0.2993Factorrotationmatrix|Factor1Factor2Factor3+Factor1|0.85780.51380.0115Factor2|-0.51370.8579-0.0135Factor3|0.0168-0.0056-0.9998結(jié)合實(shí)際情況,我們通過(guò)上面的分析整理出前兩個(gè)主因子的正交因子表。表:正交因子表因子指標(biāo)FactorFactor12x10.96590.0601x20.22690.8399x30.95850.1143x40.97080.1546x50.22360.8940x6-0.09620.8291根據(jù)上表將六個(gè)指標(biāo)按高載荷分成兩類,并結(jié)合專業(yè)知識(shí)對(duì)各因子命名,如下表:表:高載荷分類高載荷指標(biāo)因子命名1人均GDP城鎮(zhèn)居民人均年可支配收入農(nóng)村居民家庭人均純收入收入因子2高等學(xué)校數(shù)衛(wèi)生機(jī)構(gòu)數(shù)新增固定資產(chǎn)投資、社會(huì)因子接著進(jìn)行一個(gè)后續(xù)因子分析的制圖命令loadingplote有助于將其可視化。從圖中我們就可以直觀的看出在主因子1中x1、x3、x4明顯取得較大值,而對(duì)于主因子2則是x2、x5、x6取得較大的值。載荷圖因子分是通過(guò)將每個(gè)變量標(biāo)準(zhǔn)化為平均數(shù)等于0和方差等于1,然后以因子分系數(shù)進(jìn)行加權(quán)合計(jì)為每個(gè)因子構(gòu)成的線性組合?;谧罱膔otate或factor結(jié)果,predict會(huì)自動(dòng)進(jìn)行這些計(jì)算。通過(guò)命令predictf1f2,我們得到了各個(gè)觀察變量的主因子1、主因子2的得分情況。.listareaf1f2++|areaf1f2|||1.|北京2.561218-.3716789|2.|天津1.557873-.9623399|3.|河北-.33086411.11135|4.|山西-.4196471-.1267554|5.|XX.0597282-.493462|||6.|遼寧.05891541.03599|7.|吉林-.1869884-.0693724|8.|XX-.3388027.0518705|9.|上海3.102133-.8749663|10.|江蘇.77138721.864629|||11.|浙江1.640963.5580102|12.|安徽-.5925296.5026094|13.|福建.5376554-.3128498|14.|江西-.445243.2467043|15.|山東.15895031.588749|||16.|河南-.47445981.084772|17.|湖北-.4194019.7986803|18.|湖南-.4611212.8609527|19.|廣東.64253421.33433|20.|廣西-.5491737-.1288966|||21.|海南-.2889173-1.39015|22.|重慶-.3183038-.6323313|23.|四川-.652319.9108785|24.|貴州-.9411649-.6618432|25.|云南-.7608307-.2586383|||26.|西藏-.6072451-1.569231|27.|陜西-.7326311.1913275|28.|甘肅-.9497479-.5987777|29.|青海-.6269016-1.50444|30.|寧夏-.4114082-1.422286|||31.|新疆-.5836563-.7628338|++.summarizef1f2Variable|ObsMeanStd.Dev.MinMax+f1|31-4.09e-09.988557-.94974793.102133f2|319.13e-09.9464783-1.5692311.864629在這些因子分之間是存在著相關(guān),在默認(rèn)選項(xiàng)中,promax旋轉(zhuǎn)允許因子分之間存在相關(guān)。通過(guò)運(yùn)行命令correlatef1f2可得。從運(yùn)行出來(lái)的結(jié)果看到,兩個(gè)因子分相關(guān)關(guān)系是很小的。.correlatef1f2<obs=31>|f1f2+f1|1.0000f2|0.01581.0000另一個(gè)后因子分析制圖命令,scoreplot可繪出這些觀測(cè)案例的因子分的散點(diǎn)圖。在本例的得分圖中,我們可以看到,上海、北京、XX、天津這些城市的主因子1的得分相對(duì)于其他城市高,因?yàn)橹饕蜃?是收入因子,這些城市的收入在全國(guó)是排在前列的。而我們可以看到北京、上海的在主因子2〔即投資、社會(huì)因子的得分是較低,這是因?yàn)檫@兩個(gè)城市的經(jīng)濟(jì)總量相對(duì)較小。在XX、XX、XX這些經(jīng)濟(jì)總量名列前茅的省份,它們的主因子2的得分也是相應(yīng)位于其他城市前面。得分圖練習(xí):將上一章的主成分分析的例子的數(shù)據(jù)進(jìn)行因子分析。省份GDP<億元居民消費(fèi)水平<元固定資產(chǎn)投資<億元>職工平均工資〔元貨物周轉(zhuǎn)量<億噸公里>居民消費(fèi)價(jià)格指數(shù)<上年100>商品零售價(jià)格指數(shù)<上年100>工業(yè)總產(chǎn)值<億元>areax1x2x3x4x5x6x7x8北京10488.03203463814.756328758.9105.1104.410413天津6354.38140003389.8417482703.4105.4105.112503河北16188.6165708866.6247565925.5106.2106.723031山西6938.7361873531.2258282562.2107.2107.210024XX7761.881085475.4261143658.7105.7104.78740.2遼寧13461.57962510019.1277297033.9104.6105.324769吉林6424.0675915038.9234861157.8105.1106.28406.9XX831070393656230461690.9105.6105.87624.5上海1369815656516029.8105.8105.325121江蘇30312.6111013153
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 檢驗(yàn)科檢驗(yàn)儀器試劑殘留污染的清潔處理制度
- 唐代壁畫舞蹈解析課件
- 環(huán)保執(zhí)法崗位年度污染查處工作小結(jié)
- 護(hù)理十二項(xiàng)核心制度
- 2026年電力設(shè)備行業(yè)年度展望:數(shù)據(jù)中心強(qiáng)化電力基建需求出海仍是企業(yè)長(zhǎng)期增長(zhǎng)驅(qū)動(dòng)力-
- 2025 小學(xué)六年級(jí)科學(xué)上冊(cè)蠶的生命周期階段觀察記錄課件
- 2025年山西管理職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性考試題庫(kù)附答案解析
- 古代印度課件
- 2025年芒康縣幼兒園教師招教考試備考題庫(kù)附答案解析(奪冠)
- 2025年昌吉職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)帶答案解析
- 甘肅省武威市涼州區(qū)2025-2026學(xué)年上學(xué)期九年級(jí)化學(xué)期末模擬練習(xí)試卷含答案
- (2025年)安全教育考試(電氣焊)含答案
- (2025年)會(huì)計(jì)入職考核試題及答案
- (2025年)勞動(dòng)關(guān)系協(xié)調(diào)員考試題庫(kù)與答案
- 企業(yè)客戶關(guān)系維護(hù)工作方案
- 2026年春節(jié)放假通知模板范文
- 幼兒語(yǔ)言表達(dá)能力提高策略
- 農(nóng)業(yè)技術(shù)推廣指導(dǎo)-農(nóng)業(yè)推廣的概念與基本原理
- 一種拖曳浮標(biāo)三維軌跡協(xié)調(diào)控制方法
- 墓碑上的100個(gè)藥方
- 4D廚房設(shè)備設(shè)施管理責(zé)任卡
評(píng)論
0/150
提交評(píng)論