4--主成分因子.ppt_第1頁
4--主成分因子.ppt_第2頁
4--主成分因子.ppt_第3頁
4--主成分因子.ppt_第4頁
4--主成分因子.ppt_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、主成分分析和因子分析,主成分分析因子分析,報告什么?例如,假設(shè)您掌握了公司的所有數(shù)據(jù),包括固定資產(chǎn)、流動性、每筆貸款的金額和期限、各種稅、工資支出、原材料消費、產(chǎn)值、利潤、折舊、職員數(shù)、職員分工和培訓(xùn)水平。如果你在上面介紹公司情況,你能原封不動地拿出牙齒指標和數(shù)字嗎?當(dāng)然不是。你必須高度概括各方面,用一兩個指標簡單明了地說明情況。每個人都會遇到有很多變量的數(shù)據(jù)。例如,用一個國家或每個地區(qū)有很多經(jīng)濟和社會變量的數(shù)據(jù)指標來描述研究對象是綜合性的,因此設(shè)計很多指標是不可避免的。觀測指標的增加本來是為了完成研究過程,相反,為了明確研究結(jié)果,增加觀測指標引起了混亂。指標過多,增加了分析的復(fù)雜性。很多因素

2、往往給模型結(jié)構(gòu)帶來很大的困難。在實際工作中,指標之間經(jīng)常有一定的關(guān)聯(lián),所以人們想用較少的指標代替原來的很多指標,但仍然能反映原來的所有信息,因此產(chǎn)生了主要成分分析、系數(shù)分析等方法。(大衛(wèi)亞設(shè),美國電視電視劇,成功),很多指標都可以找出并描述他們的少數(shù)“代表”。牙齒一章介紹了兩種降低變量維數(shù)的茄子方法,用于說明、理解和分析:“主成分分析”(principal component analysis)和“因子分析”(factor analysis)。實際上,主成分分析可以說是因子分析的特例。100名學(xué)生的數(shù)學(xué)、物理、化學(xué)、國語、歷史和英語的成績列在下表(部分)。在牙齒例子中可以毽子的問題中,現(xiàn)在的問

3、題是,牙齒數(shù)據(jù)中的6個變量能否表示為1到2個統(tǒng)一變量?牙齒兩個茄子綜合變量包含多少原始信息?可以利用找到的綜合變量對學(xué)生排序嗎?2008年八月,因素分析得到了什么?因素分析方法應(yīng)用于部分領(lǐng)域的幾個茄子實例心理學(xué):心理學(xué)家薩斯頓分析了56個考試的分數(shù),獲得了7茄子主要智力因素。單詞理解能力,語言流利能力,計算能力,空間能力,記憶力,感知速度,推理能力,2008年八月, 教育學(xué):某師范大學(xué)以幼兒園36歲幼兒為對象,通過80名幼兒教師描述480名兒童好奇心行為特征的公開問卷調(diào)查,對60個項目進行了初步問卷調(diào)查,對500名幼兒早期測試結(jié)果進行了探索性因素分析,并對33個項目構(gòu)成了正式問卷調(diào)查,對100

4、0名幼兒的評價結(jié)果進行了驗證性因素分析,結(jié)果顯示,教師評價的36歲幼兒好奇心結(jié)構(gòu)具有敏感性,對未知的興趣, 上市公司評價:一位研究人員選定了35家能源上市公司,根據(jù)2007年12家經(jīng)營指標數(shù)據(jù),通過因素分析,根據(jù)盈利能力、資產(chǎn)管理能力、支付能力及經(jīng)營業(yè)績綜合得分等,對35家上市公司進行了排名。 其中盈利能力排名前5位的是新華股票、海油工程、蘭花果倉、安環(huán)能源、中國石油。經(jīng)營業(yè)績綜合評分前5名是新華股票、蘭氏能源、蘭氏果昌、海油工程、蓋爾股票、主要成分分析的基本原理主要成分分析的數(shù)學(xué)模型主要成分分析階段、主要成分分析的基本原理、主要成分分析和主要成分分析。使多個指標成為與徐璐無關(guān)的綜合指標的這種

5、統(tǒng)計方法稱為主成分分析或主成分分析。這也是數(shù)學(xué)上處理姜俊華的方法。引入主成分分析之前,先看下面的例子。,空間中的點,示例中的數(shù)據(jù)點是6維。也就是說,每個觀測都是6維空間中的一點。我們想把六維空間表示為低維空間。首先,假設(shè)只有二維,即兩個變量,用橫坐標和縱坐標表示。因此,每個觀測均具有兩個座標值,對應(yīng)于兩個軸。如果收入、消費支出、收入、消費支出、牙齒數(shù)據(jù)形成橢圓狀網(wǎng)格,橢圓就有長軸和短軸。在短方向上,數(shù)據(jù)幾乎沒有變化。在極端情況下,短軸退化為一點,只能在長軸的方向上解釋這些點的變化。這樣,從二維降到一維的維度就自然而然地完成了。橢球的長軸、軸與橢圓的長軸平行時,表示長軸的變量說明數(shù)據(jù)的主要變化,

6、表示短軸的變量說明數(shù)據(jù)的次要變化。但是,坐標軸通常與橢圓的長軸不平行。因此,必須找到并變換橢圓的長軸和長軸,以便新變量與橢圓的長軸平行。如果長軸變量表示數(shù)據(jù)中包含的大多數(shù)信息,則使用牙齒變量代替前兩個變量(第二個一維舍去)完成維縮減。橢圓(球)的長軸差越大,降低維數(shù)也就越有道理。問哪一個有可能降級。什么時候降級也不會丟失信息?兩個獨立的變量無法降維,主成分分析沒有意義。在上圖中,一維、長軸、短軸損失、損失是多少?請看縮短所占的比例。主軸和主成分,對于多維變量,還有二維相似、高維橢球體,但不能直觀地查看。首先查找高維橢球的主軸,然后使用表示大多數(shù)數(shù)據(jù)信息的最長軸作為新變量。這樣,主成分分析基本完

7、成了。與二維情況一樣,高維橢球的主軸也是徐璐垂直的。這些垂直于徐璐的新變量是原始變量的線性組合,稱為主成分。正如二維橢圓上有兩個主軸(垂直)牙齒一樣,三維橢球上有三個主軸(主軸的長度是牙齒變量的差值,即方差)牙齒,有幾個變量,還有幾個主要組件。選擇的主要成分越少,越要降低維度。什么是標準?那就是牙齒選定的主要成分所表示的主軸長度總和占主軸長度總和的大部分。一些文獻建議,選定主軸的總長度可以占所有主軸長度的85%左右。事實上,這只是一般的表達。具體選擇幾個取決于實際情況。不難想象,這些主要成分不僅徐璐無關(guān),而且它們的分散也依次減少。因此,在實際工作中,選擇前幾個最大的主要成分,這樣可能會丟失一些

8、信息,但這使我們捕捉到主要矛盾,從遠視數(shù)據(jù)中進一步提取一些新信息,因此,在一些實際問題的研究中,收益比損失更大。這有助于減少變量的數(shù)量,了解主要矛盾,有助于問題的分析和處理。2008年八月,選擇了多少茄子主成分?選擇標準是什么?在大多數(shù)統(tǒng)計信息中,主要組件表示的原始變量的信息以方差表示,其中所選主要組件表示的主軸的長度之和占主軸總長度的總和。因此,選擇的第一個主要成分是所有主要成分中方差最大的,即Var(yi)最大的第一個主要成分不足以代表原始變量,則考慮選擇第二個主要成分,這些主要成分徐璐無關(guān),方差減少,主要成分的選擇,主要成分分析的數(shù)學(xué)模型,作為2008新變量設(shè)定p個遠視變量,新變量將綜合

9、成p個指標。F1=a11x1a12x2.a1pxpF2=a21x1a22x2.a2pxp.Fp=ap1x1ap2x2.appxp此確定的綜合指標F1,F(xiàn)2,appxp,以上等式縮寫為:(:X是N維向量,因此F也是N維向量),上述方程式需要:牙齒,根據(jù)系數(shù),與: (1)無關(guān)的所有線性組合(2)的偏差最大,通常需要所選主要成分的方差之和占總方差的80%以上。當(dāng)然,這只是一個大體的標準,要選擇一些具體的來看實際情況。如果原變量之間的相關(guān)性高,降維效果會更好,選擇的主要成分會更少。如果原來變量本身不太相關(guān),降維效果自然就不好了。不相關(guān)的變量只能代表自行自己。主要成分的選擇,主要成分分析的階段,2000

10、水平和尺寸維度中,為了消除變量的影響,根據(jù)標準化數(shù)據(jù)矩陣求出相關(guān)系數(shù)矩陣,求出協(xié)方差矩陣的特征根和特征向量,確定主要成分,正確解釋每個主要成分中包含的信息,根據(jù)主要成分分析階段,2008年八月,例根據(jù)我國31個省自治區(qū)2006年的6個主要經(jīng)濟指標數(shù)據(jù)進行主要成分分析主成分確定和適當(dāng)解釋、主成分分析(案例分析)、2008年八月、SPSS的輸出結(jié)果、變量間相關(guān)系數(shù)矩陣、變量間強相關(guān)、適合主成分分析、2008年八月、SPSS的輸出結(jié)果(主成分選擇)“初始Eigenvalues也就是說,引入牙齒主成分后可以解釋原始變量的信息特征根也稱為方差。特征布線與整個特征布線的比率稱為設(shè)定主要元件分布貢獻特征布線

11、。第一個主要組成部分的分散貢獻率如下:第一個主要成分的特征根為3.963,總特征根的比率(方差貢獻率)為66.052%,可見第一個主要成分解釋了原來6個變量66.052%的信息。可以看出,第一個主要成分對原來的6個變量進行了充分的說明。根據(jù)什么選擇主要成分?2008年八月,根據(jù)主要成分貢獻率,一般可以選擇主要成分的累計方差貢獻率超過80%的前幾個茄子主要成分。表13.3中前兩個主要成分的累計方差貢獻率為95.57%。所以SPSS只選擇了兩個主要成分。在牙齒的情況下,兩個主要成分足以說明各地區(qū)的經(jīng)濟發(fā)展?fàn)顩r。根據(jù)什么選擇主要成分?2008年八月,SPSS還提供了更直觀的圖形工具,用于選擇主要組件

12、:碎石。碎石在碎石圖中看到6個主軸長度變化的趨勢實踐中,通常與特定情況相結(jié)合。在碎石圖中,選擇變化趨勢出現(xiàn)拐點的前幾個主要組成部分作為原始變量的代表。如果是牙齒,請選擇前兩個關(guān)鍵組件。(Scree Plot),疫情峰值,2008年八月,主要成分如何解釋?主要組件的系數(shù)負載矩陣,具有第一主要組件的列的系數(shù)0.670表示第一主要組件和原始第一變量(人均GDP)之間的線性相關(guān)系數(shù)。牙齒系數(shù)越大,主要組件對變量的代表性越大,2008年八月,負載圖將主要組件對原始6變量的解釋可視化。圖形的橫軸表示第一個主要組件和原始變量之間的相關(guān)系數(shù)。垂直軸表示第二個主要組件和原始變量之間的相關(guān)系數(shù)。對應(yīng)于每個變量的關(guān)

13、鍵組件載荷對應(yīng)于坐標系中的一點。例如,人均GDP變量的對應(yīng)點是(0.670,0.725),第一個主要成分充分說明了最初的6個變量(每個原始變量與強烈的正相關(guān)),第二個主要成分更好地說明了。(加載點),相關(guān)系數(shù)的點離坐標軸越遠,主要組件對原始變量的代表性越大。牙齒三點是主成分為2的坐標,主成分分析的主成分數(shù)等于遠視變量數(shù)。也就是說,只要幾個變量,就有幾個主要成分,但最終我們只是確定了幾個主要成分。系數(shù)分析必須事先確定幾個茄子成分(也稱為系數(shù)),然后將原始變量合并成少數(shù)元素,再現(xiàn)原始變量和系數(shù)之間的關(guān)系。一般來說,系數(shù)的數(shù)目遠少于原始變數(shù)的數(shù)目。什么是系數(shù)分析?(Factor Analysis),2008年八月,元素分析可以看作是主成分分析的普及和擴展,但是對問題的研究更為深入和細致。事實上,主要組件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論