同濟(jì)醫(yī)學(xué)院-《醫(yī)學(xué)多元統(tǒng)計(jì)》課件-主成份-因子分析_第1頁(yè)
同濟(jì)醫(yī)學(xué)院-《醫(yī)學(xué)多元統(tǒng)計(jì)》課件-主成份-因子分析_第2頁(yè)
同濟(jì)醫(yī)學(xué)院-《醫(yī)學(xué)多元統(tǒng)計(jì)》課件-主成份-因子分析_第3頁(yè)
同濟(jì)醫(yī)學(xué)院-《醫(yī)學(xué)多元統(tǒng)計(jì)》課件-主成份-因子分析_第4頁(yè)
同濟(jì)醫(yī)學(xué)院-《醫(yī)學(xué)多元統(tǒng)計(jì)》課件-主成份-因子分析_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

主成份分析常常遇到的問(wèn)題指標(biāo)過(guò)多,對(duì)現(xiàn)象(或事物)解釋帶來(lái)困難----需要降維;指標(biāo)往往存在相關(guān)性,使“關(guān)系”復(fù)雜化,特別是在回歸分析中出現(xiàn)共線性----需消除共線性;用多指標(biāo)從多個(gè)維度對(duì)醫(yī)學(xué)現(xiàn)象(或事物)進(jìn)行考核----需綜合評(píng)價(jià);揭示事物的不同屬性與多個(gè)維度體征----判別歸類。

解決諸如此類問(wèn)題方法:主成份分析與因子分析!何為主成份?主成份分析:對(duì)數(shù)據(jù)和變量結(jié)構(gòu)進(jìn)行分析處理的一種行之有效的多元統(tǒng)計(jì)分析方法,它可在不損失或盡量少損失原有指標(biāo)信息的情況下,將多個(gè)具有相關(guān)性的指標(biāo)轉(zhuǎn)換成少數(shù)幾個(gè)互相獨(dú)立的綜合指標(biāo),即主成份.如何去尋找主成份呢?這可從“點(diǎn)集”的角度來(lái)討論:

在有P(≥2)個(gè)指標(biāo)的P維空間中,抽取了n個(gè)點(diǎn)(即n個(gè)觀察對(duì)象),我們希望弄清這n個(gè)點(diǎn)間的關(guān)系,顯然在高維空間中點(diǎn)的關(guān)系不直觀,若把這些點(diǎn)“近似地”在較低維(如m維,m≤P)空間中表示出來(lái),無(wú)疑對(duì)我們的研究有幫助。這也就是主成分分析的基本思想和目的。Y1X1X2如何達(dá)到這個(gè)目的呢?Y=(Y1,Y2,…,YP)'是由X=(X1,X2,…,XP)'經(jīng)正交變換得來(lái)的,即存在一個(gè)正交矩陣U,有:

Y=UX

正交變換在所有形如上面的線性變換中,選取這樣的線性變換,它使Y1具有最大方差,Y2次之,…,依此類推,即方差的大小順序是V(Y1)≥V(Y2)≥…≥V(YP),且Y1,Y2,…,YP彼此獨(dú)立(互不相關(guān))。這樣得到的Y1,Y2,…,YP分別叫做指標(biāo)變量X的第一,第二,…,第P主成分(principelcomponent)。有P個(gè)原指標(biāo)變量,相應(yīng)的就應(yīng)該有P個(gè)主成分,但只有前面的m個(gè)主成分具有實(shí)際的解釋意義,將具體討論m的確是方法。由于Y是X的線性變換(即線性組合),所以Yi(i=1,2,…,P)都是X的一個(gè)綜合指標(biāo)。Lagrange條件極值:

V(Yk)=

k-----R的第k個(gè)特征根

-----

j

對(duì)應(yīng)的特征向量

主成分分析的計(jì)算步驟

(1)計(jì)算各變量的相關(guān)系數(shù)矩陣R=(rij);(2)計(jì)算相關(guān)矩陣R的特征值,并按由大到小的順序排列:

1≥

2≥…≥

p;(3)計(jì)算貢獻(xiàn)率

i

和累積貢獻(xiàn)率

m,確定m的值(即主成分的個(gè)數(shù));(4)求出前k個(gè)特征值

1,

2,…,

m所對(duì)應(yīng)的單位特征向量。主成分的貢獻(xiàn)率與主成分的個(gè)數(shù)

1.主成分的貢獻(xiàn)率

第i個(gè)主成分提取的信息占全部P個(gè)變量總信息的比,稱為該主成分的貢獻(xiàn)率,即:

i為第i個(gè)主成分Yi的貢獻(xiàn)率。

如果是通過(guò)相關(guān)矩陣R求主成分,則主成分的貢獻(xiàn)率的計(jì)算尤為簡(jiǎn)單:

ηi=

i/p

顯然有=1,即全部主成分對(duì)X“總方差”的貢獻(xiàn)率率為100%。

2.累積貢獻(xiàn)率

把多個(gè)主成分的貢獻(xiàn)率由大到小累加起來(lái),就得到各主成分的累積貢獻(xiàn)率

m:

m=這就是前m個(gè)主成分Y1,Y2,…,Ym對(duì)X“總方差”的累積貢獻(xiàn)率。

m愈大,表明前m個(gè)主成分的方差占全部總方差的比率愈大,反映X的總信息就越多。當(dāng)

m接近于1時(shí),表明前m個(gè)主成分已基本上綜合了原指標(biāo)X的總信息。

3.主成分個(gè)數(shù)m的確定

一般可有如下兩種方法來(lái)確定主成分的個(gè)數(shù)(即m取值):①確定某個(gè)m使得

m>70%。②取m=所有λi中大于或近似于1的個(gè)數(shù)。(其中λi為相關(guān)陣R的特征值)。因子分析

factoranalysis

1.因子(factor):

進(jìn)行多指標(biāo)變量(因素)研究時(shí),盡管各指標(biāo)之間的關(guān)系錯(cuò)綜復(fù)雜,但都可以概括為兩個(gè)方面。一方面是所有指標(biāo)(變量)各自都表現(xiàn)出一定的相對(duì)獨(dú)立性;另一方面,它們又表現(xiàn)出一定的相互關(guān)聯(lián)性。對(duì)于前者,可以看作為事物“個(gè)體特性”的反映;對(duì)于后者,則可認(rèn)為是構(gòu)成該事物的所有特征的共性反映。共性的背后有一個(gè)共同的東西在支配這些指標(biāo),使之表現(xiàn)為不同的方式組合,體現(xiàn)出共同的作用。

因子分析的概念例如,人的收縮血壓和舒張血壓這兩個(gè)指標(biāo)一方面表現(xiàn)出各自的獨(dú)立性,各自的測(cè)量值不同,意義不同。然而,收縮壓與舒張壓又總是密切相關(guān)的,其根本原因在于收縮壓和舒張壓二者都是受心臟血管系統(tǒng)支配的。心血管系統(tǒng)既要求收縮壓和舒張壓對(duì)心血管的正?;顒?dòng)分擔(dān)不同的任務(wù),同時(shí)又要求二者密切配合,共同為心血管系統(tǒng)的正常功能服務(wù)。反過(guò)來(lái),假設(shè)我們還不知道收縮壓和舒張壓是受心血管系統(tǒng)的控制?,F(xiàn)在,通過(guò)醫(yī)學(xué)研究,測(cè)得n個(gè)個(gè)體的收縮壓和舒張壓,得到了一系列研究數(shù)據(jù)。問(wèn)題在于可否通過(guò)對(duì)這些數(shù)據(jù)的統(tǒng)計(jì)學(xué)分析,找出影響這兩個(gè)血壓的“共性”來(lái),即我們稱之為因子的東西。2.因子分析

因子分析就是尋找隱含在多變量數(shù)據(jù)中的、無(wú)法直接觀察到的公共因子的一種多元統(tǒng)計(jì)分析方法。其目的就是要通過(guò)對(duì)多變量觀察數(shù)據(jù)的分析,找出支配多個(gè)指標(biāo)間相互關(guān)系的少數(shù)幾個(gè)(小于原指標(biāo)個(gè)數(shù))共性因子(有時(shí)也稱公共因子,下同),而且要求這些找出的公共因子彼此互相獨(dú)立。盡管這些公共因子往往不能直接測(cè)定,但若以這些共性因子(新指標(biāo)變量)代替原來(lái)觀察測(cè)量的變量,卻能夠使原指標(biāo)所包含信息總量損失很小。

因子分析的數(shù)學(xué)模型設(shè)對(duì)于某一研究問(wèn)題,觀察了P個(gè)變量(X1,X2,…,XP),記為X=(X1,X2,…,XP)

。變量Xi=Xi的獨(dú)立成分+Xi

的共性成分若Xi

與其他的Xi

無(wú)任何相關(guān)性(即沒(méi)有共性部分),則等式右邊的公共成分部分就為零。由于支配(或影響)P個(gè)變量的共性因子往往不止一個(gè),記為m個(gè):f1,f2,…,fm(m<p),則有:

X=AF+CU

其中A=(aij)pxm

F=(f1,f2,…,fm)

CU=(C1U1,C2U2,…,CPUP)

若記Xi*=ai1f1+ai2f2+…+aimfm,則Xi*為Xi的共性部分,系數(shù)aij則表示Xi在因子fj上的載荷(負(fù)荷),又叫做因子載荷。也有人把a(bǔ)ij叫權(quán)重系數(shù),其大小表明Xi依賴fj的程度。而矩陣A=(aij)pxm則稱為因子載荷矩陣。Ui表示Xi的獨(dú)立部分,又稱為獨(dú)立因子。Ci為Xi在Ui上的負(fù)荷。因子載荷

所謂因子分析,就是從可以測(cè)量的變量(X1,X2,…,XP)的樣本觀察值,即研究獲得的數(shù)據(jù)資料中,求出因子載荷矩陣A;再運(yùn)用求出的因子和因子載荷矩陣來(lái)預(yù)測(cè)公因子(f1,f2,…,fm)。在進(jìn)行因子分析時(shí),為了消去變量量綱的影響,常常將變量觀察結(jié)果首先進(jìn)行標(biāo)準(zhǔn)化處理。如果把標(biāo)準(zhǔn)化處理后的結(jié)果仍然記為(X1,X2,…,XP),則有E(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論