版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
YOURSITEHERE第一節(jié)引言第1頁/共111頁第一頁,共112頁。YOURSITEHERE回歸分析因果因子分析由因索果執(zhí)果析因第2頁/共111頁第二頁,共112頁。YOURSITEHERE方陣的特征值和特征向量對于n階方陣AAx=lx特征值實數(shù)(也可以是復數(shù))特征向量n維非零向量可以用從一點指向另一點的箭頭來表示縮放因子矩陣乘法對應了一個變換,把一個向量變成同維數(shù)的另一個向量第3頁/共111頁第三頁,共112頁。YOURSITEHERE一個變換的特征向量是這樣一種向量,它經(jīng)過這種特定的變換后保持方向不變,只是進行長度上的伸縮而已。特征向量所指示的方向是更本質的東西,特征值只不過反映了特征向量在變換時的伸縮倍數(shù)。特征方程|A-lI|=0的解為特征值l;滿足(A-liI)xi=0的向量xi為li的特征量。第4頁/共111頁第四頁,共112頁。YOURSITEHEREn階方陣A有且恰有n個特征值;AT與A有相同的特征值;n階方陣A=(aij)nxn的跡等于其特征值之和;實對稱矩陣A的特征值都是實數(shù);實對稱矩陣A的不同特征值所對應的特征向量都正交。因此,其特征值可以排序:l1≥l2≥…≥lp因此,存在正交矩陣P,使得P-1AP=∧
(以A的n個特征值為對角元素的對角陣)第5頁/共111頁第五頁,共112頁。YOURSITEHERE地質成因是地質學研究的根本問題之一。理性認識↑感性認識內在本質↑外在表象從定量角度對各地質變量進行成因分析,所建立的數(shù)學模型一般有主成分分析(又稱主分量分析)因子分析(R型、Q型)對應分析第6頁/共111頁第六頁,共112頁。YOURSITEHERE在如此多的地質變量之中,有很多是相關的。人們希望能夠找出它們的少數(shù)“代表”來對它們進行描述。需要把這種有很多變量的數(shù)據(jù)進行高度概括。一般情形下,每個變量都會提供一定的信息,但其重要程度與側重有所不同,且這些變量所提供的信息在一定程度上有所重疊。把所有指標和數(shù)字都原封不動地擺出去嗎?第7頁/共111頁第七頁,共112頁。YOURSITEHERE利用相關性來對所涉及的變量加以“改造”和“組合”。用為數(shù)較少的、互不相關(或基本不相關)的新變量來“代表”原來多個變量所提供的信息。通過對新變量的分析達到合理分析和數(shù)據(jù)解釋的目的。相關→互不相關第8頁/共111頁第八頁,共112頁。YOURSITEHERE潛在的、可導出的(latent、derived)少量不相關取主舍次識別、分離隱性的基因的可觀測的(observed)大量相關主次雜亂混合、疊加顯性的多樣化的地質資料觀測變量因子兩類變量的不同特性執(zhí)果析因第9頁/共111頁第九頁,共112頁。YOURSITEHERE最早提出:J.Person(皮爾遜),主成分分析,1901、S.Spearman(斯卑爾曼),真因子分析,1904年,用于心理學研究;Benzeci(貝爾凱斯),對應分析,1970。因子分析最早引入地質領域:W.C.Krumbren(克倫賓),1957年,研究沉積學。應用發(fā)展的重要地質人物:J.Imbrie(英布里)發(fā)展簡史已成為地質學等領域中傳播最快、應用最廣的多元統(tǒng)計方法之一。第10頁/共111頁第十頁,共112頁。YOURSITEHERE基本概念是一種常用的處理高維數(shù)據(jù)的多元統(tǒng)計分析方法。是一種化繁為簡,將指標盡可能壓縮的降維(即空間壓縮)技術。把數(shù)目較多的變量作線性組合,組合成幾個主要的新變量——主成分,少數(shù)幾個主成分代表了原有變量變化的主要信息。又稱主分量分析。主成分分析(PrincipalComponentAnalysis)作用:降維第11頁/共111頁第十一頁,共112頁。YOURSITEHERE信息的大小如何度量?從統(tǒng)計分析角度看,一個指標(看作隨機變量)或一串數(shù)據(jù)所包含的信息,可以用差異的大小——方差來度量。方差越大,所包含的信息量就越大;方差越小,所包含的信息量就越小。數(shù)學物理化學總分甲807060210乙707060200丙607060200第12頁/共111頁第十二頁,共112頁。YOURSITEHEREx1x2y2y1第13頁/共111頁第十三頁,共112頁。YOURSITEHERE是一種常用的處理高維數(shù)據(jù)的多元統(tǒng)計分析方法。是一種探索不易觀測或不能觀測的潛在因素,用有限個隱變量來解釋原始變量之間相關關系的技術。是通過對地質觀測數(shù)據(jù)的分析來建立一個成因系統(tǒng)。它能把原來具有一定程度相關聯(lián)系的地質變量轉換為數(shù)量較少的由原始地質變量組合而成的新變量——因子,用它們來代替原始變量,各因子之間基本上是不相關的(基本獨立)。又稱析因分析。因子分析(FactorAnalysis)基本概念第14頁/共111頁第十四頁,共112頁。YOURSITEHERE相關性度量:變量間的方差-協(xié)方差、相關系數(shù)相關性度量:夾角余弦和各種距離系數(shù)R型因子分析R型因子分析是主成分分析的發(fā)展Q型因子分析研究變量之間的成因分類研究樣品之間的成因分類因子分析分類第15頁/共111頁第十五頁,共112頁。YOURSITEHERECIMFEABDKLGJN形狀因子1因子2因子3=2+0+0CHH=2+1+1第16頁/共111頁第十六頁,共112頁。YOURSITEHERE沉積盆地與剝蝕區(qū)示意圖F1F2F3xj=f(F1,F2,F3,ε)第17頁/共111頁第十七頁,共112頁。YOURSITEHEREMgCO3SiO2CaCO3COMgCaSi碳酸鹽演示分類三角圖解第18頁/共111頁第十八頁,共112頁。YOURSITEHERER2R1R1=[4Si-11(Na+K)-2(Fe+Ti)]R2=(Al+2Mg+6Ca)侵入巖分類R1-R2圖解(DelaRoche等,1980)第19頁/共111頁第十九頁,共112頁。YOURSITEHERE因子分析典型應用問題沉積盆地蝕源區(qū)的研究沉積物粒度分析沉積相研究地層分析古生物與古環(huán)境的研究巖石化學成分的研究變質巖原巖恢復礦床成因研究礦物的類質同象研究地球化學等識別礦化活動的階段和類型分析成礦控制因素識別地層剖面上發(fā)生的氣候、水體深度、物質來源,水動力學條件等沉積環(huán)境因素的細微變化。識別在同一時間點上不同空間過程的疊加過程;識別蝕源區(qū)的個數(shù)、巖石類型、分布識別巖漿巖的形成過程,諸如巖漿的異源疊加,或同源多期侵入,分異作用,交代作用,同化作用,交代識別作用,礦化活動等;巖漿巖的分類識別在同一空間點上不同時間過程的疊加過程第20頁/共111頁第二十頁,共112頁。YOURSITEHERE作用:用最精煉的形式描述地質對象(壓縮原始數(shù)據(jù),降維技術)指示成因推理方向(探索潛在因素、進行成因分類、思考成因結論)分解疊加的地質過程(例如:得到礦物共生組合變量→劃分不同成礦階段→不同地質過程分解、時空分解)等第21頁/共111頁第二十一頁,共112頁。YOURSITEHERE是在R型因子分析和Q型因子分析的基礎上發(fā)展起來的,能夠揭示變量與樣品之間雙重關系的一種多元統(tǒng)計方法。又稱R-Q型因子分析。對應分析(CorrespondenceAnalysis)基本概念第22頁/共111頁第二十二頁,共112頁。因子分析是研究系統(tǒng)分類、成因分類的重要手段,在地質研究中的作用:
第一、壓縮原始數(shù)據(jù)。
第二、指示成因推理方向。
第三、分解疊加的地質過程。
第23頁/共111頁第二十三頁,共112頁。因子分析是研究變量間相關關系、樣品間相似關系、變量與樣品間成因聯(lián)系以及探索它們之間產(chǎn)生上述關系之內在原因的一些多元統(tǒng)計分析方法的總稱.根據(jù)它們的的研究對象可分為:(1)、主成分分析;(2)、R型因子分析;(3)、Q型因子分析;(4)、對應分析;第24頁/共111頁第二十四頁,共112頁。因子分析在地質研究中的應用:第25頁/共111頁第二十五頁,共112頁。YOURSITEHERE第二節(jié)主成分分析第26頁/共111頁第二十六頁,共112頁。2主成分分析地質中經(jīng)常要作多變量的綜合分析,這些變量經(jīng)常是不獨立的,存在復雜的相關關系。為了化繁為簡,用一種數(shù)學方法把數(shù)目較多的變量作線性組合,組合成幾個主要的新變量——主成分。第27頁/共111頁第二十七頁,共112頁。YOURSITEHERE一、主成分分析的基本思想構造關于原始變量的適當?shù)木€性組合,形成幾個新變量(即所謂的主成分),它們是我們用來代替原始變量進行資料解釋的綜合性指標。這一分析過程應使得每個新變量都是各原始變量的線性組合新變量的數(shù)目大大少于原始變量的數(shù)據(jù)新變量保留了原始變量所包含的絕大部分信息新變量之間互不相關,即各自含義的信息不重疊。第28頁/共111頁第二十八頁,共112頁。主成分的幾何意義:
(1)N個點的新坐標F1和F2的相關很小,幾乎為零。
(2)在新坐標系中N個點的波動(方差)大部分歸結為F1的波動,F(xiàn)2的波動很小,故用F1就可以反映變化的大部分信息。
(3)由于是正交坐標系,坐標(F1,F(xiàn)2)與(x1,x2)間的關系可用下式表示:
x1x2F1F2A是正交矩陣,滿足第29頁/共111頁第二十九頁,共112頁。第30頁/共111頁第三十頁,共112頁。計算步驟:
(1)作數(shù)據(jù)標準化。
(2)計算變量之間的相關系數(shù)矩陣
(3)用Jacobi法計算相關系數(shù)矩陣R的特征值λj及對應的特征向量uj(j=1,2,…,p)即可得主成分Fj,其表達式為:
第31頁/共111頁第三十一頁,共112頁。(4)計算前m個特征值所占的累計百分比:
(5)計算各個樣品在m個主成分上的得分,第i個樣品的第j個主成分為:
(6)利用前m個主成分作地質解釋或利用樣品在主成分上的得分對樣品進行分類。
第32頁/共111頁第三十二頁,共112頁。第33頁/共111頁第三十三頁,共112頁。第34頁/共111頁第三十四頁,共112頁。第35頁/共111頁第三十五頁,共112頁。第36頁/共111頁第三十六頁,共112頁。第37頁/共111頁第三十七頁,共112頁。第38頁/共111頁第三十八頁,共112頁。第39頁/共111頁第三十九頁,共112頁。YOURSITEHERE二、主成分分析的數(shù)學提法觀測資料矩陣x1 x2xpCaseVar.12n確定應該構造多少個綜合指標(主成分),并如何構造出各主成分的表達式(用x1,x2,…,xp表示)第40頁/共111頁第四十頁,共112頁。YOURSITEHEREx1x2y2y1方差越大,所包含的信息量就越大主成分分析第41頁/共111頁第四十一頁,共112頁。YOURSITEHERE我們希望用y1來代替原來p個變量x1,x2,…,xp,這就要求在向量l1的正則化條件下,y1的方差盡可能大,由此確定的隨機變量y1稱為第一主成分。如果第一主成分還不足以反映原來p個變量的信息,那么考慮第二主成分。為了有效反映原變量的信息,新變量y1和y2所包含的信息不應重疊,即要求y1和y2不相關。前述兩個約束條件下求l2使Var(y2)達到最大,從而得到第二主成分。第42頁/共111頁第四十二頁,共112頁。YOURSITEHERE以此類推,我們最多可以找出p個yi出來。然而我們最多只選擇k個yi(i=1,2,…,k,k<p),并希望主成分數(shù)量較少,但解釋能力卻能達到約85%以上。推導表明:變量x1,x2,…,xp的主成分是以協(xié)方差矩陣S(或相關矩陣R)的特征向量為系數(shù)的線性組合,它們互不相關,方差為S(或R)的特征根。而S(或R)的特征根l1≥
l2≥…≥
lp,所以有:Var(y1)≥Var(y2)≥…≥Var(yp)>0。第43頁/共111頁第四十三頁,共112頁。YOURSITEHERE對p個指標,經(jīng)過適當線性組合,p個新變量為這里y1,y2,…,yp——分別稱為第一主成分、第二主成分、第p主成分。lij——稱為第i個主成分yi
在第j個原始變量xj
上的載荷(主成分載荷),是第i個特征向量的第j個分量
。第44頁/共111頁第四十四頁,共112頁。YOURSITEHERE其中,樣本協(xié)方差矩陣樣本相關矩陣對標準化數(shù)據(jù)矩陣:新變量(隨機變量)yi的方差與協(xié)方差第45頁/共111頁第四十五頁,共112頁。YOURSITEHERE一般地,在約束條件(向量l的正則化)(yi和yk所包含的信息不應重疊,即yi和yk不相關)之下求向量li,使Var(yi)達到最大,由此向量li所確定的稱為x1,x2,…,xp的第i個主成分。第46頁/共111頁第四十六頁,共112頁。YOURSITEHERE三、主成分的性質①Y=L’X,L’L=I。這里,L為X的協(xié)差陣的特征向量(單位化的)組成的正交陣。②y的各分量之間是互不相關的。③y的p個分量是按方差大小、由大到小排列的。④
y的協(xié)差陣為對角陣。第47頁/共111頁第四十七頁,共112頁。YOURSITEHERE第k個主成分的方差貢獻率前k個主成分的累積方差貢獻率(一般取80%,85%)⑤⑥這里,a(yi,xj)表示第i個主成分yi
和第j個原始變量xj
之間的線性相關系數(shù),稱為因子載荷。矩陣A=(aij)稱為因子載荷矩陣標準化:消除量綱和數(shù)量級上的影響,sii=1(k<p)系統(tǒng)總方差不變(i,j=1,2…,p)⑦⑧第48頁/共111頁第四十八頁,共112頁。YOURSITEHERE①對原始數(shù)據(jù)進行標準化變換②計算個變量間的相關系數(shù),形成相關系數(shù)矩陣R。③求出R的特征值并按大小排列及相應于的單位特征向量。即可得主成分的表達式。④將特征值按大小降序排列,計算前k個特征值之和占特征值總和的百分數(shù),一般按累積方差貢獻率大于85%(或80%)的準則,來確定k,從而建立前k個主成分:四、主成分的計算步驟第49頁/共111頁第四十九頁,共112頁。YOURSITEHERE⑤計算各個樣品在k個主成分上的得分。第i個樣品的第j個主成分得分為:從而可得新指標(主成分)樣本值(yij)nxk以代替原樣本值(xij)nxp作統(tǒng)計分析。⑥對前k個主成分進行地質解釋并對樣品進行分類。四、主成分的計算步驟第50頁/共111頁第五十頁,共112頁。YOURSITEHERE(A)Sn,(B)As,(C)Cu,(D)Pb,(E)Zn,(E)Cd.三角符號表示錫礦床,粗黑線條表示斷層四、應用實例第51頁/共111頁第五十一頁,共112頁。YOURSITEHERE第52頁/共111頁第五十二頁,共112頁。YOURSITEHERE第一主成分第53頁/共111頁第五十三頁,共112頁。YOURSITEHERE第三節(jié)因子分析第54頁/共111頁第五十四頁,共112頁。YOURSITEHERE一、因子分析的基本思想對于直接可觀測的隨機變量,根據(jù)其相關性大小,使得同組內的變量之間相關性較高,不同組的變量相關性較低。每組變量代表一個基本結構,用一個不可觀測的綜合變量表示,這個基本結構稱為公因子。于是,原始觀測的隨機變量X可分解為不可觀測(或未做觀測)的兩個隨機向量的線性組合:一是對整個X有影響的公共因素——公因子;二是只對各對應分量有影響的特殊因素——特殊因子。第55頁/共111頁第五十五頁,共112頁。YOURSITEHEREF1F2第56頁/共111頁第五十六頁,共112頁。YOURSITEHERE建立因子載荷矩陣給出各公共因子的合理解釋及命名若有必要(當難以招到合理解釋的公共因子)時,進一步作因子旋轉。因子分析的基本任務是:因子分析就是尋找這些公共因子的模型分析方法,它是在主成分的基礎上構筑若干意義較為明確的公因子,以它們?yōu)榭蚣芊纸庠兞?,以此考察原變量間的聯(lián)系與區(qū)別。第57頁/共111頁第五十七頁,共112頁。百米跑成績X1跳遠成績X2鉛球成績X3跳高成績X4400米跑成績X5百米跨欄X6鐵餅成績X7撐桿跳遠成績X8標槍成績X91500米跑成績X10
奧運會十項全能運動項目得分數(shù)據(jù)的因子分析
第58頁/共111頁第五十八頁,共112頁。
因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運動因子。其他的3個因子不太容易解釋。似乎是跑和投擲的能力對比,似乎是長跑耐力和短跑速度的對比。于是考慮旋轉因子,得下表第59頁/共111頁第五十九頁,共112頁。
通過旋轉,因子有了較為明確的含義:
X1百米跑,X2跳遠和X5400米跑,需要爆發(fā)力的項目在F1有較大的載荷,F1可以稱為短跑速度因子;
X3鉛球,X7鐵餅和X9
標槍在F2上有較大的載荷,可以稱為爆發(fā)性臂力因子;
X6百米跨欄,X8撐桿跳遠,X2跳遠和X4跳高在F3上有較大的載荷,F(xiàn)3爆發(fā)腿力因子;F4
長跑耐力因子第60頁/共111頁第六十頁,共112頁。設對研究對象的n個樣品測試了p個變量x1,x2,…,xp,可認為這p個變量共同起因于m因子(即因素)F1,F2,…,Fm.假定這m個公因子(可理解為新的變量)對每個指標(變量)的影響或作用是線性的(我們總是討論線性模型),那么,因子分析模型可以表示為:
二、R型因子分析的數(shù)學提法第61頁/共111頁第六十一頁,共112頁。YOURSITEHERE稱為因子模型。矩陣形式第62頁/共111頁第六十二頁,共112頁。YOURSITEHERE(1)x=(x1,x2,…,xp)'是可觀測隨機向量,均值向量E(x)=0,協(xié)方差陣Cov(X)=∑,且協(xié)方差陣∑與相關矩陣R相等(因子分析通常要先對觀測資料數(shù)據(jù)作標準化處理);(2)F=(F1,F2,…,Fm)’(m<p)是不可測的向量,其均值向量E(F)=0,協(xié)方差矩陣Cov(F)=I,即向量的各分量是相互獨立的;(3)ε=(ε1,ε2,…,εp)’與F相互獨立Cov(F,ε)=0,且E(ε)=0,e的協(xié)方差陣∑是對角陣,即各分量e之間是相互獨立的。假定條件第63頁/共111頁第六十三頁,共112頁。YOURSITEHERE因子載荷第i個變量在第j個公因子上的載荷A中元素aij稱為第64頁/共111頁第六十四頁,共112頁。YOURSITEHERE主成分模型特征向量約束條件從而,每個原始變量亦可用各主成分F1,F2,…,Fp的線性組合來表示實際上,我們不需要p個主成分,按累積方差貢獻取前m個主成分。從主成分分析模型到因子分析模型第65頁/共111頁第六十五頁,共112頁。YOURSITEHERE這m個主成分對應的數(shù)據(jù)矩陣就是將特征向量矩陣剖分成:(i=1,2,…,p)于是使得模型中FA和FB因子中各變量都是標準化,即均值為0,方差為1,可得R型因子模型:從主成分分析模型到因子分析模型第66頁/共111頁第六十六頁,共112頁。YOURSITEHERE稱為因子模型。矩陣形式因子分析——二、R型因子分析的數(shù)學提法公因子、公共因子或潛因子特殊因子唯一因子原始觀測變量共性個性第67頁/共111頁第六十七頁,共112頁。YOURSITEHERE因子載荷第i個變量在第j個公因子上的載荷A中元素aij稱為略去特殊因子部分,因子分析的簡化模型(m<p)第68頁/共111頁第六十八頁,共112頁。YOURSITEHERE三、因子載荷矩陣的求解方法一:主成分法方法二:極大似然法(在多元正態(tài)分布的假定下)第69頁/共111頁第六十九頁,共112頁。YOURSITEHERE四、與因子載荷矩陣的統(tǒng)計意義(1)因子載荷aij的統(tǒng)計意義aij——第i個變量在第j個公因子上的載荷;lij——由相關矩陣R提取的第j個公因子之特征值(j=1,2,...,m)所對應的特征向量在第i個分量。因子載荷求解公式:(注意:E(Fj)=0,Var(Fj)=1)aij——是變量xi與Fj的協(xié)方差,也是xi與Fj的相關系數(shù)(依賴程度)。第i個變量在第j個公因子上的重要性(權重)。aij
的絕對值越大(|aij|≤1),表明xi
與Fj的相依程度越大,或稱公共因子Fj
對于xi的載荷量越大。公因子F的實際含義,這可以通過各變量在公因子上載荷的符號與絕對值的大小來描述。第70頁/共111頁第七十頁,共112頁。YOURSITEHERE(2)變量共同度hi2的統(tǒng)計意義(也稱公因子方差、共性方差、公共方差)因子載荷矩陣中各行元素的平方和F1F2Fm公因子方差hi2代表所有m個公因子對原始變量xi的總方差的貢獻。反映了xi對于F1,F2,…,Fm的共同依賴程度。如果公因子方差近于1,則說明該變量xi的幾乎全部原始信息都被所選取的因子說明了。公因子方差的意義在于提供轉化為因子空間后,保留原來各變量的信息有多少。 注意:(特殊方差個性方差)第71頁/共111頁第七十一頁,共112頁。YOURSITEHERE(3)公因子Fj的方差貢獻的統(tǒng)計意義因子載荷矩陣中各列元素的平方和F1F2Fm公因子Fj對所有原始變量所提供方差貢獻的總和。它是衡量公因子相對重要性的指標。gj2
越大,表明公因子Fj
對
x的貢獻越大,或者說對x的影響和作用就越大。如果將因子載荷矩陣A的所有gj2(j=1,2,…,m)都計算出來,使其按照大小排序,就可以依此提煉出最有影響力的公共因子。注意:第72頁/共111頁第七十二頁,共112頁。YOURSITEHERE五、因子旋轉1.旋轉的目的建立因子分析模型的目的不僅是找出主因子,更重要的是知道每個主因子的意義,以便對實際問題進行分析。如果求出的主因子解后,各個主因子的“典型變量”不很突出,還需要進行因子旋轉。使因子載荷兩極分化,因子載荷的平方值要么接近于0,要么接近于1。通過適當?shù)男D得到比較滿意的因子。第73頁/共111頁第七十三頁,共112頁。YOURSITEHERE(2)常用的旋轉方法①方差最大正交旋轉(varimaxorthogonalrotation)——因子對應軸相互正交②斜交旋轉(obliquerotation)——因子對應軸相互間不正交第74頁/共111頁第七十四頁,共112頁。YOURSITEHERE②斜交旋轉因子斜交旋轉后,各因子負荷發(fā)生了較大變化,出現(xiàn)了兩極分化。各因子間不再相互獨立,而彼此相關。各因子對各變量的貢獻的總和也發(fā)生了改變。適用于大數(shù)據(jù)集的因子分析。①方差最大正交旋轉基本思想以使各因子載荷值的方差達到最大作為因子載荷矩陣簡化的準則,且保持原公因子的正交性和變量共同度hi2不變,此時公因子的方差貢獻則不再與原來相同??墒姑總€因子上的具有最大載荷的變量數(shù)最小,因此可以簡化對因子的解釋。第75頁/共111頁第七十五頁,共112頁。YOURSITEHERE因子旋轉的操作對于二維因子來說好辦,而多維因子的旋轉就復雜多了,每次只調整兩個因子軸,讓其它的軸固定,這樣不斷反復地進行,直到獲得最大方差為止。bij為旋轉后因子載荷中第i行第j列的元素,使用平方是為了避免負值?!_到極大第76頁/共111頁第七十六頁,共112頁。YOURSITEHEREF1F1F2F2Factor1 Factor2 x1 0.5 0.5x2 0.7 0.7x3 -0.6 0.6x4 -0.5 -0.5 Factor1 Factor2 x1 0 0.6x2 0 0.9x3 -0.9 0x4 0 -0.9 21342134正交旋轉及樣品點投影第77頁/共111頁第七十七頁,共112頁。YOURSITEHERE六、因子得分因子分析模型建立后,還有一個重要的作用是應用因子分析模型去評價每個樣品(或變量)在整個模型中的地位,即進行綜合評價。由于公因子能充分反映原始變量的相關關系,用公因子代表原始變量時,將更有利于描述研究對象的特征。通常,所選取的公因子數(shù)總是少于原始變量數(shù)。對于每一個樣品,利用其原始變量觀測值去計算相應因子Fi的估計值,這便稱為因子得分或因子計量。第78頁/共111頁第七十八頁,共112頁。YOURSITEHERE變成F=bx
或Fj=bj1x1+…+bjpxpj=1,…,m.
稱為因子得分(函數(shù)).由簡化的因子模型可用Thomson法,即回歸法等來求?;貧w法得分是由Bayes思想導出的,得到的因子得分是有偏的,但計算結果誤差較小。第79頁/共111頁第七十九頁,共112頁。YOURSITEHERE根據(jù)最小二乘估計得因為變量和因子均已標準化,所以bj0=0第80頁/共111頁第八十頁,共112頁。第81頁/共111頁第八十一頁,共112頁。YOURSITEHERE七、Q型因子分析(自學)第82頁/共111頁第八十二頁,共112頁。YOURSITEHERE輸入原始數(shù)據(jù)xn*p,計算樣本均值和方差,進行標準化計算(處理);求樣本相關系數(shù)矩陣R=(rij)p*p;求相關系數(shù)矩陣的特征根λi(λ1,λ2,…,λp>0)和相應的標準正交的特征向量li;八、因子分析的步驟第83頁/共111頁第八十三頁,共112頁。YOURSITEHERE確定公共因子數(shù)m(按前m個特征值之和占特征值總和的百分比來確定);求出主因子載荷矩陣A=[aij];計算公共因子的共性方差hi2,是否接近于1;對載荷矩陣進行旋轉,以求能更好地解釋公共因子;計算因子得分;對公共因子作出專業(yè)性的解釋。第84頁/共111頁第八十四頁,共112頁。YOURSITEHERE相關性度量:變量間的方差-協(xié)方差、相關系數(shù)相關性度量:夾角余弦和各種距離系數(shù)R型因子分析——控礦地質因素分析R型因子分析是主成分分析的發(fā)展Q型因子分析——圈定遠景區(qū)研究變量之間的成因分類研究樣品之間的成因分類第85頁/共111頁第八十五頁,共112頁。焦家金礦礦化元素因子分析地質找礦論叢,2008年02期焦家金礦位于膠東西北部,是“焦家式破碎帶熱液蝕變巖型”金礦的命名地。它以規(guī)模巨大、礦體形態(tài)簡單、礦化連續(xù)、穩(wěn)定等特點明顯有別于石英脈金礦。第86頁/共111頁第八十六頁,共112頁。在水平上,以斷面為中心向外依次出現(xiàn)絹英巖化帶、鉀化-絹英巖化-硅化帶、硅化-鉀化帶、正?;◢弾r帶;在垂向上,蝕變分帶不是很發(fā)育,隨著深部韌性變形作用加強,蝕變的強度和規(guī)模都逐漸減小。第87頁/共111頁第八十七頁,共112頁。第88頁/共111頁第八十八頁,共112頁。第89頁/共111頁第八十九頁,共112頁。第90頁/共111頁第九十頁,共112頁。第91頁/共111頁第九十一頁,共112頁。第92頁/共111頁第九十二頁,共112頁。第93頁/共111頁第九十三頁,共112頁。第94頁/共111頁第九十四頁,共112頁。第95頁/共111頁第九十五頁,共112頁。第96頁/共111頁第九十六頁,共112頁。第97頁/共111頁第九十七頁,共112頁。YOURSITEHERE第四節(jié)對應分析第98頁/共111頁第九十八頁,共112頁。YOURSITEHERE對應分析是在R型因子分析和Q型因子分析的基礎上發(fā)展起來的、能夠揭示變量與樣品之間雙重關系的一種多元統(tǒng)計方法。第99頁/共111頁第九十九頁,共112頁。YOURSITEHERE可提供以下信息:①變量間的關系:空間上鄰近的一些變量點,表示這些變量緊密相關,即它們具有成因上的聯(lián)系,指示某一特定的地質作用;②樣品間的關系:鄰近的樣品點具有相似的性質,屬同一類型,是同樣地質作用的產(chǎn)物;③變量與樣品之間的關系:同一類型的樣品點將為鄰近的變量點所表征。也就是說,同類樣品點為其鄰近變量點所指示的地質作用下的產(chǎn)物。更重要的是,可在同一圖上表示出上述三種信息,從而可同時進行分類及地質推斷解釋。第100頁/共111頁第一百頁,共112頁。YOURSITEHERER型和Q型對應關系的對偶定理第101頁/共111頁第一百零一頁,共112頁。YOURSITEHERE第102頁/共111頁第一百零二頁,共112頁。YOURSITEHEREG2F2G2
F200.2-0.20.20.4-0.2-0.41.2.3.4.5.6.7.8.11.10.12.9.13.1△2△3△4△5△6△7△8△9△圖3.2.3對應分析的R型因子載荷和Q型因子載荷圖(圓點為樣品點,三角為變量點)第103頁/共111頁第一百零三頁,共112頁。YOURSITEHERE主成分分析是將主分量表示為原觀測變量的線性組合,而因子分析是將原觀測變量表示為公共因子的線性組合;主成分分析的主成分數(shù)m和原變量數(shù)p相等,它是將一組具有相關性的變量變換為一組獨立的變量,而因子分析的目的是要使公共因子數(shù)。m比原變量數(shù)p小,而且要盡可能地選取小的m,以便盡可能地構造一個結構簡單
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 沖床模具生產(chǎn)管理制度
- 魚船安全生產(chǎn)管理制度
- 生產(chǎn)插單計劃管理制度
- 畜牧安全生產(chǎn)培訓制度
- 安全生產(chǎn)班前提醒制度
- 2026上半年云南事業(yè)單位聯(lián)考旅游職業(yè)學院招聘14人備考考試試題附答案解析
- 安全生產(chǎn)動態(tài)監(jiān)管制度
- 2026上海市中醫(yī)醫(yī)院新職工招聘183人(第一批)備考考試題庫附答案解析
- 雙匯冷鮮肉生產(chǎn)規(guī)章制度
- 生產(chǎn)技術交底制度
- 2026年江蘇經(jīng)貿職業(yè)技術學院單招職業(yè)傾向性測試模擬測試卷必考題
- 2026年中藥材生產(chǎn)質量管理規(guī)范理論考試題含答案
- 北京市東城區(qū)2025-2026年高三上期末地理試卷(含答案)
- 肥胖患者麻醉管理
- 小鯉魚跳龍門電子版
- 2019年急性腦梗死出血轉化專家共識解讀
- 《混凝土結構工程施工規(guī)范》
- 土地證延期申請書
- 硫乙醇酸鹽流體培養(yǎng)基適用性檢查記錄
- 進階切分技法advanced funk studies rick latham-藍色加粗字
- GB 19079.12-2013體育場所開放條件與技術要求第12部分:傘翼滑翔場所
評論
0/150
提交評論