ch4主分量分析與主因子.ppt_第1頁
ch4主分量分析與主因子.ppt_第2頁
ch4主分量分析與主因子.ppt_第3頁
ch4主分量分析與主因子.ppt_第4頁
ch4主分量分析與主因子.ppt_第5頁
免費預(yù)覽已結(jié)束,剩余66頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第四章 主分量分析與主因子分析,主分量分析,又稱主成分分析,進行空間分析時又稱經(jīng)驗正交函數(shù)展開,該方法及其衍生技術(shù)在氣候統(tǒng)計分析與預(yù)測中的應(yīng)用非常廣泛。 對事物特征的描述因子往往有眾多的反映不同特征的指標(biāo),而由于因子眾多,而且因子之間存在相關(guān)和重疊,特征描述就比較雜亂,難以表現(xiàn)最主要的規(guī)律,主分量分析就是歸納多因子的線性組合得到綜合因子,而這個綜合因子指標(biāo)概括了多個因子變化的主要信息,從而可以減少表示特征的因子數(shù),這個綜合指標(biāo)稱為主成分或主分量。,打個比方,測量空氣中的C和O元素含量的變化,在n個樣本中發(fā)現(xiàn),CO2濃度比較穩(wěn)定,CO變化較大, ,若C的含量為X1,O的含量為X2,則co的含量y

2、=x1+x2 ,就是主成分,它綜合反映C和O的變化,而可不考慮CO2的變化。,從某種角度上說,各因子之間的相關(guān)性,必然存在起支配作用的共同因素,每一主成分代表變量間結(jié)合關(guān)系的一種作用。 如氣象統(tǒng)計中,經(jīng)常要研究各種氣象要素場,如環(huán)流場,溫度場,如果抽取要素場某段時期的資料,就構(gòu)成一組以網(wǎng)格點為空間點隨時間變化的樣本,氣象演變規(guī)律體現(xiàn)在要素場的結(jié)構(gòu)上,一個空間場特征需眾多的變量(空間點)描述,分析復(fù)雜,不易反映其主要特征,主分量分析用多因子組合綜合反映一種典型分布(如經(jīng)向環(huán)流),即概括多因子變化的主要信息。,4.1 主分量的概念,例: 設(shè)所分析的對象有兩個指標(biāo)量,記為x1 、x2,樣本容量n=2

3、5,資料,統(tǒng)計得到, 兩者的解釋方差分別為20.3/44.4=46% ,24.1/44.4=54% ,兩變量的解釋方差基本相當(dāng)。,y1,y2,如果沿樣本變化的主軸方向作坐標(biāo)變換,則由原變量組合新變量,按上式分別計算y1、y2的樣本值如表,計算方差為,y1、y2的 解釋方差分別占為86%和14%,y1能夠解釋絕大部分的變化特征,y1最大限度地反映了x1,x2的變化信息。把新變量稱為x1和x2的主成分。客觀上可用較少的變量表達(dá)同樣的信息量,故又稱降維技術(shù)。 構(gòu)造主分量(主成分)應(yīng)使其解釋方差盡可能的大。,4.2 主分量的導(dǎo)出,一、有關(guān)基礎(chǔ)知識復(fù)習(xí) (附錄A、C、D),(一)、矩陣和向量的微分定義

4、設(shè),(二)、求函數(shù)的條件極值的拉格朗日乘數(shù)法,在,的條件下求函數(shù)f(x)=x A x的極值,相當(dāng)于求,的極值,即求,的解,稱為拉格朗日乘子。,函數(shù),(三)、矩陣的特征值與特征向量 一個p階方陣A,若存在p維列向量V和一個非零數(shù),使得,則稱為矩陣A的特征值或特征根,而V稱為A對應(yīng)特征值的特征向量。例,二、主分量的導(dǎo)出,一般的,如果有p個變量x1,xp,將它們綜合組成m個綜合變量:,系數(shù)向量Vi , 由D(yi)=D(ViX)=max導(dǎo)出,已知原氣象資料矩陣,t,對任意i,,根據(jù)要求:,其中,樣本協(xié)方差矩陣,因此有,但如果不對,作限定,則極大值無意義,規(guī)定對Vi作標(biāo)準(zhǔn)化限定,Vi為單位向量,,,在

5、此條件下,求使,達(dá)到極大的向量Vi為一個,條件極值,即在約束條件,下的極值。,根據(jù)拉格朗日法則,即為求:,的極值,由矩陣和向量的 微分(2)、(3),可知原要素樣本協(xié)方差矩陣的特征向量即為極值解。也就是主分量系數(shù)的解。 由,根據(jù)線性代數(shù)知識,要使Vi有非零解,必須滿足條件,(齊次方程組),若S為非奇異陣,,則它有p個非零特征值,和對應(yīng)的特征向量 ,也就有p個主分量y1,yp。,。,由前述 ,,對,,左乘Vi有,主分量yi 的方差等于對應(yīng)特征向量的特征值。對p個特征值按大小排列 ,取最大值1所對應(yīng)的特征向量 ,構(gòu)造第一主分量:,依次可有p個主分量 ,其方差分別為,主分量向量:,樣本矩陣:,三、主

6、分量的性質(zhì),1、各主分量的方差分別為原p 個變量的協(xié)方差的特征值,不同的主分量彼此是獨立的。 實對稱矩陣分解定理:若A 為pp是對稱陣,則必存在一個正交矩陣V(pp),使得 :,其中,為對角陣,陣中元素,為A的特征值,,V為由對應(yīng)的特征向量為列向量組成。,(注:若,,則稱V為正交陣),證:類似有,將 代入,有,性質(zhì)得證。,2、各主分量的方差貢獻(xiàn)按對應(yīng)特征值的大小順序排列。 稱前m個主分量占總方差的百分率為累積方差貢獻(xiàn),或累積解釋方差。,3、p個主分量的總方差與原p個變量的總方差相等。 對關(guān)系式 兩邊取跡得:,故累積解釋方差可寫為,Lorenz最早把主成分分析應(yīng)用到氣象要素場,他對美國64個測站

7、的氣壓場作主成分分析,發(fā)現(xiàn)64個中,前8個主成分已經(jīng)到達(dá)描述總方差的91%,說明用前8個主成分就可以代替64個變量,大為減少研究變量個數(shù)。,當(dāng)特征值相差越大時,主成分分析越有意義,反之特征值相接近,則主成分分析的價值就不大。主成分分析并未對總體分布作任何假定,因此它對各類分別的數(shù)據(jù)都能分析。其目的在于簡化結(jié)構(gòu)因子,尋找綜合因子,分類等,在地球科學(xué)各領(lǐng)域研究中均有廣泛的應(yīng)用。,例如沙塵暴的發(fā)生是由是諸多因子決定的。如:氣溫,相對濕 度,降水量,蒸發(fā)量,平均風(fēng)速,地溫等。它們分別從不同的 方面反映了對沙塵暴的影響程度。這些因子之間相關(guān)顯著,使 得提供的信息發(fā)生重疊。對這此數(shù)據(jù)進行主成分分析,根據(jù)主

8、 分量的方差貢獻(xiàn)率大小,可以找出前幾個主分量,保留住原系 統(tǒng)大部分的信息。第一主分量稱為溫度因子,溫度升高,地表 蒸發(fā)大,土壤解凍,土質(zhì)疏松有利于沙塵暴的形成。第二主分 量稱為風(fēng)因子,大風(fēng)是沙塵暴形成的主要動力因子之一,即大 風(fēng)多的季節(jié)沙塵暴天氣也多。第三主分量稱為相對濕度因子, 相對濕度越小,土壤干燥,沙化嚴(yán)重,易發(fā)生沙塵暴。,4.3 要素場的經(jīng)驗正交函數(shù)分解,又稱自然正交展開,簡稱EOF分析,是主成分的應(yīng)用。在氣象科研中有極廣泛的應(yīng)用。 氣象場的變化有空間的變化特征,也有時間的變化特征,經(jīng)驗正交展開的思路是將氣象場的空間和時間變化分解,分別分析其空間特征和時間變化特征。,氣象場經(jīng)驗正交展開

9、或EOF(Empirical Orthogonal Function)分析,它與主成分分析在原理與方法上有相似之處,但是也有區(qū)別。近些年來,氣象場經(jīng)驗正交展開有許多新的研究和應(yīng)用。在氣象科研中有極為廣泛的應(yīng)用,所以我們單獨列一節(jié)作較為詳細(xì)的介紹,對一維空間,空間變化函數(shù)F(x)可分解為若干典型正交空間函數(shù)的線性疊加。,經(jīng)驗正交函數(shù)展開即根據(jù)歷史資料尋找典型的正交空間函數(shù)簇和時間函數(shù)。,氣象要素場的分解,一個氣象要素場可看成時間和空間的函數(shù)。經(jīng)驗正交函數(shù)分解是針對氣象要素場進行的,其基本原理是把包含個p空間點(變量)的場隨時間變化進行分解。設(shè)抽取樣本容量為n的資料。則場中任一空間點i和任一時間點

10、t的觀測值 可看成由p個空間函數(shù) 和時間函數(shù) 的線性組合。,對p個測點的同一要素構(gòu)成的氣象場 可看成p維向量。,資料陣:,每列是對應(yīng)某時刻的空間場,亦可寫成:,V、Y分別稱為空間函數(shù)矩陣和時間函數(shù)矩陣。由于它們是根據(jù)場的資料矩陣進行分解,分解的函數(shù)沒有固有的函數(shù)形式,因而稱為“經(jīng)驗”的。但是我們還希望這種分解和其它正交函數(shù)類似具有“正交”性的特點,即要求:,分解方法,A是,對稱陣,矩陣中元素為變量的交叉積,(4.3.a),據(jù)實對稱陣分解定理有V,使得,其中V的列是A的特征向量,為A的特征值組成的對角陣,比較,得,正交性,顯然V及Y滿足正交性的要求。由此可知空間函數(shù)矩陣可從A 矩陣的特征向量求得

11、,而時間函數(shù)則可利用 得到,,至此,完成資料矩陣X的經(jīng)驗正交函數(shù)分解。,如果把X看作p維空間的向量,它是空間的函數(shù),Vi也看作p維空間向量,X分解為p個空間函數(shù)的線性疊加,它們由經(jīng)驗資料所歸納,故稱經(jīng)驗函數(shù),把一個特征向量的空間分布稱為一個典型場,它表明一種經(jīng)常出現(xiàn)的空間分布態(tài)(模態(tài))。主分量為時間系數(shù)。,由前述,易證:,即空間函數(shù)與時間函數(shù)都具備正交性質(zhì)。稱為經(jīng)驗正交函數(shù)展開。由 yit=ViXt可知,典型場與實際要素場越相似,時間系數(shù)越大。,經(jīng)驗正交函數(shù)展開的擬合精度 根據(jù)前述第t個要素場的第i個測點的值,取前m個典型場擬合作為近似,可證其誤差項:,原要素場的總離差平方和:,相對指標(biāo)誤差,

12、而相對擬合精度R2與前m個典型場的累積解釋方差是一致的:,例;選我國大陸15地面站20年(19511970)一月份氣溫距平值(標(biāo)準(zhǔn)化),進行經(jīng)驗正交分解,下表、圖給出前三典型場和時間系數(shù)。前五個典型場的累積方差貢獻(xiàn)為;,可見,前三個典型場累積方差貢獻(xiàn)達(dá)81%,前五個已達(dá)90%。,自然正交展開函數(shù)應(yīng)用實例,第一典型場,全國范圍的氣溫偏高或偏低。,第二典型場,東部偏冷或偏暖的特征。,第三典型場,西部偏冷或偏暖的特征。,例2. 1951-2010年中國年降水量距平場EOF的前四個特征向量,第一特征向量的空間分布絕大部分為正值,表明全國范圍內(nèi)降 水變化趨勢呈現(xiàn)基本一致的特征,變化最大中心位于我國長江

13、中下游地區(qū)。第二特征向量的空間分布呈現(xiàn)南北向“+-”型,反 映出我國全年降水以長江為界的南北反位相變化特征。第三特 征向量的空間分布呈現(xiàn)“+-+”型,代表江淮流域年降水趨勢與 黃河流域、華北、華南地區(qū)為反相的分布型,即江淮流域降水 多、黃河流域及其以北地區(qū)和華南地區(qū)降水少的分布形式;或 者江淮流域降水少、華北地區(qū)和華南地區(qū)降水多的分布形式。 第四特征向量的空間分布呈現(xiàn)東西向的“+-”型,反映出我國東 部地區(qū)降水變化與西部地區(qū)的反位相變化特征,特別在我國東 南、華南地區(qū)與云貴、長江中上游地區(qū)降水趨勢的相反變化特 點。,1951-2010年中國年降水量距平場EOF前四個特征向量對應(yīng)的時間系數(shù)(a-

14、d),特征向量所對應(yīng)的時間系數(shù)代表了這一區(qū)域特征向量空間分布型的時間變化特征。時間系數(shù)的絕對值越大,表明這一時刻(年、月等時段)這類空間分布型越典型,其變化特征越具有代表性。例如,圖中特征向量所對應(yīng)的時間系數(shù)序列代表的是中國年降水年際趨勢變化。從圖.a中可知:1954年的時間系數(shù)為正值,則反映出圖中第一特征向量的空間分布型的降水變化特點,即1954年全國范圍內(nèi)年降水量偏多,特別在長江中下游地區(qū)和華南地區(qū)降水量異常增加,洪澇現(xiàn)象出現(xiàn)幾率增大。2009年的時間系數(shù)為負(fù)值,則表明該年呈相反的降水分布形式。系數(shù)絕對值越大,這類分布型就越顯著。,*用雅可比(Jacobi)方法求矩陣的特征值和特征向量,對實對稱矩陣A ,根據(jù)線性代數(shù),必有,其中由特征值構(gòu)成的對角陣,V是由對應(yīng)特征向量為列向量組成的方陣。,Jacobi方法是通過尋找變換方陣Ti,對逐步進行變換,最終使

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論