下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
...wd......wd......wd...方法:1利用Excel2000進(jìn)展主成分分析第一步,錄入數(shù)據(jù),并對進(jìn)展標(biāo)準(zhǔn)化?!纠恳唤M古生物腕足動物貝殼標(biāo)本的兩個變量:長度和寬度。圖1原始數(shù)據(jù)和標(biāo)準(zhǔn)化數(shù)據(jù)及其均值、方差〔取自張超、楊秉庚《計量地理學(xué)根基》〕計算的詳細(xì)過程如下:=1\*GB2⑴將原始數(shù)據(jù)繪成散點(diǎn)圖〔圖2〕。主持分分析原則上要求數(shù)據(jù)具有線性相關(guān)趨勢——如果數(shù)據(jù)之間不相關(guān)〔即正交〕,則沒有必要進(jìn)展主成分分析,因為主成分分析的目的就是用正交的變量代替原來非正交的變量;如果原始數(shù)據(jù)之間為非線性關(guān)系,則有必要對數(shù)據(jù)進(jìn)展線性轉(zhuǎn)換,否則效果不佳。從圖2可見,原始數(shù)據(jù)具有線性相關(guān)趨勢,且測定系數(shù)R2=0.4979,相應(yīng)地,相關(guān)系數(shù)R=0.7056。=2\*GB2⑵對數(shù)據(jù)進(jìn)展標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化的數(shù)學(xué)公式為這里假定按列標(biāo)準(zhǔn)化,式中,分別為第j列數(shù)據(jù)的均值和標(biāo)準(zhǔn)差,為第i行〔即第i個樣本〕、第j列〔即第j個變量〕的數(shù)據(jù),為相應(yīng)于的標(biāo)準(zhǔn)化數(shù)據(jù),為樣本數(shù)目。圖2原始數(shù)據(jù)的散點(diǎn)圖圖3標(biāo)準(zhǔn)化數(shù)據(jù)的散點(diǎn)圖對數(shù)據(jù)標(biāo)準(zhǔn)化的具體步驟如下:=1\*GB3①求出各列數(shù)據(jù)的均值,命令為average,語法為:average(起始單元格:終止單元格)。如圖1所示,在單元格B27中輸入“=AVERAGE(B1:B26)〞,確定或回車,即得第一列數(shù)據(jù)的均值;然后抓住單元格B27的右下角〔光標(biāo)的十字變細(xì)〕右拖至C27,便可自動生成第二列數(shù)據(jù)的均值。=2\*GB3②求各列數(shù)據(jù)的方差。命令為varp,語法同均值。如圖1所示,在單元格B28中輸入“=VARP(B2:B26)〞,確定或回車,可得第一列數(shù)據(jù)的方差,右拖至C28生成第二列數(shù)據(jù)的方差。=3\*GB3③求各列數(shù)據(jù)的標(biāo)準(zhǔn)差。將方差開方便得標(biāo)準(zhǔn)差。也可利用命令stdevp直接生成標(biāo)準(zhǔn)差,語法和操作方法同均值、方差,不贅述。=4\*GB3④標(biāo)準(zhǔn)化計算。如圖1所示,在單元格D2中輸入“=(B2-$B$27)/$B$29〞,回車可得第一列第一個數(shù)據(jù)“3〞的標(biāo)準(zhǔn)化數(shù)值-1.786045,然后按住單元格D2的右下角下拖至D26,便會生成第一列數(shù)據(jù)的全部標(biāo)準(zhǔn)化數(shù)值;按照單元格D2的右下角右拖至E2,就能生成第二列第一個數(shù)據(jù)“2〞的標(biāo)準(zhǔn)化數(shù)據(jù)-1.806077,抓住單元格E2的右下角下拖至E26便會生成第二列數(shù)據(jù)的全部標(biāo)準(zhǔn)化數(shù)值。=5\*GB3⑤作標(biāo)準(zhǔn)化數(shù)據(jù)的散點(diǎn)圖〔圖3〕??梢钥闯觯c(diǎn)列的總體趨勢沒有變換,兩種數(shù)據(jù)的相關(guān)系數(shù)與標(biāo)準(zhǔn)化以前完全一樣。但回歸模型的截距近似為0,即有,斜率等于相關(guān)系數(shù),即有。=3\*GB2⑶求標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)系數(shù)矩陣或協(xié)方差矩陣。求相關(guān)系數(shù)矩陣的方法是:沿著“工具〔T〕〞→“數(shù)據(jù)分析〔D〕〞的路徑翻開“分析工具〔A〕〞選項框〔圖4〕,確定,彈出“相關(guān)系數(shù)〞對話框〔圖5〕,在“輸入?yún)^(qū)域〞的空白欄中輸入標(biāo)準(zhǔn)化數(shù)據(jù)范圍,并以單元格G1為輸出區(qū)域,具體操作方法類似于回歸分析。確定,即會在輸出區(qū)域給出相關(guān)圖4分析工具選項框圖5相關(guān)系數(shù)對話框系數(shù)矩陣的下三角即對角線局部,由于系對稱矩陣,上三角的數(shù)值與下三角相等,故未給出〔圖6〕,可以通過“拷貝——轉(zhuǎn)置——粘帖〞的方式補(bǔ)充空白局部。圖6標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)系數(shù)和協(xié)方差求協(xié)方差的方法是在“分析工具〞選項框中選擇“協(xié)方差〞〔圖7〕,彈出“協(xié)方差〞選項框〔圖8〕,具體設(shè)置與“相關(guān)系數(shù)〞類似,不贅述。結(jié)果見圖6,可以看出,對于標(biāo)準(zhǔn)化數(shù)據(jù)而言,協(xié)方差矩陣與相關(guān)系數(shù)矩陣完全一樣。因此,二者任取其一即可。圖7在分析工具選項框中選擇“協(xié)方差〞圖8協(xié)方差選項框=4\*GB2⑷計算特征根。我們已經(jīng)得到相關(guān)系數(shù)矩陣為,而二階單位矩陣為,于是根據(jù)公式,我們有按照行列式化為代數(shù)式的規(guī)則可得根據(jù)一元二次方程的求根公式,當(dāng)時,我們有據(jù)此解得,〔對于本例,顯然,〕。這便是相關(guān)系數(shù)矩陣的兩個特征根。=5\*GB2⑸求標(biāo)準(zhǔn)正交向量。將代入矩陣方程,得到在系數(shù)矩陣中,用第一行加第二行,化為由此得,令,則有,于是得根基解系,單位化為單位化的公式為〔〕。完全類似,將代入矩陣方程,得到用系數(shù)矩陣的第二行減去第一行,化為于是得到,取,則有,因此得根基解系為,單位化為這里、便是標(biāo)準(zhǔn)正交向量。=6\*GB2⑹求對角陣。首先建設(shè)標(biāo)準(zhǔn)正交矩陣P,即有該矩陣的一個特殊性質(zhì)便是,即矩陣的轉(zhuǎn)置等于矩陣的逆。根據(jù),可知下面說明一下利用Excel進(jìn)展矩陣乘法運(yùn)算的方法。矩陣乘法的命令為mmult,語法是mmult(矩陣1的單元格范圍,矩陣2的單元格范圍)。例如,用矩陣與矩陣C相乘,首先選擇一個輸出區(qū)域如G1:H2,然后輸入“=mmult(A1:B2,C1:D2)〞,然后按下“Ctrl+Shift+Enter〞鍵〔圖9〕,即可給出1.2060441.2060440.20817-0.20817再用乘得的結(jié)果與P陣相乘,便得對角矩陣1.705603000.294397如果希望一步到位也不難,選定輸出區(qū)域如C3:D4,然后輸入“=mmult(mmult(A1:B2,C1:D2),E1:F2)〞〔圖10〕,同時按下“Ctrl+Shift+Enter〞鍵,立即得到結(jié)果〔圖11〕。顯然,對角矩陣對角線的數(shù)值恰是相關(guān)系數(shù)矩陣的特征值。圖9矩陣乘法例如圖10矩陣連乘的命令與語法至此,標(biāo)準(zhǔn)化的原始變量x與主成分之間z之間可以表作顯然與之間正交。圖11乘法結(jié)果:對角矩陣=7\*GB2⑺根據(jù)特征根計算累計方差奉獻(xiàn)率?,F(xiàn)已求得第一特征根為,第二特征根為,二者之和剛好就是矩陣的維數(shù),即有,這里m=2為變量數(shù)目〔注意前面的n=25為樣本數(shù)目〕。比擬圖6或圖10中給出的相關(guān)系數(shù)矩陣C與圖11中給出的對角矩陣D可以看出,Tr.(C)=1+1=2,Tr.(D)=1.7056+0.2944=2,即有Tr.(C)=Tr.(D),可見將相關(guān)系數(shù)亦即協(xié)方差矩陣轉(zhuǎn)換為對角矩陣以后,矩陣的跡〔trace,即對角線元素之和〕沒有改變,這意味著將原始變量化為主成分以后,系統(tǒng)的信息量沒有減少?,F(xiàn)在問題是,如果我們只取一個主成分代表原來的兩個變量,能反映原始變量的多少信息這個問題可以借助相關(guān)系數(shù)矩陣的特征根來判斷。利用Excel容易算出,第一特征根占特征根總和即矩陣維數(shù)的85.28%〔見下表〕,即有特征根累計值百分比累計百分比1.7056031.70560385.28%85.28%0.294397214.72%100.00%也就是說::1.7056,:0.2944,:2,這說明,如果僅取第一個主成分,可以反映原來數(shù)據(jù)85.28%的信息——換言之,舍棄第二個主成分,原來數(shù)據(jù)的信息僅僅損失14.72%,但分析變量的自由度卻減少一個,整個分析將會顯得更加簡明。=8\*GB2⑻計算主成分載荷。根據(jù)公式,容易算出=9\*GB2⑼計算公因子方差和方差奉獻(xiàn)。根據(jù)上述計算結(jié)果可以比擬公因子方差和方差奉獻(xiàn)。再考慮全部的兩個主成分的時候,對應(yīng)于和的公因子方差分別為對應(yīng)于第一主成分z1和第二主成分z2的方差奉獻(xiàn)分別為可以看出〔圖12〕:第一,方差奉獻(xiàn)等于對應(yīng)主成分的特征根,即有第二,公因子方差相等或彼此接近,即有第一,公因子方差之和等于方差奉獻(xiàn)之和,即有第一個規(guī)律是我們決定提取主成分?jǐn)?shù)目的判據(jù)與之一,第二個規(guī)律是我們判斷提取主成分?jǐn)?shù)目是否適宜的判據(jù)之一,第三個規(guī)律是我們判斷提取主成分后是否損失信息的判據(jù)之一。去掉次要的主成分以后,上述規(guī)律理當(dāng)仍然滿足。這時如果第二個規(guī)律不滿足,就意味著主成分的提取是不適宜的。此外,上述規(guī)律也是我們檢驗計算結(jié)果是否正確的判據(jù)之一。圖12公因子方差、方差奉獻(xiàn)的計算結(jié)果及其與特征根的奉獻(xiàn)=10\*GB2⑽計算主成分得分。根據(jù)主成分與原始變量的關(guān)系,應(yīng)有或者對于本例而言,式中,,這里,為前面計算的標(biāo)準(zhǔn)化特征向量。于是有化為代數(shù)形式便是式中的x均為標(biāo)準(zhǔn)化數(shù)據(jù)。對進(jìn)展轉(zhuǎn)置,可得圖13計算特征向量的公式及語法圖14計算主成分得分根據(jù)這個式子,利用Excel計算主成分得分的步驟如下:=1\*GB3①將特征向量復(fù)制到標(biāo)準(zhǔn)化數(shù)據(jù)的附近;=2\*GB3②選中一個與標(biāo)準(zhǔn)化數(shù)據(jù)占據(jù)范圍一樣大小的數(shù)值區(qū)域〔如G2:H26〕;=3\*GB3③輸入如下計算公式“=mmult(標(biāo)準(zhǔn)化數(shù)據(jù)的范圍,特征向量的范圍)〞,在本例中就是“=MMULT(B2:C26,E2:F3)〞〔圖13〕;=4\*GB3④同時按下“Ctrl+Shift+Enter〞鍵。=5\*GB3⑤計算主成分得分的均值和方差,可以發(fā)現(xiàn),均值為0〔由于誤差之故,約等于0〕,方差等于特征根。=6\*GB3⑥最后,可以對主成分得分進(jìn)展標(biāo)準(zhǔn)化。主成分得分的均值為0,我們不按總體方差進(jìn)展標(biāo)準(zhǔn)化,而按樣本方差進(jìn)展標(biāo)準(zhǔn)化。圖15主成分得分的標(biāo)準(zhǔn)化結(jié)果樣本方差的計算公式為相應(yīng)地,標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)化公式同前面給出的一樣。結(jié)果見表15。注意,這里之所以按樣本方差進(jìn)展標(biāo)準(zhǔn)化,主要目的是為了與SPSS的計算結(jié)果進(jìn)展比擬。分別以z1、z2為坐標(biāo)軸,將主成分得分〔包括標(biāo)準(zhǔn)化的得分〕點(diǎn)列標(biāo)繪于坐標(biāo)圖中,可以發(fā)現(xiàn),點(diǎn)列分布沒有任何趨勢:回歸結(jié)果說明,回歸系數(shù)和相關(guān)系數(shù)均為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 森林安全生產(chǎn)試卷題庫講解
- 2026年劇本殺運(yùn)營公司總經(jīng)理崗位職責(zé)管理制度
- 達(dá)紅區(qū)間盾構(gòu)始發(fā)井橋式起重機(jī)安裝拆卸安全專項施工方案模板
- 2026年劇本殺運(yùn)營公司客服專員崗位職責(zé)管理制度
- 2026年太空旅游市場發(fā)展創(chuàng)新報告
- 2025 小學(xué)四年級思想品德上冊公共場合輕聲細(xì)語課件
- 初中英語口語人工智能輔助教學(xué)系統(tǒng)設(shè)計與實施效果教學(xué)研究課題報告
- 2026年高端制造機(jī)器人創(chuàng)新行業(yè)報告
- 2026及未來5年中國園林石雕行業(yè)市場全景調(diào)研及發(fā)展前景研判報告
- 民法典測試題及答案博客
- 西南交通大學(xué)本科畢業(yè)設(shè)計(論文)撰寫規(guī)范
- 八年級地理長江流域綜合教學(xué)設(shè)計方案
- 2025年高中語文必修上冊《赤壁賦》文言文對比閱讀訓(xùn)練含答案
- 工業(yè)旅游綜合規(guī)劃與管理手冊
- 國家安全生產(chǎn)十五五規(guī)劃
- 代位追償培訓(xùn)課件
- 2024內(nèi)蒙古畜牧業(yè)溫室氣體減排策略與路徑研究報告
- 醫(yī)院培訓(xùn)課件:《醫(yī)務(wù)人員不良執(zhí)業(yè)行為記分管理辦法》
- DJG330521-T 102-2024 企業(yè)能級工資集體協(xié)商工作評價規(guī)范
- 物體打擊事故培訓(xùn)課件
- 豬場產(chǎn)房技術(shù)員述職報告
評論
0/150
提交評論