版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
主成分分析法及其應用論文題目:主成分分析法及其應用摘要日常的研究中一定離不開數據的收集,而且為了得到規(guī)律或者為了使研究結論更加精準,我們往往需要收集大量的數據形成龐大的數據庫做支撐材料,所要收集的數據必須包含多個方面也就是得包含多個變量指標。雖然得到一個包含多個變量指標的完整數據庫可以為研究提供更多的信息和條件,但是在收集的大量數據的中可能會存在一定的相關性,數據系統(tǒng)非常龐大,這使得數據分析和計算過程變得非常復雜。因此,數據需要進行加工處理,去除重復數據,提煉出核心信息,縮簡變量指標個數,是非常有必要的。為了解決這個問題,我們可據情況實際選擇一些比較少的能表現或者盡可能完整的表現原來變量的信息綜合指標來。主成分分析法它利用原來多個存在線性相關的指標進行計算轉換成一組新的相互線性無關的綜合指標,并且取代調查來的原始數據。本文在第一章概括出主成分分析法的基本介紹以及該研究課題的背景和意義;第二章介紹了主成分分析法(PCA)法的原理和相應的實現步驟;第三章闡述了實現主成分分析法數據計算的軟件及實現方法;第四章綜合了主成分分析法在幾個實際問題上的應用;第五章指出了應用主成分分析法需要注意的事項。本文較為完整的介紹了主成分分析法的原理步驟,計算機實現,以及給出了該方法在實際多方面的應用等,對學習和深入研究主成分分析法有較大的意義。關鍵詞:主成分分析法;實際應用;SPSS軟件;評價指標
ABSTRACTThedailyresearchmustbeinseparablefromthedatacollection,andinordertogettherulesortomaketheresearchconclusionsmoreaccurate,weoftenneedtocollectalargenumberofdatatoformahugedatabaseassupportingmaterials,thedatatobecollectedmustcontainmultipleaspects,thatis,multiplevariableindicators.Althoughgettingacompletedatabasecontainingmultiplevariablescanprovidemoreinformationandconditionsfortheresearch,theremaybesomerelevanceinthecollectionofalargenumberofdata,andthedatasystemisverylarge,whichmakesthedataanalysisandcalculationprocessverycomplex.Therefore,itisnecessarytoprocessthedata,removetheduplicatedata,extractthecoreinformationandreducethenumberofvariables.Inordertosolvethisproblem,wecanchoosesomeinformationcomprehensiveindicatorsthatcanperformlessorascompleteaspossibleaccordingtotheactualsituation.Principalcomponentanalysis(PCA)isanewsetoflinearindependentcomprehensiveindicators,whichisbasedontheoriginalmultipleindicatorswithlinearcorrelation,andreplacestheoriginaldatafromthesurvey.Inthefirstchapter,thispapersummarizesthebasicintroductionofPCAandthebackgroundandsignificanceofthisresearchtopic;inthesecondchapter,theprincipleandcorrespondingimplementationstepsofPCAareintroduced;inthethirdchapter,thesoftwareandimplementationmethodsofPCAdatacalculationaredescribed;inthefourthchapter,theapplicationofPCAinseveralpracticalproblemsisintegrated;inthefifthchapter,theauthorpointsoutthatSomepointsforattentionintheapplicationofprincipalcomponentanalysisaregiven.ThispaperintroducestheprincipleandstepsofPCA,therealizationofcomputer,andtheapplicationofPCAinmanyaspects,whichisofgreatsignificancetothestudyandin-depthstudyofPCA.Keywords:PrincipalComponentAnalysis;PracticalApplication;SPSSSoftware;EvaluationIndex
目錄1引言 62主成分分析原理及其實現步驟 72.1主成分分析原理 72.2主成分分析的步驟: 83實現主成分分析計算的常見軟件及實現方法 93.1spss進行主成分分析 93.1.1spss實現主成分的方法步驟 93.2.2spss進行主成分分析舉例 93.2運用matlab進行主成分分析 163.2.1matlab主成分分析的方法步驟 163.2.2matlab進行主成分分析舉例 184主成分分析法在實際中的應用 204.1主成分分析法在經濟問題中的應用 204.2主成分分析法在醫(yī)學上的應用 244.3主成分分析法在生活中的應用 265主成分分析法應用時應注意的細節(jié) 296結束語 30參考文獻 31致謝 32
1引言在實際情況下,我們研究的往往都是多種變量的樣本,我們希望在進行分析過程中,涉及的變量較少,得到的信息量較多。因此,需要引入合適的方法,將變量的數目簡化,從而用較少的綜合指標來反映多個變量中存放的信息。主成分分析就是這樣一種方法[1]。主成分分析法在加入多變量時也會將原始的指標變量歸結為少數幾個互不相關的新的實際含義的主成分,在充分利用所有變量的信息量,使問題簡單化,同時得到更加科學有效的數據信息。這是一種利用變量協(xié)方差矩陣對信息進行加工處理,去除重復數據,提煉出核心信息,縮簡變量指標個數的有效方法。主成分分析的原理是將多個變量轉化為若干綜合指標。從數學角度看,它是一種降維處理技術。一般來說,原始的p-指數作為一個新的綜合指數被用作線性組合。通過重新建立原始變量與綜合指標變量之間的關系,可以對問題的維數進行降維和分析,從而將關系復雜的變量集成到幾個主成分中,簡化計算。在經濟金融和人工智能領域,主成分分析法就是一種特別合適的統(tǒng)計方法,因為這些領域中收集的數據往往都是多方面的數據,這些數據需要利用主成分分析法進行分析和計算。實際生活中工業(yè)領域、環(huán)保領域等各個方面,主成分分析法都已經被廣泛的應用了。
2主成分分析原理及其實現步驟2.1主成分分析原理主成分分析法(PrincipalComponentsAnalysis)[2]就是在變量協(xié)方差矩陣的基礎上再對收集的數據進行加工處理,去除重復數據,提煉出核心信息,縮簡變量指標個數的有效方法,主要是通過降維也就是降低原始數據指標比較多的指標變量維數,用比較少的綜合指標變量來代替來并簡化原始數據結構,化簡計算分析。這些綜合指標變量就叫做主成分(PCA),它并不是具體的變量,只是幾個指標的綜合,代表著綜合的意義。而且各個主成分之間是相互獨立,彼此不相關。實際情況中為了盡可能全面地對對象進行評價,所選用的評價指標一般也會比較多,在進行評價時計算分析數據就會非常困難。主成分分析的過程就是如何把多個變量化為少數幾個綜合指標變量的過程。主成分分析法的基本思想是用一組新的相互線性無關的綜合指標變量來代替原始的指標變量[3]。有n個樣本,每個樣本有p個變量,構成一個n×p階的矩陣,如下圖:
2.2主成分分析的步驟:
3實現主成分分析計算的常見軟件及實現方法實現主成分分析計算軟件常用的兩種軟件是spss和matlab軟件[5]:spss軟件是世界上最早的數據分析統(tǒng)計軟件。數據進行標準化、計算標準化后數據的協(xié)方差陣、協(xié)方差陣的特征值和特征向量、計算累積貢獻率,最后確定主成分個數,這些都是通過spss軟件實現;matlab軟件是最合適的對數學模型進行求解工具,所以在數學建模的比賽中每個隊伍都會利用matlab進行求解。實際問題在運用主成分分析法就是建立了一個數學模型,從而運用MATLA計算協(xié)方差矩陣進行實現主成分分析。3.1spss進行主成分分析3.1.1spss實現主成分的方法步驟3.2.2spss進行主成分分析舉例例1、下表給出了某農業(yè)生態(tài)經濟系統(tǒng)各區(qū)域的九項指標的數據,請根據該表對該生態(tài)經濟系統(tǒng)作出分析說明:樣本序號x1:人口密度(人/km2)x2:人均耕地面積(ha)x3:森林覆蓋率(%)x4:農民人均純收入(元/人)x5:人均糧食產量(kg/人)x6:經濟作物占農作物播面比例(%)x7:耕地占土地面積比率(%)x8:果園與林地面積之比(%)x9:灌溉田占耕地面積之比(%)1363.9120.35216.101192.11295.3426.72418.4922.23126.2622141.5031.68424.3011752.35452.2632.31414.4641.45527.0663100.6951.06765.6011181.54270.1218.2660.1627.47412.4894143.7391.33633.2051436.12354.2617.48611.8051.89217.5345131.4121.62316.6071405.09586.5940.68314.4010.30322.932668.3372.03276.2041540.29216.398.1284.0650.0114.861795.4160.80171.106926.35291.528.1354.0630.0124.862862.9011.65273.3071501.24225.2518.3522.6450.0343.201986.6240.84168.904897.36196.3716.8615.1760.0556.1671091.3940.81266.502911.24226.5118.2795.6430.0764.4771176.9120.85850.302103.52217.0919.7934.8810.0016.1651251.2741.04164.609968.33181.384.0054.0660.0155.4021368.8310.83662.804957.14194.049.114.4840.0025.791477.3010.62360.102824.37188.0919.4095.7215.0558.4131576.9481.02268.0011255.42211.5511.1023.1330.013.4251699.2650.65460.7021251.03220.914.3834.6150.0115.59317118.510.66163.3041246.47242.1610.7066.0530.1548.70118141.470.73754.206814.21193.4611.4196.4420.01212.94519137.760.59855.9011124.05228.449.5217.8810.06912.65420117.611.24554.503805.67175.2318.1065.7890.0488.46121122.780.73149.1021313.11236.2926.7247.1620.09210.078解:1、首先將數據存為.sav文件,2、選Analyze-DataReduction-Factor進入主對話框;3、把x1~x9選入Variables,然后點擊Descriptive4、單擊Extraction,在Method選擇,可以任意選擇里面的選項,比如可以選擇用Screeplot畫碎石圖,另外在Extract選項可以按照特征值的大小選主成分,也可以選定因子的數目;之后回到主對話框。5、點擊Rotation,再在對話框中的Method選擇一個旋轉方法,在Display選Rotatedsolution和Loadingplot;之后回到主對話框。6、點擊Scores計算因子得分,再選擇Saveasvariables和計算因子得分的方法;之后回到主對話框。最后點擊OK就可以完成了。分析結果解釋:按照SPSS輸出結果的順序依次進行介紹。1、給出了這次主成分分析從原始變量中提取的信息,可以看出各個變量的大小排序。.2、總方差的含義:在前三個主成分特征值累積已經占了總方差的86.596%。根據確定主成分的原則所以只取前三個。后面的特征值的貢獻率自然就會越來越少。3、特征值的貢獻還可以從SPSS的所謂碎石圖看出4、主成分得分系數矩陣
3.2運用matlab進行主成分分析3.2.1matlab主成分分析的方法步驟function[y,v2,u2,gongxianlv,leijigongxianlv,z]=zhuchenfen(x)分載荷矩陣a=size(x);n=a(1);%數據的個數p=a(2);%變量的個數.X=mean(x);%得到x每列的平均值,列數為pfori=1:pforj=1:pfork=1:nt1(k)=(x(k,i)-X(i))*(x(k,j)-X(j));t2(k)=(x(k,i)-X(i))^2;t3(k)=(x(k,j)-X(j))^2;endt4=sum(t1);%t1到t6都是一些臨時變量,主要為方便中間的計算t5=sum(t2);t6=sum(t3);r(i,j)=t4/sqrt(t5*t6);%r(i,j)為相關系數矩陣的每個元素endendy=r;%第二步:計算特征值v2與特征向量u2[u,v]=eig(r);%u矩陣的每一列為v的每一個對應特征值對應的特征向量v=diag(v);v1=v(end:-1:1);u1=u(:,end:-1:1);%相應特征向量按倒序排列fort=1:length(v1)ifv1(t)>0v2(t)=v1(t);%找出特征值大于0的構成特征值v2endendu2=u1(:,1:length(v2));gongxianlv=v2/sum(v2);%計算特征值v2對應的貢獻率leijigongxianlv=cumsum(gongxianlv);%第四步:確定主成份個數代碼省略%第五步:計算載荷tt=size(u2);temp=tt(2);%temp為特征向量u2的列數z(p,temp)=0;%定義載荷矩陣的行數與列數forq=1:tempz(:,q)=u2(:,q).*sqrt(v2(q));end
3.2.2matlab進行主成分分析舉例例2、現在為了了解學生的一些體型特征,所以以某中學作為樣本總體,抽選了該中學的10名男生作為樣本,測量這10名男生的身高,胸圍和體重,測得數據如下表格。試對其做主成分分析.。序號身高胸圍體重1149.569.538.52162.57755.53162.778.550.84162.287.565.55156.574.549.06156.174.545.57172.076.551.08173.281.559.59159.574.543.510157.77953.5解:用MATLAB軟件,利用協(xié)方差矩陣進行命令pcacov,它的調用格式:①PC=pcacov(X)②[PC,latent,explained]=pcacov(X)表中的調查數據可以看成是從總體中隨機抽出的樣本,由樣本主成份分析法,Matlab程序如下:X=[149.5 69.5 38.5;162.5 77 55.5;162.7 78.5 50.8;162.2 87.5 65.5;156.5 74.5 49.0;156.1 74.5 45.5;172.0 76.5 51.0;173.2 81.5 59.5;159.5 74.5 43.5;157.7 79 53.5];%輸入樣本數據[P,SCORE,latent]=princomp(X)%主成份分析輸出P=0.55920.8277-0.04800.4213-0.3335-0.84340.7140-0.45140.5352%正交單位化特征向量latent=110.004125.32451.5680%特征值所以,樣本各主成分的貢獻率分別為110.004/136.896=80.36%25.324/136.896=18.50%1.568/136.896=1.15%從主成分的累計貢獻率來看,第一個和第二個主成分的累計貢獻率為88.860%,已經大于80%,所以確定主成分取就前兩個就可以了,即第一主成分對應的是身高、胸圍和體重的系數和。當一個學生比較瘦小時,其相對應的第一主成分值也較小,故第一主成分是反映學生身材的綜合指標,稱之為“大小”因子。在第二主成分的表達式中,當胸圍和體重前的系數為正數而身高前系數為負數式,矮胖型學生的值會較大,故是反映學生體型特征的綜合指標,稱之為“形狀”因子[6]。
4主成分分析法在實際中的應用主成分分析法在實際中有許多的應用,在很多經濟問題、醫(yī)學問題、綜合評價、工程問題等方面都可以運用主成分分析法來進行研究。通過使用spss軟件對技術研究中心的總體運行效果進行綜合評價。研究成果對促進經濟、醫(yī)學、綜合評價、工程的各領域的中心穩(wěn)定、可持續(xù)的發(fā)展和優(yōu)化改進提供了一定的借鑒和參考意義。以下是主成分分析法在不同方面上的一些具體運用。4.1主成分分析法在經濟問題中的應用分析經濟問題大部分都是多方面的綜合問題,調查得到的數據龐大復雜,而且數據之間存在一定的線性相關,所以會有很多重復信息[7]。因此選擇合適的指標變量作為參考就非常有必要。用主成分分析法來分析經濟問題,如下例:一)例1、根據下表的數據對全國各地區(qū)的大中型企業(yè)的經濟狀況作出分析說明并提出具體的問題。地區(qū)工業(yè)增加值率總資產貢獻率資產負債率流動資產周轉成本費用全員勞動生產率產品銷售率(%)(%)(%)次數(次/年)利潤率(元/人.年)(%)北京23.36.6954.751.563.887985698.9天津27.937.5356.581.576.778735699.17河北35.727.8863.451.514.774705699.04山西37.735.0161.690.953.422943498.51內蒙古36.635.5557.751.32.073897698.36遼寧28.316.4956.981.43.645861397.87吉林30.438.1561.81.395.135257297.51黑龍江55.1620.2357.691.5132.227970298.38上海29.348.7343.841.57.2514218799.33江蘇26.439.1158.551.844.377305198.01浙江27.1111.9552.921.847.47763998.08安徽33.58.559.341.444.274469599.06福建29.458.6359.961.875.038062297.21江西30.566.2364.831.191.273779998.35山東32.9610.9559.161.947.26138898.45河南33.357.0664.711.282.963597098.52湖北33.497.8759.681.335.455723498.19湖南36.4710.0365.791.283.855289899.42廣東27.9510.3854.361.786.6712316398.45廣西33.198.5665.741.395.44873897.6海南26.737.6759.61.264.16644696.63重慶29.546.8961.11.122.814508698.7四川35.656.9762.231.164.644843198.87貴州35.977.8559.80.874.983888598.64云南53.517.6251.681.2611.6211025498.48西藏57.8512.827.760.8432.811640088.67陜西34.877.5465.751.116.164359898.54甘肅31.545.165.861.120.244231897.96青海40.335.0672.290.794.447275195.79寧夏30.345.5659.391.072.373768297.6新疆45.8812.1857.761.6415.75122291100.34二)、主成分分析法的方法步驟首先收集了31個市縣工業(yè)增加值率、總資產貢獻率、資產負債率、流動資產周轉、成本費用、全員勞動生產率、產品銷售率7個方面的數據,這建立的數據為原始數據。采用主成分分析法并結合spss軟件實現計算,可得到相關系數矩陣的特征值,貢獻率和累積貢獻率;選取出前三個主成分,根據選取主成分的原則;主成分荷載矩陣;主成分得分矩陣,并計算其綜合得分排名。相關系數矩陣特征值和特征向量及貢獻率等,可分析出只需取3個主成分特征值貢獻率累積貢獻率第一主成分載荷第二主成分載荷第三主成分載荷X13.52210.50320.5032-0.7632-0.37950.4669X21.67430.23920.7423-0.80010.32910.4330X30.99960.14280.88510.7797-0.06810.5149X40.39400.05630.9414-0.03660.9327-0.0552X50.22140.03160.9731-0.9399-0.07440.1701X60.09850.01410.9871-0.70290.4661-0.2825X70.09010.01291.00000.55910.56980.4660c.各主成分結果解釋①從上表中可看出第一主成分與變量x1,變量x2,變量x5,變量x6有較大的負相關,與變量x3(資產負債率)有較大的正相關。第一主成分主要從資產利用和投入產出方面衡量了企業(yè)的利潤。工業(yè)增加值可以反饋出企業(yè)的利潤,總資產貢獻率和成本費用率可以看出企業(yè)的資金利用狀況?,F實情況里,企業(yè)所有能利用的資產都是有限的,每個企業(yè)追求的目標就是充分利用有限的資源來創(chuàng)造最大的利潤。因此,企業(yè)要想提高經濟效益應首先從以上這幾個方面入手。②第二主成分與變量x4(流動資金周轉)有較大的正相關。第二主成分主要是指標流動資產周轉的反映。資金就是一個企業(yè)的血液,所以資金流動就像是企業(yè)的生命運行。而且資金流動周轉的速度也反映了企業(yè)資產利用率的高低,因此企業(yè)要不斷提高自己的流動資產周轉狀況。③第三主成分的載荷都不算大,與系數最大的x3有比較小的正相關。d.計算出前三個主成分的綜合得分,并計算出每個樣本的綜合得分,然后對每個樣本的綜合得分排序再最后進行綜合評價說明。(先利用spss軟件得出三主成分各得分,再用excel計算出綜合得分并排序)綜合得分計算公式:排名地區(qū)第一主成分得分f1第二主成分得分f2第三主成分得分f3綜合得分1黑龍江2.304430.4183.046169.52云南1.706720.3181.535115.43新疆1.064521.2831.182101.14西藏3.77027-2.51-2.2797.265廣東0.416071.668-0.9746.986上海0.707161.412-1.745.097浙江0.29361.403-0.5740.258山東0.059331.250.26836.79福建-0.05831.055-0.6912.4910江蘇-0.20581.192-0.639.09911天津-0.13840.905-0.635.65312湖南-0.3775-0.021.141-3.0813河北-0.44040.1830.616-8.9914安徽-0.37810.1580.327-10.615湖北-0.2359-0.12-0.01-1516北京-0.39450.874-1.18-15.817廣西-0.3778-0.180.384-17.818吉林-0.3416-0.09-0.15-21.319四川-0.4613-0.510.422-29.420遼寧-0.41240.047-0.8-3121陜西-0.4959-0.680.693-31.322海南-0.2835-0.26-0.9-33.323貴州-0.3683-1.110.486-38.224河南-0.6962-0.410.442-38.425內蒙古-0.512-0.5-0.12-39.526重慶-0.6686-0.47-0.05-45.527江西-0.8645-0.550.108-5528青海-0.3562-1.780.195-57.829山西-0.6704-1.290.358-59.530寧夏-0.6643-0.91-0.48-6231甘肅-0.9204-0.79-0.06-66三)、結果分析由綜合得分排名知:黑龍江作為東北三省老工業(yè)基地之一,其經濟效益最好;廣東、上海、浙江、山東、福建、江蘇等幾個省分的企業(yè)經濟效益排名為第5位到第10位,反應出這幾個省份的工業(yè)企業(yè)經濟效益較好,位于全國的前列;江西、青海,山西、寧夏、甘肅等幾省份,工業(yè)企業(yè)經濟效益在全國名次靠后。這些省份地屬內陸,城市工業(yè)大多以落后的重工業(yè)為主,技術落后,資金不足,尤其是國有大中型企業(yè)的體制改革緩慢,這些都嚴重阻礙了其工業(yè)的發(fā)展;從主成分分析方法得出結果,與我國目前的工業(yè)布局、工業(yè)發(fā)展水平、經濟發(fā)展實際狀況很相符,反映出評價結果的合理性。
4.2主成分分析法在醫(yī)學上的應用醫(yī)學中各類病患者出現健康問題往往表現多種指標出現異常,但是我們需要根據少量指標就快速判斷出病情[8]。這在數學里就是降維的思想,所以很多的醫(yī)學問題就可以用主成分分析法來解決,如下例:一)、例2、現在為了了解肝病患者的一些患病主要癥狀,所以以某醫(yī)院作為樣本總體,抽選了該醫(yī)院的20名患者作為樣本,測量這20名患者的轉氨酶(x1),肝大指數(x2),硫酸鋅濁度(x3)和胎甲球(x4),測得數據如下表格。試對其做主成分分析.。轉氨酶肝大指數硫酸鋅濁度胎甲球1402.05202101.553031203.0135042504.518051203.59506101.512507401.0194082704.0136092803.51160101703.0960111803.51440121302.03050132201.51720141601.53560152202.51430161402.02020172202.0141018401.010019201.01260201202.0200二)、主成分分析法的方法步驟收集20位肝病患者的4個肝功能變量4個方面的指標數據,這建立的數據為原始數據。采用主成分分析法并結合spss軟件實現計算,可得到相關系數矩陣的特征值,貢獻率和累積貢獻率;選取出前三個主成分,根據選取主成分的原則;主成分荷載矩陣;主成分得分矩陣,并計算其綜合得分排名。相關系數矩陣特征值和特征向量及貢獻率等,可分析出只需取3個主成分特征值貢獻率累積貢獻率第一主成分載荷第二主成分載荷第三主成分載荷1.71830.42960.4296-0.9175-0.0994-0.23781.09350.27340.7029-0.90420.29660.05790.98130.24530.9483-0.1153-0.9455-0.26780.20690.05171.0000-0.2134-0.31890.9218
4.3主成分分析法在生活中的應用數學中降低數據維的思想在主成分分析法就得到了體現。運用主成分分析法對生活中實際問題進行研究反映其的綜合狀況,并且在實際問題的研究中主成分分析法已經被廣泛應用了,如下例:一)、例3、在某中學隨機抽取某年級30名學生,測量學生的身高值(X1),體重值(X2),胸圍值(X3)和坐高值(X4),數據如下表。試對這30名中學生身體四項指標數據做主成分分析。身高體重胸圍坐高學生1148417278學生2139347176學生3160497786學生4149366779學生5159458086學生6142316676學生7153437683學生8150437779學生9151427780學生10139316874學生11140296474學生12161477884學生16152357379學生19160477487學生20156447885學生21151427382學生22147387378學生23157396880學生24147306575學生25157488088學生26151367480學生27144366876學生28141306776學生29139326873學生30148387078二)、主成分分析法的方法步驟測量30名學生的身高、體重、胸圍和坐高,得到原始數據。采用主成分分析法并用spss軟件上機處理:a. 相關系數矩陣特征值和特征向量及貢獻率等,可分析出只需取2個主成分特征值貢獻率累積貢獻率第一主成分(Z1)載荷第二主成分(Z2)載荷3.54110.88530.88530.93520.30410.31340.07830.96360.9683-0.11770.07940.01990.98350.9049-0.40560.06610.01651.00000.95390.2062各主成分結果解釋第一個第一主成分(Z1)載荷都在0.9左右,說明第一主成分與各變量存在很強的正相關性。身材矮小的學生,他的四個部分的數值都會比較小,因此第一主成分的值就較小。因此可稱第一主成分為大小因子,可以反映中學生身材的高大還是矮小的程度。因為第二個主成分乘以的系數值都相比較小,所以第二主成分與各變量之間的相關性就比較小。第二主成分比較大表明該學生瘦高。因此可稱第二主成分為主要的身材體型的因素。第一主成分得分第二主成分得分學生1-0.036530.41824學生2-0.833491.26186學生31.48799-0.6842學生4-0.39707-1.41566學生51.43142-0.03017學生6-1.10025-0.56701學生70.742470.10631學生80.431481.37172學生90.488331.0269學生10-1.235480.64162學生11-1.48249-0.61253學生121.36289-0.37372學生131.276170.29452學生14-0.97511-0.08819學生15-1.469980.55833學生16-0.0334-0.36388學生170.812772.99344學生18-0.56110.11879學生191.31756-1.70844學生201.11848-0.03895學生210.41602-0.28642學生22-0.150.62779學生230.13141-2.20514學生24-1.07477-1.38563學生251.612360.10143學生260.08552-0.07584學生27-0.71718-0.03901學生28-1.12907-0.2412學生29-1.256220.8538學生30-0.26274-0.25878
5主成分分析法應用時應注意的細節(jié)在應用主成分分析方法時要注意的問題:1、我們計算的第一主成分一般情況下已經包含了原始數據得絕大部分的信息,并且要是第一主成分累計方差貢獻率達到80%這個原則,那第一主成分就可以直接作為綜合評價指標變量。但是有些情況寫表達式會發(fā)現系數的值或這符合不符合實際情況意義[10]。2、運用主成分分析法解決問題時,并不單單只能從原始指標變量出發(fā)求協(xié)方差或相關矩陣,有時候需要的話也可以對原始指標變量進行某些變換,然后對得到的函數直接處理。比如,分別取它們的對數,尤其是一些百分比之類的數據,因為比例值的范圍是在0與1之間,它的變化值比較小,在取對數后范圍可以在負無窮與0之間,每個數值分隔較大,便于對數據比較出區(qū)別來。所以也把原始指標的函數作為主成分分析的指標變量,這樣求出的主成分就出現非線性函數的形式,可以參閱相關示例[9]。
6結束語主成分分析法就是對原始數據進行轉換使其形成相互線性無關的主成分,所以消除了變量指標之間的相互影響使得分析研究過程化簡。而且實踐證明,變量指標之間的相關性越強,主成分分析法越能體現出它的優(yōu)點。通過以上幾個實際例子可以看出對于具有多指標多方面的綜合問題,主成分分析法會根據實際情況確定主成分的指標構成,由于能夠消除相關影響,所以比較容易選擇指標,可以為索引選擇提供很多的方便,并且評價結果不會因工作量的節(jié)省而遺漏關鍵指標。當采用主成分分析法進行綜合評價時,我們選擇主成分的原則是只選擇累計貢獻率大于或等于85%的主成分,在主成分分析中,根據方差的大小對主成分進行排序[13]。主成分分析法除了其優(yōu)點外,還存在一些不可避免的缺陷,即選擇指標的線性組合構成主成分。雖然它能代表每個指標90%以上的信息,但不能完全代替每個指標的信息,在實際應用中應與每個指標結合使用。這個過程中必須付出的代價就是主成分解釋的含義不像原始變量的含義那樣清晰準確,一般有點模糊因為主成分所代表的是綜合因子[14]。所以,我們所確定下來的主成分個數必須比原來的變量指標少,否則主成分分析法所帶來的“缺點”并不像原始變量所帶來的“優(yōu)點”那樣明顯;最后綜上所述,在生活實際應用中,首先,要確保要我們所提取的這幾個主成分的累計貢獻率已經達到了一個比較高的層次;其次,我們提取出來的主成分是可靠的有意義的,可以直接運用到研究的實際情景中[15]。本文在實際應用里,經濟方面,突出了各大省市經濟發(fā)展進程的特點和優(yōu)勢,為我國實現均衡發(fā)展提供理論依據;醫(yī)學方面,用主成分分析法針對某種病情選擇出主要因素,可以提高醫(yī)院整體的醫(yī)療能力及效率,還可以為醫(yī)院的科室未來的業(yè)務發(fā)展提供數據支撐;綜合評價方面,一個多方面、多層次的綜合問題,只看其中一項重要的評判標準還是有比
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年北京市朝陽區(qū)高三期末高考數學試卷試題(含答案詳解)
- 2026屆新疆維吾爾自治區(qū)克拉瑪依市第十三中學生物高三上期末達標檢測模擬試題含解析
- 智能控制 課件 第六章-學習控制
- 內河海事執(zhí)法培訓
- 歡送儀式活動策劃方案(3篇)
- 管監(jiān)責任實施管理制度(3篇)
- 網絡銷售配送管理制度內容(3篇)
- 苗圃技術管理制度內容(3篇)
- 獸藥生產技術課程
- 項目門衛(wèi)值班管理制度內容(3篇)
- 質檢員班組級安全培訓課件
- 蓖麻醇酸鋅復合除味劑的制備及其除臭效能研究
- 海岸帶調查技術規(guī)程 國家海洋局908專項辦公室編
- 危重病人的院前急救課件
- 礦井突水機理研究-洞察及研究
- 2025年九江職業(yè)大學單招《職業(yè)適應性測試》模擬試題(基礎題)附答案詳解
- 防御性駕駛安全培訓內容
- 鉆探原始班報表試行版
- 青年積分培養(yǎng)管理辦法
- 市級應急廣播管理制度
- 智慧檢驗與大數據分析知到智慧樹期末考試答案題庫2025年溫州醫(yī)科大學
評論
0/150
提交評論