數(shù)學建模各種分析方法_第1頁
數(shù)學建模各種分析方法_第2頁
數(shù)學建模各種分析方法_第3頁
數(shù)學建模各種分析方法_第4頁
數(shù)學建模各種分析方法_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

現(xiàn)代統(tǒng)計學1.因子分析(FactorAnalysis)因子分析的基本目的就是用少數(shù)幾個因子去描述許多指標或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個變量歸在同一類中,每一類變量就成為一個因子(之所以稱其為因子,是因為它是不可觀測的,即不是具體的變量),以較少的幾個因子反映原資料的大部分信息。運用這種研究技術(shù),我們可以方便地找出影響消費者購買、消費以及滿意度的主要因素是哪些,以及它們的影響力(權(quán)重)運用這種研究技術(shù),我們還可以為市場細分做前期分析。2.主成分分析主成分分析主要是作為一種探索性的技術(shù),在分析者進行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù),讓自己對數(shù)據(jù)有一個大致的了解是非常重要的。主成分分析一般很少單獨使用:a,了解數(shù)據(jù)。(screeningthedata),b,和clusteranalysis一起使用,c,和判別分析一起使用,比如當變量很多,個案數(shù)不多,直接使用判別分析可能無解,這時候可以使用主成份發(fā)對變量簡化。(reducedimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),還可以用來處理共線性。主成分分析和因子分析的區(qū)別1、因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個變量的線性組合。2、主成分分析的重點在于解釋個變量的總方差,而因子分析則把重點放在解釋各變量之間的協(xié)方差。3、主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè)。因子分析的假設(shè)包括:各個共同因子之間不相關(guān),特殊因子(specificfactor)之間也不相關(guān),共同因子和特殊因子之間也不相關(guān)。4、主成分分析中,當給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時候,的主成分一般是獨特的;而因子分析中因子不是獨特的,可以旋轉(zhuǎn)得到不同的因子。5、在因子分析中,因子個數(shù)需要分析者指定(spss根據(jù)一定的條件自動設(shè)定,只要是特征值大于1的因子進入分析),而指定的因子數(shù)量不同而結(jié)果不同。在主成分分析中,成分的數(shù)量是一定的,一般有幾個變量就有幾個主成分。和主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解釋方面更加有優(yōu)勢。大致說來,當需要尋找潛在的因子,并對這些因子進行解釋的時候,更加傾向于使用因子分析,并且借助旋轉(zhuǎn)技術(shù)幫助更好解釋。而如果想把現(xiàn)有的變量變成少數(shù)幾個新的變量(新的變量幾乎帶有原來所有變量的信息)來進入后續(xù)的分析,則可以使用主成分分析。當然,這中情況也可以使用因子得分做到。所以這中區(qū)分不是絕對的。總得來說,主成分分析主要是作為一種探索性的技術(shù),在分析者進行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù),讓自己對數(shù)據(jù)有一個大致的了解是非常重要的。主成分分析一般很少單獨使用:a,了解數(shù)據(jù)。(screeningthedata),b,和clusteranalysis一起使用,c,和判別分析一起使用,比如當變量很多,個案數(shù)不多,直接使用判別分析可能無解,這時候可以使用主成份發(fā)對變量簡化。(reducedimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),還可以用來處理共線性。在算法上,主成分分析和因子分析很類似,不過,在因子分析中所采用的協(xié)方差矩陣的對角元素不在是變量的方差,而是和變量對應(yīng)的共同度(變量方差中被各因子所解釋的部分)。3.聚類分析(ClusterAnalysis)聚類分析是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸入不同的類的分析技術(shù)。在市場研究領(lǐng)域,聚類分析主要應(yīng)用方面是幫助我們尋找目標消費群體,運用這項研究技術(shù),我們可以劃分出產(chǎn)品的細分市場,并且可以描述出各細分市場的人群特征,以便于客戶可以有針對性的對目標消費群體施加影響,合理地開展工作。4.判別分析(DiscriminatoryAnalysis)判別分析(DiscriminatoryAnalysis)的任務(wù)是根據(jù)已掌握的1批分類明確的樣品,建立較好的判別函數(shù),使產(chǎn)生錯判的事例最少,進而對給定的1個新樣品,判斷它來自哪個總體。根據(jù)資料的性質(zhì),分為定性資料的判別分析和定量資料的判別分析;采用不同的判別準則,又有費歇、貝葉斯、距離等判別方法。費歇(FISHER)判別思想是投影,使多維問題簡化為一維問題來處理。選擇一個適當?shù)耐队拜S,使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要求是:使每一類內(nèi)的投影值所形成的類內(nèi)離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。貝葉斯(BAYES)判別思想是根據(jù)先驗概率求出后驗概率,并依據(jù)后驗概率分布作出統(tǒng)計推斷。所謂先驗概率,就是用概率來描述人們事先對所研究的對象的認識的程度;所謂后驗概率,就是根據(jù)具體資料、先驗概率、特定的判別規(guī)則所計算出來的概率。它是對先驗概率修正后的結(jié)果。距離判別思想是根據(jù)各樣品與各母體之間的距離遠近作出判別。即根據(jù)資料建立關(guān)于各母體的距離判別函數(shù)式,將各樣品數(shù)據(jù)逐一代入計算,得出各樣品與各母體之間的距離值,判樣品屬于距離值最小的那個母體。5.對應(yīng)分析(CorrespondenceAnalysis)對應(yīng)分析是一種用來研究變量與變量之間聯(lián)系緊密程度的研究技術(shù)。運用這種研究技術(shù),我們可以獲取有關(guān)消費者對產(chǎn)品品牌定位方面的圖形,從而幫助您及時調(diào)整營銷策略,以便使產(chǎn)品品牌在消費者中能樹立起正確的形象。這種研究技術(shù)還可以用于檢驗廣告或市場推廣活動的效果,我們可以通過對比廣告播出前或市場推廣活動前與廣告播出后或市場推廣活動后消費者對產(chǎn)品的不同認知圖來看出廣告或市場推廣活動是否成功的向消費者傳達了需要傳達的信息。6.典型相關(guān)分析典型相關(guān)分析是分析兩組隨機變量間線性密切程度的統(tǒng)計方法,是兩變量間線性相關(guān)分析的拓廣。各組隨機變量中既可有定量隨機變量,也可有定性隨機變(3)e=(e1,e2,…,ep)¢與F相互獨立,且E(e)=0,e的協(xié)方差陣∑是對角陣,即各分量e之間是相互獨立的,則模型:x1=a11F1+a12F2+…+a1mFm+e1x2=a21F1+a22F2+…+a2mFm+e2………xp=ap1F1+ap2F2+…+apmFm+ep稱為因子分析模型,由于該模型是針對變量進行的,各因子又是正交的,所以也稱為R型正交因子模型。其矩陣形式為:x=AF+e.其中:x=,A=,F(xiàn)=,e=這里,(1)m£p;(2)Cov(F,e)=0,即F和e是不相關(guān)的;(3)D(F)=Im,即F1,F2,…,Fm不相關(guān)且方差均為1;D(e)=,即e1,e2,…,ep不相關(guān),且方差不同。我們把F稱為X的公共因子或潛因子,矩陣A稱為因子載荷矩陣,e稱為X的特殊因子。A=(aij),aij為因子載荷。數(shù)學上可以證明,因子載荷aij就是第i變量與第j因子的相關(guān)系數(shù),反映了第i變量在第j因子上的重要性。2.模型的統(tǒng)計意義模型中F1,F(xiàn)2,…,F(xiàn)m叫做主因子或公共因子,它們是在各個原觀測變量的表達式中都共同出現(xiàn)的因子,是相互獨立的不可觀測的理論變量。公共因子的含義,必須結(jié)合具體問題的實際意義而定。e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之間以及特殊因子與所有公共因子之間都是相互獨立的。模型中載荷矩陣A中的元素(aij)是為因子載荷。因子載荷aij是xi與Fj的協(xié)方差,也是xi與Fj的相關(guān)系數(shù),它表示xi依賴Fj的程度。可將aij看作第i個變量在第j公共因子上的權(quán),aij的絕對值越大(|aij|£1),表明xi與Fj的相依程度越大,或稱公共因子Fj對于xi的載荷量越大。為了得到因子分析結(jié)果的經(jīng)濟解釋,因子載荷矩陣A中有兩個統(tǒng)計量十分重要,即變量共同度和公共因子的方差貢獻。因子載荷矩陣A中第i行元素之平方和記為hi2,稱為變量xi的共同度。它是全部公共因子對xi的方差所做出的貢獻,反映了全部公共因子對變量xi的影響。hi2大表明x的第i個分量xi對于F的每一分量F1,F(xiàn)2,…,F(xiàn)m的共同依賴程度大。將因子載荷矩陣A的第j列(j=1,2,…,m)的各元素的平方和記為gj2,稱為公共因子Fj對x的方差貢獻。gj2就表示第j個公共因子Fj對于x的每一分量xi(i=1,2,…,p)所提供方差的總和,它是衡量公共因子相對重要性的指標。gj2越大,表明公共因子Fj對x的貢獻越大,或者說對x的影響和作用就越大。如果將因子載荷矩陣A的所有g(shù)j2(j=1,2,…,m)都計算出來,使其按照大小排序,就可以依此提煉出最有影響力的公共因子。3.因子旋轉(zhuǎn)建立因子分析模型的目的不僅是找出主因子,更重要的是知道每個主因子的意義,以便對實際問題進行分析。如果求出主因子解后,各個主因子的典型代表變量不很突出,還需要進行因子旋轉(zhuǎn),通過適當?shù)男D(zhuǎn)得到比較滿意的主因子。旋轉(zhuǎn)的方法有很多,正交旋轉(zhuǎn)(orthogonalrotation)和斜交旋轉(zhuǎn)(obliquerotation)是因子旋轉(zhuǎn)的兩類方法。最常用的方法是最大方差正交旋轉(zhuǎn)法(Varimax)。進行因子旋轉(zhuǎn),就是要使因子載荷矩陣中因子載荷的平方值向0和1兩個方向分化,使大的載荷更大,小的載荷更小。因子旋轉(zhuǎn)過程中,如果因子對應(yīng)軸相互正交,則稱為正交旋轉(zhuǎn);如果因子對應(yīng)軸相互間不是正交的,則稱為斜交旋轉(zhuǎn)。常用的斜交旋轉(zhuǎn)方法有Promax法等。4.因子得分因子分析模型建立后,還有一個重要的作用是應(yīng)用因子分析模型去評價每個樣品在整個模型中的地位,即進行綜合評價。例如地區(qū)經(jīng)濟發(fā)展的因子分析模型建立后,我們希望知道每個地區(qū)經(jīng)濟發(fā)展的情況,把區(qū)域經(jīng)濟劃分歸類,哪些地區(qū)發(fā)展較快,哪些中等發(fā)達,哪些較慢等。這時需要將公共因子用變量的線性組合來表示,也即由地區(qū)經(jīng)濟的各項指標值來估計它的因子得分。設(shè)公共因子F由變量x表示的線性組合為:Fj=uj1xj1+uj2xj2+…+ujpxjpj=1,2,…,m該式稱為因子得分函數(shù),由它來計算每個樣品的公共因子得分。若取m=2,則將每個樣品的p個變量代入上式即可算出每個樣品的因子得分F1和F2,并將其在平面上做因子得分散點圖,進而對樣品進行分類或?qū)υ紨?shù)據(jù)進行更深入的研究。但因子得分函數(shù)中方程的個數(shù)m小于變量的個數(shù)p,所以并不能精確計算出因子得分,只能對因子得分進行估計。估計因子得分的方法較多,常用的有回歸估計法,Bartlett估計法,Thomson估計法。(1)回歸估計法F=Xb=X(X¢X)-1A¢=XR-1A¢(這里R為相關(guān)陣,且R=X¢X)。(2)Bartlett估計法Bartlett估計因子得分可由最小二乘法或極大似然法導出。F=[(W-1/2A)¢W-1/2A]-1(W-1/2A)¢W-1/2X=(A¢W-1A)-1A¢W-1X(3)Thomson估計法在回歸估計法中,實際上是忽略特殊因子的作用,取R=X¢X,若考慮特殊因子的作,此時R=X¢X+W,于是有:F=XR-1A¢=X(X¢X+W)-1A¢這就是Thomson估計的因子得分,使用矩陣求逆算法(參考線性代數(shù)文獻)可以將其轉(zhuǎn)換為:F=XR-1A¢=X(I+A¢W-1A)-1W-1A¢5.因子分析的步驟因子分析的核心問題有兩個:一是如何構(gòu)造因子變量;二是如何對因子變量進行命名解釋。因此,因子分析的基本步驟和解決思路就是圍繞這兩個核心問題展開的。(i)因子分析常常有以下四個基本步驟:(1)確認待分析的原變量是否適合作因子分析。(2)構(gòu)造因子變量。(3)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性。(4)計算因子變量得分。(ii)因子分析的計算過程:(1)將原始數(shù)據(jù)標準化,以消除變量間在數(shù)量級和量綱上的不同。(2)求標準化數(shù)據(jù)的相關(guān)矩陣;(3)求相關(guān)矩陣的特征值和特征向量;(4)計算方差貢獻率與累積方差貢獻率;(5)確定因子:設(shè)F1,F(xiàn)2,…,Fp為p個因子,其中前m個因子包含的數(shù)據(jù)信息總量(即其累積貢獻率)不低于80%時,可取前m個因子來反映原評價指標;(6)因子旋轉(zhuǎn):若所得的m個因子無法確定或其實際意義不是很明顯,這時需將因子進行旋轉(zhuǎn)以獲得較為明顯的實際含義。(7)用原指標的線性組合來求各因子得分:采用回歸估計法,Bartlett估計法或Thomson估計法計算因子得分。(8)綜合得分以各因子的方差貢獻率為權(quán),由各因子的線性組合得到綜合評價指標函數(shù)。F=(w1F1+w2F2+…+wmFm)/(w1+w2+…+wm)此處wi為旋轉(zhuǎn)前或旋轉(zhuǎn)后因子的方差貢獻率。(9)得分排序:利用綜合得分可以得到得分名次。在采用多元統(tǒng)計分析技術(shù)進行數(shù)據(jù)處理、建立宏觀或微觀系統(tǒng)模型時,需要研究以下幾個方面的問題:·簡化系統(tǒng)結(jié)構(gòu),探討系統(tǒng)內(nèi)核??刹捎弥鞒煞址治?、因子分析、對應(yīng)分析等方法,在眾多因素中找出各個變量最佳的子集合,從子集

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論