第8講SPSS的多元統(tǒng)計(jì)分析:因子分析、聚類分析、判別分析_第1頁(yè)
第8講SPSS的多元統(tǒng)計(jì)分析:因子分析、聚類分析、判別分析_第2頁(yè)
第8講SPSS的多元統(tǒng)計(jì)分析:因子分析、聚類分析、判別分析_第3頁(yè)
第8講SPSS的多元統(tǒng)計(jì)分析:因子分析、聚類分析、判別分析_第4頁(yè)
第8講SPSS的多元統(tǒng)計(jì)分析:因子分析、聚類分析、判別分析_第5頁(yè)
已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第八章第八章 SPSS的多元統(tǒng)計(jì)分析的多元統(tǒng)計(jì)分析本章主要內(nèi)容:u 因子分析u 聚類分析u 判別分析在工業(yè)、農(nóng)業(yè)以及經(jīng)濟(jì)、管理等諸多領(lǐng)域中,常常需要同時(shí)觀測(cè)多個(gè)指標(biāo)。例如,衡量一個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展,需觀測(cè)的指標(biāo)有:總產(chǎn)值、利潤(rùn)、效益、勞動(dòng)生產(chǎn)率、固定資產(chǎn)、物價(jià)、信貸等。因此,受多種指標(biāo)作用和影響的現(xiàn)象是大量存在的。由于每個(gè)指標(biāo)值是不能預(yù)先確定的,那么該如何根據(jù)這些觀測(cè)數(shù)據(jù)進(jìn)行有效的分析研究呢?-多元統(tǒng)計(jì)分析,就是進(jìn)行多個(gè)隨機(jī)變量觀測(cè)數(shù)據(jù)分析的一種有效方法,它通過(guò)研究變量之間的相互關(guān)系來(lái)揭示這些變量?jī)?nèi)在的變化規(guī)律。在當(dāng)前科技和經(jīng)濟(jì)迅速發(fā)展的今天,國(guó)民經(jīng)濟(jì)許多領(lǐng)域只停留在定性分析上往往是不夠的。為提

2、高科學(xué)性、可靠性,通常需要定性與定量分析相結(jié)合。而多元分析正是定量分析的有效手段和方法。整體分析與設(shè)計(jì)的內(nèi)容u 因子分析因子分析一、案例背景一、案例背景n 居民消費(fèi)結(jié)構(gòu)變化 “消費(fèi)結(jié)構(gòu)”是指消費(fèi)過(guò)程中,各項(xiàng)消費(fèi)支出占居民總支出的比重,它是反映居民生活消費(fèi)水平、生活質(zhì)量變化狀況以及內(nèi)在過(guò)程合理化程度的重要標(biāo)志。消費(fèi)結(jié)構(gòu)的變動(dòng)不僅是消費(fèi)領(lǐng)域的重要問(wèn)題,而且也關(guān)系到國(guó)民經(jīng)濟(jì)的發(fā)展。因?yàn)楹侠淼南M(fèi)結(jié)構(gòu)及消費(fèi)結(jié)構(gòu)的升級(jí)和優(yōu)化不僅反映了消費(fèi)的層次和質(zhì)量的提高,而且也為建立合理的產(chǎn)業(yè)結(jié)構(gòu)和產(chǎn)品結(jié)構(gòu)提供了重要的依據(jù)。首先看一下本節(jié)課給出的相關(guān)數(shù)據(jù):本數(shù)據(jù)文件是某市民在食品、衣著、醫(yī)療保健等幾個(gè)方面的消費(fèi)數(shù)據(jù)。

3、這些指標(biāo)之間存在著不同強(qiáng)弱的相關(guān)性。如果單獨(dú)分析這些指標(biāo),那么就很難全面的分析和了解居民消費(fèi)結(jié)構(gòu)的特點(diǎn)。因此,我們可以考慮采用“因子分析因子分析”的方法,將這幾個(gè)指標(biāo)綜合為少數(shù)幾個(gè)因子,通過(guò)這幾個(gè)因子來(lái)考察居民消費(fèi)結(jié)構(gòu)的變動(dòng)情況。整體分析與設(shè)計(jì)的內(nèi)容u 因子分析因子分析二、方法原理二、方法原理 在研究實(shí)際問(wèn)題的時(shí)候,往往希望盡可能的收集相關(guān)變量,以期對(duì)問(wèn)題有較全面、完整的把握和認(rèn)識(shí)。例如,企業(yè)綜合評(píng)價(jià)研究中,可能會(huì)收集諸如盈利能力、負(fù)債能力、運(yùn)營(yíng)能力等方面的經(jīng)濟(jì)指標(biāo)數(shù)據(jù)。 這些數(shù)據(jù)在帶來(lái)有關(guān)信息的同時(shí),也給數(shù)據(jù)的分析帶來(lái)了一定的困難:這眾多的變量之間可能存在著或多或少的相關(guān)性,實(shí)際觀測(cè)到的數(shù)據(jù)

4、包含的信息有一部分可能是重復(fù)的。 為了解決這些問(wèn)題,最簡(jiǎn)單和最直接的辦法就是減少變量數(shù)目。但這又將導(dǎo)致另一個(gè)問(wèn)題,即信息丟失或不完整的問(wèn)題。 因此,研究人員希望能夠找到一種有效的方法,既能減少參與數(shù)據(jù)分析的變量個(gè)數(shù),同時(shí)又不會(huì)造成統(tǒng)計(jì)信息的大量浪費(fèi)和丟失。-“因子分析因子分析”就這樣應(yīng)運(yùn)而生了。因子分析就是在盡可能不損失信息或少損失信息的情況下,將多個(gè)變量減少為少數(shù)幾個(gè)因子的方法,這幾個(gè)因子可以高度概括大量數(shù)據(jù)中的信息。這樣,既減少了變量個(gè)數(shù),又同樣能再現(xiàn)變量之間的內(nèi)在聯(lián)系。整體分析與設(shè)計(jì)的內(nèi)容111 112211221 1222221 122.kkkkppppkkpxa fa fa fxa

5、fafafxafafafu 因子分析因子分析二、方法原理二、方法原理1.因子分析的數(shù)學(xué)模型針對(duì)變量作因子分析,稱為R型因子分析;對(duì)樣本個(gè)案做因子分析,稱為Q型因子分析。這兩種方法有許多相似之處。其中,R型因子分析的數(shù)學(xué)模型如下:設(shè)原有p個(gè)變量,且每個(gè)變量(或經(jīng)標(biāo)準(zhǔn)化處理后的變量)的均值為0,標(biāo)準(zhǔn)差為1.現(xiàn)將每個(gè)原有變量用k(k0的情況,這個(gè)距離有助于克服各指標(biāo)之間量綱的影響,但沒(méi)有考慮指標(biāo)間的相關(guān)性。4.相似系數(shù)n 夾角余弦將任何兩個(gè)樣品Xi與Xj看成p緯空間的兩個(gè)向量,這兩個(gè)向量的夾角余弦可表達(dá)為:12211cospiajaaijppiajaaax xxx取值1,說(shuō)明兩樣品完全相似;接近1,

6、說(shuō)明兩樣品相似密切;取值0,說(shuō)明兩樣品完全不相似;接近0,說(shuō)明兩樣品差別大。整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析一、方法原理一、方法原理4.相似系數(shù)n 相關(guān)系數(shù)1221111()()11()()11piaijajaijijppiaijajaappiiajjaaaxxxxrrxxxxxxxxpp 其中,聚類分析的內(nèi)容非常豐富:有序樣品聚類法、動(dòng)態(tài)聚類法、模糊聚類法、快速聚類法、系統(tǒng)聚類法等。整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析二、快速聚類法二、快速聚類法1. 算法原理算法原理 K-均值聚類法又叫快速聚類法,可用于大量數(shù)據(jù)進(jìn)行聚類分析的情形。它是一種非分層的聚類方法,具有占用內(nèi)存少、計(jì)算量

7、大、處理速度快,特別適合大樣本的聚類分析。其具體操作步驟為:其具體操作步驟為: 指定聚類數(shù)目k(由用戶指定) 確定k個(gè)初始類的中心(用戶指定;或根據(jù)數(shù)據(jù)本身結(jié)構(gòu)的中心來(lái)確 定) 根據(jù)距離最近原則進(jìn)行分類。(逐一計(jì)算每一記錄到各個(gè)中心點(diǎn)的距離,把各個(gè)記錄按照距離最近的原則歸入各個(gè)類別,并計(jì)算新形成類別的中心點(diǎn)) 按照新的中心位置,重新計(jì)算每一個(gè)記錄距離新的類別中心點(diǎn)的距離,并重新進(jìn)行歸類 重復(fù)步驟(4),直到達(dá)到一定的收斂標(biāo)準(zhǔn)整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析二、快速聚類法二、快速聚類法2.案例背景介紹案例背景介紹n 全國(guó)人口文化程度分析 深入了解全國(guó)人口的文化程度狀況,是很有意義的一項(xiàng)工

8、作。 本節(jié)的數(shù)據(jù)文件給出了1990年全國(guó)人口普查數(shù)據(jù)。 數(shù)據(jù)中,有三個(gè)指標(biāo):大學(xué)以上文化程度的人口比例、初中文化程度的人口比例、文盲半文盲的人口比例。過(guò)這些指標(biāo)和具體的數(shù)據(jù),來(lái)分析省市地區(qū)之間文化程度的差異。 這是一個(gè)典型的多元分析問(wèn)題,可以考慮利用快速聚類法來(lái)分析研究省市之間的差異性。整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析二、快速聚類法二、快速聚類法3.操作說(shuō)明操作說(shuō)明數(shù)據(jù)文件:“全國(guó)人口文化程度.sav” 菜單:“分析分類K-均值聚類”輸入分類個(gè)數(shù),系統(tǒng)默認(rèn)為2.本例子中,輸入4.系統(tǒng)默認(rèn)項(xiàng).選擇初始類中心,在迭代的過(guò)程中不斷更新聚類中心。把觀測(cè)量分派到與之最近的以類中心為標(biāo)志的類中去。

9、只使用初始類中心對(duì)觀測(cè)量進(jìn)行分類,聚類中心始終不變。用戶可以指定外部文件或數(shù)據(jù)作為初始聚類中心點(diǎn);也可以將聚類分析中心結(jié)果輸出到指定文件或數(shù)據(jù)集中。小技巧:對(duì)于大數(shù)據(jù)集,可以先用小樣本,迭代聚類,并通過(guò)該選項(xiàng)組將中心結(jié)果保存到文件或記錄集;再通過(guò)讀取的方式,獲得該中心,選擇“僅分類”來(lái)處理大樣本數(shù)據(jù)。整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析二、快速聚類法二、快速聚類法3.操作說(shuō)明操作說(shuō)明1)“迭代”按鈕:輸入迭代次數(shù)。文本框可輸入范圍:1999輸入算法收斂標(biāo)準(zhǔn),其實(shí)就是算法的精度。該文本框輸入數(shù)值是不得超過(guò)1的正數(shù)。例如,輸入0.02,則表示兩次迭代計(jì)算的最小的類中心的變化距離小于初始類中心距

10、離的2%時(shí),迭代停止。選擇該復(fù)選框,在每個(gè)觀測(cè)量被分配到一類后,立刻計(jì)算新的類中心;若不選該復(fù)選框,則完成所有的觀測(cè)量的一次分配后,再計(jì)算各類的中心,此時(shí)可節(jié)省迭代時(shí)間。2)“保存”按鈕:在 數(shù) 據(jù) 集 中 生 成 名 為qcl_1的新變量。其值表示聚類結(jié)果,即各觀測(cè)量被分配到哪一類。其取值可為1、2、3等。在 數(shù) 據(jù) 集 中 生 成 名 為qcl_2的新變量。其值表示各觀測(cè)量與所屬類中心的歐氏距離。整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析二、快速聚類法二、快速聚類法3.操作說(shuō)明操作說(shuō)明3)“選項(xiàng)”按鈕:整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析二、快速聚類法二、快速聚類法4.輸出分析輸出分析1

11、)初始中心表2)迭代歷史表初始中心間的最小距離為13.128整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析二、快速聚類法二、快速聚類法4.輸出分析輸出分析3)分析結(jié)果列表列出了4類地區(qū)整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析二、快速聚類法二、快速聚類法4.輸出分析輸出分析4)最終聚類分析中心表5)最終聚類中心位置之間的距離與初始中心比,變化很大第一類和第二類之間的距離最大;第一類和第三類之間的距離最短。整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析二、快速聚類法二、快速聚類法4.輸出分析輸出分析6)方差分析表組間均方組間自由度組內(nèi)均方組內(nèi)自由度7)聚類數(shù)目匯總表整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析三、

12、系統(tǒng)聚類法三、系統(tǒng)聚類法1. 算法原理算法原理 又稱為層次聚類法或分層聚類法。 1)對(duì)研究對(duì)象本身進(jìn)行分類,稱為Q型聚類;對(duì)研究對(duì)象的觀察指標(biāo) 進(jìn)行分類,稱為R聚類。2)根據(jù)聚類過(guò)程的不同,又分為分解法和凝聚法。n分解法:開(kāi)始把所有個(gè)體(觀測(cè)量或變量)都視為同屬一大類,再根據(jù)距離和相似性逐層分解,直到參與聚類的每個(gè)個(gè)體自成一類為止。n凝聚法:開(kāi)始把參與聚類的每個(gè)個(gè)體(觀測(cè)量或變量)視為一類,根據(jù)兩類之間的距離或相似性逐步合并,直到合并為一個(gè)大類為止。系統(tǒng)聚類的距離公式有多種,常用的是“組間平均距離法”。整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析三、系統(tǒng)聚類法三、系統(tǒng)聚類法2. 案例背景案例背景

13、要求:要求:不同地區(qū)信息基礎(chǔ)設(shè)施發(fā)展?fàn)顩r的評(píng)價(jià)。數(shù)據(jù)文件中給出了世界不同地區(qū)信息基礎(chǔ)設(shè)施的發(fā)展?fàn)顩r。這里選取了發(fā)達(dá)地區(qū)、新興工業(yè)化地區(qū)、拉美地區(qū)。亞洲發(fā)展中地區(qū)、轉(zhuǎn)型地區(qū)等不同類型的20個(gè)地區(qū)的數(shù)據(jù)。描述信息基礎(chǔ)設(shè)施的變量主要有6個(gè),分別為:nCall:每千人擁有電話線數(shù)nMovecall:每千房居民移動(dòng)電話數(shù)nFee:高峰時(shí)期每三分鐘國(guó)際電話的成本nComputer:每千人擁有的計(jì)算機(jī)數(shù)nMips:每千人中計(jì)算機(jī)功率(每秒百萬(wàn)指令)nNet:每千人互聯(lián)網(wǎng)絡(luò)戶主數(shù)根據(jù)這6個(gè)變量指標(biāo)來(lái)分析地區(qū)之間的信息基礎(chǔ)設(shè)施發(fā)展的差異,可采用系統(tǒng)聚類法.整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析三、系統(tǒng)聚類法三

14、、系統(tǒng)聚類法3. 操作操作 數(shù)據(jù)文件:”不同地區(qū)信息基礎(chǔ)設(shè)施發(fā)展?fàn)顩r的評(píng)價(jià).sav” 菜單:“分析分類系統(tǒng)聚類”即Q型聚類即R型聚類整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析三、系統(tǒng)聚類法三、系統(tǒng)聚類法3. 操作操作1)“統(tǒng)計(jì)量”按鈕:輸出顯示聚類過(guò)程中每一步合并的類或觀測(cè)量,反映聚類過(guò)程中每一步樣品或類的合并過(guò)程。輸出相似矩陣或不相似矩陣,及其更具體的類別,取決于“方法”按鈕對(duì)應(yīng)的對(duì)話框中的設(shè)置。輸入大于1的整數(shù)。例如,輸入“2”,在結(jié)果窗口將顯示輸出聚為2類的分析結(jié)果。輸入大于1的整數(shù)。表述輸出樣本或變量的分類數(shù)從最小值到最大值的各種分類聚類表。最大類數(shù)值不能大于參與聚類的樣本數(shù)或變量總數(shù)。

15、整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析三、系統(tǒng)聚類法三、系統(tǒng)聚類法3. 操作操作2)“繪制”按鈕:輸入文本框的必須是正整數(shù)。分別是起、止步驟以及步長(zhǎng)。例如,輸入3、9、2,則生成的冰柱圖則從第3步開(kāi)始,顯示第3、5、7、9步的聚類情況。注意:注意:“排序標(biāo)準(zhǔn)”標(biāo)簽文字翻譯的不對(duì),應(yīng)該是“步長(zhǎng)”才準(zhǔn)確。冰柱圖的顯示方向。整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析三、系統(tǒng)聚類法三、系統(tǒng)聚類法3. 操作操作3)“方法”按鈕:該方法合并兩類的依據(jù)是使這兩個(gè)類別里所有兩兩配對(duì)觀測(cè)量的平均距離最小。該方法合并兩類的依據(jù)是使兩個(gè)類別合并后的新類中,觀測(cè)量的平均距離最小。離差平方和。聚類使得類內(nèi)各樣本的離差平

16、方和最小;類間的離差平方和盡可能大。適合于等間隔測(cè)度的連續(xù)性變量。下拉列表中可選擇距離測(cè)度方法。適合于字?jǐn)?shù)變量(離散變量),下拉列表中可選擇不相似性測(cè)度的方法。選擇標(biāo)準(zhǔn)化方法。把相似性值變?yōu)椴幌嗨菩曰蛳喾凑w分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析三、系統(tǒng)聚類法三、系統(tǒng)聚類法3. 操作操作4)“保存”按鈕:保存指定聚類個(gè)數(shù)時(shí)的分類結(jié)果。文本框的值必須是大于1的正數(shù),且小于等于參與聚類的觀測(cè)量個(gè)數(shù)和變量個(gè)數(shù)。文本框中輸入最小聚類數(shù)目和最大聚類數(shù)目,表示分別生成樣本或變量的分類數(shù)從最小值到最大值的各種分類聚類變量。例如,輸入“4”和“6”,表示在聚類結(jié)束后,在原數(shù)據(jù)集中將會(huì)增加3個(gè)變量,分別表明分為4

17、類、5類和6類時(shí)的聚類結(jié)果,即分別為4、5、6類時(shí)各分析對(duì)象分別屬于哪一類。整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析三、系統(tǒng)聚類法三、系統(tǒng)聚類法4. 輸出分析輸出分析1)聚類過(guò)程表步驟序號(hào)第二列和第三列,給出了某一步驟中哪些地區(qū)參與了合并。例如,第一步中,第十個(gè)樣品和第十二個(gè)樣品,首先被合并在一起。每一步的聚類系數(shù)。可根據(jù)這個(gè)系數(shù)來(lái)判斷數(shù)據(jù)應(yīng)該被分為多少類,當(dāng)兩個(gè)相鄰步驟的系數(shù)變化遠(yuǎn)大于前面相鄰步驟變化時(shí),即可大致確定應(yīng)該將聚類過(guò)程進(jìn)行到哪里的類別數(shù)是較為合適的。(主要是參考作用)第五列和第六列,表示參與合并的類是在第幾步第一次出現(xiàn)。0代表該記錄是第一次出現(xiàn)在聚類過(guò)程中。標(biāo)識(shí)出:該步驟合并的類

18、別,下一次將在第幾步中出現(xiàn),與其他類再進(jìn)行合并。整體分析與設(shè)計(jì)的內(nèi)容u 聚類分析聚類分析三、系統(tǒng)聚類法三、系統(tǒng)聚類法4. 輸出分析輸出分析2)聚類分析結(jié)果表3)樹(shù)形圖聚類結(jié)果分兩類。其中,第一類是轉(zhuǎn)型地區(qū)和亞洲、拉美發(fā)展中地區(qū),這些區(qū)域經(jīng)濟(jì)不發(fā)達(dá),基礎(chǔ)設(shè)施薄弱;第二類主要是美、日、歐洲發(fā)達(dá)地區(qū)與新興工業(yè)化地區(qū),如中國(guó)臺(tái)灣、新加坡、韓國(guó)等,信息基礎(chǔ)設(shè)施較好。其中,美國(guó)、瑞典、丹麥的信息基礎(chǔ)設(shè)施發(fā)展最為良好。整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析一、方法原理一、方法原理判別分析是判別樣品所屬類型的一種統(tǒng)計(jì)方法,其應(yīng)用也非常廣泛。在生產(chǎn)、科研和日常生活中,經(jīng)常需要根據(jù)觀測(cè)到的數(shù)據(jù)資料,對(duì)所研究的對(duì)

19、象進(jìn)行分類。例如,在經(jīng)濟(jì)學(xué)中,根據(jù)人均國(guó)民收入、人均工農(nóng)業(yè)產(chǎn)值、人均消費(fèi)水平等多種指標(biāo)來(lái)判定一個(gè)國(guó)家的經(jīng)濟(jì)發(fā)展程度所屬類型;在市場(chǎng)預(yù)測(cè)中,根據(jù)以往調(diào)查所得的種種指標(biāo),判別下季度產(chǎn)品是否暢銷、平?;驕N??傊趯?shí)際問(wèn)題中需要判別的問(wèn)題幾乎到處可見(jiàn)。判別分析和聚類分析不同。判別分析和聚類分析不同。n判別分析是在已知研究對(duì)象分成若干類型(或組別),并已取得各種類型的一批已知樣品的觀測(cè)數(shù)據(jù),在此基礎(chǔ)上根據(jù)某些準(zhǔn)則建立判別式,然后來(lái)對(duì)未知類型的樣品進(jìn)行判別分類。n聚類分析,一批給定樣品要?jiǎng)澐值念愋褪孪炔⒉恢溃枰ㄟ^(guò)聚類分析以確定類型。判別分析和聚類分析常聯(lián)合使用。先聚類分析,再用判別分析建立判別式

20、。整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析一、方法原理一、方法原理判別分析的分類:1)按組數(shù):兩組判別分析和多組判別分析2)按總體所用的數(shù)學(xué)模型不同:線性判別和非線性判別3)按處理變量的方法不同:逐步判別和序貫判別判別方法介紹判別方法介紹距離判別分析距離判別分析,是一種常見(jiàn)的判別分析法。其基本思想是:首先根據(jù)已知分類的數(shù)據(jù)計(jì)算各類的中心(即類的均值),若樣品與第i類的中心距離最近,就認(rèn)為該樣品來(lái)自第i類。例如,兩個(gè)總體的距離判別法中,設(shè)有兩個(gè)總體G1、G2,從第一個(gè)總體中抽取n1個(gè)樣品,從第二個(gè)總體抽取n2個(gè)樣品,每個(gè)樣品測(cè)量p個(gè)指標(biāo)?,F(xiàn)任取一個(gè)樣品,來(lái)判斷X該歸哪一類?11221212,(,

21、)(,),(,)(,),(,)= (,)XGD X GD X GXGD X GD X GD X GD X G待判X到G1的距離X到G2的距離整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析二、操作二、操作數(shù)據(jù)文件:“省市地區(qū)經(jīng)濟(jì)增長(zhǎng)差異.sav”菜單:“分析分類判別”選擇離散型變量作為分類變量.然后在”定義范圍”中輸入分類變量的數(shù)值范圍.當(dāng)所有自變量都能對(duì)觀測(cè)量特性提供豐富的信息時(shí),選擇該選項(xiàng).采用逐步判別法作判別分析.點(diǎn)選該按鈕,界面右側(cè)的”方法”按鈕將被激活,可以進(jìn)一步選擇判別分析方法.整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析二、操作二、操作1)”統(tǒng)計(jì)量”按鈕對(duì)各類協(xié)方差矩陣相等的假設(shè)進(jìn)行檢驗(yàn)。對(duì)

22、每一類給出一組系數(shù),并給出該組中判別分?jǐn)?shù)最大的觀測(cè)量。整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析二、操作二、操作2)”方法”按鈕每 步 都 選 擇 W i l k 的lambda統(tǒng)計(jì)量最小的變量加入判別函數(shù)。選擇未解釋方差和最小變量加入判別函數(shù)。每步都選擇靠的最近的兩類間的馬氏距離的變量加入判別函數(shù)中。每步都選擇任何兩類間的“最小F值”達(dá)到最大的變量加入判別函數(shù)中。每步都選擇使V統(tǒng)計(jì)量產(chǎn)生最大增量的變量加入判別函數(shù)。(在文本框中輸入數(shù)值,當(dāng)某變量導(dǎo)致的V值增量大于該數(shù)時(shí),此變量就進(jìn)入判別函數(shù)。)用于設(shè)置逐步判別過(guò)程中保留或刪除變量的準(zhǔn)則。當(dāng)變量的F值大于文本框中的數(shù)值時(shí),保留該變量。當(dāng)變量的F值

23、小于文本框中的數(shù)值時(shí),刪除該變量。與F值類似,只是換成了F檢驗(yàn)概率。顯示每步選擇變量之后各變量的統(tǒng)計(jì)量結(jié)果。顯示兩類之間的F比值矩陣。整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析二、操作二、操作3)”分類”按鈕各類先驗(yàn)概率相等,若分m類,則概率均為1/m根據(jù)各類樣本量占總樣本量的比例,計(jì)算先驗(yàn)概率。輸出每個(gè)觀測(cè)量的判別分?jǐn)?shù)、實(shí)際類、預(yù)測(cè)類(依據(jù)判別函數(shù)求得的分類結(jié)果)和后驗(yàn)概率等。若文本框輸入了數(shù)據(jù)n,則表示輸出前n個(gè)觀測(cè)量。根據(jù)前兩個(gè)判別函數(shù)的得分,作出包括所有類別的散點(diǎn)圖;若只有一個(gè)判別函數(shù),就輸出直方圖。根據(jù)前兩個(gè)判別函數(shù)的得分,作每一個(gè)類別的散點(diǎn)圖;若只有一個(gè)判別函數(shù),就輸出直方圖。根據(jù)判

24、別函數(shù)的得分所作的、對(duì)觀測(cè)量進(jìn)行分類的邊界圖。此圖把平面劃分成與分類個(gè)數(shù)相同的幾個(gè)區(qū)域,每類占據(jù)一個(gè)區(qū)域,各類的均值在其區(qū)域中用“*”標(biāo)出;若只有一個(gè)判別函數(shù),則不做此圖。整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析二、操作二、操作4)”保存”按鈕將復(fù)選框指定的計(jì)算結(jié)果保存到記錄集。注:注:目前選了這一項(xiàng)會(huì)出現(xiàn)系統(tǒng)異常。整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析三、輸出分析三、輸出分析1)判別分析概述表參加分析的變量總數(shù)為30有效的變量總數(shù)為27包含缺失值或分類變量范圍之外的觀測(cè)量為3.“至少一個(gè)缺失判別變量”整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析三、輸出分析三、輸出分析2)分組統(tǒng)計(jì)表給出了不同類別的基本描述性統(tǒng)計(jì)量。從數(shù)據(jù)可知:不同類別之間的省市經(jīng)濟(jì)指標(biāo)差異比較明顯。整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析三、輸出分析三、輸出分析3)類均值相等檢驗(yàn)表這個(gè)表,列出了不同類之間的 4 個(gè)經(jīng)濟(jì)指標(biāo),均值是否相等的檢驗(yàn)結(jié)果。可知,4個(gè)指標(biāo)都小于顯著性水平,這就說(shuō)明不同類之間的指標(biāo)均值存在顯著性差異,可以進(jìn)行判別分析。整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析三、輸出分析三、輸出分析4)判別分析特征值特征值方差百分比方差累計(jì)百分比典型相關(guān)系數(shù)5)Wilkss Lambda表整體分析與設(shè)計(jì)的內(nèi)容u 判別分析判別分析三、輸出分析三、輸出分析6)標(biāo)準(zhǔn)化判別函數(shù)系數(shù)對(duì)判別結(jié)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論