高級心理統(tǒng)計(第2版)課件 6-聚類分析_第1頁
高級心理統(tǒng)計(第2版)課件 6-聚類分析_第2頁
高級心理統(tǒng)計(第2版)課件 6-聚類分析_第3頁
高級心理統(tǒng)計(第2版)課件 6-聚類分析_第4頁
高級心理統(tǒng)計(第2版)課件 6-聚類分析_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

新編21世紀(jì)心理學(xué)系列教材高級心理統(tǒng)計(第2版)劉紅云

編著第六章聚類分析核心要點掌握聚類分析的基本概念,熟悉聚類分析的應(yīng)用場景。了解層次聚類法和非層次聚類法的概念,并掌握它們的計算步驟。知道如何對聚類分析的結(jié)果進行解釋。了解聚類分析與因素分析、回歸分析的區(qū)別與聯(lián)系。提綱1一般目的和描述2主要回答的問題3模型及原理4聚類分析的主要類型5值得注意的問題6應(yīng)用案例及SPSS操作1.一般目的和描述聚類分析是將所觀測的事物或觀測事物的指標(biāo)進行分類的一種統(tǒng)計分析方法,它的目的是辨認在某些特征上相似的事物,并將這些事物按照這些特征劃分為幾個類,使得同一類中的事物具有較高的同質(zhì)性,不同類中的事物具有較大的異質(zhì)性。聚類分析的對象有兩個方面,一個方面是對樣品也即個案或被試聚類(稱Q型聚類),另一個方面是對指標(biāo)也即變量進行聚類(稱R型聚類)。2.主要回答的問題如何測量變之間的相似性或個體之間的距離如何將相似的事物或變量聚為一類如何描述和解釋所聚成的各類3.模型及原理距離每個樣品(案例)有p個指標(biāo)(變量),故每個樣品可以看成p維空間中的一個點,n個樣品組成p維空間中的n個點,用距離來度量樣品之間接近的程度。距離測度應(yīng)滿足下列四個條件:1)dij

0;2)dij=dji,即距離具有對稱性;3)dijdik+dkj,即三角不等式,任意一邊小于其他兩邊之和;4)如果dij0,則ij3.模型及原理距離3.模型及原理相似系數(shù)3.模型及原理相似系數(shù)選擇原則要考慮所選擇的距離/相似系數(shù)公式在實際應(yīng)用中有明確的意義。要綜合考慮對樣本觀測數(shù)據(jù)的預(yù)處理和將要采用聚類分析方法。要考慮研究對象的特點及計算量的大小。3.模型及原理變量的標(biāo)準(zhǔn)化中心化變換變量的標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化變換中心化變換變量的標(biāo)準(zhǔn)化極差正規(guī)化變換中心化變換變量的標(biāo)準(zhǔn)化對數(shù)變換中心化變換4.聚類分析的主要類型根據(jù)聚類分析的對象劃分樣品聚類(稱Q型聚類)指標(biāo)聚類(稱R型聚類)根據(jù)聚類分析的原理劃分層次聚類法(HierarchicalCluster)非層次聚類法(NonhierarchicalCluster)或K平均數(shù)法(K—meansmethods)4.1層次聚類1、聚集法:首先把每個案例各自看成一類,先把距離最近的兩類合并,然后重新計算類與類之間的距離,再把距離最近的兩類合并,每一步減少一類,這個過程一直持續(xù)到所有案例歸為一類為止。2、分解法:與聚集法相反,首先把所有的案例看成一類,然后把最不相似的案例分為兩類,每一步增加一類,直到每個案例都成為一類為止。4.1層次聚類(1)最短距離法(SingleLinkage)類與類之間的距離定義為一個類中的所有案例與另一類中的所有案例之間的距離最小者。(2)最長距離法(CompleteLinkage)與最短距離法相反,類與類之間的距離定義為兩類中離得最遠的兩個案例之間的距離。4.1層次聚類(3)中間距離法4.1層次聚類(4)重心法4.1層次聚類(5)類平均法4.1層次聚類(6)可變類平均法4.1層次聚類(7)可變法4.1層次聚類(7)離差平方和法4.2非層次聚類K平均數(shù)法的計算步驟如下:(1)指定要形成的聚類個數(shù),對樣本點進行初始分類并計算每一個初始分類的重心;(2)調(diào)整分類,計算每個樣本點到各類重心的距離,把每個樣本點歸到距離重心最近的那個類;(3)重新計算每個類的重心;(4)重復(fù)第(2)和第(3)步,直到?jīng)]有樣本點可以再調(diào)整為止5.值得注意的問題5.1分類數(shù)目的確定和結(jié)果解釋類間差異與類內(nèi)差異相比,類間差異顯著大于類內(nèi)差異所分出的各類有明確的含義;若選用不同的方法進行聚類,應(yīng)該得到較多相同的類;確定的類中,每類所包含的元素的個數(shù)不應(yīng)太多。5.值得注意的問題5.2聚類分析與其他多元分析方法的聯(lián)系聚類分析與因素分析研究使用的目的不同,因素分析是從眾多的測量指標(biāo)中尋求潛在變量,即決定諸多指標(biāo)之間存在相關(guān)的潛變量因素是什么,而聚類分析,只尋求指標(biāo)是有哪些不同的類別。假設(shè)不同,不管哪種因素分析模型,都假設(shè)原有的觀測指標(biāo)可以用新的因素取代,而聚類只是尋求其中一個有代表性的指標(biāo)代替原來的眾多指標(biāo)。計算方法不同,求解因素的方法與聚類的計算思路與方法有很大差異。5.值得注意的問題5.2聚類分析與其他多元分析方法的聯(lián)系聚類分析與回歸分析回歸分析是從諸多自變量(因)中尋求與因變量(果)之間變量關(guān)系的統(tǒng)計分析的方法。聯(lián)系,當(dāng)回歸分析中進入的自變量太多時,為了減少自變量的數(shù)目,簡化回歸計算,可以先用聚類分析,從各指標(biāo)類別中選取有代表性的指標(biāo),用這些少數(shù)有代表性的指標(biāo)進行回歸分析,可大大減少自變量的數(shù)目,簡化回歸分析中的的計算,特別是當(dāng)自變量很多的情況下,此種方法的優(yōu)點就顯現(xiàn)出來了。6.案例及SPSS操作一、應(yīng)用案例及SPSS操作1.層次聚類

詳見課本P128-1332.K-平均值聚類詳見課本P133-136關(guān)鍵術(shù)語聚類分析層次聚類法非層次聚類法K平均數(shù)法內(nèi)容小結(jié)聚類分析是將所觀測的事物或觀測事物的指標(biāo)進行分類的一種統(tǒng)計分析方法,它的目的是辨認在某些特征上相似的事物,并將這些事物按照這些特征劃分為幾類,使得同一類中的事物具有較高的同質(zhì)性,不同類中的事物具有較大的異質(zhì)性。根據(jù)聚類分析的對象,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論