SPSS在教育統(tǒng)計中的應用-以PISA數(shù)據(jù)為例 課件 第14章 判別分析_第1頁
SPSS在教育統(tǒng)計中的應用-以PISA數(shù)據(jù)為例 課件 第14章 判別分析_第2頁
SPSS在教育統(tǒng)計中的應用-以PISA數(shù)據(jù)為例 課件 第14章 判別分析_第3頁
SPSS在教育統(tǒng)計中的應用-以PISA數(shù)據(jù)為例 課件 第14章 判別分析_第4頁
SPSS在教育統(tǒng)計中的應用-以PISA數(shù)據(jù)為例 課件 第14章 判別分析_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第14章

判別分析目錄Contents14.1判別分析概述14.2案例分析14.3案例結果分析判別分析概述14.1判別分析的原理:判別分析的核心在于考察組別之間的差異并找到判別函數(shù),確定將個體分配到兩個或更多已知群體中的概率,進而將需要判別的樣本分類。14.1判別分析概述1原理與主要步驟判別分析的主要步驟:(1)選擇用于判別分析的自變量。這些自變量應該能夠有效地區(qū)分不同的類別或群體,要反映出要判別變量的特征,且和判別分析的目的密切相關。(2)確定分析樣本和驗證樣本。數(shù)據(jù)集分為訓練集和驗證集兩部分。分析樣本(訓練集)用于確定判別函數(shù),該函數(shù)將自變量映射到類別標簽,以便對新樣本進行分類;驗證樣本(驗證集)用于檢查判別效果,評估判別函數(shù)在未知數(shù)據(jù)上的性能,以確保其泛化能力。14.1判別分析概述1原理與主要步驟(3)構建判別函數(shù)。通過數(shù)學方法(如線性判別分析、二次判別分析等)構建判別函數(shù),以便將自變量映射到類別標簽。(4)檢驗判別函數(shù)的顯著性。在建立判別函數(shù)后,通常需要進行統(tǒng)計檢驗來評估其在預測類別方面的顯著性。(5)解讀并分析判別的效果。對判別函數(shù)的結果進行解釋和分析,以便理解自變量對因變量分類的影響,并且提出改進模型的建議。14.1判別分析概述1原理與主要步驟基于判別分析的分類過程,按照判別標準區(qū)分,判別分析可分為距離判別分析、費希爾判別分析和貝葉斯判別分析。(1)距離判別分析(DistanceDiscriminantAnalysis):根據(jù)各樣本與各母體之間的距離遠近做出判別。通過建立關于各母體的距離判別函數(shù)式,得出各樣本與各母體之間的距離值,判斷與樣本距離最近的那個母體,主要基于馬氏距離和歐式距離。14.1判別分析概述2判別分析的分類(2)貝葉斯判別分析(BayesianDiscriminantAnalysis):計算待判定樣本屬于每個總體的條件概率并將樣本歸入條件概率最大的組。其主要思想如下:首先利用樣本所屬分類的先驗概率通過貝葉斯法則求出樣本所屬分類的后驗概率,主要基于最大后驗概率法和最小期望判別代價法,并依據(jù)該后驗概率分布做出統(tǒng)計推斷。14.1判別分析概述2判別分析的分類(3)費希爾判別分析(Fisher’sDiscriminantAnalysis):利用投影的方法將多維問題簡化為一維問題來處理。通過建立的線性判別函數(shù)計算出各個觀測量在各個典型變量維度上的坐標并得出樣本與各個類中心的距離,以此作為分類依據(jù)。14.1判別分析概述2判別分析的分類(1)每個判別變量不能是其他判別變量的線性組合,即自變量之間的相關性不能太大。(2)任何給定的自變量的均值和方差不能有太大的相關性。(3)兩個自變量之間的相關性在各個組之間是一致的。(4)各個判別變量之間具有多元正態(tài)分布。(5)各組變量的協(xié)方差矩陣相等。一般采用BOX檢驗來對各個類別的協(xié)方差矩陣是否相等進行檢驗。14.1判別分析概述3判別分析的假設案例分析14.2本節(jié)案例聚焦于識別出區(qū)分不同閱讀素養(yǎng)水平學生的相關特征,自變量選擇PISA2018年數(shù)據(jù),包括元認知策略中的信息評鑒(METASPAM)、總結與概括(METASUM)、閱讀興趣(JOYREAD)、學生的職業(yè)期望(BSMJ)、家庭財富(HOMEPOS)和父親的受教育水平(FISCED)。14.2案例分析1數(shù)據(jù)說明14.2案例分析2操作步驟(1)打開數(shù)據(jù),依次點擊菜單“分析→分類→判別”(2)將“類別”選入分組變量,并設置定義范圍【分組變量】矩形框中選擇表明已知的觀測量所屬類別的變量(一定是離散變量),在定義范圍框最小值中輸入該分類變量的最小值,最大框中輸入該分類變量的最大值。14.2案例分析2操作步驟(3)將其余指標選入自變量,并點選下方的“一起輸入自變量”/“使用步進法”,選擇“一起輸入變量”【一起輸入自變量】選項,當認為所有自變量都能對測量特性提供豐富的信息時,使用該選擇項。14.2案例分析2操作步驟【使用步進式方法】選項,當不認為所有自變量都能對觀測量特性提供豐富的信息時,使用該選擇項。當鼠標單擊該項時【方法】按鈕加亮,可以進一步選擇判別分析方法。但一般我們做判別分析時會先做相關的預分析,因而通常不會選擇此方法。14.2案例分析2操作步驟【方法】選項:步進法讓自變量逐個嘗試進入函數(shù)式,如果進入到函數(shù)式中的自變量符合條件,則保留在函數(shù)式中,否則,將從函數(shù)式中剔除。1.威爾克Lambda選項:它是組內平方和與總平方和之比,用于描述各組的均值是否存在顯著差別,值為1表示各組均值無差別;值越接近0表示各組差別越大。2.未解釋方差:指把計算殘余最小的自變量優(yōu)先納入到判別函數(shù)式中。3.馬氏距離:它把每步都使靠得最近的兩類間的馬氏距離最大的變量進入判別函數(shù)。4.最小比:把方差差異最大的自變量優(yōu)先納入到判別函數(shù)中。14.2案例分析2操作步驟5.拉奧:把勞氏統(tǒng)計量產生最大增值的自變量優(yōu)先納入到判別函數(shù)中??梢詫σ粋€要加入到模型中的變量的值指定一個最小增量。選擇此種方法后,應該在該項下面的“要輸入的”后的矩形框中輸入這個增量的指定值。當某變量導致的值增量大于指定值的變量后進入判別函數(shù)。14.2案例分析2操作步驟【條件】選項:選擇逐步判別停止的判據(jù)使用F值:系統(tǒng)默認的判據(jù)。當加入一個變量(或剔除一個變量)后,對在判別函數(shù)中的變量進行方差分析。當計算的值大于指定的進入值時,該變量保留在函數(shù)中。當該變量使計算的值小于指定的刪除值時,該變量從函數(shù)中剔除。設置這兩個值時應該注意進入值大于刪除值。使用F的概率:決定變量是否加入函數(shù)或被剔除的概率。刪除值(移出變量的值概率)應大于進入值(加入變量的值概率)。圖中所示均為系統(tǒng)默認值。14.2案例分析2操作步驟【顯示】選項:對于逐步選擇變量的過程和最后結果的顯示可以通過輸出欄中的兩項進行選擇:步驟摘要:要求在逐步選擇變量過程中的每一步之后顯示每個變量的統(tǒng)計量。成對距離的值:要求顯示類別之間的值矩陣。14.2案例分析2操作步驟(4)在“統(tǒng)計”選項下選擇需要統(tǒng)計的量,包含描述、函數(shù)系數(shù)和矩陣三大類。一般選擇“平均值”“單變量”、“博克斯”、“費希爾”和“未標準化”14.2案例分析2操作步驟【描述】選項:給出自變量的一些描述性結果。平均值:可以輸出各類中各自變量的均值、標準差和各自變量總樣本的均值和標準差。單變量ANOVA:對各類中同一自變量均值都相等的假設進行檢驗,輸出單變量的方差分析結果。博克斯:對各組的協(xié)方差矩陣相等的假設進行檢驗。如果樣本足夠大,差異不顯著的值表明矩陣差異不明顯。14.2案例分析2操作步驟【函數(shù)系數(shù)】選項:選擇判別函數(shù)系數(shù)的輸出形式。費希爾:給出Bayes判別函數(shù)的系數(shù)。對每一類給出一組系數(shù),并給出該組中判別分數(shù)最大的觀測量。(注意:這個選項不是要給出Fisher判別函數(shù)的系數(shù)。這個復選框的名字之所以為Fisher’s,是因為按判別函數(shù)值最大的一組進行歸類這種思想是由Fisher提出來的。這里極易混淆,請注意辨別。)未標準化:給出未標準化的判別函數(shù)(即典型判別函數(shù))的系數(shù)(SPSS默認給出標準化的判別函數(shù)信息)。14.2案例分析2操作步驟【矩陣】選項:給出相關陣及協(xié)差陣信息。組內相關:即類內相關矩陣,它是根據(jù)在計算相關矩陣之前將各組(類)協(xié)方差矩陣平均后計算類內相關矩陣。組內協(xié)方差:即計算并顯示合并類內協(xié)方差矩陣,是將各組(類)協(xié)方差矩陣平均后計算的。區(qū)別于總協(xié)方差陣。分組協(xié)方差:對每類輸出顯示一個協(xié)方差矩陣??傮w協(xié)方差:計算并顯示總樣本的協(xié)方差矩陣。14.2案例分析2操作步驟(5)在“分類”選項下,選擇關于分類想要輸出的指標。一般先驗概率選擇“所有組相等”;顯示“摘要表”、“留一分類”;使用“組內”協(xié)方差陣及圖的所有選項。【使用均值替換缺失值】選項,即用該類變量的均值代替缺失值。缺失值缺失大于10%,不建議勾選。14.2案例分析2操作步驟【先驗概率】選項:兩者選其一。所有組相等:各類先驗概率相等。若分為類,則各類先驗概率均為。系統(tǒng)默認。根據(jù)組大小計算:由各類的樣本量計算決定,即各類的先驗概率與其樣本量成正比?!臼褂脜f(xié)方差矩陣】選項:選擇分類使用的協(xié)方差矩陣。在組內:指定使用合并組內協(xié)方差矩陣進行分類。系統(tǒng)默認。分組:指定使用各組協(xié)方差矩陣進行分類。由于分類是根據(jù)判別函數(shù),而不是根據(jù)原始變量,因此該選擇項不是總等價于二次判別。14.2案例分析2操作步驟【圖】選項:選擇要求輸出的統(tǒng)計圖。合并組:生成一張包括各類的散點圖。該散點圖是根據(jù)前兩個判別函數(shù)值作的散點圖。如果只有一個判別函數(shù)就輸出直方圖。分組:根據(jù)前兩個判別函數(shù)值對每一類生成一張散點圖,共分為幾類就生成幾張散點圖。如果只有一個判別函數(shù)就輸出直方圖。區(qū)域圖:生成用于根據(jù)函數(shù)值把觀測量分到各組中去的邊界圖。此種統(tǒng)計圖把一張圖的平面劃分出與類數(shù)相同的幾個區(qū)域。每一類占據(jù)一個區(qū),各類的均值在各區(qū)中用*號標出。如果僅有一個判別函數(shù),則不作此圖。14.2案例分析2操作步驟【顯示】選項:選擇生成到輸出窗中的分類結果。個案摘要:要求輸出每個觀測量包括判別分數(shù)、實際類、預測類(根據(jù)判別函數(shù)求得的分類結果)和后驗概率等。選擇此項還摘要表:要求輸出分類的小結,給出正確分類觀測量數(shù)(原始類和根據(jù)判別函數(shù)計算的預測類相同)和錯分觀測量數(shù)和錯分率。留一分類:輸出對每個觀測量進行分類的結果,所依據(jù)的判別是由除該觀測量以外的其他觀測量導出的,也稱為交互校驗結果。建議勾選。14.2案例分析2操作步驟在“保存”選項,指定生成并保存在數(shù)據(jù)文件中的新變量。保持默認選項并單擊【繼續(xù)】按鈕14.2案例分析2操作步驟預測組成員:要求建立一個新變量,預測觀測量的分類。是根據(jù)判別分數(shù)把觀名為dis_1,如果在工作數(shù)據(jù)文件中不把前一次建立的新變量刪除,第次運行Descriminant過程建立的新變量默認的變量名為dis_n。判別分數(shù):要求建立fisher判別分數(shù)的新變量。該分數(shù)是由未標準化的判別系數(shù)乘自變量的值,將這些乘積求和后加上常數(shù)得來。每次運行Discriminant過程都給出一組表明判別分數(shù)的新變量,建立幾個判別函數(shù)就有幾個判別分數(shù)變量。組成員概率:Bayes后驗概率值。有類,對一個觀測量就會給出個概率值,因此建立個新變量。案例結果分析14.314.3.1兩總體判別分析1描述性統(tǒng)計結果(1)分析個案處理摘要在分析結果中的“分析案例處理摘要”分析表中,主要顯示了有效個案數(shù)、排除個案數(shù)和合計個案數(shù)14.3.1兩總體判別分析1描述性統(tǒng)計結果(2)組統(tǒng)計量表在分析結果中的“組統(tǒng)計量”分析表中,主要顯示了各組的均值、標準差和有效個案數(shù),可以借此了解不同組中各指標的差異。14.3.1兩總體判別分析1描述性統(tǒng)計結果(3)組平均值的同等檢驗在分析結果中的“組均值的均等性的檢驗”分析表中,主要顯示了各組在不同指標下的均值差異情況。從表中可以看出,在2個指標中,不同組差異檢驗的均小于0.05,表明不同組之間在各個指標上均存在顯著差異,可以進行判別分析。14.3.1兩總體判別分析1描述性統(tǒng)計結果(4)匯聚組內矩陣在假設兩個組的協(xié)方差相等的情況下,可以采用兩個組聚合的協(xié)方差矩陣(即組內協(xié)方差矩陣),同時給出了兩個聚合組內矩陣:協(xié)方差矩陣和相關系數(shù)矩陣。14.3.1兩總體判別分析1描述性統(tǒng)計結果(5)協(xié)方差矩陣圖中協(xié)方差矩陣給出了樣本數(shù)據(jù)的分組協(xié)方差矩陣。該表中給出了3個協(xié)方差矩陣:PV_LEVEL_2為0——低閱讀表現(xiàn)組協(xié)方差矩陣;PV_LEVEL_2為1——高閱讀表現(xiàn)組協(xié)方差矩陣;總計——對所有樣本數(shù)據(jù)計算的協(xié)方差矩陣。14.3.1兩總體判別分析1描述性統(tǒng)計結果(6)協(xié)方差矩陣的博克斯等同性檢驗博克斯等同性檢驗是對各組的協(xié)方差矩陣相等的假設進行檢驗。在分析結果中的“對數(shù)決定因子”分析表中,主要顯示了不同組別的秩和對數(shù)決定因子分析結果。14.3.1兩總體判別分析1描述性統(tǒng)計結果在分析結果中的“檢驗結果”分析表中,主要顯示了和各值。通過表中的數(shù)據(jù)可以發(fā)現(xiàn),p<0.05表示存在顯著性差異,即拒絕協(xié)方差矩陣相當?shù)脑僭O,說明兩個分組的協(xié)方差矩陣不相等。14.3.1兩總體判別分析2典則判別函數(shù)此部分給出的是判別函數(shù)檢驗,本次分析系統(tǒng)構建了一個判別函數(shù),左圖給出了典則判別函數(shù)的特征值以及方差貢獻情況等信息。特征值為1.114,能夠解釋所有的變異。右圖給出了典則判別函數(shù)的有效性檢驗,即利用威爾克的Lambda統(tǒng)計量來檢驗各個判別函數(shù)有無統(tǒng)計學意義。14.3.1兩總體判別分析3判別函數(shù)標準化判別函數(shù)表達式為:式中x1表示元認知策略:總結與概括(METASUM),x2表示元認知策略:信息評鑒(METASPAM),x3表示學生職業(yè)期望(BSMJ),x4表示閱讀興趣(JOYREAD),x5表示家庭財富(HOMEPOS),x6表示父親受教育水平(FISCED)。14.3.1兩總體判別分析3判別函數(shù)非標準化判別函數(shù)表達式為:14.3.1兩總體判別分析4結構矩陣與組質心處的函數(shù)結構矩陣可以評估各個預測變量對判別得分的貢獻大小。結構矩陣給出了預測變量和判別變量的Pearson相關系數(shù),并按照相關系數(shù)絕對值的大小進行了降序排列。組質心處的函數(shù)是各個組的判別函數(shù)得分的均值,可以看做為質心(重心)。如果有多個判別函數(shù),那么將有多組函數(shù)均值。14.3.1兩總體判別分析5分類統(tǒng)計結果(1)分類函數(shù)系數(shù)圖中給出的是貝葉斯的費希爾線性判別函數(shù)的系數(shù),利用圖中的數(shù)據(jù)可以直接寫出貝葉斯判別函數(shù),判別的類別變量有幾類就有幾個判別函數(shù),因為閱讀素養(yǎng)水平有兩個類別,因此這里有兩個函數(shù),即14.3.1兩總體判別分析5分類統(tǒng)計結果(2)分類結果經(jīng)過對比,我們會發(fā)現(xiàn)系統(tǒng)的判斷不一定完全與原來的分類一致。這樣判斷錯誤的個案數(shù)的具體情況如圖所示,例如,系統(tǒng)把204個原類別為“1”的個案判定為“0”,把368個原類別為“0”的個案判定為“1”。14.3.2多總體判別分析1典則判別函數(shù)左圖可知,判別分析模型中的方差由前兩個判別函數(shù)所解釋右圖給出了判別函數(shù)對于各個分組均值的顯著性檢驗成果。從第一行可知,各個分組的判別函數(shù)1的均值是顯著不相等的,第二行表示各個分組在第二個判別函數(shù)的均值上顯著不相等。14.3.2多總體判別分析2判別函數(shù)標準化的典型判別函數(shù)可以表示為:式中自變量含義與之前相同從函數(shù)的系數(shù)可以認為變量METASPAM的信息主要體現(xiàn)在第一個判別函數(shù)中,變量FISCED則主要反映在第二個判別函數(shù)上。14.3.2多總體判別分析2判別函數(shù)但是如果需要通過判別函數(shù)找到該個案在二維坐標上的取值,就需要用各變量的非標準化系數(shù)構建起判別函數(shù),如圖所示,這里的系數(shù)是非標準化的系數(shù),因而不能從系數(shù)大小來對預測變量判別能力的大小進行判斷。14.3.2多總體判別分析3結構矩陣與組質心處的函數(shù)上圖為結構矩陣結果。標有“*”表示自變量與判別函數(shù)的相關系數(shù)最大。從表中可知,F(xiàn)ISCED變量是與第二個判別函數(shù)密切相關的唯一變量,其余五個變量均與第一個判別函數(shù)有著密切的關系,表明第一個函數(shù)是一個“穩(wěn)定”(Stability)的判別函數(shù)。下圖給出的是按照分類來計算的判別函數(shù)得分的均值。函數(shù)1下,類別“0”的質心取值為-1.64,函數(shù)2下,類別“0”的質心取值為-0.362。14.3.2多總體判別分析4分類統(tǒng)計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論