判別分析方法與SPSS分析課件_第1頁
判別分析方法與SPSS分析課件_第2頁
判別分析方法與SPSS分析課件_第3頁
判別分析方法與SPSS分析課件_第4頁
判別分析方法與SPSS分析課件_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

判別分析方法基于SPSS應(yīng)用軟件判別分析方法基于SPSS應(yīng)用軟件1一、判別分析意義判別分析是根據(jù)表明事物特點的變量值和它們所屬的類,求出判別函數(shù)。根據(jù)判別函數(shù)對未知所屬類別的事物進(jìn)行分類的一種分析方法。在自然科學(xué)和社會科學(xué)的各個領(lǐng)域經(jīng)常遇到需要對某個個體屬于哪一類進(jìn)行判斷。如動物學(xué)家對動物如何分類的研究和某個動物屬于哪一類、目、綱的判斷。不同:判別分析和聚類分析不同的在于判別分析要求已知一系列反映事物特征的數(shù)值變量的值,并且已知各個體的分類(訓(xùn)練樣本)。一、判別分析意義判別分析是根據(jù)表明事物特點2方法有

距離判別——根據(jù)個案與總體均值間的距離大小的原則,進(jìn)行判別。

貝葉斯判別——根據(jù)后驗概率最大的原則。

典型判別——求原始變量的線性組合,使產(chǎn)生的新變量之更能將類分開。

逐步判別——有逐步篩選的辦法,將對判別有貢獻(xiàn)的變量選出。

方法有距離判別——根據(jù)個案與總體均值間的距離大小3

例中小企業(yè)的破產(chǎn)模型為了研究中小企業(yè)的破產(chǎn)模型,選定4個經(jīng)濟(jì)指標(biāo):X1總負(fù)債率(現(xiàn)金收益/總負(fù)債)X2收益性指標(biāo)(純收入/總財產(chǎn))X3短期支付能力(流動資產(chǎn)/流動負(fù)債)X4生產(chǎn)效率性指標(biāo)(流動資產(chǎn)/純銷售額)對17個破產(chǎn)企業(yè)(1類)和21個正常運行企業(yè)(2類)進(jìn)行了調(diào)查,得如下資料:例中小企業(yè)的破產(chǎn)模型4總負(fù)債率收益性指標(biāo)短期支付能力生產(chǎn)效率指標(biāo)類別-.45-.411.09.451-.56-.311.51.161.06.021.01.401-.07-.091.45.261-.10-.091.56.671-.14-.07.71.281-.23-.30.22.181.07.021.31.251.01.002.15.701-.28-.231.19.661.15.051.88.271.37.111.99.381-.08-.081.51.421.05.031.68.951.01.001.26.601.12.111.14.171-.28-.271.27.511.51.102.49.542.08.022.01.532總負(fù)債率收益性指標(biāo)短期支付能力生產(chǎn)效率指標(biāo)類別-.45-.45.38.113.27.552.19.052.25.332.32.074.24.632.31.054.45.692.12.052.52.692-.02.022.05.352.22.082.35.402.17.071.80.522.15.052.17.552-.10-1.012.50.582.14-.03.46.262.14.072.61.522-.33-.093.01.472.48.091.24.182.56.114.29.452.20.081.99.302.47.142.92.452.17.042.45.142.58.045.06.132.04.011.50.71待判-.06-.061.37.40待判.38.113.27.552.19.052.25.332.36.07-.011.37.34待判-.13-.141.42.44待判.15.062.23.56待判.16.052.31.20待判.29.061.84.38待判.54.112.33.48待判.07-.011.37.34待判-.13-.141.42.47判別分析方法與SPSS分析課件8距離的判別由于已經(jīng)知道所有點的類別了,所以可以求得每個類型的中心。這樣只要定義了如何計算距離,就可以得到任何給定的點(企業(yè))到這三個中心的三個距離。顯然,最簡單的辦法就是離哪個中心距離最近,就屬于哪一類。通常使用的距離是所謂的Mahalanobis距離(馬氏距離)。用來比較到各個中心距離的數(shù)學(xué)函數(shù)稱為判別函數(shù)(discriminantfunction).這種根據(jù)遠(yuǎn)近判別的方法,原理簡單,直觀易懂。距離的判別由于已經(jīng)知道所有點9貝葉斯判別根據(jù)后驗概率最大的原則,在企業(yè)的財務(wù)狀況下,利用貝葉斯公式計算其判給各類的后驗概率,哪個概率越大,則判給哪類。貝葉斯判別根據(jù)后驗概率最大的10典型判別法(先計算新變量的線性組合)考慮只有兩個(預(yù)測)變量的判別分析問題。假定這里只有兩類。數(shù)據(jù)中的每個觀測值是二維空間的一個點。見圖(下一張幻燈片)。這里只有兩種已知類型的訓(xùn)練樣本。其中一類有38個點(用“o”表示),另一類有44個點(用“*”表示)。按照原來的變量(橫坐標(biāo)和縱坐標(biāo)),很難將這兩種點分開。于是就尋找一個方向,也就是圖上的虛線方向,沿著這個方向朝和這個虛線垂直的一條直線進(jìn)行投影會使得這兩類分得最清楚??梢钥闯?,如果向其他方向投影,判別效果不會比這個好。有了投影之后,再用前面講到的距離遠(yuǎn)近的方法來得到判別準(zhǔn)則。這種首先進(jìn)行投影的判別方法就是典型判別法。典型判別法(先計算新變量的線性組合)11判別分析方法與SPSS分析課件12逐步判別法(僅僅是在前面的方法中加入變量選擇的功能)有時,一些變量對于判別并沒有什么作用,為了得到對判別最合適的變量,可以使用逐步判別。也就是,一邊判別,一邊引進(jìn)判別能力最強的變量,這個過程可以有進(jìn)有出。一個變量的判別能力的判斷方法有很多種,主要利用各種檢驗,例如Wilks’Lambda、Rao’sV、TheSquaredMahalanobisDistance、SmallestFratio或TheSumofUnexplainedVariations等檢驗。其細(xì)節(jié)這里就不贅述了;這些不同方法可由統(tǒng)計軟件的各種選項來實現(xiàn)。逐步判別的其他方面和前面的無異。逐步判別法(僅僅是在前面的方法中加入變量選擇的功能13第一步:打開判別分析的窗口。變量全部選入。變量逐步選入全部選入。第一步:打開判別分析的窗口。變量全部選入。變量逐步選入全部選14第二步:定義類的代碼。第二步:定義類的代碼。15第三步:將變量放入獨立變量框。第三步:將變量放入獨立變量框。16Means-計算平均數(shù);UnivariateANOVAs—討論單變量的方差分析,看哪些本來在組間有差異;Box’sM統(tǒng)計量—總體的協(xié)方差相等的檢驗。Fisher’s-判別函數(shù)的系數(shù);Unstandardized沒有標(biāo)準(zhǔn)化的判別函數(shù)的系數(shù);關(guān)于協(xié)方差矩陣的要求。第四步:選擇統(tǒng)計量。Fisher’s-判別函數(shù)的系數(shù);關(guān)于協(xié)方差矩陣的要求。第四17Prior—對先驗概率的要求,上一個選項是先驗概率相等,后一個是以樣本的頻率為先驗概率;Display-對輸出數(shù)據(jù)的要求。Casewiseresult——所有個案的結(jié)果;Summarytable——判別結(jié)果的表格;Leave-out-classification——交叉核實。UseCovariance—利用什么矩陣計算判別函數(shù)。組內(nèi)的協(xié)方差矩陣,還是分組協(xié)方差矩陣;Plot—對典型變量進(jìn)行分組,畫直方圖。分類區(qū)域散點圖。

第五步:選擇判類的一些前提條件和輸出。第五步:選擇判類的一些前提條件和輸出。18關(guān)于逐步判別的選項。關(guān)于逐步判別的選項。19下面來觀察輸出結(jié)果一、首先做全模型要求:所有本來均進(jìn)入;先驗概率相等;輸出判別函數(shù);做交叉核實;畫分類散點地圖;保存后驗概率,判類結(jié)果和判別函數(shù)得分。下面來觀察輸出結(jié)果一、首先做全模型20標(biāo)準(zhǔn)化的典型變量的函數(shù)標(biāo)準(zhǔn)化的典型變量的函數(shù)21典型判別函數(shù)和原始變量的相關(guān)系數(shù)。典型判別函數(shù)和原始變量的相關(guān)系數(shù)。22典型判別函數(shù)的系數(shù),判別函數(shù)的得分由此計算。典型判別函數(shù)的系數(shù),判別函數(shù)的得分由此計算。23典型變量在兩類的均值。典型變量在兩類的均值。24距離判別法的判別函數(shù)。在正態(tài)假定下,它與貝葉斯判別等價。距離判別法的判別函數(shù)。在正態(tài)假定下,它與貝葉斯25錯判和正判的結(jié)果。標(biāo)志處是回代核實和交叉核實的正判率。錯判和正判的結(jié)果。標(biāo)志處是回代核實和交叉核26誤判和正確判別率從這個表來看,我們的分類能夠100%地把訓(xùn)練數(shù)據(jù)的每一個觀測值分到其本來的類。該表分成兩部分;上面一半(Original)是用從全部數(shù)據(jù)得到的判別函數(shù)來判斷每一個點的結(jié)果(前面三行為判斷結(jié)果的數(shù)目,而后三行為相應(yīng)的百分比)。下面一半(Crossvalidated)是對每一個觀測值,都用缺少該觀測的全部數(shù)據(jù)得到的判別函數(shù)來判斷的結(jié)果。這里的判別結(jié)果是100%判別正確,但一般并不一定。

誤判和正確判別率從這個表來看,我們的分類能夠100%地把訓(xùn)練27二、利用SPSS軟件的逐步判別法的結(jié)果

選擇了兩個變量。二、利用SPSS軟件的逐步判別法的結(jié)果28判別分析要注意什么?訓(xùn)練樣本中必須有所有要判別的類型,分類必須清楚,不能有混雜。

要選擇好可能由于判別的預(yù)測變量。這是最重要的一步。當(dāng)然,在應(yīng)用中,選擇的余地不見得有多大。

要注意數(shù)據(jù)是否有不尋常的點或者模式存在。還要看預(yù)測變量中是否有些不適宜的;這可以用單變量方差分析(ANOVA)和相關(guān)分析來驗證。判別分析是為了正確地分類,但同時也要注意使用盡可能少的預(yù)測變量來達(dá)到這個目的。使用較少的變量意味著節(jié)省資源和易于對結(jié)果進(jìn)行解釋。

判別分析要注意什么?訓(xùn)練樣本中必須有所有要判別的類型,分類必29判別分析要注意什么?在計算中需要看關(guān)于各個類的有關(guān)變量的均值是否顯著不同的檢驗結(jié)果(在SPSS選項中選擇Wilks’Lambda、Rao’sV、TheSquaredMahalanobisDistance或TheSumofUnexplainedVariations等檢驗的計算機(jī)輸出),以確定是否分類結(jié)果是僅僅由于隨機(jī)因素。此外成員的權(quán)數(shù)(SPSS用priorprobability,即“先驗概率”,和貝葉斯統(tǒng)計的先驗概率有區(qū)別)需要考慮;一般來說,加權(quán)要按照各類觀測值的多少,觀測值少的就要按照比例多加權(quán)。對于多個判別函數(shù),要弄清各自的重要性。注意訓(xùn)練樣本的正確和錯誤分類率。研究被誤分類的觀測值,看是否可以找出原因。

判別分析要注意什么?在計算中需要看關(guān)于各個類的有關(guān)變量的均值30SPSS選項打開.sav數(shù)據(jù)。然后點擊Analyze-Classify-Discriminant,把group放入GroupingVariable,再定義范圍,即在DefineRange輸入1-3的范圍。然后在Independents輸入所有想用的變量;但如果要用逐步判別,則不選Enterindependentstogether,而選擇Usestepwisemethod,在方法(Method)中選挑選變量的準(zhǔn)則(檢驗方法;默認(rèn)值為Wilks’Lambda)。SPSS選項打開.sav數(shù)據(jù)。然后點擊Anal31為了輸出Fisher分類函數(shù)的結(jié)果可以在Statistics中的FunctionCoefficient選Fisher和UnStandardized(點則判別函數(shù)系數(shù))

,在Matrices中選擇輸出所需要的相關(guān)陣;為了輸出Fishe

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論