第六講判別分析(SPSS應用)課件_第1頁
第六講判別分析(SPSS應用)課件_第2頁
第六講判別分析(SPSS應用)課件_第3頁
第六講判別分析(SPSS應用)課件_第4頁
第六講判別分析(SPSS應用)課件_第5頁
已閱讀5頁,還剩112頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四章判別分析

(DiscriminateAnalysis)

zf第六講判別分析(SPSS應用)距離判別貝葉斯(Bayes)判別

費歇爾(Fisher)判別逐步判別zf第六講判別分析(SPSS應用)4.1

判別分析的基本思想一、什么是判別分析?判別分析

根據已知對象的某些觀測指標和所屬類別來判斷未知對象所屬類別的一種統(tǒng)計學方法。

如何判斷(判斷依據)?利用已知類別的樣本信息求判別函數,根據判別函數對未知樣本所屬類別進行判別

判別分析的特點(基本思想)1、是根據已掌握的、歷史上若干樣本的p個指標數據及所屬類別的信息,總結出該事物分類的規(guī)律性,建立判別公式和判別準則。

2、根據總結出來的判別公式和判別準則,判別未知類別的樣本點所屬的類別。判別分析的目的:識別一個個體所屬類別zf第六講判別分析(SPSS應用)判別分析的應用:無處不在醫(yī)學:例1:在醫(yī)學診斷中,一個病人肺部有陰影,醫(yī)生要判斷他患的是肺結核、肺部良性腫瘤還是肺癌?肺結核病人、肺部良性腫瘤病人、肺癌病人組成三個總體,病人來自其中一個總體,可通過病人的指標(陰影大小、邊緣是否光滑等)用判別分析判斷他來自哪個總體(即判斷他患的什么?。浚﹝f第六講判別分析(SPSS應用)經濟學:例2:中小企業(yè)的破產模型為了研究中小企業(yè)的破產模型,選定4個經濟指標:

X1總負債率(現金收益/總負債)

X2收益性指標(純收入/總財產)

X3短期支付能力(流動資產/流動負債)

X4生產效率性指標(流動資產/純銷售額)對17個破產企業(yè)(1類)和21個正常運行企業(yè)(2類)進行了調查,得如下資料:zf第六講判別分析(SPSS應用)總負債率收益性指標短期支付能力生產效率指標類別-.45-.411.09.451-.56-.311.51.161.06.021.01.401-.07-.091.45.261-.10-.091.56.671-.14-.07.71.281-.23-.30.22.181.07.021.31.251.01.002.15.701-.28-.231.19.661.15.051.88.271.37.111.99.381-.08-.081.51.421.05.031.68.951.01.001.26.601.12.111.14.171-.28-.271.27.511.51.102.49.542.08.022.01.532zf第六講判別分析(SPSS應用).38.113.27.552.19.052.25.332.32.074.24.632.31.054.45.692.12.052.52.692-.02.022.05.352.22.082.35.402.17.071.80.522.15.052.17.552-.10-1.012.50.582.14-.03.46.262.14.072.61.522-.33-.093.01.472.48.091.24.182.56.114.29.452.20.081.99.302.47.142.92.452.17.042.45.142.58.045.06.132.04.011.50.71待判-.06-.061.37.40待判zf第六講判別分析(SPSS應用).07-.011.37.34待判-.13-.141.42.44待判.15.062.23.56待判.16.052.31.20待判.29.061.84.38待判.54.112.33.48待判zf第六講判別分析(SPSS應用)企業(yè)序號判別類型判別函數得分判別為1的概率判別的為2概率11-.56509.69479.3052121-.89817.80234.1976631-.59642.70620.2938041-1.02182.83420.1658052.25719.35312.6468862.34253.32005.6799572.27925.34442.65558821.24010.09012.90988zf第六講判別分析(SPSS應用)例3:根據信息基礎設施的發(fā)展狀況,對世界20個國家和地區(qū)進行分類??疾熘笜擞?個:1、X1:每千居民擁有固定電話數目2、X2:每千人擁有移動電話數目3、X3:高峰時期每三分鐘國際電話的成本4、X4:每千人擁有電腦的數目5、X5:每千人中電腦使用率6、X6:每千人中開通互聯網的人數zf第六講判別分析(SPSS應用)分析結果:將20個國家分為兩類第1類(基礎設施落后):巴西、墨西哥、波蘭、匈牙利、智利、俄羅斯、泰國、印度、馬來西亞第2類(基礎設施發(fā)達):瑞典、丹麥、美國、中國臺灣、韓國、日本、德國、法國、新加坡、英國、瑞士如果:我們想知道我國基礎設施發(fā)展屬于哪一類型?運用判別分析

依據:20個國家的分類信息構建判別函數zf第六講判別分析(SPSS應用)例4:股票持有者根據股票近期的變化情況判斷此種股票價格下一周是上升還是下跌?刑事學:例5:Smith先生被指控偷了鄰居家的雞。但Smith先生宣稱他家冰箱里的雞是野雞。如何判定:

Smith先生究竟是否偷了鄰居的雞呢??zf第六講判別分析(SPSS應用)二、判別分析的基本要求:

1、分組類型在兩組以上;

2、第一階段每組樣本(或案例)個數至少一個以上;

3、解釋變量必須是可測量的三、判別分析與聚類分析的比較:

1、判別分析是在已知研究對象分成若干類型并已取得各種類型的一批已知樣本的觀測數據,在此基礎上根據某些準則建立判別式,然后對未知類型的樣本進行判別分類。

2、聚類分析則是對研究對象的類型未知的情況下,對其進行分類的方法。zf第六講判別分析(SPSS應用)

3、判別分析和聚類分析往往聯合使用。當總體分類不清楚時,先用聚類分析對一批樣本進行分類,再用判別分析構建判別式對新樣本進行判別。此外判別分析變量情況:被解釋變量為屬性變量;解釋變量是定量變量。zf第六講判別分析(SPSS應用)四、判別分析類型及方法

(1)按判別的組數來分,有兩組判別分析和多組判別分析(2)按區(qū)分不同總體所用的數學模型來分,有線性判別和非線性判別(3)按判別對所處理的變量方法不同有逐步判別、序貫判別。(4)按判別準則來分,有費歇爾判別準則、貝葉斯判別準則zf第六講判別分析(SPSS應用)本章介紹的主要判別分析方法:

距離判別貝葉斯(Bayes)判別

費歇爾(Fisher)判別逐步判別

zf第六講判別分析(SPSS應用)4.2距離判別基本思想:即:首先根據已知分類的數據,分別計算各類的重心即各組(類)的均值,判別的準則是對任給樣品,計算它到各類平均數的距離,哪個距離最小就將它判歸哪個類。(一)兩個總體的距離判別法

1、方差相等

先考慮兩個總體的情況,設有兩個協差陣

相同的p維正態(tài)總體,對給定的樣本Y,判別一個樣本Y到底是來自哪一個總體,一個最直觀的想法是計算Y到兩個總體的距離。故我們用馬氏距離來給定判別規(guī)則,有:zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)則前面的判別法則表示為

當和

已知時,

是一個已知的p維向量,W(y)是y的線性函數,稱為線性判別函數。稱為判別系數。用線性判別函數進行判別分析非常直觀,使用起來最方便,在實際中的應用也最廣泛。zf第六講判別分析(SPSS應用)例6在企業(yè)的考核中,可以根據企業(yè)的生產經營情況把企業(yè)分為優(yōu)秀企業(yè)和一般企業(yè)??己似髽I(yè)經營狀況的指標有:資金利潤率=利潤總額/資金占用總額勞動生產率=總產值/職工平均人數產品凈值率=凈產值/總產值三個指標的均值向量和協方差矩陣如下?,F有二個企業(yè),觀測值分別為(7.8,39.1,9.6)和(8.1,34.2,6.9),問這兩個企業(yè)應該屬于哪一類?zf第六講判別分析(SPSS應用)變量均值向量協方差矩陣優(yōu)秀一般資金利潤率13.55.468.3940.2421.41勞動生產率40.729.840.2454.5811.67產品凈值率10.76.221.4111.677.90zf第六講判別分析(SPSS應用)線性判別函數:zf第六講判別分析(SPSS應用)2、當總體的協方差已知,且不相等zf第六講判別分析(SPSS應用)(二)多總體的距離判別法

1、協方差陣相等

設有個K總體,分別有均值向量(i=1,2,…,k)和協方差陣Σi=Σ,又設Y是一個待判樣品。則Y與各總體的距離為(即判別函數):(與兩個總體類似,書101-102頁)zf第六講判別分析(SPSS應用)則距離判別法的判別函數為:判別規(guī)則為注:這與前面所提出的距離判別是等價的.zf第六講判別分析(SPSS應用)2、協方差陣不等

設有個K總體,分別有均值向量(i=1,2,…,k)和協方差陣不等,又設Y是一個待判樣品。則Y與各總體的距離為(即判別函數):(與兩個總體類似,書102頁)zf第六講判別分析(SPSS應用)距離判別法的優(yōu)缺點:該方法簡單實用,但沒有考慮到每個總體出現的機會大小,即先驗概率,沒有考慮到錯判的損失。貝葉斯判別法正是為了解決這兩個問題提出的判別分析方法。zf第六講判別分析(SPSS應用)4.3貝葉斯(Bayes)判別貝葉斯判別法是通過計算被判樣本x屬于k個總體的條件概率P(n/x),n=1,2…..k.比較k個概率的大小,將樣本判歸為來自出現概率最大的總體(或歸屬于錯判概率最小的總體)的判別方法。一、最大后驗概率準則

設有k個總體且總體的概率密度為,樣本x來自的先驗概率為滿足

.利用貝葉斯理論,x屬于的后驗概率(即當樣本x已知時,它屬于的概率為:最大后驗概率判別準則:zf第六講判別分析(SPSS應用)例7:設有,和三個類,欲判別某樣本屬于哪一類.已知現利用后驗概率準則計算屬于各組的后驗概率:

zf第六講判別分析(SPSS應用)例8:辦公室新來了一個雇員小王,小王是好人還是壞人大家都在猜測。按人們主觀意識,一個人是好人或壞人的概率均為0.5。壞人總是要做壞事,好人總是做好事,偶爾也會做一件壞事,一般好人做好事的概率為0.9,壞人做好事的概率為0.2,一天,小王做了一件好事,小王是好人的概率有多大,你現在把小王判為何種人。

zf第六講判別分析(SPSS應用)Bayes公式:zf第六講判別分析(SPSS應用)特別,總體服從正態(tài)分布的情形則判給。zf第六講判別分析(SPSS應用)上式兩邊取對數并去掉與i無關的項,則等價的判別函數為:

問題轉化為若,則判。zf第六講判別分析(SPSS應用)則判別函數退化為:令

問題轉化為若,則判。當協方差陣相等

zf第六講判別分析(SPSS應用)令問題轉化為若,則判。當先驗概率相等,完全成為距離判別法。判別準則1:后驗概率最大即判斷x來自后驗概率最大的總體zf第六講判別分析(SPSS應用)例9:下表是某金融機構客戶的個人資料,這些資料對一個金融機構來說,對于客戶信用度的了解至關重要,因為利用這些資料,可以挖掘出許多的信息,建立客戶的信用度評價體系。所選變量為:

x1:月收入

x2:月生活費支出

x3:虛擬變量,住房的所有權,自己的為“1”,租用的“0”

x4:目前工作的年限

x5:前一個工作的年限

x6:目前住所的年限

x7:前一個住所的年限X8:家庭贍養(yǎng)的人口數X9:信用程度,“5”的信用度最高,“1”的信用度最低。zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)二、最小平均誤判準則:錯判損失最小概念作判別函數

【定義】(平均錯判損失)用P(j/i)表示將來自總體Gi的樣品錯判到總體Gj的條件概率。C(j/i)表示相應錯判所造成的損失。則平均錯判損失為:使ECM最小的分劃,是Bayes判別分析的解。zf第六講判別分析(SPSS應用)

【定理】若總體G1,G2,,Gk的先驗概率為且相應的密度函數為,樣本來自而誤判為的損失為,則劃分的Bayes解為:

其中zf第六講判別分析(SPSS應用)

最小錯判損失準則的含義是:當抽取了一個未知總體的樣品值x,要判別它屬于那個總體,只要先計算出k個按先驗概率加權的誤判平均損失然后比較其大小,選取其中最小的,則判定樣品屬于該總體。zf第六講判別分析(SPSS應用)例:設先驗概率、誤判損失及概率密度如下:zf第六講判別分析(SPSS應用)試用貝葉斯判別法將樣本x0判到G1、G2、G3中的一個。考慮與不考慮誤判損失的結果如何?1、考慮誤判損失:誤判到G1的平均損失為ECM1=0.55*0.46*0+0.15*1.5*400+0.30*0.70*100=誤判到G2的平均損失為ECM2=0.55*0.46*20+0.15*1.5*0+0.30*0.70*50=誤判到G3的平均損失為ECM3=0.55*0.46*80+0.15*1.5*200+0.30*0.70*0=

其中ECM2最小,故將x0判別到G2。zf第六講判別分析(SPSS應用)2、不考慮誤判損失:將x0判別到G1的條件概率為:

P(G1/x0)=(0.55*0.46)/(0.55*0.46+0.15*1.5+0.30*0.70)=將x0判別到G2的條件概率為:

P(G2/x0)=(0.15*1.5)/(0.55*0.46+0.15*1.5+0.30*0.70)=將x0判別到G3的條件概率為:

P(G3/x0)=(0.30*0.70)/(0.55*0.46+0.15*1.5+0.30*0.70)=

其中P(G1/x0)取值最大,故將x0判別到G1。zf第六講判別分析(SPSS應用)4.4費歇爾(Fisher)判別所謂Fisher判別法,就是用投影的方法將k個不同總體在p維空間上的點盡可能分散,同一總體內的各樣本點盡可能的集中。用方差分析的思想則可構建一個較好區(qū)分各個總體的線性判別法例:考慮只有兩個(預測)變量的判別分析問題。假定這里只有兩類。數據中的每個觀測值是二維空間的一個點。見圖(下一張幻燈片)。這里只有兩種已知類型的訓練樣本。其中一類有38個點(用“o”表示),另一類有44個點(用“*”表示)。按照原來的變量(橫坐標和縱坐標),很難將這兩種點分開。于是就尋找一個方向,也就是圖上的虛線方向,沿著這個方向朝和這個虛線垂直的一條直線進行投影會使得這兩類分得最清楚??梢钥闯觯绻蚱渌较蛲队?,判別效果不會比這個好。這種首先進行投影的判別方法就是Fisher判別法。zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)一、兩個總體的費歇(Fisher)判別法

旋轉坐標軸至總體單位盡可能分開的方向,此時分類變量被簡化為一個

X不能使總體單位盡可能分開的方向u能使總體單位盡可能分開的方向

zf第六講判別分析(SPSS應用)(一)基本思想

設有A、B兩個總體,分別有個歷史樣本數據,每個樣本有P個觀測指標,每個樣本可看作P維空間中的一點。Fisher借助于方差分析的思想構造一個線性判別函數:其中,判別系數的選擇應使得y值滿足:(1)A類和B類的樣本點群盡可能遠離;(2)同一類的樣本點盡可能集中。zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)(二)Fisher兩類判別的計算步驟:1、輸入歷史數據,計算和2、計算3、解方程組,求出,建立判別函數4、對新樣本作判別(1)將新樣本p個觀測值帶入判別函數,求出y值(2)確定臨界值分別將兩類總體樣本的判別函數之均值求加權平均值作為臨界值。zf第六講判別分析(SPSS應用)5、作出判別(1)(2)zf第六講判別分析(SPSS應用)(三)判別效果的檢驗:1、總體差異的顯著性檢驗。2、各判別變量的重要性檢驗。zf第六講判別分析(SPSS應用)二、多個總體的Fisher判別法(一)判別函數

Fisher判別法實際上是致力于尋找一個最能反映組和組之間差異的投影方向,即尋找線性判別函數,設有個總體,分別有均值向量,,…,和協方差陣,分別各總體中得到樣品:zf第六講判別分析(SPSS應用)第i個總體的樣本均值向量

綜合的樣本均值向量

第i個總體樣本組內離差平方和

綜合的組內離差平方和zf第六講判別分析(SPSS應用)組間離差平方和zf第六講判別分析(SPSS應用)如果判別分析是有效的,則所有的樣品的線性組合滿足組內離差平方和小,而組間離差平方和大。則而所對應的特征向量即。Fisher樣品判別函數是zf第六講判別分析(SPSS應用)然而,如果組數k太大,討論的指標太多,則一個判別函數是不夠的,這時需要尋找第二個,甚至第三個線性判別函數其特征向量構成第二個判別函數的系數。類推得到m(m<k)個線性函數。zf第六講判別分析(SPSS應用)關于需要幾個判別函數得問題,需要累計判別效率達到85%以上,即有設為B相對于E得特征根,則zf第六講判別分析(SPSS應用)以m個線性判別函數得到的函數值為新的變量,再進行距離判別。判別規(guī)則:則設yi(X)為第i個線性判別函數,,zf第六講判別分析(SPSS應用)4.5變量選擇和逐步判別法向后剔除開始時,所有變量都在模型中。每一步,在Wilks的統(tǒng)計量的準則下對模型中判別能力貢獻最小的變量剔除。當所有余下的變量都達到留在模型中的標準時,向后剔除過程停止。逐步選擇開始時如同向前選擇一樣,模型中沒有變量,每一步都被檢查。如果在Wilks的準則下統(tǒng)計量對模型的判別能力貢獻最小的變量達不到留在模型中的標準,它就被剔除。否則,不在模型中對模型的判別能力貢獻最大的變量被選入模型。當模型中的所有變量都達到留在模型中的標準而沒有其他變量能達到進入模型的標準,逐步選擇過程停止。zf第六講判別分析(SPSS應用)逐步判別法采用有進有出的算法,即每一步都進行檢驗。首先,將判別能力最強的變量引進判別函數,而對較早進入判別函數的變量,隨著其他變量的進入,其顯著性可能發(fā)生變化,如果其判別能力不強了,則刪除。向前選入開始時模型中沒有變量。每一步,Wilks的統(tǒng)計量最小者,進入模型。當不再有未被選入的變量小于選入的臨界值時,向前選入過程停止。zf第六講判別分析(SPSS應用)例10:企圖用一套打分體系來描繪企業(yè)的狀況。該體系對每個企業(yè)的一些指標(變量)進行評分。這些指標包括:企業(yè)規(guī)模(is)、服務(se)、雇員工資比例(sa)、利潤增長(prr)、市場份額(ms)、市場份額增長(msr)、流動資金比例(cp)、資金周轉速度(cs)等等。另外,有一些企業(yè)已經被某雜志劃分為上升企業(yè)、穩(wěn)定企業(yè)和下降企業(yè)。我們希望根據這些企業(yè)的上述變量的打分和它們已知的類別(三個類別之一:group-1代表上升,group-2代表穩(wěn)定,group-3代表下降)找出一個分類標準,以對沒有被該刊物分類的企業(yè)進行分類。該數據有90個企業(yè)(90個觀測值),其中30個屬于上升型,30個屬于穩(wěn)定型,30個屬于下降型。這個數據就是一個“訓練樣本”。zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)利用SPSS軟件的逐步判別法淘汰了不顯著的流動資金比例(cp),還剩下七個變量is,se,sa,prr,ms,msr,cs,得到兩個典則判別函數(CanonicalDiscriminantFunctionCoefficients):0.035IS+3.283SE+0.037SA-0.007PRR+0.068MS-0.023MSR-0.385CS-3.1660.005IS+0.567SE+0.041SA+0.012PRR+0.048MS+0.044MSR-0.159CS-4.384這兩個函數實際上是由Fisher判別法得到的向兩個方向的投影。這兩個典則判別函數的系數是下面的SPSS輸出得到的:zf第六講判別分析(SPSS應用)根據這兩個函數,從任何一個觀測值(每個觀測值都有7個變量值)都可以算出兩個數。把這兩個數目當成該觀測值的坐標,這樣數據中的150個觀測值就是二維平面上的150個點。它們的點圖在下面圖中。zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)從上圖可以看出,第一個投影(相應于來自于第一個典則判別函數橫坐標值)已經能夠很好地分辨出三個企業(yè)類型了。這兩個典則判別函數并不是平等的。其實一個函數就已經能夠把這三類分清楚了。SPSS的一個輸出就給出了這些判別函數(投影)的重要程度:zf第六講判別分析(SPSS應用)投影的重要性是和特征值的貢獻率有關。該表說明第一個函數的貢獻率已經是99%了,而第二個只有1%。當然,二維圖要容易看一些。投影之后,再根據各點的位置遠近算出具體的判別公式(SPSS輸出):zf第六講判別分析(SPSS應用)該表給出了三個線性分類函數的系數。把每個觀測點帶入三個函數,就可以得到分別代表三類的三個值,哪個值最大,該點就屬于相應的那一類。計算機軟件的選項可以把這些訓練數據的每一個點按照這里的分類法分到某一類。當然,我們一開始就知道這些訓練數據的各個觀測值的歸屬,但即使是這些訓練樣本的觀測值(企業(yè))按照這里推導出的分類函數來分類,也不一定全都能夠正確劃分。zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)判別分析的SPSS操作步驟:執(zhí)行菜單命令,單擊[Analyze]、[Classify]、[Discriminant]zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)⑴指定分組變量及其取值范圍。

將分組變量從源變量窗口通過選擇箭頭選到分組變量窗口“Groupingvariable”。并從“DefineRange”按鈕定義分組變量的取值范圍,給定最小值Minimum和最大值Maximum。⑵指定判別函數中的自變量。

將自變量從源變量窗口通過選擇箭頭選到自變量窗口。⑶選擇使用自變量的方法。

對于選定的自變量可以全部應用到判別函數中去,這是系統(tǒng)默認的使用全部自變量法“Enterindependenttogether”。如果要對變量進行篩選檢驗,將使用選項逐步進入法“Usestepwisemethod”。使用該方法后,按鈕“Method”將被激活zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)計算各類別及總體各變量均值、標準差⑷統(tǒng)計量、矩陣和函數系數的計算按鈕“Statistics”將打開統(tǒng)計計算窗口。輸出單變量方差分析結果各類協方差矩陣相等的檢驗計算判別函數系數Fisher判別系數非標準化判別系數組內相關矩陣合并組內協方差矩陣組間協方差矩陣總協方差矩陣zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)⑸分類方式和判別結果單擊按鈕“Classify”將設置分類所依據的判別先驗概率和協方差矩陣,以及輸出圖形和顯示結果先驗概率的設定各類取相等先驗概率根據各類樣本個數計算先驗概率輸出分析結果輸出各樣本的分類結果如判別得分、判別類等交叉檢驗結果將缺失值用均值替代選擇分類使用的協方差陣組內協方差陣分組協方差陣作圖生成一張包括各類的散點圖分類顯示各個類的散點圖分界圖,將坐標平面劃分為不同的區(qū)域,每個區(qū)域將代表一個類zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)⑹在SPSS數據文件中生成新變量單擊“SAVE”按鈕,保存預測的組別,判別得分和各組成員的事后概率建立一個標明每個樣本所屬的類別的變量生成一個判別得分變量樣本屬于某類的概率zf第六講判別分析(SPSS應用)zf第六講判別分析(SPSS應用)例11:研究某年全國各地區(qū)農民家庭收支的分布規(guī)律,根據抽樣調查資料進行分類,共抽取28個省、市、自治區(qū)的六個指標數據。先采用聚類分析,將28個省、市、自治區(qū)分為三組。北京、上海、廣州3個城市屬于待判樣本。(數據家庭收支.sav)zf第六講判別分析(SPSS應用)例12:為研究某地區(qū)人口死亡狀況,已按某種方法將15個已知樣本單位分為三組,選擇判別變量為2個:55歲組死亡概率q55和80歲組死亡概率q80。建立判別函數,判定另外4個待判樣本屬于何組。數據見死亡率1.savzf第六講判別分析(SPSS應用)例13:為研究某地區(qū)人口死亡狀況,已按某種方法將15個已知樣本點分為三組,選擇判別變量為6個:0歲組死亡概率q0,1歲組死亡概率q1,10歲組死亡概率q10,55歲組死亡概率q55,80歲死亡概率q80,平均預期壽命e0。建立判別函數以便在人壽保險中應用。試用逐步判別法建立判別函數,判定另外4個待判樣本點屬于何組。數據見死亡率2.savzf第六講判別分析(SPSS應用)例14:鳶尾花數據(花瓣,花萼的長寬)5個變量:花瓣長(slen),花瓣寬(swid),花萼長(plen),花萼寬(pwid),分類號(1:Setosa,2:Versicolor,3:Virginica)(data14-04)zf第六講判別分析(SPSS應用)Statistics→Classify→Discriminant:Variables:independent(slen,swid,plen,pwid)Grouping(spno)Definerange(min-1,max-3)Classify:priorprobability(Allgroupequal)

usecovariancematrix(Within-groups)Plots(Combined-groups,Separate-groups,Territorialmap)Display(Summarytable)Statistics:Descriptive(Means)

FunctionCoefficients(Fisher’s,Unstandardized)Matrix(Within-groupscorrelation,Within-groupscovariance,Separate-groupscovariance,Totalcovariance)

Save:(Predictedgroupmembership,DiscriminantScores,Probabilityofgroupmembership)zf第六講判別分析(SPSS應用)鳶尾花數據(數據分析過程簡明表)zf第六講判別分析(SPSS應用)鳶尾花數據(原始數據的描述)zf第六講判別分析(SPSS應用)鳶尾花數據(合并類內相關陣和協方差陣)zf第六講判別分析(SPSS應用)鳶尾花數據(總協方差陣)zf第六講判別分析(SPSS應用)鳶尾花數據(特征值表)Eigenvalue:用于分析的前兩個典則判別函數的特征值,是組間平方和與組內平方和之比值.最大特征值與組均值最大的向量對應,第二大特征值對應著次大的組均值向量

典則相關系數(canonicalcorrelation):是組間平方和與總平方和之比的平方根.被平方的是由組間差異解釋的變異總和的比.zf第六講判別分析(SPSS應用)鳶尾花數據(Wilks’Lambda統(tǒng)計量)檢驗的零假設是各組變量均值相等.Lambda接近0表示組均值不同,接近1表示組均值沒有不同.

Chi-square是lambda的卡方轉換,用于確定其顯著性.zf第六講判別分析(SPSS應用)鳶尾花數據(有關判別函數的輸出)標準化的典型判別函數系數(使用時必須用標準化的自變量)zf第六講判別分析(SPSS應用)典型判別函數系數zf第六講判別分析(SPSS應用)類均值(重心)處的典則判別函數值zf第六講判別分析(SPSS應用)鳶尾花數據(用判別函數對觀測量分類結果)先驗概率費歇判別函數系數把自變量代入三個式子,哪個大歸誰.zf第六講判別分析(SPSS應用)TerritoryMap(區(qū)域圖)CanonicalDiscriminateFunction1VersusCanonicalDiscriminateFunction2三種鳶尾花的典型變量值把一個典型變量組成的坐標平面分成三個區(qū)域.*為中心坐標.

TerritorialMapCanonicalDiscriminantFunction2-12.0-8.0-4.0.04.08.012.0

趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌12.01223122312231223122312238.01223122312231223122312234.0122312231223122312231223*.0*122312*231223122312231223-4.01223122312231223

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論