SPSS數(shù)據(jù)的判別分析_第1頁(yè)
SPSS數(shù)據(jù)的判別分析_第2頁(yè)
SPSS數(shù)據(jù)的判別分析_第3頁(yè)
SPSS數(shù)據(jù)的判別分析_第4頁(yè)
SPSS數(shù)據(jù)的判別分析_第5頁(yè)
已閱讀5頁(yè),還剩76頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

判別分析(DiscriminateAnalysis)知識(shí)要點(diǎn):

1、什么是判別分析?2、理解距離判別、Bayes判別以及Fisher判別的基本思想3、結(jié)合SPSS軟件進(jìn)行案例分析4、判別分析的應(yīng)用(※※)2021/10/101醫(yī)學(xué):

例1:在醫(yī)學(xué)診斷中,一個(gè)病人肺部有陰影,醫(yī)生要判斷他患的是肺結(jié)核、肺部良性腫瘤還是肺癌?肺結(jié)核病人、肺部良性腫瘤病人、肺癌病人組成三個(gè)總體,病人來(lái)自其中一個(gè)總體,可通過(guò)病人的指標(biāo)(陰影大小、邊緣是否光滑等)用判別分析判斷他來(lái)自哪個(gè)總體(即判斷他患的什么病?)判別分析的應(yīng)用2021/10/10222經(jīng)濟(jì)學(xué):例2:股票持有者根據(jù)股票近期的變化情況判斷此種股票價(jià)格下一周是上升還是下跌?例3:依據(jù)一個(gè)企業(yè)稅務(wù)報(bào)表的數(shù)據(jù),判斷該企業(yè)是否逃稅;2021/10/10333例4:為了研究中小企業(yè)的破產(chǎn)模型,選定4個(gè)經(jīng)濟(jì)指標(biāo):

X1總負(fù)債率(現(xiàn)金收益/總負(fù)債)

X2收益性指標(biāo)(純收入/總財(cái)產(chǎn))

X3短期支付能力(流動(dòng)資產(chǎn)/流動(dòng)負(fù)債)

X4生產(chǎn)效率性指標(biāo)(流動(dòng)資產(chǎn)/純銷售額)對(duì)17個(gè)破產(chǎn)企業(yè)(1類)和21個(gè)正常運(yùn)行企業(yè)(2類)進(jìn)行了調(diào)查,得如下資料:2021/10/10444總負(fù)債率收益性指標(biāo)短期支付能力生產(chǎn)效率指標(biāo)類別-.45-.411.09.451-.56-.311.51.161.06.021.01.401-.07-.091.45.261-.10-.091.56.671-.14-.07.71.281-.23-.30.22.181.07.021.31.251.01.002.15.701-.28-.231.19.661.15.051.88.271.37.111.99.381-.08-.081.51.421.05.031.68.951.01.001.26.601.12.111.14.171-.28-.271.27.511.51.102.49.542.08.022.01.5322021/10/10555.38.113.27.552.19.052.25.332.32.074.24.632.31.054.45.692.12.052.52.692-.02.022.05.352.22.082.35.402.17.071.80.522.15.052.17.552-.10-1.012.50.582.14-.03.46.262.14.072.61.522-.33-.093.01.472.48.091.24.182.56.114.29.452.20.081.99.302.47.142.92.452.17.042.45.142.58.045.06.132.04.011.50.71待判-.06-.061.37.40待判2021/10/10666.07-.011.37.34待判-.13-.141.42.44待判.15.062.23.56待判.16.052.31.20待判.29.061.84.38待判.54.112.33.48待判2021/10/10777企業(yè)序號(hào)判別類型判別函數(shù)得分判別為1的概率判別的為2概率11-.56509.69479.3052121-.89817.80234.1976631-.59642.70620.2938041-1.02182.83420.1658052.25719.35312.6468862.34253.32005.6799572.27925.34442.65558821.24010.09012.909882021/10/10888如何進(jìn)行判類?

---判別分析的基本思想一、什么是判別分析?判別分析:根據(jù)已知對(duì)象的某些觀測(cè)指標(biāo)和所屬類別來(lái)判斷未知對(duì)象所屬類別的一種統(tǒng)計(jì)學(xué)方法。判別分析的特點(diǎn)(基本思想):(1)根據(jù)已掌握的、歷史上若干樣本的p個(gè)指標(biāo)數(shù)據(jù)及所屬類別的信息,總結(jié)出該事物分類的規(guī)律性,建立判別公式和判別準(zhǔn)則。(2)根據(jù)總結(jié)出來(lái)的判別公式和判別準(zhǔn)則,判別未知類別的樣本點(diǎn)所屬的類別。2021/10/10999二、判別分析的要求和假設(shè)條件變量屬性:被解釋變量是屬性變量(nonmetricvariables)

;解釋變量是度量變量(metricvariables)判別分析最基本的要求:(1)分組類型在兩組以上;(2)已知分類的樣本中,每組案例的規(guī)模必須至少在一個(gè)以上;(3)解釋變量必須是可測(cè)量的,才能計(jì)算其平均值和方差,使其合理地應(yīng)用于統(tǒng)計(jì)函數(shù)。2021/10/10101010假設(shè)條件:(1)每一個(gè)判別變量(解釋變量)不能是其他判別變量的線性組合(避免多重共線性問(wèn)題)。否則,參數(shù)估計(jì)的標(biāo)準(zhǔn)誤將很大,以至于參數(shù)估計(jì)統(tǒng)計(jì)上不顯著。(2)各組變量的協(xié)方差矩陣相等。在此假設(shè)下,可以使用很簡(jiǎn)單的公式計(jì)算判別函數(shù)和進(jìn)行顯著性檢驗(yàn)。(3)各判別變量之間具有多元正態(tài)分布,即每個(gè)變量對(duì)于所有其他變量的固定值有正態(tài)分布。在此條件下,可精確計(jì)算顯著性檢驗(yàn)值和分組歸屬的概率。2021/10/10111111三、判別分析方法2021/10/10121212首先根據(jù)已知分類的數(shù)據(jù),分別計(jì)算各類的重心即各組(類)的均值,判別的準(zhǔn)則是對(duì)任給樣品,計(jì)算它到各類平均數(shù)的距離,哪個(gè)距離最小就將它判歸哪個(gè)類。(一)兩個(gè)總體的距離判別法設(shè)有兩個(gè)p維正態(tài)總體G1、G2,對(duì)給定的樣本Y,可用如下規(guī)則判別:若樣本Y到總體G1的距離小于到總體G2的距離,則認(rèn)為樣本Y屬于總體G1;反之,則認(rèn)為樣本Y屬于總體G2;若樣本Y到總體G1和G2的距離相等,則讓它待判。距離判別2021/10/10131313判別函數(shù),令判別法則:W是關(guān)于y的線性函數(shù),是已知的p維向量,是W的判別系數(shù)1、方差相等:2021/10/101414142、總體協(xié)方差已知,且不相等:判別函數(shù):判別法則:2021/10/10151515

設(shè)有個(gè)K總體,分別有均值向量(i=1,2,…,k)和協(xié)方差陣∑i=∑

,又設(shè)Y是一個(gè)待判樣品。則Y與各總體的距離為(即判別函數(shù)):(二)多總體的距離判別法判別函數(shù):判別法則:注:這與距離判別是等價(jià)的.協(xié)方差陣相等:距離判別缺點(diǎn):沒(méi)有考慮到每個(gè)總體出現(xiàn)的機(jī)會(huì)大小,即先驗(yàn)概率,沒(méi)有考慮到錯(cuò)判的損失判別函數(shù):判別法則:判別函數(shù):注:這與距離判別是等價(jià)的.判別法則:判別函數(shù):注:這與距離判別是等價(jià)的.判別法則:判別函數(shù):2021/10/10161616(三)距離判別法的優(yōu)缺點(diǎn):該方法簡(jiǎn)單實(shí)用,但沒(méi)有考慮到每個(gè)總體出現(xiàn)的機(jī)會(huì)大小,即先驗(yàn)概率,沒(méi)有考慮到錯(cuò)判的損失。貝葉斯判別法正是為了解決這兩個(gè)問(wèn)題提出的判別分析方法。2021/10/10171717通過(guò)計(jì)算被判樣本x屬于k個(gè)總體的條件概率P(n/x),n=1,2…..k.比較k個(gè)概率的大小,將樣本判歸為來(lái)自出現(xiàn)概率最大的總體(或歸屬于錯(cuò)判概率最小的總體)的判別方法??紤]誤判損失,比較各類錯(cuò)判損失大小,選取其中最小的,則判定樣品屬于該總體。貝葉斯(Bayes)判別2021/10/10181818例:下表是某金融機(jī)構(gòu)客戶的個(gè)人資料,這些資料對(duì)一個(gè)金融機(jī)構(gòu)來(lái)說(shuō),對(duì)于客戶信用度的了解至關(guān)重要,因?yàn)槔眠@些資料,可以挖掘出許多的信息,建立客戶的信用度評(píng)價(jià)體系。所選變量為:

x1:月收入

x2:月生活費(fèi)支出

x3:虛擬變量,住房的所有權(quán),自己的為“1”,租用的“0”

x4:目前工作的年限

x5:前一個(gè)工作的年限

x6:目前住所的年限

x7:前一個(gè)住所的年限X8:家庭贍養(yǎng)的人口數(shù)X9:信用程度,“5”的信用度最高,“1”的信用度最低。2021/10/101919192021/10/102020202021/10/10212121用投影的方法將k個(gè)不同總體的p維數(shù)據(jù)投影到某一個(gè)方向,使不同總體之間的p維數(shù)據(jù)投影盡可能分開(kāi),同一總體內(nèi)的各樣本點(diǎn)盡可能的集中。用方差分析的思想則可構(gòu)建一個(gè)較好區(qū)分各個(gè)總體的線性判別法。

Fisher判別2021/10/10222222變量選擇和逐步判別法向后剔除開(kāi)始時(shí),所有變量都在模型中。每一步,在Wilks的統(tǒng)計(jì)量的準(zhǔn)則下對(duì)模型中判別能力貢獻(xiàn)最小的變量剔除。當(dāng)所有余下的變量都達(dá)到留在模型中的標(biāo)準(zhǔn)時(shí),向后剔除過(guò)程停止。向前選入開(kāi)始時(shí)模型中沒(méi)有變量。每一步,Wilks的統(tǒng)計(jì)量最小者,進(jìn)入模型。當(dāng)不再有未被選入的變量小于選入的臨界值時(shí),向前選入過(guò)程停止。2021/10/10232323逐步選擇開(kāi)始時(shí)如同向前選擇一樣,模型中沒(méi)有變量,每一步都被檢查。如果在Wilks的準(zhǔn)則下統(tǒng)計(jì)量對(duì)模型的判別能力貢獻(xiàn)最小的變量達(dá)不到留在模型中的標(biāo)準(zhǔn),它就被剔除。否則,不在模型中對(duì)模型的判別能力貢獻(xiàn)最大的變量被選入模型。當(dāng)模型中的所有變量都達(dá)到留在模型中的標(biāo)準(zhǔn)而沒(méi)有其他變量能達(dá)到進(jìn)入模型的標(biāo)準(zhǔn),逐步選擇過(guò)程停止。逐步判別法采用有進(jìn)有出的算法,即每一步都進(jìn)行檢驗(yàn)。首先,將判別能力最強(qiáng)的變量引進(jìn)判別函數(shù),而對(duì)較早進(jìn)入判別函數(shù)的變量,隨著其他變量的進(jìn)入,其顯著性可能發(fā)生變化,如果其判別能力不強(qiáng)了,則刪除。2021/10/10242424判別分析方法步驟及框圖

2021/10/10252525判別分析的案例分析與SPSS操作步驟執(zhí)行菜單命令,單擊[分析Analyze]、[分類Classify]、[判別Discriminant]2021/10/10262626⑴指定分組變量及其取值范圍。

將分組變量從源變量窗口通過(guò)選擇箭頭選到分組變量窗口“Groupingvariable”。并從“DefineRange”按鈕定義分組變量的取值范圍,給定最小值Minimum和最大值Maximum。⑵指定判別函數(shù)中的自變量。

將自變量從源變量窗口通過(guò)選擇箭頭選到自變量窗口。⑶選擇使用自變量的方法。

對(duì)于選定的自變量可以全部應(yīng)用到判別函數(shù)中去,這是系統(tǒng)默認(rèn)的使用全部自變量法“Enterindependenttogether”。如果要對(duì)變量進(jìn)行篩選檢驗(yàn),將使用選項(xiàng)逐步進(jìn)入法“Usestepwisemethod”。使用該方法后,按鈕“Method”將被激活2021/10/10272727λ=組內(nèi)平方和/總平方和2021/10/102828282021/10/10292929計(jì)算各類別及總體各變量均值、標(biāo)準(zhǔn)差⑷統(tǒng)計(jì)量、矩陣和函數(shù)系數(shù)的計(jì)算按鈕“Statistics”將打開(kāi)統(tǒng)計(jì)計(jì)算窗口。輸出單變量方差分析結(jié)果各類協(xié)方差矩陣相等的檢驗(yàn)選擇判別函數(shù)系數(shù)輸出形式Fisher判別系數(shù)非標(biāo)準(zhǔn)化判別系數(shù)組內(nèi)相關(guān)矩陣合并組內(nèi)協(xié)方差矩陣組間協(xié)方差矩陣總協(xié)方差矩陣指定自變量的相關(guān)矩陣2021/10/103030302021/10/10313131⑸分類方式和判別結(jié)果單擊按鈕“Classify”將設(shè)置分類所依據(jù)的判別先驗(yàn)概率和協(xié)方差矩陣,以及輸出圖形和顯示結(jié)果先驗(yàn)概率的設(shè)定各類取相等先驗(yàn)概率根據(jù)各類樣本個(gè)數(shù)計(jì)算先驗(yàn)概率輸出分析結(jié)果輸出各樣本的分類結(jié)果如判別得分、判別類等交叉檢驗(yàn)結(jié)果將缺失值用均值替代選擇分類使用的協(xié)方差陣組內(nèi)協(xié)方差陣分組協(xié)方差陣作圖生成一張包括各類的散點(diǎn)圖分類顯示各個(gè)類的散點(diǎn)圖分界圖,將坐標(biāo)平面劃分為不同的區(qū)域,每個(gè)區(qū)域?qū)⒋硪粋€(gè)類2021/10/103232322021/10/103333332021/10/10343434⑹在SPSS數(shù)據(jù)文件中生成新變量單擊“SAVE”按鈕,保存預(yù)測(cè)的組別,判別得分和各組成員的事后概率建立一個(gè)標(biāo)明每個(gè)樣本所屬的類別的變量生成一個(gè)判別得分變量樣本屬于某類的概率2021/10/10353535案例解析:人類發(fā)展?fàn)顩r判類1990聯(lián)合國(guó)開(kāi)發(fā)計(jì)劃署公布的《人類發(fā)展報(bào)告》,用出生時(shí)的預(yù)期壽命(x1)、成人識(shí)字率(x2)、調(diào)整后的人均GDP(x3)等三個(gè)變量衡量人類發(fā)展?fàn)顩r,現(xiàn)從高發(fā)展水平國(guó)家和中等發(fā)展水平國(guó)家中各選了5個(gè)樣本,另選中國(guó)、希臘等作為待判樣本。要求:構(gòu)建判別函數(shù)進(jìn)行判別分析。(見(jiàn)數(shù)據(jù)1995人類發(fā)展報(bào)告部分?jǐn)?shù)據(jù).SAV)2021/10/103636362021/10/10373737該案例的SPSS操作步驟:1、Analyze-Classify-Discriminant2、在判別分析窗口將分組變量‘經(jīng)濟(jì)發(fā)展程度(region)’選入“Groupingvariable”框。并從“DefineRange”按鈕定義分組變量的取值范圍,給定最小值Minimum設(shè)定為1和最大值Maximum設(shè)定為2。2021/10/103838382021/10/103939393、將判別依據(jù)變量出生時(shí)的預(yù)期壽命、成人識(shí)字率、調(diào)整后的人均GDP從源變量窗口通過(guò)選擇箭頭選到自變量窗口點(diǎn)擊Statistics按鈕4、在Statistics對(duì)話框選擇方差分析(UnivariateANOVAs)和方差相等檢驗(yàn)(Box’sM)以及判別函數(shù)系數(shù)中的Fisher’s和Unstandardized.點(diǎn)擊Statistics按鈕2021/10/10404040點(diǎn)擊Classify按鈕5、在Classify對(duì)話框在display中選擇‘Summarytable’和‘Leaf-one-outclassification’;在plots中選擇分界圖‘Territorialmap’點(diǎn)擊Classify按鈕2021/10/10414141點(diǎn)擊Save按鈕5、在Save對(duì)話框在中選擇預(yù)測(cè)分組變量‘Predictedgroupmembership’和判別函數(shù)得分變量‘Discriminantscores’以及各組的條件概率變量‘Probabilitiesofgroupmembership’

6、點(diǎn)擊Save對(duì)話框中的‘Continue’;再點(diǎn)擊DiscriminantAnlysis對(duì)話框中‘Ok’2021/10/10424242輸出結(jié)果及分析樣本描述:該例中有效樣本有10個(gè),有效率為71.4%;缺失樣本為4,缺失率為28.8%判別依據(jù)變量在各組及總體中有效樣本量情況2021/10/10434343方差分析表:判別依據(jù)變量在各組中的均值相等檢驗(yàn)。從該表中可看出各組之間的調(diào)整后的人均GDP存在顯著差異,該變量對(duì)分組起著重要作用各組協(xié)方差矩陣的行列式值各組協(xié)方差矩陣相等的檢驗(yàn)。零假設(shè)認(rèn)為各組方差相等,該例中零假設(shè)出現(xiàn)的可能性為0.02,說(shuō)明各組方差不等,嚴(yán)格意義上應(yīng)構(gòu)建非線性判別函數(shù)2021/10/10444444SummaryofCanonicalDiscriminantFunctions(典型判別函數(shù)的相關(guān)描述)構(gòu)建的典型判別函數(shù)的貢獻(xiàn)率:對(duì)原始信息的包含量。從表中可看出,本例構(gòu)建了1個(gè)典型判別函數(shù),其貢獻(xiàn)率為100%。構(gòu)建的典型判別函數(shù)模型顯著性檢驗(yàn)。零假設(shè)為:典型判別函數(shù)模型不顯著;從表中可看出,本例構(gòu)建的典型判別函數(shù)是顯著的(Sig值為0.008)。2021/10/10454545標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)表。從該表可寫(xiě)出標(biāo)準(zhǔn)化的典型判別函數(shù)模型:f1=0.625*標(biāo)準(zhǔn)化的出生時(shí)的預(yù)期壽命-0.025*標(biāo)準(zhǔn)化的成人識(shí)字率*+0.975*標(biāo)準(zhǔn)化的調(diào)整后的人均GDP從該表中各函數(shù)系數(shù)的絕對(duì)值大小進(jìn)行比較,還可看出哪些變量對(duì)構(gòu)建判別函數(shù)起著重要作用:本例中調(diào)整后的人均GDP對(duì)構(gòu)建的判別函數(shù)起著重要作用;出生時(shí)的預(yù)期壽命則次之。該表反映的是判別依據(jù)變量與判別函數(shù)之間的相關(guān)關(guān)系;系數(shù)值越大,說(shuō)明相應(yīng)變量對(duì)判類起著重要作用(與上表功用類似)2021/10/10464646非標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)表。從該表可寫(xiě)出非標(biāo)準(zhǔn)化的典型判別函數(shù)模型:f1=0.159*出生時(shí)的預(yù)期壽命-0.003*成人識(shí)字率*+0.002*調(diào)整后的人均GDP-19.334每組重心代入非標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)后的取值。由該重心的函數(shù)取值可計(jì)算分類的臨界值:本例為臨界值Z=(2.046-2.046)/2=0;將14個(gè)樣本數(shù)據(jù)代入非標(biāo)準(zhǔn)化的典型判別函數(shù)模型,得到各樣本的函數(shù)取值;取值大于0的樣本,判到‘高發(fā)展水平國(guó)家’;反之,判到‘中等發(fā)展水平國(guó)家’。2021/10/10474747以下3個(gè)表為在Statistics對(duì)話框中的判別函數(shù)系數(shù)中選擇Fisher’s出現(xiàn)的結(jié)果。(通常可不選擇該選項(xiàng),不列示以下結(jié)果)以下結(jié)果是依據(jù)Bayes判別法,設(shè)定先驗(yàn)概率(Priorprobabilities),將后驗(yàn)概率判別轉(zhuǎn)化為距離判別,得到分組的線性判別函數(shù)。進(jìn)入分析的樣本數(shù)每組先驗(yàn)概率設(shè)定情況,本例中兩組的先驗(yàn)概率為相等,為0.5。分組的線性判別函數(shù)系數(shù)表。該例中,高發(fā)達(dá)國(guó)家的函數(shù)模型:f=5.742*出生時(shí)的預(yù)期壽命+0.221*成人識(shí)字率*+0.081*調(diào)整后的人均GDP-311.823;中等發(fā)展國(guó)家的函數(shù)模型:f=5.093*出生時(shí)的預(yù)期壽命+0.234*成人識(shí)字率*+0.024*調(diào)整后的人均GDP-232.705;依據(jù)兩模型每個(gè)樣本有兩個(gè)函數(shù)取值,哪個(gè)大判到哪一類。2021/10/10484848分類預(yù)測(cè)效果表依據(jù)函數(shù)的分類預(yù)測(cè)情況交叉檢驗(yàn):分類預(yù)測(cè)效果檢驗(yàn)從該表的Original部分,可看出:高發(fā)展水平國(guó)家原始樣本有5個(gè),正確判類個(gè)數(shù)為5個(gè),正判率為100%;中等發(fā)展國(guó)家原始樣本有5個(gè),正確判類個(gè)數(shù)為5個(gè),正判率為100%;待判樣本有5個(gè),其中2個(gè)判到高發(fā)展國(guó)家,有2個(gè)判到中等發(fā)展國(guó)家??傮w正判率為100%;從該表的Cross-validated(交叉檢驗(yàn))部分,可看出:高發(fā)展水平國(guó)家原始樣本有5個(gè),正確判類個(gè)數(shù)為4個(gè),正判率為80%,誤判率為20%;中等發(fā)展國(guó)家原始樣本有5個(gè),正確判類個(gè)數(shù)為5個(gè),正判率為100%;總體正判率為90%。2021/10/10494949最終的數(shù)據(jù)文件,增加了4個(gè)新變量。這是點(diǎn)擊Save按鈕中選擇預(yù)測(cè)分組變量‘Predictedgroupmembership’和判別函數(shù)得分變量‘Discriminantscores’以及各組的條件概率變量‘Probabilitiesofgroupmembership’等后,系統(tǒng)將這些變量信息保存到數(shù)據(jù)文件的結(jié)果。2021/10/10505050例1:企圖用一套打分體系來(lái)描繪企業(yè)的狀況。該體系對(duì)每個(gè)企業(yè)的一些指標(biāo)(變量)進(jìn)行評(píng)分。這些指標(biāo)包括:企業(yè)規(guī)模(is)、服務(wù)(se)、雇員工資比例(sa)、利潤(rùn)增長(zhǎng)(prr)、市場(chǎng)份額(ms)、市場(chǎng)份額增長(zhǎng)(msr)、流動(dòng)資金比例(cp)、資金周轉(zhuǎn)速度(cs)等等。另外,有一些企業(yè)已經(jīng)被某雜志劃分為上升企業(yè)、穩(wěn)定企業(yè)和下降企業(yè)。我們希望根據(jù)這些企業(yè)的上述變量的打分和它們已知的類別找出一個(gè)分類標(biāo)準(zhǔn),以對(duì)沒(méi)有被該刊物分類的企業(yè)進(jìn)行分類。2021/10/10515151利用SPSS軟件的逐步判別法淘汰了不顯著的流動(dòng)資金比例(cp),還剩下七個(gè)變量is,se,sa,prr,ms,msr,cs,得到兩個(gè)典則判別函數(shù)(CanonicalDiscriminantFunctionCoefficients):這兩個(gè)函數(shù)實(shí)際上是由Fisher判別法得到的向兩個(gè)方向的投影。這兩個(gè)典則判別函數(shù)的系數(shù)是下面的SPSS輸出得到的:2021/10/10525252SPSS分析結(jié)果之一:典型判別函數(shù)系數(shù)矩陣?yán)弥鸩脚袆e法淘汰了不顯著的流動(dòng)資金比例(cp)兩個(gè)典型判別函數(shù):這兩個(gè)函數(shù)實(shí)際上是由Fisher判別法得到的向兩個(gè)方向的投影。2021/10/10535353SPSS分析結(jié)果之一:樣本分組散點(diǎn)圖根據(jù)兩個(gè)典型判別函數(shù)算出的樣本觀測(cè)值繪制處二維平面圖從上圖可以看出,第一個(gè)投影(相應(yīng)于來(lái)自于第一個(gè)典則判別函數(shù)橫坐標(biāo)值)已經(jīng)能夠很好地分辨出三個(gè)企業(yè)類型了。這兩個(gè)典則判別函數(shù)并不是平等的。其實(shí)一個(gè)函數(shù)就已經(jīng)能夠把這三類分清楚了。2021/10/10545454SPSS分析結(jié)果之一:

特征根表(反映構(gòu)建的判別函數(shù)(投影)的重要程度)該表說(shuō)明第一個(gè)函數(shù)的貢獻(xiàn)率已經(jīng)是99%了,而第二個(gè)只有1%。2021/10/10555555SPSS分析結(jié)果之一:分類線性函數(shù)系數(shù)矩陣該表給出了三個(gè)線性分類函數(shù)的系數(shù)。把每個(gè)觀測(cè)點(diǎn)帶入三個(gè)函數(shù),就可以得到分別代表三類的三個(gè)值,哪個(gè)值最大,該點(diǎn)就屬于相應(yīng)的那一類。見(jiàn)下頁(yè)幻燈2021/10/10565656樣本Y到Gi的距離:注:這與距離判別是等價(jià)的.判別法則:判別函數(shù):備注:2021/10/10575757SPSS分析結(jié)果之一:利用構(gòu)建的判別函數(shù)分類情況及交叉檢驗(yàn)結(jié)果該表反映構(gòu)建的判別函數(shù)進(jìn)行預(yù)測(cè)判類的效果狀況。從該表可看出該例對(duì)所有樣本進(jìn)行預(yù)測(cè)的準(zhǔn)確率為100%;進(jìn)行交叉檢驗(yàn)也可看到判別函數(shù)的判類準(zhǔn)確率也為100%。說(shuō)明構(gòu)建的函數(shù)模型進(jìn)行預(yù)測(cè)非常有效。2021/10/10585858例2:鳶尾花數(shù)據(jù)(花瓣,花萼的長(zhǎng)寬)5個(gè)變量:花瓣長(zhǎng)(slen),花瓣寬(swid),花萼長(zhǎng)(plen),花萼寬(pwid),分類號(hào)(1:Setosa,2:Versicolor,3:Virginica)(data14-04)2021/10/10595959鳶尾花數(shù)據(jù)(數(shù)據(jù)分析過(guò)程簡(jiǎn)明表)2021/10/10606060鳶尾花數(shù)據(jù)(原始數(shù)據(jù)的描述)2021/10/10616161鳶尾花數(shù)據(jù)(合并類內(nèi)相關(guān)陣和協(xié)方差陣)2021/10/10626262鳶尾花數(shù)據(jù)(總協(xié)方差陣)2021/10/10636363鳶尾花數(shù)據(jù)(特征值表)Eigenvalue:用于分析的前兩個(gè)典型判別函數(shù)的特征值,是組間平方和與組內(nèi)平方和之比值.最大特征值與組均值最大的向量對(duì)應(yīng),第二大特征值對(duì)應(yīng)著次大的組均值向量

典型相關(guān)系數(shù)(canonicalcorrelation):是組間平方和與總平方和之比的平方根.2021/10/10646464鳶尾花數(shù)據(jù)(Wilks’Lambda統(tǒng)計(jì)量)檢驗(yàn)判別函數(shù)1和2是否顯著.2021/10/10656565鳶尾花數(shù)據(jù)(有關(guān)判別函數(shù)的輸出)標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)(使用時(shí)必須用標(biāo)準(zhǔn)化的自變量)2021/10/10666666典型判別函數(shù)系數(shù)2021/10/10676767類均值(重心)處的典則判別函數(shù)值2021/10/10686868鳶尾花數(shù)據(jù)(用判別函數(shù)對(duì)觀測(cè)量分類結(jié)果)先驗(yàn)概率費(fèi)歇判別函數(shù)系數(shù)把自變量代入三個(gè)式子,哪個(gè)大歸誰(shuí).2021/10/10696969TerritoryMap(區(qū)域圖)CanonicalDiscriminateFunction1VersusCanonicalDiscriminateFunction2三種鳶尾花的典型變量值把一個(gè)典型變量組成的坐標(biāo)平面分成三個(gè)區(qū)域.*為中心坐標(biāo).

TerritorialMapCanonicalDiscriminantFunction2-12.0-8.0-4.0.04.08.012.0

趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌12.01223122312231223122312238.01223122312231223122312234.0122312231223122312231223*.0*122312*231223122312231223-4.0122312231223122312231223-8.0122312231223122312231223-12.012

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論