數(shù)學(xué)建模題目及其答案(疾病的診斷)_第1頁
數(shù)學(xué)建模題目及其答案(疾病的診斷)_第2頁
數(shù)學(xué)建模題目及其答案(疾病的診斷)_第3頁
數(shù)學(xué)建模題目及其答案(疾病的診斷)_第4頁
數(shù)學(xué)建模題目及其答案(疾病的診斷)_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)學(xué)建模疾病的診斷

現(xiàn)要你給出疾病診斷的一種方法。

胃癌患者容易被誤診為萎縮性胃炎患者或非胃病者。從胃癌患者中抽

取5人(編號(hào)為1-5),從萎縮性胃炎患者中抽取5人(編號(hào)為670),以

及非胃病者

中抽取5人(編號(hào)為1175),每人化臉4項(xiàng)生化指標(biāo):血清銅藍(lán)蛋白(XQ、

藍(lán)色反應(yīng)(X,/)、尿叫味乙酸(X,,)、中性硫化物(?。?、測得數(shù)據(jù)如表1

所示:

表1.從人體中化驗(yàn)出的生化指標(biāo)

No.12345678910

228245200170100255130150120160

x2134134167150167125100117133100

X30.20.10.120.070.200.070.060.070.10.05

X40.110.40.270.080.140.140.120.060.260.10

1112131415

185170165135100

115125142108117

0.050.060.050.020.07

0.190.040.080.120.02

根據(jù)數(shù)據(jù),試給出鑒別胃病的方法。

論文題目:胃病的診斷

摘要

在臨床醫(yī)學(xué)中,診斷試臉是一種診斷疾病的重要方法。好的診斷試驗(yàn)方法將對(duì)臨床

診斷的正確性和疾病的治療效果起重要影響。因此,對(duì)于不同疾病不斷發(fā)現(xiàn)新的診斷試

驗(yàn)方法是醫(yī)學(xué)進(jìn)步的重要標(biāo)志。傳統(tǒng)的診斷試臉方法有生化檢測、DNA檢測和影像檢測

等方法。而本文則通過利用多元統(tǒng)計(jì)分析中的判別分析及SPSS軟件的輔助較好地解決

了臨床醫(yī)學(xué)中胃病鑒別的問題。在臨床醫(yī)學(xué)上,既提高了臨床診斷的正確性,又對(duì)疾病

的治療效果起了重要效果,同時(shí)也減輕了病人的負(fù)擔(dān)。

判別分析是在分類確定的條件下,根據(jù)某一研究對(duì)象的各種特征值判別其類型

歸屬問題的一種多變量統(tǒng)計(jì)分析方法。

其基本原理是按照一定的判別準(zhǔn)則,建立一個(gè)或多個(gè)判別函數(shù),用研究對(duì)象的

大量資料確定判別函數(shù)中的待定系數(shù),并計(jì)算判別指標(biāo)。

首先,由判別分析定義可知,只有當(dāng)多個(gè)總體的特征具有顯著的差異時(shí),進(jìn)行判別

分析才有意義,且總體間差異越大,才會(huì)使誤判率越小。因此在進(jìn)行判別分析時(shí),有必

要對(duì)總體多元變量的均值進(jìn)行是否不等的顯著性檢驗(yàn)。

其次,利用判別分析出的費(fèi)歇判別和貝葉斯判別進(jìn)行判別函數(shù)的建立。

最后,利用所建立的判別函數(shù)進(jìn)行回判并測得其誤判率,以及對(duì)其修正。

本文利用SPSS軟件實(shí)現(xiàn)「對(duì)總體間給類變量的均值是否不等的顯著性檢驗(yàn)并根據(jù)

樣本建立了相應(yīng)的費(fèi)歇判別函數(shù)和貝葉斯判別函數(shù),最后進(jìn)行了回判并測得了誤判率,

從而獲得了在臨床診斷中模型,給臨床上的診斷試驗(yàn)提供了新方法和新建議。

關(guān)鍵詞:判別分析;判別函數(shù);Fisher判別;Bayes判別

一問題的提出

在傳統(tǒng)的胃病診斷中,胃癌患者容易被誤診為萎縮性胃炎患者或非胃病患者,為了

提高醫(yī)學(xué)上診斷的準(zhǔn)確性,也為了減少因誤診而造成的病人死亡率,必須要找出一種最

準(zhǔn)確最有效的診斷方法。為診斷疾病,必須從人體中提取4項(xiàng)生化指標(biāo)進(jìn)行化驗(yàn),即血

清銅藍(lán)蛋白、藍(lán)色反應(yīng)、尿叫喋乙酸、中性硫化物。但是,從人體中化驗(yàn)出的生化指標(biāo),

必須要確定一個(gè)精準(zhǔn)的指標(biāo)來判斷疾病所屬的類型。設(shè)想,使用判別分析法,利用SPSS

軟件對(duì)各個(gè)變量進(jìn)行系統(tǒng)的分析,使該問題得到有效地解決。

二、問題的分析

由題意可知,目的就是為了建立一種模型,解決醫(yī)學(xué)上的這種誤診問題。在該問題

中,必須確定血清銅籃蛋白、藍(lán)色反應(yīng)、尿呷味乙酸、中性硫化物與胃癌、萎縮性胃炎

的關(guān)系。衡量該四項(xiàng)指標(biāo)的數(shù)學(xué)要點(diǎn)必然是相應(yīng)的標(biāo)準(zhǔn)差、方差、均值等,同時(shí),會(huì)建

立一個(gè)或幾個(gè)函數(shù)分析其間關(guān)系的正相關(guān)或負(fù)相關(guān),即其具有一定的相關(guān)性,然后利用

所給數(shù)據(jù)求解出一定的數(shù)學(xué)模型表達(dá)式,便可求解出胃病的鑒別方法。

三、符號(hào)的說明

X1:血清銅蛋白

X2:藍(lán)色反應(yīng)

X3:尿明味乙酸

X4:中型硫化物

N:被調(diào)查的樣本數(shù)

WiIks的lambda:組內(nèi)平方和與總平方和之比(當(dāng)所有觀測的組均值相等時(shí),Wilks的

lambda值為1;當(dāng)組內(nèi)變異與總變異相比小時(shí),WiIks的lambda值接近于0。因此,WiIks

的lambda值大,表示各個(gè)組的均值基本相等;WiIks的Iambda小表示組間有差異。在

判別分析中,只有組均值不等時(shí),判別分析才有意義)

F:F值,F(xiàn)分布中的統(tǒng)計(jì)檢定值

df:自由度

sig.:統(tǒng)計(jì)顯著性,即出現(xiàn)目前樣本的機(jī)率

P:p值

四、問題的假設(shè)

1.該四項(xiàng)生化指標(biāo)是分別可以測得的。

2.每個(gè)生化指標(biāo)都不是其他三個(gè)指標(biāo)的線性組合,即兩兩之間無相關(guān)性。

3.被抽取的三類人員中彼此沒有任何血緣關(guān)系。

4.除了本題研究的疾病外,被調(diào)查的人員無任何疾病。

(2)按順序單擊分析T分類T判別菜單項(xiàng),如圖7所示,系統(tǒng)彈出判別分析的對(duì)話框,

如圖-2所示

文件(E)焉屬(國視圖(y)^fe(D)就怏(D分析(A)圖形(@實(shí)用程序(LD附加內(nèi)容(。)窗口加)幫助

1:

類型X1x2x3x4變量變量

11228.00134.00.200.11

21245.00134.00.100.40

31200.00167.00.120.27

41170.00150.00.070.08

51100.00167.00.200.14

62255.00125.00.070.14

72130.00100.00.060.12

82150.00117.00.070.06

92120.00133.00.100.26

102160.00100.00.050.10

113185.00115.00.050.19

123170.00125.00.060.04

133165.00142.00.050.08

143135.00108.00.020.12

153100.00117.00.070.02

圖7先選擇菜單進(jìn)入判別分析對(duì)話框

注:X1:血清銅蛋白

X2:藍(lán)色反應(yīng)

X3:尿叫味乙酸

X4:中型硫化物

(3)選擇參與判別分析的變量及其他相關(guān)設(shè)置

1)分組變量框:從左側(cè)選入分類變量“類型”于分組變量框中。

2)定義范圍按鈕:定義分類變量的取值范圍。單擊分類變量按鈕,系統(tǒng)彈出一個(gè)對(duì)話

框,如圖-3所示。最小值輸入1,最大只輸入3.完成設(shè)置后,單擊繼續(xù)按鈕,返回

判別分析主對(duì)話框,見圖-2.

強(qiáng)判別分析

分組變量(Q):

類型SI

x1

定義范圍

x2

x3自變量①:

x4

④一總循入自變量?

使用步法式方?法(U)

S選擇變量(D:

圖-2判別分析的主對(duì)話框

圖-3指定分類變量范圍對(duì)話框

3)自變量列表框:從左側(cè)的變量列表將參與判別分析的變量“X1—X4”于其中,如圖

-4所示。

4)一起輸入變量單按鈕:表示選擇所有變量參與判別分析,如圖-4所示。

圖-4

(4)判別分析的統(tǒng)計(jì)輸出設(shè)置。單擊統(tǒng)計(jì)量按鈕,系統(tǒng)彈出一個(gè)對(duì)話框,如圖-5所示。

x

圜列別分標(biāo)Al

緩計(jì)量(§二

描述性矩陣

方法(的…

回均值M□組內(nèi)招美?

分類?...

叵單變量ANOVA(A)□組內(nèi)加方差(V)

保存(⑥…

□Box'sM(B)□分組方方差(日

函數(shù)系數(shù)□總體加方笈(D

0Fisher(F)

引來標(biāo)準(zhǔn)優(yōu)也)

取消語助

圖-5判別分析的統(tǒng)計(jì)輸出設(shè)置

1)描述性框:描述統(tǒng)計(jì)量選項(xiàng)組,包括3個(gè)復(fù)選框項(xiàng),復(fù)選均值復(fù)選框和單變量復(fù)選

框。如圖-5所示

均值復(fù)選框:各類中個(gè)變量的均值、標(biāo)準(zhǔn)差和各自變量總樣本的均值、標(biāo)準(zhǔn)差;

單變量復(fù)選框:變量均值的單因子差異假設(shè)實(shí)駿。

2)函數(shù)系數(shù)框:判別函數(shù)系數(shù)選項(xiàng)組,復(fù)選Fisher復(fù)選框和未標(biāo)準(zhǔn)化復(fù)選框,如圖

-5所示。

Fisher復(fù)選框:給出貝葉斯判別函數(shù)的系數(shù)。

未標(biāo)準(zhǔn)化復(fù)選框:給出未標(biāo)準(zhǔn)化的Fisher判別函數(shù)的系數(shù)。

(5)指定判別分析的有關(guān)參數(shù)及有關(guān)輸出結(jié)果設(shè)置。單擊分類按鈕,系統(tǒng)彈出一個(gè)對(duì)

話框,如圖-6所示。

強(qiáng)工與分析陽Y吩析分類兇

先駒概率使用次方差矩陣

?所有組相等(A)@在組內(nèi)奧

O報(bào)愜組大小計(jì)現(xiàn)(6O分組⑥

輸出-----------------------

0個(gè)案結(jié)果@H合并組(Q)

倩個(gè)案限制在前(U:叵分組G)

0檎要表&)回區(qū)域圖①

H不考慮該個(gè)案時(shí)?的分?類(0

使用均的苦袂域失值(9

型紋取酒相助

圖-6指定參數(shù)與結(jié)果對(duì)話框

1)先驗(yàn)概率框:先驗(yàn)概率選項(xiàng)組,包括兩個(gè)單選項(xiàng),單選所有組相等框如圖-6所示。

所有組相等框:個(gè)二類先險(xiǎn)概率相等。

2)輸出框:分類結(jié)果選項(xiàng)組,包括三個(gè)復(fù)選項(xiàng),復(fù)選個(gè)案結(jié)果、摘要表和不考慮該個(gè)

案時(shí)的分類復(fù)選框如圖-6所示。

個(gè)案結(jié)果復(fù)選項(xiàng):對(duì)每個(gè)樣品輸出判別函數(shù)值、實(shí)際類、預(yù)測類和后驗(yàn)概率。

摘要表復(fù)選項(xiàng):輸出分類小結(jié),給出正確分類的樣品數(shù)、錯(cuò)分樣品數(shù)和錯(cuò)分率。

不考慮該個(gè)案時(shí)的分類復(fù)選項(xiàng):交叉驗(yàn)證的判別分類結(jié)果。

3)使用協(xié)方差矩陣框:分類使用的協(xié)方差矩陣,單選在組內(nèi)單選項(xiàng)如圖-6所示。

在組內(nèi)單選項(xiàng):使用合并類內(nèi)協(xié)方差矩陣。

4)圖框:復(fù)選合并組、分組和區(qū)域圖復(fù)選框如圖-6所示。

合并組復(fù)選項(xiàng):使出包括各個(gè)類的散點(diǎn)圖。

分組復(fù)選項(xiàng):每類輸出一個(gè)散點(diǎn)圖。

區(qū)域圖復(fù)選項(xiàng):揄出領(lǐng)域圖。

所有設(shè)置完成后,單擊繼續(xù)按鈕返回判別分析主對(duì)話框。

強(qiáng)心別分析Al

皎計(jì)量⑤...

方法(M)..

分類?...

保存(④…

圖-7建立新變量對(duì)話框

(6)單擊保存按鈕,系統(tǒng)彈出一個(gè)對(duì)話框,復(fù)選預(yù)測組成員、判別得分和組成員概率

復(fù)選項(xiàng)如圖-7所示。

1)預(yù)測組成員復(fù)選項(xiàng):根據(jù)判別函數(shù)的值,按后驗(yàn)概率計(jì)算預(yù)測分類結(jié)果。

2)判別得分復(fù)選項(xiàng):建立判別函數(shù)值變量。

3)組成員概率復(fù)選項(xiàng):建立新變量,表明每一個(gè)樣品屬于某一類的概率。

所有設(shè)置完成后,單擊繼續(xù)按鈕返回判別分析主對(duì)話框。

(7)上述設(shè)置完成后,單擊確定按鈕進(jìn)行判別分析,得到輸出結(jié)果。

七、模型的結(jié)果

(1)描述性輸出

分析案例處理摘要

未加權(quán)案例N百分比

有效15100.0

排除的缺失或越界組代碼0.0

至少一個(gè)暴失判別變量0.0

缺失或越界組代碼還有至少一0.0

個(gè)缺失判別變量

合計(jì)0.0

合計(jì)15100.0

圖-8

圖-8表示有效樣本及樣本變量的實(shí)際情況o

組均值的均等性的檢臉

WiIks的LambdaFdf1df2Sig.

X1.888.758212.490

x2.4268.074212.006

x3.4427.564212.007

x4.7861.633212.236

圖-9

由圖-9可知顯著水平X2、X3最大,而X1、X4顯著水平最小。但是由于判別變量間可能相

互關(guān)聯(lián),僅單獨(dú)檢驗(yàn)是不夠的。但是通過將X1和X4分別與X2和X3聯(lián)合后發(fā)現(xiàn),他們對(duì)判

別的提高有很大的貢獻(xiàn)。

組統(tǒng)計(jì)量

有效的N(列表狀態(tài))

類型均值標(biāo)準(zhǔn)差未加權(quán)的已加權(quán)的

1x1188.600057.1384355.300

x2150.400016,5015255.300

x3.1380.0593355.300

x4.2000.1332355.300

2x1163.000053,8052055.300

x2115.000014.8155355.300

x3.0700.0187155.300

x4.1360.0753755.300

3x1151.000033.8008955.300

x2121.400013.0115355.300

x3.0500.0187155.300

x4.0900.0678255.300

合計(jì)x1167.533348.475131515.300

x2128.933321.049151515.300

x3.0860.052211515.300

x4.1420.100941515.300

圖TO

上表(圖-10)表示各組變量的描述統(tǒng)計(jì)情況,給出了各個(gè)類型的均值、標(biāo)準(zhǔn)差等統(tǒng)計(jì)

量。通過這些數(shù)據(jù),可以大致了解3種類型在這4個(gè)指標(biāo)上的差異。

(2)判別函數(shù)的檢驗(yàn)

特征值

函數(shù)特征值方差的%累積氣正則相關(guān)性

12.768193.593.5.857

2.192*6.5100.0.402

a.分析中使用了前2個(gè)典型判別式函數(shù)。

圖T1

WiIks的Lambda

函數(shù)檢

臉Wilks的Lambda卡方dfSig.

1到2.22315.7758.046

2.8391.8473.605

圖72

“特征值”(圖71)表格給出了兩個(gè)典型判別函數(shù)所能解釋的方差變異,其中第一個(gè)

函數(shù)解釋了所有變異的93.5%,第二個(gè)函數(shù)解釋了余下的6.5%。因而第二個(gè)函數(shù)的相對(duì)

重要性遠(yuǎn)遠(yuǎn)小于第一個(gè)函數(shù)。

“WiIks的lambda”(圖72)表格用來檢驗(yàn)各個(gè)判別函數(shù)有無統(tǒng)計(jì)學(xué)上的顯著意義,根

據(jù)該表反應(yīng)的值,這些數(shù)據(jù)表明,第二個(gè)判別函數(shù)對(duì)判別組仍有顯著貢獻(xiàn)(犯錯(cuò)概率為

60.5%)o

(3)典型判別式函數(shù)摘要

標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù)

函教

12

x1.382.011

x2.567861

x3.673.633

x4.296.515

結(jié)構(gòu)矩陣

函致

12

x3.670'.314

圖73

x1.2C8,.178

x2.673696'

x4.296.390,

判別變量和標(biāo)準(zhǔn)化典型判別式函

“標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù)”數(shù)之間的匯聚組間相關(guān)性表格(圖一⑶是兩個(gè)

判別函數(shù)中各個(gè)變量的標(biāo)準(zhǔn)化系按函數(shù)內(nèi)相關(guān)性的絕對(duì)大小排序數(shù),由此可以判斷各

的變量。

個(gè)函數(shù)主要受那些變量的影響;”結(jié)構(gòu)矩陣”(圖74)給

*.每個(gè)變量和任意判別式函數(shù)間

出的是判別變量和標(biāo)準(zhǔn)化判別函數(shù)最大的絕對(duì)相關(guān)性之間的相關(guān)性數(shù)據(jù),

同樣可以用來判斷各個(gè)函數(shù)受那些判別變量的影響最大。對(duì)于判別函數(shù)1,變量X2、X3

的判別意義最大,而對(duì)判別函數(shù)2變量X3、X4的判別意義最大。

(4)未標(biāo)準(zhǔn)化系數(shù)和質(zhì)心函數(shù)

典型判別式函數(shù)系數(shù)組質(zhì)心處的函數(shù)

函教函數(shù)

12類型12

x1.008.00012.095053

x2.0380582873.505

x317.95416.8803-1.221452

x43.0625.327在組均值處評(píng)估的非標(biāo)準(zhǔn)化典型

(常量)-8.2045.228判別式函數(shù)

非標(biāo)準(zhǔn)化系.數(shù)

圖75圖76

非標(biāo)準(zhǔn)化系數(shù)在使用時(shí)可以直接通過原始變量進(jìn)行計(jì)算,如圖75所示。

“組質(zhì)心處的函數(shù)”(圖76)表格給出的是各類別的重心在平面上的坐標(biāo),如類型一的

坐標(biāo)是(2.095,-0.053).只要根據(jù)這里的典型判別函數(shù)(未標(biāo)準(zhǔn)化的),計(jì)算出每個(gè)

觀測的平面坐標(biāo),再計(jì)算它們和各類重心的距離,就可以判斷其類型歸屬。

(5)Fisher判別函數(shù)

分類函數(shù)系數(shù)

類型

.127.104.101

.715.569.611

x368.59924.7232.328

組的光險(xiǎn)概率

x44.742-1.376-7.537

用于分析的案例(常量)-71.993-43.041-45.525

類型先駿未加權(quán)的已加權(quán)的Fisher的線性判別式函數(shù)

1.33355.000

2.33355.000

3.33355.000

合計(jì)1.0001515.000

圖77

圖-18

Fisher判別函數(shù)的輸出如圖T7、圖T8所示。

根據(jù)分類函數(shù)系數(shù)表格可騫出各類型的Fisher判別函數(shù)為:

8(x)=0.127*%+0.715*/+68.599*%+4.742%—71.993

g2(x)=0.104*xl+0,569*x2+24.723*x3-1.376x4-43.041

&(x)=0.101*%+0.611*%+2382*當(dāng)一7.537x4-45.525

將某待診者的四項(xiàng)生化指標(biāo)分別帶入到上述各類型對(duì)應(yīng)的Fisher判別函數(shù),得到三個(gè)對(duì)

應(yīng)的Fisher函數(shù)值,根據(jù)Fisher后驗(yàn)概率最大這一判別規(guī)則,即所得函數(shù)值最大,可以

判斷某待診者所屬的類型。

(6)典型判別的散點(diǎn)圖

典則判別函數(shù)

類型二1

組質(zhì)心

■組質(zhì)心

O1

函數(shù)1

圖79

典則判別函數(shù)

類型=2

組質(zhì)心

■俎舸心

02

圖-20

典則判別函數(shù)

類型二3

組質(zhì)心

■組質(zhì)心

03

函數(shù)1

圖-21

以上三圖給出的是胃癌、萎縮性胃炎、非胃病三種類型的判別函數(shù)值的散點(diǎn)圖。第一個(gè)

圖形表示將類型1,即胃癌的5個(gè)樣本分別代入兩個(gè)典型判別函數(shù),得到5對(duì)判別函數(shù)

值,從而構(gòu)成散點(diǎn)圖,其中,橫坐標(biāo)是第一典型判別函數(shù)值,縱坐標(biāo)是第二典型判別函

數(shù)值。在用SPSS軟件進(jìn)行判別分析時(shí),都可以得到類似的判別函數(shù)值散點(diǎn)圖。以上三

點(diǎn)圖比較直觀地反映了各組觀測的分類情況和各組的重心。

典則判別函數(shù)

類膽

O1

02

3

■組質(zhì)心

函數(shù)1

圖-22

上圖給出了三種類型的典型判別函數(shù)值總的散點(diǎn)圖,同樣是把各類的樣品分別代入兩個(gè)

典型判別函數(shù),計(jì)算得到15對(duì)判別函數(shù)值,從而構(gòu)成這樣的散點(diǎn)圖,其中,橫坐標(biāo)是第

一典型判別函數(shù)值,縱坐標(biāo)是第二典型判別函數(shù)值。從圖中可以看出,三種類型在圖中

有各自的分布領(lǐng)域,說明所建立的判別函數(shù)的判別精度不太好。

(7)每個(gè)個(gè)體的判別結(jié)果

按照案例順序的統(tǒng)計(jì)量

最高組第

案例數(shù)

aP(D>d|G=g)

到質(zhì)心的平方

Mahalanobis距

實(shí)際組預(yù)測組PdfP(G=g|D=d)離組P(G=g

初始111.2732.9942.5972

211.3692.9491.9942

311.5572.9981.1702

413-.1142.5974.3361

511.6582.999.8382

622.4702.4871.5123

722.4752.6751.4873

823”.9072.516.1962

922.4412.5641.6361

1022.5352.6161.2523

1132”.9992.611.0033

1233.9102.664.1882

1333.3172.7782.2972

1433.5082.6191.3542

1533.8972.614.2182

交叉險(xiǎn)證.112-.0004.58338.0671

212”.0054.91314.9501

311.3904.9974.1192

413-.3944.8554.0892

511.0044.99915.5392

62r.1484.8246.7743

722.5214.5353.2253

823”.9754.566.4892

92r.1934.9186.0843

1022.6994.5072.1983

1132”.9694.723.5463

1233.8744.6011.2222

1333.3284.6124.6262

1432”.5894.5262.8193

1532”.6314.5182.5773

對(duì)初始數(shù)據(jù)來說,平方Mahalanobis距離基于典則函數(shù)。

對(duì)交叉險(xiǎn)證數(shù)據(jù)來說,平方Mahalanobis距離基于觀察值。

**.錯(cuò)誤分類的案例

a.僅對(duì)分析中的案例進(jìn)行交叉臉證。在交叉驗(yàn)證中,每個(gè)案例都是按照從該案例以外的所有其他案例派生的函數(shù)來分類的。

圖-23

上表中的案例數(shù)目列,是所有個(gè)體的編號(hào)。實(shí)際組列是每個(gè)個(gè)體實(shí)際上所在的類型。

在最高組(具有最大分辨率)下的預(yù)測組列,是按照計(jì)算結(jié)果的類型??梢钥吹骄幪?hào)4

經(jīng)過判別分析后被判到了第三種類型中,即非胃??;編號(hào)8經(jīng)過判別分析后被判到了第

三種類型中,即非胃??;編號(hào)11經(jīng)過判別分析后被判到了第二種類型中,即萎縮性胃炎。

上表中的最高組(具有最大分辨率)下的P(D>d|G=g)列和df列,是在樣本屬于

該類型而判別不是相應(yīng)類型的條件概率及其自由度。表中P(D=d|G=g)列是判別樣本

屬于相應(yīng)類型,而樣本確實(shí)是相應(yīng)類型的后臉概率。從表中可以看出后驗(yàn)概率還是比較

大的。表中的最高組下的到質(zhì)心的平方Mahalanobis距離列,是相應(yīng)個(gè)體距類別重心

的馬氏距離的平方。

上表中的第二最高組(具有第二大分辨率)下的組列,是把相應(yīng)判為相應(yīng)類型的情

況。表中的第二最高組下的P(D二d|G=g)是判別樣本屬于相應(yīng)類型,而樣本頊實(shí)是相

應(yīng)類型的后驗(yàn)概率。表中第二最高組下的到質(zhì)心的平方Mahalanobis距離列,與表中

最高組下的定義相同。

表中最后一列是兩個(gè)典則判別函數(shù)之值.

分類結(jié)果比。

預(yù)測組成員

類型123合計(jì)

初始計(jì)數(shù)14015

20415

30145

%180.0.020.0100.0

2.080.020.0100.0

3.020.080.0100.0

交叉驗(yàn)證"計(jì)數(shù)12215

22215

30325

%140.040.020.0100.0

240.040.020.0100.0

3.060.040.0100.0

a.僅對(duì)分析中的案例進(jìn)行交叉驗(yàn)證。在交叉臉證中,每個(gè)案例都是按照從該案例

以外的所有其他案例派生的函數(shù)來分類的。

b.已對(duì)初始分組案例中的80.0%個(gè)進(jìn)行了正確分類。

c.已對(duì)交叉臉證分組案例中的40.0%個(gè)進(jìn)行了正確分類。

圖-24

由圖-24可以得出該模型的判別正確率為80%,較低。

八模型的評(píng)價(jià)與改進(jìn)方向

在此模型下,我們是假設(shè)把所有存在的判別變量都選入判別函數(shù),并說明如何通過

計(jì)算標(biāo)淮化判別函數(shù)系藪,辨認(rèn)出不重要的判別變量,但最后的判別正確率不太高,因

此我們必須對(duì)模型進(jìn)行改進(jìn)。

根據(jù)圖71和圖73可計(jì)算各個(gè)指標(biāo)對(duì)整個(gè)判別函數(shù)總體的判別系數(shù)。

對(duì)X1,其判別系數(shù)為:0.935*0.382+0.065*0.011=0.357885;

對(duì)X2,其判別系數(shù)為:0.935*0.567+0.065*(-0.861)=0.47418:

對(duì)X3,其判別系數(shù)為:0.935*0.673+0.065*0.633=0.6704;

對(duì)X4,其列別系數(shù)為:0.935*0.296+0.065*0.515=0.310235o

根據(jù)以上平均判別系數(shù)的數(shù)據(jù),可以發(fā)現(xiàn)X3的平均判別系數(shù)最大,判別意義最大;

X4的平均判別系數(shù)最小,即其判別意義最小。因此,我們?cè)诖诉^程中可以考慮將X4舍去。

通過以上類似過程,我們可以得到每個(gè)個(gè)體的判別結(jié)果如圖-25和圖-26所示,貝]最后的

判別正確率為93.3%。

按照案例順序的統(tǒng)計(jì)量

最高組第

P(D>d|G=g)

到質(zhì)心的平方

案例數(shù)Mahalanobis距

目實(shí)際組預(yù)測組PdfP(G=gID=d)離組P(G=g

初始111.0432.9966.3062

211.6542.815.8482

311.4152.9961.7603

411.1332.4424.0313

511.6562.999.8452

622.4112.4591.7791

722.4742.6261.4933

822.9822.547.0363

922.5642.4541.1443

1022.5492.625

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論