版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)學(xué)建模疾病的診斷
現(xiàn)要你給出疾病診斷的一種方法。
胃癌患者容易被誤診為萎縮性胃炎患者或非胃病者。從胃癌患者中抽
取5人(編號(hào)為1-5),從萎縮性胃炎患者中抽取5人(編號(hào)為670),以
及非胃病者
中抽取5人(編號(hào)為1175),每人化臉4項(xiàng)生化指標(biāo):血清銅藍(lán)蛋白(XQ、
藍(lán)色反應(yīng)(X,/)、尿叫味乙酸(X,,)、中性硫化物(?。?、測得數(shù)據(jù)如表1
所示:
表1.從人體中化驗(yàn)出的生化指標(biāo)
No.12345678910
228245200170100255130150120160
x2134134167150167125100117133100
X30.20.10.120.070.200.070.060.070.10.05
X40.110.40.270.080.140.140.120.060.260.10
1112131415
185170165135100
115125142108117
0.050.060.050.020.07
0.190.040.080.120.02
根據(jù)數(shù)據(jù),試給出鑒別胃病的方法。
論文題目:胃病的診斷
摘要
在臨床醫(yī)學(xué)中,診斷試臉是一種診斷疾病的重要方法。好的診斷試驗(yàn)方法將對(duì)臨床
診斷的正確性和疾病的治療效果起重要影響。因此,對(duì)于不同疾病不斷發(fā)現(xiàn)新的診斷試
驗(yàn)方法是醫(yī)學(xué)進(jìn)步的重要標(biāo)志。傳統(tǒng)的診斷試臉方法有生化檢測、DNA檢測和影像檢測
等方法。而本文則通過利用多元統(tǒng)計(jì)分析中的判別分析及SPSS軟件的輔助較好地解決
了臨床醫(yī)學(xué)中胃病鑒別的問題。在臨床醫(yī)學(xué)上,既提高了臨床診斷的正確性,又對(duì)疾病
的治療效果起了重要效果,同時(shí)也減輕了病人的負(fù)擔(dān)。
判別分析是在分類確定的條件下,根據(jù)某一研究對(duì)象的各種特征值判別其類型
歸屬問題的一種多變量統(tǒng)計(jì)分析方法。
其基本原理是按照一定的判別準(zhǔn)則,建立一個(gè)或多個(gè)判別函數(shù),用研究對(duì)象的
大量資料確定判別函數(shù)中的待定系數(shù),并計(jì)算判別指標(biāo)。
首先,由判別分析定義可知,只有當(dāng)多個(gè)總體的特征具有顯著的差異時(shí),進(jìn)行判別
分析才有意義,且總體間差異越大,才會(huì)使誤判率越小。因此在進(jìn)行判別分析時(shí),有必
要對(duì)總體多元變量的均值進(jìn)行是否不等的顯著性檢驗(yàn)。
其次,利用判別分析出的費(fèi)歇判別和貝葉斯判別進(jìn)行判別函數(shù)的建立。
最后,利用所建立的判別函數(shù)進(jìn)行回判并測得其誤判率,以及對(duì)其修正。
本文利用SPSS軟件實(shí)現(xiàn)「對(duì)總體間給類變量的均值是否不等的顯著性檢驗(yàn)并根據(jù)
樣本建立了相應(yīng)的費(fèi)歇判別函數(shù)和貝葉斯判別函數(shù),最后進(jìn)行了回判并測得了誤判率,
從而獲得了在臨床診斷中模型,給臨床上的診斷試驗(yàn)提供了新方法和新建議。
關(guān)鍵詞:判別分析;判別函數(shù);Fisher判別;Bayes判別
一問題的提出
在傳統(tǒng)的胃病診斷中,胃癌患者容易被誤診為萎縮性胃炎患者或非胃病患者,為了
提高醫(yī)學(xué)上診斷的準(zhǔn)確性,也為了減少因誤診而造成的病人死亡率,必須要找出一種最
準(zhǔn)確最有效的診斷方法。為診斷疾病,必須從人體中提取4項(xiàng)生化指標(biāo)進(jìn)行化驗(yàn),即血
清銅藍(lán)蛋白、藍(lán)色反應(yīng)、尿叫喋乙酸、中性硫化物。但是,從人體中化驗(yàn)出的生化指標(biāo),
必須要確定一個(gè)精準(zhǔn)的指標(biāo)來判斷疾病所屬的類型。設(shè)想,使用判別分析法,利用SPSS
軟件對(duì)各個(gè)變量進(jìn)行系統(tǒng)的分析,使該問題得到有效地解決。
二、問題的分析
由題意可知,目的就是為了建立一種模型,解決醫(yī)學(xué)上的這種誤診問題。在該問題
中,必須確定血清銅籃蛋白、藍(lán)色反應(yīng)、尿呷味乙酸、中性硫化物與胃癌、萎縮性胃炎
的關(guān)系。衡量該四項(xiàng)指標(biāo)的數(shù)學(xué)要點(diǎn)必然是相應(yīng)的標(biāo)準(zhǔn)差、方差、均值等,同時(shí),會(huì)建
立一個(gè)或幾個(gè)函數(shù)分析其間關(guān)系的正相關(guān)或負(fù)相關(guān),即其具有一定的相關(guān)性,然后利用
所給數(shù)據(jù)求解出一定的數(shù)學(xué)模型表達(dá)式,便可求解出胃病的鑒別方法。
三、符號(hào)的說明
X1:血清銅蛋白
X2:藍(lán)色反應(yīng)
X3:尿明味乙酸
X4:中型硫化物
N:被調(diào)查的樣本數(shù)
WiIks的lambda:組內(nèi)平方和與總平方和之比(當(dāng)所有觀測的組均值相等時(shí),Wilks的
lambda值為1;當(dāng)組內(nèi)變異與總變異相比小時(shí),WiIks的lambda值接近于0。因此,WiIks
的lambda值大,表示各個(gè)組的均值基本相等;WiIks的Iambda小表示組間有差異。在
判別分析中,只有組均值不等時(shí),判別分析才有意義)
F:F值,F(xiàn)分布中的統(tǒng)計(jì)檢定值
df:自由度
sig.:統(tǒng)計(jì)顯著性,即出現(xiàn)目前樣本的機(jī)率
P:p值
四、問題的假設(shè)
1.該四項(xiàng)生化指標(biāo)是分別可以測得的。
2.每個(gè)生化指標(biāo)都不是其他三個(gè)指標(biāo)的線性組合,即兩兩之間無相關(guān)性。
3.被抽取的三類人員中彼此沒有任何血緣關(guān)系。
4.除了本題研究的疾病外,被調(diào)查的人員無任何疾病。
(2)按順序單擊分析T分類T判別菜單項(xiàng),如圖7所示,系統(tǒng)彈出判別分析的對(duì)話框,
如圖-2所示
文件(E)焉屬(國視圖(y)^fe(D)就怏(D分析(A)圖形(@實(shí)用程序(LD附加內(nèi)容(。)窗口加)幫助
1:
類型X1x2x3x4變量變量
11228.00134.00.200.11
21245.00134.00.100.40
31200.00167.00.120.27
41170.00150.00.070.08
51100.00167.00.200.14
62255.00125.00.070.14
72130.00100.00.060.12
82150.00117.00.070.06
92120.00133.00.100.26
102160.00100.00.050.10
113185.00115.00.050.19
123170.00125.00.060.04
133165.00142.00.050.08
143135.00108.00.020.12
153100.00117.00.070.02
圖7先選擇菜單進(jìn)入判別分析對(duì)話框
注:X1:血清銅蛋白
X2:藍(lán)色反應(yīng)
X3:尿叫味乙酸
X4:中型硫化物
(3)選擇參與判別分析的變量及其他相關(guān)設(shè)置
1)分組變量框:從左側(cè)選入分類變量“類型”于分組變量框中。
2)定義范圍按鈕:定義分類變量的取值范圍。單擊分類變量按鈕,系統(tǒng)彈出一個(gè)對(duì)話
框,如圖-3所示。最小值輸入1,最大只輸入3.完成設(shè)置后,單擊繼續(xù)按鈕,返回
判別分析主對(duì)話框,見圖-2.
強(qiáng)判別分析
分組變量(Q):
類型SI
x1
定義范圍
x2
x3自變量①:
x4
④一總循入自變量?
使用步法式方?法(U)
S選擇變量(D:
圖-2判別分析的主對(duì)話框
圖-3指定分類變量范圍對(duì)話框
3)自變量列表框:從左側(cè)的變量列表將參與判別分析的變量“X1—X4”于其中,如圖
-4所示。
4)一起輸入變量單按鈕:表示選擇所有變量參與判別分析,如圖-4所示。
圖-4
(4)判別分析的統(tǒng)計(jì)輸出設(shè)置。單擊統(tǒng)計(jì)量按鈕,系統(tǒng)彈出一個(gè)對(duì)話框,如圖-5所示。
x
圜列別分標(biāo)Al
緩計(jì)量(§二
描述性矩陣
方法(的…
回均值M□組內(nèi)招美?
分類?...
叵單變量ANOVA(A)□組內(nèi)加方差(V)
保存(⑥…
□Box'sM(B)□分組方方差(日
函數(shù)系數(shù)□總體加方笈(D
0Fisher(F)
引來標(biāo)準(zhǔn)優(yōu)也)
取消語助
圖-5判別分析的統(tǒng)計(jì)輸出設(shè)置
1)描述性框:描述統(tǒng)計(jì)量選項(xiàng)組,包括3個(gè)復(fù)選框項(xiàng),復(fù)選均值復(fù)選框和單變量復(fù)選
框。如圖-5所示
均值復(fù)選框:各類中個(gè)變量的均值、標(biāo)準(zhǔn)差和各自變量總樣本的均值、標(biāo)準(zhǔn)差;
單變量復(fù)選框:變量均值的單因子差異假設(shè)實(shí)駿。
2)函數(shù)系數(shù)框:判別函數(shù)系數(shù)選項(xiàng)組,復(fù)選Fisher復(fù)選框和未標(biāo)準(zhǔn)化復(fù)選框,如圖
-5所示。
Fisher復(fù)選框:給出貝葉斯判別函數(shù)的系數(shù)。
未標(biāo)準(zhǔn)化復(fù)選框:給出未標(biāo)準(zhǔn)化的Fisher判別函數(shù)的系數(shù)。
(5)指定判別分析的有關(guān)參數(shù)及有關(guān)輸出結(jié)果設(shè)置。單擊分類按鈕,系統(tǒng)彈出一個(gè)對(duì)
話框,如圖-6所示。
強(qiáng)工與分析陽Y吩析分類兇
先駒概率使用次方差矩陣
?所有組相等(A)@在組內(nèi)奧
O報(bào)愜組大小計(jì)現(xiàn)(6O分組⑥
輸出-----------------------
0個(gè)案結(jié)果@H合并組(Q)
倩個(gè)案限制在前(U:叵分組G)
0檎要表&)回區(qū)域圖①
H不考慮該個(gè)案時(shí)?的分?類(0
使用均的苦袂域失值(9
型紋取酒相助
圖-6指定參數(shù)與結(jié)果對(duì)話框
1)先驗(yàn)概率框:先驗(yàn)概率選項(xiàng)組,包括兩個(gè)單選項(xiàng),單選所有組相等框如圖-6所示。
所有組相等框:個(gè)二類先險(xiǎn)概率相等。
2)輸出框:分類結(jié)果選項(xiàng)組,包括三個(gè)復(fù)選項(xiàng),復(fù)選個(gè)案結(jié)果、摘要表和不考慮該個(gè)
案時(shí)的分類復(fù)選框如圖-6所示。
個(gè)案結(jié)果復(fù)選項(xiàng):對(duì)每個(gè)樣品輸出判別函數(shù)值、實(shí)際類、預(yù)測類和后驗(yàn)概率。
摘要表復(fù)選項(xiàng):輸出分類小結(jié),給出正確分類的樣品數(shù)、錯(cuò)分樣品數(shù)和錯(cuò)分率。
不考慮該個(gè)案時(shí)的分類復(fù)選項(xiàng):交叉驗(yàn)證的判別分類結(jié)果。
3)使用協(xié)方差矩陣框:分類使用的協(xié)方差矩陣,單選在組內(nèi)單選項(xiàng)如圖-6所示。
在組內(nèi)單選項(xiàng):使用合并類內(nèi)協(xié)方差矩陣。
4)圖框:復(fù)選合并組、分組和區(qū)域圖復(fù)選框如圖-6所示。
合并組復(fù)選項(xiàng):使出包括各個(gè)類的散點(diǎn)圖。
分組復(fù)選項(xiàng):每類輸出一個(gè)散點(diǎn)圖。
區(qū)域圖復(fù)選項(xiàng):揄出領(lǐng)域圖。
所有設(shè)置完成后,單擊繼續(xù)按鈕返回判別分析主對(duì)話框。
強(qiáng)心別分析Al
皎計(jì)量⑤...
方法(M)..
分類?...
保存(④…
圖-7建立新變量對(duì)話框
(6)單擊保存按鈕,系統(tǒng)彈出一個(gè)對(duì)話框,復(fù)選預(yù)測組成員、判別得分和組成員概率
復(fù)選項(xiàng)如圖-7所示。
1)預(yù)測組成員復(fù)選項(xiàng):根據(jù)判別函數(shù)的值,按后驗(yàn)概率計(jì)算預(yù)測分類結(jié)果。
2)判別得分復(fù)選項(xiàng):建立判別函數(shù)值變量。
3)組成員概率復(fù)選項(xiàng):建立新變量,表明每一個(gè)樣品屬于某一類的概率。
所有設(shè)置完成后,單擊繼續(xù)按鈕返回判別分析主對(duì)話框。
(7)上述設(shè)置完成后,單擊確定按鈕進(jìn)行判別分析,得到輸出結(jié)果。
七、模型的結(jié)果
(1)描述性輸出
分析案例處理摘要
未加權(quán)案例N百分比
有效15100.0
排除的缺失或越界組代碼0.0
至少一個(gè)暴失判別變量0.0
缺失或越界組代碼還有至少一0.0
個(gè)缺失判別變量
合計(jì)0.0
合計(jì)15100.0
圖-8
圖-8表示有效樣本及樣本變量的實(shí)際情況o
組均值的均等性的檢臉
WiIks的LambdaFdf1df2Sig.
X1.888.758212.490
x2.4268.074212.006
x3.4427.564212.007
x4.7861.633212.236
圖-9
由圖-9可知顯著水平X2、X3最大,而X1、X4顯著水平最小。但是由于判別變量間可能相
互關(guān)聯(lián),僅單獨(dú)檢驗(yàn)是不夠的。但是通過將X1和X4分別與X2和X3聯(lián)合后發(fā)現(xiàn),他們對(duì)判
別的提高有很大的貢獻(xiàn)。
組統(tǒng)計(jì)量
有效的N(列表狀態(tài))
類型均值標(biāo)準(zhǔn)差未加權(quán)的已加權(quán)的
1x1188.600057.1384355.300
x2150.400016,5015255.300
x3.1380.0593355.300
x4.2000.1332355.300
2x1163.000053,8052055.300
x2115.000014.8155355.300
x3.0700.0187155.300
x4.1360.0753755.300
3x1151.000033.8008955.300
x2121.400013.0115355.300
x3.0500.0187155.300
x4.0900.0678255.300
合計(jì)x1167.533348.475131515.300
x2128.933321.049151515.300
x3.0860.052211515.300
x4.1420.100941515.300
圖TO
上表(圖-10)表示各組變量的描述統(tǒng)計(jì)情況,給出了各個(gè)類型的均值、標(biāo)準(zhǔn)差等統(tǒng)計(jì)
量。通過這些數(shù)據(jù),可以大致了解3種類型在這4個(gè)指標(biāo)上的差異。
(2)判別函數(shù)的檢驗(yàn)
特征值
函數(shù)特征值方差的%累積氣正則相關(guān)性
12.768193.593.5.857
2.192*6.5100.0.402
a.分析中使用了前2個(gè)典型判別式函數(shù)。
圖T1
WiIks的Lambda
函數(shù)檢
臉Wilks的Lambda卡方dfSig.
1到2.22315.7758.046
2.8391.8473.605
圖72
“特征值”(圖71)表格給出了兩個(gè)典型判別函數(shù)所能解釋的方差變異,其中第一個(gè)
函數(shù)解釋了所有變異的93.5%,第二個(gè)函數(shù)解釋了余下的6.5%。因而第二個(gè)函數(shù)的相對(duì)
重要性遠(yuǎn)遠(yuǎn)小于第一個(gè)函數(shù)。
“WiIks的lambda”(圖72)表格用來檢驗(yàn)各個(gè)判別函數(shù)有無統(tǒng)計(jì)學(xué)上的顯著意義,根
據(jù)該表反應(yīng)的值,這些數(shù)據(jù)表明,第二個(gè)判別函數(shù)對(duì)判別組仍有顯著貢獻(xiàn)(犯錯(cuò)概率為
60.5%)o
(3)典型判別式函數(shù)摘要
標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù)
函教
12
x1.382.011
x2.567861
x3.673.633
x4.296.515
結(jié)構(gòu)矩陣
函致
12
x3.670'.314
圖73
x1.2C8,.178
x2.673696'
圖
x4.296.390,
判別變量和標(biāo)準(zhǔn)化典型判別式函
“標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù)”數(shù)之間的匯聚組間相關(guān)性表格(圖一⑶是兩個(gè)
判別函數(shù)中各個(gè)變量的標(biāo)準(zhǔn)化系按函數(shù)內(nèi)相關(guān)性的絕對(duì)大小排序數(shù),由此可以判斷各
的變量。
個(gè)函數(shù)主要受那些變量的影響;”結(jié)構(gòu)矩陣”(圖74)給
*.每個(gè)變量和任意判別式函數(shù)間
出的是判別變量和標(biāo)準(zhǔn)化判別函數(shù)最大的絕對(duì)相關(guān)性之間的相關(guān)性數(shù)據(jù),
同樣可以用來判斷各個(gè)函數(shù)受那些判別變量的影響最大。對(duì)于判別函數(shù)1,變量X2、X3
的判別意義最大,而對(duì)判別函數(shù)2變量X3、X4的判別意義最大。
(4)未標(biāo)準(zhǔn)化系數(shù)和質(zhì)心函數(shù)
典型判別式函數(shù)系數(shù)組質(zhì)心處的函數(shù)
函教函數(shù)
12類型12
x1.008.00012.095053
x2.0380582873.505
x317.95416.8803-1.221452
x43.0625.327在組均值處評(píng)估的非標(biāo)準(zhǔn)化典型
(常量)-8.2045.228判別式函數(shù)
非標(biāo)準(zhǔn)化系.數(shù)
圖75圖76
非標(biāo)準(zhǔn)化系數(shù)在使用時(shí)可以直接通過原始變量進(jìn)行計(jì)算,如圖75所示。
“組質(zhì)心處的函數(shù)”(圖76)表格給出的是各類別的重心在平面上的坐標(biāo),如類型一的
坐標(biāo)是(2.095,-0.053).只要根據(jù)這里的典型判別函數(shù)(未標(biāo)準(zhǔn)化的),計(jì)算出每個(gè)
觀測的平面坐標(biāo),再計(jì)算它們和各類重心的距離,就可以判斷其類型歸屬。
(5)Fisher判別函數(shù)
分類函數(shù)系數(shù)
類型
.127.104.101
.715.569.611
x368.59924.7232.328
組的光險(xiǎn)概率
x44.742-1.376-7.537
用于分析的案例(常量)-71.993-43.041-45.525
類型先駿未加權(quán)的已加權(quán)的Fisher的線性判別式函數(shù)
1.33355.000
2.33355.000
3.33355.000
合計(jì)1.0001515.000
圖77
圖-18
Fisher判別函數(shù)的輸出如圖T7、圖T8所示。
根據(jù)分類函數(shù)系數(shù)表格可騫出各類型的Fisher判別函數(shù)為:
8(x)=0.127*%+0.715*/+68.599*%+4.742%—71.993
g2(x)=0.104*xl+0,569*x2+24.723*x3-1.376x4-43.041
&(x)=0.101*%+0.611*%+2382*當(dāng)一7.537x4-45.525
將某待診者的四項(xiàng)生化指標(biāo)分別帶入到上述各類型對(duì)應(yīng)的Fisher判別函數(shù),得到三個(gè)對(duì)
應(yīng)的Fisher函數(shù)值,根據(jù)Fisher后驗(yàn)概率最大這一判別規(guī)則,即所得函數(shù)值最大,可以
判斷某待診者所屬的類型。
(6)典型判別的散點(diǎn)圖
典則判別函數(shù)
類型二1
組質(zhì)心
■組質(zhì)心
O1
函數(shù)1
圖79
典則判別函數(shù)
類型=2
組質(zhì)心
■俎舸心
02
圖-20
典則判別函數(shù)
類型二3
組質(zhì)心
■組質(zhì)心
03
函數(shù)1
圖-21
以上三圖給出的是胃癌、萎縮性胃炎、非胃病三種類型的判別函數(shù)值的散點(diǎn)圖。第一個(gè)
圖形表示將類型1,即胃癌的5個(gè)樣本分別代入兩個(gè)典型判別函數(shù),得到5對(duì)判別函數(shù)
值,從而構(gòu)成散點(diǎn)圖,其中,橫坐標(biāo)是第一典型判別函數(shù)值,縱坐標(biāo)是第二典型判別函
數(shù)值。在用SPSS軟件進(jìn)行判別分析時(shí),都可以得到類似的判別函數(shù)值散點(diǎn)圖。以上三
點(diǎn)圖比較直觀地反映了各組觀測的分類情況和各組的重心。
典則判別函數(shù)
類膽
O1
02
3
■組質(zhì)心
函數(shù)1
圖-22
上圖給出了三種類型的典型判別函數(shù)值總的散點(diǎn)圖,同樣是把各類的樣品分別代入兩個(gè)
典型判別函數(shù),計(jì)算得到15對(duì)判別函數(shù)值,從而構(gòu)成這樣的散點(diǎn)圖,其中,橫坐標(biāo)是第
一典型判別函數(shù)值,縱坐標(biāo)是第二典型判別函數(shù)值。從圖中可以看出,三種類型在圖中
有各自的分布領(lǐng)域,說明所建立的判別函數(shù)的判別精度不太好。
(7)每個(gè)個(gè)體的判別結(jié)果
按照案例順序的統(tǒng)計(jì)量
最高組第
案例數(shù)
aP(D>d|G=g)
到質(zhì)心的平方
Mahalanobis距
實(shí)際組預(yù)測組PdfP(G=g|D=d)離組P(G=g
初始111.2732.9942.5972
211.3692.9491.9942
311.5572.9981.1702
413-.1142.5974.3361
511.6582.999.8382
622.4702.4871.5123
722.4752.6751.4873
823”.9072.516.1962
922.4412.5641.6361
1022.5352.6161.2523
1132”.9992.611.0033
1233.9102.664.1882
1333.3172.7782.2972
1433.5082.6191.3542
1533.8972.614.2182
交叉險(xiǎn)證.112-.0004.58338.0671
212”.0054.91314.9501
311.3904.9974.1192
413-.3944.8554.0892
511.0044.99915.5392
62r.1484.8246.7743
722.5214.5353.2253
823”.9754.566.4892
92r.1934.9186.0843
1022.6994.5072.1983
1132”.9694.723.5463
1233.8744.6011.2222
1333.3284.6124.6262
1432”.5894.5262.8193
1532”.6314.5182.5773
對(duì)初始數(shù)據(jù)來說,平方Mahalanobis距離基于典則函數(shù)。
對(duì)交叉險(xiǎn)證數(shù)據(jù)來說,平方Mahalanobis距離基于觀察值。
**.錯(cuò)誤分類的案例
a.僅對(duì)分析中的案例進(jìn)行交叉臉證。在交叉驗(yàn)證中,每個(gè)案例都是按照從該案例以外的所有其他案例派生的函數(shù)來分類的。
圖-23
上表中的案例數(shù)目列,是所有個(gè)體的編號(hào)。實(shí)際組列是每個(gè)個(gè)體實(shí)際上所在的類型。
在最高組(具有最大分辨率)下的預(yù)測組列,是按照計(jì)算結(jié)果的類型??梢钥吹骄幪?hào)4
經(jīng)過判別分析后被判到了第三種類型中,即非胃??;編號(hào)8經(jīng)過判別分析后被判到了第
三種類型中,即非胃??;編號(hào)11經(jīng)過判別分析后被判到了第二種類型中,即萎縮性胃炎。
上表中的最高組(具有最大分辨率)下的P(D>d|G=g)列和df列,是在樣本屬于
該類型而判別不是相應(yīng)類型的條件概率及其自由度。表中P(D=d|G=g)列是判別樣本
屬于相應(yīng)類型,而樣本確實(shí)是相應(yīng)類型的后臉概率。從表中可以看出后驗(yàn)概率還是比較
大的。表中的最高組下的到質(zhì)心的平方Mahalanobis距離列,是相應(yīng)個(gè)體距類別重心
的馬氏距離的平方。
上表中的第二最高組(具有第二大分辨率)下的組列,是把相應(yīng)判為相應(yīng)類型的情
況。表中的第二最高組下的P(D二d|G=g)是判別樣本屬于相應(yīng)類型,而樣本頊實(shí)是相
應(yīng)類型的后驗(yàn)概率。表中第二最高組下的到質(zhì)心的平方Mahalanobis距離列,與表中
最高組下的定義相同。
表中最后一列是兩個(gè)典則判別函數(shù)之值.
分類結(jié)果比。
預(yù)測組成員
類型123合計(jì)
初始計(jì)數(shù)14015
20415
30145
%180.0.020.0100.0
2.080.020.0100.0
3.020.080.0100.0
交叉驗(yàn)證"計(jì)數(shù)12215
22215
30325
%140.040.020.0100.0
240.040.020.0100.0
3.060.040.0100.0
a.僅對(duì)分析中的案例進(jìn)行交叉驗(yàn)證。在交叉臉證中,每個(gè)案例都是按照從該案例
以外的所有其他案例派生的函數(shù)來分類的。
b.已對(duì)初始分組案例中的80.0%個(gè)進(jìn)行了正確分類。
c.已對(duì)交叉臉證分組案例中的40.0%個(gè)進(jìn)行了正確分類。
圖-24
由圖-24可以得出該模型的判別正確率為80%,較低。
八模型的評(píng)價(jià)與改進(jìn)方向
在此模型下,我們是假設(shè)把所有存在的判別變量都選入判別函數(shù),并說明如何通過
計(jì)算標(biāo)淮化判別函數(shù)系藪,辨認(rèn)出不重要的判別變量,但最后的判別正確率不太高,因
此我們必須對(duì)模型進(jìn)行改進(jìn)。
根據(jù)圖71和圖73可計(jì)算各個(gè)指標(biāo)對(duì)整個(gè)判別函數(shù)總體的判別系數(shù)。
對(duì)X1,其判別系數(shù)為:0.935*0.382+0.065*0.011=0.357885;
對(duì)X2,其判別系數(shù)為:0.935*0.567+0.065*(-0.861)=0.47418:
對(duì)X3,其判別系數(shù)為:0.935*0.673+0.065*0.633=0.6704;
對(duì)X4,其列別系數(shù)為:0.935*0.296+0.065*0.515=0.310235o
根據(jù)以上平均判別系數(shù)的數(shù)據(jù),可以發(fā)現(xiàn)X3的平均判別系數(shù)最大,判別意義最大;
X4的平均判別系數(shù)最小,即其判別意義最小。因此,我們?cè)诖诉^程中可以考慮將X4舍去。
通過以上類似過程,我們可以得到每個(gè)個(gè)體的判別結(jié)果如圖-25和圖-26所示,貝]最后的
判別正確率為93.3%。
按照案例順序的統(tǒng)計(jì)量
最高組第
P(D>d|G=g)
到質(zhì)心的平方
案例數(shù)Mahalanobis距
目實(shí)際組預(yù)測組PdfP(G=gID=d)離組P(G=g
初始111.0432.9966.3062
211.6542.815.8482
311.4152.9961.7603
411.1332.4424.0313
511.6562.999.8452
622.4112.4591.7791
722.4742.6261.4933
822.9822.547.0363
922.5642.4541.1443
1022.5492.625
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 拒絕陪酒合同范本
- 2025年重慶長江軸承股份有限公司招聘13人備考題庫及答案詳解一套
- 2025年汝州職業(yè)技術(shù)學(xué)院單招(計(jì)算機(jī))測試模擬題庫附答案
- 2026年四川長江職業(yè)學(xué)院單招(計(jì)算機(jī))測試備考題庫附答案
- 2026年重慶青年職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試模擬測試卷附答案
- 2025年寧夏石嘴山市單招職業(yè)傾向性考試模擬測試卷附答案
- 2026年烏海職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫附答案
- 2025年中國能源建設(shè)集團(tuán)遼寧電力勘測設(shè)計(jì)院有限公司社會(huì)成熟人才招聘備考題庫及1套參考答案詳解
- 2025年成都軌道交通集團(tuán)有限公司招聘9人備考題庫參考答案詳解
- 2025年保山萬宇投資開發(fā)有限公司招聘備考題庫及參考答案詳解一套
- 2025濟(jì)寧市檢察機(jī)關(guān)招聘聘用制書記員(31人)筆試考試參考試題及答案解析
- 2025年安全總監(jiān)年終總結(jié)報(bào)告
- 安順市人民醫(yī)院招聘聘用專業(yè)技術(shù)人員筆試真題2024
- 廚師專業(yè)職業(yè)生涯規(guī)劃與管理
- 《恒X地產(chǎn)集團(tuán)地區(qū)公司管理辦法》(16年12月發(fā)文版)
- 2025年10月自考00688設(shè)計(jì)概論試題及答案
- 六西格瑪設(shè)計(jì)實(shí)例
- 海南檳榔承包協(xié)議書
- 工業(yè)交換機(jī)產(chǎn)品培訓(xùn)
- 2025浙江溫州市龍港市國有企業(yè)招聘產(chǎn)業(yè)基金人員3人筆試歷年備考題庫附帶答案詳解試卷3套
- 《十五五規(guī)劃》客觀測試題及答案解析(二十屆四中全會(huì))
評(píng)論
0/150
提交評(píng)論