《診斷腎炎問題》word版_第1頁
《診斷腎炎問題》word版_第2頁
《診斷腎炎問題》word版_第3頁
《診斷腎炎問題》word版_第4頁
《診斷腎炎問題》word版_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、診斷腎炎問題羅隆琪(數(shù)理學(xué)院) 鐘 文(數(shù)理學(xué)院) 黃禮斌(信息科學(xué)與傳媒學(xué)院)診斷問題摘要 本文首先提出距離判別法和判別法判別屬于腎炎病人或非腎炎病人,根據(jù)已確診的病例的化驗結(jié)果分別列出距離判別法和判別法的判別函數(shù)。然后將已確診的病例化驗結(jié)果數(shù)據(jù)回代入判別函數(shù)中,得到距離判別法判別法的回代準確率為回代效果高,判別法的回代準確率為準確率也較高。且通過觀察回代函數(shù)值知在距離判別法中可根據(jù)判別函數(shù)值的正負判別是腎炎病人還是非腎炎病人,判別函數(shù)值為正表示為腎炎病人,為負則為非腎炎病人。在判別法中首先我們計算出它的閥值,代入判別函數(shù)其值小于閥值的為腎炎病人,大于閥值的為非腎炎病人。對于判定表二中的30

2、名就診人員的是腎炎病人還是非腎炎病人的問題,我們將表二中的就診人員的化驗結(jié)果數(shù)據(jù)分別代入距離判別法和判別法的判別函數(shù)中,通過計算得出:運用距離判別法得出的結(jié)果為:腎炎病人:;非腎炎病人:;運用判別法得出的結(jié)果為:腎炎病人:;非腎炎病人:;就問題三確定哪些指標是影響人們患腎炎的主要因素,我們采用主成分分析法進行分析,再利用進行求解??扇〉角皟芍鞒煞?,即:故可判定是影響人們患腎炎的關(guān)鍵或主要因素,求得:而問題四跟據(jù)問題三的結(jié)果和患病與非患病的特點判定號病例是否患病:腎炎病人:;非腎炎病人:;最后,通過對的分析,分別對距離判別法、判別法和主成分分析法進行數(shù)據(jù)處理、比較,得出主成分分析法得出的結(jié)果是最

3、準確的,距離判別法其次。關(guān)鍵字 距離判別法、判別法、主成分分析法一、問題的重述人們到醫(yī)院就診時,通常要化驗一些指標來協(xié)助醫(yī)生的診斷。診斷就診人員是否患腎炎時通常要化驗人體內(nèi)各種元素含量。表1是確診病例的化驗結(jié)果,其中130號病例是已經(jīng)確診為腎炎病人的化驗結(jié)果;3160號病例是已經(jīng)確定為非腎炎病人的結(jié)果。表2是就診人員的化驗結(jié)果。我們的問題是:1.根據(jù)表1中的數(shù)據(jù),提出一種或多種簡便的判別方法,判別屬于腎炎病人或非腎炎病人的方法,并檢驗?zāi)闾岢龇椒ǖ恼_性;2.按照1提出的方法,判斷表2中的30名就診人員的化驗結(jié)果進行判別,判定他(她)們是腎炎病人還是非腎炎病人;3.能否根據(jù)表表1的數(shù)據(jù)特征,確定

4、哪些指標是影響人們患腎炎的關(guān)鍵或主要因素,以便減少化驗的指標;4.根據(jù)3的結(jié)果,重復(fù)2的工作;5.對2和4的結(jié)果作進一步的分析。病例表詳見附錄。二、模型的假設(shè)和符號說明2.1模型的假設(shè)(1)兩總體腎炎病人和非腎炎病人化驗結(jié)果中各元素的期望值,標準差和由數(shù)據(jù)給出的樣本的統(tǒng)計量是一致的;(2)兩總體的各元素服從正態(tài)分布;(3)兩總體腎炎病人和非腎炎病人的數(shù)量之比為一個確定的值;(4)化驗結(jié)果中每個元素的值之間沒有影響。2.2符號的說明表示表中各元素的編號;表示各個總體的樣本均值向量;表示各總體的離差矩陣;表示閥值;表示總體的協(xié)方差矩陣。其它變量符號在文中使用時給出說明。三、問題的分析3.1問題一、

5、二的問題分析:對于判別屬于腎炎病人或非腎炎病人的方法的問題,我們選用距離判別法和判別法進行判別,首先我們考慮運用距離判別法并根據(jù)已給的確診病例的化驗結(jié)果的特征對表二中的就診人員進行判別。根據(jù)確診病例的化驗結(jié)果列出觀測矩陣及樣本容量,計算出樣本的均值向量和各總體的樣本離差矩陣,對化驗結(jié)果中的各種元素建立判別函數(shù),依據(jù)的正負做出歸類結(jié)論,為正表示該就診人員為腎炎患者,若為負表示該就診人員為非腎炎患者。對于原確診的病例回代到中,檢驗回代效果。對于表二中的30名就診人員的化驗結(jié)果中的各檢測元素代入中并計算出它的值,根據(jù)的正負判定就診人員是腎炎患者或非腎炎患者。對于判別法,列出樣本觀測矩陣,同一類別的樣

6、本在特征空間中聚集在一起,計算出樣本的均值向量,寫出判別法的判別函數(shù),根據(jù)已確定的就診人員檢測的各元素的含量求出閥值,將確診病例的各元素的值回代到判別函數(shù)中并算出函數(shù)值與閥值進行比較,比閥值小的為腎炎患者,否則為非腎炎患者。對于待判定的就診人員,將其檢測的各元素的值代入判定函數(shù)中計算出函數(shù)值與閥值比較確定腎炎患者和非腎炎患者的分類問題。3.2問題三和問題四的問題分析原數(shù)據(jù)中有個指標影響著患者,其中有些指標影響少,可對其進行刪減,選出比原始變量個數(shù)少,能主要影響腎炎的幾個指標,即主成分,故這利用主成分分析法來進行計算。用分別表示的系數(shù),現(xiàn)只考慮的影響,我們對其附表一中位腎炎患者和位非腎炎患者進行

7、比較,其圖如下:圖一由圖可看出對是否是腎炎患者幾乎無區(qū)別,對是否是腎炎患者有很大區(qū)別,所以我們有必要對其進行刪減,選出其主成分。選出其主成分后,分別對腎炎患者和非腎炎患者進行數(shù)據(jù)處理,對其進行分析找出其區(qū)別,再對需要判定的人進行數(shù)據(jù)處理,判定其是否是腎炎患者。3.3問題五的問題分析:由問題三的問題分析和圖一可知,對是否是腎炎患者的區(qū)別很大,大致可認為腎炎患者的的含量大約在以下,而非腎炎患者的的含量大約在以上,所以我們對于問題二和問題四的結(jié)果作進一步分析可以認為是對的含量分析,來判定是否患病,進而與問題二和問題四的結(jié)果進行比較來判定它們的大致準確性。四、建模前的準備4.1距離判別法:按樣品到總體

8、的最近“距離”來進行分類。設(shè)是從均值向量,協(xié)方差矩陣為的總體中取出的兩個樣品(若對每個樣品,有種觀測資料,則每個樣品可用中的一個點來表示);1、與兩點間的 (馬氏)距離:2、點與總體的距離為:3、設(shè)兩總體的均值向量分別為,協(xié)方差矩陣分別為都為已知,建立判別函數(shù):若則判別,若則判別4、實際中統(tǒng)計量的估計:實際中是常常不知道的,則可根據(jù)樣本觀測矩陣分別算出它們的無偏估計再進行判別。例如:設(shè)從兩總體中各抽取樣本容量的樣本即則 若兩總體的協(xié)方差陣是相同的,則其中若當未知時,可用代替上式中的再依的正負進行判別。4.2 Fisher(費歇爾)判別法設(shè)有個總體相應(yīng)的均值向量和協(xié)方差矩陣分別為,且為正定矩陣從

9、中抽取容量為的樣本則為在軸上的投影,記這里分別為組內(nèi)平均向量及點平均向量:組內(nèi)差為:其中:,即為樣本離差矩陣。組間差為: ;其中:。令,現(xiàn)在要求使達到最大關(guān)鍵是選擇,但至于的長度無關(guān)緊要,為保證解的唯一性,附加一條件,利用Lagrange乘數(shù)法,令;由于均為對稱矩陣于是;令為解方程組,將第一式兩邊左乘,并用第二式使得,要使得最大,等價于最大,而當可逆時,用右乘兩邊,得:而,這表明的最大特征值,為最大特征向量,這樣判別函數(shù)就可求出Fisher判別法具體步驟:(1)列出樣本觀測陣;(2)求出各個總體的樣本均值向量及總平均向量;(3)計算;(4)計算;(5)計;(6)求的最大特征值及對應(yīng)的特征向量,

10、當時,可算出;(7)寫出判別函數(shù),并求出閥值閥值的求法:將代入得再將按從小到大排列,例如設(shè),則相鄰兩類,的閥值為或;(8)回代樣本,進行判別,對給定的樣品,若相應(yīng)的介于與之間,則判屬于。4.3問題三的準備:主成分分析法的計算步驟:計算相關(guān)系數(shù)矩陣在公式(3)中,為原來變量與的相關(guān)系數(shù),其計算公式為因為是實對稱矩陣(即),所以只需計算其上三角元素或下三角元素即可。計算特征值與特征向量首先解特征方程求出特征值,并使其按大小順序排列,即;然后分別求出特征值的特征向量。計算主成分貢獻率及累計貢獻率主成分貢獻率:,累計貢獻率:一般取累計貢獻率達85%-95%的特征值所對應(yīng)的第一,第二,第個主成分。4)計

11、算主成分載荷由此可以進一步計算主成分得分:以上步驟我們可以用求解:其中表示為協(xié)方差矩陣。五、模型的建立與求解5.1問題一與問題二模型的建立與求解5.1.1距離判別法提取特征,就診人員的化驗結(jié)果的每種元素為一特征特征編號 計算各個總體的樣本均值向量,確診為腎炎患者樣本的均值向量:確診為非腎炎患者的樣本均值向量:計算腎炎患者和非腎炎患者樣本的離差矩陣類似的計算出非腎炎患者樣本的離差矩陣,則判別函數(shù)為:根據(jù)已知確診病例樣品的樣本值代入中值的符號,可知回代效果準確率達到以上,因此回代效果明顯,對于待判對象表二中的30位就診人員,將其化驗元素結(jié)果代入中,得到的值依次為61-703.9341.271-0.

12、5814.6551.8200.593-3.3670.6201.978-4.41371-802.056 3.747 3.221 -2.252 0.500 2.597 -0.617 -1.351 2.287 -3.932 81-90-5.964 -3.650 4.481 -1.499 2.947 -3.667 -0.175 -6.881 -13.616 -1.353 為正表示該就診人員是腎炎患者,為負表示該就診人員是非腎炎患者。因此根據(jù)上表可得病例號為腎炎患者,病例號,為非腎炎患者。5.1.2判別法樣本空間為2,故可取判別函數(shù)為記取判別閥值為對確診病例進行回代回代效果準確率達到,回代效果顯著,且根

13、據(jù)其數(shù)據(jù)特征知判別函數(shù)值大于閥值的為非腎炎患者,小于閥值為腎炎患者。將待確診的就診人員的化驗結(jié)果代入判別函數(shù)中得到為非腎炎病人,其余的為腎炎病人。5.2問題三的模型建立與求解以附表前行列為總體主成分矩陣,根據(jù)模型建立和問題分析,利用求解可得:各樣本主成分的貢獻率分別為前兩個主成分的累計貢獻率達到,故在實際中只取前兩主成分。即: 由此可知,第一主成分與有較大的負相關(guān),第二主成分與有較大的負相關(guān),與有較大的正相關(guān),故可認為是影響人們患腎炎的關(guān)鍵或主要因素,進而可以只考慮的影響關(guān)系。根據(jù)此前的步驟,以前60行特定5列為總體主成分,同理可得:第一主成分的貢獻率達到,符合其標準,所以在實際中只取第一主成

14、分為:5.3問題四的求解設(shè)則附表前30行特定5列(即腎炎患者的的系數(shù))與B相乘,所得結(jié)果大都是3位數(shù),見附表,附表第31行到60行特定5列(即非腎炎患者的的系數(shù))與B相乘,所得結(jié)果大都是4位數(shù),所以用附表后30行特定5列(需要判別的的系數(shù))相乘得到一系列數(shù)據(jù),因此可判定為腎炎患者。5.4問題五的求解我們對號病例中進行分析,為了觀測方便,我們把所有的數(shù)據(jù)作圖,如下圖:圖二由圖二與問題五的分析可判定是腎炎患者,這完全與問題四的結(jié)果一樣,用距離判別法所求結(jié)果腎炎患者是,它與的相似率為,再考慮用判別法所求的結(jié)果,它所求出的腎炎患者是,它與第五問所求的相似率為。又因為在問題三中我們可知是最主要的影響因素

15、,所以我們可以認定用主成分分析法的結(jié)果更準確,距離判別法其次,判別法更差一點。六、結(jié)果分析根據(jù)問題一提出的兩種判別方法對待判定的就診人員的化驗結(jié)果進行判定,根據(jù)距離判別法知為腎炎患者,其余的均為非腎炎患者,而根據(jù)判別法知為非腎炎患者,其余的為腎炎患者。由于兩種判別方法的回代效果都未達到100%因此判定結(jié)果存在偏差。由問題三的結(jié)果可知,如果選取其中相關(guān)系數(shù)絕對值最大者作為作表,則是,它在決定是否患有腎炎有絕對的代表權(quán)。我們從醫(yī)學(xué)上了解,影響患腎炎的因素有,而在我們所求得的結(jié)果中,這三種因素都有,所有我們可以認定,問題三的結(jié)果符合實際情況。由第三問中選出的主成分來判定出來的結(jié)果,與第二問的結(jié)果相比

16、更具有代表性。但由于是根據(jù)其患病和非患病的特點來判定號病例是否患病,而其特定是由人工算得,其中會產(chǎn)生誤差。在問題五中我們只考慮了的影響,太過于單調(diào),會造成一定的偏差。但在問題三中我們求出對腎炎的影響最相關(guān),因此考慮是最簡單也是誤差最小的判定方法。七、模型的優(yōu)缺點分析(1)在運用判別分析中將確定樣本回代,回代效果都較高,在對表二中的病歷號進行判別時具有科學(xué)性;(2)在Fisher判別方法中,將七維空間映射到一維,會因信息量的損失而產(chǎn)生一定的誤差;(3)主成分分析法選取了其中一些主成分進行分析,更簡便也更具有代表性;(4)在問題五中只考慮了的分布,造成了一些誤差。八、參考文獻【1】姜啟源、謝金星、

17、葉?。粩?shù)學(xué)模型(第三版),高等教育出版社,2003年8月【2】韓中庚;數(shù)學(xué)建模競賽(獲獎?wù)撐木x與點評),科學(xué)出版社,2007年5月九、附錄病例號ZnCuFeCaMgKNa116615.824.5700112179513218515.731.570112518442731939.825.9541163128642415914.239.789699.2239726522616.223.860615270.321861719.299.2930718745.5257720113.326.655110149.4141814714.53065910215468091728.857.8655175.798

18、.43181015611.532.56391071035521113215.917.757892.4131413721218211.311.3767111264672131869.2637.195823373347141628.2327.162510862.4465151506.63216271401796391615910.711.761219098.53901711716.17.0498895.51365721818110.14.0414371841015421914620.723.8123212815010922042.310.39.762993.74398882128.212.453.

19、137044.14548522215413.853.36211051607232317912.217.9113915045.22182413.53.3616.813532.651.6182251755.8424.980712355.61262611315.847.362653.61686272750.511.66.360858.958.91392878.614.69.742170.813346429903.278.1762252.37708523017828.832.499211270.21693121319.136.22220249401683217013.929.8128522647.93

20、303316213.219.8152116636.2133342031390.8154416298.93943516713.114.1227821246.31343616412.918.6299319736.394.5371671527205626064.62373815814.437102510144.672.53913322.83116334011808994015613532267471090228810411698308106899.1532894224717.38.65255424177.9373431668.162.81233252134649442096.4386.9215728

21、874219451826.4961.738704321433674623515.623.4180616668.81884717319.117249729565.82874815119.764.220314031828744919165.43553613921376885022324.486360335397.74795122120.11553172368150739522172528.223433731104945316422.235.52212281153549541738.993616242161032575520218.617.737852253167.35618217.324.8307

22、324650.7109572112417383642873.53515824621.593.2211235471.71955916416.138213515264.3240601792135156022647.93306158.25.4229.7323138179513621061.8740.5542177184427631520.812.513321761286466485.51.73.9950362.3238762.6651440.715.154779.771218.56685.71.094.279017045.8257.9671440.39.1141755249.5141.5681704

23、.169.32943260155680.8691760.5727.331813399.4318.8701927.0632.91969343103553711888.2822.6120823113141372721535.8734.8328163264672.5731432.8415.726512373347.57421319.136.2222024962465.87519220.123.81606156401687617110.530.567214547330.57716213.219.8152116636.2133782031390.8154416298.9394.57916420.128.

24、9106216147.3134.58016713.114.1227821236.596.58116412.918.6299319765.5237.8821671527205626044.8728315814.4371025101180899.58413322.831.3163340122828985169830.8106899.1538178624717.38.65255424177.5373.5871853.931.31211190134649.8882096.4386.9215728874219.8891826.4961.73870432143367.59023515.623.418061

25、6668.9188附表1第四問附表:病例號參數(shù)病例號參數(shù)病例號參數(shù)是否腎炎1-697.6231-2232.361-323.89是2-701.4132-1297.162-547.52是3-544.6233-1528.763-1331.6否4-886.2934-1546.264-490.16是5-616.4635-2285.865-549.07是6-322.0636-2995.866-799.13是7-557.8437-206867-470.31是8-653.6838-1029.568-952.63是9-550.8639-1648.669-325.18是10-637.740-680470-1984

26、.7否11-531.5541-1068.871-1173否12-759.7842-2559.972-328.3是13-972.1343-124173-271.21是14-626.3344-217274-2227.2否15-625.8145-3885.375-1612否16-622.0246-1811.476-679.43是17-981.747-2509.377-1528.7否18-1439.548-2045.178-1546.2否19-1219.949-5358.879-1071.6否20-610.9250-3611.880-2286.6否21-348.2651-3179.681-2992.9

27、否22-615.5252-2360.782-2071否23-114653-2218.283-1013.6否24-133.7154-1632.884-1656.5否25-814.2655-3787.185-1060.9否26-615.856-3080.186-2559.9否27-607.6557-3853.687-1213.1否28-416.6158-213588-2172否29-592.3959-2135.389-3885.3否30-996.0660-1570.690-1811.4否問題四程序數(shù)據(jù):b=cov(x)b =2330.5 99.033 376.39 25355 2690.6 -3342

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論