版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
基于隨機森林模型的古代玻璃制品成分分析與鑒別摘要古代玻璃極易受到埋藏環(huán)境的影響而發(fā)生風化,風化過程中內部元素與環(huán)境元素發(fā)生大量交換會導致其成分比例發(fā)生變化。本文建立了對應分析模型、隨機森林模型和斯皮爾曼相關性分析模型,對玻璃文物表面風化與其類型、紋飾和顏色的關系進行了相關性分析,系統(tǒng)研究了文物表面各化合物的統(tǒng)計性質和關聯(lián)關系,借助于預測模型對相應缺失數(shù)據(jù)進行了準確預測。針對問題一,要分析玻璃文物表面風化與其類型、紋飾和顏色的關系,我們建立了對應分析模型,研究了玻璃類型、紋飾和顏色與表面風化的關聯(lián)程度,紋飾為B的情況下更容易導致玻璃表面風化,高鉀類型的玻璃表面風化程度更為嚴重,表面顏色接近藍色其風化程度越大,接近綠色其風化程度越??;對于文物樣品表面有無風化化學成分含量的統(tǒng)計規(guī)律,我們利用SPSS軟件進行了數(shù)據(jù)分析,得到了詳細的統(tǒng)計性質:高鉀玻璃風化后二氧化硅含量高于風化前,氧化鉀風化前含量高于風化后含量,而鉛鋇玻璃風化前二氧化硅含量高于風化后含量,氧化錫含量風化后高于風化前含量;而關于風化點風化前化學成分含量的預測工作,按照比例法我們得到了風化前化學成分含量數(shù)據(jù)。針對問題二,要推測分析高鉀玻璃和鉛鋇玻璃的分類規(guī)律,我們建立了隨機森林模型,按照各化學成分的貢獻情況,建立起了以氧化鉛含量為判斷依據(jù)的玻璃分類規(guī)律:鉛鋇玻璃氧化鉛含量遠大于高鉀玻璃。將氧化鉛含量5.46作為區(qū)分類型的臨界值;對于不同類別的亞類劃分情況,根據(jù)顏色情況對兩類玻璃進行了亞類劃分,建立起隨機森林分類模型,按照不同化學成分的貢獻情況進行劃分,將兩類玻璃各自劃分為兩個亞類。高鉀類將氧化鈣含量8.0,氧化鉀含量12.37,氧化鈉含量0的作為分類值,高鉀亞類1的顏色特征是藍綠色和深藍色,高鉀亞類2的顏色特征是淺藍色和深綠色;鉛鋇類以氧化鋇含量24.89作為分類值,鉛鋇亞類1的顏色特征是紫色,鉛鋇亞類2的顏色特征是紫色外所有顏色。針對問題三,要對附件表單3中未知類別的玻璃進行類型鑒別,我們建立起隨機森林預測模型,將不同樣本的各化合物含量作為自變量,進行樣本所屬類別預測:A1、A6、A7為高鉀玻璃,A2、A3、A4、A5、A8為鉛鋇玻璃。同時改變相應的化學成分含量進行擾動分析,得到分類結果的敏感性分析情況:玻璃類型對氧化鋇含量不夠敏感。針對問題四,要分析不同類別玻璃文物樣品化學成分間的關聯(lián)關系,我們建立起斯皮爾曼相關性分析模型,利用MATLAB軟件繪制出相關性熱力圖,得到樣本數(shù)據(jù)間的相關系數(shù),依據(jù)相關系數(shù)進行相關性分析。得到個別化合物與其他化合物的正負相關性與其含量變化有著緊密的聯(lián)系,如二氧化硅,其他聯(lián)系不夠緊密;對于不同類別間化學成分關系的差異性,則結合相關系數(shù)進行系統(tǒng)分析。關鍵詞:對應分析模型,隨機森林模型,斯皮爾曼相關性分析模型一、問題的提出1.1問題背景玻璃制品外觀雖然都相似,但化學成分卻有差異,根據(jù)化學成分的差異,可將玻璃劃分為不同種類。我國古代玻璃中,將以鉛礦石作為助溶劑從而氧化鉛、氧化鋇含量較高的稱為鉛鋇玻璃,將以含鉀高物質作為助溶劑的稱為高鉀玻璃。古代玻璃會受環(huán)境影響風化,導致化學成分比例發(fā)生改變。而且玻璃的風化并不一定全部風化,存在部分風化和部分嚴重風化現(xiàn)象。1.2問題重述現(xiàn)有一批玻璃制品,經(jīng)檢測已經(jīng)確認只有鉛鋇玻璃和高鉀玻璃兩類。根據(jù)給出數(shù)據(jù),得到該批玻璃的分類信息及主要化學成分比例。并且給出的化學成分比例數(shù)據(jù)為百分制,由于技術原因化學成分之和不一定全為100%,故取累計比例在85%-105%的為有效數(shù)據(jù)。先建立模型解決以下問題:(1)分析玻璃風化情況與玻璃類型、顏色和紋飾的關系;分別分析不同類型玻璃中,有無風化下化學成分含量的統(tǒng)計規(guī)律;根據(jù)風化后化學成分含量數(shù)據(jù)預測風化前化學成分含量。(2)分析高鉀玻璃和鉛鋇玻璃的分類規(guī)律;對該兩類型再進行劃分,給出具體的方案,選取化學成分進行亞類劃分。并分析方案的合理性和敏感性。(3)根據(jù)上題的分析對給出的附件3的玻璃文物進行類別鑒定。并分析分類結果的敏感性。(4)分析不同類別玻璃制品的化學成分關聯(lián)關系。并分析不同類別間化學成分關聯(lián)關系的差異性。二、問題分析2.1問題一的分析問題一要對玻璃的文物表面風化與玻璃類型、紋飾和顏色的關系進行分析,由于附件表單1中的數(shù)據(jù)為分類變量,我們建立起對應分析模型來研究表面分化與玻璃類型、紋飾和顏色的關聯(lián)程度;對于文物樣品表面有無風化化學成分含量的統(tǒng)計規(guī)律分析,我們則需要對風化前后各種化學成分進行相關性分析,同時給出基本的統(tǒng)計數(shù)量,結合統(tǒng)計量繪制相應的圖直觀分析風化前后各化合物含量的變化情況;要求風化監(jiān)測點風化前的化學成分含量,我們根據(jù)求得的均值統(tǒng)計量,按照比例法求得相應風化監(jiān)測點在風化前各化學成分的含量。2.2問題二的分析問題二首先要求利用附件數(shù)據(jù)分析得到玻璃分類的規(guī)律。對于該小問,我們利用附件數(shù)據(jù),建立隨機森林模型,將兩類玻璃數(shù)據(jù)輸入尋找特征重要性最高的化學成分作為分類的特征。為了驗證分類的正確性,使用混淆矩陣驗證。其次題目要求在每個類別中選擇適合的化學成分進行亞類劃分,并分析其靈敏性和合理性。對于該小問,我們考慮到可以作為分類判別的有紋路、顏色和是否風化,但紋路與化學成分的含量關系不大,風化對化學成分的影響已由問題一討論出,并且經(jīng)過查閱文獻得知玻璃的顏色與其構成的化學成分有關,故選取顏色作為分類的判別依據(jù)。我們在前半問建模的基礎上,使用隨機森林模型排序各化學成分特征重要性以找到適合的劃分化學成分。并驗證靈敏性和合理性。2.3問題三的分析問題三中要求我們分析附件表單3中未知類別玻璃文物的化學成分,依據(jù)這些化學成分的含量,來鑒別不同的樣本所屬的類型,該問題可以看作預測問題,依據(jù)已知的化學成分含量來預測樣本類型,根據(jù)問題二中我們建立的隨機森林模型,我們將問題二中數(shù)據(jù)作為訓練集,得到最佳的預測模型,而后只需要將附件表單3中的化學成分含量數(shù)據(jù)作為預測模型的自變量,即可得到樣本所屬類型;對于分類結果的敏感性分析,我們只需要對相應的自變量數(shù)據(jù)做微小改變,然后再次借助于預測模型判斷其對于輸出結果的影響,從而可以進行擾動分析,判斷分類結果的敏感性。2.4問題四的分析問題四要求我們針對不同類別的玻璃文物樣品,建立相關的關聯(lián)度分析方法進一步分析各自化學成分之間的關聯(lián)關系,根據(jù)所求的數(shù)據(jù),借助于相應的差異性分析方法比較高鉀玻璃和鉛鋇玻璃兩者之間化學成分關聯(lián)關系的差異。三、模型的假設與符號說明3.1模型假設假設1:假設玻璃風化前的化學成分含量與未被風化玻璃的相近。假設2:假設相同類型玻璃內玻璃的紋路與化學成分含量無關。假設3:假設附件中缺失的化合物比例數(shù)據(jù)都記為0。假設4:附件中給的文物數(shù)據(jù)具有代表性,可以由表單1、2中的數(shù)據(jù)去推測其他文物的類型。3.2符號說明 符號定義符號說明X原始數(shù)據(jù)矩陣x第i個樣本的第j個分量Z數(shù)據(jù)變換矩陣A協(xié)方差矩陣FR型因子載荷矩陣GL某化合物平均比例α風化前某化合物比例β風化后某化合物比例tem計算中間量P顯著性ra,b相關系數(shù)四、數(shù)據(jù)預處理4.1異常樣本剔除根據(jù)考古工作者對于古代玻璃文物化學成分含量的檢測可知各成分比例的累加和應為100%,但由于檢測手段等原因的影響可能導致各成分比例的累加和非100%的情況出現(xiàn),所以問題中將各成分比例累加和介于85%~105%之間的數(shù)據(jù)都視為有效數(shù)據(jù),我們對附件表單2中的數(shù)據(jù)進行化學成分累加,剔除掉一部風數(shù)據(jù)。4.2缺失數(shù)據(jù)處理附件表單1中有四個樣本的顏色數(shù)據(jù)缺失,為了不影響數(shù)據(jù)的準確性,我們排除文物編號為19、40、48和58的四組數(shù)據(jù)。五、模型的建立與求解5.1問題一模型的建立與求解5.1.1模型的建立對應分析模型問題一中要分析玻璃文物表面風化與玻璃紋飾、類型和顏色的關系,由于玻璃文物的相關屬性為分類變量,因此我們不能用皮爾遜相關系數(shù)來刻畫他們之間的相關性,而對應分析非常適用于有多個類別的分類變量,易于揭示同一個變量各個類別之間的差異以及不同變量各個類別之間的對應關系,因此我們建立起對應分析模型來分析玻璃文物表面風化與玻璃紋飾、類型和顏色之間的關系。下面簡要介紹對應分析的相關理論。對應分析REF_Ref114400940\r\h[2]又稱為R-Q型因子分析,而因子分析法又分為R型因子分析和Q型因子分析。R型因子分析研究變量之間的相關關系,Q型因子分析研究樣本之間的相關關系。對應分析有時也會關心變量和樣本之間的對應關系。如問題一中要求我們分析玻璃文物表面風化與玻璃紋飾、類型和顏色之間的關系,這就是典型的R型因子分析,我們可以通過二維圖來呈現(xiàn)這幾個變量之間的信息,簡單起見,我們只分析表面風化與紋飾、類型和顏色兩兩之間的關系,可以直接進行簡單對應分析。從上述三種關系中,任取一對關系進行分析,其他兩種關系的分析方法雷同。假設這種關系有n個樣本,則原始的數(shù)據(jù)為:X=x11x21??xn1xn2式中xij表示第i個樣本的第j個變量,按行列分別求和得到行和xi、列和xjZij=Txij-xixjT然后計算變量的協(xié)方差矩陣A=ZTZ(SEQ公式\*ARABIC3)對于R型因子分析,我們計算變量協(xié)方差矩陣的特征值,取累積貢獻值大于70%~90%的前k個特征值λ1>λ2>...>F=F1,F2,…,Fk,其中Fk=λ以載荷因子為坐標,將行列變量的多個分類點直觀地對應在維度分布圖上,實現(xiàn)變量類別間差異的量化,根據(jù)維度分布圖上數(shù)據(jù)點的遠近來分析各類別之間的關聯(lián)程度。數(shù)據(jù)預測模型記GLijk表示某玻璃文物的某種化合物的平均比例,令i=1、2,當i=1時,文物為高鉀玻璃,當i=2時,文物為鉛鋇玻璃;令j=1、2,當j=1時,文物無風化,當j=2時,文物風化;記α為某個玻璃文物風化前的化合物比例,β為該文物風化后的某種化合物比例,tempk為計算的中間量,當GLi2k不為0時,即風化文物的化合物ktempk=GLi1kGLi2k×β 當GLi2k為0時,即風化文物的化合物k的平均比例為零時,使用下式來計算tempk=GLi1k (SEQ公式\*ARABIC使用下式來計算選定的風化文物風化之前的化合物k的比例:α=tempk/tempk (SEQ公式5.1.2模型的求解對應分析我們建立的分析模型分別對紋飾與表面風化、類型與表面風化、顏色與表面風化這三種關系進行對應分析,借助于SPSSPROREF_Ref114400874\r\h[1]我們導入原始數(shù)據(jù),得到相應的交叉列聯(lián)表,依據(jù)卡方顯著性(P<0.05),進行顯著性判斷;然后根據(jù)輸出的因子分析表,分析表中字段提取維度的貢獻率,若貢獻率大于80%,則認為該模型表現(xiàn)優(yōu)秀;再結合輸出的維度分析表,得出各類別在各維度上的具體坐標值,由距離遠近分析類別間的關聯(lián)程度。(1)紋飾-表面風化表SEQ表\*ARABIC1紋飾-表面風化卡方交叉列聯(lián)表紋飾總計X2PCAB表面風化無風化13.0(43.333%)11.0(50%)0.0(0.0%)2450.084*風化17.0(56.667%)11.0(50%)6.0(100.0%)34總計3022658***、**、*分別代表1%、5%、10%的顯著性水平表中數(shù)據(jù)顯示顯著性為P=0.084*,根據(jù)卡方顯著性檢驗,呈現(xiàn)5%的顯著性水平,不呈現(xiàn)顯著性,則玻璃紋飾與表面風化之間相關性弱。表SEQ表\*ARABIC2紋飾-表面風化維度分析表字段名項維度1維度2紋飾C0.04-1A0.175-1B-0.84-1表面風化無風化0.384-0.809風化-0.246-0.809從因子維度得分來看,紋飾B數(shù)值絕對值最大,根據(jù)我們建立的對應分析模型,說明紋飾B與文物表面風化情況的關聯(lián)程度大,而紋飾A與紋飾C與文物表面風化情況的關聯(lián)程度小。(2)類型-表面風化表SEQ表\*ARABIC3類型-表面風化卡方價差列聯(lián)表類型總計X2p高鉀鉛鋇表面風化無風化12.0(66.667%)12.0(30.0%)2450.020**風化6.0(33.333%)28.0(70.0%)34總計184058注:***、**、*分別代表1%、5%、10%的顯著性水平表中數(shù)據(jù)顯示顯著性為P=0.020**,根據(jù)卡方顯著性檢驗,呈現(xiàn)5%的顯著性水平,呈現(xiàn)顯著性,由于0.02<0.05,說明玻璃類型與表面風化之間關聯(lián)性較強。表SEQ表\*ARABIC4類型-表面風化維度分析表字段名項維度1維度2類型高鉀鉛鋇0.513-0.231-1-1表面風化無風化風化0.41-0.28911從因子維度得分來看,高鉀和鉛鋇的維度得分絕對值都大于1,高鉀與無風化距離更近,鉛鋇與風化距離更近,再次驗證了類型與表面風化之間有較強關聯(lián)性。(3)顏色-表面風化卡方交叉列聯(lián)表如下:表SEQ表\*ARABIC5顏色-表面風化卡方交叉列聯(lián)表顏色總計X2p藍綠淺藍紫深綠深藍淺綠黑綠表面風化無6.08.02.03.02.02.00.01.02460.507有9.012.02.04.00.01.02.00.030總計152047232154注:***、**、*分別代表1%、5%、10%的顯著性水平表中數(shù)據(jù)顯示顯著性為P=0.507,不呈現(xiàn)顯著性,由于0.507>0.05,說明玻璃顏色與表面風化之間關聯(lián)性弱。表SEQ表\*ARABIC6顏色-表面風化維度分析表字段名項維度1維度2顏色藍綠淺藍紫深綠深藍淺綠黑綠-0.089-0.0890.112-0.0321.1180.447-0.8941.118-1-1-1-1-1-1-1-1表面風化無風化風化0.381-0.305-0.399-0.399從因子為度得分來看,顏色綠色和深藍得分絕對值最大,顏色黑色的得分絕對值較大,這三者都具有較顯著的特征,黑色與表面風化有一定的關聯(lián)程度,但不及深藍色和綠色與表面風化的關聯(lián)程度。同時觀察到藍綠色和淺藍色對應的點距離坐標原點很近,說明其與表面風化情況的關聯(lián)程度小。通過查閱相關資料REF_Ref114401057\r\h[3],我們得知鉛鋇玻璃在風化過程中主要顯色元素Cu向外流失,F(xiàn)e元素在外層積聚,Cu2+、Fe描述統(tǒng)計問題一中要我們結合玻璃類型分析文物樣品表面有無風化情況下的化學成分含量問題,我們對附件表單2中的數(shù)據(jù)進行了一系列的描述統(tǒng)計分析,可以得到各個化學成分的最大值、最小值、均值和標準偏差的數(shù)據(jù),將這些數(shù)據(jù)存放在附錄中。我們將文物表面的化合物含量均值重新列出來,對其進行數(shù)據(jù)分析,方便后續(xù)的數(shù)據(jù)預測。玻璃文物表面化合物含量百分比均值數(shù)據(jù)如下表:表SEQ表\*ARABIC7文物表面化合物含量均值表化合物比例(%)高鉀玻璃文物鉛鋇玻璃文物風化無風化風化無風化二氧化硅(SiO2)93.963367.984224.912754.6596氧化鈉(Na2O)00.6950.21621.6826氧化鉀(K2O)0.54339.33080.13350.2187氧化鈣(CaO)0.875.33252.69541.3204氧化鎂(MgO)0.19671.07920.650.6404氧化鋁(Al2O3)1.936.622.974.4561氧化鐵(Fe2O3)0.2651.93170.58460.7365氧化銅(CuO)1.56172.45252.27581.4317氧化鉛(PbO)00.411743.313822.0848氧化鋇(BaO)00.598311.80739.0017五氧化二磷(P2O5)0.281.40255.27731.0491氧化鍶(SrO)00.04170.41850.2683氧化錫(SnO2)00.19670.06850.0465二氧化硫(SO2)00.10171.36620.1591上述表格定量地表示了玻璃文物表面化合物含量的情況,但不易于直觀反映各種化合物含量在風化前后的變化情況,也難以直接求出他們的對于關系,因此,我們借助于柱形圖直觀地反映出數(shù)據(jù)變化情況。圖SEQ圖\*ARABIC4文物表面化合物含量均值百分比柱形圖下面我們對于兩類玻璃文物分別進行分析,查看他們各自化合物含量在風化前后的均值百分比,進行相應的數(shù)據(jù)分析:根據(jù)高鉀玻璃表面化合物含量百分比圖中柱形圖數(shù)據(jù)分析,高鉀玻璃文物表面在風化前氧化鈉、氧化鉀、氧化鈣、氧化鎂、氧化鋁、氧化鐵、氧化銅、氧化鉛、氧化鋇、五氧化二磷、氧化鍶、氧化錫以及二氧化硫的含量高于風化后含量,只有二氧化硅的含量是風化后含量高于風化前含量。根據(jù)所查閱的資料顯示,高鉀玻璃在風化過程中,表面的化學成分含量會發(fā)生明顯變化,像氧化鉀會析出流失,氧化硅的含量會明顯增加,這與我們所觀測到的數(shù)據(jù)變化情況是吻合的。對于鉛鋇玻璃文物表面的化合物含量,我們從鉛鋇玻璃表面化合物含量均值百分比圖中可以直觀地觀察到風化前二氧化硅、氧化鈉、氧化鉀、氧化鐵含量高于風化后含量,而氧化鈣、氧化鎂、氧化銅、氧化鋁、氧化鋇、五氧化二磷、氧化鍶、氧化錫與二氧化硫的含量則是風化后的高于風化前的。兩種不同類型玻璃在風化前后表面化合物含量的差異性也從另一方面說明了玻璃類型與玻璃表面風化情況的顯著性關系。圖SEQ圖\*ARABIC5高鉀玻璃表面化合物含量百分比圖SEQ圖\*ARABIC6鉛鋇玻璃表面化合物含量均值百分比數(shù)據(jù)預測建立數(shù)據(jù)預測模型,使用MATLAB進行模型的實現(xiàn),得到了未風化鉛鋇玻璃和未風化高鉀玻璃的風化前預測值。以下為高鉀玻璃文物的全部預測數(shù)據(jù)。表SEQ表\*ARABIC8高鉀玻璃預測數(shù)據(jù)高鉀玻璃文物采樣點070910122227二氧化硅(SiO2)73.00871.78273.59166.56459.80372.805氧化鈉(Na2O)0.7570.7260.7310.6780.6220.754氧化鉀(K2O)0.00010.58016.60716.92511.3750.000氧化鈣(CaO)7.1443.9681.3534.3069.1076.253氧化鎂(MgO)0.0000.0000.0000.0003.1433.215氧化鋁(Al2O3)7.3984.7272.9204.88610.7459.344氧化鐵(Fe2O3)1.3502.4361.9922.0632.2831.582氧化銅(CuO)5.5432.5421.3872.5280.7732.625氧化鉛(PbO)0.4480.4300.4330.4020.3680.447氧化鋇(BaO)0.6520.6250.6290.5840.5350.649五氧化二磷(P2O5)3.3281.8300.0000.7330.9411.957氧化鍶(SrO)0.0450.0440.0440.0410.0370.045氧化錫(SnO2)0.2140.2050.2070.1920.1760.213二氧化硫(SO2)0.1110.1060.1070.0990.091以下為鉛鋇玻璃文物的部分預測數(shù)據(jù),其余數(shù)據(jù)于附錄中可見。表SEQ表\*ARABIC9鉛鋇玻璃的部分預測數(shù)據(jù)鉛鋇玻璃文物采樣點020811192634二氧化硅(SiO2)22.12422.55220.36818.42923.91751.709氧化鈉(Na2O)0.5861.0760.5820.5971.1611.388氧化鉀(K2O)15.1990.0003.0230.0000.0008.576氧化鈣(CaO)12.08814.03918.03115.43314.7439.549氧化鎂(MgO)5.4570.0003.2652.7820.0000.000氧化鋁(Al2O3)16.5657.1137.73310.5234.01111.099氧化鐵(Fe2O3)11.4270.0000.0008.3310.0006.843氧化銅(CuO)0.34425.3016.4894.73727.7264.737氧化鉛(PbO)0.3470.6370.3450.3540.6880.822氧化鋇(BaO)0.5040.9260.5010.5140.9991.195五氧化二磷(P2O5)15.07227.83039.37738.00826.1883.402氧化鍶(SrO)0.0350.0650.0350.0360.0700.083氧化錫(SnO2)0.1660.3040.1650.1690.3290.393二氧化硫(SO2)0.0860.1570.0850.0870.1700.2035.1.3結論分析玻璃文物表面風化與玻璃類型、紋飾和顏色的關系時,我們選擇了對應分析模型,發(fā)現(xiàn)在呈現(xiàn)10%的顯著性水平時,P=0.0840,紋飾B與表面風化的關聯(lián)程度大于紋飾A和紋飾C,說明玻璃紋飾為B的情況下更容易導致玻璃表面風化;在呈現(xiàn)5%的顯著性水平時,P=0.020,高鉀類型的玻璃與表面風化的關聯(lián)程度大于鉛鋇類型的玻璃,說明高鉀類型的玻璃表面風化程度更為嚴重一些;進行玻璃顏色與表面風化的對應分析時,觀測到深藍和綠色與表面風化的關聯(lián)程度大于藍綠色和淺藍色,通過查閱文獻,我們得知玻璃文物表面顏色的變化可以反映其風化程度,表面顏色接近藍色其風化程度越大,接近綠色其風化程度越小,從一方面反映了玻璃冶煉時需要堿性環(huán)境。在對附件表單2中數(shù)據(jù)做描述統(tǒng)計分析時,我們按照玻璃類型以及有無風化情況分為四類,分別對其進行統(tǒng)計分析,求出了各自化合物含量的最大值、最小值、均值以及標準偏差;結合風化情況對兩種玻璃類型進行前后化合物含量的比較,同時查閱相關文獻,驗證了化合物含量變化的正確性,例如高鉀玻璃風化后二氧化硅含量高于風化前,氧化鉀風化前含量高于風化后含量,而鉛鋇玻璃風化前二氧化硅含量高于風化后含量,氧化錫含量風化后高于風化前含量。5.2問題二模型的建立與求解5.2.1模型的建立對于問題二的求解,我們將問題二分為兩部分建立模型求解。第一部分建立隨機森林模型尋找高鉀玻璃和鉛鋇玻璃的分類規(guī)律。第二部分是選擇化學成分再對每個類別進行亞類劃分?;瘜W成分的選取在第一部分建模的基礎上,使用特征重要性排序選擇適合的化學成分。隨機森林分類模型根據(jù)問題一中得到的統(tǒng)計規(guī)律,我們發(fā)現(xiàn)高鉀玻璃和鉛鋇玻璃的一些化學成分含量有明顯差異。而隨機森林算法REF_Ref114401666\r\h[4]是一種可以高效實現(xiàn)分類目的的算法,有高精度,處理多變量數(shù)據(jù)的優(yōu)點,同時可以判斷變量的重要性。所以以化學成分含量作為變量,使用化學成分數(shù)據(jù)建立隨機森林分類模型。通過建立的隨機森林分類模型計算出各個特征重要性,尋找出特征重要性最高的變量作為分類的主要依據(jù)。亞分類模型玻璃的顏色與其所含的化學成分有關,而是否風化與化學成分含量的關系已由問題一得到,紋路無明顯的相關關系。故選取顏色作為分類的依據(jù),分別在鉛鋇玻璃和高鉀玻璃中,基于隨機森林算法建立模型,根據(jù)各化學成分的特征重要性選擇進行亞類劃分的化學成分。5.2.2模型的求解隨機森林分類模型的求解使用隨機森林分類模型,隨著決策樹數(shù)目的增多,準確度增加即誤差減小。從而得到了最佳的分類。圖SEQ圖\*ARABIC7決策樹數(shù)目-誤差圖圖7說明了當決策樹數(shù)目最多大于10以后,誤差即為0。該結果非常理想。說明得到分類的準確度極高。通過計算各化學成分的特征重要性得到分類的規(guī)律,以找到最能區(qū)分玻璃類別的化學成分。圖SEQ圖\*ARABIC8特征重要性柱形圖圖8中可以看到氧化鉛的特征重要性最高且數(shù)值很大。該圖說明了氧化鉛是最適合作為區(qū)別這兩種玻璃類型的化學成分特征。且可以預測該區(qū)分的準確度會很高。表SEQ表\*ARABIC10氧化鉛含量均值化合物高鉀玻璃文物鉛鋇玻璃文物風化無風化風化無風化氧化鉛(PbO).00.411743.313822.0848根據(jù)氧化鉛在不同類型玻璃中的均值含量,可知鉛鋇玻璃中氧化鉛的含量遠遠大于高鉀玻璃中的含量。且高鉀玻璃中氧化鉛的含量最大值是1.62,而鉛鋇玻璃中氧化鉛的最小值是9.30。所以鉛鋇玻璃中氧化鉛的含量遠遠大于高鉀玻璃中的含量??梢砸匝趸U的含量區(qū)分玻璃類型。本題中取高鉀玻璃最大值與鉛鋇玻璃最小值的均值5.46,該均值可以較好的精確區(qū)分玻璃類型。為了精確的了解分類的準確性,對預測結果和實際結果對比。圖SEQ圖\*ARABIC9訓練集預測結果對比 圖SEQ圖\*ARABIC10測試集預測結果對比準確度是預測正確結果占總樣本的比例,訓練集與測試集的預測結果都達到了100%的準確度,可知預測很準確。同時利用混淆矩陣最后驗證該分類的準確性。圖SEQ圖\*ARABIC11訓練集混淆矩陣 圖SEQ圖\*ARABIC12測試集混淆矩陣圖11和圖12的混淆矩陣中,數(shù)據(jù)都在2,4象限中,故該分類模型準確度極高。亞分類模型的求解(1)高鉀玻璃的亞分類使用SPSSPRO將高鉀玻璃數(shù)據(jù)輸入進行隨機森林分類,獲得特征重要性排序。圖SEQ圖\*ARABIC13高鉀玻璃特征重要性排序根據(jù)圖13可知氧化鈉、氧化鉀和氧化鈣的特征重要性最高且較為明顯的高于其余化學成分的特征重要性。故選取氧化鈉、氧化鉀和氧化鈣作為劃分的化學成分進行亞類劃分。對于該分類,通過混淆矩陣熱力圖驗證其準確性。圖SEQ圖\*ARABIC14混淆矩陣熱力圖根據(jù)混淆矩陣熱力圖,在對角塊上元素最多,故該分類較為準確。表SEQ表\*ARABIC11高鉀玻璃模型數(shù)據(jù)圖準確率召回率精確率訓練集111測試集0.8330.8330.833其中準確率是預測準確樣本占總樣本的比例,召匯率是實際為正樣本的結果中預測為正樣本的比例,精確率是預測出為正樣本的結果中實際為正樣本的比例。故得到該分類較為準確。表SEQ表\*ARABIC12高鉀玻璃文物的顏色與化合物含量氧化鈉(%)氧化鉀(%)氧化鈣(%)深藍09.420藍綠00-12.370-7.35淺藍2.1-2.8612.53-14.528.27-8.7深綠3.3812.288.23在確定了劃分的化學成分后,為了對亞類進行具體的劃分,需要找到劃分類別的含量臨界值。根據(jù)高鉀玻璃氧化鈉、氧化鉀和氧化鈣的成分含量與顏色情況的數(shù)據(jù),藍綠與深藍色的玻璃氧化鈉含量都為0,氧化鉀含量都小于12.37,氧化鈣含量都小于8。綜合以上結論,將其分為兩亞類,將氧化鈣含量8.0,氧化鉀含量12.37,氧化鈉含量0的作為臨界值。當氧化鈣含量小于8.0,氧化鉀含量小于12.37,氧化鈉含量等于于0的劃分為高鉀亞類1,不滿足的劃分為高鉀亞類2。高鉀亞類1的顏色特征是藍綠色和深藍色,高鉀亞類2的顏色特征是淺藍色和深綠色。(2)鉛鋇玻璃的亞分類使用SPSSPRO將鉛鋇玻璃數(shù)據(jù)輸入進行隨機森林分類,獲得特征重要性排序。圖SEQ圖\*ARABIC15鉛鋇玻璃特征重要性排序根據(jù)圖15可知氧化鋇的特征重要性最高且較為明顯的高于其余化學成分的特征重要性。且氧化鋇的數(shù)據(jù)較為完整,鉛鋇玻璃中幾乎都含有氧化鋇。故選取氧化鋇作為劃分的化學成分進行亞類劃分。對于該分類,通過混淆矩陣熱力圖驗證其準確性。圖SEQ圖\*ARABIC16混淆矩陣熱力圖根據(jù)混淆矩陣熱力圖,在對角塊上元素最多,故該分類較為準確。表SEQ表\*ARABIC13鉛鋇玻璃模型數(shù)據(jù)圖準確率召回率精確率訓練集111測試集0.7140.7140.63根據(jù)準確率、召匯率、精確率得到該分類較為準確。表SEQ表\*ARABIC14鉛鋇玻璃文物的顏色與化合物含量黑藍綠綠淺藍淺綠深藍深綠紫氧化鋇(%)4.19-14.211.86-17.37.952.03-23.554.88-9.7610.29-10.353.55-10.8326.23-35.45在確定了劃分的化學成分后,為了對亞類進行具體的劃分,需要找到劃分類別的含量臨界值。根據(jù)鉛鋇玻璃氧化鋇的成分含量與顏色情況的數(shù)據(jù),去除異常數(shù)據(jù)與氧化鋇為0的極少數(shù)據(jù),發(fā)現(xiàn)紫色玻璃的氧化鋇含量在26.23-35.45,其余顏色的氧化鋇含量在2.03-23.55,故選取24.89作為臨界值。綜合以上結論,將其分為兩亞類。當氧化鋇含量大于24.89的劃分為鉛鋇亞類1,小于24.89的劃分為鉛鋇亞類2。鉛鋇亞類1的顏色特征是紫色,鉛鋇亞類2的顏色特征是黑色,藍綠色,綠色,淺藍色,深藍色,淺綠色,深綠色。5.2.3結論利用隨機森林分類模型,以各化學成分為變量得到了最優(yōu)分類。得到氧化鉛的特征重要性最大,并通過測試結果對比和混淆矩陣,驗證了該分類的準確性。所以高鉀玻璃和鉛鋇玻璃的分類規(guī)律是氧化鉛的含量,鉛鋇玻璃氧化鉛含量遠大于高鉀玻璃。取5.46作為區(qū)分類型的臨界值。高鉀玻璃分為兩亞類,將氧化鈣含量8.0,氧化鉀含量12.37,氧化鈉含量0的作為臨界值。當氧化鈣含量小于8.0,氧化鉀含量小于12.37,氧化鈉含量等于于0的劃分為高鉀亞類1,不滿足的劃分為高鉀亞類2。高鉀亞類1的顏色特征是藍綠色和深藍色,高鉀亞類2的顏色特征是淺藍色和深綠色。鉛鋇玻璃分為兩亞類。當氧化鋇含量大于24.89的劃分為鉛鋇亞類1,小于24.89的劃分為鉛鋇亞類2。鉛鋇亞類1的顏色特征是紫色,鉛鋇亞類2的顏色特征是黑色,藍綠色,綠色,淺藍色,深藍色,淺綠色,深綠色。5.3問題三模型的建立與求解5.3.1模型的建立問題三要對附件表單3中玻璃文物的化學成分進行分析,然后判斷其所屬類型,根據(jù)第二問中我們建立起的隨機森林算法模型,其對于高鉀玻璃和鉛鋇玻璃化學成分進行了分析,然后得出相應的各成分貢獻率,因此,我們也可以建立起隨機森林預測模型,將問題二中數(shù)據(jù)作為訓練集,將不同樣本的化學成分含量百分比作為自變量,將樣本類型作為因變量,進行訓練,通過調參等操作建立起較為合理的預測模型,然后將附件表單3中數(shù)據(jù)作為自變量,預測樣本所屬類型。5.3.2模型的求解根據(jù)我們建立的模型,將數(shù)據(jù)導入SPSSPRO中進行預測,我們可以很容易地得到8中不同編號的文物所屬類型,下面是經(jīng)過分析后不同編號文物所屬類別情況:表SEQ表\*ARABIC15文物類型表文物編號A1A2A3A4A5A6A7A8類型高鉀鉛鋇鉛鋇鉛鋇鉛鋇高鉀高鉀鉛鋇得到上述文物類型后,我們需要對計算結果進行敏感性分析,敏感性分析,又稱為靈敏度分析,主要用于研究一個系統(tǒng)的狀態(tài)或輸出變化對系統(tǒng)參數(shù)或周圍條件變化的敏感程度。在本問題中,我們觀察到高鉀玻璃和鉛鋇玻璃各自氧化鋇的含量差異較為明顯,因此可以作為區(qū)分兩者的重要指標,其在敏感性分析中也更加具有說服力。我們以附件表單3中文物編號為A8的文物進行舉例分析,A8中所有化合物比例之和為99.98%,其中氧化鋇為11.34%,我們固定A8中其他化合物含量百分比,以1%為間隔進行氧化鋇含量下降處理,再次借助于隨機森林模型得出不同氧化鋇比例對應下的玻璃類別,由此進行敏感性分析,得到以下數(shù)據(jù):表SEQ表\*ARABIC16敏感性分析表氧化鋇比例(%)類型氧化鋇比例(%)類型11.34鉛鋇玻璃4.34鉛鋇玻璃10.34鉛鋇玻璃3.34鉛鋇玻璃9.34鉛鋇玻璃2.34鉛鋇玻璃8.34鉛鋇玻璃1.34鉛鋇玻璃7.34鉛鋇玻璃0.34鉛鋇玻璃6.34鉛鋇玻璃0鉛鋇玻璃5.34鉛鋇玻璃由上表中數(shù)據(jù)分析可知,玻璃類型的改變對于氧化鋇含量的變化不敏感,也就是說在一定范圍內改變氧化鋇的含量不會對玻璃的類型造成實質性影響。5.3.3結論我們通過建立的隨機森林模型求得了附件表單3中不同編號文物的所屬類型,其中A1、A6、A7為高鉀玻璃,A2、A3、A4、A5、A8為鉛鋇玻璃;我們借助于兩種不同類型玻璃之間的化合物含量顯著差異性,將氧化鋇含量作為敏感性分析的標準,對其進行擾動分析,判斷其對實驗結果的影響,發(fā)現(xiàn)玻璃類型對氧化鋇含量不夠敏感,也即在一定范圍內改變化合物含量不會造成玻璃類型的變化。5.4問題四模型的建立與求解5.4.1模型的建立問題四要求我們分析不同類別玻璃文物表面化學成分之間的關聯(lián)關系,我們由此建立起相關分析模型來分析各化學成分之間的關系。斯皮爾曼相關分析模型建立斯皮爾曼相關分析模型必然離不開斯皮爾曼相關系數(shù),建立相關分析模型REF_Ref114401813\r\h[5]前先對斯皮爾曼相關系數(shù)做介紹。當數(shù)據(jù)中存在相同值和異常值時,往往需要借助于斯皮爾曼相關系數(shù)來進行相關性分析。對于該問題來說,任取一類玻璃中的m個樣本,其中的n種不同化學成分,由此可以構成數(shù)據(jù)矩陣X=(xij)m×n,Spearman相關系數(shù)等效于應用于Xa和Xb列秩序的Pearson線性相關系數(shù),對于第a列xa和第 rho(a,b)=1-6d2m(m2-1)(其中d為兩個列的秩之差,m為每列的長度。對任取的某一類別玻璃的所有樣本及其對應的化學成分含量百分比做斯皮爾曼相關性分析,就可以得到他們之間的相關系數(shù),由相關系數(shù)大小則可以很容易地判斷任意兩者之間的線性相關性大小,對各化學成分之間的關聯(lián)程度大小也容易判斷。5.4.2模型的求解斯皮爾曼相關分析根據(jù)以上建立的斯皮爾曼相關分析模型,我們借助于MATLAB軟件實現(xiàn)兩類玻璃各自化學成分含量的斯皮爾曼相關性分析,兩種玻璃分別的化合物相關系數(shù)數(shù)據(jù)表放在附錄中,以下為對應的斯皮爾曼相關性熱力圖。高鉀玻璃圖SEQ圖\*ARABIC17高鉀玻璃斯皮爾曼相關性圖從高鉀玻璃斯皮爾曼相關性熱力圖來看,二氧化硅除了與氧化錫有著微弱的正相關關系外,與其他幾種化合物的相關系數(shù)都為負值,說明其相關關系為負相關;氧化鈉和氧化錫與其他幾種化合物之間的相關關系表現(xiàn)為負相關種類較多;氧化鋇和氧化鈣與其他幾種化合物之間的相關關系較為均衡;而氧化鉀、氧化鎂、氧化鋁、氧化鐵、氧化銅、氧化鉛、五氧化二磷以及氧化鍶與其他幾種化合物之間的相關系數(shù)表現(xiàn)為正相關種類多。鉛鋇玻璃從鉛鋇玻璃相關性分析熱力圖來看,二氧化硅與7種化合物呈現(xiàn)負相關關系,其與氧化鉛的負相關性最強,與氧化鎂的正相關性最強;氧化納與8中化合物呈現(xiàn)負相關關系,其與五氧化二磷負相關性最強,與二氧化硅正相關性最強;氧化鉀、氧化銅、氧化鉛、氧化鋇以及五氧化二磷與其他化合物種類呈現(xiàn)負相關關系較多;而氧化鈣、氧化鋁、氧化鐵和氧化錫與其他化合物線性相關關系較為均衡,正負相關關系合理;而氧化鎂、氧化鍶與其他幾種化合物正相關關系比較多。圖SEQ圖\*ARABIC18鉛鋇玻璃相關性圖不同類別差異性分析問題四中不僅要比較同類別玻璃文物樣品化學成分之間的關聯(lián)關系,還要比較不同類別之間化學成分關聯(lián)關系的差異性,根據(jù)題目提供信息,我們按照高鉀玻璃和鉛鋇玻璃兩種類型進行差異性分析。根據(jù)相關系數(shù)判斷,高鉀玻璃中二氧化硅基本與其他類型化合物呈現(xiàn)負相關關系,而鉛鋇玻璃中二氧化硅與其它一些化合物存在正相關關系,這與我們問題一中得到的結果相吻合,問題一中高鉀玻璃二氧化硅含量在風化過程中增加,與其負相關性相契合,鉛鋇玻璃二氧化硅含量在風化過程中減少,與其存在正相關性相契合;作為重要的化合物,氧化鉛在高鉀玻璃中與氧化鋁、氧化鋇呈現(xiàn)出較高的正相關性,與二氧化硅、二氧化硫呈現(xiàn)出較高的負相關性,在鉛鋇玻璃中,氧化鉛則與上述幾種化合物呈現(xiàn)負相關性。5.4.3結論不同類別玻璃文物內部各化學成分之間有著不同的正負相關性,個別化合物與其他化合物的正負相關性與其含量變化有著緊密的聯(lián)系,如二氧化硅,而其他化合物的正負相關性與其含量變化聯(lián)系不夠緊密;不同類別之間各化合物相關關系存在差異性,往往與其各自能夠發(fā)生的化學反應密切相關。六、模型的優(yōu)缺點分析6.1模型優(yōu)點(1)問題一建立的對應分析模型極其適合該題的解答,完全滿足了該問的要求,且有普適性,可以推廣到類似的關系分析實際問題中。(2)問題二,三建立的隨機森林分類模型的分類結果準確,簡潔有效,計算速度快。得到的結果貼合題意。且對類似的分類問題都可以解答。(3)問題四建立的斯皮爾曼相關分析模型算法成熟,結果明了,運算快速穩(wěn)定。對關聯(lián)關系的分析可以推廣到更多實際問題中。6.2模型缺點(1)本文為了簡化建模,假設玻璃風化前的化學成分含量與未被風化玻璃的相近,但所做假設是基于一定的客觀規(guī)律,所以并不影響結果與分析。(2)本文為了計算的簡化,將問題二中的亞類分類舍去了次要因素紋路的影響,假設相同類型玻璃內玻璃的紋路與化學成分含量無關。但基于客觀規(guī)律該次要因素的影響不大,故也并不會影響結果的準確性與合理性。七、模型的改進與推廣7.1問題一模型的改進與推廣(1)該題中建立的對應分析模型可很好的推廣到相關關系分析的實際問題中,普適性強。(2)該題中建立的預測模型可在更專業(yè)的指導下,明確玻璃風化前的化學成分含量與未被風化玻璃化學成分含量的關系,以完善該模型,增強準確性。7.2問題二模型的改進與推廣(1)該題建立的隨機森林模型對大多實際分類規(guī)律尋找問題都有著極高的可行性,可以推廣到實際分類問題中。(2)在更強的計算與專業(yè)的指導下,可以將紋路等更多特征加入以完善亞分類的模型。7.3問題三模型的改進與推廣(1)該題建立的隨機森林模型可以推廣到更多方面如礦物的分類鑒定問題中,有較強普適性。7.4問題四模型的改進與推廣(1)該題建立的斯皮爾曼相關分析模型對關聯(lián)關系的分析在實際問題中不同變量間的關系研究有很強的可行性,可以推廣到如不同商品銷售量之間的關系等方面。八、參考文獻ScientificPlatformServingforStatisticsProfessional2021.SPSSPRO.(Version1.0.11)[OnlineApplicationSoftware].Retrievedfrom.高惠璇.應用多元統(tǒng)計分析[M].北京:北京大學出版社,2005.王婕,李沫,馬清林,張治國,章梅芳,王菊琳.一件戰(zhàn)國時期八棱柱狀鉛鋇玻璃器的風化研究[J].周志華.機器學習[M].清華大學出版社,2016.徐維超.相關系數(shù)研究綜述[J].廣東工業(yè)大學學報,2012,29(3):12-17.九、附錄9.1代碼%問題1%spsspro對應分析代碼importnumpyimportpandasfromspsspro.algorithmimportquestionnaire#生成案例數(shù)據(jù)data=pandas.DataFrame({"A":numpy.random.choice([1,2],size=100),"B":numpy.random.choice([1,2],size=100),"C":numpy.random.choice([1,2],size=100),"D":numpy.random.choice([1,2],size=100),"E":numpy.random.choice([1,2],size=100),"F":numpy.random.choice([1,2],size=100)})#對應分析result=questionnaire.correspondence_analysis(data=data,dimension=2)print(result)%spss代碼,分別對高鉀玻璃、鉛鋇玻璃的風化和無風化樣本表面化合物數(shù)據(jù)探究其統(tǒng)計規(guī)律DESCRIPTIVESVARIABLES=二氧化硅SiO2氧化鈉Na2O氧化鉀K2O氧化鈣CaO氧化鎂MgO氧化鋁Al2O3氧化鐵Fe2O3氧化銅CuO氧化鉛PbO氧化鋇BaO五氧化二磷P2O5氧化鍶SrO氧化錫SnO2二氧化硫SO2/STATISTICS=MEANSTDDEVMINMAX.%MATLAB代碼,根據(jù)風化點檢測數(shù)據(jù),預測其風化前的化學成分含量A=readmatrix("awork.xlsx",'Sheet',1,'Range','B3:E16')%對于高鉀玻璃B=[2910121314]GJ=readmatrix("GOODWORK.xlsx",'Sheet',8,'Range','B2:O7')[m,n]=size(GJ);GJ1=zeros(m,n);GJ2=zeros(m,n);fork=1:mfori=1:nforj=1:6ifi==B(j)GJ1(k,i)=A(i,2);endendifGJ1(k,i)==0GJ1(k,i)=A(i,2)./A(i,1).*GJ(k,i);endendendb=sum(GJ1,2);fork=1:mfori=1:nGJ2(k,i)=GJ1(k,i)./b(k);endendwritematrix(GJ2*100,"Q1result.xlsx",'Sheet',1,'Range','B2:O7')%對于鉛鋇玻璃QB=readmatrix("GOODWORK.xlsx",'Sheet',10,'Range','B2:O27')[m1,n1]=size(QB);QB1=zeros(m1,n1);QB2=zeros(m1,n1);fork=1:m1fori=1:n1forj=1:6ifi==B(j)QB1(k,i)=A(i,2);endendifQB1(k,i)==0QB1(k,i)=A(i,2)./A(i,1).*QB(k,i);endendendb=sum(QB1,2);fork=1:m1fori=1:n1QB2(k,i)=QB1(k,i)./b(k);endendwritematrix(QB2*100,"Q1result.xlsx",'Sheet',2,'Range','B2:O27')%問題2%MATLAB代碼,對表單2中的類型數(shù)據(jù)進行隨機森林分類,并得出各個化合物的重要性,作為分類規(guī)律warningoffcloseallclearclc%%導入數(shù)據(jù)rester=readmatrix("Q2數(shù)據(jù).xlsx",'Sheet',2,'Range','B2:T68');%%劃分訓練集和測試集%loadtemptempter=randperm(67);%訓練集P_training=rester(tempter(1:44),1:14)';T_training=rester(tempter(1:44),17)';m=size(P_training,2);%測試集P_testing=rester(tempter(45:end),1:14)';T_testing=rester(tempter(45:end),17)';n=size(P_testing,2);%%數(shù)據(jù)歸一化[ptrain,ps_input]=mapminmax(P_training,0,1);p_test=mapminmax('apply',P_testing,ps_input);ttrain=T_training;ttest=T_testing;%%轉置以適應模型ptrain=ptrain';p_test=p_test';ttrain=ttrain';ttest=ttest';%%訓練模型trees=50;leaf=1;OOBPrediction='on';OOBPredictorImportance='on';Method='classification';net=TreeBagger(trees,ptrain,ttrain,'OOBPredictorImportance',OOBPredictorImportance,...'Method',Method,'OOBPrediction',OOBPrediction,'minleaf',leaf);importance=net.OOBPermutedPredictorDeltaError;%%仿真測試t_sim1=predict(net,ptrain);t_sim2=predict(net,p_test);%%格式轉換T1sim1=str2num(cell2mat(t_sim1));T1sim2=str2num(cell2mat(t_sim2));%%性能評價error1=sum((T1sim1'==T_training))/m*100;error2=sum((T1sim2'==T_testing))/n*100;%%繪制誤差曲線figureplot(1:trees,oobError(net),'b-','LineWidth',1)legend('誤差曲線')xlabel('決策樹數(shù)目')ylabel('誤差')xlim([1,trees])grid%%繪制特征重要性figurebar(importance)legend('重要性')xlabel('特征')ylabel('重要性')%%數(shù)據(jù)排序[T_training,index1]=sort(T_training);[T_testing,index2]=sort(T_testing);T1sim1=T1sim1(index1);T1sim2=T1sim2(index2);%%繪圖figureplot(1:m,T_training,'r-*',1:m,T1sim1,'b-o','LineWidth',1)legend('真實值','預測值')xlabel('預測樣本')ylabel('預測結果')string={'訓練集預測結果對比';['準確率='num2str(error1)'%']};title(string)gridfigureplot(1:n,T_testing,'r-*',1:n,T1sim2,'b-o','LineWidth',1)legend('真實值','預測值')xlabel('預測樣本')ylabel('預測結果')string={'測試集預測結果對比';['準確率='num2str(error2)'%']};title(string)grid%%混淆矩陣figurecm=confusionchart(T_training,T1sim1);cm.Title='ConfusionMatrixforTrainData';cm.ColumnSummary='column-normalized';cm.RowSummary='row-normalized';figurecm=confusionchart(T_testing,T1sim2);cm.Title='ConfusionMatrixforTestData';cm.ColumnSummary='column-normalized';cm.RowSummary='row-normalized';%spsspro代碼,使用隨機森林尋找重要性高的化合物importnumpyimportpandasfromspsspro.algorithmimportsupervised_learning#生成案例數(shù)據(jù)data_x=pandas.DataFrame({"A":numpy.random.random(size=100),"B":numpy.random.random(size=100)})data_y=pandas.Series(data=numpy.random.choice([1,2],size=100),name="C")#隨機森林分類result=supervised_learning.random_forest_classifier(data_x=data_x,data_y=data_y)print(result)%問題3%MATLAB代碼,使用已經(jīng)訓練好的隨機森林分類模型對表單3中的數(shù)據(jù)進行分類restQ=readmatrix("GOODWORK.xlsx",'Sheet',3,'Range','C2:P9');PTHEwork=restQ(:,1:14)';pTEHwork=mapminmax('apply',PTHEwork,ps_input);%變量ps_input在Q2的代碼中tTHEsim3=predict(net,pTEHwork');tTHEsim3=str2num(cell2mat(tTHEsim3));writematrix(tTHEsim3,"Q3result.xlsx",'Sheet',1,'Range','Q2:Q9')%MATLAB代碼,靈敏度分析mo=13,n=10PworkTHE=zeros(14,mo);x=zeros(14,1);x(n)=1PworkTHE(:,1)=rest(8,1:14)'fori=1:mo-1ifi==mo-1PworkTHE(:,i+1)=PworkTHE(:,i)-x*mod(PworkTHE(n,1),1);elsePworkTHE(:,i+1)=PworkTHE(:,i)-x;endendPworkTHEnum=zeros(mo,1);fori=1:mopworkTHE=mapminmax('apply',PworkTHE(:,i),ps_input);tsim3THE=predict(net,pworkTHE');num(i)=str2num(cell2mat(tsim3THE));endnumwritematrix(PworkTHE',"Q3result.xlsx",'Sheet',1,'Range','C14:P27')writematrix(tTHEsim3,"Q3result.xlsx",'Sheet',1,'Range','Q14:Q27')%問題4%MATLAB代碼,使用相關性分析計算出各個化學物質之間的相關系數(shù),畫出相關性分析的熱力圖%高鉀clcclearBETA=readmatrix("GOODWORK.xlsx",'Sheet',6,'Range','B2:O19');figure%求維度之間的相關系數(shù)rhoma=corr(BETA,'type','Spearman');%繪制熱圖string_name={'二氧化硅','氧化鈉','氧化鉀','氧化鈣','氧化鎂','氧化鋁','氧化鐵','氧化銅','氧化鉛','氧化鋇','五氧化二磷','氧化鍶','氧化錫','二氧化硫'};xvalues=string_name;yvalues=string_name;h=heatmap(xvalues,yvalues,rhoma,'FontSize',10,'FontName','宋體');h.CellLabelFormat='%0.2f';h.Title='高鉀玻璃各化合物之間的斯皮爾曼相關性';colormapautumnwritematrix(rhoma,"Q4相關系數(shù).xlsx",'Sheet',1,'Range','B2:O15')%鉛鋇clcclearBETA1=readmatrix("GOODWORK.xlsx",'Sheet',7,'Range','B2:O50');figure%求維度之間的相關系數(shù)rhoma1=corr(BETA1,'type','Spearman');%繪制熱圖string_name={'二氧化硅','氧化鈉','氧化鉀','氧化鈣','氧化鎂','氧化鋁','氧化鐵','氧化銅','氧化鉛','氧化鋇','五氧化二磷','氧化鍶','氧化錫','二氧化硫'};xvalues=string_name;yvalues=string_name;h=heatmap(xvalues,yvalues,rhoma1,'FontSize',10,'FontName','宋體');h.CellLabelFormat='%0.2f';h.Title='鉛鋇玻璃各化合物之間的斯皮爾曼相關性';colormapwinterwritematrix(rhoma1,"Q4相關系數(shù).xlsx",'Sheet',2,'Range','B2:O15')9.2描述性統(tǒng)計數(shù)據(jù)表表SEQ表\*ARABIC17高鉀玻璃風化文物樣品表面化學成分含量描述統(tǒng)計(%)N最小值最大值均值標準偏差二氧化硅(SiO2)692.3596.7793.96331.73362氧化鈉(Na2O)60000氧化鉀(K2O)601.010.54330.44518氧化鈣(CaO)60.211.660.870.48777氧化鎂(MgO)600.640.19670.30631氧化鋁(Al2O3)60.813.51.930.96449氧化鐵(Fe2O3)60.170.350.2650.0695氧化銅(CuO)60.553.241.56170.93482氧化鉛(PbO)60000氧化鋇(BaO)60000五氧化二磷(P2O5)600.610.280.20995氧化鍶(SrO)60000氧化錫(SnO2)60000二氧化硫(SO2)60000表SEQ表\*ARABIC18高鉀玻璃無風化文物樣品表面化學成分含量描述統(tǒng)計(%)N最小值最大值均值標準偏差二氧化硅(SiO2)1259.0187.0567.98428.7551氧化鈉(Na2O)1203.380.6951.28692氧化鉀(K2O)12014.529.33083.9203氧化鈣(CaO)1208.75.33253.09248氧化鎂(MgO)1201.981.07920.67614氧化鋁(Al2O3)123.0511.156.622.49151氧化鐵(Fe2O3)1206.041.93171.66669氧化銅(CuO)1205.092.45251.65999氧化鉛(PbO)1201.620.41170.58899氧化鋇(BaO)1202.860.59830.9821五氧化二磷(P2O5)1204.51.40251.43396氧化鍶(SrO)1200.120.04170.0484氧化錫(SnO2)1202.360.19670.68127二氧化硫(SO2)1200.470.10170.18551表SEQ表\*ARABIC19鉛鋇玻璃風化文物樣品表面的化學成分含量描述統(tǒng)計(%)N最小值最大值均值標準偏差二氧化硅(SiO2)263.7253.3324.912710.60548氧化鈉(Na2O)26.002.22.2162.55665氧化鉀(K2O)26.001.05.1335.23997氧化鈣(CaO)26.006.402.69541.65978氧化鎂(MgO)26.002.73.6500.70643氧化鋁(Al2O3)26.4513.652.97002.63427氧化鐵(Fe2O3)26.002.74.5846.73653氧化銅(CuO)26.0010.572.27582.82052氧化鉛(PbO)2615.7170.2143.313812.23022氧化鋇(BaO)26.0035.4511.80739.97827五氧化二磷(P2O5)26.0014.135.27734.19670氧化鍶(SrO)26.001.12.4185.26484氧化錫(SnO2)26.001.31.0685.26945二氧化硫(SO2)26.0015.951.36624.20607表SEQ表\*ARABIC20鉛鋇玻璃無風化文物樣品表面的化學成分含量描述統(tǒng)計(%)N最小值最大值均值標準偏差二氧化硅(SiO2)2331.9475.5154.659611.82859氧化鈉(Na2O)2307.921.68262.37164氧化鉀(K2O)2301.410.21870.31006氧化鈣(CaO)2304.491.32041.2847氧化鎂(MgO)2301.670.64040.54675氧化鋁(Al2O3)231.4214.344.45613.26245氧化鐵(Fe2O3)2304.590.73651.15473氧化銅(CuO)2308.461.43171.96987氧化鉛(PbO)239.339.2222.08488.21515氧化鋇(BaO)232.0326.239.00175.82528五氧化二磷(P2O5)2306.341.04911.84706氧化鍶(SrO)2300.910.26830.24345氧化錫(SnO2)2300.440.04650.12734二氧化硫(SO2)2303.660.15910.763169.3問題一中鉛鋇玻璃文物的部分預測數(shù)據(jù)表SEQ表\*ARABIC21問題一中鉛鋇玻璃文物的部分預測數(shù)據(jù)(1)鉛鋇玻璃文物采樣點08嚴重風化點26嚴重風化點36383940二氧化硅(SiO2)4.6623.84464.21253.51851.68232.334氧化鈉(Na2O)0.9710.9931.5591.5611.8911.859氧化鉀(K2O)0.0009.8125.3930.0000.0000.000氧化鈣(CaO)27.33126.3525.0869.36218.51430.654氧化鎂(MgO)0.0000.0000.0000.0000.0000.000氧化鋁(Al2O3)5.3225.78112.30919.8014.6674.128氧化鐵(Fe2O3)0.0000.0005.2324.7480.0003.704氧化銅(CuO)6.8938.0752.3952.5753.7610.000氧化鉛(PbO)0.5750.5880.9230.9251.1201.101氧化鋇(BaO)0.8360.8551.3421.3441.6281.600五氧化二磷(P2O5)52.93343.2130.7865.40115.81123.711氧化鍶(SrO)0.0580.0600.0940.0940.1130.112氧化錫(SnO2)0.2750.2810.4410.4420.5350.526二氧化硫(SO2)0.1420.1450.2280.2280.2770.272表SEQ表\*ARABIC22問題一中鉛鋇玻璃文物的部分預測數(shù)據(jù)(2)鉛鋇玻璃文物采樣點4143部位143部位2484950二氧化硅(SiO2)10.23712.88510.42229.29813.51416.356氧化鈉(Na2O)0.5330.9970.4610.5280.4510.874氧化鉀(K2O)5.7920.0000.0004.1730.0000.000氧化鈣(CaO)23.30146.09026.03913.12418.21224.583氧化鎂(MgO)11.4807.0073.4606.4165.2323.242氧化鋁(Al2O3)8.75411.0757.76435.55111.9728.065氧化鐵(Fe2O3)10.0017.9506.7265.70112.9583.024氧化銅(CuO)0.22912.0571.5740.0000.7132.231氧化鉛(PbO)0.3160.5910.2730.3130.2670.518氧化鋇(BaO)0.4590.8590.3970.4540.3880.752五氧化二磷(P2O5)28.6390.00042.6584.18436.07139.927氧化鍶(SrO)0.0320.0600.0280.0320.0270.052氧化錫(SnO2)0.1510.2820.1310.1490.1280.247二氧化硫(SO2)0.0780.1460.0680.0770.0660.128表SEQ表\*ARABIC23問題一中鉛鋇玻璃文物的部分預測數(shù)據(jù)(3)鉛鋇玻璃文物采樣點51部位151部位25254二氧化硅(SiO2)15.12413.60225.52718.526氧化鈉(Na2O)0.5900.6120.9530.799氧化鉀(K2O)0.0000.0000.0006.316氧化鈣(CaO)18.63927.68719.07122.471氧化鎂(MgO)5.5467.0054.1368.071氧化鋁(Al2O3)15.2967.5815.45416.359氧化鐵(Fe2O3)7.3682.6962.2980.000氧化銅(CuO)1.8271.0371.5071.498氧化鉛(PbO)0.3500.3630.5640.473氧化鋇(BaO)0.5080.5270.8200.688五氧化二磷(P2O5)34.46338.59239.20324.408氧化鍶(SrO)0.0350.0370.0570.048氧化錫(SnO2)0.1670.1730.2700.226二氧化硫(SO2)0.0860.0900.1390.117表SEQ表\*ARABIC24問題一中鉛鋇玻璃文物的部分預測數(shù)據(jù)(4)鉛鋇玻璃文物采樣點54嚴重風化點565758二氧化硅(SiO2)11.68841.46748.70017.748氧化鈉(Na2O)0.6561.3661.8400.561氧化鉀(K2O)0.0000.0000.0004.713氧化鈣(CaO)0.00014.58221.26117.267氧化鎂(MgO)5.7500.0000.0003.499氧化鋁(Al2O3)11.82112.47619.8009.746氧化鐵(Fe2O3)0.0000.0000.0005.060氧化銅(CuO)1.9872.4394.8243.968氧化鉛(PbO)0.3890.8091.0900.332氧化鋇(BaO)0.5651.1761.5840.483五氧化二磷(P2O5)66.82425.0150.00036.348氧化鍶(SrO)0.0390.0820.1100.034氧化錫(SnO2)0.1860.3870.5210.159二氧化硫(SO2)0.0960.2000.2690.0829.4問題三中鑒別玻璃文物
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 旅行活動策劃方案6(3篇)
- 生日活動策劃方案評價(3篇)
- 紅色兒歌活動方案策劃(3篇)
- 2025年企業(yè)財務管理與成本分析
- 2025年高職園林(園林工程造價)試題及答案
- 2025年中職工程計價管理(管理技術)試題及答案
- 2025年高職食品科學與工程技術(食品加工工藝)試題及答案
- 2025年大學廣播電視編導(廣播電視編導)試題及答案
- 2025年大學(中西醫(yī)臨床醫(yī)學)中西醫(yī)結合信息學試題及答案
- 2025年高職(寵物臨床診療技術)寵物疾病診斷階段測試題及答案
- 2026年寧夏賀蘭工業(yè)園區(qū)管委會工作人員社會化公開招聘備考題庫帶答案詳解
- 房地產售后服務及質量保證措施
- 國有企業(yè)采購管理規(guī)范 T/CFLP 0027-2020
- 國開2023年企業(yè)法務形考任務1-4答案
- 感應加熱器安全操作規(guī)程
- 商業(yè)地產行業(yè)商業(yè)地產投資機會
- 兩輪車控制器行業(yè)報告
- JSA臨時用電作業(yè)安全分析表
- 2015-2022年北京衛(wèi)生職業(yè)學院高職單招語文/數(shù)學/英語筆試參考題庫含答案解析
- 賽膚潤常見臨床應用2010年
- 提高鋁模板施工質量合格率
評論
0/150
提交評論