版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
定量結(jié)構(gòu)性質(zhì)關(guān)系QSPR用于紫外吸收最大波長預(yù)測(cè)
目錄課題背景QSPR多元線性回歸(MLR)模型的建立徑向基神經(jīng)網(wǎng)絡(luò)(RBFNN)模型的建立交互檢驗(yàn)結(jié)果與討論致謝課題背景
黃酮類化合物通常指廣泛存在于植物中的黃色素,目前已發(fā)現(xiàn)2000余種,其中有一些具有明顯的生理活性,并已應(yīng)用于臨床。黃酮類化合物中有藥用價(jià)值的化合物很多。近十幾年來對(duì)黃酮類化合物的紫外光譜研究較多,已經(jīng)積累了很多數(shù)據(jù)及規(guī)律性,因此紫外光譜對(duì)黃酮類化合物的鑒定有重要的價(jià)值。
黃酮類化合物結(jié)構(gòu)
黃酮化合物的基本結(jié)構(gòu)為2-苯色酮,即具有C6-C3部分的B環(huán)和C6部分的A環(huán)骨架。從這個(gè)基本結(jié)構(gòu)衍生出很多不同類型的黃酮化合物,可以分為黃酮、黃酮醇、異黃酮、二氫黃酮、二氫黃酮醇、二氫異黃酮、雙黃酮、查耳酮和橙酮等。黃酮異黃酮雙黃酮查耳酮橙酮各類黃酮化合物的紫外吸收
種類帶Ⅰ帶Ⅱ黃酮和黃酮醇290~300nm240~280nm異黃酮300~330nm(w)245~270nm(s)二氫黃酮和二氫黃酮醇肩峰或弱峰270~295nm(s)二氫異黃酮同上同上查耳酮300~400nm(s)220~270nm(w)橙酮一個(gè)或兩個(gè)高于300nm(s)兩個(gè)低于300nm雙黃酮其紫外光譜仍保持原黃酮的吸收帶
鑒于黃酮類化合物具有明顯的生理活性,因此我們可以人工合成集多個(gè)優(yōu)點(diǎn)于一身的化合物,來彌補(bǔ)天然黃酮類化合物的不足。合成出來的化合物要通過鑒定才能確定其結(jié)構(gòu),通過實(shí)驗(yàn)才能確定其性質(zhì)。結(jié)構(gòu)與紫外最大吸收之間的關(guān)系化合物的性質(zhì)確定
應(yīng)用實(shí)驗(yàn)測(cè)定方法存在著如下的不足:(1)要求具備良好的實(shí)驗(yàn)設(shè)備,而且工作量巨大;(2)考慮到實(shí)驗(yàn)過程中的安全問題;(3)有毒、易揮發(fā)、爆炸性或有輻射的物質(zhì);(4)尚未合成的物質(zhì)。
因此,單純地應(yīng)用實(shí)驗(yàn)研究來確定化合物的性質(zhì)是不可取的,有必要借助理論計(jì)算方法對(duì)有機(jī)物的性質(zhì)進(jìn)行預(yù)測(cè),以彌補(bǔ)實(shí)驗(yàn)研究方法的不足.當(dāng)今比較熱門的定量結(jié)構(gòu)-性質(zhì)關(guān)系(QSPR)研究可以滿足這一要求。QSPR的簡(jiǎn)介
QSPR的研究就是對(duì)計(jì)算出來的分子結(jié)構(gòu)參數(shù)和所研究的實(shí)驗(yàn)性質(zhì)進(jìn)行統(tǒng)計(jì)分析,建立它們之間的定量關(guān)系模型。一旦建立了可靠的定量關(guān)系模型,就可以用它來預(yù)測(cè)新的甚至是未合成出來的化合物的性質(zhì)。
原理部分QSPR研究的步驟
數(shù)據(jù)的搜集與整理(可靠)預(yù)測(cè)模型的建立與評(píng)估(交互檢驗(yàn))↓↑分子結(jié)構(gòu)的輸入與優(yōu)化ChemDrawHyperChem→描述符的計(jì)算與選擇CODESSA
原理部分
原理部分QSPR研究中的首要問題之一是分子結(jié)構(gòu)的描述問題,即選擇各種分子描述符,全面地反映分子的結(jié)構(gòu)特征。組成描述符(ConstitutionalDescriptors)
拓?fù)涿枋龇═opologicalDescriptors)
幾何描述符(GeometricalDescriptors)電荷相關(guān)描述符(ElectrostaticDescriptors)
量子化學(xué)描述符(Quantum-ChemicalDescriptors)
分子結(jié)構(gòu)描述符的產(chǎn)生及計(jì)算QSPR
模型線性非線性
原理部分徑向基神經(jīng)網(wǎng)絡(luò)線性回歸分析誤差反向傳播神經(jīng)網(wǎng)絡(luò)主成分分析偏最小二乘法多元線性回歸(Multiplelinearregression,MLR)模型
建立MLR模型中最主要的步驟就是篩選符合條件的描述符這一步,本論文中我們采用了啟發(fā)式回歸方法(HeuristicMethod,HM)。
原理部分參數(shù)的預(yù)選相關(guān)性分析
建立多元線性相關(guān)模型(一參數(shù)模型→兩參數(shù)模型→
…
…
→n參數(shù)模型)徑向基神經(jīng)網(wǎng)絡(luò)(Radialbasisfunctionneuralnetwork,RBFNN)模型RBF網(wǎng)絡(luò)的基本思想:(1)用RBF作為隱單元的“基”構(gòu)成隱含層空間,將輸入矢量直接映射到隱空間;(2)當(dāng)RBF的中心點(diǎn)確定后,映射關(guān)系也就確定;(3)隱含層空間到輸出空間的映射是線性的。wwy1y211hnyn….….…
原理部分
交互檢驗(yàn)
模型建立好以后,要對(duì)所建模型進(jìn)行評(píng)估,于是選擇交互檢驗(yàn)對(duì)其預(yù)測(cè)能力及穩(wěn)定性來進(jìn)行檢驗(yàn)。交互檢驗(yàn)的過程如下:為了檢驗(yàn)?zāi)P偷姆€(wěn)定性和所選參數(shù)的合理性,我們隨機(jī)地把樣本集分為A、B、C、D、E、F六組,用建立模型時(shí)篩選出的六個(gè)描述符對(duì)任意五組進(jìn)行多元線性回歸分析,余下的一組作為測(cè)試集。
原理部分
實(shí)驗(yàn)部分1、黃酮2、3-去甲醚水黃皮素3、黃連苷Ⅰ4、薊黃苷5、5,7,4‘-三甲氧基黃酮6、異金雀兒黃素7、5-羥基-4‘,7-二甲氧基-6-甲基黃酮8、阿勒亭黃素9、5,6,7,2‘-四甲氧基黃酮10、澤藍(lán)黃素11、澤藍(lán)黃素-7,3‘,4’-三甲醚
12、胡麻苷13、5-氧-去甲福桔黃素14、魏穿心蓮黃素15、山胡椒黃素
實(shí)驗(yàn)部分16、干楂黃酮17、5,7,3‘,5’-四羥-18、3-甲氧基黃酮19、3,2'-二羥基黃酮20、3,5-二羥基-21、3,5,8,4‘-22、5-羥基-3,7,4’-23、赤楊黃素24、甲基赤楊黃素25、3,5,7,2‘-四羥基黃酮26、蜜茱萸三黃素27、5,4’-二羥基-8,4'-二甲氧基黃酮7,4‘-二甲氧基黃酮四羥基黃酮三甲氧基黃酮3,7,8-三甲氧基黃酮
28、因特靈29、九里香黃酮30、桑白皮素B31、桑白皮素C
實(shí)驗(yàn)部分32、異黃酮33、紫藤苷34、香槐黃素35、3',4'-次甲二氧基-6,7-二甲氧基異黃酮36、尼鳶尾黃苷37、血莧黃素38、6,7,3‘-三甲氧基-39、藤薇甘菊黃素4',5'-次甲二氧基異黃酮40、5,7,2‘-三羥基-4’-甲氧基異黃酮41、底普脫利辛42、奧多那亭43、普勞特亭44、6,7-二甲氧基-3‘,4’-45、阿曼讬黃素46、西阿多黃素47、破故紙素甲醚次甲二氧基異黃酮
實(shí)驗(yàn)部分48、5-羥基-7,4‘-49、里柯亭50、阿奇白芷黃素51、黃杉甲素-5-甲醚二甲氧基二氫黃酮52、黃杉甲素-7,4‘-二甲醚53、黃杉甲素三甲醚54、6,7,3’,4‘-55、高圣草素四甲氧基二氫黃酮56、紫鉚素-3-氧-葡萄糖苷57、5,7-二羥基-8-甲氧基二氫黃酮58、赤楊素59、雪松素
60、安哥杜鵑素61、環(huán)廣豆根素62、廣豆根素
實(shí)驗(yàn)部分63、二氫異鼠李素64、阿柯里寧A65、2'-羥基查耳酮66、廣豆根酮
67、環(huán)廣豆根酮
68、3‘-羥基橙酮69、4-羥基橙酮
實(shí)驗(yàn)部分樣本集(69個(gè))訓(xùn)練集(其余57個(gè))測(cè)試集(12個(gè))={1,7,14,18,24,29,36,42,48,54,60,66}MOPAC分子結(jié)構(gòu)和數(shù)據(jù)的獲得
ChemDrawCODESSAHyperChemProfessional
實(shí)驗(yàn)部分MLR模型的建立
本文中我們采用CODESSA軟件來建立線性關(guān)系模型。采用啟發(fā)式回歸方法,總共計(jì)算了381個(gè)描述符,經(jīng)過篩選后還剩97個(gè)描述符,最后篩選至6個(gè)描述符。
實(shí)驗(yàn)部分RBFNN模型的建立
本次實(shí)驗(yàn)中我們選擇用MATLAB來建立RBFNN模型,采用的是其中的徑向基神經(jīng)網(wǎng)絡(luò)(RBFNN),用線性模型中的6個(gè)分子描述符建立了RBFNN的非線性模型。在建模過程中,為了獲得更好的結(jié)果,我們最優(yōu)化了影響模型結(jié)果的參數(shù)。
實(shí)驗(yàn)部分交互檢驗(yàn)
實(shí)驗(yàn)部分樣本集分組:A={1,7,14,18,24,29,36,42,48,54,60,66}B={2,8,13,19,25,30,37,43,49,55,61,67}C={3,9,15,20,26,31,38,44,50,56,62,68}D={4,10,16,21,27,32,39,45,51,57,63}E={5,11,17,22,28,33,40,46,52,58,64}F={6,12,23,34,35,41,47,53,59,65,69}
交互檢驗(yàn)計(jì)算包括線性模型改換六組不同測(cè)試集時(shí)訓(xùn)練集和測(cè)試集分別對(duì)應(yīng)的R2、RMS、F-檢驗(yàn)值,以及非線性模型中相對(duì)應(yīng)的這三類數(shù)值。MLR模型結(jié)果
DescriptorsCoefficientsStandardErrort-testIntercept6.20E+022.83E+0121.92Numberofrings-2.50E+011.18E+00-21.09Avgnucleoph.react.indexforaOatom-9.39E+031.04E+03-9.06Maxelectroph.react.indexforaCatom-2.62E+031.96E+02-13.401XGAMMApolarizability(DIP)3.59E-043.00E-0511.92Avg1-electronreact.indexforaCatom4.50E+045.71E+037.87Totmolecular2-centerexchangeenergy/#ofatoms2.65E+014.54E+005.83R2=0.96F=207.83s2=42.96
結(jié)果部分描述符含義變化趨勢(shì)λmax變化趨勢(shì)NR分子中所包含的環(huán)數(shù)↑↓ANRIOA氧原子的親核反應(yīng)指數(shù)的平均值↑↓MERICA分子中碳原子親電反應(yīng)指數(shù)的極大值↑↓GAMMAP1X軸γ方向分子的極化度↑↑AERICA分子中碳原子對(duì)1-電子親電反應(yīng)指數(shù)的平均值↑↑TMEE分子中二級(jí)中心原子交換能量的總和↑↑
結(jié)果部分
MLR模型結(jié)果
結(jié)果部分
RBFNN模型結(jié)果
在建立了線性模型后,以相同的描述符作為RBFNNs的輸入建立了非線性模型。為了得到好的結(jié)果,優(yōu)化了影響RBFNNs的參數(shù)。最佳的半徑選擇是通過在訓(xùn)練過程中系統(tǒng)改變它的值實(shí)現(xiàn)的。對(duì)于本數(shù)據(jù)集最佳的半徑值是3.6,相應(yīng)的隱含層結(jié)點(diǎn)數(shù)是20。
結(jié)果部分
RBFNN模型結(jié)果
結(jié)果部分
結(jié)果部分
結(jié)果部分
結(jié)果部分
結(jié)果部分兩個(gè)模型的統(tǒng)計(jì)參數(shù)
MLRRBFNNForthetrainingsetForthetestsetForthetrainingsetForthetestsetR20.96140.96700.97080.9781F207.8250293.21801823.7420447.8660RMS6.55477.17635.34945.7219
從上表可以看出,RBFNN模型的結(jié)果中無論是訓(xùn)練集還是測(cè)試集,R2都略高于MLR模型。
結(jié)果部分交互檢驗(yàn)結(jié)果(MLR)HM訓(xùn)練集測(cè)試集訓(xùn)練集測(cè)試集R2RMSCVFR2RMSFA+B+C+D+EF0.9666.465238.3450.9447.503150.382A+B+C+D+FE0.9636.995219.6320.9574.761201.644A+B+C+E+FD0.9666.515243.7050.9457.203153.913A+B+D+E+FC0.9666.604234.3470.9377.190147.577A+C+D+E+FB0.9596.720192.3320.9776.620428.929B+C+D+E+FA0.9616.555207.8250.9677.176293.218
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 汽車文化課件 第一章 汽車發(fā)展史 第三節(jié) 汽車外觀的發(fā)展
- 山東省煙臺(tái)市蓬萊區(qū)2025-2026學(xué)年魯教版(五四制)七年級(jí)上冊(cè)數(shù)學(xué)期末模擬試卷(含答案)
- 2025-2026學(xué)年廣東省深圳市坪山區(qū)九年級(jí)(上)期末數(shù)學(xué)試卷(含答案)
- 鋼結(jié)構(gòu)數(shù)字化制造技術(shù)要點(diǎn)
- 飛機(jī)維護(hù)技術(shù)基礎(chǔ)
- 特殊食品管理辦法
- 2026甘肅酒泉藝術(shù)職業(yè)高級(jí)中學(xué)招聘1人備考考試試題及答案解析
- 2026福建廈門市海員培訓(xùn)中心教學(xué)人員選聘1人參考考試題庫及答案解析
- 2026江蘇南京市氣象部門招聘高層次人才2人筆試參考題庫及答案解析
- 飛機(jī)小知識(shí)課件
- 被動(dòng)關(guān)節(jié)活動(dòng)訓(xùn)練
- GB/T 5781-2025緊固件六角頭螺栓全螺紋C級(jí)
- 教師心理素養(yǎng)對(duì)學(xué)生心理健康的影響研究-洞察及研究
- DGTJ08-10-2022 城鎮(zhèn)天然氣管道工程技術(shù)標(biāo)準(zhǔn)
- 公路工程質(zhì)量管理制度范本
- 廣東省廣州市八區(qū)聯(lián)考2025-2026學(xué)年生物高二上期末調(diào)研試題含解析
- 《中國臨床腫瘤學(xué)會(huì)(csco)小細(xì)胞肺癌診療指南(2025版)》
- 醫(yī)院醫(yī)療糾紛案例匯報(bào)
- 重癥醫(yī)學(xué)科進(jìn)修匯報(bào)
- 2025年基金會(huì)招聘筆試本科院校沖刺題庫
- 2025年高校行政管理崗位招聘面試指南與模擬題
評(píng)論
0/150
提交評(píng)論