實(shí)施指南《G B-T36700.6-2018化學(xué)品水生環(huán)境危害分類指導(dǎo)第6部分:定量結(jié)構(gòu)活性關(guān)系(QSAR)》實(shí)施指南解讀_第1頁
實(shí)施指南《G B-T36700.6-2018化學(xué)品水生環(huán)境危害分類指導(dǎo)第6部分:定量結(jié)構(gòu)活性關(guān)系(QSAR)》實(shí)施指南解讀_第2頁
實(shí)施指南《G B-T36700.6-2018化學(xué)品水生環(huán)境危害分類指導(dǎo)第6部分:定量結(jié)構(gòu)活性關(guān)系(QSAR)》實(shí)施指南解讀_第3頁
實(shí)施指南《G B-T36700.6-2018化學(xué)品水生環(huán)境危害分類指導(dǎo)第6部分:定量結(jié)構(gòu)活性關(guān)系(QSAR)》實(shí)施指南解讀_第4頁
實(shí)施指南《G B-T36700.6-2018化學(xué)品水生環(huán)境危害分類指導(dǎo)第6部分:定量結(jié)構(gòu)活性關(guān)系(QSAR)》實(shí)施指南解讀_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

—PAGE—《GB/T36700.6-2018化學(xué)品水生環(huán)境危害分類指導(dǎo)第6部分:定量結(jié)構(gòu)活性關(guān)系(QSAR)》實(shí)施指南解讀目錄一、為何說GB/T36700.6-2018是化學(xué)品水生環(huán)境危害分類的關(guān)鍵依據(jù)?專家視角剖析標(biāo)準(zhǔn)核心定位與行業(yè)價(jià)值二、定量結(jié)構(gòu)活性關(guān)系(QSAR)在該標(biāo)準(zhǔn)中如何定義與運(yùn)作?深度解析核心原理及與傳統(tǒng)測試方法的差異三、GB/T36700.6-2018對QSAR模型的構(gòu)建有哪些硬性要求?全面梳理模型開發(fā)流程與關(guān)鍵技術(shù)指標(biāo)四、如何判斷QSAR模型是否符合標(biāo)準(zhǔn)要求?專家解讀模型驗(yàn)證的核心維度與判定標(biāo)準(zhǔn)五、在化學(xué)品水生環(huán)境危害分類實(shí)踐中,QSAR模型如何具體應(yīng)用?結(jié)合案例說明操作步驟與注意事項(xiàng)六、該標(biāo)準(zhǔn)實(shí)施過程中可能遇到哪些常見疑點(diǎn)?專家答疑解惑關(guān)鍵問題與解決方案七、未來3-5年QSAR技術(shù)在化學(xué)品環(huán)境風(fēng)險(xiǎn)評估領(lǐng)域?qū)⒂泻涡纶厔荩炕跇?biāo)準(zhǔn)預(yù)測行業(yè)發(fā)展方向八、GB/T36700.6-2018與國際相關(guān)標(biāo)準(zhǔn)如何銜接?深度剖析國內(nèi)外標(biāo)準(zhǔn)差異與協(xié)同應(yīng)用策略九、企業(yè)如何依據(jù)該標(biāo)準(zhǔn)建立內(nèi)部QSAR應(yīng)用體系?指導(dǎo)性強(qiáng)的實(shí)施路徑與資源配置建議十、該標(biāo)準(zhǔn)實(shí)施后對化學(xué)品行業(yè)監(jiān)管與創(chuàng)新有何影響?熱點(diǎn)分析標(biāo)準(zhǔn)帶來的機(jī)遇與挑戰(zhàn)一、為何說GB/T36700.6-2018是化學(xué)品水生環(huán)境危害分類的關(guān)鍵依據(jù)?專家視角剖析標(biāo)準(zhǔn)核心定位與行業(yè)價(jià)值(一)該標(biāo)準(zhǔn)在化學(xué)品環(huán)境管理體系中處于何種核心地位?從我國化學(xué)品環(huán)境管理整體框架來看,GB/T36700.6-2018是化學(xué)品水生環(huán)境危害分類體系的重要組成部分。在當(dāng)前對化學(xué)品環(huán)境風(fēng)險(xiǎn)管控日益嚴(yán)格的背景下,水生環(huán)境作為化學(xué)品暴露的關(guān)鍵受體,其危害分類的科學(xué)性直接影響后續(xù)風(fēng)險(xiǎn)評估與管控措施的制定。該標(biāo)準(zhǔn)專門針對定量結(jié)構(gòu)活性關(guān)系(QSAR)這一高效工具進(jìn)行規(guī)范,填補(bǔ)了傳統(tǒng)實(shí)驗(yàn)測試方法在大規(guī)?;瘜W(xué)品篩查中的不足,成為連接化學(xué)品結(jié)構(gòu)信息與水生環(huán)境危害特性的關(guān)鍵橋梁,為化學(xué)品環(huán)境管理提供了精準(zhǔn)、高效的技術(shù)支撐,是實(shí)現(xiàn)化學(xué)品全生命周期環(huán)境風(fēng)險(xiǎn)管控的重要基礎(chǔ)。(二)相較于其他相關(guān)標(biāo)準(zhǔn),該標(biāo)準(zhǔn)的獨(dú)特行業(yè)價(jià)值體現(xiàn)在哪里?與其他化學(xué)品環(huán)境危害分類相關(guān)標(biāo)準(zhǔn)相比,GB/T36700.6-2018的獨(dú)特價(jià)值主要體現(xiàn)在技術(shù)手段的創(chuàng)新性與應(yīng)用的高效性上。傳統(tǒng)標(biāo)準(zhǔn)多依賴實(shí)驗(yàn)測試獲取化學(xué)品危害數(shù)據(jù),不僅成本高、周期長,還存在實(shí)驗(yàn)動(dòng)物倫理問題,且難以覆蓋大量現(xiàn)有及新興化學(xué)品。而該標(biāo)準(zhǔn)引入QSAR技術(shù),通過挖掘化學(xué)品結(jié)構(gòu)與水生環(huán)境危害活性之間的內(nèi)在關(guān)聯(lián),可快速預(yù)測化學(xué)品的危害特性,大幅降低測試成本與時(shí)間成本。同時(shí),標(biāo)準(zhǔn)對QSAR應(yīng)用的規(guī)范,確保了預(yù)測結(jié)果的可靠性與可比性,為行業(yè)開展大規(guī)?;瘜W(xué)品水生環(huán)境危害篩查、優(yōu)先控制化學(xué)品篩選等工作提供了統(tǒng)一的技術(shù)依據(jù),推動(dòng)了化學(xué)品環(huán)境風(fēng)險(xiǎn)評估工作的高效開展。(三)該標(biāo)準(zhǔn)的實(shí)施對保障水生生態(tài)環(huán)境安全有何直接作用?水生生態(tài)環(huán)境是生態(tài)系統(tǒng)的重要組成部分,化學(xué)品的不當(dāng)排放是導(dǎo)致水生生態(tài)破壞的重要因素之一。GB/T36700.6-2018的實(shí)施,通過規(guī)范QSAR技術(shù)在化學(xué)品水生環(huán)境危害分類中的應(yīng)用,能夠快速識別具有潛在水生環(huán)境危害的化學(xué)品。相關(guān)監(jiān)管部門可依據(jù)標(biāo)準(zhǔn)預(yù)測結(jié)果,提前對高風(fēng)險(xiǎn)化學(xué)品采取管控措施,如限制生產(chǎn)、使用或制定嚴(yán)格的排放限值,從源頭減少高危害化學(xué)品進(jìn)入水生環(huán)境。此外,企業(yè)可借助標(biāo)準(zhǔn)指導(dǎo)自身化學(xué)品研發(fā)與生產(chǎn),優(yōu)先選擇低水生環(huán)境危害的化學(xué)品結(jié)構(gòu),減少對水生生態(tài)系統(tǒng)的潛在威脅,從而直接保障水生生態(tài)環(huán)境的安全與穩(wěn)定。二、定量結(jié)構(gòu)活性關(guān)系(QSAR)在該標(biāo)準(zhǔn)中如何定義與運(yùn)作?深度解析核心原理及與傳統(tǒng)測試方法的差異(一)標(biāo)準(zhǔn)中對定量結(jié)構(gòu)活性關(guān)系(QSAR)的定義包含哪些關(guān)鍵要素?在GB/T36700.6-2018中,定量結(jié)構(gòu)活性關(guān)系(QSAR)被定義為通過分析化學(xué)品的分子結(jié)構(gòu)特征(如分子拓?fù)浣Y(jié)構(gòu)、理化性質(zhì)參數(shù)等)與該化學(xué)品在水生環(huán)境中所表現(xiàn)出的危害活性(如對水生生物的急性毒性、慢性毒性等)之間的定量關(guān)聯(lián),建立數(shù)學(xué)模型,進(jìn)而利用該模型預(yù)測未知化學(xué)品水生環(huán)境危害活性的一種方法。其定義包含三個(gè)關(guān)鍵要素:一是分子結(jié)構(gòu)特征的提取,要求所選取的結(jié)構(gòu)參數(shù)能夠準(zhǔn)確反映化學(xué)品的本質(zhì)屬性且易于量化;二是活性數(shù)據(jù)的可靠性,強(qiáng)調(diào)用于建立模型的水生環(huán)境危害活性數(shù)據(jù)需經(jīng)過規(guī)范的實(shí)驗(yàn)測試獲取,符合相關(guān)數(shù)據(jù)質(zhì)量要求;三是數(shù)學(xué)模型的有效性,要求模型具有良好的擬合度、穩(wěn)定性和預(yù)測能力,且模型的建立與驗(yàn)證過程需遵循標(biāo)準(zhǔn)化流程,確保模型結(jié)果的科學(xué)性與可信度。(二)QSAR技術(shù)在該標(biāo)準(zhǔn)框架下的運(yùn)作流程分為哪幾個(gè)核心步驟?在GB/T36700.6-2018框架下,QSAR技術(shù)的運(yùn)作流程主要分為四個(gè)核心步驟。第一步是數(shù)據(jù)收集與預(yù)處理,收集已知化學(xué)品的分子結(jié)構(gòu)信息和對應(yīng)的水生環(huán)境危害活性數(shù)據(jù),對數(shù)據(jù)進(jìn)行篩選,剔除異常值、重復(fù)值,確保數(shù)據(jù)的完整性與可靠性,同時(shí)對分子結(jié)構(gòu)進(jìn)行標(biāo)準(zhǔn)化處理,如統(tǒng)一原子編號、確定分子構(gòu)象等。第二步是分子描述符計(jì)算與篩選,根據(jù)化學(xué)品結(jié)構(gòu)特征計(jì)算多種分子描述符,如拓?fù)涿枋龇㈦娮用枋龇?、立體描述符等,再通過相關(guān)性分析、主成分分析等方法篩選出與水生環(huán)境危害活性高度相關(guān)的描述符,減少冗余信息。第三步是模型構(gòu)建,選擇合適的數(shù)學(xué)算法(如多元線性回歸、偏最小二乘回歸、人工神經(jīng)網(wǎng)絡(luò)等),利用篩選后的分子描述符與活性數(shù)據(jù)建立QSAR模型,并對模型參數(shù)進(jìn)行優(yōu)化,以提高模型的擬合效果。第四步是模型驗(yàn)證與應(yīng)用,采用內(nèi)部驗(yàn)證(如交叉驗(yàn)證)和外部驗(yàn)證(如預(yù)測集驗(yàn)證)方法評估模型的穩(wěn)定性與預(yù)測能力,驗(yàn)證合格的模型可用于預(yù)測未知化學(xué)品的水生環(huán)境危害活性,為危害分類提供依據(jù)。(三)QSAR方法與傳統(tǒng)化學(xué)品水生環(huán)境危害測試方法相比,在哪些方面存在顯著差異?QSAR方法與傳統(tǒng)化學(xué)品水生環(huán)境危害測試方法相比,存在多方面顯著差異。在測試成本方面,傳統(tǒng)測試方法需大量培養(yǎng)實(shí)驗(yàn)生物、購置實(shí)驗(yàn)設(shè)備、消耗化學(xué)試劑,且測試周期長(通常需數(shù)周至數(shù)月),成本較高;而QSAR方法僅需獲取化學(xué)品分子結(jié)構(gòu)信息,通過計(jì)算機(jī)軟件進(jìn)行計(jì)算與建模,無需實(shí)際實(shí)驗(yàn)操作,大幅降低了時(shí)間成本與經(jīng)濟(jì)成本。在測試規(guī)模方面,傳統(tǒng)測試方法一次僅能測試一種或少數(shù)幾種化學(xué)品,難以滿足大規(guī)模化學(xué)品(尤其是新興化學(xué)品)危害篩查的需求;QSAR方法可同時(shí)對大量未知化學(xué)品進(jìn)行快速預(yù)測,測試效率極高。在動(dòng)物倫理方面,傳統(tǒng)測試方法常需使用魚類、無脊椎動(dòng)物等水生生物進(jìn)行毒性測試,存在動(dòng)物倫理爭議;QSAR方法屬于非實(shí)驗(yàn)方法,無需傷害實(shí)驗(yàn)生物,符合動(dòng)物保護(hù)的發(fā)展趨勢。在數(shù)據(jù)獲取及時(shí)性方面,傳統(tǒng)測試方法受實(shí)驗(yàn)條件、實(shí)驗(yàn)周期限制,數(shù)據(jù)獲取滯后;QSAR方法可在獲取化學(xué)品分子結(jié)構(gòu)后迅速給出預(yù)測結(jié)果,能快速為化學(xué)品風(fēng)險(xiǎn)評估與管控提供數(shù)據(jù)支持。三、GB/T36700.6-2018對QSAR模型的構(gòu)建有哪些硬性要求?全面梳理模型開發(fā)流程與關(guān)鍵技術(shù)指標(biāo)(一)在數(shù)據(jù)來源與質(zhì)量控制方面,標(biāo)準(zhǔn)對QSAR模型構(gòu)建提出了哪些硬性要求?GB/T36700.6-2018在數(shù)據(jù)來源與質(zhì)量控制方面,對QSAR模型構(gòu)建提出了嚴(yán)格的硬性要求。在數(shù)據(jù)來源上,標(biāo)準(zhǔn)明確規(guī)定用于模型構(gòu)建的化學(xué)品水生環(huán)境危害活性數(shù)據(jù),優(yōu)先采用符合國際或國內(nèi)標(biāo)準(zhǔn)實(shí)驗(yàn)方法(如OECD測試指南、GB/T系列測試標(biāo)準(zhǔn))獲取的實(shí)驗(yàn)數(shù)據(jù),且數(shù)據(jù)需來自具有資質(zhì)的實(shí)驗(yàn)室或權(quán)威數(shù)據(jù)庫,確保數(shù)據(jù)的溯源性與可靠性。對于無法獲取實(shí)驗(yàn)數(shù)據(jù)的情況,可采用經(jīng)同行評審認(rèn)可的文獻(xiàn)數(shù)據(jù),但需對文獻(xiàn)數(shù)據(jù)的實(shí)驗(yàn)條件、數(shù)據(jù)完整性進(jìn)行嚴(yán)格核查。在質(zhì)量控制方面,標(biāo)準(zhǔn)要求對收集到的數(shù)據(jù)進(jìn)行系統(tǒng)性評估,包括數(shù)據(jù)完整性(如是否包含劑量-效應(yīng)關(guān)系、測試生物種類等關(guān)鍵信息)、準(zhǔn)確性(如重復(fù)實(shí)驗(yàn)數(shù)據(jù)的一致性)、一致性(如不同實(shí)驗(yàn)室針對同一化學(xué)品測試結(jié)果的偏差程度)。同時(shí),需剔除因?qū)嶒?yàn)設(shè)計(jì)缺陷、操作失誤等導(dǎo)致的異常數(shù)據(jù),對于數(shù)據(jù)缺失情況,需采用科學(xué)合理的方法進(jìn)行補(bǔ)充或說明,確保用于建模的數(shù)據(jù)具有較高的質(zhì)量,為模型的可靠性奠定基礎(chǔ)。(二)標(biāo)準(zhǔn)規(guī)定的QSAR模型開發(fā)流程中,分子描述符的選擇需遵循哪些關(guān)鍵原則?在GB/T36700.6-2018規(guī)定的QSAR模型開發(fā)流程中,分子描述符的選擇是至關(guān)重要的環(huán)節(jié),需遵循以下關(guān)鍵原則。一是相關(guān)性原則,所選分子描述符必須與化學(xué)品的水生環(huán)境危害活性具有明確的化學(xué)或生物學(xué)意義上的關(guān)聯(lián),能夠從分子水平解釋化學(xué)品與水生生物相互作用的機(jī)制,避免選擇與活性無實(shí)質(zhì)關(guān)聯(lián)的描述符。例如,對于化學(xué)品的急性毒性,可選擇與化學(xué)品脂溶性(如logP)、分子大小(如分子質(zhì)量)、電子效應(yīng)(如分子最高占據(jù)軌道能量)相關(guān)的描述符。二是可解釋性原則,分子描述符應(yīng)具有清晰的物理化學(xué)意義,其與活性之間的關(guān)聯(lián)能夠通過化學(xué)或毒理學(xué)理論進(jìn)行解釋,便于模型使用者理解模型的內(nèi)在邏輯,提高模型的可信度。三是獨(dú)立性原則,所選分子描述符之間應(yīng)盡量避免高度相關(guān)性,減少多重共線性問題對模型穩(wěn)定性和預(yù)測能力的影響??赏ㄟ^計(jì)算描述符之間的相關(guān)系數(shù)、進(jìn)行主成分分析等方法,篩選出相互獨(dú)立或低相關(guān)的描述符。四是可獲得性原則,分子描述符應(yīng)能夠通過現(xiàn)有成熟的計(jì)算機(jī)軟件(如Dragon、MOE等)基于化學(xué)品的分子結(jié)構(gòu)準(zhǔn)確計(jì)算得到,且計(jì)算方法簡單、可重復(fù),確保不同使用者能夠獲得一致的描述符數(shù)值。(三)針對QSAR模型的數(shù)學(xué)算法選擇,標(biāo)準(zhǔn)提出了哪些技術(shù)指標(biāo)要求?GB/T36700.6-2018針對QSAR模型的數(shù)學(xué)算法選擇,提出了明確的技術(shù)指標(biāo)要求,以確保模型的科學(xué)性與有效性。首先,在模型擬合度方面,標(biāo)準(zhǔn)要求對于線性模型,可采用決定系數(shù)(R2)作為評價(jià)指標(biāo),通常要求R2值不低于0.6(具體數(shù)值需根據(jù)模型應(yīng)用場景和數(shù)據(jù)特點(diǎn)調(diào)整),以表明模型能夠較好地解釋化學(xué)品結(jié)構(gòu)與活性之間的線性關(guān)系;對于非線性模型,可采用調(diào)整決定系數(shù)(Radj2)、均方根誤差(RMSE)等指標(biāo),確保模型對訓(xùn)練集數(shù)據(jù)具有良好的擬合效果。其次,在模型穩(wěn)定性方面,標(biāo)準(zhǔn)強(qiáng)調(diào)需通過交叉驗(yàn)證(如k折交叉驗(yàn)證)評估模型的穩(wěn)定性,要求交叉驗(yàn)證決定系數(shù)(Q2)不低于0.5,且交叉驗(yàn)證過程中模型參數(shù)的波動(dòng)范圍應(yīng)在可接受范圍內(nèi),避免模型因數(shù)據(jù)微小變化而產(chǎn)生較大的預(yù)測偏差。最后,在模型預(yù)測能力方面,標(biāo)準(zhǔn)要求必須采用獨(dú)立的外部驗(yàn)證集對模型進(jìn)行評估,外部驗(yàn)證決定系數(shù)(Qext2)通常要求不低于0.5,同時(shí)要求預(yù)測集化合物的預(yù)測值與實(shí)際觀測值之間的相對誤差控制在合理范圍內(nèi)(如多數(shù)化合物相對誤差小于30%),以確保模型能夠準(zhǔn)確預(yù)測未知化學(xué)品的水生環(huán)境危害活性。此外,標(biāo)準(zhǔn)還要求對所選擇的數(shù)學(xué)算法進(jìn)行詳細(xì)描述,包括算法原理、參數(shù)設(shè)置等,確保模型的可重復(fù)性。四、如何判斷QSAR模型是否符合標(biāo)準(zhǔn)要求?專家解讀模型驗(yàn)證的核心維度與判定標(biāo)準(zhǔn)(一)模型內(nèi)部驗(yàn)證是判斷模型符合標(biāo)準(zhǔn)的首要環(huán)節(jié),其核心維度與判定標(biāo)準(zhǔn)是什么?模型內(nèi)部驗(yàn)證作為判斷QSAR模型是否符合GB/T36700.6-2018要求的首要環(huán)節(jié),核心維度主要包括模型的擬合穩(wěn)定性、參數(shù)可靠性和數(shù)據(jù)代表性,且有明確的判定標(biāo)準(zhǔn)。在擬合穩(wěn)定性維度,常用k折交叉驗(yàn)證(如5折、10折交叉驗(yàn)證)方法,通過將訓(xùn)練集數(shù)據(jù)隨機(jī)分為k個(gè)子集,依次用k-1個(gè)子集作為訓(xùn)練集、1個(gè)子集作為驗(yàn)證集構(gòu)建模型并計(jì)算預(yù)測誤差,最終以交叉驗(yàn)證決定系數(shù)(Q2)作為評價(jià)指標(biāo)。標(biāo)準(zhǔn)判定要求Q2值不低于0.5,若Q2<0.5,表明模型對訓(xùn)練集數(shù)據(jù)的擬合穩(wěn)定性較差,無法有效捕捉數(shù)據(jù)內(nèi)部的規(guī)律。在參數(shù)可靠性維度,針對線性回歸模型,需評估回歸系數(shù)的顯著性(如通過t檢驗(yàn))和標(biāo)準(zhǔn)誤差,要求回歸系數(shù)的t檢驗(yàn)P值小于0.05,且標(biāo)準(zhǔn)誤差較小,確保模型參數(shù)具有統(tǒng)計(jì)學(xué)意義,并非由隨機(jī)因素導(dǎo)致。在數(shù)據(jù)代表性維度,需檢查訓(xùn)練集數(shù)據(jù)是否覆蓋了模型適用范圍內(nèi)的化學(xué)品結(jié)構(gòu)多樣性和活性范圍,可通過計(jì)算訓(xùn)練集化合物的分子描述符分布范圍、活性值分布情況進(jìn)行判斷,若訓(xùn)練集數(shù)據(jù)過于集中,無法代表目標(biāo)化學(xué)品群體的特征,則判定模型不符合標(biāo)準(zhǔn)要求,需補(bǔ)充更多樣化的數(shù)據(jù)。(二)外部驗(yàn)證在模型符合性判斷中起到何種關(guān)鍵作用?其核心判定指標(biāo)與標(biāo)準(zhǔn)閾值是多少?外部驗(yàn)證在GB/T36700.6-2018規(guī)定的QSAR模型符合性判斷中,起著至關(guān)重要的“實(shí)戰(zhàn)檢驗(yàn)”作用,是評估模型預(yù)測能力的核心環(huán)節(jié),直接決定模型能否用于未知化學(xué)品的水生環(huán)境危害預(yù)測。相較于內(nèi)部驗(yàn)證僅針對訓(xùn)練集數(shù)據(jù)的“自我檢驗(yàn)”,外部驗(yàn)證采用與訓(xùn)練集無交集的獨(dú)立外部驗(yàn)證集(驗(yàn)證集化合物結(jié)構(gòu)和活性數(shù)據(jù)均未參與模型構(gòu)建),能夠真實(shí)反映模型對未知化合物的預(yù)測性能,避免模型出現(xiàn)“過擬合”(僅在訓(xùn)練集上表現(xiàn)良好,對新數(shù)據(jù)預(yù)測誤差大)的問題。其核心判定指標(biāo)主要包括外部驗(yàn)證決定系數(shù)(Qext2)、預(yù)測值與實(shí)測值的平均絕對誤差(MAE)和相對誤差(RE)。根據(jù)標(biāo)準(zhǔn)要求,Qext2是首要判定指標(biāo),標(biāo)準(zhǔn)閾值為不低于0.5,若Qext2≥0.5,表明模型具有較好的外部預(yù)測能力;同時(shí),要求驗(yàn)證集中至少80%的化合物,其預(yù)測值與實(shí)測值的相對誤差(RE)小于30%,平均絕對誤差(MAE)需控制在該類化學(xué)品活性測試方法允許的誤差范圍內(nèi)(如對于急性毒性數(shù)據(jù),MAE通常要求小于0.5log單位)。只有同時(shí)滿足上述指標(biāo)要求,才能判定模型通過外部驗(yàn)證,符合標(biāo)準(zhǔn)對預(yù)測能力的要求。(三)除內(nèi)部與外部驗(yàn)證外,模型的適用性域評估也是重要環(huán)節(jié),標(biāo)準(zhǔn)對此有哪些具體要求?除內(nèi)部與外部驗(yàn)證外,GB/T36700.6-2018明確將模型的適用性域(AD)評估作為判斷模型符合性的重要環(huán)節(jié),旨在界定模型能夠可靠預(yù)測的化學(xué)品范圍,避免將模型應(yīng)用于超出其能力范圍的化合物而導(dǎo)致錯(cuò)誤預(yù)測。標(biāo)準(zhǔn)對此提出了具體要求。在適用性域定義方法上,標(biāo)準(zhǔn)推薦采用基于分子描述符的方法(如歐氏距離法、leverage值法)或基于結(jié)構(gòu)相似性的方法(如Tanimoto系數(shù)法)來界定適用性域。例如,采用leverage值法時(shí),需計(jì)算每個(gè)化合物的leverage值(衡量化合物在訓(xùn)練集中的影響力),并設(shè)定leverage閾值(通常為3(p+1)/n,其中p為分子描述符數(shù)量,n為訓(xùn)練集化合物數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論