当前位置:主页 > 医学论文 > 药学论文 >

机器学习法和分子对接法筛选BRD4抑制剂

发布时间:2021-11-08 13:58
  目的采用分子指纹和分子对接法筛选BRD4抑制剂。方法采用1181个IC50值跨度从0.7~8.354×106nmol·L-1的BRD4抑制剂小分子作为训练集和测试集构建机器学习法的二元分类模型,利用ROC曲线,Sensitivity、Specificity和Accuracy值对二元分类模型进行评估;然后联合分子对接法筛选天然化合物库。结果用机器学习法构建的二元分类模型都较好适用于进一步筛选化合物库,文中运用支持向量SVM筛选天然产物化合物库,根据机器学习法得到的化合物在分子对接中与蛋白具有相似的相互作用模式。结论机器学习法所构建的二元分类模型可行度较高、预测能力较强,为寻找新型小分子BRD4抑制剂奠定了基础。 

【文章来源】:华西药学杂志. 2020,35(04)CSCD

【文章页数】:4 页

【部分图文】:

机器学习法和分子对接法筛选BRD4抑制剂


BRD4数据集物理化学性质(A)与未违反五定律的数据集(B)的雷达图(违反五定律的数据集蓝色方块表示物理化学性质在五规则范围内的区域,蓝线连接过滤数据集的平均值,虚线显示标准偏差)

二维图,蛋白,化合物,机器学习


对于机器学习,首先,需要将分子转换成一系列特征描述符,文中使用RDKit计算MACCS、ECFP4、torsion、RDK5等分子指纹来表征分子。将IC50转换成pIC50,且pIC50≥6.3的化合物视为机器学习法中有活性的化合物,pIC50<6.3的化合物视为机器学习法中不具有活性的化合物[10]。研究采用了最新的机器学习方法包括RF、SVM和MLP,可以把这种预测归结为一个二元分类问题。同时,运用10折交叉验证以评估模型的泛化能力。即重复随机产生子样本的方法将样本平均分成10份,其中,9份作为训练集构建模型,一份作为测试集验证模型准确度,平均10次的结果。在药物发现领域存在着许多评估不同分类方法的准确性和等级的性能度量,文中选择了sensitivity、specificity、accuracy、ROC-curve作为评估模型质量的度量,因为它们分别具有最小化假阴性(FN)和假阳性(FP)错误的能力[11]。对于训练出的几个模型选择最优模型,是利用这些模型筛选天然化合物数据库(2.5×105个小分子),以预测新的潜在BRD4抑制剂。机器学习法分类模型根据python脚本建立,联合10折交叉验证方法高了训练集的预测精度,详细结果参见表1和图3。在BRD4的数据集上,用ECFP4表征分子时,这3个模型都表现得很好,平均AUC达到90%。随机森林模型(random forest)和支持向量机(SVM)模型性能最好。人工神经网络性能稍差的一个原因可能是数据太少,无法训练出较好的模型。图3 机器学习分类模型的ROC曲线

ROC曲线,机器学习,ROC曲线,蛋白


机器学习分类模型的ROC曲线

【参考文献】:
期刊论文
[1]基于靶蛋白共结晶药效团与分子对接的新型WEE1抑制剂的设计[J]. 和龙,罗小娇,刘新琦,温晓燕,王玲,欧阳亮,何俊.  华西药学杂志. 2020(02)
[2]藤黄酸抗肿瘤作用机制及其纳米制剂的研究进展[J]. 白皎皎,陈新棉,曾代文,汤明海,童荣生,蔡璐璐.  华西药学杂志. 2018(06)
[3]鼠尾草酚抗肿瘤活性机制的研究进展[J]. 王威,宋洋.  华西药学杂志. 2018(04)
[4]倍半萜内酯类化合物抗肿瘤作用机制的研究进展[J]. 朱华野,朴惠顺.  华西药学杂志. 2015(03)



本文编号:3483836

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyaoxuelunwen/3483836.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bd532***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com