当前位置:主页 > 医学论文 > 药学论文 >

基于机器学习的虚拟筛选效率对比研究

发布时间:2020-03-21 10:18
【摘要】:药物设计是一个耗时且昂贵的过程,提高药物的筛选效率能够为药物设计提供早期的小分子筛选作用,具有重要科学价值。鉴于药物设计中的巨大搜索空间,随着人工智能技术的发展,机器学习已经成为预测小分子药物与靶向蛋白质之间亲和力的有效方法。然而,各种机器学习算法包括大量的参数和各种各样的模型,使得预测框架的选择非常困难。在这项工作中,本文探究了针对不同机器学习算法的参数优化来进行虚拟筛选,传统的机器学习算法以决策树为例,选择了XGBoost框架和LightGBM框架;深度学习算法则构建了多层感知器和卷积神经网络模型。在参数优化之后,对决策树算法和深度学习算法的RMSE值和R2值进行了比较与评估,对于本次实验所得到的结果是在虚拟筛选方面决策树比神经网络更有效。这是因为在具有约160000个样本的特定药物筛选问题的亲和力预测中,深度学习算法可能比决策树算法更容易过拟合。最后,可以得到先进的机器学习方法可以提取比传统的虚拟筛选方法更准确的蛋白质-小分子结合信息,提高药物设计的筛选效率可达200~1000倍。
【图文】:

模型图,决策树,模型,过拟合


逦’逡逑划分子节点,所测试的实例在每处节点与该节点的属性进行比较,根据比较结果进行相逡逑应子节点的选择,重复该过程直到最终结论。如图2-1所示是一个决策树,其中X,邋Y,逡逑Z表示属性名称,,x,邋y,邋z分别表示X,Y,邋Z的不同取值,如果一个实例的属性X,邋Y逡逑的取值分别为xl,邋y2,那么该实例则是第2类,其它属性以此类推。在决策树构建的过逡逑程中很容易产生过拟合,为了防止过拟合的产生,一般会设定停止阈值,当信息熵或信逡逑息增益低于该阈值时,会停止创建分支,这种减小过拟合的方法叫做剪枝。逡逑: 」L__j逡逑,\逡逑yl/邋'邋y2逦zl逦z2逡逑O逦::)逦0逦3逡逑图2-1决策树模型逡逑7逡逑

多层感知器


在输入层和输出层之间添加了隐藏层,通常使用反向传播(Backpropagation邋)算法[ ̄]进逡逑行训练,这样解决了感知器无法处理线性不可分的问题。MLP是一种前向人工神经网络,逡逑也叫做全连接神经网络,如图2-2所示。逡逑;::v0逡逑输入层邋隐藏层邋输出层逡逑图2-2多层感知器逡逑MLP包含三种节点,输入节点:或叫做输入层,是用来输入数据的节点,在此节点处逡逑11逡逑
【学位授予单位】:中央民族大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R91;TP181

【相似文献】

相关期刊论文 前10条

1 张媛;刘雨桐;李达;宋新蕊;周雪松;赵勇;;反向虚拟筛选平台及应用[J];生物信息学;2015年04期

2 李悦青;黄雅俊;赵伟杰;王希诚;;氮杂

本文编号:2593188


资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyaoxuelunwen/2593188.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d1c73***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com