基于深度学习对化合物与蛋白质相互作用分类的研究
发布时间:2020-08-04 16:17
【摘要】:化合物和蛋白质相互作用的识别在网络药理学和药物发现中有着非常重要的作用,但是传统的生化实验方法既耗时又昂贵。随着计算机软件技术的迅猛发展,利用计算机软件模拟生化实验的方法成为可能,这种方法比传统的生化实验方法速度更快并且也更加便宜,因此计算方法开始流行起来。然而,计算方法要求研究者有浓厚的化学方面的背景知识并且准确率并不高,例如分子对接技术,一种研究化合物和蛋白质间结合模式和亲和力的理论模拟方法,就需要对化合物和蛋白质的结构有深刻的认识。近年来,机器学习技术在日常生活中的应用越来越广泛,如人脸识别、机器翻译、无人驾驶。这些应用中都使用了一种被称为深度学习的技术。由于深度学习可以自动提取特征,不需要研究者有相关的背景知识,入门门槛低,并且其学习能力强大,在许多任务上都取得了比传统机器学习技术更高的准确率,因此深度学习已经在计算机视觉、语音识别和自然语言处理方面取得了巨大的成功。同时,深度学习在医学、化学和生物学中的应用也逐渐发展起来。本文以BindingDB中化合物与蛋白质相互作用的数据作为依据,并使用SDF(Structure Data File)和蛋白质序列表示化合物和蛋白质的结构。然后利用随机生成算法生成与正样本数量相同的负样本,并使用深度学习中的深度神经网络学习训练数据。深度神经网络的输入为化合物和蛋白质的结构数据,输出为化合物与蛋白质相互作用为绑定的概率。经过大量的实验调整超参数,最终的深度神经网络的结构为多路网络。多路网络分为特征提取网络和分类网络。其中特征提取网络分别提取化合物和蛋白质的特征,其隐藏层有3层,每层2000个神经元;分类网络基于特征提取网络提取到的特征对化合物和蛋白质的相互作用进行分类,其隐藏层为1层,有1000个神经元。多路网络的参数数量达到了2720万,最终可以达到96.73%的测试准确率。本文将深度学习技术引入化合物与蛋白质相互作用分类的研究中。虽然本文所做工作并不能直接应用于实际中,但是对今后深度学习在化合物与蛋白质相互作用分类研究中的应用起到了启示性的作用。
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R91;TP181
【图文】:
大大降低了机器学习的门槛,为如今机器学习的热潮奠定了基础。深度学习是表示学习算法的一种,可以通过多个非线性模块的叠加得到原始数据的多层次的抽象特征。图2-1展示了深度学习、表示学习和机器学习的关系。2.2.3 深度学习的历史神经网络已经经历了几十年的发展,其中不乏高潮与低谷,最近才因为“深度学习”这个新名称重新被人们认识。神经网络的初衷是模拟生物大脑,但是由于对生物大脑的理解还远远不够,所以那时神经网络还十分简单,只是在简单的线性模型上增加了些功能。神经网络的第一次兴起主要是因为生物学习理论的发展[28-29]以及感知机[30]的出现。感知机是那时最为著名的模型,感知机通过在线性模型之上增加一个符号函数将其变为分类模型,通常线性模型的输出大于 0 则将其预测为正类,小于0 则将其预测为负类,等于 0 则随机选择一个类别。感知机算法影响了许多后来的机器学习算法
生物神经元与人造神经元结构示意图
人工神经网络学习流程图
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R91;TP181
【图文】:
大大降低了机器学习的门槛,为如今机器学习的热潮奠定了基础。深度学习是表示学习算法的一种,可以通过多个非线性模块的叠加得到原始数据的多层次的抽象特征。图2-1展示了深度学习、表示学习和机器学习的关系。2.2.3 深度学习的历史神经网络已经经历了几十年的发展,其中不乏高潮与低谷,最近才因为“深度学习”这个新名称重新被人们认识。神经网络的初衷是模拟生物大脑,但是由于对生物大脑的理解还远远不够,所以那时神经网络还十分简单,只是在简单的线性模型上增加了些功能。神经网络的第一次兴起主要是因为生物学习理论的发展[28-29]以及感知机[30]的出现。感知机是那时最为著名的模型,感知机通过在线性模型之上增加一个符号函数将其变为分类模型,通常线性模型的输出大于 0 则将其预测为正类,小于0 则将其预测为负类,等于 0 则随机选择一个类别。感知机算法影响了许多后来的机器学习算法
生物神经元与人造神经元结构示意图
人工神经网络学习流程图
【相似文献】
相关期刊论文 前10条
1 王建;;蛋白质相互作用数据库[J];中国生物化学与分子生物学报;2017年08期
2 陈心浩;胡俭;;基于多特征融合预测蛋白质相互作用界面[J];中南民族大学学报(自然科学版);2017年03期
3 谭从娥;黄祥云;;基于蛋白质相互作用网络分析右归丸治疗肾阳虚证的疗效机制[J];中国中医药信息杂志;2016年02期
4 杨晓敏;李英伦;;基于蛋白质相互作用“热点”区域的小分子药物设计研究进展[J];生物物理学报;2015年02期
5 冯舒s
本文编号:2780788
本文链接:https://www.wllwen.com/yixuelunwen/yiyaoxuelunwen/2780788.html
最近更新
教材专著