基于深度学习的小分子虚拟筛选和反应产率预测
发布时间:2020-06-05 03:56
【摘要】:药物研发是一项复杂的工程,为了得到疗效可靠且性质合理的药物,需要进行大量的实验,浪费大量的人力物力财力。与此相同,在有机合成中,为了得到目标化合物或者找到高产率的反应条件,也需要进行不断地尝试。从经济环保高效的角度出发,构建各种可靠的计算模型,实现数据驱动的药物设计和有机合成是至关重要的。深度学习作为一种机器学习表征算法,使用包含多层非线性处理单元的神经网络来学习数据表征,通过反向传播算法来指示机器应如何更改其内部参数发现数据集中的复杂结构。深度学习有多种框架,被广泛用于语音识别、视觉识别和自然语言处理等领域,并取得了极佳的效果。由于各种组学和生物学数据的积累,深度学习模型已经在药物设计的各个领域崭露头角,并且在某些领域的表现要优于简单的机器学习模型。除了药物设计外,深度学习模型凭借其强大的学习表征和数据处理能力,在逆合成路线和反应产物预测等有机合成相关问题上也有出色的表现。本论文的第一章介绍了机器学习的发展历史及常用算法,深度学习模型的常见框架及训练过程,并重点介绍了深度学习方法在药物设计和有机合成某些领域的具体应用实例。第二章首先介绍了靶点ZAK(sterile alpha motif and leucine zipper containing kinase)相关的生物学背景,指出其是治疗心血管疾病及某些癌症的重要靶标,但目前没有专门针对ZAK的小分子抑制剂类药物上市。然后介绍了ZAK的晶体结构,分析复合物中配体和ZAK的结合模式,收集其他激酶选择性差的ZAK交叉活性小分子与其晶体结构对接,指出使用传统的基于结构的药物设计方法进行ZAK小分子的虚拟筛选存在高假阳性的风险。为了提高虚拟筛选的富集率,我们发展了基于深度学习的预测模型,将深度学习分类模型与分子对接相结合用于ZAK小分子抑制剂的虚拟筛选中。而且为了得到对ZAK有选择性的小分子,我们在挑选过程中还引入激酶谱预测模型,联合使用上述方法,我们成功找到了骨架结构新颖并具有选择性的ZAK小分子抑制剂。在第三章,我们论述了深度学习在有机化学反应产率预测中的应用。我们在文献中收集高质量的Suzuki-Miyaura反应数据,并应用量化软件计算了反应物和催化剂的性质。用反应物和催化剂的量化性质和反应时间、反应温度、催化剂用量三个反应条件作为模型的输入,构建了深度神经网络回归模型来预测Suzuki-Miyaura的反应产率,经过超参优化,确定最优模型。最优模型不仅在模建反应数据上有良好的表现,还可以为未见过的新反应预测产率。除了预测反应产率外,我们的模型还可以根据预测的产率为反应确定高产率的反应条件,所有结果都得到了实验证实。综上所述,本文以深度学习为基本手段,并将其成功应用到的两个具体且有意义的课题中。我们发展的基于深度学习的方法不仅可以使我们的课题取得良好的结果,同样适用于其他相似的体系,充分肯定了深度学习是推动药物设计和有机合成实现数据驱动发展的重要力量。
【图文】:
展现了深度学习的强大,也使得更多的研究者开始关注深度学习。深度神经网络以人工神经网络为基本架构,但又有多种不同的框架(图1.1)。其中多层感知机(multiplayer perceptron, MLP)的结构比较简单,层与层之间全连接,很容易实现;卷积神经网络(convolutionalneuralnetworks,CNN)包含卷积层和池化层可以对输入数据进行卷积处理。不仅如此,后面一般还会连接一个全连接层,利用提取到的特征来模拟输出结果20(图1.1A)。卷积神经网络擅长处理多数组形式的数据,,在图像及某些信号识别方面有卓越表现21-22。递归神经网络(recurrentneuralnetworks,RNN)一次处理一个元素的输入序列,可在隐藏单元中保持其状态向量,而该状态向量包含了关于序列的所有过去元素的历史信息,也就是说递归神经网络有一定记忆能力20(图1.1B)。随着递归神经网络架构及训练方法的发展23-24
过度表达会激活 ERK、JNK 和 p38,并促进细胞型 ZAK-α 和 ZAK-β 都是 ERK 通路调控结肠癌细癌病人体内,ZAK 两种亚型的转录和蛋白质水K 研究的深入,关于 ZAK 在其他癌症细胞内发-Feng Dou 等人79发现在肝癌细胞内存在一种促进肝癌的发生。URHC 在肝癌细胞内高度表达细胞增殖、抑制凋亡的作用是通过抑制 ZAK 的细胞内也发现,过度表达的 ZAK 通过激活 ER增殖80。更有文献指出,一些 BRAF 激酶的抑制达拉菲尼等,在临床应用中会造成皮肤鳞状细胞K 存在密切联系82-83。虽然 ZAK 在不同的癌症作用,但也不可否认它的生理重要性。综上,Z化等心血管疾病及结肠癌等癌症的重要靶标。
【学位授予单位】:中国科学院大学(中国科学院上海药物研究所)
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R91
【图文】:
展现了深度学习的强大,也使得更多的研究者开始关注深度学习。深度神经网络以人工神经网络为基本架构,但又有多种不同的框架(图1.1)。其中多层感知机(multiplayer perceptron, MLP)的结构比较简单,层与层之间全连接,很容易实现;卷积神经网络(convolutionalneuralnetworks,CNN)包含卷积层和池化层可以对输入数据进行卷积处理。不仅如此,后面一般还会连接一个全连接层,利用提取到的特征来模拟输出结果20(图1.1A)。卷积神经网络擅长处理多数组形式的数据,,在图像及某些信号识别方面有卓越表现21-22。递归神经网络(recurrentneuralnetworks,RNN)一次处理一个元素的输入序列,可在隐藏单元中保持其状态向量,而该状态向量包含了关于序列的所有过去元素的历史信息,也就是说递归神经网络有一定记忆能力20(图1.1B)。随着递归神经网络架构及训练方法的发展23-24
过度表达会激活 ERK、JNK 和 p38,并促进细胞型 ZAK-α 和 ZAK-β 都是 ERK 通路调控结肠癌细癌病人体内,ZAK 两种亚型的转录和蛋白质水K 研究的深入,关于 ZAK 在其他癌症细胞内发-Feng Dou 等人79发现在肝癌细胞内存在一种促进肝癌的发生。URHC 在肝癌细胞内高度表达细胞增殖、抑制凋亡的作用是通过抑制 ZAK 的细胞内也发现,过度表达的 ZAK 通过激活 ER增殖80。更有文献指出,一些 BRAF 激酶的抑制达拉菲尼等,在临床应用中会造成皮肤鳞状细胞K 存在密切联系82-83。虽然 ZAK 在不同的癌症作用,但也不可否认它的生理重要性。综上,Z化等心血管疾病及结肠癌等癌症的重要靶标。
【学位授予单位】:中国科学院大学(中国科学院上海药物研究所)
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R91
【相似文献】
相关期刊论文 前10条
1 张媛;刘雨桐;李达;宋新蕊;周雪松;赵勇;;反向虚拟筛选平台及应用[J];生物信息学;2015年04期
2 李悦青;黄雅俊;赵伟杰;王希诚;;氮杂
本文编号:2697467
本文链接:https://www.wllwen.com/yixuelunwen/yiyaoxuelunwen/2697467.html
最近更新
教材专著