基于注意力池化网络的可解释性药靶亲和度预测
发布时间:2021-04-26 19:49
在药物发现的课题中,我们可以通过研究药物和蛋白质相互作用来达到发现药物的目的。药物蛋白质亲和度指的是药物和蛋白质相互作用后结合的强度。因此找出蛋白质和配体药物的亲和度问题至关重要。最早期,药物发现只能依靠人们偶然发现。直到生物、化学等学科逐渐发展起来后,人们在实验中发现了药物。并且随着生物化学研究的深入,人们可以开始有目的性的设计药物。但是直到这个时期,所有的药物发现课题都只能依靠临床实验的方式进行,然而临床实验的方式耗时长且花费大,并且成功率也无法得到保证。随着计算机学科的发展,计算方法被引入药物发现的课题中。在预测药物蛋白质相互作用亲和度问题上,计算方法表现出了卓越的优势。不仅成功率更高、速度更快,而且极大地降低了经济成本。目前主流的计算方法主要有以下几种:基于分子对接方法、基于相似度的方法和基于机器学习方法。基于分子对接的方法需要了解蛋白质和药物小分子的三维结构,在三维空间中找到蛋白质和药物的最佳结合位点,并预测结合亲和度。基于相似度的方法主要依赖于一个假设:具有相似序列和结构的药物或蛋白质应该在其生物功能的表现上也具有相似性。而目前最主流的方式是使用机器学习的方法,机器学习方法...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题来源
1.2 课题背景及意义
1.2.1 课题背景
1.2.2 课题研究意义
1.3 国内外研究现状
1.4 本文主要内容
1.5 本文结构安排
第2章 蛋白质和药物表示的“分词”技术
2.1 数据表示
2.1.1 药物表示
2.1.2 蛋白质表示
2.1.3 亲和度表示
2.2 蛋白质结构域和基序获取
2.3 蛋白质和药物表示的“分词”
2.4 Word Embedding
2.5 亲和度值转换
2.6 本章小结
第3章 基于注意力池化网络的药靶亲和度预测模型
3.1 Attentive Pooling Networks模型
3.2 使用GRU替代模型中LSTM
3.3 模型结构
3.4 本章小结
第4章 模型实现与结果分析
4.1 数据集
4.2 难点及解决
4.2.1 Scan Prosite获取结构域和基序超时
4.2.2 GRU处理不等长数据
4.3 实验结果
4.3.1 实验设置
4.3.2 评价指标
4.3.3 结果展示与分析
4.4 本章小结
结论
参考文献
致谢
本文编号:3162012
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题来源
1.2 课题背景及意义
1.2.1 课题背景
1.2.2 课题研究意义
1.3 国内外研究现状
1.4 本文主要内容
1.5 本文结构安排
第2章 蛋白质和药物表示的“分词”技术
2.1 数据表示
2.1.1 药物表示
2.1.2 蛋白质表示
2.1.3 亲和度表示
2.2 蛋白质结构域和基序获取
2.3 蛋白质和药物表示的“分词”
2.4 Word Embedding
2.5 亲和度值转换
2.6 本章小结
第3章 基于注意力池化网络的药靶亲和度预测模型
3.1 Attentive Pooling Networks模型
3.2 使用GRU替代模型中LSTM
3.3 模型结构
3.4 本章小结
第4章 模型实现与结果分析
4.1 数据集
4.2 难点及解决
4.2.1 Scan Prosite获取结构域和基序超时
4.2.2 GRU处理不等长数据
4.3 实验结果
4.3.1 实验设置
4.3.2 评价指标
4.3.3 结果展示与分析
4.4 本章小结
结论
参考文献
致谢
本文编号:3162012
本文链接:https://www.wllwen.com/projectlw/hxgylw/3162012.html
最近更新
教材专著